IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ベイジン バイドゥ ネットコム サイエンス アンド テクノロジー カンパニー リミテッドの特許一覧

特開2023-76820画像処理方法、装置、電子機器、及び記憶媒体
<>
  • 特開-画像処理方法、装置、電子機器、及び記憶媒体 図1
  • 特開-画像処理方法、装置、電子機器、及び記憶媒体 図2
  • 特開-画像処理方法、装置、電子機器、及び記憶媒体 図3
  • 特開-画像処理方法、装置、電子機器、及び記憶媒体 図4
  • 特開-画像処理方法、装置、電子機器、及び記憶媒体 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023076820
(43)【公開日】2023-06-02
(54)【発明の名称】画像処理方法、装置、電子機器、及び記憶媒体
(51)【国際特許分類】
   G06T 11/00 20060101AFI20230526BHJP
   G06T 7/00 20170101ALI20230526BHJP
【FI】
G06T11/00 110
G06T7/00 350C
【審査請求】有
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022187657
(22)【出願日】2022-11-24
(31)【優先権主張番号】202111396686.7
(32)【優先日】2021-11-23
(33)【優先権主張国・地域又は機関】CN
(71)【出願人】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】ワン・ディ
(72)【発明者】
【氏名】ヂャオ・チェン
(72)【発明者】
【氏名】リ・ジエ
【テーマコード(参考)】
5B080
5L096
【Fターム(参考)】
5B080AA00
5B080CA00
5B080FA02
5B080GA22
5L096AA06
5L096DA05
5L096FA32
5L096GA51
5L096HA11
5L096KA04
(57)【要約】
【課題】画像処理のための方法、装置、電子機器と記憶媒体、およびコンピュータプログラム製品を提供する。
【解決手段】本開示は、拡張/仮想現実、画像処理分野に関する画像処理方法、装置、電子機器と記憶媒体を提供し、特に3次元顔再構築における画像処理の方法、装置、電子機器、及び記憶媒体に関する。具体的な実現態様としては、2次元顔画像の第一のテクスチャ係数を取得し、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成し、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得し、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得することである。
【選択図】図1
【特許請求の範囲】
【請求項1】
画像処理方法であって、
2次元顔画像の第一のテクスチャ係数を取得するステップと、
前記第一のテクスチャ係数と前記2次元顔画像の第一のテクスチャベースに基づいて、前記2次元顔画像の第一のテクスチャ画像を生成するステップと、
前記第一のテクスチャ画像に基づいて前記第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、前記第一のテクスチャ画像に基づいて前記第一のテクスチャベースを更新し、第二のテクスチャベースを取得するステップと、
前記第二のテクスチャベースが収束されたことに応答する場合、前記第二のテクスチャベースに基づいて前記2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するステップと、を含む、画像処理方法。
【請求項2】
前記第二のテクスチャベースが収束されていないことに応答する場合、前記第一のテクスチャ係数と前記第二のテクスチャベースに基づいて、前記2次元顔画像の第二のテクスチャ画像を生成するステップと、
前記第二のテクスチャ画像に基づいて前記第二のテクスチャベースが第二のターゲット条件を満たすと決定する場合、前記第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得するステップと、
前記第二のテクスチャ係数を前記第一のテクスチャ係数として決定し、前記第二のテクスチャベースを前記第一のテクスチャベースとして決定し、前記第二のテクスチャベースが収束されたと決定するまで、前記第一のテクスチャ係数と前記2次元顔画像の第一のテクスチャベースに基づいて、前記2次元顔画像の第一のテクスチャ画像を生成するステップを実行するステップと、をさらに含む、請求項1に記載の方法。
【請求項3】
前記第二のテクスチャ画像に基づいて前記第二のテクスチャベースが第二のターゲット条件を満たすと決定するステップは、
前記第二のテクスチャ画像をレンダリング処理し、第一のレンダリング画像を取得するステップと、
前記第一のレンダリング画像と前記2次元顔画像に対応するターゲット真理値図との間の第一の損失度を取得するステップと、
前記第一の損失度がターゲット閾値範囲内であると決定する場合、前記第二のテクスチャベースが前記第二のターゲット条件を満たすと決定するステップとを含む、請求項2に記載の方法。
【請求項4】
2次元顔画像の第一のテクスチャ係数を取得するステップは、前記2次元顔画像を、入力画像のテクスチャ係数を予測するために用いられるターゲットネットワークモデルに入力して処理し、前記第一のテクスチャ係数を取得するステップを含み、
前記第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得するステップは、前記ターゲットネットワークモデルのパラメータの重み付けを更新し、更新後の前記ターゲットネットワークモデルに基づいて前記第一のテクスチャ係数を前記第二のテクスチャ係数に調整するステップを含む、請求項2に記載の方法。
【請求項5】
前記第一のテクスチャ画像に基づいて前記第一のテクスチャ係数が第一のターゲット条件を満たすと決定するステップは、
前記第一のテクスチャ画像をレンダリング処理し、第二のレンダリング画像を取得するステップと、
前記第二のレンダリング画像と前記2次元顔画像に対応するターゲット真理値図との間の第二の損失度を取得するステップと、
前記第二の損失度がターゲット閾値範囲内であると決定する場合、前記第一のテクスチャ係数が前記第一のターゲット条件を満たすと決定するステップと、を含む、請求項1に記載の方法。
【請求項6】
前記第一のテクスチャ画像に基づいて前記第一のテクスチャベースを更新し、第二のテクスチャベースを取得するステップは、
前記第二の損失度に基づいて前記第一のテクスチャベースを前記第二のテクスチャベースに調整するステップを含む、請求項5に記載の方法。
【請求項7】
前記第二の損失度に基づいて前記第一のテクスチャベースを前記第二のテクスチャベースに調整するステップは、
前記第二の損失度に基づいて前記第一のテクスチャベースのテンソルを調整するステップと、
調整後の前記テンソルに対応するテクスチャベースを、前記第二のテクスチャベースとして決定するステップと、を含む、請求項6に記載の方法。
【請求項8】
前記第二のテクスチャベースに基づいて前記2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するステップは、
前記第一のテクスチャ係数と前記第二のテクスチャベースに基づいて、前記2次元顔画像の第二のテクスチャ画像を生成するステップと、
前記第二のテクスチャ画像に基づいて前記2次元顔画像に対して3次元再構築を行い、前記3次元顔画像を取得するステップと、を含む、請求項1に記載の方法。
【請求項9】
画像処理装置であって、
2次元顔画像の第一のテクスチャ係数を取得するための取得ユニットと、
前記第一のテクスチャ係数と前記2次元顔画像の第一のテクスチャベースに基づいて、前記2次元顔画像の第一のテクスチャ画像を生成するための生成ユニットと、
前記第一のテクスチャ画像に基づいて前記第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、前記第一のテクスチャ画像に基づいて前記第一のテクスチャベースを更新し、第二のテクスチャベースを取得するための更新ユニットと、
前記第二のテクスチャベースが収束されたことに応答する場合、前記第二のテクスチャベースに基づいて前記2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するための再構築ユニットと、を含む、画像処理装置。
【請求項10】
電子機器であって、
少なくとも1つのプロセッサ、及び
前記少なくとも1つのプロセッサと通信可能に接続されるメモリを含み、
前記メモリには、前記少なくとも1つのプロセッサによって実行されることが可能な命令が記憶されており、前記命令が前記少なくとも1つのプロセッサによって実行されて、前記少なくとも1つのプロセッサに請求項1から請求項8のいずれか1項に記載の方法を実行させることができる、電子機器。
【請求項11】
コンピュータに請求項1から請求項8のいずれか1項に記載の方法を実行させるために用いられるコンピュータ命令が記憶されている、非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項12】
コンピュータプログラムを含むコンピュータプログラム製品であって、
前記コンピュータプログラムがプロセッサによって実行されると、請求項1から請求項8のいずれか1項に記載の方法を実現させる、コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、拡張/仮想現実、画像処理分野に関し、特に3次元顔再構築における画像処理の方法、装置、電子機器と記憶媒体に関する。
【背景技術】
【0002】
現在、顔再構築において、テクスチャ画像の生成は、テクスチャベースの色カバー能力及びテクスチャ係数の予測精度に依存しているが、3次元顔再構築を行うためのテクスチャベースに対し、そのオープンソースは、いずれも手動で描画されている。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本開示は、画像処理のための方法、装置、電子機器と記憶媒体を提供する。
【課題を解決するための手段】
【0004】
本開示の1つの側面によれば、2次元顔画像の第一のテクスチャ係数を取得するステップと、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するステップと、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすことを決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得するステップと、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するステップと、を含む画像処理方法を提供する。
【0005】
本開示の別の側面によれば、2次元顔画像の第一のテクスチャ係数を取得するための取得ユニットと、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するための生成ユニットと、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得するための更新ユニットと、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するための再構築ユニットと、を含む画像処理装置を提供する。
【0006】
本開示の別の側面によれば、少なくとも1つのプロセッサ、及び少なくとも1つのプロセッサと通信可能に接続されるメモリを含み、そのうち、メモリには、少なくとも1つのプロセッサによって実行されることが可能な命令が記憶されており、命令が少なくとも1つのプロセッサによって実行されて、少なくとも1つのプロセッサに請求項1から8のいずれか1項に記載の方法を実行させることができる電子機器を提供する。
【0007】
本開示の別の方面によれば。コンピュータに請求項1から8のいずれか1項に記載の方法を実行させるために用いられるコンピュータ命令が記憶されている非一時的なコンピュータ読み取り可能な記憶媒体を提供する。
【0008】
本開示の別の側面によれば、コンピュータプログラムを含むコンピュータプログラム製品であって、コンピュータプログラムがプロセッサによって実行されると、請求項1から8のいずれか1項に記載の方法を実現させるコンピュータプログラム製品を提供する。
【0009】
理解すべきことは、本部分に記述された内容は、本開示の実施例の肝心な特徴又は重要な特徴を標識するために意図しているものではなく、本開示の範囲を制限するものでもない。本開示の他の特徴は、以下の明細書によって容易に理解されることになる。
【0010】
添付図面は、本態様をより良く理解するためのものとして、本開示に対する限定を構成しない。
【図面の簡単な説明】
【0011】
図1】本開示の実施例による画像処理方法の模式図である。
図2】本開示の実施例によるレンダリング図生成フローの模式図である。
図3図2に示される損失度を計算する方法による模式図である。
図4】本開示の実施例を実現するための画像処理装置の構造図である。
図5】本開示の実施例による電子機器の模式的なブロック図である。
【発明を実施するための形態】
【0012】
以下では、添付図面を参照しながら本開示の模式的な実施例について説明し、理解を容易にするために、その中に本開示の実施例の様々な詳細を含んでおり、それらは単なる例示するものと見なされるべきである。そのため、当業者は、本開示の範囲及び趣旨から逸脱することなく、ここで記述される実施例に対して様々な変更と修正を行うことができることを認識すべきである。同様に、明確及び簡潔にするために、以下の説明では、周知の機能及び構成の説明を省略する。
【0013】
以下、本開示の実施例の画像処理方法を説明する。
従来のコンピュータグラフィックス学では、テクスチャベースは、一定の1組の直交テクスチャ画像を用いてから、フィッティングの方式によってテクスチャ係数を計算する。このような方式には限界があり、一定のテクスチャベースは、この3次元顔再構築モデルが最終的に色を表す範囲を決定しており、例えばヨーロッパの顔基底を用いると、如何にテクスチャ係数をトレーニングしてもアジアの顔を表すことができない。しかし、テクスチャベースがトレーニング方式で生成される場合、テクスチャベースとテクスチャ係数とを同時にトレーニングすると、トレーニングが収束せず、安定しないことになる。
【0014】
図1は、本開示の実施例による画像処理方法のフローチャートである。図1に示すように、この方法は、以下のステップS101~S104を含んでもよい。
【0015】
ステップS101では、2次元顔画像の第一のテクスチャ係数を取得する。
本開示の上記ステップS101による技術案では、2次元顔画像の第一のテクスチャ係数を取得する前に、2次元顔画像を1枚收集する必要がある。
【0016】
この実施例では、第一のテクスチャ係数は、收集した2次元顔画像をターゲットネットワークモデルに入力して処理したものであってもよい。
【0017】
選択的に、第一のテクスチャ係数は、2次元顔画像をターゲットネットワークモデルに入力して予測することによって得られてもよく、例えば、2次元顔画像を畳み込みニューラルネットワーク(Convolutional Neural Networks、CNNと略称される)に入力し、予測して第一のテクスチャ係数を取得し、畳み込みニューラルネットワークの入力層は、マルチ次元データを処理可能であって、畳み込みニューラルネットワークがコンピュータビジョン分野において広く応用される。よって、その構造を説明する際には3次元入力データ、即ち平面上の2ビット画素ドットと色チャンネル(RGBチャンネル)を予め仮定しており、勾配降下アルゴリズムを用いて学習するため、畳み込みニューラルネットワークの入力特徴を正規化処理する必要がある。
【0018】
ステップS102では、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成する。
【0019】
本開示の上記ステップS102による技術案では、2次元顔画像の第一のテクスチャ係数を取得した後、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成することができる。
【0020】
この実施例では、第一のテクスチャベースは、收集した2次元顔画像のテクスチャベースの値であり、第一のテクスチャ係数と第一のテクスチャベースとを線形加算して計算し、さらに2次元顔画像の第一のテクスチャ画像を生成する。
【0021】
ステップS103では、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得する。
【0022】
本開示の上記ステップS103による技術案では、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成した後、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすか否かを判断することができ、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと判断する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得する。
【0023】
この実施例では、第一のターゲット条件は、第一のテクスチャ画像と2次元顔画像に対応するターゲット真理値図との間の違いが許可可能な範囲内であるか否かを判断するために用いられてもよく、生成した第一のテクスチャ画像が第一のターゲット条件に合う場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得する。
【0024】
選択的に、第一のターゲット条件は、第一のテクスチャ画像の損失度が、RGB平均単一チャンネル損失値が一定の閾値範囲内となるように下がることであってもよく、テクスチャ係数のトレーニングが安定していると決定することができ、例えば、第一のターゲット条件は、第一のテクスチャ画像の損失度について、RGB平均単一チャンネル損失値が10以内となるように下がることであってもよい。
【0025】
ステップS104では、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得する。
【0026】
本開示の上記ステップS104による技術案では、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得した後、第二のテクスチャベースが収束されるか否かを判断することによって、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行って、3次元顔画像を取得するか否かを決定することができる。第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得することができる。
【0027】
上記ステップS101~ステップS104によって、2次元顔画像の第一のテクスチャ係数を取得し、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成し、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得し、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得する。つまり、本開示は、テクスチャベースが収束されたことに応答するまで、テクスチャ係数とテクスチャベースとを交互にトレーニングし、テクスチャベースが収束されたことに応答すると、収束されたテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得することで、テクスチャ画像のテクスチャベースが収束するようにトレーニングすることを実現することによって、3次元顔画像再構築の効率が低い課題を解決し、3次元顔画像再構築の効率を向上させる技術的効果を達成する。
【0028】
以下、この実施例の上記方法をさらに詳細に説明する。
1つの選択的な実施の形態として、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するステップS104は、第二のテクスチャベースが収束されていないことに応答する場合、第一のテクスチャ係数と第二のテクスチャベースに基づいて、2次元顔画像の第二のテクスチャ画像を生成することと、第二のテクスチャ画像に基づいて第二のテクスチャベースが第二のターゲット条件を満たすと決定する場合、第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得することと、第二のテクスチャ係数を第一のテクスチャ係数として決定し、第二のテクスチャベースを第一のテクスチャベースとして決定し、第二のテクスチャベースが収束されたことに応答するまで、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するステップを実行することと、を含む。
【0029】
この実施例では、第二のテクスチャベースが収束されていないことに応答する場合、第一のテクスチャ係数と第二のテクスチャベースに基づいて、2次元顔画像の第二のテクスチャ画像を生成することは、微分可能レンダラーによって第二のテクスチャ画像をレンダリングすることであってもよく、選択的に、第一のテクスチャ係数と第二のテクスチャベースとを線形演算し、第二の顔画像を取得してから、第二の顔画像を3D点群に貼り付けてmeshを取得し、meshとOBJを微分可能レンダラーに入力し、第二のテクスチャ画像のレンダリングを行うことで、第二のテクスチャ画像を取得する。
【0030】
この実施例では、第二のテクスチャ画像に基づいて第二のテクスチャベースが第二のターゲット条件を満たすと決定する場合、第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得する。ここで、第二のターゲット条件は、第二のテクスチャベースが要求に合うか否かを判断するために用いられるものとして、テクスチャベースの表現範囲が大きくなったことであってもよく、第一のテクスチャ係数を更新する前に、ターゲットネットワークモデルのパラメータの重み付けを更新し、更新後のターゲットネットワークモデルに基づいて第一のテクスチャ係数を第二のテクスチャ係数に調整し、テクスチャ係数が安定値に達するまでトレーニングした場合、テクスチャベースは、1つのテンソルとして、それ自体の勾配は、畳み込みニューラルネットワークの勾配返送過程に関与し、重み付けが更新され始め、第二のテクスチャ係数を取得することをさらに含む。
【0031】
この実施例では、第二のテクスチャ係数を第一のテクスチャ係数として決定し、第二のテクスチャベースを第一のテクスチャベースとして決定し、第二のテクスチャベースが収束されたことに応答するまで、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するステップを実行し、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成することにおいて、第一のテクスチャ係数は、ステップS101において2次元顔画像をターゲットネットワークモデルCNNに入力して予測することによって得られたものである一方、第一のテクスチャベースは、上述した、ターゲットネットワークモデルに入力して第一のテクスチャ係数を予測するための顔画像のテクスチャベースの値である。選択的に、予め用意した2次元顔画像のテクスチャベースは、155*1024*1024次元のテンソル(Tensor)であってもよく、つまり、トレーニングの開始時に、第一のテクスチャベースは、固定値であり、トレーニング過程において、第二のテクスチャベースが収束されていないことに応答し、レンダリング図の損失度がテクスチャベースにフィードバックした際の勾配によって決定され、その後、テクスチャ係数を更新し、第二のテクスチャベースは、1つのテンソルとしてトレーニング過程に関与し、第一のテクスチャ係数と第一のテクスチャベースとを線形加算して計算することで、2次元顔画像のテクスチャ画像を再生成する。
【0032】
1つの選択的な実施の形態として、第二のテクスチャ画像に基づいて第二のテクスチャベースが第二のターゲット条件を満たすと決定することは、第二のテクスチャ画像に対してレンダリング処理を行い、第一のレンダリング画像を取得することと、第一のレンダリング画像と2次元顔画像に対応するターゲット真理値図との間の第一の損失度を取得することと、第一の損失度がターゲット閾値範囲内であると決定する場合、第二のテクスチャベースが第二のターゲット条件を満たすと決定することとを含む。
【0033】
この実施例では、第二のターゲット条件は、テクスチャベースをトレーニングする表現範囲が大きくなったことであってもよい。
【0034】
この実施例では、第一のテクスチャ画像に対してレンダリング処理を行う場合、生成した第二のテクスチャ画像を微分可能レンダラーに入力して、第一のレンダリング画像を取得することができる。微分可能レンダラーにおけるインバースレンダリング過程は、第一のテクスチャ画像とターゲットネットワークモデルCNNにおける3Dモデルファイル(OBJ)とを統合してmeshを取得し、つまり第一のテクスチャ画像を3D点群に貼り付けてmeshを取得してから、meshを微分可能レンダラーに入力し、第二のテクスチャ画像をレンダリングすることである。
【0035】
この実施例では、上記OBJは、モデルにおいて与えられたものでもよく、トレーニングすることによって生成したものであってもよく、ここで限定されない。
【0036】
この実施例では、第一のレンダリング画像と2次元顔画像に対応するターゲット真理値図との間の第一の損失度を取得し、第二のテクスチャ画像によってレンダリング処理されて得られた第一のレンダリング図と2次元顔画像との間の違いを比較することによって、違いを定量化し、第一のレンダリング画像と2次元顔画像に対応するターゲット真理値図との間の第一の損失度を計算する。
【0037】
この実施例では、第一の損失度がターゲット閾値範囲内であると決定する場合、第二のテクスチャベースが第二のターゲット条件を満たすと決定する。ここで、ターゲット閾値範囲は、損失度について、RGB平均単一チャンネル損失値が10以内となるように下がり、即ちテクスチャ係数のトレーニングが安定していることであってもよく、第二のターゲット条件は、テクスチャベースをトレーニングする表現範囲が大きくなったことであってもよい。第一のレンダリング図と2次元顔画像に対応するターゲット真理値図との間の差分をより小さくするために、ターゲット閾値範囲が十分に小さい値の範囲であるべきと決定し、つまり、要求される厳格性が高ければ高いほど、ターゲット閾値範囲が小さくなり、第一のレンダリング図も2次元顔画像に対応するターゲット真理値図に近づくようになる。
【0038】
1つの選択的な実施の形態として、2次元顔画像の第一のテクスチャ係数を取得するステップS101は、2次元顔画像をターゲットネットワークモデルに入力して処理し、第一のテクスチャ係数を取得することを含む。ここで、ターゲットネットワークモデルは、入力画像のテクスチャ係数を予測するために用いられる。第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得することは、ターゲットネットワークモデルのパラメータの重み付けを更新し、更新後のターゲットネットワークモデルに基づいて第一のテクスチャ係数を第二のテクスチャ係数に調整することを含む。
【0039】
この実施例では、2次元顔画像をターゲットネットワークモデルに入力して処理し、第一のテクスチャ係数を取得する。ここで、ターゲットネットワークモデルは、入力画像のテクスチャ係数を予測するために用いられ、ターゲットネットワークモデルは、畳み込みニューラルネットワークであってもよく、畳み込みニューラルネットワークの入力層は、マルチ次元データを処理可能であって、畳み込みニューラルネットワークがコンピュータビジョン分野において広く応用される。よって、その構造を説明する際には3次元入力データを予め仮定しており、即ち平面上の2ビット画素ドットとRGBチャンネル、勾配降下アルゴリズムを用いて学習するため、畳み込みニューラルネットワークの入力特徴を正規化処理する必要がある。
【0040】
この実施例では、第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得することは、ターゲットネットワークモデルのパラメータの重み付けを更新し、更新後のターゲットネットワークモデルに基づいて第一のテクスチャ係数を第二のテクスチャ係数に調整し、ターゲットネットワークモデルのパラメータの重み付けを更新し、更新後のターゲットネットワークモデルに基づいて第一のテクスチャ係数を第二のテクスチャ係数に調整することを含み、テクスチャ係数が安定値に達するまでトレーニングした場合、テクスチャベースは、1つのテンソルとして、それ自体の勾配は、畳み込みニューラルネットワークの勾配返送過程に関与し、重み付けの更新が始まるため、畳み込みニューラルネットワークは、顔画像のテクスチャ係数を再予測することで、第一のテクスチャ係数に対する更新を実現し、第一のテクスチャ係数が更新された後の第二のテクスチャ係数を取得し、その後、テクスチャ係数とテクスチャ画像とを交互にトレーニングする過程において、テクスチャベースが1つのテンソルとして畳み込みニューラルネットワーク勾配返送過程に関与し、重み付けを更新することによって、交互トレーニング過程における第一のテクスチャ係数の更新を実現する。
【0041】
1つの選択的な実施の形態として、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定するステップS103は、第一のテクスチャ画像に対してレンダリング処理を行い、第二のレンダリング画像を取得することと、第二のレンダリング画像と2次元顔画像に対応するターゲット真理値図との間の第二の損失度を取得することと、第二の損失度がターゲット閾値範囲内であると決定する場合、第一のテクスチャ係数が第一のターゲット条件を満たすと決定することとを含む。
【0042】
この実施例では、第一のテクスチャ画像に対してレンダリング処理を行い、第二のレンダリング画像を取得する。第一のテクスチャ画像に対してレンダリング処理を行う場合、ステップS102において生成した第一のテクスチャ画像を微分可能レンダラーに入力して、第二のレンダリング画像を取得することができる。微分可能レンダラーにおけるインバースレンダリング過程は、第一のテクスチャ画像とターゲットネットワークモデルCNNにおける3Dモデルファイル(OBJ)とを統合してmeshを取得し、つまり第一のテクスチャ画像を3D点群に貼り付けてmeshを取得してから、meshを微分可能レンダラーに入力し、第二のテクスチャ画像をレンダリングすることである。
【0043】
この実施例では、第二のレンダリング画像と2次元顔画像に対応するターゲット真理値図との間の第二の損失度を取得し、第二のレンダリング画像と2次元顔画像に対応するターゲット真理値図との間の第二の損失度を計算し、つまり、第二のレンダリング画像と2次元顔画像に対応するターゲット真理値図との間の差分を比較し、第二の損失度という数値でこのような差分を定量化する。
【0044】
この実施例では、第二の損失度がターゲット閾値範囲内であると決定する場合、第一のテクスチャ係数が第一のターゲット条件を満たすと決定し、第二の損失度がターゲット閾値範囲内であるか否かを判断することによって、第一のテクスチャ係数が第一のターゲット条件を満たすか否かを判断する。第二のレンダリング図と2次元顔画像に対応するターゲット真理値図との間の差分をより小さくするために、ターゲット閾値範囲が十分に小さい値の範囲であるべきと決定し、つまり、要求される厳格性が高ければ高いほど、ターゲット閾値範囲が小さくなり、第二のレンダリング図も2次元顔画像に対応するターゲット真理値図に近づくようになり、第一のターゲット条件は、第二の損失度について、RGB平均単一チャンネル損失値が10以内となるように下がり、即ちテクスチャ係数のトレーニングが安定していることであってもよい。
【0045】
1つの選択的な実施の形態として、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得するステップS103は、第二の損失度に基づいて第一のテクスチャベースを第二のテクスチャベースに調整することを含む。
【0046】
この実施例では、第二の損失度について、RGB平均単一チャンネル損失値が10以内となるように下がり、即ちテクスチャ係数のトレーニングが安定している。
【0047】
1つの選択的な実施の形態として、第二の損失度に基づいて第一のテクスチャベースのテンソルを調整し、調整後のテンソルに対応するテクスチャベースを、第二のテクスチャベースとして決定する。
【0048】
この実施例では、テクスチャベースは、初期化時に1つのテンソル(tensor)であり、テクスチャ係数がトレーニングされる際に、テクスチャベースは、1つのテンソルとして、その勾配がゼロであり、重み付けが更新されないが、テクスチャ係数が安定値に達するまでトレーニングした後、テクスチャベースがトレーニング過程に関与し、第二の損失度がターゲット閾値範囲以内である場合、第二の損失度に基づいて、第一のテクスチャベースのテンソルを更新してから、更新後のテンソルに対応するテクスチャベースを第二のテクスチャベースとして決定する。
【0049】
1つの選択的な実施の形態として、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するステップS104は、第一のテクスチャ係数と第二のテクスチャベースに基づいて、2次元顔画像の第二のテクスチャ画像を生成することと、第二のテクスチャ画像に基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得することと、を含む。
【0050】
この実施例では、第二のテクスチャベースが収束されたことに応答する場合、交互トレーニング過程は、終了し、収束された第二のテクスチャベースと第一のテクスチャ係数は、線形加算の計算によって、第二のテクスチャ画像を生成してから、第一のテクスチャ画像を3D点群に貼り付けてmeshを取得し、meshによって3次元顔画像をレンダリングすることができる。
【0051】
この実施例は、第二のテクスチャベースが収束されていないことに応答する場合、第一のテクスチャ係数と第二のテクスチャベースに基づいて、2次元顔画像の第二のテクスチャ画像を生成し、第二のテクスチャ画像に基づいて第二のテクスチャベースが第二のターゲット条件を満たすと決定する場合、第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得し、第二のテクスチャ係数を第一のテクスチャ係数として決定し、第二のテクスチャベースを第一のテクスチャベースとして決定し、第二のテクスチャベースが収束されたことに応答するまで、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するステップを実行することによって、テクスチャベースの収束効果を確保し、3次元顔再構築の効率が低い課題を解決し、3次元顔再構築の効率を向上させる技術的効果を達成する。
【0052】
図2は、本開示の実施例によるレンダリング図生成フローの模式図である。図2に示すように、このフローは、以下のステップを含んでもよい。
【0053】
まず、2D顔画像を1枚用意する。
そして、用意した2D顔画像1枚をターゲットネットワークモデルに入力し、第一のテクスチャ係数を予測する。ここで、ターゲットネットワークモデルは、2D顔画像のテクスチャ係数(Tex param)を出力する畳み込みニューラルネットワーク(CNN)であってもよい。
【0054】
それから、2D顔画像は、テクスチャベース(Tex base)を提供しており、テクスチャベースとテクスチャ係数とを線形加算して計算し、テクスチャ画像を生成する。
【0055】
最後に、生成したテクスチャ画像を3DモデルファイルOBJと統合し、meshを取得し、meshを微分可能レンダラーに入力し、2Dレンダリング図を生成する。
【0056】
この実施例では、テクスチャ係数とテクスチャベースとを線形加算して計算することによって、第一のテクスチャ画像を取得し、テクスチャ画像を3D点群に貼り付けてmeshを取得してから、meshを微分可能レンダラーに入力し、第二のテクスチャ画像をレンダリングし、生成したレンダリング図は、ターゲット真理値図との間の損失度Lossを計算するために用いられ、さらに損失度Lossがターゲット閾値範囲内であると決定する。
【0057】
図3は、図2に示されるレンダリング図生成フローに基づく損失度を計算する方法による模式図である。図に示すように、この方法は、以下のステップS301~S305を含んでもよい。
【0058】
ステップS301では、2次元顔画像を1枚用意する。
ステップS302では、2次元顔画像をターゲットネットワークモデルCNNに入力する。
【0059】
本開示の上記ステップS302による技術案では、ターゲットネットワークモデルCNNは、2次元顔画像の第一のテクスチャ係数を予測し、且つ、第二のテクスチャベースが収束されていないことに応答する場合、第一のテクスチャ係数と第二のテクスチャベースに基づいて、2次元顔画像の第二のテクスチャ画像を生成し、第二のテクスチャ画像に基づいて第二のテクスチャベースが第二のターゲット条件を満たすと決定する場合、第一のテクスチャ係数を更新し、第二のテクスチャ係数を取得し、第二のテクスチャ係数を第一のテクスチャ係数として決定し、第二のテクスチャベースを第一のテクスチャベースとして決定し、第二のテクスチャベースが収束されたことに応答するまで、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するステップを実行する過程において、テクスチャ係数は、いずれもターゲットネットワークモデルCNNによって予測されたものであり、そのうち、テクスチャ係数のターゲットネットワークモデルCNNにおける重み付けも更新される。
【0060】
ステップS303では、テクスチャ係数とテクスチャベースとを線形加算して計算し、テクスチャ画像を生成する。
【0061】
ステップS304では、生成したテクスチャ画像をモデルのOBJファイルと統合し、meshを取得し、meshを微分可能レンダラーに入力し、2Dレンダリング図を生成する。
【0062】
ステップS305では、2D顔レンダリング図とターゲット顔真理値図(Gt図)の損失度Lossを計算する。
【0063】
本開示の上記ステップS305による技術案では、損失度LossはRGB平均単一チャンネル損失が10以内となるに下がり、即ちテクスチャ係数のトレーニングが安定している。
【0064】
この実施例では、トレーニング過程において生成したテクスチャ図の2次元レンダリング画像とターゲット真理値図との間の損失度Lossを計算することによって、ステップ103において、第二の損失度がターゲット閾値範囲内であると決定し、さらに第一のテクスチャ係数が第一のターゲット条件を満たすと決定し、第二の損失度に基づいて第一のテクスチャベースを第二のテクスチャベースに調整し、第二の損失度に基づいて第一のテクスチャベースのテンソルを調整する。また、1つの選択的な実施例において、第二のテクスチャ画像に基づいて第二のテクスチャベースが第二のターゲット条件を満たすと決定することは、第一の損失度がターゲット閾値範囲内であると決定する場合、第二のテクスチャベースが第二のターゲット条件を満たすと決定することを含む。
【0065】
本開示の実施例は、図1に示される実施例を実行するための画像処理装置をさらに提供する。
【0066】
図4は、本開示の実施例による画像処理装置の模式図である。図4に示すように、この画像処理装置40は、取得ユニット41と、生成ユニット42と、更新ユニット43と、再構築ユニット44とを含んでもよい。
【0067】
取得ユニット41は、2次元顔画像の第一のテクスチャ係数を取得するために用いられ、畳み込みニューラルネットワーク(CNN)をターゲットネットワークモデルとして、2次元顔画像をCNNに入力して第一のテクスチャ係数を予測することができ、交互にトレーニングする過程において、取得ユニット41は、第二のテクスチャベースに基づいて生成された第二のテクスチャ画像の第二のテクスチャ係数を予測してから、第二のテクスチャ係数を第一のテクスチャ係数として、テクスチャベースが安定するまで、テクスチャベースをトレーニングし続けるために用いられる。
【0068】
生成ユニット42は、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するために用いられ、生成ユニット42は、微分可能レンダラーを含み、具体的には、生成ユニットにおいて、第一のテクスチャ係数と第一のテクスチャベースとを線形加算して計算し、第一の顔画像を取得してから、第一の顔画像を3D点群に貼り付けてmeshを取得し、meshとOBJとを微分可能レンダラーに入力し、テクスチャ画像のレンダリングを行うことで、第一のテクスチャ画像を取得する。
【0069】
更新ユニット43は、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得するが、交互にトレーニングする過程において、第二のテクスチャベースが収束されていないことに応答する場合、第一のテクスチャ係数と第二のテクスチャベースに基づいて、2次元顔画像の第二のテクスチャ画像を生成し、第二のテクスチャ画像に基づいて前記第二のテクスチャベースが、テクスチャベースをトレーニングする表現範囲が大きくなったことであってもよい第二のターゲット条件を満たすと決定し、ターゲットネットワークモデルのパラメータの重み付けを更新することによって、さらに第一のテクスチャ係数を更新し、CNNモデルによって予測して第二のテクスチャ係数を取得してから、第二のテクスチャ係数を第一のテクスチャ係数として決定し、第二のテクスチャベースを第一のテクスチャベースとして決定し、第二のテクスチャベースが収束されたことに応答するまで、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成するステップを実行するために用いられる。
【0070】
再構築ユニット44は、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得し、第二のテクスチャベースが収束されたことに応答する場合、第一のテクスチャ係数と第二のテクスチャベースに基づいて、2次元顔画像の第二のテクスチャ画像を生成し、第二のテクスチャ画像に基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得するために用いられる。
【0071】
この実施例の画像処理装置では、畳み込みニューラルネットワークによって2次元顔画像のテクスチャ係数を予測し、2次元顔画像のテクスチャベースとテクスチャ係数とを交互にトレーニングし、最終的にテクスチャ画像のテクスチャベースを収束させ、3次元顔再構築の効率が低い課題を解決し、3次元顔画像再構築の効率を向上させる技術的効果を達成する。
【0072】
本開示の技術案では、関わるユーザ個人情報の取得、記憶や応用などは、いずれも関連法律法規の規定に合致し、且つ公序良俗に違反しない。
【0073】
本開示の実施例によれば、本開示は、電子機器と、読み取り可能な記憶媒体とコンピュータプログラム製品とをさらに提供する。
【0074】
本開示の実施例は、電子機器を提供する。この電子機器は、少なくとも1つのプロセッサ、及び少なくとも1つのプロセッサと通信可能に接続されるメモリを含んでもよい。ここで、メモリには、少なくとも1つのプロセッサによって実行されることが可能な命令が記憶されており、命令が少なくとも1つのプロセッサによって実行されて、少なくとも1つのプロセッサに本開示の実施例の画像処理方法を実行させることができる。
【0075】
選択的に、上記電子機器は、上記プロセッサに接続される伝送機器及び上記プロセッサに接続される入力出力機器をさらに含んでもよい。
【0076】
選択的に、本実施例では、上記不揮発性記憶媒体は、以下のステップS101~S104を実行するためのコンピュータプログラムを記憶するように構成されてもよい。
【0077】
S101では、2次元顔画像の第一のテクスチャ係数を取得する。
S102では、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成する。
【0078】
S103では、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得する。
【0079】
S104では、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得する。
【0080】
選択的に、本実施例では、上記非一時的なコンピュータ読み取り可能な記憶媒体は、電子的、磁気的、光学的、電磁的、赤外線的、又は半導体システム、装置又は機器、又は上記内容の任意の適宜な組み合わせを含んでもよいが、それらに限らない。読み取り可能な記憶媒体のより具体的な例として、1つ又は複数の線に基づく電气接続、携帯型コンピュータディスク、ハードディクス、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、ファイバ、移動可能なコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶機器、磁気記憶機器、又は上記内容の任意の適宜な組み合わせを含む。
【0081】
本開示の実施例によれば、本開示は、コンピュータプログラムを含むコンピュータプログラム製品をさらに提供する。このコンピュータプログラムがプロセッサによって実行されると、以下のステップを実現させる。
【0082】
S101では、2次元顔画像の第一のテクスチャ係数を取得する。
S102では、第一のテクスチャ係数と2次元顔画像の第一のテクスチャベースに基づいて、2次元顔画像の第一のテクスチャ画像を生成する。
【0083】
S103では、第一のテクスチャ画像に基づいて第一のテクスチャ係数が第一のターゲット条件を満たすと決定する場合、第一のテクスチャ画像に基づいて第一のテクスチャベースを更新し、第二のテクスチャベースを取得する。
【0084】
S104では、第二のテクスチャベースが収束されたことに応答する場合、第二のテクスチャベースに基づいて2次元顔画像に対して3次元再構築を行い、3次元顔画像を取得する。
【0085】
図5は、本開示の実施例による電子機器の模式的なブロック図である。電子機器は、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークベンチ、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適宜なコンピュータを示すことを意図している。電子機器は、さらに、様々な形式の移動装置、例えば、パーソナルデジタル処理、セルラー電話、スマートフォン、ウェアラブルデバイス、及び他の類似しているコンピューティング装置を示してもよい。本明細書に示される部品、それらの接続と関係、及びそれらの機能は、単に例として使用され、また、本明細書に記述されている及び/又は要求される本開示の実施例の実現を制限することを意図しない。
【0086】
図5は、本開示の実施例を実施するための模式的な電子機器500の模式的なブロック図を示す。電子機器は、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、ワークベンチ、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適宜なコンピュータを示すことを意図している。電子機器は、さらに、様々な形式の移動装置、例えば、パーソナルデジタル処理、セルラー電話、スマートフォン、ウェアラブルデバイス、及び他の類似しているコンピューティング装置を示してもよい。本明細書に示される部品、それらの接続と関係、及びそれらの機能は、単に例として使用され、また、本明細書に記述されている及び/又は要求される本開示の実施例の実現を制限することを意図しない。
【0087】
図5に示すように、機器500は、リードオンリーメモリ(ROM)502に記憶されたコンピュータプログラム、又は記憶ユニット508からランダムアクセスメモリ(RAM)503にロードされたコンピュータプログラムに基づいて、様々な適宜な動作と処理を実行することができる計算ユニット501を含む。RAM503には、機器500の操作に必要な様々なプログラムとデータが記憶されてもよい。計算ユニット501、ROM502及びRAM503は、バス504によって互いに接続されている。入出力(I/O)インターフェース505もバス504に接続されている。
【0088】
機器500における複数の部品は、I/Oインターフェース505に接続され、例えばキーボード、マウスなどのような入力ユニット506、例えば様々なタイプのディスプレイ、スピーカなどのような出力ユニット507、例えば磁気ディスク、光ディスクなどのような記憶ユニット508、及び、例えばネットカード、モデム、無線通信送受信機などのような通信ユニット509を含む。通信ユニット509は、機器500がインターネットのようなコンピュータネットワーク及び/又は様々な電気通信ネットワークを介して他の機器と情報/データを交換することを許可する。
【0089】
計算ユニット501は、様々な処理と計算能力を有する汎用及び/又は専用処理コンポーネントであってもよい。計算ユニット501のいくつかの例は、中央処理ユニット(CPU)、グラフィックス処理ユニット(GPU)、様々な専用人工智能(AI)計算チップ、機器学習モデルアルゴリズムを運行する様々な計算ユニット、デジタルシグナルプロセッサ(DSP)、及び任意の適当なプロセッサ、コントローラ、マイクロコントローラなどを含むが、それらに限らない。計算ユニット501は、上述した各方法と処理、例えば、生成したテクスチャ画像の2次元レンダリング図とターゲット真理値図との間の損失度を計算する方法実行する。例えば、いくつかの実施例において、方法で計算して生成したテクスチャ画像の2次元レンダリング図とターゲット真理値図との間の損失度は、コンピュータソフトウェアプログラムとしても実現されてもよく、それは、機器読み取り可能な媒体、例えば記憶ユニット508に有形的に含まれる。いくつかの実施例において、コンピュータプログラムの一部又は全ては、ROM502及び/又は通信ユニット509を介して機器500にロードされ、及び/又は取り付けられてもよい。コンピュータプログラムがRAM503にロードされ、計算ユニット501によって実行される場合、上述した方法で生成したテクスチャ画像の2次元レンダリング図とターゲット真理値図との間の損失度を計算する1つ又は複数のステップを実行してもよい。あるいは、他の実施例において、計算ユニット501は、他の任意の適当な方式(例えば、ファームウェアに頼る)によって生成したテクスチャ画像の2次元レンダリング図とターゲット真理値図との間の損失度を計算する方法を実行するように配置されてもよい。
【0090】
本明細書では、以上に記述されるシステムと技術の様々な実施の形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ(FPGA)、特定用途向け集積回路(ASIC)、専用標準製品(ASSP)、チップ上システムのシステム(SOC)、ロードプログラマブル論理デバイス(CPLD)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/又はそれらの組み合わせに実現されてもよい。これらの様々な実施の形態は、以下を含んでもよく、1つ又は複数のコンピュータプログラムに実施され、この1つ又は複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステム上で実行し、及び/又は解釈してもよく、このプログラマブルプロセッサは、専用又は汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、と少なくとも1つの出力装置からデータと命令を受信し、且つデータと命令をこの記憶システム、この少なくとも1つの入力装置、とこの少なくとも1つの出力装置に伝送してもよい。
【0091】
本開示の方法を実施するためのプログラムコードは、1つ又は複数のプログラミング言語の任意の組み合わせを採用して作成してもよい。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ又は他のプログラマブルデータ処理装置のプロセッサ又はコントローラに提供して、プログラムコードがプロセッサ又はコントローラによって実行される時、フローチャート及び/又はブロック図に規定される機能/操作が実施されることができる。プログラムコードは、完全に機器上で実行され、部分的に機器上で実行され、独立したソフトウェアパッケージとして部分的に機器上で実行され、且つ部分的に遠隔機器上で実行され、又は完全に遠隔機器又はサーバ上で実行されてもよい。
【0092】
本開示のコンテキストでは、機器読み取り可能な媒体は、有形の媒体であってもよく、それは、命令実行システム、装置又は機器によって使用され、又は命令実行システム、装置又は機器と組み合わせて使用されるプログラムを含むか、記憶してもよい。機器読み取り可能な媒体は、機器読み取り可能な信号媒体又は機器読み取り可能な記憶媒体であってもよい。機器読み取り可能な媒体は、電子的、磁気的、光学的、電磁的、赤外線的、又は半導体システム、装置又は機器、又は上記内容の任意の適切な組み合わせを含んでもよいが、それらに限らない。機器読み取り可能な記憶媒体のより具体的な例として、1つ又は複数の線に基づく電气接続、携帯型コンピュータディスク、ハードディクス、ランダムアクセスメモリ(RAM)、リードオンリーメモリ(ROM)、消去可能プログラマブルリードオンリーメモリ(EPROM又はフラッシュメモリ)、ファイバ、便利なコンパクトディスクリードオンリーメモリ(CD-ROM)、光学記憶機器、磁気記憶機器、又は上記内容の任意の適切な組み合わせを含む。
【0093】
ユーザとのインタラクションを提供するために、コンピュータ上でここに記述されるシステムと技術を実施してもよく、このコンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極管表示装置)又はLCD(液晶ディスプレイ)監視器)、及びキーボードと指向装置(例えば、マウス又はトラックボール)を有し、ユーザは、このキーボードとこの指向装置によって入力をコンピュータに提供することができる。他の種類の装置はさらに、ユーザとのインタラクションを提供するために用いられてもよく、例えば、ユーザに提供するフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、且つ任意の形式(音声入力、ボイス入力又は、触覚入力を含む)でユーザからの入力を受信してもよい。
【0094】
ここに記述されるシステムと技術を、バックグラウンド部品を含むコンピューティングシステム(例えば、データサーバとして)、又はミドルウェア部品を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部品を含むコンピューティングシステム(例えば、グラフィックスユーザインターフェース又はネットワークブラウザを有するユーザコンピュータ、ユーザは、このグラフィックスユーザインターフェース又はこのネットワークブラウザによってここに記述されているシステムと技術の実施の形態とインタラクションすることができる)、又はこのようなバックグラウンド部品、ミドルウェア部品、又はフロントエンド部品を含む任意の組み合わせのコンピューティングシステムに実施してもよい。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によってシステムの部品を互に接続してもよい。通信ネットワークの例は、ローカルエリアネットワーク(LAN)と、ワイドエリアネットワーク(WAN)とインターネットとを含む。
【0095】
コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、一般的には、互いに離れており、通常、通信ネットワークによってインタラクションされる。該当するコンピュータ上で運行し、且つ互いにクライアント-サーバ関係を有するコンピュータプログラムによってクライアントとサーバの関係を生成する。サーバは、クラウドサーバであってもよく、分散型システムのサーバであってもよく、又はブロックチェーンを結び付けたサーバであってもよい。
【0096】
理解すべきことは、上記に示される様々な形式のフローを用いて、順位を再並べ替え、ステップを追加し、削除してもよい。例えば、本開示に記載されている各ステップは、並列に実行されてもよく、順次に実行されてもよく、異なる手順で実行されてもよい。本開示に開示される技術案が望ましい結果を達成することができる限り、本明細書は、ここで制限しない。
【0097】
上記具体的な実施の形態は、本開示の保護範囲に対する制限を構成しない。当業者が理解すべきことは、設計要求と他の要素に基づいて、様々な修正、組み合わせ、サブ組み合わせと置き換えを行ってもよい。本開示の精神と原則内に行われる任意の修正、同等の置き換えと改良などは、本開示の保護範囲内に含まれるべきである。
図1
図2
図3
図4
図5