(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-07
(45)【発行日】2023-08-16
(54)【発明の名称】画像処理方法及び情報処理装置
(51)【国際特許分類】
G06T 7/00 20170101AFI20230808BHJP
G06T 7/50 20170101ALI20230808BHJP
【FI】
G06T7/00 660A
G06T7/50
(21)【出願番号】P 2019226684
(22)【出願日】2019-12-16
【審査請求日】2022-08-09
(31)【優先権主張番号】201811549825.3
(32)【優先日】2018-12-18
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】100107766
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】郭 松
(72)【発明者】
【氏名】李 斐
【審査官】藤原 敬利
(56)【参考文献】
【文献】特開2009-211178(JP,A)
【文献】特開2011-022994(JP,A)
【文献】特開2005-209148(JP,A)
【文献】国際公開第2015/068470(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00- 7/90
G06V 10/00-20/90
G06V 40/00-40/70
(57)【特許請求の範囲】
【請求項1】
2次元画像における顔対象に基づいて、3次元顔モデルを構築し、
構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定し、
前記対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出するように構成されるプロセッサを含む、情報処理装置。
【請求項2】
プロセッサは、2次元画像における顔対象の、複数のキーポイントを含む2次元形状に基づいて、前記3次元顔モデルを構築するように構成される、請求項1に記載の情報処理装置。
【請求項3】
プロセッサは、さらに、
抽出された各キーポイントの画像特徴に基づいて、予め取得された回帰部を用いて顔対象の2次元形状の現在の増分を構築し、
取得された顔対象の2次元形状及び顔対象の2次元形状の現在の増分に基づいて、顔対象の現在の2次元形状を取得するように構成される、請求項2に記載の情報処理装置。
【請求項4】
プロセッサは、さらに、
所定条件が満たされるまで、3次元顔モデルの構築、対応関係の決定、関心領域の決定、画像特徴の抽出、現在の増分の構築及び現在の2次元形状の取得のステップを反復的に実行するように構成される、請求項3に記載の情報処理装置。
【請求項5】
キーポイントは、目尻、眉、鼻の先、口元及び/又は顎の中心を含む、請求項1乃至4の何れかに記載の情報処理装置。
【請求項6】
前記回帰部は、2次元形状が予めラベル付けされた、顔対象を含む2次元訓練画像に基づいて訓練により取得される、請求項3又は4に記載の情報処理装置。
【請求項7】
プロセッサは、さらに、
2次元画像における関心領域を決定する際に、前記対応関係に基づいて、3次元顔モデルにおける関心領域を2次元画像に投影し、投影結果を2次元画像における関心領域とするように構成される、請求項1乃至4の何れかに記載の情報処理装置。
【請求項8】
3次元顔モデルにおけるキーポイント近傍の関心領域は、3次元顔モデルにおけるキーポイントを中心とする球体内の3次元顔モデルの部分を含む、請求項7に記載の情報処理装置。
【請求項9】
プロセッサは、さらに、
3次元顔モデルと2次元画像における顔対象との対応関係を決定する際に、顔対象の3次元姿勢を決定し、
2次元画像における関心領域を決定する際に、決定された3次元姿勢に基づいて、3次元顔モデルにおけるキーポイントが2次元画像において見えるか否かを判断し、2次元画像において見えるキーポイント近傍の関心領域のみを投影するように構成される、請求項7に記載の情報処理装置。
【請求項10】
2次元画像における顔対象に基づいて、3次元顔モデルを構築するステップと、
構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定するステップと、
前記対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出するステップと、を含む、画像処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、画像処理の分野に関し、具体的には、顔対象を含む2次元画像から画像特徴を抽出する画像処理方法、及び上記画像処理方法を実現可能な情報処理装置に関する。
【背景技術】
【0002】
画像処理技術の発展に伴い、顔認識、顔属性分類及び3次元顔再構築などの顔に関する多くのタスクが益々注目され、応用されている。
【0003】
顔に関連する各種のタスクでは、通常、予め定義された一連のキーポイント(例えば目尻、鼻の先、口元及び顎の中心点など)に対して各種の前処理を行い、例えば後続の処理を行うために、キーポイントに関連する画像特徴を抽出する必要がある。本分野では、キーポイントに関連する画像特徴を抽出するためのアルゴリズムが多数あるが、顔の表情及び姿勢、並びに外部環境の変化が顔画像へ影響を与えるため、殆どのアルゴリズムは現実のシーンの要求を満たすことができない。
【0004】
よって、人間の顔(即ち、顔対象)を含む2次元画像からキーポイントに関連する画像特徴を抽出するための改良された方法が求められている。
【発明の概要】
【発明が解決しようとする課題】
【0005】
以下は、本発明の態様を基本的に理解させるために、本発明の簡単な概要を説明する。なお、この簡単な概要は、本発明を網羅的な概要ではなく、本発明のポイント又は重要な部分を意図的に特定するものではなく、本発明の範囲を意図的に限定するものではなく、後述するより詳細的な説明の前文として、単なる概念を簡単な形で説明することを目的とする。
【0006】
従来の画像処理方法を改善する要望を鑑み、本発明は、顔対象を含む2次元画像から画像特徴を抽出し、特徴抽出の正確性を改善できる画像処理方法を提供することを目的の1つとする。
【課題を解決するための手段】
【0007】
本開示の1つの態様では、2次元画像における顔対象に基づいて、3次元顔モデルを構築するステップと、構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定するステップと、前記対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出するステップと、を含む、画像処理方法を提供する。
【0008】
本開示のもう1つの態様では、上記の画像処理方法を実行するように構成されるプロセッサを含む、情報処理装置を提供する。
【0009】
本発明の他の態様では、コンピュータにより上記の画像処理方法を実現する、プログラムをさらに提供する。
【0010】
本発明の他の態様では、機器が読み取り可能な命令コードが記憶されている記憶媒体であって、前記命令コードが機器により読み取られて実行される際に、コンピュータに上記の画像処理方法を実行させる、記憶媒体をさらに提供する。
【0011】
本開示の実施例の各態様によれば、少なくとも、2次元画像に含まれる3次元情報を用いて2次元画像におけるキーポイントの画像特徴の抽出の正確性を向上させることができる。
【0012】
以下は図面を参照しながら本発明の好ましい実施例を詳細に説明することにより、本開示の上記及び他の利点はより明確になる。
【図面の簡単な説明】
【0013】
本開示の上記及び他の利点及び特徴を理解させるために、以下は図面を参照しながら本開示の具体的な実施形態を詳細に説明する。図面及び以下の詳細な説明は本明細書に含まれ、本明細書の一部を構成する。同一の機能及び構造を有する素子は同一の符号で示される。なお、これらの図面は単なる本開示の典型的な例を説明するためのものであり、本開示の範囲を限定するものではない。
【
図1】本開示の実施例に係る画像処理方法の流れの一例を示すフローチャートである。
【
図2】本開示の実施例に係る画像処理方法の流れの他の例を示すフローチャートである。
【
図3】本開示の実施例に係る画像処理方法の流れの他の例を示すフローチャートである。
【
図4】
図3に示す画像処理方法の流れを説明するための図である。
【
図5】
図3に示す画像処理方法の流れを説明するための図である。
【
図6】
図3に示す画像処理方法の流れを説明するための図である。
【
図7】
図2又は
図3の例に適用される回帰部の取得方法の流れを示すフローチャートである。
【
図8】本開示の実施例に係る画像処理装置の構成の一例を示すブロック図である。
【
図9】本開示の実施例に係る画像処理装置の構成の他の例を示すブロック図である。
【
図10】本開示の実施例に係る画像処理装置の構成の他の例を示すブロック図である。
【
図11】本開示の実施例に係る画像処理方法及び装置を実現するための可能なハードウェア構成を示すブロック図である。
【発明を実施するための形態】
【0014】
以下、図面を参照しながら本発明の例示的な実施例を詳細に説明する。説明の便宜上、明細書には実際の実施形態の全ての特徴が示されていない。なお、実際に実施する際に、開発者の具体的な目標を実現するために、特定の実施形態を変更してもよい、例えばシステム及び業務に関する制限条件に応じて実施形態を変更してもよい。また、開発作業が非常に複雑であり、且つ時間がかかるが、本公開の当業者にとって、この開発作業は単なる例の作業である。
【0015】
なお、本発明を明確にするために、図面には本発明に密に関連する装置の構成要件及び/又は処理のステップのみが示され、本発明と関係のない細部が省略されている。
【0016】
本開示の1つの態様では、画像処理方法を提供する。
図1は本開示の実施例に係る画像処理方法100の流れの一例を示すフローチャートである。
【0017】
図1に示すように、画像処理方法100は以下のステップを含んでもよい。3次元顔モデルの構築のステップS101において、2次元画像における顔対象に基づいて、3次元顔モデルを構築する。対応関係の決定のステップS103において、構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定する。画像特徴の抽出のステップS105において、該対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出する。
【0018】
一例として、本開示の実施例の画像処理方法に適用される2次元画像は、顔対象(人間の顔)を含む任意の2次元画像であってもよく、ここで、顔対象は、様々な年齢、性別、人種などの様々な身分を有する人の顔であってもよく、様々な表情及び/又は姿勢を有してもよい。また、2次元画像には、様々な背景が存在してもよく、例えば該画像は現実のシーンにおいて撮影された写真画像であってもよい。
【0019】
本実施例の画像処理方法は、顔対象を含む2次元画像を処理し、該2次元画像に含まれる3次元情報を十分に利用することで、キーポイントの画像特徴を抽出する処理の正確性を向上させることができる。
【0020】
より具体的には、顔対象のキーポイント及びその特徴は、顔に関連する各種の画像処理に利用される可能性のある重要な情報である。これらのキーポイントは、例えば目尻、眉、鼻の先、口元及び/又は顎の中心(顎の中心点)などを含んでもよい。従来の2次元顔画像の処理では、各キーポイントの特徴は、その近傍の局所領域から直接抽出される。これらの局所領域は、主にキーポイントを中心とする円形又は矩形の領域を選択し、これらの領域は各キーポイントの具体的な状況(キーポイントの位置及び顔の姿勢など)を考慮していないため、領域に大量の複雑な背景が含まれ、キーポイントの特徴が不正確になり、さらに間違っている。輪郭のキーポイント及び大きな姿勢の顔におけるキーポイントの場合は、特徴が不正確である現象がより深刻である。本実施例に係る方法は、2次元画像における顔対象と3次元顔モデルとの対応関係を用いて、3次元顔モデルにおける関心領域を計算して該関心領域に基づいて2次元画像における関心領域を決定し、該関心領域から特徴を抽出する。3次元顔モデルに背景領域がないため、3次元モデルの関心領域を用いて対応する2次元画像において決定された関心領域はより簡単であり、これらの領域から抽出された特徴はより正確である。
【0021】
一例として、3次元顔モデルの構築のステップS101において、3次元変形モデル(3DMM)又は3次元点分布モデルなどの従来の3次元顔モデルを用いて、2次元画像における顔対象を反映するモデルを構築してもよい。本明細書では主に3次元変形モデルを一例にして説明するが、他の適切な方法を用いて3次元顔モデルを構築してもよく、ここでその説明を省略する。
【0022】
一般に、3次元顔モデルは、M個の点の3次元位置を含む行列で表されてもよい。
【数1】
【0023】
3次元変形モデルにより構築された3次元顔モデルSは、次の式(2)で表されてもよい。
【数2】
【0024】
ここで、S
0は平均顔モデルであり、
(外1)
は身分を表すn
1番目の基底関数であり、
(外2)
は該基底関数の再構成係数であり、N
idは身分を表す基底関数の総数であり、
(外3)
は表情を表すn
2番目の基底関数であり、
(外4)
は該基底関数の再構成係数であり、N
expは表情を表す基底関数の総数である。2種類の再構成係数の集合c(c
id,c
exp)は、再構成された3次元顔モデルを表す形状パラメータである。
【0025】
一例として、P. Paysan、R. Knothe、B. Amberg、S. Romdhani、T. Vetterらの論文「A 3D face model for pose and illumination invariant face recognition」(Sixth IEEE International Conference on Advanced Video and Signal Based Surveillance、第296-301頁、2009年」により平均顔モデルS0及び合計199個の身分を表す基底関数(Nid=199)を取得してもよく、C. Cao、Y. Weng、S. Zhou、Y. Tong、K. Zhouらの論文「Facewarehouse: a 3d facial expression database for visual computing」(IEEE Trans. Vis. Comput. Graph., 第3号、第20巻、第413-425頁、2014年)により合計29個の表情を表す基底関数(Nexp=29)を取得してもよい。
【0026】
3次元顔モデルの構築のステップS101において、2次元画像における顔対象の関連情報に基づいて、式(2)で示す3次元顔モデルの形状パラメータを決定してもよい。
【0027】
1つの好ましい実施例では、該3次元顔モデルは、2次元画像における顔対象の、複数のキーポイントを含む2次元形状に基づいて構築されてもよい。一例として、構築された3次元顔モデルにおけるキーポイントの2次元空間における投影と顔対象の2次元キーポイントとの距離を最小にしてもよい。以下はこれについて詳細に説明する。
【0028】
一般に、顔対象の2次元形状Uは、L個のキーポイントの2次元位置を含む行列で表されてもよい。
【数3】
【0029】
本実施例では、顔対象を含む処理すべき2次元画像では、例えば上記の式(3)のような顔対象の2次元形状Uが既に予めラベル付つけされ、或いは既に取得された(例えば、前処理により上記の2次元形状Uが既に取得された)。
【0030】
一方、一般的な3次元顔モデル(本実施例に適用される3次元変形モデルを含む)では、顔の所定のキーポイントの位置、即ち該ポイントの全ての3次元ポイントにおけるインデックスは固定されている。このため、S(:,d)で3次元顔モデルにおける全てのM個の3次元ポイントにおけるL個のキーポイントのサブ集合を表してもよく、ここで、dはL次元のベクトルであり、L個の2次元キーポイントに対応する3次元キーポイントのインデックスを表す。それに応じて、該サブ集合S(:,d)は2次元画像における顔対象の2次元形状Uに対応する。
【0031】
上述したように、構築された3次元顔モデルにおけるキーポイントS(:,d)の2次元空間における投影点と2次元画像における顔対象のキーポイントLとの距離を最小化することで、3次元顔モデルの形状パラメータcを決定してもよい。
【0032】
また、対応関係の決定のステップS103において、式(2)で示す構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定してもよい。一例として、該対応関係の決定は、3次元顔モデルにおける3次元キーポイント(S(:,d))から顔対象の2次元形状(U)への投影関係を決定することを含んでもよい。
【0033】
具体的には、次の投影関係を決定してもよい。
【数4】
ここで、
(外5)
は3次元顔モデルから2次元空間への投影関数である。弱透視投影を用いる場合、
(外6)
は次のようにさらに拡張されてもよい。
【数5】
【0034】
ここで、sは拡大/縮小パラメータであり、Pは直交投影行列
(外7)
であり、Rは3つの回転角α、β、γ(頭の姿勢の水平方向の回転、傾斜及び鉛直方向の回転にそれぞれ対応する)により制御される回転行列であり、tはt
x及びt
yにより構成された2次元平行移動パラメータベクトルである。式(5)における上記パラメータはベクトルp=(s、α、β、γ、t
x、t
y)
Tで示されてもよい。
【0035】
このように、上記の式(5)は次のように表されてもよい。
【数6】
【0036】
上記の式(4)~式(5)に基づいて、次の式(6)のような最適化関数を構築してもよい。
【数7】
【0037】
式(6)により、3次元顔モデルにおける3次元キーポイントS(:,d)の2次元空間への投影点pS(:,d)と顔対象の2次元キーポイントUとの距離が最小になる場合、最適化された投影パラメータp及び3次元顔モデルの最適された形状パラメータcを取得することができる。
【0038】
なお、
図1のフローチャート100では3次元顔モデルの構築のステップS101及び対応関係の決定のステップS103の順序関係が示されているが、上記の例において説明されたように、この2つのステップは並行又は同時に実行されてもよい。例えば上記の式(6)の最適化関数により形状パラメータcの決定(即ち3次元顔モデルの構築)及び投影パラメータpの決定(即ち対応関係の決定)を同時に行ってもよい。
【0039】
或いは、3次元顔モデルの構築のステップS101及び対応関係の決定のステップS103を反復的に実行してもよい。例えば、最初は、3次元顔モデルの形状パラメータcを0に設定してもよい。その後、k番目の反復では、
【数8】
に従って投影パラメータp
kを決定し、
【数9】
に従って形状パラメータc
kを決定し、反復停止条件を満たした場合に反復を停止してもよい。一例として、反復停止条件は、例えば上記の2つのパラメータの隣接する反復間のそれぞれの差が十分に小さいこと、又は反復回数が所定の合計反復回数に達することであってもよい。上記の投影パラメータpが取得されると、3次元顔モデルの姿勢(即ち回転行列R、それは2次元画像における顔対象の姿勢を表してもよい)を容易に決定することができる。
【0040】
3次元顔モデルが構築され、該3次元顔モデルと2次元画像における顔対象との対応関係が決定された後に、画像特徴の抽出のステップS105において、該対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出してもよい。
【0041】
一例として、3次元顔モデルにおける関心領域を用いて2次元画像における関心領域を決定するステップは、該対応関係に基づいて、3次元顔モデルにおける関心領域を2次元画像に投影し、投影結果を2次元画像における関心領域とするステップを含んでもよい。一例として、3次元顔モデルにおける関心領域は、3次元顔モデルにおけるキーポイントを中心とする球体内の3次元顔モデルの部分、即ち該球体内に含まれる、3次元顔モデルである3次元曲面上の各点のサブ集合を含んでもよい。一例として、該球体の半径は、実験などにより予め設定された合理的な半径であってもよい。
【0042】
それに応じて、投影により取得された2次元画像の関心領域は、3次元顔モデルの上記のサブ集合における各点の2次元画像における投影点の集合である。各キーポイントの位置及び顔の姿勢が異なるため、各キーポイントに対応する投影後の関心領域の形状も異なる。しかし、従来の2次元画像からキーポイント近傍の円形又は矩形の領域を直接決定する方法に比べて、本実施例の方法により決定された関心領域は2次元画像におけるキーポイントにより合致し、また、3次元顔モデルに背景領域がないため、2次元画像における背景領域の干渉を排除しやすい。
【0043】
一例として、上記の式(5)に従って、3次元顔モデルにおけるl番目のキーポイントの関心領域の2次元空間に投影することで得られた2次元画像における関心領域Patchlは次のように表されてもよい。
【0044】
Patchl=pkS(:,dl) 式(7)
式(7)における各パラメータは式(5)における対応するパラメータと同様な意味を有し、ここで、S(:,dl)は、3次元顔モデルにおけるl番目の3次元キーポイント近傍の関心領域におけるdl個の点のサブ集合(例えば、l番目の3次元キーポイントを中心とする球体内に含まれる、3次元顔モデルである3次元曲面上の各点のサブ集合)を表し、dlは上記サブ集合における3次元の点に対応するインデックスを表す。
【0045】
例えば上記の方法により決定された2次元画像における関心領域について、従来技術における各画像特徴の抽出方法を用いて該関心領域から画像特徴を、キーポイントに対応する画像特徴として抽出してもよい。例えば、SIFT(スケール不変特徴変換)、LBF(局所二値特徴)などの既知の特徴演算子を用いて上記画像特徴の抽出を行ってもよい。一例として、SIFT特徴演算子Φ()を用いて2次元画像におけるキーポイントUの関心領域から特徴Φ(U)を抽出する。上述したように、3次元顔モデルに背景領域がないため、3次元モデルの関心領域を用いて対応する2次元画像において決定された関心領域はより簡単であり、これらの領域から抽出された特徴はより正確である。
【0046】
本実施例の上記の例示的なプロセスでは、3次元顔モデルに存在し、且つ処理される2次元画像において見えない顔キーポイント(例えば、2次元画像における顔対象の姿勢などの原因により画像に見えない)が特に考慮されていない。一例として、顔の左部分がカメラに向かっている顔の2次元画像では顔の右部分におけるキーポイント(例えば右目の目尻など)が見えないと考えられる。このため、3次元顔モデルには全てのL個のキーポイントが含まれるが、2次元画像には、顔対象のL1個のキーポイント(L1<L)のみが見える場合がある。従って、1つの変形例では、計算プロセスでは2次元画像において見えない(L-L1)個のキーポイントを特に考慮してもよい。
【0047】
この変形例では、1つの前提として、3次元顔モデルと2次元画像における顔対象との対応関係を決定する際に、顔対象の3次元姿勢(例えば上記の回転行列R)が決定されている。その後、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定する際に、決定された3次元姿勢(例えば上記の回転行列R)に基づいて、3次元顔モデルにおけるキーポイントが2次元画像において見えるか否かを判断し、2次元画像において見えるキーポイント近傍の関心領域のみを投影してもよい。
【0048】
一例として、3次元顔モデルにおけるキーポイントが2次元画像において見えるか否かを判断する計算方法としては、各キーポイント周囲の3次元曲面法線ベクトルの方向とカメラ方向との夾角を計算し、夾角が90度よりも小さい場合は見えると判断し、そうでない場合は見えないと判断してもよい。
【0049】
例えば、3次元顔モデルにおける所定のキーポイントについて、まず3次元顔モデルにおける該キーポイントの周囲のポイント集合の3次元曲面法線ベクトルを計算し、これらの3次元曲面法線ベクトルの平均値を該キーポイントの法線ベクトルとして計算する。3次元顔モデルの頭の姿勢(回転行列R)に基づいて該法線ベクトルを回転させた後に、該法線ベクトルがカメラ方向に向かっているか、それともカメラ方向から離されるかを決定し、即ち該キーポイントが2次元画像において見えるか否かを決定してもよい。例えば、l番目のキーポイントの3次元曲面法線ベクトルNlについて、次の式(8)
に従ってその方向性vlを計算してもよい。
【0050】
vl=Nl・R12 式(8)
ここで、R12は回転行列Rにおける1行目及び2行目を表す。式(8)により計算された方向性vlが正である場合、l番目のキーポイントが2次元画像において見えると判断し、そうでない場合、それが見えないと判断する。
【0051】
この変形例では、各キーポイントが2次元画像において見えるか否かの情報が取得されると、3次元顔モデルにおける2次元画像において見えるキーポイント近傍の関心領域のみを投影し、投影により得られた2次元画像における関心領域から特徴を抽出してもよい。
【0052】
2次元画像において見えないキーポイントについて、顔の対称性によりその対称点の特徴を計算し、即ち、見える対称的なキーポイントについて上記の方法を用いて画像特徴を取得し、取得された特徴を該見えないキーポイントの画像特徴としてもよい。例えば、顔の左部分がカメラに向いている顔の2次元画像の例では、見える左目の目尻について抽出された特徴を、見えない右目の目尻の特徴としてもよい。或いは、不正確な特徴による後続の処理のアルゴリズムの性能の降下を回避するために、見えないキーポイントの特徴を0に直接設定してもよい。
【0053】
また、2次元画像において見えないキーポイントを考慮すると、例えば上記の式(7)の方法により各キーポイントが見えるか否かが決定された場合、このような可視性に基づいて、ステップS101及びステップS103における3次元顔モデルの構築及び該モデルと顔対象との対応関係の決定の精度を改善してもよい。より具体的には、可視性ベクトルVを導入して上記の式(6)を改善してもよい。
【数10】
【0054】
ここで、・は各要素の積を表す。
【0055】
なお、この変形例では各キーポイントの可視性が考慮されているが、このような付加的な考慮は単なる好ましい例を示し、必要なものではない。言い換えれば、キーポイントの可視性を考慮せずに本実施例の基本的な処理を行う場合であっても、従来の2次元画像からキーポイントの特徴を直接抽出する方法に比べて、特徴抽出の正確性を向上させる改善効果を得ることができる。
【0056】
以上は
図1を参照しながら本開示の実施例に係る画像処理方法の流れの一例を説明した。以下は、
図2を参照しながら本開示の実施例に係る画像処理方法の流れの他の例を説明する。
【0057】
図2は本開示の実施例に係る画像処理方法の流れの他の例を示すフローチャートである。
図2に示すように、本実施例の画像処理方法200と
図1の画像処理方法100との相違点として、増分の構築のステップS207及び2次元形状の構築のステップS209をさらに含む。増分の構築のステップS207において、抽出された各キーポイントの画像特徴に基づいて、予め取得された回帰部(regressor)を用いて顔対象の2次元形状の現在の増分を構築する。それに応じて、2次元形状の構造のステップS209において、取得された顔対象の2次元形状及び顔対象の2次元形状の現在の増分に基づいて、顔対象の現在の2次元形状を取得する。
【0058】
上記の相違点を除いて、本実施例の画像処理方法200における他のステップは
図1の画像処理方法100の対応するステップと略同様である。従って、上記の
図1を参照しながら説明された方法100における2次元画像における顔対象の2次元形状(又はキーポイントの集合)U及び対応する3次元顔モデルSを参照しながら、
図2の方法200を説明する。
【0059】
具体的には、ステップS101~S105に対応するステップS201~S205の後に、決定された2次元画像のキーポイントの関心領域から抽出された画像特徴Φ1(U0)を、2次元画像の画像特徴としてもよい。ここで、U0は予め取得され、或いは以前に知られている(例えば予めラベル付され、或いは前処理により取得された)顔対象の2次元形状(即ち、キーポイントの集合)である。
【0060】
そして、ステップS207において、抽出された各キーポイントの画像特徴Φ1(U0)に基づいて、予め得られた回帰部R1()を用いて顔対象の2次元形状の現在の増分R1(Φ1(U0))を構築してもよい。ここで、回帰部R1()は、予め得られた顔対象の2次元形状U0と実際の2次元形状との差分、即ち前者の実行すべき変位調整を表してもよい。ステップS209において、このように得られた2次元形状の現在の増分R1(Φ1(U0))を用いて予め得られた2次元形状U0を調整し、顔対象の実際の2次元形状により近い現在の2次元形状U1を取得してもよい。
【0061】
U
1=U
0+R
1(Φ
1(U
0)) 式(9)
一例として、上記の式(9)における回帰部R
1()は、真実又は現実の2次元形状が予めラベル付けされた、顔対象を含む2次元訓練画像に基づいて訓練により取得されてもよい。また、各種の従来のタイプの回帰部、例えば線形回帰部、サポートベクトル回帰部などを採用してもよく、ここでその説明を省略する(これらの回帰部は単なる一例であり、制限するものではなく、該回帰部の取得方法の例は
図7を参照しながら後述する)。
【0062】
以上の
図1を参照しながら説明するように、本開示の実施例の画像処理方法はキーポイントの特徴抽出の正確性を改善することができる。それに応じて、
図2に示す方法の例では、このように正確に抽出された画像特徴を用いて、既知のキーポイント自体の情報(即ち、既知の顔対象の2次元形状)を修正し、キーポイント自体の位置の精度を改善することができる。キーポイント自体の正確性又は精度を改善することで、例えば2次元の顔の位置合わせなどの後続の画像処理の正確度を改善することができる。
【0063】
以下は
図3を参照しながら本開示の実施例に係る画像処理方法の流れの他の例を説明する。
【0064】
図3は本開示の実施例に係る画像処理方法の流れの他の例を示すフローチャートである。
図3に示すように、本実施例の画像処理方法300と
図2の画像処理方法200との相違点として、所定条件(即ち、反復の停止条件)を満たすか否かを判断するステップS311をさらに含み、該条件が満たさない場合、該条件が満たされるまで、ステップS201~S209にそれぞれ対応する3次元顔モデルの構築のステップS301、対応関係の決定のステップS303、画像特徴の抽出のステップS305、増分の構築のステップS307及び2次元形状の構築の構造S309を反復的に実行する。一例として、反復の停止条件は、所定の反復回数に達すること、又は所定のパラメータの隣接する反復間の差(例えば、2回の隣接する反復間の2次元形状の差)が十分に小さくなることなどであってもよい。
【0065】
上記の相違点を除いて、本実施例の画像処理方法300における他のステップは
図2の画像処理方法200の対応するステップと略同様である。言い換えれば、この方法300では、反復の停止条件が満たされるか否かを判断するステップS311を除いて、他のステップにおける処理はステップS201~S209と略同様であり、その相違点は、現在の反復(k回目の反復)が前回の反復(k-1番目の反復)の結果に基づいて行われることのみである。このため、上記の
図2を参照しながら説明された方法200における対応する処理に基づいて、
図3の方法300を説明し、主に該方法と方法200との差異(又は方法200の基礎となる
図1を参照しながら説明された方法100との差異)を説明する。
【0066】
具体的には、本実施例の方法300では、最初(即ち、反復回数k=1の場合)に、関連パラメータの初期値を設定してもよい。例えば、最初に、顔対象を含む処理すべき2次元画像の2次元形状を平均顔画像の2次元形状(即ち、従来の前処理を用いて、従来技術における既知の平均顔画像におけるキーポイントの位置と処理すべき画像における顔対象とに対して初期位置合わせを行うことで得られた結果)に設定し、
図1に示す方法100と同様に、式(2)における形状パラメータが0の3次元顔モデル(平均顔モデル)を最初に使用される3次元モデルとして設定してもよい。その後、現在のk回目の反復において、前回であるk-1回目の反復の結果に基づいて関連処理を行う。
【0067】
例えば、k回目の反復では、方法300の3次元顔モデルの構築のステップS301及び対応関係の決定のステップS303において、前のk-1回目の反復により得られた顔対象の2次元形状U
k-1に基づいて、
図1のステップS101及びS103と同様な方法により(例えば式(1)~(6)を用いて)、現在の反復における3次元顔モデルS
k(形状パラメータc
k)、及び該顔モデルと2次元画像における顔対象との対応関係(投影パラメータp
k)を取得してもよい。
【0068】
次に、画像特徴の抽出のステップS305において、今回の反復において決定された3次元顔モデルS
k及び該3次元顔モデルと2次元画像における顔対象との対応関係(投影パラメータp
k)に基づいて、
図1のステップS105と同様な方法により(例えば式(7)を用いて)、3次元顔モデルS
kにおける各キーポイントの関心領域を2次元画像に投影し、投影結果を2次元画像における対応するキーポイントの関心領域(即ち、顔対象の2次元形状U
k-1における対応するキーポイントの関心領域)とし、これらの関心領域から画像特徴Φ
k(U
k-1)を抽出してもよい。
【0069】
その後、増分の構築のステップS307において、今回の反復において抽出された画像特徴Φ
k(U
k-1)に基づいて、
図2のステップS207と同様な方法により、予め取得されたk番目の回帰部R
k()を用いて、今回の反復における2次元形状の現在の増分R
k(Φ
k(U
k-1))を構築する。該増分は、取得された顔対象の2次元形状U
k-1とその実際の2次元形状との差又は変位を表してもよい。
【0070】
次に、2次元形状の構築のステップS309において、顔対象の実際の2次元形状により近い現在の2次元形状Ukを取得するように、今回の反復において取得された2次元形状の現在の増分Rk(Φk(Uk-1))を用いて、例えば次の式(9’)に従って、前回の反復において取得された2次元形状Uk-1を調整してもよい。
【0071】
U
k=U
k-1+R
k(Φ
k(U
k-1)) 式(9’)
例えば、上記の式(9’)における回帰部R
k()は、2次元形状が予めラベル付けされた、顔対象を含む2次元訓練画像に基づいて訓練により取得されてもよい。また、各種の従来のタイプの回帰部、例えば線形回帰部、サポートベクトル回帰部などを採用してもよく、ここでその説明を省略する(これらの回帰部は単なる一例であり、制限するものではなく、該回帰部の取得方法の例は
図7を参照しながら後述する)。
【0072】
その後、ステップS311において、所定の反復停止条件が満たされるか否かを判断する。ステップS311において該条件が満たされないと判断されると、処理はステップS301に戻り、ステップS311において反復停止条件が満たされるまで、ステップS301乃至ステップS311の処理をk+1回目の反復として再度実行してもよい。反復停止条件が満たされる場合、処理を終了させ、顔対象の2次元形状、即ち2次元画像におけるキーポイントの最終位置を処理結果として出力する。
【0073】
以上の
図2を参照しながら説明するように、本開示の実施例の画像処理方法は、正確に抽出された画像特徴を用いて、既知のキーポイント自体の情報(即ち、例えば初期の前処理により取得された顔対象の2次元形状)を修正する際に、キーポイント自体の位置の精度を改善することができる。
図3の方法300では、上記改善処理を反復的に実行することで、
図2の方法200に比べて、決定されたキーポイントの正確性又は精度をさらに改善することができる。
【0074】
以下は
図4乃至
図6を参照しながら
図3の方法の処理及びその効果を説明する。
図4乃至
図6は
図3に示す画像処理方法の流れを説明するための図である。
【0075】
一例として、
図4乃至
図6は
図3の方法300の一例における1回目~3回目の反復(即ち反復回数k=1、2、3)の状況をそれぞれ示している。各図では、上から下への4つのサブ図は、反復における2次元画像及びその顔対象の2次元形状又はキーポイントの集合U
k(白色の点で示す)、該2次元形状に基づいて構築された3次元モデル及びその3次元キーポイントの集合S
k(:d)(黒色の点で示す)、3次元モデルにおいて決定された特定点であるl番目のキーポイント(図中の顔の右部分の輪郭の1番目のキーポイント)の関心領域S
k(:dl)(黒色の領域で示す)、及び3次元モデルの関心領域に基づいて取得された2次元画像における該キーポイントの関心領域
(外8)
(黒色の点の周囲の白色領域で示す)を順次示している。
【0076】
図4乃至
図6から分かるように、本開示の実施例の画像処理方法は、キーポイント自体の正確性又は精度を改善することができ、キーポイントと2次元画像における顔対象との位置合わせの正確度を改善することができる。また、構築された3次元顔モデルは、2次元画像における顔対象をより正確に反映することができる。
【0077】
以上は
図1乃至
図6を参照しながら本開示の実施例に係る画像処理方法の流れの例を説明した。
図2及び
図3に示す方法では、予め訓練された回帰部を用いて2次元形状の増分を構築する。以下は、
図7を参照しながらこの回帰部の訓練方法の例を説明する。
図7は
図2又は
図3の例に適用される回帰部の取得方法の流れを示すフローチャートである。
【0078】
なお、回帰部を取得するための訓練処理は回帰部を適用するテスト処理(例えば上記の
図2又は
図3に示す画像処理方法の流れ)に基本的に対応するため、以下は主に訓練処理とテスト処理との相違点を説明し、テスト処理の同一又は類似の部分を省略し、或いは簡単に説明する。
【0079】
より具体的には、回帰部を取得するための訓練方法700は
図3に示す画像処理方法300の流れと同様である。
図7に示すように、訓練方法700と
図3の画像処理方法300との相違点として、増分の構築のステップS307の代わりに回帰部の訓練のステップS707を有する。また、訓練方法700の各ステップにおける処理対象は何れも訓練サンプル画像である(処理すべきターゲット画像ではない)。
【0080】
回帰部を訓練するために、訓練データセットを提供する必要がある。訓練データセットは、例えばN個の訓練サンプル画像I
i及びそのグラウンドトゥルース(groundtruth)キーポイントの位置
(外9)
、即ち
(外10)
を含んでもよい。また、各訓練サンプル画像Iiにおける初期キーポイントの位置
(外11)
を設定してもよい。一例として、訓練サンプル画像におけるキーポイントの初期位置は、例えば
図4における上部のサブ図面に示すように、平均顔画像の2次元形状(即ち、平均顔画像における2次元形状に対して初期的な前処理及び訓練サンプル画像における顔対象との初期的な位置合わせのみを行う)を採用してもよい。また、最初に、式(2)に示すように3次元顔モデル
(外12)
の初期の形状パラメータcを0に設定してもよい。訓練により、カスケードされた回帰部
(外13)
を取得でき、ここで、Kは例えば
図7に示す訓練方法に関連する反復の総回数である。
【0081】
初期設定後の各反復では、前回の反復の処理結果に基づいて対応する処理を行ってもよい。例えば、現在のk番目の反復では、まず、ステップS701及びS703において、
図3におけるステップS301及びS303と同様に、各サンプル画像I
iについて前のk-1番目の反復の結果に基づいて今回の反復における3次元顔モデルを構築し、それと顔対象との対応関係を決定してもよい。
【0082】
一例として、式(6)と同様の次の式(10)に従って、前のk-1番目の反復において取得されたサンプル画像I
iの2次元形状
(外14)
に基づいて、該サンプル画像に対応する3次元モデルの現在のk番目の反復における投影パラメータ
(外15)
及び形状パラメータ
(外16)
を計算してもよい。
【数11】
【0083】
或いは、式(6’)を参照して同様の方法を用いてキーポイントの可視性を考慮し、式(10)を修正してもよく(この場合は、訓練サンプル画像では、キーポイントの可視性が予めラベル付けされている)、ここでその説明を省略する。また、キーポイントの可視性に関連する他の処理は上記のテスト処理と類似する方法を参照して修正してもよく、ここでその説明を省略する。
【0084】
上記の式(10)により決定された形状パラメータ
(外17)
に基づいて、式(2)と同様の次の式(11)に従ってサンプル画像I
iの現在の反復における3次元顔モデル
(外18)
を表してもよい。
【数12】
【0085】
なお、上記の式(11)の右側では、簡潔化のために、サンプル画像I
iの形状パラメータ
(外19)
における身分パラメータ
(外20)
及び表情パラメータ
(外21)
の下付きを特に示していないが、異なるサンプル画像I
iについて上記の形状パラメータは異なる。
【0086】
次に、ステップS705において、
図3におけるステップS305と同様に、各サンプル画像I
iについて、ステップS305において決定された対応関係(投影パラメータ
(外22)
)に基づいて、3次元顔モデル
(外23)
におけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を対応するキーポイントの画像特徴として抽出してもよい。
【0087】
一例として、3次元顔モデルにおける関心領域を2次元画像に投影し、投影結果を2次元画像における関心領域としてもよい。1つの態様では、3次元顔モデルにおける関心領域は、3次元顔モデルにおけるキーポイントを中心とする球体内の3次元顔モデルの部分、即ち該球体内に含まれる、3次元顔モデルである3次元曲面上の各点のサブ集合を含んでもよい。それに応じて、投影により取得された2次元画像における感心領域は、該サブ集合における各点の2次元画像における投影点の集合である。
【0088】
例えば、上記の式(5)~(7)を参照すると、3次元顔モデル
(外24)
におけるl番目のキーポイントの関心領域の2次元空間に投影して得られた2次元画像における関心領域
(外25)
は次にように表されてもよい。
【数13】
【0089】
式(12)における各パラメータは式(7)における対応するパラメータと同様の意味を有し、ここで、
(外26)
は、k回目の反復における3次元顔モデル
(外27)
におけるl番目の3次元キーポイント近傍の関心領域における
(外28)
個の点のサブ集合(例えば、l番目の3次元キーポイントを中心とする所定半径の球体内に含まれる、3次元顔モデルである3次元曲面上の各点のサブ集合)を表し、
(外29)
は上記サブ集合における3次元の点に対応するインデックスを表す。
【0090】
このように取得された各サンプル画像I
iの各関心領域
(外30)
について、特徴抽出関数
(外31)
を学習し、即ち各関心領域の画像特徴
(外32)
を取得してもよい。
【0091】
その後、ステップS707において、抽出されたN個のサンプル画像の各キーポイントの特徴
(外33)
(i=1,2,…N)に基づいて、次の式(13)を用いて、k階目の回帰部R
kを共同に訓練してもよい。
【数14】
【0092】
式(13)の最適化により、N個のサンプル画像の各キーポイントの特徴
(外34)
に基づいて構築された回帰部
(外35)
は、各サンプル画像の2次元形状の今回の反復において用いられる変位又は増分の調整を最適に表すことができる。言い換えれば、式(13)の作用は、回帰部
(外36)
で表される変位増分が各サンプル画像の真の2次元形状
(外37)
と前のk-1回目の反復において取得された2次元形状
(外38)
との差
(外39)
を最適に表すこと、即ち該回帰部
(外40)
と上記差
(外41)
との距離が最小になることである。上述したように、回帰部R
k自体は各種の適切な従来の形式、例えば線形回帰部、サポートベクタマシン回帰部などを採用してもよく、その具体的な訓練方法も各種の従来技術を採用してもよく、ここでその説明を省略する。
【0093】
次に、ステップS709において、各サンプル画像I
iについて、取得された回帰部R
kを用いてその2次元形状の増分
(外42)
をそれぞれ構築し、取得された現在の2次元形状
(外43)
が真の2次元形状に近くなるように、該増分に基づいて前の反復において取得された2次元形状
(外44)
を調整してもよい。
【数15】
【0094】
その後、ステップS711において、反復の停止条件が満たされるか否かを判断する。例えば、反復の停止条件は、所定の反復回数Kに達すること、2回の隣接する反復間の2次元形状の差が所定閾値よりも小さいこと、又は現在の2次元形状と真の2次元形状との差が所定閾値よりも小さいことなどを含んでもよい。ステップS711において該条件が満たされないと判断された場合、処理はステップS701に戻り、ステップS711において反復の停止条件が満たされると判断されるまで、ステップS701乃至ステップS711の処理を繰り返してもよい。反復の停止条件が満たされた場合、訓練処理を終了させ、カスケードされた回帰部
(外45)
を取得する。それと同時に、各反復における特徴の演算子、即ち特徴抽出関数集合
(外46)
を取得する。
【0095】
上記の訓練処理により取得されたカスケード回帰部
(外47)
及び特徴抽出関数集合
(外48)
を用いて、
図3に示す画像処理方法の処理を行うことができる。
【0096】
また、本開示は画像処理装置を提供する。
図8は本開示の実施例に係る画像処理装置の構成の一例を示すブロック図である。
【0097】
図8に示すように、画像処理装置800は、3次元顔モデル構築部801、対応関係決定部802及び画像特徴抽出部803を含んでもよい。3次元顔モデル構築部801は、2次元画像における顔対象に基づいて、3次元顔モデルを構築する。対応関係決定部802は、構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定する。画像特徴抽出部803は、該対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出する。
【0098】
上記の画像処理装置及びその各部は、例えば
図1に示す本開示の実施例の画像処理方法及びその各ステップの動作及び/又は処理を行い、同様の効果を実現することができ、ここでその説明を省略する。
【0099】
図9は本開示の実施例に係る画像処理装置の構成の他の例を示すブロック図である。
【0100】
図9に示すように、画像処理装置900は、
図8の画像処理装置800との相違点として、3次元顔モデル構築部801、対応関係決定部802及び画像特徴抽出部803にそれぞれ対応する3次元顔モデル構築部901、対応関係決定部902及び画像特徴抽出部903に加えて、増分構築部904及び2次元形状構築部905をさらに含む。増分構築部904は、抽出された各キーポイントの画像特徴に基づいて、予め取得された回帰部を用いて顔対象の2次元形状の現在の増分を構築する。2次元形状構築部905は、取得された顔対象の2次元形状及び顔対象の2次元形状の現在の増分に基づいて、顔対象の現在の2次元形状を取得する。上記の相違点を除いて、本実施例の画像処理装置900は、
図8の画像処理装置800と完全に同じであり、ここでその説明を省略する。
【0101】
上記の画像処理装置及びその各部は、例えば
図2に示す本開示の実施例の画像処理方法及びその各ステップの動作及び/又は処理を行い、同様の効果を実現することができ、ここでその説明を省略する。
【0102】
図10は本開示の実施例に係る画像処理装置の構成の他の例を示すブロック図である。
【0103】
図10に示すように、画像処理装置1000は、
図9の画像処理装置900との相違点として、3次元顔モデル構築部901、対応関係決定部902、画像特徴抽出部903、増分構築部904及び2次元形状構築部905にそれぞれ対応する3次元顔モデル構築部1001、対応関係決定部1002、画像特徴抽出部1003、増分構築部1004及び2次元形状構築部1005に加えて、所定条件(即ち反復の停止条件)が満たされるか否かを判定する反復停止条件判定部1006をさらに含む。画像処理装置100が処理すべき画像を処理する際に、反復停止条件判定部1006により反復の停止条件が満たされないと判定された場合、反復停止条件判定部1006により反復の停止条件が満たされると判定されるまで、3次元顔モデル構築部1001、対応関係決定部1002、画像特徴抽出部1003、増分構築部1004及び2次元形状構築部1005はそれぞれの処理を反復的に実行する。一例として、反復の停止条件は、所定の反復回数に達すること、又は所定のパラメータの隣接する反復間の差(例えば、2回の隣接する反復間の2次元形状の差)が十分に小さくなることなどであってもよい。上記の相違点を除いて、本実施例の画像処理装置1000は、
図9の画像処理装置900と完全に同じであり、ここでその説明を省略する。
【0104】
上記の画像処理装置及びその各部は、例えば
図3に示す本開示の実施例の画像処理方法及びその各ステップの動作及び/又は処理を行い、同様の効果を実現することができ、ここでその説明を省略する。
【0105】
また、本開示では、上記の画像処理方法を実行するように構成されるプロセッサを含む、情報処理装置をさらに提供する。
【0106】
より具体的には、1つの態様では、該プロセッサは、2次元画像における顔対象に基づいて、3次元顔モデルを構築し、構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定し、該対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出するように構成されてもよい。
【0107】
一例として、プロセッサは、2次元画像における顔対象の、複数のキーポイントを含む2次元形状に基づいて、該3次元顔モデルを構築するように構成されてもよい。
【0108】
1つの好ましい態様では、プロセッサは、さらに、抽出された各キーポイントの画像特徴に基づいて、予め取得された回帰部を用いて顔対象の2次元形状の現在の増分を構築し、取得された顔対象の2次元形状及び顔対象の2次元形状の現在の増分に基づいて、顔対象の現在の2次元形状を取得するように構成されてもよい。
【0109】
1つの好ましい態様では、プロセッサは、さらに、所定条件が満たされるまで、3次元顔モデルの構築、対応関係の決定、関心領域の決定、画像特徴の抽出、現在の増分の構築及び現在の2次元形状の取得のステップを反復的に実行するように構成されてもよい。
【0110】
一例として、キーポイントは、目尻、眉、鼻の先、口元及び/又は顎の中心を含んでもよい。
【0111】
一例として、該回帰部は、2次元形状が予めラベル付けされた、顔対象を含む2次元訓練画像に基づいて訓練により取得されてもよい。
【0112】
1つの好ましい態様では、プロセッサは、さらに、2次元画像における関心領域を決定する際に、該対応関係に基づいて、3次元顔モデルにおける関心領域を2次元画像に投影し、投影結果を2次元画像における関心領域とするように構成されてもよい。
【0113】
一例として、3次元顔モデルにおけるキーポイント近傍の関心領域は、3次元顔モデルにおけるキーポイントを中心とする球体内の3次元顔モデルの部分を含んでもよい。
【0114】
1つの好ましい態様では、プロセッサは、さらに、3次元顔モデルと2次元画像における顔対象との対応関係を決定する際に、顔対象の3次元姿勢を決定し、2次元画像における関心領域を決定する際に、決定された3次元姿勢に基づいて、3次元顔モデルにおけるキーポイントが2次元画像において見えるか否かを判断し、2次元画像において見えるキーポイント近傍の関心領域のみを投影するように構成されてもよい。
【0115】
図11は本開示の実施例に係る情報処理装置及び画像処理方法を実現するための可能なハードウェア構成を示すブロック図である。
【0116】
図11において、中央処理部(CPU)1101は、読み出し専用メモリ(ROM)1102に記憶されているプログラム、又は記憶部1108からランダムアクセスメモリ(RAM)1103にロードされたプログラムにより各種の処理を実行する。RAM1103には、必要に応じて、CPU1101が各種の処理を実行するに必要なデータが記憶されている。CPU1101、ROM1102、及びRAM1103は、バス1104を介して互いに接続されている。入力/出力インターフェース1105もバス1104に接続されている。
【0117】
入力部1106(キーボード、マウスなどを含む)、出力部1107(ディスプレイ、例えばブラウン管(CRT)、液晶ディスプレイ(LCD)など、及びスピーカなどを含む)、記憶部1108(例えばハードディスクなどを含む)、通信部1109(例えばネットワークのインタフェースカード、例えばLANカード、モデムなどを含む)は、入力/出力インターフェース1105に接続されている。通信部1109は、ネットワーク、例えばインターネットを介して通信処理を実行する。必要に応じて、ドライバ1110は、入力/出力インターフェース1105に接続されてもよい。取り外し可能な媒体1111は、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどであり、必要に応じてドライバ1110にセットアップされて、その中から読みだされたコンピュータプログラムは必要に応じて記憶部1108にインストールされている。
【0118】
また、本開示は、機器が読み取り可能な命令コードが記憶されているプログラムプロダクトをさらに提供する。該命令コードは機器により読み取られ、実行される際に、上記の本開示の実施例に係る画像処理方法を実行することができる。それに応じて、本開示は、このようなプログラムプロダクトが記録されている磁気ディスク、光ディスク、光磁気ディスク、半導体メモリなどの各種の記憶媒体をさらに含む。
【0119】
本開示は、機器が読み取り可能な命令コードが記憶されている記憶媒体をさらに提供する。該命令コードが機器により読み取られ、実行される際に、機器に画像処理方法を実行させることができる。
【0120】
該記憶媒体は、例えば磁気ディスク、光ディスク、光磁気ディスク、半導体メモリ等を含んでもよいが、これらに限定されない。
【0121】
上記本開示の具体的な実施例の説明では、1つの実施形態における説明及び/又は特徴は同一又は類似の方式で他の1つ又は複数の実施形態において用いられてもよいし、他の実施形態における特徴と組み合わせてもよいし、他の実施形態における特徴を置き換えてもよい。
【0122】
また、本開示の各実施例の方法は、明細書に説明された時間的順序で実行するものに限定されず、他の時間的順序で順次、並行、又は独立して実行されてもよい。このため、本明細書に説明された方法の実行順序は、本発明の技術的な範囲を限定するものではない。
【0123】
なお、本開示の上記の方法の各動作プロセスは、各種の機器読み取り可能な記憶媒体に記憶されたコンピュータ実行可能なプログラムにより実現されてもよい。
【0124】
また、本開示の目的は次の方式により実現されてもよい。上記の実行可能なプログラムコードが記憶された記憶媒体をシステム又は装置に直接又は間接に提供し、該システム又は装置におけるコンピュータ又は中央処理装置(CPU)により該プログラムコードを読み出し、実行する。
【0125】
この場合、該システム又は装置がプログラムを実行する機能を有する限り、本開示の実施形態はプログラムに限定されない。また、該プログラムは、任意の形式、例えばオブジェクトプログラム、インタープリタにより実行されるプログラム、又はオペレーティングシステムに提供されるスクリプトプログラムなどであってもよい。
【0126】
上記の機器読み取り可能な記憶媒体は、各種の記憶装置及び記憶部、半導体装置、光ディスク、磁気ディスク及び光磁気ディスクなどのディスク、並びに情報を記憶可能な媒体などを含むが、これらに限定されない。
【0127】
また、本開示の各実施例は、ユーザ情報処理端末がインターネット上の対応するウェブサイトに接続することで、本開示のコンピュータプログラムコードを情報処理端末にダウンロードしてインストールし、該プログラムを実行することを含んでもよい。
【0128】
また、上述の各実施例を含む実施形態に関し、更に以下の付記を開示する。
(付記1)
2次元画像における顔対象に基づいて、3次元顔モデルを構築し、
構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定し、
前記対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出するように構成されるプロセッサを含む、情報処理装置。
(付記2)
プロセッサは、2次元画像における顔対象の、複数のキーポイントを含む2次元形状に基づいて、前記3次元顔モデルを構築するように構成される、付記1に記載の情報処理装置。
(付記3)
プロセッサは、さらに、
抽出された各キーポイントの画像特徴に基づいて、予め取得された回帰部を用いて顔対象の2次元形状の現在の増分を構築し、
取得された顔対象の2次元形状及び顔対象の2次元形状の現在の増分に基づいて、顔対象の現在の2次元形状を取得するように構成される、付記2に記載の情報処理装置。
(付記4)
プロセッサは、さらに、
所定条件が満たされるまで、3次元顔モデルの構築、対応関係の決定、関心領域の決定、画像特徴の抽出、現在の増分の構築及び現在の2次元形状の取得のステップを反復的に実行するように構成される、付記3に記載の情報処理装置。
(付記5)
キーポイントは、目尻、眉、鼻の先、口元及び/又は顎の中心を含む、付記1乃至4の何れかに記載の情報処理装置。
(付記6)
前記回帰部は、2次元形状が予めラベル付けされた、顔対象を含む2次元訓練画像に基づいて訓練により取得される、付記3又は4に記載の情報処理装置。
(付記7)
プロセッサは、さらに、
2次元画像における関心領域を決定する際に、前記対応関係に基づいて、3次元顔モデルにおける関心領域を2次元画像に投影し、投影結果を2次元画像における関心領域とするように構成される、付記1乃至4の何れかに記載の情報処理装置。
(付記8)
3次元顔モデルにおけるキーポイント近傍の関心領域は、3次元顔モデルにおけるキーポイントを中心とする球体内の3次元顔モデルの部分を含む、付記7に記載の情報処理装置。
(付記9)
プロセッサは、さらに、
3次元顔モデルと2次元画像における顔対象との対応関係を決定する際に、顔対象の3次元姿勢を決定し、
2次元画像における関心領域を決定する際に、決定された3次元姿勢に基づいて、3次元顔モデルにおけるキーポイントが2次元画像において見えるか否かを判断し、2次元画像において見えるキーポイント近傍の関心領域のみを投影するように構成される、付記7に記載の情報処理装置。
(付記10)
2次元画像における顔対象に基づいて、3次元顔モデルを構築するステップと、
構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定するステップと、
前記対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出するステップと、を含む、画像処理方法。
(付記11)
前記3次元顔モデルは、2次元画像における顔対象の、複数のキーポイントを含む2次元形状に基づいて構築される、付記10に記載の画像処理方法。
(付記12)
抽出された各キーポイントの画像特徴に基づいて、予め取得された回帰部を用いて顔対象の2次元形状の現在の増分を構築ステップと、
取得された顔対象の2次元形状及び顔対象の2次元形状の現在の増分に基づいて、顔対象の現在の2次元形状を取得するステップと、をさらに含む、付記11に記載の画像処理方法。
(付記13)
所定条件が満たされるまで、3次元顔モデルの構築、対応関係の決定、関心領域の決定、画像特徴の抽出、現在の増分の構築及び現在の2次元形状の取得のステップを反復的に実行する、付記12に記載の画像処理方法。
(付記14)
キーポイントは、目尻、眉、鼻の先、口元及び/又は顎の中心を含む、付記10乃至13の何れかに記載の画像処理方法。
(付記15)
2次元形状が予めラベル付けされた、顔対象を含む2次元訓練画像に基づいて、訓練により前記回帰部を取得する、付記12又は13に記載の画像処理方法。
(付記16)
3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定するステップは、
前記対応関係に基づいて、3次元顔モデルにおける関心領域を2次元画像に投影し、投影結果を2次元画像における関心領域とするステップ、を含む、付記10乃至13の何れかに記載の画像処理方法。
(付記17)
3次元顔モデルにおけるキーポイント近傍の関心領域は、3次元顔モデルにおけるキーポイントを中心とする球体内の3次元顔モデルの部分を含む、付記16に記載の画像処理方法。
(付記18)
3次元顔モデルと2次元画像における顔対象との対応関係を決定するステップは、顔対象の3次元姿勢を決定するステップ、を含み、
3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定するステップは、決定された3次元姿勢に基づいて、3次元顔モデルにおけるキーポイントが2次元画像において見えるか否かを判断するステップ、を含み、
2次元画像において見えるキーポイント近傍の関心領域のみを投影する、付記16に記載の画像処理方法。
(付記19)
プログラムを記憶した記録媒体であって、前記プログラムがコンピュータにより実行される際に、
2次元画像における顔対象に基づいて、3次元顔モデルを構築するステップと、
構築された3次元顔モデルと2次元画像における顔対象との対応関係を決定するステップと、
前記対応関係に基づいて、3次元顔モデルにおけるキーポイント近傍の関心領域を用いて2次元画像における対応するキーポイントの関心領域を決定し、決定された2次元画像の関心領域から画像特徴を、対応するキーポイントの画像特徴として抽出するステップと、を含む、画像処理方法をコンピュータに実行させる、記録媒体。
【0129】
なお、本開示では、「第1」及び「第2」等の関係用語は、単なる1つの実体又は操作と他の実体又は操作とを区別するためのものであり、これらの実体又は操作間にこのような実際の関係又は順序が存在することを意味することではない。また、用語「含む」、「有する」又は他の任意の変形は、排他的に含むことに限定されず、一連の要素を含むプロセス、方法、物又は装置は、これらの要素を含むことだけではなく、明示的に列挙されていない他の要素、又はこのプロセス、方法、物若しくは装置の固有の要素を含む。また、さらなる制限がない限り、用語「1つの…を含む」より限定された要素は、該要素を含むプロセス、方法、物又は装置に他の同一の要素が存在することを排除しない。
【0130】
以上は図面を参照しながら本発明の好ましい実施例を説明しているが、上記実施例及び例は例示的なものであり、制限的なものではない。当業者は、特許請求の範囲の主旨及び範囲内で本発明に対して各種の修正、改良、均等的なものに変更してもよい。これらの修正、改良又は均等的なものに変更することは本発明の保護範囲に含まれるものである。
【0131】
本願は、2018年12月18日に中国特許庁に出願した出願番号が201811549825.3号、発明名称が「画像処理方法及び情報処理装置」の中国特許出願に基づく優先権を主張するものであり、その全内容を本願に参照により援用する。