(58)【調査した分野】(Int.Cl.,DB名)
前記対象画像は生体であり、前記特徴点位置は目、鼻、口、手、指、爪、骨、臓器、または、目、鼻、口、手、指、爪、骨、臓器の輪郭の情報を含む、請求項1に記載の特徴点位置検出装置。
正準変量を求める行列と、正準相関の2乗を対角成分に持つ行列と、特徴点位置初期情報の座標値の平均値のベクトルと、特徴点推定位置の平均値のベクトルとから構成される特徴点位置推定辞書情報を格納する特徴点位置推定辞書記憶手段を有する情報処理装置が、
対象画像に応じてあらかじめ検出した特徴点ごとに座標値として表された特徴点位置初期情報を入力し、
前記特徴点位置初期情報の前記座標値と前記特徴点位置推定辞書情報とから正準相関分析を用いて前記対象画像における所望の点数の前記特徴点推定位置を推定すし、
前記特徴点推定位置と、前記対象画像の形状に関するモデル、前記対象画像のテクスチャに関するモデル、および前記対象画像の形状に関するモデルと前記対象画像のテクスチャに関するモデルを統合した統合モデルと、前記特徴点推定位置から正規化された画像を抽出する関数を用いて、前記対象画像の特徴点位置探索の探索パラメータを求め、
前記探索パラメータと前記統合モデルを用いて形状に関するパラメータとテクスチャに関するパラメータを求め、
前記形状に関するパラメータと前記形状に関するモデルから正規化された前記特徴点推定位置を求め、
前記テクスチャに関するパラメータと前記テクスチャに関するモデルを用いて、前記探索パラメータから推定された画像を求め、
前記正規化された前記特徴点推定位置から前記正規化された画像を抽出する関数を用いて抽出した画像と、前記推定された画像の差分を求めることと前記探索パラメータを更新することを繰り返して前記対象画像の特徴点位置を探索し検出することを含む特徴点位置検出方法。
正準変量を求める行列と、正準相関の2乗を対角成分に持つ行列と、特徴点位置初期情報の座標値の平均値のベクトルと、特徴点推定位置の平均値のベクトルとから構成される特徴点位置推定辞書情報を格納する特徴点位置推定辞書記憶手段を有する情報処理装置を、
対象画像に応じてあらかじめ検出した特徴点ごとに座標値として表された特徴点位置初期情報を入力する特徴点位置初期情報入力手段と、
前記特徴点位置初期情報の前記座標値と前記特徴点位置推定辞書情報とから正準相関分析を用いて前記対象画像における所望の点数の前記特徴点推定位置を推定する特徴点推定位置推定手段と、
前記特徴点推定位置と、前記対象画像の形状に関するモデル、前記対象画像のテクスチャに関するモデル、および前記対象画像の形状に関するモデルと前記対象画像のテクスチャに関するモデルを統合した統合モデルと、前記特徴点推定位置から正規化された画像を抽出する関数を用いて、前記対象画像の特徴点位置探索の探索パラメータを求めるモデルパラメータ計算手段と、
前記探索パラメータと前記統合モデルを用いて形状に関するパラメータとテクスチャに関するパラメータを求め、
前記形状に関するパラメータと前記形状に関するモデルから正規化された前記特徴点推定位置を求め、
前記テクスチャに関するパラメータと前記テクスチャに関するモデルを用いて、前記探索パラメータから推定された画像を求め、
前記正規化された前記特徴点推定位置から前記正規化された画像を抽出する関数を用いて抽出した画像と、前記推定された画像の差分を求めることと前記探索パラメータを更新することを繰り返して前記対象画像の特徴点位置を探索し検出する手段として動作させるプログラム。
【発明を実施するための最良の形態】
【0014】
以下、図を参照しながら、本発明の最良の実施形態を詳細に説明する。但し、以下に述べる実施形態には、本発明を実施するために技術的に好ましい限定がされているが、発明の範囲を以下に限定するものではない。
【0015】
本発明の実施形態の特徴点位置検出装置について、図面を参照して説明する。
図1は、本発明の実施形態の顔などの画像の特徴点の位置を検出する特徴点位置検出装置1の構成を示すブロック図である。
【0016】
図1に示すように、本実施形態の特徴点位置検出装置1は、データ処理装置100と記憶装置200とを有する。データ処理装置100は、顔などの画像の特徴点位置初期情報を入力する特徴点位置初期情報入力手段110と、特徴点推定位置を推定する特徴点推定位置推定手段120と、モデルパラメータ計算手段130と、特徴点位置を探索する顔特徴点位置探索手段140とを有する。記憶装置200は、顔などの画像の特徴点位置推定辞書を記憶する特徴点位置推定辞書記憶手段210を有する。
【0017】
特徴点位置初期情報入力手段110は、外部から特徴点位置の初期情報を顔などの画像300に応じて入力する。特徴点位置の初期情報とは、例えば、外部の任意の、画像の特徴点の検出装置で得られる目、鼻、口などの特徴点位置の情報である。特徴点推定位置推定手段120は、特徴点位置初期情報入力手段110で入力された特徴点位置の初期情報から、特徴点位置推定辞書記憶手段210に記憶されている特徴点位置の推定辞書を用いて、対象とする画像300における所望の点数の特徴点推定位置を推定する。
【0018】
モデルパラメータ計算手段130は、特徴点推定位置推定手段120で推定した特徴点推定位置を基に、特徴点位置の探索における探索パラメータを求める。探索パラメータについては、後述のより具体的な実施形態の説明で詳しく述べる。特徴点位置探索手段140は、モデルパラメータ計算手段130で求めた探索パラメータを初期値とすることに基づいて、画像300の目や鼻や口などのモデルのパラメータフィッティングを行うことによって特徴点位置の探索を行い、特徴点位置310を検出する。
【0019】
次に、特徴点位置検出装置1の動作について、図面を参照して説明する。
図2は、
図1に示す特徴点位置検出装置1の動作を示すフローチャートである。
【0020】
まず、特徴点位置初期情報入力手段110が、外部から特徴点位置の初期情報を顔画像などの画像300に応じて入力する(ステップS111)。次に、特徴点推定位置推定手段120が、S111で入力された特徴点位置の初期情報から、特徴点位置推定辞書記憶手段210に記憶されている特徴点位置の推定辞書を用いて、対象とする画像300における所望の点数の特徴点推定位置を推定する(ステップS112)。
【0021】
次に、モデルパラメータ計算手段130が、S112で推定した特徴点推定位置を基に、特徴点位置の探索における探索パラメータを求める(ステップS113)。次に、特徴点位置探索手段140が、S113で求めた探索パラメータを初期値とすることに基づいて、モデルのパラメータフィッティングを行うことによって特徴点位置の探索を行い、特徴点位置310を検出する(ステップS114)。
【0022】
本実施形態によれば、特徴点位置初期情報入力手段110で入力された特徴点位置の初期情報から、特徴点位置探索手段140における適切なモデルパラメータの初期値、つまり、より正解に近いモデルパラメータを特徴点位置探索手段140の初期値とすることに基づいて、特徴点位置探索を行うことができる。これにより、特徴点位置探索時に局所解に陥ることが防がれ、高精度な特徴点位置の検出が可能となる。
【0023】
次に、本実施形態の構成と動作とについて、さらに具体的に説明する。
【0024】
図1に示す実施形態の特徴点位置検出装置1において、記憶装置200は、例えば、半導体メモリまたはハードディスクによって実現される。特徴点位置初期情報入力手段110、特徴点推定位置推定手段120、モデルパラメータ計算手段130、および、特徴点位置探索手段140は、例えば、プログラム制御に従って処理を実行するCPU(Central Processing Unit)によって実現される。また、特徴点位置推定辞書記憶手段210は、例えば、半導体メモリまたはハードディスクによって実現される。
【0025】
特徴点位置初期情報入力手段110は、外部からの特徴点位置の初期情報を、画像300に応じて、特徴点推定位置推定手段120に入力する。画像300に応じてとは、顔画像などの画像の人物を予め特定しておくことなどにより可能である。特徴点位置の初期情報とは、例えば、外部の任意の特徴点の検出装置などから予め得ることができる、目、鼻、口などの特徴点の位置(座標)である。
【0026】
特徴点位置の座標は、特徴点位置検出装置1が処理対象とする画像上の特徴点の位置を、特徴点位置ごとにそれぞれx座標値、y座標値の二つの数字の組として表す。外部の特徴点位置の初期情報の入力には、例えば、外部の任意の特徴点の検出装置を繋ぐことや、非特許文献3の特徴点の検出技術を用いること、あるいは、人間の手による特徴点位置の入力などが可能である。
【0027】
図3は、特徴点位置検出装置1が処理の対象とする画像300の例である顔画像301を示す図である。また、
図4は、特徴点位置初期情報入力手段110で入力する顔特徴点位置初期情報302を、顔画像301に重ね合わせて示した図である。
図4では、特徴点位置初期情報入力手段110で入力する顔特徴点位置初期情報302が×印で示されている。ここでは、左右の眉の両端部と、左右の目の中央部および両端部と、鼻の下部と、口の両端部および中央部との14点に×印が付されている。
【0028】
特徴点推定位置推定手段120は、特徴点位置初期情報入力手段110から入力された顔特徴点位置初期情報302、ここでは顔特徴点位置の座標値の情報から、特徴点位置推定辞書記憶手段210に記憶されている特徴点位置の推定辞書を用いて、対象とする顔画像301に応じた所望の点数の顔特徴点推定位置を推定する。
図5では、顔特徴点推定位置303を×印で、顔画像301に重ね合わせて示している。所望の点数の顔特徴点推定位置303の推定は、例えば、正準相関分析により行うことができる。また、所望の点数は、個別に指定することができる。
【0029】
ここでは、特徴点推定位置推定手段120が、特徴点位置初期情報入力手段110から入力された14個の顔特徴点位置初期情報302の座標値から、正準相関分析により、75個の顔特徴点推定位置303の座標値を推定する場合を示す。正準相関分析は多変量群間の相関関係を分析する手法である。ここで、14個の顔特徴点位置初期情報302の二次元座標値を縦に並べた28次元のベクトルをxとおくと、75個の顔特徴点推定位置303の二次元座標値を縦に並べた150次元ベクトルyは、
(数1)
【0030】
により計算される。ただし、数1のTはベクトル及び行列の転置を表す。また、U、V、Λは正準相関分析により求まる行列であり、それぞれ、Uはベクトルxの正準変量を求める行列で大きさは28×r、Vはベクトルyの正準変量を求める行列で大きさは150×r、Λは正準相関の2乗を対角成分に持つ行列で大きさはr×r、を意味する。なお、rはxとyの次元以下の正の整数であり、ここでは1から28までの間の任意の整数である。さらに、x
0、y
0は、それぞれ、x
0は14個の顔特徴点位置初期情報302の二次元座標値の平均値を縦に並べた28次元ベクトル、y
0は75個の顔特徴点推定位置303の二次元座標値の平均値を縦に並べた150次元ベクトルである。Λ、U、V、x
0、y
0は、特徴点位置推定辞書記憶手段210に記憶される。
【0031】
モデルパラメータ計算手段130は、特徴点推定位置推定手段120で推定した顔特徴点推定位置303を基に、顔の特徴点位置の探索における探索パラメータを求める。ここでは、特徴点推定位置推定手段120において14点の顔特徴点位置初期情報302の座標値から75点の顔特徴点推定位置303の座標値を推定した場合の例を示す。75個の顔特徴点推定位置303の二次元座標値を縦に並べた150次元ベクトルをy、顔特徴点位置探索手段140の顔の形状に関するモデルをS、顔のテクスチャに関するモデルをT、形状に関するモデルSとテクスチャに関するモデルTの統合モデルをAとしたとき、探索パラメータpは、
(数2)
【0032】
により計算される。数2のS(y)、T(y)はそれぞれ、yを入力として、予め定義されたモデルS、モデルTに従って各モデルに関する探索パラメータを返す関数、またAは、S(y),T(y)を入力として、予め定義されたモデルAに従って探索パラメータを返す関数である。なお、Active Appearance Model(AAM)では通常、モデルS、モデルT、モデルAは線形の部分空間としてモデル化するため、それぞれの部分空間を構成するベクトルを並べた行列をS、T、Aと置きなおすと、
(数3)
【0033】
により計算される。ただし、S、T、Aの行列サイズは、それぞれ、150×r
s、(g(y)の次元数)×r
t、(r
s+r
t)×r
aであり、r
s、r
t、r
aは各モデルのランクを示す。この場合、p
s、p
t、p
aのサイズは、それぞれ、r
s×1、r
t×1、r
a×1となる。また、g(y)は、75個の顔特徴点推定位置303の二次元座標値を縦に並べた150次元ベクトルyから、顔の二次元画像上での位置および大きさ、二次元画像上での回転角度、および顔形状が正規化された顔画像を抽出する関数である。関数gの出力は、正規化された顔画像の各画素の値を縦に並べたベクトルである。例えば、正規化顔画像の大きさが100画素×100画素の場合、関数gの出力は10000次元ベクトルとなる。非特許文献1のAAMでは、関数gはwarp imageとして知られている。warp imageでは、複数の特徴点位置の座標値の任意の三点から構成される三角形を定義し、この三角形ごとにアフィン変換を行うことで顔画像の正規化を行う。また、g
0は、予め複数の顔画像およびその特徴点位置情報yから求めたg(y)の平均ベクトルである。
【0034】
特徴点位置探索手段140では、モデルパラメータ計算手段130で求めた探索パラメータpを初期値として、モデルのパラメータフィッティングを行うことで特徴点位置の探索を行い、特徴点位置の検出を行う。モデルのパラメータフィッティングには、例えばAAMの場合、非特許文献1の手法を用いることができる。
【0035】
すなわち、探索パラメータpを初期値としてAAMでモデルのパラメータフィッティングを行う場合、予めAAMで学習したモデルS、モデルT、モデルAを利用して、まず、第一のステップにおいて、探索パラメータpとモデルAから顔の形状に関するパラメータp
sと顔のテクスチャに関するパラメータp
tを求める。次に、第二のステップにおいて、形状に関するパラメータp
sとモデルSを用いて顔の特徴点位置yを求め、正規化された顔画像g
sをg
s=g(y+y
0)により求める。次に、第三のステップにおいて、テクスチャに関するパラメータp
tとモデルTを用いて、探索パラメータpから推定される顔画像g
mを求める。さらに、第四のステップにおいて、差分画像dをd=g
s−g
mにより計算し、探索パラメータを更新する値δpをδp=−R×dにより求め、p=p+δpにより探索パラメータpを更新する。ここで、Rは予めAAMで学習した行列である。第一のステップから第四のステップまでを複数回繰り返すことにより、顔画像301の特徴点位置を確定することができる。
【0036】
以上により、顔画像の表情変動や個人変動、姿勢変動などに対して、少数の特徴点位置の初期情報を外部から入力することによって、所望の特徴点位置のおおよその位置を推定し、所望の特徴点位置のおおよその位置から特徴点位置の探索を開始することができる。これにより、正解とは異なる姿勢や表情などの顔形状を、入力画像に対して誤ってフィッティングする場合が抑制される。つまりは局所解に陥ることが防がれる。
【0037】
すなわち、特徴点位置初期情報入力手段110で入力された特徴点位置の初期情報から、特徴点探索手段140における適切なモデルパラメータの初期値、つまり、より正解に近いモデルパラメータを、特徴点位置探索手段140の初期値とすることに基づいて特徴点位置探索を行うことが可能となる。これにより、顔画像の表情変動や個人変動、姿勢変動などに対しても、高精度な特徴点位置の検出が可能となる。
【0038】
本発明は、顔の画像における特徴点位置の高精度な特定を可能とするにとどまらず、画像全般における特徴点位置の高精度な特定を可能とする。例えば、特徴点位置初期情報入力手段110において、顔の特徴点位置の代わりに手の特徴点位置として親指や人差し指あるいは爪等の初期情報を、予め別の手段で検出し特徴点位置初期情報入力手段110で入力することで、手の指の輪郭や爪などの検出が可能である。
【0039】
また、医療画像における骨や臓器などの輪郭の特定なども可能である。すなわち、特徴点位置としての所定の骨や臓器の初期情報を、予め別の手段で検出し特徴点位置初期情報入力手段110で入力することで、所定の骨や臓器の検出が可能である。また同様に、牛などの家畜の白黒などの模様の特定なども可能である。
【0040】
またさらに、本実施形態により特徴点位置の高精度な特定が可能となるので、これを用いて動物や植物の種類の特定、人工物としての自動車や船、飛行機、電子機器、建造物、絵画などの種類の特定も可能となる。例えば、自動車の場合、所定の種類の自動車の特徴点位置としてのヘッドライトの初期情報を、予め別の手段で検出し特徴点位置初期情報入力手段110で入力することで、所定の自動車のヘッドライトの検出が可能となる。これにより、逆に、自動車の種類を特定することができる。動植物や他の人工物に対しても同様である。
【0041】
本発明は上記実施形態に限定されることなく、請求の範囲に記載した発明の範囲内で、種々の変形が可能であり、それらも本発明の範囲内に含まれるものであることはいうまでもない。
【0042】
また、上記の実施形態の一部又は全部は、以下の付記のようにも記載され得るが、以下には限られない。
【0043】
付記
(付記1)
対象画像に応じて外部からの特徴点位置初期情報を入力する特徴点位置初期情報入力手段と、前記特徴点位置初期情報と特徴点位置推定辞書情報とから前記対象画像における所望の点数の特徴点推定位置を推定する特徴点推定位置推定手段と、前記特徴点推定位置から前記対象画像の特徴点位置探索の探索パラメータを求めるモデルパラメータ計算手段と、前記探索パラメータに基づいて前記対象画像のモデルのパラメータフィッティングを行うことで前記対象画像の特徴点位置を探索し検出する特徴点位置探索手段と、を備えた、特徴点位置検出装置。
(付記2)
前記特徴点推定位置は前記特徴点位置初期情報よりも多い、付記1に記載の特徴点位置検出装置。
(付記3)
前記特徴点位置推定辞書情報を格納する特徴点位置推定辞書記憶手段を備えた、付記1または2に記載の特徴点位置検出装置。
(付記4)
前記対象画像は人体を有する、付記1から3の内の1項記載の特徴点位置検出装置。
(付記5)
前記人体の前記特徴点位置は顔の目あるいは鼻あるいは口の情報を有する、付記4に記載の特徴点位置検出装置。
(付記6)
対象画像に応じて外部からの特徴点位置初期情報を入力し、前記特徴点位置初期情報と特徴点位置推定辞書情報とから前記対象画像における所望の点数の特徴点推定位置を推定し、前記特徴点推定位置から前記対象画像の特徴点位置探索の探索パラメータを求め、前記探索パラメータに基づいて前記対象画像のモデルのパラメータフィッティングを行うことで前記対象画像の特徴点位置を探索し検出する、特徴点位置検出方法。
(付記7)
前記特徴点推定位置は前記特徴点位置初期情報よりも多い、付記6に記載の特徴点位置検出方法。
(付記8)
前記特徴点位置推定辞書情報は格納された特徴点位置推定辞書を用いる、付記6または7に記載の特徴点位置検出方法。
(付記9)
前記対象画像は人体を有する、付記6から8の内の1項記載の特徴点位置検出方法。
(付記10)
前記人体の前記特徴点位置は顔の目あるいは鼻あるいは口の情報を有する、付記9に記載の特徴点位置検出方法。
(付記11)
特徴点位置検出装置に、対象画像に応じて外部からの特徴点位置初期情報を入力する処理と、前記特徴点位置初期情報と特徴点位置推定辞書情報とから前記対象画像における所望の点数の特徴点推定位置を推定する処理と、前記特徴点推定位置から前記対象画像の特徴点位置探索の探索パラメータを求める処理と、前記探索パラメータに基づいて前記対象画像のモデルのパラメータフィッティングを行うことで前記対象画像の特徴点位置を探索し検出する処理と、を実行させる特徴点位置検出プログラム。
(付記12)
前記特徴点推定位置は前記特徴点位置初期情報よりも多い、付記11に記載の特徴点位置検出プログラム。
(付記13)
前記特徴点位置推定辞書情報は格納された特徴点位置推定辞書を用いる、付記11または12に記載の特徴点位置検出プログラム。
(付記14)
前記対象画像は人体を有する、付記11から13の内の1項記載の特徴点位置検出プログラム。
(付記15)
前記人体の前記特徴点情報は顔の目あるいは鼻あるいは口の情報を有する、付記14に記載の特徴点位置検出プログラム。
(付記16)
対象画像に応じて外部からの特徴点位置初期情報を入力する特徴点位置初期情報入力手段と、前記特徴点位置初期情報と特徴点位置推定辞書情報とから前記対象画像における所望の点数の特徴点推定位置を推定する特徴点推定位置推定手段と、前記所望の点数の特徴点推定位置から特徴点位置の探索を開始する特徴点位置探索手段と、を備えた、特徴点位置検出装置。
(付記17)
対象画像に応じて外部からの特徴点位置初期情報を入力し、前記特徴点位置初期情報と特徴点位置推定辞書情報とから前記対象画像における所望の点数の特徴点推定位置を推定し、前記所望の点数の特徴点推定位置から特徴点位置の探索を開始する、特徴点位置検出方法。
(付記18)
特徴点位置検出装置に、対象画像に応じて外部からの特徴点位置初期情報を入力する処理と、前記特徴点位置初期情報と特徴点位置推定辞書情報とから前記対象画像における所望の点数の特徴点推定位置を推定する処理と、前記所望の点数の特徴点推定位置から特徴点位置の探索を開始する処理と、を実行させる特徴点位置検出プログラム。
【0044】
この出願は、2013年1月15日に出願された日本出願特願2013−004228を基礎とする優先権を主張し、その開示の全てをここに取り込む。