特許第6244059号(P6244059)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ペキン センスタイム テクノロジー ディベロップメント カンパニー リミテッドの特許一覧

特許6244059基準画像に基づく顔画像検証方法、及び顔画像検証システム
<>
  • 特許6244059-基準画像に基づく顔画像検証方法、及び顔画像検証システム 図000018
  • 特許6244059-基準画像に基づく顔画像検証方法、及び顔画像検証システム 図000019
  • 特許6244059-基準画像に基づく顔画像検証方法、及び顔画像検証システム 図000020
  • 特許6244059-基準画像に基づく顔画像検証方法、及び顔画像検証システム 図000021
  • 特許6244059-基準画像に基づく顔画像検証方法、及び顔画像検証システム 図000022
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6244059
(24)【登録日】2017年11月17日
(45)【発行日】2017年12月6日
(54)【発明の名称】基準画像に基づく顔画像検証方法、及び顔画像検証システム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20171127BHJP
【FI】
   G06T7/00 350C
   G06T7/00 660A
【請求項の数】19
【全頁数】15
(21)【出願番号】特願2017-503042(P2017-503042)
(86)(22)【出願日】2014年4月11日
(65)【公表番号】特表2017-510927(P2017-510927A)
(43)【公表日】2017年4月13日
(86)【国際出願番号】CN2014000389
(87)【国際公開番号】WO2015154205
(87)【国際公開日】20151015
【審査請求日】2016年10月4日
(73)【特許権者】
【識別番号】516158998
【氏名又は名称】ペキン センスタイム テクノロジー ディベロップメント カンパニー リミテッド
(74)【代理人】
【識別番号】100105924
【弁理士】
【氏名又は名称】森下 賢樹
(72)【発明者】
【氏名】タン、シャオオウ
(72)【発明者】
【氏名】ジュ、チェンヤオ
(72)【発明者】
【氏名】ルオ、ピン
(72)【発明者】
【氏名】ワン、シャオガン
【審査官】 佐藤 実
(56)【参考文献】
【文献】 特開2008−077536(JP,A)
【文献】 米国特許出願公開第2007/0086627(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 − 7/90
(57)【特許請求の範囲】
【請求項1】
同一の身元の複数の顔画像から最小正面測定値を持つ顔画像を獲得して前記身元の代表画像とする獲得ステップと、
獲得された前記代表画像と前記身元の前記複数の顔画像との間のマッピングに基づいて画像再構成ネットワークのパラメータを決定する決定ステップと、
決定されたパラメータを有する前記画像再構成ネットワークを介して、少なくとも2つの入力顔画像をそれぞれ相応の基準画像として再構成する再構成ステップと、
再構成された基準画像を比較して、再構成された基準画像が同じ身元に属するか否かを検証する比較ステップと、を含み、
その中で、前記代表画像は正面画像であり、前記正面測定値は各前記顔画像の対称性とシャープネスを表すこと
を特徴とする基準画像に基づく顔画像の検証方法。
【請求項2】
前記再構成ステップの後、前記方法は、
入力顔画像と、再構成された相応の基準画像との間の変換に基づいて、前記画像再構成ネットワークのパラメータを調整するステップをさらに含むこと
を特徴とする請求項1に記載の方法
【請求項3】
前記画像再構成ネットワークは、複数層を有するサブネットワークを備え、かつ前記決定ステップは、
画像訓練セットの入力により前記マッピングに基づいて前記画像再構成ネットワークの各層の初期パラメータを決定するステップと、
前記サブネットワークの最後の層の出力と、想定ターゲットとを比較して前記サブネットワークの最後の層の出力と前記想定ターゲットとの誤差を取得するステップと、
得られた誤差に基づいて前記初期パラメータを微調整して前記画像再構成ネットワークの全てのパラメータを具体化させるステップとをさらに含み、
その中で、前記画像再構成ネットワークの各層の初期パラメータを決定する期間に、前記サブネットワークの前の層の出力を前記サブネットワークの現在の層に入力こと
を特徴とする請求項1に記載の方法。
【請求項4】
前記比較ステップの前に、前記方法は、
任意の2つの再構成された基準画像の間の類似度を取得して画像検証ネットワークのパラメータを決定するステップをさらに含むこと
を特徴とする請求項1に記載の方法。
【請求項5】
再構成された基準画像のいずれの画像から、それぞれ1つ以上の顔部品を選択して1つ以上の顔部品対を形成するステップと、
前記顔部品対の間の類似度を取得して前記画像検証ネットワークのパラメータを決定するステップとをさらに含み、
その中で、前記顔部品対のいずれも、それぞれ前記基準画像における同一顔領域に対応した顔部品を含むこと
を特徴とする請求項4に記載の方法。
【請求項6】
前記正面測定値M(Y)は、
【数1】
で表われ、
その中で、Y∈Dは、顔画像セットDにおける顔画像を表し、
λは、定数係数であり、
||・||は、フロベニウスノルムであり、
||・||は、核ノルムであり、
P、Qは、2つの定数行列を表し、その中で、P=diag([1,0])かつQ=diag([0,1])であり、ここで、diag(・)は、対角行列を表すこと
を特徴とする請求項1に記載の方法。
【請求項7】
同一の身元の複数の顔画像から最小正面測定値を持つ顔画像を獲得して前記身元の代表画像とするように構成される獲得ユニットと、
入力顔画像をそれぞれ相応の基準画像として再構成するように構成される画像再構成ユニットと、
前記獲得ユニットで獲得された前記代表画像と前記身元の前記複数の顔画像との間のマッピングに基づいて前記画像再構成ユニットのパラメータを決定するように構成される決定ユニットと、
前記画像再構成ユニットで再構成された前記基準画像を比較し、再構成された基準画像が同じ身元に属するか否かを検証するように構成される比較ユニットとを備え、
その中で、前記代表画像は正面画像であり、かつ前記正面測定値は各前記顔画像の対称性とシャープネスを表すこと
を特徴とする基準画像に基づく顔画像の検証システム。
【請求項8】
前記決定ユニットは、さらに、入力顔画像と再構成された相応の基準画像との間の変換に基づいて、前記画像再構成ネットワークのパラメータを調整するように構成されること
を特徴とする請求項7に記載のシステム。
【請求項9】
前記画像再構成ユニットは、多層画像再構成ニューラルネットワークとして形成されていること
を特徴とする請求項7に記載のシステム。
【請求項10】
前記画像再構成ニューラルネットワークは、複数層を有するサブネットワークを備え、かつ前記決定ユニットは、さらに、画像訓練セットの入力により前記マッピングに基づいて前記画像再構成ニューラルネットワークの各層の初期パラメータを決定し、その中で、前記画像再構成ニューラルネットワークの各層の初期パラメータを決定する期間に、前記サブネットワークの前の層の出力を前記サブネットワークの現在の層に入力するように構成され、
前記決定ユニットは、さらに、前記サブネットワークの最後の層の出力と、想定ターゲットとを比較して前記サブネットワークの最後の層の出力と前記想定ターゲットとの誤差を取得し、かつ、得られた誤差に基づいて前記初期パラメータを微調整して前記画像再構成ネットワークの全てのパラメータを具体化させるように構成されること
を特徴とする請求項9に記載のシステム。
【請求項11】
任意の2つの再構成された基準画像の間の類似度を取得するように構成される取得ユニットと、
対になる顔画像が同じ身元に属するか否かを検証するように構成される画像検証ユニットとをさらに備え、
その中で、前記決定ユニットは、さらに、前記取得ユニットで取得された任意の2つの再構成された基準画像の間の類似度に基づいて前記画像検証ユニットのパラメータを決定するように構成されること
を特徴とする請求項8に記載のシステム。
【請求項12】
再構成された基準画像のいずれの画像から、それぞれ1つ以上の顔部品を選択して1つ以上の顔部品対を形成し、前記顔部品対のいずれも、それぞれ前記基準画像における同一顔領域に対応した顔部品を含むように構成される選択ユニットをさらに備え、かつ
その中で、前記取得ユニットは、さらに、前記顔部品対の間の類似度を取得するように構成され、かつ
前記決定ユニットは、さらに、前記取得ユニットで取得された前記顔部品対の間の類似度に基づいて前記画像検証ユニットのパラメータを決定するように構成されること
を特徴とする請求項11に記載のシステム。
【請求項13】
前記正面測定値M(Y)は、
【数2】
で表され、
その中で、Y∈Dは、顔画像セットDにおける顔画像を表し、
λは、定数係数であり、
||・||は、フロベニウスノルムであり、
||・||は、核ノルムであり、
P、Qは、2つの定数行列を表し、その中で、P=diag([1,0])かつQ=diag([0,1])であり、ここで、diag(・)は、対角行列を表すこと
を特徴とする請求項7に記載のシステム。
【請求項14】
前記画像検証ユニットは、多層画像検証ニューラルネットワークとして形成されている、請求項11に記載のシステム。
【請求項15】
同一の身元の複数の顔画像から顔画像を獲得して前記身元の代表画像とする獲得ステップと、
獲得された代表画像と前記身元の前記複数の顔画像との間のマッピングに基づいて画像再構成ネットワークのパラメータを決定する決定ステップと、
決定されたパラメータを有する前記画像再構成ネットワークを介して、少なくとも2つの入力顔画像をそれぞれ相応の基準画像として再構成する再構成ステップと、
任意の2つの再構成された基準画像の間の類似度を取得して画像検証ネットワークのパラメータを決定する取得ステップと、
決定されたパラメータを有する前記画像検証ネットワークを介して、再構成された基準画像が同じ身元に属するか否かを検証する検証ステップとを含み、
その中で、前記代表画像は、正面画像であること
を特徴とする基準画像に基づく顔画像の検証方法。
【請求項16】
前記画像再構成ネットワークは、複数のサブネットワーク層を備え、かつ前記決定ステップは、
画像訓練セットの入力により前記マッピングに基づいて前記画像再構成ネットワークの各層の初期パラメータを決定するステップと、
サブネットワークの最後の層の出力と、想定ターゲットとを比較して前記サブネットワークの最後の層の出力と前記想定ターゲットとの誤差を取得するステップと、
得られた誤差に基づいて前記初期パラメータを微調整して前記画像再構成ネットワークの全てのパラメータを具体化させるステップとをさらに含み、
その中で、前記決定期間に、サブネットワークの前層の出力をサブネットワークの現在層に入力こと
を特徴とする請求項15に記載の方法。
【請求項17】
前記獲得ステップにおいては、
最小の正面測定値を持つ顔画像を獲得して前記身元の前記代表画像とするステップをさらに含み
その中で、前記正面測定値は、各顔画像の対称性とシャープネスを表すこと
を特徴とする請求項15に記載の方法。
【請求項18】
前記再構成された基準画像のいずれの画像から、それぞれ1つ以上の顔部品を選択して1つ以上の顔部品対を形成するステップと、
前記顔部品対の間の類似度を取得するステップと、
取得された任意の2つの再構成された基準画像の間の類似度、および取得された前記顔部品対の間の類似度に基づいて前記画像検証ネットワークのパラメータを決定するステップとをさらに含み、
その中で、前記顔部品対のいずれも、それぞれ前記基準画像における同一顔領域に対応した顔部品を含むこと
を特徴とする請求項15に記載の方法。
【請求項19】
プロセッサによって実行可能なコンピュータ読み取り可能な命令が記憶され、前記コンピュータ読み取り可能な命令がプロセッサによって実行される際に、前記プロセッサが、
同一の身元の複数の顔画像から顔画像を獲得して前記身元の代表画像とし、
獲得された代表画像と前記身元の前記複数の顔画像との間のマッピングに基づいて画像再構成ネットワークのパラメータを決定し、
決定されたパラメータを有する前記画像再構成ネットワークを介して、少なくとも2つの入力顔画像をそれぞれ相応の基準画像として再構成し、
任意の2つの再構成された基準画像の間の類似度を取得して画像検証ネットワークのパラメータを決定し、
決定されたパラメータを有する前記画像検証ネットワークを介して、再構成された基準画像が同じ身元に属するか否かを検証すること
を特徴とする不揮発性コンピュータ記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、顔画像の検証方法と検証システムに関し、具体的には、基準画像に基づく顔画像検証方法と顔画像検証システムに関する。
【背景技術】
【0002】
自然環境において得られた顔画像は、姿勢、照明条件、遮断、および解像度のような面で多くの個人内(intra−personal)の変化が存在している。顔画像の変化を処理することは、多くの顔関連のアプリケーションにおける重要なチャレンジとなっている。
【0003】
顔変化を処理するために、さまざまな顔正規化の方法を有し、これらの方法では、多くの姿勢および異なる照明条件下での顔画像から正規化ビュー形式(正面姿勢およびニュートラル照明条件を有し)の画像へ復元する。顔正規化方法は、大別すると、3Dによる顔再構成方法および2Dによる顔再構成方法という2種類に分かられる。3Dによる方法は、3D幾何学的変換によって正面姿勢を回復することを目指している。2Dによる方法は、グラフィカルモデルを利用して正面姿勢を導き出し、これらのグラフィカルモデルは、例えばMRF(Markov Random Field、マルコフ確率場)が挙げられ、その中で、対応物(correspondence)は、異なる姿勢にある画像から学習して得られたものである。上記方法は、一定の制限を有し、例えば3Dデータをキャプチャするために定額以上のコストとリソースを追加する必要がある一方、2Dによる顔分析が特徴点検出の精度に大きく依存しているが、正規化の結果が平滑でない場合は多い。また、これらの方法は、ほとんど、用いられた3D情報または制御された2D環境である制御された条件下で収集された顔画像に基づいて評価されたものである。
【0004】
したがって、上記問題の少なくとも1つ以上を解決するために、各身元(identity)の基準画像を自動的に選択したり分析したりすることができて、個人内の変化を低減させるとともに、個人間(inter−person)の識別力を維持させるような基準画像に基づく顔画像の検証システムと方法を提供することを期待している。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明は、任意の自然条件下での顔画像から基準画像を再構成することができる新規な顔再構成ネットワークを提案する。これらの再構成の画像は、個人内の変化を大幅に低減して個人間の識別力を維持することができる。さらに、当該顔再構成方法は、顔認証に用いられることができる。
【課題を解決するための手段】
【0006】
本発明の一態様において、基準画像に基づく顔画像検証方法を開示した。この方法は、
同一の身元の複数の顔画像から最小正面測定値を持つ顔画像を獲得して身元の代表画像とするステップと、
獲得された代表画像と身元の複数の顔画像との間のマッピングに基づいて画像再構成ネットワークのパラメータを決定するステップと、
決定されたパラメータを有する画像再構成ネットワークを介して少なくとも2つの入力顔画像をそれぞれ相応の基準画像として再構成するステップと、
再構成された基準画像を比較して、再構成された基準画像が同じ身元に属するか否かを検証するステップとを含んでもよく、
その中で、代表画像は正面画像であり、かつ正面測定値は各顔画像の対称性とシャープネスを表す。
【0007】
本発明の他の一態様は、基準画像に基づく顔画像検証システムを開示した。このシステムは、
同一の身元の複数の顔画像から最小正面測定値を持つ顔画像を獲得して身元の代表画像とするように構成される獲得ユニットと、
入力顔画像をそれぞれ相応の基準画像として再構成するように構成される画像再構成ユニットと、
獲得ユニットで獲得された代表画像と身元の複数の顔画像との間のマッピングに基づいて画像再構成ユニットのパラメータを決定するように構成される決定ユニットと、
画像再構成ネットワークで再構成された基準画像を比較し、再構成された基準画像が同じ身元に属するか否かを検証するように構成される比較ユニットとを備えてもよく、
その中で、代表画像は正面画像であり、かつ正面測定値は各顔画像の対称性とシャープネスを表す。
【図面の簡単な説明】
【0008】
図1】本発明の一実施形態に係る基準画像に基づく顔画像検証システムを示す模式図である。
図2】本発明の他の一実施形態に係る基準画像に基づく顔画像検証システムを示す模式図である。
図3】本発明の一実施形態に係る基準画像に基づく顔画像検証方法を示す模式図である。
図4】本発明の一実施形態に係る画像再構成ネットワークのフローを示す模式図である。
図5】本発明の一実施形態に係る画像検証ネットワークのアーキテクチャを示す模式図である。
【発明を実施するための形態】
【0009】
以下、図面に示される例示的実施形態を具体的に参照する。本文において、適切な場合、同じ符号を用いて同一又は類似の部材を表す。
【0010】
図1は、本発明の一実施形態に係る基準画像に基づく顔画像検証システム100を示す模式図である。システム100は、特定のハードウェア、ソフトウェア、または両方の組み合わせを用いて実現されてもよいことを理解すべきである。また、本発明の実施形態は、コンピュータプログラムコードを含有する1つ以上のコンピュータ読み取り可能な記憶媒体(ディスクメモリ、CD−ROM、光メモリ等を含むが、これらに限定されない)の形態で具現されたコンピュータプログラム製品に適用されることができる。システム100がソフトウェアにより実現される場合、システム100には、汎用コンピュータ、コンピュータクラスター、主流コンピュータ、オンラインコンテンツを提供する専用コンピュータ機器、または集中型もしくは分散型の方式で実行されるコンピュータグループのコンピュータネットワークを備えてもよい。
【0011】
図1に示すように、本発明の一実施形態に係るシステム100は、獲得ユニット101と、決定ユニット103と、画像再構成ユニット105と、比較ユニット107とを備えてもよい。
【0012】
獲得ユニット101は、身元の複数の顔画像から最小正面測定値を持つ顔画像を獲得して当該身元の代表画像とすることができ、その中で、代表画像は、正面画像であり、かつ正面測定値は、各顔画像の対称性と各顔画像のシャープネスを表す。本文において、画像のシャープネスとは、画像行列の階数を指す。
【0013】
本発明の実施形態において、獲得ユニット101は計算ユニット(図示せず)を備えてもよい。計算ユニットは、複数の顔画像のいずれの正面測定値を計算することができ、これについては後述する。これらの顔画像は、既存の顔データベースまたはネットワークから収集されてもよい。本発明の他の一実施形態において、獲得ユニット101は、ソーティングユニット(図示せず)を備えてもよく、当該ソーティングユニットは、計算ユニットで計算された正面測定値を昇順または降順でソートすることができる。それに応じて、獲得ユニット101は、第1の顔画像または最後の顔画像を身元の代表画像とすることができる。
【0014】
決定ユニット103は、画像再構成ユニット105のパラメータを決定することができる。画像再構成ユニット105は、任意の入力顔画像を相応の基準画像として再構成することができ、その中で、基準画像は、ニュートラル(neutral)照明条件下での正面顔画像である。図4に示すように、画像再構成ユニット105は、画像再構成ネットワークの形態で形成されてもよく、当該画像再構成ネットワークは、多層ニューラルネットワークであってもよい。本発明の一実施形態において、画像再構成ユニット105のパラメータは、身元の複数の顔画像と獲得ユニット101で獲得された代表画像との間のマッピングにより決定することができる。その後、決定されたパラメータを有する画像再構成ユニット105は、任意の入力顔画像を基準画像として再構成することができる。本発明の他の一実施形態において、決定ユニット103は、身元の顔画像と当該同じ身元の画像再構成ネットワーク105で再構成された基準画像との間の変換に基づいて画像再構成ネットワーク105のパラメータを決定することができる。すなわち、決定ステップおよび再構成ステップは、ユニット105のパラメータを連続的に最適化させるために繰り返して実行されてもよい。
【0015】
比較ユニット107は、画像再構成ネットワーク105で再構成された基準画像を比較してそれらが同じ身元に属するか否かを検証することができる。本発明の一実施形態において、画像再構成ネットワーク105は、複数層を有するサブネットワークを備え、かつ決定ユニット103は、画像訓練セットを入力することで、マッピングに基づいて画像再構成ニューラルネットワークの各層の初期パラメータを決定することができ、その中で、画像再構成ニューラルネットワークの各層の初期パラメータを決定する期間に、サブネットワークの前層の出力がサブネットワークの現在層に入力され、サブネットワークの最後の層の出力と想定ターゲットとを比較してそれらの誤差を取得し、かつ、得られた誤差に基づいて初期パラメータを微調整して画像再構成ネットワークの全てのパラメータを具体化させる。例えば、図4に示すように、ネットワークは、複数の畳み込み層と、サブサンプリング層と、完全接続層とを備える。以下、決定ステップを詳細に説明する。
【0016】
本発明の一実施形態において、図2に示すように、システム100は、さらに、取得ユニット106と、画像検証ユニット108とを備えてもよく、その中で、画像検証ユニット108は、図5に示すような多層画像検証ニューラルネットワークの形態で形成されてもよい。具体的には、取得ユニット106は、任意の2つの再構成された基準画像の間の類似度を取得することができる。画像検証ネットワーク108は、1対の顔画像が同じ身元に属するか否かを検証することができる。本発明の一実施形態によれば、画像検証ネットワーク108のパラメータは、決定ユニット103により取得ユニット106で取得された任意の2つの再構成された基準画像の間の類似度に基づいて決定されてもよい。
【0017】
本発明の一実施形態において、システム100は、選択ユニット(図示せず)をさらに備えてもよく、当該選択ユニットは、それぞれ再構成された基準画像のいずれから、1つ以上の顔部品を選択して1つ以上の顔部品対を形成し、各顔部品対がそれぞれ基準画像における同一の顔区域に対応した顔部品を含む。取得ユニット106は、顔部品対の間の類似度を取得することができ、かつ決定ユニット103は、取得ユニット106で取得された顔部品対の間の類似度に基づいて画像検証ネットワーク108のパラメータを決定することができる。本発明の実施形態において、決定ユニット103は、同時に再構成された顔画像の間の類似度と顔部品対の間の類似度に基づいてネットワーク108のパラメータを決定することができる。
【0018】
本発明の一実施形態において、システム100は、1つ以上のプロセッサ(図示せず)を含んでもよい。プロセッサは、中央処理装置(「CPU」)、グラフィック処理装置(「GPU」)、または他の適切な情報処理機器を含んでもよい。使用されるハードウエアの種類に基いて、プロセッサは、1つ以上のプリント回路基板、および/または1つ以上のマイクロプロセッサチップを含んでもよい。また、処理器は、下記のより詳細に説明されるプロセス1000を実行するために、コンピュータプログラムの命令のシーケンスを実行することができる。
【0019】
全体的に、本システムは、3つの重要な貢献をもたらす。第1のは、現在で知られているように、自然環境での顔画像に由来する2D情報のみを用いて基準顔画像を再構成することができる。新規な深度再構成ネットワークを提供し、それは、代表的顔選択と顔再構成とを組み合わせ、自然環境での顔認証領域の最新技術のレベルに達したパフォーマンスを示す。第2のは、再構成の画像が高品質である。当該方法を用いて正規化ステップとした場合、既存の方法に対して大幅に改善したのを確認することができる。第3のは、LFWデータセットよりも6倍大きい顔データセットを貢献することができる。
【0020】
図3は本発明の一実施形態に係る基準画像に基づく顔画像の検証プロセス1000のフローチャートを示しており、これについて以下で詳細に説明する。
【0021】
ステップS1001において、身元の複数の顔画像から最小正面測定値を持つ顔画像を獲得して身元の代表画像とすることができる。
【0022】
当該ステップにおいて、例えば既存の画像データベースまたはネットワークから身元の複数の顔画像を収集することができる。当該複数の顔画像は、任意の姿勢および照明条件にある。その後、複数の顔画像のいずれの正面測定値を計算する。そして、最小値を持つ顔画像を身元の代表画像として設定してもよい。代表画像は、身元の、ニュートラル照明条件下での正面顔画像である。本発明の実施形態において、正面測定値を算出した後に、これらの値を降順でソートして最後のものを身元の代表画像として設定してもよい。あるいは、正面測定値を算出した後に、これらの値を昇順でソトして第1のものを身元の代表画像として設定してもよい。
【0023】
具体的には、画像セットDから身元iの複数の顔画像を収集し、その中で、行列Y∈Dは、顔画像セットDにおける顔画像を表す。上記正面測定値は、
【数1】
で表れ、
その中で、Y∈R2a×2aであり、λは定数係数であり、||・||はフロベニウスノルムであり、||・||は行列の特異値の合計である核ノルムを表し、P,Q∈R2a×2aは2つの定数行列であり、その中で、P=diag([1,0])かつQ=diag([0,1])であり、ここで、diag(・)は対角行列を表す。
【0024】
式(1)におけるM(Y)は、身元の顔画像の対称性およびシャープネスを表す。式(1)における第1の項は、顔の対称性、すなわち顔の左半分と右半分との差異を測定する。明らかに、第1の項の値が小さいほど、顔がより対称になることを示す。式(1)の第2の項は、顔画像の行列の階数を測定する。階数とは、行列の線形独立な列の最大値を指す。例えば、顔画像は、ピンぼけ、または横顔(背景が画像の他の側に現れ、通常、単色のブロックとし、そのサイズが「クローズアップ」と類似し)である場合、線形独立な列的数目が比較的小さいため、第2項の値(マイナス記号を付け)が比較的大きい。したがって、式(1)の値が小さいほど、顔が正面図である可能性が大きくになり、より対称でより明晰でほとんど姿勢の変化がなくなっている。対称性と行列の階数とを組み合わせる測定により、身元のニュートラル照明条件下での正面画像を高効率よく自動的に取得することができる。
【0025】
ステップS1002において、ステップS1001で獲得された代表画像と身元の複数の顔画像との間のマッピングに基づいて(図4に示すような)画像再構成ネットワーク105のパラメータを決定することができる。
【0026】
注意すべきことは、任意の身元に対して決定ステップが繰り返して実行されてもよい。例えば、本発明の他の一実施形態において、身元iについて、疎な線形の組み合わせY=αi1i1+αi2i2+...+αikikにより、画像セットDから代表画像Yを選択し、その中で、DikはセットDにおける第kの画像(図4に示すように、本明細書において顔選択とも称され)である。Y=αを設定し、その中で、α=[αi1,αi2,...,αik,]は、係数ベクトルであり、かつ当該係数ベクトルが疎であると期待されている。また、選択された異なる身元の顔画像の間の不関連性を強めることが必要があり、これは、正則化項
【数2】
を追加することにより実現される。なぜなら、再構成された正面図画像の識別力を維持するためである。したがって、顔選択は、
【数3】
で表れて、
その中で、M(Y)式(1)で限定される。式(2)において、Yとαについて、最適化問題は凸でない。しかしながら、Yが固定されている場合、αに関する問題は、凸のLasso問題になるが、αが固定されている場合、Yの関数は凸の項および凹の項に分かれ、これは負の核ノルムである。これは、CCCP(concave−convex procedure:凹凸プロシージャ)によって解を求めることができる。
【0027】
ステップS1003において、少なくとも2つの入力顔画像を、画像再構成ネットワークを介してそれらの相応の基準画像として再構成する。すなわち、画像再構成ネットワークは、任意の姿勢での任意の顔画像を相応の基準画像として再構成することができ、当該基準画像は正面であり、ニュートラル照明条件下でのもの(図4に示すように、本明細書において顔回復(face recover)とも称され)である。具体的には、下記に示された損失誤差を最小化して顔画像を再構成することができ、
【数4】
その中で、iは身元の番号であり、かつ、kは身元iの第kのサンポルを表し、XおよびYはそれぞれ訓練画像およびターゲット画像を表す。Wは、画像再構成ネットワークのパラメータセットである。
【0028】
本発明の実施形態において、さらに、入力顔画像とネットワーク105で再構成された相応の基準画像との間の変換に基づいて画像再構成ネットワークのパラメータを決定することができる。その後、パラメータが既に決定された画像再構成ネットワークを用いて任意の顔画像を再構成することができる。マッピングとは、1つのベクトルから他の1つのベクトルへの変換を指す。本明細書において、マッピングは、順次に行われる非線形マッピングを指してもよく、身元の複数の顔画像の入力画像を同じ身元の正規化ビュー画像として変換することができる。
【0029】
図4に示すように、画像再構成ネットワークは、複数の畳み込み層を備える。例えば、図4に示すように、3つの層が存在してもよく、かつ、最初の2つの畳み込み層の後に、最大プーリング層が付き従い、そして最後の層の後に完全接続層が付き従う。従来のCNN(convolutional neural network、畳み込みニューラルネットワーク)と異なり(従来のCNNのフィルターが重みを共有し)、当該ネットワークにおけるフィルターは、ローカライズされ、かつ重みを共有しなく、なぜなら、本明細書において異なる顔領域が異なる特徴を用いるすべきだと仮定されたためである。注意すべきことは、図4において64×64のサイズのみで入力X、出力
【数5】
(予測の画像)、およびターゲットYを示したが、これらの行列は、当業者に知られた任意のサイズであってもよい。
【0030】
再度図4を参照し、まず、全ての画像がグレースケール形式に変換され、かつ、それらの照明条件が所属分野で知られている方法で修正されたため、本明細書において当該部分に対する詳細の説明を省略する。各畳み込み層において、非共有のフィルターを学習することにより、複数(例えば、32)の出力チャネルを取得し、その中で、各非共有のフィルターは、例えば5×5のサイズである。サブサンプリング層のユニットサイズは2×2である。第lの畳み込み層は、
【数6】
で表れ、
その中で、Wlpq,uvおよび(Xlpuvは、それぞれ画像位置の(u,v)でのフィルターと画像パッチを表す。pとqは入力チャネルと出力チャネルの番号である。例えば、第1の畳み込み層において、p=1,q=1,...,32である。したがって、Xl+1q,uvは、位置(u,v)にある第qのチャネル出力であり、すなわち、第l+1の層への入力であることを表す。σ(x)=max(0,x)は正規化線形関数(Rectified linear function)であり、および「○」は、要素ごとの積を表す。バイアスベクトルは、bで表われる。完全接続層において、顔画像
【数7】
は、
【数8】
で再構成され、
本発明の実施形態において、顔選択および顔回復は、式(2)および式(3)を組み合わせることにより共同学習し、
【数9】
で各身元を独立的に最適化させることができ、
その中で、γ,τ,λ,η’は、正則化項のバランスパラメータである。式(6)は、各選択された画像Yが正面画像を有し、識別力を維持し、かつ損失誤差を最小化させる必要があることを示す。下記のステップによりY,α,Wの値を繰り返して獲得する。
【0031】
1.YおよびWの固定によるαの更新:
αについて、式(6)がLasso問題になり、それは、FISTA(fast iterative shrinkage−thresholding algorithm、高速逐次的縮退しきい値アルゴリズム)により効率的に解を求めることができる。
【0032】
2.αおよびWの固定によるYの更新:
当該問題は、3つの凸の項(フロベニウスノルム)および1つの凹の項(核ノルム)を含み、これは、最適な解を得ることを確保することができないと意味する。反復更新ルールは、
【数10】
であり、
その中で、
【数11】
は、UとVが第1の階数(Yit)列(columns)に対する打ち切り(truncation)であり、ここで、Yit=UΣVは、YitのSVDである。
【0033】
3.αおよびYの固定によるWの更新:
画像再構成ネットワークにおける活性化関数に起因して当該問題が非線形性問題になる。当該問題は、SGD(stochastic gradient descent、確率的勾配降下)を利用して逆伝播して解を求めることができる。
【0034】
本発明の実施形態において、以下のアルゴリズムで示された簡単で実用の訓練プロシージャを、まず全ての訓練サンプルを用いてWを推定して、それから各身元に対してターゲットを選択して、上記3つのステップの反復プロシージャを加速させるように設計する。
【0035】
入力:全ての身元{X0ij}の顔画像
出力:ターゲット{Y}とネットワークパラメータW
初期化:t=0、教師なし特徴学習によりWを初期化させ、各身元iについて、Yit∈Dを式(1)の最小値を持つ画像として設定し、
t<Tである場合、
各X0ijに対して、
確率的勾配降下によりWを更新し、
終了
各身元iに対して、
式(7)を利用してYを計算し、
it+1∈DをYに最も近い画像として設定し、
終了
終了
その後、ステップS1004において、ステップS100で再構成された基準画像を比較してそれらが同じ身元に属するか否かを検証し、すなわち、それぞれ基準画像に対応した顔画像が同じ身元に属するか否かを検証する。
【0036】
本発明の実施形態において、方法1000には、任意の2つの再構成された基準画像の間の類似度を取得して画像検証ネットワークのパラメータことを決定するステップをさらに含んでもよく、当該ネットワークのアーキテクチャが図5に示すようなものである。その後、決定されたパラメータを有する画像検証ネットワークでは、再構成された基準画像が同じ身元に属するか否かを検証することができる。
【0037】
本発明の他の一実施形態において、方法1000は、それぞれ再構成された基準画像のいずれから、1つ以上の顔部品を選択して1つ以上の顔部品対を形成するステップをさらに含んでもよく、各顔部品対がそれぞれ基準画像における同一顔区域に対応した顔部品を含む。本発明の他の一実施形態において、方法100には、画像検証ネットワークのパラメータを訓練するために、顔部品対の間の類似度を取得するステップを含んでもよい。
【0038】
本発明によれば、画像検証ネットワークは、対になる再構成された正規化顔画像から階層的な特徴表現を学習する。再構成された画像が既に大きな顔変化を除去したため、これらの特徴は、顔認証に対して頑健性を持っている。それは、例えば、顔幻覚、顔素描の分析および識別のような他の問題に用いられる潜在用途を持っている。
【0039】
図5を参照して、再構成された基準画像は、画像検証ネットワークの入力として用いられ、顔部品対の間の類似度および再構成された基準画像の間の類似度に基づいて画像検証ネットワークのパラメータを訓練する。
【0040】
図5を参照して、画像検証ネットワークは、5つのCNNを含み、各CNNは、対になる顔画像の全体や顔部品(例えば額、鼻、目および口が挙げられ)を用いて入力する。図5に示された顔全体、額、目、鼻および口のサイズは、それぞれ64×64、22×64、24×64、28×30および20×56である。注意すべきことは、図5において額、目、鼻および口を選択の顔領域としたが、本発明において異なるサイズを持つ他の顔領域を選択することができる。図5に示された画像検証ネットワークにおいて、各CNNは、交互に構成された、2つの畳み込み層および2つのサブサンプリング層を備える。各CNNは、完全接続層をさらに備える。画像再構成ネットワークと同様に、畳み込み層のフィルタを共有しない。
【0041】
画像検証ネットワークにおいて、各CNNは、顔部品対または顔画像の共同表示を学習してCNNの各層の初期パラメータを訓練する。訓練期間では、前層の出力が現在層に入力される。その後、最後の層の出力と想定ターゲットとを比較して誤差を得る。その後、2つの顔画像が同じ身元に属するか否かを推測するために、得られた誤差に基づいて、ロジスティック回帰層が初期パラメータを微調整し、全ての共同表示を特徴として具体化する。
【0042】
具体的に、画像検証ネットワークの訓練は、まず教師なし特徴学習によりフィルタを訓練する。その後、所属分野によく知られているように、SGD(stochastic gradient descent、確率的勾配降下)により逆伝播して画像検証ネットワークを微調整する。画像再構成ネットワークの訓練と同様に、逆伝播誤差を逆方向へ伝送し、かつ、その後、各層において完全接続重みやフィルタが更新新される。
【数12】
によりラベルyを推測する必要があるため、損失誤差ではなく、エントロピー誤差を用いる。
その中で、
【数13】
は、予測されたラベルであり、かつ、
【数14】
が1に等しいのは、入力画像が同じ身元に属することを表す一方、0に等しいのは、入力画像が同じ身元に属しないことを表す。
【0043】
特定のハードウェア、ソフトウェア、または両方の組み合わせを用いて本発明の実施形態を実行することができる。また、本発明の実施形態は、コンピュータプログラムコードを含有する1つ以上のコンピュータ読み取り可能な記憶媒体(ディスクメモリ、CD−ROM、光メモリ等を含むがこれらに限定されない)の形態で具現されたコンピュータプログラム製品に適用できる。
【0044】
上記の記載の中では、説明の便宜のために、単一の実施形態においてさまざまな態様、ステップ、または部材を組み合わせした。本発明は、保護を請求する主題のために全ての変形を開示する必要となることが解釈されないべきである。添付の特許請求の範囲は、当該例示的な実施形態の明細書に組み込まれており、その中で、各請求項その自体は、本発明の独立の実施形態として示されている。
【0045】
以上、本発明の実施形態および実施例を既に示して説明したが、本発明の要旨および範囲を逸脱しない限り、それらに対してさまざまな変更を行うことができると明らかにする。
図1
図2
図3
図4
図5