(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
顔認証技術全体の処理に注目すると、顔認証では予め特定したい人物の顔画像を登録する登録処理が存在する。登録処理で登録される顔画像は、その場で撮影して取得する場合や既に撮影した顔画像をフラッシュメモリなどのインターフェイスを介して取得する場合が多く、比較的に高解像な顔画像であることが多い。
本発明では、従来のように入力された低解像顔画像に対して顔特徴点検出技術を適用して位置合わせをするのではなく、登録処理で登録された顔画像から検出した顔特徴点を入力された低解像顔画像に適用することで位置合わせを行う。
また、これに加え、高解像化技術に対して位置ズレに頑健な本発明の技術を組み込むことで、低解像顔画像に対する顔認証精度を大幅に向上させることができる。
【0012】
[第1の実施形態]
第1の実施形態では、登録処理で登録された顔画像から検出した顔器官位置を入力低解像顔画像の顔器官位置に設定し、顔認識を実行する。以下で、その詳細を説明する。
【0013】
<ハードウェア構成>
図14に、本実施形態における画像認識装置のハードウェア構成の一例を示す。画像認識装置1400は、CPU(Central Processing Unit)1401、ROM(Read Only Memory)1402、RAM(Random Access Memory)1403を備える。更に、二次記憶装置1404、表示部1405、操作部1406、ネットワーク通信部1407、ネットワーク接続部1408、USB通信部1409、USB接続部1410、および接続バス1411を備える。
CPU1401は、ROM1402やRAM1403に格納された制御プログラムを実行することにより、本装置全体の制御を行う。
【0014】
ROM1402は、不揮発性メモリであり、制御プログラムや各種パラメタデータを記憶する。制御プログラムは、CPU1401で実行され、後述する各処理を実行するための手段として、当該装置を機能させる。
RAM1403は、揮発性メモリであり、画像データや制御プログラムおよびその実行結果を一時的に記憶する。
【0015】
二次記憶装置1404は、ハードディスクやフラッシュメモリなどの書き換え可能な二次記憶装置であり、OS(Operating System)、アプリケーションプログラム、画像データなどを記憶する。
CPU1401は、二次記憶装置1404に記憶されているプログラムやOSをメモリ1403に読み出す。そして、メモリ1403上で当該プログラムを実行することで、画像認識装置の各種の機能を実現することができる。
【0016】
なお、プログラムの実行は、1つのプロセッサにより行われてもよいし、複数のプロセッサが協働することでプログラムが実行される場合であってもよい。また特定の処理を実行するための専用回路(ASIC)を設け、その特定の処理については、専用回路が実行する場合であってもよい。
また、後述する処理を記述したソフトウェア(プログラム)をネットワークまたは各種記憶媒体を介して取得して実行してもよい。
【0017】
表示部1405は、LCD等の表示装置から構成される。操作部1406は、キーボードやマウス等の入力装置から構成される。ネットワーク通信部1407は、画像認識装置をネットワークに接続して各種通信を行う。ネットワーク接続部1408は、ネットワーク通信部1407をネットワーク媒体に接続する。
【0018】
ネットワーク通信部1407とネットワーク接続部1408は、有線LANと無線LANの内、少なくともいずれかに対応する。これらの具体的な形態は、対応LANに応じて必要な機能及び形態をとる。USB通信部1409は、各種周辺装置とUSBインターフェイスを介して通信する。USB接続部1410は、USBコネクタから構成される。
接続バス1411は、CPU1401、ROM1402、RAM1403、二次記憶装置1404などを接続して相互にデータの入出力を行う。
【0019】
<機能構成>
図1は、第1の実施形態における画像認識装置の機能構成の一例を示したブロック図である。
図1に示すように、本実施形態の機能構成は、画像取得部110、顔位置検出部120、顔器官位置検出部130、顔器官位置設定部140、特徴抽出部150、顔画像登録部160、及び顔識別部170を含む。
【0020】
画像取得部110は、複数の登録用の画像を取得する。登録用の画像または登録された画像を、登録画像とも記載する。
また、画像取得部110は、登録画像と一致するか判断される対象となる画像(以下、「入力画像」とも記載する)を取得する。
顔位置検出部120は、入力画像および登録画像に写っている顔の位置を検出する。
【0021】
顔器官位置検出部130は、登録画像に関しては、登録画像に写っている各顔器官(右目、左目、口など)の位置を検出する。
顔器官位置検出部130は、入力画像に関しては、入力画像に写っている各顔器官の位置は検出しない。
【0022】
顔器官位置設定部140は、入力画像の顔領域全体と複数の登録画像の各登録画像の顔領域全体とを比較して、入力画像と登録画像との顔類似度を算出し、入力画像と対応するペアとなる登録画像を探索する。ここでは、入力画像との顔類似度が最も高くなる登録画像を探索する。そして、顔類似度が最も高くなる登録画像に関連付けて記憶されている顔器官位置を、入力画像の顔器官位置として設定する。なお、この探索は、特徴を抽出する基準となる顔器官位置を設定するためのものであり、顔類似度が最も高くなる登録画像ではなく、顔類似度が所定の閾値より高い登録画像を探索するようにしてもよい。以下の探索でも同様である。
【0023】
また顔器官位置設定部140は、
入力画像から顔の大きさ、顔の位置、顔の向きの少なくとも1つが異なる複数の変換画像を生成し、生成された複数の変換画像のそれぞれと、複数の登録画像のそれぞれとの顔類似度を算出し、
顔類似度が最も高くなる変換画像と登録画像とのペアを探索し、
顔類似度が最も高くなる登録画像に関連付けて記憶されている顔器官位置を、顔類似度が最も高くなる変換画像の顔器官位置として設定する、ことが好ましい。
【0024】
特徴抽出部150は、登録画像に関しては、顔器官位置検出部130が検出した顔器官位置に基づいて、登録画像の各顔器官の特徴量を抽出する。
特徴抽出部150は、入力画像に関しては、顔器官位置設定部140が設定した顔器官位置に基づいて、入力画像の変換画像から各顔器官の特徴量を抽出する。
【0025】
顔画像登録部160は、複数の登録画像を、各登録画像に写っている各顔器官の位置と、各顔器官の特徴量(右目の特徴量、左目の特徴量、口の特徴量など)と、関連付けて記憶する。
例えば、
第1の登録画像を、
第1の登録画像に写っている右目の位置、左目の位置、口の位置と、
第1の登録画像に写っている右目の特徴量、左目の特徴量、口の特徴量と、
関連付けて記憶する。
【0026】
顔識別部170は、特徴抽出部150が抽出した入力画像の各顔器官の特徴量と、特徴抽出部150が抽出し、顔画像登録部160が記憶している各登録画像の各顔器官の特徴量との顔器官類似度を算出する。そして、算出された顔器官類似度に基づいて入力画像に写っている顔と各登録画像に写っている顔が同一人物の顔か識別する。
【0027】
図2および
図3は、本発明の第1の実施形態の全体フローを示しており、以下では、この全体フローを利用して第1の実施形態を詳細に説明する。
図2(a)のステップS1001では、まず、登録モードが選択されているかどうかを判定する。登録モードが選択されている場合には、顔画像登録モードに進む。
【0028】
<顔画像登録モード>
図2(b)のステップS1101では、画像取得部110において、登録画像を取得する。画像取得部110は、レンズなどの集光素子、光を電気信号に変換するCMOSやCCDなどの撮像素子、アナログ信号をデジタル信号に変換するAD変換器を通過することによって、得られたデジタル画像データを取得する。また、間引き処理等を行うことによって、例えば、VGA(640×480[pixel])やQVGA(320×240[pixel])に変換した顔画像を取得することも可能である。また、撮影の他もフラッシュメモリなどを通じて登録画像を取得することもできる。従って、登録画像は比較的に高解像度の顔画像が登録される。
【0029】
ステップS1201では、顔位置検出部120が、非特許文献5のような技術を利用して顔や左右の目や口などの重心位置を検出する。
ステップS1202では、ステップS1201で検出した顔や左右の目や口などの重心位置からアフィン変換などを利用して顔の大きさが所定のサイズ、顔の向きが正立するような第1の正規化画像を生成する。なお、顔の大きさは左右の目の間のユークリッド距離として定義する方法などがある。
【0030】
ステップS1301では、顔器官位置検出部130が、ステップS1201で生成した第1の正規化画像に対して、非特許文献6のような技術を利用して目尻や目頭などのより細かな顔器官位置を検出する。
ステップS1302では、ステップS1301で検出した目尻や目頭などのより細かな特徴点の重心位置を利用して顔の大きさが所定のサイズ、顔の向きが正立するような第2の正規化画像を生成する。
【0031】
ステップS1501では、ステップS1301で検出した顔器官位置に基づいて、ステップS1302で生成された第2の正規化画像に対して特徴抽出領域を設定し、その領域から非特許文献1のようなLBP特徴を抽出する。
ステップS1601では、顔画像登録部160が、個人ID、ステップS1301で検出された顔器官位置、ステップS1302で生成された第2の正規化画像、ステップS1501で生成された特徴量をメモリなどに記憶する。
なお、従来の顔認証ではステップS1601においては、ステップS1301で検出された顔器官位置やステップS1302で生成された第2の正規化画像は記憶せず、個人IDと特徴量だけを記憶するケースが一般的である。
【0032】
以上の処理が顔画像登録モードで実施される登録処理である。なお、ステップS1501では正規化画像に対して特徴抽出を行い、ステップS1601で抽出した特徴量もメモリに記憶している。しかし、個人ID、ステップS1301で検出された顔器官位置、ステップS1302で生成された正規化画像までを記憶しておき、登録処理では特徴抽出を行わないでおく。そして、顔識別モード時に、入力画像から特徴抽出を行うと共に、登録画像からも特徴抽出を行うようにしても良い。
【0033】
<顔識別モード>
図2(a)のステップS1001で、顔識別モードが選択された場合には、顔識別モードに進む。
図3のステップS1102からステップS1204までの処理は、顔画像登録モードにおけるステップS1101からステップS1202までの処理と同じため、説明を省略する。但し、本発明の第1の実施形態では、顔識別モードで取得される顔画像は、遠方にある小さい顔やぼけている顔などの低解像顔画像としている。
【0034】
ステップS1401では、本実施形態のポイントとなる顔器官位置設定部140における顔器官位置設定処理について説明する。
図4は、ステップS1401における顔器官位置設定処理の詳細な処理フローを示している。
図5は、ステップS1411における変換画像生成処理を解説した図である。
ステップS1411では、
図5に示すようにステップS1204で生成された第1の正規化画像からスケール(サイズ)、シフト量、回転量の異なる複数の変換画像を生成する。スケール、シフト量、回転量の異なる複数の変換画像は、例えば、アフィン変換を用いて生成する。
【0035】
図6Aは、ステップS1412における変換画像と登録画像とのペアを探索する処理を解説した図である。
ステップS1412では、
図6Aに示すようにステップS1411で生成されたスケール、シフト量、回転量の異なる複数の変換画像と、登録画像とのマッチングを行うことで最も類似度の高くなる変換画像と登録画像とのペアを探索する。マッチングには、例えば、正規化相互相関などを用いる。
【0036】
なお、スケール変換によって複数の変換画像が生成される。シフト変換によっても、回転変換によっても複数の変換画像が生成される。また、スケール変換、シフト変換、回転変換は適宜組み合わせても良い。スケール変換し、かつシフト変換しても良い。また、回転変換し、かつスケール変換し、かつシフト変換しても良い。
【0037】
図6Bは、ステップS1413における登録画像の顔器官位置を変換画像の顔器官位置に設定する処理を解説した図である。
ステップS1413では、
図6Bに示すようにステップS1412で探索された登録画像(
図6Bの例では第1の登録画像)の顔器官位置を、変動画像(
図6Bの例では第1の変換画像)の顔器官位置として設定する。なお、登録画像の顔器官位置は上述のようにステップS1301での顔器官位置検出の結果である。
【0038】
従来の顔認証では、ステップS1204で生成された第1の正規化画像に対してステップS1301と同様に顔器官位置検出を行っていた。しかしながら、ステップS1204で生成された第1の正規化画像が低解像画像である場合には、顔器官位置検出を実施しても正しい位置が得られない。但し、低解像画像であっても顔の輪郭情報など比較的に低周波成分の情報だけは残されている。
【0039】
従って、本実施形態では、ステップS1204で生成された第1の正規化画像に対しては顔器官位置検出を実施しない。その代わりに、ステップS1204で生成された第1の正規化画像との顔全体の見た目のマッチングを行うことで、変換画像と最も類似度の高い登録画像を探索し、最も類似度が高い登録画像の顔器官位置検出結果を、変換画像の顔器官位置として利用する。
【0040】
ステップS1502では、ステップS1413で設定された登録画像の顔器官位置検出の結果を利用して、特徴抽出領域を設定し、その領域に対して特徴抽出を行う。
ステップS1701では、ステップS1502で抽出された特徴量と、ステップS1601で記憶された特徴量との類似度(顔器官類似度)を算出し、個人を識別する。
例えば、
図6Cに示すように、第1の変換画像の各顔器官と第1の登録画像の各顔器官の類似度、第1の変換画像の各顔器官と第2の登録画像の各顔器官の類似度を算出する。そして、算出された顔器官類似度に基づいて、第1の入力画像に写っている人物と第1の登録画像に写っている人物とが同一人物か、第1の入力画像に写っている人物と第2の登録画像に写っている人物とが同一人物かを識別する。
【0041】
[第2の実施形態]
第2の実施形態では、入力画像の顔器官位置を設定した後に、入力画像の変換画像を高解像化する。そしで、高解像化した変換画像の各顔器官と、登録画像の各顔器官の類似度を算出し、算出された類似度(顔器官類似度)に基づいて、入力画像に写っている人物と登録画像に写っている人物が同一人物かを識別する。
【0042】
<機能構成>
図7Aは、第2の実施形態における画像認識装置の機能構成の一例を示したブロック図である。
図7Aに示すように、本実施形態の機能構成200は、画像取得部110、顔位置検出部120、顔器官位置検出部130、顔器官位置設定部140、特徴抽出部151、顔画像登録部160、及び顔識別部171、並びに高解像顔画像生成部210を含む。
【0043】
図7Aに示す第2の実施形態における画像認識装置200と、
図1に示す第1の実施形態における画像認識装置100との違いは以下のとおりである。
画像認識装置200は高解像顔画像生成部210を有するが、画像認識装置100は高解像顔画像生成部210に相当する機能部は有しない。
高解像顔画像生成部210は、顔類似度が最も高くなる変換画像から高解像顔画像を生成する。
【0044】
特徴抽出部151は、入力画像に関しては、顔器官位置設定部140が設定した顔器官位置に基づいて、入力画像の変換画像を高解像化した画像(高解像化された変換画像)から各顔器官の特徴量を抽出する。
顔識別部171は、高解像顔画像の各顔器官の特徴量と、各登録画像の各顔器官の特徴量との顔器官類似度を算出し、算出された顔器官類似度に基づいて、入力画像に写っている顔と各登録画像に写っている顔が同一人物の顔か識別する。
【0045】
図7Bは、第2の実施形態における顔識別モードにおける処理の流れを示すフローチャートである。
図7BのステップS1102からステップS1401までの処理は、
図3のステップS1102からステップS1401までの処理と同じため、説明を省略する。
図7Cは、第2の実施形態における一連の処理の流れを示すフローチャートである。
【0046】
ステップS1450では、高解像顔画像生成部210が変換画像を高解像化する。高解像化される変換画像は、前記のマッチングの結果、顔器官位置設定部140が変換画像と登録画像とのペアの中で最も類似度(顔類似度)が高いと判断したペアの変換画像である。
ステップS1502では、特徴抽出部151が高解像化された変換画像から特徴量を抽出する。
ステップS1701では、特徴抽出部151が高解像化された変換画像から抽出した特徴量と、特徴抽出部151によって登録画像から抽出され顔画像登録部160に記憶されている特徴量との類似度(顔器官類似度)が算出される。そして、算出された顔器官類似度に基づいて、顔識別部170が入力画像に写っている人物と登録画像に写っている人物とが同一人物かを識別する。
【0047】
[第3の実施形態]
まず、始めに高解像顔画像生成技術であるhallucination技術について説明する。
・hallucination技術の説明
hallucination技術は、低解像顔画像から高解像顔画像を生成する技術である。その原理の概要は、入力された低解像顔画像を他人の高解像顔画像で近似するというものである。詳細を説明する。
【0048】
まずは、予め様々な人物の顔画像を利用して高解像と低解像がペアとなっている高解像化辞書(数式1)を学習により用意する。
高解像と低解像のペアは数式2に示すように複数格納されている。
また、高解像化辞書を構成する第1のペア、第1のペアを構成する低解像辞書、第1のペアを構成する高解像辞書のそれぞれを数式3のように記述すると、高解像化辞書と低解像辞書と高解像辞書との関係は数式4のとおりである。
【0050】
高解像化辞書Dとして輝度画像を用いる場合には、高解像の輝度画像と低解像の輝度画像がペアとなって格納される。例えば、高解像の輝度画像は、映像中の顔が誰かを特定することが十分に可能なくらい鮮明な画像である。一方、低解像の輝度画像は、顔が小さすぎるために又は顔がボケているために映像中の顔が誰かを特定するのが難しい画像となる。
【0051】
次に、入力された低解像顔画像I
Lから低解像部分画像を切り出し、この低解像部分画像を高解像化辞書Dに記憶されている高解像と低解像のペア辞書のうち、低解像辞書の線形和で近似する。数式5は近似の結果である。
これにより、低解像部分画像を近似する低解像辞書と結合係数α(α1、α2、α3、...)が求まり、そして、低解像辞書に対応する高解像辞書と結合係数α(α1、α2、α3、...)を用いて高解像部分画像を生成する。数式6は生成された高解像部分画像を表す式である。
【0053】
なお、高解像化辞書Dは輝度画像ではなく、エッジなどのような顔画像に共通な基底画像を利用しても良い。基底画像の例としては、非特許文献3のように主成分分析による固有顔などがある。
【0054】
次にhallucination技術の問題点を説明する。
・hallucination技術の問題点
hallucination技術では、低解像顔画像を複数のブロックに分割し、各ブロック毎に高解像化辞書Dを利用して高解像化を行うため、目や口などの位置を所定の位置に合わせるような高精度な位置合わせが必要である。もし、高精度な位置合わせができていない場合には、生成された高解像顔画像が部分的に破綻してしまい、十分な顔認証精度を実現できない可能性がある。
【0055】
例えば、
図8のように低解像顔画像18001から高解像度の画像(高解像画像)18003を生成した時に、ブロック18002に含まれる人の目(左目)は、ブロック18002に対応するブロック18004においても人の目として認識できる。しかし、ブロック801及び802にまたがる人の目(右目)は、ブロック801及び802に対応するブロック803及び804においては破綻してしまい、人の目として認識することができない。
【0056】
一方、低解像顔画像18001の顔位置を左にシフトした低解像顔画像18005から高解像画像18007を生成した時には、ブロック18006に含まれる人の目(右目)は、当該ブロックに対応するブロック18008においても人の目として認識できる。しかし、ブロック805及び806にまたがる人の目(左目)は、ブロック805及び806に対応するブロック807及び808においては破綻してしまい、人の目として認識することができない、というような現象が発生する。
以上のように、hallucination技術では目や口などの位置を所定の位置に合わせることが非常に重要であり、これができていない場合には画像の一部が破綻してしまうような現象が発生する。しなしながら、低解像顔画像に対して高精度な位置合わせをすることは困難である。そこで、第3の実施形態では、高解像化処理で複数の高解像顔画像を生成し、その中から最も類似度が高い領域を利用することによって、破綻していない領域だけを利用して顔認証を行う。以下で、その詳細を説明する。
【0057】
図9は、第3の実施形態における画像認識装置の機能構成の一例を示したブロック図である。
図9に示すように、本実施形態の機能構成は、画像取得部110、顔位置検出部120、顔器官位置検出部130、顔器官位置設定部140、特徴抽出部152、及び顔画像登録部160、並びに高解像画像生成部310及び顔識別部340を含む。顔識別部340は、類似度算出部320及び類似度統合部330を含む。
【0058】
画像取得部110、顔位置検出部120、顔器官位置検出部130、顔器官位置設定部140、及び顔画像登録部160は、第1の実施形態又は第2の実施形態における画像取得部110等と同様であるから説明を省略する。
【0059】
高解像顔画像生成部310は、顔類似度が最も高くなる変換画像から、顔の大きさ、顔の位置、顔の向きの少なくとも1つが異なる複数の2回変換画像を生成する。そして、複数の2回変換画像の各2回変換画像から2回変換高解像顔画像(以下では、単に高解像顔画像とも言う)を生成する。
【0060】
特徴抽出部152は、
顔器官位置設定部140が設定した顔器官位置に基づいて、2回変換高解像顔画像の各顔器官の特徴量を抽出し、
顔画像登録部160が記憶している顔器官位置に基づいて、各登録画像の各顔器官の特徴量を抽出する。
【0061】
類似度算出部320は、2回変換高解像顔画像の各顔器官の特徴量と、各登録画像の各顔器官の特徴量との顔器官類似度を算出する。
【0062】
類似度統合部330は、少なくとも
第1の2回変換高解像顔画像を用いて算出された第1の顔器官についての顔器官類似度の最高値と、
第2の2回変換高解像顔画像を用いて算出された第2の顔器官についての顔器官類似度の最高値と、を統合して統合顔器官類似度を得る。
第1の顔器官とは、例えば右目であり、第2の顔器官とは例えば左目である。
【0063】
ここで、「少なくとも」とは
第3の2回変換高解像顔画像を用いて算出された第3の顔器官(例えば、口)についての顔器官類似度の最高値や、
第4の2回変換高解像顔画像を用いて算出された第4の顔器官(右目、左目、口以外の顔器官)についての顔器官類似度の最高値と、を統合して統合顔器官類似度を得るとしても良い、という意味である。
【0064】
「第1の2回変換高解像顔画像」とは「当該画像の第1の顔器官と登録画像の第1の顔器官との組合せ」から「第1の顔器官についての顔器官類似度の最高値」が得られた2回変換高解像画像ということを意味する。
また、「第2の2回変換高解像顔画像」とは「当該画像の第2の顔器官と登録画像の第2の顔器官との組合せ」から「第2の顔器官についての顔器官類似度の最高値」が得られた2回変換高解像画像ということを意味する。
【0065】
ある「2回変換高解像顔画像」から「第1の顔器官についての顔器官類似度の最高値」が得られ、かつ
これと同じ「2回変換高解像顔画像」から「第2の顔器官についての顔器官類似度の最高値」が得られることもあり得る。この場合、「第1の2回変換高解像顔画像」と「第2の2回変換高解像顔画像」とは同一の「2回変換高解像顔画像」となる。
【0066】
顔識別部340は、類似度統合部330が得た統合顔器官類似度(統合類似度)に基づいて、前記入力画像に写っている顔と前記各登録画像に写っている顔が同一人物の顔か識別する。
【0067】
図10、および
図11は、本発明の第3の実施形態における顔識別モードの処理の流れを示している。
顔登録モードは第1の実施形態の顔登録モード同様であるので、説明を省略する。
【0068】
<顔識別モード>
図10のステップS2102からステップS2302までの処理は
図2のステップS1101からステップS1202までの処理と同様である。
ステップS2303以降を説明する前に本発明の第3の実施形態でのポイントを説明する。
【0069】
<第3の実施形態のポイント>
上述で説明した通り、hallucination技術を用いた場合、目や口などの位置を所定の位置に合わせることができず、画像の一部が破綻してしまうような現象が発生する。そこで、第3の実施形態では、ステップS2303でシフト量、スケール、回転量の異なる複数の変換画像を生成し、生成した複数の変換画像に対して高解像化処理を行い、登録画像との類似度が高い領域だけを利用して顔認識を行う。その結果、破綻していない領域だけを利用して顔認証を行うことになる。
【0070】
図12は、複数の変換画像から高解像顔画像を生成し、生成した高解像顔画像のうちの破綻していない領域(ブロック)を利用して顔認証を実施するという処理の流れの概要を示す図である。
変換画像18001と変換画像18005はシフト量が異なる変換画像の例である。変換画像18001から生成した高解像顔画像18003のブロック18004と、変換画像18005から生成した高解像顔画像18007のブロック18008とは、登録画像との顔器官類似度が高い(つまり、破綻していない)領域の例である。
【0071】
破綻していないブロック18004の位置と登録画像18009のブロック18011の位置が対応し、破綻していないブロック18008の位置とブロック18010の位置とが対応する。そして、ブロック18004から抽出される特徴とブロック18011から抽出される特徴との類似度、及びブロック18008から抽出される特徴とブロック18010から抽出される特徴との類似度に基づいて顔を識別する。
以上が、第3の実施形態のポイントである。
続いて、第3の実施形態における処理を順次説明する。
【0072】
<第3の実施形態における処理の流れ>
ステップS2303では、ステップS2302で生成された正規化画像からシフト量、スケール、回転量の異なる複数の変換画像を生成する。例えば、アフィン変換などを用いる。
図13Aに示すように、入力画像からスケール変換、シフト変換、回転変換などにより第1〜第3の変換画像を生成する。なお、スケール変換、シフト変換、回転変換のそれぞれによって複数の変換画像が生成されること、各変換を適宜組み合わせても良いことは第1、第2の実施形態と同様である。
【0073】
<ペアの探索>
ステップS2304では、
図4のステップS1402と同様に、類似度が最も高くなる変換画像と登録画像とのペアを探索する。
【0074】
<2回変換画像の生成>
ステップS2305では、ステップS2304で類似度が最も高くなると判断されたペアの変換画像からシフト量、スケール、回転量の異なる複数の変換画像(以下、「2回変換画像」とも記載する)を生成する。
図13Aに示す例では、第1の変換画像が類似度が最も高くなった変換画像であり、その第1の変換画像から、第1の2回変換画像、第2の2回変換画像を生成している。
図10のステップS2305におけるシフト量、スケール、回転量は、ステップS2303におけるシフト量、スケール、回転量よりも小さい。ステップS2303は顔全体の類似度を比較するための前処理であるのに対し、ステップS2305は顔全体と比べて小さい顔器官の類似度を比較するための前処理だからである。例えば、ステップS2303では1cm単位でシフトさせ、ステップS2305では1mm単位でシフトさせる。
【0075】
ステップS2401では、ステップS2305で生成した複数の変換画像に対して、上述したようなhallucination技術を適用することにより高解像化を行う。
図13Bに示す例では、第1の2回変換画像を高解像化して第1の2回変換高解像画像とし、第2の2回変換画像を高解像化して第2の2回変換高解像画像とした。
【0076】
<特徴の抽出>
ステップS2502では、ステップS2401で生成された全ての高解像顔画像に対して非特許文献1に記載されているようなLBP特徴を抽出する。
<類似度の算出>
ステップS2701では、高解像顔画像のあるブロックからステップS2502で抽出したLBP特徴と、ステップS1601(
図2)で記憶した顔画像の同じブロックから抽出したLBP特徴との類似度をそれぞれ算出する。
【0077】
図13Bに示す例では、
第1の2回変換画像のブロック18022から抽出したLBP特徴と、第1の登録画像のブロック18010から抽出したLBP特徴との類似度を算出し、
第2の2回変換画像のブロック18008から抽出したLBP特徴と、第1の登録画像のブロック18010から抽出したLBP特徴との類似度を算出する。
【0078】
図13Cに示す例では、
第1の2回変換画像のブロック18004から抽出したLBP特徴と、第1の登録画像のブロック18011から抽出したLBP特徴との類似度を算出し、
第2の2回変換画像のブロック18012から抽出したLBP特徴と、第1の登録画像のブロック18011から抽出したLBP特徴との類似度を算出する。
【0079】
<類似度の統合>
ステップS2702では、ブロック位置が同じ複数のペアの類似度の中から最も類似度の高いペアの類似度を選択し、選択された類似度を統合する。
例えば、
図13Bの高解像顔画像18003のブロック18022と、登録画像18009のブロック18010との類似度(顔器官類似度)と、
高解像顔画像18007のブロック18008と、登録画像18009のブロック18010との類似度(顔器官類似度)と、の中から最も類似度の高いペア(ブロック18008とブロック18010とのペア)の類似度を選択する。
【0080】
同様に、
図13Cの高解像顔画像18003のブロック18004と、登録画像18009のブロック18011との類似度(顔器官類似度)と、
高解像顔画像18007のブロック18012と、登録画像18009のブロック18011との類似度(顔器官類似度)と、の中から最も類似度の高いペア(ブロック18004とブロック18011とのペア)の類似度を選択する。
そして、選択された類似度(ブロック18008とブロック18010とのペアの類似度、ブロック18004とブロック18011とのペアの類似度)を統合する。
【0081】
高解像顔画像18007のブロック18008と登録画像18009のブロック18010とのペアの類似度を選択し、選択された類似度について後述する類似度統合を行う。
ステップS2801では、統合された類似度に基づいて顔識別を実行する。
【0082】
<特徴抽出から類似度統合まで>
図11を用いてステップS2502〜ステップS2702について、詳しく説明する。
まず、ステップS3010では、顔器官の特徴を抽出する。
ステップS3011では、顔器官の類似度を算出する。
ステップS3012では、全ての2回変換高解像画像について顔器官類似度を算出していなければステップS3010に戻り、新たな2回変換高解像画像についてステップS3010以降の処理を繰り返す。全ての2回変換高解像画像について顔器官類似度を算出していればステップS3013に進む。
【0083】
例えば、2回変換高解像画像として第1の2回変換高解像画像から第nの2回変換高解像画像までが生成されたとする(nは任意の自然数)。
この場合、
第1の2回変換高解像画像の右目と第1の登録画像の右目との第1の類似度を算出し、
第2の2回変換高解像画像の右目と第1の登録画像の右目との第2の類似度を算出し、
:
第(n−1)の2回変換高解像画像の右目と第1の登録画像の右目との第(n−1)の類似度を算出し、
第nの2回変換高解像画像の右目と第1の登録画像の右目との第nの類似度を算出したら、ステップS3013に進む。
【0084】
ステップS3013では、顔器官類似度の最高値を記憶する。
例えば、前記の如く、2回変換高解像画像として第1の2回変換高解像画像から第nの2回変換高解像画像までが生成されたとする(nは任意の自然数)。
この場合、
右目についての第1の類似度、第2の類似度、・・・、第(n−1)の類似度、第nの類似度の中での最高値を記憶する。
【0085】
ステップS3014では、全ての顔器官について顔器官類似度の最高値を記憶していなければステップS3010に戻り、新たな顔器官に関して、ステップS3010以降の処理を繰り返す。
例えば、右目、左目及び口に関して、顔器官類似度を算出し、その最高値を記憶し、統合して顔識別をする場合に、右目に関しては最高値の記憶をしたが、左目に関してはまだ最高値を記憶していないとする。
【0086】
この場合、
第1の2回変換高解像画像の左目と第1の登録画像の左目との第1の類似度を算出し、
第2の2回変換高解像画像の左目と第1の登録画像の左目との第2の類似度を算出し、
:
第nの2回変換高解像画像の左目と第1の登録画像の左目との第nの類似度を算出したら、左目についての第1の類似度、第2の類似度、・・・、第(n−1)の類似度、第nの類似度の中での最高値を記憶する。
【0087】
その後、ステップS3010に戻り、口に関して、ステップS3010以降の処理を繰り返す。第1の2回変換高解像画像の口と第1の登録画像の口との第1の類似度、・・・第nの2回変換高解像画像の口と第1の登録画像の口との第nの類似度を算出し、第1〜第nの類似度の中での最高値を記憶する。
【0088】
全ての顔器官について顔器官類似度の最高値を記憶していればステップS3015に進む。
ステップS3015では、顔器官類似度を統合する。
例えば、右目についての顔器官類似度の最高値と、左目についての顔器官類似度の最高値と、口についての顔器官類似度の最高値とを合計する。
【0089】
各顔器官類似度の最高値が、第1〜第nの2回変換高解像画像のどれとの組合せによって得られるかは顔器官に応じて異なり得る。
例えば、右目については、第1の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
左目については第1の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
口については第3の2回変換高解像画像と第1の登録画像との類似度が最高値となり得る。
又は、右目については、第1の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
左目については第3の2回変換高解像画像と第1の登録画像との類似度が最高値となり、
口については第5の2回変換高解像画像と第1の登録画像との類似度が最高値となり得る。
【0090】
ステップS3016では、全ての登録画像について顔器官類似度を統合していなければステップS3010に戻り、新たな登録画像に関して、ステップS3010以降の処理を繰り返す。
全ての登録画像について、全ての顔器官について、全ての変換画像との組み合わせについて顔器官類似度を統合したら、ステップS2801に進み、顔識別を実行する。
【0091】
前記の如く、第3の実施形態では、高解像化処理で複数の高解像顔画像を生成し、その中から最も類似度が高い領域を利用することによって、破綻していない領域だけを利用して顔認証を行う。それによって、正確な位置合わせが困難なために、hallucination技術を適用した、画像の一部が破綻してしまうような現象が発生した場合であっても、高精度の顔認証が可能となる。
【0092】
[その他の実施形態]
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。