(58)【調査した分野】(Int.Cl.,DB名)
前記バイタル情報抽出部は、前記顔領域に関する画像データに基づき、前記顔領域において撮像された前記顔における脈拍を推定し、当該推定した脈拍を前記バイタル情報として抽出することを特徴とする請求項1に記載の顔検出装置。
前記フォーカス制御部は、前記バイタル判定部によって前記顔が生きている状態にあると判定されなかった顔領域については前記フォーカス処理を不実行とすることを特徴とする請求項1から請求項3のいずれかに記載の顔検出装置。
【発明を実施するための形態】
【0012】
上記課題を解決するためになされた第1の発明は、人物を含む画像から顔を検出する顔検出装置であって、前記人物を含む時間的に連続する撮像画像が入力される画像入力部と、前記撮像画像において1以上の顔領域を検出する顔領域検出部と、前記顔領域に関する画像データに基づき、前記顔領域において撮像された顔の生きている状態を示す指標を含むバイタル情報を抽出するバイタル情報抽出部と、前記バイタル情報に基づき、前記顔領域における前記顔が生きている状態にあるか否かを判定するバイタル判定部とを備え、前記顔領域検出部は、前記1以上の顔領域のうち前記バイタル判定部によって生きている状態にあると判定された前記顔に対応する顔領域を、生体に基づく顔領域として認識することを特徴とする。
【0013】
この第1の発明に係る顔検出装置によれば、撮像画像に含まれる1以上の顔領域のうち、生きている状態にあると判定された顔に対応する顔領域を生体に基づく顔領域として認識する構成としたため、人物を含む画像から顔を検出する場合に、人物以外の物体を生体の顔として誤検出することを防止することが可能となる。
【0014】
また、第2の発明では、上記第1の発明において、前記バイタル情報抽出部は、前記顔領域に関する画像データに基づき、前記顔領域において撮像された前記顔における脈
拍を推定し、当該推定した脈
拍を前記バイタル情報として抽出することを特徴とする。
【0015】
この第2の発明に係る顔検出装置によれば、顔領域における顔が生きている状態にあるか否かを脈
拍に基づき判定する構成としたため、簡易な構成により、生体に基づく顔領域を認識することが可能となる。
【0016】
また、第3の発明では、上記第1または第2の発明において、前記撮像画像を表示する表示部を更に備え、前記顔領域検出部は、前記表示部に表示される前記撮像画像に対し、前記1以上の顔領域において前記生体に基づく顔領域と他の顔領域とをユーザに識別させるための画像処理を行うことを特徴とする。
【0017】
この第3の発明に係る顔検出装置によれば、ユーザに対して生体に基づく顔領域を容易に認識させることができ、その結果、ユーザは、その生体に基づく顔領域に対し、所望の操作を実行することが可能となる。
【0018】
また、第4の発明では、上記第1から第3の発明のいずれかにおいて、前記顔領域における顔の特徴量を予め登録された顔の情報と照合する顔照合部を更に備え、前記顔照合部は、前記バイタル判定部によって生きている状態にあると判定された前記顔に対してのみ前記照合を実行する。
【0019】
この第4の発明に係る顔検出装置によれば、生体に基づく顔(画像)に対してのみ顔照合が実行される構成としたため、生体に基づかない顔に対して照合が実施されることによる誤認証の発生を防止することが可能となる。
【0020】
また、第5の発明は、上記第1から第3の発明のいずれかにおいて、前記顔領域における顔の特徴量を予め登録された顔の情報と照合する顔照合部を更に備え、前記顔照合部は、前記バイタル判定部によって生きている状態にないと判定された前記顔について、前記照合の結果を無効または不一致とすることを特徴とする。
【0021】
この第5の発明に係る顔検出装置によれば、生体に基づかない顔(画像)に関する照合結果を無効または不一致とする構成としたため、生体に基づかない顔に対する照合結果に基づく誤認証の発生を防止することが可能となる。
【0022】
また、第6の発明は、上記第1から第5の発明のいずれかに係る前記顔検出装置と、前記顔検出装置に対して前記撮像画像を入力するカメラとを備えたことを特徴とする顔検出システムである。
【0023】
この第6の発明に係る顔検出システムによれば、撮像画像に含まれる1以上の顔領域のうち、生きている状態にあると判定された顔に対応する顔領域を生体に基づく顔領域として認識する構成としたため、人物を含む画像から顔を検出する場合に、人物以外の物体を生体の顔として誤検出することを防止することが可能となる。
【0024】
また、第7の発明は、人物を含む撮像画像から顔を検出する顔検出方法であって、前記人物を含む時間的に連続する撮像画像が入力される画像入力ステップと、前記撮像画像において1以上の顔領域を検出する顔領域検出ステップと、前記顔領域に関する画像データに基づき、前記顔領域において撮像された顔が生きている状態を示す指標を含むバイタル情報を抽出するバイタル情報抽出ステップと、前記バイタル情報に基づき、前記顔領域における前記顔の生きている状態にあるか否かを判定するバイタル判定ステップとを有し、前記顔領域検出ステップは、前記1以上の顔領域のうち前記バイタル判定ステップによって生きている状態にあると判定された前記顔に対応する顔領域を、生体に基づく顔領域として認識することを特徴とする。
【0025】
この第7の発明に係る顔検出方法によれば、撮像画像に含まれる1以上の顔領域のうち、生きている状態にあると判定された顔に対応する顔領域を生体に基づく顔領域として認識する構成としたため、人物を含む画像から顔を検出する場合に、人物以外の物体を生体の顔として誤検出することを防止することが可能となる。
【0026】
以下、本発明の実施の形態について図面を参照しながら説明する。
【0027】
(第1実施形態)
図1は本発明の第1実施形態に係る顔検出装置1の機能ブロック図であり、
図2および
図3はそれぞれ顔領域検出部4による顔検出対象の第1および第2の例を示す説明図であり、
図4はバイタル情報抽出部8によるバイタル情報抽出処理の説明図である。
【0028】
図1に示すように、顔検出装置1は、人物の少なくとも顔を被写体として撮像する撮像部2と、撮像部2からの映像信号が入力される画像入力部3と、それら撮像画像において1以上の顔領域を検出する顔領域検出部4と、その顔領域の検出結果に基づき、撮像部2に像の光を入力する光学系を含むフォーカス機構(図示せず)の動作を制御するフォーカス制御部5と、画像入力部3に入力された撮像画像および顔領域検出部4による顔検出結果等を表示する表示部6と、撮像画像を記憶する画像記憶部7とを備えている。
【0029】
さらに、顔検出装置1は、人物以外の物体を生体の顔として誤検出することを防止するための構成として、顔領域検出部4により検出された顔領域に関する画像データに基づき、その顔領域におけるバイタル情報を抽出するバイタル情報抽出部8と、そのバイタル情報に基づき、顔領域における顔が生きている状態にあるか否かを判定するバイタル判定部9とを備えている。ここで、バイタル情報には、顔領域において撮像された顔の生きている状態を示す指標が少なくとも含まれる。
【0030】
撮像部2は、光学系を通して得られる被写体からの光を図示しないイメージセンサ(CCD、CMOS等)に結像させることにより、その結像した像の光を電気信号に変換した映像信号を画像入力部3に対して出力する。また、撮像部2では、ノイズ抑制や輪郭強調等を目的とする公知の信号処理を実施することが可能である。これにより、画像入力部3には、時間的に連続する撮像画像(フレーム画像のデータ)が順次入力される。
【0031】
顔領域検出部4は、各撮像画像に対し、公知のパターン認識手法(例えば、予め準備したテンプレートとのマッチング)に基づく顔検出処理を実行することにより顔領域を検出・追尾し、その顔領域に関する顔検出情報(検出された顔領域の座標、画素値等)を取得する。また、顔領域検出部4によって取得された顔検出情報は、撮像画像のデータとともに、フォーカス制御部5、表示部6、及びバイタル情報抽出部8等に送出される。なお、顔領域検出部4による顔検出処理については、顔の特徴量を用いた公知の統計的学習手法を利用してもよい。
【0032】
また、後に詳述するように、顔検出装置1では、ユーザの選択により生体の顔のみを検出する動作モード(以下、バイタル検出モードという。)を実行することが可能であり、このバイタル検出モードでは、顔領域検出部4は、バイタル判定部9によって生きている状態にないと判定された顔が撮像画像中に存在する場合には、それらの顔を検出対象から除外する。
【0033】
例えば、
図2に示すように、撮像画像P中に人物11と、被写体の背後の壁に貼付された人の顔写真を含むポスター(人の顔に類似の形態を有する物体)12が存在する場合、顔領域検出部4は、生体に基づく人物11の顔領域13のみを検出し、生体に基づかないポスター12中の顔写真に基づく顔領域14、15は、検出対象から除外する。
【0034】
また、例えば、
図3に示すように、撮像画像P中に人物21と、その周辺に配置された複数(ここでは、4体)の衣裳陳列用の人形22(マネキン)が存在する場合、顔領域検出部4は、生体に基づく人物21の顔領域24のみを検出し、生体に基づかない複数の人形22の顔領域25−28は、検出対象から除外することができる。
【0035】
なお、ここでは、顔領域13−15、24−28を矩形で示しているが、顔領域検出部4によって検出される顔領域は種々の変更が可能であり、例えば、頭部を除く顔の輪郭を外縁とした顔領域を設定することができる。
【0036】
フォーカス制御部5は、顔領域検出部4から顔検出情報を取得することにより、撮像画像中の顔領域の位置を基準(フォーカスポイント)としてフォーカス機構の動作を制御する公知のオートフォーカス処理を実行することが可能である。特に、上述のバイタル検出モードが実行された場合には、顔領域検出部4からの顔検出情報には、生体の顔に基づく情報のみが含まれるため、フォーカス制御部5では、撮像画像に人の顔に類似の形態を有する物体(生体に基づかない顔)が存在する場合でも、人物の顔に適切にピントを合わせることができる。
【0037】
バイタル情報抽出部8は、抽出対象(人物)と接触することなく、生体の脈
拍をバイタル情報として抽出するバイタル情報抽出処理を実行する。より詳細には、バイタル情報抽出部8は、時間的に連続する撮像画像において顔領域検出部4により検出された顔領域を構成する各画素に関し、例えばRGBの各成分の画素値(0−255階調)を算出し、その代表値(ここでは、各画素の平均値)の時系列データを脈拍信号として生成する。この場合、脈動による変動が特に大きい緑成分(G)のみの画素値に基づき時系列データを生成することができる。
【0038】
また、生成された画素値(平均値)の時系列データは、例えば、
図4(A)に示すように、血液中のヘモグロビン濃度の変化に基づく微少な変動(例えば、画素値の1階調未満の変動)を伴う。そこで、バイタル情報抽出部8は、その画素値に基づく時系列データに対し、必要に応じて公知のフィルタ処理(例えば、所定の通過帯域が設定されたバンドパスフィルタによる処理等)を実施することにより、
図4(B)に示すように、ノイズ成分を除去した脈波をバイタル情報として抽出することができる。また、バイタル情報抽出部8は、その脈波において隣接する2以上のピーク(またはゼロ点)間の時間から脈拍数を算出し、それらをバイタル情報とすることもできる。バイタル情報抽出部8によって抽出されたバイタル情報は、バイタル判定部9に対して送出される。さらに、バイタル情報抽出部8は、
図4(A)に示したような時系列データの周波数解析(高速フーリエ変換)により取得したスペクトルをバイタル情報とすることもできる。
【0039】
バイタル判定部9は、バイタル情報抽出部8によって抽出されたバイタル情報としての脈波(
図4(B)参照)の情報に基づき、顔領域における顔が生きている状態にあるか否かを判定することができる。ここで、バイタル判定部9は、バイタル情報抽出部8によって抽出された脈波と、予め準備された脈波の基準波形とのマッチング処理を行うことにより、脈
拍が検出されたか否か(すなわち、検出された顔が生きている状態にあるか否か)を判定することが可能である。別法として、バイタル判定部9は、バイタル情報抽出部8によって適正な脈拍数が検出されたか否かによって、顔が生きている状態にあるか否かを判定してもよい。更に別法として、バイタル判定部9は、バイタル情報抽出部8によってバイタル情報としてのスペクトルに基づき、顔が生きている状態にあるか否かを判定してもよい。
【0040】
上述のような顔検出装置1は、例えば、人物等の撮影に用いられるビデオカメラとして実現することが可能である。その場合、顔検出装置1では、撮像画像は装置の起動後に画像入力部3に対して順次入力されると共に、表示部6に表示され、ユーザがシャッターボタン(録画開始ボタン)を操作することにより、その撮影画像が画像記憶部7に順次記憶されることになる。
【0041】
詳細は図示しないが、例えば、顔検出装置1は、所定の制御プログラムに基づき撮像に関する処理や周辺機器の制御などを統括的に実行するCPU(Central Processing Unit)、イメージセンサから取り込んだ画像データを一時的に記憶するRAM(Random Access Memory)、画像データに対して所定の画像処理を実行するDSP(Digital Signal Processer)、イメージセンサ用のドライバ、LCD、及びメモリカードなどを含む公知のハードウェア構成を有しており、
図1に示した顔検出装置1の各部の機能の少なくとも一部については、CPUが本発明に関する所定の制御プログラムを実行することによって実現可能である。なお、顔検出装置1の機能の少なくとも一部を他の公知のハードウェアによる処理によって代替してもよい。
【0042】
図5は第1実施形態に係る顔検出装置1による処理の流れを示すフロー図である。顔検出装置1では、起動とともに撮像が開始され、撮像部2から画像入力部3に対して撮像画像(フレーム画像)が順次入力される(ST101)。そこで、顔検出装置1のユーザが、顔検出を実行する動作モード(以下、顔検出モードという。)を選択している場合(ST102:Yes)、顔領域検出部4は、顔検出処理を実行する(ST103)。
【0043】
続いて、顔検出装置1では、ステップST103の顔検出処理によって顔領域が検出されたか否かが判定され(ST104)、顔領域が検出されている場合(Yes)は、更に、ユーザがバイタル検出モードを選択しているか否かを判定する(ST105)。
【0044】
ステップST105においてバイタル検出モードが選択されている場合(Yes)、バイタル情報抽出部8は、ステップST103で検出された顔領域の各々からバイタル情報(ここでは、脈
拍)を抽出する(ST106)。続いて、バイタル判定部9は、ステップST106において抽出されたバイタル情報の有効性を判定する(ST107)。本実施形態では、バイタル判定部9は、顔領域から抽出された脈波の情報に基づき、顔領域における顔が生きている状態にあると判定した場合にはバイタル情報を有効(ST107:Yes)とし、一方、顔領域における顔が生きている状態にない(すなわち、ステップST103で検出された顔は、人の顔に類似の形態を有する物体に由来する)と判定した場合には、バイタル情報を無効(ST107:No)とする。
【0045】
ステップST107においてバイタル情報が有効(Yes)であると判定された場合、フォーカス制御部5は、ステップST103で検出された顔領域の位置を基準としてオートフォーカス処理を実行する(ST108)。また、表示部6には、ステップST104に基づく顔検出結果(例えば、
図2中に顔領域13として示した顔を外囲する枠を参照)が撮像画像とともに表示される(ST109)。これにより、ユーザに対して生体に基づく顔領域を容易に認識させることができ、その結果、ユーザは、その生体に基づく顔領域に対し、所望の操作(例えば、ユーザが顔領域をタッチすることによる当該顔領域に対するオートフォーカス)を実行することが可能となる。
【0046】
一方、バイタル検出モードの実行中にステップST107においてバイタル情報が無効(No)であると判定された場合には、ステップST108、ST109は実行されることはない。これにより、生体に基づかない顔領域を基準としてフォーカス制御が実行されることを回避することができる。
【0047】
上述のステップST101−ST109の動作は、最終的にユーザの操作(例えば、電源オフ操作や、撮影の完了操作等)に基づく処理停止要求がある(ST110:Yes)まで、繰り返し実行される。なお、ユーザが顔検出モードの実行を選択していない場合(ST102:No)には、ステップST103−ST109の処理は省略される。また、ユーザがバイタル検出モードを選択していない場合(ST105:No)には、ステップST106、ST107は実行されず、ステップST103で検出された顔領域(生体に基づかない顔領域を含む)の位置を基準としてオートフォーカス処理が実行されることになる(ST108)。また、ステップST108のフォーカス制御が実行された後の撮像画像は、別途、ユーザがシャッターボタン(録画開始ボタン)を押下する操作を行うなどにより、画像記憶部7に記憶される。
【0048】
(第2実施形態)
図6は本発明の第2実施形態に係る顔検出システム100の全体構成図であり、
図7は顔検出システム100の機能ブロック図である。
図6および
図7において、上述の第1実施形態と同様の構成要素については、同一の符号が付されている。また、第2実施形態では、以下で特に言及しない事項については、上述の第1実施形態の場合と同様とする。
【0049】
図6に示すように、顔検出システム100は、被写体としての人物Hの少なくとも顔を撮像するカメラ31と、カメラ31の撮影により得られる撮像画像から顔を検出する顔検出装置1とを備える。本実施形態では、顔検出装置1は、顔検出を実行するのみならず、その顔検出の結果に基づき顔認証を実行する顔認証装置として機能し、これにより、顔検出システム100は、顔認証システムとして機能することが可能である。また、顔検出システム100において、カメラ31および顔検出装置1は、インターネットやLAN(Local Area Network)等のネットワーク32を介して互いに通信可能に接続されている。ただし、これに限らず、カメラ31および顔検出装置1が、公知の通信ケーブルによって通信可能に直接接続される構成であってもよい。
【0050】
カメラ31は、公知の構成を有するビデオカメラであり、
図7に示すように、ズームレンズを通して得られる被写体からの光を図示しないイメージセンサ(CCD、CMOS等)に結像させることにより、その結像した像の光を電気信号に変換した映像信号を顔検出装置1に対して出力する撮像部2を有している。なお、
図6では1台のカメラ31のみを示しているが、顔検出システム100では、同様のカメラを複数設けた構成も可能である。
【0051】
顔検出装置1は、上述の第1実施形態の場合と同様の機能を有する画像入力部3、顔領域検出部4、表示部6、バイタル情報抽出部8、及びバイタル判定部9に加えて、顔領域検出部4により検出された顔領域における顔の特徴量を抽出する特徴量抽出部41と、その抽出された特徴量を予め登録された複数の人物の顔の情報(以下、登録顔情報という。)と照合する顔照合処理を行う顔照合部42と、その照合に用いられる登録顔情報を記憶する登録情報記憶部43と、顔照合部42による顔の照合結果に基づき、必要に応じて所定の認証後処理を実行する認証制御部44とを有している。
【0052】
特徴量抽出部41は、公知の手法により、顔領域検出部4から検出された顔領域から顔検出情報を取得することにより、顔領域における顔の形状、目・鼻・口などの相対位置、顔(肌)の色などに基づく特徴点を検出し、その特徴を表す特徴量を抽出する。ここで、顔領域検出部4から検出される顔領域は、人物Hの正面における顔画像を含むことが好ましい。
【0053】
顔照合部42は、顔照合処理として、特徴量抽出部41により抽出された特徴量と、登録顔情報(登録された特徴量)とのマッチング処理を行う。そのマッチング処理の結果、抽出された特徴量が登録顔情報のいずれかと一致すると判定された場合には、顔照合部42は、認証が受理された旨の通知を認証制御部44に対して送出する。一方、抽出された特徴量が登録顔情報のいずれとも一致しないと判定された場合には、顔照合部42は、認証が棄却された旨の通知を認証制御部44に対して送出する。
【0054】
また、顔照合部42は、顔検出システム100のユーザによりバイタル検出モードが選択されている場合には、バイタル判定部9による判定(顔領域における顔が生きている状態にあるか否かの判定)の結果を取得する。そして、顔照合部42は、バイタル判定部9によって生体に基づく(すなわち、生きている状態にある)と判定された顔のみを照合(マッチング処理)の対象とすることができる。或いは、顔照合部42は、マッチング処理の結果、抽出された特徴量が登録顔情報のいずれかと一致しても、その特徴量が抽出された顔について、バイタル判定部9によって生体に基づくものではないと判定された場合には、その照合結果を無効または不一致とすることができる。
【0055】
このような構成により、顔照合部42では、バイタル検出モードが選択されている場合には、人の顔に類似の形態を有する物体(例えば、人形の顔、生体に基づかない人の顔写真、人の顔に似せて作った仮面など)を誤認証することを防止することが可能である。
【0056】
認証制御部44は、顔照合部42から認証が受理された旨の通知を受け取ると、予め設定された認証後処理を実行する。そのような認証後処理には、特に限定されるものではないが、例えば、セキュリティエリアのドアの解錠、表示部6における画像や音声による情報出力、電子機器に対する操作許可などが含まれる。一方、認証制御部44は、顔照合部42から認証が棄却された旨の通知を受け取った場合には、認証後処理を実行せずに、その認証の棄却に関する情報を記録する。
【0057】
上述の第2実施形態に係る顔検出装置1は、例えば、PC(Personal Computer)などの情報処理装置から構成することが可能である。詳細は図示しないが、顔検出装置1は、所定の制御プログラムに基づき各種情報処理や周辺機器の制御などを統括的に実行するCPU(Central Processing Unit)、CPUのワークエリア等として機能するRAM(Random Access Memory)、CPUが実行する制御プログラムやデータを格納するROM(Read Only Memory)、ネットワークを介した通信処理を実行するネットワークインタフェース、モニタ(画像出力装置)、スピーカ、入力デバイス、及びHDD(Hard Disk Drive)などを含むハードウェア構成を有しており、
図7に示した顔検出装置1の各部の機能の少なくとも一部については、CPUが所定の制御プログラムを実行することによって実現可能である。なお、顔検出装置1の機能の少なくとも一部を他の公知のハードウェアによる処理によって代替してもよい。
【0058】
図8は第2実施形態に係る顔検出装置1による処理の流れを示すフロー図である。顔検出システム100では、起動とともにカメラ31による撮像が開始され、
図5中のステップST101と同様のステップST201が実行される。続いて、顔検出装置1では、
図5中のステップST103−ST107とそれぞれ同様のステップST202−ST206が実行される。
【0059】
次に、顔検出システム100のユーザ(管理者)が、顔認証を実行する動作モードを選択している場合(ST207:Yes)、顔照合部42は、顔の特徴量を用いた顔照合処理を実行する(ST208)。続いて、認証制御部44は、顔照合部42から認証が受理された旨の通知を受け取ると(ST209:Yes)、規定の認証後処理を実行する(ST210)。
【0060】
なお、ステップST206でバイタル情報が無効である(検出された顔が生体に基づくものではない)と判定された場合(ST206:No)、認証制御部44は、所定の異常発生処理(例えば、顔検出システム100の管理者への報知、異常発生時の撮像画像の記録など)を行う(ST211)。
【0061】
上述のステップST201−ST211は、最終的に全ての認証処理が完了するまで繰り返し実行される。
【0062】
以上、本発明を特定の実施形態に基づいて説明したが、これらの実施形態はあくまでも例示であって、本発明はこれらの実施形態によって限定されるものではない。なお、上記実施形態に示した本発明に係る顔検出装置、顔検出システム、及び顔検出方法の各構成要素は、必ずしも全てが必須ではなく、少なくとも本発明の範囲を逸脱しない限りにおいて適宜取捨選択することが可能である。