(58)【調査した分野】(Int.Cl.,DB名)
前記判定手段は、前記重複率が低いほど、前記特徴量を前記検出対象らしくないことを表すように補正することにより、前記入力画像に前記検出対象が含まれると判定しにくくする、請求項1に記載の対象検出装置。
前記判定手段は、前記識別領域から、当該識別領域と所定の位置関係にある部分領域を複数特定し、当該部分領域のそれぞれについて、前記特徴量及び前記重複率を算出し、当該重複率が低いほど、当該特徴量を前記検出対象らしくないことを表すように補正する、請求項2に記載の対象検出装置。
前記判定手段は、前記重複率が低いほど、前記評価値を前記検出対象が含まれていないことを表すように補正することにより、前記入力画像に前記検出対象が含まれると判定しにくくする、請求項1に記載の対象検出装置。
前記判定手段は、前記識別領域から、当該識別領域と所定の位置関係にある部分領域を複数特定し、当該部分領域のそれぞれについて、前記評価値及び前記重複率を算出し、当該重複率が低いほど、当該評価値を前記検出対象が含まれていないことを表すように補正する、請求項4に記載の対象検出装置。
前記判定手段は、前記重複率が半分より低い所定値以下である場合に限り、当該重複率が低いほど前記入力画像に前記検出対象が含まれると判定しにくくする、請求項1〜5の何れか一項に記載の対象検出装置。
【発明を実施するための形態】
【0015】
以下、本発明にかかる対象検出装置を出入管理システムに適用した場合の一実施形態である顔画像認証装置について図を参照しつつ説明する。
従来、予め登録している顔画像に基づいて人物を認証する顔画像認証装置に対して、登録されていない未登録者が、予め登録された登録者の顔写真または登録顔画像を引き延ばして印刷した紙を自分の顔の前に掲げることにより、登録者と判定されようとする不正行為が行われる問題がある。この問題に対して、例えば、検出対象を顔写真とし、検出対象を識別する特徴を画像内において写真枠により顔の周囲に生じる直線成分として、非特許文献1に開示されたシステムを適用することにより、不正行為を検出することができる。しかし、画像内の顔の周囲に、写真枠と同様に直線成分を有する窓、柱、壁の模様等が写っている場合、顔写真が写っていないにも関わらず顔写真が写っていると誤って判定されるおそれがある。
そこで、本発明にかかる対象検出装置は、人物を撮影した入力画像から動物体を表す動物体領域を抽出する一方で、入力画像において人物の顔を含む領域と特定の位置関係にある識別領域を抽出して、識別領域について顔写真らしさを表す特徴量を算出する。
さらに対象検出装置は、識別領域に対する識別領域と動物体領域が重複している領域の比率が低いほど、その算出した特徴量を顔写真らしくないことを表すように補正して、補正した特徴量を用いて入力画像に顔写真が含まれるか否かを判定する。
これにより、対象検出装置は、入力画像に顔写真を掲げていない人物が写っており、且つその人物の顔の周囲に静止物体である窓、柱、壁の模様等が写っている場合に、窓、柱、壁の模様等による直線成分を写真枠と誤って判定し、窓、柱、壁の模様等で囲われた領域を顔写真と誤って検出することの抑制を図る。
【0016】
図1(a)及び
図1(b)は、本発明にかかる対象検出装置を適用した例として、部屋の入口の出入を管理する顔画像認証装置1に接続される撮像装置2の設置例を模式的に示している。以下、撮像装置2が撮影する撮影領域の状態について説明する。
図1(a)及び
図1(b)に示すように、顔画像認証装置1は、電気錠制御装置3を介して不図示の電気錠を制御することにより部屋の入口101の出入を管理する。撮像装置2は、入口101に通じる通路を撮影領域として撮影できるように入口101の近傍の壁面または天井に、撮影方向をやや下方へ向け、その通路側へ向けた状態で取り付けられる。これにより撮像装置2は、進行方向102に沿って入口101に向かう人物を撮像することができる。
図1(a)は、撮像装置2が、入口101に向かう人物110を撮影する様子を示し、
図1(b)は、撮像装置2が、入口101に向かう人物120を撮影する様子を示している。この人物120は、顔画像認証装置1に登録されていない未登録者であり、顔画像認証装置1に予め登録されている登録者の顔写真121を自分の顔の前に掲げている。つまり、この人物120は、自分の顔の代わりに、登録者の顔写真121を撮像装置2に撮影させて、登録者の顔写真121により認証を受けようとする不正行為を行っている。このような人物の顔が写っている写真又はディスプレイ(以下、顔写真等と称する)を用いた不正行為を以下では写真画策と称する。
【0017】
図2(a)、(b)は、撮像領域を撮影した入力画像から人物の顔の周辺を含む領域を抽出した画像の例を示している。
図2(a)は、
図1(a)の写真画策を行っていない人物110が撮影された入力画像から抽出された画像200の例を示し、
図2(b)は、
図1(b)の人物120が登録者の顔写真121を自分の顔の前に掲げた状態で撮影された入力画像から抽出された画像210の例を示している。
図2(b)に示すように、画像210には、顔写真121に写っている登録者の顔の周囲に顔写真121の枠が写っており、写真枠による直線成分が存在する。したがって、人物の顔の周囲に存在する直線成分を顔写真等の特徴とする機械学習により生成した識別器を用いることにより顔写真等を検出することができる。入力画像に顔写真等が写っているか否かを判定する識別器は、顔写真等が写っている多数の学習用画像と顔写真等が写っていない多数の学習用画像のそれぞれから抽出した特徴量を用い、特徴量空間において顔写真等の特徴量が分布する空間とそれ以外の空間とを分ける識別境界を機械学習することによって生成される。
【0018】
図3に、顔写真等を検出するように生成される識別器についての確率密度関数の例を表すグラフを示す。
図3に示すグラフ300の横軸は特徴量を示し、縦軸は確率密度を示す。グラフ300において、曲線301は、顔写真等が写っていない複数の学習用画像についての確率密度関数を表し、曲線302は、顔写真等が写っている複数の学習用画像についての確率密度関数を表す。この識別器は、曲線301と曲線302が交わる点における特徴量θを識別境界とし、入力画像から抽出した特徴量が特徴量空間において識別境界のどちら側に位置するかにより、入力画像において人物の顔の周囲に直線成分が存在するか否かを判定し、顔写真等が写っているか否かを精度よく判定することができる。
【0019】
しかし、
図2(a)に示すように、人物110の顔の周囲に窓103の枠が写っているような画像200には、写真画策を行っていない人物110の顔の周囲に窓枠による直線成分が存在している。したがって、画像200について算出される特徴量は、顔写真等の特徴量が分布する側の空間に存在する、すなわち
図3の領域303に存在する可能性がある。この場合、画像200には、顔写真等が写っていないにも関わらず顔写真等が存在すると判定され、写真画策が行われたと誤って判定される。
【0020】
このように、人物の背景に写っている窓枠等は、人物の顔の周囲に直線成分を生じさせ、写真枠と同様の特徴を有する。しかし、窓は静止物体であり、顔写真等は人物の移動とともに移動する動物体であるという違いがある。そこで、顔画像認証装置1は、入力画像から動物体を表す動物体領域を抽出し、特徴量を算出する領域のうち動物体領域が占める比率が小さいほど、特徴量を顔写真等の特徴を表す度合いが低くなるように補正する。これにより、入力画像に窓枠等が写っている場合に、顔写真等が写っていると判定しにくくし、窓枠等を写真枠と誤って判定することを抑制する。
【0021】
以下、
図4を参照し、顔画像認証装置1について詳細に説明する。
図4は、本発明を適用した出入管理システム100の概略構成を示す図である。出入管理システム100は、顔画像認証装置1、撮像装置2及び電気錠制御装置3を有する。
【0022】
撮像装置2は、
図1(a)及び
図1(b)に示したように所定の撮影領域を撮影する監視カメラである。撮像装置2は、例えば、2次元に配列され、受光した光量に応じた電気信号を出力する光電変換素子(例えば、CCDセンサ、C−MOSなど)と、その光電変換素子上に撮影領域の像を結像するための結像光学系を有する。撮像装置2は、撮影領域内を通行する人物の顔を順次撮影できるように人物の通行方向の略正面に設置される。そして撮像装置2は、所定の時間間隔(例えば、200msec)ごとに、撮影領域を撮影して入力画像を取得する。入力画像は、グレースケールまたはカラーの多階調の画像とすることができる。本実施形態では、入力画像を、横1280画素×縦960画素を有し、RGB各色について8ビットの輝度分解能を持つカラー画像とした。ただし、入力画像として、この実施形態以外の解像度及び階調を有するものを使用してもよい。撮像装置2は、顔画像認証装置1と接続され、取得した入力画像を顔画像認証装置1へ渡す。
【0023】
電気錠制御装置3は、不図示の電気錠を制御する制御装置である。電気錠制御装置3は、顔画像認証装置1と接続され、顔画像認証装置1からの信号に従って、電気錠を施錠又は解錠する。
【0024】
顔画像認証装置1は、顔写真等を検出対象とする対象検出装置を出入管理システムに適用した例であり、
図4に示すように、画像取得部10、出力部20、記憶部30及び画像処理部40を有する。以下、顔画像認証装置1の各部について詳細に説明する。
【0025】
画像取得部10は、撮像装置2と接続されるインターフェース回路、例えばビデオインターフェース及びオーディオインターフェースあるいはユニバーサル・シリアル・バスといったシリアルバスに準じるインターフェース回路を有する。画像取得部10は、撮像装置2から入力画像を取得して画像処理部40へ渡す。なお、本実施形態では、画像取得部10は、撮像装置2が撮影した順に入力画像を画像処理部40へ渡すが、ハードディスク等の媒体から入力画像を撮影時刻の古い順に取得し、画像処理部40へ渡すようにしてもよい。
【0026】
出力部20は、外部の接続機器である電気錠制御装置3と接続するインターフェース及びその制御回路である。そして出力部20は、画像処理部40から人物についての認証成功を示す信号を受け取ると、接続されている電気錠制御装置3に対して解錠制御を行う信号を出力する。また、出力部20は、不図示の認証結果表示ランプと接続され、画像処理部40から人物についての認証成功、認証失敗または不正行為(写真画策)を示す信号を受け取ると、その認証結果に応じて認証結果表示ランプを点灯または消灯させる。あるいは、認証結果を不図示の監視センタ装置へ出力するようにしてもよい。
【0027】
記憶部30は、ROM(Read Only Memory)、RAM(Random Access Memory)等の半導体メモリ、又は磁気記録媒体及びそのアクセス装置若しくは光記録媒体及びそのアクセス装置などを有する。記憶部30は、顔画像認証装置1を制御するためのコンピュータプログラム及び各種データを記憶し、画像処理部40との間でこれらの情報を入出力する。各種データには、入口101の通行を許可されている登録者の氏名、登録者ID及び登録顔画像等の登録者データ31と、事前学習により決定された識別器に関する識別器情報32と、撮影領域に動物体が存在しないときに撮影領域を撮影した画像である背景画像33とが含まれる。なお、識別器情報32には、検出対象である顔写真等らしさを表す特徴量を算出するための部分領域についての情報が含まれる。
【0028】
画像処理部40は、例えば、いわゆるコンピュータにより構成され、撮像装置2から取得した入力画像に対し記憶部30を参照しながら各種処理を実行し、その処理結果を出力部20に外部へ出力させる。そのために画像処理部40は、動物体領域抽出手段41、顔検出手段42、識別領域抽出手段43、判定手段44及び顔照合手段45を有する。
画像処理部40の各手段は、マイクロプロセッサ、メモリ、その周辺回路及びそのマイクロプロセッサ上で動作するソフトウェアにより実装される機能モジュールである。これらの手段を、ファームウェアにより一体化して構成してもよい。また、これらの手段の一部または全てを、独立した電子回路、ファームウェア、マイクロプロセッサなどで構成してもよい。以下、画像処理部40の各手段について詳細に説明する。
【0029】
動物体領域抽出手段41は、画像取得部10から入力画像を取得する度に、取得した入力画像から動物体を表す動物体領域が存在するか否かを判定し、存在すればその動物体領域を抽出する。そのために、動物体領域抽出手段41は、入力画像と、記憶部30に記憶された背景画像33との間で、対応画素間の輝度差を求め、各画素の画素値がその輝度差の絶対値で表される差分画像を作成する。動物体領域抽出手段41は、入力画像において、対応する差分画像内の画素値が所定の閾値Th1以上となる領域を動物体領域とし、閾値Th1未満となる領域を背景領域とする。例えば、閾値Th1は、差分画像の各画素値の平均値とすることができる。
【0030】
顔検出手段42は、入力画像に人物の顔が写っているか否かを判定し、存在すれば、人物の顔を含む顔領域を検出し、入力画像から切り出して顔領域画像として抽出する。なお、顔領域は所定の物体を含む物体領域の例であり、顔検出手段42は、入力画像から物体領域を検出する物体領域検出手段の例である。
顔領域を検出するために、顔検出手段42は、Adaboost識別器を用いる(非特許文献1を参照)。
顔領域を検出する識別器は、顔が写っている画像に生じる明暗差やエッジ情報などを顔に関する特徴量として用いて、機械学習を行うことにより生成される。つまり、顔が写っている多数の学習用画像と顔が写っていない多数の学習用画像のそれぞれから抽出した特徴量を用い、特徴量空間において顔の特徴量が分布する空間とそれ以外の空間とを分ける識別境界を機械学習することによって生成される。
なお、顔領域の検出方法は種々存在するので、他の方法を適宜採用してもよい。例えば、顔検出手段42は、動物体領域抽出手段41が抽出した動物体領域のうち、その動物体領域の大きさ、縦横比等から人物らしいと考えられる動物体領域を人物領域として抽出する。顔検出手段42は、抽出した人物領域に対して、周知のエッジフィルタを用いて、エッジ画素抽出を行う。そして顔検出手段42は、抽出したエッジ画素から、所定の大きさをもつ、頭部の輪郭形状を近似した楕円形状のエッジ分布を検出し、そのエッジ分布に囲まれた領域を顔領域として検出してもよい。
【0031】
識別領域抽出手段43は、入力画像から、顔領域と特定の位置関係にある識別領域を抽出する。識別領域は、例えば顔検出手段42が検出した顔領域を中心に含み、顔領域の2倍の面積を有する領域とすることができる。この識別領域は、判定手段44による検出対象の検出に用いられる。
【0032】
判定手段44は、識別領域抽出手段43が抽出した識別領域から、その識別領域と所定の位置関係にある部分領域を記憶部30の識別器情報32を参照して特定する。判定手段44は、特定した部分領域について、検出対象らしさを表す特徴量を算出し、算出した特徴量を用いてその部分領域に検出対象が含まれていることの確からしさを表す評価値を出力するように構成された識別器を含む。そして、判定手段44は、識別器が出力した評価値を用いて入力画像に検出対象が含まれるか否かを判定する。そのために、判定手段44は、顔写真等に関する特徴量として、例えばハールライク(Haar-Like)特徴量とHOG(Histogram of Oriented Gradient)特徴量を用いたAdaboost識別器を有する。
ハールライク特徴量は、画像領域中に任意に設定された複数の隣接矩形領域間の輝度差である。ハールライク特徴量の詳細については、例えば、非特許文献1に開示されている。
【0033】
HOG特徴量は、画像領域中の各勾配方向の勾配強度の総和を度数としたヒストグラムから算出される。判定手段44は、識別領域を複数のブロックに分割し、さらに各ブロックを複数のセルに分割する。例えば、各セルは5画素×5画素の矩形領域であり、各ブロックは3セル×3セルの矩形領域である。そして、判定手段44は、入力された画像内の各画素における画素値の勾配方向及び勾配強度を算出する。なお、勾配方向は向きを考慮する必要がないため0°〜180°の範囲で算出され、例えば22.5°ごとに分割された8方向に定められる。
さらに、判定手段44は、セルごとに、各勾配方向について、各勾配方向の勾配強度の総和を度数としたヒストグラムを求め、求めたヒストグラムをブロックごとに正規化する。本実施形態の判定手段44は、正規化したヒストグラムの中で検出対象の特徴である写真枠の直線成分が表れやすい1つの勾配方向のみに着目し、その勾配方向の度数をHOG特徴量として用いる。
着目する勾配方向は、例えば顔検出手段42が検出した顔領域の上側部及び下側部では水平方向が望ましく、顔領域の左側部及び右側部では垂直方向が望ましい。または、学習によって最適な勾配方向を求めてもよい。
【0034】
Adaboost識別器は、複数の弱識別器と、各弱識別器の判定結果を統合して判定する強識別器とから構成される。各弱識別器には、特徴量を算出するための部分領域を対応付けさせ、各弱識別器は、その部分領域からハールライク特徴量又はHOG特徴量を算出する。各弱識別器は、算出した特徴量に基づいて、その弱識別器に対応した部分領域に顔写真等が写っていると判定した場合、評価値として1を出力し、一方、その弱識別器に対応した部分領域に顔写真等が写っていないと判定した場合、-1を出力する。一方、強識別器は、各弱識別器による出力結果をそれぞれ重み付けして、その重み付け和を求める。そして強識別器は、得られた重み付け和が所定の閾値Θ(例えば、0)よりも高い場合、識別領域に顔写真等が写っていると判定する。
なお、特徴量の算出手段を別途設けて、弱識別器に入力することとしてもよい。
【0035】
また、識別領域中のどの位置に関するハールライク特徴量又はHOG特徴量を識別に利用する弱識別器が使用されるか、及び弱識別器に対する重みは、顔写真等が写っていない複数のサンプル画像と顔写真等が写っている複数のサンプル画像とを用いた事前学習により決定される。学習手順の概略は以下の通りである。
(1)事前学習を行うコンピュータは、使用可能な全ての弱識別器について、各特徴量の値に基づいて、識別領域に顔写真等が写っているか否かを識別する閾値を設定する。
(2)コンピュータは、各サンプル画像に対する重みを決定する。重みの初期値は、各サンプル画像に対して同じ値とする。
(3)コンピュータは、全ての弱識別器に対して各サンプル画像を入力して、弱識別器ごとに識別に失敗したサンプル画像に付けられた重みを合計する。
(4)コンピュータは、重みの合計が最も小さい弱識別器をアダブースト識別器で使用する弱識別器として選択する。そして選択された弱識別器の出力に付される重みを決定する。
(5)コンピュータは、選択された弱識別器が識別に失敗したサンプル画像の重みを大きくする。
(6)コンピュータは、(3)〜(5)の手順を繰り返す。
なお、Adaboost法の詳細については、例えば、非特許文献1に開示されている。このようにして決定された各弱識別器にて用いる特徴量を算出する部分領域を表す情報と、特徴量についての情報(ハールライク特徴量であるかHOG特徴量であるか、ハールライク特徴量である場合はどのハールライク特徴量であるか)と、各弱識別器の出力に付される重みを表す情報は、識別器情報32として記憶部30に記憶される。
このような事前学習では、識別領域に顔写真等が写っているか否かを明確に区別できるように、各部分領域は、識別領域内の顔領域に対して顔写真等の特徴である背景との境界(写真枠)が写っている可能性が高いと評価された領域に設定される。したがって、選択された弱識別器に対応するハールライク特徴量は、識別領域に顔写真等が写っている場合は顔写真等と背景の間の輝度差により高い値を取り、写っていない場合は低い値を取る傾向にある。また、選択された弱識別器に対応するHOG特徴量は、識別領域に顔写真等が写っている場合は写真枠により特定の画素値勾配方向が強くなって高い値を取り、写っていない場合は低い値を取る傾向にある。
【0036】
さらに、判定手段44は、各弱識別器に対応する部分領域に対する、その部分領域と動物体領域が重複している領域の比率である重複率を算出する。つまり、重複率は、部分領域の面積(画素数)に対する部分領域と動物体領域が重複している領域の面積(画素数)の比率である。重複率が高いときは、部分領域のうち動物体領域の占める割合が高く、その部分領域について算出された特徴量はほとんど検出対象について算出されていると考えられる。一方、重複率が低くなるほど、部分領域のうち背景領域の占める割合が高くなり、その部分領域について算出された特徴量はほとんど背景について算出されていることになる。この場合、その部分領域には検出対象が写っていない可能性が高く、その部分領域についての特徴量が高い値を有するときは、背景の特徴が検出対象の特徴と類似している可能性が高い。
そこで、判定手段44は、算出した重複率に応じて各弱識別器にて用いる特徴量を補正するための補正係数を算出し、各弱識別器は、その弱識別器に対応する特徴量に補正係数を乗じることにより補正特徴量を算出し、補正特徴量を用いて評価値を算出する。補正係数は、0から1の範囲の値である。判定手段44は、重複率が高いほど、特徴量を検出対象らしいことを表すように補正して、部分領域に検出対象が含まれると判定し易くし、重複率が低いほど、特徴量を検出対象らしくないことを表すように補正して、部分領域に検出対象が含まれると判定しにくくする。本実施形態では、各弱識別器にて用いる特徴量は、値が高いほど顔写真等の特徴を表す度合いが高く、値が低いほど顔写真等の特徴を表す度合いが低い。そのため、判定手段44は、重複率が高いほど、補正係数を大きくして補正特徴量を大きくし、重複率が低いほど、補正係数を小さくして補正特徴量を小さくする。
【0037】
図5に、重複率と補正係数の関係の一例を表すグラフを示す。
図5のグラフ500において、横軸は重複率を示し、縦軸は補正係数を示す。
図5に示すように、重複率が閾値Dthより高い場合、補正係数は1とし、重複率が閾値Dth以下である場合、重複率が低くなるほど補正係数は低い値とする。なお、重複率が高いほど部分領域に動物体が含まれる割合が高く、重複率が低いほど部分領域に動物体が含まれる割合が低い。また、動物体領域と背景領域の境界は動物体の輪郭を表すため、重複率が半分(50%)である場合、動物体の輪郭が部分領域の中心を通過している可能性がある。例えば、部分領域を縦に分割した二つの領域間の輝度差をハールライク特徴量として用いる場合、動物体の輪郭が部分領域を縦に分割する境界を通過していれば、一方の領域には動物体が写り、他方の領域には背景が写るため、動物体の特徴を適切に抽出することができる。したがって、閾値Dthは50%より低い値とし、重複率が閾値Dth以上の場合は特徴量を補正せず、重複率が閾値Dth未満の場合に限り特徴量を補正することが好ましい。
【0038】
i番目の弱識別器の出力関数h
i(x
i)は、次式により与えられる。
【数1】
(1)式において、L
iはi番目の弱識別器についての補正係数であり、x
iはi番目の弱識別器に対応する部分領域について算出された特徴量であり、θ
iはi番目の弱識別器について設定した閾値である。強識別器の出力関数Hは、次式により与えられる。
【数2】
(2)式において、Tは弱識別器の数であり、α
iはi番目の弱識別器の出力に付される重みであり、Θは強識別器について設定した閾値である。判定手段44は、強識別器が正値を出力する場合、識別領域に顔写真等が含まれると判定し、強識別器が負値を出力する場合、識別領域に顔写真等が含まれないと判定する。
【0039】
図6(a)〜(e)に、部分領域と動物体領域の関係の一例を表す模式図を示す。
図6(a)〜(e)では、
図2(a)に示した画像200及び
図2(b)に示した画像210が識別領域として抽出されたものとして説明する。
図6(a)は識別領域600、及び識別領域600内に設定された、各弱識別器についての特徴量が算出される部分領域601〜610を表す。
図6(b)の斜線部分は
図2(a)の識別領域200について抽出された動物体領域620を表し、
図6(c)の斜線部分は
図2(b)の識別領域210について抽出された動物体領域630を表す。
図6(d)は部分領域601〜610と動物体領域620とを重ね合わせた画像640を表し、
図6(e)は部分領域601〜610と動物体領域630とを重ね合わせた画像650を表す。
【0040】
図6(d)に示すように、写真画策がされていない識別領域200の部分領域601〜610のうち、部分領域601、603、604、605、609及び610は、大部分が静止物体である窓103が写っている領域であり、動物体である人物が写っている領域と重複していないか、あるいはわずかに重複しているのみである。そこで、例えば閾値Dthを25%とすると、部分領域601、603、604、605、609及び610についての重複率が閾値Dth未満となり、補正係数が1未満となる。これにより、部分領域601、603、604、605、609及び610についての特徴量は小さくなるように補正され、窓103を顔写真等でないと判定することができる。
一方、
図6(e)に示すように、写真画策がされている識別領域210の部分領域601〜610のうち、部分領域604以外の部分領域は、大部分が動物体である顔写真等が写っている領域である。したがって、例えば閾値Dthが25%である場合、部分領域604についての重複率のみが閾値Dth未満となり、補正係数が1未満となるが、他の部分領域についての重複率は閾値Dth以上となり、補正係数は1となる。これにより、部分領域604以外の部分領域についての特徴量は小さくなるように補正されず、顔写真121を顔写真等であると判定することができる。
【0041】
判定手段44は、写真画策が発生したと判定すると、出力部20に写真画策が行われたことを示す信号をさせ、不図示の警報ランプの点灯、不図示のブザーの鳴動等を行わせるとともに、顔照合手段45に写真画策が発生した旨を通知する。
【0042】
顔照合手段45は、写真画策が発生していないことを条件に、顔検出手段42が抽出した顔領域画像と記憶部30の登録者データ31に記憶されているすべての登録顔画像を照合する。顔照合手段45は、顔領域画像とすべての登録顔画像との類似度をそれぞれ算出し、最も値が高い類似度が認証閾値以上である場合に、その顔領域画像に写っている顔がその登録顔画像に対応する登録者の顔であると判定する。例えば、顔照合手段45は、顔領域画像と登録顔画像のそれぞれから顔の特徴点を抽出し、対応する特徴点同士の位置関係の一致の程度を類似度として算出する。なお、類似度は、二つの顔画像について類似している度合いを表すものであればどのようなものでもよい。顔照合手段45は、登録者の顔であると判定すると、出力部20に認証成功を示す信号を出力し、電気錠制御装置3に対して解錠制御を行う信号を出力させる。
【0043】
以下、
図7に示したフローチャートを参照しつつ、本発明を適用した顔画像認証装置1による認証処理の動作を説明する。なお、以下に説明する動作のフローは、画像処理部40を構成するマイクロプロセッサ上で動作し、顔画像認証装置1全体を制御する制御部(図示せず)により制御される。なお、以下に説明する動作は、入力画像を一つ取得するごとに実行される。
【0044】
最初に、顔画像認証装置1の画像取得部10は、撮像装置2が撮影領域を撮影した入力画像を取得する(ステップS101)。画像取得部10が入力画像を取得すると、動物体領域抽出手段41は、取得された入力画像から動物体領域を抽出する処理を行う(ステップS102)。動物体領域抽出手段41は、動物体領域が抽出されたか否かを判定し(ステップS103)、動物体領域が全く抽出されなかった場合、ステップS101へ処理を移行し、動物体領域が抽出されるまでステップS101〜S103の処理を繰り返す。
一方、ステップS103において、一つ以上の動物体領域を抽出した場合、動物体領域抽出手段41は、抽出した動物体領域についての情報(例えば、入力画像中での位置、形状等)を記憶部30に記憶する(ステップS104)。次に、顔検出手段42は、入力画像から顔領域を検出し、その顔領域を入力画像から切り出して顔領域画像を抽出する処理を行う(ステップS105)。顔検出手段42は、一つ以上の顔領域が検出されたか否か判定し(ステップS106)、顔領域が全く検出されなかった場合、ステップS101へ処理を移行し、顔領域が検出されるまでステップS101〜S106の処理を繰り返す。一方、一つ以上の顔領域が検出された場合、顔検出手段42は、ステップS107へ処理を移行させる。
【0045】
以下のステップS107〜S109の処理は、顔検出手段42が検出した各顔領域ごとに行われる。
画像処理部40は、顔領域の周囲に写真枠らしき物体が写っているか否かにより、入力画像に顔写真等が含まれるか否かを判定する不正行為判定処理を実施する(ステップS107)。不正行為判定処理の詳細については後述する。判定手段44は、不正行為判定処理において不正行為があったと判定したか否かを判定し(ステップS108)、不正行為があった場合、写真画策が行われたと判定し、写真画策が行われたことを示す信号を出力部20に出力し(ステップS109)、処理をステップS101へ戻す。写真画策が行われたことを示す信号が出力部20に出力された場合、出力部20を介して不図示の警報ランプの点灯、不図示のブザーの鳴動等が行われる。あるいは、出力部20を介して、その写真画策が行われたことを示す信号が不図示の監視センタ装置へ出力される。これにより監視センタ装置は、写真画策が行われたことを管理者に通知し、またその履歴を記録することができる。
全ての顔領域についてステップS107〜S109の処理の処理が終わり、不正行為がなかった場合、画像処理部40は、ステップS110へ処理を移行させる。
【0046】
以下のステップS110〜S112の処理は、顔検出手段42が検出した各顔領域ごとに行われる。
顔照合手段45は、顔領域画像と登録者データ31に記憶されている登録顔画像との類似度を算出し(ステップS110)、最も値が高い類似度が認証閾値以上であるか否かを判定する(ステップS111)。最も値が高い類似度が認証閾値以上である場合、その顔領域画像に写っている顔がその登録顔画像に対応する登録者の顔であると判定し、出力部20に認証成功を示す信号を出力する(ステップS112)。認証成功を示す信号が出力部20に出力された場合、出力部20から電気錠制御装置3に対して解錠制御を行う信号が出力される。一方、最も値が高い類似度が認証閾値未満である場合、顔照合手段45は、特に処理を行わない。
全ての顔領域についてステップS110〜S112の処理の処理が終わると、画像処理部40は、処理をステップS101へ戻す。
【0047】
このように、入力画像内に複数の人物の顔が写っている場合、そのうちの一つについて写真画策を検出したときは、他の人物の顔についても照合処理を行わず、電気錠を解錠しないので、セキュリティ性を高めることができる。
【0048】
図8は、画像処理部40により実行される不正行為判定処理の動作を示すフローチャートである。
図8に示す不正行為判定処理は、
図7のステップS107において実行される。
【0049】
最初に、識別領域抽出手段43は、入力画像から、顔検出手段42が検出した顔領域を含む所定領域を識別領域として抽出する(ステップS201)。
【0050】
以下のステップS202〜S206の処理は、判定手段44が有する各弱識別器に対して行われる。
判定手段44は、その弱識別器に対応する部分領域と動物体領域についての重複率を算出し(ステップS202)、算出した重複率に応じて補正係数を算出する(ステップS203)。さらに、判定手段44の各弱識別器は、その弱識別器に対応する部分領域について顔写真等に関する特徴量を算出する(ステップS204)。次に、判定手段44の各弱識別器は、ステップS204で算出した特徴量にステップS203で算出した補正係数を乗じることにより補正特徴量を算出し(ステップS205)、補正特徴量を用いて評価値を出力する(ステップS206)。
【0051】
全ての弱識別器に対してステップS202〜S206の処理が終わると、判定手段44は、各弱識別器から出力された評価値を強識別器に入力し、弱識別器から出力される各評価値の重み付け和を取得する(ステップS207)。判定手段44は、取得した重み付け和により不正行為の有無を判定する(ステップS208)。判定手段44は、重み付け和が所定の閾値Θよりも高い場合、識別領域に顔写真等が写っており、不正行為があったと判定し、重み付け和が所定の閾値Θよりも高くない場合、識別領域に顔写真等が写っておらず、不正行為がないと判定し、
図8のステップS108に処理を移行させる。
【0052】
以上説明してきたように、本発明にかかる対象検出装置は、人物を撮影した入力画像から動物体を表す動物体領域を抽出する一方で、入力画像において人物の顔を含む領域と特定の位置関係にある識別領域を抽出して、識別領域について顔写真等らしさを表す特徴量を算出する。さらに対象検出装置は、識別領域に対する識別領域と動物体領域が重複している領域の比率が低いほど、その算出した特徴量を顔写真等らしくないことを表すように補正して、補正した特徴量を用いて入力画像に顔写真が含まれるか否かを判定する。これにより、対象検出装置は、入力画像内の顔の周囲に静止物体である窓、柱、壁の模様等が写っている場合に、窓、柱、壁の模様等による直線成分を写真枠と誤って判定し、窓、柱、壁の模様等で囲われた領域を顔写真等と誤って検出することを抑制することができる。
【0053】
以上、本発明の好適な実施形態について説明してきたが、本発明はこれらの実施形態に限定されるものではない。例えば、本実施形態では、判定手段が、重複率に応じて、各弱識別器にて用いる特徴量を補正する例を示したが、判定手段は、各弱識別器が出力した評価値を補正してもよい。その場合、判定手段は、重複率が高いほど、評価値を識別領域に検出対象が含まれていることを表すように補正し、重複率が低いほど、評価値を識別領域に検出対象が含まれていないことを表すように補正する。つまり、i番目の弱識別器の出力関数h
i(x
i)は、(1)式の代わりに、次式により与えられ、
【数3】
強識別器の出力関数Hは、(2)式の代わりに、次式により与えられる。
【数4】
また、
図5に示すグラフ500のように、重複率が閾値Dth以下である場合に限り評価値を識別領域に検出対象が含まれていないことを表すよう補正してもよい。この場合も、入力画像内の顔の周囲に窓、柱、壁の模様等が写っている場合に、強識別器の出力は低減され、対象検出装置は、窓、柱、壁の模様等で囲われた領域を顔写真等と誤って検出することを抑制することができる。
【0054】
また、判定手段が特徴量及び評価値を算出する部分領域は、複数でなく一つだけであってもよい。さらに、部分領域が一つのみである場合、その部分領域は識別領域と同じ領域であってよい。その場合、判定手段は、識別領域に対する、識別領域と動物体領域が重複している領域の比率を重複率として算出し、重複率に応じて特徴量又は評価値を補正する。
【0055】
また、判定手段が用いる特徴量は、識別領域に顔写真等が写っている場合に高い値を取り、写っていない場合に低い値を取るものではなく、識別領域に顔写真等が写っている場合に低い値を取り、写っていない場合に高い値を取るものでもよい。その場合、補正係数は1以上の値とし、重複率が高いほど、補正係数を小さくして補正特徴量を小さくし、重複率が低いほど、補正係数を大きくして補正特徴量を大きくする。そして、その特徴量に対応する弱識別器の出力関数は、補正特徴量が閾値θ
iより小さい場合、1を出力し、補正特徴量が閾値θ
i以上である場合、-1を出力するようにする。例えば、顔写真内の領域と顔写真外の領域とではテクスチャ情報が異なるため、所定距離だけ離れた二つの矩形領域のそれぞれの色ヒストグラムのマッチング等により求められる類似度が、識別領域に顔写真等が写っている場合に低い値を取り、写っていない場合に高い値を取る特徴量として利用される。
【0056】
また、判定手段は、Adaboost識別器を用いて評価値を算出する代わりにサポートベクトルマシン、又は3層以上の層を持つパーセプトロン等を用いて評価値を算出してもよい。その場合、判定手段は、顔写真等が写っている複数の学習用画像と顔写真等が写っていない複数の学習用画像のそれぞれについて、設定された部分領域から顔写真等に関する特徴量を算出し、算出した特徴量を用いて事前学習を行う。この事前学習は、特定の画像から算出された特徴量が入力されたときに、特定の画像に顔写真等が写っているか否かを判別するように行われる。判定手段は、入力画像から抽出された識別領域内の部分領域から顔写真等に関する特徴量を算出する。なお、顔写真等に関する特徴量として、例えばハールライク特徴量、HOG特徴量を用いることができる。あるいはエッジ検出フィルタの出力を顔写真等に関する特徴量として用いてもよい。そして、判定手段は、算出した特徴量を重複率に応じて補正した補正特徴量をサポートベクトルマシン又はパーセプトロンに入力し、出力された評価値に基づいて入力画像内に顔写真等が含まれるか否かを判定する。
【0057】
また、識別領域抽出手段は、一つの顔領域に対して識別領域を一つだけ抽出するのではなく、複数抽出してもよい。その場合、識別領域抽出手段は、一つの顔領域に対してそれぞれサイズが異なるように複数の識別領域を抽出する。判定手段は、抽出された複数の識別領域のそれぞれについて、各弱識別器による出力結果の重み付け和を算出する。なお、この重み付け和は、正値である場合、入力画像に顔写真等が含まれることを表す度合いを示し、負値である場合、入力画像に顔写真等が含まれないことを表す度合いを示す。判定手段は、抽出された複数の識別領域のうち、算出した重み付け和の絶対値、即ち、入力画像に顔写真等が含まれるか否かを表わす度合いの大きさが最も大きくなる識別領域を用いて、入力画像に顔写真等が含まれるか否かを判定する。これにより、判定手段は、事前学習された識別器に最も適した識別領域を用いて、入力画像に顔写真等が含まれるか否かをより精度よく判定することができる。
【0058】
また、動物体領域抽出手段は、背景差分処理を用いて動物体領域を抽出するのではなく、例えば、フレーム間差分処理を用いて動物体領域を抽出してもよい。その場合、動物体領域抽出手段は、画像取得部によって連続して取得される複数の入力画像から、輝度値の時間的な変化のある領域を動物体領域として抽出する。
【0059】
また、画像処理部は、画像取得部が順次取得した入力画像において、顔検出手段が検出した顔領域について、公知のトラッキング技術を用いて追跡処理を実行し、同一人物の顔として追跡された顔領域ごとに、不正行為判定処理及び顔照合処理を実施してもよい。画像処理部は、例えば、最新の入力画像内の顔領域のそれぞれについて、その顔領域の重心位置と、直前の入力画像から抽出された顔領域の重心位置との距離を求めて、その距離が所定の閾値以下である場合に、その顔領域を同一人物によるものとして対応付ける。あるいは、オプティカルフロー、パーティクルフィルタ等の方法を用いて追跡処理を実行してもよい。
さらに、複数の顔領域が検出された場合、ある顔領域について抽出した識別領域内の部分領域と他の顔領域が重複している場合、その部分領域について重複率を算出するときはその重複している領域は動物体領域でないものとして重複率を算出してもよい。これにより、注目する人物の近傍に他の人物が写っている場合に、注目する人物について求めた識別領域について、その近傍に写っている人物によって重複率が高くなり、顔写真が写っていると誤って判定しやすくなることを抑制することができる。
【0060】
また、対象検出装置の検出対象は、顔写真等に限定されず、両手を挙げている人物、つまりホールドアップの姿勢を取っている人物としてもよい。両手を挙げている人物が写っている画像には、人物の顔の左右に写っている両腕により直線成分が生じるため、人物の顔の左右に存在する直線成分を特徴とすることにより、顔写真等と同様にして、両手を挙げている人物を検出することができる。その場合、両手を挙げている人物が写っている多数の学習用画像と両手を挙げている人物が写っていない多数の学習用画像のそれぞれから抽出した特徴量を用いた機械学習により識別器を生成しておく。判定手段は、重複率に応じて、各弱識別器についての特徴量又は評価値を補正することにより、窓、柱、壁の模様等の静止物体を人物が挙げている両手等と誤って検出することを抑制することができる。
【0061】
以上のように、当業者は、本発明の範囲内で、実施される形態に合わせて様々な変更を行うことができる。