(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0013】
以下、適宜図面を参照しながら、本発明に顔認識システム、顔認識サーバ及び顔認識方法を具体的に開示した実施形態(以下、「本実施形態」という)を詳細に説明する。但し、必要以上に詳細な説明は省略する場合がある。例えば、既によく知られた事項の詳細説明や実質的に同一の構成に対する重複説明を省略する場合がある。これは、以下の説明が不必要に冗長になるのを避け、当業者の理解を容易にするためである。なお、添付図面及び以下の説明は、当業者が本開示を十分に理解するために提供されるのであって、これらにより特許請求の範囲に記載の主題を限定することは意図されていない。
【0014】
図1は、本実施形態の顔認識システム5の内部構成の一例を詳細に示すブロック図である。
図1に示す顔認識システム5は、複数台のカメラ装置10、顔認識サーバ30及びユーザ端末60が接続された構成を有する。
【0015】
各カメラ装置10は、予め設定された店舗内等の所定の場所を撮像領域として撮像する。各カメラ装置10は、撮像された映像に現れる、この撮像領域を通過する人物の顔を含む顔画像データを取得する。各カメラ装置10は、撮像部11、顔検出部12、顔切出し部13及び通信部14を有する。なお、本実施形態のカメラ装置10は、1台であってもよいし、複数台であってもよい。
【0016】
撮像部は、CCD(電荷結合素子:Charge Couples Device)イメージセンサやCMOS(相補性金属酸化膜半導体:Complementary Metal-Oxide Semiconductor)イメージセンサ等の撮像素子を有し、予め設定された撮像領域から入射する光を受光面に結像し、その光学像を電気信号に変換する。これにより、撮像領域の映像を表す映像データのフレームが得られる。
【0017】
顔検出部12は、撮像部11によって撮像された映像に含まれる顔を検出する。この顔検出処理は、例えば目、鼻、口等の顔のパーツを検出する方法、肌色を検出する方法、頭髪を検出する方法、首や肩などの部分を検出する方法等、公知の技術を用いて、顔を検出する処理である。また、顔検出処理方法として、統計的学習に基づくパターン認識技術を用いてもよい。
【0018】
顔切出し部13は、顔検出部12によって検出された顔を含む顔画像データを、撮像部11によって撮像された映像のフレームから切り出す。切り出される顔画像データは、撮像された顔を含む程度の大きさを有する矩形の画像を含むデータである。顔検出部12及び顔切出し部13は、例えばCPU(Central Processing Unit)、MPU(Micro Processing Unit)又はDSP(Digital Signal Processor)等のプロセッサ16によって実行される機能である。プロセッサ16は、例えば内部メモリに記憶されたアプリケーションプログラムを実行することで、顔検出部12及び顔切出し部13の機能を実現する。
【0019】
通信部14は、有線若しくは無線で顔認識サーバ30と接続され、顔切出し部13によって切り出された顔画像データを顔認識サーバ30に送信する。例えばカメラ装置10がネットワークカメラである場合、通信部14はIP(Internet Protocol)ネットワークを介して顔画像データを送信可能である。
【0020】
顔認識サーバ30は、各カメラ装置10から受信した顔画像データに含まれる顔を予め登録された顔と照合して認識する。顔認識サーバ30は、通信部31、顔特徴量抽出部32、顔特徴量比較部33、撮像時刻比較部34、保存部35、事前通過比較元顔特徴量データメモリ41及び顔画像データメモリ42を有する。
【0021】
通信部31は、カメラ装置10から顔画像データを受信し、また、ユーザ端末60からの要求(例えば後述する検索要求)に応じて、当該要求に合致する検索結果(つまり、統計データ)をユーザ端末60に送信する。
【0022】
特徴量抽出部の一例としての顔特徴量抽出部32は、通信部31が受信した顔画像データから顔の特徴量(以下、単に「顔特徴量」という)を抽出する。顔特徴量抽出処理は、公知の技術を用いて、例えば眼の位置、目と鼻と口の位置関係、しわの寄り方等の特徴量を抽出する処理である。
【0023】
顔特徴量比較部33は、顔特徴量抽出部32によって抽出された顔特徴量と、事前通過比較元顔特徴量データメモリ41に登録されている顔特徴量とを比較し、これらの類似度が所定値以上に高いか否かを判別する。また、これらの類似度が所定値以上に高くない場合(つまり、類似度が所定値未満である場合)、顔特徴量比較部33は、類似度が低いと判定する。なお、類似度が高いと判定する際の所定値(第1閾値)に対し、類似度が低いと判定する際の所定値(第2閾値)は、同じ値でもよいし、第1閾値より低い値であってもよい。
【0024】
顔特徴量メモリの一例としての事前通過比較元顔特徴量データメモリ41は、カメラ装置10から送られた顔画像データから、顔特徴量抽出部32によって抽出された顔特徴量が所定の保存条件を満たす場合に、この顔特徴量を、撮像領域を通過した人物の顔を含む顔画像データの特徴量として、一定期間において保存する。このとき、顔画像データの特徴量の他、撮像時刻や撮像領域(位置)の情報も付属情報として保存される。
【0025】
なお、一定期間の開始は、カメラ装置10によって画像データが撮像された撮像時刻であり、この撮像時刻は、例えば画像データのヘッダに含まれる。また、一定期間は、撮像領域の環境に合わせて、ユーザ端末60の操作に応じて任意に設定・変更可能である。例えば撮像領域がレストラン等の店舗内である場合、一定期間は一例として2時間に設定される。また、撮像領域がオフィスビル内である場合、一定期間は一例として6〜7時間に設定される。この一定期間は、顔認識サーバ30に事前に設定されてもよいし、管理者等のユーザがユーザ端末60を操作して顔認識サーバ30に対し一定期間の値を送信することで設定されてもよい。
【0026】
顔画像データメモリ42は、事前通過比較元顔特徴量データメモリ41に登録された顔特徴量の顔画像データを、顔特徴量と同様、一定期間、顔特徴量に紐付けて保存する。ここでは、一定期間が経過し、事前通過比較元顔特徴量データメモリ41に保存された顔特徴量が消去されると、顔画像データメモリ42に保存された、顔特徴量に対応する顔画像データも同時に消去されるが、画像データを消去することなく、より長い期間(例えば1年等)保存しておいてもよい。消去することなく、画像データを相当量蓄積しておくことで、ビッグデータとして活用することも可能になる。
【0027】
撮像時刻比較部34は、顔特徴量抽出部32によって抽出された顔特徴量と、事前通過比較元顔特徴量データメモリ41に登録されている顔特徴量との類似度が所定値(第1閾値)以上に高い場合、カメラ装置10から受信した顔画像データの撮像時刻を取得する。前述したように、撮像時刻は顔画像データのヘッダ情報に記述されている。
【0028】
また、撮像時刻比較部34は、この登録された顔特徴量は、顔特徴量抽出部32によって顔特徴量が抽出された顔画像データの撮像時刻から所定時間前までに、事前通過比較元顔特徴量データメモリ41に保存されたものであるか否かを判別する。所定時間は、後述する統計処理を行う際、同一の人物を重複して計数(ダブルカウント)しないようにするために設定される時間であり、撮像領域の環境に合わせて適正な値に設定される。例えば、事前通過比較元顔特徴量データメモリ41に顔特徴量を保存可能な一定期間が24時間である場合、所定時間はそれにより短い2時間等に設定される。なお、一定期間と所定時間とが同じ期間であってもよく、この場合、所定時間より前の顔特徴量は、事前通過比較元顔特徴量データメモリ41に存在しなくなるので、撮像時刻比較部34を省くことも可能である。
【0029】
保存部35は、事前通過比較元顔特徴量データメモリ41及び顔画像データメモリ42に接続され、顔画像データの特徴量を事前通過比較元顔特徴量データメモリ41に保存し、この特徴量に対応する顔画像データを顔画像データメモリ42に保存する。なお、後述するように、顔特徴量を統計処理しない場合でも、この顔特徴量に対応する顔画像データが保存条件を満たす場合には、顔特徴量は保存される。
【0030】
顔認識サーバ30は、更に、年齢性別判定部36、統計部37、保存部38、統計データ検索部39及び年齢性別統計データメモリ43を有する。年齢性別判定部36は、顔特徴量抽出部32によって抽出された顔特徴量を基に、公知の技術を用いて年齢及び性別を推定する。推定される年齢は、ある程度の年齢幅で表現されてもよいし、代表値で表現されてもよい。
【0031】
統計処理部の一例としての統計部37は、年齢及び性別を統計の対象とする統計処理を行う。この統計処理では、例えばカメラ装置10によって撮像された映像に含まれる顔の数が年齢及び性別毎に集計され、年齢性別統計データとして登録される。統計処理は、単に年齢及び性別毎に人数(顔の数)をカウントアップする以外に、全体の人数の中に占める各年齢層の比率や男女の比率等を算出する処理等を含めてもよい。その他、統計処理は、後述する検索条件(年月日、期間、場所、年齢、性別、カメラID等)のAND条件又はOR条件に従って、検索可能なように集計し、年齢性別統計データとしてもよい。なお、年齢性別統計データは、少なくとも年齢と性別とに分類された統計データであり、それ以外の要素で細分類されてもよい。保存部38は、年齢性別統計データメモリ43に接続され、統計部37で統計処理された年齢性別統計データを年齢性別統計データメモリ43に保存する。年齢性別統計データメモリ43は、年齢性別統計データを長期間に亘って保存し、統計データを利用する際に用いられる。
【0032】
統計データ検索部39は、ユーザ端末60からの要求に従って、所定の検索条件で年齢性別統計データメモリ43を検索し、この検索結果をユーザ端末60に返信する。
【0033】
ユーザ端末60は、顔認識サーバ30に対し、各種の設定や要求を行う汎用のコンピュータ装置であり、通信部61、制御部62、ディスプレイ63及び操作部64を有する。通信部61は、顔認識サーバ30と有線又は無線で接続され、通信可能である。例えば、通信部61は顔認識サーバ30とIPネットワークを介して接続される。
【0034】
制御部62は、ユーザ端末60の動作を統括的に制御し、アプリケーションを実行し、顔認識サーバ30に対して、ユーザの入力操作に応じた検索処理を要求する。ディスプレイ63は各種の情報を表示し、後述する検索条件や検索結果等をUI画面に表示する。操作部64は、キーボードやマウス等であり、検索条件等、ユーザからの入力操作を受け付ける。
【0035】
なお、ユーザ端末60が携帯可能なタブレット端末で構成される場合、操作部64はディスプレイ63とともにタッチパネルとして一体化されており、ディスプレイ63の画面に直接入力操作可能である。
【0036】
上記構成を有する顔認識システム5の動作を示す。
【0037】
図2は、本実施形態の顔認識サーバ30における顔検出処理の動作手順の一例を説明するフローチャートである。顔認識サーバ30内の通信部31は、カメラ装置10から送られた顔画像データを受信する(S1)。
【0038】
顔特徴量抽出部32は、受信した顔画像データから顔特徴量を抽出する(S2)。顔特徴量として、例えば眼の位置、目と鼻と口の位置関係、しわの寄り方等の特徴量が抽出される。顔特徴量比較部33は、顔特徴量抽出部32によって抽出された顔特徴量と、事前通過比較元顔特徴量データメモリ41に登録されている顔特徴量とを比較し(S3)、これらの類似度が所定値(第1閾値)以上に高いか否かを判別する(S4)。
【0039】
類似度が所定値以上に高くない場合(つまり、類似度が低いと判断された場合)、保存部35は、顔特徴量抽出部32によって抽出された顔特徴量を事前通過比較元顔特徴量データメモリ41に保存する(S7)。年齢性別判定部36は、顔特徴量抽出部32によって抽出された顔特徴量を基に、公知の技術を用いて年齢及び性別を推定し、統計部37は、推定された、年齢及び性別を統計の対象とする統計処理を行う(S8)。この統計処理は、抽出された顔特徴量から推定される、人物の年齢及び性別毎に区分された年齢性別統計データのデータ数を値1増加(カウントアップ)させるように計数する。
【0040】
保存部38は、統計部37によって統計処理された年齢性別統計データを年齢性別統計データメモリ43に保存する(S9)。
【0041】
一方、ステップS4で類似度が所定値(第1閾値)以上に高いと判断された場合、撮像時刻比較部34は、顔特徴量抽出部32によって顔特徴量が抽出された顔画像データの撮像時刻と、事前通過比較元顔特徴量データメモリ41に登録された顔特徴量の撮像時刻とを比較し(S5)、事前通過比較元顔特徴量データメモリ41に保存された類似度の高い特徴量が、顔特徴量抽出部32によって顔特徴量が抽出された顔画像データの撮像時刻から所定時間前まで(所定時間の範囲内)に保存されたか否かを判別する(S6)。
【0042】
所定時間の範囲外である場合(S6,NO)、新たな顔画像データの顔特徴量であるとして、統計部37は、ステップS8において、前述した統計処理を行う。一方、ステップS6で所定時間の範囲内であると判断された場合(S6,YES)、統計部37は、抽出された顔特徴量が既に保存済みであると判断する。そして、統計部37は、この顔特徴量の顔画像データが保存条件を満たすか否かを判別する(S10)。保存条件を満たさない場合(S10,NO)、顔認識サーバ30は、この顔特徴量を事前通過比較元顔特徴量データメモリ41に保存することなく廃棄する(S11)。一方、顔画像データが保存条件を満たす場合(S10,YES)、保存部35は、この顔特徴量を事前通過比較元顔特徴量データメモリ41に保存する(S12)。
【0043】
ここで、保存条件として、例えば最初の画像のみ保存することが設定されている場合、ステップS10で判断される顔画像データは最初の画像ではないので、これに対応する顔特徴量は保存されず、廃棄されることになる。また、顔画像データに含まれる顔の向きが正面で、かつ、顔が大きく映っていることが保存条件である場合、顔画像データがこの保存条件に該当しないと、これに対応する顔特徴量は廃棄される。また、全て保存することが保存条件である場合、画像データにかかわらず、顔特徴量は全て保存される。なお、この保存条件は、保存部35に事前に設定される他、動作の途中でユーザ端末60からの設定情報によって変更されてもよい。
【0044】
上記ステップS1〜S12までの処理で、年齢性別統計データ及び顔特徴量の保存が完了すると、統計データ検索部39は、ユーザ端末60からの要求を受け付け、この要求に従って、年齢性別統計データメモリ43に登録されている年齢性別統計データを検索し、該当する年齢性別統計データをユーザ端末60に返信する(S13)。この後、顔認識サーバ30は本動作を終了する。
【0045】
ユーザ端末60は、顔認識サーバ30に対し年齢性別統計データを検索する要求を行い、この検索結果を顔認識サーバ30から受信する。
図3はユーザ端末60のディスプレイ63に表示されるUI(ユーザインタェース)画面を示す図である。ディスプレイ63の画面の左側には、ユーザが年齢性別統計データメモリ43に登録されている年齢性別統計データを検索するための検索条件が表示されている。
【0046】
ここでは、検索条件として、撮像した年月日、時間帯(期間)、場所、年齢、性別、カメラID等のキーワードを選択可能である。ユーザは、各検索項目の入力ボックスにチェックマークを入力することで、これらの検索項目を、事前に設定されたAND条件あるいはOR条件で検索可能である。
【0047】
ユーザ端末60は、ユーザが設定した検索条件を顔認識サーバ30に送信すると、統計データ検索部39は、この検索条件に従って年齢性別統計データメモリ43に登録されている年齢性別統計データを検索する。顔認識サーバ30は、検索条件に合致する人物の顔特徴量を、年齢性別統計データメモリ43から抽出し、また、顔画像データメモリ42に登録されている、この顔特徴量に紐付けられた顔画像データを顔画像データメモリ42から抽出する。顔認識サーバ30は、抽出した顔特徴量及び顔画像データをユーザ端末60に送信する。
【0048】
この結果、ユーザ端末60のディスプレイ63の画面の右側には、検索条件に合致する人物の顔特徴量及び顔画像データが表示される。ここでは、検索結果として、3名の人物の顔特徴量TK1,TK2,TK3及び顔画像データG1,G2,G3が表示されている。
【0049】
以上により、本実施形態の顔認識システム5では、顔認識サーバ30内の顔特徴量抽出部32は、カメラ装置10によって撮像領域に対して撮像された映像に現れる顔を含む顔画像データの顔特徴量を抽出する。保存部35は、撮像領域を通過した顔を含む顔画像データの顔特徴量を事前通過比較元顔特徴量データメモリ41に保存する。統計部37は、カメラ装置10により撮像され、顔特徴量抽出部32により抽出された顔画像データの顔特徴量に対し、所定値以上に類似度の高い顔特徴量が、カメラ装置10による撮像時刻より所定時間前までに事前通過比較元顔特徴量データメモリ41に保存されていない場合、顔特徴量抽出部32により抽出された顔画像データの顔特徴量を統計処理する。
【0050】
これにより、顔認識サーバ30は、撮像時刻に近い時刻に保存された類似度の高い顔特徴量を同一の人物のものと判断し、この撮像時刻に得られた顔特徴量は統計処理されないので、複雑な判断を行うことなく同一の人物が重複して含まれないように効率的に統計処理できる。また、顔認識システム5では、カメラ装置10で映像フレームから切り出された顔画像データが顔認識サーバ30に伝送されるので、映像データを伝送する場合と比べ、データ伝送量を少なくすることができる。
【0051】
また、類似度の高い顔特徴量が所定時間前までに事前通過比較元顔特徴量データメモリ41に保存されている場合、カメラ装置10によって撮像された顔画像データが所定の保存条件を満たしていないと、保存部35は、顔特徴量抽出部32によって抽出された顔画像データの顔特徴量を破棄する。これにより、不要な顔特徴量を省き、保存されるデータ量を削減できる。
【0052】
また、カメラ装置10によって撮像された顔画像データが所定の保存条件を満たしていると、顔特徴量抽出部32によって抽出された顔画像データの顔特徴量を事前通過比較元顔特徴量データメモリ41に保存する。これにより、有効な顔特徴量のデータが増え、顔特徴量の類似度の判定精度が向上する。
【0053】
また、統計部37は、カメラ装置10により撮像され、顔特徴量抽出部32により抽出された顔画像データの顔特徴量に対し、所定値(第2閾値)に達しない類似度の低い顔特徴量が、事前通過比較元顔特徴量データメモリ41に保存されている場合、顔特徴量抽出部32により抽出された顔像データの顔特徴量を統計処理する。これにより、初めての人物の顔を見逃すことなく、統計処理できる。
【0054】
また、所定時間は、レストランやビル内等、撮像領域の環境に合わせて設定可能である。これにより、撮像領域の環境によらず、同一の人物が重複して含まれないように統計処理できる。
【0055】
また、顔認識サーバ30は、ユーザ端末60(端末装置)からの要求に応じて、年齢性別統計データメモリ43に登録された年齢性別統計データ(統計処理された顔画像データの特徴量)を検索し、この検索結果をユーザ端末60に返信する。これにより、ユーザの利用に貢献でき、様々な活用が期待される。
【0056】
(本実施形態の変形例)
図4は、本実施形態の変形例の顔認識システム5Aの内部構成の一例を詳細に示すブロック図である。本実施形態と同一の構成要素については同一の符号を付すことで、その説明を省略する。本実施形態の変形例の顔認識システム5Aでは、カメラ装置10Aは、上記した本記実施形態と異なり、撮像部11及び通信部14だけを有し、撮像部11で撮像された画像データを、通信部14によりそのまま顔認識サーバ30Aに送信するだけである。
【0057】
顔認識サーバ30Aは、上記本実施形態と異なり、プロセッサ40内に顔検出部52及び顔切出し部53を有する。顔検出部52は、カメラ装置10Aから送信された画像データ(映像)に対し、上記本実施形態の顔検出部12と同様、映像に含まれる顔を検出する。顔切出し部53は、上記本実施形態の顔切出し部13と同様、顔検出部52によって検出された顔を含む顔画像データを映像のフレームから切り出す。
【0058】
このように、本実施形態の変形例の顔認識システム5Aでは、顔認識サーバ30Aに負荷のかかる処理を効率的に集中させるので、カメラ装置10Aの負荷を軽減できる。このように、カメラ装置10Aは、撮像した画像データ(映像)を顔認識サーバ30に送信するだけであるので、簡易な構成で済み、例えば撮像領域にカメラ装置10Aが既設であっても利用可能である。また、本実施形態の変形例の顔認識システム5Aでは、カメラ装置10Aは汎用のネットワークカメラでも利用可能である。
【0059】
以上、図面を参照しながら各種の実施形態について説明したが、本発明はかかる例に限定されないことは言うまでもない。当業者であれば、特許請求の範囲に記載された範疇内において、各種の変更例又は修正例に想到し得ることは明らかであり、それらについても当然に本発明の技術的範囲に属するものと了解される。