【文献】
井尻 善久、外3名,“サーベイ論文 : 視野を共有しない複数カメラ間での人物照合”,電子情報通信学会技術研究報告 Vol.111 No.317 IEICE Technical Report,日本,社団法人電子情報通信学会,2011年11月17日,Vol.111, No.317,pp.117-124
(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0019】
以下、本発明の実施の形態(以下実施形態という)である人物同定・検索システムについて、図面に基づいて説明する。当該人物同定・検索システムは人物を対象物体とし、画像内の注目物体像である人物像により2つの画像に写る人物が同一であるか照合する機能を有する。人物同定・検索システムは、人物情報生成装置1と人物同定装置2とから構成される。人物情報生成装置1は複数の監視カメラそれぞれによって異なる撮像領域を撮影した複数フレームの画像(時系列画像)から、各撮像領域に現れた人物の画像情報(人物情報)を人物ごとに生成する。この人物情報には背景から分離された人物像が含まれる。人物同定装置2は、人物情報生成装置1が生成した人物情報の間で人物像の照合を行って同一人物の人物情報を検出する。人物同定・検索システムは、この人物像の照合によって、複数の撮像領域に亘って移動する人物の横断的検索を可能にする。以下、人物情報生成装置1及び人物同定装置2をそれぞれ説明する。
【0020】
[人物情報生成装置1の構成]
図1は人物情報生成装置1の概略の構成を示すブロック図である。人物情報生成装置1は入力部10、信号処理部11及び記憶部12から構成される。
【0021】
入力部10は時系列画像を出力する複数の監視カメラ、又は各監視カメラにより撮影済みの時系列画像を記録したDVR(Digital Video Recorder)などの映像記録装置であり、信号処理部11に接続される。
【0022】
信号処理部11はCPU(Central
Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置を用いて構成され、入力部10及び記憶部12に接続される。信号処理部11は記憶部12からプログラムを読み出して実行し、人物追跡部110、人物特徴抽出部111、類似姿勢画像グループ生成部112及び人物情報生成部113等として機能する。
【0023】
人物追跡部110は入力部10から監視カメラごとの時系列画像を取得し、人物追跡処理により当該時系列画像上に現れた各人物の人物像の時系列(時系列人物像)を生成し、人物特徴抽出部111に出力する。具体的には、人物追跡部110は背景差分処理等により時系列画像の各フレームから人物像を抽出し、パターンマッチング等によりフレーム間で同一人物の人物像を対応付けることで時系列人物像を生成する。なお、各人物像のデータの受け渡しは、当該人物像が存在するフレームを識別するフレーム番号と、当該フレームにおける人物の領域を表現する2値のマスク画像を受け渡すことで行う。
【0024】
人物特徴抽出部111は人物追跡部110が生成した各人物像からアピアランス特徴量と形状特徴量とを抽出して、抽出した特徴量を類似姿勢画像グループ生成部112と人物情報生成部113に出力する。
【0025】
アピアランス特徴量は人物の見かけの特徴量であり、具体的には人物像の輝度特徴量である。人物特徴抽出部111はアピアランス特徴量として各人物像のRGBカラーヒストグラムを抽出する。これは人物を服や肌などの色により特徴付ける色特徴量である。RGBカラーヒストグラムに代えてHSVカラーヒストグラムを抽出してもよい。または、人物特徴抽出部111はアピアランス特徴量として各人物像の輝度勾配ヒストグラムを抽出する。これは人物を服の模様などにより特徴付けるテクスチャ特徴量である。アピアランス特徴量として各人物像の色特徴量とテクスチャ特徴量の両方を抽出することもできるし、その他の各種の輝度特徴量を加えることもできる。
【0026】
形状特徴量は人物の姿勢や向きを特徴付ける特徴量であり、例えばシェイプコンテキスト(ShapeContext)又はエッジ方向ヒストグラムを用いることができる。
【0027】
類似姿勢画像グループ生成部112は人物追跡部110で生成した各時系列人物像を人物特徴抽出部111で抽出した形状特徴量が類似する人物像同士からなる類似姿勢画像グループに分けて、グループ生成の結果を人物情報生成部113に出力する。
【0028】
まず、類似姿勢画像グループ生成部112は、各時系列人物像においてフレーム間で人物像の形状特徴量の類似度を求める。形状特徴量の類似度は動的計画(Dynamic Programming)法などのマッチング手法を用いて求めることができる。次に、類似姿勢画像グループ生成部112は、求めた類似度に平均シフト(MeanShift)法やクイックシフト(QuickShift)法等の既存のクラスタリング手法を適用して、各時系列人物像の人物像をクラスタリングすることにより類似姿勢画像グループを生成する。
【0029】
人物情報生成部113は、類似姿勢画像グループ生成部112で生成した類似姿勢画像グループごとに当該グループを構成する人物像のアピアランス特徴量を代表する代表アピアランス特徴量を算出し、またマスク画像とフレーム番号と時系列画像を基に人物像を切り出し、時系列人物像ごとに人物IDと各類似姿勢画像グループのフレーム番号リストとフレーム番号ごとの人物像及び形状特徴量と各類似姿勢画像グループの代表アピアランス特徴量とを対応付けた人物情報120を記憶部12に記憶させる。
【0030】
人物情報生成部113は各類似姿勢画像グループの人物像のアピアランス特徴量を平均して代表アピアランス特徴量を算出する。平均に用いる人物像は全部としてもよいが、平均値に近い規定数の人物像を用いてもよい。これに代えて各類似姿勢画像グループの人物像のアピアランス特徴量の平均値に最も近いアピアランス特徴量を代表アピアランス特徴量とすることもでき、または、類似姿勢画像グループ生成部112でのクラスタリング結果を参照して各類似姿勢画像グループのクラスタ中心に対応するアピアランス特徴量を代表アピアランス特徴量とすることもできる。また、人物情報生成部113は形状特徴量についてもアピアランス特徴量と同様にして各類似姿勢画像グループの代表形状特徴量を生成してもよい。
【0031】
記憶部12は例えば、ハードディスクドライブ(Hard disk drive:HDD)、RAM(Random Access Memory)等の記憶装置からなり、人物情報生成部113で生成された人物情報120を格納する他、計算用の一時記憶領域(図示せず)として信号処理部11により利用される。また、記憶部12は信号処理部11で用いられる各種プログラムや各種データを記憶し、信号処理部11との間でこれらの情報を入出力する。
【0032】
[人物同定装置2の構成]
図2は人物同定装置2の概略の構成を示すブロック図である。人物同定装置2は入力部20、信号処理部21、記憶部22及び出力部23から構成される。既に述べたように人物同定装置2は、人物情報生成装置1により作成された人物情報120を用いて同一人物を見つける同定処理を行う。本実施形態では、ユーザが或る監視カメラ(以下、カメラAとする)の時系列画像に現れた人物について検索を要求し、人物同定装置2が他の監視カメラ(以下、カメラBとする)で撮影された時系列画像から当該人物を検索するものとする。
【0033】
入力部20はキーボードやマウスなどの入力装置であり、信号処理部21と接続され、ユーザが検索したい人物を選択したり、検索するカメラBを指定したりする時などに用いられる。
【0034】
信号処理部21は信号処理部11と同様、CPU等の演算装置を用いて構成され、入力部20、記憶部22及び出力部23に接続される。信号処理部21は記憶部22からプログラムを読み出して実行し、人物情報取得部210、類似姿勢画像グループ選択部211、色変換部212、人物間類似度算出部213及び照合結果生成部214等として機能する。
【0035】
人物情報取得部210は入力部20から検索要求された人物(以下、クエリ(query)人物と称する)の人物情報(人物情報220A)を記憶部22から読み込む。また、人物情報取得部210は入力部20から照合相手として監視カメラ単位で指定された複数の人物(以下、DB(database)人物と称する)の人物情報群(人物情報220B)を記憶部22から読み込む。そして、人物情報取得部210は検索対象や照合相手として指定された人物の人物情報220(220A,220B)を類似姿勢画像グループ選択部211へ出力する。
【0036】
類似姿勢画像グループ選択部211は、クエリ人物の人物情報に格納された類似姿勢画像グループと、各DB人物の人物情報に格納された類似姿勢画像グループとから、最も姿勢が類似する類似姿勢画像グループペアを選択する。類似姿勢画像グループ選択部211は選択した各類似姿勢画像グループを特定する情報を加えた人物情報を色変換部212へ出力する。
【0037】
類似姿勢画像グループペアの選択は、各類似姿勢画像グループの形状特徴量間の類似度を比較することで行う。類似姿勢画像グループ間の類似度は、人物情報生成装置1の類似姿勢画像グループ生成部112で用いた方法と同様に、動的計画法などのマッチング手法を用いて類似姿勢画像グループの形状特徴量を比較することで求めることができる。
【0038】
クエリ人物とDB人物の照合は選択したペアの人物像を照合することにより行う。このように姿勢が類似した人物像を選択して照合を行うことで、人物の姿勢や向きの違いによる照合精度の低下を抑制することができる。
【0039】
色変換部212は、クエリ人物の人物像とDB人物の人物像との間の照明条件の違いを吸収するために、類似姿勢画像グループ選択部211で選択された類似姿勢画像グループペア間で色変換処理を行う。色変換処理は、BTF(輝度変換関数:Brightness Transfer Function)により行う。
【0040】
具体的には色変換部212はクエリ人物及びDB人物の人物像それぞれの累積色ヒストグラムを算出し、累積色ヒストグラムの一方の各色成分の輝度値(色輝度値)を変換して他方の近似となるように各色輝度値を変換する。すなわち、一方の累積色ヒストグラムを色輝度値B
1に対する関数H
1(B
1)、他方の累積色ヒストグラムを色輝度値B
2に対する関数H
2(B
2)、及びBTFによる色輝度値B
1の変換をf(B
1)と表すと、色変換部212はH
1(B
1)がH
2(f(B
1))に一致するように関数fを定義する。色変換部212は各輝度値B
2についての輝度値0〜B
2までの累積頻度H
2(B
2)と、各輝度値B
1についての輝度値0〜B
1までの累積頻度H
1(B
1)を求めて、輝度値B
1のそれぞれをH
1(B
1)=H
2(B
2)を満たす輝度値B
2に置き換える変換f(B
1)を行う。この変換は色成分ごとに行う。実際には輝度値も頻度も離散的であるため一般にH
1(B
1)=H
2(B
2)を完全に満たす変換は得られず、当該色変換は一方の累積色ヒストグラムを他方の累積色ヒストグラムに近似させる変換となる。ここでは、累積ヒストグラムの曲線(折れ線)が表す変化特性を積分特性と呼び、BTFにより当該特性を近似させることを、積分特性を合わせると表現する。
【0041】
色変換部212が行う色変換は背景を除いた人物像に対して行うため、背景の色分布の違いは色変換に影響しない。また、色変換部212が行う色変換は特定人物の人物像の色特性に合わせ込む変換であり、上述のように輝度値の順序を変えない拘束条件を課した変換である。そのため、本来の色分布が異なる他人同士で積分特性を合わせようとしても拘束条件により合わせ込みきれずに色ずれが生じて両者の色分布は類似したものとならない。しかし、本来の色分布が同じである本人同士で積分特性を合わせようとすれば拘束条件があっても色ずれを生じずに合わせ込むことができ、照明条件が補正されて両者の色分布は類似したものとなる。
【0042】
その結果、本人同士の照合と他人同士の照合との差を広げることができ、照合精度を向上させることができる。
【0043】
図3はクエリ人物とDB人物とが同一人物の時の色変換の一例を示す説明図であり、
図4は両人物が他人の時の色変換の一例を示す説明図である。
【0044】
図3,
図4の上半分には人物像の画素におけるRGB各色についての輝度値の相対度数を累積した累積色ヒストグラムが示されている。左側がクエリ人物の累積色ヒストグラムであり、右側がDB人物の累積色ヒストグラムである。これらの累積色ヒストグラムは色変換前のものである。一方、
図3,
図4の下半分にはクエリ人物の色輝度値について変換を行い、クエリ人物とDB人物との積分特性を合わせた後の色ヒストグラムが示されている。左側がクエリ人物であり、右側がDB人物である。
図3,
図4の各グラフにおいて点線が赤(R)、一点鎖線が緑(G)、実線が青(B)に対応する。
【0045】
図3に示す例ではクエリ人物はDB人物と同一であるが、照明条件が相違している。具体的には、クエリ人物は照明が暗い状態で撮影され、人物像内の色の違いが比較的に不明瞭な画像となった場合を例としている。そのため、左側の累積色ヒストグラムにおける各色の積分特性の差異が右側の累積色ヒストグラムより小さくなっている。この場合に、クエリ人物についての積分特性をDB人物に合わせるように色変換を行うと、例えば、クエリ人物の各色の色ヒストグラムはピークの位置及び相対的な大きさがDB人物の色ヒストグラムと似た、つまり類似した色ヒストグラムとなる。変換された色輝度値で表されたクエリ人物の人物像においては、照明条件だけが上手く補正されて、人物像の肌や服装の色がDB人物の人物像と類似した色合いとなる。
【0046】
一方、
図4に示す例では、クエリ人物とDB人物の服装の色や肌の露出具合が異なる。そのため、例えば、積分特性の増加の速さについてRGBの順序が異なっている。この場合に、クエリ人物とDB人物とで積分特性を合わせるように色変換を行うと、クエリ人物の色ヒストグラムにおける各色のピーク同士の相対的な位置関係や相対的な強度がクエリ人物の本来の色ヒストグラムから変化する。そのため、変換後のクエリ人物の人物像は歪んだ色分布となり、また照明条件もDB人物の人物像における条件に一致しない。
【0047】
上述した色変換により、本人のときと他人のときとで色合わせの程度の差が開くため、照明条件を補正しつつ本人照合精度を向上させることができる。
【0048】
またこの色変換を複数の色成分ごとに行うことで他人のときに1つの色成分が偶然に合わせ込めても他の色成分が合わせ込み切れないなど、上記の差を維持する可能性を高めることができる。
【0049】
この色変換は特定人物の人物像に固有の色分布に都度合わせ込むため上記の差を広げることができる。
【0050】
またこの色変換は背景を除いた人物像を対象に行うため、上記の差を広げる効果を高めることができる。
【0051】
さらに、この色変換は時系列人物像の平均的な累積ヒストグラムを用いて行うため人物像の抽出誤差により多少の背景画素が混ざっていてもその影響を希釈できるので上記の差を広げる効果を高めることができる。
【0052】
またこの色変換は形状特徴量が類似する時系列人物像の平均的な累積ヒストグラムを用いて行うため姿勢や向きの変動による個人性の鈍化が抑制されて上記の差を広げる効果を高めることができる。
【0053】
なお、類似姿勢画像グループの色変換に際して、累積色ヒストグラムは、当該グループ内の全ての人物像の画素について集計して求められる。ここで、グループ内の人物像の大きさは、実世界での人物とカメラとの相対的な位置関係に応じた差異を有し得る。ヒストグラム集計に際してはこの人物像の大きさの相違に配慮することが好適である。例えば、各人物像の累積色ヒストグラムの各頻度値を当該人物像を構成する画素数で除算して正規化し、正規化した各人物像の累積色ヒストグラムを類似姿勢画像グループ内で平均した結果を色変換に用いる。
【0054】
上記色変換では人物像全体の累積色ヒストグラムからBTFを構築したが、人物像を複数の部分領域に分割し人物像相互の対応する部分領域にて累積色ヒストグラムからBTFを構築する構成とすることもできる。例えば、人物像を上半身領域と下半身領域とに分割して、上半身領域同士及び下半身領域同士でそれぞれの領域からBTFを構築することが可能である。この場合、例えば、上半身が青色で下半身が茶色の人物と、上半身が茶色で下半身が青色の人物との間で色変換を行うような場合、分割した領域ごとに構築したBTFを用いて色変換を行うことで、より本人のときと他人のときとで色合わせの程度の差を広げることが可能であり、照合精度を向上させることができる。
【0055】
人物間類似度算出部213は、色変換部212が色変換を施したクエリ人物の人物像と、各DB人物の人物像との間の類似性(人物間類似度)を算出して、DB人物ごとの人物間類似度を照合結果生成部214に出力する。
【0056】
人物間類似度はアピアランス特徴量の類似度として算出する。具体的には、人物間類似度算出部213は、類似姿勢画像グループペアの一方であるクエリ人物の類似姿勢画像グループを構成する色変換後の人物像から代表アピアランス特徴量を再抽出すると共に、類似姿勢画像グループペアの他方であるDB人物それぞれの類似姿勢画像グループを構成する物体像の代表アピアランス特徴量を人物情報220Bから読み出して、クエリ人物の代表アピアランス特徴量と各DB人物の代表アピアランス特徴量との類似度を人物間類似度として算出する。アピアランス特徴量であるRGBヒストグラムの類似度はヒストグラムインターセクションを計算することで求めることができる。RGBヒストグラムに代えてHSVヒストグラム又は輝度勾配ヒストグラムを用いる場合もこれらのヒストグラムインターセクションを計算すればよい。また、複数種類の特徴量をアピアランス特徴量として用いる場合は、各特徴量の類似度を予め定めた重みで重み付け加算して人物間類似度とすることができる。
【0057】
照合結果生成部214は、DB人物のうち人物間類似度算出部213が算出した人物間類似度が予め設定した同定閾値以上かつ最大となる者をクエリ人物と同一の人物と判定してこれらの人物の人物情報220を出力部23に出力する。一方、同定閾値以上の人物間類似度を持つDB人物が存在しない場合は該当無しと判定してその旨を出力部23に出力する。
【0058】
記憶部22は記憶部12と同様、HDD等の記憶装置からなり、人物情報220A,220Bを格納する他、計算用の一時記憶領域(図示せず)として信号処理部21により利用される。また、記憶部22は信号処理部21で用いられる各種プログラムや各種データを記憶し、信号処理部21との間でこれらの情報を入出力する。
【0059】
ここで、人物情報220Aには、人物情報生成装置1がカメラAの時系列画像から生成した複数人物の人物情報が格納され、人物情報220Bには、人物情報生成装置1がカメラBの時系列画像から生成した複数人物の人物情報が格納される。なお、本実施形態ではカメラが2台の場合で説明しているが、カメラが2台より多い場合はカメラと同じ数の人物情報220が記憶部22に格納される。
【0060】
出力部23はディスプレイなどから構成される。出力部23は信号処理部21と接続され、照合結果生成部214で生成された結果を出力する。
【0061】
なお、人物情報生成装置1及び人物同定装置2を一体の人物同定・検索システムとして構成する場合、信号処理部11及び信号処理部21は共通の演算装置で構成でき、また記憶部12及び記憶部22も共通の記憶装置で構成できる。
【0062】
[人物情報生成装置1の動作]
図5は人物情報生成装置1の動作を説明する概略のフロー図である。
【0063】
人物追跡部110は入力部10から入力された時系列画像の各画像に対し、背景差分処理を行って当該画像から背景の画素を除くことにより人物像を抽出し、そのマスク画像を生成する(ステップS10)。そして、人物追跡部110はステップS10で抽出した現フレームの人物像とその前フレームまでに抽出した人物像とのテンプレートマッチングを行って同一人物の人物像同士を対応付ける(ステップS11)。人物追跡部110は同一人物の人物像に共通の人物IDを付与し、また新規人物の人物像に新たな人物IDを付与する。人物追跡部110は現フレームのフレーム番号と現フレームで抽出した人物像のマスク画像とその人物IDを対応付けて記憶部12に追記する。
【0064】
人物特徴抽出部111は人物追跡部110がステップS10で抽出した人物像から形状特徴量を抽出し、当該人物像と対応付けて記憶部12に追記する(ステップS12)。また、人物特徴抽出部111は当該人物像から、アピアランス特徴量を抽出し、当該人物像と対応付けて記憶部12に追記する(ステップS13)。
【0065】
追跡を終了した人物が居る場合(ステップS14にてYESの場合)はステップS15に進み、そうでない場合(ステップS14でNOの場合)は新たに入力されるフレームに対してステップS10〜S13の処理を繰り返す。人物特徴抽出部111はステップS10〜S13で記録された追跡終了人物の画像情報をとりまとめて類似姿勢画像グループ生成部112と人物情報生成部113に出力する。類似姿勢画像グループ生成部112は、追跡終了人物の時系列人物像をステップS12で抽出された形状特徴量に基づいてクラスタリングして類似姿勢画像グループを生成してグループごとのフレーム番号リストを人物情報生成部113に出力する(ステップS15)。
【0066】
人物情報生成部113は、ステップS15にて生成された追跡終了人物の各類似姿勢画像グループごとに、そのグループを構成する人物像のアピアランス特徴量を平均して代表アピアランス特徴量を生成する(ステップS16)。そして、人物情報生成部113はステップS10〜S12で求められた追跡終了人物の人物ID、当該人物の時系列人物像とその各フレーム番号、及び当該各人物像の形状特徴量に、ステップS15で生成した類似姿勢画像グループの情報及びステップS16で生成した代表アピアランス特徴量を加えた、追跡終了人物の人物情報120を生成して記憶部12に格納する(ステップS17)。追跡終了人物の人物情報120を生成すると、信号処理部11は処理をステップS10へ戻し次のフレームの処理に移る。
【0067】
[人物同定装置2の動作]
図6は人物同定装置2の動作を説明する概略のフロー図である。
【0068】
ユーザは入力部20を操作して、カメラAの時系列画像に写っている人物の1人をクエリ人物として選択し(ステップS20)、また、対応付けを行いたいカメラとしてカメラBを選択する(ステップS21)。カメラBの選択は当該カメラの時系列画像に写っている全人物をDB人物として選択することに相当する。
【0069】
人物情報取得部210はステップS20で指定されたクエリ人物の人物情報220Aを記憶部22から読み込む(ステップS22)。
【0070】
続くステップS23〜S28のループ処理ではクエリ人物と全DB人物との人物間類似度を算出する。
【0071】
人物情報取得部210は、各DB人物の人物情報220Bを記憶部22から順次読み込む(ステップS23)。そして、類似姿勢画像グループ選択部211はクエリ人物の各類似姿勢画像グループの形状特徴量と、ステップS23で読み込んだDB人物の各類似姿勢画像グループの形状特徴量とを比較して、形状特徴量が最も類似する類似姿勢画像グループのペアを選出する(ステップS24)。
【0072】
色変換部212は、ステップS24で選出されたペアを構成するクエリ人物の類似姿勢画像グループ及びDB人物の類似姿勢画像グループそれぞれの累積色ヒストグラムを算出し(ステップS25)、クエリ人物の類似姿勢画像グループの累積色ヒストグラムをDB人物の類似姿勢画像グループの累積色ヒストグラムに近似させる色変換処理をクエリ人物の当該類似姿勢画像グループを構成する各人物像に対して施す(ステップS26)。
【0073】
人物間類似度算出部213は、ステップS26にて色変換したクエリ人物の類似姿勢画像グループから代表アピアランス特徴量を抽出し、当該代表アピアランス特徴量と、DB人物について選出された類似姿勢画像グループの代表アピアランス特徴量との類似度をクエリ人物とDB人物との人物間類似度として算出する(ステップS27)。
【0074】
人物間類似度算出部213は、ステップS21で指定した全DB人物に対して人物間類似度を算出したか否かを確認する(ステップS28)。全てについて算出していなければ(ステップS28でNO判定)、未算出のDB人物に対してステップS23〜S27の処理を繰り返す。一方、全DB人物について人物間類似度を算出していれば(ステップS28でYES判定)ステップS29に処理を進める。
【0075】
照合結果生成部214は、ステップS23〜S28のループ処理により各DB人物について算出した人物間類似度の中から最大の人物間類似度を選出して同定閾値と比較し、最大の人物間類似度が同定閾値以上であれば(ステップS29にてYES判定)、当該人物間類似度が算出されたDB人物をクエリ人物と同一人物であると判定してこれらの人物の人物情報を出力部23に出力する(ステップS30)。
【0076】
なお最大の人物間類似度が同定閾値未満の場合(ステップS29にてNO判定)、照合結果生成部214はクエリ人物に該当するDB人物が検出されなかった旨を出力部23に出力してステップS30を省略する。
【0077】
出力部23は照合結果生成部214から入力された同一人物の人物情報若しくは該当人物無しの情報を同定処理結果としてディスプレイ等に出力し(ステップS31)、処理を終了する。
【0078】
[変形例]
(1)ステップS26にて色変換部212がクエリ人物の画像の累積色ヒストグラムをDB人物の画像の累積色ヒストグラムに近似させる色変換の例を示したが、逆に、DB人物の画像の累積色ヒストグラムをクエリ人物の画像の累積色ヒストグラムに近似させる色変換を施してもよい。
【0079】
(2)上記実施形態では、同一の対象物体であるか否か照合される注目物体像、つまりクエリ人物の人物像及びDB人物の人物像として、それぞれ同一人物を追跡する処理で得られた複数の人物像を姿勢が類似するグループを用いて照合精度の向上を図っている。一方、同一人物を追跡する処理で得られた複数の人物像を姿勢でグループ分けせずにそのまま照合対象とする簡易な構成も可能である。また、複数フレームから得られた人物像に代えて、単一のフレームから得られた人物像を照合対象としてもよい。
【0080】
(3)上記実施形態では、色輝度値について輝度変換を行ったが、例えば、モノクロ画像においては色相に関係しない輝度値Yについて輝度変換を行ってもよい。
【0081】
(4)アピアランス特徴量は、例えば、人物領域を上半身領域及び下半身領域に分割し、それぞれの領域から求めても良い。人物領域を分割する方法は、例えば人物追跡部110で得られたマスク画像を高さ方向に2分割する方法や、マスク画像の人物領域に対応する画素の位置座標から人物の高さ方向を向く主軸を求め、主軸に沿って等間隔に分割する方法が適用可能である。例えば、マスク画像に現れる人の形をその平均座標を中心とする楕円で近似し、当該楕円の長軸を主軸とすることができる。
【0082】
この構成では、各領域の照合結果を統合判定することで照合精度を上げることができる。統合判定は例えば、分割した複数個の領域のうち一部の複数個の領域又は全てについて、アピアランス特徴量についての類似度が閾値以上であることを以て同一人物との対応付けを行うようにすることができる。