(58)【調査した分野】(Int.Cl.,DB名)
前記第2特定手段は、1つの画像に写る人物の組合せのうち、前記類似度に基づいて類似する服装を着ていると判定される人物の組合せを選択し、選択された組合せの数が一定割合以上または一定数以上である場合に、前記選択された組合せに含まれる人物それぞれから特定される第1種類情報に基づいて、前記第2種類情報を特定する
ことを特徴とする請求項3に記載の画像評価装置。
前記第2特定手段は、1つの画像に写る人物の組合せのうち、前記類似度に基づいて類似する服装を着ていると判定される人物の組合せを選択し、選択された組合せにおける前記類似度の平均値が所定の式によって算出される値を超える場合に、前記選択された組合せに含まれる人物それぞれから特定される第1種類情報に基づいて、前記第2種類情報を特定する
ことを特徴とする請求項3に記載の画像評価装置。
前記算出手段は、前記顔の領域に基づいて、検出した複数の人物のうちより前面に写っている人物を特定し、重複する前記服装の領域を、より前面に写っている人物の服装の領域とする
ことを特徴とする請求項11記載の画像評価装置。
【発明を実施するための形態】
【0013】
<発明の概要>
撮影者は、通常、1つのイベントに対し複数の画像を撮影する。そのような1つのイベントに対して撮影された複数の画像において、服装を正しく認識できた画像はそのイベントについて正しく評価できるが、服装を正しく認識できなかった画像はそのイベントについて正しく評価することが困難である。本発明は、服装を正しく認識できた画像の情報を用いることにより、服装を正しく認識できなかった画像についても、正しく評価することを可能とするものである。
<実施の形態1>
以下、本発明の一実施形態である画像評価装置100について図面を用いて説明する。
<構成>
図1は、実施の形態1における画像評価装置100の機能ブロック図である。
図1に示すように、画像評価装置100は、撮影装置120および表示装置130と接続されている。
【0014】
画像評価装置100は、撮影装置120から画像群を取得し、取得した画像群を評価し、評価結果に従って表示装置130に出力する。
【0015】
撮影装置120は、画像を撮影および撮影した画像を蓄積する。撮影装置120は、例えば、デジタルカメラなどから構成され、USB(Universal Serial Bus)ケーブルなどを介して画像評価装置100と接続される。
【0016】
表示装置130は、画像評価装置100から出力される画像などの映像を表示する。表示装置130は、例えば、デジタルテレビなどから構成され、HDMI(High Definition Multimedia Interface)ケーブルなどを介して画像評価装置100と接続される。
【0017】
次に、本実施形態における画像評価装置100の機能構成について説明する。画像評価装置100は、画像情報取得部110、画像イベント評価部107および記憶部108を備える。また、画像情報取得部110は、画像取得部101、画像グループ生成部102、顔検出部103、服装検出部104、服装特徴量抽出部105および服装認識部106を備える。
【0018】
画像取得部101は、撮影装置120が蓄積している画像群を一括して取得し、取得した画像それぞれに固有の画像IDを付与する。画像取得部101は、各画像に付された画像IDを記憶部108が保持する
図2に示す画像管理情報テーブル201に登録する。
【0019】
画像グループ生成部102は、画像取得部101で取得した画像群を、複数の画像グループに分類する。画像グループの生成方法は、例えば、同じ日に撮影された画像を1つの画像グループとし、各画像グループに固有の画像グループIDを付与する。画像グループ生成部102は撮影日時を、画像に付されているEXIF(Exchangeable Image File Format)情報から取得し、画像グループの分類に用いる。画像グループ生成部102は、上記のようにして得た撮影日時および画像グループIDを画像管理情報テーブル201に登録する。
【0020】
顔検出部103は、画像取得部101が取得した画像群の各画像から、人の顔が写る正方形領域(画像における座標)を検出し、検出した顔それぞれについて、固有の顔IDを付与する。そして、顔検出部103は、画像管理情報テーブル201および記憶部108が保持する
図3に示す人物管理情報テーブル301に、顔IDを登録する。顔領域は、例えば、あらかじめ用意された顔画像からなる顔学習辞書を用いたマッチングによって検出する。
【0021】
服装検出部104は、顔検出部103で検出した顔領域の座標を元に、その顔の人物の服装が写っている領域を検出する。服装検出部104は、顔領域の位置と大きさから顔と首と上半身の比率を算出して得られる服装領域を検出し、検出した服装領域は、顔IDに関連付けて管理する。
【0022】
図4を用いて、顔領域を用いた服装領域を算出する方法の具体例を説明する。画像401のように、顔検出部103にて検出された顔領域の大きさを縦1.0×横1.0であるとすると、服装領域は、顔領域の下端から0.2だけ下に離れた縦2.8×横2.0の領域とする。例えば、顔領域が縦100ピクセル×横100ピクセルとすると、服装領域は、顔領域から20ピクセル下に離れた縦280ピクセル×横200ピクセルの領域となる。
【0023】
服装領域は顔領域を元に自動的に算出される領域であるため、服装領域として検出される領域は、画像402のように画像からはみ出てしまう場合がある。この場合は、服装領域は、服装領域402a’のうち画像内に収まっている斜線領域のみとする。
【0024】
画像403のように服装領域が他人の顔領域と重複している場合は、服装領域は、顔領域と重複しない領域とする。また、服装領域が2つ以上重複している場合は、顔領域がより下に検出されている人物がカメラに対してより前面に写っていると見なして、より後面に写っている人物の服装領域は、より前面に写っている人物の服装領域と重複しない領域とする。これは、前面に写っている人が後面に写っている人よりも背が高ければ、後面の人は前面の人に隠れてしまい、顔領域が検出されないという仮定による。
【0025】
例えば、画像403において、検出された顔領域403aと403bのうち、顔領域403bのほうがより下に検出されている。服装領域403a'と服装領域403b'が重複している場合は、顔領域403bに対応する服装領域403b'のほうを優先的に検出する。顔領域403aに対応する服装領域は、服装領域403a'のうち服装領域403b'と重複しない格子領域を検出結果とする。
【0026】
図5に、各画像から顔検出部103で検出された顔情報および、服装検出部104で検出された服装領域の結果の例を示す。実線で囲った領域が顔領域であり、点線で囲った領域が抽出された顔領域に対応する服装領域である。
【0027】
図1に戻って、服装特徴量抽出部105は、服装検出部104において検出された服装領域の画像特徴量を抽出する。画像特徴量とは、画像中の複数の画素に係る画素値の分布の特徴を示したものである。服装領域の画像特徴量は、例えば、服装領域における色の含有割合や、隣接する画素間における輝度の変化量などが挙げられる。服装特徴量抽出部105は、抽出した服装領域の画像特徴量を人物管理情報テーブル301に登録する。
【0028】
服装認識部106は、人物管理情報301の服装の画像特徴量を元に、その服装の種類を特定する。服装の認識方法は、SVM(Support Vector Machine)法を用いてあらかじめ学習することにより、画像特徴量から服装の種類を特定できる分類器を設けておいて、各顔IDに対応する服装の種類を特定する。なお、服装認識部106が認識した服装の種類を第1種類情報とする。服装認識部106は、特定した第1種類情報を、人物管理情報テーブル301に登録する。例えば、
図3において、顔IDが2や3の人物の第1種類情報は体操服と特定されている。なお、顔IDが1の人物のように、いずれの服装の種類にも特定されない場合も起こりうる。
【0029】
画像イベント評価部107は、画像管理情報テーブル201の内容と、人物管理情報テーブル301の内容とに基づいて、画像グループのイベント評価をする。詳細な評価方法については後述する。なお、ここでは、イベント評価は、画像グループまたは画像とイベントとを対応付けることとする。
【0030】
記憶部108は、各画像IDに対応する撮影日時、画像グループIDおよび顔IDからなる画像管理情報テーブル201と、各顔IDに対応する服装の画像特徴量および第1種類情報からなる人物管理情報テーブル301と、後述する
図8、
図9、
図10に示す第3種類情報と画像数のテーブル801、服装とイベントの対応関係を示すテーブル901および画像グループのイベント評価結果を示すテーブル1001を保持する。
【0031】
画像評価装置100は、図示していないプロセッサおよびメモリを備え、プロセッサがメモリに格納されたプログラムを実行することにより各機能部を実現している。
<動作>
次に、本実施形態の動作を
図6に示すフローチャートを用いて説明する。
【0032】
まず、画像取得部101は、撮影装置120が蓄積した画像を取得し、各画像に固有の画像IDを画像管理情報テーブル201に登録する(ステップS601)。
【0033】
画像グループ生成部102は、画像取得部101が取得した画像群から画像グループを生成し、各グループに固有の画像グループIDを画像管理情報テーブル201に登録する(ステップS602)。
【0034】
顔検出部103は、各画像から人物の顔領域を検出し、各顔に固有の顔IDを画像管理情報テーブル201および人物管理情報テーブル301に登録する(ステップS603)。
【0035】
服装検出部104は、顔検出部103で検出された顔領域から各顔領域に対応する服装領域を検出する(ステップS604)。
【0036】
服装特徴量抽出部105は、服装検出部104で検出された服装領域の画像特徴量を抽出し、人物管理情報テーブル301に登録する(ステップS605)。
【0037】
服装認識部106は、人物管理情報テーブル301の服装の画像特徴量に基づいて、各人物の第1種類情報を特定し、特定結果を人物管理情報テーブル301に登録する(ステップS606)。
【0038】
画像イベント評価部107は、ステップS601〜S606の処理を実行して作成した画像管理情報テーブル201の内容および人物管理情報テーブル301の内容をもとに、複数の画像グループのイベント評価をする(ステップS607)。
図7は、画像イベント評価部107が1つの画像グループのイベント評価をする動作を示すステップS607の詳細なフローチャートである。
【0039】
画像イベント評価部107は、評価対象の画像グループから、一定人数以上の人物が写る画像群を選択する(ステップS701)。ここでは、画像イベント評価部107は、複数の人物の着ている服装からイベント評価を行うために、2人以上の人物が写っている画像を選択する。画像に写る人物の数については、画像管理情報テーブル201における顔IDのフィールドに登録されている顔IDの数から知ることができる。
【0040】
画像イベント評価部107は、ステップS701で選択された画像群の中から1つの画像を選択し、その画像を特徴付ける服装の種類(以下、第3種類情報とする)として、その画像において第1基準を満たす服装の種類を特定する(ステップS702)。例えば、第1基準は、画像に含まれる服装の数に対する同一の第1種類情報の数の割合が0.5を超えることとする。つまり、画像イベント評価部107は、画像に写る過半数の人物が着ている同一種類の服装があればその服装の種類を特定する。
【0041】
図2に示す画像管理情報テーブル201および
図3に示す人物管理情報テーブル301を用いて、ステップS702の動作の具体例を説明する。例えば、画像イベント評価部107が、本ステップで選択する画像の画像IDを1とする。このとき、画像管理情報テーブル201から、画像に含まれる人物数は、顔IDが1〜4の4人であることが分かる。また、人物管理情報テーブル301より、顔IDが2〜4の3人の人物の第1種類情報が体操服と特定され、顔IDが1の人物の服装の種類は特定されていないことがわかる。従って、画像に含まれる人物数に対する体操服を着ている人物数の割合は、3/4=0.75となる。画像に含まれる全服装数(4)に対する体操服の数(3)の割合(0.75)が0.5を超えることから、体操服は第1基準を満たす。従って、画像イベント評価部107は、画像IDが1の画像に対する第3種類情報が体操服であると特定する。
【0042】
画像イベント評価部107は、同一の第3種類情報によって特徴付けられる画像数をカウントする(ステップS703)。ここでは、画像イベント評価部107は、
図8に示す第3種類情報と画像数のテーブル801を作成し、ステップS702で特定された第3種類情報に対応する画像数のフィールドをインクリメントすることによってカウントする。
【0043】
画像イベント評価部107は、ステップS701において選択された全画像の処理が終了したかどうかを判定する(ステップS704)。YESの場合はステップS705に進み、NOの場合は、ステップS702に戻る。
【0044】
画像イベント評価部107は、画像グループを特徴づける服装の種類(以下、第2種類情報とする)として、画像グループにおいて第2基準を満たす服装の種類を特定する(ステップS705)。例えば、第2基準は、画像グループの中でステップS701において選択された画像数に対して、同一の第3種類情報で特徴付けられる画像数の割合が0.5を超えることとする。つまり、画像イベント評価部107は、画像グループ内の複数の人物が写っている画像のうち、過半数の画像において、画像に写る過半数の人物が着ている服装があればその種類を特定する。
【0045】
図8に示す、第3種類情報と画像数のテーブル801を用いてステップS705の処理の具体例を説明する。例えば、画像グループの中でステップS701において選択された画像数が50枚であるとする。このとき、体操服に関しては、画像グループの中でステップS701において選択された画像数に対する体操服の数の割合が36/50=0.72である。S701において選択された画像数(50)に対して体操服によって特徴付けられる画像数(36)の割合(0.72)が基準(0.5)を超えることから、体操服は第2基準を満たす。従って、画像イベント評価部107は、画像グループに対する第2種類情報が体操服であると特定する。
【0046】
画像イベント評価部107は、第2種類情報に応じて画像グループのイベント評価を行う(ステップS706)。具体的には、画像イベント評価部107は、記憶部108があらかじめ保持する
図9に示す服装とイベントとの対応関係を示すテーブル901から、第2種類情報と対応付けられたイベントを特定し、画像グループと特定したイベントとの対応付けを行う。また、画像グループに属するすべての画像に特定したイベントのイベントタグを付与する。
【0047】
画像評価装置100は、全ての画像グループに対して上述のイベント評価を行う。
図10に画像グループのイベント評価結果例を示す。
【0048】
最後に、画像評価装置100は、画像取得部101が取得した各画像を評価結果が分かるようにして表示装置130へ出力する。例えば、画像評価装置100は、各画像と付与されたイベントタグのイベント名とを合成して表示装置130へ出力する。
<まとめ>
本実施の形態の画像評価装置100は、2つ以上の画像からなる画像グループに対して、服装の種類ごとの画像グループにおける出現頻度に基づいて、画像グループに含まれる画像のイベント評価をする。
【0049】
本実施の形態の画像評価装置100は、上記画像グループに属する少数の画像において、複数の服装を誤認識した場合でも、画像グループに属する大半の画像において正しく服装を認識できれば、誤認識した画像も正しく評価できる。つまり、本実施の形態の画像評価装置100は、1つの画像で評価するより正確に評価を行うことが可能である。
【0050】
<実施の形態2>
実施の形態1では、服装認識部106で認識された服装情報のみに基づいて、画像のイベント評価を行っていた。実施の形態2では、実施の形態1に加えて、服装間の類似度を算出し、類似度の高い服装同士は同一の服装の種類であるという仮定のもとに、画像のイベント評価を行う方法を説明する。なお、構成とデータについて実施の形態1と同様の部分は同じ符号を付し説明を省略する。
<構成>
以下、本実施の形態の画像評価装置1100について説明する。
図11は、実施の形態2における画像評価装置1100の機能ブロック図である。画像評価装置1100は、実施の形態1の画像イベント評価部107、記憶部108、画像情報取得部110の代わりに画像イベント評価部1102、記憶部1103、画像情報取得部1110を備える。画像情報取得部1110は、画像情報取得部110の構成に加えて、類似度算出部1101を備える。
【0051】
類似度算出部1101は、人物管理情報301で管理される服装の画像特徴量に基づいて、同一画像に写る服装間の類似度を算出し、記憶部1103が保持する
図12に示す人物の服装間の類似度情報テーブル1201に登録する。類似度は、服装の画像特徴量をベクトルとして2つのベクトルのコサイン類似度を算出する。
【0052】
画像イベント評価部1102は、画像管理情報テーブル201の内容、人物管理情報テーブル301の内容および人物の服装間の類似度情報テーブル1201の内容に基づいて、画像グループのイベント評価をする。詳細な評価方法については後述する。
【0053】
記憶部1103は、画像管理情報テーブル201、人物管理情報テーブル301、第3種類情報と画像数のテーブル801、服装とイベントの対応関係を示すテーブル901および画像グループのイベント評価結果を示すテーブル1001に加えて各画像における人物の服装間の類似度情報テーブル1201を保持する。
<動作>
次に、本実施形態の動作を
図13に示すフローチャートを用いて説明する。ここで、ステップS601〜S606の処理は実施の形態1と同様であるので説明を省略する。
【0054】
類似度算出部1101は、人物管理情報テーブル301の服装の画像特徴量から、同一画像に写る服装間の類似度を算出する(ステップS1301)。
【0055】
画像イベント評価部1102は、画像管理情報テーブル201の内容、人物管理情報テーブル301の内容および人物の服装間の類似度情報テーブル1201の内容をもとに、複数の画像グループのイベント評価をする(ステップS1302)。
図14は、画像イベント評価部1102が1つの画像グループのイベント評価をする動作を示すステップS1301の詳細なフローチャートである。
【0056】
画像イベント評価部1102は、評価対象の画像グループから、一定人数以上の人物が写る画像群を選択する(ステップS701)。
【0057】
画像イベント評価部1102は、ステップS701において選択された複数の画像から画像を1つ選択し、その画像に含まれる服装のうち、類似する服装の組み合わせが第3基準を満たすかどうかを判定する(ステップS1401)。YESの場合は、ステップS1403に進み、NOの場合はステップS1402に進む。類似する服装の組み合わせとは、類似度算出部1101が算出する服装間の類似度が0.7を超える2つの服装の組み合わせのことを表す。また、第3基準は、例えば、画像に写る服装から2つの服装を選ぶ組み合わせの数のうち、類似する服装の組み合わせの数の割合が0.6を超えることとする。
【0058】
図12に示す人物の服装間の類似度情報テーブル1201を用いて、ステップS1401の処理の具体例を説明する。
図12は、画像IDが1の画像に写る人物間の服装の類似度を示している。画像に含まれる人物数は顔IDが1〜4の4人であることから画像に写る服装の組み合わせの数は、
4C
2=(4×3)/(2×1)=6組である。また、類似度情報テーブル1201から類似する服装の組み合わせの数は、基準0.7を超える類似度を有する顔IDの組合せが(2,3)、(2,4)、(3,4)の計3組である。従って、画像に含まれる服装のうち、類似する服装の数の割合は3/6=0.5である。画像に写る服装から2つの服装を選ぶ組み合わせの数(6)のうち、類似する服装の組み合わせの数(3)の割合(0.5)が基準(0.6)より小さいことから、画像イベント評価部1102は、類似する服装の組み合わせは第3基準を満たさないと判定する。
【0059】
画像イベント評価部1102は、ステップS1401において選択された画像において、類似する服装の組み合わせが第4基準を満たすかどうかを判定する(ステップS1402)。Yesの場合はステップS1403に進み、Noの場合はステップS1405に進む。ここでは、第4基準は、例えば、類似する服装の組み合わせの数をNとすると、類似する服装の組み合わせにおける類似度の平均値が所定の式0.9−(0.01×N)を超えることとする。
【0060】
図12に示す人物の服装間の類似度情報テーブル1201を用いて、ステップS1402の処理の具体例を説明する。類似する服装の組み合わせは顔IDが(2,3)、(2,4)、(3,4)の3組であることから、第4基準は顔IDが3組の類似度の平均値が0.9−(0.01×3)=0.87を超えることである。また、類似する服装の組み合わせにおける類似度の平均値は、(0.93+0.98+0.91)/3=0.94である。類似する服装の組み合わせの類似度の平均値(0.94)が基準(0.87)を超えることから、画像イベント評価部1102は、類似する組み合せは第4基準を満たすと判定する。
【0061】
画像イベント評価部1102は、ステップS1401の処理で選択された画像を特徴付ける服装の種類(第3種類情報)として、第5基準を満たす服装の種類を特定する(ステップS1403)。ここで、例えば、第5基準を満たす服装の種類は、ステップS1401の処理で選択された画像における全類似する服装の組合せに含まれる服装のうち、服装認識部106において特定の種類と特定されている第1種類情報とする。ただし、第5基準を満たす第1種類情報が同時に2種類以上ある場合は、ステップS1401の処理で選択された画像における全類似する服装の組合せに含まれる服装のうち、同一の種類と特定されている数が多い第1種類情報を、第3種類情報とする。
【0062】
図12に示す人物の服装間の類似度情報テーブル1201および
図3に示す人物管理情報テーブル301を用いてステップS1403の処理の具体例を説明する。類似する服装の組合せは、顔IDの組合せが(2,3)、(2,4)、(3,4)の3組である。類似する服装の組合せに含まれる服装を着ている人物は顔IDが2、3、4の3人であることが分かる。人物管理情報テーブル301から、顔IDが2、3、4の人物の服装は服装認識部106において体操服と特定されている。従って、画像イベント評価部1102は、第3種類情報が体操服であると特定する。
【0063】
以下、画像イベント評価部1102は、実施の形態1におけるステップS703〜S706で画像イベント評価部107が行う処理と同様の処理を行うので説明を簡潔にする。
【0064】
画像イベント評価部1102は、同一の第3種類情報によって特徴付けられる画像数をカウントする(ステップS1404)。
【0065】
画像イベント評価部1102は、ステップS701において選択された全画像の処理が終了したかどうかを判定する(ステップS1405)。YESの場合はステップS1406に進み、NOの場合は、ステップS1401に戻る。
【0066】
画像イベント評価部1102は、画像グループを特徴づける服装の種類(第2種類情報)として、画像グループにおいて第6基準を満たす服装の種類を特定する(ステップS1406)。例えば、第6基準は、画像グループの中でステップS701において選択された画像数に対して、同一の第3種類情報で特徴付けられる画像数の割合が0.5を超えることとする。
【0067】
画像イベント評価部1102は、第2種類情報に応じて画像グループのイベント評価を行う(ステップS1407)。
【0068】
画像評価装置1100は、全ての画像グループに対するイベント評価を行い、画像取得部101が取得した各画像を評価結果のイベントが分かるようにして表示装置130へ出力する。
<まとめ>
実施の形態2の画像評価装置1100は、2つ以上の画像からなる画像グループに対して、画像グループに含まれる画像における服装の種類ごとの出現頻度および服装間の類似度に基づいて、画像グループに含まれる画像のイベント評価をする。
【0069】
本実施の形態の画像評価装置1100は、例えば、実際は体操服である服装が誤認識により体操服と認識されない服装について、服装の画像特徴量の類似性を用いることで体操服と特定できる可能性がある。つまり、本実施の形態の画像評価装置1100は、実施の形態1の画像評価装置100より正確な評価を行うことが可能である。
<実施の形態3>
実施の形態1では、服装認識部106で認識された服装情報のみに基づいて画像に写る人物の着ている服装を推定して、画像のイベント評価を行っている。実施の形態3では、実施の形態1に加えて、顔の特徴量に基づいたクラスタリングを利用して、複数の画像に写る同一人物を識別し、同一イベント中同一人物は同一の服装を着ているという仮定のもとに、画像のイベント評価を行う方法を説明する。なお、構成とデータについて実施の形態1と同様の部分は同様の符号を付し説明を省略する。
<構成>
以下、本発明の一実施形態である画像評価装置1500について説明する。
図15は、実施の形態3における画像評価装置1500の機能ブロック図である。画像評価装置1500は、実施の形態1の画像評価装置100と比べて、画像イベント評価部107、記憶部108、画像情報取得部110の代わりに画像イベント評価部1503、記憶部1504、画像情報取得部1510を備える。画像情報取得部1510は画像情報取得部110の構成に加えて顔特徴量抽出部1501および顔クラスタリング部1502を備える。
【0070】
顔特徴量抽出部1501は、顔検出部103で検出した顔領域から、顔の画像特徴量を抽出する。抽出した顔の特徴量は、顔領域に関連付けて管理する。
【0071】
顔クラスタリング部1502は、顔特徴量抽出部1501が抽出した顔の画像特徴量に基づいて、クラスタリングを行い、同一の画像グループ内で顔の画像特徴量が類似する顔を1つのクラスタとする。また、クラスタ毎に固有のクラスタIDを付与し、記憶部1504の保持する
図16に示す顔ごとのクラスタを示すテーブル1601に登録する。同じクラスタに分類された顔の人物は、同一人物であることが推定できる。
【0072】
画像イベント評価部1503は、画像管理情報テーブル201の内容、人物管理情報テーブル301の内容、顔ごとのクラスタを示すテーブル1601に基づいて、画像グループのイベント評価をする。詳細な評価方法については後述する。
【0073】
記憶部1504は、画像管理情報テーブル201、人物管理情報テーブル301、第3種類情報と画像数のテーブル801、服装とイベントの対応関係を示すテーブル901および画像グループのイベント評価結果を示すテーブル1001に加えて顔ごとのクラスタを示すテーブル1601および後述する
図19に示すクラスタごとの顔を示すテーブル1901と
図20に示すクラスタに属する顔と第1種類情報を示すテーブル2001とを保持する。
<動作>
次に、本実施形態の動作を
図17に示すフローチャートを用いて説明する。ここで、ステップS601〜S606の処理は実施の形態1と同様の処理であるので説明を省略する。
【0074】
顔特徴量抽出部1501は、顔検出部103で検出された各顔領域から各々の顔の画像特徴量を抽出する(ステップS1701)。
【0075】
顔クラスタリング部1502は、顔特徴量抽出部1501で抽出された顔の画像特徴量に基づいて、画像特徴量の類似する顔を1つのクラスタに分類する(ステップS1702)。顔クラスタリング部1502は、各クラスタに固有のクラスタIDを付与し、顔ごとのクラスタを示すテーブル1601に登録する。
【0076】
画像イベント評価部1503は、画像管理情報テーブル201の内容、人物管理情報テーブル301の内容、顔ごとのクラスタを示すテーブル1601の内容をもとに、複数の画像グループのイベント評価をする(ステップS1703)。
図18は、画像イベント評価部1503が1つの画像グループのイベント評価をする動作を示すステップS1703の詳細なフローチャートである。
【0077】
画像イベント評価部1503は、評価対象の画像グループから、一定人数以上の人物が写る画像群を選択する(ステップS701)。
【0078】
画像イベント評価部1503は、ステップS701において選択された複数の画像から判定対象の画像を1つ選択する(ステップS1801)。
【0079】
画像イベント評価部1503は、ステップS1801で選択された画像に含まれる顔を1つ選択する(ステップS1802)。
【0080】
画像イベント評価部1503は、ステップS1802において選択された顔が属するクラスタについて、そのクラスタに属する各顔から服装認識部106により特定された第1種類情報を抽出する(ステップS1803)。
【0081】
顔ごとのクラスタを示すテーブル1601を用いて、ステップS1803の動作を具体的に説明する。例えば、ステップS1802において選択された顔の顔IDが1であるとする。テーブル1601から、顔IDが1である人物のクラスタIDは1である。画像イベント評価部1503は、テーブル1601からクラスタIDが1であるレコードを抽出し、
図19に示すクラスタごとの顔を示すテーブル1901を作成する。テーブル1901からクラスタIDが1である人物の顔IDは1、13、17および31である。顔IDが1、13、17および31の顔から特定された第1種類情報を
図3の人物管理情報テーブル301から抽出する。
図20に抽出結果例を示す。
【0082】
画像イベント評価部1503は、ステップS1802で選択した顔の属するクラスタを特徴づける服装の種類(以下、第4種類情報とする)として、第7基準を満たす服装の種類を特定する(ステップS1804)つまり、ステップS1802で選択された顔の人物の着ている服装を特定する。ここで、第7基準を満たす服装の種類は、ステップS1803の処理で抽出された第1種類情報のうち、服装認識部106において特定の種類と特定されている第1種類情報とする。第7基準を満たす第1種類情報が同時に2種類以上ある場合は、ステップS1803の処理で抽出された第1種類情報のうち、同一の種類と特定されている数が多い第1種類情報を、ステップS1802で選択された顔の属するクラスタの第4種類情報とする。
【0083】
画像イベント評価部1503は、ステップS1801において選択された画像に写るすべての顔についてステップS1803〜S1804の処理が完了したかどうかを判定する(ステップS1805)。Yesの場合はステップS1806へ進み、NOの場合は、ステップS1802に戻る。
【0084】
画像イベント評価部1503は、ステップS1801において選択された画像を特徴付ける服装(第3種類情報)として、該画像に含まれる顔について第4種類情報から、第8基準を満たす服装の種類を特定する(ステップS1806)。ここで、第8基準は、例えば、ステップS1801で選択された画像に写る服装の数に対して、ステップS1804で特定された第4種類情報について、同一の第4種類情報の数の割合が0.5を超えることとする。
【0085】
以下、画像イベント評価部1503は、実施の形態1におけるステップS703〜S706で画像イベント評価部107が行う処理と同様の処理を行うので説明を簡潔にする。
【0086】
画像イベント評価部1503は、同一の第3種類情報によって特徴付けられる画像数をカウントする(ステップS1807)。
【0087】
画像イベント評価部1503は、ステップS701において選択された全画像の処理が終了したかどうかを判定する(ステップS1808)。YESの場合はステップS1809に進み、NOの場合は、ステップS1801に戻る。
【0088】
画像イベント評価部1503は、画像グループを特徴づける服装の種類(第2種類情報)として、画像グループにおいて第9基準を満たす服装の種類を特定する(ステップS1809)。例えば、第9基準は、画像グループの中でステップS701において選択された画像数に対して、同一の第3種類情報で特徴付けられる画像数の割合が0.5を超えることとする。
【0089】
画像イベント評価部1503は、第2種類情報に応じて画像グループのイベント評価を行う(ステップS1810)。
【0090】
画像評価装置1500は、全ての画像グループに対するイベント評価を行い、画像取得部101が取得した各画像を評価結果のイベントが分かるようにして表示装置130へ出力する。
<まとめ>
実施の形態3の画像評価装置1500は、2つ以上の画像からなる画像グループに対して、画像グループに含まれる画像における服装の種類と服装の種類ごとの画像グループにおける出現頻度および顔クラスタリング結果に基づいて、画像グループのイベント評価をする。
【0091】
本実施の形態の画像評価装置1500は、例えば、実際は体操服を着ている人物が、ある画像において体操服を着ていると認識されなかった場合でも、別の画像で体操服を着ていると認識できれば、体操服を着ていると認識できなかった画像においてもその人物の着ている服装が体操服であるとして特定できる。つまり、本実施の形態の画像評価装置1500は、実施の形態1の画像評価装置100より正確な評価を行うことが可能である。
<実施の形態4>
実施の形態1〜3では、特定の服装を着ている人物が多く写っている画像の数に基づいて、画像のイベント評価を行っている。実施の形態4では、実施の形態3における、顔クラスタリングを利用して、画像グループに登場する特定の種類の服装を着ている人物の数に基づいて、画像のイベント評価を行う方法を説明する。なお、構成とデータについて実施の形態1、3と同様の部分は同様の符号を付し説明を省略する。
<構成>
以下、本発明の一実施形態である画像評価装置2100について説明する。
図21は、実施の形態3に係る画像評価装置2100の構成を示すブロック図である。画像評価装置2100は、実施の形態3の構成の画像イベント評価部1503、記憶部1504の代わりに画像イベント評価部2101、記憶部2102を備える。
【0092】
画像イベント評価部2101は、画像管理情報テーブル201の内容、人物管理情報テーブル301の内容および顔ごとのクラスタを示すテーブル1601の内容に基づいて、画像グループのイベント評価をする。詳細な評価方法については後述する。
【0093】
記憶部2102は、画像管理情報テーブル201、人物管理情報テーブル301、服装とイベントの対応関係を示すテーブル901、画像グループのイベント評価結果を示すテーブル1001、顔ごとのクラスタを示すテーブル1601、クラスタごとの顔を示すテーブル1901、クラスタに属する顔と第1種類情報を示すテーブル2001および後述する
図24に示す第3種類情報とクラスタ数のテーブル2401を保持する。
<動作>
次に、本実施形態の動作を
図22に示すフローチャートを用いて説明する。ここで、ステップS601〜S606およびステップS1701、S1702の処理は実施の形態3と同様であるので説明を省略する。
【0094】
画像イベント評価部2101は、画像管理情報テーブル201、人物管理情報テーブル301、顔ごとのクラスタを示すテーブル1601の内容をもとに、複数の画像グループのイベント評価をする(ステップS2201)。
図23は、画像イベント評価部2101が1つの画像グループのイベント評価をする動作を示すステップS2201の詳細なフローチャートである。
【0095】
まず、画像イベント評価部2101は、評価対象の画像グループ内のクラスタを1つ選択する(ステップS2301)。
【0096】
画像イベント評価部2101は、ステップS2301において選択されたクラスタに属する各顔から服装認識部106により特定された第1種類情報を抽出する(ステップS2302)。
【0097】
画像イベント評価部2101は、ステップS2301で選択されたクラスタを特徴づける服装(以下、第3種類情報とする)として、第10基準を満たす服装の種類を特定する(ステップS2303)。ここで、第10基準を満たす服装の種類は、ステップS2302で抽出された第1種類情報のうち、服装認識部106において特定の種類と特定されている第1種類情報とする。第10基準を満たす第1種類情報が2種類以上ある場合は、ステップS2302で抽出された第1種類情報のうち、同一の種類と特定されている数が多い第1種類情報を、ステップ2301で選択されたクラスタの第3種類情報とする。
【0098】
画像イベント評価部2101は、同一の第3種類情報によって特徴付けられるクラスタ数をカウントする(ステップS2304)。つまり、画像イベント評価部2101は、各服装の種類ごとに、画像グループ内で同一の種類の服装を着ている人物数をカウントする。ここでは、画像イベント評価部2101は、
図24に示す服装ごとのクラスタ数のテーブル2401を作成し、ステップS2303で特定された第3種類情報に対応するクラスタ数のフィールドをインクリメントすることによってカウントする。
【0099】
画像イベント評価部2101は、画像グループ内の全てのクラスタについてステップS2302〜S2304の処理が完了したかどうかを判定する(ステップS2305)。Yesの場合はステップS2306に進み、Noの場合はステップS2301に戻る。
【0100】
画像イベント評価部2101は、画像グループを特徴付ける服装の種類(第2種類情報)として、画像グループにおいて第11基準を満たす服装の種類を特定する(ステップS2306)。ここでは、第11基準は、例えば、画像グループ内のクラスタ数に対して、同一の第3種類情報で特徴付けられるクラスタ数の割合が0.5を超えることとする。つまり、画像グループ内に登場する人物のうち、過半数の人物が着ている服装があればその種類を特定する。
【0101】
図24に示す、第3種類情報とクラスタ数のテーブル2401を用いてステップS2306の処理の具体例を説明する。例えば、画像グループ内のクラスタ数が10であるとする。このとき、体操服によって特徴付けられているクラスタ数は、6/10=0.6である。画像グループ内のクラスタ数(10)に対して体操服によって特徴付けられているクラスタ数(6)の割合(0.6)が基準(0.5)を超えることから、体操服は第11基準を満たす。従って、画像イベント評価部2101は、第2種類情報が体操服であると特定する。
【0102】
画像イベント評価部2101は、第2種類情報に応じて画像グループのイベント評価を行う(ステップ2307)。
【0103】
画像評価装置2100は、全ての画像グループに対するイベント評価を行い、画像取得部101が取得した各画像を評価結果のイベントが分かるようにして表示装置130へ出力する。
<まとめ>
実施の形態4の画像評価装置2100は、2つ以上の画像からなる画像グループに対して、画像グループに登場する同一の人物を同一のクラスタに分類し、特定の服装を着ている人物数に基づいて、画像グループに含まれる画像のイベント評価をする。
【0104】
実施の形態3の画像評価装置1500は、画像グループに属する画像単位で評価を行うため、特定の個人が複数の画像に登場する場合、該人物が登場する画像が増えるほど該人物が評価結果に大きな影響を及ぼす可能性がある。それに対して、本実施の形態の画像評価装置2100では、同一人物を同一のクラスタに評価し、クラスタ単位で評価を行うため、特定の個人が評価結果に大きく影響を与えることなく、画像グループのイベント評価をすることができる。
【0105】
<補足1>
上記実施形態について説明したが、本発明はこれに限られるものではない。以下、本発明の思想として含まれる各種変形例について説明する。
【0106】
(1)画像グループ生成103において、EXIF情報から取得する撮影日時に基づいてグループの生成を行っているが、グループの生成方法はこれに限られるものではない。例えば、EXIF情報などのメタデータから取得できる撮影地点に基づいて、ある地点から一定距離内で撮影された画像を1つのグループとして画像グループを生成してもよい。
【0107】
(2)服装検出部104において、顔領域がより下に検出されている人物を、カメラに対してより前面に写っている人物として検出しているが、人物の位置関係を検出する方法はこれに限るものではない。例えば、顔領域がより大きく検出されている人物を、カメラに対してより前面に写っている人物として検出してもよい。また、撮影装置120がステレオグラムなどの視差情報を含む画像を撮影および蓄積できる場合には、その視差情報に基づいて、カメラから被写体までの距離を算出し、人物の位置関係を検出してもよい。
【0108】
(3)服装認識部106において、服装の種類を特定する方法としてあらかじめSVM法によって服装の種類を特定できる分類器を設けるとしているが、これに限られるものではない。例えば、抽出された画像特徴量と各服装のテンプレートとなる画像特徴量とのマッチングによって服装の種類を特定してもよい。
【0109】
また、画像評価装置は、さらに更新情報取得部を備え、ネットワークを介してこれら分類器やテンプレートの更新情報を取得し、分類器やテンプレートを更新できるようにしてもよい。この構成により、画像評価装置は、特定可能な服装の種類を必要に応じて変更することが可能になる。また、更新情報取得部は、分類器やテンプレートの変更に合わせて服装とイベントの対応関係を示すテーブル901の更新情報も取得し、評価可能なイベントを変更できるようにしてもよい。この構成により、新たに特定可能になった服装の種類に対応するイベントに画像グループをイベント評価することが可能になる。
【0110】
(4)類似度算出部1101において、服装間の類似度として、服装の画像特徴量をベクトルとする2つのベクトル間のコサイン類似度を算出しているが、類似度はこれに限られるものではない。例えば、服装間の画像特徴量におけるピアソンの相関係数や、服装の画像特徴量をベクトルとする2つのベクトル間のユークリッド距離に1を加えたものの逆数を類似度として算出してもよい。
【0111】
(5)実施の形態1、3のステップS701、において、1人しか写っていない画像を判断の対象から除外したが、1人の人物が写っている画像も含めて選択してもよい。
【0112】
(6)類似度算出部1101で算出する類似度を用いて画像を特徴付ける服装の種類を特定する方法について、実施の形態2では、類似する服装を着ている人物の組合せの数、または、類似する服装を着ている人物の組合せにおける類似度の平均値に基づいて、画像を特徴づける服装の種類を特定している。しかしながら、類似度を用いて画像を特徴付ける服装の種類を特定する方法はこれに限られるものではない。
【0113】
例えば、類似度が所定の閾値よりも高い服装の組合せがあって、一方が服装認識部106において特定の種類の服装と特定され、他方の服装の種類が特定されていない場合において、後者の服装を前者の服装と同一の服装と見なして、服装認識部106の認識結果を補完する手法がある。本発明の一実施形態の画像評価装置は、上述の手法で補完した認識結果に基づいて、実施の形態1のように同一の服装の数が一定の基準を満たす服装を、画像を特徴付ける服装として特定してもよい。
【0114】
(7)実施の形態1〜3で、各画像を特徴付ける服装の種類について、同一の服装の種類によって特徴付けられる画像の数によって、画像グループを特徴付ける服装を特定していたが、各画像を特徴付ける服装の種類に基づいて画像グループを特徴付ける服装を特定する方法はこれに限られるものではない。例えば、各画像を画像に写る人物数によって重み付けを行い、同一の服装の種類によって特徴付けられる画像の数について、重みを付けた値を加算して評価してもよい。上記方法によれば、多くの人物が写る画像の評価が高くなるので、多くの人物の着ている服装の中で支配的な服装の種類を特定することができる。
【0115】
(8)実施の形態3では、1つの画像で出現数の多い服装の種類を、当該画像を特徴付ける服装の種類として特定していた。別の実施形態では、画像に写る人物の重要度を計算して、計算した重要度も考慮して画像を特徴付ける服装の種類を特定してもよい。人物の重要度は、例えば、各クラスタに分類される顔数に基づき、多くの画像に写っている人物の重要度を高く計算してもよいし、画像における出現位置や表示サイズに基づき、画像中央に写っている人物や大きく写っている人物の重要度を高く計算してもよい。
【0116】
各クラスタに分類される顔数を人物の重要度とする場合を例に挙げて、画像を特徴付ける服装の種類を特定する変形例について説明する。
【0117】
顔クラスタリング部1502は、ステップS1702において、クラスタリングを実施した後、各クラスタに分類される顔数と第4種類情報(クラスタを特徴付ける服装の種類)を管理する。なお、実施の形態3では、第4種類情報は、画像イベント評価部1503で特定されたが、顔クラスタリング部1502で特定されてもよい。クラスタリングの結果、例えば、クラスタ1の顔数が「6」で服装の種類が「体操服」、クラスタ2の顔数が「2」で服装の種類が「分類なし」および、クラスタ3の顔数が2で服装の種類が「分類なし」であったとする。
【0118】
画像イベント評価部1503は、ステップS1806において、ステップS1801で選択された画像に写る人物が3人でそれぞれクラスタ1、クラスタ2および、クラスタ3に分類される場合、該画像を特徴付ける服装の種類を以下に示す方法で特定する。
【0119】
まず、画像イベント評価部1503は、画像に写る人物(クラスタ)それぞれについて、クラスタ重要度を求める。クラスタ重要度は、例えば、当該クラスタの顔数であり、クラスタ1のクラスタ重要度は6、クラスタ2のクラスタ重要度は2、クラスタ3のクラスタ重要度は2である。
【0120】
次に、画像イベント評価部1503は、画像に写る服装の種類それぞれについて、画像服装重要度を計算する。画像服装重要度は、例えば、同一の服装の種類に分類されるクラスタのクラスタ重要度の累積値を正規化したものである。
【0121】
クラスタ1の服装の種類が「体操服」、クラスタ2およびクラスタ3の服装の種類が「分類なし」なので、「体操服」の画像服装重要度は6/(6+2+2)=0.6、「分類なし」の画像服装重要度は、(2+2)/(6+2+2)=0.4と計算される。
【0122】
最後に、画像イベント評価部1503は、所定の基準を満たす服装の種類(例えば、画像服装重要度が0.5を超える服装の種類など)を、画像を特徴付ける服装の種類として特定する。ここでは、「体操服」の画像服装重要度が0.6であり、0.5を超えているので、画像を特徴付ける服装の種類として「体操服」が特定される。
【0123】
また、別の変形例として、重要度の高い人物(重要人物)のみを用いて、画像を特徴付ける服装の種類を特定してもよい。ここでは、例えば、クラスタ重要度が4以上のクラスタの人物を重要人物とする。
【0124】
上記の例と同様に、クラスタ1の顔数が「6」で服装の種類が「体操服」、クラスタ2の顔数が「2」で服装の種類が「分類なし」および、クラスタ3の顔数が2で服装の種類が「分類なし」であったとすると、画像に写る重要人物はクラスタ1のみである。ここで、例えば、画像を特徴付ける服装の基準を、画像に写る重要人物における特定の服装の種類の割合が0.5を超えることとする。この場合、画像に写る重要人物における「体操服」の割合は、1/1=1となり、基準を満たすので、画像を特徴付ける服装の種類として「体操服」が特定される。
【0125】
実施の形態4において、画像グループを特徴付ける服装の種類を評価する際にもこれらの変形を適用することが可能である。すなわち、クラスタ重要度による重み付けを適用して画像グループを特徴付ける服装の種類を評価してもよいし、画像グループに出現する重要人物のみを用いて、画像グループを特徴付ける服装の種類を特定してもよい。
【0126】
これらの変形を適用すると、撮影者にとって重要と思われる人物の重要度が高く計算されるので、撮影者の意図に沿ったイベント評価が実施可能である。
【0127】
なお、画像に写る人物の重要度は、SNS(Social Networking Service)などを利用して、重要度を高くしたい個人の情報を外部から取得し、取得した情報に基づいて計算してもよい。例えば、外部から重要度を高くしたい個人の情報として顔画像データを取得した場合、顔画像データから顔特徴量を抽出し、各クラスタに分類されている人物の顔特徴量とマッチングすることによって、重要度を高くしたい人物の重要度を高く計算することが可能である。
【0128】
(9)実施の形態1〜4では、画像評価装置は、デジタルカメラ等から構成される撮影装置120から画像群を取得するとしたが、画像の取得先は画像を蓄積する機能があれば足り、例えば、ハードディスクなどの記録媒体に記録してある画像群を取得してもよい。
【0129】
(10)実施の形態1〜4では、画像取得部101は、撮影装置120が蓄積している画像群を一括して取得するとしたが、この限りではない。例えば、撮影装置120が蓄積している画像群から撮影日時などの条件を指定して該当する画像群を取得してもよい。
【0130】
(11)実施の形態1〜4では、画像評価装置は、各画像グループに対してイベント評価をし、画像取得部101が取得した各画像を評価結果のイベントが分かるようにして表示装置130に出力するとしたが、評価結果の利用法はこの限りではない。例えば、各画像の評価結果のイベントと画像ファイルの記録場所(アドレス)とを示すテーブル(データベース)を作成し、ファイルシステムにおけるインデックスとして利用してもよい。
【0131】
(12)実施の形態1〜4では、画像評価装置は、画像グループと評価結果のイベントとを1対1で対応付けていたが、複数のイベント候補と対応付けてもよい。例えば、服装とイベントの対応関係を示すテーブル901において、1つの服装に対して複数のイベント候補を対応付けておいて、第2種類情報に対応付けられた複数のイベント候補すべてと画像グループとを対応付けてもよい。
【0132】
また、第2種類情報を、例えば、第3種類情報の出現数に基づいて複数特定し、複数の第2種類情報それぞれに対応付けられたイベントと対応付けてもよい。その際、第3種類情報の出現数に応じてランキング形式で表示してもよい。
【0133】
さらに、複数の第2種類情報について、例えば、「スーツ」および「ドレス」の組合せと「パーティ」のように服装の組合せとイベントを対応付けたテーブルを用意して、第2種類情報の組合せによって画像グループのイベント評価を行ってもよい。
【0134】
(13)上述の各実施形態及び各変形例を、部分的に組み合せてもよい。
【0135】
(14)実施の形態1〜4で示した各処理を、画像評価装置のプロセッサ、及びそのプロセッサに接続された各種回路に実行させるための機械語或いは高級言語のプログラムコードからなる制御プログラムを、記録媒体に記録すること、又は各種通信路等を介して流通させ頒布することもできる。このような記録媒体には、ICカード、ハードディスク、光ディスク、フレキシブルディスク、ROM、フラッシュメモリ等がある。流通、頒布された制御プログラムはプロセッサに読み出され得るメモリ等に格納されることにより利用に供され、そのプロセッサがその制御プログラムを実行することにより各実施形態で示したような各機能が実現されるようになる。なお、プロセッサは、制御プログラムを直接実行する他、コンパイルして実行或いはインタプリタにより実行してもよい。
【0136】
(15)実施の形態1〜4にかかる各機能構成要素は、集積回路であるLSI(Large Scale Integration)として実現されてもよい。これらの構成は、個別に1チップ化されても良いし、一部又は全てを含むように1チップ化されてもよい。ここでは、LSIと表現したが、回路の集積度の違いによっては、IC(Integrated Circuit)、システムLSI、スーパーLSI、ウルトラLSIと称呼されることもある。また、集積回路化の手法は、LSIに限られるものではなく、専用回路または汎用プロセッサで集積回路化を行ってもよい。また、LSI製造後にプログラムすることが可能なFPGA(Field Programmable Gate Array)や、LSI内部の回路セルの接続や設定を再構成可能なリコンフィギュラブル・プロセッサー(Reconfigurable Processor)を用いてもよい。あるいは、これらの機能ブロックの演算は、例えば、DSP(Digital Signal Processor)やCPU(Central Processing Unit)などを用いて演算することもできる。さらに、これらの処理ステップはプログラムとして記録媒体に記録して実行することで処理することもできる。
<補足2>
本発明の取り得る実施形態とその効果について説明する。
【0137】
(A)本発明の一実施形態の画像評価装置は、画像に写る人物それぞれに対して、当該人物の着ている服装の種類を示す第1種類情報を特定する第1特定手段と、所定の画像グループに属する複数の画像から特定される第1種類情報の種類ごとの出現頻度に基づいて、前記所定の画像グループを特徴付ける服装の種類を示す第2種類情報を特定する第2特定手段と、前記第2種類情報に基づいて前記所定の画像グループに属する複数の画像が撮影されたイベントを評価する評価手段とを備える。
【0138】
(B)本発明の一実施形態の画像評価方法は、画像に写る人物それぞれに対して、当該人物の着ている服装の種類を示す第1種類情報を特定する第1特定ステップと、所定の画像グループに属する複数の画像から特定される第1種類情報の種類ごとの出現頻度に基づいて、前記所定の画像グループを特徴付ける服装の種類を示す第2種類情報を特定する第2特定ステップと、前記第2種類情報に基づいて前記所定の画像グループに属する複数の画像が撮影されたイベントを評価する評価ステップとを含む。
【0139】
(C)本発明の一実施形態のプログラムは、コンピュータに画像評価処理を実行させるためのプログラムであって、前記画像評価処理は、画像に写る人物それぞれに対して、当該人物の着ている服装の種類を示す第1種類情報を特定する第1特定ステップと、所定の画像グループに属する複数の画像から特定される第1種類情報の種類ごとの出現頻度に基づいて、前記所定の画像グループを特徴付ける服装の種類を示す第2種類情報を特定する第2特定ステップと、前記第2種類情報に基づいて前記所定の画像グループに属する複数の画像が撮影されたイベントを評価する評価ステップと含む。
【0140】
(D)本発明の一実施形態の集積回路は、画像に写る人物それぞれに対して、当該人物の着ている服装の種類を示す第1種類情報を特定する第1特定手段と、所定の画像グループに属する複数の画像から特定される第1種類情報の種類ごとの出現頻度に基づいて、前記所定の画像グループを特徴付ける服装の種類を示す第2種類情報を特定する第2特定手段と、前記第2種類情報に基づいて前記所定の画像グループに属する複数の画像が撮影されたイベントを評価する評価手段とを備える。
【0141】
上記(A)〜(D)の構成によれば、1つの画像に含まれる人物の服装が誤認識された場合でも、複数の画像における服装の出現頻度を確認するので、誤認識した画像も正しく評価できる。
【0142】
(E)上記実施形態(A)の画像評価装置は、更に、1つの画像から特定される前記第1種類情報に基づいて、当該画像を特徴付ける服装の種類を示す第3種類情報を特定する第3特定手段を備え、前記第2特定手段は、前記所定のグループに属する複数の画像ごとに特定される前記第3種類情報の種類ごとの出現数に基づいて、前記所定の画像グループに対する第2種類情報を特定するとしてもよい。
【0143】
上記構成によれば、同一の服装の種類によって特徴付けられる画像の数によって、複数の画像を特徴付ける服装の種類を特定するので、複数の画像のうち多くの画像に出現する服装の種類を特定することができる。
【0144】
(F)上記実施形態(E)の画像評価装置は、前記第3特定手段は、1つの画像から特定される前記第1種類情報のうち、出現数が一定割合以上または一定数以上である第1種類情報を、前記第3種類情報として特定するとしてもよい。
【0145】
(G)上記実施形態(E)の画像評価装置は、更に、画像に写る人物の着ている服装の画像特徴量を抽出し、前記画像特徴量に基づいて前記画像に写る人物間の服装の類似度を算出する算出手段を備え、前記第3特定手段は、1つの画像から特定される前記第1種類情報および前記類似度に基づいて、前記第3種類情報を特定するとしてもよい。
【0146】
(H)上記実施形態(G)の画像評価装置において、前記第3特定手段は、1つの画像に写る人物の組合せのうち、前記類似度に基づいて類似する服装を着ていると判定される人物の組合せを選択し、選択された組合せの数が一定割合以上または一定数以上である場合に、前記選択された組合せに含まれる人物それぞれから特定される第1種類情報に基づいて、前記第3種類情報を特定するとしてもよい。
【0147】
(I)上記実施形態(G)の画像評価装置において、前記第3特定手段は、1つの画像に写る人物の組合せのうち、前記類似度に基づいて類似する服装を着ていると判定される人物の組合せを選択し、選択された組合せにおける前記類似度の平均値が所定の式によって算出される値を超える場合に、前記選択された組合せに含まれる人物それぞれから特定される第1種類情報に基づいて、前記第3種類情報を特定する
としてもよい。
【0148】
上記(G)〜(I)の構成によれば、画像を特徴付ける服装の種類を特定するのに各服装の認識結果に加えて服装間の類似度を用いている。従って、本来は同一の服装の種類であるが、認識結果が別になる場合においても、服装間の類似度を確認することによって同一の服装の種類として認識できる可能性がある。
【0149】
(J)上記実施形態(E)の画像評価装置は、更に、画像に写る人物の顔の特徴量を抽出し、前記顔の特徴量の類似性に基づいて、前記複数の画像に写る同一人物を同一のクラスタに分類する分類手段と、各クラスタに属する人物から特定される第1種類情報に基づいて、当該クラスタを特徴付ける服装の種類を示す第4種類情報を特定する第4特定手段を備え、前記第3特定手段は、1つの画像に写る人物のクラスタから特定される前記第4種類情報に基づいて、前記第3種類情報を特定するとしてもよい。
【0150】
上記構成によれば、顔の特徴量によってクラスタリングを行い複数の画像に写る同一人物を識別する。ある人物が着ている服装の種類を1つの画像で誤認識したとしても、別の画像における同一人物の服装の認識結果から誤認識した服装の種類を補正することができる可能性がある。
【0151】
(K)上記実施形態(J)の画像評価装置において、前記分類手段は、更に、前記クラスタそれぞれの重要度を計算し、前記第3特定手段は、1つの画像に写る人物のクラスタから特定される前記第4種類情報および前記重要度に基づいて、前記第3種類情報を特定するとしてもよい。
【0152】
上記構成によれば、重要人物の服装を考慮して、画像を特徴付ける服装の種類を特定することができる。
【0153】
(L)上記実施形態(A)の画像評価装置は、更に、画像に写る人物の顔の特徴量を抽出し、前記顔の特徴量の類似性に基づいて、複数の画像に写る同一人物を同一のクラスタに分類する分類手段と、前記クラスタに属する人物から特定される第1種類情報に基づいて、当該クラスタを特徴付ける服装の種類を示す第3種類情報を特定する第3特定手段を備え、前記第2特定手段は、前記所定の画像グループにおける前記第3種類情報の出現数に基づいて、前記所定の画像グループに対する前記第2種類情報を特定するとしてもよい。
【0154】
上記構成によれば、同一の服装の種類によって特徴付けられるクラスタの数によって、複数の画像を特徴付ける服装の種類を特定するので、複数の画像に登場する人物のうち多くの人物が着ている服装の種類を特定することができる。また、多くの画像に登場する個人が大きく評価結果に影響を及ぼすことを抑制することができる。
【0155】
(M)上記実施形態(L)の画像評価装置において、前記分類手段は、更に、前記クラスタそれぞれの重要度を計算し、前記第2特定手段は、前記所定の画像グループにおける前記第3種類情報の出現数および前記重要度に基づいて、前記所定の画像グループに対する前記第2種類情報を特定するとしてもよい。
【0156】
上記構成によれば、重要人物の服装を考慮して、画像グループのイベントを評価することができる。
【0157】
(N)上記実施形態(A)の画像評価装置において、前記第1特定手段は、服装の種類を特定するための服装情報を用いて、前記第1種類情報を特定し、
更に、前記服装情報を更新する更新部を備えるとしてもよい。
【0158】
上記構成によれば、特定できる服装の種類や評価可能なイベントの種類を適宜変更することができる。
【0159】
(O)上記実施形態(A)の画像評価装置は、更に、画像に写る人物の顔の領域を検出し、前記顔の領域に基づいて服装の領域を算出する算出手段を備え、前記第1特定手段は、前記服装の領域から抽出される画像特徴量に基づいて前記第1種類情報を特定するとしてもよい。
【0160】
上記構成によれば、画像に写る人物の顔の領域が検出できれば、その人物の服装の領域を検出することができる。
【0161】
(P)上記実施形態(O)の画像評価装置において、前記算出手段は、前記顔の領域に基づいて、検出した複数の人物のうちより前面に写っている人物を特定し、重複する前記服装の領域を、より前面に写っている人物の服装の領域とするとしてもよい。
【0162】
上記構成によれば、画像において服装の検出領域の重複が発生した場合に、人物の位置関係をもとにそれぞれの服装領域を決定することができる。