(58)【調査した分野】(Int.Cl.,DB名)
請求項1または2に記載の対象画像検出デバイスとしてコンピュータを機能させるための制御プログラムであって、コンピュータを上記各手段として機能させるための制御プログラム。
【発明の概要】
【発明が解決しようとする課題】
【0007】
誤検出される対象画像については、上述のように、検出されたり検出されなかったりするので、検出情報が出力されたり、出力されなかったりする。このため、例えば、検出された対象画像の領域に、当該対象画像を検出したことを示す検出枠(検出マーク)を表示する場合、当該検出枠が表示されたり表示されなかったりして、見映えが悪い。
【0008】
本発明は、上記の問題点に鑑みてなされたものであり、その目的は、誤検出された対象画像の検出結果が出力されることを防止できる対象画像検出デバイスなどを提供することにある。
【課題を解決するための手段】
【0009】
本発明に係る対象画像検出デバイスは、撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する対象画像検出デバイスであって、上記課題を解決するために、情報を記憶する記憶部と、動画像を構成する複数の前記撮影画像を順次取得する取得手段と、該取得手段が前記撮影画像を取得すると、取得した撮影画像に含まれる対象画像を検出し、検出結果を生成して、前記記憶部に検出履歴として蓄積する検出手段と、前記記憶部の検出履歴を参照して、対象物が同じである対象画像の検出結果が直近の所定数の検出結果に含まれるかを判定し、含まれる場合に当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない判定手段とを備えることを特徴としている。
【0010】
また、本発明に係る対象画像検出デバイスの制御方法は、撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する対象画像検出デバイスの制御方法であって、上記課題を解決するために、動画像を構成する複数の前記撮影画像を順次取得する取得ステップと、該取得ステップにて取得された撮影画像に含まれる対象画像を検出し、検出結果を生成して、記憶部に検出履歴として蓄積する検出ステップと、前記記憶部の検出履歴を参照して、対象物が同じである対象画像の検出結果が直近の所定数の検出結果に含まれるかを判定し、含まれる場合に当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない判定ステップとを含むことを特徴としている。
【0011】
上記構成および方法によると、動画像を構成する複数の撮影画像が順次取得され、取得された撮影画像に含まれる対象画像が検出され、検出結果が記憶部に検出履歴として蓄積される。一般に、誤検出の対象画像は、前記撮影画像から検出されたり検出されなかったりする。そこで、本発明では、対象物が同じである対象画像の検出結果が、直近の所定数の検出結果に含まれるかを判定し、含まれる場合に適正な検出として当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しない。これにより、誤検出の対象画像の検出結果が出力されることを防止できる。
【0012】
なお、上記所定数は、1以上の整数である。また、対象画像の対象物が同じであるかの判定は、位置、大きさ、類似度などの情報の少なくとも1つに基づいて行われる。
【0013】
本発明に係る対象画像検出デバイスでは、前記判定手段は、前記検出手段が検出した対象画像と対象物が同じである対象画像を、直近の所定数の検出結果に含まれるかを判定してもよい。この場合、連続して検出される対象画像の検出結果が出力され、その他の検出結果が出力されないので、誤検出の対象画像の検出結果が出力されることを確実に防止できる。
【0014】
ところで、検出すべき対象画像であったとしても、常に連続して検出されるとは限らず、一時的に検出できない場合もある。この場合、検出枠等の検出マークが一時的に消えることになり、見映えが悪いなどの問題点が発生する。
【0015】
そこで、本発明に係る対象画像検出デバイスでは、前記判定手段は、直近の所定期間のうち、少なくとも所定数の検出結果に、対象物が同じである対象画像の検出結果が含まれるかを判定してもよい。この場合、対象画像が一時的に検出できなくても、直近の所定期間に少なくとも所定数の対象画像が検出されていれば、当該対象画像の検出結果が出力される。その結果、一時的に検出できなかったことによる問題点を解消することができる。
【0016】
本発明に係る対象画像検出デバイスでは、前記検出手段は、検出した対象画像を識別する識別情報を、前記検出結果に対応付けて前記記憶部に蓄積しており、今回検出した対象画像が、過去に検出した対象画像と対象物が同じである場合、当該過去に検出した対象画像の識別情報と同じ識別情報を、今回検出した対象画像の検出結果に対応付けて前記記憶部に蓄積しており、前記判定手段は、前記判定を、前記対象画像の識別情報を用いて行うことが好ましい。この場合、判定手段は、前記記憶部の履歴情報から、前記対象画像の識別情報のみを利用して前記判定を行うことができるので、迅速な処理および動作が可能となる。
【0017】
なお、被写体の撮影を行って、動画像を構成する複数の撮影画像を作成する撮影部と、情報を表示する表示部とを備えるデジタルカメラであって、前記撮影画像の一部であって、対象物の画像である対象画像を当該撮影画像から検出する、請求項1から4までの何れか1項に記載の対象画像検出デバイスと、前記対象画像検出デバイスからの検出結果に基づいて、前記対象画像を検出したことを示す検出マークを当該撮影画像に合成し、合成した画像を前記表示部に表示させる合成手段とを備えるデジタルカメラであれば、上述と同様の効果を奏する。なお、検出マークとしては、検出した対象画像の領域を示す検出枠等任意のマークを利用することができる。
【0018】
本発明の各態様に係る対象画像検出デバイスは、コンピュータによって実現してもよく、この場合には、コンピュータを上記対象画像検出デバイスが備える各手段として動作させることにより上記対象画像検出デバイスをコンピュータにて実現させる対象画像検出デバイスの制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【発明の効果】
【0019】
以上のように、本発明に係る対象画像検出デバイスは、対象物が同じである対象画像の検出結果が、直近の所定数の検出結果に含まれるかを判定し、含まれる場合に適正な検出として当該検出結果を出力する一方、含まれない場合に当該検出結果を出力しないので、誤検出の対象画像の検出結果が出力されることを防止できるという効果を奏する。
【発明を実施するための形態】
【0021】
〔実施の形態1〕
(デジタルカメラの概要)
本発明の一実施形態について
図1〜
図4を参照して説明する。なお、以下では、「同じ顔画像」どうしは、対象物である顔が同じである顔画像(対象画像)どうしを意味している。
【0022】
図1は、本実施形態であるデジタルカメラの概略構成を示すブロック図である。図示のように、デジタルカメラ10は、撮影部11での撮影により、動画像を構成する複数の撮影画像が順次作成され、画像処理部12にて順次画像処理されて、表示部13にてライブビュー画像として順次表示される。また、デジタルカメラ10は、ユーザが操作部14のシャッターボタン(図示せず)を押すと、画像処理部12にて画像処理された撮影画像が、画像圧縮部15にて画像圧縮された後、画像記録部16に記録される。
【0023】
(デジタルカメラの詳細)
次に、本実施形態のデジタルカメラ10の詳細について説明する。上述のように、デジタルカメラ10は、撮影部11、画像処理部12、表示部13、操作部14、画像圧縮部15、画像記録部16、および画像合成部(合成手段)17を備えている。さらに、
図1に示すように、デジタルカメラ10は、制御部(対象画像検出デバイス)20および記憶部21を備えている。
【0024】
撮影部11は、被写体の撮影を行うものであり、例えばレンズ群、絞り、撮像素子などの光学系と、アンプ、A/Dコンバータなどの回路系とを備えている。撮像素子の例としては、CCD、CMOS(Complementary Metal-oxide Semiconductor)イメージセンサなどが挙げられる。撮影部11は、上記撮影により撮影画像を生成し、撮影画像のデータに変換して画像処理部12に送信する。
【0025】
画像処理部12は、撮影部11からの撮影画像のデータに対し、マトリックス演算、γ補正、ホワイトバランスの調整などの画像処理を行うものである。また、画像処理部12は、画像処理された撮影画像のデータから、表示用、記録用、および顔検出用の撮影画像のデータを作成し、それぞれ、表示部13、画像圧縮部15、および制御部20に送信する。なお、表示用および顔検出用の撮影画像のデータは同じであってもよい。
【0026】
画像合成部17は、画像処理部12からの撮影画像に対し、制御部20からの画像(例えば、OSD(On-Screen Display)用画像)を合成するものである。画像合成部17は、合成した画像である合成画像のデータを表示部13に送信する。
【0027】
表示部13は、LCD(液晶表示素子)、有機EL(Electroluminescence)ディスプレイ、プラズマディスプレイなどの表示デバイスによって構成されている。表示部13は、画像合成部17からの合成画像のデータに基づいて、文字や画像などの各種の情報を表示出力する。
【0028】
操作部14は、ユーザの操作によりユーザから各種の入力を受け付けるものであり、入力用ボタン、タッチパネル、その他の入力デバイスによって構成されている。操作部14は、ユーザが操作した情報を操作データに変換して制御部20に送信する。なお、入力デバイスの他の例としては、キーボードと、テンキーと、マウスなどのポインティングデバイスとが挙げられる。
【0029】
画像圧縮部15は、画像処理部12からの撮影画像のデータを、JPEG(Joint Photographic Experts Group)、MPEG(Moving Picture Expert Group)などの方式に従って圧縮するものである。画像圧縮部15は、圧縮した撮影画像のデータを画像記録部16に記録する。
【0030】
画像記録部16は、情報を記録するものであり、特に画像圧縮部15が圧縮した撮影画像のデータを記録するものである。画像記録部16は、フラッシュメモリ、ハードディスクなどの不揮発性の記憶装置によって構成される。
【0031】
制御部20は、デジタルカメラ10内における各種構成の動作を統括的に制御する。制御部20は、例えばCPU(Central Processing Unit)およびメモリを含むコンピュータによって構成され、該コンピュータに制御プログラムを実行させることにより、各種構成の動作制御を行う。なお、制御部20の詳細については後述する。
【0032】
記憶部21は、フラッシュメモリ、ROM(Read Only Memory)などの不揮発性の記憶装置と、RAM(Random Access Memory)などの揮発性の記憶装置とによって構成されるものである。不揮発性の記憶装置に記憶される内容としては、上記した制御プログラム、OS(operating system)プログラム、その他の各種プログラム、各種の動作設定値などが挙げられる。一方、揮発性の記憶装置に記憶される内容としては、作業用ファイル、テンポラリファイルなどが挙げられる。なお、記憶部21の詳細については後述する。
【0033】
本実施形態では、制御部20は、画像処理部12にて処理された撮影画像を取得し、取得した撮影画像に含まれる顔画像を検出し、検出した顔画像の領域を示す検出枠(検出マーク)の画像を作成して、画像合成部17に送信するものである。これにより、画像処理部12からの撮影画像に対し、制御部20からの検出枠の画像が、画像合成部17にて合成され、合成された合成画像が表示部13を介して表示出力される。
【0034】
さらに、本実施形態では、制御部20は、今回検出した顔画像と同じ顔画像が、直近の所定数(例えば2)の撮影画像のうち、当該所定数含まれているか、すなわち今回の撮影画像を含めて(所定数+1)回連続して含まれているかを判定する。制御部20は、連続して含まれていると判定した場合、当該顔画像は、誤検出されたものではなく、適正に検出されたものであるとして、上記検出枠の画像を作成する。一方、連続して含まれてはいないと判定した場合、当該顔画像は、誤検出の可能性があるとして、上記検出枠の画像の作成を省略する。従って、本実施形態の場合、撮影画像に顔画像が検出されても、すぐには検出枠が表示されず、(所定数+1)回以上連続して検出された場合に、検出枠が表示されることになる。
【0035】
図2は、本実施形態のデジタルカメラ10により順次表示される合成画像の一例を示す図である。一方、
図10は、従来のデジタルカメラにより順次表示される合成画像の一例を比較例として示す図である。
図2および
図10の例では、犬の顔画像は、第1〜第6フレームの全ての撮影画像で検出されており、熊のヌイグルミの顔画像は、第2・第6フレームの撮影画像で誤検出されているとしている。
【0036】
従来のデジタルカメラは、撮影画像から顔画像を検出すると、当該撮影画像に対し、検出した顔画像の領域に検出枠の画像を合成して表示している。従って、
図10の(a)〜(f)に示すように、犬の顔画像に関する検出枠fdは、第1〜第6フレームの全てにおいて表示される。一方、熊のヌイグルミの顔画像に関する検出枠fbは、第2・第6フレームにおいてのみ表示されるので、検出枠が点滅することになり、見映えが悪く、表示品質が低下することなる。
【0037】
これに対し、本実施形態のデジタルカメラ10では、
図2の(a)〜(f)に示すように、犬の顔画像に関しては、第1フレームでは、1回検出したのみであるので、検出枠fdを表示せず、第2フレームでは、2回連続して検出したのみであるので、検出枠fdを表示しない。そして、第3フレーム以降では、3回以上連続して検出しているので、検出枠fdを表示する。このように、本実施形態では、適正な検出であっても、検出当初の所定数のフレームには検出枠fdが表示されないが、1フレームの期間は、1/30秒であり、ユーザにとって極めて短時間であるので、問題とはならない。
【0038】
一方、熊のヌイグルミの顔画像に関しては、第1・3・4・5フレームでは、検出していないので、検出枠fbを表示せず、第2・6フレームでは、1回検出したのみであるので、検出枠fbを表示しない。すなわち、3回以上連続して検出したフレームが存在しないので、検出枠fbが表示されない。従って、誤検出による検出枠の点滅を防止することができ、表示品質の低下を防止することができる。
【0039】
(制御部および記憶部の詳細)
次に、制御部20および記憶部21の詳細について、
図1を参照して説明する。同図には、制御部20および記憶部21において、顔画像の検出に関する構成が示されている。図示のように、制御部20は、画像取得部(取得手段)30、顔検出部(検出手段)31、適正検出判定部(判定手段)32、および検出枠生成部(合成手段)33を備える構成である。また、記憶部21は、検出履歴記憶部40、および閾値記憶部41を含む構成である。
【0040】
検出履歴記憶部40は、上記顔検出の検出結果を検出履歴として蓄積している。上記検出結果は、検出された顔画像のID(識別情報)(以下、「顔ID」と称する。)、特徴情報、サイズ、および位置情報を含んでいる。さらに、上記検出結果は、検出された顔画像の検出日時、その他の情報を含んでもよい。閾値記憶部41は、適正な検出であるかを判定するための閾値を記憶している。
【0041】
画像取得部30は、画像処理部12から撮影画像のデータを取得するものである。画像取得部30は、上記撮影画像のデータを取得すると、取得した上記撮影画像のデータを顔検出部31に送出する。
【0042】
顔検出部31は、時系列順の複数の撮影画像からなる動画像に関して、上記撮影画像から顔画像を検出する顔検出機能と、検出された顔画像を、続く撮影画像から検出することにより、上記顔画像を追跡する顔追跡機能とを有するものである。なお、顔画像の検出には、テンプレートマッチングを利用したり、肌色領域を検出したり、顔の輪郭を検出したり、顔の特徴点を検出したりするなど、公知の顔検出技術を利用することができる。
【0043】
具体的には、顔検出部31は、画像取得部30から撮影画像のデータを受け取ると、当該撮影画像から顔画像を検出する。顔検出部31は、検出した顔画像の検出結果を検出履歴として検出履歴記憶部40に蓄積すると共に、当該検出結果のうち、顔IDを適正検出判定部32に送出する。
【0044】
さらに、顔検出部31は、検出履歴記憶部40の検出履歴を参照して、直近に検出した顔画像と同じ顔画像が、今回検出した顔画像に存在するかを判定する(顔追跡)。顔検出部31は、同じ顔画像には、同じ顔IDを付与する。なお、顔検出部31が行う顔検出および顔追跡の具体的な処理は、従来と同様であるので、その説明を省略する。
【0045】
適正検出判定部32は、顔検出部31における顔画像の検出が、適正であるか否かを判定するものである。具体的には、適正検出判定部32は、検出履歴記憶部40を参照して、顔検出部31から受け取った顔IDが、直近の所定数(例えば2)のフレームの検出履歴に含まれるかを判断する。含まれる場合、適正な検出であるとして、当該顔IDを検出枠生成部33に送出する。一方、含まれない場合、適正な検出ではないとして、当該顔IDの検出枠生成部33への送出を省略する。なお、適正検出判定部32は、送出すべき顔IDが存在しない場合、検出枠生成部33に対し、何も送出しなくてもよいし、顔画像を検出しなかった(未検出)旨を通知してもよい。
【0046】
検出枠生成部33は、顔画像を検出した旨を示す検出枠の画像を生成するものである。具体的には、検出枠生成部33は、適正検出判定部32から顔IDを取得すると、取得した顔IDに対応するサイズおよび位置情報を、検出履歴記憶部40の検出履歴から検索する。次に、検出枠生成部33は、検索したサイズおよび位置情報に従って、検出枠の画像を作成し、作成した検出枠の画像のデータを画像合成部17に送信する。これにより、画像合成部17は、画像処理部12からの撮影画像に対し、検出枠生成部33からの検出枠の画像を合成し、合成した画像を、表示部13を介して表示出力することになる。
【0047】
(制御部の処理動作)
次に、上記構成の制御部20における処理動作について説明する。
図3は、制御部20が行う処理の流れを示すフローチャートである。図示のように、撮影部11にて撮影された動画像における一撮影画像を画像取得部30が取得すると、顔検出部31は、取得された撮影画像から顔画像を検出し、該検出結果を検出履歴として検出履歴記憶部40に蓄積する(S10)。次に、適正検出判定部32は、顔検出部31が検出した顔画像のうち、直近の所定数の撮影画像にも同じ顔画像を含まれているものを、適正に検出された顔画像として抽出する(S11)。
【0048】
そして、検出枠生成部33は、適正検出判定部32が抽出した顔画像に関する検出枠の画像を、検出履歴記憶部40の検出履歴を参照して作成し、画像合成部17に送信する(S12)。これにより、画像処理部12にて画像処理された撮影画像が、画像合成部17にて検出枠の画像と合成されて、表示部13にて表示されることになる。その後、制御部20の処理を終了する。
【0049】
次に、制御部20における顔検出部31および適正検出判定部32の処理動作について説明する。
図4は、顔検出部31が行う顔検出処理の流れを示すフローチャートである。なお、この顔検出処理は、検出された顔画像ごとに実行される。
【0050】
図4に示すように、顔検出部31は、撮影画像から顔画像を検出すると、検出履歴記憶部40の検出履歴を参照して、今回検出した顔画像と同じ顔画像が、直近に検出した顔画像に存在するか否かを判断する(S20)。存在する場合、該当する顔画像の顔IDを、今回検出した顔画像に付与する一方(S21)、存在しない場合、新たな顔IDを、今回検出した顔画像に付与する(S22)。次に、今回検出した顔画像の検出結果に、付与した顔IDを関連づけて、検出履歴として検出履歴記憶部40に蓄積する(S23)。その後、顔検出処理を終了する。
【0051】
〔実施例1〕
次に、適正検出判定部32における動作の一例を、
図5を参照して説明する。
図5は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。
図5の例は、
図2の例に対応するものである。
【0052】
なお、図示の例では、顔検出部31は、第1フレームにて検出し、その後追跡している犬の顔画像に対し、顔IDとしてID1を付与している。また、顔検出部31は、熊のヌイグルミの顔画像について、第2フレームにて検出した時に顔IDとしてID2を付与し、第3〜第5フレームにて検出できなかったため追跡できず、このため、第6フレームにて検出した時には、顔IDとしてID2とは別のID3を付与している。
【0053】
図5の例では、適正検出判定部32は、第1フレームでは、ID1が入力されるが、直近の2フレームが存在しないので、未検出であるとして何も出力しない。第2フレームでは、ID1・ID2が入力されるが、直近の2フレームが存在しないので、未検出であるとして何も出力しない。第3〜第5フレームでは、ID1が入力され、直近の2フレームでもID1が入力されているので、ID1を出力する。第6フレームでは、ID1・ID3が入力され、ID1は、直近の2フレームでも入力されているので出力される一方、ID3は、直近の2フレームにて入力されていないので、出力されない。
【0054】
〔実施例2〕
次に、適正検出判定部32における動作の別の例を、
図6を参照して説明する。
図6は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の1フレームでも検出されている場合、すなわち、2フレーム連続して検出されている場合に、適正に検出された顔画像としている。
【0055】
図6の例では、適正検出判定部32は、第1フレームでは、ID1が入力されるが、直近の1フレームが存在しないので、未検出であるとして何も出力しない。第2・4・6・8・10・12フレームでは、未検出であるとして何も入力されないので、未検出であるとして何も出力しない。第3・5・7・9・11・13フレームでは、それぞれ、新たなID2〜ID7が入力されるが、直近の1フレームにて入力されていないので出力せず、その結果、未検出であるとして何も出力しない。第14・第15フレームでは、ID7が入力され、直近の1フレームでもID7が入力されているので、ID7を出力する。
【0056】
従って、本実施例では、第1・3・5・7・9・11・13〜15フレームにて、顔検出部31が顔画像を検出しているが、検出枠生成部33は、2フレーム連続して同じ顔画像(ID7)が検出される第14・15フレームでのみ検出枠を生成する。これにより、検出枠は、第1〜13フレームでは表示されず、第14・第15フレームで表示されることになる。その結果、第1〜12フレームにて検出枠が点滅表示されることを防止でき、表示品質の低下を防止できる。
【0057】
〔実施の形態2〕
次に、本発明の別の実施形態について説明する。本実施形態のデジタルカメラ10は、
図1に示すデジタルカメラ10に比べて、適正検出判定部32における判定処理が異なるのみであり、その他の構成は同様である。なお、上記実施形態で説明した構成および処理動作と同様の構成および処理動作には、同一の符号を付して、その説明を省略する。
【0058】
本実施形態では、適正検出判定部32は、検出履歴記憶部40を参照して、直近の所定数(例えば4)のフレームに少なくとも所定数(例えば2)のフレームの検出履歴に含まれるかを判断する。含まれる場合、適正な検出であるとして、当該顔IDを検出枠生成部33に送出する。一方、含まれない場合、適正な検出ではないとして、当該顔IDの検出枠生成部33への送出を省略する。
【0059】
〔実施例3〕
次に、本実施形態における適正検出判定部32における動作の一例を、
図7を参照して説明する。
図7は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の4フレームのうち、少なくとも2フレームに検出されている場合、適正に検出された顔画像としている。
【0060】
図7の例では、適正検出判定部32は、第1・2フレームでは、直近の2フレームが存在しないので、未検出であるとして何も出力しない。第3・4フレームでは、直近のフレームのうち、ID1が1フレームしか入力されていないので、出力せず、その結果、未検出であるとして何も出力しない。第5〜7フレームでは、直近の4フレームのうち、ID1が2フレーム入力されているので、ID1を出力する。
【0061】
従って、本実施例では、第5フレームにて、顔検出部31が顔画像を検出していないが、直近の4フレームのうち、2フレームにて同じ顔画像(ID1)が検出しているので、検出枠生成部33は、検出枠を生成する。これにより、顔画像の検出に一時的に失敗したことにより、検出枠の表示が遅延することを防止することができる。
【0062】
〔実施例4〕
次に、本実施形態における適正検出判定部32における動作の別の例を、
図8を参照して説明する。
図8は、適正検出判定部32にて入出力されるデータの一例をフレームごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の5フレームのうち、少なくとも3フレームに検出されている場合、適正に検出された顔画像としている。
【0063】
図8の例では、適正検出判定部32は、第1・2フレームでは、直近の3フレームが存在しないので、未検出であるとして何も出力しない。第3フレームでは、直近の3フレームしか存在しないが、ID1が3フレーム入力されているので、ID1を出力する。このように、直近の5フレーム全ての検出履歴を調べる必要はない。
【0064】
なお、上記実施形態では、適正検出判定部32は、直近の数フレームの検出履歴を参照しているが、直近の十数フレームの検出履歴を参照してもよい。
【0065】
〔実施の形態3〕
次に、本発明の他の実施形態について説明する。本実施形態のデジタルカメラ10は、
図1に示すデジタルカメラ10に比べて、適正検出判定部32における判定処理が異なるのみであり、その他の構成は同様である。なお、上記実施形態で説明した構成および処理動作と同様の構成および処理動作には、同一の符号を付して、その説明を省略する。
【0066】
本実施形態では、適正検出判定部32は、検出履歴記憶部40を参照して、顔検出部31から受け取った顔IDが、直近の所定期間(例えば2秒)の検出履歴に含まれるかを判断する。含まれる場合、適正な検出であるとして、当該顔IDを検出枠生成部33に送出する。一方、含まれない場合、適正な検出ではないとして、当該顔IDの検出枠生成部33への送出を省略する。
【0067】
〔実施例5〕
次に、本実施形態における適正検出判定部32における動作の一例を、
図9を参照して説明する。
図9は、適正検出判定部32にて入出力されるデータの一例を0.2秒ごとに表形式で示す図である。図示の例では、適正検出判定部32は、今回検出された顔画像が、直近の2秒間に連続して検出している場合、適正に検出された顔画像としている。
【0068】
図9の例では、適正検出判定部32は、ID1が連続して入力されているが、開始から2秒間は、出力せず、その結果、未検出であるとして何も出力しない。そして、開始から2.2秒後は、直近の2秒間にID1が入力されているので、IDを出力する。
【0069】
このように、適正検出判定部32は、フレーム単位の代わりに時間単位で判定することもできる。
【0070】
〔ソフトウェアによる実現例〕
デジタルカメラ10は、の制御ブロック(特に制御部20)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、CPU(Central Processing Unit)を用いてソフトウェアによって実現してもよい。
【0071】
後者の場合、デジタルカメラ10は、各機能を実現するソフトウェアであるプログラムの命令を実行するCPU、上記プログラムおよび各種データがコンピュータ(またはCPU)で読み取り可能に記録されたROM(Read Only Memory)または記憶装置(これらを「記録媒体」と称する)、上記プログラムを展開するRAM(Random Access Memory)などを備えている。そして、コンピュータ(またはCPU)が上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記記録媒体としては、「一時的でない有形の媒体」、例えば、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0072】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【0073】
例えば、上記実施形態では、撮影画像から人、動物などの顔画像を検出して認識しているが、人、動物などの全身の画像を検出してもよいし、ボール、車両その他の物体の画像を検出してもよい。すなわち、本発明は、取得した撮影画像に含まれる任意の対象画像の検出に適用可能である。
【0074】
また、上記実施形態では、本発明をデジタルカメラ10に適用しているが、携帯電話機、スマートフォン、PDA(Personal Digital Assistant)など、撮影部を有する任意の電子機器に本発明を適用可能である。