IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オムロン株式会社の特許一覧

特許7581980物体検出装置、物体検出方法、およびプログラム
<>
  • 特許-物体検出装置、物体検出方法、およびプログラム 図1
  • 特許-物体検出装置、物体検出方法、およびプログラム 図2
  • 特許-物体検出装置、物体検出方法、およびプログラム 図3
  • 特許-物体検出装置、物体検出方法、およびプログラム 図4
  • 特許-物体検出装置、物体検出方法、およびプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-05
(45)【発行日】2024-11-13
(54)【発明の名称】物体検出装置、物体検出方法、およびプログラム
(51)【国際特許分類】
   G06T 7/00 20170101AFI20241106BHJP
   G06V 10/22 20220101ALI20241106BHJP
   G06V 20/52 20220101ALI20241106BHJP
【FI】
G06T7/00 300F
G06V10/22
G06V20/52
【請求項の数】 7
(21)【出願番号】P 2021036637
(22)【出願日】2021-03-08
(65)【公開番号】P2022136840
(43)【公開日】2022-09-21
【審査請求日】2023-03-08
(73)【特許権者】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】阪田 真也
【審査官】岡本 俊威
(56)【参考文献】
【文献】特開2019-159391(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06V 10/20-10/22
G06V 20/50-20/52
(57)【特許請求の範囲】
【請求項1】
画像から所定の物体を検出する物体検出装置であって、
前記画像から前記物体が存在する候補領域を検出するとともに、前記候補領域に前記物体が含まれる確からしさを表す第1の検出信頼度を出力する第1の検出手段と、
前記第1の検出手段によって検出された1つ以上の前記候補領域から対象領域を決定する判定手段と、
前記対象領域を対象として、前記第1の検出手段とは異なる検出アルゴリズムによって前記物体を検出する第2の検出手段と、
前記対象領域に対する前記第2の検出手段による検出結果を表し、前記第2の検出手段によって前記物体が検出されなかった対象領域に関する情報を含む検出情報を記憶する記憶手段と、
を有し、
前記判定手段は、前フレームにおいて前記物体が検出されなかった対象領域との類似度が所定値以上の候補領域については前記第1の検出信頼度から所定の値を減算した値に基づいて、その他の候補領域については前記第1の検出信頼度に基づいて、前記対象領域を決定する、
ことを特徴とする物体検出装置。
【請求項2】
前記所定の値は、前記第2の検出手段によって前記物体が検出されなかった連続フレーム数に応じた値である、
請求項に記載の物体検出装置。
【請求項3】
前記所定の値は、固定値である、
請求項に記載の物体検出装置。
【請求項4】
前記検出情報は、前記対象領域の位置および/またはサイズを含み、
前記判定手段は、前記候補領域の位置および/またはサイズと、前記対象領域の位置および/またはサイズとに基づいて、前記類似度を求める、
ことを特徴とする請求項からのいずれか一項に記載の物体検出装置。
【請求項5】
前記検出情報は、前記対象領域に対応する画像を含み、
前記判定手段は、前記検出情報に含まれる前記画像と、前記候補領域に対応する画像とに基づいて、前記類似度を求める、
ことを特徴とする請求項からのいずれか一項に記載の物体検出装置。
【請求項6】
画像から所定の物体を検出する物体検出方法であって、
前記画像から前記物体が存在する候補領域を検出するとともに、前記候補領域に前記物体が含まれる確からしさを表す第1の検出信頼度を出力する第1の検出ステップと、
前記第1の検出ステップで検出された1つ以上の前記候補領域から対象領域を決定する判定ステップと、
前記対象領域を対象として、前記第1の検出ステップとは異なる検出アルゴリズムによって前記物体を検出する第2の検出ステップと、
前記対象領域に対する前記2の検出ステップにおける検出結果を表し、前記第2の検出ステップにおいて前記物体が検出されなかった対象領域に関する情報を含む検出情報を記憶する記憶ステップと、
を有し、
前記判定ステップでは、前フレームにおいて前記物体が検出されなかった対象領域との類似度が所定値以上の候補領域については前記第1の検出信頼度から所定の値を減算した値に基づいて、その他の候補領域については前記第1の検出信頼度に基づいて、前記対象領域を決定する、
を有することを特徴とする物体検出方法。
【請求項7】
請求項に記載の物体検出方法の各ステップをコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物体を検出する技術に関する。
【背景技術】
【0002】
従来より、物体検出において、前段と後段に分かれた二段構成の検出器を用いて検出を行う技術が知られている。例えば、特許文献1、特許文献2では、前段の検出器で検出対象(例えば、顔)の候補領域を検出して、後段の検出器で当該複数の候補領域から検出対象を検出することで、高精度な物体検出を行っている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2006-293720号公報
【文献】特開2019-021001号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来技術では、2段階の検出処理を行うことで、処理時間が増大するという問題がある。特に、固定カメラでは、検出対象の物体(例えば、動体)以外は見え方が変わらないため、前段の検出器で一度発生した誤検出は何度も同じ場所で発生する。誤検出された領域に対しても後段の検出器で再度検出処理を行われてしまい、処理時間をより一層増大させてしまう問題がある。
【0005】
本発明は、高速かつ高精度に物体検出が可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記目的を達成するために本発明は、以下の構成を採用する。
【0007】
本発明の第一側面は、画像から所定の物体を検出する物体検出装置であって、前記画像から前記物体が存在する候補領域を検出する第1の検出手段と、前記第1の検出手段によって検出された1つ以上の前記候補領域から対象領域を決定する判定手段と、前記対象領域を対象として、前記第1の検出手段とは異なる検出アルゴリズムによって前記物体を検出する第2の検出手段と、前記対象領域に対する前記2の検出手段による検出結果を表す検出情報を記憶する記憶手段と、を有し、前記判定手段は、1つ以上前のフレームに対する前記検出情報に基づいて、1つ以上の前記候補領域から前記対象領域を決定する、ことを特徴とする物体検出装置である。
【0008】
検出対象の物体は、特に限定されないが、例えば、人体、顔、特定の動物、自動車、特定の商品などが挙げられる。候補領域は、検出対象の物体が存在する確率が高いと第1の検出手段によって判断された領域であり、第2の検出手段の検出の対象とする領域(対象領域)はこの候補領域に基づいて決定される。第1の検出手段および第2の検出手段は、どのようなアルゴリズムを用いたものであってもよいが、第2の検出手段の検出アルゴリズムは、第1の検出手段の検出アルゴリズムよりも高精度に検出が可能かつ計算量がより多いことが望ましい。検出情報は、第2の検出手段によって行われる物体検出処理を行って得られた情報であって、例えば、対象領域の位置やサイズ、対象領域に対応する画像、対象領域に検出対象の物体が含まれる確からしさを表すスコア等が含まれる。
【0009】
検出情報は、第2の検出手段によって物体が検出されなかった対象領域に関する情報を
含むとよい。この場合、判定手段は、候補領域のうち、前フレームにおいて物体が検出されなかった対象領域との類似度が所定値以上の候補領域以外を、前記対象領域として決定するとよい。また、第1の検出手段は、候補領域に物体が含まれる確からしさを表す第1の検出信頼度も出力し、判定手段は、前フレームにおいて物体が検出されなかった対象領域との類似度が所定値以上の候補領域については第1の検出信頼度から所定の値を減算した値に基づいて、その他の候補領域については第1の検出信頼度に基づいて、対象領域を決定してもよい。上記の構成によれば、第2の検出手段に渡る候補領域の数が減るので、2段階の検出処理を行うことで検出性能を維持したまま、処理時間を削減することができる。
【0010】
また、第1の検出信頼度から減算する所定の値は、第2の検出手段によって物体が検出されなかった連続フレーム数に応じた値であるとよい。例えば、連続フレーム数が増加するほど、所定の値を大きくしてもよいし、連続フレーム数が一定数以上の場合に初めて第1の検出信頼度から減算する所定の値を減算してもよい。なお、第1の検出信頼度から減算する所定の値は、固定値であってもよい。
【0011】
また、第1の検出手段は、候補領域に物体が含まれる確からしさを表す第1の検出信頼度も出力し、検出情報は、第2の検出手段によって判定される、対象領域に物体が含まれる確からしさを表す第2の検出信頼度を含み、判定手段は、検出情報に示される対象領域との類似度が所定値以上の候補領域については第1の検出信頼度から第2の検出信頼度に応じた値を減算した値に基づいて、その他の候補領域については第1の検出信頼度に基づいて、対象領域を決定するとよい。例えば、第2の検出信頼度が高い程、第1の検出信頼度から減算する所定の値を大きくすればよい。
【0012】
検出情報は、対象領域の位置および/またはサイズを含み、判定手段は、候補領域の位置および/またはサイズと、対象領域の位置および/またはサイズとに基づいて、類似度を求めるとよい。物体検出において、入力画像中の同じ物に対し、何度も誤検出が発生することがあるが、上記の構成によれば、同じ位置・サイズのものを何度も誤検出することを効果的に減らすことができる。これにより、第2の検出部に渡る候補領域の数が減るので、2段階の検出処理を行うことで検出性能を維持したまま、処理時間を削減することができる。
【0013】
検出情報は、対象領域に対応する画像を含み、判定手段は、検出情報に含まれる画像と、候補領域に対応する画像とに基づいて、類似度を求めるとよい。これにより、誤検出情報に対応する領域と候補領域との位置やサイズが一致または類似するが、2つの領域に対応する画像が全く異なる場合にも高精度に物体検出を行うことができる。
【0014】
本発明の第二側面は、画像から所定の物体を検出する物体検出方法であって、前記画像から前記物体が存在する候補領域を検出する第1の検出ステップと、前記第1の検出ステップで検出された1つ以上の前記候補領域から対象領域を決定する判定ステップと、前記対象領域を対象として、前記第1の検出ステップとは異なる検出アルゴリズムによって前記物体を検出する第2の検出ステップと、前記対象領域に対する前記2の検出ステップにおける検出結果を表す検出情報を記憶する記憶ステップと、を有し、前記判定ステップでは、1つ以上前のフレームに対する前記検出情報に基づいて、1つ以上の前記候補領域から前記対象領域を決定する、を有することを特徴とする物体検出方法である。
【0015】
本発明は、上記手段の少なくとも一部を有する物体検出装置として捉えてもよいし、検出対象の物体を認識または追跡する装置、あるいは画像処理装置や監視システムとして捉えてもよい。また、本発明は、上記処理の少なくとも一部を含む物体検出方法、物体認識方法、物体追跡方法、画像処理方法、監視方法として捉えてもよい。また、本発明は、か
かる方法を実現するためのプログラムやそのプログラムを非一時的に記録した記録媒体として捉えることもできる。なお、上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
【発明の効果】
【0016】
本発明によれば、高速かつ高精度に物体検出を行うことができる。
【図面の簡単な説明】
【0017】
図1図1は、物体検出の適用例を示す図である。
図2図2は、物体検出装置の構成を示す図である。
図3図3は、物体検出処理のフローチャートである。
図4図4は、判定処理のフローチャートである。
図5図5は、判定処理のフローチャートである。
【発明を実施するための形態】
【0018】
(適用例)
図1を参照して、本発明に係る物体検出装置の適用例を説明する。物体検出装置は、検出対象エリアの上方(例えば、天井)に取り付けられた固定カメラによって取得される画像から対象物(例えば、人体)を検出する。また、物体検出装置は、前段と後段に分かれた二段構成の検出器を用いる。物体101および物体102は、検出物(例えば、人体)であって、固定カメラ1の撮像範囲を移動する動体である。物体103は、固定カメラ1の撮像範囲内に設けられる物体(例えば、花)である。物体検出装置は、入力画像に対して上述の前段の検出器を用いて対象物が存在する候補領域111~113を検出する。候補領域111~113は、物体101~103に対応する領域である。物体103は検出対象の人体ではないが、物体103の特徴が人体に類似している場合に候補領域113が発生する。そして、物体検出装置は、上述の後段の検出器を用いて物体検出を行い、検出結果を記憶装置に記録する。後段の検出器は、基本的に候補領域111~113に対応する対象領域121~123を対象として行う。ここで、前段の検出器は、物体(花)103を対象物であると誤検出するが、後段の検出器は対象物ではないと検出できるものとする。この場合、前段の検出器は物体103の誤検出し続けることが考えられる。候補領域の全てを後段の検出器の対象領域とすると、図1の状況において、後段の検出器は対象物が存在しないにもかかわらず、毎フレーム検出処理を行うことになり無駄な処理が発生する。
【0019】
そこで、本適用例においては、前段の検出器が物体を検出した領域(候補領域)のうちから、後段の検出器が物体検出を行う領域(対象領域)を、1つ以上前のフレームに対する検出情報に基づいて決定する。例えば、1つ以上前のフレームにおいて後段の検出器が対象物を検出しなかった領域との類似度が高い現フレームの候補領域は、対象領域から除外することが考えられる。あるいは、候補領域のうち前段の検出器の検出スコア(信頼度)に基づいて対象領域を決定するが、1つ以上前のフレームにおいて後段の検出器が対象物を検出しなかった領域については、検出スコアから所定の値を減算した値に基づいて対象領域と決定してもよい。減算する値は、固定値であってもよいし、対象物が検出されなかった連続フレーム数に応じた値としてもよい。このように、前段の検出器が対象物を検出した領域であっても、後段の検出器が対象物を検出しなかった領域と類似する場合には、後段の検出器の処理対象から除外することで、物体検出の精度を保ちつつ処理を高速化できる。
【0020】
(実施形態1)
<構成>
図2は、本実施形態に係る物体検出装置10における機能ブロック図である。物体検出
装置10は、演算装置(CPU;プロセッサ)、メモリ、記憶装置(記憶部16)、入出力装置等を含む情報処理装置(コンピュータ)である。記憶装置に格納されたプログラムを物体検出装置10が実行することで、画像入力部11、第1の検出部12、判定部13、第2の検出部14、出力部15等の機能が提供される。これらの機能の一部または全部は、ASICやFPGAなどの専用の論理回路により実装されてもよい。
【0021】
画像入力部11は、カメラ20から画像データを取り込む機能を有する。取り込まれた画像データは、第1の検出部12に引き渡される。この画像データは記憶部16に格納されてもよい。なお、本実施形態ではカメラ20から、直接、画像データを受け取っているが、通信装置等を介して画像データを受け取ったり、記録媒体を経由して画像データを受け取ったりしてもよい。なお、入力される画像は特に限定されず、RGB画像やグレー画像、距離または温度等を表す画像であってもよい。
【0022】
第1の検出部12は、入力画像から候補領域(検出対象の物体が存在しそうな領域)を検出する。本実施形態では、第1の検出部12は、Haar-like特徴量とadaboostを用いた検出器を用いて候補領域の検出を行う。検出結果は、判定部13に引き渡される。検出結果には、検出された候補領域が含まれ、さらに、当該候補領域に検出対象の物体が存在する確からしさ(第1の検出信頼度、検出スコア)が含まれてもよい。なお、検出に用いる特徴量および検出器の学習アルゴリズムは特に限定されない。例えば、特徴量として、HoG(Histgram of Gradient)特徴量、SIFT特徴量、SURF特徴量、Sparse特徴量など任意の特徴量を用いることができる。また、学習アルゴリズムも、adaboost以外のboosting手法や、SVM(Support Vector Machine)、ニューラルネットワーク、決定木学習などの任意の学習手法を用いることができる。
【0023】
判定部13は、第1の検出部12によって検出された候補領域の中から、第2の検出部14による検出の対象とする領域(対象領域)を決定する。本実施形態においては、判定部13は、記憶部16に記憶される前フレームの検出情報を用いて、候補領域の中から対象領域を決定する。検出情報は、1つ以上前のフレームにおいて、後述する第2の検出部14によって物体が検出されなかった対象領域(誤検出領域)に関する情報を含む。判定部13は、候補領域のうち、誤検出領域との類似度が所定値以上の候補領域以外を、対象領域として決定し、後段の第2の検出部14に出力する。なお、判定部13は、第1の検出部12の検出結果に、上述の第1の検出信頼度が含まれる場合、当該第1の検出信頼度が所定値以上の候補領域の中から、誤検出領域に類似する候補領域を除いた領域を、候補領域として決定してもよい。
【0024】
第2の検出部14は、判定部13によって決定された対象領域に対して物体検出を行う。検出結果には、対象領域に検出対象の物体が存在するか否かを示す情報が含まれ、さらに、対象領域に検出対象の物体が存在する確からしさ(第2の検出信頼度、検出スコア)等が含まれてもよい。また、本実施形態では、第2の検出部14は、物体検出を行った結果、検出対象の物体が存在しないと判断された対象領域の位置および/またはサイズを、検出情報として記憶部16に記録する。なお、第2の検出部14は、判定部13によって決定された対象領域すべての検出情報(位置および/またはサイズ)を記憶部16に記録してもよい。本実施形態では、第2の検出部14は、深層学習を用いた検出器を用いて物体の検出を行う。なお、深層学習の手法は特に限定されず、例えば、CNN(Convolutional Neural Network)、RNN(Recurrent Neural Network)、SAE(Stacked Auto Encoder)、DBN(Deep Belief Network)などの任意の手法による検出器であってもよい。また、第2の検出部14は、深層学習を用いた検出器でなくても構わない。ただし、第2の検出部14の検出アルゴリズムは、第1の検出部12の検出アルゴリズ
ムよりも高精度に検出が可能かつ計算量がより多いことが望ましい。
【0025】
出力部15は、第2の検出部14によって検出された物体について検出結果を出力する。例えば、出力部15は、第2検出部14による検出結果の信頼度が閾値以上である候補領域について、物体が検出されたことを示す結果情報を出力する。信頼度が閾値未満の候補領域については、結果情報に含めなくてよい。検出結果情報は、特に限定されないが、例えば顔検出の場合には、顔領域、信頼度、顔の向き、年齢、性別、人種、表情など情報が挙げられる。
【0026】
<処理内容>
図3は、物体検出装置10による物体検出処理の全体の流れを示すフローチャートである。以下、図3のフローチャートにしたがって、物体検出装置100の詳細について説明する。
【0027】
≪S31:画像入力処理≫
ステップS31において、物体検出装置10は、画像(入力画像)を取得する。入力画像は、画像入力部11を介してカメラ20から取得されてもよいし、通信装置104を介して他のコンピュータから取得されてもよいし、記憶部16から取得されてもよい。
【0028】
≪S32:第1の検出処理≫
ステップS32において、第1の検出部12は、入力画像から候補領域(検出対象の物体が存在すると推定される領域)を検出する(第1の検出処理)。本実施形態では、第1の検出部12は、画像特徴量としてHaar-like特徴量を用い、学習アルゴリズムとしてAdaBoostを用いるように構成される。第1の検出処理の検出結果として、上述の候補領域の他に、当該候補領域に検出対象の物体が存在する確からしさ(第1の検出信頼度、検出スコア)が含まれてもよい。
【0029】
≪S33:判定処理≫
ステップS33において、判定部13は、ステップS32で検出された候補領域のうち、誤検出領域との類似度が所定値以上の候補領域以外を、対象領域として決定する。誤検出領域は、1つ以上前のフレームにおける後述する第2の検出処理において、物体が検出されなかった対象領域である。判定部13は、ステップS32で検出された候補領域の中から誤検出領域に類似するものを除いた領域を対象領域として出力する。
【0030】
ステップS33で行われる判定処理について、図4を用いて詳しく説明する。図4は、本実施形態に係る判定処理のフローチャートである。まず、判定部13は、記憶部16から検出情報(誤検出領域の位置およびサイズ)を取得する(S41)。判定部13は、直前のフレームに対する誤検出情報のみを取得してもよいし、直近の所定数フレームに対する誤検出情報を取得してもよい。そして、判定部13は、1つ以上の候補領域のそれぞれに対して、誤検出領域との類似度を算出する(S42)。本実施形態では、領域同士における類似度の指標として、IoU(Intersection over Union)を用いる。IoUは、2つの領域の積集合の面積を、当該2つの領域の和集合の面積で割った値である。IoUは、0から1の間の値をとり、2つの領域が完全に重なると1、全く重ならないと0となる。IoUの算出には、候補領域の位置およびサイズ、ならびに誤検出領域の位置およびサイズを用いればよい。そして、判定部13は、IoUが所定の閾値T1以上か否かを判定して(S43)、IoUが閾値T1以上である場合に、該当する候補領域を除いた領域を対象領域として出力する(S44)。
【0031】
≪S34~S36:第2の検出処理≫
ステップS34において、第2の検出部14は、ステップS33で出力された1つ以上
の対象領域に対して、検出対象の物体が含まれるか否かを判定する(第2の検出処理)。本実施形態では、第2の検出部14は、たたみ込みニューラルネットワーク(CNN)と呼ばれる多層ニューラルネットワークを用いて学習した識別器を用いて物体検出を行う。
【0032】
ステップS35において、第2の検出部14は、ステップS34の処理において、検出対象の物体が含まれないと判定された対象領域があるか否かを判定する。
【0033】
ステップS36において、第2の検出部14は、検出対象の物体が含まれないと判定された対象領域に関する情報を検出情報として記憶部16に記録する。本実施形態では、検出情報として、検出対象の物体が含まれないと判定された対象領域の位置およびサイズが記憶部16に記録される。
【0034】
≪S37:検出結果出力処理≫
ステップS37において、出力部15は、ステップS34で物体が検出された領域について検出結果を出力する。出力部15は、物体検出領域による検出結果の信頼度(第2の検出信頼度)が閾値以上である検出対象領域について、検出対象の物体が検出されたことを示す結果情報を出力する。信頼度が閾値未満の検出対象領域については、結果情報に含めなくてよい。
【0035】
<本実施形態の有利な効果>
物体検出において、入力画像中の同じ物に対し、何度も誤検出が発生することがあるが、本実施形態によれば、同じ位置・サイズのものを何度も誤検出することを効果的に減らすことができる。これにより、第2の検出部に渡る候補領域(対象領域)の数が減るので、2段階の検出処理を行うことで検出性能を維持したまま、処理時間を削減することができる。
【0036】
(実施形態2)
上述の実施形態1では、ステップS33において、候補領域および誤検出領域の位置や大きさに基づいて、類似度を決定する例について説明した。本実施形態では、ステップS33において、候補領域に対応する画像と誤検出領域に対応する画像とのパターンマッチングを行うことで類似度を決定する例について説明する。上述の実施形態1と同じ処理については説明を省略し、相違する処理である判定処理(S33)について説明する。
【0037】
<判定処理(S33)>
図5は、本実施形態において、ステップS33で行われる判定処理のフローチャートである。まず、判定部13は、記憶部16から検出情報を取得する(S51)。本実施形態では、検出情報には、誤検出領域に対応する画像が含まれる。そして、判定部13は、1つ以上の候補領域に対応する画像のそれぞれに対して、誤検出領域に対応する画像を用いてパターンマッチング処理を行う(S52)。そして、判定部13は、パターンマッチングによって得られる画像同士の類似度が所定の閾値T2以上であるか否かを判断して(S53)、類似度が閾値T2以上である場合に、該当する候補領域を除いた領域を対象領域として出力する(S54)。
【0038】
<本実施形態の有利な効果>
本実施形態によれば、誤検出領域と候補領域との位置やサイズが一致または類似するが、2つの領域に対応する画像が全く異なる場合にも高精度に物体検出を行うことができる。例えば、図1に示す物体103の位置に、検出対象の物体が重なった場合にも、画像に基づいて類似度を算出しているため、当該位置に対応する領域を対象領域とすることができる。
【0039】
(変形例)
上述の実施形態1および実施形態2では、判定部13は、候補領域の中から誤検出領域に類似するものを除いた候補領域を、対象領域として決定する例について説明したが、これに限定されない。例えば、第1の検出部12が上述の第1の検出信頼度を出力する場合に、判定部13は、当該第1の検出信頼度が所定の閾値T3以上である候補領域を対象領域として決定する。このとき、判定部13は、誤検出領域との類似度が所定の閾値T4以上の候補領域については、第1の検出信頼度から所定の値を減算した値が上述の所定の閾値T3以上である候補領域を対象領域として決定してもよい。
【0040】
なお、第1の検出信頼度から減算する所定の値の決定方法は特に限定されない。信頼度から減算する所定の値は、固定値でもよい。また、信頼度から減算する所定の値は、第2の検出部14によって対象物体が検出されなかった連続フレーム数に応じて決定してもよい。例えば、連続フレーム数が増加するほど、所定の値を大きくしてもよいし、連続フレーム数が一定数以上の場合に初めて第1の検出信頼度から減算する所定の値を減算してもよい。さらに、第2の検出部14によって第2の検出信頼度が出力される場合、信頼度から減算する所定の値は、当該第2の検出信頼度に基づいて決定されもよい。例えば、判定部13は、第1の検出信頼度が所定の閾値T3以上である候補領域を対象領域として決定する。このとき、判定部13は、誤検出領域との類似度が所定の閾値T4以上の候補領域については、第1の検出信頼度から、第2の検出信頼度に基づく値を減算した値が上述の所定の閾値T3以上である候補領域を対象領域として決定してもよい。例えば、第2の検出信頼度が高い程、信頼度から減算する所定の値を大きくすればよい。
【0041】
上述の実施形態1では、領域同士における類似度の指標として、IoUを用いる例について説明したが、これに限定されない。例えば、領域同士のサイズの比や差、または領域同士の位置(例えば、中央の座標値)の差、あるいはこれらの組合せを類似度の指標として用いてもよい。
【0042】
上述の実施形態2では、画像同士の類似度を求める際にパターンマッチングを行う例について説明したが、これに限定されない。例えば、画像における色情報の差や輝度情報の差を類似度の指標として用いてもよい。
【符号の説明】
【0043】
10:物体検出装置
11:画像入力部
12:第1の検出部
13:判定部
14:第2の検出部
15:出力部
16:記憶部
1,20:カメラ
101,102,103:物体
111,112,113:候補領域
121,122,123:対象領域
図1
図2
図3
図4
図5