IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ オムロン株式会社の特許一覧

<>
  • 特許-情報処理装置および情報処理方法 図1
  • 特許-情報処理装置および情報処理方法 図2
  • 特許-情報処理装置および情報処理方法 図3
  • 特許-情報処理装置および情報処理方法 図4
  • 特許-情報処理装置および情報処理方法 図5
  • 特許-情報処理装置および情報処理方法 図6
  • 特許-情報処理装置および情報処理方法 図7
  • 特許-情報処理装置および情報処理方法 図8
  • 特許-情報処理装置および情報処理方法 図9
  • 特許-情報処理装置および情報処理方法 図10
  • 特許-情報処理装置および情報処理方法 図11
  • 特許-情報処理装置および情報処理方法 図12
  • 特許-情報処理装置および情報処理方法 図13
  • 特許-情報処理装置および情報処理方法 図14
  • 特許-情報処理装置および情報処理方法 図15
  • 特許-情報処理装置および情報処理方法 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-24
(45)【発行日】2024-07-02
(54)【発明の名称】情報処理装置および情報処理方法
(51)【国際特許分類】
   G06T 7/215 20170101AFI20240625BHJP
   G06T 7/00 20170101ALI20240625BHJP
   G06T 7/254 20170101ALI20240625BHJP
【FI】
G06T7/215
G06T7/00 350B
G06T7/254
【請求項の数】 18
(21)【出願番号】P 2021005855
(22)【出願日】2021-01-18
(65)【公開番号】P2022110441
(43)【公開日】2022-07-29
【審査請求日】2023-02-28
(73)【特許権者】
【識別番号】000002945
【氏名又は名称】オムロン株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】杉尾 淳一
(72)【発明者】
【氏名】田中 清明
(72)【発明者】
【氏名】高山 貴宏
【審査官】▲広▼島 明芳
(56)【参考文献】
【文献】特開2020-107349(JP,A)
【文献】特開2016-085675(JP,A)
【文献】国際公開第2016/021411(WO,A1)
【文献】特開2007-180933(JP,A)
【文献】特開2015-184908(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06V 10/00 - 20/90
(57)【特許請求の範囲】
【請求項1】
動画像の各フレーム画像から動体を検出する検出部と、
前記検出された動体が所定の被写体である信頼度を算出する算出部と、
第1のフレームで検出された第1の動体に外接する枠による前記第1の動体の信頼度、および前記第1のフレームより前の第2のフレームで検出された第2の動体の検出枠による前記第1のフレームでの前記第1の動体の信頼度に基づいて、前記第1の動体の検出枠を決定し、記録部に記録する決定部と、を備え、
前記決定部は、前記第1の動体に外接する枠による前記第1の動体の信頼度よりも、前記第2の動体の検出枠による前記第1の動体の信頼度が大きい場合、前記第2の動体の検出枠を、前記第1の動体の検出枠として決定する、
情報処理装置。
【請求項2】
前記第2のフレームで検出された複数の動体のうち、前記第1の動体と同じ被写体である前記第2の動体を判定する判定部をさらに備える、
請求項1に記載の情報処理装置。
【請求項3】
前記判定部は、前記第1の動体に外接する枠と前記第2のフレームで検出された各動体の検出枠との中心間距離に基づいて、前記第1の動体と同じ被写体である前記第2の動体を判定する、
請求項2に記載の情報処理装置。
【請求項4】
前記判定部は、前記第1の動体に外接する枠と前記第2のフレームで検出した各動体の検出枠とが占める領域に対する重なりの領域の割合に基づいて、前記第1の動体と同じ被写体である前記第2の動体を判定する、
請求項2または3に記載の情報処理装置。
【請求項5】
前記判定部は、前記第1の動体と前記第2のフレームで検出した各動体とを、機械学習による照合のアルゴリズムを用いて照合することにより、前記第1の動体と同じ被写体である前記第2の動体を判定する、
請求項2から4のいずれか1項に記載の情報処理装置。
【請求項6】
前記判定部は、前記第1のフレームより前の複数のフレームで検出された動体のうち、前記第1の動体と同じ被写体がいずれの動体かをそれぞれのフレームで判定し、
前記決定部は、各フレームで前記第1の動体と同じ被写体であると判定された動体のそれぞれの検出枠による前記第1の動体の信頼度のうち最も大きい信頼度が、前記第1の動体に外接する枠による前記第1の動体の信頼度よりも大きい場合、前記最も大きい信頼度が算出された検出枠を、前記第1の動体の検出枠として決定する、
請求項2から5のいずれか1項に記載の情報処理装置。
【請求項7】
前記決定部は、前記第1の動体に外接する枠による前記第1の動体の信頼度が、第1閾値より大きい場合、前記第1の動体に外接する枠を、前記第1の動体の検出枠として決定する、
請求項1から6のいずれか1項に記載の情報処理装置。
【請求項8】
前記決定部は、前記決定した前記第1の動体の検出枠による信頼度が、第2閾値より大きい場合に、前記第1の動体の検出枠を前記記録部に記録する、
請求項1からのいずれか1項に記載の情報処理装置。
【請求項9】
前記決定部は、前記第1の動体に外接する枠による前記第1の動体の信頼度よりも、前記第2の動体の検出枠による前記第1の動体の信頼度が大きい場合であって、前記第1の動体に外接する枠と前記第2の動体の検出枠との差分が第3閾値より大きいフレームの連続数が所定数以下の場合に、前記第2の動体の検出枠を前記第1の動体の検出枠として決定し、前記第1の動体の検出枠を前記記録部に記録する、
請求項1からのいずれか1項に記載の情報処理装置。
【請求項10】
前記記録部に記録された前記第1の動体の検出枠を、前記第1のフレームに重畳させて出力する出力部をさらに備える、
請求項1からのいずれか1項に記載の情報処理装置。
【請求項11】
前記出力部は、前記記録部に記録された前記第1の動体の検出枠による信頼度が、第2閾値より大きい場合に、前記第1の動体の検出枠を出力する、
請求項1に記載の情報処理装置。
【請求項12】
前記出力部は、前記第1の動体に外接する枠による前記第1の動体の信頼度よりも、前記第2の動体の検出枠による前記第1の動体の信頼度が大きい場合であって、前記第1の動体に外接する枠と前記第2の動体の検出枠の差分が第3閾値より大きいフレームの連続数が所定数以下の場合に、前記記録部に記録された前記第1の動体の検出枠を出力する、請求項1または1に記載の情報処理装置。
【請求項13】
前記出力部は、前記決定された前記第1の動体の検出枠による信頼度が第1閾値より大きいフレームの連続数が所定数より多い場合に、前記第1の動体の検出枠を出力する、
請求項1から1のいずれか1項に記載の情報処理装置。
【請求項14】
前記第2の動体の検出枠と、前記第2のフレームよりも前のフレームで前記第1の動体と同じ被写体であると判定された動体の検出枠との位置および大きさの変化量に基づいて、前記第2の動体の検出枠を補正する補正部をさらに備える、
請求項1から1のいずれか1項に記載の情報処理装置。
【請求項15】
前記検出部は、フレーム間差分法および背景差分法の少なくともいずれかにより動体を検出する、
請求項1から1のいずれか1項に記載の情報処理装置。
【請求項16】
前記算出部は、ニューラルネットワーク、ブースティング、サポートベクターマシンの少なくともいずれかに基づく識別器により、前記検出された動体が所定の被写体である信頼度を算出する、
請求項1から1のいずれか1項に記載の情報処理装置。
【請求項17】
コンピュータが、
動画像に含まれる第1のフレームから第1の動体を検出する検出ステップと、
前記第1の動体が所定の被写体である信頼度を、前記第1の動体に外接する枠、および記録部に記録されている検出枠であって、前記第1のフレームより前の第2のフレームで検出された第2の動体の検出枠を用いて算出する算出ステップと、
前記第1の動体に外接する枠による前記第1の動体の信頼度、および前記第2の動体の検出枠による前記第1のフレームでの前記第1の動体の信頼度に基づいて、前記第1の動体の検出枠を決定し、前記記録部に記録する決定ステップと、を実行し、
前記決定ステップは、前記第1の動体に外接する枠による前記第1の動体の信頼度よりも、前記第2の動体の検出枠による前記第1の動体の信頼度が大きい場合、前記第2の動体の検出枠を、前記第1の動体の検出枠として決定する処理をさらに含む、
情報処理方法。
【請求項18】
請求項1に記載の方法の各ステップをコンピュータに実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置および情報処理方法に関する。
【背景技術】
【0002】
動画像から動物体を検出する技術として、動画像を動体差分(フレーム間差分、背景差
分)で処理することにより、画像内で動いている画素を動物体領域として抽出する方法が
知られている。特許文献1は、動きを持った物体のうち、検出位置などの物理量情報を基に、検出対象と検出対象以外の動く物体とを区別して認識する技術を開示する。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2000-105835号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、動体差分法によって抽出した差分領域は、移動速度または動き方の違いにより、ばらつきが発生する可能性がある。動体差分法による差分領域は、最新時刻の変化に追従して検出矩形(検出枠)を出力することができるが、フレーム間差分または背景差分の精度の影響により、抽出する動物体領域が安定しない場合がある。例えば、移動せずに作業をする人体は、時刻の変化とともに動く部分が変わるため、動物体の矩形サイズを安定して出力することは難しい。
【0005】
本発明は、一側面では、動画像での動物体の検出精度を改善し、検出枠を安定して出力する技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明は、上記目的を達成するために、以下の構成を採用する。
【0007】
本開示の第一側面は、動画像の各フレーム画像から動体を検出する検出部と、検出された動体が所定の被写体である信頼度を算出する算出部と、第1のフレームで検出された第1の動体に外接する枠による第1の動体の信頼度、および第1のフレームより前の第2のフレームで検出された第2の動体の検出枠による第1のフレームでの第1の動体の信頼度に基づいて、第1の動体の検出枠を決定し、記録部に記録する決定部と、を備える情報処理装置である。
【0008】
情報処理装置は、現フレーム(第1のフレーム)で検出された動体(第1の動体)について、前のフレーム(第2のフレーム)で検出された動体(第2の動体)の検出枠による信頼度に基づいて、第1の動体の検出枠を決定する。情報処理装置は、より信頼度が高い検出枠を採用することにより、動体の検出精度を改善し、検出枠を安定して出力することができる。「所定の被写体」は、人体といった検出対象の動体である。
【0009】
情報処理装置は、第2のフレームで検出された複数の動体のうち、第1の動体と同じ被写体である第2の動体を判定する判定部をさらに備えてもよい。第2のフレームで検出された動体のうち、第1の動体と同じ被写体の動体をより正確に判定することにより、情報処理装置は、同じ被写体に対する検出枠を安定して出力することができる。
【0010】
判定部は、第1の動体に外接する枠と第2のフレームで検出された各動体の検出枠との
中心間距離に基づいて、第1の動体と同じ被写体である第2の動体を判定してもよい。情報処理装置は、簡易な方法で、第1の動体と同じ被写体である第2の動体を判定することにより、処理負荷を軽減することができる。
【0011】
判定部は、第1の動体に外接する枠と第2のフレームで検出した各動体の検出枠とが占める領域に対する重なりの領域の割合に基づいて、第1の動体と同じ被写体である第2の動体を判定してもよい。情報処理装置は、簡易な方法で、第1の動体と同じ被写体である第2の動体を判定することにより、処理負荷を軽減することができる。
【0012】
判定部は、第1の動体と第2のフレームで検出した各動体とを、機械学習による照合のアルゴリズムを用いて照合することにより、第1の動体と同じ被写体である第2の動体を判定してもよい。情報処理装置は、第1の動体と同じ被写体である第2の動体を精度よく判定することができる。
【0013】
判定部は、第1のフレームより前の複数のフレームで検出された動体のうち、第1の動体と同じ被写体がいずれの動体かをそれぞれのフレームで判定し、決定部は、各フレームで第1の動体と同じ被写体であると判定された動体のそれぞれの検出枠による第1の動体の信頼度のうち最も大きい信頼度が、第1の動体に外接する枠による第1の動体の信頼度よりも大きい場合、最も大きい信頼度が算出された検出枠を、第1の動体の検出枠として決定してもよい。情報処理装置は、複数フレーム前まで遡って、より信頼度が高くなる検出枠を採用することにより、出力する検出枠による信頼度は改善され、安定した検出枠を出力することができる。
【0014】
決定部は、第1の動体に外接する枠による第1の動体の信頼度が、第1閾値より大きい場合、第1の動体に外接する枠を、第1の動体の検出枠として決定してもよい。情報処理装置は、外接枠による信頼度が第1閾値より大きい場合には、前フレームの検出枠による信頼度との比較をせずに検出枠を決定するため、処理負荷を軽減することができる。
【0015】
決定部は、第1の動体に外接する枠による第1の動体の信頼度よりも、第2の動体の検出枠による第1の動体の信頼度が大きい場合、第2の動体の検出枠を、第1の動体の検出枠として決定してもよい。情報処理装置は、より信頼度が高い検出枠を採用することにより、動体の検出精度を改善することができる。
【0016】
決定部は、決定した第1の動体の検出枠による信頼度が、第2閾値より大きい場合に、第1の動体の検出枠を記録部に記録するようにしてもよい。信頼度が第2閾値以下となる枠は記録部に記録されないため、情報処理装置は、安定した検出枠を出力することができる。
【0017】
決定部は、第1の動体に外接する枠による第1の動体の信頼度よりも、第2の動体の検出枠による第1の動体の信頼度が大きい場合であって、第1の動体に外接する枠と第2の動体の検出枠との差分が第3閾値より大きいフレームの連続数が所定数以下の場合に、第2の動体の検出枠を第1の動体の検出枠として決定し、第1の動体の検出枠を記録部に記録するようにしてもよい。差分は、例えば、第2の動体の検出枠から第1の動体に外接する枠への面積変化であってもよく、第2の動体の検出枠の面積に対する当該面積変化の割合であってもよい。情報処理装置は、現フレームでの外接枠と前フレームの検出枠との差分が第3閾値より大きくなるフレームが連続する場合、第1の動体に対する検出枠を記録しないことにより、誤検出による検出枠の出力を低減することができる。
【0018】
情報処理装置は、記録部に記録された第1の動体の検出枠を、第1のフレームに重畳させて出力する出力部をさらに備えてもよい。動画像での動物体の検出精度が改善され、情
報処理装置は、安定した検出枠を出力することができる。
【0019】
出力部は、記録部に記録された第1の動体の検出枠による信頼度が、第2閾値より大きい場合に、第1の動体の検出枠を出力するようにしてもよい。情報処理装置は、信頼度が第2閾値よりも大きい検出枠を、安定して出力することができる。
【0020】
出力部は、第1の動体に外接する枠による第1の動体の信頼度よりも、第2の動体の検出枠による第1の動体の信頼度が大きい場合であって、第1の動体に外接する枠と第2の動体の検出枠との差分が第3閾値より大きいフレームの連続数が所定数以下の場合に、記録部に記録された第1の動体の検出枠を出力するようにしてもよい。情報処理装置は、現フレームでの外接枠と前フレームの検出枠との差分が第3閾値より大きくなるフレームが連続する場合、第1の動体に対する検出枠を出力しないように制御することにより、誤検出による検出枠の出力を低減することができる。
【0021】
出力部は、決定された第1の動体の検出枠による信頼度が第1閾値より大きいフレームの連続数が所定数より多い場合に、第1の動体の検出枠を出力するようにしてもよい。情報処理装置は、第1の動体の検出枠による信頼度が第1閾値より大きいフレームが連続する場合に、第1の動体に対する検出枠を出力するように制御することにより、高信頼度の検出枠を継続して出力することができる。
【0022】
情報処理装置は、第2の動体の検出枠と、第2のフレームよりも前のフレームで第1の動体と同じ被写体であると判定された動体の検出枠との位置および大きさの変化量に基づいて、第2の動体の検出枠を補正する補正部をさらに備えてもよい。補正部125は、前フレームで検出された動体の検出枠を補正することにより、補正枠を現フレームに適用した場合の動体の信頼度を改善することができる。
【0023】
検出部は、フレーム間差分法および背景差分法の少なくともいずれかにより動体を検出してもよい。算出部は、ニューラルネットワーク、ブースティング、サポートベクターマシンの少なくともいずれかに基づく識別器により、検出された動体が所定の被写体である信頼度を算出してもよい。
【0024】
本発明の第二側面は、コンピュータが、動画像に含まれる第1のフレームから第1の動体を検出する検出ステップと、第1の動体が所定の被写体である信頼度を、第1の動体に外接する枠、および記録部に記録されている検出枠であって、第1のフレームより前の第2のフレームで検出された第2の動体の検出枠を用いて算出する算出ステップと、第1の動体に外接する枠による第1の動体の信頼度、および第2の動体の検出枠による第1のフレームでの第1の動体の信頼度に基づいて、第1の動体の検出枠を決定し、記録部に記録する決定ステップと、を含む情報処理方法である。
【0025】
本発明は、かかる方法をコンピュータによって実現するためのプログラムやそのプログラムを非一時的に記録した記録媒体として捉えることもできる。なお、上記手段および処理の各々は可能な限り互いに組み合わせて本発明を構成することができる。
【発明の効果】
【0026】
本発明によれば、動画像での動物体の検出精度を改善し、検出枠を安定して出力することができる。
【図面の簡単な説明】
【0027】
図1図1は、実施形態に係る情報処理装置の適用例を説明する図である。
図2図2は、情報処理装置のハードウェア構成を例示する図である。
図3図3は、情報処理装置の機能構成を例示する図である。
図4図4は、検出矩形出力処理の例を示すフローチャートである。
図5図5は、被写体の同一判定方法について説明する図である。
図6図6は、実施形態2に係る検出矩形出力処理の例を示すフローチャートである。
図7図7は、実施形態3に係る検出矩形出力処理の例を示すフローチャートである。
図8図8は、実施形態3に係る検出矩形出力処理の別の例を示すフローチャートである。
図9図9は、実施形態4が適用される状況について説明する図である。
図10図10は、実施形態4に係る検出矩形出力処理の例を示すフローチャートである。
図11図11は、実施形態4に係る検出矩形出力処理の別の例を示すフローチャートである。
図12図12は、実施形態5に係る検出矩形出力処理の例を示すフローチャートである。
図13図13は、実施形態6に係る検出矩形出力処理の例を示すフローチャートである。
図14図14は、実施形態7に係る情報処理装置の機能構成を例示する図である。
図15図15は、実施形態7に係る検出矩形の補正を説明する図である。
図16図16は、実施形態7に係る検出矩形出力処理の例を示すフローチャートである。
【発明を実施するための形態】
【0028】
以下、本発明の一側面に係る実施の形態を、図面に基づいて説明する。
【0029】
<適用例>
図1は、実施形態に係る情報処理装置の適用例を説明する図である。情報処理装置は、カメラから入力される動画像を取得し、取得した動画像の各画像フレームから、動物体(以下、動体とも称する)を検出する。カメラは、例えば、監視カメラ等の固定カメラが想定される。
【0030】
情報処理装置は、例えば、フレーム画像と予め用意した背景画像との間で変化した領域を抽出する背景差分法、フレーム間で変化した領域を抽出するフレーム間差分法またはそれらの両方により、動体領域を抽出することができる。図1の例は、時刻Tにおいて動体A1が抽出された例を示す。情報処理装置は、抽出した動体A1に外接する矩形A2を生成する。なお、本適用例および以下の各実施形態の説明では、動体領域を示す枠の形状は、矩形であるものとして説明するが、矩形に限られず、楕円、多角形、動体に外接する曲線等により動体領域を囲むものであればよい。
【0031】
情報処理装置は、例えば、検出した動体を機械学習の識別器に入力することにより、動体の信頼度を取得する。図1の例での信頼度は人体らしさの信頼度であるものとする。外接矩形A2は、人体の頭部を除く部分が動体領域として抽出された領域を含む。このため、外接矩形A2で囲まれた領域の画像を識別器に入力した場合の信頼度は500となる。
【0032】
現フレームで検出した動体の信頼度が所定の閾値以下の場合、情報処理装置は、前フレームで検出した同じ被写体の検出矩形を用いて現フレームから切り取った画像の信頼度を算出する。情報処理装置は、算出した信頼度を、現フレームで検出した動体の外接矩形による信頼度と比較する。
【0033】
図1の例では、所定の閾値を700とすると、時刻T(現フレーム)の外接矩形A2による動体A1の信頼度500は、所定の閾値700よりも低い。そこで、情報処理装置は、時刻T-1(前フレーム)での動体A1と同じ被写体に対する検出矩形A3を用いて時刻Tの現フレームで切り取った画像の信頼度を算出する。算出した信頼度1000は、時刻Tで検出した動体A1の外接矩形A2による信頼度よりも高くなっている。
【0034】
前フレームでの検出矩形による信頼度が、現フレームでの外接矩形による信頼度よりも高い場合、情報処理装置は、前フレームでの検出矩形を現フレームで検出した動体の検出矩形に決定する。図1の例では、時刻T-1での検出矩形A3による信頼度1000は、時刻Tでの信頼度500よりも高いため、情報処理装置は、検出矩形A3を時刻Tの現フレームで検出した動体A1の検出矩形に決定する。人体の頭部を含まない領域を囲む外接矩形A2ではなく、信頼度がより高くなる検出矩形A3を採用することで、時刻Tでの検出精度は改善される。
【0035】
以上のように、情報処理装置は、現フレームで検出した動体の外接矩形による信頼度、および前フレームで検出した同じ動体の検出矩形による信頼度に基づいて、当該動体の検出矩形を決定する。情報処理装置は、信頼度がより高くなる矩形を検出矩形として採用することで、動体検出の精度を改善することができる。また、情報処理装置は、動画像において動体が動きを停止した場合、または動体の動きがほとんどない場合でも、前フレームの検出矩形を採用することにより安定した検出矩形を出力することができる。このため、フレーム間差分法により動体を検出した場合でも、静止物体の検出精度は向上する。
【0036】
<実施形態1>
(ハードウェア構成)
図2を参照して、情報処理装置1のハードウェア構成の一例について説明する。図2は、情報処理装置1のハードウェア構成を例示する図である。情報処理装置1は、プロセッサ101、主記憶装置102、補助記憶装置103、通信インタフェース(I/F)104、出力装置105を備える。プロセッサ101は、補助記憶装置103に記憶されたプログラムを主記憶装置102に読み出して実行することにより、図3で説明する各機能構成としての機能を実現する。通信インタフェース104は、有線または無線通信を行うためのインタフェースである。出力装置105は、例えば、ディスプレイ等の出力を行うための装置である。
【0037】
情報処理装置1は、パーソナルコンピュータ、サーバコンピュータ、タブレット端末、スマートフォンのような汎用的なコンピュータでもよく、オンボードコンピュータのように組み込み型のコンピュータでもよい。情報処理装置1は、例えば、複数台のコンピュータ装置による分散コンピューティングにより実現されてもよく、各機能部の一部をクラウドサーバにより実現されてもよい。また、情報処理装置1の各機能部の一部は、FPGAまたはASICなどの専用のハードウェア装置によって実現されてもよい。
【0038】
情報処理装置1は、有線(USBケーブル、LANケーブルなど)または無線(WiFiなど)でカメラ2に接続され、カメラ2で撮影された画像データを受信する。カメラ2は、レンズを含む光学系および撮像素子(CCDやCMOSなどのイメージセンサ)を有する撮像装置である。
【0039】
なお、情報処理装置1は、カメラ2と一体に構成されてもよい。また、撮像画像に対する動体検出、人体判定処理など情報処理装置1の処理の一部は、カメラ2で実行されてもよい。さらに、情報処理装置1による人体検出の結果は、外部の装置に送信されユーザに提示されるようにしてもよい。
【0040】
(機能構成)
図3は、情報処理装置1の機能構成を例示する図である。情報処理装置1は、画像取得部11、処理部12、検出矩形データベース(DB)13、出力部14を含む。処理部12は、検出部121、算出部122、判定部123、決定部124を含む。
【0041】
画像取得部11は、カメラ2から取得した動画像データを処理部12に送信する。処理部12の検出部121は、画像取得部11から受信した動画像のフレームごとに動体を検出する。検出部121は、例えば、背景差分法またはフレーム間差分法により、動体を検出することができる。
【0042】
算出部122は、検出された動体が所定の被写体(例えば、人体)である信頼度を算出する。算出部122は、例えば、CNN(Convolution Neural Network)などのニューラルネットワークのアルゴリズムにより信頼度を算出することができる。また、算出部122は、ブースティング、サポートベクターマシン(SVM、Support Vector Machine)といった機械学習による識別器を用いて信頼度を算出してもよい。
【0043】
判定部123は、前フレームで検出された動体のうち、現フレームで検出した動体と同じ被写体がいずれの動体かを判定する。前フレームで検出された動体および対応する検出矩形の情報は、検出矩形データベース13に格納されている。判定部123は、例えば、現フレームで検出した動体に外接する矩形と、前フレームで検出された動体の検出矩形との中心間距離に基づいて、現フレームで検出した動体と前フレームで検出された動体とが同じ被写体であるか否かを判定する。
【0044】
決定部124は、算出部122により算出された信頼度に基づいて、現フレームで検出された動体に対する検出矩形を決定し、検出矩形データベース13に登録する。例えば、決定部124は、現フレームで検出された動体の外接矩形による信頼度が所定の閾値より大きい場合には、当該外接矩形を当該動体の検出矩形と決定して、検出矩形データベース13に登録する。
【0045】
また、現フレームでの外接矩形による信頼度が所定の閾値以下の場合、決定部124は、前フレームで検出された同じ被写体の検出矩形を現フレームに適用して信頼度を算出する。決定部124は、現フレームでの外接矩形および前フレームでの同じ被写体の検出矩形のうち、信頼度がより高くなる矩形を、現フレームで検出された動体の検出矩形と決定し、検出矩形データベース13に登録する。
【0046】
検出矩形データベース13は、動画像の各フレームで検出された動体を、決定部124が決定したそれぞれの検出矩形と対応づけて格納する。検出矩形データベース13は、検出矩形の情報として、例えば、フレーム内での検出矩形の位置および大きさの情報を格納する。また、検出矩形データベース13は、検出矩形の情報として、算出部122によって算出された検出矩形による当該動体の信頼度を格納してもよい。検出矩形データベース13は、記録部の一例である。
【0047】
出力部14は、検出矩形データベース13に格納されている動体および対応する検出矩形の情報に基づいて、各フレームの画像に検出された動体の検出矩形を重畳させ、ディスプレイ等の出力装置105に出力する。
【0048】
(検出矩形出力処理)
図4を参照して、検出矩形出力処理の全体的な流れを説明する。図4は、検出矩形出力
処理の例を示すフローチャートである。検出矩形出力処理は、例えば、画像取得部11が取得した動画像の各フレームが処理部に送信されることにより開始される。図4に示す検出矩形出力処理は、動画像のフレームごとに実行される処理である。
【0049】
S101では、検出部121は、画像取得部11から受信した処理対象のフレーム(以下、現フレームと称する)の画像から動体を検出する。検出部121は、フレーム画像と予め用意した背景画像との間で変化した領域を抽出する背景差分法、フレーム間で変化した領域を抽出するフレーム間差分法により、動体を検出することができる。
【0050】
S102では、検出部121は、現フレームで検出した各動体に外接する矩形を生成する。現フレームで検出された動体i(i=1,…,N)に対し、S103からS109までの処理が繰り返される。
【0051】
S103では、算出部122は、S102で生成された外接矩形により現フレームから切り取った画像の信頼度を算出する。信頼度は、切り取った画像内の動体iが所定の被写
体、例えば人物である信頼度である。算出部122は、例えば、CNNなどのニューラルネットワークのアルゴリズム、ブースティング、SVMといった機械学習による識別器を用いて信頼度を算出することができる。
【0052】
S104では、決定部124は、S103で算出された外接矩形による信頼度が所定の閾値TH1(第1閾値)より大きいか否かを判定する。外接矩形による信頼度がTH1より大きい場合(S104:Yes)、処理はS109に進む。外接矩形による信頼度がTH1以下の場合(S104:No)、処理は、S105からS108のループ処理L2に進む。
【0053】
ループ処理L2では、算出部122は、前のフレーム(以下、前フレームとも称する)で検出された動体j(j=1,…,M)のうち、現フレームの動体iと同じ被写体である
動体jの検出矩形を用いて、動体iの信頼度を算出する。決定部124は、算出した信
頼度、および動体iの外接矩形による信頼度に基づいて、現フレームでの動体iの検出矩形を決定する。以下、各ステップの処理を具体的に説明する。
【0054】
S105では、判定部123は、前フレームで検出した動体jの被写体が、現フレームの動体iの被写体と同じであるか否かを判定する。前フレームで検出した動体jの被写体
が、現フレームの動体iの被写体と同じであると判定した場合(S106:Yes)、処
理はS107に進む。同じでないと判定した場合(S106:No)、処理は次の動体j+1の検出矩形についてのループ処理L2に進む。
【0055】
ここで、図5を参照して、S105およびS106で、前フレームの動体jが現フレームの動体iと同じ被写体であるか否かを判定する同一判定方法の3つの例を説明する。な
お、被写体が同じであるか否かは、以下に例示する3つの方法を可能な範囲で組み合わせて判定してもよい。
【0056】
図5(A)は、1つめの同一判定方法の例を示す。判定部123は、現フレームの動体iに外接する矩形A512と、前フレームの動体jの検出矩形A511との中心間の距離
dに基づいて、前フレームで検出した動体jの被写体が、現フレームの動体iの被写体と
同じであるか否かを判定する。
【0057】
判定部123は、例えば、中心間の距離dが所定の閾値より小さい場合に、前フレームで検出した動体jの被写体が、現フレームの動体iの被写体と同じであると判定する。中
心間距離dに対する所定の閾値は、例えば、現フレームの動体iに外接する矩形A512
の幅の1/2の長さとすることができる。
【0058】
図5(B)は、2つめの同一判定方法の例を示す。判定部123は、現フレームの動体iに外接する矩形A522と、前フレームの動体jの検出矩形A521とのIoU(Intersection over Union)に基づいて、前フレームで検出した動体jの被写体が、現フレームの動体iの被写体と同じであるか否かを判定する。IoUは、現フレームの動体iに外接する矩形A522と前フレームの動体jの検出矩形A521とが占める領域(和の領域)に対する両矩形の重なりの領域の割合である。
【0059】
判定部123は、例えば、IoUが所定の閾値より大きい場合に、前フレームで検出した動体jの被写体が、現フレームの動体iの被写体と同じであると判定する。IoUに対
する所定の閾値は、例えば、80%とすることができる。
【0060】
図5(C)は、3つめの同一判定方法の例を示す。判定部123は、現フレームの動体iと、前フレームの動体jとを、機械学習による照合のアルゴリズム(Re-Id)を用
いて照合することにより、前フレームで検出した動体jの被写体が、現フレームの動体i
の被写体と同じであるか否かを判定する。
【0061】
図5(C)の例では、時刻Tで検出された動体A532に対し、時刻T-1で検出された動体A531および動体A541のうち、動体A531が同じ被写体であると判定される。また、時刻Tで検出された動体A542に対し、動体A541が同じ被写体であると判定される。判定部123は、機械学習による照合のアルゴリズムを用いることで、精度よく同じ被写体であることを判定することができる。
【0062】
判定部123は、例えば、現フレームで検出した動体と、前フレームで検出した複数の動体との類似度をそれぞれ取得する。判定部123は、類似度が閾値(例えば、1を最大値とした場合に0.5)以上である動体のうち、類似度が最も高くなる動体を、現フレームで検出した動体と同じ被写体であると判定することができる。
【0063】
図4のS107では、算出部122は、現フレームの動体iの被写体と同じであると判
定された動体jの検出矩形によって、現フレームから切り取った動体iの信頼度を算出
する。
【0064】
S108では、決定部124は、S107で算出した前フレームの動体jの検出矩形による信頼度と、S103で算出した外接矩形による信頼度とを比較する。決定部124は、現フレームの動体iの外接矩形による信頼度が、前フレームの動体jの検出矩形に
よる信頼度よりも高い場合、外接矩形を、現フレームの動体iの検出矩形として決定する
。一方、前フレームの動体jの検出矩形による信頼度が、外接矩形による信頼度よりも高い場合、決定部124は、前フレームの動体jの検出矩形を、現フレームの動体iの
検出矩形として決定する。
【0065】
なお、前フレームの動体jのうち、現フレームの動体iと同じ被写体であると判定され
た動体jが複数存在する場合、S107で算出した信頼度が最も高い検出矩形を採用し、S103で算出した外接矩形による信頼度と比較すればよい。
【0066】
S109では、決定部124は、S108で現フレームの動体iの検出矩形として決定
した検出矩形の情報を、検出矩形データベース13に記録する。検出矩形の情報は、動体iの画像情報、決定された検出矩形の位置および大きさ、決定された検出矩形による動体iの信頼度の値を含む。
【0067】
S109で検出矩形データベース13に記録された現フレームの動体iの検出矩形は、
次のフレームで検出された動体の信頼度を算出するために使用される。現フレームで検出された各動体に対し、S103からS109までのループ処理L1が終了すると、処理はS110に進む。
【0068】
S110では、出力部14は、S108で決定した検出矩形を、現フレームの画像に重畳させて出力する。現フレームに対する検出矩形出力処理は終了する。
【0069】
(作用効果)
上記の実施形態1において、情報処理装置1は、現フレームの動体に外接する矩形による当該動体の信頼度、および前フレームで検出した同じ被写体の検出矩形による現フレームでの当該動体の信頼度を比較する。情報処理装置1は、信頼度を比較した矩形のうち信頼度がより高い矩形を、現フレームでの当該動体の検出矩形として決定する。信頼度がより高くなる検出矩形が採用されるため、情報処理装置1は、動体の検出精度を改善し、検出矩形を安定して出力することができる。
【0070】
また、情報処理装置1は、現フレームでの外接矩形による動体の信頼度が所定の閾値(第1閾値)より大きい場合には、外接矩形を当該動体の検出矩形として記録する。信頼度が所定の閾値より大きい場合、前フレームの検出矩形による信頼度との比較をしないため、情報処理装置1は、処理負荷を軽減することができる。
【0071】
また、情報処理装置1は、図4に示す検出矩形出力処理のS105およびS106の処理で、現フレームで検出した動体と前フレームで動体とが同じ被写体であるか否かを判定する。図5(A)で説明した中心間距離を用いた同一判定方法、および図5(B)で説明したIoUを用いた同一判定方法は、同じ被写体であるか否かを、図5(C)で説明した機械学習による同一判定方法と比較して、より低負荷で判定することができる。また、図5(C)で説明した機械学習による同一判定方法は、同じ被写体であるか否かを、中心間距離またはIoUを用いた同一判定方法よりも、精度よく判定することができる。
【0072】
<実施形態2>
実施形態1では、現フレームで検出した動体の外接矩形による信頼度が所定の閾値より大きい場合、情報処理装置1は、前フレームでの検出矩形による信頼度との比較をせずに、現フレームでの外接矩形を検出した動体の検出矩形として決定する。これに対し、実施形態2では、情報処理装置1は、現フレームで検出した動体の外接矩形による信頼度に関わらず、前フレームで検出した動体の検出矩形による信頼度との比較し、信頼度が高いほうの矩形を、現フレームで検出した動体の検出矩形として決定する。
【0073】
実施形態2に係る情報処理装置1のハードウェア構成および機能構成は、実施形態1と同様であるため、説明は省略する。図6は、実施形態2に係る検出矩形出力処理の例を示すフローチャートである。実施形態2に係る検出矩形出力処理は、図4に示す実施形態1の検出矩形出力処理とは、S104の判定処理がない点で相違する。図4に示す実施形態1の検出矩形出力処理と同じ処理については、同じ符号を付して説明は省略する。なお、図6の実施形態2に係る検出矩形出力処理は、図4の検出矩形出力処理で、S104の閾値TH1を信頼度の最大値に設定することにより実現することも可能である。
【0074】
実施形態2では、判定部123は、動体iの外接矩形による信頼度が閾値TH1より大
きいか否かに関わらず、外接矩形による信頼度を、前フレームで検出した動体jの検出矩形による動体iの信頼度と比較する。動体iの外接矩形による信頼度に関わらず、前フレ
ームでの検出矩形も含めて、より信頼度が高い矩形が採用されるため、出力される検出矩形の精度は改善される。
【0075】
<実施形態3>
実施形態3は、決定部124によって決定した検出矩形による信頼度が、所定の閾値以下の場合には検出矩形を出力せず、所定の閾値より大きい場合には決定した検出矩形を出力する実施形態である。信頼度が所定の閾値以下の場合には検出矩形を出力しないようにすることで、情報処理装置1は、安定した信頼度の検出矩形を、継続して出力することができる。
【0076】
実施形態3に係る情報処理装置1のハードウェア構成および機能構成は、実施形態1と同様であるため、説明は省略する。図7および図8は、実施形態3に係る検出矩形出力処理の例を示すフローチャートである。実施形態3に係る検出矩形出力処理は、図4に示す実施形態1の検出矩形出力処理に対し、検出矩形による信頼度が所定の閾値より大きいか否かの判定処理(S701、S801)が追加されている。図4に示す実施形態1の検出矩形出力処理と同じ処理については、同じ符号を付して説明は省略する。
【0077】
図7の検出矩形出力処理と図8の検出矩形出力処理とは、検出矩形の信頼度が所定の閾値TH2(第2閾値)より大きいか否かを判定するタイミングが相違する。図7では、検出矩形の信頼度が所定の閾値TH2より大きいか否かは、S109で検出矩形の情報が検出矩形データベース13に格納される前に判定される。即ち、検出矩形の信頼度が所定の閾値TH2以下の場合、検出矩形は、検出矩形データベース13に格納されず出力もされない。これに対し、図8では、検出矩形の信頼度が所定の閾値TH2より大きいか否かは、S110で検出矩形が出力される前に判定される。即ち、検出矩形の信頼度が所定の閾値TH2以下の場合、検出矩形は、検出矩形データベース13に格納されるが、出力はされない。
【0078】
図7の例では、ループ処理L2で動体iに対する検出矩形が決定されると、処理はS7
01に進む。S701では、決定部124は、決定した検出矩形による信頼度が所定の閾値TH2より大きいか否かを判定する。所定の閾値TH2は、例えば、閾値TH1以下の値に設定することができる。決定した検出矩形による信頼度が所定の閾値TH2より大きい場合(S701:Yes)、処理はS109に進む。決定した検出矩形による信頼度が所定の閾値TH2以下の場合(S701:No)、処理は次の動体i+1についてのルー
プ処理L1に進む。
【0079】
S109では、決定した検出矩形による信頼度が所定の閾値TH2より大きい検出矩形の情報が、検出矩形データベース13に格納される。S110では、出力部14は、現フレームで検出された動体に対し、検出矩形データベース13に格納されている検出矩形を出力する。即ち、出力部14は、S104で信頼度が所定の閾値TH1より大きい動体i
の外接矩形、およびS701で信頼度が所定の閾値TH2より大きいと判定された検出矩形を出力する。信頼度が所定の閾値以下となる矩形を出力しないことにより、情報処理装置1は、安定した信頼度の検出矩形を、継続して出力することができる。
【0080】
図8の例では、ループ処理L1で、現フレームで検出された各動体に対する検出矩形が検出矩形データベース13に記録されると、処理はS801に進む。S801では、出力部14は、検出矩形データベース13に記録された各動体の検出矩形による信頼度が所定の閾値TH2より大きいか否かを判定する。
【0081】
信頼度が所定の閾値TH2より大きい動体については(S801:Yes)、処理はS110に進む。信頼度が所定の閾値TH2以下の動体については(S801:No)、検出矩形は出力されず、図8に示す現フレームの検出矩形出力処理は終了する。
【0082】
S110では、出力部14は、検出矩形データベース13に格納されている検出矩形のうち、S801で信頼度が所定の閾値TH2より大きいと判定された検出矩形を出力する。信頼度が所定の閾値以下となる矩形を出力しないことにより、情報処理装置1は、安定した信頼度の検出矩形を、継続して出力することができる。
【0083】
<実施形態4>
実施形態4は、静止物体に対する検出矩形が、現フレームの動体の外接矩形よりも信頼度が高くなるために、動体の検出矩形として採用され残ってしまう状況を解消するための実施形態である。実施形態4に係る情報処理装置1のハードウェア構成および機能構成は、実施形態1と同様であるため、説明は省略する。
【0084】
情報処理装置1は、現フレームで検出した動体の外接矩形と、前フレームで同じ被写体であると判定された動体の検出矩形との差分が所定の閾値より大きくなるフレームの連続数が所定数を超える場合には、検出矩形を出力しないようにする。差分は、例えば、前フレームの検出矩形から現フレームの外接矩形への面積変化であってもよく、前フレームの検出矩形の面積に対する当該面積変化の割合であってもよい。即ち、情報処理装置1は、現フレームでの動体の外接矩形と、前フレームでの検出矩形との差分が所定の閾値より大きいフレームが所定数以下の場合に、決定部124により決定された検出矩形を、動体の検出矩形として記録する。これにより、情報処理装置1は、動体の検出矩形として誤って採用された静止物体の検出矩形を、以降のフレームで採用されないように制御することができる。
【0085】
図9を参照して、実施形態4が適用される状況について説明する。図9(A)は、フレーム画像から検出対象として人体を検出する例を示す。物体902は、動体として検出され得る扇風機などの物体である。物体903は、物体902と重なって撮像され、人体として誤検出される可能性のある物体である。物体903は、例えば、ロボット、人体の写ったポスター、コート掛け、壁の模様など、物体902と重なって人体と判定される可能性のあるものが想定される。図9(A)は、本実施形態が適用される場面を例示する。人体901は、カメラ2の位置から見て物体902と重なるように通り過ぎる。
【0086】
図9(B)は、図9(A)の場面で時刻T-1から時刻T+1までの動体の検出結果を例示する。時刻Tは、人体901が、カメラ2の位置から見て物体902と重なる位置を通った直後の時刻であるものとする。
【0087】
時刻T-1のフレーム画像では、人体901が物体902の周囲で検出され、検出矩形A91は、人体901の検出矩形として検出矩形データベース13に記録される。時刻Tで物体902が検出されると、判定部123は、物体902の外接矩形A92と、人体901の検出矩形A91との中心間距離から、時刻T-1での人体901を、物体902と同じ被写体であると判定することが考えられる。この場合、算出部122は、人体901の検出矩形A91を用いて、物体902の信頼度を算出する。検出矩形A91による物体902の信頼度(人体であることの信頼度)は、物体903が存在するために、物体902の外接矩形A92による信頼度よりも高くなる。したがって、決定部124は、時刻T-1での検出矩形A91を、物体902の検出矩形として決定する。
【0088】
物体903が静止物体である場合には、時刻T+1になっても、時刻Tの場合と同様に、決定部124は、時刻T-1および時刻Tでの検出矩形A91を、物体902の検出矩形として決定する。時刻T+1以降も同様に、誤検出である検出矩形A91は、物体902の検出矩形として検出矩形データベース13に記録される。
【0089】
この状況を回避するため、情報処理装置1は、現フレームでの外接矩形と前フレームの
検出矩形との差分が所定の閾値TH3より大きくなるフレームが所定数連続している場合には、検出矩形A91を検出矩形データベース13に記録しないように制御する。
【0090】
例えば、図9(B)の例での差分は、前フレームの検出矩形A91の面積に対する、検出矩形A91から外接矩形A92への面積変化の割合とすることができる。この場合、情報処理装置1は、差分が所定の閾値TH3である50%より大きいフレームが、5フレームより多く連続した場合、検出矩形A91を検出矩形データベース13に記録しないように制御することができる。即ち、情報処理装置1は、差分が所定の閾値TH3の50%より大きいフレームの連続数が5フレーム以下であれば、検出矩形A91を記録する。前フレームの検出矩形と現フレームの外接矩形との差分に基づいて検出矩形を記録するか否かを制御することで、情報処理装置1は、誤検出である検出矩形が、所定数より多く連続して出力されることを回避することができる。
【0091】
図10および図11は、実施形態4に係る検出矩形出力処理の例を示すフローチャートである。実施形態4に係る検出矩形出力処理は、図4に示す実施形態1の検出矩形出力処理に対し、矩形の差分が所定の閾値より大きいフレームの連続数についての判定処理(S1001~S1004、S1101~S1104)が追加されている。図4に示す実施形態1の検出矩形出力処理と同じ処理については、同じ符号を付して説明は省略する。
【0092】
図10の検出矩形出力処理と図11の検出矩形出力処理とは、矩形の差分が所定の閾値TH3(第3閾値)より大きいフレームの連続数が、所定数TH4より大きいか否かを判定するタイミングが相違する。図10では、連続数が所定数TH4より大きいか否かは、S109で検出矩形の情報が検出矩形データベース13に格納される前に判定される。即ち、連続数が所定数以下の場合、検出矩形は、検出矩形データベース13に格納されず出力もされない。これに対し、図11では、連続数が所定数TH4より大きいか否かは、S110で検出矩形が出力される前に判定される。即ち、連続数が所定数TH4以下の場合、検出矩形は、検出矩形データベース13に格納されるが、出力はされない。
【0093】
図10の例では、ループ処理L2で動体iに対する検出矩形が決定されると、処理はS
1001に進む。S1001では、前フレームの検出矩形と現フレームの外接矩形との差分が算出される。矩形の差分は、例えば、動体iの外接矩形と、S108で決定された動
体iの検出矩形との面積の変化量として算出することができる。なお、矩形の差分は、検
出矩形の情報とともに検出矩形データベース13に記録される。
【0094】
決定部124は、動体iの矩形の差分が所定の閾値TH3より大きいか否かを判定する
。動体iの矩形の差分が所定の閾値TH3より大きい場合(S1001:Yes)、処理
はS1002に進む。動体iの矩形の差分が所定の閾値TH3以下の場合(S1001:
No)、処理はS1003に進む。S1003では、決定部124は、動体iの矩形の差
分変化量が所定の閾値TH3より大きいフレームの連続数F1を初期化する。処理はS109に進み、S108で決定された動体iに対応する検出矩形は、検出矩形データベース
13に記録される。
【0095】
S1002では、決定部124は、動体iの矩形の差分が所定の閾値TH3より大きい
フレームの連続数F1を1増やす。動体iの矩形の差分が所定の閾値TH3より大きいフ
レームの連続数F1は、検出矩形データベース13に記録され、各フレームの処理で参照される。
【0096】
S1004では、決定部124は、連続数F1が所定数TH4を超えているか否かを判定する。連続数F1が所定数TH4を超えている場合(S1004:Yes)、動体iに
対応する検出矩形は、検出矩形データベース13に記録されず、処理は次のループ処理L
1に進む。連続数F1が所定数TH4以下の場合(S1004:No)、処理はS109に進み、動体iに対応する検出矩形は、検出矩形データベース13に記録される。
【0097】
情報処理装置1は、矩形の差分が所定の閾値より大きくなるフレームの連続数が所定数を超える場合には、検出矩形を出力しないようにすることにより、誤検出による検出矩形の出力を低減することができる。
【0098】
図11の例では、S1101からS1103の処理は、それぞれ図10のS1001およびS1003と同様である。決定部124は、S1102で連続数F1を1増やした後、またはS1103で連続数F1を0に初期化した後、連続数F1を検出矩形データベース13に記録する。S109では、決定部124は、連続数F1の値にかかわらず、動体iおよび対応する検出矩形の情報を検出矩形データベース13に記録する。
【0099】
現フレームで検出された各動体に対する検出矩形が検出矩形データベース13に記録されると、処理はS1104に進む。S1104では、出力部14は、連続数F1が所定数TH4を超えているか否かを判定する。
【0100】
連続数F1が所定数TH4を超えている動体iについては(S1104:Yes)、検
出矩形は出力されず、図11に示す現フレームの検出矩形出力処理は終了する。この場合、出力部14は、検出矩形データベース13に記録された動体iについての連続数F1を
0に初期化する。連続数F1が所定数TH4以下の動体iについては(S1104:No
)、処理はS110に進む。
【0101】
S110では、出力部14は、検出矩形データベース13に格納されている検出矩形のうち、S1104で連続数F1が所定数TH4以下と判定された検出矩形を出力する。情報処理装置1は、矩形の差分が所定の閾値より大きくなるフレームの連続数が所定数を超える場合には、検出矩形を出力しないようにすることにより、誤検出による検出矩形の出力を低減することができる。
【0102】
<実施形態5>
実施形態5は、信頼度が所定の閾値より大きいフレームが所定数連続する場合に、検出矩形を出力する実施形態である。信頼度が所定の閾値以下の場合には検出矩形を出力しないようにすることで、情報処理装置1は、安定した信頼度の検出矩形を、継続して出力することができる。
【0103】
実施形態5に係る情報処理装置1のハードウェア構成および機能構成は、実施形態1と同様であるため、説明は省略する。図12は、実施形態5に係る検出矩形出力処理の例を示すフローチャートである。実施形態5に係る検出矩形出力処理は、図4に示す実施形態1の検出矩形出力処理に対し、信頼度が所定の閾値より大きいフレームの連続数についての判定処理(S1201~S1204)が追加されている。図4に示す実施形態1の検出矩形出力処理と同じ処理については、同じ符号を付して説明は省略する。
【0104】
図12の例では、S104で、外接矩形による信頼度が所定の閾値TH1より大きい場合(S104:Yes)、処理はS1202に進む。
【0105】
S1202では、決定部124は、信頼度が所定の閾値より大きいフレームの連続数F2を1増やす。信頼度が所定の閾値より大きいフレームの連続数F2は、検出矩形データベース13に記録され、各フレームの処理で参照される。
【0106】
また、図12のループ処理L2で動体iに対する検出矩形が決定されると、処理はS1
201に進む。S1201では、決定部124は、ループ処理L2で決定した検出矩形による動体iの信頼度が所定の閾値TH1より大きいか否かを判定する。決定した検出矩形
による信頼度が所定の閾値TH1より大きい場合(S1201:Yes)、処理はS1202に進む。決定した検出矩形による信頼度がTH1以下の場合(S1201:No)、処理はS109に進む。
【0107】
S1202では、決定部124は、信頼度が所定の閾値より大きいフレームの連続数F2を1増やす。S109では、連続数F2の値にかかわらず、動体iおよび対応する検出
矩形の情報を検出矩形データベース13に記録する。
【0108】
S1203では、決定部124は、S1201で信頼度がTH1以下と判定されて信頼度が所定の閾値より大きいフレームが連続しないことになるため、動体iについての連続
数F2を0に初期化する。
【0109】
現フレームで検出された各動体に対する検出矩形が検出矩形データベース13に記録されると、処理はS1204に進む。S1204では、出力部14は、連続数F2が所定数TH5を超えているか否かを判定する。
【0110】
連続数F2が所定数TH5を超えている動体iについては(S1204:Yes)、処
理はS110に進む。連続数F2が所定数TH5以下の動体iについては(S1204:
No)、検出矩形は出力されず、図12に示す現フレームの検出矩形出力処理は終了する。
【0111】
S110では、出力部14は、検出矩形データベース13に格納されている検出矩形のうち、S1204で連続数F2が所定数TH5を超えていると判定された検出矩形を出力する。情報処理装置1は、連続数F2が所定数TH5以下の場合には、検出矩形を出力しないようにすることにより、高信頼度の検出矩形を継続して出力することができる。
【0112】
<実施形態6>
上述の各実施形態では、現フレームの動体の外接矩形による信頼度は、前フレームで検出された同じ被写体の検出矩形による信頼度と比較される。これに対し、実施形態6は、現フレームの動体の外接矩形による信頼度を、複数フレーム前まで遡って検出された同じ被写体の各検出矩形による信頼度と比較する実施形態である。実施形態6では、情報処理装置1は、現フレームの外接矩形および複数フレーム前までの検出矩形のうち、信頼度がより高くなる矩形を、現フレームの動体の検出矩形として出力する。
【0113】
実施形態6に係る情報処理装置1のハードウェア構成および機能構成は、実施形態1と同様であるため、説明は省略する。図13は、実施形態6に係る検出矩形出力処理の例を示すフローチャートである。実施形態6に係る検出矩形出力処理は、図4に示す実施形態1の検出矩形出力処理に対し、フレームを遡るループ処理L3が追加されている。図4に示す実施形態1の検出矩形出力処理と同じ処理については、同じ符号を付して説明は省略する。
【0114】
図13の例では、S105、S106、S1301のループ処理L4は、kフレーム(k=1,…,L)前までの各フレームで繰り返される。遡るフレーム数Lは、例えば5フレーム程度とし、処理時間および処理負荷に応じて決定されればよい。S1301では、算出部122は、図4のS107と同様に、現フレームの動体iの被写体と同じであると
判定された動体jの検出矩形によって、現フレームから切り取った動体iの信頼度を算
出する。
【0115】
S1302では、決定部124は、遡った各フレームで算出された信頼度と、S103で算出した外接矩形による信頼度とを比較する。決定部124は、比較した信頼度のうち最も高い信頼度の矩形を動体iの検出矩形として決定する。なお、S1302の信頼度を
比較する処理は、S1301の信頼度算出後に行ってもよい。
【0116】
実施形態6では、情報処理装置1は、複数フレーム前まで遡って得られる検出矩形による信頼度を、現フレームでの外接矩形による信頼度と比較する。前フレームに限らず複数フレーム前まで遡ることにより、出力する検出矩形による信頼度は改善され、情報処理装置1は、安定した検出矩形を出力することができる。
【0117】
<実施形態7>
実施形態7は、前フレームの検出矩形の位置およびサイズを補正し、補正後の検出矩形を用いて、現フレームで検出した動体の信頼度を算出する実施形態である。現フレームで検出される動体は、前フレームからの移動により、前フレームでの検出矩形を現フレームに適用しても所望の信頼度を得られない可能性がある。そこで、情報処理装置1は、前フレームでの検出矩形の位置または大きさを補正することにより、前フレームでの検出矩形による信頼度を改善する。
【0118】
実施形態7に係る情報処理装置1のハードウェア構成は、実施形態1と同様であるため、説明は省略する。図14は、実施形態7に係る情報処理装置の機能構成を例示する図である。実施形態7に係る情報処理装置1は、図3に示す実施形態1での機能構成に加えて、補正部125を備える。図3と同じ機能構成については、同じ符号を付して説明は省略する。
【0119】
補正部125は、現フレームで検出された動体と同じ被写体に対する前フレームでの検出矩形を補正する。ここで、図15を参照して、検出矩形の補正について説明する。時刻T、時刻T-1、時刻T-2は、それぞれ現フレーム、前回フレーム、前々回フレームの撮像時刻である。矩形A151は、前々回フレームで検出された動体の検出矩形である。矩形A152は、前回フレームで検出された動体の検出矩形である。矩形A151は、および矩形A152の情報は、検出矩形データベース13に格納されている。矩形A153は、現フレームで検出された動体の外接矩形である。図15の例では、人体の頭部が動体として認識されず、矩形A153は、頭部を除く部分を囲む矩形となっている。
【0120】
動体の移動により前回の矩形A152は、補正なしで現フレームに適用すると、現フレームでの動体の位置とずれが生じる。このため、矩形A152による信頼度は、頭部が動体として認識されていない矩形A153による信頼度よりも低くなる可能性がある。
【0121】
補正部125は、前回の矩形A152の位置および大きさを、現フレームでの動体の位置に合わせて補正する。補正部125は、例えば、前回フレームの矩形A152および前々回フレームの矩形A151の幅、高さ、中心座標等の変化量に基づいて、現フレームでの矩形の幅、高さ、中心座標の推定値を算出することができる。
【0122】
具体的には、補正部125は、前々回フレームおよび前回フレームの検出矩形の中心座標から動体が移動する向きおよび移動距離を推定し、現フレームでの中心座標を算出することができる。また、補正部125は、前々回フレームおよび前回フレームの検出矩形の幅、高さの平均値を、現フレームでの幅、高さとして算出することができる。補正部125は、算出した推定値に基づいて、補正矩形A154を生成することができる。
【0123】
補正矩形A154によって現フレームでの動体の信頼度を算出することで、情報処理装置1は、より信頼度の高い検出矩形を出力することができるようになる。なお、補正矩形
は、前回フレームおよび前々回フレームに限られず、現フレームの外接矩形および複数フレーム前に遡って得られた検出矩形の情報に基づいて生成されてもよい。
【0124】
図16は、実施形態7に係る検出矩形出力処理の例を示すフローチャートである。実施形態7に係る検出矩形出力処理は、図4に示す実施形態1の検出矩形出力処理のS107、S108に代えて、前フレームでの検出矩形を補正し、補正した矩形により信頼度を算出する処理(S1601からS1603)が追加されている。図4に示す実施形態1の検出矩形出力処理と同じ処理については、同じ符号を付して説明は省略する。
【0125】
図16の例では、S106で、現フレームの動体iの被写体と同じであると判定された
動体jに対し、処理はS1601に進む。S1601では、補正部125は、動体jの検出矩形を、動体jの検出矩形と、前フレームよりも前のフレームで動体iと同じ被
写体であると判定された動体の検出矩形との位置および大きさの変化量に基づいて補正する。
【0126】
S1602では、算出部122は、S1601で補正された補正矩形によって、現フレームから切り取った動体iの信頼度を算出する。S1603では、決定部124は、S1
602で算出した信頼度と、S103で算出した外接矩形による信頼度とを比較する。決定部124は、現フレームの動体iの外接矩形による信頼度が、補正矩形による信頼度よ
りも高い場合、外接矩形を、現フレームの動体iの検出矩形として決定する。一方、補正
矩形による信頼度が、外接矩形による信頼度よりも高い場合、決定部124は、補正矩形を、現フレームの動体iの検出矩形として決定する。
【0127】
実施形態7では、補正部125は、前フレームで検出された動体の検出矩形を、前フレームより前のフレームでの検出矩形に基づいて補正する。情報処理装置1は、前フレームでの検出矩形を補正することにより、補正矩形を現フレームに適用した場合の動体の信頼度を改善することができる。
【0128】
<その他>
上記実施形態は、本発明の構成例を例示的に説明するものに過ぎない。各実施形態の構成は、上記の具体的な形態には限定されることはなく、本発明の技術的思想の範囲内で適宜組み合わせて利用することができる。また、本発明は、その技術的思想を逸脱しない範囲で、種々の変形が可能である。
【0129】
なお、上述の各実施形態で、人体らしさの信頼度は、不特定の人体であることの信頼度として説明したが、これに限られない。信頼度は、検出対象である特定の人物であることの信頼度であってもよい。
【0130】
また、上述の各実施形態で、前フレームまたは複数フレーム前に遡る場合、連続するフレームを順に遡る例で説明したが、これに限られない。情報処理装置1は、2フレーム、3フレームといった複数フレームおきに前のフレームに遡って、信頼度がより高くなる矩形を、現フレームの検出矩形として出力してもよい。
【0131】
また、上述の各実施形態では、現フレームより前のフレームで検出された動体の検出矩形を用いて、現フレームの動体の信頼度を算出したが、これに限られない。情報処理装置1は、撮影済みの動画では、現フレームより後のフレームで検出された動体の外接矩形を用いて、現フレームの動体の信頼度を算出してもよい。この場合、情報処理装置1は、現フレームでの動体の外接矩形による信頼度よりも、後のフレームで検出された動体の外接矩形を用いて算出した信頼度が大きい場合、後のフレームの外接矩形を、現フレームでの検出矩形に決定することができる。
【0132】
<付記1>
(1)動画像の各フレーム画像から動体を検出する検出部(121)と、
前記検出された動体が所定の被写体である信頼度を算出する算出部(122)と、
第1のフレームで検出された第1の動体に外接する枠による前記第1の動体の信頼度、および前記第1のフレームより前の第2のフレームで検出された第2の動体の検出枠による前記第1のフレームでの前記第1の動体の信頼度に基づいて、前記第1の動体の検出枠を決定し、記録部に記録する決定部(124)と、
を備える情報処理装置(1)。
【0133】
(2)コンピュータが、
動画像に含まれる第1のフレームから第1の動体を検出する検出ステップ(S101)と、
前記第1の動体が所定の被写体である信頼度を、前記第1の動体に外接する枠、および記録部に記録されている検出枠であって、前記第1のフレームより前の第2のフレームで検出された第2の動体の検出枠を用いて算出する算出ステップ(S103、S107)と、
前記第1の動体に外接する枠による前記第1の動体の信頼度、および前記第2の動体の検出枠による前記第1のフレームでの前記第1の動体の信頼度に基づいて、前記第1の動体の検出枠を決定し、前記記録部に記録する決定ステップ(S108、S109)と、
を含む情報処理方法。
【符号の説明】
【0134】
1:情報処理装置、2:カメラ、11:画像取得部、12:処理部、121:検出部、122:算出部、123:判定部、124:決定部、125:補正部、13:検出矩形データベース、14:出力部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16