(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-02-06
(45)【発行日】2023-02-14
(54)【発明の名称】目標検出方法、装置、電子デバイス、記憶媒体、及びプログラム
(51)【国際特許分類】
G06T 7/174 20170101AFI20230207BHJP
【FI】
G06T7/174
(21)【出願番号】P 2020193157
(22)【出願日】2020-11-20
【審査請求日】2020-11-20
(31)【優先権主張番号】202010090507.6
(32)【優先日】2020-02-13
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】521208273
【氏名又は名称】阿波▲羅▼智▲聯▼(北京)科技有限公司
【氏名又は名称原語表記】APOLLO INTELLIGENT CONNECTIVITY(BEIJING)TECHNOLOGY CO.,LTD.
【住所又は居所原語表記】101, 1st Floor, Building 1, Yard 7, Ruihe West 2nd Road, Beijing Economic and Technological Development Zone, Beijing 100176, China
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】シアオシアン チュー
(72)【発明者】
【氏名】ファン ヤン
(72)【発明者】
【氏名】チョンファー ワン
(72)【発明者】
【氏名】ヨンイー スン
【審査官】山田 辰美
(56)【参考文献】
【文献】特開2010-251849(JP,A)
【文献】特開2019-133658(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
(57)【特許請求の範囲】
【請求項1】
複数のフレーム画像において、候補目標を含む少なくとも1フレームの第1画像を決定することと、
各前記第1画像
に前記候補目標の
出現する信頼度をそれぞれ取得することと、
各前記第1画像の重みと前記信頼度とに基づいて、前記候補目標の出現確率を計算することと、
前記出現確率が予め設定された第1条件を満たす場合、前記候補目標を最終目標として決定することと、を含
み、
前記第1画像の重みは、現在の時刻からの先後、又は前記第1画像において検出された候補目標の数に応じて設定される、
ことを特徴とする目標検出方法。
【請求項2】
前記複数のフレーム画像のうち、最終の1フレーム画像に前記最終目標が含まれていない場合、前記最終目標の各前記第1画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、前記最終目標が前記最終の1フレーム画像に現れる位置を予測すること、をさらに含む、
ことを特徴とする請求項1に記載の目標検出方法。
【請求項3】
前記候補目標の出現確率を計算することは、
各前記第1画像の重みと前記候補目標の対応する前記第1画像に
出現する信頼度とをそれぞれ乗算して、各前記第1画像における前記候補目標の第1出現確率を取得することと、
各前記第1画像における前記候補目標の第1出現確率を加算して、前記候補目標の出現確率を取得することと、を含む、
ことを特徴とする請求項1に記載の目標検出方法。
【請求項4】
前記候補目標の決定は、
任意の1フレーム画像における任意の目標に対して、前記目標の
出現する信頼度が予め設定された第2条件を満たす場合に、前記目標を候補目標として決定すること、を含む、
ことを特徴とする請求項1~請求項3のいずれか1項に記載の目標検出方法。
【請求項5】
前記目標の決定は、
任意の1フレーム画像中の第1検出枠を取得することと、
前記第1検出枠と前記任意の1フレーム画像より前の他の画像における第2検出枠との重なり度が予め設定された第3条件を満たす場合、前記第1検出枠における目標は前記他の画像において既に検出された目標であると決定し、そうでない場合、前記第1検出枠における目標は前記任意の1フレーム画像において新たに検出された目標であると決定することと、を含む、
ことを特徴とする請求項4に記載の目標検出方法。
【請求項6】
複数のフレーム画像において、候補目標を含む少なくとも1フレームの第1画像を決定する画像決定モジュールと、
各前記第1画像
に前記候補目標の
出現する信頼度をそれぞれ取得する信頼度取得モジュールと、
各前記第1画像の重みと前記信頼度とに基づいて、前記候補目標の出現確率を計算する出現確率計算モジュールと、
前記出現確率が予め設定された第1条件を満たす場合、前記候補目標を最終目標として決定する最終目標決定モジュールと、を備
え、
前記第1画像の重みは、現在の時刻からの先後、又は前記第1画像において検出された候補目標の数に応じて設定される、
ことを特徴とする目標検出装置。
【請求項7】
前記複数のフレーム画像のうち、最終の1フレーム画像に前記最終目標が含まれていない場合、前記最終目標の各前記第1画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、前記最終目標が前記最終の1フレーム画像に現れる位置を予測する位置予測モジュールをさらに備える、
ことを特徴とする請求項6に記載の目標検出装置。
【請求項8】
前記出現確率計算モジュールは、
各前記第1画像の重みと前記候補目標の対応する前記第1画像に
出現する信頼度とをそれぞれ乗算して、各前記第1画像における前記候補目標の第1出現確率を取得する第1出現確率計算サブモジュールと、
各前記第1画像における前記候補目標の第1出現確率を加算して、前記候補目標の出現確率を取得する出現確率計算実行サブモジュールと、を備える、
ことを特徴とする請求項6に記載の目標検出装置。
【請求項9】
任意の1フレーム画像における任意の目標に対して、前記目標の
出現する信頼度が予め設定された第2条件を満たす場合に、前記目標を候補目標として決定する候補目標決定モジュールをさらに備える、
ことを特徴とする請求項6~請求項8のいずれか1項に記載の目標検出装置。
【請求項10】
任意の1フレーム画像中の第1検出枠を取得する第1検出枠決定モジュールと、
前記第1検出枠と前記任意の1フレーム画像より前の他の画像における第2検出枠との重なり度が予め設定された第3条件を満たす場合、前記第1検出枠における目標は前記他の画像において既に検出された目標であると決定し、そうでない場合、前記第1検出枠における目標は前記任意の1フレーム画像において新たに検出された目標であると決定する目標確定モジュールと、をさらに備える、
ことを特徴とする請求項9に記載の目標検出装置。
【請求項11】
1つ又は複数のプロセッサと、
前記1つ又は複数のプロセッサに通信接続されるメモリとを備え、
前記メモリには、前記1つ又は複数のプロセッサにより実行可能なコマンドを記憶しており、
前記1つ又は複数のプロセッサは、前記1つ又は複数のコマンドを実行する場合、請求項1~
請求項5のいずれか1項に記載の目標検出方法を実行させる、
ことを特徴とする電子デバイス。
【請求項12】
請求項1~
請求項5のいずれか1項に記載の目標検出方法をコンピュータに実行させるためのコンピュータコマンドを記憶した非一過性のコンピュータ可読記憶媒体。
【請求項13】
コンピュータにおいて、プロセッサにより実行される場合、請求項1~
請求項5のいずれか1項に記載の目標検出方法を実現することを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータビジョンの技術分野に関し、特に目標検出方法、装置、電子デバイス、記憶媒体、及びプログラムに関する。
【背景技術】
【0002】
従来技術において、目標の検出は単一フレーム画像の認識に依存している。目標認識アルゴリズムに基づいて検出目標は求められる。目標認識アルゴリズム自体の制約や訓練レベルの制約により、誤検出や検出漏れなどが生じる可能性があり、目標検出の正確性は高くない。
【発明の概要】
【発明が解決しようとする課題】
【0003】
本発明は、従来技術における1つ又は複数の技術的課題を解決するための目標検出方法、装置、電子デバイス、及び記憶媒体を提供する。
【課題を解決するための手段】
【0004】
本発明の第1態様は、目標検出方法を提供する。当該目標検出方法は、
複数のフレーム画像において、候補目標を含む少なくとも1フレームの第1画像を決定することと、
各第1画像における候補目標の信頼度をそれぞれ取得することと、
各第1画像の重みと信頼度とに基づいて、候補目標の出現確率を計算することと、
出現確率が予め設定された第1条件を満たす場合、候補目標を最終目標として決定することと、を含む。
【0005】
上記方案によれば、複数のフレーム画像の検出結果を用いて候補目標に対して総合的な判断を行うことで、検出された最終目標を決定することができる。単一フレーム画像による誤検出や検出漏れなどの状況を回避し、最終目標の検出に対する正確性を高めることができる。
【0006】
1つの実施形態において、当該目標検出方法は、
複数のフレーム画像のうち、最終の1フレーム画像に最終目標が含まれていない場合、最終目標の各第1画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、最終目標が最終の1フレーム画像に現れる位置を予測することをさらに含む。
【0007】
上記方案によれば、複数のフレーム画像のうちの最終の1フレーム画像に最終目標が検出されなくとも、最終目標の他のフレーム画像における移動速度を検出することにより、最終目標の最終の1フレーム画像における位置を推定することができる。最終目標の最終の1フレーム画像における位置を比較的正確に決定することができる。
【0008】
1つの実施形態において、候補目標の出現確率を計算することは、
各第1画像の重みと候補目標の対応する第1画像における信頼度とをそれぞれ乗算して、各第1画像における候補目標の第1出現確率を取得することと、
各第1画像における候補目標の第1出現確率を加算して、候補目標の出現確率を取得することと、を含む。
【0009】
上記方案によれば、検出される候補目標の各フレーム画像の重みと候補目標の対応するフレーム画像における信頼度とに基づいて、候補目標の出現確率を客観的に反映することができる。
【0010】
1つの実施形態において、候補目標の決定は、
任意の1フレーム画像における任意の目標に対して、目標の信頼度が予め設定された第2条件を満たす場合に、目標を候補目標として決定することを含む。
【0011】
上記方案によれば、候補目標に対して比較的正確な認識を行うことができる。
【0012】
1つの実施形態において、目標の決定は、
任意の1フレーム画像中の第1検出枠を取得することと、
第1検出枠と任意の1フレーム画像より前の他の画像における第2検出枠との重なり度が予め設定された第3条件を満たす場合、第1検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第1検出枠における目標は任意の1フレーム画像において新たに検出された目標であると決定することと、を含む。
上記方案によれば、目標が異なる画像において変位が発生する場合であっても、候補目標の正確な決定を実現することができる。
本発明の第2態様は、目標検出装置を提供する。当該目標検出装置は、
複数のフレーム画像において、候補目標を含む少なくとも1フレームの第1画像を決定する画像決定モジュールと、
各第1画像における候補目標の信頼度をそれぞれ取得する信頼度取得モジュールと、
各第1画像の重みと信頼度とに基づいて、候補目標の出現確率を計算する出現確率計算モジュールと、
出現確率が予め設定された第1条件を満たす場合、候補目標を最終目標として決定する最終目標決定モジュールと、を備える。
【0013】
1つの実施形態において、当該目標検出装置は、
複数のフレーム画像のうち、最終の1フレーム画像に最終目標が含まれていない場合、最終目標の各第1画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、最終目標が最終の1フレーム画像に現れる位置を予測する位置予測モジュールをさらに備える。
【0014】
1つの実施形態において、出現確率計算モジュールは、
各第1画像の重みと候補目標の対応する第1画像における信頼度とをそれぞれ乗算して、各第1画像における候補目標の第1出現確率を取得する第1出現確率計算サブモジュールと、
各第1画像における候補目標の第1出現確率を加算して、候補目標の出現確率を取得する出現確率計算実行サブモジュールと、を備える。
【0015】
1つの実施形態において、当該目標検出装置は、
任意の1フレーム画像における任意の目標に対して、目標の信頼度が予め設定された第2条件を満たす場合に、目標を候補目標として決定する候補目標決定モジュールをさらに備える。
【0016】
1つの実施形態において、当該目標検出装置は、
任意の1フレーム画像中の第1検出枠を取得する第1検出枠決定モジュールと、
第1検出枠と任意の1フレーム画像より前の他の画像における第2検出枠との重なり度が予め設定された第3条件を満たす場合、第1検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第1検出枠における目標は任意の1フレーム画像において新たに検出された目標であると決定する目標確定モジュールと、をさらに備える。
【0017】
本発明の第3態様は、電子デバイスを提供する。当該電子デバイスは、
1つ又は複数のプロセッサと、
1つ又は複数のプロセッサに通信接続されるメモリとを含み、
メモリには、前記1つ又は複数のプロセッサにより実行可能なコマンドを記憶しており、
1つ又は複数のプロセッサは、1つ又は複数のコマンドを実行する場合、第1態様のいずれか1項に記載の目標検出方法を実行させる。
【0018】
本発明の第4態様は、コンピュータコマンドが記憶された非一過性のコンピュータ可読記憶媒体を提供し、コンピュータコマンドが第1態様のいずれか1項に記載の目標検出方法を実行させる。
【発明の効果】
【0019】
本発明は、従来技術における1つ又は複数の技術的課題を解決するための目標検出方法、装置、電子デバイス、及び記憶媒体を提供する。
【0020】
上記の選択可能な実施形態によるその他の効果は、具体的な実施形態とあわせて後述する。
【図面の簡単な説明】
【0021】
【
図1】本発明の実施形態による目標検出方法のフローチャートである。
【
図2】本発明の実施形態による目標検出方法のフローチャートである。
【
図3】本発明の実施形態による目標検出方法のフローチャートである。
【
図4】本発明の実施形態による目標検出装置のブロック図である。
【
図5】本発明の実施形態による目標検出装置のブロック図である。
【
図6】本発明の実施形態による目標検出装置のブロック図である。
【
図7】本発明の実施形態による目標検出方法を実現するための電子デバイスのブロック図である。
【発明を実施するための形態】
【0022】
添付図面は、本開示の理解を促すためのものであり、いかなる限定をも目的としない。
【0023】
以下、図面を参照しながら本発明の例示的な実施形態を説明するが、本発明の実施形態の様々な詳細が理解を容易にするために含まれており、それらは単なる例示と考えられるべきである。したがって、当業者は、本発明の範囲及び旨から逸脱することなく、本発明明細書に記載された実施形態に対して様々な変更及び修正を行うことができることを理解すべきである。同様に、以下の説明では、公知な機能及び構造についての説明は、明瞭かつ簡明のために省略される。
【0024】
本発明は目標検出方法を提供する。
図1に示されるよう、1つの実施形態において、目標検出方法は以下のステップS101~S104を含む。
【0025】
ステップS101において、複数のフレーム画像において、候補目標を含む少なくとも1フレームの第1画像を決定する。
【0026】
ステップS102において、各第1画像における候補目標の信頼度をそれぞれ取得する。
【0027】
ステップS103において、各第1画像の重みと信頼度とに基づいて、候補目標の出現確率を計算する。
【0028】
ステップS104において、出現確率が予め設定された第1条件を満たす場合、候補目標を最終目標として決定する。
【0029】
候補目標は、車両、歩行者、ペット、貨物などを含んでもよい。撮像装置を用いることで連続するフレーム画像を絶え間なく撮像することができ、連続するフレーム画像における各フレーム画像の時間間隔は同一であってもよい。スライディングウィンドウ方式によって時間的な順序を有する複数のフレーム画像を選択し、さらに選択された複数のフレーム画像において目標検出を行うことができる。
【0030】
例えば、候補目標が車両である場合、撮像装置は交通カメラであってもよい。車両認識アルゴリズムを用いて撮像装置により撮像された複数のフレーム画像に出現する候補目標を検出することができる。現在のフレーム画像から候補目標が検出されたことが確認された場合、現在のフレーム画像における候補目標の信頼度を取得することができる。例えば、車両認識アルゴリズムが現在のフレーム画像において、車両、歩行者、樹木の3つの目標を検出した。そのうち、車両の信頼度は0.9、歩行者の信頼度は0.1、樹木の信頼度は0.06とする。予め信頼度の閾値(例えば、信頼度の閾値を0.75とする)を設定することにより、車両認識アルゴリズムにより認識された目標の信頼度が信頼度の閾値を下回らない場合、認識された目標を候補目標と決定することができる。信頼度の閾値を下回る目標については、無視することができる(信頼度を0とする)。上述の例において、車両の信頼度は信頼度の閾値よりも高く、歩行者および樹木の信頼度は信頼度の閾値より低いため、車両認識アルゴリズムにより検出された車両を現在のフレーム画像における候補目標として決定することができる。
【0031】
各フレーム画像の重みは時間に基づいて設定されてもよい。例えば、現在の時刻からの先後に応じて各フレーム画像の重みを設定しても良い。現在時刻から最も近い画像の重みを一番高く設定することができる。また、各フレーム画像において検出された候補目標の数などの他の要因に応じて重みを設定しても良く、例えば、候補目標の数が多い画像を検出したとき、比較的低い重みを設定しても良い。あるいは、時間または候補目標の数などの要素を総合して重みを設定してもよい。
【0032】
例えば、複数のフレーム画像は5フレームの画像であってもよく、第1、5フレームの画像には候補目標が検出されず、残りの3フレームの画像はいずれも候補目標が検出された。この場合、残りの3フレームの画像の重みと残りの3フレームの画像における候補目標の信頼度とに基づいて、候補目標の出現確率を得ることができる。
【0033】
また、例えば、複数のフレーム画像が5フレームの画像である場合に、第1フレームの画像のみに候補目標が検出された。第1フレームの画像の重みと第1フレームの画像における候補目標の信頼度とに基づいて候補目標の出現確率を得ることができる。
【0034】
出現確率が予め設定された第1条件を満たす場合、候補目標を検出された最終目標とする。予め設定された第1条件は、出現確率が予め設定された第1閾値より大きい、または予め設定された第1閾値より小さくないなどであることができる。
【0035】
1フレーム画像において複数の候補目標が検出されてもよく、各候補目標が最終目標になり得るか否かについての判定方式は同様である。本実施形態は、1つの候補目標の判断プロセスのみを例として説明する。
【0036】
上記方案によれば、複数のフレーム画像の検出結果を用いて候補目標に対して総合的な判断を行うことで、検出された最終目標を決定することができる。スライディングウィンドウのスライドごとに、最終目標の検出を1回更新することができる。そのため、単一フレーム画像のみを用いて最終目標に対して検出を行うことを回避し、最終目標の検出に対する正確性を高めることができる。
【0037】
1つの実施形態において、当該目標検出方法は、
複数のフレーム画像のうち、最終の1フレーム画像に最終目標が含まれていない場合、最終目標の各第1画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、最終目標が最終の1フレーム画像に現れる位置を予測することをさらに含む。
【0038】
複数のフレーム画像のうち、最終の1フレームを出力結果の参照フレームとしてもよい。出力結果は、最終目標が最終の1フレーム画像に現れる位置であってもよく、または最終目標が最終の1フレーム画像に現れる位置に基づいて得られる最終目標のワールド座標系における位置であってもよい。
【0039】
前述の例のように、5フレームの画像を含み、第1、5フレームの画像には候補目標が検出されていない。判断により、当該候補目標を検出された最終目標とすることができる。最終の1フレーム(第5フレーム)の画像に最終目標(候補目標)が含まれていないため、最終目標の残りの3フレームの画像における位置変化に基づいて最終目標の最終の1フレーム画像における位置を予測する必要がある。例えば、候補目標が検出された任意の隣接する2フレームの画像を選択することができる。候補目標の選択された隣接する2フレームの画像における変位と、選択された隣接する2フレームの画像の時間間隔とを取得することにより、候補目標の隣接する2フレームの画像における移動速度を計算することができる。さらに、候補目標が最終の1フレーム画像に現れる位置を予測することができる。
【0040】
または、候補目標の3フレームの画像を検出することに基づき位置変化の平均値を得て、候補目標が最終の1フレーム画像に現れる位置を予測することもできる。例えば、候補目標が第2フレームの画像における第1位置と第4フレームの画像における第2位置とを取得する。第1位置と第2位置とに基づいて、候補目標が3フレームの画像における位置変化を得る。第2フレームの画像から第4フレームの画像までの時間間隔を組み合わせて、候補目標が3フレームの画像における平均移動速度を計算することができる。これにより、候補目標が最終の1フレーム画像に現れる位置を予測することができる。
【0041】
上記方案によれば、複数のフレーム画像のうちの最終の1フレーム画像に最終目標が検出されなくとも、最終目標の他のフレーム画像における移動速度に基づき最終目標の最終の1フレーム画像における位置を推定することができる。最終目標が最終の1フレーム画像における位置の比較的正確な決定を実現することができる。
【0042】
図2に示されるよう、1つの実施形態において、候補目標の出現確率を計算することは以下のステップS201、S202を含む。
【0043】
ステップS201において、各第1画像の重みと候補目標の対応する第1画像における信頼度とをそれぞれ乗算して、各第1画像における候補目標の第1出現確率を取得する。
【0044】
ステップS202において、各第1画像における候補目標の第1出現確率を加算して、候補目標の出現確率を取得する。
【0045】
前述の例のように、5フレームの画像を含み、第1、5フレームの画像には候補目標が検出されていない。即ち、第2フレームから第4フレームまでの3フレームの画像から候補目標が検出されている。
【0046】
上記3フレームの画像の重みをそれぞれ取得し、Q2、Q3、Q4とする。
【0047】
上記3フレームの画像における候補目標の信頼度をそれぞれC2、C3、C4とする。
【0048】
上記3フレームの画像における候補目標のある第1出現確率をそれぞれP2、P3、P4とし、ここで、P2= Q2* C2、P3= Q3* C3、P4= Q4* C4である。
【0049】
候補目標の出現確率はPで表すことができ、ここで、P=P2+P3+P4である。
【0050】
上記方案によれば、各フレーム画像の重みと信頼度とに基づいて、候補目標の出現確率を客観的に反映することができる。
【0051】
1つの実施形態において、候補目標の決定は、
任意の1フレーム画像における任意の目標に対して、目標の信頼度が予め設定された第2条件を満たす場合に、目標を候補目標として決定することを含む。
【0052】
撮像装置により撮像された画像には、複数の目標が含まれる可能性があり、例えば、車両、歩行者、ペット、緑色植物などを含む複数の目標である可能性がある。例えば、候補目標が車両である場合、車両認識アルゴリズムを用いて画像内の目標に対して認識を行うことができ、かつ、目標ごとに対応して信頼度を得ることができる。
【0053】
予め設定された第2条件は信頼度が予め設定された第2閾値より大きい、または予め設定された第2閾値より小さくないなどであることができる。信頼度が予め設定された第2条件を満たす場合のみ、対応する目標が候補目標であると決定でき、即ち、車両の識別ができたと決定できる。
【0054】
上記方案によれば、候補目標に対して比較的正確な認識を行うことができる。
【0055】
図3に示されるよう、1つの実施形態において、目標の決定は以下のステップS301、S302を含む。
【0056】
ステップS301において、任意の1フレーム画像中の第1検出枠を取得する。
【0057】
ステップS302において、第1検出枠と任意の1フレーム画像より前の他の画像における第2検出枠との重なり度が予め設定された第3条件を満たす場合、第1検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第1検出枠における目標は任意の1フレーム画像において新たに検出された目標であると決定する。
【0058】
具体的には、スライディングウィンドウに含まれる複数のフレーム画像のうち、任意の1フレーム画像から目標が検出された場合、目標に対応する第1検出枠を生成することができる。例えば、任意の1フレーム画像を第Nフレーム画像とすると、第N-1フレーム画像から前の画像を遍歴することができる。第N-1フレーム画像における第2検出枠を取得する。第1検出枠と第2検出枠との重なり度を比較する。第1検出枠と第2検出枠の重なり度が予め設定された第3条件を満たすものを検出すると、遍歴を停止する。
【0059】
予め設定された第3条件は重なり度が予め設定された第3閾値より大きい、または予め設定された第3閾値より小さくないなどであることができる。
【0060】
第1検出枠と第2検出枠との重なり度が予め設定された第3条件を満たす場合、目標は現在のフレームより前の他のフレーム画像において既に出現したことを表し、もって、目標に対して追跡をすることができる。追跡の方法は、同じラベルを用いて異なる画像における同じ目標に対してラベル付けをすることを含んでもよい。
【0061】
一方、第1検出枠と第2検出枠との重なり度が予め設定された第3条件を満たさない場合、第1検出枠における目標は当該任意の1フレーム画像において新たに検出された目標であると決定することができる。新たに検出された目標については、新しいラベルを用いてラベル付けをしてもよい。
【0062】
本発明の実施形態は、目標検出装置を提供する。
図4に示されるよう、1つの実施形態において、目標検出装置は、
複数のフレーム画像において、候補目標を含む少なくとも1フレームの第1画像を決定する画像決定モジュール401と、
各第1画像における候補目標の信頼度をそれぞれ取得する信頼度取得モジュール402と、
各第1画像の重みと信頼度とに基づいて、候補目標の出現確率を計算する出現確率計算モジュール403と、
出現確率が予め設定された第1条件を満たす場合、候補目標を最終目標として決定する最終目標決定モジュール404と、を備える。
【0063】
1つの実施形態において、当該目標検出装置は、
複数のフレーム画像のうち、最終の1フレーム画像に最終目標が含まれていない場合、最終目標の各第1画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、最終目標が最終の1フレーム画像に現れる位置を予測する位置予測モジュールをさらに備える。
【0064】
図5に示されるよう、1つの実施形態において、出現確率計算モジュール403は、
各第1画像の重みと候補目標の対応する第1画像における信頼度とをそれぞれ乗算して、各第1画像における候補目標の第1出現確率を取得する第1出現確率計算サブモジュール4031と、
各第1画像における候補目標の第1出現確率を加算して、候補目標の出現確率を取得する出現確率計算実行サブモジュール4032と、を備える。
【0065】
1つの実施形態において、当該目標検出装置は、
任意の1フレーム画像における任意の目標に対して、目標の信頼度が予め設定された第2条件を満たす場合に、目標を候補目標として決定する候補目標決定モジュールをさらに備える。
【0066】
図6に示されるよう、1つの実施形態において、当該目標検出装置は、
任意の1フレーム画像中の第1検出枠を取得する第1検出枠決定モジュール405と、
第1検出枠と任意の1フレーム画像より前の他の画像における第2検出枠との重なり度が予め設定された第3条件を満たす場合、第1検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第1検出枠における目標は任意の1フレーム画像において新たに検出された目標であると決定する目標確定モジュール406と、をさらに備える。
【0067】
本発明の実施形態に係る各装置における各モジュールの機能は、上述の方法における対応する説明を参照できるため、ここでは説明を省略する。
【0068】
本発明に係る実施形態は、電子デバイスとコンピュータ可読取記録媒体をさらに提供する。
【0069】
図7は、本発明の実施形態による目標検出方法を実現する電子デバイスのブロック図である。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような様々な形態のデジタルコンピュータを表すことができる。また、電子デバイスはパーソナルデジタル処理、携帯電話、スマートフォン、装着可能デバイス、及びその他の類似のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。ここで示した構成要素、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本発明で説明されたもの及び/または要求される本発明の実施を制限することは意図されない。
【0070】
図7に示すように、当該電子デバイスは、1つ又は複数のプロセッサ710と、メモリ720と、高速インターフェースと低速インターフェースとを含む各構成要素を接続するためのインターフェースとを含む。各構成要素は、異なるバスを利用して互いに接続し、共通のマザーボードに取り付けられてもよいし、必要に応じて他の方法で取り付けられてもよい。プロセッサは、電子デバイス内で実行される命令を処理してもよく、また、外部入出力デバイス(例えば、インターフェースに接続された表示デバイス)にグラフィックユーザインターフェース(Graphical User Interface,GUI)を表示するための、メモリまたはメモリ上に記憶されたグラフィカル情報の命令を含む。他の実施形態では、必要に応じて、複数のプロセッサ及び/または複数のバスを複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子デバイスを接続してもよく、各デバイスは、部分的に必要な動作(例えば、サーバアレイ、ブレードサーバのセット、またはマルチプロセッサシステムとして)を提供する。
図7においてプロセッサ710を例とする。
【0071】
メモリ720は、本発明にて提供された非一過性のコンピュータ可読記憶媒体である。メモリは、本発明で提供される目標検出方法を少なくとも1つのプロセッサに実行させるように、少なくとも1つのプロセッサによって実行されることができる命令を記憶する。本発明における非一過性のコンピュータ可読記憶媒体は、本発明で提供された目標検出方法をコンピュータに実行させるためのコンピュータ命令を記憶する。
【0072】
メモリ720は、非一過性のコンピュータ可読記憶媒体として、非一過性のソフトウェアプログラム、非一過性のコンピュータ実行可能なプログラム及びモジュールを記憶するために使用されてもよく、本発明の実施形態における目標検出方法に対応するプログラム命令/モジュール(例えば、
図4に示される画像決定モジュール401、信頼度取得モジュール402、出現確率計算モジュール403及び最終目標決定モジュール404)のようなものである。プロセッサ710は、メモリ720に記憶されている非一過性のソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理、すなわち上述した方法に関する実施形態に係る目標検出方法を実行する。
【0073】
メモリ720は、オペレーティングシステムや少なくとも1つの機能に必要なアプリケーションを記憶することができるプログラムの記憶領域と、目標検出方法に係る電子デバイスの使用によって生成されたデータなどを記憶することができるデータの記憶領域と、を含むことができる。さらに、メモリ720は、高速ランダムアクセスメモリを含んでもよく、非一過性の固体記憶装置を含んでもよい。例えば、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の非一過性の固体記憶装置を含むことができる。いくつかの実施形態では、メモリ720はオプションとして、プロセッサ710に対して遠隔的に設定されたメモリを含み、これらの遠隔メモリは、ネットワークを介して目標検出方法に係る電子デバイスに接続されてもよい。上記のネットワークの例は、インターネット、企業内ネットワーク、ローカルネットワーク、モバイル通信ネットワーク及びその組み合わせを含むが、これらに限定されない。
【0074】
目標検出方法に係る電子デバイスは、入力装置730と出力装置740とをさらに含むことができる。プロセッサ710、メモリ720、入力装置730、及び出力装置740は、バスまたは他の方法で接続されてもよく、
図7ではバスを介して接続されている。
【0075】
入力装置730は、入力された数字または文字を受信し、目標検出方法に係る電子デバイスのユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチパネル、キーパッド、マウス、トラックボード、タッチパッド、指示棒、1つまたは複数のマウスボタン、トラックボール、ジョイスティックなどを含むことができる。出力装置740は、表示装置、補助照明装置(例えばLED)、及び触覚フィードバック装置(例えば、振動モータ)などを含むことができる。この表示装置は、液晶ディスプレイ(Liquid Crystal Display、LCD)、発光ダイオード(Light Emitting Diode、LED)ディスプレイ及びプラズマディスプレイを含むことができるがこれらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。
【0076】
本発明におけるシステム及び技術に係る様々な実施形態は、デジタル電子回路システム、集積回路システム、専用集積回路(Application Specific Integrated Circuits、ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、及び/またはこれらの組み合わせによって実現されることができる。これらの様々な実施形態は、1つまたは複数のコンピュータプログラムにおいて実装されてもよく、この1つまたは複数のコンピュータプログラムは、少なくとも1つのプログラマブルプロセッサを含むプログラム可能なシステム上で実行されてもよく、及び/または解釈されてもよく、このプログラマブルプロセッサは、専用または汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置より、データと命令を受信し、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置に、データと命令を送信する。
【0077】
これらの計算プログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードともいう)は、プログラマブルプロセッサのマシン命令を含み、プロセス指向及び/またはオブジェクト指向プログラミング言語、及び/またはアセンブリ/マシン言語を用いてこれらの計算プログラムを実施することができる。本発明で使用されるように、「機械可読媒体」及び「コンピュータ可読媒体」という用語は、マシン命令及び/またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、及び/または装置(例えば、磁気ディスク、光ディスク、メモリ、編集可能論理デバイス(programmable logic device、PLD)を意味し、機械読み取り可能な信号としてのマシン命令を受信する機械可読媒体を含む。「機械読み取り可能な信号」という用語は、マシン命令及び/またはデータをプログラマブルプロセッサに提供するための任意の信号を意味する。
【0078】
ユーザとのイントラクションを提供するために、本発明で説明されているシステムや技術は、コンピュータ上で実施されてもよく、また、ユーザに情報を表示するための表示装置(例えば、CRT(Cathode Ray Tube、ブラウン管)またはLCD(液晶ディスプレイ)モニタ)と、入力をコンピュータに提供するためのキーボード及びポインティングデバイス(例えば、マウスまたはトラックボール)とを備えてもよい。他の種類の装置も、ユーザとのイントラクションを提供するために使用され得る。例えば、ユーザに提供されたフィードバックは、任意の形態のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック)であってもよく、ユーザからの入力は、いかなる形式(音響入力、音声入力、または触覚入力を含む)で受信されてもよい。
【0079】
本発明で説明されているシステム及び技術は、バックグラウンド構成要素を含む計算システム(例えば、データサーバとして)、または中間部構成要素を含む計算システム(例えば、アプリケーションサーバ)、または、フロントエンド構成要素を含む計算システム(例えば、グラフィカルユーザインタフェースまたはネットワークブラウザを備えたユーザコンピュータであって、ユーザがこのグラフィカルユーザインタフェースまたはネットワークブラウザを介して本発明で説明されたシステム及び技術に係る実施形態とインタラクションを行うことができるユーザコンピュータ)に実行されてもよく、または、このようなバックグラウンド構成要素、中間部構成要素、またはフロントエンド構成要素の任意の組合せを含む計算システムにおいて実行されてもよい。システムの構成要素は、任意の形態または媒体のデジタルデータ通信(例えば、通信ネットワーク)によって相互に接続されてもよい。通信ネットワークの例えとして、ローカルネットワーク(Local Area Network,LAN)、広域ネットワーク(Wide Area Network,WAN)及びインターネットを含む。
【0080】
コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバは一般的に相互に離れており、通信ネットワークを介してインタラクションを行う。クライアントとサーバとの関係を持つコンピュータプログラムがそれぞれのコンピュータ上で実行されることによって、クライアントとサーバとの関係は構築される。
【0081】
上記の様々な態様のフローを使用して、ステップを新たに順序付け、追加、または削除することが可能であることを理解すべきである。例えば、本発明で記載された各ステップは、並列に実行しても良いし、順次に実行しても良いし、異なる順序で実行しても良い。本発明で開示された技術案が所望する結果を実現することができる限り、本発明ではこれに限定されない。
【0082】
上記具体的な実施形態は、本発明の保護範囲に対する限定を構成するものではない。当業者は、設計事項やその他の要因によって、様々な修正、組み合わせ、サブ組み合わせ、及び代替が可能であることを理解するべきである。本発明の要旨及び原則内における変更、均等な置換及び改善等は、いずれも本発明の保護範囲に含まれるべきである。
【符号の説明】
【0083】
710 プロセッサ
720 メモリ