特許7221920 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 阿波▲羅▼智▲聯▼（北京）科技有限公司の特許一覧

特許7221920目標検出方法、装置、電子デバイス、記憶媒体、及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-02-06

(45)【発行日】2023-02-14

(54)【発明の名称】目標検出方法、装置、電子デバイス、記憶媒体、及びプログラム

(51)【国際特許分類】

G06T 7/174 20170101AFI20230207BHJP

【ＦＩ】

G06T7/174

【請求項の数】 13

(21)【出願番号】P 2020193157

(22)【出願日】2020-11-20

(65)【公開番号】P2021128753

(43)【公開日】2021-09-02

【審査請求日】2020-11-20

(31)【優先権主張番号】202010090507.6

(32)【優先日】2020-02-13

(33)【優先権主張国・地域又は機関】CN

(73)【特許権者】

【識別番号】521208273

【氏名又は名称】阿波▲羅▼智▲聯▼（北京）科技有限公司

【氏名又は名称原語表記】ＡＰＯＬＬＯＩＮＴＥＬＬＩＧＥＮＴＣＯＮＮＥＣＴＩＶＩＴＹ（ＢＥＩＪＩＮＧ）ＴＥＣＨＮＯＬＯＧＹＣＯ．，ＬＴＤ．

【住所又は居所原語表記】１０１，１ｓｔＦｌｏｏｒ，Ｂｕｉｌｄｉｎｇ１，Ｙａｒｄ７，ＲｕｉｈｅＷｅｓｔ２ｎｄＲｏａｄ，ＢｅｉｊｉｎｇＥｃｏｎｏｍｉｃａｎｄＴｅｃｈｎｏｌｏｇｉｃａｌＤｅｖｅｌｏｐｍｅｎｔＺｏｎｅ，Ｂｅｉｊｉｎｇ１００１７６，Ｃｈｉｎａ

(74)【代理人】

【識別番号】110001519

【氏名又は名称】弁理士法人太陽国際特許事務所

(72)【発明者】

【氏名】シアオシアンチュー

(72)【発明者】

【氏名】ファンヤン

(72)【発明者】

【氏名】チョンファーワン

(72)【発明者】

【氏名】ヨンイースン

【審査官】山田辰美

(56)【参考文献】

【文献】特開２０１０－２５１８４９（ＪＰ，Ａ）

【文献】特開２０１９－１３３６５８（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００－７／９０

(57)【特許請求の範囲】

【請求項1】

複数のフレーム画像において、候補目標を含む少なくとも１フレームの第１画像を決定することと、
各前記第１画像に前記候補目標の出現する信頼度をそれぞれ取得することと、
各前記第１画像の重みと前記信頼度とに基づいて、前記候補目標の出現確率を計算することと、
前記出現確率が予め設定された第１条件を満たす場合、前記候補目標を最終目標として決定することと、を含み、
前記第１画像の重みは、現在の時刻からの先後、又は前記第１画像において検出された候補目標の数に応じて設定される、
ことを特徴とする目標検出方法。

【請求項2】

前記複数のフレーム画像のうち、最終の１フレーム画像に前記最終目標が含まれていない場合、前記最終目標の各前記第１画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、前記最終目標が前記最終の１フレーム画像に現れる位置を予測すること、をさらに含む、
ことを特徴とする請求項１に記載の目標検出方法。

【請求項3】

前記候補目標の出現確率を計算することは、
各前記第１画像の重みと前記候補目標の対応する前記第１画像に出現する信頼度とをそれぞれ乗算して、各前記第１画像における前記候補目標の第１出現確率を取得することと、
各前記第１画像における前記候補目標の第１出現確率を加算して、前記候補目標の出現確率を取得することと、を含む、
ことを特徴とする請求項１に記載の目標検出方法。

【請求項4】

前記候補目標の決定は、
任意の１フレーム画像における任意の目標に対して、前記目標の出現する信頼度が予め設定された第２条件を満たす場合に、前記目標を候補目標として決定すること、を含む、
ことを特徴とする請求項１～請求項３のいずれか１項に記載の目標検出方法。

【請求項5】

前記目標の決定は、
任意の１フレーム画像中の第１検出枠を取得することと、
前記第１検出枠と前記任意の１フレーム画像より前の他の画像における第２検出枠との重なり度が予め設定された第３条件を満たす場合、前記第１検出枠における目標は前記他の画像において既に検出された目標であると決定し、そうでない場合、前記第１検出枠における目標は前記任意の１フレーム画像において新たに検出された目標であると決定することと、を含む、
ことを特徴とする請求項４に記載の目標検出方法。

【請求項6】

複数のフレーム画像において、候補目標を含む少なくとも１フレームの第１画像を決定する画像決定モジュールと、
各前記第１画像に前記候補目標の出現する信頼度をそれぞれ取得する信頼度取得モジュールと、
各前記第１画像の重みと前記信頼度とに基づいて、前記候補目標の出現確率を計算する出現確率計算モジュールと、
前記出現確率が予め設定された第１条件を満たす場合、前記候補目標を最終目標として決定する最終目標決定モジュールと、を備え、
前記第１画像の重みは、現在の時刻からの先後、又は前記第１画像において検出された候補目標の数に応じて設定される、
ことを特徴とする目標検出装置。

【請求項7】

前記複数のフレーム画像のうち、最終の１フレーム画像に前記最終目標が含まれていない場合、前記最終目標の各前記第１画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、前記最終目標が前記最終の１フレーム画像に現れる位置を予測する位置予測モジュールをさらに備える、
ことを特徴とする請求項６に記載の目標検出装置。

【請求項8】

前記出現確率計算モジュールは、
各前記第１画像の重みと前記候補目標の対応する前記第１画像に出現する信頼度とをそれぞれ乗算して、各前記第１画像における前記候補目標の第１出現確率を取得する第１出現確率計算サブモジュールと、
各前記第１画像における前記候補目標の第１出現確率を加算して、前記候補目標の出現確率を取得する出現確率計算実行サブモジュールと、を備える、
ことを特徴とする請求項６に記載の目標検出装置。

【請求項9】

任意の１フレーム画像における任意の目標に対して、前記目標の出現する信頼度が予め設定された第２条件を満たす場合に、前記目標を候補目標として決定する候補目標決定モジュールをさらに備える、
ことを特徴とする請求項６～請求項８のいずれか１項に記載の目標検出装置。

【請求項10】

任意の１フレーム画像中の第１検出枠を取得する第１検出枠決定モジュールと、
前記第１検出枠と前記任意の１フレーム画像より前の他の画像における第２検出枠との重なり度が予め設定された第３条件を満たす場合、前記第１検出枠における目標は前記他の画像において既に検出された目標であると決定し、そうでない場合、前記第１検出枠における目標は前記任意の１フレーム画像において新たに検出された目標であると決定する目標確定モジュールと、をさらに備える、
ことを特徴とする請求項９に記載の目標検出装置。

【請求項11】

１つ又は複数のプロセッサと、
前記１つ又は複数のプロセッサに通信接続されるメモリとを備え、
前記メモリには、前記１つ又は複数のプロセッサにより実行可能なコマンドを記憶しており、
前記１つ又は複数のプロセッサは、前記１つ又は複数のコマンドを実行する場合、請求項１～請求項５のいずれか１項に記載の目標検出方法を実行させる、
ことを特徴とする電子デバイス。

【請求項12】

請求項１～請求項５のいずれか１項に記載の目標検出方法をコンピュータに実行させるためのコンピュータコマンドを記憶した非一過性のコンピュータ可読記憶媒体。

【請求項13】

コンピュータにおいて、プロセッサにより実行される場合、請求項１～請求項５のいずれか１項に記載の目標検出方法を実現することを特徴とするプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、コンピュータビジョンの技術分野に関し、特に目標検出方法、装置、電子デバイス、記憶媒体、及びプログラムに関する。

【背景技術】

【0002】

従来技術において、目標の検出は単一フレーム画像の認識に依存している。目標認識アルゴリズムに基づいて検出目標は求められる。目標認識アルゴリズム自体の制約や訓練レベルの制約により、誤検出や検出漏れなどが生じる可能性があり、目標検出の正確性は高くない。

【発明の概要】

【発明が解決しようとする課題】

【0003】

本発明は、従来技術における１つ又は複数の技術的課題を解決するための目標検出方法、装置、電子デバイス、及び記憶媒体を提供する。

【課題を解決するための手段】

【0004】

本発明の第１態様は、目標検出方法を提供する。当該目標検出方法は、
複数のフレーム画像において、候補目標を含む少なくとも１フレームの第１画像を決定することと、
各第１画像における候補目標の信頼度をそれぞれ取得することと、
各第１画像の重みと信頼度とに基づいて、候補目標の出現確率を計算することと、
出現確率が予め設定された第１条件を満たす場合、候補目標を最終目標として決定することと、を含む。

【0005】

上記方案によれば、複数のフレーム画像の検出結果を用いて候補目標に対して総合的な判断を行うことで、検出された最終目標を決定することができる。単一フレーム画像による誤検出や検出漏れなどの状況を回避し、最終目標の検出に対する正確性を高めることができる。

【0006】

１つの実施形態において、当該目標検出方法は、
複数のフレーム画像のうち、最終の１フレーム画像に最終目標が含まれていない場合、最終目標の各第１画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、最終目標が最終の１フレーム画像に現れる位置を予測することをさらに含む。

【0007】

上記方案によれば、複数のフレーム画像のうちの最終の１フレーム画像に最終目標が検出されなくとも、最終目標の他のフレーム画像における移動速度を検出することにより、最終目標の最終の１フレーム画像における位置を推定することができる。最終目標の最終の１フレーム画像における位置を比較的正確に決定することができる。

【0008】

１つの実施形態において、候補目標の出現確率を計算することは、
各第１画像の重みと候補目標の対応する第１画像における信頼度とをそれぞれ乗算して、各第１画像における候補目標の第１出現確率を取得することと、
各第１画像における候補目標の第１出現確率を加算して、候補目標の出現確率を取得することと、を含む。

【0009】

上記方案によれば、検出される候補目標の各フレーム画像の重みと候補目標の対応するフレーム画像における信頼度とに基づいて、候補目標の出現確率を客観的に反映することができる。

【0010】

１つの実施形態において、候補目標の決定は、
任意の１フレーム画像における任意の目標に対して、目標の信頼度が予め設定された第２条件を満たす場合に、目標を候補目標として決定することを含む。

【0011】

上記方案によれば、候補目標に対して比較的正確な認識を行うことができる。

【0012】

１つの実施形態において、目標の決定は、
任意の１フレーム画像中の第１検出枠を取得することと、
第１検出枠と任意の１フレーム画像より前の他の画像における第２検出枠との重なり度が予め設定された第３条件を満たす場合、第１検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第１検出枠における目標は任意の１フレーム画像において新たに検出された目標であると決定することと、を含む。
上記方案によれば、目標が異なる画像において変位が発生する場合であっても、候補目標の正確な決定を実現することができる。
本発明の第２態様は、目標検出装置を提供する。当該目標検出装置は、
複数のフレーム画像において、候補目標を含む少なくとも１フレームの第１画像を決定する画像決定モジュールと、
各第１画像における候補目標の信頼度をそれぞれ取得する信頼度取得モジュールと、
各第１画像の重みと信頼度とに基づいて、候補目標の出現確率を計算する出現確率計算モジュールと、
出現確率が予め設定された第１条件を満たす場合、候補目標を最終目標として決定する最終目標決定モジュールと、を備える。

【0013】

１つの実施形態において、当該目標検出装置は、
複数のフレーム画像のうち、最終の１フレーム画像に最終目標が含まれていない場合、最終目標の各第１画像における位置変化と、隣接するフレーム画像の時間間隔とに基づいて、最終目標が最終の１フレーム画像に現れる位置を予測する位置予測モジュールをさらに備える。

【0014】

１つの実施形態において、出現確率計算モジュールは、
各第１画像の重みと候補目標の対応する第１画像における信頼度とをそれぞれ乗算して、各第１画像における候補目標の第１出現確率を取得する第１出現確率計算サブモジュールと、
各第１画像における候補目標の第１出現確率を加算して、候補目標の出現確率を取得する出現確率計算実行サブモジュールと、を備える。

【0015】

１つの実施形態において、当該目標検出装置は、
任意の１フレーム画像における任意の目標に対して、目標の信頼度が予め設定された第２条件を満たす場合に、目標を候補目標として決定する候補目標決定モジュールをさらに備える。

【0016】

１つの実施形態において、当該目標検出装置は、
任意の１フレーム画像中の第１検出枠を取得する第１検出枠決定モジュールと、
第１検出枠と任意の１フレーム画像より前の他の画像における第２検出枠との重なり度が予め設定された第３条件を満たす場合、第１検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第１検出枠における目標は任意の１フレーム画像において新たに検出された目標であると決定する目標確定モジュールと、をさらに備える。

【0017】

本発明の第３態様は、電子デバイスを提供する。当該電子デバイスは、
１つ又は複数のプロセッサと、
１つ又は複数のプロセッサに通信接続されるメモリとを含み、
メモリには、前記１つ又は複数のプロセッサにより実行可能なコマンドを記憶しており、
１つ又は複数のプロセッサは、１つ又は複数のコマンドを実行する場合、第１態様のいずれか１項に記載の目標検出方法を実行させる。

【0018】

本発明の第４態様は、コンピュータコマンドが記憶された非一過性のコンピュータ可読記憶媒体を提供し、コンピュータコマンドが第１態様のいずれか１項に記載の目標検出方法を実行させる。

【発明の効果】

【0019】

本発明は、従来技術における１つ又は複数の技術的課題を解決するための目標検出方法、装置、電子デバイス、及び記憶媒体を提供する。

【0020】

上記の選択可能な実施形態によるその他の効果は、具体的な実施形態とあわせて後述する。

【図面の簡単な説明】

【0021】

【図1】本発明の実施形態による目標検出方法のフローチャートである。

【図2】本発明の実施形態による目標検出方法のフローチャートである。

【図3】本発明の実施形態による目標検出方法のフローチャートである。

【図4】本発明の実施形態による目標検出装置のブロック図である。

【図5】本発明の実施形態による目標検出装置のブロック図である。

【図6】本発明の実施形態による目標検出装置のブロック図である。

【図7】本発明の実施形態による目標検出方法を実現するための電子デバイスのブロック図である。

【発明を実施するための形態】

【0022】

添付図面は、本開示の理解を促すためのものであり、いかなる限定をも目的としない。

【0023】

以下、図面を参照しながら本発明の例示的な実施形態を説明するが、本発明の実施形態の様々な詳細が理解を容易にするために含まれており、それらは単なる例示と考えられるべきである。したがって、当業者は、本発明の範囲及び旨から逸脱することなく、本発明明細書に記載された実施形態に対して様々な変更及び修正を行うことができることを理解すべきである。同様に、以下の説明では、公知な機能及び構造についての説明は、明瞭かつ簡明のために省略される。

【0024】

本発明は目標検出方法を提供する。図１に示されるよう、１つの実施形態において、目標検出方法は以下のステップＳ１０１～Ｓ１０４を含む。

【0025】

ステップＳ１０１において、複数のフレーム画像において、候補目標を含む少なくとも１フレームの第１画像を決定する。

【0026】

ステップＳ１０２において、各第１画像における候補目標の信頼度をそれぞれ取得する。

【0027】

ステップＳ１０３において、各第１画像の重みと信頼度とに基づいて、候補目標の出現確率を計算する。

【0028】

ステップＳ１０４において、出現確率が予め設定された第１条件を満たす場合、候補目標を最終目標として決定する。

【0029】

候補目標は、車両、歩行者、ペット、貨物などを含んでもよい。撮像装置を用いることで連続するフレーム画像を絶え間なく撮像することができ、連続するフレーム画像における各フレーム画像の時間間隔は同一であってもよい。スライディングウィンドウ方式によって時間的な順序を有する複数のフレーム画像を選択し、さらに選択された複数のフレーム画像において目標検出を行うことができる。

【0030】

例えば、候補目標が車両である場合、撮像装置は交通カメラであってもよい。車両認識アルゴリズムを用いて撮像装置により撮像された複数のフレーム画像に出現する候補目標を検出することができる。現在のフレーム画像から候補目標が検出されたことが確認された場合、現在のフレーム画像における候補目標の信頼度を取得することができる。例えば、車両認識アルゴリズムが現在のフレーム画像において、車両、歩行者、樹木の３つの目標を検出した。そのうち、車両の信頼度は０．９、歩行者の信頼度は０．１、樹木の信頼度は０．０６とする。予め信頼度の閾値（例えば、信頼度の閾値を０．７５とする）を設定することにより、車両認識アルゴリズムにより認識された目標の信頼度が信頼度の閾値を下回らない場合、認識された目標を候補目標と決定することができる。信頼度の閾値を下回る目標については、無視することができる（信頼度を０とする）。上述の例において、車両の信頼度は信頼度の閾値よりも高く、歩行者および樹木の信頼度は信頼度の閾値より低いため、車両認識アルゴリズムにより検出された車両を現在のフレーム画像における候補目標として決定することができる。

【0031】

各フレーム画像の重みは時間に基づいて設定されてもよい。例えば、現在の時刻からの先後に応じて各フレーム画像の重みを設定しても良い。現在時刻から最も近い画像の重みを一番高く設定することができる。また、各フレーム画像において検出された候補目標の数などの他の要因に応じて重みを設定しても良く、例えば、候補目標の数が多い画像を検出したとき、比較的低い重みを設定しても良い。あるいは、時間または候補目標の数などの要素を総合して重みを設定してもよい。

【0032】

例えば、複数のフレーム画像は５フレームの画像であってもよく、第１、５フレームの画像には候補目標が検出されず、残りの３フレームの画像はいずれも候補目標が検出された。この場合、残りの３フレームの画像の重みと残りの３フレームの画像における候補目標の信頼度とに基づいて、候補目標の出現確率を得ることができる。

【0033】

また、例えば、複数のフレーム画像が５フレームの画像である場合に、第１フレームの画像のみに候補目標が検出された。第１フレームの画像の重みと第１フレームの画像における候補目標の信頼度とに基づいて候補目標の出現確率を得ることができる。

【0034】

出現確率が予め設定された第１条件を満たす場合、候補目標を検出された最終目標とする。予め設定された第１条件は、出現確率が予め設定された第１閾値より大きい、または予め設定された第１閾値より小さくないなどであることができる。

【0035】

１フレーム画像において複数の候補目標が検出されてもよく、各候補目標が最終目標になり得るか否かについての判定方式は同様である。本実施形態は、１つの候補目標の判断プロセスのみを例として説明する。

【0036】

上記方案によれば、複数のフレーム画像の検出結果を用いて候補目標に対して総合的な判断を行うことで、検出された最終目標を決定することができる。スライディングウィンドウのスライドごとに、最終目標の検出を１回更新することができる。そのため、単一フレーム画像のみを用いて最終目標に対して検出を行うことを回避し、最終目標の検出に対する正確性を高めることができる。

【0037】

【0038】

複数のフレーム画像のうち、最終の１フレームを出力結果の参照フレームとしてもよい。出力結果は、最終目標が最終の１フレーム画像に現れる位置であってもよく、または最終目標が最終の１フレーム画像に現れる位置に基づいて得られる最終目標のワールド座標系における位置であってもよい。

【0039】

前述の例のように、５フレームの画像を含み、第１、５フレームの画像には候補目標が検出されていない。判断により、当該候補目標を検出された最終目標とすることができる。最終の１フレーム（第５フレーム）の画像に最終目標（候補目標）が含まれていないため、最終目標の残りの３フレームの画像における位置変化に基づいて最終目標の最終の１フレーム画像における位置を予測する必要がある。例えば、候補目標が検出された任意の隣接する２フレームの画像を選択することができる。候補目標の選択された隣接する２フレームの画像における変位と、選択された隣接する２フレームの画像の時間間隔とを取得することにより、候補目標の隣接する２フレームの画像における移動速度を計算することができる。さらに、候補目標が最終の１フレーム画像に現れる位置を予測することができる。

【0040】

または、候補目標の３フレームの画像を検出することに基づき位置変化の平均値を得て、候補目標が最終の１フレーム画像に現れる位置を予測することもできる。例えば、候補目標が第２フレームの画像における第１位置と第４フレームの画像における第２位置とを取得する。第１位置と第２位置とに基づいて、候補目標が３フレームの画像における位置変化を得る。第２フレームの画像から第４フレームの画像までの時間間隔を組み合わせて、候補目標が３フレームの画像における平均移動速度を計算することができる。これにより、候補目標が最終の１フレーム画像に現れる位置を予測することができる。

【0041】

上記方案によれば、複数のフレーム画像のうちの最終の１フレーム画像に最終目標が検出されなくとも、最終目標の他のフレーム画像における移動速度に基づき最終目標の最終の１フレーム画像における位置を推定することができる。最終目標が最終の１フレーム画像における位置の比較的正確な決定を実現することができる。

【0042】

図２に示されるよう、１つの実施形態において、候補目標の出現確率を計算することは以下のステップＳ２０１、Ｓ２０２を含む。

【0043】

ステップＳ２０１において、各第１画像の重みと候補目標の対応する第１画像における信頼度とをそれぞれ乗算して、各第１画像における候補目標の第１出現確率を取得する。

【0044】

ステップＳ２０２において、各第１画像における候補目標の第１出現確率を加算して、候補目標の出現確率を取得する。

【0045】

前述の例のように、５フレームの画像を含み、第１、５フレームの画像には候補目標が検出されていない。即ち、第２フレームから第４フレームまでの３フレームの画像から候補目標が検出されている。

【0046】

上記３フレームの画像の重みをそれぞれ取得し、Ｑ_２、Ｑ_３、Ｑ_４とする。

【0047】

上記３フレームの画像における候補目標の信頼度をそれぞれＣ_２、Ｃ_３、Ｃ_４とする。

【0048】

上記３フレームの画像における候補目標のある第１出現確率をそれぞれＰ_２、Ｐ_３、Ｐ_４とし、ここで、Ｐ_２＝Ｑ_２＊Ｃ_２、Ｐ_３＝Ｑ_３＊Ｃ_３、Ｐ_４＝Ｑ_４＊Ｃ_４である。

【0049】

候補目標の出現確率はＰで表すことができ、ここで、Ｐ＝Ｐ_２＋Ｐ_３＋Ｐ_４である。

【0050】

上記方案によれば、各フレーム画像の重みと信頼度とに基づいて、候補目標の出現確率を客観的に反映することができる。

【0051】

【0052】

撮像装置により撮像された画像には、複数の目標が含まれる可能性があり、例えば、車両、歩行者、ペット、緑色植物などを含む複数の目標である可能性がある。例えば、候補目標が車両である場合、車両認識アルゴリズムを用いて画像内の目標に対して認識を行うことができ、かつ、目標ごとに対応して信頼度を得ることができる。

【0053】

予め設定された第２条件は信頼度が予め設定された第２閾値より大きい、または予め設定された第２閾値より小さくないなどであることができる。信頼度が予め設定された第２条件を満たす場合のみ、対応する目標が候補目標であると決定でき、即ち、車両の識別ができたと決定できる。

【0054】

上記方案によれば、候補目標に対して比較的正確な認識を行うことができる。

【0055】

図３に示されるよう、１つの実施形態において、目標の決定は以下のステップＳ３０１、Ｓ３０２を含む。

【0056】

ステップＳ３０１において、任意の１フレーム画像中の第１検出枠を取得する。

【0057】

ステップＳ３０２において、第１検出枠と任意の１フレーム画像より前の他の画像における第２検出枠との重なり度が予め設定された第３条件を満たす場合、第１検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第１検出枠における目標は任意の１フレーム画像において新たに検出された目標であると決定する。

【0058】

具体的には、スライディングウィンドウに含まれる複数のフレーム画像のうち、任意の１フレーム画像から目標が検出された場合、目標に対応する第１検出枠を生成することができる。例えば、任意の１フレーム画像を第Ｎフレーム画像とすると、第Ｎ－１フレーム画像から前の画像を遍歴することができる。第Ｎ－１フレーム画像における第２検出枠を取得する。第１検出枠と第２検出枠との重なり度を比較する。第１検出枠と第２検出枠の重なり度が予め設定された第３条件を満たすものを検出すると、遍歴を停止する。

【0059】

予め設定された第３条件は重なり度が予め設定された第３閾値より大きい、または予め設定された第３閾値より小さくないなどであることができる。

【0060】

第１検出枠と第２検出枠との重なり度が予め設定された第３条件を満たす場合、目標は現在のフレームより前の他のフレーム画像において既に出現したことを表し、もって、目標に対して追跡をすることができる。追跡の方法は、同じラベルを用いて異なる画像における同じ目標に対してラベル付けをすることを含んでもよい。

【0061】

一方、第１検出枠と第２検出枠との重なり度が予め設定された第３条件を満たさない場合、第１検出枠における目標は当該任意の１フレーム画像において新たに検出された目標であると決定することができる。新たに検出された目標については、新しいラベルを用いてラベル付けをしてもよい。

【0062】

本発明の実施形態は、目標検出装置を提供する。図４に示されるよう、１つの実施形態において、目標検出装置は、
複数のフレーム画像において、候補目標を含む少なくとも１フレームの第１画像を決定する画像決定モジュール４０１と、
各第１画像における候補目標の信頼度をそれぞれ取得する信頼度取得モジュール４０２と、
各第１画像の重みと信頼度とに基づいて、候補目標の出現確率を計算する出現確率計算モジュール４０３と、
出現確率が予め設定された第１条件を満たす場合、候補目標を最終目標として決定する最終目標決定モジュール４０４と、を備える。

【0063】

【0064】

図５に示されるよう、１つの実施形態において、出現確率計算モジュール４０３は、
各第１画像の重みと候補目標の対応する第１画像における信頼度とをそれぞれ乗算して、各第１画像における候補目標の第１出現確率を取得する第１出現確率計算サブモジュール４０３１と、
各第１画像における候補目標の第１出現確率を加算して、候補目標の出現確率を取得する出現確率計算実行サブモジュール４０３２と、を備える。

【0065】

【0066】

図６に示されるよう、１つの実施形態において、当該目標検出装置は、
任意の１フレーム画像中の第１検出枠を取得する第１検出枠決定モジュール４０５と、
第１検出枠と任意の１フレーム画像より前の他の画像における第２検出枠との重なり度が予め設定された第３条件を満たす場合、第１検出枠における目標は他の画像において既に検出された目標であると決定し、そうでない場合、第１検出枠における目標は任意の１フレーム画像において新たに検出された目標であると決定する目標確定モジュール４０６と、をさらに備える。

【0067】

本発明の実施形態に係る各装置における各モジュールの機能は、上述の方法における対応する説明を参照できるため、ここでは説明を省略する。

【0068】

本発明に係る実施形態は、電子デバイスとコンピュータ可読取記録媒体をさらに提供する。

【0069】

図７は、本発明の実施形態による目標検出方法を実現する電子デバイスのブロック図である。電子デバイスは、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータのような様々な形態のデジタルコンピュータを表すことができる。また、電子デバイスはパーソナルデジタル処理、携帯電話、スマートフォン、装着可能デバイス、及びその他の類似のコンピューティングデバイスなどの様々な形態のモバイルデバイスを表すことができる。ここで示した構成要素、それらの接続と関係、及びそれらの機能は例示的なものに過ぎず、本発明で説明されたもの及び／または要求される本発明の実施を制限することは意図されない。

【0070】

図７に示すように、当該電子デバイスは、１つ又は複数のプロセッサ７１０と、メモリ７２０と、高速インターフェースと低速インターフェースとを含む各構成要素を接続するためのインターフェースとを含む。各構成要素は、異なるバスを利用して互いに接続し、共通のマザーボードに取り付けられてもよいし、必要に応じて他の方法で取り付けられてもよい。プロセッサは、電子デバイス内で実行される命令を処理してもよく、また、外部入出力デバイス（例えば、インターフェースに接続された表示デバイス）にグラフィックユーザインターフェース（ＧｒａｐｈｉｃａｌＵｓｅｒＩｎｔｅｒｆａｃｅ，ＧＵＩ）を表示するための、メモリまたはメモリ上に記憶されたグラフィカル情報の命令を含む。他の実施形態では、必要に応じて、複数のプロセッサ及び／または複数のバスを複数のメモリ及び複数のメモリとともに使用することができる。同様に、複数の電子デバイスを接続してもよく、各デバイスは、部分的に必要な動作（例えば、サーバアレイ、ブレードサーバのセット、またはマルチプロセッサシステムとして）を提供する。図７においてプロセッサ７１０を例とする。

【0071】

メモリ７２０は、本発明にて提供された非一過性のコンピュータ可読記憶媒体である。メモリは、本発明で提供される目標検出方法を少なくとも１つのプロセッサに実行させるように、少なくとも１つのプロセッサによって実行されることができる命令を記憶する。本発明における非一過性のコンピュータ可読記憶媒体は、本発明で提供された目標検出方法をコンピュータに実行させるためのコンピュータ命令を記憶する。

【0072】

メモリ７２０は、非一過性のコンピュータ可読記憶媒体として、非一過性のソフトウェアプログラム、非一過性のコンピュータ実行可能なプログラム及びモジュールを記憶するために使用されてもよく、本発明の実施形態における目標検出方法に対応するプログラム命令／モジュール（例えば、図４に示される画像決定モジュール４０１、信頼度取得モジュール４０２、出現確率計算モジュール４０３及び最終目標決定モジュール４０４）のようなものである。プロセッサ７１０は、メモリ７２０に記憶されている非一過性のソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理、すなわち上述した方法に関する実施形態に係る目標検出方法を実行する。

【0073】

メモリ７２０は、オペレーティングシステムや少なくとも１つの機能に必要なアプリケーションを記憶することができるプログラムの記憶領域と、目標検出方法に係る電子デバイスの使用によって生成されたデータなどを記憶することができるデータの記憶領域と、を含むことができる。さらに、メモリ７２０は、高速ランダムアクセスメモリを含んでもよく、非一過性の固体記憶装置を含んでもよい。例えば、少なくとも１つの磁気ディスク記憶装置、フラッシュメモリ装置、または他の非一過性の固体記憶装置を含むことができる。いくつかの実施形態では、メモリ７２０はオプションとして、プロセッサ７１０に対して遠隔的に設定されたメモリを含み、これらの遠隔メモリは、ネットワークを介して目標検出方法に係る電子デバイスに接続されてもよい。上記のネットワークの例は、インターネット、企業内ネットワーク、ローカルネットワーク、モバイル通信ネットワーク及びその組み合わせを含むが、これらに限定されない。

【0074】

目標検出方法に係る電子デバイスは、入力装置７３０と出力装置７４０とをさらに含むことができる。プロセッサ７１０、メモリ７２０、入力装置７３０、及び出力装置７４０は、バスまたは他の方法で接続されてもよく、図７ではバスを介して接続されている。

【0075】

入力装置７３０は、入力された数字または文字を受信し、目標検出方法に係る電子デバイスのユーザ設定及び機能制御に関するキー信号入力を生成することができ、例えば、タッチパネル、キーパッド、マウス、トラックボード、タッチパッド、指示棒、１つまたは複数のマウスボタン、トラックボール、ジョイスティックなどを含むことができる。出力装置７４０は、表示装置、補助照明装置（例えばＬＥＤ）、及び触覚フィードバック装置（例えば、振動モータ）などを含むことができる。この表示装置は、液晶ディスプレイ（ＬｉｑｕｉｄＣｒｙｓｔａｌＤｉｓｐｌａｙ、ＬＣＤ）、発光ダイオード（ＬｉｇｈｔＥｍｉｔｔｉｎｇＤｉｏｄｅ、ＬＥＤ）ディスプレイ及びプラズマディスプレイを含むことができるがこれらに限定されない。いくつかの実施形態では、表示装置はタッチパネルであってもよい。

【0076】

本発明におけるシステム及び技術に係る様々な実施形態は、デジタル電子回路システム、集積回路システム、専用集積回路（ＡｐｐｌｉｃａｔｉｏｎＳｐｅｃｉｆｉｃＩｎｔｅｇｒａｔｅｄＣｉｒｃｕｉｔｓ、ＡＳＩＣ）、コンピュータハードウェア、ファームウェア、ソフトウェア、及び／またはこれらの組み合わせによって実現されることができる。これらの様々な実施形態は、１つまたは複数のコンピュータプログラムにおいて実装されてもよく、この１つまたは複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラム可能なシステム上で実行されてもよく、及び／または解釈されてもよく、このプログラマブルプロセッサは、専用または汎用のプログラマブルプロセッサであってもよく、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置より、データと命令を受信し、記憶システム、少なくとも１つの入力装置、及び少なくとも１つの出力装置に、データと命令を送信する。

【0077】

これらの計算プログラム（プログラム、ソフトウェア、ソフトウェアアプリケーション、またはコードともいう）は、プログラマブルプロセッサのマシン命令を含み、プロセス指向及び／またはオブジェクト指向プログラミング言語、及び／またはアセンブリ／マシン言語を用いてこれらの計算プログラムを実施することができる。本発明で使用されるように、「機械可読媒体」及び「コンピュータ可読媒体」という用語は、マシン命令及び／またはデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、デバイス、及び／または装置（例えば、磁気ディスク、光ディスク、メモリ、編集可能論理デバイス（ｐｒｏｇｒａｍｍａｂｌｅｌｏｇｉｃｄｅｖｉｃｅ、ＰＬＤ）を意味し、機械読み取り可能な信号としてのマシン命令を受信する機械可読媒体を含む。「機械読み取り可能な信号」という用語は、マシン命令及び／またはデータをプログラマブルプロセッサに提供するための任意の信号を意味する。

【0078】

ユーザとのイントラクションを提供するために、本発明で説明されているシステムや技術は、コンピュータ上で実施されてもよく、また、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（ＣａｔｈｏｄｅＲａｙＴｕｂｅ、ブラウン管）またはＬＣＤ（液晶ディスプレイ）モニタ）と、入力をコンピュータに提供するためのキーボード及びポインティングデバイス（例えば、マウスまたはトラックボール）とを備えてもよい。他の種類の装置も、ユーザとのイントラクションを提供するために使用され得る。例えば、ユーザに提供されたフィードバックは、任意の形態のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、ユーザからの入力は、いかなる形式（音響入力、音声入力、または触覚入力を含む）で受信されてもよい。

【0079】

本発明で説明されているシステム及び技術は、バックグラウンド構成要素を含む計算システム（例えば、データサーバとして）、または中間部構成要素を含む計算システム（例えば、アプリケーションサーバ）、または、フロントエンド構成要素を含む計算システム（例えば、グラフィカルユーザインタフェースまたはネットワークブラウザを備えたユーザコンピュータであって、ユーザがこのグラフィカルユーザインタフェースまたはネットワークブラウザを介して本発明で説明されたシステム及び技術に係る実施形態とインタラクションを行うことができるユーザコンピュータ）に実行されてもよく、または、このようなバックグラウンド構成要素、中間部構成要素、またはフロントエンド構成要素の任意の組合せを含む計算システムにおいて実行されてもよい。システムの構成要素は、任意の形態または媒体のデジタルデータ通信（例えば、通信ネットワーク）によって相互に接続されてもよい。通信ネットワークの例えとして、ローカルネットワーク（ＬｏｃａｌＡｒｅａＮｅｔｗｏｒｋ，ＬＡＮ）、広域ネットワーク（ＷｉｄｅＡｒｅａＮｅｔｗｏｒｋ，ＷＡＮ）及びインターネットを含む。

【0080】

コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバは一般的に相互に離れており、通信ネットワークを介してインタラクションを行う。クライアントとサーバとの関係を持つコンピュータプログラムがそれぞれのコンピュータ上で実行されることによって、クライアントとサーバとの関係は構築される。

【0081】

上記の様々な態様のフローを使用して、ステップを新たに順序付け、追加、または削除することが可能であることを理解すべきである。例えば、本発明で記載された各ステップは、並列に実行しても良いし、順次に実行しても良いし、異なる順序で実行しても良い。本発明で開示された技術案が所望する結果を実現することができる限り、本発明ではこれに限定されない。

【0082】

上記具体的な実施形態は、本発明の保護範囲に対する限定を構成するものではない。当業者は、設計事項やその他の要因によって、様々な修正、組み合わせ、サブ組み合わせ、及び代替が可能であることを理解するべきである。本発明の要旨及び原則内における変更、均等な置換及び改善等は、いずれも本発明の保護範囲に含まれるべきである。

【符号の説明】

【0083】

７１０プロセッサ
７２０メモリ

【図1】