(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-27
(45)【発行日】2023-11-07
(54)【発明の名称】ターゲット追跡方法、装置、電子機器、コンピュータ読み取り可能な記憶媒体及びコンピュータプログラムプロダクト
(51)【国際特許分類】
G06T 7/70 20170101AFI20231030BHJP
【FI】
G06T7/70 Z
(21)【出願番号】P 2022527078
(86)(22)【出願日】2020-09-25
(86)【国際出願番号】 CN2020117751
(87)【国際公開番号】W WO2021232652
(87)【国際公開日】2021-11-25
【審査請求日】2022-05-11
(31)【優先権主張番号】202010443892.8
(32)【優先日】2020-05-22
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100118913
【氏名又は名称】上田 邦生
(74)【代理人】
【識別番号】100142789
【氏名又は名称】柳 順一郎
(74)【代理人】
【識別番号】100201466
【氏名又は名称】竹内 邦彦
(72)【発明者】
【氏名】蘇 翔博
(72)【発明者】
【氏名】袁 宇辰
(72)【発明者】
【氏名】孫 昊
【審査官】新井 則和
(56)【参考文献】
【文献】中国特許出願公開第109816690(CN,A)
【文献】中国特許出願公開第103281476(CN,A)
【文献】中国特許出願公開第109635657(CN,A)
【文献】中国特許出願公開第107516303(CN,A)
【文献】米国特許出願公開第2015/0055829(US,A1)
【文献】中国特許出願公開第111192296(CN,A)
【文献】中国特許出願公開第110348332(CN,A)
【文献】特開2011-002266(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00-7/90
(57)【特許請求の範囲】
【請求項1】
現在のフレームの画像に対してターゲット検出を行い、前記現在のフレームの画像におけるターゲット検出枠の、第1の位置及び第1のサイズを表すための第1の情報を得ることと、
カルマンフィルタを利用してターゲット追跡を行い、前記現在のフレームの画像におけるターゲット追跡枠の、第2の位置及び第2のサイズを表すための第2の情報を得ることと、
カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行い、補正後の共分散行列を得ることと、
前記第1の情報、前記第2の情報及び前記補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出することと、
前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことと、
前記現在のフレームの画像のトポロジー関係行列M
T1
を取得し、かつ前記現在のフレームの画像の前のフレームの画像のトポロジー関係行列M
T2
を取得することと、
前記M
T1
と前記M
T2
を要素ごとに乗算して、トポロジー変化行列M
0
を得ることと、
前記M
0
を利用して、前記現在のフレームの画像におけるターゲット検出枠のマッチング結果に対して補正処理を行うことと、
を含み、
前記M
T1
における第i行第j列の値は、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記M
T2
における第i行第j列の値は、前記前のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記M
0
における第i行第j列の値は、前記前のフレームの画像に比べて、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係が変化したか否かを表す、ターゲット追跡方法。
【請求項2】
前記の前記第1の情報、前記第2の情報及び前記補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出することが、
以下の式を利用して、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出することを含み、
【数6】
ここで、Xは、前記第1の情報を表し、μは、前記第2の情報を表し、Σは、前記カルマンフィルタにおける予測誤差共分散行列を表し、(Σ+αE)は、前記補正後の共分散行列を表し、αは、0より大きい予め設定された係数であり、Eは、単位行列を表す請求項1に記載の方法。
【請求項3】
前記の前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことが、
前記マハラノビス距離が予め設定された閾値以下である場合、該当ターゲット検出枠とターゲット追跡枠との間のマッチングを確定するか、又は前記マハラノビス距離が前記予め設定された閾値より大きい場合、該当ターゲット検出枠とターゲット追跡枠との間のミスマッチングを確定することを含む請求項1に記載の方法。
【請求項4】
前記の前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出することの後、
前記マハラノビス距離に基づいて、第i行第j列の値が前記現在のフレームの画像における第i個のターゲット追跡枠と第j個のターゲット検出枠との間の距離類似度を表す距離類似度行列M
Dを算出することと、
第i行第j列の値が第i個のターゲット追跡枠に対応する前のフレームの画像における外観深度特徴と第j個のターゲット検出枠の外観深度特徴とのコサイン類似度を表す外観深度特徴類似度行列M
Aを算出することと、
前記M
D及び前記M
Aに基づいて、類似度マッチング行列を決定することと、
を含み、
前記の前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことが、
前記類似度マッチング行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことを含む請求項1に記載の方法。
【請求項5】
現在のフレームの画像に対してターゲット検出を行い、前記現在のフレームの画像におけるターゲット検出枠の、第1の位置及び第1のサイズを表すための第1の情報を得るための検出モジュールと、
カルマンフィルタを利用してターゲット追跡を行い、前記現在のフレームの画像におけるターゲット追跡枠の、第2の位置及び第2のサイズを表すための第2の情報を得るための追跡モジュールと、
カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行い、補正後の共分散行列を得るための補正モジュールと、
前記第1の情報、前記第2の情報及び前記補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出するための第1の算出モジュールと、
前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うためのマッチングモジュールと、
前記現在のフレームの画像のトポロジー関係行列M
T1
を取得し、かつ前記現在のフレームの画像の前のフレームの画像のトポロジー関係行列M
T2
を取得するための取得モジュールと、
前記M
T1
と前記M
T2
を要素ごとに乗算して、トポロジー変化行列M
0
を得るための第2の算出モジュールと、
前記M
0
を利用して、前記現在のフレームの画像におけるターゲット検出枠のマッチング結果に対して補正処理を行うための処理モジュールと、
を含み、
前記M
T1
における第i行第j列の値は、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記M
T2
における第i行第j列の値は、前記前のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記M
0
における第i行第j列の値は、前記前のフレームの画像に比べて、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係が変化したか否かを表す、ターゲット追跡装置。
【請求項6】
前記第1の算出モジュールが、以下の式を利用して、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出することに用いられ、
【数7】
ここで、Xは、前記第1の情報を表し、μは、前記第2の情報を表し、Σは、前記カルマンフィルタにおける予測誤差共分散行列を表し、(Σ+αE)は、前記補正後の共分散行列を表し、αは、0より大きい予め設定された係数であり、Eは、単位行列を表す請求項
5に記載の装置。
【請求項7】
前記マッチングモジュールが、前記マハラノビス距離が予め設定された閾値以下である場合、該当ターゲット検出枠とターゲット追跡枠との間のマッチングを確定するか、又は前記マハラノビス距離が前記予め設定された閾値より大きい場合、該当ターゲット検出枠とターゲット追跡枠との間のミスマッチングを確定することに用いられる請求項
5に記載の装置。
【請求項8】
前記マハラノビス距離に基づいて、第i行第j列の値が前記現在のフレームの画像における第i個のターゲット追跡枠と第j個のターゲット検出枠との間の距離類似度を表す距離類似度行列M
Dを算出するための第3の算出モジュールと、
第i行第j列の値が第i個のターゲット追跡枠に対応する前のフレームの画像における外観深度特徴と第j個のターゲット検出枠の外観深度特徴とのコサイン類似度を表す外観深度特徴類似度行列M
Aを算出するための第4の算出モジュールと、
前記M
D及び前記M
Aに基づいて、類似度マッチング行列を決定するための決定モジュールと、
を含み、
前記マッチングモジュールが、
前記類似度マッチング行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことに用いられる請求項
5に記載の装置。
【請求項9】
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサにより実行可能で、前記少なくとも1つのプロセッサにより実行されることにより、前記少なくとも1つのプロセッサに請求項1から
4のいずれか一項に記載の方法を実行させる命令が記憶され、前記少なくとも1つのプロセッサと通信接続されたメモリと、
を含む電子機器。
【請求項10】
コンピュータに請求項1から
4のいずれか一項に記載の方法を実行させるためのコンピュータ命令が格納されている非一時的なコンピュータ読み取り可能な記憶媒体。
【請求項11】
プロセッサによって実行されると、請求項1から
4のいずれか一項に記載の方法を実現させるコンピュータプログラ
ム。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本開示は、2020年5月22日に中国で提出された中国特許出願番号No.202010443892.8の優先権を主張し、その全ての内容が援用によりここに取り込まれる。
【0002】
本開示は、人工知能の分野に関し、特にコンピュータビジョンの技術分野に関する。
【背景技術】
【0003】
関連技術において、リアルタイムビデオストリームにおけるターゲット追跡に対して、まず検出器を利用して現在のフレームの画像における全てのターゲット検出枠を抽出し、次に全てのターゲット検出枠を従来の軌跡と関連付けてマッチングすることにより、現在のフレームの画像におけるターゲットの新たな軌跡を取得することができる。しかしながら、ターゲットの運動状態が急激に変化し、例えば長時間静止した後に突然運動し、移動中で突然静止し、移動速度が明らかに変化するなどの状況が発生すると、ターゲットの検出枠と従来の軌跡位置が成功裏にマッチングできず、追跡が無効になることをもたらす。
【発明の概要】
【発明が解決しようとする課題】
【0004】
本開示の実施例は、ターゲット追跡方法、装置、電子機器及びコンピュータ読み取り可能な記憶媒体を提供することにより、現在追跡ターゲットの運動状態が急激に変化する時に追跡失効をもたらしやすいという課題を解決する。
【課題を解決するための手段】
【0005】
上記技術的課題を解決するために、本開示は、以下のように実現される。
【0006】
第1の態様では、本開示の実施例は、
現在のフレームの画像に対してターゲット検出を行い、前記現在のフレームの画像におけるターゲット検出枠の、第1の位置及び第1のサイズを表すための第1の情報を得ることと、
カルマンフィルタを利用してターゲット追跡を行い、前記現在のフレームの画像におけるターゲット追跡枠の、第2の位置及び第2のサイズを表すための第2の情報を得ることと、
カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行い、補正後の共分散行列を得ることと、
前記第1の情報、前記第2の情報及び前記補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出することと、
前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことと、
を含むターゲット追跡方法を提供する。
【0007】
このように、フォールトトレランス補正後の予測誤差共分散行列に基づいてターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出できることにより、ターゲット運動状態が急激に変化する場合であっても、該マハラノビス距離をより合理的な範囲内に維持することができ、それにより、該マハラノビス距離に基づいて現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行う場合、ターゲットが異なる運動状態で追跡されるロバスト性を向上させることができる。
【0008】
第2の態様では、本開示の実施例は、
現在のフレームの画像に対してターゲット検出を行い、前記現在のフレームの画像におけるターゲット検出枠の、第1の位置及び第1のサイズを表すための第1の情報を得るための検出モジュールと、
カルマンフィルタを利用してターゲット追跡を行い、前記現在のフレームの画像におけるターゲット追跡枠の、第2の位置及び第2のサイズを表すための第2の情報を得るための追跡モジュールと、
カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行い、補正後の共分散行列を得るための補正モジュールと、
前記第1の情報、前記第2の情報及び前記補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出するための第1の算出モジュールと、
前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うためのマッチングモジュールと、
を含むターゲット追跡装置を提供する。
【0009】
第3の態様では、本開示の実施例は、さらに、
少なくとも1つのプロセッサと、
該少なくとも1つのプロセッサにより実行可能で、前記少なくとも1つのプロセッサにより実行されることにより、前記少なくとも1つのプロセッサに前記ターゲット追跡方法を実行させる命令が記憶され、前記少なくとも1つのプロセッサと通信接続されたメモリと、
を含む電子機器を提供する。
【0010】
第4の態様では、本開示の実施例は、前記コンピュータに前記ターゲット追跡方法を実行させるためのコンピュータ命令が格納されている非一時的なコンピュータ読み取り可能な記憶媒体を提供する。
【発明の効果】
【0011】
上記出願における1つの実施例は、以下の利点又は有益な効果を有する。フォールトトレランス補正後の予測誤差共分散行列に基づいてターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出できることにより、ターゲット運動状態が急激に変化する場合であっても、該マハラノビス距離をより合理的な範囲内に維持することができ、それにより、該マハラノビス距離に基づいて現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行う場合、ターゲットが異なる運動状態で追跡されるロバスト性を向上させることができる。現在のフレームの画像に対してターゲット検出を行い、ターゲット検出枠の、第1の位置及び第1のサイズを表すための第1の情報を得て、カルマンフィルタを利用してターゲット追跡を行い、現在のフレームの画像におけるターゲット追跡枠の、第2の位置及び第2のサイズを表すための第2の情報を得て、カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行い、補正後の共分散行列を得て、前記第1の情報、前記第2の情報及び前記補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出し、前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行う技術手段を採用するため、現在の追跡ターゲットの運動状態が急激に変化する場合に追跡失効をもたらしやすいという技術的課題を解消し、さらに、ターゲットが異なる運動状態で追跡されるロバスト性を向上させるという技術的効果を達成する。
【0012】
上記好ましい方式が有する他の効果は、以下に具体的な実施例を組み合わせて説明する。
【図面の簡単な説明】
【0013】
図面は本解決手段をよりよく理解するために用いられ、本開示を限定するものではない。
【0014】
【
図1】本開示の実施例に係るターゲット追跡方法のフローチャートである。
【
図2】本開示の具体的な実施例におけるターゲット追跡プロセスのフローチャートである。
【
図3】本開示の実施例に係るターゲット追跡方法を実現するための追跡装置のブロック図である。
【
図4】本開示の実施例に係るターゲット追跡方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0015】
以下に図面を参照しながら、本開示の例示的な実施例を説明し、理解を容易にするために本開示の実施例の様々な詳細を含み、それらを例示的なものに過ぎないと考えられるべきである。したがって、当業者であれば、本開示の範囲及び精神から逸脱することなく、ここで説明された実施例に対して様々な変更及び補正を行うことができることを理解すべきである。同様に、明確かつ簡潔にするために、以下の説明において公知の機能及び構造に対する説明を省略する。
【0016】
本開示の明細書及び特許請求の範囲における「第1」、「第2」などの用語は、類似する対象を区別するために用いられ、必ずしも特定の順序又は前後順序を説明するために用いられるわけではない。ここに記載される本開示の実施例がここに示されるか又は記載されるもの以外の順序で実施され得るように、そのように使用されるデータは適切な状況下で交換可能であることが理解されるべきである。さらに、「含む」及び「有する」という用語、並びにそれらの変形は、非排他的な包含をカバーすることを意図し、例えば、一連のステップ又はユニットを含むプロセス、方法、システム、製品又は機器は、必ずしも明示的に記載されているステップ又はユニットに限定されるものではなく、明示的に記載されていない、又はプロセス、方法、製品又は機器に固有の他のステップ又はユニットを含んでもよい。
【0017】
図1を参照すると、
図1は本開示の実施例に係るターゲット追跡方法のフローチャートであり、該方法は、電子機器に応用され、
図1に示すように、以下のステップ101~105を含む。
【0018】
ステップ101では、現在のフレームの画像に対してターゲット検出を行い、前記現在のフレームの画像におけるターゲット検出枠の第1の情報を取得する。
【0019】
本実施例では、該第1の情報は、第1の位置及び第1のサイズを表し、すなわち、該当ターゲット検出枠に含まれるターゲットの位置情報(例えば、座標情報)及びサイズ情報を表すことに用いられる。例えば、該第1の情報は、(x、y、w、h)と表すことができ、ここで、xは、ターゲット検出枠の左上隅の横座標を表し、yは、ターゲット検出枠の左上隅の縦座標を表し、wは、ターゲット検出枠の幅を表し、hは、ターゲット検出枠の高さを表し、さらに、該x、y、w及びhは、いずれも画素を単位として、1つのターゲットの画像における領域に対応することができる。
【0020】
好ましくは、上記現在のフレームの画像に対してターゲット検出を行うプロセスは、現在のフレームの画像をターゲット検出モデル(又はターゲット検出器と呼ばれる)に入力し、前記現在のフレームの画像におけるターゲット検出枠の第1の情報を取得することを含む。理解されるように、ターゲット検出により得られたターゲット検出枠の数は、複数であってもよく、すなわち、ターゲット検出により一連のターゲット検出枠を得ることができ、各ターゲット検出枠は、該当ターゲットの座標情報及びサイズ情報を含む。上記ターゲット検出モデルは、関連技術におけるディープラーニングに基づく方法を選択してトレーニングして得られるものであり、ダイレクトマルチターゲット検出(Single Shot Multi Box Detector、SSD)モデル、ファインダイレクトマルチターゲット検出(Single-Shot Refinement Neural Network for Object Detection、RefineDet)、モバイルビジョンアプリケーションのための効率的な畳み込みニューラルネットワークに基づくダイレクトマルチターゲット検出(MobileNet based Single Shot Multi Box Detector、MobileNet-SSD)モデル、統合されたリアルタイムオブジェクト検出(You Only Look Once: Unified、Real-Time Object Detection、YOLO)モデルなどのうちのいずれか1つであってもよい。
【0021】
一実施形態では、ターゲット検出モデルを利用してターゲット検出を行う場合、該ターゲット検出モデルが前処理された画像に基づいてトレーニングして得られると、現在のフレームの画像に対してターゲット検出を行う前に、現在のフレームの画像に対して前処理を行う必要があり、例えば、現在のフレームの画像を固定サイズ(例えば、512*512)にスケーリングし、かつ統合されたRGB平均値(例えば、[104、117、123])を減算することにより、モデルトレーニングプロセスにおけるトレーニングサンプルとの統合を保証し、モデルのロバスト性を向上させる。
【0022】
別の実施形態では、上記現在のフレームの画像は、監視又は他のシーンカメラのリアルタイムビデオストリーム内の画像であってもよい。上記ターゲットは、歩行者、車両などであってもよい。
【0023】
ステップ102では、カルマンフィルタを利用してターゲット追跡を行い、前記現在のフレームの画像におけるターゲット追跡枠の第2の情報を得る。
【0024】
本実施例では、該第2の情報は、第2の位置及び第2のサイズを表し、すなわち、該当ターゲット追跡枠に含まれるターゲットの位置情報(例えば、座標情報)及びサイズ情報を表すことに用いられる。例えば、該第2の情報は、(x、y、w、h)と表すことができ、ここで、xは、ターゲット追跡枠の左上隅の横座標を表し、yは、ターゲット追跡枠の左上隅の縦座標を表し、wは、ターゲット追跡枠の幅を表し、hは、ターゲット追跡枠の高さを表し、さらに、該x、y、w及びhは、いずれも画素を単位として、1つのターゲットの画像における領域に対応することができる。
【0025】
上記カルマンフィルタ(Kalmanフィルタ)を利用してターゲット追跡を行うことは、以下のように理解できる。ターゲット軌跡の既存の運動状態に基づいて、該ターゲットが現在のフレームの画像に出現する可能性のある位置及びサイズの大きさを予測する。該ターゲット軌跡は、現在のフレームの画像の前のいくつかのフレームの画像において、全ての同じターゲットに属する異なるフレームの画像におけるターゲット検出枠と表すことができる。各ターゲット軌跡は、1つのKalmanフィルタに対応し、該Kalmanフィルタは、ターゲットが初めて出現した検出枠で初期化し、かつ各フレームの画像の関連マッチングが完了した後、マッチングしたターゲット検出枠で該Kalmanフィルタを補正する。新たに得られた1つのフレームの画像(例えば、現在のフレームの画像)に対して、記憶された全てのターゲット軌跡のKalmanフィルタを予測し、ターゲット軌跡の予測された現在のフレームの画像に出現する位置を得て、かつKalmanフィルタの予測誤差共分散行列Σを得ることができる。該予測誤差共分散行列Σは、好ましくは、4x4の行列であり、ターゲット追跡における予測値と真値との誤差共分散を説明するために用いられる。
【0026】
ステップ103では、カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行い、補正後の共分散行列を得る。
【0027】
ステップ104では、第1の情報、第2の情報及び補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出する。
【0028】
理解できるように、上記カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行うことは、主に、マハラノビス距離算出式を改善することにより、改善されたマハラノビス距離算出式により算出されたターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を、ターゲット運動状態が急激に変化する場合であっても、合理的な範囲内に維持することができる。上記フォールトトレランス補正の方式について、実際の需要に基づいて設定することができ、ここで限定しない。
【0029】
ステップ105では、前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行う。
【0030】
好ましくは、このステップにおいてハンガリーアルゴリズムなどの画像マッチングアルゴリズムを利用してターゲット検出枠とターゲット追跡枠との間の関連マッチングを行うことにより、いくつかのマッチングしたターゲット検出枠とターゲット追跡枠との間のペアリングを得ることができる。該ペアリングにおけるターゲット検出枠とターゲット追跡枠は同じターゲット軌跡に属し、同じターゲットに属し、統合されたターゲット識別IDを付与することができる。関連マッチングが完了した後に現在のフレームの画像での新たなターゲット軌跡を得ることができ、従来のターゲット軌跡の更新、従来のターゲット軌跡の削除、及び/又は新たなターゲット軌跡の増加を含む。
【0031】
好ましくは、このステップにおいて関連マッチングを行うプロセスは、以下を含むことができる。前記マハラノビス距離が予め設定された閾値以下である場合、該当ターゲット検出枠とターゲット追跡枠との間のマッチングを確定するか、又は前記マハラノビス距離が前記予め設定された閾値より大きい場合、該当ターゲット検出枠とターゲット追跡枠との間のミスマッチングを確定する。つまり、ターゲット検出枠とターゲット追跡枠との間のマハラノビス距離が小さいほど、両者が同じターゲットに属する可能性が高くなる。これにより、距離情報と予め設定された閾値との比較により関連マッチングを行うことで、マッチングプロセスを簡単に実現することができる。
【0032】
本開示の実施例に係るターゲット追跡方法は、フォールトトレランス補正後の予測誤差共分散行列に基づいてターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出できることにより、ターゲット運動状態が急激に変化する場合であっても、該マハラノビス距離をより合理的な範囲内に維持することができ、それにより該マハラノビス距離に基づいて現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行う場合、ターゲットが異なる運動状態で追跡されるロバスト性を向上させることができる。
【0033】
マルチターゲット追跡において、関連技術におけるマハラノビス距離の算出式は以下のとおりである。
【数1】
【0034】
ここで、μは、カルマンフィルタの平均値(x、y、w、h)を表し、カルマンフィルタの予測ターゲット(すなわち、ターゲット追跡枠)の現在のフレームの画像における座標及び幅と高さである。Σは、カルマンフィルタの予測誤差共分散行列を表す。Xは、現在のフレームの画像におけるターゲット検出枠の座標及び幅と高さを表し、あるターゲットの現在の実際の運動状態(x、y、w、h)を記述する変数である。1つのターゲットが一定の時間内に同じ運動状態(例えば、長時間静止するか又は同じ運動速度を長時間維持するなど)を維持する場合、カルマンフィルタの共分散Σが小さく、Σ-1が大きく、すなわち、予測値と真値との偏差が小さいと考えられ、予測ターゲット軌跡が次のフレームにある場合に依然として元の運動状態を維持する傾向がある。ターゲットが元の運動状態を保持する場合、すなわち(X-μ)が0に近く、Σ-1が大きい場合に、算出して得られたマハラノビス距離DM値が小さいが、ターゲットの運動状態が急激に変化する場合、(X-μ)の値が大きくなり、Σ-1が大きい場合に、算出して得られたマハラノビス距離DM値が異常に大きくなり、後続のマッチングエラーをもたらす。算出して得られたマハラノビス距離DMが予め設定された閾値より大きい場合、ターゲット検出枠Xが該カルマンフィルタに対応する軌跡に属さないと考えられ、追跡失敗をもたらす。
【0035】
一実施形態では、上記ステップ104でマハラノビス距離を算出するプロセスは、以下のとおりである。
【0036】
以下の式(該式は、改善されたマハラノビス距離算出式として理解できる)を利用して、現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出する。
【数2】
【0037】
ここで、Xは、現在のフレームの画像におけるターゲット検出枠の第1の情報を表し、例えば、位置情報及びサイズ情報を含み、(x、y、w、h)と表すことができる。μは、カルマンフィルタに基づいて得られた現在のフレームの画像におけるターゲット追跡枠の第2の情報を表し、例えば、位置情報及びサイズ情報を含み、(x、y、w、h)と表すことができる。Σは、カルマンフィルタの予測誤差共分散行列を表す。(Σ+αE)は、補正後の共分散行列を表し、αは、0より大きい予め設定された係数であり、Eは、単位行列を表す。
【0038】
上記改善されたマハラノビス距離算出式に対する分析により、以下のことが分かる。
α>0の場合、常に、以下の不等式(1)~(3)がある。
【数3】
【0039】
上記不等式(3)に基づいて、DM(X,μ)>DMnew(X,μ)を得ることができる。
【0040】
また、以下の不等式(4)~(7)が存在する。
【数4】
【0041】
上記不等式(7)に基づいて、DMnew(X,μ)<√α|X-μ|を得ることができる。
【0042】
すなわち、任意のXに対して、いずれもDMnew<DMであり、かつΣが小さいほど、両者の偏差が大きくなる。1つのターゲットが一定の時間内に同じ運動状態(例えば、長時間に静止するか又は長時間に同じ運動速度を維持するなど)を維持する場合、カルマンフィルタの共分散Σが小さい。ターゲットが従来の運動状態を保持する場合、すなわち(X-μ)が0に近く、DMに比べて、算出して得られたDMnewの値が小さい。ターゲットの運動状態が急激に変化する場合、(X-μ)の値が大きくなるが、DMに比べて、算出されたDMnewは、より小さい値に制約される。
【0043】
これにより、上記改善されたマハラノビス距離算出式により、ターゲット運動状態が急激に変化する場合であっても、算出されたマハラノビス距離を合理的な範囲内に維持することができ、それによりターゲットが異なる運動状態で追跡されるロバスト性を向上させる。
【0044】
本開示の実施例では、関連マッチングの正確性を向上させるために、算出されたマハラノビス距離に基づいて、他の関連マッチングを補助する類似度測定方法における、例えば外観特徴類似度、形状輪郭類似度などを結合して、類似度マッチング行列を構成することにより、該類似度マッチング行列に基づいて関連マッチングを行うことができる。好ましくは、上記ステップ104の後、前記方法は、さらに、以下を含む。
【0045】
前記マハラノビス距離に基づいて、距離類似度行列MDを算出する。ここで、前記MDにおける第i行第j列の値は、前記現在のフレームの画像における第i個のターゲット追跡枠と第j個のターゲット検出枠との間の距離類似度を表し、例えば、該距離類似度は、好ましくは、第i個のターゲット追跡枠と第j個のターゲット検出枠との間のマハラノビス距離DMnewの逆数す、なわちDMnew
-1、又は他の方式を採用して該マハラノビス距離DMnewを処理した後の値であり、類似度を体現すればよい。
【0046】
外観深度特徴類似度行列MAを算出する。ここで、前記MAにおける第i行第j列の値は、第i個のターゲット追跡枠に対応する前のフレームの画像における外観深度特徴Fiと第j個のターゲット検出枠の外観深度特徴Fjとのコサイン類似度cos(Fi、Fj)を表し、外観深度特徴Fに対して深度畳み込みニューラルネットワーク(例えば、残差ニューラルネットワークResNet)を利用して該当フレームの画像から抽出して得ることができる。
【0047】
前記MD及び前記MAに基づいて、類似度マッチング行列を決定する。
【0048】
上記ステップ105は、前記類似度マッチング行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことを含む。
【0049】
一実施形態では、類似度マッチング行列を決定する場合、加重平均の方式でMDとMAを融合して得ることができ、例えば、該類似度マッチング行列は、aMDとbMAの合計に等しく、ここで、aとbは、それぞれMDとMAの重みであり、実際の需要に基づいて予め設定することができる。
【0050】
別の実施形態では、類似度マッチング行列に基づいて、現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行う場合、ハンガリーアルゴリズムを利用して二分図マッチングを行うことができ、それによりターゲット検出枠とターゲット追跡枠との間の一対一マッチングの結果を得る。
【0051】
理解できるように、マルチターゲット追跡において、前後のターゲットが深刻に遮蔽される状況が発生する可能性があり、レンズに近いターゲットがレンズから遠いターゲットの大部分の領域を遮蔽するため、ターゲットの追跡エラーをもたらす可能性があり、後続のフレームの画像において誤った追跡結果を得る。この問題を解消するために、本開示の実施例は、ターゲットの前後トポロジー関係を利用して制約マッチングを行うことを提案する。
【0052】
透視関係の存在のため、撮像装置(例えば、カメラ)が収集した画像において、地面ターゲット検出枠の下縁の中心点は、ターゲットの接地点と見なすことができ、該点が画像の下方に近いほど、レンズに近づくと考えられ、そうでなければ、レンズから離れると考えられる。2つのターゲット検出枠に対して、それらの間の交差比が一定の閾値より大きい場合、該当2つのターゲットが深刻に遮蔽されると考えられる。ターゲット接地点の位置により、2つのターゲットの前後関係を判断することができる。ここで、カメラに近いターゲットは、前景として遮蔽するターゲットであり、カメラから遠いターゲットは、背景として遮蔽されるターゲットである。全ての遮蔽ターゲットの間の前後関係は、ターゲットの前後トポロジー関係と呼ぶことができる。前後トポロジー関係の一致性は、以下のように定義することができる。連続フレーム(画像)において、前のフレームの2つのターゲットA及びBが深刻に遮蔽され、ターゲットAは、前景として遮蔽するターゲットであり、ターゲットBは、背景として遮蔽されるターゲットである場合、後のフレームにおいて、ターゲットA及びBが依然として深刻に遮蔽されると、ターゲットAは、依然として前景として遮蔽するターゲットであり、ターゲットBは、背景として遮蔽されるターゲットである。現在のフレームの画像において複数のターゲットが深刻に遮蔽される場合、前のフレームのターゲット軌跡の間の前後トポロジー関係を取得することができ、かつ関連マッチングにおいて前後トポロジー関係の一致性を利用して制約することにより、マッチングがより正確になる。
【0053】
好ましくは、上記ステップ105の後、前記方法は、
前記現在のフレームの画像のトポロジー関係行列MT1を取得し、かつ前記現在のフレームの画像の前のフレームの画像のトポロジー関係行列MT2を取得することと、
MT1とMT2を要素ごとに乗算して、トポロジー変化行列M0を得ることと、
M0を利用して、現在のフレームの画像におけるターゲット検出枠のマッチング結果に対して補正処理を行うことと、をさらに含む。
【0054】
ここで、前記MT1における第i行第j列の値は、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記MT2における第i行第j列の値は、前記前のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記M0における第i行第j列の値は、前記前のフレームの画像に比べて、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係が変化したか否かを表す。上記補正処理は、前のフレームと現在のフレームにおいて、第i個のターゲットと第j個のターゲットとの前後関係が変化すると、現在のフレームにおける第i個のターゲットと第j個のターゲットとがマッチングした検出枠に対して交換処理を行うことにより、ターゲット追跡過程において関連マッチングの結果を補正する。
【0055】
このように、隣接するフレームの画像における遮蔽物の前後のトポロジー関係の一致性の制約を利用することにより、ターゲットが深刻に遮蔽された場合にマッチングを行う信頼性を向上させ、ターゲット追跡プロセスがスムーズに進行することを保証することができる。
【0056】
例えば、MT1及びMT2を取得する場合、ターゲット検出枠の下縁中心点(x+w/2、y+h)を該当ターゲットの接地点とすることができ、透視原理に基づいて、縦座標y+hが大きいほど、ターゲット距離がカメラに近づき、逆にカメラから離れる。2つのターゲットの間の前後関係を決定する場合、該当ターゲット検出枠の下縁中心点の縦座標を比較することができる。例えば、MT1を例として、ここで、第i行第j列の値は、現在のフレームの画像における第i個のターゲットと第j個のターゲットの前後関係tを表し、第i個のターゲットと第j個のターゲットに遮蔽関係が存在し、かつyi+hi<yj+hjである場合、t=-1であり、第i個のターゲットが第j個のターゲットの前にあることを表すか、又は第i個のターゲットと第j個のターゲットに遮蔽関係が存在し、かつ且yi+hi>yj+hjである場合、t=1であり、第i個のターゲットが第j個のターゲットの後にあることを表すか、又は第i個のターゲットと第j個のターゲットに遮蔽関係が存在しない場合、t=0である。MT2に対して、以上のMT1の方式で設定することができる。このように、MT1とMT2を要素ごとに乗算して得られたトポロジー変化行列M0において、第i個のターゲットと第j個のターゲットがいずれも正確にマッチングする場合、M0における第i行第j列の値が0又は1であり、すなわち、第i個のターゲットと第j個のターゲットの前後関係が変化しないが、M0における第i行第j列の値が-1である場合、マッチングエラーにより、第i個のターゲットと第j個のターゲットが隣接する2つのフレームにおける前後関係が変化したことを表し、このときに現在のフレームの画像における該2つのターゲットがマッチングした検出枠に対して交換処理を行うことにより、該当ターゲット軌跡を補正し、追跡プロセスがスムーズに進行することを保証する。
【0057】
好ましくは、2つのターゲットに遮蔽関係が存在するか否かに対して、該当検出枠と追跡枠の交差比(Intersection over Union、IoU)を利用して決定することができる。
【0058】
本開示の実施例が適用されるシーンは、ターゲットの位置、身分、運動状態及び履歴軌跡などの情報を取得するために、スマート都市、スマート交通、スマート小売などのシーンでの歩行者及び/又は車両などのターゲットの継続的な追跡を含むが、これらに限定されない。
【0059】
以下に、
図2を参照して本開示の具体的な実施例におけるターゲット追跡プロセスを説明する。
【0060】
図2に示すように、該当ターゲット追跡プロセスは、以下のステップS21~S28を含むことができる。
【0061】
S21では、監視又は他のシーンカメラのリアルタイムビデオストリームを取得する。
【0062】
S22では、該リアルタイムビデオストリームから現在のフレームの画像を抽出し、かつ前処理を行い、例えば、固定サイズにスケーリングし、かつ統合されたRGB平均値を減算する。
【0063】
S23では、前処理された現在のフレームの画像を予め設定されたターゲット検出器に入力し、一連のターゲット検出枠を出力し、各枠は、ターゲットの座標及びサイズ情報を含む。
【0064】
S24では、カルマンフィルタを利用してターゲット追跡を行い、現在のフレームの画像におけるターゲット追跡枠に含まれるターゲットの座標及びサイズ情報を得る。
【0065】
S25では、改善されたマハラノビス距離算出式により、現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出し、具体的なプロセスは上記内容を参照する。
【0066】
S26では、S25で得られたマハラノビス距離に基づいて、現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行い、例えば、ハンガリーアルゴリズムを利用して二分図マッチングを行う。
【0067】
S27では、隣接するフレームの画像におけるターゲットの前後トポロジー関係を利用して関連マッチング結果に対して一致性制約を行う。
【0068】
S28では、現在のフレームの画像における追跡プロセスを終了し、かつ次の画像フレームを抽出し、ビデオストリームが終了するまで、上記S22~S27を繰り返す。記録が存在するが一定の時間内(いくつかの画像フレームを超える)に任意の検出枠とマッチングしないターゲット軌跡に対して、それをオフフィールドとマークし、将来に関連マッチングプロセスに参加しない。
【0069】
図3を参照すると、
図3は、本開示の実施例に係るターゲット追跡装置の構造概略図であり、
図3に示すように、該ターゲット追跡装置30は、
現在のフレームの画像に対してターゲット検出を行い、前記現在のフレームの画像におけるターゲット検出枠の、第1の位置及び第1のサイズを表すための第1の情報を得るための検出モジュール31と、
カルマンフィルタを利用してターゲット追跡を行い、前記現在のフレームの画像におけるターゲット追跡枠の、第2の位置及び第2のサイズを表すための第2の情報を得るための追跡モジュール32と、
カルマンフィルタにおける予測誤差共分散行列に対してフォールトトレランス補正を行い、補正後の共分散行列を得るための補正モジュール33と、
前記第1の情報、前記第2の情報及び前記補正後の共分散行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出するための第1の算出モジュール34と、
前記マハラノビス距離に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うためのマッチングモジュール35と、
を含む。
【0070】
好ましくは、前記第1の算出モジュール34は、具体的には、以下の式を利用して、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出することに用いられる。
【数5】
【0071】
ここで、Xは、前記第1の情報を表し、μは、前記第2の情報を表し、Σは、前記カルマンフィルタにおける予測誤差共分散行列を表し、(Σ+αE)は、前記補正後の共分散行列を表し、αは、0より大きい予め設定された係数であり、Eは、単位行列を表す。
【0072】
好ましくは、前記マッチングモジュール35は、具体的には、前記マハラノビス距離が予め設定された閾値以下である場合、該当ターゲット検出枠とターゲット追跡枠との間のマッチングを確定するか、又は前記マハラノビス距離が前記予め設定された閾値より大きい場合、該当ターゲット検出枠とターゲット追跡枠との間のミスマッチングを確定することに用いられる。
【0073】
好ましくは、前記ターゲット追跡装置30は、
前記現在のフレームの画像のトポロジー関係行列MT1を取得し、かつ前記現在のフレームの画像の前のフレームの画像のトポロジー関係行列MT2を取得するための取得モジュールと、
前記MT1と前記MT2を要素ごとに乗算して、トポロジー変化行列M0を得るための第2の算出モジュールと、
前記M0を利用して、前記現在のフレームの画像におけるターゲット検出枠のマッチング結果に対して補正処理を行うための処理モジュールと、をさらに含み、
ここで、前記MT1における第i行第j列の値は、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記MT2における第i行第j列の値は、前記前のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係を表し、前記M0における第i行第j列の値は、前記前のフレームの画像に比べて、前記現在のフレームの画像における第i個のターゲットと第j個のターゲットとの前後関係が変化したか否かを表す。
【0074】
好ましくは、前記ターゲット追跡装置30は、
前記マハラノビス距離に基づいて、第i行第j列の値が前記現在のフレームの画像における第i個のターゲット追跡枠と第j個のターゲット検出枠との間の距離類似度を表す距離類似度行列MDを算出するための第3の算出モジュールと、
第i行第j列の値が第i個のターゲット追跡枠に対応する前のフレームの画像における外観深度特徴と第j個のターゲット検出枠の外観深度特徴とのコサイン類似度を表す外観深度特徴類似度行列MAを算出するための第4の算出モジュールと、
前記MD及び前記MAに基づいて、類似度マッチング行列を決定するための決定モジュールと、
を含む。
【0075】
好ましくは、前記マッチングモジュール35は、具体的には、前記類似度マッチング行列に基づいて、前記現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行うことに用いられる。
【0076】
理解できるように、本開示の実施例のターゲット追跡装置30は、上記
図1に示す方法の実施例で実現された各プロセスを実現し、かつ同じ有益な効果を達成することができ、重複を回避するために、ここでは説明を省略する。
【0077】
本開示の実施例によれば、本開示は、電子機器及び読み取り可能な記憶媒体をさらに提供する。
【0078】
図4に示すように、本開示の実施例に係るターゲット追跡方法を実現するための電子機器のブロック図である。電子機器は、様々な形式のデジタルコンピュータ、例えば、ラップトップコンピュータ、デスクトップコンピュータ、作業台、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、大型コンピュータ、及び他の適切なコンピュータを表すことを目的とする。電子機器は、さらに、様々な形式の移動装置、例えば、パーソナルデジタル処理、携帯電話、スマートフォン、ウェアラブルデバイス及び他の類似する算出装置を表すことができる。本明細書に示された部材、それらの接続及び関係、並びにそれらの機能は単なる例示であり、本明細書に記載された及び/又は要求された本開示の実現を制限することを意図しない。
【0079】
図4に示すように、該電子機器は、1つ又は複数のプロセッサ401、メモリ402、及び高速インタフェース及び低速インタフェースを含む各部材を接続するためのインタフェースを含む。各部材は、異なるバスを利用して互いに接続され、かつ共通のマザーボードに取り付けられるか又は必要に応じて他の方式で取り付けられる。プロセッサは、メモリ又は記憶装置に記憶されて外部入力/出力装置(例えば、インタフェースに結合された表示装置)にGUIのグラフィック情報を表示する命令を含む、電子機器内で実行された命令を処理することができる。他の実施形態では、必要であれば、複数のプロセッサ及び/又は複数のバスを複数のメモリ及び複数の記憶装置と共に使用することができる。同様に、複数の電子機器に接続することができ、各機器は、一部の必要な操作(例えば、サーバアレイ、一組のブレードサーバ、又はマルチプロセッサシステムとする)を提供する。
図4において1つのプロセッサ401を例とする。
【0080】
メモリ402は、すなわち、本開示に係る非一時的なコンピュータ読み取り可能な記憶媒体である。ここで、前記メモリに少なくとも1つのプロセッサにより実行可能な命令が記憶されることにより、前記少なくとも1つのプロセッサが本開示に係るターゲット追跡方法を実行する。本開示の非一時的なコンピュータ読み取り可能な記憶媒体は、本開示に係るターゲット追跡方法をコンピュータに実行させるためのコンピュータ命令を記憶する。
【0081】
メモリ402は、非一時的なコンピュータ読み取り可能な記憶媒体として、非一時的なソフトウェアプログラム、非一時的なコンピュータ実行可能なプログラム及びモジュールを記憶することに用いることができ、例えば、本開示の実施例におけるターゲット追跡方法に対応するプログラム命令/モジュール(例えば、
図3に示す検出モジュール31、追跡モジュール32、補正モジュール33、第1の算出モジュール34及びマッチングモジュール35)である。プロセッサ401は、メモリ402に記憶された非瞬時ソフトウェアプログラム、命令及びモジュールを実行することにより、サーバの様々な機能アプリケーション及びデータ処理を実行し、すなわち上記方法実施例におけるターゲット追跡方法を実現する。
【0082】
メモリ402は、オペレーティングシステム、少なくとも1つの機能に必要なアプリケーションプログラムを記憶できるプログラム記憶領域と、電子機器の使用により作成されたデータなどを記憶できるデータ記憶領域とを含むことができる。また、メモリ402は、高速ランダムアクセスメモリを含むことができ、さらに、非一時的メモリを含むことができ、例えば、少なくとも1つの磁気ディスクメモリ、フラッシュメモリ、又は他の非一時的固体メモリである。いくつかの実施例では、メモリ402は、好ましくは、プロセッサ401に対して遠隔に設置されたメモリを含み、これらの遠隔メモリは、ネットワークを介して電子機器に接続することができる。上記ネットワークの例は、インターネット、企業イントラネット、ローカルエリアネットワーク、移動体通信ネットワーク及びそれらの組み合わせを含むがこれらに限定されない。
【0083】
ターゲット追跡方法の電子機器は、さらに、入力装置403及び出力装置404を含む。プロセッサ401、メモリ402、入力装置403及び出力装置404は、バス又は他の方式により接続されてもよく、
図4においてバスにより接続されることを例とする。
【0084】
入力装置403は、入力されたデジタル又は文字情報を受信し、かつターゲット追跡方法の電子機器のユーザ設定及び機能制御に関連するキー信号入力を生成することができ、例えば、タッチスクリーン、キーパッド、マウス、トラックパッド、タッチパネル、指示レバー、1つ又は複数のマウスボタン、トラックボール、ジョイスティックなどの入力装置である。出力装置404は、表示装置、補助照明装置(例えば、LED)及び触覚フィードバック装置(例えば、振動モータ)などを含むことができる。該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ及びプラズマディスプレイを含むがこれらに限定されない。いくつかの実施形態では、表示装置は、タッチスクリーンであってもよい。
【0085】
ここで説明されるシステム及び技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、特定用途向けASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア及び/又はこれらの組み合わせで実現され得る。これらの様々な実施形態は、特定用途向け又は汎用のプログラマブルプロセッサであり得る少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムで実行及び/又は解釈できる、1つ又は複数のコンピュータプログラムで実施され、記憶システム、少なくとも1つの入力装置、及び少なくとも1つの出力装置からデータ及び命令を受信し、かつデータ及び命令を該記憶システム、該少なくとも1つの入力装置、及び該少なくとも1つの出力装置に伝送することができることを含む。
【0086】
これらのコンピューティングプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、又はコードとも呼ばれる)は、プログラマブルプロセッサの機械命令を含み、かつ、高レベルの手続き型及び/又はオブジェクト指向プログラミング言語、及び/又はアセンブリ/機械語を利用してこれらのコンピューティングプログラムを実施することができる。本明細書で使用されるように、「機械読み取り可能な媒体」及び「コンピュータ読み取り可能な媒体」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意のコンピュータプログラム製品、装置、及び/又は装置(例えば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を指し、機械読み取り可能な信号とする機械命令を受信する機械読み取り可能な媒体を含む。「機械読み取り可能な信号」という用語は、機械命令及び/又はデータをプログラマブルプロセッサに提供するための任意の信号を指す。
【0087】
ユーザとの対話を提供するために、コンピュータで、ここで説明されたシステム及び技術を実施することができ、該コンピュータは、ユーザに情報を表示するための表示装置(例えば、CRT(陰極線管)又はLCD(液晶ディスプレイ)モニタ)、キーボード及びポインティング装置(例えば、マウス又はトラックボール)を有し、ユーザは、該キーボード及び該ポインティング装置により入力をコンピュータに提供することができる。他の種類の装置は、さらに、ユーザとの対話を提供するために用いられ、例えば、ユーザに提供されたフィードバックは、任意の形式のセンシングフィードバック(例えば、視覚フィードバック、聴覚フィードバック、又は触覚フィードバック)であってもよく、かつ任意の形式(音声入力、音声入力又は触覚入力を含む)でユーザからの入力を受信することができる。
【0088】
ここで説明されたシステム及び技術を、バックグラウンド部材を含むコンピューティングシステム(例えば、データサーバとする)、又はミドルウェア部材を含むコンピューティングシステム(例えば、アプリケーションサーバ)、又はフロントエンド部材を含むコンピューティングシステム(例えば、グラフィカルユーザインタフェース又はウェブブラウザを有するユーザコンピュータであり、ユーザは、該グラフィカルユーザインタフェース又は該ウェブブラウザを介してここで説明されたシステム及び技術の実施形態と対話することができる)、又はこのようなバックグラウンド部材、ミドルウェア部材、又はフロントエンド部材の任意の組み合わせを含むコンピューティングシステムに実施することができる。任意の形式又は媒体のデジタルデータ通信(例えば、通信ネットワーク)によりシステムの部品を互いに接続することができる。通信ネットワークの例は、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)、インターネットを含む。
【0089】
コンピュータシステムは、クライアント及びサーバを含むことができる。クライアントとサーバは、一般的に、互いに離れ、かつ一般的に通信ネットワークを介して対話する。クライアントとサーバとの関係は、それぞれのコンピュータ上で動作し、互いにクライアント-サーバの関係を有するコンピュータプログラムによって生成される。
【0090】
本開示の実施例の技術的解決手段によれば、フォールトトレランス補正後の予測誤差共分散行列に基づいてターゲット検出枠とターゲット追跡枠との間のマハラノビス距離を算出できることにより、ターゲット運動状態が急激に変化する場合であっても、該マハラノビス距離をより合理的な範囲内に維持することができ、それにより該マハラノビス距離に基づいて現在のフレームの画像におけるターゲット検出枠とターゲット追跡枠に対して関連マッチングを行う場合、ターゲットが異なる運動状態で追跡されるロバスト性を向上させることができる。
【0091】
以上に示した様々な形式のフローを使用して、ステップを改めて並べ替えたり、追加したり、削除したりできることを理解すべきである。例えば、本開示に記載の各ステップは並列的に実行されてもよく、順序的に実行されてもよく、異なる順序で実行されてもよく、本開示の技術的解決手段の所望の結果を実現することができれば、本明細書では限定されない。
【0092】
上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者であれば、設計要件及び他の要因に応じて、様々な補正、組み合わせ、サブ組み合わせ及び置換を行うことができることを理解すべきである。任意の本開示の精神及び原則内で行われた補正、同等置換及び改善などは、いずれも本開示の保護範囲内に含まれるべきである。