(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-11
(45)【発行日】2023-10-19
(54)【発明の名称】ビデオオブジェクト検出
(51)【国際特許分類】
G06T 7/246 20170101AFI20231012BHJP
G06T 7/70 20170101ALI20231012BHJP
G08G 1/16 20060101ALI20231012BHJP
【FI】
G06T7/246
G06T7/70 A
G08G1/16 C
(21)【出願番号】P 2020551352
(86)(22)【出願日】2019-03-21
(86)【国際出願番号】 US2019023437
(87)【国際公開番号】W WO2019183398
(87)【国際公開日】2019-09-26
【審査請求日】2022-03-17
(32)【優先日】2018-10-11
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】201841010577
(32)【優先日】2018-03-22
(33)【優先権主張国・地域又は機関】IN
(73)【特許権者】
【識別番号】507107291
【氏名又は名称】テキサス インスツルメンツ インコーポレイテッド
(74)【代理人】
【識別番号】230129078
【氏名又は名称】佐藤 仁
(72)【発明者】
【氏名】ソエブ ノーモハメッド ナゴリ
(72)【発明者】
【氏名】マヌ マシュー
(72)【発明者】
【氏名】クマル デサパン
(72)【発明者】
【氏名】プラモッド クマル スワミ
【審査官】▲広▼島 明芳
(56)【参考文献】
【文献】米国特許出願公開第2012/0143808(US,A1)
【文献】米国特許出願公開第2005/0249426(US,A1)
【文献】Ahmet Ekin, et al.,Automatic extraction of low-level object motion descriptors,Proceedings 2001 International Conference on Image Processing,米国,2001年,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=958573
【文献】森田 俊彦,外1名,映像情報とセキュリティ,映像情報 第30巻 第5号,日本,産業開発機構株式会社,1998年,第30巻
【文献】Z. Hu, et al.,Tracking cycle: a new concept for simultaneous tracking of multiple moving objects in a typical traffic scene,Proceedings of the IEEE Intelligent Vehicles Symposium 2000,米国,2000年,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=898347
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06V 10/00 - 20/90
G08G 1/16
(57)【特許請求の範囲】
【請求項1】
ビデオプロセッサであって、
第1のビデオフレームにおけるオブジェクトを検出するように構成されるオブジェクト検出回路と、
オブジェクト伝搬回路であって、
前記オブジェクトの第1の注目点に関連する第1のオプティカルフローに基づいて
、第1の注目領域に位置して前記オブジェクトの一部であると判定される第1の注目点のセットから
、前記第1の注目点のセットの中で前記オブジェクトを囲む矩形の第1のコーナーに最も近く位置する前記第1の注目点を選択し、
前記オブジェクトの第2の注目点に関連する第2のオプティカルフローに基づいて、前記オブジェクトを囲む前記
矩形の、前記第1のコーナーと対角線状に対向している第2のコーナーに位置する第2の注目領域に配置される
第2の注目点のセットから前記第2の注目点を選択し、
前記第1のオプティカルフローに基づいて第2のビデオフレームにおける前記第1の注目点の位置を判定し、前記第2のオプティカルフローに基づいて前記第2のビデオフレームにおける前記第2の注目点の位置を判定することによって、前記第2のビデオフレームにおける前記オブジェクトの位置を推定する、
ように構成される、前記オブジェクト伝搬回路と、
を含む、ビデオプロセッサ。
【請求項2】
請求項1に記載のビデオプロセッサであって、
前記オブジェクト伝搬回路が、
前記第1の注目領域における
前記第1の注目点のセットを含む複数の注目点を識別し、
前記複数の注目点の各々が前記オブジェクトの一部であるかどうかを判定し、
前記オブジェクトの一部であると判定され
る前記複数の注目点の
幾つ
かを前記第1の注目点
のセットとして選択する、
ように更に構成される、ビデオプロセッサ。
【請求項3】
請求項1に記載のビデオプロセッサであって、
前記オブジェクト伝搬回路が、
前記第1の注目領域における
前記第1の注目点のセットを含む複数の注目点を識別し、
前記複数の注目点の各々についてオプティカルフローを判定し、
前記
複数の注目点
の各々について
の前記オプティカルフローに基づいて前記複数の注目点の
幾つ
かを前記第1の注目点
のセットとして選択する、
ように更に構成される、ビデオプロセッサ。
【請求項4】
請求項1に記載のビデオプロセッサであって、
前記オブジェクト伝搬回路が、
伝搬されるべきオブジェクトのプールを維持し、
各ビデオフレームにおいて前記オブジェクトの位置が推定されるライフタイム値を前記プールにおける各オブジェクトに割り当てる、
ように更に構成される、ビデオプロセッサ。
【請求項5】
請求項4に記載のビデオプロセッサであって、
前記オブジェクト伝搬回路が、検出されたオブジェクトに割り当てられ、第1の閾値を超える検出信頼値に基づいて、前記検出されたオブジェクトを前記プールに追加するように更に構成される、ビデオプロセッサ。
【請求項6】
請求項4に記載のビデオプロセッサであって、
前記オブジェクト伝搬回路が、所与のビデオフレームにおいて、前記検出されたオブジェクトの前記推定された位置における前記検出されたオブジェクトと前記所与のビデオフレームにおいて検出された第2のオブジェクトとの重なりが所定の重なりよりも小さいことに基づいて、検出されたオブジェクトを前記プールから削除するように更に構成される、ビデオプロセッサ。
【請求項7】
請求項1に記載のビデオプロセッサであって、
前記オブジェクトが第1のオブジェクトであり、
前記オブジェクト伝搬回路が、前記第2のフレームにおいて検出されるオブジェクトが前記オブジェクトと少なくとも所定量重なることに応答して、前記第2のビデオフレームにおける前記第1のオブジェクトの前記推定位置における前記第1のオブジェクトを抑制するように更に構成され、
前記第2のビデオフレームにおいて検出された前記オブジェクトの検出信頼スコアが前記第1のオブジェクトの検出信頼スコアよりも低い、ビデオプロセッサ。
【請求項8】
プロセッサを用いるビデオオブジェクト検出のための方法であって、
第1のビデオフレームにおいてオブジェクトを検出することと、
前記オブジェクトの第1の注目点に関連する第1のオプティカルフローに基づいて
第1の注目領域に位置して前記オブジェクトの一部であると判定される第1の注目点のセットから第1の注目点を選択することであって、前記第1の注目点が
前記第1の注目点のセットの中で前記オブジェクトを囲む
矩形の第1のコーナーに
最も近く位置する、前記第1の注目点を選択することと、
前記オブジェクトの第2の注目点に関連する第2のオプティカルフローに基づいて
第2の注目点のセットから第2の注目点を選択することであって、前記第2の注目点
のセットが前記オブジェクトを囲む前記
矩形の第2のコーナーに位置する第2の注目領域に配置され、前記第2のコーナーが前記第1のコーナーと対角線状に対向する、前記第2の注目点を選択することと、
前記第1のオプティカルフローに基づいて第2のビデオフレームにおける前記第1の注目点の位置を判定し、前記第2のオプティカルフローに基づいて前記第2のビデオフレームにおける前記第2の注目点の位置を判定することによって、前記第2のビデオフレームにおける前記オブジェクトの位置を推定することと、
を含む、方法。
【請求項9】
請求項8に記載の方法であって、
前記第1の注目領域における
前記第1の注目点のセットを含む複数の注目点を識別することと、
前記複数の注目点の各々が前記オブジェクトの一部であるかどうかを判定することと、
前記オブジェクトの一部であると判定され
る前記複数の注目点の
幾つ
かを前記第1の注目点
のセットとして選択することと、
を更に含む、方法。
【請求項10】
請求項8に記載の方法であって、
前記第1の注目領域における
前記第1の注目点のセットを含む複数の注目点を識別することと、
前記複数の注目点の各々についてオプティカルフローを判定することと、
前記
複数の注目点
の各々について
の前記オプティカルフローに基づいて前記複数の注目点の
幾つ
かを前記第1の注目点
のセットとして選択することと、
を更に含む、方法。
【請求項11】
請求項8に記載の方法であって、
伝播されるべきオブジェクトのプールを維持することと、
前記オブジェクトの位置が各ビデオフレームにおいて推定されるライフタイム値を前記プールにおける各オブジェクトに割り当てることと、
を更に含む、方法。
【請求項12】
請求項11に記載の方法であって、
検出されたオブジェクトに割り当てられ、第1の閾値を超える検出信頼値に基づいて、前記検出されたオブジェクトを前記プールに追加することを更に含む、方法。
【請求項13】
請求項11に記載の方法であって、
所与のビデオフレームにおいて、検出されたオブジェクトの前記推定位置における前記検出されたオブジェクトと前記所与のビデオフレームにおいて検出される第2のオブジェクトとの重なりが所定の重なりよりも小さいことに基づいて、前記プールから前記検出されたオブジェクトを削除することを更に含む、方法。
【請求項14】
請求項8に記載の方法であって、
前記オブジェクトが第1のオブジェクトであり、
前記方法が、前記第2のフレームにおいて検出されるオブジェクトが前記オブジェクトと少なくとも所定量重なることに応答して、前記第2のビデオフレームにおける前記第1のオブジェクトの推定位置における前記第1のオブジェクトを抑制することを更に含み、
前記第2のフレームにおいて検出された前記オブジェクトの検出信頼スコアが、前記第1のオブジェクトの検出信頼スコアよりも低い、方法。
【請求項15】
ビデオシステムであって、
動作環境の画像を捕捉するように構成されるカメラと、
前記カメラに結合されるビデオプロセッサであって、
前記カメラから複数のビデオフレームを受け取り、
前記複数のビデオフレームの第1のビデオフレームにおいてオブジェクトを検出し、
前記オブジェクトを囲む
矩形を画定し、
前記
矩形の第1のコーナーにおいて第1の注目領域を画定し、
前記第1の注目領域における第1の複数の注目点を識別し、
前記第1の複数の注目点の各々のオプティカルフローを判定し、
前記第1の複数の注目点の各々が前記オブジェクトの一部であるか否かを判定し、
前記オブジェクトの第1の注目点に関連する第1のオプティカルフローに基づいて前記第1の複数の注目点から
前記オブジェクトの一部であって前記矩形の第1のコーナーに最も近く位置する第1の注目点を選択し、
前記第1のコーナーと対角線状に対向する前記
矩形の第2のコーナーにおいて第2の注目領域を画定し、
前記第2の注目領域における第2の複数の注目点を識別し、
前記オブジェクトの第2の注目点に関連する第2のオプティカルフローに基づいて前記第2の複数の注目点から第2の注目点を選択し、
前記第1のオプティカルフローに基づいて第2のビデオフレームにおける前記第1の注目点の位置を判定し、前記第2のオプティカルフローに基づいて前記第2のビデオフレームにおける前記第2の注目点の位置を判定することによって、前記第2のビデオフレームにおける前記オブジェクトの位置を推定する、
ように構成される、前記ビデオプロセッサと、
を含む、ビデオシステム。
【請求項16】
請求項15に記載のビデオシステムであって、
前記ビデオプロセッサが、
前記第1の複数の注目点の各々が前記オブジェクトの一部であるかどうかを判定
するためにエピポーラチェックを実施し、
前記第2の複数の注目点の各々が前記オブジェクトの一部であるかどうかを判定
するためにエピポーラチェックを実施し、
前記オブジェクトの一部であり、前記
矩形の第2のコーナーに最も近い、前記第2の複数の注目点の1つの注目点を第2の注目点として選択する、
ように更に構成される、ビデオシステム。
【請求項17】
請求項15に記載のビデオシステムであって、
前記ビデオプロセッサが、
伝搬されるべきオブジェクトのプールを維持し、
各ビデオフレームにおいて前記オブジェクトの位置が推定されるライフタイム値を前記プールにおける各オブジェクトに割り当てる、
ように更に構成される、ビデオシステム。
【請求項18】
請求項17に記載のビデオシステムであって、
前記ビデオプロセッサが、検出されたオブジェクトに割り当てられ、第1の閾値を超える検出信頼スコア値に基づいて、前記検出されたオブジェクトを前記プールに追加するように更に構成される、ビデオシステム。
【請求項19】
請求項17に記載のビデオシステムであって、
前記ビデオプロセッサが、所与のビデオフレームにおいて、検出されたオブジェクトの前記推定された位置における前記検出されたオブジェクトと前記所与のビデオフレームにおいて検出される第2のオブジェクトとの重なりが所定の重なりよりも小さいことに基づいて、前記プールから前記検出されたオブジェクトを削除するように更に構成される、ビデオシステム。
【請求項20】
請求項15に記載のビデオシステムであって、
前記オブジェクトが第1のオブジェクトであり、
前記ビデオプロセッサが、前記第2のフレームにおいて検出された第2のオブジェクトが前記第1のオブジェクトと少なくとも所定量だけ重なることに応答して、前記第2のビデオフレームにおける前記第1のオブジェクトの推定位置における前記第1のオブジェクトを抑制するように更に構成され、
前記第2のビデオフレームにおいて検出された前記オブジェクトの検出信頼スコアが、前記第1のオブジェクトの検出信頼スコアよりも低い、ビデオシステム。
【発明の詳細な説明】
【技術分野】
【0001】
オブジェクト検出は、コンピュータビジョンにおける重要な問題である。或るシーンにおけるオブジェクトの挙動と動きを解析するために、ビデオ処理システムはビデオデータからオブジェクトを確実に検出する必要がある。オブジェクトの検出は、オブジェクトの位置及びスケールを判定することに関与する。様々な分析応用例は、シーンにおけるオブジェクトの位置及び縮尺を判定することに基づいている。例えば、トラッカーは、オブジェクトの位置と縮尺で初期化する必要があるため、オブジェクト検出は、オブジェクト追跡に先行するものとして必須である。
【0002】
先進運転支援システム(ADAS)及び自動運転システムは、オブジェクト検出に依存して、車両動作環境におけるオブジェクトの位置を判定する。ADASのオペレーションは、検出されたオブジェクトのドライバに警告すること、又は検出されたオブジェクトを回避するために車両の制御を想定することを含み得る。
【発明の概要】
【0003】
視覚プロセッサが、オブジェクト検出回路とオブジェクト伝搬回路とを含む。オブジェクト検出回路は、第1のビデオフレームにおいてオブジェクトを検出するように構成される。オブジェクト伝搬回路は、オブジェクトの第1の注目点を選択するように構成される。第1の注目点は、オブジェクトを囲むボックスの第1のコーナー(corner)に位置する第1の注目領域に配置される。オブジェクト伝搬回路はまた、オブジェクトの第2の注目点を選択するように構成される。第2の注目点は、オブジェクトを囲むボックスの第2のコーナーに位置する第2の注目領域に配置される。第2のコーナーは、第1のコーナーと対角線状に対向している。オブジェクト伝搬回路はさらに、第1の注目点について第1のオプティカルフロー(optical flow)を判定し、第2の注目点について第2のオプティカルフローを判定するように構成される。さらに、オブジェクト伝搬回路は第1のオプティカルフローに基づいて第2のビデオフレームにおける第1の注目点の位置を判定し、第2のオプティカルフローに基づいて第2のビデオフレームにおける第2の注目点の位置を判定することによって、第2のビデオフレームにおけるオブジェクトの位置を推定するように構成される。
【0004】
ビデオオブジェクト検出のための方法が、第1のビデオフレームにおいてオブジェクトを検出することを含む。オブジェクトの第1の注目点が選択される。第1の注目点は、オブジェクトを囲むボックスの第1のコーナーに位置する第1の注目領域に配置される。オブジェクトの第2の注目点が選択される。第2の注目点は、オブジェクトを囲むボックスの第2のコーナーに位置する第2の注目領域に配置される。第2のコーナーは、第1のコーナーと対角線状に対向している。第1の注目点の第1のオプティカルフローが判定される。第2の注目点に対する第2のオプティカルフローが判定される。第2のビデオフレームにおけるオブジェクトの位置は、第1のオプティカルフローに基づいて第2のビデオフレームにおける第1の注目点の位置を判定し、第2のオプティカルフローに基づいて第2のビデオフレームにおける第2の注目点の位置を判定することによって推定される。
【0005】
ビデオシステムが、カメラ及びビデオプロセッサを含む。カメラは、動作環境の画像を捕捉するように構成される。ビデオプロセッサは、カメラに結合され、カメラからビデオフレームを受け取り、ビデオフレームの第1のビデオフレームにおけるオブジェクトを検出するように構成される。ビデオプロセッサはまた、オブジェクトを囲むボックスを画定し、ボックスの第1のコーナーにおける第1の注目領域を画定し、第1の領域における第1の複数の注目点を識別し、第1の複数の注目点から第1の注目点を選択し、第1の注目点について第1のオプティカルフローを判定するように構成される。ビデオプロセッサはさらに、ボックスの第2のコーナーにおける第2の注目領域を画定し、第2の領域における第2の複数の注目点を識別し、第2の複数の注目点から第2の注目点を選択し、第2の注目点について第2のオプティカルフローを判定するように構成される。第2のコーナーは、第1のコーナーと対角線状に対向している。ビデオプロセッサは、第1のオプティカルフローに基づいて第2のビデオフレームにおける第1の注目点の位置を判定し、第2のオプティカルフローに基づいて第2のビデオフレームにおける第2の注目点の位置を判定することによって、第2のビデオフレームにおけるオブジェクトの位置を推定するようにさらに構成される。
【図面の簡単な説明】
【0006】
【
図1】本記載に従ってビデオ画像を処理するための例示のシステムのブロック図を示す。
【0007】
【
図2】本記載に従ったオブジェクト検出のための例示の方法のためのフローチャートを示す。
【0008】
【
図3】本記載に従ってビデオ処理システムによって検出されるオブジェクトのためのオプティカルフローに基づく注目点の選択を示す。
【0009】
【
図4A】本記載に従ってビデオ処理システムによって検出されるオブジェクトについてのエピポーラチェックに基づく注目点の選択を示す。
【
図4B】本記載に従ってビデオ処理システムによって検出されるオブジェクトについてのエピポーラチェックに基づく注目点の選択を示す。
【0010】
【
図5A】本記載に従ったオプティカルフローによって伝播されるオブジェクトのプールを示す。
【
図5B】本記載に従ったオプティカルフローによって伝播されるオブジェクトのプールを示す。
【0011】
【
図6A】本記載に従ったオプティカルフローによるオブジェクト伝搬のための条件を示す。
【
図6B】本記載に従ったオプティカルフローによるオブジェクト伝搬のための条件を示す。
【
図6C】本記載に従ったオプティカルフローによるオブジェクト伝搬のための条件を示す。
【0012】
【
図7A】本記載に従った条件付きNMS(non-maximum suppression)に基づくオプティカルフローによって伝播されるオブジェクトの抑制を示す。
【
図7B】本記載に従った条件付きNMSに基づくオプティカルフローによって伝播されるオブジェクトの抑制を示す。
【0013】
【
図8】本記載に従ったオプティカルフローによってオブジェクト伝搬を実装するのに適した例示のシステムオンチップのためのブロック図を示す。
【発明を実施するための形態】
【0014】
本記載において、「結合する」という用語は、間接的又は直接的な有線又はワイヤレス接続のいずれかを意味する。したがって、第1のデバイスが第2のデバイスに結合する場合、その接続は、直接的接続を介するもの、又は他のデバイス及び接続を介する間接的接続を介するものであり得る。また、本記載では、「~に基づく」は「少なくとも部分的に基づく」ことを意味する。したがって、XがYに基づく場合、XはY及び任意の数の他の要因の関数であり得る。
【0015】
ディープラーニングの使用は、ビデオにおけるオブジェクトの検出及び認識を実質的に改善してきている。しかしながら、ディープラーニングを実装するために必要な計算の複雑度は、リアルタイムでビデオを処理する埋め込みデバイスに対する実装を困難にしている。シングルショット検出器(SSD)などの、埋め込みデバイスにおけるオブジェクト検出に特に向けられたディープラーニングベースのオブジェクト検出の実装は有用であるが、ほとんどの埋め込みデバイスで利用可能であるよりもかなり多くの計算能力を依然として必要とする。
【0016】
本明細書に記載されるビデオ処理装置及び方法は、著しく(例えば、80倍)低い計算複雑度で、SSDのものと同様のオブジェクト検出精度を提供する。実装は、検出されたオブジェクトに関連付けられた2つの注目領域の各々において注目点を選択する。注目領域は、オブジェクトを囲む矩形の対向する頂点に位置する。注目点の各々のオプティカルフローが判定され、注目点のオプティカルフローに基づいて、後続のビデオフレームにおけるオブジェクトの位置が判定される。オプティカルフローを用いて伝播される検出されたオブジェクトのプールが維持される。プール内の、選択された経過時間未満のすべての検出されたオブジェクトが伝播される。第1の信頼閾値を上回る検出信頼スコアを有する検出されたオブジェクトが、プールに追加される。検出されたオブジェクトは、伝播されたオブジェクトが、第1の閾値を下回る検出信頼スコアである検出されたオブジェクトと重なる場合、オプティカルフローに基づいて伝播される。
【0017】
図1は、本記載に従ったビデオ画像を処理するための例示のビデオ処理システム100のブロック図を示す。ビデオ処理システム100は、一つ又は複数のカメラ102と、ビデオプロセッサ104を含む。カメラ102は、特定の応用例におけるオブジェクト検出に適したフレームレート及び解像度で可視光又は赤外画像を捕捉し得る。例えば、ビデオ処理システム100は、車両の動作環境におけるオブジェクトを検出するために、先進運転支援システム(ADAS)又は自動運転システムに適用され得る。そのような応用例において、カメラ102は、毎秒60フレーム、毎秒30フレームのフレームレート、又は0.5~8メガピクセル又はそれ以上の解像度を有する他の好適な速度で動作し得る。カメラ102は、モバイル産業プロセッサインタフェース連合(例えば、MIPI CSI−2)によって特定されるカメラシリアルインタフェース、又はビデオデータをプロセッサに転送するのに適した他のインタフェースを介して、ビデオプロセッサ104に結合され得る。
【0018】
ビデオプロセッサ104は、オブジェクトを検出し、カメラ102から受け取ったビデオデータに基づいて他のオペレーションを行うのに適している命令実行デバイスである。例えば、或るADAS実装において、ビデオプロセッサ104が、テキサス・インスツルメンツ社によって製造されたTDA2ファミリのシステムオンチップ(SoC)であってもよく、ビデオプロセッサ104は任意の数及びタイプのサブプロセッサを含んでもよい。ビデオプロセッサ104の様々な実装は、カメラ102から受け取ったビデオデータを操作し、ビデオコプロセッサコア100のカメラ102及び他の構成要素(例えば、ビデオディスプレイ、オートモーティブ制御システムなど)を制御するために、一つ又は複数の汎用マイクロプロセッサコア、及び/又は一つ又は複数の汎用コプロセッサコア、及び/又は一つ又は複数のデジタルシグナルプロセッサコア、及び/又は一つ又は複数のハードウェアビデオアクセラレータコア、及び一つ又は複数の視覚エンジンコアを含み得る。また、ビデオプロセッサ104の実装は、処理のためのビデオデータとビデオプロセッサ104に含まれる種々プロセッサコアによって実行される命令とのストレージのためのメモリと、メモリにアクセスし、ビデオプロセッサ104の外部の他のデバイスと通信するためのインタフェースとを含み得る。
【0019】
ビデオプロセッサ104は、オブジェクト検出回路106及びオブジェクト伝搬回路108を含む。オブジェクト検出回路106及びオブジェクト伝搬回路108は、ビデオプロセッサ104のメモリにストアされた命令を実行するビデオプロセッサ104の一つ又は複数のプロセッサコアによって実装され得る。オブジェクト検出回路106は、カメラ102から受け取ったビデオのフレームを解析し、各フレームにおけるオブジェクトを検出する。それぞれのオブジェクト検出には、検出されたオブジェクトがビデオフレーム内に存在する尤度を表す信頼値(すなわち、検出信頼スコア)が割り当てられる。例えば、0.4~0.6の範囲の検出信頼スコアが、検出されたオブジェクトがビデオフレーム内に存在するという良好な信頼度を示し得る。オブジェクト検出回路106の例は、SSD、高速R−CNN(領域提案+畳み込みニューラルネットワーク)、又は他のオブジェクト検出アーキテクチャを実装し得る。
【0020】
オブジェクト伝搬回路108は、前のビデオフレームで検出されたオブジェクトの、現ビデオフレームにおける位置を推定する。オブジェクト伝搬回路108は、前のビデオフレームにおけるオブジェクトの注目点のオプティカルフローを分析し、判定されたオプティカルフローをオブジェクトに適用することによって、前のビデオフレームから現在のビデオフレームにオブジェクトを伝播する。オブジェクト伝搬回路108の実装は、オブジェクトの伝播位置を、低い検出信頼度(例えば、0.3~0.5の範囲の検出信頼スコア)のため認識されないままとなるオブジェクト検出と相関させることによって、改善されたオブジェクト検出を提供する。したがって、オブジェクト伝搬回路108は、さもなければ検出されないままであり得るビデオフレームにおけるオブジェクトの存在を検出し、オブジェクト伝搬回路108は、同様の検出性能をもたらす他のアルゴリズムよりも低い計算複雑度を有する改善された検出を提供する。
【0021】
図2は、本記載に従ったオブジェクト検出のための例示の方法200のフローチャートを示す。便宜上順次示されているが、示されている行為の少なくとも幾つかが、異なる順で実施され得、及び/又は並列に実施され得る。また、実装によっては、示されている行為の一部のみを行う場合がある。方法200のオペレーションは、ビデオプロセッサ104及び/又はビデオ処理システム100の実装によって成されてもよい。
【0022】
ブロック202において、カメラ102は、ビデオフレームにおけるビデオ処理システム100の動作環境の画像を捕捉する。オブジェクト検出回路106は、オブジェクトの検出のためのビデオフレームを処理する。
【0023】
ブロック204において、ビデオフレームにおけるオブジェクト検出回路106によって検出された各オブジェクトについて、オブジェクト伝搬回路108はオブジェクトの2つの注目領域における注目点を識別する。
図3は、オブジェクト検出回路106によって検出されたオブジェクト302を示す。オブジェクト302は、矩形300によって囲まれている。オブジェクト伝搬回路108は、矩形300の第1のコーナー312におけるエリアを第1の注目領域304として識別し、矩形300の第2のコーナー314におけるエリアを第2の注目領域308として識別する。第1のコーナー312は、第2のコーナー314と対角線状に対向している。注目領域304及び注目領域308内で、オブジェクト伝搬回路108は、幾つかの注目点を識別する。注目点は、注目領域304において識別された端部又はコーナーに位置する点(例えば、画素)によって識別され得る。例えば、オブジェクト伝搬回路108は、閾値を超える端部又はコーナースコアを有する点を注目点として識別し得る。注目領域304において、オブジェクト伝搬回路108は、注目点306A、注目点306B、注目点306C、注目点306D、及び注目点306Eを識別する。注目領域308において、オブジェクト伝搬回路108は、注目点310A、注目点310B、注目点310C、注目点310D、及び注目点310Eを識別する。
【0024】
注目領域における複数の注目点を識別すると、オブジェクト伝搬回路108は、複数の注目点から、注目領域の各々における注目点のうちの1つを選択する。注目領域の各々において単一の注目点を選択するために、オブジェクト伝搬回路108は、識別された注目点の各々についてオプティカルフローを判定する。不良オプティカルフローを示す注目点は、考慮から除去される。例えば、オブジェクトをフレームから取り出し、オブジェクトを見えなくするオプティカルフローを有する注目点等は、不良オプティカルフローと考えることができる。注目領域304において、注目点306Aは不良オプティカルフローを有するものとして識別され、注目領域308において、注目点310Aは不良オプティカルフローを有するものとして識別される。したがって、注目点306Aは注目領域304における1つの注目点として選択されず、注目点310Aは注目領域308における1つの注目点として選択されない。
【0025】
ブロック206において、矩形300は、オブジェクト302に加えて背景の部分を含むので、オブジェクト伝搬回路108は、注目点の各々がオブジェクト302の一部であるか、背景の一部であるかを判定する。オブジェクト302の一部ではない注目点は、注目領域において選択される1つの注目点としての考慮から除去される。
図4A及び
図4Bは、矩形400に配置される検出オブジェクト402を示す。
図4Aは、背景の様々な構成要素が矩形400内に含まれており、これらの構成要素の幾つかが、注目領域404又は注目領域408における端部又はコーナーを示し得ることを示す。注目領域404及び注目領域408における注目点の各々について、オブジェクト伝搬回路108は、カメラ102によって異なる時間に捕捉された2つの画像を用いてエピポーラチェックを行う。オブジェクト伝搬回路108は、オブジェクト402について基本行列を演算する。基本行列を用いて、オブジェクト伝搬回路108はエピポーラ線を演算する。エピポーラ線から遠く(例えば、閾値より大きい)端部で終端するオプティカルフローを有する如何なる注目点も、背景又は異なるオブジェクトの一部とみなされ、注目領域における1つの注目点として選択するための考慮から除外される。
【0026】
ブロック208において、良好なオプティカルフローを有し、検出されたオブジェクトの点とみなされる注目点から、オブジェクト伝搬回路108は、注目領域における1つの注目点となるように、アンカーポイントに最も近い(最小距離を有する)(すなわち、注目領域のコーナーに最も近い)注目点を選択する。例えば、
図3において、注目点306B、注目点306C、注目点306D、及び注目点306Eが良好なオプティカルフローを有し、エピポーラチェックに合格した場合、注目点306Bはコーナー312に最も近いので、オブジェクト伝搬回路108は、注目領域304について注目点306Bを1つの注目点として選択する。同様に、注目点310B、注目点310C、注目点310D、及び注目点310Eが良好なオプティカルフローを有し、エピポーラ検査に合格した場合、注目点310Bはコーナー314に最も近いので、オブジェクト伝搬回路108は、注目領域308について注目点310Bを1つの注目点として選択する。
図4Bにおいて、オブジェクト伝搬回路108は、注目領域404における1つの注目点として注目点410を選択し、注目領域408における1つの注目点として注目点412を選択する。
【0027】
オブジェクト伝搬回路108は、オプティカルフローに基づいて伝搬するオブジェクトのプールを維持する。ブロック210において、ブロック202で識別されたオブジェクトがプールに追加される。オブジェクト検出回路106によってオブジェクトに割り当てられた検出信頼スコアが、検出されたオブジェクトがビデオフレーム内に存在するという良好な信頼度を示す場合、識別されたオブジェクトがプールに追加され得る。例えば、オブジェクト検出回路106によってオブジェクトに割り当てられた検出信頼スコアが信頼スコア閾値(例えば、0.4~0.6の範囲の閾値)を超える場合、そのオブジェクトは500に追加され得る。
図5A及び
図5Bは、本記載に従ってオプティカルフローによって伝播されるオブジェクトのプール500を示す。
図5Aはプール500を示し、プール500は、オブジェクト502、オブジェクト504、及びオブジェクト506を含む。プール500は、ビデオプロセッサ104のメモリにストアされ得る。プール500は、任意の数のオブジェクトを含み得る。新しいオブジェクトが検出されると、検出されたオブジェクトがプール500に追加される。オブジェクトがプール500に追加されると、ライフタイム値がオブジェクトに割り当てられる。オブジェクトがプールに追加されるときに、例えば、0.5秒、1秒などのライフタイムが、各オブジェクトに割り当てられ得る。ライフタイムの満了時に、オブジェクトはプール500から削除され得る。プール500におけるオブジェクトのライフタイムの持続時間の間、そのオブジェクトは各新たなビデオフレームにおいて伝播され得る(すなわち、オブジェクトの位置が推定される)。
【0028】
ブロック212において、プール500にストアされたオブジェクトは伝搬される。
図5Bは、後続のビデオフレームにおける、プール500内のオブジェクトの伝搬を示す。オブジェクトの各々において識別された2つの注目点のオプティカルフローは、オブジェクトを囲むボックスのアンカーポイント(すなわち、注目領域の頂点)にオプティカルフローを適用することによって、オブジェクトの位置を推定するために適用される。
図5Bにおいて、オブジェクト502がオプティカルフロー503A及びオプティカルフロー503Bに基づいて、位置512に伝播される。オブジェクト504は、オプティカルフロー505A及びオプティカルフロー505Bに基づいて、位置514に伝搬される。オブジェクト506は、オプティカルフロー507A及びオプティカルフロー507Bに基づいて、位置516に伝播される。
【0029】
オブジェクト検出回路106の実装において、ビデオプロセッサ104が、中程度の検出信頼スコアを有するビデオフレームにおけるオブジェクトを検出し、検出されたオブジェクトが、伝播されたオブジェクトと重なる場合、プール500におけるオブジェクトが伝播され得る。中程度の検出信頼スコアは、オブジェクトをプール500に追加するために適用される良好な検出信頼スコアより低い信頼スコアを示す。例えば、良好な検出信頼スコアは0.4又はそれ以上であり得、一方、中程度の検出信頼スコアは少なくとも0.2であり0.4未満であり得る。
【0030】
図6A、
図6B、及び
図6Cは、本記載に従って少なくとも中程度の検出信頼スコアを有する新たに検出されたオブジェクトとの重なりに基づくオブジェクト伝搬の例を示す。少なくとも中程度の検出信頼スコアを有する新たに検出されたオブジェクトが、重なり閾値を超えるIntersection over Union(IoU)を有するプール500におけるオブジェクトの推定位置と重なる場合、プール500におけるオブジェクトは、推定位置に伝播される。
図6Aにおいて、オブジェクト602の位置は、オブジェクト602の注目点のオプティカルフローに基づいて推定されている。オブジェクト604は、検出信頼スコア0.3(中程度の検出信頼スコア)で現在のフレームにおいて検出されており、オブジェクト606は検出信頼スコア0.4(中程度又は良好な検出信頼スコア)で現在のフレームにおいて検出されている。しかしながら、オブジェクト602と、オブジェクト604又はオブジェクト606のいずれかとの間に重なりがないので、オブジェクト伝搬回路108はオブジェクト602を現在のビデオフレームに伝播せず、オブジェクト602はプール500から削除され得る。
【0031】
図6Bにおいて、オブジェクト602の位置が、オブジェクト602の注目点のオプティカルフローに基づいて推定されている。オブジェクト608は、検出信頼スコア0.3(中程度の検出信頼スコア)で現在のフレームにおいて検出されており、オブジェクト610は、検出信頼スコア0.4(中程度又は良好な検出信頼スコア)で現在のフレームにおいて検出されている。オブジェクト602とオブジェクト610との間には重なりはなく、オブジェクト602とオブジェクト608とのIoUは重なり閾値未満である。したがって、オブジェクト伝搬回路108は、現在のビデオフレームにおいてオブジェクト602を伝播せず、オブジェクト602をプール500から削除し得る。
【0032】
図6Cにおいて、オブジェクト602の位置が、オブジェクト602の注目点のオプティカルフローに基づいて推定されている。オブジェクト612は、検出信頼スコア0.3(中程度の検出信頼スコア)で現在のフレームにおいて検出され、オブジェクト614は、検出信頼スコア0.4(中程度又は良好な検出信頼スコア)で現在のフレームにおいて検出されている。オブジェクト602は、オブジェクト612とオブジェクト614の両方に重なる。オブジェクト602及びオブジェクト614のIoUは、重なり閾値よりも小さく、したがって、オブジェクト602の伝搬をトリガしない。オブジェクト602とオブジェクト612のIoUは重なり閾値を超えている。オブジェクト602と612の重なりに基づいて、オブジェクト伝搬回路108はオブジェクト602を現在のビデオフレームに伝搬させ、オブジェクト602はプール500に残る。
【0033】
オブジェクト伝搬回路108の実装において、オプティカルフローに基づくオブジェクト伝搬は、プール500におけるオブジェクトが現在のビデオフレームにおけるオブジェクト検出回路106によって伝播され検出される場合、同じオブジェクトの複数の検出をもたらし得る。オブジェクト伝搬回路108は、条件付きnon-maximum suppression(NMS)オペレーションを適用して、このような複数検出を回避する。オブジェクトの2つのインスタンスの重なりが所定の閾値(例えば、0.5)より高い場合、条件付きNMSは、2つの検出されたオブジェクトの検出信頼スコアに関係なく、オブジェクトの2つのインスタンスのうち古い方を抑制する。オブジェクト伝搬回路108において、オプティカルフローに基づいて伝播されるオブジェクトは常に、新たに検出されたオブジェクトよりも古く、常に、新たに検出されたオブジェクトに有利に抑制される。
【0034】
図7A及び
図7Bは、本記載に従った条件付きNMSに基づくオプティカルフローによって伝播されるオブジェクトの抑制を示す。
図7Aにおいて、伝播されたオブジェクト702は0.6の検出信頼スコアを有し、オブジェクト704の新たに検出されたインスタンスは、0.8の検出信頼スコアを有する。オブジェクト702はオブジェクト704よりも古いので、オブジェクト伝搬回路108は条件付きNMSを適用してオブジェクト702を抑制し、オブジェクト702はプール500から削除され得る。これらの条件のもとで、条件付きNMSは、どのオブジェクトインスタンスが抑制されるべきかを選択するために検出信頼スコアに依拠するNMSと同じ結果を提供する。
【0035】
図7Bにおいて、伝播されたオブジェクト710は0.8の検出信頼スコアを有し、オブジェクト708の新たに検出されたインスタンスは、0.6の検出信頼スコアを有する。オブジェクト伝搬回路108は、条件付きNMSを適用してオブジェクト710を抑制する。オブジェクト708の検出信頼スコアがオブジェクト710の検出信頼スコアより低い一方、オブジェクト710はオブジェクト708よりも古く、これにより、オブジェクト伝搬回路108にオブジェクト710をオブジェクト708に有利に抑制させ、オブジェクト710はプール500から削除され得る。これらの条件のもとで、条件付きNMSは、どのオブジェクトインスタンスが抑制されるべきかを選択するために検出信頼スコアに依拠するNMSとは異なる結果を提供する。
【0036】
図2に戻ると、ブロック214において、オブジェクト伝搬回路108は、ライフタイム時間が満了したオブジェクト、又は、新たに検出されたオブジェクトと少なくとも所定のIoUの閾値量だけ重ならないオブジェクトを、プール500から除去する。
【0037】
図8は、プロセッサビデオプロセッサ104の一実装であるSoC800の例を示す。SoC800は、高速度相互接続820を介して結合される、一つ又は複数の汎用プロセッサ(GPP)コア802、一つ又は複数のデジタルシグナルプロセッサ(DSP)コア806、一つ又は複数の視覚プロセッサコア812、及び一つ又は複数の処理アクセラレータコア804を含む。処理アクセラレータコア804は、カメラ102から受け取った入力画像に対して様々な処理オペレーションを行うように構成される幾つかのハードウェアアクセラレータを含む。視覚プロセッサコア812は、勾配演算、方位ビニング、ヒストグラム正規化などのコンピュータ視覚処理に対して調整されたベクトルプロセッサである。このようなコンピュータ視覚処理は、処理アクセラレータ804の前処理された出力を用い得る。GPPコア802は、オペレーティングシステムをホストし、804によって成された前処理タスクのスケジューリングを含む、SoC800のオペレーションの全体的な制御を提供する。DSPコア806は、オブジェクト検出及び分類、オブジェクト伝搬などのコンピュータ視覚処理のためのサポートを提供する。
【0038】
SoC800はさらに、DMAコントローラ816、カメラインタフェース818、ディスプレイ管理構成要素810、例えばコンピュータ読み取り可能媒体などのオンチップランダムアクセスメモリ(RAM)814、及び、さまざまな入力/出力(I/O)周辺機器822を含み、これらはすべて、高速相互接続820を介してプロセッサコア802、804、806、及び812に結合される。さらに、オートモーティブ用途を対象とするSoC800の幾つかの実装が、オートモーティブ安全要件の遵守を可能にする安全関連機能性を含む安全構成要素824を含む。そのような機能性には、データのCRC(巡回冗長検査)、ドリフト検出のためのクロックコンパレータ、エラーシグナリング、ウィンドウウォッチドッグタイマー、並びに、損害及び欠陥に対するSoC800の自己テストのためのサポートが含まれ得る。
【0039】
本発明の特許請求の範囲内で、説明した例示の実施例に改変が成され得、他の実施例が可能である。