(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-28
(45)【発行日】2023-10-06
(54)【発明の名称】車両を検出するための方法、装置、電子機器、記憶媒体およびコンピュータプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20230929BHJP
G06V 10/82 20220101ALI20230929BHJP
G06V 20/58 20220101ALI20230929BHJP
【FI】
G06T7/00 650B
G06T7/00 350C
G06V10/82
G06V20/58
(21)【出願番号】P 2022529400
(86)(22)【出願日】2020-11-19
(86)【国際出願番号】 CN2020130110
(87)【国際公開番号】W WO2021218124
(87)【国際公開日】2021-11-04
【審査請求日】2022-06-14
(31)【優先権主張番号】202010356239.8
(32)【優先日】2020-04-29
(33)【優先権主張国・地域又は機関】CN
(73)【特許権者】
【識別番号】514322098
【氏名又は名称】ベイジン バイドゥ ネットコム サイエンス テクノロジー カンパニー リミテッド
【氏名又は名称原語表記】Beijing Baidu Netcom Science Technology Co., Ltd.
【住所又は居所原語表記】2/F Baidu Campus, No.10, Shangdi 10th Street, Haidian District, Beijing 100085, China
(74)【代理人】
【識別番号】100099623
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100125380
【氏名又は名称】中村 綾子
(74)【代理人】
【識別番号】100142996
【氏名又は名称】森本 聡二
(74)【代理人】
【識別番号】100166268
【氏名又は名称】田中 祐
(74)【代理人】
【識別番号】100218604
【氏名又は名称】池本 理絵
(74)【代理人】
【氏名又は名称】有原 幸一
(72)【発明者】
【氏名】ヤン,シィーパン
(72)【発明者】
【氏名】ヂィァン,ミンユエ
(72)【発明者】
【氏名】タン,シィアオ
(72)【発明者】
【氏名】スゥン,ハオ
(72)【発明者】
【氏名】ウェン,シィーレイ
(72)【発明者】
【氏名】ヂァン,ホォンウー
(72)【発明者】
【氏名】ディン,エールゥイ
【審査官】▲広▼島 明芳
(56)【参考文献】
【文献】国際公開第2020/063753(WO,A1)
【文献】特表2021-517312(JP,A)
【文献】特開2020-061066(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00 - 7/90
G06V 10/00 - 20/90
(57)【特許請求の範囲】
【請求項1】
検出対象画像を取得するステップと、
前記検出対象画像を予め作成された車両検出モデルに入力して車両検出結果を得るステップであって、前記車両検出結果は、検出枠の種別情報と、座標情報と、座標信頼度と、座標誤差情報とを含み、前記車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられるステップと、
検出枠の座標信頼度に基づいて、前記車両検出結果の中から検出枠を処理対象検出枠として選択するステップと、
前記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するステップと
を含
み、
前記車両検出モデルは、種別情報出力ネットワークと、座標情報出力ネットワークと、座標信頼度出力ネットワークと、座標誤差情報出力ネットワークとを含み、
前記車両検出モデルは、
サンプル画像と、サンプル画像に対応するサンプル種別情報およびサンプル座標情報とを含むサンプルからなるサンプルセットを取得するステップと、
サンプルのサンプル画像を初期モデルに入力し、初期モデルの種別情報出力ネットワークおよび座標情報出力ネットワークから予測種別情報および予測座標情報をそれぞれ出力するステップと、
前記予測座標情報と、入力されたサンプル画像に対応するサンプル座標情報とに基づいて、サンプル座標信頼度およびサンプル座標誤差情報を確定するステップと、
サンプル画像を入力とし、入力されたサンプル画像に対応するサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報を所望出力として、初期モデルをトレーニングして車両検出モデルを得るステップと
によってトレーニングされることを特徴とする車両を検出するための方法。
【請求項2】
前記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するステップは、
種別情報に基づいて、前記処理対象検出枠の中から検出枠を第1の検出枠として選択するステップと
前記第1の検出枠とのIoU(Intersection over Union)に基づいて、前記処理対象検出枠の中から検出枠を第2の検出枠として選択するステップと、
前記第1の検出枠と前記第2の検出枠とのIoU、並びに第2の検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するステップと
を含むことを特徴とする請求項1に記載の方法。
【請求項3】
前記車両検出モデルは、特徴抽出ネットワークを含み、
前記特徴抽出ネットワークは、ダイレイト畳み込み層および/または非対称畳み込み層を含むことを特徴とする請求項1または2に記載の方法。
【請求項4】
前記処理対象検出枠の種別情報と前記処理済み検出枠の座標情報とに基づいて、修正済み検出結果を生成するステップをさらに含むことを特徴とする請求項1~
3のいずれか1項に記載の方法。
【請求項5】
検出対象画像を取得するように構成される取得ユニットと、
前記検出対象画像を予め作成された車両検出モデルに入力して車両検出結果を得るように構成される入力ユニットであって、前記車両検出結果は、検出枠の種別情報と、座標情報と、座標信頼度と、座標誤差情報とを含み、前記車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられる、入力ユニットと、
検出枠の座標信頼度に基づいて、前記車両検出結果の中から検出枠を処理対象検出枠として選択するように構成される選択ユニットと、
前記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するように構成される生成ユニットと
を備え
、
前記車両検出モデルは、種別情報出力ネットワークと、座標情報出力ネットワークと、座標信頼度出力ネットワークと、座標誤差情報出力ネットワークとを含み、
前記車両検出モデルは、
サンプル画像と、サンプル画像に対応するサンプル種別情報およびサンプル座標情報とを含むサンプルからなるサンプルセットを取得するステップと、
サンプルのサンプル画像を初期モデルに入力し、初期モデルの種別情報出力ネットワークおよび座標情報出力ネットワークから予測種別情報および予測座標情報をそれぞれ出力するステップと、
前記予測座標情報と入力されたサンプル画像に対応するサンプル座標情報とに基づいて、サンプル座標信頼度およびサンプル座標誤差情報を確定するステップと、
サンプル画像を入力とし、入力されたサンプル画像に対応するサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報を所望出力として、初期モデルをトレーニングして車両検出モデルを得るステップと
によってトレーニングされることを特徴とする車両を検出するための装置。
【請求項6】
前記生成ユニットは、さらに、
種別情報に基づいて、前記処理対象検出枠の中から検出枠を第1の検出枠として選択し、
前記第1の検出枠とのIoU(Intersection over Union)に基づいて前記処理対象検出枠の中から検出枠を第2の検出枠として選択し、
前記第1の検出枠と前記第2の検出枠とのIoU、並びに第2の検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するように構成されることを特徴とする請求項
5に記載の装置。
【請求項7】
前記車両検出モデルは、特徴抽出ネットワークを含み、
前記特徴抽出ネットワークは、ダイレイト畳み込み層および/または非対称畳み込み層を含むことを特徴とする請求項
5または
6に記載の装置。
【請求項8】
前記処理対象検出枠の種別情報と前記処理済み検出枠の座標情報とに基づいて、修正済み検出結果を生成するように構成される結果生成ユニットをさらに備えることを特徴とする請求項
5~
7のいずれか1項に記載の装置。
【請求項9】
少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信接続されたメモリとを備える電子機器であって、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な指令が格納され、前記指令が前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~
4のいずれか1項に記載の方法を実行させることを特徴とする電子機器。
【請求項10】
コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ指令は請求項1~
4のいずれか1項に記載の方法を前記コンピュータに実行させるために用いられることを特徴とする非一時的コンピュータ可読記憶媒体。
【請求項11】
プロセッサにより実行されると、請求項1に記載の方法が実現されることを特徴とするコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
<関連出願の相互参照>
本出願は、2020年4月29日に提出された、出願番号が202010356239.8で、発明の名称が「車両を検出するための方法および装置」である中国特許出願に基づく優先権を主張し、当該特許出願の全文を引用することにより本明細書の一部をなすものとする。
【0002】
本出願の実施形態は、コンピュータ技術分野に関し、特にコンピュータビジョン技術に関する。
【背景技術】
【0003】
近年、交通車両の数の高速増加に伴い、交通管理は大きな挑戦に直面している。車両の目標検出は交通状況のビデオ監視を構築する重要な技術であり、中国国内外の研究者の注目を集めている。通常、実際の道路状況を監視する時、車両が長すぎる場合に検出精度が低いことがある。例えば、都市道路における牽引自動車は、通常に車両を検出するために用いられる検出モデルが、トレーニングの時に使用するトレーニングセットにおける牽引自動車の画像の数が限られているため、検出モデルを用いて検出する際に、検出枠がトラクターのみ、またはトレーラーのみを囲んでしまう場合がある。実際には同一の車両が検出モデルによって2台以上の車両と判定されてしまう。
【発明の概要】
【発明が解決しようとする課題】
【0004】
車両を検出するための方法および装置を提供する。
【課題を解決するための手段】
【0005】
第1の態様によれば、検出対象画像を取得するステップと、上記検出対象画像を予め作成された車両検出モデルに入力して車両検出結果を得るステップであって、上記車両検出結果は検出枠の種別情報、座標情報、座標信頼度および座標誤差情報を含み、上記車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられるステップと、検出枠の座標信頼度に基づいて、上記車両検出結果から検出枠を処理対象検出枠として選択するステップと、上記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するステップとを含む車両を検出するための方法を提供する。
【0006】
第2の態様によれば、検出対象画像を取得するように構成される取得ユニットと、上記検出対象画像を予め作成された車両検出モデルに入力して車両検出結果を得るように構成される入力ユニットであって、上記車両検出結果は検出枠の種別情報、座標情報、座標信頼度および座標誤差情報を含み、上記車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられる、入力ユニットと、検出枠の座標信頼度に基づいて、上記車両検出結果から検出枠を処理対象検出枠として選択するように構成される選択ユニットと、上記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するように構成される生成ユニットとを備える車両を検出するための装置を提供する。
【0007】
第3の態様によれば、少なくとも1つのプロセッサと、上記少なくとも1つのプロセッサと通信接続されたメモリとを備える電子機器であって、上記メモリには、上記少なくとも1つのプロセッサによって実行可能な指令が格納され、上記指令が上記少なくとも1つのプロセッサによって実行されると、上記少なくとも1つのプロセッサに第1の態様のいずれか1項に記載の方法を実行させる、電子機器を提供する。
【0008】
第4の態様によれば、コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、コンピュータ指令はコンピュータに第1の態様のいずれか1項に記載の方法を実行させるために用いられる非一時的コンピュータ可読記憶媒体を提供する。
第5の態様によれば、プロセッサにより実行されると、第1の態様に記載の方法が実現されるコンピュータプログラムを提供する。
【0009】
本出願の技術的解決手段によれば、検出枠の座標信頼度および座標誤差情報に基づいて、車両検出モデルが出力した検出枠の座標情報をさらに処理し、処理済み検出枠の座標情報を生成することにより、検出枠の座標情報の精度を向上させ、車両検出モデルの検出精度低下による誤検出を低減することができる。
【0010】
なお、発明の概要に記載された内容は、本出願の実施形態のかなめとなる特徴または重要な特徴を限定することを意図するものではなく、本出願の範囲を限定するものでもない。本出願の他の特徴は、以下の説明によって容易に理解される。
【0011】
図面は本出願をよりよく理解するために用いられ、本出願に対する限定を構成しない。
【図面の簡単な説明】
【0012】
【
図1】本出願に係る車両を検出するための方法の一実施形態のフローチャートである。
【
図2】本出願に係る車両を検出するための方法の一応用シーンの概略図である。
【
図3】本出願に係る車両を検出するための方法のもう一つの実施形態のフローチャートである。
【
図4】本出願に係る車両を検出するための装置の一実施形態の構造概略図である。
【
図5】本出願の実施形態に係る車両を検出するための方法を実現するための電子機器のブロック図である。
【発明を実施するための形態】
【0013】
以下は図面を参照して本出願の例示的な実施形態を説明し、ここでは理解に役立つため、本出願の実施形態の様々な詳細が記載されるが、これらは単なる例示的なものに過ぎない。従って、本出願の範囲および要旨を逸脱しない限り、当業者が本明細書の実施形態に対して様々な変更や修正を行うことができることは自明である。なお、以下の説明では、明確化および簡略化のため、公知の機能および構成については説明を省略する。
【0014】
図1に示すように、
図1は、本出願に係る車両を検出するための方法の一実施形態のフローチャート100を示す。当該車両を検出するための方法は、次のステップを含む。
【0015】
S101では、検出対象の画像を取得する。
【0016】
本実施形態では、車両を検出するための方法の実行主体は、有線接続方式または無線接続方式により画像採集装置(例えば、カメラなど)から検出対象画像を取得してもよい。ここで、上記検出対象画像は、車両画像を含んでもよい。例示として、上記検出対象画像は、車両を含む道路画像であってもよい。例えば、検出対象画像は、道路側の監視カメラによって撮影された画像であってもよい。
【0017】
ここで、上記実行主体は、画像の検出機能を有する様々な電子機器であってもよく、スマートフォン、タブレットコンピュータ、ラップトップコンピュータおよびデスクトップコンピュータなどを含むが、これらに限定されない。
【0018】
S102では、検出対象画像を予め作成された車両検出モデルに入力して、車両の検出結果を得る。
【0019】
本実施形態では、上記実行主体の内部に車両検出モデルを予め作成しておいてもよい。この車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられてもよい。例示として、上記車両検出モデルは、特徴抽出ネットワークと、対応関係テーブルとを含んでもよい。ここで、特徴抽出ネットワークは、車両検出モデルに入力された画像を特徴抽出して特徴ベクトルを得るために用いられてもよい。対応関係テーブルは、技術者が大量の特徴ベクトルおよび車両検出結果の統計に基づいて予め定めた、複数の特徴ベクトルと車両検出結果との対応関係を記憶したテーブルであってもよい。このように、車両検出モデルは、まず、特徴抽出ネットワークを用いて、受信した画像の特徴ベクトルを抽出し、抽出された特徴ベクトルを目標特徴ベクトルとしてもよい。その後、目標の特徴ベクトルと対応関係テーブル内の複数の特徴ベクトルとを順次比較し、対応関係テーブル内の特徴ベクトルと目標特徴ベクトルとが同一であるかまたは類似している場合、当該対応関係テーブル内の当該特徴ベクトルに対応する車両検出結果を、受信された画像の車両検出結果とする。
【0020】
これにより、実行主体は、検出対象画像を車両検出モデルに入力して車両検出結果を得ることができる。ここで、車両検出結果は、検出枠の種別情報、座標情報、座標信頼度および座標誤差情報を含んでもよい。ここで、検出枠の種別情報は、種別と種別信頼度、すなわち、検出枠内の対象物が属する種別とその種別に属する確率とを含んでもよい。例えば、種別としては、小型自動車、バス、トラック、三輪車、二輪車等が挙げられる。検出枠の座標情報は、検出枠の位置を記述するために用いられてもよい。例えば、検出枠の座標情報は、検出枠の左上隅の座標を含んでもよい。通常、左上隅の座標、高さおよび幅により、1つの矩形検出枠を、唯一、確定することができる。座標信頼度は、座標の精度を記述するために用いられてもよい。例示として、座標信頼度は0~1の間の値であってもよく、数値が大きいほど座標の精度が高いことを表す。座標情報を(x,y)とすると、xとyのそれぞれについて座標信頼度を出力してもよい。座標誤差情報は、座標予測の変動度合いを記述するために用いられてもよい。例示として、座標誤差はオフセット分散(offset variance)であってもよい。オフセット分散が大きいほど、予測座標の変動が大きく、オフセット分散が小さいほど、予測座標の変動が小さいことを表す。一般に、変動が小さいほど、予測された座標情報の精度が高い。
【0021】
通常、同一車両に対する車両検出結果には複数の検出枠が含まれてもよい。一般的に、目標検出を行う場合、同一目標に対して大量の検出枠を検出することができ、各検出枠には信頼度スコア(confidence score)を持たせてもよい。このとき、信頼度スコアが予め設定されたスコア閾値よりも大きい検出枠を、目標に対応する検出枠として選択してもよい。ここで、スコア閾値は、実際のニーズに応じて設定されてもよい。なお、目標検出における目標とは、検出しようとするオブジェクトを指してもよい。本実施形態では、車両は検出しようとするオブジェクトである。
【0022】
本実施形態のいくつかのオプション的な実施形態において、上記車両検出モデルは、特徴抽出ネットワークを含んでもよく、上記特徴抽出ネットワークは、ダイレイト畳み込み層(Dilated Convolutional Layer)および/または非対称畳み込み層を含んでもよい。
【0023】
本実施形態では、上記車両検出モデルは、特徴抽出ネットワークを含んでもよく、当該特徴抽出ネットワークは、受信した画像に対して特徴抽出を行い、特徴ベクトルを生成するために用いられてもよい。ここで、特徴抽出ネットワークは、resnet(残差ネットワーク)、resnext等の各種のニューラルネットワークであってもよい。実践では、実際のニーズに応じて異なる大きさの特徴抽出ネットワークを選択してもよい。例えば、処理のリアルタイム性に対する要求が比較的高く、精度に対する要求がそれほど高くない場合には、resnet18、resnet34などのような軽量な構造を選択してもよい。処理の精度に対する要求が高く、リアルタイム性に対する要求がそれほど高くない場合には、例えば、resent101、resneXt152などのような重量な構造を選択してもよい。また、例えばresnet50、resneXt50のような、軽量と重量との間にあるミッドサイズの構造もあり、これらを選択してもよい。
【0024】
特徴抽出ネットワークには、実際のニーズに応じてダイレイト畳み込み(dilated convolution)構造を付加してダイレイト畳み込み層を形成してもよい。ダイレイト畳み込み(または膨張畳み込み)は、標準的な畳み込みにダイレイトを注入することにより、受容野(receptive field)を増やし、それによって出力に幅広い情報が含まれるようになり、特徴抽出ネットワークで超長車両の特性情報をより多く抽出できるようになる。
【0025】
特徴抽出ネットワークでは、実際のニーズに応じて非対称畳み込みカーネルを持つ畳み込み構造を付加し、非対称畳み込み層を形成してもよい。非対称畳み込みカーネルは、超長目標の受容野を増やすとともに、背景情報のノイズを減らすのに役立つ。これにより、特徴抽出ネットワークは、超長車両の特徴情報をより多く抽出することができる。
【0026】
ここで、特徴抽出ネットワークは、特徴ピラミッドネットワーク(Feature Pyramid Networks,FPN)構造を採用してもよい。特徴ピラミッド構造を採用することで、異なる階層間の情報の融合を実現することができ、同時に、浅層意味情報と深層意味情報を組み合わせることで、検出結果出力ネットワークが取得した特徴がより豊富になり、検出結果出力ネットワークが出力する結果の精度を向上できる。
【0027】
本実施形態のいくつかのオプション的な実施形態において、上記車両検出モデルは、特徴抽出ネットワークに加えて、種別情報出力ネットワーク、座標情報出力ネットワーク、座標信頼度出力ネットワークおよび座標誤差情報出力ネットワークを含んでもよい。例示として、種別情報出力ネットワークは、特徴抽出ネットワークにより抽出された特徴情報に基づいて、種別情報を出力するようにしてもよい。座標情報出力ネットワークは、特徴抽出ネットワークにより抽出された特徴情報に基づいて、座標情報を出力するようにしてもよい。座標信頼度出力ネットワークは、特徴抽出ネットワークにより抽出された特徴情報に基づいて、座標信頼度を出力するようにしてもよい。座標誤差情報出力ネットワークは、特徴抽出ネットワークにより抽出された特徴情報に基づいて座標誤差情報を出力するようにしてもよい。
【0028】
本実施形態では上記車両検出モデルは以下の方式によりトレーニングされ得る。
【0029】
先ず、サンプルセットを取得する。
【0030】
本実施形態では、車両検出モデルをトレーニングするためのトレーニング用実行主体と、車両を検出するための方法の実行主体とは、同じであっても異なっていてもよい。トレーニング用実行主体は、サンプルセットを取得してもよい。ここで、サンプルセットにおけるサンプルは、サンプル画像と、サンプル画像に対応するサンプル種別情報およびサンプル座標情報とを含んでもよい。ここで、サンプル画像に対応するサンプル種別情報およびサンプル座標情報は、サンプル画像に含まれる車両の種別および位置をそれぞれ記述するための情報である。例えば、サンプル種別情報は、サンプル画像における車両の種別および種別信頼度を含んでもよく、サンプル座標情報は、サンプル画像における車両に対応する検出枠の左上隅の座標と、検出枠の高さおよび幅とを含んでもよい。
【0031】
次に、サンプルのサンプル画像を初期モデルに入力し、初期モデルの種別情報出力ネットワークと座標情報出力ネットワークは、予測種別情報と予測座標情報をそれぞれ出力する。
【0032】
本実施形態では、トレーニング用実行主体は、サンプルセットにおけるサンプルのサンプル画像を初期モデルに入力することができ、初期モデルの種別情報出力ネットワークと座標情報出力ネットワークは、予測種別情報と予測座標情報をそれぞれ出力することができる。ここで、初期モデルは、トレーニングされていないモデルまたは一部トレーニングされたモデルであってもよい。初期モデルは、特徴抽出ネットワーク、種別情報出力ネットワーク、座標情報出力ネットワーク、座標信頼度出力ネットワークおよび座標誤差情報出力ネットワークを含んでもよい。
【0033】
そして、予測座標情報と、入力されたサンプル画像に対応するサンプル座標情報とに基づいて、サンプル座標信頼度およびサンプル座標誤差情報を確定する。
【0034】
本実施形態では、トレーニング用実行主体は、初期モデルが入力されたサンプル画像に対して出力した予測座標情報と、入力されたサンプル画像に対応するサンプル座標情報とに基づいて、サンプル座標信頼度とサンプル座標誤差情報とを確定することができる。例えば、トレーニング用実行主体内には、サンプル座標信頼度およびサンプル座標誤差情報を確定するための確定規則を予め記憶しておいてもよく、この確定規則は、技術者が必要に応じて確定したものであってもよい。このように、トレーニング用実行主体は、確定規則に基づいて、サンプル座標信頼度とサンプル座標誤差情報とを確定することができる。例えば、サンプル座標信頼度について、あるサンプル画像に対応する予測座標情報を(x1,y1)、サンプル座標情報を(x2,y2)とすると、当該サンプル画像に対応するX軸のサンプル座標信頼度は、次の計算規則に従って確定されることができる。
【0035】
【0036】
ここで、Cはサンプル座標信頼度を表し、Xはx1とx2の差を表す。同様に、当該サンプル画像に対応するY軸のサンプル座標信頼度も上記式により計算されることができる。例えば、サンプル座標誤差情報を求める場合、オフセット分散として座標誤差情報を例として取り上げ、サンプル座標情報が平均値であると仮定すると、予測座標情報の確率分布は、ガウス分布に従う予測確率密度関数である。実行主体は、目標確率分布を予め記憶しておいてもよく、当該目標確率分布は、分散が0であるガウス分布に従うものであってもよく、例えば、目標確率分布はディラックのデルタ関数であってもよい。実行主体は、予測確率密度関数と目標確率分布の相対エントロピー(カルバック・ライブラー・ダイバージェンス,Kullback-Leibler Divergenceとも呼ぶ)の最小値を求めることにより、オフセット分散を求め、求めたオフセット分散を座標誤差情報としてもよい。
【0037】
最後に、サンプル画像を入力とし、入力されたサンプル画像に対応するサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報を所望出力として、初期モデルをトレーニングして車両検出モデルを得る。
【0038】
本実施形態では、トレーニング用実行主体は、サンプル画像を入力とし、入力されたサンプル画像に対応するサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報を所望出力として、初期モデルをトレーニングして車両検出モデルを得ることができる。例えば、まず、初期モデルから出力された予測種別情報、予測座標情報、予測座標信頼度および予測座標誤差情報と、当該サンプルのサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報との差分を、予め設定された損失関数を用いて計算してもよい。そして、算出した差分に基づいて、初期モデルのモデルパラメータを調整することで、車両検出モデルを得る。例えば、BP(Back Propagation,誤差逆伝播)アルゴリズムまたはSGD(Stochastic Gradient Descent,確率的勾配降下)アルゴリズムを使用して、初期モデルのモデルパラメータを調整することができる。本実施形態により、車両検出モデルへのトレーニングが実現可能であり、得られた車両検出モデルの出力結果の精度が向上される。
【0039】
S103では、検出枠の座標信頼度に基づいて、車両検出結果から検出枠を処理対象検出枠として選択する。
【0040】
本実施形態では、S102で得られた車両検出結果における複数の検出枠について、実行主体は、検出枠の座標信頼度に基づいて、複数の検出枠の中から検出枠を処理対象検出枠として選択することができる。例えば、座標信頼度が予め設定された閾値よりも大きい検出枠を処理対象検出枠として選択してもよい。ここで、閾値は、実際のニーズに応じて設定されてもよい。ここで、選択された複数の処理対象検出枠の種別は同一であってもよい。
【0041】
S104では、処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成する。
【0042】
本実施形態では、実行主体は、処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成することができる。例示として、各処理対象検出枠は、検出枠の種別情報、座標情報、座標信頼度および座標誤差情報を含んでもよい。実行主体は、少なくとも1つの処理対象検出枠の座標情報および座標誤差情報に基づいて新たな座標情報を計算して得るための計算規則を予め記憶しておいてもよく、これにより、実行主体は、当該計算規則に基づいて処理済み検出枠の座標情報を取得することができる。ここで、上記計算規則は、技術者が実際のニーズに応じて設定したものであってもよい。
【0043】
本実施形態のいくつかのオプション的な実施形態において、上記車両を検出するための方法は、処理対象検出枠の種別情報と処理済み検出枠の座標情報とに基づいて、修正済み検出結果を生成するステップ(
図1には示されていない)をさらに含んでもよい。
【0044】
本実施形態では、実行主体は、処理対象検出枠の種別情報と処理済み検出枠の座標情報とに基づいて、修正済み検出結果を生成することができる。その後、実行主体は、修正済み検出結果を出力することもできる。例えば、実行主体は、処理対象検出枠の種別を、処理済み検出枠の種別としてもよい。ここで、複数の処理対象検出枠の種別が同一であってもよい。実行主体は、複数の処理対象検出枠のうち、種別信頼度が最も高い種別信頼度を、処理済み検出枠の種別信頼度としてもよい。そして、実行主体は、処理済み検出枠の種別、種別信頼度および座標情報を、修正済み検出結果としてもよい。本実施形態によれば、修正済み検出結果を得ることができ、車両検出モデルが出力した車両検出結果と比較して、修正済み検出結果の方は精度が高い。
【0045】
次に、本実施形態に係る車両を検出するための方法の応用シーンの1つの概略図である
図2を参照する。
図2の応用シーンにおいて、端末装置201は、まず、検出対象画像を取得する。その後、端末装置201は、検出対象画像を予め作成された車両検出モデルに入力し、検出枠の種別情報、座標情報、座標信頼度および座標誤差情報を含み得る車両検出結果を得る。そして、検出枠の座標信頼度に基づいて、車両検出結果の中から検出枠を処理対象検出枠として選択する。最後に、処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成する。
【0046】
本出願の上記実施形態に係る方法によれば、検出枠の座標信頼度および座標誤差情報に基づいて、車両検出モデルが出力した検出枠の座標情報をさらに処理し、処理済み検出枠の座標情報を生成することができるので、検出枠の座標情報の精度が向上され、車両検出モデルの検出精度低下による誤検出を低減することができる。
【0047】
さらに、車両を検出するための方法のもう一つの実施形態のフロー300を示す
図3を参照する。この車両を検出するための方法のフロー300は、次のステップを含む。
【0048】
S301では、検出対象画像を取得する。
【0049】
本実施形態では、ステップS301は
図1に示す実施形態のステップS101と同様であり、ここではその説明を省略する。
【0050】
S302では、検出対象画像を予め作成された車両検出モデルに入力して、車両検出結果を得る。
【0051】
本実施形態では、ステップS302は
図1に示す実施形態のステップS102と同様であり、ここではその説明を省略する。
【0052】
S303では、検出枠の座標信頼度に基づいて、車両検出結果の中から検出枠を処理対象検出枠として選択する。
【0053】
本実施形態では、ステップS303は
図1に示す実施形態のステップS103と同様であり、ここではその説明を省略する。
【0054】
S304では、種別情報に基づいて、処理対象検出枠の中から検出枠を第1の検出枠として選択する。
【0055】
本実施形態では、実行主体は、種別情報に基づいて、処理対象検出枠の中から1つの検出枠を第1の検出枠として選択することができる。例えば、実行主体は、処理対象検出枠のうち、種別信頼度が最も高い検出枠を第1の検出枠として選択してもよい。
【0056】
S305では、第1の検出枠とのIoU(Intersection over Union)に基づいて、処理対象検出枠の中から検出枠を第2の検出枠として選択する。
【0057】
本実施形態では、実行主体は、まず、処理対象検出枠のうち、第1の検出枠以外の他の各検出枠と第1の検出枠とのIoU(Intersection over Union)を計算することができる。ここで、IoUはIoU関数に基づいて計算されてもよい。その後、実行主体は、予め設定された閾値(例えば、0.5)よりも大きいIoUに対応する処理対象検出枠を第2の検出枠として選択してもよい。
【0058】
S306では、第1の検出枠と第2の検出枠とのIoU、並びに第2の検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成する。
【0059】
本実施形態では、実行主体は、第1の検出枠と第2の検出枠とのIoUと、第2の検出枠の座標情報および座標誤差情報とに基づいて、処理済み検出枠の座標情報を生成することができる。例えば、実行主体の内部に、処理済み検出枠の座標情報を生成するための計算式を予め定めておいてもよい。このように、実行主体は、この式により、処理済み検出枠の座標情報を生成することができる。一例として、N個の第2の検出枠を含む例として、i番目(1≦i≦N)の検出枠のX軸座標をxiとし、座標誤差情報をσ2
x,iとし、i番目の検出枠と第1の検出枠とのIoUをIOU(bi,b)とすると、処理済み検出枠の座標情報のX軸座標は、以下の式により求めることができる。
【0060】
【0061】
ただし、
【0062】
【0063】
ここで、σtは手動で設定したパラメータである。同様に、処理済み検出枠の座標情報のY軸座標も上記式により計算されることができる。
【0064】
図3から分かるように、
図1の対応する実施形態と比較して、本実施形態における車両を検出するための方法のフロー300では、種別情報とIoUに基づいて第1の検出枠と第2の検出枠を選択し、第1の検出枠と第2の検出枠に基づいて処理済み検出枠の座標情報を生成するステップを強調した。これによれば、本実施形態に係る方案は、IoUに基づいて、第1の検出枠と第2の検出枠とを結合することができ、それにより、生成された処理済み検出枠の座標情報の精度を向上できる。
【0065】
さらに
図4を参照すると、上記の各図に示された方法の実施形態として、本出願は、車両を検出するための装置の一実施形態を提供し、当該装置の実施形態は、
図1に示された方法の実施形態に対応しており、当該装置は、具体的に様々な電子機器に適用することができる。
【0066】
図4に示すように、本実施形態に係る車両を検出するための装置400は、取得ユニット401と、入力ユニット402と、選択ユニット403と、生成ユニット404とを備える。取得ユニット401は、検出対象画像を取得するように構成される。入力ユニット402は、上記検出対象画像を予め作成された車両検出モデルに入力して車両検出結果を得るように構成される。上記車両検出結果は検出枠の種別情報、座標情報、座標信頼度および座標誤差情報を含み、上記車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられる。選択ユニット403は、検出枠の座標信頼度に基づいて、上記車両検出結果から検出枠を処理対象検出枠として選択するように構成される。生成ユニット404は、上記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するように構成される。
【0067】
本実施形態では、車両を検出するための装置400の取得ユニット401、入力ユニット402、選択ユニット403および生成ユニット404の具体的な処理並びに奏される技術的効果は、それぞれ
図1の対応する実施形態におけるS101、S102、S103およびS104の関連する説明を参照することができ、ここではその説明を省略する。
【0068】
本実施形態のいくつかのオプション的な実施形態において、上記生成ユニット404は、種別情報に基づいて、上記処理対象検出枠の中から検出枠を第1の検出枠として選択し、上記第1の検出枠とのIoUに基づいて上記処理対象検出枠の中から検出枠を第2の検出枠として選択し、上記第1の検出枠と上記第2の検出枠とのIoU、並びに第2の検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するようにさらに構成される。
【0069】
本実施形態のいくつかのオプション的な実施形態において、上記車両検出モデルは、特徴抽出ネットワークを含み、上記特徴抽出ネットワークは、ダイレイト畳み込み層および/または非対称畳み込み層を含む。
【0070】
本実施形態のいくつかのオプション的な実施形態において、上記車両検出モデルは、種別情報出力ネットワークと、座標情報出力ネットワークと、座標信頼度出力ネットワークと、座標誤差情報出力ネットワークとを含み、
上記車両検出モデルは、
サンプル画像と、サンプル画像に対応するサンプル種別情報およびサンプル座標情報とを含むサンプルからなるサンプルセットを取得するステップと、
サンプルのサンプル画像を初期モデルに入力し、初期モデルの種別情報出力ネットワークおよび座標情報出力ネットワークから予測種別情報および予測座標情報をそれぞれ出力するステップと、
上記予測座標情報と入力されたサンプル画像に対応するサンプル座標情報とに基づいて、サンプル座標信頼度およびサンプル座標誤差情報を確定するステップと、
サンプル画像を入力とし、入力されたサンプル画像に対応するサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報を所望出力として、初期モデルをトレーニングして車両検出モデルを得るステップとによってトレーニングされる。
【0071】
本実施形態のいくつかのオプション的な実施形態において、上記装置400は、上記処理対象検出枠の種別情報と上記処理済み検出枠の座標情報とに基づいて、修正済み検出結果を生成するように構成される結果生成ユニット(図示せず)をさらに備えてもよい。
【0072】
本出願の実施形態によれば、本出願はさらに電子機器および読み取り可能な記憶媒体を提供する。
【0073】
図5に示すように、本出願の実施形態に係る車両を検出するための方法を実現するための電子機器のブロック図である。電子機器は、ラップトップコンピュータ、デスクトップコンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレード型サーバ、メインフレームコンピュータおよびその他の適切なコンピュータ等の様々な形態のデジタルコンピュータを表す。また、電子機器は、個人デジタル処理、携帯電話、スマートフォン、ウェアラブル機器およびその他の類似する計算装置等の様々な形態のモバイルデバイスを表すことができる。なお、ここで示したコンポーネント、それらの接続関係、およびそれらの機能はあくまでも一例であり、ここで記述および/または要件した本出願の実施形態を限定することを意図するものではない。
【0074】
図5に示すように、当該電子機器は、1つまたは複数のプロセッサ501、メモリ502、および各コンポーネントを接続するためのインターフェース(高速インターフェースおよび低速インターフェースを含む)を含む。各コンポーネントは、互いに異なるバスで接続されており、共通のマザーボード上に実装されていてもよいし、必要に応じて他の方式で実装されていてもよい。プロセッサは、電子機器内で実行される指令を処理することができ、前記指令は、インターフェースに結合された表示装置等の外部入出力装置にグラフィカルユーザインターフェース(GUI,Graphical User Interface)のグラフィック情報を表示するために、メモリ内またはメモリ上に格納される指令を含む。他の実施形態では、必要に応じて、複数のプロセッサおよび/または複数のバスを、複数のメモリとともに使用することができる。また、複数の電子機器が接続されていてもよく、各機器は(例えば、サーバアレイ、ブレードサーバ群またはマルチプロセッサシステムなど)、一部の必要な動作を提供する。
図5では、1つのプロセッサ501を例としている。
【0075】
メモリ502は、本出願が提供する非一時的コンピュータ可読記憶媒体である。ここで、前記メモリは、少なくとも1つのプロセッサが実行可能な指令を格納しており、それにより前記少なくとも1つのプロセッサに本出願が提供する車両を検出するための方法を実行させる。本出願の非一時的コンピュータ可読記憶媒体はコンピュータ指令を格納し、当該コンピュータ指令はコンピュータに本出願が提供する車両を検出するための方法を実行させるために用いられる。
【0076】
メモリ502は、非一時的コンピュータ可読記憶媒体として、非一時的ソフトウェアプログラム、非一時的コンピュータ実行可能なプログラムおよびモジュールを格納することに用いることができ、例えば本出願の実施形態における車両を検出するための方法に対応するプログラム指令/モジュール(例えば、
図4に示す取得ユニット401、入力ユニット402、選択ユニット403および生成ユニット404)が挙げられる。プロセッサ501は、メモリ502に格納された非一時的ソフトウェアプログラム、指令およびモジュールを実行することにより、サーバの各種機能アプリケーションおよびデータ処理を実行し、すなわち上記方法の実施形態における車両を検出するための方法を実現する。
【0077】
メモリ502はオペレーティングシステム、少なくとも1つの機能に必要なアプリケーションを記憶できるプログラム記憶領域と、車両を検出するための電子機器の使用に応じて作成されるデータ等を記憶できるデータ記憶領域とを含んでもよい。また、メモリ502は高速ランダムアクセスメモリを含むことができ、また非一時的メモリ(例えば、少なくとも1つの磁気ディスク記憶装置、フラッシュメモリデバイスまたはその他の非一時的ソリッドステート記憶装置)を含んでもよい。いくつかの実施形態において、メモリ502は、オプションとしてプロセッサ501と遠隔に設置されたメモリを含み、これらのリモートメモリはネットワークを介して車両を検出するための電子機器に接続されてもよい。上記ネットワークとしては、例えば、インターネット、企業イントラネット、ローカルエリアネットワーク、移動体通信網およびこれらの組み合わせなどが挙げられるが、それらに限定されない。
【0078】
車両を検出するための方法を実行する電子機器はさらに、入力装置503および出力装置504を含んでもよい。プロセッサ501、メモリ502、入力装置503および出力装置504は、バスまたはその他の方式で接続されてもよく、
図5ではバスで接続されている例を示している。
【0079】
例えばタッチパネル、キーパッド、マウス、トラックパッド、タッチパッド、ポインティングデバイス、1つまたは複数のマウスボタン、トラックボール、ジョイスティック等の入力装置503は、入力された数字または文字情報を受信でき、車両を検出するための電子機器のユーザ設定および機能制御に関するキー信号の入力を生成することができる。出力装置504は表示装置、補助照明装置(例えば、LED)および触覚フィードバック装置(例えば、振動モータ)等を含んでもよい。当該表示装置は、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイおよびプラズマディスプレイを含んでもよいが、これらに限定されない。いくつかの実施形態において、表示装置はタッチパネルであってもよい。
【0080】
ここで説明するシステムおよび技術の様々な実施形態はデジタル電子回路システム、集積回路システム、専用集積回路(Application Specific Integrated Circuit,ASIC)、コンピュータハードウェア、ファームウェア、ソフトウェア、および/またはそれらの組み合わせにおいて実装され得る。これらの各実施形態は、1つまたは複数のコンピュータプログラムに実装され、当該1つまたは複数のコンピュータプログラムは少なくとも1つのプログラマブルプロセッサを含むプログラマブルシステムにおいて実行および/または解釈することができ、当該プログラマブルプロセッサは専用または汎用プログラマブルプロセッサであってもよく、記憶システム、少なくとも1つの入力装置および少なくとも1つの出力装置からデータおよび指令を受信することができ、且つデータおよび指令を当該記憶システム、当該少なくとも1つの入力装置および当該少なくとも1つの出力装置に伝送することを含み得る。
【0081】
これらのコンピュータプログラムは(プログラム、ソフトウェア、ソフトウェアアプリケーションまたはコードとも呼ばれ、プログラマブルプロセッサの機械指令を含み)且つ高度プロセスおよび/またはオブジェクト指向のプログラミング言語、および/またはアセンブリ言語/機械語を利用して実現することができる。ここで、「機械可読媒体」および「コンピュータ可読媒体」という用語は、機械指令および/またはデータをプログラマブルプロセッサに供給するための任意のコンピュータプログラム製品、機器、および/または装置(たとえば、磁気ディスク、光ディスク、メモリ、プログラマブルロジックデバイス(PLD))を意味し、機械可読信号である機械指令を受信する機械可読媒体を含む。「機械可読信号」という用語は、機械指令および/またはデータをプログラマブルプロセッサに供給するためのあらゆる信号を意味する。
【0082】
ユーザとのインタラクションを提供するために、ここで説明するシステムと技術は、ユーザに情報を表示するための表示装置(例えば、陰極線管(Cathode-Ray Tube,CRT)またはLCD(液晶ディスプレイ)モニタ)と、キーボードおよびポインティングデバイス(例えば、マウスまたはトラックボール)とを備えるコンピュータ上で実装することができ、ユーザが該キーボードおよび該ポインティングデバイスを介してコンピュータに入力を提供できる。他の種類の装置は、さらにユーザとのインタラクションを提供することに用いることができる。例えば、ユーザに提供されるフィードバックは(例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックであるいかなる形態のセンシングフィードバックであってもよく)、且つ音入力、音声入力または、触覚入力を含むいかなる形態でユーザからの入力を受信してもよい。
【0083】
ここで説明したシステムおよび技術は、バックエンドコンポーネントを含むコンピューティングシステム(例えば、データサーバ)に実施されてもよく、またはミドルウェアコンポーネントを含むコンピューティングシステム(例えば、アプリケーションサーバ)に実施されてもよく、またはフロントエンドコンポーネントを含むコンピューティングシステム(例えば、グラフィカルユーザインターフェースまたはウェブブラウザを有するユーザコンピュータ)に実施されてもよく、ユーザは該グラフィカルユーザインターフェースまたはウェブブラウザを介してここで説明したシステムおよび技術の実施形態とインタラクションしてもよく、またはこのようなバックエンドコンポーネント、ミドルウェアコンポーネントまたはフロントエンドコンポーネントのいずれかの組み合わせを含むコンピューティングシステムに実施されてもよい。また、システムの各コンポーネントの間は、通信ネットワーク等、任意の形態または媒体のデジタルデータ通信により接続されていてもよい。通信ネットワークの例示としては、ローカルエリアネットワーク(LAN)、ワイドエリアネットワーク(WAN)およびインターネットを含む。
【0084】
コンピュータシステムは、クライアントとサーバとを含んでもよい。クライアントとサーバは、通常、互いに離れており、通信ネットワークを介してやりとりを行う。クライアントとサーバとの関係は、互いにクライアント-サーバの関係を有するコンピュータプログラムをそれぞれのコンピュータ上で動作することによって生成される。
【0085】
上記具体的な実施形態は、本出願の保護範囲を限定するものではない。設計要件および他の要因に従って、様々な修正、組み合わせ、再組み合わせ、および置換を行うことができることを当業者は理解すべきである。本出願の趣旨および原理を逸脱せずに行われたあらゆる修正、均等置換および改善などは、いずれも本出願の保護範囲内に含まれるべきである。
なお、出願当初の特許請求の範囲の記載は以下の通りである。
請求項1:
検出対象画像を取得するステップと、
前記検出対象画像を予め作成された車両検出モデルに入力して車両検出結果を得るステップであって、前記車両検出結果は、検出枠の種別情報と、座標情報と、座標信頼度と、座標誤差情報とを含み、前記車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられるステップと、
検出枠の座標信頼度に基づいて、前記車両検出結果の中から検出枠を処理対象検出枠として選択するステップと、
前記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するステップと
を含むことを特徴とする車両を検出するための方法。
請求項2:
前記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するステップは、
種別情報に基づいて、前記処理対象検出枠の中から検出枠を第1の検出枠として選択するステップと
前記第1の検出枠とのIoU(Intersection over Union)に基づいて、前記処理対象検出枠の中から検出枠を第2の検出枠として選択するステップと、
前記第1の検出枠と前記第2の検出枠とのIoU、並びに第2の検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するステップと
を含むことを特徴とする請求項1に記載の方法。
請求項3:
前記車両検出モデルは、特徴抽出ネットワークを含み、
前記特徴抽出ネットワークは、ダイレイト畳み込み層および/または非対称畳み込み層を含むことを特徴とする請求項1または2に記載の方法。
請求項4:
前記車両検出モデルは、種別情報出力ネットワークと、座標情報出力ネットワークと、座標信頼度出力ネットワークと、座標誤差情報出力ネットワークとを含み、
前記車両検出モデルは、
サンプル画像と、サンプル画像に対応するサンプル種別情報およびサンプル座標情報とを含むサンプルからなるサンプルセットを取得するステップと、
サンプルのサンプル画像を初期モデルに入力し、初期モデルの種別情報出力ネットワークおよび座標情報出力ネットワークから予測種別情報および予測座標情報をそれぞれ出力するステップと、
前記予測座標情報と、入力されたサンプル画像に対応するサンプル座標情報とに基づいて、サンプル座標信頼度およびサンプル座標誤差情報を確定するステップと、
サンプル画像を入力とし、入力されたサンプル画像に対応するサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報を所望出力として、初期モデルをトレーニングして車両検出モデルを得るステップと
によってトレーニングされることを特徴とする請求項1~3のいずれか1項に記載の方法。
請求項5:
前記処理対象検出枠の種別情報と前記処理済み検出枠の座標情報とに基づいて、修正済み検出結果を生成するステップをさらに含むことを特徴とする請求項1~4のいずれか1項に記載の方法。
請求項6:
検出対象画像を取得するように構成される取得ユニットと、
前記検出対象画像を予め作成された車両検出モデルに入力して車両検出結果を得るように構成される入力ユニットであって、前記車両検出結果は、検出枠の種別情報と、座標情報と、座標信頼度と、座標誤差情報とを含み、前記車両検出モデルは、画像と車両検出結果との対応関係を表すために用いられる、入力ユニットと、
検出枠の座標信頼度に基づいて、前記車両検出結果の中から検出枠を処理対象検出枠として選択するように構成される選択ユニットと、
前記処理対象検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するように構成される生成ユニットと
を備えることを特徴とする車両を検出するための装置。
請求項7:
前記生成ユニットは、さらに、
種別情報に基づいて、前記処理対象検出枠の中から検出枠を第1の検出枠として選択し、
前記第1の検出枠とのIoU(Intersection over Union)に基づいて前記処理対象検出枠の中から検出枠を第2の検出枠として選択し、
前記第1の検出枠と前記第2の検出枠とのIoU、並びに第2の検出枠の座標情報および座標誤差情報に基づいて、処理済み検出枠の座標情報を生成するように構成されることを特徴とする請求項6に記載の装置。
請求項8:
前記車両検出モデルは、特徴抽出ネットワークを含み、
前記特徴抽出ネットワークは、ダイレイト畳み込み層および/または非対称畳み込み層を含むことを特徴とする請求項6または7に記載の装置。
請求項9:
前記車両検出モデルは、種別情報出力ネットワークと、座標情報出力ネットワークと、座標信頼度出力ネットワークと、座標誤差情報出力ネットワークとを含み、
前記車両検出モデルは、
サンプル画像と、サンプル画像に対応するサンプル種別情報およびサンプル座標情報とを含むサンプルからなるサンプルセットを取得するステップと、
サンプルのサンプル画像を初期モデルに入力し、初期モデルの種別情報出力ネットワークおよび座標情報出力ネットワークから予測種別情報および予測座標情報をそれぞれ出力するステップと、
前記予測座標情報と入力されたサンプル画像に対応するサンプル座標情報とに基づいて、サンプル座標信頼度およびサンプル座標誤差情報を確定するステップと、
サンプル画像を入力とし、入力されたサンプル画像に対応するサンプル種別情報、サンプル座標情報、サンプル座標信頼度およびサンプル座標誤差情報を所望出力として、初期モデルをトレーニングして車両検出モデルを得るステップと
によってトレーニングされることを特徴とする請求項6~8のいずれか1項に記載の装置。
請求項10:
前記処理対象検出枠の種別情報と前記処理済み検出枠の座標情報とに基づいて、修正済み検出結果を生成するように構成される結果生成ユニットをさらに備えることを特徴とする請求項6~9のいずれか1項に記載の装置。
請求項11:
少なくとも1つのプロセッサと、前記少なくとも1つのプロセッサと通信接続されたメモリとを備える電子機器であって、
前記メモリには、前記少なくとも1つのプロセッサによって実行可能な指令が格納され、前記指令が前記少なくとも1つのプロセッサによって実行されると、前記少なくとも1つのプロセッサに請求項1~5のいずれか1項に記載の方法を実行させることを特徴とする電子機器。
請求項12:
コンピュータ指令が格納されている非一時的コンピュータ可読記憶媒体であって、
前記コンピュータ指令は請求項1~5のいずれか1項に記載の方法を前記コンピュータに実行させるために用いられることを特徴とする非一時的コンピュータ可読記憶媒体。
【0086】
なお、上述した様々な形態のフローを用いて、ステップを改めて並び替え、追加または削除を行うことができる。例えば、本出願に記載された各ステップは、本出願に開示された技術案の所望の結果が達成できる限り、並行して実行されてもよいし、順番に実行されてもよいし、異なる順序で実行されてもよい。本明細書はここで制限しない。
【0087】
上記具体的な実施形態は、本出願の保護範囲を限定するものではない。設計要件および他の要因に従って、様々な修正、組み合わせ、再組み合わせ、および置換を行うことができることを当業者は理解すべきである。本出願の趣旨および原理を逸脱せずに行われたあらゆる修正、均等置換および改善などは、いずれも本出願の保護範囲内に含まれるべきである。