特許第6866439号(P6866439)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッドの特許一覧

特許6866439位置検出方法とその装置、機器、記憶媒体及び車両
<>
  • 特許6866439-位置検出方法とその装置、機器、記憶媒体及び車両 図000008
  • 特許6866439-位置検出方法とその装置、機器、記憶媒体及び車両 図000009
  • 特許6866439-位置検出方法とその装置、機器、記憶媒体及び車両 図000010
  • 特許6866439-位置検出方法とその装置、機器、記憶媒体及び車両 図000011
  • 特許6866439-位置検出方法とその装置、機器、記憶媒体及び車両 図000012
  • 特許6866439-位置検出方法とその装置、機器、記憶媒体及び車両 図000013
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6866439
(24)【登録日】2021年4月9日
(45)【発行日】2021年4月28日
(54)【発明の名称】位置検出方法とその装置、機器、記憶媒体及び車両
(51)【国際特許分類】
   G06T 7/70 20170101AFI20210419BHJP
【FI】
   G06T7/70 A
【請求項の数】14
【全頁数】18
(21)【出願番号】特願2019-155990(P2019-155990)
(22)【出願日】2019年8月28日
(65)【公開番号】特開2020-42804(P2020-42804A)
(43)【公開日】2020年3月19日
【審査請求日】2019年8月28日
(31)【優先権主張番号】201811044487.8
(32)【優先日】2018年9月7日
(33)【優先権主張国】CN
(73)【特許権者】
【識別番号】513224353
【氏名又は名称】バイドゥ オンライン ネットワーク テクノロジー (ベイジン) カンパニー リミテッド
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】リウ,ミンジェン
(72)【発明者】
【氏名】ワン,イーチャン
(72)【発明者】
【氏名】スン,シン
(72)【発明者】
【氏名】シエ,シューフー
(72)【発明者】
【氏名】ヂャイ,イーチャン
(72)【発明者】
【氏名】ワン,ハオ
(72)【発明者】
【氏名】シア,ティェン
【審査官】 鈴木 隆夫
(56)【参考文献】
【文献】 特開平07−093693(JP,A)
【文献】 特開平07−077431(JP,A)
【文献】 特開2003−329411(JP,A)
【文献】 特開2010−218226(JP,A)
【文献】 特開平06−020189(JP,A)
【文献】 特開2012−075060(JP,A)
【文献】 特開2011−215063(JP,A)
【文献】 ERNST S ET AL,"Camera calibration for lane and obstacle detection",INTELLIGENT TRANSPORTATION SYSTEM, 1999. PROCEEDINGS. 1999. IEEE/IEEJ/JSAI INTERNATIONAL CONFERENCE ON TOKYO, JAPAN.,米国,IEEE,1999年10月 8日,pages 356-361
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/70
G06T 1/00
G06T 5/00
G06T 7/00
G08G 1/16
G01B 11/00
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
位置検出方法であって、
前記方法は、
カメラによって撮影された現在の画像における第1の車線を検出するステップと、
第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するステップと、
最適化して取得された変換行列に基づいて、前記現在の画像における目標物体の第1の3次元座標を取得し、第1の3次元座標に基づいて前記目標物体の最終的な3次元座標を決定するステップと、を含み、
第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するステップは、
世界座標系とカメラ座標系との間の初期の変換行列に基づいて、地図における車線を前記現在の画像に投影して、第2の車線を取得するステップと、
第1の車線と第2の車線との前記現在の画像における位置に基づいて、前記初期の変換行列を最適化して、最適化された変換行列に基づいて地図における車線を前記現在の画像に再投影して取得された新たな第2の車線と第1の車線との距離が、調整前の第2の車線と第1の車線との距離より小さくなるようにするステップと、を含む、
ことを特徴とする位置検出方法。
【請求項2】
第1の車線と第2の車線との前記現在の画像における位置に基づいて、前記初期の変換行列を最適化するステップは、
第1の車線と第2の車線との画像における位置に基づいて、第1の車線における設定された数の点から第2の車線までの最短距離を決定し、前記最短距離に基づいて第1の損失関数を決定するステップと、
前記第1の損失関数が小さくなる方向に従って、第2の車線の位置を少なくとも一回調整するステップと、
少なくとも一回調整して取得された新たな第2の車線の前記現在の画像における位置と、世界座標系における車線の位置とに基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得するステップと、を含む、
ことを特徴とする請求項に記載の位置検出方法。
【請求項3】
第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するステップは、
第1の車線の消失点に対応するピッチ角を決定するステップであって、前記ピッチ角はカメラの光軸と地平面との間の角度を指すステップと、
前記ピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得するステップと、を含む、
ことを特徴とする請求項1に記載の位置検出方法。
【請求項4】
前記ピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得するステップは、
前記現在の画像を撮影する前に撮影された履歴画像における車線の消失点に対応するピッチ角に基づいて、設定されたフィルタリングアルゴリズムを使用して前記第1の車線の消失点に対応するピッチ角を平滑化してノイズ除去するステップと、
平滑化してノイズ除去して取得されたピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列とに基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得するステップと、を含む、
ことを特徴とする請求項に記載の位置検出方法。
【請求項5】
下記の式によって第1の車線の消失点に対応するピッチ角を決定し、
Y=tan(pitch)fy+cy
ただし、Yは、第1の車線の消失点に対応する縦軸座標値であり、pitchは、第1の車線の消失点に対応するピッチ角であり、fyは、カメラの焦点距離であり、cyは、カメラの感光ユニットの画素サイズである、
ことを特徴とする請求項に記載の位置検出方法。
【請求項6】
最適化して取得された変換行列に基づいて、前記現在の画像における目標物体の第1の3次元座標を取得するステップは、
最適化して取得された変換行列の逆行列に基づいて、前記現在の画像における目標物体の2次元座標を世界座標系に逆投影して、目標物体の第1の3次元座標を取得するステップを含む、
ことを特徴とする請求項1〜のいずれかに記載の位置検出方法。
【請求項7】
第1の3次元座標に基づいて前記目標物体の最終的な3次元座標を決定するステップは、
第1の3次元座標を前記目標物体の最終的な3次元座標として決定するステップ、又は、
第1の3次元座標と設定された検出アルゴリズムに基づいて取得された目標物体の第2の3次元座標とを比較し、比較結果が一致しない場合、第1の3次元座標に基づいて第2の3次元座標を修正し、修正された第2の3次元座標を前記目標物体の最終的な3次元座標をするステップ、を含む、
ことを特徴とする請求項1〜のいずれかに記載の位置検出方法。
【請求項8】
第1の3次元座標に基づいて第2の3次元座標を修正し、修正された第2の3次元座標を前記目標物体の最終的な3次元座標をするステップは、
第2の3次元座標と第1の3次元座標との差に基づいて第2の損失関数を決定するステップと、
前記第2の損失関数が小さくなる方向に従って、第2の3次元座標を少なくとも一回調整するステップと、
少なくとも一回調整して取得された第2の3次元座標を、前記目標物体の最終的な3次元座標として決定するステップと、を含む、
ことを特徴とする請求項に記載の位置検出方法。
【請求項9】
前記方法は、
毎回第2の3次元座標を調整した後、前記現在の画像における位置決め要素の3次元位置座標を取得し、前記位置決め要素とカメラとの距離が目標物体とカメラとの距離より大きい場合、調整された第2の3次元座標が位置決め要素の3次元位置座標より小さいか否かを判断し、「はい」の場合、今回の調整は有効であり、「いいえ」の場合、今回の調整は無効であり、第2の3次元座標を逆方向に再調整するステップと、
位置決め要素とカメラとの距離が目標物体とカメラとの距離より小さい場合、調整された第2の3次元座標が位置決め要素の3次元位置座標以上であるか否かを判断し、「はい」の場合、今回の調整は有効であり、「いいえ」の場合、今回の調整は無効であり、第2の3次元座標を逆方向に再調整するステップと、をさらに含む、
ことを特徴とする請求項に記載の位置検出方法。
【請求項10】
前記位置決め要素は、交通標識と、街灯と、電柱とのうち少なくとも一つを含む、
ことを特徴とする請求項に記載の位置検出方法。
【請求項11】
位置検出装置であって、
前記装置は、
カメラによって撮影された現在の画像における第1の車線を検出するための第1の車線検出モジュールと、
第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するための初期の変換行列最適化モジュールと、
最適化して取得された変換行列に基づいて、前記現在の画像における目標物体の第1の3次元座標を取得し、第1の3次元座標に基づいて前記目標物体の最終的な3次元座標を決定するための3次元座標決定モジュールと、を含み、
前記初期の変換行列最適化モジュールは、さらに、
世界座標系とカメラ座標系との間の初期の変換行列に基づいて、地図における車線を前記現在の画像に投影して、第2の車線を取得し、
第1の車線と第2の車線との前記現在の画像における位置に基づいて、前記初期の変換行列を最適化して、最適化された変換行列に基づいて地図における車線を前記現在の画像に再投影して取得された新たな第2の車線と第1の車線との距離が、調整前の第2の車線と第1の車線との距離より小さくなるようにする
ことを特徴とする位置検出装置。
【請求項12】
電子機器であって、
メモリと、
プロセッサと、
メモリに記憶され、プロセッサによって実行可能なコンピュータプログラムと、を含み、
前記プログラムが前記プロセッサによって実行される場合に、請求項1〜1のいずれかに記載の位置検出方法を実現する、
ことを特徴とする電子機器。
【請求項13】
コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体であって、
当該プログラムがプロセッサによって実行される場合に、請求項1〜1のいずれかに記載の位置検出方法を実現する、
ことを特徴とするコンピュータ読み取り可能な記憶媒体。
【請求項14】
車体を含む車両であって、
前記車両は、
請求項1に記載の電子機器と、
車体に設けられたカメラと、をさらに含む、
ことを特徴とする車両。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施例は、無人車技術分野に関し、特に位置検出方法とその装置、機器、記憶媒体及び車両に関する。
【背景技術】
【0002】
従来において、無人車システム視覚に基づく検出アルゴリズムを使用して障害物の3次元位置を検出する。
【0003】
具体的には、まず、h/H=f/zに基づいて障害物のz軸座標値を算出し、その中zは、障害物のz軸座標値であり、fは、無人車に取り付けたカメラの焦点距離であり、hは、障害物のカメラによって撮影された画像における高さ値であり、Hは、障害物の実際の高さ値であり、その後、z軸座標値に基づいてx軸座標値とy軸座標値を取得し、さらに障害物の3次元位置座標を取得する。
【0004】
上記の態様では、Hの値は、予めトレーニングして取得される機械モデルに基づいて取得するため、精度が低く、障害物の3次元位置座標の精度をさらに低下させる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の実施例は、位置検出方法とその装置、機器、記憶媒体及び車両を提供して、無人車システムにおける目標物体の3次元位置座標を検出する精度を向上させる。
【課題を解決するための手段】
【0006】
第1の側面において、本発明の実施例は、位置検出方法を提供し、前記方法は、カメラによって撮影された現在の画像における第1の車線を検出するステップと、第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するステップと、最適化して取得された変換行列に基づいて、前記現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて前記目標物体の最終的な3次元座標を決定するステップと、を含む。
【0007】
第2の側面において、本発明の実施例は、位置検出装置をさらに提供し、当該装置は、カメラによって撮影された現在の画像における第1の車線を検出するための第1の車線検出モジュールと、第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するための初期の変換行列最適化モジュールと、最適化して取得された変換行列に基づいて、前記現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて前記目標物体の最終的な3次元座標を決定するための3次元座標決定モジュールと、をさらに含む。
【0008】
第3の側面において、本発明の実施例は、電子機器をさらに提供し、メモリと、プロセッサと、メモリに記憶され、プロセッサによって実行可能なコンピュータプログラムと、を含み、前記プログラムが前記プロセッサによって実行される場合に、本発明の実施例の位置検出方法を実現する。
【0009】
第4の側面において、本発明の実施例は、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体をさらに提供し、当該プログラムがプロセッサによって実行される場合に、本発明の実施例の位置検出方法を実現する。
【0010】
第5の側面において、本発明の実施例は、車体を含む車両をさらに提供し、第3の側面の電子機器、車体に設けられたカメラと、をさらに含む。
【発明の効果】
【0011】
本発明の実施例は、まず、カメラによって撮影された現在の画像における第1の車線を検出し、その後、第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化し、最適化して取得された変換行列に基づいて現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定する。本発明の実施例より提供される位置検出方法は、最適化された変換行列を使用して、画像における目標物体の第1の3次元座標を取得し、その後、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定するため、無人車システムにおける障害物などの目標物体の3次元位置座標を検出する精度を向上させることができる。
【図面の簡単な説明】
【0012】
図1】本発明の実施例1による位置検出方法のフローチャートである。
図2】本発明の実施例2による位置検出方法のフローチャートである。
図3】本発明の実施例2による他の位置検出方法のフローチャートである。
図4】本発明の実施例3による位置検出装置の概略構成図である。
図5】本発明の実施例4による電子機器の概略構成図である。
図6】本発明の実施例5による車両の概略構成図である。
【発明を実施するための形態】
【0013】
以下、図面と実施例とを組み合わせて、本発明についてさらに詳しく説明する。なお、ここで説明される具体的な実施例は、単に本発明を解釈するためのものであり、本発明を限定するものではない。また、説明の便宜上、図面には、すべての構成ではなく、本発明に係る部分だけが示されている。
【0014】
実施例1
図1は、本発明の実施例1より提供される位置検出方法のフローチャートである。本実施例は、無人車システムにおいて目標物体の3次元座標位置を検出する場合に適用することができる。当該方法は、位置検出装置によって実行されることができ、当該装置は、ソフトウェア及び/又はハードウェアで構成することができ、一般的に位置検出機能を有する機器に統合されることができる。当該機器は、携帯端末、車載機器などの電子機器であってもよい。図1に示すように、当該方法は、具体的には、以下のようなステップを含む。
ステップS110:カメラによって撮影された現在の画像における第1の車線を検出する。
【0015】
具体的には、無人車が走行中に、車載カメラが車両前方の画像を連続的に取得し、カメラが現在の画像を撮影する場合、現在の画像における第1の車線を検出して、第1の車線における各点の座標又は第1の車線の消失点に対応するピッチ角を取得する。
【0016】
ステップS120:第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化する。
【0017】
その中、変換行列は、世界座標系とカメラ座標系との間のマッピング関係を反映することができる行列であってもよく、変換行列に世界座標系におけるある点の座標を乗算すると、当該点がカメラ座標系にマッピングされる座標を取得することができる。
【0018】
選択可能に、第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するステップは、世界座標系とカメラ座標系との間の初期の変換行列に基づいて、地図における車線(具体的には、地図の、現在の画像を撮影しているときの位置の車線を指す)を現在の画像に投影して、第2の車線を取得し、第1の車線と第2の車線との現在の画像における位置に基づいて初期の変換行列を最適化して、最適化された変換行列に基づいて地図における車線を現在の画像に再投影して取得された新たな第2の車線と第1の車線との距離が、調整前の第2の車線と第1の車線との距離より小さくなるようにする方式によって実施されることができる。
【0019】
その中、地図は、世界座標系を基準にして作成される。地図における車線を現在の画像に投影して、第2の車線を取得する実現方式は、地図に対応する世界座標系とカメラ座標系との間の初期の変換行列に基づいて、地図における車線の各点を画像の画素に投影し、投影された各画素によって第2の車線が構成されることができる。例示的には、地図における車線を現在の画像に投影して、第2の車線を取得することは下記の式によって実現されることができる。
【0020】
【数1】
【0021】
その中、u、vは、画像の画素点座標であり、X、Y、Zは、世界座標系座標であり、Pは、世界座標系とカメラ座標系との間の変換行列である。
【0022】
具体的には、地図における車線における各点は、世界座標系に基づく座標を有し、世界座標系とカメラ座標系との間の初期変化行列を用いて、地図における車線における各点の座標を画像におけるカメラ座標系に基づく座標に変換することができるため、地図における車線の各点を画像の画素に投影し、最後に投影された各画素によって第2の車線が構成される。第2の車線を取得した後、第1の車線と第2の車線との現在の画像における位置に基づいて初期変化行列を最適化する。
【0023】
選択可能に、第1の車線と第2の車線との画像における位置に基づいて初期の変換行列を最適化することは、第1の車線と第2の車線との画像における位置に基づいて、第1の車線における設定された数の点から第2の車線までの最短距離を決定し、最短距離に基づいて第1の損失関数を決定し、第1の損失関数が小さくなる方向に従って、第2の車線の位置を少なくとも一回調整し、少なくとも一回して取得調整された新たな第2の車線の現在の画像における位置と、世界座標系における車線の位置とに基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する方式によって実施されることができる。
【0024】
その中、第1の車線と第2の車線との画像における位置は、第1の車線と第2の車線とを構成する各点の座標によって特徴付けることができる。最短距離に基づいて第1の損失関数を決定する方式は、第1の車線における設定された数の点から第2の車線までの最短距離を合計することができる。第1の損失関数の表示式は:
【0025】
【数2】
【0026】
であり、その中、(x1、y1)は、第1の車線上の一つの点であり、(x2、y2)は、第2の車線において(x1、y1)までの距離が最も小さい点であり、
【0027】
【数3】
【0028】
は、二つの点の間の距離、すなわち(x1、y1)と第2の車線との間の最短距離を表示し、sumは、各最短距離を合計して算出することを表示する。
【0029】
第1の損失関数が小さくなる方向に従って、第2の車線の位置を少なくとも一回調整する実現方式は、まず、設定されたステップサイズにしたがって第2の車線における各点の座標を調整することができ、具体的には、第2の車線上の、第1の車線における設定された数の点との距離が最も小さい各点を調整することができ、調整時に調整対象の点の座標を設定されたステップサイズに加算又は減算することができ、第2の車線の点の座標を調整した後、調整された各点によって新たな第2の車線が再形成され、さらに第1の車線と新たな第2の車線の位置に基づいて、第1の損失関数の値を再決定する。その後、再決定された第1の損失関数の値が大きくなるか小さくなるかを判断し、大きくなる場合、今回の調整は無効であり、設定されたステップサイズにしたがって第2の車線における各点の座標を逆方向に調整し(すなわち前回の無効調整がステップサイズに加算された場合、今回の調整は減算され、前回の無効調整がステップサイズに減算された場合、今回の調整はステップサイズに加算され)、小さくなる場合、今回の調整は有効であり、設定されたステップサイズにしたがって第2の車線における各点の座標を同方向に調整する(すなわち前回の有効調整がステップサイズに加算された場合、今回の調整は、まだステップサイズに加算され、前回の有効調整がステップサイズに減算された場合、今回の調整はまだステップサイズに減算される)。上記の調整回数が設定された反復回数に達するか、又は損失関数の値が設定された閾値より小さい場合、調整は停止される。最後に一回調整された各点の座標は、最終的な新たな第2の車線が構成され、最終的な新たな第2の車線及び世界座標系における車線の位置に基づいて、一つの変化行列、すなわち求められた最適化の変化行列を取得する。
【0030】
ステップS130:最適化して取得された変換行列に基づいて、現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定する。
【0031】
具体的には、最適化された変換行列を取得した後、目標物体の現在の画像における2次元座標と最適化された変換行列に基づいて、目標物体の第1の3次元座標を取得する。
【0032】
選択可能に、最適化して取得された変換行列に基づいて現在の画像における目標物体の第1の3次元座標を取得することは、最適化して取得された変換行列の逆行列に基づいて、現在の画像における目標物体の2次元座標を世界座標系に逆投影して、目標物体の第1の3次元座標を取得する方式によって実施されることができる。
【0033】
その中、2次元座標は、目標物体の2D枠の底辺の点の2次元座標であってもよく、対応する第1の3次元座標は、目標物体の着地点の3次元座標である。2D枠は、既存のアルゴリズムに基づいて自動的に取得することができる。具体的には、変換行列の逆行列に現在の画像における目標物体の2次元座標を乗算して、目標物体の第1の3次元座標を取得する。例示的には、第1の3次元座標は、以下の算出式:
【0034】
【数4】
【0035】
を使用して取得することができ、その中、u、vは、画像の画素点座標であり、X、Y、Zは、世界座標系座標であり、
【0036】
【数5】
【0037】
は、最適化された変化行列の逆行列である。
【0038】
選択可能に、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定するステップは、第1の3次元座標を目標物体の最終的な3次元座標として決定するステップ、又は、第1の3次元座標と設定された検出アルゴリズムに基づいて取得された目標物体の第2の3次元座標とを比較し、比較結果が一致しない場合、第1の3次元座標に基づいて第2の3次元座標を修正して、修正された第2の3次元座標を目標物体の最終的な3次元座標とするステップ、を含む。
【0039】
その中、設定された検出アルゴリズムは、既存の視覚に基づく検出アルゴリズムであってもよい。選択可能に、第1の3次元座標に基づいて第2の3次元座標を修正して、修正された第2の3次元座標を目標物体の最終的な3次元座標とすることは、第2の3次元座標と第1の3次元座標と差に基づいて第2の損失関数を決定するステップと、第2の損失関数が小さくなる方向に従って、第2の3次元座標を少なくとも一回調整し、少なくとも一回調整された第2の3次元座標を、目標物体の最終的な3次元座標として決定するするステップとによって、実施されることができる。
【0040】
その中、第2の3次元座標と第1の3次元座標との差は、目標物体の着地点の第2の3次元座標と第1の3次元座標との差であってもよい。下記の式:
【0041】
【数6】
【0042】
を使用して表示することができ、その中、(x1、y1、z1)は、目標物体のうちの一つの着地点の第1の3次元座標であり、(x2、y2、z2)は、目標物体の当該着地点の第2の3次元座標であり、dは、第2の3次元座標と第1の3次元座標との差である。第2の損失関数を決定するの方式は、目標物体の設定数量の着地点の第2の3次元座標と第1の3次元座標との差を合計することであってもよい。
【0043】
具体的には、第2の損失関数が小さくなる方向に従って、第2の3次元座標を少なくとも一回調整する実現方式は、設定されたステップサイズにしたがって第2の3次元座標を調整し、調整時に調整対象の点の座標を設定されたステップサイズに加算又は減算することができ、調整後に第2の損失関数の値を再決定することができる。再決定された第2の損失関数の値が大きくなるか小さくなるかを判断し、大きくなる場合、今回の調整は無効であり、設定されたステップサイズにしたがって第2の3次元座標を逆方向に再調整し(すなわち前回の無効調整がステップサイズに加算された場合、今回の調整は減算され、前回の無効調整がステップサイズに減算された場合、今回の調整はステップサイズに加算され)、小さくなる場合、設定されたステップサイズにしたがって第2の3次元座標を同方向に再調整する(すなわち前回の無効調整がステップサイズに加算された場合、今回の調整はまだ加算され、前回の無効調整がステップサイズに減算された場合、今回の調整はまだステップサイズに減算される)。上記の調整回数が設定された反復回数に達するか、又は第2の損失関数の値より小さい設定された閾値時、調整は停止される。最後に、調整を停止した後に、取得された第2の3次元座標を目標物体の最終的な3次元座標として決定する。
【0044】
選択可能に、当該方法は、毎回第2の3次元座標を調整した後、現在の画像における位置決め要素の3次元位置座標を取得し、位置決め要素とカメラとの距離が目標物体とカメラとの距離より大きい場合、調整された第2の3次元座標が位置決め要素の3次元位置座標より小さいか否かを判断し、「はい」の場合、今回の調整は有効であり、「いいえ」の場合、今回の調整は無効であり、第2の3次元座標を逆方向に再調整するステップと、位置決め要素とカメラとの距離が目標物体とカメラとの距離より小さい場合、調整された第2の3次元座標が位置決め要素の3次元位置座標以上であるか否かを判断し、「はい」の場合、今回の調整は有効であり、「いいえ」の場合、今回の調整は無効であり、第2の3次元座標を逆方向に再調整するステップと、をさらに含む。
【0045】
その中、位置決め要素は、交通標識と、街灯と、電柱とのうち少なくとも一つを含むことができる。本実施例では、画像における位置決め要素が目標物体の上にある場合、位置決め要素とカメラとの距離は、目標物体とカメラとの距離より大きく、位置決め要素が目標物体の下にある場合、位置決め要素とカメラとの距離は、目標物体とカメラとの距離より小さい。調整された第2の3次元座標と位置決め要素の3次元座標を比較することは、二つの3次元座標の縦座標のサイズを比較することであってもよい。本実施例では、位置決め要素を参照として第2の3次元座標を調整することは、3次元座標調整の精度を向上させることができる。
【0046】
本実施例の技術案は、まず、カメラによって撮影された現在の画像における第1の車線を検出し、その後、第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化し、最適化して取得された変換行列に基づいて現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定する。本発明の実施例より提供される位置検出方法は、最適化された変換行列を使用して、画像における目標物体の第1の3次元座標を取得し、その後、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定するため、無人車システムにおける障害物などの目標物体の3次元位置座標を検出する精度を向上させることができる。
【0047】
実施例2
図2は、本発明の実施例2により提供される位置検出方法のフローチャートである。上記の実施例を基礎として、第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するステップは、第1の車線の消失点に対応するピッチ角を決定し、ピッチ角はカメラの光軸と地平面との間の角度を指し、ピッチ角と、世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する方式によって実施されることができる。図2に示すように、当該方法は、具体的には、以下のようなステップを含む。
ステップS210:カメラによって撮影された現在の画像における第1の車線を検出する。
【0048】
ステップS220:第1の車線の消失点に対応するピッチ角を決定する。
【0049】
その中、ピッチ角はカメラの光軸と地平面との間の角度を指す。第1の車線の消失点は二つの車線の交点であってもよい。
【0050】
選択可能に、第1の車線の消失点に対応するピッチ角を取得することは、Y=tan(pitch)fy+cyによって算出することができ、その中、Yは、第1の車線の消失点に対応する縦軸座標値であり、pitchは、第1の車線の消失点に対応するピッチ角であり、fyは、カメラの焦点距離であり、cyは、カメラの感光ユニットの画素サイズである。
【0051】
ステップS230:ピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する。
【0052】
具体的には、初期の地図に対応する世界座標系とカメラ座標系との間の変換行列におけるピッチ角要素を、第1の車線の消失点に対応するピッチ角に置き換えて、最適化された変換行列を取得する。
【0053】
選択可能に、前記ピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得するステップは、現在の画像を撮影する前に撮影された履歴画像における車線の消失点に対応するピッチ角に基づいて、設定されたフィルタリングアルゴリズムを使用して第1の車線の消失点に対応するピッチ角を平滑化してノイズ除去するステップと、平滑化してノイズ除去して取得されたピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列とに基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得するステップと、によって実施されることができる。
【0054】
その中、設定されたフィルタリングアルゴリズムは、カルブマンフィルタリング又はヒストグラム平滑化フィルタリングなどのアルゴリズムであってもよい。具体的には、複数の履歴画像における車線の消失点に対応するピッチ角を取得した後、複数の履歴ピッチ角に基づいて設定されたフィルタリングアルゴリズムを使用して現在の画像における第1の車線の消失点に対応するピッチ角を平滑化してノイズ除去し、初期の地図に対応する世界座標系とカメラ座標系との間の変換行列におけるピッチ角要素を、平滑化してノイズ除去されたピッチ角に置き換えるため、最適化された世界座標系とカメラ座標系との間の変換行列を取得する。
【0055】
ステップS240:最適化して取得された変換行列に基づいて、現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定する。
【0056】
本実施例の技術案は、ピッチ角と、世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得し、最適化して取得された変換行列に基づいて、現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定するため、無人車システムにおける障害物の3次元位置座標を検出する精度を向上させることができる。
【0057】
図3は、本発明の実施例2により提供される他の位置検出方法のフローチャートである。上記の実施例に対するさらなる説明として、図3に示すように、当該方法は、以下のようなステップを含む。
ステップS310:カメラによって撮影された現在の画像における第1の車線を検出し、検出されたものが第1の車線の位置座標である場合、ステップ320を実行し、検出されたものが第1の車線の消失点のピッチ角である場合、ステップ350を実行する。
【0058】
ステップS320:世界座標系とカメラ座標系との間の初期の変換行列に基づいて、地図における車線を現在の画像に投影して、第2の車線を取得する。
【0059】
ステップS330:第1の車線と第2の車線との画像における位置に基づいて、第1の車線における設定された数の点から第2の車線までの最短距離を決定し、最短距離に基づいて第1の損失関数を決定するステップと、第1の損失関数が小さくなる方向に従って、第2の車線の位置を少なくとも一回調整する。
【0060】
ステップS340:少なくとも一回調整して取得された新たな第2の車線の現在の画像における位置と、世界座標系における車線の位置とに基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する。
【0061】
ステップS350:Y=tan(pitch)fy+cyによって第1の車線の消失点に対応するピッチ角を決定し、現在の画像を撮影する前に撮影された履歴画像における車線の消失点に対応するピッチ角に基づいて、設定されたフィルタリングアルゴリズムを使用して第1の車線の消失点に対応するピッチ角を平滑化してノイズ除去する。
【0062】
ステップS360:平滑化してノイズ除去されたピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する。
【0063】
ステップS370:最適化して取得された変換行列の逆行列に基づいて、現在の画像における目標物体の2次元座標を世界座標系に逆投影して、目標物体の第1の3次元座標を取得する。
【0064】
ステップS380:第1の3次元座標を目標物体の最終的な3次元座標として決定するステップであり、又は、第1の3次元座標と設定された検出アルゴリズムに基づいて取得された目標物体の第2の3次元座標とを比較し、比較結果が一致しない場合、第1の3次元座標に基づいて第2の3次元座標を修正して、修正された第2の3次元座標を目標物体の最終的な3次元座標とするステップである。
【0065】
実施例3
図4は、本発明の実施例3により提供される位置検出装置の概略構成図である。図4に示すように、当該装置は、第1の車線検出モジュール410と、初期の変換行列最適化モジュール420と、及び3次元座標決定モジュール430と、を含む。
【0066】
第1の車線検出モジュール410は、カメラによって撮影された現在の画像における第1の車線を検出するために用いられる。
初期の変換行列最適化モジュール420は、第1の車線の検出結果に基づいて、世界座標系とカメラ座標系との間の初期の変換行列を最適化するために用いられる。
3次元座標決定モジュール430は、最適化して取得された変換行列に基づいて現在の画像における目標物体の第1の3次元座標を取得して、第1の3次元座標に基づいて目標物体の最終的な3次元座標を決定するために用いられる。
【0067】
選択可能に、初期の変換行列最適化モジュール420は、さらに、世界座標系とカメラ座標系との間の初期の変換行列に基づいて、地図における車線を現在の画像に投影して、第2の車線を取得し、第1の車線と第2の車線との現在の画像における位置に基づいて初期の変換行列を最適化し、最適化された変換行列に基づいて地図における車線を現在の画像に再投影して取得された新たな第2の車線と第1の車線との距離が、調整前の第2の車線と第1の車線との小さくなる距離より小さくなるようにする。
【0068】
選択可能に、初期の変換行列最適化モジュール420は、さらに、第1の車線と第2の車線との画像における位置に基づいて、第1の車線における設定された数の点から第2の車線までの最短距離を決定し、最短距離に基づいて第1の損失関数を決定し、第1の損失関数が小さくなる方向に従って、第2の車線の位置を少なくとも一回調整し、少なくとも一回調整して取得された新たな第2の車線の現在の画像における位置と、世界座標系における車線の位置とに基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する。
【0069】
選択可能に、初期の変換行列最適化モジュール420は、さらに、第1の車線の消失点に対応するピッチ角を決定し、ピッチ角はカメラの光軸と地平面との間の角度を指し、ピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する。
【0070】
選択可能に、初期の変換行列最適化モジュール420は、さらに、現在の画像を撮影する前に撮影された履歴画像における車線の消失点に対応するピッチ角に基づいて、設定されたフィルタリングアルゴリズムを使用して第1の車線の消失点に対応するピッチ角を平滑化してノイズ除去し、平滑化してノイズ除去されたピッチ角及び世界座標系とカメラ座標系との間の初期の変換行列に基づいて、最適化された世界座標系とカメラ座標系との間の変換行列を取得する。
【0071】
選択可能に、Y=tan(pitch)fy+cyによって第1の車線の消失点に対応するピッチ角を決定し、その中、Yは、第1の車線の消失点に対応する縦軸座標値であり、pitchは、第1の車線の消失点に対応するピッチ角であり、fyは、カメラの焦点距離であり、cyは、カメラの感光ユニットの画素サイズである。
【0072】
選択可能に、3次元座標決定モジュール430は、さらに、最適化して取得された変換行列の逆行列に基づいて、現在の画像における目標物体の2次元座標を世界座標系に逆投影して、目標物体の第1の3次元座標を取得する。
【0073】
選択可能に、3次元座標決定モジュール430は、さらに、第1の3次元座標を目標物体の最終的な3次元座標として決定するか、又は、第1の3次元座標と設定された検出アルゴリズムに基づいて取得された目標物体の第2の3次元座標とを比較し、比較結果が一致しない場合、第1の3次元座標に基づいて第2の3次元座標を修正して、修正された第2の3次元座標を目標物体の最終的な3次元座標とする。
【0074】
選択可能に、3次元座標決定モジュール430は、さらに、第2の3次元座標と第1の3次元座標との差に基づいて第2の損失関数を決定し、第2の損失関数が小さくなる方向に従って、第2の3次元座標を少なくとも一回調整し、少なくとも一回調整された第2の3次元座標を、目標物体の最終的な3次元座標として決定する。
【0075】
選択可能に、前記位置検出装置は、毎回第2の3次元座標を調整した後、現在の画像における位置決め要素の3次元位置座標を取得し、位置決め要素とカメラとの距離が目標物体とカメラとの距離より大きい場合、調整された第2の3次元座標が位置決め要素の3次元位置座標より小さいか否かを判断し、「はい」の場合、今回の調整は有効であり、「いいえ」の場合、今回の調整は無効であり、第2の3次元座標を逆方向に再調整するための位置決め要素3次元座標取得モジュールと、位置決め要素とカメラとの距離が目標物体とカメラとの距離より小さい場合、調整された第2の3次元座標が位置決め要素の3次元位置座標以上であるか否かを判断し、「はい」の場合、今回の調整は有効であり、「いいえ」の場合、今回の調整は無効であり、第2の3次元座標を逆方向に再調整するための調整モジュールと、をさらに含む。
【0076】
選択可能に、位置決め要素は、交通標識と、街灯と、電柱とのうち少なくとも一つを含む。
【0077】
上記の装置は、本発明の前述のすべての実施例により提供される方法を実行することができ、上記の方法を実行することに対応する機能モジュールと有益な効果を備える。未在本実施例に詳細に記載されていない技術的詳細は、本発明の前述のすべての実施例により提供される方法を参照することができる。
【0078】
実施例4
図5は、本発明の実施例4により提供される電子機器の概略構成図である。図5は、本発明の実施形態を実現するのに適する電子機器512のブロック図である。図5に示される電子機器512は、単なる一つの例であり、本発明の実施例の機能及び使用範囲を一切制限しない。機器512は、一般的に、位置検出機能を担うコンピューティングデバイスである。
【0079】
図5に示すように、電子機器512は、汎用コンピューティングデバイスの形態で表現される。電子機器512のコンポーネントは、一つ又は複数のプロセッサ516又は記憶装置528と、異なるシステムコンポーネント(記憶装置528とプロセッサ516とを含む)を接続するバス518と、を含むことができるが、これらに限定されない。
【0080】
バス518は、メモリバス又はメモリコントローラ、周辺バス、アクセラレーテッドグラフィックスポート、プロセッサ又は多様なバス構造のうち任意のバス構造を使用するローカルバスを含む、複数種のバス構造のうち一つ又は複数のものを表す。例をあげると、これらのアーキテクチャは、インダストリスタンダードアーキテクチャ(Industry Standard Architecture、ISA)バス、マイクロチャネルアーキテクチャ(Micro Channel Architecture、MCA)バス、拡張ISAバス、ビデオエレクトロニクススタンダーズアソシエーション(Video Electronics Standards Association、VESA)ローカルバス、及びペリフェラルコンポーネントインターコネクト(Peripheral Component Interconnect、PCI)バスを含むが、これらに限定されない。
【0081】
電子機器512は、典型的には、多種類のコンピュータシステム読み取り可能な媒体を含む。これらの媒体は、電子機器512がアクセスすることができる任意の使用可能な媒体であってもよく、揮発性媒体及び不揮発性媒体、リムーバブル媒体及びノンリムーバブル媒体を含む。
【0082】
記憶装置528は、ランダムアクセスメモリ(Random Access Memory、RAM)530及び/又はキャッシュメモリ532などの揮発性メモリの形態のコンピュータシステム読み取り可能な媒体を含んでもよい。電子機器512は、他のリムーバブル/ノンリムーバブル、揮発性/不揮発性コンピュータシステム記憶媒体をさらに含んでもよい。単なる一例として、ストレージシステム534は、ノンリムーバブル、不揮発性磁気媒体(図5に示されていないが、通常「ハードアクチュエー」と呼ぶ)に対して読み出し及び書き込みをするために用いることができる。図5に示されていないが、リムーバブル、不揮発性磁気ディスク(例えば、「フロッピーディスク」)に対して読み出し及び書き込みをするための磁気ディスクアクチュエー、及びリムーバブル、不揮発性光学ディスク(例えば、コンパクトディスク読み取り専用メモリ(Compact Disc Read−Only Memory、CD−ROM)、デジタルビデオディスク読み取り専用メモリ(Digital Video Disc−Read Only Memory、DVD−ROM)又は他の光学媒体)に対して読み出し及び書き込みをするための光学ディスクアクチュエーを提供することができる。この場合、各アクチュエーは、一つ又は複数のデータメディアインターフェイスを介してバス518に接続することがきる。記憶装置528は、本発明の各実施例に記載の機能を実行するように構成されるワンセットのプログラムモジュール(例えば、少なくとも一つ)を有する少なくとも一つのプログラム製品を含んでもよい。
【0083】
ワンセットのプログラムモジュール526(少なくとも一つ)を有するプログラム536は、例えば、記憶装置528に記憶されてもよく、このようなプログラムモジュール526は、オペレーティングシステム、一つ又は複数のアプリケーションプログラム、他のプログラムモジュール、及びプログラムデータを含むことができるがこれらに限定されない。これらの例のそれぞれ又は何らかの組み合わせには、ネットワーク環境の実装が含まれる可能性がある。プログラムモジュール526は、通常本発明に記載の実施例における機能及び/又は方法を実行する。
【0084】
電子機器512は、一つ又は複数の外部デバイス514(例えば、キーボード、ポインティング機器、カメラ、ディスプレイ524など)と通信することができ、ユーザが電子機器512とインタラクションすることを可能にする一つ又は複数の機器と通信することもでき、及び/又は電子機器512が一つ又は複数の他のコンピューティングデバイスと通信することを可能にする任意の機器(例えば、ネットワークカード、モデムなど)と通信することができる。そのような通信は、入力/出力(I/O)インターフェイス522を介して行うことができる。また、電子機器512は、ネットワークアダプタ520を介して、一つ又は複数のネットワーク(例えば、ローカルエリアネットワーク(Local Area Network、LAN)、ワイドエリアネットワーク(Wide Area Network、WAN)、及び/又はパブリックネットワーク、例えば、インターネット)と通信することができる。図5に示すように、ネットワークアダプタ520は、バス518を介して、電子機器512の他のモジュールと通信する。なお、図示されていないが、マイクロコードや機器ドライブ、冗長処理ユニット、外部ディスクドライブアレイ、ディスクアレイ(Redundant Arrays of Independent Disks、RAID)システム、テープドライバ、及びデータバックアップトレージシステムなどを含むがこれらに限定されない他のハードウェア及び/又はソフトウェアモジュールを、電子機器512と組み合わせて使用することができる。
【0085】
プロセッサ516は、記憶装置528に記憶されるプログラムを実行することにより、多様な機能アプリケーション及びデータ処理を実行し、例えば、本発明の上記の実施例が提供する位置検出方法を実現する。
【0086】
実施例5
本発明の実施例5は、コンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体をさらに提供し、当該プログラムがプロセッサによって実行される場合に、本発明の実施例により提供される位置検出方法を実現する。
【0087】
無論、本発明の実施例により提供されるコンピュータプログラムが記憶されているコンピュータ読み取り可能な記憶媒体は、上記に示す方法の動作に限定されず、本発明の任意の実施例により提供される位置検出方法における関連動作も実行することができる。
【0088】
本発明の実施例に係るコンピュータ記憶媒体は、一つ又は複数のコンピュータ読み取り可能な媒体の任意の組み合わせを採用することができる。コンピュータ読み取り可能な媒体は、コンピュータ読み取り可能な信号媒体、或いはコンピュータ読み取り可能な記憶媒体であってもよい。コンピュータ読み取り可能な媒体は、例えば、電子、磁気、光、電磁気、赤外線、又は半導体のシステム、装置又はデバイス、或いは上記の任意の組み合わせであってもよいが、これらに限定されない。コンピュータ読み取り可能な記憶媒体のより具体的な例(非網羅的なリスト)は、一つ又は複数の配線を備える電気接続部、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、消去可能なプログラマブル読み出し専用メモリ(EPROM又はフラッシュメモリ)、光ファイバ、ポータブルコンパクトディスク読み出し専用メモリ(CD−ROM)、光記憶装置、磁気記憶装置、又は上記の任意の適切な組み合わせを含む。この文書において、コンピュータ読み取り可能な記憶媒体は、命令実行システム、装置又はデバイスにより使用され、或いはそれらと組み合わせて使用されることが可能であるプログラムを含む又は記憶する任意の有形の媒体であってもよい。
【0089】
コンピュータ読み取り可能なの信号媒体は、ベースバンドにおける、又は搬送波の一部として伝播するデータ信号を含むことができ、その中のにはコンピュータ読み取り可能なのプログラムコードが搭載される。この伝播するデータ信号は様々な形式を採用することができ、電磁信号、光信号又は上記の任意の適切な組み合わせを含むがこれらに限定されない。コンピュータ読み取り可能なの信号媒体は、さらに、コンピュータ読み取り可能な記憶媒体以外の任意のコンピュータ読み取り可能な媒体であってもよく、当該コンピュータ読み取り可能な媒体は、命令実行システム、装置又はデバイスにより使用され、或いはそれらと組み合わせて使用されるプログラムを送信、伝播又は伝送することができる。
【0090】
コンピュータ読み取り可能な媒体に含まれるプログラムコードは、無線、有線、光ケーブル、RFなど、又は上記の任意の適切な組み合わせを含むが、これらに限定されない任意の適切な媒体によって伝送することができる。
【0091】
一つ又は複数のプログラミング言語又はそれらの組み合わせで本発明の動作を実行するためのコンピュータプログラムコードを作成することができ、前記プログラミング言語は、Java(登録商標)、Smalltalk、C++などのプロジェクト指向のプログラミング言語を含み、さらに、「C」言語又は同様のプログラミング言語といった従来の手続き型プログラミング言語をも含む。プログラムコードは、完全にユーザーコンピュータで実行されてもよく、部分的にユーザーコンピュータに実行されてもよく、スタンドアロンソフトウェアパッケージとして実行されてもよく、部分的にユーザーコンピュータで、部分的にリモートコンピュータで実行されてもよく、又は完全にリモートコンピュータ又はサーバで実行してもよい。リモートコンピュータに係る場合、リモートコンピュータは、ローカルネットワーク(LAN)又は広域ネットワーク(WAN)を含む任意種類のインターネットを介して、ユーザーコンピュータに接続することができ、或いは、外部コンピュータ(例えば、インターネットサービスプロバイダを利用してインターネットを介して接続する)に接続することもできる。
【0092】
さらに、図6は、本発明の実施例5により提供される車両の概略構成図である。図6に示すように、当該車両は、車体610と、上記の実施例の電子機器620と、車体に設けられたカメラ630と、を含む。
【0093】
なお、以上は、本発明の好ましい実施例及び運用される技術的原理に過ぎない。当業者は、本発明がここで記載される特定の実施例に限定されないことを理解することができる。当業者であれば、本発明の保護範囲を逸脱することはなく、種々の明らかな変化、新たな調整及び取り換えを行うことができる。したがって、上記実施例により本発明について比較的詳細に説明したが、本発明は、上記実施例のみに限定されず、本発明の構想を逸脱しない場合、より多くの他の効果同等な実施例をさらに含むごくができ、本発明の範囲は、特許請求の範囲によって决定される。
図1
図2
図3
図4
図5
図6