(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-05
(45)【発行日】2024-07-16
(54)【発明の名称】自動車のための経路および/または軌道を計画するためのデバイス
(51)【国際特許分類】
G01C 21/34 20060101AFI20240708BHJP
B60W 30/10 20060101ALI20240708BHJP
B60W 40/09 20120101ALI20240708BHJP
G08G 1/00 20060101ALI20240708BHJP
G08G 1/0969 20060101ALI20240708BHJP
【FI】
G01C21/34
B60W30/10
B60W40/09
G08G1/00 A
G08G1/0969
(21)【出願番号】P 2021517253
(86)(22)【出願日】2019-09-27
(86)【国際出願番号】 EP2019076315
(87)【国際公開番号】W WO2020065070
(87)【国際公開日】2020-04-02
【審査請求日】2022-08-29
(32)【優先日】2018-09-28
(33)【優先権主張国・地域又は機関】FR
(73)【特許権者】
【識別番号】507308902
【氏名又は名称】ルノー エス.ア.エス.
【氏名又は名称原語表記】RENAULT S.A.S.
【住所又は居所原語表記】122-122 bis, avenue du General Leclerc, 92100 Boulogne-Billancourt, France
(73)【特許権者】
【識別番号】000003997
【氏名又は名称】日産自動車株式会社
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】オベール, セバスチャン
(72)【発明者】
【氏名】ジャカローネ, ジャン-ピエール
(72)【発明者】
【氏名】ワインガートナー, フィリップ
【審査官】宮本 礼子
(56)【参考文献】
【文献】国際公開第2017/057060(WO,A1)
【文献】特開2018-063476(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01C 21/00-21/36
G01C 23/00-25/00
G08G 1/00-99/00
B60W 10/00-10/30
B60W 30/00-60/00
(57)【特許請求の範囲】
【請求項1】
自動車両(4)のための経路および/または軌道を計画するためのデバイス(2)であって、
時間の関数である入力変数のシーケンスを受信するためのモジュール(6)と、受信された入力変数の前記シーケンスに基づいて、前記経路および/または前記軌道に対応する制御法を決定するためのハードウェアおよびソフトウェア手段とを備え、前記デバイス(2)は、
メモリ使用量の低減のために削減された前記シーケンスのセット中の
複数の前記シーケンスの分類手段を備えることを特徴と
し、
可変長の入力変数の異なるシーケンスから構成された入力の前記セットが、センサーから取得された未加工変数のシーケンスと、前記車両の外部環境のマージされた表現のための変数のシーケンスと、前記車両の内部パラメータの表現のための変数のシーケンスとの中から選定された、入力変数の少なくとも1つのシーケンスを備える、デバイス(2)。
【請求項2】
前
記分類手段が、可変長の出力変数の異なるシーケンスから構成された出
力セットに向かう
、入力の
前記セットの全射を定義するように構成されている、請求項1に記載のデバイス(2)。
【請求項3】
入力の前記セットが時間入力変数のシーケンスおよび/またはメトリック入力変数のシーケンスを備える、請求項2に記載のデバイス(2)。
【請求項4】
前記出
力セットが時間出力変数のシーケンスおよび/またはメトリック出力変数のシーケンスを備える、請求項2
または3に記載のデバイス(2)。
【請求項5】
前記出
力セットが、ルートポイントの座標のペアのシーケンスと、ルートポイントの横座標のシーケンスと、ルートポイントの縦座標のシーケンスとの中から選定された少なくとも1つの出力シーケンスを備える、請求項2から
4のいずれか一項に記載のデバイス(2)。
【請求項6】
前
記分類手段が、隠れマルコフ連鎖モデルおよび/または再帰型ニューラルネットワーク、好ましくは、長短期記憶再帰型ニューラルネットワーク(8)を備える、請求項1から
5のいずれか一項に記載のデバイス(2)。
【請求項7】
前
記分類手段が、コネクショニスト時間分類関数を使用するように構成されている、請求項1から
6のいずれか一項に記載のデバイス(2)。
【請求項8】
自動車(4)のための経路および/または軌道を計画するための方法であって、
時間の関数である入力変数のシーケンスを受信すること(F01)と、入力変数の前記シーケンスに基づいて、前記自動車の前記経路および/または前記軌道に対応する制御法を決定することとを含み、前記方法は、
メモリ使用量の低減のために削減された前記シーケンスのセット中の
複数の前記シーケンスの分類手段の使用(F02)を含むことを特徴と
し、
前記方法は、前記分類手段によるインデックス(ind、ind
56
)および少なくとも1つの時間変調ファクタ(lon、lon
5
、lon
6
、lat、lat
56
)の送信(F02)と、送信された前記インデックス(ind、ind
56
)に関連する経路のルックアップテーブル(10)における読取り(F03)と、送信された前記時間変調ファクタ(lon、lon
5
、lon
6
、lat、lat
56
)によって読み取られた前記経路の時間変調(F04)とをさらに含む、方法。
【請求項9】
前
記分類手段のオフライントレーニングフェーズ(P01)を含み、それぞれ同じ操縦に対応する出力変数のシーケンスのセットが第1レベルグルーピングにおいてグループ化される、請求項
8に記載の方法。
【請求項10】
前記オフライントレーニングフェーズ(P01)中に、各第1レベルグルーピングについて、それぞれ、実質的に等しい実装周期および/または実質的に等しい実装距離を有する操縦に対応する変数のシーケンスのセットが、第2レベルグルーピングにおいてグループ化される、請求項
9に記載の方法。
【請求項11】
前
記分類手段が、縦方向の時間変調ファクタ(lon、lon
5、lon
6)および/または横方向の時間変調ファクタ(lat、lat
56)を送信する(F02)、請求項
8から
10のいずれか一項に記載の方法。
【請求項12】
プロセッサまたは電子制御ユニットによって実行されたとき、請求項
8から
11のいずれか一項に記載の方法を実装するように構成されたコードを備える、コンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、自動車のための経路および/または軌道を計画するためのデバイスおよび方法、ならびにそのような方法を実装するためのコンピュータプログラムの分野に関する。
【背景技術】
【0002】
自動車は、現在、性能のレベルを改善する高度運転支援デバイスを装備されている。高度運転支援デバイスは、自動車の自律運転、すなわち、ドライバーによる介入がない運転を可能にするものである。特に、高度運転支援デバイスは、自動車のための経路および/または軌道を計画するために役立ち得る。本出願において、「計画する」という用語およびそれの派生語は、高度運転支援デバイスの分野におけるそれらの語の通常の定義の意味で、すなわち、経路または軌道の計画は、経路または軌道に対応する将来における自動車の状態(位置、速度、加速度)の、ある状態から別の望まれる状態への連続を表すという趣旨で解釈される。本出願において、車両の経路は、出発地点と到着地点との間の車両の進行に対応する幾何学的形態として理解されよう。車両の軌道は、出発地点と到着地点との間の車両の位置の時間経過に伴う変化として理解されよう。
【0003】
自動車の経路および/または軌道を計画するための方法の知られている例は、特に、1次ラグランジュ力学方程式に基づいてモデル化された最適制御問題を解くことによる計画の方法を含む。経路および/または軌道を生成するための方法は、通常、車両の搭乗者の快適さと安全との間の良好な妥協点を見つけるように意図される。
【0004】
軌道を生成するための方法の一例(以下「Werling方法」)は、M. Werling, J. Ziegler, S. KammelおよびS. Thrunによる「Optimal trajectory generation for dynamic street scenarios in a Frenet frame, IEEE International Conference on Robotics and Automation」[1]という論文中に見つけられ得る。Werling方法は、最適制御問題を解くために間接的手法に関する。この手法によれば、入力パラメータのうちのいくつかが選択され、最適制御問題は、選択された入力パラメータのみを考慮に入れることによって部分的に解かれ、解は、選択されていない入力パラメータと選択された入力パラメータとを使用して帰納的に検証される。しかしながら、多数の入力パラメータが考慮に入れられることにより、間接的手法の使用はロバストネスを欠いている。その上、衝突回避の制約が帰納的に検証されることの結果として、多数の経路および/または軌道の計画が衝突の危険のために最終的に拒否されることになり、したがって、多くのリソースが大量の拒否される計算のために使用され得る。
【0005】
軌道計画方法の別の例(以下で「Mercy方法」)は、T. Mercy, W. Van Loock, G. PipeleersおよびJ. Sweversによる「Time‐optimal motion planning in the presence of moving obstacles」[2]という論文に記載されている。この例は、最適制御問題を解くために直接的手法を使用する。その直接的手法によれば、すべての制約が、問題を解く際に検討される。したがって、本発明はWerling方法よりもMercy方法に近い。しかしながら、Mercy方法に関連するアルゴリズムの複雑さにより、自動車に搭載されたデバイス中に組み込むことは不可能である。
【0006】
経路および/または軌道計画方法の他の例は、各障害物が、車両がその障害物に接近することを防ぐ傾向がある抗重力場を生成する、ポテンシャル場方法を含む。しかしながら、そのような方法は、極小値におけるブロッキングの危険を伴い、したがって、経路および/または軌道計画の問題への最良の解を生成することに失敗し得る。
【発明の概要】
【0007】
上記に鑑みて、本発明の目的は、上述の欠点を克服しながら、自動車のための経路および/または軌道が計画されることを可能にすることである。
【0008】
より詳細には、本発明は、計算複雑さを低減しながら、十分にロバストである経路および/または軌道生成の実装を可能にすることを提案する。
【0009】
この目的で、入力変数のシーケンスを受信するためのモジュールと、受信された入力変数のシーケンスに従って、経路および/または軌道に対応する制御法(control law)を決定するためのハードウェアおよびソフトウェア手段とを備える、自動車のための経路および/または軌道を計画するためのデバイスが提案される。
【0010】
本発明の一般的な特性のうちの1つによれば、本デバイスは、コンパクト表現のセット中の時間分類手段を備える。
【0011】
時間分類手段を使用することによって、履歴に基づいて経路および/または軌道を計画することが可能である。そのような手法は、比較的小さい複雑さを有しながら、Mercy方法の場合のように、すべての入力パラメータが考慮に入れられることを可能にする。事実上、時間分類手段を使用する場合、アルゴリズムの設計および調整のために大量の作業が必要とされるが、計画の推論フェーズのために必要とされる作業は少量である。計算リソース要件は、したがって、オンライン推論状況からオフライントレーニングフェーズにシフトされる。
【0012】
本出願において、「制御法」という表現は、経路または軌道に対応する制御法は、シャシーの物理的制約をモデル化しながら、車両に経路または軌道をたどらせるようにアクチュエータを動作させるために必要とされるコマンドのセットを含むという意味で解釈される。
【0013】
「時間分類」という表現は、時間の関数である複数の入力シーケンスを分類する行為を示す。
【0014】
「コンパクト表現のセット」という表現は、コンパクトな状態への変更の動作、すなわち、たとえば、入力シーケンス中の時間の概念の喪失、または入力シーケンスのいくつかのポイントの、それらのメモリフットプリントを低減する目的での削除を受けた入力シーケンスによって形成されるセットを示す。
【0015】
一実施形態によれば、時間分類手段は、可変長の出力変数の異なるシーケンスから構成された出力のセットに向かう、可変長の入力変数の異なるシーケンスから構成された入力のセットの全射を定義するように構成される。
【0016】
そのような特性は、特に、時間分類手段の使用により可能になる。したがって、時間分類手段は、事前定義された長さの入力変数のシーケンスを選択しないが、時間分類手段が満足な解を決定するために十分なデータを有するまで、入力変数を受信し続けるので、シーケンスの長さが増加する。入力のセットと出力のセットとの間の全射は、記憶された軌道の異なるクラスに対応する、出力軌道のセットへの入力軌道のセットの全射適用である。たとえば、その適用は、使用されるシステムが、学習中に見られない軌道に対して内挿または外挿を行うことも可能である、グルーピングに属し得る。本出願において、シーケンスの長さは、時間的である、すなわち、シーケンスのサンプリング周期に対応するか、またはメトリックである、すなわち、シーケンスのサンプリング距離に対応し得る。同様に、時間分類手段は、それの出力において、任意の長さを取り得る変数のシーケンスを生成する。
【0017】
好ましくは、入力のセットは時間入力変数のシーケンスおよび/またはメトリック入力変数のシーケンスを備える。
【0018】
そのような変形態によれば、軌道の様々なクラスが、時間分類を介して、ただし、可能なケースのより良い表現のために異なる長さの軌道とともに、入力のセット中のメモリに記憶される。
【0019】
有利には、入力のセットは、センサーから取得された未加工変数のシーケンスと、車両の外部環境のマージされた表現のための変数のシーケンスと、車両の内部パラメータの表現のための変数のシーケンスと、エージェントの挙動の表現のための変数のシーケンスと、エージェントの意図の表現のための変数のシーケンスとの中から選定された、入力変数の少なくとも1つのシーケンスを備える。
【0020】
本出願において、「表現」という用語は、イベント、パラメータ、状態などを表すデータのセットを意味するように取られる。「マージされた表現」は、異なるセンサーおよび/または推定器から取得されるデータをマージすることから取得されるデータのセットである。
【0021】
一実施形態では、出力のセットは時間出力変数のシーケンスおよび/またはメトリック出力変数のシーケンスを備える。
【0022】
好ましくは、出力のセットは、ルートポイントの座標のペアのシーケンスと、ルートポイントの横座標のシーケンスと、ルートポイントの縦座標のシーケンスとの中から選定された少なくとも1つの出力シーケンスを備える。
【0023】
別の実施形態では、時間分類手段は、コネクショニスト時間分類機能を使用するように構成される。
【0024】
時間分類機能は、隠れマルコフ場、RNN-LSTM、RNN-LSTM-CTC(コネクショニスト)など、様々なタイプのものであり得る。そのような機能を使用することによって、時間分類手段の効果的なトレーニングを実装することが可能である。
【0025】
また別の実施形態によれば、時間分類手段は、隠れマルコフ連鎖モデルおよび/または再帰型ニューラルネットワーク、好ましくは、短期および長期記憶をもつ再帰型ニューラルネットワークを備える。
【0026】
そのような例は、オフライントレーニングフェーズ中に容易にトレーニングされ得るので、時間分類手段を形成するために特に好適である。
【0027】
別の態様によれば、入力変数のシーケンスを受信することと、入力変数のシーケンスに基づいて、自動車の経路および/または軌道に対応する制御法を決定することとを含む、自動車のための経路および/または軌道を計画するための方法が提案される。
【0028】
本態様の一般的な特性のうちの1つによれば、この方法は、コンパクト表現のセット中の時間分類手段を使用することを含む。
【0029】
一実施形態によれば、本方法は、それぞれ同じ操縦に対応する出力変数のシーケンスのセットが第1レベルグルーピングにおいてグループ化される、時間分類手段のオフライントレーニングフェーズを含む。
【0030】
そのようなグルーピングは、推論フェーズ中の時間分類手段の正しい動作の目的のために、時間分類手段を作成するために特に好適である。
【0031】
本出願において、「オフライン」という表現は、オフラインフェーズが、車両が制御法によって制御される周期外に、たとえば、車両が動いていないときに行われることを意味するように取られる。
【0032】
一実施形態によれば、オフライントレーニングフェーズ中に、各第1レベルグルーピングについて、それぞれ、実質的に等しい実装周期および/または実質的に等しい実装距離を有する操縦に対応する変数のシーケンスのセットが、第2レベルグルーピングにおいてグループ化される。
【0033】
したがって、時間分類手段の調整は、それによって計算複雑さを増加させることなしに、計画のロバストネスを増加させるように一層改良される。
【0034】
一実施形態では、本方法は、時間分類手段によるインデックスおよび少なくとも1つの時間変調ファクタの送信と、送信されたインデックスに関連する経路のルックアップテーブルにおける読取りと、送信された時間変調ファクタによって読み取られた経路の時間変調とを含む。
【0035】
したがって、本発明による方法は、特に、パラメータになる、時間に対する自由度をもつ、いくつかの経路パターンを記憶することにある。これにより、計算複雑さを一層制限することが可能になる。
【0036】
有利には、時間分類手段は縦方向の時間変調ファクタおよび/または横方向の時間変調ファクタを送信する。
【0037】
また別の態様によれば、プロセッサまたは電子制御ユニットによって実行されたとき、上記で定義された方法を実装するように構成されたコードを備える、コンピュータプログラムが提案される。
【0038】
本発明の他の目的、特性および利点は、単に非限定的な例として、添付の図を参照しながら与えられる、下の説明を熟読することから明らかになろう。
【図面の簡単な説明】
【0039】
【
図1】本発明の一実施形態による計画デバイスの概略表現を示す図である。
【
図2】本発明の一実施形態による計画方法の概略表現を示す図である。
【
図3】
図2の方法の第1のフェーズを示す図である。
【
図4】
図2の方法の第2のフェーズを示す図である。
【
図5】車両の2つの運転状況のうちの1つにおける経路の選定を概略的に示す図である。
【
図6】車両の2つの運転状況のうちの1つにおける経路の選定を概略的に示す図である。
【発明を実施するための形態】
【0040】
図1を参照すると、計画デバイス2が概略的に表されている。デバイス2は、それがその中に組み込まれた自動車4のための経路を計画するように意図される。明らかに、本発明の範囲から逸脱することなく、車両4の軌道を計画するためのデバイス2の構成を想定することが可能である。図示の例では、車両4は自律的に運転される。本発明の範囲から逸脱することなく、自律的に運転されない、すなわち、ドライバーによって運転される、デバイス2を組み込んだ車両を想定することが可能である。この場合、デバイス2は、たとえば危険の状況においてのみ、ドライバーに支援を与えることが意図される。
【0041】
図示の例では、デバイス2は自律運転アーキテクチャ(図示せず)の一部を形成する。より詳細には、デバイス2は、自律運転アーキテクチャに属する、予測モジュール(図示せず)と、センサーマージングモジュール(図示せず)と、ロケーションモジュール(図示せず)とデータリンクされる。
【0042】
デバイス2は、自律運転アーキテクチャの他のモジュールと車両のオンボードコンピュータとデータリンクされた、受信モジュール6を備える。より正確には、モジュール6は、入力変数の複数のシーケンスを受信することが可能である。シーケンスは、変数によって取られる値のセットである。時間シーケンスは、複数の異なる時点において変数によって取られる値のセットである。メトリックシーケンスは、複数の異なる位置において変数によって取られる値のセットである。図示の例では、シーケンスは、時間的であり、40msの間隔によって分離された複数の時点において取られた変数の値から構成される。
【0043】
図示の例では、モジュール6は入力ベクトルのシーケンスを受信し、入力ベクトルのスカラーは、内部制約および外部制約であり得る入力変数である。内部制約は、特に、車両4における乗員の快適さと安全とに関係し、ドライバーの意図、将来の操縦の予測、車両4の速度、または乗員による車両4の運転モードの入力を含む。外部制約は、特に、環境条件と交通とに関係し、他の車両の位置、速度および加速度、道路の曲率、気象条件、路面のタイプ、昼間もしくは夜間条件、または視界に関する情報を含む。
【0044】
デバイス2は、一般的に、英語用語「Recurrent Neural Network」または対応する頭字語「RNN」によって指定される、再帰型ニューラルネットワーク8を備える。再帰型ニューラルネットワークの例について述べている『Robot Intelligence Technology and Applications』という雑誌におけるY.-M. LeeおよびJ.-H. Kimによる「Trajectory Generation Using RNN with Context Information for Mobile Robots」[3]という文献が参照され得る。再帰型ニューラルネットワーク8は受信モジュール6とデータリンクされる。
【0045】
図示の例では、再帰型ニューラルネットワーク8は長短期記憶タイプのものである。この特性は、一般的に、英語の用語「Long Short Term Memory」または対応する頭字語「LSTM」によって指定される。
【0046】
再帰型ニューラルネットワーク8は、コネクショニスト時間分類機能を使用するように構成される。そのような機能は、一般的に、英語用語「Connectionist Temporal Classification」または対応する頭字語「CTC」によって指定される。したがって、再帰型ニューラルネットワーク8はデバイス2のための時間分類手段を形成する。さらに、再帰型ニューラルネットワークの使用により、可変長の入力変数のシーケンスを収集することによって、可変長の出力変数のシーケンスを生成することが可能になる。
【0047】
再帰型ニューラルネットワーク8は、受信モジュール6によって受信された入力変数に基づいて、インデックスind、縦方向変調ファクタlonおよび横方向変調ファクタlatを決定し、送信するように構成される。より詳細には、変数ind、lonおよびlatは、安全度を保証し、障害物を回避し、操縦の最大長を順守しながら、操縦中に車両4が受ける横方向ジャークの和を最小にするように決定される。
【0048】
明らかに、本発明は再帰型ニューラルネットワーク8の使用に限定されない。特に、英語用語「Hidden Markov Model」または対応する頭字語「HMM」によっても知られている、隠れマルコフモデルを使用することが可能である。
【0049】
デバイス2はルックアップテーブル10を有する。テーブル10は、英語名「Look-Up Table」または対応する頭字語「LUT」によって指定され得る。テーブル10は再帰型ニューラルネットワーク8とデータリンクされる。テーブル10は、インデックスindに基づいた複数の経路形状を含んでいる。テーブル10中に記憶された経路形状は車両4のための可能な経路に対応する。
【0050】
デバイス2は時間変調器12を備える。変調器12は、再帰型ニューラルネットワーク8とテーブル10とデータリンクされる。より正確には、変調器12は、それぞれ、再帰型ニューラルネットワーク8によって供給された縦方向および横方向変調ファクタに基づいて、テーブル10によって供給された経路を形成するポイントの縦方向および横方向位置を、時間に関して、変調を行うことが可能である。言い換えれば、変調器12は、テーブル10によって供給された経路を拡大または縮小することが可能である。変調器12によって拡大または縮小された経路は、ルートポイントの時間シーケンスを決定する速度プロファイルに関連付けられる。この時間シーケンスは車両4の制御法デバイス(図示せず)に供給される。
【0051】
図2を参照すると、このことは、デバイス2によって実装され得る、自動車4のための経路を計画するための方法の主要なフェーズを示す。
【0052】
本方法は、再帰型ニューラルネットワーク8をトレーニングする第1のフェーズP01を含む。フェーズP01は、車両4の搭載コンピュータ(図示せず)がオフラインであるとき、すなわち、車両4の納入前、車両4のサービス中、または車両4の長期駐車中に実装される。
【0053】
図3を参照すると、フェーズP01は、実際のドライバー挙動を記録する第1のステップE01を含む。たとえば、車両4と同じモデルの車両上のテストドライバーの挙動が記録され得る。挙動と同時に、操縦のタイプが認識され、記録され得る。たとえば、同じ車線または異なる車線であり得る、交通車線の中央に到達するために交通車線の中央を離れる行為が認識され、記録され得る。
【0054】
フェーズP01は、記録されたデータを操縦のタイプによってグループ化する第2のステップE02を含む。より正確には、ステップE02において、それぞれ、ステップE01において記録されたそれぞれの操縦に対応する、第1のレベルにおける複数のグループが作成される。たとえば、ステップE01中に、それぞれ、交通車線を変更する操縦と、同じ交通車線中において再センタリングする操縦と、緊急制動操縦と、車両の緊急事態回避操縦とについて、データが記録された場合、4つの第1レベルグループがそれぞれ上述の4つの操縦に関連付けられる。
【0055】
本方法は、記録されたデータを操縦の長さによってグループ化する第3のステップE03を含む。ステップE03において、それぞれ、ステップE01において記録された操縦のそれぞれの長さに対応する、第2のレベルにおける複数のグループが各第1レベルグループ中に作成される。たとえば、それぞれ、20メートル(+/-10%)の距離にわたる緊急制動操縦と、30メートル(+/-10%)の距離にわたる緊急制動操縦と、50メートル(+/-10%)の距離にわたる緊急制動操縦とについて、データが記録された場合、緊急制動操縦に関連付けられた第1レベルグループは、それぞれ、操縦の上述の3つの長さに関連付けられた3つの第2レベルグループに再分割される。
【0056】
フェーズP01は、テーブル10を強化する第4のステップE04を含む。ステップE04において、ステップE01において受信された軌道が、テーブル10中に記憶された軌道を改良するために使用される。
【0057】
フェーズP01は、ステップE02およびE03において定義された異なるグループに関連付けられた特有の特性を分離するステップE05を含む。特に、ステップE05において、特有の特性は以下のとおりであり得る:
車両4に関する状態情報、周囲の物体に関する状態情報、各近隣車両について、その近隣車両の位置、速度および加速度、ならびにその近隣車両の周りのフリースペースまたはリスクフリースペースを、交通車線の境界線と一緒に表すマップなど、モジュールをマージすることから取得された情報、
路面、天気予報、昼間もしくは夜間条件、または視界情報など、コンテキストに関係する情報、
運転モードの選択など、車両4に関係する情報、
インジケータの実際の動作またはシミュレートされた動作、方位角の急激な変化、(緊急制動の意図が検出されるように)急ブレーキなど、意図に関する情報。
【0058】
フェーズP01は、時間分類手段を定義するステップE06を含む。この場合、CTC機能を使用するRNN-LSTMタイプの再帰型ニューラルネットワーク8がステップE06において定義される。
【0059】
フェーズP01は、再帰型ニューラルネットワーク8をトレーニングするステップE07を含む。ステップE07は、ステップE05において分離された特有の特性のセットを入力として使用することによって、ならびにステップE01、E02およびE03において記録され、グループ化された可能な軌道を出力として使用することによって実装される。
【0060】
本発明は、示された例を参照しながら上記で説明したステップに限定されない。特に、ステップE02およびE03において実装されるグルーピング技法を使用する代わりに、競合学習ストラテジーが使用され得る。使用され得る他の変形態は、C. Sung, D. FeldmanおよびD. Rus.による「Trajectory clustering for motion prediction, International Conference on Intelligent Robots and Systems」[4]という刊行物に記載されている。
【0061】
図2を参照すると、本方法は推論の第2のフェーズP02を含む。フェーズP02はオンラインで実行される。すなわち、フェーズP02は、車両4が走行しているときに常時実装される。フェーズP01は上記で示され、フェーズP02の前に説明されているが、フェーズP01はフェーズP02の後および/または前にあり得る。
【0062】
図4を参照すると、フェーズP02は、入力変数のシーケンスを受信する第1のステップF01を含む。受信された入力変数のシーケンスはn個のベクトルから構成され、各ベクトルは、iが1からnまでの範囲中にある、時点t
iにおいてモジュール10によって受信された異なる入力変数から構成される。数nの値は、入力変数のシーケンスの長さが、関連がある値ind、lonおよびlatを決定するのに十分であるように選定される。入力変数は、フェーズP01のステップE05において分離された特有の特性と実質的に同じ特有の特性であり、一般に、ロードホールディングおよび視界条件など、センサーマージングモジュールから取得されたデータ、およびいくつかの特定のセンサーからの他の情報、または挙動計画者からの意図に関する情報である。実装のこの例では、受信されたシーケンスは時間的である。別のタイプのシーケンス、特にメトリックシーケンスが、本発明の範囲から逸脱することなく想定され得る。
【0063】
フェーズP02は、再帰型ニューラルネットワーク8中に入力変数のシーケンスを入力する第2のステップF02を含む。ステップF02において、受信モジュール8によって供給された、インデックスind、縦方向変調ファクタlonおよび横方向変調ファクタlatが収集される。
【0064】
フェーズP02は、テーブル10中にインデックスindを入力する第3のステップF03を含む。ステップF03において、テーブル10によって供給される経路形状が収集される。
【0065】
フェーズP02は、ステップF03において収集された経路形状を時間変調する第4のステップを含む。ステップF04において、ステップF03において収集された経路形状の、ファクタlonに対する縦方向の拡大または縮小が実行され、ステップF03において収集された経路形状の、ファクタlatに対する横方向の拡大または縮小が実行される。
【0066】
フェーズP02は、衝突回避のために検査を行うステップF05を含む。ステップF05において、ステップF04の終わりに取得された変調された経路が、車両4と別の物体との衝突の危険を伴わないかことが検査される。別の物体との衝突の危険がある場合、フェーズP02が異なる経路の選択とともに反復されるように、エラー信号が送信される。
【0067】
図5および
図6は、車両4のためにデバイス2によって計画され得る経路の例を示す。
図5は車両4の第1の運転状況を示し、
図6は車両4の第2の運転状況を示す。
【0068】
図5および
図6は、第1の境界線16と、第2の境界線18と、第3の境界線20とによって横方向に画定された複数の交通車線を備える道路14を概略的に示す。線16と線18との間に位置する車線のセンターライン22、および線18と線20との間に位置する車線のセンターライン24も概略的に示されている。2つの運転状況において、経路は、車両4が交通車線を変更することを可能にするように計画される。横方向速度は初期状態および最終状態において0である。縦方向速度は初期状態および最終状態について同じである。
【0069】
図5を参照すると、円の連続によって概略的に表された経路26が、再帰型ニューラルネットワーク8による対応するインデックスind
56の送信の後に、テーブル10によって供給される。経路26は、本発明による方法のステップF03において収集された経路形状に対応する。再帰型ニューラルネットワーク8は、操縦全体にわたる横方向ジャークの和を最小にするように選定されたファクタlon
5を供給する。
図5および
図6の例では、再帰型ニューラルネットワークによって供給されるファクタlat
56は1に等しい。×印の連続によって概略的に表された経路28は、再帰型ニューラルネットワーク8によって送信されたファクタlon
5の影響の下で変調器12によって縦方向に拡大された経路に対応する。経路28は、本発明による方法のステップF04の終わりに取得された変調された経路に対応する。これらの条件では、車両4は経路28をたどる。
【0070】
図6を参照すると、第1の障害物28および第2の障害物30が道路14上に配置されている。再帰型ニューラルネットワーク8によって供給されるインデックスind
56は
図5の場合と同じである。したがって、
図5の経路26はここでも見られる。しかしながら、再帰型ニューラルネットワーク8は、障害物28および30の存在を考慮に入れ、障害物28および30を回避することを可能にするためにファクタlon
6を送信する。×印の連続によって概略的に表された経路32は、ファクタlon
6の影響の下で変調器12によって縦方向に縮小された経路に対応する。経路32は、したがって、ステップF04の終わりに取得された変調された経路に対応し、この動作モードにおいて車両4がたどる経路になる。
【0071】
上記に鑑みて、本発明は、推論フェーズにおいて計算リソースをほとんど使用することなく、考慮に入れられ得るすべての内部制約と外部制約とを斟酌しながら、最適な経路および/または軌道を与えることを可能にする。特に、時間分類手段を使用することによって、計算リソースのための要件がオフライントレーニングフェーズに移されるので、計画の複雑さを制限しながら、ロバストな計画を取得することが可能になる。
【0072】
引用された刊行物のリスト:
[1] Moritz Werling, Julius Ziegler, Soren Kammel et al. Optimal trajectory generation for dynamic street scenarios in a frenet frame. In: Robotics and Automation (ICRA), 2010 IEEE International Conference on. IEEE, 2010. pp. 987-993 (ISBN 978-1-4244-5040-4).
[2] Tim Mercy, Wannes Van Loock, Goele Pipeleers, et al. Time-optimal motion planning in the presence of moving obstacles. 2015.
[3] You-Min Lee and Jong-Hwan Kim. Trajectory Generation Using RNN with Context Information for Mobile Robots. In: Robot Intelligence Technology and Applications 4. Springer, Cham, 2017. pp. 21-29 (ISBN: 978-3-319-31291-0).
[4] Cynthia Sung, Dan Feldman, and Daniela Rus. Trajectory clustering for motion prediction. In: Intelligent Robots and Systems (IROS), 2012 IEEE/RSJ International Conference on. IEEE, 2012. pp. 1547-1552.