(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-12-13
(54)【発明の名称】少なくとも部分的に自動化されて走行する車両のための運転操作の選択
(51)【国際特許分類】
G08G 1/16 20060101AFI20231206BHJP
【FI】
G08G1/16 C
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023533896
(86)(22)【出願日】2021-11-30
(85)【翻訳文提出日】2023-06-02
(86)【国際出願番号】 EP2021083637
(87)【国際公開番号】W WO2022117586
(87)【国際公開日】2022-06-09
(31)【優先権主張番号】102020215324.8
(32)【優先日】2020-12-03
(33)【優先権主張国・地域又は機関】DE
(81)【指定国・地域】
(71)【出願人】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100134315
【氏名又は名称】永島 秀郎
(74)【代理人】
【識別番号】100162880
【氏名又は名称】上島 類
(72)【発明者】
【氏名】フェリックス シュミット
(72)【発明者】
【氏名】マーティン シュトル
(72)【発明者】
【氏名】ヨハネス ゴス
(72)【発明者】
【氏名】ホルガー アンドレアス バンツハーフ
(72)【発明者】
【氏名】ヨハネス マクシミリアン デリンガー
(72)【発明者】
【氏名】ミハエル ハンゼルマン
【テーマコード(参考)】
5H181
【Fターム(参考)】
5H181AA01
5H181BB20
5H181CC03
5H181CC04
5H181CC11
5H181CC12
5H181CC14
5H181EE02
5H181LL01
5H181LL02
5H181LL04
5H181LL09
(57)【要約】
少なくとも部分的に自動化されて走行する車両(50)により実行すべき運転操作(4)を選択するための方法(100)であって、当該方法は、車両に搭載された少なくとも1つのセンサ(51)の測定データ(51a)を利用して、車両(50)が置かれている状況(60)の表現(61)を作成するステップ(110)と、状況(60)の表現(61)を、トレーニング済み機械学習モデル(1)により確率分布(2)にマッピングするステップ(120)であって、確率分布(2)は、使用可能な運転操作(3a~3f)の予め定められたカタログに属する運転操作(3a~3f)各々について、この運転操作(3a~3f)が実行される確率(2a~2f)を表す、ステップ(120)と、確率分布(2,2’)から、実行すべき運転操作(4)として1つの運転操作(3a~3f)を導出するステップ(150)と、付加的に、車両(50)が置かれている状況(60)の少なくとも1つの局面(62)を利用して、この状況(60)において許容されない運転操作(3a*~3f*)の部分集合を求めるステップ(130,160)と、許容されないこれらの運転操作(3a*~3f*)の実行を抑制するステップ(140,170)と、を含む。
【特許請求の範囲】
【請求項1】
少なくとも部分的に自動化されて走行する車両(50)により実行すべき運転操作(4)を選択するための方法(100)であって、
・前記車両に搭載された少なくとも1つのセンサ(51)の測定データ(51a)を利用して、前記車両(50)が置かれている状況(60)の表現(61)を作成するステップ(110)と、
・前記状況(60)の前記表現(61)を、トレーニング済み機械学習モデル(1)により確率分布(2)にマッピングするステップ(120)であって、前記確率分布(2)は、使用可能な運転操作(3a~3f)の予め定められたカタログに属する運転操作(3a~3f)各々について、当該運転操作(3a~3f)が実行される確率(2a~2f)を表す、ステップ(120)と、
・前記確率分布(2,2’)から、実行すべき運転操作(4)として1つの運転操作(3a~3f)を導出するステップ(150)と、
・付加的に、前記車両(50)が置かれている前記状況(60)の少なくとも1つの局面(62)を利用して、前記状況(60)において許容されない運転操作(3a
*~3f
*)の部分集合を求めるステップ(130,160)と、
・前記許容されない運転操作(3a
*~3f
*)の実行を抑制するステップ(140,170)と、
を含む方法(100)。
【請求項2】
前記確率分布(2)において、少なくとも1つの許容されない運転操作(3a
*~3f
*)が実行される確率(2a~2f)をゼロにセットする(141)ことによって、変更された確率分布(2’)を生成するようにして、前記許容されない運転操作(3a
*~3f
*)の実行を抑制する、請求項1に記載の方法(100)。
【請求項3】
少なくとも1つの確率(2a~2f)をゼロにセットした後、まだゼロとは異なる運転操作(3a~3f)の確率(2a~2f)が合計して1となるように、前記確率分布(2)を正規化する(142)ことによって、変更された確率分布(2’)を生成する、請求項2に記載の方法(100)。
【請求項4】
少なくとも1つの許容されない運転操作(3a
*~3f
*)の実行を、当該許容されない運転操作(3a
*~3f
*)が前記確率分布(2)から導出されたことに応答して、新たな運転操作(3a~3f)を前記確率分布(2)から導出するようにして、抑制する(171)、請求項1乃至3のいずれか一項に記載の方法(100)。
【請求項5】
少なくとも1つの許容されない運転操作(3a
*~3f
*)を、前記車両(50)の現在のポジションに基づき、空間分解されたディジタルマップから呼び出される情報に基づいて求める(131,161)、請求項1乃至4のいずれか一項に記載の方法(100)。
【請求項6】
少なくとも1つの許容されない運転操作(3a
*~3f
*)は、
・車道からの逸脱、及び/又は、
・一般的な交通ルールの違反、及び/又は、
・自動化された走行動作のための特定の機構の損傷、及び/又は、
・自車両(50)と他車両又はその他の物体との衝突
に対するリスクを成す運転操作である、請求項1乃至5のいずれか一項に記載の方法(100)。
【請求項7】
前記許容されない運転操作(3a
*~3f
*)は、
・車道からの逸脱に至る車線変更、及び/又は、
・現在到達不可能な車線への車線変更、及び/又は、
・交通ルールによって禁止される加速操作及び/又は追い越し操作、及び/又は、
・現在自車両(50)後方に位置する他車両後方での追従走行
を含む、請求項1乃至6のいずれか一項に記載の方法(100)。
【請求項8】
機械学習モデル(1)をトレーニングするための方法(200)であって、前記機械学習モデル(1)は、車両(50)が置かれた状況(60)の表現(61)を確率分布(2)にマッピングし、前記確率分布(2)は、使用可能な運転操作(3a~3f)の予め定められたカタログに属する運転操作(3a~3f)各々について、当該運転操作(3a~3f)が実行される確率(2a~2f)を表す、方法(200)において、
・状況(60)の学習表現(61a)と、前記学習表現(61a)を前記機械学習モデル(1)がマッピングする対象となる対応する目標確率分布(2a)とを準備するステップ(210)と、
・前記学習表現(61a)を前記機械学習モデル(1)に供給し、前記機械学習モデル(1)によって確率分布(2)にマッピングするステップ(220)と、
・前記確率分布(2)と個々の前記目標確率分布(2a)との一致を、予め定められたコスト関数(5)に基づき評価するステップ(230)と、
・学習表現(61a)をさらに処理することによって前記コスト関数(5)による評価(230a)が高められるようにする目的で、前記機械学習モデル(1)の挙動を特徴づけるパラメータ(1a)を最適化するステップ(240)と、
・前記学習表現(61a)により特徴づけられた前記状況(60)において許容されない少なくとも1つの運転操作(3a
*~3f
*)に関して、当該運転操作(3a
*~3f
*)に割り当てられた前記確率(2a~2f)の上昇が、前記コスト関数(5)による評価(230a)を高めることになる可能性を抑制するステップと、
を含む方法(200)。
【請求項9】
前記許容されない運転操作(3a
*~3f
*)に割り当てられた前記確率(2a~2f)の上昇により元のコスト関数(5)に関連して獲得されるであろう利得を吸い上げ及び/又は過剰補償するペナルティ項によって、前記コスト関数(5)を拡張する(231)、請求項8に記載の方法(200)。
【請求項10】
前記機械学習モデル(1)から供給された、前記許容されない運転操作(3a
*~3f
*)に割り当てられた確率(2a~2f)を、前記コスト関数(5)による評価の前にゼロにセットする(221)、請求項8又は9に記載の方法(200)。
【請求項11】
予め定められた閾値を下回る確率(2a~2f)がゼロに低下させられるように、前記確率分布(2)を正則化及び/又は離散化する(222)、請求項8乃至10のいずれか一項に記載の方法(200)。
【請求項12】
コンピュータプログラムであって、当該コンピュータプログラムは、1つ又は複数のコンピュータ上において実行されるときに、請求項1乃至11のいずれか一項に記載の方法(100,200)を前記1つ又は複数のコンピュータに実施させるための機械可読命令を含む、コンピュータプログラム。
【請求項13】
請求項12に記載のコンピュータプログラムを備える機械可読データ担体及び/又はダウンロード製品。
【請求項14】
請求項12に記載のコンピュータプログラム及び/又は請求項13に記載の機械可読データ担体及び/又はダウンロード製品を備えるコンピュータ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、少なくとも部分的に自動化されて走行する車両のための、状況に応じた運転操作プラニングに関する。
【背景技術】
【0002】
背景技術
少なくとも部分的に自動化されて走行する車両は、比較的間近な今後の運転操作プラニングを自身が置かれている状況の変化に適応させる目的で、この状況を継続的に捕捉する。車両が反応しなければならない状況の変化は、たとえば、異なる所与の状態を伴う別の場所に車両が移動することによって引き起こされる可能性がある。ただし、たとえば、他の道路利用者のような他の物体の動きも、状況を大きく変化させる可能性があり、それにより反応が必要になる場合がある。独国特許出願公開第102018210280号明細書には、他の物体の軌跡を予測することができ、それによって、自車両の軌跡を相応に適応させることができるようにした方法が開示されている。
【0003】
運転操作プラニングのためのいくつかの方法は、車両が置かれている状況の表現を作成し、この表現を、トレーニング済み機械学習モデルによって、基本的に使用可能な運転操作の確率を表す確率分布にマッピングする。この確率分布から、実行すべき運転操作として1つの運転操作が導出され、車両のアクチュエータ装置の動作が相応に制御される。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】独国特許出願公開第102018210280号明細書
【発明の概要】
【課題を解決するための手段】
【0005】
発明の開示
本発明の枠内において、少なくとも部分的に自動化された車両により実行すべき運転操作を選択するための方法が開発された。本方法は、車両に搭載された少なくとも1つのセンサの測定データを利用して、車両が置かれている状況の表現が作成されることから開始する。状況のこの表現は、トレーニング済み機械学習モデルによって確率分布にマッピングされる。表現は、特に、たとえば、任意の形態及び手法により作成された、状況の包括的な表現とすることができる。
【0006】
測定データは、特に、たとえば、画像データ、ビデオデータ、レーダデータ、LIDARデータ及び/又は超音波データとすることができる。
【0007】
機械学習モデルとは、特に、優れた一般化能力を有する、適応化可能なパラメータを用いてパラメータ化される関数を具現化するモデルであるとみなされる。機械学習モデルをトレーニングする際に、パラメータは、特に以下のように、適応させることができる。即ち、学習表現をモデルに入力したときに、それらの学習入力に対応する予め既知である目標出力が、可能な限り良好に再現されるように、適応させる。機械学習モデルは、特に、人工ニューラルネットワークKNNを含み得るものであり、及び/又は、機械学習モデルは、人工ニューラルネットワークKNNとすることができる。
【0008】
確率分布は、使用可能な運転操作の予め定められたカタログに属する運転操作各々について、その運転操作が実行される確率を表す。確率分布から、実行すべき運転操作として1つの運転操作が導出される。
【0009】
付加的に、車両が置かれている状況の少なくとも1つの局面を利用して、この状況において許容されない運転操作の部分集合が求められる。許容されないこれらの運転操作の実行が抑制される。
【0010】
機械学習モデルのトレーニングは、個々の状況において、より目的に適った運転操作を、あまり目的に適っていない運転操作から切り離すように調整されている。従って、許容されない運転操作の大半は、既に、機械学習モデルによってあまり目的に適っていないとみなされる。最終的に実行すべき運転操作を確率分布から導出することにより、表現を厳密に1つの運転操作に直接マッピングすることに比較して、より現実的な、特に他の道路利用者をあまり驚かせない走行挙動が、機械学習モデルによってもたらされる。ただし、許容されない運転操作にも、確率分布においてゼロとは異なる確率が割り当てられることを回避することはできない。このことが意味することは、許容されない運転操作が所定の確率で実際には選択及び実行される、ということである。この確率は、自動化された走行動作のために指定された許容可能な残存リスクよりも高い可能性がある。
【0011】
さらに、1つの特定の状況において1つの具体的な運転操作が許容されないようにする境界条件は、比較的複雑であり、及び/又は、機械学習モデルのトレーニングに取り入れることが適当ではないような特性である可能性がある。機械学習モデルの強みはまさに、限定された量のトレーニング状況から、不特定の多数の状況へと一般化する能力にある。しかしながら、たとえば、自動化された走行動作のために決められた条件によって、特定の速度範囲内においてしか特定の運転操作を実行してはならないこと、又は、接近する対向交通まで規定された最小距離があるときにしか追い越し操作を開始してはならないことが規定されている場合には、上述の一般化能力は、最適な手段ではない。むしろ、この種の境界条件は、機械学習モデルを介して回り道することなく実施する方が有利である。
【0012】
従って、許容されない運転操作の抑制は、特に機械学習モデルから完全に切り離して行うことができる。このことが意味することは、個々の運転操作の許否とはまずは切り離して、機械学習モデルをトレーニングすることができ、後になって初めて許否が実施される、ということである。かくして、許否に関する規定を後から変更しても、機械学習モデルのトレーニングにはもはや影響が及ぼされない。即ち、このような変更は、トレーニングを完全に又は部分的に繰り返す必要なく、何度も行うことができる。トレーニングの適応化のためには、通常、特定の新しい状況の表現が記録されるテスト走行をやり終えなければならない。次いで、それらの表現に対し、個々の状況において望まれる運転操作を手動でラベリングしなければならない。
【0013】
たとえば、運転操作が許容される速度範囲を適応させるためには、このような手間は不要である。特に、激しく渋滞した高速道路区間においては路肩を車線として解放するといった新たなルールも、通常は許容されないものとして拒否される路肩への車線変更を、相応に解放されたときに許容されるものとして宣言するようにして、簡単に実装することができる。
【0014】
特に有利な実施形態において、少なくとも1つの許容されない運転操作が実行される確率が確率分布においてゼロにセットされるようにして、この運転操作の実行が抑制される。これによって、変更された確率分布が生成される。このようにして、以下のことが保証される。即ち、確率分布から導出する際に、許容される運転操作だけを選択することができ、これと同時に使用することができる結果がない場合には、導出は、そのままでは維持されない。従って、許容されない運転操作が導出されたケースについて、個別の「エラー処理」は、必要とされない。
【0015】
特にたとえば、少なくとも1つの確率がゼロにセットされた後、まだゼロとは異なる運転操作の確率が合計して1になるように、確率分布は、正規化することができる。これによっても、変更された確率分布が生成される。即ち、許容されないものとして破棄された運転操作は、選択されるという自身の以前の確率を放棄し、その確率を持ち分に応じて、許容されるものとして残存した運転操作に配分する。このことは、1つの住居又は勤め口について複数の応募者のうちの1人が不合格判定基準で失敗すると、その応募者のこれまでのチャンスが残余の応募者に再配分される、ということといくらか類似している。即ち、この1人の応募者が失敗しても、確実に(確率1で)住居又は勤め口が誰かに与えられることになるということは、変わらない。
【0016】
確率分布を後から変更することに代えて又はこれとの組合せにおいても、少なくとも1つの許容されない運転操作の実行は、この許容されない運転操作が確率分布から導出されたことに応答して、新たな運転操作が確率分布から導出されるようにして、抑制することができる。確率分布は、許容される運転操作により高い確率を割り当てるので、新たな導出にあたり許容される運転操作が選択されることを予期することができるが、保証されてはいない。場合によっては、許容される運転操作が結果として得られるまで、新たな導出を繰り返す必要がある。
【0017】
導出を反復することの利点は、許容されない運転操作が最初に選択された状況を捕捉して評価することができる、ということにある。このような状況が度重なる場合には、このことを、機械学習モデルが状況をもはや適切には捕捉せず、そのトレーニングを相応に適応させなければならない、ということの指標とすることができる。これについて考えられる1つの原因は、機械学習モデルのトレーニング後に道路交通に関する新たなルールが導入されたことである可能性がある。
【0018】
たとえば、環境ゾーンのために新たに導入された交通標識は、速度30ゾーンの開始を知らせる交通標識に概ね基づいている。ここでは赤い円の中の「30」という数字が「環境」という単語に置き換えられたにすぎない。機械学習モデルが「速度30ゾーン」の標識だけしか識別しなければ、人間の運転者の場合にはどうしても望まれる再認知度が問題となる可能性がある。たとえば、80km/hが許可されている高速道路が環境ゾーン内に通じている場合には、機械学習モデルは、30km/hの速度制限と識別し、それに応じて、急ブレーキを目的に適った運転操作として推奨する可能性がある。このようにして生じた急ブレーキが、自動化された走行動作のために許容された最大減速度を上回った場合には、ブレーキは、許容されないものとして破棄され、実行されない。このようにして、走行動作中に何度も同様の運転操作が同様の場所において許容されないものとして破棄されたことが捕捉された場合には、車両ユーザは、何か根本的なことが正常に機能しておらず、機械学習モデルが更新を必要としている、というフィードバックを受け取る。
【0019】
さらに他の特に有利な実施形態において、少なくとも1つの許容されない運転操作が、車両の現在のポジションに基づき、空間分解されたディジタルマップから呼び出される情報に基づいて求められる。ディジタルマップには、特にたとえば、道路の推移、走行方向ごとに設けられている車線の数、速度制限、追い越し禁止及びその他の交通ルールを記録することができる。たとえば、現在の車線の左側若しくは右側に別の車線が隣接していないこと、又は、走行可能な領域がそもそも隣接していないことが、マップに従って判明した場合には、左側又は右側への車線変更は、許容されないものとして評価することができる。
【0020】
従って、許容されない走行操作は、特にたとえば、以下のこと、即ち、
・車道からの逸脱、及び/又は、
・一般的な交通ルールの違反、及び/又は、
・自動化された走行動作のための特定の機構の損傷、及び/又は、
・自車両と他車両又はその他の物体との衝突
に対するリスクを成す運転操作とすることができる。
【0021】
よって、許容されない運転操作は、特にたとえば、以下のこと、即ち、
・車道からの逸脱に至る車線変更、及び/又は、
・現在到達不可能な車線への車線変更、及び/又は、
・交通ルールによって禁止される加速操作及び/又は追い越し操作、及び/又は、
・現在自車両後方に位置する他車両後方での追従走行
を含み得る。
【0022】
先に説明したように、許容されない運転操作をフィルタリングして除外することは、機械学習モデルから切り離して行うことができ、この機械学習モデルは、最初は一旦、基本的に使用可能なあらゆる運転操作を提案する完全な自由度を有する。ただし、どの運転操作が許容されないのかの知識を、これに加えて機械学習モデルのトレーニングに取り入れることもできる。
【0023】
従って、本発明は、機械学習モデルをトレーニングするための方法にも関する。この機械学習モデルは、車両が置かれている状況の表現を確率分布にマッピングし、この確率分布は、使用可能な運転操作の予め定められたカタログに属する運転操作各々について、その運転操作が実行される確率を表す。
【0024】
この方法の枠内において、状況の学習表現と、これらの学習表現を機械学習モデルがマッピングする対象となる対応する目標確率分布とが準備される。学習表現は、機械学習モデルに供給され、この機械学習モデルによって確率分布にマッピングされる。この確率分布と個々の目標確率分布との一致が、予め定められたコスト関数に基づき評価される。学習表現をさらに処理することによってコスト関数による評価が高められるようにする目的で、機械学習モデルの挙動を特徴づけるパラメータが最適化される。
【0025】
この場合、学習表現により特徴づけられた状況において許容されない少なくとも1つの運転操作に関して、この運転操作に割り当てられた確率の上昇が、コスト関数による評価を高めることになる可能性が抑制される。
【0026】
このことが意味することは、機械学習モデルは、許容されない運転操作を提案することにより、コスト関数による評価に関連して利点をもたらすことができない、ということである。よって、この評価に関して高めるようにするためには、機械学習モデルは、他の運転操作の確率を上昇させることを考慮しなければならない。これは、許容されない運転操作が確率分布においてまだ0とは異なる確率に割り当てられる、ということを排除するものではない。ただし、明らかに好ましいことは、許容された運転操作の確率だけを上昇させることである。
【0027】
有利な実施形態においては、許容されない運転操作に割り当てられた確率の上昇により元のコスト関数に関連して獲得されるであろう利得を吸い上げ及び/又は過剰補償するペナルティ項によって、コスト関数が拡張される。このようにした場合、刑罰による脅しによっても非常に重度の犯罪を完全には防止できない刑法と同様に、許容されない運転操作に依然として0とは異なる確率が割り当てられることは排除されていない。ただし、許容される運転操作の確率だけを上昇させる代わりに、強い刺激がもたらされる。
【0028】
これに代えて又はこれとの組合せにおいても、機械学習モデルから供給された、許容されない運転操作に割り当てられた確率を、コスト関数による評価の前にゼロにセットすることができる。この確率の上昇は、このことを通して明示的にペナルティを受けることはないが、最適化の際にもはや何の効果も生じさせない。トレーニングの過程において機械学習モデルは、許容されない運転操作の確率が変化しても、コスト関数の最適化においてもはや効果を及ぼさない、ということを学習する。このようにした場合には、相応の試みは、許容される運転操作の確率の最適化にとって有利な結果となるように放棄される。このような振る舞いは、「タイムアウトチェア」といくらか対比可能であり、この「タイムアウトチェア」に、癇癪を起こして無理矢理注目を浴びようとする子供を座らせて、まさにこの注目を浴びさせないでおくことによって、その子供に道理を悟らせるのである。
【0029】
さらに他の有利な実施形態において、予め定められた閾値を下回る確率がゼロに低下させられるように、確率分布が正則化及び/又は離散化される。このようにする場合には、確率分布からの導出によっても許容されない運転操作がもたらされない、という保証を与えることができる。たとえばこの目的で、L1ノルムを使用することができる。
【0030】
この方法は、特に、たとえば、1つ又は複数のコンピュータにおいて実装することができ、その限りにおいては、ソフトウェアとして具体化することができる。よって、本発明は、コンピュータプログラムにも関し、このコンピュータプログラムは、それが1つ又は複数のコンピュータ上において実行されるときに、既述の方法のうちの1つを1つ又は複数のコンピュータに実施させるための機械可読命令を含む。
【0031】
同様に、本発明は、コンピュータプログラムを備える機械可読データ担体及び/又はダウンロード製品にも関する。ダウンロード製品は、データネットワークを介して伝送可能な、即ち、データネットワークのユーザによってダウンロード可能なディジタル製品であり、このディジタル製品を、たとえばオンラインショップにおいて即座にダウンロードするために販売することができる。
【0032】
さらに、コンピュータが、上記コンピュータプログラム、機械可読データ担体又はダウンロード製品を備えるものとすることができる。
【0033】
本発明を改良するさらなる措置について、図面に基づく本発明の好ましい実施例の説明と共に、以下において詳細に示す。
【図面の簡単な説明】
【0034】
【
図1】運転操作4を選択するための方法100の実施例を示す図である。
【
図2】機械学習モデル1をトレーニングするための方法200の実施例を示す図である。
【発明を実施するための形態】
【0035】
実施例
図1は、方法100の1つの実施例の概略的なフローチャートである。方法100の目的は、車両50の現在の状況60に適合させられた実行すべき運転操作4を、運転操作3a~3fから成る予め定められたカタログから選択することである。
【0036】
この目的でステップ110において、車両に搭載された少なくとも1つのセンサ51の測定データ51aを利用して、車両50が置かれている状況60の表現61が作成される。状況60のこの表現61は、ステップ120において、トレーニング済み機械学習モデル1によって確率分布2にマッピングされる。確率分布2は、使用可能な運転操作3a~3fの予め定められたカタログに属する運転操作3a~3f各々について、その運転操作3a~3fが実行される確率2a~2fを表す。
【0037】
既にこの箇所でステップ130において、状況60の少なくとも1つの局面62を利用して、この状況60において許容されない運転操作3a*~3f*の部分集合が、求められるものとするとよい。続いてステップ140において、これらの許容されない運転操作3a*~3f*の実行が抑制されるものとするとよい。この目的で特に、たとえばブロック141に従って、確率分布2において、許容されない運転操作3a*~3f*が実行される確率2a~2fがゼロにセットされるものとするとよい。このようにゼロにセットされた後、ブロック142に従って、まだゼロとは異なる運転操作3a~3fの確率2a~2fが合計して1になるように、確率分布が正規化されるものとするとよい。その後、変更された確率分布2’が生じる。
【0038】
ステップ150において、変更されたこの確率分布2’から、又は、元の確率分布2から、実行すべき運転操作4として1つの運転操作3a~3fが導出される。
【0039】
この箇所において、許容されない運転操作3a*~3f*をフィルタリングして除外するために、介入処理が行われるものとしてもよい。この目的でステップ160において、ステップ130と同様に、状況60の少なくとも1つの局面62を利用して、許容されない運転操作3a*~3f*が求められるものとするとよい。続いてこれらの許容されない運転操作3a*~3f*は、ステップ170において抑制することができる。この目的で特にたとえば、許容されない運転操作3a*~3f*が確率分布2から導出されたことに応答して、新たな運転操作3a~3fを、確率分布2から導出することができる。かくして最後には、もはや元々導出された運転操作4ではなく、新たに導出された運転操作4’が生じる。
【0040】
許容されない運転操作3a*~3f*は、特にたとえばブロック131又は161に従って、車両50の現在のポジションに基づき空間分解されたディジタルマップから呼び出される情報にそれぞれ基づいて、求めることができる。
【0041】
図2は、機械学習モデル1をトレーニングするための方法200の1つの実施例の概略的なフローチャートである。機械学習モデル1は、車両50が置かれている状況60の表現61を確率分布2にマッピングする。この確率分布2は、使用可能な運転操作3a~3fの予め定められたカタログに属する運転操作3a~3f各々について、その運転操作3a~3fが実行される確率2a~2fを表す。
【0042】
ステップ210において、状況60の学習表現61aと、対応する目標確率分布2aとが準備され、機械学習モデル1は、この目標確率分布2aに上述の学習表現61aをマッピングすることになる。ステップ220において、学習表現61aが機械学習モデル1に供給され、機械学習モデル1によって確率分布2にマッピングされる。ステップ230において、これらの確率分布2と個々の目標確率分布2aとの一致が、予め定められたコスト関数5に基づき評価される。ステップ240において、機械学習モデル1の挙動を特徴づけるパラメータ1aが最適化される。この最適化が目的とすることは、学習表現61aをさらに処理することにより、コスト関数5による評価230aが高められるようにすることである。パラメータ1aのトレーニングが完了した状態は、参照符号1a*によって表されている。
【0043】
この場合、学習表現61aにより特徴づけられた状況60において許容されない少なくとも1つの運転操作3a
*~3f
*に関して、この運転操作3a
*~3f
*に割り当てられた確率2a~2fの上昇が、コスト関数5による評価230aを高めることになる可能性が抑制される。
図2には、このことを実現することができる2つの手法が例示的に示されている。
【0044】
たとえばブロック231に従って、許容されない運転操作3a*~3f*に割り当てられた確率2a~2fの上昇により元のコスト関数5に関連して獲得されるであろう利得を吸い上げ及び/又は過剰補償するペナルティ項により、コスト関数5は、拡張されるものとするとよい。
【0045】
これに代えて又はこれとの組合せにおいても、ブロック221に従って、機械学習モデル1から供給された、許容されない運転操作3a*~3f*に割り当てられた確率2a~2fは、コスト関数5による評価の前にゼロにセットされるものとするとよい。
【0046】
さらに、ブロック222に従って、予め定められた閾値を下回る確率2a~2fがゼロに低下させられるように、確率分布2は、正則化及び/又は離散化されるものとするとよい。
【手続補正書】
【提出日】2023-07-07
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
少なくとも部分的に自動化されて走行する車両(50)により実行すべき運転操作(4)を選択するための方法(100)であって、
・前記車両に搭載された少なくとも1つのセンサ(51)の測定データ(51a)を利用して、前記車両(50)が置かれている状況(60)の表現(61)を作成するステップ(110)と、
・前記状況(60)の前記表現(61)を、トレーニング済み機械学習モデル(1)により確率分布(2)にマッピングするステップ(120)であって、前記確率分布(2)は、使用可能な運転操作(3a~3f)の予め定められたカタログに属する運転操作(3a~3f)各々について、当該運転操作(3a~3f)が実行される確率(2a~2f)を表す、ステップ(120)と、
・前記確率分布(2,2’)から、実行すべき運転操作(4)として1つの運転操作(3a~3f)を導出するステップ(150)と、
・付加的に、前記車両(50)が置かれている前記状況(60)の少なくとも1つの局面(62)を利用して、前記状況(60)において許容されない運転操作(3a
*~3f
*)の部分集合を求めるステップ(130,160)と、
・前記許容されない運転操作(3a
*~3f
*)の実行を抑制するステップ(140,170)と、
を含む方法(100)。
【請求項2】
前記確率分布(2)において、少なくとも1つの許容されない運転操作(3a
*~3f
*)が実行される確率(2a~2f)をゼロにセットする(141)ことによって、変更された確率分布(2’)を生成するようにして、前記許容されない運転操作(3a
*~3f
*)の実行を抑制する、請求項1に記載の方法(100)。
【請求項3】
少なくとも1つの確率(2a~2f)をゼロにセットした後、まだゼロとは異なる運転操作(3a~3f)の確率(2a~2f)が合計して1となるように、前記確率分布(2)を正規化する(142)ことによって、変更された確率分布(2’)を生成する、請求項2に記載の方法(100)。
【請求項4】
少なくとも1つの許容されない運転操作(3a
*~3f
*)の実行を、当該許容されない運転操作(3a
*~3f
*)が前記確率分布(2)から導出されたことに応答して、新たな運転操作(3a~3f)を前記確率分布(2)から導出するようにして、抑制する(171)、請求項1乃至3のいずれか一項に記載の方法(100)。
【請求項5】
少なくとも1つの許容されない運転操作(3a
*~3f
*)を、前記車両(50)の現在のポジションに基づき、空間分解されたディジタルマップから呼び出される情報に基づいて求める(131,161)、請求項1乃至4のいずれか一項に記載の方法(100)。
【請求項6】
少なくとも1つの許容されない運転操作(3a
*~3f
*)は、
・車道からの逸脱、及び/又は、
・一般的な交通ルールの違反、及び/又は、
・自動化された走行動作のための特定の機構の損傷、及び/又は、
・自車両(50)と他車両又はその他の物体との衝突
に対するリスクを成す運転操作である、請求項1乃至5のいずれか一項に記載の方法(100)。
【請求項7】
前記許容されない運転操作(3a
*~3f
*)は、
・車道からの逸脱に至る車線変更、及び/又は、
・現在到達不可能な車線への車線変更、及び/又は、
・交通ルールによって禁止される加速操作及び/又は追い越し操作、及び/又は、
・現在自車両(50)後方に位置する他車両後方での追従走行
を含む、請求項1乃至6のいずれか一項に記載の方法(100)。
【請求項8】
機械学習モデル(1)をトレーニングするための方法(200)であって、前記機械学習モデル(1)は、車両(50)が置かれた状況(60)の表現(61)を確率分布(2)にマッピングし、前記確率分布(2)は、使用可能な運転操作(3a~3f)の予め定められたカタログに属する運転操作(3a~3f)各々について、当該運転操作(3a~3f)が実行される確率(2a~2f)を表す、方法(200)において、
・状況(60)の学習表現(61a)と、前記学習表現(61a)を前記機械学習モデル(1)がマッピングする対象となる対応する目標確率分布(2a)とを準備するステップ(210)と、
・前記学習表現(61a)を前記機械学習モデル(1)に供給し、前記機械学習モデル(1)によって確率分布(2)にマッピングするステップ(220)と、
・前記確率分布(2)と個々の前記目標確率分布(2a)との一致を、予め定められたコスト関数(5)に基づき評価するステップ(230)と、
・学習表現(61a)をさらに処理することによって前記コスト関数(5)による評価(230a)が高められるようにする目的で、前記機械学習モデル(1)の挙動を特徴づけるパラメータ(1a)を最適化するステップ(240)と、
・前記学習表現(61a)により特徴づけられた前記状況(60)において許容されない少なくとも1つの運転操作(3a
*~3f
*)に関して、当該運転操作(3a
*~3f
*)に割り当てられた前記確率(2a~2f)の上昇が、前記コスト関数(5)による評価(230a)を高めることになる可能性を抑制するステップと、
を含む方法(200)。
【請求項9】
前記許容されない運転操作(3a
*~3f
*)に割り当てられた前記確率(2a~2f)の上昇により元のコスト関数(5)に関連して獲得されるであろう利得を吸い上げ及び/又は過剰補償するペナルティ項によって、前記コスト関数(5)を拡張する(231)、請求項8に記載の方法(200)。
【請求項10】
前記機械学習モデル(1)から供給された、前記許容されない運転操作(3a
*~3f
*)に割り当てられた確率(2a~2f)を、前記コスト関数(5)による評価の前にゼロにセットする(221)、請求項8又は9に記載の方法(200)。
【請求項11】
予め定められた閾値を下回る確率(2a~2f)がゼロに低下させられるように、前記確率分布(2)を正則化及び/又は離散化する(222)、請求項8乃至10のいずれか一項に記載の方法(200)。
【請求項12】
コンピュータプログラムであって、当該コンピュータプログラムは、1つ又は複数のコンピュータ上において実行されるときに、請求項1乃至11のいずれか一項に記載の方法(100,200)を前記1つ又は複数のコンピュータに実施させるための機械可読命令を含む、コンピュータプログラム。
【請求項13】
請求項12に記載のコンピュータプログラムを備える機械可読データ担体
。
【請求項14】
請求項12に記載のコンピュータプログラム及び/又は請求項13に記載の機械可読データ担体
を備えるコンピュータ。
【手続補正2】
【補正対象書類名】図面
【補正方法】変更
【補正の内容】
【国際調査報告】