特表2023-551944 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト　ボツシユ　ゲゼルシヤフト　ミツト　ベシユレンクテル　ハフツングの特許一覧

特表2023-551944少なくとも部分的に自動化されて走行する車両のための運転操作の選択

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-12-13

(54)【発明の名称】少なくとも部分的に自動化されて走行する車両のための運転操作の選択

(51)【国際特許分類】

G08G 1/16 20060101AFI20231206BHJP

【ＦＩ】

G08G1/16 C

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2023533896

(86)(22)【出願日】2021-11-30

(85)【翻訳文提出日】2023-06-02

(86)【国際出願番号】 EP2021083637

(87)【国際公開番号】W WO2022117586

(87)【国際公開日】2022-06-09

(31)【優先権主張番号】102020215324.8

(32)【優先日】2020-12-03

(33)【優先権主張国・地域又は機関】DE

(81)【指定国・地域】

(71)【出願人】

【識別番号】390023711

【氏名又は名称】ローベルトボツシユゲゼルシヤフトミツトベシユレンクテルハフツング

【氏名又は名称原語表記】ＲＯＢＥＲＴＢＯＳＣＨＧＭＢＨ

【住所又は居所原語表記】Ｓｔｕｔｔｇａｒｔ，Ｇｅｒｍａｎｙ

(74)【代理人】

【識別番号】100114890

【弁理士】

【氏名又は名称】アインゼル・フェリックス＝ラインハルト

(74)【代理人】

【識別番号】100098501

【弁理士】

【氏名又は名称】森田拓

(74)【代理人】

【識別番号】100116403

【弁理士】

【氏名又は名称】前川純一

(74)【代理人】

【識別番号】100134315

【弁理士】

【氏名又は名称】永島秀郎

(74)【代理人】

【識別番号】100162880

【弁理士】

【氏名又は名称】上島類

(72)【発明者】

【氏名】フェリックスシュミット

(72)【発明者】

【氏名】マーティンシュトル

(72)【発明者】

【氏名】ヨハネスゴス

(72)【発明者】

【氏名】ホルガーアンドレアスバンツハーフ

(72)【発明者】

【氏名】ヨハネスマクシミリアンデリンガー

(72)【発明者】

【氏名】ミハエルハンゼルマン

【テーマコード（参考）】

5H181

【Ｆターム（参考）】

5H181AA01

5H181BB20

5H181CC03

5H181CC04

5H181CC11

5H181CC12

5H181CC14

5H181EE02

5H181LL01

5H181LL02

5H181LL04

5H181LL09

(57)【要約】

少なくとも部分的に自動化されて走行する車両（５０）により実行すべき運転操作（４）を選択するための方法（１００）であって、当該方法は、車両に搭載された少なくとも１つのセンサ（５１）の測定データ（５１ａ）を利用して、車両（５０）が置かれている状況（６０）の表現（６１）を作成するステップ（１１０）と、状況（６０）の表現（６１）を、トレーニング済み機械学習モデル（１）により確率分布（２）にマッピングするステップ（１２０）であって、確率分布（２）は、使用可能な運転操作（３ａ～３ｆ）の予め定められたカタログに属する運転操作（３ａ～３ｆ）各々について、この運転操作（３ａ～３ｆ）が実行される確率（２ａ～２ｆ）を表す、ステップ（１２０）と、確率分布（２，２’）から、実行すべき運転操作（４）として１つの運転操作（３ａ～３ｆ）を導出するステップ（１５０）と、付加的に、車両（５０）が置かれている状況（６０）の少なくとも１つの局面（６２）を利用して、この状況（６０）において許容されない運転操作（３ａ^＊～３ｆ^＊）の部分集合を求めるステップ（１３０，１６０）と、許容されないこれらの運転操作（３ａ^＊～３ｆ^＊）の実行を抑制するステップ（１４０，１７０）と、を含む。

【特許請求の範囲】

【請求項1】

少なくとも部分的に自動化されて走行する車両（５０）により実行すべき運転操作（４）を選択するための方法（１００）であって、
・前記車両に搭載された少なくとも１つのセンサ（５１）の測定データ（５１ａ）を利用して、前記車両（５０）が置かれている状況（６０）の表現（６１）を作成するステップ（１１０）と、
・前記状況（６０）の前記表現（６１）を、トレーニング済み機械学習モデル（１）により確率分布（２）にマッピングするステップ（１２０）であって、前記確率分布（２）は、使用可能な運転操作（３ａ～３ｆ）の予め定められたカタログに属する運転操作（３ａ～３ｆ）各々について、当該運転操作（３ａ～３ｆ）が実行される確率（２ａ～２ｆ）を表す、ステップ（１２０）と、
・前記確率分布（２，２’）から、実行すべき運転操作（４）として１つの運転操作（３ａ～３ｆ）を導出するステップ（１５０）と、
・付加的に、前記車両（５０）が置かれている前記状況（６０）の少なくとも１つの局面（６２）を利用して、前記状況（６０）において許容されない運転操作（３ａ^＊～３ｆ^＊）の部分集合を求めるステップ（１３０，１６０）と、
・前記許容されない運転操作（３ａ^＊～３ｆ^＊）の実行を抑制するステップ（１４０，１７０）と、
を含む方法（１００）。

【請求項2】

前記確率分布（２）において、少なくとも１つの許容されない運転操作（３ａ^＊～３ｆ^＊）が実行される確率（２ａ～２ｆ）をゼロにセットする（１４１）ことによって、変更された確率分布（２’）を生成するようにして、前記許容されない運転操作（３ａ^＊～３ｆ^＊）の実行を抑制する、請求項１に記載の方法（１００）。

【請求項3】

少なくとも１つの確率（２ａ～２ｆ）をゼロにセットした後、まだゼロとは異なる運転操作（３ａ～３ｆ）の確率（２ａ～２ｆ）が合計して１となるように、前記確率分布（２）を正規化する（１４２）ことによって、変更された確率分布（２’）を生成する、請求項２に記載の方法（１００）。

【請求項4】

少なくとも１つの許容されない運転操作（３ａ^＊～３ｆ^＊）の実行を、当該許容されない運転操作（３ａ^＊～３ｆ^＊）が前記確率分布（２）から導出されたことに応答して、新たな運転操作（３ａ～３ｆ）を前記確率分布（２）から導出するようにして、抑制する（１７１）、請求項１乃至３のいずれか一項に記載の方法（１００）。

【請求項5】

少なくとも１つの許容されない運転操作（３ａ^＊～３ｆ^＊）を、前記車両（５０）の現在のポジションに基づき、空間分解されたディジタルマップから呼び出される情報に基づいて求める（１３１，１６１）、請求項１乃至４のいずれか一項に記載の方法（１００）。

【請求項6】

少なくとも１つの許容されない運転操作（３ａ^＊～３ｆ^＊）は、
・車道からの逸脱、及び／又は、
・一般的な交通ルールの違反、及び／又は、
・自動化された走行動作のための特定の機構の損傷、及び／又は、
・自車両（５０）と他車両又はその他の物体との衝突
に対するリスクを成す運転操作である、請求項１乃至５のいずれか一項に記載の方法（１００）。

【請求項7】

前記許容されない運転操作（３ａ^＊～３ｆ^＊）は、
・車道からの逸脱に至る車線変更、及び／又は、
・現在到達不可能な車線への車線変更、及び／又は、
・交通ルールによって禁止される加速操作及び／又は追い越し操作、及び／又は、
・現在自車両（５０）後方に位置する他車両後方での追従走行
を含む、請求項１乃至６のいずれか一項に記載の方法（１００）。

【請求項8】

機械学習モデル（１）をトレーニングするための方法（２００）であって、前記機械学習モデル（１）は、車両（５０）が置かれた状況（６０）の表現（６１）を確率分布（２）にマッピングし、前記確率分布（２）は、使用可能な運転操作（３ａ～３ｆ）の予め定められたカタログに属する運転操作（３ａ～３ｆ）各々について、当該運転操作（３ａ～３ｆ）が実行される確率（２ａ～２ｆ）を表す、方法（２００）において、
・状況（６０）の学習表現（６１ａ）と、前記学習表現（６１ａ）を前記機械学習モデル（１）がマッピングする対象となる対応する目標確率分布（２ａ）とを準備するステップ（２１０）と、
・前記学習表現（６１ａ）を前記機械学習モデル（１）に供給し、前記機械学習モデル（１）によって確率分布（２）にマッピングするステップ（２２０）と、
・前記確率分布（２）と個々の前記目標確率分布（２ａ）との一致を、予め定められたコスト関数（５）に基づき評価するステップ（２３０）と、
・学習表現（６１ａ）をさらに処理することによって前記コスト関数（５）による評価（２３０ａ）が高められるようにする目的で、前記機械学習モデル（１）の挙動を特徴づけるパラメータ（１ａ）を最適化するステップ（２４０）と、
・前記学習表現（６１ａ）により特徴づけられた前記状況（６０）において許容されない少なくとも１つの運転操作（３ａ^＊～３ｆ^＊）に関して、当該運転操作（３ａ^＊～３ｆ^＊）に割り当てられた前記確率（２ａ～２ｆ）の上昇が、前記コスト関数（５）による評価（２３０ａ）を高めることになる可能性を抑制するステップと、
を含む方法（２００）。

【請求項9】

前記許容されない運転操作（３ａ^＊～３ｆ^＊）に割り当てられた前記確率（２ａ～２ｆ）の上昇により元のコスト関数（５）に関連して獲得されるであろう利得を吸い上げ及び／又は過剰補償するペナルティ項によって、前記コスト関数（５）を拡張する（２３１）、請求項８に記載の方法（２００）。

【請求項10】

前記機械学習モデル（１）から供給された、前記許容されない運転操作（３ａ^＊～３ｆ^＊）に割り当てられた確率（２ａ～２ｆ）を、前記コスト関数（５）による評価の前にゼロにセットする（２２１）、請求項８又は９に記載の方法（２００）。

【請求項11】

予め定められた閾値を下回る確率（２ａ～２ｆ）がゼロに低下させられるように、前記確率分布（２）を正則化及び／又は離散化する（２２２）、請求項８乃至１０のいずれか一項に記載の方法（２００）。

【請求項12】

コンピュータプログラムであって、当該コンピュータプログラムは、１つ又は複数のコンピュータ上において実行されるときに、請求項１乃至１１のいずれか一項に記載の方法（１００，２００）を前記１つ又は複数のコンピュータに実施させるための機械可読命令を含む、コンピュータプログラム。

【請求項13】

請求項１２に記載のコンピュータプログラムを備える機械可読データ担体及び／又はダウンロード製品。

【請求項14】

請求項１２に記載のコンピュータプログラム及び／又は請求項１３に記載の機械可読データ担体及び／又はダウンロード製品を備えるコンピュータ。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、少なくとも部分的に自動化されて走行する車両のための、状況に応じた運転操作プラニングに関する。

【背景技術】

【0002】

背景技術
少なくとも部分的に自動化されて走行する車両は、比較的間近な今後の運転操作プラニングを自身が置かれている状況の変化に適応させる目的で、この状況を継続的に捕捉する。車両が反応しなければならない状況の変化は、たとえば、異なる所与の状態を伴う別の場所に車両が移動することによって引き起こされる可能性がある。ただし、たとえば、他の道路利用者のような他の物体の動きも、状況を大きく変化させる可能性があり、それにより反応が必要になる場合がある。独国特許出願公開第１０２０１８２１０２８０号明細書には、他の物体の軌跡を予測することができ、それによって、自車両の軌跡を相応に適応させることができるようにした方法が開示されている。

【0003】

運転操作プラニングのためのいくつかの方法は、車両が置かれている状況の表現を作成し、この表現を、トレーニング済み機械学習モデルによって、基本的に使用可能な運転操作の確率を表す確率分布にマッピングする。この確率分布から、実行すべき運転操作として１つの運転操作が導出され、車両のアクチュエータ装置の動作が相応に制御される。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】独国特許出願公開第１０２０１８２１０２８０号明細書

【発明の概要】

【課題を解決するための手段】

【0005】

発明の開示
本発明の枠内において、少なくとも部分的に自動化された車両により実行すべき運転操作を選択するための方法が開発された。本方法は、車両に搭載された少なくとも１つのセンサの測定データを利用して、車両が置かれている状況の表現が作成されることから開始する。状況のこの表現は、トレーニング済み機械学習モデルによって確率分布にマッピングされる。表現は、特に、たとえば、任意の形態及び手法により作成された、状況の包括的な表現とすることができる。

【0006】

測定データは、特に、たとえば、画像データ、ビデオデータ、レーダデータ、ＬＩＤＡＲデータ及び／又は超音波データとすることができる。

【0007】

機械学習モデルとは、特に、優れた一般化能力を有する、適応化可能なパラメータを用いてパラメータ化される関数を具現化するモデルであるとみなされる。機械学習モデルをトレーニングする際に、パラメータは、特に以下のように、適応させることができる。即ち、学習表現をモデルに入力したときに、それらの学習入力に対応する予め既知である目標出力が、可能な限り良好に再現されるように、適応させる。機械学習モデルは、特に、人工ニューラルネットワークＫＮＮを含み得るものであり、及び／又は、機械学習モデルは、人工ニューラルネットワークＫＮＮとすることができる。

【0008】

確率分布は、使用可能な運転操作の予め定められたカタログに属する運転操作各々について、その運転操作が実行される確率を表す。確率分布から、実行すべき運転操作として１つの運転操作が導出される。

【0009】

付加的に、車両が置かれている状況の少なくとも１つの局面を利用して、この状況において許容されない運転操作の部分集合が求められる。許容されないこれらの運転操作の実行が抑制される。

【0010】

機械学習モデルのトレーニングは、個々の状況において、より目的に適った運転操作を、あまり目的に適っていない運転操作から切り離すように調整されている。従って、許容されない運転操作の大半は、既に、機械学習モデルによってあまり目的に適っていないとみなされる。最終的に実行すべき運転操作を確率分布から導出することにより、表現を厳密に１つの運転操作に直接マッピングすることに比較して、より現実的な、特に他の道路利用者をあまり驚かせない走行挙動が、機械学習モデルによってもたらされる。ただし、許容されない運転操作にも、確率分布においてゼロとは異なる確率が割り当てられることを回避することはできない。このことが意味することは、許容されない運転操作が所定の確率で実際には選択及び実行される、ということである。この確率は、自動化された走行動作のために指定された許容可能な残存リスクよりも高い可能性がある。

【0011】

さらに、１つの特定の状況において１つの具体的な運転操作が許容されないようにする境界条件は、比較的複雑であり、及び／又は、機械学習モデルのトレーニングに取り入れることが適当ではないような特性である可能性がある。機械学習モデルの強みはまさに、限定された量のトレーニング状況から、不特定の多数の状況へと一般化する能力にある。しかしながら、たとえば、自動化された走行動作のために決められた条件によって、特定の速度範囲内においてしか特定の運転操作を実行してはならないこと、又は、接近する対向交通まで規定された最小距離があるときにしか追い越し操作を開始してはならないことが規定されている場合には、上述の一般化能力は、最適な手段ではない。むしろ、この種の境界条件は、機械学習モデルを介して回り道することなく実施する方が有利である。

【0012】

従って、許容されない運転操作の抑制は、特に機械学習モデルから完全に切り離して行うことができる。このことが意味することは、個々の運転操作の許否とはまずは切り離して、機械学習モデルをトレーニングすることができ、後になって初めて許否が実施される、ということである。かくして、許否に関する規定を後から変更しても、機械学習モデルのトレーニングにはもはや影響が及ぼされない。即ち、このような変更は、トレーニングを完全に又は部分的に繰り返す必要なく、何度も行うことができる。トレーニングの適応化のためには、通常、特定の新しい状況の表現が記録されるテスト走行をやり終えなければならない。次いで、それらの表現に対し、個々の状況において望まれる運転操作を手動でラベリングしなければならない。

【0013】

たとえば、運転操作が許容される速度範囲を適応させるためには、このような手間は不要である。特に、激しく渋滞した高速道路区間においては路肩を車線として解放するといった新たなルールも、通常は許容されないものとして拒否される路肩への車線変更を、相応に解放されたときに許容されるものとして宣言するようにして、簡単に実装することができる。

【0014】

特に有利な実施形態において、少なくとも１つの許容されない運転操作が実行される確率が確率分布においてゼロにセットされるようにして、この運転操作の実行が抑制される。これによって、変更された確率分布が生成される。このようにして、以下のことが保証される。即ち、確率分布から導出する際に、許容される運転操作だけを選択することができ、これと同時に使用することができる結果がない場合には、導出は、そのままでは維持されない。従って、許容されない運転操作が導出されたケースについて、個別の「エラー処理」は、必要とされない。

【0015】

特にたとえば、少なくとも１つの確率がゼロにセットされた後、まだゼロとは異なる運転操作の確率が合計して１になるように、確率分布は、正規化することができる。これによっても、変更された確率分布が生成される。即ち、許容されないものとして破棄された運転操作は、選択されるという自身の以前の確率を放棄し、その確率を持ち分に応じて、許容されるものとして残存した運転操作に配分する。このことは、１つの住居又は勤め口について複数の応募者のうちの１人が不合格判定基準で失敗すると、その応募者のこれまでのチャンスが残余の応募者に再配分される、ということといくらか類似している。即ち、この１人の応募者が失敗しても、確実に（確率１で）住居又は勤め口が誰かに与えられることになるということは、変わらない。

【0016】

確率分布を後から変更することに代えて又はこれとの組合せにおいても、少なくとも１つの許容されない運転操作の実行は、この許容されない運転操作が確率分布から導出されたことに応答して、新たな運転操作が確率分布から導出されるようにして、抑制することができる。確率分布は、許容される運転操作により高い確率を割り当てるので、新たな導出にあたり許容される運転操作が選択されることを予期することができるが、保証されてはいない。場合によっては、許容される運転操作が結果として得られるまで、新たな導出を繰り返す必要がある。

【0017】

導出を反復することの利点は、許容されない運転操作が最初に選択された状況を捕捉して評価することができる、ということにある。このような状況が度重なる場合には、このことを、機械学習モデルが状況をもはや適切には捕捉せず、そのトレーニングを相応に適応させなければならない、ということの指標とすることができる。これについて考えられる１つの原因は、機械学習モデルのトレーニング後に道路交通に関する新たなルールが導入されたことである可能性がある。

【0018】

たとえば、環境ゾーンのために新たに導入された交通標識は、速度３０ゾーンの開始を知らせる交通標識に概ね基づいている。ここでは赤い円の中の「３０」という数字が「環境」という単語に置き換えられたにすぎない。機械学習モデルが「速度３０ゾーン」の標識だけしか識別しなければ、人間の運転者の場合にはどうしても望まれる再認知度が問題となる可能性がある。たとえば、８０ｋｍ／ｈが許可されている高速道路が環境ゾーン内に通じている場合には、機械学習モデルは、３０ｋｍ／ｈの速度制限と識別し、それに応じて、急ブレーキを目的に適った運転操作として推奨する可能性がある。このようにして生じた急ブレーキが、自動化された走行動作のために許容された最大減速度を上回った場合には、ブレーキは、許容されないものとして破棄され、実行されない。このようにして、走行動作中に何度も同様の運転操作が同様の場所において許容されないものとして破棄されたことが捕捉された場合には、車両ユーザは、何か根本的なことが正常に機能しておらず、機械学習モデルが更新を必要としている、というフィードバックを受け取る。

【0019】

さらに他の特に有利な実施形態において、少なくとも１つの許容されない運転操作が、車両の現在のポジションに基づき、空間分解されたディジタルマップから呼び出される情報に基づいて求められる。ディジタルマップには、特にたとえば、道路の推移、走行方向ごとに設けられている車線の数、速度制限、追い越し禁止及びその他の交通ルールを記録することができる。たとえば、現在の車線の左側若しくは右側に別の車線が隣接していないこと、又は、走行可能な領域がそもそも隣接していないことが、マップに従って判明した場合には、左側又は右側への車線変更は、許容されないものとして評価することができる。

【0020】

従って、許容されない走行操作は、特にたとえば、以下のこと、即ち、
・車道からの逸脱、及び／又は、
・一般的な交通ルールの違反、及び／又は、
・自動化された走行動作のための特定の機構の損傷、及び／又は、
・自車両と他車両又はその他の物体との衝突
に対するリスクを成す運転操作とすることができる。

【0021】

よって、許容されない運転操作は、特にたとえば、以下のこと、即ち、
・車道からの逸脱に至る車線変更、及び／又は、
・現在到達不可能な車線への車線変更、及び／又は、
・交通ルールによって禁止される加速操作及び／又は追い越し操作、及び／又は、
・現在自車両後方に位置する他車両後方での追従走行
を含み得る。

【0022】

先に説明したように、許容されない運転操作をフィルタリングして除外することは、機械学習モデルから切り離して行うことができ、この機械学習モデルは、最初は一旦、基本的に使用可能なあらゆる運転操作を提案する完全な自由度を有する。ただし、どの運転操作が許容されないのかの知識を、これに加えて機械学習モデルのトレーニングに取り入れることもできる。

【0023】

従って、本発明は、機械学習モデルをトレーニングするための方法にも関する。この機械学習モデルは、車両が置かれている状況の表現を確率分布にマッピングし、この確率分布は、使用可能な運転操作の予め定められたカタログに属する運転操作各々について、その運転操作が実行される確率を表す。

【0024】

この方法の枠内において、状況の学習表現と、これらの学習表現を機械学習モデルがマッピングする対象となる対応する目標確率分布とが準備される。学習表現は、機械学習モデルに供給され、この機械学習モデルによって確率分布にマッピングされる。この確率分布と個々の目標確率分布との一致が、予め定められたコスト関数に基づき評価される。学習表現をさらに処理することによってコスト関数による評価が高められるようにする目的で、機械学習モデルの挙動を特徴づけるパラメータが最適化される。

【0025】

この場合、学習表現により特徴づけられた状況において許容されない少なくとも１つの運転操作に関して、この運転操作に割り当てられた確率の上昇が、コスト関数による評価を高めることになる可能性が抑制される。

【0026】

このことが意味することは、機械学習モデルは、許容されない運転操作を提案することにより、コスト関数による評価に関連して利点をもたらすことができない、ということである。よって、この評価に関して高めるようにするためには、機械学習モデルは、他の運転操作の確率を上昇させることを考慮しなければならない。これは、許容されない運転操作が確率分布においてまだ０とは異なる確率に割り当てられる、ということを排除するものではない。ただし、明らかに好ましいことは、許容された運転操作の確率だけを上昇させることである。

【0027】

有利な実施形態においては、許容されない運転操作に割り当てられた確率の上昇により元のコスト関数に関連して獲得されるであろう利得を吸い上げ及び／又は過剰補償するペナルティ項によって、コスト関数が拡張される。このようにした場合、刑罰による脅しによっても非常に重度の犯罪を完全には防止できない刑法と同様に、許容されない運転操作に依然として０とは異なる確率が割り当てられることは排除されていない。ただし、許容される運転操作の確率だけを上昇させる代わりに、強い刺激がもたらされる。

【0028】

これに代えて又はこれとの組合せにおいても、機械学習モデルから供給された、許容されない運転操作に割り当てられた確率を、コスト関数による評価の前にゼロにセットすることができる。この確率の上昇は、このことを通して明示的にペナルティを受けることはないが、最適化の際にもはや何の効果も生じさせない。トレーニングの過程において機械学習モデルは、許容されない運転操作の確率が変化しても、コスト関数の最適化においてもはや効果を及ぼさない、ということを学習する。このようにした場合には、相応の試みは、許容される運転操作の確率の最適化にとって有利な結果となるように放棄される。このような振る舞いは、「タイムアウトチェア」といくらか対比可能であり、この「タイムアウトチェア」に、癇癪を起こして無理矢理注目を浴びようとする子供を座らせて、まさにこの注目を浴びさせないでおくことによって、その子供に道理を悟らせるのである。

【0029】

さらに他の有利な実施形態において、予め定められた閾値を下回る確率がゼロに低下させられるように、確率分布が正則化及び／又は離散化される。このようにする場合には、確率分布からの導出によっても許容されない運転操作がもたらされない、という保証を与えることができる。たとえばこの目的で、Ｌ１ノルムを使用することができる。

【0030】

この方法は、特に、たとえば、１つ又は複数のコンピュータにおいて実装することができ、その限りにおいては、ソフトウェアとして具体化することができる。よって、本発明は、コンピュータプログラムにも関し、このコンピュータプログラムは、それが１つ又は複数のコンピュータ上において実行されるときに、既述の方法のうちの１つを１つ又は複数のコンピュータに実施させるための機械可読命令を含む。

【0031】

同様に、本発明は、コンピュータプログラムを備える機械可読データ担体及び／又はダウンロード製品にも関する。ダウンロード製品は、データネットワークを介して伝送可能な、即ち、データネットワークのユーザによってダウンロード可能なディジタル製品であり、このディジタル製品を、たとえばオンラインショップにおいて即座にダウンロードするために販売することができる。

【0032】

さらに、コンピュータが、上記コンピュータプログラム、機械可読データ担体又はダウンロード製品を備えるものとすることができる。

【0033】

本発明を改良するさらなる措置について、図面に基づく本発明の好ましい実施例の説明と共に、以下において詳細に示す。

【図面の簡単な説明】

【0034】

【図1】運転操作４を選択するための方法１００の実施例を示す図である。

【図2】機械学習モデル１をトレーニングするための方法２００の実施例を示す図である。

【発明を実施するための形態】

【0035】

実施例
図１は、方法１００の１つの実施例の概略的なフローチャートである。方法１００の目的は、車両５０の現在の状況６０に適合させられた実行すべき運転操作４を、運転操作３ａ～３ｆから成る予め定められたカタログから選択することである。

【0036】

この目的でステップ１１０において、車両に搭載された少なくとも１つのセンサ５１の測定データ５１ａを利用して、車両５０が置かれている状況６０の表現６１が作成される。状況６０のこの表現６１は、ステップ１２０において、トレーニング済み機械学習モデル１によって確率分布２にマッピングされる。確率分布２は、使用可能な運転操作３ａ～３ｆの予め定められたカタログに属する運転操作３ａ～３ｆ各々について、その運転操作３ａ～３ｆが実行される確率２ａ～２ｆを表す。

【0037】

既にこの箇所でステップ１３０において、状況６０の少なくとも１つの局面６２を利用して、この状況６０において許容されない運転操作３ａ^＊～３ｆ^＊の部分集合が、求められるものとするとよい。続いてステップ１４０において、これらの許容されない運転操作３ａ^＊～３ｆ^＊の実行が抑制されるものとするとよい。この目的で特に、たとえばブロック１４１に従って、確率分布２において、許容されない運転操作３ａ^＊～３ｆ^＊が実行される確率２ａ～２ｆがゼロにセットされるものとするとよい。このようにゼロにセットされた後、ブロック１４２に従って、まだゼロとは異なる運転操作３ａ～３ｆの確率２ａ～２ｆが合計して１になるように、確率分布が正規化されるものとするとよい。その後、変更された確率分布２’が生じる。

【0038】

ステップ１５０において、変更されたこの確率分布２’から、又は、元の確率分布２から、実行すべき運転操作４として１つの運転操作３ａ～３ｆが導出される。

【0039】

この箇所において、許容されない運転操作３ａ^＊～３ｆ^＊をフィルタリングして除外するために、介入処理が行われるものとしてもよい。この目的でステップ１６０において、ステップ１３０と同様に、状況６０の少なくとも１つの局面６２を利用して、許容されない運転操作３ａ^＊～３ｆ^＊が求められるものとするとよい。続いてこれらの許容されない運転操作３ａ^＊～３ｆ^＊は、ステップ１７０において抑制することができる。この目的で特にたとえば、許容されない運転操作３ａ^＊～３ｆ^＊が確率分布２から導出されたことに応答して、新たな運転操作３ａ～３ｆを、確率分布２から導出することができる。かくして最後には、もはや元々導出された運転操作４ではなく、新たに導出された運転操作４’が生じる。

【0040】

許容されない運転操作３ａ^＊～３ｆ^＊は、特にたとえばブロック１３１又は１６１に従って、車両５０の現在のポジションに基づき空間分解されたディジタルマップから呼び出される情報にそれぞれ基づいて、求めることができる。

【0041】

図２は、機械学習モデル１をトレーニングするための方法２００の１つの実施例の概略的なフローチャートである。機械学習モデル１は、車両５０が置かれている状況６０の表現６１を確率分布２にマッピングする。この確率分布２は、使用可能な運転操作３ａ～３ｆの予め定められたカタログに属する運転操作３ａ～３ｆ各々について、その運転操作３ａ～３ｆが実行される確率２ａ～２ｆを表す。

【0042】

ステップ２１０において、状況６０の学習表現６１ａと、対応する目標確率分布２ａとが準備され、機械学習モデル１は、この目標確率分布２ａに上述の学習表現６１ａをマッピングすることになる。ステップ２２０において、学習表現６１ａが機械学習モデル１に供給され、機械学習モデル１によって確率分布２にマッピングされる。ステップ２３０において、これらの確率分布２と個々の目標確率分布２ａとの一致が、予め定められたコスト関数５に基づき評価される。ステップ２４０において、機械学習モデル１の挙動を特徴づけるパラメータ１ａが最適化される。この最適化が目的とすることは、学習表現６１ａをさらに処理することにより、コスト関数５による評価２３０ａが高められるようにすることである。パラメータ１ａのトレーニングが完了した状態は、参照符号１ａ^＊によって表されている。

【0043】

この場合、学習表現６１ａにより特徴づけられた状況６０において許容されない少なくとも１つの運転操作３ａ^＊～３ｆ^＊に関して、この運転操作３ａ^＊～３ｆ^＊に割り当てられた確率２ａ～２ｆの上昇が、コスト関数５による評価２３０ａを高めることになる可能性が抑制される。図２には、このことを実現することができる２つの手法が例示的に示されている。

【0044】

たとえばブロック２３１に従って、許容されない運転操作３ａ^＊～３ｆ^＊に割り当てられた確率２ａ～２ｆの上昇により元のコスト関数５に関連して獲得されるであろう利得を吸い上げ及び／又は過剰補償するペナルティ項により、コスト関数５は、拡張されるものとするとよい。

【0045】

これに代えて又はこれとの組合せにおいても、ブロック２２１に従って、機械学習モデル１から供給された、許容されない運転操作３ａ^＊～３ｆ^＊に割り当てられた確率２ａ～２ｆは、コスト関数５による評価の前にゼロにセットされるものとするとよい。

【0046】

さらに、ブロック２２２に従って、予め定められた閾値を下回る確率２ａ～２ｆがゼロに低下させられるように、確率分布２は、正則化及び／又は離散化されるものとするとよい。

【図1】