IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツングの特許一覧

特許7504647車両の走行曲線及び/又は走行経路を生成するための機械学習システムを訓練するための、コンピュータにより実行されるコンピュータ実装方法、車両の走行曲線及び/又は走行経路を生成するための方法、車両の走行曲線及び/又は走行経路を評価するための方法、車両の駆動システムの経路固有の排出量を特定するための方法、車両の駆動システムを適合させるための方法、並びに、コンピュータプログラム、機械可読記憶媒体、及び、コンピュータ実装式の機械学習システム
<>
  • 特許-車両の走行曲線及び/又は走行経路を生成するための機械学習システムを訓練するための、コンピュータにより実行されるコンピュータ実装方法、車両の走行曲線及び/又は走行経路を生成するための方法、車両の走行曲線及び/又は走行経路を評価するための方法、車両の駆動システムの経路固有の排出量を特定するための方法、車両の駆動システムを適合させるための方法、並びに、コンピュータプログラム、機械可読記憶媒体、及び、コンピュータ実装式の機械学習システム 図1
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-06-14
(45)【発行日】2024-06-24
(54)【発明の名称】車両の走行曲線及び/又は走行経路を生成するための機械学習システムを訓練するための、コンピュータにより実行されるコンピュータ実装方法、車両の走行曲線及び/又は走行経路を生成するための方法、車両の走行曲線及び/又は走行経路を評価するための方法、車両の駆動システムの経路固有の排出量を特定するための方法、車両の駆動システムを適合させるための方法、並びに、コンピュータプログラム、機械可読記憶媒体、及び、コンピュータ実装式の機械学習システム
(51)【国際特許分類】
   B60W 30/10 20060101AFI20240617BHJP
   B60W 50/00 20060101ALI20240617BHJP
   G06N 20/00 20190101ALI20240617BHJP
【FI】
B60W30/10
B60W50/00
G06N20/00
【請求項の数】 27
【外国語出願】
(21)【出願番号】P 2020069739
(22)【出願日】2020-04-08
(65)【公開番号】P2020175885
(43)【公開日】2020-10-29
【審査請求日】2023-02-22
(31)【優先権主張番号】10 2019 205 520.6
(32)【優先日】2019-04-16
(33)【優先権主張国・地域又は機関】DE
(73)【特許権者】
【識別番号】390023711
【氏名又は名称】ローベルト ボツシユ ゲゼルシヤフト ミツト ベシユレンクテル ハフツング
【氏名又は名称原語表記】ROBERT BOSCH GMBH
【住所又は居所原語表記】Stuttgart, Germany
(74)【代理人】
【識別番号】100114890
【弁理士】
【氏名又は名称】アインゼル・フェリックス=ラインハルト
(74)【代理人】
【識別番号】100098501
【弁理士】
【氏名又は名称】森田 拓
(74)【代理人】
【識別番号】100116403
【弁理士】
【氏名又は名称】前川 純一
(74)【代理人】
【識別番号】100135633
【弁理士】
【氏名又は名称】二宮 浩康
(74)【代理人】
【識別番号】100162880
【弁理士】
【氏名又は名称】上島 類
(72)【発明者】
【氏名】マーティン シーク
(72)【発明者】
【氏名】ムハンマド ビラル ザファール
(72)【発明者】
【氏名】シュテファン アンガーマイアー
【審査官】平井 功
(56)【参考文献】
【文献】特表2018-534205(JP,A)
【文献】特開2019-1450(JP,A)
【文献】米国特許出願公開第2016/0325753(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
B60W 10/00-10/30
B60W 30/00-60/00
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
車両の走行曲線及び/又は走行経路生成するための機械学習システム(4)を訓練するための、コンピュータにより実行されるコンピュータ実装方法であって、
・前記機械学習システム(4)の生成器(41)が、入力量としてンダムベクトルを受信し、当該ンダムベクトルに対してそれぞれ第1の走行経路と、これに対応する第1の走行曲線とを生成するステップと、
・走行経路と、走行動作中に検出されたそれぞれ対応する走行曲線とを、データベース(2)に保存するステップと、
・前記データベース(2)から、第2の走行経路と、走行動作中に検出されたそれぞれ対応する第2の走行曲線とを選択するステップと、
・前記機械学習システム(4)の弁別器(42)が、入力量として、生成された第1の走行経路と、生成されたそれぞれ対応する第1の走行曲線とからなる第1のペア、及び、第2の走行経路と、走行動作中に検出されたそれぞれ対応する第2の走行曲線とからなる第2のペアを受信するステップと、
・前記弁別器(42)が、前記入力量に基づいて、当該入力量として受信したそれぞれのペアごとに、当該ペアが、生成された第1の走行経路と、生成されたそれぞれ対応する第1の走行曲線とからなる第1のペアであるのか、又は、第2の走行経路と、走行動作中に検出されたそれぞれ対応する第2の走行曲線とからなる第2のペアであるのかを特徴付ける出力を計算するステップと、
・前記弁別器(42)の前記出力に基づいて、前記第1のペアの分布と、前記第2のペアの分布との間の距離を表す目的関数(5)を最適化するステップと、
を含むことを特徴とする方法。
【請求項2】
前記目的関数(5)の前記最適化に基づいて、前記機械学習システム(4)のパラメータを適合させることにより、
・生成された前記第1の走行曲線及び走行経路と、走行動作中に検出された前記第2の走行曲線及び走行経路とを識別するように、前記弁別器(42)が最適化されるようにし、
・前記弁別器(42)によって、第2の分布で存在している、走行動作中に検出された第2の走行曲線及び走行経路に対して、可能な限り識別することが困難となるような、第1の分布での、生成された第1の走行曲線及び走行経路を生成するように、前記生成器(41)が最適化されるようにする、
請求項1に記載の方法。
【請求項3】
前記機械学習システム(4)の前記パラメータを、前記目的関数(5)の勾配に基づいて適合させる、
請求項2に記載の方法。
【請求項4】
前記目的関数(5)として、前記第1の走行曲線及び走行経路の第1の分布と、前記第2の走行曲線及び走行経路の第2の分布との間の統計的距離が実装されている、
請求項1乃至3のいずれか一項に記載の方法。
【請求項5】
前記目的関数(5)は、ジェンソン・シャノン距離として、又は、ワッサースタイン計量とし実装されている、
請求項4に記載の方法。
【請求項6】
前記目的関数(5)は、ジェンソン・シャノン距離として、又は、前記第1の走行曲線及び走行経路の第1の分布と、前記第2の走行曲線及び走行経路の第2の分布との間のワッサースタイン距離として実装されている、
請求項4に記載の方法。
【請求項7】
前記目的関数(5)を、正則部の分だけ拡張する、又は、重みクリッピングを実施する、
請求項5又は6に記載の方法。
【請求項8】
前記第1の走行経路及び前記第2の走行経路は、時間的又は空間的な離散化刻みで存在するデータであり、
それぞれの離散化刻みにおけるそれぞれの経路に対して、経路特性が保存されている、
請求項1乃至のいずれか一項に記載の方法。
【請求項9】
前記経路特性は、地理的特性、交通流の特性、道路特性、交通管理の特性、及び/又は、経路の気象特性を含む、
請求項に記載の方法。
【請求項10】
前記生成器(41)及び前記弁別器(42)の前記入力量は、追加的な情報として運転者特性及び/又は車両特性を含む、
請求項1乃至のいずれか一項に記載の方法。
【請求項11】
前記ランダムベクトルを、大域的なランダムベクトルとして、又は、一時的又は局所的なランダムベクトルとして、実装する、
請求項1乃至10のいずれか一項に記載の方法。
【請求項12】
前記ランダムベクトルを、大域的なランダムベクトルと、一時的又は局所的なランダムベクトルとの組合せとして、実装する、
請求項1乃至10のいずれか一項に記載の方法。
【請求項13】
前記生成器(41)及び/又は前記弁別器(42)は、それぞれニューラルネットワークとし実装されている、
請求項1乃至12のいずれか一項に記載の方法。
【請求項14】
前記生成器(41)及び/又は前記弁別器(42)は、それぞれリカレントニューラルネットワークとして実装されている、
請求項1乃至13のいずれか一項に記載の方法。
【請求項15】
前記生成器(41)は、双方向リカレントニューラルネットワークとして実装されている、
請求項14に記載の方法。
【請求項16】
生成された前記走行曲線及び生成された前記走行経路の長さを、所定の入力量若しくはコンフィギュレーション可能な入力量に基づいて、又は、終了基準に基づいて、決定する、
請求項1乃至15のいずれか一項に記載の方法。
【請求項17】
前記機械学習システム(4)は、前記車両の前記走行曲線及び/又は前記走行経路、速度推移、アクセルペダル位置の推移、又は、トランスミッションの変速比の推移を生成するための機械学習システム(4)である、
請求項1乃至16のいずれか一項に記載の方法。
【請求項18】
車両の走行曲線及び/又は走行経路を生成するための方法であって、
前記走行曲線を、請求項1乃至17のいずれか一項に記載の方法を用いて学習された、機械学習システム(4)のコンピュータ実装式の生成器(41)によって生成する、
方法。
【請求項19】
車両の走行曲線及び/又は走行経路を評価するための方法であって、
前記走行曲線及び/又は前記走行経路を、請求項1乃至17のいずれか一項に記載の方法を用いて学習された、機械学習システム(4)のコンピュータ実装式の弁別器(42)によって評価する、
方法。
【請求項20】
車両の駆動システムの経路固有の排出量を特定するための方法であって、
前記経路固有の排出量を、請求項18に記載の方法を用いて生成された走行曲線及び/又は走行経路に基づいて特定する、
方法。
【請求項21】
前記排出量を、前記駆動システムのモデルが計算されるシミュレーションにおいて特定する、
請求項20に記載の方法。
【請求項22】
前記駆動システムのモデルは、前記駆動システムの機関と、排気ガス後処理システムとを記述するサブモデルを含む、
請求項21に記載の方法。
【請求項23】
車両の駆動システムを適合させるための方法であって、
前記車両の前記駆動システムを、請求項20乃至22のいずれか一項に記載の方法を用いて特定された経路固有の排出量に基づいて適合させる、
ことを特徴とする、方法。
【請求項24】
前記適合を、
前記駆動システムの開発時にコンポーネント若しくはパラメータを適合させることによって実施する、
前記駆動システムの適用時にデータを適合させることによって実施する、又は、
前記車両内で前記駆動システムの動作中に制御量を適合させることによって実施する、
請求項23に記載の方法。
【請求項25】
請求項1乃至24のいずれか一項に記載の方法を実行するために構成されたコンピュータプログラム。
【請求項26】
請求項25に記載のコンピュータプログラムが記憶された機械可読記憶媒体。
【請求項27】
請求項26に記載の機械可読記憶媒体を備える、コンピュータ実装式の機械学習システム(4)。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習システムを用いて車両の走行曲線を生成又は評価するためのコンピュータ実装方法と、そのような機械学習システムを学習させるためのコンピュータ実装方法と、このために構成されたコンピュータプログラム及び学習システムとに関する。
【背景技術】
【0002】
従来技術
独国特許出願公開第102017107271号明細書は、自動車の排気ガス排出量を特定するための走行試験のための制御走行サイクルを決定するための方法を開示している。同方法においては、種々異なる走行サイクルに対する速度プロファイルが、パラメータセットに基づいて導出される。目的は、所与の境界条件内の「最大」排出量の事例を可能な限り反映するような制御サイクルを決定することである。
【先行技術文献】
【特許文献】
【0003】
【文献】独国特許出願公開第102017107271号明細書
【発明の概要】
【発明が解決しようとする課題】
【0004】
発明の開示
一部の国々においては、内燃機関によって駆動される新型の自動車を、実際の走行動作において発生する排出量に基づいて認可するように法律で制定することが企図されている。これに関して、英語の用語“real driving emissions”も一般に使用されている。そのような自動車には、例えば、専ら内燃機関のみによって駆動されるものが含まれるが、ハイブリッド式のドライブトレインを有するものも含まれる。
【0005】
このために、試験官は、自動車を用いて1回又は複数回の走行サイクルを取り扱い、その際に発生する排出量が測定される。その後、自動車の認可は、これらの測定された排出量に基づいて決まる。この場合、走行サイクルは、試験官によって広範囲の制限内で自由に選択される可能性がある。1回の走行サイクルの典型的な持続時間は、例えば90~120分であり得る。
【0006】
従って、自動車の開発に際して、自動車の製造業者には、新型の自動車の開発プロセスの既に早期の段階で、この自動車の排出量が、全ての許容される走行サイクルにおいて法的に制定された制限内に収まっているかどうかを予測しなければならないという課題が課せられている。
【0007】
従って、限界値を超えることが予想される場合に自動車に変更を加えることができるようにするために、自動車の開発段階において既に、自動車の予想排出量を確実に予測することができるような方法及び装置を提供することが重要である。試験台上又は走行中の自動車での測定のみに基づいたこのような評価は、考えられる走行サイクルの多様性が大きいので非常に手間がかかる。
【0008】
従って、従来技術においては、例えば、いわゆる、排出量要件を満たすことが特に困難である制御サイクルを決定することが提案されている。この制御サイクルが最も困難なサイクルに該当する場合、仮定的に、考えられる全ての走行サイクルに対して排出量要件が満たされることが前提にされる。
【0009】
しかしながら、考えられる又は許容される全ての走行サイクルにおいて排気ガス規制を遵守しなければならないという要件に加えて、車両又は駆動部の開発における重要な課題は、実際の走行における車両駆動システムの総排出量を最小限に抑制することである。車両駆動システムを、最も危機的な走行サイクル、又は、特に危機的な走行サイクルに合わせて適合若しくは最適化すれば、全てのサイクルにおいて基準の遵守を保証することは可能かもしれないが、さほど危機的でないサイクルにおける排出量が、これによって大幅に悪化してしまう危険性が存在する。その場合にはさらに、よくあることではあるが、このさほど危機的でないサイクルが、実際の走行動作において比較的頻繁に発生するサイクルである場合、このような最適化によって、実際の走行における排出量に関してシステム全体が悪化してしまう。例えば、排出量を、危機的ではあるが実際には非常に稀であるような、極端な速度プロファイルを有する走行サイクル(例えば、強力な加速による極端な登坂走行)に合わせて最適化すれば、さほど危機的ではないがはるかに頻繁であるような、通常の速度プロファイルを有する走行サイクル(例えば、信号機を伴う短距離の市街地走行)の場合に、排出量が悪化してしまう可能性があり、これにより全体として、実際の走行における排出量が多くなり過ぎる可能性がある。
【0010】
従って、内燃機関を有する、排出量が最適化された車両を開発するためには、生成された速度プロファイルの分布が現実的に期待される分布に対応する又は近似するような多数の現実的な速度プロファイルを、自動的に生成することができることが非常に有利である。従って、生成された速度プロファイルが、実際の走行を代表する分布を有するようにすることが課題である。
【0011】
低排出量の駆動システムの開発、又は、そのような駆動システムの排出量が最適化された適用に加えて、そのような生成された速度プロファイルを、有利には、予測走行において使用することも可能であり、例えば、電気自動車又はEバイクのバッテリー管理において使用することも、ハイブリッド車両の駆動部管理において使用することも、内燃機関を有する車両の排気ガスコンポーネントの再生管理において使用することも可能である。コンポーネントの仕様を決めるために荷重スペクトル及び負荷シナリオを特定するためにも、このようにして生成された速度プロファイルは、例えばポンプのような特定のコンポーネントがその耐用期間中にどのような負荷を受けるかなどに、貴重な貢献を果たすことができる。
【0012】
従って、実際の走行を代表する分布での速度プロファイルを、コンピュータ支援によって生成することは、種々異なるシナリオにおいて、車両の開発又は最適化を大幅に改善することが可能であり、ひいては、より低排出量でより効率的な車両のため、特に、より低排出量でより効率的な車両の駆動システムのために寄与する、重要な技術課題である。
【課題を解決するための手段】
【0013】
従って、第1の態様においては、車両の走行曲線を生成するための機械学習システムを訓練するためのコンピュータ実装方法が提示される。
【0014】
走行曲線とは、車両の走行特性の推移を意味しており、走行特性は、車両のドライブトレインの、センサによって測定可能な、特に物理的又は技術的な特性であって、かつ、車両の移動運動を特徴付ける特性である。最も重要な変形例として、走行曲線には、車両の速度推移が含まれる。車両の速度推移は、特定の走行に対して、排出量、消費量、摩耗量、及び、同等の量を決定するための制御量である。速度推移は、速度値によって決定することができるが、加速度値のように速度値から導出可能な量によって決定することもできる。排出量、消費量又は摩耗量を決定するため等の用途にとって重要な推移を有する他の重要な走行特性には、特にアクセルペダルの位置又はトランスミッションの変速比が含まれる。
【0015】
本訓練方法は、以下のステップ、即ち、
・機械学習システムの生成器が、入力量としてランダムベクトルを受信し、当該ランダムベクトルに対してそれぞれ第1の走行経路と、これに対応する第1の走行曲線とを生成するステップと、
・走行経路と、走行動作中に検出されたそれぞれ対応する走行曲線とを、データベースに保存するステップと、
・データベースから、第2の走行経路と、走行動作中に検出されたそれぞれ対応する第2の走行曲線とを選択するステップと、
・機械学習システムの弁別器が、入力量として、第1の走行経路と、生成されたそれぞれ対応する第1の走行曲線とからなるペアと、第2の走行経路と、走行動作中に検出されたそれぞれ対応する第2の走行曲線とからなるペアとを受信するステップと、
・弁別器が、入力量に基づいて、当該入力量として受信したそれぞれのペアごとに、当該ペアが、生成された第1の走行曲線が含まれたペアであるのか、又は、走行動作中に検出された第2の走行曲線が含まれたペアであるのかを、特徴付ける又は表現する又は数値化する出力を計算するステップと、
・弁別器の出力に基づいて、生成された第1の走行曲線が含まれたペアの分布と、走行動作中に検出された第2の走行曲線が含まれたペアの分布との間の距離又は分散を、表現する乃至描写する又は数値化する目的関数を計算する、特に最適化するステップと、
を含む。
【0016】
好ましくは、目的関数の最適化に基づいて、機械学習システムのパラメータを適合させることにより、
a.生成された第1の走行曲線と、走行動作中に検出された第2の走行曲線とを識別するように、弁別器が最適化されるようにし、
b.弁別器によって、第2の分布で存在している、走行動作中に検出された第2の走行曲線に対して、可能な限り識別することが困難となるような、第1の分布での、生成された第1の走行曲線を生成するように、生成器が最適化されるようにする。
好ましい実施形態においては、機械学習システムのパラメータを、目的関数の勾配に基づいて適合させる。
【0017】
本提示による訓練方法は、代表的な走行曲線及び代表的な走行経路、又は、走行曲線と走行経路とからなる代表的なペアを生成することができるコンピュータ実装式の機械学習システムを提供し、これによって、今度は、排出量の最適化、又は、排出量に関するシステムの検証のような措置を、実際の代表的な影響を考慮しながら実施することが可能となる。例えば、代表的な走行経路として、勾配という経路特性を有する経路を生成することができ、代表的な走行曲線として、速度推移を生成することができる。これらの生成された量を用いて、組み合わせることによって、駆動システムの種々の最適化、又は、駆動システムの検証を、自動的に実行することが可能である。
【0018】
目的関数は、好ましくは、例えばジェンソン・シャノン距離のような静的距離として実装されている。好ましくは、目的関数は、ワッサースタイン計量として、特に、第1の走行曲線の第1の分布と、第2の走行曲線の第2の分布との間のワッサースタイン距離として実装される。これによって有利には、生成されたデータの分布が、測定されたデータの分布の完全な分散を反映することとなり、いわゆるモード崩壊が阻止される。さらに、より安定的でより効率的な訓練と、より良好な収束とが可能になる。なぜなら、この目的関数が、勾配消失(vanishing gradients)を阻止するからである。目的関数は、弁別器における過多な最適化ステップに対してロバストである。目的関数としてのワッサースタイン計量の使用を最適化するために、好ましい実施形態においては、目的関数を、正則部の分だけ拡張し、又は、重みクリッピングを実施することが提案される。
【0019】
さらに、生成器及び弁別器の入力量は、それぞれ追加的な情報、特に運転者特性及び/又は車両特性を含むことができる。このような、特に離散化もされていない追加情報によって、走行曲線は、さらなる量、例えば車両の動力方式又は運転者の経験を条件とすることが可能となり、このことにより、生成された走行曲線に基づいたより正確な適合及び推定が可能になる。
【0020】
ランダムベクトルは、特に乱数生成器によって生成される。ランダム量を、有利には、一つには、大域的なランダムベクトルとして、又は、一時的又は局所的なランダムベクトルとして、実装することができる。これに代えて、ランダム量を、大域的なランダムベクトルと、一時的又は局所的なランダムベクトルとの組合せとして実装してもよい。大域的なランダムベクトルと、一時的/局所的なランダムベクトルとの組合せは、特に有利であることが判明している。なぜなら、これによってデータにおける分散を、大域的な影響と、局所的又は一時的な影響との両方に基づいて表現することができるからである。
【0021】
好ましい実施形態においては、生成器及び/又は弁別器は、それぞれニューラルネットワークとして、特にリカレントニューラルネットワークとして実装されている。これによって、任意の長さの走行曲線を生成又は評価することも可能となり、この場合、走行曲線の各区分間の遷移部は、学習された遷移モデルと常に整合的になっている。リカレントニューラルネットワークを、特に、長短期記憶(long short-term memory:LSTM)ニューラルネットワーク、又は、ゲート付きリカレントユニット(gated recurrent units:GRU)として実装することができる。
【0022】
好ましい実施形態においては、有利には、いわゆる予測走行を考慮することも可能である。この場合には、車両の速度を、運転者の挙動によって、又は、自動的な車両介入によっても、例えば、既に見える信号機、既知の後続の速度制限等の、未来又は後続の経路特性に合わせて既に適合させることが可能であるということが考慮される。このために、好ましい実施形態においては、生成器を、双方向リカレントニューラルネットワークとして実装することができる。
【0023】
本提示によるさらなる態様においては、本提示による訓練方法を用いて学習される機械学習システムの要素を、走行曲線を生成するため(生成器)又は評価するため(弁別器)のコンピュータ実装式のシステムとして使用することができる。
【0024】
特に、車両の駆動システムの経路固有の排出量を、このようにして生成された走行曲線に基づいて特定することができ、例えば、駆動システムのモデルが計算されるシミュレーションにおいて計算することができる。そのようなモデルは、駆動システムの機関と、排気ガス後処理システムとを記述するサブモデルを含むことができる。
【0025】
その後、今度は、このようにして生成された走行曲線に基づいて特定された、車両の駆動システムの経路固有の排出量を用いて、駆動システムの検証又は適合を実施することが可能であり、特に、排出量を最小限に抑制する適合を実施することが可能である。
【0026】
既に説明したように、生成された走行曲線の代表的な分布によって、駆動システムの排出量を、個々の走行曲線又は特に危機的な走行曲線に合わせて最適化しないような適合を実施することができる。むしろ、実際の走行において予期される排出量が全体的に最小化されるように、駆動システムを最適化することが可能である。
【0027】
最適化を、駆動システムの開発時にコンポーネント若しくはパラメータを適合させることによって実施することができ、駆動システムの適用時にデータを適合させることによって実施することができ、又は、車両内で駆動システムの動作中に制御量を適合させることによって実施することができる。
【0028】
コンピュータプログラムを、上述したコンピュータ実装方法を実行するように構成して、機械可読記憶装置に保存することができる。そのような機械可読記憶装置を有するコンピュータ実装式の学習システムを、本方法を実行するように構成することができ、この場合、実行されるべき計算は、コンピュータ実装式の学習システムの1つ又は複数のプロセッサによって実行される。
【図面の簡単な説明】
【0029】
図1】機械学習システムのためのコンピュータ実装式の訓練方法を例示的に示す図である。
【発明を実施するための形態】
【0030】
データベース2には、車両の走行経路又は経路が、それぞれ対応する走行曲線と一緒に保存されている。図1には、データベース2内の、経路と、これに対応する走行曲線とからなるペアの一例が参照符号21で示されている。データベース2内の走行曲線は、車両の走行動作中に検出又は測定された走行曲線に相当する。即ち、好ましくは、走行曲線は、対応する経路を実際に車両が走行したときに車両のセンサによって検出及び保存したものである。データベースは、機械可読記憶装置に体系的に保存されたデータを表しているに過ぎない。
【0031】
さてここで、機械学習システム4において、走行曲線と、これに対応する走行経路とを生成するように、生成器41が訓練されることとする。これらの走行曲線は、ランダムな入力量に基づいて決定されることとし、このためにブロック3においては、ランダムベクトルのようなランダム量を供給することができる。ブロック3において、特に乱数生成器を実装することができ、なお、この乱数生成器は、擬似乱数生成器であってもよい。
【0032】
生成器41によって生成された走行曲線を、好ましくは、データベース2からの走行動作中に特定された走行曲線に対して、可能な限り識別することができない又はほとんど識別することができないものにしたい。このために、弁別器42は、生成器41によって生成された走行曲線と、データベース2から抽出された走行曲線とを、可能な限り良好に識別することができるように訓練され、又は、走行曲線と、走行経路若しくは経路特性とからなるそれぞれのペアを、可能な限り良好に識別することができるように訓練される。学習システムは、走行動作中に特定された個々の走行曲線に対して、可能な限り識別することができないような又はほとんど識別することができないような個々の走行曲線及び走行経路を生成すべきである、というだけではない。むしろ、入力量のパラメータ空間内での、生成された走行曲線及び走行経路の分布も、入力量のパラメータ空間内での、走行動作中に特定された走行曲線及び走行経路の分布に可能な限り近似させるべきであり、即ち、走行曲線及び走行経路の代表的な分布が得られるようにすべきである。
【0033】
このために機械学習システム4の訓練は、生成器41及び弁別器42のどのパラメータが適合されたかに基づいて、目的関数5を最適化することを含む。
【0034】
以下においては、機械学習システム4の本提案による訓練を、図1に基づいてより詳細に説明することとする。
【0035】
経路は、特に離散的なデータ点のシーケンスとして決定されており、それぞれのデータ点又はそれぞれの離散化刻みごとに、その離散化刻みにおける経路特性が保存されている。このことは、特にデータベース内に保存された経路のような、生成された経路に当てはまる。
【0036】
経路rは、例えば長さNを有し、即ち、r=(r,・・・,r)である。それぞれのデータ点rが、1つの離散化刻みに対応する。特に好ましいのは、離散化刻みが、時間的又は空間的な離散化に対応するように実現することである。時間的な離散化の場合には、データ点は、経路が開始してからのそれぞれ1つの過ぎ去った時刻に対応し、従って、データ点のシーケンスは、時間的な推移に対応する。空間的な離散化の場合には、データ点は、経路に沿って移動したそれぞれ1つの区間に対応する。
【0037】
サンプリングレートは、基本的に一定である。時間的な離散化の場合には、サンプリングレートを、例えばx秒として定義することができ、空間的な離散化の場合には、例えばxメートルとして定義することができる。
【0038】
経路のそれぞれのデータ点rは、それぞれの対応する離散化刻みにおける経路特性を記述しており、即ち、r∈Rである。Dは、経路特性の数であり、この場合、多次元の経路特性のうちのそれぞれの次元は、1次元の経路特性の1つの次元としてカウントされる。
【0039】
そのような経路特性は、例えば、離散化刻み、特に、時点若しくは時間間隔、場所若しくは区間、又は、距離に関連して、それぞれ以下のものとすることができる。
・絶対高度又は勾配のような、地理的特性
・時間依存性の平均交通速度のような、交通流の特性
・車線の数、道路の種類、又は、道路の曲率のような、道路特性
・速度制限、信号機の数、又は、特に停止若しくは優先道路若しくは横断歩道などの特定の交通標識の数のような、交通管理の特性
・所定の時点における雨量、風速、霧の存在のような、気象特性
【0040】
特に、生成された経路と、データベース内に保存された経路とは、同一又は同種の経路特性によって決定されている。
【0041】
ブロック3においてランダムベクトルが決定され、このランダムベクトルは、ステップ31において生成器41に送信される。ランダムベクトルzは、抽出されるものであり、即ち、ランダムに決定されるものである。特に、z∈Rが当てはまり、なお、任意選択的にLを、経路の長さNに依存させてもよい。zが抽出される分布は、好ましくは単純な分布族に、例えばガウス分布又は一様分布に規定されている。
【0042】
従って、生成器41の入力量は、少なくともランダムベクトルzを含む。さてここで、生成器41は、入力量(ステップ31)に基づいて、走行曲線及び走行経路を生成する。このために生成器42は、生成モデルを実行するコンピュータ実装されたアルゴリズムを有し、走行曲線及び走行経路を出力する(ステップ43)。
【0043】
生成器41によって生成されたそのような走行曲線を、例えば、x=(x,・・・,x)として出力することができ、生成されたこれに対応する走行経路と同様に、場所に関して離散化された状態で設けることができる。これに代えて、例えば、生成された経路特性、即ち、走行経路を、場所に関して離散化された状態で設け、その一方で、生成された走行曲線、即ち、例えば生成された速度を、時間に関して離散化された状態で設けるようにしてもよい。
【0044】
生成された走行曲線及び走行経路の長さに影響を与えるために、又は、生成された走行曲線及び走行経路の長さを規定するために、好ましい実施形態においては、生成器41にはさらに、生成されるべき走行曲線及び走行経路の長さNをあらかじめ供給することができる。この長さNは、固定された値であってもよいし、又は、コンフィギュレーション可能な値であってもよいし、又は、好ましい変形形態においては、経路長さの真の分布を代表する分布からサンプリングされたものであってもよい。この分布を、例えば、上述したデータベース又は他のデータベースから抽出することができる。生成器41としてリカレントニューラルネットワークを使用する場合には、生成を、N回のステップの後に終了させることができ、又は、Nを、生成器41のさらなる入力量として設けることができる。
【0045】
代替実施形態においては、所定の終了基準が規定され、特に、生成中に生成されるデータ(走行曲線、走行経路)の長さを決定するランダムな終了基準が規定される。例えば、経路の終わりを通知する特別な記号(例えば、$,-1,NAN)を挿入することができる。生成器41がこの記号を初めて生成するとすぐに、経路が終了される。
【0046】
生成モデルは、パラメータθによってパラメータ化されている。生成モデルのアーキテクチャは、例えばリカレントニューラルネットワークであってもよい。生成器のコンピュータ実装は、生成モデルを実行するアルゴリズムと、このモデルのパラメータとを、機械可読記憶装置に保存することによって実施され、即ち、プロセッサによってアルゴリズムの計算ステップを処理し、生成された走行曲線を機械可読記憶装置に保存することによって実施される。
【0047】
1つの可能な実施形態においては、走行曲線を、固定された長さで生成することができ、即ち、固定された数の離散化刻み又はデータ点で生成することができる。比較的長い走行曲線を生成する場合には、複数の生成された短い時系列を相互に連結させる必要があろう。しかしながら、その場合には、遷移部は、通常、整合的ではなくなってしまうだろう。代替実施形態においては、任意の長さの走行曲線を生成又は評価することも可能となるように、かつ、遷移部が、学習された遷移モデルと常に整合的になるように、本方法を拡張することができる。このために好ましくは、生成器及び弁別器の両方が、リカレントニューラルネットワークとして実装され、例えば、長短期記憶(LSTM)ニューラルネットワーク又はゲート付きリカレントユニット(GRU)として実装される。構造的に、生成器は、好ましくはベクトル・ツー・シーケンス・モデル(vector-to-sequence model)として構成されているが、生成器を、シーケンス・ツー・シーケンス・モデル(sequence-to-sequence model)として実装することもできる。弁別器は、好ましくはシーケンス・ツー・スカラー・モデル(sequence-to-scalar model)として構成されているが、弁別器を、シーケンス・ツー・シーケンス・モデル(sequence-to-sequence model)として実装することもできる。
【0048】
リカレントニューラルネットワークとしての生成モデルのアーキテクチャに関しては、種々の選択肢が存在する。
【0049】
例えば、大域的なランダムベクトルzを、走行曲線全体にわたってサンプリングすることができ、なお、大域的という用語自体は、時間的又は空間的な離散化を意味することができる。この実施形態においては、潜在空間内において、走行曲線を大域的に変化させる特性、例えば、一定の運転者特性(例えば、年齢又は経験)、一定の気象特性(例えば、連続雨)、又は、一定の車両特性(例えば、動力方式)のような、経路にわたって一定である特性が、考慮又は学習される。ここで、このランダムベクトルを、最初の時間刻みにおける隠れた状態(hidden state)を初期化するために使用することができ、及び/又は、それぞれの時間刻みにおいてリカレントニューラルネットワークに供給することができる。
【0050】
局所的又は一時的なランダムベクトルzをサンプリングすることもでき、即ち、潜在空間内において、走行曲線を局所的又は一時的に変化させる特性、例えば、短期的な交通管理又は交通流の特性(信号機の状態、交差点の待機車列、路上の歩行者)のような短期的な特性が考慮又は学習される。ランダムベクトルがM個の時間刻みの間隔で新たに生成され、リカレントニューラルネットワークに供給される。なお、M>0である。Mは、推計学的であってもよく、即ち、ランダムベクトルを、ランダムな間隔で変化させてもよい。
【0051】
好ましい実施形態においては、大域的なランダムベクトルと、局所的又は一時的なランダムベクトルとの組合せを実施することもできる。ランダムベクトルのいくつかの次元は、1つの走行曲線につき1回だけサンプリングされ、残余の次元は、M個の時間刻みごとに変化する。これに代えて、大域的なランダムベクトルを、基本的に、それぞれの時間刻みにおいてリカレントニューラルネットワークに供給してもよく、この場合、大域的なランダムベクトルは、M個の時間刻みごとに局所的な(即ち、新たにサンプリングされた)ランダムベクトルによって置き換えられる。
【0052】
大域的なランダムベクトルと、局所的なランダムベクトルとの組合せは、特に有利であることが判明している。なぜなら、これによってデータにおける分散を、大域的な影響と、局所的又は一時的な影響との両方に基づいて表現することができるからである。
【0053】
好ましくは、生成モデルにおいて、予想走行又は予測走行を考慮することもできる。
【0054】
従って、生成モデルとして、双方向リカレントニューラルネットワークを使用することができ、この双方向リカレントニューラルネットワークにおいては、リカレントニューラルネットワークの未来のセルの隠れた状態(hidden state)が追加的に考慮される。これによって、全ての起こり得る未来の時間刻みを明示的に一緒に取り入れることができる。
【0055】
即ち、時点tでの速度又は経路特性の生成は、現在の時点tでの内部状態(及び場合によっては時点t-1の隠れた状態)のみを条件とするのではなく、時点tでの速度を生成するために、未来の内部状態も、ひいては間接的に未来の経路特性及び速度推移も、一緒に取り入れることができる。これにより、いわゆる「予測走行」をシミュレートすることが可能となり、例えば、特に、遠くから既に見える経路特性(例えば、信号機、速度制限、高速道路の出口等)に対して速度を適合させるという観点で、運転者の初期の反応をシミュレートすることが可能となる。さらに、例えば経路の終わりに、さらにデフォルト値だけ、例えば未来の経路特性の場合には0だけを設けることによって、アルゴリズムが、この経路の終わりに速度0に戻ることを学習することが可能となる。
【0056】
このようにして決定された経路は、それぞれ、これらの経路に対応する、走行動作中に実際に測定された走行曲線と一緒にデータベース2に保存されている。経路と、これに対応する走行曲線とからなるこれらのペアが、機械学習システムのために訓練データとして使用される。この訓練のために、特に経路と、これに対応する走行曲線とからなるペアが選択され、ステップ23及び24において弁別器42に送信される。さらに、ステップ13又は43において、生成された走行経路と、この経路に基づいて生成器41によって生成された走行曲線とからなるペアも、弁別器42に送信される。
【0057】
弁別器42は、弁別モデルを実行するコンピュータ実装されたアルゴリズムを有する。入力量として、弁別器42は、経路と、これに対応する走行曲線とからなるペアを受信し、この受信したペアが、(生成器41によって)生成された走行曲線を含んでいるのか、又は、(データベース2から得られた)実際に測定された走行曲線を含んでいるのかを判定する。この判定の結果は、ステップ44において出力される。例えば、弁別器42は、「本物の走行曲線」であると判定した場合には、>0の値を出力することができ、「生成された走行曲線」であると判定した場合には、<0の値を出力することができる。これに代えて、例えば、クラスラベルのような事前に規定された値を出力してもよい。弁別モデルは、パラメータθによってパラメータ化されている。判定の出力44は、特に、バイナリの判定「はい」/「いいえ」に関する評価を含む。
【0058】
弁別器のコンピュータ実装は、弁別モデルを実行するアルゴリズムと、このモデルのパラメータとを、機械可読記憶装置に保存することによって実施され、即ち、プロセッサによってアルゴリズムの計算ステップを処理し、その出力を機械可読記憶装置に保存することによって実施される。
【0059】
弁別器42を、例えば、リカレントニューラルネットワークとして実装することができる。これによって、特に任意の長さの走行曲線を評価することが可能となる。
【0060】
評価するため(生成された走行曲線及び走行経路であるのか、走行動作中に特定された走行曲線及び経路特性であるのかを判定するため)には、複数の実施形態が存在する。この評価を、特に、それぞれの個々の時間刻みごとに新しく行うことができる。その場合には、走行曲線及び走行経路の大域的な評価は、例えば、個々の評価の平均であり、又は、多数決である。これに代えて、走行曲線全体及び走行経路全体の評価を、最後の時間刻みに対してのみ行ってもよい。後者の実施形態は、特に追加的な計算ステップを省略しており、走行曲線全体と走行経路全体とが、均等に評価に含め入れられるというさらなる利点を有する。
【0061】
弁別器42の出力44に基づいて、ブロック5において目的関数が最適化され、特に損失関数が最小化される。このために弁別器の入力量は、特に、本物のサンプル(即ち、走行動作中に特定された走行曲線が含まれたペア)としてラベル付けされており、又は、生成されたサンプル(即ち、生成器41によって生成された走行曲線が含まれたペア)としてラベル付けされている。目的関数は、生成された走行曲線が実際に測定された走行曲線にどの程度まで対応しているのかを特徴付けるものであり、又は、パラメータ空間内での、生成された走行曲線の分布が、パラメータ空間内での、測定された走行曲線の分布にどの程度まで対応しているのかを特徴付けるものである。目的関数の適合に基づいて、生成器41の又は生成器41で実行される生成モデルのパラメータθと、弁別器42の又は弁別器42で実行される弁別モデルのパラメータθとが適合される。これらのパラメータは、特に目的関数の勾配に関して適合される。
【0062】
目的関数は、生成された走行曲線及び走行経路の分布と、走行動作中に特定された走行曲線及び走行経路の分布との間の差若しくは距離を特徴付けるように若しくは表すように選択されており、又は、目的関数は、生成された走行曲線が含まれた経路-走行曲線ペアの分布と、走行動作中に特定された走行曲線が含まれた経路-走行曲線ペアの分布との間の差若しくは距離を特徴付けるように若しくは表すように選択されている。このような目的関数を選択することにより、生成されたデータの分布が、測定されたデータの分布の完全な分散を反映するように、機械学習システムを訓練することができる。いわゆるモード崩壊が阻止される。このことは、即ち、走行曲線及び走行経路の代表的な分布が提供されるということを意味する。目的関数は、特に観測不能な影響の分散も考慮する。
【0063】
好ましくはこのために、目的関数として損失(loss)関数が選択され、この損失関数は、各分布間のワッサースタイン計量又はワッサースタイン距離として実装されている。
【0064】
コンピュータ実装式の訓練のこの実施形態においては、弁別器を、好ましくはリプシッツ制約付きの関数に制限すべきである。好ましい実施形態においては、このために目的関数が、正則化項の分だけ拡張され、例えば、(i)本物のサンプル(即ち、走行動作中に特定された走行曲線が含まれたペア)の勾配が0へと勾配ペナルティ(gradient penalty)若しくはセンタリングされ、又は、(ii)生成されたサンプル(即ち、生成された走行曲線が含まれたペア)の勾配が0へと勾配ペナルティ若しくはセンタリングされ、又は、(iii)(本物のサンプルと生成されたサンプルとの平均値を表す)サンプルの勾配が1へと勾配ペナルティ若しくはセンタリングされる。この場合には、「本物のサンプルの勾配を0へとセンタリングする」という選択肢が特に好ましい。なぜなら、この選択肢は、複数の選択肢のうちの最も高速なものであることが判明しており、最適化問題の特に高速な収束をもたらすからである。これに代えて、それぞれの勾配ステップごとに、重みクリッピング(weight clipping)を実施してもよい。
【0065】
生成器41及び弁別器42が含まれた学習システム全体のコンピュータ実装式の訓練のための上述した方法は、min-max訓練目標として説明することができる。ここでは、弁別器42は、自身の正しい分類率を最大化し、その一方で、生成器41は、可能な限り弁別器42を誤解させるような走行曲線及び走行経路を生成することによって正しい分類率を最小化する。
【0066】
生成器41の上述した入力量に加えて、さらなる入力量を生成器41に供給することもできる。例えば、ランダムベクトルに加えて、運転者特性に関する情報(経験、年齢、攻撃性、走行スタイル等)、又は、車両情報(出力、動力方式、駆動システムの種類等)を保存することができる。これにより、生成された走行曲線は、これらの追加的な情報を条件とすることも可能となる。この場合には有利には、機械学習システム4の訓練のために、それぞれデータベース2に保存された走行経路に関する対応する情報も保存されている。弁別器には、データベース2からの経路情報及び走行曲線(ステップ23)に対して、入力量としてこれらの追加情報が提供される。
【0067】
上述した訓練方法を用いて学習されるコンピュータ実装式の機械学習システムは、代表的な走行曲線及び走行経路を生成すること、又は、走行曲線と走行経路とからなる代表的なペアを生成することが可能である。このために、このようにして学習される機械学習システムの生成器に、ランダム量と、場合によってはさらなる情報とを供給することができ、この生成器は、対応する走行曲線及び走行経路を生成する。このようにして生成された走行曲線及び走行経路を使用して、車両の排出量をシミュレートすることが可能であり、ひいては、例えば、排気ガス基準を遵守するための確率論的評価を実施することが可能であり、排出量を最適化することが可能である。排出量の最適化を、例えば、開発時に駆動システムを適合させることによって実施することができ、又は、駆動システムの、例えば駆動システムを制御するための制御装置のデータ適用を最適化することによって実施することができ、又は、排出量が最適化されるように車両の駆動システムの制御量を適合させることによって実施することができる。後者の場合には、走行曲線及び走行経路の生成を、特に車両内で実施することができる。
【0068】
走行曲線及び/又は走行経路を、予測走行を最適化するために使用することも可能であり、例えば、電気自動車又はEバイクのバッテリー管理において使用することも、ハイブリッド車両の駆動部管理において使用することも、内燃機関を有する車両の排気ガスコンポーネントの再生管理において使用することも可能である。最適化自体は、開発時に、対応する制御装置のアプリケーションを最適化することによって、又は、車両内で対応するシステムの制御量を適合させることによって、実施することが可能である。
【0069】
コンポーネントの仕様を決めるために荷重スペクトル及び負荷シナリオを特定するためにも、このようにして生成された走行曲線及び/又は走行経路は、例えばポンプのような特定のコンポーネントがその耐用期間中にどのような負荷を受けるかなどに、貴重な貢献を果たすことができる。
図1