特開2022-89806 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ローベルト　ボツシユ　ゲゼルシヤフト　ミツト　ベシユレンクテル　ハフツングの特許一覧

特開2022-89806車両の動作プロファイルのモデリング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
2
3A
3B
4A
4B
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022089806

(43)【公開日】2022-06-16

(54)【発明の名称】車両の動作プロファイルのモデリング

(51)【国際特許分類】

G06N 20/00 20190101AFI20220609BHJP

【ＦＩ】

G06N20/00

【審査請求】未請求

【請求項の数】15

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2021197183

(22)【出願日】2021-12-03

(31)【優先権主張番号】10 2020 215 350.7

(32)【優先日】2020-12-04

(33)【優先権主張国・地域又は機関】DE

(71)【出願人】

【識別番号】390023711

【氏名又は名称】ローベルトボツシユゲゼルシヤフトミツトベシユレンクテルハフツング

【氏名又は名称原語表記】ＲＯＢＥＲＴＢＯＳＣＨＧＭＢＨ

【住所又は居所原語表記】Ｓｔｕｔｔｇａｒｔ，Ｇｅｒｍａｎｙ

(74)【代理人】

【識別番号】100114890

【弁理士】

【氏名又は名称】アインゼル・フェリックス＝ラインハルト

(74)【代理人】

【識別番号】100098501

【弁理士】

【氏名又は名称】森田拓

(74)【代理人】

【識別番号】100116403

【弁理士】

【氏名又は名称】前川純一

(74)【代理人】

【識別番号】100134315

【弁理士】

【氏名又は名称】永島秀郎

(74)【代理人】

【識別番号】100162880

【弁理士】

【氏名又は名称】上島類

(72)【発明者】

【氏名】マーティンシーク

(72)【発明者】

【氏名】ムハンマドビラルザファール

(57)【要約】

【課題】自動走行システムにおけるデータ駆動アルゴリズムの開発及び適用は、自動走行システムの正確なシミュレーションにとって益々重要になっている。自動走行システムをシミュレーションする際に、対象とする自動車システムの性能の一側面を特徴付ける複数の人工的なデータポイントを生成することが有利であることが証明可能である。このようにして、例えば、種々の将来のシナリオをシミュレーションし、統計的に評価することができる。
【解決手段】本発明は、機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法、機械学習のための生成モデルを使用して、人工的なデータ列を生成するためのコンピュータ実装された方法及び関連する装置に関する。本発明はさらに、関連するコンピュータプログラム要素及びコンピュータ可読媒体に関する。
【選択図】図３Ａ

【特許請求の範囲】

【請求項1】

生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法（３０）であって、前記方法は、
・データ空間から複数のデータ列を取得すること（３２）を含み、ここで、各データ列は、車両又はロボットの少なくとも１つの動作プロファイルを記述し、
・機械学習のための前記生成モデルのトレーニング時の少なくとも１つの生成フェーズの間に、分布からサンプリングすることによって複数の人工的なデータ列を生成すること（３３）を含み、
・機械学習のための前記生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、前記識別器モデルに、（ｉ）取得された前記複数のデータ列からのデータ列、又は、（ｉｉ）前記複数の人工的なデータ列からの人工的なデータ列を入力すること（３４）を含み、
・機械学習のための前記生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、前記識別器モデルへの入力を、前記データ空間からのデータ列として、又は、少なくとも、前記識別器モデルの第１の関数及び第２の関数を使用した人工的なデータ列として、分類すること（３５）を含み、ここで、前記第１の関数（１０）の複数の入力は、前記人工的なデータ列の複数の連続的なサンプルを含み、前記第２の関数（２６）の少なくとも１つの入力は、前記人工的なデータ列の複数の異なるステップから得られた前記人工的なデータ列の少なくとも２つのデータサンプルを含み、
・トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための前記生成モデルの前記生成器モデル及び前記識別器モデルを反復的にトレーニングすること（３６）を含む、
コンピュータ実装された方法（３０）。

【請求項2】

前記第１の関数の前記入力は、前記識別器モデルへの前記入力の時間的に積分された関数であり、前記第２の関数の前記入力は、前記識別器モデルへの前記入力の微分可能な関数である、
請求項１に記載のコンピュータ実装された方法（３０）。

【請求項3】

・ニューラル識別器ネットワークを用いて前記第１の関数の前記出力と前記第２の関数の前記出力とを結合することをさらに含み、
前記第１の関数は、リカレント・ニューラル・ネットワーク、任意選択的に長・短期記憶ネットワークであり、及び／又は、
前記第２の関数は、前記人工的なデータ列のうちの少なくとも１つの人工的なデータ列の射影によって、さらに、射影された前記少なくとも１つの人工的なデータ列と、前記複数のデータ列のうちの少なくとも１つのデータ列との組合せに基づいた、前記識別器モデルの前記第２の関数の結果の取得によって得られ、
前記ニューラル識別器ネットワークは、任意選択的に、前記識別器モデルの前記第１の関数と前記第２の関数との線形結合を計算する、
請求項１又は２に記載のコンピュータ実装された方法（３０）。

【請求項4】

前記複数のデータ列に含まれる前記データ列は、時間列又は距離列のいずれかであり、前記複数の人工的なデータ列のうちの前記人工的なデータ列は、人工的な時間データ列又は人工的な距離データ列のいずれかである、
請求項１乃至３のいずれか一項に記載のコンピュータ実装された方法（３０）。

【請求項5】

前記複数の人工的なデータ列を提供するために、前記少なくとも１つの生成フェーズにおいて潜在空間をサンプリングする、
請求項１乃至４のいずれか一項に記載のコンピュータ実装された方法（３０）。

【請求項6】

・少なくとも１つの停止基準を使用して、前記生成器モデルの前記反復的なトレーニングを停止させることをさらに含み、前記少なくとも１つの停止基準を、前記生成器モデルの反復によって、前記識別器モデルの前記第２の関数を使用して生成された少なくとも１つの人工的なデータ列を評価することによって取得し、前記第２の関数は、前記停止基準を出力する、
請求項１乃至５のいずれか一項に記載のコンピュータ実装された方法（３０）。

【請求項7】

前記識別器モデルの前記第２の関数を、車両速度を表す少なくとも１つのデータ列と人工的な車両速度を表す少なくとも１つの人工的なデータ列とに基づく真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた値の列上において評価する、又は、
前記識別器モデルの前記第２の関数は、車両速度を表す少なくとも１つの人工的なデータ列に基づいて、ゼロ速度において費やされた時間を評価するように構成されている、又は、
前記複数のデータ列は、経路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能のうちの少なくとも１つを含む、車両の複数の動作プロファイルを記述し、前記識別器モデルの前記第２の関数への前記入力は、速度－加速度ヒストグラムからサンプリングされる複数の速度－加速度対を含む、又は、
前記複数のデータ列は、自律型又は半自律型のロボットのアクチュエータの一連の変位、一連の速度又は一連の位置のうちの少なくとも１つを含む、前記自律型又は半自律型のロボットの複数の動作プロファイルを記述する、
請求項１乃至６のいずれか一項に記載のコンピュータ実装された方法（３０）。

【請求項8】

前記識別器モデルの前記出力は、

【数1】

によって規定され、ここで、ｆ_ｒｎｎ（ｘ_１：Ｔ）は、第１の関数であり、ｆ_ｅｘｐ（ｘ_１：Ｔ）は、第２の関数であり、Φ（．）及びΨ（．）は、任意選択的に多層パーセプトロンとして実行される射影である、
請求項１乃至７のいずれか一項に記載のコンピュータ実装された方法（３０）。

【請求項9】

前記識別器モデルの前記第２の関数に入力される前記データ列は、単位時間あたりの整数の車両停止回数、所定の速度までの車両加速の持続時間、所定の速度までの車両減速の持続時間、ゼロ速度までの車両減速の持続時間、経路湾曲に対する車両速度、経路傾斜に対する車両速度、総走行持続時間に対する車両速度、単位時間あたりの整数のギアチェンジ回数、予め定められた速度を達成するためのギアチェンジ機能、ゼロ速度を達成するためのギアチェンジ機能、経路湾曲に対するギアチェンジ機能、経路傾斜に対するギアチェンジ機能、総走行持続時間に対するギアチェンジ機能、ロボットのアクチュエータの位置のうちの１つ又は複数を規定する、
請求項１乃至８のいずれか一項に記載のコンピュータ実装された方法（３０）。

【請求項10】

機械学習のためのトレーニングされた前記生成モデルは、前記識別器モデルにおいて前記第２の関数を用いずに生成される複数の人工的なデータ列の統計的な分布に比較して、前記複数のデータ列の統計的な分布により類似した統計的な分布を有する複数の人工的なデータ列を生成するために構成されている、
請求項１乃至９のいずれか一項に記載のコンピュータ実装された方法（３０）。

【請求項11】

機械学習のための生成モデルを使用して、車両又はロボットの人工的な動作プロファイルを表す、人工的なデータサンプルを生成するためのコンピュータ実装された方法（３０）であって、
・請求項１乃至１０のいずれか一項に記載の方法に従って取得された複数のモデルパラメータに従って、機械学習のための生成モデルを構成することと、
・疑似ランダムベクトルを提供するために構成されている分布からサンプリングすることによって、複数のサンプルを取得することと、
・データ空間内においてさらなる複数の人工的なデータサンプルを取得するために、前記分布の前記複数のサンプルを復号化することと、
・車両又はロボットの前記人工的な動作プロファイルを表す、前記さらなる複数の人工的なデータサンプルを出力することと、
を含む、コンピュータ実装された方法（３０）。

【請求項12】

メモリに格納されている生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするための装置（５０）であって、前記装置は、
・データ空間から複数のデータ列を取得するように構成されている入力インタフェース（５２）を含み、ここで、各データ列は、車両又はロボットの少なくとも１つの動作プロファイルを記述し、
・機械学習のための前記生成モデルのトレーニング時の少なくとも１つの生成フェーズの間に、分布からサンプリングすることによって少なくとも１つの人工的なデータ列を生成するように構成されているプロセッサ（５４）を含み、ここで、
前記プロセッサは、機械学習のための前記生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、前記識別器モデルに、（ｉ）取得された前記複数のデータ列からのデータ列、又は、（ｉｉ）前記少なくとも１つの人工的なデータ列からの人工的なデータ列を入力するように構成されており、
前記プロセッサは、機械学習のための前記生成モデルのトレーニング時の前記少なくとも１つの識別フェーズの間に、前記識別器モデルへの前記入力を、前記データ空間からのデータ列として、又は、少なくとも、前記識別器モデルの第１の関数及び第２の関数を使用した人工的なデータ列として、分類するように構成されており、前記第１の関数の複数の入力は、前記人工的なデータ列の複数の連続的なサンプルを含み、前記第２の関数の少なくとも１つの入力は、前記人工的なデータ列の複数の異なるステップから得られた前記人工的なデータ列の少なくとも２つのデータサンプルを含み、
前記プロセッサは、トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための前記生成モデルの前記生成器モデル及び前記識別器モデルを反復的にトレーニングするように構成されており、
前記装置は、
・機械学習のための前記トレーニングされたモデルを出力するように構成されている出力インタフェース（５６）をさらに含む、
装置（５０）。

【請求項13】

１つ又は複数のコンピュータプログラム要素であって、前記コンピュータプログラム要素は、少なくとも、
（ｉ）機械学習の使用の下における、請求項１乃至１０のいずれか一項に記載の方法に従った機械学習のための生成モデルをトレーニングするためのコンピュータ実行可能な命令、及び／又は、
（ｉｉ）請求項１１に記載の人工的なデータ列の生成のためのコンピュータ実行可能な命令、及び／又は、
（ｉｉｉ）請求項１乃至１０のいずれか一項に従ってトレーニングされる機械学習のための生成モデルを提供するためのモデルパラメータを含むコンピュータ実行可能な命令
を含む、１つ又は複数のコンピュータプログラム要素。

【請求項14】

請求項１３に記載のコンピュータプログラム要素のうちの１つ又は複数を含むコンピュータ可読媒体。

【請求項15】

車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルをトレーニングするためのコンピュータ実装された方法（４０）であって、
・請求項１１に記載のコンピュータ実装された方法に従って生成された車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を取得すること（４１）と、
・車両の前記人工的な動作プロファイルを表す、前記さらなる複数の人工的なデータ列を、機械学習のためのさらなるモデルに入力すること（４２）と、
・機械学習のための前記さらなるモデルを反復的にトレーニングすること（４３）と、
・車両の動作プロファイルをモデリングする機械学習のための前記さらなるモデルのさらなる複数のモデルパラメータを出力すること（４４）と、
を含む、コンピュータ実装された方法（４０）。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法、機械学習のための生成モデルを使用して人工的なデータサンプルを生成するためのコンピュータ実装された方法、及び、関連する装置に関する。本発明はさらに、関連するコンピュータプログラム要素及びコンピュータ可読媒体に関する。

【背景技術】

【0002】

従来技術
自動走行システムにおけるデータ駆動アルゴリズムの開発及び適用は、自動走行システムの正確なシミュレーションにとって益々重要になっている。自動走行システムをシミュレーションする際に、対象とする自動車システムの性能の一側面を特徴付ける複数の人工的なデータポイントを生成することが有利であることが証明可能である。このようにして、例えば、種々の将来のシナリオをシミュレーションし、統計的に評価することができる。

【0003】

このテーマ領域内には、例えば、先に取得された車両軌跡データに基づく車両軌跡予測データの生成が含まれる。敵対的生成ネットワーク（ＧｅｎｅｒａｔｉｖｅＡｄｖｅｒｓａｒｉａｌＮｅｔｗｏｒｋ－ＧＡＮ）は、通常、生成モデルを提供するために使用される。しかし、このようなアプローチをさらに改善することができる。

【発明の概要】

【課題を解決するための手段】

【0004】

発明の概要
第１の態様によれば、生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法が提供される。この方法は、
・データ空間から複数のデータ列を取得することを含み、ここで、各データ列は、車両又はロボットの少なくとも１つの動作プロファイルを記述し、
・機械学習のための生成モデルのトレーニング時の少なくとも１つの生成フェーズの間に、分布からサンプリングすることによって複数の人工的なデータ列を生成することを含み、
・機械学習のための生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、識別器モデルに、（ｉ）取得された複数のデータ列からのデータ列、又は、（ｉｉ）複数の人工的なデータ列からの人工的なデータ列を入力することを含み、
・機械学習のための生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第１の関数及び第２の関数を使用した人工的なデータ列として、分類することを含み、ここで、第１の関数の複数の入力は、人工的なデータ列の複数の連続的なサンプルを含み、第２の関数の少なくとも１つの入力は、人工的なデータ列の複数の異なるステップから得られた人工的なデータ列の少なくとも２つのデータサンプルを含み、
・トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングすることを含む。

【0005】

１つの効果は、この方法に従ってトレーニングされている機械学習のためのモデルによって生成された人工的なデータが、真の車両アプリケーションシナリオの特有の特徴に関する真の分布と一致すること又はこれと近似することである。この結果、人工的なデータサンプルを生成するために識別器を使用してトレーニングされている生成器を使用する場合、シミュレーションの質が改善される。

【0006】

上述のアプローチに従って生成されたモデルを、有利には、車両の実行中の動作時にも使用することができる。エンジン制御ユニットは、例えば、燃費又は排気特性を、車両走行の記録された速度プロファイルに基づいて、又は、ナビゲーションシステムによって計算された車両の将来の経路に基づいて、又は、車両の現在の位置を考慮した、最も可能性の高い道のりに基づいて、予測することができる。将来の車両の動作モードを予測するようにモデルがトレーニングされている場合、このモデルを使用して車両を制御するエンジン制御ユニットよりも、所定の経路に対する排気又は燃費により正確に近似することができ、これによって、例えば、車両は、自身の排気を平均的に減少させることができる。

【0007】

このモデルの結果に基づいて、車両又はロボットの制御戦略を適合させることができる。電動車両又は電動ロボットの場合には、ある経路が、許容し得ないレベルよりもバッテリを消耗させると予測される場合、他の経路が提案されるものとしてよく、運転者アラームが起動されるものとしてよく、及び／又は、低電力モード（例えば、車両又はロボットの速度の制限）が開始されるものとしてよい。

【0008】

このモデルを、車両ルート探索ソフトウェアへの入力を、燃料性能又は排気性能に関して、評価するように構成することができる。より効率的な燃料性能又はより低い排気特性を有する経路を、出力インタフェース上において、より高い優先度により、運転者に提示することができる。

【0009】

このモデルを同様に、予想経路に基づくバッテリの消耗の予測又は充電時間の予測を改善するために、電気車両又はハイブリッド車両の制御ユニットにおいて使用することができる。

【0010】

第１の態様に従ってトレーニングされているモデルを使用して、１つ又は複数の、予測された経路上の走行によって引き起こされ得る車両構成部分の摩耗を推定することができる。

【0011】

さらに、機械学習のためのモデル（例えば、ｃＧＡＮ又はＧＡＮ）のトレーニングに使用されるプロセッサ又はシステムの内部動作の本態様は有利である。特に、第２のモジュールの実用的効果は、トレーニング中にＧＡＮ生成器又はｃＧＡＮ生成器に追加の勾配情報を提供することである。これは、実際のデータ列又は人工的なデータ列（任意選択的に速度－加速度ヒストグラム）から結果として生じる分布から得られる値の列などのドメイン特有の特徴に焦点を当てることによって、識別器のタスクを容易にし、これによって、同様にトレーニングを誘導し、トレーニングの安定性、速度及び精度の向上を生じさせ得る。

【0012】

第２の態様によれば、機械学習のための生成モデルを使用して、車両又はロボットの人工的な動作プロファイルを表す、人工的なデータサンプルを生成するためのコンピュータ実装された方法が提供される。この方法は、
・第１の態様の方法に従って取得された複数のモデルパラメータに従って、機械学習のための生成モデルを構成することと、
・疑似ランダムベクトルを提供するために構成されている分布からサンプリングすることによって、複数のサンプルを取得することと、
・データ空間内においてさらなる複数の人工的なデータサンプルを取得するために、この分布の複数のサンプルを復号化することと、
・車両又はロボットの人工的な動作プロファイルを表す、さらなる複数の人工的なデータサンプルを出力することと、
を含む。

【0013】

第３の態様によれば、車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルをトレーニングするためのコンピュータ実装された方法が提供され、この方法は、
・第２の態様のコンピュータ実装された方法に従って生成された車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を取得することと、
・車両の人工的な動作プロファイルを表す、さらなる複数の人工的なデータ列を、機械学習のためのさらなるモデルに入力することと、
・機械学習のためのさらなるモデルを反復的にトレーニングすることと、
・車両の動作プロファイルをモデリングする機械学習のためのさらなるモデルのさらなる複数のモデルパラメータを出力することと、
を含む。

【0014】

第４の態様によれば、メモリに格納されている生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするための装置が提供される。この装置は、データ空間から複数のデータ列を取得するように構成されている入力インタフェースを含み、ここでは、各データ列は、車両の少なくとも１つの動作プロファイルを記述する。この装置はさらに、機械学習のための生成モデルのトレーニング時の少なくとも１つの生成フェーズの間に、分布からサンプリングすることによって少なくとも１つの人工的なデータ列を生成するように構成されているプロセッサを含む。

【0015】

プロセッサは、機械学習のための生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、識別器モデルに、（ｉ）取得された複数のデータ列からのデータ列、又は、（ｉｉ）少なくとも１つの人工的なデータ列からの人工的なデータ列を入力するように構成されている。

【0016】

プロセッサは、機械学習のための生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第１の関数及び第２の関数を使用した人工的なデータ列として、分類するように構成されている。

【0017】

第１の関数の複数の入力は、人工的なデータ列の複数の連続的なサンプルを含み、第２の関数の少なくとも１つの入力は、人工的なデータ列の複数の異なるステップから得られた人工的なデータ列の少なくとも２つのデータサンプルを含む。

【0018】

プロセッサは、トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングするように構成されている。上記装置は、機械学習のためのトレーニングされたモデルを出力するように構成されている出力インタフェースをさらに含む。

【0019】

第５の態様によれば、１つ又は複数のコンピュータプログラム要素が提供され、このコンピュータプログラム要素は、少なくとも、
（ｉ）機械学習のための使用の下における、第１の態様の方法又はその実施形態に従った機械学習のための生成モデルをトレーニングするためのコンピュータ実行可能な命令、及び／又は、
（ｉｉ）第３の態様に従った人工的なデータ列の生成のためのコンピュータ実行可能な命令、及び／又は、
（ｉｉｉ）第１の態様又はその実施形態に従ってトレーニングされる機械学習のための生成モデルを提供するためのモデルパラメータを含むコンピュータ実行可能な命令
を含む。

【0020】

第６の態様によれば、第５の態様のコンピュータプログラム要素のうちの１つ又は複数を含むコンピュータ可読媒体が提供される。

【0021】

第７の態様によれば、車両が提供され、この車両は、車両を動作させるために駆動力を提供するように構成されている原動機と、複数のセンサと、少なくとも原動機をセンサからのフィードバックに基づいて制御するように構成されている車両エレクトロニクスユニットとを含む。車両エレクトロニクスユニットは、トレーニングされたモデルを第２の態様に従ってインスタンス化し、実施するように構成されているプロセッサを含む。トレーニングされたモデルは、センサからの入力信号を受信し、この入力信号をトレーニングされたモデルに適用するように構成されている。プロセッサは、トレーニングされたモデルを用いて、１つ又は複数の応答信号を計算するように構成されている。プロセッサは、トレーニングされたモデルを介して取得された応答信号への応答として、１つ又は複数の原動機の構成又は車両の他の出力アクチュエータの構成を適合させるように構成されている。

【0022】

本特許明細書において、車両は、要素（乗客又は有効荷重など）を運搬する又は輸送するためのあらゆる手段であるものとしてよい。車両の例としては、内燃機関、ハイブリッドエンジン、ガスエンジン、電動パワートレイン又は水素ハイブリッドエンジンを有している自動車、トラック、配送車又はバスが挙げられる。車両は、自律型又は半自律型の乗用車、バス又はトラックであるものとしてよい。車両は、電動自転車、電動スクータ、工場ロボット、フォークリフト又は電動車椅子であるものとしてよい。

【0023】

本特許明細書において、車両の動作プロファイルは、例えば、道路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能を記述する複数のサンプリングされたデータ列の１つ又は複数である。

【0024】

一例においては、トレーニングされたモデルは、この適用においては車両の一種とみなされる倉庫ロボットなどの半自律型又は自律型のロボットにも適用され得る。

【0025】

一例においては、識別器モデルの第２の関数への入力は、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた、一連の速度－加速度対を含む。他の例においては、動作プロファイルは、単位時間あたりの整数の車両停止回数、所定の速度までの車両加速の持続時間、所定の速度までの車両減速の持続時間、ゼロ速度までの車両減速の持続時間、経路湾曲に対する車両速度、経路傾斜に対する車両速度、総走行持続時間に対する車両速度、単位時間あたりの整数のギアチェンジ回数、予め定められた速度を達成するためのギアチェンジ機能、ゼロ速度を達成するためのギアチェンジ機能、経路湾曲に対するギアチェンジ機能、経路傾斜に対するギアチェンジ機能、総走行持続時間に対するギアチェンジ機能であるものとしてよい。

【0026】

その結果、一例においては、生成モデルの分布に、エキスパートによって規定される分布による影響を与えるサンプルの追加情報を提供するために、識別器の第２の関数を評価することができる。

【図面の簡単な説明】

【0027】

【図1A】経路／速度データサンプル上において条件付き敵対的生成ネットワークをトレーニングするためのアプローチを示す図である。

【図1B】機械学習のためのトレーニングされた生成ネットワークを使用して経路／速度データサンプルを生成するためのアプローチを示す図である。

【図2】図１Ｂの条件付き敵対的生成ネットワークの識別器をより詳細に示す図である。

【図3A】第１の態様に従った車両の動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法を示す図である。

【図3B】第２の態様に従った機械学習のための生成モデルを使用して、車両の人工的な動作プロファイルを表す人工的なデータサンプルを生成するためのコンピュータ実装された方法を示す図である。

【図4A】機械学習のためのシステムの例示的な構造を示す図である。

【図4B】データ生成器の例示的な構造を示す図である。

【図5】機械学習のためのシステムの識別器の例示的な構造を示す図である。

【図6】機械学習のためのシステムの識別器の詳細な実施形態を示す図である。

【図7】第３の態様に従った装置を示す図である。

【図8】第７の態様に従った車両を概略的に示す図であり、車両には制御デバイスが設置されており、制御デバイスは、第１の態様に従ってトレーニングされているモデルを適用するように構成されている。

【発明を実施するための形態】

【0028】

詳細な説明
ここでは、生成モデルの改善が提示されている。生成モデルは、この生成モデルをトレーニングするために以前に使用されたデータサンプルのセットを表すデータサンプルを生成することができるニューラルネットワークアーキテクチャである。一例においては、生成モデルは、敵対的生成ネットワーク（ＧＡＮ）又は条件付き敵対的生成ネットワーク（ｃＧＡＮ）の生成器であるものとしてよい。

【0029】

人工的な速度曲線を生成するための生成モデルは（例えば）サンプルを生成することができ、このサンプルは、実際のように見えるが、生成された軌跡が、場合によっては真のデータの統計と一致しないことがある。例えば、速度軌跡が生成される場合、経路に沿った信号機の存在、特定の交差点における他の運転者の行動、時間帯、運転者の気分などの外的要因は、従来の速度曲線生成が考慮しない影響を生じさせる。このような外部の影響は、生成された速度軌跡の統計に影響を与えるアプリケーション特有の歪みを形成する。

【0030】

一例として、速度－加速度ヒストグラムを表す分布からのサンプルの取得が、生成ネットワークによって生成された車両速度軌跡の忠実度を評価するためにエキスパートによって使用されるものとしてよい。現実の世界のシナリオを表す車両走行に関しては、これが、速度－加速度対の所与の分布に従うことが予想される。現実の世界の走行に関しては、これが、速度軌跡において表されている部分走行の数（ここでは、部分走行は、例えば、継続前の期間の間の、ゼロ速度における車両停滞時間によって識別可能である）又はゼロ速度において費やされた時間などの、いくつかの他の特徴の特定の分布を表すことも予想される。

【0031】

本特許明細書の態様によれば、敵対的生成ネットワーク（ＧＡＮ）又は条件付き敵対的生成ネットワーク（ｃＧＡＮ）の識別器を、識別過程から結果として生じる統計の質を改善する追加機能によって改善することが提案される。特に、識別関数に対するアプリケーション特有の識別器統計において、少なくとも１つの追加機能ブロックを提供することが提案される。換言すると、ＧＡＮ又はｃＧＡＮのデータベースの生成器を、ドメイン特有の専門知識により強化することができる。

【0032】

換言すると、エキスパート特徴の分布と一致する又はエキスパート特徴に極めて類似するデータサンプルの軌跡（例えば、速度軌跡）を生成する、変更されたアーキテクチャを有するＧＡＮ又はｃＧＡＮが提案される。

【0033】

さらに、より正確な出力データを生成するために、又は、生成モデルによって生成されたデータの精度を評価するための評価指標として、正確な統計を適用する関数を有している識別器の提供をトレーニング手順中に適用することができる。

【0034】

図１Ａは、経路／速度データサンプル上における条件付き敵対的生成ネットワークのトレーニングの例を示す図である。しかし、ここで説明されている技術は、あらゆる条件付け、例えば経路に基づく条件付けを伴わない敵対的生成ネットワーク（ＧＡＮ）にも適用される。

【0035】

トレーニングフェーズにおいて、サンプルｃ_{｛１：Ｔｉ｝}とｘ_{｛１：Ｔｉ｝}とが、真のデータ分布から取得される。このケースにおいては、環境変数ｃ_{｛１：Ｔｉ｝}は、真の経路を記述する行列であり、時間列ｘ_{｛１：Ｔｉ｝}は、この経路に沿った速度観測のベクトルである。Ｔｉは、シーケンスの長さである。

【0036】

経路サンプル１４ａと、この経路サンプル１４ａに付随する速度サンプル１４ｂとを含む真のデータサンプル１４の対が、ランダムに真のデータ分布から選択されて、識別器１２に提供され、この結果、真の時間列データのサンプルが形成される。（ｃＧＡＮとは異なり）ＧＡＮのトレーニングの例においては、ここで、データサンプルの対の代わりに、１つのデータサンプルだけが必要とされる。

【0037】

経路サンプル１４ａは、例示的な経路において規定された一連の環境ポイントである。速度サンプル１４ｂは、各経路サンプル１４ａに対応している。速度サンプル１４ｂは、経路サンプル１４ａに沿ったポイントにおける車両の速度を規定する一連の速度ポイントである。

【0038】

先行する反復からの生成モデル１０ａは、ガウス分布又は均一分布などの予め定められた分布のランダムサンプルを伴って提供される。この分布からのサンプリングの際に、ベクトル又はベクトルのシーケンスを検出することができる。生成モデル１０ａは、さらに、一例においては時間列である条件付きの経路サンプルを伴って提供される。

【0039】

生成モデル１０ａは、１つ又は複数の出力、このケースにおいては１つ又は複数の生成された速度１５を生成するように構成されている。生成モデル１０ａを条件付けするために使用される、生成された速度１５及び経路サンプル１６ｂは、人工的な時間列データ１７ｂのサンプルを形成する。

【0040】

識別器モデル１２は、この入力におけるサンプルが、実験的に観察されたデータ（現実の世界のデータ）１７ａを表しているのか、又は、生成モデル１０ａからの人工的な時間列データ（偽のデータ）１７ｂを表しているのかを識別するようにトレーニングされる。典型的には、トレーニングプロセスは、生成モデル１０ａと識別器１２とを相対させて統合し、これによって、識別器モデル１２の打破時に生成モデル１０ａが改善される（換言すると、識別器モデル１２が、実験的に観察されたデータ１７ａを人工的なデータ１７ｂとして識別する可能性及びその逆の可能性が高くなる）。

【0041】

換言すると、ｃＧＡＮのトレーニングプロセスは、生成モデル１０ａに対する損失関数の最適化と識別器モデル１２に対する損失関数の最適化とを含む。具体的には、このトレーニングプロセスは、識別器モデル１２の損失関数の最小化及び生成モデル１０ａのエラーの損失関数の最小化を含む（これにより、人工的なデータに対する識別器の損失の最大化が生じる）ミニマックスプロセスである。その結果、人工的な時間列曲線を生成することができる最終的な生成モデル１０ｂが生じる。

【0042】

図１Ｂは、機械学習のための、トレーニングされた生成ネットワークを使用して経路／速度データサンプルを生成するためのアプローチを示している。所与の経路は、例えば、勾配、速度制限、交通密度プロファイル、路面、信号機の数又は気象データを表す一連の情報によって表されるものとしてよい。

【0043】

経路データベース１９ａから経路２０が抽出され、ｃＧＡＮのトレーニングされた生成モデル１０ｂを条件付けするために使用される。さらに、予め定められた分布から、ｃＧＡＮからのサンプルが抽出される。経路２０及び予め定められた分布のサンプリングに基づいて、トレーニングされた生成モデル１０ｂは、さらなる使用のために、特定の時間２２における速度の人工的なデータ列などの、人工的なデータの１つ又は複数の要素を提供する。一例においては、このさらなる使用は、生成されたデータの、システムシミュレーションソフトウェア及び解析ソフトウェア２３への入力であり得る。

【0044】

本特許明細書において、次に列挙する記号は、次の意味を有する。

【0045】

【表1】

【0046】

本開示における具体的な例を説明するための、上に挙げた名称の規定は、技術的な概念全体に対する限定ではない。特に、多変量時間列が、ｘ_ｔを伴い、Ｒ^Ｄにおいて生成されるものとしてよく、ここでは、Ｄは、生成されるべき変数の数である。記号「ｘ」、「ｃ」、「ｚ」が現れる図中の箇所において、それらは、「ｘ_１：Ｔ」、「ｃ_１：Ｔ」、「ｚ_１：Ｔ」の略語を示す。

【0047】

下付き文字Ｔは、上に挙げた列にインデックスを付けするために使用されており、ここに示された例は、時間列により示されているが、この技術は、これに限定されるものではない。この列は、例えば、距離ステップ又は変速機設定を基準とする。

【0048】

列ｘ_１：Ｔは、一変量又は多変量であるものとしてよい。一例においては、この列は、時間列又は距離に基づく列である。

【0049】

複数の列における各要素ｘ_１：Ｔｉ、ｃ_１：Ｔｉは、異なる長さを有するものとしてよい。図１Ａの例においては、ｃＧＡＮターゲットに実際のデータ

【数1】

が与えられ、これは、

【数2】

からサンプルを抽出することを学習する。生成器モデル（ネットワーク）１０ａｇ（ｚ_１：Ｔ，ｃ_１：Ｔ）は、暗黙的に誘導された分布

【数3】

からサンプリングするように構成されている。実際の分布と誘導された分布との間の不一致

【数4】

を敵対的トレーニングによって最小限に抑制するために最小化が実行される。一例においては、この不一致を、Ｊｅｎｓｅｎ－Ｓｈａｎｎｏｎダイバージェンス、ワッサースタイン距離又はＭａｘｉｍｕｍＭｅａｎＤｉｓｃｒｅｐａｎｃｙ（ＭＭＤ）によって低減させることができる。所与の生成器モデルｇ及び識別器モデル（クリティック）ｆの場合、これは、ミニマックス目的

【数5】

に対応する。

【0050】

項

【数6】

は、ここで生成器が最小化しようと試みるダイバージェンスの推定に関連している。

【0051】

一例においては、ＧＡＮ設定におけるワッサースタイン距離

【数7】

の適用であり、即ち、２つの分布の間の環境情報／経路情報への条件付けは行われない。

【数8】

ここでは、

【数9】

は、１－リプシッツ関数から成る。従って、ミニマックス目的は、次のようになる。

【数10】

【0052】

条件付きＧＡＮ（ｃＧＡＮ）は、経路情報及び車両動作プロファイル
の共通の分布

【数11】

の近似によって、異なる分布

【数12】

を備える。

【数13】

によって、生成器モデル（ネットワーク）１０ａは、

【数14】

からサンプリングするようにトレーニングされ得る。実際の分布と誘導された分布との間の不一致

【数15】

は、敵対的トレーニングによって最小化され得る。ダイバージェンス尺度としてワッサースタイン距離が設定される場合には、ｃＧＡＮ目的は、次のようになる。

【数16】

【0053】

図２は、図１Ｂの条件付き敵対的生成ネットワーク（ｃＧＡＮ）の生成器及び識別器をより詳細に示している。同一の特徴には、同一の参照符号が付けられている。行２４は、簡略化された図であり、行２５は、ｃＧＡＮの例示的なモデルアーキテクチャ（ネットワークアーキテクチャ）の詳細な図である。一例においては、生成モデル１０ｂは、リカレント・ニューラル・ネットワーク（ＬＳＴＭ１０ｃ）によって実行される。特定の例は、長・短期記憶ユニットを使用して生成モデル１０ｂを実行するが、他の変形形態を使用することが可能である。ＬＳＴＭへの入力は、経路１６ｂから抽出される。

【0054】

図２においては、２つのセットの環境条件タイムシーケンスが、経路１６ｂから特徴として抽出される。第１の環境条件タイムシーケンスは、経路に沿った勾配を規定する。第２の環境条件タイムシーケンスは、経路に沿った速度制限を規定する。当業者は、ＬＳＴＭ１０ｃへの入力として、多かれ少なかれ環境時間列を使用することができることを理解するであろう。各時間ステップにおけるノイズサンプル１６ａ（ｚ）がＰ_Ｚから抽出され、ＬＳＴＭ１０ｃに入力される。ＬＳＴＭ１０ｃを含む生成モデルは、これらの入力から、対応する人工的な速度時間列を生成する。

【0055】

識別器１２には、経路に沿った勾配を規定する第１の環境条件タイムシーケンスと、経路に沿った速度制限を規定する第２の環境条件タイムシーケンスと、生成された人工的な速度時間列とが適用される。図示の例においては、識別器１２ａは、長・短期記憶などのリカレント・ニューラル・ネットワークでもある。

【0056】

さらに、図２に示されているｃＧＡＮを改良することができる。特に、現実の速度時間列の統計的分布が、例えば、信号機、気象条件、運転者の気分、速度カメラの位置又は時刻の影響によって引き起こされ得る、現実の運転条件によって歪められる場合がある。

【0057】

第１の態様によれば、生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法３０が提供される。この方法は、
・データ空間から複数のデータ列を取得すること３２を含み、ここで、各データ列は、車両又はロボットの少なくとも１つの動作プロファイルを記述し、
・機械学習のための生成モデルのトレーニング時の少なくとも１つの生成フェーズの間に、分布からサンプリングすることによって複数の人工的なデータ列を生成すること３３を含み、
・機械学習のための生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、識別器モデルに、（ｉ）取得された複数のデータ列からのデータ列、又は、（ｉｉ）複数の人工的なデータ列からの人工的なデータ列を入力すること３４を含み、
・機械学習のための生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第１の関数及び第２の関数を使用した人工的なデータ列として、分類すること３５を含み、ここで、第１の関数１０の複数の入力は、人工的なデータ列の複数の連続的なサンプルを含み、第２の関数２６の少なくとも１つの入力は、人工的なデータ列の複数の異なるステップから得られた人工的なデータ列の少なくとも２つのデータサンプルを含み、
・トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングすること３６を含む。

【0058】

図３Ａは、第１の態様に従った車両の動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするためのコンピュータ実装された方法を示す図である。

【0059】

一実施形態によれば、複数の人工的なデータ列を提供するために、分布は、少なくとも１つの生成フェーズにおいてサンプリングされる。

【0060】

図４Ａは、トレーニングフェーズにおける、生成モデルをトレーニングするための機械学習のためのシステム４５の例示的な構造を示している。

【0061】

機械学習のためのシステム４５は、敵対的生成ネットワークＧＡＮの一例である。経路及びこれに関連する速度プロファイルなどの例示的なデータが、真のデータサンプル１４を含むデータベースから取得される。次いで、生成器４７が、速度プロファイル及び／又は経路プロファイルなどの例示的な出力データ列を生成するために、機械学習のためのシステム４５内においてトレーニングされる。速度プロファイルは、ランダムな入力変数１６ａの関数として決定される。複数の車両経路から抽出される速度などの、データ空間Ｘにおける複数のサンプリングされたデータ列が、データ空間Ｘにおける複数のサンプリングされたデータ列を形成するが、他の多くの変数が、単独で又は組み合わせて使用可能である。

【0062】

複数の人工的なデータ列のセットを取得するために、ガウス分布などの分布がサンプリングされる。分布のパラメータは、例えば、出力される分布の特徴が、意図した人工的なデータ、例えば、複数の速度プロファイル又は変速機設定を表すように選択される。

【0063】

この分布からサンプリングされた、各時間ステップにおけるノイズｚ_１：Ｔが生成器４７に入力され、生成器４７には、任意選択的に、条件付きＧＡＮにおいて他の変数を提供することができる。生成器４７は、真のデータサンプル１４と区別することができない人工的なデータ列を生成することを目的とする。生成器４７の反復的な最適化は、Ｘと

【数17】

との比較及び損失関数の計算によって、反復ごとに実行されるものとしてよい。生成器４７のパラメータは、勾配法などのアプローチによって設定されるものとしてよい。

【0064】

その結果、生成器４７が、人工的なデータ列を生成するためにトレーニングされる。生成器４７は、例えば、図１Ａに示される生成モデル１０ａ、１０ｂとして使用可能である。

【0065】

その結果、第１の態様の方法の、データ空間における複数のデータ列Ｘを取得するステップ３２と、予め定められた分布における複数のサンプルに基づいた少なくとも１つの人工的なデータ列

【数18】

を生成するステップ３３とを、図４Ａに示されている機械学習のためのシステム４５に従って実施することができる。

【0066】

一例においては、識別器モデルに、（ｉ）複数のサンプリングされたデータ列からのデータ列、又は、（ｉｉ）少なくとも１つの人工的なデータ列からの人工的なデータ列を入力するステップ３４が、１つ又は複数の人工的なデータ列を、例えば、生成器４７の出力から選択することによって、又は、真の入力サンプル１４などの真の入力データからデータ列を選択することによって、実施される。

【0067】

ＧＡＮ識別器１２、１２ａは、いくつかの潜在的な特徴（必ずしも解釈可能ではない）を抽出することによって動作し、これらの特徴を用いて、入力されたサンプルが真か、人工的であるか（生成器１０ａ、４７によって生成された）を判断する。生成器１２ａは、例えば、スコアとしての実数ｆ_ｒｎｎ（ｘ_１：Ｔ）を生成する。

【0068】

スコアの正の値は、例えば、識別器１２、１２ａが、このサンプルを真と判断していることを意味する。スコアの負の値は、例えば、識別器が、このサンプルを人工的（偽）であると判断していることを意味する。特徴抽出は、ニューラルネットワークによって実行され得る。

【0069】

選択的に、スコアは、バイナリ値であるものとしてよく、この場合には、例えば、「１」は、「真」のサンプルを示し、「０」は、「偽」のサンプルを示す。

【0070】

本明細書は、機械学習のためのモデルの識別フェーズにおいて、識別器モデルへの入力を真又は人工的（偽）のいずれかに分類すること３５を目的とした、新たな識別器概念を提案する。

【0071】

基本的な考え方は、ＧＡＮ識別器に別個の関数モジュールｆ_ｅｘｐ２６を追加することである。この別個のモジュールは、エキスパート特徴などの追加情報を抽出し、これらを識別器スコアの構成要素として使用するように構成されている。これは、真のデータ列に近づく確率密度関数を有する人工的なデータ列を提供するために、識別器１２、１２ａが生成器４７をトレーニングすることを意味している。

【0072】

図５は、第１の態様に従った機械学習のためのシステムの識別器１２の例示的な構造を示している。識別器は、第１の関数１２ａと第２の関数２６とを含む。第１の関数の複数の入力は、真のデータ列ｘ_１：Ｔ又は人工的なデータ列

【数19】

の複数の連続的なサンプルを含む。

【数20】

又はｘ_１：Ｔの入力列が、概略的な目的において選択可能として図５に示されている。真のデータ列ｘ_１：Ｔ又は人工的なデータ列

【数21】

の間における選択を可能にする各データ操作関数が適用可能である。各人工的なデータ列

【数22】

又は真のデータ列ｘ_１：Ｔの入力されたサンプルが、直列シーケンス又はコントロールされた数のサンプルとして、又は、サンプルの並列ベクトルとして提供され得ることが仮定される。識別器１２の第１の関数１２ａの入力時に、人工的なデータ列

【数23】

又はｘ_１：Ｔの置換、混合又は畳み込みは、これらの連続した次元において行われない。換言すると、第１の関数１２ａの入力は、人工的なデータ列

【数24】

又はｘ_１：Ｔの時間的な写しである。第２の関数２６の少なくとも１つの入力は、人工的なデータ列の異なる位置から取られた、人工的なデータ列の少なくとも２つのサンプルを含む。

【0073】

一例においては、識別器１２の第２の関数２６への入力は、生成器１０の出力から取得され、ここでは、生成器１０の出力の第１のサンプルと、隣接する、生成器１０の出力の第２のサンプルとが結合される。

【0074】

一例においては、識別器１２の第２の関数２６への入力は、生成器１０の出力のみから取得される。一例においては、第２の関数２６への入力は、時間にわたった環境条件ｃ_１：Ｔ（例えば、勾配又は速度制限）のサンプルを含まない。

【0075】

一例においては、人工的なデータ列

【数25】

又はｘ_１：Ｔの第１の部分集合は、人工的なデータ列

【数26】

又はｘ_１：Ｔの第２の部分集合に対するオフセットにおいて第２の関数２６へ入力される。一例においては、第１のサンプルの集合と第２のサンプルの集合との間のオフセットの値は、人工的なデータ列

【数27】

又は真のデータ列ｘ_１：Ｔの１つの要素、２つのサンプル、３つのサンプル又は４つのサンプルである。一例においては、人工的なデータ列

【数28】

又は真のデータ列ｘ_１：Ｔの第１の部分集合及び第２の部分集合が、その間のサンプルシフトを伴って第２の関数２６に入力される。

【0076】

一例においては、識別器の第１の関数１２ａは、自身の入力側において、少なくとも１つの人工的なデータ列

【数29】

と、任意選択的に一連の測定された環境条件とを取得する。識別器の第１の関数１２ａは、例えば、生成器１０ａからの人工的なデータ列と、一連の環境条件との組合せを取得することができる。

【0077】

一例においては、識別器の第１の関数１２ａは、自身の入力側において、速度を表す人工的なデータ列

【数30】

又はｘ_１：Ｔと_、少なくとも勾配及び／又は速度制限を表す一連の環境条件とを取得する。時間にわたった複数の連続的な環境条件は、速度を表す人工的なデータ列

【数31】

又はｘ_１：Ｔの複数の連続的なサンプルにインデックス付けされる。

【0078】

一例においては、データ列の要素及び人工的なデータ列の要素は、それぞれ時間列を表す（時間的に配列される）。他の例においては、データ列の要素及び人工的なデータ列の要素は、それぞれ距離に基づく列を表す（地図上の固定位置の基準点に関連して並べられる）。

【0079】

一例においては、第２の関数は、自身の入力側において、環境条件を取得しない。

【0080】

一例においては、第２の関数は、人工的なデータ列

【数32】

又はｘ_１：Ｔに、エキスパート関数を適用する。

【0081】

一実施形態によれば、第１の関数の入力は、識別器モデルへの入力の時間的にインデックス付けされた関数であり、第２の関数の入力は、識別器モデルへの入力の微分可能な関数である。

【0082】

一実施形態によれば、第１の態様は、識別器ニューラルネットワークを用いて第１の関数の出力と第２の関数の出力とを結合することをさらに含む。

【0083】

第１の関数は、リカレント・ニューラル・ネットワーク、任意選択的に長・短期記憶ネットワークである。

【0084】

第２の関数は、少なくとも１つの人工的なデータ列の射影によって、さらに、射影された少なくとも１つの人工的なデータ列と、複数のデータ列のうちの少なくとも１つのデータ列との組合せに基づいた、識別器モデルの第２の関数の結果の取得によって得られる。

【0085】

識別器ニューラルネットワークは、識別器モデルの第１の関数と第２の関数との線形結合を計算する。

【0086】

一例においては、複数のデータ列に含まれるデータ列は、時間列又は距離列のいずれかである。複数の人工的なデータ列のうちの人工的なデータ列は、人工的な時間データ列又は人工的な距離データ列のいずれかである。

【0087】

一例として、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた一連の値を、追加情報又はエキスパート特徴として使用することができる。

【0088】

一例として、真のデータ列又は人工的なデータ列（任意選択的に速度－加速度ヒストグラム）から結果として生じる分布からサンプリングされた一連の速度－加速度対を、追加情報又はエキスパート特徴として使用することができる。

【0089】

速度－加速度ヒストグラムを表す分布から抽出されるサンプルによってエキスパート特徴が提供されるケースにおいては、識別器の第２の関数２６は、次の形態を有する。即ち、データ列は、ｘ_ｔを、時間ステップｔにおける対象車両の速度として表す要素を含む。

【数33】

が時間ステップｔにおける車両の加速度を表す、さらなるデータ列

【数34】

が、計算又は入力されるものとしてよい。識別器の第２の関数２６は、次のように記述され得る。

【数35】

ここでは、

【数36】

は、エキスパート特徴を、少なくとも時間ステップの際に抽出し、一例においては、各時間ステップの際に抽出する。この例においては、時間ステップは、データ列の連続する要素間のステップによって表される。一例においては、射影関数２６ｃは、エキスパート特徴の少なくとも１つのサンプルの射影

【数37】

を行い、識別を可能にする。

【0090】

一例においては、識別器１２の第２の関数２６の入力は、生成器１０の出力から取得され、ここでは、生成器１０の出力のサンプルと、それに続く、生成器１０の出力の第２のサンプルとが結合され、

【数38】

に従って射影される。

【0091】

一例においては、識別器１２の第２の関数２６への各入力は、生成器１０の出力から取得され、ここでは、生成器１０の出力の各サンプルが、生成器１０の出力の各第２のサンプルと結合される。

【0092】

一例においては、識別器１２の第２の関数２６への各入力は、生成器１０の出力から取得され、ここでは、生成器１０の出力の各サンプルは、生成器出力の畳み込みである。

【0093】

一例においては、識別器１２の第２の関数２６への少なくとも１つの入力は、人工的なデータ列

【数39】

又は真のデータ列ｘ_１：Ｔから取得される。一例においては、識別器１２の第２の関数２６への少なくとも１つの入力は、データ空間Ｘから取得されるデータ列から取得される。一例においては、識別器１２の第２の関数２６への入力は、人工的なデータ列

【数40】

と、データ空間Ｘから取得されるデータ列との混合物として取得される。

【0094】

一例においては、識別器の第２の関数２６は、自身の入力のうちの少なくとも１つの入力にエキスパート関数（ｅ（．））を適用する。生成器１０の出力に基づいて、エキスパート関数（ｅ（．））は、例えば、単位時間あたりの整数の車両停止回数、所定の速度までの車両加速の持続時間、所定の速度までの車両減速の持続時間、ゼロ速度までの車両減速の持続時間、経路湾曲に対する車両速度、経路傾斜に対する車両速度、総走行持続時間に対する車両速度、単位時間あたりの整数のギアチェンジ回数、予め定められた速度を達成するためのギアチェンジ機能、ゼロ速度を達成するためのギアチェンジ機能、経路湾曲に対するギアチェンジ機能、経路傾斜に対するギアチェンジ機能、総走行持続時間に対するギアチェンジ機能の１つ又は複数を評価することができる。

【0095】

上述した例の効果は、モデル全体をトレーニングする際に、識別器１２（換言すると、分類器）が、偽の速度－加速度対の分布と真の速度－加速度対の分布とを区別することを学習することである。暗黙的に、識別器は、所与の入力に対して、両者のうちのどちらがより可能性があるかを見出すために、真のサンプル及び偽のサンプルのデータ密度を構築する。

【0096】

一実施形態においては、識別器モデルの第２の関数は、車両速度を表す少なくとも１つのデータ列と、人工的な車両速度を表す少なくとも１つの人工的なデータ列とに基づいて、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングするように構成されている。

【0097】

一実施形態においては、識別器モデルの第２の関数は、車両速度を表す少なくとも１つの人工的なデータ列に基づいて、ゼロ速度において費やされた時間を評価するように構成されている。

【0098】

一実施形態においては、複数のデータ列は、経路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能の少なくとも１つを含む車両の複数の動作プロファイルを記述し、識別器モデルの第２の関数への入力は、真のデータ列又は人工的なデータ列から結果として生じる分布からサンプリングされた一連の値からサンプリングされる複数の速度－加速度対を含む。

【0099】

一実施形態においては、複数のデータ列は、自律型又は半自律型のロボットのアクチュエータの一連の変位、一連の速度又は一連の位置のうちの少なくとも１つを含む、自律型又は半自律型のロボットの複数の動作プロファイルを記述する。

【0100】

一実施形態によれば、第２の関数は、少なくとも１つの人工的なデータ列の射影によって、さらに、射影された少なくとも１つの人工的なデータ列と、複数のデータ列のうちの少なくとも１つのデータ列との組合せに基づいた、識別器モデルの第２の関数の結果の取得によって得られる。

【0101】

一実施形態によれば、識別器モデルの第２の関数は、複数の人工的なデータ列のサンプルのうちの１つ又は複数のサンプルを射影することによって、識別器スコアに寄与するように構成されている。

【0102】

一実施形態においては、Ｄ＝１である。このケースにおいては、ｆ_ｐｒｏｊの出力を、単一の時間ステップにおけるエキスパート特徴に対する識別出力とみなすことができる。例えば、Ｄ＝１の場合、単一の時間ステップにおける速度－加速度対の識別出力が取得される。一実施形態においては、Ｄは、（複数の時間ステップにわたったエキスパート特徴の混合を可能にするために）より充実した表現のために、１より大きいものとしてよい。

【0103】

一例においては、ｆ_ｐｒｏｊ射影関数は、多層パーセプトロンの一連の密な層として実装され得る。

【0104】

一例においては、ｆ_ｐｒｏｊ射影関数は、入力を第２の関数のビンに射影するために手作業により作成されるものとしてよい。一例においては、ｆ_ｐｒｏｊ射影関数は、入力を第２の関数のエキスパート特徴のビンに射影するために手作業により作成されるものとしてよい。一例においては、ｆ_ｐｒｏｊ射影関数は、真のデータ列又は人工的なデータ列、例えば、速度－加速度ヒストグラムから結果として生じる分布からサンプリングされる一連の値を表す分布のビンに入力を射影するために手作業により作成されるものとしてよい。

【0105】

多くの車両経路は、ゼロに等しい速度と共に開始される。従って、一例においては、第１の時間ステップの速度は、ゼロであると仮定され、加速度は、後続の総ての時間ステップにおいて計算されるものとしてよい。

【0106】

この射影関数ｆ_ｐｒｏｊの出力は、任意選択的に平均値形成ユニット２６ｂにおいて平均化されるものとしてよく、これによって、識別器１２の第２のエキスパート関数２６（エキスパートユニット）の最終的な識別ｆ_ｅｘｐ（ｘ_１：Ｔ）を取得することができる。

【0107】

図６は、ｃＧＡＮにおいて使用される、機械学習のためのシステムの識別器１２の詳細な実施形態の例を示している。図６の部分２８に示されている生成器１０ｃが基準として設けられている。識別器１２は、図６の部分２９に示されている。識別器１２は、少なくとも第１の関数１２ａと第２の関数２６とを含む。

【0108】

一例においては、識別器１２は、ｃＧＡＮに代えてＧＡＮに適用される。このケースにおいては、図６に示されている環境変数（ｃ_１，ｃ_ｔ，ｃ_Ｔ）は不要である。このケースは、図６には図示されていない。

【0109】

従って、生成器１０ａは、人工的なデータ列から、例えば一連の速度から複数のサンプルを生成する。識別器１２の第１の関数１２ａが、時間に対して参照されている。第２の関数２６が一連の速度から加速度を計算する特定のケースにおいては、図６に示されているように、隣接する時間ステップの対から加速度が計算され、第２の関数２６への入力が予め定められた順序により抽出される。加速度

【数41】

は、恣意的な値に設定されるものとしてよく、例えば、

【数42】

である。

【0110】

第２の関数が加速度をベースにしていない他のケースにおいては、識別器の第２の関数２６は、時間構造に関連しないものとしてよい。図示の例においては、第２の関数２６は、速度から加速度を計算し、ｆ_ｅｘｐ（ｘ_１：Ｔ）を計算する。当業者は、第２の関数２６によって、多くの他の関数が、データ列又は人工的なデータ列の時間構造に関連して又は関連せずに計算され得ることを理解するであろう。第２の関数２６の目的は、識別装置に特定の車両特性又はロボット特性に関するエキスパート情報が与えられることが保証されることによって、複数の人工的なデータ列がより現実的になることを可能にすることである。

【0111】

一実施形態によれば、機械学習のためのトレーニングされた生成モデルは、識別器モデルにおいて第２の関数を用いずに生成される複数の人工的なデータ列の統計的な分布に比較して、複数のデータ列の統計的な分布により類似した統計的な分布を有する複数の人工的なデータ列を生成するために構成されている。

【0112】

第１の関数１２ａの出力と第２の関数２６の出力とが、結合ブロック２７において統合される。これは、任意選択的に、射影Φ（．）及びΨ（．）の適用後に行われる。任意選択的に、射影Φ（．）及びΨ（．）を多層パーセプトロンＭＬＰによって実行することができる。任意選択的に、結合ブロック２７は、シグモイド関数又は線形結合又は他の形態のニューラルネットワークであるものとしてよい。

【0113】

一実施形態によれば、識別器モデルの出力は、

【数43】

によって規定され、ここでは、ｆ_ｒｎｎ（ｘ_１：Ｔ）は、第１の関数であり、ｆ_ｅｘｐ（ｘ_１：Ｔ）は、第２の関数であり、Φ（．）及びΨ（．）は、任意選択的に多層パーセプトロンとして実行される射影である。

【0114】

上述の例は、速度－加速度ヒストグラムを表す分布からサンプリングするように構成されている識別器１２における第２の関数２６の使用を考察している。

【0115】

第２の例は、排気シミュレーション又は負荷収集分析のための車両速度生成に関連して論述される。

【0116】

第２の例においては、車両の速度は、放出又は種々の車両構成要素における負荷の変更を目的として生成される。このようにして生成されたデータを用いて、乗用車が走行中に使用可能なモデルをトレーニングすることができる。実際には、燃費、排気特性、エネルギ需要、又は、ポンプ若しくはブレーキなどの車両部品における摩耗をリアルタイムで特徴付けるために、このようなモデルがトレーニングされることとなる。

【0117】

この例においては、目標変数は、速度の時間列である。この例においては、識別器１２の第２の関数２６は、分布からサンプリングされる一連の値であり、この分布は、総走行時間に対する、ゼロ速度において費やされた時間の真のデータ列又は人工的なデータ列から結果として生じる。ゼロ速度において費やされた複数のエピソードを含む車両走行は、開始から終了までの間、実質的に一定の速度のままである車両走行に比較して、より高い放出を示す又はより多くの部品摩耗を引き起こすので、これは有利である。

【0118】

識別器１２の第２の関数２６の例示的な実行は、このケースにおいては、次のようになる。

【数44】

【0119】

この和の中の項は、ゼロ速度を１にマッピングし、ゼロでない各速度をほぼゼロにマッピングする（負ではない速度しか生じないことを前提条件とする）。温度は、基準値１を取るが、ステップ関数のより急峻な近似を得るために増加させることができる。このようなケースにおいては、温度は、シグモイド関数に特有の用語であり、車両のエンジン温度に関係していない。関数ρ（．）は、入力（ゼロ速度において費やされる時間及び総走行時間）を、識別のために、特徴空間にマッピングする。一例においては、ρ（．）は、多層パーセプトロンであるものとしてよい。

【0120】

従って、異なる適用に対応するために、識別器の第２の関数２６の構成の２つの詳細な例が提示されている。しかし、当業者は、適用分野に関連する統計的スキューの多くの事例に対処するために、識別器の第２の関数２６が構成され得ることを理解するであろう。

【0121】

一実施形態によれば、識別器モデルの第２の関数は、分布からサンプリングされた一連の値をサンプリングするために構成されている。この分布は、真のデータ列又は人工的なデータ列、例えば、それに基づいて速度－加速度ヒストグラムを提供するために車両速度を表す少なくとも１つの人工的なデータ列から結果として生じる。

【0122】

一実施形態によれば、識別器モデルの第２の関数は、車両速度を表す少なくとも１つの人工的なデータ列に基づいて、ゼロ速度において費やされる時間を評価するように構成されている。

【0123】

一実施形態によれば、複数のデータ列は、経路を走行する車両の一連の速度、エンジン温度、エンジン回転数、ペダル位置、舵角又はギアチェンジ機能の少なくとも１つを含む車両の複数の動作プロファイルを記述し、識別器モデルの第２の関数への入力は、速度－加速度関数を表す分布を有している真のデータ列又は人工的なデータ列から結果として生じる一連の値からサンプリングされている。

【0124】

図６の例は、適用を車両速度軌跡とみなしており、第２の関数２６（エキスパート特徴）は、速度－加速度ヒストグラムを表す分布を有している真のデータ又は人工的なデータから結果として生じる一連の値からサンプリングされるべきであるが、この設定を、他の環境変数ｃなどの多くの特徴に拡張することができる。

【0125】

一例においては、識別器１２の第２の関数２６は（存在する場合には）、ｆ_ｅｘｐ（ｘ_１：Ｔ）を微分可能に符号化すべきである。

【0126】

識別器にさらなるエキスパート特徴を追加する、識別器のさらなる関数が、同様に、第２の関数２６に追加されるものとしてよい。例えば、識別器１２は、第３の関数、第４の関数、第５の関数及び第６の関数を含むものとしてよく、このケースにおいては、関数ｒ（．）を実行する結合ブロック２７は、任意の第３の関数、第４の関数、第５の関数及び第６の関数を結合するために変更されなければならない。識別器１２の第２の関数２６は（存在する場合には）、ｆ_ｅｘｐ（ｘ_１：Ｔ）を微分可能に符号化すべきである。

【0127】

一例においては、識別器１２の第２の関数２６への入力は、微分可能である。

【0128】

一実施形態によれば、識別器モデルの第２の関数への入力は、次のもののうちの１つ又は複数を規定する。即ち、（ｉ）単位時間あたりの整数の車両停止回数、（ｉｉ）所定の速度までの車両加速の持続時間、（ｉｉｉ）所定の速度までの車両減速の持続時間、（ｉｖ）ゼロ速度までの車両減速の持続時間、（ｖ）経路湾曲に対する車両速度、（ｖｉ）経路傾斜に対する車両速度、（ｖｉｉ）総走行持続時間に対する車両速度、（ｖｉｉｉ）単位時間あたりの整数のギアチェンジ回数、（ｉｘ）予め定められた速度を達成するためのギアチェンジ機能、（ｘ）ゼロ速度を達成するためのギアチェンジ機能、（ｘｉ）経路湾曲に対するギアチェンジ機能、（ｘｉｉ）経路傾斜に対するギアチェンジ機能、（ｘｉｉｉ）総走行持続時間に対するギアチェンジ機能、のうちの１つ又は複数を規定する。

【0129】

第２の関数２６の変形を、最適化反復の評価指標として使用することができる。ＧＡＮ（ｃＧＡＮ）をトレーニングするためのエキスパート特徴の使用に加えて、第２の関数２６を用いることが可能であり、これによって、機械学習のためのモデルの生成された出力の質を評価することができる。このような評価ステップに、微分不可能なエキスパート特徴又は微分不可能な関数、例えばランダムフォレスト分類器を使用することもできる。

【0130】

このようにして、これらの特徴は、トレーニングされたモデルの停止基準としても機能する。停止基準を、モデルの質を評価するために使用することができるが、トレーニングプロセスをガイドすることもでき、停止基準が所望の閾値を下回った場合にトレーニング手順の早期停止を可能にする。エキスパート特徴に基づく停止基準がない場合には、ＧＡＮの損失関数が変動することが多いため、そのような手順は不可能である。

【0131】

一実施形態によれば、生成器モデルの反復的なトレーニングの停止のステップは、停止基準を使用して提供され、ここでは、停止基準は、生成器モデルの反復によって、識別器モデルの第２の関数を使用して生成された少なくとも１つの人工的なデータ列を評価することによって取得され、ここでは、第２の関数は、停止基準を出力する。

【0132】

トレーニングプロセスの停止のために、識別器１２の第２の関数２６を使用する第１の例として、排気シミュレーション又は負荷収集分析（部品摩耗）のための車両速度生成のケースが考察される。

【0133】

車両の速度は、排気又は種々の車両構成部分における負荷をモデリングするために生成される。目標変数は、速度の時間列である。識別器１２の第２の関数２６は、対象の車両又はシナリオに対する速度－加速度ヒストグラムを表す分布からサンプリングするように構成されている。評価指標は、真の時間列サンプル及び人工的な時間列サンプルのセットを得ることによって得られる。速度軌跡のクラス（真対人工的）を予測するために、分類モデル（ランダムフォレストなど）がトレーニングされる。

【0134】

良好にトレーニングされたモデルにおいては、２つの選択肢の間の分類の精度は、ほぼランダム、即ち、５０％であるべきである。

【0135】

識別器のトレーニング及び生成器のトレーニングの進行中のこの精度の追跡は、生成器１０の性能の良好なインジケータも提供する。

【0136】

識別器１２の第２の関数２６を評価指標として用いる他の例においては、同様に、排気シミュレーション又は負荷収集分析（部品摩耗）のための車両速度生成のケースが考察される。

【0137】

トレーニングプロセスの停止のために識別器１２の第２の関数２６が使用される第１の例として、排気シミュレーション又は負荷収集分析（部品摩耗）のための車両速度生成のケースが考察される。

【0138】

排気又は種々の車両構成部分における負荷をモデリングするために、車両の速度が生成される。目標変数は、速度の時間列である。識別器１２の第２の関数２６は、対象の車両又はシナリオに対する、ゼロ速度において費やされる時間を取得するように構成されている。

【0139】

評価指標は、速度の真のデータ列及び人工的なデータ列に対する、ゼロ速度において費やされる時間の平均偏差及び標準偏差である。良好にトレーニングされたモデルにおいては、これらの指標は、速度の真のデータ列と人工的なデータ列とに対して同等であるべきである。平均偏差及び標準偏差に加えて、他の指標（又は測定値）を、確率分布の比較のために使用することができる（例えば、ＫＬダイバージェンス）。

【0140】

第１の態様の方法に従ってトレーニングされる、機械学習のためのモデルが、ＧＡＮ又はｃＧＡＮであることは、必須ではない。生成器を有している、敵対的機械学習のための各モデルを適用することができる。第２の関数２６を含む識別器を含む敵対的オートエンコーダが提供され得る。従って、一実施形態においては、第１の態様に従った機械学習のための生成モデルは、ＧＡＮ、条件付きＧＡＮ又は敵対的オートエンコーダのうちの１つである。

【0141】

【0142】

図３Ｂは、第２の態様に従って、機械学習のための生成モデルを使用して、車両の人工的な動作プロファイルを表す人工的なデータサンプルを生成するためのコンピュータ実装された方法を示している。

【0143】

図４Ｂは、人工的なデータ列を生成する間に使用可能な、データ生成器４９の例示的な構造を示している。

【0144】

サンプル生成器４８は、予め定められた確率分布からノイズ（ｚ_１：Ｔ）をサンプリングする。確率密度を、例えば、密度推定器を使用して求めることができる。これは、例えば、密度推定器が図４Ａにおいてトレーニングされたように、１つ又は複数の時間ステップにおける求められたノイズ（ｚ_１：Ｔ）の関数として求められることによって行われる。トレーニングされた（以下において説明されるように、エキスパート入力を実行する第２の関数２６を有する識別器に対して敵対的にトレーニングされた）生成器４７は、ランダムに、サンプルを、１つ又は複数の時間ステップにおける求められたノイズ（ｚ_１：Ｔ）から抽出する。生成器４７は、トレーニング中に取得された生成器４７のパラメータと、１つ又は複数の時間ステップにおける求められたノイズ（ｚ_１：Ｔ）のサンプルとに基づいて、人工的なデータ列

【数45】

を生成する。

【0145】

生成器４７は、例えば、第１の態様に従って前もってトレーニングされている。これは、識別器における第２の関数２６の敵対的トレーニングへの適用を含む。第２の関数２６は、特定の技術要件に基づいて、一例においては、速度－加速度ヒストグラムに基づいて、識別器がテストする分布に影響を与える。従って、第２の態様に従って生成された人工的なデータ列は、現実の世界のデータをより忠実に再現する。

【0146】

一例によれば、第２の態様に従って生成されたプロファイルは、排気をシミュレートするために、また、排気基準の準拠のための確率論的評価のために、使用される。

【0147】

一例によれば、生成された速度プロファイルは、ソフトウェアアプリケーションを最適化するために使用される。

【0148】

一例によれば、生成された速度プロファイルは、車両の排気をシミュレーションするために使用される。一例においては、生成された速度プロファイル及び／又はシミュレートされた車両排気は、車両構成部分（内燃機関など）又は車両全体のソフトウェア表現（デジタルツインとも称される）に適用されるものとしてよい。ソフトウェア表現は、入力された速度プロファイルに従って、車両又は車両の構成部分の種々の部分を最適化するように構成されるものとしてよい。内燃機関又はギアボックス部品のサイズ、レイアウト及び構成部分構成を、本当の使用ケースの改善された精度を有する、生成された速度プロファイルに基づいて、車両又は車両の構成部分のソフトウェア表現を使用して変更することができる。従って、第１の態様に従ってトレーニングされた、機械学習のためのモデルの適用によって、結果として、車両又はロボットに含まれる技術的な構成部分の具体的なコンセプト変更が生じる。

【0149】

一例によれば、所与の経路が実際の運転行動に関連しているか否かを判断するために、潜在的な速度プロファイルを評価するために、第２の関数２６を含む識別器１２が適用可能である。

【0150】

一例によれば、第２の態様に従ったデータ生成方法は、車両の耐用年数の間に、ポンプなどの車両の個々の構成部分の負荷（摩耗）を判断するために使用される。

【0151】

一例によれば、第２の態様に従ったデータ生成方法は、車両の走行時に適用可能である。エンジン制御ユニットは、第２の態様に従って速度プロファイルを生成することができる。選択的に、エンジン制御ユニットは、メモリから、予め生成されている、第２の態様に従って計算された速度プロファイルを取得することができる。エンジン制御ユニットは、生成された速度プロファイルに関連してエンジン命令を制御することができる。

【0152】

一例によれば、第２の態様のデータ生成方法は、速度プロファイル又は加速度プロファイルを取得することができる。速度プロファイル又は加速度プロファイルは、電動車両のバッテリの空き容量、ハイブリッド車両の走行管理、回生制動システムの回生管理を規定する軌跡を生成するために、又は、電動自転車のバッテリ管理を改善するために使用されるものとしてよい。

【0153】

【0154】

第２の態様に従った人工的なサンプルを生成するためのコンピュータ実装された方法によって生成されたデータは、第１の態様の方法に従ってＧＡＮ又はｃＧＡＮをトレーニングする際に、識別器１２の少なくとも第２の関数２６の効果に起因して、より現実的である。従って、第２の態様の方法に従って生成された人工的なデータが、第３の態様において、機械学習のためのさらなるモデルをトレーニングするために使用される。

【0155】

第３の態様に従ってトレーニングされた、機械学習のためのさらなるモデルが、ＧＡＮ又はｃＧＡＮであることは、必須ではない。トレーニング用にデータを必要とする機械学習のための各モデルが、第２の態様の方法に従って生成された人工的なデータを使用することができる。１つの効果は、より正確に、機械学習のためのさらなるモデルがトレーニングされることである。なぜなら、自身のトレーニングに使用される人工的なデータが、敵対的モデルに従って生成されるからである。この敵対的モデルは、識別器にエキスパートデータを適用する第２の関数２６を有する識別器１２を有している。

【0156】

第４の態様によれば、メモリに格納されている生成器モデル及び識別器モデルの敵対的トレーニングを含む、車両又はロボットの動作プロファイルをモデリングする機械学習のための生成モデルをトレーニングするための装置が提供される。この装置は、データ空間から複数のデータ列を取得するように構成されている入力インタフェースを含み、ここで、各データ列は、車両の少なくとも１つの動作プロファイルを記述する。この装置はさらに、機械学習のための生成モデルのトレーニング時の少なくとも１つの生成フェーズの間に、分布からサンプリングすることによって少なくとも１つの人工的なデータ列を生成するように構成されているプロセッサを含む。

【0157】

【0158】

機械学習のための生成モデルのトレーニング時の少なくとも１つの識別フェーズの間に、プロセッサは、識別器モデルへの入力を、データ空間からのデータ列として、又は、少なくとも、識別器モデルの第１の関数及び第２の関数を使用した人工的なデータ列として、分類するように構成されている。

【0159】

【0160】

プロセッサは、トレーニングされた生成器モデルを含む、機械学習のためのトレーニングされたモデルを生成するために、機械学習のための生成モデルの生成器モデル及び識別器モデルを反復的にトレーニングするように構成されている。この装置は、機械学習のためのトレーニングされたモデルを出力するように構成されている出力インタフェースをさらに含む。

【0161】

一例においては、装置５０は、パーソナルコンピュータ、サーバ、クラウドに基づくサーバ、又は、組込型コンピュータである。物理プロセッサ上において処理が行われることは、必須ではない。例えば、同一のプロセッサ上の複数のプロセッサコア上において、又は、複数の異なるプロセッサにわたって、処理タスクの分割が行われる。プロセッサは、Ｈａｄｏｏｐ（登録商標）クラスタであるものとしてよく、又は、商用クラウド処理サービス上に提供されるものとしてよい。一部の処理は、非従来的な処理ハードウェア上において、例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、１つ又は複数のグラフィカルプロセッサ、機械学習のための特定用途向けプロセッサなどの上において実行されるものとしてよい。

【0162】

装置５０のメモリ５８は、プロセッサ５４によって実行された場合に、第１の態様、第２の態様又は第３の態様に従ったコンピュータ実装された方法により記述される機能をプロセッサ５４に実行させるためのコンピュータプログラムを格納している。

【0163】

一例によれば、入力インタフェース５２及び／又は出力インタフェースは、ＵＳＢインタフェース、イーサネットインタフェース、ＷＬＡＮインタフェース又は装置５０からのデータサンプルの入力及び出力を可能にすることができる他の適当なハードウェアのうちの１つである。

【0164】

一例においては、装置５０は、入力インタフェース５２から入力データとして入力コメントを受け取るように構成されている揮発性メモリシステム５８及び／又は不揮発性メモリシステム５８をさらに含む。

【0165】

一例においては、装置５０は、車両に含まれる自動車組込型コンピュータであり、このケースにおいては、自動車組込型コンピュータは、車両内に設けられているセンサ及びアクチュエータと接続されるものとしてよい。装置５０の入力インタフェース５２は、例えば、速度データ、燃費データ、バッテリデータ、位置データなどを提供するエンジンコントロールユニットＥＣＵの１つ又は複数と接続されるものとしてよい。装置５０の出力インタフェース５６は、例えば、複数のブレーキアクチュエータ、スロットルアクチュエータ、燃料混合アクチュエータ又は燃料空気混合アクチュエータ、ターボチャージャ制御デバイス、バッテリ管理システム、車両照明又はエンタテイメントシステムなどの１つ又は複数と接続されるものとしてよい。

【0166】

【0167】

第５の態様のコンピュータプログラム要素は、例えば、コンピュータメモリに格納可能な機械可読命令を含むものとしてよい。

【0168】

第６の態様によれば、第５の態様のコンピュータプログラム要素のうちの１つ又は複数を含むコンピュータ可読媒体が提供される。

【0169】

図８は、第７の態様に従った車両を概略的に示しており、車両には制御デバイスが設置されており、この制御デバイスは、第１の態様に従ってトレーニングされているモデルを適用するように構成されている。

【0170】

第７の態様によれば、車両６０が提供され、この車両６０は、車両６０を動作させるために駆動力を提供するように構成されている原動機６１と、複数のセンサ６２ａ、６２ｂと、少なくとも原動機６１をセンサ６２ａ、６２ｂからのフィードバックに基づいて制御するように構成されている車両エレクトロニクスユニット６３とを含む。車両エレクトロニクスユニット６３は、第２の態様に従って、少なくとも１つの動作プロファイルに応答するトレーニングされたモデルをインスタンス化し、実施するように構成されているプロセッサを含む。

【0171】

トレーニングされたモデルは、センサ６２ａ、６２ｂからの入力信号を受信し、入力信号をトレーニングされたモデルに適用するように構成されている。プロセッサは、トレーニングされたモデルを用いて、１つ又は複数の応答信号を計算するように構成されている。プロセッサは、トレーニングされたモデルを介して取得された応答信号への応答として、１つ又は複数の原動機６１又は車両６０の他の出力アクチュエータの構成を適合させるように構成されている。

【0172】

一実施形態によれば、原動機６１は、燃料システム及び排気システムと結合されている内燃機関、又は、バッテリと結合されている電気モータ若しくはハイブリッドパワートレインであるものとしてよい。

【0173】

車両の動作プロファイルは、有利には、車両の複数のセンサ６２ａ、６２ｂによって検出可能な、又は、車両の複数のセンサ６２ａ、６２ｂから導出可能な次の変数のうちの１つ、いくつか又は総てを含み得る。即ち、車両のアクセルペダル位置、車両のブレーキペダル位置、車両の変速機のクラッチの位置、変速機の歯車、車両の速度、車両の走行抵抗、内燃機関の牽引力、車両の電動駆動機の牽引力、内燃機関の構成部分の回転数、内燃機関の単位時間あたりの吸気量、内燃機関の吸気マニホールド内の圧力、高圧ＥＧＲ（排気再循環）の量、低圧ＥＧＲの量、吸気弁の閉弁のタイミング、排気弁の開弁のタイミング、内燃機関の圧縮変更システムの位置、噴射部の噴射タイミング、高圧燃料蓄圧器（コモンレール）内の圧力、内燃機関の冷却液温度又は内燃機関の吸気系内の温度、のうちの１つ、いくつか又は総てを含み得る。

【0174】

モデルに適用可能なさらなるパラメータ、又は、トレーニング中に考慮され得るパラメータには、車両の質量、車両の変速比、車両の駆動システムの最大駆動力、駆動システムの最大トルク、変速機のタイプ、燃料のタイプ、ハイブリッド化の仕様、エンジンのタイプ指定、車両のタイプ指定、走行経路の特徴、例えば、ＧＰＳ記録、環境温度、勾配パラメータ、環境圧力が含まれる。

【0175】

トレーニングされたモデルは、例えば、走行中に使用可能であり、これによって、潜在的な将来の排気をシミュレーションするために、検出された速度プロファイルを使用することができ、これによって、車両エレクトロニクスユニット６３は、車両の排気が規定された所定の制限を絶対に超過しないことを保証するために、原動機６１に制御命令が提供されることを保証するために、原動機６１のアクチュエータを設定することができる。他の例においては、トレーニングされたモデルは、ポンプ又はブレーキディスクなどの構成部分における摩耗の負荷シナリオを動作中に予測するために、走行中に使用可能である。

【0176】

図面に示され、上述の説明に記載された例は、本開示のコンセプトの理解に役立てる目的のものである。従って、本開示の保護範囲の限定を意図するものではない。本開示は、図示された例の変更及び修正を説明するものである。有利な例のみが提示されており、本開示の保護範囲内における総ての変更、修正及びさらなる適用が保護されるべきである。

【図1A】