特許6564905 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ シーメンス　アクチエンゲゼルシヤフトの特許一覧

特許6564905複合動的システムの最適化制御を提供するための方法およびシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
4C
4D
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6564905

(24)【登録日】2019年8月2日

(45)【発行日】2019年8月21日

(54)【発明の名称】複合動的システムの最適化制御を提供するための方法およびシステム

(51)【国際特許分類】

G06N 20/00 20190101AFI20190808BHJP

G06N 99/00 20190101ALI20190808BHJP

【ＦＩ】

G06N20/00

G06N99/00 180

【請求項の数】11

【全頁数】14

(21)【出願番号】特願2018-92884(P2018-92884)

(22)【出願日】2018年5月14日

(65)【公開番号】特開2018-195307(P2018-195307A)

(43)【公開日】2018年12月6日

【審査請求日】2018年6月13日

(31)【優先権主張番号】17171020.5

(32)【優先日】2017年5月15日

(33)【優先権主張国】EP

(73)【特許権者】

【識別番号】390039413

【氏名又は名称】シーメンスアクチエンゲゼルシヤフト

【氏名又は名称原語表記】ＳｉｅｍｅｎｓＡｋｔｉｅｎｇｅｓｅｌｌｓｃｈａｆｔ

(74)【代理人】

【識別番号】100075166

【弁理士】

【氏名又は名称】山口巖

(74)【代理人】

【識別番号】100133167

【弁理士】

【氏名又は名称】山本浩

(72)【発明者】

【氏名】ディルクハルトマン

(72)【発明者】

【氏名】ビルギットオープスト

(72)【発明者】

【氏名】エリックオロフヨハネスヴァンナーベルク

【審査官】福西章人

(56)【参考文献】

【文献】特開２０１６−１００００９（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１６／０１４７２０３（ＵＳ，Ａ１）

【文献】国際公開第２０１７／００６３７２（ＷＯ，Ａ１）

【文献】特表２０１６−５２０４６４（ＪＰ，Ａ）

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｎ３／００−９９／００

(57)【特許請求の範囲】

【請求項1】

機械学習型の、シナリオに基づく制御ヒューリスティックスを用いて複合動的システム（ｓｙｓ）の最適化制御を実行するための方法であって、
前記方法が、
ａ）現在のシナリオパラメータベクトル（ｐ）と制御ベクトル（ｕ）に基づいて、前記動的システム（ｓｙｓ）のシステム状態ベクトル（ｘ）を時間的に予測するためのシミュレーションモデル（ｆ）を提供するステップ（Ｓ１）と、
ｂ）モデル予測制御ＭＰＣアルゴリズムを用いて、前記シミュレーションモデル（ｆ）を用いた前記動的システム（ｓｙｓ）のシミュレーション中に毎回、異なるシナリオパラメータベクトル（ｐ０，ｐ１，ｐ２，・・・）および初期システム状態ベクトル（ｘ００，ｘ０１，ｘ０２，・・・）に関する制御ベクトル（ｕ）を提供するステップ（Ｓ２）と、
ｃ）シナリオパラメータベクトル（ｐ）と初期システム状態ベクトル（ｘ_０）の各シミュレートされた組み合わせに関して、ＭＰＣアルゴリズムによって、結果の最適制御値（ｕ^＊（ｐ，ｘ_０））を計算し、結果の最適制御値を保存するステップ（Ｓ３）と、
ｄ）機械学習アルゴリズムを用いて、保存された結果の最適制御値（ｕ^＊（ｐ，ｘ_０））に関する対応するシナリオパラメータベクトル（ｐ）と初期システム状態ベクトル（ｘ_０）との関係を近似する機械学習制御ヒューリスティックス（ｕ_ａ（ｐ，ｘ_０））を生成するステップ（Ｓ４）と、
ｅ）生成された機械学習制御ヒューリスティックスを用いて、前記シミュレーションモデル（ｆ）によってモデル化される複合動的システム（ｓｙｓ）を制御するステップ（Ｓ５）と、
を含む方法。

【請求項2】

前記機械学習アルゴリズムがディフュージョンマップを用いる、請求項１に記載の方法。

【請求項3】

前記機械学習アルゴリズムが、前記動的システムを近似するための閉観測量を有するディフュージョンマップを用いる、請求項１または２に記載の方法。

【請求項4】

前記機械学習アルゴリズムがサポートベクトルマシンを用いる、請求項１に記載の方法。

【請求項5】

前記生成された機械学習制御ヒューリスティックスはコントローラに転送され、コントローラは転送された機械学習制御ヒューリスティックスに従って前記動的システムをオンラインで制御する、請求項１から４のいずれか１項に記載の方法。

【請求項6】

前記機械学習制御ヒューリスティックスは、前記シミュレーションモデルによってモデル化される前記複合動的システムを制御するための近似ルールを含む、請求項１から５のいずれか１項に記載の方法。

【請求項7】

モデル記憶装置（２）に記憶されたシミュレーションモデル（ｆ）によってモデル化される動的システム（ｓｙｓ）を制御するために用いられ、現在のシナリオパラメータベクトル（ｐ）と制御ベクトル（ｕ）に基づいて前記動的システム（ｓｙｓ）のシステム状態ベクトル（ｘ）を時間的に予測するように適合された機械学習制御ヒューリスティックスを提供するための制御ヒューリスティック生成プラットフォーム（１）であって、
前記制御ヒューリスティック生成プラットフォーム（１）が、
モデル予測制御ＭＰＣアルゴリズムを用いて、前記シミュレーションモデル（ｆ）を用いた前記動的システム（ｓｙｓ）のシミュレーション中に毎回、異なるシナリオパラメータベクトルおよび初期システム状態ベクトルに関して制御ベクトル（ｕ）を提供するとともに、シナリオパラメータベクトル（ｐ）と初期システム状態ベクトル（ｘ_０）の各シミュレートされた組み合わせに関して、ＭＰＣアルゴリズムにより、結果の最適制御値（ｕ^＊（ｐ，ｘ_０））を計算し、結果の最適制御値をメモリ（６）に保存するように適合された第１の計算部（３）と、
機械学習アルゴリズムを用いて、保存された結果の最適制御値（ｕ^＊（ｐ，ｘ_０））に関する対応するシナリオパラメータベクトル（ｐ）と初期システム状態ベクトル（ｘ_０）との関係を近似する機械学習制御ヒューリスティックス（ｕ_ａ（ｐ，ｘ_０））を生成するように適合された第２の計算部（７）を含み、
生成された機械学習制御ヒューリスティックスは、前記制御ヒューリスティック生成プラットフォーム（１）のインターフェースを介して前記動的システムのコントローラ（９）に転送可能である、制御ヒューリスティック生成プラットフォーム。

【請求項8】

オンライン操作中に観察され保存される初期システム状態（ｘ_０）とシナリオパラメータベクトル（ｐ）は付加的に前記第１の計算部（３）に供給されて、コントローラ（９）に転送可能である、更新された機械学習制御ヒューリスティックスを構築する、請求項７に記載の制御ヒューリスティック生成プラットフォーム。

【請求項9】

クラウドプラットフォームとして実装される、請求項７または８に記載の制御ヒューリスティック生成プラットフォーム。

【請求項10】

前記機械学習制御ヒューリスティックスは、前記シミュレーションモデル（ｆ）によってモデル化される前記複合動的システム（ｓｙｓ）を制御するための近似ルールを備える、請求項７、８または９に記載の制御ヒューリスティック生成プラットフォーム。

【請求項11】

前記動的システム（ｓｙｓ）が、前記コントローラ（９）によって、転送された機械学習制御ヒューリスティックスに従ってオンラインで制御される車両を備えている、請求項７から１０のいずれか１項に記載の制御ヒューリスティック生成プラットフォーム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、機械学習型の、シナリオに基づく制御ヒューリスティックスを用いて、車両などの複合動的システムの最適化制御を提供するための方法およびシステムに関する。

【背景技術】

【0002】

プラントまたは車両などのシステムは益々複雑化している。その結果、システムを制御する制御素子もさらに複雑化している。これは、対応する制御システムのプログラミングとコンフィギュレーションの要求の増加につながる。さらに、計算要求もより厳しくなり、システム制御実行の所要計算時間も実際に増加する。

【発明の概要】

【発明が解決しようとする課題】

【0003】

したがって、本発明の目的は、非常に高効率であり、複合動的システムの制御を実行するための計算リソースがより少ない、複合動的システムを制御するための方法を提供することである。

【課題を解決するための手段】

【0004】

この目的は、請求項１に記載の特徴を備えた、複合動的システムの最適化制御を実行するための方法によって、本発明の第１の態様に従って達成される。

【0005】

本発明は、方法の第１の態様に従って、機械学習型の、シナリオに基づく制御ヒューリスティックスを用いた複合動的システムの最適化制御を実行するための方法を提供し、方法は、
前記動的システムの時間におけるシステム状態ベクトルを予測するためのシミュレーションモデルを、現在のシナリオパラメータベクトルと制御ベクトルに基づいて提供するステップと、
モデル予測制御ＭＰＣアルゴリズムを用いて、前記シミュレーションモデルを用いた動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルおよび初期システム状態ベクトルに関する制御ベクトルを提供するステップと、
シナリオパラメータベクトルと初期システム状態ベクトルの各シミュレートされた組み合わせに関して、モデル予測制御ＭＰＣアルゴリズムにより結果の最適制御値を計算し、結果の最適制御値を保存するステップと、
機械学習アルゴリズムを用いて、保存された結果の最適制御値に関する対応するシナリオパラメータベクトルと初期システム状態ベクトルとの関係を近似する機械学習制御ヒューリスティックスを生成するステップと、
生成された機械学習制御ヒューリスティックスを用いて、前記シミュレーションモデルによってモデル化される複合動的システムを制御するステップと、
を含む。

【0006】

本発明の第１の態様による方法の可能な一実施形態において、機械学習アルゴリズムはディフュージョンマップを用いる。

【0007】

本発明の第１の態様による方法の別の可能な実施形態において、機械学習アルゴリズムは、動的システムを近似するための閉観測量を備えたディフュージョンマップを用いる。

【0008】

本発明の第１の態様による方法の別の可能な実施形態において、機械学習アルゴリズムはサポートベクトルマシンを用いる。

【0009】

本発明の第１の態様による方法のさらなる可能な実施形態において、生成された機械学習制御ヒューリスティックスはコントローラに転送され、コントローラは動的システムを、転送された機械学習制御ヒューリスティックスに従ってオンラインで制御する。

【0010】

本発明の第１の態様による方法のもう１つの可能な実施形態において、機械学習制御ヒューリスティックスは、前記シミュレーションモデルによってモデル化される複合動的システムを制御するための近似ルールを含む。

【0011】

本発明は、さらなる態様により、請求項７の特徴を備えた制御ヒューリスティック生成プラットフォームを提供する。

【0012】

本発明は、第２の態様により、モデル記憶装置に記憶されたシミュレーションモデルｆによってモデル化される動的システムを制御するために用いられ、動的システムの時間におけるシステム状態ベクトルを、現在のシナリオパラメータベクトルと制御ベクトルに基づいて予測するように適合された機械学習制御ヒューリスティックスを提供するための制御ヒューリスティック生成プラットフォームを提供し、前記制御ヒューリスティックス生成システムは、
モデル予測制御ＭＰＣアルゴリズムを用いて、前記シミュレーションモデルｆを用いた前記動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルおよび初期システム状態ベクトルに関して制御ベクトルを提供し、シナリオパラメータベクトルと初期システム状態ベクトルの各シミュレートされた組み合わせに関して、モデル予測制御ＭＰＣアルゴリズムにより、結果の最適制御値を計算し、結果の最適制御値をメモリに保存するように適合された第１の計算部と、
機械学習アルゴリズムを用いて、保存された結果の最適制御値に関する対応するシナリオパラメータベクトルと初期システム状態ベクトルとの関係を近似する機械学習制御ヒューリスティックスを生成するように適合された第２の計算部を含み、
生成された機械学習制御ヒューリスティックスは、前記制御ヒューリスティック生成プラットフォームのインターフェースを介して前記動的システムのコントローラに転送可能である。

【0013】

本発明の第２の態様による制御ヒューリスティック生成プラットフォームの可能な実施形態において、制御ヒューリスティック生成プラットフォームは、クラウドプラットフォームとして実装される。

【0014】

本発明の第２の態様による制御ヒューリスティック生成プラットフォームのさらなる可能な実施形態において、機械学習制御ヒューリスティックスは、前記シミュレーションモデルｆによってモデル化される複合動的システムを制御するための近似ルールを備える。

【0015】

本発明の第２の態様による制御ヒューリスティック生成プラットフォームのさらなる可能な実施形態において、動的システムは、転送された機械学習制御ヒューリスティックスに従ってコントローラによってオンラインで制御される車両を備える。

【0016】

以下、本発明の第１の態様による複合動的システムの最適化制御を実行する方法と、本発明の第２の態様による制御ヒューリスティック生成プラットフォームの可能な実施形態を、添付図面を参照してより詳細に説明する。

【図面の簡単な説明】

【0017】

【図1】本発明の一態様による制御ヒューリスティック生成プラットフォームの可能な代表的実施形態の模式図である。

【図2】動的システムを制御するためにコントローラによって用いられる機械学習制御ヒューリスティックスを提供する制御ヒューリスティック生成プラットフォームの可能な代表的実施形態を示すさらなる模式図である。

【図3】本発明の一態様による複合動的システムの最適化制御を実行するための方法の可能な代表的実施形態のフローチャートである。

【図4A】本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。

【図4B】本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。

【図4C】本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。

【図4D】本発明の一態様による複雑なシステムの最適化制御を実行するための方法の可能な代表的実施形態を示す図である。

【図5】本発明のシステムの可能なユースケースを示すモデル予測制御結果の図である。

【図6】図５のユースケースに関する可能なシステムの応答を示す図である。

【発明を実施するための形態】

【0018】

図１の代表的実施形態に見られるように、本発明の一態様による制御ヒューリスティック生成プラットフォーム１は、異なるコンポーネントを備え得る。図１に示された制御ヒューリスティック生成プラットフォーム１は、機械学習制御ヒューリスティックスを提供するために用いられ得る。これらの制御ヒューリスティックスは、動的システムｓｙｓをオンラインで制御するために用いられ、動的システムｓｙｓはシミュレーションモデルｆによってモデル化されて、制御ヒューリスティック生成プラットフォーム１のモデル記憶装置２に記憶される。モデル記憶装置２に記憶されたシミュレーションモデルｆは、動的システムｓｙｓの時間におけるシステム状態ベクトルｘを、現在のシナリオパラメータベクトルｐと制御ベクトルｕに基づいて予測するように適合される。シミュレーションモデルｆは、動的システムｓｙｓのエンジニアリングモデルであり得る。動的システムは例えば、道路を走行中の車両であり得る。制御ヒューリスティック生成プラットフォーム１は、モデル予測制御ＭＰＣアルゴリズムを用いて、シミュレーションモデルｆを用いた動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルｐおよび初期システム状態ベクトルｘ_０に関して制御ベクトルｕを提供するように適合された第１の計算部３を備えている。制御ヒューリスティック生成プラットフォーム１の第１の計算部３は、シナリオパラメータベクトルｐを記憶するデータベース４へのアクセスを有する。さらに、制御ヒューリスティック生成プラットフォーム１の計算部３は、システムｓｙｓの初期システム状態ベクトルｘ_０が記憶されているさらなるデータベース５へのアクセスを有する。計算部３は、シナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０の各シミュレートされた組み合わせに関して、結果の最適制御値ｕ^＊を、ＭＰＣアルゴリズムを用いて計算するように適合される。次に、結果の最適制御値ｕ^＊は、計算された最適制御値を記憶するメモリ６に、計算部３によって保存される。

【0019】

制御ヒューリスティック生成プラットフォーム１はさらに、結果の最適制御値に関する対応するシナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０との関係を、機械学習アルゴリズムＭＬＡを用いて近似する機械学習制御ヒューリスティックスを生成するように適合された第２の計算部７を備える。生成された機械学習制御ヒューリスティックスｕ_ａは、可能な実施形態において制御ヒューリスティック生成プラットフォーム１のインターフェースを介して動的システムｓｙｓのコントローラ９に転送され得る。図１に示すように、生成された機械学習制御ヒューリスティックスｕ_ａは、完成後に、手段８を介して、シミュレーションモデルｆによってモデル化される動的システムｓｙｓをオンラインで制御するコントローラ９に転送される。機械学習制御ヒューリスティックスｕ_ａは、ケーブルによって電子的に、またはＵＳＢスティック等の物理的メモリによって、などの異なる手段で搬送されてもよい。可能な実装において、制御ヒューリスティック生成プラットフォーム１は、リモートプラットフォームとして、例えばクラウドプラットフォームとして実装され得る。クラウドプラットフォームとしての実装は、オフラインのヒューリスティック生成フェーズにおいて、ほぼ無限の計算リソースを用いることを可能にする。

【0020】

図２は、本発明によるシステムを例示するためのさらなる図を示す。図２の例示された実施形態において、リモートプラットフォーム１は、動的システムｓｙｓのエンジニアリングモデルまたはシミュレーションモデルｆを記憶するための記憶装置２を備えている。プラットフォーム１は、例示された実施形態において、用いられるシミュレーションモデルｆの複雑さまたは次数を自動的に低減するためのモデル次数低減部２ａを備えている。データベース４は、例えば履歴データ、以前の製品生成または製品要求等の、見込まれるユースケースまたはシナリオパラメータベクトルの群を記憶する。計算部３は、モデル予測制御ＭＰＣを用いてシミュレーションを実行して、制御ベクトルｕを提供する。したがって、計算部３は、見込まれるシナリオの群に関するモデル予測制御ＭＰＣを提供する。モデル予測制御ＭＰＣアルゴリズムは、シミュレーションモデルｆを用いた動的システムｓｙｓのシミュレーション中に毎回、データベース５から読み出された異なるシナリオパラメータベクトルｐおよび初期システム状態ベクトルｘ_０に関して制御ベクトルｕを提供するために用いられる。シナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０のシミュレーションの組み合わせ毎に、結果の最適制御値ｕ^＊が、ＭＰＣアルゴリズムを用いて計算される。結果の最適制御値ｕ^＊は、プラットフォーム１のメモリ６に記憶される。プラットフォーム１の第２の計算部７は、保存された結果の最適制御値ｕ^＊に関する対応するシナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０との間の関係を近似する機械学習制御ヒューリスティックスｕ_ａを、機械学習アルゴリズムＭＬＡを用いて生成する。制御値は、記憶された制御挙動に基づく機械学習によって、および／または例えばニューラルネットワークによる制御曲線によって学習される。生成された機械学習制御ヒューリスティックスｕ_ａは次に、図２に示すようにコントローラ９の内部メモリ９Ａに転送され得る。制御ヒューリスティック生成プラットフォーム１は、モデル予測制御ＭＰＣアルゴリズムを用いて、シミュレーションモデルｆ、一組のパラメータシナリオに基づいて、機械学習を用いてオフラインの前処理を実行する。このように、制御ヒューリスティック生成プラットフォーム１は、オフライン段階で、すなわち、システムｓｙｓの動作の前に前処理を提供する。

【0021】

制御ヒューリスティックスｕ_ａがコントローラ９の内部メモリ９Ａに転送された後で、システムｓｙｓの動作中にオンライン制御段階が開始される。システムｓｙｓは、図２に示すように１つまたはいくつかのプロセス１０Ａを含む。システムのプロセスは、図２に同様に示されるようなプロセスの現在の状態での予測される負荷９Ｂに基づいて制御ヒューリスティックスｕ_ａを用いて制御され得る。付加的なユースケースまたはシナリオが、図２に示されるようにプラットフォーム１のデータベース４に記憶されてもよい。これらの付加的なユースケースまたはシナリオは、オフライン段階中にパラメータおよび状態値を保存することによって収集され得る。シミュレーションモデルｆの更新が、劣化によるパラメータの変化等の付加的なセンサ情報に基づいて実行されることも可能である。現在の負荷（いくつかのシナリオパラメータの現在の値）１０Ｂが、図２に示すように、動的システムｓｙｓのプロセス１０Ａに供給される。

【0022】

動作に従って学習されたシナリオの、データベースへのフィードバックがある。フィードバックは経時的に制御を大きく改良する。

【0023】

このデータに基づいて、
Ａ）シミュレーションモデルの入力パラメータが校正されることができて、より良いシミュレーションモデルにつながる、例えば、モータ特性に磨耗が如何に影響するかを学習する、予測よりも圧力が少ないタイヤを検出する、異なる空気力学につながる、ボックス付きルーフトップを検出する等を行い、
Ｂ）可能ならば、どの負荷に基づいてシステム、例えば機械が作動されるかを判断する。車の場合、それは地図から軌跡を読み取ることによってなされ得る。船、工場またはポンプの場合、これは一層複雑になり得る。例えば、ポンプに関しては、異なる粘度を有するどの種類の油がパイプライン内で圧送されるかが判断され得る。例えば、異なる粘度は異なる負荷を意味し得る。

【0024】

動的システムは、状態ベクトル（ｘ）を有するシステムであり、状態ベクトルは、特定の状態の関数に従って時間ｔとともに発展し、ｆ（ｘ）＝ｄｘ／ｄｔとなる。さらに、関数は、ベクトルｐのいくつかのパラメータを受け入れ得る（ｄｘ／ｄｔ＝ｆ（ｘ，ｐ））。制御可能な動的システムにおいて、付加的な制御ベクトル（ｕ）は、動的システムの発展に影響し得る、コントローラ９によって直接変更され得るシステムの部分を表す（ｄｘ／ｄｔ＝ｆ（ｘ，ｕ，ｐ））。動的システムｓｙｓの一例は、坂道を走行している車両であり、その場合状態ベクトルｘの状態ベクトルエントリーは、車両の高さ、傾斜、位置、速度、加速度ならびにその車両のモータの角速度等の量であり得る。出力ベクトルエントリーは、車両のダッシュボード上の速度および消費の読み取り値を含み得る。これらから、状態ベクトルｘが直接または間接的に推測され得る。制御ベクトルｕの制御ベクトルエントリーは例えば、どれ程のガスが供給されたか、およびブレーキペダルがどこまで踏み込まれたかを示し得る。パラメータベクトルｐのパラメータベクトルエントリーは例えば、車両の質量、空気抗力および転がり抵抗プロファイルならびにモータトルクプロファイルを含み得る。さらなるパラメータベクトルエントリーは、位置を伴う高さの表での値または高さ曲線を記述する何らかの関数の係数等の、道路の高さプロファイルを記述し得る。

【0025】

モデル予測制御（ＭＰＣ）は、制御可能な動的システムｓｙｓを制御するための最適な方式を計算するためのアルゴリズムである。モデル予測制御（ＭＰＣ）は、発展関数、時間ｔ＝０での推定状態ベクトルｘと、パラメータベクトルｐ、おそらく何らかの制約ｄ（ｘ，ｕ，ｐ）ならびに可能な限り低いコスト関数Ｃ（ｔ，ｘ，ｕ，ｐ）を入力として取り込み、最適化アルゴリズムを用いて、ｔ＝０からｔ＝Ｔ_ｈまでの最適な制御ｕ^＊を見出し、それは、予測ホライズンと呼ばれる、この時間間隔中に積分されたコスト関数Ｃの最小値そのものまたはほぼ最小値のいずれかをもたらし、同時に、可能ならば制約も満たしている。Ｔ_ｈは予測ホライズン長さと呼ばれる。この計算された最適な制御ｕ^＊は時間ステップΔＴ_ｃにわたり実行され、その場合０＜ΔＴ_ｃ＜Ｔ_ｈであり、その後、最適な制御ｕ^＊は、時間ｔ＝ΔＴ_ｃでの状態ベクトルｘの新たな推定値を用いて、ｔ＝ΔＴ_ｃからｔ＝Ｔ_ｈ＋ΔＴ_ｃまでの時間にわたり再び見出される。これは次に、ΔＴ_ｃから２ΔＴ_ｃまでの次の時間間隔にわたり、また、望むだけ反復されることができる。

【0026】

図３は、本発明の一態様による、複合動的システムｓｙｓの最適化制御を実行するための方法の可能な代表的実施形態のフローチャートを示す。

【0027】

第１のステップＳ１で、動的システムの時間におけるシステム状態ベクトルｘを、シナリオパラメータベクトルｐおよび制御ベクトルｕに基づいて予測するためのシミュレーションモデルｆが提供される。

【0028】

さらなるステップＳ２で、モデル予測制御ＭＰＣアルゴリズムを用いて、シミュレーションモデルｆを用いた動的システムのシミュレーション中に毎回、異なるシナリオパラメータベクトルｐおよび初期システム状態ベクトルｘ_０に関して制御ベクトルｕを提供する。

【0029】

さらなるステップＳ３で、シナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０の各シミュレートされた組み合わせに関して、結果の最適制御値ｕ^＊がＭＰＣアルゴリズムによって計算され、メモリに保存される。

【0030】

さらなるステップＳ４で、機械学習アルゴリズムＭＬＡを用いて、保存された結果の最適制御値ｕ^＊に関する対応するシナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０との関係を近似する機械学習制御ヒューリスティックスｕ_ａが生成される。機械学習アルゴリズムＭＬＡは、例えばディフュージョンマップを用いてよい。１つの可能な実施形態において、機械学習アルゴリズムＭＬＡは動的システムｓｙｓを近似するための閉観測量を有するディフュージョンマップを用いる。

【0031】

さらなるステップＳ５で、生成された機械学習ヒューリスティックスｕ_ａは、シミュレーションモデルｆによってモデル化される複合動的システムをオンラインで制御するために用いられる。

【0032】

制御可能な動的システムｓｙｓは、システムのダイナミクスのためのシミュレーションモデルｆによって以下のように表され得る：

【数1】

ここで、ｔは時間、ｘは状態変数ベクトル、ｕは制御変数ベクトル、ｐはパラメータベクトルである。

【0033】

図４Ａから図４Ｄは、本発明による方法のステップを示す。

【0034】

図４Ａは、一次元状態ｘ（ｔ）とコントロールｕ（ｔ）のためのＭＰＣ最適化を示す。ｘおよびｕに関する既知のデータ（実線）と、システムのダイナミクス

【数2】

に基づき、コスト関数Ｃ（図示せず）は予測ホライズンｔε［ｔ_０、ｔ_０＋Ｔ_ｈｏｒ］に関して最小化される。結果のｕおよび対応する予測状態ｘ（破線）に対する最適制御値はその後、次のΔＴ_ｃに、ｔ_１まで用いられることができ、ｔ_１の時点で、この手順は、間隔ｔε［ｔ_０、ｔ_０＋Ｔ_ｈｏｒ］に関して反復される。

【0035】

図４Ｂに例示されるように、高次元ＭＰＣデータは次に、ディフュージョンマップを用いることで低次元マニホールドにパラメータ化されて、ディフュージョンマップ座標Ψ_０およびΨ_１をもたらす。ディフュージョンマップは、高次元に埋め込まれた低次元マニホールドをパラメータ化するためのデータ解析ツールである。ディフュージョンマップによるマッピングは、特定のカーネルまたはメトリックに従って測定された最近傍間の距離に基づく。ディフュージョンマップの基となる概念は、下層のマニホールド内でサンプリングされたポイントに関して、高次元空間内の最近接ポイント同士の距離が、そのマニホールドにおける、またはマニホールドに沿った距離とほぼ等しくなるということである。これは、ポイント間の一種のディフュージョン演算子に用いることができ、それは、無限データの制約内で、連続したラプラース−ベルトラミ演算子を近似するためになされ得る。この演算子の固有ベクトルまたは固有関数が、下層のマニホールドの有用なパラメータ化を提供するため、離散したポイントに関して同じことを行い、パラメータ化を得ることが可能である。固有ベクトル値は、最も重要な方向、またはマニホールド内の距離に対して最も貢献度が高い方向における座標として解釈され得る。固有ベクトルとして、それらはデータ上の関数の空間の直角ベースをも形成する。これは、幾何学的ハーモニクスを介した補間および拡張関数のべースをも形成できる。

【0036】

図４Ｃに示すように、ディフュージョンマップの座標は、拡張されて、ディフュージョンマップによって近似された低次元マニホールド上またはその付近のサンプリングされないポイントに補間され得る。

【0037】

さらに、図４Ｄに示されるように、出力されたヒューリスティックスは以前にサンプリングされていないポイントに補間されることができ、次に、例えば認証または制御用に用いられ得る。

【0038】

システムのダイナミクスを組み込むもう１つの可能性は、各データポイントを、時間遅延埋め込みによって拡張すること、すなわち、時系列全体を１つのデータポイントとして組み込むことである。こうして、距離メトリックは、単一の時点というよりは軌跡全体間の差異を比較する。

【0039】

１つの可能な実施形態において、複合動的システムは、路上を走行中の車両を含む。１つの適用例において、そのようなシステムは、現在の速度（状態ｘ）に基づいた予め設けられた高さプロファイル（シナリオｐ）に関してエネルギー最適化された車両の加速度と制動を含む。

【0040】

例えば、制御ヒューリスティックは、図５に示すように、マップルート（グーグル（Ｇｏｏｇｌｅ：登録商標）マップまたはその他のマップサービスおよびナビゲーションシステムによって提供される）の高さプロファイルによって訓練され得る。モデル予測制御（ＭＰＣ）アルゴリズムは、この高さプロファイルに関して最適化制御戦略または最適化制御値を供給できる。図５は、速度Ｖ、加速度Ａ、温度Ｔおよびモータ制動力Ｆならびに距離ｄにわたる瞬時（コスト／時間）値ｃを示す。

【0041】

図６に、ＭＰＣから、高さ２００および中心３０００分だけ離れた標準偏差１０００のガウス分布の２つの連続した坂への最適制御値を有するシステム応答が図示されている。

【0042】

制御ヒューリスティック生成プラットフォーム１は、シナリオパラメータベクトルを記憶するためのデータベース４を備える。シナリオパラメータベクトルは、システムの外部因子を記述するパラメータのベクトルである。これらの外部因子は、システムの発展により変化しない。これらのパラメータは、そのシステムのプロセス要求、物理定数、特性、または特定の設定の特性を含み得る。

【0043】

さらに、プラットフォーム１は、システムの初期システム状態ベクトルへのアクセスを有する。システム状態ベクトルｘは、動的システムｓｙｓの状態を記述し、動的システムｓｙｓの将来に影響し、経時的に発展する変数のベクトルである。発展は、システム状態ベクトルｘ、シナリオパラメータベクトルｐおよびｄｘ／ｄｔ＝ｆ（ｘ，ｕ，ｐ）による制御変数のベクトルｕに依存する数理モデルｆによって記述される。モデル予測制御ＭＰＣは、シミュレーションモデルｆを用いた動的システムｓｙｓのシミュレーション中に毎回、異なるシナリオパラメータベクトルｐおよび初期システム状態ベクトルｘ_０に関して制御ベクトルｕを提供するために用いられる。シナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０の各シミュレートされた組み合わせに関して、図１に示すように、結果の最適制御値ｕ^＊が計算されてメモリ６に保存される。機械学習アルゴリズムＭＬＡを用いて、保存された結果の最適制御値ｕ^＊に関する対応するシナリオパラメータベクトルｐと初期システム状態ベクトルｘ_０との関係を近似する機械学習制御ヒューリスティックスｕ_ａを生成する。機械学習ヒューリスティックは、機械学習アルゴリズムＭＬＡによって生成されるヒューリスティック（経験則または近似ルール）である。機械学習ヒューリスティックスは、したがって、制御のための近似ルールを含む。機械学習制御ヒューリスティックスｕ_ａは、入力システムベクトルｘおよびシナリオパラメータベクトルｐから、モデル予測制御ＭＰＣアルゴリズムによって生成された最適な制御ベクトルｕへの入力／出力関係の近似ルールを指す。したがって、そのような機械学習制御ヒューリスティックスｕ_ａは、入力状態ベクトルｘとシナリオパラメータベクトルｐを取り込んで制御ベクトルｕを出力する数学関数である。制御ヒューリスティックスは、計算された最適制御値を提供する。結果の最適制御値ｕ^＊は保存され、次に、関係（ヒューリスティック）が補間され得る。

【0044】

別の可能な実施形態において、線形回帰または最近傍補間が、変数に近似ルールをもたらすために用いられ得る。

【0045】

システムｓｙｓ自体は、生成された機械学習制御ヒューリスティックスｕ_ａのみを用いて、コントローラ９による操作中に制御され得る。したがって、コントローラ９自体の計算要求は低い。さらに、制御は従来型モデル予測制御ＭＰＣと比較してロバストである。複合プロセッサまたはシステムｓｙｓであっても、単純な制御ヒューリスティックスｕ_ａで表されることができ、その結果、制御方法の効率が向上する。

【符号の説明】

【0046】

１制御ヒューリスティック生成プラットフォーム
２モデル記憶装置
２ａモデル次数低減部
３計算部
４データベース
５データベース
６メモリ
７計算部
８手段
９コントローラ
９Ａ内部メモリ
９Ｂ予測される負荷
１０Ａプロセス
１０Ｂ現在の負荷
ｆシミュレーションモデル
ｐシナリオパラメータベクトル
ｕ制御ベクトル
ｕ_ａ制御ヒューリスティックス
ｓｙｓ動的システム

【図1】