IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許7588761ガウス分布の仮定密度フィルタによる不確実性伝播に基づく確率論的非線形予測コントローラおよび方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-14
(45)【発行日】2024-11-22
(54)【発明の名称】ガウス分布の仮定密度フィルタによる不確実性伝播に基づく確率論的非線形予測コントローラおよび方法
(51)【国際特許分類】
   G05B 13/04 20060101AFI20241115BHJP
   G05B 13/02 20060101ALI20241115BHJP
【FI】
G05B13/04
G05B13/02 K
【請求項の数】 24
(21)【出願番号】P 2024517607
(86)(22)【出願日】2022-02-18
(65)【公表番号】
(43)【公表日】2024-05-24
(86)【国際出願番号】 JP2022008106
(87)【国際公開番号】W WO2023276268
(87)【国際公開日】2023-01-05
【審査請求日】2023-11-27
(31)【優先権主張番号】17/365,338
(32)【優先日】2021-07-01
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】クイリネン,リエン
(72)【発明者】
【氏名】バーントープ,カール
【審査官】田中 成彦
(56)【参考文献】
【文献】特表2021-504815(JP,A)
【文献】米国特許出願公開第2014/0368387(US,A1)
【文献】特表2020-535562(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/00 - 13/04
(57)【特許請求の範囲】
【請求項1】
システムの状態および制御変数に対する制約を受ける不確実性の下でシステムを制御するための予測コントローラであって、
少なくとも1つのプロセッサと、
命令を格納したメモリとを備え、前記命令は、前記少なくとも1つのプロセッサによって実行されると、前記予測コントローラに、
前記予測コントローラの各制御ステップにおいて、制御信号を生成するために前記不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解かせ、前記予測コントローラは、確率的機会制約に基づいて、ガウス分布の仮定密度フィルタリング(ADF)に基づく離散時間近似伝播方程式を用いて、直接最適制御構造化非線形プログラム(NLP)を解いて、予測範囲内のある時間ステップから次の時間ステップまで、状態確率分布の一次および/または高次モーメント積分の近似予測を、時変モデル化不確実性および/または外部外乱のうちの1つまたは複数の確率分布の前記一次および/または高次モーメント積分に応じて、直接最適制御構造化非線形プログラム(NLP)解が発見されたかどうか、および/または最大反復回数に到達したかどうかの終了条件が満たされるまで実行し、前記命令はさらに、前記予測コントローラに、
前記制御信号を用いて前記システムの動作を制御させ
前記システムの状態および制御変数に対する制約は、1つまたは複数の不等式制約を含み、前記確率的機会制約は、対応する不等式制約の各々に違反する確率が確率閾値を下回ることを保証するために、バックオフ係数値と、制約ヤコビアン行列と、前記予測範囲内の各時間ステップにおける予測状態変数の前記一次および/または高次モーメント積分とに依存する項を有する制約境界によって強化された1つまたは複数の不等式制約に基づいて近似される、予測コントローラ。
【請求項2】
前記一次および/または高次モーメント積分は、平均である第1のモーメント積分と、共分散である第2のモーメント積分とを含む、請求項に記載の予測コントローラ。
【請求項3】
前記バックオフ係数値は、基礎となる状態確率分布に関係なく成立するカンテリ・チェビシェフ不等式を用いて計算される、請求項に記載の予測コントローラ。
【請求項4】
前記バックオフ係数値は、近似的に正規分布する状態軌道を仮定する逆ガウス誤差関数を用いて計算される、請求項に記載の予測コントローラ。
【請求項5】
前記バックオフ係数値は、前記状態確率分布の第1のモーメント積分と、第2のモーメント積分と、第4のモーメント積分とに基づいて、多変量ピアソンVII確率分布の累積密度関数を用いて計算される、請求項に記載の予測コントローラ。
【請求項6】
前記予測範囲内の時間ステップごとの平均状態値および状態共分散行列の伝播は、初期状態推定および不確実性を考慮し、前記時変モデル化不確実性および/または外部外乱の1つまたは複数の平均および共分散を考慮し、かつ前記予測範囲について最適化される制御入力変数の現在値を考慮して、ガウス分布の仮定密度フィルタリング(ADF)に基づいて非線形状態平均および非線形共分散伝播方程式に近似することによって実行される、請求項に記載の予測コントローラ。
【請求項7】
前記ガウス分布の仮定密度フィルタは、前記予測範囲について最適化される制御入力変数の現在値を考慮して、状態動的方程式および対応するヤコビアン行列の評価に基づいて、非線形システムダイナミクスの陽的線形化を使用する拡張カルマンフィルタ(EKF)である、請求項に記載の予測コントローラ。
【請求項8】
前記ガウス分布の仮定密度フィルタは、線形回帰カルマンフィルタ(LRKF)であり、線形回帰カルマンフィルタ(LRKF)は、前記予測範囲について最適化される制御入力変数の現在値を考慮して、1つまたは複数の積分点における状態動的方程式の評価に基づ、前記状態確率分布の統計的線形化使用される、請求項に記載の予測コントローラ。
【請求項9】
積分点の集合は、球面立体求積公式またはアンセンテッド変換に従って選択される、請求項に記載の予測コントローラ。
【請求項10】
前記非線形共分散伝播方程式は、各制御時間ステップにおける前記状態共分散行列の正定値性を保持するために、前記状態共分散行列をコレスキー分解演算子を用いて再定式化する、請求項に記載の予測コントローラ。
【請求項11】
各制御時間ステップにおいて前記状態共分散行列のコレスキー分解が存在することを保証するために、前記非線形共分散伝播方程式において正則化項が使用される、請求項10に記載の予測コントローラ。
【請求項12】
前記予測範囲内の時間ステップごとの平均状態値および状態共分散行列の伝播は、前記予測範囲内の前記予測状態変数の不確実性の順方向伝播における将来のフィードバック制御アクションを考慮するために、非線形システムダイナミクスの事前安定化システムについて実行され
前記非線形システムダイナミクスの事前安定化システムは、アフィンフィードバックゲインの時不変または時変シーケンスを使用している、請求項に記載の予測コントローラ。
【請求項13】
前記不等式制約付き非線形動的最適化問題は、前記非線形システムダイナミクスの事前安定化システムの実行可能性を保証するために、前記予測範囲内の後続のフィードバック制御アクションに対する1つまたは複数の不等式制約について1つまたは複数の確率的機会制約を含む、請求項12に記載の予測コントローラ。
【請求項14】
前記予測コントローラは、ブロック構造化スパース性を保持する二次計画法(QP)下位問題を解く逐次二次計画法(SQP)最適化アルゴリズムを用いて、前記直接最適制御構造化非線形プログラム(NLP)の(近似)最適解を計算して、前記SQP最適化アルゴリズムの各反復において、状態平均および共分散変数の値の更新、ならびに前記制御変数の値の更新を、終了条件が満たされるまで計算する、請求項1に記載の予測コントローラ。
【請求項15】
前記SQP最適化アルゴリズムは、前記NLPの目的関数および/または制約関数の一次および/または高次導関数のうちの1つまたは複数の厳密でない評価に基づいており、それによって、大幅に低い計算コストで解くことができるQP下位問題になる、請求項14に記載の予測コントローラ。
【請求項16】
厳密でないSQP最適化アルゴリズムの各反復は、状態共分散行列のコレスキー因子の偏差変数の数値的除去を使用し、それによって、ブロック構造化スパース性を保持し、かつ大幅に低い計算コストで解くことができるQP下位問題になる、請求項15に記載の予測コントローラ。
【請求項17】
前記厳密でないSQP最適化アルゴリズムの各反復は、前記NLPの目的関数および/または制約関数の一次および/または高次導関数のうちの1つまたは複数の厳密でない評価の補正として、1つまたは複数の随伴ベースの勾配計算を使用する、請求項16に記載の予測コントローラ。
【請求項18】
前記厳密でないSQP最適化アルゴリズムの各反復は、前記QP下位問題の主解および双対解に基づく展開ステップを用いて、前記予測範囲内の各時間ステップにおいて、前記状態共分散行列のコレスキー因子の偏差変数の更新と、状態共分散伝播方程式のラグランジュ乗数値の更新とを計算する、請求項16に記載の予測コントローラ。
【請求項19】
前記状態平均および共分散変数の値の更新、ならびに前記制御変数の値の更新は、直接最適制御構造化NLPの(近似)最適解を計算するために前記SQP最適化アルゴリズムの各反復において十分な進行を保証するためのメリット関数と組み合わせて直線探索手順に基づくことができるグローバル化ベースのステップサイズ選択を必要とする、請求項14に記載の予測コントローラ。
【請求項20】
P下位問題を解いた後に、初期状態値から開始して線形化されたシステムダイナミクスをシミュレートし、かつ、前記予測範囲内の各時間ステップにおいて更新された制御値を使用することよって、平均状態変数の値を更新できるように、前記平均状態値および制御変数の最適化は、前記予測範囲内のすべての前の時間ステップにおける前記平均状態変数および制御変数の初期値の関数として、圧縮ルーチンにおいて前記予測範囲内の各時間ステップにおける前記平均状態変数を数値的に削除する、請求項14に記載の予測コントローラ。
【請求項21】
前記予測コントローラは、前の制御ステップにおける前記予測範囲にわたる状態平均値および共分散行列値ならびに制御入力値の最適シーケンスから開始して、各制御ステップにおいて、前記不等式制約付き非線形動的最適化問題を解くために、導関数ベースの最適化アルゴリズムについて1回または所定回数の反復のみを使用する、請求項1に記載の予測コントローラ。
【請求項22】
前記導関数ベースの最適化アルゴリズムは、目的関数および/または制約関数の一次および/または高次導関数のうちの1つまたは複数の厳密でない評価を使用する随伴ベースのSQP最適化法であり、前記随伴ベースのSQP最適化法は、各制御ステップにおいて、1つまたは所定数のブロック構造化QP下位問題のみを解いて、前記予測範囲にわたる状態平均値および共分散行列値ならびに制御入力値の最適シーケンスを更新する、請求項21に記載の予測コントローラ。
【請求項23】
被制御システムが、車両のコントローラに制御入力を出力するように構成されている、請求項1に記載の予測コントローラ。
【請求項24】
前記車両の状態は、前記車両の位置、向き、速度、角速度、スリップ率およびスリップ角の値の1つまたは組み合わせを含み、前記制御入力は、加速度、ブレーキトルク、操舵角および操舵率の値の1つまたは組み合わせを含み、前記不確実性は、前記車両のモデルにおける質量値、慣性値、またはその両方の不確実性、前記車両のステアリングモデルの不確実性、前記車両のタイヤと路面との間の摩擦を示す1つまたは複数のパラメータ値の不確実性の1つまたは組み合わせを含む時変外乱を含む、請求項23に記載の予測コントローラ。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、一般に予測制御に関し、より特定的には、不確実性の存在下における非線形動的システムの確率論的予測制御のための予測状態変数の平均および共分散情報の高精度伝播の方法ならびに装置に関する。
【背景技術】
【0002】
非線形モデル予測制御(nonlinear model predictive control:NMPC)は成熟しており、比較的複雑な制約付きのプロセスを処理する能力を示している。NMPCのような予測コントローラは、非線形微分方程式の組、すなわち常微分方程式(ordinary differential equation:ODE)または微分代数方程式(differential-algebraic equation:DAE)のシステムによって記述される複雑な動的システムを制御するために、多くの用途で使用することができる。このようなシステムの例として、生産ライン、車両、人工衛星、エンジン、ロボット、発電機およびその他の(半)自動制御機械が挙げられる。
NMPCはフィードバックに起因する固有のロバスト性を示すが、このようなコントローラは不確実性を直接考慮しないため、モデルの不確実性および/または外部外乱の存在下では、セーフティクリティカルな制約の充足を保証することができない。ある代替的なアプローチは、不確実性および/または有界外乱が存在する最悪のシナリオにおける制御ポリシーの最適化に依存するロバストNMPCである。しかしながら、ロバストNMPCは、最悪のシナリオが極めて低い確率で発生するため、制御性能が保守的になる可能性がある。
【0003】
確率論的(Stochastic)NMPC(SNMPC)は、不確実性の確率的記述を最適制御問題(optimal control problem:OCP)の定式化に直接組み込むことにより、ロバストNMPCの保守性を低減することを意図している。SNMPCでは、ある確率で、すなわち、指定されるもののゼロではない制約違反確率を考慮するいわゆる機会制約を定式化することにより、制約が満たされることが要求される。さらに、確率論的NMPCは、プラントの実行可能領域の境界付近で閉ループ動作で高い性能が達成されるような設定で有利である。一般的な場合、機会制約は計算が困難であり、たとえば、非線形システムダイナミクスを通して伝播される状態変数の確率分布の近似計算に基づく近似定式化を必要とする。
【0004】
サンプリング技術は、不確実性のランダムな実現値の有限集合を用いて確率論的システムダイナミクスを特徴付けるものであるが、不確実性伝播に必要なサンプル数が多いことがよくあるため、計算コストが多大になる可能性がある。シナリオベースの方法は、確率分布の適切な表現を利用するが、シナリオの数を決定するタスクは、ロバスト性と計算効率との間のトレードオフにつながる。状態の遷移確率分布を記述するためにガウス混合近似を用いることができるが、重みを適応するには計算コストがかかることが多い。また、別のアプローチは多項式カオス(polynomial chaos:PC)を使用し、暗黙的マッピングを直交多項式基底関数の展開に置き換えるが、時変不確実性の場合、PCベースの確率論的NMPCは多くの展開項を必要とする。
【0005】
または、たとえば、テイラー級数近似に基づく非線形システムダイナミクスの陽的線形化を用いて、確率的機会制約を近似することができる。しかしながら、結果として得られる線形化ベースの共分散伝播は、非線形システムダイナミクスについて十分に正確でない可能性がある。さらに、後者のアプローチでは、状態変数の平均値の正確な伝播ができず、非線形システムダイナミクスの公称値(すなわち、不確実性ゼロおよび/または外乱ゼロに対応する値)と異なる可能性がある。したがって、不確実性の下での非線形動的システムの確率論的予測制御において、確率的機会制約を定式化するために、平均および共分散情報の直接扱いやすいが正確な伝播が必要である。
【0006】
直接最適制御法は、制御範囲の離散化と予測範囲にわたる制御アクションの対応するパラメータ化とに基づく連続時間微分方程式の離散化に依存している。さらに、確率論的予測制御用途の場合、予測範囲にわたる制御フィードバックのパラメータ化に基づく非線形システムダイナミクスの不確実性を伝播するための離散時間または離散化された方程式の組を、直接OCP定式化に含めることができる。結果として得られる大規模な非線形最適化問題または非線形計画(nonlinear program:NLP)は、任意の非線形最適化ソルバによって解くことができる。しかしながら、非線形システムの予測制御のリアルタイム用途の場合、この非線形最適化問題は、厳密なタイミング制約の下で、計算能力が限られ、かつ利用可能なメモリが限られた組込みハードウェア上で、解く必要がある。
【0007】
非線形微分方程式で記述されるシステムの確率論的予測制御は、各制御時間ステップにおいて非線形確率論的最適制御問題の解を必要とする。各問題を厳密に解く代わりに、ある時点から次の時点へ解の推測を更新するために、逐次二次計画法(sequential quadratic programming:SQP)の1つのリアルタイム反復を実行することができる。このようなニュートン型SQPアルゴリズムは、アルゴリズムの各反復において、非線形制約関数および目的関数の線形化を必要とする。この線形化は、特に非線形システムダイナミクスの不確実性伝播を記述する方程式の組の場合、コストがかかる可能性があり、陽的積分法を使用する場合にはヤコビアン評価が必要となり、非線形微分方程式を離散化する陰的積分法の場合には、非線形連立方程式を解くための行列分解、行列-行列乗算、および/または反復手順がさらに必要となる可能性がある。
【0008】
したがって、結果として得られるSNMPCコントローラの閉ループ性能を向上させるために、非線形システムダイナミクスを通じて状態変数の平均および共分散情報を伝播する精度を高める必要があり、不確実性の下での非線形動的システムのための確率論的予測制御のリアルタイム用途において、数値最適化アルゴリズムの計算コストを削減する必要がある。
【発明の概要】
【0009】
いくつかの実施形態の目的は、システムの動的モデルを記述する非線形微分方程式の離散化、および非線形システムダイナミクスの不確実性の離散時間伝播に基づいて、確率的機会制約を含む不等式制約付き非線形動的最適化問題を解くことによって、不確実性の下でシステムを制御するためのシステムおよび方法を提供することである。確率的機会制約の各々は、対応する不等式制約に違反する確率が、ある確率閾値を下回るように保証することを目的とする。
【0010】
本発明のいくつかの実施形態は、バックオフ係数値と、制約ヤコビアン行列と、特定の時間ステップにおける予測状態値の一次および/または高次モーメント積分とに依存する項を有する不等式制約ごとの強化に基づく確率的機会制約の定式化を使用する。本発明のいくつかの実施形態において、一次および/または高次モーメント積分は、平均である第1のモーメント積分と、共分散である第2のモーメント積分とを含む。共分散行列は、近似線形化ベースの共分散伝播を用いて、制御範囲内の各時間ステップにおける状態値について効率的に計算することができる。線形化ベースの共分散方程式は、非線形システムダイナミクスを通して状態変数の平均および共分散情報の正確でない伝播につながる可能性がある。したがって、本発明のいくつかの実施形態において、ガウス分布の仮定密度フィルタ(assumed density filter:ADF)を用いて、非線形システムダイナミクスを通して状態変数の平均および共分散情報の高精度の伝播を実行する。状態変数の平均および共分散情報のより正確な伝播は、不確実性の下での非線形動的システムの確率論的予測制御の性能向上につながり得る。
【0011】
本発明のいくつかの実施形態によれば、システムの状態および制御変数に対する制約を受ける不確実性の下でシステムを制御するための予測コントローラを提供することができる。予測コントローラは、少なくとも1つのプロセッサと、命令を格納したメモリとを備え得る。命令は、少なくとも1つのプロセッサによって実行されると、予測コントローラに、予測コントローラの各制御ステップにおいて、制御信号を生成するために、不確実性を表す確率的機会制約を含む不等式制約付き非線形動的最適化問題を解かせる。予測コントローラは、確率的機会制約に基づいて、ガウス分布の仮定密度フィルタリング(ADF)に基づく離散時間近似伝播方程式を用いて、直接最適制御構造化非線形プログラム(NLP)を解いて、予測範囲内のある時間ステップから次の時間ステップまで、状態確率分布の一次および/または高次モーメント積分の近似予測を、時変モデル化不確実性および/または外部外乱のうちの1つまたは複数の時変モデル化不確実性および/または外部外乱の確率分布の一次および/または高次モーメント積分に応じて、終了条件が満たされるまで実行する。命令はさらに、予測コントローラに、制御信号を用いてシステムの動作を制御させる。
【0012】
本発明のいくつかの実施形態は、確率的機会制約の制約関数が線形またはやや非線形である場合、制御範囲内の各時間ステップにおける予測状態値の共分散行列を考慮して、不等式制約ごとの線形化ベースの強化が厳密または十分に正確であり得る、という認識に基づいている。本発明のいくつかの実施形態は、確率的機会制約の制約関数が高度に非線形である場合、線形化ベースの強化は不正確である可能性があるが、代わりに、ADFを用いて、状態変数および/または制御入力変数に非線形に依存する制約関数ごとに、高精度の平均および共分散情報を直接計算することができる、という認識に基づいている。
【0013】
たとえば、非線形システムダイナミクスの場合、たとえば拡張カルマンフィルタリング(extended Kalman filtering:EKF)を使用する平均および共分散情報の線形化ベースの伝播よりも、アンセンテッド・カルマンフィルタリング(unscented Kalman filtering:UKF)の方が正確であることが知られている。本発明のいくつかの実施形態は、UKFが、ガウス分布の仮定密度フィルタ(ADF)のさらに一般的なファミリーの一部である線形回帰カルマンフィルタリング(linear-regression Kalman filtering:LRKF)のより一般的なファミリーの特別な場合である、という認識に基づいている。本発明のいくつかの実施形態は、ADFが、(たとえば、EKFにおける)テイラー級数近似に基づく陽的線形化の代わりに、1つおよび/または複数の高次モーメント積分の近似マッチングに基づく統計的線形化を使用する、という認識に基づいている。したがって、EKFは、非線形性を処理するための陽的線形化ベースに基づく一次法である一方、統計的線形化に基づくADFのファミリーは、非線形システムダイナミクスを介した状態変数の平均および共分散情報の伝播において、二次以上の精度を達成することができる。
【0014】
【数1】
【0015】
本発明のいくつかの実施形態において、状態変数の平均および共分散情報の伝播のための連続時間方程式を得るために、ADFが連続時間システムダイナミクスに適用される。結果として得られる連続時間OCPは、数値最適化アルゴリズムで解くことができる扱いやすい非線形最適化問題に到達するために、時間離散化および最適制御パラメータ化に基づいて、たとえば、直接シングルシューティング、マルチプルシューティング、直接コロケーションまたは擬似スペクトル法を用いて、解くことができる。
【0016】
本発明のいくつかの実施形態において、状態変数の平均および共分散情報の伝播の離散時間方程式を得るために、離散時間または離散化システムダイナミクスにADFが適用される。いくつかの実施形態は、離散時間共分散伝播方程式が計算コストを削減し、各制御時間ステップにおける共分散行列の正定値性を保持できる、という認識に基づいている。いくつかの実施形態は、共分散行列が、各時間ステップにおける予測された状態値についての厳密な共分散の過大評価であることを保証するために、すなわち、矛盾のない予測をもたらすために、共分散伝播に非線形性界を含むことができ、その結果、確率的機会制約の各々は、違反の確率がある閾値を下回ることを保証する。
【0017】
本発明のいくつかの実施形態は、予測された状態値の平均および共分散の不確実性情報の順方向伝播において、フィードバック制御アクションを考慮するべきである、という認識に基づいている。いくつかの実施形態は、非線形システムダイナミクスを事前に安定化させるために、アフィンフィードバックゲインの時不変または時変シーケンスを使用して非線形システムダイナミクスを事前に安定化させ、その結果、将来における不確実性および/または外乱に対するフィードバック制御アクションの影響を直接考慮する状態平均および共分散伝播方程式となる。たとえば、基準定常状態および入力値における線形化システムダイナミクスの無限範囲での線形-二次レギュレータは、確率論的非線形OCP定式化においてシステムダイナミクスを事前安定化させるために使用することができる。
【0018】
不等式制約ごとの個別の強化に基づく確率的機会制約の近似定式化を用いて、結果として生じる不等式制約付き非線形動的最適化問題を、最適性条件および実現可能性条件の逐次線形化に基づくニュートン型最適化アルゴリズムを用いて解くことができる。このようなニュートン型最適化アルゴリズムの例として、内点法(interior point method:IPM)および逐次二次計画法(SQP)が挙げられる。本発明のいくつかの実施形態は、SQPアルゴリズムが、SQP最適化アルゴリズムの各反復において、確率論的非線形OCPの二次計画(QP)近似を、不等式制約ごとに、かつ強化された確率的機会制約ごとに、目的関数の線形-二次近似、離散化されたシステムダイナミクスの線形化ベースの近似、離散時間共分散伝播方程式、および線形化ベースの近似に基づいて解く、という認識に基づいている。
【0019】
システムの元の動的モデルが連続時間微分方程式の組によって記述されている場合、本発明のいくつかの実施形態は、離散時間または離散化ADFベースの状態平均および共分散伝播方程式を構築するために、陽的または陰的数値積分法、たとえば陽的または陰的ルンゲ・クッタ法を用いて、システムダイナミクスを離散化する。いくつかの実施形態は、ニュートン型最適化アルゴリズムの各反復において、状態平均および共分散伝播方程式の線形化は、非線形システムダイナミクスについて一次および/または高次導関数の評価を必要とし、これは、ダイナミクスが高次元および/または計算上複雑である場合、たとえば、ダイナミクスが長い非線形式を含む場合、および/または硬直した、もしくは陰的に定義された微分方程式の組によって記述されている場合に、計算コストが高いステップを形成し得る、という認識に基づいている。
【0020】
本発明のいくつかの実施形態において、確率論的OCP定式化における最適化変数は、たとえば、状態共分散行列の順コレスキー分解または逆コレスキー分解を使用する、制御範囲の各時間ステップにおける状態変数の共分散行列についての行列分解の因子を含む。本発明のいくつかの実施形態は、状態共分散行列ではなくコレスキー因子のみを最適化変数に含める必要があるように、ADFベースの状態平均および共分散伝播方程式が、コレスキー因子の観点から、たとえば、コレスキー分解演算子を用いて直接、再定式化可能である、という認識に基づいている。さらに、本発明のいくつかの実施形態は、状態共分散行列の軌道をコレスキー因子の対応する軌道から計算することができ、それゆえ、状態共分散行列は、各制御時間ステップおよび任意の最適化アルゴリズムの各反復において常に正定値であると保証される、という認識に基づいている。
【0021】
本発明のいくつかの実施形態は、コレスキー分解演算子があらゆる場所で定義されることを保証するために、ADFベースの共分散伝播方程式に小さな正則化項を追加する必要とされる場合があり得るように、(順方向または逆方向)コレスキー分解が正定値行列についてのみ定義される、という認識に基づいている。コレスキー分解演算子の一次および高次導関数は、アルゴリズム的微分技術の順方向または逆方向モードによって計算することができる。
【0022】
【数2】
【0023】
【数3】
【0024】
本発明のいくつかの実施形態は、厳密でない導関数ベースの最適化アルゴリズムが、システムダイナミクス、共分散伝播方程式、不等式制約、および確率的機会制約に関して実現可能な確率論的非線形OCPの解に収束するが、この解は、厳密でない導関数計算に起因して準最適である可能性がある、という認識に基づいている。その代わりに、本発明のいくつかの実施形態は、実行可能かつ局所最適な確率論的非線形OCPの解に収束する、厳密でない導関数の使用を補正するための随伴ベースの勾配計算を伴う、厳密でない導関数ベースの最適化アルゴリズムに基づいている。なお、共分散伝播方程式の随伴計算は、完全なヤコビアン行列ではなく単一の勾配に対応するシステムダイナミクスの一次および/または高次導関数の評価を必要とする。いくつかの実施形態において、後者の随伴勾配計算は、アルゴリズム的または自動微分の随伴モードの1回の掃引を用いて効率的に実行することができる。
【0025】
本発明のいくつかの実施形態において、提案されたSNMPCのための厳密でない最適化アルゴリズム(場合によっては、随伴ベースの勾配計算を伴う)は、3つの主要な計算ステップからなる。第1のステップでは、線形-二次目的関数を準備し、ベクトルおよび平均およびヤコビアン行列を計算して、線形化された等式および不等式制約を準備し、随伴ベースの勾配計算を評価し、予測された平均状態値および制御値の現在の軌道ならびに共分散行列および/またはコレスキー因子の現在の値が与えられると、目的関数および制約関数の各々から、共分散行列および/またはコレスキー因子を数値的に削除する。第2のステップは、確率的機会制約の各々を近似するための1つまたは複数の強化された不等式制約を有する、結果として得られるブロック構造化QP下位問題を解くことからなる。第3の最終ステップは、予測された状態および制御値の軌道についてのニュートン型更新に加えて、ラグランジュ乗数の対応する更新の展開と、制御範囲にわたる共分散行列および/またはコレスキー因子の軌道の更新とを含む。
【0026】
本発明のいくつかの実施形態は、たとえば、高度に非線形性なADFベースの状態平均および共分散伝播方程式に起因して、確率論的OCP問題を解くための導関数ベースの最適化アルゴリズムの収束挙動を改善するために、グローバル化技術が必要な場合がある、という認識に基づいている。このようなグローバル化技術の一例として、たとえば、SQP最適化法を用いて、導関数ベースの最適化アルゴリズムの反復ごとに、最適性条件と実現可能性条件との両方に依存するメリット関数の十分な減少条件を満たすことができることを保証するために、主最適化変数および/または双対最適化変数のニュートン型更新におけるステップサイズを計算する直線探索法が挙げられる。本発明のいくつかの実施形態において、主最適化変数および/または双対最適化変数のニュートン型更新のための後者の直線探索ベースのステップサイズ選択は、SNMPCコントローラの最適化アルゴリズムにおける第3のステップの一部であり得る。
【0027】
本発明のいくつかの実施形態は、共分散および/またはコレスキー因子に加えて、確率論的最適制御問題における平均状態変数も、各反復において圧縮手順に基づいて数値的に削除することができ、これは、離散時間システムダイナミクスを用いて、予測範囲内の各段階の状態変数を、初期状態値の関数として規定し、予測範囲内の前のすべての段階における制御変数を規定する、という認識に基づいている。この完全または部分的な圧縮手順は、より小さいが全体的により高密度の最適化問題となり、この問題では、等式制約はより少ないかまたは存在せず、同じ量の不等式制約および確率的機会制約があり、これらは、OCP内の残りの最適化変数に関して説明される。本発明のいくつかの実施形態は、同じ厳密でない導関数ベースの最適化アルゴリズムを、そのような圧縮手順と組み合わせて使用することができる、という認識に基づいている。より具体的には、平均状態変数の数値的削除は、第1のステップにおいて追加的に実行され、密なQP解は、第2のステップにおいて実行され、一方、圧縮された状態変数の展開は、SNMPCのための厳密でない最適化アルゴリズムの第3のステップにおいて追加的に実行される。
【0028】
本発明のいくつかの実施形態は、確率論的予測コントローラにおける各制御時間ステップにおいて、提案された厳密なまたは厳密でない導関数ベースの最適化アルゴリズムの反復を1回実行することによって、非線形確率論的OCPを解くためのリアルタイム反復方法を使用する。つまり、各制御時間ステップにおいて、非線形確率論的最適化問題のブロック構造化局所(凸)QP近似のために、1つの準備、解法、展開ステップを実行するだけでよい。QPの準備には、離散化非線形システムダイナミクスを課す非線形方程式の線形化と、非線形不等式制約の線形化と、共分散行列および/またはコレスキー因子の圧縮または削除と、随伴勾配計算のオプションの評価オプションとが含まれる。この準備に基づいて、結果として得られるブロック構造化QPが解かれ、これに、確率論的非線形予測コントローラの各ステップにおいてシステムを制御するために使用される制御解を生成するために、すべての主最適化変数およびラグランジュ乗数値を更新する展開ステップが続く。
【0029】
添付の図面を参照して、現在開示されている実施形態をさらに説明する。示された図面は、必ずしも縮尺通りではなく、一般に、現在開示されている実施形態の原理を説明することに重点が置かれている。
【図面の簡単な説明】
【0030】
図1A】いくつかの実施形態に係る、不確実性を伴うシステムのための予測コントローラとフィードバックループとを示すブロック図である。
図1B】いくつかの実施形態に係る、不確実性を伴うシステムのための確率論的予測コントローラとフィードバックループとを示すブロック図である。
図1C】本発明のいくつかの実施形態に係る、CPUプロセッサおよびメモリを用いて実現されたコントローラと、フィードバックシステムとを示すブロック図である。
図2A】本発明の実施形態に係る、非線形システムダイナミクスのガウス分布の仮定密度フィルタ(ADF)を用いた、ある時間ステップから次の時間ステップまでの状態確率分布の予測を示す概略図である。
図2B】本発明のいくつかの実施形態に係る、非線形システムダイナミクスに影響を与える時変不確実性および/または外乱を含む、状態確率分布の予測を示す概略図である。
図2C】本発明のいくつかの実施形態に係る、非線形システムダイナミクスの陽的線形化に基づく、状態平均および共分散情報の離散時間または離散化伝播を示すブロック図である。
図2D】本発明のいくつかの実施形態に係る、非線形システムダイナミクスの統計的線形化に基づく、状態平均および共分散情報の離散時間または離散化伝播を示すブロック図である。
図3A】いくつかの実施形態に係る、不確実性の下での被制御システムの確率論的予測コントローラを実現するための確率論的非線形モデル予測制御(SNMPC)法を示すブロック図である。
図3B】いくつかの実施形態に係る、離散時間システムダイナミクスおよび確率的機会制約に基づく、直接最適制御構造化非線形プログラム(NLP)を解くSNMPC法を示すブロック図である。
図3C】いくつかの実施形態に係る、状態平均および共分散の陽的線形化ベースの伝播方程式に基づいて、直接最適制御構造化NLPを解くSNMPC法を示すブロック図である。
図3D】いくつかの実施形態に係る、状態平均および共分散の統計的線形化ベースの伝播方程式に基づいて、直接最適制御構造化NLPを解くSNMPC法を示すブロック図である。
図4A】いくつかの実施形態に係る、確率論的予測コントローラにおける確率的機会制約の近似を示すブロック図である。
図4B】確率論的予測コントローラにおける確率的機会制約の定式化および近似の背後にある考えを示す説明図である。
図5A】いくつかの実施形態に係る、連続時間における非線形システムダイナミクスの状態平均および共分散伝播を示すブロック図である。
図5B】いくつかの実施形態に係る、離散時間における非線形システムダイナミクスの状態平均および共分散伝播を示すブロック図である。
図5C】いくつかの実施形態に係る、離散時間における事前安定化非線形システムダイナミクスの陽的線形化ベースの状態平均および共分散伝播を示すブロック図である。
図5D】いくつかの実施形態に係る、離散時間における事前安定化非線形システムダイナミクスの統計的線形化ベースの状態平均および共分散伝播を示すブロック図である。
図5E】本発明のいくつかの実施形態に係る、状態フィードバック制御アクションに起因する確率的機会制約としての制御境界の定式化および近似を示すブロック図である。
図6A】確率論的予測コントローラにおける各時間ステップにおいて制約付き非線形最適制御問題を解くための反復微分ベースの最適化手順を示すブロック図である。
図6B】確率論的予測コントローラで解く必要のある最適制御構造化NLPのコンパクトな定式化を示す図である。
図6C】本発明のいくつかの実施形態に係る、確率論的予測コントローラにおける最適制御構造化NLPの厳密なヤコビアンベースの局所二次計画(QP)近似を示すブロック図である。
図7A】いくつかの実施形態に係る、予測時間範囲にわたる現在の平均状態値および制御値を考慮した、状態平均値および共分散行列値の明示的かつ逐次的な計算を示すブロック図である。
図7B】非線形等式制約関数の1つまたは複数の一次導関数および/または高次導関数を評価することを必要とせずに、本発明のいくつかの実施形態に係る、確率論的予測コントローラを効率的に実現するための反復的かつ厳密でないSQP最適化アルゴリズムを示すブロック図である。
図8A】いくつかの実施形態に係る、随伴ベースの厳密でないSQP最適化アルゴリズムの実現のための、ヤコビアン行列近似および対応する随伴ベースの勾配補正、圧縮された制約評価、ならびにラグランジュ乗数展開ステップを示すブロック図である。
図8B】収束特性を改善するための随伴ベースの勾配補正に基づく確率論的予測コントローラの効率的な実現のための反復的かつ厳密でないSQP最適化アルゴリズムを示すブロック図である。
図8C】本発明のいくつかの実施形態に係る、確率論的非線形モデル予測制御を実現するための、随伴ベースの厳密でないSQP最適化アルゴリズムのリアルタイム変形例を示すアルゴリズム説明図である。
図8D】本発明のいくつかの実施形態に係る、確率論的予測コントローラにおけるリアルタイム随伴ベースのSQP最適化アルゴリズムのステップサイズ値について十分な減少条件が満たされるような、望ましいステップサイズ選択のための探索手順の一例を示す図である。
図9A】随伴ベースのSQP最適化アルゴリズムにおいて、状態共分散行列のコレスキー因子の更新シーケンスを計算するための、順方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。
図9B】随伴ベースのSQP最適化アルゴリズムにおいて、圧縮された不等式制約値を計算するための順方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。
図9C】随伴ベースのSQP最適化アルゴリズムにおいて、圧縮された等式制約値を計算するための順方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。
図9D】随伴ベースのSQP最適化アルゴリズムにおいて、更新されたラグランジュ乗数値を計算するための逆方向再帰における制約ヤコビアン行列のブロック構造化スパース性の利用を示すブロック図である。
図10A】いくつかの実施形態の原理を採用した確率論的予測コントローラを含む車両を示す概略図である。
図10B】いくつかの実施形態の原理を採用した確率論的予測コントローラと、いくつかの実施形態に係る車両1001のコントローラとの間の相互作用を示す概略図である。
図10C】本発明のいくつかの実施形態の原理を採用した、不確実性の下での被制御車両の運動計画および/または確率論的予測制御方法を示す概略図である。
図10D】本発明のいくつかの実施形態の原理を採用した、不確実性の下での被制制御車両の運動計画および/または確率論的予測制御方法を示す概略図である。
【発明を実施するための形態】
【0031】
実施形態の説明
図を参照して、本発明のさまざまな実施形態を以下で説明する。なお、図面は縮尺通りに描かれておらず、同様の構造または機能の要素は、図面全体を通して同様の参照数字で表されている。また、図面は、本発明の特定の実施形態の説明を容易にすることを意図しているに過ぎない。これらは、本発明の網羅的な説明として、または本発明の範囲の限定として意図されるものではない。くわえて、本発明の特定の実施形態と併せて説明される態様は、必ずしも当該実施形態に限定されるものではなく、本発明の他の任意の実施形態において実施され得る。
【0032】
以下の説明は、例示的な実施形態のみを提供するものであり、本開示の範囲、適用性、または構成を限定することを意図するものではない。むしろ、例示的な実施形態の以下の説明は、1つ以上の例示的な実施形態を実施するための可能な説明を当業者に提供するものである。意図されるのは、添付の特許請求の範囲に記載されるように開示された主題の精神および範囲から逸脱することなく、要素の機能および配置において行われ得るさまざまな変更である。
【0033】
本発明のいくつかの実施形態は、不確実性を伴うシステムまたは確率論的予測コントローラを使用するシステムの動作を制御するためのシステムおよび方法を提供する。確率論的予測コントローラの例は、被制御システムのモデルと不確実性のモデルとに基づいて制御入力を決定する確率論的モデル予測制御(stochastic model predictive control :SMPC)である。
【0034】
図1Aは、いくつかの実施形態に係る、状態推定器131を介して予測コントローラ110に接続された、不確実性125を伴うシステム120の例を示す。いくつかの実現例において、予測コントローラは、システムの動的モデル140に従ってプログラムされたモデル予測コントローラ(model predictive controller:MPC)である。モデルは、現在および以前の入力111と以前の出力103との関数として、経時的なシステム120の状態および出力103の変化を表す一組の方程式であり得る。モデルは、システムの物理的制限および動作上の制限を表す制約142を含み得る。動作中、コントローラは、システムの所望の挙動を示すコマンド101を受信する。コマンドは、たとえばモーションコマンドである。コマンド101の受信に応答して、コントローラは、不確実性125を伴う実システム120の入力として機能する制御信号111を生成する。入力に応答して、システム120は、システム120の出力103を更新する。システムの出力103の測定値に基づいて、状態推定器131は、システム120の推定状態121を更新する。システムのこの推定状態121は、コントローラ110に状態フィードバックを提供する。場合によっては、出力103の測定値は、実システム120に配置されたセンサ(図示せず)または実システム120のアクチュエータ(複数可)/回路(複数可)によって提供され得る。さらに、不確実性125は、実システム120上またはその周囲に配置された1つ以上の位置における温度、圧力、または空気の流れ、またはそれらの1つ以上の組み合わせによって示す外部外乱、システム120に作用する電流、力、もしくはトルク、モデル化されていないダイナミクス、または実システム120上/内に配置されたセンサもしくは他のセンサによって測定された不確実な摩擦係数、物体の質量、もしくは不確実な係数およびパラメータなどの物理量における不確実性を含む、観測可能/測定可能な物理量(信号)であり得る。
【0035】
本明細書で言及するシステム120は、電圧、圧力、力、トルクなどの物理量に関連する可能性のある特定の操作入力信号111(入力)によって制御され、電流、流量、速度、前の状態から現在の状態へのシステムの状態の遷移を示す位置などの物理量に関連する可能性のあるいくつかの被制御出力信号103(出力)を返す、任意の機械または装置であり得る。出力値は、一部はシステムの以前の出力値に関連し、一部は以前および現在の入力値に関連する。以前の入力および以前の出力への依存性は、システムの状態で符号化される。システムの動作、たとえばシステムのコンポーネントの運動は、特定の入力値の適用後にシステムによって生成される出力値のシーケンスを含み得る。
【0036】
不確実性125は、システム120に作用する外部外乱、力またはトルクを含む任意の時変不確実性、モデル化されていないダイナミクス、または不確実な摩擦係数、物体の質量、もしくは実システム120の物理的挙動を記述する動的モデル方程式における不確実な係数およびパラメータなどの、物理量における不確実性であり得る。MPCコントローラのほとんどの実現は、コントローラの計算複雑性を低減するため、または物理的挙動の一部が複雑すぎることによってモデル化が困難または不可能であるために、単純化された動的モデル140を使用し、その結果、実システムの物理的挙動の大部分がモデル化されないままとなる。なお、時不変不確実性は、状態およびパラメータ推定器131の一部として、オンラインまたはオフラインのいずれかで推定または学習可能である。
【0037】
システム140の動的モデルは、現在の入力および以前の入力、ならびに以前の出力の関数として、システムの出力が経時的にどのように変化するかを記述するために、時不変または時変である可能性があり、線形または非線形である可能性がある方程式である、一組の数学的方程式を含み得る。システムの状態とは、一般に時間的に変化する情報の任意の集合であり、たとえば、現在および以前の入力と出力との適切な部分集合であり、システムの動的モデルおよび将来の入力と共に、システムの将来の運動を一意に(しかし近似的に)定義することができる。実システム120は、出力、入力、および場合によってはシステムの状態が動作可能な範囲を制限する物理的制限および仕様制約142を受ける可能性がある。
【0038】
コントローラ110は、固定または可変の制御周期サンプリング間隔でシステム121の推定状態および所望のモーションコマンド101を受信し、この情報を用いて、システムを動作させるための入力、たとえば制御信号111を決定する、ハードウェアで、またはプロセッサ(たとえばマイクロプロセッサ)で実行されるソフトウェアプログラムとして実装することができる。
【0039】
状態推定器131および(図1Bにおける)不確実性推定器132は、固定もしくは可変の制御周期サンプリング間隔でシステム103の出力を受信し、新たな出力測定値および以前の出力測定値を用いて、システム120の推定状態121を決定する、ハードウェアで、またはコントローラ110と同じもしくは異なるプロセッサのいずれかで実行されるソフトウェアプログラムとして実装することができる。
【0040】
図1Bは、いくつかの実施形態に係る、状態推定器131および不確実性推定器132を介して確率論的予測コントローラ150に接続された、不確実性125を伴うシステム120の例を示す。いくつかの実現例では、確率論的予測コントローラ150は、実システム120および不確実性の動的モデル140に従ってプログラムされた確率論的モデル予測コントローラ(SMPC)である。動的モデル141は、不確実性125とシステム120の挙動との関係とをモデル化するための不確実性モデル141を含む。不確実性モデルは、不確実性とシステムの動的挙動を記述する動的モデル方程式との間の線形および/または非線形関係のモデルを含む。さらに、不確実性モデルは、動的モデルにおける時変不確実性ごとの確率分布のモデルを含む。
【0041】
本発明のいくつかの実施形態において、確率論的予測コントローラ150の動的モデル140は、1つまたは複数の確率的機会制約143を含み得る。システムの物理的制限および仕様制約のいずれかは、対応する制約に違反する確率がある確率閾値を下回ることを強制することを目的とする、1つまたは複数の確率的機会制約143として定式化することができる。
【0042】
本発明のいくつかの実施形態において、不確実性推定器132は、不確実性122の推定値、たとえば、確率論的予測コントローラ150によって使用される動的モデル140内の複数の時変不確実性のうちの1つまたは複数の時変不確実性についての確率分布の一次および/または高次モーメントの推定値を提供する。本発明のいくつかの実施形態において、状態推定器131および不確実性推定器132は、単一の状態で不確実性パラメータ推定器コンポーネント130において一緒に実装され、これらは、固定または可変制御周期サンプリング間隔でシステム103の出力を受信し、新たな出力測定値および以前の出力測定値を用いて、システム120および不確実性125の推定状態121および推定不確実性122、ならびに場合によっては1つまたは複数の追加の推定パラメータ値を決定する。
【0043】
図1Cは、いくつかの実施形態に係る確率論的予測コントローラ150を示すブロック図であり、このコントローラは、システムの推定状態121および出力103が、推定不確実性122を与えられるとコマンド101に従うように、システムを作動させる。確率論的予測コントローラ150は、入力インターフェース151と、出力インターフェース152と、不確実性125を伴う実システム120の動作に関する動的モデル140、不確実性モデル141、制約142、および確率的機会制約143を格納するためのメモリ165に接続された、たとえば単一の中央処理装置(central processing unit:CPU)または複数のCPUプロセッサ160の形式のコンピュータとを含み得る。プロセッサ(複数可)160は、入力インターフェース151を介して推定状態121およびコマンド101を取得し/受付け、出力インターフェース152を介して実システム120に制御信号111を送信するように構成されている。プロセッサ(複数可)160は、シングルコアマイクロプロセッサ、マルチコアプロセッサ、コンピューティングクラスタ、複数のプロセッサが接続されたネットワーク、または任意の数の他の構成であり得る。メモリ165は、ランダムアクセスメモリ(random access memory:RAM)、読み取り専用メモリ(read only memory:ROM)、フラッシュメモリ、または任意の他の適切なメモリシステムを含み得る。
【0044】
【数4】
【0045】
【数5】
【0046】
【数6】
【0047】
【数7】
【0048】
【数8】
【0049】
【数9】
【0050】
【数10】
【0051】
【数11】
【0052】
【数12】
【0053】
最後に、本発明のいくつかの実施形態に係る、離散時間または離散化非線形システムダイナミクスの陽的線形化ベースの伝播方程式を用いて、状態平均および共分散情報の離散時間または離散化伝播において、1つまたは複数の追加ステップ255を実行することができる。
【0054】
【数13】
【0055】
本発明のいくつかの実施形態は、アンセンテッド・カルマンフィルタリング(UKF)を使用して、非線形システムダイナミクスについて、たとえば拡張カルマンフィルタリング(EKF)を使用して、平均および共分散情報の陽的線形化ベースの伝播よりも正確な平均および共分散情報の伝播を計算することができる、という認識に基づいている。本発明のいくつかの実施形態は、UKFが、線形回帰カルマンフィルタリング(LRKF)のより一般的なファミリーの特別な場合であり、これは、不確実性の下での被制御システムの確率論的予測コントローラの実現において使用することができるガウス分布の仮定密度フィルタ(ADF)のさらに一般的なファミリーの一部である、という認識に基づいている。本発明のいくつかの実施形態は、ADFが、(たとえば、EKFにおける)テイラー級数近似に基づく陽的線形化の代わりに、1つおよび/または複数の高次モーメント積分の近似マッチングに基づく統計的線形化を使用する、という認識に基づいている。したがって、EKFは、非線形性を処理するための陽的線形化に基づく一次手法である一方、統計的線形化に基づくADFのファミリーは、非線形システムダイナミクスを介した状態変数の平均および共分散情報の離散時間または離散化された伝播において、二次またはより高次の精度を達成することができる。
【0056】
本発明のいくつかの実施形態は、特定のクラスの問題について、1つおよび/または複数の高次モーメント積分のマッチングに基づく統計的線形化を解析的に実行可能であり、これにより、平均および共分散情報の伝播の精度がさらに改善され、それゆえ、不確実性の下での被制御システムの確率論的予測コントローラの性能がさらに改善される、という認識に基づいている。
【0057】
【数14】
【0058】
【数15】
【0059】
最後に、本発明のいくつかの実施形態に係る、状態平均および共分散情報の離散時間または離散化された伝播において、不確実性の下での被制御システムの離散時間または離散化非線形システムダイナミクスの統計的線形化ベースの伝播方程式を用いて、1つまたは複数の追加ステップ275を実行することができる。本発明のいくつかの実施形態において、統計的線形化ベースの伝播方程式の1つまたは複数のステップにおいて、異なる積分点および重みの集合を使用することができる。
【0060】
【数16】
【0061】
【数17】
【0062】
図3Aは、本発明のいくつかの実施形態に係る、システムの現在の状態推定121を考慮し、推定不確実性122と制御コマンド101とを考慮した、制御信号111を計算する確率論的予測コントローラ150を実現するための確率論的非線形モデル予測制御(SNMPC)のシステムおよび方法を示すブロック図である。具体的には、SNMPCは、各制御時間ステップにおいて制約付き最適化問題350を解くことによって、制御解、たとえば、システムの予測時間範囲にわたる将来の最適な、またはほぼ最適な制御入力のシーケンスを含む解ベクトル365を計算する(360)。この最適化問題350における目的関数、等式制約および不等式制約のデータ345は、動的モデルおよびシステム制約340と、システムの現在の状態推定121と、推定不確実性122と、制御コマンド101とに依存する。
【0063】
本発明の実施形態は、直接最適制御法を使用して、連続時間SNMPC問題を不等式制約付き非線形動的最適化問題として定式化する。本発明のいくつかの実施形態は、導関数ベースの最適化アルゴリズムを使用して、ニュートン法と、最適化問題の実行可能性条件および最適性条件の逐次線形化とに基づく反復手順を用いて、不等式制約付き最適化問題350を厳密にまたは近似的に解く。このようなニュートン型最適化アルゴリズムの例として、内点法(IPM)および逐次二次計画法(SQP)が挙げられる。本発明のいくつかの実施形態は、不等式制約付き最適化問題350が、微分ベースの最適化アルゴリズムの実現を利用する構造を各制御時間ステップにおいて解ベクトル365を計算するために使用可能となるような最適制御構造化非線形プログラム(NLP)の形式を有している、という認識に基づいている。
【0064】
本発明のいくつかの実施形態において、不等式制約付き最適化問題350の解は、現在の制御時間ステップにおいて不等式制約付き最適化問題350を解く計算労力を低減するために、メモリから読み出すことができる、前の制御時間ステップ310からの予測時間範囲にわたる厳密なまたは近似的な制御入力、状態平均値および/または共分散値を、解の推測として使用する。前の制御時間ステップ310における解情報から解の推測を計算するこの概念は、最適化アルゴリズムのウォーム・スタートまたはホット・スタートと呼ばれ、本発明のいくつかの実施形態において、SNMPCコントローラの必要な計算労力を削減することができる。同様の方法で、対応する解ベクトル365を使用して、次の制御時間ステップについて厳密なまたは近似的な制御入力、状態平均値および/または共分散値のシーケンスを更新し格納する(360)ことができる。本発明のいくつかの実施形態において、現在の制御時間ステップにおける不等式制約付き最適化問題350のより正確な解の推測を計算するために、前の制御時間ステップ310からの予測時間範囲にわたる制御入力、状態平均値および/または共分散値を考慮して、時間シフト手順を使用することができる。
【0065】
【数18】
【0066】
【数19】
【0067】
【数20】
【0068】
【数21】
【0069】
【数22】
【0070】
【数23】
【0071】
【数24】
【0072】
【数25】
【0073】
【数26】
【0074】
不等式制約ごとの個々の強化に基づく、確率的機会制約355の近似定式化375または385を用いて、結果として生じる不等式制約付き非線形動的最適化問題を、最適性条件および実現可能性条件の逐次線形化に基づくニュートン型最適化アルゴリズムを用いて解くことができる。このようなニュートン型最適化アルゴリズムの例として、内点法(IPM)および逐次二次計画法(SQP)が挙げられる。本発明のいくつかの実施形態は、SQPアルゴリズムが、目的関数の線形-二次近似と、SQP最適化アルゴリズムの各反復において、離散化システムダイナミクスおよび離散時間共分散伝播方程式の線形化ベースの近似と、不等式制約ごと、かつ強化された確率的偶然制約ごとの線形化ベースの近似とに基づいて、確率論的非線形OCPの二次計画(QP)近似を解く、という認識に基づいている。
【0075】
本発明のいくつかの実施形態において、目的関数351,371または381におけるステージコストおよび/または終端コストは、凸関数および/または非凸関数のいずれかを含む、任意の線形関数、線形-二次関数および/または非線形平滑関数によって定義することができる。確率論的最適制御問題の目的関数351,371または381は、予測時間範囲の各時点に対応するコスト項を含み得る。いくつかの実施形態において、目的関数は、予測時間範囲の各時点における基準出力値のシーケンスからのシステムの特定の出力関数の偏差の(非線形)最小二乗タイプのペナルティを課すことを含み、その結果、確率論的予測コントローラ150におけるコスト関数の基準追跡タイプの定式化となる。
【0076】
【数27】
【0077】
【数28】
【0078】
【数29】
【0079】
【数30】
【0080】
【数31】
【0081】
【数32】
【0082】
【数33】
【0083】
【数34】
【0084】
【数35】
【0085】
図5Cは、確率論的予測コントローラの陽的線形化ベースの状態平均および共分散伝播の一部として、フィードバック制御アクションを考慮に入れるために非線形システムダイナミクスの事前安定化を説明するためのブロック図である。いくつかの実施形態は、離散時間ダイナミクス520および時変外乱525を考慮して事前安定化非線形システムダイナミクス560を定式化するために、フィードバック制御アクションのパラメータ化に基づいている。
【0086】
【数36】
【0087】
【数37】
【0088】
【数38】
【0089】
【数39】
【0090】
【数40】
【0091】
なお、図5C図5D、および図5Eにおけるフィードバック制御アクションは、1つの制御ステップでの動的最適化問題における予測時間範囲にわたる将来のフィードバック制御アクションの予測であり、それゆえ、これらのフィードバック制御アクションは、図1Aの予測コントローラ110へのシステム121の推定状態の実際のフィードバックと混同されるべきではない。
【0092】
図6Aは、逐次的な局所線形化ベースの凸近似605の使用によって、確率論的予測コントローラにおける各制御時間ステップにおいて制約付き最適制御構造化非線形プログラム(NLP)350を解くための、反復微分ベースの最適化手順を示すブロック図である。NLP601の解の推測は、この局所凸近似を構築するために使用され、制約付きNLP610の局所(凸)近似の解は、予測時間範囲にわたる制御入力、状態平均値および共分散値の現在のシーケンスを更新する(615)ために使用され、その結果、アルゴリズム手順の各反復において、制約付きNLP601の現在の解の推測が更新される。最適化手順の各反復は、制約付きNLPの解が発見されたかどうか、および/または最大反復回数に到達したかどうか(607)を確認する。終了条件607が満たされている場合は制御解365が発見されており、そうでない場合は、最適化アルゴリズムの次の反復において局所線形化ベースの近似605を構築するために、制約ヤコビアン行列(の近似)の評価(620)が行われる。前の制御時間ステップ310からの制御入力、状態平均値および共分散値を使用して、確率論的予測コントローラの各時間ステップにおいて、制約付きNLP601の初期解の推測および線形化点を形成することができる。
【0093】
非線形目的および制約関数345に基づき、予測時間範囲にわたる制御入力、状態平均値および共分散値の軌道を含む現在の解の推測を線形化点601として用いて、アルゴリズム手順の各反復においてNLP605に対する局所(凸)近似が構築される。この目的のために、複雑な非線形システムダイナミクスの離散化システムの線形化、状態平均および共分散伝播方程式の線形化、ならびに/または非線形不等式制約の線形化を形成するために、制約ヤコビアン行列を計算または近似する(620)必要がある。局所近似の解がNLP607について十分に正確な解を形成する場合、最適制御解365が得られる。代わりに、最大反復回数607に達すると、最適でない、および/または実行不可能な解が得られる(365)。十分な精度のNLPの解がまだ発見されておらず、最大反復回数にまだ到達していない場合(607)、局所近似610の解は、予測時間範囲615にわたる制御入力、状態平均値および共分散値の軌道を更新し、NLP601の解の推測を更新するために使用される。
【0094】
逐次局所近似605の使用によって、各制御時間ステップにおいて、不等式制約付き最適制御構造化非線形プログラム(NLP)350を解くために、異なるタイプの最適化アルゴリズムを使用することができる。いくつかの実施形態は、(凸)二次計画(QP)が構築される、かつ各反復において元のNLPに対する局所近似として解かれる逐次二次計画法(SQP)に基づいている。本発明のいくつかの実施形態は、凸QPは一般に、元のNLP350を解くのに必要な計算コストよりも大幅に少ない計算コストで解くことができる、という認識に基づいている。その代わりに、いくつかの実施形態は内点(IP)法に基づいており、内点(IP)法では、各局所近似は、不等式制約に対応する相補性条件が概ね緩和手順に基づいて平滑化される、NLPの最適性の一次必要条件の線形化である。いくつかの実施形態において、不等式制約を反復的に実行するためにバリア関数が使用され、各反復は、バリア再定式化問題の局所近似を構築し、これを解く。
【0095】
導関数ベースの最適化アルゴリズムは、各反復において局所下位問題を構築し(605)これを解く(610)際に、制約ヤコビアン行列およびヘッセ行列について異なるニュートン型近似技術を使用することができる。いくつかの実施形態は、厳密なヤコビアン行列を計算する(620)ことによって、制約関数の一部またはすべての厳密な線形化に基づいている。いくつかの実施形態は、代わりに、準ニュートン型更新式を使用して、低ランク更新技術によって制約ヤコビアン行列へ近似を反復的に更新する。同様に、NLPのラグランジュ・ヘッセ行列についても、異なるニュートン型近似技術を使用することができる。いくつかの実施形態は、NLPの各局所近似を構築する際のラグランジュの厳密なヘッセ行列の評価に基づく。いくつかの実施形態は、代わりに準ニュートン型更新定式を用いて、対称低ランク更新技術によってヘッセ行列の近似を反復的に更新する。NLPの目的関数が(非線形)最小二乗タイプのコスト項を含む場合、いくつかの実施形態は、代わりにガウス・ニュートン型ヘッセ近似に基づく。
【0096】
【数41】
【0097】
【数42】
【0098】
【数43】
【0099】
図6Cは、確率論的予測コントローラを実現するための逐次二次計画法(SQP)に基づくいくつかの実施形態に係る、最適制御構造化NLP630の局所(凸)近似605を形成する厳密なヤコビアンベースの二次計画法(QP)640を示すブロック図である。QP下位問題における線形等式制約642は、完全制約ヤコビアン行列652の評価に基づく離散時間システムダイナミクス632および状態共分散伝播方程式633の線形化に対応する。さらに、局所線形化643は、元のNLP定式化における不等式制約634に必要であり、そのために、厳密なヤコビアン行列653を、非線形不等式制約ごとに評価する必要がある。
【0100】
【数44】
【0101】
本発明のいくつかの実施形態は、分離可能な目的関数381、ステージごとの個々の不等式制約384~385、および制約付きNLP380の等式制約382~383における予測時間範囲にわたる後続のステージでの状態と共分散行列変数との間のステージごとの結合に起因して、ヘッセ行列651、等式制約ヤコビアン行列652、および不等式制約ヤコビアン行列653がブロック構造化スパース性を示す、という認識に基づいている。したがって、本発明のいくつかの実施形態において、ブロック-スパース構造利用最適化アルゴリズムを用いて、確率論的予測コントローラを実現するためのSQP最適化アルゴリズムにおいて、最適制御構造化NLP630の各局所(凸)QP近似640を解く(610)ことができる。QP最適化アルゴリズム利用するブロック-スパース構造の例として、プライマル、デュアル、またはプライマル-デュアルアクティブセット法、内点法、投影勾配法、前方-後方分割法、または交互方向乗数法(alternating direction method of multiplier:ADMM)が挙げられる。
【0102】
本発明のいくつかの実施形態において、非線形不等式制約634のうちの1つまたは複数を、1つまたは複数の非線形であるが凸の不等式制約によって局所的に近似することができ、その結果、確率論的予測コントローラの逐次凸計画法(sequential convex programming:SCP)の実現において解く(610)必要がある局所凸計画(convex program:CP)近似605となる。たとえば、いくつかの実施形態において、1つまたは複数の確率的機会制約は、凸二次円錐制約および/または凸二次不等式制約によって局所的に近似することができる。凸円錐制約の各々は、1つまたは複数の制御入力、状態平均、および/または状態共分散行列変数の線形結合が、凸円錐の内側になるように制限されることを課す。凸円錐の例として、正象限、正半正定値行列の集合、および/または二次円錐を挙げることができる。本発明のいくつかの実施形態は、最適制御構造化制約付きNLP350の局所凸プログラム近似605が、線形計画(linear program:LP)、二次計画(quadratic program:QP)、二次制約付き二次計画(quadratically constrained quadratic program:QCQP)、二次錐計画(second-order cone program:SOCP)、または半定値計画(semidefinite program:SDP)であってもよく、これらのクラスの問題の各々を、凸最適化アルゴリズムを利用する構造によって解くことができる、という認識に基づいている。
【0103】
【数45】
【0104】
【数46】
【0105】
【数47】
【0106】
【数48】
【0107】
【数49】
【0108】
【数50】
【0109】
【数51】
【0110】
【数52】
【0111】
【数53】
【0112】
【数54】
【0113】
【数55】
【0114】
【数56】
【0115】
【数57】
【0116】
【数58】
【0117】
【数59】
【0118】
【数60】
【0119】
【数61】
【0120】
【数62】
【0121】
【数63】
【0122】
【数64】
【0123】
【数65】
【0124】
【数66】
【0125】
【数67】
【0126】
【数68】
【0127】
【数69】
【0128】
【数70】
【0129】
【数71】
【0130】
【数72】
【0131】
【数73】
【0132】
【数74】
【0133】
図10Aは、いくつかの実施形態の原理を採用する確率論的予測コントローラ1002を含む車両1001を示す概略図である。本明細書で使用される車両1001は、乗用車、バス、またはローバーなどの任意のタイプの車輪自動車であり得る。また、車両1001は、自動車両または半自動車両であり得る。たとえば、いくつかの実施形態は、車両1001の運動を制御する。運動の例として、車両1001のステアリングシステム1003によって制御される車両の横方向の運動が挙げられる。一実施形態において、ステアリングシステム1003は、コントローラ1002によって制御される。さらにまたは代替的に、ステアリングシステム1003は、車両1001の運転手によって制御され得る。
【0134】
車両1001は、コントローラ1002によってまたは車両1001の他の構成要素によって制御可能なエンジン1006も含み得る。車両1001は、周囲環境を感知する1つ以上のセンサ1004も含み得る。センサ1004の例として、距離計、レーダー、ライダーおよびカメラが挙げられる。車両1001は、その現在の運動量および内部状態を検知する1つ以上のセンサ1005も含み得る。センサ1005の例として、全地球測位システム(global positioning system:GPS)、加速度計、慣性測定ユニット、ジャイロスコープ、シャフト回転センサ、トルクセンサ、撓みセンサ、圧力センサ、および流量センサが挙げられる。センサ1005は、コントローラ1002に情報を提供する。本発明のいくつかの実施形態において、センサは、たとえば、車両の位置、縦方向速度および横方向速度、ヨー角およびヨーレート、車両の車輪のうちの1つまたは複数の車輪における角速度またはスリップ角、ならびに他の関連量といった量のうちの1つまたは複数を含む、車両の現在の状態を推定するために使用される。本発明のいくつかの実施形態によれば、予測コントローラ1002は、たとえば、ステアリングホイール角またはステアリングレート、車両の車輪のうちの1つまたは複数の車輪における角速度またはトルク、および他の関連量の量といった量のうちの1つまたは複数を含む制御入力を計算する。車両1001は、有線または無線通信チャネルを介してコントローラ1002の通信機能を可能にするトランシーバ1007を備え得る。
【0135】
図10Bは、いくつかの実施形態に係る、確率論的予測コントローラ1002と車両1001のコントローラ1020との間の相互作用の概略を示す。たとえば、いくつかの実施形態において、車両1001のコントローラ1020は、車両1001の回転および加速を制御するステアリングコントローラ1025およびブレーキ/スロットルコントローラ1030である。このような場合、確率論的予測コントローラ1002は、コントローラ1025および1030に制御入力を出力して、車両の状態を制御する。コントローラ1020はまた、確率論的予測コントローラ1002の制御入力をさらに処理する高レベルのコントローラ、たとえば、レーン維持アシストコントローラ1035を含み得る。いずれの場合も、コントローラ1020は、車両の運動を制御するために、確率論的予測コントローラ1002の出力を使用して、車両のステアリングホイールおよび/またはブレーキといった、車両の少なくとも1つのアクチュエータを制御する。
【0136】
図10Cは、本発明の実施形態を使用することにより、動的に実現可能であり、多くの場合最適な軌道1055を計算することができる、自動または半自動制御車両1050を示す概略図である。生成された軌道は、車両を特定の道路境界1052内に維持することを意図しており、他の非制御車両を、すなわち被制御車両1050にとっての障害物1051を回避することを意図している。いくつかの実施形態において、障害物1051の各々は、制約付き最適制御問題の時間または空間定式化における1つまたは複数の不等式制約によって表すことができる。たとえば、確率論的モデル予測コントローラを実現するように構成された実施形態に基づいて、自動または半自動の被制御車両1050は、たとえば、左側もしくは右側の別の車両を追い越す、または代わりに道路1052の現在の車線内で別の車両の後方に留まるなどの決定を、リアルタイムで行うことができる。本発明の実施形態は、車両1050の現在の状態および予測される状態に関する不確実性、車両モデル内のパラメータに関する不確実性、ならびに環境の現在の状態および予測される状態に関する不確実性(たとえば、自動または半自動の被制御車両1050の現在の位置から一定距離内にある障害物1051を含む)を直接考慮するSNMPCコントローラに基づいている。
【0137】
図10Dは、本発明の実施形態を使用することによって、上限の道路境界1060および下限の道路境界1061内で急激な車線変更操作の動的に実現可能で最適な軌道1070を追跡することを意図しているSNMPCコントローラによって制御される車両1065を示す概略図である。図10Dは、第1の時点における、SNMPCコントローラ1071による予測状態軌道の不確実性の伝播を含む車両位置1065と、第2の時点における車両位置1066および対応する予測状態不確実性の伝播1072と、第3の時点における車両位置1067および対応する予測状態不確実性の伝播1073とを示す。本発明のいくつかの実施形態に係る、確率的機会制約を伴う確率論的予測コントローラを使用することにより、被制御車両が道路境界制約1060および/または1061に違反する確率が、ある確率閾値を下回ることが可能になる。より具体的には、たとえば、図10Dは、第2の時点における予測された状態軌道1072の確率論的チューブが上限道路境界制約1060に到達する(1075)ことを示し、不確実性の下で、被制御システムに対する決定論的制約と確率的機会制約との両方を満たすことを意図している確率論的予測コントローラの挙動を示す。
【0138】
システムおよびその環境の不確実性の例として、車両のタイヤと路面との間の摩擦挙動に関連する任意の時変パラメータ、たとえば、車両を制御しながらオフラインおよび/またはオンラインのいずれかで学習または推定できるPacejkaタイヤ-力モデルのパラメータを挙げることができる。推定パラメータ値および推定不確実性は、本発明の実施形態に係る確率論的非線形モデル予測コントローラの直接最適制御問題定式化において、時変および不確実な外乱変数として定義することができる。
【0139】
上述の本発明の実施形態は、多数の方式のいずれかで実施することができる。たとえば、実施形態は、ハードウェア、ソフトウェア、またはそれらの組み合わせを使用して実現することができる。ソフトウェアで実現される場合、ソフトウェアコードは、単一のコンピュータに設けられているか、複数のコンピュータに分散されているかにかかわらず、任意の適切なプロセッサまたはプロセッサの集合体上で実現することができる。このようなプロセッサは、1つ以上のプロセッサが集積回路コンポーネント内に備えられた集積回路として実現することができる。しかしながら、プロセッサは、任意の適切な形式の回路を用いて実現されてもよい。
【0140】
また、本発明の実施形態は方法として具体化されてもよく、その例が提供されている。方法の一部として実行される行為は、任意の適切な方法で順序付けることができる。したがって、例示的な実施形態では逐次的な行為として示されていても、いくつかの行為を同時に行うことを含む場合もある、図示とは異なる順序で行為が行われる実施形態が構成されてもよい。
【0141】
請求項要素を修飾するために特許請求の範囲において「第1の」、「第2の」といった序数項を使用することは、それ自体、ある請求項要素の他の請求項要素に対する優先順位、先行順位、順序、または方法の行為が実行される時間的順序を意味するものではなく、請求項要素を区別するために、ある名称を有するある請求項要素を、同じ名称を有する(ただし序数項を使用する)他の請求項要素と区別するためのラベルとして使用されているに過ぎない。
図1A
図1B
図1C
図2A
図2B
図2C
図2D
図3A
図3B
図3C
図3D
図4A
図4B
図5A
図5B
図5C
図5D
図5E
図6A
図6B
図6C
図7A
図7B
図8A
図8B
図8C
図8D
図9A
図9B
図9C
図9D
図10A
図10B
図10C
図10D