IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ いすゞ自動車株式会社の特許一覧

<>
  • 特開-情報処理装置 図1
  • 特開-情報処理装置 図2
  • 特開-情報処理装置 図3
  • 特開-情報処理装置 図4
  • 特開-情報処理装置 図5
  • 特開-情報処理装置 図6
  • 特開-情報処理装置 図7
  • 特開-情報処理装置 図8
  • 特開-情報処理装置 図9
  • 特開-情報処理装置 図10
  • 特開-情報処理装置 図11A
  • 特開-情報処理装置 図11B
  • 特開-情報処理装置 図11C
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022181937
(43)【公開日】2022-12-08
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
   G05B 13/02 20060101AFI20221201BHJP
【FI】
G05B13/02 B
【審査請求】有
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2021089186
(22)【出願日】2021-05-27
(71)【出願人】
【識別番号】000000170
【氏名又は名称】いすゞ自動車株式会社
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】矢作 修一
【テーマコード(参考)】
5H004
【Fターム(参考)】
5H004GA05
5H004GB01
5H004GB15
5H004HB01
5H004HB03
5H004HB08
5H004KB02
5H004KB04
5H004KB06
5H004KC12
5H004KC33
5H004KC39
5H004KC50
(57)【要約】
【課題】制御対象の状態に応じて制御パラメータを変化させることが可能な情報処理装置を提供する。
【解決手段】フィードバック制御システムにおいて、制御器の制御パラメータを算出する情報処理装置は、制御対象又は外部入力に関する1又は複数の状態を軸とし、軸によって定義される空間に制御パラメータを算出するために用いられる複数のパラメータ値が配置されているルックアップテーブルと、制御対象の状態を取得する状態取得部と、状態取得部が取得した状態に基づいて、ルックアップテーブルを参照して複数のパラメータ値に基づいて制御パラメータを生成するパラメータ生成部と、制御対象の出力と、参照モデルの出力との誤差に関する評価関数についてのRidge回帰の結果に基づいて、ルックアップテーブルに配置する複数のパラメータ値を変更するテーブル変更部と、を備える。
【選択図】図7
【特許請求の範囲】
【請求項1】
制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、
前記制御対象又は外部入力に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、
前記制御対象の状態を取得する状態取得部と、
前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、
前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのRidge回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、
を備える情報処理装置。
【請求項2】
前記パラメータ生成部は、前記複数のパラメータ値のそれぞれに、前記複数のパラメータ値のそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより前記制御パラメータを生成する、
請求項1に記載の情報処理装置。
【請求項3】
前記パラメータ生成部は、前記状態取得部が取得した前記制御対象の状態と前記複数のパラメータ値が対応する状態との距離が近ければ近いほど大きな値の前記重みを前記複数のパラメータ値に乗じる、
請求項2に記載の情報処理装置。
【請求項4】
前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更する、
請求項1から3のいずれか一項に記載の情報処理装置。
【請求項5】
前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置された前記複数のパラメータ値に基づく前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、
前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを変更することにより、前記制御パラメータを変更する、
請求項1から4のいずれか一項に記載の情報処理装置。
【請求項6】
前記評価関数は、(1)前記空間における前記複数のパラメータ値に対応する位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、(2)前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、
前記テーブル変更部は、前記Ridge回帰を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを変更する、
請求項5に記載の情報処理装置。

【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理装置に関する。
【背景技術】
【0002】
産業システムの閉ループ制御の大半は直感的に理解できるPID制御が用いられている。線形性の強い制御対象であれば所望の制御性能が得られるが、非線形システムの場合、ゲインが固定されたPID制御で十分な制御性能を得ることは難しい。非線形制御理論やモデルベース制御の適用も考えられるが、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きいため非線形制御適用のハードルが高い。また,産業システムは複雑であり精度の高いモデルを得ることが難しい場合が多く、モデルベース制御の効果が十分に発揮できない場合がある。このような背景から、産業界ではルックアップテーブル(Look-up table:以下「LUT」と記載する)を用いたゲインスケジュールPID制御がよく用いられる(例えば、特許文献1を参照)。
【0003】
ゲインスケジュール制御は制御対象の状態に応じて制御器パラメータを変更し、所望の制御性能を実現する手法である。このような考え方は直観的に理解しやすく産業界では受け入れやすい。その反面,所望の制御性能を得るために大量の制御パラメータを事前に調整する必要がある。固定PID制御であれば調整パラメータは比例ゲイン、積分ゲイン、微分ゲインの3つであるが、LUTを用いたゲインスケジュール制御の場合、はるかに大きな数のパラメータを調整しなくてはならず、パラメータ調整に多くの時間を要している。近年,システム同定を介することなく制御対象モデルを用いない制御系設計法が注目されている.オフラインで取得したデータから最適制御パラメータを求める手法として、VRFT(Virtual Reference Feedback Tuning)(例えば、特許文献2を参照)やFRIT(Fictitious Reference Feedback Tuning)が提案されている。
【0004】
VRFTやFRITといったデータ駆動制御は、繰り返し実験を行うことなく一組の入出力データからオフラインで制御器パラメータが得られるという点で注目されている。以上のような制御対象のモデルを用いない制御手法は、プロセス系や自動車システム等の産業システム,振動制御問題への適用も進められている。これまで、非線形システムに対するデータ駆動制御手法の検討もされているが、LUTパラメータの自動調整法に対しての検討はされていない。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2012-113676号公報
【特許文献2】特開2021-43573号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、固定PIDゲインを求める一般的なVRFTでは、制御対象の状態に応じて制御パラメータが変化しないため、PIDゲインが目標応答に十分に追従できないという問題もある。
【0007】
本開示はこれらの点に鑑みてなされたものであり、制御対象の状態に応じて制御パラメータを変化させることが可能な情報処理装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の目的を達成するため、本開示における情報処理装置は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御対象に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、前記制御対象又は外部入力に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのRidge回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、を備える。
【0009】
前記パラメータ生成部は、前記複数のパラメータ値のそれぞれに、前記複数のパラメータ値のそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより前記制御パラメータを生成してもよい。
【0010】
前記パラメータ生成部は、前記状態取得部が取得した前記制御対象の状態と前記複数のパラメータ値が対応する状態との距離が近ければ近いほど大きな値の前記重みを前記複数のパラメータ値に乗じてもよい。
【0011】
前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更してもよい。
【0012】
前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置された前記複数のパラメータ値に基づく前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを変更することにより、前記制御パラメータを変更してもよい。
【0013】
前記評価関数は、(1)前記空間における前記複数のパラメータ値に対応する位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、(2)前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、前記テーブル変更部は、Ridge回帰を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを変更してもよい。
【発明の効果】
【0014】
本開示によれば、制御対象の状態に応じて制御パラメータを変化させることができる。
【図面の簡単な説明】
【0015】
図1図1は、参照モデルを備える閉ループ系を模式的に示す図である。
図2図2は、ゲインスケジュールPID制御のシステム構成を模式的に示す図である。
図3図3は、二次元で構成されるLUTを示す図である。
図4図4は、ゲインスケジューラの構成を示す図である。
図5図5は、ゲインスケジュール制御によるモデル参照制御のブロック線図である。
図6図6は、実施の形態に係る閉ループ系を模式的に示す図である。
図7図7は、実施の形態に係る情報処理装置の機能構成を模式的に示す図である。
図8図8は、実施の形態に係る情報処理装置が実行する情報処理の流れを説明するためのフローチャートである。
図9図9は、取得した入出力データから固定PIDゲインを求めたときの時系列データを示す図である。
図10図10は、本開示の手法でPIDゲインを求めたときの時系列データを示す図である。
図11A図11Aは、制御対象の状態1および状態2のそれぞれに応じて変化する比例ゲインを示す図である。
図11B図11Bは、制御対象の状態1および状態2のそれぞれに応じて変化する積分ゲインを示す図である。
図11C図11Cは、制御対象の状態1および状態2のそれぞれに応じて変化する微分ゲインを示す図である。
【発明を実施するための形態】
【0016】
<実施の形態の前提となる技術>
本開示の実施の形態を説明する前に、まず、本開示の実施の形態が前提とする前提技術について説明する。
【0017】
[緒言]
現在、産業界において、閉ループ制御の大半はPID制御が用いられている。これは、PID制御は直感的に理解でき、計算負荷が小さいからである。一方で、産業界における閉ループ制御の制御対象のほとんどは非線形システムである。非線形制御理論を適用することも考えられるものの、コントローラ性能に制約があることや理論が複雑かつ計算負荷が大きく、適用のハードルが高いため用いられることは少ないのが現状である。このため、産業界では、非線形システムの制御は、計算負荷が小さく理解が容易なゲインスケジュール制御で対応することが多い。
【0018】
LUTを用いたゲインスケジュール制御は、あらかじめ制御対象の状態と制御器の制御パラメータの生成に用いられるパラメータ値とを紐づけて格納するLUTを参照することにより制御対象の状態に応じて制御器の制御パラメータを変更し、所望の制御性能を実現する手法である。このため、LUTを用いたゲインスケジュール制御はマップベース制御と呼ばれることもある。
【0019】
ゲインスケジュール制御を実施するには、所望の制御性能が得られるようにLUTを事前に調整する必要がある。通常のPID制御であれば調整パラメータは比例ゲイン、積分ゲイン、及び微分ゲインの3つである。一方、ゲインスケジュール制御はLUTを用意する必要があるため、通常のPID制御と比べてはるかに大きな数のパラメータを調整する必要がある。したがって、ゲインスケジュール制御のパラメータ調整には多くの時間を要する。さらに、ゲインスケジュール制御では、経年劣化等の制御対象の特性変動に対応できていないという問題もある。
【0020】
そこで、本開示では、ゲインスケジュールPID制御のスケジューリング関数(スケジューラ)であるLUTパラメータを自動調整する方法を提案する。以下に、スケジューリング関数をLUTで表す。次に、ゲインスケジュールPID制御器を定義する。次に、ゲインスケジュールPID制御器を対象としたVRFTの評価関数を導出する。次に、評価関数が最小となるようにRidge回帰により最適制御パラメータを求める。これにより、試行錯誤的なパラメータ調整や、システム同定が不要となる。
【0021】
以下の説明においては、先ず、準備としてVRFTとゲインスケジュールPID制御について説明する。次に、問題設定について説明する。次に、VRFTを利用したゲインスケジュール制御パラメータの自動調整について説明する。次に、シミュレーション検証について説明する。
【0022】
[VRFT]
VRFTは、開ループの入出力データからシステム同定を介さず、直接的に、制御パラメータを求める手法である。最適制御パラメータは参照モデルと閉ループ系が同じ特性となるように調整される。図1にVRFTの構造について示す。図1は、参照モデルを備える閉ループ系を模式的に示す図である。Cは制御器、Mは参照モデル、Pは制御対象(プラント)であり、uは入力、yは出力である。また、ρは制御器パラメータ、zはシフトオペレータである。rバー(t)はVRFTで提案されている仮想参照入力、eバー(t)は、VRFTで提案されている仮想誤差である。
【0023】
VRFTの手順について簡単に説明する。
ステップ1:希望する閉ループの参照モデルをMdとする。また、制御対象の入出力データをu(t),y(t),t=1,...,Nとする。
ステップ2:y(t)を参照モデルの出力とみなすと、y(t)を発生する仮想の参照入力は次式のように決められる。なお、参照入力を「参照信号」又は「疑似参照信号」ともいう。
【数1】
ステップ3:この参照信号rバー(t)を図1の閉ループの参照入力と考える。このとき制御器で作られる操作量は、これを仮想操作量とすると、次式になる。
【数2】
ステップ4:この仮想操作量uバー(t)と操作量u(t)のデータが近づけば、コントローラをもつ閉ループは参照モデルに近いとみなせる。すなわち、最小化する評価関数は次式になる。
【数3】
式(1),(2)により、上式は次のようになる。
【数4】
ステップ5:プレフィルタLの導入
式(4)の項には、参照モデルMdの逆行列がありノンプロパーである。式(34)に示すプレフィルタの追加によりノンプロパーを回避する。このプレフィルタを式(4)に追加すると式(5)が得られる。
【数5】
ここで、
【数6】
【数7】
【0024】
[ゲインスケジュールPID制御]
図2は、ゲインスケジュールPID制御のシステムを示す図である。図2に示すように、ゲインスケジュールPID制御のシステムは、制御対象Pと、制御器C(z,ρ)、可変な制御器パラメータρ、有理関数ベクトルψ(z)、スケジューリング関数f(x)により構成される。
図2に示す制御器C(z,ρ)は、次式で記述される。
【数8】
ここで、
【数9】
制御パラメータρは、スケジューリング関数f(x)に応じてゲインスケジュールされる。wiは、i番目のスケジューリング関数のパラメータベクトルである。
【0025】
[ルックアップテーブルの構造]
図3に、2次元の場合のグリッドベースルックアップテーブル(Grid-Based Look-up Table)の構成を示す。図3に示すx1,x2は、LUTへの入力、Cl,k,C1,k+1,C2,1、C2,l+1は、補間ノード、θk,l,θk+1,l,θk、l+1,θk+1,l+1は、テーブルデータ(LUTのパラメータ値)である。このとき、LUTへ入力が与えられときのLUTからの出力wLUは次式となる。
【数10】
ここで、
【数11】
【0026】
図4は、ゲインスケジューラの構成を示す図である。図4に示すように、LUTから出力される複数のパラメータが重み付け加算された値が制御パラメータとなる。
【0027】
重みは、状態量に近いテーブルデータの影響が大きく、状態量から遠いテーブルデータの影響を小さくするように、状態量と各ノードの面積Aが利用される。
【0028】
式(10)に一般化基底関数φを導入するとサイスM×Mのマップの出力は次式で表せる。なお、基底関数は、公知のルックアップテーブルで示されるか、簡単な計算により求められる。
【数12】
【0029】
なお、図3に示すLUTは、状態1に対応する軸と状態2に対応する軸とを有する二次元のLUTであるが、LUTは1つの状態に対応する1つの軸のみを有する一次元のLUTであってもよく、3つ以上の状態に対応する三次元以上のLUTであってもよい。
【0030】
[モデル参照制御]
図5は、ゲインスケジュール制御によるモデル参照制御のブロック線図である。図5に示すように、目標値rから出力yまでの入出力特性が、予め設定された参照モデルMdに一致するようなゲインスケジューラを構成するn個のパラメータベクトルwを自動で調整する場合に、次の評価関数JMRを最小にするゲインスケジュールの最適パラメータを得ることを目的とする。
【数13】
ここで、wはスケジューリング関数f(x)を構成するパラメータベクトルである。
【0031】
[ゲインスケジュール制御パラメータの自動調整]
ここで、制御器は、例えば、速度型PID制御器とする。2次元LUTをゲインスケジューラとして用いると、ゲインスケジュールPID制御は次式で表される。なお、PID制御器を速度型PID制御器とするが、本開示は速度型PID制御器に限定されない。
【数14】
ここで、
【数15】
【数16】
【数17】
ここで、
【数18】
【数19】
【数20】
【数21】
【数22】
【数23】
【数24】
である。ρは制御器の制御パラメータ、Kpは比例ゲイン、Kiは積分ゲイン、Kdは微分ゲインである。また、fは比例ゲインに関するLUT、fは積分ゲインに関するLUT、fは微分ゲインに関するLUTである。wKp、wKi、wKdは、それぞれ比例ゲイン、積分ゲイン、微分ゲインに関するゲインスケジューラのパラメータベクトルである。φ(チルダ)は、式(12)に示した一般化基底関数を要素とする既知ベクトルであり、LUTにおいて各テーブルデータが格納されている場所の位置座標を用いて計算される。また、式中「T」はベクトルの転置を表す。
【0032】
式(5)に式(13)を代入し,式を整理すると、評価関数は次式が得られる。
【数25】
ここで、
【数26】
ここで、パラメータベクトルw、ベクトルξ,及び、ベクトルdのそれぞれは、以下の式(27)、式(28)及び式(29)で表される。
【数27】
【数28】
【数29】
【0033】
式(26)~式(29)に示すように、フィードバック制御の応答と参照モデルと擬似参照信号から得られる目標応答との誤差eLUT(t)は、LUTのテーブルデータから構成されるパラメータベクトルwに関して線形で表せる。
【0034】
式(29)より、ξ(t)は、LUTにおいて各テーブルデータが格納されている場所の位置座標、参照モデルMd、及び、制御対象Pの出力y(t)を用いて算出できる。また、式(27)より、d(t)は、制御対象Pの入力u(t)(すなわち制御器Cの出力)を用いて算出できる。
【0035】
式(25)および式(26)から、評価関数Jは、(1)LUTにおいてテーブルデータを配置すべき位置座標、参照モデルMd、及び制御対象Pの出力yから算出されるベクトルξと、LUTのテーブルデータを要素とするパラメータベクトルwとの内積と、(2)制御対象Pの入力信号uを用いて算出された値の積との差の二乗で定義される。
【0036】
[最適化手法]
上述したように、評価関数はパラメータベクトルwに関して線形であるため、最小二乗法を用いると、最適解は次式で求められる。
【数30】
ここで、
【数31】
【数32】
【0037】
最小二乗法を適用した場合、非常に局所的にLUTのパラメータを求めることになり、そのパラメータと隣り合うパラメータとの差が極端に大きくなる場合がある。これは、PIDゲインが急変し、閉ループ系が不安定になることにつながる。本開示では、一般化Ridgeを導入することで、互いに隣り合うパラメータの差の大きさに対しLノルムを導入する。
一般化Ridgeを取り入れた評価関数は次式で表される。
【数33】
λは設計パラメータであって、クロスバリデーション(Cross-validation)等の公知の手法により適切な値が求められる。また、クロスバリデーションにより、制御対象の入出力データ数が少ない場合や、制御対象の状態が急激に変化した場合でも、過学習が防止されるため、パラメータの局所的な最適化を防止できる。
【0038】
[アルゴリズム]
VRFTを用いたPIDゲインのスケジューリング関数の重み係数(制御パラメータ)の自動調整アルゴリズムについて説明する。
ステップ1:開ループ系で入出力データを計測する。
ステップ2:参照モデルを設定する。
ステップ3:スケジューリングパラメータの候補を決定し、PIDゲインそれぞれのスケジューリング関数を設計する。
ステップ4:プレフィルタを設計する。
ステップ5:評価関数を最小にするスケジューリング関数の重み係数(制御パラメータ)をRidge回帰で求める。
なお、ステップ4において、たとえば、シミュレーションおよび実験にて実績のある次式のプレフィルタを用いる。ただし、プレフィルタはこれに限らない。
【数34】
【0039】
[シミュレーション検証]
非線形システムを制御対象とした。ここでは、非線形システムを記述するモデルとして広く用いられているHammerstein モデルを制御対象とした。
制御器を含めたシミュレーションのサンプリング周期は1(sec)とし、次式に示すようなHammerstein モデルを制御対象とした。
【数35】
ここで、vは分散1×10-3の白色雑音とする。各時刻の目標値rを以下のように設定した。
【数36】
参照モデルは次式を用いた。
【数37】
スケジューリングパラメータを次式とした。
【数38】
ゲインスケジューラは、式(9)を用いた。
【0040】
[検証結果]
入力はチャープサイン信号を印加し、入出力データを計測した。
従来の手法である標準VRFT(固定PIDゲイン)を用いたときの時系列データと、本開示の手法であるLUT-VRFT-Ridgeを用いたとときの時系列データとを比較した。
従来の手法で求められた固定PIDゲインは、K=0.0389、K=0.2232、K=0.0000である。取得した入出力データから固定PIDゲインを求めたときの時系列データを図9に示す。また、本開示の手法でPIDゲインを求めたときの時系列データを図10に示す。なお、図9および図10のそれぞれにおいて、上段から、出力、入力、比例ゲイン、積分ゲイン、微分ゲインである。
図9および図10を参照して、従来の手法と本開示の手法とを比較すると、本開示の手法は、PIDゲインが制御対象の状態に応じて変化しており、PIDゲインが目標応答に追従していることが確認できた。
【0041】
また、本開示の手法における、制御対象の状態と比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれとの関係を図11A図11Cに示す。なお、図11A図11Cのそれぞれにおいて、state1軸は状態1の数量を表し、state2軸は状態2の数量を表す。縦軸は比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれを表す。
図11A図11Cを参照すると、制御対象の状態1および状態2のそれぞれに応じて比例ゲイン、積分ゲイン、および、微分ゲインのそれぞれが変化していることが確認できた。
【0042】
<実施の形態に係る情報処理装置1の機能構成>
以上の技術を前提として、実施の形態に係る情報処理装置1を説明する。
【0043】
図6は、実施の形態に係る閉ループ系を模式的に示す図であり、制御モデルを用いずに自動調整則を有するゲインスケジュールPID制御を実現するための構成を示す図である。図6に示すように、実施の形態に係る情報処理装置1は、制御対象Pへの入力u、制御対象の出力y、制御対象Pの状態X、参照モデルMの出力M(z-1)rを取得して、ゲインスケジュール制御を実現するためのLUTを変更するとともに、制御器Cの制御パラメータρを出力する。図6から明らかなように、実施の形態に係る閉ループ系は、図1に示した参照モデルを備える一般的な閉ループ系に情報処理装置1が追加されて構成されている。
【0044】
図7は、実施の形態に係る情報処理装置1の機能構成を模式的に示す図である。情報処理装置1は、記憶部2と制御部3とを備える。図7において、矢印は主なデータの流れを示しており、図7に示していないデータの流れがあってもよい。図7において、各機能ブロックはハードウェア(装置)単位の構成ではなく、機能単位の構成を示している。そのため、図7に示す機能ブロックは単一の装置内に実装されてもよく、あるいは複数の装置内に分かれて実装されてもよい。機能ブロック間のデータの授受は、データバス、ネットワーク、可搬記憶媒体等、任意の手段を介して行われてもよい。
【0045】
記憶部2は、情報処理装置1を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)や情報処理装置1の作業領域となるRAM(Random Access Memory)、OS(Operating System)やアプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報、制御対象Pの状態と制御器Cの制御パラメータρとを紐づけて格納するLUTを格納するHDD(Hard Disk Drive)やSSD(Solid State Drive)等の大容量記憶装置である。
【0046】
制御部3は、情報処理装置1のCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサであり、記憶部2に記憶されたプログラムを実行することによって状態取得部30、パラメータ生成部31、及びテーブル変更部32として機能する。
【0047】
なお、図7は、情報処理装置1が単一の装置で構成されている場合の例を示している。しかしながら、情報処理装置1は、例えばクラウドコンピューティングシステムのように複数のプロセッサやメモリ等の計算リソースによって実現されてもよい。この場合、制御部3を構成する各部は、複数の異なるプロセッサの中の少なくともいずれかのプロセッサがプログラムを実行することによって実現される。
【0048】
[ゲインスケジュールPID制御]節で説明したように、実施の形態に係る情報処理装置1は、図6における制御器Cの制御パラメータρを算出する。すなわち、情報処理装置1は、制御器Cと、制御器Cの出力を入力とする制御対象Pと、制御対象Pに入力する入力信号を入力として制御対象Pの出力をモデル化する参照モデルMを備え、制御対象Pの出力が制御器Cの入力にフィードバックされる制御システムにおいて、制御器Cの制御パラメータρを算出する。また、情報処理装置1は、制御器Cの制御パラメータρを算出するために用いられるLUTのテーブルデータであるパラメータ値も変更する。
【0049】
[ルックアップテーブルの構造]節で説明したように、記憶部2が格納するLUTは、制御対象Pに関する1又は複数の状態を軸とし、軸によって定義される空間に制御器Cの制御パラメータρが配置されて格納されている。
【0050】
状態取得部30は、制御対象Pの状態Xを取得する。制御対象Pの状態Xとは、例えば、制御対象Pの温度や圧力、制御対象Pが運動を行う場合はその速度や運動量、制御対象Pが存在する環境のパラメータ(温度や湿度等)である。状態取得部30により取得されたデータは記憶部2に蓄積され、蓄積されたデータは、パラメータ生成部31により用いられる。これにより、LUTのパラメータはテーブル変更部32によりオフライン調整される。なお、状態取得部30により取得されたデータがリアルタイムで用いられることで、LUTのパラメータがテーブル変更部32によりオンライン調整されてもよい。
【0051】
パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xに基づいて、LUTを参照して複数のパラメータ値θi,jに基づいて制御パラメータρを生成する。具体的には、パラメータ生成部31は、式(8)又は式(13)に基づいて、複数のパラメータ値θi,jのそれぞれに、複数のパラメータ値θi,jのそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより制御パラメータρを生成する。パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xと複数のパラメータ値θi,jが対応する状態との距離dが近ければ近いほど大きな値の重みを複数のパラメータ値θi、jに乗じる。これにより、情報処理装置1は、制御対象Pの速い特性変動に応じて制御パラメータρを生成することができる。
【0052】
テーブル変更部32は、制御対象Pの出力と、参照モデルMの出力との誤差に関する評価関数Jに基づいて、LUTに配置するテーブルデータである複数のパラメータ値θi,jを変更する。具体的には、テーブル変更部32は、式(13)に示す評価関数Jが小さくなるように、LUTに配置する複数のテーブルデータを変更する。これにより、情報処理装置1は、たとえば、経年劣化が原因で制御対象Pの特性が変動しても、LUTに格納すべきテーブルデータである複数のパラメータ値θi,jを自動的に調整することで、制御パラメータを最適な値に調整することができる。
【0053】
ここで、LUTに配置するテーブルデータの変更は、制御対象Pの状態に対応して行われる。たとえば、制御対象Pの経年劣化等に対応してテーブルデータの変更が行われる。
【0054】
そこで、テーブル変更部32は、式(13)に示す評価関数Jの評価値が所定の範囲から外れた場合に、評価関数Jの評価値が所定の範囲に含まれるようにLUTに配置するテーブルデータである複数のパラメータ値θi,jを変更する。
【0055】
ここで「所定の範囲」とは、LUTの変更の必要性の有無を決定するためにテーブル変更部32が参照する「LUT変更決定用範囲」である。具体的には、式(13)に示す評価関数Jは評価値が小さいほど良い評価となるため、所定の範囲は0~上限値の範囲となる。すなわち、テーブル変更部32は、評価関数Jの評価値が上限値を超えた場合、評価関数Jの評価値が上限値を下回るように、LUTに配置するテーブルデータを変更する。この上限値の具体的な値は、制御対象Pに関する先見情報や、制御に求められる精度等を勘案して実験により定めればよい。これにより、情報処理装置1は、不必要なLUTの変更処理に計算リソースが割り当てられることを抑制できるとともに、制御器Cによる制御対象Pの制御の安定性を維持することができる。
【0056】
式(26)に示すように、制御対象Pの出力と参照モデルMの出力との誤差eは、LUTに配置すべきテーブルデータである複数のパラメータ値θi,jに基づく制御パラメータρを要素とするパラメータベクトルw(式(28))に対して線形となるように定義されている。
【0057】
そこで、テーブル変更部32は、制御対象Pの出力と参照モデルMの出力との誤差eが小さくなるように、式(28)に示すパラメータベクトルwを変更することにより、LUTに配置すべき複数のパラメータ値θi,jを変更する。
【0058】
より具体的には、テーブル変更部32は、式(33)に示す評価関数に基づいて、パラメータベクトルwを変更する。式(33)に示す式はRidge回帰を取り入れた評価関数の式である。一般に、Ridge回帰は、一般的な逐次最小二乗法と比較して過学習を防止することで、パラメータの局所的な最適化を防止できるという利点がある。
【0059】
このように、テーブル変更部32がRidge回帰の導入で評価関数Jの評価値が小さくなるようにパラメータベクトルwを変更することにより、情報処理装置1は、制御器Cにより制御対象Pの制御の安定性を維持することができる。
【0060】
パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xに対応するLUTの位置座標からの距離に基づいて複数のパラメータ値θi,jを重み付け加算することにより制御パラメータρを算出する。このように、パラメータ生成部31がLUTのテーブルデータから制御パラメータρを線形演算で算出することにより、最終的に式(26)に示すように、制御対象Pの出力と参照モデルMの出力との誤差eをLUTのテーブルデータに対して線形とすることができる。
【0061】
<情報処理装置1が実行する情報処理の処理フロー>
図8は、実施の形態に係る情報処理装置1が実行する情報処理の流れを説明するためのフローチャートである。本フローチャートにおける処理は、例えば情報処理装置1が起動したときに開始する。
【0062】
状態取得部30は、制御対象Pの状態Xを取得する(S1)。パラメータ生成部31は、状態取得部30が取得した制御対象Pの状態Xに基づいて、LUTを参照して制御器Cの制御パラメータρを生成する(S2)。
【0063】
テーブル変更部32は、評価関数Jの評価値を算出して取得する(S3)。評価値が所定の範囲から外れている場合(S4:NO)、テーブル変更部32は、評価関数Jの評価値が所定の範囲に含まれるように、LUTに格納する制御パラメータρを変更する(S5)。その後、本フローチャートにおける処理は終了する。評価値が所定の範囲内の場合(S4:YES)、本フローチャートにおける処理は終了する。
【0064】
<実施の形態に係る情報処理装置1が奏する効果>
以上説明したように、実施の形態に係る情報処理装置1によれば、制御対象の状態に応じて制御パラメータを変化させるように構成したため、PIDゲインが目標応答に十分に追従可能となる。
【0065】
以上、本開示を実施の形態を用いて説明したが、本開示の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の分散・統合の具体的な実施の形態は、以上の実施の形態に限られず、その全部又は一部について、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本開示の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を合わせ持つ。
【0066】
その他、上記実施の形態は、何れも本開示の実施をするにあたっての具体化の一例を示したものに過ぎず、これらによって本開示の技術的範囲が限定的に解釈されてはならないものである。すなわち、本開示はその要旨、又はその主要な特徴から逸脱することなく、様々な形で実施することができる。
【産業上の利用可能性】
【0067】
本開示は、制御対象の状態に応じてパラメータを変化させることが要求される情報処理装置を備えた産業システム、特に、エンジンや自動変速機等の非線形性が強い産業システムに好適に利用される。
【符号の説明】
【0068】
1 情報処理装置
2 記憶部
3 制御部
30 状態取得部
31 パラメータ生成部
32 テーブル変更部
C 制御器
P 制御対象
M 参照モデル
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11A
図11B
図11C
【手続補正書】
【提出日】2022-10-06
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
制御器と、前記制御器の出力を入力とする制御対象と、前記制御器に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、
前記制御対象又は外部入力に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、
前記制御対象の状態を取得する状態取得部と、
取得された前記制御対象の状態を蓄積する記憶部と、
前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、
蓄積された前記制御対象の状態を用いて、オフラインで、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのRidge回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、
を備える情報処理装置。
【請求項2】
前記パラメータ生成部は、前記複数のパラメータ値のそれぞれに、前記複数のパラメータ値のそれぞれに対応する重みを乗じて生成した複数の乗算値を加算することにより前記制御パラメータを生成する、
請求項1に記載の情報処理装置。
【請求項3】
前記パラメータ生成部は、前記状態取得部が取得した前記制御対象の状態と前記複数のパラメータ値が対応する状態との距離が近ければ近いほど大きな値の前記重みを前記複数のパラメータ値に乗じる、
請求項2に記載の情報処理装置。
【請求項4】
前記テーブル変更部は、前記評価関数の評価値が所定の範囲から外れた場合に、前記評価値が前記範囲に含まれるように前記制御パラメータを変更する、
請求項1から3のいずれか一項に記載の情報処理装置。
【請求項5】
前記制御対象の出力と前記参照モデルの出力との誤差は、前記ルックアップテーブルに配置された前記複数のパラメータ値に基づく前記制御パラメータを要素とするパラメータベクトルに対して線形となるように定義されており、
前記テーブル変更部は、前記誤差が小さくなるように前記パラメータベクトルを変更することにより、前記制御パラメータを変更する、
請求項1から4のいずれか一項に記載の情報処理装置。
【請求項6】
前記評価関数は、(1)前記空間における前記複数のパラメータ値に対応する位置座標、前記参照モデル、及び前記制御対象の出力から算出されるベクトルと前記パラメータベクトルとの内積と、(2)前記参照モデル及び前記制御対象への入力信号の積と、の差の二乗で定義されており、
前記テーブル変更部は、前記Ridge回帰を用いて前記評価関数の評価値が小さくなるように前記パラメータベクトルを変更する、
請求項5に記載の情報処理装置。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0008
【補正方法】変更
【補正の内容】
【0008】
上記の目的を達成するため、本開示における情報処理装置は、制御器と、前記制御器の出力を入力とする制御対象と、前記制御器に入力する入力信号を入力として前記制御対象の出力をモデル化する参照モデルとを備え、前記制御対象の出力が前記制御器の入力にフィードバックされる制御システムにおいて、前記制御器の制御パラメータを算出する情報処理装置であって、前記制御対象又は外部入力に関する1又は複数の状態を軸とし、前記軸によって定義される空間に前記制御パラメータを算出するために用いられる複数のパラメータ値が配置されたルックアップテーブルと、前記制御対象の状態を取得する状態取得部と、取得された前記制御対象の状態を蓄積する記憶部と、前記状態取得部が取得した状態に基づいて、前記ルックアップテーブルを参照して前記複数のパラメータ値に基づいて前記制御パラメータを生成するパラメータ生成部と、蓄積された前記制御対象の状態を用いて、オフラインで、前記制御対象の出力と、前記参照モデルの出力との誤差に関する評価関数についてのRidge回帰の結果に基づいて、前記ルックアップテーブルに配置された前記複数のパラメータ値を変更するテーブル変更部と、を備える。