IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ いすゞ自動車株式会社の特許一覧 ▶ 国立大学法人北海道大学の特許一覧

<>
  • 特開-情報処理装置 図1
  • 特開-情報処理装置 図2
  • 特開-情報処理装置 図3
  • 特開-情報処理装置 図4
  • 特開-情報処理装置 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023031900
(43)【公開日】2023-03-09
(54)【発明の名称】情報処理装置
(51)【国際特許分類】
   G05B 11/32 20060101AFI20230302BHJP
【FI】
G05B11/32 F
【審査請求】有
【請求項の数】3
【出願形態】OL
(21)【出願番号】P 2021137667
(22)【出願日】2021-08-26
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り ▲1▼刊行物 北海道大学令和2年卒業論文 ▲2▼発行日 令和3年2月1日 ▲3▼発行所 国立大学法人北海道大学 ▲4▼該当ページ 第3章(節3.5~及び3.6) ▲5▼公開者 坂井達成、梶原逸朗 ▲6▼公開のタイトル データ駆動制御手法を用いた二自由度制御系の適応パラメータチューニング
(71)【出願人】
【識別番号】000000170
【氏名又は名称】いすゞ自動車株式会社
(71)【出願人】
【識別番号】504173471
【氏名又は名称】国立大学法人北海道大学
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】矢作 修一
(72)【発明者】
【氏名】梶原 逸朗
(72)【発明者】
【氏名】坂井 達成
【テーマコード(参考)】
5H004
【Fターム(参考)】
5H004GA08
5H004KB32
5H004KC02
(57)【要約】
【課題】初期パラメータに対する制限を緩和しても、プレフィルタの安定性の低下を抑制し得る、情報処理装置を提供すること。
【解決手段】情報処理装置は、第1の評価関数を最小化させる制御パラメータをフィードフォワード制御器の最適パラメータとして算出するとともに、第2の評価関数を最小化させる制御パラメータをフィードバック制御器の最適パラメータとして算出する演算部を有し、当該演算部は、第1及び第2の評価関数においてそれぞれ、遅れを含むプレフィルタを用いて、フィードフォワード制御器及びフィードバック制御器の最適パラメータを算出する。
【選択図】図5
【特許請求の範囲】
【請求項1】
目標値と制御対象の出力値との偏差に基づいて第1の操作量を算出するフィードバック制御器と、前記目標値に基づいて第2の操作量を算出するフィードフォワード制御器と、を有し、前記第1の操作量と前記第2の操作量とを加算して前記制御対象の操作量として、前記制御対象の出力値を前記目標値に一致させるように二自由度制御する二自由度制御器における、前記フィードバック制御器及び前記フィードフォワード制御器のそれぞれの最適制御パラメータを算出する情報処理装置であり、
第1の評価関数を最小化させる制御パラメータを前記フィードフォワード制御器の最適パラメータとして算出するとともに、第2の評価関数を最小化させる制御パラメータを前記フィードバック制御器の最適パラメータとして算出する演算部を有し、
前記演算部は、前記第1及び前記第2の評価関数においてそれぞれ、遅れを含むプレフィルタを用いて、前記フィードフォワード制御器及び前記フィードバック制御器の最適パラメータを算出する、
情報処理装置。
【請求項2】
前記遅れを含むプレフィルタは、FIR(Finite Impulse Response)モデルで同定されたものである、
請求項1に記載の情報処理装置。
【請求項3】
前記演算部は、
前記第1の評価関数として次式(48)で表される評価関数を用いるとともに、前記第2の評価関数として次式(49)で表される評価関数を用いる、
【数1】
【数2】
ただし、式(48)、式(49)において、JTdチルダ(ρベクトル)はフィードフォワード制御器の評価関数を示し、JSd(ρベクトル)はフィードバック制御器の評価関数を示し、ρベクトルは制御パラメータを示し、uiniは入力データを示し、yiniは出力データを示し、Fはプレフィルタを示し、Tは目標応答伝達関数を示し、Sは感度関数規範モデルを示し、Z-Δは遅れ要素を示し、β(z)ベクトル及びα(z)ベクトルは式(50)及び式(51)で表されるものである、
【数3】
【数4】
ただし、式(50)、式(51)において、Cはフィードフォワード制御器を示し、Cはフィードバック制御器を示す、
請求項1または2に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、二自由度制御系に対して用いられる情報処理装置に関する。
【背景技術】
【0002】
従来、目標応答特性と外乱応答特性のそれぞれを向上させることができる制御システムとして、フィードフォワード制御器およびフィードバック制御器を備えた二自由度制御系が知られている(例えば、非特許文献1参照)。
【0003】
この二自由度制御系の制御器の最適パラメータは、計算機などで構成される情報処理装置によって求めることができる。具体的には、情報処理装置は、制御器の評価関数を用い、この評価関数を最小化する制御パラメータを制御器の最適パラメータとして求める。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】金子修・中村岳男・池崎太一著,「二自由度制御系におけるフィードフォワード制御器更新の新しいアプローチ -Estimated Response Iterative Tuning (ERIT)の提案-」計測自動制御学会論文集Vol.54,No.12,p857~864,2018年
【非特許文献2】Bernard Widrow,Eugene Walach,Adaptive Inverse Control, Reissue Edition: A Signal Processing Approach,Wiley-IEEE Press,2008
【非特許文献3】B. Widrow,M. Bilello,“ Adaptive inverse control ”, Proceedings of 8th IEEE International Symposium on Intelligent Control,pp. 1-6,August 1993
【発明の概要】
【発明が解決しようとする課題】
【0005】
二自由度制御系では、最適化に必要な入出力データを整形するために用いるプレフィルタが用いられる。具体的には、このプレフィルタは、応答初期における上記評価関数の誤差を低減するために用いられる、上記評価関数内でのフィルタ演算のことを言う。
【0006】
ところが、このプレフィルタは、制御器の初期パラメータ(以下これを単に「初期パラメータ」と呼ぶ)によっては不安定となる場合がある。よって、プレフィルタが安定となるような初期パラメータとしなければならないという制限が生じてしまう。従来はこの点について、十分な配慮がなされていなかった。
【0007】
本開示は、以上の点を考慮してなされたものであり、初期パラメータに対する制限を緩和しても、プレフィルタの安定性の低下を抑制し得る、情報処理装置を提供する。
【課題を解決するための手段】
【0008】
本開示の情報処理装置の一つの態様は、
目標値と制御対象の出力値との偏差に基づいて第1の操作量を算出するフィードバック制御器と、前記目標値に基づいて第2の操作量を算出するフィードフォワード制御器と、を有し、前記第1の操作量と前記第2の操作量とを加算して前記制御対象の操作量として、前記制御対象の出力値を前記目標値に一致させるように二自由度制御する二自由度制御器における、前記フィードバック制御器及び前記フィードフォワード制御器のそれぞれの最適制御パラメータを算出する情報処理装置であり、
第1の評価関数を最小化させる制御パラメータを前記フィードフォワード制御器の最適パラメータとして算出するとともに、第2の評価関数を最小化させる制御パラメータを前記フィードバック制御器の最適パラメータとして算出する演算部を有し、
前記演算部は、前記第1及び前記第2の評価関数においてそれぞれ、遅れを含むプレフィルタを用いて、前記フィードフォワード制御器及び前記フィードバック制御器の最適パラメータを算出する。
【発明の効果】
【0009】
本開示によれば、初期パラメータに対する制限を緩和しても、プレフィルタの安定性の低下を抑制し得る、情報処理装置を実現できる。
【図面の簡単な説明】
【0010】
図1】本開示の実施の形態にかかる二自由度制御系を示す模式図
図2】二回目の実験で実際に取得された入力データと、本開示の実施の形態にかかる情報処理装置により予測された入力データとを示すグラフ
図3】二回目の実験で実際に取得された出力データと、本開示の実施の形態にかかる情報処理装置により予測された出力データとを示すグラフ
図4】本開示の実施の形態における逆システムXΔ -1(z,ρiniベクトル)の同定手法の説明に供する図
図5】本開示の実施の形態にかかる情報処理装置の構成例を示すブロック図
【発明を実施するための形態】
【0011】
以下、本開示の実施の形態について、図面を参照しながら説明する。
【0012】
[二自由度制御系の構成]
図1を用いて、本開示の実施の形態にかかる制御システムとしてのモデルマッチング二自由度制御系(以下、単に二自由度制御系という)について説明する。図1は、本実施の形態の二自由度制御系1を示す模式図である。なお、図1では図示を省略しているが、二自由度制御系1は、図5に示す情報処理装置100と電気的に接続される。この情報処理装置100については後述する。
【0013】
図1において、C(z,ρベクトル)はフィードフォワード制御器を示し、C(z,ρベクトル)はフィードバック制御器を示す。また、G(z)は制御対象(プラント)を示し、ρベクトルは制御器の持つ制御パラメータを示す。また、rは参照信号(参照入力または目標値ともいう)を示し、vは既知の外乱入力(単に外乱ともいう)を示す。また、u(ρベクトル)は制御入力(操作量ともいう)を示し、y(ρベクトル)は制御対象G(z)の出力(応答または制御量ともいう)を示す。また、T(z)は、参照信号rから出力y(ρベクトル)までの目標応答伝達関数を示す。制御対象G(z)は線形時不変であり、その動特性は未知であるとする。
【0014】
フィードフォワード制御器C(z,ρベクトル)は、参照信号rに基づく第1操作量を出力する。フィードバック制御器C(z,ρベクトル)は、目標応答伝達関数T(z)の出力(目標応答)と制御対象G(z)の出力y(ρベクトル)との偏差eに基づく第2操作量を出力する。制御対象G(z)に入力される制御入力u(ρベクトル)には、第1操作量、第2操作量、および既知の外乱入力vが含まれる。なお、以下では、制御入力u(ρベクトル)と制御対象G(z)の出力y(ρベクトル)とをまとめて「入出力データ」と表記する。
【0015】
図1に示す二自由度制御系1において、感度関数規範モデルS(z)に対してフィードバック制御器C(z,ρベクトル)が独立に設計でき、目標応答伝達関数T(z)に対してフィードフォワード制御器C(z,ρベクトル)が独立に設計できることを、以下に示す。
【0016】
制御パラメータρベクトルにおいて、参照入力rから出力y(ρベクトル)までの伝達関数T(z,ρベクトル)と、既知の外乱入力vから制御入力u(ρベクトル)までの伝達関数(感度関数)S(z,ρベクトル)とは、それぞれ、次式(1)、(2)のように表される。
【数1】
【数2】
【0017】
伝達関数T(z,ρベクトル)と伝達関数S(z,ρベクトル)とを、それぞれ、目標応答伝達関数T(z)、感度関数規範モデルS(z)とするには、フィードフォワード制御器C(z,ρベクトル)とフィードバック制御器C(z,ρベクトル)とが、それぞれ、次式(3)、(4)のようになればよい。
【数3】
【数4】
【0018】
式(3)と式(4)により、フィードフォワード制御器C(z,ρベクトル)とフィードバック制御器C(z,ρベクトル)とは互いに依存せず、目標応答伝達関数T(z)に対してフィードフォワード制御器C(z,ρベクトル)が独立に設計でき、感度関数規範モデルS(z)に対してフィードバック制御器C(z,ρベクトル)が独立に設計できることが分かる。
【0019】
次に、フィードフォワード制御器C(z,ρベクトル)の最適化を考える。ここで、v=0とし、Nステップ分の入出力データu(k)、y(k)を取得したとする。このとき、次式(5)に示す評価関数JTd(ρベクトル)を最小化する最適な制御パラメータρベクトルアスタリスクを求めることがFRIT(Fictitious Reference Iterative Tuning)の目的である。これは、パラメータρベクトルを変えることにより伝達関数T(z,ρベクトル)を目標応答伝達関数T(z)に一致させるモデルマッチング設計法である。
【数5】
【0020】
閉ループ系が安定となるように制御パラメータρiniベクトルを定め、r=r≠0、v=v=0のもと、Nステップ分の入出力データuini、yiniを取得する。この初期の入出力データuini、yiniを用いて、次式(6)に示す擬似参照信号rチルダ(k,ρベクトル)を計算する。
【数6】
【0021】
擬似参照信号rチルダ(k,ρベクトル)は、ρベクトルの関数である。ここで、擬似参照信号rチルダ(k,ρベクトル)に対する誤差信号eチルダ(k,ρベクトル)を導入する。この誤差信号eチルダ(k,ρベクトル)を用いた評価関数JTdチルダ(ρベクトル)を次式(7)のように与える。
【数7】
【0022】
この評価関数JTdチルダ(ρベクトル)を最小化させる制御パラメータρベクトルが、最適パラメータρベクトルアスタリスクとなる。誤差信号eチルダ(k,ρベクトル)の計算に必要なyini(k)、T(z)が既知の情報であり、rチルダ(k,ρベクトル)はオフラインで計算可能である。
【0023】
次に、フィードバック制御器Ce(z,ρベクトル)の最適化を考える。ここで、r=0とし、Nステップ分のデータv(k)、u(k)を取得したとする。このとき、次式(8)に示す評価関数JSd(ρベクトル)を最小化する最適な制御パラメータρベクトルアスタリスクを求めることがFRITの目的である。これは、パラメータρベクトルを変えることにより伝達関数S(z,ρベクトル)を感度関数規範モデルS(z)に一致させるモデルマッチング設計法である。
【数8】
【0024】
上述した初期の制御パラメータρiniベクトルにおいて、r=r=0、v=v≠0のもと、Nステップ分の入出力データuv_ini、yv_iniを取得する。この初期の入出力データuv_ini、yv_iniを用いて、次式(9)に示す擬似外乱信号vチルダ(k,ρベクトル)を計算する。また、既知である付加信号vは、低周波数帯域の外乱を想定して、低周波帯域に強調された信号とする。つまり、付加信号vに低周波帯域に強調された信号として、ステップ信号を利用すれば、調整可能である。
【数9】
【0025】
擬似外乱信号vチルダ(k,ρベクトル)は、ρベクトルの関数である。ここで、擬似外乱信号vチルダ(k,ρベクトル)に対する誤差信号eチルダ(k,ρベクトル)を導入する。この誤差信号eチルダ(k,ρベクトル)を用いた評価関数JSdチルダ(ρベクトル)を次式(10)のように与える。
【数10】
【0026】
この評価関数JSdチルダ(ρベクトル)を最小化させる制御パラメータρベクトルが、最適パラメータρベクトルアスタリスクとなる。誤差信号eチルダ(k,ρベクトル)の計算に必要なuv_ini(k)、S(z)が既知の情報であり、vチルダ(k,ρベクトル)はオフラインで計算可能である。
【0027】
また、上記式(7)、式(10)にそれぞれ示した評価関数JTdチルダ(ρベクトル)、評価関数JSdチルダ(ρベクトル)を最小化させることは、上記式(5)、式(8)にそれぞれ示した本来最小化したい評価関数JTdチルダ(ρベクトル)、評価関数JSdチルダ(ρベクトル)を最小化することと漸近的に等価となる。これは、先行文献(例えば、坂田智則・金子修・藤井隆雄著,“FRITを用いた閉ループ特性と目標応答特性の向上のための二自由度制御器のパラメータ調整”,システム制御情報学会論文誌,Vol.20,No.11,p419~429,2007年)に開示されている。
【0028】
上記先行文献では、評価関数をJチルダ(ρベクトル)=JTdチルダ(ρベクトル)+JSdチルダ(ρベクトル)とし、フィードフォワード制御器Cとフィードバック制御器Cを同時に最適化している。
【0029】
これに対し、本実施の形態では、図1に示したモデルマッチング二自由度制御系を用いるため、上記式(3)、式(4)により、フィードフォワード制御器Cとフィードバック制御器Cのそれぞれを独立に設計可能である。つまり、評価関数JSdチルダ(ρベクトル)に対してフィードバック制御器C、評価関数JTdチルダ(ρベクトル)に対してフィードフォワード制御器Cのように別々に設計しても、最適な制御パラメータを得ることができる。
【0030】
以下に、従来一般的な、FRITに基づく二自由度制御系の最適化のフローをまとめる。
【0031】
ステップ1:目標応答伝達関数T、感度関数規範モデルSを決定する。
【0032】
ステップ2:閉ループ系が安定となるように制御パラメータρiniベクトルを定める。
【0033】
ステップ3:r=r≠0、v=v=0のもと、入出力データuini、yiniを取得する(一回目の実験)。
【0034】
ステップ4:r=r=0、v=v≠0のもと、入出力データuv_ini、yv_iniを取得する(二回目の実験)。
【0035】
ステップ5:評価関数JSdチルダ(ρベクトル)を最小化させる最適パラメータρベクトルアスタリスクを求め、それに基づいて最適なフィードバック制御器C(ρベクトルアスタリスク)に調整する。なお、本ステップでは、非線形最適化アルゴリズムを使用する。
【0036】
ステップ6:評価関数JTdチルダ(ρベクトル)を最小化させる最適パラメータρベクトルアスタリスクを求め、それに基づいて最適なフィードフォワード制御器C(ρベクトルアスタリスク)に調整する。なお、本ステップでは、非線形最適化アルゴリズムを使用する。
【0037】
[FIRフィルタの導入と最小二乗法による求解]
本実施の形態では、図1に示したフィードフォワード制御器Cに、有限時間のインパルス応答を持つデジタルフィルタ、すなわちFIR(Finite Impulse Response)フィルタを適用することを考える。FIRフィルタを用いる理由としては、必ず安定であること、線形位相を持たせることができること、構造が分かりやすいこと、などが挙げられる。しかしながら、一般にFIRフィルタでは次数を高くする必要があるため、非線形最適化アルゴリズムを用いると、計算量が多くなり、時間とコストがかかるという問題がある。よって、FIRフィルタとPID(Proportional-Integral-Differential)制御器がパラメータに対して線形であることから、最小二乗法により求解できることが理想である。
【0038】
従来、フィードバック制御系、または、二自由度制御系のフィードフォワード制御器の最適化におけるFRITで最小二乗法を導入することが知られている。そこで、本実施の形態では、図1に示した二自由度制御系1におけるフィードバック制御器Cに対しても、最小二乗法を用いて最適化する。すなわち、本実施の形態では、上述したステップ5、6において、非線形最適化アルゴリズムの代わりに、最小二乗法を用いる。
【0039】
まず、フィードフォワード制御器Cの最適化を考える。上記式(6)を上記式(7)へ代入し、次式(11)に示すように、誤差信号eチルダ(k,ρベクトル)を定義する。
【数11】
【0040】
プレフィルタFにより、r=r≠0、v=v=0のもとに取得される入出力データuini、yiniを整形し、次式(12)に示す評価関数JTdFチルダ(ρベクトル)を考える。
【数12】
【0041】
そして、上記式(5)を、次式(13)のように書き換える。
【数13】
【0042】
また、上記式(12)を、次式(14)のように書き換える。
【数14】
【0043】
上記式(13)と上記式(14)は、次式(15)を満たすとき、等価となる。
【数15】
【0044】
フィードフォワード制御器Cとフィードバック制御器Cのそれぞれを別々に最適化するため、C(z,ρベクトル)=C(z,ρiniベクトル)と固定させる。上記式(15)を満たすプレフィルタFは、次式(16)となる。
【数16】
【0045】
フィードフォワード制御器C(z,ρベクトル)が、次式(17)に示すように、パラメータρベクトルに対して線形であるとする。
【数17】
【0046】
このとき、上記式(12)は、次式(18)のようになる。
【数18】
【0047】
最適パラメータρベクトルアスタリスクは、最小二乗法により、次式(19)のように求解される。
【数19】
【0048】
次に、フィードバック制御器Cの最適化を考える。上記式(9)を上記式(10)へ代入し、次式(20)に示すように、誤差信号eMSチルダ(k,ρベクトル)を定義する。
【数20】
【0049】
誤差信号eMSチルダ(k,ρベクトル)に対して、新たに次式(21)に示す評価関数JSdFチルダ(ρベクトル)を考える。
【数21】
【0050】
フィードバック制御器C(z,ρベクトル)が、次式(22)に示すように、パラメータρベクトルに対して線形であるとする。
【数22】
【0051】
このとき、上記式(21)は、次式(23)のようになる。
【数23】
【0052】
最適パラメータρベクトルアスタリスクは、最小二乗法により、次式(24)のように求解される。
【数24】
【0053】
また、フィードフォワード制御器CをFIRフィルタとする場合、上記式(17)は、次式(25)のようにすればよい。
【数25】
【0054】
[一組の入出力データによる制御器の最適化方法]
フィードフォワード制御器Cとフィードバック制御器CのそれぞれをFRITにより最適化する際、上記式(10)、式(7)に示した評価関数を最小化するパラメータを計算する。最小二乗法を用いる場合、上記式(25)、式(19)により計算を行い、最適パラメータを求める。いずれにしても、上述したステップ3、ステップ4のように、二回の実験が必要となる。
【0055】
上記ステップ3により得られる入出力データuini、yiniは、フィードフォワード制御器Cの最適化に必要である。上記ステップ4により得られる入出力データuv_ini、yv_iniは、フィードバック制御器Cの最適化に必要である。
【0056】
ここで、上記ステップ3は、各制御器の稼働中に実行可能であるが、上記ステップ4は、各制御器を停止させ、図1に示した既知の外乱信号vを意図的に印加させなければならない。そのため、手間がかかる上、稼働の目的とは異なる状況が想定される。また、時間やコストの面からも、実験の回数は少ないことが望ましい。
【0057】
そこで、本実施の形態では、上記ステップ3で得られる入出力データuini、yiniのみを用いて、フィードフォワード制御器Cとフィードバック制御器Cのそれぞれを調整する方法を提案する。
【0058】
その方法は、ERIT(Estimated Response Iterative Tuning)という応答予測手法を参考にしたものである。ERITは、二自由度制御系において、データ駆動予測というコンセプトのもと、既知であるパラメータ更新前の入出力データにより、フィードフォワード制御器を更新した際の応答予測をすることができ、実装前に、安定性や応答性を評価できるという方法である。
【0059】
このERITの考え方を基にして、本実施の形態では、r=r≠0、v=v=0のときに得られる入出力データuini、yiniに基づいて、r=r=0、v=v≠0のときに取得されるべき入出力データuv_ini、yv_iniを予測する。
【0060】
まず、r=r=0、v=v≠0のときに取得されるべき入出力データuv_ini、yv_iniは、それぞれ、以下の式(26)、式(27)のように表される。
【数26】
【数27】
【0061】
また、r=r≠0、v=v=0のときに得られる入出力データuini、yiniは、それぞれ、以下の式(28)、式(29)のように表される。
【数28】
【数29】
【0062】
上記式(26)~式(29)までをz変換の形にし、未知である制御対象G(z)を消去すると、以下の式(30)、式(31)を得られる。
【数30】
【数31】
【0063】
このとき、一回目の実験に用いる参照信号r=r≠0を定値とし、さらに、二回目の実験に用いるはずの、低周波数に強調された擬似的に印加する外乱v=v≠0を定値とした場合、上記式(30)、式(31)は、それぞれ、以下の式(32)、式(33)となる。
【数32】
【数33】
【0064】
特に、r=1、v=1と設定すれば、上記式(16)に示したプレフィルタF(z,ρiniベクトル)と同じ形であるため、F(z,ρiniベクトル)として表すと、以下の式(34)、式(35)となる。
【数34】
【数35】
【0065】
以上のことから、上述したステップ3における一回目の実験で得られる一組の入出力データuini、yiniを用いて、オフラインにより、上述したステップ4における二回目の実験で得られる一組の入出力データuv_ini、yv_iniを計算することができる。よって、上述したステップ4における二回目の実験を省略することができる。
【0066】
すなわち、本実施の形態では、r=r≠0、v=v=0のときに得られる入出力データuini、yiniを基に、上記式(30)、式(31)(特に、r=1、v=1とする場合では、上記式(34)、式(35))を用いて、r=r2=0、v=v2≠0のときに得られる入出力データuv_ini、yv_iniを計算することができる。よって、実質的に、一回目の実験により得られる一組の入出力データuini、yiniを用いるだけで、フィードフォワード制御器Cとフィードバック制御器Cの両方を最適に調整することができる。
【0067】
[有効性の検証]
上述した本実施の形態の方法の有効性について検証する。
【0068】
図1に示した二自由度制御系1において、r=r=1.0、v=v=0.0とした一回目の実験と、r=r=0.0、v=v=1.0とした二回目の実験とを行う。そして、実際に二回目の実験で得られた入出力データuv_ini、yv_iniと、実際に一回目の実験で得られた入出力データuini、yiniに基づいて、上記式(34)、式(35)により算出(予測)された入出力データuv_ini、yv_iniと、を比較する。
【0069】
なお、制御対象G(s)は、データ駆動制御手法の検討にベンチマーク問題として扱われることの多い実プロセスシステムであり、以下の式(36)のように表されるとする。式(36)において、sはラプラス演算子を示す。
【数36】
【0070】
また、相補感度関数の規範モデルT(s)は、二次の二項係数標準形とし、以下の式(37)のように表されるとする。
【数37】
【0071】
また、フィードバック制御器C(s,ρベクトル)は、不完全微分を使用し、フィルタ時定数τを0.1としたPID制御器であり、以下の式(38)のように表されるとする。
【数38】
【0072】
フィードバック制御器C(z,ρベクトル)は、上記式(25)に示したFIRフィルタとし、次数nを40とする。
【0073】
サンプリング時間ts=0.05[sec]として、離散系で設計する。離散化は、MathWorks社製の数値解析ソフトウェア(MATLAB:登録商標)のc2dコマンドによりゼロ次ホールドで行う。
【0074】
入出力データは、0.0~49.5[sec]まで、合計1000個の時系列データとして取得する。初期パラメータは、K=K=K=1.0、ρ=(ts/n)・(n-i)=0.00003125(40-i)とした。
【0075】
図2は、実際に二回目の実験で得られた入力データuv_ini(実線A)と、実際に一回目の実験で得られた入力データuiniに基づいて上記式(34)により算出された入力データuv_ini(点線B)と、を示すグラフである。図2に示すように、実線Aと点線Bとは一致している。
【0076】
図3は、実際に二回目の実験で得られた出力データyv_ini(実線C)と、実際に一回目の実験で得られた出力データyiniに基づいて上記式(35)により算出された出力データyv_ini(点線D)と、を示すグラフである。図3に示すように、実線Cと点線Dとは一致している。
【0077】
すなわち、r=r=0.0、v=v=1.0とした二回目の実験で実際に得られた入出力データuv_ini、yv_iniと、一回目の実験で得られた入出力データuini、yiniに基づいて上記式(34)、式(35)により算出(予測)された入出力データuv_ini、yv_iniと、は一致する、という結果を得ることができた。したがって、実験の回数を二回から一回に減らすことができる。具体的には、上述したステップ3、4のうち、ステップ4を実行する必要がなくなる。
【0078】
=1.0、v=1.0と設定した場合、上記式(23)に示す評価関数は、次式(39)のようになる。また、r=1.0、v=1.0以外の場合(例えば、r=3.0、v=2.0と設定した場合)、定数であれば、因数(例えば、v/r=2/3)としてくくりだせるので、次式(39)をそのまま用いても漸近的に等価となる。
【数39】
【0079】
[不安定なプレフィルタに対する解決方法]
二自由度制御系のフィードフォワード制御器、フィードバック制御器を、オフラインFRITによって最小二乗法でパラメータ調整する手法を説明してきた。フィードフォワード制御器は、式(18)に示す評価関数を最小化する最適パラメータを、式(19)によって求解する。このとき、式(5)の評価関数と等価となるように、入出力データu_ini,y_iniに対して、式(16)に示すプレフィルタF(z,ρiniベクトル)が必要であった。また、前節では、フィードバック制御器の最適化に必要な入出力データu_ini,yv_iniが、式(34)、式(35)により計算可能であることを示したが、この時もF(z,ρiniベクトル)が必要であった。次式に、プレフィルタF(z,ρiniベクトル)を示す。
【数40】
【0080】
このF(z,ρiniベクトル)が不安定である場合、最適化に必要なデータが発散してしまい、最適化計算を適切に行うことはできない。前提として与えられていた制限は、閉ループ系が安定となるρiniベクトルであることであったが、F(z,ρiniベクトル)の必要性を考えると、閉ループ系が安定、かつF(z,ρiniベクトル)が安定となるようなρiniベクトルとする必要がある。
【0081】
ρiniベクトルは閉ループ系を安定にすることを前提に話を進める。ここで、プレフィルタF(z,ρiniベクトル)が安定になるよう、初期値ρiniベクトルを定めればよいが、それには試行錯誤が必要になる場合がある。また、経験則、あるいは他の方法である程度のρiniベクトルを決めて、既に制御を実装中の状況も想定できる。このときρiniベクトルで構成されるプレフィルタF(z,ρiniベクトル)は,不安定となっている場合がある。このような場合、安定になるようなρiniベクトルにしてから実験しなおすというのは非効率的である上、プレフィルタF(z,ρiniベクトル)が安定となるようなρiniベクトルを見つけることは簡単ではない。
【0082】
従来は、プレフィルタF(z,ρiniベクトル)の安定性については十分な検討がなされていない。そこで、本開示では、F(z,ρiniベクトル)の安定性を高める方法を提供する。
【0083】
本開示では、ρiniベクトルの制限である「閉ループ系が安定となるρiniベクトルとすること」「プレフィルタF(z,ρiniベクトル)が安定となるようなρiniベクトルとすること」を緩和させ、前者の「閉ループ系が安定となるρiniベクトルとすること」のみを考慮すればよいとする手法を提案する。
【0084】
まず、次式で表されるシステムX(z,ρiniベクトル)を考える。
【数41】
【0085】
X(z,ρiniベクトル)は、F(z,ρiniベクトル)の逆システムであり、F(z,ρiniベクトル)が不安定であるということは、X(z,ρiniベクトル)が不安定零点を持つ非最小位相系であることを意味する。X(z,ρiniベクトル)の逆システムをFIRフィルタで作ることができれば、安定なF(z,ρiniベクトル)となるが、非最小位相系であるX(z,ρiniベクトル)の逆システムを直接FIRフィルタとして作ることはできない。
【0086】
そこで、本実施の形態では、非最小位相系のX(z,ρiniベクトル)に対して、因果性を犠牲にした遅れを含む逆システムXΔ -1(z,ρiniベクトル)の同定手法を用いる。なお、Z-Δは遅れ要素である。
【0087】
図4は、本実施の形態における逆システムXΔ -1(z,ρiniベクトル)の同定手法の説明に供する図である。図4から分かるように、本実施の形態では、逆システムXΔ -1(z,ρiniベクトル)をFIRモデルで同定する。
【0088】
具体的に説明する。逆システムXΔ -1(z,ρiniベクトル)は、次式に示す安定なFIRフィルタで構成されるものとする。また、入力uは[-1.0,1.0]のM系列の白色信号とする。
【数42】
【0089】
遅延要素Z-Δの遅れΔは、非特許文献2、3によると、XΔ -1(z,ρiniベクトル)のインパルス応答時間の半分が適切とされている。誤差信号eは次式で与えられる。
【数43】
【0090】
誤差信号を最小化するXΔ -1(z,ρiniベクトル)のフィルタ係数ρベクトルは、最小二乗法によって求解可能であり、次式のように計算すればよい。
【数44】
【0091】
以上の同定手法により得られたXΔ -1は遅れΔを含んだF(z,ρiniベクトル)であり、次式で表すことができる。
【数45】
【0092】
よって、式(18)と式(39)の評価関数に含まれるF(z,ρiniベクトル)の代わりに、XΔ -1(z,ρiniベクトル)を用いると次式となる。
【数46】
【数47】
【0093】
このとき、uini,yiniの時系列は一致するため、式(18)と式(46)、式(39)と式(47)は漸近的に等価となり、同様の最適パラメータを得ることができると考えられる。また、遅れに対して、入出力データuini,yiniをできるだけ長く取得する必要があると言える。
【0094】
ここで、ρiniベクトルで構成されるプレフィルタF(z,ρiniベクトル)が安定、つまりX(z,ρiniベクトル)が最小位相系であるときに、本実施の形態の方法を利用しても、入出力データu_ini,y_iniを長く取得することができれば、同様に最適パラメータを得ることができると考えられる。
【0095】
本実施の形態のプレフィルタの設計手法は、初期パラメータに依存してプレフィルタが不安定となるような場合に、遅れを含むプレフィルタXΔ -1を用いることで因果性を犠牲して安定なプレフィルタを構成していると言うことができる。これにより、初期パラメータに対する制限を緩和しても、プレフィルタの安定性の低下を抑制できるようになる。
【0096】
また、本実施の形態で提案した式(46)及び式(47)によれば、入出力データに同量の遅延を付加しているので、評価関数間で時系列が一致し、適切に最適パラメータを求めることができる。
【0097】
このように、本実施の形態の不安定なプレフィルタに対する解決方法によれば、式(46)及び式(47)のように、評価関数に用いるプレフィルタとして遅れを含むプレフィルタXΔ -1を導入したことにより、初期パラメータに対する制限を緩和しても、プレフィルタの安定性の低下を抑制できるようになる。
【0098】
本実施の形態の[不安定なプレフィルタに対する解決方法]を実行する情報処理装置は、例えば図5に示した構成にて具現化される。
【0099】
図5に示す情報処理装置100は、図1に示した二自由度制御系1と電気的に接続され、フィードフォワード制御器Cとフィードバック制御器Cのそれぞれを最適化する装置である。特に、情報処理装置100は、上述した[不安定なプレフィルタに対する解決方法]を実行する。勿論、情報処理装置100は、上述した[一組の入出力データによる制御器の最適化方法]なども実行するが、ここでは[不安定なプレフィルタに対する解決方法]の実行に着目して説明する。
【0100】
図5に示すように、情報処理装置100は、演算部10および記憶部20を有する。
【0101】
演算部10は、例えばCPU(Central Processing Unit)やGPU(Graphics Processing Unit)等のプロセッサである。演算部10は、記憶部20に記憶されたプログラムを実行することによって、二自由度制御器における、フィードバック制御器及びフィードフォワード制御器のそれぞれの最適制御パラメータを算出する。
【0102】
記憶部20は、例えば、情報処理装置100を実現するコンピュータのBIOS(Basic Input Output System)等を格納するROM(Read Only Memory)と、情報処理装置100の作業領域として用いられるRAM(Random Access Memory)と、OS(Operating System)、アプリケーションプログラム、当該アプリケーションプログラムの実行時に参照される種々の情報等を格納する大容量記憶装置と、を含む。大容量記憶装置としては、例えば、HDD(Hard Disk Drive)またはSSD(Solid State Drive)等が挙げられる。
【0103】
演算部20は、上述の式(46)及び式(47)の演算を行うことにより、式(46)で示される第1の評価関数JTdチルダ(ρベクトル)を最小化させる制御パラメータρベクトルをフィードフォワード制御器Cの最適パラメータとして算出するとともに、式(47)で示される第2の評価関数JSd(ρベクトル)を最小化させる制御パラメータρベクトルをフィードバック制御器Cの最適パラメータとして算出する。
【0104】
このとき、演算部20は、式(46)及び式(47)から分かるように、第1及び第2の評価関数においてそれぞれ、遅れを含むプレフィルタを用いて、フィードフォワード制御器及びフィードバック制御器の最適パラメータを算出する。
【0105】
以上説明したように、本実施の形態の情報処理装置100によれば、目標値と制御対象の出力値との偏差に基づいて第1の操作量を算出するフィードバック制御器と、前記目標値に基づいて第2の操作量を算出するフィードフォワード制御器と、を有し、前記第1の操作量と前記第2の操作量とを加算して前記制御対象の操作量として、前記制御対象の出力値を前記目標値に一致させるように二自由度制御する二自由度制御器における、前記フィードバック制御器及び前記フィードフォワード制御器のそれぞれの最適制御パラメータを算出する情報処理装置であり、第1の評価関数を最小化させる制御パラメータを前記フィードフォワード制御器の最適パラメータとして算出するとともに、第2の評価関数を最小化させる制御パラメータを前記フィードバック制御器の最適パラメータとして算出する演算部10を有し、演算部10は、前記第1及び前記第2の評価関数においてそれぞれ、遅れを含むプレフィルタXΔ -1を用いて、前記フィードフォワード制御器及び前記フィードバック制御器の最適パラメータを算出する。
【0106】
これにより、初期パラメータに対する制限を緩和しても、プレフィルタの安定性の低下を抑制できる情報処理装置100を実現できる。
【0107】
なお、本開示は、上記実施の形態の説明に限定されず、その趣旨を逸脱しない範囲において種々の変形が可能である。
【産業上の利用可能性】
【0108】
本開示の情報処理装置は、二自由度制御系におけるフィードフォワード制御器およびフィードバック制御器の最適化に有用である。
【符号の説明】
【0109】
1 二自由度制御系
10 演算部
20 記憶部
100 情報処理装置
図1
図2
図3
図4
図5