(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-25
(45)【発行日】2022-12-05
(54)【発明の名称】最適制御装置、最適制御方法及びコンピュータプログラム
(51)【国際特許分類】
G05B 13/02 20060101AFI20221128BHJP
【FI】
G05B13/02 K
(21)【出願番号】P 2021522795
(86)(22)【出願日】2020-05-27
(86)【国際出願番号】 JP2020020816
(87)【国際公開番号】W WO2020241657
(87)【国際公開日】2020-12-03
【審査請求日】2021-07-13
(31)【優先権主張番号】P 2019100408
(32)【優先日】2019-05-29
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】598076591
【氏名又は名称】東芝インフラシステムズ株式会社
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(74)【代理人】
【識別番号】100108855
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100103034
【氏名又は名称】野河 信久
(74)【代理人】
【識別番号】100075672
【氏名又は名称】峰 隆司
(74)【代理人】
【識別番号】100153051
【氏名又は名称】河野 直樹
(74)【代理人】
【識別番号】100162570
【氏名又は名称】金子 早苗
(72)【発明者】
【氏名】山中 理
(72)【発明者】
【氏名】大西 祐太
(72)【発明者】
【氏名】平岡 由紀夫
【審査官】稲垣 浩司
(56)【参考文献】
【文献】特開2017-33104(JP,A)
【文献】特開2017-224176(JP,A)
【文献】特開2001-16775(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/02
(57)【特許請求の範囲】
【請求項1】
制御対象プロセスの制御量に基づく値であって前記制御対象プロセスの操作量に対して未知の評価関数によって表される値である評価量を、前記評価関数の最適値に近づけるように前記操作量を更新する極値制御を実行する最適制御装置であって、
前記評価量を示す信号に基づいて前記評価関数のヤコビアンの推定値
を算出するヤコビアン推定器と、
正則化後の前記ヤコビアンの推定値を積分することにより前記操作量を動かすべき方向及び量を決定する操作量決定部と、
前記評価量を示す信号に基づいて前記評価関数のヘシアンを推定する
ヘシアン推定器と、
前記評価関数のヘシアンの推定値に基づく値であって
、分母が0とならないように調整された正則化信号
を生成する正則化信号生成部と、
前記ヤコビアンの推定値の信号と前記正則化信号とを掛け合わせて前記ヤコビアンの推定値を正則化して前記操作量決定部に入力する正則化部と、を備える最適制御装置。
【請求項2】
前記正則化信号は、前記ヘシアンの推定値の絶対値のN乗値(N>0)に微小な正の定数δを加算した値のN乗根、又は前記ヘシアンの推定値の絶対値のM-1乗値(M≧1)を、前記ヘシアンの推定値の絶対値のM乗値に微小な正の定数δを加算した値で除した値によって表される信号である、請求項1に記載の最適制御装置。
【請求項3】
制御対象プロセスの制御量に基づく値であって前記制御対象プロセスの操作量に対して未知の評価関数によって表される値である評価量を、前記評価関数の最適値に近づけるように前記操作量を更新する極値制御を実行する最適制御装置であって、
前記評価量を示す信号に基づいて前記評価関数のヤコビアンを推定するヤコビアン推定器と、
正則化後の前記ヤコビアンの推定値を積分することにより前記操作量を動かすべき方向及び量を決定する操作量決定部と、
前記評価関数の前記ヤコビアンの推定値に基づく値であって、分母が0とならないように調整された正則化信号を生成する正則化信号生成部と、
前記ヤコビアンの推定値の信号と前記正則化信号とを掛け合わせて、前記ヤコビアンの推定値を正則化して前記操作量決定部に入力する正則化部と、を備える最適制御装置。
【請求項4】
前記正則化信号は、前記ヤコビアンの推定値の絶対値のN乗値(N>0)に微小な正の定数δを加算した値のN乗根、又は前記ヤコビアンの推定値の絶対値のM-1乗値(M≧1)を、前記ヤコビアンの推定値の絶対値のM乗値に微小な正の定数δを加算した値で除した値によって表される信号である、請求項
3に記載の最適制御装置。
【請求項5】
前記正則化信号は、前記ヤコビアンの推定値の絶対値によって表される信号である、請求項
3に記載の最適制御装置。
【請求項6】
前記正則化信号は、前記ヤコビアンの符号推定値を連続関数で近似した近似符号推定値によって表される信号である、請求項
3に記載の最適制御装置。
【請求項7】
前記操作量決定部によって決定された操作量をフィードバックして前記正則化信号に掛け合わせることにより、極値から離れた動作点ほどより大きく極値方向に動かすように前記操作量を補正する操作量補正部をさらに備える、請求項
4乃至
6のいずれか1項に記載の最適制御装置。
【請求項8】
制御対象プロセスの制御量に基づく値であって前記制御対象プロセスの操作量に対して未知の評価関数によって表される値である評価量を、前記評価関数の最適値に近づけるように前記操作量を更新する極値制御を実行する方法であって、
前記評価量を示す信号に基づいて前記評価関数のヤコビアンを推定するステップと、
前記評価量を示す信号に基づいて前記評価関数のヘシアンを推定するステップと、
前記評価関数のヘシアンの推定値に基づく値であって
、分母が0とならないように調整された正則化信号
を生成するステップと、
前記ヤコビアンの推定値の信号に前記正則化信号を掛け合わせて正則化するステップと、
正則化後の前記ヤコビアンの推定値を積分することにより前記操作量を動かすべき方向及び量を決定する操作量決定ステップと、
を有する最適制御方法。
【請求項9】
制御対象プロセスの制御量に基づく値であって前記制御対象プロセスの操作量に対して未知の評価関数によって表される値である評価量を、前記評価関数の最適値に近づけるように前記操作量を更新する極値制御を実行する最適制御装置として機能するコンピュータに、
前記評価量を示す信号に基づいて前記評価関数のヤコビアンを推定するステップと、
前記評価量を示す信号に基づいて前記評価関数のヘシアンを推定するステップと、
前記評価関数のヘシアンの推定値に基づく値であって
、分母が0とならないように調整された正則化信号
を生成するステップと、
前記ヤコビアンの推定値の信号に前記正則化信号を掛け合わせて正則化するステップと、
正則化後の前記ヤコビアンの推定値を積分することにより前記操作量を動かすべき方向及び量を決定する操作量決定ステップと、
を
コンピュータに実行させるためのコンピュータプログラム。
【請求項10】
制御対象プロセスの制御量に基づく値であって前記制御対象プロセスの操作量に対して未知の評価関数によって表される値である評価量を、前記評価関数の最適値に近づけるように前記操作量を更新する極値制御を実行する方法であって、
前記評価量を示す信号に基づいて前記評価関数のヤコビアンを推定するステップと、
前記評価関数のヤコビアンの推定値に基づく値であって、分母が0とならないように調整された正則化信号を生成するステップと、
前記ヤコビアンの推定値の信号に前記正則化信号を掛け合わせて正則化するステップと、
正則化後の前記ヤコビアンの推定値を積分することにより前記操作量を動かすべき方向及び量を決定する操作量決定ステップと、
を有する最適制御方法。
【請求項11】
制御対象プロセスの制御量に基づく値であって前記制御対象プロセスの操作量に対して未知の評価関数によって表される値である評価量を、前記評価関数の最適値に近づけるように前記操作量を更新する極値制御を実行する最適制御装置として機能するコンピュータに、
前記評価量を示す信号に基づいて前記評価関数のヤコビアンを推定するステップと、
前記評価関数のヤコビアンの推定値に基づく値であって、分母が0とならないように調整された正則化信号を生成するステップと、
前記ヤコビアンの推定値の信号に前記正則化信号を掛け合わせて正則化するステップと、
正則化後の前記ヤコビアンの推定値を積分することにより前記操作量を動かすべき方向及び量を決定する操作量決定ステップと、
をコンピュータに実行させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、最適制御装置、最適制御方法及びコンピュータプログラムに関する。
【背景技術】
【0002】
近年、プラント制御の方法として、極値制御と呼ばれる技術が注目されている。極値制御は、プラントの複雑なモデルを用いないモデルフリーのリアルタイム最適制御技術である。極値制御の概要は、操作量を強制的に変化させることにより、制御対象プロセスの制御量に基づく評価量が最適化される操作量を探索していくものである。このような極値制御をプラント制御に適用する場合、極値制御に係る各種のパラメータ(以下「極値制御パラメータ」という。)を制御対象プロセスの特性に応じて適切に設定する必要がある。従来、極値制御パラメータの設計に関する指針がいくつか示されているが、そのいずれも制御対象プロセスの時間的な変化(以下「ダイナミクス」という。)に適応して極値制御を安定的に動作させることができるまでには至っていない。
【先行技術文献】
【特許文献】
【0003】
【非特許文献】
【0004】
非特許文献1:D.Nesic et. al., ‘A Unifying Approach to Extremum Seeking: Adaptive Schemes Based on Estimation of Derivatives’, Proc. 49th IEEE Conference on Decision and Control, December 15-17, 2010)
非特許文献2:Yan et al, On the choice of dither in extremum seeking systems: A case study, Automatica, 44, pp.1446-1450 (2008)
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明が解決しようとする課題は、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることができる最適制御装置、最適制御方法及びコンピュータプログラムを提供することである。
【課題を解決するための手段】
【0006】
実施形態の最適制御装置は、制御対象プロセスの制御量に基づく値であって前記制御対象プロセスの操作量に対して未知の評価関数によって表される値である評価量を、前記評価関数の最適値に近づけるように前記操作量を更新する極値制御を実行する最適制御装置である。最適制御装置は、第1の勾配推定部と、操作量決定部と、第2の勾配推定部と、パラメータ調整部と、を持つ。第1の勾配推定部は、前記評価量を示す信号に基づいて前記評価関数のヤコビアンを推定する。操作量決定部は、前記ヤコビアンの推定値を積分することにより前記操作量を動かすべき方向及び量を決定する。第2の勾配推定部は、前記評価量を示す信号に基づいて前記評価関数のヘシアンを推定する。パラメータ調整部は、前記操作量決定部に入力される前記ヤコビアンの推定値を、前記評価関数のヤコビアン又はヘシアンの推定値に基づく値であって0とならないように調整された正則化信号で除することにより、前記操作量決定部の積分ゲインを前記評価関数の変化に応じて調整する。
【図面の簡単な説明】
【0007】
【
図1A】
図1Aは、第1の実施形態において、極値制御の基本的な概念を説明する図である。
【
図1B】
図1Bは、第1の実施形態において、極値制御の基本的な概念を説明する図である。
【
図1C】
図1Cは、第1の実施形態において、極値制御の基本的な概念を説明する図である。
【
図2】
図2は、第1の実施形態において、極値制御システムの基本的な構成例を示す図である。
【
図3】
図3は、第1の実施形態の極値制御システムの構成例を示す図である。
【
図4】
図4は、第1の実施形態における極値制御パラメータの調整方法の具体例を示す図である。
【
図5】
図5は、第1の実施形態における勾配推定器の第1の構成例を示す図である。
【
図6】
図6は、第1の実施形態における勾配推定器の第2の構成例を示す図である。
【
図7】
図7は、第1の実施形態において、第1の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
【
図8】
図8は、第1の実施形態において、第1の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
【
図9】
図9は、第1の実施形態において、第2の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
【
図10】
図10は、第1の実施形態において、第2の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
【
図11】
図11は、第1の実施形態において、第3の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
【
図12】
図12は、第1の実施形態において、第4の方法によって生成された正則化信号の一例について説明するための図である。
【
図13】
図13は、第1の実施形態において、第4の方法によって生成された正則化信号の他の例について説明するための図である。
【
図14A】
図14Aは、第1の実施形態において、正則化信号を用いることなく操作量の応答をシミュレーションした結果の一例を説明するための図である。
【
図14B】
図14Bは、第1の実施形態において、正則化信号として正則化信号勾配の符号信号を用いて操作量の応答をシミュレーションした結果の一例を説明するための図である。
【
図14C】
図14Cは、第1の実施形態において、第4の方法によって生成された正則化信号を用いたときの効果の一例を説明するための図である。
【
図14D】
図14Dは、第1の実施形態において、第4の方法によって生成された正則化信号を用いたときの効果の一例を説明するための図である。
【
図15】
図15は、第2の実施形態の極値制御システムの構成例を示す図である。
【
図16】
図16は、第2の実施形態において、第2の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
【
図17】
図17は、第2の実施形態において、第3の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
【
図18】
図18は、第1の実施形態又は第2の実施形態の極値制御システムの適用例を示す図である。
【実施形態】
【0008】
以下、実施形態の最適制御装置、最適制御方法及びコンピュータプログラムを、図面を参照して説明する。
【0009】
(第1の実施形態)[極値制御の概略]
図1A乃至
図1Cは、極値制御の基本的な概念を説明する図である。
極値制御は、操作量に対する評価量の変化を観測しながら、評価量を最適値に近づける方向に操作量を更新していく制御方法である。評価量は、制御対象となるプロセス(以下「制御対象プロセス」という。)の最適化の指標となる値であり、制御対象プロセスの制御量に基づいて決定される。例えば、評価量は制御量を変数とする所定の評価関数によって表される。評価量は、制御量に基づく値であればどのような評価基準に基づいて定義されてもよい。例えば、評価量は制御量そのものであってもよい。一般に、極値制御において、制御対象プロセスの評価関数は操作量に対して未知の関数であってよい。
【0010】
具体的には、極値制御では、操作量を示す信号にディザー信号を作用させることによって操作量を変化させる。ディザー信号は、値が周期的に変化する信号であり、通常は正弦波で与えられることが多い。極値制御では、ディザー信号によって操作量を継続的に振動させ、それによって生じる評価量の変化(増減)を観測する。そして、観測された評価量の変化に基づいて、評価関数の最適値(最大値又は最小値)に近づくように評価量を変化させる新たな操作量を算出し、算出した新たな操作量で現在の操作量を更新する。極値制御は、このような評価量の観測及び操作量の更新を繰り返すことによって評価関数の最適値を探索していく制御方法である。
【0011】
例えば、
図1Aは、操作量に対して未知の評価関数の一例として下に凸の二次関数を想定した評価関数曲線EVを示す。また、
図1Bは、制御対象プロセスの操作量をディザー信号で振動させた結果、評価量を示す信号がディザー信号とは逆位相で変化した場合(例えば操作量の増加に対して評価量が減少する)を示す。このような変化は、動作点が例えば評価関数曲線EVの極小点P10より左側の領域で変化する場合(例えば動作点P11から極小点P10に向かって変化する場合)に起こる。
【0012】
一方、
図1Cは、
図1Bと同様のディザー信号で制御対象プロセスの操作量を変化させた結果、評価量を示す信号がディザー信号と同位相で変化した場合(例えば操作量の増加に対して評価量も増加する)を示す。このような変化は、動作点が例えば評価関数曲線EVの極小点P10より右側の領域で変化する場合(例えば動作点P12から極小点P10に向かって変化する場合)に起こる。
【0013】
したがって、操作量を周期的に増減させた結果、評価量が操作量と同位相で増減する場合には操作量を減少させ、評価量が操作量と逆位相で増減する場合には操作量を増加させることによって、評価量を最適値に近づけることができる。従来、産業用プラントの制御方式として一般的に用いられてきたPID制御(Proportional-Integral-Derivative Control)は、制御量が予め設定された目標値に追従するように操作量を制御する目標値追従型の制御方式であった。これに対して、極値制御は、評価量を最適化する最適値探索型の制御方式であるため、PID制御のように制御対象プロセスについて操作量と制御量との関係性を表すプロセスモデルを予め作成しておく必要がない。このような性質を有する極値制御は、目標値を予め設定できないような制御対象プロセスについても有効に機能させることができるため今後広く普及する可能性を秘めている。その一方で、極値制御を実現する極値制御システムは、次の
図2に示すように比較的簡単な構成で実現することができる。
【0014】
図2は、極値制御システムの基本的な構成例を示す図である。
図2の極値制御システム9は、変調用ディザー信号出力部11、ハイパスフィルタ12(HPF:High-Pass Filter)、復調用ディザー信号出力部13、ローパスフィルタ14(LPF:Low-Pass Filter)、及び積分器15を備える。このように極値制御システム9の構成は、従来のPID制御コントローラと比較しても同程度の複雑さである。そのため、極値制御システム9は、PID制御コントローラと同様に、PLC(Programmable Logic Controller)等のハードウェアを用いて容易に実装可能である。以下、
図2の極値制御システム9の動作の概要について説明する。なお、ここでは、最適値として評価関数の極小値を探索する場合を例に説明する。
【0015】
まず、変調用ディザー信号出力部11は、ディザー信号を作用させることにより、制御対象プロセスの操作量に対して強制的な変化を与える。例えば、変調用ディザー信号出力部11は、正弦波等のディザー信号を作用させることにより、制御対象プロセスの操作量を周期的に変化させる。以下、この操作をモジュレーション(Modulation:変調)といい、モジュレーションに用いられるディザー信号を変調用ディザー信号という。このモジュレーションによる操作量の変化に応じて制御量が変化する。制御対象プロセスは、このように変化する制御量に基づいて評価量を取得し、取得した評価量を極値制御システム9にフィードバックする。
【0016】
一般に、制御量は操作量の変化に対してある程度の時間遅れを伴って変化することが多いため、制御量に基づいて取得される評価量も操作量の変化に対してある程度の時間遅れを伴って変化するものとなる。なお、制御量に基づいて評価量を取得する機能は、必ずしも制御対象プロセスに含まれる必要はない。例えば、評価量を取得する機能は、極値制御システム9に含まれてもよいし、制御対象プロセスと極値制御システム9との間に介在しうる他の装置によって実現されてもよい。
【0017】
極値制御システム9は、このようにフィードバックされる評価量に基づいて、評価量を評価関数の極値に近づけるように操作量を更新する。この場合、制御対象プロセスの評価関数が極小値を持つことが前提となるが、上述のとおり、評価関数は操作量に対して未知の関数であるため、その極値も操作量に対して未知である。そのため、極値制御システム9は、モジュレーションに応じて変化した評価量の変化の大きさ及び方向をフィードバックされる評価量の信号に基づいて観測し、観測された変化の大きさ及び方向に基づいて新たな操作量を決定する。
【0018】
具体的には、この新たな操作量の決定は、ハイパスフィルタ12、復調用ディザー信号出力部13、ローパスフィルタ14、及び積分器15が以下の各機能を有することによって実現される。
【0019】
ハイパスフィルタ12は、フィードバックされる評価量の信号から未知の極小値に応じた一定値のバイアスを除去する。この処理はすなわち、未知の極小値を常にゼロに調整するための処理であり、後述する積分器15が操作量を更新する方向(増加又は減少)を決定するための前処理である。
【0020】
復調用ディザー信号出力部13は、このように調整された評価量の信号に対して復調用のディザー信号を作用させることにより、操作量のモジュレーションに応じて変化した評価量から変調用ディザー信号と同じ周波数成分を抽出する。以下、この操作をデモジュレーション(Demodulation:復調)といい、デモジュレーションに用いられるディザー信号を復調用ディザー信号という。デモジュレーションの役割は以下のとおりである。
【0021】
操作量に対して未知の評価関数には非線形要素が含まれている場合がある。この場合、評価関数は下に凸(極大値探索の場合は上に凸)の非線形関数であると想定される。このような非線形要素に起因して、評価量には変調用ディザー信号の周波数ωに応じた高調波成分や分調波成分が現れる可能性が高いと考えられる。デモジュレーションは、このような高調波や分調波の影響を取り除くための処理である。このデモジュレーションにより、評価量の信号に含まれる成分のうち、評価量を変化させた変調用ディザー信号と同じ周波数ωの成分が抽出される。
【0022】
復調された評価量の信号は、ローパスフィルタ14に入力される。ローパスフィルタ14によって、評価量の信号から定常成分(低周波成分)が抽出される。具体的には、定常成分は、評価関数の一階微分値(以下「ヤコビアン」という。)を示し、モジュレーションによる評価量の変化の方向(増加又は減少)を表すと考えられる。
【0023】
積分器15は、ローパスフィルタ14によって抽出された定常成分を積分する。積分器15は、定常成分の積分値に基づいて、評価量を極小値に近づけるために動かすべき操作量の方向(以下「探索方向」という。)を推定する推定器として機能する。このようにして探索方向を推定する方法は一般に勾配法と呼ばれ、適応制御系において探索方向を推定する基本的な方法の1つである。
【0024】
具体的には、積分器15は、定常成分の積分値に基づいて評価関数の勾配を推定し、推定した勾配の値に基づいて操作量の探索方向、及び探索方向に動かす操作量の大きさ(操作量を動かす量)を調整する。このように調整された操作量は、変調用ディザー信号によって変調されて制御対象プロセスに入力される。
【0025】
なお、ここでは、極値制御システム9が極小値を探索する場合を想定して、その構成を説明したが、極値制御システム9により極大値を探索する場合には、積分器15が推定する勾配の符号を反転させればよい。また、一般に、積分器はローパス特性を有するため、積分器15が十分なローパス特性を有する場合には、極値制御システム9は必ずしもローパスフィルタ14を備える必要はない。
【0026】
このような構成により実現される極値制御システム9は、従来のプロセス制御において一般的であったPID制御システムと比較しても同程度の複雑さであるため、PID制御システムと同様にPLC(Programmable Logic Controller)等のハードウェアを用いて容易に実装可能である。
【0027】
以上、極値制御システムの基本的な構成について説明したが、このような従来の極値制御システムには、必ずしも制御対象プロセスのダイナミクスに適応した極値制御を実現することができないという課題があった。そこで以下では、このような課題を解決することができる実施形態の極値制御システムの構成について詳細に説明する。
【0028】
[実施形態の詳細]
図3は、第1の実施形態の極値制御システム1の構成例を示す図である。
図3に示すプラントPは制御対象プロセスを実現する手段の一例であり、例えば、生物学的排水処理プロセスを実現する水処理プラントである。プラントPは、制御対象プロセスを実現する各種のプロセス機器を備え、極値制御システム1から入力する操作量に基づいてプロセス機器を動作させる。また、プラントPは、制御対象プロセスの制御量を計測する各種の計測機器を含み、その計測値を示す情報(以下「計測情報」という。)を極値制御システム1に出力する。極値制御システム1は、プラントPから取得される計測情報に基づいて、制御対象プロセスの評価量を最適値に近づける方向(探索方向)に操作量を更新していく。
【0029】
このような極値制御の基本的な動作は、実施形態の極値制御システム1が、従来構成の極値制御システム9と同様の変調用ディザー信号出力部11、ハイパスフィルタ12、復調用ディザー信号出力部13、ローパスフィルタ14、積分器15を備えることによって実現される。その一方で、実施形態の極値制御システム1は、評価量信号に基づいて極値制御パラメータを調整するパラメータ調整部2を備える点で従来構成の極値制御システム9と異なる。
【0030】
例えば、極値制御システム1は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、極値制御プログラムを実行する。極値制御システム1は、極値制御プログラムの実行によって上記の各機能部を備える装置又はシステムとして機能する。なお、極値制御システム1の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。プログラムは、電気通信回線を介して送信されてもよい。
【0031】
パラメータ調整部2は、制御対象プロセスのダイナミクスに対して適応的に極値制御パラメータを調整する機能を有する。具体的には、パラメータ調整部2は、ダイナミクスにより時々刻々と変化する評価関数の勾配推定値に基づいて積分器15の積分ゲインを適応的に調整する。
【0032】
図4は、第1の実施形態における極値制御パラメータの調整方法の具体例を示す図である。具体的には、
図4は、特許文献1に記載の調整方法を引用したものである。
図4のNo.5に記載のとおり、本実施形態におけるパラメータ調整部2は、制御対象プロセスからフィードバックされる評価量に基づいて評価関数の二階微分値(以下「ヘシアン」という。)を推定し、推定したヘシアンの値を用いて新たな積分ゲインを決定する。このような積分ゲインの調整のため、パラメータ調整部2は、第1乗算器21、勾配推定部22、正則化信号出力部23、及び第2乗算器24を備える。
【0033】
第1乗算器21は、ハイパスフィルタ12から入力する評価量信号にディザー信号(の二乗信号)を乗算して勾配推定部22に出力する。勾配推定部22は、第1乗算器21の出力信号からヘシアン信号H(t)を抽出して正則化信号出力部23に出力する。この場合、例えば勾配推定部22は、非特許文献1に記載されている方法を用いて評価関数の0階以上の微分値を推定することができる。すなわち、勾配推定部22は、評価関数のヘシアンを推定するヘシアン推定器として機能し得る。具体的には、非特許文献1には、ローパスフィルタを用いて評価関数の0階以上の微分値を推定する構成が記載されており、その基本的な考え方は以下のとおりである。
【0034】
一般に、操作量には高調波成分や分調波成分が含まれる場合があるが、ディザー信号が正弦波で与えられる場合、変調後の操作量も概ねディザー信号と同じ周波数で正弦波状に変化する。そこで、操作量UがU(t)=U0+a×sinωtという正弦波状に変化すると仮定し、その操作量に応じて変化する評価量が式(1)に示す評価関数Jで表されると仮定する。
【0035】
【0036】
式(1)は、評価量J(t)を操作量U(t)についての(未知の)関数として定義するものである。プラントのダイナミクスを考慮すれば、正確にはfは関数ではなく動的システムの作用素(オペレータ)とされるべきであるが、ディザー信号の周波数ωがプラントのダイナミクスに対して十分に緩やかな変化をもたらす場合にはfを近似的に関数とみなすことができる。本実施形態では、このような前提のもとでfを関数とみなす。式(1)をテーラー展開することにより式(2)が得られる。
【0037】
【0038】
ここで、D
k
f(kは1以上の整数)は、関数fのUに関するk階微分を意味する。この式(2)にsin
n
ωt(nは1以上の整数)をかけることにより式(3)が得られる。さらに、式(3)に対して周期平均処理を施す(又は時間積分する)と、正弦波の直交性によりsin
n
ωtに関する成分のみが残り、式(4)が得られる。
【0039】
【0040】
【0041】
ここで、ディザー信号の振幅aと冪数nが定数であることから、n階微分D
n
fの値が1制御周期で大きく変化しないと仮定すれば、式(4)は式(5)及び(6)のように表すことができる。そして、式(5)から逆算することによって、n階微分D
n
fを表す式(7)を得ることができる。
【0042】
【0043】
【0044】
【0045】
図5及び
図6は、式(7)で表される勾配推定器の構成例を示す図である。
具体的には、
図5はヤコビアン推定器の構成例(すなわちn=1の場合)を示し、ディザー信号sinωtを作用させた評価量信号J(t)をローパスフィルタで処理した後に2/a倍することによって評価関数のヤコビアンを得る構成を表している。なお、この構成は、積分ゲインKIを有する積分器15に対して新たな積分ゲインKImod=KI×(a/2)を定義したことに相当するため、
図2に示した従来の基本的な極値制御システムは、ローパスフィルタ14によって評価関数のヤコビアンを推定する構成であるとみなすことができる。
【0046】
一方
図6はヘシアン推定器の構成例(すなわちn=2の場合)を示し、ディザー信号の二乗信号sin
2ωtを作用させた評価量信号J(t)をローパスフィルタで処理した後に16倍した第1の信号から、評価量信号J(t)をローパスフィルタで処理して8倍した第2の信号を減算して1/a
2
倍することによって評価関数のヘシアンを得る構成を表している。
【0047】
なお、パラメータ調整部2は、このような方法で推定した評価関数のヘシアンをそのまま用いて積分ゲインを調整することもできるが、その場合、後述する理由により極値制御が不安定化する可能性がある。そこで、本実施形態の極値制御システム1では、ローパスフィルタ14によって推定されたヤコビアンをヘシアンの推定値に基づいて正則化し、正則化後のヤコビアン信号を積分器15に供給する。これにより、本実施形態の極値制御システム1は、極値制御の不安定化を回避しつつ、積分ゲインを適応的に更新することが可能となる。
【0048】
具体的には、正則化信号出力部23が、勾配推定部22の出力するヤコビアン信号を正則化(Regularization)する信号(以下「正則化信号」という。)を生成して第2乗算器24に出力する。第2乗算器24は、ローパスフィルタ14からヤコビアン信号G(t)を、正則化信号出力部23から正則化信号を、それぞれ入力し、ヤコビアン信号に正則化信号を掛け合わせることによりヤコビアン信号を正則化する。第2乗算器24は、正則化後のヤコビアン信号Gn(t)を積分器15に供給する。
【0049】
[正則化信号を生成する第1の方法]
一般に信号の「正則化」とは、対象の信号に対して何らかの逆算を行おうとした場合に、逆が存在せず、逆算ができなくなるといった悪条件(ill-condition)を回避することを意味する。例えば、このような悪条件の一例として、割り算における「ゼロ割り」などが挙げられる。
【0050】
一方で、
図4に示したとおり、本実施形態の極値制御システム1は評価関数のヘシアンを用いて積分器15の積分ゲインを適応的に更新していくものであるが、これは各制御周期の積分ゲインを、評価関数のヤコビアンをヘシアンで割る(正規化する)ことによって得られる一定値に固定して極値制御を実行することと等価的に置き換えることができる。すなわち、本実施形態における極値制御システム1の構成は、
図2に示した基本的な構成に対して、ヤコビアンをヘシアンで正規化する構成を付加したものとみなすことができる。
【0051】
そこで、本実施形態では、ヤコビアン信号の「正規化(Normalization)」において「ゼロ割り」等の悪条件を回避することを「正則化」と定義し、ヤコビアン信号に作用してこのような正則化を実現する信号を正則化信号として生成する。具体的には、正則化信号出力部23は、以下の各条件を満たす信号変換(⇔)を実現する信号を正則化信号として生成する。
【0052】
[条件1]G(t)=0 ⇔ Gn(t)=0
[条件2]G(t)が正(負) ⇔ Gn(t)が正(負)
[条件3]G(t)<∞ ⇔ Gn(t)<∞
[条件4]G(t)→∞ ⇔ Gn(t)→k (0<k<∞)
【0053】
G(t)はヤコビアン信号を表し、Gn(t)は正則化信号の作用によって正則化された(すなわちヘシアンで割り算された)ヤコビアン信号を表す。[条件1]はG(t)が0のときに限りGn(t)も0となるという条件を表している。[条件2]はG(t)とGn(t)の符号は同じであるという条件を表している。[条件3]はG(t)が有限のときはGn(t)も有限となる(すなわちゼロ割りが起こらない)という条件を表している。[条件4]はG(t)が∞に発散したときにはGn(t)は∞に発散せず、ある正の有限値に収束するという条件を表している。このような性質を有する正則化信号は、例えば式(8)で表される。
【0054】
【0055】
式(8)におけるδは正の定数(δ>0)であり、いわゆる正則化定数を表す。H(t)は推定された評価関数のヘシアンを表す。式(8)によって表される正則化信号は、ヘシアン信号に正則化定数δを加える処理と、ヘシアン信号の絶対値をとる処理とによって生成することができるため、装置の大型化を抑制しつつ極値制御の安定性を向上させることができる。
【0056】
例えば、極値制御によって最小値(極小値)を探索する場合、極値近傍でヘシアンが正の値をとる下に凸なM次(M>1)の評価関数や、極値近傍でヘシアンが負の値となる上に凸なM次(0<M<1)の評価関数についても安定して極値を探索することが可能になる。
【0057】
なお、ヘシアンを用いて生成される正則化信号は、必ずしも式(8)のようなヘシアンの一乗関数によって表されるものである必要は無い。例えば、正則化信号は式(9)や式(10)のようなヘシアンの二乗関数によって表されるものであってもよいし、式(11)や式(12)のようなヘシアンのM乗(M=1,2,3,…)関数によって表されるものであってもよい。
【0058】
【0059】
【0060】
【0061】
【0062】
図7及び
図8は、第1の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。具体的には、
図7は、式(8)で表される正則化信号によって正則化されたヤコビアン信号Gn(t)を積分器15に入力する構成例を示す。また、
図8は、式(9)で表される正則化信号によって正則化されたヤコビアン信号Gn(t)を積分器15に入力する構成例を示す。
【0063】
[正則化信号を生成する第2の方法]
第1の方法では、正則化信号の生成にヘシアン信号を用いるため、評価関数のヘシアンを推定する何らかの機構が必要となる。例えば、
図7及び
図8に示した極値制御システム1においては、評価量の信号からヘシアン信号を生成するための第1乗算器21及び勾配推定部22(例えばローパスフィルタ)が必要となる。これに対して、第2の方法は、ヘシアンの推定値に代えてヤコビアンの推定値を用いることで、第1乗算器21及び勾配推定部22を備えずに正則化信号を生成する方法である。例えば、第2の方法によって生成される正則化信号は式(13)で表される。
【0064】
【0065】
ここでG(t)は、勾配推定部22によって推定された評価関数のヤコビアン、又はヤコビアンに比例する量を表す。なお、第2の方法で生成される正則化信号は、必ずしもヤコビアンの一乗関数で表されるものである必要はない。例えば、第2の方法で生成される正則化信号は、第1の方法と同様に、ヤコビアンのM乗(M=1,2,3,…)関数によって表されるものであってもよい(例えば式(14)及び(15))。
【0066】
【0067】
【0068】
図9及び
図10は、第2の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。具体的には、
図9は、式(13)で表される正則化信号によって正則化されたヤコビアン信号Gn(t)を積分器15に入力する構成例を示す。また、
図10は、式(14)で表される正則化信号(M=2の場合)によって正則化されたヤコビアン信号Gn(t)を積分器15に入力する構成例を示す。このような第2の方法によれば、ヤコビアン信号の正則化のために極値制御システムの構成が複雑化することを抑制することができる。
【0069】
[正則化信号を生成する第3の方法]
第3の方法は、式(13)~(15)においてδ=0とすることにより第2の方法をより簡略化した方法である。この場合、第3の方法によって生成される正則化信号は式(16)で表される。
【0070】
【0071】
第1及び第2の方法においてδ(>0)はゼロ割りを回避するように働くため、このδを0とすると、G(t)=0のときにRSが無限大に発散してしまい、正則化後のヤコビアン信号Gn(t)も同様に発散してしまう。このような信号は、そもそも正則化信号としての条件1~4を満たしていないため、本来は正則化信号として用いるべきものではないが、ヤコビアン信号の正則化を式(17)のように定義する場合には正則化信号として用いることができる。
【0072】
【0073】
式(17)は、ヤコビアン信号を式(16)の正則化信号RSで割ることをヤコビアン信号の正則化と定義することを表している。これは、ヤコビアン信号をヤコビアン信号の絶対値で割る操作であるから、式(17)におけるGn(t)は-1又は+1のいずれかの値をとる。すなわち、第3の方法によって生成される正則化信号とは、ヤコビアン信号に作用してその符号情報(-1又は+1)を抽出する信号であると言える。このため、式(17)に定義した正則化を行う場合には、式(16)によって表される信号は原理的には正則化信号として機能する。
【0074】
なお、このような正則化の目的が符号情報を抽出することであることからすれば、ヤコビアン信号の符号情報を抽出することができれば、実際にG(t)をその絶対値|G(t)|で割り算する処理は必ずしも必要ない。そのため、この場合の正則化信号出力部23は、sgn(G(t))を直接的に計算するように構成されてもよい。また、このような構成にすることによりゼロ割りの発生を回避することができる。ここでsgn(x)は値xの符号を返す関数を表している。
【0075】
図11は、第1の実施形態において、第3の方法によって正則化信号を生成する極値制御システムの構成例を示す図である。
このように抽出される符号情報は、単純に操作量を動かすべき方向(増加又は減少)のみを示す信号となる。そのため、このような正則化の構成を備えることにより、例えば
図11に示すような簡易な極値制御システムを構成することが可能になる。なお、この場合、各制御周期において操作量を変化させる量は一定値となるため、sgn(G(t))に係数を乗じるなどして、その変化量が所望量となるように調整してもよい。
【0076】
なお、式(13)だけでなく、式(14)や式(15)においてもδ=0とすることで式(16)が得られることからすれば、式(13)~(15)はδ>0をパラメータとして式(16)の作用を調整するものと考えることができる。実際、sgn()による正則化では操作量を動かすべき方向のみが与えられるため、パラメータが十分適切に調整されていない場合には極値近傍でチャタリングを生じる可能性がある。この場合、式(16)をδ>0によって調整した式(13)~(15)を用いて生成した正則化信号は、極値近傍でのチャタリングを抑制するようにヤコビアン信号に作用すると考えられる。
【0077】
第2乗算器24は、このようにして生成される正則化信号を乗じることによりヤコビアン信号G(t)を正則化し、正則化後のヤコビアン信号Gn(t)を積分器15に出力する。このようなパラメータ調整部2によるヤコビアン信号の正則化は式(18)によって表される。
【0078】
【0079】
パラメータ調整部2は、このようにして正則化されたヤコビアン信号を用いて積分器15の積分ゲインを適応的に更新する。一般に、極値制御において操作量を動かすべき方向は、操作量に対して未知である評価関数について推定された勾配(ヤコビアン)の符号によって表され、その動かす量は積分ゲインによって調整される。ここでは、非特許文献2などに記載されているアベレージシステム(平均システム)の考え方に基づいて積分ゲインを調整する方法について説明する。
【0080】
アベレージシステムとは、あるシステムに周期的な入力が加えられたときに、その周期平均(アベレージ)をとったシステムの動的な挙動を表すシステムである。一般に、アベレージシステムは極値制御システムの安定性解析などにおいて用いられる。例えば、非特許文献2には、ダイナミクスを持たないスタティックなプラントの極値制御システムについて、そのアベレージシステムのダイナミクスが具体的に記載されている。そのアベレージシステムは式(19)及び(20)で表される。
【0081】
【0082】
【0083】
式(19)においてG(u)は操作量uに対して未知である評価関数のヤコビアンの推定値を表す。aはディザー信号の振幅を表す。Pはディザー信号のパワーを表し、正弦波をディザー信号とする場合にはP=1/2であり、三角波をディザー信号とする場合にはP=1/3であり、矩形波をディザー信号とする場合にはP=1である。τは実時間tをディザー信号の周波数ωでスケール変換した時間(τ=ωt)を表し、KI
0
はτの時間軸上における積分ゲインを表す。KI
0
は式(20)によって実時間tの時間軸上における積分ゲインKIに変換される。
【0084】
さらに式(19)について、操作量uの平衡点をu
*
として周期平均u~=u-u
*
をとることにより式(21)が得られる。『u~』は『u』の真上に『~』を冠した記号を意味している。
【0085】
【0086】
式(19)及び(21)によって表されるアベレージシステムは、ディザー信号による操作量の振動に応じて、評価量がどのような速度で最小値(極小値)に収束していくかという極値制御における収束のダイナミクスを表現したものである。非特許文献2では、制御対象プロセスがスタティックである場合を仮定しているが、ディザー信号の周期がプラントの時定数よりも十分に長く設定されている。これはすなわちディザー信号の周波数ωが制御対象プロセスのカットオフ周波数よりも十分に小さく設定されている場合には、ダイナミクスを持つ制御対象プロセスを近似的にスタティックな制御対象プロセスとみなすことができるということである。これは、極値制御の安定性解析で用いられる特異摂動論によっても裏付けられる。
【0087】
また、
図2のようにハイパスフィルタやローパスフィルタを備えて構成される基本的な構成の極値制御システムの場合であっても、これらのフィルタのカットオフ周波数が適切に設定され、支配的なダイナミクス(最も遅いダイナミクス)が積分器15(積分器)となる場合には、式(19)に示すアベレージシステムで極値制御システムの全体の挙動を特徴づけることができる。そのため、このような場合には式(19)を用いて積分ゲインを調整することができる。
【0088】
式(19)における評価関数のヤコビアンG(u)はuに関する非線形関数となることが多いため、一般に式(19)は非線形微分方程式となる。ここで、式(19)のuに関して適当な動作点u
0
の周辺で線形化したアベレージシステムは式(22)で表すことができる。
【0089】
【0090】
ここで、『u^』は『u』の真上に『^』を冠した記号を意味している。u^=u-u
0
であり、H(u
0
)はG(u)のヤコビアンを表す。すなわちH(u
0
)は評価関数のヘシアンである。そのため、本実施形態では積分ゲインKI
0
をH(u
0
)の逆数に比例するように適応的に調整することで極値制御の収束速度を調整する。このような積分ゲインの調整において、第1の方法によって生成される正則化信号(式(8)~(12)参照)は、ヘシアンの推定値によるゼロ割りを回避するとともに、急激な符号変化を抑制するように作用する。
【0091】
これに加えて第1の方法による正則化信号は、時間とともに変動するヘシアンの推定値を積分ゲインの算出式から追い出し、新たな信号として定義している。このようにして積分ゲインを可変とする要因を算出式から追い出すことにより、算出式から1/H(u
0
)の項が除かれることになり、積分ゲインKI
0
を固定値として調整することができる。また、正則化信号の定義式に含まれる微小定数δ(>0)は、ヘシアンによるゼロ割りを回避するためものであり、ヘシアンの推定値が0になった場合にKI
0
が最大値(定数項の1/δ倍)をとる。そのため、KI
0
について想定する最大値に基づいてδを決定することにより積分ゲインの調整が可能になる。
【0092】
式(22)は式(19)の非線形方程式を線形近似したものであるが、式(19)の非線形要素であるG(u)の影響を抑制する方法として、G(u)を消去するというより直接的な方法が考えられる。上述の第2及び第3の方法は、このような考え方に沿った正則化信号を生成する方法である。式(19)における積分ゲインKI
0
は調整対象のパラメータであり、設計者が決定することのできるものであるから、これを式(19)の微分方程式を変形する一種の操作量とみなし、式(23)を満たすような積分ゲインKI
0
’を新たに定義することにより、式(19)における非線形要素を消去することができる。
【0093】
【0094】
しかしながら式(23)を適用するとヤコビアンに関する情報が式(19)に含まれなくなるため、操作量を動かすべき方向を決定するために必要な情報が失われてしまうことになる。そこで、式(23)に代えて、式(24)のようにヤコビアンの絶対値をとることにより、式(19)にヤコビアンの符号情報を残すことができる。この場合、式(19)は式(25)のように表される。
【0095】
【0096】
【0097】
このようにすると、操作量の探索方向の決定に必要な情報を残しつつ、ヤコビアンの非線形性を消去することができる。すなわち第3の方法による正則化信号は、ヤコビアンの非線形性を積分ゲインの算出式から追い出すための信号であるということができる。式(25)にはヤコビアンの符号情報のみが含まれるため新たな積分ゲインKI
0
'の調整は簡単になる。なお、KI
0
’の調整は、式(25)に基づく極値制御の過渡的な挙動が直線的になることを踏まえ、
図5に示した調整方法を参考に行えば良い。
【0098】
第3の方法に係る正則化は、非常に簡単に表される一方で、ヤコビアンについては符号情報のみを含むため極値近傍においてチャタリングが起こる可能性がある。第2の方法に係る正則化は、このチャタリングを回避するために、第3の方法に微少定数δ>0を導入したものと考えることができる。この場合、積分ゲインを式(26)のように変換すると考えると、式(25)に相当するアベレージシステムは式(27)で表される。
【0099】
【0100】
【0101】
式(27)のアベレージシステムは、ヤコビアンの値が大きいときにはδの影響が小さくなるため、式(25)のアベレージシステムと同様の動きをする。一方で、ヤコビアンの値が小さいときにはδの影響が大きくなるため、式(27)のアベレージシステムはヤコビアンに比例するような動きをすることになる。そのため、第2の方法に係る正則化においても、極値近傍におけるチャタリングの防止のためにδを設定するだけで、基本的には式(25)と同様の考え方で積分ゲインKI
0
’を調整することができる。
【0102】
[正則化信号を生成する第4の方法]
第4の方法による正則化信号は、ヤコビアン信号の符号推定値を連続関数で近似した近似符号推定値によって表される信号である。
第4の方法により生成された正則化信号によりヤコビアン信号を正則化すると、第3の方法による正則化信号により正則化後のヤコビアン信号(符号信号)を滑らかな連続関数で近似したものであって、第2の方法による正則化信号により正則化後のヤコビアン信号を一般化したものに相当する信号となる。
【0103】
第2の方法においてδ=0としたものが第3の方法による正則化信号である。換言すると、第3の方法において微小定数δ>0を導入したものが第2の方法による正則化信号である。しかし、第3の方法による正則化信号である符号関数を近似しながら、先述の正則化信号の条件1-4を満たす近似関数は第2の方法による正則化信号に限定されない。
【0104】
例えば、符号関数を連続関数、あるいは、滑らかな連続関数で近似するものであれば、条件1-4の正則化信号の定義を満たす。このような符号関数の(滑らかな)近似関数は多数存在するが、上記の第2の方法による正則化信号による近似関数に限らず、例えば、以下の様な近似関数が考えられる。
【0105】
A.飽和関数
【数28】
ここで、m(G(t))は、m(0)=0を満たすG(t)の厳密な単調増加関数であり、典型的な例としては、-sgn(G(t))/α・|G(t)|
ρ,α>0,ρ>0の様なG(t)のべき乗関数であり、例えばρ=1の場合は、勾配G(t)を±1で打ち切ったものに相当する。
【0106】
B.シグモイド関数(ハイパボリックタンジェント)
【数29】
C.アークタンジェント
【数30】
【0107】
上記A-Cの例の他、広義のシグモイド関数に含まれる、累積正規分布関数、ゴンペルツ関数、グーデルマン関数などを原点が中心になる様に平行移動し、値域が±1に適当にスケール変換した関数なども含まれる。あるいは、安定でオーバーシュートや振動が生じない伝達関数(例:高次遅れ系)のステップ応答(例:1次遅れ系の場合1-exp(t))の時間tをG(t)に置換(例:1次遅れ系の場合1-exp(G(t)))して、原点を中心に点対称になる様に折り返して接合した関数(例:1次遅れ系の場合sgn(G(t))(1-exp(|G(t)|))なども符号関数の滑らかな近似関数として機能するので、正則化信号として利用することができる。
【0108】
図12は、第1の実施形態において、第4の方法によって生成された正則化信号の一例について説明するための図である。
図12は、勾配(ヤコビアン信号)G(t)と正則化後のヤコビアン信号Gn(t)との関係を図示したものであるが、G(t)=Gn(t)=0の原点が極値探索の極値に対応する。
【0109】
第3の方法による正則化後のヤコビアン信号(符号関数)を連続関数で近似するということは、極値近傍での正則化信号の挙動を調整していることに相当する。すなわち、単純に勾配を±1で打ち切った飽和関数を適用すると、極値近傍において従来の勾配型の極値制御をそのまま適用することとなる。なお、従来の極値制御は、評価関数がちょうど(操作量に関して)2次関数であるときにこれを微分した勾配が1次関数(線形関数)となる。このとき、勾配法を適用すると、ちょうど極値近傍で線形システムの収束特性(=指数関数的な収束)を持つ。このような収束は一般に好ましいと考えられる。
【0110】
そこで、もし評価関数の勾配の形状がG(t)∝u
nの様に操作量uのべき乗に比例している(評価関数はu
(n+1)に比例する)とすると、Gn(t)=G(t)
(1/n)とすると、Gn(t)∝uとなるので、極値近傍において指数関数的に収束させることができる。実際には、極値近傍での評価関数形状は未知であるため、nを理論的に求めることはできないが、極値近傍の挙動を確認しながら、符号関数の近似関数の選択やそのパラメータを調整することで、極値近傍の挙動のファインチューニングが可能になる。
例えば、
図12に示すように、シグモイド関数においてαの値を変えると、正則化信号Gn(t)の絶対値が1よりも小さな値になるときのG(t)の値が変化するため、極値の「近傍」の範囲A自身を調整することが可能になる。
【0111】
図13は、第1の実施形態において、第4の方法によって生成された正則化信号の他の例について説明するための図である。
図13も
図12と同様に、ヤコビアン信号G(t)と正則化後のヤコビアン信号Gn(t)との関係を図示したものであるが、G(t)=Gn(t)=0の原点が極値探索の極値に対応する。
【0112】
例えば、
図13に示すように、極値近傍Bにおいて、上に凸な形状の連続関数と下に凸な形状の連続関数とを切り替えると、極値近傍でチャタリングを生じる状況を抑制したり、極値探索制御で極値に収束せずにその付近で止まってしまう現象を改善させたりすることができる。
【0113】
上に凸な形状(例えばシグモイド関数にてα=3)の正則化後のヤコビアン信号Gn(t)を選ぶと、Gn(t)は純粋な符号関数に近くなっていくので、収束値が極値に到達しない場合にこのような形状の関数を選択することで、真の極値に近い探索が可能となる。ただし、上に凸の傾向が強すぎる(符号化関数に近づけすぎる)とチャタリングを起こす場合があることに留意すべきである。
一方、下に凸な形状(例えば飽和関数にてα=10,ρ=1.5)の正則化信号Gn(t)を選ぶと、極値近傍でチャタリングを起こしている様な場合に、それを抑制する効果が認められる。下に凸の傾向が弱くなると、極値の探索性能が劣化することに留意すべきである。
【0114】
図14Aは、第1の実施形態において、正則化信号を用いることなく操作量の応答をシミュレーションした結果の一例を説明するための図である。ここでは、1次遅れ系にy=u
5という関数を付加した仮想的な制御対象に対して、様々な正則化信号を適用した場合の操作量の応答をシミュレーションした結果を例示している。
図14Aに示す例は、正則化信号を適用しなかった比較例であり、初期値が2の場合にうまく動作する様に調整している。この時、初期値を3に変更すると極値制御は発散してしまう。これは、y=u
5の一次微分はy´=5u
4であり、初期値が2のときにy´=5・2
4
=
80であるのに対し、初期値が3のときにはy´=5・3
4
=
405となり、勾配が大きく変化してしまうためである。
【0115】
また、初期値を2とした場合でも、操作量は、所定時間以内に極値(=1)が極値に収束することがなかった。これは、uが0に近くなるとy´が急速に0に近くなるためである。すなわち、仮想的な制御対象において、極値の付近はほぼ勾配がフラットになるためである。
【0116】
図14Bは、第1の実施形態において、正則化信号として勾配の符号信号を用いて操作量の応答をシミュレーションした結果の一例を説明するための図である。
図14Aに示す比較例に対し、
図14B-14Dに示した例は正則化信号を適用したものである。
図14Bに示した例は、第3の方法による正則化信号である符号関数を適用した場合である。この時、初期値が2でも3でも同じような収束速度で極値の探索が可能になっているが、極値である1付近でチャタリングを起こしている。これは、符号関数が最も強い不連続なスイッチング関数になっているためである。
【0117】
図14Cおよび14Dは、第1の実施形態において、第4の方法によって生成された正則化信号を用いたときの効果の一例を説明するための図である。
図14Cに示した例は、符号関数の連続近似関数として第4の方法のAに示した飽和関数(ρ=1)を適用したものである。
図14Bと同様に初期値に関わらず同じような収束速度で極値の探索が可能になるが、
図14Aと同じように所定時間以内に極値に到達していない。これは、極値近傍で勾配そのものを用いているため、極値近傍では
図14Aと同じ現象が生じるためである。
【0118】
図14Dに示した例は、符号関数の連続近似関数として例えば、第4の方法のAに示した-sgn(G(t))/α・|G(t)|
ρ,α>0,ρ>0の,ρ≠1様なG(t)のべき乗関数である飽和関数を適用したものであって、α=1,ρ=1/5としたものである。この例では、初期値によらず極値の探索が可能であり、チャタリングを抑制できた。この例のように、符号関数を近似する連続関数をうまく利用することにより、極値探索制御の応答を調整することが可能である。
【0119】
第4の方法により生成された正則化信号を用いた極値制御システムは、例えば
図11に示す構成例において、符号関数sgn()をG(t)による近似関数(一例として、上述の関数A-C)とすることにより、実現することが出来る。
また、第4の方法により生成された正則化信号を用いた極値制御システムは、例えば
図9及び
図10に示す構成例において、正則化信号出力部23にて、近似関数に対応する演算を行うことにより、実現することが出来る。すなわち、正則化信号出力部23の出力が、正則化後のヤコビアン信号をG(t)で除した値となるように、正則化信号出力部23での演算式を設定しておけばよい。
【0120】
上記第4の方法によれば、正則化関数は第3の方法によるものに限定されず、連続近似関数の選択やその関数が持つパラメータを調整することにより、探索された極値近傍での挙動を容易に調整することが可能になり、よりきめ細やかな極値探索制御を実現できる。
【0121】
以上説明したように、正則化信号出力部23が生成する正則化信号は、操作量を動かすべき方向及び量を与えるアベレージシステムから評価関数の非線形要素による複雑な挙動を追い出す役割を持ち、パラメータ調整部2は、このような性質を有する正則化信号を用いて勾配推定部22の出力するヤコビアン信号を正則化する。そして、積分器15が、調整された積分ゲインを用いて正則化されたヤコビアンを積分することにより、極値制御の探索方向をより適切に制御することが可能となる。
【0122】
このように構成された第1の実施形態の極値制御システム1は、ヤコビアン信号を正則化し、正則化したヤコビアン信号に基づいて積分ゲインを適応的に調整するパラメータ調整部を備えることにより、制御対象プロセスの極値制御を、そのダイナミクスに適応してより安定的に動作させることが可能となる。
【0123】
具体的には、第1の実施形態の極値制御システム1は、ヤコビアン信号の正則化によって以下の(1)及び(2)を実現することにより、極値制御の安定性を損なうことなく積分ゲインを容易に調整することを可能とする。(1)積分ゲインの算出時におけるゼロ割りを回避する。(2)ヤコビアン信号の符号情報を維持する(急激な符号の反転を回避する)。
これにより、制御対象プロセスのオペレータは極値制御の収束速度をより容易に、かつ安全に調整することが可能となる。
【0124】
(第2の実施形態)
図15は、第2の実施形態の極値制御システム1aの構成例を示す図である。極値制御システム1aは、操作量補正部3をさらに備える点で第1の実施形態の極値制御システム1と異なる。
図15に示す極値制御システム1aは、第1の実施形態において第2の方法によって正則化信号を生成した極値制御システムの構成例のうち、
図9に示した極値制御システム1に操作量補正部3を追加して構成したものである。極値制御システム1aのそれ以外の構成は第1の実施形態の極値制御システム1と同様のため、ここでは
図3と同じ符号を付すことにより、それらの同様の機能部についての説明を省略する。
【0125】
評価関数のヘシアンに基づく正則化信号を用いた場合、式(22)のような線形近似システムが得られるため、ヘシアンの推定精度が高ければ、操作量や評価量を指数関数的に極値に収束させることができると考えられる。このような収束の態様は(一次の)線形システムの特徴でもあり、ヘシアンの推定精度を高めることによりこのような特徴が期待どおりに得られやすくなると考えられる。
【0126】
一方、評価関数のヤコビアンに基づく正則化信号を用いた場合、式(25)のようなアベレージシステムが得られるため、極値への収束は直線的になると考えられる。このような直線的な探索が求められる場合もあるが、一般には、操作量や評価量が目標とする極値から大きく離れている場合には速やかに極値に近づけ、極値近傍では少しずつ極値に近づけることが求められる場合が多い。
【0127】
式(25)のようなアベレージシステムで表される極値制御では、極値近傍でチャタリングを生じる可能性が高い。このようなチャタリングは、上述の式(27)のように、式(25)を微小な定数δ(>0)で調整することで抑制することができるが、これは極値近傍における極値探索の挙動を調整するものであり、極値探索の動きを全体的に調整するものではない。
【0128】
そこで、式(19)又は(22)のアベレージシステムの挙動を全体的に調整するためには、操作量u又は操作量偏差u-を右辺に持つようにすればよい。すなわち、式(22)を式(29)のように変形することができれば良い。
【0129】
【0130】
ここで、F(u~)はF(0)=0を満たし、u~の符号とF(u~)の符号とが一致する関数である。すなわちF(u~)は、u~×F(u~)>0を満たす。最も単純な例はF(u~)=u~であり、この場合、式(29)は線形微分方程式となり、u~は指数関数的にゼロに収束する。なお、uではなくu~を考えるのは、uの最適値u
*
が未知であるのに対してu~はゼロに収束すればよいため、式(29)の平衡点を0とすればよいからである。また、u~の適当なべき乗関数を用いると、極値から離れている場合に、動作点をより早く極値方向に移動させ、極値近傍では緩やかに動作点を動かすようにすることもできる。
【0131】
操作量補正部3は、式(29)のような挙動を持つアベレージシステムを得るためのものであり、操作量uをフィードバックして正則化信号と掛け合わせることにより、極値から離れた動作点ほどより大きく極値方向に動かすように操作量を補正する。例えば、第3の方法で正則化信号を生成する場合には式(25)のアベレージシステムが得られるが、式(29)式のようなシステムを得るためには、uの微分とu~の微分が等しいことに着目して式(25)の右辺にF(u~)を掛ければよい。
【0132】
ただし、u~=u-u
*
であり、操作量の最適値が未知であるため、u~を直接的に用いることはできない。しかしながら、操作量uは用いることができるので、u~の推定値としてuにハイパスフィルタを作用させて未知の定数項u
*
を除去することで近似的にu~を得ることができる。すなわち、u~を式(30)で推定することができる。
【0133】
【0134】
式(30)によって推定したu~の信号を、正規化されたヤコビアン信号に掛け合わせることで、指数関数的な応答特性を持つように極値探索を修正することができる。なお、指数関数的な応答特性よりもさらに早い速度で動作点を極値近傍に移動させたい場合、例えば操作量u~の推定値を式(30)で得られる値のべき乗値とすることで動作点の動き幅をより大きくするようにしてもよい。
【0135】
図16及び
図17は、第2の実施形態における極値制御システム1aの構成例を示す図である。具体的には、
図16は、第1の実施形態において第2の方法によって正則化信号を生成した極値制御システム1の構成例のうち、
図10に示した極値制御システム1に操作量補正部3を追加して構成される極値制御システム1aの例を示す。
図17は、第1の実施形態において第3の方法によって正則化信号を生成した極値制御システム1(
図11参照)に操作量補正部3を追加して構成される極値制御システム1aの例を示す。
【0136】
このように構成された第2の実施形態の極値制御システム1aは、第1の実施形態の極値制御システム1と同様の効果を奏することに加え、極値探索の速度をより細かく調整することが可能になる。これにより、動作点が極値から大きく離れているときには速やかに動作点を極値近傍に移動させ、極値近傍では細かく動作点を動かすことができるため、極値探索の速度及び精度を向上させることが可能となる。
【0137】
(適用例)
図17は、第1の実施形態の極値制御システム又は第2の実施形態の極値制御システムの適用例を示す図である。
図17は、実施形態の極値制御システムを生物学的排水処理プロセスを実現する水処理プラント4に適用した例を示す。例えば、
図17に示す水処理プラント4は、嫌気槽41、無酸素槽42、好気槽43及び最終沈澱池44の各設備を備える。嫌気槽41は、微生物を活性化させるための設備である。無酸素槽42は、窒素を除去するための設備である。好気槽43は有機物の分解やリンの除去、アンモニアの硝化を行うための設備である。最終沈澱池44は、活性汚泥を沈殿させるための設備である。
【0138】
水処理プラント4には、上記設備間で水や汚泥を搬送するポンプや、槽内に空気を供給するブロワ、空気中又は水中の物質の濃度を計測するセンサー等の設備が設置される。薬品投入ポンプ411は、微生物を活性化させる炭素源等の薬品を嫌気槽41に投入するポンプである。循環ポンプ431は、好気槽43と無酸素槽42との間で循環する被処理水の循環量を制御するポンプである。ブロワ432は、好気槽43に空気を供給して曝気量を制御する。返送汚泥ポンプ441は、最終沈澱池44から無酸素槽42に汚泥を返送するポンプである。余剰汚泥引き抜きポンプ442は、最終沈澱池44から過剰な汚泥を引き抜くポンプである。センサー412及びセンサー443は、それぞれ、嫌気槽41及び最終沈澱池44における放流水の水質を計測する。
【0139】
一般に、このような生物学的廃水処理プロセスでは、操作量は返送汚泥の返送率であり、制御量は放流水に含まれる窒素の濃度(以下「放流窒素濃度」という。)及びリンの濃度(以下「放流リン濃度」という。)である。返送率は、返送汚泥ポンプ441の放流量を流入量で割ることによって得られる。放流窒素濃度及び放流リン濃度は、センサー412及びセンサー443によって取得される。なお、制御量を、放流水に含まれる窒素の量(以下「放流窒素量」という。)及びリンの量(以下「放流リン量」という。)としてもよい。この場合、放流窒素量及び放流リン量は、それぞれ放流窒素濃度及び放流リン濃度に放流量を乗算することにより得られる。
【0140】
適用例の極値制御システム1bは、このような水処理プラント4から放流窒素量や放流リン量等の制御量に基づく評価量を入力して極値制御を実行することにより、評価量を最適値に近づけるように操作量を更新していく。この場合に用いる評価関数の一例として、評価量を排水賦課金の考え方に基づく水質コストと、返送汚泥ポンプ441の電力コストとの総和(以下「総コスト」という。)として表す方法が考えられる。返送汚泥ポンプ441の電力コストは、返送汚泥流量と返送汚泥ポンプ441の定格電力などから算出することができる。一般に、排水賦課金の考え方では、水質コストは以下の式で表される。
【0141】
【0142】
式(31)においてCODは化学的酸素要求量、BODは生物化学的酸素要求量、TNは放流される窒素、TPは放流されるリンを意味する。各コストの換算係数は、実際の排水賦課金に基づいて決定されても良いし、他の方法によって決定されてもよい。一般に、TN及びTPは、返送率を変えることによって大きく変化することが知られているため、ここでは返送率の制御に関する水質コストJ1を式(32)のように定義することにする。
【0143】
【0144】
このような水質コストに加え、返送流量を変化させることによって間接的に変化するブロワの電力コストと、返送ポンプの電力コストとを合計した運転コストJ2を定義し、その運転コストJ2と水質コストJ1との合計を総コストとする関数を評価関数として定義してもよい。例えば、運転コストJ2は式(33)のように定義することができる。
【0145】
【0146】
適用例の極値制御システム1bは、このような評価関数によって取得される評価量からヤコビアン信号を抽出し、そのヤコビアン信号に対して上述の正則化信号を作用させて極値制御を行うことにより、水処理プラント4のダイナミクスに対して適応的に積分ゲインを更新することができる。これにより、適用例の極値制御システム1bは、総コストを最小化する最適な操作量を、より安定した動作で探索することが可能となる。なお、実施形態の極値制御システムは、操作量の入力に対して制御量を出力する任意のプロセスの制御に適用可能である。例えば、制御対象プロセスは、下水処理プロセスや燃焼プロセス、石油化学プロセスなどであってもよい。
【0147】
以上説明した少なくともひとつの実施形態によれば、評価関数のヤコビアンを推定する第1の勾配推定部と、ヤコビアンの推定値を積分することにより操作量を動かすべき方向及び量を決定する操作量決定部と、評価関数のヘシアンを推定する第2の勾配推定部と、操作量決定部に入力されるヤコビアンの推定値を、評価関数のヤコビアン又はヘシアンの推定値に基づく値であって0とならないように調整された正則化信号で除することにより、操作量決定部の積分ゲインを評価関数の変化に応じて調整するパラメータ調整部と、を持つことにより、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることができる。
【0148】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。