(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-07
(45)【発行日】2022-10-18
(54)【発明の名称】最適制御装置、制御方法及びコンピュータプログラム
(51)【国際特許分類】
G05B 13/02 20060101AFI20221011BHJP
C02F 3/34 20060101ALI20221011BHJP
【FI】
G05B13/02 J
C02F3/34 101C
(21)【出願番号】P 2018033243
(22)【出願日】2018-02-27
【審査請求日】2021-01-13
(73)【特許権者】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(73)【特許権者】
【識別番号】598076591
【氏名又は名称】東芝インフラシステムズ株式会社
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】山中 理
(72)【発明者】
【氏名】大西 祐太
(72)【発明者】
【氏名】中川 祐一
【審査官】影山 直洋
(56)【参考文献】
【文献】特開2017-224176(JP,A)
【文献】特開2017-033104(JP,A)
【文献】特開平09-325801(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/02
C02F 3/34
(57)【特許請求の範囲】
【請求項1】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御を実行する制御装置であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え
、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器を有し、
前記勾配推定部は、前記勾配として前記評価関数の二階微分値を推定し、
前記補正部は、前記勾配推定部によって推定された前記評価関数の二階微分値に基づいて、前記積分器の積分ゲインを補正する、
最適制御装置。
【請求項2】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御を実行する制御装置であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、
前記勾配推定部は、前記勾配として前記評価関数の一階微分値を推定し、
前記補正部は、前記極値制御部が前記積分ゲインに基づいて決定した操作量を、前記勾配推定部によって推定された前記評価関数の一階微分値に基づいて補正する、
最適制御装置。
【請求項3】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御を実行する制御装置であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、
前記勾配推定部は、前記勾配として前記評価関数の一階微分値又は二階微分値を推定し、
前記補正部は、前記勾配推定部によって推定された前記評価関数の一階微分値又は二階微分値に基づいて、前記操作量に対して未知である前記評価関数を、その勾配が前記操作量の変化に対して線形に変化するように変数変換する、
最適制御装置。
【請求項4】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御を実行する制御装置であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定部と、
前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正部と、
を備え、
前記勾配推定部は、前記極値制御に用いられるディザー信号が正弦波である場合に、フィルタ又はオブザーバを用いて前記評価関数の一階以上の微分値を推定する、
最適制御装置。
【請求項5】
前記勾配推定部によって推定された前記評価関数の勾配を示す勾配情報と、前記
極値制御を実行する極値制御部によって決定された操作量又は前記補正部によって補正された操作量を示す操作量情報とを、対応づけて表示部に表示させるための情報を生成する表示制御部をさらに備える、
請求項1から
4のいずれか一項に記載の最適制御装置。
【請求項6】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御の制御方法であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、
を有
し、
前記勾配推定ステップにおいて、前記勾配として前記評価関数の二階微分値を推定し、
前記補正ステップにおいて、前記極値制御を実行する極値制御部が前記制御対象プロセスに与える操作量を決定するために有している積分器の積分ゲインを、前記勾配推定ステップによって推定された前記評価関数の二階微分値に基づいて補正する、
制御方法。
【請求項7】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御の制御方法であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、
を有し、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、
前記勾配推定ステップにおいて、前記勾配として前記評価関数の一階微分値を推定し、
前記補正ステップにおいて、前記極値制御部が前記積分ゲインに基づいて決定した操作量を、前記勾配推定ステップによって推定された前記評価関数の一階微分値に基づいて補正する、
制御方法。
【請求項8】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御の制御方法であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、
を有し、
前記極値制御を実行する極値制御部は、前記制御対象プロセスに与える操作量を決定するための積分器であって、その積分ゲインが前記評価関数を二次関数と仮定して得られる前記評価関数の二階微分値に基づいて決定される積分器を有し、
前記勾配推定ステップにおいて、前記勾配として前記評価関数の一階微分値又は二階微分値を推定し、
前記補正ステップにおいて、前記勾配推定ステップによって推定された前記評価関数の一階微分値又は二階微分値に基づいて、前記操作量に対して未知である前記評価関数を、その勾配が前記操作量の変化に対して線形に変化するように変数変換する、
制御方法。
【請求項9】
制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御の制御方法であって、
前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する勾配推定ステップと、
前記勾配推定ステップにおいて取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する補正ステップと、
を有し、
前記勾配推定ステップにおいて、前記極値制御に用いられるディザー信号が正弦波である場合に、フィルタ又はオブザーバを用いて前記評価関数の一階以上の微分値を推定する、
制御方法。
【請求項10】
コンピュータを、
請求項1から5のいずれか一項に記載の最適制御装置として機能させるためのコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、最適制御装置、制御方法及びコンピュータプログラムに関する。
【背景技術】
【0002】
近年、プラント制御の方法として、極値制御と呼ばれる技術が注目されている。極値制御は、プラントの複雑なモデルを用いないモデルフリーのリアルタイム最適制御技術である。極値制御の概要は、操作量を強制的に変化させることにより、制御対象プロセスの制御量に基づく評価量が最適化される操作量を探索していくものである。このような極値制御をプラント制御に適用する場合、極値制御に係る各種のパラメータ(以下「制御パラメータ」という。)を制御対象プロセスの特性に応じて適切に設定する必要がある。従来、制御パラメータの設計に関する指針がいくつか示されているが、そのいずれも制御対象プロセスの時間的な変化(以下「ダイナミクス」という。)に適応して極値制御を安定的に動作させることができるまでには至っていない。
【先行技術文献】
【特許文献】
【0003】
【非特許文献】
【0004】
【文献】D.Nesic et. al., ‘A Unifying Approach to Extremum Seeking: Adaptive Schemes Based on Estimation of Derivatives’, Proc. 49th IEEE Conference on Decision and Control, December 15-17, 2010
【文献】W.H.Moase et al, ‘Newton-Like Extremum-Seeking Part I: Theory’, Proc. Joint 48th IEEE Conference on Decision and Control and 28th Chinese Control Conference, December 16-18, 2009
【文献】Yan et al, On the choice of dither in extremum seeking systems:A case study, Automatica, 44, pp.1446-1450 (2008)
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明が解決しようとする課題は、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることができる最適制御装置、制御方法及びコンピュータプログラムを提供することである。
【課題を解決するための手段】
【0006】
実施形態の最適制御装置は、制御対象プロセスの操作量と、前記操作量に応じて変化する制御量に基づく前記制御対象プロセスの最適化に関する指標を示す評価量とに基づいて、前記評価量が最適値に向かうように前記操作量を変化させる極値制御を実行する制御装置である。最適制御装置は、勾配推定部と、補正部と、を持つ。勾配推定部は、前記制御対象プロセスに関して観測される前記評価量に基づいて、前記評価量を表す関数であって前記操作量に対して未知の関数である評価関数の変化率を示す勾配を推定する。補正部は、前記勾配推定部によって取得された前記勾配の推定値に基づいて、前記極値制御の実行に必要な制御パラメータ、前記操作量又は前記評価量を、前記評価関数の変化に適応して補正する。
【図面の簡単な説明】
【0007】
【
図2】極値制御を実現する極値制御システム9の基本的な構成例を示すブロック線図。
【
図3】第1の実施形態における最適制御装置2の機能構成の具体例を示すブロック図。
【
図4】第1の実施形態におけるn階微分値の推定方法の一具体例を示す図。
【
図5】第1の実施形態における制御パラメータの決定方法の一例を示す図。
【
図6】第1の実施形態の最適制御装置2によって実現される極値制御システム1の構成例を示すブロック線図。
【
図7】第1の実施形態におけるプラントPの一例として、生物学的排水処理プロセスを実現する水処理プラント3の具体例を示す図。
【
図8】第1の実施形態における最適制御装置2が制御対象プロセスを極値制御によって制御する処理の流れを示すフローチャート。
【
図9】第2の実施形態における最適制御装置2aの機能構成の具体例を示すブロック図。
【
図10】第2の実施形態の最適制御装置2aによって実現される極値制御システム1aの構成例を示すブロック線図。
【
図11】第3の実施形態における最適制御装置2bの機能構成の具体例を示すブロック図。
【
図12】第3の実施形態におけるn階微分値の推定方法の一例を示す図。
【
図13】第3の実施形態の最適制御装置2bによって実現される極値制御システム1bの構成例を示すブロック線図。
【
図14】第1~第3の実施形態の最適制御装置によって得られる効果の具体例を示す図。
【
図15】変形例の最適制御装置2において表示情報によって表示される画面の具体例を示す図。
【発明を実施するための形態】
【0008】
以下、実施形態の最適制御装置、制御方法及びコンピュータプログラムを、図面を参照して説明する。
【0009】
(概略)
図1は、極値制御の基本的な概念を説明する図である。極値制御は、評価量の変化に基づいて操作量を更新していくことで評価量を最適値に近づけていく制御手法である。評価量は、制御対象となるプロセス(以下「制御対象プロセス」という。)についての最適化の指標となる値である。評価量は、制御対象プロセスの制御量に基づいて決定される指標値であり、評価量と制御量との関係は所定の評価関数によって表される。この評価関数は、制御量に基づくものであれば任意の評価基準に基づいて設定されてよい。また評価量は制御量そのものであってもよい。一般に、極値制御において、制御対象プロセスの評価関数は操作量に対して未知の関数である。
【0010】
極値制御ではディザー信号と呼ばれる周期的な信号によって操作量を変化させる。通常このディザー信号は、正弦波で与えられることが多い。極値制御では、まずディザー信号によって操作量を継続的に振動させ、それによって生じる評価量の変化(増減)を観測する。そして、観測された評価量の変化に基づいて、評価量を評価関数の最適値(最大値又は最小値)に近づけるような操作量を算出し、算出された操作量で現在の操作量を更新する。極値制御は、このような評価量の観測及び操作量の更新を繰り返すことによって評価関数の最適値を探索していく制御方法である。
【0011】
図1(A)の評価関数曲線EVは、操作量に対して未知の評価関数を表す。ここでは、説明の便宜のため、未知の評価関数を下に凸の二次関数として想定する。
図1(B)は、このような評価関数を持つ制御対象プロセスに対してディザー信号で操作量を変化させたときに、ディザー信号の位相と逆位相の評価量が得られた場合を示す。この場合、操作量の増加に対して評価量が減少しているため、動作点が評価関数曲線EVの極小点Pminより左側で変化したことが分かる。一方、
図1(C)は、
図1(B)と同様のディザー信号に対して、ディザー信号の位相と同位相の評価量が得られた場合を示す。この場合、操作量の増加に対して評価量も増加しているため、動作点が極小点Pminより右側で変化したことが分かる。
【0012】
したがって、操作量を周期的に増減させた結果、評価量の増減が操作量の増減と同位相の動きをする場合には操作量を減少させ、逆位相の動きをする場合には操作量を増加させることによって、評価量を最適値に近づけることができる。従来、産業用プラントの制御方式として一般的に用いられてきたPID制御(Proportional-Integral-Derivative Control)は、制御量が予め設定された目標値に追従するように操作量を制御する目標値追従型の制御方式であった。これに対して、極値制御は、評価量が最適化されるような操作量を探索する最適値探索型の制御方式であるため、PID制御のように操作量と制御量との関係を表すプロセスモデルを予め必要としない。そのため、極値制御は、目標値を予め設定できないような制御対象プロセスについても有効な制御方式であり、今後広く普及する可能性を秘めている。このような原理で極値制御を行う極値制御コントローラは比較的簡単な構成で実現することができる。
【0013】
図2は、極値制御を実現する極値制御システム9の基本的な構成例を示すブロック線図である。
図2の極値制御システム9(極値制御部)は、ハイパスフィルタ11(HPF:High-Pass Filter)、ディザー信号出力部12、ローパスフィルタ13(LPF:Low-Pass Filter)及び推定器14を備える。このように極値制御システム9の構成は、従来のPID制御コントローラと比較しても同程度の複雑さである。そのため、極値制御システム9は、PID制御コントローラと同様に、PLC(Programmable Logic Controller)等のハードウェアを用いて容易に実装可能である。以下、
図2の極値制御システム9の動作の概要について説明する。なお、ここでは、最適値として評価関数の極小値を探索する場合を例に説明する。
【0014】
極値制御システム9は、周期的な変化を持つディザー信号M(MはModulationを意味する)を作用させることによって、制御対象プロセスTPの操作量を強制的に変化させる。以下、この操作をモジュレーション(Modulation:変調)と呼ぶ。このモジュレーションにより、制御対象プロセスTPの操作量が周期的に変化し、操作量の変化に応じて制御量が変化する。制御対象プロセスTPは、制御量に基づいて評価量を取得し、取得した評価量を極値制御システム9にフィードバックする。
【0015】
なお、制御量に基づいて評価量を取得する機能(以下「評価量取得機能」という。)は、必ずしも制御対象プロセスTPに含まれる必要はない。例えば、評価量取得機能は極値制御システム9に含まれてもよいし、制御対象プロセスTPと極値制御システム9との間に評価量取得機能を有する他の装置が介在してもよい。
【0016】
通常、操作量の変化に対する評価量の変化はある程度の時間遅れを伴って現れる。上述したように、極値制御は操作量に対して未知の評価関数の極値を探索する制御方法である。そのため、制御対象プロセスTPの評価関数は極小値を持つことが前提であるが、その値は操作量に対して未知である。
【0017】
ハイパスフィルタ11は、フィードバックされた評価量から未知の極小値に応じた一定値のバイアスを除去する。この処理はすなわち、未知の極小値を常にゼロに調整するための処理であり、推定器14が操作量に対して与える変化の方向(増加又は減少)を決定するために必要な前処理である。
【0018】
ディザー信号出力部12は、このように調整された評価量に対してディザー信号D(DはDemodulationを意味する)を作用させる。これにより、操作量のモジュレーションに応じて変化した評価量からディザー信号Mと同じ周波数成分が抽出される。以下、この操作をデモジュレーション(Demodulation:復調)と呼ぶ。デモジュレーションの役割は次のとおりである。
【0019】
上述したとおり制御対象プロセスTPの操作量に対する評価関数は未知である。そのため、評価関数には非線形要素が含まれている場合がある。この場合、評価関数は下に凸(極大値探索の場合は上に凸)の非線形関数であると想定される。このような非線形要素に起因して、評価量にはディザー信号Mの周波数ωに応じた高調波成分や分調波成分が現れる可能性が高い。デモジュレーションは、このような高調波や分調波の影響を取り除くための処理である。このデモジュレーションによって、評価量に含まれる成分のうち、評価量を変化させたディザー信号Mと同じ周波数ωの成分が抽出される。
【0020】
デモジュレーションされた評価量は、ローパスフィルタ13に入力される。ローパスフィルタ13によって、評価量から定常成分(低周波成分)が抽出される。定常成分は、ディザー信号Mを作用させたことによって評価量が増加方向に変化したのか、又は減少方向に変化したのかを表すと考えられる。
【0021】
推定器14は、ローパスフィルタ13によって抽出された定常成分を積分する積分器である。推定器14は、定常成分の積分値に基づいて評価量を極小値に近づけるために動かすべき操作量の方向(以下「操作方向」という。)を推定する推定器として機能する。このような操作方向の推定方法は、適応制御系における操作方向の推定法として最も基本的な勾配法に基づくものである。推定器14によって操作方向(以下「勾配」ともいう。)が決定されると、その勾配に応じて評価量を極小値に近づけるように操作量が調整される。このように調整された操作量は、再びディザー信号を印加されて制御対象プロセスTPに入力される。
【0022】
なお、ここでは、極小値を探索する場合を想定して極値制御システム9の構成例を説明したが、極大値を探索する場合には、推定器14が推定する勾配の符号を反転させればよい。
【0023】
また、一般に積分器はローパス特性を有するため、推定器14が十分なローパス特性を有する場合には、極値制御システム9はローパスフィルタ13を備えなくてもよい。以下では、簡単のため、推定器14は十分なローパス特性を有し、ローパスフィルタ13の機能を包含するものとして説明する。
【0024】
以下に説明する実施形態の最適制御装置は、上記の極値制御システム9を用いて構成され、制御対象プロセスを極値制御によって制御する装置として機能する。実施形態の最適制御装置は、操作量の入力に対して制御量を出力する任意のプロセスの制御に適用可能である。例えば、制御対象プロセスは、下水処理プロセスや燃焼プロセス、石油化学プロセスなどであってもよい。以下、生物学的排水処理プロセスを適宜例にとり実施形態の最適制御装置の詳細を説明する。
【0025】
(第1の実施形態)
図3は、第1の実施形態における最適制御装置2の機能構成の具体例を示すブロック図である。
図3に示すプラントPは制御対象プロセスを実現する手段の一例であり、例えば、生物学的排水処理プロセスを実現する水処理プラントである。プラントPは、制御対象プロセスを実現するための各種機器を含み、最適制御装置2によって与えられる操作量に基づいて各種機器を動作させる。また、プラントPは、操作量に対する制御対象プロセスの応答(すなわち制御量)を計測する各種の計測機器を含み、計測機器によって取得される計測データを制御対象プロセスの制御量を示す情報(以下「計測情報」という。)を最適制御装置2に出力する。最適制御装置2は、制御対象プロセスから取得される計測情報に基づいて、制御対象プロセスの評価量が最適値に近づくような操作方向で操作量を更新していく。このような動作は、最適制御装置2が以下のような構成を備えることによって実現される。
【0026】
最適制御装置2は、バスで接続されたCPU(Central Processing Unit)やメモリや補助記憶装置などを備え、極値制御プログラムを実行する。最適制御装置2は、極値制御プログラムの実行によってディザー信号出力部21、操作量出力部22、計測情報取得部23、評価量算出部24、勾配推定部25、パラメータ決定部26及び極値制御部27を備える装置として機能する。なお、最適制御装置2の各機能の全て又は一部は、ASIC(Application Specific Integrated Circuit)やPLD(Programmable Logic Device)やFPGA(Field Programmable Gate Array)等のハードウェアを用いて実現されてもよい。制御プログラムは、コンピュータ読み取り可能な記録媒体に記録されてもよい。コンピュータ読み取り可能な記録媒体とは、例えばフレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置である。制御プログラムは、電気通信回線を介して送信されてもよい。
【0027】
ディザー信号出力部21は、ディザー信号を生成し、生成したディザー信号を極値制御部27に出力する。具体的には、ディザー信号出力部21は、操作量のモジュレーションのためにディザー信号Mを生成し、評価量のデモジュレーションのためにディザー信号Dを生成する。
【0028】
操作量出力部22及び計測情報取得部23は、最適制御装置2とプラントPとを通信可能に接続する通信インターフェースを含んで構成される。操作量出力部22は、極値制御部27から出力される操作量をプラントPに送信する。また、計測情報取得部23は、プラントPから計測情報を取得し、取得した計測情報が示す制御量を評価量算出部24に出力する。
【0029】
評価量算出部24は、計測情報取得部23から出力される制御量に基づいて極値制御に用いられる評価量を算出する。評価量算出部24は、算出した評価量を勾配推定部25及び極値制御部27に出力する。
【0030】
勾配推定部25は、評価量算出部24から出力される評価量に基づいて、評価関数の勾配を推定する。具体的には、勾配推定部25は、順次取得される評価量の変化に基づいて、操作量に対する1階からN階(Nは1以上の整数)までの勾配(すなわち微分値)を推定する。ここでは一例として1階微分値を推定する場合について説明する。ここで最適制御装置2の制御周期をTとし、制御周期Tごとの制御が行われる時刻を制御時刻という。この場合、勾配推定部25は、ある制御時刻tにおける評価量J(t)と、その1制御周期前の制御時刻t-Tにおける評価量J(t-T)との差を、両時刻における操作量U(t)及びU(t-T)の差で除することによって、操作量に対する評価量の1階微分値の近似値を取得することができる。すなわち、評価量の1階微分値dJ/dUは、次の式(1)のように近似される。
【0031】
【0032】
式(1)は、評価量の微分値を取得する方法の最も簡単な例を示したものであるが、実際には、このような方法で取得される1階微分値は評価関数や操作量の計測値又は算出値によるノイズの影響を受けやすい。また、2階以上の高階微分値を取得する場合にはノイズの影響が大きくなり、実質的に勾配を推定することができなくなる可能性が高い。このような問題に関して、以下に示す各文献には、ディザー信号が、通常、正弦波として与えられることに着目し、より精度良く勾配を推定する方法が提案されている。
【0033】
非特許文献1には、フィルタを用いた勾配推定法が記載されており、非特許文献2には、オブザーバの考え方を用いた勾配推定法が記載されている。本実施形態において、勾配推定部25は、このような従来技術に基づいて評価関数の勾配を推定することが望ましい。ここで、非特許文献1に記載された勾配推定法の基本的な考え方を説明する。
【0034】
一般に、操作量には高調波成分や分調波成分が含まれる場合があるが、ディザー信号が正弦波で与えられる場合、操作量は概ねディザー信号と同じ周波数で正弦波状に変化する。そこで、操作量UがU(t)=U0+a×sinωtという正弦波状に変化すると仮定し、それによって得られる評価量が次の式(2)に示す評価関数Jで表されると仮定する。
【0035】
【0036】
ここで、fは未知の関数である。実際には、fにはプラントのダイナミクスが含まれるため、正確には、fは動的システムの作用素(オペレータ)とみなされるべきである。ただし、ディザー信号の周波数ωがプラントのダイナミクスに対して十分に緩やかな変化をもたらす場合には、fを近似的に関数とみなすことができる。このような前提の下、ここではfを関数とみなす。この式(2)をテーラー展開することにより次の式(3)が得られる。
【0037】
【0038】
ここで、Dkf(kは1以上の整数)は、関数fのUに関するk階微分を意味する。この式(3)にsinnωt(nは1以上の整数)を掛けることにより次の式(4)が得られる。
【0039】
【0040】
ここで、式(4)に周期平均処理を行うと次の式(5)が得られる。
【0041】
【0042】
ここで、A0は次の式(6)で定義される。
【0043】
【0044】
ディザー信号の振幅aと冪数nは定数であることに着目し、n階微分Dnfの値が1制御周期で大きく変化しないと仮定しており、μnは次の式(7)で定義される。
【0045】
【0046】
続いて、次の式(8)及び(9)を定義し、式(5)の関係を用いると、0からn階までの微分D0f~Dnfは次の式(10)のように表される。
【0047】
【0048】
【0049】
【0050】
ここで、Anは次の式(11)で定義される。
【0051】
【0052】
したがって、式(10)を用いることで任意の次数のn階微分値(或いは第0階~第n階微分値)を推定することができる。さらに非特許文献1には、このような基本的な考え方に沿って、若干の修正を加えたn階微分値の推定方法が記載されている。
【0053】
図4は、第1の実施形態におけるn階微分値の推定方法の一具体例を示す図である。
図4においてG(t)は次の式(12)で定義される。
【0054】
【0055】
ここで、X(t)は、
図4のx
1(t)~x
n(t)を並べたベクトル信号である。すなわち式(12)は、式(5)及び(8)で定義した信号を、
図4に示したX(t)で近似(代用)したものと考えることができる。
【0056】
このように、フィルタを用いた勾配推定器G(t)で評価関数Jの勾配を推定することができる。本実施形態の最適制御装置2は、このような方法を用いて推定された勾配の推定値に基づいて極値制御の制御パラメータを決定する。勾配推定部25は、このようにして取得した勾配推定値をパラメータ決定部26に出力する。
【0057】
図3の説明に戻る。パラメータ決定部26は、勾配推定部25によって取得された評価関数の勾配推定値に基づいて極値制御の制御パラメータを決定する。具体的には、パラメータ決定部26は、ローパスフィルタの周波数、ハイパスフィルタの周波数、ディザー信号の周波数、ディザー信号の振幅及び積分ゲインの5つの制御パラメータを決定する。
【0058】
図5は、第1の実施形態における制御パラメータの決定方法の一例を示す図である。具体的には、
図5は、特許文献1に記載された制御パラメータの調整則を示す。この調整則は、基本的には、制御対象プロセスの制御に極値制御を適用する前の設計段階において制御パラメータを決定する際に用いられることを想定したものである。すなわち、特許文献1は、この調整則に基づいて決定された制御パラメータを極値制御の適用後に変更することを想定したものではない。
【0059】
本実施形態の最適制御装置2において、パラメータ決定部26は、
図5に示す5つのパラメータのうち積分ゲイン以外のパラメータについては、
図5に示すNo.1~No.4の各調整則に基づいて決定する。一方、積分ゲインについては、パラメータ決定部26は、勾配推定部25によって取得された勾配推定値に基づいて、制御対象プロセスの状態に応じて適応的に決定し、極値制御に反映させる。積分ゲインの決定方法については後述する。
【0060】
図3の説明に戻る。極値制御部27は、パラメータ決定部26によって決定された制御パラメータで、制御対象プロセスの極値制御を行う。具体的には、まず、極値制御部27は、プラントPに与える操作量にディザー信号を印加し、それによって変化する評価量を観測する。そして、極値制御部27は、評価量の観測値に基づいて、評価量を最適値に近づけるように操作量を更新する。極値制御部27が、ディザー信号の印加、評価量の観測及び操作量の更新を繰り返し実行することで、制御対象プロセスの評価量が最適値に近づけられる。
【0061】
図6は、第1の実施形態の最適制御装置2によって実現される極値制御システム1の構成例を示すブロック線図である。極値制御システム1が
図2に示した基本的な構成の極値制御システム9と異なる点は、勾配推定部25によって取得された評価関数の勾配推定値が推定器14の動作に適応的に作用する点である。具体的には、パラメータ決定部26(図示せず)が勾配推定値に基づいて算出した積分ゲインKIが適応的に推定器14に反映される。これにより、最適制御装置2は、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。積分ゲインの決定方法の詳細は後述する。
【0062】
なお、
図6に示す極値制御システム1は、
図3に示した最適制御装置2のディザー信号出力部21及び極値制御部27として機能する。また、極値制御システム1は、操作量出力部22、計測情報取得部23及び評価量算出部24を含むように構成されてもよい。
【0063】
図7は、第1の実施形態におけるプラントPの一例として、生物学的排水処理プロセスを実現する水処理プラント3の具体例を示す図である。例えば、
図7に示す水処理プラント3は、嫌気槽31、無酸素槽32、好気槽33及び最終沈澱池34の各設備を備える。嫌気槽31は、微生物を活性化させるための設備である。無酸素槽32は、窒素を除去するための設備である。好気槽33は有機物の分解やリンの除去、アンモニアの硝化を行うための設備である。最終沈澱池34は、活性汚泥を沈殿させるための設備である。
【0064】
水処理プラント3には、上記設備間で水や汚泥を搬送するポンプや、槽内に空気を供給するブロワ、空気中又は水中の物質の濃度を計測するセンサー等の設備が設置される。薬品投入ポンプ311は、微生物を活性化させる炭素源等の薬品を嫌気槽31に投入するポンプである。循環ポンプ331は、好気槽33と無酸素槽32との間で循環する被処理水の循環量を制御するポンプである。ブロワ332は、好気槽33に空気を供給して曝気量を制御する。返送汚泥ポンプ341は、最終沈澱池34から無酸素槽32に汚泥を返送するポンプである。余剰汚泥引き抜きポンプ342は、最終沈澱池34から過剰な汚泥を引き抜くポンプである。センサー312及びセンサー343は、それぞれ、嫌気槽31及び最終沈澱池34における放流水の水質を計測する。
【0065】
一般に、このような生物学的廃水処理プロセスでは、操作量は返送汚泥の返送率であり、制御量は放流水に含まれる窒素及びリンの濃度(以下それぞれを「放流窒素濃度」及び「放流リン濃度」という。)である。返送率は、返送汚泥ポンプ341の放流量を流入量で割ることによって得られる。放流窒素濃度及び放流リン濃度は、センサー312及びセンサー343によって取得される。なお、制御量を、放流水に含まれる窒素及びリンの量(以下それぞれを「放流窒素量」及び「放流リン量」という。)としてもよい。この場合、放流窒素量及び放流リン量は、それぞれ放流窒素濃度及び放流リン濃度に放流量を乗算することにより得られる。
【0066】
評価量算出部24には、水処理プラント3から出力される制御量に基づいて評価量を取得するための評価関数を予め設定しておく。ここでいう評価関数は、操作量に対する未知の評価関数を、制御量の関数として定義したものである。例えば、評価関数は、放流窒素濃度及び放流リン濃度と評価量との関係を表す関数である。この評価関数は、操作量(返送率)上限での制御量と、操作量下限での制御量との間で極値をとるように設定される必要がある。このように評価関数を設定する方法の一例として、評価量を排水賦課金の考え方に基づく水質コストと、返送汚泥ポンプ341の電力コストとの総和(以下「総コスト」という。)として表す方法が考えられる。返送汚泥ポンプ341の電力コストは、返送汚泥流量と返送汚泥ポンプ341の定格電力などから算出することができる。一般に、排水賦課金の考え方では、水質コストは以下の式で表される。
【0067】
【0068】
式(13)においてCODは化学的酸素要求量、BODは生物化学的酸素要求量、TNは放流窒素、TPは放流リンを意味する。各コストの換算係数は、実際の排水賦課金に基づいて決定されても良いし、他の方法によって決定されてもよい。一般に、COD、BOD、TN及びTPのうち、返送率を変えることによって大きく変化するものはTN及びTPであることが知られている。そのためここでは、水質コストを次の式(14)で表す。
【0069】
【0070】
なお、一般に、返送率を上げると窒素の除去率が高まりTNに関する水質コストが減少し、逆に返送率を下げるとリンの除去率が高まりTPに関する水質コストが減少することが知られている。このような場合、水質コストのみに基づいて評価関数が設定されても良い。ただし、このようなトレードオフの関係を持たない水質同士のコストを指標とする場合には、評価量を、運転コスト(電力コスト)を加味した総コストとして表すことにより、評価関数が、操作量(返送率)上限での制御量と操作量下限での制御量との間で極値をとるように設定する。
【0071】
また、評価関数には、このような総コストではなく、直接的に水質の評価を表す関数が設定されてもよい。例えば、評価量は、次の式(15)のように算出されてもよい。
【0072】
【0073】
式(15)において、TNlim及びTPlimは、放流水質の規制値や管理値に相当するスレッシホールドレベルを表すパラメータである。このような評価関数を用いた場合、スレッシホールドレベルを超えると評価量が急上昇する。そのため、評価量をスレッシホールドレベル以内に抑えるように極値制御が機能することが期待できる。
【0074】
以上、
図4に示したような水処理プラント3を例として、極値制御に必要となる評価関数の設定方法について説明したが、制御対象とするプラントPによっては評価関数の設定を必要としない場合もある。そのような例として、風力発電プラントにおける風車のブレードの制御が挙げられる。風車のブレードの向きを風向に併せて動かすことにより発電量を最大化するような制御に極値制御を適用する場合、評価量は発電量であり、操作量は風車のブレードの回転角となる。この場合、制御量がそのまま評価量となるため評価関数の設定を必要としない。このような場合、評価量算出部24が設けられなくてもよい。その一方で、評価量を取得することによって、極値制御の適用が可能となる場合もある。
【0075】
[積分ゲインの決定方法]
以下、パラメータ決定部26が勾配推定値に基づいて積分ゲインを決定する方法について説明する。特許文献1で提案されている上記の調整則は、非特許文献3に記載されたアベレージシステムに基づくものである。アベレージシステムとは、あるシステムに周期的な入力が加えられたときに、その周期平均(アベレージ)をとったシステムの動的な挙動を表すシステムであり、極値制御系の安定解析に用いられる。
【0076】
特に非特許文献3には、ダイナミクスを持たないスタティックなプラントを制御対象とする極値制御系のアベレージシステムについて具体的に記載されている。そのアベレージシステムは、次の式(16)で表される。
【0077】
【0078】
ただし、DJは評価関数Jの入力の周期平均U-U*に関する勾配を表す。U*はUの平衡点である。τはディザー信号の周波数ωでスケール変換された時間関数であり、次の式(17)によって表される値である。
【0079】
【0080】
また、KI0は時間軸τ上での積分ゲインであり、実際の時間軸t上での積分ゲインKIは次の式(18)によって変換される。
【0081】
【0082】
なお、式(16)におけるPはディザー信号のパワーを表す。非特許文献3に記載されているように、ディザー信号として正弦波を用いる場合にはP=1/2であり、三角波の場合はP=1/3であり、矩形波の場合はP=1である。式(16)が示すアベレージシステムは、ディザー信号で操作量を周期的に振動させながら、評価量を最小値(極小値)に収束させていくとき、評価量が周期的に振動しながらどのような速さで最小値(極小値)収束していくかという極値制御の収束のダイナミクスを表現したものである。
【0083】
非特許文献3では、プラントがスタティックである場合を仮定し、ディザー信号の周期がプラントの時定数よりも十分に長く設定されている。これはすなわち、ディザー信号の周波数ωがプラントのカットオフ周波数2π/ωよりも十分に小さく設定されている場合である。このような場合には、プラントがダイナミクスを持っている場合であっても、これを近似的にスタティックであるとみなせる。このことは、極値制御の安定解析に用いられる特異摂動論によって裏付けられる。したがって、ここでは、ディザー信号の周波数ωが適切に設定されているという想定の下で式(16)のアベレージシステムを用いて積分ゲインを決定する方法を示す。
【0084】
式(16)は、ディザー信号の周波数でスケール変換された時間軸τ=ωtでの極値制御系の挙動を示すため、式(16)の時定数は、極値制御が極値に収束するまでの時間軸τでの時定数に対応すると考えられる。したがって、式(16)で表されるアベレージシステムの時定数Taveが、ディザー信号の周期T=2π/ωより十分長くなるようにパラメータω、a、KI0を決定すれば、評価量はディザー信号による操作量の増減に応じて徐々に最小値(極小値)に収束していくと期待される。
【0085】
ここで、ディザー信号の周波数ωと振幅aは
図5の調整則に基づいて決定されるため、アベレージシステムの時定数がディザー信号の周期T=2π/ωより十分に長くなるようにするためにはKI
0を調整することになる。しかしながら、式(16)は一般的には非線形の微分方程式となるため、時定数という概念を直接的に定義することができない。そこで、特許文献1では、評価関数Jが二次関数であるとの想定の下で時定数を定義して制御パラメータを決定する調整則が提案されている。例えば、評価関数J(t)が次の式(19)で表される場合を想定する。
【0086】
【0087】
この場合、DJ(U+U*)=G×U(t)となるため、式(14)は次の式(20)のように表される。
【0088】
【0089】
式(20)の時定数Taveは、1/(KI0×a×P×G)となる。このTaveは時間軸τ上での時定数であり、τ=1は1/ωに相当する時間である。このことから、時定数Taveに相当する時間をディザー信号の周期2π/ωの何倍にするかが決まればKI0の値を決定することができる。ここで、アベレージシステムの時定数がディザー信号の周期より十分に長くなるように調整される必要があることから、例えば、時定数に相当する時間を、ディザー信号の周期のk3(=5~10)倍程度とする。この場合、k3×2π=1/(KI0×a×P×G)が成立するため、KI0は次の式(21)のように決定される。
【0090】
【0091】
特許文献1には、以上のような積分ゲインの調整則が提案されているが、この調整則は上述したとおり評価関数J(t)が二次関数であるとの想定に基づくものである。しかしながら、現実の問題がこのような想定の範囲内にあることはほとんど期待できない。これに対して、特許文献1には評価関数を二次関数で近似できるように変換する方法も提案されているが、このような変換を行うためには予め操作量と評価量との関係性をある程度明らかにしておく必要がある。そして、このような関係性の取得には、制御対象プロセスについていくつかの動作点の観測が必要となり、多大なエンジニアリングコストを要する。
【0092】
このような課題に対して、本実施形態では式(19)及び(21)におけるGが評価関数の二階微分値であることに着目し、パラメータ決定部26が勾配推定部25によって取得される二階微分の推定値を式(21)に適用することで積分ゲインを決定する。なお、評価関数J(t)が二次関数である場合にはGは定数となるが、現実の問題のほとんどにおいて評価関数J(t)は二次関数でない。このように評価関数J(t)が二次関数でない場合、Gは時間とともに変化する関数となる。そのため、この場合、積分ゲインは次の式(22)のように表される。
【0093】
【0094】
式(19)において、G(t)は勾配推定部25によって推定された評価関数の操作量に対する二階微分値である。また、式(19)は、積分ゲインが時刻tにおける二階微分値G(t)によって時間tの関数となることを表している。すなわち、パラメータ決定部26は、順次取得される勾配推定値を式(22)に適用することにより、経時的に変化する制御対象プロセスのダイナミクスに適応して積分ゲインを更新することができる。
【0095】
図8は、第1の実施形態における最適制御装置2が制御対象プロセスを極値制御によって制御する処理の流れを示すフローチャートである。なお、プラントPの制御対象プロセスは、フローチャートの開始時点においてPID制御等の極値制御以外の制御方法で制御されているものとする。まず、計測情報取得部23は、プラントPから計測情報を取得する(ステップS101)。計測情報取得部23は、計測情報が示す制御量を評価量算出部24に出力する。
【0096】
評価量算出部24は、計測情報取得部23から出力された制御量に基づいて、制御対象プロセスのその時点における評価量を算出する(ステップS102)。評価量算出部24は、算出した評価量を勾配推定部25及び極値制御部27に出力する。
【0097】
勾配推定部25は、評価量算出部24から出力された評価量に基づいて評価関数の勾配を推定する(ステップS103)。勾配推定部25は、取得した勾配推定値をパラメータ決定部26に出力する。
【0098】
パラメータ決定部26は、勾配推定部25から出力された勾配推定値と、予め定められた制御パラメータの調整則とに基づいて制御パラメータを決定する(ステップS104)。具体的には、パラメータ決定部26は、
図5のNo.1~No.4に示す調整則に基づいてハイパスフィルタ11の周波数ω
1、ディザー信号出力部12が出力するディザー信号の周波数ω及び振幅a、及びローパスフィルタ13の周波数ω
2を決定する。なお、
図5に示す調整則でこれらの制御パラメータを決定する際に必要な情報(例えば、制御対象プロセスの時定数やむだ時間など)は、計測情報に基づいて取得されてもよいし、予め最適制御装置2に記憶されていてもよい。
【0099】
一方で、パラメータ決定部26は、勾配推定部25から出力された勾配推定値を式(22)に適用して積分ゲインKI0を決定する。パラメータ決定部26は、このように決定した制御パラメータの値を極値制御部27に出力する。
【0100】
続いて、極値制御部27が、パラメータ決定部26によって決定された各制御パラメータを用いて、制御対象プロセスの極値制御を開始する(ステップS105)。ここでは、パラメータ決定部26によって制御パラメータが決定された後、所定のタイミングで、制御対象プロセスの制御方法が極値制御に切り替えられるものとする。このタイミングは予め定められたタイミングであってもよいし、ユーザの操作による任意のタイミングであってもよい。
【0101】
極値制御部27が極値制御を開始した後、最適制御装置2は、ステップS101、S102及びS103と同様の処理を繰り返し実行する(ステップS106、S107及びS108)とともに、ステップS104と同様の方法で積分ゲインの値を取得する(ステップS109)。そして、パラメータ決定部26は、取得した積分ゲインの値で現在の積分ゲインの値を更新する(ステップS110)。
【0102】
このように構成された第1の実施形態の最適制御装置2は、取得される計測情報に基づいて評価関数の勾配を推定するとともに、取得した勾配推定値に基づいて積分ゲインを適応的に決定する機能を有する。このような最適制御装置2によれば、極値制御の安定性に大きく関係する積分ゲインを制御対象プロセスの状態に応じて適応的に更新することができるため、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。
【0103】
このように制御パラメータを調整することができる最適制御装置2によれば、例えば
図7の水処理プラントにおける汚泥の返送量を操作量として、水処理プロセスのダイナミクスに適応しながら総コストを最小化するような極値制御を実現することが可能となる。
【0104】
(第2の実施形態)
図9は、第2の実施形態における最適制御装置2aの機能構成の具体例を示すブロック図である。最適制御装置2aは、勾配推定部25に代えて勾配推定部25aを備える点、パラメータ決定部26に代えてパラメータ決定部26aを備える点、操作量変換部28をさらに備える点で第1の実施形態における最適制御装置2と異なる。最適制御装置2aのその他の構成は第1の実施形態における最適制御装置2と同様である。そのため、ここでは、それらの同様の構成には
図3と同じ符号を付すことにより説明を省略する。
【0105】
勾配推定部25aは、取得された評価量に基づいて評価関数の勾配を推定する点では第1の実施形態における勾配推定部25と同様であるが、評価関数の勾配として二階微分値ではなく一階微分値を推定する点、取得した勾配推定値をパラメータ決定部26aではなく、操作量変換部28に出力する点で勾配推定部25と異なる。
【0106】
パラメータ決定部26aは、ローパスフィルタの周波数、ハイパスフィルタの周波数、ディザー信号の周波数、ディザー信号の振幅及び積分ゲインの5つの制御パラメータを決定する点では第1の実施形態におけるパラメータ決定部26と同様であるが、積分ゲインの決定に評価関数の勾配推定値を用いない点でパラメータ決定部26と異なる。
【0107】
操作量変換部28は、勾配推定部25aから出力される評価関数の勾配推定値に基づいて極値制御部27から出力される操作量を変換する。操作量変換部28は、変換した操作量を操作量出力部22に出力する。具体的には、操作量変換部28は、以下のような方法で操作量を変換する。
【0108】
まず、極値制御部27から出力される操作量をUとすると、Uを入力(操作量)とした場合の極値制御のアベレージシステムは上記の式(16)で表される。以下、式(23)として式(16)を再掲する。
【0109】
【0110】
式(23)において評価関数の勾配DJ(U+U*)は、一般的にはUに関する非線形関数となるため、式(23)の収束の速さを時定数の概念で表現することができなかった。そこで、第1の実施形態では、まず、評価関数J(U)が二次関数で表されると仮定した上で時定数の概念を定義し、定義した時定数が所望の値になるように積分ゲインKI0を決定した。しかしながら、実際には,評価関数J(U)は二次関数ではないため、その二階微分値が一定となるように積分ゲインKI0を適応的に調整した。
【0111】
これに対して、本実施形態では、式(23)によって表されるアベレージシステムが線形システムとなるように入力変数Uを変数変換することで時定数を定義する。すなわち、変換後の変数vに関するアベレージシステムが線形システムとなるように次の式(24)に示す変数変換を行う。この変数変換により、変数vに関するアベレージシステムは次の式(25)のように変換される。
【0112】
【0113】
【0114】
ここで、式(23)を式(25)に変換する関数v=h(U)は次の式(26)に示す偏微分方程式を満たす必要がある。
【0115】
【0116】
この条件を満たす変換関数hは多数存在するが、評価関数の一階微分値DJ(U)が既知であれば、どのような微分方程式であっても少なくとも近似的には解くことが可能である。例えば、式(26)を次の式(27)のように近似することができる。
【0117】
【0118】
このように近似した式(27)を用いれば、例えば、初期値の操作量U0に対して適当な変換v0=h(U0)を与えることができれば、極値制御による操作量の変化に応じてh(U)を更新していくことができる。操作量変換部28は、勾配推定部25aによって取得された勾配推定値(一階微分値)を式(27)に適用することによって操作量を変換することができる。
【0119】
また、変数vの初期値v0については、DJ(U)がUの一次関数で近似できる場合には、次の式(28)によって変換することで、近似的に式(22)を成立させることができる。
【0120】
【0121】
なお、式(25)は、式(20)が示すアベレージシステムにおいて評価関数の二階微分値GをG=1としたものに相当する。そのため、積分ゲインは、式(22)のGをG=1として算出されればよい。
【0122】
図10は、第2の実施形態の最適制御装置2aによって実現される極値制御システム1aの構成例を示すブロック線図である。極値制御システム1aが
図2に示した基本的な構成の極値制御システム9と異なる点は、勾配推定部25aによって取得された評価関数の勾配推定値(一階微分値)(図中の()
n)が制御対象プロセスTPに与えられる操作量に適応的に作用する点である。具体的には、操作量変換部28(図示せず)が勾配推定値に基づいて変換した操作量が制御対象プロセスTPに与えられる。これにより、最適制御装置2aは、第1の実施形態の最適制御装置2と同様に、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。
【0123】
さらに、第2の実施形態では勾配推定値として評価関数の一階微分値を取得すればよいため、二階微分値を取得する第1の実施形態よりも、極値制御の処理を簡単にすることができる。具体的には、
図4に示したようなフィルタを用いた勾配の推定において、フィルタの段数を少なくすることができるため、勾配推定部25を第1の実施形態よりも簡単な回路構成で実現することができる。また、このことは、フィルタ後段のG(t)をより小さい次元で実現できることを意味する。
【0124】
また、その一方で、第2の実施形態では、操作量を変換する際の初期値を適切に設定するために多少の手間がかかる可能性がある。そのため、どちらの実施形態を用いるかは、適用する対象のプロセスの特性や制約事項等に応じて選択されるとよい。
【0125】
(第3の実施形態)
図11は、第3の実施形態における最適制御装置2bの機能構成の具体例を示すブロック図である。最適制御装置2bは、評価量算出部24に代えて評価量算出部24bを備える点、勾配推定部25に代えて勾配推定部25bを備える点、パラメータ決定部26に代えてパラメータ決定部26bを備える点、評価量変換部29をさらに備える点で第1の実施形態における最適制御装置2と異なる。最適制御装置2bのその他の構成は第1の実施形態における最適制御装置2と同様である。そのため、ここでは、それらの同様の構成には
図3と同じ符号を付すことにより説明を省略する。
【0126】
評価量算出部24bは、計測情報取得部23から出力される制御量に基づいて極値制御に用いられる評価量を算出する点では第1の実施形態における評価量算出部24bと同様であるが、算出した評価量を勾配推定部25b及び評価量変換部29に出力する点で評価量算出部24と異なる。
【0127】
勾配推定部25bは、取得された評価量に基づいて評価関数の勾配を推定する点では第1の実施形態における勾配推定部25と同様であるが、取得した勾配推定値をパラメータ決定部26bではなく、評価量変換部29に出力する点で勾配推定部25と異なる。
【0128】
評価量変換部29は、勾配推定部25bから出力される評価関数の勾配推定値に基づいて評価量算出部24bから出力される評価量を変換する。評価量変換部29は、変換した評価量を極値制御部27に出力する。具体的には、評価量変換部29は、以下のような方法で評価量を変換する。
【0129】
図12は、第3の実施形態におけるn階微分値の推定方法の一例を示す図である。まず、評価量変換部29に対して、評価量を変換するための変換関数を予め決定しておく。ここでは、簡単のため、評価関数Jを冪乗変換することにより、変換後の評価関数Jを局所的に二次関数で近似する。ここで、変換後の評価関数をJ
m、変換に用いる冪数(以下「冪乗パラメータ」という。)をnとするとJ
mはJ
m=T(J)=J
nと表すことができる。この冪乗パラメータnは以下のように推定することができる。
【0130】
J
m=J
nと変換する場合、操作量Uに関するJの勾配も同じ変換関数で変換されるため、D
2J
m=(D
2J)
nとなる。このとき、D
2J
mが一定値となるように冪乗パラメータnを定めれば、変換後の評価関数の二階微分値は一定値となるため、変換後の評価量は二次関数で近似されたとみなすことができる。そこで、評価量変換部29は、入力された評価量に基づいて取得される評価関数の二階微分値が予め定められた所定の定数C=1となる冪数を算出することによって冪乗パラメータnを推定する。
図12は、このような評価量変換部29の構成を示す概念図である。
【0131】
具体的には、評価量変換部29は、推定器291及び変換部292を備える。推定器291は、定数C=1を評価関数の二階微分値の目標値として、変換関数D2Jm=(D2J)nを満たす冪数nを探索し、探索結果を最終的な冪乗パラメータの値として変換部292に出力する。変換部292は、推定器291によって推定された冪乗パラメータnを評価量の変換関数に適用して評価量Jを変換する。変換部292は、変換後の評価量Jmを極値制御部27に出力する。
【0132】
例えば、冪乗パラメータの推定を最急降下法のような方法で推定する場合、推定器291を、積分器を用いて構成することができる。また、推定器291は、冪乗パラメータnを仮想的な操作量とみなして、目標値である定数C=1と二階微分値D2Jm=(D2J)nとの誤差をゼロにするようなPID制御器を用いて構成されてもよい。
【0133】
なお、ここでは、勾配推定部25bによって二階微分値が推定される場合について説明したが、勾配推定部25bが一階微分値を推定する場合には、評価量変換部29は、その勾配推定値が操作量に対して比例するように評価量を変換するように構成されてもよい。
【0134】
ただし、推定器291の目標値を定数C=1とした場合には、
図5に示した調整則において評価関数の勾配G(二階微分値)をG=1と仮定して積分ゲインを決定する。もし、推定器291の目標値を定数C=Gとした場合には、定数Cの値を用いて積分ゲインを決定する。
【0135】
図11の説明に戻る。パラメータ決定部26bは、ローパスフィルタの周波数、ハイパスフィルタの周波数、ディザー信号の周波数、ディザー信号の振幅及び積分ゲインの5つの制御パラメータを決定する点では第1の実施形態におけるパラメータ決定部26と同様であるが、積分ゲインの決定に評価関数の勾配推定値を用いない点でパラメータ決定部26と異なる。
【0136】
図13は、第3の実施形態の最適制御装置2bによって実現される極値制御システム1bの構成例を示すブロック線図である。極値制御システム1bが
図2に示した基本的な構成の極値制御システム9と異なる点は、勾配推定部25bによって取得された評価関数の勾配推定値(一階微分値又は二階微分値)が制御対象プロセスTPの制御量に基づいて取得される評価量に適応的に作用する点である。具体的には、評価量変換部29(図示せず)が勾配推定値に基づいて変換した評価量が極値制御システム1bに入力される。これにより、最適制御装置2bは、第1の実施形態の最適制御装置2と同様に、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることが可能となる。
【0137】
図14は、第1~第3の実施形態の最適制御装置によって得られる効果の具体例を示す図である。
図14(A)は、実際には未知の評価関数の形状が二次関数、三次関数及び0.5次関数であると仮定し、従来の調整則で調整した制御パラメータに基づく極値制御をシミュレーションした結果を示す。また、
図14(B)は、同仮定の下で、本実施形態の調整方法で調整された制御パラメータに基づく極値制御をシミュレーションした結果を示す。具体的には、
図14(A)のシミュレーションにおいては、特許文献1に記載された調整則に基づいて制御パラメータを調整した。
図14(A)を見ても分かるように、従来の調整方法では、評価関数の形状が二次関数や三次関数である場合には極値探索に成功しているものの、評価関数の形状が0.5次関数である場合には探索性能が著しく劣化している。一方、本実施形態の調整方法では、
図14(B)を見ても分かるように、評価関数の形状に関わらず極値の探索成功している。
【0138】
実際の極値制御においては最適化したい評価関数の形状を予め知ることができない。そのため、従来の制御パラメータの調整方法では、評価関数の形状に依存して、極値(局所的な最適値)の探索性能が変化し、最悪の場合には制御が不安定になる可能性もあった。これに対して、本実施形態における制御パラメータの調整方法によれば、評価関数の形状がどのような形状であっても常に安定的に極値を探索することが可能になる。
【0139】
(変形例)
第1の実施形態の最適制御装置2は、勾配推定部25によって推定された評価関数の勾配を示す勾配情報と、極値制御部27によって決定された操作量を示す操作量情報と、を対応づけて、CRT(Cathode Ray Tube)ディスプレイや液晶ディスプレイ、有機EL(Electro-Luminescence)ディスプレイ等の表示装置に表示させるための情報(以下「表示情報」という。)を生成する表示制御部(図示せず)を備えてもよい。
図15は、変形例の最適制御装置2において表示情報によって表示される画面の具体例を示す図である。表示情報は、
図15(A)に示すように、時間軸に対して各値を別系列で示すものであってもよいし、各値を一つの系列で示すものであってもよい。また、表示情報は、
図15(B)に示すように、一方又は両方の値を相関する他の値に置き換えた形で各値を表示するものであってもよい。
図15(B)は、勾配情報を、評価量を示す情報で置き換えた例である。なお、
図15に示されるように、表示情報には、現在の動作点や現在時刻などを示す情報が含まれてもよい。
【0140】
なお、この場合、最適制御装置2は、表示情報を表示させるための表示装置を備えてもよいし、これらの表示装置を自装置に接続するインターフェースを備えてもよい。また、最適制御装置2は、表示情報を他の装置に送信するための通信インターフェースを備えてもよい。また、表示制御部は、第1の実施形態の最適制御装置2と同様に、第2又は第3の実施形態における最適制御装置2a又は2bに備えられてもよい。なお、第2の実施形態においては、表示される操作量は、極値制御部27によって決定された操作量であってもよいし、操作量変換部28によって変換された操作量であってもよい。
【0141】
以上説明した少なくともひとつの実施形態によれば、制御対象プロセスに関して観測される評価量に基づいて、操作量に対する評価量を示す未知の評価関数の変化率を示す勾配を推定する勾配推定部と、勾配推定部によって取得された勾配の推定値に基づいて、極値制御の実行に必要な制御パラメータ、操作量又は評価量を、評価関数の変化に適応して補正する補正部と、を持つことにより、制御対象プロセスのダイナミクスに適応して極値制御をより安定的に動作させることができる。
【0142】
なお、第1の実施形態においては、勾配推定値に基づいて推定器14の積分ゲインを適応的に更新するパラメータ決定部26が上記補正部の一例である。また、第2の実施形態においては、勾配推定値に基づいて操作量を適応的に変換する操作量変換部28が上記補正部の一例である。また、第3の実施形態においては、勾配推定値に基づいて評価量を適応的に変換する評価量変換部29が上記補正部の一例である。
【0143】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれると同様に、特許請求の範囲に記載された発明とその均等の範囲に含まれるものである。
【符号の説明】
【0144】
1,1a,1b…極値制御システム、11…ハイパスフィルタ、12…ディザー信号出力部、13…ローパスフィルタ、14…推定器、9…極値制御システム(基本的な構成)、2,2a,2b…最適制御装置、21…ディザー信号出力部、22…操作量出力部、23…計測情報取得部、24,24b…評価量算出部、25,25a,25b…勾配推定部、26,26a,26b…パラメータ決定部、27…極値制御部、28…操作量変換部、29…評価量変換部、291…推定器、292…変換部、3…水処理プラント、31…嫌気槽、311…薬品投入ポンプ、312…センサー、32…無酸素槽、33…好気槽、331…循環ポンプ、332…ブロワ、34…最終沈澱池、341…返送汚泥ポンプ、342…余剰汚泥引き抜きポンプ、343…センサー