(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024070308
(43)【公開日】2024-05-23
(54)【発明の名称】装置、方法およびプログラム
(51)【国際特許分類】
G05B 13/02 20060101AFI20240516BHJP
【FI】
G05B13/02 D
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022180701
(22)【出願日】2022-11-11
(71)【出願人】
【識別番号】000006507
【氏名又は名称】横河電機株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】劉 琢
(72)【発明者】
【氏名】石井 英二
(72)【発明者】
【氏名】▲高▼見 豪
【テーマコード(参考)】
5H004
【Fターム(参考)】
5H004GB01
5H004HB01
5H004HB02
5H004HB03
5H004KC35
5H004KC48
(57)【要約】 (修正有)
【課題】制御モデルから出力される推奨制御パラメータを出力する。
【解決手段】制御対象に関する状態の測定値と、目標値との偏差を取得する第1取得部と、制御対象に対して供給された制御パラメータを取得する第2取得部と、状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデルを有する制御モデルであって、測定値に応じた局面に対応付けられたサブ制御モデルを用いて、偏差および制御パラメータが入力されることに応じて、制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、第1取得部により取得された偏差と、第2取得部により取得された制御パラメータとを供給する供給部と、供給部から制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される推奨制御パラメータを出力する出力部と、を備える装置が提供される。
【選択図】
図1
【特許請求の範囲】
【請求項1】
制御対象に関する状態の測定値と、目標値との偏差を取得する第1取得部と、
前記制御対象に対して供給された制御パラメータを取得する第2取得部と、
前記状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデルを有する制御モデルであって、前記複数のサブ制御モデルのうち前記測定値に応じた局面に対応付けられたサブ制御モデルを用いて、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記第1取得部により取得された前記偏差と、前記第2取得部により取得された前記制御パラメータとを供給する供給部と、
前記供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部と、
を備える装置。
【請求項2】
前記複数の局面のうち、前記測定値に応じた局面を特定する特定部と、
前記複数のサブ制御モデルのうち、前記特定部により特定された局面に対応するサブ制御モデルを選択する選択部と、
をさらに備え、
前記供給部は、前記複数のサブ制御モデルのうち、前記選択部により選択されたサブ制御モデルに対し、前記第1取得部により取得された前記偏差と、前記第2取得部により取得された前記制御パラメータとを供給する、請求項1に記載の装置。
【請求項3】
前記特定部は、予め設定された複数の数値範囲の何れに前記偏差が含まれるかに応じて局面を特定する、請求項2に記載の装置。
【請求項4】
前記複数のサブ制御モデルのうち、少なくとも2つのサブ制御モデルは、それぞれ測定値と、共通の目標値との偏差、および、制御パラメータの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータを出力する、請求項2に記載の装置。
【請求項5】
前記特定部は、予め設定された複数の数値範囲の何れに前記測定値が含まれるかに応じて局面を特定する、請求項2に記載の装置。
【請求項6】
前記複数のサブ制御モデルのうち、少なくとも2つのサブ制御モデルは、互いに異なる固有目標値に対応付けられて、測定値と、当該固有目標値との偏差、および、制御パラメータの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータを出力し、
当該装置は、
前記特定部により特定された局面に応じて前記少なくとも2つのサブ制御モデルの前記固有目標値の何れかを前記目標値として設定する設定部をさらに備える、請求項2に記載の装置。
【請求項7】
各サブ制御モデルは、
偏差および制御パラメータが入力されることに応じて、当該制御パラメータについて変更することを推奨する推奨変更量を出力する変更量出力モデルと、
前記制御対象に供給された前記制御パラメータと、前記変更量出力モデルから出力される前記推奨変更量とを加算して前記推奨制御パラメータを算出する加算部と、
を有し、
前記複数のサブ制御モデルは、前記加算部を共有する、請求項1に記載の装置。
【請求項8】
前記複数のサブ制御モデルのうち、少なくとも2つのサブ制御モデルにおける前記変更量出力モデルは、互いに異なる範囲の前記推奨変更量を出力する、請求項7に記載の装置。
【請求項9】
前記第1取得部により取得される偏差と、前記第2取得部により取得される制御パラメータと、を含む学習データを用い、偏差および制御パラメータの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される前記推奨変更量を出力するよう各変更量出力モデルの学習処理を行う学習処理部をさらに備える、請求項8に記載の装置。
【請求項10】
前記学習処理部は、各変更量出力モデルに対し、別々の学習データを用いて学習処理を行う、請求項9に記載の装置。
【請求項11】
制御対象に関する状態の測定値と、目標値との偏差を取得する第1取得段階と、
前記制御対象に対して供給された制御パラメータを取得する第2取得段階と、
前記状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデルを有する制御モデルであって、前記複数のサブ制御モデルのうち前記測定値に応じた局面に対応付けられたサブ制御モデルを用いて、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記第1取得段階により取得された前記偏差と、前記第2取得段階により取得された前記制御パラメータとを供給する第1供給段階と、
前記第1供給段階により前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力段階と、
を備える方法。
【請求項12】
コンピュータを、
制御対象に関する状態の測定値と、目標値との偏差を取得する第1取得部と、
前記制御対象に対して供給された制御パラメータを取得する第2取得部と、
前記状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデルを有する制御モデルであって、前記複数のサブ制御モデルのうち前記測定値に応じた局面に対応付けられたサブ制御モデルを用いて、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記第1取得部により取得された前記偏差と、前記第2取得部により取得された前記制御パラメータとを供給する供給部と、
前記供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部
として機能させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、装置、方法およびプログラムに関する。
【背景技術】
【0002】
特許文献1~4には、「目標値SVに基づいて操作量マップを選択して、選択した操作量マップを用いて操作量MVを算出する」(特許文献1の段落0031)などと記載されている。
[先行技術文献]
[特許文献]
[特許文献1]特開2022-156797号公報
[特許文献2]特開2020-95352号公報
[特許文献3]特開2021-117699号公報
[特許文献4]特開2022-014099号公報
【発明の概要】
【0003】
本発明の第1の態様においては、制御対象に関する状態の測定値と、目標値との偏差を取得する第1取得部と、前記制御対象に対して供給された制御パラメータを取得する第2取得部と、前記状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデルを有する制御モデルであって、前記複数のサブ制御モデルのうち前記測定値に応じた局面に対応付けられたサブ制御モデルを用いて、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記第1取得部により取得された前記偏差と、前記第2取得部により取得された前記制御パラメータとを供給する供給部と、前記供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部と、を備える装置が提供される。
【0004】
上記の装置においては、前記複数の局面のうち、前記測定値に応じた局面を特定する特定部と、前記複数のサブ制御モデルのうち、前記特定部により特定された局面に対応するサブ制御モデルを選択する選択部と、をさらに備えてよい。
前記供給部は、前記複数のサブ制御モデルのうち、前記選択部により選択されたサブ制御モデルに対し、前記第1取得部により取得された前記偏差と、前記第2取得部により取得された前記制御パラメータとを供給してよい。
【0005】
特定部および選択部を有する上記の装置においては、前記特定部は、予め設定された複数の数値範囲の何れに前記偏差が含まれるかに応じて局面を特定してよい。
【0006】
特定部および選択部を有する上記何れかの装置においては、前記複数のサブ制御モデルのうち、少なくとも2つのサブ制御モデルは、それぞれ測定値と、共通の目標値との偏差、および、制御パラメータの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータを出力してよい。
【0007】
特定部および選択部を有する上記の装置においては、前記特定部は、予め設定された複数の数値範囲の何れに前記測定値が含まれるかに応じて局面を特定してよい。
【0008】
特定部および選択部を有する上記何れかの装置においては、前記複数のサブ制御モデルのうち、少なくとも2つのサブ制御モデルは、互いに異なる固有目標値に対応付けられて、測定値と、当該固有目標値との偏差、および、制御パラメータの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータを出力してよい。当該装置は、前記特定部により特定された局面に応じて前記少なくとも2つのサブ制御モデルの前記固有目標値の何れかを前記目標値として設定する設定部をさらに備えてよい。
【0009】
特定部および選択部を有する上記何れかの装置においては、各サブ制御モデルは、偏差および制御パラメータが入力されることに応じて、当該制御パラメータについて変更することを推奨する推奨変更量を出力する変更量出力モデルと、前記制御対象に供給された前記制御パラメータと、前記変更量出力モデルから出力される前記推奨変更量とを加算して前記推奨制御パラメータを算出する加算部と、を有してよい。前記複数のサブ制御モデルは、前記加算部を共有してよい。
【0010】
特定部および選択部を有する上記何れかの装置においては、前記複数のサブ制御モデルのうち、少なくとも2つのサブ制御モデルにおける前記変更量出力モデルは、互いに異なる範囲の前記推奨変更量を出力してよい。
【0011】
特定部および選択部を有する上記何れかの装置においては、前記第1取得部により取得される偏差と、前記第2取得部により取得される制御パラメータと、を含む学習データを用い、偏差および制御パラメータの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される前記推奨変更量を出力するよう各変更量出力モデルの学習処理を行う学習処理部をさらに備えてよい。
【0012】
上記の装置においては、前記学習処理部は、各変更量出力モデルに対し、別々の学習データを用いて学習処理を行ってよい。
【0013】
本発明の第2の態様においては、制御対象に関する状態の測定値と、目標値との偏差を取得する第1取得段階と、前記制御対象に対して供給された制御パラメータを取得する第2取得段階と、前記状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデルを有する制御モデルであって、前記複数のサブ制御モデルのうち前記測定値に応じた局面に対応付けられたサブ制御モデルを用いて、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記第1取得段階により取得された前記偏差と、前記第2取得段階により取得された前記制御パラメータとを供給する第1供給段階と、前記第1供給段階により前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力段階と、を備える方法が提供される。
【0014】
本発明の第3の態様においては、コンピュータを、制御対象に関する状態の測定値と、目標値との偏差を取得する第1取得部と、前記制御対象に対して供給された制御パラメータを取得する第2取得部と、前記状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデルを有する制御モデルであって、前記複数のサブ制御モデルのうち前記測定値に応じた局面に対応付けられたサブ制御モデルを用いて、偏差および制御パラメータが入力されることに応じて、前記制御対象に供給することを推奨する推奨制御パラメータを出力する制御モデルに対し、前記第1取得部により取得された前記偏差と、前記第2取得部により取得された前記制御パラメータとを供給する供給部と、前記供給部から前記制御モデルに対する供給が行われたことに応じて当該制御モデルから出力される前記推奨制御パラメータを出力する出力部として機能させるプログラムが提供される。
【0015】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0016】
【
図7】制御対象101が制御される場合の測定値PVおよび制御パラメータPの推移を示す。
【
図9】局面IDと、測定値PVの数値範囲と、サブモデルIDと、固有目標値との対応を示す。
【
図11】制御対象101が制御される場合の測定値PVの推移を示す。
【
図12】本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。
【発明を実施するための形態】
【0017】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0018】
<1.システム1>
図1は、第1実施形態に係るシステム1を示す。システム1は設備100と、装置200とを備える。
【0019】
<1.1.設備100>
設備100は、制御対象101が備え付けられた施設や装置等である。例えば、設備100は、プラントであってもよいし、複数の機器を複合させた複合装置であってもよい。プラントとしては、化学やバイオ等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、上下水やダム等を管理制御するプラント等が挙げられる。
【0020】
設備100には、1または複数の制御対象101が設けられている。制御対象101は、制御の対象となる器具、機械または装置等であり、いわゆるフィールド機器であってよい。例えば、制御対象101は、圧力計、流量計、温度センサ等のセンサ機器、流量制御弁や開閉弁等のバルブ機器、またはファンやモータ等のアクチュエータ機器であってよい。制御対象101は、外部から有線または無線で制御されるが、手動で制御されてもよい。制御対象101は、装置200における制御部210によって制御されてよい。本実施形態では一例として、制御対象101は、操作量MV(Manipulated Variable)についての指示値IV(Instructed value)を制御部210から供給されることで制御されてよい。
【0021】
また、設備100には、1または複数のセンサ102が設けられていてよい。各センサ102は、設備100の内外の状態の測定値、つまり、内外の状態を示す物理量の測定値を測定してよい。少なくとも1つのセンサ102は、制御対象101の状態の測定値PV(Process Variable)を測定してよい。測定値PVは、制御対象101を制御した結果の運転状態を示す運転データであってよく、制御の対象となる制御量を示してよい。一例として、測定値PVは、制御対象101の出力そのものを示してもよいし、制御対象101の出力によって変化する様々な値を示してもよい。一例として、測定値PVは、圧力、温度、pH、速度、流量などを示してよい。各センサ102は、測定した測定値PVを装置200に供給してよい。
【0022】
<1.2.装置200>
装置200は、制御対象101を制御するものであり、例えば制御対象101のコントローラであってよい。装置200は、制御対象101の操作量MVについての指示値IVを出力して温度の調節、液面の水位調整または流量の調整などのプロセス制御を実行してよい。
【0023】
装置200は、PC(パーソナルコンピュータ)、タブレット型コンピュータ、スマートフォン、ワークステーション、サーバコンピュータ、または汎用コンピュータ等のコンピュータであってよく、複数のコンピュータが接続されたコンピュータシステムであってもよい。このようなコンピュータシステムもまた広義のコンピュータである。また、装置200は、コンピュータ内で1または複数実行可能な仮想コンピュータ環境によって実装されてもよい。これに代えて、装置200は、AI制御用に設計された専用コンピュータであってもよく、専用回路によって実現された専用ハードウェアであってもよい。また、装置200がインターネットに接続可能な場合、装置200は、クラウドコンピューティングにより実現されてもよい。
【0024】
装置200は、測定値取得部201と、目標値取得部202と、偏差取得部203と、制御パラメータ取得部204と、制御モデル205と、特定部207と、選択部208と、供給部209と、制御部210と、学習処理部211とを有してよい。なお、これらブロックは、それぞれ機能的に分離された機能ブロックであって、実際のデバイス構成とは必ずしも一致していなくてもよい。即ち、本図において、1つのブロックとして示されている場合であっても、それが1つのデバイスにより構成されるものに限定されない。また、本図において、別々のブロックとして示されている場合であっても、それらが別々のデバイスにより構成されるものに限定されない。
【0025】
<1.2―1.測定値取得部201>
測定値取得部201は、制御対象101に関する状態の測定値PVを取得する。本実施形態では一例として、測定値取得部201は、一の物理量についての測定値PVを一のセンサ102から取得することとして説明するが、複数の物理量のそれぞれについての測定値PVを複数のセンサ102から取得してもよい。測定値取得部201は、取得した測定値PVを偏差取得部203に供給してよい。
【0026】
<1.2-2.目標値取得部202>
目標値取得部202は、制御対象101に関する状態の目標値SP(Set Point)を取得する。目標値取得部202は、測定値取得部201により取得される測定値PVの目標値SPを取得してよい。目標値取得部202は、図示しない入力部を介してオペレータから目標値SPを取得してよい。本実施形態では一例として目標値取得部202は、予め設定された基準目標値を目標値SPとして取得してよい。目標値取得部202は、取得した目標値SPを偏差取得部203に供給してよい。
【0027】
<1.2-3.偏差取得部203>
偏差取得部203は、第1取得部の一例であり、制御対象101に関する状態の測定値PVおよび目標値SPの偏差を取得する。偏差取得部203は、測定値取得部201から測定値PVを、目標値取得部202から目標値SPを取得し、目標値SPから測定値PVを減算して偏差を算出してよい。これに代えて、偏差取得部203は、測定値PVから目標値SPを減算して偏差を算出してもよい。偏差取得部203は、取得した偏差を特定部207および供給部209に供給してよい。偏差取得部203は、取得した偏差を、図示しない記憶部に記憶させてよい。
【0028】
<1.2-4.制御パラメータ取得部204>
制御パラメータ取得部204は、第2取得部の一例であり、制御対象101に対して供給された制御パラメータPを取得する。制御パラメータ取得部204は、後述の制御部210から制御パラメータPを取得してよく、本実施形態では一例として、制御部210が制御対象101に制御パラメータPを供給するごとに当該制御パラメータPを取得してよい。制御パラメータPは、制御対象101の操作量MVについての指示値IVを示してよい。制御対象101がバルブである場合には、制御パラメータPは一例としてバルブ開度を示してよい。制御パラメータ取得部204は、取得した制御パラメータPを供給部209に供給してよい。
【0029】
<1.2-5.制御モデル205>
制御モデル205は、偏差および制御パラメータPが入力されることに応じて、制御対象101に供給することを推奨する推奨制御パラメータPrを出力する。制御モデル205は、偏差と、一の制御対象101に供給された制御パラメータPとが入力されることに応じて、当該一の制御対象101に供給することを推奨する推奨制御パラメータPrを出力してよい。推奨制御パラメータPrは、制御対象101の操作量MVについての、推奨される指示値IVを示してよい。
【0030】
制御モデル205は、後述の供給部209から偏差と、制御パラメータPとを入力されることに応じて、後述の制御部210に推奨制御パラメータPrを出力してよい。本実施形態では一例として、制御モデル205には一の物理量についての測定値PVおよび目標値SPの偏差が入力されることとして説明するが、複数の物理量についての測定値PVおよび目標値SPの偏差がそれぞれ入力されることとしてもよい。
【0031】
制御モデル205は、制御対象101に関する状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデル206(本実施形態では一例として2つのサブ制御モデル206a,206b)を有し、測定値PVに応じた局面に対応付けられたサブ制御モデル206を用いて推奨制御パラメータPrを出力してよい。局面とは、ある時点での制御対象101に関する状態であってよい。例えば、複数の局面には、測定値PVが目標値SPに近い第1の局面と、測定値PVが目標値SPから遠い第2の局面とが含まれてよい。
【0032】
<1.2-5(1).サブ制御モデル206>
各サブ制御モデル206は、それぞれ偏差、および、制御パラメータの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータを出力してよい。複数のサブ制御モデル206は、互いに独立して別々に設けられ、後述の供給部209から互いに独立に偏差および制御パラメータを取得可能であってよい。2つのサブ制御モデル206a、206bは、共通の目標値SPに対応付けられてよく、それぞれ共通の目標値SPと測定値PVとの偏差、および、制御パラメータの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータを出力してよい。
【0033】
本実施形態では一例としてサブ制御モデル206aは、測定値PVが目標値SPに近い(つまり偏差が小さい)第1の局面において、細かい間隔や粒度(細かさ、精度とも称する)の推奨制御パラメータを出力するものであってよい。サブ制御モデル206aは、速度よりも精度を優先して制御対象101を制御するためのものであってよく、精度重視型のサブ制御モデル206aとも称される。
【0034】
サブ制御モデル206bは、測定値PVが目標値SPから遠い(つまり偏差が大きい)第2の局面において、サブ制御モデル206aよりも大きい間隔や粒度の推奨制御パラメータを出力するものであってよい。サブ制御モデル206bは、精度よりも速度を優先して制御対象101を制御するためのものであってよく、速度重視型のサブ制御モデル206bとも称される。
【0035】
サブ制御モデル206a,206bには、入力される偏差について、互いに異なる数値範囲が設定されてよい。例えば、サブ制御モデル206aには、入力される偏差の数値範囲として、0を含み絶対値が小さい範囲(一例として、-1から1までの範囲。第1の数値範囲とも称する)が設定されてよく、サブ制御モデル206bには、0を含まず第1の数値範囲よりも絶対値が大きい範囲(一例として、-1以下および1以上の範囲。第2の数値範囲とも称する)が設定されてよい。第1の数値範囲および第2の数値範囲は互いに重複しなくてよく、第1の数値範囲は、第2の数値範囲の内側の範囲であってよい。各サブ制御モデル206は、変更量出力モデル2061と、加算部2062とを有してよい。
【0036】
<1.2-5(1-1).変更量出力モデル2061>
各サブ制御モデル206の各変更量出力モデル2061は、偏差および制御パラメータPが入力されることに応じて、当該制御パラメータPについて変更することを推奨する推奨変更量を出力する。各サブ制御モデル206の変更量出力モデル2061は、互いに異なる範囲の推奨変更量を出力してよい。本実施形態では一例として、サブ制御モデル206aの変更量出力モデル2061(変更量出力モデル2061aとも称する)から出力される推奨変更量は、サブ制御モデル206bの変更量出力モデル2061(変更量出力モデル2061bとも称する)から出力される推奨変更量と比較して、オーダ(桁数とも称する)や間隔、粒度が小さくてよい。変更量出力モデル2061bの推奨変更量は、最大値および最小値と、中間値(一例として0)との3種類のみであってよく、フルアクセル・フルブレーキ制御に近似した制御によって測定値PVを目標値SPに近づけてよい。変更量出力モデル2061aの推奨変更量は、変更量出力モデル2061bよりも多くの値を有してよい。
【0037】
変更量出力モデル2061は、推奨変更量を加算部2062に供給してよい。推奨変更量は、制御対象101に対して供給された直近の制御パラメータPから変更することを推奨する変更量を示してよい。本実施形態では一例として推奨変更量は、操作量MVについての直近の指示値IVについての推奨される変更量を示してよい。変更量出力モデル2061は、学習処理部211による学習処理によって生成されてよく、図示しない記憶部に記憶されていてよい。
【0038】
<1.2-5(1-2).加算部2062>
加算部2062は、制御対象101に供給された制御パラメータPと、変更量出力モデル2061から出力される推奨変更量とを加算して推奨制御パラメータPrを算出する。加算部2062は、サブ制御モデル206a,206bにより共有されてよい。加算部2062は、制御対象101に供給された制御パラメータPと、サブ制御モデル206aの変更量出力モデル2061aから出力される推奨変更量とを加算して推奨制御パラメータPrを算出すると共に、制御対象101に供給された制御パラメータPと、サブ制御モデル206bの変更量出力モデル2061bから出力される推奨変更量とを加算して推奨制御パラメータPrを算出してよい。
【0039】
加算部2062は、制御部210から供給された直近の制御パラメータPと、変更量出力モデル2061から供給された推奨変更量とを加算して推奨制御パラメータPrを算出してよい。加算部2062は、次の(1)式に示すように、時点t-1での制御パラメータP(t-1)と、時点tでの推奨変更量Δu(t)とを加算して、時点tでの推奨制御パラメータPr(t)を算出してよい。
Pr(t)=P(t-1)+Δu(t) (1)
【0040】
加算部2062は、制御部210から供給される制御パラメータPを記憶して、推奨制御パラメータPrの算出に用いてよい。加算部2062は、算出された推奨制御パラメータPrを制御部210に供給してよい。
【0041】
<1.2-6.特定部207>
特定部207は、複数の局面のうち、測定値PVに応じた局面を特定する。特定部207は、偏差取得部203から供給される偏差に応じて局面を特定してよい。特定部207は、予め設定された複数の数値範囲の何れに偏差が含まれるかに応じて局面を特定してよい。特定部207は、サブ制御モデル206a,206bに予め設定された、入力される偏差についての第1の数値範囲および第2の数値範囲の何れに対し、偏差取得部203からの偏差が含まれるかに応じて局面を特定してよい。
【0042】
特定部207は、数値範囲と、局面の識別情報(局面IDとも称する)とを対応付けて記憶してよく、偏差取得部203からの偏差を含む数値範囲に対応付けられた局面を特定してよい。本実施形態では一例として、特定部207は、偏差取得部203からの偏差が第1の数値範囲に含まれることに応じて第1の局面を、測定値PVに応じた局面として特定してよい。特定部207は、偏差取得部203からの偏差が第2の数値範囲に含まれることに応じて第2の局面を、測定値PVに応じた局面として特定してよい。特定部207は、特定した局面の局面IDを選択部208に供給してよい。
【0043】
<1.2-7.選択部208>
選択部208は、複数のサブ制御モデル206のうち、特定部207により特定された局面に対応するサブ制御モデル206を選択する。選択部208は、各局面の局面IDと、各サブ制御モデル206の識別情報(サブモデルIDとも称する)とを対応付けて記憶してよく、特定部207から供給される局面IDに対応するサブモデルIDのサブ制御モデル206を選択してよい。選択部208は、選択したサブ制御モデル206のサブモデルIDを供給部209に供給してよい。
【0044】
<1.2-8.供給部209>
供給部209は、制御モデル205に対し、偏差取得部203により取得された偏差と、制御パラメータ取得部204により取得された制御パラメータPとを供給する。供給部209は、制御部210から制御対象101に供給された制御パラメータPと、当該制御パラメータPにより制御対象101を制御した結果の運転状態を示す偏差とを制御モデル205に供給してよい。
【0045】
供給部209は、制御モデル205における複数のサブ制御モデル206のうち、選択部208により選択されたサブ制御モデル206に対して偏差および制御パラメータを供給してよい。本実施形態では一例として供給部209は、選択部208から供給されるサブモデルIDで示されるサブ制御モデル206に対して供給を行ってよい。
【0046】
<1.2-9.制御部210>
制御部210は、出力部の一例であり、供給部209から制御モデル205に対する供給が行われたことに応じて当該制御モデル205から出力される推奨制御パラメータPrを出力する。本実施形態では一例として、制御部210は、推奨制御パラメータPrを制御パラメータPとして制御対象101に出力して、制御対象101を制御してよい。制御部210は、オペレータから入力される制御パラメータPを制御対象101に出力して制御対象101を制御してもよい。制御部210は、制御対象101の制御周期に合わせて制御パラメータPを制御対象101に出力してよい。
【0047】
制御部210は、制御対象101に供給される制御パラメータPを、図示しない記憶部に記憶させてよい。制御部210は、制御対象101に供給される制御パラメータPを、偏差取得部203により取得される偏差と対応付けて記憶部に記憶させてよい。制御部210は、制御対象101に供給される制御パラメータPを、当該制御パラメータPにより制御対象101を制御した結果の運転状態を示す偏差と対応付けて記憶部に記憶させてよい。
【0048】
<1.2-10.学習処理部211>
学習処理部211は、偏差取得部203により取得される偏差と、制御パラメータ取得部204により取得される制御パラメータPと、を含む学習データを用いて各変更量出力モデル2061の学習処理を行う。
【0049】
学習処理部211は、偏差および制御パラメータPの入力に応じ、報酬値を高めるために推奨される推奨変更量を出力するようサブ制御モデル2061の学習を行ってよい。推奨変更量は、所定の時点(一例として偏差および制御パラメータPの取得時点)での制御対象101の状態に対応する報酬値(一例としてその時点の測定値PVに応じた値を報酬関数に入力して得られる報酬値)を基準報酬値とした場合に、当該基準報酬値よりも報酬値を高くするために推奨される変更量であってよい。報酬値は、予め設定された報酬関数により定まる値であってよい。報酬関数は、偏差に基づく関数であってよく、一例として、偏差が小さいほど報酬値が大きくなる関数であってよい。なお、偏差取得部203により複数の物理量のそれぞれについて偏差が取得される場合には、報酬関数は複数の偏差の総和に基づく関数であってもよいし、複数の偏差を重み付け加算した結果に基づく関数であってもよい。学習処理部211は、一例として、カーネルダイナミックポリシープログラミング法(Kernel Dynamic Policy Programming、KDPP)のアルゴリズムにより学習を行ってよい。
【0050】
学習処理部211は、各変更量出力モデル2061に対し、別々の学習データを用いて学習処理を行ってよい。例えば、学習処理部211は、変更量出力モデル2061aの学習処理を行う場合には、偏差が第1の数値範囲に含まれる学習データを用いて学習処理を行ってよい。一例として、学習処理部211は、測定値PVが目標値SPに近い状態において制御対象101を逐次、制御した場合に取得される学習データを用いて学習処理を行ってよい。学習処理部211は、変更量出力モデル2061bの学習処理を行う場合には、偏差が第2の数値範囲に含まれる学習データを用いて学習処理を行ってもよいし、偏差が第1の数値範囲に含まれる学習データをさらに用いて学習処理を行ってもよい。一例として、学習処理部211は、測定値PVが目標値SPから遠い状態において制御対象101を逐次、制御した場合に取得される学習データを用いて学習処理を行ってよい。
【0051】
なお、変更量出力モデル2061aの学習データと、変更量出力モデル2061bの学習データとの間では、偏差の絶対値の数値範囲が互いに異なってよい。例えば、変更量出力モデル2061aの学習データにおける偏差の絶対値の数値範囲は、変更量出力モデル2061bの学習データにおける偏差の絶対値の数値範囲よりも0に近くてよい。一例として、変更量出力モデル2061aの学習データにおける偏差は100、つまり1桁のオーダであってよく、変更量出力モデル2061bの学習データにおける偏差は101のオーダ、つまり2桁の値であってよい。
【0052】
また、変更量出力モデル2061aの学習データと、変更量出力モデル2061bの学習データとの間では、制御パラメータPの数値範囲が互いに異なってよい。例えば、変更量出力モデル2061aの学習データにおける制御パラメータPの数値範囲は、測定値PVが目標値SPに安定する場合の制御パラメータPの値(平衡点での制御パラメータPとも称する)を含む第3の数値範囲内の値であってよい。変更量出力モデル2061bの学習データにおける制御パラメータPの数値範囲は、第3の数値範囲よりも外側の第4の数値範囲内の値であってもよいし、第3の数値範囲および第4の数値範囲内の値であってもよい。変更量出力モデル2061aの学習データにおける制御パラメータPは、変更量出力モデル2061bの学習データにおける制御パラメータPと比較して、間隔や粒度が小さくてよい。
【0053】
学習処理部211は、目標値SPが同一の値である場合に取得される偏差および制御パラメータPを含む学習データを用いて各変更量出力モデル2061の学習処理を行ってよい。なお、学習データは、実際のシステム1から取得される代わりに、システム1のシミュレータ(図示せず)から取得されてもよい。シミュレータは、任意のシステム同定技術により設備100の実測データなどを用いて作成されてよい。各学習データは、図示しない記憶部に記憶されてよい。
【0054】
以上の装置200によれば、制御モデル205では、状態について予め設定された複数の局面にそれぞれ対応付けられた複数のサブ制御モデル206のうち、測定値に応じた局面に対応付けられたサブ制御モデル206が用いられ、偏差取得部203により取得された偏差と、制御パラメータ取得部204により取得された制御パラメータPとが入力されることに応じて推奨制御パラメータPrが出力される。従って、制御モデル205に偏差および制御パラメータPを入力することで、局面に応じた推奨制御パラメータPrを取得することができる。
【0055】
また、測定値PVに応じた局面が特定されて、複数のサブ制御モデル206のうち、特定された局面に対応するサブ制御モデル206が選択され、選択されたサブ制御モデル206に偏差と制御パラメータとが供給される。
従って、局面に応じたサブ制御モデル206を適切に用いて推奨制御パラメータPrを取得することができる。
【0056】
また、予め設定された複数の数値範囲の何れに偏差が含まれるかに応じて局面が特定されるので、偏差の大きさに応じた局面、つまり、目標値SPと測定値PVとの乖離度に応じた局面を特定して、局面に応じた推奨制御パラメータPrを取得することができる。
【0057】
また、サブ制御モデル206a,206bはそれぞれ測定値PVと、共通の目標値SPとの偏差、および、制御パラメータPの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータを出力する。従って、共通の目標値SPと測定値PVとの偏差を小さくするための別々の推奨制御パラメータPrを、局面に応じて取得することができる。よって、平衡点に達する速度を重視して偏差を急激に小さくする推奨制御パラメータPrと、平衡点に達する精度を重視して偏差を穏やかに小さくする推奨制御パラメータPrとを局面に応じて取得することができる。
【0058】
また、各サブ制御モデル206では、偏差と、制御対象101に供給済みの制御パラメータPとに応じて当該制御パラメータPの推奨変更量が変更量出力モデル2061から出力され、当該供給済みの制御パラメータPと、当該推奨変更量とが共通の加算部2062によって加算されて推奨制御パラメータPrが算出される。従って、加算部2062をサブ制御モデル206ごとに設ける場合と異なり、装置200の構成を簡略化することができる。
【0059】
また、サブ制御モデル206a,206bの変更量出力モデル2061は、互いに異なる範囲の推奨変更量を出力するので、偏差を急激に小さくする推奨制御パラメータPrと、偏差を穏やかに小さくする推奨制御パラメータPrとを局面に応じて確実に取得することができる。
【0060】
また、偏差取得部203により取得される偏差と、制御パラメータ取得部204により取得される制御パラメータPと、を含む学習データを用い、偏差および制御パラメータPの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される推奨変更量を出力するよう各変更量出力モデル2061の学習処理が行われる。従って、各サブ制御モデル206から適切な推奨制御パラメータPrを取得することができる。
【0061】
また、各サブ制御モデル206に対し、別々の学習データを用いて学習処理が行われるので、各サブ制御モデル206から局面に適した推奨制御パラメータPrを取得することができる。
【0062】
<2.変更量出力モデル2061>
図2,
図3は、変更量出力モデル2061を示す。なお、
図2,
図3等において縦軸は制御パラメータP(一例としてバルブの開度の指示値IV)を示し、横軸は偏差を示す。
【0063】
変更量出力モデル2061は、偏差および制御パラメータPの組み合わせと、推奨変更量との対応関係を示してよい。本例の変更量出力モデル2061は、偏差および制御パラメータPの組み合わせと、推奨変更量との対応関係をマッピングした操作量マップであってよい。操作量マップは、制御パラメータPと偏差との組み合わせに応じて、それぞれ別々の推奨変更量に対応付けられた複数の領域に分けられてよく、入力される制御パラメータPおよび偏差の組み合わせの座標位置に対応付けられた推奨変更量を出力してよい。このような変更量出力モデル2061を用いると、偏差が0で、かつ、推奨変更量が0の座標点(本図では一例として偏差=0かつ制御パラメータP=約50の点)、つまり平衡点でプロセスが安定状態となる。
【0064】
ここで、
図2の変更量出力モデル2061は、偏差が小さい局面において細かい間隔や粒度の推奨制御パラメータを出力する変更量出力モデル2061aであり、
図3の変更量出力モデル2061は、偏差が大きい局面において大きい間隔や粒度の推奨制御パラメータを出力する変更量出力モデル2061bであってよい。変更量出力モデル2061aには、入力される偏差について-1.00~1.00が第1の数値範囲として設定されてよく、変更量出力モデル2061bには、入力される偏差について-50~50が第2の数値範囲として設定されてよい。変更量出力モデル2061aから出力される推奨変更量は10
-2~10
-1のオーダであってよく、変更量出力モデル2061bから出力される推奨変更量は10
0のオーダであってよい。
【0065】
なお、変更量出力モデル2061は、操作量マップの全域に関する情報を含んでよい。これに代えて、変更量出力モデル2061は、各領域の境界を示す情報(一例として境界を示す座標や関数式)と、各領域に対応する推奨変更量とのみを含んでもよい。この場合には、変更量出力モデル2061を記憶するための記憶領域を小さくすることができる。
【0066】
図4、
図5は、変更量出力モデル2061の他の例を示す。
図4は
図2と同内容の変更量出力モデル2061aを示してよく、
図5は
図3と同内容の変更量出力モデル2061bを示してよい。これらの図に示すように、変更量出力モデル2061は、偏差および制御パラメータPの組み合わせと、推奨変更量とを対応付けたテーブルであってもよい。
【0067】
<3.動作>
図6は、装置200の動作を示す。装置200は、ステップS11~S23の処理を行うことにより、制御対象101を制御してよい。なお、この動作は装置200が起動されることに応じて開始してよい。また、動作の開始時点においては変更量出力モデル2061の学習処理が完了しており、目標値SPが基準目標値に設定されていてよい。
【0068】
ステップS11において測定値取得部201は、制御対象101に関する状態の測定値PVを取得する。目標値取得部202は、設備100のセンサ102から測定値PVを取得してよい。
【0069】
ステップS13において偏差取得部203は、目標値SP(本実施形態では一例として基準目標値)と、ステップS13で取得された測定値PVとの偏差を取得する。
【0070】
ステップS15において特定部207は、複数の局面のうち、測定値PVに応じた局面を特定する。本実施形態では一例として特定部207は、偏差取得部203からの偏差が第1の数値範囲および第2の数値範囲の何れに含まれるかに応じて第1の局面および第2の局面の何れかを特定してよい。
【0071】
ステップS17において選択部208は、複数のサブ制御モデル206のうち、特定部207により特定された局面に対応するサブ制御モデル206を選択する。本実施形態では一例として選択部208は、第1の局面が特定されたことに応じてサブ制御モデル206aを選択し、第2の局面が特定されたことに応じてサブ制御モデル206bを選択してよい。
【0072】
ステップS19において制御パラメータ取得部204は、制御対象101に対して供給された制御パラメータPを取得する。制御パラメータ取得部204は、直近の制御周期において制御対象101に供給された制御パラメータPを制御部210から取得してよい。一例として、制御パラメータ取得部204は、後述のステップS23の処理で制御部210から制御対象101に出力される制御パラメータPを取得して一時保存しておき、ステップS19において当該制御パラメータPを読み出してよい。ステップS19が最初に実行される場合、つまりステップS23の処理が実行されていない場合には、制御パラメータ取得部204は、予め設定された制御パラメータPの初期値を取得してよい。
【0073】
ステップS21において供給部209は、制御パラメータ取得部204から供給された制御パラメータPと、偏差取得部203から供給された偏差とを制御モデル205に供給する。本実施形態では一例として供給部209は、制御モデル205における複数のサブ制御モデル206のうち、選択されたサブ制御モデル206に偏差および制御パラメータPを供給する。これにより、入力された制御パラメータPおよび偏差に応じた推奨制御パラメータPrが、局面に応じたサブ制御モデル206から出力される。本実施形態では一例として、入力された制御パラメータPおよび偏差に応じた推奨変更量が変更量出力モデル2061から出力され、推奨変更量と、ステップS17で取得された制御パラメータPとが加算部2062により加算されて推奨制御パラメータPrが生成されてよい。
【0074】
ステップS23において制御部210は、制御モデル205からの推奨制御パラメータPrを出力する。制御部210は、推奨制御パラメータPrを制御パラメータPとして制御対象101に供給して、制御対象101を制御してよい。ステップS23の処理が終了したら、ステップS11に処理が移行してよい。
【0075】
<4.動作例>
図7は、制御対象101が制御される場合の測定値PVおよび制御パラメータPの推移を示す。図中の横軸は時間(秒)を示し、縦軸は測定値PVおよび制御パラメータPを示す。なお、本図では一例として制御パラメータPは、バルブの開度の指示値IVを示してよい。
【0076】
この図に示されるように、本実施形態に係る装置200では、偏差が第2の数値範囲に含まれることに応じて速度重視のサブ制御モデル206bから出力される推奨制御パラメータPrを用いて制御対象101のバルブが制御される。本図では一例として、バルブの開度は±10%の変更量で大まかに制御される。そして、偏差が第1の数値範囲に含まれることに応じて精度重視のサブ制御モデル206aから出力される推奨制御パラメータPrを用いて制御対象101が制御される。本図では一例として、バルブの開度は±0.1%の変更量で細かに制御される。これにより、局面に応じた推奨制御パラメータPrにより制御対象101が制御される結果、高速かつ高精度に測定値PVを目標値SPに維持することができる。
【0077】
<5.変形例>
<5.1.システム1A>
図8は、変形例に係るシステム1Aを示す。なお、
図1に示されたシステム1と略同一のものには同一の符号を付け、説明を省略する。システム1Aは装置200Aを備える。装置200Aは、特定部207Aと、目標値設定部212Aと、制御モデル205Aと、学習処理部211Aとを有してよい。
【0078】
<5.1.1.特定部207A>
特定部207Aは、複数の局面のうち、測定値PVに応じた局面を特定する。本変形例に係る特定部207Aは、測定値取得部201から供給される測定値PVに応じて局面を特定してよい。特定部207Aは、予め設定された複数の数値範囲の何れに測定値が含まれるかに応じて局面を特定してよい。特定部207Aは、制御モデル205Aにおける後述のサブ制御モデル206c~206fに対して予め設定された、測定値PVについての第3の数値範囲から第6の数値範囲の何れに対し、測定値取得部201からの測定値PVが含まれるかに応じて局面を特定してよい。
【0079】
特定部207Aは、数値範囲と、各局面の局面IDとを対応付けて記憶してよく、測定値取得部201からの測定値を含む数値範囲に対応付けられた局面を特定してよい。本実施形態では一例として、特定部207Aは、測定値PVが第3の数値範囲に含まれることに応じて第3の局面を、測定値PVに応じた局面として特定してよい。特定部207Aは、測定値PVが第4の数値範囲に含まれることに応じて第4の局面を、測定値PVに応じた局面として特定してよい。特定部207Aは、測定値PVが第5の数値範囲に含まれることに応じて第5の局面を、測定値PVに応じた局面として特定してよい。特定部207Aは、測定値PVが第6の数値範囲に含まれることに応じて第6の局面を、測定値PVに応じた局面として特定してよい。
【0080】
特定部207Aは、特定した局面の局面IDを選択部208および目標値設定部212Aに供給してよい。特定部207Aから選択部208に局面IDが供給されることにより、制御モデル205Aにおける複数のサブ制御モデル206のうち、特定された局面に対応するサブ制御モデル206が選択部208によって選択されてよい。
【0081】
<5.1.2.目標値設定部212A>
目標値設定部212Aは、設定部の一例であり、特定部207Aにより特定された局面に応じて目標値SPを設定する。目標値設定部212Aは、後述のサブ制御モデル206c~206fそれぞれの固有目標値の何れかを目標値SPとして設定してよい。目標値設定部212Aは、各サブ制御モデル206c~206fの固有目標値と、各局面の局面IDとを対応付けて記憶してよく、特定部207Aから供給される局面IDに対応する固有目標値を、新たな目標値SPに設定してよい。目標値設定部212Aは、設定した目標値SPを目標値取得部202に供給してよい。これにより、新たな目標値SPが目標値取得部202から偏差取得部203に供給され、偏差取得部203では新たな目標値SPと測定値PVとの偏差が取得されてよい。
【0082】
<5.1.3.制御モデル205A>
制御モデル205Aは、上述の実施形態における制御モデル205と同様にして、偏差および制御パラメータPが入力されることに応じて、制御対象101に供給することを推奨する推奨制御パラメータPrを出力する。本変形例に係る制御モデル205Aは、制御対象101に関する状態について予め設定された複数の局面にそれぞれ対応付けられた4つのサブ制御モデル206(サブ制御モデル206c~206fとも称する)を有してよく、測定値PVに応じた局面に対応付けられたサブ制御モデル206を用いて推奨制御パラメータPrを出力してよい。
【0083】
サブ制御モデル206c~206fは目標値の値ごとに設けられてよく、互いに異なる固有目標値に対応付けられてよい。各固有目標値は、目標値設定部212Aにより目標値SPとして用いられてよい。サブ制御モデル206c~206fは、固有目標値と測定値PVとの偏差、および、制御パラメータPの入力に応じ、当該偏差を小さくするために推奨される推奨制御パラメータPrを出力してよい。本変形例では一例として、局面に応じてサブ制御モデル206c~206fが選択部208により選択され、選択されるサブ制御モデル206の固有目標値が目標値設定部212Aにより目標値SPとして設定されるため、サブ制御モデル206c~206fは、それぞれ選択された場合に目標値SPとしての固有目標値と、測定値PVとの偏差、および、制御パラメータPの入力に応じて推奨制御パラメータPrを出力することとなる。
【0084】
サブ制御モデル206c~206fは、それぞれ変更量出力モデル2061c~2061fを有してよい。変更量出力モデル2061c~2061fは、偏差および制御パラメータPが入力されることに応じて、当該制御パラメータPについて変更することを推奨する推奨変更量を出力する。変更量出力モデル2061c~2061fは、互いに異なる範囲の推奨変更量を出力してもよいし、同じ範囲の推奨変更量を出力してもよい。変更量出力モデル2061c~2061fから出力される推奨変更量は間隔や粒度が同程度であってよい。
【0085】
<5.1-4.学習処理部211A>
学習処理部211は、上記実施形態における学習処理部211と同様にして各変更量出力モデル2061c~2061fの学習処理を行う。学習処理部211Aは、各変更量出力モデル2061c~2061fに対し、別々の学習データを用いて学習処理を行ってよい。
【0086】
例えば、学習処理部211Aは、サブ制御モデル206cの変更量出力モデル2061cの学習処理を行う場合には、偏差が第3の数値範囲に含まれる学習データを用いて学習処理を行ってよい。変更量出力モデル2061cの学習データは、目標値SPをサブ制御モデル206cの固有目標値に予め設定した場合に取得される偏差および制御パラメータPを含んでよい。
【0087】
学習処理部211Aは、サブ制御モデル206dの変更量出力モデル2061dの学習処理を行う場合には、偏差が第4の数値範囲に含まれる学習データを用いて学習処理を行ってよい。変更量出力モデル2061dの学習データは、目標値SPをサブ制御モデル206dの固有目標値に予め設定した場合に取得される偏差および制御パラメータPを含んでよい。
【0088】
学習処理部211Aは、サブ制御モデル206eの変更量出力モデル2061eの学習処理を行う場合には、偏差が第5の数値範囲に含まれる学習データを用いて学習処理を行ってよい。変更量出力モデル2061eの学習データは、目標値SPをサブ制御モデル206eの固有目標値に予め設定した場合に取得される偏差および制御パラメータPを含んでよい。
【0089】
学習処理部211Aは、サブ制御モデル206fの変更量出力モデル2061fの学習処理を行う場合には、偏差が第6の数値範囲に含まれる学習データを用いて学習処理を行ってよい。変更量出力モデル2061fの学習データは、目標値SPをサブ制御モデル206fの固有目標値に予め設定した場合に取得される偏差および制御パラメータPを含んでよい。
【0090】
なお、変更量出力モデル2061c~2061fの学習データの間では、偏差の絶対値が同程度であってよく、一例として偏差のオーダが等しくてよい。なお、学習データは、実際のシステム1Aから取得される代わりに、システム1Aのシミュレータ(図示せず)から取得されてもよい。
【0091】
以上の装置200Aによれば、予め設定された複数の数値範囲の何れに測定値PVが含まれるかに応じて局面が特定されるので、測定値PVに応じた局面を特定して、局面に応じた推奨制御パラメータPrを取得することができる。
【0092】
また、局面に応じてサブ制御モデル206c~206fの何れかの固有目標値が目標値SPとして設定され、サブ制御モデル206c~206fのうち局面に応じたサブ制御モデル206により、目標値SPとしての固有目標値と測定値PVとの偏差、および、制御パラメータPに応じた推奨制御パラメータPrが出力される。従って、プロセスの進行に応じて目標値SPを切り替えつつ、切り替え後の目標値SPと測定値PVとの偏差を小さくするための推奨制御パラメータPrを取得することができる。
【0093】
<5.2.対応テーブル>
図9は、局面IDと、測定値PVの数値範囲と、サブモデルIDと、固有目標値との対応を示す。図中の「K3」~「K6」は、第3の局面から第6の局面の局面IDであってよい。「PVc
min~PVc
max」,「PVd
min~PVd
max」,「PVe
min~PVe
max」,「PVf
min~PVf
max」はそれぞれ測定値PVの数値範囲を示してよい。「206c」~「206f」はサブ制御モデル206c~206fのサブモデルIDであってよい。「SPc」~「SPf」はサブ制御モデル206c~206fの固有目標値であってよい。
【0094】
特定部207Aは、図中の数値範囲の何れに測定値PVが含まれるかに応じて局面IDを特定してよい。選択部208は、図中の各局面IDのうち、特定された局面IDに対応するサブモデルIDのサブ制御モデル206を選択してよい。目標値設定部212Aは、図中の各局面IDのうち、特定された局面IDに対応する固有目標値を目標値SPとして設定してよい。
【0095】
<5.3.動作>
図10は、装置200Aの動作を示す。装置200Aは、ステップS11~S23の処理を行うことにより、制御対象101を制御してよい。なお、この動作は装置200が起動されることに応じて開始してよい。また、動作の開始時点においては変更量出力モデル2061の学習処理が完了していてよい。第2実施形態に係る装置200Aの動作は、第1実施形態に係る装置200の動作と比較してステップS17,S17の間にステップS31~S35の処理を行う点で異なっている。
【0096】
ステップS31において特定部207Aは、複数の局面のうち、測定値PVに応じた局面を特定する。本変形例では一例として特定部207Aは、測定値PVに応じた局面として、第3の局面~第6の局面の何れかを特定してよい。
【0097】
ステップS33において目標値設定部212Aは、特定部207Aにより特定された局面に応じて目標値SPを設定する。目標値設定部212Aは、サブ制御モデル206c~206fの固有目標値のうち、ステップS31で特定された局面に対応する固有目標値を目標値SPとして設定してよい。
【0098】
ステップS35において偏差取得部203は、目標値SPと測定値PVとの偏差を取得する。偏差取得部203は、ステップS33で設定された目標値SPと、ステップS11で取得された測定値PVとの偏差を取得してよい。ステップS35の処理が終了したら、ステップS17に処理が移行してよい。これにより、複数のサブ制御モデル206c~206fのうち、ステップS31で特定された局面に対応するサブ制御モデル206が選択される。
【0099】
<5.4.動作例>
図11は、制御対象101が制御される場合の測定値PVの推移を示す。図中の横軸は時間(秒)を示し、縦軸は測定値PVを示す。なお、本図では一例として制御パラメータPは、炉内の温度の指示値IVを示してよい。
【0100】
この図に示されるように、本変形例に係る装置200Aでは、プロセスの進行に応じて測定値PVが第3の数値範囲に含まれることに応じて第3の局面が特定される。そして、第3の局面に応じた目標値SPと測定値PVとの偏差、および、制御パラメータPがサブ制御モデル206cに入力されて出力される推奨制御パラメータPrを用いて、制御対象101が制御される。
【0101】
同様に、測定値PVが第4の数値範囲に含まれることに応じて第4の局面が特定される。そして、第4の局面に応じた目標値SPと測定値PVとの偏差、および、制御パラメータPがサブ制御モデル206dに入力されて出力される推奨制御パラメータPrを用いて、制御対象101が制御される。
【0102】
同様に、測定値PVが第5の数値範囲に含まれることに応じて第5の局面が特定される。そして、第5の局面に応じた目標値SPと測定値PVとの偏差、および、制御パラメータPがサブ制御モデル206eに入力されて出力される推奨制御パラメータPrを用いて、制御対象101が制御される。
【0103】
そして、測定値PVが第6の数値範囲に含まれることに応じて第6の局面が特定される。そして、第6の局面に応じた目標値SPと測定値PVとの偏差、および、制御パラメータPがサブ制御モデル206fに入力されて出力される推奨制御パラメータPrを用いて、制御対象101が制御される。
【0104】
<6.他の変形例>
なお、上記の実施形態および変形例においては、制御モデル205,205Aが変更量出力モデル2061と加算部2062とを有することとして説明したが、偏差および制御パラメータPが入力されることに応じて推奨制御パラメータPrを出力する限りにおいて、これらを有しなくてもよい。この場合には、制御モデル205,205Aは、カーネルダイナミックポリシープログラミング法や深層強化学習、サポートベクトルマシン、ロジスティック回帰、決定木、ニューラルネットワークなどのアルゴリズムにより生成された学習モデルであってよい。学習処理部211,211Aは、偏差取得部203により取得された偏差と、制御パラメータ取得部204により取得された制御パラメータPと、を含む学習データを用いて制御モデル205,205Aの学習処理を行ってよい。
【0105】
また、変更量出力モデル2061をカーネルダイナミックポリシープログラミング法の学習アルゴリズムにより生成されたマップやテーブルとして説明したが、深層強化学習やサポートベクトルマシン、ロジスティック回帰、決定木、ニューラルネットワークなどの他のアルゴリズムにより生成されてもよいし、マップやテーブルとは異なる他の形態のモデルであってもよい。
【0106】
また、変更量出力モデル2061には偏差および制御パラメータPが入力されることとして説明したが、他の値がさらに入力されてよい。他の値は、例えばセンサ102による測定値の微分値や積分値であってよい。
【0107】
また、装置200,200Aが測定値取得部201、目標値取得部202、学習処理部211を有することとして説明したが、これらの何れかを有しなくてもよい。装置200,200Aが測定値取得部201および目標値取得部202を有しない場合には、偏差取得部203は外部機器で算出された偏差を取得してよい。装置200,200Aが学習処理部211,211Aを有しない場合には、予め外部機器で学習された変更量出力モデル2061を有してよい。
【0108】
また、各サブ制御モデル206は独立して別々に設けられ供給部209から独立に偏差及び制御パラメータを供給されることとして説明したが、統合して設けられてもよい。この場合には各サブ制御モデル206は、制御モデル205,205Aの各部分を構成してよい。一例として、制御モデル205、205Aは、偏差および制御パラメータPの組み合わせと、推奨制御パラメータPrとの対応関係をマッピングした操作量マップであってよく、各サブ制御モデル206は当該操作量マップの中央部分や周辺部分であってよい。複数のサブ制御モデル206が統合して制御モデル205を構成する場合には、装置200,200Aは特定部207および選択部208を有しなくてよく、供給部209が制御モデル205,205Aに対して偏差および制御パラメータPを入力することに応じ、当該制御モデル205,205Aにおける各サブ制御モデル206のうち、該当のサブ制御モデル206の部分から推奨制御パラメータPrが出力されてよい。このような制御モデル205,205Aは、学習処理部211,211Aによって生成される別々のサブ制御モデル206に対して共通の入力部を設け、供給部209から供給される偏差および制御パラメータPが数値範囲に応じて何れかのサブ制御モデル206に入力されるよう設定することで生成されてよい。
【0109】
また、上記の実施形態においては制御モデル205には、共通の目標値SPに対応付けられた2つのサブ制御モデル206a,206bを有することとして説明したが、共通の目標値SPに対応付けられた3つ以上のサブ制御モデル206を有してもよい。また、制御モデル205は、目標値が異なる他のサブ制御モデル206をさらに有してもよい。
【0110】
また、本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
【0111】
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0112】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。
【0113】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0114】
図12は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。コンピュータ2200にインストールされたプログラムは、コンピュータ2200に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ2200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ2200に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU2212によって実行されてよい。
【0115】
本実施形態によるコンピュータ2200は、CPU2212、RAM2214、グラフィックコントローラ2216、およびディスプレイデバイス2218を含み、それらはホストコントローラ2210によって相互に接続されている。コンピュータ2200はまた、通信インタフェース2222、ハードディスクドライブ2224、DVD-ROMドライブ2226、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ2220を介してホストコントローラ2210に接続されている。コンピュータはまた、ROM2230およびキーボード2242のようなレガシの入/出力ユニットを含み、それらは入/出力チップ2240を介して入/出力コントローラ2220に接続されている。
【0116】
CPU2212は、ROM2230およびRAM2214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ2216は、RAM2214内に提供されるフレームバッファ等またはそれ自体の中にCPU2212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス2218上に表示されるようにする。
【0117】
通信インタフェース2222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ2224は、コンピュータ2200内のCPU2212によって使用されるプログラムおよびデータを格納する。DVD-ROMドライブ2226は、プログラムまたはデータをDVD-ROM2201から読み取り、ハードディスクドライブ2224にRAM2214を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。
【0118】
ROM2230はその中に、アクティブ化時にコンピュータ2200によって実行されるブートプログラム等、および/またはコンピュータ2200のハードウェアに依存するプログラムを格納する。入/出力チップ2240はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ2220に接続してよい。
【0119】
プログラムが、DVD-ROM2201またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ2224、RAM2214、またはROM2230にインストールされ、CPU2212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ2200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ2200の使用に従い情報の操作または処理を実現することによって構成されてよい。
【0120】
例えば、通信がコンピュータ2200および外部デバイス間で実行される場合、CPU2212は、RAM2214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インタフェース2222に対し、通信処理を命令してよい。通信インタフェース2222は、CPU2212の制御下、RAM2214、ハードディスクドライブ2224、DVD-ROM2201、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
【0121】
また、CPU2212は、ハードディスクドライブ2224、DVD-ROMドライブ2226(DVD-ROM2201)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM2214に読み取られるようにし、RAM2214上のデータに対し様々なタイプの処理を実行してよい。CPU2212は次に、処理されたデータを外部記録媒体にライトバックする。
【0122】
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU2212は、RAM2214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM2214に対しライトバックする。また、CPU2212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU2212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0123】
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ2200上またはコンピュータ2200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ2200に提供する。
【0124】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0125】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0126】
1 システム
100 設備
101 制御対象
102 センサ
200 装置
201 測定値取得部
202 目標値取得部
203 偏差取得部
204 制御パラメータ取得部
205 制御モデル
206 サブ制御モデル
207 特定部
208 選択部
209 供給部
210 制御部
211 学習処理部
212 目標値設定部
206 サブ制御モデル
2061 変更量出力モデル
2062 加算部
2200 コンピュータ
2201 DVD-ROM
2210 ホストコントローラ
2212 CPU
2214 RAM
2216 グラフィックコントローラ
2218 ディスプレイデバイス
2220 入/出力コントローラ
2222 通信インタフェース
2224 ハードディスクドライブ
2226 DVD-ROMドライブ
2230 ROM
2240 入/出力チップ
2242 キーボード