IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 横河電機株式会社の特許一覧

特許7484382制御装置、制御方法および制御プログラム
<>
  • 特許-制御装置、制御方法および制御プログラム 図1
  • 特許-制御装置、制御方法および制御プログラム 図2
  • 特許-制御装置、制御方法および制御プログラム 図3
  • 特許-制御装置、制御方法および制御プログラム 図4
  • 特許-制御装置、制御方法および制御プログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-08
(45)【発行日】2024-05-16
(54)【発明の名称】制御装置、制御方法および制御プログラム
(51)【国際特許分類】
   G05B 13/02 20060101AFI20240509BHJP
【FI】
G05B13/02 L
【請求項の数】 16
(21)【出願番号】P 2020077843
(22)【出願日】2020-04-24
(65)【公開番号】P2021174259
(43)【公開日】2021-11-01
【審査請求日】2023-02-28
(73)【特許権者】
【識別番号】000006507
【氏名又は名称】横河電機株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】▲高▼見 豪
(72)【発明者】
【氏名】西條 史雄
(72)【発明者】
【氏名】田中 覚
【審査官】西井 香織
(56)【参考文献】
【文献】国際公開第2018/179191(WO,A1)
【文献】特開2020-046965(JP,A)
【文献】特開2002-258952(JP,A)
【文献】国際公開第2019/087374(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/02
(57)【特許請求の範囲】
【請求項1】
制御対象機器について測定された測定値を取得する取得部と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御部と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御部と、
前記第1制御部と前記第2制御部とのいずれによって前記制御対象機器を制御するかの切替を行う切替部と
を備え
前記切替部は、前記測定値と目標値との差に応じて前記第1制御部による制御から、前記第2制御部による制御への前記切替を行う制御装置。
【請求項2】
前記切替部は、基準タイムウィンドウ内で前記測定値と前記目標値との差が複数回、基準値よりも大きくなったことに応じて、前記第1制御部による制御から、前記第2制御部による制御への切り替えを行う、請求項に記載の制御装置。
【請求項3】
制御対象機器について測定された測定値を取得する取得部と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御部と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御部と、
前記第1制御部と前記第2制御部とのいずれによって前記制御対象機器を制御するかの切替を行う切替部と
を備え
前記切替部は、前記測定値と目標値との差が基準値よりも小さくなったことに応じて前記第2制御部による制御から、前記第1制御部による制御への切替を行う制御装置。
【請求項4】
制御対象機器について測定された測定値を取得する取得部と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御部と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御部と、
前記第1制御部と前記第2制御部とのいずれによって前記制御対象機器を制御するかの切替を行う切替部と
を備え
前記切替部は、
前記制御対象機器に対する制御の開始から基準時間が経過するまでは前記第2制御部による制御を行わせ、
前記制御対象機器に対する制御の開始から前記基準時間が経過した後は前記第1制御部による制御を行わせる制御装置。
【請求項5】
前記第1制御部は、前記測定値と目標値とに基づいて算出される操作量を出力し、
前記第2制御部の前記モデルは、前記測定値を含む測定データと、前記制御対象機器の操作量とを含む学習データを用いて学習され、測定データの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される前記制御対象機器の操作量を出力する、請求項1からの何れか一項に記載の制御装置。
【請求項6】
前記報酬関数は、前記測定値が一の目標値に近いほど前記報酬値が高くなる関数であり、
前記切替部は、前記一の目標値に基づく閾値と、前記測定値との比較結果に基づいて前記切替を行う、請求項1~3の何れか一項に従属する請求項5に記載の制御装置。
【請求項7】
前記切替部は、
前記第1制御部による制御から、前記第2制御部による制御への切り替えに用いる閾値と、
前記第2制御部による制御から、前記第1制御部による制御への切り替えに用いる閾値とにヒステリシス特性を持たせる、請求項に記載の制御装置。
【請求項8】
前記第1制御部は、比例制御、積分制御、または、微分制御の少なくとも1つを用いたフィードバック制御を行う、請求項1から7の何れか一項に記載の制御装置。
【請求項9】
前記第1制御部は、
前記測定値が入力されることに応じて、当該測定値に応じた前記制御対象機器の操作量を算出して出力するオートモードと、
出力するべき前記操作量が入力されることに応じて、当該操作量を出力するマニュアルモードとで動作可能であり、
前記第2制御部は、前記制御対象機器の操作量を前記第1制御部に入力し、
前記切替部は、前記第1制御部のモードを切り替えることで前記切替を行う、請求項1から8の何れか一項に記載の制御装置。
【請求項10】
前記第1制御部は、前記マニュアルモードから前記オートモードへ切り替えられた場合に、切替前後の操作量をバンプレスに制御する、請求項9に記載の制御装置。
【請求項11】
制御対象機器について測定された測定値を取得する取得段階と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御段階と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御段階と、
前記第1制御段階と前記第2制御段階とのいずれによって前記制御対象機器を制御するかの切替を行う切替段階と
を備え、
前記切替段階は、前記測定値と目標値との差に応じて前記第1制御段階による制御から、前記第2制御段階による制御への前記切替を行う段階を含む制御方法。
【請求項12】
制御対象機器について測定された測定値を取得する取得段階と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御段階と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御段階と、
前記第1制御段階と前記第2制御段階とのいずれによって前記制御対象機器を制御するかの切替を行う切替段階と
を備え、
前記切替段階は、前記測定値と目標値との差が基準値よりも小さくなったことに応じて前記第2制御段階による制御から、前記第1制御段階による制御への切替を行う段階を含む制御方法。
【請求項13】
制御対象機器について測定された測定値を取得する取得段階と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御段階と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御段階と、
前記第1制御段階と前記第2制御段階とのいずれによって前記制御対象機器を制御するかの切替を行う切替段階と
を備え
前記切替段階は、
前記制御対象機器に対する制御の開始から基準時間が経過するまでは前記第2制御段階による制御を行わせ、
前記制御対象機器に対する制御の開始から前記基準時間が経過した後は前記第1制御段階による制御を行わせる制御方法。
【請求項14】
コンピュータを、
制御対象機器について測定された測定値を取得する取得部と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御部と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御部と、
前記第1制御部と前記第2制御部とのいずれによって前記制御対象機器を制御するかの切替を行う切替部
として機能させ
前記切替部は、前記測定値と目標値との差に応じて前記第1制御部による制御から、前記第2制御部による制御への前記切替を行う制御プログラム。
【請求項15】
コンピュータを、
制御対象機器について測定された測定値を取得する取得部と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御部と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御部と、
前記第1制御部と前記第2制御部とのいずれによって前記制御対象機器を制御するかの切替を行う切替部
として機能させ
前記切替部は、前記測定値と目標値との差が基準値よりも小さくなったことに応じて前記第2制御部による制御から、前記第1制御部による制御への切替を行う制御プログラム。
【請求項16】
コンピュータを、
制御対象機器について測定された測定値を取得する取得部と、
フィードバック制御およびフィードフォワード制御の少なくとも一方により、前記測定値に応じた前記制御対象機器の操作量を出力する第1制御部と、
学習用データを用いて学習したモデルを用いて、前記測定値に応じた前記制御対象機器の操作量を出力する第2制御部と、
前記第1制御部と前記第2制御部とのいずれによって前記制御対象機器を制御するかの切替を行う切替部
として機能させ
前記切替部は、
前記制御対象機器に対する制御の開始から基準時間が経過するまでは前記第2制御部による制御を行わせ、
前記制御対象機器に対する制御の開始から前記基準時間が経過した後は前記第1制御部による制御を行わせる制御プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、制御装置、制御方法および制御プログラムに関する。
【背景技術】
【0002】
従来、機器を制御する種々の手法が提案されている(例えば、特許文献1参照)。
特許文献1 特開2018-202564号公報
【発明の概要】
【0003】
上記課題を解決するために、本発明の第1の態様においては、制御装置が提供される。制御装置は、制御対象機器について測定された測定値を取得する取得部を備えてよい。制御装置は、フィードバック制御およびフィードフォワード制御の少なくとも一方により、測定値に応じた制御対象機器の操作量を出力する第1制御部を備えてよい。制御装置は、学習用データを用いて学習したモデルを用いて、測定値に応じた制御対象機器の操作量を出力する第2制御部を備えてよい。制御装置は、第1制御部と第2制御部とのいずれによって制御対象機器を制御するかの切替を行う切替部を備えてよい。
【0004】
切替部は、測定値と目標値との差に応じて切替を行ってよい。
【0005】
切替部は、基準タイムウィンドウ内で測定値と目標値との差が複数回、基準値よりも大きくなったことに応じて、第1制御部による制御から、第2制御部による制御への切り替えを行ってよい。
【0006】
第1制御部は、測定値と目標値とに基づいて算出される操作量を出力してよい。第2制御部のモデルは、測定値を含む測定データと、制御対象機器の操作量とを含む学習データを用いて学習され、測定データの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される制御対象機器の操作量を出力してよい。
【0007】
報酬関数は、測定値が一の目標値に近いほど報酬値が高くなる関数であってよい。切替部は、一の目標値に基づく閾値と、測定値との比較結果に基づいて切替を行ってよい。
【0008】
切替部は、第1制御部による制御から、第2制御部による制御への切り替えに用いる閾値と、第2制御部による制御から、第1制御部による制御への切り替えに用いる閾値とにヒステリシス特性を持たせてよい。
【0009】
切替部は、制御対象機器に対する制御の開始から基準時間が経過するまでは第2制御部による制御を行わせてよい。切替部は、制御対象機器に対する制御の開始から基準時間が経過した後は第1制御部による制御を行わせてよい。
【0010】
第1制御部は、比例制御、積分制御、または、微分制御の少なくとも1つを用いたフィードバック制御を行ってよい。
【0011】
第1制御部は、測定値が入力されることに応じて、当該測定値に応じた制御対象機器の操作量を算出して出力するオートモードと、出力するべき操作量が入力されることに応じて、当該操作量を出力するマニュアルモードとで動作可能であってよい。第2制御部は、制御対象機器の操作量を第1制御部に入力してよい。切替部は、第1制御部のモードを切り替えることで切替を行ってよい。
【0012】
第1制御部は、マニュアルモードからオートモードへ切り替えられた場合に、切替前後の操作量をバンプレスに制御してよい。
【0013】
本発明の第2の態様においては、制御方法が提供される。制御方法は、制御対象機器について測定された測定値を取得する取得段階を備えてよい。制御方法は、フィードバック制御およびフィードフォワード制御の少なくとも一方により、測定値に応じた制御対象機器の操作量を出力する第1制御段階を備えてよい。制御方法は、学習用データを用いて学習したモデルを用いて、測定値に応じた制御対象機器の操作量を出力する第2制御段階を備えてよい。制御方法は、第1制御段階と第2制御段階とのいずれによって制御対象機器を制御するかの切替を行う切替段階を備えてよい。
【0014】
本発明の第3の態様においては、プログラムが提供される。プログラムは、コンピュータを、制御対象機器について測定された測定値を取得する取得部として機能させてよい。プログラムは、コンピュータを、フィードバック制御およびフィードフォワード制御の少なくとも一方により、測定値に応じた制御対象機器の操作量を出力する第1制御部として機能させてよい。プログラムは、コンピュータを、学習用データを用いて学習したモデルを用いて、測定値に応じた制御対象機器の操作量を出力する第2制御部として機能させてよい。プログラムは、コンピュータを、第1制御部と第2制御部とのいずれによって制御対象機器を制御するかの切替を行う切替部として機能させてよい。
【0015】
なお、上記の発明の概要は、本発明の必要な特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0016】
図1】本実施形態に係るシステム1を示す。
図2】本実施形態に係る制御装置4の学習段階での動作を示す。
図3】本実施形態に係る制御装置4の運用段階での動作を示す。
図4】システム1の適用例を示す。
図5】本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。
【発明を実施するための形態】
【0017】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0018】
[1.システム1の構成]
図1は、本実施形態に係るシステム1を示す。システム1は、設備2と、制御装置4とを備える。
【0019】
[1-1.設備2]
設備2は、複数の機器20を備え付けたものである。例えば設備2は、プラントでもよいし、複数の機器20を複合させた複合装置でもよい。プラントとしては、化学やバイオ等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、上下水やダム等を管理制御するプラント等が挙げられる。本実施形態においては一例として、設備2は、1または複数の機器20と、1または複数のセンサ21とを有する。
【0020】
[1-1-1.機器20]
各機器20は、器具、機械または装置であり、例えば、設備2のプロセスにおける圧力、温度、pH、速度または流量などの少なくとも1つの物理量を制御するバルブ、ポンプ、ヒータ、ファン、モータ、スイッチ等のアクチュエータであってよい。
【0021】
本実施形態においては一例として、設備2には複数の機器20が具備される。各機器20は互いに異種でもよいし、少なくとも一部の2以上の機器20が同種でもよい。
【0022】
各機器20は図示しないネットワークを介して外部から有線または無線で制御されてもよいし、手動で制御されてもよい。複数の機器20のうち少なくとも一部の機器20は、制御装置4によって制御される制御対象機器20(T)であってよい。システム1に複数の制御対象機器20(T)が具備される場合には、これら複数の制御対象機器20(T)は連動して制御される関係(一例として主従関係、独立には制御されない関係)を有してよい。また、各制御対象機器20(T)は、同種の機器20でもよいし、異種の機器20でもよい。
【0023】
なお、複数の機器20のうち少なくとも一部の機器20には、図示しないコントローラが設けられてよい。機器20にコントローラが設けられるとは、機器20にコントローラが内蔵されることであってもよいし、機器20にコントローラが外部接続されることであってもよい。コントローラは、目標値(設定値)が設定されることに応じて、当該目標値と現在値との差分を低減するように機器20をフィードバック制御してよい。制御対象機器20(T)に設けられるコントローラの目標値は制御装置4から供給されてよく、本実施形態では一例として、制御対象機器20(T)の操作量であってよい。フィードバック制御は、比例制御(P制御)、積分制御(I制御)、または、微分制御(D制御)の少なくとも1つを用いた制御であってよい。
【0024】
[1-1-2.センサ21]
各センサ21は、設備2の内外の物理量を測定する。各センサ21は、測定によって得られた測定データを制御装置4に供給してよい。
【0025】
本実施形態においては一例として、設備2には複数のセンサ21が具備される。複数のセンサ21によって測定される複数の測定データは、外部環境データ、フィードバック制御用データ、運転状態データ、または、消費量データの少なくとも1つを含んでよい。
【0026】
外部環境データは、制御対象機器20(T)に対する外乱として作用し得る物理量を示す。例えば、外部環境データは、制御対象機器20(T)の制御に対して外乱として作用し得る物理量(或いは、その変動)を示してよい。一例として、外部環境データは、設備2の外気の温度や湿度、日照、風向き、風量、降水量、他の機器20の制御により変化する物理量等を示してよい。外部環境データは、外乱を検出するのに用いられてよい。
【0027】
フィードバック制御用データは、各制御対象機器20(T)をフィードバック制御するための物理量を示す。フィードバック制御用データは、制御対象機器20(T)について測定された測定値を示してよく、例えば各制御対象機器20(T)による出力値を示してもよいし、出力値によって変化する値を示してもよい。
【0028】
運転状態データは、各制御対象機器20(T)を制御した結果の運転状態を示す。運転状態データは、各制御対象機器20(T)の制御によって変動し得る物理量を示してもよいし、各制御対象機器20(T)の出力値を示してもよい。運転状態データは、フィードバック制御用データと同じであってもよい。
【0029】
消費量データは、設備2によるエネルギーまたは原材料の少なくとも一方の消費量を示す。消費量データは、エネルギー消費量として、電力や燃料(一例としてLPG)の消費量を示してよい。
【0030】
[1-3.制御装置4]
制御装置4は、各制御対象機器20(T)を制御する。制御装置4は、1または複数のコンピュータであってよく、PCなどで構成されてよい。制御装置4は、測定データ取得部40と、操作量取得部41と、報酬値取得部42と、学習処理部44と、AI制御部45と、フィードバック制御部46と、切替部47と、制御部49とを有する。
【0031】
[1-3―1.測定データ取得部40]
測定データ取得部40は、取得部の一例であり、センサ21によって測定された測定データを取得する。測定データ取得部40は、設備2に具備された複数のセンサ21のそれぞれによって測定された測定データを取得してよい。測定データには、各制御対象機器20(T)について測定された測定値が含まれてよい。
【0032】
測定データ取得部40は、制御装置4による各制御対象機器20(T)の制御周期内での測定値の平均値を示す測定データを取得してもよいし、制御インターバル毎の測定値(つまり制御周期の終了タイミングでの測定値)を示す測定データを取得してもよい。本実施形態では一例として、各制御対象機器20(T)の制御周期は同期していてよい。測定データ取得部40は、測定データをセンサ21から取得してもよいし、センサ21を確認したオペレータから取得してもよい。測定データ取得部40は、取得した測定データを学習処理部44およびAI制御部45に供給してよい。また、測定データ取得部40は、各制御対象機器20(T)についての測定値(本実施形態では一例として各制御対象機器20(T)の出力値、或いは、出力値によって変化する値)を、フィードバック制御部46および切替部47に供給してよい。
【0033】
[1-3―2.操作量取得部41]
操作量取得部41は、各制御対象機器20(T)の操作量を取得する。本実施形態では一例として、操作量取得部41は制御部49から操作量を取得するが、オペレータから取得してもよいし、各制御対象機器20(T)から取得してもよい。操作量取得部41は、取得した操作量を学習処理部44に供給してよい。
【0034】
[1-3―3.報酬値取得部42]
報酬値取得部42は、学習処理部44での強化学習に用いられる報酬値を取得する。報酬値は、設備2の操業状態を評価するための値であってよく、予め設定された報酬関数により定まる値であってよい。ここで、関数とは、ある集合の各要素に他の集合の各要素を一対一で対応させる規則を持つ写像であり、例えば数式でもよいし、テーブルでもよい。
【0035】
報酬関数は、測定データの入力に応じて、当該測定データで示される状態を評価した報酬値を出力してよい。報酬関数は、制御対象機器20(T)について測定された測定値が一の目標値に近いほど報酬値が高くなる関数であってよい。一の目標値は、制御対象機器20(T)について測定される測定値についての目標値の固定値であってよく、測定値と同様に、各制御対象機器20(T)による出力値を示してもよいし、出力値によって変化する値を示してもよい。一例として、制御対象機器20(T)がバルブであり、目標値(SV)および測定値(PV)がバルブの開度を示す場合に、報酬値Rは次の報酬関数で示されてよい。
R=1.0-|SV-PV|*0.1
【0036】
報酬関数は、オペレータによって設定されてよい。報酬値取得部42は、報酬関数を使用したオペレータから報酬値を取得してもよいし、センサ21からの測定データを報酬関数に入力して報酬値を取得してもよい。報酬値取得部42が測定データを報酬関数に入力する場合には、報酬関数は制御装置4の内部に記憶されていてもよいし、外部に記憶されていてもよい。
【0037】
[1-3―4.学習処理部44]
学習処理部44は、AI制御部45に具備されるモデル450の学習処理を行う。学習処理部44は、測定データ取得部40により取得された測定データと、操作量取得部41により取得された操作量とを含む学習データを用いてモデル450の学習処理を実行する。学習処理部44は、報酬値取得部42からの報酬値を用いてモデル450の学習処理を実行してよい。
【0038】
[1-3―5.AI制御部45]
AI制御部45は、第2制御部の一例であり、学習用データを用いて学習したモデル450を用いて、制御対象機器20(T)についての測定値に応じた、制御対象機器20(T)の操作量を出力する。AI制御部45は、複数の制御対象機器20(T)のそれぞれについての測定値に応じた、複数の制御対象機器20(T)のそれぞれの操作量を出力してよい。AI制御部45は、操作量をフィードバック制御部46に入力してよい。
【0039】
モデル450は、測定データの入力に応じ、報酬値を高めるために推奨される操作量を出力してよい。報酬値を高める操作量とは、所定の時点(一例として現在)の設備2の操業状態に対応する報酬値(一例としてその時点の測定データを報酬関数に入力して得られる報酬値)を基準報酬値とした場合に、当該基準報酬値よりも報酬値が高くなる操作量であってよい。このように報酬値が高くなる操作量は、現時点よりも操業状態が改善されるので、制御対象機器20(T)に対する制御として推奨される。但し、基準報酬値は、固定値(一例として報酬値の最大値から許容値を減じた値)であってもよい。
【0040】
なお、本実施形態では一例として、AI制御部45がモデル450を内蔵することとして説明するが、制御装置4の外部のサーバ(例えばクラウドサーバ)にモデル450が格納されてもよい。
【0041】
[1-3―6.フィードバック制御部46]
フィードバック制御部46は、第1制御部の一例であり、フィードバック制御により、制御対象機器20(T)についての測定値に応じた、制御対象機器20(T)の操作量を出力する。フィードバック制御部46は、複数の制御対象機器20(T)のそれぞれについての測定値に応じた、複数の制御対象機器20(T)のそれぞれの操作量を出力してよい。フィードバック制御部46は、オートモードおよびマニュアルモードで動作可能であってよい。
【0042】
オートモードは、測定値が入力されることに応じて、当該測定値に応じた制御対象機器20(T)の操作量を算出して出力するモードである。オートモードにおいてフィードバック制御部46は、フィードバック制御を行うべく測定値と目標値とに基づいて操作量を算出してよい。フィードバック制御部46は、オペレータや外部機器などから目標値が設定されることに応じて、当該目標値と、現在の測定値との差分を低減するように操作量を算出してよい。フィードバック制御部46に設定される目標値は固定値であってもよいし、適宜、変更されてもよい。
【0043】
フィードバック制御部46は、比例制御(P制御)、積分制御(I制御)、または、微分制御(D制御)の少なくとも1つを用いたフィードバック制御を行ってよく、本実施形態においては一例として、PID制御を行う。
【0044】
マニュアルモードは、出力するべき操作量が入力されることに応じて、当該操作量を出力するモードである。フィードバック制御部46に入力される操作量は、AI制御部45から供給されてよい。
【0045】
フィードバック制御部46は、何れのモードにおいても、制御対象機器20(T)の操作量を制御部49に供給してよい。
【0046】
[1-3―7.切替部47]
切替部47は、フィードバック制御部46とAI制御部45とのいずれによって制御対象機器20(T)を制御するかの切替(制御切替とも称する)を行う。
【0047】
切替部47は、フィードバック制御部46のモードを切り替えることで制御切替を行ってよい。例えば、切替部47は、フィードバック制御部46をオートモードにすることで、フィードバック制御部46に各制御対象機器20(T)を制御させてよい。また、切替部47は、フィードバック制御部46をマニュアルモードにすることで、AI制御部45に各制御対象機器20(T)を制御させてよい。
【0048】
[1-3―8.制御部49]
制御部49は、供給された操作量を用いて各制御対象機器20(T)を制御する。制御部49は、各制御対象機器20(T)に操作量を供給することで、各制御対象機器20(T)を当該操作量だけ駆動させてよい。
【0049】
制御部49は、各制御対象機器20(T)の出力値が制御周期内に維持されるように各制御対象機器20(T)を制御してよい。制御対象機器20(T)がフィードバック制御される場合には、制御周期はフィードバック制御のサイクルタイムよりも長くてよい。
【0050】
なお、制御部49は、制御装置4の各部の制御をさらに行ってもよい。例えば、制御部49は、モデル450の学習を制御してよい。
【0051】
以上のシステム1によれば、フィードバック制御部46とAI制御部45とのいずれによって制御対象機器20(T)を制御するかの切替が行われるので、フィードバック制御部46と、AI制御部45との何れか一方によって良好に制御を行えない場合に、他方によって良好に制御を行うことができる。また、AI制御部45のみによって制御対象機器20(T)の制御を行う場合と異なり、制御の一部をフィードバック制御部46に分担することができるため、モデル450の学習を簡略化することができる。
【0052】
また、制御対象機器20(T)について測定された測定値と目標値との差に応じて制御切替が行われるので、制御対象機器20(T)の立ち上がり期間に差が大きく生じた場合や、外乱などにより差が大きく生じた場合に、フィードバック制御部46では測定値を目標値に近づけるのに時間を要する場合であっても、AI制御部45によって測定値を目標値に速やかに近づけることができる。
【0053】
また、AI制御部45のモデル450に測定データが入力されることで、報酬値を高めるために推奨される操作量が出力される。従って、AI制御部45による制御を行う場合には、熟練したオペレータによる試行錯誤を必要とせずに状況に応じた適切な操作量によって制御対象機器20(T)を制御することができる。
【0054】
また、AI制御部45が制御対象機器20(T)の操作量をフィードバック制御部46に入力し、切替部47がフィードバック制御部46をオートモードおよびマニュアルモードの間で切り替えることで制御切替を行う。従って、フィードバック制御部46に具備されるモード切り替え機能を用いて制御切替を行うことができる。
【0055】
[2.動作]
[2-1.学習段階]
図2は、本実施形態に係る制御装置4の学習段階での動作を示す。制御装置4は、ステップS11~S25の処理を行うことにより設備2を稼働させつつモデル450の学習を行う。
【0056】
まずステップS11において測定データ取得部40は、各センサ21によって測定された測定データを取得する。これにより、初期状態の測定データが取得される。測定データ取得部40は、学習処理部44に測定データを記憶させてよい。
【0057】
ステップS13において制御部49は、各制御対象機器20(T)の操作量を決定する。制御部49は、次の制御周期での操作量を決定してよく、本実施形態では一例として、後述のステップS15が次回行われる場合に使用される操作量を決定してよい。決定される操作量は、報酬値を高くするものであってもよいし、低くするものであってもよいし、報酬値とは無関係に決定されるものであってもよい。
【0058】
制御部49は、オペレータの操作に応じて次の制御周期での操作量を決定してもよいし、各制御対象機器20(T)についての測定値が入力されたフィードバック制御部46から出力される操作量を次の制御周期での操作量として決定してもよい。これに代えて、制御部49は、モデル450から出力される操作量を次の制御周期での操作量として決定してよい。
【0059】
例えば、ステップS13の処理が最初に行われる場合には、制御部49は、ステップS11で取得された測定データをモデル450に入力したことに応じてモデル450から出力される操作量を、次の制御周期での操作量として決定してよい。ステップS13~S19の処理が繰り返されてステップS13の処理が複数回行われる場合には、制御部49は、最後に行われたステップS17の処理で取得された測定データをモデル450に入力したことに応じてモデル450から出力される操作量を、次の制御周期での操作量として決定してよい。ステップS13の処理が複数回行われる場合には、複数のステップS13の処理のうち少なくとも一部の処理の間では、異なる操作量が決定されてよい。
【0060】
ステップS15において制御部49は、操作量を各制御対象機器20(T)に出力して各制御対象機器20(T)を制御する。制御部49は、操作量取得部41を介して学習処理部44に操作量を記憶させてよい。制御部49は、各制御対象機器20(T)の制御前に測定データ取得部40によって取得された測定データに対応付けて、操作量を学習処理部44に記憶させてよい。これにより、測定データおよび操作量を含む学習データが学習処理部44に記憶される。
【0061】
なお、ステップS15の処理が最初に行われる場合には、制御対象機器20(T)の制御前に取得された測定データは、上述のステップS11の処理で取得された測定データであってよい。ステップS13~S19の処理が繰り返されてステップS15の処理が複数回行われる場合には、制御対象機器20(T)の制御前に取得された測定データは、最後に行われたステップS17の処理で取得された測定データであってよい。
【0062】
ステップS17において測定データ取得部40は、各センサ21によって測定された測定データを取得する。これにより、操作量で各制御対象機器20(T)が制御された場合の測定データが取得される。
【0063】
ステップS19において報酬値取得部42は、報酬関数により定まる報酬値を取得する。ここで、測定データ取得部40により取得される測定データには第1群の測定データと、第2群の測定データとがそれぞれ含まれてよく、各群の測定データには少なくとも1種類の測定データが含まれてよい。報酬関数は、第1群の測定データの少なくとも1つが基準条件を満たさない場合には、第2群の測定データのそれぞれの値に関わらず報酬値を0としてよい。また、報酬関数は、第1群の測定データのそれぞれが基準条件を満たす場合には、第2群の測定データのそれぞれの値に応じて報酬値を増減させてよい。
【0064】
第1群の測定データは運転状態データであってよく、第1群の測定データの基準条件は、設備2で最低限、達成するべき条件であってよい。例えば、設備2が化学製品などの製品の製造プラントである場合には第1群の測定データはプラント内の温度や湿度を示してよく、測定データの基準条件は、製品の品質を保つために維持されるべき温度範囲、湿度範囲であってよい。また、第2群の測定データは消費量データであってよい。この場合、消費量が多いほど報酬値は少なくてよい。これにより、消費量が削減されるように学習処理が行われることとなる。
【0065】
報酬値取得部42は、取得した報酬値を学習処理部44に記憶させてよい。報酬値取得部42は、最後に行われたステップS15の処理で記憶された学習データに対応付けて報酬値を記憶させてよい。
【0066】
ステップS21において制御部49は、ステップS13~S19の処理を基準ステップ数だけ行ったか否かを判定する。基準ステップ数だけ処理を行っていないと判定された場合(ステップS21;No)には、ステップS13に処理が移行する。これにより、測定データまたは操作量の少なくとも一方が異なる学習データが基準ステップ数だけサンプリングされて報酬値と共に記憶される。なお、ステップS13~S19の処理が繰り返し行われる場合に、ステップS13の周期(つまり制御周期)は設備2の時定数に応じて定められてよく、一例として5分であってよい。ステップS21において基準ステップ数だけ処理を行ったと判定された場合(ステップS21;Yes)には、ステップS23に処理が移行する。
【0067】
ステップS23において学習処理部44は、対応付けて記憶された学習データおよび報酬値の組をそれぞれ用いてモデル450の学習処理を行う。これにより、モデル450が更新される。なお、学習処理部44は、最急降下法やニューラルネットワーク、DQN(Deep Q-Network)、ガウシアンプロセス、ディープラーニングなど、公知の手法による学習処理を行ってよい。学習処理部44は、報酬値が高くなる操作量ほど、推奨の操作量として優先的に出力されるように、モデル450の学習処理を行ってよい。
【0068】
学習処理後のモデル450には、測定データおよび操作量を含む学習データに対応付けて、重み係数が記憶されてよい。重み係数は、対応する学習データ内の操作量が制御に用いられた場合の報酬値の高さに応じて設定されてよく、当該操作量が制御に用いられる場合の報酬値を予測するのに用いられてよい。
【0069】
ステップS25において制御部49は、ステップS13~S23の処理を基準繰り返し(イテレーション)数だけ行ったか否かを判定する。基準繰り返し数だけ処理を行っていないと判定された場合(ステップS25;No)には、ステップS11に処理が移行する。基準イテレーション数だけ処理を行ったと判定された場合(ステップS25;Yes)には、処理が終了する。
【0070】
以上の動作によれば、報酬関数は第1群の測定データの少なくとも1つが基準条件を満たさない場合には、第2群の測定データのそれぞれの値に関わらず報酬値を0とし、第1群の測定データのそれぞれが基準条件を満たす場合には、第2群の測定データのそれぞれの値に応じて報酬値を増減させる。従って、第1群の測定データが基準条件を満たす前提で報酬値が高まるような操作量が優先的に出力されるようモデル450の学習処理を行うことができる。
【0071】
また、モデル450から出力される推奨の操作量を次の制御周期での操作量として決定する場合には、推奨の操作量に従って各制御対象機器20(T)が制御され、制御に応じた測定データが取得されるので、推奨の操作量を含む学習データと、その制御結果に対応する報酬値とを用いてモデル450の学習処理が行われる。従って、推奨の操作量で制御が行われる場合のモデル450の学習処理を順次行って学習精度を高めることができる。
【0072】
[2-2.運用段階]
図3は、本実施形態に係る制御装置4の運用段階での動作を示す。制御装置4は、ステップS31~S37の処理を行うことによりフィードバック制御部46およびAI制御部45を用いて設備2を稼働させる。
【0073】
ステップS31において測定データ取得部40は、各センサ21によって測定された測定データを取得する。これにより、初期状態の測定データが取得される。
【0074】
ステップS33において切替部47は、AI制御部45およびフィードバック制御部46の何れにより制御対象機器20(T)を制御するかを決定する。AI制御部45が制御を行うと決定された場合(ステップS33:AI)には、切替部47は、フィードバック制御部46をマニュアルモードに設定してよい。この場合には、制御装置4はステップS35に処理を移行してよい。フィードバック制御部46が制御を行うと決定された場合(ステップS33:FB)には切替部47は、フィードバック制御部46をオートモードに設定してよい。この場合には、制御装置4はステップS37に処理を移行してよい。切替部47は、AI制御部45が制御している状態からフィードバック制御部46が制御することを決定した場合、および、フィードバック制御部46が制御している状態からAI制御部45が制御することを決定した場合には、制御切替(本実施形態では一例としてフィードバック制御部46のマニュアルモードおよびオートモードの切替)を行ってよい。
【0075】
切替部47は、制御対象機器20(T)についての測定値と目標値との差に応じて制御切替を行ってよい。一例として、切替部47は、測定値と目標値との差が基準値よりも大きくなったことに応じてフィードバック制御部46による制御からAI制御部45による制御への制御切替を行い、差が基準値よりも小さくなったことに応じてAI制御部45による制御からフィードバック制御部46による制御への制御切替を行ってよい。切替部47は、AI制御部45による制御へ切り替える場合の基準値と、フィードバック制御部46による制御へ切り替える場合の基準値とにヒステリシス特性を持たせてよく、後者の基準値を前者の基準値より小さくしてよい。切替部47は、フィードバック制御部46から目標値を取得してよい。
【0076】
また、切替部47は、基準タイムウィンドウ内で制御対象機器20(T)についての測定値と目標値との差が複数回、基準値よりも大きくなったこと、つまり差が複数回、基準値以下の値から、基準値よりも大きい値になったことに応じて、フィードバック制御部46による制御から、AI制御部45による制御への制御切替を行ってよい。一例として、切替部47は、外乱などに起因して測定値が波打つハンチングが生じたことに応じてAI制御部45による制御への制御切替を行ってよい。基準タイムウィンドウとしては任意の時間幅を用いてよく、基準値としては任意の値を用いてよい。
【0077】
この場合に、切替部47は、基準タイムウィンドウ内で測定値と目標値との差が基準値よりも小さく維持されたことに応じて、AI制御部45による制御から、フィードバック制御部46による制御への切り替えを行ってよい。切替部47は、AI制御部45による制御へ切り替える場合の基準値と、フィードバック制御部46による制御へ切り替える場合の基準値とにヒステリシス特性を持たせてよく、後者の基準値を前者の基準値よりも小さくしてよい。
【0078】
また、切替部47は、閾値と、制御対象機器20(T)についての測定値との比較結果に基づいて制御切替を行ってよい。閾値は、報酬関数に含まれる、制御対象機器20(T)についての一の目標値に基づいて設定されてよい。例えば閾値は、一の目標値に四則演算などの演算を行って得られる値でもよいし、一の目標値そのものであってもよい。
【0079】
閾値と測定値との比較結果に基づいて制御切替を行う場合に、切替部47は、測定値が閾値以下である場合にはAI制御部45が制御対象機器20(T)を制御すると決定してよい。また、切替部47は、測定値が閾値より大きい場合にはフィードバック制御部46が制御対象機器20(T)を制御すると決定してよい。一例として、制御対象機器20(T)がバルブであり、開度を示す一の目標値が30%である場合には、閾値は一の目標値そのものの30%として設定されてよく、測定値が30%以下の場合にはAI制御部45が、測定値が30%より大きい場合にはフィードバック制御部46が、制御対象機器20(T)のバルブを制御してよい。
【0080】
切替部47は、AI制御部45による制御へ切り替える場合の閾値と、フィードバック制御部46による制御へ切り替える場合の閾値とにヒステリシス特性を持たせてよく、後者の閾値を前者の閾値り大きくしてよい。
【0081】
ステップS35において制御装置4は、AI制御部45による制御対象機器20(T)の制御を行う。例えば、AI制御部45のモデル450は、測定データ取得部40から測定データが供給されることに応じて推奨される操作量を、フィードバック制御部46を介して制御部49に出力してよい。制御部49は、入力された操作量を制御対象機器20(T)に供給してよい。これにより、制御対象機器20(T)が操作量だけ駆動する。ステップS35の処理が終了したら、制御装置4はステップS31に処理を移行してよい。
【0082】
なお、ステップS35においてモデル450は、学習データ内に含まれる操作量それぞれについて、当該操作量が制御に用いられる場合に予測される報酬値(予測報酬値とも称する)を算出してよい。例えば、モデル450は、複数の学習データから、一の操作量を含む各学習データを抽出してよい。モデル450は、抽出した各学習データに対応付けられた各重み係数を、現時点の状態を示す測定データ(本実施形態では一例として最後に行われたステップS31の処理で取得された測定データ)と、学習データ内の測定データとの距離に応じて重み付け加算した結果を、当該一の操作量についての予測報酬値としてよい。モデル450は、測定データ間の距離が大きいほど重みが小さくなるように(つまり、報酬値への影響が小さくなるように)、重み付けの大きさを設定してよい。モデル450は、予測報酬値の高い操作量ほど、より優先的に推奨操作量としてよい。ただし、モデル450は、必ずしも予測報酬値が最高の操作量を推奨操作量にしなくてもよい。
【0083】
ステップS37において制御装置4は、フィードバック制御部46による制御対象機器20(T)の制御を行う。例えば、フィードバック制御部46は、制御対象機器20(T)についての測定値が入力されることに応じて当該測定値に応じた操作量を制御部49に出力してよい。制御部49は、入力された操作量を制御対象機器20(T)に供給してよい。これにより、制御対象機器20(T)が操作量だけ駆動する。ステップS37の処理が終了したら、制御装置4はステップS31に処理を移行してよい。
【0084】
ステップS37においてフィードバック制御部46は、マニュアルモードからオードモードへ切り替えられた場合に、切替前後の操作量をバンプレスに制御する、つまり、切替前後での操作量の急変を抑制する。例えば、フィードバック制御部46は、マニュアルモードで出力した操作量(つまりAI制御部45から供給された操作量)から逆算される積分項を用いて、次の操作量を算出してよい。一例として、フィードバック制御部46は、オートモードにおいてPID制御を行う場合に、次の式(1)、(2)から操作量MVを算出してよい。フィードバック制御部46がマニュアルモードからオートモードへ切り替えられた場合には、マニュアルモードで出力した操作量から式(2)の右辺第2項の積分項を逆算して、次の操作量MVを算出してよい。
【0085】
【数1】
【0086】
ここで、式中、添え字のi,i-1は制御タイミングを示す変数である。PVは制御対象機器20(T)についての測定値であり、別言すればプロセスデータである。SVは目標値であり、別言すれば設定値である。P,I,Dは比例ゲイン,積分ゲイン,微分ゲインである。
【0087】
以上の動作によれば、基準タイムウィンドウ内で測定値と目標値との差が複数回、基準値よりも大きくなったことに応じて、フィードバック制御部46による制御から、AI制御部45による制御への制御切替が行われる。従って、フィードバック制御部46による制御によってハンチングが生じる場合に、ハンチングを抑えて測定値を目標値に近づけることができる。
【0088】
また、AI制御部45で用いられる報酬関数では測定値が一の目標値に近いほど報酬値が高くなり、制御切替が一の目標値に基づく閾値と測定値との比較結果に基づいて行われる。従って、AI制御部45によって制御が良好に行えない範囲内に測定値が含まれる場合に、フィードバック制御部46によって良好に制御を行うことができる。
【0089】
また、AI制御部45による制御へ切り替える場合の閾値と、フィードバック制御部46による制御へ切り替える場合の閾値とがヒステリシス特性を持つので、測定値の変動によって制御主体が頻繁に切り替わり、操作量が不安定になってしまうのを防止することができる。
【0090】
また、フィードバック制御部46がマニュアルモードからオードモードへ切り替えられた場合に、切替前後の操作量がバンプレスに制御されるので、マニュアルモードのフィードバック制御部46から出力された操作量と、オートモードのフィードバック制御部46により新たに算出される操作量との間の不連続性を抑え、変動を抑えることができる。
【0091】
[3.適用例]
図4は、システム1の適用例を示す。なお、図4では、制御装置4の構成を簡略化して図示している。
【0092】
本適用例において、設備2はプラント用の空調機であり、ダクト200内に外気を取り込んで、調温・調湿後の空気をプラントの部屋や他の空調機に供給する。
【0093】
設備2には、制御対象機器20(T)としてのバルブB1~B4が設けられている。バルブB1はダクト200内の加熱量を調整するものであり、バルブB2はダクト200内の冷却量を調整するものであり、バルブB3はダクト200内の加湿量を調整するものであり、バルブB4はダクト200内の除湿量を調整するものである。
【0094】
また、設備2には、センサ21としての湿度センサ21a,21bや、温度センサ21c,21d、開度センサ21e、日照センサ21f、風向きセンサ21g、風量センサ21h、使用電力センサ21i、使用LPGセンサ21jなどが設けられている。湿度センサ21a,温度センサ21cは、ダクト200内に取り込まれた外気の湿度,温度を測定する。湿度センサ21b,温度センサ21dは、ダクト200から放出された調整後の空気の湿度,温度を測定する。開度センサ21eは、バルブB1~B4の開度(出力値)をそれぞれ測定する。日照センサ21f,風向きセンサ21g,風量センサ21hは、設備2が設けられたプラント外部での日射量,風向き,風量を測定する。使用電力センサ21iは、設備2の使用電力量を測定する。使用LPGセンサ21jは、設備2の使用LPG量を測定する。
【0095】
制御装置4の学習処理部44は、これらのセンサ21a~21jによって測定された測定データと、各バルブB1~B4の操作量とを含む学習データを用いて、AI制御部45におけるモデル450の学習処理を実行する。本適用例では一例として、操作量は、バルブB1~B4の出力値である開度に関する。開度に関する操作量が電気信号等で制御装置4から送信されると、バルブB1~B4は、その操作量だけ開閉する。学習処理に用いられる報酬値は、調整後の空気の温度または湿度の少なくとも一方が基準範囲内に維持されない場合には0にされてよく、調整後の空気の温度,湿度がそれぞれ基準範囲内に維持される場合には、使用電力量および使用LPG量が少ないほど高い値にされてよい。
【0096】
AI制御部45は、センサ21a~21jによって測定された測定データの入力に応じて、報酬値を高めるために推奨される操作量を算出する。
【0097】
フィードバック制御部46は、開度センサ21eによって測定された開度と、開度の目標値とに基づいて操作量を算出する。
【0098】
切替部47は、開度センサ21eによって測定された開度と、開度の目標値との差に応じて制御切替を行う。切替部47は、フィードバック制御部46をマニュアルモードとオートモードとの間で切り替えることにより、AI制御部45により算出された操作量と、フィードバック制御部46により算出された操作量との何れか一方をフィードバック制御部46から制御部49に供給させる。
【0099】
制御部49は、操作量をバルブB1~B4に供給することで、バルブB1~B4を操作量だけ開閉させる。
【0100】
[5.変形例]
なお、上記の実施形態では、システム1は単一の制御装置4を備えることとして説明したが、複数の制御装置4を備えてもよい。この場合には、各制御装置4の間で制御対象機器20(T)が同じであってもよいし、異なってもよい。一例としてシステム1には、機器20毎に、当該機器20を制御対象機器20(T)とする制御装置4が具備されてよい。
【0101】
また、制御装置4は、操作量取得部41と、報酬値取得部42と、学習処理部44と、制御部49とを有することとして説明したが、これらの少なくとも1つを有しないこととしても良い。制御装置4が学習処理部44や操作量取得部41を有しない場合には、制御装置4は、モデル450の学習処理を行わずに、学習処理後のモデル450を用いて制御対象機器20(T)の制御を行ってよい。
【0102】
また、測定データ取得部40は、複数のセンサ21のそれぞれによって測定された測定データを取得することとして説明したが、制御対象機器20(T)についての測定値のみを取得してもよい。
【0103】
また、切替部47は、制御対象機器20(T)についての測定値と目標値との差に応じて制御切替を行うこととして説明したが、制御対象機器20(T)に対する制御開始からの経過時間に応じて制御切替を行ってもよい。例えば、切替部47は、制御対象機器20(T)に対する制御の開始から基準時間が経過するまではAI制御部45による制御を行わせ、基準時間が経過した後はフィードバック制御部46による制御を行わせてよい。これにより、制御対象機器20(T)の立ち上がり期間におけるオーバーシュートやアンダーシュートを防止して、測定値を速やかに目標値に近づけることができる。また、制御対象機器20(T)に対する制御の開始から基準時間が経過した後はフィードバック制御部46による制御が行われるので、測定値を安定に制御することができる。制御対象機器20(T)に対する制御開始のタイミングは、制御対象機器20(T)および制御装置4が起動されて制御装置4による制御が開始するタイミングでもよいし、一旦、制御が開始した後に、制御装置4に設定される目標値が変更されて新たに制御装置4による制御が開始するタイミングであってもよい。基準時間は、一例として、制御対象機器20(T)をフィードバック制御部46により制御した場合に、制御の開始からオーバーシュートやアンダーシュートが収まるまでの期間であってよい。
【0104】
また、制御装置4はフィードバック制御により測定値に応じた操作量を出力するフィードバック制御部46を有することとして説明したが、フィードバック制御に加えて、または、フィードバック制御に代えて、フィードフォワード制御により測定値に応じた操作量を出力する制御部を有してもよい。
【0105】
また、制御装置4は、単一のフィードバック制御部46を有することとして説明したが、複数のフィードバック制御部46を有してもよい。これら複数のフィードバック制御部46は、フィードバック制御を多重に組み合わせたカスケード制御を行うべく多段に接続されてよい。各段のフィードバック制御部46には、同じ制御対象機器20(T)についての測定値が入力されてよく、前段のフィードバック制御部46から出力される操作量が、次段のフィードバック制御部46に対し目標値として入力されてよい。この場合、AI制御部45は何れか1つのフィードバック制御部46に対して操作量を供給してよく、当該フィードバック制御部46は切替部47によってマニュアルモードとオートモードとの間でモードが切り替えられてよい。また、フィードバック制御部46が多段に接続される場合には、制御装置4は複数のAI制御部45を有してよい。これら複数のAI制御部45は、それぞれ別々のフィードバック制御部46に対して操作量を供給してよく、これらのフィードバック制御部46はそれぞれ切替部47によってマニュアルモードとオートモードとの間でモードが切り替えられてよい。複数のAI制御部45のモデル450は、同じ学習処理が施されていてもよいし、異なる学習処理が施されてもよい。
【0106】
また、切替部47はフィードバック制御部46のモードを切り替えることで制御切替を行うこととして説明したが、他の手法により制御切替を行ってもよい。例えば、AI制御部45およびフィードバック制御部46は算出した操作量をそれぞれ切替部47に供給してよく、切替部47は、制御部49に出力する操作量の供給元をAI制御部45およびフィードバック制御部46の間で切り替えることで切替制御を行ってよい。
【0107】
また、本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、およびコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサの少なくとも1つによって実装されてよい。専用回路は、デジタルおよびアナログの少なくとも一方のハードウェア回路を含んでよく、集積回路(IC)およびディスクリート回路の少なくとも一方を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
【0108】
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0109】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたコードまたはオブジェクトコードのいずれかを含んでよい。
【0110】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0111】
図5は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ2200の例を示す。コンピュータ2200にインストールされたプログラムは、コンピュータ2200に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、これに加えて、またはこれに代えて、コンピュータ2200に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ2200に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU2212によって実行されてよい。
【0112】
本実施形態によるコンピュータ2200は、CPU2212、RAM2214、グラフィックコントローラ2216、およびディスプレイデバイス2218を含み、それらはホストコントローラ2210によって相互に接続されている。コンピュータ2200はまた、通信インターフェイス2222、ハードディスクドライブ2224、DVD-ROMドライブ2226、およびICカードドライブのような入出力ユニットを含み、それらは入出力コントローラ2220を介してホストコントローラ2210に接続されている。コンピュータはまた、ROM2230およびキーボード2242のようなレガシの入出力ユニットを含み、それらは入出力チップ2240を介して入出力コントローラ2220に接続されている。
【0113】
CPU2212は、ROM2230およびRAM2214内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ2216は、RAM2214内に提供されるフレームバッファ等またはそれ自体の中にCPU2212によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス2218上に表示されるようにする。
【0114】
通信インターフェイス2222は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ2224は、コンピュータ2200内のCPU2212によって使用されるプログラムおよびデータを格納する。DVD-ROMドライブ2226は、プログラムまたはデータをDVD-ROM2201から読み取り、ハードディスクドライブ2224にRAM2214を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、これに加えて、またはこれに代えてプログラムおよびデータをICカードに書き込む。
【0115】
ROM2230はその中に、アクティブ化時にコンピュータ2200によって実行されるブートプログラム等、およびコンピュータ2200のハードウェアに依存するプログラムの少なくとも1つを格納する。入出力チップ2240はまた、様々な入出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入出力コントローラ2220に接続してよい。
【0116】
プログラムが、DVD-ROM2201またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ2224、RAM2214、またはROM2230にインストールされ、CPU2212によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ2200に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ2200の使用に従い情報の操作または処理を実現することによって構成されてよい。
【0117】
例えば、通信がコンピュータ2200および外部デバイス間で実行される場合、CPU2212は、RAM2214にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェイス2222に対し、通信処理を命令してよい。通信インターフェイス2222は、CPU2212の制御下、RAM2214、ハードディスクドライブ2224、DVD-ROM2201、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
【0118】
また、CPU2212は、ハードディスクドライブ2224、DVD-ROMドライブ2226(DVD-ROM2201)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM2214に読み取られるようにし、RAM2214上のデータに対し様々なタイプの処理を実行してよい。CPU2212は次に、処理されたデータを外部記録媒体にライトバックする。
【0119】
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU2212は、RAM2214から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索,置換等を含む、様々なタイプの処理を実行してよく、結果をRAM2214に対しライトバックする。また、CPU2212は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU2212は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0120】
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ2200上またはコンピュータ2200近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ2200に提供する。
【0121】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0122】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0123】
1 システム、 2 設備、 4 制御装置、 20 機器、 21 センサ、 40 測定データ取得部、 41 操作量取得部、 42 報酬値取得部、 44 学習処理部、 45 AI制御部、 46 フィードバック制御部、 47 切替部、 49 制御部、 200 ダクト、 450 モデル、 2200 コンピュータ、 2201 DVD-ROM、 2210 ホストコントローラ、 2212 CPU、 2214 RAM、 2216 グラフィックコントローラ、 2218 ディスプレイデバイス、 2220 入出力コントローラ、 2222 通信インターフェイス、 2224 ハードディスクドライブ、 2226 DVD-ROMドライブ、 2230 ROM、 2240 入出力チップ、 2242 キーボード
図1
図2
図3
図4
図5