(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024066678
(43)【公開日】2024-05-16
(54)【発明の名称】予測装置、予測方法及びプログラム
(51)【国際特許分類】
G05B 13/04 20060101AFI20240509BHJP
【FI】
G05B13/04
【審査請求】有
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022176246
(22)【出願日】2022-11-02
(11)【特許番号】
(45)【特許公報発行日】2023-08-16
(71)【出願人】
【識別番号】000005234
【氏名又は名称】富士電機株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】島崎 祐一
(72)【発明者】
【氏名】金田 龍哉
【テーマコード(参考)】
5H004
【Fターム(参考)】
5H004GA04
5H004GB01
5H004HA01
5H004HA02
5H004HA03
5H004HB01
5H004HB02
5H004HB03
5H004KC27
5H004KD61
(57)【要約】 (修正有)
【課題】精度の良い予測値を高速に得ることができる技術を提供すること。
【解決手段】本開示の一態様による予測装置は、対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習するように構成されている第1の学習部と、第2の学習部と、前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出するように構成されている予測部と、を有する。
【選択図】
図2
【特許請求の範囲】
【請求項1】
対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習するように構成されている第1の学習部と、
前記運転実績データに基づいて、前記第1の予測モデルの学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習するように構成されている第2の学習部と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出するように構成されている予測部と、
を有する予測装置。
【請求項2】
前記予測部は、
前記状態変数の予測値に対して前記補正量を加算することで、前記状態変数の補正後の予測値を算出するように構成されている請求項1に記載の予測装置。
【請求項3】
前記第2の予測モデルは、決定木を含む木構造を用いるモデルであり、
前記予測部は、
前記操作変数の値と前記環境変数の値を、前記木構造を用いるモデルに入力したときに、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の統計量を、前記学習誤差の予測値として算出するように構成されている請求項1又は2に記載の予測装置。
【請求項4】
前記予測部は、
前記学習誤差の予測値を前記補正量とするように構成されている請求項3に記載の予測装置。
【請求項5】
前記統計量は、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の平均値である、請求項4に記載の予測装置。
【請求項6】
前記予測部は、
前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値のうち、前記学習誤差の絶対値が大きい順に上位所定の数の前記学習誤差の値を除いた上で、前記終端ノードに属する前記学習誤差の値の平均値を算出するように構成されている請求項5に記載の予測装置。
【請求項7】
対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習する第1の学習手順と、
前記運転実績データに基づいて、前記第1の予測モデルの学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習する第2の学習手順と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出する予測手順と、
をコンピュータが実行する予測方法。
【請求項8】
対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習する第1の学習手順と、
前記運転実績データに基づいて、前記第1の予測モデルの学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習する第2の学習手順と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出する予測手順と、
をコンピュータに実行させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、予測装置、予測方法及びプログラムに関する。
【背景技術】
【0002】
近年、産業分野では熟練オペレータ(オペレータは、運用者又は運転者と呼ばれてもよい。)の不足等を背景に、AI(Artificial Intelligence)や機械学習技術等を活用したプラント運転支援システムへのニーズが高まっている。一般に、発電プラント、鉄鋼プラント、化学プラント等といったプラントの運転は、その時の環境に応じて、オペレータが過去の知見から将来のプラントの状態を予測し、予め決められた所定の状態になるように最適な操作量を計画した上で、その操作量によりプラントを運転している。
【0003】
プラントの運転を支援する従来技術の1つとして、統計・機械学習技術により過去の運転実績データから構築した予測モデルをシミュレータとして活用し、最適化技術と組み合わせて最適な操作量を計算する技術が知られている(例えば、特許文献1)。このような技術では、例えば、プラントの状態を表す状態変数の値と環境を表す環境変数の値とが与えられたときに、数理計画法やメタヒューリスティック等といった繰り返し計算を用いる手法により予測モデルから最適な操作量を求めている。このため、予測モデルは、高精度であることに加えて、高速である必要がある。
【0004】
一方で、予測モデルは、一般に、プラントの状態を表す状態変数を目的変数、それに関連する変数(例えば、環境変数や操作変数等)を説明変数として、統計・機械学習技術により運転実績データから目的変数と説明変数の関係を学習することによって構築する。このため、予測モデルで予測した値(予測値)には誤差が生じ得る。特に、例えば、学習時の説明変数に表れない変動や稀にしか起こらない状態等には対応できず、誤差が大きくなる。これに対して、過去の予測モデルの誤差を学習時の説明変数に表れない変動として捉え、その予測モデルの誤差を用いて予測値を補正する従来技術が知られている。例えば、特許文献2には、製品の状態の実績値と物理モデルにより予測した状態の予測値との誤差を局所回帰モデルにより逐次学習し、この誤差を用いて物理モデルの予測値を補正する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特許第7081728号公報
【特許文献2】特許第6834209号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、従来技術では、予測値の補正を高速に行うことができなかった。例えば、上記の特許文献2では、物理モデルにより製品の状態を予測するたびに、当該物理モデルの補正量を計算するための回帰係数を学習する必要があり、或る程度の計算時間が必要になると考えられる。このため、例えば、予測値が補正される予測モデルをシミュレータとして活用し、最適化技術と組み合わせて最適な操作量を計算する場合、数理計画法やメタヒューリスティック等といった繰り返し計算に膨大な計算時間が必要になり、実システムへの適用は現実的ではないと考えられる。
【0007】
本開示は、上記の点に鑑みてなされたもので、精度の良い予測値を高速に得ることができる技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
本開示の一態様による予測装置は、対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習するように構成されている第1の学習部と、前記運転実績データに基づいて、前記第1の予測モデルの学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習するように構成されている第2の学習部と、前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出するように構成されている予測部と、を有する。
【発明の効果】
【0009】
精度の良い予測値を高速に得ることができる技術が提供される。
【図面の簡単な説明】
【0010】
【
図1】本実施形態に係るプラント状態予測装置のハードウェア構成の一例を示す図である。
【
図2】本実施形態に係るプラント状態予測装置の機能構成の一例を示す図である。
【
図3】本実施形態に係るモデル学習処理の一例を示すフローチャートである。
【
図4】本実施形態に係る予測処理の一例を示すフローチャートである。
【
図5】状態変数実績値と補正前のプラント状態予測値と補正後のプラント状態予測値の推移を示す図である。
【発明を実施するための形態】
【0011】
以下、本発明の一実施形態について説明する。以下の実施形態では、プラントを対象として、プラントの状態を表す状態変数の精度の良い予測値を高速に得ることができるプラント状態予測装置10について説明する。
【0012】
ここで、以下では、対象の一例としてプラントを想定するが、対象はプラントに限られるものではない。対象としては、オペレータ(運用者又は運転者と呼ばれてもよい。)や自動運転装置等の操作対象となるものであればよく、例えば、設備、機器、装置等であってもよい。対象には各種センサが設置されており、これらのセンサにより当該対象の状態や環境、当該対象に対する操作等が計測される。状態の具体例としては、例えば、或る時点の温度、圧力、流量等が挙げられる。環境の具体例としては、例えば、或る時点の外気温、設備番号、製品品種番号等が挙げられる。操作の具体例としては、例えば、対象の空気弁や燃料バルブ等に対する開閉量、空気弁の開閉によって制御される酸素量等が挙げられる。このような状態を表す変数は「状態変数」、環境を表す変数は「環境変数」、操作を表す変数は「操作変数」と呼ばれる。なお、以下では、状態変数、環境変数、操作変数をまとめて単に「変数」ともいう。
【0013】
以下、操作変数の総数をIとして、各操作変数をxi(1≦i≦I)と表す。同様に、状態変数の総数をJとして、各状態変数をyj(1≦j≦J)と表す。同様に、環境変数の総数をKとして、各環境変数をzk(1≦k≦K)と表す。以下では、簡単のため、或る状態変数yjの精度の良い予測値を高速に得る場合について説明し、この状態変数yjを単にyと表すことにする。ただし、以下で説明する実施形態は、複数の状態変数の精度の良い予測値を高速に得る場合についても同様に適用することが可能である。
【0014】
また、操作変数xi(1≦i≦I)をi番目の要素に持つI次元ベクトルをx=(x1,・・・,xI)、環境変数zk(1≦k≦K)をk番目の要素に持つK次元ベクトルをz=(z1,・・・,zK)と表す。なお、x、zはいずれも横ベクトルであるものとしたが、縦ベクトルであってもよい。
【0015】
また、時刻tの操作変数値をx(t)=(x1(t),・・・,xI(t))、時刻tの状態変数値をy(t)、時刻tの環境変数値をz(t)=(z1(t),・・・,zK(t))と表す。なお、時刻tは時刻ステップとも呼ばれ、例えば、対象の制御周期をΔtとすれば、制御周期Δt毎にt←t+Δtと更新される時刻である。
【0016】
このとき、本実施形態に係るプラント状態予測装置10は、プラントの過去の運転データ(以下、実績データともいう。)を用いて、操作変数x及び環境変数zから状態変数yを予測する第1の予測モデルと、操作変数x及び環境変数zから第1の予測モデルの誤差(学習誤差)を予測する第2の予測モデルとを学習する。そして、本実施形態に係るプラント状態予測装置10は、操作変数xの値と環境変数zの値とが与えられたときに、学習済みの第1の予測モデルにより予測された予測値を、学習済みの第2の予測モデルにより算出された学習誤差を用いて補正する。これにより、学習誤差を用いて補正された精度の良い予測値(以下、この補正後の予測値を「プラント状態予測値」ともいう。)が高速に得られる。
【0017】
以下では、上記の第1の予測モデルと第2の予測モデルを学習するフェーズを「モデル学習フェーズ」、上記のプラント状態予測値を算出するフェーズを「予測フェーズ」と呼ぶことにする。
【0018】
<プラント状態予測装置10のハードウェア構成例>
本実施形態に係るプラント状態予測装置10のハードウェア構成例を
図1に示す。
図1に示すように、本実施形態に係るプラント状態予測装置10は、入力装置101と、表示装置102と、外部I/F103と、通信I/F104と、RAM(Random Access Memory)105と、ROM(Read Only Memory)106と、補助記憶装置107と、プロセッサ108とを有する。これらの各ハードウェアは、それぞれがバス109を介して通信可能に接続される。
【0019】
入力装置101は、例えば、キーボード、マウス、タッチパネル、物理ボタン等である。表示装置102は、例えば、ディスプレイ、表示パネル等である。なお、プラント状態予測装置10は、例えば、入力装置101及び表示装置102のうちの少なくとも一方を有していなくてもよい。
【0020】
外部I/F103は、記録媒体103a等の外部装置とのインタフェースである。記録媒体103aとしては、例えば、CD(Compact Disc)、DVD(Digital Versatile Disk)、SDメモリカード(Secure Digital memory card)、USB(Universal Serial Bus)メモリカード等が挙げられる。
【0021】
通信I/F104は、プラント状態予測装置10を通信ネットワークに接続するためのインタフェースである。RAM105は、プログラムやデータを一時保持する揮発性の半導体メモリ(記憶装置)である。ROM106は、電源を切ってもプログラムやデータを保持することができる不揮発性の半導体メモリ(記憶装置)である。補助記憶装置107は、例えば、HDD(Hard Disk Drive)、SSD(Solid State Drive)、フラッシュメモリ等の不揮発性の記憶装置であり、プログラムやデータが格納される。プロセッサ108は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)等の各種演算装置である。
【0022】
本実施形態に係るプラント状態予測装置10は、
図1に示すハードウェア構成を有することにより、後述するモデル学習処理及び予測処理を実現することができる。ただし、
図1に示すハードウェア構成は一例であって、プラント状態予測装置10のハードウェア構成はこれに限られるものではない。例えば、プラント状態予測装置10は、複数の補助記憶装置107や複数のプロセッサ108を有していてもよいし、図示したハードウェアの一部を有していなくてもよいし、図示したハードウェア以外の種々のハードウェアを有していてもよい。
【0023】
<プラント状態予測装置10の機能構成例>
本実施形態に係るプラント状態予測装置10の機能構成例を
図2に示す。
図2に示すように、本実施形態に係るプラント状態予測装置10は、入力部201と、第1の予測モデル学習部202と、第2の予測モデル学習部203と、予測部204と、出力部205とを有する。これら各部は、例えば、プラント状態予測装置10にインストールされた1以上のプログラムが、プロセッサ108等に実行させる処理により実現される。また、本実施形態に係るプラント状態予測装置10は、実績データ記憶部206と、第1の予測モデル記憶部207と、第2の予測モデル記憶部208とを有する。これら各部は、例えば、補助記憶装置107等により実現される。ただし、実績データ記憶部206、第1の予測モデル記憶部207及び第2の予測モデル記憶部208の少なくとも1つが、プラント状態予測装置10と通信ネットワークを介して接続される記憶装置(例えば、データベースサーバ等)により実現されていてもよい。
【0024】
入力部201は、モデル学習フェーズにおいて、第1の予測モデルと第2の予測モデルの学習に用いる実績データを実績データ記憶部206から取得する。実績データは、時刻tの操作変数値と状態変数値と環境変数値で構成される。すなわち、或る時刻tの実績データは、例えば、(x(t),y(t),z(t))と表される。以下、モデル学習フェーズにおいて、実績データ集合D={(x(t),y(t),z(t))|t∈T}が実績データ記憶部206から取得されるものとする。ここで、Tは第1の予測モデルと第2の予測モデルの学習に用いる実績データの時刻集合である。ただし、実績データ集合Dに含まれる各実績データは、対象の正常運転時の運転データや対象が適切に運転されているときの運転データ、模範的な運転がなされているときの運転データ等であるものとする。以下では、各x(t)を操作変数実績値、各y(t)を状態変数実績値、各z(t)を環境変数実績値とも呼ぶことにする。
【0025】
また、入力部201は、予測フェーズにおいて、プラント状態の予測に用いる操作変数値と環境変数値(例えば、現在時刻t=t0の操作変数値x(t0)と環境変数値z(t0))を取得する。なお、プラント状態の予測に用いる操作変数値と環境変数値は、例えば、制御周期Δt毎に対象からプラント状態予測装置10に与えられてもよいし、補助記憶装置107等により実現される記憶部から取得されてもよい。
【0026】
なお、入力部201は、モデル学習フェーズ及び予測フェーズにおいて、操業情報を入力してもよい。操業情報とは、例えば、状態変数の正常範囲・異常範囲を示す情報、対象の操業日や点検日等を表すイベント情報等といった情報のことである。これらの操業情報は、例えば、第1の予測モデル及び第2の予測モデルの学習とプラント状態予測値の算出の際に補助的な情報として用いられてもよい。
【0027】
第1の予測モデル学習部202は、モデル学習フェーズにおいて、入力部201によって取得された実績データ集合Dを用いて、操作変数x及び環境変数zから状態変数yを予測する第1の予測モデルを学習する。第1の予測モデルは、操作変数x及び環境変数zを入力として状態変数yを出力する関数fで表現される統計又は機械学習モデルである。具体的には、第1の予測モデルは、y=f(x,z)と表される統計又は機械学習モデルである。ここで、yは状態変数であり、目的変数に相当する。x及びzはそれぞれ操作変数及び環境変数であり、説明変数に相当する。以下では、第1の予測モデルをfで表す。
【0028】
このとき、第1の予測モデル学習部202は、各t∈Tに対して、f(x(t),z(t))がy(t)を精度良く予測するように、第1の予測モデルfの学習可能パラメータを学習すればよい。
【0029】
なお、第1の予測モデルfとしては、任意の統計又は機械学習モデルを採用することが可能であるが、例えば、回帰分析、SVR(Support Vector Regression)、ニューラルネットワーク、勾配ブースティング等を用いればよい。また、第1の予測モデルfの学習手法としては、統計又は機械学習モデルの種類に応じて適切な既存手法を用いればよい。
【0030】
第2の予測モデル学習部203は、モデル学習フェーズにおいて、入力部201によって取得された実績データ集合Dと、学習済みの第1の予測モデルfとを用いて、この第1の予測モデルfの学習誤差を算出する。すなわち、第2の予測モデル学習部203は、各t∈Tに対して、s(t)=y(t)-f(x(t),z(t))により学習誤差s(t)を算出する。
【0031】
そして、第2の予測モデル学習部203は、入力部201によって取得された実績データ集合Dに含まれる各操作変数実績値x(t)及び環境変数実績値z(t)と、第1の予測モデルfの各学習誤差s(t)とを用いて、操作変数x及び環境変数zから学習誤差sを予測する第2の予測モデルを学習する。第2の予測モデルは、操作変数x及び環境変数zを入力として学習誤差sを出力する関数gで表現される統計又は機械学習モデルである。具体的には、第2の予測モデルは、s=g(x,z)と表される統計又は機械学習モデルである。ここで、sは学習誤差を表す変数であり、目的変数に相当する。x及びzはそれぞれ操作変数及び環境変数であり、説明変数に相当する。以下では、第2の予測モデルをgで表す。
【0032】
このとき、第2の予測モデル学習部203は、各t∈Tに対して、g(x(t),z(t))がs(t)を精度良く予測するように、第2の予測モデルgの学習可能パラメータを学習すればよい。
【0033】
なお、第2の予測モデルgとしては、任意の統計又は機械学習モデルを採用することが可能であるが、例えば、決定木等といった木構造を用いるモデルを用いればよい。また、第2の予測モデルgの学習手法としては、統計又は機械学習モデルの種類に応じて適切な既存手法を用いればよい。
【0034】
予測部204は、予測フェーズにおいて、入力部201によって取得された操作変数値及び環境変数値と、学習済みの第1の予測モデルfと、学習済みの第2の予測モデルgとを用いて、プラント状態予測値を算出する。例えば、入力部201によって取得された操作変数値及び環境変数値をそれぞれx(t0)及びz(t0)とすれば、まず、予測部204は、状態変数yの予測値f(x(t0),z(t0))を補正前のプラント状態予測値として算出すると共に、学習誤差sの予測値g(x(t0),z(t0))を補正量として算出する。そして、予測部204は、補正量g(x(t0),z(t0))により補正前のプラント状態予測値f(x(t0),z(t0))を補正する。例えば、予測部204は、f(x(t0),z(t0))+g(x(t0),z(t0))と補正してプラント状態予測値を算出する。
【0035】
ここで、第2の予測モデルが決定木等の木構造を用いるモデルである場合、g(x(t0),z(t0))は、例えば、(x(t0),z(t0))が分類された終端ノード(葉ノード)に属する学習誤差s(t)の平均値とすればよい。ただし、例えば、学習誤差sの異常値の影響を除外するために、学習誤差s(t)の絶対値|s(t)|が大きい順に上位数点を除いた上で、学習誤差s(t)の平均値を算出してもよい。また、平均値に限られず、平均値以外の何等かの統計量が用いられてもよい。
【0036】
出力部205は、予測フェーズにおいて、予測部204によって算出されたプラント状態予測値を予め決められた所定の出力先に出力する。このような出力先は、例えば、表示装置102であってもよいし、通信ネットワークを介して接続される端末(特に、オペレータが利用する端末)であってもよいし、補助記憶装置107であってもよいし、プラント状態予測装置10にインストールされた他のプログラムであってもよい。
【0037】
実績データ記憶部206は、モデル学習フェーズにおいて、実績データ集合Dを記憶する。なお、実績データ記憶部206には、例えば、予測フェーズにおいて、対象から取得された現在時刻t=t0の操作変数値x(t0)及び環境変数値z(t0)が記憶されてもよい。
【0038】
第1の予測モデル記憶部207は、モデル学習フェーズにおいて、学習済みでない第1の予測モデルfの学習可能パラメータを記憶する。また、第1の予測モデル記憶部207は、予測フェーズにおいて、学習済みの第1の予測モデルfの学習可能パラメータ(つまり、学習済みパラメータ)を記憶する。
【0039】
第2の予測モデル記憶部208は、モデル学習フェーズにおいて、学習済みでない第2の予測モデルgの学習可能パラメータを記憶する。また、第2の予測モデル記憶部208は、予測フェーズにおいて、学習済みの第2の予測モデルgの学習可能パラメータ(つまり、学習済みパラメータ)を記憶する。
【0040】
なお、
図2に示すプラント状態予測装置10の機能構成は一例であって、これに限られるものではない。例えば、モデル学習フェーズにおけるプラント状態予測装置10は、予測部204と、出力部205とを有していなくてもよい。また、このとき、モデル学習フェーズにおけるプラント状態予測装置10は、例えば、「学習装置」等と称されてもよい。一方で、例えば、予測フェーズにおけるプラント状態予測装置10は、第1の予測モデル学習部202と、第2の予測モデル学習部203と、実績データ記憶部206とを有していなくてもよい。
【0041】
<モデル学習処理>
以下、モデル学習フェーズで実行されるモデル学習処理について、
図3を参照しながら説明する。なお、モデル学習処理は一般にプラント等の対象のオフライン時に実行されるが、これに限られず、例えば、オフラインで一度実行した後、オンライン時にバックグラウンドで定期的に実行されてもよい。
【0042】
まず、入力部201は、モデル学習に用いる実績データ集合D={(x(t),y(t),z(t))|t∈T}を実績データ記憶部206から取得する(ステップS101)。
【0043】
次に、第1の予測モデル学習部202は、上記のステップS101で取得された実績データ集合Dを用いて、第1の予測モデルfを学習する(ステップS102)。なお、より精度の良い第1の予測モデルfを得るために、本ステップで第1の予測モデルfを学習する際に、実績データ集合Dに加えて、操業情報等といった補助的な情報が用いられてもよい。
【0044】
次に、第2の予測モデル学習部203は、上記のステップS101で取得された実績データ集合Dと、学習済みの第1の予測モデルfとを用いて、第1の予測モデルfの学習誤差s(t)を算出する(ステップS103)。すなわち、第2の予測モデル学習部203は、例えば、各t∈Tに対して、s(t)=y(t)-f(x(t),z(t))により学習誤差s(t)を算出する。
【0045】
次に、第2の予測モデル学習部203は、上記のステップS101で取得された実績データ集合Dに含まれる各操作変数実績値x(t)及び環境変数実績値z(t)と、上記のステップS103で算出された各学習誤差s(t)とを用いて、第2の予測モデルgを学習する(ステップS104)。なお、より精度の良い第2の予測モデルgを得るために、本ステップで第2の予測モデルgを学習する際に、各操作変数実績値x(t)及び環境変数実績値z(t)と各学習誤差s(t)とに加えて、操業情報等といった補助的な情報が用いられてもよい。
【0046】
以上により、学習済みの第1の予測モデルfと学習済みの第2の予測モデルgとが得られる。なお、学習済みの第1の予測モデルfのパラメータは第1の予測モデル記憶部207に記憶され、学習済みの第2の予測モデルgのパラメータは第2の予測モデル記憶部208に記憶される。
【0047】
<予測処理>
以下、予測フェーズで実行される予測処理について、
図4を参照しながら説明する。なお、予測処理は、例えば、制御周期Δt毎に繰り返し実行される。
【0048】
まず、入力部201は、プラント状態の予測に用いる操作変数値と環境変数値を取得する(ステップS201)。以下、本ステップでは現在時刻t=t0の操作変数値x(t0)と環境変数値z(t0)が取得されたものとする。
【0049】
次に、予測部204は、上記のステップS201で取得された操作変数値x(t0)及び環境変数値z(t0)と、学習済みの第1の予測モデルfとを用いて、補正前のプラント状態予測値f(x(t0),z(t0))を算出する(ステップS202)。
【0050】
次に、予測部204は、上記のステップS201で取得された操作変数値x(t0)及び環境変数値z(t0)と、学習済みの第2の予測モデルgとを用いて、補正量g(x(t0),z(t0))を算出する(ステップS203)。
【0051】
次に、予測部204は、上記のステップS202で算出された補正前のプラント状態予測値f(x(t0),z(t0))を、上記のステップS203で算出された補正量g(x(t0),z(t0))により補正してプラント状態予測値を算出する(ステップS204)。すなわち、予測部204は、例えば、f(x(t0),z(t0))+g(x(t0),z(t0))と補正して(補正後の)プラント状態予測値を算出する。ただし、この補正方法は一例であって、これに限られるものではない。例えば、予め決められた係数0<α≦1を用いて、f(x(t0),z(t0))+α・g(x(t0),z(t0))と補正して(補正後の)プラント状態予測値が算出されてもよい。
【0052】
そして、出力部205は、上記のステップS204で算出されたプラント状態予測値を予め決められた所定の出力先に出力する(ステップS205)。
【0053】
以上により、第1の予測モデルfの予測値をその学習誤差に基づく補正量で補正したプラント状態予測値が得られる。しかも、補正量は、決定木等といった木構造を用いるモデルで実現される第2の予測モデルgの推論処理により算出されるため、上記の特許文献2等に記載されている従来技術と比較して、少ない計算時間で算出することができる。これにより、精度の良いプラント状態予測値を高速に得ることが可能となる。
【0054】
<評価>
以下、本実施形態に係るプラント状態予測装置10の評価について説明する。
【0055】
(x1,x2,x3,x4,x5,x6,x7,z1,z2,z3)という形式で表される模擬データを400点作成し、本実施形態に係るプラント状態予測装置10を評価した。ここで、x1~x7は0から1の範囲の一様乱数からランダムにサンプリングした。また、z1~z3はいずれか1つのみが1、それ以外は0となるようにランダムにサンプリングした。
【0056】
また、各模擬データに対して以下の式により状態変数実績値yを算出し、模擬データと状態変数実績値yとのペアを作成した。
【0057】
y=x1
2+x2
2+x3
2+x4
2+x5
2+x6
2+x7
2+c
ここで、cは、z1=1のときは5、z2=1のときは0、z3=1のときは-5とした。
【0058】
このとき、上記のペアで表されるデータのうち、0~300点を学習データ、301~400点を評価データとした。
【0059】
また、第1の予測モデルfは勾配ブースティングを採用し、yを目的変数、x1,x2,x3,x4,x5,x6,x7,z1,z2,z3を説明変数として、学習データを用いて学習を行った。第2の予測モデルgは決定木を採用し、第1の予測モデルfの学習誤差を目的変数、x1,x2,x3,x4,x5,x6,x7,z1,z2,z3を説明変数として、学習データを用いて学習を行った。
【0060】
そして、学習済みの第1の予測モデルfと学習済みの第2の予測モデルgと評価データとを用いて、補正前のプラント状態予測値と、(補正後の)プラント状態予測値とを算出し、状態変数実績値yと比較した。この比較結果を
図5に示す。なお、
図5の縦軸は状態変数値、横軸は評価データのサンプル番号(301~400)を表す。
【0061】
図5に示すように、補正によりプラント状態予測値が改善していることがわかる。このため、本実施形態に係るプラント状態予測装置10により、精度の良い予測値が得られることがわかる。
【0062】
<まとめ>
以上のように、本実施形態に係るプラント状態予測装置10では、プラント状態を予測する第1の予測モデルfと、第1の予測モデルの学習誤差を予測する第2の予測モデルgとを学習した上で、第2の予測モデルgが予測した学習誤差に基づく補正量を用いて、第1の予測モデルfの予測結果を補正する。これにより、精度の良い予測値を高速に得ることが可能となる。
【0063】
このため、例えば、第1の予測モデルfと第2の予測モデルgで構成されるモデルをシミュレータとして、上記の特許文献1に記載されている技術に適用する場合であっても、現実的な時間で最適な操作量を計算することが可能になると考えられる。
【0064】
なお、本実施形態に係るプラント状態予測装置10は、第1の予測モデルfと第2の予測モデルgによりプラント状態予測値を算出するものとしたが、例えば、第1の予測モデルfと第2の予測モデルgで構成されるモデルをシミュレータとして、上記の特許文献1に記載されている技術により対象の最適な操作量を算出してもよい。
【0065】
本発明は、具体的に開示された上記の実施形態に限定されるものではなく、特許請求の範囲の記載から逸脱することなく、種々の変形や変更、既知の技術との組み合わせ等が可能である。
【符号の説明】
【0066】
10 プラント状態予測装置
101 入力装置
102 表示装置
103 外部I/F
103a 記録媒体
104 通信I/F
105 RAM
106 ROM
107 補助記憶装置
108 プロセッサ
109 バス
201 入力部
202 第1の予測モデル学習部
203 第2の予測モデル学習部
204 予測部
205 出力部
206 実績データ記憶部
207 第1の予測モデル記憶部
208 第2の予測モデル記憶部
【手続補正書】
【提出日】2023-02-01
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習するように構成されている第1の学習部と、
前記運転実績データに基づいて、前記第1の予測モデルの学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習するように構成されている第2の学習部と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出するように構成されている予測部と、
を有し、
前記第2の予測モデルは、決定木を含む木構造を用いるモデルであり、
前記予測部は、
前記操作変数の値と前記環境変数の値を、前記木構造を用いるモデルに入力したときに、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の統計量を、前記学習誤差の予測値として算出するように構成されている、予測装置。
【請求項2】
前記予測部は、
前記状態変数の予測値に対して前記補正量を加算することで、前記状態変数の補正後の予測値を算出するように構成されている請求項1に記載の予測装置。
【請求項3】
前記予測部は、
前記学習誤差の予測値を前記補正量とするように構成されている請求項1又は2に記載の予測装置。
【請求項4】
前記統計量は、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の平均値である、請求項3に記載の予測装置。
【請求項5】
前記予測部は、
前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値のうち、前記学習誤差の絶対値が大きい順に上位所定の数の前記学習誤差の値を除いた上で、前記終端ノードに属する前記学習誤差の値の平均値を算出するように構成されている請求項4に記載の予測装置。
【請求項6】
対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習する第1の学習手順と、
前記運転実績データに基づいて、前記第1の予測モデルの学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習する第2の学習手順と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出する予測手順と、
をコンピュータが実行し、
前記第2の予測モデルは、決定木を含む木構造を用いるモデルであり、
前記予測手順は、
前記操作変数の値と前記環境変数の値を、前記木構造を用いるモデルに入力したときに、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の統計量を、前記学習誤差の予測値として算出する、予測方法。
【請求項7】
対象の過去の運転実績データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習する第1の学習手順と、
前記運転実績データに基づいて、前記第1の予測モデルの学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習する第2の学習手順と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から前記第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出する予測手順と、
をコンピュータに実行させ、
前記第2の予測モデルは、決定木を含む木構造を用いるモデルであり、
前記予測手順は、
前記操作変数の値と前記環境変数の値を、前記木構造を用いるモデルに入力したときに、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の統計量を、前記学習誤差の予測値として算出する、プログラム。
【手続補正書】
【提出日】2023-05-10
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
対象の過去の運転実績データを学習データとして、前記学習データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習するように構成されている第1の学習部と、
前記学習データに基づいて、前記第1の学習部によって学習された学習済み第1の予測モデルに対して前記学習データに含まれる操作変数の値及び環境変数の値を入力したときの状態変数の予測値と前記学習データに含まれる状態変数の値との誤差を表す学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習するように構成されている第2の学習部と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記学習済み第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から、前記第2の学習部によって学習された学習済み第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出するように構成されている予測部と、
を有し、
前記学習済み第2の予測モデルは、決定木を含む木構造を用いる学習済みモデルであり、
前記予測部は、
前記操作変数の値と前記環境変数の値を、前記木構造を用いる学習済みモデルに入力したときに、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の統計量を、前記学習誤差の予測値として算出するように構成されている、予測装置。
【請求項2】
前記予測部は、
前記状態変数の予測値に対して前記補正量を加算することで、前記状態変数の補正後の予測値を算出するように構成されている請求項1に記載の予測装置。
【請求項3】
前記予測部は、
前記学習誤差の予測値を前記補正量とするように構成されている請求項1又は2に記載の予測装置。
【請求項4】
前記統計量は、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の平均値である、請求項3に記載の予測装置。
【請求項5】
前記予測部は、
前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値のうち、前記学習誤差の絶対値が大きい順に上位所定の数の前記学習誤差の値を除いた上で、前記終端ノードに属する前記学習誤差の値の平均値を算出するように構成されている請求項4に記載の予測装置。
【請求項6】
対象の過去の運転実績データを学習データとして、前記学習データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習する第1の学習手順と、
前記学習データに基づいて、前記第1の学習手順によって学習された学習済み第1の予測モデルに対して前記学習データに含まれる操作変数の値及び環境変数の値を入力したときの状態変数の予測値と前記学習データに含まれる状態変数の値との誤差を表す学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習する第2の学習手順と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記学習済み第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から、前記第2の学習手順によって学習された学習済み第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出する予測手順と、
をコンピュータが実行し、
前記学習済み第2の予測モデルは、決定木を含む木構造を用いる学習済みモデルであり、
前記予測手順は、
前記操作変数の値と前記環境変数の値を、前記木構造を用いる学習済みモデルに入力したときに、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の統計量を、前記学習誤差の予測値として算出する、予測方法。
【請求項7】
対象の過去の運転実績データを学習データとして、前記学習データに基づいて、前記対象の状態を表す状態変数を目的変数、前記対象に対する操作を表す操作変数と前記対象の環境を表す環境変数とを説明変数として、前記操作変数と前記環境変数から前記状態変数を予測する第1の予測モデルを学習する第1の学習手順と、
前記学習データに基づいて、前記第1の学習手順によって学習された学習済み第1の予測モデルに対して前記学習データに含まれる操作変数の値及び環境変数の値を入力したときの状態変数の予測値と前記学習データに含まれる状態変数の値との誤差を表す学習誤差を目的変数、前記操作変数と前記環境変数とを説明変数として、前記操作変数と前記環境変数から前記学習誤差を予測する第2の予測モデルを学習する第2の学習手順と、
前記操作変数の値と前記環境変数の値とが与えられたときに、前記操作変数の値と前記環境変数の値から前記学習済み第1の予測モデルによって予測した前記状態変数の予測値を、前記操作変数の値と前記環境変数の値から、前記第2の学習手順によって学習された学習済み第2の予測モデルによって予測した前記学習誤差の予測値に基づく補正量により補正し、前記状態変数の補正後の予測値を算出する予測手順と、
をコンピュータに実行させ、
前記学習済み第2の予測モデルは、決定木を含む木構造を用いる学習済みモデルであり、
前記予測手順は、
前記操作変数の値と前記環境変数の値を、前記木構造を用いる学習済みモデルに入力したときに、前記操作変数の値と前記環境変数の値が分類される終端ノードに属する前記学習誤差の値の統計量を、前記学習誤差の予測値として算出する、プログラム。