IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人広島大学の特許一覧 ▶ 東洋紡株式会社の特許一覧

特開2024-29816状態推定装置、状態推定方法及びプログラム
<>
  • 特開-状態推定装置、状態推定方法及びプログラム 図1
  • 特開-状態推定装置、状態推定方法及びプログラム 図2
  • 特開-状態推定装置、状態推定方法及びプログラム 図3
  • 特開-状態推定装置、状態推定方法及びプログラム 図4
  • 特開-状態推定装置、状態推定方法及びプログラム 図5
  • 特開-状態推定装置、状態推定方法及びプログラム 図6
  • 特開-状態推定装置、状態推定方法及びプログラム 図7
  • 特開-状態推定装置、状態推定方法及びプログラム 図8
  • 特開-状態推定装置、状態推定方法及びプログラム 図9
  • 特開-状態推定装置、状態推定方法及びプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024029816
(43)【公開日】2024-03-07
(54)【発明の名称】状態推定装置、状態推定方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240229BHJP
   G05B 23/02 20060101ALI20240229BHJP
【FI】
G06N20/00
G05B23/02 R
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022132211
(22)【出願日】2022-08-23
(71)【出願人】
【識別番号】504136568
【氏名又は名称】国立大学法人広島大学
(74)【代理人】
【識別番号】100196380
【弁理士】
【氏名又は名称】森 匡輝
(71)【出願人】
【識別番号】000003160
【氏名又は名称】東洋紡株式会社
(72)【発明者】
【氏名】山本 透
(72)【発明者】
【氏名】木下 拓矢
(72)【発明者】
【氏名】土井 邦之
(72)【発明者】
【氏名】田丸 慎也
(72)【発明者】
【氏名】西村 和紀
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA05
3C223BA01
3C223CC01
3C223DD01
3C223FF04
3C223FF12
3C223FF22
3C223FF24
3C223FF26
3C223FF42
3C223GG01
3C223HH03
3C223HH08
(57)【要約】
【課題】精度よく目的変量の推定を行うことができるとともに、データベースの学習状況を分析可能な状態推定装置、状態推定方法及びプログラムを提供する。
【解決手段】状態推定装置1は、推定対象Pの状態を表す説明変量xと目的変量yとを含む複数のデータセットを格納するデータベースDBを作成するデータベース作成部111と、データベースDBを学習させる学習部112と、学習されたデータベースDBに基づいて、推定対象Pの測定値である説明変量xに対応する目的変量yを推定する推定部114と、を備える。データベース作成部111は、測定可能な状態変数のうち重要度の大きい変数を説明変量xとして選択し、学習部112は、学習前の初期データセットを、学習用データセットを用いて推定用データベースを作成し、推定用データベースの推定用データセットは、初期データセットのデータと学習によるデータの修正量とを含むデータセットである。
【選択図】図2
【特許請求の範囲】
【請求項1】
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットを格納するデータベースを作成するデータベース作成部と、
前記データベースを学習させる学習部と、
前記学習部で学習された前記データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部と、を備え、
前記データベース作成部は、前記推定対象の動作中に測定可能な状態変数のうち重要度の大きい変数を前記説明変量として選択し、
前記学習部は、学習前の初期データセットを、学習用データセットを用いて更新することにより学習させて推定用データベースを作成し、
前記推定用データベースの推定用データセットは、初期データセットのデータと、学習によるデータの修正量とを含むデータセットである、
ことを特徴とする状態推定装置。
【請求項2】
前記修正量は、推定された前記目的変量と実測された前記目的変量との差に基づいて導出される、前記目的変量の補正値である、
ことを特徴とする請求項1に記載の状態推定装置。
【請求項3】
前記データベース作成部は、前記データベースを作成するために取得された複数の前記データセットに含まれる前記目的変量を、所定の前記説明変量の時間変化に基づいて補間する、
ことを特徴とする請求項1に記載の状態推定装置。
【請求項4】
前記データベース作成部は、前記データベースを作成するために取得された複数の前記データセットを、前記説明変量と前記目的変量との関係に影響を与える環境指標に基づいて複数のデータ群に分類し、前記データ群ごとに前記データベースを作成する、
ことを特徴とする請求項1から3のいずれか一項に記載の状態推定装置。
【請求項5】
前記推定部は、
測定された前記説明変量と、前記推定用データセット中の前記説明変量との類似度を演算して近傍データを抽出し、前記データベースごとに抽出された前記近傍データの数に基づいて前記データベースごとの重みを算出し、前記近傍データと前記重みに基づいて、前記目的変量を推定する、
ことを特徴とする請求項4に記載の状態推定装置。
【請求項6】
推定対象の動作中に測定可能な状態変数のうち重要度の大きい変数を説明変量として選択し、前記推定対象の状態を表す前記説明変量と目的変量とを含む複数のデータセットをデータベースに格納して初期データベースを作成する初期データベース作成ステップと、
前記初期データベースを、学習用データセットを用いて学習させて推定用データベースを作成する学習ステップと、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定ステップと、を含み、
前記推定用データベースに格納された推定用データセットは、初期データセットのデータと、学習によるデータの修正量とを含むデータセットである、
ことを特徴とする状態推定方法。
【請求項7】
コンピュータを、
推定対象の動作中に測定可能な状態変数のうち重要度の大きい変数を説明変量として選択し、前記推定対象の状態を表す前記説明変量と目的変量とを含む複数のデータセットをデータベースに格納して初期データベースを作成するデータベース作成部、
前記データベースを、学習用データセットを用いて学習させて、初期データセットのデータと、学習によるデータの修正量とを含む推定用データセットを格納する推定用データベースを作成する学習部、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部、
として動作させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、状態推定装置、状態推定方法及びプログラムに関する。
【背景技術】
【0002】
従来、対象の状態を表すパラメータとして測定された説明変量(入力変数)の値に基づいて、所定の目的変量(出力変数)の値を推定する状態推定方法が開発されている。このような状態推定方法は、ソフトセンサと呼ばれ、高温高圧環境となるプラント内の各種パラメータ、製品品質等、測定が難しいパラメータを、物理的なセンサ(ハードセンサ)によって測定された物理量(測定値)を用いて推定する場合等に用いられている。
【0003】
例えば特許文献1のように、ソフトセンサの入力値と、保存された複数のデータとに基づいて、出力値を推定する状態推定方法が開発されている。特許文献1のソフトセンサでは、保存されたデータを学習させることにより、ソフトセンサの精度を向上させることとしている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開第2002/006953号
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1のソフトセンサでは、所定の大きさのメッシュで量子化された入力空間に入力値と出力値との組み合わせ(データセット)である履歴データが振り分けられて事例ベースが作成される。出力値は、この事例ベースと、測定された現在の入力値とに基づいて、推定される。特許文献1の事例ベースでは、メッシュごとに、事例としてのデータセットの値が学習により修正され、事例ベースのデータセットが作成される。
【0006】
しかしながら、ソフトセンサは、推定対象の動作中に測定可能な状態変数である説明変量を用いて、測定困難な目的変量を推定するので、精度よく目的変量を推定することは難しい。
【0007】
また、特許文献1のデータセットは、学習により上書き修正されたデータのみが保存されており、修正後に初期のデータセットの入力値、出力値に対する学習の状況を確認することは難しい。
【0008】
本発明は、上述の事情に鑑みてなされたものであり、精度よく目的変量の推定を行うことができるとともに、データベースの学習状況を分析可能な状態推定装置、状態推定方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
上記目的を達成するために、本発明の第1の観点に係る状態推定装置は、
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットを格納するデータベースを作成するデータベース作成部と、
前記データベースを学習させる学習部と、
前記学習部で学習された前記データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部と、を備え、
前記データベース作成部は、前記推定対象の動作中に測定可能な状態変数のうち重要度の大きい変数を前記説明変量として選択し、
前記学習部は、学習前の初期データセットを、学習用データセットを用いて更新することにより学習させて推定用データベースを作成し、
前記推定用データベースの推定用データセットは、初期データセットのデータと、学習によるデータの修正量とを含むデータセットである。
【0010】
また、前記修正量は、推定された前記目的変量と実測された前記目的変量との差に基づいて導出される、前記目的変量の補正値である、
こととしてもよい。
【0011】
また、前記データベース作成部は、前記データベースを作成するために取得された複数の前記データセットに含まれる前記目的変量を、所定の前記説明変量の時間変化に基づいて補間する、
こととしてもよい。
【0012】
また、前記データベース作成部は、前記データベースを作成するために取得された複数の前記データセットを、前記説明変量と前記目的変量との関係に影響を与える環境指標に基づいて複数のデータ群に分類し、前記データ群ごとに前記データベースを作成する、
こととしてもよい。
【0013】
また、前記推定部は、
測定された前記説明変量と、前記推定用データセット中の前記説明変量との類似度を演算して近傍データを抽出し、前記データベースごとに抽出された前記近傍データの数に基づいて前記データベースごとの重みを算出し、前記近傍データと前記重みに基づいて、前記目的変量を推定する、
こととしてもよい。
【0014】
本発明の第2の観点に係る状態推定方法は、
推定対象の動作中に測定可能な状態変数のうち重要度の大きい変数を説明変量として選択し、前記推定対象の状態を表す前記説明変量と目的変量とを含む複数のデータセットをデータベースに格納して初期データベースを作成する初期データベース作成ステップと、
前記初期データベースを、学習用データセットを用いて学習させて推定用データベースを作成する学習ステップと、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定ステップと、を含み、
前記推定用データベースに格納された推定用データセットは、初期データセットのデータと、学習によるデータの修正量とを含むデータセットである。
【0015】
本発明の第3の観点に係るプログラムは、
コンピュータを、
推定対象の動作中に測定可能な状態変数のうち重要度の大きい変数を説明変量として選択し、前記推定対象の状態を表す前記説明変量と目的変量とを含む複数のデータセットをデータベースに格納して初期データベースを作成するデータベース作成部、
前記データベースを、学習用データセットを用いて学習させて、初期データセットのデータと、学習によるデータの修正量とを含む推定用データセットを格納する推定用データベースを作成する学習部、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部、
として動作させる。
【発明の効果】
【0016】
本発明の状態推定装置、状態推定方法及びプログラムによれば、データベースに格納されるデータセットに含まれる説明変量として、重要度の大きい状態変数を選択して用いるので、高い精度で目的変量の推定を行うことができる。また、データベースに格納される推定用データセットを、初期データセットのデータと修正量とを含むデータセットとしているので、初期データセットからの修正量を確認可能であり、学習状況を容易に分析することができる。
【図面の簡単な説明】
【0017】
図1】本発明の実施の形態に係る状態推定の概要を示す概念図
図2】実施の形態1に係る状態推定装置の機能ブロック図
図3】実施の形態1に係る状態推定処理の流れを示すフローチャート
図4】基本データにおける目的変量の補間方法を示す概念図
図5】実施の形態2に係る状態推定装置の機能ブロック図
図6】実施の形態2に係る状態推定処理の流れを示すフローチャート
図7】実施の形態2に係る目的変量の推定方法を示す概念図
図8】状態変数の重要度の例を示すグラフ
図9】変数選択を行った場合の状態推定の例を示すグラフ
図10】変数選択を行わなかった場合の状態推定の例を示すグラフ
【発明を実施するための形態】
【0018】
以下、図を参照しつつ、本発明の実施の形態に係る状態推定装置及び状態推定方法について説明する。
【0019】
(実施の形態1)
(状態推定システムの概要)
図1は、本実施の形態に係る状態推定の概要を示す概念図である。ここで、y(t)は推定対象P(制御対象)の出力、x(t)は状態変数、^y(t)はソフトセンサで算出された出力y(t)の推定値である。
【0020】
状態変数x(t)は、出力y(t)への影響度が弱い(重要度が小さい)変数を含む場合がある。重要度が小さい状態変数x(t)に基づいて出力y(t)を推定すると、ノイズの影響を受けやすくなり、推定精度が劣化するおそれがある。本実施の形態では、状態変数x(t)のうち、出力y(t)への影響度が強い(重要度が大きい)変数を、状態変数xrn(t)として選択し、選択された状態変数xrn(t)を用いて、ソフトセンサとして機能する状態推定装置を構成する。
【0021】
また、本実施の形態では、推定対象Pである制御対象として、以下の式に示す離散時間非線形システムを考える。
【数1】
ここで、f(・)は非線形関数、φ(t-1)はシステムの時刻tより前の状態を表しており、φを情報ベクトルともいう。
【0022】
φ(t-1)は次式で定義される。
【数2】
ここで、nは出力yの次数であり、nxnは状態変数xrnの次数である。
【0023】
(状態推定装置)
図2のブロック図に示すように、本実施の形態に係る状態推定装置1は、制御部11、記憶部12、表示部13、入力部14を備える。
【0024】
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等から構成されており、状態推定装置1の動作を制御する。また、制御部11は、推定対象Pの現在の状態を表すパラメータ(説明変量x)の値を取得し、取得した説明変量xの値と、記憶部12に記憶されているデータベースDBとに基づいて、目的変量yを推定する。
【0025】
制御部11は、制御部11のROM、記憶部12等に記憶されている各種動作プログラム及びデータをRAMに読み込んでCPUを動作させることにより、図2に示す制御部11の各機能を実現させる。これにより、制御部11は、データベース作成部111、学習部112、説明変量取得部113、推定部114として動作する。
【0026】
データベース作成部111は、推定対象Pの過去の操業データ又はシミュレーションデータとして取得された基本データPDに含まれる複数の状態変数xから、目的変量yを推定するためのデータセットφに含まれる1又は2以上の状態変数xrnを説明変量xとして選択する。また、データベース作成部111は、選択した説明変量xに係る基本データPDに基づいて、データセットφが蓄積されたデータベースDBを作成する。
【0027】
学習部112は、データベースDBに記憶されている初期データセット~φ(j)を、学習用データセットφ(t)(教師データ)を用いて学習させ、推定用データセットφ(j)を生成する。各データセットは、説明変量x、目的変量y等を含むものであり、各データセットの詳細については後述する。初期データセット~φ(j)及び学習用データセットφ(t)は、例えば、予め取得された基本データPDを振り分けて生成される、互いに異なるデータを含むデータセットである。
【0028】
説明変量取得部113は、推定対象Pの状態を表すものとして測定されるパラメータのうちデータベース作成部111で選択された説明変量xの値を取得する。説明変量xは、例えば、化学プラントである推定対象Pにおいて、物理的なセンサ(ハードセンサ)を用いて測定可能な材料の温度、重量、装置内の圧力等の物理量である。
【0029】
推定部114は、学習部112によって学習され、記憶部12のデータベースDBに格納されている推定用データセットφ(j)と、説明変量取得部113で取得された推定対象Pの説明変量x等に基づいて、目的変量yの推定値^yを算出する。
【0030】
記憶部12は、ハードディスク、フラッシュメモリ等の不揮発性メモリであり、説明変量xから目的変量yを推定するためのプログラム、推定部114で推定された目的変量^y等を記憶する。また、記憶部12は、目的変量yを推定するための複数の推定用データセットφ(j)を格納するデータベースDBを備える。本実施の形態に係る初期データセット~φ(j)は、推定対象Pの状態を表す説明変量x、目的変量yを含む。また、推定用データセットφ(j)は、説明変量x、目的変量yを含む初期データセット~φ(j)に修正量cを加えたものである。
【0031】
表示部13は、推定対象Pの現在の状態を示す説明変量x、推定された目的変量^y等の情報を表示する表示デバイスであり、例えば、液晶モニタである。
【0032】
入力部14は、推定用データセットφ(j)の学習条件等の各種設定値、目的変量yの推定の開始、終了指示等を入力するキーボード、マウス、タッチパネル等の入力デバイスである。
【0033】
続いて、状態推定装置1を用いた推定対象Pの状態推定方法について、図3のフローチャートを参照しつつ、具体的に説明する。本実施の形態に係る状態推定処理では、取得した基本データPDから状態推定に用いる説明変量xを選択して、状態推定を行うためのデータベースDBを作成し、データベースDBの学習を行う。そして、学習されたデータベースDBを用いて、目的変量yを推定する。
【0034】
図3に示すように、初期データベース作成ステップとして、状態推定装置1のデータベース作成部111は、推定対象Pの操業データ等の基本データPDを取得する(ステップS11)。基本データPDは、予め記憶部12に格納されていてもよいし、状態推定装置1とネットワークを介して接続されたサーバ等の外部記憶装置に格納されていてもよい。
【0035】
ここで、基本データPDに含まれる説明変量xは、推定対象Pの動作中に測定可能な状態変数xであるのに対し、目的変量yは、推定対象Pの動作中に測定することが難しい変数である。例えば、目的変量yは、化合物を生成する化学プラントにおいて、動作停止中でなければ測定することが難しい化合物の組成等である。この場合、操業データとして取得される基本データPDの目的変量yは、図4に示すように、推定対象Pの動作停止時のデータのみとなる。そこで、本実施の形態では、所定の状態変数xに基づいて、目的変量yを補間して、基本データPDとして用いることとする。
【0036】
具体的には、データベース作成部111は、状態変数xのうち、時間変化の傾向が目的変量yと近いと考えられるものを選択する。そして、データベース作成部111は、目的変量yの初期値(時刻t=0)と、測定データ(時刻t=t)との間のデータを、選択された状態変数xの時間変化、例えばt=0~tの各測定時刻における変化率に基づいて補間する。図4は、目的変量yと選択された状態変数xとが、ともに単純増加する場合の補間について示しているが、実際には増加、減少等の変化の傾向に基づいて補間される。また、補間を行う際に参照される状態変数xの選択方法は特に限定されず、過去の操業データ、シミュレーションデータ等に基づいて、目的変量yと変化の傾向がより近似すると推測される状態変数xを選択すればよい。
【0037】
データベース作成部111は、取得した基本データPDに含まれる状態変数xから状態推定に用いる状態変数xrnを説明変量xとして選択する(ステップS12)。変数選択の方法としては、変数選択、特徴量選択において用いられる公知の方法を用いることができる。例えば、前向き法、後ろ向き法等のラッパー法、ラッソ回帰、決定木等の組み込み法等を用いることができる。
【0038】
データベース作成部111は、基本データPDから説明変量x及び目的変量yに関するデータを抽出し、2つの群に振り分けることにより、初期データセット~φ(j)(ただし、jは1~Nの自然数であり、Nは2以上である。)及び学習用データセットφ(t)を生成する(ステップS13)。尚、外れ値の影響を抑えるため、事前に基本データPDから外れ値を除去していることが好ましい。
【0039】
初期データセット~φ(j)は、以下の式(3)に示すように、推定対象Pにおいて測定可能なデータである説明変量~x(j)と、制御対象の動作中において測定が困難な目的変量~y(j)とを含む。状態推定装置1は、初期データセット~φ(j)を格納したデータベースDB(以下、初期データベースDBともいう。)を作成し、記憶部12に記憶させる(ステップS14)。
【数3】
【0040】
また、上式に示すように、初期データセット~φ(j)は、後述する学習によって目的変量yの推定値を修正するためのパラメータである修正量c(j)を含む。ただし、学習前である初期データセット~φ(j)中の修正量~c(j)は、~c(j)=0と設定されている。
【0041】
続いて、学習ステップとして、学習部112は、以下の式に示す学習用データセットφ(t)(ただし、tは1~Mの自然数である。)を用いて初期データベースDBを学習させる。
【数4】
【0042】
学習用データセットφ(t)は、初期データセット~φ(j)と同様に、予め測定されたデータ等である基本データPDに基づいて生成され、初期データセット~φ(j)とは異なるデータである。また、学習用データセットφ(t)は、初期データベースDBの学習に用いられるデータセットであるので、上式に示すように、修正量cは含まない。
【0043】
学習ステップでは、学習部112は、学習用データセットφ(t)(要求点)を選択する(ステップS15)。学習部112は、選択された学習用データセットφ(t)と、初期データベースDBに格納されている初期データセット~φ(j)との類似度Sを算出する(ステップS16)。学習用データセットφ(t)と初期データセット~φ(j)との類似度S(φ(t),~φ(j))、すなわち学習用データセットφ(t)に含まれる説明変量xと初期データセット~φ(j)に含まれる説明変量xとの近さは、以下の式で表される。
【0044】
【数5】
なお,hはバンド幅であり、~φ(j,i)は、データベースDBに記憶されている第j番目のデータセットφにおける説明変量xの第i番目の要素を表す。また、n,nはそれぞれ目的変量y,説明変量xの次数である。バンド幅hの決定方法は特に限定されず、プラグ・イン法(Plug-In Method)等の公知の方法を用いることができる。
【0045】
類似度Sが最も高くなるのは、要求点φ(t)と同じ説明変量xを有する初期データセット~φ(j)が存在する場合であり、この場合の類似度Sは以下の式となる。
【数6】
【0046】
また、要求点φ(t)の説明変量xと、初期データセット~φ(j)の説明変量xとが類似していない場合、類似度S(φ(t),~φ(j))は0に近づく。したがって、本実施の形態に係る学習部112は、以下の類似度Sに基づく条件式を満足する初期データセット~φ(j)を近傍データとして選択する(ステップS17)。
【数7】
ここで、Tthは閾値であり、0≦Tth≦1の範囲で設定される。
【0047】
続いて、ステップS17で選択された近傍データである初期データセット~φ(j)の目的変量y及び修正量cを用いて、以下で示される重み付き局所線形平均法(Linearly Weighted Average:LWA)により目的変量yの推定値^yを算出する(ステップS18)。
【数8】
ここで、kはステップS17で選択された近傍データの数である。
【0048】
また、wは近傍データとして選択されたi番目の初期データセット~φ(j)に含まれる目的変量y及び修正量cに対する重みであり、以下の式で与えられる。
【数9】
【0049】
以上の手順により、類似度Sに基づいて、初期データセット~φ(j)中の説明変量xに対する目的変量yの推定値^yを算出することができる。
【0050】
学習部112は、式(8)に示すように、近傍データの目的変量~y(i)にその修正量~c(i)を足し合わせたものを、式(9)で算出された重みωと掛け合わせて、近傍データ全てについて算出された値を足し合わせる。これにより、学習部112は、近傍データとの類似度Sに対応した推定目的変量^y(t)を算出することができる。なお、学習開始時においては、修正量~c(i)は0であり、以下のデータ修正によって順次更新される。
【0051】
学習部112は、式(8)で推定された推定値^yと、学習用データセットφ(t)に含まれる実測値又は補間値である目的変量y(t)との誤差に基づいて、修正量~cを更新する(ステップS19)。具体的には、学習部112は、以下の式(10)に示す最急降下法を用いて修正量~cを更新する。
【数10】
【0052】
ここで、~c(i)はステップS17で選択された近傍データの修正量である。また、ηは学習係数、J(t)は、以下の式(11)、(12)で定義される評価規範である。
【数11】
【0053】
式(12)に示すように、学習部112は、実測又は補間された目的変量yと推定された目的変量^yとの誤差を最小化する修正量~cnewを算出して、データベースDBに格納されている近傍データの修正量~c(j)を更新する。これにより、初期データセット~φ(j)は逐次更新される。上記の式(10)~(12)に示すように、修正量cは、推定された目的変量^yと実測又は補間された目的変量yとの差に基づいて導出される目的変量の補正値である。
【0054】
修正量~c(j)の更新の後、ステップS15へ戻り、学習部112は、次の学習用データセットφ(t)を用いて、初期データセット~φ(j)の学習を行う。ステップS15~S19の学習は、上記の評価規範J(t)が十分に小さくなるまで、すなわち予め設定された閾値Th以下となるまで繰り返される(ステップS20のNO)。
【0055】
評価規範J(t)が十分に小さく、すなわち予め設定された閾値Th以下になると、学習部112は、学習を終了する(ステップS20のYES)。これにより、学習部112は、学習が終了した初期データセット~φ(j)を、より適切な推定が可能なデータセットである推定用データセットφ(j)としてデータベースDBに格納し、推定用のデータベースDB(以下、推定用データベースDBpともいう。)とする。
【0056】
上述のように、本実施の形態に係る推定用データセットφ(j)では、学習によって初期データセット~φ(j)の説明変量~x(j)及び目的変量~y(j)を変更せず、独立して設けられた修正量~cを更新して学習することとしている。これにより、学習後の推定用データセットφ(j)は、初期データセット~φ(j)の説明変量~x(j)、目的変量~y(j)を保持するので、学習によって更新されたパラメータを容易に確認することが可能となる。
【0057】
続いて、状態推定ステップとして、状態推定装置1は、学習された推定用データベースDBpを用いて、推定対象Pの状態推定を行う。状態推定が開始されると、状態推定装置1の推定部114は、推定対象Pの説明変量x(要求点)を取得する(ステップS21)。
【0058】
推定部114は、取得した説明変量xと推定用データセットφ(j)との類似度Sを算出し、取得した説明変量xの近傍データを選択する(ステップS22)。類似度Sの算出方法及び近傍データの選択方法は、学習ステップにおけるステップS16、S17と同様である。すなわち、推定部114は、取得した説明変量xと、推定用データセットφ(j)の説明変量xとの類似度Sを式(5)と同様に算出する。そして推定部114は、算出された類似度Sの高いものから、予め定められた所定の個数の推定用データセットφ(j)を近傍データとして選択する。
【0059】
推定部114は、ステップS22で選択された近傍データに基づいて、目的変量yを推定する(ステップS23)。目的変量yの推定方法は、学習ステップにおけるステップS18の目的変量yの推定方法と同様である。すなわち、推定部114は、ステップS22で選択された近傍データである推定用データセットφ(j)に、式(8),(9)と同様の重み付き局所線形平均法を適用して、推定目的変量^yを算出する。
【0060】
状態推定装置1は、状態推定処理が終了するまで(ステップS24のNO)、ステップS21~S23の状態推定処理を繰り返す。そして、入力部14への終了指示の入力、所定の推定処理時間の終了等の終了条件を充足すると(ステップS24のYES)、状態推定装置1は状態推定処理を終了する。
【0061】
以上説明したように、本実施の形態に係る状態推定装置及び状態推定方法によれば、重要度の大きい状態変数として選択された説明変量xに基づいてデータセットφを構成し、目的変量yの推定に用いるデータベースDBを作成する。また、推定用データセットφ(j)を、初期データセット~φ(j)と修正量c(j)とを含むデータとして構成し、データベースDBを学習させている。したがって、重要度の大きい説明変量を用いて構成され、学習されたデータベースDBを用いることにより、高い精度で目的変量yの推定を行うことができる。また、初期データセット~φ(j)からの修正量c(j)を確認できるので修正状況を容易に把握することが可能である。これにより、修正量cの変化、初期データセット~φ(j)及び近傍データ数の妥当性等の分析を容易に行うことができる。
【0062】
(実施の形態2)
上述の実施の形態1では、データベースDBは1つであることとしたが、2つ以上のデータベースDBを用いることもできる。本実施の形態では、制御対象の動作状態、すなわち説明変量xと目的変量yとの関係に影響を与える環境指標EIに基づいて複数のデータベースDBを作成し、これら複数のデータベースDBを用いて目的変量yを推定する状態推定装置2について説明する。
【0063】
本実施の形態では、データベースDBの構成が実施の形態1と異なり、その他の構成は実施の形態1と同様であるので、同じ符号を付して説明を省略する。
【0064】
図5に示すように、本実施の形態に係る状態推定装置2は、複数のデータベースDBnを備える。本実施の形態に係る状態推定装置2は、4つのデータベースDBn(データベースDB1~DB4)を備えることとする。以下、図6のフローチャートを参照しつつ、本実施の形態に係る状態推定の流れについて説明する。
【0065】
図6に示すように、初期データベース作成ステップとして、状態推定装置2は、推定対象Pの操業データ等、データベースDBnを作成するための複数のデータセットを含む基本データPDを取得する(ステップS31)。本実施の形態に係る基本データPDは、環境指標EIの異なる複数のデータ群として与えられる。環境指標EIは、推定対象Pの動作状態、すなわち説明変量xと目的変量yとの関係に影響を与える指標であり、例えば、推定対象Pの周囲の温度、湿度等に基づいて定義される指標である。ステップS31で取得される基本データPDは、環境指標EIが所定の範囲を超えて離れている状態で取得された操業データ等のデータ群であり、例えば、環境温度が大きく異なる季節ごとに取得された操業データである。
【0066】
データベース作成部111は、取得した基本データPDに含まれる状態変数xから重要度の大きい状態変数xrnを説明変量xとして選択する(ステップS32)。変数選択の方法は、実施の形態1のステップS12と同様である。また、データベース作成部111は、選択された説明変量xに係る基本データPDを環境指標EIに基づいて複数のデータ群に分類する。例えば、データベース作成部111は、説明変量xに基づいて基本データPDを、環境温度の異なる季節ごとのデータ群に分類する(ステップS33)。
【0067】
データベース作成部111は、分類されたデータ群ごとに、実施の形態1と同様の方法により、初期データセット~φ(j)及び学習用データセットφ(t)を生成し(ステップS34)、複数の初期データベースDBを作成する(ステップS35)。
【0068】
続いて、学習ステップとして、学習部112は、初期データベースDBごとに、学習用データセットφ(t)を用いて学習を行う(ステップS36)。学習ステップの処理(ステップS36)は、実施の形態1に係る学習ステップの処理であるステップS15~S20と同様の処理を、各初期データベースDBについて行うものである。これにより、複数の学習済みデータベースDBnが作成される。
【0069】
続いて、状態推定ステップとして、状態推定装置2は、作成された複数のデータベースDBnを用いて、目的変量yの推定を行う(図7)。具体的には、説明変量取得部113は、推定対象Pの説明変量xの測定値を取得する(ステップS37)。推定部114は、各データベースDBnにおいて、測定値に基づく要求点と推定用データセットφ(j)との類似度Sを演算し、類似度Sが予め設定された基準類似度Ssより高い推定用データセットφ(j)を近傍データとして選択する(ステップS38)。
【0070】
推定部114は、データベースDBnごとに、選択された近傍データに基づいて、目的変量yの推定値^yを算出する(ステップS39)。推定目的変量^yの算出方法は、実施の形態1に係るステップS23と同様である。
【0071】
また、推定部114は、各データベースDB1~DB4において基準類似度Ssを超えたデータ数N~Nを計数する(ステップS40)。推定部114は、計数したデータ数N~Nを用いて、以下の式によって重みv~vを算出する。
【数12】
【0072】
推定部114は、以下の式に示す重み付き平均法に基づいて、要求点に対応する推定値^y(t)を算出する(ステップS41)。
【数13】
【0073】
状態推定装置2は、状態推定処理が終了するまで(ステップS42のNO)、ステップS37~S41の状態推定処理を繰り返す。そして、入力部14への終了指示の入力、所定の推定処理時間の終了等の終了条件を充足すると(ステップS42のYES)、状態推定装置2は状態推定処理を終了する。
【0074】
これにより、環境指標EIに基づいて、説明変量xと目的変量yとの関係について、近い傾向を有するデータベースDBnの影響を大きく反映させて、目的変量yの推定を行うことができる。したがって、環境指標EIが大きく変化する状態であっても、より精度よく状態推定を行うことが可能となる。
【0075】
(数値例)
以下、本発明の実施の形態に係る状態推定の数値例について説明する。本例では、ポリエステルの生成に係る重縮合反応プロセスにおける状態推定について説明する。本プロセスは、温度や圧力などを制御することで重縮合反応を高め、ポリエステルを生成するものである。
【0076】
高分子化合物の製造プロセスにおける重縮合反応では、製品品質の指標として、化合物の粘度が一般的に用いられる。重縮合反応における化合物の粘度は、通常、反応終了後に測定されるものであり、反応中に測定することは難しい。例えば、ポリエステルの重縮合反応においては、製品品質の指標として極限粘度(固有粘度)、還元粘度が重要となる。そこで、本例では、目的変量yを還元粘度として、状態推定を行う。また、説明変量xとなる状態変数xは、反応中の温度、圧力、原料流量等多数存在するが、初期データベース作成ステップにおける変数選択によって、反応中に測定可能な183個の状態変数xから、重要度の大きい23個の状態変数xrnを、説明変量xとして選択した。
【0077】
本例では、ランダムフォレストを用いて状態変数xの重要度を分析し、変数選択を行った。図8は、ランダムフォレストによって演算された状態変数xの重要度の一部を示したものである。図8に示すように、ランダムフォレストを適用することにより、重要度の大きい状態変数xを説明変量xとして選択できることがわかる。
【0078】
また、本例では、実測データとして得られた基本データPDを、初期データセット~φ(j)用データ、学習用データセットφ(t)用データ及び検証用データに振り分けて使用した。また、近傍データを選択する際の近傍データ数kは3とし、学習に用いる学習係数ηは0.2とした。
【0079】
上記条件で作成したデータベースDBを用いて推定を行った結果の一例を図9及び図10に示す。図9及び図10のグラフでは、横軸の時間を0~100、縦軸の還元粘度を0~1の範囲で正規化して示している。図9は、変数選択を行って、説明変量xの数を23個として推定を行った結果を示すグラフである。図9に示すように、丸印で示す還元粘度の真値(実測値)に近づくように徐々に粘度が高くなるように推定できており、適切な状態推定が行われていることがわかる。
【0080】
図10は、変数選択を行わず、183個の状態変数xを説明変量xとして用いた場合の状態推定の結果を示している。図10に示すように、図9の場合と比較して、還元粘度の真値と推定値とが乖離しており、推定精度が劣化していることがわかる。
【0081】
本例では、複数の検証データを用いて推定を行い、以下の式に示す誤差率Iを用いて、結果の評価を行った。
【数14】
【0082】
本例の全検証データに対する誤差率Iの平均値は2.91%であり、有効な状態推定を行えることが確認できた。また、変数選択を行わなかった場合の誤差率Iの平均は3.24%であり、データベースDBの作成の際、事前に重要度の大きい状態変数xを説明変量xとして選択することにより、精度よく状態推定を行えることが確認できた。
【0083】
上記の実施の形態では、状態推定処理を行う前にデータベースDBの学習を終了することとしたが、これに限られない。推定対象Pの動作中に目的変量yが測定可能な場合、例えば、説明変量xより低い頻度で目的変量yが測定可能である場合、測定された説明変量x及び目的変量yを用いてデータベースDBをオンライン学習させることとしてもよい。この場合、状態推定装置1の制御部11は、動作中の推定対象Pのセンサから取得した説明変量x、目的変量yを学習用データセットφとして、推定用データベースDBpの学習を行うこととすればよい。学習のタイミングは、例えば、目的変量yが取得されるタイミングとすればよい。これにより、推定対象Pの状態変化に対応した、より精度の高い状態推定を行うことが可能となる。
【0084】
また、上記実施の形態に係る状態推定方法は、通常のコンピュータシステムを用いて実現可能である。例えば、上記実施の形態に係る状態推定を実行するためのコンピュータプログラムを、インターネット等のネットワークを介して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、コンピュータ装置を上記の状態推定を実行する状態推定装置として機能させることができる。
【産業上の利用可能性】
【0085】
本発明は、複数の状態変数を測定可能な場合の状態推定に好適である。また、本発明は推定対象の状態が時刻とともに変化するシステムの状態推定に好適である。
【符号の説明】
【0086】
1,2 状態推定装置、11 制御部、111 データベース作成部、112 学習部、113 説明変量取得部、114 推定部、12 記憶部、13 表示部、14 入力部、DB データベース、P 推定対象
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10