IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人広島大学の特許一覧

特許7414289状態推定装置、状態推定方法及びプログラム
<>
  • 特許-状態推定装置、状態推定方法及びプログラム 図1
  • 特許-状態推定装置、状態推定方法及びプログラム 図2
  • 特許-状態推定装置、状態推定方法及びプログラム 図3
  • 特許-状態推定装置、状態推定方法及びプログラム 図4
  • 特許-状態推定装置、状態推定方法及びプログラム 図5
  • 特許-状態推定装置、状態推定方法及びプログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-05
(45)【発行日】2024-01-16
(54)【発明の名称】状態推定装置、状態推定方法及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240109BHJP
【FI】
G06N20/00
【請求項の数】 3
(21)【出願番号】P 2021086752
(22)【出願日】2021-05-24
(65)【公開番号】P2022179932
(43)【公開日】2022-12-06
【審査請求日】2022-05-10
(73)【特許権者】
【識別番号】504136568
【氏名又は名称】国立大学法人広島大学
(74)【代理人】
【識別番号】100196380
【弁理士】
【氏名又は名称】森 匡輝
(72)【発明者】
【氏名】山本 透
(72)【発明者】
【氏名】加納 晴香
【審査官】青木 重徳
(56)【参考文献】
【文献】特開2006-155344(JP,A)
【文献】特開2008-102720(JP,A)
【文献】米国特許出願公開第2013/0179380(US,A1)
【文献】小山 貴広 ほか,データ指向型アプローチに基づく電力需要予測,電気学会研究会資料,日本,一般社団法人電気学会,2014年09月24日,CT-14-049,p.1-5
【文献】臼坂 高司 ほか,データ駆動型IMCアプローチに基づく個別学習における学習支援システムの構築に向けて,電気学会研究会資料,日本,一般社団法人電気学会,2014年11月23日,CT-14-073,p.31-35
【文献】加納 晴香 ほか,データベース駆動型ソフトセンサの一設計,第65回 システム制御情報学会 研究発表講演会講演論文集 [CD-ROM],日本,2021年05月26日,TS04-1-1,p.190-192
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットを格納するデータベースと、
前記データベースを学習させる学習部と、
前記学習部で学習された前記データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部と、を備え、
前記学習部は、学習前の初期データセットを、学習用データセットを用いて更新することにより学習させて推定用データベースを作成し、
前記推定用データベースの推定用データセットは、前記学習前の初期データセットの説明変量及び目的変量と、学習による目的変量の修正量とを含むデータセットであ
前記修正量は、前記学習用データセットの説明変量及び初期データセットを用いて推定された目的変量と、前記学習用データセットの目的変量との差に基づいて導出される目的変量の補正値であり、前記学習前の初期データセットに含まれる目的変量に対する差分として表される
状態推定装置。
【請求項2】
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットをデータベースに格納して初期データベースを作成する初期データベース作成ステップと、
前記初期データベースを、学習用データセットを用いて学習させて推定用データベースを作成する学習ステップと、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定ステップと、を含み、
前記推定用データベースに格納された推定用データセットは、前記学習前の初期データセットの説明変量及び目的変量と、学習による目的変量の修正量とを含むデータセットであ
前記修正量は、前記学習用データセットの説明変量及び初期データセットを用いて推定された目的変量と、前記学習用データセットの目的変量との差に基づいて導出される目的変量の補正値であり、前記学習前の初期データセットに含まれる目的変量に対する差分として表される
状態推定方法。
【請求項3】
コンピュータを、
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットを格納するデータベース、
前記データベースを、学習用データセットを用いて学習させて、学習前の初期データセットの説明変量及び目的変量と、学習による目的変量の修正量とを含み、前記修正量は、前記学習用データセットの説明変量及び初期データセットを用いて推定された目的変量と、前記学習用データセットの目的変量との差に基づいて導出される目的変量の補正値であり、前記学習前の初期データセットに含まれる目的変量に対する差分として表される、推定用データセットを格納する推定用データベースを作成する学習部、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部、
として動作させるプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、状態推定装置、状態推定方法及びプログラムに関する。
【背景技術】
【0002】
従来、対象の状態を表すパラメータとして実測された説明変量(入力変数)の値に基づいて、所定の目的変量(出力変数)の値を推定する状態推定方法が開発されている。このような状態推定方法は、ソフトセンサと呼ばれ、高温高圧環境となるプラント内の各種パラメータ、製品品質等、実測が難しいパラメータを、物理的なセンサ(ハードセンサ)によって実測された物理量(計測値)を用いて推定する方法として用いられている。
【0003】
状態推定方法としては、例えば特許文献1のように、ソフトセンサの入力値と、保存された複数のデータとに基づいて、出力値を推定する方法が開発されている。特許文献1のソフトセンサでは、保存されたデータを学習させることにより、ソフトセンサの精度を向上させることとしている。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第2002/006953号
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1のソフトセンサでは、所定の大きさのメッシュで量子化された入力空間に入力値と出力値との組み合わせ(データセット)である履歴データが振り分けられて事例ベースが作成される。出力値は、この事例ベースと、測定された現在の入力値とに基づいて、推定される。特許文献1の事例ベースでは、メッシュごとに、事例としてのデータセットの値が学習により修正され、事例ベースのデータセットが作成される。
【0006】
しかしながら、特許文献1のデータセットは、学習により上書き修正されたデータのみが保存されており、修正後に初期のデータセットの入力値、出力値に対する学習の状況を確認することは難しい。
【0007】
本発明は、上述の事情に鑑みてなされたものであり、精度よく目的変量の推定を行うことができるとともに、データベースの学習状況を分析可能な状態推定装置、状態推定方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、この発明の第1の観点に係る状態推定装置は、
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットを格納するデータベースと、
前記データベースを学習させる学習部と、
前記学習部で学習された前記データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部と、を備え、
前記学習部は、学習前の初期データセットを、学習用データセットを用いて更新することにより学習させて推定用データベースを作成し、
前記推定用データベースの推定用データセットは、前記学習前の初期データセットの説明変量及び目的変量と、学習による目的変量の修正量とを含むデータセットであり、
前記修正量は、前記学習用データセットの説明変量及び初期データセットを用いて推定された目的変量と、前記学習用データセットの目的変量との差に基づいて導出される目的変量の補正値であり、前記学習前の初期データセットに含まれる目的変量に対する差分として表される。
【0010】
この発明の第2の観点に係る状態推定方法は、
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットをデータベースに格納して初期データベースを作成する初期データベース作成ステップと、
前記初期データベースを、学習用データセットを用いて学習させて推定用データベースを作成する学習ステップと、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定ステップと、を含み、
前記推定用データベースに格納された推定用データセットは、前記学習前の初期データセットの説明変量及び目的変量と、学習による目的変量の修正量とを含むデータセットであり、
前記修正量は、前記学習用データセットの説明変量及び初期データセットを用いて推定された目的変量と、前記学習用データセットの目的変量との差に基づいて導出される目的変量の補正値であり、前記学習前の初期データセットに含まれる目的変量に対する差分として表される。
【0012】
この発明の第3の観点に係るプログラムは、
コンピュータを、
推定対象の状態を表す説明変量と目的変量とを含む複数のデータセットを格納するデータベース、
前記データベースを、学習用データセットを用いて学習させて、学習前の初期データセットの説明変量及び目的変量と、学習による目的変量の修正量とを含み、前記修正量は、前記学習用データセットの説明変量及び初期データセットを用いて推定された目的変量と、前記学習用データセットの目的変量との差に基づいて導出される目的変量の補正値であり、前記学習前の初期データセットに含まれる目的変量に対する差分として表される、推定用データセットを格納する推定用データベースを作成する学習部、
前記推定用データベースに基づいて、前記推定対象の測定値である前記説明変量に対応する前記目的変量を推定する推定部、
として動作させる。
【発明の効果】
【0013】
本発明の状態推定装置、状態推定方法及びプログラムによれば、目的変量の推定に用いるデータベースの推定用データセットを、初期データセットのデータと修正量とを含むデータセットとしているので、学習されたデータベースを用いて高い精度で目的変量の推定を行うことができるとともに、初期データセットからの修正量を容易に確認できるので、学習状況を容易に分析することが可能である。
【図面の簡単な説明】
【0014】
図1】本発明の実施の形態に係る状態推定装置の機能ブロック図である。
図2】実施の形態に係る状態推定処理の流れを示すフローチャートである。
図3】数値例に係る状態推定装置及び推定対象を示すブロック線図である。
図4】数値例の推定対象の特性に係るパラメータの設定例である。
図5】数値例の推定対象の状態に係るパラメータの時間変化を示すグラフである。
図6】数値例に係る推定結果の例を示すグラフであり、(A)は目的変量の時間変化を示すグラフ、(B)は修正量の時間変化を示すグラフである。
【発明を実施するための形態】
【0015】
以下、図を参照しつつ、本発明の実施の形態に係る状態推定装置及び状態推定方法について説明する。
【0016】
本実施の形態に係る状態推定装置1は、推定対象Pの測定値である説明変量x(入力変数)の値を取得し、取得した説明変量xの値と、予め記憶部12に記憶されているデータベースDBとを用いて目的変量y(出力変数)を推定するソフトセンサである。
【0017】
状態推定装置1は、図1のブロック図に示すように、制御部11、記憶部12、表示部13、入力部14を備える。
【0018】
制御部11は、CPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)、水晶発振器等から構成されており、状態推定装置1の動作を制御する。また、制御部11は、推定対象Pの現在の状態を表すパラメータ(説明変量x)の値を取得し、取得した説明変量xの値と、予め記憶部12に記憶されているデータベースDBとに基づいて、目的変量yを推定する。
【0019】
制御部11は、制御部11のROM、記憶部12等に記憶されている各種動作プログラム及びデータをRAMに読み込んでCPUを動作させることにより、図1に示す制御部11の各機能を実現させる。これにより、制御部11は、説明変量取得部111、学習部112、推定部113として動作する。
【0020】
説明変量取得部111は、推定対象Pの状態を表すものとして測定されたパラメータを説明変量xとして取得する。説明変量xは、例えば、化学プラントである推定対象Pにおいて、物理的なセンサ(ハードセンサ)を用いて比較的容易に計測可能な材料の温度、重量、装置内の圧力等の物理量である。
【0021】
学習部112は、データベースDBに記憶されている初期データセットφ~(j)を、学習用データセットφ(t)(教師データ)を用いて学習させ、推定用データセットφ(j)を生成する。各データセットは、説明変量x、目的変量y等を含むものであり、各データセットの詳細については後述する。初期データセットφ~(j)及び学習用データセットφ(t)は、推定対象Pを動作させた際の実測データとして予め取得された、互いに異なるデータである。
【0022】
推定部113は、学習部112によって学習され、記憶部12のデータベースDBに格納されている推定用データセットφ(j)と、説明変量取得部111で取得された推定対象Pの説明変量x等に基づいて、目的変量yの推定値y^を算出する。
【0023】
記憶部12は、ハードディスク、フラッシュメモリ等の不揮発性メモリであり、推定部113で推定された目的変量y^、説明変量xから目的変量yを推定するためのプログラム等を記憶する。また、記憶部12は、目的変量yを推定するための複数の推定用データセットφ(j)を格納するデータベースDBを備える。本実施の形態に係る初期データセットφ~(j)は、推定対象Pの状態を表す説明変量x、目的変量yを含む。また、推定用データセットφ(j)は、説明変量x、目的変量yを含む初期データセットφ~(j)に修正量cを加えたものである。
【0024】
表示部13は、推定対象Pの現在の状態を示す説明変量x、推定された目的変量y^等の情報を表示する表示デバイスであり、例えば、液晶モニタである。
【0025】
入力部14は、推定用データセットφ(j)の学習条件の設定、目的変量yの推定の開始、終了指示、初期データセットφ~(j)の学習に用いられる学習用データセットφ(t)等を入力するキーボード、マウス、タッチパネル等の入力デバイスである。
【0026】
続いて、状態推定装置1を用いた推定対象Pの状態推定方法について、図2のフローチャートを参照しつつ、具体的に説明する。本実施の形態に係る状態推定処理では、まず、状態推定を行うためのデータベースDBを作成し、データベースDBの学習を行う。そして、学習されたデータベースDBを用いて、目的変量yを推定する。
【0027】
図2に示すように、初期データベース作成ステップとして、状態推定装置1は、推定対象Pの操業データとして予め測定された初期データセットφ~(j)(ただし、jは1~Nの自然数であり、Nは2以上である。)を取得する(ステップS11)。初期データセットφ~(j)は、以下の式に示すように、推定対象Pにおいて比較的容易に測定可能なデータである説明変量x~(j)と、比較的測定が困難な目的変量y~(j)とを含む。状態推定装置1は、初期データセットφ~(j)を格納したデータベースDB(以下、初期データベースDBともいう。)を作成し、記憶部12に記憶させる(ステップS12)。
【数1】
【0028】
また、上式に示すように、初期データセットφ~(j)は、後述する学習によって目的変量yの推定値を修正するためのパラメータである修正量c~(j)を含む。ただし、学習前である初期データセットφ~(j)中の修正量c~(j)は、c~(j)=0と設定されている。初期データセットφ~(j)は、予め記憶部12に格納されていてもよいし、状態推定装置1とネットワークを介して接続されたサーバ等の外部記憶装置に格納されていてもよい。
【0029】
続いて、学習ステップとして、学習部112は、以下の式に示す学習用データセットφ(t)(ただし、tは1~Mの自然数である。)を用いて初期データベースDBを学習させる。
【数2】
【0030】
学習用データセットφ(t)は、初期データセットφ~(j)と同様に、予め測定されたデータであり、初期データセットφ~(j)とは異なるデータである。また、学習用データセットφ(t)は、初期データベースDBの学習に用いられるデータセットであるので、上式に示すように、修正量cは含まない。学習用データセットφ(t)は、初期データセットφ~(j)と同様に、記憶部12、状態推定装置1と接続された外部記憶装置等に予め格納されている。
【0031】
学習ステップでは、学習部112は、学習用データセットφ(t)(要求点)を選択する(ステップS13)。学習部112は、選択された学習用データセットφ(t)と、初期データベースDBに格納されている初期データセットφ~(j)との距離d(φ(t),φ~(j))を以下の式に示す重み付きLノルムによって算出する(ステップS14)。
【0032】
【数3】
ただし、j=1,2,・・・,Nであり、Nは初期データベースDBに格納されている初期データセットφ~(j)のデータ数である。また、x~(j)は第j番目の初期データセットφ~(j)の説明変量x~(j)の第l番目の要素である。また、x (j)は学習用データセットφ(t)の説明変量x(t)の第l番目の要素である。また、maxx~(j)は、データベースDBに格納されている全ての初期データセットφ~(j)の説明変量x~(j)の第l番目の要素の中で最も大きな値であり、minx~(j)は、データベースDBに格納されている全ての初期データセットφ~(j)の説明変量x~(j)の第l番目の要素の中で最も小さな値である。
【0033】
上記式(3)に示すように、距離d(φ(t),φ~(j))は、選択された学習用データセットφ(t)の説明変量x(t)と、初期データセットφ~(j)の説明変量x~(j)との要素ごとの差を評価して算出される。これにより、特定の要素に過度に影響されることなく、選択された学習用データセットφ(t)の説明変量x(t)と、初期データセットφ~(j)の説明変量x~(j)との類似度を適切に評価することができる。
【0034】
学習部112は、ステップS14で算出された距離dが小さいものからk個の初期データセットφ~(j)を近傍データとして選択する(ステップS15)。近傍データとして選択されるデータの個数(k)は、特に限定されず、初期データセットφ~(j)の個数、演算にかかる負荷等に基づいて選択すればよい。
【0035】
学習部112は、ステップS15で選択された近傍データを用いて、目的変量yの推定値(推定目的変量)y^(t)を算出する(ステップS16)。推定目的変量y^は、以下の式(4)に示す重み付き局所線形平均法(Linearly Weighted Average:LWA)を用いて算出される。
【数4】
【0036】
ここで、ωは近傍データとして選択された第i番目の初期データセットφ~(j)に含まれる目的変量y~(i)に対する重みであり、以下の式(5)を満足するものとし、式(6)で与えられる。
【数5】
【0037】
式(6)に示すように、距離dが小さい初期データセットφ~(j)、すなわち要求点により類似している初期データセットφ~(j)ほど、その初期データセットφ~(j)に係る重みは大きくなる。したがって、距離dが小さい初期データセットφ~(j)ほど、推定目的変量y^への影響は大きくなる。
【0038】
学習部112は、式(4)に示すように、近傍データの目的変量y~(i)にその修正量c~(i)を足し合わせたものを、式(5)、(6)で算出された重みωと掛け合わせて、近傍データ全てについて算出された値を足し合わせる。これにより、学習部212は、近傍データとの距離に対応した推定目的変量y^(t)を算出することができる。なお、学習開始時においては、修正量c~(i)は0であり、以下のデータ修正によって順次更新される。
【0039】
学習部112は、式(4)で推定された推定値y^と、学習用データセットφ(t)に含まれる実測値である目的変量y(t)との誤差に基づいて、修正量c~を更新する(ステップS17)。具体的には、学習部112は、以下の式(7)に示す最急降下法を用いて修正量c~を更新する。
【数6】
【0040】
ここで、c~(i)はステップS15で選択された近傍データの修正量である。また、ηは学習係数、J(t)は、以下の式(8)、(9)で定義される評価規範である。
【数7】
【0041】
式(7)に示すように、学習部112は、実測された目的変量yと推定された目的変量y^との誤差を最小化する修正量c~newを算出して、データベースDBに格納されている近傍データの修正量c~(j)を更新する。これにより、初期データセットφ~(j)は逐次更新される。上記の式(7)~(9)に示すように、修正量cは、推定された目的変量y^と実測された目的変量yとの差に基づいて導出される目的変量の補正値である。
【0042】
修正量c~(j)の更新の後、学習部112は、ステップS13へ戻り、次の学習用データセットφ(t)を用いて、推定用データセットφ(j)の学習を行う。ステップS13~S17の学習は、上記の評価規範J(t)が十分に小さくなるまで、すなわち予め設定された閾値Th以下となるまで繰り返される(ステップS18のNO)。
【0043】
評価規範J(t)が十分に小さく、すなわち予め設定された閾値Th以下になると、学習部112は、学習を終了する(ステップS18のYES)。これにより、学習部112は、学習が終了した初期データセットφ~(j)を、より適切な推定が可能なデータセットである推定用データセットφ(j)としてデータベースDBに格納し、推定用のデータベースDB(以下、推定用データベースDBpともいう。)とする。
【0044】
上述のように、本実施の形態に係る推定用データセットφ(j)では、学習によって初期データセットφ~(j)の説明変量x~(j)及び目的変量y~(j)を変更せず、独立して設けられた修正量c~を更新して学習することとしている。これにより、学習後の推定用データセットφ(j)は、初期データセットφ~(j)の説明変量x~(j)、目的変量y~(j)を保持するので、学習によって更新されたパラメータを容易に確認することが可能となる。
【0045】
続いて、状態推定ステップとして、状態推定装置1は、学習された推定用データベースDBpを用いて、推定対象Pの状態推定を行う。状態推定が開始されると、状態推定装置1の推定部113は、推定対象Pの説明変量x(要求点)を取得する(ステップS19)。
【0046】
推定部113は、取得した説明変量xと推定用データセットφ(j)との距離dを算出し、取得した説明変量xの近傍データを選択する(ステップS20)。距離dの算出方法及び近傍データの選択方法は、学習ステップにおけるステップS14、S15と同様である。すなわち、推定部113は、取得した説明変量xと、推定用データセットφ(j)の説明変量xとの距離dを式(3)と同様の重み付きLノルムによって算出する。そして推定部113は、算出された距離dの小さいものから、予め定められた所定の個数の推定用データセットφ(j)を近傍データとして選択する。
【0047】
推定部113は、ステップS20で選択された近傍データに基づいて、目的変量yを推定する(ステップS21)。目的変量yの推定方法は、学習ステップにおけるステップS16の目的変量yの推定方法と同様である。すなわち、推定部113は、ステップS20で選択された近傍データである推定用データセットφ(j)に、式(4)~(6)と同様の重み付き局所線形平均法を適用して、推定目的変量y^を算出する。
【0048】
状態推定装置1は、状態推定処理が終了するまで(ステップS22のNO)、ステップS19~S21の状態推定処理を繰り返す。そして、入力部14への終了指示の入力、所定の推定処理時間の終了等の終了条件を充足すると(ステップS22のYES)、状態推定装置1は状態推定処理を終了する。
【0049】
以上説明したように、本実施の形態に係る状態推定装置及び状態推定方法によれば、
目的変量yの推定に用いるデータベースDBの推定用データセットφ(j)を、初期データセットφ~(j)と修正量c(j)とを含むデータとして構成し、データベースDBを学習させている。したがって、学習されたデータベースDBを用いて高い精度で目的変量yの推定を行うことができるとともに、初期データセットφ~(j)からの修正量c(j)を確認できるので修正状況を容易に把握することが可能である。これにより、修正量cの変化、初期データセットφ~(j)及び近傍データ数の妥当性等の分析を容易に行うことができる。
【0050】
(数値例)
以下、本実施の形態に係る状態推定の数値例について説明する。図3は、本例に係る推定対象P、状態推定装置1を表すブロック線図である。推定対象Pは、図3に破線で示す部分であり、制御器C、制御対象P、Pを含む。推定対象Pは、例えば化学プラントのようなプロセス系のフィードバック制御システムであり、推定対象の状態を表すものとして比較的容易に測定可能なパラメータである説明変量xを出力するPと、比較的測定が難しいパラメータである目的変量yを出力するPとを含む。
【0051】
本例では、説明を簡単にするため、制御対象P、Pは以下に示す伝達関数で表されるものとする。
【数8】
ただし、T=20,K=2,L=4とする。
【0052】
上記の推定対象Pについて、図4に示すように、Tを区間[5,10]の一様乱数、Kを区間[0.5,1]の一様乱数、Lを区間[0.5,1]の一様乱数として設定して時系列のデータセットΦ=[x,y]を生成した。本例では、生成された21個のデータセットΦの1/3である7個ずつを、初期データセットφ~(j)、学習用データセットφ(t)、検証に用いる要求点としての検証用データセットφ~(j)として用いた。
【0053】
上記のデータセットΦは、Φ=[x,y]=[w(t),w(t-1),v(t),v(t-1),u(t-1),u(t-2),y(t-N),y(t-2N)]と設定されている。ここで、Nはデータ取得間隔であり、本例ではNs=5としている。これは、w,v,u等の説明変量xに係るパラメータが時刻ステップtごとに測定可能であるのに対し、目的変量yは遅れて測定される状態を想定したものである。また、目標値w(t)は、w(t)=1と設定している。
【0054】
また、制御器Cは比例・微分先行型PID制御則を用いる制御器(I-PD制御器)であり、以下の伝達関数で表されることとする。
【数9】
ここで、E(s)は偏差を表し、E(s)=W(s)-Y(s)である。
【0055】
図5は、上記の制御システムについて、乱数の値をシステムパラメータ(T,K,L)に与えた場合の、説明変量xの各パラメータ(u,y,v)の時間変化を示すグラフである。図5のvの変化を表すグラフに示すように、生成した各データを初期データセットφ~(j)、学習用データセットφ(t)、検証用データセットφ~(j)に振り分ける。
【0056】
上記の条件で、初期データセットφ~(j)を、学習用データセットφ(t)を用いて学習させることにより、推定用データセットφ(j)を生成し、推定用データベースDBpを作成する。そして、作成された推定用データベースDBpと、検証用データセットφ~(j)とを用いて検証を行った。具体的には、検証用データセットφ~(j)の説明変量xを用いて、推定用データセットφ(j)と検証用データセットφ~(j)との距離dを算出して近傍データを選択する。そして、選択された近傍データに重み付き局所線形平均法を適用して、推定目的変量y^を算出した。
【0057】
図6(A)は、検証用データセットφ~(j)の1つについて、学習無しの初期データセットφ~(j)を用いて目的変量yを推定した推定値y^と、学習後の推定用データセットφ(j)を用いて目的変量yを推定した推定値y^と、選択された検証用データセットφ~(j)の目的変量yとを示したグラフである。図6(A)のグラフに示すように、学習された推定用データベースDBpを用いることにより、初期データセットφ~(j)を用いて推定する場合と比較して、より精度よく目的変量yを推定できていることがわかる。
【0058】
より詳細には、7個の時系列の検証用データセットφ~(j)における以下の式(14)に示す誤差率の平均値は、学習ありの場合で16.52%であり、学習なしの場合で69.11%であった。
【数10】
ただし、Mは時系列データサンプル数であり、上記の例ではM=100としている。
【0059】
また、図6(B)に示すように、修正量cを説明変量x、目的変量yから独立した変数として推定用データセットφ(j)のパラメータとしているので、状態推定に用いるデータベースDBの学習状況を容易に分析することができる。
【0060】
上記の実施の形態では、状態推定処理を行う前にデータベースDBの学習を終了することとしたが、これに限られない。例えば、状態推定処理中に推定対象Pから取得されたデータを学習用データセットφとして、データベースDBを随時学習させることとしてもよい。この場合、状態推定装置1の制御部11は、動作中の推定対象Pのセンサから取得した説明変量x、目的変量yを学習用データセットφとして、推定用データベースDBpの学習を行うこととすればよい。データ取得のタイミングは、例えば、目的変量yが取得されるタイミングとすればよい。これにより、推定対象Pの状態変化に対応した、より精度の高い状態推定を行うことが可能となる。
【0061】
また、上記実施の形態に係る状態推定方法は、通常のコンピュータシステムを用いて実現可能である。例えば、上記実施の形態に係る状態推定を実行するためのコンピュータプログラムを、インターネット等のネットワークを介して配布し、当該コンピュータプログラムをコンピュータにインストールすることにより、コンピュータ装置を上記の状態推定を実行する状態推定装置1として機能させることができる。
【産業上の利用可能性】
【0062】
本発明は、推定対象の状態が時刻とともに変化するシステムの状態推定に好適である。
【符号の説明】
【0063】
1 状態推定装置、11 制御部、111 説明変量取得部、112 学習部、113 推定部、12 記憶部、13 表示部、14 入力部、P 推定対象
図1
図2
図3
図4
図5
図6