IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立造船株式会社の特許一覧

特開2024-7873情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム
<>
  • 特開-情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム 図1
  • 特開-情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム 図2
  • 特開-情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム 図3
  • 特開-情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム 図4
  • 特開-情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム 図5
  • 特開-情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024007873
(43)【公開日】2024-01-19
(54)【発明の名称】情報処理装置、推論モデルの生成方法、教師データの生成方法、推論モデル生成プログラム、および教師データ生成プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240112BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022109243
(22)【出願日】2022-07-06
(71)【出願人】
【識別番号】000005119
【氏名又は名称】日立造船株式会社
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】林 翔太
(72)【発明者】
【氏名】白石 裕司
(57)【要約】
【課題】汎用性の高い推論モデルの生成を可能にする。
【解決手段】情報処理装置(2)は、複数の施設のそれぞれで収集されたデータに基づく複数の時系列データを連結して擬似的時系列データを生成するデータ連結部(204)と、前記擬似的時系列データに対して標準化処理を施して教師データとする教師データ生成部(205)と、前記教師データを用いた機械学習により推論モデルを生成する学習部(206)と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部と、
前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部と、
前記教師データを用いた機械学習により推論モデルを生成する学習部と、を備える情報処理装置。
【請求項2】
前記データ連結部は、複数の前記時系列データに一連の順序を示す順序情報を付与することにより複数の前記時系列データを連結する、請求項1に記載の情報処理装置。
【請求項3】
前記データ連結部は、複数の前記時系列データにおける連結部分の数値の不連続性を軽減する処理を実施した上で連結を行う、請求項1または2に記載の情報処理装置。
【請求項4】
前記対象について測定された測定値と当該測定値に対応する設定値とから、当該測定値と当該設定値との差または比を要素とする前記時系列データを、複数の前記対象のそれぞれについて生成する時系列データ生成部を備える、請求項1または2に記載の情報処理装置。
【請求項5】
複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部と、
前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部と、を備える情報処理装置。
【請求項6】
1または複数の情報処理装置が実行する推論モデルの生成方法であって、
複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップと、
前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップと、
前記教師データを用いた機械学習により推論モデルを生成する学習ステップと、を含む推論モデルの生成方法。
【請求項7】
1または複数の情報処理装置が実行する教師データの生成方法であって、
複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップと、
前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップと、を含む教師データの生成方法。
【請求項8】
請求項1に記載の情報処理装置としてコンピュータを機能させるための推論モデル生成プログラムであって、前記データ連結部、前記教師データ生成部、および前記学習部としてコンピュータを機能させるための推論モデル生成プログラム。
【請求項9】
請求項5に記載の情報処理装置としてコンピュータを機能させるための教師データ生成プログラムであって、前記データ連結部および前記教師データ生成部としてコンピュータを機能させるための教師データ生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推論モデルを生成する情報処理装置等に関する。
【背景技術】
【0002】
機械学習により推論モデルを生成する技術が従来から知られている。例えば、下記の特許文献1には、プラントで取得された複数のプラントデータから当該プラントで発生した事象の種別を推論するニューラルネットワークモデルが開示されている。なお、上記「複数のプラントデータ」とは、1つのプラントで収集された時系列のデータである。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第3002524号
【発明の概要】
【発明が解決しようとする課題】
【0004】
上述のような従来技術には推論モデルの汎用性という点で改善の余地がある。すなわち、特許文献1の技術では、対象となるプラントにおいて収集されたプラントデータを用いて機械学習を行う。このような学習により生成された推論モデルでは、そのプラントにおいて収集されたプラントデータから当該プラントで発生した事象の種別を高精度に推論することが可能である。しかし、当該推論モデルでは、他のプラントで収集されたプラントデータから当該他のプラントで発生した事象の種別を推論することはできないか、あるいは推論できたとしてもその精度は低いものとなってしまう。
【0005】
本発明の一態様は、汎用性の高い推論モデルの生成を可能にする情報処理装置等を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本発明の一態様に係る情報処理装置は、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部と、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部と、前記教師データを用いた機械学習により推論モデルを生成する学習部と、を備える。
【0007】
また、本発明の一態様に係る他の情報処理装置は、上記の課題を解決するために、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部と、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部と、を備える。
【0008】
また、本発明の一態様に係る推論モデルの生成方法は、上記の課題を解決するために、1または複数の情報処理装置が実行する推論モデルの生成方法であって、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップと、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップと、前記教師データを用いた機械学習により推論モデルを生成する学習ステップと、を含む。
【0009】
また、本発明の一態様に係る教師データの生成方法は、上記の課題を解決するために、1または複数の情報処理装置が実行する教師データの生成方法であって、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップと、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップと、を含む。
【発明の効果】
【0010】
本発明の一態様によれば、汎用性の高い推論モデルを生成することが可能になる。
【図面の簡単な説明】
【0011】
図1】本発明の一実施形態に係る情報処理装置の要部構成の一例を示すブロック図である。
図2】上記情報処理装置を含む情報処理システムの構成を示す図である。
図3】連結対象の決定例を示す図である。
図4】時系列データの生成例を示す図である。
図5】擬似的時系列データおよび教師データの生成例を示す図である。
図6】上記情報処理装置が推論モデルを生成する際の処理の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
(システム構成)
図2は、本実施形態に係る情報処理システム5の構成を示す図である。図示のように、情報処理システム5には、情報処理装置1A~1Dと情報処理装置2とが含まれている。詳細は以下説明するが、情報処理システム5によれば、出所が異なる複数の時系列データを利用して推論モデルを生成することができる。そして、情報処理システム5によって生成される推論モデルは、単一の出所の時系列データを教師データとして生成された推論モデルと比べて汎用性の高い推論モデルとなる。
【0013】
情報処理装置1A~1Dは、上述の推論モデルを生成するための教師データの元になる時系列データを収集する装置であり、施設A~Dにそれぞれ配置されている。以下では、情報処理装置1A~1Dのそれぞれを区別する必要がないときには、単に「情報処理装置1」と表記する。
【0014】
施設A~Dは、少なくとも1つの機器を備えたものであればよい。例えば、施設A~Dは、複数の機器を備えたプラントであってもよい。ここで「プラント」とは、産業的に使用される設備であり、複数の機器を備えており、それらの機器により製品の生産あるいは対象物の処理といった所定の処理を行うものである。
【0015】
以下では、施設A~Dが、廃棄物(例えば可燃ごみ)を焼却し、その排熱を利用して発電を行う廃棄物処理施設である例を説明する。この場合、情報処理装置1Aは、施設Aにおける廃棄物の焼却や発電に関する時系列データを収集する。同様に、情報処理装置1B~1Dは、施設B~Dにおける廃棄物の焼却や発電に関する時系列データを収集する。
【0016】
時系列データは、推論モデルを生成するための教師データの元になるものであればよく、推論内容等に応じたものとすればよい。例えば、焼却炉の燃焼状態を予測する推論モデルを生成する場合、焼却炉の燃焼状態に関連する各種の時系列データを収集すればよい。具体例を挙げれば、炉内温度の時系列の測定値や、ボイラにおける発生蒸気量の時系列の測定値といった、自動燃焼制御(ACC:Automatic Combustion Control)に関わる時系列のセンシングデータを時系列データとして収集してもよい。
【0017】
情報処理装置2は、情報処理装置1A~1Dにより収集される時系列データを連結して1つの時系列データを生成する。そして、情報処理装置2は、連結した時系列データに対して標準化処理または正規化処理を施して教師データとすると共に、当該教師データを用いた機械学習により推論モデルを生成する。
【0018】
このようにして生成された推論モデルは、単一の出所の時系列データを教師データとする場合と比べて汎用性の高いものとなる。例えば、施設A~Dを出所とする各時系列データから生成された教師データを用いて生成された推論モデルは、施設A~Dの何れにおける推論にも利用できる上、同種の施設であれば施設A~D以外の施設における推論にも利用できる。このように、情報処理装置2による推論モデルの生成においては、推論の対象となる施設で収集されたデータを必ずしも必要としないため、例えば新規施設が建設された場合に、その稼働開始直後から当該推論モデルを使用することも可能である。また、必ずしも情報処理装置1A~1Dの全てが教師データの元になる時系列データを収集する必要もない。例えば、施設A~Cからは教師データの元になる時系列データを収集する一方、施設Dからは教師データの元になる時系列データを収集せずに推論モデルを生成することもできる。そして、この推論モデルは、施設Dにおける推論にも利用可能である。
【0019】
また、一般に、十分な推定精度の推定モデルを生成するためには、十分な数の教師データが必要となり、各施設におけるデータの収集期間も長期化しがちである。この点、情報処理システム5では複数の施設で収集された時系列データから教師データを生成するので、短期間で必要な数の教師データを揃えて速やかに推論モデルを生成することができる。
【0020】
なお、連結する時系列データは、それぞれ異なる複数の施設で収集されたものに限られない。例えば、情報処理装置2は、1つの施設における異なる複数の設備あるいは機器について収集された時系列データを連結することもできる。例えば、上述の施設Aが2基の焼却炉を備える場合、情報処理装置2は、各焼却炉で収集された時系列データを連結し、それら2基の焼却炉の何れにおける推論にも利用可能な推論モデルを生成することができる。このため、以下の説明における「施設」は、任意の「対象」に読み替えることができる。
【0021】
また、時系列データの収集の方法も任意である。例えば、任意の対象自体に設置したセンサで測定した測定値を時系列データとして収集してもよいし、任意の対象の周囲に設置したセンサで測定した測定値や、気温、湿度等のより広い範囲を対象として計測されたデータを時系列データとして収集してもよい。この他にも、例えば、任意の対象の動作設定のための設定値や、任意の対象に所定の動作を実行させる際の指令値等を時系列データとして収集してもよい。
【0022】
(装置構成)
図1に基づいて情報処理装置1および2の構成を説明する。図1は、情報処理装置1および2の要部構成の一例を示すブロック図である。図示のように、情報処理装置1は、情報処理装置1の各部を統括して制御する制御部10と、情報処理装置1が使用する各種データを記憶する記憶部11を備えている。また、情報処理装置1は、情報処理装置1が他の装置と通信するための通信部12、情報処理装置1に対する各種データの入力を受け付ける入力部13、および情報処理装置1が各種データを出力するための出力部14を備えている。また、制御部10には、データ取得部101、前処理部102、推論部103、および制御量決定部104が含まれている。
【0023】
データ取得部101は、推論モデルを生成するための教師データの元になる時系列データを取得する。時系列データは、施設に配置されたセンサ等から通信部12または入力部13を介して取得されてもよいし、情報処理装置1のユーザが入力部13を介して入力してもよい。そして、データ取得部101は、取得したデータを、通信部12経由で情報処理装置2に送信する。
【0024】
また、データ取得部101は、情報処理装置2に送信した上記のデータを用いて生成された推論モデルを取得する。推論モデルは、通信部12を介した通信により情報処理装置2から取得されてもよいし、情報処理装置1のユーザにより入力部13を介して入力されてもよい。
【0025】
さらに、データ取得部101は、取得した推論モデルを用いて推論を行う際に、推論用のデータを取得する。以下では当該データを推論用データと呼ぶ。推論用データは、推論の対象となる施設に配置されたセンサ等から通信部12または入力部13を介して入力されてもよいし、情報処理装置1のユーザにより入力部13を介して入力されてもよい。
【0026】
前処理部102は、データ取得部101が取得する推論用データに前処理を施し、上記の推論モデルに入力する入力データを生成する。詳細は後述するが、上記の前処理は、情報処理装置2で推論モデルの教師データの生成時と同じ条件を適用して推論用データを標準化処理または正規化処理する処理である。
【0027】
推論部103は、情報処理装置2により生成される推論モデルを用いて推論を行う。より詳細には、推論部103は、前処理部102が生成する入力データを上記推論モデルに入力することにより得られる出力値をそのまま推論結果とするか、または当該出力値に基づいて推論結果を得る。
【0028】
推論モデルの推論対象は特に限定されず、例えば図2に示した施設A~Dが備える焼却炉における燃焼状態を予測するものとしてもよい。施設A~Dにおいて効率的に発電するためには、発電用のタービンを回すための蒸気量を安定させる必要があるが、焼却する廃棄物の質や量などの変動に伴って焼却炉内の燃焼状態が変化し、これに伴って蒸気量も変化する。情報処理装置1A~1Dは、燃焼状態を予測する推論モデルを用いることにより、施設A~Dが備える焼却炉における燃焼状態を予測し、その予測結果に応じて施設A~D内の機器を適切に制御して、廃棄物の焼却と発電とを安定的に行うことが可能になる。
【0029】
制御量決定部104は、推論部103の推論結果に基づいて、対象となる施設に設けられた機器に対する制御量を決定する。制御量の決定方法はどのような推論モデルを用いて推論が行われたかによって異なる。例えば、焼却炉のボイラから発生する蒸気量を予測する推論モデルを用いた推論により、発生蒸気量が減少するとの推論結果が得られたとする。この場合、制御量決定部104は、ボイラからの発生蒸気量に影響を与える機器(例えば焼却炉内に供給する空気の量や火格子の動作速度)の制御量を決定してもよい。無論、この場合、発生蒸気量が増えるように制御量が決定される。例えば、焼却炉内に供給する空気の量を増やす、あるいは火格子の動作速度を上げる制御が行われるように制御量が決定される。
【0030】
一方、情報処理装置2は、情報処理装置2の各部を統括して制御する制御部20と、情報処理装置2が使用する各種データを記憶する記憶部21を備えている。また、情報処理装置2は、情報処理装置2が他の装置と通信するための通信部22、情報処理装置2に対する各種データの入力を受け付ける入力部23、および情報処理装置2が各種データを出力するための出力部24を備えている。また、制御部20には、データ取得部201、連結対象決定部202、時系列データ生成部203、データ連結部204、教師データ生成部205、および学習部206が含まれている。
【0031】
データ取得部201は、教師データの元になるデータを取得する。データ取得部201が取得するデータには、生成する推定モデルの説明変数となるデータまたは説明変数の元になるデータが含まれていればよい。例えば、施設A~Dのそれぞれで収集された時系列のセンシングデータを説明変数とする推定モデルを生成する場合、データ取得部201は、通信部22を介して図2に示される情報処理装置1A~1Dと通信して当該センシングデータを取得してもよい。
【0032】
連結対象決定部202は、データ取得部201が取得するデータの中からデータ連結部204による連結の対象とするものを決定する。連結対象決定部202は、必須の構成ではない。ただし、連結対象決定部202を備えていることにより、データ取得部201が取得するデータの中に連結に適さないものが含まれている場合や、連結できない組み合わせがある場合でも妥当な教師データを生成することが可能になるという利点がある。
【0033】
時系列データ生成部203は、データ連結部204による連結に用いられる時系列データを生成する。より詳細には、時系列データ生成部203は、施設で測定された測定値と当該測定値に対応する設定値とから、当該測定値と当該設定値との差または比を要素とする時系列データを生成する。測定値と設定値との差または比は、生成される推論モデルにおける説明変数である。
【0034】
時系列データ生成部203も必須の構成ではない。ただし、時系列データ生成部203を備えていることにより、施設が異なることを原因として発生するデータのばらつきを減少させることができると共に、複数の施設のそれぞれで収集されたデータを連結することが、時系列性による数値の変動に与えるバイアスを減少させることができるという利点がある。
【0035】
データ連結部204は、複数の施設のそれぞれで収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成する。擬似的時系列データの生成方法については後記「擬似的時系列データおよび教師データの生成例」の項目で説明する。
【0036】
教師データ生成部205は、データ連結部204により生成された擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする。教師データの生成方法についても後記「擬似的時系列データおよび教師データの生成例」の項目で説明する。
【0037】
学習部206は、教師データ生成部205が生成する教師データを用いた機械学習により推論モデルを生成する。機械学習のアルゴリズムは特に限定されず、例えば学習部206は、サポートベクターマシン、線形回帰、ランダムフォレスト、またはニューラルネットワークにより推論モデルを生成してもよい。
【0038】
以上のように、情報処理装置2は、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部204と、データ連結部204が生成する擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部205と、を備えている。
【0039】
上記の構成によれば、汎用性の高い推論モデルを生成することが可能な教師データを生成することができる。よって、上記の構成によれば、汎用性の高い推論モデルを提供することが可能になる。
【0040】
また、以上のように、情報処理装置2は、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部204と、データ連結部204が生成する擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部205と、教師データ生成部205が生成する教師データを用いた機械学習により推論モデルを生成する学習部206と、を備えている。
【0041】
上記の構成によれば、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを利用して推論モデルを生成することができる。また、上記の構成によれば、データの収集の対象となった施設のみならず、他の施設における推論にも利用可能な汎用性の高い推論モデルを生成することができる。
【0042】
(連結対象の決定例)
図3は、連結対象の決定例を示す図である。図3の例では、施設Aにおいて、蒸気量センサデータ111Aおよび温度センサデータ112A等が収集されている。これらのデータの収集は、例えば図2に示した情報処理装置1A(より詳細には情報処理装置1Aのデータ取得部101)により行われる。同様に、施設Bでは蒸気量センサデータ111Bおよび温度センサデータ112B等が収集され、施設Cでは蒸気量センサデータ111Cおよび温度センサデータ112C等が収集されている。これらのデータの収集は、例えば図2に示した情報処理装置1Bおよび1Cにより行われる。そして、情報処理装置2のデータ取得部201が、情報処理装置1A~1Cにより収集される上記の各データを取得する。
【0043】
連結対象決定部202は、このようにして取得されたデータの中からデータ連結部204による連結の対象とするものを決定する。例えば、連結対象決定部202は、予め設定されたルールに従って連結の対象とするデータを決定し、関連性のないデータは連結の対象としないようにしてもよい。
【0044】
例えば、同一の種類のセンサで測定されたデータを連結の対象とするというルールを設定しておいてもよい。この場合、連結対象決定部202は、図3に示すように、蒸気量センサで測定された測定値を含む蒸気量センサデータ111A~111Cを連結の対象と決定すると共に、温度センサで測定された測定値を含む温度センサデータ112A~112Cを連結の対象と決定する。なお、連結対象決定部202は、連結の対象であることを決定したデータに対し、共通の符号や識別情報を付与してもよい。
【0045】
また、例えば、連結対象決定部202は、上記のルールに加えて、あるいは上記のルールの代わりに、施設において同様の位置に設置されているセンサで測定されたデータは連結する、というルールに従って連結の対象とするデータを決定してもよい。例えば、図3における温度センサデータ112Aと112Cが何れも焼却炉の過熱器付近に設置された温度センサで測定されたものである一方、温度センサデータ112Bは他の位置に設置された温度センサで測定されたものであるとする。この場合、連結対象決定部202は、同様の位置に設置されている温度センサで測定された温度センサデータ112Aと112Cを連結の対象と決定し、温度センサデータ112Bは連結の対象としない。
【0046】
(時系列データの生成例)
図4は、時系列データの生成例を示す図である。より詳細には、図4には、図3に示した蒸気量センサデータ111A~111Cのそれぞれから、教師データの生成に用いられる時系列データを生成した例を示している。
【0047】
図4に示すように、蒸気量センサデータ111A~111Cには、時刻ごとの測定値(PV:Process Variable)が含まれている。また、図4に示す蒸気量センサデータ111A~111Cには、各測定値に対応する設定値も含まれている。設定値(SV:Set Variable)は、当該設定値に対応付けられた時刻において目標とする値(この例では蒸気量)を示す。つまり、蒸気量センサデータ111A~111Cが得られた施設A~Cでは、蒸気量が設定値に近付くように制御が行われている。
【0048】
このように、データ取得部201は、測定値と設定値を含む蒸気量センサデータ111A~111Cを取得してもよい。そして、この場合、時系列データ生成部203は、蒸気量センサデータ111A~111Cに含まれる、施設A~Cで測定された測定値と当該測定値に対応する設定値とから、当該測定値と当該設定値との差または比を要素とする時系列データを生成してもよい。
【0049】
例えば、図4の例では、時系列データ生成部203は、蒸気量センサデータ111A~111Cのそれぞれから、各時刻におけるPV/SVの値すなわち測定値と設定値との比を要素とする時系列データ113A~113Cを生成している。PV/SVの値が1に近い場合、施設の状態は正常であるといえる。なお、時系列データ生成部203は、PV/SVの代わりにPVとSVの差すなわち測定値と設定値の差を要素とする時系列データを生成してもよい。
【0050】
また、時系列データ113A~113Cには、異常フラグという要素が含まれている。各時刻における異常フラグの値は、施設A~Cの状態が正常であるか否かを示している。具体的には、図4の例では、正常な状態である場合には異常フラグの値を0に、正常な状態ではない場合には異常フラグの値を1にしている。正常か否かの判定基準は適宜定めておけばよい。例えば、時系列データ生成部203は、PV/SVの値が所定の下限値未満である場合、および、PV/SVの値が所定の上限値を超える場合の少なくとも何れかの場合に正常ではないと判定し、他の場合に正常であると判定してもよい。
【0051】
異常フラグの値は、機械学習における正解データ、言い換えれば生成する推論モデルの目的変数である。つまり、時系列データ113A~113Cを用いて生成される推論モデルは、施設の状態が正常であるか否かを推論するモデルとなる。なお、目的変数の対応付けは教師データ生成部205が行うようにしてもよい。
【0052】
無論、推論モデルの目的変数は任意であり、施設の状態が正常であるか否かに限られない。つまり、時系列データ生成部203は、推論したい任意の目的変数を含む時系列データを生成すればよい。例えば、施設内の所定の機器に対する適切な制御量を推定する推論モデルを生成する場合、時系列データ生成部203は、当該機器に対する適切な制御量を含む時系列データを生成すればよい。なお、目的変数は時系列データ生成部203が自動で決定してもよいし、ユーザが入力してもよい。
【0053】
また、蒸気量センサデータ111A~111Cに、センサ名やセンサID等が含まれている場合や、蒸気量センサデータ111A~111Cに含まれるデータのデータ型が異なっていることも想定される。このような場合には、時系列データ生成部203は、蒸気量センサデータ111A~111Cを整形して連結可能なデータに変換してもよい。
【0054】
以上のように、時系列データ生成部203は、施設で測定された測定値と当該測定値に対応する設定値とから、当該測定値と当該設定値との差または比を要素とする時系列データを、複数の施設(対象)のそれぞれについて生成してもよい。
【0055】
測定値と設定値との差や比は、施設で測定された測定値と比べて汎用性が高い指標である。よって、このような汎用性のある指標を要素とする時系列データを生成する上記の構成によれば、擬似的時系列データを自然なものとすることができる。つまり、上記の構成によれば、施設が異なることを原因として発生するデータのばらつきを減少させることができると共に、複数の施設のそれぞれについて収集されたデータを連結することが、時系列性による数値の変動に与えるバイアスを減少させることができる。よって、上記の構成によれば、推論精度の高い推論モデルを生成することが可能になる。
【0056】
(擬似的時系列データおよび教師データの生成例)
図5は、擬似的時系列データおよび教師データの生成例を示す図である。より詳細には、図5には、図4に示した時系列データ113A~113Cから生成された擬似的時系列データ114と、擬似的時系列データ114から生成された教師データ115とを示している。
【0057】
まず、データ連結部204による擬似的時系列データ114の生成について説明する。データ連結部204は、時系列データ113A~113Cをこの順序で連結して擬似的時系列データ114を生成する。ただし、時系列データ113A~113Cをそのまま連結しただけでは、「時刻」の値について重複や不整合が生じる。
【0058】
そこで、データ連結部204は、連結を行うにあたり、時系列データ113A~113Cにおける時刻の値を1~15という連続する値に置き換えている。これらの値は、時系列データ113A~113Cに含まれる各データ要素の順序を示すものであり、順序情報と呼ぶことができる。元の「時刻」の値の代わりに新たな順序情報を与えることにより、データの連続性を保持しつつ、「時刻」の値に不整合が生じさせないようにすることができる。
【0059】
このように、データ連結部204は、複数の時系列データに一連の順序を示す順序情報を付与することにより複数の時系列データを連結してもよい。この構成によれば、複数の時系列データに一連の順序情報を付与するという簡易な処理で複数の時系列データを1つの擬似的時系列データとすることができる。
【0060】
なお、一般的に、データの分布が異なる複数の変数を用いて推論モデルを作成する場合には、変数を標準化処理または正規化処理することで高精度な推論モデルを作成することができる。ここで、標準化処理または正規化処理を実施するためには、対象となるデータセットの統計量が必要となるが、その統計量はデータセットに固有のものとなる。そのため、従来技術では、標準化処理または正規化処理後の時系列データを連結して単一のデータとすることは不可能であるか、もしくは仮に連結できたとしてもそのようなデータを用いた学習は推論モデルの性能を著しく低下させてしまう。
【0061】
これに対し、上記構成によれば、事前に複数の時系列データを連結して単一の疑似的時系列データとするため、標準化処理または正規化処理と複数の時系列データの連結処理を両立させることができる。
【0062】
また、データ連結部204は、複数の時系列データにおける連結部分の数値の不連続性を軽減する処理を実施した上で連結を行ってもよい。これにより、連結部分の数値の不連続性を軽減して連結後の擬似的時系列データに連続性を持たせることができ、連結部分の数値変化が自然な擬似的時系列データを生成することが可能になる。
【0063】
また、上記の構成によれば、複数の時系列データにおける連結部分の数値の不連続性が軽減されるため、疑似的時系列データに対して移動平均の算出等の時系列データに適用される一般的な前処理を適用することが可能になる。これにより、推論モデルのさらなる推論精度向上が期待できる。
【0064】
なお、不連続性を軽減する処理は、複数の時系列データにおける連結部分の数値の不連続性が軽減されるようなものであればよく、特に限定されない。例えば、不連続性を軽減する処理として、複数の時系列データにおける連結部分の数値を平滑化する処理を適用してもよい。また、例えば、不連続性を軽減する処理として、連結する時系列データのそれぞれの結合部の数値の一部を、不連続性が軽減されるように削除する処理を適用してもよい。この場合、例えば、結合部間の差が閾値以下となるように数値の削除を行ってもよい。
【0065】
例えば、データ連結部204は、擬似的時系列データ114における時刻=6のときのPV/SVの値を、当該値と時刻=5のときのPV/SVの値との平均値に置き換えてもよい。この場合、時刻=6におけるPV/SVの値は、(0.989+1.035)/2=1.012となり、時系列データ113Aと113Bの連結部分におけるPV/SVの値の変化を滑らかにすることができる。
【0066】
また、例えば、データ連結部204は、擬似的時系列データ114における時刻=10のときのPV/SVの値を削除してもよい。これにより、時系列データ113Bと113Cの連結部分におけるPV/SVの値の変化を滑らかにすることができる。
【0067】
続いて、教師データ生成部205による教師データ115の生成について説明する。図5の例では、教師データ生成部205は、擬似的時系列データ114に対して標準化処理を施すことにより教師データ115を生成している。具体的には、教師データ生成部205は、擬似的時系列データ114に含まれる、測定値、設定値、およびPV/SVという3つのデータ要素のそれぞれについて標準化処理を行ったものを教師データ115としている。
【0068】
具体的には、教師データ生成部205は、擬似的時系列データ114に含まれるデータ要素の値と平均値との差を標準偏差で割る、という処理を、各データ要素について行うことにより教師データ115を生成する。例えば、擬似的時系列データ114では、測定値の平均値が9.387であり、標準偏差が0.519である。よって、教師データ生成部205は、擬似的時系列データ114における時刻=1の測定値である9.8については、(9.8-9.387)/0.519=0.795との値に標準化している。
【0069】
また、教師データ生成部205は、標準化処理の代わりに正規化処理を施して教師データを生成してもよい。この場合、教師データ生成部205は、擬似的時系列データ114に含まれるデータ要素の最大値と最小値をそれぞれ算出する。そして、教師データ生成部205は、データ要素の値と算出した上記最小値との差を、データ範囲すなわち上記最大値と上記最小値との差で割る、という処理を、各データ要素について行うことにより教師データを生成する。
【0070】
以上のように、教師データ生成部205は、擬似的時系列データ114に対して標準化処理または正規化処理を施すことにより教師データ115を生成する。これにより、施設ごとの時系列データの特性を吸収した推論モデル、言い換えれば施設ごとの時系列データの特性を反映した推論モデルを生成することが可能になっている。
【0071】
なお、標準化処理または正規化処理の条件(平均、標準偏差、最大値、および最小値などの統計量)は、生成された推論モデルを用いた推論時にも使用される。このため、教師データ生成部205は、通信部22を介した通信により、標準化処理または正規化処理の条件を図2に示す情報処理装置1A~1Dに通知してもよい。
【0072】
学習部206は、以上のようにして生成された教師データ115を用いて機械学習を行い、推論モデルを生成する。推論モデルの目的変数は、異常フラグの値とすればよい。また、推論モデルの説明変数は、測定値、設定値、およびPV/SVの値の少なくとも何れかとすればよい。また、学習部206は、これら以外の値を説明変数に含めてもよい。例えば、学習部206は、温度センサデータ112Aに含まれる、温度の時系列の測定値、設定値、およびPV/SVの値の少なくとも何れかを説明変数に含めてもよい。また、これらの値を標準化処理または正規化処理した値の少なくとも何れかを説明変数に含めてもよい。
【0073】
なお、図5に示す教師データ115には、施設Dで収集されたデータは反映されていないが、このような教師データ115を用いて生成された推論モデルは、施設Dで収集された推論用データを用いた推論にも適用することが可能である。
【0074】
(情報処理装置2が実行する処理の流れ)
情報処理装置2が実行する処理の流れを図6に基づいて説明する。図6は、情報処理装置2が推論モデルを生成する際の処理の一例を示すフローチャートである。なお、詳細は後述するが、図6のフローチャートに示される一連の処理には、教師データの生成方法と推論モデルの生成方法とが含まれている。
【0075】
S11では、データ取得部201が、各施設で得られたデータを取得する。例えば、データ取得部201は、図2に示される施設A~Cでそれぞれ収集された時系列のセンシングデータを情報処理装置1A~1C経由で取得してもよい。なお、各施設で収集されたデータは、予め記憶部21等に記憶させておいてもよく、この場合、データ取得部201は記憶部21等からデータを取得すればよい。
【0076】
S12では、連結対象決定部202が、S11で取得されたデータの中からデータ連結部204による連結の対象とするものを決定する。図3に基づいて説明したように、連結対象決定部202は、予め設定されたルールに従って連結の対象とするデータを決定し、関連性のないデータは連結の対象としないようにすればよい。
【0077】
S13では、時系列データ生成部203が、S12で連結の対象と決定されたデータから、データ連結部204による連結に用いられる時系列データを生成する。具体的には、時系列データ生成部203は、S12で連結の対象と決定されたデータに含まれる測定値と当該測定値に対応する設定値とから、当該測定値と当該設定値との差または比を要素とする時系列データを生成する。この処理は、測定値を用いて推論モデルの説明変数を生成する処理であるともいえる。また、時系列データ生成部203は、S13において、生成する時系列データに、推論モデルの目的変数となる値を対応付ける処理についても行うようにしてもよい。
【0078】
S14(データ連結ステップ)では、データ連結部204が、複数の施設のそれぞれで収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成する。
【0079】
S15(教師データ生成ステップ)では、教師データ生成部205が、S14で生成された擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする。もしS13で時系列データに対して目的変数となる値の対応付けが行われていなければ、教師データ生成部205は、S15で擬似的時系列データに対して当該値の対応付けを行う。
【0080】
S16(学習ステップ)では、学習部206が、S15で生成された教師データを用いた機械学習により推論モデルを生成し、これにより図6の処理は終了する。なお、学習部206は、生成した推論モデルを情報処理装置1に送信してもよい。また、この際には、S15における標準化処理または正規化処理で用いた統計量も送信してもよい。
【0081】
以上説明した図6の処理には教師データの生成方法が含まれている。すなわち、情報処理装置2が実行する教師データの生成方法は、複数の施設(対象)のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップ(S14)と、S14で生成された擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップ(S15)と、を含む。これにより、汎用性の高い推論モデルを生成することが可能な教師データを生成することができる。
【0082】
また、図6の処理には推論モデルの生成方法も含まれている。すなわち、情報処理装置2が実行する推論モデルの生成方法は、複数の施設(対象)のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップ(S14)と、S14で生成された擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップ(S15)と、S15で生成された教師データを用いた機械学習により推論モデルを生成する学習ステップ(S16)と、を含む。よって、汎用性の高い推論モデルを生成することが可能である。
【0083】
(情報処理装置1が実行する処理の流れ)
情報処理装置1のデータ取得部101は、S16で生成された推論モデルと、S15における標準化処理または正規化処理で使用された統計量とを取得する。また、データ取得部101は、推論の対象となる施設について収集された推論用データを取得する。例えば、図2の情報処理装置1Dであれば、施設Dで収集された推論用データが取得される。
【0084】
次に、前処理部102が、上記の統計量を用いて推論用データを標準化処理または正規化処理して推論モデルの入力データを生成する。続いて、推論部103が、前処理部102が生成した入力データを推論モデルに入力し、推論モデルが出力する出力値に基づいて推論結果を得る。そして、制御量決定部104が、上記の推論結果に基づいて対象となる施設に設けられた機器に対する制御量を決定する。
【0085】
なお、従来は、図2のように複数の施設が存在する場合、施設ごとに収集された時系列データを、施設ごとに標準化処理または正規化処理して、施設ごとに教師データを生成し、各施設専用の推論モデルを生成していた。このため、各施設において、推論用データを用いた推論の際には、その施設において適用された統計量を用いて標準化処理または正規化処理を行う必要があった。
【0086】
これに対し、図2の情報処理システム5では、情報処理装置2が、施設ごとに収集された時系列データを連結して1つの擬似的時系列データとした上で標準化処理または正規化処理する。このため、何れの施設において収集された推論用データについても、同じ統計量を用いて標準化処理または正規化処理を行うことができる。
【0087】
〔変形例〕
上述の各実施形態で説明した各処理の実行主体は任意であり、上述の例に限られない。つまり、上述の各実施形態で説明した各処理を実行可能であれば、情報処理システム5を構成する装置は適宜変更することができる。
【0088】
例えば、図2の情報処理システム5では、情報処理装置1A~1Dとは別の情報処理装置2が教師データの生成と推論モデルの生成とを行っているが、情報処理装置1A~1Dの何れかが教師データの生成と推論モデルの生成とを行ってもよい。また、図2の情報処理システム5では、情報処理装置1A~1Dが施設A~Dにおけるデータの取集と、推論モデルを用いた推論とを行っているが、これらの処理をそれぞれ別の情報処理装置に実行させてもよい。
【0089】
また、図2の情報処理システム5では、1つの情報処理装置2で教師データの生成と推論モデルの生成とを行っているが、教師データの生成と推論モデルの生成とは、それぞれ別の情報処理装置に実行させることもできる。
【0090】
また、図6に記載の各処理の実行主体は、必ずしも1つの装置である必要はなく、それらの処理を複数の任意の情報処理装置(コンピュータ)に分担させて実行することができる。例えば、図6のS11~S15の処理を情報処理装置2に実行させ、S16の処理は他の情報処理装置に実行させてもよい。
【0091】
〔ソフトウェアによる実現例〕
情報処理装置1および2(以下、「装置」と呼ぶ)の機能は、当該装置としてコンピュータを機能させるためのプログラムであって、当該装置の各制御ブロック(特に制御部10および20に含まれる各部)としてコンピュータを機能させるためのプログラムにより実現することができる。例えば、情報処理装置2における推論モデルの生成機能は、推論モデル生成プログラムにより実現することができ、情報処理装置2における教師データ生成機能は、教師データ生成プログラムにより実現することができる。
【0092】
この場合、上記装置は、上記プログラムを実行するためのハードウェアとして、少なくとも1つの制御装置(例えばプロセッサ)と少なくとも1つの記憶装置(例えばメモリ)を有するコンピュータを備えている。この制御装置と記憶装置により上記プログラムを実行することにより、上記各実施形態で説明した各機能が実現される。
【0093】
上記プログラムは、一時的ではなく、コンピュータ読み取り可能な、1または複数の記録媒体に記録されていてもよい。この記録媒体は、上記装置が備えていてもよいし、備えていなくてもよい。後者の場合、上記プログラムは、有線または無線の任意の伝送媒体を介して上記装置に供給されてもよい。
【0094】
また、上記各制御ブロックの機能の一部または全部は、論理回路により実現することも可能である。例えば、上記各制御ブロックとして機能する論理回路が形成された集積回路も本発明の範疇に含まれる。この他にも、例えば量子コンピュータにより上記各制御ブロックの機能を実現することも可能である。
【0095】
〔まとめ〕
本発明の態様1に係る情報処理装置は、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部と、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部と、前記教師データを用いた機械学習により推論モデルを生成する学習部と、を備える。
【0096】
本発明の態様2に係る情報処理装置では、前記態様1において、前記データ連結部は、複数の前記時系列データに一連の順序を示す順序情報を付与することにより複数の前記時系列データを連結する構成であってもよい。
【0097】
本発明の態様3に係る情報処理装置では、前記態様1または2において、前記データ連結部は、複数の前記時系列データにおける連結部分の数値の不連続性を軽減する処理を実施した上で連結を行う構成であってもよい。
【0098】
本発明の態様4に係る情報処理装置では、前記態様1から3の何れかにおいて、前記対象について測定された測定値と当該測定値に対応する設定値とから、当該測定値と当該設定値との差または比を要素とする前記時系列データを、複数の前記対象のそれぞれについて生成する時系列データ生成部を備える。
【0099】
本発明の態様5に係る情報処理装置は、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結部と、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成部と、を備える。
【0100】
本発明の態様6に係る生成方法は、1または複数の情報処理装置が実行する推論モデルの生成方法であって、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップと、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップと、前記教師データを用いた機械学習により推論モデルを生成する学習ステップと、を含む。
【0101】
本発明の態様7に係る生成方法は、1または複数の情報処理装置が実行する教師データの生成方法であって、複数の対象のそれぞれについて収集されたデータに基づく複数の時系列データを連結して1つの擬似的時系列データを生成するデータ連結ステップと、前記擬似的時系列データに対して標準化処理または正規化処理を施して教師データとする教師データ生成ステップと、を含む。
【0102】
本発明の態様8に係る推論モデル生成プログラムは、前記態様1に記載の情報処理装置としてコンピュータを機能させるための推論モデル生成プログラムであって、前記データ連結部、前記教師データ生成部、および前記学習部としてコンピュータを機能させる。
【0103】
本発明の態様9に係る教師データ生成プログラムは、前記態様5に記載の情報処理装置としてコンピュータを機能させるための教師データ生成プログラムであって、前記データ連結部および前記教師データ生成部としてコンピュータを機能させる。
【0104】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0105】
2 情報処理装置
203 時系列データ生成部
204 データ連結部
205 教師データ生成部
206 学習部
111A、111B、111C 蒸気量センサデータ(測定値、設定値)
112A、112B、112C 温度センサデータ(測定値、設定値)
113A、113B 時系列データ
114 疑似的時系列データ
115 教師データ
図1
図2
図3
図4
図5
図6