(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-20
(45)【発行日】2024-05-28
(54)【発明の名称】情報処理装置および情報処理方法
(51)【国際特許分類】
G06Q 50/04 20120101AFI20240521BHJP
G06N 20/00 20190101ALI20240521BHJP
【FI】
G06Q50/04
G06N20/00
(21)【出願番号】P 2020075823
(22)【出願日】2020-04-22
【審査請求日】2023-01-11
(73)【特許権者】
【識別番号】000153443
【氏名又は名称】株式会社 日立産業制御ソリューションズ
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】高田 晋太郎
(72)【発明者】
【氏名】佐藤 江里子
(72)【発明者】
【氏名】鯨井 俊宏
【審査官】青柳 光代
(56)【参考文献】
【文献】特開2018-163622(JP,A)
【文献】特開2019-197315(JP,A)
【文献】特開2020-047230(JP,A)
【文献】特開平10-187226(JP,A)
【文献】特開2015-172945(JP,A)
【文献】特開2019-082943(JP,A)
【文献】特開2019-049850(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
複数の装置から構成され当該複数の装置による生産処理より材料から製品を生産するプラントで計測されたデータのうち、予測する対象である目的変
数を説明するための複数の説明変数のデータ
から、前記目的変数の予測に適した複数の特徴量変数のデータを生成する処理を行う処理部と、
前記複数の
特徴量変数の各々について、前記プラントの制御性を示す指標を算出する算出部と、
前記算出部により算出された指標に基づいて選択された
特徴量変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する生成部と、
を備え
、
前記複数の装置は、前記製品を出力する第1の装置と、前記第1の装置以外の複数の第2の装置とで構成され、
前記処理部は、前記複数の第2の装置の各々について、当該第2の装置を材料が通過して前記第1の装置に到達するまでの時間差を特定し、特定された時間差を基に、当該第2の装置に対応した説明変数を、材料が前記第1の装置に到達すると予想される時刻における値に変換する補正処理を行い、
前記複数の特徴量変数は、前記補正処理が施された複数の説明変数から変換されたものであり、
前記算出部は、前記複数の特徴量変数のうち、前記プラントの設定値が対応付けられている特徴量変数について、前記プラントの制御性を示す指標として、前記設定値が変更された際に、変更された設定値にどれくらい素早く前記特徴量変数に係る計測値が収束するかを示す収束性を算出し、
前記算出部は、前記複数の特徴量変数のうち、所定の値より類似度が高い特徴量変数のデータが前記プラントにおける生産工程のどの工程で計測されたデータであるかを示す因果性を算出し、
前記算出部は、前記複数の特徴量変数のうちの評価対象の特徴量変数と前記目的変数との相関値であり、当該評価対象の特徴量変数が前記目的変数の予測において貢献する貢献度を算出し、
前記算出部は、前記評価対象の特徴量変数のうちの前記評価対象の特徴量変数以外の各特徴量変数について、当該特徴量変数と前記評価対象の特徴量変数との相関値であり、当該特徴量変数の前記評価対象の特徴量変数との類似度を算出する、
情報処理装置。
【請求項2】
前記プラントで計測されたデータを記憶する記憶装置が接続され、
前記複数の
特徴量変数の各々について、前記記憶装置に記憶されているデータのうち前記目的変数と相関が最も高い1つのデータを特定する特定部を備え、
前記算出部は、前記複数の
特徴量変数の各々について、前記特定部により特定されたデータを用いて、前記プラントの制御性を示す指標を算出し、
前記生成部は、前記算出部により算出された指標に基づいて選択された
特徴量変数のデータであって、前記特定部により特定されたデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する、
請求項1に記載の情報処理装置。
【請求項3】
前記算出部は、前記目的変数の予測の精度を示す指標を算出し、
前記複数の
特徴量変数の各々について、前記算出部により算出された前記目的変数の予測の精度を示す指標と、前記算出部により算出された前記プラントの制御性を示す指標とを対応付けて出力する出力部と、
前記出力部による出力をもとに前記目的変数の予測に用いる
特徴量変数が使用者により選択された情報を入力する入力部と、を備え、
前記生成部は、前記入力部により入力された情報に基づいて、前記使用者により選択された
特徴量変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する、
請求項1に記載の情報処理装置。
【請求項4】
(A)処理部が、
複数の装置から構成され当該複数の装置による生産処理より材料から製品を生産するプラントで計測されたデータのうち、予測する対象である目的変
数を説明するための複数の説明変数のデータ
から、前記目的変数の予測に適した複数の特徴量変数のデータを生成する処理を行うことと、
(B)算出部が、前記複数の
特徴量変数の各々について、前記プラントの制御性を示す指標を算出することと、
(C)生成部が、前記算出部により算出された指標に基づいて選択された
特徴量変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成することと、
を含む情報処理方法であって、
前記複数の装置は、前記製品を出力する第1の装置と、前記第1の装置以外の複数の第2の装置とで構成され、
(A)において、前記生成部は、前記複数の第2の装置の各々について、当該第2の装置を材料が通過して前記第1の装置に到達するまでの時間差を特定し、特定された時間差を基に、当該第2の装置に対応した説明変数を、材料が前記第1の装置に到達すると予想される時刻における値に変換する補正処理を行い、
前記複数の特徴量変数は、前記補正処理が施された複数の説明変数から変換されたものであり、
(B)において、前記算出部は、前記複数の特徴量変数のうち、前記プラントの設定値が対応付けられている特徴量変数について、前記プラントの制御性を示す指標として、前記設定値が変更された際に、変更された設定値にどれくらい素早く前記特徴量変数に係る計測値が収束するかを示す収束性を算出し、
(B)において、前記算出部は、前記複数の特徴量変数のうち、所定の値より類似度が高い特徴量変数のデータが前記プラントにおける生産工程のどの工程で計測されたデータであるかを示す因果性を算出し、
(B)において、前記算出部は、前記複数の特徴量変数のうちの評価対象の特徴量変数と前記目的変数との相関値であり、当該特徴量変数が前記目的変数の予測において貢献する貢献度を算出し、
(B)において、前記算出部は、前記評価対象の特徴量変数のうちの前記評価対象の特徴量変数以外の各特徴量変数について、当該特徴量変数と前記評価対象の特徴量変数との相関値であり、当該特徴量変数の前記評価対象の特徴量変数との類似度を算出し、
前記算出部、前記処理部、及び、前記生成部は、情報処理装置の構成要素である、
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、概して、予測モデルの生成に関する。
【背景技術】
【0002】
近年、原料を加工する工場等であるプラントにおける特定の製品の生産についての歩留まり改善、生産性の向上等の業務改善に予測モデルを活用する動きが盛んである。予測モデルは、特定の製品の品質値等を予測するモデルであり、機械学習を用いて生成される。予測モデルでは、特定の製品の生産工程の各装置における各種の計測値を蓄積したデータが学習データとされている。
【0003】
例えば、学習データにおける特徴量変数のベクトルに対し、目的変数の予測に有用な基底関数の写像方法を評価、採用し、機械学習を行うことで、精度が高い予測モデルの自動構築を行うことが可能な情報処理装置が開示されている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1のように、学習データの各特徴量変数に対して、目的変数の予測に有用な写像を行う基底関数を適用して機械学習を行うことで、精度の高い予測モデルを自動で生成することが可能となる。
【0006】
一方で、プラント等で計測されたデータから特定の特徴量変数の値を予測する予測モデルが生成され、当該予測モデルを生産性の向上等に活かすような場合がある。この場合、予測モデルの使用者は、予測モデルから得られた予測値と生産品の目標値との乖離を確認する。そして、使用者は、どの特徴量変数を現在の値からどのように変更して制御すべきかを調べる等して、生産現場での改善を行う。したがって、予測モデルを構成する特徴量変数は、使用者がプラントを制御し易い特徴量変数であることが望ましい。
【0007】
しかしながら、特許文献1には、使用者がプラントを制御し易い特徴量変数の選択方法については、開示されていない。
【0008】
本発明は、以上の点を考慮してなされたもので、プラントの制御性がよい予測モデルを生成し得る情報処理装置等を提案しようとするものである。
【課題を解決するための手段】
【0009】
かかる課題を解決するため本発明においては、プラントで計測されたデータのうち、予測する対象である目的変数のデータと、前記目的変数を説明するための複数の説明変数のデータとをもとに、前記複数の説明変数の各々について、前記プラントの制御性を示す指標を算出する算出部と、前記算出部により算出された指標に基づいて選択された説明変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する生成部と、を設けるようにした。
【0010】
上記構成では、制御性を示す指標に基づいて選択された説明変数のデータをもとに、機械学習が行われるので、例えば、使用者がプラントを容易に制御可能な予測モデルを生成することができる。
【発明の効果】
【0011】
本発明によれば、プラントの制御性がよい予測モデルを生成することができる。
【図面の簡単な説明】
【0012】
【
図1】第1の実施の形態による情報処理装置に係る構成の一例を示す図である。
【
図2】第1の実施の形態によるプラントにおける生産工程の流れを模式化した模式図である。
【
図3】第1の実施の形態による計測値テーブルの一例を示す図である。
【
図4】第1の実施の形態による入力学習データの一例を示す図である。
【
図5】第1の実施の形態による予測モデル生成処理の一例を示す図である。
【
図6A】第1の実施の形態による設定値の時系列データの一例を示す図である。
【
図6B】第1の実施の形態による計測値の時系列データの一例を示す図である。
【
図7】第1の実施の形態による特徴量評価テーブルの一例を示す図である。
【
図8】第1の実施の形態による特徴量候補テーブルの一例を示す図である。
【
図9】第1の実施の形態による画面の一例を示す図である。
【発明を実施するための形態】
【0013】
(1)第1の実施の形態
以下、本発明の一実施の形態を詳述する。本実施の形態では、使用者がプラントを制御し易い予測モデルの生成方法に関して説明する。
【0014】
プラントは、エネルギー(電気、ガス、上水等)、化学製品(ガソリン、プラスチック等)、食品、医薬品といった製品を製造する機器、装置、設備、工場等である。
【0015】
本実施形態に示す情報処理装置では、プラントで計測されたデータを記憶する。当該データには、予測する対象である目的変数のデータと、目的変数を説明するための複数の説明変数のデータとが含まれる。情報処理装置は、プラントで計測されたデータをもとに機械学習を用いて目的変数を予測する予測モデルを生成する。
【0016】
ここで、予測モデルを構成する説明変数は、物理量として理解可能な説明変数であることが望ましい。機械学習のアルゴリズムについては、線形回帰式等、目的変数と説明変数との関係性が解釈可能なアルゴリズムであることが望ましい。予測モデルについては、使用者による理解が容易あることが望ましい。
【0017】
よって、本実施の形態では、プラントにおける生産性の改善等への活用を前提とし、使用者によるプラントの制御が容易であり、かつ、理解が容易な予測モデルを構築する方法について説明する。
【0018】
例えば、情報処理装置は、予測対象となる目的変数と、目的変数と何らかの関連がある複数の説明変数と、データサンプルに一意な時刻情報を与える時間変数とを列要素とし、それらの各変数に何らかの値を持つデータサンプルを行の1要素とするデータ集合を学習データとして入力する。
【0019】
情報処理装置は、上記学習データにおける各説明変数について、目的変数を予測する際の予測の精度に関わる1つ以上の評価指標と、プラントの制御性に関わる1つ以上の評価指標の評価を行う。
【0020】
情報処理装置は、与えられた学習データを用いて目的変数を予測する予測モデルを機械学習によって生成する。より具体的には、情報処理装置は、上記学習データにおける説明変数の中から、上記予測の精度に関わる評価指標群の中から少なくとも1つ以上の指標に基づいて説明変数の選択を行う。また、情報処理装置は、上記学習データにおける説明変数の中から、上記制御性に関わる評価指標群の中から少なくとも1つ以上の指標に基づいて説明変数の選択を行う。情報処理装置は、変数選択を行った学習データに対して予測モデルを生成する。なお、情報処理装置は、予測モデルの生成に関わる使用者の作業を支援する構成を備えてもよい。
【0021】
上記構成によれば、使用者がプラントを制御し易い予測モデルを生成することができる。
【0022】
次に、本発明の実施形態を図面に基づいて説明する。ただし、本発明は、実施の形態に限定されるものではない。
【0023】
[構成の説明]
図1において、101は、全体として第1の実施の形態による情報処理装置を示す。
図1は、情報処理装置101に係る構成の一例を示す図である。
【0024】
情報処理装置101は、ハードウェア構成として、主記憶装置102、副記憶装置103、演算装置104、ネットワークインタフェイス(NW I/F)105、および入出力I/F106を備える。各ハードウェア構成は、内部バスを介して互いに接続されている。
【0025】
主記憶装置102は、DRAM(Dynamic Random Access Memory)等のメモリである。主記憶装置102は、演算装置104が実行するプログラムおよびプログラムが使用する情報を格納する。なお、主記憶装置102は、揮発性の記憶素子から構成されてもよいし、不揮発性の記憶素子から構成されてもよい。主記憶装置102に格納されるプログラムおよび情報については後述する。
【0026】
副記憶装置103は、HDD(Hard Disk Drive)、SSD(Solid State Drive)等である。副記憶装置103は、データを永続的に格納する。主記憶装置102に格納されるプログラムおよび情報は、副記憶装置103に格納されてもよい。この場合、演算装置104は、副記憶装置103からプログラムおよび情報を読み出し、主記憶装置102にロードし、ロードされたプログラムを実行する。
【0027】
演算装置104は、プロセッサ、GPU(Graphics Processing Unit)、FPGA(Field Programmable Gate Array)等である。演算装置104は、主記憶装置102等に格納されるプログラムを実行する。
【0028】
NW I/F105は、ネットワークを介して外部装置と通信する。入出力I/F106は、キーボード、マウス、タッチパネル等からデータを入力するための入力装置、および/または、スピーカ、ディスプレイ等にデータを出力するための出力装置と通信する。なお、情報処理装置101は、入力装置および/または出力装置を備えていてもよい。
【0029】
情報処理装置101が備えるソフトウェアモジュール(モジュール)として、制御部107、時刻情報補正部108、特徴量生成部109、特徴量評価部110、特徴量候補絞込み部111、特徴量加工部112、予測モデル生成部113、およびモデル評価部114を備える。これらのモジュールの実体(プログラム)は、主記憶装置102または副記憶装置103に格納され、情報処理装置101の起動時に読み込まれ、所定のデータ処理を実行するモジュールとして機能する。
【0030】
制御部107は、情報処理装置101の動作を制御するモジュールであり、各種のモジュールの動作を制御する。制御部107は、各種の入力を行う入力部の一例である。また、制御部107は、各種の出力を行う出力部の一例である。
【0031】
時刻情報補正部108は、特定部の一例であり、学習データに格納された値について時刻情報に関する補正処理を行う。例えば、特定部は、複数の説明変数の各々について、主記憶装置102または副記憶装置103に記憶されている学習データのうち目的変数と相関が最も高い1つのデータを特定する。
【0032】
特徴量生成部109は、処理部の一例であり、学習データの説明変数を用いて任意の処理を行い、特徴量変数を生成する処理を行う。例えば、処理部は、複数の説明変数のデータから、目的変数の予測に適した1以上の特徴量変数のデータを生成する処理を行う。
【0033】
特徴量評価部110は、算出部の一例であり、特徴量生成部109により生成された特徴量変数(特徴量)について様々な評価基準に基づいて評価を行う。例えば、算出部は、複数の説明変数の各々について、プラントの制御性を示す指標(後述の収束性、因果性等)を算出する。
【0034】
特徴量候補絞込み部111は、特徴量評価部110で算出された評価値(指標)に基づいて、機械学習に用いる学習データの特徴量変数の候補を絞り込む処理を行う。
【0035】
特徴量加工部112は、特徴量の選択、加工等の特徴量加工処理を行う。
【0036】
予測モデル生成部113は、生成部の一例であり、与えられた学習データに対して、目的変数の予測を行うことができる予測モデルを機械学習によって生成する。例えば、生成部は、使用者または自動的に選択された説明変数のデータをもとに、機械学習により目的変数を予測する予測モデルを生成する。
【0037】
モデル評価部114は、予測モデルに対して、予測の精度またはその他の観点において評価を行う。
【0038】
これらのモジュールの詳細な処理については後述する。
【0039】
情報処理装置101が処理する情報としては、入力学習データ1021、時刻補正後学習データ1022、特徴量生成後学習データ1023、特徴量加工後学習データ1024、特徴量評価テーブル1025、特徴量候補テーブル1026、および予測モデル1027がある。これらの情報は、主記憶装置102上で計算された後に、副記憶装置103に保存されるようにしてもよい。
【0040】
入力学習データ1021は、情報処理装置101で予測モデルの生成対象となる学習データである。入力学習データ1021は、NW I/F105等を介して入力される。本実施の形態では、プラントにおける生産工程での各装置における各種の計測値を集計したものを学習データの例として説明を行う。なお、本実施の形態は、以下で例示するプラントにおけるデータに、適用範囲が限定されるものではない。
【0041】
図2は、本実施の形態が想定するプラントにおける生産工程の流れを模式化した模式図である。
【0042】
プラント201は、複数の装置から構成されている。プラント201では、基本的に、予め定められた装置(例えば、図面上の左から右の装置)へと製品の材料が流れていき、各装置を材料が通過する際に所定の生産処理が施されていく。ここでは、装置0において出力される物が目的とする製品である。それより前の工程にある装置は、一対一の関係のみならず、例えば、装置2のように複数の装置からの出力を受け入れるものも想定される。装置Nおよび装置Kは、本工程において最も上流(以下、「左端」と記す)に設置されるものであり、このような装置からは、製品の材料が投入されることが想定される。
【0043】
各装置には、計測器が設置されており、装置の状態、材料の状態等に関する種々の情報が記録される。例えば、計測器Nでは、計測時刻Tおよび計測値PVN_0,PVN_i,・・・が記録される。計測時刻Tは、各計測器で共通の値である。各計測器では、通常、1分毎等の定期的なタイミングで計測が行われる。計測値PVN_iは、計測器Nにおけるi番目の計測項目の値であることを示す。計測項目は、装置間で必ずしも同じであるとは限らない。
【0044】
図3は、計測値テーブル301の一例を示す図である。計測値テーブル301では、各計測器における項目(変数PV)の内容を示す情報が記憶される。
【0045】
例えば、計測値テーブル301において、PV0_0は、計測器0における温度の計測値を示す。PV0_1は、計測器0における圧力の計測値を示す。PVN_0は、計測器Nにおける温度の計測値を示す。PVN_1は、計測器Nにおける温度の設定値を示す。設定値とは、装置に対して使用者が所望する値を設定値として指定するものである。例えば、設定値が指定される装置としては、装置で計測された温度が設定値に近づくようにフィードバック制御を行う機構が備えられた装置等が該当する。
【0046】
図4は、入力学習データ1021の一例を示す図である。入力学習データ1021は、
図2および
図3で説明したプラントの生産工程における各種の計測値を集計したデータである。
【0047】
入力学習データ1021は、各計測器において共通の値である計測時刻Tを基準に、一定の時刻毎に各計測器で計測された値を集計したテーブル形式で表現される。入力学習データ1021では、時刻毎にユニークな値であるidが割り振られている。一の時刻の計測値が学習データにおける1サンプルに該当する。なお、本実施の形態においては、計測器0で計測された温度であるPV0_0が予測モデルにおける目的変数であるとして説明する。以下では、PV0_0以外の計測値を説明変数と記す。
【0048】
時刻補正後学習データ1022は、入力学習データ1021の各説明変数の値に対して、時刻情報に関する補正を施したデータである。特徴量生成後学習データ1023は、時刻補正後学習データ1022の各説明変数に対して特徴量生成処理が施されて生成された特徴量変数の学習データである。特徴量加工後学習データ1024は、特徴量生成後学習データ1023に対して、特徴量変数の選択による削減処理等の特徴量加工処理が施されたデータである。情報処理装置101は、特徴量加工後学習データ1024を学習データとし、予測モデルを生成する。特徴量評価テーブル1025は、特徴量生成後学習データ1023における各特徴量変数に対して種々の評価が行われた結果が記されたデータである。特徴量候補テーブル1026は、特徴量評価テーブル1025の中でも各種評価値が高いものが選択され、絞り込まれたデータである。予測モデル1027は、情報処理装置101により生成された予測モデルである。なお、主記憶装置102で取り扱う、各種データ、テーブルの詳細については後述する。
【0049】
[処理の説明]
情報処理装置101の動作について、
図5に示す処理フローを用いて説明する。
図5は、情報処理装置101が学習データを取得して予測モデルを生成するまでの処理(予測モデル生成処理)の一例を示す図である。
【0050】
まず、使用者による操作に応じて予測モデル生成処理が開始され(S501)、情報処理装置101は、副記憶装置103に格納されている学習データを、主記憶装置102に読込み、入力学習データ1021を取得する(S502)。
【0051】
S503では、情報処理装置101は、入力学習データ1021の各種の説明変数について、どの説明変数がどの装置における設定値に該当するかを判定するための情報を取得する。本処理の具体例の1つとして、まず、情報処理装置101は、入出力I/F106を介して、説明変数の一覧と、それらが設定値に該当するかどうかのチェックボックスを備えたテーブル等をディスプレイに表示する。続いて、どの説明変数が設定値に該当するかのチェックが使用者により付けられた後、情報処理装置101は、チェックの結果を取り込む。情報処理装置101は、これらの処理を行うことによって本処理を実現する。
【0052】
また、その他の例として、情報処理装置101は、説明変数の一覧と、各説明変数が設定値に該当するかどうかの項目に特定の値(例えば、値「1」等)が付与されたテーブルを格納したファイルを、学習データの取り込み時に同時に取り込むようにしてもよい。これによって、使用者は、あらかじめ、どの説明変数がどの設定値に該当するかを準備することができ、予測モデルの生成時における作業を軽減することができる。
【0053】
S504では、情報処理装置101は、S505にて後述する時刻情報補正処理に必要な情報を取得する。
図2に示すような、プラントにおける生産工程において、情報処理装置101は、目的変数が計測される装置0と、その他の装置との関係性に関する情報を取得する。より具体的には、関係性に関する情報は、装置0とその他の任意の装置Nとの距離L
Nの値、および、材料が装置間を流れる速度vの値である。事前の知識として、材料が装置Nを通過して装置0に到達するまでの時間ΔT
Nが把握できているような場合には、情報処理装置101は、時間ΔT
Nを情報として取得してもよい。
【0054】
また、情報処理装置101は、その他の情報として、
図2における装置2のように、複数の装置の出力が合流するような装置であるかどうか、装置K等のように、生産工程の左端に位置する装置であるかどうかを情報として入力してもよい。
【0055】
S505では、情報処理装置101は、入力学習データ1021に対して、時刻情報補正処理を施し、時刻補正後学習データ1022を生成する。本処理では、まず、情報処理装置101は、S504で取得した情報をもとに、材料が装置Nを通過して装置0に到達するまでの時間ΔTNを装置毎に算出する。より具体的には、情報処理装置101は、ΔTN=LN/vの式によってΔTNを求める。情報処理装置101は、このようにして得られたΔTNを用いて、各種の説明変数PVN_iの値を、装置0に到達が予想される時刻における値に変換する処理を行う。より具体的には、情報処理装置101は、以下の式によって変換を行う。
【0056】
PV’
N_i(t)=PV
N_i(t-ΔT
N)
変数tは、任意の時刻インデックスであり、例えば、
図4におけるTの任意の値が該当する。
【0057】
この変換によって、各装置(例えば、装置N)で計測された各種の計測値は、装置0にΔTN後に到達し、そのまま影響を与えるという仮定のもと、装置0を基準とした同じ時間軸に全ての計測値を置き換えることができる。
【0058】
したがって、時刻補正後学習データ1022は、PV0_iを除く説明変数PVN_iがPV’N_iに置き換わったものになる。これによって、学習データの各idにおける1行の値をもとに目的変数を予測する際において、目的変数と各説明変数とは、最も影響を与えると考えられる関係性を持っていることが期待できる。
【0059】
なお、ΔTNに関しては、外部から与えられた情報からではなく、取得した学習データから算出されるような構成としてもよい。より具体的には、情報処理装置101は、目的変数とPVN_iの特定のiの説明変数との相互相関を求め、最も相関が高くなるようなΔTNを求める。これによって、装置0と他装置との距離、その他の要因等で、材料が移動する速度が一定でなかったりするような場合でも、各装置で適したΔTNを定めることが可能となる。
【0060】
S506では、情報処理装置101は、S505で得られた時刻補正後学習データ1022をもとに、特徴量変数の生成処理(特徴量生成処理)を行い、特徴量生成後学習データ1023を生成する。特徴量変数の生成処理は、PV’N_iをもとにして目的変数を予測するのに適した特徴量変数に変換を行う処理である。特徴量変数の生成処理の例として、移動平均化の処理、一定期間における最大値/最小値の算出、微分値の算出等が挙げられるが、これら以外の処理を適用してもよい。以後では、PV’N_iをもとにして生成された特徴量変数をPV’N_i_fで記すものとする。インデックスfは、上述したような変換処理の種類に対応する。
【0061】
S507では、情報処理装置101は、特徴量生成後学習データ1023をもとに、各特徴量変数に対して特徴量評価処理を実行し、特徴量評価テーブル1025を生成する。特徴量評価処理は、様々な観点で、特徴量の評価を行う処理であり、本実施の形態では、貢献度、類似度、収束性、および因果性の4つの観点で評価を行う。
【0062】
<貢献度>
貢献度は、評価対象の特徴量変数が目的変数の予測においてどれくらい貢献するかを指標化(評価)したものである。より具体的には、貢献度として、目的変数と特徴量変数との相関値等を適用する。
【0063】
<類似度>
類似度は、評価対象の特徴量変数と当該特徴量変数以外の各特徴量変数との類似性を指標化したものである。より具体的には、類似度として、互いの特徴量変数の相関値等を適用する。類似度を評価することによって、予測モデルを生成する際に、同じ性質を持つ複数の説明変数が存在することで発生する多重共線性を防ぐための変数選択を行うことができる。
【0064】
<収束性>
収束性は、評価対象の特徴量変数、または当該特徴量変数の生成元となった説明変数に関して、対応する計測値に変化が生じた場合に、どれくらい素早く設定された値に計測値が収束するかを指標化したものである。より具体的には、情報処理装置101は、ある装置の項目に対する設定値と、当該項目に対応する計測値の特徴量変数の学習データを解析することで算出を行う。
【0065】
図6Aは、装置Nの温度の設定値PV’
N_1に対応した時系列データ601の一例を示す図である。
図6Bは、装置Nの温度の計測値PV’
N_0に対応した時系列データ602の一例を示す図である。
図6Aおよび
図6Bを用いて収束性の算出方法の具体例を説明する。なお、PV’
N_1は、装置Nにおける温度の設定値であり、温度の計測値であるPV’
N_0は、設定値にできるだけ近い値であることが望ましい。
【0066】
収束性は、設定値が変更された際にどれくらい素早く変更後の設定値に収束していくかを示す指標である。情報処理装置101は、実際の計測値であるPV’N_0を解析して収束性を算出する。より具体的には、情報処理装置101は、設定値が変更されたタイミングでPV’N_0が収束したと思われるまでに要した時間を収束性の値とする。
【0067】
図6Bに示す例では、情報処理装置101は、時刻がt_changeのタイミングで設定値の変更がなされ、時刻T_stableのタイミングで収束段階になったと判断する。この場合、情報処理装置101は、収束性の値として、t_stable-t_changeを算出する。情報処理装置101は、t_stableの時刻を、PV’
N_0が一定の期間中に取り得る値が一定の閾値内に収まっているかどうかで判断する。
【0068】
情報処理装置101は、収束性の算出を解析対象の時系列データにおける設定値の変更がなされたタイミング全てで算出し、それらを平均化することで、解析対象の特徴量変数の収束性の評価を完了する。収束性を評価することで、生成した予測モデルを使用して、プラントにおける生産性の向上等の業務改善を行う際に、設定値の変更に素早く追従して変化する特徴量変数が予測モデルに含まれているかどうか等を使用者が容易に把握できるようになる。
【0069】
なお、収束性の算出方法については、上述した方法に限るものではない。例えば、情報処理装置101は、外部からの入力情報として、各装置においての仕様情報を入力し、仕様情報に基づいて評価してもよい。仕様情報とは、各装置における対象の計測値に関してフィードバック制御の機構の有無、その機構の収束の応答特性等である。他には、情報処理装置101は、S504で入力した情報である評価対象の特徴量変数の装置が生産工程における左端に位置する装置であるかどうか、複数の入力を受け付ける装置であるかどうか等から判断するようにしてもよい。一般的には、前者の場合は、収束性が高く、後者の場合は、因果が複雑なため収束性が低いと判断できる。
【0070】
また、単純に外部から収束性の良し悪しを使用者が判断した結果を入力するような構成としてもよい。これによって、情報処理装置101は、学習データにおける評価対象の特徴量変数の設定値の変動と、計測値の変動との関係性をうまく取得したり、分析したりできないような場合に、現場の知識に基づいた、より正確な収束性の評価値を決定することができる。
【0071】
なお、そもそも対応する設定値の特徴量変数を持たない特徴量変数に関しては、本指標については、評価対象外となる。
【0072】
<因果性>
因果性は、評価対象の特徴量変数に対して、因果関係を持つ他の特徴量変数との関わり合いを指標化したものである。例えば、ある装置Pの前工程に存在する装置P-1があった場合に、それぞれの装置で計測される温度値に高い相関があったとして、当該温度値は、前工程である装置P-1で行われる操作に強く依存しているような場合、装置Pは、装置P-1の子であると言える。逆に、装置P-1は、装置Pの親であると言える。
【0073】
このような評価については、情報処理装置101は、評価対象の特徴量変数と類似度が非常に高い特徴量変数に対して、該当するそれぞれの装置が生産工程のどの場所に位置されているかに基づいて親子関係を評価することができる。この際には、情報処理装置101は、S504で取得した生産工程における各装置の関係性等を用いて評価することができる。
【0074】
なお、各特徴量変数間における親子関係の情報は、使用者が明示的に指定するような構成としてもよい。これによって、現場の事前の知識に基づいた、より正確な因果性の評価を行うことができる。このような因果性の評価を行うことによって、上述したように複数の説明変数間に高い類似度をもつ説明変数が存在した場合に、多重共線性を解消するために変数選択を行う際に、より因果的な関係性を反映した説明変数(この場合は子ではなく親側を選択)を選択することが可能となる。
【0075】
情報処理装置101は、このように算出した特徴量変数の各々についての評価指標の情報をもとに、特徴量評価テーブル1025を生成する。
図7は、特徴量評価テーブル1025の一例を示す図である。
【0076】
id701は、時刻補正後学習データに含まれる説明変数それぞれに付与されるユニークな番号を示す項目である。説明変数702は、id701により識別される説明変数を示す項目である。sub id703は、id701により識別される説明変数から生成された特徴量変数(特徴量)それぞれに対して付与されるユニークな識別子を示す項目である。
図7では、1つの説明変数について移動平均化が行われた特徴量変数と、当該1つの説明変数について微分が行われた特徴量変数との2種類の特徴量変数が示されている。特徴量生成処理の種類が増えた場合は、sub idの数がそれに応じて増える。特徴量変数704は、id701により識別される説明変数から生成された特徴量変数を示す項目である。なお、特徴量変数の種類は、全ての説明変数において同じであってもよいし、説明変数に応じて異なっていてもよい。
【0077】
貢献度705は、貢献度の評価結果を示す項目である。貢献度は、正規化等されて、「0」-「100」の値を取るものとされる。貢献度「100」は、最も貢献度が高いことを意味する。収束性706は、収束性の評価結果を示す項目である。収束性は、正規化等されて「0」-「100」の値を取るものとされる。収束性「100」は、最も収束性が高いことを意味する。なお、収束性の評価は、各説明変数に対して評価を行うものとする。したがって、1つのidにつき1つの評価結果が存在する。評価対象の説明変数自体が設定値である場合、計測値の説明変数に対応する設定値の説明変数が存在しない場合には、本指標は算出されない。
【0078】
類似度の高い特徴量変数707は、類似度が高い他の特徴量変数のsub idを示す項目である。類似度が高いと判定する閾値が設定されていて、閾値以上の特徴量変数の情報が類似度の高い特徴量変数707に格納される。因果性708は、因果性の評価結果を示す項目である。因果性708には、類似度が高い特徴量変数の中で親子関係にある特徴量変数のidと親であるか子であるかを示す情報とが格納される。なお、因果性708には、1つのid毎に評価結果が格納されるものとする。
【0079】
S508では、情報処理装置101は、生成した特徴量評価テーブル1025をもとに、特徴量絞込み処理を実施し、特徴量候補テーブル1026を生成する。特徴量絞込み処理では、情報処理装置101は、特徴量評価テーブル1025における各種の評価結果をもとに、特徴量変数の絞り込みを行う。より具体的には、情報処理装置101は、貢献度が一定の閾値(例えば、「70」)以下の特徴量変数を除外する。これによって、目的変数の予測にほとんど貢献しないような特徴量変数を、候補から自動的に除外することができる。
【0080】
また、情報処理装置101は、同一の説明変数から生成された特徴量変数間において、最も貢献度が高い特徴量変数を残すような処理を施してもよい。これによって、同一の説明変数から派生した特徴量変数が複数存在する状態を防ぐことができ、多重共線性の発生を防ぎやすくなる。このような処理を
図7の特徴量評価テーブルに施した結果の例を
図8に示す。図中の横実線は、除外された特徴量変数を示している。
【0081】
このように、情報処理装置101は、特徴量絞込み処理を行うことで、予測モデルの生成における有効な特徴量の候補として、数が絞り込まれた一覧を得ることができる。
【0082】
S509では、情報処理装置101は、得られた特徴量候補テーブル1026を用いて、使用者に対して特徴量変数の候補の一覧を提示する。
【0083】
図9は、使用者に提示される画面901(GUI:Graphical User Interface)の一例を示す図である。
【0084】
画面901は、特徴量候補テーブル1026の一部または全部の内容を示すテーブル902と、どの特徴量変数を予測モデルに使用するかを選択する選択ボックス903とを備える。選択ボックス903にチェックがなされた特徴量変数を以後の処理に使用する。画面901は、ディスプレイに表示され、選択ボックス903への入力は、マウス、キーボード等を介して行われる。
【0085】
画面901右上の領域には、特徴量変数の選択状況に応じて表示内容が変わる情報窓904が表示される。
【0086】
「選択済みの特徴量変数」には、現在選択済みの特徴量変数の数が示される。
【0087】
「収束性が高い特徴量変数」には、収束性の評価項目が一定の閾値(例えば、「85」)以上である特徴量変数の数が表示される。本例では、sub id「60-b」の特徴量変数の収束性が「95」であることから、本内容が1個の表示になっている。このように、選択した特徴量変数群の中に収束性が高い特徴量変数が何個存在しているかが、使用者が変数選択を行っている際にリアルタイムに表示される。よって、使用者は、自身の目的に応じて、適切な変数選択を行うことが可能となる。使用者自身の目的としては、設定値の変更に感度が高い予測モデルが欲しいため、収束性が高い特徴量変数を多めに選びたい、感度が高いというよりは、予測の精度を重視した予測モデルが欲しいため、収束性が高い特徴量変数を1つ含めればよい、等がある。
【0088】
「類似度が高い特徴量の組み合わせ」には、互いの類似度が高い特徴量変数の組み合わせの数が表示される。本例では、類似度が高い特徴量変数同士であるsub id「1-a」と「3-a」との特徴量変数が選択されているため、本内容が1個の表示になっている。このように、現在選択中の特徴量変数の中に似た傾向を持つ特徴量変数が存在しているかどうかがリアルタイムに表示される。よって、使用者は、多重共線性の発生を防ぎながら変数選択を行うことが容易になる。
【0089】
さらに、テーブル902では、類似度が高い特徴量変数同士において因果性(親であるか、子であるか)の情報を併せて表示している。よって、使用者は、自身の目的(多重共線性を防ぐため、類似度が高い特徴量変数は除きたいが、制御がしやすい親側の特徴量変数を優先して選択したい、等)に沿って、そのような特徴量変数の候補の中から最適な特徴量変数を容易に選択することが可能となる。
【0090】
なお、本実施の形態では、GUIを用いて使用者の選択結果を受け取る方法について説明したが、本実施の形態は、この方法に限定して適用されるものではない。例えば、情報処理装置101は、特徴量候補テーブル1026の内容の一部または全部を記載したファイルを出力する。使用者は、当該ファイルに対して選択の操作内容を反映させた新たなファイルを作成し、情報処理装置101に入力する。情報処理装置101は、新たなファイルを入力し、選択結果を受け取る。
【0091】
また、本例では、使用者による選択操作を想定したが、使用者による選択操作を一切行わずに、情報処理装置101において自動で実施するような構成としてもよい。この場合、上述の説明で使用者に選択を委ねていた基準をあらかじめ入力しておく。より具体的には、最終的に選択される特徴量変数の中に収束性が高い特徴量変数を何個含んでおくか、類似度が高い特徴量変数の組み合わせが発生した場合に、親または子のどちらを優先して選択するか、等である。このように、使用者が重視する選択の判断基準をあらかじめ指定できるようにすることで、自動での変数選択を行うことが可能となり、予測モデルの生成に関する作業工数を大幅に削減することができる。
【0092】
S510では、情報処理装置101は、S509によって、どの特徴量変数が選択されたかが決定された後、変数選択の結果(選択結果)を取得する。
【0093】
S511では、情報処理装置101は、取得した変数選択の結果の情報をもとに、特徴量生成後学習データ1023に対して特徴量加工処理(ここでは変数選択の処理)を施し、特徴量加工後学習データ1024を得る。
【0094】
なお、他の特徴量加工処理として、複数の特徴量変数を合成し、新たな特徴量変数を生成するような処理を本処理で行ってもよい。例えば、PCA(Principal Component Analysis)、ICA(Independent Component Analysis)、NMF(Non-Negative Matrix Factorization)等のアルゴリズムである。情報処理装置101は、このような処理を行うことで、より少ない特徴量数で有効な予測モデルを生成することができる場合がある。この場合、全ての説明変数を合成すると、物理量として理解可能で制御が可能な説明変数が失われてしまうため、情報処理装置101は、あらかじめ制御性の高い説明変数等を除外して本処理を実行してもよい。
【0095】
S512では、情報処理装置101は、得られた特徴量加工後学習データ1024に対して、目的変数を予測する予測モデルを機械学習によって生成する。
【0096】
情報処理装置101が用いる機械学習のアルゴリズムは、特に限定されるものではない。ただし、作られたモデルの解釈性を考慮すると、当該アルゴリズムとしては、線形回帰型のアルゴリズムが適している。当該アルゴリズムとしては、重回帰分析、Ridge回帰、Lasso回帰、Elastic Net等が用いられる。これらのアルゴリズムで生成された予測モデルは、学習データの各特徴量変数の値の重み付き線形結合の形で表されるため、予測モデルを用いたプラントの生産性の向上等の業務改善に、直感的に利用がしやすい。
【0097】
また、予測モデルの生成に非線形型のアルゴリズム(Neural Network、Random Forest、 Gradient Boosting Machine等)を用い、予測モデルの予測値と特徴量変数との関係性を示すLIME、SHAP等のXAI(Explainable AI)技術等と組み合わせてもよい。これによって、線形回帰型のアルゴリズムよりも予測の精度が高い予測モデルが得られ、かつ予測値と特徴量変数との関係性も解釈することが可能となる。
【0098】
S513では、情報処理装置101は、S512で生成された予測モデルに対し、モデルの評価を実施する。予測モデルの評価には、学習データに用いなかったサンプルを評価用データとして、予測モデルによって予測された値と、評価用サンプルの目的変数の値との差分(誤差)を尺度とした予測の精度を用いる。当該誤差については、例えば、MAE(Mean Absolute Error)等が挙げられるが、これに限定されるものではない。
【0099】
さらに、予測モデルの評価指標として予測モデルを構成する特徴量変数の中に、収束性が高い特徴量変数がどれくらい含まれているかどうかの尺度を含むようにしてもよい。より具体的には、単純に予測モデルの構築時に使用する特徴量変数の中に収束性が高いものが何個含まれているかとしてもよいし、予測モデルにおける当該特徴量変数の重み(例えば、線形回帰モデルであれば全特徴量変数の係数に対する比率等)をその予測モデルの評価値としてもよい。このように、予測モデルの予測の精度に加えて、収束性の特徴量変数に関する指標も評価することで、予測モデルを用いたプラントの生産性の向上等の業務改善に用いる際に、使用者は、より適した予測モデルを使用することができる。S513の処理をもって、予測モデル生成処理は、終了する(S514)。
【0100】
以上で説明した情報処理装置を用いることで、プラントにおける生産性の改善等への活用を前提とし、使用者が理解可能な予測モデルを構築する際の、予測モデルの生成に関わる作業を支援することが可能となる。
【0101】
(2)付記
上述の実施の形態には、例えば、以下のような内容が含まれる。
【0102】
上述の実施の形態においては、本発明を情報処理装置に適用するようにした場合について述べたが、本発明はこれに限らず、この他種々のシステム、装置、方法、プログラムに広く適用することができる。
【0103】
また、上述の実施の形態においては、情報処理装置101(コンピュータ)は、ノートパソコン、サーバ装置、タブレット端末等であり、CPU(Central Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)、HDD(Hard Disk Drive)、通信部等を含んで構成されていてもよい。
【0104】
情報処理装置101の機能(制御部107等)は、例えば、CPUがROMに格納されたプログラムをRAMに読み出して実行すること(ソフトウェア)により実現されてもよいし、専用の回路等のハードウェアにより実現されてもよいし、ソフトウェアとハードウェアとが組み合わされて実現されてもよい。また、情報処理装置101の機能の一部は、情報処理装置101と通信可能な他のコンピュータにより実現されてもよい。
【0105】
情報処理装置101は、上記の機能に加えて、例えば、オペレーティングシステム、デバイスドライバ、ファイルシステム、DBMS(DataBase Management System)等の機能を更に備えていてもよい。
【0106】
また、上述の実施の形態において、各テーブルの構成は一例であり、1つのテーブルは、2以上のテーブルに分割されてもよいし、2以上のテーブルの全部または一部が1つのテーブルであってもよい。
【0107】
また、上述の実施の形態において、説明の便宜上、XXテーブル、XXファイルを用いて各種のデータを説明したが、データ構造は限定されるものではなく、XX情報等と表現してもよい。
【0108】
また、上述の実施の形態において、情報の出力は、ディスプレイへの表示に限るものではない。情報の出力は、スピーカによる音声出力であってもよいし、ファイルへの出力であってもよいし、印刷装置による紙媒体等への印刷であってもよいし、プロジェクタによるスクリーン等への投影であってもよいし、その他の態様であってもよい。
【0109】
また、上述の実施の形態において示した画面は、一例であり、受け付ける情報が同じであればどのような画面デザインであってもよい。例えば、各パラメータの名称をタイトル行にもち、各行が個々のパラメータの入力セルとなっているような表計算シート状の画面デザインであってもよい。また、画面は、ファイルの入力を受け付けるインタフェイスを持ち、指定されたファイルの情報を基に画面の内容を更新してもよい。
【0110】
また、上記の説明において、各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、SSD(Solid State Drive)、USB(Universal Serial Interface)等の記憶装置、または、ICカード、SDカード、DVD(Digital Versatile Disc)等の記録媒体に置くことができる。
【0111】
上述した実施の形態は、例えば、以下の特徴的な構成を備える。
【0112】
情報処理装置(例えば、情報処理装置101)は、プラント(例えば、プラント201)で計測されたデータのうち、予測する対象である目的変数のデータと、上記目的変数を説明するための複数の説明変数のデータと(入力学習データ1021、時刻補正後学習データ1022、特徴量生成後学習データ1023等)をもとに、上記複数の説明変数の各々について、上記プラントの制御性を示す指標を算出する算出部を備える。算出部は、情報処理装置101、演算装置104、回路、特徴量評価部110等である。
【0113】
上記説明変数のデータは、上記プラントで計測されたデータであってもよいし、当該データが加工されたデータであってもよい。例えば、加工されたデータは、平均値、最大値、最小値、最大値と最小値との差、最頻値、中央値、標準偏差等の統計値であってもよい。また、例えば、加工されたデータは、所定の処理が行われたデータである特徴量変数のデータであってもよい。所定の処理が行われたデータとしては、移動平均化の処理が行われたデータ、一定期間における最大値/最小値のデータ、微分値のデータ等である。
【0114】
上記プラントの制御性を示す指標は、収束性、因果性等である。上記プラントの制御性を示す指標は、上記プラントで計測されたデータから算出されてもよいし、上記プラントで計測されたデータに対して所定の処理が行われたデータから算出されてもよい。
【0115】
上記情報処理装置は、更に、上記算出部により算出された指標に基づいて選択された説明変数のデータをもとに(例えば、特徴量加工後学習データ1024を用いて)、機械学習により上記目的変数を予測する予測モデル(例えば、予測モデル1027)を生成する生成部を備える。生成部は、情報処理装置101、演算装置104、回路、予測モデル生成部113等である。
【0116】
上記選択は、使用者による選択であってもよいし、あらかじめ指定された基準に従う情報処理装置101による選択であってもよい。
【0117】
上記構成では、制御性を示す指標に基づいて選択された説明変数のデータをもとに、機械学習が行われるので、例えば、使用者がプラントを容易に制御可能な予測モデルを生成することができる。
【0118】
上記算出部は、上記複数の説明変数のうち、上記プラントの設定値が対応付けられている説明変数について、上記プラントの制御性を示す指標として、上記設定値が変更された際に、変更された設定値にどれくらい素早く上記説明変数に係る計測値が収束するかを示す収束性(例えば、収束性706)を算出する(
図5~
図7等を参照)。なお、収束性は、正規化されていてもよいし、正規化されていなくてもよい。
【0119】
上記構成では、収束性が算出されるので、例えば、使用者は、収束性が高い説明変数を選択することができ、使用者がプラントを素早く制御可能な予測モデルを生成できるようになる。
【0120】
上記算出部は、上記複数の説明変数のうち、所定の値より類似度が高い説明変数のデータが上記プラントにおける生産工程のどの工程で計測されたデータであるかを示す因果性(例えば、因果性708)を算出する(
図5、
図7等を参照)。なお、因果性は、正規化されていてもよいし、正規化されていなくてもよい。
【0121】
上記構成では、類似度が高い説明変数について因果性が算出されるので、例えば、使用者は、多重共線性を解消する際に、因果性を踏まえて説明変数を選択することができるようになる。
【0122】
上記情報処理装置は、更に、上記複数の説明変数のデータから、上記目的変数の予測に適した1以上の特徴量変数のデータを生成する処理(例えば、特徴量変数の生成処理(特徴量生成処理))を行う処理部を備える(例えば、S506参照)。処理部は、情報処理装置101、演算装置104、回路、特徴量生成部109等である。
【0123】
上記算出部は、上記処理部により生成された特徴量変数の各々について、上記プラントの制御性を示す指標を算出する。上記生成部は、上記算出部により算出された指標に基づいて選択された特徴量変数のデータをもとに、機械学習により上記目的変数を予測する予測モデルを生成する。
【0124】
上記構成では、説明変数のデータから、1以上の特徴量変数のデータが生成され、当該1以上の特徴量変数のデータが機械学習に用いられるので、予測モデルの精度を高めることができる。また、特徴量変数の各々について、制御性を示す指標が算出されるので、例えば、特徴量変数が多数あったとしても、使用者は、制御性を示す指標に基づいて、機械学習に用いる特徴量変数を適切に選択することができる。
【0125】
上記情報処理装置には、上記プラントで計測されたデータを記憶する記憶装置が接続されている。記憶装置は、副記憶装置103であってもよい。記憶装置は、NW I/F105に接続された他のコンピュータであってもよい。記憶装置は、入出力I/F106に接続された記憶装置(USB、DVD等)であってもよい。
【0126】
上記情報処理装置は、更に、上記複数の説明変数の各々について、上記記憶装置に記憶されているデータのうち上記目的変数と相関が最も高い1つのデータ(例えば、PV0_iを除く説明変数PVN_iがPV’N_iに置き換わったデータ)を特定する特定部を備える(例えば、S505参照)。特定部は、情報処理装置101、演算装置104、回路、時刻情報補正部108等である。
【0127】
上記算出部は、上記複数の説明変数の各々について、上記特定部により特定されたデータを用いて、上記プラントの制御性を示す指標を算出する。上記生成部は、上記算出部により算出された指標に基づいて選択された説明変数のデータであって、前記特定部により特定されたデータをもとに、機械学習により上記目的変数を予測する予測モデルを生成する。
【0128】
上記構成では、目的変数と相関が最も高いデータをもとに、指標の算出および機械学習が行われるので、例えば、使用者がプラントを制御可能な予測モデルをより精度よく生成することができる。
【0129】
上記算出部は、上記目的変数の予測の精度を示す指標を算出する。
【0130】
上記情報処理装置は、更に、上記複数の説明変数の各々について、上記算出部により算出された上記目的変数の予測の精度を示す指標と、上記算出部により算出された上記プラントの制御性を示す指標とを対応付けて出力する出力部を備える(例えば、
図9参照)。
【0131】
出力される情報は、貢献度、類似度等に基づいて、説明変数(特徴量変数)の絞込みが行われていてもよいし、説明変数の絞込みが行われていなくてもよい。
【0132】
出力部は、情報処理装置101、演算装置104、回路、制御部107等である。出力については、ディスプレイへの表示であってもよいし、ファイルへの出力であってもよいし、その他の出力であってもよい。
【0133】
上記情報処理装置は、更に、上記出力部による出力をもとに上記目的変数の予測に用いる説明変数が使用者により選択された情報を入力する入力部を備える。入力部は、情報処理装置101、演算装置104、回路、制御部107等である。例えば、入力部は、入力装置を介して使用者による選択を受け付ける。
【0134】
上記生成部は、上記入力部により入力された情報に基づいて、上記使用者により選択された説明変数のデータをもとに、機械学習により上記目的変数を予測する予測モデルを生成する。
【0135】
上記構成では、例えば、使用者は、予測の精度を示す指標と、制御性を示す指標とを把握することができ、目的に応じて説明変数を選択することができる。これにより、使用者は、予測の精度が高く、かつ、制御性が高い予測モデルを使用できるようになる。
【0136】
また上述した構成については、本発明の要旨を超えない範囲において、適宜に、変更したり、組み替えたり、組み合わせたり、省略したりしてもよい。
【0137】
「A、B、およびCのうちの少なくとも1つ」という形式におけるリストに含まれる項目は、(A)、(B)、(C)、(AおよびB)、(AおよびC)、(BおよびC)または(A、B、およびC)を意味することができると理解されたい。同様に、「A、B、またはCのうちの少なくとも1つ」の形式においてリストされた項目は、(A)、(B)、(C)、(AおよびB)、(AおよびC)、(BおよびC)または(A、B、およびC)を意味することができる。
【符号の説明】
【0138】
101……情報処理装置。