特許7491724 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社　日立産業制御ソリューションズの特許一覧

特許7491724情報処理装置および情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6A
6B
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-05-20

(45)【発行日】2024-05-28

(54)【発明の名称】情報処理装置および情報処理方法

(51)【国際特許分類】

G06Q 50/04 20120101AFI20240521BHJP

G06N 20/00 20190101ALI20240521BHJP

【ＦＩ】

G06Q50/04

G06N20/00

【請求項の数】 4

(21)【出願番号】P 2020075823

(22)【出願日】2020-04-22

(65)【公開番号】P2021174125

(43)【公開日】2021-11-01

【審査請求日】2023-01-11

(73)【特許権者】

【識別番号】000153443

【氏名又は名称】株式会社日立産業制御ソリューションズ

(74)【代理人】

【識別番号】110002365

【氏名又は名称】弁理士法人サンネクスト国際特許事務所

(72)【発明者】

【氏名】高田晋太郎

(72)【発明者】

【氏名】佐藤江里子

(72)【発明者】

【氏名】鯨井俊宏

【審査官】青柳光代

(56)【参考文献】

【文献】特開２０１８－１６３６２２（ＪＰ，Ａ）

【文献】特開２０１９－１９７３１５（ＪＰ，Ａ）

【文献】特開２０２０－０４７２３０（ＪＰ，Ａ）

【文献】特開平１０－１８７２２６（ＪＰ，Ａ）

【文献】特開２０１５－１７２９４５（ＪＰ，Ａ）

【文献】特開２０１９－０８２９４３（ＪＰ，Ａ）

【文献】特開２０１９－０４９８５０（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

Ｇ０６Ｎ２０／００

(57)【特許請求の範囲】

【請求項1】

複数の装置から構成され当該複数の装置による生産処理より材料から製品を生産するプラントで計測されたデータのうち、予測する対象である目的変数を説明するための複数の説明変数のデータから、前記目的変数の予測に適した複数の特徴量変数のデータを生成する処理を行う処理部と、
前記複数の特徴量変数の各々について、前記プラントの制御性を示す指標を算出する算出部と、
前記算出部により算出された指標に基づいて選択された特徴量変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する生成部と、
を備え、
前記複数の装置は、前記製品を出力する第１の装置と、前記第１の装置以外の複数の第２の装置とで構成され、
前記処理部は、前記複数の第２の装置の各々について、当該第２の装置を材料が通過して前記第１の装置に到達するまでの時間差を特定し、特定された時間差を基に、当該第２の装置に対応した説明変数を、材料が前記第１の装置に到達すると予想される時刻における値に変換する補正処理を行い、
前記複数の特徴量変数は、前記補正処理が施された複数の説明変数から変換されたものであり、
前記算出部は、前記複数の特徴量変数のうち、前記プラントの設定値が対応付けられている特徴量変数について、前記プラントの制御性を示す指標として、前記設定値が変更された際に、変更された設定値にどれくらい素早く前記特徴量変数に係る計測値が収束するかを示す収束性を算出し、
前記算出部は、前記複数の特徴量変数のうち、所定の値より類似度が高い特徴量変数のデータが前記プラントにおける生産工程のどの工程で計測されたデータであるかを示す因果性を算出し、
前記算出部は、前記複数の特徴量変数のうちの評価対象の特徴量変数と前記目的変数との相関値であり、当該評価対象の特徴量変数が前記目的変数の予測において貢献する貢献度を算出し、
前記算出部は、前記評価対象の特徴量変数のうちの前記評価対象の特徴量変数以外の各特徴量変数について、当該特徴量変数と前記評価対象の特徴量変数との相関値であり、当該特徴量変数の前記評価対象の特徴量変数との類似度を算出する、
情報処理装置。

【請求項2】

前記プラントで計測されたデータを記憶する記憶装置が接続され、
前記複数の特徴量変数の各々について、前記記憶装置に記憶されているデータのうち前記目的変数と相関が最も高い１つのデータを特定する特定部を備え、
前記算出部は、前記複数の特徴量変数の各々について、前記特定部により特定されたデータを用いて、前記プラントの制御性を示す指標を算出し、
前記生成部は、前記算出部により算出された指標に基づいて選択された特徴量変数のデータであって、前記特定部により特定されたデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する、
請求項１に記載の情報処理装置。

【請求項3】

前記算出部は、前記目的変数の予測の精度を示す指標を算出し、
前記複数の特徴量変数の各々について、前記算出部により算出された前記目的変数の予測の精度を示す指標と、前記算出部により算出された前記プラントの制御性を示す指標とを対応付けて出力する出力部と、
前記出力部による出力をもとに前記目的変数の予測に用いる特徴量変数が使用者により選択された情報を入力する入力部と、を備え、
前記生成部は、前記入力部により入力された情報に基づいて、前記使用者により選択された特徴量変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する、
請求項１に記載の情報処理装置。

【請求項4】

（Ａ）処理部が、複数の装置から構成され当該複数の装置による生産処理より材料から製品を生産するプラントで計測されたデータのうち、予測する対象である目的変数を説明するための複数の説明変数のデータから、前記目的変数の予測に適した複数の特徴量変数のデータを生成する処理を行うことと、
（Ｂ）算出部が、前記複数の特徴量変数の各々について、前記プラントの制御性を示す指標を算出することと、
（Ｃ）生成部が、前記算出部により算出された指標に基づいて選択された特徴量変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成することと、
を含む情報処理方法であって、
前記複数の装置は、前記製品を出力する第１の装置と、前記第１の装置以外の複数の第２の装置とで構成され、
（Ａ）において、前記生成部は、前記複数の第２の装置の各々について、当該第２の装置を材料が通過して前記第１の装置に到達するまでの時間差を特定し、特定された時間差を基に、当該第２の装置に対応した説明変数を、材料が前記第１の装置に到達すると予想される時刻における値に変換する補正処理を行い、
前記複数の特徴量変数は、前記補正処理が施された複数の説明変数から変換されたものであり、
（Ｂ）において、前記算出部は、前記複数の特徴量変数のうち、前記プラントの設定値が対応付けられている特徴量変数について、前記プラントの制御性を示す指標として、前記設定値が変更された際に、変更された設定値にどれくらい素早く前記特徴量変数に係る計測値が収束するかを示す収束性を算出し、
（Ｂ）において、前記算出部は、前記複数の特徴量変数のうち、所定の値より類似度が高い特徴量変数のデータが前記プラントにおける生産工程のどの工程で計測されたデータであるかを示す因果性を算出し、
（Ｂ）において、前記算出部は、前記複数の特徴量変数のうちの評価対象の特徴量変数と前記目的変数との相関値であり、当該特徴量変数が前記目的変数の予測において貢献する貢献度を算出し、
（Ｂ）において、前記算出部は、前記評価対象の特徴量変数のうちの前記評価対象の特徴量変数以外の各特徴量変数について、当該特徴量変数と前記評価対象の特徴量変数との相関値であり、当該特徴量変数の前記評価対象の特徴量変数との類似度を算出し、
前記算出部、前記処理部、及び、前記生成部は、情報処理装置の構成要素である、
情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、概して、予測モデルの生成に関する。

【背景技術】

【0002】

近年、原料を加工する工場等であるプラントにおける特定の製品の生産についての歩留まり改善、生産性の向上等の業務改善に予測モデルを活用する動きが盛んである。予測モデルは、特定の製品の品質値等を予測するモデルであり、機械学習を用いて生成される。予測モデルでは、特定の製品の生産工程の各装置における各種の計測値を蓄積したデータが学習データとされている。

【0003】

例えば、学習データにおける特徴量変数のベクトルに対し、目的変数の予測に有用な基底関数の写像方法を評価、採用し、機械学習を行うことで、精度が高い予測モデルの自動構築を行うことが可能な情報処理装置が開示されている（特許文献１参照）。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１２－２２４９８号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１のように、学習データの各特徴量変数に対して、目的変数の予測に有用な写像を行う基底関数を適用して機械学習を行うことで、精度の高い予測モデルを自動で生成することが可能となる。

【0006】

一方で、プラント等で計測されたデータから特定の特徴量変数の値を予測する予測モデルが生成され、当該予測モデルを生産性の向上等に活かすような場合がある。この場合、予測モデルの使用者は、予測モデルから得られた予測値と生産品の目標値との乖離を確認する。そして、使用者は、どの特徴量変数を現在の値からどのように変更して制御すべきかを調べる等して、生産現場での改善を行う。したがって、予測モデルを構成する特徴量変数は、使用者がプラントを制御し易い特徴量変数であることが望ましい。

【0007】

しかしながら、特許文献１には、使用者がプラントを制御し易い特徴量変数の選択方法については、開示されていない。

【0008】

本発明は、以上の点を考慮してなされたもので、プラントの制御性がよい予測モデルを生成し得る情報処理装置等を提案しようとするものである。

【課題を解決するための手段】

【0009】

かかる課題を解決するため本発明においては、プラントで計測されたデータのうち、予測する対象である目的変数のデータと、前記目的変数を説明するための複数の説明変数のデータとをもとに、前記複数の説明変数の各々について、前記プラントの制御性を示す指標を算出する算出部と、前記算出部により算出された指標に基づいて選択された説明変数のデータをもとに、機械学習により前記目的変数を予測する予測モデルを生成する生成部と、を設けるようにした。

【0010】

上記構成では、制御性を示す指標に基づいて選択された説明変数のデータをもとに、機械学習が行われるので、例えば、使用者がプラントを容易に制御可能な予測モデルを生成することができる。

【発明の効果】

【0011】

本発明によれば、プラントの制御性がよい予測モデルを生成することができる。

【図面の簡単な説明】

【0012】

【図1】第１の実施の形態による情報処理装置に係る構成の一例を示す図である。

【図2】第１の実施の形態によるプラントにおける生産工程の流れを模式化した模式図である。

【図3】第１の実施の形態による計測値テーブルの一例を示す図である。

【図4】第１の実施の形態による入力学習データの一例を示す図である。

【図5】第１の実施の形態による予測モデル生成処理の一例を示す図である。

【図6A】第１の実施の形態による設定値の時系列データの一例を示す図である。

【図6B】第１の実施の形態による計測値の時系列データの一例を示す図である。

【図7】第１の実施の形態による特徴量評価テーブルの一例を示す図である。

【図8】第１の実施の形態による特徴量候補テーブルの一例を示す図である。

【図9】第１の実施の形態による画面の一例を示す図である。

【発明を実施するための形態】

【0013】

（１）第１の実施の形態
以下、本発明の一実施の形態を詳述する。本実施の形態では、使用者がプラントを制御し易い予測モデルの生成方法に関して説明する。

【0014】

プラントは、エネルギー（電気、ガス、上水等）、化学製品（ガソリン、プラスチック等）、食品、医薬品といった製品を製造する機器、装置、設備、工場等である。

【0015】

本実施形態に示す情報処理装置では、プラントで計測されたデータを記憶する。当該データには、予測する対象である目的変数のデータと、目的変数を説明するための複数の説明変数のデータとが含まれる。情報処理装置は、プラントで計測されたデータをもとに機械学習を用いて目的変数を予測する予測モデルを生成する。

【0016】

ここで、予測モデルを構成する説明変数は、物理量として理解可能な説明変数であることが望ましい。機械学習のアルゴリズムについては、線形回帰式等、目的変数と説明変数との関係性が解釈可能なアルゴリズムであることが望ましい。予測モデルについては、使用者による理解が容易あることが望ましい。

【0017】

よって、本実施の形態では、プラントにおける生産性の改善等への活用を前提とし、使用者によるプラントの制御が容易であり、かつ、理解が容易な予測モデルを構築する方法について説明する。

【0018】

例えば、情報処理装置は、予測対象となる目的変数と、目的変数と何らかの関連がある複数の説明変数と、データサンプルに一意な時刻情報を与える時間変数とを列要素とし、それらの各変数に何らかの値を持つデータサンプルを行の１要素とするデータ集合を学習データとして入力する。

【0019】

情報処理装置は、上記学習データにおける各説明変数について、目的変数を予測する際の予測の精度に関わる１つ以上の評価指標と、プラントの制御性に関わる１つ以上の評価指標の評価を行う。

【0020】

情報処理装置は、与えられた学習データを用いて目的変数を予測する予測モデルを機械学習によって生成する。より具体的には、情報処理装置は、上記学習データにおける説明変数の中から、上記予測の精度に関わる評価指標群の中から少なくとも１つ以上の指標に基づいて説明変数の選択を行う。また、情報処理装置は、上記学習データにおける説明変数の中から、上記制御性に関わる評価指標群の中から少なくとも１つ以上の指標に基づいて説明変数の選択を行う。情報処理装置は、変数選択を行った学習データに対して予測モデルを生成する。なお、情報処理装置は、予測モデルの生成に関わる使用者の作業を支援する構成を備えてもよい。

【0021】

上記構成によれば、使用者がプラントを制御し易い予測モデルを生成することができる。

【0022】

次に、本発明の実施形態を図面に基づいて説明する。ただし、本発明は、実施の形態に限定されるものではない。

【0023】

［構成の説明］
図１において、１０１は、全体として第１の実施の形態による情報処理装置を示す。図１は、情報処理装置１０１に係る構成の一例を示す図である。

【0024】

情報処理装置１０１は、ハードウェア構成として、主記憶装置１０２、副記憶装置１０３、演算装置１０４、ネットワークインタフェイス（ＮＷＩ／Ｆ）１０５、および入出力Ｉ／Ｆ１０６を備える。各ハードウェア構成は、内部バスを介して互いに接続されている。

【0025】

主記憶装置１０２は、ＤＲＡＭ（Dynamic Random Access Memory）等のメモリである。主記憶装置１０２は、演算装置１０４が実行するプログラムおよびプログラムが使用する情報を格納する。なお、主記憶装置１０２は、揮発性の記憶素子から構成されてもよいし、不揮発性の記憶素子から構成されてもよい。主記憶装置１０２に格納されるプログラムおよび情報については後述する。

【0026】

副記憶装置１０３は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）等である。副記憶装置１０３は、データを永続的に格納する。主記憶装置１０２に格納されるプログラムおよび情報は、副記憶装置１０３に格納されてもよい。この場合、演算装置１０４は、副記憶装置１０３からプログラムおよび情報を読み出し、主記憶装置１０２にロードし、ロードされたプログラムを実行する。

【0027】

演算装置１０４は、プロセッサ、ＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）等である。演算装置１０４は、主記憶装置１０２等に格納されるプログラムを実行する。

【0028】

ＮＷＩ／Ｆ１０５は、ネットワークを介して外部装置と通信する。入出力Ｉ／Ｆ１０６は、キーボード、マウス、タッチパネル等からデータを入力するための入力装置、および／または、スピーカ、ディスプレイ等にデータを出力するための出力装置と通信する。なお、情報処理装置１０１は、入力装置および／または出力装置を備えていてもよい。

【0029】

情報処理装置１０１が備えるソフトウェアモジュール（モジュール）として、制御部１０７、時刻情報補正部１０８、特徴量生成部１０９、特徴量評価部１１０、特徴量候補絞込み部１１１、特徴量加工部１１２、予測モデル生成部１１３、およびモデル評価部１１４を備える。これらのモジュールの実体（プログラム）は、主記憶装置１０２または副記憶装置１０３に格納され、情報処理装置１０１の起動時に読み込まれ、所定のデータ処理を実行するモジュールとして機能する。

【0030】

制御部１０７は、情報処理装置１０１の動作を制御するモジュールであり、各種のモジュールの動作を制御する。制御部１０７は、各種の入力を行う入力部の一例である。また、制御部１０７は、各種の出力を行う出力部の一例である。

【0031】

時刻情報補正部１０８は、特定部の一例であり、学習データに格納された値について時刻情報に関する補正処理を行う。例えば、特定部は、複数の説明変数の各々について、主記憶装置１０２または副記憶装置１０３に記憶されている学習データのうち目的変数と相関が最も高い１つのデータを特定する。

【0032】

特徴量生成部１０９は、処理部の一例であり、学習データの説明変数を用いて任意の処理を行い、特徴量変数を生成する処理を行う。例えば、処理部は、複数の説明変数のデータから、目的変数の予測に適した１以上の特徴量変数のデータを生成する処理を行う。

【0033】

特徴量評価部１１０は、算出部の一例であり、特徴量生成部１０９により生成された特徴量変数（特徴量）について様々な評価基準に基づいて評価を行う。例えば、算出部は、複数の説明変数の各々について、プラントの制御性を示す指標（後述の収束性、因果性等）を算出する。

【0034】

特徴量候補絞込み部１１１は、特徴量評価部１１０で算出された評価値（指標）に基づいて、機械学習に用いる学習データの特徴量変数の候補を絞り込む処理を行う。

【0035】

特徴量加工部１１２は、特徴量の選択、加工等の特徴量加工処理を行う。

【0036】

予測モデル生成部１１３は、生成部の一例であり、与えられた学習データに対して、目的変数の予測を行うことができる予測モデルを機械学習によって生成する。例えば、生成部は、使用者または自動的に選択された説明変数のデータをもとに、機械学習により目的変数を予測する予測モデルを生成する。

【0037】

モデル評価部１１４は、予測モデルに対して、予測の精度またはその他の観点において評価を行う。

【0038】

これらのモジュールの詳細な処理については後述する。

【0039】

情報処理装置１０１が処理する情報としては、入力学習データ１０２１、時刻補正後学習データ１０２２、特徴量生成後学習データ１０２３、特徴量加工後学習データ１０２４、特徴量評価テーブル１０２５、特徴量候補テーブル１０２６、および予測モデル１０２７がある。これらの情報は、主記憶装置１０２上で計算された後に、副記憶装置１０３に保存されるようにしてもよい。

【0040】

入力学習データ１０２１は、情報処理装置１０１で予測モデルの生成対象となる学習データである。入力学習データ１０２１は、ＮＷＩ／Ｆ１０５等を介して入力される。本実施の形態では、プラントにおける生産工程での各装置における各種の計測値を集計したものを学習データの例として説明を行う。なお、本実施の形態は、以下で例示するプラントにおけるデータに、適用範囲が限定されるものではない。

【0041】

図２は、本実施の形態が想定するプラントにおける生産工程の流れを模式化した模式図である。

【0042】

プラント２０１は、複数の装置から構成されている。プラント２０１では、基本的に、予め定められた装置（例えば、図面上の左から右の装置）へと製品の材料が流れていき、各装置を材料が通過する際に所定の生産処理が施されていく。ここでは、装置０において出力される物が目的とする製品である。それより前の工程にある装置は、一対一の関係のみならず、例えば、装置２のように複数の装置からの出力を受け入れるものも想定される。装置Ｎおよび装置Ｋは、本工程において最も上流（以下、「左端」と記す）に設置されるものであり、このような装置からは、製品の材料が投入されることが想定される。

【0043】

各装置には、計測器が設置されており、装置の状態、材料の状態等に関する種々の情報が記録される。例えば、計測器Ｎでは、計測時刻Ｔおよび計測値ＰＶ_Ｎ＿０，ＰＶ_Ｎ＿ｉ，・・・が記録される。計測時刻Ｔは、各計測器で共通の値である。各計測器では、通常、１分毎等の定期的なタイミングで計測が行われる。計測値ＰＶ_Ｎ＿ｉは、計測器Ｎにおけるｉ番目の計測項目の値であることを示す。計測項目は、装置間で必ずしも同じであるとは限らない。

【0044】

図３は、計測値テーブル３０１の一例を示す図である。計測値テーブル３０１では、各計測器における項目（変数ＰＶ）の内容を示す情報が記憶される。

【0045】

例えば、計測値テーブル３０１において、ＰＶ_０＿０は、計測器０における温度の計測値を示す。ＰＶ_０＿１は、計測器０における圧力の計測値を示す。ＰＶ_Ｎ＿０は、計測器Ｎにおける温度の計測値を示す。ＰＶ_Ｎ＿１は、計測器Ｎにおける温度の設定値を示す。設定値とは、装置に対して使用者が所望する値を設定値として指定するものである。例えば、設定値が指定される装置としては、装置で計測された温度が設定値に近づくようにフィードバック制御を行う機構が備えられた装置等が該当する。

【0046】

図４は、入力学習データ１０２１の一例を示す図である。入力学習データ１０２１は、図２および図３で説明したプラントの生産工程における各種の計測値を集計したデータである。

【0047】

入力学習データ１０２１は、各計測器において共通の値である計測時刻Ｔを基準に、一定の時刻毎に各計測器で計測された値を集計したテーブル形式で表現される。入力学習データ１０２１では、時刻毎にユニークな値であるｉｄが割り振られている。一の時刻の計測値が学習データにおける１サンプルに該当する。なお、本実施の形態においては、計測器０で計測された温度であるＰＶ_０＿０が予測モデルにおける目的変数であるとして説明する。以下では、ＰＶ_０＿０以外の計測値を説明変数と記す。

【0048】

時刻補正後学習データ１０２２は、入力学習データ１０２１の各説明変数の値に対して、時刻情報に関する補正を施したデータである。特徴量生成後学習データ１０２３は、時刻補正後学習データ１０２２の各説明変数に対して特徴量生成処理が施されて生成された特徴量変数の学習データである。特徴量加工後学習データ１０２４は、特徴量生成後学習データ１０２３に対して、特徴量変数の選択による削減処理等の特徴量加工処理が施されたデータである。情報処理装置１０１は、特徴量加工後学習データ１０２４を学習データとし、予測モデルを生成する。特徴量評価テーブル１０２５は、特徴量生成後学習データ１０２３における各特徴量変数に対して種々の評価が行われた結果が記されたデータである。特徴量候補テーブル１０２６は、特徴量評価テーブル１０２５の中でも各種評価値が高いものが選択され、絞り込まれたデータである。予測モデル１０２７は、情報処理装置１０１により生成された予測モデルである。なお、主記憶装置１０２で取り扱う、各種データ、テーブルの詳細については後述する。

【0049】

［処理の説明］
情報処理装置１０１の動作について、図５に示す処理フローを用いて説明する。図５は、情報処理装置１０１が学習データを取得して予測モデルを生成するまでの処理（予測モデル生成処理）の一例を示す図である。

【0050】

まず、使用者による操作に応じて予測モデル生成処理が開始され（Ｓ５０１）、情報処理装置１０１は、副記憶装置１０３に格納されている学習データを、主記憶装置１０２に読込み、入力学習データ１０２１を取得する（Ｓ５０２）。

【0051】

Ｓ５０３では、情報処理装置１０１は、入力学習データ１０２１の各種の説明変数について、どの説明変数がどの装置における設定値に該当するかを判定するための情報を取得する。本処理の具体例の１つとして、まず、情報処理装置１０１は、入出力Ｉ／Ｆ１０６を介して、説明変数の一覧と、それらが設定値に該当するかどうかのチェックボックスを備えたテーブル等をディスプレイに表示する。続いて、どの説明変数が設定値に該当するかのチェックが使用者により付けられた後、情報処理装置１０１は、チェックの結果を取り込む。情報処理装置１０１は、これらの処理を行うことによって本処理を実現する。

【0052】

また、その他の例として、情報処理装置１０１は、説明変数の一覧と、各説明変数が設定値に該当するかどうかの項目に特定の値（例えば、値「１」等）が付与されたテーブルを格納したファイルを、学習データの取り込み時に同時に取り込むようにしてもよい。これによって、使用者は、あらかじめ、どの説明変数がどの設定値に該当するかを準備することができ、予測モデルの生成時における作業を軽減することができる。

【0053】

Ｓ５０４では、情報処理装置１０１は、Ｓ５０５にて後述する時刻情報補正処理に必要な情報を取得する。図２に示すような、プラントにおける生産工程において、情報処理装置１０１は、目的変数が計測される装置０と、その他の装置との関係性に関する情報を取得する。より具体的には、関係性に関する情報は、装置０とその他の任意の装置Ｎとの距離Ｌ_Ｎの値、および、材料が装置間を流れる速度ｖの値である。事前の知識として、材料が装置Ｎを通過して装置０に到達するまでの時間ΔＴ_Ｎが把握できているような場合には、情報処理装置１０１は、時間ΔＴ_Ｎを情報として取得してもよい。

【0054】

また、情報処理装置１０１は、その他の情報として、図２における装置２のように、複数の装置の出力が合流するような装置であるかどうか、装置Ｋ等のように、生産工程の左端に位置する装置であるかどうかを情報として入力してもよい。

【0055】

Ｓ５０５では、情報処理装置１０１は、入力学習データ１０２１に対して、時刻情報補正処理を施し、時刻補正後学習データ１０２２を生成する。本処理では、まず、情報処理装置１０１は、Ｓ５０４で取得した情報をもとに、材料が装置Ｎを通過して装置０に到達するまでの時間ΔＴ_Ｎを装置毎に算出する。より具体的には、情報処理装置１０１は、ΔＴ_Ｎ＝Ｌ_Ｎ／ｖの式によってΔＴ_Ｎを求める。情報処理装置１０１は、このようにして得られたΔＴ_Ｎを用いて、各種の説明変数ＰＶ_Ｎ＿ｉの値を、装置０に到達が予想される時刻における値に変換する処理を行う。より具体的には、情報処理装置１０１は、以下の式によって変換を行う。

【0056】

ＰＶ’_Ｎ＿ｉ（ｔ）＝ＰＶ_Ｎ＿ｉ（ｔ－ΔＴ_Ｎ）
変数ｔは、任意の時刻インデックスであり、例えば、図４におけるＴの任意の値が該当する。

【0057】

この変換によって、各装置（例えば、装置Ｎ）で計測された各種の計測値は、装置０にΔＴ_Ｎ後に到達し、そのまま影響を与えるという仮定のもと、装置０を基準とした同じ時間軸に全ての計測値を置き換えることができる。

【0058】

したがって、時刻補正後学習データ１０２２は、ＰＶ_０＿ｉを除く説明変数ＰＶ_Ｎ＿ｉがＰＶ’_Ｎ＿ｉに置き換わったものになる。これによって、学習データの各ｉｄにおける１行の値をもとに目的変数を予測する際において、目的変数と各説明変数とは、最も影響を与えると考えられる関係性を持っていることが期待できる。

【0059】

なお、ΔＴ_Ｎに関しては、外部から与えられた情報からではなく、取得した学習データから算出されるような構成としてもよい。より具体的には、情報処理装置１０１は、目的変数とＰＶ_Ｎ＿ｉの特定のｉの説明変数との相互相関を求め、最も相関が高くなるようなΔＴ_Ｎを求める。これによって、装置０と他装置との距離、その他の要因等で、材料が移動する速度が一定でなかったりするような場合でも、各装置で適したΔＴ_Ｎを定めることが可能となる。

【0060】

Ｓ５０６では、情報処理装置１０１は、Ｓ５０５で得られた時刻補正後学習データ１０２２をもとに、特徴量変数の生成処理（特徴量生成処理）を行い、特徴量生成後学習データ１０２３を生成する。特徴量変数の生成処理は、ＰＶ’_Ｎ＿ｉをもとにして目的変数を予測するのに適した特徴量変数に変換を行う処理である。特徴量変数の生成処理の例として、移動平均化の処理、一定期間における最大値／最小値の算出、微分値の算出等が挙げられるが、これら以外の処理を適用してもよい。以後では、ＰＶ’_Ｎ＿ｉをもとにして生成された特徴量変数をＰＶ’_{Ｎ＿ｉ＿ｆ}で記すものとする。インデックスｆは、上述したような変換処理の種類に対応する。

【0061】

Ｓ５０７では、情報処理装置１０１は、特徴量生成後学習データ１０２３をもとに、各特徴量変数に対して特徴量評価処理を実行し、特徴量評価テーブル１０２５を生成する。特徴量評価処理は、様々な観点で、特徴量の評価を行う処理であり、本実施の形態では、貢献度、類似度、収束性、および因果性の４つの観点で評価を行う。

【0062】

＜貢献度＞
貢献度は、評価対象の特徴量変数が目的変数の予測においてどれくらい貢献するかを指標化（評価）したものである。より具体的には、貢献度として、目的変数と特徴量変数との相関値等を適用する。

【0063】

＜類似度＞
類似度は、評価対象の特徴量変数と当該特徴量変数以外の各特徴量変数との類似性を指標化したものである。より具体的には、類似度として、互いの特徴量変数の相関値等を適用する。類似度を評価することによって、予測モデルを生成する際に、同じ性質を持つ複数の説明変数が存在することで発生する多重共線性を防ぐための変数選択を行うことができる。

【0064】

＜収束性＞
収束性は、評価対象の特徴量変数、または当該特徴量変数の生成元となった説明変数に関して、対応する計測値に変化が生じた場合に、どれくらい素早く設定された値に計測値が収束するかを指標化したものである。より具体的には、情報処理装置１０１は、ある装置の項目に対する設定値と、当該項目に対応する計測値の特徴量変数の学習データを解析することで算出を行う。

【0065】

図６Ａは、装置Ｎの温度の設定値ＰＶ’_Ｎ＿１に対応した時系列データ６０１の一例を示す図である。図６Ｂは、装置Ｎの温度の計測値ＰＶ’_Ｎ＿０に対応した時系列データ６０２の一例を示す図である。図６Ａおよび図６Ｂを用いて収束性の算出方法の具体例を説明する。なお、ＰＶ’_Ｎ＿１は、装置Ｎにおける温度の設定値であり、温度の計測値であるＰＶ’_Ｎ＿０は、設定値にできるだけ近い値であることが望ましい。

【0066】

収束性は、設定値が変更された際にどれくらい素早く変更後の設定値に収束していくかを示す指標である。情報処理装置１０１は、実際の計測値であるＰＶ’_Ｎ＿０を解析して収束性を算出する。より具体的には、情報処理装置１０１は、設定値が変更されたタイミングでＰＶ’_Ｎ＿０が収束したと思われるまでに要した時間を収束性の値とする。

【0067】

図６Ｂに示す例では、情報処理装置１０１は、時刻がｔ＿ｃｈａｎｇｅのタイミングで設定値の変更がなされ、時刻Ｔ＿ｓｔａｂｌｅのタイミングで収束段階になったと判断する。この場合、情報処理装置１０１は、収束性の値として、ｔ＿ｓｔａｂｌｅ－ｔ＿ｃｈａｎｇｅを算出する。情報処理装置１０１は、ｔ＿ｓｔａｂｌｅの時刻を、ＰＶ’_Ｎ＿０が一定の期間中に取り得る値が一定の閾値内に収まっているかどうかで判断する。

【0068】

情報処理装置１０１は、収束性の算出を解析対象の時系列データにおける設定値の変更がなされたタイミング全てで算出し、それらを平均化することで、解析対象の特徴量変数の収束性の評価を完了する。収束性を評価することで、生成した予測モデルを使用して、プラントにおける生産性の向上等の業務改善を行う際に、設定値の変更に素早く追従して変化する特徴量変数が予測モデルに含まれているかどうか等を使用者が容易に把握できるようになる。

【0069】

なお、収束性の算出方法については、上述した方法に限るものではない。例えば、情報処理装置１０１は、外部からの入力情報として、各装置においての仕様情報を入力し、仕様情報に基づいて評価してもよい。仕様情報とは、各装置における対象の計測値に関してフィードバック制御の機構の有無、その機構の収束の応答特性等である。他には、情報処理装置１０１は、Ｓ５０４で入力した情報である評価対象の特徴量変数の装置が生産工程における左端に位置する装置であるかどうか、複数の入力を受け付ける装置であるかどうか等から判断するようにしてもよい。一般的には、前者の場合は、収束性が高く、後者の場合は、因果が複雑なため収束性が低いと判断できる。

【0070】

また、単純に外部から収束性の良し悪しを使用者が判断した結果を入力するような構成としてもよい。これによって、情報処理装置１０１は、学習データにおける評価対象の特徴量変数の設定値の変動と、計測値の変動との関係性をうまく取得したり、分析したりできないような場合に、現場の知識に基づいた、より正確な収束性の評価値を決定することができる。

【0071】

なお、そもそも対応する設定値の特徴量変数を持たない特徴量変数に関しては、本指標については、評価対象外となる。

【0072】

＜因果性＞
因果性は、評価対象の特徴量変数に対して、因果関係を持つ他の特徴量変数との関わり合いを指標化したものである。例えば、ある装置Ｐの前工程に存在する装置Ｐ－１があった場合に、それぞれの装置で計測される温度値に高い相関があったとして、当該温度値は、前工程である装置Ｐ－１で行われる操作に強く依存しているような場合、装置Ｐは、装置Ｐ－１の子であると言える。逆に、装置Ｐ－１は、装置Ｐの親であると言える。

【0073】

このような評価については、情報処理装置１０１は、評価対象の特徴量変数と類似度が非常に高い特徴量変数に対して、該当するそれぞれの装置が生産工程のどの場所に位置されているかに基づいて親子関係を評価することができる。この際には、情報処理装置１０１は、Ｓ５０４で取得した生産工程における各装置の関係性等を用いて評価することができる。

【0074】

なお、各特徴量変数間における親子関係の情報は、使用者が明示的に指定するような構成としてもよい。これによって、現場の事前の知識に基づいた、より正確な因果性の評価を行うことができる。このような因果性の評価を行うことによって、上述したように複数の説明変数間に高い類似度をもつ説明変数が存在した場合に、多重共線性を解消するために変数選択を行う際に、より因果的な関係性を反映した説明変数（この場合は子ではなく親側を選択）を選択することが可能となる。

【0075】

情報処理装置１０１は、このように算出した特徴量変数の各々についての評価指標の情報をもとに、特徴量評価テーブル１０２５を生成する。図７は、特徴量評価テーブル１０２５の一例を示す図である。

【0076】

ｉｄ７０１は、時刻補正後学習データに含まれる説明変数それぞれに付与されるユニークな番号を示す項目である。説明変数７０２は、ｉｄ７０１により識別される説明変数を示す項目である。ｓｕｂｉｄ７０３は、ｉｄ７０１により識別される説明変数から生成された特徴量変数（特徴量）それぞれに対して付与されるユニークな識別子を示す項目である。図７では、１つの説明変数について移動平均化が行われた特徴量変数と、当該１つの説明変数について微分が行われた特徴量変数との２種類の特徴量変数が示されている。特徴量生成処理の種類が増えた場合は、ｓｕｂｉｄの数がそれに応じて増える。特徴量変数７０４は、ｉｄ７０１により識別される説明変数から生成された特徴量変数を示す項目である。なお、特徴量変数の種類は、全ての説明変数において同じであってもよいし、説明変数に応じて異なっていてもよい。

【0077】

貢献度７０５は、貢献度の評価結果を示す項目である。貢献度は、正規化等されて、「０」－「１００」の値を取るものとされる。貢献度「１００」は、最も貢献度が高いことを意味する。収束性７０６は、収束性の評価結果を示す項目である。収束性は、正規化等されて「０」－「１００」の値を取るものとされる。収束性「１００」は、最も収束性が高いことを意味する。なお、収束性の評価は、各説明変数に対して評価を行うものとする。したがって、１つのｉｄにつき１つの評価結果が存在する。評価対象の説明変数自体が設定値である場合、計測値の説明変数に対応する設定値の説明変数が存在しない場合には、本指標は算出されない。

【0078】

類似度の高い特徴量変数７０７は、類似度が高い他の特徴量変数のｓｕｂｉｄを示す項目である。類似度が高いと判定する閾値が設定されていて、閾値以上の特徴量変数の情報が類似度の高い特徴量変数７０７に格納される。因果性７０８は、因果性の評価結果を示す項目である。因果性７０８には、類似度が高い特徴量変数の中で親子関係にある特徴量変数のｉｄと親であるか子であるかを示す情報とが格納される。なお、因果性７０８には、１つのｉｄ毎に評価結果が格納されるものとする。

【0079】

Ｓ５０８では、情報処理装置１０１は、生成した特徴量評価テーブル１０２５をもとに、特徴量絞込み処理を実施し、特徴量候補テーブル１０２６を生成する。特徴量絞込み処理では、情報処理装置１０１は、特徴量評価テーブル１０２５における各種の評価結果をもとに、特徴量変数の絞り込みを行う。より具体的には、情報処理装置１０１は、貢献度が一定の閾値（例えば、「７０」）以下の特徴量変数を除外する。これによって、目的変数の予測にほとんど貢献しないような特徴量変数を、候補から自動的に除外することができる。

【0080】

また、情報処理装置１０１は、同一の説明変数から生成された特徴量変数間において、最も貢献度が高い特徴量変数を残すような処理を施してもよい。これによって、同一の説明変数から派生した特徴量変数が複数存在する状態を防ぐことができ、多重共線性の発生を防ぎやすくなる。このような処理を図７の特徴量評価テーブルに施した結果の例を図８に示す。図中の横実線は、除外された特徴量変数を示している。

【0081】

このように、情報処理装置１０１は、特徴量絞込み処理を行うことで、予測モデルの生成における有効な特徴量の候補として、数が絞り込まれた一覧を得ることができる。

【0082】

Ｓ５０９では、情報処理装置１０１は、得られた特徴量候補テーブル１０２６を用いて、使用者に対して特徴量変数の候補の一覧を提示する。

【0083】

図９は、使用者に提示される画面９０１（ＧＵＩ：Graphical User Interface）の一例を示す図である。

【0084】

画面９０１は、特徴量候補テーブル１０２６の一部または全部の内容を示すテーブル９０２と、どの特徴量変数を予測モデルに使用するかを選択する選択ボックス９０３とを備える。選択ボックス９０３にチェックがなされた特徴量変数を以後の処理に使用する。画面９０１は、ディスプレイに表示され、選択ボックス９０３への入力は、マウス、キーボード等を介して行われる。

【0085】

画面９０１右上の領域には、特徴量変数の選択状況に応じて表示内容が変わる情報窓９０４が表示される。

【0086】

「選択済みの特徴量変数」には、現在選択済みの特徴量変数の数が示される。

【0087】

「収束性が高い特徴量変数」には、収束性の評価項目が一定の閾値（例えば、「８５」）以上である特徴量変数の数が表示される。本例では、ｓｕｂｉｄ「６０－ｂ」の特徴量変数の収束性が「９５」であることから、本内容が１個の表示になっている。このように、選択した特徴量変数群の中に収束性が高い特徴量変数が何個存在しているかが、使用者が変数選択を行っている際にリアルタイムに表示される。よって、使用者は、自身の目的に応じて、適切な変数選択を行うことが可能となる。使用者自身の目的としては、設定値の変更に感度が高い予測モデルが欲しいため、収束性が高い特徴量変数を多めに選びたい、感度が高いというよりは、予測の精度を重視した予測モデルが欲しいため、収束性が高い特徴量変数を１つ含めればよい、等がある。

【0088】

「類似度が高い特徴量の組み合わせ」には、互いの類似度が高い特徴量変数の組み合わせの数が表示される。本例では、類似度が高い特徴量変数同士であるｓｕｂｉｄ「１－ａ」と「３－ａ」との特徴量変数が選択されているため、本内容が１個の表示になっている。このように、現在選択中の特徴量変数の中に似た傾向を持つ特徴量変数が存在しているかどうかがリアルタイムに表示される。よって、使用者は、多重共線性の発生を防ぎながら変数選択を行うことが容易になる。

【0089】

さらに、テーブル９０２では、類似度が高い特徴量変数同士において因果性（親であるか、子であるか）の情報を併せて表示している。よって、使用者は、自身の目的（多重共線性を防ぐため、類似度が高い特徴量変数は除きたいが、制御がしやすい親側の特徴量変数を優先して選択したい、等）に沿って、そのような特徴量変数の候補の中から最適な特徴量変数を容易に選択することが可能となる。

【0090】

なお、本実施の形態では、ＧＵＩを用いて使用者の選択結果を受け取る方法について説明したが、本実施の形態は、この方法に限定して適用されるものではない。例えば、情報処理装置１０１は、特徴量候補テーブル１０２６の内容の一部または全部を記載したファイルを出力する。使用者は、当該ファイルに対して選択の操作内容を反映させた新たなファイルを作成し、情報処理装置１０１に入力する。情報処理装置１０１は、新たなファイルを入力し、選択結果を受け取る。

【0091】

また、本例では、使用者による選択操作を想定したが、使用者による選択操作を一切行わずに、情報処理装置１０１において自動で実施するような構成としてもよい。この場合、上述の説明で使用者に選択を委ねていた基準をあらかじめ入力しておく。より具体的には、最終的に選択される特徴量変数の中に収束性が高い特徴量変数を何個含んでおくか、類似度が高い特徴量変数の組み合わせが発生した場合に、親または子のどちらを優先して選択するか、等である。このように、使用者が重視する選択の判断基準をあらかじめ指定できるようにすることで、自動での変数選択を行うことが可能となり、予測モデルの生成に関する作業工数を大幅に削減することができる。

【0092】

Ｓ５１０では、情報処理装置１０１は、Ｓ５０９によって、どの特徴量変数が選択されたかが決定された後、変数選択の結果（選択結果）を取得する。

【0093】

Ｓ５１１では、情報処理装置１０１は、取得した変数選択の結果の情報をもとに、特徴量生成後学習データ１０２３に対して特徴量加工処理（ここでは変数選択の処理）を施し、特徴量加工後学習データ１０２４を得る。

【0094】

なお、他の特徴量加工処理として、複数の特徴量変数を合成し、新たな特徴量変数を生成するような処理を本処理で行ってもよい。例えば、ＰＣＡ（Principal Component Analysis）、ＩＣＡ（Independent Component Analysis）、ＮＭＦ（Non-Negative Matrix Factorization）等のアルゴリズムである。情報処理装置１０１は、このような処理を行うことで、より少ない特徴量数で有効な予測モデルを生成することができる場合がある。この場合、全ての説明変数を合成すると、物理量として理解可能で制御が可能な説明変数が失われてしまうため、情報処理装置１０１は、あらかじめ制御性の高い説明変数等を除外して本処理を実行してもよい。

【0095】

Ｓ５１２では、情報処理装置１０１は、得られた特徴量加工後学習データ１０２４に対して、目的変数を予測する予測モデルを機械学習によって生成する。

【0096】

情報処理装置１０１が用いる機械学習のアルゴリズムは、特に限定されるものではない。ただし、作られたモデルの解釈性を考慮すると、当該アルゴリズムとしては、線形回帰型のアルゴリズムが適している。当該アルゴリズムとしては、重回帰分析、Ｒｉｄｇｅ回帰、Ｌａｓｓｏ回帰、ＥｌａｓｔｉｃＮｅｔ等が用いられる。これらのアルゴリズムで生成された予測モデルは、学習データの各特徴量変数の値の重み付き線形結合の形で表されるため、予測モデルを用いたプラントの生産性の向上等の業務改善に、直感的に利用がしやすい。

【0097】

また、予測モデルの生成に非線形型のアルゴリズム（Neural Network、Random Forest、 Gradient Boosting Machine等）を用い、予測モデルの予測値と特徴量変数との関係性を示すＬＩＭＥ、ＳＨＡＰ等のＸＡＩ（Explainable AI）技術等と組み合わせてもよい。これによって、線形回帰型のアルゴリズムよりも予測の精度が高い予測モデルが得られ、かつ予測値と特徴量変数との関係性も解釈することが可能となる。

【0098】

Ｓ５１３では、情報処理装置１０１は、Ｓ５１２で生成された予測モデルに対し、モデルの評価を実施する。予測モデルの評価には、学習データに用いなかったサンプルを評価用データとして、予測モデルによって予測された値と、評価用サンプルの目的変数の値との差分（誤差）を尺度とした予測の精度を用いる。当該誤差については、例えば、ＭＡＥ（Mean Absolute Error）等が挙げられるが、これに限定されるものではない。

【0099】

さらに、予測モデルの評価指標として予測モデルを構成する特徴量変数の中に、収束性が高い特徴量変数がどれくらい含まれているかどうかの尺度を含むようにしてもよい。より具体的には、単純に予測モデルの構築時に使用する特徴量変数の中に収束性が高いものが何個含まれているかとしてもよいし、予測モデルにおける当該特徴量変数の重み（例えば、線形回帰モデルであれば全特徴量変数の係数に対する比率等）をその予測モデルの評価値としてもよい。このように、予測モデルの予測の精度に加えて、収束性の特徴量変数に関する指標も評価することで、予測モデルを用いたプラントの生産性の向上等の業務改善に用いる際に、使用者は、より適した予測モデルを使用することができる。Ｓ５１３の処理をもって、予測モデル生成処理は、終了する（Ｓ５１４）。

【0100】

以上で説明した情報処理装置を用いることで、プラントにおける生産性の改善等への活用を前提とし、使用者が理解可能な予測モデルを構築する際の、予測モデルの生成に関わる作業を支援することが可能となる。

【0101】

（２）付記
上述の実施の形態には、例えば、以下のような内容が含まれる。

【0102】

上述の実施の形態においては、本発明を情報処理装置に適用するようにした場合について述べたが、本発明はこれに限らず、この他種々のシステム、装置、方法、プログラムに広く適用することができる。

【0103】

また、上述の実施の形態においては、情報処理装置１０１（コンピュータ）は、ノートパソコン、サーバ装置、タブレット端末等であり、ＣＰＵ（Central Processing Unit）、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、ＨＤＤ（Hard Disk Drive）、通信部等を含んで構成されていてもよい。

【0104】

情報処理装置１０１の機能（制御部１０７等）は、例えば、ＣＰＵがＲＯＭに格納されたプログラムをＲＡＭに読み出して実行すること（ソフトウェア）により実現されてもよいし、専用の回路等のハードウェアにより実現されてもよいし、ソフトウェアとハードウェアとが組み合わされて実現されてもよい。また、情報処理装置１０１の機能の一部は、情報処理装置１０１と通信可能な他のコンピュータにより実現されてもよい。

【0105】

情報処理装置１０１は、上記の機能に加えて、例えば、オペレーティングシステム、デバイスドライバ、ファイルシステム、ＤＢＭＳ（DataBase Management System）等の機能を更に備えていてもよい。

【0106】

また、上述の実施の形態において、各テーブルの構成は一例であり、１つのテーブルは、２以上のテーブルに分割されてもよいし、２以上のテーブルの全部または一部が１つのテーブルであってもよい。

【0107】

また、上述の実施の形態において、説明の便宜上、ＸＸテーブル、ＸＸファイルを用いて各種のデータを説明したが、データ構造は限定されるものではなく、ＸＸ情報等と表現してもよい。

【0108】

また、上述の実施の形態において、情報の出力は、ディスプレイへの表示に限るものではない。情報の出力は、スピーカによる音声出力であってもよいし、ファイルへの出力であってもよいし、印刷装置による紙媒体等への印刷であってもよいし、プロジェクタによるスクリーン等への投影であってもよいし、その他の態様であってもよい。

【0109】

また、上述の実施の形態において示した画面は、一例であり、受け付ける情報が同じであればどのような画面デザインであってもよい。例えば、各パラメータの名称をタイトル行にもち、各行が個々のパラメータの入力セルとなっているような表計算シート状の画面デザインであってもよい。また、画面は、ファイルの入力を受け付けるインタフェイスを持ち、指定されたファイルの情報を基に画面の内容を更新してもよい。

【0110】

また、上記の説明において、各機能を実現するプログラム、テーブル、ファイル等の情報は、メモリ、ハードディスク、ＳＳＤ（Solid State Drive）、ＵＳＢ（Universal Serial Interface）等の記憶装置、または、ＩＣカード、ＳＤカード、ＤＶＤ(Digital Versatile Disc)等の記録媒体に置くことができる。

【0111】

上述した実施の形態は、例えば、以下の特徴的な構成を備える。

【0112】

情報処理装置（例えば、情報処理装置１０１）は、プラント（例えば、プラント２０１）で計測されたデータのうち、予測する対象である目的変数のデータと、上記目的変数を説明するための複数の説明変数のデータと（入力学習データ１０２１、時刻補正後学習データ１０２２、特徴量生成後学習データ１０２３等）をもとに、上記複数の説明変数の各々について、上記プラントの制御性を示す指標を算出する算出部を備える。算出部は、情報処理装置１０１、演算装置１０４、回路、特徴量評価部１１０等である。

【0113】

上記説明変数のデータは、上記プラントで計測されたデータであってもよいし、当該データが加工されたデータであってもよい。例えば、加工されたデータは、平均値、最大値、最小値、最大値と最小値との差、最頻値、中央値、標準偏差等の統計値であってもよい。また、例えば、加工されたデータは、所定の処理が行われたデータである特徴量変数のデータであってもよい。所定の処理が行われたデータとしては、移動平均化の処理が行われたデータ、一定期間における最大値／最小値のデータ、微分値のデータ等である。

【0114】

上記プラントの制御性を示す指標は、収束性、因果性等である。上記プラントの制御性を示す指標は、上記プラントで計測されたデータから算出されてもよいし、上記プラントで計測されたデータに対して所定の処理が行われたデータから算出されてもよい。

【0115】

上記情報処理装置は、更に、上記算出部により算出された指標に基づいて選択された説明変数のデータをもとに（例えば、特徴量加工後学習データ１０２４を用いて）、機械学習により上記目的変数を予測する予測モデル（例えば、予測モデル１０２７）を生成する生成部を備える。生成部は、情報処理装置１０１、演算装置１０４、回路、予測モデル生成部１１３等である。

【0116】

上記選択は、使用者による選択であってもよいし、あらかじめ指定された基準に従う情報処理装置１０１による選択であってもよい。

【0117】

【0118】

上記算出部は、上記複数の説明変数のうち、上記プラントの設定値が対応付けられている説明変数について、上記プラントの制御性を示す指標として、上記設定値が変更された際に、変更された設定値にどれくらい素早く上記説明変数に係る計測値が収束するかを示す収束性（例えば、収束性７０６）を算出する（図５～図７等を参照）。なお、収束性は、正規化されていてもよいし、正規化されていなくてもよい。

【0119】

上記構成では、収束性が算出されるので、例えば、使用者は、収束性が高い説明変数を選択することができ、使用者がプラントを素早く制御可能な予測モデルを生成できるようになる。

【0120】

上記算出部は、上記複数の説明変数のうち、所定の値より類似度が高い説明変数のデータが上記プラントにおける生産工程のどの工程で計測されたデータであるかを示す因果性（例えば、因果性７０８）を算出する（図５、図７等を参照）。なお、因果性は、正規化されていてもよいし、正規化されていなくてもよい。

【0121】

上記構成では、類似度が高い説明変数について因果性が算出されるので、例えば、使用者は、多重共線性を解消する際に、因果性を踏まえて説明変数を選択することができるようになる。

【0122】

上記情報処理装置は、更に、上記複数の説明変数のデータから、上記目的変数の予測に適した１以上の特徴量変数のデータを生成する処理（例えば、特徴量変数の生成処理（特徴量生成処理））を行う処理部を備える（例えば、Ｓ５０６参照）。処理部は、情報処理装置１０１、演算装置１０４、回路、特徴量生成部１０９等である。

【0123】

上記算出部は、上記処理部により生成された特徴量変数の各々について、上記プラントの制御性を示す指標を算出する。上記生成部は、上記算出部により算出された指標に基づいて選択された特徴量変数のデータをもとに、機械学習により上記目的変数を予測する予測モデルを生成する。

【0124】

上記構成では、説明変数のデータから、１以上の特徴量変数のデータが生成され、当該１以上の特徴量変数のデータが機械学習に用いられるので、予測モデルの精度を高めることができる。また、特徴量変数の各々について、制御性を示す指標が算出されるので、例えば、特徴量変数が多数あったとしても、使用者は、制御性を示す指標に基づいて、機械学習に用いる特徴量変数を適切に選択することができる。

【0125】

上記情報処理装置には、上記プラントで計測されたデータを記憶する記憶装置が接続されている。記憶装置は、副記憶装置１０３であってもよい。記憶装置は、ＮＷＩ／Ｆ１０５に接続された他のコンピュータであってもよい。記憶装置は、入出力Ｉ／Ｆ１０６に接続された記憶装置（ＵＳＢ、ＤＶＤ等）であってもよい。

【0126】

上記情報処理装置は、更に、上記複数の説明変数の各々について、上記記憶装置に記憶されているデータのうち上記目的変数と相関が最も高い１つのデータ（例えば、ＰＶ_０＿ｉを除く説明変数ＰＶ_Ｎ＿ｉがＰＶ’_Ｎ＿ｉに置き換わったデータ）を特定する特定部を備える（例えば、Ｓ５０５参照）。特定部は、情報処理装置１０１、演算装置１０４、回路、時刻情報補正部１０８等である。

【0127】

上記算出部は、上記複数の説明変数の各々について、上記特定部により特定されたデータを用いて、上記プラントの制御性を示す指標を算出する。上記生成部は、上記算出部により算出された指標に基づいて選択された説明変数のデータであって、前記特定部により特定されたデータをもとに、機械学習により上記目的変数を予測する予測モデルを生成する。

【0128】

上記構成では、目的変数と相関が最も高いデータをもとに、指標の算出および機械学習が行われるので、例えば、使用者がプラントを制御可能な予測モデルをより精度よく生成することができる。

【0129】

上記算出部は、上記目的変数の予測の精度を示す指標を算出する。

【0130】

上記情報処理装置は、更に、上記複数の説明変数の各々について、上記算出部により算出された上記目的変数の予測の精度を示す指標と、上記算出部により算出された上記プラントの制御性を示す指標とを対応付けて出力する出力部を備える（例えば、図９参照）。

【0131】

出力される情報は、貢献度、類似度等に基づいて、説明変数（特徴量変数）の絞込みが行われていてもよいし、説明変数の絞込みが行われていなくてもよい。

【0132】

出力部は、情報処理装置１０１、演算装置１０４、回路、制御部１０７等である。出力については、ディスプレイへの表示であってもよいし、ファイルへの出力であってもよいし、その他の出力であってもよい。

【0133】

上記情報処理装置は、更に、上記出力部による出力をもとに上記目的変数の予測に用いる説明変数が使用者により選択された情報を入力する入力部を備える。入力部は、情報処理装置１０１、演算装置１０４、回路、制御部１０７等である。例えば、入力部は、入力装置を介して使用者による選択を受け付ける。

【0134】

上記生成部は、上記入力部により入力された情報に基づいて、上記使用者により選択された説明変数のデータをもとに、機械学習により上記目的変数を予測する予測モデルを生成する。

【0135】

上記構成では、例えば、使用者は、予測の精度を示す指標と、制御性を示す指標とを把握することができ、目的に応じて説明変数を選択することができる。これにより、使用者は、予測の精度が高く、かつ、制御性が高い予測モデルを使用できるようになる。

【0136】

また上述した構成については、本発明の要旨を超えない範囲において、適宜に、変更したり、組み替えたり、組み合わせたり、省略したりしてもよい。

【0137】

「Ａ、Ｂ、およびＣのうちの少なくとも１つ」という形式におけるリストに含まれる項目は、（Ａ）、（Ｂ）、（Ｃ）、（ＡおよびＢ）、（ＡおよびＣ）、（ＢおよびＣ）または（Ａ、Ｂ、およびＣ）を意味することができると理解されたい。同様に、「Ａ、Ｂ、またはＣのうちの少なくとも１つ」の形式においてリストされた項目は、（Ａ）、（Ｂ）、（Ｃ）、（ＡおよびＢ）、（ＡおよびＣ）、（ＢおよびＣ）または（Ａ、Ｂ、およびＣ）を意味することができる。

【符号の説明】

【0138】

１０１……情報処理装置。

【図1】