(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-05-07
(45)【発行日】2024-05-15
(54)【発明の名称】学習装置、学習方法及び学習プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20240508BHJP
G05B 13/04 20060101ALI20240508BHJP
【FI】
G06N20/00 130
G05B13/04
(21)【出願番号】P 2022172553
(22)【出願日】2022-10-27
【審査請求日】2022-10-27
(73)【特許権者】
【識別番号】399035766
【氏名又は名称】エヌ・ティ・ティ・コミュニケーションズ株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】伊藤 浩二
(72)【発明者】
【氏名】泉谷 知範
(72)【発明者】
【氏名】藤原 大悟
【審査官】佐藤 直樹
(56)【参考文献】
【文献】特開2008-033505(JP,A)
【文献】特開2022-035737(JP,A)
【文献】特開2004-355189(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00ー99/00
G05B 13/04
(57)【特許請求の範囲】
【請求項1】
説明変数と目的変数との組み合わせである第1のデータを収集する収集部と、
前記第1のデータから、少なくとも、前記説明変数と指定された説明変数との距離に基づいて第2のデータを取得する取得部と、
前記第2のデータから、所定の絞り込み条件に基づいて、学習データを絞り込む絞り込み部と、
前記学習データを用いて、前記説明変数から前記目的変数を出力するモデルを更新する更新部と、
を有し、
前記絞り込み条件として、通常と異なる
運転時の状況が除外されるような状況が設定され、
前記絞り込み部は、前記絞り込み条件に基づいて、前記
通常と異なる運転に関する履歴を前記学習データから除外することを特徴とする学習装置。
【請求項2】
前記第1のデータは、製品の生産工程における状況を表す前記説明変数と、前記生産工程における機器の操作を表す前記目的変数との組み合わせであり、
前記絞り込み条件は、前記操作を指示した操作者の識別情報、所定の期間、所定の前記状況、及び/または、前記操作によって設定される設定値に対応するデータを、前記第2のデータから絞り込むように予め設定された条件であることを特徴とする請求項1に記載の学習装置。
【請求項3】
前記所定の状況は、第1温度と第2温度との平均の変動が閾値未満である場合、及び/または、操作目標となる値の所定期間の分散が閾値を下回った場合であることを特徴とする請求項2に記載の学習装置。
【請求項4】
学習装置が実行する学習方法であって、
説明変数と目的変数との組み合わせである第1のデータを収集する工程と、
前記第1のデータから、少なくとも、前記説明変数と指定された説明変数との距離に基づいて第2のデータを取得する工程と、
前記第2のデータから、所定の絞り込み条件に基づいて、学習データを絞り込む工程と、
前記学習データを用いて、前記説明変数から前記目的変数を出力するモデルを更新する工程と、
を含み、
前記絞り込み条件として、通常と異なる
運転時の状況が除外されるような状況が設定され、
前記絞り込む工程は、前記絞り込み条件に基づいて、前記
通常と異なる運転に関する履歴を前記学習データから除外することを特徴とする学習方法。
【請求項5】
説明変数と目的変数との組み合わせである第1のデータを収集するステップと、
前記第1のデータから、少なくとも、前記説明変数と指定された説明変数との距離に基づいて第2のデータを取得するステップと、
前記第2のデータから、所定の絞り込み条件に基づいて、学習データを絞り込むステップと、
前記学習データを用いて、前記説明変数から前記目的変数を出力するモデルを更新するステップと、
をコンピュータに実行させ、
前記絞り込み条件として、通常と異なる
運転時の状況が除外されるような状況が設定され、
前記絞り込むステップは、前記絞り込み条件に基づいて、前記
通常と異なる運転に関する履歴を前記学習データから除外する学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習方法及び学習プログラムに関する。
【背景技術】
【0002】
従来、人間の行動を機械学習モデルに学習させ、当該モデルを用いて人間又はロボット等に動作を教示する模倣学習という技術が知られている。
【0003】
また、観測されたデータを大量に蓄積しておき、蓄積されたデータの中から要求点の近傍のデータを抽出し、当該抽出したデータを用いてモデルの逐次学習を行うJust-In-Time(JIT)法という技術が知られている(例えば、非特許文献1を参照)。
【0004】
ここで、例えば化学プラントにおいては、時間の経過に応じて、機器の経年劣化、触媒の劣化、生産ロード計画の変更等の環境の変化が生じる。
【0005】
これに対し、化学プラントにおけるオペレータによる機器の操作を学習する模倣学習にJIT法を適用して、モデルを環境の変化に適応させることが考えられる。
【先行技術文献】
【特許文献】
【0006】
【非特許文献】
【0007】
【文献】山本 茂、「Just-In-Time予測制御:蓄積データに基づく予測制御」、計測と制御 第52巻 第10号 2013年10月号(https://www.jstage.jst.go.jp/article/sicejl/52/10/52_878/_pdf/-char/ja)
【発明の概要】
【発明が解決しようとする課題】
【0008】
しかしながら、オペレータの操作履歴には、非定常状態や、経験が浅いオペレータによる運転など、学習に適さない履歴が含まれる。一方、オペレータの操作履歴には、経験が豊富なオペレータによる運転など、積極的にモデルに学習してほしい履歴も含まれる。このようなオペレータの操作履歴全てを一律で学習するとモデルの精度が上がらない場合がある。
【0009】
そこで、人が、モデルに、学習して欲しい履歴及び学習して欲しくない履歴を個別に取捨選択すると、選別する人自身の主観が入るため、恣意的な学習になるおそれがある。さらに、この場合、膨大なデータ量の操作履歴を定期的に人手で選別するという煩雑な処理負担が必要となるという問題がある。
【0010】
本発明は、上記に鑑みてなされたものであって、模倣学習においてJIT法による逐次学習に適する学習データを用い、モデルの精度の向上を図ることができる学習装置、学習方法及び学習プログラムを提供することを目的とする。
【課題を解決するための手段】
【0011】
上述した課題を解決し、目的を達成するために、学習装置は、説明変数と目的変数との組み合わせである第1のデータを収集する収集部と、前記第1のデータから、少なくとも、前記説明変数と指定された説明変数との距離に基づいて第2のデータを取得する取得部と、前記第2のデータから、所定の絞り込み条件に基づいて、学習データを絞り込む絞り込み部と、前記学習データを用いて、前記説明変数から前記目的変数を出力するモデルを更新する更新部と、を有することを特徴とする。
【発明の効果】
【0012】
本発明によれば、模倣学習においてJIT法による逐次学習に適する学習データを用い、モデルの精度の向上を図る。
【図面の簡単な説明】
【0013】
【
図1】
図1は、プラント運用システムについて説明する図である。
【
図2】
図2は、実施の形態に係る処理装置の構成例を示す図である。
【
図4】
図4は、処理装置の処理を説明する図である。
【
図5】
図5は、実施の形態における処理の手順を示すフローチャートである。
【
図6】
図6は、実施の形態における処理の手順を示すフローチャートである。
【
図7】
図7は、プログラムを実行するコンピュータの一例を示す図である。
【発明を実施するための形態】
【0014】
以下に、本願に係る学習装置、学習方法及び学習プログラムの実施形態を図面に基づいて詳細に説明する。なお、本発明は、以下に説明する実施形態により限定されるものではない。
【0015】
[実施の形態]
[実施の形態の構成]
まず、
図1を用いて、プラント運用システムについて説明する。プラント運用システム1は、プラントにおける製品の生産工程の管理及び制御を行うためのシステムである。プラントには、化学製品を生産するための化学プラントが含まれる。
【0016】
図1に示すように、処理装置10、端末装置20及びプラントシステム30を有する。
【0017】
処理装置10は、模倣学習を行うためのモデルに関する処理を行う。処理装置10は学習装置として機能することができる。
【0018】
また、処理装置10及びプラントシステム30は、ネットワークを介して互いにデータ通信ができるように接続されている。例えば、ネットワークはインターネット及びイントラネットである。
【0019】
プラントシステム30は、生産工程で使用される機器及び分散制御システム(DCS:Distributed Control System)を含むものであってもよい。例えば、機器は、反応器、冷却器、気液分離器等である。
【0020】
端末装置20は、パーソナルコンピュータ、タブレット型端末及びスマートフォン等の情報処理装置、または、プラントの機器を操作するための専用の端末である。
【0021】
オペレータ(操作者)は、端末装置20を介してプラントシステム30に含まれる機器を操作するユーザである。なお、処理装置10において使用されるモデルは、システム管理者等によって適宜管理される。
【0022】
図1に基づき、プラント運用システム1の各装置の処理を説明する。
【0023】
端末装置20は、オペレータの操作に応じて、プラントシステム30の機器を操作する(ステップS1)。例えば、端末装置20は、操作により、機器内の温度、機器内の圧力、生産工程における生産量の目標値、機器に投入する原料の量等を設定する。
【0024】
プラントシステム30は、端末装置20からの操作に従い稼働する(ステップS2)。そして、プラントシステム30は、稼働の履歴を処理装置10に送信する(ステップS3)。
【0025】
例えば、履歴には、プラントシステム30の各所に設置されたセンサのセンサ値、端末装置20からの操作によって設定された設定値が含まれる。また、履歴は、各レコードに時刻(タイムスタンプ)が付された時系列データであってもよい。
【0026】
端末装置20は、オペレータの操作に応じて、学習データとして使用する履歴の絞り込み条件を送信する(ステップS4)。絞り込み条件は、操作を指示した操作者の識別情報、所定の期間、所定の状況、及び/または、所定の操作の内容に対応する履歴を絞り込むように、予め設定されたものである。また、絞り込み条件は、システム管理者等によって設定されたものでもよい。
【0027】
処理装置10は、モデルの学習のために使用する学習データを履歴の中から絞り込み、例えば重みを付与して、モデルの学習を行い、モデルを使った推論を行う(ステップS5)。処理装置10の各処理の詳細については後述する。
【0028】
さらに、処理装置10は、推論結果をオペレータの端末装置20に提供する(ステップS6)。例えば、推論結果は、状況から予測される操作内容であり、予測される操作内容を示すガイダンス画面21が、端末装置20の画面に表示される。オペレータは、例えば、端末装置20に表示されたガイダンス画面21の操作内容に従いプラントシステム30を操作する(ステップS1)。
【0029】
ここで、推論に使用するモデルは、オペレータの操作内容を模倣学習により学習する。そのため、モデルによる推論結果として得られる操作内容に従うことで、他のオペレータが操作を模倣することができる。
【0030】
図2を用いて、処理装置10について詳細に説明する。
図2は、実施の形態に係る処理装置10の構成例を示す図である。
【0031】
図2に示すように、処理装置10は、通信部11、記憶部12及び制御部13を有する。
【0032】
通信部11は、ネットワークを介して、他の装置との間でデータ通信を行う。例えば、通信部11はNIC(Network Interface Card)である。
【0033】
記憶部12は、HDD(Hard Disk Drive)、SSD(Solid State Drive)等の記憶装置である。なお、記憶部12は、RAM(Random Access Memory)、フラッシュメモリ、NVSRAM(Non Volatile Static Random Access Memory)等のデータを書き換え可能な半導体メモリであってもよい。
【0034】
記憶部12は、処理装置10で実行されるOS(Operating System)や各種プログラムを記憶する。記憶部12は、履歴DB121、絞り込み条件DB122及びモデル情報123を記憶する。
【0035】
履歴DB121は、プラントシステム30から提供された履歴を含む情報である。
図3は、履歴DB121の例を示す図である。
図3に示すように、履歴DB121は、時刻(time)、オペレータ(operator)、状況(situation)、実施内容(operation)等の説明変数リスト、目的変数である設定値を含む。また、履歴DB121は、重みを含んでもよい。
【0036】
時刻は、操作実施時刻を示す。オペレータの項目は、機器の操作を行ったオペレータの識別情報を示す。状況の項目は、第1温度、第2温度、第1流量等の項目を有する。状況の項目は、
図3に記載の項目以外に、第1圧力、第2圧力、CO
2濃度等を含んでもよい。
【0037】
第1温度、第2温度、第1圧力、第2圧力及び第1流量は、それぞれプラントシステム30の各所に設置されたセンサのセンサ値である。
【0038】
第1温度、第2温度、第1圧力、第2圧力及び第1流量は、モデルの説明変数であって、製品の生産工程における状況を表す説明変数の一例である。
【0039】
CO2濃度は、生産工程で発生するCO2の濃度である。
【0040】
なお、時刻は、第1温度、第2温度、第1圧力、第2圧力、第1流量及びCO2濃度が取得された日時を示すタイムスタンプである。
【0041】
実施内容(operation)は、例えば、プラント制御で良く利用される制御手法であるPID制御のSV値(設定値)、MV値(制御出力)などであり、端末装置20からの操作によって設定される設定値である。設定値は、実際に設定された値を正規化した値であってもよい。また、設定値は、モデルの目的変数に相当する。
【0042】
設定値は、モデルの目的変数であって、生産工程における機器の操作を表す目的変数の一例である。
【0043】
例えば、
図3には、「山田太郎」による操作によって、時刻「13:21:01」における第1温度が「102.1℃」であり、第2温度が「103.0℃」であり、第1流量が「311.2m
3/s」であり、実施内容(operation)が「206.3」であることが示されている。
【0044】
絞り込み条件DB122は、予め設定された絞り込み条件を含む情報である。絞り込み条件は、モデルの学習データを選別するための条件である。絞り込み条件は、例えば、オペレータの操作に応じて端末装置20によって設定される。絞り込み条件により履歴DB121から検索された履歴が、モデルの学習データとして使用される。
【0045】
例えば、絞り込み条件には、所定のオペレータの識別情報が設定される。この場合には、絞り込み条件によって設定されたオペレータの操作による履歴が、学習データとして絞り込まれる。熟練したオペレータと経験が浅いオペレータとが存在し、熟練したオペレータの履歴をモデルに模倣させたい場合に、熟練したオペレータの識別情報を絞り込み条件に設定することによって、この熟練したオペレータの操作による履歴のみを絞り込むことが可能になる。なお、経験豊富な班長等の操作による履歴は、他の履歴よりも大きい重みが付与されてもよい。
【0046】
また、絞り込み条件は、時刻または期間が設定される。例えば、昼間は体制が厚く積極的な運転が可能であるが、夜間は体制が薄く積極的な運転が減少する場合、絞り込み条件に、昼間(例えば、8時から18時)の期間が設定されることで、昼間の履歴のみを絞り込むことが可能になる。なお、昼間の所定期間の履歴は、重み付けされてもよい。
【0047】
また、絞り込み条件には、状況が設定される。例えば、絞り込み条件として、第1温度と第2温度との平均の変動が閾値未満である状況が設定される。通常と異なる運転に関する履歴を学習データから除外したい場合、絞り込み条件に、通常と異なる運転時の状況が除外されるような状況が設定されることで、通常と異なる運転に関する履歴を学習データから除外することが可能になる。
【0048】
通常と異なる運転は、例えば、工場の立ち上げ、立ち下げ、一時的な保守作業等がある。そして、このような運転時には、例えば、第1温度と第2温度との平均が30分前と比較して1度以上、上昇している場合があり、このような運転時から30分間の履歴が除外されるように絞り込み条件が設定される。具体的には、絞り込み条件として、第1温度と第2温度との平均と、30分前の平均からの上昇が1℃未満である状況が設定される。
【0049】
また、絞り込み条件として、操作目標となる値の所定期間の分散が閾値を下回った状況が設定される。品質安定時の履歴をモデルに模倣させたい場合、絞り込み条件として、例えば、操作目標となる値の過去30分の分散が0.3を下回った状況を設定する。これによって、オペレーションにより品質が安定した場合の履歴を絞り込むことができる。
【0050】
また、絞り込み条件として、実施内容が設定される。例えば、所定の機器に対する設定値の変更後に、所定期間内に変更前の設定値に戻した実施内容が設定される。例えば、バルブ開度を変更してから5分以内に元に戻した場合の履歴を学習データとするために、絞り込み条件として、バルブ開度の設定値が変更され、変更後5分以外に元のバルブ開度の設定値に戻った場合が設定される。
【0051】
モデル情報123は、モデルを構築するためのパラメータ等の情報である。モデルがニューラルネットワークである場合、モデル情報123は、各層の重み及びバイアスであり、モデルがLasso回帰やRidge回帰の場合は正則化パラメータである。さらに、モデル情報123は、前処理の順番、移動平均処理における窓幅(ウィンドウサイズ)等のパラメータを含む。
【0052】
制御部13は、処理装置10全体を制御する。制御部13は、例えば、CPU(Central Processing Unit)、MPU(Micro Processing Unit)、GPU(Graphics Processing Unit)等の電子回路や、ASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等の集積回路である。
【0053】
また、制御部13は、各種の処理手順を規定したプログラムや制御データを格納するための内部メモリを有し、内部メモリを用いて各処理を実行する。また、制御部13は、各種のプログラムが動作することにより各種の処理部として機能する。例えば、制御部13は、受付部131、収集部132、取得部133、絞り込み部134、更新部135、推論部136、及び、表示制御部137を有する。
図4を用いて、処理装置10の各機能部の処理を説明する。
図4は、処理装置10の処理を説明する図である。
【0054】
受付部131は、例えば、端末装置20から、絞り込み条件を受け付け(
図4の(1))、絞り込み条件DB122に格納する。受付部131は、絞り込み条件を新規に受け付けるほか、修正、削除(一部削除を含む)も受け付ける。
【0055】
収集部132は、プラントシステム30における稼働の履歴を収集し(
図4の(2))、収集した履歴を履歴DB121に格納する。履歴は、説明変数と目的変数との組み合わせである第1のデータの一例である。
【0056】
取得部133は、履歴DB121に含まれる履歴の中から、説明変数と指定された説明変数との距離に基づいて履歴を取得する。履歴DB121に含まれる履歴は、第1のデータの一例である。また、取得部133によって取得される履歴は、第2のデータの一例である。取得部133は、履歴DB121に含まれるデータ(第1のデータ)の中から、説明変数と指定された説明変数との距離、及び、重みに基づいて第2のデータを取得してもよい。
【0057】
取得部133は、履歴検索用キー(説明変数及び/または目的変数)が指定されると、この履歴検索キーに類似する過去の履歴群を、履歴DB121から取得する(
図4の(3))。取得部133は、履歴検索キー(例えば、現在の状況を示す説明変数)と近い状況で収集された過去の履歴群(説明変数、目的変数)(第2のデータ)を、履歴DB121から取得する。
【0058】
指定された説明変数を要求点と呼ぶ。例えば、要求点は、所定の時刻における説明変数(履歴DB121の各センサ値に相当)である。なお、要求点における目的変数(設定値)は未知であってもよい。
【0059】
ここで、JIT法では、多次元ベクトルである訓練用のデータ(本実施形態の履歴DB121に相当)と多次元ベクトルである要求点との距離を基に類似履歴が取得される。例えば、取得部133は、JIT法を用いて、計算されたユークリッド距離が小さいk(kは整数)個のレコードであるk最近傍(k-NN:k Nearest Neighbors)を取得する。なお、訓練用のデータと要求点との距離は、ユークリッド距離に限られず、例えばマハラノビス距離及びコサイン類似度等であってもよい。
【0060】
また、取得部133は、訓練用のデータと要求点との距離だけでなく、履歴DB121の重みを参照してレコードを取得してもよい。ここでは、重みが大きいほど取得対象として望ましいデータである場合、例えば、取得部133は、履歴DB121の中から、k最近傍であって、かつ重みが大きいデータを優先して取得する。
【0061】
絞り込み部134は、取得部133によって取得された過去の履歴群(第2のデータ)から、所定の絞り込み条件に基づいて、学習データを絞り込む(
図4の(4))。絞り込み条件は、前述のように、操作を指示したオペレータの識別情報、所定の期間、所定の状況、及び/または、操作によって設定される設定値に対応するデータを、過去の履歴群から絞り込むように予め設定された条件であり、絞り込み条件DB122から読み出される。
【0062】
絞り込み部134は、絞り込み条件にオペレータの識別情報が設定されている場合には、第2のデータから、絞り込み条件に設定されたオペレータの操作による履歴を、学習データとして絞り込む。
【0063】
絞り込み部134は、絞り込み条件に時刻または期間が設定されている場合には、第2のデータから、絞り込み条件に設定された時刻または期間の履歴を、学習データとして絞り込む。
【0064】
絞り込み部134は、絞り込み条件に状況が設定されている場合には、第2のデータから、絞り込み条件に設定された状況に対応する履歴を、学習データとして絞り込む。
【0065】
絞り込み部134は、絞り込み条件に実施内容が設定されている場合には、第2のデータから、絞り込み条件に設定された実施内容に対応する履歴を、学習データとして絞り込む。
【0066】
なお、取得部133が、指定された履歴検索用キー(説明変数及び/または目的変数)と絞り込み条件とを用いて、この履歴検索キーに類似し、かつ、絞り込み条件に合致する過去の履歴群を、履歴DB121から取得してもよい。なお、この場合、絞り込み部134は省略される。このように、取得部133が、一度の処理で過去の履歴群を絞り込むことで、学習データ数の偏りを減らすことができる。
【0067】
更新部135は、絞り込み部134によって絞り込まれた学習データを用いて、説明変数から目的変数を出力するモデルの学習を行い(
図4の(5))、モデルを更新する(
図4の(6))。
【0068】
更新部135は、モデル情報123から構築したモデルに、説明変数を入力することにより計算された目的変数と、絞り込み部134によって絞り込まれた学習データに含まれる目的変数との差分を表す目的関数を計算し、該目的関数が小さくなるように、学習の終了条件を満たすまでモデルのパラメータ、すなわちモデル情報123を繰り返し更新する。なお、学習データに重みが付与されている場合には、付与された重みで学習データを学習する。
【0069】
推論部136は、更新後のモデル情報123から構築したモデルに、予測用の説明変数を入力することにより目的変数を計算する。すなわち、推論部136は推論処理を行う(
図4の(7))。推論された目的変数は、例えば、状況から予測される操作内容である。
【0070】
表示制御部137は、推論された目的変数(例えば、操作内容)を示すガイダンス画面を、端末装置20に表示させることで、推論結果をオペレータに提示する。
【0071】
[実施の形態の処理]
図5を用いて実施の形態における処理手順を説明する。
図5は、実施の形態における処理の手順を示すフローチャートである。
【0072】
図5に示すように、まず、処理装置10は、例えば、端末装置20から、絞り込み条件を受け付ける(ステップS11)。処理装置10は、新規の絞り込み条件に限らず、条件の追加、修正、削除などを受け付けてもよい。そして、処理装置10は、受け付けた絞り込み条件DB122に格納する(ステップS12)。
【0073】
図6は、実施の形態における処理の手順を示すフローチャートである。
図6に示すように、処理装置10は、プラントシステム30における稼働の履歴を収集し(ステップS21)、収集した履歴を履歴DB121に格納する。
【0074】
処理装置10は、履歴DB121に含まれる履歴の中から、説明変数と指定された説明変数との距離に基づいてデータを抽出する。処理装置10は、履歴検索キー(説明変数及び/または目的変数)が指定されると、この履歴検査キーに類似する過去の履歴群を、履歴DB121から取得する(ステップS22)。
【0075】
処理装置10は、ステップS22において取得した履歴群から、絞り込み条件DB122に格納されている絞り込み条件に基づいて、学習データを絞り込む(ステップS23)。
【0076】
処理装置10は、絞り込み部134によって絞り込まれた学習データを用いて、説明変数から目的変数を出力するモデルの学習を行い(ステップS24)、モデルを更新する(ステップS25)。
【0077】
処理装置10は、更新後のモデル情報123から構築したモデルに、予測用の説明変数(例えば、第1温度、第2温度、第1流量など)を入力することにより目的変数(例えば、操作内容)を推論する(ステップS26)。
【0078】
処理装置10は、ステップS25において推論された目的変数(例えば、操作内容)を示すガイダンス画面を、端末装置20に表示させることで、推論結果をオペレータに提示する(ステップS27)。
【0079】
[実施の形態の効果]
このように、実施の形態に係る処理装置10は、説明変数と目的変数との組み合わせである第1のデータを収集し、第1のデータから、少なくとも、説明変数と指定された説明変数との距離に基づいて第2のデータを取得する。そして、処理装置10は、第2のデータから、所定の絞り込み条件に基づいて、学習データを絞り込み、この学習データを用いて、説明変数から目的変数を出力するモデルを更新する。
【0080】
このように、処理装置10は、膨大なデータ量の履歴から、絞り込み条件にしたがって、学習に適した履歴を自動で絞り込み、モデルを更新するため、人手による履歴の選別が不要となる。
【0081】
また、処理装置10は、プラントシステム30から収集された履歴から、所定の絞り込み条件にしたがって、学習に適した学習データを絞り込むため、選別する人自身の主観を入れることなく、学習に適した履歴を適正に選別することができる。また、処理装置10は、操作を指示した操作者の識別情報、所定の期間、所定の状況、及び/または、操作によって設定される設定値に対応するように設定された絞り込み条件を用いて、学習に適した履歴を正確に絞り込むことができる。
【0082】
したがって、処理装置10は、学習に適した履歴のみを用いて、モデルを更新することができるため、モデルの推論精度を向上させることができる。特に、処理装置10は、模倣学習においてJIT法による逐次学習に適する学習データを用いてモデル更新を行うため、プラントシステム30の適切な操作と、モデルの精度向上とを並行して実現することができる。
【0083】
[システム構成等]
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示のように構成されていることを要しない。すなわち、各装置の分散及び統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散又は統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU(Central Processing Unit)及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。なお、プログラムは、CPUだけでなく、GPU等の他のプロセッサによって実行されてもよい。
【0084】
また、本実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0085】
[プログラム]
一実施形態として、処理装置10は、パッケージソフトウェアやオンラインソフトウェアとして上記の学習処理を実行する学習プログラムを所望のコンピュータにインストールさせることによって実装できる。例えば、上記の学習プログラムを情報処理装置に実行させることにより、情報処理装置を処理装置10として機能させることができる。ここで言う情報処理装置には、デスクトップ型又はノート型のパーソナルコンピュータが含まれる。また、その他にも、情報処理装置には、タブレット型端末、スマートフォン、携帯電話機やPHS(Personal Handyphone System)等の移動体通信端末、さらには、PDA(Personal Digital Assistant)等のスレート端末等がその範疇に含まれる。
【0086】
また、処理装置10は、ユーザが使用する端末装置をクライアントとし、当該クライアントに上記の学習処理に関するサービスを提供するサーバとして実装することもできる。例えば、サーバは、要求点の指定を入力とし、学習済みのモデルを出力とする学習サービスを提供するサーバ装置として実装される。この場合、サーバは、Webサーバとして実装することとしてもよいし、アウトソーシングによって上記の学習処理に関するサービスを提供するクラウドとして実装することとしてもかまわない。
【0087】
図7は、プログラムを実行するコンピュータの一例を示す図である。コンピュータ1000は、例えば、メモリ1010、CPU1020を有する。また、コンピュータ1000は、ハードディスクドライブインタフェース1030、ディスクドライブインタフェース1040、シリアルポートインタフェース1050、ビデオアダプタ1060、ネットワークインタフェース1070を有する。これらの各部は、バス1080によって接続される。
【0088】
メモリ1010は、ROM(Read Only Memory)1011及びRAM(Random Access Memory)1012を含む。ROM1011は、例えば、BIOS(Basic Input Output System)等のブートプログラムを記憶する。ハードディスクドライブインタフェース1030は、ハードディスクドライブ1090に接続される。ディスクドライブインタフェース1040は、ディスクドライブ1100に接続される。例えば磁気ディスクや光ディスク等の着脱可能な記憶媒体が、ディスクドライブ1100に挿入される。シリアルポートインタフェース1050は、例えばマウス1110、キーボード1120に接続される。ビデオアダプタ1060は、例えばディスプレイ1130に接続される。
【0089】
ハードディスクドライブ1090は、例えば、OS1091、アプリケーションプログラム1092、プログラムモジュール1093、プログラムデータ1094を記憶する。すなわち、処理装置10の各処理を規定するプログラムは、コンピュータにより実行可能なコードが記述されたプログラムモジュール1093として実装される。プログラムモジュール1093は、例えばハードディスクドライブ1090に記憶される。例えば、処理装置10における機能構成と同様の処理を実行するためのプログラムモジュール1093が、ハードディスクドライブ1090に記憶される。なお、ハードディスクドライブ1090は、SSD(Solid State Drive)により代替されてもよい。
【0090】
また、上述した実施形態の処理で用いられる設定データは、プログラムデータ1094として、例えばメモリ1010やハードディスクドライブ1090に記憶される。そして、CPU1020は、メモリ1010やハードディスクドライブ1090に記憶されたプログラムモジュール1093やプログラムデータ1094を必要に応じてRAM1012に読み出して、上述した実施形態の処理を実行する。
【0091】
なお、プログラムモジュール1093やプログラムデータ1094は、ハードディスクドライブ1090に記憶される場合に限らず、例えば着脱可能な記憶媒体に記憶され、ディスクドライブ1100等を介してCPU1020によって読み出されてもよい。あるいは、プログラムモジュール1093及びプログラムデータ1094は、ネットワーク(LAN(Local Area Network)、WAN(Wide Area Network)等)を介して接続された他のコンピュータに記憶されてもよい。そして、プログラムモジュール1093及びプログラムデータ1094は、他のコンピュータから、ネットワークインタフェース1070を介してCPU1020によって読み出されてもよい。
【符号の説明】
【0092】
1 プラント運用システム
10 処理装置
20 端末装置
30 プラントシステム
11 通信部
12 記憶部
13 制御部
121 履歴DB
122 絞り込み条件DB
123 モデル情報
131 受付部
132 収集部
133 取得部
134 絞り込み部
135 更新部
136 推論部
137 表示制御部
【要約】
【課題】模倣学習においてJIT法による逐次学習に適する学習データを用い、モデルの精度の向上を図る。
【解決手段】処理装置10は、説明変数と目的変数との組み合わせである第1のデータを収集する収集部132と、第1のデータから、少なくとも、説明変数と指定された説明変数との距離に基づいて第2のデータを取得する取得部133と、第2のデータから、所定の絞り込み条件に基づいて、学習データを絞り込む絞り込み部134と、学習データを用いて、説明変数から目的変数を出力するモデルを更新する更新部135と、を有する。
【選択図】
図2