IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日揮プラントイノベーション株式会社の特許一覧

特開2022-81866機械学習装置、反応槽運転支援装置、及び、推論装置
<>
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図1
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図2
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図3
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図4
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図5
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図6
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図7
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図8
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図9
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図10
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図11
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図12
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図13
  • 特開-機械学習装置、反応槽運転支援装置、及び、推論装置 図14
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022081866
(43)【公開日】2022-06-01
(54)【発明の名称】機械学習装置、反応槽運転支援装置、及び、推論装置
(51)【国際特許分類】
   C08F 2/01 20060101AFI20220525BHJP
   G05B 23/02 20060101ALI20220525BHJP
   G06N 20/00 20190101ALI20220525BHJP
   G06N 3/08 20060101ALI20220525BHJP
【FI】
C08F2/01
G05B23/02 E
G06N20/00 130
G06N3/08
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2020193066
(22)【出願日】2020-11-20
(71)【出願人】
【識別番号】502040041
【氏名又は名称】日揮株式会社
(74)【代理人】
【識別番号】100214248
【弁理士】
【氏名又は名称】青山 純
(74)【代理人】
【識別番号】100214260
【弁理士】
【氏名又は名称】相羽 昌孝
(72)【発明者】
【氏名】横山 岳志
【テーマコード(参考)】
3C223
4J011
【Fターム(参考)】
3C223AA05
3C223BA01
3C223BB17
3C223CC01
3C223EB01
3C223FF05
3C223FF23
3C223FF26
3C223GG01
3C223HH29
4J011AA01
4J011AB02
4J011AB03
4J011AB04
4J011AB09
4J011AB10
4J011DB03
4J011DB23
4J011DB33
(57)【要約】
【課題】反応装置の運転パラメータの設定を支援することを可能とする機械学習装置を提供する。
【解決手段】機械学習装置6は、反応槽内に投入された原材料を撹拌機で攪拌して所定の反応プロセスを行う反応装置の運転パラメータを設定する反応槽運転支援装置にて用いられる学習モデルを生成する。機械学習装置6は、反応槽3に係る反応槽状態変数、及び、撹拌機4に係る撹拌機状態変数を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部61と、学習モデル2に学習用データを複数組入力することで、入力データと運転パラメータとの相関関係を学習モデル2に学習させる機械学習部62と、機械学習部62により学習させた学習モデル2を記憶する学習済みモデル記憶部63とを備える。
【選択図】 図4
【特許請求の範囲】
【請求項1】
反応槽内に投入された原材料を撹拌機で攪拌して所定の反応プロセスを行う反応装置の運転パラメータを設定する反応槽運転支援装置にて用いられる学習モデルを生成する機械学習装置であって、
前記反応槽に係る反応槽状態変数、及び、前記撹拌機に係る撹拌機状態変数を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部と、
前記学習モデルに前記学習用データを複数組入力することで、前記入力データと前記運転パラメータとの相関関係を前記学習モデルに学習させる機械学習部と、
前記機械学習部により学習させた前記学習モデルを記憶する学習済みモデル記憶部と、備える、
機械学習装置。
【請求項2】
前記入力データに含まれる前記反応槽状態変数は、
前記反応槽の加熱又は徐熱に係る熱量を示す熱量状態変数を少なくとも含み、
前記入力データに含まれる前記撹拌機状態変数は、
前記モータに加わるトルクを示す撹拌機トルクを少なくとも含み、
前記運転パラメータは、
前記反応槽を加熱又は徐熱するときの指令値を示す反応槽運転パラメータ、及び、
前記撹拌機を駆動するときの指令値を示す撹拌機運転パラメータの少なくとも1つを含む、
請求項1に記載の機械学習装置。
【請求項3】
前記入力データに含まれる前記熱量状態変数は、
前記反応槽の外周に設けられたジャケットに流通される熱媒の温度を示すジャケット熱媒温度、及び、
前記ジャケットに流通される前記熱媒の流量を示すジャケット熱媒流量を少なくとも含む、
請求項2に記載の機械学習装置。
【請求項4】
前記入力データに含まれる前記撹拌機状態変数は、
前記モータの回転数を示すモータ回転数、及び、
前記モータに供給される電流値を示すモータ電流値の少なくとも1つをさらに含む、
請求項2又は請求項3に記載の機械学習装置。
【請求項5】
前記入力データに含まれる前記反応槽状態変数は、
前記反応槽内の温度を示す反応槽温度、
前記反応槽内の圧力を示す反応槽圧力、及び、
前記反応槽の重量を示す反応槽重量の少なくとも1つをさらに含む、
請求項2乃至請求項4のいずれか一項に記載の機械学習装置。
【請求項6】
前記反応槽運転パラメータは、
前記反応槽の外周に設けられたジャケットに流通される熱媒の温度を示すジャケット熱媒温度に関する指令値、及び、
前記ジャケットに流通される前記熱媒の流量を示すジャケット熱媒流量に関する指令値を少なくとも含む、
請求項2乃至請求項5のいずれか一項に記載の機械学習装置。
【請求項7】
前記撹拌機運転パラメータは、
前記モータの回転数を示すモータ回転数に関する指令値、及び、
前記モータに供給される電流値を示すモータ電流値に関する指令値の少なくとも1つを含む、
請求項2乃至請求項6のいずれか一項に記載の機械学習装置。
【請求項8】
前記入力データは、
前記反応槽が設置された外部環境に係る外部環境状態変数をさらに含み、
前記入力データに含まれる前記外部環境状態変数は、
前記外部環境の温度を示す外部環境温度、及び、
前記外部環境の湿度を示す外部環境湿度の少なくとも1つを含む、
請求項1乃至請求項7のいずれか一項に記載の機械学習装置。
【請求項9】
前記学習用データは、
前記運転パラメータを出力データとしてさらに含み、前記入力データ及び前記出力データが対応付けられたものであり、
前記機械学習部は、
前記入力データと前記出力データとの相関関係を教師あり学習により前記学習モデルに学習させる、
請求項1乃至請求項8のいずれか一項に記載の機械学習装置。
【請求項10】
前記入力データに含まれる前記反応槽状態変数及び前記撹拌機状態変数は、
前記反応プロセスが進行する所定期間における時系列データであり、
前記運転パラメータは、
前記所定期間における時系列データである、
請求項9に記載の機械学習装置。
【請求項11】
前記機械学習部は、
前記入力データと前記運転パラメータとの相関関係を強化学習により前記学習モデルに学習させる、
請求項1乃至請求項8のいずれか一項に記載の機械学習装置。
【請求項12】
前記機械学習部は、
前記入力データに基づく前記反応槽内の前記原材料の反応状態に対して前記運転パラメータに基づく前記反応装置の運転が行われた後の前記反応状態と、前記反応プロセスの進行に伴って推移する前記反応状態の目標値を示す目標推移との差に基づいて、前記入力データと前記運転パラメータとの相関関係を前記学習モデルに学習させる、
請求項11に記載の機械学習装置。
【請求項13】
請求項1乃至請求項12のいずれか一項に記載の機械学習装置により生成された学習モデルを用いて、反応槽内に投入された原材料を撹拌機で攪拌して所定の反応プロセスを行う反応装置の運転パラメータを設定する反応槽運転支援装置であって、
前記反応槽に係る反応槽状態変数、及び、前記撹拌機に係る撹拌機状態変数を少なくとも含む入力データを取得する入力データ取得部と、
前記入力データ取得部により取得された前記入力データを前記学習モデルに入力し、前記運転パラメータを推論する推論部と、を備える、
反応槽運転支援装置。
【請求項14】
反応槽内に投入された原材料を撹拌機で攪拌して所定の反応プロセスを行う反応装置の運転パラメータを設定するために用いられる推論装置であって、
前記推論装置は、メモリと、プロセッサとを備え、
前記プロセッサは、
前記反応槽に係る反応槽状態変数、及び、前記撹拌機に係る撹拌機状態変数を少なくとも含む入力データを取得する入力データ取得処理と、
前記入力データ取得処理にて前記入力データを取得すると、前記運転パラメータを推論する推論処理と、を実行する、
推論装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機械学習装置、反応槽運転支援装置、及び、推論装置に関する。
【背景技術】
【0002】
重合プロセスにより合成樹脂を製造する製造設備として、反応槽を備える反応装置が広く使用されている。例えば、特許文献1には、反応槽と、反応槽の外周に設けられたジャケットと、反応槽の内部に配置された攪拌翼と、攪拌翼の動力源となる撹拌動力とを備える反応装置が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2000-264909号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1には、重合温度の調整方法や撹拌機(攪拌翼)による撹拌方法についての具体的な反応装置の運転方法が開示されておらず、どのように反応装置の運転パラメータが設定されるのかが不明である。
【0005】
また、重合プロセスに限られず、反応槽内に投入された原材料を撹拌機で攪拌して所定の反応プロセスにより生成物を製造する際、作業者が反応装置の各部を手動で操作する場合もあれば、反応装置が反応装置の各部を自動で制御する制御部を備え、制御部が自動で制御する場合もある。
【0006】
前者の場合には、作業者の経験(暗黙知を含む)に依存した判断に基づいて反応装置が操作されるため、担当する作業者によって運転パラメータを設定するときの判断や基準が異なり、製造品質や製造時間に差が生じる。経験豊富な熟練の作業者によれば、製造品質の向上や製造時間の短縮が見込まれるが、そのような結果が常に得られるとは限らない。後者の場合には、時々刻々と変化する反応装置の様々な状況に応じて運転パラメータを自動で設定するための制御アルゴリズムを開発することが必要となり、制御アルゴリズムにより製造品質や製造時間を担保することは非常に困難である。
【0007】
本発明は、上記の課題に鑑みてなされたものであり、反応装置の運転パラメータの設定を支援することを可能とする機械学習装置、反応槽運転支援装置、及び、推論装置を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記目的を達成するために、本発明の一態様に係る機械学習装置は、
反応槽内に投入された原材料を撹拌機で攪拌して所定の反応プロセスを行う反応装置の運転パラメータを設定する反応槽運転支援装置にて用いられる学習モデルを生成する機械学習装置であって、
前記反応槽に係る反応槽状態変数、及び、前記撹拌機に係る撹拌機状態変数を入力データとして少なくとも含む学習用データを複数組記憶する学習用データ記憶部と、
前記学習モデルに前記学習用データを複数組入力することで、前記入力データと前記運転パラメータとの相関関係を前記学習モデルに学習させる機械学習部と、
前記機械学習部により学習させた前記学習モデルを記憶する学習済みモデル記憶部と、備える。
【発明の効果】
【0009】
本発明の機械学習装置によれば、熱量状態変数及び撹拌機状態変数に基づいて反応装置の運転パラメータを推論可能な学習モデルを提供することができる。よって、この学習モデルを利用することにより、作業者の経験に依存することなく、製造品質の向上及び製造時間の短縮を図ることができる。
【0010】
上記以外の課題、構成及び効果は、後述する発明を実施するための形態にて明らかにされる。
【図面の簡単な説明】
【0011】
図1】第1の実施形態に係る反応装置1の一例を示す全体構成図である。
図2】第1の実施形態に係る反応装置1の一例を示すブロック図である。
図3】反応槽制御装置5(主に反応槽運転支援装置7の部分)及び機械学習装置6を構成するコンピュータ200の一例を示すハードウエア構成図である。
図4】第1の実施形態に係る機械学習装置6の一例を示すブロック図である。
図5】第1の実施形態に係る機械学習装置6で使用されるデータ(教師あり学習)の一例を示すデータ構成図である。
図6】第1の実施形態に係る機械学習装置6で使用される学習用データにおける入力データ(状態変数)と出力データ(運転パラメータ)との関係を示す説明図である。
図7】第1の実施形態に係る機械学習装置6で使用されるニューラルネットワークモデルの一例を示す模式図である。
図8】第1の実施形態に係る機械学習装置6による機械学習方法の一例を示すフローチャートである。
図9】第1の実施形態に係る反応槽運転支援装置7(運転支援部500)の一例を示すブロック図である。
図10】第1の実施形態に係る反応槽運転支援装置7(反応槽制御装置5の運転支援部500)による反応槽運転支援方法の一例を示すフローチャートである。
図11】第2の実施形態に係る機械学習装置6で使用されるデータ(強化学習)の一例と、強化学習の仕組みを示す概略図である。
図12】第2の実施形態に係る機械学習装置6で使用されるニューラルネットワークモデルの一例を示す模式図である。
図13】第2の実施形態に係る機械学習装置6による機械学習方法の一例を示すフローチャートである。
図14】第2の実施形態に係る反応槽運転支援装置7(反応槽制御装置5の運転支援部500)による反応槽運転支援方法の一例を示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、図面を参照して本発明を実施するための実施形態について説明する。以下では、本発明の目的を達成するための説明に必要な範囲を模式的に示し、本発明の該当部分の説明に必要な範囲を主に説明することとし、説明を省略する箇所については公知技術によるものとする。
【0013】
(第1の実施形態)
図1は、第1の実施形態に係る反応装置1の一例を示す全体構成図である。図2は、第1の実施形態に係る反応装置1の一例を示すブロック図である。
【0014】
反応装置1は、原材料に対して所定の反応プロセスを行うことで所定の生成物を生成する装置である。反応装置1は、例えば、合成樹脂等を重合プロセスにて生成する化学分野や、酒や醤油等を醸造プロセスにて生成する食品分野にて利用可能である。なお、反応装
置1は、上記の例に限定されず、任意の生成物を生成する各種の分野で利用されるものでよい。
【0015】
本実施形態では、反応装置1は、1又は複数種のモノマー、溶媒、重合開始剤、添加剤等を原材料として重合プロセス(反応プロセスの一形態)を行うことで合成樹脂(例えば、ポリプロピレン、ポリエチレン、ポリ塩化ビニル、メラミン樹脂、エポキシ樹脂、ウレタン樹脂、アクリル樹脂及びシリコン樹脂等)を生成物として生成する装置である場合を中心に説明する。
【0016】
反応装置1は、主要な構成として、反応槽3と、撹拌機4と、反応槽制御装置5とを備える。反応装置1の各部には、商用電源(不図示)からの電力が供給される。なお、本実施形態では、反応装置1は、バッチ方式の反応プロセスを行うものとして説明するが、連続方式の反応プロセスを行うものでもよい。
【0017】
反応槽3は、略縦長円筒状の反応槽本体30と、反応槽本体30の上面部に形成された原材料投入口31と、反応槽本体30の底面部に形成された生成物排出口32と、反応槽本体30の外周に設けられたジャケット33と、熱媒としての冷水及び温水を循環させる熱媒循環流路34と、反応槽3の各部の物理量や状態量を反応槽状態変数として測定する反応槽センサ群35と、反応槽3の各部を制御する反応槽制御機器群36と、反応槽3が設置された外部環境の物理量や状態量を外部環境状態変数として測定する外部環境センサ群37を備える。
【0018】
原材料投入口31は、原材料が自動投入又は手動投入される部分である。原材料投入口31は、複数設けられていてもよい。生成物排出口32は、生成物が排出される部分である。生成物排出口32には、生成物の粘度を測定する粘度計や生成物の密度を測定する密度計が設けられていてもよい。
【0019】
ジャケット33は、反応槽本体30の外周側面を覆うように形成され、その内部に冷水及び温水を流通させるためのジャケット流路(不図示)を有する。冷水が流通されるジャケット流路と温水が流通されるジャケット流路とは、別々でもよいし、兼用されてもよい。なお、熱媒は、水以外の物質でもよい。
【0020】
熱媒循環流路34は、ジャケット流路の流入口及び流出口にそれぞれ連通される。熱媒循環流路34は、冷水を循環させる冷水循環流路340と、温水を循環させる温水循環流路341とを備える。なお、冷水循環流路340及び温水循環流路341は兼用されてもよい。
【0021】
反応槽センサ群35は、熱量状態変数を測定するセンサとして、ジャケット33に流通される熱媒(冷水及び温水)の温度を示すジャケット熱媒温度T4を測定するジャケット熱媒温度センサ350と、ジャケット33に流通される熱媒(冷水及び温水)の流量を示すジャケット熱媒流量F1を測定するジャケット熱媒流量センサ353を備える。なお、ジャケット熱媒温度センサ350は、ジャケット流路に設けられていてもよいし、ジャケット33に埋め込まれていてもよい。
【0022】
反応槽センサ群35は、熱量状態変数を測定するセンサとして、ジャケット熱媒温度センサ350に加えて又は代えて、冷水温度T5を測定する冷水温度センサ351と、温水温度T6を測定する温水温度センサ352とを備える。反応槽センサ群35は、熱量状態変数を取得するセンサとして、ジャケット熱媒流量センサ353に加えて又は代えて、冷水流量F2を測定する冷水流量センサ354と、温水流量F3を測定する温水流量センサ355とを備える。冷水温度センサ351及び冷水流量センサ354は、冷水循環流路3
40に設けられる。温水温度センサ352及び温水流量センサ355は、温水循環流路341に設けられる。
【0023】
反応槽センサ群35は、反応槽本体30の内部の温度を示す反応槽温度T1、T2、T3をそれぞれ測定する3つの反応槽温度センサ356A、356B、356Cと、反応槽本体30の内部の圧力を示す反応槽圧力P1を測定する反応槽圧力センサ357と、反応槽本体30の内部の原材料の重量を示す反応槽重量W1を測定する反応槽重量センサ358とをさらに備える。
【0024】
反応槽温度センサ356A、356B、356Cは、例えば、反応槽本体30を上下方向に3分割したときの上段、中段、下段にそれぞれ設けられる。なお、反応槽温度センサ356A、356B、356Cの数や配置は、上記の例に限定されず、例えば、反応槽本体30の大きさや生成物の種類等に応じて適宜変更してもよい。反応槽重量センサ358は、例えば、ロードセルで構成され、反応槽3及び撹拌機4の自重をキャンセルすることで反応槽重量W1を測定する。
【0025】
反応槽制御機器群36は、反応槽3を加熱又は徐熱するときの指令値を示す反応槽運転パラメータに従って動作する複数の制御機器で構成される。本実施形態では、反応槽制御機器群36は、自動で制御される自動運転モードと、手動で操作される手動運転モードとが切替可能であるものとして説明する。
【0026】
反応槽制御機器群36は、ジャケット熱媒温度T4を制御する制御機器として、冷水温度T5を制御する冷却機器360と、温水温度T6を制御する加熱機器361とを備える。冷却機器360は、冷水循環流路340に設けられる。加熱機器361は、温水循環流路341に設けられる。
【0027】
反応槽制御機器群36は、ジャケット熱媒流量F1を制御する制御機器として、冷水流量F2を制御する冷水流量調整弁362及び冷水ポンプ363と、温水流量F3を制御する温水流量調整弁364及び温水ポンプ365とを備える。冷水流量調整弁362及び冷水ポンプ363は、冷水循環流路340に設けられる。温水流量調整弁364及び温水ポンプ365は、温水循環流路341に設けられる。
【0028】
外部環境センサ群37は、外部環境状態変数を測定するセンサとして、外部環境の温度を示す外部環境温度T7を測定する外部環境温度センサ370と、外部環境の湿度を示す外部環境湿度H1を測定する外部環境湿度センサ371とを備える。
【0029】
撹拌機4は、反応槽本体30の内部に配置されたプロペラ状の攪拌翼40と、反応槽本体30の上方に配置されて、攪拌翼40を回転する駆動源としてのモータ41と、攪拌翼40及びモータ41の間を連結するシャフト状の回転軸42と、撹拌機4の各部の物理量や状態量を撹拌機状態変数として測定する撹拌機センサ群43と、撹拌機4の攪拌状態を制御する撹拌機制御機器44とを備える。
【0030】
撹拌機センサ群43は、撹拌機状態変数を測定するセンサとして、モータ41に加わるトルクを示す撹拌機トルクST1を測定する撹拌機トルクセンサ430と、モータ41の回転数を示すモータ回転数R1を測定するモータ回転数センサ431と、モータ41に供給されるモータ電流値I1を測定するモータ電流センサ432と、撹拌機4が動作したときの振動値O1を測定する振動センサ433と、撹拌機4が動作したときの音響値N1を測定する音響センサ434とを備える。
【0031】
撹拌機トルクセンサ430は、回転軸42に取り付けられる。撹拌機トルクセンサ43
0は、モータ41が攪拌翼40を回転させたときに、モータ41が原材料から受ける負荷を撹拌機トルクST1として測定する。原材料は、反応プロセスの進行状態に応じて粘度が変化するため、撹拌機トルクST1は、反応プロセスが進行するのに従って変化する。
【0032】
モータ回転数センサ431は、例えば、モータ41に設けられたロータリエンコーダ等の回転角検出器で構成される。モータ電流センサ432は、モータ41、撹拌機制御機器44、又は、モータ41及び撹拌機制御機器44を接続する電力線に取り付けられる。振動センサ433及び音響センサ434は、例えば、反応槽本体30又はモータ41のケース等に取り付けられる。
【0033】
撹拌機制御機器44は、撹拌機4を駆動するときの指令値を示す撹拌機運転パラメータに従って動作する制御機器で構成される。撹拌機制御機器44は、例えば、インバータで構成され、モータ41に駆動電力を供給し、モータ41の回転状態(オン又はオフ、回転数等)を制御する。本実施形態では、撹拌機制御機器44は、自動で制御される自動運転モードと、手動で操作される手動運転モードとが切替可能であるものとして説明する。
【0034】
反応槽制御装置5は、例えば、汎用又は専用のコンピュータ(後述の図3参照)で構成される。反応槽制御装置5は、図2に示すように、主要な構成として、反応装置1の各部に接続される制御盤50と、作業者の操作を受け付けるとともに各種の情報を表示する操作表示盤51とを備える。
【0035】
制御盤50には、反応槽状態変数を測定する反応槽センサ群35と、反応槽3の各部を動作させる反応槽制御機器群36と、外部環境状態変数を測定する外部環境センサ群37と、撹拌機状態変数を測定する撹拌機センサ群43と、撹拌機4の各部を動作させる撹拌機制御機器44とが電気的に接続される。
【0036】
制御盤50は、反応装置1の運転支援を行う運転支援部500と、反応装置1の自動運転モードを実行する自動運転モード部501と、反応装置1の手動運転モードを実行する手動運転モード部502とを備える。制御盤50は、例えば、作業者の操作を操作表示盤51により受け付けることで自動運転モード及び手動運転モードを切り替える。
【0037】
運転支援部500は、反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43により測定された各種の測定値を示す状態変数を所定の測定周期で取得する。運転支援部500は、その取得した状態変数に応じて反応槽制御機器群36及び撹拌機制御機器44に対する指令値を設定し、その指令値を示す反応装置1の運転パラメータ(反応槽運転パラメータ及び撹拌機運転パラメータ)を所定の指令周期で出力する。
【0038】
反応装置1の運転パラメータによる指令値は、設定値(目標値)で指定するものでもよいし、状態変数(現在値)と設定値との差に基づいて計算される制御量で指定するものでもよい。指令値は、絶対値(例えば、モータ回転数であれば、1000rpm)で指定するものでよいし、相対値(例えば、モータ回転数であれば、最大回転数の50%)で指定するものでよい。指令値は、現在の指令値に対する変化量(例えば、モータ回転数であれば、50rpm増加、5%増加)で指定するものでよい。なお、状態変数及び運転パラメータは、アナログ信号及びデジタル信号のいずれでもよい。また、測定周期及び指令周期は、同一でもよいし、異なるものでもよい。
【0039】
運転支援部500は、自動運転モードが選択されている場合には、運転パラメータを自動運転モード部501に出力する。自動運転モード部501は、その運転パラメータを反応槽制御機器群36及び撹拌機制御機器44に送信することで、反応槽制御機器群36及び撹拌機制御機器44を自動で制御する。運転支援部500は、自動運転モード部501
が反応槽制御機器群36及び撹拌機制御機器44を自動で制御したときの自動制御量と、そのときに所定の測定周期で取得した状態変数とを自動運転履歴データ52として記録する。
【0040】
運転支援部500は、手動運転モードが選択されている場合には、運転パラメータを手動運転モード部502に出力する。手動運転モード部502は、その運転パラメータを操作表示盤51に送信し、その運転パラメータの内容を操作表示盤51に表示させることで、作業者がその表示された内容に従って反応槽制御機器群36及び撹拌機制御機器44を手動で操作する。運転支援部500は、作業者により反応槽制御機器群36及び撹拌機制御機器44が操作されたときの作業者操作量と、そのときに所定の測定周期で取得した状態変数とを手動運転履歴データ53として記録する。
【0041】
なお、自動運転履歴データ52及び手動運転履歴データ53には、反応プロセスが終了したときに、粘度計や密度計で生成物の粘度や密度を測定した結果や、作業者又は検査装置(不図示)により検査された結果が、完成後の検査結果として記録されてもよい。
【0042】
本実施形態では、運転支援部500の一態様として、機械学習による学習モデル2を用いて反応装置1の運転パラメータを設定する反応槽運転支援装置7が制御盤50に組み込まれた場合について説明する。制御盤50(運転支援部500)は、機械学習の推論フェーズの主体として動作する。
【0043】
機械学習装置6は、機械学習の学習フェーズの主体として動作し、反応槽運転支援装置7にて用いられる学習モデル2を機械学習により生成する。学習済みの学習モデル2は、任意の通信網や記録媒体等を介して制御盤50に提供される。機械学習装置6は、機械学習の手法として、「教師あり学習」及び「強化教師」のいずれかを採用する。本実施形態では、「教師あり学習」を採用し、後述する第2の実施形態では、「強化学習」を採用する場合について説明する。
【0044】
反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43は、機械学習の学習フェーズでは、学習用のデータ取得に用いられ、機械学習の推論フェーズでは、推論用のデータ取得に用いられる。なお、反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43に含まれるセンサの各々における測定周期は同一でもよいし、異なるものでもよい。また、センサの各々は、上記のように、測定周期が経過する毎に離散的な測定値を出力することに代えて、アナログ信号のように連続的な測定値を出力してもよい。
【0045】
図3は、反応槽制御装置5(主に反応槽運転支援装置7の部分)及び機械学習装置6を構成するコンピュータ200の一例を示すハードウエア構成図である。
【0046】
反応槽制御装置5(主に反応槽運転支援装置7の部分)及び機械学習装置6のそれぞれは、汎用又は専用のコンピュータ200により構成される。コンピュータ200は、図3に示すように、その主要な構成要素として、バス210、プロセッサ212、メモリ214、入力デバイス216、表示デバイス218、ストレージ装置220、通信I/F(インターフェース)部222、外部機器I/F部224、I/O(入出力)デバイスI/F部226、及び、メディア入出力部228を備える。なお、上記の構成要素は、コンピュータ200が使用される用途に応じて適宜省略されてもよい。
【0047】
プロセッサ212は、1つ又は複数の演算処理装置(CPU、MPU、GPU、DSP等)で構成され、コンピュータ200全体を統括する制御部として動作する。メモリ214は、各種のデータ及びプログラム230を記憶し、例えば、メインメモリとして機能する揮発性メモリ(DRAM、SRAM等)と、不揮発性メモリ(ROM、フラッシュメモ
リ等)とで構成される。
【0048】
入力デバイス216は、例えば、キーボード、マウス、テンキー、電子ペン等で構成される。表示デバイス218は、例えば、液晶ディスプレイ、有機ELディスプレイ、電子ペーパー、プロジェクタ等で構成される。入力デバイス216及び表示デバイス218は、タッチパネルディスプレイのように、一体的に構成されていてもよい。ストレージ装置220は、例えば、HDD、SSD等で構成され、オペレーティングシステムやプログラム230の実行に必要な各種のデータを記憶する。
【0049】
通信I/F部222は、インターネットやイントラネット等のネットワーク240に有線又は無線により接続され、所定の通信規格に従って他のコンピュータとの間でデータの送受信を行う。外部機器I/F部224は、プリンタ、スキャナ等の外部機器250に有線又は無線により接続され、所定の通信規格に従って外部機器250との間でデータの送受信を行う。I/OデバイスI/F部226は、各種のセンサ、アクチュエータ等のI/Oデバイス260に接続され、I/Oデバイス260との間で、例えば、センサによる検出信号やアクチュエータへの制御信号等の各種の信号やデータの送受信を行う。メディア入出力部228は、例えば、DVDドライブ、CDドライブ等のドライブ装置で構成され、DVD、CD等のメディア270に対してデータの読み書きを行う。
【0050】
上記構成を有するコンピュータ200において、プロセッサ212は、プログラム230をメモリ214のワークメモリ領域に呼び出して実行し、バス210を介してコンピュータ200の各部を制御する。なお、プログラム230は、メモリ214の代わりに、ストレージ装置220に記憶されていてもよい。プログラム230は、インストール可能なファイル形式又は実行可能なファイル形式でCD、DVD等の非一時的な記録媒体に記録され、メディア入出力部228を介してコンピュータ200に提供されてもよい。プログラム230は、通信I/F部222を介してネットワーク240経由でダウンロードすることによりコンピュータ200に提供されてもよい。また、コンピュータ200は、プロセッサ212がプログラム230を実行することで実現する各種の機能を、例えば、FPGA、ASIC等のハードウエアで実現するものでもよい。
【0051】
コンピュータ200は、例えば、据置型コンピュータや携帯型コンピュータで構成され、任意の形態の電子機器である。コンピュータ200は、クライアント型コンピュータでもよいし、サーバ型コンピュータやクラウド型コンピュータでもよい。コンピュータ200は、反応槽制御装置5及び機械学習装置6以外の他の装置に適用されてもよい。
【0052】
(機械学習装置6)
図4は、第1の実施形態に係る機械学習装置6の一例を示すブロック図である。
【0053】
機械学習装置6は、学習用データ取得部60と、学習用データ記憶部61と、機械学習部62と、学習済みモデル記憶部63とを備える。機械学習装置6は、例えば、図3に示すコンピュータ200で構成される。その場合、学習用データ取得部60は、通信I/F部222又はI/OデバイスI/F部226で構成され、機械学習部62は、プロセッサ212で構成され、学習用データ記憶部61及び学習済みモデル記憶部63は、ストレージ装置220で構成される。
【0054】
学習用データ取得部60は、各種の外部装置と通信網を介して接続され、入力データを少なくとも含む学習用データを取得するインタフェースユニットである。外部装置は、反応装置1、試験装置8、反応シミュレーション装置9、及び、作業者が使用する作業者用端末10等である。なお、外部装置は、これらの一部でもよいし、他の装置がさらに接続されてもよい。
【0055】
試験装置8は、反応装置1と同様の構成を有し、反応プロセスの試験運転を実行可能に構成される。反応シミュレーション装置9は、反応プロセスをモデル化し、数値計算により反応プロセスを解析可能に構成される。反応シミュレーション装置9は、例えば、所定の状態変数と運転パラメータ等からなるシミュレーション条件に基づいて、その状態変数で特定される反応装置1においてその運転パラメータに基づく反応装置1の運転が行われた場合に、その運転後の状態変数や原材料の反応状態を数値計算により算出する。
【0056】
学習用データ記憶部61は、学習用データ取得部60で取得した学習用データを複数組記憶するデータベースである。なお、学習用データ記憶部61を構成するデータベースの具体的な構成は適宜設計すればよい。
【0057】
機械学習部62は、学習用データ記憶部61に記憶された学習用データを用いて機械学習を実施する。すなわち、機械学習部62は、学習モデル2に学習用データを複数組入力することで、学習用データに含まれる入力データと反応装置1の運転パラメータとの相関関係を学習モデル2に学習させることで、学習済みの学習モデル2を生成する。本実施形態では、機械学習部62による教師あり学習の具体的な手法として、ニューラルネットワークを採用する場合について説明する。
【0058】
学習済みモデル記憶部63は、機械学習部62により生成された学習済みの学習モデル2を記憶するデータベースである。学習済みモデル記憶部63に記憶された学習済みの学習モデル2は、任意の通信網や記録媒体等を介して実システム(例えば、反応槽制御装置5の制御盤50)に提供される。なお、図4では、学習用データ記憶部61と、学習済みモデル記憶部63とが別々の記憶部として示されているが、これらは単一の記憶部で構成されてもよい。
【0059】
図5は、第1の実施形態に係る機械学習装置6で使用されるデータ(教師あり学習)の一例を示すデータ構成図である。図6は、第1の実施形態に係る機械学習装置6で使用される学習用データにおける入力データ(状態変数)と出力データ(運転パラメータ)との関係を示す説明図である。
【0060】
学習用データは、反応槽状態変数、及び、撹拌機状態変数を入力データとして少なくとも含む。入力データに含まれる反応槽状態変数は、反応槽センサ群35に含まれる各センサにて取得される。入力データに含まれる撹拌機状態変数は、撹拌機センサ群43に含まれる各センサにて取得される。
【0061】
反応槽状態変数は、反応槽3の加熱又は徐熱に係る熱量を示す熱量状態変数を少なくとも含む。熱量状態変数は、ジャケット熱媒温度T4、及び、ジャケット熱媒流量F1を少なくとも含む。熱量状態変数は、ジャケット熱媒温度T4の他に、冷水温度T5、及び、温水温度T6をさらに含むものでもよいし、ジャケット熱媒流量F1の他に、冷水流量F2、及び、温水流量F3をさらに含むものでもよい。
【0062】
反応槽状態変数は、熱量状態変数の他に、反応槽温度T1、T2、T3、反応槽圧力P1、及び、反応槽重量W1の少なくとも1つをさらに含むものでもよい。
【0063】
撹拌機状態変数は、撹拌機トルクST1を少なくとも含む。なお、撹拌機状態変数は、撹拌機トルクST1の他に、モータ回転数R1及びモータ電流値I1の少なくとも1つをさらに含むものでもよい。
【0064】
入力データは、反応槽状態変数、及び、撹拌機状態変数の他に、外部環境状態変数をさ
らに含むものでもよく、外部環境状態変数は、外部環境温度T7、及び、外部環境湿度H1の少なくとも1つを含む。入力データに含まれる外部環境状態変数は、外部環境センサ群37に含まれる各センサにて取得される。なお、入力データは、上記以外に他のデータをさらに含むものでもよい。
【0065】
入力データに含まれる状態変数の各々は、反応プロセスが進行する所定期間である状態変数取得期間において測定周期毎に測定された時系列データである。状態変数の時系列データは、例えば、状態変数としての各測定値が測定時点を示す測定時刻順に並べられた配列のデータであり、状態変数の経時変化を示すデータとして構成される。
【0066】
状態変数取得期間は、反応プロセスが開始されてから終了するまでのプロセス実行期間以下の期間に設定される。状態変数取得期間が短く設定されるほど、状態変数の時系列データを構成する配列の数(図6の例では「3」)は少なくなるが、状態変数取得期間は、反応プロセスの特性や学習モデル2に求められる推論精度を考慮して設定すればよい。状態変数取得期間がプロセス実行期間よりも短く設定された場合、状態変数取得期間の開始時点及び終了時点は、開始時点及び終了時点の時間間隔が固定されたまま状態変数取得期間内で任意に設定される。
【0067】
機械学習として、教師あり学習を採用する場合、学習用データは、入力データに対応付けられた出力データとして、反応装置1の運転パラメータをさらに含む。出力データは、教師あり学習において、例えば、教師データや正解ラベルと称される。
【0068】
運転パラメータは、反応槽3を加熱又は徐熱するときの指令値を示す反応槽運転パラメータ、及び、撹拌機4を駆動するときの指令値を示す撹拌機運転パラメータの少なくとも1つを含む。
【0069】
反応槽運転パラメータは、ジャケット熱媒温度T4に関する指令値、及び、ジャケット熱媒流量F1に関する指令値を少なくとも含む。なお、反応槽運転パラメータは、ジャケット熱媒温度T4に関する指令値の他に、冷水温度T5に関する指令値、及び、温水温度T6に関する指令値をさらに含むものでもよいし、ジャケット熱媒流量F1に関する指令値の他に、冷水流量F2に関する指令値、及び、温水流量F3に関する指令値をさらに含むものでもよい。
【0070】
撹拌機運転パラメータは、モータ回転数R1に関する指令値、及び、モータ電流値I1に関する指令値の少なくとも1つを含む。
【0071】
運転パラメータは、入力データに含まれる状態変数の状態変数取得期間における終了時点以降の時点データ又は時系列データである。運転パラメータの時点データは、状態変数取得期間の終了時点以降に次の指令周期が到来したときに出力される指令値である。運転パラメータの時系列データは、状態変数取得期間の終了時点以降に出力される各指令値が指令時点を示す指令時刻順に並べられた配列のデータであり、指令値の経時変化を示すデータとして構成される。
【0072】
本実施形態に係る学習用データは、図5図6に示すように、入力データと出力データとを含み、入力データ及び出力データが対応付けられて構成される。なお、図6では、ジャケット熱媒流量F1を示すグラフと、ジャケット熱媒流量F1に関する指令値を示すグラフを省略している。学習用データに含まれる入力データは、状態変数取得期間におけるジャケット熱媒温度T4の時系列データ、ジャケット熱媒流量F1の時系列データ、及び、撹拌機トルクST1の時系列データで構成される。学習用データに含まれる出力データは、ジャケット熱媒温度T4に関する指令値の時点データ、ジャケット熱媒流量F1に関
する指令値の時点データ、及び、モータ回転数R1に関する指令値の時点データからなる運転パラメータで構成される。図6では、2つの学習用データとして、一点鎖線で囲まれた学習用データAと、二点鎖線で囲まれた学習用データBとが示されている。
【0073】
したがって、学習用データに含まれる入力データは、反応プロセスの進行度合いに影響を与える熱量を表す代表値として、ジャケット熱媒温度T4及びジャケット熱媒流量F1を含むとともに、反応プロセスの進行に従って変化する原材料の反応状態を表す代表値として、撹拌機トルクST1を含む。そのため、これらの入力データが示す様々な反応プロセスの進行状況に対して過去の運転時に採用された運転パラメータの特徴量を機械学習により学習モデル2に学習させることで、例えば、熟練の作業者と同様の運転を再現することが可能となる。
【0074】
図7は、第1の実施形態に係る機械学習装置6で使用されるニューラルネットワークモデルの一例を示す模式図である。
【0075】
学習モデル2は、図7に示すニューラルネットワークモデルとして構成される。ニューラルネットワークモデルは、入力層にあるm個のニューロン(x1~xm)、第1中間層にあるp個のニューロン(y11~y1p)、第2中間層にあるq個のニューロン(y21~y2q)、及び、出力層にあるn個のニューロン(z1~zn)から構成される。
【0076】
入力層の各ニューロンには、学習用データに含まれる入力データのそれぞれが対応付けられる。出力層の各ニューロンには、学習用データに含まれる出力データのそれぞれが対応付けられる。なお、入力層に入力する前の入力データに対して所定の前処理(正規化、標準化、ワンホットエンコーディング等)を施してもよいし、出力層から出力された後の出力データに対して所定の後処理を施してもよい。
【0077】
第1中間層及び第2中間層は、隠れ層とも呼ばれており、ニューラルネットワークとしては、第1中間層及び第2中間層の他に、さらに複数の隠れ層を有するものでもよいし、第1中間層のみを隠れ層とするものでもよい。また、入力層と第1中間層との間、第1中間層と第2中間層との間、第2中間層と出力層との間には、各層のニューロンの間を接続するシナプスが張られており、それぞれのシナプスには、重みwi(iは自然数)が対応付けられる。
【0078】
ニューラルネットワークモデルは、学習用データを用いて、当該学習用データに含まれる入力データを入力層に入力し、その推論結果として出力層から出力された出力データと、当該学習用データに含まれる出力データ(教師データ)とを比較することで、入力データと出力データとの相関関係を学習する。
【0079】
具体的には、入力層の各ニューロンには、学習用データに含まれる入力データのそれぞれが入力される。そして、出力層の各ニューロンの値は、当該ニューロンに接続される入力側のニューロンの値と、出力側のニューロンと入力側のニューロンとを接続するシナプスに対応付けられた重みwiとの乗算値の数列の和として算出する処理を、入力層以外の全てのニューロンに対して行うことで算出される。
【0080】
そして、推論結果として出力層の各ニューロンに出力された値(z1~zn)と、学習用データに含まれる出力データのそれぞれに対応する教師データの値(t1~tn)とをそれぞれ比較して誤差を求め、その誤差が小さくなるように、各シナプスに対応付けられた重みwiを調整する処理(バックプロバケーション)が実施される。
【0081】
上記の一連の工程を所定回数反復実施すること、又は、上記の誤差が許容値より小さく
なること等の所定の学習終了条件が満たされた場合には、機械学習を終了する。これにより、学習済みのニューラルネットワークモデル(シナプスのそれぞれに対応付けられた全ての重みwi)が生成される。
【0082】
(機械学習方法)
図8は、第1の実施形態に係る機械学習装置6による機械学習方法の一例を示すフローチャートである。機械学習方法は、学習フェーズに該当する。
【0083】
まず、ステップS100において、学習用データ取得部60は、機械学習を開始するための事前準備として、所望の数の学習用データを準備し、その準備した学習用データを学習用データ記憶部61に記憶する。ここで準備する学習用データの数については、最終的に得られる学習モデル2に求められる推論精度を考慮して設定すればよい。
【0084】
学習用データを準備する方法には、いくつかの方法を採用することができる。例えば、手動運転モードにて作業者が反応槽制御機器群36及び撹拌機制御機器44を操作したときの手動運転履歴データ53を利用してもよく、学習用データ取得部60は、手動運転履歴データ53に記録された状態変数及び手動操作量を、学習用データの入力データ及び出力データとして取得する。その際、手動運転履歴データ53は、プロセス実行期間における時系列データとして記録されているため、状態変数取得期間がプロセス実行期間よりも短く設定された場合には、図6に示すように、プロセス実行期間に対して状態変数取得期間を測定周期単位でシフトさせることで、1つの手動運転履歴データ53から複数の学習用データが取得される。
【0085】
また、手動運転履歴データ53に完成後の検査結果が記録されている場合には、学習用データ取得部60は、その検査結果が所定の合格基準を満たす手動運転履歴データ53を抽出し、その抽出した手動運転履歴データ53に基づいて学習用データを取得してもよい。手動運転履歴データ53に完成後の検査結果が記録されていない場合には、学習用データ取得部60は、例えば、作業者用端末10を用いて作業者が指定した手動運転履歴データ53に基づいて学習用データを取得してもよい。
【0086】
さらに、自動運転モードにて自動運転モード部501が反応槽制御機器群36及び撹拌機制御機器44を制御したときの自動運転履歴データ52を利用してもよく、学習用データ取得部60は、手動運転履歴データ53と同様にして、自動運転履歴データ52に記録された状態変数及び手動操作量を、学習用データの入力データ及び出力データとして取得してもよい。
【0087】
なお、自動運転履歴データ52及び手動運転履歴データ53は、反応装置1で反応プロセスを行った場合に反応装置1により記録されたものだけでなく、試験装置8で反応プロセスを試験的に行った場合に、反応装置1と同様にして、試験装置8により記録されたものでもよい。また、学習用データ取得部60は、自動運転履歴データ52及び手動運転履歴データ53として記録されたものではなく、反応装置1が備える反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43から各センサの測定値(状態変数)を直接取得するとともに、反応槽制御機器群36及び撹拌機制御機器44からそのときの自動制御量や手動操作量を直接取得するようにしてもよい。
【0088】
次に、ステップS110において、機械学習部62は、機械学習を開始すべく、学習前の学習モデル2を準備する。ここで準備する学習前の学習モデル2は、図7に例示したニューラルネットワークモデルで構成されており、各シナプスの重みが初期値に設定されている。
【0089】
入力層の各ニューロンには、学習用データに含まれる入力データとしてのジャケット熱媒温度T4の時系列データ、ジャケット熱媒流量F1の時系列データ、及び、撹拌機トルクST1の時系列データのそれぞれが対応付けられる。そのため、例えば、状態変数取得期間(例えば、10分間)に含まれる測定回数(例えば、測定周期10秒)が、60回である場合には、上記の3つの時系列データは60点のデータをそれぞれ含むため、入力層は180個のニューロンを有する。
【0090】
出力層の各ニューロンには、学習用データに含まれる出力データとしてのジャケット熱媒温度T4に関する指令値の時点データ、ジャケット熱媒流量F1に関する指令値の時点データ、及び、モータ回転数R1に関する指令値の時点データのそれぞれが対応付けられる。そのため、出力層は3個のニューロンを有する。なお、指令値が、時点データではなく時系列データで構成される場合には、出力層は、その時系列データの配列の数に応じた数のニューロンを有する。
【0091】
次に、ステップS120において、機械学習部62は、学習用データ記憶部61に記憶された複数組の学習用データから、例えば、ランダムに一の学習用データを取得する。
【0092】
次に、ステップS130において、機械学習部62は、一の学習用データに含まれる入力データを、準備された学習前(又は学習中)の学習モデル2の入力層に入力する。その結果、学習モデル2の出力層から推論結果として出力データが出力されるが、当該出力データは、学習前(又は学習中)の学習モデル2によって生成されたものである。そのため、学習前(又は学習中)の状態では、推論結果として出力された出力データは、学習用データに含まれる出力データ(教師データ)とは異なる情報を示す。
【0093】
次に、ステップS140において、機械学習部62は、ステップS120において取得された一の学習用データに含まれる出力データ(教師データ)と、ステップS130において出力層から推論結果として出力された出力データとを比較し、各シナプスの重みを調整することで、機械学習を実施する。これにより、機械学習部62は、入力データと出力データとの相関関係を学習モデル2に学習させる。
【0094】
次に、ステップS150において、機械学習部62は、機械学習を継続する必要があるか否かを、例えば、出力データと教師データとの誤差や、学習用データ記憶部61内に記憶された未学習の学習用データの残数に基づいて判定する。
【0095】
ステップS150において、機械学習部62が機械学習を継続すると判定した場合(ステップS150でNo)、ステップS120に戻り、学習中の学習モデル2に対してステップS120~S140の工程を未学習の学習用データを用いて複数回実施する。一方、ステップS150において、機械学習部62が機械学習を終了すると判定した場合(ステップS150でYes)、ステップS160に進む。
【0096】
そして、ステップS160において、機械学習部62は、各シナプスに対応付けられた重みが調整されることで生成された学習済みの学習モデル2を学習済みモデル記憶部63に記憶し、図8に示す一連の機械学習方法を終了する。機械学習方法において、ステップS100が学習用データ記憶工程、ステップS110~S150が機械学習工程、ステップS160が学習済みモデル記憶工程に相当する。
【0097】
以上のように、本実施形態に係る機械学習装置6及び機械学習方法によれば、反応槽3に係る反応槽状態変数及び撹拌機4に係る撹拌機状態変数に基づいて反応装置1の運転パラメータの設定を支援することが可能な学習モデル2を提供することができる。
【0098】
(反応槽運転支援装置7)
図9は、第1の実施形態に係る反応槽運転支援装置7(運転支援部500)の一例を示すブロック図である。
【0099】
反応槽運転支援装置7は、入力データ取得部70と、推論部71と、学習済みモデル記憶部72と、出力処理部73とを備える。反応槽運転支援装置7は、例えば、図3に示すコンピュータ200で構成される。その場合、入力データ取得部70は、通信I/F部222又はI/OデバイスI/F部226で構成され、推論部71及び出力処理部73は、プロセッサ212で構成され、学習済みモデル記憶部72は、ストレージ装置220で構成される。本実施形態では、反応槽運転支援装置7は、反応槽制御装置5の制御盤50に組み込まれたものであるが、反応槽制御装置5とは別体の装置として、例えば、汎用又は専用のコンピュータ(図3参照)で構成されてもよい。
【0100】
入力データ取得部70は、反応装置1が備える反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43に接続され、各センサにより測定された測定値(状態変数)に基づく入力データを取得するインタフェースユニットである。本実施形態に係る入力データは、図5に示すように、状態変数取得期間(所定期間)におけるジャケット熱媒温度T4の時系列データ、状態変数取得期間におけるジャケット熱媒流量F1の時系列データ、及び、状態変数取得期間における撹拌機トルクST1の時系列データで構成される。
【0101】
推論部71は、入力データ取得部70により取得された入力データを学習モデル2に入力し、反応装置1の運転パラメータを推論する推論処理を行う。推論処理には、機械学習装置6及び機械学習方法にて教師あり学習が実施された学習済みの学習モデル2が用いられる。
【0102】
推論部71は、学習モデル2を用いた推論処理を行う機能のみならず、推論処理の前処理として、入力データ取得部70により取得された入力データを所望の形式等に調整して学習モデル2に入力する前処理機能や、推論処理の後処理として、学習モデル2から出力された出力データの値に所定の論理式や計算式を適用することで、反応装置1の運転パラメータを所望の形式等に調整する後処理機能をも含んでいる。なお、推論部71の推論結果は、学習済みモデル記憶部72や他の記憶装置(不図示)に記憶することが好ましく、過去の推論結果は、例えば、学習モデル2の推論精度の更なる向上のため、オンライン学習や再学習に用いられる学習用データとして利用することが可能である。
【0103】
学習済みモデル記憶部72は、推論部71の推論処理にて用いられる学習済みの学習モデル2を記憶するデータベースである。なお、学習済みモデル記憶部72には、複数の学習済モデルが格納されて、推論部71により選択的に用いられてもよい。複数の学習済モデルは、例えば、入力データ及び出力データの数や種類、学習手法、反応装置1を構成する反応槽3及び撹拌機4の各部の仕様、反応プロセスにおける原材料及び生成物の種類や量等が異なる毎に生成されたものである。
【0104】
出力処理部73は、推論部71の推論結果、すなわち、反応装置1の運転パラメータを出力する出力処理を行う。具体的な出力手段は、種々の手段を採用することが可能である。例えば、出力処理部73は、自動運転モードが選択されている場合には、運転パラメータを自動運転モード部501に出力することにより、運転パラメータに従って反応槽制御機器群36及び撹拌機制御機器44が自動で制御される。また、出力処理部73は、手動運転モードが選択されている場合には、運転パラメータを手動運転モード部502に出力することにより、運転パラメータに応じた運転支援情報が操作表示盤51を介して表示や音で作業者に報知される。
【0105】
(反応槽運転支援方法)
図10は、第1の実施形態に係る反応槽運転支援装置7(反応槽制御装置5の運転支援部500)による反応槽運転支援方法の一例を示すフローチャートである。反応槽運転支援方法は、推論フェーズに該当する。
【0106】
作業者が、操作表示盤51により反応プロセスの開始を指示する開始操作を行うと、反応槽制御装置5は、その開始操作を受け付けて、図10に示す一連の反応槽運転支援方法を実行する。
【0107】
まず、ステップS200において、反応装置1が備える反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43が、各種の測定値(状態変数)を測定周期毎に測定する。
【0108】
次に、ステップS210において、運転支援部500(入力データ取得部70)は、反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43の各センサにより測定周期毎に測定された状態変数に基づいて入力データを取得する。
【0109】
本実施形態では、入力データは、図5に示すように、状態変数取得期間(所定期間)におけるジャケット熱媒温度T4の時系列データ、状態変数取得期間におけるジャケット熱媒流量F1の時系列データ、及び、状態変数取得期間における撹拌機トルクST1の時系列データである。そのため、状態変数取得期間が経過するまでは、例えば、初期設定値により自動で制御されるか、作業者により手動で操作される。そして、状態変数取得期間が経過した時点で、上記の時系列データが状態変数として測定されることで、運転支援部500は入力データを取得する。
【0110】
次に、ステップS220において、運転支援部500(推論部71)は、入力データに前処理を施して学習モデル2の入力層に入力し、反応装置1の運転パラメータを推論し、その学習モデル2の出力層から出力された出力データを取得する。
【0111】
次に、ステップS230~S234において、運転支援部500(出力処理部73)は、推論部71の推論結果である運転パラメータを出力することで、運転パラメータの設定を支援する。
【0112】
具体的には、ステップS230において、自動運転モードか手動運転モードかを判定する。そして、ステップS230において、運転支援部500が自動運転モードと判定した場合には、運転パラメータを自動運転モード部501に出力し、ステップS232において、運転パラメータに従って反応槽制御機器群36及び撹拌機制御機器44が自動で制御される。
【0113】
一方、ステップS230において、運転支援部500が手動運転モードと判定した場合には、ステップS233において、運転パラメータを手動運転モード部502に出力し、ステップS234において、運転パラメータに応じた運転支援情報が操作表示盤51を介して作業者に報知され、反応槽制御機器群36及び撹拌機制御機器44が手動で操作される。
【0114】
次に、ステップS240において、運転支援部500は、反応プロセスが終了したか否かを判定する。その結果、反応プロセスが終了していないと判定した場合には(ステップS240でNo)、ステップS200に戻り、上記のステップS200~S234の工程を実行することで、次の指令周期が到来したタイミングで新たな運転パラメータの設定を支援する。
【0115】
一方、ステップS240において、運転支援部500が、反応プロセスが終了したと判定した場合には(ステップS240でYes)、図10に示す一連の反応槽運転支援方法を終了する。反応槽運転支援方法において、ステップS210が入力データ取得工程、ステップS220が推論工程、ステップS230~S234が出力処理工程に相当する。
【0116】
以上のように、本実施形態に係る反応槽運転支援装置7及び反応槽運転支援方法によれば、学習モデル2を利用することにより、反応槽3に係る反応槽状態変数及び撹拌機4に係る撹拌機状態変数に基づいて反応装置1の運転パラメータの設定を支援することができる。よって、作業者の経験に依存することなく、製造品質の向上及び製造時間の短縮を図ることができる。
【0117】
(第2の実施形態)
第1の実施形態では、機械学習の手法として、「教師あり学習」を採用した場合について説明したが、本実施形態では、「強化学習」を採用した場合について説明する。なお、第2の実施形態に係る反応装置1、機械学習装置6及び反応槽運転支援装置7(運転支援部500)の基本的な構成や動作は、第1の実施形態と同様であるため、以下では第1の実施形態との相違点を中心に説明する。
【0118】
(機械学習装置6)
機械学習装置6は、第1の実施形態(図4参照)と同様に、学習用データ取得部60と、学習用データ記憶部61と、機械学習部62と、学習済みモデル記憶部63とを備える。
【0119】
機械学習部62は、強化学習のエージェントとして機能する。強化学習の基本的な仕組みにおいて、エージェントは、所定の条件下において環境の状態を観測し、その観測された状態に対して所定の方策に従って行動を選択する。そして、その選択した行動により環境の状態が変化したとき、その状態の変化に応じた報酬を受け取り、その選択した行動の価値を評価する。このような一連の処理として、状態の観測、行動の選択、価値の評価を繰り返すことで、報酬を最も多く獲得できるように行動を選択するための方策を学習モデル2に学習させる。
【0120】
図11は、第2の実施形態に係る機械学習装置6で使用されるデータ(強化学習)の一例と、強化学習の関係を示す概略図である。
【0121】
機械学習部62による強化学習を、上記の強化学習の基本的な仕組みに対応させた場合、環境は、反応装置1や反応装置1で行われる反応プロセスである。
【0122】
状態sは、反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43により測定される各種の状態変数や、反応槽本体30の内部の原材料の反応状態である。原材料の反応状態は、例えば、反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43により測定される各種の状態変数に基づいて反応指標値として算出される。反応指標値は、例えば、反応開始時を0%とし、反応終了時を100%として、0~100%の範囲で表される。本実施形態に係る状態sは、図11に示すように、ジャケット熱媒温度T4の時系列データ、ジャケット熱媒流量F1の時系列データ、及び、撹拌機トルクST1の時系列データで構成される。
【0123】
行動aは、反応装置1の運転パラメータとして取り得る複数の運転パラメータである。本実施形態に係る行動aは、図11に示すように、反応装置1が取り得る6つの運転パラメータ(行動a~a)として、ジャケット熱媒温度T4の増加量に関する指令値(a
)及び減少量に関する指令値(a)、ジャケット熱媒流量F1の増加量に関する指令値(a)及び減少量に関する指令値(a)、並びに、モータ回転数R1の増加量に関する指令値(a)及び減少量に関する指令値(a)である。なお、増加量及び減少量の大きさは適宜設定すればよく、複数段階で設定されてもよい。
【0124】
報酬rは、変化前の原材料の反応状態に対して運転パラメータに基づく反応装置1の運転が行動aとして行われた後(変化後)の原材料の反応状態と、反応プロセスの進行に伴って推移する反応状態の目標値を示す目標推移TGとの差Dに基づいて算出される。報酬rは、上記の差Dが小さいほど大きくなるように算出されるものとして定義される。
【0125】
図11の例では、時刻t1の状態s1対して異なる2つの行動a、aを取った後の時刻t2の状態s2(a)、s2(a)を比較した場合、目標推移TGとの差Dは、D(a)<D(a)となるため、行動aに対する報酬rは、行動aに対する報酬rよりも大きく算出される。なお、報酬rの定義は、適宜変更してもよく、例えば、複数の観点をさらに考慮してもよく、運転パラメータの変化量が小さいほど大きくなるように算出されるようにしてもよいし、製造時間が短いほど大きくなるように算出されるようにしてもよい。
【0126】
目標推移TGは、検査結果が所定の合格基準を満たす手動運転履歴データ53又は自動運転履歴データ52に基づいて、これらに含まれる状態変数の時間推移から反応指標値の時間推移を算出することで取得される。なお、手動運転履歴データ53又は自動運転履歴データ52は、反応槽制御装置5により運転パラメータの設定が支援された状態で記録されたものでもよいし、運転パラメータの設定が支援されていない状態で記録されたものでもよい。
【0127】
また、目標推移TGは、複数の手動運転履歴データ53又は自動運転履歴データ52からも取得可能であり、その場合には、複数の反応指標値の時間推移から、例えば、回帰曲線等を統計的に算出することで取得される。そのため、目標推移TGは、時間tと、状態変数(例えば、ジャケット熱媒温度T4、ジャケット熱媒流量F1、及び、撹拌機トルクST1)を変数とする関数で近似されるものでもよい。また、目標推移TGは、各時点において下限値及び上限値により定められる所定の幅を有するものでもよい。
【0128】
機械学習として、強化学習を採用する場合、学習データは、状態sに対応する入力データのみを含む。すなわち、学習データは、出力データを含まない構成としてもよく、機械学習装置6が採用する機械学習の手法に応じて出力データの有無や出力データの形式を適宜選択することができる。本実施形態に係る学習用データに含まれる入力データは、図11に示すように、状態変数取得期間におけるジャケット熱媒温度T4の時系列データ、ジャケット熱媒流量F1の時系列データ、及び、撹拌機トルクST1の時系列データで構成される。
【0129】
本実施形態では、状態sに対して所定の行動aを取ったときの評価は、Q学習法の行動価値関数Q(s,a)を用いて行うものとして説明する。行動価値関数Q(s,a)は、状態sにおいて行動aを取った場合において将来に亘って獲得することができる報酬rの期待値である。
【0130】
行動価値関数Q(s,a)は、例えば、DQN(Deep Q-Network)と呼ばれる手法により、状態sを入力変数とし、状態sにおいて各行動a(k=1,2,…,n)をそれぞれ取ったときの行動価値関数Q(s,a)を出力変数とするニューラルネットワークモデルで近似的に算出することができる。この場合、機械学習部62は、例えば、報酬r、学習率α、割引率γを変数として含む誤差関数(例えば、TD誤差)が最
小になるように、ニューラルネットワークモデルの重みwiを調整することで行動価値関数Q(s,a)を更新し、入力データ(状態s)と運転パラメータ(行動a)との相関関係を学習モデル2に学習させる。なお、強化学習の手法としては、任意の手法を採用すればよく、Q学習法の他に、例えば、SARSA法、モンテカルロ法等を採用してもよい。
【0131】
図12は、第2の実施形態に係る機械学習装置6で使用されるニューラルネットワークモデルの一例を示す模式図である。
【0132】
学習モデル2は、行動価値関数Q(s,a)を近似的に算出するために、図12に示すニューラルネットワークモデルとして構成される。図12に示すニューラルネットワークモデルは、図7に示すものと同様に構成される。
【0133】
入力層の各ニューロンには、学習用データに含まれる入力データ(状態s)のそれぞれが対応付けられる。出力層の各ニューロンには、状態sに対して各行動a(k=1,2,…,n)を取ったときの行動価値関数Q(s,a)のそれぞれが対応付けられる。
【0134】
(機械学習方法)
図13は、第2の実施形態に係る機械学習装置6による機械学習方法の一例を示すフローチャートである。
【0135】
まず、ステップS300において、学習用データ取得部60は、機械学習を開始するための事前準備として、所望の数の学習用データを準備し、その準備した学習用データを学習用データ記憶部61に記憶する。
【0136】
学習用データを準備する方法には、いくつかの方法を採用することができる。例えば、学習用データ取得部60は、第1と実施形態と同様に、手動運転履歴データ53又は自動運転履歴データ52に記録された状態変数を、学習用データの入力データ(状態s)として取得すればよい。
【0137】
次に、ステップS310において、機械学習部62は、機械学習を開始すべく、学習前の学習モデル2を準備する。ここで準備する学習前の学習モデル2は、図12に例示したニューラルネットワークモデルで構成されており、各シナプスの重みが初期値に設定されている。
【0138】
入力層の各ニューロンには、学習用データに含まれる入力データ(状態s)としてのジャケット熱媒温度T4の時系列データ、ジャケット熱媒流量F1の時系列データ、及び、撹拌機トルクST1の時系列データのそれぞれが対応付けられる。
【0139】
出力層の各ニューロンには、反応装置1が取り得る運転パラメータ(行動a)として、ジャケット熱媒温度T4の増加量に関する指令値(a)及び減少量に関する指令値(a)、ジャケット熱媒流量F1の増加量に関する指令値(a)及び減少量に関する指令値(a)、並びに、モータ回転数R1の増加量に関する指令値(a)及び減少量に関する指令値(a)のそれぞれが対応付けられる。出力層の各ニューロンは、各行動aの行動価値関数Q(s,a)の値をそれぞれ出力する。
【0140】
次に、ステップS311において、機械学習部62は、反応プロセスの進行に伴って推移する反応状態の目標値を示す目標推移TGを算出する。
【0141】
次に、ステップS320において、機械学習部62は、学習用データ記憶部61に記憶
された複数組の学習用データから、例えば、ランダムに一の学習用データを取得する。
【0142】
次に、ステップS330において、機械学習部62は、ステップS320で取得した一の学習用データに含まれる入力データ(状態s1)を、準備された学習前(又は学習中)の学習モデル2の入力層に入力する。その結果、学習モデル2の出力層から推論結果として、各行動aの価値(行動価値関数Q(s,a)の値)が出力される。
【0143】
次に、ステップS340において、機械学習部62は、ステップS330において出力層から推論結果として出力された各行動aの行動価値関数Q(s,a)の値に基づいて、例えば、最大値に対応する特定の一の行動aを選択する。特定の一の行動aを選択する手法としては、例えば、greedy法、ε-greedy法等を採用すればよい。
【0144】
次に、ステップS350において、機械学習部62は、状態s1に対してステップS350で選択した行動aを取った後の状態s2を取得する。具体的には、機械学習部62は、状態s1が示すジャケット熱媒温度T4の時系列データ、ジャケット熱媒流量F1の時系列データ、及び、撹拌機トルクST1の時系列データに基づく原材料の反応状態に対して、行動aに対応する運転パラメータに基づく反応装置1の運転が行われ、その運転が行われた後の時点におけるジャケット熱媒温度T4、ジャケット熱媒流量F1、及び、撹拌機トルクST1を状態s2として取得する。ここでの反応装置1の運転は、例えば、機械学習の初期段階では、反応シミュレーション装置9を用いて行われるものであり、機械学習の最終段階では、反応装置1にて実際に行われるようにしてもよい。
【0145】
次に、ステップS360において、機械学習部62は、ステップS350で取得した状態s2と、ステップS311で取得した目標推移TGとに基づいて報酬rを算出する。具体的には、機械学習部62は、状態s2が示すジャケット熱媒温度T4、ジャケット熱媒流量F1、及び、撹拌機トルクST1に基づく原材料の反応状態と、目標推移TGとの差Dに基づいて算出される。
【0146】
次に、ステップS370において、機械学習部62は、ステップS360で算出した報酬rに基づいて、誤差関数が最小になるように、ニューラルネットワークモデルの重みwiを調整することで行動価値関数Q(s,a)を更新する。これより、機械学習部62は、入力データ(状態s)と運転パラメータ(行動a)との相関関係を学習モデル2に学習させる。なお、行動価値関数Q(s,a)の更新は、毎回行わなくてもよく、例えば、所定の条件を満たす場合にだけ行うようにしてもよい。
【0147】
次に、ステップS380において、機械学習部62は、別の学習用データを用いて機械学習を実施するか否かを判定する。その結果、機械学習部62は、ステップS320で取得した学習用データを用いて機械学習を継続すると判定した場合(ステップS380でNo)、ステップS330に戻り、ステップS350で取得した状態s2をステップS330での状態s1として扱うことにより、学習中の学習モデル2に対してステップS330~S370の工程を実施する。一方、機械学習部62は、別の学習用データを用いると判定した場合(ステップS380でYes)、ステップS381に進む。
【0148】
次に、ステップS381において、機械学習部62は、機械学習を継続する必要があるか否かを判定する。その結果、継続すると判定した場合(ステップS381でNo)、ステップS320に戻り、学習中の学習モデル2に対してステップS320~S380の工程を実施し、機械学習を終了すると判定した場合(ステップS381でYes)、ステップS390に進む。
【0149】
そして、ステップS390において、機械学習部62は、各シナプスに対応付けられた
重みが調整されることで生成された学習済みの学習モデル2を学習済みモデル記憶部63に記憶し、図13に示す一連の機械学習方法を終了する。機械学習方法において、ステップS300が学習用データ記憶工程、ステップS310~S381が機械学習工程、ステップS390が学習済みモデル記憶工程に相当する。
【0150】
以上のように、本実施形態に係る機械学習装置6及び機械学習方法によれば、反応槽3に係る反応槽状態変数及び撹拌機4に係る撹拌機状態変数に基づいて反応装置1の運転パラメータの設定を支援することが可能な学習モデル2を提供することができる。
【0151】
(反応槽運転支援装置7)
反応槽運転支援装置7は、第1の実施形態(図9参照)と同様に、入力データ取得部70と、推論部71と、学習済みモデル記憶部72と、出力処理部73とを備える。
【0152】
推論部71は、入力データ取得部70により取得された入力データを学習モデル2に入力し、反応装置1の運転パラメータを推論する推論処理を行う。推論処理には、機械学習装置6及び機械学習方法にて強化学習が実施された学習済みの学習モデル2が用いられる。
【0153】
(反応槽運転支援方法)
図14は、第2の実施形態に係る反応槽運転支援装置7(反応槽制御装置5の運転支援部500)による反応槽運転支援方法の一例を示すフローチャートである。
【0154】
まず、ステップS400において、反応装置1が備える反応槽センサ群35、外部環境センサ群37及び撹拌機センサ群43が、各種の測定値(状態変数)を測定周期毎に測定する。
【0155】
次に、ステップS410において、運転支援部500(入力データ取得部70)は、各センサにより測定周期毎に測定された状態変数に基づいて入力データ(状態s)を取得する。
【0156】
ステップS420において、運転支援部500(推論部71)は、入力データ(状態s)に前処理を施して学習モデル2の入力層に入力し、反応装置1の運転パラメータを推論し、その学習モデル2の出力層から出力された出力データ(各行動aの行動価値関数Q(s,a)の値)を取得する。
【0157】
次に、ステップS421において、運転支援部500(推論部71)は、強化学習の後処理の一例として、出力データとして出力層の各ニューロンから出力された各行動aの行動価値関数Q(s,a)の値に基づいて、その中で最大値を与える行動aを選択する。
【0158】
次に、ステップS430~S434において、運転支援部500(出力処理部73)は、ステップS421で選択した行動aに対応する運転パラメータを出力することで、運転パラメータの設定を支援する。なお、ステップS430~S434は、図10のステップS230~S234と同様であるため、詳細な説明は省略する。
【0159】
次に、ステップS440において、運転支援部500は、反応プロセスが終了したか否かを判定する。その結果、反応プロセスが終了していないと判定した場合には(ステップS440でNo)、ステップS400に戻り、上記のステップS400~S434の工程を実行することで、次の指令周期が到来したタイミングで新たな運転パラメータの設定を支援する。
【0160】
一方、ステップS440において、運転支援部500が、反応プロセスが終了したと判定した場合には(ステップS440でYes)、図14に示す一連の反応槽運転支援方法を終了する。反応槽運転支援方法において、反応槽運転支援方法において、ステップS410が入力データ取得工程、ステップS420、S421が推論工程、ステップS430~S434が出力処理工程に相当する。
【0161】
以上のように、本実施形態に係る反応槽運転支援装置7及び反応槽運転支援方法によれば、学習モデル2を利用することにより、反応槽3に係る反応槽状態変数及び撹拌機4に係る撹拌機状態変数に基づいて反応装置1の運転パラメータの設定を支援することができる。よって、作業者の経験に依存することなく、製造品質の向上及び製造時間の短縮を図ることができる。
【0162】
(他の実施形態)
本発明は上述した実施形態に制約されるものではなく、本発明の主旨を逸脱しない範囲内で種々変更して実施することが可能である。そして、それらはすべて、本発明の技術思想に含まれるものである。
【0163】
上記実施形態では、反応槽運転支援装置7は、自動運転モードと手動運転モードとが切替可能な反応装置1に適用されたものとして説明した。これに対し、反応槽運転支援装置7は、自動運転モード及び手動運転モードのいずかを実行する反応装置1に適用されてもよい。また、反応槽運転支援装置7は、例えば、反応装置1の製造工場にて反応槽制御装置5に組み込まれた状態で出荷されてもよいし、工場出荷後の既設の反応槽制御装置5に後付けされてもよい。
【0164】
上記実施形態では、学習データが入力データとして含む状態変数の各々は、時系列データであるものとして説明した。これに対し、学習データが入力データとして含む状態変数の各々は、特定の時点における時点データとしてもよい。
【0165】
上記実施形態では、機械学習部62による機械学習の具体的な手法として、ニューラルネットワークを採用した場合について説明した。これに対し、機械学習部62は、任意の他の機械学習の手法を採用してもよい。他の機械学習の手法としては、例えば、決定木、回帰木等のツリー型、バギング、ブースティング等のアンサンブル学習、再帰型ニューラルネットワーク、畳み込みニューラルネットワーク、LSTM等のニューラルネット型(
ディープラーニングを含む)、階層型クラスタリング、非階層型クラスタリング、k近傍
法、k平均法等のクラスタリング型、主成分分析、因子分析、ロジスティク回帰等の多変量解析、サポートベクターマシン等が挙げられる。
【0166】
(機械学習プログラム)
本発明は、図3に示すコンピュータ200に、上記実施形態に係る機械学習方法が備える各工程を実行させるためのプログラム(機械学習プログラム)230の態様で提供することもできる。
【0167】
(反応槽運転支援プログラム)
本発明は、図3に示すコンピュータ200に、上記実施形態に係る反応槽運転支援方法が備える各工程を実行させるためのプログラム(反応槽運転支援プログラム)230の態様で提供することもできる。
【0168】
(推論装置、推論方法及び推論プログラム)
本発明は、上記実施形態に係る反応槽運転支援装置7(反応槽運転支援方法又は反応槽
運転支援プログラム)の態様によるもののみならず、反応装置1の運転パラメータを設定するために用いられる推論装置(推論方法又は推論プログラム)の態様で提供することもできる。その場合、推論装置(推論方法又は推論プログラム)としては、メモリと、プロセッサとを含み、このうちのプロセッサが、一連の処理を実行するものとすることができる。当該一連の処理とは、反応槽3に係る反応槽状態変数、及び、撹拌機4に係る撹拌機状態変数を少なくとも含む入力データを取得する入力データ取得処理(入力データ取得工程)と、入力データ取得処理にて入力データを取得すると、反応装置1の運転パラメータを推論する推論処理(推論工程)とを含む。
【0169】
推論装置(推論方法又は推論プログラム)の態様で提供することで、反応槽運転支援装置7を実装する場合に比して簡単に種々の装置への適用が可能となる。推論装置(推論方法又は推論プログラム)が反応装置1の運転パラメータを推論する際、上記実施形態に係る機械学習装置6及び機械学習方法により生成された学習済みの学習モデル2を用いて、反応槽運転支援装置7の推論部71が実施する推論手法を適用してもよいことは、当業者にとって当然に理解され得るものである。
【符号の説明】
【0170】
1…反応装置、2…学習モデル、3…反応槽、4…撹拌機、5…反応槽制御装置、
6…機械学習装置、7…反応槽運転支援装置、8…試験装置、
9…反応シミュレーション装置、10…作業者用端末、
30…反応槽本体、31…原材料投入口、32…生成物排出口、
33…ジャケット、34…熱媒循環流路、35…反応槽センサ群、
36…反応槽制御機器群、37…外部環境センサ群、
40…攪拌翼、41…モータ、42…回転軸、
43…撹拌機センサ群、44…撹拌機制御機器、
50…制御盤、51…操作表示盤、
52…自動運転履歴データ、53…手動運転履歴データ、
60…学習用データ取得部、61…学習用データ記憶部、
62…機械学習部、63…学習済みモデル記憶部、
70…入力データ取得部、71…推論部、
72…学習済みモデル記憶部、73…出力処理部、
200…コンピュータ、
340…冷水循環流路、341…温水循環流路、350…ジャケット熱媒温度センサ、
351…冷水温度センサ、352…温水温度センサ、
353…ジャケット熱媒流量センサ、354…冷水流量センサ、
355…温水流量センサ、356A~356C…反応槽温度センサ、
357…反応槽圧力センサ、358…反応槽重量センサ、
360…冷却機器、361…加熱機器、362…冷水流量調整弁、
363…冷水ポンプ、364…温水流量調整弁、365…温水ポンプ、
370…外部環境温度センサ、371…外部環境湿度センサ、
430…撹拌機トルクセンサ、431…モータ回転数センサ、
432…モータ電流センサ、433…振動センサ、434…音響センサ、
500…運転支援部、501…自動運転モード部、502…手動運転モード部、
F1…ジャケット熱媒流量、F2…冷水流量、F3…温水流量、
T1~T3…反応槽温度、T4…ジャケット熱媒温度、T5…冷水温度、
T6…温水温度、P1…反応槽圧力、W1…反応槽重量、
ST1…撹拌機トルク、I1…モータ電流値、R1…モータ回転数、
N1…音響値、O1…振動値、T7…外部環境温度、H1…外部環境湿度
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14