IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 横河電機株式会社の特許一覧

特許7484868操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム
<>
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図1
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図2
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図3
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図4
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図5
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図6
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図7
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図8
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図9
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図10
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図11
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図12
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図13
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図14
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図15
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図16
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図17
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図18
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図19
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図20
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図21
  • 特許-操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム 図22
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-05-08
(45)【発行日】2024-05-16
(54)【発明の名称】操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラム
(51)【国際特許分類】
   G05B 13/02 20060101AFI20240509BHJP
   G05B 23/02 20060101ALI20240509BHJP
   G06N 20/00 20190101ALI20240509BHJP
【FI】
G05B13/02 L
G05B23/02 G
G06N20/00 130
G06N20/00
【請求項の数】 14
(21)【出願番号】P 2021175652
(22)【出願日】2021-10-27
(65)【公開番号】P2023065072
(43)【公開日】2023-05-12
【審査請求日】2022-11-09
(73)【特許権者】
【識別番号】000006507
【氏名又は名称】横河電機株式会社
(74)【代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】▲高▼見 豪
(72)【発明者】
【氏名】鹿子木 宏明
(72)【発明者】
【氏名】小渕 恵一郎
(72)【発明者】
【氏名】古川 陽太
【審査官】西井 香織
(56)【参考文献】
【文献】特開2021-064049(JP,A)
【文献】特開2019-141869(JP,A)
【文献】特開2021-143882(JP,A)
【文献】特開2021-037716(JP,A)
【文献】特開2017-224027(JP,A)
【文献】米国特許第10766136(US,B1)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/02
G05B 23/02
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
機械学習により、設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成装置と、
前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記設備における状態に応じた行動を出力する操業モデルを生成する操業モデル生成装置と、
前記設備の状態に応じて前記操業モデルが出力する行動に基づく操作量を、前記設備における制御対象へ与える制御装置と
を備え
前記評価モデル生成装置は、前記制御対象が前記操業モデルを用いて制御された場合における前記設備における状態に基づいて、前記評価モデルを更新し、
前記操業モデル生成装置は、更新された前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記操業モデルを更新する、操業システム。
【請求項2】
前記制御装置は、更新された前記操業モデルを用いて前記制御対象を制御する、請求項に記載の操業システム。
【請求項3】
機械学習により、設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成装置と、
前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記設備における状態に応じた行動を出力する操業モデルを生成する操業モデル生成装置と、
前記設備の状態に応じて前記操業モデルが出力する行動に基づく操作量を、前記設備における制御対象へ与える制御装置と
を備え
前記評価モデル生成装置は、
前記操業目標を取得する操業目標取得部と、
前記設備における状態を示す状態データを取得する状態データ取得部と、
前記操業目標に基づいて、前記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、前記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する相関データ生成部と、
ラベリングモデルを用いて、前記相関データをラベリングするラベリング部と、
前記ラベリングされた相関データを用いて、前記評価モデルを生成する評価モデル生成部と
を備える、操業システム。
【請求項4】
前記評価モデル生成装置は、
前記評価モデルの妥当性を判定する評価モデル判定部を更に備える、請求項に記載の操業システム。
【請求項5】
前記評価モデル生成装置は、
前記評価モデルが妥当であると判定された場合に、前記評価モデルを出力する評価モデル出力部を更に備える、請求項に記載の操業システム。
【請求項6】
前記評価モデル生成装置は、
前記評価モデルが妥当であると判定された場合に、前記ラベリングモデルを更新するラベリングモデル更新部を更に備える、請求項4または5に記載の操業システム。
【請求項7】
前記評価モデル生成装置は、前記相関データの少なくとも一部について教師ラベルを取得する教師ラベル取得部を更に備え、
前記ラベリングモデル更新部は、前記教師ラベルに基づいて生成された初期のラベリングモデルとは別に、更新用のラベリングモデルを生成する、請求項に記載の操業システム。
【請求項8】
機械学習により、設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成することと、
前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記設備における状態に応じた行動を出力する操業モデルを生成することと、
前記設備の状態に応じて前記操業モデルが出力する行動に基づく操作量を、前記設備における制御対象へ与えることと
を備え
前記評価モデルを生成することは、前記制御対象が前記操業モデルを用いて制御された場合における前記設備における状態に基づいて、前記評価モデルを更新することを含み、
前記操業モデルを生成することは、更新された前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記操業モデルを更新することを含む、操業方法。
【請求項9】
機械学習により、設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成することと、
前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記設備における状態に応じた行動を出力する操業モデルを生成することと、
前記設備の状態に応じて前記操業モデルが出力する行動に基づく操作量を、前記設備における制御対象へ与えることと
を備え
前記評価モデルを生成することは、
前記操業目標を取得することと、
前記設備における状態を示す状態データを取得することと、
前記操業目標に基づいて、前記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、前記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成することと、
ラベリングモデルを用いて、前記相関データをラベリングすることと、
前記ラベリングされた相関データを用いて、前記評価モデルを生成することと
を有する、操業方法。
【請求項10】
コンピュータにより実行されて、前記コンピュータを、
機械学習により、設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成装置と、
前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記設備における状態に応じた行動を出力する操業モデルを生成する操業モデル生成装置と、
前記設備の状態に応じて前記操業モデルが出力する行動に基づく操作量を、前記設備における制御対象へ与える制御装置と
して機能させ
前記評価モデル生成装置は、前記制御対象が前記操業モデルを用いて制御された場合における前記設備における状態に基づいて、前記評価モデルを更新し、
前記操業モデル生成装置は、更新された前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記操業モデルを更新する、操業プログラム。
【請求項11】
コンピュータにより実行されて、前記コンピュータを、
機械学習により、設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成装置と、
前記評価モデルの出力を報酬の少なくとも一部とした強化学習により、前記設備における状態に応じた行動を出力する操業モデルを生成する操業モデル生成装置と、
前記設備の状態に応じて前記操業モデルが出力する行動に基づく操作量を、前記設備における制御対象へ与える制御装置と
して機能させ
前記評価モデル生成装置は、
前記操業目標を取得する操業目標取得部と、
前記設備における状態を示す状態データを取得する状態データ取得部と、
前記操業目標に基づいて、前記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、前記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する相関データ生成部と、
ラベリングモデルを用いて、前記相関データをラベリングするラベリング部と、
前記ラベリングされた相関データを用いて、前記評価モデルを生成する評価モデル生成部と
を備える、操業プログラム。
【請求項12】
設備における操業目標を取得する操業目標取得部と、
前記設備における状態を示す状態データを取得する状態データ取得部と、
前記操業目標に基づいて、前記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、前記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する相関データ生成部と、
ラベリングモデルを用いて、前記相関データをラベリングするラベリング部と、
前記ラベリングされた相関データを用いて、前記設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成部と
を備え
前記評価モデルは、前記設備における状態に応じた行動を出力する操業モデルの強化学習において報酬の少なくとも一部として用いられる前記指標を出力する、評価モデル生成装置。
【請求項13】
設備における操業目標を取得することと、
前記設備における状態を示す状態データを取得することと、
前記操業目標に基づいて、前記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、前記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成することと、
ラベリングモデルを用いて、前記相関データをラベリングすることと、
前記ラベリングされた相関データを用いて、前記設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成することと
を備え
前記評価モデルは、前記設備における状態に応じた行動を出力する操業モデルの強化学習において報酬の少なくとも一部として用いられる前記指標を出力する、評価モデル生成方法。
【請求項14】
コンピュータにより実行されて、前記コンピュータを、
設備における操業目標を取得する操業目標取得部と、
前記設備における状態を示す状態データを取得する状態データ取得部と、
前記操業目標に基づいて、前記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、前記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する相関データ生成部と、
ラベリングモデルを用いて、前記相関データをラベリングするラベリング部と、
前記ラベリングされた相関データを用いて、前記設備における操業目標および前記設備における状態に基づいて対象とする目標について前記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成部と
して機能させ
前記評価モデルは、前記設備における状態に応じた行動を出力する操業モデルの強化学習において報酬の少なくとも一部として用いられる前記指標を出力する、評価モデル生成プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、操業システム、操業方法、および、操業プログラム、ならびに、評価モデル生成装置、評価モデル生成方法、および、評価モデル生成プログラムに関する。
【背景技術】
【0002】
特許文献1には、「測定データの入力に応じ、予め設定された報酬関数により定まる報酬値を高めるために推奨される第1種類の制御内容を示す推奨制御パラメータを出力する第1モデルの学習処理を実行する」と記載されている。
[先行技術文献]
[特許文献]
[特許文献1] 特開2021-086283
[特許文献2] 特開2020-027556
[特許文献3] 特開2019-020885
【発明の概要】
【0003】
本発明の第1の態様においては、操業システムを提供する。上記操業システムは、機械学習により、設備における操業目標および上記設備における状態に基づいて対象とする目標について上記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成装置を備えてよい。上記操業システムは、上記評価モデルの出力を報酬の少なくとも一部とした強化学習により、上記設備における状態に応じた行動を出力する操業モデルを生成する操業モデル生成装置を備えてよい。上記操業システムは、上記設備の状態に応じて上記操業モデルが出力する行動に基づく操作量を、上記設備における制御対象へ与える制御装置を備えてよい。
【0004】
上記評価モデル生成装置は、上記制御対象が上記操業モデルを用いて制御された場合における上記設備における状態に基づいて、上記評価モデルを更新してよい。
【0005】
上記操業モデル生成装置は、更新された上記評価モデルの出力を報酬の少なくとも一部とした強化学習により、上記操業モデルを更新してよい。
【0006】
上記制御装置は、更新された上記操業モデルを用いて上記制御対象を制御してよい。
【0007】
上記評価モデル生成装置は、上記操業目標を取得する操業目標取得部を備えてよい。上記評価モデル生成装置は、上記設備における状態を示す状態データを取得する状態データ取得部を備えてよい。上記評価モデル生成装置は、上記操業目標に基づいて、上記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、上記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する相関データ生成部を備えてよい。上記評価モデル生成装置は、ラベリングモデルを用いて、上記相関データをラベリングするラベリング部を備えてよい。上記評価モデル生成装置は、上記ラベリングされた相関データを用いて、上記評価モデルを生成する評価モデル生成部を備えてよい。
【0008】
上記評価モデル生成装置は、上記評価モデルの妥当性を判定する評価モデル判定部を更に備えてよい。
【0009】
上記評価モデル生成装置は、上記評価モデルが妥当であると判定された場合に、上記評価モデルを出力する評価モデル出力部を更に備えてよい。
【0010】
上記評価モデル生成装置は、上記評価モデルが妥当であると判定された場合に、上記ラベリングモデルを更新するラベリングモデル更新部を更に備えてよい。
【0011】
上記評価モデル生成装置は、上記相関データの少なくとも一部について教師ラベルを取得する教師ラベル取得部を更に備えてよい。上記ラベリングモデル更新部は、上記教師ラベルに基づいて生成された初期のラベリングモデルとは別に、更新用のラベリングモデルを生成してよい。
【0012】
本発明の第2の態様においては、操業方法を提供する。上記操業方法は、機械学習により、設備における操業目標および上記設備における状態に基づいて対象とする目標について上記設備における状態を評価した指標を出力する評価モデルを生成することを備えてよい。上記操業方法は、上記評価モデルの出力を報酬の少なくとも一部とした強化学習により、上記設備における状態に応じた行動を出力する操業モデルを生成することを備えてよい。上記操業方法は、上記設備の状態に応じて上記操業モデルが出力する行動に基づく操作量を、上記設備における制御対象へ与えることを備えてよい。
【0013】
本発明の第3の態様においては、操業プログラムを提供する。上記操業プログラムは、コンピュータにより実行されてよい。上記操業プログラムは、上記コンピュータを、機械学習により、設備における操業目標および上記設備における状態に基づいて対象とする目標について上記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成装置として機能させてよい。上記操業プログラムは、上記コンピュータを、上記評価モデルの出力を報酬の少なくとも一部とした強化学習により、上記設備における状態に応じた行動を出力する操業モデルを生成する操業モデル生成装置として機能させてよい。上記操業プログラムは、上記コンピュータを、上記設備の状態に応じて上記操業モデルが出力する行動に基づく操作量を、上記設備における制御対象へ与える制御装置として機能させてよい。
【0014】
本発明の第4の態様においては、評価モデル生成装置を提供する。上記評価モデル生成装置は、設備における操業目標を取得する操業目標取得部を備えてよい。上記評価モデル生成装置は、上記設備における状態を示す状態データを取得する状態データ取得部を備えてよい。上記評価モデル生成装置は、上記操業目標に基づいて、上記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、上記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する相関データ生成部を備えてよい。上記評価モデル生成装置は、ラベリングモデルを用いて、上記相関データをラベリングするラベリング部を備えてよい。上記評価モデル生成装置は、上記ラベリングされた相関データを用いて、上記設備における操業目標および上記設備における状態に基づいて対象とする目標について上記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成部を備えてよい。
【0015】
本発明の第5の態様においては、評価モデル生成方法を提供する。上記評価モデル生成方法は、設備における操業目標を取得することを備えてよい。上記評価モデル生成方法は、上記設備における状態を示す状態データを取得することを備えてよい。上記評価モデル生成方法は、上記操業目標に基づいて、上記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、上記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成することを備えてよい。上記評価モデル生成方法は、ラベリングモデルを用いて、上記相関データをラベリングすることを備えてよい。上記評価モデル生成方法は、上記ラベリングされた相関データを用いて、上記設備における操業目標および上記設備における状態に基づいて対象とする目標について上記設備における状態を評価した指標を出力する評価モデルを生成することを備えてよい。
【0016】
本発明の第6の態様においては、評価モデル生成プログラムを提供する。上記評価モデル生成プログラムは、コンピュータにより実行されてよい。上記評価モデル生成プログラムは、上記コンピュータを、設備における操業目標を取得する操業目標取得部として機能させてよい。上記評価モデル生成プログラムは、上記コンピュータを、上記設備における状態を示す状態データを取得する状態データ取得部として機能させてよい。上記評価モデル生成プログラムは、上記コンピュータを、上記操業目標に基づいて、上記状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、上記状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する相関データ生成部として機能させてよい。上記評価モデル生成プログラムは、上記コンピュータを、ラベリングモデルを用いて、上記相関データをラベリングするラベリング部として機能させてよい。上記評価モデル生成プログラムは、上記コンピュータを、上記ラベリングされた相関データを用いて、上記設備における操業目標および上記設備における状態に基づいて対象とする目標について上記設備における状態を評価した指標を出力する評価モデルを生成する評価モデル生成部として機能させてよい。
【0017】
なお、上記の発明の概要は、本発明の特徴の全てを列挙したものではない。また、これらの特徴群のサブコンビネーションもまた、発明となりうる。
【図面の簡単な説明】
【0018】
図1】本実施形態に係る操業システム100のブロック図の一例を、設備10および本部20とともに示す。
図2】本実施形態に係る操業システム100における評価モデル生成装置200のブロック図の一例を示す。
図3】ラベリング部220が初期のラベリングモデルを生成するにあたって学習器に入力する教師データの一例を示す。
図4】ラベリング部220が用いる学習器の設計例の一例を示す。
図5】ラベリング部220が用いる学習器の設計例の他の例を示す。
図6】ラベリング部220がラベリングの対象とするラベルが未付与の相関データの一例を示す。
図7】設備10におけるI/Oリストの一例を示す。
図8】設備10におけるセグメント図の一例を示す。
図9】ラベリングデータ出力部222が出力するラベリングデータの一例を示す。
図10】評価モデル生成装置200のラベリング機能部210における処理フローの一例を示す。
図11】評価モデル生成部250のブロック図の一例を示す。
図12】評価モデルの出力の一例を示す。
図13】評価モデルの出力の他の例を示す。
図14】評価モデル生成装置200の機械学習機能部230における処理フローの一例を示す。
図15】本実施形態に係る操業システム100における操業モデル生成装置300のブロック図の一例を示す。
図16】操業モデル生成装置300が生成する操業モデルの一例を示す。
図17】行動決定テーブルの一例を示す。
図18】操業モデル生成装置300における処理フローの一例を示す。
図19】操業モデル生成部316における強化学習フローの一例を示す。
図20】本実施形態に係る操業システム100における制御装置400のブロック図の一例を示す。
図21】制御装置400における処理フローの一例を示す。
図22】本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ9900の例を示す。
【発明を実施するための形態】
【0019】
以下、発明の実施の形態を通じて本発明を説明するが、以下の実施形態は特許請求の範囲にかかる発明を限定するものではない。また、実施形態の中で説明されている特徴の組み合わせの全てが発明の解決手段に必須であるとは限らない。
【0020】
図1は、本実施形態に係る操業システム100のブロック図の一例を、設備10および本部20とともに示す。なお、これらブロックは、それぞれ機能的に分離された機能ブロックであって、実際の装置構成とは必ずしも一致していなくてもよい。すなわち、本図において、1つのブロックとして示されているからといって、それが必ずしも1つの装置により構成されていなくてもよい。また、本図において、別々のブロックとして示されているからといって、それらが必ずしも別々の装置により構成されていなくてもよい。これより先のブロック図についても同様である。
【0021】
設備10は、アクチュエータ等の制御対象が備え付けられた施設や装置等である。例えば、設備10は、プラントであってもよいし、複数の機器を複合させた複合装置であってもよい。プラントとしては、化学やバイオ等の工業プラントの他、ガス田や油田等の井戸元やその周辺を管理制御するプラント、水力・火力・原子力等の発電を管理制御するプラント、太陽光や風力等の環境発電を管理制御するプラント、上下水やダム等を管理制御するプラント等が挙げられる。
【0022】
本部20は、設備10を経営する事業の中心となる機関であり、例えば、事業者の本社等であってよい。例えばこのような本部20には、事業者の経営を担当する経営陣が在籍していてよい。経営陣は、操業システム100へ操業目標を指定する。ここで、操業目標とは、設備10を操業するにあたって設定された目標であり、例えば、目標とする項目や値が含まれていてよい。
【0023】
本実施形態に係る操業システム100においては、設備10における状態を評価した指標を出力する評価モデルを機械学習により生成し、当該評価モデルの出力を報酬の少なくとも一部とした強化学習により操業モデルを生成する。そして、本実施形態に係る操業システム100においては、このようにして生成された操業モデルを用いて設備10における制御対象を制御する。
【0024】
操業システム100は、評価モデル生成装置200、操業モデル生成装置300、および、制御装置400を備える。
【0025】
評価モデル生成装置200は、機械学習により、設備10における操業目標および設備10における状態に基づいて対象とする目標について設備10における状態を評価した指標を出力する評価モデルを生成する。評価モデル生成装置200は、生成した評価モデルを操業モデル生成装置300へ供給する。
【0026】
操業モデル生成装置300は、評価モデル生成装置200が生成した評価モデルの出力を報酬の少なくとも一部とした強化学習により、設備10における状態に応じた行動を出力する操業モデルを生成する。操業モデル生成装置300は、生成した操業モデルを制御装置400へ供給する。
【0027】
制御装置400は、設備10の状態に応じて操業モデル生成装置300が生成した操業モデルが出力する行動に基づく操作量を、設備10における制御対象へ与える。すなわち、制御装置400は、強化学習により生成された操業モデルを用いたAI(Artificial Intelligence)コントローラとして機能する。
【0028】
この際、評価モデル生成装置200は、制御対象が操業モデルを用いて制御された場合における設備10における状態に基づいて、評価モデルを更新する。これに応じて、操業モデル生成装置300は、更新された評価モデルの出力を報酬の少なくとも一部とした強化学習により、操業モデルを更新する。そして、制御装置400は、更新された操業モデルを用いて制御対象を制御する。
【0029】
このように、本実施形態に係る操業システム100においては、AIが自動的に操業におけるボトルネック(ポテンシャルフォルト)を探し出し、改善のための指標を評価モデルとして生成する。そして、AIが与えられた指標を基に試行錯誤を行い、より良い操業方法を指示する操業モデルを生成する。そして、AIコントローラが当該操業モデルを用いて制御対象をAI制御する。これにより、本実施形態に係る操業システム100によれば、AI技術を用いて設備10を自律制御可能な環境を提供する。そして、本実施形態に係る操業システム100は、このようなAI制御下における設備の状態に基づいて、評価モデルおよび操業モデルを更新し、更新された操業モデルを用いて制御対象をAI制御する。これにより、本実施形態に係る操業システム100によれば、設備10における操業を改善するループを自律的に回すことができる。これについて詳細に説明する。
【0030】
図2は、本実施形態に係る操業システム100における評価モデル生成装置200のブロック図の一例を示す。評価モデル生成装置200は、PC(パーソナルコンピュータ)、タブレット型コンピュータ、スマートフォン、ワークステーション、サーバコンピュータ、または汎用コンピュータ等のコンピュータであってよく、複数のコンピュータが接続されたコンピュータシステムであってもよい。このようなコンピュータシステムもまた広義のコンピュータである。また、評価モデル生成装置200は、コンピュータ内で1または複数実行可能な仮想コンピュータ環境によって実装されてもよい。これに代えて、評価モデル生成装置200は、評価モデルの生成用に設計された専用コンピュータであってもよく、専用回路によって実現された専用ハードウェアであってもよい。また、インターネットに接続可能な場合、評価モデル生成装置200は、クラウドコンピューティングにより実現されてもよい。
【0031】
評価モデル生成装置200は、ラベリング機能部210および機械学習機能部230を備える。なお、本図においては、ラベリング機能部210と機械学習機能部230とが一体の装置として構成されている場合を一例として示しているが、これに限定されるものではない。ラベリング機能部210と機械学習機能部230とは別体の装置として構成されていてもよい。
【0032】
ラベリング機能部210は、操業目標取得部212と、状態データ取得部214と、相関データ生成部216と、教師ラベル取得部218と、ラベリング部220と、ラベリングデータ出力部222と、ラベリングモデル更新部224とを含む。すなわち、評価モデル生成装置200は、操業目標取得部212と、状態データ取得部214と、相関データ生成部216と、教師ラベル取得部218と、ラベリング部220と、ラベリングデータ出力部222と、ラベリングモデル更新部224とを備える。
【0033】
操業目標取得部212は、設備10における操業目標を取得する。例えば、操業目標取得部212は、本部20からネットワークを介して操業目標を取得する。しかしながら、これに限定されるものではない。操業目標取得部212は、操業目標を他の装置から取得してもよいし、各種メモリデバイスを介して取得してもよいし、ユーザ入力を介して取得してもよい。操業目標取得部212は、取得した操業目標を相関データ生成部216へ供給する。
【0034】
状態データ取得部214は、設備10における状態を示す状態データを取得する。例えば、状態データ取得部214は、設備10に設けられた各種センサが測定した様々な物理量を、状態データとして設備10からネットワークを介して時系列に取得する。しかしながら、これに限定されるものではない。状態データ取得部214は、状態データを他の装置から取得してもよいし、各種メモリデバイスを介して取得してもよいし、ユーザ入力を介して取得してもよい。状態データ取得部214は、取得した状態データを相関データ生成部216へ供給する。
【0035】
相関データ生成部216は、操業目標取得部212が取得した操業目標に基づいて、状態データ取得部214が取得した状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する。この際、相関データ生成部216は、これら相関をグラフ化したグラフ画像を含む相関データを生成してよい。相関データ生成部216は、生成した相関データをラベリング部220へ供給する。
【0036】
教師ラベル取得部218は、相関データ生成部216が生成した相関データの少なくとも一部について教師ラベルを取得する。例えば、教師ラベル取得部218は、ユーザ(有識者等)入力を介して教師ラベルを取得する。しかしながら、これに限定されるものではない。教師ラベル取得部218は、教師ラベルを他の装置から取得してもよいし、ネットワークを介して取得してもよいし、各種メモリデバイスを介して取得してもよい。教師ラベル取得部218は、取得した教師ラベルをラベリング部220へ供給する。
【0037】
ラベリング部220は、教師ラベル取得部218が取得した教師ラベルに基づいて生成されたラベリングモデルを用いて、相関データ生成部216が生成した相関データをラベリングする。例えば、ラベリング部220は、相関データ生成部216が生成した相関データの少なくとも一部に教師ラベル取得部218が取得した教師ラベルが付されたデータを教師データとして学習器に入力することにより、初期のラベリングモデルを生成する。そして、ラベリング部220は、当該初期のラベリングモデルおよび後述する更新用のラベリングモデルを用いて、ラベルが未付与の相関データをラベリングする。なお、上述の説明では、教師データにおける相関データが相関データ生成部216によって生成されたものである場合を一例として示したが、これに限定されるものではない。教師データにおける相関データは、有識者等によって生成されたものであってもよい。この場合、教師ラベル取得部218は、有識者等から教師ラベルを取得することに代えて、教師ラベルが付された教師データそれ自体を取得し、これをラベリング部220へ供給してもよい。ラベリング部220は、ラベリングした相関データをラベリングデータ出力部222へ供給する。
【0038】
ラベリングデータ出力部222は、ラベリング部220がラベリングした相関データとセンサデータ(物理量の測定値)とに基づき、ラベリングデータを生成する。ラベリングデータ出力部222は、生成したラベリングデータを機械学習機能部230へ出力する。
【0039】
ラベリングモデル更新部224は、後述する評価モデルの判定結果を取得する。そして、ラベリングモデル更新部224は、評価モデルが妥当であると判定された場合に、ラベリングモデルを更新する。この際、ラベリングモデル更新部224は、教師ラベルに基づいて生成された初期のラベリングモデルとは別に、更新用のラベリングモデルを生成してよい。
【0040】
機械学習機能部230は、ラベリングデータ取得部240と、評価モデル生成部250と、評価モデル判定部260と、評価モデル出力部270とを含む。すなわち、評価モデル生成装置200は、ラベリングデータ取得部240と、評価モデル生成部250と、評価モデル判定部260と、評価モデル出力部270と備える。
【0041】
ラベリングデータ取得部240は、ラベリングデータ出力部222が出力したラベリングデータを取得する。ラベリングデータ取得部240は、取得したラベリングデータを評価モデル生成部250へ供給する。
【0042】
評価モデル生成部250は、ラベリングデータ取得部240が取得したラベリングデータ、すなわち、ラベリング部220によってラベリングされた相関データとセンサデータとに基づき生成されたラベリングデータを用いて、設備10における操業目標および設備10における状態に基づいて対象とする目標について設備10における状態を評価した指標を出力する評価モデルを生成する。評価モデル生成部250は、生成した評価モデルを評価モデル判定部260および評価モデル出力部270へ供給する。
【0043】
評価モデル判定部260は、評価モデル生成部250が生成した評価モデルの妥当性を判定する。評価モデル判定部260は、評価モデルが妥当であると判定した場合に、その旨をラベリングモデル更新部224および評価モデル出力部270へ通知する。これに応じて、ラベリングモデル更新部224は、ラベリングモデルを更新する。
【0044】
評価モデル出力部270は、評価モデルが妥当であると判定された場合に、評価モデルを操業モデル生成装置300へ出力する。
【0045】
これについて、先ず、評価モデル生成装置200のラベリング機能部210における処理の詳細を、データ例やフローを用いて詳細に説明する。
【0046】
図3は、ラベリング部220が初期のラベリングモデルを生成するにあたって学習器に入力する教師データの一例を示す。本図に示されるように、学習器に入力する教師データには、「操業目標」、「対象」、「タグ情報1」、「タグ情報2」、「グラフ画像」、および、「ラベル」が含まれていてよい。ここで、「操業目標」には、目標とする項目を示す「目標項目」、および、当該目標項目についての「目標値」が含まれていてよい。また、「対象」には、対象となるセグメントの「カテゴリ」、および、対象となる「制御ループ」が含まれていてよい。また、「タグ情報1」には、タグ1の「名前」、「物理量」の種別、「最小値」、「最大値」、および、「単位」が含まれていてよい。また、「タグ情報2」には、タグ2の「名前」、「物理量」の種別、「最小値」、「最大値」、および、「単位」が含まれていてよい。
【0047】
また、「グラフ画像」は、タグ1とタグ2の相関をグラフ化した画像であってよい。例えば、「xxx1.jpg」や「xxx2.jpg」は、タグ1の濃度を縦軸、タグ2の時間を横軸としてグラフ化した時系列画像であってよい。同様に、「xxx3.jpg」や「xxx4.jpg」は、タグ1の加速度を縦軸、タグ2の時間を横軸としてグラフ化した時系列画像であってよい。また、「xxx5.jpg」や「xxx6.jpg」は、タグ1の温度を縦軸、タグ2の濃度を横軸としてグラフ化した分布図(散布図)画像であってよい。換言すれば、「グラフ画像」における縦軸は「タグ情報1」によって定義され、「グラフ画像」における横軸は「タグ情報2」によって定義されているということができる。
【0048】
また、「ラベル」は、有識者等によって付された教師ラベルである。ラベリング部220は、このような項目を含む教師データを学習器に入力することにより、初期のラベリングモデルを生成してよい。なお、本図においては、ラベルとして「OK」ラベルと「NG」ラベルの両者が用いられる場合を一例として示したが、これに限定されるものではない。ラベルとして「OK」ラベルのみが用いられてもよいし、「NG」ラベルのみが用いられてもよい。特に、操業におけるボトルネックを探し出す用途においては、ラベルとして少なくとも「NG」ラベルが用いられるとよい。
【0049】
図4は、ラベリング部220が用いる学習器の設計例の一例を示す。ラベリング部220は、このような学習器として様々な学習アルゴリズムを用いてもよく、一例として、Deep Learningを用いてもよい。学習器は、操業目標を分類する機能部と、対象を分類する機能部と、物理量(タグ情報)を分類する機能部と、グラフ画像を分類する機能部を有していてよい。この際、学習器は、本図に示されるように、操業目標を分類する目標分類層、対象を分類する対象分類層、物理量を分類する物理量分類層、および、グラフ画像を分類するグラフ分類層のような各項目に反応する層を有するように設計されてもよい。
【0050】
図5は、ラベリング部220が用いる学習器の設計例の他の例を示す。図4のように学習器に各項目に反応する層を用意することに代えて、学習器は、本図に示されるように、操業目標を分類する目標分類モデル、対象を分類する対象分類モデル、物理量を分類する物理量分類モデル、および、グラフ画像を分類するグラフ分類モデルのような各層毎に分類可能なモデルを有するように設計されてもよい。
【0051】
図6は、ラベリング部220がラベリングの対象とするラベルが未付与の相関データの一例を示す。本図に示されるように、ラベルが未付与の相関データには、「操業目標」、「対象」、「タグ情報1」、「タグ情報2」、および、「グラフ画像」が含まれていてよい。これら各項目については、図3に示される教師データの各項目と同様であってよいので、ここでは説明を省略する。
【0052】
図7は、設備10におけるI/Oリストの一例を示す。I/Oリストは、設備10に設けられた各機器の情報をリスト化したものである。このようなI/Oリストは、相関データの生成やラベリングデータの生成の際に適宜参照される。
【0053】
図8は、設備10におけるセグメント図の一例を示す。セグメント図は、設備10におけるセグメントの構成を示す図である。このようなセグメント図についても、I/Oリストと同様、相関データの生成やラベリングデータの生成の際に適宜参照される。
【0054】
図9は、ラベリングデータ出力部222が出力するラベリングデータの一例を示す。本図に示されるように、ラベリングデータには、「OK」ラベルが付されたラベリングデータおよび「NG」ラベルが付されたラベリングデータが含まれていてよい。このようなラベリングデータには、それぞれ、センサID(タグ名)に対応するセンサデータが含まれている。すなわち、ラベリングデータは、1つまたは複数のセンサにおける測定値がどのような値の場合に「OK」ラベルが付され、どのような値の場合に「NG」ラベルが付されているかを示している。
【0055】
ラベリング機能部210は、例えば本図に示されるようなラベリングデータを生成して出力する。これについてフローを用いて詳細に説明する。
【0056】
図10は、評価モデル生成装置200のラベリング機能部210における処理フローの一例を示す。評価モデル生成装置200のラベリング機能部210は、例えば本図に示されるフローにより、ラベリング処理を実行してよい。
【0057】
ステップS1002において、評価モデル生成装置200は、設備10における操業目標を取得する。例えば、操業目標取得部212は、本部20からネットワークを介して操業目標を取得する。このような操業目標には、例えば、目標とする項目を示す目標項目、および、当該目標項目についての目標値が含まれていてよい。一例として、設備10がプラントである場合、操業目標取得部212は、操業目標としてプラントKPI(Key Performance Indicator:重要業績評価指標)を取得してよい。操業目標取得部212は、取得した操業目標を相関データ生成部216へ供給する。
【0058】
ステップS1004において、評価モデル生成装置200は、設備10における状態を示す状態データを取得する。例えば、状態データ取得部214は、設備10に設けられた各種センサが測定した様々な物理量を、状態データとして設備10からネットワークを介して時系列に取得する。このような物理量には、例えば、設備10の様々な箇所における温度、濃度、加速度、および、圧力等が含まれていてよい。状態データ取得部214は、取得した状態データを相関データ生成部216へ供給する。
【0059】
ステップS1006において、評価モデル生成装置200は、操業目標に基づいて、状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する。例えば、相関データ生成部216は、ステップS1002において取得された操業目標に基づいて、ステップS1004において取得された状態データに含まれる少なくとも1つの物理量と時間との間における相関、および、状態データに含まれる少なくとも2つの物理量の間における相関の少なくともいずれかを示す相関データを生成する。一例として、相関データ生成部216は、ステップS1002において取得された操業目標により「操業目標」の項目を入力する。また、相関データ生成部216は、図7に示されるI/Oリスト、および、図8に示されるセグメント図を参照することにより「対象」の項目、「タグ情報1」、および、「タグ情報2」の項目を網羅的に入力する。そして、相関データ生成部216は、「タグ情報1」によって横軸を定義し、「タグ情報2」によって縦軸を定義することにより、タグ1とタグ2の相関をグラフ化し、このようにグラフ化された画像(例えば、時系列画像や分布図画像)を「グラフ画像」の項目に入力する。これにより、相関データ生成部216は、例えば、図3に示される教師データのうちの「教師ラベル」の項目以外の相関データや、図6に示されるラベルが未付与の相関データを生成する。相関データ生成部216は、生成した相関データをラベリング部220へ供給する。
【0060】
ステップS1008において、評価モデル生成装置200は、ラベリングモデルの有無を判定する。例えば、評価モデル生成装置200は、ラベルが未付与の相関データをラベリングするためのラベリングモデルが生成済みであるか否か判定する。ラベリングモデルが無い(生成済みでない)と判定された場合(Noの場合)、評価モデル生成装置200は、処理をステップS1010へ進める。
【0061】
ステップS1010において、評価モデル生成装置200は、相関データの少なくとも一部について教師ラベルを取得する。例えば、教師ラベル取得部218は、ステップS1006において生成された相関データが表示されたことに応じて、教師ラベルの入力を受け付ける。これに応じて、有識者等は、グラフ画像を基に相関データを判断し、「問題なし」と判断した相関データに「OK」ラベルを付し、「問題あり/疑わしい」と判断した相関データに「NG」ラベルを付す。すなわち、有識者等は、どのデータに着目してどこがおかしいかをラベリングする。教師ラベル取得部218は、例えばこのようにして、ユーザ入力を介して教師ラベルを取得する。教師ラベル取得部218は、取得した教師ラベルをラベリング部220へ供給する。
【0062】
ステップS1012において、評価モデル生成装置200は、初期のラベリングモデルを生成する。例えば、ラベリング部220は、ステップS1006において生成された相関データの少なくとも一部にステップS1010において取得した教師ラベルを付すことにより、例えば図3に示されるような教師データを生成する。そして、ラベリング部220は、このような教師データを、例えば、図4図5に示される学習器に入力することにより、初期のラベリングモデルを生成する。そして、評価モデル生成装置200は、処理をステップS1002に戻してフローを継続する。これ以降、評価モデル生成装置200は、このようにして生成したラベリングモデルを用いてラベルが未付与の相関データをラベリングすることとなる。
【0063】
ステップS1012において初期のラベリングモデルが生成された後は、ステップS1008において、評価モデル生成装置200は、ラベリングモデルが有る(生成済みである)と判定し、処理をステップS1014へ進める。
【0064】
ステップS1014において、評価モデル生成装置200は、ステップS1010において取得された教師ラベルに基づいて生成されたラベリングモデルを用いて、ステップS1006において生成された相関データをラベリングする。この際、グラフ画像で用いるデータの範囲は、操業目標を基にして紐づけておいてもよいし、初期のラベリングモデルを生成する際に用いられたデータを使って絞っておいてもよい。例えば、ラベリング部220は、ステップS1012において生成された初期のラベリングモデルおよび更新用のラベリングモデルに、ラベルが未付与の相関データを入力する。これに応じて、ラベリングモデルは、操業目標を分類し、対象を分類し、物理量を分類し、そして、グラフ画像を分類する。すなわち、ラベリングモデルは、操業目標が共通または類似するデータを識別し、対象が共通または類似するデータを識別し、物理量が共通または類似するデータを識別する。そして、ラベリングモデルは、このようにして識別されたグラフ画像を比較し、ラベルが未付与の相関データに対して、グラフ画像が「OK」ラベルが付されたグラフ画像に類似する場合に「OK」ラベルを付し、グラフ画像が「NG」ラベルが付されたグラフ画像に類似する場合に「NG」ラベルを付す。この際、ラベリングモデルは、データを画像にしてグラフの形で類似を判別してもよいし、RNN(Recurrent Neural Netwоrk)やLSTM(Long Short Term Memory)等を使ってデータ波形が類似するかどうかを判別してもよい。
【0065】
ラベリング部220は、初期のラベリングモデルが「OK」に分類し、かつ、更新用のラベリングモデルが「OK」に分類した相関データに対して「OK」ラベルを付してよい。同様に、ラベリング部220は、初期のラベリングモデルが「NG」に分類し、かつ、更新用のラベリングモデルが「NG」に分類した相関データに対して「NG」ラベルを付してよい。すなわち、ラベリング部220は、初期のラベリングモデルの分類結果と更新用のラベリングモデルの分類結果の論理積により、相関データをラベリングしてもよい。しかしながら、初期のラベリングモデルと更新用のラベリングモデルとが異なる分類結果を示すことも考えられる。このような場合には、ラベリング部220は、初期のラベリングモデルの分類結果を優先してもよい。これに代えて、ラベリング部220は、更新用のラベリングモデルの分類結果を優先してもよい。または、ラベリング部220は、初期のラベリングモデルの分類結果と更新用のラベリングモデルの分類結果の論理和により、相関データをラベリングしてもよい。ラベリング部220は、このようにしてラベリングされた相関データをラベリングデータ出力部222へ供給する。
【0066】
ステップS1016において、評価モデル生成装置200は、ラベリングデータを出力する。例えば、ラベリングデータ出力部222は、ステップS1014においてラベリングされた相関データとセンサデータとに基づき、例えば、図9に示されるようなラベリングデータを生成する。そして、ラベリングデータ出力部222は、生成したラベリングデータを機械学習機能部230へ出力する。
【0067】
ステップS1018において、評価モデル生成装置200は、評価モデルが妥当である旨の判定結果を取得したかどうか判定する。取得していないと判定された場合(Noの場合)、評価モデル生成装置200は、フローを終了する。一方、取得したと判定された場合(Yesの場合)、評価モデル生成装置200は、処理をステップS1020へ進める。
【0068】
ステップS1020において、評価モデル生成装置200は、評価モデルが妥当である旨の判定結果を取得したと判定された場合に、ラベリングモデルを更新する。例えば、ラベリングモデル更新部224は、教師ラベルに基づいて生成された初期のラベリングモデルとは別に、更新用のラベリングモデルを生成し、当該更新用のラベリングモデルを更新する。一般に、学習器により付与されたラベルよりも有識者等により付与された教師ラベルの方が確からしい。したがって、ラベリングモデル更新部224は、初期のラベリングモデルを更新していくのではなく、初期のラベリングモデルとは別に生成された更新用のラベリングモデルを更新することで、有識者等により付与された教師ラベルの影響度が徐々に薄まっていくことを避けることができる。しかしながら、これに限定されるものではなく、ラベリングモデル更新部224が、初期のラベリングモデルを更新する場合を排除するものではない。
【0069】
評価モデル生成装置200のラベリング機能部210は、例えばこのようにしてラベリング処理を実行してよい。次に、評価モデル生成装置200の機械学習機能部230における処理の詳細を、データ例やフローを用いて詳細に説明する。
【0070】
図11は、評価モデル生成部250のブロック図の一例を示す。評価モデル生成部250は、複数の学習部252a、252b、・・・、学習部252n(「学習部252」と総称する。)を有しており、複数の学習部252が並列して学習を実行する。学習部252aは、前処理部254aと、機械学習部256aとを含む。同様に、学習部252bは、前処理部254bと、機械学習部256bとを含む。同様に、学習部252cは、前処理部254cと、機械学習部256cとを含む。ここで、前処理部254a、254b、・・・、254nを「前処理部254」と総称する。また、機械学習部256a、256b、・・・、256nを「機械学習部256」と総称する。
【0071】
前処理部254は、ラベリングデータを前処理する。例えば、前処理部254は、ラベリングデータに対して標準化処理、正規化処理、ローパスフィルタ、ハイパスフィルタ、および、主成分分析等の処理を実行する。前処理部254は、前処理したラベリングデータを機械学習部256へ供給する。
【0072】
機械学習部256は、前処理部254が前処理したラベリングデータを学習データとして、機械学習のアルゴリズムにより評価モデルを生成する。
【0073】
このように、評価モデル生成部250は、複数の学習部252を有し、複数の学習部252のそれぞれが機械学習部256を含む。これにより、評価モデル生成部250は、それぞれの学習部252による複数の評価モデルを生成することとなる。この際、複数の学習部252において、前処理部254の処理内容、および、機械学習部256のアルゴリズムの少なくともいずれかが異なっているとよい。これにより、評価モデル生成部250は、それぞれ異なる複数の評価モデルを生成することができる。このようにして生成された評価モデルは、例えば、センサデータに対して、OK教師に近いかNG教師に近いかを数値で出力してよい。
【0074】
図12は、評価モデルの出力の一例を示す。本図においては、一例として、操業目標において対象とする品質についての品質向上を目標とした評価モデルの出力を示している。本図において縦軸は、ヘルスインデックスを示している。一例として、このような評価モデルは、対象とする目標が目標値と同じ値となることが推測される場合に、ヘルスインデックス=0を出力する。そして、評価モデルは、対象とする目標が目標値よりも良いことが推測される程、0よりも大きい値を出力し、対象とする目標が目標値よりも悪いことが推測される程、0よりも小さい値を出力する。
【0075】
また、本図において横軸は、時間を示している。一例として、本図の横軸における前半は、「OK」ラベルが付された期間のデータを評価モデルに入力した場合を一例として示している。この場合、評価モデルは、当該期間において0以上の値を出力する率が高い程、ラベリングとの正答率が高いため、妥当であるということができる。同様に、本図の横軸における後半は、「NG」ラベルが付された期間のデータを評価モデルに入力した場合を示している。この場合、評価モデルは、当該期間において0未満の値を出力する率が高い程、ラベリングとの正答率が高いため、妥当であるということができる。
【0076】
図13は、評価モデルの出力の他の例を示す。本図においては、一例として、操業目標において対象とする触媒利用の延長(コストカット)を目標とした評価モデルの出力を示している。本図において縦軸は、ヘルスインデックスを示している。また、本図において横軸は、時間を示している。一般に、触媒が時間の経過とともに徐々に減少していくという事象が発生する。したがって、評価モデルは、本図において矢印で示されるように、出力が単調減少性を有する程、事象を正しく捕らえているため、妥当であるということができる。評価モデル生成装置200の機械学習機能部230は、例えばこのような結果を出力し得る評価モデルを生成する。
【0077】
図14は、評価モデル生成装置200の機械学習機能部230における処理フローの一例を示す。評価モデル生成装置200の機械学習機能部230は、例えば本図に示されるフローにより、機械学習による評価モデルの生成処理を実行してよい。
【0078】
ステップS1410において、評価モデル生成装置200は、ラベリングデータを取得する。例えば、ラベリングデータ取得部240は、図10のフローにおけるステップS1016において出力されたラベリングデータを取得する。一例として、ラベリングデータ取得部240は、図9に示されるようなラベリングデータを取得してよい。
【0079】
ステップS1420において、評価モデル生成装置200は、判定用データをサンプリングする。例えば、ラベリングデータ取得部240は、ステップS1410において取得されたラベリングデータの一部を判定用データとしてサンプリングする。一例として、ラベリングデータ取得部240は、取得したラベリングデータから判定用データをランダムにサンプリングしてよい。これに代えて、ラベリングデータ取得部240は、取得したラベリングデータの前半を機械学習用データとし、後半を判定用データとしてサンプリングしてもよい。ラベリングデータ取得部240は、サンプリングした判定用データを評価モデル判定部260へ供給する。また、ラベリングデータ取得部240は、残りのラベリングデータを機械学習用データとして評価モデル生成部250へ供給する。
【0080】
ステップS1430において、評価モデル生成装置200は、ステップS1420において供給されたラベリングデータ、すなわち、図10のフローにおけるステップS1014においてラベリングされた相関データとセンサデータとに基づき生成されたラベリングデータを用いて、設備10における操業目標および設備10における状態に基づいて対象とする目標について設備10における状態を評価した指標を出力する評価モデルを生成する。
【0081】
より詳細には、ステップS1432において、評価モデル生成装置200は、ラベリングデータを前処理する。例えば、前処理部254a、254b、・・・、254nはそれぞれ、ステップS1420において供給されたラベリングデータに対して、標準化処理、正規化処理、ローパスフィルタ、ハイパスフィルタ、および、主成分分析等の処理を実行する。この際、前処理部254a、254b、・・・、254nは、それぞれ異なる処理内容を実行してよい。前処理部254a、254b、・・・、254nは、それぞれ、前処理したラベリングデータを機械学習部256a、256b、・・・、256nへ供給する。
【0082】
ステップS1434において、評価モデル生成装置200は、機械学習を実行する。例えば、機械学習部256a、256b、・・・、256nはそれぞれ、ステップS1432において前処理されたラベリングデータを学習データとして、機械学習のアルゴリズムにより評価モデルを生成する。この際、機械学習部256a、256b、・・・、256nは、それぞれ異なるアルゴリズムにより機械学習を実行してよい。したがって、学習部252a、252b、・・・、252nは、前処理内容および機械学習アルゴリズムの少なくともいずれかが異なる処理を実行することによって、それぞれ異なる複数の評価モデルを生成してよい。このような評価モデルは、一例として、データが入力されたことに応じて図12図13のような結果を出力するモデルであってよい。評価モデル生成部250は、このようにして生成された評価モデルを評価モデル判定部260および評価モデル出力部270へ供給する。
【0083】
ステップS1440において、評価モデル生成装置200は、評価モデルの妥当性を判定する。例えば、評価モデル判定部260は、ステップS1420においてサンプリングされた判定用データを、評価モデル生成部250における複数の学習部252によって生成された複数の評価モデルのそれぞれに入力することによって、複数の評価モデルのそれぞれについて妥当性を判定する。
【0084】
この際、一例として、生成された評価モデルが図12のような結果を出力する評価モデルである場合、「OK」ラベルが付された判定用データを入力したことに応じて、評価モデルが0以上の値を出力する割合(「OK」ラベルに対する正答率)が予め定めらえた閾値を超える場合に、評価モデル判定部260は、当該評価モデルが妥当であると判定してよい。これに代えて、または、加えて、生成された評価モデルが図12のような結果を出力する評価モデルである場合、「NG」ラベルが付された判定用データを入力したことに応じて、評価モデルが0未満の値を出力する割合(「NG」ラベルに対する正答率)が予め定めらえた閾値を超える場合に、評価モデル判定部260は、当該評価モデルが妥当であると判定してもよい。他の例として、生成された評価モデルが図13のような結果を出力する評価モデルである場合、判定用データを入力したことに応じて、評価モデルが単調減少性を有する結果を出力している場合に、評価モデル判定部260は、当該評価モデルが妥当であると判定してもよい。
【0085】
生成された複数の評価モデルのうち、いずれの評価モデルも妥当でないと判定された場合(Noの場合)、評価モデル生成装置200は、処理をステップS1410に戻してフローを継続する。一方、生成された複数の評価モデルのうち、少なくともいずれかの評価モデルが妥当であると判定された場合(Yesの場合)、評価モデル生成装置200は、処理をステップS1450へ進める。
【0086】
ステップS1450において、評価モデル生成装置200は、判定結果をフィードバックする。例えば、評価モデル判定部260は、評価モデルが妥当であると判定した旨を、当該判定を得るにあたったラベリングデータ、すなわち、ステップS1410において取得されたラベリングデータを特定する情報とともに、ラベリングモデル更新部224へ通知する。これに応じて、ラベリングモデル更新部224は、ラベリングモデルを更新する。また、評価モデル判定部260は、評価モデルが妥当であると判定した旨を、当該妥当であると判定した評価モデルを識別する情報とともに、評価モデル出力部270へ通知する。
【0087】
ステップS1460において、評価モデル生成装置200は、評価モデルを出力する。例えば、評価モデル出力部270は、ステップS1450において、評価モデルが妥当である旨を通知された場合に、妥当であると判定された評価モデルを、操業モデル生成装置300へ出力する。
【0088】
評価モデル生成装置200の機械学習機能部230は、例えばこのようにして機械学習による評価モデルの生成処理を実行してよい。すなわち、評価モデル生成装置200は、図10のフローによりラベリング処理を実行し、図14のフローにより評価モデルの生成処理を実行する。そして、評価モデル生成装置200は、生成した評価モデルを操業モデル生成装置300へ出力する。
【0089】
図15は、本実施形態に係る操業システム100における操業モデル生成装置300のブロック図の一例を示す。操業モデル生成装置300についても、評価モデル生成装置200と同様、コンピュータであってよく、複数のコンピュータが接続されたコンピュータシステムであってもよい。また、操業モデル生成装置300は、コンピュータ内で1または複数実行可能な仮想コンピュータ環境によって実装されてもよい。これに代えて、操業モデル生成装置300は、操業モデルの生成用に設計された専用コンピュータであってもよく、専用回路によって実現された専用ハードウェアであってもよい。また、インターネットに接続可能な場合、操業モデル生成装置300は、クラウドコンピューティングにより実現されてもよい。
【0090】
操業モデル生成装置300は、評価モデル取得部312と、学習環境データ取得部314と、操業モデル生成部316と、学習操作指示部318と、操業モデル判定部320と、操業モデル出力部322とを備える。
【0091】
評価モデル取得部312は、評価モデル出力部238が出力した評価モデルを、例えば、ネットワークを介して取得する。しかしながら、これに限定されるものではない。評価モデル取得部312は、評価モデルを、各種メモリデバイスを介して取得してもよいし、ユーザ入力を介して取得してもよい。評価モデル取得部312は、取得した評価モデルを、操業モデル生成部316へ供給する。
【0092】
学習環境データ取得部314は、学習環境における状態を示す学習環境データを、ネットワークを介して取得する。しかしながら、これに限定されるものではない。学習環境データ取得部314は、学習環境データを、各種メモリデバイスを介して取得してもよいし、ユーザ入力を介して取得してもよい。学習環境データ取得部314は、取得した学習環境データを操業モデル生成部316へ供給する。
【0093】
操業モデル生成部316は、学習環境データ取得部314が取得した学習環境データを用いて、評価モデル取得部312が取得した評価モデルの出力を報酬の少なくとも一部とした強化学習により、設備10における状態に応じた行動を出力する操業モデルを生成する。操業モデル生成部316は、生成した操業モデルを操業モデル判定部320および操業モデル出力部322へ供給する。
【0094】
学習操作指示部318は、強化学習中の操業モデルが出力する行動に基づく操作量を、学習環境における制御対象へ与える。
【0095】
操業モデル判定部320は、操業モデル生成部316が生成した操業モデルの妥当性を判定する。操業モデル判定部320は、操業モデルが妥当であると判定した場合に、その旨を操業モデル出力部322へ通知する。
【0096】
操業モデル出力部322は、操業モデルが妥当であると判定された場合に、操業モデルを制御装置400へ出力する。このような操業モデル生成装置300における処理の詳細を、データ例やフローを用いて詳細に説明する。
【0097】
図16は、操業モデル生成装置300が生成する操業モデルの一例を示す。操業モデルは、サンプリングされた状態データの集合を示す状態sと各状態下に取られた行動aとの組み合わせ(s,a)と、報酬によって計算されたウエイトwとで構成される。なお、このようなウエイトを計算するための報酬の少なくとも一部として、評価モデル生成装置200が生成した評価モデルの出力が用いられる。本図においては、一例として、状態s=(TI001,TI002,TI003,FI001,FI002,VI001)とした場合を示している。そして、本図においては、例えば、s=(-2.47803,-2.48413,-0.07324,29.71191,24.2511,70)の状態下でa=1の行動が取られた場合に、報酬によって計算されたウエイトがw=144.1484であることを意味している。このような操業モデルにより次の行動が決定される。
【0098】
図17は、行動決定テーブルの一例を示す。行動決定テーブルは、入力された状態sと取り得る行動aとで構成される。本図においては、一例として、入力された状態がs=(0.1,0.2,0.4,0.3,0.8,0.2)であり、取り得る行動がa=(-3,-1,0,1,3)の5つである場合を示している。例えば、このような行動決定テーブルを図16に示される操業モデルに入力することにより、次の行動が決定される。これについてフローを用いて詳細に説明する。
【0099】
図18は、操業モデル生成装置300における処理フローの一例を示す。操業モデル生成装置300は、例えば本図に示されるフローにより、操業モデルの生成処理を実行してよい。
【0100】
ステップS1802において、操業モデル生成装置300は、評価モデルを取得する。例えば、評価モデル取得部312は、図14のフローにおけるステップS1460において出力された評価モデルを、ネットワークを介して取得する。評価モデル取得部312は、取得した評価モデルを、操業モデル生成部316へ供給する。
【0101】
ステップS1804において、操業モデル生成装置300は、強化学習により操業モデルを生成する。例えば、操業モデル生成部316は、ステップS1802において取得された評価モデルの出力を報酬の少なくとも一部とした強化学習により、設備10における状態に応じた行動を出力する操業モデルを生成する。一例として、操業モデル生成部316は、図16に示されるような操業モデルを生成する。この詳細については、別フローを用いて後述する。操業モデル生成部316は、生成した操業モデルを操業モデル判定部320および操業モデル出力部322へ供給する。
【0102】
ステップS1806において、操業モデル生成装置300は、操業モデルの妥当性を判定する。例えば、操業モデル判定部320は、ステップS1804において生成された操業モデルの妥当性を判定する。一例として、操業モデル判定部320は、評価モデル生成装置200により設定された目標設定、操作端、および、観測点の情報に基づいて、プラントシミュレータにユーザによる操作を入れた際のデータ(a)、もしくは、ユーザによる操作の過去データ(b)をリファレンスデータとして用意する。次に、操業モデル判定部320は、生成された操業モデルに対して、プラントシミュレータ上で操業モデルを動作させる(c)。この際、操業モデル判定部320は、プラントシミュレータに代えて、実機を用いてもよい。そして、操業モデル判定部320は、(c)により出力された結果と、(a)または(b)とを比較することで、操業モデルの妥当性を判定する。すなわち、操業モデル判定部320は、プラントシミュレータにユーザによる操作を入れた際のリファレンスデータと、AIにより操作した際の結果とを比較することで、操業モデルの妥当性を判定する。そして、操業モデル判定部320は、AIにより操作した際の結果の方が高い場合に、生成された操業モデルが妥当(良好)であると判定する。操業モデル判定部320は、操業モデルが妥当であると判定した場合に、その旨を操業モデル出力部322へ通知する。
【0103】
ステップS1808において、操業モデル生成装置300は、操業モデルを出力する。例えば、操業モデル出力部322は、ステップS1806において操業モデルが妥当であると判定された場合に、操業モデルを制御装置400へ出力する。
【0104】
図19は、操業モデル生成部316における強化学習フローの一例を示す。操業モデル生成部316は、例えば本図に示されるフローにより、図18のステップS1804における処理を実行してよい。
【0105】
ステップS1902において、操業モデル生成装置300は、学習環境データを取得する。例えば、学習環境データ取得部314は、学習環境における状態を示す学習環境データを、ネットワークを介して取得する。このような学習環境としては、設備10の挙動を模擬するシミュレータが用いられてもよいし、実際の設備10が用いられてもよい。例えば、設備10がプラントである場合、学習環境として、プラントシミュレータが用いられてもよいし、実プラントが用いられてもよい。学習環境データ取得部314は、取得した学習環境データを操業モデル生成部316へ供給する。
【0106】
ステップS1904において、操業モデル生成装置300は、行動を決定する。例えば、操業モデル生成部316は、ランダムに行動を決定する。なお、上述の説明では、操業モデル生成部316がランダムに行動を決定する場合を一例として示したが、これに限定されるものではない。操業モデル生成部316が行動を決定するにあたって、例えば、FKDPP(Factorial Kernel Dynamic Policy Programming)等の既知のAIアルゴリズムが用いられてもよい。このようなカーネル法を用いる場合、操業モデル生成部316は、学習環境データにより得られたセンサ値から状態sのベクトルを生成する。次に、操業モデル生成部316は、状態sと、取り得る全ての行動aとの組み合わせを、例えば図17に示されるような行動決定テーブルとして生成する。そして、操業モデル生成部316は、行動決定テーブルを、例えば図16に示されるような操業モデルへ入力する。これに応じて、操業モデルは、行動決定テーブルの各行と、操業モデルのうちのウエイト列を除いた各サンプルデータとの間でカーネル計算を行い、各サンプルデータとの間の距離をそれぞれ算出する。そして、操業モデルは、各サンプルデータについて算出した距離にそれぞれのウエイト列の値を乗算したものを順次足し合わせ、各行動における報酬期待値を計算する。操業モデルは、このようにして計算された報酬期待値が最も高くなる行動を選択する。操業モデル生成部316は、例えばこのようにして、更新中の操業モデルを用いて報酬期待値が最も高いと判断された行動を選択することにより行動を決定してもよい。学習時においては、操業モデル生成部316は、ランダムに行動を決定するか、操業モデルを用いて行動を決定するかを適宜選択しながら行動を決定すればよい。操業モデル生成部316は、決定した行動を学習操作指示部318へ供給する。
【0107】
ステップS1906において、操業モデル生成装置300は、学習環境へ操作を指示する。例えば、学習操作指示部318は、ステップS1904において決定された行動を、学習環境における制御対象の値(バルブ値等)に加算した操作量を、学習環境における制御対象へ与える。これにより学習環境の状態が変化する。
【0108】
ステップS1908において、操業モデル生成装置300は、学習環境データを取得する。例えば、学習環境データ取得部314は、ステップS1902と同様、学習環境における状態を示す学習環境データを取得する。すなわち、学習環境データ取得部314は、決定された行動に基づく操作量が制御対象へ与えたことに応じて変化した後の学習環境の状態を取得する。学習環境データ取得部314は、取得した学習環境データを操業モデル生成部316へ供給する。
【0109】
ステップS1910において、操業モデル生成装置300は、報酬値を算出する。例えば、操業モデル生成部316は、評価モデルの出力に少なくとも部分的に基づき、報酬値を算出する。一例として、操業モデル生成部316は、ステップS1908において取得された学習環境データを、図18のステップS1802において取得された評価モデルへ入力したことに応じて評価モデルが出力する指標をそのまま用いて報酬値を算出してもよいし、評価モデルによってOKと判断された場合に1、NGと判断された場合に0として報酬値を算出してもよい。
【0110】
ステップS1912において、操業モデル生成装置300は、行動の決定に応じた状態の取得処理が、指定されたステップ回数を超えたかどうか判定する。なお、このようなステップ回数は、予めユーザにより指定されたものであってもよいし、学習対象期間(例えば10日間等)を基に定められたものであってもよい。上述の処理が指定されたステップ回数を超えていないと判定された場合(Noの場合)、操業モデル生成装置300は、処理をステップS1904に戻してフローを継続する。操業モデル生成装置300は、このような行動の決定に応じた状態の取得処理を指定されたステップ回数実行する。
【0111】
ステップS1912において、上述の処理が指定されたステップ回数を超えたと判定された場合(Yesの場合)、操業モデル生成装置300は、処理をステップS1914へ進める。ステップS1914において、操業モデル生成装置300は、操業モデルを更新する。例えば、操業モデル生成部316は、図16に示される操業モデルにおけるウエイト列の値を上書きするほか、これまでに保存されていない新たなサンプルデータを操業モデルに追加する。
【0112】
ステップS1916において、操業モデル生成装置300は、操業モデルの更新処理が、指定された繰り返し回数を超えたかどうか判定する。なお、このような繰り返し回数は、予めユーザにより指定されたものであってもよいし、操業モデルの妥当性に応じて定められたものであってもよい。上述の処理が指定された繰り返し回数を超えていないと判定された場合(Noの場合)、操業モデル生成装置300は、処理をステップS1902へ戻してフローを継続する。
【0113】
ステップS1916において、上述の処理が指定された繰り返し回数を超えたと判定された場合(Yes)の場合、操業モデル生成装置300は、フローを終了する。操業モデル生成装置300は、例えばこのようにして、評価モデルの出力を報酬の少なくとも一部とした強化学習により、設備10における状態に応じた行動を出力する操業モデルを生成することができる。
【0114】
図20は、本実施形態に係る操業システム100における制御装置400のブロック図の一例を示す。制御装置400は、例えば、DCS(Distributed Control System:分散制御システム)や中規模向け計装システムにおけるコントローラであってもよいし、リアルタイムOSコントローラ等であってもよい。
【0115】
制御装置400は、操業モデル取得部412と、実環境データ取得部414と、制御部416と、実操作指示部418とを備える。
【0116】
操業モデル取得部412は、操業モデル出力部322が出力した操業モデルを、例えば、ネットワークを介して取得する。しかしながら、これに限定されるものではない。操業モデル取得部412は、操業モデルを、各種メモリデバイスを介して取得してもよいし、ユーザ入力を介して取得してもよい。操業モデル取得部412は、取得した操業モデルを、制御部416へ供給する。
【0117】
実環境データ取得部414は、実環境、すなわち、設備10における状態を示す実環境データを取得する。このような実環境データは、前述の状態データと同様のデータであってよい。実環境データ取得部414は、取得した実環境データを制御部416へ供給する。
【0118】
制御部416は、実環境データ取得部414が取得した実環境、すなわち、設備10の状態に応じて操業モデル取得部412が取得した操業モデルが出力する行動に基づく操作量を決定する。制御部416は、決定した操作量を実操作指示部418へ供給する。
【0119】
実操作指示部418は、制御部416が決定した操作量を、実環境、すなわち、設備10における制御対象へ与える。
【0120】
図21は、制御装置400における処理フローの一例を示す。制御装置400は、例えば本図に示されるフローにより、制御対象の制御処理を実行してよい。
【0121】
ステップS2102において、制御装置400は、操業モデルを取得する。例えば、操業モデル取得部412は、図18のステップS1808において出力された操業モデルを、ネットワークを介して取得する。操業モデル取得部412は、取得した操業モデルを、制御部416へ供給する。
【0122】
ステップS2104において、制御装置400は、実環境データを取得する。例えば、実環境データ取得部414は、実環境における状態を示す実環境データを取得する。このような実環境データは、上述の設備10における状態を示す状態データと同様のデータであってよい。実環境データ取得部414は、取得した実環境データを制御部416へ供給する。
【0123】
ステップS2106において、制御装置400は、行動を決定する。例えば、制御部416は、操業モデルを用いて報酬期待値が最も高いと判断された行動を選択することにより行動を決定する。制御部416は、決定した行動を実操作指示部418へ供給する。
【0124】
ステップS2108において、制御装置400は、実環境へ操作を指示する。例えば、実操作指示部418は、ステップS2106において決定された行動を、設備10における制御対象の値に加算した操作量を、設備10における制御対象へ与える。これにより実環境の状態が変化する。
【0125】
ステップS2110において、制御装置400は、AI制御を終了するかどうか判定する。AI制御を終了すると判定された場合(Yesの場合)、制御装置400はフローを終了する。AI制御を終了しないと判定された場合(Noの場合)、制御装置400は、処理をステップS2104へ戻してフローを継続する。
【0126】
従来、例えば、特許文献1のように、強化学習されたモデルを用いて制御対象を制御するAI制御技術が知られている。しかしながら、AI制御技術においては、報酬値を算出するための報酬関数をユーザが経験や勘等により事前に設定しておく必要があった。このように人の手が介在する場合、操業サイクルを解決まで導くためには、複数の労働力を用いた年単位の長期間に及ぶ作業が必要である等、莫大な手間と時間を要していた。また、労働力不足や人員配置ミスによる遅延や中断、遠隔地・危険地での作業を伴う可能性等も考慮する必要があった。さらに、熟練オペレータの経験や勘を用いても、常に迅速で最適な判断ができるとも限らない。長期間にわたるプラント管理の場合、同レベルのスキルを受け継ぐ後継者の確保も容易ではない。また、個人のスキルは一面的になることが多く、異なる部門や機能間で情報を共有し、複数の問題を網羅的に把握して解決するには限界があった。
【0127】
これに対して、本実施形態に係る操業システム100においては、AIが自動的に操業におけるボトルネック(ポテンシャルフォルト)を探し出し、改善のための指標を評価モデルとして生成する。そして、AIが与えられた指標を基に試行錯誤を行い、より良い操業方法を指示する操業モデルを生成する。そして、AIコントローラが当該操業モデルを用いて制御対象をAI制御する。これにより、本実施形態に係る操業システム100によれば、AI技術を用いて設備10を自律制御可能な環境を提供する。そして、本実施形態に係る操業システム100は、このようなAI制御下における設備の状態に基づいて、評価モデルおよび操業モデルを更新し、更新された操業モデルを用いて制御対象をAI制御する。これにより、本実施形態に係る操業システム100によれば、設備10における操業を改善するループを自律的に回すことができる。したがって、本実施形態に係る操業システム100によれば、これまで行っていたデータ収集・調査のPDCAサイクルを24時間365日休まず継続的かつ高速に行い、もって、プラント等の生産性・効率性を半永久的に高め続けることを可能とする。また、状況に応じた意思決定を客観的かつ包括的に行うことができるので、熟練オペレータの退職によるスキル継承リスク等にとらわれず、長期間にわたって積み上げた知識を多角的に活用することができる。
【0128】
本発明の様々な実施形態は、フローチャートおよびブロック図を参照して記載されてよく、ここにおいてブロックは、(1)操作が実行されるプロセスの段階または(2)操作を実行する役割を持つ装置のセクションを表わしてよい。特定の段階およびセクションが、専用回路、コンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプログラマブル回路、および/またはコンピュータ可読媒体上に格納されるコンピュータ可読命令と共に供給されるプロセッサによって実装されてよい。専用回路は、デジタルおよび/またはアナログハードウェア回路を含んでよく、集積回路(IC)および/またはディスクリート回路を含んでよい。プログラマブル回路は、論理AND、論理OR、論理XOR、論理NAND、論理NOR、および他の論理操作、フリップフロップ、レジスタ、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルロジックアレイ(PLA)等のようなメモリ要素等を含む、再構成可能なハードウェア回路を含んでよい。
【0129】
コンピュータ可読媒体は、適切なデバイスによって実行される命令を格納可能な任意の有形なデバイスを含んでよく、その結果、そこに格納される命令を有するコンピュータ可読媒体は、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく実行され得る命令を含む、製品を備えることになる。コンピュータ可読媒体の例としては、電子記憶媒体、磁気記憶媒体、光記憶媒体、電磁記憶媒体、半導体記憶媒体等が含まれてよい。コンピュータ可読媒体のより具体的な例としては、フロッピー(登録商標)ディスク、ディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、電気的消去可能プログラマブルリードオンリメモリ(EEPROM)、静的ランダムアクセスメモリ(SRAM)、コンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、ブルーレイ(RTM)ディスク、メモリスティック、集積回路カード等が含まれてよい。
【0130】
コンピュータ可読命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、またはSmalltalk(登録商標)、JAVA(登録商標)、C++等のようなオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語のような従来の手続型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで記述されたソースコードまたはオブジェクトコードのいずれかを含んでよい。
【0131】
コンピュータ可読命令は、汎用コンピュータ、特殊目的のコンピュータ、若しくは他のプログラム可能なデータ処理装置のプロセッサまたはプログラマブル回路に対し、ローカルにまたはローカルエリアネットワーク(LAN)、インターネット等のようなワイドエリアネットワーク(WAN)を介して提供され、フローチャートまたはブロック図で指定された操作を実行するための手段を作成すべく、コンピュータ可読命令を実行してよい。プロセッサの例としては、コンピュータプロセッサ、処理ユニット、マイクロプロセッサ、デジタル信号プロセッサ、コントローラ、マイクロコントローラ等を含む。
【0132】
図22は、本発明の複数の態様が全体的または部分的に具現化されてよいコンピュータ9900の例を示す。コンピュータ9900にインストールされたプログラムは、コンピュータ9900に、本発明の実施形態に係る装置に関連付けられる操作または当該装置の1または複数のセクションとして機能させることができ、または当該操作または当該1または複数のセクションを実行させることができ、および/またはコンピュータ9900に、本発明の実施形態に係るプロセスまたは当該プロセスの段階を実行させることができる。そのようなプログラムは、コンピュータ9900に、本明細書に記載のフローチャートおよびブロック図のブロックのうちのいくつかまたはすべてに関連付けられた特定の操作を実行させるべく、CPU9912によって実行されてよい。
【0133】
本実施形態によるコンピュータ9900は、CPU9912、RAM9914、グラフィックコントローラ9916、およびディスプレイデバイス9918を含み、それらはホストコントローラ9910によって相互に接続されている。コンピュータ9900はまた、通信インターフェイス9922、ハードディスクドライブ9924、DVDドライブ9926、およびICカードドライブのような入/出力ユニットを含み、それらは入/出力コントローラ9920を介してホストコントローラ9910に接続されている。コンピュータはまた、ROM9930およびキーボード9942のようなレガシの入/出力ユニットを含み、それらは入/出力チップ9940を介して入/出力コントローラ9920に接続されている。
【0134】
CPU9912は、ROM9930およびRAM9914内に格納されたプログラムに従い動作し、それにより各ユニットを制御する。グラフィックコントローラ9916は、RAM9914内に提供されるフレームバッファ等またはそれ自体の中にCPU9912によって生成されたイメージデータを取得し、イメージデータがディスプレイデバイス9918上に表示されるようにする。
【0135】
通信インターフェイス9922は、ネットワークを介して他の電子デバイスと通信する。ハードディスクドライブ9924は、コンピュータ9900内のCPU9912によって使用されるプログラムおよびデータを格納する。DVDドライブ9926は、プログラムまたはデータをDVD-ROM9901から読み取り、ハードディスクドライブ9924にRAM9914を介してプログラムまたはデータを提供する。ICカードドライブは、プログラムおよびデータをICカードから読み取り、および/またはプログラムおよびデータをICカードに書き込む。
【0136】
ROM9930はその中に、アクティブ化時にコンピュータ9900によって実行されるブートプログラム等、および/またはコンピュータ9900のハードウェアに依存するプログラムを格納する。入/出力チップ9940はまた、様々な入/出力ユニットをパラレルポート、シリアルポート、キーボードポート、マウスポート等を介して、入/出力コントローラ9920に接続してよい。
【0137】
プログラムが、DVD-ROM9901またはICカードのようなコンピュータ可読媒体によって提供される。プログラムは、コンピュータ可読媒体から読み取られ、コンピュータ可読媒体の例でもあるハードディスクドライブ9924、RAM9914、またはROM9930にインストールされ、CPU9912によって実行される。これらのプログラム内に記述される情報処理は、コンピュータ9900に読み取られ、プログラムと、上記様々なタイプのハードウェアリソースとの間の連携をもたらす。装置または方法が、コンピュータ9900の使用に従い情報の操作または処理を実現することによって構成されてよい。
【0138】
例えば、通信がコンピュータ9900および外部デバイス間で実行される場合、CPU9912は、RAM9914にロードされた通信プログラムを実行し、通信プログラムに記述された処理に基づいて、通信インターフェイス9922に対し、通信処理を命令してよい。通信インターフェイス9922は、CPU9912の制御下、RAM9914、ハードディスクドライブ9924、DVD-ROM9901、またはICカードのような記録媒体内に提供される送信バッファ処理領域に格納された送信データを読み取り、読み取られた送信データをネットワークに送信し、またはネットワークから受信された受信データを記録媒体上に提供される受信バッファ処理領域等に書き込む。
【0139】
また、CPU9912は、ハードディスクドライブ9924、DVDドライブ9926(DVD-ROM9901)、ICカード等のような外部記録媒体に格納されたファイルまたはデータベースの全部または必要な部分がRAM9914に読み取られるようにし、RAM9914上のデータに対し様々なタイプの処理を実行してよい。CPU9912は次に、処理されたデータを外部記録媒体にライトバックする。
【0140】
様々なタイプのプログラム、データ、テーブル、およびデータベースのような様々なタイプの情報が記録媒体に格納され、情報処理を受けてよい。CPU9912は、RAM9914から読み取られたデータに対し、本開示の随所に記載され、プログラムの命令シーケンスによって指定される様々なタイプの操作、情報処理、条件判断、条件分岐、無条件分岐、情報の検索/置換等を含む、様々なタイプの処理を実行してよく、結果をRAM9914に対しライトバックする。また、CPU9912は、記録媒体内のファイル、データベース等における情報を検索してよい。例えば、各々が第2の属性の属性値に関連付けられた第1の属性の属性値を有する複数のエントリが記録媒体内に格納される場合、CPU9912は、第1の属性の属性値が指定される、条件に一致するエントリを当該複数のエントリの中から検索し、当該エントリ内に格納された第2の属性の属性値を読み取り、それにより予め定められた条件を満たす第1の属性に関連付けられた第2の属性の属性値を取得してよい。
【0141】
上で説明したプログラムまたはソフトウェアモジュールは、コンピュータ9900上またはコンピュータ9900近傍のコンピュータ可読媒体に格納されてよい。また、専用通信ネットワークまたはインターネットに接続されたサーバーシステム内に提供されるハードディスクまたはRAMのような記録媒体が、コンピュータ可読媒体として使用可能であり、それによりプログラムを、ネットワークを介してコンピュータ9900に提供する。
【0142】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されない。上記実施の形態に、多様な変更または改良を加えることが可能であることが当業者に明らかである。その様な変更または改良を加えた形態も本発明の技術的範囲に含まれ得ることが、特許請求の範囲の記載から明らかである。
【0143】
特許請求の範囲、明細書、および図面中において示した装置、システム、プログラム、および方法における動作、手順、ステップ、および段階等の各処理の実行順序は、特段「より前に」、「先立って」等と明示しておらず、また、前の処理の出力を後の処理で用いるのでない限り、任意の順序で実現しうることに留意すべきである。特許請求の範囲、明細書、および図面中の動作フローに関して、便宜上「まず、」、「次に、」等を用いて説明したとしても、この順で実施することが必須であることを意味するものではない。
【符号の説明】
【0144】
10 設備
20 本部
100 操業システム
200 評価モデル生成装置
210 ラベリング機能部
212 操業目標取得部
214 状態データ取得部
216 相関データ生成部
218 教師ラベル取得部
220 ラベリング部
222 ラベリングデータ出力部
224 ラベリングモデル更新部
230 機械学習機能部
240 ラベリングデータ取得部
250 評価モデル生成部
252 学習部
254 前処理部
256 機械学習部
260 評価モデル判定部
270 評価モデル出力部
300 操業モデル生成装置
312 評価モデル取得部
314 学習環境データ取得部
316 操業モデル生成部
318 学習操作指示部
320 操業モデル判定部
322 操業モデル出力部
400 制御装置
412 操業モデル取得部
414 実環境データ取得部
416 制御部
418 実操作指示部
9900 コンピュータ
9901 DVD-ROM
9910 ホストコントローラ
9912 CPU
9914 RAM
9916 グラフィックコントローラ
9918 ディスプレイデバイス
9920 入/出力コントローラ
9922 通信インターフェイス
9924 ハードディスクドライブ
9926 DVDドライブ
9930 ROM
9940 入/出力チップ
9942 キーボード
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22