特開2024-84021 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ 日立造船株式会社の特許一覧

特開2024-84021情報処理装置、制御システム、探索方法、および探索プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024084021

(43)【公開日】2024-06-24

(54)【発明の名称】情報処理装置、制御システム、探索方法、および探索プログラム

(51)【国際特許分類】

G05B 23/02 20060101AFI20240617BHJP

G06N 20/00 20190101ALI20240617BHJP

F23G 5/50 20060101ALN20240617BHJP

【ＦＩ】

G05B23/02 F

G06N20/00

F23G5/50 H

F23G5/50 G

【審査請求】未請求

【請求項の数】11

【出願形態】ＯＬ

(21)【出願番号】P 2022198178

(22)【出願日】2022-12-12

(71)【出願人】

【識別番号】000005119

【氏名又は名称】日立造船株式会社

(74)【代理人】

【識別番号】110000338

【氏名又は名称】弁理士法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】林翔太

(72)【発明者】

【氏名】野原俊平

(72)【発明者】

【氏名】白石裕司

【テーマコード（参考）】

3C223

3K062

【Ｆターム（参考）】

3C223AA01

3C223AA17

3C223BA03

3C223CC02

3C223DD03

3C223EB01

3C223FF04

3C223FF05

3C223FF22

3C223FF26

3C223GG01

3K062AC01

3K062DB05

(57)【要約】

【課題】個人の技能に左右されずに推論や制御に関するパラメータを適切に設定する。
【解決手段】情報処理装置（３）は、推論モデルによる推論の結果に応じて制御対象（５）に対する制御を行う制御システム（７）におけるパラメータと、当該パラメータが適用されている期間の制御対象（５）の稼働状態との関係を示す関数の予測分布を算出する予測分布算出部（３０３）と、当該予測分布に基づいて上記パラメータの最適値の候補を探索する探索部（３０４）と、を備える。
【選択図】図３

【特許請求の範囲】

【請求項1】

推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおける当該推論および当該制御の少なくとも何れかに関するパラメータと、当該パラメータが適用されている期間における前記制御対象の稼働状態との関係を示す関数の予測分布を算出する予測分布算出部と、
前記予測分布に基づいて前記パラメータの最適値の候補を探索する探索部と、を備える情報処理装置。

【請求項2】

前記パラメータは、前記推論の結果に応じた、前記制御対象に対する制御の内容と制御量とを示すものである、請求項１に記載の情報処理装置。

【請求項3】

前記パラメータには、前記推論モデルによる推論に用いられる推論用パラメータが含まれており、
前記探索部は、前記予測分布に基づいて、前記制御対象に対する制御の内容と制御量の最適値の候補と、前記推論用パラメータの最適値の候補の両方を探索する、請求項２に記載の情報処理装置。

【請求項4】

前記推論モデルは、前記制御対象の将来の稼働状態を示す値を予測するものであり、
前記パラメータは、前記制御対象の将来の稼働状態が正常であるか否かを判定するための閾値である、請求項１に記載の情報処理装置。

【請求項5】

前記推論モデルは、前記制御対象の将来の稼働状態を示す値を予測するものであり、
前記予測分布算出部は、前記制御対象の稼働状態を示す情報として、前記制御対象の稼働時間に対する、前記制御対象の稼働状態が異常であった時間の比を用いる、請求項１から４の何れか１項に記載の情報処理装置。

【請求項6】

前記予測分布算出部は、前記探索部が検出した前記候補と、当該候補が適用されている期間における前記制御対象の稼働状態とに基づいて前記予測分布を更新し、
前記探索部は、更新後の前記予測分布に基づいて前記パラメータの最適値の新たな候補を探索する、請求項１から４の何れか１項に記載の情報処理装置。

【請求項7】

前記探索部による各探索で検出された前記候補の値の遷移を示す遷移情報を表示する表示制御部を備える、請求項６に記載の情報処理装置。

【請求項8】

前記表示制御部は、前記候補を適用して前記制御対象の制御を行った後の前記制御対象の稼働状態に応じて前記遷移情報に含まれる各候補の値の表示態様を異ならせる、請求項７に記載の情報処理装置。

【請求項9】

請求項１に記載の情報処理装置と、
前記情報処理装置が検出する前記パラメータの最適値の候補を適用して前記制御対象に対する制御を行う制御装置と、を含み、
前記情報処理装置は、前記候補が適用されている期間における前記稼働状態を示す結果データを取得し、当該結果データに基づいて前記予測分布を更新すると共に、更新後の予測分布に基づいて前記パラメータの最適値の新たな候補を探索する、制御システム。

【請求項10】

少なくとも１つの情報処理装置が実行する探索方法であって、
推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおける当該推論および当該制御の少なくとも何れかに関するパラメータと、当該パラメータが適用されている期間における前記制御対象の稼働状態との関係を示す関数の予測分布を算出するステップと、
前記予測分布に基づいて前記パラメータの最適値の候補を探索するステップと、を含む探索方法。

【請求項11】

請求項１に記載の情報処理装置としてコンピュータを機能させるための探索プログラムであって、前記予測分布算出部および前記探索部としてコンピュータを機能させるための探索プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおけるパラメータの設定に関する。

【背景技術】

【0002】

機械学習モデルにより推論を行い、その推論の結果に基づいて制御対象を制御する技術が従来から知られている。例えば、下記の特許文献１には、ごみの焼却を行うと共に、焼却時に発生する熱を利用して発電を行うごみ焼却プラント設備において、機械学習したニューラルネットワークモデルを用いて所定時間後の発生蒸気量を予測し、その予測結果に基づいて運転制御を行うことが記載されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開２００５－２４９３４９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

上述のような従来技術では、例えば、発生蒸気量の低下が予測された場合に行われる、発生蒸気量の低下を回避するための運転制御の内容についてはオペレータが判断する必要がある。このため、発生蒸気量の低下を避けることができるか否かが、オペレータの運転技術等の個人の技能に左右されるという問題がある。

【0005】

また、ごみ焼却プラント設備を稼働させている期間中は、その制御システムも常に稼働させておく必要があり、その制御システムの制御内容はごみ焼却プラント設備の稼働状態に直接的な影響を与える。このため、幾度もトライアンドエラーを繰り返し、その結果に基づいて適切な運転制御の内容を自動で決定するような構成を採用することは難しく、上記のとおり個人の技能に頼らざるを得なかった。

【0006】

このような問題は、プラントで使用される制御システムに限られず、任意の推論モデルによる推論の結果に応じて任意の制御対象に対する制御を行う制御システムにおいて共通して生じる問題である。また、このような問題は、運転制御の内容を決定する場合に限られず、推論や制御に関する様々なパラメータの設定において共通して生じる問題点である。

【0007】

本発明の一態様は、推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおいて、個人の技能に左右されることなく、推論や制御に関するパラメータを適切に設定することを可能にする情報処理装置等を提供することを目的とする。

【課題を解決するための手段】

【0008】

上記の課題を解決するために、本発明の一態様に係る情報処理装置は、推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおける当該推論および当該制御の少なくとも何れかに関するパラメータと、当該パラメータが適用されている期間における前記制御対象の稼働状態との関係を示す関数の予測分布を算出する予測分布算出部と、前記予測分布に基づいて前記パラメータの最適値の候補を探索する探索部と、を備える。

【0009】

また、本発明の一態様に係る探索方法は、少なくとも１つの情報処理装置が実行する探索方法であって、推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおける当該推論および当該制御の少なくとも何れかに関するパラメータと、当該パラメータが適用されている期間における前記制御対象の稼働状態との関係を示す関数の予測分布を算出するステップと、前記予測分布に基づいて前記パラメータの最適値の候補を探索するステップと、を含む。

【発明の効果】

【0010】

本発明の一態様によれば、個人の技能に左右されることなく、推論や制御に関するパラメータを適切に設定することが可能になる。

【図面の簡単な説明】

【0011】

【図1】本発明の一実施形態に係る制御システムの概要を示す図である。

【図2】本発明の一実施形態に係る情報処理装置（推論モデルの適合性を示す指標値を算出する装置）の要部構成の一例を示すブロック図である。

【図3】本発明の一実施形態に係る情報処理装置（パラメータの最適値を探索する装置）の要部構成の一例を示すブロック図である。

【図4】閾値の決定方法と入力データが外れ値であるか否かの判定方法を説明する図である。

【図5】廃棄物を焼却することにより発生した熱を利用して発電を行う焼却発電プラントにおいて、算出した指標値と再現率の遷移を示す図である。

【図6】探索結果の表示画面の例を示す図である。

【図7】上記情報処理装置（推論モデルの適合性を示す指標値を算出する装置）が実行する処理の一例を示すフローチャートである。

【図8】上記情報処理装置（パラメータの最適値を探索する装置）が実行する処理の一例を示すフローチャートである。

【発明を実施するための形態】

【0012】

〔システム概要〕
図１は、本発明の一実施形態に係る制御システム７の概要を示す図である。図示のように、制御システム７には、学習装置１と、情報処理装置２と、情報処理装置３と、制御装置４と、制御対象５とが含まれている。制御システム７は、制御装置４により制御対象５の動作を制御するシステムであり、制御対象５に対する制御は、推論モデルによる推論の結果に基づいて行われる。

【0013】

制御対象５は、制御装置４の制御対象であり機器５１を含む。また、制御対象５には計測装置５２が取り付けられている。計測装置５２は、機器５１に関するデータの計測を行うものであり、機器５１や計測したいデータに応じたものを適用すればよい。例えば、機器５１の内部あるいは外部の温度を計測したい場合には、計測装置５２として温度センサを用いればよい。

【0014】

制御対象に含まれる機器５１および計測装置５２は、各１つであってもよいし、複数であってもよい。例えば、制御対象５が１つのプラントである場合、機器５１はプラント内の機器である。この場合、計測装置５２は、機器５１に取り付けられていてもよいし、プラント内の他の場所に取り付けられてもよく、プラント外に設置されていてもよい。

【0015】

学習装置１は、制御対象５に対する制御の内容を決定するために用いられる推論モデルを生成する。推論モデルは、訓練データを用いた機械学習により生成されるから機械学習モデルと呼ぶこともできる。また、学習装置１は、推論モデルの再学習を行い、当該推論モデルを更新する。なお、機械学習のアルゴリズムは任意であり、使用する訓練データや推論内容等に応じて適当なアルゴリズムを適用すればよい。

【0016】

推論モデルは、制御対象５に対する制御の内容を決定する指針となるような事項についての推論を行うものであればよい。例えば、推論モデルは、制御対象５の将来の稼働状態が正常であるか否かを予測するものであってもよい。また、例えば、推論モデルは、将来の計測装置５２の測定値を予測するものであってもよいし、制御対象５に対する最適な制御の内容を予測するものであってもよい。

【0017】

情報処理装置２は、学習装置１が生成する推論モデルによる推論の際に当該推論モデルに入力された入力データに対する当該推論モデルの適合性を示す指標値を算出する。詳細は後述するが、情報処理装置２は、上記指標値の算出にあたり、推論モデルの生成に用いた訓練データセットに含まれる訓練データが外れ値であるか否かを判定するための閾値を用いて、推論モデルに入力された複数の入力データのそれぞれについて、当該入力データが外れ値であるか否かを判定する。そして、情報処理装置２は、その判定結果に基づいて上記指標値を算出する。これにより、入力データに対する推論モデルの適合性を的確に判定することが可能になる。この指標値は、学習装置１に推論モデルを更新させるタイミングを決定するために使用される。

【0018】

情報処理装置３は、制御対象５の制御に関するパラメータの最適値の探索を行う。また、情報処理装置３は、制御対象５の制御に関するパラメータの代わりに、あるいは当該パラメータに加えて、推論モデルによる推論に関するパラメータの最適値の探索を行ってもよい。この探索により検出されたパラメータは制御装置４に提供され、制御装置４はこのパラメータを適用して制御対象５に対する制御を行う。

【0019】

詳細は後述するが、情報処理装置３は、推論モデルによる推論および該推論の結果に応じた制御の少なくとも何れかに関する上述のパラメータと、当該制御後の制御対象５の稼働状態との関係を示す関数の予測分布を算出し、算出した予測分布に基づいてパラメータの最適値の候補を探索する。これにより、オペレータの技能に左右されることなくパラメータを適切に設定することが可能になる。

【0020】

制御装置４は、上述の推論モデルを用いて推論を行うと共に、当該推論の結果に基づいて制御対象５に対する制御内容を決定する。具体的には、制御装置４は、データ取得部４１と、推論部４２と、制御内容決定部４３とを備えており、これらの各部により上述の機能が実現される。

【0021】

データ取得部４１は、推論に必要なデータを取得する。例えば、データ取得部４１は、計測装置５２により計測された計測データを取得してもよい。データ取得部４１が取得したデータは、そのままあるいは所定のデータ処理を施した上で、推論モデルの入力データとされる。そして、推論部４２は、上述の推論モデルに上述の入力データを入力し、出力データを得る。

【0022】

制御内容決定部４３は、推論部４２の推論の結果、すなわち上述の出力データに応じた制御内容を決定する。例えば、推論モデルが制御対象５の将来の稼働状態が正常であるか否かを予測するものである場合、制御内容決定部４３は、稼働状態が正常である可能性が高いことを示す出力データが出力されたときには制御内容を従前の内容から変更しないようにしてもよい。一方、制御内容決定部４３は、稼働状態が正常ではない可能性が高いことを示す出力データが出力されたときには、稼働状態を正常にするための制御内容を決定すればよい。制御内容は、情報処理装置３が検出したパラメータに基づいて決定される。

【0023】

なお、学習装置１が推論モデルを更新したときには、データ取得部４１は更新後の推論モデルを取得し、推論部４２は更新後の推論モデルに入力データを入力することにより出力データを得て、制御内容決定部４３は当該出力データに基づいて制御対象５に対する制御内容を決定する。

【0024】

以上のように、制御システム７は、訓練データが外れ値であるか否かを判定するための閾値を用いて推論モデルに入力された入力データが外れ値であるか否かを判定し、その判定結果に基づいて、当該入力データに対する推論モデルの適合性を示す指標値を算出する情報処理装置２と、算出された指標値に基づいて決定されたタイミングで推論モデルを更新する学習装置１と、更新後の推論モデルに入力データを入力することにより得られた出力データに基づいて制御対象５に対する制御内容を決定する制御装置４とを含む。このようにして推論モデルが更新されると、情報処理装置２は、更新後の推論モデルに入力された入力データを取得して、当該入力データに対する推論モデルの適合性を示す指標値を算出する。

【0025】

このように、制御システム７では、推論モデルの再学習および更新と、推論モデルと入力データとの適合性を示す指標値の算出とを繰り返し行うことができる。これにより、適切なタイミングで再学習を行い、制御対象５に対する制御内容が妥当である状態を維持することが可能になる。

【0026】

また、以上のように、制御システム７は、あるパラメータが適用されている期間における、当該パラメータと制御対象５の稼働状態との関係を示す関数の予測分布を算出し、算出した予測分布に基づいて上記パラメータの最適値の候補を探索する情報処理装置３と、検出された最適値の候補を適用して制御対象５に対する制御を行う制御装置４と、を含む。なお、あるパラメータとは、制御対象５の制御と、推論モデルによる推論との少なくとも何れかに関するパラメータである。

【0027】

そして、情報処理装置３は、検出された候補が適用されている期間における稼働状態を示す結果データを取得し、当該結果データに基づいて予測分布を更新すると共に、更新後の予測分布に基づいてパラメータの最適値の新たな候補を探索する。これにより、制御システム７では、制御対象５に対する制御を行いながら、パラメータを最適値に近付けていくことができる。

【0028】

〔情報処理装置２の構成〕
図２は、情報処理装置２の要部構成の一例を示すブロック図である。図示のように、情報処理装置２は、情報処理装置２の各部を統括して制御する制御部２０と、情報処理装置２が使用する各種データを記憶する記憶部２１を備えている。また、情報処理装置２は、情報処理装置２が他の装置と通信するための通信部２２、情報処理装置２に対する各種データの入力を受け付ける入力部２３、および情報処理装置２が各種データを出力するための出力部２４を備えている。

【0029】

また、制御部２０には、データ取得部２０１、平均距離算出部２０２、閾値決定部２０３、外れ値判定部２０４、指標値算出部２０５、再学習要否判定部２０６、再現率算出部２０７、および学習用データ抽出部２０８が含まれている。

【0030】

データ取得部２０１は、情報処理装置２で使用する各種データを取得する。例えば、データ取得部２０１は、推論モデルの生成に用いた複数の訓練データを含む訓練データセットや、推論のために推論モデルに入力された入力データを取得する。例えば、データ取得部２０１は、学習装置１から訓練データセットを取得し、制御装置４から入力データを取得してもよい。

【0031】

平均距離算出部２０２は、データ間の平均距離を算出する。具体的には、平均距離算出部２０２は、データ取得部２０１が取得する訓練データセットに含まれる訓練データの１つと、当該訓練データからの距離が最も近い所定数の訓練データのそれぞれとの距離の平均値を算出する処理を、各訓練データについて行う。また、平均距離算出部２０２は、データ取得部２０１が取得する複数の入力データのうちの１つと、当該入力データからの距離が最も近い所定数の他の入力データのそれぞれとの距離の平均値を算出する処理を、各入力データについて行う。

【0032】

閾値決定部２０３は、データ取得部２０１が取得する訓練データセットに含まれる訓練データが外れ値であるか否かを判定するための閾値を決定する。より詳細には、閾値決定部２０３は、訓練データセットに含まれる各訓練データについて、当該訓練データが他の訓練データに対して乖離している程度を示す乖離度を算出し、算出した乖離度のうち所定の順位の乖離度を閾値に決定する。上記乖離度は、例えば、平均距離算出部２０２が各訓練データについて算出する平均値であってもよい。

【0033】

外れ値判定部２０４は、データ取得部２０１が取得する複数の入力データのそれぞれについて、当該入力データが外れ値であるか否かを判定する。この判定には、閾値決定部２０３が決定する閾値が用いられる。つまり、外れ値判定部２０４は、閾値決定部２０３が決定する閾値を基準として入力データが外れ値であるか否かを判定する。

【0034】

指標値算出部２０５は、外れ値判定部２０４の判定結果に基づき、入力データに対する推論モデルの適合性を示す指標値を算出する。指標値については後記〔指標値の例〕の項目で説明する。

【0035】

再学習要否判定部２０６は、指標値算出部２０５が算出する指標値に基づいて推論モデルの再学習の要否を判定する。そして、再学習要否判定部２０６は、推論モデルの再学習が必要と判定したときには、学習装置１に指示して推論モデルの再学習を行わせる。つまり、再学習要否判定部２０６が、再学習が必要と判定したタイミングが、再学習を行うべきタイミングということになり、再学習要否判定部２０６は再学習のタイミングを決定しているともいえる。

【0036】

再現率算出部２０７は、推論モデルに複数の入力データを入力して行った各推論における再現率を算出する。再現率は、真の値が正事例のものの中で、正事例と予測した割合を示す指標である。例えば、状態が正常であるか異常であるかを予測する推論モデルの場合、再現率は、（異常と正しく判定できた件数）／{（異常と正しく判定できた件数）＋（異常を正常と誤判定した件数）}との式で算出することができる。つまり、再現率算出部２０７は、異常と正しく判定できた件数を、異常と正しく判定できた件数と異常を正常と誤判定した件数との和で除することにより、当該判定における再現率を算出する。

【0037】

学習用データ抽出部２０８は、指標値算出部２０５が算出する指標値に基づいてデータ取得部２０１が取得する複数の入力データの中から推論モデルの再学習に用いるものを抽出する。上述のように、指標値算出部２０５が算出する指標値は、外れ値判定部２０４の判定結果に基づいて算出されるから、学習用データ抽出部２０８は、外れ値判定部２０４の判定結果に基づいて再学習に用いる入力データを抽出しているともいえる。

【0038】

また、学習用データ抽出部２０８は、再現率算出部２０７が算出する再現率についても考慮して再学習に用いる入力データを抽出してもよい。抽出した入力データは例えば、再学習要否判定部２０６が推論モデルの再学習が必要と判定したときに学習装置１に送信するようにしてもよい。

【0039】

以上のように、情報処理装置２は、推論モデルの生成に用いた訓練データセットに含まれる訓練データが外れ値であるか否かを判定するための閾値を用いて、推論モデルに入力された複数の入力データのそれぞれについて、当該入力データが外れ値であるか否かを判定する外れ値判定部２０４と、外れ値判定部２０４の判定結果に基づき、入力データに対する推論モデルの適合性を示す指標値を算出する指標値算出部２０５と、を備える。

【0040】

上記の構成によれば、訓練データが外れ値であるか否かを判定するための閾値を用いて推論モデルに入力された入力データが外れ値であるか否かを判定している。この処理では、仮に訓練データセットに含まれていたとすると外れ値と判定されるような入力データ、つまり学習済みの範囲から乖離した入力データが外れ値と判定される。

【0041】

そして、学習済みの範囲から乖離した入力データの数や割合が増えたとき、入力データに対する推論モデルの適合性は低くなっているといえる。また、このとき、推論モデルの再学習や交換の必要性は高くなっているといえる。よって、上記の判定結果に基づいて指標値を算出する上記の構成によれば妥当な指標値を算出することができる。

【0042】

また、この指標値の算出は、推論モデルによる推論結果を用いることなく行うことができる。このため、上記の構成によれば、推論結果の正否の検証が難しい場合にも妥当な指標値を算出すること、つまり推論に用いた入力データに対する推論モデルの適合性を的確に判定することが可能になる。そして、この指標値を用いることにより、推論モデルの更新に関する各種処理を適切に行うことも可能になる。

【0043】

また、以上のように、情報処理装置２は、推論モデルの生成に用いた訓練データセットに含まれる訓練データが外れ値であるか否かを判定するための閾値を用いて、推論モデルに入力された複数の入力データのそれぞれについて、当該入力データが外れ値であるか否かを判定する外れ値判定部２０４と、外れ値判定部２０４の判定結果に基づき、推論モデルに入力された複数の入力データの中から推論モデルの再学習に用いるものを抽出する学習用データ抽出部２０８とを備えている。

【0044】

上述のように、学習済みの範囲から乖離した入力データの数や割合が増えたとき、入力データに対する推論モデルの適合性は低くなっているといえる。また、このとき、推論モデルの再学習や交換の必要性は高くなっているといえる。よって、外れ値判定部２０４の判定結果に基づいて推論モデルの再学習に用いる入力データを抽出する上記の構成によれば、再学習用のデータとして妥当なものを抽出することができる。

【0045】

なお、学習用データ抽出部２０８は、指標値算出部２０５が算出する指標値を用いて入力データを抽出してもよいし、当該指標値は用いず、外れ値判定部２０４の判定結果を用いて入力データを抽出してもよい。つまり、再学習に用いる入力データを抽出するにあたり、指標値算出部２０５を備えていることは必須ではない。

【0046】

また、上記の構成によれば、再学習に用いる入力データを抽出にあたり、推論モデルによる推論結果を用いる必要がない。このため、上記の構成によれば、推論結果の正否の検証が難しい場合にも、推論モデルの更新に関する処理である再学習用のデータを抽出する処理を適切に行うことが可能になる。

【0047】

〔情報処理装置３の構成〕
図３は、情報処理装置３の要部構成の一例を示すブロック図である。図示のように、情報処理装置３は、情報処理装置２と同様に、制御部３０、記憶部３１、通信部３２、入力部３３、および出力部３４を備えている。情報処理装置３の制御部３０には、データ取得部３０１、評価値算出部３０２、予測分布算出部３０３、探索部３０４、最適化制御部３０５、および表示制御部３０６が含まれている。

【0048】

データ取得部３０１は、情報処理装置３において使用される各種データを取得する。具体的には、データ取得部３０１は、情報処理装置３（より正確には探索部３０４）が検出したパラメータを適用した制御が行われた期間における制御対象５の稼働状態を示す結果データを取得する。例えば、データ取得部３０１は、当該期間における計測装置５２の計測データを結果データとして取得してもよい。

【0049】

評価値算出部３０２は、データ取得部３０１が取得する結果データを用いて、制御対象５の稼働状態を評価した評価値を算出する。評価値は、制御対象５の稼働状態の良し悪しを表すものであればよい。なお、この評価値は、適用したパラメータの良し悪しを表しているともいえる。

【0050】

例えば、制御システム７において、制御対象５の将来の稼働状態を示す値を予測する推論モデルを用い、制御対象５の稼働状態が正常である状態を維持する制御を行う場合、評価値算出部３０２は、異常時間率を評価値としてもよい。異常時間率は、制御対象５の稼働時間に対する、制御対象５の稼働状態が異常であった時間の比である。制御対象５の稼働状態が異常であるか正常であるかはデータ取得部３０１が取得する結果データに基づいて判定することができる。

【0051】

予測分布算出部３０３は、上述のパラメータと、当該パラメータが適用されている期間における制御対象５の稼働状態との関係を示す関数の予測分布を算出する。制御対象５の稼働状態は、評価値算出部３０２の算出する評価値により表される。例えば、評価値算出部３０２が異常時間率を算出する場合、予測分布算出部３０３は、制御対象５の稼働状態を示す情報として異常時間率を用いる。この場合、異常時間率を低くすることができるような値にパラメータを設定することが可能になる。なお、評価値算出部３０２に評価値を算出させる代わりに、当該評価値を、入力部３３等を介して入力するようにし、評価値算出部３０２を省略してもよい。

【0052】

探索部３０４は、予測分布算出部３０３が算出する予測分布に基づいてパラメータの最適値の候補を探索する。なお、予測分布の算出方法と候補の探索方法については後記〔予測分布の算出方法と最適値の候補の探索方法の詳細〕の項目で説明する。

【0053】

最適化制御部３０５は、予測分布算出部３０３と探索部３０４によるパラメータの最適化に関する制御を行う。例えば、最適化制御部３０５は、所定の条件を満たした場合に、予測分布算出部３０３と探索部３０４に最適化を終了させる制御を行う。

【0054】

表示制御部３０６は、探索部３０４が検出した候補を表示装置に表示出力させる。表示装置は情報処理装置３が備えているものであってもよい。例えば、出力部３４が表示装置である場合、表示制御部３０６は、探索部３０４が検出した候補を出力部３４に表示出力させてもよい。また、表示制御部３０６は、情報処理装置３に接続されている表示装置に表示出力させてもよいし、通信部３２を介して通信可能な他の装置を介して当該装置に接続された表示装置に表示出力させてもよい。

【0055】

以上のように、情報処理装置３は、上述のパラメータと当該パラメータが適用されている期間における制御対象５の稼働状態との関係を示す関数の予測分布を算出する予測分布算出部３０３と、算出された予測分布に基づいてパラメータの最適値の候補を探索する探索部３０４と、を備える。

【0056】

上記の構成によれば、当該パラメータと稼働状態との関係を定式化することが難しい場合であっても、妥当なパラメータを検出することが可能になる。よって、上記の構成によれば、推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システム７において、個人の技能に左右されることなくパラメータを適切に設定することが可能になる。

【0057】

また、予測分布算出部３０３は、探索部３０４が検出した候補と、当該候補が適用されている期間における制御対象５の稼働状態とに基づいて予測分布を更新する。そして、探索部３０４は、更新後の予測分布に基づいてパラメータの最適値の新たな候補を探索する。

【0058】

この構成によれば、先に検出した最適値の候補を適用したときの稼働状態を踏まえて、最適値の新たな候補を探索するから、より妥当性の高い候補を検出することが可能になる。また、例えば季節変動や経年変化により制御対象の状態が変化した場合であっても、変化後の状態に適合した候補を検出することが可能になる。なお、この構成ではある程度のトライアンドエラーが発生し得るが、その回数は必要最小限に抑えられる。

【0059】

〔閾値の決定方法と、外れ値であるか否かの判定方法〕
図４は、閾値の決定方法と入力データが外れ値であるか否かの判定方法を説明する図である。本項目では、図４に基づいて、閾値決定部２０３による閾値の決定方法と、外れ値判定部２０４による外れ値であるか否かの判定方法について説明する。

【0060】

閾値決定部２０３は、推論モデルの機械学習に用いた訓練データセットを用いて閾値を決定する。閾値の決定にあたり、平均距離算出部２０２が、訓練データセットに含まれる訓練データの１つと、当該訓練データからの距離が最も近い所定数の訓練データのそれぞれとの距離の平均値を算出する処理を、各訓練データについて行う。上述のように、このようにして算出される平均値は、各訓練データが他の訓練データに対して乖離している程度を示すものであり、乖離度と呼ぶこともできる。

【0061】

図４の左側には、訓練データセットに含まれる各訓練データの特徴空間におけるプロットを示している。例えば、上述の所定数を５としたとする。この場合、平均距離算出部２０２は、訓練データの１つであるデータＤ１について、当該特徴空間内においてデータＤ１から距離が最も近い５つの訓練データのそれぞれとデータＤ１との距離を算出し、それらの平均値を算出する。同様に、平均距離算出部２０２は、データＤ２についても、データＤ２から距離が最も近い５つの訓練データのそれぞれとデータＤ２との距離の平均値を算出する。平均距離算出部２０２は、このような処理を訓練データセットに含まれる各訓練データについて行う。これらの処理は、データ分類の一手法であるｋ近傍法で行われる処理と同様の処理である。

【0062】

次に、閾値決定部２０３が、上述のようにして算出された平均値をその大きさの昇順に並べ、順位が所定の順位となる平均値を求め、当該平均値を閾値に決定する。算出された平均値が大きい値の訓練データほど、他の訓練データから乖離しており、訓練データセットの全体からみて外れ値である可能性が高いといえる。例えば、図４に示されるデータＤ２について算出される平均値は、データＤ１について算出される平均値よりも大きいため、データＤ２はデータＤ１よりも外れ値である可能性が高いといえる。

【0063】

所定の順位は適宜設定すればよく、どのような値に設定するかは特に限定されない。例えば、訓練データセットにおける所定の割合の訓練データが当該順位より上位になるように所定の順位を設定してもよい。具体例を挙げれば、９６％の訓練データが当該順位より上位になるようにする場合、（訓練データの総数）×０．９６の値が所定の順位となる。この場合、訓練データの４％が外れ値となる。

【0064】

一方、図４の右側には、推論モデルに入力された各入力データの特徴空間におけるプロットを示している。以下では、外れ値判定部２０４による外れ値であるか否かの判定方法について説明する。

【0065】

外れ値判定部２０４は、以上のようにして決定された閾値を用いて、推論モデルに入力された入力データが外れ値であるか否かを判定する。外れ値であるか否かの判定においても、まず、平均距離算出部２０２による平均値の算出が行われる。より詳細には、平均距離算出部２０２は、入力データの１つと、当該入力データからの距離が最も近い所定数の入力データのそれぞれとの距離の平均値を算出する処理を、各入力データについて行う。平均距離算出部２０２により算出される平均値は、各入力データが他の入力データに対して乖離している程度を示しており、乖離度と呼ぶこともできる。

【0066】

図４の右側の例においても、同図の左側の例と同様に所定数は５である。この場合、平均距離算出部２０２は、入力データの１つであるデータｄ１について、特徴空間内においてデータｄ１から距離が最も近い５つの入力データのそれぞれとデータｄ１との距離を算出し、それらの平均値を算出する。

【0067】

そして、外れ値判定部２０４は、算出された平均値と、閾値決定部２０３が決定した閾値とを比較し、それらの大小関係に基づいてデータｄ１が外れ値であるか否かを判定する。例えば、外れ値判定部２０４は、図示のように、データｄ１について算出された平均値が閾値以上であった場合に、データｄ１を外れ値と判定してもよい。同様にして外れ値判定部２０４は、他の入力データのそれぞれについて、当該入力データが外れ値であるか否かを判定する。

【0068】

なお、外れ値の検方法は上述の例に限られない。例えば、ＬＯＦ（Local Outlier Factor）により外れ値を検出してもよい。この場合、閾値決定部２０３は、局所密度の閾値を決定し、外れ値判定部２０４は、局所密度が当該閾値以下である入力データを外れ値と判定すればよい。また、例えば、ホテリング理論により外れ値を検出してもよい。この場合、閾値決定部２０３は、異常度の閾値を決定し、外れ値判定部２０４は、異常度が当該閾値以上である入力データを外れ値と判定すればよい。

【0069】

以上のように、閾値決定部２０３は、訓練データセットに含まれる各訓練データについて、当該訓練データが他の訓練データに対して乖離している程度を示す乖離度を算出し、算出した乖離度のうち所定の順位の乖離度を閾値に決定してもよい。そして、外れ値判定部２０４は、複数の入力データに含まれる各入力データについて算出された、当該入力データが他の入力データに対して乖離している程度を示す乖離度を、閾値決定部２０３が決定した閾値と比較することにより、各入力データが外れ値であるか否かを判定してもよい。

【0070】

上記の判定により外れ値と判定される入力データの数が増えた場合、推論に用いた入力データの特徴が、訓練データの特徴とは異なるものに変化したといえる。よって、上記の構成によれば、入力データに対する推論モデルの適合性を的確に判定することが可能になる。

【0071】

なお、外れ値の検出方法と同様に、乖離度の算出方法も特に限定されない。例えば、上述のように近傍の所定数のデータからの平均距離を乖離度としてもよい。この場合、当該距離は、例えばユークリッド距離であってもよいし、マンハッタン距離やマハラノビス距離等の他の距離であってもよい。また、例えば、ホテリング理論における異常度を乖離度としてもよいし、ＬＯＦで用いられる局所密度を乖離度としてもよい。

【0072】

〔指標値の例〕
指標値算出部２０５が算出する指標値は、入力データに対する推論モデルの適合性を示すものであればよい。例えば、指標値算出部２０５は、所定期間に外れ値判定部２０４が外れ値と判定した入力データの総数を上記指標値としてもよい。例えば、制御対象５を毎日稼働させる場合に、一日のうちに推論に用いられた複数の入力データのそれぞれについて当該入力データが外れ値であるか否かが判定されたとする。この場合、指標値算出部２０５は、外れ値であると判定された入力データの総数を、その日の終了時点における推論モデルの適合性を示す指標値として算出してもよい。

【0073】

また、例えば、指標値算出部２０５は、外れ値判定部２０４が外れ値と判定した入力データの数を用いて指標値を算出してもよい。例えば、指標値算出部２０５は、所定期間に計測装置５２で計測された入力データのうち、外れ値判定部２０４が外れ値と判定した入力データの割合を指標値として算出してもよい。

【0074】

また、推論モデルが、所定の対象（例えば制御対象５）に関する入力データから、当該対象の将来の状態が正常であるか異常であるかを予測するモデルである場合、指標値算出部２０５は、外れ値であると判定された入力データのうち、当該入力データを用いた予測後に上記対象の状態が異常であった入力データの数または当該入力データの数を用いて算出される値を指標値として算出してもよい。

【0075】

外れ値であると判定された入力データは、入力データを用いた予測後に対象の状態が異常であったものと正常であったものとに分類することができる。このうち、予測後に対象の状態が異常であったものについては、異常という状態に応じた特徴が含まれているといえる。

【0076】

一般に正常という状態は変わらないが、異常という状態には多様性があるから、異常という状態に応じた特徴が含まれている入力データに外れ値が多いときには、異常という状態が学習時から変化した可能性があり、再学習の必要性が高いといえる。よって、上記の構成によれば、異常という状態の性質が変化することを考慮した妥当な指標値を算出することができる。

【0077】

〔再現率を考慮した再学習要否の判定〕
上述のように、推論モデルは、所定の対象に関する入力データから、当該対象の将来の状態が正常であるか異常であるかを予測するモデルであってもよい。この場合、異常である状態を見逃すつまり実際には異常であるのに正常と判定してしまう可能性を低減するという観点から、推論モデルの精度は再現率で評価することが好ましい。

【0078】

上記のような推論モデルの推論結果の正否の検証は難しい場合があるが、再現率を単体で利用するのではなく、指標値算出部２０５が算出する指標値と共に利用することにより、効果的な再学習が可能になる。

【0079】

これについて、図５に基づいて説明する。図５は、廃棄物を焼却することにより発生した熱を利用して発電を行う廃棄物焼却発電プラントにおいて、指標値算出部２０５が算出した指標値と再現率の遷移を示す図である。つまり、ここでは制御対象５が廃棄物焼却発電プラントである例を示している。なお、指標値は、１日あたりの外れ値と判定された入力データの総数である。また、同図には、上記廃棄物焼却発電プラントにおける蒸気量の設定値の遷移についても併せて示している。同図の横軸は時間（日）であり、縦軸の値は０～１の値に正規化したものである。

【0080】

図５において、円Ｃ１で示した期間では、再現率は高い水準で推移している。一方、指標値については、直近まで低い水準であった値が急増し、その後、高い水準で推移している。指標値の急増の直前に設定値が大きい値に変化していることから、指標値の急増の原因は設定値が変更されて入力データの特徴が変化したことにあると考えられる。

【0081】

一方、円Ｃ２で示した期間では、設定値に大きな変化がないにもかかわらず、指標値が増加し、再現率が低下している。この期間においては、設定値の変更以外の要因により、外れ値と判定された入力データが増えると共に、再現率が低下したと考えられる。このように指標値が増加し、かつ再現率が低下している期間は、推論モデルが異常と正常を分類する能力が低い期間であるといえる。

【0082】

このように、所定の対象に関する入力データから、当該対象の将来の状態が正常であるか異常であるかを予測する推論モデルを用いる場合、再現率算出部２０７は、推論モデルに複数の入力データを入力して行った予測における再現率、すなわち、異常と正しく判定できた件数を、異常と正しく判定できた件数と異常を正常と誤判定した件数との和で除した値を算出してもよい。

【0083】

再現率が低下している期間は、推論モデルによる正常であるか異常であるかの予測の精度が低下している期間であるといえるから、再現率は、推論モデルが異常と正常を分類する能力の高低を示す指標として利用できると考えられる。しかし、再現率の算出に用いられる、異常と正しく判定できた件数と異常を正常と誤判定した件数は、推論モデルの予測結果に基づく介入制御やオペレータの操作等の影響を受けるため、再現率を絶対的な評価指標とすることは好ましくない。一方で、上述の指標値を用いれば、使用された入力データが未学習の傾向を持つ期間を特定することが可能である。

【0084】

このため、学習用データ抽出部２０８は、再現率算出部２０７が算出する再現率と、指標値算出部２０５が算出する指標値とに基づいて、複数の入力データの中から推論モデルの再学習に用いるものを抽出してもよい。これにより、特に学習すべき期間（入力データが未学習の傾向を持ち、かつ回避すべき異常となってしまった期間）を推定することができ、効率よく学習すべきデータ期間を特定し、当該期間の入力データを再学習用のデータとして抽出することができる。例えば、図５の例において、取得された入力データのうち、円Ｃ２で示した期間の入力データを用いて効果的な再学習を行うこともできる。

【0085】

〔予測分布の算出方法と最適値の候補の探索方法の詳細〕
予測分布算出部３０３による予測分布の算出方法（更新も含む）の詳細と、探索部３０４による最適値の候補の探索方法の詳細を以下説明する。なお、以下の説明は、ベイズ最適化における予測分布の算出方法と探索方法に関するものである。ただし、予測分布を用いて最適値の候補を探索するものであれば、以下の説明に係る方法以外の方法を適用することも可能である。

【0086】

最適化の対象とするパラメータがＮ個ある場合、それらの制御パラメータは、

【0087】

【数1】

【0088】

と表され、
それに対する評価値は、

【0089】

【数2】

【0090】

と表される。

【0091】

予測分布算出部３０３は、データ取得部３０１が取得する結果データに基づいて、最適化の対象とするパラメータと制御後における制御対象の稼働状態との関係を示す関数の予測分布を算出する。なお、この関数を以下では評価関数ｆ（θ）と呼ぶ。また、新たな結果データ（例えば、探索部３０４が検出した候補を適用した制御の結果を示す結果データ）が取得されたときには、予測分布算出部３０３は、その結果データが反映されるように予測分布を更新する。

【0092】

パラメータと稼働状態との関係を、ガウスノイズε_ｎ～Ν（０，β）を用いて

【0093】

【数3】

【0094】

と仮定すると、ガウス過程による評価関数の予測分布として以下の分布が得られる。

【0095】

【数4】

【0096】

【数5】

【0097】

【数6】

【0098】

ここで、ｋ_＊＝ｋ（θ，θ）であり、Ｋ_Θは［Ｋ_Θ］_ｉ，ｊ＝ｋ（θ_ｉ，θ_ｊ）で得られるグラム行列である。また、

【0099】

【数7】

【0100】

である。ｋ_Θ，＊は、［ｋ_Θ，＊］_ｉ＝ｋ（θ_ｉ，θ）の縦ベクトルであり、ｋ（・，・）は、カーネル関数である。ここではカーネル関数のパラメータをα_ｋとする。

【0101】

平均関数μ（θ）は、結果データ（および当該結果データから評価値算出部３０２が算出した評価値）から予測される評価関数の平均値を示す。また、分散関数σ（θ）は、結果データ（および当該結果データから評価値算出部３０２が算出した評価値）から予測される評価関数の分散である。σ（θ）は、予測の不確実性を示し、結果データが不足している領域ではその値が大きくなる傾向がある。σが大きいと、予測が不確実であるといえ、予測の確実性を上げるために必要な結果データが不足しているといえる。数式（３）から明らかなように、分散関数σ（θ）に含まれるカーネル関数およびカーネル関数のパラメータα_ｋは、予測分布の算出に影響を与える。予測分布の算出の際には、パラメータα_ｋの最適化が行われる。最適化の方法は特に限定されず、例えば一般的なベイズ最適化で適用されている各種の最適化手法を適用することもできる。

【0102】

探索部３０４は、最適な制御パラメータを求めるために、最適な制御パラメータの候補を探索する。具体的には、探索部３０４は、後記数式（４）、（５）に示されるように、平均関数μ（θ）と分散関数σ（θ）を用いて獲得関数ａ（θ）を最大にするパラメータを探索する。この探索で検出されたパラメータが、最適なパラメータの候補となる。この探索は、ＵＣＢ（Upper Confidence Bound）戦略に基づいている。

【0103】

数式（５）におけるκは探索と利用を調節するためのパラメータである。受付部１０４が、フィードバック制御の結果が既知の値の周辺と、フィードバック制御の結果が未知の範囲と、の何れを重視して探索を行うかの選択を受け付けた場合、探索部３０４は、κを受け付けた選択に応じた値に設定し、候補の探索を行う。

【0104】

無論、他の方法で新たなパラメータを探索することも可能である。例えば、ＰＩ（Probability of Improvement）戦略や、ＥＩ（Expected Improvement）戦略で最適なパラメータの候補を探索してもよい。この他にも、例えば、ＰＴＲ（Probability in Target Range）あるいはＭＩ（Mutual Information）等の戦略を適用し、各戦略に応じた獲得関数を用いて最適なパラメータの候補を探索してもよい。

【0105】

なお、評価関数の値を最小化するパラメータを最適なパラメータとして求める場合（例えば稼働状態を示す情報として異常時間率を用いる場合等）には、獲得関数ａ（θ）を最小にするパラメータを探索すればよい。

【0106】

【数8】

【0107】

【数9】

【0108】

探索部３０４が検出したパラメータの最適値の候補は、表示制御部３０６が表示装置に表示させる等により情報処理装置３のオペレータに提示されてもよい。そして、制御装置４によりその候補を適用した制御対象５に対する制御が開始され、当該制御が行われた期間に計測装置５２により計測された計測データが制御装置４に取得され、蓄積される。そして、蓄積された計測データには適用されたパラメータが対応付けられ、新たな結果データとして情報処理装置３に入力される。

【0109】

そして、予測分布算出部３０３は、新たな結果データに基づいて予測分布を更新し、探索部３０４は、予測分布算出部３０３による更新後の予測分布に基づいて構成される評価関数に基づき、パラメータの最適値を探索する。このように、予測分布の更新と最適値の探索とを繰り返すことにより、最適なパラメータを検出することが可能になる。

【0110】

〔表示画面例（結果表示）〕
表示制御部３０６は、例えば図６のような表示画面を表示させて探索の結果をオペレータに提示してもよい。図６は、探索結果の表示画面の例を示す図である。より詳細には、図６は、探索するパラメータに含まれる要素ａ～ｄのそれぞれについて検出された候補の履歴を平行座標上に示した図である。

【0111】

このように、探索するパラメータには、複数の要素が含まれていてもよく、これにより複数の要素を並行して最適化することができる。例えば、上述の焼却発電プラントが制御対象５である場合、上記要素ａ～ｄは、自動燃焼制御に関する各種制御パラメータとしてもよい。自動燃焼制御に関する制御パラメータとしては、例えば、燃焼速度の調整、乾燥空気の供給流量の調整、燃焼空気の供給流量の調整、燃焼空気の温度の調整、および焼却する廃棄物層の高さの調整に関するパラメータ等が挙げられる。

【0112】

また、探索するパラメータには、例えば、推論モデルの推論の結果に応じた、制御対象５に対する制御の内容と制御量とを示すものが含まれていてもよい。これにより、推論モデルによる推論の結果に応じて制御の内容と制御量を適切に設定することが可能になる。

【0113】

また、探索するパラメータには、制御対象５に対する制御の内容と制御量とを示す上記パラメータに加え、推論モデルによる推論に用いられる推論用パラメータが含まれていてもよい。この場合、探索部３０４は、予測分布算出部３０３が算出する予測分布に基づいて、制御対象５に対する制御の内容と制御量の最適値の候補と、推論用パラメータの最適値の候補の両方を探索する。

【0114】

なお、推論用パラメータは、例えば、推論モデルがニューラルネットワークモデルである場合には、学習により求められる重み値のようなハイパーパラメータであってもよい。また、推論モデルが、複数の機械学習モデルの推論結果をアンサンブルして最終的な推論結果を出力するものである場合、上記推論用パラメータを、アンサンブル比（各推論結果に対する重み）としてもよい。

【0115】

制御対象５の稼働状態は、推論モデルによる推論の結果や、その結果に応じた介入制御等の影響を受ける。このため、制御対象５に対する制御の内容と制御量の最適値と、推論用パラメータの最適値とを個別に算出した場合、全体として最適なパラメータの組み合わせとならない場合がある。この点、上記の構成によれば、制御対象５に対する制御の内容と制御量の最適値と、推論用パラメータの最適値の両方を探索するから、全体として最適なパラメータの組み合わせを検出することが可能になる。

【0116】

また、制御対象５の将来の状態が正常であるか異常であるかを予測する推論モデルを用いる場合、当該推論モデルの出力値は、正常である確率および／または異常である確率を示すものとなる。このため、制御装置４において、制御内容決定部４３が、正常であるか異常であるかに応じた制御内容を決定するためには、上記の確率についての閾値を用いて、正常であるか異常であるかを判定する必要がある。

【0117】

そして、上記閾値をどのような値に設定するかは、状況に応じた妥当な制御内容を決定するために重要であるから、上記要素ａ～ｄには、制御対象５の将来の状態が正常であるか異常であるかを判定する当該閾値が含まれていてもよい。これにより、正常であるか異常であるかを適切に判定し、その判定結果に応じた妥当な制御を行うことが可能になる。なお、最適化するパラメータに含まれる要素の数は任意であり、また、各要素の内容も上記の例に限られない。

【0118】

ここで図６の説明に戻る。図６に示す平行座標は、縦軸がパラメータに含まれる各要素の値である。そして、当該平行座標上に、１回の探索で検出されたパラメータに含まれる要素を折れ線で結んだグラフを図示している。つまり、折れ線と縦軸との交点が各要素の値を示している。このようなグラフは並行座標プロットと呼ばれる。図６に示す並行座標プロットは、探索部３０４による各探索で検出された候補の値の遷移を示しており、遷移情報と呼ぶことができる。

【0119】

このように、表示制御部３０６は、探索部３０４による各探索で検出された候補の値の遷移を示す遷移情報を表示してもよい。これにより、パラメータの最適値の候補が、探索を重ねることによりどのように遷移したかをオペレータに容易に認識させ、最適化が正常に進んでいるかを確認させることができる。

【0120】

特に、最適化の対象とするパラメータが複数の要素を含んでいる場合、表示制御部３０６は、平行座標プロットすなわち各探索において検出された候補の値を要素ごとに示すグラフを平行座標上に表示してもよい。これにより、パラメータに含まれる各要素について検出された各候補が、探索を重ねることによりどのように変化したかをオペレータに容易に認識させ、最適化が正常に進んでいるかを確認させることができる。

【0121】

なお、平行座標プロットは遷移情報の表示態様の一例に過ぎず、遷移情報の表示態様は任意である。例えば、表示制御部３０６は、探索部３０４による各探索で検出された候補の値の遷移を示すパラレルセットグラフ、等高線プロット、あるいはコレログラフ等を遷移情報として表示してもよい。

【0122】

また、図６の例において、折れ線グラフを構成する線分には、実線のものと、破線のものと、一点鎖線のものとがある。これらの線分のパターンは、当該線分上の各要素の値を適用して制御対象５の制御を行った後の制御対象５の稼働状態に応じたものとなっている。具体的には、異常時間率が第１の閾値未満であったときの要素を結ぶ線分は実線、異常時間率が第１の閾値以上、第２の閾値未満であったときの要素を結ぶ線分は一点鎖線、異常時間率が第２の閾値以上であったときの要素を結ぶ線分は破線となっている。

【0123】

このように、表示制御部３０６は、検出された候補を適用して制御対象５の制御を行った後の制御対象５の稼働状態に応じて遷移情報に含まれる各候補の値の表示態様を異ならせてもよい。これにより、各候補の良し悪しを容易に認識させることができる。なお、稼働状態に応じた表示態様をどのようなものとするかは任意であり、図示の例に限られない。例えば、表示制御部３０６は、稼働状態に応じた色で各候補の値を表示させてもよい。この場合、稼働状態を評価した評価値（例えば異常時間率等）の値と、表示色との対応関係を予め定めておけばよい。これにより、表示制御部３０６は、評価値算出部３０２が算出する評価値に応じた表示色で各候補の値を表示させることができる。

【0124】

〔情報処理装置２が実行する処理の流れ〕
情報処理装置２が実行する処理（指標値算出方法）の流れを図７に基づいて説明する。図７は、情報処理装置２が実行する処理の一例を示すフローチャートである。

【0125】

Ｓ１１では、データ取得部２０１が、訓練データセットを取得する。訓練データセットの取得方法は任意である。例えば、データ取得部２０１は、入力部２３を介して入力された訓練データセットを取得してもよいし、通信部２２を介して学習装置１から訓練データセットを取得してもよい。

【0126】

Ｓ１２では、平均距離算出部２０２が、Ｓ１１で取得された訓練データセットに含まれる各訓練データについて、当該訓練データの近傍の所定数の訓練データとの距離の平均値をそれぞれ算出する。なお、ある訓練データの近傍の所定数の訓練データとは、その訓練データからの距離が最も近い所定数の他の訓練データである。

【0127】

Ｓ１３では、閾値決定部２０３が、Ｓ１２で算出された複数の平均値のうち所定の順位の平均値を、入力データが外れ値であるか否かを判定するための閾値に決定する。なお、Ｓ１１～Ｓ１３の処理は、遅くともＳ１６の処理が行われるまでに行っておけばよく、必ずしもＳ１４の直前に行う必要はない。

【0128】

Ｓ１４では、データ取得部２０１が、推論モデルによる推論に用いられた入力データを取得する。入力データの取得方法は任意である。例えば、データ取得部２０１は、入力部２３を介して入力された入力データを取得してもよい。また、例えば、データ取得部２０１は、通信部２２を介して制御装置４から入力データを取得してもよいし、計測装置５２から計測データを取得して入力データを生成してもよい。

【0129】

なお、データ取得部２０１は、所定期間分の入力データをまとめて取得してもよいし、入力データをリアルタイムつまり当該入力データが推論モデルによる推論に用いられたあるいは用いられるタイミングで取得してもよい。

【0130】

Ｓ１５では、平均距離算出部２０２が、Ｓ１４で取得された入力データについて、当該入力データの近傍の所定数の入力データとの距離の平均値を算出する。なお、Ｓ１４で１つの入力データが取得された場合、平均距離算出部２０２は、それ以前に取得された複数の入力データとの距離の平均値を算出する。一方、Ｓ１４で複数の入力データが取得された場合、平均距離算出部２０２は、入力データと、当該入力データの近傍の所定数の入力データとの距離の平均値を算出する処理を、取得された複数の入力データのそれぞれについて行う。

【0131】

Ｓ１６（外れ値判定ステップ）では、外れ値判定部２０４が、Ｓ１５で算出された平均値に基づいて、Ｓ１４で取得された入力データが外れ値であるか否かを判定する。より詳細には、外れ値判定部２０４は、Ｓ１５で算出された平均値とＳ１３で決定された閾値とを比較し、その比較結果に基づいて入力データが外れ値であるか否かを判定する。なお、Ｓ１４で複数の入力データが取得された場合には、外れ値判定部２０４は、各入力データについて当該入力データが外れ値であるか否かを判定する。

【0132】

Ｓ１７（指標値算出ステップ）では、指標値算出部２０５が、Ｓ１６の判定結果に基づいて入力データに対する推論モデルの適合性を示す指標値を算出する。例えば、指標値算出部２０５は、所定期間に計測装置５２で計測された計測データに対応する入力データのうち、Ｓ１６で外れ値であると判定された入力データの数を指標値として算出してもよい。

【0133】

Ｓ１８では、再学習要否判定部２０６が、Ｓ１７で算出された指標値に基づいて再学習の要否を判定する。例えば、再学習要否判定部２０６は、Ｓ１７で算出された指標値が所定の閾値以上であった場合に再学習要（Ｓ１８でＹＥＳ）と判定し、当該閾値未満であった場合に再学習不要（Ｓ１８でＮＯ）と判定してもよい。Ｓ１８でＮＯと判定された場合には図７の処理は終了する。なお、リアルタイムで入力データを取得する場合、Ｓ１８でＮＯと判定された場合にＳ１４に戻り、新たな入力データを取得するようにしてもよい。

【0134】

Ｓ１８でＹＥＳと判定された場合にはＳ１９に進み、再学習要否判定部２０６は、学習装置１にＳ１４で取得された入力データを送信して推論モデルの再学習を行わせ、これにより図７の処理は終了する。

【0135】

なお、再現率算出部２０７は、Ｓ１４で取得された入力データを用いて行われた推論の再現率を算出してもよい。そして、学習用データ抽出部２０８は、Ｓ１７で算出された指標値と、再現率算出部２０７が算出する再現率とに基づいて、Ｓ１４で取得された複数の入力データの中から推論モデルの再学習に用いるものを抽出してもよい。そして、学習用データ抽出部２０８は、Ｓ１８でＹＥＳと判定されたときに、再学習に用いる入力データを学習装置１に送信するようにしてもよい。

【0136】

〔再学習を促す構成について〕
また、Ｓ１９において、再学習要否判定部２０６は、再学習を行うように学習装置１を制御する代わりに、オペレータに推論モデルの再学習を促す処理を行ってもよい。この場合、再学習要否判定部２０６は、外れ値判定部２０４の判定結果に応じて推論モデルの再学習を促す報知部として機能する。なお、報知の態様および報知の対象は何れも特に限定されない。例えば、報知部２１０は、再学習が必要であることを示す情報を出力することによって報知してもよい。出力先は特に限定されず、例えば報知部２１０は、出力部２４に当該情報を出力させてもよいし、学習装置１に当該情報を出力させてもよく、オペレータの所持する端末装置等の他の装置に当該情報を出力させてもよい。

【0137】

また、再学習を促す処理を行う場合、指標値算出部２０５は省略し、再学習要否判定部２０６が外れ値判定部２０４の判定結果を用いて再学習の要否を判定してもよい。例えば、再学習要否判定部２０６は、Ｓ１６で外れ値であると判定された入力データの数をカウントし、カウントした数が所定の閾値以上であった場合に再学習要と判定してもよい。

【0138】

このように、情報処理装置２は、推論モデルの生成に用いた訓練データセットに含まれる訓練データが外れ値であるか否かを判定するための閾値を用いて、推論モデルに入力された複数の入力データのそれぞれについて、当該入力データが外れ値であるか否かを判定する外れ値判定部２０４と、外れ値判定部２０４の判定結果に応じて推論モデルの再学習を促す再学習要否判定部（報知部）２０６と、を備える構成であってもよい。これにより、推論結果の正否の検証が難しい場合にも、推論モデルの更新に関する処理である再学習を促す処理を適切に行うことが可能になる。

【0139】

〔情報処理装置２で再学習を行う構成について〕
また、情報処理装置２は、推論モデルの再学習を行う学習部を備えていてもよい。この場合、制御システム７から学習装置１を省略することができる。そして、この場合、図７のＳ１８において再学習要と判定されると、Ｓ１９では情報処理装置２が備える学習部により再学習が行われる。

【0140】

この場合も、上記〔再学習を促す構成について〕で説明したように、指標値算出部２０５は省略してもよい。指標値算出部２０５を省略する場合、外れ値判定部２０４の判定結果を用いて再学習のタイミングが決定される。例えば、再学習要否判定部２０６が外れ値判定部２０４の判定結果を用いて再学習の要否を判定してもよく、この場合、再学習要と判定された時点が再学習のタイミングとなる。また、再学習要否判定部２０６を省略し、学習部が再学習を行うか否かを判定してもよく、この場合、学習部が外れ値判定部２０４の判定結果に基づいて再学習のタイミングを決定することになる。

【0141】

このように、情報処理装置２は、推論モデルの生成に用いた訓練データセットに含まれる訓練データが外れ値であるか否かを判定するための閾値を用いて、推論モデルに入力された複数の入力データのそれぞれについて、当該入力データが外れ値であるか否かを判定する外れ値判定部２０４と、外れ値判定部２０４の判定結果に基づいて決定されたタイミングで推論モデルの再学習を行う学習部と、を備える構成であってもよい。

【0142】

【0143】

そして、学習済みの範囲から乖離した入力データの数や割合が増えたとき、入力データに対する推論モデルの適合性は低くなっているといえる。また、このとき、推論モデルの再学習や交換の必要性は高くなっているといえる。よって、外れ値判定部２０４の判定結果に基づいて決定されたタイミングで推論モデルの再学習を行う上記の構成によれば、妥当なタイミングで再学習を行うことができる。

【0144】

また、上記の構成によれば、推論モデルによる推論結果を用いる必要がない。このため、上記の構成によれば、推論結果の正否の検証が難しい場合にも、推論モデルの更新に関する処理である再学習を適切に行うことが可能になる。

【0145】

〔情報処理装置３が実行する処理の流れ〕
情報処理装置３が実行する処理（探索方法）の流れを図８に基づいて説明する。図８は、情報処理装置３が実行する処理の一例を示すフローチャートである。なお、図８の処理を実行する契機は特に限定されない。例えば、所定期間おきに実行するようにしてもよいし、制御対象５の稼働状態を示す異常時間率等の情報を基に、稼働状態が悪化しているあるいは悪化傾向にあると判定されたタイミングで実行するようにしてもよい。

【0146】

Ｓ２１では、データ取得部３０１が、最適化の対象となるパラメータの初期値と、当該初期値に対応する結果データとを取得する。例えば、データ取得部３０１は、入力部３３を介して入力される初期値と結果データを取得してもよい。パラメータの初期値に対応する結果データは、当該初期値を適用した制御対象５の制御が行われた期間における制御対象５の稼働状態を示すものであり、例えば当該期間に計測装置５２により計測された計測値であってもよい。

【0147】

また、データ取得部３０１は、Ｓ２１において、初期値とその結果データに加えて、パラメータの上限値およびその上限値を適用したときの結果データと、パラメータの下限値およびその下限値を適用したときの結果データとを取得していてもよい。

【0148】

パラメータの初期値の決定方法は特に限定されない。例えば、記述統計的手法等によりパラメータの初期値を決定してもよい。この場合、例えば、異常発生前後のパラメータの値の分布を示す度数分布表などを作成し、それを基に最適と考えられるパラメータの値を特定し、特定した値を初期値としてもよい。初期値が決まれば、パラメータの値を初期値に設定して制御対象５の制御を所定期間行い、当該期間における稼働状態を示す結果データを取得することができる。

【0149】

また、パラメータの上限値と下限値の決定方法も特に限定されない。例えば、初期値と同様に記述統計的手法等により決定してもよいし、初期値を基準とし、初期値から所定幅だけ乖離した値を上限値および下限値としてもよい。後者の場合、例えば所定幅を１０％として、初期値に初期値の１０％の値を加えて上限値とし、初期値から初期値の１０％の値を差し引いて下限値としてもよい。上限値および下限値のそれぞれについても、初期値と同様にして結果データを取得することができる。

【0150】

Ｓ２２では、評価値算出部３０２が、Ｓ２１で取得された結果データを用いて、初期値を適用して制御対象５の制御を行った期間における制御対象５の稼働状態を評価した評価値を算出する。評価値としては、例えば上述した異常時間率を適用してもよい。なお、異常時間率を算出する際の「異常」の定義は、推論モデルの学習の際と同じとしてもよいし、より広い定義を適用してもよい。

【0151】

Ｓ２３（予測分布を算出するステップ）では、予測分布算出部３０３が、Ｓ２１で取得された初期値と、Ｓ２２で算出された評価値とに基づいて、最適化の対象とするパラメータと制御対象５の稼働状態との関係を示す関数の予測分布を算出する。なお、表示制御部３０６は、算出された予測分布を出力部３４に出力させる等してオペレータに提示してもよい。

【0152】

Ｓ２４（候補を探索するステップ）では、探索部３０４が、Ｓ２３で算出された予測分布に基づいてパラメータの最適値の候補を探索する。また、表示制御部３０６は、検出された候補を出力部３４に出力させる等して当該候補をオペレータに提示する。

【0153】

この後、オペレータは、提示された候補を適用することに問題がないか確認し、問題ないと判断した場合には、制御装置４に当該候補を入力して、当該候補を適用した制御対象５の制御を開始させる。そして、オペレータは、当該候補を適用した制御が行われた期間に計測装置５２で計測された計測データ等を制御対象５の稼働状態を示す結果データとして、適用したパラメータの値（提示された候補の値）と共に情報処理装置３に入力する。これらの処理はオペレータを介さず自動で行うようにしてもよい。

【0154】

なお、オペレータが、Ｓ２４の探索の結果として提示された候補を適用することに問題があると判断した場合、Ｓ２５以下の処理はスキップされる。この場合、探索部３０４は、先に検出した候補とは異なる候補を探索してもよい。また、予めパラメータの正常範囲を定めておいてもよい。この場合、オペレータの判断によらず、Ｓ２４で検出された候補が当該正常範囲外である場合に、Ｓ２５以下の処理がスキップされる。

【0155】

Ｓ２５では、データ取得部３０１が、上述のようにして入力された、適用されたパラメータの値と結果データとを取得する。なお、データ取得部３０１は、適用されたパラメータの値と結果データを制御装置４から取得してもよい。そして、Ｓ２６では、評価値算出部３０２が、Ｓ２５で取得された結果データを用いて評価値を算出する。

【0156】

Ｓ２７では、最適化制御部３０５が、Ｓ２６で算出された評価値に基づいて最適化を終了するか否かを判定する。例えば、最適化制御部３０５は、評価値が所定の閾値以上である場合に最適化を終了する（Ｓ２７でＹＥＳ）と判定し、評価値が当該閾値未満である場合に最適化を続ける（Ｓ２７でＮＯ）と判定してもよい。Ｓ２７でＹＥＳと判定された場合には図８の処理は終了し、Ｓ２７でＮＯと判定された場合にはＳ２３の処理に戻る。Ｓ２７から遷移したＳ２３では、Ｓ２５で取得されたパラメータの値と結果データとを用いて予測分布が更新される。

【0157】

〔変形例〕
上述の各実施形態で説明した各処理の実行主体は任意であり、上述の例に限られない。つまり、相互に通信可能な複数の情報処理装置（プロセッサということもできる）により、学習装置１、情報処理装置２、３、および制御装置４の機能を実現することができる。例えば、図７および図８のフローチャートに記載されている各処理を複数の情報処理装置に分担させることもできる。つまり、上述の各実施形態における制御方法の実行主体は、１つの情報処理装置であってもよいし、複数の情報処理装置であってもよい。

【0158】

また、上述のように、学習装置１の機能を情報処理装置２に持たせてこれらを１つの装置に統合してもよいし、学習装置１、情報処理装置２、および情報処理装置３の機能の一部または全部を制御装置４に持たせてもよい。このように、制御システム７をどのような装置で構成するかについても適宜変更することが可能である。

【0159】

〔ソフトウェアによる実現例〕
学習装置１、情報処理装置２、３、および制御装置４（以下、「装置」と呼ぶ）の機能は、当該装置としてコンピュータを機能させるためのプログラムであって、当該装置の各制御ブロック（特に制御部２０および制御部３０に含まれる各部）としてコンピュータを機能させるためのプログラム（指標値算出プログラム／探索プログラム）により実現することができる。

【0160】

この場合、上記装置は、上記プログラムを実行するためのハードウェアとして、少なくとも１つの制御装置（例えばプロセッサ）と少なくとも１つの記憶装置（例えばメモリ）を有するコンピュータを備えている。この制御装置と記憶装置により上記プログラムを実行することにより、上記各実施形態で説明した各機能が実現される。

【0161】

上記プログラムは、一時的ではなく、コンピュータ読み取り可能な、１または複数の記録媒体に記録されていてもよい。この記録媒体は、上記装置が備えていてもよいし、備えていなくてもよい。後者の場合、上記プログラムは、有線または無線の任意の伝送媒体を介して上記装置に供給されてもよい。

【0162】

また、上記各制御ブロックの機能の一部または全部は、論理回路により実現することも可能である。例えば、上記各制御ブロックとして機能する論理回路が形成された集積回路も本発明の範疇に含まれる。この他にも、例えば量子コンピュータにより上記各制御ブロックの機能を実現することも可能である。

【0163】

〔まとめ〕
本発明の態様１に係る情報処理装置は、推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおける当該推論および当該制御の少なくとも何れかに関するパラメータと、当該パラメータが適用されている期間における前記制御対象の稼働状態との関係を示す関数の予測分布を算出する予測分布算出部と、前記予測分布に基づいて前記パラメータの最適値の候補を探索する探索部と、を備える。

【0164】

本発明の態様２に係る情報処理装置は、前記態様１において、前記パラメータは、前記推論の結果に応じた、前記制御対象に対する制御の内容と制御量とを示すものである。

【0165】

本発明の態様３に係る情報処理装置は、前記態様２において、前記パラメータには、前記推論モデルによる推論に用いられる推論用パラメータが含まれており、前記探索部は、前記予測分布に基づいて、前記制御対象に対する制御の内容と制御量の最適値の候補と、前記推論用パラメータの最適値の候補の両方を探索する。

【0166】

本発明の態様４に係る情報処理装置は、前記態様１において、前記推論モデルは、前記制御対象の将来の稼働状態を示す値を予測するものであり、前記パラメータは、前記制御対象の将来の稼働状態が正常であるか否かを判定するための閾値である。

【0167】

本発明の態様５に係る情報処理装置は、前記態様１から４の何れかにおいて、前記推論モデルは、前記制御対象の将来の稼働状態を示す値を予測するものであり、前記予測分布算出部は、前記制御対象の稼働状態を示す情報として、前記制御対象の稼働時間に対する、前記制御対象の稼働状態が異常であった時間の比を用いる。

【0168】

本発明の態様６に係る情報処理装置は、前記態様１から５の何れかにおいて、前記予測分布算出部は、前記探索部が検出した前記候補と、当該候補が適用されている期間における前記制御対象の稼働状態とに基づいて前記予測分布を更新し、前記探索部は、更新後の前記予測分布に基づいて前記パラメータの最適値の新たな候補を探索する。

【0169】

本発明の態様７に係る情報処理装置は、前記態様６において、前記探索部による各探索で検出された前記候補の値の遷移を示す遷移情報を表示する表示制御部を備える。

【0170】

本発明の態様８に係る情報処理装置は、前記態様７において、前記表示制御部は、前記候補を適用して前記制御対象の制御を行った後の前記制御対象の稼働状態に応じて前記遷移情報に含まれる各候補の値の表示態様を異ならせる。

【0171】

本発明の態様９に係る制御システムは、前記態様１に記載の情報処理装置と、前記情報処理装置が検出する前記パラメータの最適値の候補を適用して前記制御対象に対する制御を行う制御装置と、を含み、前記情報処理装置は、前記候補が適用されている期間における前記稼働状態を示す結果データを取得し、当該結果データに基づいて前記予測分布を更新すると共に、更新後の予測分布に基づいて前記パラメータの最適値の新たな候補を探索する。

【0172】

本発明の態様１０に係る探索方法は、少なくとも１つの情報処理装置が実行する探索方法であって、推論モデルによる推論の結果に応じて所定の制御対象に対する制御を行う制御システムにおける当該推論および当該制御の少なくとも何れかに関するパラメータと、当該パラメータが適用されている期間における前記制御対象の稼働状態との関係を示す関数の予測分布を算出するステップと、前記予測分布に基づいて前記パラメータの最適値の候補を探索するステップと、を含む。

【0173】

本発明の態様１１に係る探索プログラムは、請求項１に記載の情報処理装置としてコンピュータを機能させるための探索プログラムであって、前記予測分布算出部および前記探索部としてコンピュータを機能させる。

【0174】

本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

【符号の説明】

【0175】

３情報処理装置
３０３予測分布算出部
３０４探索部
３０６表示制御部
４制御装置
７制御システム

【図1】