(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-13
(45)【発行日】2024-08-21
(54)【発明の名称】汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20240814BHJP
C02F 1/00 20230101ALI20240814BHJP
G06N 5/04 20230101ALI20240814BHJP
【FI】
G06N20/00 130
C02F1/00 C
C02F1/00 V
G06N5/04
(21)【出願番号】P 2021082211
(22)【出願日】2021-05-14
【審査請求日】2023-08-30
(31)【優先権主張番号】P 2020129385
(32)【優先日】2020-07-30
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000006105
【氏名又は名称】株式会社明電舎
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】木村 雄喜
(72)【発明者】
【氏名】鮫島 正一
(72)【発明者】
【氏名】▲高▼倉 正佳
(72)【発明者】
【氏名】庭川 誠
(72)【発明者】
【氏名】高▲瀬▼ 信彰
(72)【発明者】
【氏名】三宅 雄貴
【審査官】千葉 久博
(56)【参考文献】
【文献】特開2019-175409(JP,A)
【文献】特開2018-14113(JP,A)
【文献】中国特許出願公開第110188945(CN,A)
【文献】深井寛修, 外2名,“ディープラーニングを用いた社会インフラを支える技術の開発”,スマートグリッド,株式会社大河出版,2018年10月15日,第8巻, 第4号,p.14-18
【文献】Marco Tulio Ribeiro, 外2名,"“Why Should I Trust You?” Explaining the Predictions of Any Classifier",[online],2016年08月09日,[検索日 2024.07.01], インターネット<URL:https://arxiv.org/pdf/1602.04938v3>
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
C02F 1/00
G06N 5/04
(57)【特許請求の範囲】
【請求項1】
汚水処理施設の運転状況を、水質の改善を目的として変更するに際し、前記汚水処理施設内の設備の運転操作量を推論し、推論の根拠を出力する、汚水処理施設の運転操作量推論根拠出力装置であって、
機械学習器を備え、前記運転状況に関連する複数の施設パラメータの各々に対応する学習データを入力とし、当該学習データに対応する運転操作量データを教師データとして前記機械学習器を機械学習し、前記運転操作量の推論に関するモデルパラメータを生成する、運転操作量学習部と、
前記運転操作量の推論対象となる推論対象データを、前記モデルパラメータを用いて構築した推論モデルに入力して、前記運転操作量を推論する、運転操作量推論部と、
前記推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、前記推論対象データに対して前記推論モデルを近似する近似モデルを生成し、近似モデルパラメータを生成する、近似モデル生成部と、
前記近似モデルパラメータを基に、前記推論モデルにおける前記推論対象データを基にした前記運転操作量の推論の前記根拠を出力する、推論根拠出力部と、
を備えている、汚水処理施設の運転操作量推論根拠出力装置。
【請求項2】
前記近似モデルは、前記推論対象データを構成する値を基にして、複数の係数を用いた線形和として表現され、前記近似モデルパラメータは、前記複数の係数である、請求項1に記載の汚水処理施設の運転操作量推論根拠出力装置。
【請求項3】
前記運転操作量の外部からの入力を受け付ける入力部を備え、
前記入力部により入力された前記運転操作量と、前記推論モデルにおいて推論された前記運転操作量が異なる場合にのみ、前記推論の根拠を外部に出力する、請求項1または2に記載の汚水処理施設の運転操作量推論根拠出力装置。
【請求項4】
前記入力部により入力された前記運転操作量と、前記推論モデルにおいて推論された前記運転操作量が異なる場合に、これらの差分値が大きいほど、前記近似モデルを生成する際に用いられる前記複数の関連データを多く複製し増加させる、請求項3に記載の汚水処理施設の運転操作量推論根拠出力装置。
【請求項5】
前記複数の施設パラメータは、汚泥濃度及び汚泥流量を含むトレンドデータと、前記汚水処理施設において処理される水の水質データを含む、請求項1から4のいずれか一項に記載の汚水処理施設の運転操作量推論根拠出力装置。
【請求項6】
汚水処理施設の運転状況を、水質の改善を目的として変更するに際し、前記汚水処理施設内の設備の運転操作量を推論し、推論の根拠を出力する、汚水処理施設の運転操作量推論根拠出力方法であって、
前記運転状況に関連する複数の施設パラメータの各々に対応する学習データを入力とし、当該学習データに対応する運転操作量データを教師データとして機械学習器を機械学習し、前記運転操作量の推論に関するモデルパラメータを生成し、
前記運転操作量の推論対象となる推論対象データを、前記モデルパラメータを用いて構築した推論モデルに入力して、前記運転操作量を推論し、
前記推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、前記推論対象データに対して前記推論モデルを近似する近似モデルを生成し、近似モデルパラメータを生成し、
前記近似モデルパラメータを基に、前記推論モデルにおける前記推論対象データを基にした前記運転操作量の推論の前記根拠を出力する、汚水処理施設の運転操作量推論根拠出力方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法に関する。
【背景技術】
【0002】
従来より、例えば下水処理施設等の汚水処理施設において、活性汚泥処理によって汚水を浄化することが、広く行われている。活性汚泥処理においては、汚水を貯留した反応槽において、汚水を曝気等により送風された空気に晒し、好気的な微生物に汚濁物質を分解させて活性汚泥を生成し、活性汚泥を増殖させて沈降分離することで、汚水が浄化される。
このような汚水処理施設では、汚泥引抜量、反応層における溶存酸素量や送風量等を、作業員が決定し、汚水処理施設中の様々な設備を操作することで、日々の運転がなされている。
上記のような設備を操作するに際し、設備の運転操作量の決定は、熟練した作業員の勘や経験、ノウハウに依るところが大きく、非常に難易度が高い作業である。このため、熟練した作業員に依らずとも運転操作量を決定可能とすることが、望まれている。
【0003】
上記のような、運転操作量の決定においては、例えばニューラルネットワーク等の深層学習手法や、ランダムフォレスト(Random Forest)やXGBoost(eXtreme Gradient Boosting)等の集団学習手法をはじめとした機械学習手法を適用し、熟練した作業員の運転操作をモデル化することが考えられる。
例えば特許文献1には、過去のある時点から現在までに汚水貯留施設へ入ってきた実績流入量と、プラントデータをもとに、現在より先のある一定時間内に流入する汚水量を予測し、予め設定されたポンプ吐出量の目標値と、予測流入量と、実績流入量と、現在の貯蔵量と、現在のポンプ吐出量の情報より演算される情報を入力とし、予め決定されたメンバーシップ関数・ルールに従い、ファジィ推論によりポンプの目標吐出量を決定する、下水処理場の汚水ポンプ制御装置が開示されている。
特許文献1の装置には、ニューラルネットワークが用いられている。このニューラルネットワークは、入力としてポンプ井水位、除塵流入ゲート開度、汚水ポンプ吐出量、実績流入量等の時系列データを与えると、予測流入量を出力する。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
一般に、上記のような深層学習手法を適用する場合、そのブラックボックス性が問題となり得る。人の脳内のニューロンの繋がりを模したニューラルネットワークは、多数のニューロンの線形結合と非線形関数による活性化の多層構造で表現され、その推論の結果に対して説明を与えることが難しい。しかし、下水処理施設等の汚水処理施設においては、特に公共性が非常に高いため、何らかの問題が生じた際に汚水処理施設の運営企業や当該施設の使用者に致命的な損害を与え得る。したがって、ブラックボックス性のある深層学習手法を汚水処理施設に導入するためには、運転操作量を推論する推論モデルが、どのような根拠をもって推論を行ったのかを明確に、例えば推論の根拠を出力して示すことで、結果への信頼性を高めることが必要である。
深層学習手法ではなく、集団学習手法を用いた場合においては、学習データ全体を通した推論根拠を出力することは可能ではあるが、それはあくまで全体としての傾向を示すのみである。個々の推論を行った際の、その推論に主として寄与した根拠は、全体としての傾向に従う以上に、その推論の入力となったデータの特性に対応し、依存することも多い。
したがって、例えば集団学習手法を用いた場合においても、あるいは深層学習手法や集団学習手法以外の他の推論手法を用いた場合においても、より詳細な推論の根拠を出力して示すことで、結果への信頼性を高めることが望まれる。
【0006】
他方、汚水処理施設内の処理は生物反応を伴うために非常に複雑である。例えば、溶存酸素量を増減させても、反応槽内の水の有機物、りん、窒素の量は、それぞれが非線形的に、複雑な態様で増減する。これら有機物、りん、窒素の量は、返送汚泥、循環量、余剰汚泥等の溶存酸素量以外の運転操作量を変化させることによっても、複雑な態様で増減する。
このように、汚水処理施設内の処理は非常に複雑である。したがって、機械学習手法に依らずにこれを解釈可能な単純なモデルで大域的に表現するのは、現実的ではない。
機械学習された推論モデルにより汚水処理施設の運転操作値を推論するとともに、推論結果の根拠を示して結果への信頼性を高めることが、望まれている。
【0007】
本発明が解決しようとする課題は、機械学習された推論モデルにより汚水処理施設の運転操作値を推論するに際し、推論結果の根拠を示して結果への信頼性を高めることができる、汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法を提供することである。
【課題を解決するための手段】
【0008】
本発明は、上記課題を解決するため、以下の手段を採用する。すなわち、本発明は、汚水処理施設の運転状況を、水質の改善を目的として変更するに際し、前記汚水処理施設内の設備の運転操作量を推論し、推論の根拠を出力する、汚水処理施設の運転操作量推論根拠出力装置であって、機械学習器を備え、前記運転状況に関連する複数の施設パラメータの各々に対応する学習データを入力とし、当該学習データに対応する運転操作量データを教師データとして前記機械学習器を機械学習し、前記運転操作量の推論に関するモデルパラメータを生成する、運転操作量学習部と、前記運転操作量の推論対象となる推論対象データを、前記モデルパラメータを用いて構築した推論モデルに入力して、前記運転操作量を推論する、運転操作量推論部と、前記推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、前記推論対象データに対して前記推論モデルを近似する近似モデルを生成し、近似モデルパラメータを生成する、近似モデル生成部と、前記近似モデルパラメータを基に、前記推論モデルにおける前記推論対象データを基にした前記運転操作量の推論の前記根拠を出力する、推論根拠出力部と、を備えている、汚水処理施設の運転操作量推論根拠出力装置を提供する。
【0009】
また、本発明は、汚水処理施設の運転状況を、水質の改善を目的として変更するに際し、前記汚水処理施設内の設備の運転操作量を推論し、推論の根拠を出力する、汚水処理施設の運転操作量推論根拠出力方法であって、前記運転状況に関連する複数の施設パラメータの各々に対応する学習データを入力とし、当該学習データに対応する運転操作量データを教師データとして機械学習器を機械学習し、前記運転操作量の推論に関するモデルパラメータを生成し、前記運転操作量の推論対象となる推論対象データを、前記モデルパラメータを用いて構築した推論モデルに入力して、前記運転操作量を推論し、前記推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、前記推論対象データに対して前記推論モデルを近似する近似モデルを生成し、近似モデルパラメータを生成し、前記近似モデルパラメータを基に、前記推論モデルにおける前記推論対象データを基にした前記運転操作量の推論の前記根拠を出力する、汚水処理施設の運転操作量推論根拠出力方法を提供する。
【発明の効果】
【0010】
本発明によれば、機械学習された推論モデルにより汚水処理施設の運転操作値を推論するに際し、推論結果の根拠を示して結果への信頼性を高めることができる、汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法を提供することができる。
【図面の簡単な説明】
【0011】
【
図1】本発明の実施形態における汚水処理施設のブロック図である。
【
図2】上記汚水処理施設に設けられた運転操作量推論根拠出力装置のブロック図である。
【
図3】上記運転操作量推論根拠出力装置のデータ加工部の説明図である。
【
図4】上記運転操作量推論根拠出力装置における推論根拠の説明図である。
【
図5】上記運転操作量推論根拠出力装置を用いた、運転操作量推論根拠出力方法の、推論モデルの学習時のフローチャートである。
【
図6】上記運転操作量推論根拠出力方法の、運転操作量の推論時のフローチャートである。
【
図7】上記運転操作量推論根拠出力方法における、推論根拠の導出処理のフローチャートである。
【
図8】上記実施形態の第1変形例における運転操作量推論根拠出力装置のブロック図である。
【
図9】上記第1変形例の運転操作量推論根拠出力装置を用いた、運転操作量推論根拠出力方法のフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明の実施形態について図面を参照して詳細に説明する。
【0013】
図1は、本実施形態における汚水処理施設のブロック図である。汚水処理施設1は、反応槽3に貯留された汚水を微生物により浄化処理する。
汚水処理施設1は、最初沈殿池2、反応槽3、計測器4、最終沈殿池5、散気板6、ブロア7、曝気調整バルブ8、返送汚泥ポンプ9、余剰汚泥引抜ポンプ10、重力濃縮槽11、機械濃縮槽12、消化槽13、脱水槽14、運転操作量推論根拠出力装置20、及び第1~第8配管L1、L2、L3、L4、L5、L6、L7、L8を備えている。
【0014】
最初沈殿池2には、有機物を含む汚水が原水として導入される。最初沈殿池2においては、導入された汚水内の小さなゴミや砂等が取り除かれて、大まかな固液分離が行われる。ゴミ等が取り除かれた汚水は、第1配管L1を介して、反応槽3に送られる。最初沈殿池2に沈殿した汚泥、いわゆる生汚泥は、第2配管L2を介して、重力濃縮槽11に送られる。
【0015】
反応槽3では、微生物により汚水が生物処理され、浄化される。浄化の際に、汚水は曝気等により空気に晒されて、好気的な微生物が、有機物を分解するとともに、有機物を資化することに伴って増殖することにより、活性汚泥が形成される。活性汚泥処理された水は、第3配管L3を介して、最終沈殿池5に送られる。
反応槽3内の下部には、ブロア7から第6配管L6を介して空気が供給される。第6配管L6の、ブロア7と反応槽3との間には、曝気調整バルブ8が設けられている。曝気調整バルブ8を開閉すると、曝気量(以下においては送風量と記載する)が変化し、これにより反応槽3内の溶存酸素量が調整されて、微生物による生物処理の進行度合いが制御される。反応槽3の、第6配管L6により空気が供給される部分には、酸素の溶解効率を高めるための散気板6が設けられている。
反応槽3には、溶存酸素量(DO)、浮遊物質濃度(MLSS)、NH4濃度、及びNO3濃度等の、様々な水質データを計測する計測器4が設けられている。
図1においては、計測器は反応槽3に設けられているが、実際には計測器は、汚水処理施設1内の様々な場所に設けられており、場合によってはこれら複数の計測器による計測結果が総括されて処理系全体での水質データとして、運転操作等の各作業や判断に使用される。後に説明するトレンドデータについても同様である。
【0016】
最終沈殿池5では、反応槽3から送られた活性汚泥処理された水に含まれる活性汚泥が沈殿されて、汚水が浄化される。最終沈殿池5で活性汚泥が分離された上澄みは、処理水として系外に放流される。
最終沈殿池5で沈殿した汚泥の一部は、返送汚泥ポンプ9により第4配管L4を通じて再び反応槽3に戻され、活性汚泥処理に再利用される。残りの汚泥は余剰汚泥として汚泥引抜ポンプ10により第5配管L5を通じて排出されて、機械濃縮槽12に送られる。
【0017】
重力濃縮槽11と機械濃縮槽12の各々は、最初沈殿池2から送られた生汚泥と、余剰汚泥引抜ポンプ10を介して最終沈殿池5から送られた余剰汚泥の各々を濃縮処理する。重力濃縮槽11と機械濃縮槽12により濃縮された汚泥は、第7配管L7を通じて消化槽13へ送られる。
消化槽13は、濃縮された汚泥を、例えば嫌気性消化方式により、嫌気性微生物の働きによって有機性汚泥を分解し、消化処理する。分解された汚泥は、第8配管L8を通じて脱水槽14に送られる。
脱水槽14は、分解された汚泥の含水率を下げ、減容化する。減容化された汚泥は焼却処理される。
【0018】
本実施形態における運転操作量推論根拠出力装置20は、上記のような汚水処理施設1を対象としており、汚水処理施設1の運転状況を、水質の改善を目的として変更するに際し、汚水処理施設1内の設備の運転操作量を推論し、推論の根拠を出力する。
図2は、運転操作量推論根拠出力装置20のブロック図である。運転操作量推論根拠出力装置20は、データ蓄積部24、推論モデル用学習データ取得部25、推論対象データ取得部26、近似モデル用学習データ取得部27、データ加工部28、運転操作量学習部29、推論モデルパラメータ記憶部30、運転操作量推論部31、近似モデル生成部32、及び推論根拠出力部33を備えている。
これら運転操作量推論根拠出力装置20の構成要素のうち、推論モデル用学習データ取得部25、推論対象データ取得部26、近似モデル用学習データ取得部27、データ加工部28、運転操作量学習部29、運転操作量推論部31、近似モデル生成部32、及び推論根拠出力部33は、例えば上記情報処理装置内のCPUにより実行されるソフトウェア、プログラムであってよい。また、データ蓄積部24、及び推論モデルパラメータ記憶部30は、上記情報処理装置内外に設けられた半導体メモリや磁気ディスクなどの記憶装置により実現されていてよい。
【0019】
運転操作量推論根拠出力装置20の入力は、汚水処理施設1の運転状況に関連する、汚泥濃度や汚泥流量、水温等のトレンドデータ21を含む。これらトレンドデータ21の各々は、最初沈殿池2、反応槽3、最終沈殿池5等の各々において取得した値を個別に用いてもよいし、これらの値から汚水処理施設1の処理系全体として総括された値を導出し、これを用いても構わない。
また、運転操作量推論根拠出力装置20の入力は、既に説明したような、溶存酸素量(DO)、浮遊物質濃度(MLSS)、NH4濃度、及びNO3濃度等の水質データ22を含む。
運転操作量推論根拠出力装置20の入力の一つである運転操作量データ23については、後に説明する。
【0020】
運転操作量推論根拠出力装置20の出力は、上記のように、各設備の運転操作量34である。運転操作量34は、本実施形態においては、最初沈殿池2から反応槽3へと流入する汚水の流入量、送風量、最終沈殿池5から返送汚泥ポンプ9を介して反応槽3へと返送される返送汚泥の量である返送汚泥量、最終沈殿池5から余剰汚泥引抜ポンプ10を介して機械濃縮槽12へと送られる余剰汚泥の量である余剰汚泥引抜量を含む。
例えば溶存酸素量に関しては、反応槽3内の溶存酸素量を一定以上にするために、送風量が目標値として設定され得る。しかし、例えば反応槽3内の溶存酸素量自体に目標値を設定して、溶存酸素量が当該目標値以上となるように風量を調整する処理系も想定される。この場合においては、例えば運転操作量34として、送風量に替えて、溶存酸素量の設定値を出力するようにしてもよい。
返送汚泥量は、より詳細には、例えば返送汚泥ポンプ9の回転数であり得る。
余剰汚泥引抜量は、より詳細には、例えば余剰汚泥引抜ポンプ10による余剰汚泥の引抜時間であり得る。
また、本実施形態においては、運転操作量34は、脱水槽14での脱水処理において注入される高分子凝集剤の注入率を含む。
【0021】
運転操作量推論根拠出力装置20は、上記のようなトレンドデータ21及び水質データ22が入力されると、これに対応する、すなわち入力されたトレンドデータ21と水質データ22に表されるような状況下においてこれに対応して実行すべき、運転操作量34を推論する。この推論を効果的に行うために、運転操作量推論根拠出力装置20は、運転操作量学習部29に設けられた機械学習器40を機械学習することにより生成された推論モデル50を備えている。より詳細には、運転操作量学習部29は、トレンドデータ21及び水質データ22を基に生成された学習データを機械学習器40に入力して機械学習を行い、運転操作量34の推論に関するモデルパラメータを生成する。
すなわち、運転操作量推論根拠出力装置20は、運転操作量34の学習と、運転操作量34の推論を行う。また、本実施形態においては、運転操作量推論根拠出力装置20はこれに加えて、運転操作量34の推論に際し、推論モデル50がどのような根拠をもって運転操作量34を推論したのか、その推論根拠35を出力する。説明を簡単にするために、以下ではまず、運転操作量34の学習時における、運転操作量推論根拠出力装置20の各構成要素の説明をした後に、運転操作量34の推論時での各構成要素の挙動について説明し、更に、推論根拠35の出力時の各構成要素の挙動について説明する。
【0022】
運転操作量34の学習時には、学習データを基に、運転操作量学習部29が機械学習器40を機械学習させる。この機械学習器40が機械学習されることにより、推論モデル50が生成される。
学習データは、運転操作量推論根拠出力装置20が運転操作量34を推論する際に入力される、運転状況に関連する、トレンドデータ(施設パラメータ)21と水質データ(施設パラメータ)22を基に、これらに対応して生成される。より詳細には、学習データは、運転操作量34を学習する時刻を基準時刻とすると、この学習時における基準時刻より前に実際の汚水処理施設1において計測、記録されたトレンドデータ21と水質データ22を基に生成される。
【0023】
トレンドデータ21と水質データ22を基に生成された学習データが機械学習器40に入力されて機械学習器40を機械学習する際に、機械学習器40は、学習の中途段階において、学習データに対して適していると考えられる運転操作量34を導出する。この、機械学習器40が出力した運転操作量34は、運転操作量データ23と比較される。運転操作量データ23は、汚水処理施設1が、機械学習器40に入力された学習データに対応するトレンドデータ21と水質データ22に示される状況下にあると想定したときに、熟練した作業員が汚水処理施設1の設備に対して実施すると考えられる、実際の運転の操作量である。機械学習器40の出力である運転操作量34は、入力された学習データに対応する運転操作量データ23と比較され、この比較結果を反映するように機械学習器40が機械学習される。すなわち、運転操作量データ23は、機械学習器40に入力された学習データに対応する、教師データである。
このようにして、機械学習器40は、運転操作量データ23に近い運転操作量34を推論するように学習される。
【0024】
データ蓄積部24は、機械学習器40の学習に使用される、トレンドデータ21、水質データ22、及び運転操作量データ23を記憶、蓄積する。
推論モデル用学習データ取得部25は、データ蓄積部24から、機械学習器40の学習に使用されるトレンドデータ21と水質データ22を取得し、データ加工部28に送信する。
【0025】
データ加工部28は、推論モデル用学習データ取得部25から各データを受信し、機械学習器40の入力として実際に使用される形式に加工し、学習データを生成する。
図3は、データ加工部28の説明図である。
本実施形態におけるデータ加工部28は、連続値として入力されたデータを、平均値からのずれに基づいて離散値化する。例えば、本実施形態においては、
図3に示されるように、対象となるデータについて平均値と標準偏差σを計算し、データ中の各値について、当該値に対応する確率変数の値xと標準偏差σとの大小関係を基にした、次の式1として示される関係式Ψにより離散値化がなされている。
【数1】
データ加工部28における離散値化の方法はこれに限られず、閾値を設けて閾値との大小関係により2値化するなど、データの分布の態様に応じて加工方法が決定されてよい。
データ加工部28は、上記のように生成された学習データを、運転操作量学習部29に送信する。
【0026】
運転操作量学習部29は、学習データと教師データを受信する。運転操作量学習部29は、学習データを機械学習器40に入力する。本実施形態においては、機械学習器40は、ニューラルネットワークにより実現されている。
機械学習器40は、入力層、複数の中間層、及び出力層を備えている。入力層は、学習データの各々に対応した入力ノードを備えている。出力層は、機械学習器40が出力する運転操作量34の各々に対応した出力ノードを備えている。
運転操作量学習部29は、入力層の各入力ノードに、対応する学習データの値を入力する。
中間層は、入力層と出力層の間に設けられており、隣接する層間においては全てのノード同士が全結合し、ノード間に結合荷重を備えた構成となっている。中間層及び出力層の各々のノードにおいては、この結合荷重に基づいて、前段の層の各ノードに対して重み付け和を演算し、その結果に出力関数を適用した値が格納される。
【0027】
機械学習器40においては、入力された学習データが上記のように処理されて、出力ノードに処理結果が格納される。運転操作量学習部29は、この処理結果と、機械学習器40に入力された学習データに対応する教師データとの2乗誤差等により表されるコスト関数を小さくするように、誤差逆伝搬法、確率的勾配降下法等により、各結合荷重の値等を調整することで、機械学習器40を機械学習する。
結果として、機械学習器40は、学習データが入力されたときに、これに対応する教師データに近い運転操作量34を推論するように学習される。学習が終了した時点の各結合荷重の値等は、学習データに関する特徴が抽出されて反映されたものとなっている。
【0028】
運転操作量学習部29は、学習が終了すると、調整が終了した結合荷重等のパラメータを、モデルパラメータとして、推論モデルパラメータ記憶部30に記憶する。推論モデルパラメータ記憶部30に記憶されたモデルパラメータは、後に説明する運転操作量推論部31において取得され、運転操作量34を推定する推論モデル50が構築される。
すなわち、運転操作量学習部29は、人工知能ソフトウェアの一部であるプログラムモジュールとして利用される、適切な学習パラメータが学習された学習済みの推論モデル50を生成するものである。
【0029】
次に、運転操作量34の推論時での各構成要素の挙動について説明する。
推論対象データ取得部26は、データ蓄積部24から、運転操作量34を推論したい時刻、例えば現在の時刻における、トレンドデータ21と水質データ22を取得する。推論対象データ取得部26は、これらトレンドデータ21と水質データ22の各々を、データ加工部28に送信する。
データ加工部28は、推論対象データ取得部26から各データを受信し、既に説明したような手順により加工して、運転操作量34の推論対象となる推論対象データを生成する。
データ加工部28は、推論対象データを、運転操作量推論部31に送信する。
【0030】
運転操作量推論部31は、データ加工部28から、推論対象データを取得する。
運転操作量推論部31は、推論モデルパラメータ記憶部30からモデルパラメータを取得し、推論モデル50を構築する。推論モデル50は、既に説明した機械学習器40と略同等の構造を備えている。運転操作量推論部31は、この推論モデル50を、例えばCPU上でプログラムとして実行することで、運転操作量34を推論する。
運転操作量推論部31が推論モデル50に推論対象データを入力すると、推論モデル50は、入力層から出力層までを順に辿りながら、運転操作量学習部29における機械学習器40と同様な計算処理を実行する。最終的に出力ノードから、推論対象データに対応する運転操作量34が出力される。
【0031】
次に、推論根拠35の出力時での各構成要素の挙動について説明する。
概念的には、ニューラルネットワーク等の学習モデルにおいてどのような根拠で推論がなされたかを説明するに際し、例えば学習モデルの全体を単純化した説明用のモデルを構築して、これを用いることが考えられる。しかし、これは容易ではない。特に本実施形態のような汚水処理施設1内の処理は、非常に複雑であるため、この運転操作量34を推論する推論モデル50は複雑性が高く、したがって、これを解釈可能で単純なモデルで大域的に表現すること自体が、現実的ではない。
本実施形態においては、推論モデル50を単純なモデルで大域的に表現せず、その替わりに、推論モデル50を局所的に表現する近似モデルを生成する。より詳細には、近似モデルは、推論モデル50によって運転操作量34が推論された際に入力となった推論対象データに値が近い、推論対象データ周辺部分を限定して表現するように、生成される。このように、推論根拠35を説明するための近似モデルを、推論モデル50の局所的な表現にとどめることによって、比較的単純で解釈可能なものとして生成する。
また、近似モデルは、推論時に入力となった推論対象データに関連するデータを対象として生成される。すなわち、近似モデルは、推論対象データに依存するため、推論モデル50によって運転操作量34が推論される度に、その入力となった推論対象データに特化して、専用に生成される。
上記のような構成により、近似モデルは、少なくとも推論対象データに関連する部分においては、単純で解釈可能なものとなる。したがって、推論根拠35を出力するために解釈性を高めることを目的として、推論モデル50を単純化させて推論精度を低減させる必要もない。
【0032】
上記のような近似モデルの生成を、本実施形態においては、既知の機械学習手法であるLIME(Local Interpretable Model-agnostic Explanations)を適用する。LIMEは、推論対象のデータに対し、当該データに関連する部分において局所的に単純かつ分析が容易な分析器で近似することにより、推論の根拠を可視化するための手法である。
【0033】
まず、近似モデル用学習データ取得部27は、データ蓄積部24から、データ加工部28によって生成された推論対象データに対応するトレンドデータ21と水質データ22に関連する、トレンドデータ21と水質データ22を取得する。
より詳細には、近似モデル用学習データ取得部27は、推論対象データaの各値により構成される座標空間において、推論対象データaに対し、各成分を2値化することでダミー変数化した点をa´としたときに、a´のゼロではない成分を一部だけ含むような点を、一定の数だけサンプリングする。このサンプリングは、例えば、a´の全ての成分がゼロのゼロベクトルにはならないという条件下で、a´の1となっている成分をランダムにゼロに置換するように行われる。
近似モデル用学習データ取得部27は、上記のように取得したトレンドデータ21と水質データ22をデータ加工部28に送信する。
データ加工部28は、近似モデル用学習データ取得部27から受信した各データを、既に説明したような手順により加工して、推論対象データに関連する値を有する、複数の関連データを生成する。
データ加工部28は、関連データを、近似モデル生成部32に送信する。
【0034】
近似モデル生成部32は、推論対象データと、複数の関連データを受信する。近似モデル生成部32は、これらのデータを基に、推論対象データ周辺において、推論対象データに対して推論モデル50を近似する近似モデルを生成し、近似モデルパラメータを生成する。
既に説明したように、近似モデルのモデルパラメータは、推論対象データに関連する部分で、推論モデル50を局所的に近似するように決定される。このため、近似モデルは、推論モデル50全体を近似するのではなく、推論モデル50が推論を行う度に、その都度、入力となった推論対象データに関連する部分を近似するように生成される。
【0035】
より具体的には、近似モデル生成部32は、推論対象データをa、運転操作量34を推論するための推論モデル50をfとすると、次の式2に記載された目的関数ξ(a)を最小化するように、近似モデルgを生成する。
【数2】
ここで、L(f、g、π
a)は、推論対象データaの周辺で2つのモデルf、gがどれだけ相違しているかを示す損失関数である。
上記のように、推論対象データaをサンプリングしてできた座標空間をZ、サンプリングした座標空間Z内の点をz´、このダミー変数化されたz´をもとの空間に復元したときの点をzとすると、L(f、g、π
a)は、次の式3として表現される。
【数3】
π
a(z)は、zが推論対象データaから離れるほど小さな値を示す関数であり、f(z)とg(z´)の誤差に重み付けを行うものである。π
a(z)としては、例えば次に式4として示すような指数カーネル関数が採用され得る。
【数4】
損失関数Lが上記のような式3で表されるため、目的関数ξ(a)を最小化して得られる近似モデルgは、推論対象データaに近いほど、推論モデル50であるモデルfをよく近似したものとなる。すなわち、このπ
a(z)は、zが推論対象データaから一定の距離以上離れると、急激にゼロに落ち込む関数となっているため、zは推論対象データaの周辺で近似される。
【0036】
近似モデルgは、例えば、推論対象データaを構成する各変数の値をa
1、a
2、…、a
nとすると、次の式5が用いられ得る。
【数5】
上式において、w=(w
1、w
2、…、w
n)は回帰係数である。また、δ
ai(x
i)は、次の式6で表される。
【数6】
すなわち、δ
ai(x
i)は、i番目の変数x
iと、推論対象データaのi番目の値a
iが等しいときに1の値となり、異なるときに0の値となる。つまり、gはダミー変数化した変数の線形和として表現されることを仮定し、その上で目的関数ξ(a)を最小化するように回帰係数wを決定する。このとき、wの値がそのまま推論モデル50の推論に寄与している各変数の寄与度と解釈することが可能である。
すなわち、複数の係数w=(w
1、w
2、…、w
n)が、近似モデルgを表す近似モデルパラメータである。
【0037】
上記の式2におけるΩ(g)は正規化項であり、近似モデルgの複雑さを示す関数である。式2に示されるように、Ω(g)が損失関数Lとともに目的関数ξ(a)に組み込まれて最小化されることにより、近似モデルgが複雑な構造となるのが抑制される。
式5を用いて説明したように、近似モデルgは、推論対象データaを構成する値の各々をダミー変数化し、これらダミー変数の各々に対して、対応する複数の係数w=(w1、w2、…、wn)を用いた線形和として表現される。例えば、Kを固定値としたときに、説明変数の個数がK個以下のモデルを近似モデルgとして生成したい場合には、Ω(g)を、係数w1、w2、…、wnの中で0でない係数の個数がKより大きい場合に無限大の値となり、それ以外の場合に0となるように設定する。
【0038】
近似モデル生成部32は、上記のように生成した近似モデルパラメータw=(w1、w2、…、wn)を、推論根拠出力部33へ送信する。
【0039】
推論根拠出力部33は、近似モデルパラメータw=(w
1、w
2、…、w
n)を受信する。
近似モデルパラメータw=(w
1、w
2、…、w
n)に関しては、i番目の係数w
iの数値が大きな正の値となる場合に、i番目の変数x
iの値がa
iであることが、モデルfの結果がf(x)であることを強く支持していると解釈することができる。このため、近似モデルパラメータw=(w
1、w
2、…、w
n)を、機械学習器40の判断根拠の強さとして適用可能である。
図4は、推論根拠35の説明図である。
図4においては、溶存酸素量(DO)をどの程度変化させるように汚水処理施設1を運転するのが望ましいか、その変化量が推論対象とされている。推論モデル50は、溶存酸素量の設定値を0.2(mg/L)上げる、0.1(mg/L)上げる、変化させない、0.1(mg/L)下げる、0.2(mg/L)下げるという5種類の運転操作量34を変更する選択肢の中で、最も高い確率0.57を有する運転操作量34として、0.1(mg/L)下げるのが好ましいと推定している。
本例においては、施設パラメータは、NO3濃度、NH4濃度、総窒素(T-N)、総りん(T-P)、及びPO4濃度を含む。これら施設パラメータの各々に対し、対応する係数w
iの値が、それぞれ、0.37、0.21、0.09、-0.02、-0.05として表示されている。ここで、NO3濃度に対応する係数w
iの値が最も大きな値となっている。これは、NO3濃度が通常よりやや高い範囲である4.4(mg/L)以上で7.3(mg/L)より小さい範囲の値となっていることが、推論モデル50が溶存酸素量を0.1(mg/L)下げると推論した最も主要な原因であることを示す。また、このNO3濃度の他に、NH4濃度が通常よりもやや低いこと、及び総窒素が通常よりもやや低いことも、推論モデル50が溶存酸素量を0.1(mg/L)下げると推論した他の原因であることが示されている。
このように、推論根拠出力部33は、近似モデルパラメータwを基に、推論モデル50における推論対象データaを基にした運転操作量34の推論の根拠35を、外部に、例えば図示されない表示装置等に、出力する。
【0040】
次に、
図1~
図4、及び
図5~
図7を用いて、上記の汚水処理施設の運転操作量推論根拠出力装置20を用いた運転操作量推論根拠出力方法を説明する。
図5は、運転操作量推論根拠出力方法の、推論モデルの学習時のフローチャートである。
図6は、運転操作量推論根拠出力方法の、運転操作量34の推論時のフローチャートである。
図7は、運転操作量推論根拠出力方法における、推論根拠の出力処理のフローチャートである。
【0041】
運転操作量34の学習時には、まず、機械学習器40の学習に使用される、トレンドデータ21、水質データ22、及び運転操作量データ23をデータ蓄積部24に記憶、蓄積する(ステップS1)。
推論モデル用学習データ取得部25は、データ蓄積部24から、機械学習器40の学習に使用されるトレンドデータ21と水質データ22を取得し、データ加工部28に送信する(ステップS3)。
データ加工部28は、推論モデル用学習データ取得部25から各データを受信し、機械学習器40の入力として実際に使用される形式に加工し、学習データを生成する(ステップS5)。
運転操作量学習部29は、学習データと、運転操作量データ23すなわち教師データを用いて、機械学習器40を機械学習し、運転操作量34の推論に関するモデルパラメータを生成する(ステップS7)。
運転操作量学習部29は、生成したモデルパラメータを、推論モデルパラメータ記憶部30に記憶する(ステップS9)。
【0042】
運転操作量34の推論時には、推論対象データ取得部26は、データ蓄積部24から、運転操作量34を推論したい時刻、例えば現在の時刻における、トレンドデータ21と水質データ22を取得する。推論対象データ取得部26は、これらトレンドデータ21と水質データ22の各々を、データ加工部28に送信する(ステップS11)。
データ加工部28は、推論対象データ取得部26から各データを受信し、加工して、運転操作量34の推論対象となる推論対象データを生成する(ステップS13)。
運転操作量推論部31は、推論モデルパラメータ記憶部30からモデルパラメータを取得し、推論モデル50を構築する。運転操作量推論部31は、推論モデル50に推論対象データを入力して、運転操作量34を推論する(ステップS15)。
【0043】
次に、運転操作量推論根拠出力装置20は、推論根拠35を導出する(ステップS17)。これは、詳細には次のように行われる。
まず、近似モデル用学習データ取得部27は、データ蓄積部24から、データ加工部28によって生成された推論対象データに対応するトレンドデータ21と水質データ22に関連する、トレンドデータ21と水質データ22を取得し、データ加工部28に送信する(ステップS31)。
データ加工部28は、近似モデル用学習データ取得部27から受信した各データを加工して、推論対象データに関連する値を有する、複数の関連データを生成する(ステップS33)。
近似モデル生成部32は、推論対象データと、複数の関連データを受信する。近似モデル生成部32は、これらのデータを基に、推論対象データ周辺において、推論対象データに対して推論モデル50を近似する近似モデルを生成し、近似モデルパラメータwを生成し、推論根拠出力部33に送信する(ステップS35)。
この近似モデルパラメータw=(w1、w2、…、wn)が、推論根拠35となる。
【0044】
推論根拠出力部33は、近似モデルパラメータw=(w1、w2、…、wn)を受信する。
運転操作量推論部31は、推論した運転操作量34を、外部に、例えば図示されない表示装置等に、出力する。また、推論根拠出力部33は、近似モデルパラメータw=(w1、w2、…、wn)を、推論モデル50による運転操作量34の推論根拠35として、外部に、例えば図示されない表示装置等に、出力する(ステップS25)。
このように表示された運転操作量34と推論根拠35を基に、作業員が、最終的に汚水処理施設1を運転させる運転操作量を判断、決定し、汚水処理施設1を稼働させる(ステップS27)。
【0045】
次に、上記の汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法の効果について説明する。
【0046】
本実施形態の汚水処理施設1の運転操作量推論根拠出力装置20は、汚水処理施設1の運転状況を、水質の改善を目的として変更するに際し、汚水処理施設1内の設備の運転操作量34を推論し、推論の根拠を出力する、汚水処理施設1の運転操作量推論根拠出力装置20であって、機械学習器40を備え、運転状況に関連する複数の施設パラメータ21、22の各々に対応する学習データを入力とし、当該学習データに対応する運転操作量データ23を教師データとして機械学習器40を機械学習し、運転操作量34の推論に関するモデルパラメータを生成する、運転操作量学習部29と、運転操作量34の推論対象となる推論対象データを、モデルパラメータを用いて構築した推論モデル50に入力して、運転操作量34を推論する、運転操作量推論部31と、推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、推論対象データに対して推論モデル50を近似する近似モデルを生成し、近似モデルパラメータを生成する、近似モデル生成部32と、近似モデルパラメータを基に、推論モデル50における推論対象データを基にした運転操作量34の推論の根拠35を出力する、推論根拠出力部33と、を備えている。
また、本実施形態の汚水処理施設1の運転操作量推論根拠出力方法は、汚水処理施設1の運転状況を、水質の改善を目的として変更するに際し、汚水処理施設1内の設備の運転操作量34を推論し、推論の根拠を出力する、汚水処理施設1の運転操作量推論根拠出力方法であって、運転状況に関連する複数の施設パラメータ21、22の各々に対応する学習データを入力とし、当該学習データに対応する運転操作量データ23を教師データとして機械学習器40を機械学習し、運転操作量34の推論に関するモデルパラメータを生成し、運転操作量34の推論対象となる推論対象データを、モデルパラメータを用いて構築した推論モデル50に入力して、運転操作量34を推論し、推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、推論対象データに対して推論モデル50を近似する近似モデルを生成し、近似モデルパラメータを生成し、近似モデルパラメータを基に、推論モデル50における推論対象データを基にした運転操作量34の推論の根拠35を出力する。
既に説明したように、ニューラルネットワーク等の学習モデルにおいてどのような根拠で推論がなされたかを説明するに際し、例えば学習モデルの全体を単純化した説明用のモデルを構築して、これを用いることが考えられる。しかし、これは容易ではない。特に本実施形態のような汚水処理施設1内の処理は、非常に複雑であるため、この運転操作量34を推論する推論モデル50は複雑性が高く、したがって、これを解釈可能な単純なモデルで大域的に表現すること自体が、現実的ではない。
これに対し、上記のような構成によれば、推論モデル50を用いて運転操作量34を推論するに際し、推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、推論対象データに対して推論モデル50を近似する近似モデルを生成し、これにより運転操作量34の推論根拠35を出力する。すなわち、推論根拠35を説明するための近似モデルは、推論モデル50の局所的な表現にとどめることによって、比較的単純で解釈可能なものとして生成される。
このように、機械学習された推論モデル50により汚水処理施設1の運転操作値34を推論する場合であっても、上記のように近似モデルを生成することにより、推論モデル50による運転操作量34の推論根拠35を出力することができる。これにより、推論結果の根拠を示してブラックボックス性を低減することができるため、推論結果の信頼性を高めることができる。
【0047】
また、近似モデルは、推論対象データを構成する値を基にして、複数の係数を用いた線形和として表現され、近似モデルパラメータは、複数の係数である。
上記のような構成によれば、上記のような汚水処理施設1の運転操作量推論根拠出力装置20を、適切に実現可能である。
【0048】
また、複数の施設パラメータ21、22は、汚泥濃度及び汚泥流量を含むトレンドデータ21と、汚水処理施設において処理される水の水質データ22を含む。
上記のような構成によれば、汚泥濃度及び汚泥流量を含むトレンドデータ21と、汚水処理施設において処理される水の水質データ22の、特にどの部分が推論に大きな影響を与えたか、その根拠を解析して抽出することができる。
【0049】
[実施形態の第1変形例]
次に、
図8、
図9を用いて、上記実施形態として示した汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法の変形例を説明する。
図8は、本変形例における運転操作量推論根拠出力装置のブロック図である。
図9は、本変形例における運転操作量推論根拠出力装置を用いた、運転操作量推論根拠出力方法のフローチャートである。本変形例における運転操作量推論根拠出力装置20Aは、上記実施形態の運転操作量推論根拠出力装置20とは、運転操作量の外部からの入力を受け付ける入力部60を備えており、入力部60により入力された運転操作量と、推論モデルにおいて推論された運転操作量34が異なる場合にのみ、推論根拠35を外部に出力する点が異なっている。
【0050】
入力部60は、例えば作業員により考慮された運転操作量の入力を受け付ける。
推論根拠出力部33Aは、推論モデル50により運転操作量34を推論した際に、運転操作量推論部31から、推論モデル50により推論された運転操作量34を受信する。推論根拠出力部33Aは、推論モデル50により推論された運転操作量34を、入力部60から入力された運転操作量と比較し、異なる場合に、推論モデル50により運転操作量34と推論根拠35を、外部に、例えば図示されない表示装置等に、出力する。
【0051】
本変形例の運転操作量推論根拠出力方法では、上記実施形態の運転操作量推論根拠出力方法において推論根拠35を導出するステップS17の後に、入力部60による運転操作量の入力を受け付ける(ステップS19)。
推論根拠出力部33Aは、推論モデル50により推論された運転操作量34と、入力部60から入力された運転操作量と比較する(ステップS21)。
推論根拠出力部33Aは、比較の結果を判定し(ステップS23)、これらの値が異なる場合には(ステップS23のNo)、推論モデル50が推論した運転操作量34に加え、更に推論根拠35を共に、図示されない表示装置等に出力する(ステップS25)。その後、作業員が、最終的に汚水処理施設1を運転させる運転操作量34を判断、決定し、汚水処理施設1を稼働させる(ステップS27)。
同一である場合には(ステップS23のYes)、ステップS25における運転操作量34と推論根拠35の出力を行わず、ステップS27に遷移する。
【0052】
本変形例が、既に説明した実施形態と同様な効果を奏することは言うまでもない。
特に本変形例においては、運転操作量の外部からの入力を受け付ける入力部60を備え、入力部60により入力された運転操作量と、推論モデル50において推論された運転操作量34が異なる場合にのみ、推論根拠35を外部に出力する。
上記のような構成によれば、入力部60により入力された運転操作量と、推論モデル50において推論された運転操作量34が一致する場合には、これらの値が外部に出力されない。このため、作業員による、出力された結果の確認の手間が軽減される。
【0053】
[実施形態の第2変形例]
次に、上記実施形態として示した汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法の変形例を説明する。本変形例における運転操作量推論根拠出力装置は、上記第1変形例の更なる変形例であり、入力部60により入力された運転操作量と、推論モデル50において推論された運転操作量34が異なる場合に、後の推論根拠35の出力がより適切に実行されるよう、これらの差分値の大きさに応じて、近似モデルの学習データ量を変更する点が異なっている。
【0054】
例えば、推論根拠35として溶存酸素量を推論する場合には、次の式により定義されるαの値に基づいて、α倍だけ学習データを複製したものを、学習データとして登録する。
【数7】
【0055】
本変形例が、既に説明した実施形態と同様な効果を奏することは言うまでもない。
特に本変形例においては、入力部により入力された運転操作量と、推論モデル50において推論された運転操作量34が異なる場合に、これらの差分値が大きいほど、近似モデルを生成する際に用いられる複数の関連データを多く複製し増加させる。
上記のような構成によれば、作業員が想定した運転操作量とずれが大きいデータほど強く学習される。このため、後の推論においては、作業員の想定により近い推論根拠35が導出される。
【0056】
[実施形態の第3変形例]
次に、上記実施形態として示した汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法の変形例を説明する。本変形例における運転操作量推論根拠出力装置は、主に、近似モデル生成部32における近似モデルの生成方法が異なっている。本変形例における運転操作量推論根拠出力装置のブロック図は上記実施形態と同等であるため、
図2を主に用いて説明する。
ここでは、推論根拠35の出力時での各構成要素の挙動について説明する。運転操作量34の学習時と、運転操作量34の推論時での各構成要素の挙動は、上記実施形態と同じである。
本変形例においても、上記実施形態と同様に、推論モデル50を局所的に表現する近似モデルを生成する。近似モデルは、推論時に入力となった推論対象データに関連するデータを対象として生成される。
【0057】
上記実施形態と同様に、近似モデル用学習データ取得部27は、データ蓄積部24から、推論対象データに対応するトレンドデータ21と水質データ22に関連する、トレンドデータ21と水質データ22を取得する。
近似モデル用学習データ取得部27は、取得したトレンドデータ21と水質データ22をデータ加工部28に送信する。
データ加工部28は、近似モデル用学習データ取得部27から受信した各データを加工して、推論対象データに関連する値を有する、複数の関連データを生成する。
データ加工部28は、関連データを、近似モデル生成部32に送信する。
【0058】
近似モデル生成部32は、推論対象データと、複数の関連データを受信する。近似モデル生成部32は、これらのデータを基に、推論対象データに対して推論モデル50を近似する近似モデルを生成し、近似モデルパラメータを生成する。
近似モデルのモデルパラメータは、推論対象データに関連する部分で、推論モデル50を局所的に近似するように決定される。このため、近似モデルは、推論モデル50全体を近似するのではなく、推論モデル50が推論を行う度に、その都度、入力となった推論対象データに関連する部分を近似するように生成される。
上記のような近似モデルを、本変形例においては、SHAP(SHapley Additive exPlanations)を適用して生成する。SHAPは、推論対象のデータに対し、各特徴量を変化させたときの推論結果の変化の度合いを基に、推論対象のデータの各特徴量の重要性、すなわち寄与度を定量化しようとするものである。
【0059】
より具体的には、近似モデル生成部32は、推論対象データをa、運転操作量34を推論するための推論モデル50をfとすると、推論対象となる説明変数x=a=(a
1、a
2、…、a
n)に対し、次式8で表されるような簡略化されたモデルgを、fに近似する近似モデルgとして生成する。
【数8】
上式における複数の係数w=(w
0、w
1、…、w
n)が、上記実施形態と同様に、近似モデルgを表す近似モデルパラメータである。
ここで、z(a)は、次式9で表される。
【数9】
上式におけるδ
aiは、上記実施形態における式6と同様、所謂クロネッカーのデルタである。すなわち、上式においては、説明変数x=(x
1、x
2、…、x
n)のi番目の要素x
iが、推論対象データのi番目の要素の値a
iと等しい場合に1と、等しくない場合に0と、それぞれなるように設定されている。
【0060】
SHAPにおいては、local accuracy、missingness、及びconsistencyの、3種類の性質を有することが、計算上での制約となる。
local accuracyは、説明対象となる推論モデルfと、近似モデルg(f)の、説明変数xが推論対象データaと等しくx=aとなる場合の値は等しいという制約である。すなわち、推論対象x=a=(a
1、a
2、…、a
n)において、次式10が成立する。
【数10】
【0061】
missingnessは、存在しない説明因子ziの寄与度wiはゼロであるという制約である。すなわち、上記の式8において、zi(a)=0となるようなiに対して、wi=0が成立する。
【0062】
consistencyは、以下に説明するような制約である。まず、推論モデルfと近似モデルg(f)の間で、f(a)と、g(f)(z(a))が等しいとする。
このとき、2つの推論モデルf
1、f
2に関し、次式11が成立する。
【数11】
ここで、z
(i)(a)は、上式9で表されるz(a)のうち、i番目の説明因子z
i(a)をゼロとしたベクトルである。すなわち、本制約は、2つの推論モデルf
1、f
2を比較したときに、i番目の説明因子が存在することによる推論モデルf
1の変化が推論モデルf
2の変化よりも大きければ、推論モデルf
1の、i番目の説明因子による貢献度合いw
i(f
1)は、推論モデルf
2の、i番目の説明因子による寄与度w
i(f
2)よりも大きいことを示すものである。
【0063】
上記の各制約を満足する寄与度w
i(f)は、次式12として表すように、一意に求めることができる。
【数12】
上式において、|S|は、集合Sの元の数である。すなわち、i番目の要因を加えたときと加えなかったときの差を、全ての組み合わせの分だけ総和して平均したものとして、i番目の説明変数の寄与度は計算される。
この寄与度、すなわち複数の係数w=(w
0、w
1、…、w
n)が、近似モデルgを表す近似モデルパラメータである。
【0064】
このように、本変形例においても、上記実施形態と同様に、近似モデル生成部32は、推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、推論対象データに対して推論モデル50を近似する近似モデルを生成し、近似モデルパラメータを生成する。
近似モデル生成部32は、上記のように生成した近似モデルパラメータw=(w0、w1、…、wn)を、推論根拠出力部33へ送信する。
【0065】
推論根拠出力部33は、近似モデルパラメータw=(w
0、w
1、…、w
n)を受信する。
本変形例においても、上記実施形態と同様に、近似モデルパラメータw=(w
0、w
1、…、w
n)に関しては、i番目の係数w
iの数値が大きな正の値となる場合に、i番目の変数x
iの値がa
iであることが、モデルfの結果がf(x)であることを強く支持していると解釈することができる。このため、近似モデルパラメータw=(w
0、w
1、…、w
n)を、機械学習器40の判断根拠の強さとして適用可能である。
推論根拠出力部33は、上記実施形態において
図4を用いて説明したように、近似モデルパラメータwを基に、推論モデル50における推論対象データaを基にした運転操作量34の推論の根拠35を、外部に、例えば図示されない表示装置等に、出力する。
【0066】
本変形例が、既に説明した実施形態と同様な効果を奏することは言うまでもない。
【0067】
なお、本発明の汚水処理施設の運転操作量推論根拠出力装置及び運転操作量推論根拠出力方法は、図面を参照して説明した上述の実施形態及び各変形例に限定されるものではなく、その技術的範囲において他の様々な変形例が考えられる。
【0068】
例えば、上記第1変形例においては、入力部60により入力された運転操作量と、推論モデルにおいて推論された運転操作量34が異なるか否かの判断は、推論根拠出力部33Aにより行われていたが、これ以外の部分により行われてもよい。例えば、近似モデル用学習データ取得部が当該判断を行い、異なる場合にのみ、近似モデル用学習データ取得部によるデータの取得、データ加工部によるデータの加工、近似モデル生成部による近似モデルの生成、及び推論根拠出力部による結果の出力を含む、推論根拠を出力する一連の処理が行われるように構成されていてもよい。
また、上記実施形態及び各変形例において、機械学習器はニューラルネットワークにより実現されていたが、ランダムフォレスト(Random Forest)やXGBoost(eXtreme Gradient Boosting)等の集団学習手法をはじめとした、他の機械学習手法により実現されていてもよい。
【0069】
これ以外にも、本発明の主旨を逸脱しない限り、上記実施形態及び各変形例で挙げた構成を取捨選択したり、他の構成に適宜変更したりすることが可能である。
例えば、上記第2変形例は、第1変形例の更なる変形例であるため、第1変形例と同様に、入力部60により入力された運転操作量と、推論モデルにおいて推論された運転操作量34が異なる場合にのみ、推論根拠35を外部に出力するように構成されていた。これに替えて、上記第2変形例において、上記実施形態と同様に、入力部60により入力された運転操作量と、推論モデルにおいて推論された運転操作量34が同一の場合においても、推論根拠35を外部に出力するように構成されていてもよい。
【符号の説明】
【0070】
1 汚水処理施設
20、20A 運転操作量推論根拠出力装置
21 トレンドデータ(施設パラメータ)
22 水質データ(施設パラメータ)
23 運転操作量データ
29 運転操作量学習部
31 運転操作量推論部
32 近似モデル生成部
33、33A 推論根拠出力部
34 運転操作量
35 推論根拠
40 機械学習器
50 推論モデル
60 入力部