(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025009595
(43)【公開日】2025-01-20
(54)【発明の名称】水質管理指標出力装置及び水質管理指標出力方法
(51)【国際特許分類】
C02F 1/00 20230101AFI20250109BHJP
G06N 20/00 20190101ALI20250109BHJP
【FI】
C02F1/00 T
G06N20/00 130
【審査請求】未請求
【請求項の数】14
【出願形態】書面
(21)【出願番号】P 2023119462
(22)【出願日】2023-07-05
(71)【出願人】
【識別番号】501317560
【氏名又は名称】京都市
(72)【発明者】
【氏名】恒吉 敦
(57)【要約】
【課題】本発明が解決しようとする課題は、最適な水質管理を行うために必要とされる、水質影響要因の定量的評価及び水質を最適化するための施設の運転指標を導出することを可能とする方法を提供することである。
【解決手段】水質管理指標出力装置10は、水質関連データを蓄積する、データ蓄積部13と、水質関連データから学習済みモデルを出力する、機械学習モデル推定部17と、学習済みモデルを記憶する、学習済みモデル記憶部18と、水質関連データ及び学習済みモデルから水質影響量推論値を推論し、出力する、水質影響量推論値出力部20と、水質影響量推論値を記憶する、水質影響量推論値記憶部21と、水質関連データ及び学習済みモデルから水質最適化運転指標を推論し、出力する、水質最適化運転指標出力部24と、水質最適化運転指標を記憶する、水質最適化運転指標記憶部26と、を備えている。
【選択図】
図2
【特許請求の範囲】
【請求項1】
水質管理に用いる、水質影響量推論値及び水質最適化運転指標を推論し、出力する、水質管理指標出力装置であって、
水質関連データを蓄積する、データ蓄積部と、
前記水質関連データから学習済みモデルを出力する、機械学習モデル推定部と、
前記学習済みモデルを記憶する、学習済みモデル記憶部と、
前記水質関連データ及び前記学習済みモデルから前記水質影響量推論値を推論し、出力する、水質影響量推論値出力部と、
前記水質影響量推論値を記憶する、水質影響量推論値記憶部と、
前記水質関連データ及び前記学習済みモデルから前記水質最適化運転指標を推論し、出力する、水質最適化運転指標出力部と、
を備えている、水質管理指標出力装置。
【請求項2】
前記水質関連データは、施設運転データ及び水質データを統合した統合データである、
請求項1に記載の水質管理指標出力装置。
【請求項3】
前記機械学習モデル推定部は、前記統合データに対し、最適学習方法に基づく機械学習を行い、学習済みモデルを出力する、
請求項1に記載の水質管理指標出力装置。
【請求項4】
前記最適学習方法は、最適教師データ、最適学習アルゴリズム及び最適ハイパーパラメータにより決定される、
請求項3に記載の水質管理指標出力装置。
【請求項5】
前記統合データに対し、目的変数の設定、説明変数の抽出、外れ値処理及び欠測値処理を施した、仮教師データを作成し、
前記仮教師データ、仮機械学習アルゴリズム及び仮ハイパーパラメータによって仮学習済みモデルを推定し、
前記仮学習済みモデルの精度評価及び影響量評価によって前記仮教師データ、前記仮学習アルゴリズム及び前記仮ハイパーパラメータを最適化し、
前記最適学習方法として出力する最適学習方法出力部を更に備える、
請求項4に記載の水質管理指標出力装置。
【請求項6】
前記精度評価において、前記仮学習済みモデル及び前記仮教師データを用いて、仮学習済みモデル予測値を推論し、
前記仮学習済みモデルの予測精度、汎化性能及び前記目的変数と前記仮学習モデル予測値の相関の評価に基づき、前記仮学習アルゴリズム及び前記仮ハイパーパラメータを最適化する、
請求項5に記載の水質管理指標出力装置。
【請求項7】
前記影響量評価において、前記仮学習済みモデル及び前記仮教師データに対し、仮水質影響量推論値を推論し、前記仮教師データを最適化する、
請求項5に記載の水質管理指標出力装置。
【請求項8】
前記仮水質影響量推論値は、前記仮学習済みモデル及び前記仮教師データから、前記仮学習済みモデル予測値に対する、前記仮教師データの説明変数の寄与の大きさとして、推論された値である、
請求項7に記載の水質管理指標出力装置。
【請求項9】
前記水質影響量推論値出力部は、前記学習済みモデル及び水質影響量推論用データを用いて、学習済みモデル予測値を推論し、
前記学習済みモデル及び前記水質影響量推論用データに対し、前記水質影響量推論値を推論し、出力する、
請求項1に記載の水質管理指標出力装置。
【請求項10】
前記水質影響量推論値は、前記学習済みモデル及び前記水質影響量推論用データから、前記学習済みモデル予測値に対する、前記水質影響量推論用データの説明変数の寄与の大きさとして、推論された値である、
請求項9に記載の水質管理指標出力装置。
【請求項11】
前記水質影響量推論用データは、前記統合データから、前記最適学習方法に基づく方法で抽出した、前記水質影響量推論値の推論対象データである、
請求項10に記載の水質管理指標出力装置。
【請求項12】
前記水質最適化運転指標出力部は、前記学習済みモデル及び水質最適化運転指標推論用データを用いて、前記水質最適化運転指標を推論し、出力する、
請求項1または請求項9に記載の水質管理指標出力装置。
【請求項13】
前記水質最適化運転指標推論用データは、前記統合データから、前記最適学習方法に基づく方法で抽出した、前記水質最適化運転指標の推論対象データである、
請求項12に記載の水質管理指標出力装置。
【請求項14】
水質管理指標出力装置が、水質管理に用いる水質管理指標を出力する方法であって、
水質関連データから学習済みモデルを推定し、
前記学習済みモデル及び水質影響量推論用データから水質影響量推論値を推論し、
前記学習済みモデル及び水質最適化運転指標推論用データから水質最適化運転指標を推論し、
前記水質影響量推論値及び前記水質最適化運転指標を水質管理指標として出力する、
方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は水質管理指標出力装置及び水質管理指標出力方法に関する。
【背景技術】
【0002】
下水処理は、微生物の凝集した汚泥、活性汚泥を用い、好気的な生物反応によって、主に有機物除去を行う、いわゆる標準活性汚泥法を主要な方法として普及が進んできた。この標準活性汚泥法では、活性汚泥の働きを促進させるため、活性汚泥と下水の混合液に対して酸素を与える、ばっ気と呼ばれる操作を行う。このような標準活性汚泥法における水質管理では、流入する下水中の有機物量の増減に合わせ、活性汚泥の量やばっ気操作の変更を行うことが主なものだった。
【0003】
しかし、下水道の普及が進むにつれ、富栄養化問題などの環境問題への対応が必要となり、窒素やりんの除去を行う処理方法、すなわち高度処理の普及が進められてきた。標準活性汚泥法は、ばっ気により活性汚泥に酸素を与える、好気槽だけで構成されていたが、高度処理では、嫌気槽や無酸素槽と呼ばれる、敢えて活性汚泥に酸素を与えない槽を導入することで、生物によるりんの過剰蓄積や脱窒反応という特殊な生物反応を生じさせ、窒素やりんを下水中から除去することを可能としている。
【0004】
そのため、現在の下水の水質管理では、従前の有機物処理に加えて、高度処理機能を適切に維持することも同時に求められている。好気槽だけでなく嫌気槽や無酸素槽の状態も、同時に適切に維持することが必要となることから、水質管理のための操作は複雑化してきている。そのため、種々の水質影響要因を踏まえた、最適な水質管理を行うためには、多くの経験とノウハウが必要とされるようになってきた。
【0005】
例えば、高度処理で窒素の除去を行う場合、好気槽では有機物の除去だけでなく、硝化と呼ばれる生物反応によって、下水中のアンモニア性窒素を硝酸性窒素に酸化する反応を進める必要がある。どちらもばっ気量を増やすことなどで促進することができるが、一方、窒素除去は無酸素槽で生物処理されることが必要となる。これは好気槽で生じた硝酸性窒素を、脱窒と呼ばれる生物反応でN2などに還元して除去することで行われる。しかし、無酸素槽内に酸素が残存している場合、好気的な生物反応が優先し、脱窒反応が進まなくなってしまう。そのため、好気槽で過剰にばっ気量を増やすと、無酸素槽で脱窒が進まなくなり、ばっ気量が不足すると、硝化が不十分となり、どちらも窒素除去を阻害してしまう。さらに、流入下水の水量や水質は季節や天候、人間の生活によって大きく変動し、それぞれに合わせて最適な運転操作の変更を行わなければ、最適な水質管理を行うことはできない。
【0006】
このように、高度処理の普及に伴い、水質管理の難易度や重要性は増してきているが、現在のところ、最適な水質管理の方法は、経験やノウハウ、個人の勘所といったものに依るところが大きい。しかし、近年の技術者の減少や経験者の大量退職によって、水質管理の技術を維持することは難しくなっていくことが想定される。そのため、経験などに依らず、データに基づいて水質管理指標を得て、それに基づいた最適な水質管理を行う方法が必要とされている。
【0007】
先行技術においても下水処理やそれに準じる排水処理などにおける、機械学習によるデータの活用方法を提示している。非特許文献1では、下水道が有する種々の情報の可能性について考察するなかで,日々取得されている運転管理データ及び流入水質データを用いた機械学習による下水処理水の水質予測を行っている。ニューラルネットワークによる深層学習モデル及びランダムフォレスト(Random Forest)での計算を行っているが、未知データに対する検証では十分な精度が得られず、改善の余地があるとしている。
【0008】
非特許文献2では、養豚汚水処理において重要な、硝酸性窒素などを予測対象とした機械学習を行っている。センサで容易にデータ収集可能な運転管理項目(汚水pH,汚水EC,曝気槽水温,曝気槽pHおよび曝気槽の活性汚泥浮遊物質)を学習データとし、決定木モデルを推定し、さらにこの決定木のノード分岐を解析することで運転管理項目の影響を評価し、運転管理指針の作成を試みている。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】西村文武,et al.″都市域・流域圏の情報拠点としての下水道―運転管理データ活用の試み―.″AI・データサイエンス論文集 1.J1 (2020):278-285.
【非特許文献2】田中康男.″機械学習による養豚汚水処理施設の性能向上に向けて-決定木解析による個別施設の硝酸性窒素等除去特性把握の試み-.″日本養豚学会誌58.2(2021):65-79.
【発明の概要】
【発明が解決しようとする課題】
【0010】
非特許文献1では本発明と同じ下水処理場の運転管理データ及び水質データをもとに処理水の水質を予測する機器学習モデルを推定しているが、十分な精度が得られておらず、水質影響量のような水質影響要因の定量的な評価にまでは至っていない。
【0011】
非特許文献2では処理水の水質を予測する機械学習モデル推定と運転管理項目による影響評価を行っている。しかし、決定木解析では解析毎に決定木を書出し、ノードを解釈する必要があり、また、多数の水質影響要因を取り扱うことが難しいという問題がある。
【0012】
本発明が解決しようとする課題は、最適な水質管理を行うために必要とされる、水質影響要因の定量的評価及び水質を最適化するための施設の運転指標を導出する装置及び方法を提供することである。
【課題を解決するための手段】
【0013】
本発明は上記課題を解決するために、以下の手段を採用する。すなわち、水質管理に用いる、水質影響量推論値及び水質最適化運転指標を推論し、出力する、水質管理指標出力装置であって、水質関連データを蓄積する、データ蓄積部と、前記水質関連データから学習済みモデルを出力する、機械学習モデル推定部と、前記学習済みモデルを記憶する、学習済みモデル記憶部と、前記水質関連データ及び前記学習済みモデルから水質影響量推論値を推論し、出力する、水質影響量推論値出力部と、前記水質影響量推論値を記憶する、水質影響量推論値記憶部と、前記水質影響量推論値から水質最適化運転指標を推論し、出力する水質最適化運転指標出力部と、を備えている、水質管理指標出力装置を提供する。
【発明の効果】
【0014】
最適な水質管理を行うために必要とされる、水質影響要因の定量的評価及び水質を最適化するための施設の運転指標を導出することができる。
【図面の簡単な説明】
【0015】
【
図1】本発明実施形態における下水処理施設のブロック図である。
【
図3】水質管理指標出力装置の最適学習方法出力部のフローチャートである。
【
図4】水質管理指標出力装置の機械学習モデル推定部のフローチャートである。
【
図5】水質管理指標出力装置の水質影響量推論値出力部のフローチャートである。
【
図6】水質管理指標出力装置の水質最適化運転指標出力部のフローチャートである。
【
図7】統合データから作成された最適教師データの説明変数データの例である。
【
図8】統合データから作成された最適教師データの目的変数データの例である。
【
図9】最適教師データの目的変数データ(図中実測データ)と学習済みモデル予測値(図中予測データ)の、テストデータ及びトレーニングデータ別の相関を示す散布図である。
【
図10】最適教師データにおける、水質影響量推論値の例である。
【
図12】水質影響量推論値の変化量の可視化例である。
【
図13】説明変数毎の水質影響量推論値の分布の可視化例である。
【
図14】対象とする説明変数の値とその平均水質影響量推論値の関係の可視化例である。
【
図15】対象とする説明変数の値、その水質影響量推論値及び依存性を調べたい説明変数の値の関係の可視化例である。
【発明を実施するための形態】
【0016】
以下、本発明の実施形態について図面を参照して詳細に説明する。
【0017】
図1は、本実施形態における下水処理施設のブロック図である。下水処理施設1は沈砂池2、揚水ポンプ設備3、最初沈殿池4、生物反応槽5、最終沈殿池6、消毒設備7、送風機設備8、汚泥処理設備9及び水質管理指標出力装置10を備えている。なお、生物反応槽の一例として、窒素除去を行う高度処理である、ステップ流入式2段硝化脱窒法の構造を示している。各工程には流量計などが、生物反応槽にはDO(溶存酸素濃度)計、MLSS(活性汚泥濃度)計、ORP(酸化還元電位)計、NH4-N(アンモニア性窒素濃度)計などが設置されており、中央監視システムでこれら計装設備のトレンドデータを集約している。また、水質などの測定を行う主要工程の試料としては、流入下水2w、原水3w、沈殿後水4w、処理水5w、放流水6w、反応槽混合液2s、返送汚泥3s及び余剰汚泥4sがある。定期的にこれらの各工程の試料をサンプリングし、法定検査や水質管理のための水質試験が行われる。
【0018】
下水道を通じて下水処理施設1に流入した下水、流入下水2wは、下水処理施設1の汚泥処理施設9などから生じる場内返送水1wとともに沈砂池2に流入する。沈砂池2では下水道管を流れてきた下水を、より断面積の大きな沈砂池2に導入することで、流速を大きく減少させ、下水中に含まれる砂分を取り除く。これにより後段にある揚水ポンプ設備3に設置されている揚水ポンプでのサンドブラスト現象などを防ぐ。また、沈砂池に付随して、スクリーンなどを用いた、し渣除去装置も設置されている。これも揚水ポンプへのし渣の絡まりなどを防ぐための装置である。
【0019】
下水道は自然流下を利用し、下水処理施設1に下水を集めることが多く、下水処理施設1に流入する段階で、下水道管の設置レベルは地下深くとなることが多い。また、下水処理施設1は大きな面積を必要とするため、地表レベルに設置される。そのため、揚水ポンプを用いて下水を地表レベルまで揚水する必要が生じる。揚水ポンプ設備3はこのために設けられたものである。
【0020】
揚水された下水は、沈砂池2よりもさらに断面積の大きな最初沈殿池4に導入される。沈砂池2よりもさらに流速が減少するため、下水に分散している粒子状の有機物などを沈降させ、下水から分離させることができる。沈降分離後の汚泥を生汚泥1sと呼び、これは汚泥処理設備9に送られる。また、最初沈殿池4に入る前の試料を原水3w、最初沈殿池4で処理された下水を沈殿後水4wと呼ぶ。
【0021】
沈殿後水4wは返送汚泥2sとともに生物反応槽5に導入される。生物反応槽5では活性汚泥微生物の生物反応により、沈殿後水4wに含まれる微細な汚濁粒子や下水中に溶解している汚濁物質を除去する。例として示したステップ流入式2段硝化脱窒法では沈殿後水4wを無酸素槽それぞれに一定の比率で分割して流入させる。無酸素槽は機械式の撹拌装置などで混合状態を維持する。好気槽では送風機設備8からの空気を反応槽底部などに設置した散気装置から送気してばっ気を行う。ばっ気量の制御は、生物反応槽5の末端などに設置したDO計を参照し、一定のDOを維持するようばっ気量を制御するDO制御や、流入下水量に対して定めた体積倍率の空気量でばっ気量を制御する送気倍率制御などが用いられる。
【0022】
ステップ流入式2段硝化脱窒法の好気槽では沈殿後水4wに含まれる有機物処理及びアンモニア性窒素の硝化が行われ、無酸素槽では前段の好気槽あるいは最終沈殿池6からの返送汚泥2sに含まれる硝酸性窒素の脱窒が行われる。無酸素状態は、沈殿後水4wに含まれる有機物が生物に利用される過程で溶存酸素が消費されることによって維持されるため、沈殿後水4wを分割して投入している。ORP計はこの無酸素状態の把握のために設置されている。
【0023】
生物反応槽5で処理された下水は、最終沈殿池6に導入される。最終沈殿池6では活性汚泥を沈降分離させ、生物処理の完了した処理水5wを得る。沈降分離した活性汚泥は、返送汚泥2sとして生物反応槽5に戻され、繰り返し下水処理に用いられる。また、このように繰返し下水処理を行う過程で微生物が増殖していくため、活性汚泥の量は増加していく。この活性汚泥の増分は余剰汚泥3sとして引き抜かれ汚泥処理設備9に送られる。また、余剰汚泥3sの量をコントロールすることで生物反応槽5のMLSS(活性汚泥濃度)を操作する。
【0024】
生物処理の完了した処理水5wは、消毒設備7に送られる。ここで、処理水5wは次亜塩素酸ナトリウムやオゾンなどによって消毒され、河川や海域に、放流水6wとして放流される。汚泥処理設備9に送られた、生汚泥1s及び余剰汚泥3sは濃縮、脱水などの処理を行ったのち焼却される。
【0025】
図2は、本実施形態における、水質管理指標出力装置10のブロック図である。本実施形態における水質管理指標出力装置10は、上記のような下水処理施設1を対象としており、下水処理施設1の水質管理に用いる、水質影響量推論値22及び水質最適化運転指標26を推論し、出力する。
【0026】
水質管理指標出力装置10は、データ蓄積部13、最適学習方法出力部14、最適学習方法記憶部15、機械学習モデル推定用データ取得部16、機械学習モデル推定部17、学習済みモデル記憶部18、水質影響量推論用データ取得部19、水質影響量推論値出力部20、水質影響量推論値記憶部21、水質最適化運転指標推論用データ取得部23、水質最適化運転指標出力部24及び水質最適化運転指標記憶部25を備え、施設運転データ11及び水質データ12を入力とし、水質影響量推論値22及び水質最適化運転指標26を出力する装置である。
【0027】
これら水質管理指標出力装置10の構成要素のうち、最適学習方法出力部14、機械学習モデル推定用データ取得部16、機械学習モデル推定部17、水質影響量推論用データ取得部19、水質影響量推論値出力部20、水質最適化運転指標推論用データ取得部23及び水質最適化運転指標出力部24は、例えば上記情報処理装置内のCPUにより実行されるソフトウェア、プログラムであってよい。また、データ蓄積部13、最適学習方法記憶部15、学習済みモデル記憶部18、水質影響量推論値記憶部21及び水質最適化運転指標記憶部25は上記情報処理装置内外に設けられた半導体メモリや磁気ディスクなどの記憶装置により実現されていてよい。
【0028】
水質管理指標出力装置10の入力は二つの系統があり、一つは、下水処理施設1の計装設備から得られる、流量、ORP、DO、MLSS、送気量などのトレンドデータからなる、施設運転データ11である。もう一つは、下水処理施設1の流入下水2w、原水3w、沈殿後水4w、処理水5w、放流水6w、反応槽混合液2s、返送汚泥3s及び余剰汚泥4sの水質測定結果からなる、水質データ12である。水質データ12は定期的な水質試験により、主として日間平均水質として測定されたものであるため、施設運転データ11もトレンドデータの日毎の積算値としたものを用いる。
【0029】
水質管理指標出力装置10の出力は、上記のように水質影響量推論値22及び水質最適化運転指標26である。水質影響量推論値22は、水質管理対象の水質項目に対し、ある処理状態における水質影響要因毎の水質影響量を推論した値である。また、水質最適化運転指標26は、水質管理対象としての水質項目に対し、複数の処理状態における複数の水質影響量推論値から推論した、水質を最適化する運転を行うために目標とすべき水質影響要因に関する指標である。
【0030】
これらの出力を効果的に行うため、水質管理指標出力装置10は、機械学習モデル推定用データ取得部16で取得されたデータを教師データとして、機械学習モデル推定部17で推定した、学習済みモデルを学習済みモデル記憶部18に備えている。また、機械学習モデル推定用データ取得部16及び機械学習モデル推定部17では、最適学習方法出力部14において生成され、最適学習方法記憶部15に最適学習方法として備えられている、最適教師データ、最適学習アルゴリズム及び最適ハイパーパラメータを用いて、教師データの取得とモデルパラメータの推定を行う。
【0031】
水質管理指標出力装置10は、上記方法で機械学習モデル記憶部18に備えた学習済みモデルと、水質影響量推論用データ取得部19で取得されたデータを用い、水質影響量推論値出力部20に備えた水質影響量推論器によって、水質影響量推論値22を出力する。また、上記方法で機械学習モデル記憶部18に備えた学習済みモデルと、水質最適化運転指標推論用データ取得部23で取得されたデータを用い、水質最適化運転指標出力部24に備えた水質影響量推論器によって、水質影響量推論値を出力し、これをもとに水質最適化運転指標26を推論し出力する。
【0032】
水質影響量推論器では、学習済みモデルが目的変数、すなわち本実施形態における水質管理対象の水質項目の推論を行うに際し、どのような根拠を持って推論を行ったか、その根拠を水質影響量推論値として出力する。
【0033】
以下、学習済みモデル推定、水質影響量推論値出力及び水質最適化運転指標出力における各構成要素の挙動について説明する。なお、水質影響量推論器の機能についてはこれら挙動の説明後に説明する。
【0034】
施設運転データ11は、下水処理施設1の運転状態や、下水処理施設1に設置されている水質測定計器の測定値などのトレンドデータで構成されるものである。
【0035】
水質データ12は水質管理のために実施される、下水処理の各工程の試料の水質測定結果及び法定検査のために実施される、下水処理場からの放流水6wの水質測定結果などである。
【0036】
データ蓄積部13では施設運転データ11及び水質データ12を統合したものを統合データとして蓄積する。水質データ12が主として日間平均水質として収集されるものであることから、施設運転データ11も日毎の積算値を用い、日付をキーとして施設運転データ11と水質データ12を結合し、統合データとして蓄積する。
【0037】
次に、機械学習モデル推定部17に先立ち、最適学習方法出力部14において、最適教師データ、最適学習アルゴリズム及び最適ハイパーパラメータからなる最適学習方法の出力を行う。
図3は最適学習方法出力部14のフローチャートである。
【0038】
最適学習方法出力部14では、初めに目的変数決定s1が実行される。本実施形態は水質管理を目的とするため、目的変数は、水質管理を行う際に重要な水質項目から選定される。例としては、高度処理であれば処理水5wのりん含有量や窒素含有量、標準活性汚泥法であればBOD(生物化学的酸素要求量)、SS(浮遊物質)、アンモニア性窒素などが挙げられる。また、窒素除去を目的とした高度処理は窒素除去率に理論的な上限があるため、窒素含有量ではなく窒素除去率を目的変数としてもよい。このような水質項目のほか、活性汚泥の性状維持に注目したSVI(汚泥容積指標)などを目的変数としてもよい。
【0039】
仮説明変数抽出s2ではデータ蓄積部13の統合データ内の全変数から説明変数が抽出される。説明変数の抽出にあたっては、目的変数決定s1で選定された目的変数に対して、因果関係が無いと明らかな説明変数、他の変数から算出が可能な説明変数、目的変数が原因となって変化する説明変数、データ数が少ない説明変数、相関係数が高い説明変数のうちの一方の説明変数、値に変動がない(分散が著しく小さい)説明変数、を除いたものが抽出される。算出可能な変数間においては、説明変数としての情報を増やすため、より基礎的な変数が抽出される。また、相関係数が高い説明変数間においては、目的変数とした水質との工程における距離、測定頻度や測定精度、説明変数間の因果関係などに基づき、適切な変数が抽出される。
【0040】
仮教師データ取得s3では、目的変数決定s1及び仮説明変数抽出s2で定められた変数のデータが、データ蓄積部13の統合データから仮教師データとして取得される。
【0041】
外れ値処理s4では、仮教師データ内の異常値や外れ値への対処が行われる。外れ値の検出方法としては3σ法やIQR(四分位偏差法)などを用いてもよい。検出した外れ値のサンプルデータは仮教師データから除去される。ただし、外れ値が異常値ではなく、極端ではあるが下水処理状況として想定すべき状況を示すデータと判断し、仮教師データから除去されないとしてもよい。
【0042】
欠測値処理s5では、外れ値処理s4後の仮教師データ内の欠測値への対処が行われる。施設運転データ11及び水質データ12は測定周期が異なるため、両者を結合した統合データは構造的に多くの欠測値が生じる。このような欠測値への対処としては、欠測値を含むサンプルを削除するリストワイズ法や、欠測値を線形補完などにより、他の数値で補完する単一代入法などが用いられてもよい。本発明形態では統合データが時系列構造であり、多くの欠測が生じる原因が測定周期の違いにあるため、線形補完による欠測値の対応を行うことで、教師データ量を確保するとしてもよい。
【0043】
仮学習アルゴリズム決定s6では、欠測値処理s5後の仮教師データを用いた仮学習済みモデル推定s8に際して使用する、仮機械学習アルゴリズムが決定される。仮機械学習アルゴリズム選定にあたっては、目的変数に設定した水質項目の特性に注目するとよい。履歴効果の重要性が高くない場合は、勾配ブースティング決定木に類するものを用いるとよい。逆に履歴効果を強く受けるものの場合は、水質影響量推論値算出の計算コストと解釈性で勾配ブースティング決定木に劣るが、回帰型ニューラルネットワークに類するものを用いるとしてもよい。
【0044】
ハイパーパラメータ調整s7では、上述の仮教師データ、仮機械学習アルゴリズムを用いた学習における、ハイパーパラメータの調整が行われる。ハイパーパラメータ調整にあたっては、グリッドサーチ、ランダムサーチ、ベイズ最適化などの方法を用いる。また、ハイパーパラメータの自動最適化ライブラリを利用してもよい。
【0045】
仮学習済みモデル推定s8では、上述の仮教師データ、仮機械学習アルゴリズム及びハイパーパラメータを用いて、仮学習済みモデルが推定される。なお推定にあたっては、精度評価s10のため、ホールドアウト法により仮教師データはトレーニングデータとテストデータに分割され、トレーニングデータから仮学習済みモデルが推定される。
【0046】
仮学習済みモデル予測値算出s9では、上述の仮学習済みモデル及び仮教師データを用いて目的変数の予測データが推論される。
【0047】
精度評価実施s10では、目的変数データと、仮学習済みモデル予測値算出s9で推論されたトレーニングデータ及びテストデータそれぞれに対する目的変数の予測データから、MAE(Mean Absolute Error)、RMSE(Root Mean Square Error)、R
2スコア及びCVスコアによる精度及び汎化性能の評価が行われる。水質分析や計装設備の定量下限値、水質管理対象の目的変数の許容誤差を判断基準とし、判断基準に満たない場合は、仮学習アルゴリズム決定s6に戻り、学習アルゴリズムの見直しが行われる。十分な精度及び汎化性能が得られた場合は最適学習アルゴリズム出力s11に進み、最適学習アルゴリズムが出力される。
図9は目的変数データ(図中実測データ)と目的変数の予測データにおける、テストデータ及びトレーニングデータ別の相関を示す散布図の例である。
【0048】
水質影響量推論器s12では最適学習アルゴリズムにおける仮学習済みモデル及び仮教師データから仮水質影響量推論値が推論され出力される。
【0049】
影響量評価実施s13では水質影響量推論器s12で出力された仮水質影響量推論値の分布に基づき、説明変数の評価が行われる。
図13は仮水質影響量推論値(図中SHAP value)の分布を、説明変数毎に可視化した例である。水質分析や計装設備の定量下限値、水質管理対象の目的変数の許容誤差を判断基準として、仮水質影響量推論値の分布幅が十分に小さい説明変数がある場合、仮説明変数抽出s2に戻り、当該説明変数を取り除くよう、抽出する説明変数の見直しが行われる。取り除かれる説明変数が無い場合は、最適ハイパーパラメータ出力s14及び最適教師データ出力s15に進み、最適ハイパーパラメータ及び最適教師データが、出力される。
【0050】
最適学習方法出力部14で最適化された、最適教師データ、最適学習アルゴリズム及び最適ハイパーパラメータは、最適学習方法として出力され、最適学習方法記憶部15に記憶される。なお、最適教師データは、データ蓄積部13から取得した目的変数及び説明変数のデータから、最適教師データを作成するために必要な、外れ値処理s4や欠測値処理s5なども含めた方法として記憶されるものである。
【0051】
機械学習モデル推定用データ取得部16では、最適学習方法記憶部15に記憶された最適学習方法に基づき、データ蓄積部13から機械学習モデル推定用データが取得される。
図7は機械学習モデル推定用データの説明変数データの例を示したものである。また、
図8は機械学習モデル推定用データの目的変数データの例を示したものである。
【0052】
図4は機械学習モデル推定部17のフローチャートである。最適学習方法取得s16では最適学習方法記憶部15に記憶された最適学習方法が取得される。教師データ取得s17では機械学習モデル推定用データ取得部16で取得された機械学習モデル推定用データが取得される。学習済みモデル推定s18では最適学習方法及び機械学習モデル推定用データから学習済みモデルが推定され、学習済みモデル出力s19で出力される。
【0053】
学習済みモデル記憶部18は、機械学習モデル推定部17から出力された学習済みモデルが記憶される。
【0054】
水質影響量推論用データ取得部19では、最適学習方法記憶部15に記憶された最適学習方法に基づき、データ蓄積部13から水質影響量推論用データが取得される。
【0055】
図5は水質影響量推論値出力部20のフロー図である。水質影響量推論対象データ取得s20では水質影響量推論用データ取得部19で取得された水質影響量推論用データから水質影響推論対象データが取得される。また、学習済みモデル取得s21では学習済みモデル記憶部18に記憶された学習済みモデルが取得される。
【0056】
モデル予測値推論s22では水質影響量推論対象データ及び学習済みモデルからモデル予測値データが推論され、モデル予測値データ出力s23で出力される。また、水質影響量推論器s24では水質影響量推論対象データ及び学習済みモデルから、水質影響量推論器を用いて、水質影響量推論値データが推論され、水質影響量推論値データ出力s25で出力される。
【0057】
モデル予測値データ出力s23及び水質影響量推論値データ出力s24の出力は、水質影響量推論値記憶部21に記憶され、水質影響量推論値22として、水質管理指標出力装置10の出力となる。
図10は、出力される水質影響量推論値の例である。
【0058】
水質管理指標出力装置10から出力された水質影響量推論値22は、水質管理対象として目的変数に設定された水質項目に対し、あるサンプル、すなわちある処理状態における、各説明変数、すなわち水質影響要因毎の水質影響量を推論した値である。
【0059】
図11は、沈殿後水から処理水に至る過程で除去された窒素の除去率、すなわち窒素除去率を目的変数とした、水質影響量推論値22をウォーターフォールプロットとして可視化した例である。この例では、沈殿後水4wの有機性窒素濃度が12mg/Lであったことで、処理水5wの窒素除去率を2.21%pt上昇させる影響があったことや、生物反応槽5の温度(図中温度(℃)反応タンク混合液A)が18.6℃であったことで処理水5wの窒素除去率を0.64%pt低下させる影響があったことなどが推論されている。このような推論情報をもとに、水質管理対象の水質項目がどのような水質影響要因から、どれだけの水質影響量を受け、現在の水質となっているのかを把握することが可能となる。
【0060】
図12は水質影響要因を把握したいサンプルに加え、比較対象とするサンプルの水質影響量推論値22及び説明変数の値との差分、すなわち変化量を可視化した例である。縦軸は各水質影響要因及びカッコ内に説明変数の変化量を示したものである。横軸は水質影響要因毎の水質影響量推論値22の変化量を示している。このように変化量に注目することで、水質影響要因の値の増減と水質影響量推論値22の増減の関係の把握が可能となる。この例では、生物反応槽のDOが0.88mg/L低下したことで、窒素除去率が0.5%pt程度上がったことが推論されている。当然、水質管理対象の水質項目が悪化した場合の原因と対策の判断材料として、水質影響量推論値22を利用してもよい。また、最適学習方法出力部13の影響量評価で例示した、
図13からは、水質影響要因の値の変化と水質影響量推論値22の変化の定性的な関係を読み取ることもできる。
【0061】
以上のように、水質影響量推論値22を用いることで、これまで経験やノウハウの積み重ねが必要であった、水質影響要因の的確な把握に基づく水質管理が、それらに依らずデータに基づいて行えることになる。さらに水質影響要因の水質影響量を定量的に評価することも可能となり、より精密な水質管理を行うことが可能となる。
【0062】
水質最適化運転指標推論用データ取得部23では最適学習方法記憶部15に記憶された最適学習方法に基づき、データ蓄積部13から水質最適化運転指標推論用データが取得される。
【0063】
図6は水質最適化運転指標出力部24のフロー図である。水質最適化運転指標推論対象データ取得s26では、水質最適化運転指標推論用データ取得部23で取得された、水質最適化運転指標推論用データから水質最適化運転指標推論対象データが取得される。また、学習済みモデル取得s27では学習済みモデル記憶部18に記憶された学習済みモデルが取得される。なお、水質最適化運転指標推論対象データは、処理状態の季節変動を適切に評価できるよう、1年から数年間分のデータが用いられる。
【0064】
水質影響量推論器s28では、水質最適化運転指標推論対象データ及び学習済みモデルから、水質影響量推論器を用いて、水質影響量推論値データが推論される。水質最適化運転指標推論s29では、水質影響量推論器s28で推論された水質影響量推論値データから、水質最適化運転指標がさらに推論され、水質最適化運転指標推論出力s30で出力され、これは水質最適化運転指標26として、水質管理指標出力装置10の出力となる。
【0065】
水質最適化運転指標推論s29においては、水質影響量推論器28で推論された水質影響推論値データの全サンプルに対し、水質影響要因毎に、水質影響要因の値とその値における水質影響量推論値の平均値が算出され、両者の関係から水質を最適化する水質影響要因毎の望ましい値が推論される。以下、推論の方法を具体例で示す。
【0066】
図14は窒素除去率を目的変数とし、水質影響要因としてMLSSを対象とした場合の、MLSSの値と、その値に対応する水質影響量推論値の平均値の関係を可視化した例である。平均値の算出に当たっては適切な階級幅が設定されている。図中横軸はMLSSの値、縦軸は水質影響量推論値の平均値である。この例では、MLSSが1,400mg/L以下では水質影響量推論値の平均値はマイナスであり、窒素除去率にネガティブな影響を与える状態であることを示している。MLSSをさらに引き上げていくと、1,600mg/Lまで影響は横ばいだが、1,600mg/Lを超えると急激に上昇に転じ、窒素除去率が大きく上昇するポジティブな影響を与える状態に遷移することを示している。その後さらにMLSSを上昇させることでも窒素除去率の改善が見込まれるが、その効果は1,600mg/L前後での変化に比べると大きくない。そのため、MLSSを上昇させることで電力消費量が増大することなども加味し、この系におけるMLSSの水質最適化運転指標は、1,600~1,700mg/Lと推論される。
【0067】
図15は窒素除去率を目的変数とし、水質影響要因としてMLSSを対象とした場合の、水質影響要因の値と水質影響量推論値の散布図である。加えて各プロットの濃淡によって生物反応槽の温度も表現している。このようなプロットを用いることで、季節別の水質最適化運転指標を推論することが可能である。
図15から、広い温度範囲において1,600mg/L で大きく窒素除去率が上昇することが分かる。また、MLSSが1,600mg/L 以下の場合、温度が低いほど窒素除去率低下が大きく、低水温期にMLSSを下げることは窒素除去率低下のリスクが高いことが分かる。このような傾向から、低水温期はMLSS低下による窒素除去率低下リスクを避けるため、水質最適化運転指標範囲内でも、より高い値でMLSSを維持するべきであることも推論できる。
【0068】
以上のように、本発明により、下水処理における水質予測モデルを高精度で推定すること、処理状態の水質影響要因の定量的評価に基づく水質管理を行うこと、重要な水質影響要因の最適値の導出とそれを目標とした水質管理を行うこと、処理悪化の水質影響要因の定量的評価に基づき適切な対応を行うこと及びこれらを経験に依らず、蓄積してきたデータの活用から可能とすることができる。
【0069】
次に、水質影響量推論器の挙動について説明する。本実施形態においては、SHAP(SHapley Additive exPlanations)を用い水質影響量推論値を推論する。SHAPは、ゲーム理論の協力ゲームにおける利得の分配の一つの方法、シャープレイ値に基づく理論である。まずシャープレイ値の内容を説明する。
【0070】
次のような協力ゲームを設定する。特徴的な点は、人の組み合わせによって獲得賞金が変わることを想定していることである。このような設定のもと、3人で60万円の賞金を得た場合、公平に分けるにはどうすればよいか、ということを考える。
Aさんは、個人では20万円の賞金を獲得できる。
Bさんは、個人では10万円の賞金を獲得できる。
Cさんは、個人では5万円の賞金を獲得できる。
AさんとBさんが協力すると、36万円の賞金を獲得できる。
AさんとCさんが協力すると、22万円の賞金を獲得できる。
BさんとCさんが協力すると、26万円の賞金を獲得できる。
3人が協力すると、60万円の賞金を獲得できる。
【0071】
単純に個人戦の獲得賞金で分配するのではなく、協力状況で賞金が変わることを加味するために3人同時に参加する状況を、3人が順番に参加する事象(6通り)の重ね合わせと捉える。また、この時、プレーヤーが新たに加わることで賞金がいくら増えるか、すなわち限界貢献度に注目する。
【0072】
3人が参加する順番とその時の限界貢献度について、すべての場合について計算すると以下の通りとなる。
【0073】
参考にA、B、Cの順で参加する場合について説明する。0人0万円からAさん一人20万円に増額するので、Aさんの限界貢献度は20万円となる。ここにBさんが加わると、AさんとBさんの協力で36万円に増額するので、Bさんの限界貢献度は36-20=16万円となる。最後にCさんが加わると、60万円に増額するのでCさんの限界貢献度は60-36=24万円となる。
【0074】
3人で60万円を獲得する事象はこれらすべての場合の重ね合わせ、平均とみなせると考え、その時の各プレーヤーの獲得賞金をシャープレイ値と呼ぶ。
Aさんのシャープレイ値=(20+20+26+34+17+34)/6=25.166Bさんのシャープレイ値=(16+38+10+10+38+21)/6=22.166Cさんのシャープレイ値=(24+2+24+16+5+5)/6=12.666
【0075】
このようにシャープレイ値はプレーヤーの組み合わせも考慮した貢献度を評価できるものである。そこでこのプレーヤーを説明変数、獲得賞金を目的変数と捉え、機械学習に応用したものがSHAPである。本実施形態ではさらに説明変数を水質影響要因、目的変数を水質管理対象とする水質項目としている。
【0076】
SHAPでは、推論対象のデータに対して各説明変数を変化させたときの目的変数の予測結果の変化の度合いを基に、推論対象のデータの各説明変数の重要性、すなわち寄与度を定量化しようとするものである。この定量化された寄与度が、シャープレイ値に対応し、また本実施形態においては水質影響量推論値に対応する。
【0077】
より具体的には、推論対象データをa、目的変数を予測するための学習済みモデルをfとすると、推論対象となる説明変数x=a=(a
1、a
2、…、a
n)に対し、次式1で表されるような簡略化されたモデルgを、fに近似する近似モデルgとして生成する。
【数1】
【0078】
上式における複数の係数w=(w
0、w
1、…、w
n)が近似モデルgを表す近似モデルパラメータである。ここで、z(a)は、次式2で表される。
【数2】
【0079】
上式におけるδaiは、所謂クロネッカーのデルタである。すなわち、上式においては、説明変数x=(x1、x2、…、xn)のi番目の要素xiが、推論対象データのi番目の要素の値aiと等しい場合に1と、等しくない場合に0と、それぞれなるように設定されている。
【0080】
SHAPにおいては、local accuracy、missingness及びconsistencyの、3種類の性質を有することが、計算上での制約となる。local accuracyは、説明対象となる推論モデルfと、近似モデルg(f)の、説明変数xが推論対象データaと等しくx=aとなる場合の値は等しいという制約である。すなわち、推論対象x=a=(a
1、a
2、…、a
n)において、次式3が成立する。
【数3】
【0081】
missingnessは、存在しない説明因子ziの寄与度wiはゼロであるという制約である。すなわち、上記の式1において、zi(a)=0となるようなiに対して、wi=0が成立する。
【0082】
consistencyは、以下に説明するような制約である。まず、推論モデルfと近似モデルg(f)の間で、f(a)と、g(f)(z(a))が等しいとする。このとき、2つの推論モデルf
1、f
2に関し、次式4が成立する。
【数4】
ここで、z
(i)(a)は、上式2で表されるz(a)のうち、i番目の説明因子z
i(a)をゼロとしたベクトルである。すなわち、本制約は、2つの推論モデルf
1、f
2を比較したときに、i番目の説明因子が存在することによる推論モデルf
1の変化が推論モデルf
2の変化よりも大きければ、推論モデルf
1の、i番目の説明因子による貢献度合いw
i(f
1)は、推論モデルf
2の、i番目の説明因子による寄与度w
i(f
2)よりも大きいことを示すものである。
【0083】
上記の各制約を満足する寄与度w
i(f)は、次式5として表すように、一意に求めることができる。
【数5】
【0084】
式5において、|S|は、集合Sの元の数である。すなわち、i番目の要因を加えたときと加えなかったときの差を、全ての組み合わせの分だけ総和して平均したものとして、i番目の説明変数の寄与度は計算される。この寄与度、すなわち複数の係数w=(w0、w1、…、wn)が、近似モデルgを表す近似モデルパラメータである。
【0085】
このように、水質影響量推論器は、推論対象データと、当該推論対象データに関連する値を有する複数の関連データを基に、推論対象データに対して学習済みモデルを近似する近似モデルを生成し、近似モデルパラメータを生成する。近似モデルパラメータw=(w0、w1、…、wn)に関しては、i番目の計数wiの数値が大きな正の値となる場合に、i番目の変数xiの値がaiであることが、モデルfの結果がf(x)であることを強く支持していると解釈することができる。このため、近似モデルパラメータw=(w0、w1、…、wn)を、各説明変数が水質へ与える影響量、すなわち水質影響量推論値として適用可能である。
【0086】
以上の方法によって、水質影響量推論器は、推論対象のデータ及び学習済みモデルを入力として、上記近似モデルパラメータwを水質影響量推論値として出力する。
【0087】
以上、本発明の実施の形態および変形例について説明したが、本発明はこれらに限定されるものではない。本発明は、実施の形態および変形例が適宜組み合わされたもの、それに適宜変更が加えられたものを含む。
【産業上の利用可能性】
【0088】
本発明は下水処理における水質管理及び下水処理場の運転制御に利用できる。
【符号の説明】
【0089】
1:下水処理施設、2:沈砂池、3:揚水ポンプ設備、4:最初沈殿池、5:生物反応槽、6:最終沈殿池、7:消毒設備、8:送風機設備、9:汚泥処理設備、10:水質管理指標出力装置、11:施設運転データ、12:水質データ、13:データ蓄積部、14:最適学習方法出力部、15:最適学習方法記憶部
16:機械学習モデル推定用データ取得部、17:機械学習モデル推定部、18:学習済みモデル記憶部、19:水質影響量推論用データ取得部、20:水質影響量推論値出力部、21:水質影響量推論値記憶部、22:水質影響量推論値、23:水質最適化運転指標推論用データ取得部、24:水質最適化運転指標出力部、25:水質最適化運転指標記憶部、26:水質最適化運転指標
1w:場内返送水、2w:流入下水、3w:原水、4w:沈殿後水、5w:処理水、6w:放流水、1s:生汚泥、2s:反応槽混合液、3s:返送汚泥、4s:余剰汚泥
s1:目的変数決定、s2:仮説明変数抽出、s3:仮教師データ取得、s4:外れ値処理、s5:欠測値処理、s6:仮学習アルゴリズム決定、s7:ハイパーパラメータ調整、s8:仮学習済みモデル推定、s9:仮学習済みモデル予測値算出、s10:精度評価実施、s11:最適学習アルゴリズム出力、s12:水質影響量推論器、s13:影響量評価実施、s14:最適ハイパーパラメータ出力、s15:最適教師データ出力、s16:最適学習方法取得、s17:教師データ取得、s18:学習済みモデル推定、s19:学習済みモデル出力、s20:水質影響量推論対象データ取得、s21:学習済みモデル取得、s22:モデル予測値推論、s23:モデル予測値データ出力、s24:水質影響量推論器s25:水質影響量推論値データ出力、s26:水質最適化運転指標推論対象データ取得、s27:学習済みモデル取得、s28:水質影響量推論器、s29:水質最適化運転指標推論、s30:水質最適化運転指標出力