(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-12-11
(45)【発行日】2023-12-19
(54)【発明の名称】水処理施設の操作量導出装置
(51)【国際特許分類】
C02F 1/00 20230101AFI20231212BHJP
G06N 20/00 20190101ALI20231212BHJP
【FI】
C02F1/00 D
G06N20/00
C02F1/00 V
(21)【出願番号】P 2020038479
(22)【出願日】2020-03-06
【審査請求日】2022-09-22
(73)【特許権者】
【識別番号】000006105
【氏名又は名称】株式会社明電舎
(74)【代理人】
【識別番号】110002077
【氏名又は名称】園田・小林弁理士法人
(72)【発明者】
【氏名】木村 雄喜
(72)【発明者】
【氏名】鮫島 正一
(72)【発明者】
【氏名】▲高▼倉 正佳
(72)【発明者】
【氏名】庭川 誠
(72)【発明者】
【氏名】深井 寛修
(72)【発明者】
【氏名】高▲瀬▼ 信彰
(72)【発明者】
【氏名】三宅 雄貴
【審査官】石岡 隆
(56)【参考文献】
【文献】特開2019-144631(JP,A)
【文献】特開2018-158284(JP,A)
【文献】特開2019-021032(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
C02F1/00
G05B23/00-23/02
G06N5/00-5/048、20/00-20/20
(57)【特許請求の範囲】
【請求項1】
第1のラベル付きデータと第1のラベルなしデータとを含むトレンドデータ及び第2のラベル付きデータと第2のラベルなしデータとを含む水質データを蓄積するデータ蓄積部と、
前記データ蓄積部に蓄積されたトレンドデータ及び水質データの双方から推定モデルのモデルパラメータ更新に用いる学習対象データを取得する学習対象データ取得部と、
前記データ蓄積部に蓄積されたトレンドデータ及び水質データの双方から操作量の導出に用いる推定対象データを取得する推定対象データ取得部と、
前記学習対象データ取得部からの前記学習対象データに含まれる前記第1、第2のラベル付きデータ及び前記第1、第2のラベルなしデータを用いて半教師あり学習を行うことで前記推定モデルのモデルパラメータを更新するモデルパラメータ更新部と、
前記モデルパラメータ更新部に更新されたモデルパラメータを学習パラメータとして記憶する学習パラメータ記憶部と、
前記推定対象データと、前記学習パラメータと、を用いて制御対象の操作量を導出する操作量導出部と、を備える水処理施設の操作量導出装置。
【請求項2】
主成分分析によりデータの次元を圧縮するデータ変換部を備え、
前記モデルパラメータ更新部は、自己訓練により半教師あり学習を行うことを特徴とする請求項
1に記載の水処理施設の操作量導出装置。
【請求項3】
前記モデルパラメータ更新部は、トランスダクティブSVMの半教師あり学習を行うことを特徴とする請求項
1に記載の水処理施設の操作量導出装置。
【請求項4】
前記モデルパラメータ更新部は、グラフベースの半教師あり学習を行うことを特徴とする請求項
1に記載の水処理施設の操作量導出装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、水処理施設の操作量導出装置に関する。
【背景技術】
【0002】
従来、水処理施設における水質の制御は、水処理施設の様々な状況を考慮して熟練の技術を有する運転員の操作により行われている。
しかしながら、運転員の高齢化及び当該技術の習熟に長期間を要するため、人工知能を用いて操作量を決定し、自動化したいという要請がある。
ここで、操作量は、主に、放流水に含まれるアンモニア濃度等の水質データに基づいて決定される。
【0003】
従来技術の一例である特許文献1には、モデルパラメータを自動調整することにより、専門知識を持たない運転員が下水処理場を運転した場合にも運転効率、運転コストなどを大幅に低減させ、流入水の水質を規定範囲内に納めることを可能にすることを課題とし、下水処理プロセスから出力される計測データ、水質分析員などの分析動作で得られる分析データなどをデータベース装置に蓄積しながら、モデルパラメータ設定部に設定されているモデルパラメータ、プラント条件設定部に設定されているプラント条件、運転条件設定部に設定されている運転条件、データベース装置から出力されるシミュレーション用データ、パラメータ同定用データなどに基づき、プロセスシミュレータにモデルパラメータを自動調整して、下水処理プロセスのシミュレーションを実行する技術が開示されている。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記の従来技術は、下水処理プロセスに設置されたセンサから得られるセンサ情報及び下水処理場において取得された水質分析結果情報等をはじめとして、シミュレーションのために、時系列に蓄えられた大量のデータを要する、という問題があった。
他方で、水処理施設における水質データを取得するための水質分析は、コスト及び時間を要するため、大量の水質データを揃えるためには多大なコストを要し、データ取得期間が長期に及んでしまう、という問題があった。
【0006】
本発明は、上記に鑑みてなされたものであって、蓄積されたデータ量が少ない場合であっても、高い精度で操作量の導出が可能な技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
上述の課題を解決して目的を達成する本発明は、トレンドデータ及び水質データを蓄積するデータ蓄積部と、前記データ蓄積部に蓄積されたトレンドデータ及び水質データから学習対象データ及び推定対象データの双方をともに取得する学習対象データ及び推定対象データ取得部と、学習対象データ及び推定対象データ取得部からの前記学習対象データ及び前記推定対象データに含まれるラベル付きデータ及びラベルなしデータの双方をともに圧縮するデータ圧縮部と、前記データ圧縮部により圧縮された圧縮済みデータのうち前記学習対象データに対応する部分を取得する学習対象データ取得部と、前記学習対象データ取得部からの圧縮済みの学習対象データを用いて半教師あり学習を行うことで、学習モデル及び学習モデルに基づく学習パラメータを生成する推定モデル生成部と、前記推定モデル生成部で生成された前記学習パラメータを記憶する学習パラメータ記憶部と、前記データ圧縮部により圧縮された圧縮済みデータのうち前記推定対象データに対応する部分を取得する推定対象データ取得部と、前記推定対象データ取得部からの前記圧縮済みデータのうち前記推定対象データに対応する部分に含まれる推定対象の説明変数と、前記学習パラメータ記憶部に記憶された前記学習パラメータと、を用いて制御対象の操作量を導出する操作量導出部と、を備える水処理施設の操作量導出装置である。
【0008】
又は、本発明は、トレンドデータ及び水質データを蓄積するデータ蓄積部と、前記データ蓄積部に蓄積されたトレンドデータ及び水質データから推定モデルのモデルパラメータ更新に用いる学習対象データを取得する学習対象データ取得部と、前記データ蓄積部に蓄積されたトレンドデータ及び水質データから操作量の導出に用いる推定対象データを取得する推定対象データ取得部と、前記学習対象データ取得部からの前記学習対象データを用いて学習することで前記推定モデルのモデルパラメータを更新するモデルパラメータ更新部と、前記モデルパラメータ更新部に更新されたモデルパラメータを学習パラメータとして記憶する学習パラメータ記憶部と、前記推定対象データと、前記学習パラメータと、を用いて制御対象の操作量を導出する操作量導出部と、を備える水処理施設の操作量導出装置である。
【0009】
上記構成の本発明において、主成分分析によりデータの次元を圧縮するデータ変換部を備え、前記モデルパラメータ更新部は、部分最小二乗により半教師あり学習を行うとよい。
【0010】
上記構成の本発明において、前記モデルパラメータ更新部は、トランスダクティブSVMの半教師あり学習を行うとよい。
【0011】
上記構成の本発明において、前記モデルパラメータ更新部は、グラフベースの半教師あり学習を行うとよい。
【発明の効果】
【0012】
本発明によれば、蓄積されたデータ量が少ない場合であっても、高い精度で操作量の導出ができる。
【図面の簡単な説明】
【0013】
【
図1】
図1は、実施形態1に係る水処理施設の操作量導出装置を適用可能な水処理施設の構成を示す図である。
【
図2】
図2は、実施形態1に係る水処理施設の操作量導出装置の構成を示すブロック図である。
【
図3】
図3は、学習対象データ及び推定対象データから操作量を出力するまでの操作量導出装置の動作イメージを説明する図である。
【
図4】
図4は、
図3に対応した動作を示すフローチャートである。
【
図5】
図5は、実施形態2に係る水処理施設の操作量導出装置の構成を示すブロック図である。
【
図6】
図6は、学習対象データ及び推定対象データから操作量を出力するまでの操作量導出装置の動作を示すフローチャートである。
【
図7】
図7は、モデルパラメータ更新部の構成を示すブロック図である。
【
図8】
図8は、モデルパラメータ更新部が行う自己訓練による半教師あり学習の流れを示すフローチャートである。
【
図9】
図9は、実施形態2における自己訓練による半教師あり学習の動作イメージを説明する図である。
【
図10】
図10は、実施形態3におけるトランスダクティブSVMによる2クラス分類の半教師あり学習の動作イメージを説明する図である。
【
図11】
図11は、実施形態4におけるグラフベースによる2クラス分類の半教師あり学習の動作イメージを説明する図である。
【発明を実施するための形態】
【0014】
以下、添付図面を参照して、本発明を実施するための形態について説明する。
ただし、本発明は、以下の実施形態の記載によって限定解釈されるものではない。
【0015】
(実施形態1)
図1は、本実施形態に係る水処理施設の操作量導出装置100を適用可能な水処理施設200の構成を示す図である。
図1に示す水処理施設200は、最初沈殿池1と、反応槽2と、最終沈殿池3と、送風機4と、風量調整バルブ5と、散気装置6と、第1のポンプ7と、第2のポンプ8と、計測器9と、重力濃縮槽10と、機械濃縮槽11と、消化槽12と、脱水槽13と、配管21,22,23,24とを備える。
【0016】
最初沈殿池1は、原水が導入される沈殿池である。
この原水は、有機物を含む排水である。
最初沈殿池1では、原水の固液分離が行われ、最初沈殿池1からの流出水は、配管21を通して反応槽2に送られる。
最初沈殿池1に沈殿した汚泥である生汚泥は、配管24を通して重力濃縮槽10に送られる。
【0017】
反応槽2は、微生物を含み、該微生物によって最初沈殿池1からの流出水を浄化する槽である。
反応槽2では、該微生物が最初沈殿池1からの流出水に含まれる有機物を資化することで増殖し、該微生物を用いた生物処理により活性汚泥が形成される。
反応槽2からの流出水は、配管22を通して最終沈殿池3に送られる。
【0018】
最終沈殿池3は、反応槽2からの流出水に含まれる活性汚泥を沈殿させる沈殿池である。
最終沈殿池3の上澄みは、処理水として水処理施設200の外へ放出される。
最終沈殿池3で沈殿した汚泥の一部は、第1のポンプ7によって配管23を通して反応槽2に戻されて再利用される。
最終沈殿池3で沈殿した残りの汚泥は、余剰汚泥として第2のポンプ8によって機械濃縮槽11に送られる。
【0019】
送風機4は、複数の散気装置6に空気を供給する。
風量調整バルブ5は、複数の散気装置6の各々に通した配管に設けられており、開閉により送風量を調整する。
複数の散気装置6は、反応槽2の下部に設けられており、風量調整バルブ5に通された配管に接続されて、風量調整バルブ5によって送風量が調整された空気を反応槽2内に供給する。
このように反応槽2への送風量が調整されると、反応槽2内の溶存酸素量であるDO(Dissolved Oxygen)値が調整され、生物処理の進行が調整される。
【0020】
第1のポンプ7は、最終沈殿池3で沈殿した汚泥の一部を、配管23を通して反応槽2に送る返送汚泥ポンプである。
第2のポンプ8は、最終沈殿池3で沈殿した残りの汚泥を余剰汚泥として機械濃縮槽11に送る余剰汚泥引抜ポンプである。
【0021】
計測器9は、反応槽2の水質を示す各パラメータを計測する計測器であり、計測したパラメータである計測値データは操作量導出装置100に送られる。
ここで、水質を示す各パラメータとしては、溶存酸素量であるDO値及び浮遊物質濃度であるMLSS(Mixed Liquor Suspended Solids)値を例示することができる。
水処理施設200の運転員は、計測器9によって計測された水質を示す各パラメータを参照することで制御対象の操作量を決定している。
ここで、制御対象の操作量としては、水処理施設200の最終沈殿池3からの返送汚泥量を調整する第1のポンプ7の回転数、水処理施設200の最終沈殿池3の余剰汚泥引抜量を調整する第2のポンプ8の単位時間あたりの引抜量又は余剰汚泥の引抜時間、水処理施設200の脱水槽13への高分子凝集剤の注入率を例示することができる。
【0022】
重力濃縮槽10は、最初沈殿池1に沈殿した生汚泥を濃縮処理する槽である。
機械濃縮槽11は、第2のポンプ8によって最終沈殿池3から引き抜かれた余剰汚泥を濃縮処理する槽である。
重力濃縮槽10及び機械濃縮槽11において濃縮された汚泥は、消化槽12に送られる。
【0023】
消化槽12は、濃縮された汚泥の消化処理を行う槽である。
ここで、消化処理は、例えば嫌気性消化処理方式によって行われるとよい。
嫌気性消化処理方式では、嫌気性微生物によって有機性の汚泥が分解される。
消化処理によって分解された汚泥は、脱水槽13に送られる。
【0024】
脱水槽13は、消化処理によって分解された汚泥を脱水することで、汚泥の含水率を低下させて減容化を行う槽である。
【0025】
配管21は、最初沈殿池1と反応槽2との間に配置され、最初沈殿池1からの流出水を反応槽2に送る配管である。
配管22は、反応槽2と最終沈殿池3との間に配置され、反応槽2からの流出水を最終沈殿池3に送る配管である。
配管23は、第1のポンプ7と反応槽2との間に配置され、最終沈殿池3の汚泥の一部を反応槽2に送る配管である。
配管24は、最初沈殿池1と重力濃縮槽10との間に配置され、最初沈殿池1の生汚泥を重力濃縮槽10に送る配管である。
【0026】
図1に示す水処理施設200において、主な操作項目は、最初沈殿池1から反応槽2への水量である流入量、反応槽2内に供給される空気量である送風量、第1のポンプ7によって反応槽2に返送される汚泥の量である返送汚泥量、及び第2のポンプ8によって最終沈殿池3から引き抜かれる汚泥の量である余剰汚泥引抜量である。
これらの操作項目の各々は、処理場によって設定が異なる。
【0027】
反応槽2の制御は、例えば、送風量一定制御、比率一定制御及びDO一定制御によって行うことが可能である。
ここで、送風量一定制御は、目標送風量値として設定された一定の送風量となるように行う制御である。
また、比率一定制御は、最初沈殿池1から反応槽2への流入量に応じた送風量となるように、すなわち流入量と送風量との比率が一定となるように行う制御である。
また、DO一定制御は、反応槽2のDO値が設定された目標DO値となるように行う制御である。
【0028】
また、主な操作項目は、返送汚泥量の調整では第1のポンプ7の回転数であり、余剰汚泥引抜量の調整では単位時間あたりの引抜量又は余剰汚泥の引抜時間であり、脱水処理では高分子凝集剤の注入率である。
本実施形態に係る操作量導出装置100は、これらの操作項目を決める際の操作量を導出対象とする。
そして、運転員は、水処理施設の操作量導出装置100によって導出された操作量により制御対象を操作する。
このように操作量導出装置100を用いて制御対象の操作量が決定されることで、勘、経験及びノウハウを有していない者を運転員とすることが可能となる。
【0029】
図2は、本実施形態に係る水処理施設の操作量導出装置100の構成を示すブロック図である。
図2に示す水処理施設の操作量導出装置100は、データ蓄積部101と、学習対象データ及び推定対象データ取得部102と、データ圧縮部103と、学習部110と、操作量導出部120と、を備える。
【0030】
データ蓄積部101は、計測器9により計測された計測値データを取得し、トレンドデータ及び水質データとして蓄積する。
トレンドデータとしては、最初沈殿池1における汚泥引抜量である生汚泥引抜量、反応槽2におけるMLSS、反応槽2に送られた最終沈殿池3で沈殿した汚泥の一部である返送汚泥の返送汚泥濃度、返送汚泥の流量である返送汚泥流量、最終沈殿池3から引き抜かれる汚泥の量である余剰汚泥引抜量、返送汚泥ポンプである第1のポンプ7の回転数、余剰汚泥の流量である余剰汚泥流量、及び各層における堆積汚泥と上澄みとの境界の水深位置である最終沈殿池汚泥界面を例示することができる。
水質データとしては、NH4濃度、NO2濃度、NO3濃度及びPO4濃度を例示することができる。
なお、データ蓄積部101は、半導体メモリ又は磁気ディスク等の記録媒体により実現することができる。
【0031】
学習対象データ及び推定対象データ取得部102は、データ蓄積部101に蓄積されたトレンドデータ及び水質データから学習対象データ及び推定対象データの双方をともに取得する。
なお、学習対象データ及び推定対象データ取得部102は、MPU(Micro-Processing Unit)又はCPU(Central Processing Unit)等のプロセッサと、半導体メモリ又は磁気ディスク等の記録媒体とを組み合わせて実現することができる。
【0032】
データ圧縮部103は、学習対象データ及び推定対象データ取得部102からの学習対象データ及び推定対象データを合わせてデータ圧縮することでデータを低次元化する。
なお、データ圧縮部103は、MPU又はCPU等のプロセッサと、半導体メモリ又は磁気ディスク等の記録媒体とを組み合わせて実現することができる。
【0033】
学習部110は、学習対象データ取得部111と、推定モデル生成部112と、学習パラメータ記憶部113と、を備える。
学習対象データ取得部111は、データ圧縮部103により圧縮された、圧縮済みのデータから学習対象データに対応する部分を取得する。
推定モデル生成部112は、学習対象データ取得部111からの圧縮済みの学習対象データを用いて学習モデル及び学習モデルに基づく学習パラメータを生成する。
学習パラメータ記憶部113は、推定モデル生成部112からの学習パラメータを記憶する。
なお、学習対象データ取得部111及び推定モデル生成部112は、MPU又はCPU等のプロセッサと、半導体メモリ又は磁気ディスク等の記録媒体とを組み合わせて実現することができる。
また、学習パラメータ記憶部113は、半導体メモリ又は磁気ディスク等の記録媒体により実現することができる。
【0034】
操作量導出部120は、推定対象データ取得部121と、操作量導出部122と、操作量出力部123と、を備え、推定対象データ及び学習パラメータを用いて導出した制御対象の操作量を出力する。
推定対象データ取得部121は、データ圧縮部103により圧縮された、圧縮済みのデータから推定対象データに対応する部分を取得する。
操作量導出部122は、推定対象データ取得部121からの圧縮済みの推定対象データに含まれる推定対象の説明変数と、学習パラメータ記憶部113に記憶された学習パラメータと、を用いて制御対象の操作量を導出する。
なお、推定対象データ取得部121及び操作量導出部122は、MPU又はCPU等のプロセッサと、半導体メモリ又は磁気ディスク等の記録媒体とを組み合わせて実現することができる。
操作量出力部123は、操作量導出部122が導出した制御対象の操作量を出力することで、運転員に制御対象の操作量を提示する。
なお、操作量出力部123が運転装置に対して制御対象の操作量を出力し、該運転装置がこの操作量に基づいて自動運転する構成とすることも可能である。
【0035】
ここで、操作量導出装置100の動作について説明する。
図3は、学習対象データ及び推定対象データから操作量を出力するまでの操作量導出装置100の動作イメージを説明する図である。
図4は、
図3に対応した動作を示すフローチャートである。
なお、
図3においては、データ圧縮には主成分分析(PCA:Principal Component Analysis)が用いられ、学習モデルには部分最小二乗(PLS:Partial Least Squares)が用いられている。
【0036】
学習処理では、まず、データ蓄積部101にトレンドデータ及び水質データが蓄積される(S1)。
そして、学習対象データ及び推定対象データ取得部102は、データ蓄積部101に蓄積されたデータから学習対象データ及び推定対象データをともに取得する(S2)。
ここで、トレンドデータ及び水質データの双方について、ラベル付きデータ及びラベルなしデータを合わせて取得することが重要である。
ラベル付きデータは、実際に運転員により設定された操作量と対応した水質データ及びトレンドデータであり、目的関数及び説明変数の双方を含む。
ラベルなしデータは、操作量と対応していない水質データ及びトレンドデータであり、目的関数を含まず説明変数を含む。
操作量と対応していない水質データ及びトレンドデータは、例えば、システム導入後間もない推定時直近におけるデータである。
【0037】
データ圧縮部103は、学習対象データ及び推定対象データ取得部102により取得されたラベル付きデータ及びラベルなしデータの双方を含む全データをPCAにより圧縮することで低次元化する(S3)。
これにより、圧縮後に得られる圧縮済みのデータは、操作量と対応したラベル付きの過去のデータのみならず、操作量と対応していないラベルなしの直近のデータを反映したものになる。
このように圧縮することで、システム導入後の操作量の推定に、直近の水質データ及びトレンドデータを反映させることができる。
次に、学習対象データ取得部111は、データ圧縮部103が圧縮した圧縮済みのデータからラベル付きデータに対応する部分を取得する(S4)。
次に、推定モデル生成部112は、学習対象データ取得部111が取得したラベル付きデータに対応する部分を説明変数としてPLSにより推定モデルを生成する(S5)。
次に、学習パラメータ記憶部113は、推定モデル生成部112が生成した推定モデルのパラメータを学習パラメータとして記憶する(S6)。
【0038】
推定対象データ取得部121は、データ圧縮部103が圧縮した圧縮済みのデータから推定対象である部分を取得する(S7)。
操作量導出部122は、学習パラメータ記憶部113に記憶された学習パラメータを用いた推定モデルに対して推定対象データを入力することで、制御対象の操作量を導出する(S8)。
導出された操作量は、操作量出力部123から出力されて(S9)制御対象の操作に用いられる。
【0039】
一般に、水処理施設における水質データを取得するための水質分析は、コスト及び時間を要し、取得可能な水質データは、年間に100件弱程度までに留まる。
また、季節の変化及び水処理施設の運用方針の変更によっても水質データは変化するため、人工知能の機械学習によって操作量を導出する際に、その時点における適切な教師データが質及び量の双方において不足することが懸念される。
適切な教師データが不足する状況における推定は、学習モデルを構築して導入した後においても、水処理施設内の汚泥流量及び汚泥濃度等のオンラインデータ並びに水質分析により取得される水質データの双方を可能な限り取り入れることを要する。
本実施形態において説明したように、半教師あり学習を適用することで、適切な教師データが不足している状況においても、蓄積されたデータ量が少ない場合であっても、高い精度でリアルタイムに操作量の導出が可能となる。
【0040】
(実施形態2)
実施形態1では、半教師あり学習としてPCA及びPLSを用いた形態を説明し、本発明はこれに限定されるものではなく、本実施形態では、半教師あり学習として自己訓練(Self-training)を用いる形態について説明する。
【0041】
なお、本実施形態において、推定対象の操作量である目的変数については、離散化した値が想定されている。
例えば、DO設定値については、0.1mg/L単位で操作量を調整することが一般的である。
そのため、ここでは、操作量を下げることを示す(-0.1)と、現状維持することを示す(0)と、操作量を上げることを示す(+0.1)と、の3値、又は、これらに操作量を更に下げることを示す(-0.2)と、操作量を更に上げることを示す(+0.2)と、を加えた5値を推定するものとすると、多クラス分類問題として取り扱うことが可能である。
また、余剰汚泥引抜量、生汚泥引抜量等についても一定範囲の整数値で操作量が設定されることが一般的であり、DO設定値と同様に、多クラス分類問題として取り扱うことが可能である。
【0042】
図5は、本実施形態に係る水処理施設の操作量導出装置150の構成を示すブロック図である。
図5に示す水処理施設の操作量導出装置150は、データ蓄積部151と、データ変換部152と、学習対象データ取得部161と、モデルパラメータ更新部162と、学習パラメータ記憶部163と、推定対象データ取得部171と、操作量導出部172と、操作量出力部173と、を備える。
【0043】
データ蓄積部151は、計測器9により計測された計測値データを取得し、トレンドデータ及び水質データとして蓄積する。
トレンドデータとしては、最初沈殿池1における汚泥引抜量である生汚泥引抜量、反応槽2におけるMLSS、反応槽2に送られた最終沈殿池3で沈殿した汚泥の一部である返送汚泥の返送汚泥濃度、返送汚泥の流量である返送汚泥流量、最終沈殿池3から引き抜かれる汚泥の量である余剰汚泥引抜量、返送汚泥ポンプである第1のポンプ7の回転数、余剰汚泥の流量である余剰汚泥流量、及び各層における堆積汚泥と上澄みとの境界の水深位置である最終沈殿池汚泥界面を例示することができる。
水質データとしては、NH4濃度を例示することができる。
なお、データ蓄積部151は、半導体メモリ又は磁気ディスク等の記録媒体により実現することができる。
【0044】
学習対象データ取得部161は、データ蓄積部151に蓄積された水質データ及びトレンドデータから、推定モデルのモデルパラメータ更新に必要な学習データを取得する。
データ変換部152は、学習対象データ取得部161からの学習対象データを学習可能なデータに加工及び変換し、推定対象データ取得部171からの推定対象データを推定可能なデータに加工及び変換する。
モデルパラメータ更新部162は、データ変換部152からの変換済み学習対象データを用いて推定モデルのモデルパラメータを更新するとともに学習パラメータとしてモデルパラメータを生成する。
学習パラメータ記憶部163は、モデルパラメータ更新部162からの学習パラメータを記憶する。
なお、学習対象データ取得部161及びモデルパラメータ更新部162は、MPU又はCPU等のプロセッサと、半導体メモリ又は磁気ディスク等の記録媒体とを組み合わせて実現することができる。
また、学習パラメータ記憶部163は、半導体メモリ又は磁気ディスク等の記録媒体により実現することができる。
【0045】
推定対象データ取得部171は、データ蓄積部151に蓄積された水質データ及びトレンドデータから、操作量導出に必要な推定対象データを取得する。
操作量導出部172は、データ変換部152からの変換済み推定対象データと、学習パラメータ記憶部163に記憶された学習パラメータと、を用いて制御対象の操作量を導出する。
なお、推定対象データ取得部171及び操作量導出部172は、MPU又はCPU等のプロセッサと、半導体メモリ又は磁気ディスク等の記録媒体とを組み合わせて実現することができる。
操作量出力部173は、操作量導出部172が導出した制御対象の操作量を出力することで、運転員に制御対象の操作量を提示する。
なお、操作量出力部173が運転装置に対して制御対象の操作量を出力し、該運転装置がこの操作量に基づいて自動運転する構成とすることも可能である。
【0046】
ここで、操作量導出装置150の動作について説明する。
図6は、学習対象データ及び推定対象データから操作量を出力するまでの操作量導出装置150の動作を示すフローチャートである。
【0047】
学習処理では、まず、データ蓄積部151にトレンドデータ及び水質データが蓄積される(S11)。
そして、学習対象データ取得部161は、データ蓄積部151に蓄積されたデータから学習対象データを取得する(S12)。
ここで、トレンドデータ及び水質データの双方について、ラベル付きデータ及びラベルなしデータを合わせて取得することが重要である。
ラベル付きデータは、実際に運転員により設定された操作量と対応した水質データ及びトレンドデータであり、目的関数及び説明変数の双方を含む。
ラベルなしデータは、操作量と対応していない水質データ及びトレンドデータであり、目的関数を含まず説明変数を含む。
操作量と対応していない水質データ及びトレンドデータは、例えば、システム導入後間もない推定時直近におけるデータである。
【0048】
データ変換部152は、学習対象データ取得部161により取得されたラベル付きデータ及びラベルなしデータの双方を含む全データのうち学習対象データを学習可能な形に加工及び変換する(S13)。
ここで、データの加工及び変換は必要に応じて行えばよく、加工及び変換の手法としては、主成分分析、因子分析及び独立性分分析等によるデータの次元の圧縮を例示することができる。
次に、モデルパラメータ更新部162は、学習可能な形の学習対象データにより半教師あり学習を行うことで推定モデルのパラメータを更新する(S14)。
ここで、推定モデルのパラメータの形態は、使用する学習手法により異なる。
次に、学習パラメータ記憶部163は、モデルパラメータ更新部162が更新した推定モデルのパラメータを学習パラメータとして記憶する(S15)。
【0049】
次に、推定対象データ取得部171は、データ蓄積部151に蓄積されたデータから推定対象データを取得する(S16)。
データ変換部152は、推定対象データ取得部171により取得されたラベル付きデータ及びラベルなしデータの双方を含む全データのうち推定対象データを推定可能な形に加工及び変換する(S17)。
なお、推定可能な形に加工及び変換する手法は、学習可能な形に加工及び変換する手法と同様である。
操作量導出部172は、学習パラメータ記憶部163に記憶された学習パラメータを用いた推定モデルに対して推定対象データを入力することで、制御対象の操作量を導出する(S18)。
導出された操作量は、操作量出力部173から出力されて(S19)制御対象の操作に用いられることになる。
【0050】
ここで、本実施形態では、モデルパラメータ更新部162が行う半教師あり学習として、自己訓練を適用する。
自己訓練においては、推定結果とともにその推定結果の信頼性を表す推定確度を出力する分類器により操作量の導出を行うことを前提とし、推定確度P(y|x,θ)が設定したしきい値以上であるデータを逐次学習データに取り込みつつ、再帰的に判別を繰り返す。
【0051】
図7は、モデルパラメータ更新部162の構成を示すブロック図である。
図7に示すモデルパラメータ更新部162は、データ抽出部1621と、データ有無判定部1622と、操作量推定部1623と、推定確度判定部1624と、ラベル付与部1625と、更新パラメータ生成部1626と、を備える。
図8は、モデルパラメータ更新部162が行う自己訓練による半教師あり学習の流れを示すフローチャートである。
まず、データ抽出部1621は、学習データからラベルなしデータを抽出し(S21)、データ有無判定部1622は、ラベルなしデータがあるか否かを判定する(S22)。
ラベルなしデータがある場合(S22:Y)には、操作量推定部1623は、ラベルなしデータのすべての操作量を推定し(S23)、推定確度判定部1624は、推定確度がしきい値以上のデータがあるか否かを判定する(S24)。
モデルパラメータ更新部162は、ラベルなしデータがない場合(S22:N)には学習を終了する。
推定確度がしきい値以上のデータがある場合(S24:Y)には、ラベル付与部1625は、推定確度がしきい値以上のデータにラベルを付与して学習データに追加し(S25)、更新パラメータ生成部1626が更新パラメータを生成することで、モデルパラメータが更新されて(S26)、S1に戻る。
モデルパラメータ更新部162は、推定確度がしきい値以上のデータがない場合(S24:N)には学習を終了する。
【0052】
図9は、本実施形態における自己訓練による半教師あり学習の動作イメージを説明する図である。
図9においては、DO設定値について、-0.1mg/Lと、±0.0mg/Lと、+0.1mg/Lとの3値を想定している。
ここで、例えば、操作量を下げることを示す(-1)と、現状維持することを示す(0)と、操作量を上げることを示す(+1)と、の分類でモデルとしてロジスティック回帰モデルを選択した場合、推定確度P(y|x,θ)は以下の式(1)で表される。
【0053】
【0054】
推定確度P(y=1|x,θ)が設定したしきい値以上の場合には操作量を上げるクラス1のデータとして学習データに追加し、推定確度P(y=-1|x,θ)が設定したしきい値以上の場合には操作量を下げるクラス-1のデータとして学習データに追加し、推定確度P(y=0|x,θ)が設定したしきい値以上の場合には操作量を変更しないクラス0のデータとして学習データに追加する。
このように、推定確度の高いデータをラベル付き学習データに追加して再学習を繰り返すことにより、
図9の左側に示す初期状態では少ないラベル付き学習データから生成されていた推定モデルの信頼性が高まっていき、
図9の右側に示す学習完了時では多くのラベル付き学習データから生成された信頼性の高いモデルが構築される。
【0055】
以上説明したように、半教師あり学習として自己訓練(Self-training)を用いることで、蓄積されたデータ量が少ない場合であっても、高い精度で操作量の導出ができる。
【0056】
(実施形態3)
実施形態1では、半教師あり学習としてPCA及びPLSを用いた形態を説明し、実施形態2では、半教師あり学習として自己訓練を用いる形態について説明したが、本発明はこれらに限定されるものではない。
本実施形態では、半教師あり学習としてトランスダクティブSVM(Transductive SVM(Support Vector Machine))を用いる形態について説明する。
なお、本実施形態に係る操作量導出装置は、
図5に示す操作量導出装置150であり、半教師あり学習の手法のみが異なる。
【0057】
なお、本実施形態では、説明の簡略化のために、操作量を下げることを示す(DO設定値-0.1mg/L)と、操作量を上げることを示す(DO設定値+0.1mg/L)と、の2クラス分類とする。
【0058】
図10は、本実施形態におけるトランスダクティブSVMによる2クラス分類の半教師あり学習の動作イメージを説明する図である。
ここでは、目的関数及び説明変数を含むラベル付きデータと、目的関数を含まず説明変数を含むラベルなしデータと、に対してトランスダクティブSVMを適用する。
なお、必要に応じて、トランスダクティブSVMを適用する前処理としてデータ変換部152によってデータの加工及び変換を行うとよい。
ここで、加工及び変換の手法としては、主成分分析、因子分析及び独立性分分析等によるデータの次元の圧縮を例示することができる。
また、
図10(a)にはラベル付きデータのみによる分離境界面を含む初期状態が示され、
図10(b)にはラベル付きデータ及びラベルなしデータの双方による分離境界面を含む学習完了時が示されている。
【0059】
学習対象データの全てがラベル付きデータである通常のSVMでは、学習データ(xi,yi)(yi∈{-1,1},1≦i≦n)が与えられたとき、以下の式(2)で示す最小化問題により分離境界面の位置を示すパラメータw,bを決定する。
【0060】
【0061】
ただし、||w||はwのユークリッドノルムを表し、φ(xi)はSVMのカーネルによる決定される高次元空間へのxiの写像を表し、Cはソフトマージンパラメータを表す。
トランスダクティブSVMでは、最小化する関数は、以下の式(3)に示すように、ラベルなしデータを含む。
【0062】
【0063】
ここで、学習データ(xi,yi)(yi∈{-1,1},1≦i≦l)は、操作量と紐付けられたラベル付きデータを表し、xi(l+1≦i≦n)は、操作量と紐付けられていないラベルなしデータを表し、C1,C2はハイパーパラメータを表す。
上記の式(3)においては第3項によって、ラベルなしデータに対しては判別関数の出力w・φ(xi)+bが1又は-1に近づくようにパラメータが決定される。
すなわち、ラベルの分からないデータについては、判定結果が明確に分離されるように分離境界面のパラメータw,bが決定される。
これにより、ラベル付きデータについてはラベルを正しく判別し、ラベルなしデータについてはその分布を反映して判別を行うことが可能となる。
ハイパーパラメータC1,C2は、各々ラベル付きデータ又はラベルなしデータの重みを調整するものであり、ハイパーパラメータC1を大きくするとラベル付きデータを重視した操作量の導出が行われ、ハイパーパラメータC2を大きくするとラベルなしデータを重視した操作量の導出が行われることになる。
【0064】
以上説明したように、半教師あり学習としてトランスダクティブSVM(Transductive SVM(Support Vector Machine))を用いることで、蓄積されたデータ量が少ない場合であっても、高い精度で操作量の導出ができる。
【0065】
(実施形態4)
実施形態1では、半教師あり学習としてPCA及びPLSを用いた形態を説明し、実施形態2では、半教師あり学習として自己訓練を用いる形態について説明し、実施形態3では、半教師あり学習としてトランスダクティブSVMを用いた形態を説明したが、本発明はこれらに限定されるものではない。
本実施形態では、半教師あり学習としてグラフベース(Graph-based)の半教師あり学習を用いる。
なお、本実施形態に係る操作量導出装置は、
図5に示す操作量導出装置150であり、半教師あり学習の手法のみが異なる。
【0066】
ここで、本実施形態では、モデルパラメータ更新部162が行う半教師あり学習として、グラフベースの半教師あり学習を適用する。
なお、本実施形態では、説明の簡略化のために、実施形態3と同様に、操作量を下げることを示す(DO設定値-0.1mg/L)と、操作量を上げることを示す(DO設定値+0.1mg/L)と、の2クラス分類とする。
【0067】
図11は、本実施形態におけるグラフベースによる2クラス分類の半教師あり学習の動作イメージを説明する図である。
ここでは、ラベル付きデータ及びラベルなしデータを含むすべてのデータに対してグラフベースの半教師あり学習を適用する。
なお、必要に応じて、グラフベースの半教師あり学習を適用する前処理としてデータ変換部152によってデータの加工及び変換を行うとよい。
また、
図11(a)には推定前の状態が示され、
図11(b)には推定後の状態が示されている。
【0068】
まず、モデルパラメータ更新部162は、ラベル付きデータ及びラベルなしデータを含むすべてのデータに対してデータ間の類似度を計算し、このデータ間の類似度がモデルパラメータとなる。
【0069】
ここで、類似度の計算例について説明する。
モデルパラメータ更新部162は、学習対象データ取得部161からの2つのベクトルxi=(xi
1,xi
2,…,xi
D)及びxj=(xj
1,xj
2,…,xj
D)に対し、類似度wijを以下の式(4)により定義する。
【0070】
【0071】
ここで、σd(1≦d≦D)はハイパーパラメータを表す。
このように、モデルパラメータ更新部162が学習により得た類似度は、学習パラメータとして学習パラメータ記憶部163に記憶される。
モデルパラメータ更新部162は、学習パラメータ記憶部163に記憶されたパラメータにより、ラベル付きデータのラベル情報をラベルなしデータに伝搬させてラベルなしデータのラベルを推定する。
具体的には、ラベル付きデータを(xi,yi)(yi∈{-1,1},1≦i≦l)とし、ラベルなしデータをxi(l+1≦i≦l+u)とすると、類似度を表す行列W及び対角行列Dは以下の式(5)で表される。
【0072】
【0073】
このとき、ラベルなしデータのラベルは以下の式(6)で推定される。
【0074】
【0075】
ただし、fl=(yi)(yi∈{-1,1},1≦i≦l)は、ラベル付きデータからなるl次元ベクトルであり、特に、2値の操作量導出を行う場合には、fuの正負により判別が可能である。
上記の式(6)におけるラベルなしデータに対する推定結果fuは、以下の式(7)のLを最小化することで導かれる。
【0076】
【0077】
すなわち、ラベル付きデータ及びラベルなしデータを合わせたデータ全体として類似度の高いデータは同じラベルとなるようラベルなしデータのラベルである操作量が決定される。
【0078】
以上説明したように、半教師あり学習としてグラフベース(Graph-based)の半教師あり学習を用いることで、蓄積されたデータ量が少ない場合であっても、高い精度で操作量の導出ができる。
【0079】
なお、実施形態1~4において、ラベル付きデータ及びラベルなしデータの双方を含む全データを処理する際には、必ずしも全データを処理する必要はなく、ラベル付きデータ及びラベルなしデータの双方が含まれており、処理が可能であれば、全データのうち一部が欠落していてもよい。
【0080】
また、本発明は、上述の実施形態に限定されるものではなく、上述の構成に対して、構成要素の付加、削除又は転換を行った様々な変形例も含むものとする。
【符号の説明】
【0081】
1 最初沈殿池
2 反応槽
3 最終沈殿池
4 送風機
5 調整バルブ
6 散気装置
7 第1のポンプ
8 第2のポンプ
9 計測器
10 重力濃縮槽
11 機械濃縮槽
12 消化槽
13 脱水槽
21,22,23,24 配管
100 操作量導出装置
101 データ蓄積部
102 学習対象データ及び推定対象データ取得部
103 データ圧縮部
110 学習部
111 学習対象データ取得部
112 推定モデル生成部
113 学習パラメータ記憶部
120 操作量導出部
121 推定対象データ取得部
122 操作量導出部
123 操作量出力部
150 操作量導出装置
151 データ蓄積部
152 データ変換部
161 学習対象データ取得部
162 モデルパラメータ更新部
163 学習パラメータ記憶部
171 推定対象データ取得部
172 操作量導出部
173 操作量出力部
200 水処理施設
1621 データ抽出部
1622 データ有無判定部
1623 操作量推定部
1624 推定確度判定部
1625 ラベル付与部
1626 更新パラメータ生成部