(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024156023
(43)【公開日】2024-10-31
(54)【発明の名称】放流水質予測装置および放流水質予測方法
(51)【国際特許分類】
G06Q 10/04 20230101AFI20241024BHJP
【FI】
G06Q10/04
【審査請求】有
【請求項の数】2
【出願形態】OL
(21)【出願番号】P 2024146639
(22)【出願日】2024-08-28
(62)【分割の表示】P 2020048360の分割
【原出願日】2020-03-18
(71)【出願人】
【識別番号】000003942
【氏名又は名称】日新電機株式会社
(71)【出願人】
【識別番号】504255685
【氏名又は名称】国立大学法人京都工芸繊維大学
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】黄 嵐
(72)【発明者】
【氏名】森本 充
(72)【発明者】
【氏名】竹原 輝巳
(72)【発明者】
【氏名】清滝 和雄
(72)【発明者】
【氏名】寶珍 輝尚
(57)【要約】
【課題】1つの予測モデルだけで放流水質の予測を可能とした放流水質予測装置を提供する。
【解決手段】放流水質予測装置(100)において、予測モデル生成部(103)は、リカレントニューラルネットワークのハイパーパラメータを変更しながら予測モデルを生成し、学習データセットの少なくとも一部の学習データを評価データとし、評価データを予測モデルに入力することによって得られる予測値と、検証データと、の誤差が所定値以下の予測モデルを、放流水質予測部(105)に設定する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
下水処理場に設置された複数のセンサから、前記下水処理場の放流水質を示す検出値の時系列データを取得するセンサ情報取得部と、
前記センサ情報取得部によって取得された前記時系列データを学習データとして記憶する学習データデータベースと、
前記センサ情報取得部によって取得された前記時系列データを直近データとして記憶する直近データデータベースと、
前記学習データデータベースに記憶される第1の所定時間分の学習データを学習データセットとし、第2の所定時間後の、前記複数のセンサの中の少なくとも1つの値を予測するための予測モデルを、前記学習データセットから生成する予測モデル生成部と、
前記直近データに、前記予測モデルを適用することにより、前記少なくとも1つの値を予測する放流水質予測部とを備え、
前記予測モデル生成部は、
前記学習データセットをトレーニングデータとし、
前記第2の所定時間後の、前記複数のセンサの中の少なくとも1つの実測値を検証データとし、
前記トレーニングデータおよび前記検証データを用いてリカレントニューラルネットワークに学習させることにより予測モデルを生成し、さらに、
前記予測モデル生成部は、
前記リカレントニューラルネットワークのハイパーパラメータを変更しながら予測モデルを生成し、
前記学習データセットの少なくとも一部の学習データを評価データとし、
前記評価データを前記予測モデルに入力することによって得られる予測値と、前記検証データと、の誤差が所定値以下の予測モデルを、前記放流水質予測部に設定する、放流水質予測装置。
【請求項2】
コンピュータが実行する放流水質予測方法であって、
下水処理場に設置された複数のセンサから、前記下水処理場の放流水質を示す検出値の時系列データを取得するステップと、
前記取得された時系列データを学習データとして記憶するステップと、
前記取得された時系列データを直近データとして記憶するステップと、
第1の所定時間分の前記学習データを学習データセットとし、第2の所定時間後の、前記複数のセンサの中の少なくとも1つの値を予測するための予測モデルを、前記学習データセットから生成するステップと、
前記直近データに、前記生成された予測モデルを適用することにより前記少なくとも1つの値を予測するステップとを含み、
前記予測モデルを、前記学習データセットから生成するステップにおいて、
前記学習データセットをトレーニングデータとし、
前記第2の所定時間後の、前記複数のセンサの中の少なくとも1つの実測値を検証データとし、
前記トレーニングデータおよび前記検証データを用いてリカレントニューラルネットワークに学習させることにより予測モデルを生成し、さらに
前記予測モデルを、前記学習データセットから生成するステップにおいて、
前記リカレントニューラルネットワークのハイパーパラメータを変更しながら予測モデルを生成し、
前記学習データセットの少なくとも一部の学習データを評価データとし、
前記評価データを前記予測モデルに入力することによって得られる予測値と、前記検証データと、の誤差が所定値以下の予測モデルを選択する、放流水質予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、下水処理場の複数のセンサからの時系列データに基づいて、放流水質を予測する技術に関する。
【背景技術】
【0002】
下水処理場の放流水質を予測する技術として、下記の特許文献1に開示された発明がある。この特許文献1は、水処理設備等のプラント設備の監視対象量を予測する技術に関する。
【0003】
一次予測部は、データ群、基準年間平均モデルおよび基準季節別平均モデルを用いて、ニューラルモデル、重回帰モデル、およびクラスタリングモデルを含む年間平均一次予測モデル群および季節別平均一次予測モデル群を生成する。そして、年間平均一次予測モデル群および季節別平均一次予測モデル群を用いて各予測モデルの監視対象量の予測値を予測結果データとして算出する。
【0004】
二次予測部は、稼働実績データ(年間実績データおよび季節別実績データ)を用いて基準二次予測モデルを生成する。そして、基準二次予測モデル、予測結果データおよび稼働実績データを用いて、監視対象量の年間および季節別の平均値を予測するための二次予測モデルを生成する。
【0005】
最後に、二次予測部は、監視対象予測値(予測結果データ)に重みを付与し、重みが付与された複数の監視対象量をノードとするニューラルネットワークを用いて監視対象量の予測値を算出する。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2013-161336号公報(2013年8月19日公開)
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、上述の特許文献1に開示された発明においては、一次予測部および二次予測部が、年間平均一次予測モデル群、季節別平均一次予測モデル群および二次予測モデルを生成し、2段階で予測処理を行う必要がある。
【0008】
本発明の一態様は、1つの予測モデルだけで放流水質の予測を可能とした放流水質予測装置を提供することを目的とする。
【課題を解決するための手段】
【0009】
上記の課題を解決するために、本発明の一態様に係る放流水質予測装置は、下水処理場に設置された複数のセンサから、前記下水処理場の放流水質を示す検出値の時系列データを取得するセンサ情報取得部と、前記センサ情報取得部によって取得された前記時系列データを学習データとして記憶する学習データデータベースと、前記センサ情報取得部によって取得された前記時系列データを直近データとして記憶する直近データデータベースと、前記学習データデータベースに記憶される第1の所定時間分の学習データを学習データセットとし、第2の所定時間後の、前記複数のセンサの中の少なくとも1つの値を予測するための予測モデルを、前記学習データセットから生成する予測モデル生成部と、前記直近データに、前記予測モデルを適用することにより、前記少なくとも1つの値を予測する放流水質予測部とを備え、前記予測モデル生成部は、前記学習データセットをトレーニングデータとし、前記第2の所定時間後の、前記複数のセンサの中の少なくとも1つの実測値を検証データとし、前記トレーニングデータおよび前記検証データを用いてリカレントニューラルネットワークに学習させることにより予測モデルを生成し、さらに、前記予測モデル生成部は、前記リカレントニューラルネットワークのハイパーパラメータを変更しながら予測モデルを生成し、前記学習データセットの少なくとも一部の学習データを評価データとし、前記評価データを前記予測モデルに入力することによって得られる予測値と、前記検証データと、の誤差が所定値以下の予測モデルを、前記放流水質予測部に設定する。
【0010】
また、上記の課題を解決するために、本発明の一態様に係る放流水質予測方法は、コンピュータが実行する放流水質予測方法であって、下水処理場に設置された複数のセンサから、前記下水処理場の放流水質を示す検出値の時系列データを取得するステップと、前記取得された時系列データを学習データとして記憶するステップと、前記取得された時系列データを直近データとして記憶するステップと、第1の所定時間分の前記学習データを学習データセットとし、第2の所定時間後の、前記複数のセンサの中の少なくとも1つの値を予測するための予測モデルを、前記学習データセットから生成するステップと、前記直近データに、前記生成された予測モデルを適用することにより前記少なくとも1つの値を予測するステップとを含み、前記予測モデルを、前記学習データセットから生成するステップにおいて、前記学習データセットをトレーニングデータとし、前記第2の所定時間後の、前記複数のセンサの中の少なくとも1つの実測値を検証データとし、前記トレーニングデータおよび前記検証データを用いてリカレントニューラルネットワークに学習させることにより予測モデルを生成し、さらに前記予測モデルを、前記学習データセットから生成するステップにおいて、前記リカレントニューラルネットワークのハイパーパラメータを変更しながら予測モデルを生成し、前記学習データセットの少なくとも一部の学習データを評価データとし、前記評価データを前記予測モデルに入力することによって得られる予測値と、前記検証データと、の誤差が所定値以下の予測モデルを選択する。
【発明の効果】
【0011】
本発明の一態様によれば、1つの予測モデルだけで放流水質を予測することが可能となる。
【図面の簡単な説明】
【0012】
【
図1】本発明の一実施形態に係る放流水質予測装置の概略構成を示す機能ブロック図である。
【
図2】前処理部によって加工された後の学習データの一例を示す図である。
【
図3】予測モデル生成部の処理手順を説明するためのフローチャートである。
【
図4】モデル生成部によって使用されるRNNのハイパーパラメータの調整項目例を示す図である。
【
図6】放流水質予測部の処理手順を説明するためのフローチャートである。
【
図7】放流水質データの予測を模式的に示す図である。
【
図8】CODの実測値と放流水質予測部によって予測されたCODの予測値とを示すグラフである。
【
図9】TNの実測値と放流水質予測部によって予測されたTNの予測値とを示すグラフである。
【
図10】TPの実測値と放流水質予測部によって予測されたTPの予測値とを示すグラフである。
【
図11】放流水質予測装置を実現するためのコンピュータの構成例を示す図である。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態について、詳細に説明する。なお、説明の便宜上、同一の部材には同一の符号を付し、それらの名称および機能も同一である。したがって、それらの詳細な説明は繰り返さない。
【0014】
(放流水質予測装置100の構成)
図1は、本発明の一実施形態に係る放流水質予測装置100の概略構成を示す機能ブロック図である。放流水質予測装置100は、センサ情報取得部101と、学習データデータベース102と、予測モデル生成部103と、直近データデータベース104と、放流水質予測部105と、出力部106とを含む。
【0015】
図示していないが、下水処理場には、ポンプ揚水量、返流流量、送気量、混合浮遊物濃度(MLSS(Mixed Liquor Suspended Solid))、溶存酸素濃度(DO(Dissolved Oxygen))、COD(Chemical Oxygen Demand)、TN(Total Nitrogen)(全窒素)、TP(Total Phosphorus)(全リン)などのデータ(検出値)を計測するためのセンサが設置されている。これらのセンサからのデータが、放流水質予測装置100に逐一送られる。
【0016】
COD、TNおよびTPは、下水処理場の放流水質を示す指標として知られている。そこで、以下、COD、TNおよびTPのそれぞれを計測する3つのセンサから送られるデータを放流水質データと呼ぶ。他方、上記3つのセンサ以外のセンサから送られるデータをセンサ情報データと呼ぶことにする。
【0017】
センサ情報取得部101は、センサ情報データおよび放流水質データを取得し、これらのデータに時間情報データ(年、月、日、曜日/祝日、および時刻)を付与して学習データを生成する。以下の説明において、センサ情報取得部101は、1分毎にセンサ情報データおよび放流水質データを取得することとするが、これに限定されるものではない。
【0018】
学習データデータベース102は、センサ情報取得部101によって生成された学習データを、学習に必要な期間、たとえば、1年以上の期間分だけ順次記憶する。本明細書では、この「学習に必要な期間」を「第1の所定時間」とも称する。
【0019】
予測モデル生成部103は、前処理部103aと、モデル生成部103bと、モデル変更部103cとを備えている。前処理部103aは、学習データデータベース102に蓄積されている学習データを、学習できる形式になるように加工する。
【0020】
図2は、前処理部103aによって加工された後の学習データの一例を示す図である。それぞれの学習データは、5項目の時間情報データ(年、月、日、曜日/祝日、および時刻)と、15項目のセンサ情報データ(ポンプ揚水量、返流流量、送気量、混合浮遊物濃度、および溶存酸素濃度など)と、3項目の放流水質データ(COD、TN、およびTP)とを含む。
【0021】
モデル生成部103bは、前処理部103aによって生成された学習データを用いて所定の更新周期ごとに再学習を行い、下水処理場の運転変更に対応した予測モデルを生成する。詳細は後述する。
【0022】
モデル変更部103cは、放流水質予測部105が予測処理を実行中であるか否かを判定する。予測処理が実行中でなければ、モデル変更部103cは、モデル生成部103bによって生成された予測モデルを最新の予測モデルとして更新する。
【0023】
直近データデータベース104は、センサ情報取得部101によって生成された学習データを予測に必要な期間、たとえば、1時間以上の期間分だけを順次記憶する。すなわち、直近データデータベース104は、1時間以上の最新の学習データを直近データとして常に記憶している。
【0024】
放流水質予測部105は、前処理部105aと、予測処理部105bと、後処理部105cとを備える。前処理部105aは、直近データデータベース104に蓄積されている直近データを、予測できる形式になるように加工する。
【0025】
予測処理部105bは、前処理部105aによって生成された直近データおよびモデル変更部103cによって更新された予測モデルを用いて、所定時間後(例:数時間後)の放流水質を予測する。詳細は後述する。以下では、当該所定時間が、2.5時間である場合を主に例示する。本明細書では、当該所定時間を「第2の所定時間」とも称する。
【0026】
後処理部105cは、予測処理部105bによって予測された放流水質を、出力可能な形式に変換する。
【0027】
出力部106は、放流水質予測部105によって生成された各種情報を、下水処理場の図示しない制御装置、表示装置などに出力する。
【0028】
(予測モデル生成部103の処理手順)
図3は、予測モデル生成部103の処理手順を説明するためのフローチャートである。まず、前処理部103aは、学習データデータベース102に蓄積されている学習データを取得する(ステップS1)。前処理部103aは、学習データの前処理を行う。より具体的には、前処理部103aは、学習データ内に欠測値または異常値がある場合には、当該欠測値または異常値を補間する(ステップS2)。
【0029】
ここで、欠測値とは、センサの点検等により計測値が正しく出力されていないときの値を意味する。また、異常値とは、センサの故障等により異常となっている値を意味する。これらは、たとえば、一定の範囲から値が外れているか否かによって判断される。
【0030】
前処理部103aは、学習データ内に欠測値または異常値がある場合、前後の時間の学習データの同じ項目の値を用いて、当該欠測値または異常値を補間してよい。あるいは、前処理部103aは、前週の同じ曜日の同じ時刻の同じ項目の値を用いて、当該欠測値または異常値を補間してもよい。
【0031】
次に、モデル生成部103bは、前処理部103aによって補間された後の学習データを用いて、複数の学習データセットを作成する。
図2に示すように、太線によって囲まれた24時間(1440点)分の学習データを1つの学習データセットとする。そして、1点(1行)下にずらした24時間分の学習データを次の学習データセットとする。このように、1点(1行)ずつ下にずらした学習データセットを順次作成してゆく。
【0032】
以下、24時間(1440点)分の学習データを1つの学習データセットとして説明するが、これは一例であって、それ以外の時間(点数)分の学習データを学習データセットとしてもよい。
【0033】
そして、モデル生成部103bは、予測モデルを作成する。本実施形態においては、時系列データを処理するために好適な回帰型ニューラルネットワーク、たとえば、リカレントニューラルネットワーク(Recurrent Neural Network)(以下、RNNと呼ぶ。)の学習手法を用いることとし、現行のハイパーパラメータを用いて予測モデルを作成する。
【0034】
図4は、モデル生成部103bによって使用されるRNNのハイパーパラメータの調整項目例を示す図である。ハイパーパラメータは、学習データセットの時間、エポック数、最適化関数、重み減衰係数、学習率の乗数、学習率の更新間隔、およびノード数などを含む。モデル生成部103bは、これらハイパーパラメータの値を順次調整しながら予測モデルを生成する。
【0035】
ハイパーパラメータの各項目は、
図4の右側に示すように調整範囲が決められており、これらの値に変更することが可能である。したがって、ハイパーパラメータの各項目の調整範囲のすべての組み合わせで予測モデルを作成することができる。なお、ハイパーパラメータは、
図4に示す項目に限られるものではなく、これ以外に層数、潜在変数の数、活性化関数等を含んでいても良い。
【0036】
モデル生成部103bは、
図4に示すハイパーパラメータの各項目の値を選択してRNN構造に適用することにより、パラメータの調整を行う。そして、RNNの機械学習手法、たとえば、BPTT(Back Propagation Through Time)法を適用し、調整したハイパーパラメータを使用して予測モデルを作成する(ステップS3)。
【0037】
また、RNNでは、過去の中間層出力を反映することが必ずしも容易ではないことが知られている。そこで、この問題を改善するために、LSTM(Long Short Term Memory)と呼ばれるネットワークを利用することも可能である。LSTMでは、RNNの中間層出力に対して、記憶期間の長さの概念が導入されているため、遠い過去の出力の影響を保持できる。
【0038】
また、GRU(Gated Recurrent Unit)という手法を用いることも可能である。GRUでは、入力ゲートと忘却ゲートとが更新ゲートとして、1つのゲートに統合されている。GRUによれば、長いステップ前の出来事の特徴の記憶を維持しやすくなる。
【0039】
次に、モデル生成部103bは、複数の学習データセットをトレーニングデータ、検証データおよび評価データに分割する。そして、モデル生成部103bは、トレーニングデータと検証データとを用い、ステップS3において作成された予測モデルで学習および検証を行い、予測値が学習データの実測値に近づくようにネットワークのパラメータを調整する(ステップS4)。
【0040】
この学習および検証について、再び
図2を参照しながら、詳細に説明する。モデル生成部103bは、
図2の太線によって示す学習データセットをトレーニングデータとし、2.5時間後のCODの値を検証データとする。そして、モデル生成部103bは、ステップS3において作成された予測モデルの入力層にトレーニングデータを設定し、出力層の検証データとして2.5時間後のCODの値を設定する。モデル生成部103bは、所定の学習手法(BPTT法、LSTM法、またはGRU法など)を用いて再学習を行うことにより、予測モデルを更新する。なお、検証データは、学習データセットの中の最新の時刻の学習データから2.5時間後のCODの値とする。
【0041】
図5は、予測モデルの生成を模式的に示す図である。学習データ201として学習データセットの各行の23項目(時間情報データ5項目+センサ情報データ15項目+放流水質データ3項目)がRNN層の入力層に入力され、2.5時間後のCODの値が検証データとして出力層に設定される。なお、入力層に入力されるのは時間情報データ5項目+センサ情報データ15項目の合計20項目だけであってもよい。
【0042】
RNN層202は、回帰型ニューラルネットワークであり、中間層の時間経過を考慮しなければならない。このため、RNN層202に、そのまま誤差逆伝播(BP)法を適用することができない。そのため、RNN層を、中間層出力を介して時間方向に展開することにより全結合層203を作成し、BP法が適用できる形式の予測モデル204を作成する。いわゆる、BPTT法が適用できるようにする。また、上述のLSTM法またはGRU法などの学習手法を用いるようにしてもよい。
【0043】
この予測モデル204に学習データ201の各行の項目を順次入力して予測値を計算し、予測値が検証データ(2.5時間後のCODの実測値)に近づくように、BPTT法などを用いてパラメータ(重み、バイアス)を調整することにより学習を行う。そして、学習データセットの行をずらしながら順次再学習を行ない、予測モデル204を更新する。
【0044】
図5の例では、CODを学習する場合について説明されている。但し、TNの値を学習する場合であれば、2.5時間後のTNの実測値を検証データとして学習すればよい。あるいは、TPを学習する場合であれば、2.5時間後のTPの実測値を検証データとして学習すればよい。また、放流水質データの上記3項目(COD、TN、およびTP)を一度に学習するのであれば、これら3項目の実測値を検証データとして学習すればよい。
【0045】
また、上記の例では、所定時間が「2.5時間」である場合を例示している。但し、所定時間はこれに限定されず、任意の時間であってもよい。
【0046】
次に、モデル生成部103bは、評価データを用い、ステップS4において調整した予測モデルで予測を行う。モデル生成部103bは、予測値と実測値との評価を行う(ステップS5)。ここでは、モデル生成部103bは、予測値と実測値との差を誤差として計算し、最大誤差を評価誤差として保存する。評価データとして、24時間の学習データセットの入力項目を全て用いてもよい。但し、学習データセット内の最も新しい時刻から数時間分の入力項目を抽出し、それを評価データとするようにしてもよい。
【0047】
次に、モデル生成部103bは、評価誤差が目標誤差以下であるか否かを判定する(ステップS6)。目標誤差とは、あらかじめ決められた値であり、予測モデル204が十分に学習しているか否かを判定するための値である。
【0048】
評価誤差が目標誤差よりも大きければ(ステップS6,No)、モデル生成部103bは、所定の更新時間を超えているか否かを判定する(ステップS10)。この所定の更新時間とは、十分な時間を経過しても評価誤差が小さくならなければ処理を終了するための時間であり、たとえば、数日程度の時間として設定される。
【0049】
所定の更新時間を超えていれば(ステップS10,Yes)、モデル生成部103bは、現在の学習データでは目標誤差以下の予測モデル204を作成することができないと判断し、予測モデル204の更新を行なわずに処理を終了する(ステップS11)。
【0050】
また、所定の更新時間を超えていなければ(ステップS10,No)、モデル生成部103bは、ステップS3に戻ってS3~S5の処理を繰り返すことになる。ここで、モデル生成部103bは、第1の設定時間だけ待った後に、ステップS3以降の処理を行う。この第1の設定時間は、1回の学習に必要な時間であり、データ量によっても異なるが、たとえば半日または1日の時間として設定される。
【0051】
モデル生成部103bがステップS3~S5を繰り返すことにより、
図4に示す様々な組み合わせのハイパーパラメータの予測モデル204を順次作成し、作成した予測モデル204を用いて学習データセットの学習を順次行ない、予測モデル204を順次更新してゆくことになる。
【0052】
評価誤差が目標誤差以下であれば(ステップS6,Yes)、モデル生成部103bは、予測モデル204を保存する(ステップS7)。この予測モデル204は、ハイパーパラメータの様々な組み合わせで生成された予測モデルの中で、最適に近い予測モデルであると言える。
【0053】
次に、モデル変更部103cは、放流水質予測部105が予測処理を実施中であるか否かを判定する(ステップS8)。放流水質予測部105が予測処理を実施中であれば(ステップS8,Yes)、モデル変更部103cは、第2の設定時間毎に放流水質予測部105の状態を確認する。この第2の設定時間とは、放流水質予測部105が1回の予測処理を実施するのに必要な時間であり、たとえば、数分程度の時間として設定される。
【0054】
放流水質予測部105が予測処理を実施中でなければ(ステップS8,No)、モデル変更部103cは、予測処理部105bが使用する予測モデル204を最新の予測モデル204に更新し(ステップS9)、処理を終了する。
【0055】
なお、所定の更新時間、第1の設定時間および第2の設定時間は任意の値が設定可能であり、下水処理場に設置されているセンサの数の変更および学習データのデータ量の変更等に応じて適切な値を設定するものとする。
【0056】
(放流水質予測部105の処理手順)
図6は、放流水質予測部105の処理手順を説明するためのフローチャートである。まず、前処理部105aは、所定の予測周期毎に直近データデータベース104に蓄積されている直近データを取得する(ステップS21)。前処理部103aは、学習データの前処理を行う。より具体的には、前処理部103aは、学習データ内に欠測値または異常値がある場合には、当該欠測値または異常値を補間する(ステップS22)。なお、欠測値、異常値およびそれらの値の補間方法については、予測モデル生成部103の前処理部103aにおいて説明したものと同様である。
【0057】
なお、
図6に示す処理は、所定の予測周期毎に再度行われる。この所定の予測周期とは、放流水質予測部105が1回の予測処理を実施するのに必要な時間であり、たとえば、数分程度の時間として設定される。この所定の予測周期は、任意の値を設定することが可能であり、学習データのデータ量の変更等に応じて適切な値を設定するものとする。
【0058】
次に、予測処理部105bは、前処理部105aによって補間された後の直近データを、予測モデル生成部103によって作成された予測モデル204に適用して、2.5時間後の放流水質データ(COD、TN、TP)の値を予測する(ステップS23)。
【0059】
図7は、放流水質データの予測を模式的に示す図である。直近データ205として学習データセットの各行の23項目(時間情報データ5項目+センサ情報データ15項目+放流水質データ3項目)が予測モデル204の入力層に入力される。予測モデル204は、2.5時間後のCODの値を予測し、出力データ206として出力する。
【0060】
同様にして、TNの予測用に作成された予測モデル204を用いて、2.5時間後のTNの値を予測することも可能である。また、TPの予測用に作成された予測モデル204を用いて、2.5時間後のTPを予測することも可能である。
【0061】
最後に、後処理部105cは、予測処理部105bによって予測された放流水質データ(予測結果)に対し、後処理を行う。具体的には、後処理部105cは、予測結果を出力部106が出力可能な形式に変換し(ステップS24)、処理を終了する。
【0062】
(予測結果の一例)
ある下水処理場において放流水質の予測を行った。データ数は4年8か月の1分データ(約245万データ)とし、入力データ種は20項目とし、出力データ種は3項目(COD、TNおよびTP)とした。また、学習データセットは、23項目(入力データ種(時間情報データを含む)+出力データ種)×12時間とした。機械学習手法としては、LSTM法を用いた。
【0063】
図8は、CODの実測値と放流水質予測部105によって予測されたCODの予測値とを示すグラフである。縦軸はCODの値を示し、横軸は時刻を示している。このグラフは、ある週の月曜日から日曜日までのCODの実測値および予測値を示している。
【0064】
図9は、TNの実測値と放流水質予測部105によって予測されたTNの予測値とを示すグラフである。また、
図10は、TPの実測値と放流水質予測部105によって予測されたTPの予測値とを示すグラフである。縦軸は、それぞれTNの値、TPの値を示し、横軸は時刻を示している。
図9・
図10のグラフはそれぞれ、ある週の月曜日から日曜日までの、TNの実測値および予測値と、TPの実測値および予測値とを示している。
【0065】
(効果)
以上説明したように、放流水質予測装置100によれば、モデル生成部103bが、学習データセットから所定時間後の放流水質データの実測値を検証データとして学習し、予測モデル204を作成するようにしたので、所定時間後の放流水質データを正確に予測することが可能となった。
図8~
図10のグラフに示すように、放流水質データ(COD、TN、TP)の実測値と予測値とがほぼ一致している。
【0066】
また、放流水質データの予測にRNNを用い、BPTT法、LSTM法、GRU法などの学習手法を適用するようにしたので、1つの予測モデルで放流水質データを予測することが可能となった。
【0067】
また、放流水質データの予測にRNNを用いるようにしたので、下水処理場の運転が変更された場合でも、ハイパーパラメータを変更して予測モデルを作成するだけで対応できるため、予測精度の低下を防止することが可能となった。
【0068】
また、モデル生成部103bが、様々なハイパーパラメータを用いて予測モデルを作成し、その中で評価誤差が少ない予測モデルを用いて放流水質データの予測を行なうようにしたので、放流水質データを正確に予測することが可能となった。
【0069】
〔ソフトウェアによる実現例〕
放流水質予測装置100の制御ブロック(特に予測モデル生成部103および放流水質予測部105)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
【0070】
後者の場合、放流水質予測装置100は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば1つ以上のプロセッサを備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0071】
〔コンピュータの構成例〕
図11は、本発明の一態様に係る放流水質予測装置(例:放流水質予測装置100)を実現するためのコンピュータの構成例を示す図である。このコンピュータは、コンピュータ本体300と、ディスプレイ401と、キーボード40と、マウス403とを含む。使用者は、ディスプレイ401に表示された画面を見ながらキーボード402およびマウス403を操作することにより、コンピュータ本体300を放流水質予測装置として機能させるためのプログラム(以下、放流水質予測プログラムと呼ぶ。)を起動する。
【0072】
コンピュータ本体300は、CPU301と、GPGPU(General-Purpose computing on Graphics Processing Units)302と、ブートプログラム等を記憶するROM303と、実行するプログラム、作業データ等を記憶するRAM304と、ハードディスク305と、DVD(Digital Versatile Disc)ドライブ306と、ネットワークI/F(Interface)307と、メモリポート308と、RTC(Real Time Clock)309とを含み、それぞれ内部バス310に接続されている。
【0073】
GPGPU302は、GPUの演算資源を画像処理以外の目的に応用したものであり、高い処理性能を有しているため、ニューラルネットワーク等の行列演算、最適化問題、暗号解読、音声処理などの幅広い分野で用いられている。
【0074】
放流水質予測プログラムは、DVD406、リムーバブルメモリ405などの記録媒体に記録されており、CPU301の制御により、DVDドライブ306またはメモリポート308を介してハードディスク305にインストールされる。また、放流水質予測プログラムは、公衆回線404およびネットワークI/F307を介してダウンロードされ、ハードディスク305にインストールされても良い。
【0075】
CPU301が、RAM304に記憶される放流水質プログラムを実行し、ネットワークI/F307および公衆回線404を介して下水処理場に設置された複数のセンサからのセンサ情報データおよび放流水質データを受信し、それらのデータにRTC309から取得した時刻情報データを付与して学習データを生成することにより、センサ情報取得部101を実現する。
【0076】
また、CPU301が、RAM304に記憶される放流水質プログラムを実行し、センサ情報取得部101によって生成された学習データをハードディスク305などに逐次記憶することにより、学習データデータベース102および直近データデータベース104を実現する。
【0077】
また、CPU301が、RAM304に記憶される放流水質プログラムを実行し、GPGPU302と共にRNNの学習などを行ない、予測モデル204を生成することにより、予測モデル生成部103を実現する。
【0078】
同様に、CPU301が、RAM304に記憶される放流水質予測プログラムを実行し、GPGPU302と共に直近データ205を予測モデル204に適用した演算を行なって予測データを生成することにより、放流水質予測部105を実現する。
【0079】
また、CPU301が、RAM304に記憶される放流水質予測プログラムを実行し、放流水質予測部105によって生成された各種情報を、ネットワークI/F307および公衆回線404を介して、下水処理場の図示しない制御装置、表示装置などに送信することにより、出力部106を実現する。
<備考>
[課題を解決するための手段]
【0080】
上記の課題を解決するために、本発明の一態様に係る放流水質予測装置は、下水処理場に設置された複数のセンサから、下水処理場の放流水質を示す検出値の時系列データを取得するセンサ情報取得部と、センサ情報取得部によって取得された時系列データを学習データとして記憶する学習データデータベースと、センサ情報取得部によって取得された時系列データを直近データとして記憶する直近データデータベースと、学習データデータベースに記憶される第1の所定時間分の学習データを学習データセットとし、第2の所定時間後の、複数のセンサの中の少なくとも1つの値を予測するための予測モデルを、学習データセットから生成する予測モデル生成部と、直近データに、予測モデルを適用することにより、少なくとも1つの値を予測する放流水質予測部とを備える。
【0081】
また、上記の課題を解決するために、本発明の一態様に係る放流水質予測方法は、下水処理場に設置された複数のセンサから、下水処理場の放流水質を示す検出値の時系列データを取得するステップと、取得された時系列データを学習データとして記憶するステップと、取得された時系列データを直近データとして記憶するステップと、第1の所定時間分の前記学習データを学習データセットとし、第2の所定時間後の、複数のセンサの中の少なくとも1つの値を予測するための予測モデルを、学習データセットから生成するステップと、直近データに、生成された予測モデルを適用することにより少なくとも1つの値を予測するステップとを含む。
【0082】
〔付記事項〕
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0083】
100 放流水質予測装置
101 センサ情報取得部
102 学習データデータベース
103 予測モデル生成部
104 直近データデータベース
105 放流水質予測部
201 学習データ
204 予測モデル
205 直近データ