(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-01
(45)【発行日】2024-07-09
(54)【発明の名称】教師データ更新装置、推定モデル構築装置および教師データ更新方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20240702BHJP
B01D 21/01 20060101ALI20240702BHJP
B01D 21/30 20060101ALI20240702BHJP
C02F 1/00 20230101ALI20240702BHJP
【FI】
G06N20/00 130
B01D21/01 B
B01D21/30 A
C02F1/00 T
C02F1/00 K
(21)【出願番号】P 2020213987
(22)【出願日】2020-12-23
【審査請求日】2023-06-22
(73)【特許権者】
【識別番号】000001052
【氏名又は名称】株式会社クボタ
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】権 大維
(72)【発明者】
【氏名】鈴木 伸和
(72)【発明者】
【氏名】布 光昭
【審査官】多賀 実
(56)【参考文献】
【文献】特開2019-087012(JP,A)
【文献】特開2020-086778(JP,A)
【文献】特開2019-028824(JP,A)
【文献】特開2013-025367(JP,A)
【文献】特開2020-154825(JP,A)
【文献】米国特許出願公開第2012/0284213(US,A1)
【文献】圓佛 伊智朗 外3名,「ニューラルネットを用いたプラント運転ルールの抽出に関する研究」,電気学会論文誌D,社団法人電気学会,1991年01月20日,第111巻, 第1号,pp.20-28
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-20/00
B01D 21/01
B01D 21/30
C02F 1/00
G06Q 50/06
(57)【特許請求の範囲】
【請求項1】
説明変数から目的変数を推定する推定モデルを構築するための教師データの集合を更新する教師データ更新装置であって、
前記説明変数は、浄水施設に流入する流入水の水質を含むデータであり、
前記目的変数は、前記流入水へ注入する凝集剤の注入率であり、
初期の前記集合に含まれる前記教師データは、実際に前記流入水へ注入された前記凝集剤の前記注入率である実績値を前記目的変数とする第1実績データであり、
(1)前記推定モデルが推定した前記注入率の推定値を前記目的変数とする推定データ、並びに、(2)前記実績値を前記目的変数とする、前記第1実績データおよび前記推定データのいずれとも異なる第2実績データ、の少なくとも一方を前記教師データとして前記集合に追加するデータ追加部と、
所定条件が満たされるように、前記集合から前記推定データの少なくとも一部を除外するデータ除外部と、を備える、教師データ更新装置。
【請求項2】
前記所定条件は、前記第1実績データの、前記集合に含まれる全ての前記教師データに占める割合が所定値以上となることである、請求項1に記載の教師データ更新装置。
【請求項3】
前記データ除外部は、前記データ追加部による追加が行われてから前記推定モデルの再構築が開始されるまでの間に、前記所定条件が満たされるか否かを判定する、請求項1または2に記載の教師データ更新装置。
【請求項4】
前記データ除外部は、前記集合に含まれる全ての前記第1実績データとの類似度が相対的に高い前記推定データほど優先して除外対象とする、請求項1から3のいずれか1項に記載の教師データ更新装置。
【請求項5】
前記類似度は、前記推定データと、前記集合に含まれる全ての前記第1実績データの重心との距離に応じて定められる、請求項4に記載の教師データ更新装置。
【請求項6】
前記データ除外部は、前記集合が前記推定データを含まない状態に至ったとき、前記集合から除外する対象を前記第1実績データに切り替える、請求項1から5のいずれか1項に記載の教師データ更新装置。
【請求項7】
前記第2実績データが得られたときの前記流入水は、前記第1実績データが得られたときの前記流入水より後に前記浄水施設に流入したものであり、
前記第2実績データの前記説明変数である前記水質を含むデータは、前記第1実績データの前記説明変数である前記水質を含むデータが取り得る数値範囲に含まれない値である、請求項1から6のいずれか1項に記載の教師データ更新装置。
【請求項8】
請求項1から7のいずれか1項に記載の教師データ更新装置と、前記教師データ更新装置が更新した前記集合に含まれる前記教師データを用いて前記推定モデルを構築するモデル構築部を備える推定モデル構築装置と、を備える凝集剤の注入率を推定する薬注率推定システム。
【請求項9】
前記推定モデルは、第1推定モデル、および、前記第1推定モデルと異なる第2推定モデルを含み、
請求項7に記載の教師データ更新装置が更新した前記集合に含まれる全ての前記第1実績データと、前記水質を含むデータが前記数値範囲に含まれる前記推定データとをクラスタリングして複数のクラスタを生成し、当該生成された複数のクラスタ毎に前記第1推定モデルを構築する第1モデル構築部と、
前記教師データ更新装置が更新した前記集合に含まれる全ての前記第2実績データと、前記水質を含むデータが前記数値範囲に含まれない前記推定データとを用いて、前記第2推定モデルを構築する第2モデル構築部と、を備える、推定モデル構築装置。
【請求項10】
前記第1モデル構築部は、前記第1推定モデルとして非線形回帰モデルを構築し、
前記第2モデル構築部は、前記第2推定モデルとして線形回帰モデルを構築する、請求項9に記載の推定モデル構築装置。
【請求項11】
説明変数から目的変数を推定する推定モデルを構築するための教師データの集合を更新する教師データ更新装置が実行する教師データ更新方法であって、
前記説明変数は、浄水施設に流入する流入水の水質を含むデータであり、
前記目的変数は、前記流入水へ注入する凝集剤の注入率であり、
初期の前記集合に含まれる前記教師データは、実際に前記流入水へ注入された前記凝集剤の前記注入率である実績値を前記目的変数とする第1実績データであり、
(1)前記推定モデルが推定した前記注入率の推定値を前記目的変数とする推定データ、並びに、(2)前記実績値を前記目的変数とする、前記第1実績データおよび前記推定データのいずれとも異なる第2実績データ、の少なくとも一方を前記教師データとして前記集合に追加するデータ追加ステップと、
所定条件が満たされるように、前記集合から前記推定データの少なくとも一部を除外するデータ除外ステップと、を含む、教師データ更新方法。
【請求項12】
説明変数から目的変数を推定する推定モデルを構築するための教師データの集合を更新する
教師データ更新装置が実行する教師データ更新工程であって、
前記説明変数は、浄水施設に流入する流入水の水質を含むデータであり、
前記目的変数は、前記流入水へ注入する凝集剤の注入率であり、
初期の前記集合に含まれる前記教師データは、実際に前記流入水へ注入された前記凝集剤の前記注入率である実績値を前記目的変数とする第1実績データであり、
(1)前記推定モデルが推定した前記注入率の推定値を前記目的変数とする推定データ、並びに、(2)前記実績値を前記目的変数とする、前記第1実績データおよび前記推定データのいずれとも異なる第2実績データ、の少なくとも一方を前記教師データとして前記集合に追加するデータ追加工程と、
所定条件が満たされるように、前記集合から前記推定データの少なくとも一部を除外するデータ除外工程と、
を含む、教師データ更新工程と、
前記教師データ更新装置が更新した前記集合に含まれる前記教師データを用いて
推定モデル構築装置が前記推定モデルを構築するモデル構築工程と、
を含む、凝集剤の注入率を推定する薬注率推定方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、浄水施設に流入する流入水へ注入する凝集剤の注入率を推定するための推定モデルの生成に用いる教師データの集合を更新する教師データ更新装置などに関する。
【背景技術】
【0002】
特許文献1には、浄水施設における自動運転制御システムが開示されている。具体的には、特許文献1には、浄水施設に流入した流入水の水質などから、算出式を用いて水質の安全性に係る評価指標を算出し、算出された評価指標に基づいて機器の運転を制御する技術が開示されている。また、特許文献1には、評価指標が操作量算出式の適用範囲を超えた場合、作業員の手動介入モードに自動的に切り替える技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1の技術では、算出式の更新が行われないため、自動制御を開始してからの時間経過に伴う環境変化などの要因により、算出式の信頼度が低下するおそれがある。算出式の信頼度が低下すると、作業員の手動介入の頻度が増え、作業員の負担が増加するおそれがある。この問題は、例えば、凝集剤の注入操作に関する操作量算出において発生する。
【0005】
本発明の一態様は、浄水施設への流入水に対する凝集剤の注入に関する推定において、浄水施設の作業員等の負担を軽減することができる実現する教師データ更新装置などを提供することを目的としている。
【課題を解決するための手段】
【0006】
上記の課題を解決するために、本発明の一態様に係る教師データ更新装置は、説明変数から目的変数を推定する推定モデルを構築するための教師データの集合を更新する教師データ更新装置であって、前記説明変数は、浄水施設に流入する流入水の水質を含むデータであり、前記目的変数は、前記流入水へ注入する凝集剤の注入率であり、初期の前記集合に含まれる前記教師データは、実際に前記流入水へ注入された前記凝集剤の前記注入率である実績値を前記目的変数とする第1実績データであり、(1)前記推定モデルが推定した前記注入率の推定値を前記目的変数とする推定データ、並びに、(2)前記実績値を前記目的変数とする、前記第1実績データおよび前記推定データのいずれとも異なる第2実績データ、の少なくとも一方を前記教師データとして前記集合に追加するデータ追加部と、所定条件が満たされるように、前記集合から前記推定データの少なくとも一部を除外するデータ除外部と、を備える。
【0007】
推定モデルが推定した推定値は、浄水施設の作業員等が実際に注入した凝集剤の注入率である実績値と比較して、信頼度が低いのが通常である。よって、推定データを教師データとして再利用するために教師データの集合に単に追加していくだけでは、信頼度が低い推定データの前記集合に占める割合が時間経過につれて増加するため、そのような集合を用いて再構築される推定モデルの推定精度は時間経過につれて低下する。これに対して、前記の構成によれば、所定条件が満たされるように、教師データの集合から、推定データの少なくとも一部を除外する。これにより、推定データの前記集合に占める割合が増加一辺倒ではなくなる(言い換えれば、第1実績データおよび第2実績データの前記集合に占める割合が減少一辺倒ではなくなる)ため、再構築される推定モデルの推定精度の維持または低下抑制を実現することができる。結果として、推定モデルが推定した推定値をそのまま実績値として適用できる可能性が高まるので、浄水施設の作業員等の負担を軽減することができる。
【0008】
また、本発明の一態様に係る教師データ更新装置では、前記所定条件は、前記第1実績データの、前記集合に含まれる全ての前記教師データに占める割合が所定値以上となることであってもよい。
【0009】
前記の構成によれば、第1実績データの割合が常に所定値以上となるように集合から推定データの少なくとも一部が除外されるので、再構築される推定モデルの推定精度の維持または低下抑制を実現することができる。結果として、推定モデルが推定した推定値をそのまま実績値として適用できる可能性が高まるので、浄水施設の作業員等の負担を軽減することができる。
【0010】
また、本発明の一態様に係る教師データ更新装置では、前記データ除外部は、前記データ追加部による追加が行われてから前記推定モデルの再構築が開始されるまでの間に、前記所定条件が満たされるか否かを判定してもよい。
【0011】
前記の構成によれば、推定データおよび第2実績データの少なくとも一方を集合に追加されてから推定モデルの再構築が開始されるまでの間に、所定条件が満たされるように推定データが除外される。よって、推定モデルの再構築が開始される時点において、所定条件は満たされている。ここで、所定条件として、集合に含まれる教師データの上限数を定める条件が規定されている場合、推定モデルの再構築が開始される時点において、集合に含まれる教師データは上限数を超えない。この場合、推定モデルの再構築にかかる処理負荷の増大を抑制することができる。
【0012】
また、本発明の一態様に係る教師データ更新装置では、前記データ除外部は、前記集合に含まれる全ての前記第1実績データとの類似度が相対的に高い前記推定データほど優先して除外対象としてもよい。
【0013】
一般的に、浄水施設に流入する流入水の水質は、長期間に渡って略一定であることはなく、時間経過に伴う気象変動および環境変動等に起因して、徐々に或いは時に急激に変化することが通常である。そのため、初期の推定データは第1実績データとの類似度が高い傾向にある一方で、時間経過に伴って集合に含まれる第1実績データの割合が低下するにつれて、後から追加される推定データほど第1実績データとの類似度が低くなる傾向が生じる。つまり、時間経過に伴って、集合内には、第1実績データとの類似度が相対的に低い推定データの数が増えやすい。
【0014】
ここで、上述したとおり、推定モデルが推定した推定値の信頼度は、浄水施設の作業員等が実際に注入した実績値の信頼度より低い。よって、推定データは第1実績データより信頼度が低いデータではあるが、その中でも、第1実績データとの類似度が相対的に高い推定データほど第1実績データとの差が小さいため教師データとしての価値が相対的に低く、一方、第1実績データとの類似度が相対的に低い推定データほど第1実績データとの差が大きいため教師データとしての価値が相対的に高いといえる。したがって、集合において第1実績データとの類似度が相対的に低い推定データの占める割合は高い方が望ましい。
【0015】
前記の構成によれば、集合に含まれる全ての第1実績データとの類似度が相対的に高い推定データほど優先して除外される。これにより、時間経過につれて、集合において第1実績データとの類似度が相対的に低い推定データの占める割合が徐々に高くなる。その結果、集合内の教師データの全体としての価値を相対的に向上させることができる。したがって、再構築される推定モデルの推定精度を向上させることができる。
【0016】
また、本発明の一態様に係る教師データ更新装置では、前記類似度は、前記推定データと、前記集合に含まれる全ての前記第1実績データの重心との距離に応じて定められてもよい。
【0017】
前記の構成によれば、前記距離に応じて前記類似度を定めるので、簡易な演算により類似度を求めることができる。なお、前記距離は、ユークリッド距離であってもマハラノビス距離であってもよい。
【0018】
また、本発明の一態様に係る教師データ更新装置では、前記データ除外部は、前記集合が前記推定データを含まない状態に至ったとき、前記集合から除外する対象を前記第1実績データに切り替えてもよい。
【0019】
推定データを教師データの集合から除外していくと、最終的に、集合は、推定データを含まず、第1実績データおよび第2実績データのみを含む状態となる。第1実績データは初期の集合から存在する古いデータであり最新の集合においては教師データとしての価値が相対的に低くなっている。よって、上記の状態になってからは、第1実績データを除外することにより、集合内の教師データの全体としての価値を相対的に向上させることができる。結果として、再構築される推定モデルの推定精度の低下を抑制することができる。
【0020】
また、本発明の一態様に係る教師データ更新装置では、前記第2実績データが得られたときの前記流入水は、前記第1実績データが得られたときの前記流入水より後に前記浄水施設に流入したものであり、前記第2実績データの前記説明変数である前記水質を含むデータは、前記第1実績データの前記説明変数である前記水質を含むデータが取り得る数値範囲に含まれない値であってもよい。
【0021】
上述したとおり、一般的に、浄水施設に流入する流入水の水質は、長期間に渡って略一定であることはなく、時間経過に伴う気象変動および環境変動等に起因して、徐々に或いは時に急激に変化することが通常である。よって、水質を含むデータが、過去に浄水施設に流入した流入水のデータが取り得る数値範囲に含まれない流入水が、時間経過に伴い浄水施設に流入し得る。
【0022】
前記の構成によれば、そのような新たな前記水質を含むデータを説明変数とする第2実績データを、教師データの集合に含めることができる。これにより、集合内の教師データの全体としての価値を相対的に向上させることができる。結果として、再構築される推定モデルの推定精度を向上させることができる。
【0023】
また、本発明の一態様に係る推定モデル構築装置は、前記教師データ更新装置が更新した前記集合に含まれる前記教師データを用いて前記推定モデルを構築するモデル構築部を備えてもよい。
【0024】
前記の構成によれば、教師データ更新装置が更新する集合に含まれる教師データを用いて推定モデルを構築することができる。よって、推定精度の低下が抑制された推定モデルを生成することができる。
【0025】
また、本発明の一態様に係る推定モデル構築装置では、前記推定モデルは、第1推定モデル、および、前記第1推定モデルと異なる第2推定モデルを含み、前記教師データ更新装置が更新した前記集合に含まれる全ての前記第1実績データと、前記水質を含むデータが前記数値範囲に含まれる前記推定データとをクラスタリングして複数のクラスタを生成し、当該生成された複数のクラスタ毎に前記第1推定モデルを構築する第1モデル構築部と、前記教師データ更新装置が更新した前記集合に含まれる全ての前記第2実績データと、前記水質を含むデータが前記数値範囲に含まれない前記推定データとを用いて、前記第2推定モデルを構築する第2モデル構築部と、を備えてもよい。
【0026】
前記の構成によれば、第1実績データと、水質を含むデータが前記数値範囲に含まれる推定データとから複数の第1推定モデルを構築し、また、第2実績データと、水質を含むデータが前記数値範囲に含まれない推定データとから第2推定モデルを構築する。これにより、流入水の水質に応じて、異なる推定モデルを用いた推定が行えるので凝集剤の注入率の推定精度を向上させることができる。
【0027】
また、本発明の一態様に係る推定モデル構築装置では、前記第1モデル構築部は、前記第1推定モデルとして非線形回帰モデルを構築し、前記第2モデル構築部は、前記第2推定モデルとして線形回帰モデルを構築してもよい。
【0028】
第1実績データと推定データとから構築される回帰モデルにおいて、流入水の水質を含むデータと凝集剤の注入率との相関関係は非線形であることが、出願人の検証により見出された。このため、前記の構成によれば、線形回帰モデルの場合と比べて、注入率の推定精度を向上させることができる。
【0029】
また、説明変数である水質を含むデータが、第1実績データの説明変数である水質を含むデータの数値範囲に含まれない第2実績データから構築される回帰モデルは、いわゆる外挿に強い線形回帰モデルであるので、時間経過に伴い水質が変化した流入水に対する凝集剤の注入率を適切に推定することができる。
【0030】
また、上記の課題を解決するために、本発明の一態様に係る教師データ更新方法は、説明変数から目的変数を推定する推定モデルを構築するための教師データの集合を更新する教師データ更新装置が実行する教師データ更新方法であって、前記説明変数は、浄水施設に流入する流入水の水質を含むデータであり、前記目的変数は、前記流入水へ注入する凝集剤の注入率であり、初期の前記集合に含まれる前記教師データは、実際に前記流入水へ注入された前記凝集剤の前記注入率である実績値を前記目的変数とする第1実績データであり、(1)前記推定モデルが推定した前記注入率の推定値を前記目的変数とする推定データ、並びに、(2)前記実績値を前記目的変数とする、前記第1実績データおよび前記推定データのいずれとも異なる第2実績データ、の少なくとも一方を前記教師データとして前記集合に追加するデータ追加ステップと、所定条件が満たされるように、前記集合から前記推定データの少なくとも一部を除外するデータ除外ステップと、を含む。
【0031】
前記の構成によれば、本発明の一態様に係る教師データ更新装置と同様の作用効果を奏する。
【0032】
本発明の各態様に係る教師データ更新装置および推定モデル構築装置は、コンピュータによって実現してもよく、この場合には、コンピュータを前記教師データ更新装置および前記推定モデル構築装置が備える各部(ソフトウェア要素)として動作させることにより前記教師データ更新装置および前記推定モデル構築装置をコンピュータにて実現させる教師データ更新装置および推定モデル構築装置の制御プログラム、およびそれを記録したコンピュータ読み取り可能な記録媒体も、本発明の範疇に入る。
【発明の効果】
【0033】
本発明の一態様によれば、浄水施設への流入水に対する凝集剤の注入に関する推定において、浄水施設の作業員等の負担を軽減することができる。
【図面の簡単な説明】
【0034】
【
図1】本発明の一実施形態に係る薬注率推定システムの要部構成の一例を示すブロック図である。
【
図5】推定データの除外処理について説明する図である。
【
図6】初期データの除外処理について説明する図である。
【
図7】教師データ更新装置が実行する教師データ更新処理の流れの一例を示すフローチャートである。
【
図8】推定モデル構築装置が実行する推定モデル生成処理の流れの一例を示すフローチャートである。
【
図9】推定モデル構築装置が実行する推定モデル生成処理の流れの別の例を示すフローチャートである。
【
図10】推定装置が実行する薬注率推定処理の流れの一例を示すフローチャートである。
【
図11】推定された薬注率を、作業員等の確認無しで自動注入するための所定の条件を説明する図である。
【
図12】推定装置が実行する薬注率推定処理の流れの別の例を示すフローチャートである。
【発明を実施するための形態】
【0035】
<薬注率推定システム100>
図1は、本実施形態に係る薬注率推定システム100の要部構成の一例を示すブロック図である。薬注率推定システム100は、浄水施設へ流入する流入原水(以下、「流入水」と称する)へ注入する凝集剤の注入率である薬注率を、流入水の水質を含むデータ(以下、「水質データ」と称する)に応じて推定モデルを用いて推定するとともに、推定された薬注率の凝集剤を自動的に流入水へ注入する自動運転を行うシステムである。ここで、凝集剤とは、流入水に含まれる浮遊物質を凝集させ沈澱させるための薬品である。また、薬注率は、流入水に注入する凝集剤の、流入水に対する割合である。なお、本開示に係る凝集剤の注入は、凝集沈澱急速ろ過方式における凝集剤の注入であってもよいし、膜ろ過方式の前処理としての凝集剤の注入であってもよい。
【0036】
本明細書における凝集剤の注入パターンは、以下の3つに分別される。
(パターン1)薬注率推定システム100による自動運転の開始前は、浄水施設の作業員等(以下、単に「作業員等」と称する)が、ジャーテストの結果、過去の知見、所定の計算式などに基づいて決定した薬注率で凝集剤を注入する。
(パターン2)薬注率推定システム100による自動運転の開始後は、原則として、薬注率推定システム100により推定された薬注率で凝集剤を自動注入する。
(パターン3)薬注率推定システム100による自動運転の開始後の例外として、薬注率推定システム100による推定の信頼度の低下が予想される事態が生じた場合は、自動注入を一時停止して作業員等が介入し、作業員等が決定した薬注率で凝集剤を注入する。当該事態の典型例としては、時間経過に伴う気象変動および環境変動等に起因して流入水の水質データが過去に例を見ない値に至る事態が挙げられる。
【0037】
本明細書において、推定モデルにより推定された薬注率を「推定値」と称することがある。また。実際に流入水へ注入された凝集剤の薬注率を「実績値」と称することがある。推定値は、実績値と比較して信頼度が低いことが通常である。
【0038】
薬注率推定システム100では、推定モデルの初期構築にあたり、パターン1において決定した実績値を目的変数とする教師データを用いる。また、推定モデルの再構築にあたり、パターン2において推定された推定値を目的変数とする教師データ、および、パターン3において決定した実績値を目的変数とする教師データを、教師データの集合に追加する。教師データを単に増やすだけでは、信頼度が低い推定値を目的変数とする教師データの上記集合に占める割合が時間経過につれて増加するため、再構築される推定モデルの推定精度は時間経過につれて低下することとなる。そこで、薬注率推定システム100では、所定条件が満たされるように、教師データの集合から、推定値を目的変数とする教師データの少なくとも一部を除外する。
【0039】
薬注率推定システム100は、教師データ更新装置1、教師データ記憶装置2、推定モデル構築装置3、推定モデル記憶装置4、端末装置5、推定装置6および薬品注入装置7を含んでいる。
【0040】
(端末装置5)
端末装置5は、作業員等や外部の装置からの入力を受け付け、当該入力に基づく入力信号を推定装置6へ出力する。また、端末装置5は、推定装置6が生成した情報を出力する。端末装置5による情報の出力方法は特に限定されない。端末装置5は、例えば、当該情報を画像として表示してもよいし、当該情報を音声として出力してもよい。
【0041】
(推定モデル構築装置3)
推定モデル構築装置3は、流入水に対して注入される凝集剤の薬注率を推定するための推定モデルを構築する。具体的には、推定モデル構築装置3は、過去に浄水施設に流入した流入水の水質データと、当該流入水に対して実際に注入された凝集剤の薬注率とを含む教師データの集合を取得し、当該水質データを説明変数とし、当該薬注率を目的変数とした推定モデルを構築する。推定モデル構築装置3は、第1モデル構築部31(モデル構築部)および第2モデル構築部32(モデル構築部)を含んでいる。
【0042】
第1モデル構築部31は、教師データの集合をクラスタリングして複数のクラスタを生成する。具体的には、第1モデル構築部31は、教師データ記憶装置2に記憶されている教師データ群20に含まれる教師データの一部を集合としてクラスタリングを実行し、複数のクラスタを生成する。本実施形態では、第1モデル構築部31が生成するクラスタの数は3個である例を説明するが、当該クラスタの数は3個に限定されない。
【0043】
続いて、第1モデル構築部31は、生成した複数のクラスタ毎に、水質データと薬注率とを変数とする推定モデルを構築する。換言すれば、第1モデル構築部31は、各クラスタの教師データを用いて機械学習を行い、各クラスタにおける学習モデルとして推定モデルを構築する。
【0044】
第1モデル構築部31は、推定モデルの一例として、非線形回帰モデルを構築する。第1モデル構築部31は、例えば、ランダムフォレスト(RF:Random Forest)、勾配ブースティング(GBR:Gradient Boosted tree Regression)またはニューラルネットワーク(NN:Neural Network)を用いて非線形回帰モデルを構築する。
【0045】
第1モデル構築部31は、例えば、第1クラスタ411の推定モデルとして、第1推定モデル421(推定モデル)を構築する。また、第1モデル構築部31は、第2クラスタ412の構築モデルとして、第2推定モデル422(推定モデル)を構築する。また、第1モデル構築部31は、第3クラスタ413の推定モデルとして、第3推定モデル423(推定モデル)を構築する。
【0046】
これにより、クラスタと推定モデルとの組が複数構築される。第1モデル構築部31は、当該複数の組を推定モデル記憶装置4に格納する。本実施形態では、当該複数の組を総称して、クラスタ群41と称する。
【0047】
第2モデル構築部32は、教師データ記憶装置2に記憶されている教師データ群20に含まれる教師データの一部から、水質データと薬注率とを変数とする推定モデルであって、クラスタ群41に含まれる推定モデルとは異なる推定モデルを構築する。当該教師データの一部は、第1モデル構築部31が取得する教師データの一部とは異なるもの、換言すれば、クラスタリングの対象外である教師データであり、詳細については後述する。また、本実施形態では、第2モデル構築部32が構築する推定モデルを、例外推定モデル42(推定モデル、第2推定モデル)と称する。
【0048】
第2モデル構築部32は、例外推定モデル42の一例として、線形回帰モデルを構築する。第2モデル構築部32は、例えば、一般化線形回帰(GLR:Generalized Liner Regression)または部分的最小二乗回帰(PLS:Partial Least Squares Regression)を用いて、線形回帰モデルを構築する。第2モデル構築部32は、構築した例外推定モデル42を推定モデル記憶装置4に格納する。
【0049】
(推定モデル記憶装置4)
推定モデル記憶装置4は、推定モデル構築装置3が構築したクラスタ群41および例外推定モデル42を記憶する。
【0050】
(推定装置6)
推定装置6は、推定モデル構築装置3が構築した推定モデルを用いて、浄水施設に現在流入している水(以下、「現流入水」と称する)に対して注入される凝集剤の薬注率を推定する。推定装置6は、介入判定部61、クラスタ特定部62、薬注率推定部63および出力制御部64を含んでいる。
【0051】
介入判定部61は、薬注率推定システム100による自動注入を一時停止して作業員等が介入すべきか否かを判定する。具体的には、介入判定部61は、端末装置5から取得した現流入水の水質データに基づき、介入の要否を判定する。一例として、介入判定部61は、現流入水の水質データが過去に出現済みか否かに応じて、介入の要否を判定する。具体的には、未出現の水質データである場合、介入判定部61は「要介入」と判定する。一方、既出現の水質データである場合、介入判定部61は「介入不要」と判定する。なお、「未出現の水質データ」とは、教師データ群20に含まれる教師データの各々における水質データが取り得る数値範囲から外れた値を示す水質データである。また、「既出現の水質データ」とは、教師データ群20に含まれる教師データの各々における水質データが取り得る数値範囲に収まる値を示す水質データである。後述する初期範囲311が、ここでいう数値範囲の初期値に相当する。
【0052】
介入判定部61は、要介入と判定した場合、その旨を、出力制御部64から端末装置5へ通知させる。一方、介入判定部61は、介入不要と判定した場合、水質データに関するさらなる判定を行い、この判定結果に応じて、現流入水の水質データをクラスタ特定部62または薬注率推定部63へ出力する。当該判定の詳細については後述する。
【0053】
クラスタ特定部62は、介入判定部61から取得した水質データと、各クラスタの重心との距離に基づき、クラスタ群41のうちのいずれかのクラスタを特定する。クラスタ特定部62は、一例として、第1クラスタ411、第2クラスタ412および第3クラスタ413のうち、現流入水の水質データと重心との距離が最も近いクラスタを特定する。クラスタ特定部62は、クラスタの特定結果と取得した水質データとを薬注率推定部63へ出力する。
【0054】
薬注率推定部63は、現流入水に対して注入される凝集剤の薬注率を推定する。薬注率推定部63は、クラスタ特定部62から特定結果を取得した場合、当該特定結果が示すクラスタから構築された推定モデルに、クラスタ特定部62から取得した水質データを入力することにより薬注率を取得する。また、薬注率推定部63は、介入判定部61から水質データを取得した場合、例外推定モデル42に、当該水質データを入力することにより薬注率を取得する。薬注率推定部63は、取得した薬注率および水質データを出力制御部64へ出力する。
【0055】
出力制御部64は、推定装置6の外部の装置へ、薬注率推定部63が推定した薬注率を出力する。一例として、出力制御部64は、薬品注入装置7へ当該薬注率を送信する。また、出力制御部64は、取得した薬注率と水質データとを対応付けて教師データ更新装置1へ出力する。
【0056】
また、出力制御部64は、端末装置5から薬注率と、当該薬注率の決定に用いた水質データとを受信する。当該薬注率は、介入判定部61が要介入と判定したことにより、作業員等が決定し、端末装置5に入力した薬注率である。出力制御部64は、受信した薬注率を薬品注入装置7へ送信する。また、出力制御部64は、受信した薬注率と水質データとを対応付けて教師データ更新装置1へ出力する。
【0057】
出力制御部64が薬注率と水質データとを対応付けたデータが、推定モデル構築装置3が構築する推定モデルの教師データとなる。
【0058】
(薬品注入装置7)
薬品注入装置7は、推定装置6から受信した薬注率に基づく注入量で、現流入水へ凝集剤を注入する。
【0059】
(教師データ更新装置1)
教師データ更新装置1は、推定モデル構築装置3が推定モデルの構築に用いる教師データを更新する。具体的には、教師データ更新装置1は、教師データ記憶装置2に記憶されている教師データ群20(教師データの集合)を更新する。教師データ更新装置1は、データ追加部11およびデータ除外部12を含んでいる。
【0060】
データ追加部11は、教師データ群20に教師データを追加する。具体的には、データ追加部11は、外部の装置から受信した、薬注率と水質データとを対応付けたデータを、教師データとして教師データ群20に追加する。本実施形態において、教師データは3種類に分類される。データ追加部11は、教師データの1種である、後述する初期データを、例えば端末装置5から受信する。また、データ追加部11は、教師データの1種である、後述する推定データおよび介入データを、例えば推定装置6から受信する。
【0061】
図2は、教師データ群20の一具体例を示す図である。教師データ群20に格納されている各教師データ、すなわち、
図2に示すテーブルの各レコードは、生成日時、流入水の水質データ、薬注率およびラベルが対応付けられたデータである。生成日時は、レコードが生成された日時を示す。ラベルは、教師データの分類を示すデータであり、「初期」、「推定」および「介入」の3種類がある。
【0062】
「初期」とは、上述したパターン1において作業員等が実際に注入した凝集剤の薬注率と、当該流入水の水質データとを対応付けた教師データに付されるラベルである。換言すれば、「初期」のラベルを含む教師データは、自動運転の開始前における流入水の浄水処理において、実際に流入水に注入された凝集剤の薬注率を目的変数とする教師データである。なお、
図2の教師データに含まれる流入水の水質データは、流入水の濁度、アルカリ度およびpHを含むが、水質データは
図2の例に限定されない。また、以降、「初期」のラベルを含む教師データを「初期データ」(第1実績データ)と表記する場合がある。
【0063】
「推定」とは、上述したパターン2において推定された薬注率と、流入水の水質データとを対応付けた教師データに付されるラベルである。すなわち、「推定」のラベルを含む教師データは、薬注率推定部63から取得した薬注率および水質データを、出力制御部64が対応付けたデータである。換言すれば、「推定」のラベルを含む教師データは、推定モデル記憶装置4に記憶されている推定モデルのいずれかを用いて推定した薬注率の推定値を目的変数とする教師データである。なお以降、「推定」のラベルを含む教師データを「推定データ」と表記する場合がある。
【0064】
「介入」とは、上述したパターン3において、すなわち介入判定部61により要介入と判定された場合において、作業員等が実際に注入した凝集剤の薬注率と、流入水の水質データとを対応付けた教師データに付されるラベルである。すなわち、「介入」のラベルを含む教師データは、端末装置5から受信した薬注率および水質データを、出力制御部64が対応付けたデータである。なお以降、「介入」のラベルを含む教師データを「介入データ」(第2実績データ)と表記する場合がある。
【0065】
なお、初期データにおけるラベルは、初期データを教師データ群20に格納する時点で、水質データおよび薬注率の組み合わせに対応付けられる。この処理は、例えば、作業員等が端末装置5を用いて行う。また、推定データおよび介入データにおいて、ラベルを上記組み合わせに対応付ける処理は、例えば、出力制御部64が行う。
【0066】
データ除外部12は、教師データ群20に格納されている教師データにおいて所定条件が満たされるように、教師データ群20から推定データの少なくとも一部を除外する。また、データ除外部12は、推定データの除外が継続して行われた結果、教師データ群20に推定データが含まれていない状態に至ったとき、初期データの少なくとも一部を除外する。換言すれば、データ除外部12は、上記の状態に至ったとき、除外対象を推定データから初期データに切り替える。所定条件およびデータ除外部12が行う処理の詳細については後述する。
【0067】
(教師データ記憶装置2)
教師データ記憶装置2は、上述したとおり、教師データ群20を記憶する。
【0068】
<教師データの概要>
図3は、教師データの概要を示す図である。具体的には、
図3は、教師データにおける水質データと薬注率との関係を示すグラフである。なお、当該水質データは、
図2に示す複数のパラメータのいずれかであり、例えば濁度である。
【0069】
グラフ301は、自動運転の開始時点における教師データ群20に含まれる教師データである初期データの各々の、水質データと薬注率との関係の一例を示す。
図3に示す白丸の各々が初期データを示す。グラフ301に示す初期範囲311は、初期データの各々における水質データが取り得る数値の下限値から上限値までの範囲である。換言すれば、初期範囲311は、自動運転の開始時点で出現済の水質データの数値範囲である。なお、初期範囲311は、例えば教師データ更新装置1により特定され、教師データ更新装置1から推定モデル構築装置3および推定装置6へ送信される。
【0070】
グラフ302は、自動運転が開始されてから或る時間が経過した時点における、教師データ群20に含まれる教師データの各々の、水質データと薬注率との関係の一例を示す。この例では、推定データおよび介入データが新たに登場している。
図3に示す白星の各々が推定データを示し、黒星の各々が介入データを示す。この時点までの推定データは、初期データとの類似度が高い傾向にあり、いずれも初期範囲311内に存在していることがグラフ302に示されている。一方、介入データは、初期範囲311外に存在する。
【0071】
<教師データの更新の概要>
図4は、教師データの更新の概要を示す図である。具体的には、
図4は、教師データ群20に含まれる教師データの数を示すグラフである。
【0072】
グラフ401は、自動運転の開始時点における教師データ群20に含まれる教師データの数を示す。この時点では教師データ群20には初期データのみが含まれる。領域441は初期データを示し、領域441の縦幅は初期データの数を示す。
【0073】
グラフ402は、自動運転が開始されてから或る時間が経過した時点における、教師データ群20に含まれる教師データの数を示す。自動運転が開始されると、教師データ更新装置1は、教師データの更新処理として、推定データおよび介入データを教師データ群20に追加する追加処理を行う。グラフ402において、領域442は、教師データ群20に含まれる推定データを示し、領域442の縦幅は推定データの数を示す。また、領域443は、教師データ群20に含まれる介入データの数を示し、領域443の縦幅は介入データの数を示す。
【0074】
グラフ403は、グラフ402の時点より後の時点における、教師データ群20に含まれる教師データの数を示す。グラフ403に示した「M」は、教師データ群20に含まれる教師データ数の上限値を示すものとする(以降、Mを「上限値M」と表記する)。すなわち、教師データ更新装置1が、推定データおよび介入データの追加を継続して行った結果、グラフ403の時点において、教師データ群20に含まれる教師データの数は上限値Mに到達している。一例として、上限値Mは教師データ群20に含まれる全ての教師データに対する初期データの割合が所定値となるように予め定められる。所定値の典型値は、
図4に示すとおり50%である(つまり、教師データ群20に含まれる教師データの半数が初期データとなる)が、これに限定されない。
【0075】
グラフ404は、グラフ403の時点より後の時点における、教師データ群20に含まれる教師データの数を示す。グラフ404の時点においては、グラフ403の時点に比べて、推定データの数(つまり、領域442の縦幅)が減少し、介入データの数(つまり、領域443の縦幅)が増加している。つまり、教師データ更新装置1は、グラフ403の時点より後においては、教師データの更新処理として、上記追加処理に加え、追加処理により教師データの数が上限値Mを超えないように推定データを教師データ群20から除外する除外処理を行う。換言すれば、
図4の例におけるデータ除外部12は、所定条件としての「教師データ群20に含まれる教師データの総数が上限値Mを超えない」を満たすように、教師データ群20から推定データの少なくとも一部を除外する。これにより、初期データおよび介入データに比べて薬注率の信頼度が低い推定データについて、教師データ群20に占める割合が増加一辺倒ではなくなる(言い換えれば、初期データおよび介入データの教師データ群20に占める割合が減少一辺倒ではなくなる)ため、再構築される推定モデルの推定精度の維持または低下抑制を実現することができる。なお、当該条件は、「教師データ群20に含まれる全ての教師データに対する初期データの割合が、所定値(
図4の例では50%)以上となる」と表現することもできる。
【0076】
グラフ405は、グラフ404の時点より後の時点における、教師データ群20に含まれる教師データの数を示す。教師データ更新装置1が、教師データ(推定データまたは介入データ)の追加処理および推定データの除外処理を継続して行うと、グラフ405に示すように、教師データ群20は推定データを含まない状態に至る。
【0077】
グラフ406は、グラフ405の時点より後の時点における、教師データ群20に含まれる教師データの数を示す。グラフ406の時点においては、グラフ405の時点に比べて、初期データの数(つまり、領域441の縦幅)が減少し、推定データおよび介入データの数が増加している。つまり、教師データ更新装置1は、グラフ405の時点より後においては、グラフ405の時点までの方針を転換し、教師データの更新処理として、上記追加処理に加え、追加処理により教師データの数が上限値Mを超えないように初期データを教師データ群20から除外する。自動運転の開始からグラフ405の時点に至るまでの期間は長期でありグラフ405の時点に至ったとき、生成日時が推定データおよび介入データに比べて早い初期データは最新の教師データ群20において教師データとしての価値が相対的に低くなっている。このため、グラフ405の時点以降では推定データに代えて初期データを除外することにより、教師データ群20内の教師データの全体としての価値を相対的に向上させることができる。
【0078】
<推定データの除外処理>
図5は、推定データの除外処理について説明する図である。具体的には、
図5は、教師データにおける水質データと薬注率との関係を示すグラフである。なお、当該水質データは、
図2に示す複数のパラメータのいずれかであり、例えば濁度である。なお、
図5に示すグラフでは、初期範囲311外に推定データが存在するが、その理由については後述する。
【0079】
グラフ501は、推定データの除外処理を実行する直前における、教師データ群20に含まれる教師データについて、水質データと薬注率との関係を示す。グラフ501には、初期データ、推定データおよび介入データに加え、初期データの重心510がプロットされている。初期データの重心については、例えば、初期データを教師データ群20に格納する時点で、教師データ更新装置1が特定してもよい。
【0080】
データ除外部12は、推定データおよび介入データの追加により教師データ群20に格納されている教師データの総数が上限値Mを超える場合、初期データの重心との距離が最も近い推定データを教師データ群20から除外する。
【0081】
浄水施設に流入する流入水の水質は、長期間に渡って略一定であることはなく、時間経過に伴う気象変動および環境変動等に起因して、徐々に或いは時に急激に変化することが通常である。そのため、初期の推定データは初期データとの類似度が高い傾向にある一方で、時間経過に伴って教師データ群20に含まれる初期データの割合が低下するにつれて、後から追加される推定データほど初期データとの類似度が低くなる傾向が生じる。つまり、時間経過に伴って、教師データ群20内には、初期データとの類似度が相対的に低い推定データの数が増えやすい。また、上述したとおり、推定モデルが推定した薬注率の信頼度は、作業員等が決定した薬注率の信頼度より低い。よって、推定データは初期データより信頼度が低いデータではあるが、その中でも、初期データとの類似度が相対的に高い推定データほど初期データとの差が小さいため教師データとしての価値が相対的に低く、一方、初期データとの類似度が相対的に低い推定データほど初期データとの差が大きいため教師データとしての価値が相対的に高いといえる。したがって、教師データ群20において初期データとの類似度が相対的に低い推定データの占める割合は高い方が望ましい。
【0082】
よって、初期データの重心との距離が最も近い推定データを教師データ群20から除外することにより、時間経過につれて、教師データ群20において初期データとの類似度が相対的に低い推定データの占める割合が徐々に高くなる。その結果、教師データ群20内の教師データの全体としての価値を相対的に向上させることができる。
【0083】
グラフ501の例の場合、データ除外部12は、初期データの重心510との距離が最も近い推定データ511を教師データ群20から除外する。なお、当該距離は、ユークリッド距離であってもマハラノビス距離であってもよい。
【0084】
グラフ502は、推定データの除外処理を実行した直後おける、教師データ群20に含まれる教師データについて、水質データと薬注率との関係を示す。グラフ502に示すように、推定データの除外処理を実行したことにより、推定データ511が教師データ群20から除外されている。
【0085】
<初期データの除外処理>
図6は、初期データの除外処理について説明する図である。
図6に示す教師データ群20Aは、初期データの除外処理を実行する直前における、教師データ群20を示す。また、
図6に示すグラフ600は、教師データ群20に含まれる初期データについて、水質データと薬注率との関係を示す。教師データ群20Aにおける初期データ201および202は、それぞれ、グラフ600における初期データ601および602に対応する。
【0086】
グラフ600に示す除外範囲611は、初期データにおける水質データが取り得る数値範囲の一部分である。除外範囲611は、一例として、
図6に示すように、初期範囲311に収まるように定められる。すなわち、「初期範囲311の下限値≦除外範囲611の下限値」かつ「初期範囲311の上限値≧除外範囲611の上限値」である。別の例として、除外範囲611は、全ての初期データの重心との距離が近い方から所定割合(例えば、90%)の初期データを含む範囲としてもよい。
【0087】
データ除外部12は、推定データおよび介入データの追加により教師データ群20に格納されている教師データの総数が上限値Mを超える場合、除外範囲611内の初期データのうち、生成日時が早い初期データを優先して教師データ群20から除外する。これにより、最新の教師データ群20に含まれる初期データのうち、より古く、かつ、類似する推定データが存在する可能性が相対的に高い初期データ、換言すれば、教師データとしての価値が相対的に低い初期データを除外することができる。結果として、教師データ群20内の教師データの全体としての価値を相対的に向上させることができる。
【0088】
図6の例において、生成日時が最も早い初期データは初期データ201である。グラフ600において初期データ201に対応する初期データ601は、除外範囲611外である。このため、データ除外部12は、初期データ201を教師データ群20Aから除外しない。
【0089】
図6の例において、生成日時が初期データ201の次に早い初期データは初期データ202である。グラフ600において初期データ202に対応する初期データ602は、除外範囲611内である。このため、データ除外部12は、初期データ202を教師データ群20Aから除外する。
【0090】
教師データ群20Bは、初期データの除外処理を実行した直後おける、教師データ群20を示す。教師データ群20Bに示すように、初期データの除外処理を実行したことにより、初期データ202が教師データ群20から除外されている。
【0091】
<教師データ更新処理の流れ>
図7は、教師データ更新装置1が実行する教師データ更新処理の流れの一例を示すフローチャートである。なお、
図7に示す例では、教師データ群20にはすでに初期データが格納されているものとする。
【0092】
ステップS1において、データ追加部11は、推定装置6から教師データ、すなわち推定データまたは介入データを受信するまで待機している。推定装置6から教師データを受信すると(ステップS1でYES)、教師データ更新処理はステップS2へ進む。
【0093】
ステップS2(データ追加ステップ)において、データ追加部11は、受信した教師データを教師データ群20へ追加する。なお、データ追加部11は、教師データ群20へ推定データを追加する場合、予め定められた初期データの重心と当該推定データの距離とを算出する。そして、データ追加部11は、算出した距離を推定データに対応付けて教師データ群20へ追加する。また、データ追加部11は、教師データを追加した旨をデータ除外部12へ通知する。
【0094】
続いて、ステップS3において、データ除外部12は、データ追加部11からの通知を受けると、教師データ群20における初期データの割合が所定値(一例として50%)以上であるか否かを判定する。初期データの割合が所定値以上である場合(ステップS3でYES)、教師データ更新処理はステップS1へ戻る。一方、初期データの割合が所定値未満である場合(ステップS3でNO)、教師データ更新処理はステップS4へ進む。なお、「教師データ群20における初期データの割合が所定値以上であるか否か」は、「教師データの総数が上限値M(
図4参照)を超えたか否か」と表現することもできる。
【0095】
ステップS4において、データ除外部12は、教師データ群20が推定データを含んでいるか否かを判定する。推定データを含んでいると判定した場合(ステップS4でYES)、教師データ更新処理はステップS5へ進む。一方、推定データを含んでいないと判定した場合(ステップS4でNO)、教師データ更新処理はステップS6へ進む。
【0096】
ステップS5(データ除外ステップ)において、データ除外部12は、初期データの重心との距離が最も近い推定データを教師データ群20から除外する。具体的には、データ除外部12は、教師データ群20に含まれている推定データのうち、対応付けられた距離の値が最も小さいものを特定し、教師データ群20から除外する。ステップS5が終了すると、教師データ更新処理はステップS1へ戻る。
【0097】
ステップS6において、データ除外部12は、除外範囲611内の最も古い初期データを教師データ群20から除外する。具体的には、データ除外部12は、水質データが除外範囲611内の初期データのうち、生成日時が最も早いものを特定し、教師データ群20から除外する。ステップS6が終了すると、教師データ更新処理はステップS1へ戻る。
【0098】
なお、ステップS3~ステップS6の処理は、推定モデル記憶装置4に記憶されている各推定モデルの再構築が開始されるまでに実行される。一例として、データ除外部12は、データ追加部11からの通知を受けて即時にステップS3~ステップS6の処理を実行してもよい。または、データ除外部12は、推定モデル構築装置3が推定モデルを再構築するとき、換言すれば、教師データ群20から教師データの集合を読み出すとき、この読み出しの前にステップS3~ステップS6の処理を実行してもよい。
【0099】
<推定モデル構築処理1>
図8は、推定モデル構築装置3が実行する推定モデル構築処理の流れの一例を示すフローチャートである。
図8の例では、クラスタ群41に含まれる複数の推定モデル(
図1の第1推定モデル421、第2推定モデル422および第3推定モデル423)を構築する推定モデル構築処理を説明する。
【0100】
ステップS11において、第1モデル構築部31は、推定モデルを構築するタイミングとなるまで待機している。クラスタ群41当該タイミングの一例は、所定期間の経過である。タイミングが到来すると(ステップS11でYES)、推定モデル構築処理はステップS12へ進む。
【0101】
ステップS12において、第1モデル構築部31は、教師データ群20から、初期データと、初期範囲311内の推定データとからなる集合を読み出す。具体的には、第1モデル構築部31は、教師データ群20に含まれる教師データのラベルを参照し、初期データを読み出す。また、第1モデル構築部31は、水質データが、教師データ更新装置1から予め受信していた初期範囲311に含まれる推定データを読み出す。
【0102】
続いて、ステップS13において、第1モデル構築部31は、読み出した集合をクラスタリングし、複数のクラスタを生成する。
【0103】
続いて、ステップS14において、第1モデル構築部31は、クラスタ毎に、水質データと薬注率とを変数とする推定モデル(一例として、非線形回帰モデル)を構築する。これにより、複数の推定モデルを含むクラスタ群41が構築される。
【0104】
続いて、ステップS15において、第1モデル構築部31は、クラスタ群41、すなわち、構築したクラスタおよび推定モデルを推定モデル記憶装置4へ格納する。ステップS15が終了すると、推定モデル構築処理はステップS11へ戻る。
【0105】
<推定モデル構築処理2>
図9は、推定モデル構築装置3が実行する推定モデル構築処理の流れの別の一例を示すフローチャートである。
図9の例では、例外推定モデル42を構築する推定モデル構築処理を説明する。
【0106】
ステップS21において、第2モデル構築部32は、例外推定モデル42を構築するタイミングとなるまで待機している。当該タイミングの一例は、所定期間の経過である。なお、ステップS21における所定期間は、ステップS22における所定期間と同じであってもよいし、異なっていてもよい。また、ステップS21におけるタイミングは、ステップS11におけるタイミングと同じであってもよいし、異なっていてもよい。タイミングが到来すると(ステップS21でYES)、推定モデル構築処理はステップS22へ進む。
【0107】
ステップS22において、第2モデル構築部32は、教師データ群20から、初期範囲311外の推定データと、介入データとからなる集合を読み出す。具体的には、第2モデル構築部32は、水質データが、教師データ更新装置1から予め受信していた初期範囲311に含まれない推定データを読み出す。また、第2モデル構築部32は、教師データ群20に含まれる教師データのラベルを参照し、介入データを読み出す。
【0108】
続いて、ステップS23において、第2モデル構築部32は、読み出した集合から、水質データと薬注率とを変数とする例外推定モデル42(一例として、線形回帰モデル)を構築する。
【0109】
続いて、ステップS24において、第2モデル構築部32は、構築した例外推定モデル42を推定モデル記憶装置4へ格納する。ステップS24が終了すると、推定モデル構築処理はステップS21へ戻る。
【0110】
<薬注率推定処理>
図10は、推定装置6が実行する薬注率推定処理の流れの一例を示すフローチャートである。
【0111】
ステップS31において、介入判定部61は、現流入水の水質データを受信する。具体的には、介入判定部61は、端末装置5を介して現流入水の水質データを受信する。ここで、端末装置5は、各種センサから受信した現流入水の水質データを介入判定部61へ送信してもよいし、作業員等が入力した水質データを介入判定部61へ送信してもよい。また、介入判定部61は、各種センサから直接現流入水の水質データを受信してもよい。
【0112】
続いて、ステップS32において、介入判定部61は、受信した水質データが初期範囲311内に含まれるか否かを判定する。初期範囲311内に含まれると判定した場合(ステップS32でYES)、薬注率推定処理はステップS33へ進む。初期範囲311内に含まれないと判定した場合(ステップS32でNO)、薬注率推定処理はステップS37へ進む。
【0113】
ステップS33において、クラスタ特定部62は、クラスタ群41に含まれる第1クラスタ411、第2クラスタ412および第3クラスタ413のうち、取得した水質データと重心との距離が最も近いクラスタを特定する。クラスタ特定部62は、クラスタの特定結果を薬注率推定部63へ出力する。
【0114】
続いて、ステップS34において、薬注率推定部63は、特定されたクラスタから構築された推定モデルを用いて、薬注率を推定する。例えば、取得した水質データと重心との距離が最も近いクラスタとして、クラスタ特定部62が、第1クラスタ411を特定した場合、薬注率推定部63は、第1推定モデル421に、現流入水の水質データを入力し、薬注率を取得する。薬注率推定部63は、取得した薬注率および水質データを出力制御部64へ出力する。
【0115】
続いて、ステップS35において、出力制御部64は、薬注率推定部63が推定した薬注率を薬品注入装置7へ送信する。これにより、薬品注入装置7は、当該薬注率に基づいて凝集剤の注入量を決定し、現流入水へ注入する。
【0116】
続いて、ステップS36において、出力制御部64は、取得した水質データと薬注率との組み合わせに、推定データのラベルを付して教師データ更新装置1へ送信する。これにより、当該組み合わせが推定データとして教師データ群20へ追加される。ステップS36が終了すると、薬注率推定処理は終了する。
【0117】
なお、ステップS35とステップS36の順序は、
図10の例に限定されない。ステップS36がステップ35より前に実行されてもよいし、ステップS35とステップS36とが並列に実行されてもよい。
【0118】
ステップS37において、薬注率推定部63は、例外推定モデル42を用いて、薬注率を推定する。薬注率推定部63は、例外推定モデル42に水質データを入力することにより、薬注率を取得する。薬注率推定部63は、取得した薬注率および水質データを出力制御部64へ出力する。
【0119】
続いて、ステップS38において、出力制御部64は、例外推定モデル42を用いて推定された薬注率とともに、自動運転へ介入すべき旨を端末装置5へ通知する。当該通知は、例えば、薬注率を決定し、推定された薬注率が適切であるか否かを判断するよう作業員等に依頼する内容である。なお、例外推定モデル42は、初期範囲外311の推定データおよび介入データから構築されるため、自動運転開始直後には構築されていない場合がある。この場合、ステップS37の処理は省略され、ステップS38では、自動運転へ介入すべき旨の通知のみが端末装置5へ送信される。当該通知は、例えば、薬注率を決定するよう作業員等に依頼する内容である。
【0120】
続いて、ステップS39において、出力制御部64は、端末装置5からの薬注率の受信を待機する状態となる。換言すれば、出力制御部64は、自動注入を一時停止し、作業員等からの通知に対する応答を待機する状態となる。出力制御部64が、端末装置5から薬注率と、当該薬注率を決定するために使用された水質データ(ステップS31で介入判定部61が受信した現流入水の水質データ)とを受信すると(ステップS39でYES)、薬注率推定処理はステップS40へ進む。端末装置5から送信されたデータは、薬注率および水質データに加え、例外推定モデル42を用いて推定された薬注率が適切でないことを示す情報を含んでいてもよい。
【0121】
出力制御部64が、端末装置5から薬注率ではなく、例外推定モデル42を用いて推定された薬注率が適切であることを示す情報を受信すると(ステップS39でNO)、薬注率推定処理はステップS35へ進む。ステップS35の処理が実行されることにより、自動注入が再開される。なお、この場合において、ステップS36の処理により生成される教師データは、水質データが初期範囲311外の推定データ(
図5参照)となる。
【0122】
ステップS40において、出力制御部64は、受信した薬注率を薬品注入装置7へ送信する。これにより、薬品注入装置7は、当該薬注率に基づいて凝集剤の注入量を決定し、現流入水へ注入する。換言すれば、ステップS40が実行されることにより、自動注入が再開される。
【0123】
続いて、ステップS41において、出力制御部64は、端末装置5から受信した水質データと薬注率との組み合わせに、介入データのラベルを付して教師データ更新装置1へ送信する。これにより、当該組み合わせが介入データとして教師データ群20へ追加される。ステップS42が終了すると、薬注率推定処理は終了する。
【0124】
なお、ステップS40とステップS41の順序は、
図10の例に限定されない。ステップS40がステップS41より前に実行されてもよいし、ステップS40とステップS41とが並列に実行されてもよい。
【0125】
<効果>
以上のとおり、本実施形態に係る教師データ更新装置1は、初期データを含む教師データ群20に、推定データおよび介入データの少なくとも一方を教師データとして追加するデータ追加部11を備える。また、教師データ更新装置1は、初期データの、教師データ群20に含まれる全ての教師データに占める割合が所定値以上になるように、推定データの少なくとも一部を除外するデータ除外部12を備える。
【0126】
推定データに含まれる薬注率は、初期データおよび介入データに含まれる薬注率と比較して、信頼度が低いのが通常である。よって、推定データを教師データとして再利用するために教師データ群20に単に追加していくだけでは、信頼度が低い推定データの教師データ群20に占める割合が時間経過につれて増加するため、このような教師データ群20を用いて再構築される推定モデルの推定精度は時間経過につれて低下する。これに対して、この構成によれば、初期データの、教師データ群20に含まれる全ての教師データに占める割合が常に所定値以上となるように教師データ群20から推定データの少なくとも一部が除外される。これにより、推定データの教師データ群20に占める割合が増加一辺倒ではなくなる(言い換えれば、初期データおよび介入データの教師データ群20に占める割合が減少一辺倒ではなくなる)ため、再構築される推定モデルの推定精度の維持または低下抑制を実現することができる。結果として、推定モデルが推定した薬注率をそのまま薬品注入装置7が使用できる可能性が高まるので、浄水施設の作業員等の負担を軽減することができる。
【0127】
また、一般的に、浄水施設に流入する流入水の水質は、長期間に渡って略一定であることはなく、時間経過に伴う気象変動および環境変動等に起因して、徐々に或いは時に急激に変化することが通常である。よって、水質データが、過去に浄水施設に流入した流入水の水質データが取り得る数値範囲に含まれない現流入水が、時間経過に伴い浄水施設に流入し得る。
【0128】
このため、介入データ、すなわち、水質データが初期範囲311外の教師データを教師データ群20に含めることにより、教師データ群20内の教師データの全体としての価値を相対的に向上させることができる。結果として、再構築される推定モデルの推定精度を向上させることができる。
【0129】
また、データ除外部12は、データ追加部11による追加が行われてから、推定モデルの再構築が開始されるまでの間に、初期データの教師データ群20に占める割合が常に所定値以上となるか否かを判定する。
【0130】
この構成によれば、推定データおよび介入データの少なくとも一方が教師データ群20に追加されてから推定モデルの再構築が開始されるまでの間に、初期データの教師データ群20に占める割合が常に所定値以上となるように推定データが除外される。よって、推定モデルの再構築が開始される時点において、初期データの教師データ群20に占める割合は所定値以上となっている。このため、推定モデルの再構築が開始される時点において、教師データ群20に含まれる教師データは上限数を超えない。この場合、推定モデルの再構築にかかる処理負荷の増大を抑制することができる。
【0131】
また、データ除外部12は、教師データ群20に含まれる初期データとの類似度が最も高い推定データ、具体的には、教師データ群20に含まれるすべての初期データの重心との距離が最も短い推定データを、教師データ群20から除外する。
【0132】
上述したとおり、浄水施設に流入する流入水の水質は、長期間に渡って略一定であることはなく、時間経過に伴う気象変動および環境変動等に起因して、徐々に或いは時に急激に変化することが通常である。そのため、初期の推定データは初期データとの類似度が高い傾向にある一方で、時間経過に伴って教師データ群20に含まれる初期データの割合が低下するにつれて、後から追加される推定データほど初期データとの類似度が低くなる傾向が生じる。つまり、時間経過に伴って、教師データ群20内には、初期データとの類似度が相対的に低い推定データの数が増えやすい。
【0133】
ここで、上述したとおり、推定モデルが推定した薬注率の信頼度は、作業員等が決定した薬注率の信頼度より低い。よって、推定データは初期データより信頼度が低いデータではあるが、その中でも、初期データとの類似度が相対的に高い推定データほど初期データとの差が小さいため教師データとしての価値が相対的に低く、一方、初期データとの類似度が相対的に低い推定データほど初期データとの差が大きいため教師データとしての価値が相対的に高いといえる。したがって、教師データ群20において初期データとの類似度が相対的に低い推定データの占める割合は高い方が望ましい。
【0134】
上記の構成によれば、教師データ群20に含まれる全ての初期データとの類似度が相対的に高い推定データほど優先して除外される。これにより、時間経過につれて、教師データ群20において初期データとの類似度が相対的に低い推定データの占める割合が徐々に高くなる。その結果、教師データ群20内の教師データの全体としての価値を相対的に向上させることができる。したがって、再構築される推定モデルの推定精度を向上させることができる。
【0135】
また、除外する推定データを、教師データ群20に含まれるすべての初期データの重心との距離で決定するので、簡易な演算により除外する推定データを決定することができる。
【0136】
また、データ除外部12は、教師データ群20が推定データを含まない状態に至ったとき、教師データ群20から除外する対象を推定データから初期データに切り替える。
【0137】
推定データを教師データ群20から除外していくと、最終的に、教師データ群20は、推定データを含まず、初期データおよび介入データのみを含む状態となる。初期データは初期の教師データ群20から存在する古いデータであり最新の教師データ群20においては教師データとしての価値が相対的に低くなっている。よって、上記の状態になってからは、初期データを除外することにより、教師データ群20内の教師データの全体としての価値を相対的に向上させることができる。結果として、再構築される推定モデルの推定精度の低下を抑制することができる。
【0138】
また、本実施形態に係る推定モデル構築装置3は、教師データ更新装置1が更新した教師データ群20に含まれる教師データを用いて推定モデルを構築する第1モデル構築部31および第2モデル構築部32を備える。
【0139】
この構成によれば、教師データ更新装置1が更新する教師データ群20に含まれる教師データを用いて推定モデルを構築することができる。よって、推定精度の低下が抑制された推定モデルを構築することができる。
【0140】
また第1モデル構築部31は、教師データ群20に含まれる全ての初期データと、水質データが初期範囲311内の推定データとをクラスタリングして複数のクラスタを生成し、当該生成された複数のクラスタ毎に推定モデルを構築する。第2モデル構築部32は、教師データ群20に含まれる全ての介入データと、水質データが初期範囲311外の推定データとを用いて例外推定モデル42を構築する。
【0141】
この構成によれば、現流入水の水質に応じて、異なる推定モデルを用いた薬注率の推定が行えるので、薬注率の推定精度を向上させることができる。
【0142】
また、第1モデル構築部31は、推定モデルとして非線形回帰モデルを構築し、第2モデル構築部32は、推定モデルとして線形回帰モデルを構築する。
【0143】
初期データと、水質データが初期範囲311内の推定データとから構築される、クラスタ群41に含まれる推定モデルにおいて、流入水の水質データと薬注率との相関関係は非線形であることが、出願人の検証により見出された。このため、上記の構成によれば、線形モデルの場合と比べて、薬注率の推定精度を向上させることができる。
【0144】
また、介入データと、水質データが初期範囲311外の推定データとから構築される例外推定モデル42は、いわゆる外挿に強い線形モデルであるので、時間経過に伴い水質が変化した流入水に対する薬注率を適切に推定することができる。
【0145】
<変形例>
上述の実施形態で述べたとおり、例外推定モデル42は、教師データ群20に含まれる教師データのうち、初期範囲311外の推定データと介入データとから構築される。このため、例外推定モデル42は、初期範囲311外の推定データと介入データの数が少ない段階では、推定精度が低い推定モデルとなる。一方、当該段階から自動運転を継続すると、初期範囲311外の推定データおよび介入データの数が増加し、例外推定モデル42の推定精度が向上する。推定精度が向上した例外推定モデル42を用いて推定した薬注率は、現流入水の水質データが初期範囲311外であっても、当該水質データが、初期範囲311外の推定データおよび介入データの水質データに類似していれば、作業員等に適切と判断される可能性が高くなる。換言すれば、当該薬注率は、作業員等の確認が不要である可能性が高い。
【0146】
以上をふまえ、推定装置6は、現流入水の水質データが初期範囲311外であっても、当該水質データが所定の条件を満たす場合、作業員等の確認を経ることなく、推定した薬注率を薬品注入装置7へ送信してもよい。
【0147】
図11は、上記所定の条件を説明する図である。具体的には、
図11は、教師データにおける水質データと薬注率との関係を示すグラフである。なお、当該水質データは、
図2に示す複数のパラメータのいずれかであり、例えば濁度である。
【0148】
グラフ701は、例外推定モデル42の精度が十分高くなった時点における、教師データ群20に含まれる教師データについて、水質データと薬注率との関係を示す。グラフ701に示す出現範囲711は、この時点の教師データの各々における水質データが取り得る数値の下限値から上限値までの範囲である。つまり、出現範囲711は、この時点で出現済の水質データの数値範囲である。なお、グラフ701では、出現範囲711は初期範囲311を包含する。つまり、「出現範囲711の下限値≦初期範囲311の下限値」、かつ、「出現範囲711の上限値≧初期範囲311の上限値」である。
【0149】
出現範囲711は、初期範囲311に代わる、上述した「既出現の水質データ」および「未出現の水質データ」を定義するための新たな数値範囲である。つまり、出現範囲711が設定された後は、出現範囲711に収まる値を示す水質データが「既出現の水質データ」であり、出現範囲711から外れた値を示す水質データが「未出現の水質データ」である。なお、出現範囲711は、例えば、初期範囲311外の推定データと介入データとの合計、あるいは、介入データの数が所定数に到達した時点で、教師データ更新装置1により設定され、推定装置6へ送信されてもよい。また、別の例として、介入判定部61が、初期範囲311外の水質データを受信した回数を自動運転の開始時から計測し、当該回数が所定数に到達した時点で、介入判定部61が出現範囲711を設定してもよい。
【0150】
グラフ702は、グラフ701の時点よりさらに後の時点における、教師データ群20に含まれる教師データの各々の、水質データと薬注率との関係を示す。グラフ702には、新たな推定データ712および新たな介入データ713が登場している。推定データ712における水質データは、初期範囲311の範囲外であるが、出現範囲711の範囲内である。このため、介入判定部61による判定は「介入不要」となるとともに、推定データ712は新たな教師データとして教師データ群20に追加される。
【0151】
一方、介入データ713における水質データは、出現範囲711の範囲外である。このため、介入判定部61による判定は「介入要」となるとともに、介入データ713は新たな教師データとして教師データ群20に追加される。
【0152】
なお、一例として、教師データ更新装置1は、出現範囲711外の推定データと介入データとの合計、あるいは、介入データの数が所定数に到達した時点で、出現範囲711を更新して、推定装置6へ送信してもよい。また、別の例として、介入判定部61が、出現範囲711外の水質データを受信した回数を、出現範囲711の設定時から計測し、当該回数が所定数に到達した時点で、介入判定部61が出現範囲711を更新してもよい。
【0153】
図12は、この変形例に係る推定装置6が実行する薬注率推定処理の流れの一例を示すフローチャートである。なお、当該フローチャートにおいて、
図10に示すフローチャートと同一の処理を実行するステップについては、
図10と同一のステップ番号を付している。また、当該ステップにて実行される処理はすでに説明しているため、ここでは説明を繰り返さない。
【0154】
本変形例に係る薬注率推定処理では、ステップS37に続いて、ステップS51が実行される。ステップS51において、出力制御部64は、ステップS31にて受信した水質データが出現範囲711に含まれるか否かを判断する。出現範囲711に含まれると判定した場合(ステップS51でYES)、薬注率推定処理はステップS35へ進む。すなわち、現流入水の水質データが初期範囲311外かつ出現範囲711内である場合、推定装置6は、例外推定モデル42を用いて推定した薬注率を端末装置5へ送信せず(換言すれば、当該薬注率を作業員等に確認させることなく)、薬品注入装置7へ送信する。また、この場合、現流入水の水質データと推定した薬注率との組み合わせは推定データとして教師データ群20へ追加される。この推定データの一例が、
図11に示す推定データ712である。
【0155】
一方、出力制御部64が、出現範囲711に含まれないと判定した場合(ステップS51でNO)、薬注率推定処理はステップS38へ進む。すなわち、現流入水の水質データが出現範囲711外である場合、推定装置6は、例外推定モデル42を用いて推定した薬注率を端末装置5へ送信し、当該薬注率が適切か否かを作業員等に確認させる。
【0156】
例外推定モデル42を用いて推定した薬注率が適切である旨の情報を端末装置5から受信した場合、現流入水の水質データと当該薬注率との組み合わせが推定データとして教師データ群20へ追加される。
【0157】
端末装置5から、作業員等が決定した薬注率を受信した場合、現流入水の水質データと当該薬注率との組み合わせが介入データとして教師データ群20へ追加される。この介入データの一例が、
図11に示す介入データ713である。
【0158】
以上の構成によれば、作業員等の確認頻度を低下させることができるので、作業員等の負担をさらに軽減することができる。
【0159】
推定モデル構築装置3が構築する推定モデルは、クラスタ群41に含まれる複数の推定モデルのみであってもよい。この例において、推定モデル構築装置3は、第2モデル構築部32を備えていない。この例において、第1モデル構築部31は、教師データ群20に含まれる全てのデータを読み出し、クラスタリングして複数の推定モデルを構築する。
【0160】
また、この例において、推定装置6は、現流入水の水質データが初期範囲311内であると介入判定部61が判定した場合、クラスタ群41に含まれる推定モデルのいずれかを用いて推定された薬注率を、端末装置5へ送信することなく、薬品注入装置7へ送信する。一方、現流入水の水質データが初期範囲311外であると介入判定部61が判定した場合、推定装置6は、クラスタ群41に含まれる推定モデルのいずれかを用いて推定された薬注率を、端末装置5へ送信し、作業員等に確認させる。
【0161】
また、第1モデル構築部31は、クラスタリングを行わず、1つの推定モデルを構築してもよい。また、第1モデル構築部31は、線形回帰モデルを構築してもよい。また、第2モデル構築部32は、非線形回帰モデルを構築してもよい。
【0162】
薬注率推定システム100は、薬品注入装置7を含んでいなくてもよい。この例において、出力制御部64は、端末装置5に薬注率推定部63が推定した薬注率を示すデータを送信し、端末装置5に出力させてもよい。
【0163】
データ除外部12が推定データを教師データ群20から除外したときに満たすべき所定条件は、上述した例に限定されない。当該条件は例えば、初期データが教師データ群20に占める割合に依らず、教師データ群20に含まれる教師データの総数が所定の上限値以下となることであってもよい。
【0164】
データ除外部12は、教師データを教師データ群20へ追加した場合に所定条件を満たさなくなる場合、データ追加部11が教師データを教師データ群20へ追加する前に、推定データを教師データ群20から除外してもよい。この例において、データ追加部11は、推定データまたは介入データを受信した場合、その旨をデータ除外部12へ追加する。データ除外部12は、当該通知を受けると、受信した推定データまたは介入データを教師データ群20へ追加したと仮定して、所定条件を満たしているか否かを判定する。所定条件を満たしていると判定した場合、受信した推定データまたは介入データを教師データ群20へ追加することを許可する許可通知をデータ追加部11へ出力する。所定条件を満たしていないと判定した場合、データ除外部12は推定データを除外し、上記許可通知をデータ追加部11へ出力する。データ追加部11は、許可通知を取得すると、受信した推定データまたは介入データを教師データ群20へ追加する。
【0165】
初期範囲311、除外範囲611および出現範囲711を設定するための水質データは、流入水の濁度に限定されない。当該水質データは、アルカリ度またはpHであってもよい。あるいは、水質データに含まれる全てのパラメータにおいて、初期範囲311、除外範囲611および出現範囲711が設定されてもよい。この例において、推定装置6は、現流入水の水質データに含まれる全てのパラメータが、対応する初期範囲311内にある場合、クラスタ群41に含まれる推定モデルを用いて薬注率の推定を行ってもよい。また、現流入水の水質データに含まれるパラメータのいずれかが、対応する初期範囲311外にある場合、例外推定モデル42を用いて薬注率の推定を行うとともに、自動運転へ介入すべき旨を端末装置5へ通知してもよい。また、出現範囲711が設定されている場合において、現流入水の水質データに含まれるパラメータのいずれかが、対応する初期範囲311外、かつ対応する出現範囲711内にある場合、例外推定モデル42を用いて薬注率の推定を行う一方、端末装置5への通知を行わない構成であってもよい。また、現流入水の水質データに含まれるパラメータのいずれかが、対応する出現範囲711外にある場合、例外推定モデル42を用いて薬注率の推定を行うとともに、自動運転へ介入すべき旨を端末装置5へ通知してもよい。
【0166】
出力制御部64は、薬注率推定部63が薬注率を推定した場合、当該薬注率を薬品注入装置7へ送信する前に、常に端末装置5へ送信してもよい。この例において、作業員等は、端末装置5が出力した薬注率が適切であるか否かを判断する。適切である場合、作業員等は端末装置5を操作し、推定された薬注率が適切である旨を示す通知を、推定装置6へ送信させる。一方、適切でない場合、作業員等は端末装置5を操作し、適切な薬注率(作業員等が決定した薬注率)を推定装置6へ送信させる。端末装置5から通知を受信した場合、出力制御部64は、薬注率推定部63が推定した薬注率を薬品注入装置7へ送信するとともに、当該薬注率および取得した水質データの組み合わせを、推定データとして教師データ更新装置1へ送信する。一方、端末装置5から薬注率を受信した場合、出力制御部64は、薬注率推定部63が推定した薬注率に代えて、受信した薬注率を薬品注入装置7へ送信するとともに、受信した薬注率よび取得した水質データの組み合わせを、介入データとして教師データ更新装置1へ送信する。
【0167】
データ除外部12は、教師データ群20が推定データを含まない状態に至ったとき、除外範囲611を設定せず、すべての初期データのうち生成日時が早いものを優先して除外してもよい。
【0168】
出力制御部64は、推定データまたは介入データを生成するたびにこれらデータを教師データ更新装置1へ送信しなくてもよい。具体的には、出力制御部64は、所定の送信タイミングとなるまで、生成した推定データおよび介入データを保持しておき、当該送信タイミングとなったとき、保持している推定データおよび介入データを教師データ更新装置1へ送信してもよい。
【0169】
薬注率推定システム100に含まれる2以上の装置が一体となっていてもよい。例えば、教師データ更新装置1と教師データ記憶装置2とが一体となっていてもよい。また、推定モデル構築装置3と推定モデル記憶装置4とが一体となっていてもよい。また、薬注率推定システム100に含まれる全ての装置が一体となっていてもよい。
【0170】
〔ソフトウェアによる実現例〕
教師データ更新装置1、推定モデル構築装置3および推定装置6の制御ブロック(特にデータ追加部11、データ除外部12、第1モデル構築部31、第2モデル構築部32、介入判定部61、クラスタ特定部62、薬注率推定部63および出力制御部64)は、集積回路(ICチップ)等に形成された論理回路(ハードウェア)によって実現してもよいし、ソフトウェアによって実現してもよい。
【0171】
後者の場合、教師データ更新装置1、推定モデル構築装置3および推定装置6は、各機能を実現するソフトウェアであるプログラムの命令を実行するコンピュータを備えている。このコンピュータは、例えば1つ以上のプロセッサを備えていると共に、上記プログラムを記憶したコンピュータ読み取り可能な記録媒体を備えている。そして、上記コンピュータにおいて、上記プロセッサが上記プログラムを上記記録媒体から読み取って実行することにより、本発明の目的が達成される。上記プロセッサとしては、例えばCPU(Central Processing Unit)を用いることができる。上記記録媒体としては、「一時的でない有形の媒体」、例えば、ROM(Read Only Memory)等の他、テープ、ディスク、カード、半導体メモリ、プログラマブルな論理回路などを用いることができる。また、上記プログラムを展開するRAM(Random Access Memory)などをさらに備えていてもよい。また、上記プログラムは、該プログラムを伝送可能な任意の伝送媒体(通信ネットワークや放送波等)を介して上記コンピュータに供給されてもよい。なお、本発明の一態様は、上記プログラムが電子的な伝送によって具現化された、搬送波に埋め込まれたデータ信号の形態でも実現され得る。
【0172】
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。
【符号の説明】
【0173】
1 教師データ更新装置
3 推定モデル構築装置
11 データ追加部
12 データ除外部
20 教師データ群(教師データの集合)
31 第1モデル構築部(モデル構築部)
32 第2モデル構築部(モデル構築部)
42 例外推定モデル(推定モデル、第2推定モデル)
421 第1推定モデル(推定モデル)
422 第2推定モデル(推定モデル)
423 第3推定モデル(推定モデル)