特開2022-156802 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2022-156802流量予測プログラム、流量予測方法および情報処理装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2022156802

(43)【公開日】2022-10-14

(54)【発明の名称】流量予測プログラム、流量予測方法および情報処理装置

(51)【国際特許分類】

G06Q 10/04 20120101AFI20221006BHJP

E02B 1/00 20060101ALI20221006BHJP

G01F 1/00 20220101ALI20221006BHJP

G16Z 99/00 20190101ALI20221006BHJP

【ＦＩ】

G06Q10/04

E02B1/00 Z

G01F1/00 H

G16Z99/00

【審査請求】未請求

【請求項の数】9

【出願形態】ＯＬ

(21)【出願番号】P 2021060674

(22)【出願日】2021-03-31

(71)【出願人】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】110002918

【氏名又は名称】特許業務法人扶桑国際特許事務所

(72)【発明者】

【氏名】宗美佐子

【テーマコード（参考）】

2F030

5L049

【Ｆターム（参考）】

2F030CC05

2F030CE01

5L049AA04

5L049DD01

(57)【要約】（修正有）

【課題】雨量から流量を予測する予測精度を向上させる流量予測プログラム、流量予測方法及び情報処理装置を提供する。
【解決手段】情報処理装置１０において、複数の時刻の雨量を示す雨量データ１３と複数の時刻の流量を示す流量データ１４とを記憶する記憶部１１と、雨量データ１３と流量データ１４とに基づいて、雨量と流量との間の関係が変化する境界雨量１５を判定し、境界雨量１５に基づいて区切られる雨量区間に対応して、雨量から流量を予測するための予測モデル１６，１７を生成する処理部１２とを備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

コンピュータに、
複数の時刻の雨量を示す雨量データと前記複数の時刻の流量を示す流量データとに基づいて、雨量と流量との間の関係が変化する１以上の境界雨量を判定し、
前記１以上の境界雨量に基づいて区切られる２以上の雨量区間に対応して、雨量から流量を予測するための２以上の予測モデルを生成する、
処理を実行させる流量予測プログラム。

【請求項2】

前記判定では、直前の一定時間の合計雨量と流量との間の関係を示す曲線を算出し、前記曲線を２以上の直線で近似することで前記１以上の境界雨量を判定する、
請求項１記載の流量予測プログラム。

【請求項3】

前記生成では、前記雨量データと前記流量データとに基づいて、前記２以上の雨量区間に対応する２以上の訓練データセットを生成し、前記２以上の訓練データセットを用いて前記２以上の予測モデルを生成し、
前記２以上の雨量区間のうちの連続する２つの雨量区間が重複区間を含んでおり、前記重複区間に属する雨量をもつ訓練データレコードは、前記連続する２つの雨量区間に対応する２つの訓練データセットの両方に含まれる、
請求項１記載の流量予測プログラム。

【請求項4】

雨量と流量との間の関係が変化する１以上の境界雨量と、前記１以上の境界雨量に基づいて区切られる２以上の雨量区間に対応して雨量から流量を予測するための２以上の予測モデルとを記憶する記憶部を参照して、複数の時刻の雨量を示す雨量データと前記１以上の境界雨量とに基づいて、前記２以上の予測モデルのうち使用する少なくとも１つの予測モデルを決定し、
前記決定した予測モデルの出力から、前記雨量データに対応する流量を予測する、
処理を実行させる流量予測プログラム。

【請求項5】

前記２以上の雨量区間のうちの連続する２つの雨量区間が重複区間を含んでおり、
前記決定では、前記雨量データが示す雨量が前記重複区間に属する場合、前記連続する２つの雨量区間に対応する２つの予測モデルを決定し、
前記予測では、前記２つの予測モデルの出力を合成して流量の予測値を算出する、
請求項４記載の流量予測プログラム。

【請求項6】

コンピュータが、
複数の時刻の雨量を示す雨量データと前記複数の時刻の流量を示す流量データとに基づいて、雨量と流量との間の関係が変化する１以上の境界雨量を判定し、
前記１以上の境界雨量に基づいて区切られる２以上の雨量区間に対応して、雨量から流量を予測するための２以上の予測モデルを生成する、
流量予測方法。

【請求項7】

【請求項8】

複数の時刻の雨量を示す雨量データと前記複数の時刻の流量を示す流量データとを記憶する記憶部と、
前記雨量データと前記流量データとに基づいて、雨量と流量との間の関係が変化する１以上の境界雨量を判定し、前記１以上の境界雨量に基づいて区切られる２以上の雨量区間に対応して、雨量から流量を予測するための２以上の予測モデルを生成する処理部と、
を有する情報処理装置。

【請求項9】

雨量と流量との間の関係が変化する１以上の境界雨量と、前記１以上の境界雨量に基づいて区切られる２以上の雨量区間に対応して雨量から流量を予測するための２以上の予測モデルとを記憶する記憶部と、
前記記憶部を参照して、複数の時刻の雨量を示す雨量データと前記１以上の境界雨量とに基づいて、前記２以上の予測モデルのうち使用する少なくとも１つの予測モデルを決定し、前記決定した予測モデルの出力から、前記雨量データに対応する流量を予測する処理部と、
を有する情報処理装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は流量予測プログラム、流量予測方法および情報処理装置に関する。

【背景技術】

【0002】

水環境保全や水資源管理の分野では、河川やダムなど水が流入する場所における流量を、周辺地域の直近の雨量から予測することが行われている。流量予測には、事前に最適化された係数を含む予測モデルが用いられる。予測モデルは、過去の雨量および流量を示す訓練データから生成される。ただし、流量を予測したい場所に対して、多量の訓練データを収集することが難しいことがある。そのため、線形近似モデルなど、少量の訓練データから生成されるシンプルな予測モデルが使用されることがある。

【0003】

なお、現在時刻までの実測雨量と現在時刻から先の予想雨量とを含む雨量パターンから、最適化済み係数を読み出し、貯留関数法によってダム流入量を予測するダム流入量予測方法が提案されている。また、複数の地域それぞれの雨量の時系列データから、線形関数によって、雨水処理場への雨水流入量を予測する雨水流入量予測方法が提案されている。

【0004】

また、水位予測地点とその周辺の地形情報から、水位予測地点との関連性が高い雨量観測地点を選択し、選択した雨量観測地点の実測雨量から、水位予測地点における水位を予測する河川水位予測方法が提案されている。また、実効雨量の時系列データから、伝達関数によってダム流入量を予測する発電用ダム流入量予測方法が提案されている。

【先行技術文献】

【特許文献】

【0005】

【特許文献1】特開平８－２１９８２８号公報

【特許文献2】特開２００８－１８４７８３号公報

【特許文献3】特開２０２０－２６５８号公報

【非特許文献】

【0006】

【非特許文献1】一柳勝宏、小林英夫、水野慎也、松村年郎、鬼頭幸生、「降雨パターンに対応した出水伝達関数による発電用ダム流入量予測手法」、電気学会論文誌Ｂ、１０８巻１号、３２～３８頁、１９８８年１月２０日

【発明の概要】

【発明が解決しようとする課題】

【0007】

ある場所の流量とある場所の雨量との間には、特定の関係が成立し得る。ただし、雨量と流量との間の関係は、その土地の特徴に応じて、特定の雨量レベルを境にその前後で大きく変化することがある。例えば、雨量が一定レベルを超えると、地中に貯留される水分が飽和し、雨量の増加に対して流量がより大きく増加することがある。そのため、単一の線形関数などのシンプルな予測モデルでは、雨量と流量の関係性の変化が反映されず、予測精度が低くなることがある。そこで、１つの側面では、本発明は、雨量から流量を予測する予測精度を向上させることを目的とする。

【課題を解決するための手段】

【0008】

１つの態様では、コンピュータに以下の処理を実行させる流量予測プログラムが提供される。複数の時刻の雨量を示す雨量データと複数の時刻の流量を示す流量データとに基づいて、雨量と流量との間の関係が変化する１以上の境界雨量を判定する。１以上の境界雨量に基づいて区切られる２以上の雨量区間に対応して、雨量から流量を予測するための２以上の予測モデルを生成する。

【0009】

また、１つの態様では、コンピュータに以下の処理を実行させる流量予測プログラムが提供される。雨量と流量との間の関係が変化する１以上の境界雨量と、１以上の境界雨量に基づいて区切られる２以上の雨量区間に対応して雨量から流量を予測するための２以上の予測モデルとを記憶する記憶部を参照して、複数の時刻の雨量を示す雨量データと１以上の境界雨量とに基づいて、２以上の予測モデルのうち使用する少なくとも１つの予測モデルを決定する。決定した予測モデルの出力から、雨量データに対応する流量を予測する。

【0010】

また、１つの態様では、コンピュータが実行する流量予測方法が提供される。また、１つの態様では、記憶部と処理部とを有する情報処理装置が提供される。

【発明の効果】

【0011】

１つの側面では、雨量から流量を予測する予測精度が向上する。

【図面の簡単な説明】

【0012】

【図1】第１の実施の形態の情報処理装置を説明するための図である。

【図2】第２の実施の形態の情報処理システムの例を示す図である。

【図3】情報処理装置のハードウェア例を示すブロック図である。

【図4】降雨が河川に流入するメカニズムの例を示す図である。

【図5】流域平均雨量とＮ時間雨量の例を示すグラフである。

【図6】流量のピーク検出の例を示すグラフである。

【図7】Ｎ時間雨量と流量の関係例を示すグラフである。

【図8】訓練データの分類例を示すグラフである。

【図9】シグモイド関数の例を示すグラフである。

【図10】複数の予測モデルの予測値の合成例を示す図である。

【図11】情報処理装置の機能例を示すブロック図である。

【図12】測定データテーブルの例を示す図である。

【図13】訓練データテーブルの例を示す図である。

【図14】パラメータテーブルの例を示す図である。

【図15】モデル生成の手順例を示すフローチャートである。

【図16】流量予測の手順例を示すフローチャートである。

【発明を実施するための形態】

【0013】

以下、本実施の形態を図面を参照して説明する。
［第１の実施の形態］
第１の実施の形態を説明する。

【0014】

図１は、第１の実施の形態の情報処理装置を説明するための図である。
第１の実施の形態の情報処理装置１０は、機械学習によって予測モデルを生成し、予測モデルを用いて雨量から流量を予測する。情報処理装置１０は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置１０が、コンピュータ、分析装置、機械学習装置または流量予測装置と呼ばれてもよい。

【0015】

情報処理装置１０は、記憶部１１および処理部１２を有する。記憶部１１は、ＲＡＭ（Random Access Memory）などの揮発性半導体メモリでもよいし、ＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの不揮発性ストレージでもよい。処理部１２は、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＤＳＰ（Digital Signal Processor）などのプロセッサである。ただし、処理部１２が、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）などの特定用途の電子回路を含んでもよい。プロセッサは、例えば、ＲＡＭなどのメモリに記憶されたプログラムを実行する。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

【0016】

記憶部１１は、雨量データ１３および流量データ１４を記憶する。雨量データ１３および流量データ１４は、訓練データと呼ばれてもよい。雨量データ１３は、過去の複数の時刻における雨量を示す時系列データである。雨量データ１３が示す雨量は、例えば、特定の場所に設置された雨量計を用いて測定される。ただし、雨量データ１３が示す雨量は、直近の一定時間（例えば、６時間）の測定値を合計したＮ時間雨量であってもよい。また、雨量データ１３は、２以上の場所の雨量の雨量データを含んでもよい。また、雨量データ１３が示す雨量は、２以上の雨量計の測定値の単純平均または加重平均であってもよい。雨量の指標は、例えば、１０分間の降水量である。

【0017】

流量データ１４は、雨量データ１３と同じ過去の複数の時刻における流量を示す時系列データである。流量は、雨量に依存して変化する水流の量である。流量データ１４が示す流量は、例えば、河川やダムなどの特定の場所に設置された計測器を用いて測定される。雨量の測定場所と流量の測定場所は、同じでもよいし異なってもよい。例えば、雨量の測定場所は、流量の測定場所と同じ河川の上流であってもよい。流量の指標は、流入量または水位と呼ばれてもよい。例えば、流量の指標は、ダムに流入する単位時間当たりの水量、ダムの水位、ダムの水位の変化量、河川を通過する単位時間当たりの水量、河川の水位、または、河川の水位の変化量であってもよい。

【0018】

処理部１２は、雨量データ１３および流量データ１４を用いて、雨量から流量を予測するための予測モデルを生成する。このとき、処理部１２は、雨量と流量との間の関係が変化する１以上の境界雨量を判定する。境界雨量は、雨量変化点と呼ばれてもよい。雨量と流量の関係の変化は、地中に貯留される貯留水の飽和によって発生することがある。

【0019】

例えば、処理部１２は、雨量データ１３が示す雨量と流量データ１４が示す流量とを対応付けた散布図を生成し、散布図の点に対して曲線をフィッティングする。曲線は、雨量が大きいほど傾きが大きくなる下に凸の曲線であってもよい。処理部１２は、２以上の線分によって曲線を近似し、誤差が小さくなるように線分の境界を決定する。例えば、処理部１２は、境界雨量１５（境界雨量Ｒｍ）を判定する。

【0020】

なお、境界雨量の個数は固定でもよいし可変でもよい。例えば、境界雨量の個数は、誤差が小さくなるよう最適化されてもよい。土壌が複数の地層を含む場合や土壌からの水分の流出が植物の影響を受ける場合、雨量と流量の関係の変化点が複数現れることがある。

【0021】

処理部１２は、１以上の境界雨量に基づいて区切られる２以上の雨量区間を特定し、２以上の雨量区間に対応する２以上の予測モデルを生成する。例えば、処理部１２は、雨量が境界雨量１５以下である雨量区間に対応する予測モデル１６と、雨量が境界雨量１５を超える雨量区間に対応する予測モデル１７とを生成する。予測モデル１６，１７は、線形関数など比較的シンプルな機械学習モデルであってもよい。

【0022】

このとき、処理部１２は、雨量データ１３および流量データ１４から、２以上の雨量区間に対応する２以上の訓練データセットを生成する。処理部１２は、各雨量区間の予測モデルを、当該雨量区間に対応する訓練データセットから生成する。例えば、処理部１２は、境界雨量１５以下の雨量をもつ訓練データセットから予測モデル１６を生成し、境界雨量１５を超える雨量をもつ訓練データセットから予測モデル１７を生成する。なお、２つの雨量区間が、境界雨量１５を挟んで隣接してもよい。また、２つの雨量区間が、境界雨量１５を含む一定幅の区間だけ重複するように形成されてもよい。また、２つの雨量区間が、境界雨量１５を含む一定幅の区間だけ除外されるように不連続に形成されてもよい。

【0023】

なお、記憶部１１は、生成された予測モデル１６，１７を記憶してもよい。また、記憶部１１は、判定された境界雨量１５を示す情報を記憶してもよい。
２以上の予測モデルが生成された後、処理部１２は、雨量データ１８を取得する。雨量データ１８は、記憶部１１に記憶されていてもよい。雨量データ１８は、雨量データ１３とは異なる複数の時刻の雨量を示す。雨量データ１８が示す雨量は、例えば、雨量データ１３と同じ場所の雨量計を用いて測定される。ただし、雨量データ１８が示す雨量は、Ｎ時間雨量であってもよく、２以上の雨量計の測定値の単純平均または加重平均であってもよい。また、雨量データ１８は、予報データを含んでもよい。予報データは、現在以降の雨量の予想値を示すものであってもよい。

【0024】

処理部１２は、雨量データ１８と１以上の境界雨量とに基づいて、２以上の予測モデルのうち使用する少なくとも１つの予測モデルを決定する。そして、処理部１２は、決定した予測モデルの出力から、雨量データ１８の時刻に対応する流量を予測する。

【0025】

例えば、処理部１２は、雨量データ１８が示す雨量と境界雨量１５とを比較して、雨量データ１８が示す雨量の属する雨量区間を特定し、特定した雨量区間に対応する予測モデルを選択する。また、処理部１２は、雨量データ１８から予測モデルの入力データを生成する。処理部１２は、選択された予測モデルによる入力データに対する出力から、流量の予測値を算出する。選択された予測モデルの出力が、流量の予測値そのものであってもよい。また、処理部１２は、予測モデルを選択する前に２以上の予測モデルそれぞれに入力データを入力してもよいし、選択された予測モデルのみに入力データを入力してもよい。

【0026】

例えば、処理部１２は、雨量データ１８が示す雨量と境界雨量１５とを比較する。雨量が境界雨量１５以下である場合、処理部１２は、予測モデル１６を選択し、入力データに対する予測モデル１６の出力を流量の予測値として採用する。一方、雨量が境界雨量１５を超える場合、処理部１２は、予測モデル１７を選択し、入力データに対する予測モデル１７の出力を流量の予測値として採用する。

【0027】

ただし、雨量データ１８の示す雨量が境界雨量１５付近である場合、処理部１２は、境界雨量１５の前後にある２つの雨量区間に対応する予測モデル１６，１７の両方を選択してもよい。その場合、処理部１２は、予測モデル１６，１７の出力の単純平均または加重平均を、流量の予測値として採用してもよい。また、処理部１２は、２以上の雨量区間それぞれと雨量データ１８が示す雨量との間の距離に基づいて、２以上の予測モデルの全部または一部に対する重みを決定してもよい。その場合、処理部１２は、２以上の予測モデルの全部または一部の出力の加重平均を、流量の予測値として採用してもよい。

【0028】

処理部１２は、流量の予測値を出力する。例えば、処理部１２は、情報処理装置１０が有する不揮発性ストレージに流量の予測値を保存する。また、例えば、処理部１２は、情報処理装置１０が有する表示装置に流量の予測値を表示する。また、例えば、処理部１２は、他の情報処理装置に流量の予測値を送信する。なお、予測モデル１６，１７の生成と予測モデル１６，１７を用いた流量予測とを、異なる情報処理装置が実行してもよい。

【0029】

以上説明したように、第１の実施の形態の情報処理装置１０は、過去の雨量データと過去の流量データから、雨量と流量の関係が変化する１以上の境界雨量を判定し、境界雨量に基づいて区切られる２以上の雨量区間に対応する２以上の予測モデルを生成する。そして、情報処理装置１０は、他の雨量データと境界雨量に基づいて、使用する予測モデルを決定し、他の雨量データが示す雨量に対応する流量を予測する。

【0030】

これにより、地中の貯留水の飽和など、雨量と流量の関係性が変化する現象が予測値に反映される。よって、単一の予測モデルを使用する場合と比べて、流量予測の精度が向上する。また、２以上の予測モデルはそれぞれ、線形関数など比較的シンプルな機械学習モデルであってもよい。よって、ニューラルネットワークや非線形関数などの複雑な機械学習モデルを使用する場合と比べて、少ない訓練データからでも予測モデルを生成することが可能であり、訓練データを収集するコストや機械学習の計算量が低減する。

【0031】

［第２の実施の形態］
次に、第２の実施の形態を説明する。
図２は、第２の実施の形態の情報処理システムの例を示す図である。

【0032】

第２の実施の形態の情報処理システムは、雨量および流量の測定データを収集し、過去における雨量と流量の関係を分析して流量予測モデルを生成し、現在の雨量と流量予測モデルとに基づいて今後の流量を予測する。第２の実施の形態の情報処理システムは、計測器３１，３２，３３および情報処理装置１００を含む。

【0033】

計測器３１は、河川３０の途中にあるダムへの水の流入量を流量として測定する。流量の単位は、立方メートル毎秒（ｍ^３／ｓ）である。この流量は、ダムの水位やダムの放水量などの他の指標から間接的に測定されてもよい。

【0034】

計測器３２，３３は、雨量を測定する雨量計である。雨量の測定値は１０分間雨量であり、雨量の単位はミリメートル（ｍｍ）である。計測器３２，３３は、河川３０の流域であって計測器３１の上流側に設置されている。計測器３２，３３が設置された場所の降雨が、ダムの流量に影響を与える。計測器３２は、ある小エリアを代表する代表点とみなされ、計測器３３は、計測器３２とは別の小エリアを代表する代表点とみなされる。図２では２個の雨量計を示したが、一般にＭ個（Ｍは２以上の整数）の雨量計が使用される。

【0035】

計測器３１によって測定される流量および計測器３２，３３によって測定される雨量を示す測定データが、継続的に収集される。情報処理装置１００は、この測定データを取得する。情報処理装置１００は、測定データを継続的に収集するデータベースサーバから、データ処理に使用する測定データを読み出すようにしてもよい。情報処理装置１００は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置１００が、コンピュータ、分析装置、機械学習装置または流量予測装置と呼ばれてもよい。本実施形態の情報処置装置１００では、モデル生成と流量予測を１台の装置が実行してもよいし、モデル生成と流量予測をそれぞれ別の装置が実行してもよい。

【0036】

情報処理装置１００は、過去の測定データを用いて、河川３０の途中にあるダムの流量と河川３０の流域にあるＭ個の雨量計の雨量との間の関係を分析し、それらＭ個の雨量計の雨量からダムの流量を予測するための予測モデルを生成する。予測モデルは、雨量と流量の関係を線形関数で表した線形モデルであることが好ましい。情報処理装置１００は、生成された予測モデルを保存する。その後、情報処理装置１００は、Ｍ個の雨量計の直近の雨量から入力データを生成し、予測モデルに入力データを入力して今後のダムの流量を予測する。情報処理装置１００は、流量の予測値を出力する。

【0037】

図３は、情報処理装置のハードウェア例を示すブロック図である。
情報処理装置１００は、バスに接続されたＣＰＵ１０１、ＲＡＭ１０２、ＨＤＤ１０３、ＧＰＵ１０４、入力インタフェース１０５、媒体リーダ１０６および通信インタフェース１０７を有する。ＣＰＵ１０１は、第１の実施の形態の処理部１２に対応する。ＲＡＭ１０２またはＨＤＤ１０３は、第１の実施の形態の記憶部１１に対応する。

【0038】

ＣＰＵ１０１は、プログラムの命令を実行するプロセッサである。ＣＰＵ１０１は、ＨＤＤ１０３に記憶されたプログラムおよびデータの少なくとも一部をＲＡＭ１０２にロードし、プログラムを実行する。情報処理装置１００は、複数のプロセッサを有してもよい。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。

【0039】

ＲＡＭ１０２は、ＣＰＵ１０１で実行されるプログラムおよびＣＰＵ１０１で演算に使用されるデータを一時的に記憶する揮発性半導体メモリである。情報処理装置１００は、ＲＡＭ以外の種類の揮発性メモリを有してもよい。

【0040】

ＨＤＤ１０３は、ＯＳ（Operating System）、ミドルウェア、アプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性ストレージである。情報処理装置１００は、フラッシュメモリやＳＳＤ（Solid State Drive）などの他の種類の不揮発性ストレージを有してもよい。

【0041】

ＧＰＵ１０４は、ＣＰＵ１０１と連携して画像を生成し、情報処理装置１００に接続された表示装置１１１に画像を出力する。表示装置１１１は、例えば、ＣＲＴ（Cathode Ray Tube）ディスプレイ、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイまたはプロジェクタである。なお、情報処理装置１００に、プリンタなどの他の種類の出力デバイスが接続されてもよい。

【0042】

入力インタフェース１０５は、情報処理装置１００に接続された入力デバイス１１２から入力信号を受け付ける。入力デバイス１１２は、例えば、マウス、タッチパネルまたはキーボードである。情報処理装置１００に複数の入力デバイスが接続されてもよい。

【0043】

媒体リーダ１０６は、記録媒体１１３に記録されたプログラムおよびデータを読み取る読み取り装置である。記録媒体１１３は、例えば、磁気ディスク、光ディスクまたは半導体メモリである。磁気ディスクには、フレキシブルディスク（ＦＤ：Flexible Disk）およびＨＤＤが含まれる。光ディスクには、ＣＤ（Compact Disc）およびＤＶＤ（Digital Versatile Disc）が含まれる。媒体リーダ１０６は、記録媒体１１３から読み取られたプログラムおよびデータを、ＲＡＭ１０２やＨＤＤ１０３などの他の記録媒体にコピーする。読み取られたプログラムは、ＣＰＵ１０１によって実行されることがある。

【0044】

記録媒体１１３は、可搬型記録媒体であってもよい。記録媒体１１３は、プログラムおよびデータの配布に用いられることがある。また、記録媒体１１３およびＨＤＤ１０３が、コンピュータ読み取り可能な記録媒体と呼ばれてもよい。

【0045】

通信インタフェース１０７は、ネットワーク１１４に接続され、ネットワーク１１４を介して他の情報処理装置と通信する。通信インタフェース１０７は、スイッチやルータなどの有線通信装置に接続される有線通信インタフェースでもよいし、基地局やアクセスポイントなどの無線通信装置に接続される無線通信インタフェースでもよい。

【0046】

前述のように、情報処理装置１００は、複雑性を抑えた線形モデルを予測モデルとして用いて流量を予測する。これにより、河川３０について測定データの蓄積が少ない場合であっても、情報処理装置１００は、少ない訓練データから予測モデルを生成できる。しかし、雨量が特定の雨量レベルを超えると、雨量と流量の関係が大きく変化することがある。このため、単一の線形モデルでは広い雨量範囲をカバーすることが難しいことがある。

【0047】

図４は、降雨が河川に流入するメカニズムの例を示す図である。
河川３０の周辺の土壌から河川３０へは、表面流出水３４、中間流出水３５および地下水３６が流入する。表面流出水３４は、降雨のうち地表を流れる水分である。中間流出水３５は、降雨のうち地中の浅い部分を流れる水分である。地中には、貯留水３７が蓄積される。雨量が少ないうちは、地中の貯留水３７が飽和していないため、表面流出水３４および中間流出水３５に加えて、貯留水３７にも降雨が分配される。一方、雨量が多くなると、地中の貯留水３７が飽和し、表面流出水３４が増大する。

【0048】

よって、貯留水３７が飽和するような雨量を境界として、雨量と流量の関係性が大きく変化する。なお、土壌が複数の地層を含む場合や河川３０の流域に植物が多い場合には、雨量と流量の関係性が変化する変化点が２つ以上出現することもある。

【0049】

このように、雨量レベルに応じて雨量と流量の関係性が大きく変化することがあり、単一の線形モデルによって関係性を線形近似することが難しいことがある。その結果、予測モデルの予測精度が低下することがある。そこで、情報処理装置１００は、雨量と流量の関係性が変化する境界雨量を検出し、境界雨量に基づいて区切られる雨量区間毎に、線形モデルを予測モデルとして生成する。以下、複数の予測モデルを生成する機械学習と、それら複数の予測モデルを利用した流量予測について説明する。

【0050】

図５は、流域平均雨量とＮ時間雨量の例を示すグラフである。
情報処理装置１００は、過去の測定データを分析してＳ－１個（Ｓは２以上の整数）の境界雨量を検出する。境界雨量の個数は固定でもよいし、ユーザから値が指定されるハイパーパラメータであってもよい。例えば、Ｓ＝２である。

【0051】

まず、情報処理装置１００は、Ｍ個の雨量計によって測定される１０分間隔の雨量から、各時刻の流域平均雨量を算出する。流域平均雨量は、同一時刻のＭ個の雨量を、Ｍ個の雨量計が代表するＭ個の小エリアの面積比で重み付けした加重平均雨量である。流域平均雨量を算出するため、情報処理装置１００は、各小エリアの面積を予め知っている。

【0052】

そして、情報処理装置１００は、各時刻に対して、直近Ｎ時間の流域平均雨量を合算したＮ時間雨量を算出する。例えば、Ｎ時間雨量は６時間雨量である。その場合、各時刻に対して、直近３６個の流域平均雨量が合算される。曲線４１はＮ時間雨量を示し、曲線４２は流域平均雨量を示す。ただし、表示の都合上、流域平均雨量の値は５倍されている。

【0053】

図６は、流量のピーク検出の例を示すグラフである。
次に、情報処理装置１００は、雨量の測定時刻に対応する１０分間隔の流量を時系列に並べる。曲線４３は流量を示す。情報処理装置１００は、曲線４３の中から、最大流量が測定された時刻を終点Ｐｅとして検出する。また、情報処理装置１００は、終点Ｐｅから遡って流量を走査し、直前の極小流量が測定された時刻を始点Ｐｓとして検出する。情報処理装置１００は、始点Ｐｓから終点Ｐｅまでの間のＮ時間雨量および流量を抽出する。

【0054】

図７は、Ｎ時間雨量と流量の関係例を示すグラフである。
情報処理装置１００は、上記で抽出されたＮ時間雨量および流量に基づいて、横軸がＮ時間雨量であり縦軸が流量である散布図を生成する。情報処理装置１００は、始点Ｐｓから終点Ｐｅまでの各時刻（始点Ｐｓおよび終点Ｐｅを含む）について、Ｎ時間雨量と流量の組に対応する点を散布図にプロットする。通常、始点Ｐｓに相当する点は散布図の最も左下に位置し、終点Ｐｅに相当する点は散布図の最も右上に位置する。

【0055】

散布図が生成されると、情報処理装置１００は、散布図に含まれる点の集合を最も良く近似する曲線４４を算出する。通常、曲線４４は、Ｎ時間雨量が大きいほど傾きが大きい下に凸の曲線である。曲線４４は、非線形関数によって表現される。ｎ次関数や指数関数といった非線形関数のフォーマットは、固定でもよいしフィッティングを通じて決定されてもよい。例えば、情報処理装置１００は、散布図に含まれる点の集合をフーリエ級数で近似する。情報処理装置１００は、点の集合と曲線４４との間の誤差が最小になるように、フィッティングを通じてフーリエ係数を最適化する。

【0056】

曲線４４が算出されると、情報処理装置１００は、曲線４４の上にＳ－１個の内分点を設定して、曲線４４をＳ個の部分曲線に分割する。情報処理装置１００は、Ｓ個の部分曲線それぞれに対して、部分曲線を近似する線分を算出し、部分曲線と線分との間の距離ｄを算出する。情報処理装置１００は、Ｓ個の部分曲線の距離ｄを合算して合計距離を算出し、合計距離が最小になるようにＳ－１個の内分点を最適化する。最適化されたＳ－１個の内分点におけるＮ時間雨量が、境界雨量である。なお、本実施形態では線分を処理の対象としているが、線分を含む直線を処理の対象としてよい。

【0057】

ここではＳ＝２の場合について説明する。情報処理装置１００は、曲線４４の上に内分点Ｐｍを設定する。情報処理装置１００は、内分点Ｐｍと始点Ｐｓ側の端点とを結ぶ線分４５を算出する。始点Ｐｓ側の端点は、始点ＰｓにおけるＮ時間雨量と流量の組を表す点でもよいし、始点ＰｓのＮ時間雨量に対応する曲線４４上の点でもよいし、始点Ｐｓの流量に対応する曲線４４上の点でもよい。また、情報処理装置１００は、内分点Ｐｍと終点Ｐｅ側の端点とを結ぶ線分４６を算出する。終点Ｐｅの端点は、終点ＰｅにおけるＮ時間雨量と流量の組を表す点でもよいし、終点ＰｅのＮ時間雨量に対応する曲線４４上の点でもよいし、終点Ｐｅの流量に対応する曲線４４上の点でもよい。

【0058】

情報処理装置１００は、線分４５と曲線４４との間の距離ｄ_１を算出する。距離ｄ_１は、例えば、線分４５と曲線４４の差の積分、すなわち、線分４５と曲線４４の間の面積である。ただし、距離ｄ_１が、線分４５から見た曲線４４の高さであってもよい。同様に、情報処理装置１００は、線分４６と曲線４４との間の距離ｄ_２を算出する。距離ｄ_２は、例えば、線分４６と曲線４４の差の積分、すなわち、線分４６と曲線４４の間の面積である。ただし、距離ｄ_２が、線分４６から見た曲線４４の高さであってもよい。

【0059】

情報処理装置１００は、距離ｄ_１，ｄ_２の和を合計距離として算出する。情報処理装置１００は、曲線４４の上で内分点Ｐｍを動かして、合計距離が最小になる内分点Ｐｍを検出する。最適化された内分点ＰｍにおけるＮ時間雨量が、境界雨量Ｒｍである。

【0060】

Ｓ－１個の境界雨量Ｒｍ_１，…，Ｒｍ_ｓ－１が算出されると、Ｎ時間雨量の全範囲がＳ個の雨量区間に分けられる。ただし、各境界雨量の前後Δが重複区間に設定され、その結果、連続する２つの雨量区間が２×Δだけ重複区間をもつ。これにより、境界雨量の判定精度が高くない場合であっても、予測モデルの精度の低下を抑制できる。Ｓ＝２の場合、低雨量側の雨量区間はＲｍ＋Δ以下であり、高雨量側の雨量区間はＲｍ－Δ以上である。一般に、ｊ番目の雨量区間は、Ｒｍ_ｊ－１－ΔからＲｍ_ｊ＋Δまでである。なお、Δは固定でもよいし、ユーザから値が指定されるハイパーパラメータであってもよい。

【0061】

情報処理装置１００は、過去の測定データが示す１つの時刻から１つの訓練データレコードを生成する。後述するように、１つの訓練データレコードは、Ｍ個の雨量計それぞれで測定された直近のＴ個の雨量と、その時刻の流量差とを含む。よって、１つの訓練データレコードは、Ｍ×Ｔ個の雨量を含む。流量差は、その時刻に測定された流量Ｉから基準流量Ｉ_０を引いた差分である。基準流量Ｉ_０は、河川３０における通常時の流量である。例えば、基準流量Ｉ_０は、過去の測定データに含まれる流量のうちの最頻値、または、雨量ゼロの時刻に測定された流量の平均値である。

【0062】

情報処理装置１００は、各訓練データレコードを、Ｓ個の雨量区間に対応するＳセットの訓練データに振り分ける。このとき、情報処理装置１００は、ある時刻のＮ時間雨量が属する雨量区間を特定し、その時刻の訓練データレコードを、特定された雨量区間に対応する訓練データに振り分ける。Ｓ個の雨量区間は重複区間をもつため、同一の訓練データレコードが２セットの訓練データに含まれることがある。これにより、情報処理装置１００は、Ｓ個の雨量区間に対応するＳセットの訓練データを生成する。

【0063】

図８は、訓練データの分類例を示すグラフである。
曲線４１は、図５で説明したように時系列のＮ時間雨量を示す。時間区間４７は、Ｎ時間雨量がＲｍ＋Δ以下の時間である。時間区間４８は、Ｎ時間雨量がＲｍ－Δ以上の時間である。時間区間４９は、Ｎ時間雨量がＲｍ＋Δ以下の時間である。時間区間４７と時間区間４８は、Ｎ時間雨量がＲｍ－ΔからＲｍ＋Δに増加する時間が存在するため、部分的に重複している。また、時間区間４８と時間区間４９は、Ｎ時間雨量がＲｍ＋ΔからＲｍ－Δに減少する時間が存在するため、部分的に重複している。

【0064】

時間区間４７，４９に属する各時刻について生成される訓練データレコードは、低雨量の予測モデル（予測モデル１）を生成するための訓練データに含まれる。時間区間４８に属する各時刻について生成される訓練データレコードは、高雨量の予測モデル（予測モデル２）を生成するための訓練データに含まれる。なお、上記説明ではΔは正の数であるが、Δをゼロとしてもよい。その場合、重複区間が無いことになる。また、境界雨量Ｒｍの個数が２以上である場合に、境界雨量Ｒｍ_ｊによって異なるΔ_ｊが使用されてもよい。

【0065】

Ｓセットの訓練データが生成されると、情報処理装置１００は、機械学習によって１セットの訓練データから１つの予測モデルを生成する。これにより、Ｓ個の予測モデルが生成される。例えば、情報処理装置１００は、訓練データレコードに含まれる雨量を予測モデルに入力し、予測モデルの出力と訓練データレコードに含まれる流量差との間の誤差を算出する。雨量は説明変数や入力データに相当し、流量差は目的変数や教師データに相当する。情報処理装置１００は、誤差が小さくなるように、予測モデルに含まれるパラメータを更新する。情報処理装置１００は、イテレーション回数が閾値に達するか、誤差が閾値未満になるまで、上記の処理を繰り返す。

【0066】

以下、予測モデルの例を説明する。予測モデルは、数式（１）に示す線形関数として規定される。数式（１）において、Ｉ_ｔは時刻ｔにおける流量であり、Ｉ_０は基準流量である。よって、数式（１）の左辺は、基準流量からの増加分である流量差を表す。また、ｒは、表面流出水と中間流出水の比率である内分比である。よって、数式（１）の右辺の第１項は表面流出水を表し、右辺の第２項は中間流出水を表す。

【0067】

【数1】

【0068】

α_ｉは、Ｍ個の雨量計の重みである。ｘ_ｉ，ｔは、雨量計ｉによって時刻ｔに測定された雨量である。Ｄ^ｓ _ｉは、雨量計ｉによって観測される降雨のうちの表面流出水の遅延時間である。Ｄ^ｍ _ｉは、雨量計ｉによって観測される降雨のうちの中間流出水の遅延時間である。λ^ｓ _ｉは、雨量計ｉによって観測される降雨のうちの表面流出水の時定数である。λ^ｍ _ｉは、雨量計ｉによって観測される降雨のうちの中間流出水の時定数である。Ｐ^ｓは、降雨後の表面流出水の減衰速度を示す減衰パラメータである。Ｐ^ｍは、降雨後の中間流出水の減衰速度を示す減衰パラメータである。

【0069】

数式（１）のφは、数式（２）の微分方程式を満たす減衰関数である。過去の雨量が流量に与える影響は、減衰関数φに従って徐々に減衰する。減衰関数φは、降雨直後は負の傾きをもち、時間経過に伴って傾きがゼロに漸近する下に凸の減衰曲線を表す。数式（２）において、τは経過時間であり、ｃは所定の固定値である。数式（２）の微分方程式を満たす減衰関数φは、数式（３）である。減衰関数φは、Ｐ＝１であるかＰ＞１であるかによって異なる。なお、Ｐ＜１の場合は減衰関数φは定義されない。よって、数式（１）の減衰パラメータＰ^ｓ，Ｐ^ｍの値は１以上である。

【0070】

【数2】

【0071】

【数3】

【0072】

ある２セットの訓練データを用いて２つの予測モデルを生成すると、低雨量用の予測モデルはｒ＝０．６を含み、高雨量用の予測モデルはｒ＝０．９を含むことがある。このように、高雨量用の予測モデルの方が低雨量用の予測モデルよりも、内分比ｒが大きい。これは、表面流出水と中間流出水の比率が高雨量時と低雨量時とで異なり、高雨量時の方が表面流出水の比率が大きくなることを意味する。なお、数式（１）の左辺は流量Ｉ_ｔそのものを含んでいるが、流量Ｉ_ｔを変換関数ｇで変換したｇ（Ｉ_ｔ）を用いてもよい。

【0073】

Ｓ個の予測モデルが生成された後、情報処理装置１００は、これらＳ個の予測モデルを利用して流量を予測する。時刻ｔにおける流量を予測したい場合、情報処理装置１００は、時刻ｔを基準として、Ｍ個の雨量計それぞれの直近Ｔ個の時刻の雨量を含む入力データを生成する。情報処理装置１００は、入力データに含まれるＭ×Ｔ個の雨量のうち、現時刻までに雨量計によって測定済みの雨量については、測定値（例えば、計測器３２，３３で測定された雨量）を用いる。一方、情報処理装置１００は、まだ測定されていない未来の雨量については、予報データに含まれる予想値を用いる。情報処理装置１００は、公的機関または気象予報会社のサーバ装置から、気象予報データを取得してもよい。

【0074】

情報処理装置１００は、入力データをＳ個の予測モデルにそれぞれ入力して、Ｓ個の予測値Ｊ_ｊ（ｊ＝１，…，Ｓ）を算出する。また、情報処理装置１００は、入力データから時刻ｔにおけるＮ時間雨量（Ｒ）を算出する。情報処理装置１００は、ＲとＳ－１個の境界雨量Ｒｍ_ｊ（ｊ＝１，…，Ｓ－１）それぞれとを比較して、Ｒが属する雨量区間を判定する。重複区間が存在するため、Ｒは１つまたは２つの雨量区間に属する。情報処理装置１００は、Ｒが属する１つまたは２つの雨量区間に対応する１つまたは２つの予測モデルの予測値を用いて、最終的な予測値Ｉを算出する。

【0075】

１つの予測モデルの予測値のみを使用する場合、情報処理装置１００は、当該１つの予測値を最終的な予測値Ｉとして採用する。２つの予測モデルの予測値を使用する場合、情報処理装置１００は、当該２つの予測値の重み付き和を最終的な予測値Ｉとして採用する。具体的には、予測値Ｉは数式（４）によって算出される。

【0076】

【数4】

【0077】

ＲがＲｍ_１－Δより小さい場合、予測値Ｉは、予測モデル１によって算出される予測値Ｊ_１である。ＲがＲｍ_ｊ－Δ以上かつＲｍ_ｊ＋Δ以下である場合、すなわち、Ｒが何れかの重複区間に属する場合、予測値Ｉは、予測モデルｊによって算出される予測値Ｊ_ｊと予測モデルｊ＋１によって算出される予測値Ｊ_ｊ＋１との重み付き和である。ＲがＲｍ_ｊ＋Δより大きくＲｍ_ｊ＋１－Δ未満である場合、すなわち、Ｒが２つの重複区間の間である場合、予測値Ｉは、予測モデルｊ＋１によって算出される予測値Ｊ_ｊ＋１である。ＲがＲｍ_Ｓ－１＋Δより大きい場合、予測値Ｉは、予測モデルＳによって算出される予測値Ｊ_Ｓである。

【0078】

Ｓ＝２の場合は以下の通りとなる。ＲがＲｍ－Δより小さい場合、予測値Ｉは、低雨量の予測モデルによって算出される予測値Ｊ_１である。ＲがＲｍ－Δ以上かつＲｍ＋Δ以下である場合、予測値Ｉは、低雨量の予測モデルによって算出される予測値Ｊ_１と高雨量の予測モデルによって算出される予測値Ｊ_２との重み付き和である。ＲがＲｍ＋Δより大きい場合、予測値Ｉは、高雨量の予測モデルによって算出される予測値Ｊ_２である。数式（４）において重み付けに使用されるσは、シグモイド関数である。

【0079】

図９は、シグモイド関数の例を示すグラフである。
曲線５１は、シグモイド関数であるｙ＝σ（ｘ）を示す。ｘ＝０のときｙ＝０．５である。ｘ＝－Δでｙ＝０に漸近し、ｘ＝＋Δでｙ＝１に漸近する。ｘが－Δから＋Δに増加する間、ｙは０から１に向かって単調に増加する。よって、Ｎ時間雨量が境界雨量Ｒｍ_ｊに一致する場合、最終的な予測値Ｉは２つの予測値Ｊ_ｊ，Ｊ_ｊ＋１の単純平均である。Ｎ時間雨量が境界雨量Ｒｍ_ｊより大きいほど予測値Ｊ_ｊ＋１の重みが大きくなり、Ｎ時間雨量が境界雨量Ｒｍ_ｊより小さいほど予測値Ｊ_ｊの重みが大きくなる。

【0080】

図１０は、複数の予測モデルの予測値の合成例を示す図である。
ここではＳ＝２である場合を考える。曲線５２は、流量の測定値を示す。曲線５３は、低雨量の雨量区間の予測モデルによって算出される流量の予測値を示す。曲線５４は、高雨量の雨量区間の予測モデルによって算出される流量の予測値を示す。曲線５５は、前述の合成方法によって算出される最終的な流量の予測値を示す。

【0081】

曲線５３が示すように、低雨量の雨量区間の予測モデルでは、小さい流量が高精度に予測される一方、大きい流量の予測精度が低下する。これは、低雨量の雨量区間の予測モデルには、Ｎ時間雨量が境界雨量を超えると雨量に対する流量の傾きが大きくなるという現象が反映されていないためである。また、曲線５４に示すように、高雨量の雨量区間の予測モデルでは、大きい流量が高精度に予測される一方、小さい流量の予測精度が低下する。これは、高雨量の雨量区間の予測モデルには、Ｎ時間雨量が境界雨量以下である間は雨量に対する流量の傾きが小さいという現象が反映されていないためである。これに対して、曲線５５が示すように、低雨量の雨量区間の予測モデルと高雨量の雨量区間の予測モデルとを併用することで、小さい流量と大きい流量の両方の予測精度が向上する。

【0082】

次に、情報処理装置１００の機能および処理手順について説明する。
図１１は、情報処理装置の機能例を示すブロック図である。
情報処理装置１００は、測定データ記憶部１２１、予報データ記憶部１２２および予測モデル記憶部１２３を有する。これらの記憶部は、例えば、ＲＡＭ１０２またはＨＤＤ１０３を用いて実装される。また、情報処理装置１００は、雨量変換部１３１，１３５、境界検出部１３２、訓練データ生成部１３３、予測モデル生成部１３４、予測値算出部１３６および予測値合成部１３７を有する。これらの処理部は、例えば、ＣＰＵ１０１とプログラムを用いて実装される。

【0083】

測定データ記憶部１２１は、測定された流量および雨量を示す測定データを記憶する。測定データは、計測器３１における１０分間隔の流量の測定値を含む。また、測定データは、計測器３２，３３などのＭ個の雨量計における１０分間隔の雨量の測定値を含む。

【0084】

予報データ記憶部１２２は、予想される現在時刻以降の雨量を示す予報データを記憶する。予報データは、Ｍ個の雨量計によって代表されるＭ個の小エリアにおける１０分間隔の雨量の予想値を含む。情報処理装置１００は、例えば、公的機関または気象予報会社のサーバ装置から予報データを受信する。予測モデル記憶部１２３は、情報処理装置１００が生成した雨量から流量を予測するための予測モデルを記憶する。

【0085】

雨量変換部１３１は、測定データ記憶部１２１に記憶された測定データからＭ個の雨量計の雨量を抽出し、Ｍ個の小エリアの面積比で重み付けして流域平均雨量を算出する。雨量変換部１３１は、１０分間隔の流域平均雨量を時系列に並べ、時刻毎に直近Ｎ時間分（例えば、３６個）の流域平均雨量を合算してＮ時間雨量を算出する。

【0086】

境界検出部１３２は、測定データから流量を抽出し、同一時刻のＮ時間雨量と流量との組に対応する点がプロットされた散布図を生成する。境界検出部１３２は、散布図に含まれる点の集合に対して曲線をフィッティングし、曲線をＳ個の線分で近似する。境界検出部１３２は、曲線とＳ個の線分との間の誤差が最小になるように線分間の境界を動かすことで、Ｎ時間雨量と流量の関係が変化するＳ－１個の境界雨量を検出する。

【0087】

訓練データ生成部１３３は、測定データに含まれる１０分間隔の雨量および流量から、時刻毎に、入力データと教師データを含む訓練データレコードを生成する。入力データは、Ｍ個の雨量計それぞれの直近Ｔ個の雨量である。教師データは、基準流量からの流量差である。訓練データ生成部１３３は、複数の時刻それぞれについて、境界雨量に基づいて区切られるＳ個の雨量区間のうち当該時刻のＮ時間雨量が属する雨量区間を特定し、当該時刻の訓練データレコードを、特定された雨量区間に対応する訓練データに追加する。これにより、Ｎ時間雨量に基づいて分類されたＳセットの訓練データが生成される。

【0088】

予測モデル生成部１３４は、機械学習によって１セットの訓練データにつき１個の予測モデルを生成する。これにより、Ｓ個の雨量区間に対応するＳ個の予測モデルが生成される。予測モデル生成部１３４は、生成されたＳ個の予測モデルのパラメータ値を予測モデル記憶部１２３に保存する。また、予測モデル生成部１３４は、雨量区間を特定するための境界雨量を予測モデル記憶部１２３に保存する。なお、予測モデル生成部１３４は、予測モデルを表示装置１１１に表示してもよいし、他の情報処理装置に送信してもよい。

【0089】

雨量変換部１３５は、流量を予測したい時刻ｔの入力を受け付ける。時刻ｔはユーザから入力されてもよい。雨量変換部１３５は、測定データ記憶部１２１に記憶された測定データから、Ｍ個の雨量計それぞれの直近Ｔ個の雨量のうち、現在までに測定済みの雨量を抽出する。また、雨量変換部１３５は、予報データ記憶部１２２に記憶された予報データから、Ｍ個の雨量計それぞれの直近Ｔ個の雨量のうち、未測定の雨量を抽出する。また、雨量変換部１３５は、雨量変換部１３１と同様の方法で、時刻ｔにおけるＮ時間雨量を算出する。具体的には、雨量変換部１３５は、時刻ｔ以前の各時刻の流域平均雨量を算出し、Ｎ時間分の流域平均雨量を合算する。

【0090】

予測値算出部１３６は、Ｍ個の雨量計それぞれの直近Ｔ個の雨量に該当する測定値および予想値から入力データを生成する。また、予測値算出部１３６は、予測モデル記憶部１２３からＳ個の予測モデルのパラメータ値を読み出す。予測値算出部１３６は、Ｓ個の予測モデルそれぞれに入力データを入力することで、Ｓ個の流量の予測値を算出する。予測モデルの出力が流量差である場合、流量差に基準流量を加算して流量が算出される。

【0091】

予測値合成部１３７は、境界雨量に基づいて区切られるＳ個の雨量区間のうち、時刻ｔのＮ時間雨量が属する１つまたは２つの雨量区間を特定する。予測値合成部１３７は、特定された１つまたは２つの雨量区間に対応する１つまたは２つの予測モデルの予測値を合成して、最終的な流量の予測値を算出する。特定された雨量区間が１つのみである場合、当該１つの雨量区間に対応する予測モデルの予測値が最終的な流量の予測値になる。特定された雨量区間が２つある場合、当該２つの雨量区間に対応する２つの予測モデルの予測値の重み付き和が、最終的な流量の予測値になる。

【0092】

予測値合成部１３７は、合成後の流量の予測値を出力する。予測値合成部１３７は、流量の予測値を表示装置１１１に表示してもよいし、ＨＤＤ１０３などの不揮発性ストレージに保存してもよいし、他の情報処理装置に送信してもよい。なお、予測モデル生成と流量予測を異なる情報処理装置が実行することも可能である。

【0093】

図１２は、測定データテーブルの例を示す図である。
測定データテーブル１２４は、測定データ記憶部１２１に記憶される。測定データテーブル１２４は、１０分間隔で測定された流量および雨量を示す。ここでは、流量と関連する雨量計が２個である、すなわち、Ｍ＝２である場合を説明する。測定データテーブル１２４の各レコードは、時刻、流量、雨量＃１および雨量＃２を含む。

【0094】

時刻は、流量および雨量が測定された時刻である。流量は、計測器３１を用いて測定されたダムの流入量である。流量の単位は立方メートル毎秒（ｍ^３／ｓ）である。雨量＃１は、計測器３２を用いて測定された１０分間雨量である。計測器３２は、小エリア＃１を代表する。雨量＃２は、計測器３３を用いて測定された１０分間雨量である。計測器３３は、小エリア＃２を代表する。雨量＃１，＃２の単位はミリメートル（ｍｍ）である。

【0095】

図１３は、訓練データテーブルの例を示す図である。
訓練データテーブル１２５は、訓練データ生成部１３３によって生成される。訓練データテーブル１２５は、例えば、ＲＡＭ１０２またはＨＤＤ１０３に記憶される。訓練データテーブル１２５は、Ｓ個の予測モデルに対応するＳセットの訓練データを記憶する。各訓練データは、複数の訓練データレコードを含む。ここでは、流量と関連する雨量計が２個である、すなわち、Ｍ＝２である場合を説明する。

【0096】

各訓練データレコードは、時刻ｔ－Ｔ＋１から時刻ｔまで（時刻ｔを含む）のＴ個の雨量＃１と、時刻ｔ－Ｔ＋１から時刻ｔまで（時刻ｔを含む）のＴ個の雨量＃２と、時刻ｔの流量とを含む。Ｔ個の雨量＃１およびＴ個の雨量＃２は、説明変数や入力データに相当する。流量は、目的変数や教師データに相当する。

【0097】

図１４は、パラメータテーブルの例を示す図である。
パラメータテーブル１２６は、予測モデル記憶部１２３に記憶される。パラメータテーブル１２６は、Ｓ個の予測モデルに対応するＳ個のパラメータセットを記憶する。ここでは、予測モデルが２個である、すなわち、Ｓ＝２である場合を説明する。各パラメータセットは、内分比ｒ、雨量計重みα、表面流出の遅延時間Ｄ^ｓ、中間流出の遅延時間Ｄ^ｍ、表面流出の時定数λ^ｓ、中間流出の時定数λ^ｍ、表面流出の減衰パラメータＰ^ｓ、中間流出の減衰パラメータＰ^ｍ、基準流量Ｉ_０および境界雨量Ｒｍを含む。雨量計重みα、遅延時間Ｄ^ｓ，Ｄ^ｍおよび時定数λ^ｓ，λ^ｍは、雨量計毎に与えられる。

【0098】

図１５は、モデル生成の手順例を示すフローチャートである。
（Ｓ１０）雨量変換部１３１は、測定データに現れる各時刻について、Ｍ個の雨量計の雨量をＭ個の小エリアの面積比で重み付けして流域平均雨量を算出する。

【0099】

（Ｓ１１）雨量変換部１３１は、測定データに現れる各時刻について、直近Ｎ時間分（例えば、３６個）の流域平均雨量を合算してＮ時間雨量を算出する。
（Ｓ１２）境界検出部１３２は、測定データの中で最大流量が測定されたピーク時刻を終点として検出し、ピーク時刻の前に流量が極小であった時刻を始点として検出する。

【0100】

（Ｓ１３）境界検出部１３２は、始点から終点までの各時刻のＮ時間雨量と流量を抽出し、Ｎ時間雨量と流量の関係を示す散布図を生成する。
（Ｓ１４）境界検出部１３２は、散布図に対して曲線をフィッティングする。例えば、境界検出部１３２は、誤差が最も小さいフーリエ級数を算出する。

【0101】

（Ｓ１５）境界検出部１３２は、曲線をＳ－１個の内分点でＳ個の部分曲線に分割し、各部分曲線を線分で近似する。境界検出部１３２は、Ｓ個の部分曲線とＳ個の線分との間の合計距離が最小になるように内分点を最適化して、Ｓ－１個の境界雨量を算出する。

【0102】

（Ｓ１６）訓練データ生成部１３３は、測定データに含まれる流量から、通常時の基準流量を算出する。基準流量は、例えば、流量の最頻値または無降雨時の平均流量である。
（Ｓ１７）訓練データ生成部１３３は、測定データに現れる各時刻に対応する訓練データレコードを生成する。訓練データレコードは、Ｍ個の雨量計それぞれの直近Ｔ個の雨量の測定値と、基準流量からの流量差とを含む。

【0103】

（Ｓ１８）訓練データ生成部１３３は、Ｓ個の雨量区間のうち各時刻のＮ時間雨量が属する１つまたは２つの雨量区間を特定する。訓練データ生成部１３３は、各時刻の訓練データレコードを、特定された雨量区間に対応する訓練データに分類する。これにより、訓練データ生成部１３３は、Ｓ個の雨量区間に対応するＳセットの訓練データを生成する。

【0104】

（Ｓ１９）予測モデル生成部１３４は、Ｓセットの訓練データを用いて機械学習を行い、予測モデルのＳ個のパラメータセットを決定する。例えば、予測モデル生成部１３４は、Ｓセットの訓練データそれぞれについて、訓練データレコードの入力データを予測モデルに入力し、予測モデルの出力と訓練データレコードの教師データとの誤差を算出し、誤差が小さくなるようにパラメータ値を更新する。予測モデル生成部１３４は、イテレーション回数または誤差に関する停止条件を満たすまでパラメータ値の更新を繰り返す。

【0105】

（Ｓ２０）予測モデル生成部１３４は、Ｓ個の雨量区間に対応するＳ個のパラメータセットを予測モデル記憶部１２３に保存する。
図１６は、流量予測の手順例を示すフローチャートである。

【0106】

（Ｓ３０）雨量変換部１３５は、何れの時点の流量を予測したいかを示す予測対象時刻（時刻ｔ）の入力を受け付ける。雨量変換部１３５は、時刻ｔの直近Ｔ時間のうち現在時刻以前の各時刻におけるＭ個の雨量計の測定値を、測定データから抽出する。また、雨量変換部１３５は、Ｔ時間のうち現在時刻から先の各時刻におけるＭ個の小エリアの雨量の予想値を、予報データから抽出する。雨量変換部１３５は、各時刻について、Ｍ個の雨量をＭ個の小エリアの面積比で重み付けして流域平均雨量を算出する。

【0107】

（Ｓ３１）雨量変換部１３５は、時刻ｔの直近Ｎ時間分（例えば、３６個）の流域平均雨量を合算して、時刻ｔにおけるＮ時間雨量を算出する。
（Ｓ３２）予測値算出部１３６は、時刻ｔの直近Ｔ時間におけるＭ個の雨量計それぞれの雨量の測定値および予想値を含む入力データを生成する。

【0108】

（Ｓ３３）予測値算出部１３６は、予測モデル記憶部１２３からＳ個のパラメータセットを読み出して、Ｓ個の予測モデルを取得する。予測値算出部１３６は、Ｓ個の予測モデルにそれぞれ入力データを入力して、Ｓ個の流量の予測値を算出する。

【0109】

（Ｓ３４）予測値合成部１３７は、時刻ｔにおけるＮ時間雨量とＳ－１個の境界雨量との関係から、Ｎ時間雨量が属する１つまたは２つの雨量区間を特定する。予測値合成部１３７は、特定された１つまたは２つの雨量区間に対応する１つまたは２つの予測モデルの予測値を合成して、最終的な流量の予測値を算出する。

【0110】

（Ｓ３５）予測値合成部１３７は、時刻ｔにおける流量の予測値を出力する。予測値合成部１３７は、流量の予測値を表示装置１１１に表示してもよいし、ＨＤＤ１０３などの不揮発性ストレージに保存してもよいし、他の情報処理装置に送信してもよい。

【0111】

以上説明したように、第２の実施の形態の情報処理装置１００は、予測モデルを用いて、河川流域の雨量から河川の流量を予測する。よって、情報処理装置１００は、治水政策や防災対策に役立つ有用な情報を提供することができる。また、情報処理装置１００は、雨量と流量の関係を線形近似した線形モデルを、予測モデルとして機械学習によって生成する。よって、ニューラルネットワークや非線形モデルなどの複雑な予測モデルと比べて、情報処理装置１００は、少ない訓練データからでも高精度な予測モデルを生成できる。このため、特定の河川の雨量および流量を示す測定データの収集コストが低減する。また、機械学習の計算量が減少し、機械学習の実行時間が短縮される。

【0112】

また、情報処理装置１００は、過去の測定データを分析して、雨量と流量の関係が変化する境界雨量を検出し、境界雨量の前後で異なる予測モデルを生成する。例えば、情報処理装置１００は、低雨量の予測モデルと高雨量の予測モデルとを生成する。よって、地中の貯留水の飽和など雨量と流量の関係が大きく変化する自然現象が流量予測に反映され、予測精度が向上する。また、境界雨量を挟んで連続する２つの雨量区間は、一部重複するように設定される。よって、境界雨量の検出精度が予測モデルの予測精度に与える影響を緩和できる。また、情報処理装置１００は、予測時の雨量が境界雨量に近い場合、その前後の予測モデルの出力を合成して流量の予測値を決定する。よって、雨量の変化に対して流量の予測値が連続的に変化し、予測精度が向上する。

【符号の説明】

【0113】

１０情報処理装置
１１記憶部
１２処理部
１３，１８雨量データ
１４流量データ
１５境界雨量
１６，１７予測モデル

【図1】