IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2022-156802流量予測プログラム、流量予測方法および情報処理装置
<>
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図1
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図2
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図3
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図4
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図5
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図6
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図7
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図8
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図9
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図10
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図11
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図12
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図13
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図14
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図15
  • 特開-流量予測プログラム、流量予測方法および情報処理装置 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022156802
(43)【公開日】2022-10-14
(54)【発明の名称】流量予測プログラム、流量予測方法および情報処理装置
(51)【国際特許分類】
   G06Q 10/04 20120101AFI20221006BHJP
   E02B 1/00 20060101ALI20221006BHJP
   G01F 1/00 20220101ALI20221006BHJP
   G16Z 99/00 20190101ALI20221006BHJP
【FI】
G06Q10/04
E02B1/00 Z
G01F1/00 H
G16Z99/00
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2021060674
(22)【出願日】2021-03-31
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】特許業務法人扶桑国際特許事務所
(72)【発明者】
【氏名】宗 美佐子
【テーマコード(参考)】
2F030
5L049
【Fターム(参考)】
2F030CC05
2F030CE01
5L049AA04
5L049DD01
(57)【要約】      (修正有)
【課題】雨量から流量を予測する予測精度を向上させる流量予測プログラム、流量予測方法及び情報処理装置を提供する。
【解決手段】情報処理装置10において、複数の時刻の雨量を示す雨量データ13と複数の時刻の流量を示す流量データ14とを記憶する記憶部11と、雨量データ13と流量データ14とに基づいて、雨量と流量との間の関係が変化する境界雨量15を判定し、境界雨量15に基づいて区切られる雨量区間に対応して、雨量から流量を予測するための予測モデル16,17を生成する処理部12とを備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
コンピュータに、
複数の時刻の雨量を示す雨量データと前記複数の時刻の流量を示す流量データとに基づいて、雨量と流量との間の関係が変化する1以上の境界雨量を判定し、
前記1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して、雨量から流量を予測するための2以上の予測モデルを生成する、
処理を実行させる流量予測プログラム。
【請求項2】
前記判定では、直前の一定時間の合計雨量と流量との間の関係を示す曲線を算出し、前記曲線を2以上の直線で近似することで前記1以上の境界雨量を判定する、
請求項1記載の流量予測プログラム。
【請求項3】
前記生成では、前記雨量データと前記流量データとに基づいて、前記2以上の雨量区間に対応する2以上の訓練データセットを生成し、前記2以上の訓練データセットを用いて前記2以上の予測モデルを生成し、
前記2以上の雨量区間のうちの連続する2つの雨量区間が重複区間を含んでおり、前記重複区間に属する雨量をもつ訓練データレコードは、前記連続する2つの雨量区間に対応する2つの訓練データセットの両方に含まれる、
請求項1記載の流量予測プログラム。
【請求項4】
雨量と流量との間の関係が変化する1以上の境界雨量と、前記1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して雨量から流量を予測するための2以上の予測モデルとを記憶する記憶部を参照して、複数の時刻の雨量を示す雨量データと前記1以上の境界雨量とに基づいて、前記2以上の予測モデルのうち使用する少なくとも1つの予測モデルを決定し、
前記決定した予測モデルの出力から、前記雨量データに対応する流量を予測する、
処理を実行させる流量予測プログラム。
【請求項5】
前記2以上の雨量区間のうちの連続する2つの雨量区間が重複区間を含んでおり、
前記決定では、前記雨量データが示す雨量が前記重複区間に属する場合、前記連続する2つの雨量区間に対応する2つの予測モデルを決定し、
前記予測では、前記2つの予測モデルの出力を合成して流量の予測値を算出する、
請求項4記載の流量予測プログラム。
【請求項6】
コンピュータが、
複数の時刻の雨量を示す雨量データと前記複数の時刻の流量を示す流量データとに基づいて、雨量と流量との間の関係が変化する1以上の境界雨量を判定し、
前記1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して、雨量から流量を予測するための2以上の予測モデルを生成する、
流量予測方法。
【請求項7】
雨量と流量との間の関係が変化する1以上の境界雨量と、前記1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して雨量から流量を予測するための2以上の予測モデルとを記憶する記憶部を参照して、複数の時刻の雨量を示す雨量データと前記1以上の境界雨量とに基づいて、前記2以上の予測モデルのうち使用する少なくとも1つの予測モデルを決定し、
前記決定した予測モデルの出力から、前記雨量データに対応する流量を予測する、
流量予測方法。
【請求項8】
複数の時刻の雨量を示す雨量データと前記複数の時刻の流量を示す流量データとを記憶する記憶部と、
前記雨量データと前記流量データとに基づいて、雨量と流量との間の関係が変化する1以上の境界雨量を判定し、前記1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して、雨量から流量を予測するための2以上の予測モデルを生成する処理部と、
を有する情報処理装置。
【請求項9】
雨量と流量との間の関係が変化する1以上の境界雨量と、前記1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して雨量から流量を予測するための2以上の予測モデルとを記憶する記憶部と、
前記記憶部を参照して、複数の時刻の雨量を示す雨量データと前記1以上の境界雨量とに基づいて、前記2以上の予測モデルのうち使用する少なくとも1つの予測モデルを決定し、前記決定した予測モデルの出力から、前記雨量データに対応する流量を予測する処理部と、
を有する情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は流量予測プログラム、流量予測方法および情報処理装置に関する。
【背景技術】
【0002】
水環境保全や水資源管理の分野では、河川やダムなど水が流入する場所における流量を、周辺地域の直近の雨量から予測することが行われている。流量予測には、事前に最適化された係数を含む予測モデルが用いられる。予測モデルは、過去の雨量および流量を示す訓練データから生成される。ただし、流量を予測したい場所に対して、多量の訓練データを収集することが難しいことがある。そのため、線形近似モデルなど、少量の訓練データから生成されるシンプルな予測モデルが使用されることがある。
【0003】
なお、現在時刻までの実測雨量と現在時刻から先の予想雨量とを含む雨量パターンから、最適化済み係数を読み出し、貯留関数法によってダム流入量を予測するダム流入量予測方法が提案されている。また、複数の地域それぞれの雨量の時系列データから、線形関数によって、雨水処理場への雨水流入量を予測する雨水流入量予測方法が提案されている。
【0004】
また、水位予測地点とその周辺の地形情報から、水位予測地点との関連性が高い雨量観測地点を選択し、選択した雨量観測地点の実測雨量から、水位予測地点における水位を予測する河川水位予測方法が提案されている。また、実効雨量の時系列データから、伝達関数によってダム流入量を予測する発電用ダム流入量予測方法が提案されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開平8-219828号公報
【特許文献2】特開2008-184783号公報
【特許文献3】特開2020-2658号公報
【非特許文献】
【0006】
【非特許文献1】一柳勝宏、小林英夫、水野慎也、松村年郎、鬼頭幸生、「降雨パターンに対応した出水伝達関数による発電用ダム流入量予測手法」、電気学会論文誌B、108巻1号、32~38頁、1988年1月20日
【発明の概要】
【発明が解決しようとする課題】
【0007】
ある場所の流量とある場所の雨量との間には、特定の関係が成立し得る。ただし、雨量と流量との間の関係は、その土地の特徴に応じて、特定の雨量レベルを境にその前後で大きく変化することがある。例えば、雨量が一定レベルを超えると、地中に貯留される水分が飽和し、雨量の増加に対して流量がより大きく増加することがある。そのため、単一の線形関数などのシンプルな予測モデルでは、雨量と流量の関係性の変化が反映されず、予測精度が低くなることがある。そこで、1つの側面では、本発明は、雨量から流量を予測する予測精度を向上させることを目的とする。
【課題を解決するための手段】
【0008】
1つの態様では、コンピュータに以下の処理を実行させる流量予測プログラムが提供される。複数の時刻の雨量を示す雨量データと複数の時刻の流量を示す流量データとに基づいて、雨量と流量との間の関係が変化する1以上の境界雨量を判定する。1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して、雨量から流量を予測するための2以上の予測モデルを生成する。
【0009】
また、1つの態様では、コンピュータに以下の処理を実行させる流量予測プログラムが提供される。雨量と流量との間の関係が変化する1以上の境界雨量と、1以上の境界雨量に基づいて区切られる2以上の雨量区間に対応して雨量から流量を予測するための2以上の予測モデルとを記憶する記憶部を参照して、複数の時刻の雨量を示す雨量データと1以上の境界雨量とに基づいて、2以上の予測モデルのうち使用する少なくとも1つの予測モデルを決定する。決定した予測モデルの出力から、雨量データに対応する流量を予測する。
【0010】
また、1つの態様では、コンピュータが実行する流量予測方法が提供される。また、1つの態様では、記憶部と処理部とを有する情報処理装置が提供される。
【発明の効果】
【0011】
1つの側面では、雨量から流量を予測する予測精度が向上する。
【図面の簡単な説明】
【0012】
図1】第1の実施の形態の情報処理装置を説明するための図である。
図2】第2の実施の形態の情報処理システムの例を示す図である。
図3】情報処理装置のハードウェア例を示すブロック図である。
図4】降雨が河川に流入するメカニズムの例を示す図である。
図5】流域平均雨量とN時間雨量の例を示すグラフである。
図6】流量のピーク検出の例を示すグラフである。
図7】N時間雨量と流量の関係例を示すグラフである。
図8】訓練データの分類例を示すグラフである。
図9】シグモイド関数の例を示すグラフである。
図10】複数の予測モデルの予測値の合成例を示す図である。
図11】情報処理装置の機能例を示すブロック図である。
図12】測定データテーブルの例を示す図である。
図13】訓練データテーブルの例を示す図である。
図14】パラメータテーブルの例を示す図である。
図15】モデル生成の手順例を示すフローチャートである。
図16】流量予測の手順例を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、本実施の形態を図面を参照して説明する。
[第1の実施の形態]
第1の実施の形態を説明する。
【0014】
図1は、第1の実施の形態の情報処理装置を説明するための図である。
第1の実施の形態の情報処理装置10は、機械学習によって予測モデルを生成し、予測モデルを用いて雨量から流量を予測する。情報処理装置10は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置10が、コンピュータ、分析装置、機械学習装置または流量予測装置と呼ばれてもよい。
【0015】
情報処理装置10は、記憶部11および処理部12を有する。記憶部11は、RAM(Random Access Memory)などの揮発性半導体メモリでもよいし、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性ストレージでもよい。処理部12は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)などのプロセッサである。ただし、処理部12が、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの特定用途の電子回路を含んでもよい。プロセッサは、例えば、RAMなどのメモリに記憶されたプログラムを実行する。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。
【0016】
記憶部11は、雨量データ13および流量データ14を記憶する。雨量データ13および流量データ14は、訓練データと呼ばれてもよい。雨量データ13は、過去の複数の時刻における雨量を示す時系列データである。雨量データ13が示す雨量は、例えば、特定の場所に設置された雨量計を用いて測定される。ただし、雨量データ13が示す雨量は、直近の一定時間(例えば、6時間)の測定値を合計したN時間雨量であってもよい。また、雨量データ13は、2以上の場所の雨量の雨量データを含んでもよい。また、雨量データ13が示す雨量は、2以上の雨量計の測定値の単純平均または加重平均であってもよい。雨量の指標は、例えば、10分間の降水量である。
【0017】
流量データ14は、雨量データ13と同じ過去の複数の時刻における流量を示す時系列データである。流量は、雨量に依存して変化する水流の量である。流量データ14が示す流量は、例えば、河川やダムなどの特定の場所に設置された計測器を用いて測定される。雨量の測定場所と流量の測定場所は、同じでもよいし異なってもよい。例えば、雨量の測定場所は、流量の測定場所と同じ河川の上流であってもよい。流量の指標は、流入量または水位と呼ばれてもよい。例えば、流量の指標は、ダムに流入する単位時間当たりの水量、ダムの水位、ダムの水位の変化量、河川を通過する単位時間当たりの水量、河川の水位、または、河川の水位の変化量であってもよい。
【0018】
処理部12は、雨量データ13および流量データ14を用いて、雨量から流量を予測するための予測モデルを生成する。このとき、処理部12は、雨量と流量との間の関係が変化する1以上の境界雨量を判定する。境界雨量は、雨量変化点と呼ばれてもよい。雨量と流量の関係の変化は、地中に貯留される貯留水の飽和によって発生することがある。
【0019】
例えば、処理部12は、雨量データ13が示す雨量と流量データ14が示す流量とを対応付けた散布図を生成し、散布図の点に対して曲線をフィッティングする。曲線は、雨量が大きいほど傾きが大きくなる下に凸の曲線であってもよい。処理部12は、2以上の線分によって曲線を近似し、誤差が小さくなるように線分の境界を決定する。例えば、処理部12は、境界雨量15(境界雨量Rm)を判定する。
【0020】
なお、境界雨量の個数は固定でもよいし可変でもよい。例えば、境界雨量の個数は、誤差が小さくなるよう最適化されてもよい。土壌が複数の地層を含む場合や土壌からの水分の流出が植物の影響を受ける場合、雨量と流量の関係の変化点が複数現れることがある。
【0021】
処理部12は、1以上の境界雨量に基づいて区切られる2以上の雨量区間を特定し、2以上の雨量区間に対応する2以上の予測モデルを生成する。例えば、処理部12は、雨量が境界雨量15以下である雨量区間に対応する予測モデル16と、雨量が境界雨量15を超える雨量区間に対応する予測モデル17とを生成する。予測モデル16,17は、線形関数など比較的シンプルな機械学習モデルであってもよい。
【0022】
このとき、処理部12は、雨量データ13および流量データ14から、2以上の雨量区間に対応する2以上の訓練データセットを生成する。処理部12は、各雨量区間の予測モデルを、当該雨量区間に対応する訓練データセットから生成する。例えば、処理部12は、境界雨量15以下の雨量をもつ訓練データセットから予測モデル16を生成し、境界雨量15を超える雨量をもつ訓練データセットから予測モデル17を生成する。なお、2つの雨量区間が、境界雨量15を挟んで隣接してもよい。また、2つの雨量区間が、境界雨量15を含む一定幅の区間だけ重複するように形成されてもよい。また、2つの雨量区間が、境界雨量15を含む一定幅の区間だけ除外されるように不連続に形成されてもよい。
【0023】
なお、記憶部11は、生成された予測モデル16,17を記憶してもよい。また、記憶部11は、判定された境界雨量15を示す情報を記憶してもよい。
2以上の予測モデルが生成された後、処理部12は、雨量データ18を取得する。雨量データ18は、記憶部11に記憶されていてもよい。雨量データ18は、雨量データ13とは異なる複数の時刻の雨量を示す。雨量データ18が示す雨量は、例えば、雨量データ13と同じ場所の雨量計を用いて測定される。ただし、雨量データ18が示す雨量は、N時間雨量であってもよく、2以上の雨量計の測定値の単純平均または加重平均であってもよい。また、雨量データ18は、予報データを含んでもよい。予報データは、現在以降の雨量の予想値を示すものであってもよい。
【0024】
処理部12は、雨量データ18と1以上の境界雨量とに基づいて、2以上の予測モデルのうち使用する少なくとも1つの予測モデルを決定する。そして、処理部12は、決定した予測モデルの出力から、雨量データ18の時刻に対応する流量を予測する。
【0025】
例えば、処理部12は、雨量データ18が示す雨量と境界雨量15とを比較して、雨量データ18が示す雨量の属する雨量区間を特定し、特定した雨量区間に対応する予測モデルを選択する。また、処理部12は、雨量データ18から予測モデルの入力データを生成する。処理部12は、選択された予測モデルによる入力データに対する出力から、流量の予測値を算出する。選択された予測モデルの出力が、流量の予測値そのものであってもよい。また、処理部12は、予測モデルを選択する前に2以上の予測モデルそれぞれに入力データを入力してもよいし、選択された予測モデルのみに入力データを入力してもよい。
【0026】
例えば、処理部12は、雨量データ18が示す雨量と境界雨量15とを比較する。雨量が境界雨量15以下である場合、処理部12は、予測モデル16を選択し、入力データに対する予測モデル16の出力を流量の予測値として採用する。一方、雨量が境界雨量15を超える場合、処理部12は、予測モデル17を選択し、入力データに対する予測モデル17の出力を流量の予測値として採用する。
【0027】
ただし、雨量データ18の示す雨量が境界雨量15付近である場合、処理部12は、境界雨量15の前後にある2つの雨量区間に対応する予測モデル16,17の両方を選択してもよい。その場合、処理部12は、予測モデル16,17の出力の単純平均または加重平均を、流量の予測値として採用してもよい。また、処理部12は、2以上の雨量区間それぞれと雨量データ18が示す雨量との間の距離に基づいて、2以上の予測モデルの全部または一部に対する重みを決定してもよい。その場合、処理部12は、2以上の予測モデルの全部または一部の出力の加重平均を、流量の予測値として採用してもよい。
【0028】
処理部12は、流量の予測値を出力する。例えば、処理部12は、情報処理装置10が有する不揮発性ストレージに流量の予測値を保存する。また、例えば、処理部12は、情報処理装置10が有する表示装置に流量の予測値を表示する。また、例えば、処理部12は、他の情報処理装置に流量の予測値を送信する。なお、予測モデル16,17の生成と予測モデル16,17を用いた流量予測とを、異なる情報処理装置が実行してもよい。
【0029】
以上説明したように、第1の実施の形態の情報処理装置10は、過去の雨量データと過去の流量データから、雨量と流量の関係が変化する1以上の境界雨量を判定し、境界雨量に基づいて区切られる2以上の雨量区間に対応する2以上の予測モデルを生成する。そして、情報処理装置10は、他の雨量データと境界雨量に基づいて、使用する予測モデルを決定し、他の雨量データが示す雨量に対応する流量を予測する。
【0030】
これにより、地中の貯留水の飽和など、雨量と流量の関係性が変化する現象が予測値に反映される。よって、単一の予測モデルを使用する場合と比べて、流量予測の精度が向上する。また、2以上の予測モデルはそれぞれ、線形関数など比較的シンプルな機械学習モデルであってもよい。よって、ニューラルネットワークや非線形関数などの複雑な機械学習モデルを使用する場合と比べて、少ない訓練データからでも予測モデルを生成することが可能であり、訓練データを収集するコストや機械学習の計算量が低減する。
【0031】
[第2の実施の形態]
次に、第2の実施の形態を説明する。
図2は、第2の実施の形態の情報処理システムの例を示す図である。
【0032】
第2の実施の形態の情報処理システムは、雨量および流量の測定データを収集し、過去における雨量と流量の関係を分析して流量予測モデルを生成し、現在の雨量と流量予測モデルとに基づいて今後の流量を予測する。第2の実施の形態の情報処理システムは、計測器31,32,33および情報処理装置100を含む。
【0033】
計測器31は、河川30の途中にあるダムへの水の流入量を流量として測定する。流量の単位は、立方メートル毎秒(m/s)である。この流量は、ダムの水位やダムの放水量などの他の指標から間接的に測定されてもよい。
【0034】
計測器32,33は、雨量を測定する雨量計である。雨量の測定値は10分間雨量であり、雨量の単位はミリメートル(mm)である。計測器32,33は、河川30の流域であって計測器31の上流側に設置されている。計測器32,33が設置された場所の降雨が、ダムの流量に影響を与える。計測器32は、ある小エリアを代表する代表点とみなされ、計測器33は、計測器32とは別の小エリアを代表する代表点とみなされる。図2では2個の雨量計を示したが、一般にM個(Mは2以上の整数)の雨量計が使用される。
【0035】
計測器31によって測定される流量および計測器32,33によって測定される雨量を示す測定データが、継続的に収集される。情報処理装置100は、この測定データを取得する。情報処理装置100は、測定データを継続的に収集するデータベースサーバから、データ処理に使用する測定データを読み出すようにしてもよい。情報処理装置100は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置100が、コンピュータ、分析装置、機械学習装置または流量予測装置と呼ばれてもよい。本実施形態の情報処置装置100では、モデル生成と流量予測を1台の装置が実行してもよいし、モデル生成と流量予測をそれぞれ別の装置が実行してもよい。
【0036】
情報処理装置100は、過去の測定データを用いて、河川30の途中にあるダムの流量と河川30の流域にあるM個の雨量計の雨量との間の関係を分析し、それらM個の雨量計の雨量からダムの流量を予測するための予測モデルを生成する。予測モデルは、雨量と流量の関係を線形関数で表した線形モデルであることが好ましい。情報処理装置100は、生成された予測モデルを保存する。その後、情報処理装置100は、M個の雨量計の直近の雨量から入力データを生成し、予測モデルに入力データを入力して今後のダムの流量を予測する。情報処理装置100は、流量の予測値を出力する。
【0037】
図3は、情報処理装置のハードウェア例を示すブロック図である。
情報処理装置100は、バスに接続されたCPU101、RAM102、HDD103、GPU104、入力インタフェース105、媒体リーダ106および通信インタフェース107を有する。CPU101は、第1の実施の形態の処理部12に対応する。RAM102またはHDD103は、第1の実施の形態の記憶部11に対応する。
【0038】
CPU101は、プログラムの命令を実行するプロセッサである。CPU101は、HDD103に記憶されたプログラムおよびデータの少なくとも一部をRAM102にロードし、プログラムを実行する。情報処理装置100は、複数のプロセッサを有してもよい。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。
【0039】
RAM102は、CPU101で実行されるプログラムおよびCPU101で演算に使用されるデータを一時的に記憶する揮発性半導体メモリである。情報処理装置100は、RAM以外の種類の揮発性メモリを有してもよい。
【0040】
HDD103は、OS(Operating System)、ミドルウェア、アプリケーションソフトウェアなどのソフトウェアのプログラム、および、データを記憶する不揮発性ストレージである。情報処理装置100は、フラッシュメモリやSSD(Solid State Drive)などの他の種類の不揮発性ストレージを有してもよい。
【0041】
GPU104は、CPU101と連携して画像を生成し、情報処理装置100に接続された表示装置111に画像を出力する。表示装置111は、例えば、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイまたはプロジェクタである。なお、情報処理装置100に、プリンタなどの他の種類の出力デバイスが接続されてもよい。
【0042】
入力インタフェース105は、情報処理装置100に接続された入力デバイス112から入力信号を受け付ける。入力デバイス112は、例えば、マウス、タッチパネルまたはキーボードである。情報処理装置100に複数の入力デバイスが接続されてもよい。
【0043】
媒体リーダ106は、記録媒体113に記録されたプログラムおよびデータを読み取る読み取り装置である。記録媒体113は、例えば、磁気ディスク、光ディスクまたは半導体メモリである。磁気ディスクには、フレキシブルディスク(FD:Flexible Disk)およびHDDが含まれる。光ディスクには、CD(Compact Disc)およびDVD(Digital Versatile Disc)が含まれる。媒体リーダ106は、記録媒体113から読み取られたプログラムおよびデータを、RAM102やHDD103などの他の記録媒体にコピーする。読み取られたプログラムは、CPU101によって実行されることがある。
【0044】
記録媒体113は、可搬型記録媒体であってもよい。記録媒体113は、プログラムおよびデータの配布に用いられることがある。また、記録媒体113およびHDD103が、コンピュータ読み取り可能な記録媒体と呼ばれてもよい。
【0045】
通信インタフェース107は、ネットワーク114に接続され、ネットワーク114を介して他の情報処理装置と通信する。通信インタフェース107は、スイッチやルータなどの有線通信装置に接続される有線通信インタフェースでもよいし、基地局やアクセスポイントなどの無線通信装置に接続される無線通信インタフェースでもよい。
【0046】
前述のように、情報処理装置100は、複雑性を抑えた線形モデルを予測モデルとして用いて流量を予測する。これにより、河川30について測定データの蓄積が少ない場合であっても、情報処理装置100は、少ない訓練データから予測モデルを生成できる。しかし、雨量が特定の雨量レベルを超えると、雨量と流量の関係が大きく変化することがある。このため、単一の線形モデルでは広い雨量範囲をカバーすることが難しいことがある。
【0047】
図4は、降雨が河川に流入するメカニズムの例を示す図である。
河川30の周辺の土壌から河川30へは、表面流出水34、中間流出水35および地下水36が流入する。表面流出水34は、降雨のうち地表を流れる水分である。中間流出水35は、降雨のうち地中の浅い部分を流れる水分である。地中には、貯留水37が蓄積される。雨量が少ないうちは、地中の貯留水37が飽和していないため、表面流出水34および中間流出水35に加えて、貯留水37にも降雨が分配される。一方、雨量が多くなると、地中の貯留水37が飽和し、表面流出水34が増大する。
【0048】
よって、貯留水37が飽和するような雨量を境界として、雨量と流量の関係性が大きく変化する。なお、土壌が複数の地層を含む場合や河川30の流域に植物が多い場合には、雨量と流量の関係性が変化する変化点が2つ以上出現することもある。
【0049】
このように、雨量レベルに応じて雨量と流量の関係性が大きく変化することがあり、単一の線形モデルによって関係性を線形近似することが難しいことがある。その結果、予測モデルの予測精度が低下することがある。そこで、情報処理装置100は、雨量と流量の関係性が変化する境界雨量を検出し、境界雨量に基づいて区切られる雨量区間毎に、線形モデルを予測モデルとして生成する。以下、複数の予測モデルを生成する機械学習と、それら複数の予測モデルを利用した流量予測について説明する。
【0050】
図5は、流域平均雨量とN時間雨量の例を示すグラフである。
情報処理装置100は、過去の測定データを分析してS-1個(Sは2以上の整数)の境界雨量を検出する。境界雨量の個数は固定でもよいし、ユーザから値が指定されるハイパーパラメータであってもよい。例えば、S=2である。
【0051】
まず、情報処理装置100は、M個の雨量計によって測定される10分間隔の雨量から、各時刻の流域平均雨量を算出する。流域平均雨量は、同一時刻のM個の雨量を、M個の雨量計が代表するM個の小エリアの面積比で重み付けした加重平均雨量である。流域平均雨量を算出するため、情報処理装置100は、各小エリアの面積を予め知っている。
【0052】
そして、情報処理装置100は、各時刻に対して、直近N時間の流域平均雨量を合算したN時間雨量を算出する。例えば、N時間雨量は6時間雨量である。その場合、各時刻に対して、直近36個の流域平均雨量が合算される。曲線41はN時間雨量を示し、曲線42は流域平均雨量を示す。ただし、表示の都合上、流域平均雨量の値は5倍されている。
【0053】
図6は、流量のピーク検出の例を示すグラフである。
次に、情報処理装置100は、雨量の測定時刻に対応する10分間隔の流量を時系列に並べる。曲線43は流量を示す。情報処理装置100は、曲線43の中から、最大流量が測定された時刻を終点Peとして検出する。また、情報処理装置100は、終点Peから遡って流量を走査し、直前の極小流量が測定された時刻を始点Psとして検出する。情報処理装置100は、始点Psから終点Peまでの間のN時間雨量および流量を抽出する。
【0054】
図7は、N時間雨量と流量の関係例を示すグラフである。
情報処理装置100は、上記で抽出されたN時間雨量および流量に基づいて、横軸がN時間雨量であり縦軸が流量である散布図を生成する。情報処理装置100は、始点Psから終点Peまでの各時刻(始点Psおよび終点Peを含む)について、N時間雨量と流量の組に対応する点を散布図にプロットする。通常、始点Psに相当する点は散布図の最も左下に位置し、終点Peに相当する点は散布図の最も右上に位置する。
【0055】
散布図が生成されると、情報処理装置100は、散布図に含まれる点の集合を最も良く近似する曲線44を算出する。通常、曲線44は、N時間雨量が大きいほど傾きが大きい下に凸の曲線である。曲線44は、非線形関数によって表現される。n次関数や指数関数といった非線形関数のフォーマットは、固定でもよいしフィッティングを通じて決定されてもよい。例えば、情報処理装置100は、散布図に含まれる点の集合をフーリエ級数で近似する。情報処理装置100は、点の集合と曲線44との間の誤差が最小になるように、フィッティングを通じてフーリエ係数を最適化する。
【0056】
曲線44が算出されると、情報処理装置100は、曲線44の上にS-1個の内分点を設定して、曲線44をS個の部分曲線に分割する。情報処理装置100は、S個の部分曲線それぞれに対して、部分曲線を近似する線分を算出し、部分曲線と線分との間の距離dを算出する。情報処理装置100は、S個の部分曲線の距離dを合算して合計距離を算出し、合計距離が最小になるようにS-1個の内分点を最適化する。最適化されたS-1個の内分点におけるN時間雨量が、境界雨量である。なお、本実施形態では線分を処理の対象としているが、線分を含む直線を処理の対象としてよい。
【0057】
ここではS=2の場合について説明する。情報処理装置100は、曲線44の上に内分点Pmを設定する。情報処理装置100は、内分点Pmと始点Ps側の端点とを結ぶ線分45を算出する。始点Ps側の端点は、始点PsにおけるN時間雨量と流量の組を表す点でもよいし、始点PsのN時間雨量に対応する曲線44上の点でもよいし、始点Psの流量に対応する曲線44上の点でもよい。また、情報処理装置100は、内分点Pmと終点Pe側の端点とを結ぶ線分46を算出する。終点Peの端点は、終点PeにおけるN時間雨量と流量の組を表す点でもよいし、終点PeのN時間雨量に対応する曲線44上の点でもよいし、終点Peの流量に対応する曲線44上の点でもよい。
【0058】
情報処理装置100は、線分45と曲線44との間の距離dを算出する。距離dは、例えば、線分45と曲線44の差の積分、すなわち、線分45と曲線44の間の面積である。ただし、距離dが、線分45から見た曲線44の高さであってもよい。同様に、情報処理装置100は、線分46と曲線44との間の距離dを算出する。距離dは、例えば、線分46と曲線44の差の積分、すなわち、線分46と曲線44の間の面積である。ただし、距離dが、線分46から見た曲線44の高さであってもよい。
【0059】
情報処理装置100は、距離d,dの和を合計距離として算出する。情報処理装置100は、曲線44の上で内分点Pmを動かして、合計距離が最小になる内分点Pmを検出する。最適化された内分点PmにおけるN時間雨量が、境界雨量Rmである。
【0060】
S-1個の境界雨量Rm,…,Rms-1が算出されると、N時間雨量の全範囲がS個の雨量区間に分けられる。ただし、各境界雨量の前後Δが重複区間に設定され、その結果、連続する2つの雨量区間が2×Δだけ重複区間をもつ。これにより、境界雨量の判定精度が高くない場合であっても、予測モデルの精度の低下を抑制できる。S=2の場合、低雨量側の雨量区間はRm+Δ以下であり、高雨量側の雨量区間はRm-Δ以上である。一般に、j番目の雨量区間は、Rmj-1-ΔからRm+Δまでである。なお、Δは固定でもよいし、ユーザから値が指定されるハイパーパラメータであってもよい。
【0061】
情報処理装置100は、過去の測定データが示す1つの時刻から1つの訓練データレコードを生成する。後述するように、1つの訓練データレコードは、M個の雨量計それぞれで測定された直近のT個の雨量と、その時刻の流量差とを含む。よって、1つの訓練データレコードは、M×T個の雨量を含む。流量差は、その時刻に測定された流量Iから基準流量Iを引いた差分である。基準流量Iは、河川30における通常時の流量である。例えば、基準流量Iは、過去の測定データに含まれる流量のうちの最頻値、または、雨量ゼロの時刻に測定された流量の平均値である。
【0062】
情報処理装置100は、各訓練データレコードを、S個の雨量区間に対応するSセットの訓練データに振り分ける。このとき、情報処理装置100は、ある時刻のN時間雨量が属する雨量区間を特定し、その時刻の訓練データレコードを、特定された雨量区間に対応する訓練データに振り分ける。S個の雨量区間は重複区間をもつため、同一の訓練データレコードが2セットの訓練データに含まれることがある。これにより、情報処理装置100は、S個の雨量区間に対応するSセットの訓練データを生成する。
【0063】
図8は、訓練データの分類例を示すグラフである。
曲線41は、図5で説明したように時系列のN時間雨量を示す。時間区間47は、N時間雨量がRm+Δ以下の時間である。時間区間48は、N時間雨量がRm-Δ以上の時間である。時間区間49は、N時間雨量がRm+Δ以下の時間である。時間区間47と時間区間48は、N時間雨量がRm-ΔからRm+Δに増加する時間が存在するため、部分的に重複している。また、時間区間48と時間区間49は、N時間雨量がRm+ΔからRm-Δに減少する時間が存在するため、部分的に重複している。
【0064】
時間区間47,49に属する各時刻について生成される訓練データレコードは、低雨量の予測モデル(予測モデル1)を生成するための訓練データに含まれる。時間区間48に属する各時刻について生成される訓練データレコードは、高雨量の予測モデル(予測モデル2)を生成するための訓練データに含まれる。なお、上記説明ではΔは正の数であるが、Δをゼロとしてもよい。その場合、重複区間が無いことになる。また、境界雨量Rmの個数が2以上である場合に、境界雨量Rmによって異なるΔが使用されてもよい。
【0065】
Sセットの訓練データが生成されると、情報処理装置100は、機械学習によって1セットの訓練データから1つの予測モデルを生成する。これにより、S個の予測モデルが生成される。例えば、情報処理装置100は、訓練データレコードに含まれる雨量を予測モデルに入力し、予測モデルの出力と訓練データレコードに含まれる流量差との間の誤差を算出する。雨量は説明変数や入力データに相当し、流量差は目的変数や教師データに相当する。情報処理装置100は、誤差が小さくなるように、予測モデルに含まれるパラメータを更新する。情報処理装置100は、イテレーション回数が閾値に達するか、誤差が閾値未満になるまで、上記の処理を繰り返す。
【0066】
以下、予測モデルの例を説明する。予測モデルは、数式(1)に示す線形関数として規定される。数式(1)において、Iは時刻tにおける流量であり、Iは基準流量である。よって、数式(1)の左辺は、基準流量からの増加分である流量差を表す。また、rは、表面流出水と中間流出水の比率である内分比である。よって、数式(1)の右辺の第1項は表面流出水を表し、右辺の第2項は中間流出水を表す。
【0067】
【数1】
【0068】
αは、M個の雨量計の重みである。xi,tは、雨量計iによって時刻tに測定された雨量である。D は、雨量計iによって観測される降雨のうちの表面流出水の遅延時間である。D は、雨量計iによって観測される降雨のうちの中間流出水の遅延時間である。λ は、雨量計iによって観測される降雨のうちの表面流出水の時定数である。λ は、雨量計iによって観測される降雨のうちの中間流出水の時定数である。Pは、降雨後の表面流出水の減衰速度を示す減衰パラメータである。Pは、降雨後の中間流出水の減衰速度を示す減衰パラメータである。
【0069】
数式(1)のφは、数式(2)の微分方程式を満たす減衰関数である。過去の雨量が流量に与える影響は、減衰関数φに従って徐々に減衰する。減衰関数φは、降雨直後は負の傾きをもち、時間経過に伴って傾きがゼロに漸近する下に凸の減衰曲線を表す。数式(2)において、τは経過時間であり、cは所定の固定値である。数式(2)の微分方程式を満たす減衰関数φは、数式(3)である。減衰関数φは、P=1であるかP>1であるかによって異なる。なお、P<1の場合は減衰関数φは定義されない。よって、数式(1)の減衰パラメータP,Pの値は1以上である。
【0070】
【数2】
【0071】
【数3】
【0072】
ある2セットの訓練データを用いて2つの予測モデルを生成すると、低雨量用の予測モデルはr=0.6を含み、高雨量用の予測モデルはr=0.9を含むことがある。このように、高雨量用の予測モデルの方が低雨量用の予測モデルよりも、内分比rが大きい。これは、表面流出水と中間流出水の比率が高雨量時と低雨量時とで異なり、高雨量時の方が表面流出水の比率が大きくなることを意味する。なお、数式(1)の左辺は流量Iそのものを含んでいるが、流量Iを変換関数gで変換したg(I)を用いてもよい。
【0073】
S個の予測モデルが生成された後、情報処理装置100は、これらS個の予測モデルを利用して流量を予測する。時刻tにおける流量を予測したい場合、情報処理装置100は、時刻tを基準として、M個の雨量計それぞれの直近T個の時刻の雨量を含む入力データを生成する。情報処理装置100は、入力データに含まれるM×T個の雨量のうち、現時刻までに雨量計によって測定済みの雨量については、測定値(例えば、計測器32,33で測定された雨量)を用いる。一方、情報処理装置100は、まだ測定されていない未来の雨量については、予報データに含まれる予想値を用いる。情報処理装置100は、公的機関または気象予報会社のサーバ装置から、気象予報データを取得してもよい。
【0074】
情報処理装置100は、入力データをS個の予測モデルにそれぞれ入力して、S個の予測値J(j=1,…,S)を算出する。また、情報処理装置100は、入力データから時刻tにおけるN時間雨量(R)を算出する。情報処理装置100は、RとS-1個の境界雨量Rm(j=1,…,S-1)それぞれとを比較して、Rが属する雨量区間を判定する。重複区間が存在するため、Rは1つまたは2つの雨量区間に属する。情報処理装置100は、Rが属する1つまたは2つの雨量区間に対応する1つまたは2つの予測モデルの予測値を用いて、最終的な予測値Iを算出する。
【0075】
1つの予測モデルの予測値のみを使用する場合、情報処理装置100は、当該1つの予測値を最終的な予測値Iとして採用する。2つの予測モデルの予測値を使用する場合、情報処理装置100は、当該2つの予測値の重み付き和を最終的な予測値Iとして採用する。具体的には、予測値Iは数式(4)によって算出される。
【0076】
【数4】
【0077】
RがRm-Δより小さい場合、予測値Iは、予測モデル1によって算出される予測値Jである。RがRm-Δ以上かつRm+Δ以下である場合、すなわち、Rが何れかの重複区間に属する場合、予測値Iは、予測モデルjによって算出される予測値Jと予測モデルj+1によって算出される予測値Jj+1との重み付き和である。RがRm+Δより大きくRmj+1-Δ未満である場合、すなわち、Rが2つの重複区間の間である場合、予測値Iは、予測モデルj+1によって算出される予測値Jj+1である。RがRmS-1+Δより大きい場合、予測値Iは、予測モデルSによって算出される予測値Jである。
【0078】
S=2の場合は以下の通りとなる。RがRm-Δより小さい場合、予測値Iは、低雨量の予測モデルによって算出される予測値Jである。RがRm-Δ以上かつRm+Δ以下である場合、予測値Iは、低雨量の予測モデルによって算出される予測値Jと高雨量の予測モデルによって算出される予測値Jとの重み付き和である。RがRm+Δより大きい場合、予測値Iは、高雨量の予測モデルによって算出される予測値Jである。数式(4)において重み付けに使用されるσは、シグモイド関数である。
【0079】
図9は、シグモイド関数の例を示すグラフである。
曲線51は、シグモイド関数であるy=σ(x)を示す。x=0のときy=0.5である。x=-Δでy=0に漸近し、x=+Δでy=1に漸近する。xが-Δから+Δに増加する間、yは0から1に向かって単調に増加する。よって、N時間雨量が境界雨量Rmに一致する場合、最終的な予測値Iは2つの予測値J,Jj+1の単純平均である。N時間雨量が境界雨量Rmより大きいほど予測値Jj+1の重みが大きくなり、N時間雨量が境界雨量Rmより小さいほど予測値Jの重みが大きくなる。
【0080】
図10は、複数の予測モデルの予測値の合成例を示す図である。
ここではS=2である場合を考える。曲線52は、流量の測定値を示す。曲線53は、低雨量の雨量区間の予測モデルによって算出される流量の予測値を示す。曲線54は、高雨量の雨量区間の予測モデルによって算出される流量の予測値を示す。曲線55は、前述の合成方法によって算出される最終的な流量の予測値を示す。
【0081】
曲線53が示すように、低雨量の雨量区間の予測モデルでは、小さい流量が高精度に予測される一方、大きい流量の予測精度が低下する。これは、低雨量の雨量区間の予測モデルには、N時間雨量が境界雨量を超えると雨量に対する流量の傾きが大きくなるという現象が反映されていないためである。また、曲線54に示すように、高雨量の雨量区間の予測モデルでは、大きい流量が高精度に予測される一方、小さい流量の予測精度が低下する。これは、高雨量の雨量区間の予測モデルには、N時間雨量が境界雨量以下である間は雨量に対する流量の傾きが小さいという現象が反映されていないためである。これに対して、曲線55が示すように、低雨量の雨量区間の予測モデルと高雨量の雨量区間の予測モデルとを併用することで、小さい流量と大きい流量の両方の予測精度が向上する。
【0082】
次に、情報処理装置100の機能および処理手順について説明する。
図11は、情報処理装置の機能例を示すブロック図である。
情報処理装置100は、測定データ記憶部121、予報データ記憶部122および予測モデル記憶部123を有する。これらの記憶部は、例えば、RAM102またはHDD103を用いて実装される。また、情報処理装置100は、雨量変換部131,135、境界検出部132、訓練データ生成部133、予測モデル生成部134、予測値算出部136および予測値合成部137を有する。これらの処理部は、例えば、CPU101とプログラムを用いて実装される。
【0083】
測定データ記憶部121は、測定された流量および雨量を示す測定データを記憶する。測定データは、計測器31における10分間隔の流量の測定値を含む。また、測定データは、計測器32,33などのM個の雨量計における10分間隔の雨量の測定値を含む。
【0084】
予報データ記憶部122は、予想される現在時刻以降の雨量を示す予報データを記憶する。予報データは、M個の雨量計によって代表されるM個の小エリアにおける10分間隔の雨量の予想値を含む。情報処理装置100は、例えば、公的機関または気象予報会社のサーバ装置から予報データを受信する。予測モデル記憶部123は、情報処理装置100が生成した雨量から流量を予測するための予測モデルを記憶する。
【0085】
雨量変換部131は、測定データ記憶部121に記憶された測定データからM個の雨量計の雨量を抽出し、M個の小エリアの面積比で重み付けして流域平均雨量を算出する。雨量変換部131は、10分間隔の流域平均雨量を時系列に並べ、時刻毎に直近N時間分(例えば、36個)の流域平均雨量を合算してN時間雨量を算出する。
【0086】
境界検出部132は、測定データから流量を抽出し、同一時刻のN時間雨量と流量との組に対応する点がプロットされた散布図を生成する。境界検出部132は、散布図に含まれる点の集合に対して曲線をフィッティングし、曲線をS個の線分で近似する。境界検出部132は、曲線とS個の線分との間の誤差が最小になるように線分間の境界を動かすことで、N時間雨量と流量の関係が変化するS-1個の境界雨量を検出する。
【0087】
訓練データ生成部133は、測定データに含まれる10分間隔の雨量および流量から、時刻毎に、入力データと教師データを含む訓練データレコードを生成する。入力データは、M個の雨量計それぞれの直近T個の雨量である。教師データは、基準流量からの流量差である。訓練データ生成部133は、複数の時刻それぞれについて、境界雨量に基づいて区切られるS個の雨量区間のうち当該時刻のN時間雨量が属する雨量区間を特定し、当該時刻の訓練データレコードを、特定された雨量区間に対応する訓練データに追加する。これにより、N時間雨量に基づいて分類されたSセットの訓練データが生成される。
【0088】
予測モデル生成部134は、機械学習によって1セットの訓練データにつき1個の予測モデルを生成する。これにより、S個の雨量区間に対応するS個の予測モデルが生成される。予測モデル生成部134は、生成されたS個の予測モデルのパラメータ値を予測モデル記憶部123に保存する。また、予測モデル生成部134は、雨量区間を特定するための境界雨量を予測モデル記憶部123に保存する。なお、予測モデル生成部134は、予測モデルを表示装置111に表示してもよいし、他の情報処理装置に送信してもよい。
【0089】
雨量変換部135は、流量を予測したい時刻tの入力を受け付ける。時刻tはユーザから入力されてもよい。雨量変換部135は、測定データ記憶部121に記憶された測定データから、M個の雨量計それぞれの直近T個の雨量のうち、現在までに測定済みの雨量を抽出する。また、雨量変換部135は、予報データ記憶部122に記憶された予報データから、M個の雨量計それぞれの直近T個の雨量のうち、未測定の雨量を抽出する。また、雨量変換部135は、雨量変換部131と同様の方法で、時刻tにおけるN時間雨量を算出する。具体的には、雨量変換部135は、時刻t以前の各時刻の流域平均雨量を算出し、N時間分の流域平均雨量を合算する。
【0090】
予測値算出部136は、M個の雨量計それぞれの直近T個の雨量に該当する測定値および予想値から入力データを生成する。また、予測値算出部136は、予測モデル記憶部123からS個の予測モデルのパラメータ値を読み出す。予測値算出部136は、S個の予測モデルそれぞれに入力データを入力することで、S個の流量の予測値を算出する。予測モデルの出力が流量差である場合、流量差に基準流量を加算して流量が算出される。
【0091】
予測値合成部137は、境界雨量に基づいて区切られるS個の雨量区間のうち、時刻tのN時間雨量が属する1つまたは2つの雨量区間を特定する。予測値合成部137は、特定された1つまたは2つの雨量区間に対応する1つまたは2つの予測モデルの予測値を合成して、最終的な流量の予測値を算出する。特定された雨量区間が1つのみである場合、当該1つの雨量区間に対応する予測モデルの予測値が最終的な流量の予測値になる。特定された雨量区間が2つある場合、当該2つの雨量区間に対応する2つの予測モデルの予測値の重み付き和が、最終的な流量の予測値になる。
【0092】
予測値合成部137は、合成後の流量の予測値を出力する。予測値合成部137は、流量の予測値を表示装置111に表示してもよいし、HDD103などの不揮発性ストレージに保存してもよいし、他の情報処理装置に送信してもよい。なお、予測モデル生成と流量予測を異なる情報処理装置が実行することも可能である。
【0093】
図12は、測定データテーブルの例を示す図である。
測定データテーブル124は、測定データ記憶部121に記憶される。測定データテーブル124は、10分間隔で測定された流量および雨量を示す。ここでは、流量と関連する雨量計が2個である、すなわち、M=2である場合を説明する。測定データテーブル124の各レコードは、時刻、流量、雨量#1および雨量#2を含む。
【0094】
時刻は、流量および雨量が測定された時刻である。流量は、計測器31を用いて測定されたダムの流入量である。流量の単位は立方メートル毎秒(m/s)である。雨量#1は、計測器32を用いて測定された10分間雨量である。計測器32は、小エリア#1を代表する。雨量#2は、計測器33を用いて測定された10分間雨量である。計測器33は、小エリア#2を代表する。雨量#1,#2の単位はミリメートル(mm)である。
【0095】
図13は、訓練データテーブルの例を示す図である。
訓練データテーブル125は、訓練データ生成部133によって生成される。訓練データテーブル125は、例えば、RAM102またはHDD103に記憶される。訓練データテーブル125は、S個の予測モデルに対応するSセットの訓練データを記憶する。各訓練データは、複数の訓練データレコードを含む。ここでは、流量と関連する雨量計が2個である、すなわち、M=2である場合を説明する。
【0096】
各訓練データレコードは、時刻t-T+1から時刻tまで(時刻tを含む)のT個の雨量#1と、時刻t-T+1から時刻tまで(時刻tを含む)のT個の雨量#2と、時刻tの流量とを含む。T個の雨量#1およびT個の雨量#2は、説明変数や入力データに相当する。流量は、目的変数や教師データに相当する。
【0097】
図14は、パラメータテーブルの例を示す図である。
パラメータテーブル126は、予測モデル記憶部123に記憶される。パラメータテーブル126は、S個の予測モデルに対応するS個のパラメータセットを記憶する。ここでは、予測モデルが2個である、すなわち、S=2である場合を説明する。各パラメータセットは、内分比r、雨量計重みα、表面流出の遅延時間D、中間流出の遅延時間D、表面流出の時定数λ、中間流出の時定数λ、表面流出の減衰パラメータP、中間流出の減衰パラメータP、基準流量Iおよび境界雨量Rmを含む。雨量計重みα、遅延時間D,Dおよび時定数λ,λは、雨量計毎に与えられる。
【0098】
図15は、モデル生成の手順例を示すフローチャートである。
(S10)雨量変換部131は、測定データに現れる各時刻について、M個の雨量計の雨量をM個の小エリアの面積比で重み付けして流域平均雨量を算出する。
【0099】
(S11)雨量変換部131は、測定データに現れる各時刻について、直近N時間分(例えば、36個)の流域平均雨量を合算してN時間雨量を算出する。
(S12)境界検出部132は、測定データの中で最大流量が測定されたピーク時刻を終点として検出し、ピーク時刻の前に流量が極小であった時刻を始点として検出する。
【0100】
(S13)境界検出部132は、始点から終点までの各時刻のN時間雨量と流量を抽出し、N時間雨量と流量の関係を示す散布図を生成する。
(S14)境界検出部132は、散布図に対して曲線をフィッティングする。例えば、境界検出部132は、誤差が最も小さいフーリエ級数を算出する。
【0101】
(S15)境界検出部132は、曲線をS-1個の内分点でS個の部分曲線に分割し、各部分曲線を線分で近似する。境界検出部132は、S個の部分曲線とS個の線分との間の合計距離が最小になるように内分点を最適化して、S-1個の境界雨量を算出する。
【0102】
(S16)訓練データ生成部133は、測定データに含まれる流量から、通常時の基準流量を算出する。基準流量は、例えば、流量の最頻値または無降雨時の平均流量である。
(S17)訓練データ生成部133は、測定データに現れる各時刻に対応する訓練データレコードを生成する。訓練データレコードは、M個の雨量計それぞれの直近T個の雨量の測定値と、基準流量からの流量差とを含む。
【0103】
(S18)訓練データ生成部133は、S個の雨量区間のうち各時刻のN時間雨量が属する1つまたは2つの雨量区間を特定する。訓練データ生成部133は、各時刻の訓練データレコードを、特定された雨量区間に対応する訓練データに分類する。これにより、訓練データ生成部133は、S個の雨量区間に対応するSセットの訓練データを生成する。
【0104】
(S19)予測モデル生成部134は、Sセットの訓練データを用いて機械学習を行い、予測モデルのS個のパラメータセットを決定する。例えば、予測モデル生成部134は、Sセットの訓練データそれぞれについて、訓練データレコードの入力データを予測モデルに入力し、予測モデルの出力と訓練データレコードの教師データとの誤差を算出し、誤差が小さくなるようにパラメータ値を更新する。予測モデル生成部134は、イテレーション回数または誤差に関する停止条件を満たすまでパラメータ値の更新を繰り返す。
【0105】
(S20)予測モデル生成部134は、S個の雨量区間に対応するS個のパラメータセットを予測モデル記憶部123に保存する。
図16は、流量予測の手順例を示すフローチャートである。
【0106】
(S30)雨量変換部135は、何れの時点の流量を予測したいかを示す予測対象時刻(時刻t)の入力を受け付ける。雨量変換部135は、時刻tの直近T時間のうち現在時刻以前の各時刻におけるM個の雨量計の測定値を、測定データから抽出する。また、雨量変換部135は、T時間のうち現在時刻から先の各時刻におけるM個の小エリアの雨量の予想値を、予報データから抽出する。雨量変換部135は、各時刻について、M個の雨量をM個の小エリアの面積比で重み付けして流域平均雨量を算出する。
【0107】
(S31)雨量変換部135は、時刻tの直近N時間分(例えば、36個)の流域平均雨量を合算して、時刻tにおけるN時間雨量を算出する。
(S32)予測値算出部136は、時刻tの直近T時間におけるM個の雨量計それぞれの雨量の測定値および予想値を含む入力データを生成する。
【0108】
(S33)予測値算出部136は、予測モデル記憶部123からS個のパラメータセットを読み出して、S個の予測モデルを取得する。予測値算出部136は、S個の予測モデルにそれぞれ入力データを入力して、S個の流量の予測値を算出する。
【0109】
(S34)予測値合成部137は、時刻tにおけるN時間雨量とS-1個の境界雨量との関係から、N時間雨量が属する1つまたは2つの雨量区間を特定する。予測値合成部137は、特定された1つまたは2つの雨量区間に対応する1つまたは2つの予測モデルの予測値を合成して、最終的な流量の予測値を算出する。
【0110】
(S35)予測値合成部137は、時刻tにおける流量の予測値を出力する。予測値合成部137は、流量の予測値を表示装置111に表示してもよいし、HDD103などの不揮発性ストレージに保存してもよいし、他の情報処理装置に送信してもよい。
【0111】
以上説明したように、第2の実施の形態の情報処理装置100は、予測モデルを用いて、河川流域の雨量から河川の流量を予測する。よって、情報処理装置100は、治水政策や防災対策に役立つ有用な情報を提供することができる。また、情報処理装置100は、雨量と流量の関係を線形近似した線形モデルを、予測モデルとして機械学習によって生成する。よって、ニューラルネットワークや非線形モデルなどの複雑な予測モデルと比べて、情報処理装置100は、少ない訓練データからでも高精度な予測モデルを生成できる。このため、特定の河川の雨量および流量を示す測定データの収集コストが低減する。また、機械学習の計算量が減少し、機械学習の実行時間が短縮される。
【0112】
また、情報処理装置100は、過去の測定データを分析して、雨量と流量の関係が変化する境界雨量を検出し、境界雨量の前後で異なる予測モデルを生成する。例えば、情報処理装置100は、低雨量の予測モデルと高雨量の予測モデルとを生成する。よって、地中の貯留水の飽和など雨量と流量の関係が大きく変化する自然現象が流量予測に反映され、予測精度が向上する。また、境界雨量を挟んで連続する2つの雨量区間は、一部重複するように設定される。よって、境界雨量の検出精度が予測モデルの予測精度に与える影響を緩和できる。また、情報処理装置100は、予測時の雨量が境界雨量に近い場合、その前後の予測モデルの出力を合成して流量の予測値を決定する。よって、雨量の変化に対して流量の予測値が連続的に変化し、予測精度が向上する。
【符号の説明】
【0113】
10 情報処理装置
11 記憶部
12 処理部
13,18 雨量データ
14 流量データ
15 境界雨量
16,17 予測モデル
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16