(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024170278
(43)【公開日】2024-12-06
(54)【発明の名称】学習装置、学習方法および予測装置
(51)【国際特許分類】
G01W 1/00 20060101AFI20241129BHJP
G01W 1/10 20060101ALI20241129BHJP
G06Q 50/26 20240101ALI20241129BHJP
【FI】
G01W1/00 Z
G01W1/10 R
G06Q50/26
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023193243
(22)【出願日】2023-11-13
(31)【優先権主張番号】P 2023087256
(32)【優先日】2023-05-26
(33)【優先権主張国・地域又は機関】JP
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (1)令和5年6月8日に「https://www.river-jsce.jp/2023symposium/」において説明資料を公開 (2)令和5年6月9日に「https://www.river-jsce.jp/2023symposium/」において論文を公開 (3)令和5年6月に「河川技術論文集,第29巻,第557ー562頁,土木学会水工学委員会河川部会」において公開 (4)令和5年6月23日にオンライン開催された「2023年度河川技術に関するシンポジウム」において公開
(71)【出願人】
【識別番号】000206211
【氏名又は名称】大成建設株式会社
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】大野 剛
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC35
5L050CC35
(57)【要約】
【課題】将来における水位のトレンド(上昇・下降)を把握することができる学習装置、学習方法および予測装置を提供する。
【解決手段】学習装置10は、河川の流域の少なくとも一部に積雪が存在している融雪期間中のある第一時点での前記河川の水位と、前記第一時点よりも過去の期間を含む特定期間中における複数の第二時点での気象項目値情報と、前記第一時点よりも未来の複数の第三時点での前記河川の水位と、からなる学習データを取得する学習データ取得部12と、前記学習データをまとめた学習用のデータセットを用いて、学習器を機械学習させる学習処理部13とを備える。
【選択図】
図1
【特許請求の範囲】
【請求項1】
河川の流域の少なくとも一部に積雪が存在している融雪期間中のある第一時点での前記河川の水位と、前記第一時点よりも過去の期間を含む特定期間中における複数の第二時点での気象項目値情報と、前記第一時点よりも未来の複数の第三時点での前記河川の水位と、からなる学習データを取得する学習データ取得部と、
前記学習データをまとめた学習用のデータセットを用いて、学習器を機械学習させる学習処理部と、を備え、
前記学習処理部は、前記第一時点での前記河川の水位、および、複数の前記第二時点での気象項目値情報を入力することによって、複数の前記第三時点での前記河川の水位を出力するように前記学習器を学習させる、
ことを特徴とする学習装置。
【請求項2】
前記学習データ取得部は、時間単位の平均気温、時間単位の積算降水量、時間単位の平均風速、時間単位の積雪深、および、時間単位の日照時間の少なくとも一つの前記気象項目値情報を含む学習データを取得する、
ことを特徴とする請求項1に記載の学習装置。
【請求項3】
気象項目の強度分布を色の変化で示した気象分布画像から、前記流域内の強度分布が反映された代表点に関する代表点情報および前記気象項目値情報を算出する画像処理部をさらに備え、
前記学習データ取得部は、前記第二時点での前記気象分布画像から算出した前記代表点情報および前記気象項目値情報を有する学習データを取得する、
ことを特徴とする請求項1に記載の学習装置。
【請求項4】
前記画像処理部は、
前記第二時点での前記気象分布画像を構成する各ピクセルのRGB値を輝度値に変換し、前記輝度値を重さに見立てた場合における前記流域の重心を前記代表点として算出し、当該重心の位置および予め決められた基準点から当該重心までの距離を前記代表点情報として求め、
前記気象分布画像を構成する各ピクセルの前記輝度値から算出した統計値を前記気象項目値情報として求める、
ことを特徴とする請求項3に記載の学習装置。
【請求項5】
前記気象項目値情報は、前記第二時点での流域内における複数地点のAMeDAS観測値である、ことを特徴とする請求項1に記載の学習装置。
【請求項6】
前記学習処理部は、前記気象項目値情報に対して気象項目に応じた重み付けを行い、重み付け後の当該気象項目値情報を用いて学習させる、
ことを特徴とする請求項1に記載の学習装置。
【請求項7】
前記データセットは、出水期間に基づいて間引きされたものである、ことを特徴とする請求項1に記載の学習装置。
【請求項8】
河川の流域の少なくとも一部に積雪が存在している融雪期間中のある第一時点での前記河川の水位と、前記第一時点よりも過去の期間を含む特定期間中における複数の第二時点での気象項目値情報と、前記第一時点よりも未来の複数の第三時点での前記河川の水位と、からなる学習データを取得する学習データ取得工程と、
前記学習データをまとめた学習用のデータセットを用いて、学習器を機械学習させる学習処理工程と、を有し、
前記学習処理工程では、前記第一時点での前記河川の水位、および、複数の前記第二時点での気象項目値情報を入力することによって、複数の前記第三時点での前記河川の水位を出力するように前記学習器を学習させる、
ことを特徴とする学習方法。
【請求項9】
請求項8に記載の学習方法によって学習した学習済みの学習器を備え、融雪期間中のある第四時点での前記河川の水位、および、前記第四時点よりも過去の期間を含む特定期間中における複数の第五時点での気象項目値情報を入力することによって、前記第四時点よりも未来の複数の第六時点での前記河川の水位を予測する、
ことを特徴とする予測装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習方法および予測装置に関する。
【背景技術】
【0002】
近年、地球温暖化の影響により豪雨災害が増加しており、河川では外水、内水氾濫に依る被害が増えている。河川工事においても、水位の上昇により作業員や建設資機材(重機や資材)への被害(流出、沈没など)が発生する可能性がある。そのため、河川工事において事前に水位を予測し工事関係者に周知することは、作業員や建設資機材(重機や資材)を守る上で重要である。
従来から、河川工事現場に対して出水警報システムを適用することが行われている。従来の出水警報システムの構成例を
図49に示す。
図49に示す出水警報システムでは、気象庁から雨に関する情報を取得し、また、国土交通省から河川に関する情報を取得し、これらの情報を解析することによって河川の水位を予測する。予測した河川の水位や予測に基づく警報は、インターネットや携帯メールなどを介して工事地点にいる工事関係者に通知される。従来の出水警報システムでは、水理公式に基づいた物理モデル(水位予測モデル)により河川水位を予測しており、例えば「数値モデル」、「回帰モデル」、「累積雨量モデル」、「保存則モデル」などの物理モデルが利用される(例えば、特許文献1、2参照)。
【0003】
「数値モデル」は、予測地点より上流の水位や降雨分布、土地利用、標高を入力値として分布型流出解析により工事地点の水位を求める物理モデルである。「回帰モデル」は、予測地点より上流の観測所水位と予測地点の水位の回帰式を求め、回帰式から予測地点の水位を予測する物理モデルである。「累積雨量モデル」は、予測地点より上流の流域内における雨量と予測地点の水位の関係から出水の有無を判断する物理モデルである。「保存則モデル」は、予測地点より上流の流域内における雨量と予測地点の水位の関係から予測地点の水位を予測する物理モデルである。
また、融雪による河川の水位予測に関して、特許文献3に記載された技術が存在する。特許文献3に記載された技術は、例えば、「0:00~23:00」の気象分布画像と最大水位を用いて、翌日の最大水位を予測する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2019-045290号公報
【特許文献2】特開2008-015916号公報
【特許文献3】特開2023-067705号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
河川工事では、数時間先(例えば、24時間先)までの水位のトレンド(上昇・下降)を把握することが安全管理や工程管理において重要な場合がある。しかしながら、特許文献3に記載された技術は、日最大水位(1日1点)を予測するため、数時間先までの水位のトレンドを把握することが難しかった。
このような観点から、本発明は、将来における水位のトレンド(上昇・下降)を把握することができる学習装置、学習方法および予測装置を提供する。
【課題を解決するための手段】
【0006】
本発明に係る学習装置は、学習データ取得部と、学習処理部とを備える。
前記学習データ取得部は、河川の流域の少なくとも一部に積雪が存在している融雪期間中のある第一時点での前記河川の水位と、前記第一時点よりも過去の期間を含む特定期間中における複数の第二時点での気象項目値情報と、前記第一時点よりも未来の複数の第三時点での前記河川の水位と、からなる学習データを取得する。
前記学習処理部は、前記学習データをまとめた学習用のデータセットを用いて、学習器を機械学習させる。前記学習処理部は、前記第一時点での前記河川の水位、および、複数の前記第二時点での気象項目値情報を入力することによって、複数の前記第三時点での前記河川の水位を出力するように前記学習器を学習させる。
【0007】
前記学習データ取得部は、例えば、時間単位の平均気温、時間単位の積算降水量、時間単位の平均風速、時間単位の積雪深、および、時間単位の日照時間の少なくとも一つの前記気象項目値情報を含む学習データを取得する。
本発明に係る学習装置によって学習した学習済みの学習器を用いることで、将来における水位のトレンド(上昇・下降)を予測することができる。そのため、退避・復旧のタイミングを判断することが可能であり、河川工事の安全管理や工程管理において有用である。
【0008】
気象項目の強度分布を色の変化で示した気象分布画像から、前記流域内の強度分布が反映された代表点に関する代表点情報および前記気象項目値情報を算出する画像処理部をさらに備えてもよい。その場合、前記学習データ取得部は、前記第二時点での前記気象分布画像から算出した前記代表点情報および前記気象項目値情報を有する学習データを取得する。
前記画像処理部は、例えば、前記第二時点での前記気象分布画像を構成する各ピクセルのRGB値を輝度値に変換し、前記輝度値を重さに見立てた場合における前記流域の重心を前記代表点として算出する。そして、当該重心の位置および予め決められた基準点から当該重心までの距離を前記代表点情報として求める。また、前記気象分布画像を構成する各ピクセルの前記輝度値から算出した統計値を前記気象項目値情報として求める。
【0009】
気象庁が公表する気象分布画像は、日本全域をカバーしており、また入手が容易である(例えば気象庁などから購入可能)。そのため、気象分布画像を用いれば、日本全域の任意の地点における水位を容易に予測することができる。
また、気象分布画像そのものを用いて学習を行わずに、代表点情報を用いて学習を行うことで、気象分布画像の全データ(全ピクセル値)を入力する場合に比べて計算負荷を軽減できる。
【0010】
前記気象項目値情報は、前記第二時点での流域内における複数地点のAMeDAS観測値であってもよい。このようにすると、気象分布画像が入手できない場合でも、水位の予測が可能である。そのため、水位のトレンド(上昇・下降)を把握することが可能である。
前記学習処理部は、前記気象項目値情報に対して気象項目に応じた重み付けを行い、重み付け後の当該気象項目値情報を用いて学習させてもよい。このようにすると、気象項目が水位の予測結果に及ぼす寄与度が学習データに反映されるので、さらに精度の良い予測を実現可能である。
前記データセットは、出水期間に基づいて間引きされたものであってもよい。このようにすると、融雪期間中の全データを入力する場合に比べて計算負荷を軽減できる。
【0011】
本発明に係る学習方法は、学習データ取得工程と、学習処理工程とを有する。
前記学習データ取得工程では、河川の流域の少なくとも一部に積雪が存在している融雪期間中のある第一時点での前記河川の水位と、前記第一時点よりも過去の期間を含む特定期間中における複数の第二時点での気象項目値情報と、前記第一時点よりも未来の複数の第三時点での前記河川の水位と、からなる学習データを取得する。
前記学習処理工程では、前記学習データをまとめた学習用のデータセットを用いて、学習器を機械学習させる。前記学習処理工程では、前記第一時点での前記河川の水位、および、複数の前記第二時点での気象項目値情報を入力することによって、複数の前記第三時点での前記河川の水位を出力するように前記学習器を学習させる。
本発明に係る学習方法によって学習した学習済みの学習器を用いることで、将来における水位のトレンド(上昇・下降)を予測することができる。そのため、退避・復旧のタイミングを判断することが可能であり、河川工事の安全管理や工程管理において有用である。
【0012】
本発明に係る予測装置は、上述した学習方法によって学習した学習済みの学習器を備える。この予測装置は、融雪期間中のある第四時点での前記河川の水位、および、前記第四時点よりも過去の期間を含む特定期間中における複数の第五時点での気象項目値情報を入力することによって、前記第四時点よりも未来の複数の第六時点での前記河川の水位を予測する。
本発明に係る予測装置では、将来における水位のトレンド(上昇・下降)を予測することができる。そのため、退避・復旧のタイミングを判断することが可能であり、河川工事の安全管理や工程管理において有用である。
【発明の効果】
【0013】
本発明によれば、将来における水位のトレンド(上昇・下降)を把握することができる。
【図面の簡単な説明】
【0014】
【
図1】本発明の実施形態に係る学習装置および予測装置の機能構成図である。
【
図3】画像処理部の処理を説明するための図であり、(a)は気象分布画像の例示であり、(b)は流域内の気象分布画像を抽出した流域画像の例示であり、(c)は代表点の例示である。
【
図4】各々の気象分布画像Faでの重心Gの算出イメージであり、(a)は時間平均気温画像F1aでの算出結果を示し、(b)は時間積算降水量画像F2aでの算出結果を示し、(c)は時間平均風速画像F3aでの算出結果を示す。
【
図5B】学習用のデータセットのデータ(1)の拡大図である。
【
図5C】学習用のデータセットのデータ(2)の拡大図である。
【
図5D】学習用のデータセットのデータ(3)および出力データ部分の拡大図である。
【
図6】学習用のデータセットの間引きの一例を説明するための図であり、(a)は最大水位の選定方法を説明するための図であり、(b)は観測所における水位の変動を示すグラフである。
【
図7】効果検証のために実施したシミュレーションでの予測手順フローである。
【
図8】月形観測所の流域内にある観測所の位置を示した図である。
【
図9】シミュレーションで用いた重み値の一覧である。
【
図10】Case01のデータセットを用いた場合の2018年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図11】Case01のデータセットを用いた場合の2019年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図12】Case01のデータセットを用いた場合の2020年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図13】Case01のデータセットを用いた場合の2021年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図14】Case02のデータセットを用いた場合の2018年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図15】Case02のデータセットを用いた場合の2019年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図16】Case02のデータセットを用いた場合の2020年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図17】Case02のデータセットを用いた場合の2021年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図18】Case03のデータセットを用いた場合の2018年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図19】Case03のデータセットを用いた場合の2019年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図20】Case03のデータセットを用いた場合の2020年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図21】Case03のデータセットを用いた場合の2021年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図22】Case04のデータセットを用いた場合の2018年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図23】Case04のデータセットを用いた場合の2019年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図24】Case04のデータセットを用いた場合の2020年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図25】Case04のデータセットを用いた場合の2021年度の水位予測結果であり、(a)~(c)は3~5月分の予測結果である。
【
図26】Case01、Case02のデータセットを用いた場合の予測値と実測値の比較結果であり、(a)~(d)はCase01での6,12,18.24時間後の結果であり、(e)~(h)はCase02での6,12,18.24時間後の結果である。
【
図27】Case03、Case04のデータセットを用いた場合の予測値と実測値の比較結果であり、(a)~(d)はCase03での6,12,18.24時間後の結果であり、(e)~(h)はCase04での6,12,18.24時間後の結果である。
【
図28】シミュレーションの結果を示すものであり、(a)はCase01~Case04ごとに相関式の傾きを比較したものであり、(b)はCase01~Case04ごとに相関係数を比較したものである。
【
図29】Case05のデータセットを用いた場合の2018、2019年度の水位予測結果であり、(a)~(b)は2018年3~4月分の予測結果であり、(c)~(d)は2019年3~4月分の予測結果である。
【
図30】Case05のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図31】Case06のデータセットを用いた場合の2018、2019年度の水位予測結果であり、(a)~(b)は2018年3~4月分の予測結果であり、(c)~(d)は2019年3~4月分の予測結果である。
【
図32】Case06のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図33】Case07のデータセットを用いた場合の2018、2019年度の水位予測結果であり、(a)~(b)は2018年3~4月分の予測結果であり、(c)~(d)は2019年3~4月分の予測結果である。
【
図34】Case07のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図35】Case08のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図36】Case09のデータセットを用いた場合の2018、2019年度の水位予測結果であり、(a)~(b)は2018年3~4月分の予測結果であり、(c)~(d)は2019年3~4月分の予測結果である。
【
図37】Case09のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図38】Case10のデータセットを用いた場合の2018、2019年度の水位予測結果であり、(a)~(b)は2018年3~4月分の予測結果であり、(c)~(d)は2019年3~4月分の予測結果である。
【
図39】Case10のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図40】Case11のデータセットを用いた場合の2018、2019年度の水位予測結果であり、(a)~(b)は2018年3~4月分の予測結果であり、(c)~(d)は2019年3~4月分の予測結果である。
【
図41】Case11のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図42】Case12のデータセットを用いた場合の2018、2019年度の水位予測結果であり、(a)~(b)は2018年3~4月分の予測結果であり、(c)~(d)は2019年3~4月分の予測結果である。
【
図43】Case12のデータセットを用いた場合の2020、2021年度の水位予測結果であり、(a)~(b)は2020年3~4月分の予測結果であり、(c)~(d)は2021年3~4月分の予測結果である。
【
図44】Case05、Case06のデータセットを用いた場合の予測値と実測値の比較結果であり、(a)~(d)はCase05での6,12,18.24時間後の結果であり、(e)~(h)はCase06での6,12,18.24時間後の結果である。
【
図45】Case07、Case08のデータセットを用いた場合の予測値と実測値の比較結果であり、(a)~(d)はCase07での6,12,18.24時間後の結果であり、(e)~(h)はCase08での6,12,18.24時間後の結果である。
【
図46】Case09、Case10のデータセットを用いた場合の予測値と実測値の比較結果であり、(a)~(d)はCase09での6,12,18.24時間後の結果であり、(e)~(h)はCase10での6,12,18.24時間後の結果である。
【
図47】Case11、Case12のデータセットを用いた場合の予測値と実測値の比較結果であり、(a)~(d)はCase11での6,12,18.24時間後の結果であり、(e)~(h)はCase12での6,12,18.24時間後の結果である。
【
図48】シミュレーションの結果を示すものであり、(a)はCase01~Case12ごとに相関式の傾きを比較したものであり、(b)はCase01~Case12ごとに相関係数を比較したものである。
【発明を実施するための形態】
【0015】
以下、本発明を実施するための形態を、適宜図面を参照しながら詳細に説明する。各図は、本発明を十分に理解できる程度に、概略的に示してあるに過ぎない。よって、本発明は、図示例のみに限定されるものではない。なお、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。
【0016】
<実施形態に係る学習装置および予測装置の構成について>
図1を参照して、実施形態に係る学習装置10および予測装置20について説明する。
図1は、実施形態に係る学習装置10および予測装置20の機能構成図である。なお、学習装置10および予測装置20を一つの装置として構成することもできる。
学習装置10は、河川の流域(「集水域」とも呼ばれる)での融雪の状況と当該河川の水位との関係を学習する装置である。学習装置10は、河川の水位および流域に関する気象項目値情報を用いて機械学習を行う。気象項目値情報は、例えば流域に関する気象分布画像Fを処理することによって得たものや、流域内の地点で観測したAMeDAS観測値などであってよい。
予測装置20は、河川の流域での融雪の状況から当該河川の所定時間後の水位を予測する装置である。予測装置20は、学習装置10を用いて学習した学習済みの学習器(学習モデル)を用いて水位の予測を行う。
【0017】
(学習装置の構成)
図1に示すように、学習装置10は、画像処理部11と、学習データ取得部12と、学習処理部13とを備える。画像処理部11、学習データ取得部12および学習処理部13は、CPU(Central Processing Unit)によるプログラム実行処理や、専用回路等により実現される。これらの機能がプログラム実行処理により実現する場合、当該機能を実現するためのプログラムが図示しない記憶部に格納される。
【0018】
画像処理部11は、学習に用いる気象項目値情報を気象分布画像Faから求める機能を有する。気象項目値情報は、河川の流域における気象項目値(例えば、気温、降水量、風速、積雪深、日照時間など)に関する情報である。画像処理部11には、気象分布画像Faが入力される。画像処理部11は、気象項目値情報の他に、気象分布画像Faから代表点情報を求める。
ここでの代表点は、河川の流域における気象項目の強度分布が反映されたものであり、気象分布画像Faを画像処理することによって求められる。代表点は、例えば気象項目値の強度を重さに見立てた場合の流域の重心である。代表点情報は、例えば代表点の位置、予め決められた基準点から代表点までの距離である。
【0019】
図2および
図3を参照して、画像処理部11の処理について説明する。
図2は、河川および流域のイメージ図である。
図3は、画像処理部11の処理を説明するための図であり、(a)は気象分布画像Faの例示であり、(b)は流域内の気象分布画像Faを抽出した流域画像Eの例示であり、(c)は代表点の例示である。
図2では、河川を符号K1で表し、流域を符号K2で表している。流域K2は、降った雨が河川K1に流れ込む領域を示しており、流域K2に降った雨は河川K1を介して海K3に流出する。流域K2は、例えば国土交通省が公開している流域図に基づくものであってよい。また、河川K1の下流側には観測所K4が設けられており、河川K1の水位を計測できる。本実施形態では、観測所K4における水位を予測することとし、観測所K4よりも上流側の流域K2A(つまり、上流側の流域K2Aに積もった雪の融雪)について着目する。予測する水位の場所に応じて、流域K2の中で着目する部分を選択するのがよい。例えば、河川K1の河口付近の水位を予測する場合、上流側の流域K2Aおよび下流側の流域K2Bを含めた流域K2全体に着目するのがよい。なお、水位を予測する地点は、潮位の影響を受けない場所であることが望ましく、河口付近よりも潮位変動の影響が少ない河口から離れた地点での予測の方が精度が高くなる。上流側の流域K2Aに積もった雪の融雪による水が観測所K4での水位変化に影響を与えるまでの時間は、河川K1の特徴により決定され、例えば河川の長さや高低差によって決まる。なお、
図2に示す河川K1は、石狩川である。
【0020】
画像処理部11は、気象分布画像Fa(
図3(a)参照)から流域K2A部分の画像である流域画像E(
図3(b)参照)を抽出し、流域画像Eを構成する各ピクセルのRGB値を輝度値に変換する。輝度値は、グレー値などとも呼ばれる。RGB値から輝度値への変換は、例えば式(1)を用いて行う。
・輝度値 = 255-(0.587 * r値 + 0.114 * g値+ 0.299 * b値) ・・式(1)
例えば、白色、水色、薄い青色、濃い青色、黄色、橙色、赤色、茶色の順に気象項目値の強度が強まる場合、輝度変換することによって白色の輝度値が「0(ゼロ)」に近く、茶色の輝度値が「255」に近くなるように輝度変換の式を構築する。つまり、強度分布での気象項目の強度に対応させて、RGB値の赤、青、緑に重み付けをしている。これにより、画像処理部11は、流域画像E(
図3(b)参照)を輝度変換したグレー画像D(
図3(c)参照)を作成する。
【0021】
また、画像処理部11は、グレー画像D(
図3(c)参照)を構成する各ピクセルの輝度値を重さに見立てた場合における流域K2Aの重心Gを代表点として算出する。流域K2Aの重心の算出は、気象分布画像Fa(
図3(a)参照)に設定した基準点(ここでは、原点O)から各ピクセルまでの距離(例えば、座標値)と輝度値の大きさとから重心を求めることが可能であり、例えば式(2)を用いて行う。ここでの原点Oは、気象分布画像Faの左下頂点であり、気象分布画像Faを構成する辺にX軸、Y軸を設定しており、X座標値およびY座標値は、例えば、ピクセルの位置(配列)に対応している。
・重心GのX座標X
G = (X
1M
1+ X
2M
2 + … + X
nM
n) / (M
1 + M
2 + … + M
n) ・・式(2)
ここで、「X
1,X
2, … ,X
n」は、原点Oから各ピクセルまでのX軸方向の距離(X座標値)であり、「M
1,M
2, … ,M
n」は、各ピクセルの輝度値である。重心GのY座標値についても同様に算出し、重心Gの重心座標(X
G, Y
G)が求まる。
そして、画像処理部11は、重心Gの位置(重心座標(X
G, Y
G))および基準点(ここでは原点O)から重心Gまでの距離Lを代表値情報とする。また、画像処理部11は、グレー画像D(
図3(c)参照)を構成する各ピクセルの輝度値の統計値Rを算出し、算出した統計値Rを気象項目値情報とする。輝度値の統計値Rは、例えばグレー画像Dを構成する各ピクセルの輝度値の平均値でよい。
【0022】
図4を参照して、気象分布画像Fとして時間平均気温画像F1a、時間積算降水量画像F2a、時間平均風速画像F3aの三種類を用いる場合の処理について説明する。
図4は、各々の気象分布画像Faでの重心Gの算出イメージであり、
図4(a)は時間平均気温画像F1aでの算出結果を示し、
図4(b)は時間積算降水量画像F2aでの算出結果を示し、
図4(c)は時間平均風速画像F3aでの算出結果を示す。
図4(a)に示すように、時間平均気温画像F1aから、重心座標(X1,Y1)、重心Gまでの距離L1、輝度値の統計値R1を求める。時間平均気温(℃)は、時間単位(例えば、0分から59分までの間)での平均気温である。0分から59分までの間の特定の数分間(例えば、50分~59分の10分間)に計測した観測値の平均値を時間平均気温として用いてもよく、本実施形態でも10分間の観測値に基づいて算出した値を時間平均気温としている。
また、
図4(b)に示すように、時間積算降水量画像F2aから、重心座標(X2,Y2)、重心Gまでの距離L2、輝度値の統計値R2を求める。時間積算降水量は、時間単位(例えば、0分から59分までの間)での降水量の累積値である。0分から59分までの間の特定の数分間(例えば、50分~59分の10分間)に計測した観測値に基づいて時間積算降水量を求めてもよく、本実施形態でも10分間の観測値に基づいて算出した値を時間積算降水量としている。
また、
図4(c)に示すように、時間平均風速画像F3aから、重心座標(X3,Y3)、重心Gまでの距離L3、輝度値の統計値R3を求める。時間平均風速は、時間単位(例えば、0分から59分までの間)での平均風速である。0分から59分までの間の特定の数分間(例えば、50分~59分の10分間)に計測した観測値の平均値を時間平均風速として用いてもよく、本実施形態でも10分間の観測値に基づいて算出した値を時間平均風速としている。
このように、観測値の累積値や平均値が反映された時間単位の気象分布画像Fを用いることで、水位の予測精度を高めることが期待できるが、時間ごとの代表値(例えば、0分から59分までの間の特定の時刻に計測した観測値)が反映された気象分布画像Fを用いることも可能である。
【0023】
図1に示す学習データ取得部12は、学習データを整理する機能を有する。学習データ取得部12には、河川の水位に関する情報、流域の気象項目値に関する情報、流域の代表値に関する情報などが入力される。学習データ取得部12は、例えば水位の予測を行う者の指示に従って学習データを整理する。なお、河川の水位に関する情報、流域の気象項目値に関する情報、流域の代表値に関する情報を予め記憶部に登録しておき、学習データ取得部12が登録されていた情報を学習データとして取得してもよい。記憶部は、通信回線を介して接続される装置が備えるものであってもよい。以下では、整理した学習データのまとまりを「学習用のデータセット」と呼ぶ場合がある。
【0024】
学習データ取得部12によって整理された学習用のデータセットの一例を
図5Aに示す。
図5Aは、学習用のデータセットの一例である。
図5Aに示す学習用のデータセットは、基準となる時刻(
図5Aの符号51参照)が異なる複数の学習データによって構成されている。
図5Aに示す学習用のデータセットには、2018~2021年における情報が含まれており、各年度の情報は3~5月における河川の観測所での一時間ごとの水位に対応する情報となっている。各々の学習データは、入力データ部分(
図5Aの符号52参照)と、出力データ部分(
図5Aの符号53参照)とで構成される。入力データ部分は、水位を予測する場合に入力となる情報であり、出力データ部分は、水位を予測する場合に出力となる情報である。なお、3~5月は、流域に積雪が存在している融雪期間の例示である。
【0025】
図5Aに示すように、入力データ部分は、主に、データ(1)(
図5Aの符号54参照)、データ(2)(
図5Aの符号55参照)、データ(3)(
図5Aの符号56参照)によって構成される。
図5Bは、学習用のデータセットのデータ(1)の拡大図である。
図5Cは、学習用のデータセットのデータ(2)の拡大図である。
図5Dは、学習用のデータセットのデータ(3)および出力データ部分の拡大図である。
【0026】
図5Bに示すように、データ(1)は、基準となる時刻をtとした場合における、t-24h~t+24hでの気温,降水量,風速の「重心座標(X
G,Y
G)」「重心までの距離L」「領域内の平均値R」で構成される。
図5Cに示すように、データ(2)は、基準となる時刻をtとした場合における、t-24h~t+24hでの積雪深,日照時間のAMeDAS観測値で構成される。
図5Dに示すように、データ(3)は、時刻tでの観測所の水位で構成される。
図5Dに示すように、出力データ部分は、基準となる時刻をtとした場合における、t+1h~t+24hでの観測所の水位で構成される。
つまり、予測時においては、データ(1)ないし(3)を学習済みの学習器に入力することで、データ(4)に示すように、24時間先までの1時間ごとの水位が出力される。なお、学習データにおける時刻tは、「第一時点」の一例であり、時刻t-24h~t+24hは、「第二時点」の一例であり、時刻t+1h~t+24hは、「第三時点」の一例である。
【0027】
図5Bに示すデータ(1)は、例えば気象分布画像Fから求められる。時刻tとして「2018/3/1 1:00」を想定した場合のデータ(1)について説明する。この場合のデータ(1)は、時刻t-24h(2018/2/28 1:00),時刻t-23h(2018/2/28 2:00),・・,時刻t+23h(2018/3/2 0:00),時刻t+24h(2018/3/2 1:00)の時間平均気温画像F1a(
図4(a)参照)から求めた合計で25個の重心座標(X1,Y1)、重心Gまでの距離L1、流域内の平均値R1を有する。また、時刻t-24h(2018/2/28 1:00),時刻t-23h(2018/2/28 2:00),・・,時刻t+23h(2018/3/2 0:00),時刻t+24h(2018/3/2 1:00)の時間積算降水量画像F2a(
図4(b)参照)から求めた合計で25個の重心座標(X2,Y2)、重心Gまでの距離L2、流域内の平均値R2を有する。また、時刻t-24h(2018/2/28 1:00),時刻t-23h(2018/2/28 2:00),・・,時刻t+23h(2018/3/2 0:00),時刻t+24h(2018/3/2 1:00)の時間平均風速画像F3a(
図4(c)参照)から求めた合計で25個の重心座標(X3,Y3)、重心Gまでの距離L3、流域内の平均値R3を有する。
【0028】
図5Cに示すデータ(2)は、例えば領域内の特定の地点(例えば、合計20の地点)で測定した情報である。データ(2)の情報は、例えばAMeDAS観測値であってよい。時刻tとして「2018/3/1 1:00」を想定した場合のデータ(2)について説明する。この場合のデータ(2)は、第1地点~第20地点で時刻t-24h(2018/2/28 1:00),時刻t-23h(2018/2/28 2:00),・・,時刻t+23h(2018/3/2 0:00),時刻t+24h(2018/3/2 1:00)に測定した合計で500個の積雪深の情報を有する。また、第1地点~第20地点で時刻t-24h(2018/2/28 1:00),時刻t-23h(2018/2/28 2:00),・・,時刻t+23h(2018/3/2 0:00),時刻t+24h(2018/3/2 1:00)に測定した合計で500個の日照時間の情報を有する。
【0029】
図5Dに示すデータ(3)は、例えば河川の特定の地点(例えば、観測所)で測定した情報である。時刻tとして「2018/3/1 1:00」を想定した場合のデータ(3)は、時刻t(2018/3/1 1:00)での水位である。
図5Dに示すデータ(4)は、例えば河川の特定の地点(例えば、観測所)で測定した情報である。時刻tとして「2018/3/1 1:00」を想定した場合のデータ(4)は、時刻t+1h(2018/3/1 2:00),・・,時刻t+23h(2018/3/2 0:00),時刻t+24h(2018/3/2 1:00)での水位である。
【0030】
なお、本実施形態では、学習データとしてデータ(1)および(2)を有するものを想定しているが、データ(1)および(2)の何れかのみを有する構成であってもよい。つまり、学習データは、データ(1),(3),(4)の構成や、データ(2),(3),(4)の構成であってもよい。
また、
図5Bおよび
図5Cに示したデータ(1)および(2)の構成はあくまで例示であり、データ(1)および(2)に含める気象項目の種類は、
図5Bおよび
図5Cに示すものに限定されない。例えば、
図5Bおよび
図5Cに示す気象項目以外のものをデータ(1)および(2)に含めたり、気象項目の一部をデータ(1)および(2)から除くことも可能である。本実施形態では、気象分布画像を取得し易い気象項目(気温、降水量、風速)をデータ(1)とし、気象分布画像を取得し難い気象項目(積雪深、日照時間)をデータ(2)としている。
また、データ(1),(2)は、時刻t-24h~tの期間の情報のみで構成することもできる。つまり、データ(1),(2)は、時刻t+1h~t+24hの期間の情報を含まないものであってもよい。
【0031】
学習用のデータセットは、出水期間に基づいて間引きされたものであってもよい。
図6を参照して、データセットの間引きの一例を説明する。
図6(a)は、最大水位の選定方法を説明するための図であり、(b)は、観測所における水位の変動を示すグラフである。ここでは、観測所の水位が「7m」を超える出水に基づいて間引きすることを想定する(
図6(b)参照)。観測所水位「7m」は年に数回程度発生する出水時の水位である。
ある時刻tの水位WLに関して、「WL(t-1)<WL(t)」、「WL(t-2)<WL(t)」、「WL(t+1)<WL(t)」および「WL(t+2)<WL(t)」の条件(
図6(a)参照)を満たすと共に水位が「7m」を超える時刻tを出水時刻として選定し、出水時刻tに基づいて出水期間Tを設定する。出水時刻tの水位は、前後の期間の水位に対して高くなっているので、最大水位と呼ぶことにする。出水期間Tを出水時刻t±72hと定義し、出水期間Tの中に別の最大水位が含まれる場合には、最も早いタイミングの最大水位の時刻t-72hから、最も遅いタイミングの最大水位の時刻t+72hまでを出水期間Tとする(
図6(b)参照)。
【0032】
そして、出水期間Tに基づいてデータセットに含めるデータを選定する。間引きしたデータセットの一例を以下のCase02~Case04に示す。なお、Case01は、間引きする前のデータセットの状態を示し、例えば、全期間(一例は、融雪期間(3~5月))におけるすべてのデータを学習用のデータセットに含めたものである。
Case02は、出水期間Tにおけるデータのみを学習用のデータセットに含めたものである。Case02でのデータ数は「N」とする。つまり、Case02は、Case01から出水期間以外の期間T´のデータを間引いたものである。
Case03は、出水期間以外の期間T´から出水期間Tにおけるデータ数Nと同じ数(N×1倍)のデータを任意に選定し、出水期間Tにおけるデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case03でのデータ数は「N×2」である。
Case04は、出水期間以外の期間T´から出水期間Tにおけるデータ数Nの2倍の数(N×2倍)のデータを任意に選定し、出水期間Tにおけるデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case04でのデータ数は「N×3」である。
【0033】
図1に示す学習処理部13は、学習器を有しており、学習用のデータセットを用いて学習器を機械学習させる。学習器は、機械学習における学習システムであり、与えられたデータを基に分類・予測・判定などした結果と正答となる実際の結果とを比較し、各種パラメータを調整することで良い結果を導くことが可能になる。学習器は、例えばニューラルネットワークであり、本実施形態でもニューラルネットワークを想定して説明する。ニューラルネットワークは、一般的に入力層、中間層、出力層で構成される。入力層には説明変数が入力され、出力層からは目的変数が出力される。中間層は、両者を関係づける役割を担っている。中間層の層数および各中間層のニューロン数には制約がなく、任意に設定することができる。
【0034】
学習器を学習させる方法は特に限定されず、例えば学習器の種類に適した方法によって学習器を学習させるのがよい。例えば、学習データを構成する(1)時刻t-24h~t+24hでの気温,降水量,風速の「重心座標(XG,YG)」「重心までの距離L」「領域内の平均値R」、(2)時刻t-24h~t+24hでの積雪深,日照時間のAMeDAS観測値、(3)時刻tでの観測所の水位が入力層に入力され、出力層から出力される結果と(4)時刻t+1h~t+24hでの観測所の水位との誤差に基づいて中間層を調整する。
つまり、学習処理部13は、融雪期間中のある第一時点(一例は、時刻t)での河川の水位、および、第一時点を含む特定期間中における所定時間ごとの複数の第二時点(一例は、時刻t-24h~t+24h)での気象項目値情報を入力することによって、第一時点以降の第二時点である複数の第三時点(一例は、時刻t+1h~t+24h)での河川の水位を出力するように学習器を学習させる。
【0035】
(予測装置の構成)
図1に示すように、予測装置20は、画像処理部21と、予測データ取得部22と、予測処理部23とを備える。画像処理部21、予測データ取得部22および予測処理部23は、CPU(Central Processing Unit)によるプログラム実行処理や、専用回路等により実現される。これらの機能がプログラム実行処理により実現する場合、当該機能を実現するためのプログラムが図示しない記憶部に格納される。
【0036】
図1に示す画像処理部21は、予測に用いる気象項目値情報を気象分布画像Fbから求める機能を有する。気象項目値情報は、河川の流域における気象項目値(例えば、気温、降水量、風速、積雪深、日照時間など)に関する情報である。画像処理部21には、気象分布画像Fbが入力される。画像処理部21は、気象項目値情報の他に、気象分布画像Fbから代表点情報を求める。画像処理部21の処理は、学習段階における画像処理部11の処理と同様であるので詳細な説明を省略する。なお、気象分布画像Fbは、過去のもの(例えば実測したもの)であってもよいし、未来のもの(例えば予報したもの)であってもよい。つまり、過去の実際の気象分布画像Fbから現在または近い未来の水位を予測することもできるし、予報として公表された未来の気象分布画像Fbからさらに遠い未来の水位を予測することもできる。
【0037】
図1に示す予測データ取得部22は、予測データを整理する機能を有する。予測データ取得部22には、河川の水位(予測時点より前の時刻)に関する情報、流域の気象項目値に関する情報、流域の代表値に関する情報などが入力される。予測データ取得部22は、例えば水位の予測を行う者の指示に従って予測データを整理する。なお、河川の水位に関する情報、流域の気象項目値に関する情報、流域の代表値に関する情報を予め記憶部に登録しておき、予測データ取得部22が登録されていた情報を予測データとして取得してもよい。記憶部は、通信回線を介して接続される装置が備えるものであってもよい。
【0038】
予測データは、学習データの入力データ部分(
図5Aの符号52参照)に対応する情報で構成される。つまり、予測データは、例えば、基準となる時刻をtとした場合における、(1)時刻t-24h~t+24hでの気温,降水量,風速の「重心座標(X
G,Y
G)」「重心までの距離L」「領域内の平均値R」、(2)時刻t-24h~t+24hでの積雪深,日照時間のAMeDAS観測値、(3)時刻tでの観測所での水位、とで構成される。この予測データに基づいて、(4)時刻t+1h~t+24hでの観測所の水位が予測可能である。基準となる時刻tを現時刻として現時点から24時間先までの一時間ごとの水位を予測することを想定した場合、予測データに含まれるデータ(1),(2)の時刻t+1h~t+24h部分は予報値や数値解析を別途行って取得した情報などであってよい。学習データのデータ(1),(2)が時刻t-24h~tの期間の情報のみで構成される場合(つまり、時刻t+1h~t+24hの期間の情報を含まない場合)、予測データのデータ(1),(2)も同様に時刻t-24h~tの期間の情報のみで構成できる。このようにすると、予報値などを用いずに現在よりも未来の水位の予測を行える。
なお、予測データおよび予測結果における時刻tは、「第四時点」の一例であり、時刻t-24h~t+24hは、「第五時点」の一例であり、時刻t+1h~t+24hは、「第六時点」の一例である。
【0039】
図1に示す予測処理部23は、学習済みの学習器を有している。学習済みの学習器は、学習装置10によって学習器を機械学習させたものである。つまり、学習済みの学習器は、融雪期間中のある第四時点(一例は、時刻t)での河川の水位、および、第四時点を含む特定期間中における所定時間ごとの複数の第五時点(一例は、時刻t-24h~t+24h)での気象項目値情報を入力することによって、第四時点以降の第五時点である複数の第六時点(一例は、時刻t+1h~t+24h)での河川の水位を出力するように学習されたものである。予測処理部23は、例えば、(1)時刻t-24h~t+24hでの気温,降水量,風速の「重心座標(X
G,Y
G)」「重心までの距離L」「領域内の平均値R」、(2)時刻t-24h~t+24hでの積雪深,日照時間のAMeDAS観測値、(3)時刻tでの観測所での水位を学習器に入力することで、(4)時刻t+1h~t+24hでの観測所の水位を予測する。
【0040】
(重み付けに関して)
地域や時期によって融雪に関係する気象項目の寄与度が異なる場合がある。そこで、気象項目が水位の予測に及ぼす寄与度を重みとして設定し、学習データや予測データに重み付けをして(例えば、重みを乗じて)河川の水位の予測を行ってもよい。例えば、重回帰分析を用いた重み付けを実施することが可能である。重回帰分析では、目的変数と説明変数の関係を式(3)のようにモデル化し、説明変数(式(3)のxi)によって目的変数(式(3)のy)を求める式を構築する方法である。式(3)の説明変数に乗じるwiが重みに相当する。
・y=w0+w1x1+w2x2+w3x3+・・・+wnxn ・・式(3)
重回帰分析は、複数のxiとyの組合せを用いて、yに最も近くなるwiの値を数学的な手法(Lagrangeの未定乗数法等)から求める。本実施形態では、説明変数xiが気象項目値、目的変数yが河川の水位、気象項目の重みがwiに相当する。
【0041】
重回帰分析に使用する河川の水位や気象項目値(つまり、重み値の計算に使用する情報)は、水位の予測を行う河川の流域内のものであるのがよく、河川の水位の予測を行う予測地点または当該予測地点よりも上流の地点の観測値であるのが望ましい。重回帰分析を複数の地点ごとに行い、その結果に対して統計的計算を行ったものを重み値として用いてもよい。また、重回帰分析に使用する河川の水位や気象項目値は、河川の水位の学習に使用する学習データや予測に使用する予測データに関連する時期のものであるのがよく、学習データや予測データに対応した時点であるのが望ましい。また、重回帰分析に使用する気象項目の種類や数は特に限定されないが、学習データや予測データに対応した気象項目であるのが望ましい。重回帰分析以外の方法を用いて重み値を設定してもよい。重み値の設定は、数学的な計算に基づくものに限らず、例えば経験によるものであってもよい。
【0042】
学習時および予測時では、重み値を用いて代表点情報および気象項目値情報の一方または双方に重み付けを行い、重み付け後の情報を用いて学習または予測を行う。例えば、学習処理部13は、学習データに含まれる代表点情報および気象項目値情報の一方または双方に重み値を乗じ、重み値を乗じた後の情報を用いて学習を行う。また、予測処理部23は、予測データに含まれる代表点情報および気象項目値情報の一方または双方に重み値を乗じ、重み値を乗じた後の情報を用いて予測を行う。なお、代表点情報や気象項目値情報に直接的な重み付けを行ってよいし、気象分布画像Fに対して重み付けを行うことで間接的に代表点情報や気象項目値情報に重み付けを行ってもよい。
【0043】
<実施形態に係る学習装置および予測装置の効果>
以上のように、実施形態に係る学習装置10によって学習した学習済みの学習器を用いることで、予測装置20は、将来における水位のトレンド(上昇・下降)を予測することができる。そのため、退避・復旧のタイミングを判断することが可能であり、河川工事の安全管理や工程管理において有用である。
また、重み付け後の気象項目値情報を用いて学習させることで、気象項目が水位の予測結果に及ぼす寄与度が学習データに反映されるので、さらに精度の良い予測を実現可能である。
また、出水期間Tに基づいて間引きされた学習用のデータセットを用いて学習することで、融雪期間中の全データを入力する場合に比べて計算負荷を軽減できる。
【0044】
実施形態に係る学習装置10および予測装置20の効果を検証するために、実際のデータを用いたシミュレーションを行ったので説明する。シミュレーションでは、学習用のデータセットの間引きの効果を比較するために、Case01~ Case04のデータセットを用いて学習を行い、予測結果を比較した。また、重み付けの効果を比較するために、重み付けある/なしで学習を行い、予測結果を比較した。シミュレーションの流れを
図7に示す。
図7は、シミュレーションでの予測手順フローである。予測手順は、主に、水位予測地点の選定(S1)、データの準備(S2)、画像の重心情報などの算出(S3)、間引きデータの作成(S4)、気象項目への重み付け(S5)、水位の学習および予測(S6)の工程によって構成される。
【0045】
(水位予測地点の選定「S1」)
シミュレーションでは、北海道を流れる石狩川の月形水位観測所を水位の予測地点に選定し、当該観測所における水位を予測した(
図2参照)。石狩川は、
図2の符号K1で示す河川であり、月形観測所は、
図2の符号K4に示す位置にある。石狩川の流域面積は約9,400km
2である。
図2に示すように、月形観測所は石狩川の下流部に位置している。
【0046】
(データの準備「S2」)
シミュレーションでは、2018年~2021年の3~5月(融雪時期)における1時間毎の気象分布画像およびAMeDAS観測値を準備した。
気象分布画像を準備した気象項目は、気温、降水量、風速であり、流域内の画像を準備した。画像の種類は、気温が「推計気象分布」、降水量が「解析雨量」、風速が「毎時大気解析」である。これらの画像は、気象庁から提供されており、取得可能である。
積雪深と日照時間は、AMeDAS観測値を用いた。観測地点は、月形観測所の流域内にある20か所の観測所(
図8の符号80で示すひし形の位置)であり、気象庁のHPから観測値を取得した。
図8は、月形観測所の流域内にある観測所の位置を示した図である。なお、当初は、すべての気象項目(気温,降水量,風速,積雪深,日照時間)で気象分布画像を用いることを検討したが、積雪深と日照時間については気象分布画像の提供が十分でなかったので、学習データを増やすことを優先してAMeDAS観測値を用いている。
【0047】
(画像の重心情報などの算出「S3」)
気象分布画像を用いる気温、降水量、風速は、画像の代表値として「重心座標(X
G,Y
G)」「重心までの距離L」「輝度値の統計値R」を求めた(
図4参照)。気象分布画像の全データ(例えば全ピクセルの情報)を用いると、深層学習に時間を要したり、深層学習の重みが収束しないなどの問題が発生することがあり、それを防ぐために代表値の情報を用いている。
【0048】
(間引きデータの作成「S4」)
シミュレーションで用いたCase01のデータセットは、2018~2021年における情報が含まれており、各年度の情報は3~5月における河川の観測所での一時間ごとの水位に対応する情報となっている(
図5A参照)。これにより、データセット数は、約8,800データ(92日/年×2018~2021年の4年間×24時間)である(約1,500データ/年))。
各々の学習データは、基準となる時刻をtとした場合における、(1)時刻t-24h~t+24hでの気温,降水量,風速の「重心座標(X
G,Y
G)」「重心までの距離L」「流域内の平均値R」、(2)時刻t-24h~t+24hでの積雪深,日照時間のAMeDAS観測値、(3)時刻tでの月形観測所での水位、(4)時刻t+1h~t+24hでの月形観測所の水位で構成される。
【0049】
また、
図6を参照して説明した間引き方法によって、シミュレーションで用いるCase02~ Case04のデータセットを作成した。
Case02は、出水期間Tにおけるデータのみを学習用のデータセットに含めたものである。Case02でのデータ数は「N」とする。つまり、Case02は、Case01から出水期間以外の期間T´のデータを間引いたものである。
Case03は、出水期間以外の期間T´から出水期間Tにおけるデータ数Nと同じ数(N×1倍)のデータを任意に選定し、出水期間Tにおけるデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case03でのデータ数は「N×2」である。
Case04は、出水期間以外の期間T´から出水期間Tにおけるデータ数Nの2倍の数(N×2倍)のデータを任意に選定し、出水期間Tにおけるデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case04でのデータ数は「N×3」である。
【0050】
(気象項目への重み付け「S5」)
2022年の3~5月の1時間ごとのAMeDAS観測値と月形観測所における水位の重回帰式(式(4))を求めて、回帰係数を重み値として用いた。
・y=w1x1+w2x2+w3x3+w4x4+w5x5+b ・・式(4)
ここで、「y:月形観測所水位、w1:積雪の重み、w2:気温の重み、w3:降水量の重み、w4:日照時間の重み、w5:風速の重み、b:係数」である。
重みの算出に用いる観測地点としては、流域中央付近にある「富良野(
図8の符号81で示す観測所)」、「旭川(
図8の符号82で示す観測所)」、「朱鞠内(
図8の符号83で示す観測所)」を選定した。重回帰分析は観測所ごとに実施し、AMeDAS観測値の24時間累積値から月形観測所の水位を求める重回帰式を導出した。得られた重回帰係数は、
図9の表に示す通りであり、本シミュレーションでは3地点の平均値を重み値とした。
図9は、シミュレーションで用いた重み値の一覧である。
【0051】
(水位の学習および予測「S6」)
Case01~ Case04のデータセットを用いて、1年ごとの水位を予測した。Case01~ Case04のうちの予測する年のデータを除いて学習を行い、予測時は予測する年のデータ(1)~(3)を入力した。
シミュレーションでの水位予測結果は、
図10ないし
図25に示す通りであった。
図10ないし
図13は、Case01のデータセットを用いた場合の予測結果であり、
図14ないし
図17は、Case02のデータセットを用いた場合の予測結果であり、
図18ないし
図21は、Case03のデータセットを用いた場合の予測結果であり、
図22ないし
図25は、Case04のデータセットを用いた場合の予測結果である。
また、6,12,18.24時間後の予測値と実測値の比較結果を
図26および
図27に示す。
図26は、Case01、Case02のデータセットを用いた場合の比較結果であり、
図27は、Case03、Case04のデータセットを用いた場合の比較結果である。
【0052】
図10ないし
図25に示した時系列のグラフから、各ケースとも重み付けをすることで予測精度が向上していること、および、間引きなしのCase01と間引きをしたCase03、Case04が類似した結果であることがわかる。
また、
図26および
図27から、Case03、Case04は、間引きなしのCase01と概ね同様の精度であることがわかる。
【0053】
Caseごとに相関式の傾きと相関係数を比較した結果を
図28に示す。
図28(a)はCase01~Case04ごとに相関式の傾きを比較したものであり、(b)はCase01~Case04ごとに相関係数を比較したものである。
図28に示すように、Case03、Case04は、Case01と概ね同様の値であることが確認できた。本結果から、学習データを間引きしても予測精度が大幅に低下しないこと、出水期間Tと同数以上の出水期間以外のデータを用いることで、水位を精度よく予測できることが示された。
【0054】
また、学習用のデータセットの間引きの方法を変更して、シミュレーションを行ったので説明する。追加で実施したシミュレーションでは、Case05~ Case12のデータセットを用いて学習を行い、予測結果を比較した。間引きの方法以外は、前述したシミュレーションと同様である。Case02~Case04では、出水期間Tを「t±72h」としていたが、Case05~Case09では出水期間を「t±36h」または「t±144h」に変更してある。また、Case02~Case04では、出水期間以外の期間T´からデータを任意に選定し、出水期間Tにおけるデータと出水期間以外の期間T´から選定したデータとを組み合わせていた。Case10~Case12では、出水期間以外の期間T´のデータとして2019年4月1日01:00を起点に連続した時間のデータを選定し、出水期間Tにおけるデータと組み合わせた。詳細は以下の通りである。
【0055】
Case05は、出水期間T(t±36h)におけるデータのみを学習用のデータセットに含めたものである。Case05でのデータ数は「N」である。
Case06は、出水期間以外の期間T´から出水期間T(t±36h)におけるデータ数Nと同じ数(N×1倍)のデータを任意に選定し、出水期間T(t±36h)におけるデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case06でのデータ数は「N×2」である。
Case07は、出水期間以外の期間T´から出水期間T(t±36h)におけるデータ数Nの2倍の数(N×2倍)のデータを任意に選定し、出水期間T(t±36h)におけるデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case07でのデータ数は「N×3」である。
【0056】
Case08は、出水期間T(t±144h)におけるデータのみを学習用のデータセットに含めたものである。Case08でのデータ数は「N」である。
Case09は、出水期間以外の期間T´から出水期間T(t±144h)におけるデータ数Nと同じ数(N×1倍)のデータを任意に選定し、出水期間T(t±144h)におけるデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case09でのデータ数は「N×2」である。
【0057】
Case10は、出水期間以外の期間T´に設定した起点(ここでは、2019年4月1日01:00)から1時間毎に「N×1」のデータを選定し、出水期間T(t±36h)における「N×1」のデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case10でのデータ数は「N×2」である。
Case11は、出水期間以外の期間T´に設定した起点(ここでは、2019年4月1日01:00)から1時間毎に「N×1」のデータを選定し、出水期間T(t±72h)における「N×1」のデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case11でのデータ数は「N×2」である。
Case12は、出水期間以外の期間T´に設定した起点(ここでは、2019年4月1日01:00)から1時間毎に「N×1」のデータを選定し、出水期間T(t±144h)における「N×1」のデータと出水期間以外の期間T´から選定したデータとを組み合わせたものである。Case12でのデータ数は「N×2」である。
【0058】
Case05~Case12のデータセットを用いて、1年ごとの水位を予測した。Case05~ Case12のうちの予測する年のデータを除いて学習を行い、予測時は予測する年のデータ(1)~(3)を入力した。
シミュレーションでの水位予測結果は、
図29ないし
図43に示す通りであった。
図29および
図30は、Case05のデータセットを用いた場合の予測結果であり、
図31および
図32は、Case06のデータセットを用いた場合の予測結果であり、
図33および
図34は、Case07のデータセットを用いた場合の予測結果である。
図35は、Case08のデータセットを用いた場合の予測結果であり、
図36および
図37は、Case09のデータセットを用いた場合の予測結果である。
図38および
図39は、Case10のデータセットを用いた場合の予測結果であり、
図40および
図41は、Case11のデータセットを用いた場合の予測結果であり、
図42および
図43は、Case12のデータセットを用いた場合の予測結果である。
【0059】
また、6,12,18.24時間後の予測値と実測値の比較結果を
図44ないし
図47に示す。
図44は、Case05、Case06のデータセットを用いた場合の比較結果であり、
図45は、Case07、Case08のデータセットを用いた場合の比較結果である。
図46は、Case09、Case10のデータセットを用いた場合の比較結果であり、
図47は、Case11、Case12のデータセットを用いた場合の比較結果である。
Caseごとに相関式の傾きと相関係数を比較した結果を
図48に示す。
図48(a)はCase01~Case12ごとに相関式の傾きを比較したものであり、(b)はCase01~Case12ごとに相関係数を比較したものである。
【0060】
出水期間Tのデータと、出水期間以外の期間T´のデータとの組合せについて、Case02-09の結果に基づいて検討する。なお、Case02-09では、出水期間以外の期間T´のデータを任意に抽出している。
出水期間T(T=t±72h)のデータのみのCase02、および、出水期間T(T=t±36h)のデータのみのCase05は、
図48に示すように予測精度が低下した。水位予測は出水の有無を問わず予測しているが、Case02およびCase05では、学習データに出水期間以外の期間T´のデータが少ないために出水期間以外の期間T´の水位予測精度が低下したことが要因であると考えられる。出水期間T(T=t±144h)のデータのみのCase08では、出水期間Tと出水期間以外の期間T´のデータが学習データに多く含まれているため、予測精度が低下しなかったと考えられる。
【0061】
データの間引きについて、Case10-12の結果に基づいて検討する。なお、Case10-12では、出水期間以外の期間T´のデータを連続時間で選定している。
出水期間T(T=t±36h)のCase10は、
図48に示すように予測精度が低下した。これは、2019年4月1日以降に選定したデータの中に含まれる出水期間Tと出水期間以外の期間T´のデータの数が少ないためであると考えられる。出水期間T(T=t±72h)のCase11および出水期間T(T=t±144h)のCase12は、2019年4月1日以降に選定したデータの中に出水期間Tと出水期間以外の期間T´のデータが十分に含まれていたため、予測精度が低下しなかったと考えられる。
【0062】
以上の石狩川を事例にしたシミュレーション結果により、以下のことが分かった。
[1]本実施形態で説明した手法では、学習データを間引きすることができる。
[2]最適な間引き方法は、学習データを出水期間Tと出水期間以外の期間T´に分けて、出水期間Tのデータ数に応じて期間T´を決定して学習データを選定する方法である。
[3]出水期間以外の期間T´に基づくデータの選定方法は2通りある。1つ目が任意に選定する方法であり、2つ目がある時刻から連続時間で選定する方法である。
[4]出水期間以外の期間T´から任意にデータを選定する場合を想定する。出水時のピーク水位(最大水位)の時刻tに対して出水期間Tが「t±72h」より短い時間の場合、出水期間以外の期間T´から選定するデータ数を、出水期間Tのデータ数と同じとし(Case06の結果参照)、または、それよりも多くして(Case07の結果参照)学習するのがよい。また、出水期間Tが「t±144h」以上の場合、出水期間Tのデータのみを学習データとすることが可能である。
[5]出水期間以外の期間T´に設定した起点から連続した時間のデータを選定する場合を想定する。その場合、出水期間以外の期間T´から選定するデータ数を、出水期間Tのデータ数と同じとし、かつ、出水時のピーク水位(最大水位)の時刻tに対して出水期間Tを「t±72h」以上の長い範囲を選ぶとよい(Case11およびCase12の結果参照)。
【符号の説明】
【0063】
10 学習装置
11 画像処理部
12 学習データ取得部
13 学習処理部
20 予測装置
21 画像処理部
22 予測データ取得部
23 予測処理部
F,Fa,Fb 気象分布画像