IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社東芝の特許一覧

特開2024-134376情報処理装置、情報処理方法、及びプログラム
<>
  • 特開-情報処理装置、情報処理方法、及びプログラム 図1
  • 特開-情報処理装置、情報処理方法、及びプログラム 図2
  • 特開-情報処理装置、情報処理方法、及びプログラム 図3
  • 特開-情報処理装置、情報処理方法、及びプログラム 図4
  • 特開-情報処理装置、情報処理方法、及びプログラム 図5
  • 特開-情報処理装置、情報処理方法、及びプログラム 図6
  • 特開-情報処理装置、情報処理方法、及びプログラム 図7
  • 特開-情報処理装置、情報処理方法、及びプログラム 図8
  • 特開-情報処理装置、情報処理方法、及びプログラム 図9
  • 特開-情報処理装置、情報処理方法、及びプログラム 図10
  • 特開-情報処理装置、情報処理方法、及びプログラム 図11
  • 特開-情報処理装置、情報処理方法、及びプログラム 図12
  • 特開-情報処理装置、情報処理方法、及びプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024134376
(43)【公開日】2024-10-03
(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240926BHJP
   G01W 1/00 20060101ALI20240926BHJP
【FI】
G06N20/00 130
G01W1/00 Z
【審査請求】未請求
【請求項の数】19
【出願形態】OL
(21)【出願番号】P 2023044642
(22)【出願日】2023-03-20
(71)【出願人】
【識別番号】000003078
【氏名又は名称】株式会社東芝
(74)【代理人】
【識別番号】100120031
【弁理士】
【氏名又は名称】宮嶋 学
(74)【代理人】
【識別番号】100107582
【弁理士】
【氏名又は名称】関根 毅
(74)【代理人】
【識別番号】100118876
【弁理士】
【氏名又は名称】鈴木 順生
(74)【代理人】
【識別番号】100103263
【弁理士】
【氏名又は名称】川崎 康
(72)【発明者】
【氏名】ポール トポン
(57)【要約】
【課題】目的変数を高精度に予測する。
【解決手段】情報処理装置は、時系列データを含む第1学習用データを第1モデルに入力して、目的変数の予測値を算出する第1予測値算出部と、制御データを含む第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出する第1予測残差量算出部と、前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するモデル構築部と、を備える。
【選択図】図1
【特許請求の範囲】
【請求項1】
時系列データを含む第1学習用データを第1モデルに入力して、予測対象である目的変数の予測値を算出する第1予測値算出部と、
第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出する第1予測残差量算出部と、
前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するモデル構築部と、を備える、
情報処理装置。
【請求項2】
複数の前記第1モデルから1つ又は2以上の第1モデルを選択するモデル選択部を備え、
前記第1予測値算出部は、前記モデル選択部で選択された前記1つ又は2以上の第1モデルに前記第1学習用データを入力して、前記目的変数の予測値を算出する、
請求項1に記載の情報処理装置。
【請求項3】
前記第1予測値算出部は、前記モデル選択部が2以上の第1モデルを選択した場合、前記2以上の第1モデルのそれぞれに対応する前記第1学習用データに基づいて、前記目的変数の前記予測値を算出し、
前記第1予測残差量算出部は、前記2以上の第1モデルのそれぞれで算出された前記予測値に基づいて、前記第1予測残差量を算出する、
請求項2に記載の情報処理装置。
【請求項4】
前記2以上の第1モデルのそれぞれについて、前記予測値に対する寄与度を算出する寄与度算出部を備え、
前記第1予測残差量算出部は、前記第2学習用データに含まれる目的変数と、前記2以上の第1モデルのそれぞれについて算出された前記予測値に対応する前記寄与度を乗じた値とに基づいて、前記第1予測残差量を算出する、
請求項3に記載の情報処理装置。
【請求項5】
前記第1予測残差量算出部は、前記第2学習用データに含まれる目的変数から、前記2以上の第1モデルのそれぞれについて算出された前記予測値に対応する前記寄与度を乗じた値をそれぞれ減じることにより、前記第1予測残差量を算出する、
請求項4に記載の情報処理装置。
【請求項6】
前記寄与度算出部は、前記2以上の第1モデルのそれぞれについて、前記時系列データを複数の特徴的区間に分割し、前記特徴的区間ごとに前記第1モデルの寄与度を算出し、
前記第1予測残差量算出部は、前記2以上の第1モデルのそれぞれについて、前記特徴的区間ごとの前記第1モデルの寄与度に基づいて前記第1予測残差量を算出する、
請求項4に記載の情報処理装置。
【請求項7】
前記寄与度算出部は、前記特徴的区間ごとに、前記第1モデルで算出された前記予測値と前記目的変数との相関係数を算出し、算出された前記相関係数に基づいて前記寄与度を算出する、
請求項6に記載の情報処理装置。
【請求項8】
前記寄与度算出部は、前記相関係数が大きいほど、前記寄与度をより大きくする、
請求項7に記載の情報処理装置。
【請求項9】
前記第1予測値算出部、前記第1予測残差量算出部、及び前記モデル構築部を有するモデル学習部と、
前記モデル学習部で学習された前記第2モデルに基づいて、前記目的変数を予測する予測部と、を備える、
請求項3に記載の情報処理装置。
【請求項10】
前記予測部は、
前記第1学習用データに対応する第1予測用データを前記第1モデルに入力して、前記第1モデルにて前記目的変数の予測値を算出する第2予測値算出部と、
前記第2学習用データに対応する第2予測用データを前記第2モデルに入力して、前記第2モデルにより、前記目的変数と前記第2予測値算出部で算出された前記予測値とのずれである第2予測残差量を算出する第2予測残差量算出部と、
前記第2予測値算出部で算出された前記予測値と、前記第2予測残差量算出部で算出された前記第2予測残差量とに基づいて、前記目的変数を予測する第3予測値算出部と、を有する、
請求項9に記載の情報処理装置。
【請求項11】
前記第2予測値算出部は、前記モデル選択部が前記2以上の第1モデルを選択した場合、前記2以上の第1モデルのそれぞれに対応する前記第1予測用データに基づいて、前記目的変数の前記予測値を算出する、
請求項10に記載の情報処理装置。
【請求項12】
前記第1予測用データを複数の特徴的区間に同定する特徴的区間同定部と、
前記複数の特徴的区間のそれぞれごとに前記第1モデルの寄与度を抽出する寄与度抽出部と、を備え、
前記第3予測値算出部は、前記2以上の第1モデルのそれぞれについて、前記特徴的区間ごとの前記第1モデルの寄与度に基づいて、前記目的変数を予測する、
請求項11に記載の情報処理装置。
【請求項13】
前記目的変数は、ダム流入量であり、
前記モデル選択部は、タンクモデル及び融雪モデルを前記第1モデルとして選択し、
前記第2予測値算出部は、前記タンクモデルのダム流出量と、前記融雪モデルのダム流出量を算出する、
請求項10に記載の情報処理装置。
【請求項14】
前記目的変数は、風力発電量であり、
前記第1モデルは、風車の発電モデルであり、
前記第2予測値算出部は、風速と発電カーブとに基づいて、前記風車の発電モデルの発電量を算出する、
請求項10に記載の情報処理装置。
【請求項15】
前記目的変数は、河川流量であり、
前記第1モデルは、水文モデルであり、
前記第2予測値算出部は、前記水文モデルの流出量を算出する、
請求項10に記載の情報処理装置。
【請求項16】
前記目的変数は、気象データであり、
前記モデル選択部は、WRF(Weather Research and Forecasting)モデル及びCFD(Computational Fluid Dynamics)モデルを前記第1モデルとして選択し、
前記第2予測値算出部は、前記WRFモデルの気象データと、前記CFDモデルの気象データとを算出する、
請求項10に記載の情報処理装置。
【請求項17】
学習用データを前記第1学習用データと前記第2学習用データとに分割する第1データ分割部と、
前記第1データ分割部により分割された前記第1学習用データを記憶する第1学習用データ記憶部と、
前記第1データ分割部により分割された前記第2学習用データを記憶する第2学習用データ記憶部と、を備え、
前記第1予測値算出部は、前記第1学習用データ記憶部に記憶された前記第1学習用データに基づいて前記目的変数の予測値を算出し、
前記第1予測残差量算出部は、前記第2学習用データ記憶部に記憶された前記第2学習用データを用いて前記第1予測残差量を算出し、
前記モデル構築部は、前記第2学習用データ記憶部に記憶された前記第2学習用データと前記第1予測残差量に基づいて機械学習により前記第2モデルを構築する、
請求項1に記載の情報処理装置。
【請求項18】
コンピュータに、
時系列データを含む第1学習用データを第1モデルに入力して、予測対象である目的変数の予測値を算出するステップと、
第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出するステップと、
前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するステップと、を実行させる、
情報処理方法。
【請求項19】
コンピュータに、
時系列データを含む第1学習用データを第1モデルに入力して、予測対象である目的変数の予測値を算出するステップと、
第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出するステップと、
前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するステップと、を実行させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
機械学習を行うモデル(以下、機械学習モデル)が様々な分野で活用されている。機械学習モデルには、時系列データだけでなく、制御データも入力できるため、制御データを扱えない物理モデルよりも予測精度が高くなる。
【0003】
しかしながら、機械学習モデルは、説明変数同士に相関がある場合、又は説明変数がノイズを含んでいる場合に予測性能が低下する。また、予測期間が長くなると、予測誤差が大きくなる。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2020-30686号公報
【特許文献2】特開2020-166622号公報
【特許文献3】特開2022-76416号公報
【非特許文献】
【0005】
【非特許文献1】Isihara, Y. and S. Kobatake (1979); Runoff Model for Flood Forecasting, Bull. D. P.R.I., Kyoto Univ., 29, 27-43
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明の一実施形態では、目的変数を高精度に予測できる情報処理装置、情報処理方法、及びプログラムを提供するものである。
【課題を解決するための手段】
【0007】
上記の課題を解決するために、本発明の一実施形態によれば、時系列データを含む第1学習用データを第1モデルに入力して、予測対象である目的変数の予測値を算出する第1予測値算出部と、
第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出する第1予測残差量算出部と、
前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するモデル構築部と、を備える、情報処理装置が提供される。
【図面の簡単な説明】
【0008】
図1】一実施形態に係る情報処理装置の概略構成を示すブロック図。
図2】ダム流入量を予測するための学習用データのデータ分割例を示す図。
図3】風力発電量を予測するための学習用データのデータ分割例を示す図。
図4】目的変数の時系列データの形状の特徴によりクラスリングを行い、クラスタリングに基づいて特徴的区間に分割する例を示す図。
図5】相関係数に基づいた特徴的区間ごとに物理モデルの寄与度を算出する例を示す図。
図6】予測モデルの学習処理の処理手順を示すフローチャート。
図7】着目するシステム、装置、又は機器の将来の状態値又は出力値を予測する予測部3の処理動作を示すフローチャート。
図8】第1具体例に係るダム流入量予測のための予測モデルの構築を説明する図。
図9】第2具体例に係る風力発電量予測のための予測モデルの構築を説明する図。
図10】第3具体例に係る河川流量又は河川水位を予測するための予測モデルの構築を説明する図。
図11】流量と水位との関係を示すH-Q曲線の一例を示す図。
図12】第4具体例に係る河川流量又は河川水位を予測するための予測モデルの構築を説明する図。
図13】第5具体例に係る気象予測のための予測モデルの構築を説明する図。
【発明を実施するための形態】
【0009】
以下、図面を参照して、情報処理装置、情報処理方法及びプログラムの実施形態について説明する。以下では、情報処理装置の主要な構成部分を中心に説明するが、情報処理装置には、図示又は説明されていない構成部分や機能が存在しうる。以下の説明は、図示又は説明されていない構成部分や機能を除外するものではない。
【0010】
物理モデルは、信頼性の高い予測値を算出できるものの、そのためには、正確なシステムキャリブレーションを行うとともに、物理モデルに正確なパラメータを入力する必要がある。システムキャリブレーション又はパラメータが不正確な場合、あるいは物理モデルの予測値が経時的に変化する場合には、予測誤差が大きくなる。
【0011】
また、物理モデルでは、外部の制御情報(例えば、上流ダムの放流量又は発電所の使用水量)を考慮できないため、制御動作を反映させた予測を行うことができない。
【0012】
一方、機械学習モデルでは、外部の制御情報を考慮に入れて予測値を算出できるとともに、過去のデータとシステム又は機器の現状の特徴を用いて、正確な予測値を算出できる。しかしながら、機械学習モデルでは、入力変数間に相関がある場合、又は入力変数にノイズが含まれる場合には、予測性能が落ちてしまう。
【0013】
そこで、一実施形態に係る情報処理装置は、物理モデルと機械学習モデルを融合させた予測モデルを構築して、予測モデルを用いて予測期間までの予測値を算出することを特徴とする。
【0014】
図1は一実施形態に係る情報処理装置1の概略構成を示すブロック図である。図1の情報処理装置1は、物理モデルと機械学習モデルを融合させた予測モデルを用いて、様々な予測対象を予測できるようにしたことを特徴とする。図1に示すように、一実施形態に係る情報処理装置1は、予測モデル学習部2と予測部3を備える。
【0015】
予測モデル学習部2は、物理モデルと機械学習モデルを融合させた予測モデルを構築する。本明細書では、物理モデルを第1モデル、予測モデルを第2モデルと呼ぶことがある。また、本明細書では、物理モデル(第1モデル)に入力される物理モデル用データを第1学習用データ、予測モデル(第2モデル)に入力される機械学習用データを第2学習用データと呼ぶことがある。
【0016】
予測モデル学習部2は、学習用データDB(データベース)4と、第1データ分割部5と、物理モデル用データDB6と、機械学習用データDB7と、物理モデル記憶部8と、第1予測値算出部9と、第1予測残差量算出部10と、予測モデル構築部11と、予測モデル記憶部12と、物理モデル選択部13とを有する。
【0017】
学習用データDB4は、学習用データを格納する。学習用データは、着目するシステム、装置、又は機器の状態又は出力の時系列データ、あるいは、システム、装置、又は機器に影響する外部要因の時系列データを含む。時系列データは、例えば、過去の計測値(実績値)、シミュレーションで得られた値、将来の予測値、又はシミュレーションで用いられるデータである。学習用データの中の全ての時系列データは、過去の計測値(実績値)でもよいし、将来の予測値でもよいし、シミュレーションで用いられる値でもよいし、又はこれらの値を任意に組み合わせた値でもよい。また、過去の計測値はセンサデータでもよい。
【0018】
学習用データDB4は、予測対象である目的変数の時系列データと説明変数の時系列データを保持する。時系列データのうち、システム、装置、又は機器の状態又は出力の着目する項目に該当する時系列データは、目的変数の時系列データとして扱われる。即ち、目的変数の時系列データは、着目するシステム、装置、又は機器の状態値又は出力値である。説明変数の時系列データは、着目するシステム、装置、又は機器の状態値又は出力値に影響する内部或いは外部の要因の時系列データである。説明変数の値は、目的変数の値に直接的或いは間接的に影響する。
【0019】
第1データ分割部5は、学習用データDB4の時系列データを物理モデル用データと機械学習用データに分割し、物理モデル用データDB6又は機械学習用データDB7に分けて格納する。第1データ分割部5は、例えば、物理モデルに必要な時系列データを物理モデル用データとし、残りのデータを機械学習用データとする。物理モデル用データと機械学習用データは相互排他的でも良いし、少なくとも一部のデータが重複してもよい。
【0020】
また、第1データ分割部5は、学習用データから目的変数の時系列データと説明変数の時系列データとの相関係数を用いて機械学習用データを選択してもよいし、特徴選択手法を用いて機械学習用データを選択してもよいし、情報量方法(例えば、赤池情報量基準、ベイズ情報量規準など)を用いて機械学習用データを選択してもよいし、予測手法を用いて機械学習用データを選択してもよい。予測手法を用いて機械学習用データを選択する場合、各説明変数と目的変数の時系列データを教師データと検証データに分けて教師データを用いて一時的予測モデルを構築し、構築したその一時的予測モデルを用いて検証データの予測誤差を算出し、予測誤差の昇順に基づいて、予測誤差がより小さい上位の幾つかの説明変数の時系列データを選択してもよい。図1の情報処理装置1は、選択された物理モデル用データと機械学習用データを用いて予測モデルを構築する。
【0021】
説明変数は、組み合わせ最適化を用いても選択できる。例えば、目的変数が{X1,X2,X3}の場合、{X1}、{X2}、{X3}、{X1,X2}、{X2,X3}、{X1,X3}、{X1,X2,X3}の組み合わせがあり、それぞれを組み合わせた説明変数のデータを用いて一時的予測モデルを構築して、予測誤差の最低の組み合わせの説明変数の時系列データを機械学習用データとしてもよい。物理モデル用データDB6は、目的変数の物理モデルで用いる説明変数又は目的変数の時系列データを保持する。
【0022】
機械学習用データDB7は、機械学習で用いる目的変数及び説明変数の時系列データを格納する。機械学習用データには、物理モデル用データが含まれていてもよい。
【0023】
物理モデル選択部13は、複数の物理モデルが存在する場合に、評価尺度によって最良の物理モデルを選択する。各物理モデルに物理モデル用データを入力して目的変数の予測値を算出する。目的変数の予測値と実績値を用いて予測誤差を算出し、その予測誤差を評価尺度として使うことができる。評価尺度として二乗平均平方根誤差(Root Mean Square Error, RMSE)、決定係数(R2)、平均絶対誤差(Mean Absolute Error、MAE)、平均絶対誤差率(Mean Absolute Percentage Error, MAPE)などを用いることができる。
【0024】
上述した学習用データDB4と、第1データ分割部5と、物理モデル用データDB6と、機械学習用データDB7は、情報処理装置1にとって必ずしも必須の構成部分ではなく、例えば、情報処理装置1の外部から物理モデル用データと機械学習用データを入力してもよい。
【0025】
第1予測値算出部9は、物理モデル用データDB6から取得された物理モデル用データを物理モデルに入力することにより、物理モデルにて目的変数の予測値を算出する。目的変数は、例えばダム流入量、風力発電量、又は河川流量などである。第1予測値算出部9が算出する予測値は、目的変数を直接的に予測する予測値であってもよいし、目的変数を間接的に予測する予測値であってもよい。
【0026】
一実施形態に係る情報処理装置1の用途によって利用する物理モデルは異なり、場合によっては複数の物理モデルを用いて目的変数の予測値を算出する場合がある。物理モデルは目的変数の予測値を算出する計算式であってもよいし、複雑なシミュレータで構成されてもよい。例えば、ダム流入量又は河川流量を予測する場合にはタンクモデルと融雪モデルが物理モデルとして用いられる。また、風力発電量を予測する場合には風車の発電モデルが物理モデルとして用いられる。
【0027】
利用する物理モデルによって、物理モデルに入力される物理モデル用データが異なる。例えば、ダム流入量予測ではタンクモデルを用いる場合、流出孔の高さ(L1, L2, L3)、流出係数(α1, α2, α3, α4)、浸透係数(β1, β2, β3)が物理モデル用データとして用いられる。融雪モデルを用いる場合、数値標高モデルデータ、気温逓減率、及び気温融雪率が物理モデル用データとして用いられる。風力発電量予測では、発電カーブ、風車パラメータ、及び地形情報が物理モデル用データとして用いられる。
【0028】
第1予測残差量算出部10は、物理モデルの予測残差量(以下、第1予測残差量と呼ぶ)を算出する。第1予測残差量算出部10は、目的変数から第1予測値算出部9で算出された目的変数の予測値を減じることにより、物理モデルの第1予測残差量を算出する。より詳細には、第1予測残差量算出部10は、機械学習用データの中から目的変数の時系列データを抽出し、抽出された目的変数の時系列データと、第1予測値算出部9で算出された目的変数の予測値と、後述する特徴的区間ごとの物理モデルの寄与度を用いて、物理モデルの第1予測残差量を算出する。
【0029】
予測モデル構築部11は、機械学習用データと、第1予測残差量算出部10で算出された物理モデルの第1予測残差量とに基づいて、機械学習用データから機械学習により物理モデルの第1予測残差量を予測するための予測モデルを構築する。
【0030】
予測モデル構築部11は、機械学習用データを用いて、第1予測残差量算出部で算出された物理モデルの第1予測残差量を予測するための予測モデルを機械学習により構築する。
【0031】
予測モデルは、例えば、回帰モデル、深層学習に基づいたモデル、又はグラフ深層学習に基づいたモデルなどを適用できる。回帰モデルは、例えば、線形回帰、リッジ回帰、LASSO,回帰木、サポートベクター回帰、勾配ブースティング回帰、又はランダムフォレスト回帰などを適用できる。深層学習に基づいたモデルは、例えば、長・短期記憶(Long Short Term Memory: LSTM)、再帰型ニューラルネットワーク(Recurrent Neural Network: RNN)、ゲート付き回帰型ユニット(Gated Recurrent Unit: GRU)、又は畳み込みニューラルネットワーク (Convolutional Neural Network: CNN)などを適用できる。グラフ深層学習に基づいたモデルは、例えば、グラフ深層学習アルゴリズムであるグラフニューラルネットワーク(Graph Neural Network: GNN)などを適用できる。予測モデルが分類課題の場合、機械学習としてロジスティック回帰、サポートベクターマシン(SVM)、決定木、CNN、オートエンコーダ(自己符号化器)、ニューラルネットワークなどを適用することができる。
【0032】
予測モデル記憶部12は、予測モデル構築部11が構築した予測モデルを記憶する。
【0033】
この他、予測モデル学習部2は、物理モデル寄与度算出部14を有してもよい。物理モデル寄与度算出部14は、特徴的区間分割部15と寄与度算出部16を有する。
【0034】
特徴的区間分割部15は、目的変数の時系列データのパターンを用いて予測期間を複数の特徴的区間に分割する。寄与度算出部16は、特徴的区間ごとに物理モデルの寄与度を算出する。すなわち、寄与度算出部16は、物理モデル選択部13が2以上の物理モデルを選択する場合に、特徴的区間ごとに、各物理モデルの寄与度を算出する。寄与度算出部16は、専門家の知識によって特徴的区間ごとに各物理モデルの寄与度を与えてもよいし、各物理モデルにより算出された予測値と目的変数の時系列データとの相関係数を設定してもよいし、ユーザが寄与度を予め設定してもよい。また、各物理モデルにより算出された予測値と目的変数の時系列データとの誤差に基づいて各物理モデルの寄与度を設定してもよい。例えば、正規化した絶対誤差の逆値を物理モデルの寄与度として使用してもよい。
【0035】
ダム流入量予測の場合、ダムに流れ込む流入量は、雪解けと雨量から発生する流出量に依存し、時期によって、ダム流入量予測の物理モデルであるタンクモデルと、雪解けの融雪モデルが出力する流出量が変わるので、積雪時期、融雪時期、雨量時期におけるそれぞれの寄与度は(0.5, 0.1)、(0.2, 0.9)、(0.9, 0.0)を設定することができる。
【0036】
あるいは、ダム流入量予測の物理モデルであるタンクモデルと融雪モデルの寄与度を自動的に算出する手法を採用してもよい。まずは、学習用データから、積雪時期、融雪時期、雨量時期毎に実績雨量データ、積雪量、気温、及びダム流入量を抽出し、タンクモデルに実績雨量データ、融雪モデルに積雪量と気温を入力してそれぞれの流出量を算出し、算出した流出量とその区間のダム流入量の相関係数をタンクモデルと融雪モデルの寄与度とする。
【0037】
風力発電量予測では、風速によって発生電力量が変わるので、専門家の意識によって5m/s以下、5-10m/s、10-15m/s、15-25m/s、25m/s以上の区間で風車の発電モデル(物理モデル)の寄与度は、例えば以下のように設定することができる。
【0038】
風車の発電モデル(物理モデル)の寄与度の例としては{5m/s以下は0.7、5-10m/sは0.8、10-15m/sは0.9、15-25m/sは0.8、25m/s以上は0.1}を設定することができる。
【0039】
あるいは、風車の発電モデルの寄与度を自動的に算出する手法を採用してもよい。まずは、学習用データからある区間の観測風速とそれに対応する観測発電量を抽出し、風車の発電モデルにその観測風速を入力して発電量を算出する。算出された発電量と観測発電量との相関係数を算出し、その相関係数をその区間の風車の発電モデル(物理モデル)の寄与度とする。寄与度として相関係数をそのまま使ってもよいし、他のスケールに変換して使ってもよい。
【0040】
第1予測残差量算出部10は、機械学習用データの中から目的変数の時系列データを抽出し、物理モデルにより第1予測値算出部9で算出された予測値と、物理モデル寄与度算出部14が算出する特徴的区間ごとに物理モデルの寄与度を用いて物理モデルの第1予測残差量を算出する。物理モデルの第1予測残差量は機械学習を用いてモデル化される。物理モデルの第1予測残差量は、目的変数の時系列データ、物理モデルにより算出された予測値、及び特徴的区間ごとに物理モデルの寄与度の関数で表される。
【0041】
物理モデルの予測残差量=f(目的変数の時系列データ、物理モデルにより算出された予測値、特徴的区間ごとに物理モデルの寄与度)
【0042】
この関数の入力パラメータに説明変数の時系列データを加えてもよい。ダム流入量予測の例では、第1予測残差量は式(1)で表される。
物理モデルの第1予測残差量=ダム流入量-ct×流出量t-cs×流出量s …(1)
【0043】
ここでは、ctと流出量tはタンクモデルの寄与度と流出量であり、csと流出量sは融雪モデルの寄与度と流出量である。
【0044】
風力発電量予測の例では、
物理モデルの第1予測残差量=風車発電量-cp×風車発電量p …(2)
【0045】
ここで、cpと風車発電量pは風車の発電モデルの寄与度と風車発電量である。
【0046】
このように、第1予測残差量は、目的変数と、各物理モデルの第1予測値に対応する寄与度を乗じた値とに基づいて算出される。より具体的な一例では、第1予測残差量は、目的変数から、各物理モデルの第1予測値に対応する寄与度を乗じた値を減じることにより算出される。
【0047】
図1に示すように、予測部3は、予測用データDB21、第2データ分割部22、物理モデル用データDB23、機械学習用データDB24、物理モデル寄与度抽出部25、第2予測値算出部26、第2予測残差量算出部27、第3予測値算出部28、及び予測値記憶部29を有する。物理モデル寄与度抽出部25は、特徴的区間同定部30と寄与度抽出部31を有する。
【0048】
予測部3は、予測モデル学習部2が構築した予測モデルを用いて、予測期間までの目的変数の予測値を算出する。
【0049】
予測用データDB21は、予測用データを格納する。予測用データは、時系列データを含む物理モデル用データと、機械学習用データとを有する。機械学習用データは、時系列データの他に制御データを含んでいてもよい。
【0050】
第2データ分割部22は、予測用データを物理モデル用データと機械学習用データに分割する。本明細書では、第2データ分割部22が分割する物理モデル用データを第1予測用データと呼び、第2データ分割部22が分割する機械学習用データを第2予測用データと呼ぶことがある。物理モデル用データ(第1予測用データ)は、物理モデル用データDB23に格納され、機械学習用データ(第2予測用データ)は、機械学習用データDB24に格納される。
【0051】
予測部3における予測用データDB21、第2データ分割部22、物理モデル用データDB6、及び機械学習用データDB7は、予測部3の必須の構成部分ではなく、必要に応じて省略可能である。
【0052】
第2予測値算出部26は、物理モデル用データ(第1予測用データ)を物理モデルに入力して、物理モデルにて目的変数の予測値を算出する。物理モデルは、予測モデル学習部2で用いられる物理モデルと同じである。第2予測値算出部26は、物理モデル選択部13で選択された2以上の物理モデルを用いて予測値を算出する場合もありうる。
【0053】
第2予測残差量算出部27は、機械学習用データ(第2予測用データ)を予測モデルに入力して、予測モデルにより、第2予測値算出部26が算出した予測値のずれである第2予測残差量を算出する。より具体的には、第2予測残差量算出部27は、機械学習用データ(第2予測用データ)に含まれる目的変数と、前記第2予測値算出部26で算出された予測値とのずれである第2予測残差量を算出する。
【0054】
第3予測値算出部28は、第2予測値算出部26で算出された予測値と第2予測残差量算出部27で算出された第2予測残差量とに基づいて、目的変数の予測値を算出する。算出された予測値は、予測値記憶部29に格納される。
【0055】
特徴的区間同定部30は、物理モデル用データ(第1予測用データ)を複数の特徴的区間に同定する。複数の特徴的区間に同定する基準は、予測モデル学習部2における特徴的区間分割部15が複数の特徴的区間に分割する基準と同じである。
【0056】
寄与度抽出部31は、複数の特徴的区間のそれぞれごとに物理モデルの寄与度を抽出する。第3予測値算出部28は、2以上の物理モデルのそれぞれについて、特徴的区間ごとの第1モデルの寄与度に基づいて、目的変数を予測する。
【0057】
図2は、ダム流入量を予測するための学習用データのデータ分割例を示す図である。ダム流入量を予測するための学習用データは、過去の計測値(実績値)であるダム流入量、上流ダム放流量、河川流量、積雪量、気温、及び実績雨量データと、将来の予測値である予測雨量データを含む。ここで、ダム流入量は目的変数であり、上流ダム放流量、河川流量、積雪量、気温、及び実績雨量データと、予測雨量データは説明変数である。また、ダム流入量、上流ダム放流量、河川流量、積雪量、及び気温はセンサによって計測された値である。実績雨量データは、観測地点に設置された雨量計データ或いはレーダ解析雨量データである。
【0058】
図2において、積雪量、気温、実績雨量データ、及び予測雨量データはダム流入量予測のための物理モデル用データである。
【0059】
図2では、{ダム流入量、上流ダム放流量、河川流量}あるいはこれに{積雪量、気温、実績雨量データ、予測雨量データ}を加えてダム流入量予測のための機械学習用データとして使ってよい。
【0060】
図3は、風力発電量を予測するための学習用データのデータ分割例を示す図である。風力発電量を予測するための学習用データは、過去の計測値(実績値)である観測気温、観測風速、観測風向、観測発電量、及び観測電力供給と、将来の予測値である予測風速、予測風向、及び予測気温を含む。ここで、発電量は目的変数であり、センサによって計測された値は観測発電量であり、予測する値は予測発電量である。観測気温、観測風速、観測風向、観測電力供給、予測風速、予測風向、及び予測気温が説明変数である。観測気温、観測風速、観測風向、観測発電量、及び観測電力供給は、センサによって計測された値である。
【0061】
図3において、予測風速、予測風向、及び予測気温は、風力発電量予測のための物理モデル用データである。図3では、{観測気温、観測風速、観測風向、観測発電量、観測電力供給}或いはこれに{予測風速、予測風向、予測気温}を加えて風力発電量予測のための機械学習用データとして使ってよい。
【0062】
図4は、目的変数の時系列データの形状の特徴によりクラスリングを行い、クラスタリングに基づいて特徴的区間に分割する例を示す図である。本例では、目的変数の時系列データを時間方向にA、B、C、D、E、F、Gの区間に分けてクラスタリングを行い、三つの特徴的区間1,2,3に分割する例を示す。
【0063】
目的変数の時系列データをスライディングウィンドウで区切って時系列データの複数のサンプルを生成し、各サンプルに基づいてクラスタリングを行う。時系列データのクラスタリング手法としてk平均法、DBAなどを用いることができる。他方では、目的変数の時系列データをスライディングウィンドウで区切って、各ウィンドウの統計値を算出し、その統計値のクラスタリングに基づいていくつかの特徴的区間に分けることもできる。
【0064】
図5は、相関係数に基づいた特徴的区間ごとに物理モデルの寄与度を算出する例を示す図である。ここで、まず、学習用データから、ある特徴的区間の学習用データを抽出し、抽出した学習用データの物理モデル用データを物理モデルにより第1予測値算出部9へ入力して目的変数の値(Y’(t))を予測する。その後、目的変数の値Y(t)と物理モデルにより算出した予測値Y’(t)との相関係数を算出し、その相関係数を物理モデルの寄与度へ変換する。変換手法として、相関係数の正規化を用いることができる。また、相関係数の代わりに目的変数の値Y(t)と物理モデルにより算出した予測値Y’(t)との誤差を算出してその誤差の絶対値の逆値を特徴的区間ごとに物理モデルの寄与度として使うことができる。
【0065】
図6は予測モデルの学習処理の処理手順を示すフローチャートである。まず、第1データ分割部5は学習用データDB4から学習用データを取得し(ステップS11)、学習用データを物理モデル用データと機械学習用データに分割し、分割したデータを物理モデル用データDB6と機械学習用データDB7に格納する(ステップS12)。
【0066】
次に、第1予測値算出部9は、物理モデル用データDB17から物理モデル用データを取得する(ステップS13)。特徴的区間分割部15は、学習用データDB4から学習用データを取得し、学習用データを用いて着目する時系列データを特徴的区間に分割する(ステップS14)。
【0067】
寄与度算出部16は、特徴的区間分割部15が分割した特徴的区間ごとに物理モデルの寄与度を算出する(ステップS15)。第1予測値算出部9は、物理モデル用データを物理モデルに入力し、物理モデルにより予測値を算出する(ステップS16)。
【0068】
第1予測残差量算出部10は、機械学習用データDB7の中から目的変数の時系列データを抽出し、物理モデルに基づいて第1予測値算出部9が算出した予測値と、寄与度算出部16が算出した特徴的区間ごとの物理モデルの寄与度とに基づいて、物理モデルの第1予測残差量を算出する(ステップS17)。
【0069】
予測モデル構築部11は、機械学習により物理モデルの第1予測残差量の予測モデルを構築する(ステップS18)。予測モデル構築部11が構築した予測モデルは、予測モデル記憶部12に記憶される。予測モデル学習部2は、構築された予測モデル、物理モデル、特徴的区間、特徴的区間ごとの物理モデルの寄与度を出力する(ステップS19)。以上により、予測モデル学習部2の処理が終了する。
【0070】
図7は、着目するシステム、装置、又は機器の将来の状態値又は出力値を予測する予測部3の処理動作を示すフローチャートである。まず、第2データ分割部22は予測用データDB21から予測用データを取得し(ステップS21)、予測用データを物理モデル用データと機械学習用データに分割し、物理モデル用データDB23と機械学習用データDB24に格納する(ステップS22)。
【0071】
次に、第2予測値算出部26は、物理モデル用データDB17から物理モデル用データを取得する(ステップS23)。次に、特徴的区間同定部30は、予測用データDB21から予測用データを取得し、予測用データを用いて特徴的区間を同定する(ステップS24)。
【0072】
次に、寄与度抽出部31は、特徴的な区間同定部が同定した特徴的区間での物理モデルの寄与度を抽出する(ステップS25)。第2予測値算出部26は、物理モデル用データ(第1予測用データ)を物理モデルに入力して、物理モデルにより予測値を算出する(ステップS26)。
【0073】
第2予測残差量予測部27は、機械学習用データ(第2予測用データ)を用いて予測モデルによる物理モデルの第2予測残差量を算出する(ステップS27)。第3予測値算出部28は、物理モデルにより第2予測値算出部26が算出した予測値、予測モデルによる物理モデルの第2予測残差量予測部27が算出した物理モデルの第2予測残差量、物理モデルの寄与度抽出部31が抽出した寄与度を用いて、目的変数の最終的な予測値を算出する(ステップS28)。算出された予測値は、予測値記憶部29に格納される(ステップS29)。
【0074】
ステップS28において、第3予測値算出部28は、物理モデルにより第2予測値算出部26が算出した予測値と、第2予測残差量予測部27が算出した物理モデルの予測残差量と、寄与度抽出部31が抽出した寄与度とを用いて、式(3)に基づいて最終的な予測値を算出し、予測値記憶部29へ出力する。
最終的な予測値=f(物理モデルにより算出した予測値、予測モデルによる算出した物理モデルの予測残差量、寄与度) …(3)
【0075】
第2予測残差量算出部27は、物理モデルの予測残差量を算出する際に説明変数の時系列データを使う場合、その説明変数は式(3)の関数fの引数となる。
【0076】
第3予測値算出部28は、例えばダム流入量を予測する場合、式(4)に基づいて最終的な予測値を算出する。
ダム流入量予測値=物理モデルの予測残差量+ct×流出量+cs×流出量s …(4)
【0077】
ここで、ctと流出量tはタンクモデルの寄与度と流出量であり、csと流出量sは融雪モデルの寄与度と流出量である。
【0078】
第3予測値算出部28は、例えば風力発電量を予測する場合、風力発電量を予測する場合、式(5)に基づいて最終的な風力発電量を予測する。
風力発電量予測値=物理モデルの予測残差量+cp×風車発電量p …(5)
【0079】
ここで、cpと風車発電量pは風車の発電モデルの寄与度と風車発電量である。
【0080】
(第1具体例)
図8は、第1具体例に係るダム流入量予測のための予測モデルの構築を説明する図である。第1具体例では、学習用データはダム流入量、上流ダム放流量、河川流量、積雪量、気温、実績雨量データ、及び予測雨量データを含む。
【0081】
第1データ分割部5は、学習用データの積雪量、気温、実績雨量データ、及び予測雨量データを物理モデル用データに、ダム流入量、上流ダム放流量、及び河川流量を機械学習用データに分ける。また、物理モデルとしてタンクモデルと融雪モデルが用いられる。物理モデル用データの中から実績雨量データと予測雨量データはタンクモデルに入力され、積雪量と気温は融雪モデルに入力される。
【0082】
特徴的区間分割部15は、予測期間を積雪時期、融雪時期、及び雨量時期に分割し、特徴的区間のマッピング表{12月1日~3月15日:積雪時、3月16日~5月31日:融雪時期、6月1日~11月30:雨量時期}を出力する。
【0083】
寄与度算出部16は、時期毎の寄与度の特徴的区間のマッピング表{積雪時期: [0.5, 0.1]; 融雪時期:[0.2, 0.9]、雨量時期: [0.9, 0.0]}を出力する。ここで、寄与度[a, b]はタンクモデルの寄与度aで、融雪モデルの寄与度bである。タンクモデルの物理モデル用データは、流出孔の高さ(L1, L2, L3)、流出係数(α1, α2, α3, α4)、浸透係数(β1, β2, β3)である。融雪モデルの物理モデル用データは、数値標高モデルデータ、気温逓減率、及び気温融雪率である。
【0084】
タンクモデルと融雪モデルはそれぞれの流出量を算出する。第1予測残差量算出部10では、式(6)に示すように物理モデルの予測残差量を算出する。
物理モデルの予測残差量=ダム流入量-ct×流出量t-cs×流出量s …(6)
【0085】
ここで、ctと流出量tはタンクモデルの寄与度と流出量であり、csと流出量sは融雪モデルの寄与度と流出量である。
【0086】
その後、予測モデル構築部11は、機械学習により物理モデルの予測残差量の予測モデルを構築し、その予測モデルを予測モデル記憶部12に格納し、処理を終了する。
【0087】
(第2具体例)
図9は、第2具体例に係る風力発電量予測のための予測モデルの構築を説明する図である。第2具体例では、学習用データは観測気温、観測風速、観測風向、観測発電量、観測電力供給、予測風速、予測風向、予測気温を含む。第1データ分割部5は本学習用データの予測風速、予測風向、予測気温を物理モデル用データに、観測気温、観測風速、観測風向、観測発電量、観測電力供給を機械学習用データに分ける。物理モデルとして発電カーブを用いる。特徴的区間分割部15は予測期間を{5m/s以下、5-10m/s、10-15m/s、15-25m/s、25m/s以上}の特徴的区間に分割する。また、特徴的区間ごとに物理モデルの寄与度算出部16は、風速毎の寄与度の特徴的区間のマッピング表: {5m/s以下:0.7、5-10m/s:0.8、10-15m/s:0.9、15-25m/s:0.8、25m/s以上:0.1 }を出力する。物理モデル用データとして発電カーブ、風車パラメータ、地形情報が用いられる。風車の発電モデルは、発電カーブ、風車パラメータ、地形情報に基づいて予測風速、予測風向、予測気温に対して風車の発電量を算出する。第1予測残差量算出部10では、下記のように物理モデルの予測残差量を算出する。
物理モデルの予測残差量=風車発電量-cp×風車発電量p …(7)
【0088】
ここで、cpと風車発電量pは風車の発電モデルの寄与度と風車発電量である。
【0089】
その後、機械学習により予測モデル構築部11は、機械学習により物理モデルの予測残差量の予測モデルを構築し、その予測モデルを予測モデル記憶部12に格納し、処理を終了する。
【0090】
(第3具体例)
図10は、第3具体例に係る河川流量又は河川水位を予測するための予測モデルの構築を説明する図、図11は流量Qと水位Hとの関係を示すH-Q曲線の一例を示す図である。
【0091】
河川水位を予測する場合、河川流量を予測してその河川流量を後処理で河川水位に変換する。そのために、対象河川区間で図11のような水位と流量関係のH-Q曲線を用いて河川流量を河川水位へ変換する。ダム水位予測の場合も本水位と流量関係のH-Q曲線を用いることができる。
【0092】
河川流量予測の例では、学習用データは河川水位、上流河川流量、河川流量、積雪量、気温、実績雨量データ、予測雨量データを含む。第1データ分割部5は本学習用データの積雪量、気温、実績雨量データ、予測雨量データを物理モデル用データに、河川水位、上流河川流量、河川流量を機械学習用データに分ける。物理モデルとしてタンクモデルと融雪モデルを用いる。物理モデル用データの中から実績雨量データ、予測雨量データはタンクモデルへ、積雪量、気温は融雪モデルへ入力となる。特徴的区間分割部15は予測期間を積雪時期、融雪時期、雨量時期へ分割し、特徴的区間のマッピング表{12月1日~3月15日:積雪時、3月16日~5月31日:融雪時期、6月1日~11月30:雨量時期}を出力する。また、特徴的区間ごとに物理モデルの寄与度算出部16は、時期毎の寄与度の特徴的区間のマッピング表{積雪時期:[0.5, 0.1]; 融雪時期:[0.2, 0.9]、雨量時期: [0.9, 0.0]}を出力する。ここで、寄与度[a, b]はタンクモデルの寄与度aで、融雪モデルの寄与度bである。タンクモデルの物理モデル用データは、流出孔の高さ(L1, L2, L3)、流出係数(α1, α2, α3, α4)、浸透係数(β1, β2, β3)である。融雪モデルの物理モデル用データは、数値標高モデルデータ、気温逓減率、気温融雪率である。
【0093】
タンクモデルと融雪モデルはそれぞれの流出量を算出する。第1予測残差量算出部10では、下記のように物理モデルの予測残差量を算出する。
物理モデルの予測残差量=河川流量-ct×流出量t-cs×流出量s …(8)
【0094】
ここで、ctと流出量tはタンクモデルの寄与度と流出量であり、csと流出量sは融雪モデルの寄与度と流出量である。その後、機械学習により予測モデル構築部11は、機械学習により物理モデルの予測残差量の予測モデルを構築し、その予測モデルを予測モデル記憶部12に格納し、処理を終了する。
【0095】
(第4具体例)
図12は、第4具体例に係る河川流量又は河川水位を予測するための予測モデルの構築を説明する図である。図12図11の一変形例である。第4具体例では、物理モデルとしてタンクモデルと融雪モデルの代わりに水文モデルツール(Hydrological model tool)、例えば、WRF-Hydro(R) Modeling System、Soil & Water Assessment Tool (SWAT)、Hydrological Simulation Program-Fortran (HSPF)などを用いることができる。
【0096】
河川流量予測の例では、学習用データは河川水位、上流河川流量、河川流量、積雪量、気温、雨量、気圧、風速・風向き、比湿、放射照度を含む。第1データ分割部5は本学習用データの積雪量、気温、雨量、気圧、風速・風向き、比湿、放射照度を物理モデル用データに、河川水位、上流河川流量、河川流量を機械学習用データに分ける。物理モデル用データとして格子点情報、数値標高モデルデータを用いる。特徴的区間分割部15は予測期間を積雪時期、融雪時期、雨量時期へ分割し、特徴的区間のマッピング表{12月1日~3月15日:積雪時、3月16日~5月31日:融雪時期、6月1日~11月30:雨量時期}を出力する。また、特徴的区間ごとに物理モデルの寄与度算出部16は、時期毎の寄与度の特徴的区間のマッピング表{積雪時期: 0.5; 融雪時期:0.2、雨量時期: 0.9}を出力する。水文モデルは流出量を算出する。第1予測残差量算出部10では、下記のように物理モデルの予測残差量を算出する。
物理モデルの予測残差量=河川流量-ch×流出量h …(9)
【0097】
ここで、chと流出量hは水文モデルの寄与度と流出量である。その後、機械学習により予測モデル構築部11は、機械学習により物理モデルの予測残差量の予測モデルを構築し、その予測モデルを予測モデル記憶部12に格納し、処理を終了する。
【0098】
(第5具体例)
図13は、第5具体例に係る気象予測のための予測モデルの構築を説明する図である。第5具体例では、物理モデルとして数値予報モデル、例えば、局地モデル(LFM)、メソモデル(MSM)、メソアンサンブルモデル(MEPS)、全球モデル(GSM)、全球アンサンブル予報モデル(GEPS)、グローバル予測システム(GFS)、又はWeather Research and Forecasting (WRF) Model、数値流体力学(Computational Fluid Dynamics: CFD)ツールを用いる。
【0099】
第5具体例では、学習用データは、観測気象データと予測気象データである気温、風速・風向、雨量、気圧、湿度などを含む。第5具体例では、気温が予測対象となり、気温、風速・風向、雨量、気圧、及び湿度を物理モデル用データに、気温、風速・風向、気圧、及び雨量を機械学習用データに分ける。物理モデル用データとして格子点情報、地形・土地利用データ、海面水温データ、及び数値標高モデルデータを用いる。物理モデルの予測残差量は下記の通り算出する。
物理モデルの予測残差量=気温ーcp×気温p …(10)
【0100】
cpと気温pは数値予報モデルの寄与度と数値予報モデルによる算出した気温である。その後、機械学習により予測モデル構築部11は、機械学習により物理モデルの予測残差量の予測モデルを構築し、その予測モデルを予測モデル記憶部12に格納し、処理を終了する。
【0101】
このように、本実施形態では、物理モデルと機械学習モデルを融合させた予測モデルを構築して目的変数を予測するため、説明変数に時系列データと制御データの両方が含まれていても、また、目的変数が経時的に大きく変動する場合であっても、目的変数を精度よく予測できる。
【0102】
[付記]
上述した実施形態で説明した情報処理装置1の少なくとも一部は、ハードウェアで構成してもよいし、ソフトウェアで構成してもよい。ソフトウェアで構成する場合には、情報処理装置1の少なくとも一部の機能を実現するプログラムをフレキシブルディスクやCD-ROM等の記録媒体に収納し、コンピュータに読み込ませて実行させてもよい。記録媒体は、磁気ディスクや光ディスク等の着脱可能なものに限定されず、ハードディスク装置やメモリなどの固定型の記録媒体でもよい。
また、情報処理装置1の少なくとも一部の機能を実現するプログラムを、インターネット等の通信回線(無線通信も含む)を介して頒布してもよい。さらに、同プログラムを暗号化したり、変調をかけたり、圧縮した状態で、インターネット等の有線回線や無線回線を介して、あるいは記録媒体に収納して頒布してもよい。
【0103】
[付記]
[項目1]
時系列データを含む第1学習用データを第1モデルに入力して、目的変数の予測値を算出する第1予測値算出部と、
制御データを含む第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出する第1予測残差量算出部と、
前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するモデル構築部と、を備える、
情報処理装置。
[項目2]
複数の前記第1モデルから1つ又は2以上の第1モデルを選択するモデル選択部を備え、
前記第1予測値算出部は、前記モデル選択部で選択された前記1つ又は2以上の第1モデルに前記第1学習用データを入力して、前記目的変数の予測値を算出する、
項目1に記載の情報処理装置。
[項目3]
前記第1予測値算出部は、前記モデル選択部が2以上の第1モデルを選択した場合、前記2以上の第1モデルのそれぞれに対応する前記第1学習用データに基づいて、前記目的変数の前記予測値を算出し、
前記第1予測残差量算出部は、前記2以上の第1モデルのそれぞれで算出された前記予測値に基づいて、前記第1予測残差量を算出する、
項目2に記載の情報処理装置。
[項目4]
前記2以上の第1モデルのそれぞれについて、前記予測値に対する寄与度を算出する寄与度算出部を備え、
前記第1予測残差量算出部は、前記第2学習用データに含まれる目的変数から、前記2以上の第1モデルのそれぞれについて算出された前記予測値に対応する前記寄与度を乗じた値をそれぞれ減じることにより、前記第1予測残差量を算出する、
項目3に記載の情報処理装置。
[項目5]
前記寄与度算出部は、前記2以上の第1モデルのそれぞれについて、前記時系列データを複数の特徴的区間に分割し、前記特徴的区間ごとに前記第1モデルの寄与度を算出し、
前記第1予測残差量算出部は、前記2以上の第1モデルのそれぞれについて、前記特徴的区間ごとの前記第1モデルの寄与度に基づいて前記第1予測残差量を算出する、
項目4に記載の情報処理装置。
[項目6]
前記寄与度算出部は、前記特徴的区間ごとに、前記第1モデルで算出された前記予測値と前記目的変数との相関係数を算出し、算出された前記相関係数に基づいて前記寄与度を算出する、
項目5に記載の情報処理装置。
[項目7]
前記寄与度算出部は、前記相関係数が大きいほど、前記寄与度をより大きくする、
項目6に記載の情報処理装置。
[項目8]
前記第1予測値算出部、前記第1予測残差量算出部、及び前記モデル構築部を有するモデル学習部と、
前記モデル学習部で学習された前記第2モデルに基づいて、前記目的変数を予測する予測部と、を備える、
項目3乃至7のいずれか一項に記載の情報処理装置。
[項目9]
前記予測部は、
前記第1学習用データに対応する第1予測用データを前記第1モデルに入力して、前記第1モデルにて前記目的変数の予測値を算出する第2予測値算出部と、
前記第2学習用データに対応する第2予測用データを前記第2モデルに入力して、前記第2モデルにより、前記目的変数と前記第2予測値算出部で算出された前記予測値とのずれである第2予測残差量を算出する第2予測残差量算出部と、
前記第2予測値算出部で算出された前記予測値と、前記第2予測残差量算出部で算出された前記第2予測残差量とに基づいて、前記目的変数を予測する第3予測値算出部と、を有する、
項目8に記載の情報処理装置。
[項目10]
前記第2予測値算出部は、前記モデル選択部が前記2以上の第1モデルを選択した場合、前記2以上の第1モデルのそれぞれに対応する前記第1予測用データに基づいて、前記目的変数の前記予測値を算出する、
項目9に記載の情報処理装置。
[項目11]
前記第1予測用データを複数の特徴的区間に同定する特徴的区間同定部と、
前記複数の特徴的区間のそれぞれごとに前記第1モデルの寄与度を抽出する寄与度抽出部と、を備え、
前記第3予測値算出部は、前記2以上の第1モデルのそれぞれについて、前記特徴的区間ごとの前記第1モデルの寄与度に基づいて、前記目的変数を予測する、
項目10に記載の情報処理装置。
[項目12]
前記目的変数は、ダム流入量であり、
前記モデル選択部は、タンクモデル及び融雪モデルを前記第1モデルとして選択し、
前記第2予測値算出部は、前記タンクモデルのダム流出量と、前記融雪モデルのダム流出量を算出する、
項目9乃至11のいずれか一項に記載の情報処理装置。
[項目13]
前記目的変数は、風力発電量であり、
前記第1モデルは、風車の発電モデルであり、
前記第2予測値算出部は、風速と発電カーブとに基づいて、前記風車の発電モデルの発電量を算出する、
項目9乃至11のいずれか一項に記載の情報処理装置。
[項目14]
前記目的変数は、河川流量であり、
前記第1モデルは、水文モデルであり、
前記第2予測値算出部は、前記水文モデルの流出量を算出する、
項目9乃至11のいずれか一項に記載の情報処理装置。
[項目15]
前記目的変数は、気象データであり、
前記モデル選択部は、WRF(Weather Research and Forecasting)モデル及びCFD(Computational Fluid Dynamics)モデルを前記第1モデルとして選択し、
前記第2予測値算出部は、前記WRFモデルの気象データと、前記CFDモデルの気象データとを算出する、
項目9乃至11のいずれか一項に記載の情報処理装置。
[項目16]
学習用データを前記第1学習用データと前記第2学習用データとに分割する第1データ分割部と、
前記第1データ分割部により分割された前記第1学習用データを記憶する第1学習用データ記憶部と、
前記第1データ分割部により分割された前記第2学習用データを記憶する第2学習用データ記憶部と、を備え、
前記第1予測値算出部は、前記第1学習用データ記憶部に記憶された前記第1学習用データに基づいて前記目的変数の予測値を算出し、
前記第1予測残差量算出部は、前記第2学習用データ記憶部に記憶された前記第2学習用データを用いて前記第1予測残差量を算出し、
前記モデル構築部は、前記第2学習用データ記憶部に記憶された前記第2学習用データと前記第1予測残差量に基づいて機械学習により前記第2モデルを構築する、
項目1乃至15のいずれか一項に記載の情報処理装置。
[項目17]
コンピュータに、
時系列データを含む第1学習用データを第1モデルに入力して、目的変数の予測値を算出するステップと、
制御データを含む第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出するステップと、
前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するステップと、を実行させる、
情報処理方法。
[項目18]
コンピュータに、
時系列データを含む第1学習用データを第1モデルに入力して、目的変数の予測値を算出するステップと、
制御データを含む第2学習用データを用いて、前記予測値のずれである第1予測残差量を算出するステップと、
前記第2学習用データ及び前記第1予測残差量に基づいて機械学習により前記第1予測残差量を予測する第2モデルを構築するステップと、を実行させる、
プログラム。
【0104】
本発明のいくつかの実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これら新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。これら実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0105】
1 情報処理装置、2 予測モデル学習部、3 予測部、5 第1データ分割部、8 物理モデル記憶部、9 第1予測値算出部、10 第1予測残差量算出部、11 予測モデル構築部、12 予測モデル記憶部、13 物理モデル選択部、14 物理モデル寄与度算出部、15 特徴的区間分割部、16 寄与度算出部、22 第2データ分割部、25 物理モデル寄与度抽出部、26 第2予測値算出部、27 第2予測残差量算出部、28 第3予測値算出部、29 予測値記憶部、30 特徴的区間同定部、31 寄与度抽出部、38 第2予測残差量予測部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13