(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-10-12
(45)【発行日】2022-10-20
(54)【発明の名称】予測システムおよび予測方法
(51)【国際特許分類】
G06Q 10/04 20120101AFI20221013BHJP
G06Q 50/06 20120101ALI20221013BHJP
H02J 13/00 20060101ALI20221013BHJP
H02J 3/00 20060101ALI20221013BHJP
【FI】
G06Q10/04
G06Q50/06
H02J13/00 301A
H02J3/00 130
(21)【出願番号】P 2018195809
(22)【出願日】2018-10-17
【審査請求日】2021-05-19
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110002365
【氏名又は名称】特許業務法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】内海 将人
(72)【発明者】
【氏名】渡辺 徹
(72)【発明者】
【氏名】茂森 郁雄
(72)【発明者】
【氏名】萩谷 功
【審査官】藤澤 美穂
(56)【参考文献】
【文献】特開2002-285634(JP,A)
【文献】特開2017-224268(JP,A)
【文献】特開2007-315850(JP,A)
【文献】特開2009-048384(JP,A)
【文献】特開2006-235888(JP,A)
【文献】特開2009-225550(JP,A)
【文献】特開2012-203875(JP,A)
【文献】特開2013-238988(JP,A)
【文献】特開2003-180032(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
H02J 13/00
H02J 3/00
(57)【特許請求の範囲】
【請求項1】
予測対象の予測対象時点における予測値を算出する予測システムであって、
前記予測対象の前記予測値を算出するための予測モデルの同定に用いる各因子それぞれの予測値の変動量を算出する因子変動評価部と、
前記予測対象の標本および各前記因子の標本に基づいて前記予測モデルを同定する共に、前記因子変動評価部により算出された各前記因子それぞれの前記予測値の変動量に基づい
て当該予測モデルを調整
し、調整した前記予測モデルに対して前記予測対象時点における各前記因子の予測値を入力することにより、前記予測対象の前記予測対象時点における前記予測値を算出する予測モデル切換部と
を備え、
前記予測モデル切換部は、
前記予測モデルにおける前記因子に対応する第1の係数の値を前記予測値の変動量に応じて変更することにより、前記予測モデルにおける当該因子に対する適合度合いを増減させるように前記予測モデルを調整する
ことを特徴とする予測システム。
【請求項2】
前記予測モデル切換部は、
前記予測モデル
が前記予測対象時点に類似する過去の前記予測対象の前記標本を用いて前記予測値を予測するモデルであ
る場合には、標本の類似度を示す指標である標本同士の距離の計算において、変動量の予測値が大きい前記因子の影響度に影響を及ぼす第2の係数の値を減少させるように前記予測モデルを調整する
ことを特徴とする請求項1に記載の予測システム。
【請求項3】
前記因子変動評価部は、
一の前記因子の前記予測値または前記予測値の変動量と相関を有する一つ以上の他の前記因子の前記予測値の変動量を用いて、一の前記因子の前記予測値の変動量を算出する
ことを特徴とする請求項1に記載の予測システム。
【請求項4】
前記因子変動評価部は、
一の前記因子の最新観測時刻よりも現在時刻に近い観測データが存在する一つ以上の他の前記因子の前記予測値の変動量を用いて、一の前記因子の前記予測値の変動量を算出する
ことを特徴とする請求項1に記載の予測システム。
【請求項5】
前記予測モデルは、
気温、湿度、日射量、地表面温度、人口の動態情報のいずれかを前記因子として用いる
ことを特徴とする請求項1に記載の予測システム。
【請求項6】
前記予測モデル切換部は、
前記予測モデルを同定する際、前記予測対象の値の変化に対する各前記因子の影響度合いを示す指標値を
予めそれぞれ算出し、算出した各前記因子の前記指標値をそれぞれ前記予測モデルにおける対応する前記因子の前記第1の係数の値として設定し、
前記変動量の大きい前記因子
の前記係数の値を減じるように
調整することにより、前記予測モデル
に対する当該因子の前記適合度合
いを調整する
ことを特徴とする請求項
1に記載の予測システム。
【請求項7】
前記予測モデル切換部は、
前記予測対象の値の変化に対する各前記因子の影響度合いを示す
前記指標値を、
対応する前記因子の過去時刻からの値の推移を示すデータを用い
て算出する
ことを特徴とする請求項
6に記載の予測システム。
【請求項8】
前記因子変動評価部は、
予測対象時刻の前時刻または後時刻の少なくとも何れかの前記因子の予測データを用いて当該因子の前記予測値の変動量を算出する
ことを特徴とする請求項1に記載の予測システム。
【請求項9】
前記因子変動評価部は、
前記因子それぞれの観測データの観測誤差に基づいて、前記因子それぞれの前記変動量を算出する
ことを特徴とする請求項1に記載の予測システム。
【請求項10】
前記因子変動評価部は、
前記予測モデルの同定において、地理平面および高度から構成される空間上の少なくとも一点の前記因子のデータを用いる
ことを特徴とする請求項1に記載の予測システム。
【請求項11】
前記因子変動評価部は、
予め算出している各前記因子それぞれの前記予測値を利用して、各前記因子それぞれの予測値の変動量を算出し、
算出した前記因子それぞれの前記予測値の変動量を用いて、予め算出している各前記因子それぞれの前記予測値を補正
し、
前記予測モデル切換部は、
調整された前記予測モデルに対して、補正された前記予測対象時点における各前記因子の予測値を入力することにより、前記予測対象の前記予測対象時点における前記予測値を算出する
ことを特徴とする請求項1に記載の予測システム。
【請求項12】
前記因子の変動量は、
前記因子の予測値の変動範囲、前記因子の前記予測値の誤差の発生範囲、または、前記因子の前記予測値の誤差値のいずれかである
ことを特徴とする請求項1に記載の予測システム。
【請求項13】
前記予測モデルは、
前記予測対象の値の時間推移のデータを構成する要因をそれぞれ分離し、分離した前記要因毎に予測値を算出する
ことを特徴とする請求項1に記載の予測システム。
【請求項14】
予測対象の予測対象時点における予測値を算出する予測システムで実行される予測方法であって、
前記予測対象の前記予測値を算出するための予測モデルの同定に用いる各因子それぞれの予測値の変動量を算出する第1のステップと、
前記予測対象の標本データおよび各前記因子の標本データに基づいて前記予測モデルを同定する共に、算出した各前記因子それぞれの前記予測値の変動量に基づい
て当該予測モデルを調整
し、調整した前記予測モデルに対して前記予測対象時点における各前記因子の予測値を入力することにより、前記予測対象の前記予測対象時点における前記予測値を算出する第2のステップと
を備え、
前記第2のステップでは、
前記予測モデルにおける前記因子に対応する対応する第1の係数の値を前記予測値の変動量に応じて変更することにより、前記予測モデルにおける当該因子に対する適合度合いを増減させるように前記予測モデルを調整する
ことを特徴とする予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本願発明は、予測システムおよび予測方法に関し、例えば、将来の電力需要を予測する予測システムに適用して好適なものである。
【背景技術】
【0002】
電力事業およびガス事業などのエネルギー事業分野や、通信事業分野、ならびに、タクシーおよび配送業などの運送事業分野などでは、消費者の需要に合わせた設備稼働や資源配分を行うために、将来の需要量の値の予測を行っている。
【0003】
例えば、電力事業の分野では、電気の発電量と需要量とを常に一致しなければならないという物理的な制約があり、必要十分な発電機を事前に待機させる必要があるため、電力の需要を正確に予測する必要がある。
【0004】
この場合、電力需要は気温の影響を受けることが知られており、この場合は外気温を説明変数(因子)として電力需要の予測を行う。ただし電力需要に影響を与える因子は外気温のみではないことも知られており、様々な因子を用いることで予測の精度向上を期待できる。
【0005】
特許文献1には、カレンダー情報(曜日、祝祭日、季節等の情報)、気象情報(少なくとも気温、湿度、風速、日射量等を含む)、および経済情報を用いて予測対象日と類似する過去の日のデータを抽出し予測する方法が開示されている。
【0006】
また特許文献2には、電力需要に対するイベントの影響度を示すイベント影響度を所定の単位時間ごとに有しているイベント時系列データから、イベントの影響を考慮せずに算出された予測需要と、当該予測需要で示された時間帯において実際に生じた電力需要である実績需要との差である需要変動量に基づいて、電力需要に影響を与えたイベント時系列データを抽出し、当該イベント時系列データと需要変動量とを対応付けて過去のイベント時系列データとして保存し、類似する過去のイベント時系列データの需要変動量と、イベント影響度とを用いてリアルタイムの需要変動量を予測し、当該需要変動量に通常需要を加算することで、イベントを考慮した需要予測結果を算出する方法において、類似する過去のイベント時系列データを算出するためのイベント距離計算に、エリア間のユークリッド距離、エリア間の移動人数、エリア面積、エリア内人口、エリア内年齢構成、エリア内契約需要家数、両エリアを含む鉄道・バスの定期券所持者数、および、過去のイベントによるエリア内需要変動量の少なくともいずれかを用いる方法が開示されている。
【先行技術文献】
【特許文献】
【0007】
【文献】特開2017-153259号公報
【文献】特開2018-124727号公報
【発明の概要】
【発明が解決しようとする課題】
【0008】
ところで、例えば電力需要などの予測対象の予測を行う場合、説明変数である因子の予測対象日時におけるそれぞれ値は、予め予測しておく必要がある。従って予測対象日時における因子のそれぞれの値には誤差(以下、適宜、これを因子変動量と呼ぶ)が生じる。因子変動量が過大となった場合、予測対象の予測値にも過大な誤差が生じる。加えて、因子それぞれの予測処理実行時点における最新の観測データの観測時刻が一致していない(不一致)場合、予測処理実行時点までの因子それぞれの予測期間は異なることから、それぞれの因子変動量の変動範囲の程度は異なる。さらに各因子の因子変動量は相互に相関がある場合、因子の変動による予測対象の予測誤差への影響は相乗的に拡大する。
【0009】
しかしながら、従来はこのような因子それぞれの因子変動量に程度差が存在し、また因子変動量間に相互相関が存在する因子を用いた予測まで扱っておらず、このため因子の変動に起因する予測対象の過大誤差の発生を抑制することができず、よって精度の良い予測値を得難い問題があった。
【0010】
本願発明は以上の点を考慮してなされたもので、それぞれの因子変動量に程度差が存在し、また因子変動量間に相互相関が存在する因子の因子変動量を適切に評価することで、予測対象の予測誤差を従来よりも極力低減させ得る予測システムおよび予測方法を提供しようとするものである。
【課題を解決するための手段】
【0011】
かかる課題を解決するため本発明においては、予測対象の予測対象時点における予測値を算出する予測システムであって、前記予測対象の前記予測値を算出するための予測モデルの同定に用いる各因子それぞれの予測値の変動量を算出する因子変動評価部と、前記予測対象の標本および各前記因子の標本に基づいて前記予測モデルを同定する共に、前記因子変動評価部により算出された各前記因子それぞれの前記予測値の変動量に基づいて当該予測モデルを調整し、調整した前記予測モデルに対して前記予測対象時点における各前記因子の予測値を入力することにより、前記予測対象の前記予測対象時点における前記予測値を算出する予測モデル切換部とを設け、前記予測モデル切換部は、前記予測モデルにおける前記因子に対応する対応する第1の係数の値を前記予測値の変動量に応じて変更することにより、前記予測モデルにおける当該因子に対する適合度合いを増減させるように前記予測モデルを調整するようにした。
【0012】
また本発明においては、予測対象の予測対象時点における予測値を算出する予測システムで実行される予測方法であって、前記予測対象の前記予測値を算出するための予測モデルの同定に用いる各因子それぞれの予測値の変動量を算出する第1のステップと、前記予測対象の標本データおよび各前記因子の標本データに基づいて前記予測モデルを同定する共に、算出した各前記因子それぞれの前記予測値の変動量に基づいて当該予測モデルを調整し、調整した前記予測モデルに対して前記予測対象時点における各前記因子の予測値を入力することにより、前記予測対象の前記予測対象時点における前記予測値を算出する第2のステップとを設け、前記第2のステップでは、前記予測モデルにおける前記因子に対応する対応する第1の係数の値を前記予測値の変動量に応じて変更することにより、前記予測モデルにおける当該因子に対する適合度合いを増減させるように前記予測モデルを調整するようにした。
【0013】
本発明の予測システムおよび予測方法によれば、それぞれの因子変動量に程度差が存在し、また因子変動量間に相互相関が存在する因子の因子変動量を適切に評価することができる。
【発明の効果】
【0014】
本発明によれば、予測対象の予測誤差を従来よりも極力低減させ得る予測システム及び予測方法を実現できる。
【図面の簡単な説明】
【0015】
【
図1】第1の実施の形態によるデータ管理システムの全体構成図である。
【
図2】データ予測システムの詳細構成を示すブロック図である。
【
図3】データ予測システムの論理構成を示すブロック図である。
【
図4】データ予測システムの処理フローを示すフローチャートである。
【
図5】因子変動予測部の論理構成を示すブロック図である。
【
図6】因子変動評価部の論理構成を示すブロック図である。
【
図7】予測モデル切換部の論理構成を示すブロック図である。
【
図8】(A)および(B)は、本実施の形態の効果の説明に供する概念図である。
【
図9】(A)および(B)は、因子変動評価部の説明に供する概念図である。
【
図10】データ管理システムの他の実施の形態による処理内容の説明に供する概念図である。
【
図11】本発明の電力分野への適用例の説明に供するブロック図である。
【
図12】因子変動評価部の説明に供する概念図である。
【発明を実施するための形態】
【0016】
以下図面について、本発明の一実施の形態を詳述する。
【0017】
(1)第1の実施の形態
(1-1)本実施の形態によるデータ管理システムの構成
図1において、1は全体として本実施の形態によるデータ管理システムを示す。データ管理システム1は、例えば電力事業分野に適用する場合、過去の電力需要の実績量に基づいて将来の所定期間の電力の需要量などの値を予測し、予測結果に基づいて、発電機の運転計画の策定と実行、そして、他の電気事業者からの電力の調達取引計画の策定や実行など電力の需給管理を可能にするものである。
【0018】
データ管理システム1は、予測演算装置2、データ管理装置3、計画作成・実行管理装置5、情報入出力端末4、データ観測装置6およびデータ配信装置7を備えて構成され、これらが通信経路8を介して相互に接続されている。通信経路8は、例えばLAN(Local Area Network)やWAN(Wide Area Network)などから構成される。
【0019】
データ管理装置3は、予測対象の予測値を算出するために使用する予測対象や因子の標本データ、および因子の予測データを記憶する。
【0020】
予測対象の標本データには、時間推移に伴い観測された予測対象の過去の観測データである予測対象標本データを少なくとも含む。また因子の標本データには、予測対象の値の増減に影響を及ぼす可能性のある各種因子の過去の観測データである因子標本データを少なくとも含む。また因子の予測データには、因子標本データに含まれる因子それぞれの予測データを少なくとも含む。
【0021】
ここで「予測対象」としては、例えば、電力、ガス、水道などのエネルギー消費量データ、あるいは太陽光発電や風力発電などのエネルギーの生産量、あるいは卸取引所で取引されるエネルギーの取引価格などある。また電力事業分野以外では、通信分野における通信基地局などで計測される通信量データや、運送業における自動車等の移動体の位置情報履歴データなどがこれに該当する。またこれらの標本データは、計測器単位のデータ、あるいは複数の計測器の合計としてのデータである。
【0022】
また「因子」としては、例えば気温、湿度、日射量、風速、気圧、地表面温度などの気象データ、年月日、曜日、任意に設定した日の種別を示すフラグ値などの暦日データ、台風やイベントなどの突発事象の発生有無を示すデータ、エネルギーの消費者数、産業動向や景況指数などの経済状況を示すデータ、特急列車の乗車率、乗車客数、予約席数、あるいは道路交通状況などの人や移動体の移動状況を示すデータ、あるいは通信基地局に接続する通信端末数などのデータが該当する。また「因子」は、上記の予測対象の過去の観測データそのものなども含む。
【0023】
データ管理装置3は、情報入出力端末4を介して予め設定した過去日時から最新の観測日時までの標本データを記憶する。またデータ管理装置3は、他装置からのデータ取得要求に応じて、標本データの検索および送信を行う。
【0024】
予測演算装置2は、データ管理装置3に記憶されたデータを用いて予測を行う。予測演算装置2は、後述のように、予測対象の予測値を算出する予測モデルに用いる因子それぞれの予測値の変動量を算出する因子変動予測部と、因子変動予測部が出力した因子それぞれの変動量の一部もしくは全てを用いて、因子それぞれの予測値の変動量を再計算する因子変動評価部と、因子変動評価部が算出した因子それぞれの変動量に基づいて予測モデルを切り替える予測モデル切換部とを有する。
【0025】
なお「因子の予測値の変動量」とは、例えば信頼区間や予測区間、あるいはモンテカルロ計算などにより得られた因子の予測値上下限や分散などの指標で示される因子の予測値の変動範囲、もしくは事後観測される観測値との差である誤差の期待値あるいは分散などで示される計算した予測値に対する実観測値の発生範囲を示す指標値、もしくは誤差そのものを指す。
【0026】
計画作成・実行管理装置5は、予測演算装置2が出力した予測データを基に、所定の目標を達成するための物理的な設備の運転計画の作成と実行を行う。ここで物理的な設備の運転計画とは、エネルギー分野においては、例えば、予測した将来のエネルギー需要値または予測した将来のエネルギー需要値に基づいて作成したエネルギー需要計画値を充足させるような、発電機の運転計画である。
【0027】
具体的には、発電機の起動台数およびそれら発電機の出力配分の計画や、ガス導管や水道管に流すガスや水の流量や圧力の配分計画である。あるいはデマンドレスポンスと呼ばれる電力需要の調整制御においては、デマンドレスポンスに参加している電力消費者もしくは電力消費者の需要設備の需要調整量配分の計画や調整制御の実行である。また通信分野においては、例えば、通信基地局の収容容量を超えないように、各通信基地局に接続する通信端末数の制御計画である。また運送分野においては、例えば、予測した利用者数を充足させることが出来るようなタクシーの配車計画である。
【0028】
なお設備の運転計画は、計画作成・実行管理装置5の利用者による直接的な実行に限定されるものではなく、間接的に実現される形態でもよい。「間接的な設備の運転」とは、電力分野においては、例えば、直接的な相対取引契約や取引所を介した取引契約に基づいた他者による物理的な設備の運転である。この場合、取引契約の実行計画が設備の運転計画に相当する。
【0029】
情報入出力端末4は、予測演算装置2、データ管理装置3および計画作成・実行管理装置5へのデータ入力や、これら装置が記憶するデータまたは出力するデータの表示を行う。データ観測装置6は、予測対象過去計測データと予測説明因子データを、所定の時間間隔で定期的に計測し、データ配信装置7またはデータ管理装置3に送信する。データ配信装置7は、データ観測装置6から受信したデータを記憶し、データ管理装置3、予測演算装置2またはその両方に送信する。
【0030】
(1-2)装置内部構成
図2は、データ管理システム1におけるデータ予測システム12(
図3)を構成する各装置の機能構成を示す。データ予測システム12は予測演算装置2とデータ管理装置3とから構成される。
【0031】
データ管理装置3は、データ管理装置3の動作を統括的に制御するCPU(Central Processing Unit)31、入力装置32、出力装置33、通信装置34および記憶装置35を備えて構成される。データ管理装置3は、例えばパーソナルコンピュータ、サーバコンピュータまたはハンドヘルドコンピュータなどの情報処理装置である。
【0032】
入力装置32は、キーボードまたはマウスから構成され、出力装置33は、ディスプレイまたはプリンタから構成される。また通信装置34は、無線LANまたは有線LANに接続するためのNIC(Network Interface Card)を備えて構成される。また記憶装置35は、RAM(Random Access Memory)やROM(Read Only Memory)などの記憶媒体である。出力装置33を介して各処理部の出力結果や、中間結果を適宜出力してもよい。
【0033】
記憶装置35には、予測対象標本データ記憶部351、因子標本データ記憶部352、因子予測データ記憶部353および因子変動データ記憶手段354などのデータベースが格納されている。予測対象標本データ記憶部351には、予測対象標本データ351Aが格納される。また因子標本データ記憶部352には、因子標本データ352Aが格納される。また因子予測データ記憶部353には、因子予測データ353Aが格納される。さらに因子変動データ記憶部354には、因子予測データ354Aが格納される。
【0034】
予測対象標本データ351Aは、時間推移に伴い観測された予測対象の過去の観測値が記憶されたデータである。予測対象とは、例えば、電力、ガスまたは水道などのエネルギー消費量データ、通信基地局などで計測される通信量データ、自動車などの移動体の位置情報履歴データなどである。従って標本データに含まれる予測対象の過去のデータは、例えば計量器単位または複数計量器の合計としての電力、ガスまたは水道などのエネルギー消費量データや、ある通信基地局の通信量データ、タクシーなどの移動体の時間毎の稼働台数データなどである。
【0035】
因子標本データ352Aは、予測対象の値の増減に影響を与える各種因子の、時間推移に伴い観測された過去の観測値が記憶されたデータである。「因子」とは、例えば気温、湿度、日射量、風速、気圧などの気象データ、年月日、曜日、任意に設定した日の種別を示すフラグ値などの暦日データ、台風やイベントなどの突発事象の発生有無を示すデータ、エネルギーの消費者数、産業動向や景況指数などの経済状況を示すデータ、特急列車の乗車率、乗車客数、予約席数、あるいは道路交通状況などの人や移動体の移動状況を示すデータ、あるいは通信基地局に接続する通信端末数などのデータである。また上記の予測対象の過去の観測データそのものなども含む。
【0036】
因子予測データ353Aは、因子標本データ352Aに格納されている各因子の、各時間断面における過去の予測値が記憶されたデータである。また因子変動データ354Aは、因子予測データ353Aに格納されている各因子の、各時間断面における過去の予測値に対応する変動量の過去の計算結果データが記憶されたデータである。
【0037】
予測演算装置2は、予測演算装置2の動作を統括的に制御するCPU(Central Processing Unit)21、入力装置22、出力装置23、通信装置24および記憶装置25を備えて構成される。予測演算装置2は、例えばパーソナルコンピュータ、サーバコンピュータまたはハンドヘルドコンピュータなどの情報処理装置である。
【0038】
記憶装置25には、因子変動予測部251、因子変動評価部252、予測モデル切換部253などの各種コンピュータプログラムが格納される。
【0039】
因子変動予測部251は、因子標本データ352Aおよび因子予測データ353Aを入力し、因子それぞれの予測値の変動量を算出して出力する機能を有する。具体的に因子変動予測部251は、因子標本データ352Aおよび予因子予測データ353Aを用いて、ある因子についての予測対象時点における予測値の変動量を算出する。変動量の算出手法としては、例えば微分方程式を用いた数値計算やマルチエージェントシミュレーションなどの時間発展をシミュレートする演繹的な方法、あるいは過去のデータの統計や回帰分析などの帰納的な方法の何れか、もしくはその両方を適用することができる。
【0040】
同様の処理を、一部もしくは全ての因子について行う。その後、因子変動予測部251は、因子それぞれの予測対象時点における変動量を出力する。
【0041】
因子変動評価部252は、因子標本データ352A、因子予測データ353A、および因子変動予測部251の出力データを入力し、因子それぞれの変動量を再計算し出力する。具体的に因子変動評価部252は、因子標本データ352Aおよび因子予測データ353Aそれぞれの計測時点後との差分である変動量の標本系列を算出し、因子間の変動量の相関関係に基づいて各因子の変動量を算出するモデルを同定し、同定したモデルと因子変動予測部251が出力した各因子の変動量の予測値とに基づいて予測対象時点における各因子の変動量を再計算し出力する。
【0042】
予測モデル切換部253は、予測対象標本データ351A、因子標本データ352A、因子予測データ353A、および因子変動評価部252の出力データを入力し、予測データ254Aを出力する。具体的に予測モデル切換部253は、予測対象標本データ351Aと因子象標本データ352Aとを用いて、予測対象の予測値を算出する予測モデルを同定する。同定処理において、因子変動評価部252が出力した各因子の変動量に基づいて、各因子への予測モデルの適合度を調整する。調整後の予測モデルに因子予測データ353Aを入力することで予測対象の予測対象時点における予測値を算出し予測データとして出力する。
【0043】
(1-3)本実施の形態によるデータ予測システムの全体の処理およびデータフロー
図3および
図4を参照して、本実施の形態におけるデータ予測システム12の処理およびデータフローについて説明する。
【0044】
先ず
図3を参照して、本実施の形態におけるデータ予測システム12のデータ予測処理のデータフローを説明する。
【0045】
データ管理装置3は、データ観測装置6またはデータ配信装置7から予測対象標本データ351A、因子標本データ352A、および因子予測データ353Aを受信し、それぞれ予測対象標本データ記憶部351、因子標本データ記憶部352、因子予測データ記憶手段353に記憶する。
【0046】
予測演算装置2は、データ管理装置3に記憶された予測対象標本データ351A、因子標本データ352A、および因子予測データ353Aを取得する。そして予測演算装置2は因子変動予測部251において、因子標本データ352Aおよび因子予測データ353Aに含まれるある因子について、過去の観測時点それぞれでの因子標本データ352Aと因子予測データ353Aとの差分である変動量の系列を算出し、因子標本データ352A、因子予測データ353A、および算出した変動量の少なくとも何れか一つを用いて、予測対象時点におけるこの因子の変動量の予測値を算出する。同様の処理を、一部もしくは全ての因子について行う。その後、因子変動予測部251は、因子それぞれの予測対象時点における変動量を出力する。
【0047】
次いで予測演算装置2は、因子変動評価部252において、因子標本データ352Aおよび因子予測データ353Aそれぞれの計測時点後との差分である変動量の標本系列を算出し、因子間の変動量の相関関係に基づいて各因子の変動量を算出するモデルを同定し、同定したモデルと、因子変動予測部251が出力した各因子の変動量の予測値とに基づいて予測対象時点における各因子の変動量を再計算し出力する。
【0048】
そして予測演算装置2は予測モデル切換部253において、因子標本データ352A、因子予測データ353A、および因子変動評価部252の出力データを入力し、予測データ254Aを出力する。
【0049】
具体的に、予測モデル切換部253は、予測対象標本データ351Aと因子標本データ352Aとを用いて、予測対象の予測値を算出する予測モデルを同定する。同定処理において、予測モデル切替部253は、因子変動評価部252が出力した各因子の変動量に基づいて、各因子への予測モデルの適合度を調整する。調整後の予測モデルに因子予測データ353Aを入力することで予測対象の予測対象時点における予測値を算出し予測データを出力する。その後、算出した予測データを予測データ記憶部351Aに格納する。
【0050】
最後に予測演算装置2は、算出した予測データを、計画作成・実行管理装置5に直接、もしくは予測データ記憶部254を介して送信する。
【0051】
次に
図4を参照して、本実施の形態におけるデータ予測システム12のデータ予測処理の処理手順を説明する。この処理は、予測演算装置2が利用者からの入力操作を受け付けたこと、または情報入出力端末4を介して予め設定した実行時刻になったことを契機として始まる処理であり、予測演算装置2によりステップS401からステップS404の処理が実行される。
【0052】
なおデータ予測処理は、実際には予測演算装置2のCPU21および記憶装置25に格納されている各種コンピュータプログラムならびにデータ管理装置3のCPU31および記憶装置35に格納されている各種コンピュータプログラムに基づいて実行されるが、説明の便宜上、処理主体を予測演算装置2および予測演算装置2が有する各種コンピュータプログラムとして説明する。
【0053】
先ず予測演算装置2は、データ管理装置3から、予測対象標本データ351A、因子標本データ352A、および因子予測データ353Aを取得受信する(S401)。
【0054】
次いで、予測演算装置2が有する因子変動予測部251は、因子標本データ352Aと因子予測データ353Aから、因子それぞれの予測値の変動量を算出する(S402)。
【0055】
そして、予測演算装置2が有する因子変動評価部252は、因子標本データ352A、因子予測データ353A、および因子変動予測部251の出力データから、因子それぞれの予測値の変動量を再計算する(S403)。
【0056】
そして、予測演算装置2が有する予測モデル切換部253は、予測対象標本データ351A、因子標本データ352A、因子予測データ353A、および因子変動評価部252の出力データから、予測対象の予測値を算出する予測モデルを切り替えて予測処理を行う(S404)。
【0057】
最後に予測演算装置2は、予測モデル切換部253が算出した予測対象の予測データを、予測データ記憶部254に記憶、または計画作成・実行管理装置5に送信する。
【0058】
以上の処理を以って、本実施の形態におけるデータ予測処理が終了する。
【0059】
以降、
図5から
図7を用いて、各構成要素の詳細な実施の形態を説明する。
【0060】
(1-4)各構成要素の詳細
(1-4-1)因子変動予測部
図5を参照して、本実施の形態における因子変動予測部251のデータフローおよび処理動作を説明する。
【0061】
本実施の形態による因子変動予測部251は、因子標本データ352Aおよび因子予測データ353Aを用いて、因子それぞれの予測値の変動量を算出する。ここで「因子の予測値の変動量」とは、例えば信頼区間や予測区間、あるいはモンテカルロ計算などにより得られた因子の予測値上下限や分散などの指標で示される因子の予測値の変動範囲、もしくは事後観測される観測値との差である誤差の期待値あるいは分散などで示される計算した予測値に対する実観測値の発生範囲を示す指標値、もしくは誤差そのものである。
【0062】
具体的に、先ず因子変動予測部251は、因子標本データ352Aおよび因子予測データ353Aを因子変動モデル同定部251Aに入力する。
【0063】
次いで因子変動モデル同定部251Aは、ある因子Aについて、予測対象時点における予測値の変動量を算出するためのモデルを同定する。より具体的に、例えば因子の予測値の変動量として因子の予測値の変動範囲を算出する場合、微分方程式やマルチエージェントシミュレータなどの演繹的なモデルにおける内部の各種パラメータを、因子標本データ352Aおよび因子予測データ353Aを用いて最適化する。例えば因子が気象要素である場合、データ同化処理を行う。あるいは因子変動モデル同定部251Aは、過去データの統計や回帰分析等の帰納的なモデルにおける内部パラメータの最適化を行う。例えば因子Aの予測値がαであるとき、実際の事後の観測値がβである確率が、パラメータθを持つ分布に従うと仮定した場合(P(β|α、θ))、因子標本データ352Aおよび因子予測データ353Aを基に最尤推定等によってパラメータθを推定する。また因子の予測値の変動量として因子の予測値の誤差の期待値や分散を算出する場合、因子Aの過去の各時点後との誤差を因子標本データ352Aおよび因子予測データ353Aから算出し、因子標本データ352Aを用いて統計や回帰分析等の帰納的なモデルを同定する。
【0064】
そして因子変動量予測演算部251Bは、因子変動モデル同定部251Aが同定した因子Aの変動量モデルに対し、予測対象時点における因子予測データである因子予測データ353A2を入力することで、予測対象時点における因子Aの変動量の予測値を算出し出力する。なお同定したモデルが微分方程式やマルチエージェントシミュレータなどの演繹的なモデルである場合、因子予測データ353A2をランダムに変化させた新たな因子予測データ353A2を複数生成し、それぞれをモデルに入力することで複数の因子の予測値を算出し、予測値の変動量を算出する。
【0065】
上記の処理を、因子標本データ352Aおよび因子予測データ353Aに含まれる因子の内、予め設定した因子について、もしくは全ての因子について行った後、因子変動評価部252に対して出力し、また因子変動データ354Aに記憶する。以上をもって因子変動予測部251の動作を終了する。
【0066】
なお因子変動モデル同定部251Aでの因子の予測値の変動量を予測するモデルの同定を行う際、統計や回帰分析等の帰納的なモデルを適用する場合は、他の公知の手法を適用してよい。公知の手法とは、例えば、重回帰モデルなどの線形回帰モデルやロジスティック回帰などの一般化線形モデルなどの線形性を仮定する手法、ARX(AutoRegressive with Exogenous)モデルなどの自己回帰性を仮定する手法、Ridge回帰、Lasso回帰、ElasticNetなどの縮小推定器を利用する手法、部分最小二乗法や主成分回帰などの次元縮退器を利用する手法、多項式を用いた非線形モデル、あるいはサポートベクトル回帰、回帰木、ガウス過程回帰、ニューラルネットなどのノンパラメトリックと呼ばれる手法である。
【0067】
(1-4-2)因子変動評価部
図6を参照して、本実施の形態における因子変動評価部252のデータフローおよび処理動作を説明する。
【0068】
本実施の形態による因子変動評価部252は、因子変動データ354A、因子予測データ353A、および因子変動予測部251の出力データを用いて、因子それぞれの変動量の相関関係に基づいて、因子それぞれの変動量を再計算し出力する。
【0069】
具体的に、先ず因子変動評価部252は、因子変動データ354A、因子予測データ353A、および因子変動予測部251の出力データを取得し、計測時間差補正部252Aに入力する。
【0070】
次いで計測時間差補正部252Aは、ある因子Aについて、因子Aの最新観測時刻より現在時点に近い新しい観測データを有する他の因子を因子セットXとして一つ以上選択し、選択した因子セットXのそれぞれの因子の過去および予測対象時点における変動量を、因子変動データ354Aおよび因子変動予測部251の出力データからそれぞれ抽出する。そして抽出した因子Xの過去の変動量を用いて、因子Aの計測データの未観測の時間断面の変動量を補正する。
【0071】
より詳しく、
図9および
図12の概念図を用いて説明する。先ず
図12は、二つの因子Aと因子Bのデータの取得タイミングを示した図である。例えば因子Aは0時および6時にデータを取得しており、他方因子Bは、毎時でデータを取得している。因子Aと因子Bのデータ取得のタイミングが不一致である(一致していない)ため、例えば図で示す0時から6時の期間(1201)では、因子Aのデータに対して、因子Bがより現在時刻に近いデータを取得できている状況にある。
【0072】
次に
図9を用いてより具体的な処理概要を説明する。
図9(A)の点枠9A1は、因子Aの値自体の観測値と予測値(点枠9A1内の上段図において、塗りつぶされた点が観測した値、点線で囲まれた点が予測した値)および、変動量の観測値と予測値(点枠9A1内の下段図において、塗りつぶされた棒が観測した変動量、点線で囲まれた棒が予測した変動量)を示している。同様に因子セットX内の因子Bについて、
図9(B)の点線枠9A2に図示している。図では、因子Aの最新の計測値は因子Bの最新の観測値より計測時間が古いことを示している。
【0073】
ここで因子Aの変動量の観測値(9A11)と、因子Bの変動量の観測値(9A21)は時間推移が類似しており、相関関係を有している。従って以降時刻における因子Aと因子Bの変動量にも相関を有するはずである。しかし
図9(A)では、以降時刻の因子Bの変動量の観測値と予測値(9A22)は、現時点での因子Aの変動量の予測値(9A12)と相関を有していない。そこで因子Bの変動量(9A22)と相関を有するように因子Aの変動量の予測値(9A12)を、
図9(A)の左側の9A31に示すような変動量の予測値に補正を行う。
【0074】
なお上述の概念で説明した補正の実際の処理には、公知の手法を適用してよい。公知の手法とは、例えば、重回帰モデルなどの線形回帰モデルやロジスティック回帰などの一般化線形モデルなどの線形性を仮定する手法、ARX(AutoRegressive with Exogenous)モデルなどの自己回帰性を仮定する手法、Ridge回帰、Lasso回帰、ElasticNetなどの縮小推定器を利用する手法、部分最小二乗法や主成分回帰などの次元縮退器を利用する手法、多項式を用いた非線形モデル、あるいはサポートベクトル回帰、回帰木、ガウス過程回帰、ニューラルネットなどのノンパラメトリックと呼ばれる手法である。
【0075】
また説明の簡単のために因子Aの変動量の補正に因子Bのみを使用する様に説明したが、複数の因子を使用しても良い。例えば、因子Aの変動量を算出する手法としてRidge回帰やLasso回帰を用いた場合、他の因子のうち係数がより大きい値に収束した因子ほど因子Aとの間でより強く変動量の相関を有する因子であるため、このような因子を複数抽出して使用するようにすればよい。
【0076】
次いで因子変動間相関補正部252Bは、因子変動データ354Aから取得した各因子の過去の変動量と、計測時間差補正部252Aが出力した各因子の予測対象時点における変動量の予測値とを用いて、各因子の変動量の間の相関関係に基づいた各因子の変動量の補正を行い、最終的な各因子の予測値の変動量を出力する。
【0077】
より具体的には、因子変動間相関補正部252Bは、例えば変動量を因子の予測値の誤差として算出する場面において、ある因子Aと因子Bの変動量の予測値がそれぞれaとbであるとき、事後観測される実際の変動量がそれぞれαとβである確率がパラメータθで規定されるある分布に従うと仮定し(P(α、β|a、b、θ))、過去の変動量の予測値と観測値からθを推定する。そして推定したθでの分布に対して、計測時間差補正部252Aが出力した因子Aおよび因子Bの予測対象時点における変動量の予測値を入力することで、事後観測が期待される実際の変動量の予測値が補正後データとして出力される。
【0078】
因子変動間相関補正部252Bは、補正後の各因子の変動量の予測値を予測モデル切換部253に対して出力し、因子変動評価部252の動作が終了する。
【0079】
なお上述の処理はこれに限らず、公知の手法を適用してよい。公知の手法とは、ニューラルネットワークやガウス過程回帰などを用いた多入力多出力の回帰モデルである。また一般的な回帰分析などの多入力一出力のモデルであっても良い。多入力一出力モデルの場合、補正を行う因子を順に変更し処理を繰り返すことで、補正後の各因子の変動量の予測値を得る。
【0080】
(1-4-3)予測モデル切換部
図7を参照して、本実施の形態における因子変動予測部251のデータフローおよび処理動作を説明する。
【0081】
本実施の形態による予測モデル切換部253は、予測対象標本データ351A、因子標本データ352Aおよび因子予測データ353Aに記憶されている予測対象時点における各因子の予測値である因子予測データ353A2、および因子変動評価部252が出力した予測対象時点における各因子の予測値の変動量の予測値を用いて、予測対象の最終的な予測データを出力する。
【0082】
具体的に、先ず予測モデル同定部253Aは、予測対象標本データ351Aおよび因子標本データ352Aを用いて、予測対象の予測値を算出するための予測モデルを同定する。予測モデルの同定に際しては公知の手法を適用してよく、例えば、重回帰モデルなどの線形回帰モデルやロジスティック回帰などの一般化線形モデルなどの線形性を仮定する手法、ARX(AutoRegressive with Exogenous)モデルなどの自己回帰性を仮定する手法、Ridge回帰、Lasso回帰、ElasticNetなどの縮小推定器を利用する手法、部分最小二乗法や主成分回帰などの次元縮退器を利用する手法、多項式を用いた非線形モデル、あるいはサポートベクトル回帰、回帰木、ガウス過程回帰、ニューラルネットなどのノンパラメトリックと呼ばれる手法を適用することができる。
【0083】
次いで予測モデル変更部253Bは、因子変動評価部252が出力した各因子の予測値の変動量の予測値に基づいて、予測モデル同定部253Aが出力した予測対象の予測値を算出するための予測モデルを変更する。より具体的には、因子変動評価部252が出力した各因子の予測値の変動量の予測値において、変動量が大きい因子に対する適合度を減じるように、予測モデル同定部253Aが出力した予測対象の予測値を予測するモデルを変更する。例えば予測対象の予測値を予測するモデルが重回帰モデルである場合、以下の式が予測モデルである。
【0084】
【0085】
ここでyは、予測対象の予測値である。またx_1とx_2は、それぞれ因子1と因子2である。そしてa、b、c、が予測モデルのパラメータである。w_1とw_2は、それぞれ因子1と因子2への適合度を調整するパラメータであり、通常はw_1=w_2=0.5である。ここで、因子変動評価部252が出力した因子1と因子2の変動量の予測値がそれぞれ10と90であったとする。因子1の変動量に対して因子2の変動量が9倍であるため、因子2の適合度を因子1の9分の1に減じる。従ってw_1=0.9、w_2=0.1とし、変更後の予測モデルとする。
【0086】
このように変動量が大きい因子については、予測モデル内のその因子の適合度を調整するパラメータw(w_1,w_2)の値を下げることにより、予測対象の予測結果に対するその因子の影響度を低減することができ、これによりその因子に対する予測が大きく外れた場合においても、これに起因して予測対象の予測結果が大きく外れることを防止することができる。なお、パラメータwの値を下げた結果、その値が予め設定された閾値以下となった因子については、予測モデルの同定に利用しない(予測モデルから削除する)ようにしてもよい。
【0087】
一方、予測モデルを変更する他の方法として、以下の方法を利用することもできる。例えばガウス過程回帰やサポートベクトル回帰などカーネル関数を用いた標本の類似度を算出し、予測対象時点に類似する過去の標本を用いて予測値を計算するモデルにおいては、標本の類似度の指標とする標本同士の距離は以下の式で算出する。
【0088】
【0089】
ここでdijは、標本xiと標本xjとの距離であり、通常は右辺の平方根をとるが、表記の簡単のために省略する。またxi_1は標本xiの因子1の値であり、xi_2は標本xiの因子2の値である。xj_1とxj_2も同様の意味である。ここでw_1とw_2は、標本xiとxjの距離を計算する上での因子1と因子2の影響度を調整するパラメータであり、通常はw_1=w_2=0.5である。ここで前述と同様に、因子1の変動量に対して因子2の変動量が9倍であるとして、因子2の適合度を因子1の9分の1に減じる。従ってw_1=0.9、w_2=0.1とする。すなわち、標本xiおよび標本xjの類似度を示す指標である距離の計算において、変動量の予測値が大きい因子2の影響度を減少させるように予測対象の予測モデルを変更する。
【0090】
なお前述の説明では簡単のため、因子は因子1および因子2の2種類としたが、3種類以上の因子を用いる場合も同様である。また各因子への適合度を調整するパラメータwは、各因子の変動量の比率を直接反映するように設定するとして説明したが、例えば比率のべき乗の値や変動量の逆数など、因子間の変動量の相対的な大小関係が反映されていればよい。また各因子への適合度を調整するパラメータwは合計して1となるように説明したが、合計して1以外の数値をとって良い。また前述の説明では予測対象の予測モデルにおける各因子の適合度をパラメータwにて後調整するものとして説明したが、例えば各因子の予測値の変動量の相対的な大小関係を各因子の重要度係数あるいは重み係数として、改めて予測対象の予測値を算出する予測モデルの同定もしくは予測モデルのパラメータ推定を行っても良い。
【0091】
最後に予測演算部253Cは、予測モデル変更部253Bが出力した予測モデルに対して、予測対象時点における因子の予測値である因子予測データ353Aを入力することで、予測対象の最終的な予測値を算出する。算出した予測値を予測データとして出力し、予測データ254Aに格納する。
【0092】
以上をもって予測モデル切換部253の動作を終了し、同時に、本実施の形態におけるデータ予測システム12の演算処理が終了する。
【0093】
(1-5)本実施の形態の効果
次に
図8を参照して、本実施の形態におけるデータ予測システム12の効果を説明する。
【0094】
図8は、予測対象の予測値を算出する予測モデルにおいて、因子Aおよび因子Bの2種の因子を用いた場合を例示している。
図8(A)は、予測モデル同定部253Aが出力した直後の予測対象の予測値を算出する予測モデルを図示しており、図の簡略化のため、因子Aと因子Bのそれぞれの断面部分のみでの予測モデルの適合状況をそれぞれ8A1と8A2の曲線で示している。ここで因子Aと因子Bの予測対象時点における予測値が8A3と8A4であったとする。予測モデル変更部253Bでの処理を行わなかったと仮定した場合、予測対象の予測値は点8A5の値が算出される。しかし事後観測された因子Aと因子Bの観測値がそれぞれ点8A6と点8A7であったとすると、実際の予測対象の観測値は点8A8である。特に因子Aの変動量が過大であったため、予測対象の予測値にも過大な誤差が生じている。
【0095】
ここで予測モデル変更部253Bの処理を経た後の変更後の予測モデルを
図8(B)に示している(8A9、8A2)。この図では、因子変動評価部252において因子Aの変動量が過大であると算出されていたことから、予測モデル変更部253Bにおいて因子Aへの適合度を減少するように予測モデルを変更している。変更後の予測モデルでは、因子Aの予測値の誤差に対する予測対象の予測値の影響が減じられていることから、変更後の予測モデルによる予測対象の予測値は点8A10となり、事後観測される実際の予測対象との値との差が減少する。
【0096】
以上のように本実施において、因子それぞれの計測時点の差に起因する因子それぞれの変動量の差異を補正し、加えて因子それぞれの変動量の相関関係に基づいて因子それぞれの変動量を補正し、補正後の変動量が大きい因子に対しては予測対象の予測値を算出する予測モデルへの適合度を変更することで、因子の変動量に起因する予測対象の予測の過大誤差の発生を抑制することが可能となり、よって予測精度を向上させることができる。
【0097】
(2)他の実施の形態
(2-1)因子変動予測部および因子変動評価部の変形例
上記の実施の形態における因子変動予測部251もしくは因子変動評価部252では、因子それぞれの変動量の予測値を算出するモデルを同定する際、因子標本データ352Aおよび因子予測データ353Aから抽出するデータの時間に関する言及は省略したが、前後時刻のデータを同時に用いたモデルの同定および予測処理を行うとしてもよい。より具体的には、例えばある因子Aのある時間断面tにおける変動量の予測値を算出するモデルを同定する際に、時間断面tのデータのみでなく、時間断面t-nあるいは時間断面t+nのデータも用いてモデルの同定を行う。そして同定したモデルに対して予測対象時点τの因子予測データに加えて、τ―nあるいはτ+nの因子予測データも入力することで、因子Aの予測対象時点τの変動量の予測値を算出する。前述の前後時間を決定するnの値は、予め定めた所定の値であってもよいし、例えば交差検定などの手法によって標本から最適な値を算出しても良い。本変形例は、因子の変動量の時間発展をモデル化しており、因子の変動量の時間推移が過去時点の状況に影響を受けている場合、因子の変動量の予測精度が向上し、よって予測対象の予測精度の向上が可能となる。
【0098】
またある因子Aが、GPSデータや交通状況データや鉄道運行状況データなどの緯度経度の2次現平面上に含まれるデータの場合、あるいは気象データのような高度も含めた3次元空間上に含まれるデータの場合、因子Aの変動量の予測値の算出に際してそれら平面や空間上の複数のデータを用いて予測しても良い。より具体的に、例えば因子Aがある地点の気象状況である場合、隣接する他の地点の気象状況のデータを用いて因子Aの変動量を予測するモデルを同定し、因子Aの変動量の予測値を算出してもよい。同一空間上に存在する因子は相互に影響を及ぼすため、空間上の他の因子のデータを用いることで因子の変動量の予測精度が向上し、よって予測対象の予測精度の向上が可能となる。
【0099】
また上記の実施の形態における因子変動予測部251もしくは因子変動評価部252では、因子標本データ352Aに記憶されている各因子の観測データには観測誤差が無いものとして説明したが、各因子の観測データの観測誤差の情報を用いて、各因子の予測値の変動量を予測してもよい。より具体的に、例えば因子が気象のデータである場合、気象の予測データは緯度経度および高度の3次元上に整列された格子点毎に計算される。そして各格子点の初期値は各地の気象観測所の観測データを基に推定された値を用いる。格子点と観測所の空間上の位置は必ずしも一致しておらず、また各格子点の初期値は推定値であることから、誤差が生じる。またGPSなどの移動体データも、GPSの計測データには誤差が生じる。あるいは交通状況や鉄道運行状況のデータも、道路上の走行車両数や、鉄道車両の乗客数などを常に厳密に計測する事は難しく、観測データに誤差が生じる。観測誤差が大きい因子では、因子の予測値を算出するモデルの適合度が悪化する。従って観測データ自体の観測誤差の情報を用いることで、因子の予測値の変動量の予測精度が向上し、予測対象の予測精度の向上が可能となる。
【0100】
また上記の実施の形態では、因子変動予測部251では因子それぞれの予測値の変動量をそれぞれ独立して算出し、因子変動評価部では因子の予測値の変動量の相関に基づいて因子の予測値の変動量を再計算するものとしてそれぞれ独立の処理を行うように説明したが、因子変動予測部251もしくは因子変動評価部252がそれぞれ互いの処理を包含し、一つの処理部として構成してもよい。あるいは因子の予測値の変動量が予め算出されている場合、そのデータを直接因子変動評価部252に入力してもよい。多段の処理を一つとすることで、計算過程において発生する中間出力に生じる誤差の累積の可能性を回避することが可能となるため、最終的な予測精度の安定化に繋がる可能性がある。
【0101】
また上記の実施の形態では、因子変動予測部251もしくは因子変動評価部252は因子の変動量を出力するのみであり、因子の予測値自体には加工を加えないものとして説明したが、因子の変動量が因子の予測値の誤差を意味する場合、因子変動予測部251もしくは因子変動評価部252が出力した因子の変動量を、因子予測データに加算することで、因子の予測値を補正してもよい。予測対象の予測モデルに入力する因子の予測値そのものを補正することで、予測対象の予測値の過大な誤差発生を抑制することが可能となる。
【0102】
また上記の実施の形態では、各因子の相関の時間的な変化について特に言及はしていなかったが、各因子の相関が時間を経て変化する場合であっても適用可能である。例えば数時間後と、数日後と、あるいは各因子のデータが取得される毎に本発明の処理を動作させることで、変化後の因子の相関に基づいた因子の変動を予測するモデルの同定といったフィードバック型の演算を行っても良い。またそれぞれの因子について、計測日時が新しい標本により適合をするように因子の変動を予測するモデルの同定することで、因子の相関の変化により適応したモデルの同定も可能となる。あるいは、因子の相関の変化点を検出し、変化後の標本を選択的に用いたモデル同定を行っても良い。変化点の検出には公知の手法を適用してよく、例えばマルコフレジュームスイッチなどの変化点検出法である。あるいは所定の事前情報に基づいて、相関が変化した後の標本を選択的に用いたモデルの同定を行っても良い。所定の事前情報とは、例えば因子が気象予報データである場合、気象予報データを算出するためのモデルが変更される事前通知などである。
【0103】
また上記の実施の形態では、因子変動予測部251では因子それぞれの予測値の変動量の値を出力するとして説明したが、これに限らず、因子の変動量の程度を示すラベル値、あるいは因子の変動量を特徴付ける特徴量の値や配列、あるいは行列であってもよい。具体的には、因子を気象とした場合、対象範囲内の気温や湿度といった気象データの分布をいくつかのパターンに分類したうちの対応するパターンのパターン番号であってもよい。あるいは各気象データパターンの平均値、あるいは各気象データパターンの特徴量の値、ベクトル、行列であってもよい。なお因子をパターンに分類する処理では、公知の手法を用いて良い。公知の手法とは、例えばウォード方などの階層型やk-meansや自己組織化マップなどの非階層型といったクラスタリング手法、あるいはSVM(Support Vector Machine)などの分離境界学習型の手法などである。因子の予測値の変動量に対応するパターン化された情報を用いることで、因子の予測値の変動量という値のみでは説明が難しい変動の説明が可能となり、結果として予測対象の予測値の過大な誤差発生を抑制することが可能となる。
【0104】
(2-2)予測モデル切換部の変形例
上記の実施の形態における予測モデル切換部253では、因子変動評価部252が算出した各因子の変動量の予測値に応じて予測対象の予測値を算出するモデルにおける各因子への適合度を調整する際、調整前での各因子の適合度は全因子で等しいとして説明したが、これに限らず、調整前の時点で各因子の適合度は異なっていても良い。より具体的には、予測対象の値の変化に対する因子の影響度を予測対象標本データ351Aと因子標本データ352Aを用いて予め算出し、算出した値を各因子への適合度として予め設定する。そして因子変動評価部252が算出した各因子の変動量の予測値に応じて、前述の予め設定した適合度を調整することで最終的な適合度を算出する。予め設定する適合度である各因子の予測対象に対する影響度合いを示す指標値は、公知の手法を用いて算出してよい。公知の手法とは、例えばランダムフォレストなどの回帰木を用いた因子毎の重要度推定、ガウス過程回帰などのカーネル関数を用いた手法におけるARD(automatic relevance determination)カーネルを用いた各因子の重要度推定などである。因子変動評価部252が算出した因子の変動量にのみに基づいて各因子の適合度を調整した場合、本来は予測対象に強い影響を与える因子の適合度を過剰に減じてしまう場合があり、この場合、この因子の予測値が仮に正確であった場合に、結果的に予測対象の予測値に過大な誤差が生じてしまう。従って予測対象に強い影響を与える因子に対しては強い適合度合いを設定し、この適合度を調整するようにすることで、予測対象の予測精度の悪化を抑制することが出来る。
【0105】
また上記の予め設定する各因子の予測対象に対する影響度合いを示す指標値の算出では、ある時刻の予測対象に値に対し、当該時刻も含めた過去の時間の因子標本データ352Aを用いて算出しても良い。例えばある時刻tにおける予測対象の値に対する因子Aの影響度合いを算出する際、因子Aの時刻tのデータのみでなく、時刻t-nのデータも併用する。さかのぼる時間を調整するnは予め設定した値でも良いし、交差検定などで事前に調整した値であってもよい。例えば予測対象が電力需要であり、また因子Aが外気温である場合、外気温の時間変化に対して屋内室温の変化には時間遅れが生じるため、電力需要にも時間遅れが生じる。従って過去の時刻に遡って影響度合いを示す指標値を算出することで、上記の因子の値の時間変化に対する予測対象の値の時間変化の遅れをモデルに組み込む個とが可能となり、予測対象の予測の精度を向上させることが可能となる。
【0106】
また上記の実施の形態における予測モデル切換部253では、予測対象の値を構成する計測データ数について言及はしなかったが、予測対象の値が複数の計測データの合算値として構成される場合、計測値の時間推移が類似する計測データをグループとして事前に分類し、各グループごとに本発明を適用し予測処理を行っても良い。予測対象の値が複数の計測データの合算値として構成されるデータとは、例えばスマートメータなどの電力消費建屋ごとのデータや、電気自動車の充電ステーション毎のデータなどの合算値で構成される総電力消費量である。また予測対象の時間推移のみでなく、例えば充電ステーション毎の時刻単位の接続有無を示すデータなども含めた複数種類の時間推移データに基づいて分類してもよい。
【0107】
このような処理の概念図を
図10に示す。
図10では、充電ステーションAからEの5つの充電ステーションのデータが予測対象標本データに記憶されているとしている。ここで充電ステーションごとの電力需要(すなわち電気自動車への充電)の時間推移のデータはそれぞれグラフ10A1から10E1に示されている。加えて、各充電ステーションでの電気自動車のプラグ接続有無の時間推移が、グラフ10A2から10E2に示されている。例えば充電ステーションAにおけるグラフ10A1では、図示する期間のうちに4回の電力需要が発生しており、またそれぞれの時間において10A2に示す様に電気自動車が接続されている。また充電ステーションCの電力需要のグラフ10C1では、図示の期間の後半に一定期間にわたって電力需要が発生しているとともに、グラフ10C2に示す様にその期間で電気自動車の接続がなされている。なおグラフ10C2において期間冒頭にも接続を示す値が示されている一方で、グラフ10C1の当該電力需要はゼロを示している。これは充電ステーションCに電気自動車が接続されているものの、充電はしていないことを意味している。
【0108】
これら各充電ステーションの充放電を示す電力需要データと電気自動車の接続有無を示す接続信号データを用いて、時間推移の傾向が類似する充電ステーションを分類した結果を、
図10の右側に示している。ここでは3つのグループに分類されたことを示しており、充放電データと接続信号データの時間推移が両方とも類似する充電ステーション同士が分類されている。例えば充電ステーショングループ3には充電ステーションBのみが分類されている。これは充放電の時間推移は充電ステーションCとDに類似するものの、接続信号の時間推移が非類似していることから、充電ステーションCとDとは同じグループに分類されなかったためである。なお分類の処理は公知の手法を用いて良い。公知の手法とは、例えばウォード方などの階層型やk-meansや自己組織化マップなどの非階層型といったクラスタリング手法、あるいはSVM(Support Vector Machine)などの分離境界学習型の手法などである。
【0109】
前述の様に充電ステーション毎の消費電力および電気自動車の接続有無の時間推移の傾向が類似する充電ステーション分類することで、各充電ステーションの電力需要の推移をより正確にモデル化する事が可能となり、あるいは電気自動車を用いたデマンドレスポンスやVPP(Virtual Power Plant)の制御・実行において、各充電ステーションが供出可能な調整量も正確に予測することも可能となる。さらに本発明を適用することで、予測の過大誤差の発生を抑制することが可能となる。
【0110】
また上記の実施の形態における予測モデル切換部253では予測対象の種類について特に言及はしなかったが、例えば予測対象が電力需要である場合、因子としては暦日データや気象データの他に、列車の乗車率、乗車客数、予約席数などの鉄道情報や、道路の平均移動速度などの道路交通情報を用いても良い。電力需要は気温のみならず人口動態にも依存するため、人口動態をより的確に捉えることで電力需要の予測精度を向上することが可能となる。
【0111】
また予測対象が電力需要である場合、電力需要の時間推移を例えば周波数成分などの要因に分解し、各要因を予測対象として本発明を適用しても良い。電力需要は気象や人口動態など複数の要因に影響を受ける。ただし気象の変化に対して、建物内部の室温変化は時間遅れが存在するため、電力需要にも時間遅れが生じる。周波数成分などの要因に分解することで、これらをより的確に捉えることが可能となる。
【0112】
さらに上記の実施の形態においては、変動量が大きい因子に対する適合度を減じるように予測モデルを切替える(補正する)際、予測モデル内の因子の適合度を調整する係数であるパラメータwの値が極めて小さい因子に対する対策については特に言及しなかったが、そのような因子(パラメータwの値がある閾値未満の因子)についてはかかるパラメータwの値を「0」に上書き設定するようにしてもよい。このようにパラメータwの値を「0」に設定することは、予測対象の予測値の演算からその因子の影響を排除したこと(つまり、かかる演算に因子の予測データを利用しないこと)と等価となるため、その因子に起因するノイズが演算結果に発生することを防止することができ、予測精度を向上させることができる。また変動量が大きい(例えば、既定の閾値以上)因子のパラメータwの値を始めから「0」に設定するようにしてもよく、このようにしても同様の効果を得ることができる。
【0113】
また上記の実施の形態においては、予測対象の予測値を算出するモデルの同定において用いる因子標本データには実際に計測された値を用いる場合についてについて述べたが、これに限らず、所定の計算モデルに基づいて算出した理論値であってもよく、さらには計測値と理論値を併用してもよい。例えば陸上や海上であって、計測機器が設置されていない、もしくは設置困難な場所や高度における気温、湿度、日射量、風速、気圧、地表面温度について、気象の時間発展を計算するためのモデルに基づいて計算した理論値を用いても良い。一般にこれら理論値は計測値より情報の量が多いため、予測対象の予測値を算出するモデルをより精緻化することが出来、結果、予測精度を向上することが可能となる。
【0114】
さらに上記の実施の形態においては、予測モデル変換部253が変動量が大きい因子に対する適合度を減じるように予測モデルを切り替えるようにした場合について述べたが、これに限らず、状況に応じて当該適合度を増加させるように予測モデルを切り替えるようにしてもよい。具体的には、予測値の変動量に応じて、予測モデルにおける対応する係数の値を変更するようにして増減させるようにして予測モデルを調整すればよい。
【0115】
(2-3)電力分野に適用した場合の実施の形態
本発明の電力分野への適用例を
図1との対応部分に同一符号を付した
図11に示す。
図11は電力分野に適用した場合の主要な装置の構成を示している。
図11では具体的な制御設備として、発電機5A2、電気自動車5B2、充電ステーション5C2を示している。これら設備の電力消費量を、電力量計測装置6A1、6B1、6C1でそれぞれ計測する。計測されたデータは、ネットワーク8を介して、本発明のデータ予測システム12におけるデータ管理装置3に送信される。
【0116】
一方、気象観測装置6D1で計測された気温などの気象情報も、ネットワーク8を経由してデータ管理装置3に送信される。加えて、気象予報情報は気象予報配信装置7Aからネットワーク8を経由してデータ管理装置3に送信される。また電力系統情報配信装置7Bから、例えば系統の現在の運用状況、あるいは将来の運用情況の見通しなどの、本発明における因子となる情報が、ネットワーク8を経由してデータ管理装置3に送信される。
【0117】
そして本発明のデータ予測システム12における予測演算装置2において、データ管理装置3に送信されたデータを基に予測対象期間における電力需要量の予測値を算出し、計画作成・実行管理装置5に送信する。なおここで算出する電力需要量は、例えば予め設定した複数の需要家の総需要や、あるいは予め設定した特定の需要家もしくは設備の電力需要である。特定の設備の電力需要とは、例えば
図11に示す充電ステーション5C2の電力需要である。計画作成・実行管理装置5は、受信した電力需要の予測値に基づいて、発電機5A2や電気自動車5B2、充電ステーション5C2の運転計画を作成し、それぞれの制御装置5A1、5B1、5C1への制御伝聞の送信として実行する。あるいは電力取引市場における取引計画を作成し、取引市場運用装置9への取引電文送信として実行する。なお発電機5A2の運転計画とは、例えば時間毎の発電機の起動停止の状態値、あるいは出力の値で構成される情報である。また電気自動車5B2や充電ステーション5C2は、例えば時刻毎の充電量の制御量で構成される情報である。
【0118】
本発明を電力分野に適用することで、電力需要の予測における過大誤差の発生を抑制することが可能となり、従って電力システムの安定的な運用を実現することができる。
【産業上の利用可能性】
【0119】
本発明は、例えば電力需要を予測する予測システムに適用することができる。
【符号の説明】
【0120】
1……データ管理システム、2……予測演算装置、3……データ管理装置、4……情報入出力端末、5……計画作成・実行管理装置、6……データ観測装置、7……データ配信装置、8……通信経路。