【文献】
大久保宏樹他,GPU向け汎用計算環境CUDAを用いたk−means法の高速化 Fast Implementation of k-means Method on CUDA Architecture,「先進的計算基盤システムシンポジウム SACSIS 2008」論文集,社団法人情報処理学会,2008年 6月 4日,Vol.2008,No.5,p.97-104
(58)【調査した分野】(Int.Cl.,DB名)
電力予測データの計算対象期間である予測期間と、電力需要データをクラスに分類するための期間であり、前記予測期間より前の時間に位置する分類用期間の入力を受け付ける期間入力部と、
予測対象日当日の前記分類用期間の電力需要データを対象分類用データとして読み込み、予測対象日より過去日の前記分類用期間の電力需要データを過去分類用データとして読み込み、予測対象日より過去日の前記予測期間の電力需要データを過去予測期間データとして読み込むデータ取得部と、
前記対象分類用データおよび前記過去分類用データそれぞれの電力需要データに対して、所定の平均値と所定の標準偏差とを所定の値として正規化演算するデータ標準化部と、
正規化演算された前記対象分類用データおよび前記過去分類用データの電力需要データをもとに、複数のクラスのいずれかに分類するデータ分類部と、
分類された前記過去分類用データのうち、前記対象分類用データと同じクラスの前記過去分類用データを抽出する類似データ抽出部と、
抽出された前記過去分類用データに対応する前記過去予測期間データの統計値を、予測対象日当日の前記予測期間における前記電力予測データである対象予測期間データとして計算するデータ予測部と、
計算した前記対象予測期間データを出力するデータ出力部と、を有することを特徴とする
予測装置。
前記データ分類部は、前記分類用期間分のT個の時系列データである前記対象分類用データおよび前記過去分類用データの電力需要データを、それぞれT次元のベクトル値に変換し、各クラスが属するベクトル値の重心位置と、クラスの分類対象のベクトル値の重心位置とのベクトル距離を計算し、そのベクトル距離が最小距離となる重心位置のクラスを分類対象のベクトル値が属するクラスとして分類することを特徴とする
請求項1に記載の予測装置。
前記データ分類部は、前記分類用期間分のT個の時系列データである前記対象分類用データおよび前記過去分類用データの電力需要データを、それぞれT次元のベクトル値に変換し、各クラスが属するベクトル値の重心位置と、クラスの分類対象のベクトル値の重心位置とのベクトル距離を計算し、そのベクトル距離が最小距離となる重心位置のクラスを分類対象のベクトル値が属するクラスとして分類することを特徴とする
請求項4に記載の予測方法。
【背景技術】
【0002】
環境負荷低減とQoL(quality of life)向上を両立するスマートシティの開発が米国、欧州、中国など世界中で進められている。日本では、東日本大震災を経て、エコ、QoL、レジリエントを実現する新たな形の街として被災地や都市にスマートシティを構築する動きがある。
スマートシティとは、エネルギーの利用や地域の交通システムなどを都市単位で変革する次世代の社会システムであり、特に、スマートグリッド(次世代送電網)によって、電力の流れをきめ細かく制御することが実現される。
【0003】
スマートグリッドでは、エコやレジリエントを実現するため、既存の系統電力だけではなくメガソーラや風力発電設備で発電された再生可能エネルギーが供給源として活用される。また、需要家側でもソーラーパネルや蓄電池、EV(Electric Vehicle)などが設置され、電力の自家消費や余剰電力の融通(売電)が実施される。
スマートグリッドの管理会社は、電力供給源が分散化され、出力が不安定な発電がエネルギーインフラに組み込まれたときに、管轄内における発電種別ごとの供給可能量や需要家の電力需要をつぶさに把握しながら、安定的かつ経済的な電力供給計画を立案する必要がある。
【0004】
この電力供給計画は、管内の電力需要データや供給可能データを分単位で逐次収集しながら、状況の変化に合わせて立案・修正されていく。そのため、データを逐次収集しながら高精度の需要予測値、および発電量予測値を計算することが求められる。
【0005】
以下、従来の電力需要予測システムを列挙する。
特許文献1には、過去の気温や湿度などの気象実績と電力需要との間に線形な相関関係が成立することを前提として、過去の気温実績を説明変数として電力需要を算出する重回帰モデルの予測式が記載されている。
特許文献2には、気象や暦から予測した電力負荷の予測値に対して、過去の類似電力負荷データを用いて、予測値を修正するシステムが記載されている。
特許文献3には、「当日補正モード」として、予測対象日当日の例えば朝方から当該予測対象時刻以前の所定の時刻までの需要実績データを入力データとして、予測対象日当日の需要予測処理を実行するシステムが記載されている。
【発明を実施するための形態】
【0013】
以下、本発明の一実施形態を、図面を参照して詳細に説明する。
【0014】
図1は、本実施形態の予測処理の概要を示すグラフである。以下、
図1を参照しつつ、いくつかの用語を定義する。
図1(a)、
図1(b)、および、
図1(c)は、それぞれ横軸を時刻、縦軸を電力需要量とする時系列グラフである。この時系列グラフにおいて、現在時刻(
図1(a)の9/9 9:00)までの電力需要量は、過去の実績値であり、グラフでは実線で示している。一方、これからの時刻(
図1(a)の9/9 10:00以降)の電力需要量は、本実施形態の予測処理により算出される予測値であり、グラフでは破線で示している。
【0015】
図1(a)に示す対象データ70は、現在時刻(9/9 9:00)を境界として、対象分類用データ71と、対象予測期間データ72とが時刻の順に並んでいる。対象分類用データ71の期間の長さを分類用期間(T)とし、対象予測期間データ72の期間の長さを予測期間(F)とする。
対象分類用データ71は、対象データ70の前部に位置する予測対象日当日の電力需要量の実績値である。対象分類用データ71は、対象データ70と他のデータとの類似判定に用いる「クラス」の計算用に使用される。
対象予測期間データ72は、対象データ70の後部に位置する予測対象日当日の電力需要量の予測値である。この対象予測期間データ72を高精度に求めて出力することが、本実施形態の主な目的である。
【0016】
図1(b)や
図1(c)に示す過去データ80は、対象データ70と同様に、現在時刻と同時刻(9:00)である過去日の時刻を境界として、分類用期間(T)の前部(過去分類用データ81)と、予測期間(F)の後部(過去予測期間データ82)とにより構成される。
過去分類用データ81は、対象分類用データ71と同様に、「クラス」の計算用に使用される。
図1(b)の過去分類用データ81から「クラス=1」が計算され、
図1(c)の過去分類用データ81から「クラス=7」が計算される。
過去予測期間データ82は、対象予測期間データ72の計算用に使用されるが、対象予測期間データ72とは異なり、電力需要量の実績値である。
【0017】
対象データ70と過去データ80との類似判定は、分類用期間(T)から計算されるクラスの一致不一致により判定される。
まず、
図1(a)の対象データ70のクラス=1と、
図1(b)の過去データ80のクラス=1とが一致するので、
図1(a)の対象データ70と、
図1(b)の過去データ80とが類似関係にあると判定される。ここで、対象データ70と類似関係にある過去データ80を、類似データ90と呼ぶ。つまり、過去データ80の集合から、類似データ90の集合へと、クラスによって候補が絞り込まれる。類似データ90内の分類用期間(T)のデータを「類似分類用データ91」とし、類似データ90内の予測期間(F)のデータを「類似予測期間データ92」とする。
そして、対象予測期間データ72は、1つ以上の類似予測期間データ92の統計値(平均値、中央値など)として計算される。
【0018】
一方、
図1(a)の対象データ70のクラス=1と、
図1(c)の過去データ80のクラス=7とが不一致であるので、
図1(a)の対象データ70と、
図1(c)の過去データ80とが類似関係には無いと判定される。
図1(c)の過去予測期間データ82は、対象予測期間データ72の計算用データからは除外される。
【0019】
図2は、予測装置1を示す構成図である。予測装置1は、制御部(CPU:Central Processing Unit)、記憶部(メモリ、ハードディスクなど)、および、通信部(ネットワークインタフェース)を備えるコンピュータとして構成される。
予測装置1は、電力需要データベース12内の電力需要量の実績値をもとに、
図1で示したように、予測期間(F)の電力需要量の予測値(対象予測期間データ72)を計算する。
予測装置1は、期間入力部11と、電力需要データベース12と、データ取得部13と、第1格納部21と、データ標準化部22と、データ分類部23と、第2格納部31と、類似データ抽出部32と、データ予測部33と、第3格納部41と、データ出力部42とを含めて構成される。
【0020】
期間入力部11は、
図1で示した計算用パラメータとして、分類用期間(T)と予測期間(F)をユーザに入力させる。なお、期間入力部11は、ユーザに直接入力された期間値を用いる代わりに、過去に入力された期間値の履歴を読み出して用いてもよい。
【0021】
電力需要データベース12は、電力需要量の実績値(過去データ80、対象分類用データ71)を格納するデータベースである。さらに、電力需要データベース12は、電力需要量の予測値(対象予測期間データ72)を格納してもよい。
以下、電力需要データベース12には、現在時刻(9/9 9:00)までの電力需要量が1時間単位で収集されている例で説明するが、電力需要量の分解能は他の分解能(1分単位など)であってもよいし、電力需要量の収集期間は任意(例えば、過去3年間)であってもよい。
さらに、電力需要量の収集処理について、スマートシティのエネルギー管理会社(電力会社でもよい)が過去に提供した電力供給量を電力需要量とみなしてもよいし、電力計などにより消費者から収集した実際の電力消費量を電力需要量とみなしてもよい。
【0022】
データ取得部13は、分類用期間(T)と予測期間(F)とをもとに、電力需要データベース12から対象データ70(1つの対象分類用データ71)と、N個の(N日分の)過去データ80を取得し、第1格納部21に格納する(詳細は、
図3(a)で後記)。なお、
図1では、1つの対象データ70と、2つの過去データ80とをそれぞれ取得する例を示した。
【0023】
データ標準化部22は、第1格納部21に格納された分類用期間(T)のデータ(対象分類用データ71、過去分類用データ81)について、それぞれ所定の平均値(例えば、「0」)と所定の標準偏差(例えば、「1」)になるように標準化する。
ここでの標準化は、正規化(normalization)とも呼ばれ、例えば、標準化前のデータを入力として、所定の平均値と所定の標準偏差とになるようなZ変換の関数を計算することにより実現される。
換言すると、データ標準化部22は、第1格納部21に格納された分類用期間(T)のデータに対して、所定の平均値と所定の標準偏差とを所定の値として正規化演算する。
この標準化処理により、平休や季節による電力需要の多寡の影響を取り除くことができ、電力需要傾向が類似する分類用期間(T)のデータ群を互いに類似する(同じクラスに属する)ものとして扱うヒット率を向上させることができる。
【0024】
データ分類部23は、データ標準化部22により標準化された分類用期間(T)のデータについて、データの変動パターンが類似するもの同士でグルーピング(クラス分け)する。グルーピング処理は、例えば、k-means法、k-means++法、Kernel k-means法、学習ベクトル量子化法などの手法を用いることができる。
第2格納部31は、第1格納部21に格納されたデータに対して、データ標準化部22により標準化処理がなされ、データ分類部23によりクラスが割り当てられたデータを格納する(詳細は、
図3(b)で後記)。
【0025】
類似データ抽出部32は、第2格納部31内の各過去分類用データ81のうち、対象分類用データ71と同じクラスに属するM個の(N≧M)過去分類用データ81を類似分類用データ91として抽出する。そして、抽出された類似分類用データ91が含まれる類似データ90を抽出する。
データ予測部33は、類似データ抽出部32により抽出されたM個の類似データ90内の類似予測期間データ92から、対象予測期間データ72を計算する。対象予測期間データ72の計算では、例えば、1つ以上の類似予測期間データ92の平均値を予測値とし、1つ以上の類似予測期間データ92の標準偏差から求まる平均値からのバラツキ度合いを予測期間における予測値の信頼区間とする。
第3格納部41は、データ予測部33により計算された対象予測期間データ72を格納する。データ出力部42は、第3格納部41の対象予測期間データ72(予測値、予測値の信頼区間)を、図示しない表示装置に表示するとともに、電力需要データベース12にデータ出力する。
【0026】
図3(a)は、第1格納部21に格納されているデータを示す。この例では、分類用期間(T)=24点(24時間)とし、予測期間(F)=14点(14時間)とする。第1格納部21には、対象データ70や過去データ80ごとに割り当てられるデータ番号と、分類用期間(T)のデータ(対象分類用データ71、過去分類用データ81)における各時刻の需要量と、予測期間(F)のデータ(対象予測期間データ72、過去予測期間データ82)における各時刻の需要量または予測量とが対応付けられている。なお、需要量または予測量のセルには、セル上部の時刻(例えば「9/8 10:00」)と、セル下部の需要量または予測量(例えば「977[万kW]」)とが対応付けて記載される。
データ取得部13は、対象データ70や過去データ80を電力需要データベース12から読み込むたびに、重複しないようにデータ番号を採番する。例えば、対象データ70の(i−1)日前の過去データ80には、i番のデータ番号が採番される。
【0027】
図3(b)は、第2格納部31に格納されているデータを示す。第2格納部31では、第1格納部21のデータから、データ分類部23により割り当てられたクラスが付加されている。なお、第2格納部31の分類用期間(T)内の各需要量の数値は、データ標準化部22により標準化処理がなされている。
【0028】
図4(a)は、データ予測部33による対象予測期間データ72の計算処理を示す説明図である。まず、
図4(a)の表は、第2格納部31に格納されているデータのうち、類似データ抽出部32によって「クラス=1」のレコードだけ抽出されている。次に、データ予測部33は、類似データ90の類似予測期間データ92を読み込み、その統計値を計算して、対象予測期間データ72へと書き出す。
【0029】
図4(b)は、第3格納部41に格納されているデータを示す。電力需要データベース12には、現在時刻(9/9 9:00)までの需要量の実績値に加え、データ出力部42によって出力された第3格納部41のデータ内容(予測値とその信頼区間である予測値上限〜予測値下限)が格納されている。
【0030】
例えば、各時点iの予測値D[i]が正規分布することを仮定した場合、95%の信頼区間の計算式は、例えば、以下の通りである。
カウンタ変数iを、1からFまで1つずつ増加させる
i番目の信頼上限値=D[i] + 1.96 × S[i]
i番目の信頼下限値=D[i] - 1.96 × S[i]
ただし、S[i]は、予測期間(F)に応じて設定される所定の係数であり、例えば、変数iが大きくなるほど単調増加する係数である。
【0031】
図5は、データ標準化部22の分類用期間(T)の期間データに対する標準化処理を示すフローチャートである。
S101〜S106として、データ標準化部22は、N+1個の分類用期間(T)の期間データを、選択期間データとして1つずつ順に選択するループを実行する。
S102として、データ標準化部22は、S101の選択期間データの平均値μ、および、選択期間データの標準偏差σを計算する。
S103〜S105として、データ標準化部22は、S101の選択期間データの1時点データ(ある1つの時刻における需要量を示すデータ)を、D[i](i=1〜T)として順に選択するループを実行する。
S104として、データ標準化部22は、S103で選択されたD[i]を、計算式「D[i]=(D[i]−μ)/σ」により標準化する。
【0032】
図6は、データ分類部23のk-means法を用いた分類処理を示すフローチャートである。
S201として、データ分類部23は、K個のクラスを初期化する。具体的には、各クラスkの重心C[k]の初期値として、r番目(rは、1〜N+1のいずれかの乱数値)の分類用データを示すベクトル値V[r]を代入する。なお、各分類用データは、分類用期間(T)分の需要量データ(時系列に並ぶT個の需要量データ)から構成されており、これらのT個のデータをT次元空間内の1つのベクトル値に変換しておく。
【0033】
S202〜S208として、データ分類部23は、N+1個の分類用データを選択分類用データとして、1つずつ順に選択(n=1〜N+1)するループを実行する。つまり、n回目のループ実行時に、n番目の分類用データが選択される。
S203〜S206として、データ分類部23は、K個のクラスを選択クラスとして、1つずつ順に選択(k=1〜K)するループを実行する。つまり、k回目のループ実行時に、k番目のクラスが選択される。
S204として、データ分類部23は、C[k]とV[n]とのベクトル距離を計算する。
S205として、データ分類部23は、計算したベクトル距離が最小距離なら、クラスkを所属クラスとして保持する。このS205を実行するために、S203において、あらかじめ最小距離を充分に大きい値(∞など)とし、所属クラスを「なし」に初期化しておく。
【0034】
S207として、データ分類部23は、n番目の選択分類用データを、保持された所属クラスkに割り当てる。
S209として、データ分類部23は、各クラスkの重心C[k](k=1〜K)を再計算する。重心C[k]は、クラスkに属する各分類用データのベクトルV[]から計算できる。
S210として、データ分類部23は、重心C[k]がS209の再計算によって変更されたか否かを判定し、変更されたときには、処理をS202に戻す。
【0035】
以上説明した
図6のk-means法は、初期重心Cjの選び方によって最終的な分類結果が大きく変わるため、得られる予測値も分類処理のたびに大きく変わる可能性がある。そこで、データ分類部23は、分類結果のバラツキを抑えるために初期重心Cjの選び方を工夫したk-means++法などを用いることもできる。
また、k-means法による分類は重心間線分を垂直2等分線した線形分離となるため、超平面で分類できない時系列データに対しては正しい分類ができなくなる。このような場合には、データ分類部23は、カーネル関数と呼ばれる関数で分類対象の時系列データを変換し、変換後のデータをk-means法で分類するなどの方法を用いることもできる。
【0036】
また、クラスタリング手法は対象とするデータ量が増大すればするほど計算時間がかかる。データを分単位で逐次収集しながら需要を予測し、状況の変化に合わせて供給計画を修正していくためにはクラスタリング処理を短時間で実行する必要がある。
そのため、データ分類部23は、MapReduceなどの分散処理フレームワークを用いてクラスタリング処理を並列化してもよい。
図6のフローチャートでは、外側のループ(S202〜S208)は、並列化処理が可能である。
なお、MapReduceとは、処理対象の1つのデータを1つのkeyに対応付ける「Map」処理と、複数の同一keyを集約することでデータを減らす「Reduce」処理とを並列化するアルゴリズムである。本実施形態では、クラスが「Map」処理におけるkeyに該当する。
【0037】
図7は、データ予測部33の処理を示すフローチャートである。
S301として、データ予測部33は、対象予測期間データ72を格納する配列E[i](i=1〜F)を、代入値「0」で初期化する。
S302〜S307として、データ予測部33は、M個の類似データ90を選択類似データとして、1つずつ順に選択する。
S303として、データ予測部33は、S302の選択類似データの類似予測期間データ92を取得する。
S304〜S306として、データ予測部33は、S303の類似予測期間データ92の1時点データをD[i](i=1〜F)として、1つずつ順に選択する。
S305として、データ予測部33は、計算式「E[i]=E[i]+D[i]/M」により、E[i]にD[i]成分を反映する。
【0038】
以上説明した本実施形態では、予測装置1が電力需要データベース12内の過去の需要実績データである過去データ80を用いて、予測対象日当日の需要予測値(対象予測期間データ72)を計算する。ここで、対象分類用データ71と、過去分類用データ81との類似判定を類似データ抽出部32が実行する前に、データ標準化部22が各分類用データに対して標準化処理を行うことにより、平休や季節による電力需要の多寡の影響を取り除くことができ、類似判定のヒット率を向上させることができる。
そのため、データ予測部33は、ヒットした多くの類似予測期間データ92をもとに、予測対象日当日の需要予測を高精度に求めることができる。
【0039】
一方、特許文献1では過去の需要実績データを用いていないが、特許文献2,3では、予測対象日当日の需要予測の入力パラメータとして、電力需要傾向が類似する過去の需要実績データを用いている。ここで、季節の変化や毎年の気候の変化などにより、電力需要傾向が類似する過去の需要実績データが容易に検索されないこともある。そのため、過去の需要実績データとして大量の履歴データを用意する必要があり、高精度な予測値を出力するためにかかるコストが大きくなってしまっている。
【0040】
なお、本発明は前記した実施例に限定されるものではなく、様々な変形例が含まれる。例えば、前記した実施例は本発明を分かりやすく説明するために詳細に説明したものであり、必ずしも説明した全ての構成を備えるものに限定されるものではない。
また、ある実施例の構成の一部を他の実施例の構成に置き換えることが可能であり、また、ある実施例の構成に他の実施例の構成を加えることも可能である。
また、各実施例の構成の一部について、他の構成の追加・削除・置換をすることが可能である。また、上記の各構成、機能、処理部、処理手段などは、それらの一部または全部を、例えば集積回路で設計するなどによりハードウェアで実現してもよい。
また、前記の各構成、機能などは、プロセッサがそれぞれの機能を実現するプログラムを解釈し、実行することによりソフトウェアで実現してもよい。
【0041】
各機能を実現するプログラム、テーブル、ファイルなどの情報は、メモリや、ハードディスク、SSD(Solid State Drive)などの記録装置、または、IC(Integrated Circuit)カード、SDカード、DVDなどの記録媒体に置くことができる。
また、制御線や情報線は説明上必要と考えられるものを示しており、製品上必ずしも全ての制御線や情報線を示しているとは限らない。実際にはほとんど全ての構成が相互に接続されていると考えてもよい。