特開2024-140883 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日新電機株式会社の特許一覧 ▶ 国立大学法人京都工芸繊維大学の特許一覧

特開2024-140883モデル生成装置、予測装置、モデル生成方法、および予測方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2024140883

(43)【公開日】2024-10-10

(54)【発明の名称】モデル生成装置、予測装置、モデル生成方法、および予測方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20241003BHJP

G06F 17/15 20060101ALI20241003BHJP

【ＦＩ】

G06N20/00

G06F17/15

【審査請求】未請求

【請求項の数】10

【出願形態】ＯＬ

(21)【出願番号】P 2023052243

(22)【出願日】2023-03-28

(71)【出願人】

【識別番号】000003942

【氏名又は名称】日新電機株式会社

(71)【出願人】

【識別番号】504255685

【氏名又は名称】国立大学法人京都工芸繊維大学

(74)【代理人】

【識別番号】110000338

【氏名又は名称】弁理士法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】森本充

(72)【発明者】

【氏名】竹原輝巳

(72)【発明者】

【氏名】角田あかり

(72)【発明者】

【氏名】井尻有策

(72)【発明者】

【氏名】寶珍輝尚

【テーマコード（参考）】

5B056

【Ｆターム（参考）】

5B056BB22

(57)【要約】

【課題】施設における需要電力量の予測精度を高める。
【解決手段】モデル生成装置（１０）は、施設における需要電力量の実績値の時間推移を示す時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数を導出し、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグを選択し、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量を導出し、上記新たな特徴量が追加された上記時系列データに基づいて、上記施設における需要電力量を予測するための予測モデルを機械学習によって生成する。
【選択図】図１

【特許請求の範囲】

【請求項1】

施設における需要電力量を予測するための予測モデルを生成するモデル生成装置であって、
上記モデル生成装置は、
上記需要電力量の実績値の時間推移を示す時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数を導出し、
上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグを選択し、
上記特殊ラグを上記実績値に対して設定することにより新たな特徴量を導出し、
上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルを生成する、モデル生成装置。

【請求項2】

上記モデル生成装置は、複数の上記ラグの内、時間長閾値以上の値を有するラグであって、自己相関閾値以上の値を有する上記自己相関係数に対応するラグを、上記特殊ラグとして選択する、請求項１に記載のモデル生成装置。

【請求項3】

上記モデル生成装置は、
複数の上記ラグの内、上記ラグと上記自己相関係数との関係を示すデータ系列における上記自己相関係数の極大値に対応するラグを、特殊ラグ候補として選択し、
上記特殊ラグ候補の内、時間長閾値以上の値を有するラグであって、自己相関閾値以上の値を有する上記自己相関係数に対応するラグを、特殊ラグとして選択する、請求項１に記載のモデル生成装置。

【請求項4】

上記自己相関閾値は、０．７以上かつ１以下の値である、請求項２に記載のモデル生成装置。

【請求項5】

上記モデル生成装置は、
複数の上記特殊ラグが昇順にソートされた配列において、等差数列を成す複数の上記特殊ラグをローリングラグとして選択し、
上記ローリングラグを上記実績値に対して設定することにより、上記新たな特徴量としてローリング特徴量を導出する、請求項２に記載のモデル生成装置。

【請求項6】

上記モデル生成装置は、
上記配列における上記ローリングラグを除いた上記特殊ラグを非ローリングラグとして選択し、
上記非ローリングラグを上記実績値に対して設定することにより、上記新たな特徴量としてラグ特徴量を導出する、請求項５に記載のモデル生成装置。

【請求項7】

上記新たな特徴量が追加された上記時系列データは、上記施設における日毎の就業状態を示すデータをさらに含んでいる、請求項１に記載のモデル生成装置。

【請求項8】

学習フェーズにおいて予め生成された、施設における需要電力量を予測するための予測モデルを予測フェーズにおいて用いることにより、上記需要電力量の予測値を導出する予測装置であって、
上記学習フェーズでは、
上記需要電力量の実績値の時間推移を示す上記学習フェーズにおける時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数が導出されており、
上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグが選択されており、
上記特殊ラグを上記実績値に対して設定することにより新たな特徴量が導出されており、
上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルが生成されており、
上記予測装置は、
上記実績値の時間推移を示す上記予測フェーズにおける時系列データについて、上記特殊ラグを上記予測フェーズにおける上記実績値に対して設定することにより、上記予測フェーズにおける新たな特徴量を導出し、
上記予測フェーズにおける上記新たな特徴量が追加された、上記予測フェーズにおける上記時系列データに基づいて、上記予測値を上記予測モデルに出力させる、予測装置。

【請求項9】

施設における需要電力量を予測するための予測モデルを生成するモデル生成方法であって、
上記施設における需要電力量の実績値の時間推移を示す時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれについて上記実績値の自己相関係数を導出する工程と、
上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグを選択する工程と、
上記特殊ラグを上記実績値に対して設定することにより新たな特徴量を導出する工程と、
上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルを生成する工程と、を含んでいる、モデル生成方法。

【請求項10】

学習フェーズにおいて予め生成された、施設における需要電力量を予測するための予測モデルを予測フェーズにおいて用いることにより、上記需要電力量の予測値を導出する予測方法であって、
上記学習フェーズでは、
上記需要電力量の実績値の時間推移を示す上記学習フェーズにおける時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数が導出されており、
上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグが選択されており、
上記特殊ラグを上記実績値に対して設定することにより新たな特徴量が導出されており、
上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルが生成されており、
上記予測方法は、
上記実績値の時間推移を示す上記予測フェーズにおける時系列データについて、上記特殊ラグを上記予測フェーズにおける上記実績値に対して設定することにより、上記予測フェーズにおける新たな特徴量を導出する工程と、
上記予測フェーズにおける上記新たな特徴量が追加された、上記予測フェーズにおける上記時系列データに基づいて、上記予測値を上記予測モデルに出力させる工程と、を含んでいる、予測方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明の一態様は、施設における需要電力量を予測するための予測モデルを生成するモデル生成装置に関する。

【背景技術】

【0002】

近年、施設における様々な種類のエネルギー需要量を予測するために機械学習が利用されている。例えば、下記の特許文献１には、蓄熱利用システムにおける熱負荷を、ニューラルネットワークによって予測する技術が開示されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】特開平９－８９３４８号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

本発明の一態様は、施設における需要電力量の予測精度を高めることを目的とする。

【課題を解決するための手段】

【0005】

上記の課題を解決するために、本発明の一態様に係るモデル生成装置は、施設における需要電力量を予測するための予測モデルを生成するモデル生成装置であって、上記モデル生成装置は、上記需要電力量の実績値の時間推移を示す時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数を導出し、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグを選択し、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量を導出し、上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルを生成する。

【0006】

また、本発明の一態様に係る予測装置は、学習フェーズにおいて予め生成された、施設における需要電力量を予測するための予測モデルを予測フェーズにおいて用いることにより、上記需要電力量の予測値を導出する予測装置であって、上記学習フェーズでは、上記需要電力量の実績値の時間推移を示す上記学習フェーズにおける時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数が導出されており、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグが選択されており、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量が導出されており、上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルが生成されており、上記予測装置は、上記実績値の時間推移を示す上記予測フェーズにおける時系列データについて、上記特殊ラグを上記予測フェーズにおける上記実績値に対して設定することにより、上記予測フェーズにおける新たな特徴量を導出し、上記予測フェーズにおける上記新たな特徴量が追加された、上記予測フェーズにおける上記時系列データに基づいて、上記予測値を上記予測モデルに出力させる。

【0007】

また、本発明の一態様に係るモデル生成方法は、施設における需要電力量を予測するための予測モデルを生成するモデル生成方法であって、上記施設における需要電力量の実績値の時間推移を示す時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれについて上記実績値の自己相関係数を導出する工程と、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグを選択する工程と、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量を導出する工程と、上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルを生成する工程と、を含んでいる。

【0008】

また、本発明の一態様に係る予測方法は、学習フェーズにおいて予め生成された、施設における需要電力量を予測するための予測モデルを予測フェーズにおいて用いることにより、上記需要電力量の予測値を導出する予測方法であって、上記学習フェーズでは、上記需要電力量の実績値の時間推移を示す上記学習フェーズにおける時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数が導出されており、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグが選択されており、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量が導出されており、上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルが生成されており、上記予測方法は、上記実績値の時間推移を示す上記予測フェーズにおける時系列データについて、上記特殊ラグを上記予測フェーズにおける上記実績値に対して設定することにより、上記予測フェーズにおける新たな特徴量を導出する工程と、上記予測フェーズにおける上記新たな特徴量が追加された、上記予測フェーズにおける上記時系列データに基づいて、上記予測値を上記予測モデルに出力させる工程と、を含んでいる。

【発明の効果】

【0009】

本発明の一態様によれば、施設における需要電力量の予測精度を高めることができる。

【図面の簡単な説明】

【0010】

【図1】実施形態１における情報処理装置の要部の構成を例示するブロック図である。

【図2】訓練データとしての実績データの例である。

【図3】訓練データとしての就業日データの例である。

【図4】図３の就業日データに前置補間を施すことによって生成されたデータの例である。

【図5】図２の実績データと図４のデータとを組み合わせることによって生成されたデータの例である。

【図6】ラグとＡＣとの対応関係を示すテーブルの例である。

【図7】ラグとＡＣとの関係を示すグラフの例である。

【図8】図５のデータにラグ特徴量を追加することによって生成されたデータの例である。

【図9】図８のデータにローリング特徴量コンポーネントとローリング特徴量とを追加することによって生成されたデータの例である。

【図10】図９のデータからローリング特徴量コンポーネントを削除することによって生成されたデータの例である。

【図11】図１０のデータに時点相当量を追加することによって生成されたデータの例である。

【図12】図１１のデータに曜日を追加することによって生成されたデータの例である。

【図13】図１２のデータにおける各特徴量に対して標準化を施すことによって生成されたデータの例である。

【図14】等差数列要素を選択する処理の流れを例示するフローチャートである。

【図15】予測フェーズにおける前処理後入力データの例である。

【発明を実施するための形態】

【0011】

〔実施形態１〕
実施形態１について以下に説明する。説明の便宜上、実施形態１にて説明したコンポーネント（構成要素）と同じ機能を有するコンポーネントについては、以降の各実施形態では同じ符号を付し、その説明を繰り返さない。簡潔化のため、公知の技術事項についても説明を適宜省略する。本明細書において述べる各コンポーネントおよび各数値はいずれも、特に矛盾のない限り単なる例示である。それゆえ、例えば、特に矛盾のない限り、各コンポーネントの位置関係および接続関係は各図の例に限定されない。また、各図の例における日付と曜日との対応関係は、必ずしも実際のカレンダーのものと一致していないことに留意されたい。本明細書では、特に矛盾のない限り、２つの数ＡおよびＢについての表記「Ａ～Ｂ」は、「Ａ以上かつＢ以下」を表す。

【0012】

（情報処理装置１の概要）
図１は、情報処理装置１の要部の構成を例示するブロック図である。情報処理装置１は、制御装置９および記憶部９０を備えていてよい。制御装置９は、情報処理装置１の各部を統括的に制御する。制御装置９は、モデル生成装置１０および予測装置２０を備えていてよい。

【0013】

後述の通り、モデル生成装置１０は、施設における需要電力量を予測するための予測モデルを、機械学習によって生成する。このことから、モデル生成装置１０は、学習装置と称されてもよい。予測装置２０は、モデル生成装置１０によって予め生成された予測モデルを用いて、上記施設における需要電力量の予測値を導出する。

【0014】

本発明の一態様における施設は、例えば、時間帯、曜日、および当該施設内における従業者の就業状態の内の少なくとも１つに応じて、需要電力量の変動が生じうる施設であればよい。本発明の一態様における施設の例としては、工場などの工業施設、ショッピングモールなどの商業施設、および、病院などの医療施設を挙げることができる。

【0015】

記憶部９０は、制御装置９の処理に用いられる各種のデータおよびプログラムを格納する。図１の例では、実績データと就業日データとが記憶部９０に格納されているものとする。本明細書では、実績データとは、所定の時間分解能にて記録された、施設における需要電力量の実績値を示すデータ（より詳細には、データ構造）を総称的に指す。本明細書では、特に矛盾のない限り、「需要電力量」という文言は、需要電力量の実績値を指すものとする。

【0016】

実績データは、時点と需要電力量とが対応付けられたデータであるので、需要電力量の時間推移を示す時系列データの例である。実施形態１の例では、実績データにおける時間分解能は１分である。実施形態１では、時間分解能が１分のデータにおける時点は、「年／月／日時／分」形式（「yyyy/mm/dd /hh/mm」形式）によって表現されているものとする。時点は、データ構造におけるキーとして使用されてよい。

【0017】

本明細書では、就業日データとは、施設における日毎の就業状態を示すデータを総称的に指す。一例として、就業日データとは、ある日が当該施設の就業日であるか否かを示すデータであってよい。就業日データは、日付と就業状態とが対応付けられたデータであるので、就業状態の日ごとの推移を示す時系列データの例である。実施形態１の例では、以下に述べる前置補間が施される前の就業日データにおける時間分解能は１日である。実施形態１では、時間分解能が１日のデータにおける日付は、「年／月／日」形式（「yyyy/mm/dd」形式）によって表現されているものとする。

【0018】

（学習フェーズ）
以下、情報処理装置１の動作の一例について述べる。情報処理装置１の処理は、学習フェーズにおける処理（モデル生成装置１０の一連の処理）と、予測フェーズにおける処理（予測装置２０の一連の処理）と、に大別される。はじめに、学習フェーズの例について説明する。

【0019】

図１に示す通り、モデル生成装置１０は、データ取得部１１、前処理部１２、学習部１３、および評価部１４を備えていてよい。データ取得部１１は、学習時データ取得部または第１データ取得部と称されてもよい。前処理部１２は、学習時前処理部または第１前処理部と称されてもよい。

【0020】

図１に示す通り、記憶部９０には、学習フェーズにおいて用いられる実績データＤＺと就業日データＤＳとが格納されていてよい。以下、例えば、実績データＤＺを単にＤＺを略称する。データ取得部１１は、学習フェーズにおける入力データセットとしてＤＺおよびＤＳを取得する。そして、データ取得部１１は、当該入力データセットを訓練データと検証データとに分割する。

【0021】

図２のＤＺ０は、訓練データとしての実績データの例である。ＤＺ０は、ＤＺの一部である。実施形態１の例では、実績データに記録されている需要電力量の単位はｋＷｈであるものとする。図３のＤＳ０は、訓練データとしての就業日データの例である。ＤＳ０は、ＤＳの一部である。実施形態１の例では、就業日データ内に記録されている就業状態は、「就業日」という質的変数（より詳細には、名義尺度）に予め変換されているものとする。図３の例における「１」という就業日の値は、その日（当該就業日に対応する日）が就業日であることを示す。その一方、「０」という就業日の値は、その日が休日であることを示す。

【0022】

ただし、就業日データに記録されている就業状態の種類は、上記の例に限定されない。例えば、「長期休暇日」という就業状態の種類が就業日データに記録されていてもよい。長期休暇日とは、所定の長期休暇（例：夏季休暇期間）に属する休日を意味する。この場合、例えば、「－１」という就業日の値によって、その日が長期休暇日であることが示されてよい。

【0023】

前処理部１２は、学習部１３による機械学習アルゴリズムの実行に先立ち、訓練データに一連の前処理を施すことにより、前処理後訓練データを生成する。次いで、学習部１３は、機械学習アルゴリズムを実行することにより、当該前処理後訓練データに基づいて予測モデルを生成する。

【0024】

まず、前処理部１２は、ＤＳ０に記録されている就業日について前値補間を実行することにより、新たなデータを生成する。図４のＤＳ１は、当該新たなデータの例である。ＤＳ１は、前置補間後就業日データと称されてもよい。具体的には、前処理部１２は、前置補間によって、ＤＳ０をＤＺ０と等しい時間分解能（例：１分）を有する新たなデータへと変換する。図４に示す通り、前値補間の結果として、ＤＳ１では、同じ日付に属する就業日は、全ての時点において同じ値を有する。

【0025】

次いで、前処理部１２は、時点をキーとして用いてＤＺ０とＤＳ１とを組み合わせることにより、新たなデータを生成する。図４のＤＺ１は、当該新たなデータの例である。例えば、前処理部１２は、ＤＳ１における「就業日」の列をＤＺ０に追加することにより、ＤＺ１を生成する。ＤＺ１は、就業日データ付実績データと称されてもよい。

【0026】

次いで、前処理部１２は、ＤＺ１における需要電力量の自己相関係数（autocorrelation coefficient）を算出する。本明細書では、当該自己相関係数をＡＣと略記する。具体的には、前処理部１２は、ラグ（ｌａｇ）を様々に変化させ、ラグ毎のＡＣを算出する。ラグは、時系列データとしての特徴量に対して設定される時間的な遅延量を表す。

【0027】

前処理部１２は、ラグ単位量とラグ次数との積としてラグを設定してよい。そして、前処理部１２は、決定したラグ毎にＡＣを算出してよい。一例として、ラグ単位量は、情報処理装置１のユーザによって予め設定された一定値であってよい。実施形態１の例では、ラグ単位量が３０分である場合を例示する。ただし、前処理部１２によってラグ単位量が設定されてもよい。例えば、前処理部１２は、ＤＺ１の時間分解能（例：１分）をラグ単位量として設定してもよい。

【0028】

前処理部１２は、ラグとＡＣとの対応関係を示すテーブルを生成してよい。図６のＬＴは、当該テーブルの例を示す。図６の例では、ＬＴにおけるキーとして、ラグ次数が使用されてよい。図６の例では、前処理部１２は、ラグ次数を１から１００８まで変化させることにより、１００８通りのラグを設定する。したがって、前処理部１２は、１００８通りのＡＣを算出する。実施形態１の例におけるラグは、日単位の時間長を表す量である。

【0029】

上述の通り、ラグ単位量は３０分であるので、ラグ次数１は３０分に相当する。したがって、ラグ次数４８は１日（＝３０分×４８）に相当する。そして、ラグ次数３３６（＝４８×７）は、７日すなわち１週に相当する。そして、ラグ次数６７２（＝３３６×２）は１４日すなわち２週に相当し、ラグ次数１００８（＝３３６×３）は２１日すなわち３週に相当する。

【0030】

本明細書では、データ構造の要素番号を整数ｉによって総称的に表す。図６の例におけるｉは、ラグ次数に等しい値であってよい。そこで、図６の例において、ｉに対応するラグをｌａｇ［ｉ］と表記する。また、ｉに対応するＡＣをＡＣ［ｉ］と表記する。以上の説明から明らかである通り、ｉ＞１におけるｌａｇ［ｉ］は、ｉ番目に短いラグを表す。本明細書では、特に矛盾のない限り、一般的なプログラミング言語の記法に従って、データ構造の要素番号の最小値は０であるものとする。図６には示されていないが、当業者であれば明らかである通り、ｌａｇ［０］＝０であり、ＡＣ［０］＝１である。

【0031】

前処理部１２は、ＡＣに基づいて、設定した複数のラグの内から特殊ラグを選択（抽出）する。一例として、前処理部１２は、複数のラグの内、時間長閾値以上の値を有するラグであって、自己相関閾値以上の値を有するＡＣに対応するラグを、特殊ラグとして選択してよい。

【0032】

一般的に、機械学習の分野では、２つのデータ間の相関係数が０．７以上である場合に、当該データ間に強い正の相関が存在していると考えることができる。このことから、一例として、自己相関閾値は０．７～１であればよい。自己相関閾値は、ユーザによって任意に設定可能な値であってよい。実施形態１では、自己相関閾値が０．７である場合を例示する。

【0033】

そして、施設内における需要電力量の変動は、短期的にはおおよそ１日前後の周期を有していると一般的に考えられる。したがって、時間長閾値は、比較的短期的な需要電力量の変動トレンドを把握するために適切と考えられる値に設定されていればよい。時間長閾値も、ユーザによって任意に設定可能な値であってよい。実施形態１では、時間長閾値が１日である場合を例示する。

【0034】

当業者であれば明らかである通り、ラグが短い場合には、１に近いＡＣが生じやすい。そこで、上記の通り時間長閾値を設定することにより、多くの短いラグが特殊ラグとして選択されることを避けることができる。すなわち、選択される特殊ラグの数を減らすことができる（図６の例におけるラグ次数１～３の行を参照）。その結果、後述の説明から理解できる通り、予測モデルの品質を向上させることができる。

【0035】

上述の通り、１日という時間長閾値は、ｉ＝４８に対応する。図６の例では、ｉ≧４８の範囲において、
ＡＣ［４８］＝０．７８
ＡＣ［３３６］＝０．７３
ＡＣ［６７２］＝０．７０
ＡＣ［１００８］＝０．７２
が、自己相関閾値以上の値を有している。したがって、前処理部１２は、
ｌａｇ［４８］＝１
ｌａｇ［３３６］＝７
ｌａｇ［６７２］＝１４
ｌａｇ［１００８］＝２１
を、特殊ラグとして選択する。

【0036】

発明者らは、ある工場において得られた実績データを用いて、当該工場におけるラグとＡＣとの関係を導出した。図７は、発明者らによって導出された、当該工場におけるラグとＡＣとの関係を示すグラフである。図７のグラフにおいて、横軸はラグ次数を示し、縦軸はＡＣを示す。図７のグラフにおける横軸は、ラグに読み替えることができる。図７のグラフのトレンドは、図６の例に概ね一致している。

【0037】

次いで、前処理部１２は、抽出した複数の特殊ラグを昇順にソートしてよい。そして、前処理部１２は、ソートされた当該特殊ラグを要素として含む配列Ｐｌａｇを生成してよい。実施形態１の例では、前処理部１２は、Ｐｌａｇ＝［１，７，１４，２１］を生成する。そして、前処理部１２は、Ｐｌａｇの要素の内、等差数列を成す要素（等差数列要素）を選択する。等差数列要素の選択手法については後述する。

【0038】

実施形態１の例では、前処理部１２は、Ｐｌａｇの要素の内、１番目以降の要素であるＰｌａｇ［１：］＝［７，１４，２１］を、等差数列要素として選択する。これらの等差数列要素は、初項の値が７であり、かつ、公差が７である等差数列を成す。

【0039】

そして、前処理部１２は、Ｐｌａｇの要素の内、等差数列要素を除いた要素を、残余要素として選択する。残余要素は、非等差数列要素（等差数列を成さない要素）と称されてもよい。実施形態１の例では、処理部１２は、Ｐｌａｇの要素の内、０番目の要素であるＰｌａｇ［０］＝［１］を、残余要素として選択する。

【0040】

前処理部１２は、上述の通り選択した特殊ラグを需要電力量に対して設定することにより、新たな特徴量を導出する。例えば、前処理部１２は、新たな特徴量として、ローリング特徴量（rolling feature）およびラグ特徴量（lag feature）の少なくとも一方を導出してよい。

【0041】

上述の図７を踏まえると、等差数列要素に該当する特殊ラグは、需要電力量における変動の比較的長期的な周期性を表現するために適していると考えられる。そこで、前処理部１２は、等差数列要素に当該する特殊ラグを、ローリング特徴量を導出するための特殊ラグであるローリングラグとして選択してよい。実施形態１の例では、前処理部１２は、ラグ「７、１４、および２１」をローリングラグとして選択する。実施形態１の例では、前処理部１２は、当該ローリングラグに基づいてローリング特徴量を導出する。

【0042】

そして、前処理部１２は、残余要素に該当する特殊ラグを、ローリング特徴量とは別の特徴量を導出するための特殊ラグである非ローリングラグとして選択してよい。実施形態１の例では、前処理部１２は、ラグ「１」を非ローリングラグとして選択する。当該非ローリングラグは、需要電力量における変動の比較的短期的な周期性を表現するために適していると考えられる。そこで、実施形態１の例では、前処理部１２は、当該非ローリングラグに基づいてラグ特徴量を導出する。

【0043】

実施形態１では、ローリング特徴量の導出に先立ち、ラグ特徴量が導出される場合を例示する。ただし、当業者であれば明らかである通り、ラグ特徴量の導出に先立ち、ローリング特徴量が導出されてもよい。実施形態１における各処理は、特に矛盾のない限り、任意の順序で実行されてよい。

【0044】

前処理部１２は、非ローリングラグを需要電力量に対して設定することにより、当該需要電力量に対応する新たな特徴量としてのラグ特徴量を導出する。図８のＤＺ２は、ＤＺ１にラグ特徴量を追加することによって生成されたデータの例を示す。実施形態１の例では、非ローリングラグが１であるため、前処理部１２は、「１日前の需要電力量」をラグ特徴量として導出する。したがって、図８の例において、時点「2021/4/1 0:00」の行に属する「１日前の需要電力量」は、「2021/3/31 0:00における需要電力量」を表す。また、時点「2022/3/31 23:59」の行に属する「１日前の需要電力量」は、「2022/3/30 23:59における需要電力量」を表す。

【0045】

次いで、前処理部１２は、非ローリングラグを需要電力量に対して設定することにより、当該需要電力量に対応する新たな特徴量としてのローリング特徴量を導出する。まず、前処理部１２は、ある時点に対して、ローリングラグだけ前の時点の需要電力量を、当該時点に対応するローリング特徴量の構成要素（ローリング特徴量コンポーネント）として取得する。実施形態１の例では、ローリングラグが７、１４、および２１であるため、前処理部１２は、「７日前の需要電力量」、「１４日前の需要電力量」、および「２１日前の需要電力量」を、ローリング特徴量コンポーネントとして取得する。前処理部１２は、当該ローリング特徴量コンポーネントをＤＺ２に追加する。

【0046】

次いで、前処理部１２は、ローリング特徴量コンポーネントの統計値をローリング特徴量として導出する。実施形態１では、統計値が平均値である場合を例示する。したがって、前処理部１２は、「７日前の需要電力量」と「１４日前の需要電力量」と「２１日前の需要電力量」との平均値を導出する。前処理部１２は、当該平均値をローリング特徴量としてＤＺ２にさらに追加する。

【0047】

図９のＤＺ３は、ＤＺ２にローリング特徴量コンポーネントとローリング特徴量とを追加することによって生成されたデータの例を示す。図９の例において、時点「2021/4/1 0:00」の行に属する「７日前の需要電力量」、「１４日前の需要電力量」、および「２１日前の需要電力量」は、「2021/3/25 0:00における需要電力量」を、「2021/3/18 0:00における需要電力量」、および「2021/3/11 0:00における需要電力量」をそれぞれ表す。そして、時点「2021/4/1 0:00」の行に属する「平均（７，１４，２１日前）需要電力量」は、同時点の行に属する「７日前の需要電力量」と「１４日前の需要電力量」と「２１日前の需要電力量」との平均値を表す。

【0048】

ローリング特徴量の取得後には、ローリング特徴量コンポーネントはもはや不要であると考えられる。そこで、前処理部１２は、ローリング特徴量の取得後に、ＤＺ３からローリング特徴量コンポーネントを削除してよい。図１０のＤＺ４は、ＤＺ３からローリング特徴量コンポーネントを削除することによって生成されたデータの例を示す。

【0049】

次いで、前処理部１２は、ＤＺ４に記録されている時点を、所定の型に変換することにより、当該時点に対応する特徴量である時点相当量を導出する。そして、前処理部１２は、当該時点相当量をＤＺ４に追加する。一例として、前処理部１２は、基準時点「0:00」から対象時点までの経過時間を時間（ｈ）単位で表す量として、時点相当量を設定してよい。図１１のＤＺ５は、ＤＺ４に時点相当量を追加することによって生成されたデータの例を示す。

【0050】

図１１の例では、「0:00」からの１分間の経過時間は、１／６０（≒０．０１６６７）という時点相当量に対応する。実施形態１の例では、時点の年（ｙ）、月（ｍ）、および日（ｄ）を考慮せずに、時間（ｈ）および分（ｍ）のみを用いて時点相当量が導出されている。ただし、当業者であれば明らかである通り、年、月、および日の少なくともいずれかを考慮した型として導出された量が、時点相当量として導出されてもよい。

【0051】

ただし、当業者であれば明らかである通り、時点相当量は必ずしも導出されなくともよい。本開示の一態様に係る予測モデルは、特殊ラグを需要電力量に対して設定することにより導出された新たな特徴量を説明変数として用いて、需要電力量の予測値を出力できるように設定されていればよいためである。

【0052】

次いで、前処理部１２は、例えばカレンダーデータを参照することにより、ＤＺ５に記録されている時点の日付に対応する曜日を決定する。そして、前処理部１２は、当該曜日をＤＺ５に追加する。図１２のＤＺ６は、ＤＺ５に曜日を追加することによって生成されたデータの例である。図１２の例では、前処理部１２は、質的変数（名義尺度）に変換した曜日をＤＺ５に追加することにより、ＤＺ６を生成している。実施形態１の例では、曜日０～６は、日曜日～土曜日をこの順に表す。したがって、図１２の例における曜日４は、木曜日を表す。

【0053】

図１２に示す通り、ＤＺ６において、需要電力量、および当該需要電力量に基づいて導出された新たな特徴量は、例えば曜日および就業日を示す特徴量（カレンダー特徴量）に比べて大きい値となりうる。したがって、前処理部１２は、ＤＺ６に含まれている各特徴量に対するスケーリングを実行してよい。これにより、各特徴量の数値範囲を同程度に揃えることができるので、より高い性能を有する予測モデルを生成することが可能となる。

【0054】

実施形態１では、前処理部１２がスケーリングとして標準化（standardization）を実行する場合を例示する。前処理部１２は、ＤＺ６に含まれているある特徴量について、当該特徴量の平均値（μ）および標準偏差（σ）を導出する。そして、前処理部１２は、導出したμおよびσを用いて、当該特徴量を標準化する。本明細書では、学習モデルの生成前の標準化に用いたμおよびσを、標準化パラメータと称する。図１３のＤＺ６Ｓは、ＤＺ６の各特徴量に対して標準化を施すことによって生成されたデータの例である。実施形態１の例では、ＤＺ６が、前処理後訓練データとして用いられる。

【0055】

学習部１３は、需要電力量に基づいて導出された新たな特徴量が追加された後の、当該需要電力量の時系列データに基づいて、機械学習によって予測モデルを生成する。したがって、一例として、学習部１３は、所定の機械学習アルゴリズムを実行することにより、前処理後訓練データ（例：ＤＺ６Ｓ）に基づいて予測モデルを生成してよい。

【0056】

本開示の一態様に係る予測モデルは、予測対象時点における需要電力量の予測値を、目的変数として出力できる学習済モデルであればよい。したがって、機械学習アルゴリズムの種類は、回帰タスクを解くことが可能なものであれば、特に限定されない。機械学習アルゴリズムの例としては、ニューラルネットワーク（Neural Network，ＮＮ）、サポートベクターマシン（Support Vector Machine，ＳＶＭ）、および決定木（Decision Tree，ＤＴ）などを挙げることができる。

【0057】

実施形態１の例では、学習部１３は、ＤＺ６Ｓに含まれている、（ｉ）任意の予測対象時点における需要電力量を目的変数の真値（正解データ）として用いるとともに、（ｉｉ）当該予測対象時点以前における需要電力量以外の各特徴量を説明変数として用いることにより、説明変数から目的変数を導出する予測モデルを生成する。

【0058】

予測モデルの生成後、学習部１３は、当該予測モデルに、各特徴量の標準化パラメータを組み込んでよい。学習部１３は、当該予測モデルに、ローリングラグと非ローリングラグとをさらに組み込んでよい。

【0059】

評価部１４は、学習部１３によって生成された予測モデルを評価する。具体的には、評価部１４は、当該予測モデルの予測性能を評価する。評価部１４による評価に先立ち、前処理部１２は、検証データに対して、上述の訓練データと同じ様式の一連の前処理を実行することにより、前処理後検証データを生成する。したがって、実施形態１の例では、前処理後検証データは、ＤＺ６Ｓと同じ様式のデータ構造を有している。このため、実施形態１における前処理後検証データでは、予測モデルに組み込まれている標準化パラメータを用いて各特徴量が標準化されている。

【0060】

評価部１４は、前処理後検証データを用いて予測モデルを評価する。具体的には、評価部１４は、前処理後検証データを予測モデルに入力することにより、当該予測モデルに予測値を出力させる。そして、評価部１４は、当該予測値と、前処理後検証データに示されている需要電力量の真値とに基づいて、予測モデルの予測精度を示す指標値を導出する。

【0061】

指標値は、機械学習分野において、回帰タスクにおける予測精度の評価に使用されるものであればよく、特に限定されない。指標値の例としては、平均絶対誤差（Mean Absolute Error，ＭＡＥ）および平均平方二乗誤差（Root Mean Square Error，ＲＭＳＥ）などを挙げることができる。評価部１４は、指標値の導出が完了した後に、予測モデルを記憶部９０に格納してよい。

【0062】

なお、モデル生成装置１０は、指標値が所定の閾値を下回る場合には、学習部１３に予測モデルを再び生成させてよい。この場合、予測モデルの再生成に先立ち、例えば当該予測モデルのハイパーパラメータが再設定されてよい。このように、予測フェーズにおいて使用される予測モデルの性能を補償するために、閾値以上の指標値が得られるまで予測モデルの生成が繰り返されてよい。この場合、評価部１４は、閾値以上の指標値が初めて得られた予測モデルを、記憶部９０に格納してよい。

【0063】

（等差数列要素の選択手法の例）
図１４は、等差数列要素を選択する処理の流れの例を示すフローチャートである。まず、前処理部１２は、Ｓ１に先立ち、上述の配列Ｐｌａｇの要素数ＮＰｌａｇを取得する。実施形態１の例では、Ｐｌａｇ＝［１，７，１４，２１］であるので、ＮＰｌａｇ＝４である。

【0064】

Ｓ１において、前処理部１２は、ＮＰｌａｇが２以上であるか否かを反映する。ＮＰｌａｇが２以上である場合（Ｓ１でＹＥＳ）、Ｓ２に進む。他方、ＮＰｌａｇが１以下である場合（Ｓ１でＮＯ）、前処理部１２は、図１４の処理を終了させる。この場合、前処理部１２は、Ｐｌａｇは等差数列要素を含んでいないと判定する。

【0065】

Ｓ２において、前処理部１２は、Ｐｌａｇの要素を指すための要素番号ｉを０に初期化する。Ｓ３において、前処理部１２は、Ｐｌａｇが等差数列要素を含んでいることを示すフラグｆｌｇをＴｒｕｅ（真）に初期化する。

【0066】

Ｓ４において、前処理部１２は、ｉがＮＰｌａｇ－２よりも小さいか否かを判定する。ｉがＮＰｌａｇ－２よりも小さい場合（Ｓ４でＹＥＳ）、Ｓ５に進む。他方、ｉがＮＰｌａｇ－２以上である場合（Ｓ４でＮＯ）、Ｓ８に進む。

【0067】

Ｓ５において、前処理部１２は、ａ０にＰｌａｇ［ｉ］を代入する。ａ０は、想定される等差数列の初項である。このように、Ｓ５において、前処理部１２は、ａ０をＰｌａｇ［ｉ］と等しい値に設定する。Ｓ６において、前処理部１２は、ｄにＰｌａｇ［ｉ＋１］－ａ０を代入する。ｄは、想定される等差数列の公差である。このように、Ｓ６において、前処理部１２は、ｄをＰｌａｇ［ｉ＋１］－ａ０と等しい値に設定する。次いで、Ｓ７において、前処理部１２は、Ｐｌａｇの要素を指すための要素番号ｊに、ｉ＋２を代入する。そして、Ｓ１１に進む。

【0068】

Ｓ８～Ｓ１０はそれぞれ、Ｓ５～Ｓ７と対になる処理である。Ｓ８において、前処理部１２は、ａ０に０を代入する。すなわち、Ｓ８において、前処理部１２は、ａ０を０に設定する。Ｓ９において、前処理部１２は、ｄにＰｌａｇ［ｉ］－ａ０を代入する。このように、Ｓ９において、前処理部１２は、ｄをＰｌａｇ［ｉ］－ａ０と等しい値に設定する。次いで、Ｓ１０において、前処理部１２は、ｊにｉ＋１を代入する。そして、Ｓ１１に進む。

【0069】

Ｓ１１において、前処理部１２は、ｎｅｘｔ＿ｄにＰｌａｇ［ｊ］－Ｐｌａｇ［ｊ－１］を代入する。ｎｅｘｔ＿ｄは、想定される等差数列における、ｄの次の公差である。このように、前処理部１２は、ｎｅｘｔ＿ｄをＰｌａｇ［ｊ］－Ｐｌａｇ［ｊ－１］と等しい値に設定する。

【0070】

Ｓ１２において、前処理部１２は、ｎｅｘｔ＿ｄがｄに等しいか否かを判定する。ｎｅｘｔ＿ｄがｄに等しい場合（Ｓ１２でＹＥＳ）、Ｓ１３において、前処理部１２は、ｊを１だけカウントアップする。そして、Ｓ１５に進む。他方、ｎｅｘｔ＿ｄがｄに等しくない場合（Ｓ１２でＮＯ）、Ｓ１４において、前処理部１２は、ｆｌｇをＦａｌｓｅ（偽）に更新する。そして、Ｓ１６に進む。

【0071】

Ｓ１５において、前処理部１２は、ｊがＮＰｌａｇ以上であるか否かを判定する。ｊがＮＰｌａｇ以上である場合（Ｓ１５でＹＥＳ）、Ｓ１６に進む。他方、ｊがＮＰｌａｇよりも小さい場合（Ｓ１５でＮＯ）、Ｓ１１に戻る。したがって、ｊがＮＰｌａｇに等しくなるまで、Ｓ１１～Ｓ１３およびＳ１５の処理が繰り返される。

【0072】

Ｓ１６において、前処理部１２は、ｆｌｇがＦａｌｓｅであるか否かを判定する。ｆｌｇがＦａｌｓｅである場合（Ｓ１６でＹＥＳ）、Ｓ１７において、前処理部１２は、ｉを１だけカウントアップする。そして、Ｓ１９に進む。他方、ｆｌｇがＦａｌｓｅでない場合（Ｓ１６でＮＯ）、すなわち、ｆｌｇがＴｒｕｅである場合、Ｓ１８に進む。

【0073】

Ｓ１８において、前処理部１２は、Ｐｌａｇの要素の内、ｉ番目以降の要素であるＰｌａｇ［ｉ：］を配列ａｐに代入する。配列ａｐは、等差数列要素を格納するための配列である。Ｓ１８の完了後、前処理部１２は、図１４の処理を終了させる。処理の終了時におけるｆｌｇがＴｒｕｅである場合（言い換えれば、処理の終了時における配列ａｐが空配列でない場合）、前処理部１２は、Ｐｌａｇが等差数列要素を含んでいると判定する。この場合、前処理部１２は、等差数列要素の選択結果としてａｐを出力してよい。

【0074】

Ｓ１９において、前処理部１２は、ｉがＮＰｌａｇ以上であるか否かを判定する。ｉがＮＰｌａｇ以上である場合（Ｓ１９でＹＥＳ）、Ｓ２０に進む。他方、ｉがＮＰｌａｇよりも小さい場合（Ｓ１９でＮＯ）、Ｓ３に戻る。したがって、ｉがＮＰｌａｇに等しくなるまで、Ｓ３～Ｓ１６、Ｓ１７、およびＳ１９の処理が繰り返される。

【0075】

Ｓ２０において、前処理部１２は、空配列を配列ａｐに代入する。すなわち、前処理部１２は、配列ａｐを空配列に設定する。Ｓ２０の完了後、前処理部１２は、図１４の処理を終了させる。処理の終了時におけるｆｌｇがＦａｌｓｅである場合（言い換えれば、処理の終了時における配列ａｐが空配列である場合）、前処理部１２は、Ｐｌａｇは等差数列要素を含んでいないと判定する。この場合、前処理部１２は、空配列としてのａｐを、等差数列要素の選択結果として出力してよい。

【0076】

実施形態１の例では、Ｓ２においてｉ＝０に設定された後、Ｓ５において、ａ０＝Ｐｌａｇ［０］＝１に設定される。したがって、Ｓ６において、ｄ＝Ｐｌａｇ［１］－ａ０＝７－１＝６に設定される。そして、Ｓ７において、ｊ＝２に設定される。このため、Ｓ１１において、ｎｅｘｔ＿ｄ＝Ｐｌａｇ［２］－Ｐｌａｇ［１］＝１４－７＝７に設定される。この場合、ｄがｎｅｘｔ＿ｄに等しくないので、Ｓ１４においてｆｌｇがＦａｌｓｅに設定される。その後、Ｓ１７において、ｉが１にカウントアップされる。

【0077】

Ｓ３においてｆｌｇがＴｒｕｅに更新された後、Ｓ５において、ａ０＝Ｐｌａｇ［１］＝７に設定される。したがって、Ｓ６において、ｄ＝Ｐｌａｇ［２］－ａ０＝１４－７＝７に設定される。そして、Ｓ７において、ｊ＝３に設定される。このため、Ｓ１１において、ｎｅｘｔ＿ｄ＝Ｐｌａｇ［３］－Ｐｌａｇ［２］＝２１－１４＝７に設定される。したがって、ｄがｎｅｘｔ＿ｄに等しく、かつ、ｆｌｇがＴｒｕｅであるため、Ｓ１８において、Ｐｌａｇ［１：］＝［７，１４，２１］がａｐとして設定される。

【0078】

（予測フェーズ）
続いて、図１を再び参照し、学習フェーズに後続する予測フェーズの例について説明する。予測装置２０は、データ取得部２１、前処理部２２、予測演算部２３、および予測結果出力部２４を備えていてよい。データ取得部２１は、予測時データ取得部または第２データ取得部と称されてもよい。前処理部２２は、予測時前処理部または第２前処理部と称されてもよい。

【0079】

図１に示す通り、記憶部９０には、予測フェーズにおいて用いられる実績データＤＺＰと就業日データＤＳＰとが格納されていてよい。予測フェーズでは、リアルタイムでの需要電力量予測が実行されてよい。このため、実績データＤＺＰは、リアルタイムで更新されてよい。データ取得部２１は、予測フェーズにおける入力データとしてＤＺＰおよびＤＳＰを取得する。ＤＺＰは、ＤＺと同じ様式のデータ構造を有しているものとする。また、ＤＳＰは、ＤＳと同じ様式のデータ構造を有しているものとする。加えて、データ取得部２１は、学習フェーズにおいてモデル生成装置１０によって記憶部９０に格納された予測モデルを取得する。

【0080】

前処理部２２は、予測フェーズにおける入力データセットに対して、上述の学習フェーズと同じ様式の一連の前処理を実行することにより、前処理後入力データを生成する。前処理部２２の処理の例について以下に述べる。

【0081】

まず、前処理部２２は、ＤＳＰ中の就業日に対して前値補間を実行することにより、予測フェーズにおける前置補間後就業日データ（便宜上、ＤＳＰ１と称する）を生成する。前置補間の結果、ＤＳＰ１は、ＤＺＰと等しい時間分解能（例：１分）を有している。

【0082】

次いで、前処理部２２は、時点をキーとして用いてＤＺＰとＤＳＰ１とを組み合わせることにより、予測フェーズにおける就業日データ付実績データ（便宜上、ＤＺＰ１と称する）を生成する。

【0083】

次いで、前処理部２２は、学習フェーズにおいて決定された特殊ラグを取得する。例えば、前処理部２２は、学習フェーズにおいて決定されたローリングラグと非ローリングラグとを、予測モデルから読み出してよい。前処理部２２は、学習フェーズにおいて決定された特殊ラグを予測フェーズにおける需要電力量に対して設定することにより、予測フェーズにおける新たな特徴量を導出する。

【0084】

前処理部２２は、予測フェーズにおける需要電力量に対して非ローリングラグを設定することにより、予測フェーズにおける新たな特徴量としてのラグ特徴量を導出してよい。そして、前処理部２２は、当該ラグ特徴量をＤＺＰ１に追加することによって、新たなデータ（便宜上、ＤＺＰ２と称する）を生成してよい。実施形態１の例では、非ローリングラグが１であるため、前処理部２２は、「１日前の需要電力量」を予測フェーズにおけるラグ特徴量として取得する。

【0085】

次いで、前処理部２２は、予測フェーズにおける需要電力量に対してローリングラグを設定することにより、予測フェーズにおける新たな特徴量としてのローリング特徴量を導出してよい。まず、前処理部２２は、ローリングラグに応じて、予測フェーズにおけるローリング特徴量コンポーネントを取得する。実施形態１の例では、ローリングラグが７、１４、および２１であるため、前処理部２２は、予測フェーズにおける「７日前の需要電力量」、「１４日前の需要電力量」、および「２１日前の需要電力量」を、予測フェーズにおけるローリング特徴量コンポーネントとして取得する。そして、前処理部２２は、当該ローリング特徴量コンポーネントをＤＺＰ２に追加する。

【0086】

次いで、前処理部２２は、予測フェーズにおける「７日前の需要電力量」と「１４日前の需要電力量」と「２１日前の需要電力量」との平均値を導出し、当該平均値を予測フェーズにおけるローリング特徴量として取得する。そして、前処理部２２は、当該ローリング特徴量をＤＺＰ２にさらに追加する。

【0087】

以上の通り、前処理部２２は、ＤＺＰ２に予測フェーズにおけるローリング特徴量コンポーネントとローリング特徴量とを追加することによって、新たなデータ（便宜上、ＤＺＰ３と称する）を生成してよい。ローリング特徴量の取得後に、前処理部２２は、ＤＺＰ３からローリング特徴量コンポーネントを削除することによって、新たなデータ（便宜上、ＤＺＰ４と称する）を生成してよい。

【0088】

次いで、前処理部２２は、ＤＺＰ４に記録されている時点を、予測フェーズにおける時点相当量に変換する。そして、前処理部２２は、当該時点相当量をＤＺ４に追加することにより、新たなデータ（便宜上、ＤＺＰ５と称する）を生成する。

【0089】

次いで、前処理部２２は、ＤＺＰ５に記録されている時点の日付に対応する曜日（質的変数に変換した曜日）をＤＺ５に追加することにより、新たなデータ（便宜上、ＤＺＰ６と称する）を生成する。

【0090】

次いで、前処理部２２は、学習フェーズにおいて決定された標準化パラメータを、予測モデルから読み出す。そして、前処理部２２は、当該標準化パラメータを用いてＤＺＰ６の各特徴量を標準化する。図１５のＤＺＰ６Ｓは、ＤＺＰ６の各特徴量に対して標準化を施すことによって生成されたデータの例である。ＤＺＰ６Ｓは、予測フェーズにおける前処理後入力データとして用いられる。図１５では、キーとしての時点については図示が割愛されている。すなわち、図１５では、予測フェーズにおける需要電力量の予測に用いられる説明変数のみが示されている。

【0091】

一例として、予測フェーズでは、３０分ごとに需要電力量予測が実行されてよい。また、予測フェーズでは、例えば２４時間を超える将来の期間に亘る（例：現時点から３６時間後までに亘る）需要電力量の予測値が導出されてよい。このことから、予測フェーズでは、例えば「１日前の需要電力量」の一部のセルの値は未知となりうる。図１５の例では、ＮＵＬＬという表記によって、未知の値（すなわち空白値）を有するセルが示されている。ＤＺＰ６Ｓ内に空白値が存在する場合、前処理部２２は、所定の補間手法を用いて当該空白値を補間してよい。

【0092】

一例として、前処理部２２は、予測モデルを用いて、１日前の需要電力量の既知の値に基づいて、空白値を補間してよい。例えば、前処理部２２は、ある空白値に対応する１日前の需要電力量の既知の値を予測モデルに入力することにより、当該入力に応じた予測値を予測モデルに出力させてよい。そして、前処理部２２は、当該予測値を当該空白値の補間値として設定してよい。

【0093】

予測演算部２３は、予測フェーズにおける需要電力量に基づいて導出された新たな特徴量が追加された後の、当該需要電力量の時系列データに基づいて、需要電力量の予測値を予測モデルに出力させる。したがって、予測演算部２３は、前処理後入力データ（例：ＤＺＰ６Ｓ）を予測モデルに入力することにより、当該予測モデルに予測値を出力させてよい。具体的には、予測演算部２３は、前処理後入力データ内の各特徴量を、説明変数として予測モデルに供給する。予測モデルは、当該説明変数に応じた予測値を、目的変数として出力する。

【0094】

予測結果出力部２４は、予測モデルによって出力された需要電力量の予測値に基づいて、予測結果データを生成する。例えば、予測結果出力部２４は、各予測値と各時点とを対応付けたデータを、予測結果データとして生成してよい。予測結果出力部２４は、生成した予測結果データを出力する。

【0095】

また、予測結果出力部２４は、需要電力量の予測値（単位：ｋＷｈ）を、別の単位に換算してもよい。一例として、予測結果出力部２４は、需要電力量の予測値を、需要電力の予測値（単位：ｋＷ）へと換算してよい。この場合、予測結果出力部２４は、換算後の各予測値と各時点とを対応付けたデータを、予測結果データとして生成してよい。

【0096】

（情報処理装置１の効果）
モデル生成装置１０によれば、学習フェーズにおいて、ＡＣ（需要電力量の自己相関係数）に基づいて特殊ラグを選択できる。次いで、特殊ラグを需要電力量に対して設定することにより、新たな特徴量を導出できる。このように、モデル生成装置１０によれば、新たな特徴量は、需要電力量の変動の周期性を表すと期待される特徴量（例：上述のローリング特徴量およびラグ特徴量）を、ＡＣに基づいて導出できる。それゆえ、当該新たな特徴量を、需要電力量の予測に有益であると期待される説明変数として得ることが可能となる。

【0097】

そして、モデル生成装置１０によれば、需要電力量に対して新たな特徴量が追加された時系列データ（例えば、上述の図９におけるＤＺ４を参照）に基づき、予測モデルを生成できる。このため、新たな特徴量を説明変数として用いて予測モデルを生成できるので、当該予測モデルによる予測精度を高めることができる。すなわち、高品質な予測モデルを得ることができる。

【0098】

施設における需要電力量の変動トレンドは、例えば施設の業態に応じて異なりうる。このことから、予測モデルの生成に先立ち、ユーザが当該施設に応じた適切なラグを手動で設定することは必ずしも容易ではない。また、ユーザによって設定されたラグが不適切である場合、予測モデルの品質低下が生じるおそれがある。

【0099】

しかしながら、上述の通りモデル生成装置１０によれば、需要電力量の変動の周期性を把握するために適したラグであると期待される特殊ラグを、ＡＣに基づいて選択できる。それゆえ、ユーザによるラグの手動設定を要することなく、予測モデルを生成できる。このため、ユーザの利便性を高めつつ、施設の業態に応じた高品質な予測モデルを得ることができる。

【0100】

さらに、モデル生成装置１０によれば、施設における就業状態を付加的な説明変数として用いて、予測モデルを生成することもできる。就業状態を付加的な説明変数として用いることにより、施設の業態がより詳細に反映された予測モデルを生成できる。それゆえ、予測モデルの予測精度をより一層高めることが可能となる。

【0101】

ところで、特許文献１では、熱負荷の予測精度を高めるために複数のＮＮを使い分けるという着想が示されている。具体的には、特許文献１では、平日用ＮＮと土曜日用ＮＮと日曜日用ＮＮという３つの個別のＮＮを予め生成し、予測当日の曜日に応じて各ＮＮを使い分けることが開示されている。

【0102】

ただし、施設の業態次第では、土曜日および日曜日の少なくとも一方が就業日として設定されている場合もある。あるいは、施設の業態次第では、特定の曜日の平日（例：月曜日）が休業日として設定されている場合もある。あるいは、施設の業態次第では、平日、土曜日、および日曜日の全てが就業日に該当しうる。

【0103】

したがって、特許文献１に示されている各ＮＮの使い分けでは、上述した様々な施設の業態に柔軟に対処することはできない。このことから、特許文献１に示されている各ＮＮの使い分けを需要電力量予測に適用した場合には、必ずしも高い予測精度を実現することはできない。

【0104】

その一方、モデル生成装置１０によれば、上述の通り、施設の業態に応じた高品質な予測モデルを得ることができる。したがって、モデル生成装置１０によれば、特許文献１の技術とは異なり、高い予測精度を実現可能な単一の予測モデルを生成できる。このように、モデル生成装置１０によれば、従来に比べて汎用性の高い予測モデルが得られる。

【0105】

そして、予測装置２０によれば、学習フェーズにおいてモデル生成装置１０によって生成された予測モデルを用いて、予測フェーズにおいて需要電力量の予測値を導出できる。以上の通り、本発明の一態様によれば、施設における需要電力量の予測精度を従来よりも高めることが可能となる。

【0106】

〔実施形態２〕
実施形態１では、学習フェーズにおいて設定された複数のラグの内、時間長閾値以上の値を有するラグであって、自己相関閾値以上の値を有するＡＣに対応するラグを、特殊ラグとして選択する手法を例示した。ただし、当業者であれば明らかである通り、特殊ラグの選択手法は、実施形態１の例に限定されない。

【0107】

例えば、実施形態２では、前処理部１２は、複数のラグの内、ラグとＡＣとの関係を示すデータ系列におけるＡＣの極大値に対応するラグを、特殊ラグ候補として選択してよい。したがって、例えば、前処理部１２は、図７のグラフにおけるＡＣの極大値に対応するラグを、特殊ラグ候補として選択してよい。次いで、前処理部１２は、特殊ラグ候補の内、時間長閾値以上の値を有するラグであって、自己相関閾値以上の値を有するＡＣに対応するラグを、特殊ラグとして選択してよい。

【0108】

施設の業態次第では、ＡＣの極大値に対応するラグの付近において、自己相関閾値以上の値を有するＡＣに対応するラグが多く存在するケースも考えられる。当該ケースにおいて、実施形態１における選択手法を採用した場合には、多くの特殊ラグが選択されうる。この場合、多くの新たな説明変数（例：多くのローリング特徴量およびラグ特徴量）が導出される。当業者であれば明らかである通り、説明変数の数が過大である場合には、予測モデルの品質が低下しうる。また、過大な数の説明変数は、機械学習アルゴリズムの実行に要する時間の増加を招く。

【0109】

その一方、上記ケースにおいて、実施形態２における選択手法を採用した場合には、実施形態１の選択手法には異なり、特殊ラグ候補の内から特殊ラグが選択される。したがって、実施形態２の選択手法によれば、実施形態１の選択手法に比べて、選択される特殊ラグの数を低減できる。

【0110】

それゆえ、実施形態２の選択手法によれば、実施形態１の選択手法に比べて、導出される新たな説明変数の数を低減できる。その結果、実施形態２の選択手法によれば、上記ケースにおいても、高品質な予測モデルを生成できる。加えて、機械学習アルゴリズムの実行に要する時間を低減することもできる。

【0111】

〔変形例〕
当業者であれば明らかである通り、予測モデルにおける説明変数は、上記各実施形態の例に限定されない。施設における需要電力量に影響を及ぼしうると考えられる任意の特徴量が、説明変数として使用されてよい。例えば、施設の業態次第では、気温、天候、および日射量などの気象条件が、需要電力量に影響を及ぼす。そこで、気象条件と需要電力量との間に相関がある場合には、気象条件を示す特徴量（気象特徴量）を、付加的な説明変数として使用することもできる。

【0112】

気象特徴量は、施設における測定の結果として得られた実績値であってもよいし、気象予報サービス事業者によって提供された予測値であってもよい。したがって、例えば、学習フェーズでは、気象特徴量の実績値を用いて予測モデルが生成されてよい。次いで、予測フェーズでは、気象特徴量の予測値を用いて、当該予測モデルによって需要電力量が予測されてよい。この場合、予測フェーズでは、学習フェーズにおける気象特徴量の実績値を用いて、気象特徴量の予測値が補正されてもよい。

【0113】

〔ソフトウェアによる実現例〕
情報処理装置１（以下、「装置」と呼ぶ）の機能は、当該装置としてコンピュータを機能させるためのプログラムであって、当該装置の各制御ブロック（特に制御装置９に含まれる各部）としてコンピュータを機能させるためのプログラムにより実現することができる。

【0114】

この場合、上記装置は、上記プログラムを実行するためのハードウェアとして、少なくとも１つの制御装置（例えばプロセッサ）と少なくとも１つの記憶装置（例えばメモリ）を有するコンピュータを備えている。この制御装置と記憶装置により上記プログラムを実行することにより、上記各実施形態で説明した各機能が実現される。

【0115】

上記プログラムは、一時的ではなく、コンピュータ読み取り可能な、１または複数の記録媒体に記録されていてもよい。この記録媒体は、上記装置が備えていてもよいし、備えていなくてもよい。後者の場合、上記プログラムは、有線または無線の任意の伝送媒体を介して上記装置に供給されてもよい。

【0116】

また、上記各制御ブロックの機能の一部または全部は、論理回路により実現することも可能である。例えば、上記各制御ブロックとして機能する論理回路が形成された集積回路も本発明の一態様の範疇に含まれる。この他にも、例えば量子コンピュータにより上記各制御ブロックの機能を実現することも可能である。

【0117】

上記各実施形態の説明から明らかである通り、上記各実施形態における各処理は、ＡＩ（Artificial Intelligence：人工知能）に実行させることができる。この場合、ＡＩは上記制御装置で動作するものであってもよいし、他の装置（例えばエッジコンピュータまたはクラウドサーバ等）で動作するものであってもよい。

【0118】

〔まとめ〕
本発明の態様１に係るモデル生成装置は、施設における需要電力量を予測するための予測モデルを生成するモデル生成装置であって、上記モデル生成装置は、上記需要電力量の実績値の時間推移を示す時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数を導出し、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグを選択し、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量を導出し、上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルを生成する。

【0119】

本発明の態様２に係るモデル生成装置は、上記態様１において、複数の上記ラグの内、時間長閾値以上の値を有するラグであって、自己相関閾値以上の値を有する上記自己相関係数に対応するラグを、上記特殊ラグとして選択してよい。

【0120】

本発明の態様３に係るモデル生成装置は、上記態様１において、複数の上記ラグの内、上記ラグと上記自己相関係数との関係を示すデータ系列における上記自己相関係数の極大値に対応するラグを、特殊ラグ候補として選択してよく、上記特殊ラグ候補の内、時間長閾値以上の値を有するラグであって、自己相関閾値以上の値を有する上記自己相関係数に対応するラグを、特殊ラグとして選択してよい。

【0121】

本発明の態様４に係るモデル生成装置では、上記態様２または３において、上記自己相関閾値は、０．７以上かつ１以下の値であってよい。

【0122】

本発明の態様５に係るモデル生成装置は、上記態様２から４のいずれか１つにおいて、複数の上記特殊ラグが昇順にソートされた配列において、等差数列を成す複数の上記特殊ラグをローリングラグとして選択してよく、上記ローリングラグを上記実績値に対して設定することにより、上記新たな特徴量としてローリング特徴量を導出してよい。

【0123】

本発明の態様６に係るモデル生成装置は、上記態様５において、上記配列における上記ローリングラグを除いた上記特殊ラグを非ローリングラグとして選択してよく、上記非ローリングラグを上記実績値に対して設定することにより、上記新たな特徴量としてラグ特徴量を導出してよい。

【0124】

本発明の態様７に係るモデル生成装置では、上記態様１から６のいずれか１つにおいて、上記新たな特徴量が追加された上記時系列データは、上記施設における日毎の就業状態を示すデータをさらに含んでいてよい。

【0125】

本発明の態様８に係る予測装置は、学習フェーズにおいて予め生成された、施設における需要電力量を予測するための予測モデルを予測フェーズにおいて用いることにより、上記需要電力量の予測値を導出する予測装置であって、上記学習フェーズでは、上記需要電力量の実績値の時間推移を示す上記学習フェーズにおける時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれに対応する上記実績値の自己相関係数が導出されており、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグが選択されており、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量が導出されており、上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルが生成されており、上記予測装置は、上記実績値の時間推移を示す上記予測フェーズにおける時系列データについて、上記学習フェーズにおいて選択された上記特殊ラグを上記予測フェーズにおける上記実績値に対して設定することにより、上記予測フェーズにおける新たな特徴量を導出し、上記予測フェーズにおける上記新たな特徴量が追加された、上記予測フェーズにおける上記時系列データに基づいて、上記予測値を上記予測モデルに出力させる。

【0126】

本発明の態様９に係るモデル生成方法は、施設における需要電力量を予測するための予測モデルを生成するモデル生成方法であって、上記施設における需要電力量の実績値の時間推移を示す時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれについて上記実績値の自己相関係数を導出する工程と、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグを選択する工程と、上記特殊ラグを上記実績値に対して設定することにより新たな特徴量を導出する工程と、上記新たな特徴量が追加された上記時系列データに基づいて、機械学習によって上記予測モデルを生成する工程と、を含んでいる。

【0127】

本発明の態様１０に係る予測方法は、学習フェーズにおいて予め生成された、施設における需要電力量を予測するための予測モデルを、予測フェーズにおいて用いることにより、上記施設における需要電力量の予測値を導出する予測方法であって、上記学習フェーズでは、上記施設における需要電力量の実績値の時間推移を示す上記学習フェーズにおける時系列データについて、上記実績値に対する複数のラグを設定することにより、複数の上記ラグのそれぞれについて上記実績値の自己相関係数が導出されており、上記自己相関係数に基づいて、複数の上記ラグの内から特殊ラグが選択されており、上記特殊ラグを上記学習フェーズにおける上記実績値に対して設定することにより新たな特徴量が導出されており、上記学習フェーズにおける上記新たな特徴量が追加された、上記学習フェーズにおける上記時系列データに基づいて、機械学習によって上記予測モデルが生成されており、上記予測方法は、上記施設における需要電力量の実績値の時間推移を示す上記予測フェーズにおける時系列データについて、上記学習フェーズにおいて選択された上記特殊ラグを上記予測フェーズにおける上記実績値に対して設定することにより、上記予測フェーズにおける新たな特徴量を導出する工程と、上記予測フェーズにおける上記新たな特徴量が追加された、上記予測フェーズにおける上記時系列データに基づいて、上記予測値を上記予測モデルに出力させる工程と、を含んでいる。

【0128】

〔付記事項〕
本発明の一態様は、上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の一態様の技術的範囲に含まれる。

【符号の説明】

【0129】

１情報処理装置
１０モデル生成装置
１１データ取得部（モデル生成装置のデータ取得部）
１２前処理部（モデル生成装置の前処理部）
１３学習部
１４評価部
２０予測装置
２１データ取得部（予測装置のデータ取得部）
２２前処理部（予測装置の前処理部）
２３予測演算部
２４予測結果出力部

【図1】