(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024106822
(43)【公開日】2024-08-08
(54)【発明の名称】情報処理方法、プログラム及び情報処理装置
(51)【国際特許分類】
G06N 20/20 20190101AFI20240801BHJP
【FI】
G06N20/20
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023011279
(22)【出願日】2023-01-27
(71)【出願人】
【識別番号】000141060
【氏名又は名称】株式会社関電工
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】佐野 常世
(72)【発明者】
【氏名】宍戸 英明
(72)【発明者】
【氏名】柳瀬 孝史
(57)【要約】 (修正有)
【課題】より好適な機械学習モデルを構築する情報処理方法、プログラム及び情報処理装置を提供する。
【解決手段】方法は、同一の訓練データを用いて機械学習モデルを複数回生成する処理S201と、各機械学習モデルについて算出された損失関数の値に基づき、生成された複数の機械学習モデルからいずれかを最適なモデルとして選択する処理S202と、を含む。
【選択図】
図8
【特許請求の範囲】
【請求項1】
同一の訓練データを用いて機械学習モデルを複数回生成し、
各機械学習モデルについて算出された損失関数の値に基づき、生成された複数の前記機械学習モデルからいずれかを最適なモデルとして選択する
処理をコンピュータが実行する情報処理方法。
【請求項2】
前記損失関数は平均二乗誤差である
請求項1に記載の情報処理方法。
【請求項3】
前記損失関数の値が最小の前記機械学習モデルを最適なモデルとして選択する
請求項1又は2に記載の情報処理方法。
【請求項4】
前記損失関数の値が一定値以下である一又は複数の前記機械学習モデルについて、学習済みパラメータの代表値を算出し、
算出した学習済みパラメータの代表値を設定した前記機械学習モデルを最適なモデルとして選択する
請求項1又は2に記載の情報処理方法。
【請求項5】
前記訓練データは、所定期間の複数時点における気温情報に対し、各時点における対象施設の電力需要値が対応付けられたデータであり、
前記訓練データを用いて、前記気温情報を入力した場合に前記対象施設の電力需要値を出力するよう学習済みの機械学習モデルを生成する
請求項1~4のいずれか1項に記載の情報処理方法。
【請求項6】
前記訓練データに対し、直近時点ほどデータ点数が増加するように、各時点の前記気温情報及び電力需要値をコピーするデータ拡張処理を行い、
データ拡張後の前記訓練データに基づいて機械学習モデルを生成する
請求項5に記載の情報処理方法。
【請求項7】
同一の訓練データを用いて機械学習モデルを複数回生成し、
各機械学習モデルについて算出された損失関数の値に基づき、生成された複数の前記機械学習モデルからいずれかを最適なモデルとして選択する
処理をコンピュータに実行させるプログラム。
【請求項8】
制御部を備える情報処理装置であって、
前記制御部が、
同一の訓練データを用いて機械学習モデルを複数回生成し、
各機械学習モデルについて算出された損失関数の値に基づき、生成された複数の前記機械学習モデルからいずれかを最適なモデルとして選択する
情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理方法、プログラム及び情報処理装置に関する。
【背景技術】
【0002】
機械学習技術を用いて、電力需要を予測する方法が提案されている。例えば特許文献1では、過去数年間の電力需要の実績データを学習済みのニューラルネットワークに、予測対象日から過去数日間の気象データ等を入力して電力需要を予測する日最大電力需要予測方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、特許文献1に係る発明は、損失関数の値を、計算結果の採用、不採用に用いていない。
【0005】
一つの側面では、より好適な機械学習モデルを構築することができる情報処理方法等を提供することを目的とする。
【課題を解決するための手段】
【0006】
一つの側面では、情報処理方法は、同一の訓練データを用いて機械学習モデルを複数回生成し、各機械学習モデルについて算出された損失関数の値に基づき、生成された複数の前記機械学習モデルからいずれかを最適なモデルとして選択する処理をコンピュータが実行する。
【発明の効果】
【0007】
一つの側面では、より好適な機械学習モデルを構築することができる。
【図面の簡単な説明】
【0008】
【
図3】気温情報及び電力需要値の一例を示す説明図である。
【
図4】データ拡張後の気温情報及び電力需要値を示す説明図である。
【
図5】学習モデルの生成処理の手順を示すフローチャートである。
【
図6】電力需要値の予測処理の手順を示すフローチャートである。
【
図8】実施の形態2に係る学習モデルの生成処理の手順を示すフローチャートである。
【発明を実施するための形態】
【0009】
以下、本発明をその実施の形態を示す図面に基づいて詳述する。
(実施の形態1)
図1は、サーバ1の構成例を示すブロック図である。本実施の形態では、機械学習により構築した学習モデル50(
図2参照)を用いて、気温情報に基づき対象施設の時間帯別の電力需要値を予測するサーバ1について説明する。
【0010】
サーバ1は、種々の情報処理、情報の送受信が可能な情報処理装置である。なお、サーバ1に相当するコンピュータはサーバコンピュータに限定されず、例えばパーソナルコンピュータであってもよい。
【0011】
後述するように、サーバ1は、所定の訓練データを学習する機械学習を行うことで、予測対象日における気温情報(最高気温、最低気温、及び前日との気温差)の予報値を入力した場合に、対象施設(オフィスビル、商業施設等)の時間帯別の電力需要値を出力する学習モデル50を生成する。そしてサーバ1は、当該学習モデル50を用いて、対象施設の時間帯別の電力需要値を予測する。
【0012】
特に本実施の形態では、直近時点ほどデータ点数が増加するように、各時点の気温情報をコピーするデータ拡張処理を行うことで、直近時点の気温情報を重視した重み付けを行う。当該処理について、詳しくは後述する。
【0013】
サーバ1は、制御部11、主記憶部12、通信部13、表示部14、入力部15、及び補助記憶部16を備える。
【0014】
制御部11は、一又は複数のCPU(Central Processing Unit)、MPU(Micro-Processing Unit)、GPU(Graphics Processing Unit)等の演算処理装置を有し、補助記憶部16に記憶されたプログラムPを読み出して実行することにより、種々の情報処理、制御処理等を行う。主記憶部12は、SRAM(Static Random Access Memory)、DRAM(Dynamic Random Access Memory)等の一時記憶領域であり、制御部11が演算処理を実行するために必要なデータを一時的に記憶する。通信部13は、通信に関する処理を行うための通信モジュールであり、外部と情報の送受信を行う。表示部14は、液晶ディスプレイ等の表示画面であり、画像を表示する。入力部15は、キーボード、マウス等の操作インターフェイスであり、操作入力を受け付ける。
【0015】
補助記憶部16は、大容量メモリ、ハードディスク等の不揮発性記憶領域であり、制御部11が処理を実行するために必要なプログラムP(プログラム製品)、その他のデータを記憶している。また、補助記憶部16は、学習モデル50を記憶している。学習モデル50は、所定の訓練データを学習済みの機械学習モデルであり、気温情報を入力した場合に対象施設の時間帯別の電力需要値を出力するモデルである。
【0016】
なお、補助記憶部16はサーバ1に接続された外部記憶装置であってもよい。また、サーバ1は複数のコンピュータからなるマルチコンピュータであっても良く、ソフトウェアによって仮想的に構築された仮想マシンであってもよい。
【0017】
また、サーバ1は、CD(Compact Disk)-ROM、DVD(Digital Versatile Disc)-ROM等の可搬型記憶媒体1aを読み取る読取部を備え、可搬型記憶媒体1aからプログラムPを読み取って実行するようにしても良い。
【0018】
図2は、学習モデル50の構成例を示す説明図である。
図3は、気温情報及び電力需要値の一例を示す説明図である。
図2、
図3に基づき、本実施の形態の概要を説明する。
【0019】
サーバ1は、所定の訓練データを学習することで、
図2に示す学習モデル50を生成する。学習モデル50は、直近所定期間の複数時点における気温情報を入力した場合に対象施設の時間帯別の電力需要値を出力するよう学習済みのモデルであり、例えば深層学習により生成されるFNN(フィードフォワード・ニューラルネットワーク;Feedforward Neural Network)である。
【0020】
なお、学習モデル50はFNN以外のニューラルネットワークであってもよい。また、学習モデル50は、例えば決定木、SVM(Support Vector Machine)など、ニューラルネットワーク以外の学習アルゴリズムに基づくモデルであってもよい。
【0021】
具体的には
図2に示すように、学習モデル50は、最高気温、最低気温、及び前日との気温差を入力として、1時間毎の電力需要値を出力とするモデルである。なお、前日との気温差は例えば最高気温差であるが、最低気温差、平均気温差などであってもよい。
【0022】
なお、本実施の形態では学習モデル50の説明変数として気温情報を採用するが、本実施の形態はこれに限定されるものではなく、例えば湿度、風速、雨量、天気など、他の気候情報も学習モデル50の説明変数として採用してもよい。
【0023】
図3に、データ拡張前の気温情報及び電力需要値を示す表を図示する。
図3の表では、10月1日~11日の気温情報及び電力需要値(10月11日の電力需要値は予測対象のため未知)を図示している。例えば10月11日の電力需要値を予測する場合、サーバ1は、10月1日~10日のデータを学習することで、学習モデル50を構築する。そしてサーバ1は、10月11日の気温情報の予報値を学習モデル50に入力することで、10月11日の1時間毎の電力需要値を学習モデル50より出力する。
【0024】
サーバ1は、所定期間(10日間)の複数時点(1日毎)における気温情報に対し、各時点(各日付)における正解の時間帯別の電力需要値が対応付けられた訓練データを用いて、学習モデル50を生成する。すなわち、サーバ1は、訓練用の気温情報を学習モデル50に入力することで、各日付における電力需要値を出力する。サーバ1は、出力された電力需要値と正解値とに基づいて損失関数(例えば平均二乗誤差)を算出する。なお、算出する損失関数は平均二乗誤差に限定されず、例えば平均絶対誤差、平均二乗誤差の平方根、平均二乗対数誤差、Huber損失、ポアソン損失など、種々の関数が採用されてもよい。サーバ1は、算出された損失関数が最小化されるように、ニューロン間の重み等の学習済みパラメータを最適化する。これにより、サーバ1は学習モデル50を生成する。
【0025】
なお、本実施の形態では学習モデル50の入力値(説明変数)として気温情報を採用したが、本実施の形態はこれに限定されるものではない。例えばサーバ1は、学習モデル50の入力値として、対象施設におけるイベントの有無を入力値として採用してもよい。すなわち、サーバ1は、気温情報に対して電力需要値のほかにイベントの有無を示す「1」又は「0」の値が対応付けられた訓練データを用い、気温情報と共にイベントの有無を示す値を学習モデル50に入力した場合、当該対象施設の時間帯別の電力需要値を出力する学習モデル50を生成する。これにより、例えば対象施設が商業施設、スポーツ観戦施設などである場合に、イベント開催によって電力需要が大きいケースを学習モデル50が好適に判別して電力需要値を予測することができる。
【0026】
ここで、本実施の形態においてサーバ1は、学習モデル50を生成(学習)する場合に、各時点の気温情報及び電力需要値をコピーするデータ拡張処理を行うことで、直近時点の気温情報及び電力需要値ほど重視するよう重み付けを行う。
【0027】
図4は、データ拡張後の気温情報及び電力需要値を示す説明図である。
図4では、直近時点(10月5日~10日)の気温情報をコピーする様子を図示している。
【0028】
図4に示すように、サーバ1は、直近時点ほどデータ点数が増加するように、各時点(各日付)の気温情報及び電力需要値をコピーするデータ拡張処理を行う。具体的には、サーバ1は、直近時点ほどコピー回数を増加させてデータ拡張を行う。
【0029】
図4の例では、サーバ1は、10月1日~11日のうち、10月5日~10日の気温情報及び電力需要値をコピーしている。より詳しくは、サーバ1は、予測対象日(10月11日)の1~2日前(10月9日~10日)、1~4日前(10月7日~10日)、1~6日前(10月5日~10日)のデータを抽出し、各期間のデータを1回ずつコピーして、元のデータに追加する。
図4では、追加した部分をハッチングで図示している。上記の処理により、予測対象日から近い1~2日前(10月9日~10日)は3回、次に近い3~4日前(10月7日~8日)は2回、次に近い5~6日前(10月5日~6日)は1回、それぞれコピーされる。
【0030】
このように、本実施の形態では予測対象日の直近時点ほどデータ点数(コピー回数)が増加するように、気温情報及び電力需要値をコピーするデータ拡張を行う。データ拡張を行わずにそのまま各時点のデータを学習した場合、学習モデル50において直前10日間のデータが全て同格に扱われる。すなわち、1日前のデータも10日前のデータも、同じ扱いとなる。
【0031】
しかし、電力需要の予測をするのであれば、予測対象日に近いほど気温情報と電力需要値の相関性は強くなる。そこで本実施の形態では、予測対象日に近い直近時点ほどデータ点数を増加させることで、直近時点のデータを重視するよう重み付けを行う。
【0032】
学習モデル50を生成する場合、サーバ1は、訓練用の所定期間(10日間)の気温情報に対してデータ拡張処理を行い、10日間の気温情報及び電力需要値を22日間の気温情報及び電力需要値に拡張する。そしてサーバ1は、22日間の各日付の気温情報を学習モデル50に入力することで電力需要値を出力し、出力された電力需要値が正解値と近似するように学習済みパラメータを最適化することで、学習モデル50を生成する。
【0033】
以上より、本実施の形態によれば、直近時点ほどデータ点数が増加するようにデータ拡張処理を行った上で、学習モデル50を生成する。これにより、直近時点のデータが重視され、電力需要の予測を好適に行うことができる。
【0034】
図5は、学習モデル50の生成処理の手順を示すフローチャートである。
図5に基づき、機械学習により学習モデル50を生成する際の処理内容について説明する。
サーバ1の制御部11は、学習モデル50を生成するための訓練データを取得する(ステップS11)。訓練データは、所定期間の複数時点(複数の日付)における気温情報に対し、各時点(各日付)における正解の時間帯別の電力需要値が対応付けられたデータである。
【0035】
制御部11は訓練データについて、直近時点ほどデータ点数が増加するように、各時点の気温情報及び電力需要値をコピーするデータ拡張処理を行う(ステップS12)。具体的には上述の如く、制御部11は、10日間の気温情報のうち、予測対象日の1~2日前、1~4日前、1~6日前の気温情報を抽出し、各期間の気温情報を1回ずつコピーして、元の訓練データに追加する。
【0036】
制御部11は、データ拡張後の訓練データを用いて、気温情報を入力した場合に対象施設の時間帯別の電力需要値を出力するよう学習済みの学習モデル50を生成する(ステップS13)。具体的には上述の如く、制御部11は、学習モデル50としてFNNを生成する。制御部11は、訓練用の気温情報を学習モデル50に入力することで時間帯別の電力需要値を出力し、出力された電力需要値と正解値とに基づいて損失関数(例えば平均二乗誤差)を算出して、損失関数が最小化されるように学習モデル50を最適化する。制御部11は一連の処理を終了する。
【0037】
図6は、電力需要値の予測処理の手順を示すフローチャートである。
図6に基づき、学習モデル50を用いて電力需要値を予測する際の処理内容について説明する。
サーバ1の制御部11は、対象施設の気温情報(予報値)を取得する(ステップS31)。制御部11は、取得した気温情報を学習モデル50に入力することで、対象施設の時間帯別の電力需要値を出力する(ステップS32)。制御部11は一連の処理を終了する。
【0038】
以上より、本実施の形態1によれば、電力需要値を好適に予測することができる。
【0039】
(実施の形態2)
本実施の形態では、学習時に算出される損失関数の値に応じて、最適な学習モデル50を選択する形態について述べる。なお、実施の形態1と重複する内容については同一の符号を付して説明を省略する。
【0040】
図7は、実施の形態2の概要を示す説明図である。
図7では、同一の訓練データを用いて複数の学習モデル50A、50B、50C…を生成し、複数の学習モデル50A、50B、50C…から、損失関数(例えば平均二乗誤差)の値が最小の学習モデル50を最適なモデルとして選択する様子を図示している。
図7に基づき、本実施の形態の概要を説明する。
【0041】
本実施の形態においてサーバ1は、同一の訓練データ(データ拡張後の訓練データ)を用いて、同様の学習モデル50A、50B、50C…を複数回生成する。例えばサーバ1は、予め定められた学習回数(エポック数)だけそれぞれ学習を行い、各々の学習モデル50A、50B、50C…を生成する。
【0042】
ここで、同様の学習を行ったとしても、各学習モデル50A、50B、50C…の損失関数は同じ値に収束するとは限らない。
図7の例では、損失関数が「30」、「25」、「35」、「40」、…に収束する様子を図示している。このように、同じ訓練データを用いて学習を行ったとしても、学習の都度、学習済みパラメータ(重み等)が異なるモデルが生成され、全く同じモデルが生成されることはない。
【0043】
通常、損失関数の値はモデルの精度評価に使われる。しかし、本実施の形態では損失関数の値を、計算結果の採用、不採用に用いる。すなわち、サーバ1は、損失関数の値に基づいて、複数の学習モデル50から最適なモデルを選択する。
【0044】
具体的には、サーバ1は、損失関数の値が最小の学習モデル50を最適なモデルとして選択する。
図7の例では、損失関数が「30」、「25」、「35」、「40」、…の各学習モデル50A、50B、50C、50D…のうち、「25」の学習モデル50Bを最適なモデルとして選択する。電力需要値の予測を行う場合、サーバ1は、選択した学習モデル50Bを用いて予測を行う。
【0045】
なお、上記の選択方法は一例であって、本実施の形態はこれに限定されるものではない。例えばサーバ1は、損失関数が一定値以下の学習モデル50A、50B、50C…について学習済みパラメータの代表値を算出し、算出した学習済みパラメータの値を設定した学習モデル50を、最適なモデルとして選択してもよい。代表値とは、例えば各学習モデル50A、50B、50C…の学習済みパラメータの平均値、中央値、最頻値などである。このように、サーバ1は、複数の学習モデル50A、50B、50C…の学習結果を組み合わせて最適なモデルを選択してもよい。
【0046】
以上より、本実施の形態によれば、同一の訓練データから学習モデル50A、50B、50C…を複数回生成し、生成された複数の学習モデル50A、50B、50C…から、損失関数の値に基づいて最適なモデルを選択する。これにより、より好適な機械学習モデル(学習モデル50)を構築し、電力需要値の予測を行うことができる。
【0047】
図8は、実施の形態2に係る学習モデル50の生成処理の手順を示すフローチャートである。訓練データに含まれる気温情報をコピーするデータ拡張処理を行った後(ステップS12)、サーバ1は以下の処理を実行する。
サーバ1の制御部11は、データ拡張後の訓練データを用いて、学習モデル50A、50B、50C…を複数回生成する(ステップS201)。すなわち、制御部11は同一の訓練データを用いて、同様の学習モデル50A、50B、50C…を複数生成する。
【0048】
制御部11は、各学習モデル50A、50B、50C…についてステップS201の生成時に算出された損失関数の値に基づき、生成した複数の学習モデル50から、最適な学習モデル50を選択する(ステップS202)。具体的には、制御部11は、損失関数の値が最小の学習モデル50を最適なモデルとして選択する。制御部11は一連の処理を終了する。
【0049】
以上より、本実施の形態2によれば、より好適な機械学習モデル(学習モデル50)を構築することができる。
【0050】
今回開示された実施の形態はすべての点で例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上記した意味ではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。
【0051】
各実施の形態に記載した事項は相互に組み合わせることが可能である。また、特許請求の範囲に記載した独立請求項及び従属請求項は、引用形式に関わらず全てのあらゆる組み合わせにおいて、相互に組み合わせることが可能である。さらに、特許請求の範囲には他の2以上のクレームを引用するクレームを記載する形式(マルチクレーム形式)を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム(マルチマルチクレーム)を記載する形式を用いて記載しても良い。
【符号の説明】
【0052】
1 サーバ
11 制御部
12 主記憶部
13 通信部
14 表示部
15 入力部
16 補助記憶部
P プログラム