(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-12
(45)【発行日】2022-12-20
(54)【発明の名称】残差特性推定モデル作成方法および残差特性推定モデル作成システム
(51)【国際特許分類】
G06Q 50/06 20120101AFI20221213BHJP
G06Q 10/04 20120101ALI20221213BHJP
【FI】
G06Q50/06
G06Q10/04
(21)【出願番号】P 2019044811
(22)【出願日】2019-03-12
【審査請求日】2021-04-15
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】佐藤 江里子
(72)【発明者】
【氏名】寺本 やえみ
【審査官】梅岡 信幸
(56)【参考文献】
【文献】特開2005-135287(JP,A)
【文献】特開2016-004525(JP,A)
【文献】特開2018-067266(JP,A)
【文献】特開2019-016279(JP,A)
【文献】特開2007-233639(JP,A)
【文献】特開平09-022402(JP,A)
【文献】特開2016-057193(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
残差特性推定モデル作成システムが行う残差特性推定モデル作成方法であって、
複数の属性を有するデータの集合であって、前記データとして所定の現象に対する実測データを含む集合に基づい
た機械学習により、前記複数の属性のいずれかである目的変数を、前記複数の属性のうちの前記目的変数以外の属性から選択される第1の説明変数から算出する予測モデルを作成し、
前記データの集合に基づいて、前記予測モデルに前記第1の説明変数の値を代入して得られる予測値と、前記目的変数の値である真値との残差に関する残差特性を算出し、
前記データの集合に基づい
た機械学習により、前記残差特性を、前記複数の属性から選択される第2の説明変数から算出する残差特性推定モデルを作成し、
前記予測モデルの作成では、前記データの集合に含まれる第1の部分集合に基づい
た機械学習により、前記予測モデルを作成し、
前記残差特性の算出では、前記データの集合に含まれる第2の部分集合に基づいて、
前記予測モデルに当該第2の部分集合における前記第1の説明変数の属性値を代入して得られる予測値と、当該第2の部分集合における前記目的変数の値である真値との残差の統計値を前記残差特性
として算出し、
前記残差特性推定モデルの作成では、前記第2の部分集合に含まれる第5の部分集合に基づい
た機械学習により前記残差特性推定モデルを作成し、前記第2の部分集合に含まれる、前記第5の部分集合とは異なる第6の部分集合における前記第2の説明変数の属性値を前記残差特性推定モデルに代入して得られる予測値に基づいて、前記残差特性推定モデルの精度を評価し、当該評価結果が第2の精度条件を満たすまで前記残差特性推定モデルを繰り返し作成する、残差特性推定モデル作成方法。
【請求項2】
前記予測モデルの作成では、前記第1の部分集合に含まれる第3の部分集合に基づいて前記予測モデルを作成し、前記第1の部分集合に含まれる、前記第3の部分集合とは異なる第4の部分集合における前記第1の説明変数の属性値を前記予測モデルに代入して得られる予測値に基づいて、前記予測モデルの精度を評価し、当該評価結果が第1の精度条件を満たすまで前記予測モデルを繰り返し作成する、請求項1に記載の残差特性推定モデル作成方法。
【請求項3】
前記第2の部分集合は、前記第3の部分集合を含まない、請求項2に記載の残差特性推定モデル作成方法。
【請求項4】
前記第2の部分集合は、前記第4の部分集合を含む、請求項2に記載の残差特性推定モデル作成方法。
【請求項5】
前記データの集合から前記第1の部分集合および前記第2の部分集合を選択し、
前記部分集合ごとに、当該部分集合に含まれるデータが有する属性の値の偏りを示す偏在値を算出し、
前記偏在値が所定の許容条件を満たさない場合、前記第1の部分集合と前記第2の部分集合を再度選択する、請求項1に記載の残差特性推定モデル作成方法。
【請求項6】
前記偏在値の算出では、前記第1の説明変数、前記第2の説明変数および前記目的変数に対する前記偏在値を算出する、請求項5に記載の残差特性推定モデル作成方法。
【請求項7】
前記データの集合から前記第1の部分集合および前記第2の部分集合をランダムに選択する、請求項1に記載の残差特性推定モデル作成方法。
【請求項8】
前記残差特性の算出では、前記予測値と前記真値とを所定変数の値に変換し、当該変換した予測値と真値との残差に応じた残差特性を算出する、請求項1に記載の残差特性推定モデル作成方法。
【請求項9】
前記目的変数は、気象に関する気象変数であり、
前記所定変数は、電力量である、請求項8に記載の残差特性推定モデル作成方法。
【請求項10】
複数の属性を有するデータの集合であって、前記データとして所定の現象に対する実測データを含む集合に基づい
た機械学習により、前記複数の属性のいずれかである目的変数を、前記複数の属性のうちの前記目的変数以外の属性から選択される第1の説明変数から算出する予測モデルを作成する第1の作成部と、
前記データの集合に基づいて、前記予測モデルに前記第1の説明変数の値を代入して得られる予測値と、前記目的変数の値である真値との残差に関する統計値である残差特性を算出する処理部と、
前記データの集合に基づい
た機械学習により、前記残差特性を、前記複数の属性から選択される第2の説明変数から算出する残差特性推定モデルを作成する第2の作成部と、を有し、
前記第1の作成部は、前記データの集合に含まれる第1の部分集合に基づいた機械学習により、前記予測モデルを作成し、
前記処理部は、前記データの集合に含まれる第2の部分集合に基づいて、
前記予測モデルに当該第2の部分集合における前記第1の説明変数の属性値を代入して得られる予測値と、当該第2の部分集合における前記目的変数の値である真値との残差の統計値を前記残差特性
として算出し、
前記第2の作成部は、前記第2の部分集合に含まれる第5の部分集合に基づい
た機械学習により前記残差特性推定モデルを作成し、前記第2の部分集合に含まれる、前記第5の部分集合とは異なる第6の部分集合における前記第2の説明変数の属性値を前記残差特性推定モデルに代入して得られる予測値に基づいて、前記残差特性推定モデルの精度を評価し、当該評価結果が第2の精度条件を満たすまで前記残差特性推定モデルを繰り返し作成する、残差特性推定モデル作成システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、残差特性推定モデル作成方法および残差特性推定モデル作成システムに関する。
【背景技術】
【0002】
風力発電にて発電される発電電力量などの予測対象に関する値を予測する技術が注目されている。
【0003】
特許文献1には、気象官署にて観測された風速データと標高などの地形因子とに基づいて、地形因子と風速データとの関係を表した重回帰式を求め、その重回帰式を用いて、略250mメッシュ地点ごとの平均風速データを推定する技術が開示されている。
【0004】
特許文献2には、所定の現象に対する予測値と実測値との誤差を示す誤差データを記憶し、その誤差データに対して統計処理を行うことで、予測値の誤差を評価する技術が開示されている。
【先行技術文献】
【特許文献】
【0005】
【文献】特許第3242606号公報
【文献】特開2011-95946号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
風力発電の発電設備などでは、実際の発電電力量が予測値から大きく外れると、電力系統の安定化などのために、他の発電設備などによる電力の調整などが必要となり、コストが増加するという問題がある。このため、風力発電のための発電設備の設置場所を選定する場合などでは、発電電力量のような予測対象に対する予測値だけでなく、予測値の信頼性も重要となる。
【0007】
しかしながら、特許文献1および2に記載の技術では、予測値の信頼性について課題がある。例えば、特許文献1に記載の技術では、各地点の平均風速データが推定されているが、その推定値の信頼性については何ら考慮されていない。また、特許文献2に記載の技術では、予測値と実測値との差である誤差を統計処理しているだけなので、実測値のような真値が得られていない地点については、予測値の信頼性を評価することができない。
【0008】
本開示の目的は、真値との比較ができない状況でも予測値の信頼性を評価することが可能な残差特性推定モデル作成方法および残差特性推定モデル作成システムを提供することである。
【課題を解決するための手段】
【0009】
本開示の一つの実施態様に従う残差特性推定モデル作成方法は、複数の属性を有するデータの集合に基づいて、前記複数の属性のいずれかである目的変数を、前記複数の属性から選択される第1の説明変数から算出する予測モデルを作成し、前記データの集合に基づいて、前記予測モデルに前記第1の説明変数の値を代入して得られる予測値と、前記目的変数の値である真値との残差に応じた残差特性を算出し、前記データの集合に基づいて、前記残差特性を、前記複数の属性から選択される第2の説明変数から算出する残差特性推定モデルを作成する。
【0010】
また、本開示の一つの実施態様に従う残差特性推定モデル作成システムは、複数の属性を有するデータの集合に基づいて、前記複数の属性のいずれかである目的変数を、前記複数の属性から選択される第1の説明変数から算出する予測モデルを作成する第1の作成部と、前記データの集合に基づいて、前記予測モデルに前記第1の説明変数の値を代入して得られる予測値と、前記目的変数の値である真値との残差に応じた残差特性を算出する処理部と、前記データの集合に基づいて、前記残差特性を、前記複数の属性から選択される第2の説明変数から算出する残差特性推定モデルを作成する第2の作成部と、を有する。
【発明の効果】
【0011】
本発明によれば、真値との比較ができない状況でも予測値の信頼性を評価することが可能になる。
【図面の簡単な説明】
【0012】
【
図1】本発明の一実施の形態における残差特性推定モデル作成システムの構成を示す図である。
【
図2】データセット選択部の動作の一例を説明するためのフローチャートである。
【
図3】予測モデル作成部の動作の一例を説明するためのフローチャートである。
【
図4】残差特性統計処理部の動作の一例を説明するためのフローチャートである。
【
図5】残差特性推定モデル作成部の動作の一例を説明するためのフローチャートである。
【
図6】変数偏在性評価部の動作の一例を説明するためのフローチャートである。
【
図7】残差特性推定モデルの使用例を説明するための図である。
【発明を実施するための形態】
【0013】
以下、本開示の実施形態について図面を参照して説明する。
【0014】
図1は、本発明の一実施の形態における残差特性推定モデル作成システムの構成を示す図である。
図1に示す残差特性推定モデル作成システム10は、格納部11と、データセット選択部12と、予測モデル作成部13と、残差特性統計処理部14と、残差特性推定モデル作成部15と、変数偏在性評価部16と、出力部17とを有する。
【0015】
格納部11は、複数の属性を有するデータの集合であるデータセットを格納する。属性は、3つ以上であることが望ましい。属性は、値(属性値)として数値を有する数値情報と、属性値として数値とは異なる定性的な値を有する定性的情報とを含んでもよい。
【0016】
データセット選択部12は、格納部11に格納されたデータセットを部分集合であるグループに分割する。グループは、後述する予測モデルのための第1のグループである予測用グループと、後述する残差特性推定モデルのための第2のグループである残差用グループとを含む。また、予測用グループは、予測モデルを作成するための第3のグループである予測作成用グループと、作成した予測モデルの精度を評価するための第4のグループである予測評価用グループとを含む。また、残差用グループは、残差特性推定モデルを作成するための第5のグループである残差作成用グループと、作成した残差特性推定モデルの精度を評価するための第6のグループである残差評価用グループとを含む。
【0017】
予測作成用グループに含まれるデータと予測評価用グループに含まれるデータとは、互いに異なる。また、残差作成用グループに含まれるデータと残差修正用グループに含まれるデータとは、互いに異なる。また、残差用グループは、予測作成用グループに含まれるデータを含まないように選択することが望ましい。一方、予測評価用グループに含まれるデータは、残差用グループに含まれてもよい。このため、データセット選択部12は、予測評価用グループを、残差作成用グループまたは残差評価用グループと兼用させてもよい。したがって、データセット選択部12は、データセットを、予測作成用グループ、予測評価用グループおよび残差作成用グループ(または、残差評価用グループ)を含む3つ以上のグループに分ければよい。
【0018】
予測モデル作成部13は、データセット選択部12にて分割された複数のグループのうちの予測用グループに基づいて、データが有する複数の属性のいずれかである目的変数を、複数の変数から選択される第1の説明変数から算出する予測モデルを作成する第1の作成部である。具体的には、予測モデル作成部13は、予測用グループに含まれる予測作成用グループに基づいて予測モデルを作成し、予測用グループに含まれる予測評価用グループに基づいて、作成した予測モデルの精度を評価する。そして、予測モデル作成部13は、精度の評価結果が第1の精度条件を満たすまで予測モデルを繰り返し作成する。
【0019】
残差特性統計処理部14は、予測モデル作成部13にて作成された予測モデルと、データセット選択部12にて分割された複数のグループのうちの残差用グループに基づいて、予測モデルに第1の説明変数として選択された属性の属性値を代入して得られる予測値と、目的変数として選択された属性の属性値である真値との差である残差に応じた残差特性を算出する処理部である。
【0020】
残差特性推定モデル作成部15は、残差特性統計処理部14にて算出された残差特性と、データセット選択部12にて分割された複数のグループのうちの残差用グループとに基づいて、残差特性を、データが有する複数の属性から選択された第2の説明変数から算出する残差特性推定モデルを作成する第2の作成部である。具体的には、残差特性推定モデル作成部15は、残差用グループに含まれる残差作成用グループに基づいて残差特性推定モデルを作成し、残差用グループに含まれる残差評価用グループに基づいて、作成した残差特性推定モデルの精度を評価する。そして、残差特性推定モデル作成部15は、精度の評価結果が第2の精度条件を満たすまで残差特性推定モデルを繰り返し作成する。
【0021】
変数偏在性評価部16は、データセット選択部12にて分割されたグループごとに、そのグループに含まれるデータが有する属性の属性値の偏りを示す偏在値を算出する。変数偏在性評価部16は、偏在値が所定の許容条件を満たさない場合、データセット選択部12にデータ集合のグループ分けを再度実行させる。これにより、データセット選択部12は、偏在値が許容条件を満たすまで、データ集合のグループ分けを繰り返すことになる。このとき、変数偏在性評価部16は、第1の説明変数、第2の説明変数および目的変数として選択された属性に対する偏在値を算出することが望ましい。
【0022】
出力部17は、変数偏在性評価部16にて偏在値が許容条件を満すと判断された場合、予測モデル作成部13にて作成された予測モデルと、残差特性推定モデル作成部15にて作成された残差分布推定モデルとを出力する。
【0023】
図2は、データセット選択部12の動作の一例を説明するためのフローチャートである。
【0024】
先ず、データセット選択部12は、格納部11からデータセットを取得し、そのデータセットを3つ以上のグループに分割する(ステップS101)。データセットを分割する方法は、特に限定されない。例えば、データセット選択部12は、データセットをランダムに分割してもよい。また、データセット選択部12は、各グループに含まれるデータの数が互いに同数となるように分割してもよい。、
【0025】
データセット選択部12は、3つ以上のグループから1つのグループを予測作成用グループとして選択する(ステップS102)。データセット選択部12は、選択した予測作成用グループに含まれるデータを、予測モデルを作成するための学習用データとして設定し(ステップS103)、その学習用データを予測モデル作成部13に出力する(ステップS104)。
【0026】
また、データセット選択部12は、3つ以上のグループから予測作成用グループを除く(ステップS105)。データセット選択部12は、予測作成用グループを除いた残りのグループから、1つのグループを予測評価用グループとして選択する(ステップS106)。データセット選択部12は、予測評価用グループに含まれるデータを、予測モデルの精度を評価するためのテスト用データとして設定し(ステップS107)、テスト用データを予測モデル作成部13に出力する(ステップS108)。
【0027】
また、データセット選択部12は、予測作成用グループを除いた残りのグループから、2つのグループを残差作成用グループおよび残差評価用グループとして選択する(ステップS109)。データセット選択部12は、残差作成用グループに含まれるデータを、残差特性推定モデルを作成するための残差学習用データとして設定し、残差評価用グループに含まれるデータを、残差特性推定モデルの精度を評価するための残差テスト用データとして設定する(ステップS110)。データセット選択部12は、残差学習用データおよび残差テスト用データを残差特性統計処理部14に出力する(ステップS111)。
【0028】
図3は、予測モデル作成部13の動作の一例を説明するためのフローチャートである。
【0029】
先ず、予測モデル作成部13は、データが有する複数の属性のいずれかを予測モデルの目的変数として選択し(ステップS201)、目的変数として選択された属性以外の属性から予測モデルの説明変数である第1の説明変数を選択する(ステップS202)。目的変数として選択される属性は、予め設定されていてもよいし、残差特性推定モデル作成システム10を利用するユーザにて設定可能であってもよい。第1の説明変数を選択する方法は、特に限定されない。例えば、目的変数ごとに第1の説明変数として選択される優先度を各属性に設定しておき、その優先度に基づいて選択されてもよい。第1の説明変数は、複数あってもよい。
【0030】
続いて、予測モデル作成部13は、
図2のステップS104で出力された学習用データに基づいて、ステップS202で選択した第1の説明変数からステップS201で選択した目的変数を算出(予測)する予測モデルを作成する(ステップS203)。予測モデルの作成には、公知の機械学習を用いることができる。
【0031】
そして、予測モデル作成部13は、
図1のステップS104で出力された学習用データと、
図1のステップS108で出力されたテスト用データとに基づいて、予測モデルの精度を評価する(ステップS204)。例えば、予測モデル作成部13は、テスト用データにおける第1の説明変数の属性値を予測モデルに代入して得られる第1の予測値と、学習用データにおける第1の説明変数の属性値を予測モデルに代入して得られる第2の予測値とを取得し、第1および第2の予測値のそれぞれの精度を示す第1の精度評価値および第2の精度評価値を評価結果として求める。精度評価値は、例えば、予測値の平均二乗誤差などである。
【0032】
予測モデル作成部13は、予測モデルの精度の評価結果に基づいて、ステップS203で作成した予測モデルを使用するか否かを判断する(ステップS205)。具体的には、予測モデル作成部13は、第1の精度評価値が第1の閾値以上か否かと、第2の精度評価値から第1の精度評価値を差し引いた精度差が第2の閾値以上か否かと、を判断する。予測モデル作成部13は、第1の精度評価値が第1の閾値以上、かつ、精度差が第2の閾値未満の場合、予測モデルを使用すると判断し、第1の精度評価値が第1の閾値未満の場合、および、精度差が第2の閾値以上の場合、予測モデルを使用しないと判断する。
【0033】
ステップS205で予測モデルを使用しないと判断した場合、予測モデル作成部13は、評価結果に基づいて、第1の説明変数を変更するか否かを判断する(ステップS206)。例えば、予測モデル作成部13は、精度差が第2の閾値以上か否かを判断することで、第1の説明変数を変更するか否かを判断する。精度差が第2の閾値以上の場合、予測モデル作成部13は、過学習が発生したと判断して、第1の説明変数を変更しないと判断する。一方、第1の精度評価値が第1の閾値未満の場合、予測モデル作成部13は、第1の精度評価値が第1の閾値未満である、つまり、予測モデルの精度が不十分であると判断して、第1の説明変数を変更すると判断する。
【0034】
予測モデル作成部13は、第1の説明変数を変更する場合、ステップS202の処理に戻り、第1の説明変数を変更しない場合、ステップS203の処理に戻る。ステップS202の処理に戻る場合、予測モデル作成部13は、第1の説明変数の次元削減などの処理を行ってもよい。また、ステップS203の処理に戻る場合、予測モデル作成部13は、予測モデルを作成するための機械学習のパラメータを適宜調整する。
【0035】
ステップS205で予測モデルを使用すると判断した場合、予測モデル作成部13は、作成した予測モデルと、その予測モデルの説明変数(第1の説明変数)および目的変数を説明変数IEおよび目的変数IOとして示す変数情報を出力する(ステップS207)。
【0036】
図4は、残差特性統計処理部14の動作の一例を説明するためのフローチャートである。
【0037】
先ず、残差特性統計処理部14は、
図2のステップS111で出力された残差学習用データにおける
図3のステップS207で出力された変数情報が示す説明変数IEを選択する(ステップS301)。残差特性統計処理部14は、
図3のステップS207で出力された予測モデルに説明変数IEの属性値を代入して得られる予測値を取得する(ステップS302)。そして、残差特性統計処理部14は、取得した予測値と、残差学習用データにおける目的変数IOを選択する(ステップS303)。
【0038】
残差特性統計処理部14は、予測値と目的変数IOの属性値である真値とを所定変数の値に変換するか否かを判断する(ステップS304)。例えば、予測値および真値を変換するか否かを示す変換要否情報を記録しておき、残差特性統計処理部14は、その変換要否情報に基づいて、予測値および真値を変換するか否かを判断する。変換要否情報は、ユーザにて設定可能であってもよい。また、変換要否情報の記録場所は、格納部11でもよいし、図示していない他の記録媒体でもよい。
【0039】
予測値および真値を変換すると判断した場合、残差特性統計処理部14は、代入された値を所定変数の値に変換する変換モデルを用いて、予測値および真値を所定変数の値に変換する(ステップS305)。変換モデルは、例えば、機械学習または他の手法を用いて予め作成されていてもよい。
【0040】
ステップS304で予測値および真値を変換しないと判断した場合、および、ステップS305で予測値および真値を変換した場合、残差特性統計処理部14は、予測値と真値との差である残差に応じた残差特性を生成する。残差特性統計処理部14は、残差特性、変数情報および残差学習用データと、
図2のステップS111で出力された残差テスト用データとを出力する(ステップS306)。なお、ステップS305で予測値および真値を変換した場合、残差特性統計処理部14は、変換した予測値と真値との残差に応じた残差特性を生成する。
【0041】
残差特性は、具体的には、残差に対して統計処理を行った統計値である。この場合、残差特性統計処理部14は、例えば、残差がガウス分布やワイブル分布など統計分布に近似できるか否かを判断し、残差が統計分布に近似できる場合、その統計分布の形状、平均および分散などを残差特性として算出し、残差が統計分布に近似できない場合、残差の平均二乗誤差および合計値などを残差特性として算出する。なお、残差が統計分布に近似できるか否かの判断は、例えば、残差に基づいて統計分布の特徴を示す特徴値を算出し、その特徴値が一定値以上か否かを判断することで行う。また、残差特性は、上記の例に限らず、例えば、残差そのものでもよい。
【0042】
図5は、残差特性推定モデル作成部15の動作の一例を説明するためのフローチャートである。
【0043】
先ず、残差特性推定モデル作成部15は、残差特性推定モデルの目的変数として、
図4のステップS306で出力された残差特性を選択する(ステップS401)。また、残差特性推定モデル作成部15は、データが有する複数の属性から残差特性推定モデルの説明変数である第2の説明変数を選択する(ステップS402)。第2の説明変数を選択する方法は、特に限定されない。例えば、第2の説明変数として選択される優先度を各属性に設定しておき、その優先度に基づいて選択されてもよい。第2の説明変数は、複数あってもよく、複数の第2の説明変数の少なくとも一部が第1の説明変数と重複してもよい。
【0044】
続いて、残差特性推定モデル作成部15は、
図4のステップS306(
図2のステップS111)で出力された残差学習用データに基づいて、ステップS402で選択した第2の説明変数からステップS401で選択した目的変数である残差特性を算出(予測)する残差特性推定モデルを作成する(ステップS403)。残差特性推定モデルの作成には、公知の機械学習を用いることができる。
【0045】
残差特性推定モデル作成部15は、
図4のステップS306(
図2のステップS111)で出力された残差学習用データおよび残差テスト用データに基づいて、残差特性推定モデルの精度を評価する(ステップS404)。例えば、残差特性推定モデル作成部15は、残差テスト用データにおける第2の説明変数の属性値を残差特性推定モデルに代入して得られる第1の推定値と、残差学習用データにおける第2の説明変数の属性値を残差特性推定モデルに代入して得られる第2の推定値とを取得し、第1および第2の推定値のそれぞれの精度を示す第1の残差精度評価値および第2の残差精度評価値を評価結果として求める。残差精度評価値は、例えば、推定値の平均二乗誤差などである。
【0046】
残差特性推定モデル作成部15は、残差特性推定モデルの精度の評価結果に基づいて、ステップS403で作成した残差特性推定モデルを使用するか否かを判断する(ステップS405)。具体的には、残差特性推定モデル作成部15は、第1の残差精度評価値が第1の残差閾値以上か否かと、第2の残差精度評価値から第1の残差精度評価値を差し引いた残差精度差が第2の残差閾値以上か否かと、を判断する。残差特性推定モデル作成部15は、第1の残差精度評価値が第1の残差閾値以上、かつ、残差精度差が第2の残差閾値未満の場合、残差特性推定モデルを使用すると判断し、第1の残差精度評価値が第1の残差閾値未満の場合、および、残差精度差が第2の残差閾値以上の場合、残差特性推定モデルを使用しないと判断する
【0047】
ステップS405で残差特性推定モデルを使用しない場合、残差特性推定モデル作成部15は、評価結果に基づいて、第2の説明変数を変更するか否かを判断する(ステップS406)。例えば、残差特性推定モデル作成部15は、残差精度差が第2の残差閾値以上か否かを判断することで、第2の説明変数を変更するか否かを判断する。残差精度差が第2の残差閾値以上の場合、残差特性推定モデル作成部15は、過学習が生じたと判断して、第2の説明変数を変更しないと判断する。一方、第1の精度評価値が第1の閾値未満の場合、残差特性推定モデル作成部15は、第1の残差精度評価値が第1の残差閾値である、つまり、残差特性モデルの精度が不十分であると判断して、第2の説明変数を変更すると判断する。
【0048】
残差特性推定モデル作成部15は、第2の説明変数を変更する場合、ステップS402の処理に戻り、第2の説明変数を変更しない場合、ステップS403の処理に戻る。ステップS402の処理に戻る場合、残差特性推定モデル作成部15は、第1の説明変数の次元削減などの処理を行ってもよい。また、ステップS403の処理に戻る場合、予残差特性推定モデル作成部15は、残差特性推定モデルを作成するための機械学習のパラメータを適宜調整する。
【0049】
ステップS405で残差特性推定モデルを使用すると判断した場合、残差特性推定モデル作成部15は、作成した残差特性推定モデルと、その残差特性推定モデルの第2の説明変数を説明変数IIEとして示す残差変数情報を出力する(ステップS207)。
【0050】
図6は、変数偏在性評価部16の動作の一例を説明するためのフローチャートである。
【0051】
変数偏在性評価部16は、
図3のステップS207で出力された変数情報が示す目的変数IOおよび説明変数IEと、
図5のステップS407で出力された残差変数情報が示す説明変数IIEとのいずれかを対象変数として選択する(ステップS501)。変数偏在性評価部16は、対象変数の値が数値か否かを確認する(ステップS502)。
【0052】
対象変数の値が数値の場合、変数偏在性評価部16は、データセット選択部12にて分割されたグループごとに、そのグループに含まれるデータの対象変数の値の平均および分散の少なくとも一方を偏在値として算出する(ステップS503)。
【0053】
一方、対象変数の値が数値でない場合、変数偏在性評価部16は、データセット選択部12にて分割されたグループごとに、そのグループに含まれるデータの対象変数の値を複数のカテゴリのいずれかに分類し、各カテゴリに含まれる値を有するデータの含有率を偏在値として算出する(ステップS504)。カテゴリは、例えば、属性ごとに予め定められている。含有率は、例えば、(カテゴリに含まれる値を有するデータの数)/(グループ内のデータの総数)である。
【0054】
なお、偏在値は、予測用グループおよび残差用グループのそれぞれについて算出されてもよいし、予測作成用グループ、予測評価用グループ、残差用グループおよび残差作成用グループのそれぞれについて算出されてもよい。
【0055】
変数偏在性評価部16は、各グループの偏在値に基づいて、データセットのグループ分けを変更するか否かを判断する(ステップS505)。例えば、変数偏在性評価部16は、グループの全ての組合せについて、それらのグループ間の偏在値の差の絶対値を指標値として算出し、その指標値が所定値以上か否かを判断する。変数偏在性評価部16は、全ての指標値が所定値未満の場合、偏在値が許容条件を満たすと判断して、グループ分けを変更しないと判断し、指標値のいずれかが所定値以上の場合、偏在値が許容条件を満たさないと判断して、グループ分けを変更すると判断する。
【0056】
グループ分けを変更する場合、変数偏在性評価部16は、データセット選択部12に対してグループ分けの変更を指示し(ステップS506)、処理を終了する。グループ分けの変更が指示されたデータセット選択部12は、
図1のステップS101の処理を再度実行する。
【0057】
グループ分けを変更しない場合、変数偏在性評価部16は、目的変数IO、説明変数IEおよび説明変数IIEの全ての変数を選択したか否かを判断する(ステップS507)。
【0058】
全ての変数を選択していない場合、変数偏在性評価部16は、ステップS501の処理に戻る。ステップS501では、変数偏在性評価部16は、目的変数IO、説明変数IEおよび説明変数IIEのうちまだ選択されていない変数を対象変数として選択する。一方、全ての変数を選択した場合、変数偏在性評価部16は、
図3のステップS207で出力された予測モデルと、
図5のステップS407で出力された残差特性推定モデルとを出力する(ステップS508)。ステップS507で出力された予測モデルおよび残差特性推定モデルは、出力部17によって出力される。
【0059】
以下、本開示の残差特性推定モデル作成システム10を、風力発電によって発電される発電電力量の残差特性を可視化するために利用した具体例について説明する。
【0060】
本具体例では、格納部11は、データセットとして、300箇所の地点のそれぞれに対応するデータを格納する。データは、時系列データであり、属性として、気象予報情報、土地情報および気象実測情報を有する。気象予報情報は、各地点における気象に関する予報を示す情報であり、例えば、温度、湿度、風速および降水量などの予報値を示す数値情報と、晴、曇および雨などを示す天気情報のような定性的情報とを含む。土地情報は、各地点における地理的な情報であり、位置、標高、傾斜角度および傾斜方向などを示す数値情報と、海、陸、平地および山地などを示す種別情報のような定性的情報とを含む。気象実測情報は、各地点のうちの特定点における気象に関する実測値を示す情報であり、ここでは、風速の実測値を示す。特定点は、複数あってもよい。
【0061】
データセット選択部12は、300箇所のデータをランダムに3つのグループ1~3に分割する。グループ1~3は、それぞれ100箇所のデータを含む。データセット選択部12は、グループ1に含まれるデータを学習用データ、グループ2に含まれるデータをテスト用データおよび残差学習用データ、グループ3に含まれるデータを残差テスト用データに設定する。つまり、グループ1が予測作成用グループと対応し、グループ2が予測評価用グループおよび残差作成用グループと兼用され、グループ3が残差評価用グループと対応する。
【0062】
予測モデル作成部13は、予測モデルの目的変数として特定点における気象実測情報を選択し、予測モデルの説明変数である第1の説明変数として特定点の周囲の地点における気象予報情報に含まれる風速である予報風速を選択する。予測モデル作成部13は、グループ1を用いて予測モデルを作成し、グループ1および2を用いて予測モデルの精度を評価する。このとき、予測モデルの精度が不十分な場合、予測モデル作成部13は、第1の説明変数として、特定点の周囲の地点における気象予報情報に含まれる温度および湿度などを追加して、予測モデルを再度作成する。また、過学習が発生した場合、予測モデル作成部13は、機械学習のパラメータを調整して、予測モデルを再度作成する。
【0063】
残差特性統計処理部14は、グループ2に含まれる残差学習用データにおける第1の説明変数として選択された属性の属性値を予測モデルに代入して得られる予測値と、予測モデルの目的変数の属性値である風速の実測値とを、発電電力量変換式を用いて発電電力量に変換する。発電電力量変換式は、所定変数を風力発電による発電電力量とした変換モデル、つまり、風速を発電電力量に変換する変換モデルである。
【0064】
残差特性統計処理部14は、発電電力量に変換された予測値と実測値との残差に応じた残差特性を算出する。残差特性は、例えば、平均二乗誤差である。このとき、残差特性統計処理部14は、特定点ごとに残差特性を算出する。
【0065】
残差特性推定モデル作成部15は、残差特性推定モデルの目的変数として特定点における残差特性を設定し、残差特性推定モデルの説明変数として特定点における土地情報に含まれる標高および傾斜角度を設定する。そして、残差特性推定モデル作成部15は、グループ2を用いて残差特性推定モデルを作成し、グループ2および3を用いて残差特性推定モデルの精度を評価する。このとき、残差特性モデルの精度が不十分な場合、残差特性推定モデル作成部15は、第2の説明変数として、特定点における種別情報などを追加して、残差特性推定モデルを再度作成する。また、過学習が発生した場合、残差特性推定モデル作成部15は、機械学習のパラメータを調整して、残差特性推定モデルを再度作成する。
【0066】
第2の説明変数は、その値に応じて他の第2の説明変数として選択される属性が変化する判断指標となる属性を含んでもよい。判断指標は、例えば、種別情報である。この場合、例えば、種別情報が陸を示す場合、他の第2の説明変数として傾斜角度および傾斜方向が選択され、種別情報が海を示す場合、他の第2の説明変数として標高(深度)が選択される。
【0067】
変数偏在性評価部16は、予測モデルで使用した第1の説明変数および目的変数と、残差特性推定モデルで使用した第2の説明変数に対する偏在値を算出し、その偏在値に基づいて、グループ分けを変更するか否かを判断する。例えば、第1の説明変数が風速、偏在値が平均値の場合に、グループ1および2のそれぞれの偏在値(風速の平均値)が4m/sおよび6m/s、許容条件となる所定値が1m/sであったとする。この場合、偏在値の差の絶対値である指標値が2m/sとなり、指標値が所定値以上であるため、変数偏在性評価部16は、グループ分けを変更すると判断する。
【0068】
グループ分けを変更しない場合、出力部17は、予測モデルと残差特性推定モデルとを出力する。
【0069】
図7は、残差特性推定モデルの使用例を説明するための図である。
図7は、各地点における第2の説明変数の値を残差特性推定モデルに代入することで得られる各地点の残差特性の予測値を地点ごとに示す表示情報601を示している。表示情報601では、残差特性の予測値を3段階で表し、各段階を異なるハッチング(ハッチングなしを含む)で示している。
【0070】
表示情報601において、各地点のいずれかが選択されると、その選択された地点における残差特性の予測を詳細に示す詳細情報が表示されてもよい。図の例では、地点Aに対応する詳細情報602と地点Bに対応する詳細情報とが示されている。
【0071】
地点Aは、残差特性推定モデルの説明変数である第2の説明変数と、残差特性推定モデルの目的変数である残差特性の真値との両方が存在する地点であり、地点Bは、第2の説明変数が存在するが、残差特性の真値が存在しない地点である。
【0072】
地点Aに対応する詳細情報602では、残差特性の予測値と真値の両方が示され、地点Aに対応する詳細情報603では、残差特性の予測値が示されている。したがって、残差特性の真値がない地点でも、残差特性の予測値を示すことが可能になるため、残差特性を把握することが可能になる。なお、図の例では、推定した残差特性がガウス分布に近似され、その平均と偏差とが示されている。また、残差特性の表示例は、この例に限らない。
【0073】
以上のように風速の実測値が測定されていない地点においても、残差特性推定モデルを用いて、発電電力量または風速の残差特性を予測することが可能になる。したがって、発電電力量の予測値だけでなく、その信頼性(発電電力量の予測しやすさ)を考慮して、発電設備を設置することが可能になる。これにより、電力を発電設備から送電網に供給する際の電力平準化を図るための蓄電池容量や、電力系統安定化のために必要なバックアップなどにかかるコストを精度良く算出することが可能になる。
【0074】
なお、上記の例では、残差特性推定モデルを用いて、風力発電によって発電される発電電力量の残差特性を推定していたが、残差特性を推定する対象は、この例に限らない。残差特性を推定する対象は、例えば、太陽光発電などの他の自然エネルギー発電による発電電力量でもよいし、発電とは異なる分野のものでもよい。
【0075】
以上説明したように、本開示は以下の事項を含む。
【0076】
本開示の一態様に係る残差特性推定モデル作成方法では、複数の属性を有するデータの集合(データセット)に基づいて、複数の属性のいずれかである目的変数を、複数の属性から選択される第1の説明変数から算出する予測モデルを作成する(13)。また、データの集合に基づいて、予測モデルに第1の説明変数の値を代入して得られる予測値と、目的変数の値である真値との残差に応じた残差特性を算出する(14)。そして、データの集合に基づいて、残差特性を、複数の属性から選択される第2の説明変数から算出する残差特性推定モデルを作成する。
【0077】
上記構成によれば、データが有する複数の属性のいずれかである目的変数を、複数の属性から選択される第1の説明変数から算出する予測モデルと、予測モデルに第1の説明変数の値を代入して得られる予測値と目的変数の値である真値との残差に応じた残差特性を、複数の属性から選択される第2の説明変数から算出する残差特性推定モデルとが作成される。したがって、残差特性推定モデルを用いて、予測モデルによる予測値と真値との残差に応じた残差特性の予測値を算出することが可能になるため、真値との比較ができない場合でも予測値の信頼性を評価することが可能になる。
【0078】
また、予測モデルの作成では、データの集合に含まれる第1の部分集合(予測用グループ)に基づいて、予測モデルを作成し、残差特性の算出では、データの集合に含まれる第2の部分集合(残差用グループ)に基づいて、残差特性を算出し、残差特性推定モデルの算出では、第2の部分集合に基づいて、残差特性推定モデルを算出する。これにより、予測モデルの正解データを使用せずに、残差特性推定モデルを算出することが可能になるため、残差特性推定モデルが予測モデルに対して過剰に適合し、残差特性推定モデルによる残差特性の予測値の精度が低くなることを抑制することが可能になる。
【0079】
また、予測モデルの作成では、第1の部分集合に含まれる第3の部分集合(予測作成用グループ)に基づいて予測モデルを作成し、第1の部分集合に含まれる、第3の部分集合(予測評価用グループ)とは異なる第4の部分集合に基づいて、予測モデルの精度を評価し、当該評価結果が第1の精度条件を満たすまで予測モデルを繰り返し作成する。このため、予測モデルによる予測値を精度良く算出することが可能になる。
【0080】
また、第2の部分集合は、第3の部分集合を含まない。このため、残差特性推定モデルを算出するデータから予測モデルの正解データを適切に除外することが可能になるため残差特性推定モデルによる残差特性の予測値の精度が低くなることを抑制することが可能になる。
【0081】
また、第2の部分集合は、第4の部分集合を含む。このため、予測モデルの正解データを適切に除外しつつ、残差特性推定モデルを算出するデータの数を増やすことが可能になるため、残差特性推定モデルによる残差特性の予測値を精度良く算出することが可能になる。
【0082】
また、残差特性推定モデルの作成では、第2の部分集合に含まれる第5の部分集合(残差作成用グループ)に基づいて残差特性推定モデルを作成し、第2の部分集合に含まれる、第5の部分集合とは異なる第6の部分集合(残差評価用グループ)に基づいて、残差特性推定モデルの精度を評価し、当該評価結果が第2の精度条件を満たすまで残差特性推定モデルを繰り返し作成する。このため、残差特性推定モデルによる残差特性の予測値を精度良く算出することが可能になる。
【0083】
また、データの集合から第1の部分集合および第2の部分集合を選択し(12)、部分集合ごとに、当該部分集合に含まれるデータが有する属性の値の偏りを示す偏在値を算出し(16)、偏在値が所定の許容条件を満たさない場合、第1の部分集合と第2の部分集合とを再度選択する。この構成によれば、第1の部分集合および第2の部分集合に含まれるデータが有する属性の値の偏りを軽減することが可能になるため、精度の良い予測モデルおよび残差特性推定モデルを作成することが可能になる。
【0084】
偏在値の算出では、第1の説明変数、第2の説明変数および目的変数に対する偏在値を算出する。このため、予測モデルおよび残差特性推定モデルに影響を与える属性に対する偏在値を算出すればよいため、偏在値を求めるための負荷を軽減することが可能になる。これは、属性全体の数が多い場合、予測モデルおよび残差特性推定モデルの作成に使用する属性の数が少ない場合、または、その両方の場合などに、特に顕著な効果を奏する。
【0085】
また、データの集合から第1の部分集合および第2の部分集合をランダムに選択する。この構成によれば、第1の部分集合および第2の部分集合に含まれるデータが有する属性の値の偏りを軽減することが可能になるため、精度の良い予測モデルおよび残差特性推定モデルを作成することが可能になる。
【0086】
また、残差特性は、残差に関する統計値である。このため、残差を統計的に評価することが可能になる。
【0087】
残差特性の算出では、予測値と真値とを所定変数の値に変換し、当該変換した予測値と真値との残差に応じた残差特性を算出する。この構成によれば、データの属性以外の情報で残差特性を把握することが可能になるため、残差特性を所望の変数の値として確認することが可能になり、ユーザビリティを高くすることが可能になる。
【0088】
目的変数は、気象に関する気象変数であり、所定変数は、電力量である。この構成によれば、風力発電や太陽光発電による発電電力量などの残差特性を容易に把握することが可能になる。
【0089】
上述した本開示の実施形態は、本開示の説明のための例示であり、本開示の範囲をそれらの実施形態にのみ限定する趣旨ではない。当業者は、本開示の範囲を逸脱することなしに、他の様々な態様で本開示を実施することができる。
【符号の説明】
【0090】
11:格納部 12:データセット選択部 13:予測モデル作成部 14:残差特性統計処理部 15:残差特性推定モデル作成部 16:変数偏在性評価部 17:出力部