(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024039988
(43)【公開日】2024-03-25
(54)【発明の名称】最適化プログラム、最適化方法および情報処理装置
(51)【国際特許分類】
G06Q 30/0202 20230101AFI20240315BHJP
G06Q 10/04 20230101ALI20240315BHJP
G06N 20/00 20190101ALI20240315BHJP
【FI】
G06Q30/02 310
G06Q10/04
G06N20/00
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022144775
(22)【出願日】2022-09-12
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002918
【氏名又は名称】弁理士法人扶桑国際特許事務所
(72)【発明者】
【氏名】飯村 由信
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049AA04
5L049BB01
(57)【要約】
【課題】機械学習モデルの予測値を利用した操作量の最適化を効率化する。
【解決手段】情報処理装置10は、第1の期間に発生する第1の需要量に対する実績値を示す実績データ13に基づいて、実績値に応じて操作量を最適化することで獲得される利益14を算出する。情報処理装置10は、訓練済みの予測モデル15を用いて、第1の需要量に対する第1の予測値を算出する。情報処理装置10は、補正モデル16を用いて第1の予測値から補正された第2の予測値に応じて操作量を最適化することで獲得される利益17と、利益14との比較に基づいて、補正モデル16を決定する。情報処理装置10は、予測モデル15および補正モデル16を用いて、第1の期間と異なる第2の期間に発生する第2の需要量に対する第3の予測値を算出し、第3の予測値に応じて最適化された操作量を示す計画データ18を出力する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1の期間に発生する第1の需要量に対する実績値を示す実績データに基づいて、前記実績値に応じて操作量を最適化することで獲得される第1の利益を算出し、
訓練済みの予測モデルを用いて、前記第1の需要量に対する第1の予測値を算出し、
補正モデルを用いて前記第1の予測値から補正された第2の予測値に応じて前記操作量を最適化することで獲得される第2の利益と、前記第1の利益との比較に基づいて、前記補正モデルを決定し、
訓練済みの前記予測モデルおよび決定された前記補正モデルを用いて、前記第1の期間と異なる第2の期間に発生する第2の需要量に対する第3の予測値を算出し、前記第3の予測値に応じて最適化された前記操作量を示す計画データを出力する、
処理をコンピュータに実行させる最適化プログラム。
【請求項2】
前記補正モデルの決定は、前記第1の利益と前記第2の利益との差が最小になる前記補正モデルを探索する処理を含む、
請求項1記載の最適化プログラム。
【請求項3】
前記予測モデルは、異なる時刻それぞれに対して前記第1の予測値を算出し、
前記補正モデルは、前記異なる時刻に応じて異なる補正値を付与する、
請求項1記載の最適化プログラム。
【請求項4】
前記第1の利益の算出は、前記実績値に基づいて、前記第1の利益が最大になる前記操作量を探索する処理を含む、
請求項1記載の最適化プログラム。
【請求項5】
第1の期間に発生する第1の需要量に対する実績値を示す実績データに基づいて、前記実績値に応じて操作量を最適化することで獲得される第1の利益を算出し、
訓練済みの予測モデルを用いて、前記第1の需要量に対する第1の予測値を算出し、
補正モデルを用いて前記第1の予測値から補正された第2の予測値に応じて前記操作量を最適化することで獲得される第2の利益と、前記第1の利益との比較に基づいて、前記補正モデルを決定し、
訓練済みの前記予測モデルおよび決定された前記補正モデルを用いて、前記第1の期間と異なる第2の期間に発生する第2の需要量に対する第3の予測値を算出し、前記第3の予測値に応じて最適化された前記操作量を示す計画データを出力する、
処理をコンピュータが実行する最適化方法。
【請求項6】
第1の期間に発生する第1の需要量に対する実績値を示す実績データを記憶する記憶部と、
前記実績データに基づいて、前記実績値に応じて操作量を最適化することで獲得される第1の利益を算出し、訓練済みの予測モデルを用いて、前記第1の需要量に対する第1の予測値を算出し、補正モデルを用いて前記第1の予測値から補正された第2の予測値に応じて前記操作量を最適化することで獲得される第2の利益と、前記第1の利益との比較に基づいて、前記補正モデルを決定し、訓練済みの前記予測モデルおよび決定された前記補正モデルを用いて、前記第1の期間と異なる第2の期間に発生する第2の需要量に対する第3の予測値を算出し、前記第3の予測値に応じて最適化された前記操作量を示す計画データを出力する処理部と、
を有する情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は最適化プログラム、最適化方法および情報処理装置に関する。
【背景技術】
【0002】
コンピュータは、在庫資源の購入や放出などの操作量を、需要量に応じて最適化することで、獲得される利益を最大化したいことがある。最適化対象とする期間の需要量が未知である場合、コンピュータは、機械学習モデルを用いて需要量を予測し、予測した需要量を前提として最適な操作量を計画することがある。
【0003】
例えば、将来期間の需要量を予測する推定装置が提案されている。提案の推定装置は、過去期間の需要量に基づいて機械学習モデルを訓練し、訓練された機械学習モデルを用いて将来期間の需要量を予測する。推定装置は、予測された需要量の変動が、当該予測された需要量を前提として獲得される期待利益に与える影響を示す影響度を算出する。推定装置は、算出された影響度を重みとして用いて機械学習モデルを再訓練し、再訓練された機械学習モデルを用いて将来期間の需要量を推定し直す。
【0004】
なお、過去の売上データに基づいて、類似する製品間の代替関係を推定する顧客モデルを生成し、需給バランスが悪化した際に、機会損失および在庫コストを最小化するアクションを選択する需給均衡化方法が提案されている。また、過去期間の商品の需要量に基づいて将来期間の需要量を予測し、予測した需要量を前提として、利益が最大になるような発注計画を生成する発注量決定装置が提案されている。また、過去期間における商品の販売数を、欠品により販売機会を喪失した回数を加えることで補正し、補正された販売実績データを用いて機械学習モデルを訓練する需要予測装置が提案されている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2018-116700号公報
【特許文献2】米国特許出願公開第2015/0066566号明細書
【特許文献3】特開2016-91217号公報
【特許文献4】特開2021-103374号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
機械学習モデルの予測精度には限界があるため、予測した需要量と実際の需要量との間に差異が生じることがある。この場合、予測した需要量を前提として計画された操作量を実施しても、過剰在庫による在庫ロスの発生や在庫不足による機会損失の発生などの理由で、期待したほど利益が獲得されないことがある。
【0007】
この点、機械学習モデルは、操作量の最適化にとっての重要度に関係なく、予測した需要量の誤差が平均的に小さくなるように訓練されることが多い。例えば、機械学習モデルは、利益を大きくするという観点から重要度の高い時刻と重要度の低い時刻とを区別せずに、全ての時刻における需要量の予測誤差が平均的に小さくなるように訓練される。そこで、操作量を最適化する際に、重要度の高い需要量の予測誤差が優先的に小さくなるように、上記のように機械学習モデルを再訓練する方法が考えられる。
【0008】
しかし、操作量を最適化する毎に訓練済みの機械学習モデルを再訓練することは、最適化の計算量や所要時間が増大して非効率になるおそれがある。また、複雑な機械学習モデルを再訓練することは、訓練済みの機械学習モデルを利用しようとするユーザの負担が大きい。そこで、1つの側面では、本発明は、機械学習モデルの予測値を利用した操作量の最適化を効率化することを目的とする。
【課題を解決するための手段】
【0009】
1つの態様では、以下の処理をコンピュータに実行させる最適化プログラムが提供される。第1の期間に発生する第1の需要量に対する実績値を示す実績データに基づいて、実績値に応じて操作量を最適化することで獲得される第1の利益を算出する。訓練済みの予測モデルを用いて、第1の需要量に対する第1の予測値を算出する。補正モデルを用いて第1の予測値から補正された第2の予測値に応じて操作量を最適化することで獲得される第2の利益と、第1の利益との比較に基づいて、補正モデルを決定する。訓練済みの予測モデルおよび決定された補正モデルを用いて、第1の期間と異なる第2の期間に発生する第2の需要量に対する第3の予測値を算出し、第3の予測値に応じて最適化された操作量を示す計画データを出力する。
【0010】
また、1つの態様では、コンピュータが実行する最適化方法が提供される。また、1つの態様では、記憶部と処理部とを有する情報処理装置が提供される。
【発明の効果】
【0011】
1つの側面では、機械学習モデルの予測値を利用した操作量の最適化を効率化できる。
【図面の簡単な説明】
【0012】
【
図1】第1の実施の形態の情報処理装置を説明するための図である。
【
図2】第2の実施の形態の情報処理システムの例を示す図である。
【
図3】サーバ装置のハードウェア例を示すブロック図である。
【
図4】予測需要量に基づく操作計画の例を示すグラフである。
【
図5】サーバ装置の機能例を示すブロック図である。
【
図9】操作計画決定の手順例を示すフローチャートである。
【
図10】実際需要量と予測需要量の比較例を示すグラフである。
【
図11】理想利益と予測利益の比較例を示すグラフである。
【発明を実施するための形態】
【0013】
以下、本実施の形態を図面を参照して説明する。
[第1の実施の形態]
第1の実施の形態を説明する。
【0014】
図1は、第1の実施の形態の情報処理装置を説明するための図である。
第1の実施の形態の情報処理装置10は、機械学習モデルを用いて需要量を予測し、予測した需要量に応じた最適な操作量の計画を生成する。情報処理装置10は、クライアント装置でもよいしサーバ装置でもよい。情報処理装置10が、コンピュータ、最適化装置または機械学習装置と呼ばれてもよい。
【0015】
情報処理装置10は、記憶部11および処理部12を有する。記憶部11は、RAM(Random Access Memory)などの揮発性半導体メモリでもよいし、HDD(Hard Disk Drive)やフラッシュメモリなどの不揮発性ストレージでもよい。処理部12は、例えば、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、DSP(Digital Signal Processor)などのプロセッサである。ただし、処理部12が、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの電子回路を含んでもよい。プロセッサは、例えば、RAMなどのメモリ(記憶部11でもよい)に記憶されたプログラムを実行する。プロセッサの集合が、マルチプロセッサまたは単に「プロセッサ」と呼ばれてもよい。
【0016】
記憶部11は、実績データ13を記憶する。実績データ13は、第1の期間に発生した需要量の実績値を示す。第1の期間は、以下の処理を行う時点より前の過去期間である。実績値は、実際需要量と呼ばれてもよい。需要量は、例えば、予め蓄積しておくことが可能であり経済的価値をもつ資源の消費量である。将来の需要量は、天候や経済状態などの環境条件に依存するため、誤差なく予測することが困難である。需要量は、例えば、電気などのエネルギー資源の消費量や、商品の販売量などである。実績データ13は、第1の期間に属する複数の時刻に対応する複数の実績値を含んでもよい。例えば、実績データ13は、24時間分の電力消費量の測定値を含む。
【0017】
また、記憶部11は、訓練済みの予測モデル15を記憶する。予測モデル15は、需要量を予測する機械学習モデルである。予測モデル15を訓練する機械学習は、情報処理装置10によって行われてもよいし、他の情報処理装置によって行われてもよい。予測モデル15は、実績データ13を用いて訓練されてもよい。予測モデル15のモデル構造は限定されず、線形回帰モデルまたは非線形回帰モデルでもよい。予測モデル15は、気温や雨量などの需要量以外の入力データから需要量を予測するものであってもよい。また、予測モデル15は、直近の需要量の変動からその後の需要量を予測するものであってもよい。例えば、予測モデル15は、気温などの気象情報から電力消費量を予測する。
【0018】
処理部12は、予測モデル15を用いて第2の期間に発生する需要量の予測値を算出し、算出した予測値に応じて操作量を最適化する。第2の期間は、例えば、第1の期間より後の期間であり、予測時点より後の将来期間でもよい。予測値は、予測需要量と呼ばれてもよい。操作量は、例えば、在庫資源の入出力量であり、活動量(アクション量)と呼ばれてもよい。操作量は、蓄電池への充電量のようなエネルギー資源の購入量と、蓄電池からの放電量のようなエネルギー資源の放出量であってもよい。また、操作量は、商品の仕入れ量と在庫商品の出庫量であってもよい。
【0019】
操作量は、例えば、獲得される利益が最大になるように最適化される。例えば、処理部12は、エネルギー資源を単価の低い時刻に購入して蓄積し、蓄積したエネルギー資源を単価の高い時刻に放出して消費するように操作量を計画する。これにより、コスト節約益が発生する。また、例えば、処理部12は、事前に商品を仕入れて入庫し、需要量の多い時刻に在庫商品を出庫するように操作量を計画する。これにより、売上利益が発生する。このとき、処理部12は、需要量の予測値に基づいて、過剰在庫による在庫ロスや在庫不足による機会損失が抑制されるように操作量を最適化する。ただし、処理部12は、予測モデル15が出力する予測値をそのまま使用せず、補正された予測値を使用する。
【0020】
まず、処理部12は、実績データ13に基づいて、実績値に応じて操作量を最適化することで獲得される利益14を算出する。利益14は、需要量の予測誤差がないと仮定した場合に過去に獲得することが可能であった最大の利益であり、達成可能最大利益または理想利益と呼ばれてもよい。例えば、処理部12は、実績データ13が示す実績値を前提として、利益が最大になる最適な操作量を探索し、最適な操作量に対応する利益を利益14として算出する。この最適な操作量は、理想操作量と呼ばれてもよい。
【0021】
また、処理部12は、予測モデル15を用いて、実績データ13と同じ第1の期間について需要量の予測値を算出する。例えば、処理部12は、第1の期間の気象情報を予測モデル15に入力することで、第1の期間の予測値を算出する。処理部12は、利益14と第1の期間の予測値とを用いて、補正モデル16を決定する。補正モデル16は、予測モデル15が出力する予測値を補正するものであり、補正関数または機械学習モデルと呼ばれてもよい。補正モデル16の決定は、最適化、訓練または機械学習と呼ばれてもよい。補正モデル16のモデル構造は限定されない。補正モデル16は、予測モデル15が出力する予測値に対して、時刻に応じて異なる補正値を加算するものであってもよい。
【0022】
処理部12は、補正モデル16を用いて補正された予測値に応じて操作量を最適化することで獲得される利益17と、利益14との比較に基づいて、補正モデル16を決定する。補正された予測値は、補正後需要量と呼ばれてもよい。例えば、処理部12は、利益14と利益17との差が最小になるように補正モデル16を決定する。補正モデル16の決定には、遺伝的アルゴリズム(GA:Genetic Algorithm)や粒子群最適化(PSO:Particle Swarm Optimization)などのメタヒューリスティクスが使用されてもよい。また、補正モデル16の決定には、最急降下法が用いられてもよい。メタヒューリスティクスは、特定の問題に依存しない発見的方法である。
【0023】
例えば、処理部12は、補正モデル16を初期化する。処理部12は、予測モデル15が出力する予測値を補正モデル16によって補正し、補正された予測値を前提として、獲得される利益が最大になる最適な操作量を探索し、最適な操作量に対応する利益を利益17として算出する。処理部12は、利益14と利益17との差が小さくなるように、補正モデル16を更新する。処理部12は、利益17の算出と補正モデル16の更新とを所定の収束条件が満たされるまで繰り返し、補正モデル16を決定する。
【0024】
補正モデル16が決定されると、処理部12は、予測モデル15および補正モデル16を用いて、第2の期間に発生する需要量について補正済みの予測値を算出する。例えば、処理部12は、第2の期間の気象情報を予測モデル15に入力することで補正前の予測値を算出し、補正前の予測値を補正モデル16に入力することで補正後の予測値を算出する。予測モデル15に入力される第2の期間のデータは、気象予報情報などの予想データであってもよい。予測モデル15および補正モデル16は、予測モデル15の後段に補正モデル16が連結された単一の機械学習モデルとみなされてもよい。
【0025】
処理部12は、補正された予測値に応じて最適化された操作量を示す計画データ18を生成し、計画データ18を出力する。例えば、処理部12は、第2の期間の需要量についての補正された予測値を前提として、獲得される利益が最大になる最適な操作量を探索する。計画データ18は、第2の期間に属する複数の時刻に対応する複数の操作量を含んでもよい。例えば、計画データ18は、24時間分の蓄電池の充放電量を含む。処理部12は、計画データ18を不揮発性ストレージに保存してもよいし、表示装置に表示してもよいし、他の情報処理装置に送信してもよい。
【0026】
なお、補正モデル16は、将来期間の操作量を計画する毎に決定されてもよい。また、補正モデル16は、時の経過によって実績データ13が増加する毎に修正されてもよい。また、計画データ18は、蓄電池の充放電を制御する電力制御デバイスのように、在庫資源の入出力を制御する制御デバイスに出力されてもよく、そのような制御デバイスによって在庫資源の入出力の制御のために用いられてもよい。
【0027】
以上説明したように、第1の実施の形態の情報処理装置10は、第1の期間の需要量の実績値に応じて操作量を最適化することで獲得される利益14を算出すると共に、訓練済みの予測モデル15を用いて、第1の期間の需要量の予測値を算出する。情報処理装置10は、補正モデル16を用いて補正された予測値に応じて操作量を最適化することで獲得される利益17と、利益14との比較に基づいて、補正モデル16を決定する。情報処理装置10は、予測モデル15および補正モデル16を用いて、第2の期間の需要量の予測値を算出し、この予測値に応じて最適化された操作量を示す計画データ18を出力する。
【0028】
これにより、より大きい利益を獲得できると期待される操作量が提示される。また、情報処理装置10は、訓練済みの予測モデル15を利用して操作量を最適化することができ、予測モデル15を再訓練しなくてもよい。よって、計算量や処理時間が減少して操作量の最適化が効率化されると共に、ユーザの負担が軽減される。また、予測モデル15の予測値が補正モデル16によって補正される。よって、操作量の最適化にとって重要な需要量の予測精度が優先的に高くなるように予測値が補正され、予測モデル15の出力をそのまま使用する場合よりも最適化の精度が向上する。
【0029】
なお、情報処理装置10は、補正モデル16の決定において、利益14と利益17との差が最小になる補正モデル16を探索してもよい。これにより、情報処理装置10は、最適化結果を、需要量の予測誤差がない場合の理想的な操作量に近づけることができる。また、予測モデル15は、異なる時刻それぞれに対して予測値を算出するものであってもよく、補正モデル16は、時刻に応じて異なる補正値を付与するものであってもよい。これにより、時刻によって価格が異なるような資源について、操作量の最適化の精度が向上する。また、情報処理装置10は、利益14の算出において、実績データ13が示す実績値を前提として、利益14が最大になる操作量を探索してもよい。これにより、利益が最大になる可能性が高い最適化結果が得られるように、補正モデル16が決定される。
【0030】
[第2の実施の形態]
次に、第2の実施の形態を説明する。
図2は、第2の実施の形態の情報処理システムの例を示す図である。
【0031】
第2の実施の形態の情報処理システムは、電力系統31、ネットワーク32、電気製品群33、蓄電池34、蓄電池制御部35およびサーバ装置36を含む。蓄電池制御部35およびサーバ装置36は、ネットワーク32に接続されている。サーバ装置36は、第1の実施の形態の情報処理装置10に対応する。
【0032】
電力系統31は、需要設備に電力を供給するために発電、変電、送電および配電を行うシステムである。電力系統31は、電力事業者によって保有される。ネットワーク32は、データ通信ネットワークである。ネットワーク32は、LAN(Local Area Network)を含んでもよく、インターネットなどの広域ネットワークを含んでもよい。また、ネットワーク32は、有線ネットワークを含んでもよく、無線ネットワークを含んでもよい。
【0033】
電気製品群33は、電力系統31から供給される電気を用いて動作するデバイス群である。電気製品群33は、家屋に設置されてもよいし、事業所に設置されてもよいし、屋外に設置されてもよい。電気製品群33が使用する電気は、電力系統31から直接供給されたものであることもあるし、蓄電池34に一旦蓄積されたものであることもある。
【0034】
蓄電池34は、電力系統31から供給される電気を一時的に蓄積する電池デバイスである。蓄電池34は、家屋に設置されてもよいし、事業所に設置されてもよいし、屋外に設置されてもよい。蓄電池34は、蓄電池制御部35からの指示に応じて充電を行い、蓄電池制御部35からの指示に応じて電気製品群33に対して放電を行う。
【0035】
蓄電池制御部35は、蓄電池34の充放電を制御する制御デバイスである。蓄電池制御部35は、コンピュータであってもよい。蓄電池制御部35は、事前に入力される充放電計画に従い、特定の時間帯に電力系統31から蓄電池34への充電を指示し、特定の時間帯に蓄電池34から電気製品群33への放電を指示する。充放電計画は、蓄電池34のユーザから入力されてもよいし、サーバ装置36から受信されてもよい。
【0036】
通常、充電時刻は、24時間のうち電気料金単価の安い時刻であり、放電時刻は、24時間のうち電気料金単価の高い時刻である。これにより、電気料金の節約額に相当する利益が発生する。また、蓄電池制御部35は、1時間毎の電気製品群33の電力消費量を需要量として測定し、測定された需要量のデータをサーバ装置36に送信する。
【0037】
サーバ装置36は、蓄電池制御部35から受信されるデータに基づいて、電気料金を最も節約できるような蓄電池34の充放電計画を生成するサーバコンピュータである。サーバ装置36は、データセンタに配置されてもよく、いわゆるクラウドシステムに含まれてもよい。サーバ装置36は、生成した充放電計画をユーザに対して出力してもよく、生成した充放電計画を蓄電池制御部35に送信してもよい。また、サーバ装置36の機能をもつコンピュータが、家屋または事業所に設置されてもよい。また、サーバ装置36の機能をもつコンピュータが、クライアントコンピュータであってもよい。
【0038】
図3は、サーバ装置のハードウェア例を示すブロック図である。
サーバ装置36は、バスに接続されたCPU101、RAM102、HDD103、GPU104、入力インタフェース105、媒体リーダ106および通信インタフェース107を有する。CPU101は、第1の実施の形態の処理部12に対応する。RAM102またはHDD103は、第1の実施の形態の記憶部11に対応する。
【0039】
CPU101は、プログラムの命令を実行するプロセッサである。CPU101は、HDD103に記憶されたプログラムおよびデータをRAM102にロードし、プログラムを実行する。サーバ装置36は、複数のプロセッサを有してもよい。
【0040】
RAM102は、CPU101で実行されるプログラムおよびCPU101で演算に使用されるデータを一時的に記憶する揮発性半導体メモリである。サーバ装置36は、RAM以外の種類の揮発性メモリを有してもよい。なお、RAM102は、バスに接続されたRAMインタフェースに挿入されてもよい。また、バスに接続されたDMA(Direct Memory Access)コントローラが、CPU101を介さずにRAM102と周辺機器との間でデータを直接転送してもよい。
【0041】
HDD103は、オペレーティングシステム(OS:Operating System)やミドルウェアやアプリケーションソフトウェアなどのソフトウェアのプログラムと、データとを記憶する不揮発性ストレージである。サーバ装置36は、フラッシュメモリやSSD(Solid State Drive)などの他の種類の不揮発性ストレージを有してもよい。
【0042】
GPU104は、CPU101と連携して画像処理を行い、サーバ装置36に接続された表示装置111に画像を出力する。表示装置111は、例えば、CRT(Cathode Ray Tube)ディスプレイ、液晶ディスプレイ、有機EL(Electro Luminescence)ディスプレイまたはプロジェクタである。サーバ装置36に、プリンタなどの他の種類の出力デバイスが接続されてもよい。また、GPU104は、GPGPU(General Purpose Computing on Graphics Processing Unit)として使用されてもよい。GPU104は、CPU101からの指示に応じてプログラムを実行し得る。サーバ装置36は、RAM102以外の揮発性半導体メモリをGPUメモリとして有してもよい。
【0043】
入力インタフェース105は、サーバ装置36に接続された入力デバイス112から入力信号を受け付ける。入力デバイス112は、例えば、マウス、タッチパネルまたはキーボードである。サーバ装置36に複数の入力デバイスが接続されてもよい。
【0044】
媒体リーダ106は、記録媒体113に記録されたプログラムおよびデータを読み取る読み取り装置である。記録媒体113は、例えば、磁気ディスク、光ディスクまたは半導体メモリである。磁気ディスクには、フレキシブルディスク(FD:Flexible Disk)およびHDDが含まれる。光ディスクには、CD(Compact Disc)およびDVD(Digital Versatile Disc)が含まれる。媒体リーダ106は、記録媒体113から読み取られたプログラムおよびデータを、RAM102やHDD103などの他の記録媒体にコピーする。読み取られたプログラムは、CPU101によって実行されることがある。
【0045】
記録媒体113は、可搬型記録媒体であってもよい。記録媒体113は、プログラムおよびデータの配布に用いられることがある。また、記録媒体113およびHDD103が、コンピュータ読み取り可能な記録媒体と呼ばれてもよい。
【0046】
通信インタフェース107は、ネットワーク32を介して蓄電池制御部35や他の情報処理装置と通信する。通信インタフェース107は、スイッチやルータなどの有線通信装置に接続される有線通信インタフェースでもよいし、基地局やアクセスポイントなどの無線通信装置に接続される無線通信インタフェースでもよい。
【0047】
次に、需要量と単価と操作量の関係について説明する。
図4は、予測需要量に基づく操作計画の例を示すグラフである。
サーバ装置36は、0時から24時までの24時間を1期間とする操作計画を生成する。操作計画は、1時間単位の操作量を示す。よって、1期間の操作計画は24個の操作量を含む。操作量は、蓄電池34の充放電量である。正の操作量は蓄電池34の放電量を表し、負の操作量は蓄電池34の充電量を表す。なお、以下では、k-1時0分からk時0分までの1時間(k=1,2,…,24)の値を、時刻kの値と表現することがある。
【0048】
電気料金を最小にする最適な操作計画は、各時刻の電気料金単価と最適化対象期間の需要量とに依存する。電気料金単価は、電気料金の従量部分であり、単位消費電力に対して追加的に課される電気料金である。電気料金単価は、1時間単位で規定される。24時間の中で、時刻によって電気料金単価が異なる。例えば、深夜および早朝の電気料金単価が安く、日中の電気料金単価が高い。
【0049】
需要量は、電気製品群33の電力消費量である。需要量は、1時間単位で予測または測定される。操作計画を生成する時点において、将来期間の需要量は未知である。このため、サーバ装置36は、訓練済みの機械学習モデルである予測モデルを用いて、将来期間の需要量を予測する。予測需要量が算出されると、サーバ装置36は、電気料金単価と予測需要量とから、1期間の最適な操作量を算出する。ただし、予測需要量と実際需要量とは、通常は一致しない。実際需要量は、電気製品群33の実際の電力消費量である。このため、実際に獲得される利益が、操作計画の生成時に期待した利益より少ないことが多い。
【0050】
図4において、予測需要量41は、ある1日について予測モデルが予測した1時間毎の需要量である。予測需要量41は、例えば、予想気温などの気象予報情報に基づいて算出される。予測需要量41は、日によって異なる。単価42は、1時間毎の電気料金単価である。単価42は、少なくとも短期的には固定であり、日によって変化しない。
【0051】
操作量43は、サーバ装置36による最適化によって予測需要量41と単価42とから決定される1時間毎の操作量である。通常、相対的に単価42が安い時刻に対して、充電を示す負の操作量が算出され、相対的に単価42が高い時刻に対して、放電を示す正の操作量が算出される。操作量43の最適化では、サーバ装置36は、電気料金の節約額である利益を目的関数として用いて、目的関数の値を最大にする操作量を探索する。電気料金の節約額は、放電する各時刻について放電量と単価42の積を算出し、充電する各時刻について充電量と単価42の積を算出し、前者の和から後者の和を引いた差額である。
【0052】
操作量43の最適化には、最急降下法など様々な最適化アルゴリズムを用いることができる。例えば、サーバ装置36は、操作量43を初期化し、現在の操作量43のもとで24時間の利益を算出する。サーバ装置36は、各時刻の操作量43を微少量だけ変化させた場合の利益の変化量を算出し、利益が大きくなるように各時刻の操作量43を更新する。サーバ装置36は、利益が収束するまで操作量43の更新を繰り返す。
【0053】
ただし、操作量43は任意の値をとることができるわけではなく、操作量43には制約条件が存在する。例えば、蓄電池34の物理的制約から、1時間の最大充電量である充電速度や1時間の最大放電量である放電速度には限界があり、電池容量も決まっている。また、蓄電池34は、電気製品群33の電力消費量を超える放電を行わず、電力系統31に対して電力を販売する売電も行わない。よって、サーバ装置36は、各時刻の操作量43が予測需要量41以下になるよう制限する。
【0054】
実際需要量44は、操作計画の生成後に測定される1時間毎の需要量である。実際需要量44は、実際の天候やイベントなどに依存するものであり、日によって異なる。通常、予測需要量41と実際需要量44との間には誤差が発生する。単価42が高い時刻の実際需要量44が予測需要量41より少ない場合、蓄電池34は計画よりも少ない電気しか放出せず、過剰充電による蓄電ロスが発生する可能性がある。また、単価42が高い時刻の実際需要量44が予測需要量41より多い場合、不足分の電力を電力系統31から高額で購入することになり、機会損失が発生する可能性がある。よって、予測需要量41の精度は、操作計画を実施した場合に獲得される利益に影響を与える。
【0055】
上記の操作量の最適化は、以下のように数学的に規定され得る。第2の実施の形態では説明を簡単にするため、予測需要量を算出する予測モデルとして、数式(1)に示すような線形回帰モデルを使用する。数式(1)において、θ1,θ2は機械学習によって決定されるパラメータであり、ξは予測需要量である。θ1は予測需要量の固定部分を示す固定係数であり、θ2は気温に比例する変動部分を示す比例係数である。ただし、予測モデルは、気温以外の入力データを受け付けてもよい。また、予測モデルは、直近の需要量の変動からその直後の需要量を予測するものであってもよい。
【0056】
【0057】
サーバ装置36は、最適化アルゴリズムを用いて数式(2)に示す最適化問題を解く。数式(2)において、uは数式(3)に示す列ベクトルであり、ξは数式(4)に示す列ベクトルである。uは操作量ベクトルであり、H個の要素を含む。Hは1期間に含まれる時刻の個数であり、第2の実施の形態ではH=24である。uに含まれる要素ukは、時刻kの操作量である。ξは需要量ベクトルであり、H個の要素を含む。ξに含まれる要素ξkは、時刻kの需要量である。Φ(u,ξ)はu,ξから算出される利益である。サーバ装置36は、制約条件Uを満たす範囲で、Φ(u,ξ)が最大になるuを探索する。
【0058】
【0059】
【0060】
【0061】
Φは数式(5)に示す関数である。数式(5)において、Pkは時刻kの電気料金単価である。Φは、電気料金単価と操作量の積をH個の時刻について合計したものを、1期間の利益として算出する。Uは数式(6),(7),(8)に示す制約条件を含む。数式(6)において、-Ucは蓄電池34の充電速度であり、Udcは蓄電池34の放電速度である。各時刻の操作量は、-Uc以上かつUdc以下に制限される。数式(7)において、Usは蓄電池34の電池容量であり、xkは時刻kの蓄電池34の蓄電量である。各時刻の蓄電量は、Us以下に制限される。また、数式(8)が示すように、時刻kの操作量ukは、時刻kの需要量ξk以下に制限される。
【0062】
【0063】
【0064】
【0065】
【0066】
前述のように、予測需要量と実際需要量とは相違することが多い。ここで、予測モデルは、全ての時刻の予測誤差が平均的に低下するように訓練されている。一方で、操作精度が1期間の利益に与える影響は、時刻によって異なる。通常、電気料金単価が高い時刻は利益に与える影響が大きく、電気料金単価の安い時刻は利益に与える影響が小さい。よって、操作量の最適化の観点からは、重要度が高い時刻と重要度が低い時刻とが存在する。重要度が高い時刻の予測需要量の精度を優先的に上げることで、利益が向上する。
【0067】
そこで、第2の実施の形態では、サーバ装置36は、予測モデルの出力をそのまま用いて操作計画を生成する代わりに、補正モデルによって予測モデルの出力を補正する。サーバ装置36は、操作計画の生成時に適切な補正モデルを決定する。ただし、サーバ装置36は、訓練済みの予測モデル自体を再訓練しなくてよい。
【0068】
次に、サーバ装置36の機能について説明する。
図5は、サーバ装置の機能例を示すブロック図である。
サーバ装置36は、設定情報記憶部121、実績データ記憶部122、予測モデル記憶部123および補正関数記憶部124を有する。これらの記憶部は、例えば、RAM102またはHDD103を用いて実装される。また、サーバ装置36は、予測モデル訓練部125、需要量予測部126、計画最適化部127、補正関数訓練部128および計画決定部129を有する。これらの処理部は、例えば、CPU101およびプログラムを用いて実装される。
【0069】
設定情報記憶部121は、操作量を最適化する際の前提条件となるパラメータを示す設定情報を記憶する。設定情報は、例えば、ユーザによって作成されて設定情報記憶部121に保存される。設定情報は、1時間毎の電気料金単価を含む。また、設定情報は、電池容量など蓄電池34の物理的性能を含む。
【0070】
実績データ記憶部122は、過去期間の測定値を含む実績データを記憶する。実績データは、1時間毎の実際需要量を含む。実際需要量は、例えば、蓄電池制御部35によって測定される。また、実績データは、気温など予測モデルに入力されるデータを含む。実績データの一部分が訓練データとして使用され、他の部分がテストデータとして使用される。一例として、実績データは、過去6年間の7月および8月の平日にあたる253日分の測定値を含む。そのうち、5年間にあたる212日分の測定値が訓練データとして使用され、1年間にあたる41日分の測定値がテストデータとして使用される。
【0071】
予測モデル記憶部123は、上記の実績データを用いて訓練された予測モデルを記憶する。予測モデルは、需要量を予測する。ただし、予測モデルは、他の情報処理装置によって訓練されてもよい。また、予測モデルは、上記の実績データと異なる訓練データを用いて訓練されてもよい。予測モデルは、操作計画の生成時に再訓練されなくてよい。
【0072】
補正関数記憶部124は、操作計画の生成時に訓練された補正関数を記憶する。補正関数は、予測モデルが出力する予測需要量を時刻に応じて補正する。操作計画の生成には、補正関数によって補正された需要量が使用される。補正関数は、操作計画の生成毎に更新されてもよく、時の経過によって実績データが増加した場合に更新されてもよい。
【0073】
予測モデル訓練部125は、実績データ記憶部122に記憶された実績データを用いて予測モデルを訓練し、訓練済みの予測モデルを予測モデル記憶部123に保存する。例えば、予測モデル訓練部125は、気温を説明変数とし需要量を目的変数として用いて、最小自乗法により線形回帰モデルを生成する。
【0074】
需要量予測部126は、予測モデル記憶部123に記憶された予測モデルに、予測対象期間についての気温などの入力データを入力することで、予測対象期間の需要量を予測する。この予測需要量は、補正前の需要量である。需要量予測部126は、補正関数の訓練の際に、過去期間の予測需要量を算出して補正関数訓練部128に対して出力する。また、需要量予測部126は、将来期間の操作計画の生成の際に、将来期間の予測需要量を算出して計画決定部129に対して出力する。
【0075】
計画最適化部127は、設定情報記憶部121に記憶された設定情報と与えられた需要量とに基づいて最適化アルゴリズムを実行し、与えられた需要量のもとで利益が最大になる最適な操作量を探索する。計画最適化部127は、補正関数の訓練の際に、過去期間の最適な操作量と達成される利益とを算出して補正関数訓練部128に対して出力する。また、計画最適化部127は、将来期間の操作計画の生成の際に、将来期間の最適な操作量と達成される利益とを算出して計画決定部129に対して出力する。
【0076】
補正関数訓練部128は、補正関数を訓練して補正関数記憶部124に保存する。補正関数訓練部128は、実績データに含まれる実際需要量を計画最適化部127に入力することで、過去期間の理想利益を算出する。理想利益は、需要量の予測誤差がない場合に過去期間に獲得可能であった最大利益であり、達成可能最大利益と呼ばれてもよい。
【0077】
また、補正関数訓練部128は、需要量予測部126が算出した過去期間の予測需要量を補正関数で補正し、過去期間の補正後需要量を計画最適化部127に入力することで、過去期間の補正後利益を算出する。補正後利益は、現在の補正関数によって補正された需要量を前提として獲得される最大利益である。補正関数訓練部128は、理想利益と補正後利益とを比較し、両者の差が小さくなるように補正関数を更新する。補正関数訓練部128は、補正後利益が収束するまで補正関数の更新を繰り返す。これにより、補正関数訓練部128は、理想利益と補正後利益との差が最小になる補正関数を探索する。
【0078】
計画決定部129は、需要量予測部126が算出した将来期間の予測需要量を、補正関数記憶部124に記憶された訓練済みの補正関数で補正し、将来期間の補正後需要量を計画最適化部127に入力する。これにより、計画決定部129は、補正後需要量を前提として、獲得される利益が最大になる最適な操作量を決定する。計画決定部129は、将来期間の操作量を示す操作計画を生成して出力する。計画決定部129は、操作計画を不揮発性ストレージに保存してもよいし、表示装置111に表示してもよいし、他の情報処理装置に送信してもよい。送信先は蓄電池制御部35であってもよい。
【0079】
なお、補正関数をテストする場合、上記の「将来期間」を過去期間の一部であるテスト期間に置き換えてもよい。計画決定部129は、テスト期間について、補正前需要量と補正後需要量と実際需要量とを比較してもよい。また、計画決定部129は、補正前需要量のもとで獲得される利益と、補正後需要量のもとで獲得される利益と、実際需要量のもとで獲得される利益とを比較してもよい。また、計画決定部129は、補正関数のテスト結果を不揮発性ストレージに保存してもよいし、表示装置111に表示してもよいし、他の情報処理装置に送信してもよい。
【0080】
図6は、設定テーブルの例を示す図である。
設定テーブル131には、設定情報が登録される。設定テーブル131は、設定情報記憶部121に記憶される。設定テーブル131は、電池容量、放電速度、充電速度、電気料金単価、訓練期間および予測期間を含む。電池容量は、蓄電池34が保持できる最大電気量である。放電速度は、蓄電池34が1時間当たりに放出できる電気量である。充電速度は、蓄電池34が1時間当たりに蓄積できる電気量である。
【0081】
電気料金単価は、単位消費電力当たりの変動費である。電気料金単価は、時刻によって異なる。例えば、0時から7時までと23時から24時までの電気料金単価が安く、7時から23時までの電気料金単価が高い。訓練期間は、補正関数の訓練のために実績データを使用する過去期間の日数である。予測期間は、操作計画を生成する将来期間の日数である。ただし、予測期間は、補正関数のテストのために実績データを使用する過去期間の日数、すなわち、テスト期間の日数であってもよい。
【0082】
図7は、実績データテーブルの例を示す図である。
実績データテーブル132には、実績データが登録される。実績データテーブル132は、実績データ記憶部122に記憶される。実績データテーブル132には、ID、時刻、実際需要量および気温をそれぞれ含む複数のレコードが登録される。IDは、レコードを識別する識別番号である。時刻は、過去の特定の1時間を識別する。実際需要量は、時刻が示す時点の直近1時間に電気製品群33が消費した電力の測定値である。気温は、時刻が示す時点で測定された外気温である。サーバ装置36は、気温の測定値を、公的機関または気象情報サービス会社から入手してもよい。
【0083】
図8は、補正関数テーブルの例を示す図である。
補正関数テーブル133は、補正関数を示す。補正関数は、時刻に応じて異なる補正値を予測需要量に対して付与する。補正関数テーブル133は、補正関数記憶部124に記憶される。補正関数記憶部124は、1期間に含まれる1時から24時までの24個の時刻に対応する24個の補正値を含む。補正値は、正であることもあるし負であることもある。サーバ装置36は、時刻kの予測需要量(k=1,2,…,24)に、時刻kの補正値λ
kを加算することで、時刻kの補正後需要量を算出する。ただし、補正関数テーブル133は補正関数の一例であり、補正関数の構造はこれに限定されない。
【0084】
ここで、補正関数の訓練は、以下のように数学的に規定され得る。補正関数訓練部128は、過去期間の実績データから、数式(9)に示すように理想操作計画を生成する。数式(9)において、ξDは1期間の実際需要量を示す列ベクトルであり、u*は1期間の理想操作量を示す列ベクトルである。u*は、実際需要量を前提として利益が最大になるように最適化された1期間の操作量を示す。よって、Φ(u*,ξD)は、実際需要量のもとで獲得することが可能であった最大利益である理想利益を示す。
【0085】
【0086】
補正関数の訓練に用いる実績データは、N個の期間(Nは2以上の整数)、すなわち、過去N日分の実際需要量を含む。例えば、N=212である。理想操作計画の生成および理想利益の算出は、24時間単位で行われる。そこで、補正関数訓練部128は、数式(10)に示すように、N個の期間に対応するN個の理想利益を算出する。
【0087】
【0088】
補正関数訓練部128は、数式(11)に示すように、予測モデルが出力する予測需要量を補正関数によって補正する。数式(11)において、ξは予測モデルが出力するH個の予測需要量を含む列ベクトルであり、λはH個の補正量を含む列ベクトルである。補正関数訓練部128は、ξにλを加える。よって、補正関数訓練部128は、時刻kの予測需要量ξkに、時刻kの補正量λkを加算する。λは、N個の期間に共通に使用される。
【0089】
【0090】
補正関数訓練部128は、補正後需要量から、数式(12)に示すように補正後操作計画を生成する。数式(12)において、u**は1期間の補正後操作量を示す列ベクトルである。u**は、補正後需要量を前提として利益が最大になるように最適化された1期間の操作量を示す。よって、Φ(u**,ξ+λ)は、補正後需要量のもとで獲得することが可能な最大利益である補正後利益を示す。補正後操作計画の生成および補正後利益の算出は、24時間単位で行われる。よって、理想利益Φ(u*,ξD)と同様に、補正後利益Φ(u**,ξ+λ)もN個の期間それぞれについて算出される。
【0091】
【0092】
補正関数訓練部128は、数式(13)に示すように、補正後利益と理想利益との差が最小になる補正量を探索する。補正関数訓練部128は、N個の期間それぞれについて、補正後利益から理想利益を減算する。補正関数訓練部128は、N個の期間の減算結果を合計し、その絶対値を算出する。これは、N個の期間の補正後利益を合計し、N個の期間の理想利益を合計し、前者から後者を引いてその絶対値をとることによっても算出される。補正関数訓練部128は、この差が最小になるλを探索する。
【0093】
【0094】
最急降下法を用いる場合、補正関数訓練部128は、数式(14)に示すように、H個の時刻それぞれについて勾配を算出する。数式(14)において、βkは時刻kの予測需要量ξkに対する補正後利益の勾配である。βkは、予測需要量ξkを微少量だけ変動させた場合に、N個の補正後利益の合計がどの程度変動するかを示す。
【0095】
【0096】
補正関数訓練部128は、N個の補正後利益の合計とN個の理想利益の合計とを比較する。補正後利益の合計が理想利益の合計より小さい場合、補正関数訓練部128は、数式(15)に示すようにH個の時刻それぞれの補正量を更新する。数式(15)において、ηは学習率を示す定数である。ηは、ステップ法に基づいて十分に小さい値に決められる。ここでは、補正関数訓練部128は、前イテレーションにおける時刻kの補正量に、時刻kの勾配βkのη倍を加えることで、現イテレーションの補正量とする。
【0097】
【0098】
一方、補正後利益の合計が理想利益の合計より大きい場合、補正関数訓練部128は、数式(16)に示すようにH個の時刻それぞれの補正量を更新する。ここでは、補正関数訓練部128は、前イテレーションにおける時刻kの補正量から、時刻kの勾配βkのη倍を引くことで、現イテレーションの補正量とする。
【0099】
【0100】
補正関数訓練部128は、勾配を算出して補正量を更新するイテレーションを、収束条件が満たされるまで繰り返す。収束条件は、補正後利益が収束することである。補正関数訓練部128は、補正量を更新すると、N個の期間の補正後利益の合計を、前イテレーションと現イテレーションとの間で比較する。補正関数訓練部128は、前イテレーションの補正後利益の合計から現イテレーションの補正後利益の合計を引いてその絶対値を算出し、算出された差が閾値ε未満であるか判定する。算出された差が閾値ε未満である場合、補正関数訓練部128は、イテレーションを停止して補正関数を確定する。
【0101】
次に、サーバ装置36の処理手順について説明する。
図9は、操作計画決定の手順例を示すフローチャートである。
(S10)計画最適化部127は、過去N期間それぞれについて、実際需要量に基づいて、利益が最大になるように操作量を最適化した理想操作計画を生成する。
【0102】
(S11)計画最適化部127は、過去N期間それぞれについて、ステップS10で生成された理想操作計画によって獲得されると期待される理想利益を算出する。ただし、理想利益は、ステップS10の探索の中で既に算出されていることがある。
【0103】
(S12)需要量予測部126は、過去N期間それぞれについて、気温などの入力データを訓練済みの予測モデルに入力することで予測需要量を算出する。
(S13)補正関数訓練部128は、補正関数を初期化する。
【0104】
(S14)補正関数訓練部128は、過去N期間それぞれについて、ステップS12で算出された予測需要量を、補正関数を用いて補正する。
(S15)計画最適化部127は、過去N期間それぞれについて、補正後需要量に基づいて、利益が最大になるように操作量を最適化した補正後操作計画を生成する。
【0105】
(S16)計画最適化部127は、過去N期間それぞれについて、ステップS15で生成された補正後操作計画によって獲得されると期待される補正後利益を算出する。ただし、補正後利益は、ステップS15の探索の中で既に算出されていることがある。
【0106】
(S17)補正関数訓練部128は、ステップS16で算出された補正後利益が収束条件を満たすか判断する。例えば、補正関数訓練部128は、過去N期間の補正後利益の合計を前イテレーションのものと比較し、その差が閾値未満であるか判断する。補正後利益が収束条件を満たす場合、ステップS19に処理が進む。補正後利益が収束条件を満たさない場合、ステップS18に処理が進む。
【0107】
(S18)補正関数訓練部128は、過去N期間の理想利益の合計と過去N期間の補正後利益の合計とを比較し、両者の差が小さくなるように補正関数を更新する。例えば、補正関数訓練部128は、H個の時刻それぞれの勾配を算出し、理想利益の合計と補正後利益の合計との大小関係に応じて、勾配を用いてH個の補正量それぞれを更新する。そして、ステップS14に処理が戻る。
【0108】
(S19)需要量予測部126は、将来期間について、気温などの入力データを訓練済みの予測モデルに入力することで予測需要量を算出する。
(S20)計画決定部129は、将来期間について、ステップS19で算出された予測需要量を、訓練済みの補正関数を用いて補正する。
【0109】
(S21)計画最適化部127は、将来期間について、補正後需要量に基づいて、利益が最大になるように操作量を最適化した操作計画を生成する。計画決定部129は、生成された操作計画を出力する。
【0110】
次に、実際需要量と予測需要量と補正後需要量との比較について説明する。
図10は、実際需要量と予測需要量の比較例を示すグラフである。
曲線51は、テスト期間に含まれる24時間の実際需要量を示す。曲線52は、テスト期間に含まれる24時間について予測モデルが出力した予測需要量を示す。曲線53は、テスト期間に含まれる24時間について補正関数が補正した補正後需要量を示す。電気料金単価が高く操作量最適化上の重要度が高い時刻について、予測需要量と比べて補正後需要量の方が実際需要量に近くなっており、予測誤差が小さくなっている。
【0111】
図11は、理想利益と予測利益の比較例を示すグラフである。
曲線54,55,56は、テスト期間における1日毎の利益を示す。曲線54は、実際需要量に基づいて事後的に最適化された操作計画を実施した場合に獲得される利益を示す。曲線55は、予測需要量に基づいて最適化された操作計画を、実際需要量のもとで実施した場合に獲得される利益を示す。曲線56は、補正後需要量に基づいて最適化された操作計画を、実際需要量のもとで実施した場合に獲得される利益を示す。予測モデルが出力する予測需要量と比べて補正後需要量の方が重要な時刻の予測精度が高いことから、最適化結果である操作計画の精度が上がる。これにより、予測需要量から生成された操作計画と比べて、補正後需要量から生成された操作計画の方が高い利益を達成できる。
【0112】
以上説明したように、第2の実施の形態のサーバ装置36は、電気料金の節約額に相当する利益が大きくなるように、蓄電池34の充放電を制御する操作計画を生成する。これにより、ユーザに対して有用な情報が提供される。また、サーバ装置36は、訓練済みの予測モデルを利用して操作計画を生成し、予測モデルを再訓練しなくてよい。これにより、計算量や処理時間が減少して最適化が効率化される。また、ユーザは予測モデルの複雑な内部構造を理解しなくてよく、操作計画を作成するユーザの負担が軽減される。
【0113】
また、サーバ装置36は、予測モデルの出力を補正するための補正モデルを、過去期間の実績データに基づいて訓練し、予測モデルに加えて補正モデルを用いて操作計画を生成する。このとき、サーバ装置36は、実際需要量を知っていた場合に獲得可能な理想利益と予測需要量のもとで期待される利益との差が小さくなるように、補正モデルを訓練する。これにより、操作計画にとって重要な時刻の予測精度が優先的に高くなるように予測需要量が補正され、高い利益を獲得できる高品質な操作計画が生成される。
【符号の説明】
【0114】
10 情報処理装置
11 記憶部
12 処理部
13 実績データ
14,17 利益
15 予測モデル
16 補正モデル
18 計画データ