IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特開2024-44589予測プログラム、予測装置、及び予測方法
<図1>
  • 特開-予測プログラム、予測装置、及び予測方法 図1
  • 特開-予測プログラム、予測装置、及び予測方法 図2
  • 特開-予測プログラム、予測装置、及び予測方法 図3
  • 特開-予測プログラム、予測装置、及び予測方法 図4
  • 特開-予測プログラム、予測装置、及び予測方法 図5
  • 特開-予測プログラム、予測装置、及び予測方法 図6
  • 特開-予測プログラム、予測装置、及び予測方法 図7
  • 特開-予測プログラム、予測装置、及び予測方法 図8
  • 特開-予測プログラム、予測装置、及び予測方法 図9A
  • 特開-予測プログラム、予測装置、及び予測方法 図9B
  • 特開-予測プログラム、予測装置、及び予測方法 図10A
  • 特開-予測プログラム、予測装置、及び予測方法 図10B
  • 特開-予測プログラム、予測装置、及び予測方法 図11
  • 特開-予測プログラム、予測装置、及び予測方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024044589
(43)【公開日】2024-04-02
(54)【発明の名称】予測プログラム、予測装置、及び予測方法
(51)【国際特許分類】
   G06Q 10/04 20230101AFI20240326BHJP
   H04M 3/00 20240101ALN20240326BHJP
【FI】
G06Q10/04
H04M3/00 D
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022150211
(22)【出願日】2022-09-21
(71)【出願人】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110004185
【氏名又は名称】インフォート弁理士法人
(74)【代理人】
【識別番号】100121083
【弁理士】
【氏名又は名称】青木 宏義
(74)【代理人】
【識別番号】100138391
【弁理士】
【氏名又は名称】天田 昌行
(74)【代理人】
【識別番号】100074099
【弁理士】
【氏名又は名称】大菅 義之
(72)【発明者】
【氏名】鈴木 彼方
(72)【発明者】
【氏名】飯村 由信
(72)【発明者】
【氏名】小川 雅俊
【テーマコード(参考)】
5K201
5L049
【Fターム(参考)】
5K201FA05
5K201FB10
5L049AA04
(57)【要約】
【課題】時系列予測の予測精度を向上させる。
【解決手段】コンピュータは、複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定する。コンピュータは、複数の特徴情報それぞれに基づいて、処理対象時系列データの予測値分布を求め、複数の特徴情報それぞれに基づいて求められた予測値分布から合成分布を求める。コンピュータは、合成分布に基づいて、処理対象時系列データに対する予測値の範囲を決定する。
【選択図】図3
【特許請求の範囲】
【請求項1】
複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定し、
前記複数の特徴情報それぞれに基づいて、前記処理対象時系列データの予測値分布を求め、
前記複数の特徴情報それぞれに基づいて求められた前記予測値分布から合成分布を求め、
前記合成分布に基づいて、前記処理対象時系列データに対する予測値の範囲を決定する、
処理をコンピュータに実行させるための予測プログラム。
【請求項2】
前記複数の特徴情報を特定する処理は、前記複数の時系列データそれぞれの特徴情報のうち、前記処理対象時系列データに対応する時系列データの特徴情報を、前記処理対象時系列データの特徴情報として用いて、前記複数の時系列データそれぞれの特徴情報と前記処理対象時系列データの特徴情報とを比較することで、前記複数の特徴情報を特定する処理を含むことを特徴とする請求項1記載の予測プログラム。
【請求項3】
前記処理対象時系列データは、所定の時間帯の各時刻におけるデータを含み、
前記処理対象時系列データの予測値分布は、前記所定の時間帯よりも後の時刻におけるデータの分布を表し、
前記処理対象時系列データの予測値分布を求める処理は、前記所定の時間帯を示す時間帯情報と、前記処理対象時系列データと、前記複数の特徴情報各々とを用いて、前記処理対象時系列データの予測値分布を求める処理を含むことを特徴とする請求項1又は2記載の予測プログラム。
【請求項4】
前記複数の時系列データ各々は、特定の時間帯の各時刻におけるデータを含み、
前記所定の時間帯を示す時間帯情報と、前記処理対象時系列データと、前記複数の特徴情報各々とを用いて、前記処理対象時系列データの予測値分布を求める処理は、前記特定の時間帯を示す時間帯情報と前記複数の時系列データとを用いた機械学習によって生成された予測モデルを用いて、前記処理対象時系列データの予測値分布を求める処理を含むことを特徴とする請求項3に記載の予測プログラム。
【請求項5】
前記複数の時系列データそれぞれの特徴情報は、前記機械学習を行うことで決定されるパラメータであることを特徴とする請求項4記載の予測プログラム。
【請求項6】
複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定する特定部と、
前記複数の特徴情報それぞれに基づいて、前記処理対象時系列データの予測値分布を求め、前記複数の特徴情報それぞれに基づいて求められた前記予測値分布から合成分布を求める分布生成部と、
前記合成分布に基づいて、前記処理対象時系列データに対する予測値の範囲を決定する決定部と、
を備えることを特徴とする予測装置。
【請求項7】
複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定し、
前記複数の特徴情報それぞれに基づいて、前記処理対象時系列データの予測値分布を求め、
前記複数の特徴情報それぞれに基づいて求められた前記予測値分布から合成分布を求め、
前記合成分布に基づいて、前記処理対象時系列データに対する予測値の範囲を決定する、
処理をコンピュータが実行することを特徴とする予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予測技術に関する。
【背景技術】
【0002】
時系列予測のユースケースとして、予測値が後段アプリケーションの目標値として用いられることがある。例えば、無線通信システムにおいて効率的な基地局制御を行うためには、通信トラフィック需要の予測が重要となる。この場合、基地局制御は、後段アプリケーションに対応し、予測された通信トラフィック量を制御の目標値として用いる。未来における通信トラフィック量を適切に予測することで、無線通信システム全体の性能低下を防ぐことが可能になる。
【0003】
通信トラフィック量を予測する技術として、深層強化学習を用いた予測方法が知られている(例えば、非特許文献1及び非特許文献2を参照)。
【0004】
高精度な通信障害の予測処理を実行する通信状況予測装置も知られている(例えば、特許文献1を参照)。ネットワークのトラフィック量をネットワーク装置のインタフェース毎に少ない処理負荷で計測し、予測する方法も知られている(例えば、特許文献2を参照)。マージン要件を決定するシステムも知られている(例えば、特許文献3及び特許文献4を参照)。
【0005】
時刻のベクトル表現も知られている(例えば、非特許文献3を参照)。混合密度ネットワークも知られている(例えば、非特許文献4を参照)。行動プリミティブの自己組織化も知られている(例えば、非特許文献5を参照)。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2020-136937号公報
【特許文献2】特開2016-127360号公報
【特許文献3】米国特許出願公開第2020/0226684号明細書
【特許文献4】米国特許出願公開第2013/0060673号明細書
【非特許文献】
【0007】
【非特許文献1】C. W. Huang et al., “Mobile Traffic Offloading with Forecasting using Deep Reinforcement Learning”, arXiv:1911.07452v1, 2019.
【非特許文献2】Q. Wu et al., “Deep Reinforcement Learning With Spatio-Temporal Traffic Forecasting for Data-Driven Base Station Sleep Control”, IEEE/ACM Transactions on Networking VOL. 29, NO. 2, pages 935-948, 2021.
【非特許文献3】S. M. Kazemi et al., “Time2Vec: Learning a Vector Representation of Time”, arXiv:1907.05321v1, 2019.
【非特許文献4】C. M. Bishop, “Mixture Density Networks”, Aston University, 1994.
【非特許文献5】J. Tani, “Self-Organization of Behavioral Primitives as Multiple Attractor Dynamics: A Robot Experiment”, Proceedings of the 2002 International Joint Conference on Neural Networks, IJCNN'02, pages 489-494, 2002.
【発明の概要】
【発明が解決しようとする課題】
【0008】
無線通信システムにおいて未来の通信トラフィック量を予測する場合、通信トラフィック量の予測値が実際の通信トラフィック量よりも小さくなることがある。
【0009】
なお、かかる問題は、無線通信システムにおいて通信トラフィック量を予測する場合に限らず、様々な時系列予測を行う場合において生ずるものである。
【0010】
1つの側面において、本発明は、時系列予測の予測精度を向上させることを目的とする。
【課題を解決するための手段】
【0011】
1つの案では、予測プログラムは、以下の処理をコンピュータに実行させる。
【0012】
コンピュータは、複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定する。コンピュータは、複数の特徴情報それぞれに基づいて、処理対象時系列データの予測値分布を求め、複数の特徴情報それぞれに基づいて求められた予測値分布から合成分布を求める。コンピュータは、合成分布に基づいて、処理対象時系列データに対する予測値の範囲を決定する。
【発明の効果】
【0013】
1つの側面によれば、時系列予測の予測精度を向上させることができる。
【図面の簡単な説明】
【0014】
図1】予測値に対するマージンを示す図である。
図2】実施形態の予測装置の機能的構成図である。
図3】第1の予測処理のフローチャートである。
図4】予測装置の具体例を示す機能的構成図である。
図5】訓練用データセットを示す図である。
図6】機械学習モデルを示す図である。
図7】MDNを示す図である。
図8】予測モデルを示す図である。
図9A】訓練処理のフローチャート(その1)である。
図9B】訓練処理のフローチャート(その2)である。
図10A】第2の予測処理のフローチャート(その1)である。
図10B】第2の予測処理のフローチャート(その2)である。
図11】通信トラフィック量の予測結果を示す図である。
図12】情報処理装置のハードウェア構成図である。
【発明を実施するための形態】
【0015】
以下、図面を参照しながら、実施形態を詳細に説明する。
【0016】
無線通信システムにおいて未来の通信トラフィック量を予測する場合、通信トラフィック量の予測値が実際の通信トラフィック量よりも小さくなることがある。この場合、後段の基地局制御において、実際の通信トラフィック量よりも小さな予測値が目標値として用いられるため、望ましくない制御が行われる可能性がある。望ましくない制御としては、例えば、ユーザ端末が基地局に繋がらないような、ユーザ品質の低下を引き起こす制御が挙げられる。
【0017】
この問題を解決する単純なアプローチとして、予測値にマージンを付加することで、予測値を過多に見積もる方法が挙げられる。事前に設計された十分に大きなマージンを予測値に付加すれば、後段アプリケーションにおけるユーザ品質が影響を受ける可能性が低くなる。実際に、多くの無線通信システムでは、予測値が過多に見積もられている。
【0018】
図1は、予測値に対するマージンの例を示している。曲線101は、通信トラフィック量の予測値の時間変化を表し、曲線102は、実際の通信トラフィック量の時間変化を表す。破線103-1は、予測値に対するマージンの上限を表し、破線103-2は、予測値に対するマージンの下限を表す。矢印104は、予測値の上側のマージンを表す。
【0019】
予測値に対するマージンの設計と予測性能は、トレードオフの関係にある。マージンを大きくすると、安定した運用が可能になるが、予測誤差が大きくなるため、後段アプリケーションにおける制御効率が低下する。一方、マージンを小さくすると、運用が不安定になるが、予測誤差が小さくなるため、後段アプリケーションにおける制御効率の低下が抑制される。
【0020】
図2は、実施形態の予測装置の機能的構成例を示している。図2の予測装置201は、特定部211、分布生成部212、及び決定部213を含む。
【0021】
図3は、図2の予測装置201が行う第1の予測処理の例を示すフローチャートである。まず、特定部211は、複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定する(ステップ301)。
【0022】
次に、分布生成部212は、複数の特徴情報それぞれに基づいて、処理対象時系列データの予測値分布を求め(ステップ302)、複数の特徴情報それぞれに基づいて求められた予測値分布から合成分布を求める(ステップ303)。次に、決定部213は、合成分布に基づいて、処理対象時系列データに対する予測値の範囲を決定する(ステップ304)。
【0023】
図2の予測装置201によれば、時系列予測の予測精度を向上させることができる。
【0024】
図4は、図2の予測装置201の具体例を示している。図4の予測装置401は、訓練部411、特定部412、分布生成部413、決定部414、出力部415、及び記憶部416を含み、訓練処理及び予測処理を行う。
【0025】
特定部412、分布生成部413、及び決定部414は、図2の特定部211、分布生成部212、及び決定部213にそれぞれ対応する。
【0026】
予測処理では、所定の時間帯の各時刻におけるデータを含む時系列データから、所定の時間帯よりも後の時刻におけるデータである予測値の分布が求められる。各時刻におけるデータは、無線通信システムにおける通信トラフィック量であってもよく、車両の交通量、人流、気象情報、経済情報等であってもよい。
【0027】
気象情報は、天候、気温、湿度、降水量、降水確率、風向、風の強さ等である。経済情報は、株価、為替レート、経済成長率、商品の売り上げ、小売店の来客数、不動産価格等である。
【0028】
訓練処理において、記憶部416は、訓練用時間帯ラベル421及び訓練用データセット422を記憶する。
【0029】
図5は、訓練用データセット422の例を示している。図5の訓練用データセット422は、複数の時刻それぞれにおけるデータセット501を含む。各時刻のデータセット501は、WA*HA個のセルを含む。WAは、データセット501の横方向に並んでいるセルの数を表し、HAは、データセット501の縦方向に並んでいるセルの数を表す。WA及びHAは、ハイパーパラメータであり、2以上の整数である。各セルは、データが取得される領域に対応し、その領域で取得されたデータを含む。各セルには、領域を識別する識別情報が付与されている。
【0030】
例えば、取得されるデータが通信トラフィック量である場合、各セルは、市町村等の地域に対応していてもよく、WA*HA個のセルは、都道府県に対応していてもよい。各セルの複数の時刻それぞれにおけるデータは、時系列データに対応する。各時刻におけるデータは、[0,1]の範囲の値になるように正規化されている。
【0031】
訓練用時間帯ラベル421は、訓練用データセット422に含まれる各データセット501に対応付けられたone-hotベクトルを含む。one-hotベクトルは、0時から24時までの24時間を表す24次元ベクトルであり、各要素は、1時間の期間に対応する。one-hotベクトルの24個の要素のうち、データセット501が取得された時刻が属する期間に対応する要素のみが1となり、他の要素は0となる。
【0032】
訓練部411は、訓練用時間帯ラベル421及び訓練用データセット422を用いた機械学習により機械学習モデルを訓練することで、予測モデル423を生成して、記憶部416に格納する。予測モデル423は、学習済みモデルである。
【0033】
予測処理において、予測装置401は、予測モデル423と時間ステップt-T+1から時間ステップtまでの処理対象セルの時系列データとを用いて、時間ステップt+1における処理対象セルのデータを予測する。時間ステップt-T+1~時間ステップt-1は、過去の時刻に対応し、時間ステップtは、現在の時刻に対応し、時間ステップt+1は、未来の時刻に対応する。
【0034】
この場合、時間ステップt-T+1から時間ステップtまでのT時刻分の時系列データが、予測モデル423に入力される。Tは、ハイパーパラメータであり、時間ステップに関するウィンドウ幅を表す。tは、0以上の整数であり、Tは、2以上の整数である。
【0035】
予測処理における処理対象セルの時系列データは、処理対象時系列データに対応する。予測処理における時間ステップt-T+1から時間ステップtまでの期間は、所定の時間帯に対応し、時間ステップt+1は、所定の時間帯よりも後の時刻に対応する。
【0036】
訓練用データセット422は、時間ステップ1-Tから時間ステップtNまでの各時間ステップにおけるデータセット501を含む。tNは、1以上の整数である。訓練用時間帯ラベル421は、各データセット501の取得時刻を示すone-hotベクトルを含む。
【0037】
図6は、機械学習で用いられる機械学習モデルの例を示している。図6の機械学習モデルは、全結合層611、LSTM(Long Short-Term Memory)612、全結合層613、及び混合密度ネットワーク(Mixture Density Network,MDN)614を含む。LSTM612は、RNN(Recurrent Neural Network)の一種である。
【0038】
訓練処理において、訓練部411は、時間ステップt-T+1から時間ステップtまでの処理対象セルの時系列データを用いて、時間ステップt+1における処理対象セルのデータを予測する訓練を行う。
【0039】
このとき、訓練部411は、入力用one-hotベクトル621を全結合層611に入力する。入力用one-hotベクトル621は、訓練用時間帯ラベル421から抽出されたone-hotベクトル631-(t-T+1)~one-hotベクトル631-tを含む。各one-hotベクトル631-i(i=t-T+1~t)は、時間ステップiに対応する時刻を示している。
【0040】
訓練処理における時間ステップt-T+1から時間ステップtまでの期間は、特定の時間帯の一例であり、入力用one-hotベクトル621は、特定の時間帯を示す時間帯情報の一例である。
【0041】
全結合層611は、各one-hotベクトル631-iに対応するD1次元ベクトルを出力する。訓練部411は、全結合層611から出力されるT個のD1次元ベクトルから、D1*T個の要素を含む時間帯ベクトルを生成する。D1は、ハイパーパラメータであり、1以上の整数である。非特許文献3には、時間帯のようなイベントフラグを表すベクトルが、予測精度の向上に有効であることが開示されている。
【0042】
データセット501の各セルに対応して、時系列データの特徴を示すPB(Parametric Bias)ベクトルが用意される。PBベクトルは、D2次元ベクトルであり、PBベクトルの個数は、WA*HA個である。D2は、ハイパーパラメータであり、1以上の整数である。訓練処理の開始時には、すべてのPBベクトルが初期化される。
【0043】
PBベクトルは、LSTM612の入力として追加的に用意されたパラメータであり、例えば、非特許文献5に記載されている。各PBベクトルの値は、機械学習を行うことで決定される。PBベクトルの値を時系列データ毎に学習することで、各時系列データの挙動を示すパラメータを求めることができる。PBベクトルは、時系列データの特徴情報に対応する。
【0044】
訓練部411は、時間帯ベクトル、入力用データセット622、及びPBベクトル623を結合したベクトルV1を、LSTM612に入力する。
【0045】
入力用データセット622は、データセット632-(t-T+1)~データセット632-tを含む。各データセット632-i(i=t-T+1~t)は、訓練用データセット422に含まれる時間ステップiのデータセット501のうち、処理対象セルを中心とするWB*HBの範囲のセルのデータを含む。
【0046】
WBは、横方向に並んでいるセルの数を表し、HBは、縦方向に並んでいるセルの数を表す。WB及びHBは、ハイパーパラメータである。WBは、2以上かつWA以下の整数であり、HBは、2以上かつHA以下の整数である。訓練部411は、入力用データセット622を結合可能な形状にリサイズして、ベクトルV1を生成してもよい。
【0047】
PBベクトル623としては、WA*HA個のPBベクトルのうち、処理対象セルに対応するPBベクトルが用いられる。
【0048】
LSTM612は、D3次元の内部状態とL個の隠れ層を有する。LSTM612及び全結合層613からなるニューラルネットワークは、ベクトルV1からベクトルV2を生成して、MDN614へ出力する。ベクトルV2は、D4次元ベクトルである。L、D3、及びD4は、ハイパーパラメータであり、1以上の整数である。
【0049】
MDN614は、ベクトルV2から混合ガウス分布情報を生成して出力する。混合ガウス分布は、K個の予測値分布を混合した予測値分布であり、K個の予測値分布各々は、時間ステップt+1における処理対象セルのデータの予測値の分布を表す。Kは、ハイパーパラメータであり、2以上の整数である。MDNは、例えば、非特許文献4に記載されている。
【0050】
図7は、MDN614の例を示している。図7のMDN614は、ベクトルV2を入力として、予測値分布701-1~予測値分布701-Kの情報を生成し、混合ガウス分布情報として出力する。予測値分布701-k(k=1~K)の情報は、予測値分布701-kの混合係数π(k)、平均値μ(k)、及び分散v(k)を含む。
【0051】
訓練部411は、MDN614から出力される混合ガウス分布情報と、教師信号624とを用いて、次式により損失値Qを計算する。
【0052】
【数1】
【0053】
yは、教師信号624により示される、時間ステップt+1の正解データを表す。Σ(k)は、ベクトルV2と予測値分布701-kの情報から計算される分散共分散行列を表す。N(y|μ(k)Σ(k))は、予測値分布701-kの確率密度関数を表す。総和記号は、k=1~Kに関するπ(k)N(y|μ(k)Σ(k))の総和を表す。損失値Qは、負の対数尤度を表す。
【0054】
このようにして損失値Qを計算する処理を、t=0~tNについて繰り返すことで、tN+1個の時間ステップtそれぞれにおける損失値Qが計算される。
【0055】
訓練部411は、損失値Qを誤差として用いて、誤差逆伝搬法により誤差をフィードバックする。これにより、損失値Qが最小化されるように、全結合層611、LSTM612、全結合層613、及びMDN614の重みパラメータとPBベクトル623とが更新される。誤差逆伝搬法としては、例えば、Backpropagation Through Time(BPTT)法が用いられる。
【0056】
このようにして各重みパラメータ及びPBベクトル623を更新する処理を、データセット501の各セルについて繰り返すことで、各重みパラメータ及び各PBベクトルが最適化される。
【0057】
各重みパラメータを固定した場合、MDN614の出力は、PBベクトル623、入力用one-hotベクトル621、及び入力用データセット622のみに基づいて決定される。したがって、最適化された各PBベクトルは、各セルの時系列データの特徴を示しており、WA*HA個のセルそれぞれのPBベクトルにより、それらのセルの時系列データの特徴を表現する特徴空間が実現される。
【0058】
訓練部411は、最適化された重みパラメータを有する機械学習モデルを、予測モデル423として記憶部416に格納し、最適化されたWA*HA個のPBベクトルを、PBベクトル424として記憶部416に格納する。
【0059】
予測処理において、記憶部416は、予測用時間帯ラベル425及び予測用データセット426を記憶する。
【0060】
予測用データセット426は、時間ステップ1-Tから時間ステップtまでの各時間ステップにおけるデータセットを含む。各時間ステップにおけるデータセットは、図5のデータセット501と同様に、WA*HA個のセルを含む。各セルは、対応する領域で取得されたデータを含む。予測用時間帯ラベル425は、予測用データセット426に含まれる各データセットに対応付けられたone-hotベクトルを含む。
【0061】
予測装置401は、予測モデル423、予測用時間帯ラベル425、及び予測用データセット426を用いて、予測処理を行う。予測処理において、予測装置401は、時間ステップt-T+1から時間ステップtまでの処理対象セルの時系列データを用いて、時間ステップt+1における処理対象セルのデータを予測する。
【0062】
図8は、予測処理で用いられる予測モデル423の例を示している。図8の予測モデル423は、全結合層811、LSTM812、全結合層813、及びMDN814を含む。全結合層811、LSTM812、全結合層813、及びMDN814は、訓練処理によって最適化された重みパラメータが設定された、全結合層611、LSTM612、全結合層613、及びMDN614にそれぞれ対応する。
【0063】
特定部412は、PBベクトル424のうち処理対象セルのPBベクトルと、各PBベクトル424とを比較することで、処理対象セルのPBベクトルと類似する複数のPBベクトルを特定する。
【0064】
より具体的に説明すると、特定部412は、PBベクトル424のうち処理対象セルのPBベクトルと、他のセルのPBベクトルとの間の距離を計算する。2つのPBベクトルの距離は、ユークリッド距離であってもよく、マンハッタン距離であってもよい。そして、特定部412は、距離の昇順にM個のPBベクトルを、処理対象セルのPBベクトルに対する近傍M個のPBベクトルとして抽出する。Mは、ハイパーパラメータであり、1以上の整数である。
【0065】
PBベクトル424の中から近傍M個のPBベクトルを抽出することで、処理対象セルの時系列データと類似する挙動を示す他のセルの時系列データのパラメータを特定することができる。
【0066】
例えば、取得されるデータが通信トラフィック量である場合、地理的に近い地域に対応する複数のセルの時系列データは類似した挙動を示すため、それらのセルのPBベクトル間の距離は短くなることが多い。
【0067】
PBベクトル823-0は、処理対象セルのPBベクトルに対応し、PBベクトル823-1~PBベクトル823-Mは、近傍M個のPBベクトルに対応する。PBベクトル823-0~PBベクトル823-Mは、処理対象時系列データの特徴情報と類似する複数の特徴情報に対応する。
【0068】
分布生成部413は、入力用one-hotベクトル821を全結合層811に入力する。入力用one-hotベクトル821は、予測用時間帯ラベル425から抽出されたone-hotベクトル831-(t-T+1)~one-hotベクトル831-tを含む。各one-hotベクトル831-i(i=t-T+1~t)は、時間ステップiに対応する時刻を示している。入力用one-hotベクトル821は、所定の時間帯を示す時間帯情報の一例である。
【0069】
全結合層811は、各one-hotベクトル831-iに対応するD1次元ベクトルを出力する。分布生成部413は、全結合層811から出力されるT個のD1次元ベクトルから、D1*T個の要素を含む時間帯ベクトルを生成する。
【0070】
分布生成部413は、PBベクトル823-0~PBベクトル823-Mの中から何れかのPBベクトル823-m(m=0~M)を選択する。そして、分布生成部413は、時間帯ベクトル、入力用データセット822、及びPBベクトル823-mを結合したベクトルV1を、LSTM812に入力する。
【0071】
入力用データセット822は、データセット832-(t-T+1)~データセット832-tを含む。各データセット832-i(i=t-T+1~t)は、予測用データセット426に含まれる時間ステップiのデータセットのうち、処理対象セルを中心とするWB*HBの範囲のセルのデータを含む。分布生成部413は、入力用データセット822を結合可能な形状にリサイズして、ベクトルV1を生成してもよい。
【0072】
LSTM812及び全結合層813からなるニューラルネットワークは、ベクトルV1からベクトルV2を生成して、MDN814へ出力し、MDN814は、ベクトルV2から混合ガウス分布情報を生成して出力する。このような処理をPBベクトル823-0~PBベクトル823-Mについて繰り返すことで、M+1個の混合ガウス分布情報が生成される。
【0073】
MDN814から出力される出力情報824は、混合ガウス分布情報833-0~混合ガウス分布情報833-Mを含む。混合ガウス分布情報833-m(m=0~M)は、PBベクトル823-mから生成され、予測値分布834-1-m~予測値分布834-K-mの情報を含む。
【0074】
予測値分布834-k-m(k=1~K)の情報は、予測値分布834-k-mの混合係数π(k,m)、平均値μ(k,m)、分散v(k,m)、及び標準偏差σ(k,m)を含む。予測値分布834-k-0~予測値分布834-k-Mは、複数の特徴情報それぞれに基づいて求められた予測値分布に対応する。
【0075】
機械学習によって生成された予測モデル423を用いることで、入力用one-hotベクトル821、入力用データセット822、及び(M+1)個のPBベクトル823-mから、(M+1)*K個の予測値分布834-k-mを容易に求めることができる。
【0076】
また、入力用one-hotベクトル821から生成された時間帯ベクトルをLSTM812に入力することで、入力用データセット822が取得された時間帯の情報が、予測結果に反映される。これにより、同じ時系列データであっても、時間帯に応じて異なる予測結果を生成することができ、予測結果の精度が向上する。
【0077】
分布生成部413は、PBベクトル823-0とPBベクトル823-mとの間の距離l(m)を用いて、混合係数π(k,m)を調整するための係数α(m)を設定する。ただし、l(0)=0である。係数α(m)は、l(m)が小さくなるほど大きくなるように設定される。分布生成部413は、例えば、次式により係数α(m)を計算する。
【0078】
【数2】
【0079】
Δは、予測値のばらつきが大きすぎる予測値分布を除外するための閾値を表す。εは、0による除算を防止するための小さな値を表す。Δ及びεは、ハイパーパラメータである。
【0080】
次に、分布生成部413は、(M+1)*K個の予測値分布834-k-mを混合した混合ガウス分布を求める。この混合ガウス分布は、図3のステップ303で求められる合成分布に対応する。分布生成部413は、合成分布の確率密度関数P(x)を、次式により計算する。
【0081】
【数3】
【0082】
Σ(k,m)は、予測値分布834-k-mの情報から計算される分散共分散行列を表す。N(x|μ(k,m)Σ(k,m))は、予測値分布834-k-mの確率密度関数を表す。
【0083】
k=1~Kに関する総和記号は、k=1~Kに関するα(m)π(k,m)N(x|μ(k,m)Σ(k,m))の総和を表す。m=0~Mに関する総和記号は、k=1~Kに関するα(m)π(k,m)N(x|μ(k,m)Σ(k,m))の総和を、m=0~Mに関して加算した総和を表す。
【0084】
式(2)及び式(3)によりP(x)を計算することで、M+1個のPBベクトルを用いたアンサンブル予測が行われ、Δ以下のσ(k,m)を有する予測値分布834-k-mが、l(m)に基づいて混合される。これにより、合成分布の分散及び標準偏差が調整され、予測値のばらつきに関する精度が向上する。
【0085】
決定部414は、合成分布から予測値及び予測値の信頼区間を計算する。例えば、決定部414は、合成分布から複数のデータをサンプリングし、それらのデータの統計値を予測値として用いることができる。統計値は、平均値、中央値、最大値、又は最小値であってもよい。
【0086】
また、決定部414は、最高密度区間(Highest Density Region)法等の区間推定法を用いて、信頼区間を計算することができる。計算された信頼区間は、処理対象時系列データに対する予測値の範囲に対応し、後段アプリケーションにおいて、予測値に対するマージンの基準値として用いられる。ユーザは、ユースケースに応じて、マージンの大きさを決定してもよい。
【0087】
決定部414は、予測値及び信頼区間を含む予測結果427を生成して、記憶部416に格納する。出力部415は、予測結果427を出力する。
【0088】
PBベクトルにより表現される特徴空間内で、近傍M個のPBベクトルが互いに近接している場合、合成分布の分散が小さくなり、信頼区間が狭くなるため、安定した予測を行うことができる。これにより、時系列予測の予測精度が向上し、予測誤差が小さくなるため、予測値を目標値として用いる後段アプリケーションにおける制御効率の低下が抑制される。
【0089】
一方、近傍M個のPBベクトルが互いに離れている場合、合成分布の分散が大きくなり、信頼区間が広くなるため、予測は不安定になる。
【0090】
各セルの時系列データの挙動は、時系列データが属する時間帯に応じて変化するため、夜間のように予測が安定する時間帯では、信頼区間が狭くなり、昼間のように予測が不安定な時間帯では、信頼区間が広くなる。
【0091】
図9A及び図9Bは、図4の予測装置401が行う訓練処理の例を示すフローチャートである。まず、訓練部411は、全結合層611、LSTM612、全結合層613、及びMDN614の重みパラメータと、WA*HA個のPBベクトル623とを、ランダムに初期化する(ステップ901)。
【0092】
次に、訓練部411は、WA*HA個のセルの中から処理対象セルを選択し(ステップ902)、訓練用データセット422から入力範囲の各セルの時系列データを抽出する(ステップ903)。入力範囲のセルは、処理対象セルを中心とするWB*HBの範囲のセルである。
【0093】
次に、訓練部411は、時間ステップtに0を設定する(ステップ904)。そして、訓練部411は、時間ステップtにおける入力用one-hotベクトル621を全結合層611に入力し、全結合層611の出力を用いて時間帯ベクトルを生成する(ステップ905)。
【0094】
次に、訓練部411は、入力範囲の各セルの時系列データから、時間ステップt-T+1~時間ステップtのT時刻分のデータを選択して、入力用データセット622を生成する(ステップ906)。
【0095】
次に、訓練部411は、WA*HA個のPBベクトルの中から、処理対象セルのPBベクトル623を選択する(ステップ907)。
【0096】
次に、訓練部411は、時間帯ベクトル、入力用データセット622、及びPBベクトル623を結合したベクトルV1を、LSTM612に入力する(ステップ908)。そして、訓練部411は、MDN614から出力されるK個の予測値分布701-kの情報を取得する(ステップ909)。
【0097】
次に、訓練部411は、K個の予測値分布701-kの情報と教師信号624とを用いて、式(1)により損失値Qを計算し(ステップ910)、tをtNと比較する(ステップ911)。tがtN未満である場合(ステップ911,NO)、訓練部411は、tを1だけインクリメントして(ステップ915)、ステップ905以降の処理を繰り返す。
【0098】
tがtNに達した場合(ステップ911,YES)、訓練部411は、ステップ912の処理を行う。ステップ912において、訓練部411は、損失値Qを誤差として用いて、誤差逆伝搬法により誤差をフィードバックすることで、全結合層611、LSTM612、全結合層613、及びMDN614の重みパラメータとPBベクトル623とを更新する。
【0099】
次に、訓練部411は、すべてのセルを選択したか否かをチェックする(ステップ913)。未選択のセルが残っている場合(ステップ913,NO)、訓練部411は、次のセルについて、ステップ902以降の処理を繰り返す。
【0100】
すべてのセルを選択した場合(ステップ913,YES)、訓練部411は、予測モデル423及びPBベクトル424を、学習結果として記憶部416に格納する(ステップ914)。予測モデル423は、最適化された重みパラメータを有する機械学習モデルであり、PBベクトル424は、最適化されたWA*HA個のPBベクトルである。
【0101】
図10A及び図10Bは、図4の予測装置401が行う第2の予測処理の例を示すフローチャートである。第2の予測処理では、各セルのデータの観測値が逐次的に取得される環境を想定している。したがって、t=0~tPの各時間ステップtにおいて、予測用データセット426には、時間ステップ1-Tから時間ステップtまでの各時間ステップにおけるデータセットが含まれている。tPは、0以上の整数であり、予測処理が行われる最終時刻に対応する時間ステップを表す。
【0102】
まず、分布生成部413は、WA*HA個のセルの中から処理対象セルを選択し(ステップ1001)、予測用データセット426から入力範囲の各セルの時系列データを抽出する(ステップ1002)。入力範囲のセルは、処理対象セルを中心とするWB*HBの範囲のセルである。
【0103】
次に、分布生成部413は、時間ステップtに0を設定する(ステップ1003)。そして、分布生成部413は、時間ステップtにおける入力用one-hotベクトル821を全結合層811に入力し、全結合層811の出力を用いて時間帯ベクトルを生成する(ステップ1004)。
【0104】
次に、分布生成部413は、入力範囲の各セルの時系列データから、時間ステップt-T+1~時間ステップtのT時刻分のデータを選択して、入力用データセット822を生成する(ステップ1005)。
【0105】
次に、特定部412は、PBベクトル424のうち処理対象セルのPBベクトルと、他のセルのPBベクトルとの間の距離を計算し(ステップ1006)、近傍M個のPBベクトルを抽出する(ステップ1007)。処理対象セルのPBベクトルは、PBベクトル823-0として用いられ、近傍M個のPBベクトルは、PBベクトル823-1~PBベクトル823-Mとして用いられる。
【0106】
次に、分布生成部413は、制御変数mに0を設定して(ステップ1008)、m番目のPBベクトル823-mを選択する(ステップ1009)。
【0107】
次に、分布生成部413は、時間帯ベクトル、入力用データセット822、及びPBベクトル823-mを結合したベクトルV1を、LSTM812に入力する(ステップ1010)。そして、分布生成部413は、MDN814から出力されるK個の予測値分布834-1-m~予測値分布834-K-mの情報を取得する(ステップ1011)。
【0108】
次に、分布生成部413は、式(2)により係数α(m)を計算し(ステップ1012)、mをMと比較する(ステップ1013)。mがM未満である場合(ステップ1013,NO)、分布生成部413は、mを1だけインクリメントし(ステップ1018)、予測装置401は、ステップ1009以降の処理を繰り返す。
【0109】
mがMに達した場合(ステップ1013,YES)、分布生成部413は、(M+1)*K個の予測値分布834-k-mを混合した混合ガウス分布の確率密度関数P(x)を、式(3)により計算する(ステップ1014)。
【0110】
次に、決定部414は、確率密度関数P(x)を用いて予測値及び信頼区間を計算し、出力部415は、予測値及び信頼区間を含む予測結果427を出力する(ステップ1015)。
【0111】
次に、分布生成部413は、tをtPと比較する(ステップ1016)。tがtP未満である場合(ステップ1016,NO)、分布生成部413は、tを1だけインクリメントし(ステップ1019)、予測装置401は、ステップ1004以降の処理を繰り返す。
【0112】
tがtPに達した場合(ステップ1016,YES)、分布生成部413は、すべてのセルを選択したか否かをチェックする(ステップ1017)。未選択のセルが残っている場合(ステップ1017,NO)、予測装置401は、次のセルについて、ステップ1001以降の処理を繰り返す。すべてのセルを選択した場合(ステップ1017,YES)、予測装置401は、処理を終了する。
【0113】
図11は、無線通信システムにおける通信トラフィック量の予測結果の例を示している。図11(a)は、予測値を過多に見積もる予測処理P1の予測結果の例を示している。横軸は、時間ステップtを表し、縦軸は、正規化前の通信トラフィック量を表す。予測処理P1では、従来の深層強化学習により生成された予測モデルが用いられている。
【0114】
曲線1101は、予測処理P1により求められた予測値(Predicted)の時間変化を表す。曲線1102は、取得された実際の通信トラフィック量(Input)の時間変化を表す。曲線1101の上下の領域1103は、予測値に対するマージンの時間変化を表す。この場合、深層強化学習で用いられた訓練データの最大誤差がマージンとして用いられている。
【0115】
図11(b)は、図4の予測装置401が行う予測処理P2の予測結果の例を示している。横軸は、時間ステップtを表し、縦軸は、正規化前の通信トラフィック量を表す。予測処理P2におけるハイパーパラメータとしては、次のような値が用いられている。
【0116】
T=12
WA=100
HA=100
D1=3
D2=20
L=2
D3=512
D4=512
K=3
WB=3
HB=3
M=3
Δ=0.15
ε=0.005
【0117】
曲線1111は、予測処理P2により求められた予測値(Predicted)の時間変化を表す。曲線1112は、取得された実際の通信トラフィック量(Input)の時間変化を表す。曲線1111の上下の領域1113は、予測値に対するマージンの時間変化を表す。この場合、99%信頼区間がマージンとして用いられている。
【0118】
図11(c)は、正規化後のマージンの時間変化の例を示している。横軸は、時間ステップtを表し、縦軸は、正規化後のマージンを表す。直線1121は、予測処理P1の予測値に対するマージンの時間変化を表す。予測処理P1の予測値に対するマージンは、時間的に変化しない固定値である。曲線1112は、予測処理P2の予測値に対するマージンの時間変化を表す。
【0119】
図11(a)と図11(b)を比較すると、予測値が実際の通信トラフィック量よりも小さくなる時間ステップtの割合が、ほとんど同じであることが分かる。
【0120】
一方、図11(c)では、ほとんどの時間ステップtにおいて、予測処理P2の予測値に対するマージンが、予測処理P1の予測値に対するマージンよりも小さくなっている。したがって、予測処理P2を適用することで、予測誤差を削減できることが分かる。予測処理P2の予測値に対するマージンは、予測が不安定な時間帯では大きくなり、予測が安定する時間帯では小さくなっている。
【0121】
図2の予測装置201及び図4の予測装置401の構成は一例に過ぎず、予測装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、図4の予測装置401において、訓練処理が外部の装置により行われる場合は、訓練部411を省略することができる。
【0122】
図3及び図9A図10Bのフローチャートは一例に過ぎず、予測装置の構成又は条件に応じて、一部の処理を省略又は変更してもよい。例えば、図4の予測装置401において、訓練処理が外部の装置により行われる場合は、図9A及び図9Bの訓練処理を省略することができる。
【0123】
図1及び図11に示した予測値及びマージンの時間変化は一例に過ぎず、予測値及びマージンの時間変化は、時系列データ及び後段アプリケーションに応じて変化する。図5に示した訓練用データセットは一例に過ぎず、訓練用データセットは、機械学習モデルに応じて変化する。
【0124】
図6に示した機械学習モデル、図7に示したMDN614、及び図8に示した予測モデル423は一例に過ぎず、別の構成の機械学習モデル、MDN614、及び予測モデル423を用いてもよい。ニューラルネットワーク以外の機械学習モデルを用いて、予測モデル423を生成することもできる。PBベクトルの代わりに、時系列データの特徴を示す別の特徴情報を用いてもよい。
【0125】
式(1)~式(3)は一例に過ぎず、予測装置401は、別の計算式を用いて訓練処理及び予測処理を行ってもよい。
【0126】
図12は、図2の予測装置201及び図4の予測装置401として用いられる情報処理装置(コンピュータ)のハードウェア構成例を示している。図12の情報処理装置は、CPU(Central Processing Unit)1201、メモリ1202、入力装置1203、出力装置1204、補助記憶装置1205、媒体駆動装置1206、及びネットワーク接続装置1207を含む。これらの構成要素はハードウェアであり、バス1208により互いに接続されている。
【0127】
メモリ1202は、例えば、ROM(Read Only Memory)、RAM(Random Access Memory)等の半導体メモリであり、処理に用いられるプログラム及びデータを記憶する。メモリ1202は、図4の記憶部416として動作してもよい。
【0128】
CPU1201(プロセッサ)は、例えば、メモリ1202を利用してプログラムを実行することにより、図2の特定部211、分布生成部212、及び決定部213として動作する。CPU1201は、メモリ1202を利用してプログラムを実行することにより、図4の訓練部411、特定部412、分布生成部413、及び決定部414としても動作する。
【0129】
入力装置1203は、例えば、キーボード、ポインティングデバイス等であり、ユーザ又はオペレータからの指示又は情報の入力に用いられる。出力装置1204は、例えば、表示装置、プリンタ等であり、ユーザ又はオペレータへの問い合わせ又は指示、及び処理結果の出力に用いられる。処理結果は、予測結果427であってもよい。出力装置1204は、図4の出力部415として動作してもよい。
【0130】
補助記憶装置1205は、例えば、磁気ディスク装置、光ディスク装置、光磁気ディスク装置、テープ装置等である。補助記憶装置1205は、ハードディスクドライブであってもよい。情報処理装置は、補助記憶装置1205にプログラム及びデータを格納しておき、それらをメモリ1202にロードして使用することができる。補助記憶装置1205は、図4の記憶部416として動作してもよい。
【0131】
媒体駆動装置1206は、可搬型記録媒体1209を駆動し、その記録内容にアクセスする。可搬型記録媒体1209は、メモリデバイス、フレキシブルディスク、光ディスク、光磁気ディスク等である。可搬型記録媒体1209は、CD-ROM(Compact Disk Read Only Memory)、DVD(Digital Versatile Disk)、USB(Universal Serial Bus)メモリ等であってもよい。ユーザ又はオペレータは、可搬型記録媒体1209にプログラム及びデータを格納しておき、それらをメモリ1202にロードして使用することができる。
【0132】
このように、処理に用いられるプログラム及びデータを格納するコンピュータ読み取り可能な記録媒体は、メモリ1202、補助記憶装置1205、又は可搬型記録媒体1209のような、物理的な(非一時的な)記録媒体である。
【0133】
ネットワーク接続装置1207は、WAN(Wide Area Network)、LAN(Local Area Network)等の通信ネットワークに接続され、通信に伴うデータ変換を行う通信インタフェース回路である。情報処理装置は、プログラム及びデータを外部の装置からネットワーク接続装置1207を介して受信し、それらをメモリ1202にロードして使用することができる。ネットワーク接続装置1207は、図4の出力部415として動作してもよい。
【0134】
なお、情報処理装置が図12のすべての構成要素を含む必要はなく、情報処理装置の用途又は条件に応じて一部の構成要素を省略又は変更してもよい。例えば、ユーザ又はオペレータとのインタフェースが不要な場合は、入力装置1203及び出力装置1204を省略することができる。可搬型記録媒体1209又は通信ネットワークを使用しない場合は、媒体駆動装置1206又はネットワーク接続装置1207を省略することができる。
【0135】
開示の実施形態とその利点について詳しく説明したが、当業者は、特許請求の範囲に明確に記載した本発明の範囲から逸脱することなく、様々な変更、追加、省略をすることができるであろう。
【0136】
図1乃至図12を参照しながら説明した実施形態に関し、さらに以下の付記を開示する。
(付記1)
複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定し、
前記複数の特徴情報それぞれに基づいて、前記処理対象時系列データの予測値分布を求め、
前記複数の特徴情報それぞれに基づいて求められた前記予測値分布から合成分布を求め、
前記合成分布に基づいて、前記処理対象時系列データに対する予測値の範囲を決定する、
処理をコンピュータに実行させるための予測プログラム。
(付記2)
前記複数の特徴情報を特定する処理は、前記複数の時系列データそれぞれの特徴情報のうち、前記処理対象時系列データに対応する時系列データの特徴情報を、前記処理対象時系列データの特徴情報として用いて、前記複数の時系列データそれぞれの特徴情報と前記処理対象時系列データの特徴情報とを比較することで、前記複数の特徴情報を特定する処理を含むことを特徴とする付記1記載の予測プログラム。
(付記3)
前記処理対象時系列データは、所定の時間帯の各時刻におけるデータを含み、
前記処理対象時系列データの予測値分布は、前記所定の時間帯よりも後の時刻におけるデータの分布を表し、
前記処理対象時系列データの予測値分布を求める処理は、前記所定の時間帯を示す時間帯情報と、前記処理対象時系列データと、前記複数の特徴情報各々とを用いて、前記処理対象時系列データの予測値分布を求める処理を含むことを特徴とする付記1又は2記載の予測プログラム。
(付記4)
前記複数の時系列データ各々は、特定の時間帯の各時刻におけるデータを含み、
前記所定の時間帯を示す時間帯情報と、前記処理対象時系列データと、前記複数の特徴情報各々とを用いて、前記処理対象時系列データの予測値分布を求める処理は、前記特定の時間帯を示す時間帯情報と前記複数の時系列データとを用いた機械学習によって生成された予測モデルを用いて、前記処理対象時系列データの予測値分布を求める処理を含むことを特徴とする付記3に記載の予測プログラム。
(付記5)
前記複数の時系列データそれぞれの特徴情報は、前記機械学習を行うことで決定されるパラメータであることを特徴とする付記4記載の予測プログラム。
(付記6)
複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定する特定部と、
前記複数の特徴情報それぞれに基づいて、前記処理対象時系列データの予測値分布を求め、前記複数の特徴情報それぞれに基づいて求められた前記予測値分布から合成分布を求める分布生成部と、
前記合成分布に基づいて、前記処理対象時系列データに対する予測値の範囲を決定する決定部と、
を備えることを特徴とする予測装置。
(付記7)
前記特定部は、前記複数の時系列データそれぞれの特徴情報のうち、前記処理対象時系列データに対応する時系列データの特徴情報を、前記処理対象時系列データの特徴情報として用いて、前記複数の時系列データそれぞれの特徴情報と前記処理対象時系列データの特徴情報とを比較することで、前記複数の特徴情報を特定することを特徴とする付記6記載の予測装置。
(付記8)
前記処理対象時系列データは、所定の時間帯の各時刻におけるデータを含み、
前記処理対象時系列データの予測値分布は、前記所定の時間帯よりも後の時刻におけるデータの分布を表し、
前記分布生成部は、前記所定の時間帯を示す時間帯情報と、前記処理対象時系列データと、前記複数の特徴情報各々とを用いて、前記処理対象時系列データの予測値分布を求めることを特徴とする付記6又は7記載の予測装置。
(付記9)
前記複数の時系列データ各々は、特定の時間帯の各時刻におけるデータを含み、
前記分布生成部は、前記特定の時間帯を示す時間帯情報と前記複数の時系列データとを用いた機械学習によって生成された予測モデルを用いて、前記処理対象時系列データの予測値分布を求めることを特徴とする付記8に記載の予測装置。
(付記10)
前記複数の時系列データそれぞれの特徴情報は、前記機械学習を行うことで決定されるパラメータであることを特徴とする付記9記載の予測装置。
(付記11)
複数の時系列データそれぞれの特徴情報のうち、処理対象時系列データの特徴情報と類似する複数の特徴情報を特定し、
前記複数の特徴情報それぞれに基づいて、前記処理対象時系列データの予測値分布を求め、
前記複数の特徴情報それぞれに基づいて求められた前記予測値分布から合成分布を求め、
前記合成分布に基づいて、前記処理対象時系列データに対する予測値の範囲を決定する、
処理をコンピュータが実行することを特徴とする予測方法。
(付記12)
前記複数の特徴情報を特定する処理は、前記複数の時系列データそれぞれの特徴情報のうち、前記処理対象時系列データに対応する時系列データの特徴情報を、前記処理対象時系列データの特徴情報として用いて、前記複数の時系列データそれぞれの特徴情報と前記処理対象時系列データの特徴情報とを比較することで、前記複数の特徴情報を特定する処理を含むことを特徴とする付記11記載の予測方法。
(付記13)
前記処理対象時系列データは、所定の時間帯の各時刻におけるデータを含み、
前記処理対象時系列データの予測値分布は、前記所定の時間帯よりも後の時刻におけるデータの分布を表し、
前記処理対象時系列データの予測値分布を求める処理は、前記所定の時間帯を示す時間帯情報と、前記処理対象時系列データと、前記複数の特徴情報各々とを用いて、前記処理対象時系列データの予測値分布を求める処理を含むことを特徴とする付記11又は12記載の予測方法。
(付記14)
前記複数の時系列データ各々は、特定の時間帯の各時刻におけるデータを含み、
前記所定の時間帯を示す時間帯情報と、前記処理対象時系列データと、前記複数の特徴情報各々とを用いて、前記処理対象時系列データの予測値分布を求める処理は、前記特定の時間帯を示す時間帯情報と前記複数の時系列データとを用いた機械学習によって生成された予測モデルを用いて、前記処理対象時系列データの予測値分布を求める処理を含むことを特徴とする付記13に記載の予測方法。
(付記15)
前記複数の時系列データそれぞれの特徴情報は、前記機械学習を行うことで決定されるパラメータであることを特徴とする付記14記載の予測方法。
【符号の説明】
【0137】
101、102、1101、1102、1111、1112、1122 曲線
103-1、103-2 破線
104 矢印
201、401 予測装置
211、412 特定部
212、413 分布生成部
213、414 決定部
411 訓練部
415 出力部
416 記憶部
421 訓練用時間帯ラベル
422 訓練用データセット
423 予測モデル
424 PBベクトル
425 予測用時間帯ラベル
426 予測用データセット
427 予測結果
501 データセット
611、613、811、813 全結合層
612、812 LSTM
614、814 MDN
621、821 入力用one-hotベクトル
622、822 入力用データセット
623、823-0~823-M PBベクトル
624 教師信号
631-(t-T+1)~631-t、831-(t-T+1)~831-t one-hotベクトル
632-(t-T+1)~632-t、832-(t-T+1)~832-t データセット
701-1~701-K、834-1-0~834-K-0、834-1-M~834-K-M 予測値分布
824 出力情報
833-0~833-M 混合ガウス分布情報
1103、1113 領域
1121 直線
1201 CPU
1202 メモリ
1203 入力装置
1204 出力装置
1205 補助記憶装置
1206 媒体駆動装置
1207 ネットワーク接続装置
1208 バス
1209 可搬型記録媒体
図1
図2
図3
図4
図5
図6
図7
図8
図9A
図9B
図10A
図10B
図11
図12