IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社オービックの特許一覧

特開2025-25572時系列予測管理装置、時系列予測管理方法、および、時系列予測管理プログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025025572
(43)【公開日】2025-02-21
(54)【発明の名称】時系列予測管理装置、時系列予測管理方法、および、時系列予測管理プログラム
(51)【国際特許分類】
   G06Q 10/04 20230101AFI20250214BHJP
   G06Q 10/063 20230101ALI20250214BHJP
   G06N 20/10 20190101ALI20250214BHJP
   G06N 7/01 20230101ALI20250214BHJP
   G06F 18/27 20230101ALI20250214BHJP
   G06N 20/00 20190101ALI20250214BHJP
   G06F 123/02 20230101ALN20250214BHJP
【FI】
G06Q10/04
G06Q10/063
G06N20/10
G06N7/01
G06F18/27
G06N20/00 130
G06F123:02
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2023130442
(22)【出願日】2023-08-09
(71)【出願人】
【識別番号】398040527
【氏名又は名称】株式会社オービック
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】里 彰真
【テーマコード(参考)】
5L010
5L049
【Fターム(参考)】
5L010AA04
5L010AA06
5L049AA04
5L049AA06
(57)【要約】
【課題】ベイズ最適化を用いて時系列予測モデルの最適なハイパーパラメータを探索する際に、事前に設定された制限時間内で最適なハイパーパラメータを決定することで、時系列データの予測と分析とを行うことができる時系列予測管理装置、時系列予測管理方法、および、時系列予測管理プログラムを提供することを課題とする。
【解決手段】処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成し、時系列予測モデルを用いて時系列データの予測値を取得し、実績値および予測値に基づいて、時系列予測モデルの高適合性のハイパーパラメータを決定する。
【選択図】図5
【特許請求の範囲】
【請求項1】
記憶部と制御部とを備えた時系列予測管理装置であって、
前記記憶部は、
時刻に依存する実績値が設定された時系列データを記憶する時系列記憶手段と、
ハイパーパラメータの探索の処理許容時間を設定した異常判定定義マスタと、
を備え、
前記制御部は、
前記処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、前記時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成するモデル作成手段と、
前記時系列予測モデルを用いて前記時系列データの予測値を取得する時系列予測手段と、
前記実績値および前記予測値に基づいて、前記時系列予測モデルの高適合性のハイパーパラメータを決定するハイパーパラメータ決定手段と、
を備えたことを特徴とする時系列予測管理装置。
【請求項2】
前記モデル作成手段は、
更に、前記ハイパーパラメータの初期観測点として当該ハイパーパラメータの最小値、三分割点および最大値の4点を取得し、前記訓練用データに基づいて、前記各初期観測点を前記ハイパーパラメータとする前記時系列予測モデルを作成し、
前記ハイパーパラメータ決定手段は、
前記実績値と前記予測値との二乗和誤差を計算し、最小の前記二乗和誤差となる観測点を前記時系列予測モデルの前記高適合性のハイパーパラメータとして決定することを特徴とする請求項1に記載の時系列予測管理装置。
【請求項3】
前記モデル作成手段は、
前記制限時間内に、前記二乗和誤差から標準化二乗和誤差を計算し、前記標準化二乗和誤差に基づいて、前記ベイズ最適化を用いて前記制限時間内に可能な限り設定可能な前記ハイパーパラメータの候補観測点を取得し、前記訓練用データに基づいて、前記各候補観測点を前記ハイパーパラメータとする前記時系列予測モデルを作成することを特徴とする請求項2に記載の時系列予測管理装置。
【請求項4】
前記モデル作成手段は、
前記観測点同士の類似度を評価することができるガウスカーネルの係数を決定し、前記制限時間内に、前記二乗和誤差から前記標準化二乗和誤差を計算し、前記標準化二乗和誤差、および、前記係数を設定した前記ガウスカーネルに基づいて、前記ベイズ最適化を用いて前記制限時間内に可能な限り設定可能な前記ハイパーパラメータの前記候補観測点を取得し、前記訓練用データに基づいて、前記各候補観測点を前記ハイパーパラメータとする前記時系列予測モデルを作成することを特徴とする請求項3に記載の時系列予測管理装置。
【請求項5】
前記係数は、
探索すべき候補点の数を5で除算した商が前記候補観測点の数以下である場合、5であり、当該商が前記候補観測点の数より大きい場合、前記探索すべき候補点の数を前記候補観測点の数で除算した商であることを特徴とする請求項4に記載の時系列予測管理装置。
【請求項6】
記憶部と制御部とを備えた時系列予測管理装置に実行させるための時系列予測管理方法であって、
前記記憶部は、
時刻に依存する実績値が設定された時系列データを記憶する時系列記憶手段と、
ハイパーパラメータの探索の処理許容時間を設定した異常判定定義マスタと、
を備え、
前記制御部において実行される、
前記処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、前記時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成するモデル作成ステップと、
前記時系列予測モデルを用いて前記時系列データの予測値を取得する時系列予測ステップと、
前記実績値および前記予測値に基づいて、前記時系列予測モデルの高適合性のハイパーパラメータを決定するハイパーパラメータ決定ステップと、
を含むことを特徴とする時系列予測管理方法。
【請求項7】
記憶部と制御部とを備えた時系列予測管理装置に実行させるための時系列予測管理プログラムであって、
前記記憶部は、
時刻に依存する実績値が設定された時系列データを記憶する時系列記憶手段と、
ハイパーパラメータの探索の処理許容時間を設定した異常判定定義マスタと、
を備え、
前記制御部において、
前記処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、前記時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成するモデル作成ステップと、
前記時系列予測モデルを用いて前記時系列データの予測値を取得する時系列予測ステップと、
前記実績値および前記予測値に基づいて、前記時系列予測モデルの高適合性のハイパーパラメータを決定するハイパーパラメータ決定ステップと、
を実行させるための時系列予測管理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、時系列予測管理装置、時系列予測管理方法、および、時系列予測管理プログラムに関する。
【背景技術】
【0002】
特許文献1には、産業機械の異常検知を行うための故障予知モデルにおいて、産業機械にある一定の動作を行わせた際の制御に係る時系列データを含む測定データを取得し、複数の時系列データを確認可能に重ねあわせてグラフ表示させ、当該時系列データを学習データと検証データとに2分割したデータを用いて、機械学習のハイパーパラメータの最適値をベイズ最適化により探索し、学習データに基づいて故障予知モデルの学習を実行し、故障予知モデルを検証データに適用し、異常度を算出する構成が開示されている。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2022-191680号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記特許文献1記載の発明においては、ベイズ最適化を用いてハイパーパラメータを探索する際に、事前に設定された制限時間内で最適なハイパーパラメータを決定することができないという課題があった。
【0005】
本発明は、上記問題点に鑑みてなされたものであって、ベイズ最適化を用いて時系列予測モデルの最適なハイパーパラメータを探索する際に、事前に設定された制限時間内で最適なハイパーパラメータを決定することで、時系列データの予測と分析とを行うことができる時系列予測管理装置、時系列予測管理方法、および、時系列予測管理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
上述した課題を解決し、目的を達成するために、本発明に係る時系列予測管理装置は、記憶部と制御部とを備えた時系列予測管理装置であって、前記記憶部は、時刻に依存する実績値が設定された時系列データを記憶する時系列記憶手段と、ハイパーパラメータの探索の処理許容時間を設定した異常判定定義マスタと、を備え、前記制御部は、前記処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、前記時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成するモデル作成手段と、前記時系列予測モデルを用いて前記時系列データの予測値を取得する時系列予測手段と、前記実績値および前記予測値に基づいて、前記時系列予測モデルの高適合性のハイパーパラメータを決定するハイパーパラメータ決定手段と、を備えたことを特徴とする。
【0007】
また、本発明に係る時系列予測管理装置において、前記モデル作成手段は、更に、前記ハイパーパラメータの初期観測点として当該ハイパーパラメータの最小値、三分割点および最大値の4点を取得し、前記訓練用データに基づいて、前記各初期観測点を前記ハイパーパラメータとする前記時系列予測モデルを作成し、前記ハイパーパラメータ決定手段は、前記実績値と前記予測値との二乗和誤差を計算し、最小の前記二乗和誤差となる観測点を前記時系列予測モデルの前記高適合性のハイパーパラメータとして決定することを特徴とする。
【0008】
また、本発明に係る時系列予測管理装置において、前記モデル作成手段は、前記制限時間内に、前記二乗和誤差から標準化二乗和誤差を計算し、前記標準化二乗和誤差に基づいて、前記ベイズ最適化を用いて前記制限時間内に可能な限り設定可能な前記ハイパーパラメータの候補観測点を取得し、前記訓練用データに基づいて、前記各候補観測点を前記ハイパーパラメータとする前記時系列予測モデルを作成することを特徴とする。
【0009】
また、本発明に係る時系列予測管理装置において、前記モデル作成手段は、前記観測点同士の類似度を評価することができるガウスカーネルの係数を決定し、前記制限時間内に、前記二乗和誤差から前記標準化二乗和誤差を計算し、前記標準化二乗和誤差、および、前記係数を設定した前記ガウスカーネルに基づいて、前記ベイズ最適化を用いて前記制限時間内に可能な限り設定可能な前記ハイパーパラメータの前記候補観測点を取得し、前記訓練用データに基づいて、前記各候補観測点を前記ハイパーパラメータとする前記時系列予測モデルを作成することを特徴とする。
【0010】
また、本発明に係る時系列予測管理装置において、前記係数は、探索すべき候補点の数を5で除算した商が前記候補観測点の数以下である場合、5であり、当該商が前記候補観測点の数より大きい場合、前記探索すべき候補点の数を前記候補観測点の数で除算した商であることを特徴とする。
【0011】
また、本発明に係る時系列予測管理方法は、記憶部と制御部とを備えた時系列予測管理装置に実行させるための時系列予測管理方法であって、前記記憶部は、時刻に依存する実績値が設定された時系列データを記憶する時系列記憶手段と、ハイパーパラメータの探索の処理許容時間を設定した異常判定定義マスタと、を備え、前記制御部において実行される、前記処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、前記時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成するモデル作成ステップと、前記時系列予測モデルを用いて前記時系列データの予測値を取得する時系列予測ステップと、前記実績値および前記予測値に基づいて、前記時系列予測モデルの高適合性のハイパーパラメータを決定するハイパーパラメータ決定ステップと、を含むことを特徴とする。
【0012】
また、本発明に係る時系列予測管理プログラムは、記憶部と制御部とを備えた時系列予測管理装置に実行させるための時系列予測管理プログラムであって、前記記憶部は、時刻に依存する実績値が設定された時系列データを記憶する時系列記憶手段と、ハイパーパラメータの探索の処理許容時間を設定した異常判定定義マスタと、を備え、前記制御部において、前記処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、前記時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成するモデル作成ステップと、前記時系列予測モデルを用いて前記時系列データの予測値を取得する時系列予測ステップと、前記実績値および前記予測値に基づいて、前記時系列予測モデルの高適合性のハイパーパラメータを決定するハイパーパラメータ決定ステップと、を実行させることを特徴とする。
【発明の効果】
【0013】
本発明によれば、ベイズ最適化による時系列予測モデルの適合性の向上および探索時間の短縮をすることができるという効果を奏する。また、本発明によれば、設定された制限時間内でできるだけ多くのハイパーパラメータを探索し、予測モデルの適合性の向上と探索時間の短縮とを両立することができるという効果を奏する。また、本発明によれば、時系列データの予測を活用することで、内部統制の強化やマネジメントに活用することができるという効果を奏する。また、本発明によれば、機械学習の知識がない人でも最良のハイパーパラメータを探索して、精度の良い時系列データの予測モデルを構築することができるという効果を奏する。また、本発明によれば、不正防止、ミス防止、ビジネスデータの変化の検知による業務効率化をすることができるという効果を奏する。また、本発明によれば、ベイズ最適化を行う処理ステップにて、ユーザが指定した処理許容時間に応じた処理を実行することができるという効果を奏する。また、本発明によれば、AIを活用して、各業務に応じてトレンドや周期性のある時系列データに対して、未来のデータの予測を行い、異常判定処理を行うことができるという効果を奏する。
【図面の簡単な説明】
【0014】
図1図1は、社員の法定外時間計の推移データの一例を示す図である。
図2図2は、社員の法定外時間計の推移データの一例を示す図である。
図3図3は、本実施形態における標準化二乗和誤差の予測関数の一例を示す図である。
図4図4は、本実施形態における異常判定結果の一例を示す図である。
図5図5は、本実施形態における時系列予測管理装置の構成の一例を示すブロック図である。
図6図6は、本実施形態における時系列予測管理装置の処理の一例を示すフローチャートである。
図7図7は、本実施形態における時系列予測管理処理の一例を示す図である。
図8図8は、本実施形態における時系列予測管理処理の一例を示す図である。
図9図9は、本実施形態における時系列予測管理処理の一例を示す図である。
図10図10は、本実施形態における時系列予測管理処理の一例を示す図である。
図11図11は、本実施形態における時系列予測管理処理の一例を示す図である。
図12図12は、本実施形態における時系列予測管理処理の一例を示す図である。
図13図13は、本実施形態における時系列予測管理処理の一例を示す図である。
図14図14は、本実施形態における時系列予測管理処理の一例を示す図である。
図15図15は、本実施形態における時系列予測管理処理の一例を示す図である。
図16図16は、本実施形態における時系列予測管理処理の一例を示す図である。
図17図17は、本実施形態における時系列予測管理処理の一例を示す図である。
図18図18は、本実施形態における時系列予測管理処理の一例を示す図である。
図19図19は、本実施形態における時系列予測管理処理の一例を示す図である。
図20図20は、本実施形態における時系列予測管理処理の一例を示す図である。
図21図21は、本実施形態における時系列予測管理処理の一例を示す図である。
図22図22は、本実施形態における時系列予測管理処理の一例を示す図である。
図23図23は、本実施形態における時系列予測管理処理の一例を示す図である。
図24図24は、本実施形態における時系列予測管理処理の一例を示す図である。
図25図25は、本実施形態における時系列予測管理処理の一例を示す図である。
図26図26は、本実施形態における時系列予測管理処理の一例を示す図である。
図27図27は、本実施形態における時系列予測管理処理の一例を示す図である。
図28図28は、本実施形態における時系列予測管理処理の一例を示す図である。
図29図29は、本実施形態における時系列予測管理処理の一例を示す図である。
図30図30は、本実施形態における時系列予測管理処理の一例を示す図である。
図31図31は、本実施形態における時系列予測管理処理の一例を示す図である。
図32図32は、本実施形態における時系列予測管理処理の一例を示す図である。
図33図33は、本実施形態における時系列予測管理処理の一例を示す図である。
図34図34は、本実施形態における時系列予測管理処理の一例を示す図である。
図35図35は、本実施形態における時系列予測管理処理の一例を示す図である。
図36図36は、本実施形態における時系列予測管理処理の一例を示す図である。
図37図37は、本実施形態における時系列予測管理処理の一例を示す図である。
図38図38は、本実施形態における時系列予測管理処理の一例を示す図である。
図39図39は、本実施形態における時系列予測管理処理の一例を示す図である。
図40図40は、本実施形態における時系列予測部品に渡す情報の一例を示す図である。
図41図41は、本実施形態における分解結果の一例を示す図である。
図42図42は、本実施形態における予測結果の一例を示す図である。
図43図43は、本実施形態における前処理の一例を示す図である。
図44図44は、本実施形態における前処理の一例を示す図である。
図45図45は、本実施形態における前処理の一例を示す図である。
図46図46は、本実施形態における事前分布の一例を示す図である。
図47図47は、本実施形態における事前分布の一例を示す図である。
図48図48は、本実施形態における事前分布の一例を示す図である。
図49図49は、本実施形態における予測関数の一例を示す図である。
図50図50は、本実施形態における予測関数の一例を示す図である。
図51図51は、本実施形態における予測関数の一例を示す図である。
【発明を実施するための形態】
【0015】
本発明の実施形態を図面に基づいて詳細に説明する。なお、本発明は本実施形態により限定されるものではない。
【0016】
[1.概要]
まず、図1から図4を参照して、本発明の概要を説明する。図1および図2は、社員の法定外時間計の推移データの一例を示す図である。図3は、本実施形態における標準化二乗和誤差の予測関数の一例を示す図である。図4は、本実施形態における異常判定結果の一例を示す図である。
【0017】
従来から、トレンドや周期性をもつような時系列データを管理している企業においては、過去の時系列データの実績をもとに未来のデータを予測し、予測結果をもとに意思決定をしたいという要求があった。例えば、従来、(a)就業時間を管理している企業においては、就業データを活用して、「法規定の残業時間を超える可能性のある社員を事前に検知したい」、「組織毎の社員の残業時間の合計がある規定値を超える可能性が高い組織を事前に検知したい」等の要求があり、(b)ハードウェアを管理している企業においては、ハードウェアモニタリングデータを活用して、「ハードウェアリソース使用状況・サーバのCPU使用率・メモリ使用量・ハードディスクアクセス数等の規定値を超える可能性が高いハードウェアを事前に検知したい」等の要求があった。なお、従来から、(a)就業データの活用、および、(b)ハードウェアモニタリングデータの活用での要求以外でも、トレンドや周期性を持つような業務上のあらゆるビジネスデータに対して、同様の要求があった。
【0018】
すなわち、従来から、(a)就業時間を管理している企業において、「法規定の残業時間を超える可能性のある社員を事前に検知したい」という要求があり、分析対象データは、図1に示すグラフのような勤務日毎の法定外時間計の推移データがあった。ここで、勤務日毎の当該法定外時間計の時系列データは、特徴(1):勤怠の締め日(図1では毎月15日)に法定外時間計が0時間にリセットされ、特徴(2):勤怠の締め日翌日から次の締め日まで(締期間)、法定外時間計は単調増加の傾向があり、締期間で周期性をもち、特徴(3):締期間毎に法定外時間計の増加の傾きや最大値は異なるという特徴を備えていた。ここで、法定外時間計は、前回の勤怠締め日からある時点までの法定外残業時間の累計時間であってもよい。
【0019】
図1に示すように、従来、法定外時間計は、特徴(1)、特徴(2)および特徴(3)のような特徴を持っているため、「周期性があるが、締期間毎に法定外時間計の最大値が異なるため、ある未来の期間の法定外時間計の増加傾向を過去の実績から予測し、月間の法規定の上限時間を超過する可能性が高い社員を高い精度で異常として事前に検知したい」という要求が出てきた。
【0020】
そして、図2に示すように、従来から、過去の実績データをもとに機械学習を行い、未来のデータの予測値、ならびに、信頼区間の上側信頼限界および下側信頼限界を取得することができていた。
【0021】
しかしながら、従来は、予測モデルのハイパーパラメータの探索に時間が掛かってしまうという課題(1)があった。すなわち、従来技術を用いて機械学習モデルを作成する際は、ユーザ側で設定が必要なハイパーパラメータがあり、この設定値によって予測モデルの適合性は大きく変わってしまうが、データサイエンティストのようなAI技術者でなければこのハイパーパラメータの適切な値を見つけ出すことは困難であり、さらに手動で探索するには多大な時間を要していた。そこで、誰でも柔軟に使用できるようシステムが自動的に精度の良いハイパーパラメータを見つけ出す従来の方法としては、ハイパーパラメータに設定可能な候補の値を全て設定して、最も精度のよいハイパーパラメータを得る方法があったが、この方法では、候補の値が多いときに膨大な試行計算が必要となるため、現実的には不可能であり、予測する時系列データ毎に機械学習モデルを作成するため、処理速度の問題がより顕著になっていた。ここで、ハイパーパラメータは、機械学習を行う上で、モデルの学習プロセスや予測の挙動を制御するためのパラメータであり、時系列データは、時刻列と時刻に依存する値列とをもつデータであり、時刻列は、時系列データの時刻を表す列であってもよい。
【0022】
また、従来は、異常判定の誤検知、異常判定を行うための予測値の確実性が不明確であるという課題(2)があった。すなわち、従来の異常検知システムにおいては、予測値が基準値を超えることのみ検知して異常と判定していたため、未来のデータに対する予測結果の確実性が低い場合でも誤った異常判定が発生しやすく、未来のデータの予測値の確実性を表す指標が異常判定の表示結果に表示されなかったため、予測値をどのくらい確信をもって見てよいのかが不明確であった。
【0023】
そこで、本実施形態においては、課題(1)に対して、ベイズ最適化を用いて最適なハイパーパラメータを探索する解決策(1)を採用している。ここで、時系列予測を行う上では、特異スペクトル解析(SSA)を用いるが、SSAはトレンド・周期性を学習でき、ノイズに強いという特徴があり、SSAを用いた予測モデルの適合性を向上させるには、時系列データからうまくトレンドおよび季節性成分を抽出し、ノイズを除去すること(スムージング効果)が重要になってくる。また、従来、SSAを良い条件で行うためには、ベイズ最適化を用いて探索する適切なハイパーパラメータである窓サイズを設定する必要があり、窓サイズの取りうる値の範囲が分かっているが、どのように効率的に最適な窓サイズを求めるかの方法は確立されておらず、窓サイズに全ての取りうる値を試す総当たり的な方法で最適な値が求められていたため、時間がかかっていた。そこで、本実施形態においては、ハイパーパラメータを探索する際、予測の誤差が最小になるハイパーパラメータを探索(最小値探索)するため、目的に適しているベイズ最適化を利用している。
【0024】
すなわち、本実施形態においては、最適なハイパーパラメータの探索にベイズ最適化を上手に適用することで時系列予測モデルの適合性の向上および探索時間の短縮を両立させる仕組みを提供している。具体的には、本実施形態において、ベイズ最適化を行う処理ステップでは、ユーザが指定した処理許容時間に応じて、ベイズ最適化に掛けられる処理の制限時間が決まるようし、ベイズ最適化を上手に適用することで、制限時間内である程度予測モデルの適合性の高くなるハイパーパラメータの探索ができるため、処理許容時間のユーザ指定により、時系列データの分析を行えるようにしている。また、本実施形態においては、初期観測点として、探索したいハイパーパラメータの最小値、3分割点、最大値を観測し、5点目以降として、制限時間内で1観測点あたりの処理時間に応じて観測点数を増やしていくことで、制限時間内で可能な限りの観測点を確保している。なお、観測点数を増やすと、より最適なハイパーパラメータを得ることができるが、同時に処理時間が長くなってしまうが、本実施形態においては、ベイズ最適化を活用することで、制限時間内である程度最適なハイパーパラメータを取得できるようにバランスを調整している。また、ベイズ最適化を行う上で、カーネル関数を指定する必要があり、カーネル関数には多くの種類があるが、本実施形態においては、探索したい関数がどのような関数であっても柔軟に対応できるようにガウスカーネルを指定し、ガウスカーネルを指定する際に、ガウスカーネルの係数の指定も必要だが、複数の係数を用いて実験することで最適な係数の決め方を探求している。
【0025】
ここで、図3には、ハイパーパラメータを9点探索した場合の窓サイズに対して標準化した予測誤差(二乗和誤差)の予測値および予測区間が示されており、設定可能なハイパーパラメータが53点あるが、探索された9点について、標準化二乗和誤差が負の値となるハイパーパラメータを中心に探索されているので、標準化二乗和誤差が最小となるハイパーパラメータを見つけることを目標に探索が行われている。また、本実施形態においては、ベイズ最適化を用いることで、少ない試行計算でも予測誤差を最小にするハイパーパラメータを見つけることができる。なお、図3に示すように、本実施形態においては、観測点から離れているほど、予測関数の返す予測値の確実性が下がるので、不確実性が高くなり、「予測値±標準偏差」が表す幅が広くなっている。
【0026】
また、本実施形態においては、課題(2)に対して、予測値が基準値を超える場合に異常だと判定し、ユーザが指定した信頼度に合わせた信頼区間と一緒に異常判定結果を表示する解決策(2)を採用している。具体的には、本実施形態において、時系列データの分割では、実績期間の時系列データが訓練用、検証用、テスト用データの3つに分割されるが、未来のデータに対して確実性の高い予測を行えるモデルを構築するため、「ハイパーパラメータの決定」処理、および、「予測モデルの適合性の評価」処理で最適なハイパーパラメータを決定し、「予測値の不確実性の許容度の評価」処理にて、未来のデータ予測結果に対して、許容幅をもって予測値の確実性を評価する。このように、本実施形態においては、一連の評価処理を通った後に異常判定が行われるため、より確実性のある異常判定結果が得られる。また、本実施形態においては、最終的に一定の許容度を満たす異常判定結果を表示する際、予測値、予測の不確実性の許容度がわかる予測値の信頼区間、および、基準値が表示され、特に、予測値の不確実性の許容度である信頼区間が表示されることで、ユーザは予測値の確実性を把握しながら、基準値を超える可能性があるかどうかを判断できる。
【0027】
ここで、図4に示すように、本実施形態においては、異常判定結果として、予測したい時系列データの実績値、未来の予測値、予測値の信頼区間(信頼区間の信頼度はユーザが指定できる)および基準値が表示され、異常判定として予測値が基準値を超えた場合に異常だと判定されるが、信頼区間が「予測値±許容幅」以上の幅を持つ場合に予測値の確実性が低いとし、異常判定を行わないため、予測値および異常判定結果の信憑性が保証されている。すなわち、図4に示すように、本実施形態においては、各種データが異常判定結果に表示され、ユーザが異常判定結果のグラフ表示を通じて、実績データと比較し、ユーザが指定した信頼区間、および、予測値の推移と基準値との差を確認することで、基準値を超える可能性があるかどうかを把握でき、その結果、適切な対応策を取ることができる。また、図4に示すように、本実施形態においては、異常判定結果から、2023/5/9時点で法定外時間系が基準値の45時間を超えそうだと予測でき、事前に異常だと判定された社員に対して注意喚起をすることができる。
【0028】
[2.構成]
本実施形態に係る時系列予測管理装置100の構成の一例について、図5を参照して説明する。図5は、本実施形態における時系列予測管理装置100の構成の一例を示すブロック図である。
【0029】
図5に示すように、時系列予測管理装置100は、市販のデスクトップ型パーソナルコンピュータである。なお、時系列予測管理装置100は、デスクトップ型パーソナルコンピュータのような据置型情報処理装置に限らず、市販されているノート型パーソナルコンピュータ、PDA(Personal Digital Assistants)、スマートフォン、タブレット型パーソナルコンピュータなどの携帯型情報処理装置であってもよい。
【0030】
時系列予測管理装置100は、制御部102と通信インターフェース部104と記憶部106と入出力インターフェース部108と、を備えている。時系列予測管理装置100が備えている各部は、任意の通信路を介して通信可能に接続されている。
【0031】
通信インターフェース部104は、ルータ等の通信装置および専用線等の有線または無線の通信回線を介して、時系列予測管理装置100をネットワーク300に通信可能に接続する。通信インターフェース部104は、他の装置と通信回線を介してデータを通信する機能を有する。ここで、ネットワーク300は、時系列予測管理装置100とサーバ200とを相互に通信可能に接続する機能を有し、例えばインターネットやLAN(Local Area Network)等である。
【0032】
入出力インターフェース部108には、入力装置112および出力装置114が接続されている。出力装置114には、モニタ(タッチパネルを含む)の他、スピーカやプリンタを用いることができる。入力装置112には、キーボード、マウス、およびマイクの他、マウスと協働してポインティングデバイス機能を実現するモニタを用いることができる。なお、以下では、出力装置114をモニタ114またはプリンタ114とし、入力装置112をキーボード112またはマウス112として記載する場合がある。
【0033】
記憶部106には、各種のデータベース、テーブル、およびファイルなどが格納される。記憶部106には、OS(Operating System)と協働してCPU(Central Processing Unit)に命令を与えて各種処理を行うためのコンピュータプログラムが記録される。記憶部106として、例えば、RAM(Random Access Memory)・ROM(Read Only Memory)等のメモリ装置、ハードディスクのような固定ディスク装置、フレキシブルディスク、および光ディスク等を用いることができる。記憶部106は、時系列データベース106aと異常判定定義マスタ106bとを備えている。
【0034】
時系列データベース106aは、時系列データを記憶する。ここで、時系列データベース106aは、時刻に依存する実績値が設定された時系列データを記憶していてもよい。また、時系列データベース106aは、訓練用データ、検証用データ、テスト用データ、異常判定結果データ、時系列予測モデル、時系列データの予測値、ハイパーパラメータ、モデル適合性評価、不確実性許容度評価、異常判定結果、更新データ、および、業務データ等を記憶していてもよい。
【0035】
異常判定定義マスタ106bは、業務データ上の異常判定定義を設定したマスタである。ここで、異常判定定義マスタ106bは、ハイパーパラメータの探索の処理許容時間が設定されていてもよい。また、異常判定定義マスタ106bは、時系列データの基準値、ならびに、時系列データの予測値の信頼度および許容幅が設定されていてもよい。また、異常判定定義マスタ106bは、時系列データのパラメータ設定値が設定されていてもよい。
【0036】
制御部102は、時系列予測管理装置100を統括的に制御するCPU等である。制御部102は、OS等の制御プログラム・各種の処理手順等を規定したプログラム・所要データなどを格納するための内部メモリを有し、格納されているこれらのプログラムに基づいて種々の情報処理を実行する。制御部102は、機能概念的に、モデル作成部102aと時系列予測部102bとハイパーパラメータ決定部102cとモデル適合性評価部102dと不確実性許容度評価部102eと異常検知部102fと結果表示部102gとを備えている。
【0037】
モデル作成部102aは、機械学習モデルである時系列予測モデルを作成する。ここで、モデル作成部102aは、時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成してもよい。また、モデル作成部102aは、処理許容時間に応じて決定される制限時間内に、ベイズ最適化を用いて、時系列データの一部を訓練用データとして機械学習モデルである時系列予測モデルを作成してもよい。また、モデル作成部102aは、更に、ハイパーパラメータの初期観測点として当該ハイパーパラメータの最小値、三分割点および最大値の4点を取得し、訓練用データに基づいて、各初期観測点をハイパーパラメータとする時系列予測モデルを作成してもよい。また、モデル作成部102aは、制限時間内に、二乗和誤差から標準化二乗和誤差を計算し、標準化二乗和誤差に基づいて、ベイズ最適化を用いて制限時間内に可能な限り設定可能なハイパーパラメータの候補観測点を取得し、訓練用データに基づいて、各候補観測点をハイパーパラメータとする時系列予測モデルを作成してもよい。また、モデル作成部102aは、観測点同士の類似度を評価することができるガウスカーネルの係数を決定し、制限時間内に、二乗和誤差から標準化二乗和誤差を計算し、標準化二乗和誤差、および、係数を設定したガウスカーネルに基づいて、ベイズ最適化を用いて制限時間内に可能な限り設定可能なハイパーパラメータの候補観測点を取得し、訓練用データに基づいて、各候補観測点をハイパーパラメータとする時系列予測モデルを作成してもよい。ここで、ガウスカーネルの係数は、探索すべき候補点の数を5で除算した商が候補観測点の数以下である場合、5であり、当該商が候補観測点の数より大きい場合、探索すべき候補点の数を候補観測点の数で除算した商であってもよい。また、モデル作成部102aは、時系列データを訓練用データ、検証用データおよびテスト用データに分割し、訓練用データを用いて機械学習モデルである時系列予測モデルを作成してもよい。
【0038】
時系列予測部102bは、時系列データの予測値を取得する。ここで、時系列予測部102bは、時系列予測モデルを用いて時系列データの予測値を取得してもよい。また、時系列予測部102bは、時系列予測モデルを用いて時系列データの予測値を取得し、異常判定定義マスタ106bに基づいて、予測値に対する信頼区間を取得してもよい。また、時系列予測部102bは、時系列予測モデルを用いて検証用データおよびテスト用データの予測値を取得し、異常判定定義マスタ106bに基づいて、予測値に対する信頼区間を取得してもよい。
【0039】
ハイパーパラメータ決定部102cは、時系列予測モデルの高適合性のハイパーパラメータを決定する。ここで、ハイパーパラメータ決定部102cは、実績値および予測値に基づいて、時系列予測モデルの高適合性のハイパーパラメータを決定してもよい。また、ハイパーパラメータ決定部102cは、実績値と予測値との二乗和誤差を計算し、最小の二乗和誤差となる観測点を時系列予測モデルの高適合性のハイパーパラメータとして決定してもよい。また、ハイパーパラメータ決定部102cは、検証用データと、検証用データの予測値と、の比較により、時系列予測モデルの高適合性のハイパーパラメータを決定してもよい。
【0040】
モデル適合性評価部102dは、時系列予測モデルの適合性の評価を示すモデル適合性評価を取得する。ここで、モデル適合性評価部102dは、信頼区間に含まれるテスト用データの予測値の割合が所定割合以上の場合、時系列予測モデルの適合性が十分であることを示すモデル適合性評価を取得してもよい。
【0041】
不確実性許容度評価部102eは、予測値の不確実性の許容度の評価を示す不確実性許容度評価を取得する。ここで、不確実性許容度評価部102eは、予測値の不確実性が許容できることを示す不確実性許容度評価を取得してもよい。また、不確実性許容度評価部102eは、信頼区間の幅が許容幅の2倍よりも狭い場合、予測値の不確実性が許容できることを示す不確実性許容度評価を取得してもよい。不確実性許容度評価部102eは、予測値の不確実性が許容できないことを示す不確実性許容度評価を取得してもよい。
【0042】
異常検知部102fは、予測値の異常判定結果を取得する。ここで、異常検知部102fは、予測値が基準値を超えると判定した場合、予測値の異常判定結果を取得してもよい。
【0043】
結果表示部102gは、時系列データの予測結果を表示させる。ここで、結果表示部102gは、時系列データの基準値、予測値、および、信頼区間を時系列に沿って表示させてもよい。また、結果表示部102gは、予測値の異常判定結果を表示させてもよい。
【0044】
[3.具体例]
本実施形態の具体例について、図6から図51を参照して説明する。
【0045】
[時系列予測管理処理]
ここで、図6を参照して、本実施形態における時系列予測管理処理の一例について説明する。図6は、本実施形態における時系列予測管理装置100の処理の一例を示すフローチャートである。
【0046】
図6に示すように、モデル作成部102aは、時系列データを訓練用データ、検証用データおよびテスト用データに分割する(ステップSA-1)。
【0047】
そして、モデル作成部102aは、訓練用データを用いて機械学習モデルである時系列予測モデルを作成する(ステップSA-2)。
【0048】
そして、時系列予測部102bは、時系列予測モデルを用いて検証用データおよびテスト用データの予測値を取得し、異常判定定義マスタ106bに基づいて、予測値に対する信頼区間を取得する(ステップSA-3)。
【0049】
そして、ハイパーパラメータ決定部102cは、検証用データと、検証用データの予測値と、の比較により、時系列予測モデルの高適合性のハイパーパラメータを決定する(ステップSA-4)。
【0050】
そして、モデル適合性評価部102dは、時系列予測モデルの適合性の評価を示すモデル適合性評価を取得する(ステップSA-5)。
【0051】
そして、不確実性許容度評価部102eは、予測値の不確実性の許容度の評価を示す不確実性許容度評価を取得する(ステップSA-6)。
【0052】
そして、異常検知部102fは、予測値が基準値を超えるか否かを判定する(ステップSA-7)。
【0053】
そして、異常検知部102fは、予測値が基準値を超えると判定した場合(ステップSA-7:Yes)、処理をステップSA-8に移行させる。
【0054】
そして、異常検知部102fは、予測値の異常判定結果を取得する(ステップSA-8)。
【0055】
そして、結果表示部102gは、予測値の異常判定結果を出力装置114に表示させ、時系列データの基準値、予測値、および、信頼区間を時系列に沿って出力装置114に表示させ(ステップSA-9)、処理を終了する。
【0056】
一方、異常検知部102fは、予測値が基準値を超えないと判定した場合(ステップSA-7:No)、処理をステップSA-10に移行させる。
【0057】
そして、結果表示部102gは、時系列データの基準値、予測値、および、信頼区間を時系列に沿って出力装置114に表示させ(ステップSA-10)、処理を終了する。
【0058】
ここで、図7から図39を参照して、本実施形態における時系列予測管理処理の一例について説明する。図7から図39は、本実施形態における時系列予測管理処理の一例を示す図である。
【0059】
本実施形態においては、勤怠が毎月15日締めの運用である企業にて異常判定処理が毎晩行われ、異常判定日が2023/5/2である際に、2023/5/1迄の社員の残業実績データが既にある状態において、次回締め日である2023/5/15迄に法定外時間計が45時間を超える可能性が高い社員を事前に検知することを目的としている。
【0060】
まず、図7に示すように、本実施形態において、異常判定の実行の設定は、業務データ上の異常判定を行う定義を管理する異常判定定義マスタ106bに登録されていることを前提(1)としている。ここで、信頼度は、必須項目ではなく、信頼区間の幅を評価したい場合にのみ設定される。また、許容幅は、必須項目ではなく、信頼区間の幅を評価したい場合にのみ設定される。また、許容幅は、予測値と実際の値とのずれを許容する範囲の幅を設定するものである。また、予測期間終了値取得関数は、時系列データの予測を時系列項目がいくつになる迄未来を予測するかを設定するパラメータである。また、fc_GetNextKintaiSimebiは、データベースで使用可能なスカラー値関数であり、この関数を実行することで実行日基準で次回の勤怠の締め日が取得される。また、本実施形態においては、実行日が2023/5/2なので、この関数を実行することで次回15日である2023/5/15という日付が取得される。また、処理許容時間は、「前処理」~「異常判定処理」迄に掛かってもよい時間が設定される。また、「前処理」~「異常判定処理」迄は、予測単位で分割されたデータ群毎に処理が行われるが、全てのデータ群に対しての処理完了迄に許容される処理時間が設定される。例えば、本実施形態においては、予測単位が社員CDであるため、「前処理」~「異常判定処理」迄は、社員CD毎、すなわち、社員毎に処理が行われるため、社員の人数分に対して全体で要する処理の許容時間が20分に設定されていることになる。
【0061】
また、図8に示すように、本実施形態においては、社員毎の残業実績データが既にあることを前提(2)としている。ここで、図8に示すように、残業実績データにおいては、曜日列を計算に使用することはないが、前処理にて「土曜日」および「日曜日」のデータが補間されるため、平日勤務の企業の場合、「土曜日」および「日曜日」が無い状態のデータが用いられる。
【0062】
また、図9に示すように、本実施形態においては、時系列データの予測を行う部品(時系列予測部品)が既にあることを前提(3)としている。ここで、図9に示すように、時系列予測部品には、各種情報を渡すことで予測結果が返ってくる。また、図9に示すように、信頼度は、必須項目ではなく、信頼区間の幅を評価したい場合にのみ設定され、設定されない場合、時系列予測部品が返す情報に上側信頼限界および下側信頼限界が無い。
【0063】
また、図10に示すように、本実施形態においては、ベイズ最適化を行う部品(ベイズ最適化部品)が既にあることを前提(4)としている。ここで、図10に示すように、ベイズ最適化部品には、各種情報を渡すことで次に探索すべき点が返ってくる。また、図10に示すように、ガウスカーネル(ρ=5)は、ガウスカーネルの式で係数ρに5を入れた関数:k(x1,x2)=exp[-|x1-x2|/2ρ]を意味し、カーネル情報にはこのように関数が渡される。また、図10に示すように、ベイズ最適化部品では、ベイズ最適化部品に渡された情報を保持する機能があり、探索中にベイズ最適化部品に渡す情報が「保持する情報」のような構造で保持されている。また、図10に示すように、探索中にベイズ最適化部品に渡す情報が渡されるたびに、「保持する情報」には、行追加されていく。
【0064】
そして、図11に示すように、本実施形態においては、前処理として、時系列データの分析を容易にすることを目的とし、通常、残業データ等は土日や祝日のデータが欠測しており、時刻列が等間隔になっておらず、分析しづらいため、等間隔でない場合に前処理が行われる。すなわち、図11に示すように、本実施形態においては、時系列データを時刻列項目が等間隔のデータとなるように加工され、時刻列項目が既に等間隔である場合、この処理は飛ばされてもよい。これにより、本実施形態においては、時系列データを時刻列が等間隔となるデータになるように加工され(残業データの場合は土日のデータが補間され)、時刻列が等間隔になるようなデータが作成される。具体的には、図11に示すように、本実施形態においては、異常判定定義マスタ106bのパラメータ設定列に登録されているデータを元に処理される(パラメータ設定の時刻列項目が等間隔になるように前処理され、補間などを行う際、パラメータ設定の予測項目の列の値をもとに補間される)。また、図11に示すように、加工後のデータの特徴としては、時刻列項目が行毎に等間隔になっており、曜日列に「土曜日」および「日曜日」のデータが補間され、勤務日列が行と行との間が全て1日差の等間隔になる。
【0065】
そして、図12に示すように、本実施形態においては、予測する期間の時刻列を有する時系列データを作成することを目的としている。すなわち、図12に示すように、本実施形態においては、予測する期間の時刻列を有する時系列データが作成される。これにより、本実施形態において、予測モデルを構築する際に必要な「何点先迄を予測するか」という情報は、本ステップで予測される期間の時系列データが作成されることにより得られ、異常判定結果が表示される際に、「未来のいつ時点で基準値を超えるか」という情報が表示され、その時点を表すために必要な情報となる。具体的には、図12に示すように、本実施形態においては、(1)時刻列項目の時間間隔が計算され、(2)異常判定定義マスタ106bで設定されている予測期間終了値取得関数をもとに予測する期間の時刻列を有する時系列データが作成される。また、図12に示すように、本実施形態においては、異常判定処理が2023/5/2に実行されるため、予測期間終了値取得関数が実行されると、予測期間終了値として実行日の次の勤怠の締め日である2023/5/15が取得される。
【0066】
そして、図13に示すように、本実施形態においては、前処理後残業実績データの最終レコードの勤務日に、図12(1)で計算された時間間隔が、パラメータ設定の予測期間終了値に達する迄足し続けられ、予測する期間の時刻列を有する時系列データが作成される。すなわち、図13に示すように、本実施形態においては、予測期間終了値に達する迄時間間隔(1日)が足し続けられる。また、図13に示すように、時系列データにおいて、法定外時間計列は、未来のデータであるため、NULLが設定される。
【0067】
そして、図14に示すように、本実施形態においては、「ハイパーパラメータの決定」および「予測モデルの適合性を評価」をするためのデータを用意することを目的としている。すなわち、図14に示すように、本実施形態においては、前処理後実績期間の時系列データが訓練用、検証用、テスト用データに分割される。具体的には、図14に示すように、本実施形態においては、前処理後実績期間の時系列データを時刻列の昇順に並べたときに過去の時刻から全体の80%のデータが訓練用データ、10%が検証用データ、残りがテスト用データとされる。ここで、一般的に検証用データ・テスト用データの割合は、それぞれ10%~20%で設定されるが、長期の周期をもつ時系列データの場合にも、周期性を学習出来るように訓練用データの割合を高くすることを重視して、訓練用データ、検証用データ、テスト用データの割合が80%:10%:10%に設定されている。なお、本実施形態においては、時系列データの特徴が分かっている場合、60%:20%:20%等の他の分割比に変更されてもよい。
【0068】
そして、図15に示すように、本実施形態においては、時系列予測において特異スペクトル解析(SSA)を用いる際に、最適な窓サイズ(時系列予測部品におけるハイパーパラメータ)を効率的に探索することを目的としている。すなわち、図15に示すように、本実施形態においては、時系列予測において、窓サイズというユーザが指定しなければならないハイパーパラメータがあり、様々な窓サイズに対して、訓練用データで検証用データを予測し、予測結果をもとにベイズ最適化を行うことで最適な窓サイズを探索することで、制限時間、初期観測点等を用いて効率的に短時間で処理することを目的としている。これにより、本実施形態において、最適な窓サイズが探索されることで、SSAを用いた予測モデルの適合性が向上し、トレンドや季節性成分の正確な抽出、および、ノイズの除去が可能になり、ベイズ最適化が利用されることで、最適な窓サイズを効率的に探索できることにより、総当たり的な方法に比べて探索時間を大幅に短縮することができる。また、本実施形態においては、最適なハイパーパラメータの探索にベイズ最適化を上手に適用することで時系列予測モデルの適合性の向上と探索時間の短縮とを両立させることをポイントとしており、SSAの窓サイズを最適化する有用なアプローチとなっている。ここで、「ベイズ最適化を上手に適用することで時系列予測モデルの適合性の向上と探索時間の短縮とを両立させる」とは、検証用データ(実績)と、窓サイズを変えた時の検証用データとの予測結果の比較により誤差を評価し、誤差情報をベイズ最適化による窓サイズ探索に用い、且つ、制限時間を設け、時間内に求められた窓サイズ探索の範囲内で、誤差が最小の窓サイズを求めることで、探索時間の短縮と精度向上との両立を図るということである。
【0069】
具体的には、図16に示すように、本実施形態においては、探索の制限時間の設定として、「1.異常判定定義マスタ106bのパラメータ設定の処理許容時間」および「2.異常判定定義マスタ106bのパラメータ設定の予測単位毎に分割したデータ群の数」が用いられている。ここで、データ群の数は、処理フローで「前処理」~「異常判定処理」迄を繰り返すデータ群の数であり、予測単位が社員CDであるため、社員CDの数と同じになる。また、探索の制限時間は、処理許容時間とデータ群の数を用いて、「探索の制限時間=処理許容時間÷データ群の数」の式で計算され設定される。
【0070】
そして、図17に示すように、本実施形態においては、時系列予測部品に渡すハイパーパラメータである窓サイズの最適値が探索される。ここで、時系列予測部品に渡すハイパーパラメータである窓サイズは、2以上且つ訓練用データのデータ数の半分未満である必要がある。また、図17に示すように、本実施形態においては、ハイパーパラメータの候補のうち、最大値、最小値、および、3分割点の値が抽出され(ラテン超方格法)、初期観測点とされる。すなわち、本実施形態においては、ハイパーパラメータの候補のうち、最大値、最小値、および、3分割点の値が抽出され、初期観測点とされることで、ベイズ最適化の初期段階において広い領域をカバーし、局所的な最適解に偏るリスクを軽減している。
【0071】
そして、図18に示すように、本実施形態においては、初期観測点毎に、(3)-1:検証用データの予測、および、(3)-2:時系列予測部品から返される情報を受け取り、検証用データと比較する二乗和誤差の計算が実行され、(3)-1および(3)-2の処理を4つの初期観測点に対して行った後の状態として検証結果が取得される。
【0072】
そして、図19に示すように、本実施形態において、ベイズ最適化は、平均が0になるように標準化することで効率的に学習が進むため、標準化を行い、二乗和誤差の標準化処理で標準化に用いた平均値と標準偏差とは、後続の処理で用いるため保持しておく。
【0073】
そして、図20に示すように、本実施形態においては、探索前にベイズ最適化に必要な情報がベイズ最適化部品に渡される。なお、本実施形態においては、図20に示すように、ガウスカーネルの係数を決めるために、探索するハイパーパラメータの候補と制限時間内で探索できそうなハイパーパラメータの個数とが必要であり、制限時間内で探索できそうなハイパーパラメータの個数が計算される。ここで、{(3)(4)に掛かる処理の時間÷4}の計算は、1つのハイパーパラメータに対して、検証用データの予測、および、検証用データの標準化に要した時間に相当する。
【0074】
そして、図21に示すように、本実施形態においては、初期観測点を渡した後のベイズ最適化部品から返される次の候補点が取得される。ここで、図21に示すように、本実施形態においては、「探索中に渡す情報(1)(2)」により、「保持する情報」が取得される。
【0075】
そして、図22に示すように、本実施形態においては、(6)の処理の後、次に探索すべきハイパーパラメータが取得されており、時系列予測部品に情報が渡される。ここで、図22に示すように、本実施形態においては、時系列予測部品を用いて予測された後、時系列予測部品から取得された予測結果をもとに二乗和誤差が計算される。そして、図22に示すように、本実施形態において、標準化する際の平均および標準偏差は、(4)の処理の二乗和誤差の標準化で得られた初期観測点標準化情報の平均および標準偏差が利用され、検証結果が初期観測点の検証結果に加えて保持される。
【0076】
そして、図23に示すように、本実施形態においては、ベイズ最適化部品に観測結果が渡され、ベイズ最適化部品から次に探索すべき点が取得される。
【0077】
そして、図24に示すように、本実施形態においては、制限時間の許す限りで(7)の処理が行われた後、窓サイズおよび標準化二乗和誤差の検証結果データが取得される。ここで、図24に示すように、本実施形態においては、制限時間内に10点の窓サイズについて検証が行われ、窓サイズが54の際に、二乗和誤差が一番小さいため、(8)の処理以降において、窓サイズ54を用いて予測が行われる。
【0078】
次に、図25に示すように、本実施形態においては、「ハイパーパラメータを決定する(検証用データを予測する)」処理で決定されたハイパーパラメータである窓サイズが適切かどうかを確認することを目的としている。すなわち、図25に示すように、本実施形態においては、探索された窓サイズの設定値によって適切な予測モデルが構築されるかを確認することを目的としている。これにより、本実施形態においては、「ハイパーパラメータを決定する」処理で決定された窓サイズが適切な場合、テスト用データおよびその予測値が近くなることから、モデルの予測精度を評価することができる。また、本実施形態においては、テスト用データが予測値の信頼区間に含まれている割合で精度を評価している。また、図25に示すように、本実施形態においては、時系列予測部品から予測値および95%信頼区間の情報が取得されたのち、テスト用データが信頼区間に含まれている割合が95%以上であれば、予測モデルの適合性は十分だと評価している。また、本実施形態においては、「ハイパーパラメータを決定する」処理で決定した窓サイズとテスト用データとを用いてモデル評価を行っている。
【0079】
具体的には、図26に示すように、本実施形態においては、時系列予測部品に訓練検証用データと最適な窓サイズ、予測点数、信頼度を渡し、予測が行われる。ここで、本実施形態においては、訓練用データと検証用データとを合わせたものを訓練検証用データとしており、「モデルの適合性を評価する」処理で時系列予測部品に渡される信頼度として、システム側であらかじめ固定値:0.95が設定されている。
【0080】
そして、図27に示すように、本実施形態においては、予測結果・信頼区間とテスト用データとを比較して予測モデルの適合性の評価が行われる。ここで、本実施形態において、評価の方法は、予測値の95%信頼区間にテスト用データが含まれている割合(カバレッジ)が95%以上であれば、予測モデルは適切だと評価し、この信頼区間の幅を決めるための信頼度95%は、ユーザが指定するものではなく、システム内にて固定値で設定されており、信頼区間を用いて予測モデルの適合性を評価する際は、95%信頼度の信頼区間が用いてられることが一般的であるため95%が採用されている。そして、図27に示すように、本実施形態においては、テスト用データが信頼区間に含まれている割合が求められる。ここで、「テスト用データが信頼区間に含まれている」とは、テスト用データが下側信頼限界以上且つ上側信頼限界以下ということであり、「信頼区間に含まれている」場合に、包含フラグ列に「丸:適合」が入り、含まれていない場合に、包含フラグ列に「バツ:不適合」が設定され、信頼区間に含まれているデータの割合をカバレッジとし、「カバレッジ=包含フラグが丸の数÷テスト用データの数×100(%)」で計算される。また、本実施形態においては、全て含まれているのでカバレッジが100%となり、95%より大きいため、予測モデルの適合性は十分だと判定され、逆に、カバレッジが95%未満の場合、予測モデルの適合性が低いとし、「未来のデータの予測」処理および「異常判定」処理が飛ばされ、次の予測単位のデータに対する処理に移行する。
【0081】
次に、図28に示すように、本実施形態においては、未来のデータを予測し、予測値が信頼できるか評価することを目的としている。すなわち、図28に示すように、本実施形態においては、予測値の信頼性を評価する際に設定が必要な信頼度・許容幅をユーザが指定できるため、ユーザがどの程度の確実性を必要として、異常判定を行うか決めることができ、予測値の確実性が信頼区間の幅と許容幅の値とを元に評価される。これにより、本実施形態においては、ユーザが指定した信頼度の信頼区間の幅をもとに予測値の不確実性の許容度を評価するため、ユーザが許容できる不確実性をもった予測結果をもとに異常判定処理に進むことができる。
【0082】
具体的には、図28に示すように、本実施形態においては、全ての前処理後実績期間の時系列データ、最適な窓サイズ、予測点数、信頼度が時系列予測部品に渡され、予測が行われる。ここで、図28に示すように、本実施形態においては、異常判定定義マスタ106bのパラメータ設定の信頼度の値が渡され、マスタテーブルで信頼度が設定されていない場合、時系列予測部品には信頼度の値が渡されない。
【0083】
そして、図29に示すように、本実施形態においては、信頼区間の幅と許容幅の2倍とが比較されて、予測値の不確実性の許容度が評価される(異常判定定義マスタ106bでパラメータ設定の信頼度が設定されていない場合、「予測値の不確実性の許容度を評価する」処理はスキップされる)。ここで、本実施形態において、許容幅は、異常判定定義マスタ106bのパラメータ設定の許容幅のことである。また、本実施形態において、時系列予測部品から返される情報には、信頼区間の上限(上側信頼限界)と下限(下側信頼限界)とが含まれ、許容幅だけ実際の値が予測値からずれても許容する場合、予測値の確実性を評価する際に、信頼区間の幅が重要になる。ここで、信頼区間の幅は、上側信頼限界と下側信頼限界との差である、予測値の不確かさを表し、幅が広いほど不確かさが高いということになる。また、本実施形態においては、信頼区間の幅が許容幅の2倍以上である場合、予測値がプラスとマイナスとの方向にそれぞれ許容幅以上のズレを持つ可能性があり、予測の確実性が低いと判定できる。一方、本実施形態においては、信頼区間の幅が許容幅の2倍以下である場合、予測値がプラスとマイナスとの方向にそれぞれ許容幅のズレ以下で収まる可能性があり、予測の信頼性は高いと判定できる。このように、本実施形態においては、全ての予測値の信頼区間の幅(上側信頼限界と下側信頼限界との差)が許容幅の2倍以下である場合、予測値の不確実性が許容できると判定できる。すなわち、図29に示すように、本実施形態においては、許容幅が異常判定定義マスタ106bで設定されている通り、5であるため、予測値からプラスとマイナスとの方向にそれぞれ5ずれることが許容されるとして予測値の不確実性の許容度が評価される。ここで、本実施形態においては、信頼区間の幅が許容幅×2以下であれば、予測値の不確実性は許容できると判定され、全ての予測値の不確実性が許容できる場合、構築した予測モデルが異常判定に用いられてもよいため、この後の処理が続けられ、1つでも不確実性を許容できないと判定された予測値がある場合、以降の処理がスキップされ、次の予測単位のデータに対しての処理に移行され、「許容できるか」の列には、許容できる場合(図29において、許容幅=5であるため、許容幅×2=10以下である場合)、「丸」、許容できない場合、「バツ」が設定される。
【0084】
そして、図30から図32に示すように、本実施形態においては、全ての予測値の信頼区間に対して許容幅の2倍より小さいかの評価が行われ、予測値の最初2点のみ拡大して表示されており、全ての予測値に対して、許容幅の矢印の長さの2倍と信頼区間の幅の矢印の長さとが比較されていき、全ての予測値に対して、信頼区間の幅が許容幅の2倍より小さければ、予測モデルの返す予測結果の不確実性が許容できるとされる。
【0085】
そして、図32に示すように、本実施形態においては、異常判定定義マスタ106bのパラメータ設定の信頼度が0.9より小さい0.68が指定された場合、予測値の不確実性が許容されやすくなる。このように、本実施形態においては、信頼度が小さくなると、予測値の不確実性が許容されやすくなる。すなわち、本実施形態においては、信頼度が小さくなると、時系列予測部品から返される上側信頼限界と下側信頼限界とから求まる信頼区間が狭くなり、信頼区間の幅が許容値の2倍の値より狭くなりやすくなり、予測値の不確実性が許容されやすくなる。また、本実施形態においては、信頼度が設定されていない場合、「予測値の不確実性の許容度を評価する」処理がスキップされ、不確実性の評価が行われずに異常判定処理に移行する。これは、予測の不確実性は気にせず、時系列データの未来の推移の基準線を得たいという目的の場合などに有効であり、信頼度をユーザが調整することは、どのくらい予測値の不確実性を許容して異常判定を行うかの度合を調整するパラメータとなっている。
【0086】
そして、図33に示すように、本実施形態においては、「予測する期間の時系列データの作成」処理で作成された予測期間の時系列データと予測結果とが結合される。ここで、図33に示すように、本実施形態においては、予測期間の時系列データの法定外時間計にNULLが入っているので、無視される。
【0087】
次に、図34に示すように、本実施形態においては、予測値が基準値を超える可能性のあるデータを異常検知することを目的としている。ここで、図34に示すように、本実施形態においては、法定外時間計の予測値が法規定45時間を超える場合、社員に対する異常が検知される。
【0088】
具体的には、図34に示すように、本実施形態においては、基準値がマスタに登録されている設定項目から取得され、予測結果が取得され、基準値が45なので、予測値が45以上のものが異常だと判定され、異常の場合、異常判定結果列にTRUE、異常でない場合、異常判定結果列にFALSEが設定される。すなわち、図35に示すように、本実施形態においては、予測値が基準値:45を超える場合、異常と判定可能に表示される。
【0089】
そして、図36に示すように、本実施形態においては、「前処理」~「異常判定処理」を全ての予測単位のグループ毎に行い、異常判定結果が取得される。
【0090】
次に、図37に示すように、本実施形態においては、ここ迄の処理で、予測単位毎の異常判定結果が求まっている状態であり、判定結果表示で必要な情報でテーブルを更新することを目的としている。すなわち、図37に示すように、本実施形態においては、「基準値差=予測値-基準値」が計算されて更新されることで、ある勤務日において、基準値をどれだけ超過するかの値が取得されやすくなる。
【0091】
そして、図38および図39に示すように、本実施形態においては、判定結果の表示を工夫することで、異常判定結果をユーザが有効活用できることを目的としている。すなわち、本実施形態においては、予測した時系列データの実績値、未来の予測値、予測値の信頼区間、基準値を表示することで、ユーザが必要な情報を可視化でき、適切な対応を取ることを目的としている。これにより、本実施形態においては、予測値が基準値を超えた場合、異常だと直感的にわかるように表示させ、適切な対応策を取ることができ、予測値だけでなく予測値の信頼区間を表示させることで、異常判定の信頼性を把握しながら、基準値を超える可能性があるかどうかを判定できるようにしている。ここで、本実施形態においては、信頼度と信頼区間幅とをもとに、基準値を超えて異常なデータがあった際に、(1)信頼度が高い(90%)且つ信頼区間の幅が広い場合、厳しい水準(ものさし)で見ると(厳しい信頼度を要求して見ると)、予測値のブレ幅が大きく、水準が厳しすぎるか、不確実性が高いかは不明だが、基準値の超過に注意が必要であり、(2)信頼度が高い(90%)且つ信頼区間の幅が狭い場合、厳しい水準(ものさし)で見ると(厳しい信頼度を要求して見ると)、予測値のブレ幅が小さいので予測結果は信用できそうであるため、基準値の超過に即対応が必要であり、(3)信頼度が低い(68%)且つ信頼区間の幅が広い場合、緩い水準(ものさし)で見ると(緩い信頼度を要求して見ると)、予測値のブレ幅が大きく、緩い水準で見ても、予測値のブレ幅が大きいので、予測値はあまり信用できないため、時系列データの経過を観察した方が良く、(4)信頼度が低い(68%)且つ信頼区間の幅が狭い場合、緩い水準(ものさし)で見ると(緩い信頼度を要求して見ると)、予測値のブレ幅が小さく、予測値のブレ幅が小さいものの、信頼度が低いため予測の確度がそれほど高くないため、基準値の超過に注意を払う等のアクションを取ることができる。
【0092】
また、図38および図39に示すように、本実施形態においては、異常判定結果として、予測したい時系列データの実績値、未来の予測値、予測値の信頼区間(信頼区間の信頼度はユーザが指定できる)および基準値が表示される。また、本実施形態においては、異常判定処理により予測値が基準値を超えた場合、異常だと判定されるが、信頼区間が予測値から±許容幅以上の幅を持つ場合、予測結果の確実性が低いとして、異常判定処理が行われないため、予測値および異常判定結果の確実性が保証されている。そして、本実施形態においては、実績値、未来の予測値、予測値の信頼区間および基準値が異常判定結果として表示されるため、ユーザは異常判定結果のグラフ表示を通じて、実績データと比較し、ユーザが指定した信頼区間、および、予測値の推移と基準値との差を確認することで、基準値を超える可能性があるかどうかを把握でき、その結果、適切な対応策を取ることができる。
【0093】
[時系列予測処理]
また、図40から図42を参照して、本実施形態における時系列予測処理の一例について説明する。図40は、本実施形態における時系列予測部品に渡す情報の一例を示す図である。図41は、本実施形態における分解結果の一例を示す図である。図42は、本実施形態における予測結果の一例を示す図である。
【0094】
図40に示すように、本実施形態においては、入力として未来を予測したい時系列データの実績、予測点数、窓サイズ、信頼度が時系列予測部品に受け渡され、未来を予測したい時系列データの実績の予測点数分先までの未来のデータが予測され、予測される際、未来のデータの予測値および入力として受け取った信頼度に応じた信頼区間も予測される。なお、信頼度は、設定しなくてもよく、設定しない場合、時系列予測部品が返す情報に上側信頼限界および下側信頼限界が無く、設定する場合、予測値の内側信頼度の信頼区間の上限と下限が返される。
【0095】
そして、図41に示すように、本実施形態においては、時系列データに対してラグ数の分だけずらしたデータを並べた行列であるラグ行列が作成され、ラグ行列に対して、特異値分解が行われ、特異値分解の結果が各成分に分解された後、もとの時系列データのトレンド成分、季節性成分、および、残差成分が計算され、ラグ行列のトレンド成分、および、季節性成分に対して、復元されることで、グラフ表示のように、もとの時系列データが分解表示される。ここで、残差成分については、元の時系列データからトレンド成分および季節性成分を減算することで計算される。すなわち、図41に示すように、本実施形態においては、窓サイズを30とした場合の分解の結果が表示され、元の時系列データについて山のピークがどんどん高くなる傾向にあるが、トレンド成分について単調に増加する傾向を示しているため、この特徴をよく表現できており、季節性成分について周期性をとらえられていることもわかる。対比として、図41に示すように、本実施形態においては、窓サイズ10の場合の分解の結果が表示されているが、窓サイズが10の場合より、窓サイズが30の場合のほうがうまく分解できていることから、時系列予測モデルを構築する上で窓サイズの設定値が重要な意味を持つことがわかる。なお、図41に示すように、本実施形態において、窓サイズが10の場合は、窓サイズが30の場合と比べてトレンド成分がうまく抽出されておらず、トレンド成分の推移の傾向が季節性成分のように周期性を持った推移を示しており、季節性成分が残差成分と似た推移となっており、季節性成分および残差成分の分解もうまくできていない。
【0096】
そして、図42に示すように、本実施形態においては、トレンド成分および季節性成分のそれぞれに対して予測モデルが構築・学習され、最終的に、時系列予測部品から元の時系列データの予測結果が返される。このように、本実施形態において、窓サイズは、トレンド成分および季節性成分の傾向に大きな影響が与えられ、窓サイズが小さすぎると、小刻みな変化にトレンド成分が敏感に反応し、過適合となって将来予測のモデル適合度が不安定になり、逆に、窓サイズが大きすぎると、トレンド成分が緩やかな傾向しかとらえられず、季節成分が残差成分に近い微小な変化となる。その結果、本実施形態において、予測は、平均的で信頼区間が大きく、ざっくりとした予測になってしまう。例えば、本実施形態においては、締め期間で1か月の周期性がある場合、それよりも短い週単位やそれよりも長い四半期単位の周期性を見ることで、より良い予測が可能な場合がある。
【0097】
[前処理]
また、図43から図45を参照して、本実施形態における前処理の一例について説明する。図43から図45は、本実施形態における前処理の一例を示す図である。
【0098】
図43に示すように、本実施形態においては、欠測補間対象の時系列項目が日付型で、土日祝が欠測しているデータに対する補間処理(1.日付が等間隔(1日単位)になるよう補間し、2.日付(曜日含む)以外のその他の列は直前値または直後値で補間する処理)により、ある社員の累計残業時間データに対しての日付型時系列データの欠測補間を実行している。
【0099】
そして、図44に示すように、本実施形態においては、時系列データの計測誤差の丸め込み処理(計測時刻の小数点以下の丸め込み処理)として、実行時刻に若干の遅延が生じる時系列データに対して、丸め込み(切り捨て)が行われ、例えば、CPU使用率の計測時刻について、1秒未満が切り捨てられる。なお、本実施形態においては、「.00秒」に実行されるが、毎回若干の遅延が発生すると仮定している。
【0100】
そして、図45に示すように、本実施形態においては、時系列データの拡張処理(例えば、計測時刻1秒毎のデータを0.5秒毎のデータへの拡張処理)として、サンプルサイズを増やしたい時や値を補間したい時に行われ、対象の時系列データに対して、線形補間が行われ、線形補間により補間される前後の2点(x1,y1)および(x2,y2)を用いて、その2点を通る線分:y=y1+(y2-y1)/(x2-x1)×(x-x1)・・・(1)を用いて計算され、(x1,y1)=(0,44),(x2,y2)=(1,70)の時、式(1)がx=0.5でy=57となり、補間される値が(x,y)=(0.5,57)とされる。例えば、本実施形態においては、CPU使用率の計測時刻が1秒単位から0.5秒単位に変更された場合、入力xを計測時刻、出力y(補間したい数値データ)をCPU使用率とすると、(x1,y1)=(16:55:00.00,43.69),(x2,y2)=(16:55:01.00,69.6)の時、式(1)がx=16:55:00.50でy=56.65となる。ここで、図45に示すように、本実施形態においては、左表に計測時刻1秒毎のCPU使用率の推移が表示され、右表に計測時刻を0.5秒毎に補間した後のCPU使用率の推移が表示されている。
【0101】
[カーネル決定処理]
図46から図51を参照して、本実施形態におけるカーネル決定処理の一例について説明する。図46から図48は、本実施形態における事前分布の一例を示す図である。図49から図51は、本実施形態における予測関数の一例を示す図である。
【0102】
本実施形態において、ベイズ最適化では、対象となる目的関数の性質が未知であることがあり、それを踏まえ、関数の柔軟性を高めることができ、正確な最適解を得られるカーネル関数を設定する必要がある。なお、本実施形態において、カーネル関数の種類には、指数カーネルや周期カーネル等があるが、ガウスカーネルが採用され、そのlengthパラメータ(以下、係数)の値として5が採用されている。ここで、カーネル関数とは、2点(x1,x2)の入力データの類似度を計算するための関数であり、共分散関数の一種であり、入力変数間の相関を表している。厳密には、カーネル関数は、x1,x2それぞれを非線形関数に当てはめ、その内積で表現される。また、図46から図48に示すように、本実施形態において、ガウスカーネルの性質については、ガウスカーネルkが2変数関数で表現され、x1,x2の2点の距離に応じて、値が正規分布のように指数的に減衰する関数となっている。ここで、x1,x2は、候補点を表し、ガウスカーネルは、係数ρの値を変化させることで、関数の平滑度を調整することができる。また、図46から図48に示すように、本実施形態においては、ρの値を変化させた時の事前分布のサンプルが示され、事前分布は、目的関数の仮の予測値を与えるものであり、目的関数の形状が予め想定され、事前分布のサンプルからρが選択される。また、本実施形態においては、ρを大きくすればするほど、kの値が大きくなり、2点x1,x2の共分散が大きくなりやすくなり、「共分散が大きくなる=2点の出力は近い値となる」ため、全体として滑らかな関数になる。一方で、本実施形態においては、ρを小さくすればするほど、kの値が0に近づきやすくなり、x1,x2の2点間の共分散が0に近づきやすくなり、結果として、それぞれの点が独立となるため、平滑度の低い関数となる。また、本実施形態において、ガウスカーネルを採用する理由としては、柔軟に関数を表現できる(ガウスカーネルは無限次元の特徴ベクトルから作成されるため)からであり、カーネル関数は、特徴ベクトルの内積で定義され、スカラー(実数)として表現できるため、特徴ベクトルの次元が無限でも問題はない(1×nのベクトルの内積は1×n、n×1で1×1のスカラーになるため、nの大きさは関係ない)ためである。ここで、特徴ベクトルとは、基底関数を要素に持つベクトルである。また、本実施形態において、その他のカーネルを選択しなかった理由としては、線形カーネルでは柔軟に関数を表現できず、指数カーネルでは平滑性がなく、柔軟に関数を表現できず、周期カーネルでは関数を柔軟に表現できるが、推定する目的関数に周期性を必ずしも仮定できないためである。
【0103】
そして、本実施形態において、ガウスカーネルの係数ρの決め方としては、限られた計算時間で最適解を得るために、「探索すべき候補点の数÷5≦時間内に探索できそうな候補点の数」の場合、係数ρ=5とし、「探索すべき候補点の数÷5>時間内に探索できそうな候補点の数」の場合、「係数ρ=[探索すべき候補点の数]÷[時間的に探索できそうな候補点の数]」とする。ここで、図49から図51に示すように、本実施形態においては、ρ=2,5,10の時に予測された予測関数および標準偏差関数のグラフが示されている。すなわち、本実施形態においては、図49に示すように、ρ=2の時、探索点が窓サイズ30~40付近が重点的に探索されており、幅広く探索されておらず、図50に示すように、ρ=5の時、最適解がありそうな窓サイズ40~50付近が重点的に探索され、且つ、窓サイズ1~30の間も程よく探索されており、図51に示すように、ρ=10の時、幅広く探索されているが、不確かさ(標準偏差)が矮小化して表示されているため、真に最適な解を見つけるのに時間がかかってしまう。以上から、本実施形態においては、基本的にρ=5とし、「探索すべき候補点の数÷5>時間的に探索できそうな候補点の数」の場合だけ、幅広く探索され、少しでも真に最適に近い値を選択できるように、大きめのρが設定される。
【0104】
[4.国連が主導する持続可能な開発目標(SDGs)への貢献]
本実施形態により、業務効率化や企業の適切な経営判断を推進することに寄与することができるので、SDGsの目標8及び9に貢献することが可能となる。
【0105】
また、本実施形態により、廃棄ロス削減や、ペーパレス・電子化を推進することに寄与することができるので、SDGsの目標12、13及び15に貢献することが可能となる。
【0106】
また、本実施形態により、統制、ガバナンス強化に寄与することができるので、SDGsの目標16に貢献することが可能となる。
【0107】
[5.他の実施形態]
本発明は、上述した実施形態以外にも、特許請求の範囲に記載した技術的思想の範囲内において種々の異なる実施形態にて実施されてよいものである。
【0108】
例えば、実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。
【0109】
また、本明細書中や図面中で示した処理手順、制御手順、具体的名称、各処理の登録データや検索条件等のパラメータを含む情報、画面例、データベース構成については、特記する場合を除いて任意に変更することができる。
【0110】
また、時系列予測管理装置100に関して、図示の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。
【0111】
例えば、時系列予測管理装置100が備える処理機能、特に制御部102にて行われる各処理機能については、その全部または任意の一部を、CPUおよび当該CPUにて解釈実行されるプログラムにて実現してもよく、また、ワイヤードロジックによるハードウェアとして実現してもよい。尚、プログラムは、本実施形態で説明した処理を情報処理装置に実行させるためのプログラム化された命令を含む一時的でないコンピュータ読み取り可能な記録媒体に記録されており、必要に応じて時系列予測管理装置100に機械的に読み取られる。すなわち、ROMまたはHDD(Hard Disk Drive)などの記憶部などには、OSと協働してCPUに命令を与え、各種処理を行うためのコンピュータプログラムが記録されている。このコンピュータプログラムは、RAMにロードされることによって実行され、CPUと協働して制御部を構成する。
【0112】
また、このコンピュータプログラムは、時系列予測管理装置100に対して任意のネットワークを介して接続されたアプリケーションプログラムサーバに記憶されていてもよく、必要に応じてその全部または一部をダウンロードすることも可能である。
【0113】
また、本実施形態で説明した処理を実行するためのプログラムを、一時的でないコンピュータ読み取り可能な記録媒体に格納してもよく、また、プログラム製品として構成することもできる。ここで、この「記録媒体」とは、メモリーカード、USB(Universal Serial Bus)メモリ、SD(Secure Digital)カード、フレキシブルディスク、光磁気ディスク、ROM、EPROM(Erasable Programmable Read Only Memory)、EEPROM(登録商標)(Electrically Erasable and Programmable Read Only Memory)、CD-ROM(Compact Disk Read Only Memory)、MO(Magneto-Optical disk)、DVD(Digital Versatile Disk)、および、Blu-ray(登録商標) Disc等の任意の「可搬用の物理媒体」を含むものとする。
【0114】
また、「プログラム」とは、任意の言語または記述方法にて記述されたデータ処理方法であり、ソースコードまたはバイナリコード等の形式を問わない。なお、「プログラム」は必ずしも単一的に構成されるものに限られず、複数のモジュールやライブラリとして分散構成されるものや、OSに代表される別個のプログラムと協働してその機能を達成するものをも含む。なお、本実施形態に示した各装置において記録媒体を読み取るための具体的な構成および読み取り手順ならびに読み取り後のインストール手順等については、周知の構成や手順を用いることができる。
【0115】
記憶部106に格納される各種のデータベース等は、RAM、ROM等のメモリ装置、ハードディスク等の固定ディスク装置、フレキシブルディスク、および、光ディスク等のストレージ手段であり、各種処理やウェブサイト提供に用いる各種のプログラム、テーブル、データベース、および、ウェブページ用ファイル等を格納する。
【0116】
また、時系列予測管理装置100は、既知のパーソナルコンピュータまたはワークステーション等の情報処理装置として構成してもよく、また、任意の周辺装置が接続された当該情報処理装置として構成してもよい。また、時系列予測管理装置100は、当該装置に本実施形態で説明した処理を実現させるソフトウェア(プログラムまたはデータ等を含む)を実装することにより実現してもよい。
【0117】
更に、装置の分散・統合の具体的形態は図示するものに限られず、その全部または一部を、各種の付加等に応じてまたは機能負荷に応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。すなわち、上述した実施形態を任意に組み合わせて実施してもよく、実施形態を選択的に実施してもよい。
【産業上の利用可能性】
【0118】
本発明は、勤怠管理等の時系列データを用いる様々な業界において有用である。
【符号の説明】
【0119】
100 時系列予測管理装置
102 制御部
102a モデル作成部
102b 時系列予測部
102c ハイパーパラメータ決定部
102d モデル適合性評価部
102e 不確実性許容度評価部
102f 異常検知部
102g 結果表示部
104 通信インターフェース部
106 記憶部
106a 時系列データベース
106b 異常判定定義マスタ
108 入出力インターフェース部
112 入力装置
114 出力装置
200 サーバ
300 ネットワーク
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36
図37
図38
図39
図40
図41
図42
図43
図44
図45
図46
図47
図48
図49
図50
図51