(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024018619
(43)【公開日】2024-02-08
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
G05B 23/02 20060101AFI20240201BHJP
【FI】
G05B23/02 R
G05B23/02 302R
【審査請求】未請求
【請求項の数】7
【出願形態】OL
(21)【出願番号】P 2022122055
(22)【出願日】2022-07-29
(71)【出願人】
【識別番号】000006666
【氏名又は名称】アズビル株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】長嶋 聖
【テーマコード(参考)】
3C223
【Fターム(参考)】
3C223AA11
3C223BA02
3C223CC02
3C223DD03
3C223EA01
3C223EB07
3C223FF02
3C223FF03
3C223FF04
3C223FF05
3C223FF12
3C223FF13
3C223FF22
3C223FF35
3C223FF42
3C223FF45
3C223FF52
3C223FF53
3C223GG01
3C223HH03
3C223HH08
3C223HH29
(57)【要約】
【課題】自己回帰モデルの予測処理に使用されるパラメータセットの評価時に、突発的な異常データによる不適切なモデルパラメータのセットの決定を回避すること。
【解決手段】情報処理装置10は、指標値算出部12aとパラメータ判定部12bとを備える。指標値算出部12aは、過去のデータから予測値を求めるために使用される回帰係数を算出するための、調整パラメータセットのそれぞれについて、予め設定された指標の値を算出する。パラメータ判定部12bは、調整パラメータセットのそれぞれについて、算出された指標値と、当該調整パラメータセットの近傍の調整パラメータセットの指標値とに基づき、当該調整パラメータセットを選択する。
【選択図】
図4
【特許請求の範囲】
【請求項1】
過去のデータから予測値を求めるために使用される回帰係数を算出するための、調整パラメータセットのそれぞれについて、予め設定された指標の値を算出する指標値算出部と、
前記調整パラメータセットのそれぞれについて、算出された前記指標値と、当該調整パラメータセットの近傍の調整パラメータセットの前記指標値とに基づき、当該調整パラメータセットを選択するパラメータ判定部と
を備えることを特徴とする情報処理装置。
【請求項2】
前記パラメータ判定部は、前記近傍の調整パラメータセットとして、前記調整パラメータセットにおける各要素の中の一つの要素についての数値を、当該要素の数値として設定された候補において隣り合う数値に変更した調整パラメータセットの前記指標値に基づき、当該調整パラメータセットを選択する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記指標値算出部は、前記指標値として、
過去のデータにおける、予測値を算出するときの基準となる時刻ポイントに対応する予測値と、過去の実際のデータとの平均二乗誤差と、
前記時刻ポイントに対応する予測値と予め設定された閾値との差と、
過去のデータにおける全ての異常予測区間に対し、異常予測に成功した予測値に対応する前記時刻ポイントを含む異常予測区間の割合である異常検知成功率と、
過去のデータにおける正常区間内の前記時刻ポイントの総数に対し、正常予測に成功した予測値に対応する前記時刻ポイントの数の割合である正常区間予測成功率とを算出する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記パラメータ判定部は、前記近傍の調整パラメータセットの指標値として、過去の所定の基準時刻に設定し、当該基準時刻を基準とした所定の区間のデータを用いて、各調整パラメータセットについての前記指標値をそれぞれ算出し、さらに、前記基準時刻を変更し、変更した基準時刻を基準とした所定の区間のデータを用いて、各調整パラメータセットについての前記指標値をそれぞれ算出する処理を所定回数繰り返し、算出した各指標値に基づき、前記調整パラメータセットを選択する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項5】
前記指標値算出部は、前記指標値として、前記基準時刻を基準として所定の区間のデータを用いて算出された予測値と過去の実際のデータとの平均二乗誤差を算出し、
前記パラメータ判定部によって選択された調整パラメータセットに応じて、未来予測モデルの前記回帰係数を更新する予測モデル更新部をさらに備える
ことを特徴とする請求項4に記載の情報処理装置。
【請求項6】
情報処理装置で実行される情報処理工程であって、
過去のデータから予測値を求めるために使用される回帰係数を算出するための、調整パラメータセットのそれぞれについて、予め設定された指標値を算出する指標値算出工程と、
前記調整パラメータセットのそれぞれについて、算出された前記指標値と、当該調整パラメータセットの近傍の調整パラメータセットの前記指標値とに基づき、当該調整パラメータセットを選択するパラメータ判定工程と
を含むことを特徴とする情報処理方法。
【請求項7】
過去のデータから予測値を求めるために使用される回帰係数を算出するための、調整パラメータセットのそれぞれについて、予め設定された指標値を算出する指標値算出手順と、
前記調整パラメータセットのそれぞれについて、算出された前記指標値と、当該調整パラメータセットの近傍の調整パラメータセットの前記指標値とに基づき、当該調整パラメータセットを選択するパラメータ判定手順と
をコンピュータに実行させるための情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、危険物質を扱う製造現場などでは、事故を未然に防ぐために、時系列データを解析し、それを基にデータの予測を行うことがされてきた。そして、この予測をより精度が高いものにするためには、予測を行うモデルのパラメータを調整する必要がある。
【0003】
しかし、パラメータの調整作業は、予測トレンドの傾向やエンジニアの知見をもとに試行錯誤を繰り返して実施するため、多くの労力と時間がかかることが課題である。そこで、パラメータ調整作業をAI(Artificial Intelligence)技術により行う方法が知られている。
【0004】
例えば、定常入力データと対応する定常出力データに基づいて、算出された静的パラメータを制約条件として、非定常な入力データと出力データに基づく動的パラメータを推定する方法(例えば特許文献1参照)や、時系列データについて、複数の非調和信号を定義するパラメータセットを総当たり方式で最適化する方法(例えば特許文献2参照)が従来技術として知られている。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2004-062440号公報
【特許文献2】国際公開2020/178919号
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかし、上記の従来技術では、推定されるパラメータや、各パラメータセットを評価する際に、外れ値のような異常なデータを使って評価値が算出されてしまう可能性を回避することができないため、突発的な異常データにより不適切なパラメータセットが決定される可能性があるという課題があった。
【課題を解決するための手段】
【0007】
上述した課題を解決し、目的を達成するために、本発明の情報処理装置は、過去のデータから予測値を求めるために使用される回帰係数を算出するための、調整パラメータセットのそれぞれについて、予め設定された指標の値を算出する指標値算出部と、調整パラメータセットのそれぞれについて、算出された指標値と、当該調整パラメータセットの近傍の調整パラメータセットの指標値とに基づき、当該調整パラメータセットを選択するパラメータ判定部とを備えることを特徴とする。
【発明の効果】
【0008】
本発明によれば、パラメータセットの評価時に、パラメータセットまたはデータセットに対する「距離(時間位置)」の概念を導入した評価を行うことで、突発的な異常データによる不適切なモデルパラメータのセットの決定を回避することができるという効果を奏する。
【図面の簡単な説明】
【0009】
【
図1】
図1は、実施形態に係る情報処理における予測値と回帰係数の算出方法の概要を示す図である。
【
図2】
図2は、実施形態に係る情報処理における調整パラメータの概要を示す図である。
【
図3】
図3は、実施形態1に係る情報処理方法の概要を示す説明図である。
【
図4】
図4は、実施形態1に係る情報処理装置の構成例を示す図である。
【
図5】
図5は、実施形態1に係る情報処理における指標値の概要を示す図である。
【
図6】
図6は、実施形態1に係る情報処理における指標値の概要を示す図である。
【
図7】
図7は、実施形態1に係る情報処理における指標値の概要を示す図である。
【
図8】
図8は、実施形態1に係る情報処理における、近傍の調整パラメータセットに基づき当該調整パラメータセットを選択する際の処理の概要を示す図である。
【
図9】
図9は、実施形態1に係る情報処理の具体例におけるシステム全体の流れを示す図である。
【
図10】
図10は、実施形態1に係る情報処理の具体例における前提となる各設定の一例を示す図である。
【
図11】
図11は、実施形態1に係る情報処理の具体例における調整パラメータセットの選出結果の一例を示す図である。
【
図12】
図12は、実施形態1に係る情報処理の具体例における調整パラメータセットの選出結果の一例を示す図である。
【
図13】
図13は、実施形態1に係る情報処理の具体例における調整パラメータセットの選出結果の一例を示す図である。
【
図14】
図14は、実施形態1に係る情報処理の具体例における調整パラメータセットの選出結果の一例を示す図である。
【
図15】
図15は、実施形態1に係る処理手順の一例を示すフローチャートである。
【
図16】
図16は、実施形態1に係る情報処理による予測結果の一例を示す図である。
【
図17】
図17は、実施形態2に係る情報処理方法の概要を示す説明図である。
【
図18】
図18は、実施形態2に係る情報処理装置の構成例を示す図である。
【
図19】
図19は、実施形態2に係る情報処理の具体例におけるシステム全体の流れを示す図である。
【
図20】
図20は、実施形態2に係る情報処理の具体例における平均RMS誤差の算出方法の一例を示す図である。
【
図21】
図21は、実施形態2に係る処理手順を示すフローチャートである。
【
図22】
図22は、実施形態2に係る情報処理による予測結果の一例を示す図である。
【発明を実施するための形態】
【0010】
以下に、本願に係る情報処理装置、情報処理方法及び情報処理プログラムの実施形態を図面に基づいて詳細に説明する。なお、本願に係る情報処理装置について、2つの実施形態を説明するが、これらの実施形態により本願に係る情報処理装置、情報処理方法及び情報処理プログラムが限定されるものではない。
【0011】
[原理]
〔1.はじめに〕
以下では、本実施形態に係る情報処理装置とその出力先である自己回帰モデルの機能について説明する。自己回帰モデルは、与えられた時系列データに対する1ステップ先の未来予測値を、過去時系列に再帰的にシフトすることで、任意ステップ先の未来予測値を推算する。また、本実施形態に係る情報処理装置は、与えられた時系列データに対して、各時刻において適切な予測となるような、後述する調整パラメータセットを探索し、自己回帰モデル等に出力する。
【0012】
〔2.予測値算出方法〕
以下では、本実施形態に係る自己回帰モデルによる予測値の算出方法と、それに使用される回帰係数を算出するための調整パラメータについて、数式及び図面を参照して説明する。
図1は、実施形態に係る情報処理における予測値と回帰係数の算出方法の概要を示す図である。また、
図2は、実施形態に係る情報処理における調整パラメータの概要を示す図である。
【0013】
(2-1.予測値と回帰係数)
まず、予測値の算出方法について説明する。予測値は、現在値から任意の数(p個)の過去データを、回帰係数で重みづけして加算することにより算出される。ここで、p個の過去データにより予測値を算出する方法は、
図1(1)式のように表される。また、回帰係数は、任意の数(q個)の過去データに最もよく当てはまるような値を、正則化最少二乗法により算出される。回帰係数の算出方法は、
図1(2)式のように表される。
【0014】
例えば、
図1の(2)式の例は、「p=3、q=6」の場合の回帰係数(a1、a2、a3)を求める正規方程式を表している。つまり、予測値は、基準値となるデータから3(p)個の過去データと回帰係数(a1、a2、a3)により算出され、回帰係数a1、a2、a3は、基準値となるデータから6個の過去データが使用されることにより推定される。
【0015】
(2-2.調整パラメータ)
次に、前述の回帰係数を算出するために使用される調整パラメータについて数式を参照して説明する。調整パラメータには、前述したp、qの他にλ、nの4つの種類があり、この4つの組み合わせの一組を調整パラメータセットとする。
【0016】
ここで、調整パラメータλは、前述の回帰係数の算出過程における正則化の重みであり、計算を安定させるためのロバストパラメーターである。このλを取り入れた、ロバスト性確保のためのリッジ回帰による最小二乗推定は、
図2(3)式のように表される。また、調整パラメータnは、予測値の計算において、過去のデータを伸縮させる任意の値であり、予測に用いるデータのサンプリング周期を調整するパラメータである(
図2参照)。
【0017】
例えば、
図2の例では、時系列データにおける予測値を算出するときの基準となる時刻ポイントは13個ある。しかし、調整パラメータ「n=4」であるため、13個の時刻ポイントのうち4個の時刻ポイントが等間隔で抽出され、抽出された時刻ポイントを用いて予測計算が行われる。
【0018】
[実施形態1]
〔1.情報処理方法の概要〕
まず、
図3を参照し、実施形態1に係る情報処理装置が行う情報処理方法の概要について説明する。
図3は、実施形態1に係る情報処理方法の概要を示す説明図である。なお、
図3では、与えられた時系列データに対して、評価対象内の予測値を算出するときの基準となる時刻ポイントにおいて、適切な予測となる調整パラメータセットを選択し、外部に出力する場合の情報処理の一例について説明する。
【0019】
図3に示す例において、情報処理装置10は、時系列データ、正常区間および異常予測区間のラベル、警報閾値の入力に応じて、最適な調整パラメータセットを選択し、選択した結果を出力する情報処理装置であり、コンピュータやクラウドシステム等により実現される。
【0020】
情報処理装置10は、時系列データ、正常区間および異常予測区間のラベル、警報閾値の入力を受付け、受付けられた情報に基づき、評価対象内の全時刻ポイントに対して、候補となる全ての調整パラメータセットについて予測結果を評価し、最適な調整パラメータセットを選択し、外部に出力する。
【0021】
具体的には、まず、情報処理装置10は、エンジニア等により入力された、時系列データ、時系列データについての正常区間及び異常予測区間のラベル、警報閾値を受付ける。例えば、情報処理装置10は、時系列データとして、予測値を算出する対象となる装置の過去の時系列データを受付ける。
【0022】
また、例えば、情報処理装置10は、時系列データにおける正常区間及び異常予測区間について付与されたラベルを受付ける。ここで、正常区間とは、時系列データにおいて、各時刻の任意の時間後の時系列データが、後述する警報閾値を超えない値となっている区間である。これに対し、異常予測区間とは、時系列データにおいて、各時刻の任意の時間後の時系列データが、警報閾値を超える値となっている区間である。
【0023】
さらに、例えば、情報処理装置10は、エンジニア等により設定された警報閾値を受付ける。ここで、警報閾値は、最適な調整パラメータを求める過程において、正常区間では警報閾値を超えない予測となり、異常予測区間では警報閾値を超える予測となるように設定される。なお、前述のラベル付与及び警報閾値の設定は、情報処理装置10が情報処理をする前にエンジニア等により予め行われる。
【0024】
続いて、情報処理装置10は、時系列データ、正常区間および異常予測区間のラベル、警報閾値の入力の受付けに応じて、全時刻ポイントに対して候補となる全ての調整パラメータセットについて、予め設定された指標の値を算出する。例えば、情報処理装置10は、前述の入力された情報に応じて、全時刻ポイントに対して候補となる全ての調整パラメータセットについて、後述するRMS誤差、閾値判定結果、異常検知成功率、正常区間予測成功率という4つの指標の値を算出する。
【0025】
その後、情報処理装置10は、算出された指標値に基づき、予め設定された処理を行い、最適な調整パラメータセットを選択する。例えば、情報処理装置10は、算出された4つの指標値に基づき、異常検知成功率が1番高いパラメータセットを選び出すという処理や、後述するパラメータ有効性判定処理等を順番に行うことにより、最適な調整パラメータセットを選択する。最後に、情報処理装置10は選択された調整パラメータセットを外部に出力する。例えば、情報処理装置10は選択された調整パラメータセットを外部の装置である自己回帰モデル20に出力する。
【0026】
このようにして、情報処理装置10は、時系列データ、正常区間および異常予測区間のラベル、警報閾値の入力に応じて、最適な調整パラメータセットを選択し、選択した結果を外部に出力する。その結果、自己回帰モデル20は予測値を算出する際の最適な調整パラメータセットを得ることができる。
【0027】
〔2.情報処理装置10の構成〕
次に、
図4を参照し、実施形態1に係る情報処理装置10の構成を説明する。
図4は、実施形態1に係る情報処理装置10の構成例を示す図である。
図4に示すように、実施形態1に係る情報処理装置10は、通信部11と、制御部12と、記憶部13とを有する。また、情報処理装置10と自己回帰モデル20は有線又は無線により互いに通信可能に接続される。
【0028】
通信部11は、例えば、NIC(Network Interface Card)等によって実現される。通信部11は、自己回帰モデル20と有線又は無線で接続され、自己回帰モデル20との間で情報の送受信を行う。また、例えば、外部からの時系列データやラベル情報、警報閾値の受付けについても通信部11を介して行われる。
【0029】
記憶部13は、例えば、RAM(Random Access Memory)やハードディスク等の記憶装置によって実現される。記憶部13は、制御部12による各種処理に必要なデータ及びプログラムを格納するが、特に本実施形態1に密接に関連するものとしては、時系列データ記憶部13aと、ラベル情報記憶部13bと、警報閾値記憶部13cと、指標値記憶部13dとを有する。
【0030】
時系列データ記憶部13aは、対象装置を時系列でモニタリングして得られる時系列データを記憶する。例えば、時系列データ記憶部13aは、時系列データとして、対象装置を時系列でモニタリングすることで得られる対象装置の温度等の測定値を、その時刻と共に記録したデータを記憶する。
【0031】
ラベル情報記憶部13bは、時系列データについて、正常区間と異常予測区間に該当する時系列データに付されたラベルの情報を記憶する。例えば、対象装置の時系列データにおいて、装置が正常に動作しているときの測定値には正常区間のラベルが付され、装置が異常な動作をする直前の測定値には異常予測区間のラベルが付される。ラベル情報記憶部13bは、それぞれの時系列データに付された上記ラベルの情報を記憶する。
【0032】
警報閾値記憶部13cは、対象の測定値について警報を出すか否かを判定するために設定される警報閾値を記憶する。例えば、警報閾値記憶部13cは、対象装置の温度等の測定値について警報を出すか否かを判定する目的で設定された警報閾値について記憶する。
【0033】
なお、前述した時系列データ、ラベル情報、警報閾値は、制御部12による最適な調整パラメータセットの選択が行われる前に予め記憶されている必要がある。また、これらの3つのデータは通信部11を介してそれぞれの記憶部に格納される。さらに、上記格納は、エンジニア等により人為的に行われてもよいし、対象装置をモニタリングしている装置等から自動的に行われてもよい。
【0034】
指標値記憶部13dは、後述する指標値算出部12aにより算出された各指標値を記憶する。例えば、指標値記憶部13dは、受付けられた時系列データの全時刻ポイントに対して、候補となる全ての調整パラメータセットについて算出された指標値を記憶する。
【0035】
制御部12は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部12は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現される。制御部12は、指標値算出部12aと、パラメータ判定部12bとを有する。
【0036】
指標値算出部12aは、過去のデータから予測値を求めるために使用される回帰係数を算出するための、調整パラメータセットのそれぞれについて、予め設定された指標の値を算出する。そして、指標値算出部12aは、算出した指標値を指標値記憶部13dに格納する。
【0037】
例えば、指標値算出部12aは、時系列データ記憶部13a、ラベル情報記憶部13b、警報閾値記憶部13cに記憶されている各データから、時系列データの全時刻ポイントに対して、候補となる全ての調整パラメータセットについて指標の値を算出し、指標値記憶部13dに格納する。
【0038】
また、指標値算出部12aは、指標の値として、過去のデータにおける、予測値を算出するときの基準となる時刻ポイントに対応する予測値と、過去の実際のデータとの平均二乗誤差と、時刻ポイントに対応する予測値と予め設定された閾値との差と、過去のデータにおける全ての異常予測区間に対し、異常予測に成功した予測値に対応する時刻ポイントを含む異常予測区間の割合である異常検知成功率と、過去のデータにおける正常区間内の時刻ポイントの総数に対し、正常予測に成功した予測値に対応する時刻ポイントの数の割合である正常区間予測成功率とを算出してもよい。
【0039】
ここで、前述の各指標値の概要について
図5から
図7を参照して説明する。
図5から
図7は、実施形態1に係る情報処理における指標値の概要を示す図である。
【0040】
指標値算出部12aは、特定の時刻ポイントに対応する予測値と、過去の実際のデータとの平均二乗誤差(RMS誤差)を算出する。平均二乗誤差が小さいほど予測値の予測精度が良いとされるため、情報処理装置10は、平均二乗誤差を算出することで、特定時刻に対する予測誤差を評価し、最適な調整パラメータセットを選択することができる(
図5参照)。
【0041】
また、指標値算出部12aは、特定の時刻ポイントに対する予測値と、予め設定された閾値との差を算出する。これにより、指標値算出部12aは、予測値が閾値を超えた値となっているか否かを判定することができる(
図5参照)。
【0042】
さらに、指標値算出部12aは、過去のデータにおける全ての異常予測区間に対し、異常予測に成功した予測値に対応する時刻ポイントを含む異常予測区間の割合である異常検知成功率を算出する。これにより、情報処理装置10は、前述した異常予測区間内における時刻ポイントに対応する予測値が、閾値を超える値となっているか(異常予測)を評価することで、最適な調整パラメータセットを選択することができる。
【0043】
図6の例では、過去のデータにおける異常予測区間が2つあり、異常予測区間(1)と異常予測区間(2)にはそれぞれ2つずつ時刻ポイントが存在する。そして、異常予測区間(1)中の時刻ポイントに対応する予測値は2つとも予測失敗であるのに対し、異常予測区間(2)中の時刻ポイントに対応する予測値は1つだけ予測に成功している。よって、異常予測区間(2)は異常予測に成功した予測値に対応する時刻ポイントを含む異常予測区間であるといえる。
【0044】
したがって異常予測が成功した区間の数が1つであり、全ての異常予測区間が2つであることから、
図6の例による指標値算出部12aは、全ての異常予測区間に対し、異常予測に成功した予測値に対応する時刻ポイントを含む異常予測区間の割合である異常検知成功率を、2分の1=0.5と算出する。
【0045】
また、指標値算出部12aは、過去のデータにおける正常区間内の時刻ポイントの総数に対し、正常予測に成功した予測値に対応する時刻ポイントの数の割合である正常区間予測成功率を算出する。これにより、情報処理装置10は、前述した正常区間内における時刻ポイントに対応する予測値が、閾値を超えない値となっているか(正常予測)を評価することで、最適な調整パラメータセットを選択できる。
【0046】
図7の例では、過去のデータにおける正常区間内の時刻ポイントは合計6つある。そのうち、正常予測に成功した予測値に対応する時刻ポイントは4つである。よって、
図6の例による指標値算出部12aは、正常区間内の時刻ポイントの総数に対し、正常予測に成功した予測値に対応する時刻ポイントの数の割合である正常区間予測成功率を、6分の4=0.666...と算出する。
【0047】
例えば、指標値算出部12aは、時系列データ記憶部13a、ラベル情報記憶部13b、警報閾値記憶部13cに記憶されている各データから、時系列データの全時刻ポイントに対して、候補となる全ての調整パラメータセットについて前述した4つの指標の値を算出し、指標値記憶部13dに格納する。
【0048】
パラメータ判定部12bは、調整パラメータセットのそれぞれについて、算出された指標値と、当該調整パラメータセットの近傍の調整パラメータセットの指標値とに基づき、当該調整パラメータセットを選択する。
【0049】
そして、パラメータ判定部12bは、近傍の調整パラメータセットとして、調整パラメータセットにおける各要素の中の一つの要素についての数値を、当該要素の数値として設定された候補において隣り合う数値に変更した調整パラメータセットの指標値に基づき、当該調整パラメータセットを選択する。
【0050】
ここで、パラメータ判定部12bが、近傍の調整パラメータセットの指標値に基づき、当該調整パラメータセットを選択する際に使用される有効性判定指標と、それを算出する有効性判定処理について、
図8を参照して説明する。
図8は、実施形態1に係る情報処理における近傍の調整パラメータセットに基づき、当該調整パラメータセットを選択する際の処理の概要を示す図である。
【0051】
図8の例では、情報処理装置10に、調整パラメータセットの要素pの数値として3~30までの10個の候補が、要素λの数値としては0.05~0.5までの10個の候補が、要素nの数値としては1~30までの7個の候補が設定されている。なお、調整パラメータqはpの3倍と設定されているため、
図8の例では省略している。
【0052】
ここで、例えば、当該調整パラメータセットを(p,λ,n)={3,0.1,5}として着目すると、pの3をその候補の中で隣り合う数値6に変更した(p,λ,n)={6,0.1,5}が近傍の調整パラメータセットの例の1つとなる。p以外の数値について隣り合う数値に変更したものは4つあるため、パラメータ判定部12bは、当該調整パラメータセットにおける近傍の調整パラメータセットとして、
図8に示す5つの調整パラメータセットを算出する。
【0053】
なお、実施形態1に係るパラメータ判定部12bは、近傍のパラメータセットを算出する際の具体的な処理を、
図8の距離条件式に基づき行う。この場合、パラメータ判定部12bは、調整パラメータセットの各要素に対して、1~要素数までのインデックスを付ける。また、パラメータ判定部12bは、各要素(例えばp)のインデックスをindex(p1)で計算し、各要素間の距離を|index(p1)-index(p2)|で算出する。
【0054】
その後、パラメータ判定部12bは、5つの近傍の調整パラメータセットについて、それぞれの指標値に基づき、予め設定された条件を満たすか否かを判定する。
図8の例では、5つの近傍の調整パラメータセットのうち3つが条件を満たすものとなっている。よって、パラメータ判定部12bは、当該調整パラメータセットにおける、近傍の調整パラメータセットの数に対し、条件を満たす近傍の調整パラメータセットの数の割合である、有効性判定指標を、5分の3=0.6と算出する。
【0055】
例えば、パラメータ判定部12bは、指標値記憶部13dに記憶された各調整パラメータセットの指標値と、各調整パラメータセットにおける各要素の中の一つの要素についての数値を、当該要素の数値として設定された候補において隣り合う数値に変更した、近傍の調整パラメータセットの指標値から算出される有効性判定指標に基づき、調整パラメータセットを選択する。
【0056】
〔3.情報処理の具体例〕
続いて、
図9から
図14を参照し、実施形態1に係る情報処理の具体例について説明する。
図9は、実施形態1に係る情報処理の具体例におけるシステム全体の流れを示す図である。また、
図10は、実施形態1に係る情報処理の具体例において、前提となる各設定の一例を示す図である。さらに、
図11から
図14は、実施形態1に係る情報処理の具体例における調整パラメータセットの選出結果の一例を示す図である。以下では、情報処理装置10の情報処理の流れについて説明した上で、調整パラメータセットの選択処理の具体例について説明する。
【0057】
(3-1.情報処理の流れ)
まず、
図9を参照し、情報処理装置10の具体例におけるシステム全体の流れについて説明する。例えば、情報処理装置10は、外部から時系列データ、ラベル情報、警報閾値が入力され、各データはそれぞれ対応する記憶部に記憶される。
【0058】
その後、指標値算出部12aは、例えば、各記憶部に記憶されているデータから、予め設定された候補となる全ての調整パラメータセットについて、RMS誤差、閾値判定、異常検知成功率、正常区間予測成功率を算出し、指標値記憶部13dに格納する。
【0059】
パラメータ判定部12bは、例えば、指標値記憶部13dに記憶された各指標値から、まず、処理2:異常検知成功率が一番高い調整パラメータセットを選出、を行う。選出された候補が複数である場合、パラメータ判定部12bは、次に、その候補の中から、処理3:正常区間予測成功率が一番高い調整パラメータセットを選出、を行う。
【0060】
処理3により選出された候補が複数である場合、パラメータ判定部12bは、次に、その候補の中から、処理4:有効性判定処理により、有効性判定指標が一番高い調整パラメータセットを選出、を行う。この選出結果も複数である場合は、パラメータ判定部12bは、最後に、その候補の中から、処理5:正常区間におけるRMS誤差の平均値が一番小さい調整パラメータセットを選択、を行い、最適な調整パラメータセットを選択する。その後、情報処理装置10は、パラメータ判定部12bにより判定された調整パラメータセットを外部に出力する。
【0061】
なお、
図9は実施形態1に係る情報処理装置の一例であり、処理2から処理5はそれぞれ独立しているため、一部順番を入れ替えて処理することも可能である。
【0062】
(3-2.情報処理の前提となる設定)
次に、
図10を参照し、実施形態1に係る情報処理の具体例において、前提となる各設定について説明する。当該具体例では、時系列データのサンプリング間隔を10秒とされ、時系列データのうち1.5日分が正常区間としてラベルを付けられ、80分間が異常予測区間としてラベルを付けられる。そして、警報閾値はthと設定される。
【0063】
また、候補となる調整パラメータセットの条件として、要素pは3~30の3刻みで10通り、要素qはpの3倍(探索しない)、要素λは0~0.5の0.05刻みで10通り、要素nは0~30の5刻みで7通りとする。これにより、指標値算出部12aは、評価対象内の全時刻ポイントについて、候補となる調整パラメータセットの総数である700個それぞれの各指標値を算出することとなる。
【0064】
(3-3.調整パラメータセットの選択処理)
最後に、
図11から
図14を参照し、実施形態1に係る情報処理の具体例における、各処理による調整パラメータセットの選出結果について説明する。例えば、パラメータ判定部12bは、指標値記憶部13dに記憶された各指標値に基づき、処理2~処理5を順に行い最適な調整パラメータセットを選択する(
図9参照)。
【0065】
まず、パラメータ判定部12bは、処理2:異常検知成功率が一番高い調整パラメータセットを選出、を行うことにより、
図11の結果となる。探索した700個の全調整パラメータセットのうち378個の調整パラメータセットが処理2の条件を満たす結果となり選出される。つまり、異常検知成功率が一番高い「1」が記載されている調整パラメータセットとして、378個の調整パラメータセットが選出されることとなる。選出結果が複数であるため、パラメータ判定部12bは、処理3に移ることになる。
【0066】
次に、パラメータ判定部12bは、処理3:正常区間予測成功率が一番高い調整パラメータセットを選出、を行うことにより、
図12の結果となる。処理2で選出された378個の調整パラメータセットのうち262個の調整パラメータセットが処理3の条件を満たす結果となり選出される。つまり、前述の処理2と同様に、正常区間予測成功率が一番高い「1」が記載されている調整パラメータセットとして、262個の調整パラメータセットが選出されることとなる。選出結果が複数であるため、パラメータ判定部12bは、処理4に移ることになる。
【0067】
次に、パラメータ判定部12bは、処理4:有効性判定処理により、有効性判定指標が一番高い調整パラメータセットを選出、を行うことにより、
図13の結果となる。処理3で選出された262個の調整パラメータセットのうち67個の調整パラメータセットが処理4の条件を満たす結果となり選出される。つまり、前述の処理2及び3と同様に、有効性判定指標が一番高い「1」が記載されている調整パラメータセットとして、67個の調整パラメータセットが選出されることとなる。選出結果が複数であるため、パラメータ判定部12bは、処理5に移ることとなる。
【0068】
最後に、パラメータ判定部12bは、処理5:正常区間におけるRMS誤差の平均値が一番小さい調整パラメータセットを選択、を行うことにより、
図14の結果となる。処理4で選出された67個の調整パラメータセットのうち調整パラメータセット(p,q,λ,n)={30,90,0.1,30}が処理5の条件を満たす結果となり選択される。
【0069】
前述の一連の処理により、パラメータ判定部12bは、処理2~処理5の全ての条件を満たすパラメータセットを選択することができる。つまり、パラメータ判定部12bは、異常予測及び正常予測を適切に行うことができ、外れ値の影響を受けておらず、予測値と実データとの誤差が小さい、最適な調整パラメータセットを選択することができる。
【0070】
〔4.処理手順〕
次に、
図15を参照して、実施形態1に係る情報処理装置10の処理について説明する。
図15は、実施形態1に係る処理手順の一例を示すフローチャートである。なお、
図15は実施形態1に係る情報処理装置の一例であり、S103、S105、S107及びS109はそれぞれ独立しているため、一部順番を入れ替えて処理することも可能である。
【0071】
図15に示す例では、情報処理装置10は、入力された時系列データ及びラベル、警報閾値を受付ける(ステップS101)。情報処理装置10は、時系列データ及びラベル、警報閾値を受付けていない場合(ステップS101;No)、時系列データ及びラベル、警報閾値を受付けるまで待機する。
【0072】
一方、情報処理装置10が、時系列データ及びラベル、警報閾値を受付けた場合(ステップS101;Yes)、指標値算出部12aは、探索する調整パラメータセットそれぞれについて各指標値を算出する(ステップS102)。そして、パラメータ判定部12bは、例えば、異常検知成功率が一番高い調整パラメータセットを選出する(ステップS103)。その後、パラメータ判定部12bは、選出された調整パラメータセットが2つ以上か否かを判定する(ステップS104)。
【0073】
選出された調整パラメータセットが2以上でない場合(ステップS104;No)、情報処理装置10は、選出された調整パラメータセットを出力する(ステップS110)。一方、選出された調整パラメータセットが2以上ある場合(ステップS104;Yes)、パラメータ判定部12bは、その選出結果から、正常区間予測成功率が一番高い調整パラメータセットを選出する(ステップS105)。その後、パラメータ判定部12bは、選出された調整パラメータセットが2つ以上か否かを判定する(ステップS106)。
【0074】
選出された調整パラメータセットが2以上でない場合(ステップS106;No)、情報処理装置10は、選出された調整パラメータセットを出力する(ステップS110)。一方、選出された調整パラメータセットが2以上ある場合(ステップS106;Yes)、パラメータ判定部12bは、その選出結果から、有効性判定指標が一番高い調整パラメータセットを選出する(ステップS107)。その後、パラメータ判定部12bは、選出された調整パラメータセットが2つ以上か否かを判定する(ステップS108)。
【0075】
選出された調整パラメータセットが2以上でない場合(ステップS108;No)、情報処理装置10は、選出された調整パラメータセットを出力する(ステップS110)。一方、選出された調整パラメータセットが2以上ある場合(ステップS108;Yes)、パラメータ判定部12bは、その選出結果から、正常区間におけるRMS誤差の平均値が一番小さい調整パラメータセットを選択する(ステップS109)。その後、情報処理装置10は、選出された調整パラメータセットを出力する(ステップS110)。
【0076】
〔5.実施形態1の効果〕
前述してきたように、本実施形態1に係る情報処理装置10は、与えられた時系列データに対して、評価対象内の全時刻ポイントにおいて、候補となる調整パラメータセットそれぞれについて各指標の値を算出する。そして、情報処理装置10は、算出した各指標値と、調整パラメータセットにおける各要素の中の一つの要素についての数値を、要素の数値として設定された候補において隣り合う数値に変更した調整パラメータセット(近傍の調整パラメータセット)の各指標値に基づき、適切な予測となる調整パラメータセットを選択して外部に出力する。
【0077】
これにより、情報処理装置10は、調整パラメータセットの評価時に、近傍の調整パラメータセットの各指標値を評価対象に加えることで、突発的な異常データによる不適切な調整パラメータのセットの決定を回避することができるという効果を奏する。
【0078】
また、情報処理装置10の指標値算出部12aは、指標の値として、過去のデータにおける、予測値を算出するときの基準となる時刻ポイントに対応する予測値と、過去の実際のデータとの平均二乗誤差と、時刻ポイントに対応する予測値と予め設定された閾値との差と、過去のデータにおける全ての異常予測区間に対し、異常予測に成功した予測値に対応する時刻ポイントを含む異常予測区間の割合である異常検知成功率と、過去のデータにおける正常区間内の時刻ポイントの総数に対し、正常予測に成功した予測値に対応する時刻ポイントの数の割合である正常区間予測成功率とを算出する。
【0079】
これにより、情報処理装置10は、調整パラメータセットを選択する際に、適切に異常予測と正常予測ができることに加え、実データと予測値の誤差が小さい、最適な調整パラメータセットを効率的に選択することができ、外部に出力することができるという効果を奏する。
【0080】
ここで、
図16を参照し、前述の処理により選択された調整パラメータセットと、選択されなかった調整パラメータセットを使用した際の自己回帰モデル20による予測結果について説明する。
図16は、実施形態1に係る情報処理による予測結果の一例を示す図である。
【0081】
図16の例では、自己回帰モデル20は、時系列データに対し、情報処理装置10により選択された調整パラメータセットと、比較対象の情報処理装置10により選択されなかった調整パラメータセットの2つを使用して、それぞれの予測値を算出している。
【0082】
情報処理装置10は、時系列データについて、各指標の値を算出(処理1)、異常検知成功率が一番高い調整パラメータセットを選択(処理2)、正常予測間成功率が一番高い調整パラメータセットを選択(処理3)、有効性判定指標が一番高い調整パラメータセットを選択(処理4)、RMS誤差の平均値が一番小さい調整パラメータセットを選択(処理5)、を順に行う(
図9参照)。
【0083】
上記の一連の処理により、選択された調整パラメータセットは、(p,q,λ,n)={30,90,0.1,30}である。また、
図16の例では、情報処理装置10により選択されなかった調整パラメータセット(p,q,λ,n)={30,90,0.5,30}の予測結果が比較対象として使用されている。
【0084】
図16の例では、4つのグラフが示されているが、上部2つのグラフは、比較対象の選択されなかった調整パラメータセットについての予測結果を示し、下部2つのグラフは、選択された調整パラメータセットについての予測結果を示している。そして、
図16の左側2つのグラフは、それぞれの正常区間における予測結果を示し、右側2つのグラフは、それぞれの異常予測区間における予測結果を示している。また、
図16の例では、それぞれのグラフの縦軸110の値を警報閾値としている。
【0085】
情報処理装置10により選択されなかった調整パラメータセット(p,q,λ,n)={30,90,0.5,30}を使用した際の正常区間における予測結果(
図16左上)は、予測値を表す一点鎖線が警報閾値を超えておらず、正常区間の予測は適切にできているといえる。一方、異常予測区間における予測結果(
図16右上)は、予測値を表す一点鎖線が警報閾値を超えていないため、異常予測ができておらず、適切な予測ができているとはいえない。
【0086】
一方で、情報処理装置10により選択された調整パラメータセット(p,q,λ,n)={30,90,0.1,30}を使用した際の正常区間における予測結果(
図16左下)は、予測値を表す一点鎖線が警報閾値を超えておらず、正常区間の予測は適切にできているといえる。また、異常予測区間における予測結果(
図16右下)は、予測値を表す一点鎖線が警報閾値を超えているため、異常予測に成功しており、適切な予測ができているといえる。
【0087】
よって、自己回帰モデル20は、情報処理装置10により選択されなかった調整パラメータセットを使用した場合は、異常予測区間では適切な予測ができなかった一方で、選択された調整パラメータセットを使用した場合は、正常区間、異常予測区間ともに適切な予測ができている。したがって、情報処理装置10により選択された調整パラメータセット(p,q,λ,n)={30,90,0.1,30}は、比較対象の調整パラメータセットより、自己回帰モデル20が適切な予測をすることができる調整パラメータセットであるといえる。したがって、実施形態1に係る情報処理の一例である処理1~処理5を行うことにより、情報処理装置10は適切な調整パラメータセットを選択することができるといえる。
【0088】
[実施形態2]
〔1.情報処理方法の概要〕
まず、
図17を参照し、実施形態2に係る情報処理装置が行う情報処理方法の概要について説明する。
図17は、実施形態2に係る情報処理方法の概要を示す説明図である。なお、
図17では、対象装置30から時系列データを入手し、入手した時系列データから算出される指標値に基づき最適な調整パラメータセットを選択した後、選択された調整パラメータセットにより自己回帰モデル20を更新する場合の情報処理の一例について説明する。
【0089】
図17に示す例において、情報処理装置10は、対象装置30からの時系列データの入力に応じて、最適な調整パラメータセットを選択し、選択された調整パラメータセットにより自己回帰モデル20を更新する情報処理装置であり、コンピュータやクラウドシステム等により実現される。
【0090】
情報処理装置10は、対象装置30から入手した時系列データから、後述する回帰係数算出区間基準位置(基準時刻)に対して、候補となる全ての調整パラメータセットについて指標値を算出し、その指標値に基づいて最適な調整パラメータセットを選択し、選択された調整パラメータセットにより自己回帰モデル20を更新する。
【0091】
具体的には、まず、情報処理装置10は、対象装置30から予測の対象となる時系列データを入手する。例えば、情報処理装置10は、対象装置30からリアルタイムで送信される観測データを受信することで時系列データを入手する。
【0092】
続いて、情報処理装置10は、入手した時系列データから指標値を算出し、最適な調整パラメータセットを選択する。例えば、情報処理装置10は、現在時刻を評価基準位置とする予測評価区間において、候補となる全ての調整パラメータセットについて予測データを算出した後、それぞれの調整パラメータセットについて後述する平均RMS誤差を求め、平均RMS誤差が最も小さい調整パラメータセットを選択する。
【0093】
最後に、情報処理装置10は、選択された調整パラメータセットにより自己回帰モデル20を更新する。例えば、情報処理装置10は、選択された調整パラメータセットを自己回帰モデルに入力し、当該調整パラメータセットにより更新された回帰係数によって予測データが算出されるように、自己回帰モデル20を更新する。
【0094】
このようにして、情報処理装置10は、時系列データの入力に応じて指標値を算出し、最適な調整パラメータセットを選択する。その後、情報処理装置10は、選択された調整パラメータセットにより自己回帰モデル20を更新する。その結果、情報処理装置10は、自己回帰モデル20に、予測値を算出する際に最適な調整パラメータセットを用いた精度の高い予測をさせることができる。
【0095】
〔2.情報処理装置10の構成〕
次に、
図18を参照し、実施形態2に係る情報処理装置10の構成を説明する。
図18は、実施形態2に係る情報処理装置10の構成例を示す図である。
図18に示すように、実施形態2に係る情報処理装置10は、通信部11と、制御部12と、記憶部13とを有する。また、情報処理装置10と自己回帰モデル20と対象装置30とは有線又は無線により互いに通信可能に接続される。
【0096】
通信部11は、例えば、NIC(Network Interface Card)等によって実現される。通信部11は、自己回帰モデル20及び対象装置30と有線又は無線で接続され、自己回帰モデル20及び対象装置30との間で情報の送受信を行う。例えば、対象装置30からの時系列データの入力及び選択した調整パラメータセットによる自己回帰モデル20の更新は通信部11を介して行われる。
【0097】
記憶部13は、例えば、RAM(Random Access Memory)やハードディスク等の記憶装置によって実現される。記憶部13は、制御部12による各種処理に必要なデータ及びプログラムを格納するが、特に本発明に密接に関連するものとしては、時系列データ記憶部13aと、調整パラメータセット記憶部13bと、回帰係数算出区間基準位置記憶部13cと、指標値記憶部13dとを有する。
【0098】
時系列データ記憶部13aは、対象装置30を時系列でモニタリングして得られる時系列データを記憶する。例えば、時系列データ記憶部13aは、通信部11を介して入力された、対象装置30を時系列でモニタリングすることで得られる対象装置30の温度等の測定値を、その時刻と共に記録したデータを記憶する。
【0099】
調整パラメータセット記憶部13bは、探索する調整パラメータセットの候補を記憶する。例えば、調整パラメータセット記憶部13bは、後述する調整パラメータセットの選択処理において候補となる調整パラメータセットの組み合わせについて記憶する。
【0100】
回帰係数算出区間基準位置記憶部13cは、予測データを算出する際に用いられる、回帰係数を算出するための区間の基準となる回帰係数算出区間基準位置を特定することができる情報を記憶する。例えば、回帰係数算出区間基準位置記憶部13cは、入手した時系列データの現在時刻から、任意の時間経過前の時刻を回帰係数算出区間基準位置とするような情報を記憶する。
【0101】
ここで、情報処理装置10は、回帰係数算出区間基準位置から現在時刻側の区間を予測評価区間とし、回帰係数算出区間基準位置から過去側の区間を回帰係数算出区間とする(
図17参照)。つまり、情報処理装置10は、回帰係数算出区間基準位置の予測データを、予測評価区間で評価することとなる。なお、予測評価区間の区間幅は予め設定され、回帰係数算出区間の区間幅は調整パラメータセットの各要素により決定される。また、前述した候補となる調整パラメータセット及び回帰係数算出区間基準位置に関する情報は、制御部12による最適な調整パラメータセットの選択がされる前に予め記憶されている必要がある。
【0102】
指標値記憶部13dは、後述する指標値算出部12aにより算出された指標値を記憶する。例えば、指標値記憶部13dは、入手した時系列データの回帰係数算出区間基準位置に対して、候補となる全ての調整パラメータセットについて算出された指標値を記憶する。
【0103】
制御部12は、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置10内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部12は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)などの集積回路により実現される。制御部12は、指標値算出部12aと、パラメータ判定部12bとを有し、また、必要に応じて予測モデル更新部12cを有してもよい。
【0104】
指標値算出部12aは、過去のデータから予測値を求めるために使用される回帰係数を算出するための、調整パラメータセットのそれぞれについて、予め設定された指標値を算出する。そして、指標値算出部12aは、算出した指標値を指標値記憶部13dに格納する。
【0105】
例えば、指標値算出部12aは、時系列データ記憶部13a、調整パラメータセット記憶部13b、回帰係数算出区間基準位置記憶部13cに記憶されている各データから、時系列データの回帰係数算出区間基準位置に対して、候補となる全ての調整パラメータセットについて指標値を算出し、指標値記憶部13dに格納する。
【0106】
また、指標値算出部12aは、指標値として、回帰係数算出区間基準位置に対応する予測値と、過去の実際のデータとの平均二乗誤差を算出してもよい。そして、指標値算出部12aは、算出したRMS誤差を指標値記憶部13dに格納する。
【0107】
例えば、指標値算出部12aは、回帰係数算出区間基準位置に対して、候補となる全ての調整パラメータセットについて、予測評価区間の予測値と実データとのRMS誤差を算出し、指標値記憶部13dに格納する。
【0108】
パラメータ判定部12bは、調整パラメータセットのそれぞれについて、算出された指標値と、当該調整パラメータセットの近傍の調整パラメータセットの指標値とに基づき、当該調整パラメータセットを選択する。その後、パラメータ判定部12bは、選択した調整パラメータセットを予測モデル更新部12cに通知する。
【0109】
そして、パラメータ判定部12bは、近傍の調整パラメータセットの指標値として、過去の所定の回帰係数算出区間基準位置に設定し、当該回帰係数算出区間基準位置を基準とした所定の区間のデータを用いて、各調整パラメータセットについての指標値をそれぞれ算出し、回帰係数算出区間基準位置を変更し、変更した回帰係数算出区間基準位置を基準とした所定の区間のデータを用いて、各調整パラメータセットについての指標値を算出させる処理を所定回数繰り返し、算出した各指標値に基づき、調整パラメータセットを選択する。
【0110】
ここで、例えば、回帰係数算出区間基準位置記憶部13cには、入手した時系列データの現在時刻から、任意の時間経過前の時刻を回帰係数算出区間基準位置とするような情報に加え、当該回帰係数算出区間基準位置を変更した際の時刻も回帰係数算出区間基準位置とするような情報が格納される。これにより、指標値算出部12aは、回帰係数算出区間基準位置を変更した場合についても、変更後の回帰係数算出区間基準位置を基準とした指標値を算出し、指標値記憶部13dに格納する。
【0111】
例えば、パラメータ判定部12bは、指標値記憶部13dに記憶されている、候補となる調整パラメータセットそれぞれについて、当該回帰係数算出区間基準位置におけるRMS誤差と、当該回帰係数算出区間基準位置を過去側に所定の回数変更した際の回帰係数算出区間基準位置における調整パラメータセット(近傍の調整パラメータセット)それぞれについてのRMS誤差とに基づき算出される、平均RMS誤差が一番小さい調整パラメータセットを選択する。その後、パラメータ判定部12bは、選択した調整パラメータセットを予測モデル更新部12cに通知する。
【0112】
予測モデル更新部12cは、パラメータ判定部12bによって選択された調整パラメータセットに応じて、未来予測モデルの回帰係数を更新する。例えば、予測モデル更新部12cは、パラメータ判定部12bからの調整パラメータセットの通知に応じて、通信部11を介して、自己回帰モデル20のパラメータを更新することにより、回帰係数を更新する。
【0113】
〔3.情報処理の具体例〕
続いて、
図19と
図20を参照し、実施形態2に係る情報処理の具体例について説明する。
図19は、実施形態2に係る情報処理の具体例におけるシステム全体の流れを示す図である。また、
図20は、実施形態2に係る情報処理の具体例における平均RMS誤差の算出方法の一例を示す図である。以下では、情報処理装置10の情報処理の流れについて説明した上で、平均RMS誤差の算出処理の具体例について説明する。
【0114】
(3-1.情報処理の流れ)
まず、
図19を参照し、情報処理装置10の具体例におけるシステム全体の流れについて説明する。例えば、情報処理装置10には、予め、候補となる調整パラメータセット、回帰係数算出区間基準位置に関する情報、予測評価区間の区間幅に関する情報、評価基準位置となる現在時刻を入手した時系列データから特定する情報が記憶部13に格納される。
【0115】
情報処理装置10は、対象装置30から時系列データを入手すると、記憶部13に格納された情報から、時系列データにおける現在時刻を評価基準位置として特定する。その後、指標値算出部12aは、候補となる調整パラメータセットそれぞれについて、後述する平均RMS誤差を算出する。
【0116】
そして、パラメータ判定部12bは、例えば、指標値記憶部13dに記憶された、それぞれの調整パラメータセットの平均RMS誤差から、平均RMS誤差が最も小さい調整パラメータセットを選択し、予測モデル更新部12cに通知する。その後、予測モデル更新部12cは、通知された調整パラメータセットに応じて、自己回帰モデル20のパラメータを更新する。
【0117】
(3-2.平均RMS誤差の算出処理)
次に、
図20を参照し、実施形態2に係る情報処理の具体例における、平均RMS誤差の算出方法について説明する。まず、指標値算出部12aは、調整パラメータセット記憶部13bに格納されているM種類の調整パラメータセットそれぞれについて、回帰係数算出区間基準位置を基準とした所定の区間(
図20における回帰係数算出区間)の時系列データを用いてRMS誤差を算出する。
【0118】
次に、指標値算出部12aは、当該回帰係数算出区間を過去の各時刻にずらすことを任意のS回行い、M種類の調整パラメータセットそれぞれについて、それぞれの回帰係数算出区間基準位置におけるRMS誤差を算出する。つまり、指標値算出部12aは、M種類の調整パラメータセット×S個の回帰係数算出区間により、M×S個のRMS誤差を算出することとなる。
【0119】
その後、指標値算出部12aは、共通の調整パラメータセット毎にRMS誤差の平均値を算出する。指標値算出部12aは、前述の処理により、M種類の調整パラメータセットそれぞれについてS個のRMS誤差を算出したため、そのS個のRMS誤差の平均値を算出することで、M種類の調整パラメータセットそれぞれについて、平均化されたRMS誤差を算出することができる。つまり、指標値算出部12aは、M個の平均RMS誤差を算出することとなる。そして、指標値算出部12aは、算出した平均RMS誤差を指標値記憶部13dに格納する。
【0120】
最後に、パラメータ判定部12bは、前述の指標値算出部12aによる一連の処理によって、指標値記憶部13dに格納された平均RMS誤差から、平均RMS誤差が最も小さい調整パラメータセットを選択する。これにより、パラメータ判定部12bは、予測評価区間における実データと予測データとの誤差が一番小さい時の調整パラメータセットを選択することができる。
【0121】
〔4.処理手順〕
次に、
図21を参照して、実施形態2に係る情報処理装置10の処理について説明する。
図21は、実施形態2に係る処理手順の一例を示すフローチャートである。
図21に示す例では、情報処理装置10は、入力された時系列データを受付ける(ステップS101)。情報処理装置10は、時系列データを受付けていない場合(ステップS101;No)、時系列データを受付けるまで待機する。
【0122】
一方、情報処理装置10が、時系列データを受付けた場合(ステップS101;Yes)、情報処理装置10は、時系列データの現在時刻を評価基準位置として決定する(ステップS102)。そして、指標値算出部12aは、例えば、調整パラメータセットの指標値である平均RMS誤差を算出する(ステップS103)。その後、パラメータ判定部12bは、平均RMS誤差が一番小さいときの調整パラメータセットを選択する(ステップS104)。
【0123】
その後、パラメータ判定部12bは、平均RMS誤差が一番小さいときの調整パラメータセットを選択する(ステップS104)。最後に、情報処理装置10は、選択された調整パラメータセットにより自己回帰モデル20を更新する(ステップS105)。
【0124】
〔5.実施形態2の効果〕
前述してきたように、本実施形態2に係る情報処理装置10は、対象装置30から入手した時系列データから、回帰係数算出区間基準位置に対して候補となる全ての調整パラメータセットについて指標値を算出する。そして、情報処理装置10は、算出した指標値と、回帰係数算出区間基準位置を所定回数変更し、変更した回帰係数算出区間基準位置を基準とした際の調整パラメータセット(近傍の調整パラメータセット)それぞれについて算出された指標値とに基づき、調整パラメータセットを選択する。
【0125】
これにより、情報処理装置10は、調整パラメータセットの評価時に、近傍の調整パラメータセットの各指標値を評価対象に加えることで、突発的な異常データによる不適切な調整パラメータのセットの決定を回避することができるという効果を奏する。
【0126】
また、情報処理装置10の指標値算出部12aは、指標値として、それぞれの調整パラメータセットについての回帰係数算出区間基準位置に対応する予測値と、過去の実際のデータとのRMS誤差を算出する。そして、情報処理装置10の予測モデル更新部12cは、パラメータ判定部12bによって選択された調整パラメータセットに応じて、自己回帰モデル20のパラメータを更新することにより、回帰係数を更新する。
【0127】
これにより、情報処理装置10は、調整パラメータセットを選択する際に、実データと予測値の誤差が小さい最適な調整パラメータセットを選択することができ、自己回帰モデル20のパラメータを最適な調整パラメータセットによって更新することができる。その結果、自己回帰モデル20は、最適な調整パラメータセットによって算出された回帰係数により適切な予測を行うことができる。
【0128】
ここで、
図22を参照し、前述の処理により選択された調整パラメータセットと、デフォルトパラメータを使用した際の自己回帰モデル20による予測結果について説明する。
図22は、実施形態2に係る情報処理による予測結果の一例を示す図である。なお、
図22の例では、それぞれの予測値の正確性について、それぞれの予測値と実データとのRMS誤差が示されている。
【0129】
図22の例では、デフォルトパラメータとして、(p=20、q=60、λ=0.1、Δymax=5.0、emax=2.5)が使用されている。自己回帰モデル20は、予測対象となる時系列データの全区間に対し、情報処理装置10が選択した調整パラメータセットによりパラメータを逐次推定した場合の予測値と、比較対象のデフォルトパラメータ使用したときの予測値をそれぞれ算出している。
【0130】
そして、情報処理装置10では、入手した時系列データに対して、まず、指標値算出部12aが平均RMS誤差を算出し、それに基づきパラメータ判定部12bが調整パラメータセットを選択する。その後、情報処理装置10の予測モデル更新部12cは、選択された調整パラメータセットにより自己回帰モデル20のパラメータを更新する。
【0131】
ここで、
図22の例では、情報処理装置10は、対象装置30から時系列データを一定間隔で入手し、その都度、上記処理を行う。これにより、自己回帰モデル20のパラメータは、情報処理装置10の時系列データの入手に応じて、逐次更新されることになる。
【0132】
図22の例において、比較対象のデフォルトパラメータを使用した際の予測結果(
図16における実線)は、その実データとの誤差を表すRMS誤差が、実データの測定値が乱れている3000min~4000minの間で大きくなっていることを示している。つまり、比較対象のデフォルトパラメータを使用した場合、自己回帰モデル20は、一定の区間において、実データとの誤差が大きい予測値を算出しており、適切な予測ができているとはいえない。
【0133】
一方で、情報処理装置10により選択された調整パラメータセットによって、自己回帰モデル20のパラメータを逐次更新した際の予測結果(
図16における点線)は、実データの測定値が乱れている3000min~4000minの間であっても、そのRMS誤差が比較的小さいことを示している。つまり、情報処理装置10により自己回帰モデル20のパラメータを逐次更新した場合、自己回帰モデル20は、対象の時系列データの全区間において、実データとの誤差が小さい予測値を算出しているため、適切な予測ができているといえる。
【0134】
よって、情報処理装置10が選択した調整パラメータセットにより自己回帰モデル20のパラメータを逐次推定した場合は、比較対象のデフォルトパラメータを使用した場合より、自己回帰モデル20が適切な予測をすることができているといえる。
【0135】
また、上述の2つの場合に対して、時系列データを、周波数の異なる正弦波、ノイズがだんだん大きくなる正弦波および周波数が変わる正弦波としたときについて、それぞれ比較を行ったところ、全ての時系列データについて、情報処理装置10により自己回帰モデル20のパラメータを逐次推定した場合の方が、自己回帰モデル20が適切な予測を行うことが確認された。したがって、実施形態2に係る情報処理の一例である、上述の一連の処理を行うことにより、情報処理装置10は適切な調整パラメータセットを選択することができるといえる。
【0136】
[ハードウェア構成]
前述した、実施形態1および実施形態2に係る情報処理装置10は、例えば、
図23に示すような構成のコンピュータ1000によって実現される。
図23は、情報処理装置10の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、補助記憶装置1400、通信I/F(インタフェース)1500、入出力I/F(インタフェース)1600が、バス1800により接続された形態を有する。
【0137】
CPU1100は、ROM1300又は補助記憶装置1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0138】
補助記憶装置1400は、CPU1100によって実行されるプログラム、および、係るプログラムによって使用されるデータ等を格納する。通信I/F1500は、所定の通信網を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを所定の通信網を介して他の機器へ送信する。
【0139】
CPU1100は、入出力I/F1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入出力装置1700を制御する。CPU1100は、入出力I/F1600を介して、入出力装置1700からデータを取得する。また、CPU1100は、生成したデータについて入出力I/F1600を介して入出力装置1700へ出力する。
【0140】
例えば、コンピュータ1000が本実施形態1および実施形態2に係る情報処理装置10として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部12の機能を実現する。
【0141】
[その他]
前述の実施形態1および実施形態2において説明した各処理のうち、自動的に行われるものとして説明した処理の全部又は一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部又は一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0142】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の通り構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。
【0143】
前述した構成要素には、当業者が容易に想定できるもの、実質的に同一のもの、いわゆる均等の範囲のものが含まれる。さらに、前述してきた実施形態1および実施形態2は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0144】
また、前述してきた「部(section、module、unit)」は、「手段」や「回路」等に読み替えることができる。例えば、制御部は、制御手段や制御回路に読み替えることができる。
【0145】
以上、本発明の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【符号の説明】
【0146】
[実施形態1]
10 情報処理装置
11 通信部
12 制御部
12a 指標値算出部
12b パラメータ判定部
13 記憶部
13a 時系列データ記憶部
13b ラベル情報記憶部
13c 警報閾値記憶部
13d 指標値記憶部
20 自己回帰モデル
【0147】
[実施形態2]
10 情報処理装置
11 通信部
12 制御部
12a 指標値算出部
12b パラメータ判定部
12c 予測モデル更新部
13 記憶部
13a 時系列データ記憶部
13b 調整パラメータセット記憶部
13c 回帰係数算出区間基準位置記憶部
13d 指標値記憶部
20 自己回帰モデル
30 対象装置