IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7533582時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体
<>
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図1
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図2
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図3
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図4
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図5
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図6
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図7
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図8
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図9
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図10
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図11
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図12
  • 特許-時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-05
(45)【発行日】2024-08-14
(54)【発明の名称】時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240806BHJP
【FI】
G06N20/00
【請求項の数】 6
(21)【出願番号】P 2022533018
(86)(22)【出願日】2020-07-03
(86)【国際出願番号】 JP2020026287
(87)【国際公開番号】W WO2022003983
(87)【国際公開日】2022-01-06
【審査請求日】2022-12-15
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】100124811
【弁理士】
【氏名又は名称】馬場 資博
(74)【代理人】
【識別番号】100088959
【弁理士】
【氏名又は名称】境 廣巳
(74)【代理人】
【識別番号】100097157
【弁理士】
【氏名又は名称】桂木 雄二
(74)【代理人】
【識別番号】100187724
【弁理士】
【氏名又は名称】唐鎌 睦
(72)【発明者】
【氏名】小梨 貴史
【審査官】渡辺 順哉
(56)【参考文献】
【文献】特表2012-513645(JP,A)
【文献】国際公開第2020/049666(WO,A1)
【文献】特開2014-112280(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法であって、
前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較し、
さらに、前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
【請求項2】
請求項1に記載の時系列データ処理方法であって、
前記第一の時系列データの前記複数の特定期間と、前記第二の時系列データの前記複数の期間と、の時間軸上の位置関係が相互に対応する期間同士における部分時系列データの特徴量をそれぞれ比較する、
時系列データ処理方法。
【請求項3】
請求項1又は2に記載の時系列データ処理方法であって、
期間毎に比較する特徴量間の類似度を算出し、
算出した全ての類似度に基づいて、前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
【請求項4】
請求項1乃至3のいずれかに記載の時系列データ処理方法であって、
前記別期間についての類似度を、前記対象期間についての類似度よりも重みを低くして集計を行う、
時系列データ処理方法。
【請求項5】
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を備え、
前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
前記比較手段は、前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較し、
さらに、前記比較手段は、前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
前記検出手段は、前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理装置。
【請求項6】
情報処理装置に、
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を実現させると共に、
前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
前記比較手段は、前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較し、
さらに、前記比較手段は、前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
前記検出手段は、前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
ことを実現させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、記録媒体に関する。
【背景技術】
【0002】
エネルギー(電気、ガス、上水など)や石油化学製品(原油、ガソリン、プラスチックなど)、食品、医薬品などを製造する産業プラントや、化学製品を生産する工場施設や装置などの化学プラントがある。これらプラントや、情報処理システムといった設備・大型機械では、各種センサからの計測値である時系列データを分析し、異常状態が発生したことを検出して出力することが行われている。例えば、特許文献1では、複数の特徴波形の特徴量を用いて、時系列データから異常を検出することとしている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2018-205994号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
ここで、上述したように特徴波形から時系列データの異常を検出する場合には、特徴波形の時間幅の長さ、つまり、特徴量を抽出する部分時系列データの期間の長さが問題となる。例えば、期間の長さが長い場合には、検出したい様々な部分時系列データの特徴を網羅した学習データの用意が困難となる。一方で、期間の長さが短い場合には、部分時系列データの特徴のバリエーションが少なく、多数の部分時系列データに合致してしまうこととなり、誤検出が増大するという問題がある。その結果、時系列データから異常など特定の状況を適切に検出することが困難である、という問題が生じる。
【0005】
このため、本発明の目的は、上述した課題である、時系列データから特定の状況を適切に検出することが困難である、ことを解決することができる時系列データ処理方法を提供することにある。
【課題を解決するための手段】
【0006】
本発明の一形態である時系列データ処理方法は、
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
という構成をとる。
【0007】
また、本発明の一形態である時系列データ処理装置は、
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を備えた、
という構成をとる。
【0008】
また、本発明の一形態であるプログラムは、
情報処理装置に、
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を実現させる、
という構成をとる。
【発明の効果】
【0009】
本発明は、以上のように構成されることにより、時系列データから特定の状況を適切に検出することができる。
【図面の簡単な説明】
【0010】
図1】本発明の実施形態1における時系列データ処理装置の構成を示すブロック図である。
図2図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。
図3図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。
図4図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。
図5図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。
図6図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。
図7図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。
図8図1に開示した時系列データ処理装置による時系列データの処理の様子を示す図である。
図9図1に開示した時系列データ処理装置の動作を示すフローチャートである。
図10図1に開示した時系列データ処理装置の動作を示すフローチャートである。
図11】本発明の実施形態2における時系列データ処理装置のハードウェア構成を示すブロック図である。
図12】本発明の実施形態2における時系列データ処理装置の構成を示すブロック図である。
図13】本発明の実施形態2における時系列データ処理装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0011】
<実施形態1>
本発明の第1の実施形態を、図1乃至図10を参照して説明する。図1は、時系列データ処理装置の構成を説明するための図であり、図2乃至図10は、時系列データ処理装置の処理動作を説明するための図である。
【0012】
[構成]
本発明における時系列データ処理装置10は、プラントなどの監視対象Pに接続されている。そして、時系列データ処理装置10は、監視対象Pの少なくとも一以上のデータ項目の計測値を取得して分析し、分析結果に基づいて監視対象Pの状態を監視する。例えば、監視対象Pは、製造工場や処理施設などのプラントであり、各データ項目の計測値は、プラント内の温度、圧力、流量、消費電力値、原料の供給量、残量など、複数種類のデータ項目の値からなる。そして、本実施形態では、監視する監視対象Pの状態は、監視対象Pの予め異常であると判断された状態であることとし、各データ項目の計測値の特徴量から異常状態であることを検出する。但し、監視する監視対象Pの状態は、必ずしも異常状態であることに限定されず、異常でなくとも予め設定された特定の状態であってもよい。異常ではない予め設定された特定の状態とは、例えば、異常の予兆、である。
【0013】
なお、本発明における監視対象Pは、プラントであることに限定されず、情報処理システムなどの設備といったいかなるものであってもよい。例えば、監視対象Pが情報処理システムである場合には、情報処理システムを構成する端末やサーバ等の各情報処理装置のCPU(Central Processing Unit)使用率、メモリ使用率、ディスクアクセス頻度、入出力パケット数、入出力パケットレート、消費電力値などを、各データ項目の計測値として計測し、かかる計測値を分析して情報処理システムの状態を監視してもよい。
【0014】
上記時系列データ処理装置10は、演算装置と記憶装置とを備えた1台又は複数台の情報処理装置にて構成される。そして、時系列データ処理装置10は、図1に示すように、計測部11、学習部12、異常検知部13、出力部14、を備える。計測部11、学習部12、異常検知部13、出力部14の機能は、演算装置が記憶装置に格納された各機能を実現するためのプログラムを実行することにより、実現することができる。また、時系列データ処理装置10は、計測データ記憶部16、学習データ記憶部17、検出データ記憶部18、を備える。計測データ記憶部16、学習データ記憶部17、検出データ記憶部18は、記憶装置により構成される。以下、各構成について詳述する。
【0015】
計測部11は、監視対象Pに設置された各種センサにて計測された各要素の計測値を所定の時間間隔で時系列データとして取得して、計測データ記憶部16に記憶する。このとき、計測する要素は複数種類あるため、計測部11は、図2に示すような複数の要素の時系列データA,B,C,Dの集合である時系列データセットを取得する。例えば、計測部11は、本実施形態では1分間隔で各要素の計測値を取得して時系列データとして記録するが、いかなる時間間隔で各要素の計測値を取得してもよい。なお、計測部11による時系列データセットの取得及び記憶は常時又は所定時間ごとに行われており、取得された時系列データセットは、後述するように、監視対象Pの異常状態を表すモデルを生成するために利用される学習用の時系列データセット(第一の時系列データ)であったり、監視対象Pの状態を監視するときに利用される異常検知用の時系列データセット(第二の時系列データ)である。但し、計測部11が取得する時系列データは、必ずしも複数の要素の計測値からなることに限定されず、1つの要素の計測値であってもよい。
【0016】
学習部12は、計測データ記憶部16に記憶されている、過去に監視対象Pが異常状態であると判断されたときに計測された学習用の時系列データセット(第一の時系列データ)と、判断された異常状態の種類を表す情報と、に基づいて学習する。特に、学習部12は、特定の異常状態のときにおける時系列データセットの特徴量を算出して、かかる特徴量を表す符号化データを、特定の異常状態を表す異常状態モデルとして生成する。そして、学習部12は、特定の異常状態を表す情報と共に、生成した符号化データからなるモデルを学習データ記憶部17に記憶しておく。
【0017】
ここで、学習部12による具体的な学習処理の内容を説明する。学習部12は、まず、監視対象Pから計測された時系列データセットを入力して、時間軸上において特定の異常状態となった時刻付近の時系列データセットを所定の時間毎に区切った期間であるセグメントのうち、複数のセグメント(複数の特定期間)からなるセグメントセットを抽出する。このとき、セグメントセットを構成する複数のセグメントは、1つのセグメント(対象期間)と、当該1つのセグメントに対して予め設定された特定の位置に位置する位置関係を有する他の1つ又は複数のセグメント(別期間)と、からなる。
【0018】
一例として、図2に示す時系列データセットの場合において、セグメントセットを抽出する場合を説明する。この時系列データセットにおいて、時刻tが特定の異常状態である場合には、学習部12は、まず時刻tを含む所定の期間を、実線で囲った枠で示す1つの「対象セグメント」として抽出する。また、学習部12は、対象セグメントに対して時間軸上で前後する他の時刻t-1,t+1を含むそれぞれの所定の期間を、それぞれ点線で囲った枠で示す「周辺セグメント」として抽出する。つまり、図2の例では、周辺セグメントは、対象セグメントに対して時間軸上で前後にそれぞれ隣接した2つの所定の期間となる。なお、対象セグメントと周辺セグメントとは、共に同じ時間幅の期間であり、例えば、10分といった期間である。
【0019】
そして、学習部12は、上述したように抽出したセグメントセットを構成する各セグメントにそれぞれ含まれる部分時系列データの特徴量を算出する。図2の例では、対象セグメントに含まれる部分時系列データの特徴量fと、2つの周辺セグメントのそれぞれに含まれる各部分時系列データの特徴量ft-1,ft+1と、を算出する。このとき、学習部12は、例えば、各セグメント内の部分時系列データにおけるセグメント内の時間に対する各要素の計測値や、各要素の計測値間の相関関係などから、各セグメント内の部分時系列データの特徴量を算出する。そして、学習部12は、特定の異常状態を表す情報に関連付けて、各セグメントの特徴量を、例えば、0,1といった二値の符号で表す符号化データとして、異常状態モデルとして学習データ記憶部17に記憶する。このとき、学習部12は、各セグメント間の位置関係、つまり、対象セグメントに対する周辺セグメントの位置関係、を表す情報も記憶しておいてもよい。図2の例では、セグメントセットを構成する対象セグメントに対して、時間軸上の前後のそれぞれに隣接して1つずつ周辺セグメントが位置していることを表す位置関係情報を記憶している。なお、各セグメント内の部分時系列データの特徴量の算出方法は、上述の方法に限定されず、いかなる方法であってもよい。尚、上記では、監視対象Pの異常状態を学習する場合について説明したが、学習部12は監視対象Pの正常状態を学習してもよい。この場合、学習部12は、監視対象Pが正常状態のときの各要素の時系列データに基づいて、監視対象Pの正常状態に関する正常状態モデルを生成する。
【0020】
異常検知部13(比較手段、検出手段)は、計測部11にて計測された、あるいは、計測データ記憶部16に記憶されている、監視対象Pの異常検知用の時系列データセット(第二の時系列データ)を読み出し、かかる時系列データセットから、特定の異常状態の検出を行う。このとき、異常検知部13は、学習データ記憶部17に記憶されている異常状態モデルとして、上述した対象セグメントと周辺セグメントとの各特徴量を読み出し、かかる各特徴量と、異常検知用の時系列データセット内の複数のある期間における各部分時系列データセットの各特徴量と、を比較することで、特定の異常状態の検出を行う。
【0021】
具体的に、異常検知部13は、まず、異常検知用の時系列データセットから、上述した対象セグメントと周辺セグメントとからなるセグメントセットの時間軸上の位置関係に対応して位置する、複数のセグメントからなる比較セグメントセットを抽出する。例えば、異常検知部13は、まず、異常検知用の時系列データセットの時間軸上における任意の位置における10分といった時間幅の期間であるセグメントを、上記対象セグメントに対応する「比較対象セグメント」として抽出する。加えて、異常検知部13は、比較対象セグメントに対して時間軸上で前後のそれぞれに隣接して位置する10分といった時間幅の各セグメントを、上記周辺セグメントに対応する「比較周辺セグメント」として抽出する。ここで、図3の上図に学習用の時系列データセットを示し、図3の下図に異常検知用の時系列データセットを示す。この図に示すように、異常検知部13は、異常検知用の時系列データセットにおいて、まず時刻Tを含む所定の期間を、実線で囲った枠で示す「比較対象セグメント」として抽出し、その前後して隣接する他の時刻T-1,T+1を含むそれぞれの所定の期間を、それぞれ点線で囲った枠で示す「比較周辺セグメント」として抽出し、これらを比較セグメントセットとする。
【0022】
そして、異常検知部13は、上述した学習用の時系列データセットにおける対象セグメントと周辺セグメントとについて算出した特徴量と同様に、異常検知用の時系列データセットにおける比較セグメントセット、つまり、比較対象セグメントと比較周辺セグメントセットとのそれぞれにおける部分時系列データの特徴量をそれぞれ算出する。そして、異常検知部13は、学習用の時系列データセットにおける各セグメントの各特徴量と、異常検知用の時系列データセットにおける各セグメントの各特徴量と、をそれぞれ比較する。このとき、異常検知部13は、図3の矢印に示すように、各時系列データセットの時間軸上における位置関係が相互に対応するセグメント同士の特徴量を比較する。つまり、図3の例では、学習用の時系列データセットにおける対象セグメント(時刻t)の特徴量と、異常検知用の時系列データにおける比較対象セグメント(時刻T)の特徴量と、を比較する。また、学習用の時系列データセットにおける対象セグメントよりも時間軸上で前に隣接して位置する周辺セグメント(時刻t-1)の特徴量と、異常検知用の時系列データにおける比較対象セグメントよりも前に隣接して位置する比較周辺セグメント(時刻T-1)の特徴量と、を比較する。さらに、学習用の時系列データセットにおける対象セグメントよりも時間軸上で後に隣接して位置する周辺セグメント(時刻t+1)の特徴量と、異常検知用の時系列データにおける比較対象セグメントよりも後に隣接して位置する比較周辺セグメント(時刻T+1)の特徴量と、を比較する。
【0023】
このとき、異常検知部13は、上述したようにセグメント間の特徴量を比較する際に、特徴量同士の類似度を算出する。一例として、異常検知部13は、特徴量が二値ベクトルといった符号化データで表されている場合には、二値ベクトル間の距離を算出することで、かかる距離から特徴量同士の類似度を算出する。ここで、図3の例では、対象セグメントについては類似度Sが算出され、2つの周辺セグメントについてはそれぞれ類似度St-1,St+1が算出されることとする。
【0024】
さらに、異常検知部13は、上述したように各セグメントについて行った特徴量の比較結果、つまり、各セグメントについて算出した類似度S,St-1,St+1に基づいて、異常検知用の時系列データセットに特定の状態である異常状態が発生しているか否かを検出する。例えば、異常検知部13は、算出した全ての類似度S,St-1,St+1を、予め設定された集計方法にて集計したスコアを算出し、かかる集計結果であるスコアに基づいて異常状態の検出を行う。一例として、異常検知部13は、全ての類似度S,St-1,St+1を加算してセグメントの数で割ることで、類似度の平均値を算出して、集計結果であるスコアとする。このとき、異常検知部13は、対象セグメントについて類似度Sはそのまま加算し、各周辺セグメントについての各類似度St-1,St+1は重みwを低くして加算して、平均値を算出してスコアとする。例えば、図3の例では、対象セグメントについて類似度S=0.9の場合に、w(t)=1.0とし、周辺セグメントについて各類似度がそれぞれSt-1=0.85、St+1=0.70である場合に、それぞれの重みw(t-1)=w(t+1)=0.9、とする。そして、セグメント数をnとすると、スコアは、「スコア=ΣS(t)*w(t)/n」で算出することができ、「(0.9*1.0+0.85*0.9+0.70*0.9)/3」で算出される。
【0025】
なお、上述したようい周辺セグメントの類似度に対してかけられる重みの値は、対象セグメントに対する周辺セグメントの位置に応じて設定されてもよい。例えば、周辺セグメントの類似度に対してかけられる重みの値は、対象セグメントに対して時間軸上で周辺セグメントの位置が前か後かに応じて設定されてもよく、後述するように、周辺セグメントが対象セグメントに対して隣接して位置していない場合には、対象セグメントから周辺セグメントまでの距離に応じて設定されてもよい。一例として、対象セグメントから周辺セグメントに対する距離が長くなるほど、周辺セグメントの類似度に対してかけられる重みの値を低く設定してもよい。
【0026】
そして、異常検知部13は、異常検知用の時系列データセット上における比較セグメントセットの位置を変えて、上述した異常検知処理を繰り返す。例えば、異常検知部13は、まず図3に示す比較対象セグメントセットに対するスコアを算出した後に、図4に示すように、時刻T+1に位置するセグメントを比較対象セグメントとし、その前後に隣接するセグメントを比較周辺セグメントとして、異なる時間軸上の位置の比較セグメントセットに対するスコアを算出する。その後さらに、異常検知部13は、図5に示すように、時刻T+2に位置するセグメントを比較対象セグメントとし、その前後に隣接するセグメントを比較周辺セグメントとして、異なる時間軸上の位置の比較セグメントセットに対するスコアを算出する。このようにして、異常検知部13は、異常検知用の時系列データセット上の複数の時間軸上の位置で比較セグメントセットを抽出して、異常状態モデルと比較してスコアを算出する。
【0027】
そして、異常検知部13は、上述したように算出した複数の比較セグメントセットに対するスコアから、異常検知用の時系列データセットに異常が発生したか否かを検知する。例えば、異常検知部13は、スコアが予め設定された閾値以上である場合に、異常状態が発生したと検知する。但し、異常検知部13は、スコアの値からいかなる方法で異常検知を行ってもよい。
【0028】
なお、上記では、学習用の時系列データセット上で抽出したセグメントセットは、1つの対象セグメントと、当該対象セグメントに対して時間軸上で前後にそれぞれ隣接して位置する2つの周辺セグメントと、からなることを例示したが、周辺セグメントの数と位置は上述したものに限定されない。つまり、周辺セグメントは、いかなる数であってもよく、また、対象セグメントに対していかなる位置関係に位置していてもよい。これに応じて、異常検知用の時系列データセット上で抽出する比較セグメントセットも、セグメントセットにおける対象セグメントと周辺セグメントとの位置関係に対応して抽出されることとなる。このとき、セグメントセットを構成する周辺セグメントは、対象セグメントに対して時間軸上で予め設定された範囲内に位置するものであるとよい。つまり、周辺セグメントは、対象セグメントに対して、時間軸上で離れすぎず、対象セグメントの時刻に対して予め周辺時刻と設定される範囲で抽出されるとよい。
【0029】
例えば、図6(1)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、当該対象セグメントに対して時間軸上で前と後のそれぞれに複数が連続して隣接して位置する周辺セグメント(時刻t-2,t-1,t+1,t+2)と、から構成されていてもよい。また、例えば、図6(2)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、当該対象セグメントに対して時間軸上で前のみに複数が連続して隣接して位置する周辺セグメント(時刻t-2,t-1,t+1,t+2)と、から構成されていてもよい。なお、図示しないが、セグメントセットは、時刻tにおける1つの対象セグメントと、当該対象セグメントに対して時間軸上で後のみに複数が連続して隣接して位置する周辺セグメントと、から構成されていてもよい。また、例えば、図7(1)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、セグメント間で所定の時間を空けて、対象セグメントに対して前と後のそれぞれに位置する周辺セグメント(時刻t-2,t+2)と、から構成されていてもよい。また、例えば、図7(2)に示すように、セグメントセットは、時刻tにおける1つの対象セグメントと、セグメント間で所定の時間を空けて配置され、対象セグメントの前のみに位置する複数の周辺セグメント(時刻t-2,t-4)と、から構成されていてもよい。なお、図示しないが、セグメントセットは、時刻tにおける1つの対象セグメントと、セグメント間で所定の時間を空けて配置され、対象セグメントの後のみに位置する複数の周辺セグメントと、から構成されていてもよい。尚、学習部12が監視対象Pの正常状態モデルを生成する場合、異常検知部13は、正常状態モデルに基づいて、正常状態から外れている場合に、監視対象Pが異常状態であることを検知する。
【0030】
出力部14(検出手段)は、上述したように、セグメント間での特徴量の比較結果、つまり、異常検知の結果や算出したスコアを、図示しない監視者が使用する端末装置(例えば、スマートフォン、携帯電話、タブレット、などのポータブル端末など)に対して出力する。例えば、出力部14は、計測直後の異常検知用の時系列データセットに対して上述したように異常検知処理を行って異常が検知された場合に、予め設定された監視者の操作する端末装置宛に異常を検知した旨の情報を送信したり、また、監視室に設置されたモニタに異常を検知した旨の情報を表示するよう出力してもよい。
【0031】
また、出力部14は、例えば、図8に示すように、過去の異常検知用の時系列データセットに対して異常検知処理を行ったときのスコアのランキングを出力してもよい。この場合、スコアが高い順に、かかるスコアが算出された異常検知用の時系列データセット上の時刻と、スコアと、各セグメントについて算出した類似度に基づく情報と、を出力してもよい。例えば、出力部14は、「類似マップ」欄に、各セグメントの位置に対応して各ボックスを表示し、当該各ボックス内部を、対応する各セグメントについて算出した類似度に応じた色で塗りつぶして表示する。図8の例では、「類似マップ」欄の中央に、対象セグメントに対応するボックスを実線で囲って図示し、その両脇に、対象セグメントに対して設定された位置関係の周辺セグメントに対応するボックスを図示する。そして、各セグメントについて算出した類似度が高いほど、濃い濃度の色で、各セグメントに対応するボックス内部を塗りつぶして表示する。但し、出力部14は、他の方法で各セグメントについて算出した類似度に基づく情報を出力してもよい。また、出力部14は、異常を検知した位置と、監視者が所持する端末装置の位置情報とに基づいて、異常検知位置に最も近い監視者の位置も出力してもよい。これにより、発生した異常に対して迅速に対応することができるようになる。
【0032】
[動作]
次に、上述した時系列データ処理装置10の動作を、主に図9乃至図10のフローチャートを参照して説明する。まず、図9のフローチャートを参照して、監視対象Pの異常状態を検知するための異常状態モデルを生成するときの動作を説明する。
【0033】
時系列データ処理装置10は、既に監視対象Pから計測され記憶された時系列データのうち、監視対象Pが異常状態であると判断されたときに計測された学習用の時系列データセット(第一の時系列データ)を取得する(ステップS1)。そして、時系列データ処理装置10は、時間軸上において特定の異常状態となった時刻付近の時系列データセットを所定の時間毎に区切ったセグメントのうち、複数のセグメント(複数の特定期間)からなるセグメントセットを抽出する。例えば、時系列データ処理装置10は、図2に示すように、時刻tを含む1つの「対象セグメント」と、対象セグメントに対して時間軸上で前後する他の時刻t-1,t+1をそれぞれ含む2つの「周辺セグメント」と、をセグメントセットとして抽出する。そして、時系列データ処理装置10は、各セグメントに含まれる部分時系列データの特徴量f,ft-1,ft+1をそれぞれ算出する(ステップS2)。
【0034】
そして、時系列データ処理装置10は、セグメントセットを構成する各セグメントの特徴量を、特定の異常状態を表す情報に関連付けて、異常状態モデルとして記憶する(ステップS3)。このとき、時系列データ処理装置10は、セグメントセットを構成する各セグメント間の位置関係、つまり、対象セグメントに対する周辺セグメントの位置関係、を表す情報も記憶しておく。なお、時系列データ処理装置10は、上述した図2に示すような対象セグメントと周辺セグメントとの位置関係のセグメントセットを抽出することに限らず、図6乃至図7に示すような位置関係のセグメントセットを抽出してもよい。
【0035】
次に、図10のフローチャートを参照して、監視対象Pの異常状態を検知するときの動作を説明する。時系列データ処理装置10は、計測された、あるいは、記憶されている、監視対象Pの異常検知用の時系列データセット(第二の時系列データ)を取得する(ステップS11)。併せて、時系列データ処理装置10は、記憶されている異常状態モデルとして、上述した対象セグメントと周辺セグメントとの各特徴量を読み出す。
【0036】
そして、時系列データ処理装置10は、異常検知用の時系列データセットから、上述した対象セグメントと周辺セグメントとからなるセグメントセットの時間軸上の位置関係に対応して位置する、複数のセグメントからなる比較セグメントセットを抽出する。例えば、時系列データ処理装置10は、図3に示すように、下図の異常検知用の時系列データセット上における所定時刻Tを中心として、上図の学習時に抽出したセグメントセットと同様の位置関係に位置する比較セグメントセットを抽出する。そして、時系列データ処理装置10は、比較セグメントセットを構成する時刻Tにおける「比較対象セグメント」と、その前後して隣接する他の時刻T-1,T+1をそれぞれ含む「比較周辺セグメント」と、における部分時系列データセットの特徴量をそれぞれ算出する(ステップS12)。
【0037】
続いて、時系列データ処理装置10は、学習用の時系列データセットにおけるセグメントセットを構成する各セグメントの各特徴量と、異常検知用の時系列データセットにおける比較セグメントセットを構成する各セグメントの各特徴量と、をそれぞれ比較する。このとき、時系列データ処理装置10は、図3の矢印に示すように、各時系列データセットの時間軸上における位置関係が相互に対応するセグメント同士の特徴量の類似度S,St-1,St+1を算出する(ステップS13)。
【0038】
続いて、時系列データ処理装置10は、上述したように各セグメントについて算出した類似度S,St-1,St+1を集計して(ステップS14)、異常検知用の時系列データセットに特定の状態である異常状態が発生しているか否かを判断する(ステップS15)。例えば、時系列データ処理装置10は、各セグメントの位置に応じて類似度S,St-1,St+1に重みをつけて平均値を算出し、その算出結果であるスコアに基づいて異常状態の検出を行う。
【0039】
時系列データ処理装置10は、異常検知用の時系列データセットから異常が検知されない場合には(ステップS15でNo)、かかる時系列データセットの異なる時刻に位置する比較セグメントセットを抽出する。そして、時系列データ処理装置10は、上述同様に、比較セグメントセットを構成する各セグメントの特徴量を算出して(ステップS12)、異常状態モデルとの類似度を算出して(ステップS13,S14)、異常状態が発生しているか否かを判断する(ステップS15)。
【0040】
時系列データ処理装置10は、集計したスコアから異常検知用の時系列データセットに異常が検知された場合には(ステップS15でYes)、異常検知の出力を行う(ステップS16)。例えば、時系列データ処理装置10は、予め設定された監視者のメールアドレスに異常を検知した旨の情報を送信したり、また、監視室に設置されたモニタに異常を検知した旨の情報を表示するよう出力する。なお、時系列データ処理装置10は、図8に示すように、これまでの異常検知の集計結果をランキング形式で出力してもよい。
【0041】
以上のように、本実施形態では、監視対象Pから計測した時系列データ上の複数のセグメント(期間)の部分時系列データの特徴量を用いて、異常検知用の時系列データの異常などの特定の状態を検出している。このように、複数のセグメントの特徴量をセットで用いて特定の状態の検出を行っているため、セグメントの時間幅の長さを短く設定した場合であっても、多数の部分時系列データに合致することを抑制でき、時系列データから異常など特定の状況を適切に検出することができる。
【0042】
<実施形態2>
次に、本発明の第2の実施形態を、図11乃至図13を参照して説明する。図11乃至図12は、実施形態2における時系列データ処理装置の構成を示すブロック図であり、図13は、時系列データ処理装置の動作を示すフローチャートである。なお、本実施形態では、上述した実施形態で説明した時系列データ処理装置及び時系列データ処理方法の構成の概略を示している。
【0043】
まず、図11を参照して、本実施形態における時系列データ処理装置100のハードウェア構成を説明する。時系列データ処理装置100は、一般的な情報処理装置にて構成されており、一例として、以下のようなハードウェア構成を装備している。
・CPU(Central Processing Unit)101(演算装置)
・ROM(Read Only Memory)102(記憶装置)
・RAM(Random Access Memory)103(記憶装置)
・RAM103にロードされるプログラム群104
・プログラム群104を格納する記憶装置105
・情報処理装置外部の記憶媒体110の読み書きを行うドライブ装置106
・情報処理装置外部の通信ネットワーク111と接続する通信インタフェース107
・データの入出力を行う入出力インタフェース108
・各構成要素を接続するバス109
【0044】
そして、時系列データ処理装置100は、プログラム群104をCPU101が取得して当該CPU101が実行することで、図12に示す比較手段121と検出手段122とを構築して装備することができる。なお、プログラム群104は、例えば、予め記憶装置105やROM102に格納されており、必要に応じてCPU101がRAM103にロードして実行する。また、プログラム群104は、通信ネットワーク111を介してCPU101に供給されてもよいし、予め記憶媒体110に格納されており、ドライブ装置106が該プログラムを読み出してCPU101に供給してもよい。但し、上述した比較手段121と検出手段122とは、かかる手段を実現させるための専用の電子回路で構築されるものであってもよい。
【0045】
なお、図11は、時系列データ処理装置100である情報処理装置のハードウェア構成の一例を示しており、情報処理装置のハードウェア構成は上述した場合に限定されない。例えば、情報処理装置は、ドライブ装置106を有さないなど、上述した構成の一部から構成されてもよい。
【0046】
そして、時系列データ処理装置100は、上述したようにプログラムによって構築された比較手段121と検出手段122との機能により、図13のフローチャートに示す時系列データ処理方法を実行する。
【0047】
図13に示すように、時系列データ処理装置100は、
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し(ステップS101)、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する(ステップS102)、
という処理を実行する。
【0048】
本発明は、以上のように構成されることにより、時系列データ上の複数の期間の部分時系列データの特徴量を用いて、異常検知用の時系列データの異常などの特定の状態を検出している。このように、複数の期間の特徴量をセットで用いて特定の状態の検出を行っているため、期間の時間幅の長さを短く設定した場合であっても、多数の部分時系列データに合致することを抑制でき、時系列データから異常など特定の状況を適切に検出することができる。
【0049】
なお、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体(non-transitory computer readable medium)を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体(tangible storage medium)を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体(例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ)、光磁気記録媒体(例えば光磁気ディスク)、CD-ROM(Read Only Memory)、CD-R、CD-R/W、半導体メモリ(例えば、マスクROM、PROM(Programmable ROM)、EPROM(Erasable PROM)、フラッシュROM、RAM(Random Access Memory))を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体(transitory computer readable medium)によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。
【0050】
以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、上述した比較手段121と検出手段122との機能のうちの少なくとも一以上の機能は、ネットワーク上のいかなる場所に設置され接続された情報処理装置で実行されてもよく、つまり、いわゆるクラウドコンピューティングで実行されてもよい。
【0051】
<付記>
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における時系列データ処理方法、時系列データ処理装置、時系列データ処理システム、プログラムの構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
(付記1)
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較し、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
(付記2)
付記1に記載の時系列データ処理方法であって、
前記第一の時系列データの前記複数の特定期間と、前記第二の時系列データの前記複数の期間と、の時間軸上の位置関係が相互に対応する期間同士における部分時系列データの特徴量をそれぞれ比較する、
時系列データ処理方法。
(付記3)
付記1又は2に記載の時系列データ処理方法であって、
前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較する、
時系列データ処理方法。
(付記4)
付記3に記載の時系列データ処理方法であって、
前記特定位置は、前記対象期間に対して時間軸上で前及び/又は後の位置を表す、
時系列データ処理方法。
(付記5)
付記3又は4に記載の時系列データ処理方法であって、
前記特定位置は、前記対象期間に対して時間軸上で予め設定された範囲内の位置を表す、
時系列データ処理方法。
(付記6)
付記3乃至5のいずれかに記載の時系列データ処理方法であって、
前記特定位置は、前記対象期間に対して時間軸上で隣接する位置を表す、
時系列データ処理方法。
(付記7)
付記3乃至6のいずれかに記載の時系列データ処理方法であって、
前記特定位置は、前記対象期間に対して時間軸上で連続して隣接する複数の位置を表す、
時系列データ処理方法。
(付記8)
付記1乃至7のいずれかに記載の時系列データ処理方法であって、
期間毎に比較する特徴量間の類似度を算出し、
算出した全ての類似度に基づいて、前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
(付記9)
付記3乃至7のいずれかに記載の時系列データ処理方法であって、
前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理方法。
(付記10)
付記9に記載の時系列データ処理方法であって、
前記別期間についての類似度を、前記対象期間についての類似度よりも重みを低くして集計を行う、
時系列データ処理方法。
(付記11)
付記1乃至10のいずれかに記載の時系列データ処理方法であって、
期間毎に特徴量を比較した結果を出力する、
時系列データ処理方法。
(付記12)
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を備えた時系列データ処理装置。
(付記13)
付記12に記載の時系列データ処理装置であって、
前記比較手段は、前記第一の時系列データの前記複数の特定期間と、前記第二の時系列データの前記複数の期間と、の時間軸上の位置関係が相互に対応する期間同士における部分時系列データの特徴量をそれぞれ比較する、
時系列データ処理装置。
(付記14)
付記12又は13に記載の時系列データ処理装置であって、
前記複数の特定期間は、前記第一の時系列データのうち、1つの対象期間と、当該対象期間に対して時間軸上の予め設定された位置である特定位置に位置する少なくとも1つの別期間と、からなり、
前記比較手段は、前記第一の時系列データのうち前記対象期間における部分時系列データの特徴量と、前記第二の時系列データのうち所定の期間における部分時系列データの特徴量と、を比較すると共に、前記第一の時系列データのうち前記少なくとも1つの別期間における部分時系列データの特徴量と、前記第二の時系列データのうち前記所定の期間に対して前記特定位置に位置する少なくとも1つの期間における部分時系列データの特徴量と、を比較する、
時系列データ処理装置。
(付記14.1)
付記14に記載の時系列データ処理装置であって、
前記特定位置は、前記対象期間に対して時間軸上で前及び/又は後の位置を表す、
時系列データ処理装置。
(付記14.2)
付記14又は14.1に記載の時系列データ処理装置であって、
前記特定位置は、前記対象期間に対して時間軸上で予め設定された範囲内の位置を表す、
時系列データ処理装置。
(付記14.3)
付記14乃至14.2のいずれかに記載の時系列データ処理装置であって、
前記特定位置は、前記対象期間に対して時間軸上で隣接する位置を表す、
時系列データ処理装置。
(付記14.4)
付記14乃至14.3のいずれかに記載の時系列データ処理装置であって、
前記特定位置は、前記対象期間に対して時間軸上で連続して隣接する複数の位置を表す、
時系列データ処理装置。
(付記15)
付記12乃至14のいずれかに記載の時系列データ処理装置であって、
前記比較手段は、期間毎に比較する特徴量間の類似度を算出し、
前記検出手段は、算出した全ての類似度に基づいて、前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理装置。
(付記16)
付記14に記載の時系列データ処理装置であって、
前記比較手段は、前記対象期間について比較する特徴量間の類似度と、前記別期間について比較する特徴量間の類似度と、を算出し、
前記検出手段は、前記対象期間についての類似度と、前記別期間についての類似度と、を異なる方法で集計して、集計結果に基づいて前記第二の時系列データにおける特定の状態を検出する、
時系列データ処理装置。
(付記17)
付記16に記載の時系列データ処理装置であって、
前記検出手段は、前記別期間についての類似度を、前記対象期間についての類似度よりも重みを低くして集計を行う、
時系列データ処理装置。
(付記18)
付記12乃至17のいずれかに記載の時系列データ処理装置であって、
前記検出手段は、期間毎に特徴量を比較した結果を出力する、
時系列データ処理装置。
(付記19)
情報処理装置に、
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を実現させるためのプログラム。
(付記20)
第一の時系列データのうち時間軸上の位置が異なる複数の特定期間における部分時系列データのそれぞれの特徴量と、第二の時系列データのうち前記複数の特定期間の間の位置関係に対応して位置する複数の期間における部分時系列データのそれぞれの特徴量と、を比較する比較手段と、
前記比較の結果に基づいて前記第二の時系列データにおける特定の状態を検出する検出手段と、
を備えた時系列データ処理システム。
【符号の説明】
【0052】
10 時系列データ処理装置
11 計測部
12 学習部
13 異常検知部
14 出力部
16 計測データ記憶部
17 学習データ記憶部
18 検出データ記憶部
100 時系列データ処理装置
101 CPU
102 ROM
103 RAM
104 プログラム群
105 記憶装置
106 ドライブ装置
107 通信インタフェース
108 入出力インタフェース
109 バス
110 記憶媒体
111 通信ネットワーク
121 比較手段
122 検出手段
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13