IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セコム株式会社の特許一覧

特開2023-148972異常判定装置、異常判定方法、及び異常判定プログラム
<>
  • 特開-異常判定装置、異常判定方法、及び異常判定プログラム 図1
  • 特開-異常判定装置、異常判定方法、及び異常判定プログラム 図2
  • 特開-異常判定装置、異常判定方法、及び異常判定プログラム 図3
  • 特開-異常判定装置、異常判定方法、及び異常判定プログラム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023148972
(43)【公開日】2023-10-13
(54)【発明の名称】異常判定装置、異常判定方法、及び異常判定プログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20231005BHJP
   G06N 3/02 20060101ALI20231005BHJP
   G10L 25/30 20130101ALI20231005BHJP
【FI】
G06N20/00
G06N3/02
G10L25/30
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022057280
(22)【出願日】2022-03-30
【新規性喪失の例外の表示】特許法第30条第2項適用申請有り 令和3年7月1日 https://dcase.community/documents/challenge2021/technical_reports/DCASE2021_Morita_59_t2.pdf にて公開
(71)【出願人】
【識別番号】000108085
【氏名又は名称】セコム株式会社
(74)【代理人】
【識別番号】110001519
【氏名又は名称】弁理士法人太陽国際特許事務所
(72)【発明者】
【氏名】森田 一輝
(72)【発明者】
【氏名】矢野 智彦
(72)【発明者】
【氏名】甲斐 光
(57)【要約】
【課題】精度よく時系列データの異常を判定することができるようにする。
【解決手段】異常判定装置は、散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに、特徴量を抽出する特徴量抽出部と、区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成する統合部と、前記統合済み特徴量に基づいて前記時系列データの異常度合いを判定する判定部と、を含む。
【選択図】図2
【特許請求の範囲】
【請求項1】
散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに、特徴量を抽出する特徴量抽出部と、
区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成する統合部と、
前記統合済み特徴量に基づいて前記時系列データの異常度合いを判定する判定部と、
を含む異常判定装置。
【請求項2】
前記特徴量抽出部は、ラベルを識別するためのニューラルネットワークモデルである学習済みモデルを用いて、前記特徴量を抽出する請求項1記載の異常判定装置。
【請求項3】
前記時系列データの前記イベント期間を推定するイベント期間推定部を更に含み、
前記特徴量抽出部は、前記イベント期間推定部によって推定されたイベント期間以上とした区間ごとに、前記特徴量を抽出する請求項1又は2記載の異常判定装置。
【請求項4】
前記判定部は、正常な時系列データから学習された識別器を用いて、前記統合済み特徴量から、前記異常度合いを判定する請求項1~請求項3の何れか1項記載の異常判定装置。
【請求項5】
前記時系列データは、機械の動作音を表す音データである請求項1~請求項4の何れか1項記載の異常判定装置。
【請求項6】
前記区間の長さは、前記イベント間の間隔に基づいて決定される請求項1~請求項5の何れか1項記載の異常判定装置。
【請求項7】
特徴量抽出部が、散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに特徴量を抽出し、
統合部が、区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成し、
判定部が、前記統合済み特徴量に基づいて、前記時系列データの異常度合いを判定する
異常判定方法。
【請求項8】
散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに特徴量を抽出し、
区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成し、
前記統合済み特徴量に基づいて、前記時系列データの異常度合いを判定する
ことをコンピュータに実行させるための異常判定プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、異常判定装置、異常判定方法、及び異常判定プログラムに関する。
【背景技術】
【0002】
従来、機械の動作音から異常音を検知する技術が知られている(例えば、非特許文献1)。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Kazuki Morita, Tomohiko Yano, Khai Q. Tran," Anomalous sound detection by using local outlier factor and gaussian mixture model," Technical Report, DCASE2020 Challenge, July 2020.
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1では、音データから作成したスペクトログラムを特徴量とし、Local Outlier Factor(LOF)、及び混合正規分布(GMM)を用いた異常検知手法により異常度合いを表す異常度を求め、異常度に基づいて異常の有無を判定する。
【0005】
しかしながら、このような従来技術では異常を精度よく検知することに改善の余地があった。特に、散発的にイベントが発生するような時系列データに対しては、異常の検知精度に課題があった。
【0006】
そこで、本発明は、上記問題を鑑みてなされたものであり、精度よく時系列データの異常を判定することができる異常判定装置、異常判定方法、及び異常判定プログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
上記の目的を達成するために本発明に係る異常判定装置は、散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに、特徴量を抽出する特徴量抽出部と、区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成する統合部と、前記統合済み特徴量に基づいて前記時系列データの異常度合いを判定する判定部と、を含んで構成されている。
【0008】
本発明に係る異常判定装置によれば、特徴量抽出部によって、散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに、特徴量を抽出する。統合部によって、区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成する。そして、判定部によって、前記統合済み特徴量に基づいて前記時系列データの異常度合いを判定する。
【0009】
このように、時系列データに対して、イベント期間に応じた区間ごとに、特徴量を抽出し、区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、統合済み特徴量を生成し、時系列データの異常度合いを判定する。これにより、精度よく時系列データの異常を判定することができる。
【0010】
また、前記特徴量抽出部は、ラベルを識別するためのニューラルネットワークモデルである学習済みモデルを用いて、前記特徴量を抽出することができる。
【0011】
また、上記の異常判定装置は、前記時系列データの前記イベント期間を推定するイベント期間推定部を更に含み、前記特徴量抽出部は、前記イベント期間推定部によって推定されたイベント期間以上とした区間ごとに、前記特徴量を抽出することができる。
【0012】
また、前記判定部は、正常な時系列データから学習された識別器を用いて、前記統合済み特徴量から、前記異常度合いを判定することができる。
【0013】
また、上記の時系列データを、機械の動作音を表す音データとすることができる。
【0014】
また、前記区間の長さを、前記イベント間の間隔に基づいて決定されたものとすることができる。
【0015】
本発明に係る異常判定方法は、特徴量抽出部が、散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに特徴量を抽出し、統合部が、区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成し、判定部が、前記統合済み特徴量に基づいて、前記時系列データの異常度合いを判定する。
【0016】
本発明に係る異常判定プログラムは、散発的にイベントが発生する時系列データに対して、イベント期間に応じた区間ごとに特徴量を抽出し、区間ごとの特徴量を構成する各要素について、複数の区間の対応する要素単位でばらつきを計算し、当該要素単位のばらつきを各要素として構成した特徴量である統合済み特徴量を生成し、前記統合済み特徴量に基づいて、前記時系列データの異常度合いを判定することをコンピュータに実行させるためのプログラムである。
【発明の効果】
【0017】
以上説明したように、本発明に係る異常判定装置、異常判定方法、及び異常判定プログラムによれば、精度よく時系列データの異常を判定することができる、という効果が得られる。
【図面の簡単な説明】
【0018】
図1】本発明の実施の形態に係る異常判定学習装置の構成を示すブロック図である。
図2】本発明の実施の形態に係る異常判定装置の構成を示すブロック図である。
図3】本発明の実施の形態に係る異常判定学習装置による異常判定学習処理の動作を示すフローチャートである。
図4】本発明の実施の形態に係る異常判定装置による異常判定処理の動作を示すフローチャートである。
【発明を実施するための形態】
【0019】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0020】
[異常判定学習装置の構成]
本発明の実施の形態に係る異常判定学習装置は、事前に用意した学習データを用いて、ラベルを識別するモデル及び異常を判定する識別器を学習する装置である。具体的には、機械の動作音に基づいて学習したモデル及び識別器により、所定の音データに対して機械の異常(損傷、異物の混入、過電圧、詰まり、機械の故障など)の有無を判定する。
【0021】
異常判定学習装置は、CPU(Central Processing Unit)と、GPU(Graphics Processing Unit)と、RAM(Random Access Memory)と、後述する異常判定学習処理ルーチンを実行するためのプログラムや各種データを記憶したROM(Read Only Memory)と、を含むコンピュータで構成することが出来る。図1に異常判定学習装置100のブロック図を示す。異常判定学習装置100は、機能的には、図1に示すように、入力部10及び演算部20を備えている。
【0022】
入力部10は、学習データを複数受け付ける。この学習データには、散発的にイベントが発生する正常時における機械の動作音を表す時系列データ及びラベルが含まれている。すなわち、散発的にイベントが発生する時系列データとは、時系列データの全取得期間に比べて意味のあるイベント音の波形がごく短期間だけ含まれるようなスパースな時系列データを意味する。
【0023】
例えば、時系列データは、機械の動作音を表す音データから各フレームについてSTFT(Short Time Fourier Transform)を用いて得られたスペクトログラムであり、ラベルは、機械の個体やメーカーの種別などの、音データのメタ情報から決定されるものであり、イベントは、バルブの開閉音などの、音データの波形において生じるスパイクである。本実施の形態では、およそ2~5秒間に1回の割合でバルブの開閉が発生し、当該バルブの開閉に伴って、およそ100msのバルブ開閉音(スパイク)が生じる。以下では、イベントの発生に伴って生じるスパイクの生じている期間(スパイクの立ち上がり開始から元に戻るまでの期間)を「イベント期間」と称する。
【0024】
演算部20は、学習データ記憶部22、特徴量抽出器学習部24、特徴量抽出器記憶部26、特徴量抽出部28、統合部30、識別器学習部32、及び識別器記憶部34を備えている。
【0025】
学習データ記憶部22には、入力部10により受け付けた複数の学習データが記憶されている。
【0026】
特徴量抽出器学習部24は、複数の学習データ(時系列データ及びラベル)に基づいて、時系列データに対して、切り出した区間ごとにラベルを識別するためのニューラルネットワークモデルを学習する。
【0027】
具体的には、1区間に含まれる複数フレームのスペクトログラムを入力として、ラベルを推定するCNN(Convolutional Neural Networks)を学習する。例えば、CNNとして、MobileFaceNet(MFN)を利用する(参考文献1)。CNNは、出力がラベルに近づくように繰り返し学習を行う。
【0028】
[参考文献1]:S. Chen, Y. Liu, X. Gao, and Z. Han, “MobileFaceNets: Efficient CNNs for Accurate Real-Time Face Verification on Mobile Devices,” pp. 428-438, 2018.
【0029】
ここで、区間の長さは、イベント期間及びイベント間の間隔に基づいて決定される。具体的には、区間の長さは、少なくとも1つのイベント期間の長さ以上である必要があり、2つ以上のイベントが含まれないような長さであることが望ましい。
【0030】
例えば、機械の動作音を表す音データにおいて生じるスパイクの期間、すなわちイベント期間が100msであるため、区間の長さを100ms以上とする必要があるが、スパイク期間中の区間の切り出しが行われないよう区間を100msより十分に大きな長さとすることが好適である。また、2~5秒間に1回の割合でスパイクが生じるため、区間の長さを2秒以内とすることが好適である。そこで本実施の形態では、区間の長さを約1秒とする。
【0031】
特徴量抽出器記憶部26には、特徴量抽出器学習部24によって学習されたニューラルネットワークモデルが学習済みモデルとして記憶されている。
【0032】
特徴量抽出部28は、複数の学習データの各々について、特徴量抽出器記憶部26に記憶された学習済みモデルを用いて、当該時系列データに対して、イベント期間に応じた区間ごとに、特徴ベクトル(本発明における特徴量)を抽出する。具体的には、1区間に含まれる複数フレームのスペクトログラムを、学習済みモデルであるCNNに入力し、CNNの中間層から得られる特徴ベクトルを抽出する。例えば、ニューラルネットワークの出力層の前層を利用する。
【0033】
統合部30は、複数の学習データの各々について、当該学習データの時系列データの区間ごとに抽出された特徴ベクトルに基づいて、各区間の特徴ベクトルを構成する各要素(ベクトルの成分)についてそれぞれ対応する要素単位でばらつきを計算し、計算されたばらつきをベクトルの各要素とした、統合済み特徴ベクトルを生成する。具体的には、ばらつきとして、分散又は標準偏差を計算する。例えば、時系列データをn個の区間にて切り分け、n個の特徴ベクトルを抽出した場合、第1区間からの第n区間の各特徴ベクトルの第1要素について標準偏差を求め、当該標準偏差を統合済み特徴ベクトルの第1要素とする。同じように、第1区間からの第n区間の各特徴ベクトルの第2要素について標準偏差を求め、当該標準偏差を統合済み特徴ベクトルの第2要素とする。この処理を特徴ベクトルの全ての要素について計算して、求めた全てのばらつきを要素とした特徴ベクトルである統合済み特徴ベクトルを求める。このように統合部30は一つの学習データから切り出された複数の区間の特徴ベクトルのそれぞれを統合して一つの統合済み特徴ベクトルを求める。
【0034】
識別器学習部32は、複数の学習データの各々について生成された統合済み特徴ベクトルに基づいて、学習データの時系列データの異常度合いを判定するための識別器を学習する。
【0035】
具体的には、識別器として、Local Outlier Factor(LOF)又はk-Nearest neighbors(k-NN)を用いる。
【0036】
ここで、Local Outlier Factor(LOF)は密度ベースの異常検知手法である。これは外れ値の局所密度近傍点における密度は正常値の局所密度に比べて小さくなることを利用する。あるデータの局所密度が、学習データ中の近傍データの局所密度と比べて有意に小さい場合に異常であると判定し、そのような場合に高い異常度合いを出力するように設定する。
【0037】
k-Nearest neighbors(k-NN)は近傍との距離に基づく異常検知手法である。k-NNでは、k個の近傍への距離が大きいほど正常から離れることになる。例えば、近傍5個のコサイン距離の平均を異常度合いとする。
【0038】
識別器記憶部34には、学習された識別器が記憶される。
【0039】
[異常判定装置の構成]
異常判定装置は、CPUと、GPUと、RAMと、後述する異常判定処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。図2に異常判定装置150のブロック図を示す。異常判定装置150は、機能的には、図2に示すように、入力部60、演算部70、及び出力部80を備えている。
【0040】
入力部60は、判定対象となる時系列データを受け付ける。例えば、判定対象となる時系列データは、スペクトログラムに変換前の機械の動作音を表す音データである。
【0041】
演算部70は、音響処理部72、特徴量抽出器記憶部73、特徴量抽出部74、統合部76、識別器記憶部77、及び判定部78を備えている。
【0042】
音響処理部72は、時系列データである機械の動作音を表す音データから各フレームについてSTFTを用いてスペクトログラムを取得する。
【0043】
特徴量抽出器記憶部73には、特徴量抽出器記憶部26と同様に、特徴量抽出器学習部24によって学習されたニューラルネットワークである学習済みモデルが記憶されている。
【0044】
特徴量抽出部74は、特徴量抽出部28と同様に、学習済みモデルを用いて、時系列データに対して、イベント期間に応じた区間ごとに、当該区間について取得した各フレームのスペクトログラムから特徴ベクトルを抽出する。
【0045】
統合部76は、統合部30と同様に、時系列データの区間ごとに抽出された特徴ベクトルに基づいて、特徴ベクトルの要素単位でばらつきを計算し、統合済み特徴ベクトルを生成する。
【0046】
識別器記憶部77には、識別器記憶部34と同様に、識別器学習部32によって学習された識別器が記憶されている。
【0047】
判定部78は、識別器記憶部77に記憶されている識別器を用いて、統合済み特徴量から、異常度合いを判定する。例えば、k-NNにおいては、近傍k個のコサイン距離の平均を異常度合いとする。
【0048】
出力部80は、異常度合いの判定結果をディスプレイに表示する。例えば、閾値以上の異常度合いのデータを表示する。または、異常度合いの高いデータを順番に表示する。
【0049】
[異常判定学習装置100の動作]
次に、異常判定学習装置100の動作について説明する。
【0050】
図3は、異常判定学習装置100による異常判定学習処理の流れを示すフローチャートである。CPUがROM又はストレージから異常判定学習プログラムを読み出して、RAMに展開して実行することにより、異常判定学習処理が行なわれる。また、異常判定学習装置100に、正常な時系列データが学習データとして複数入力される。ここで学習データの時系列データは、例えば、機械の動作音を表す音データから各フレームについてSTFTを用いて得られたスペクトログラムである。この学習データの時系列データには、メタ情報として、ラベルが含まれている。学習データ記憶部22に、入力された複数の学習データが記憶される。
【0051】
ステップS100で、特徴量抽出器学習部24は、複数の学習データの時系列データ及びラベルに基づいて、時系列データに対して、切り出した区間ごとにラベルを識別するためのニューラルネットワークモデルを学習する。特徴量抽出器記憶部26に、特徴量抽出器学習部24によって学習されたニューラルネットワークモデルが学習済みモデルとして記憶される。
【0052】
ステップS102で、特徴量抽出部28は、複数の学習データの各々について、学習済みモデルを用いて、当該時系列データに対して、区間ごとに、特徴ベクトルを抽出する。
【0053】
ステップS104で、統合部30は、複数の学習データの各々について、当該学習データの時系列データの区間ごとに抽出された特徴ベクトルに基づいて、各特徴ベクトルの対応する要素単位でばらつきを計算し、統合済み特徴ベクトルを生成する。
【0054】
ステップS106で、識別器学習部32は、複数の学習データの各々について生成された統合済み特徴ベクトルに基づいて、異常度合いを判定するための識別器を学習する。識別器記憶部34に、学習された識別器が記憶される。
【0055】
[異常判定装置150の動作]
次に、異常判定装置150の動作について説明する。
【0056】
図4は、異常判定装置150による異常判定処理の流れを示すフローチャートである。CPUがROM又はストレージから異常判定プログラムを読み出して、RAMに展開して実行することにより、異常判定処理が行なわれる。また、異常判定装置150に、判定対象となる時系列データが入力される。判定対象となる時系列データは、例えば、スペクトログラムに変換前の機械の動作音を表す音データである。
【0057】
また、特徴量抽出器記憶部73には、特徴量抽出器記憶部26と同様に、ニューラルネットワークである学習済みモデルが記憶され、識別器記憶部77には、識別器記憶部34と同様に、学習された識別器が記憶されているものとする。
【0058】
ステップS110で、音響処理部72は、時系列データである機械の動作音を表す音データから各フレームについてSTFTを用いてスペクトログラムを取得する。
【0059】
ステップS112で、特徴量抽出部74は、学習済みモデルを用いて、時系列データに対して、区間ごとに、当該区間について取得した各フレームのスペクトログラムから特徴ベクトルを抽出する。
【0060】
ステップS114で、統合部76は、時系列データの区間ごとに抽出された特徴ベクトルに基づいて、各特徴ベクトルの対応する要素単位でばらつきを計算し、統合済み特徴ベクトルを生成する。
【0061】
ステップS116で、判定部78は、識別器記憶部77に記憶されている識別器を用いて、統合済み特徴量から、異常度合いを判定する。
【0062】
ステップS118で、出力部80は、異常度合いの判定結果をディスプレイに表示するなどする。
【0063】
<実施例>
上記の実施の形態で説明した異常判定装置150の有効性を説明するために行った実験結果について説明する。
【0064】
まず、判定対象となる時系列データは、機械(電磁弁)の動作音からサンプリングされた10秒間の音データ(16kHz、モノラル)である。また、学習データとなる時系列データの各々には、電磁弁個体を識別する「No.0」、「No.1」、「No.2」の3つの正解ラベルの何れかが与えられている。
【0065】
特徴量抽出器は、この3つのラベルの何れかに識別するためのニューラルネットワークを学習したものであり、識別器は、学習済みモデルの中間層から得られる特徴ベクトルを用いて学習したものである。
【0066】
音響処理では、音データから、FFT点数を2048点(窓幅:128msec)とし、シフト点数を512点(シフト幅:32msec)としてスペクトログラムを取得した。
【0067】
特徴抽出器で用いるニューラルネットワークとして、MobileFaceNetを採用した。周波数1024次元×32フレーム(約1秒)を入力単位とし、入力単位は16フレームシフトで切り出す(約0.5秒シフト)こととした。また、中間層から得られる特徴ベクトルは、128次元のベクトルである。
【0068】
識別器として、LOF、k-NN、混合正規分布(GMM)、One Class SVM(OCSVM)を用いた。LOFでは、近傍数を4とし、k-NNではkを1とした。ばらつきとして標準偏差を計算し、統合済み特徴ベクトルを生成した。また、比較例として、平均値を用いて統合済み特徴ベクトルを生成した。
【0069】
各識別器を用いた場合において、標準偏差を用いた統合済み特徴ベクトルと、平均を用いた統合済み特徴ベクトルでの性能比較を表1に示す。性能評価は、「No.0」、「No.1」、「No.2」の3つの機器に対して、AUCの調和平均を用いて行った。
【0070】
【表1】
【0071】
表1では、「No.0」は、正解ラベルが「0」の時系列データ200個(異常データ100個、正常データ100個)に対する性能評価を示している。「No.1」、「No.2」についても同様であり、「平均」とは、「No.0」、「No.1」、「No.2」に対する性能評価の平均を示している。
【0072】
表1の性能比較により、標準偏差を用いた統合済み特徴ベクトルの方が、平均を用いた統合済み特徴ベクトルより性能が向上することが分かった。通常の統合処理では平均を用いるが、異常な時系列データが低頻度でしか現れない場合は、平均をとると異常が考慮できなくなる。散発的にイベントが発生する正常な時系列データでのイベントのばらつき具合は類似したものになると仮定して、ばらつきを用いて、特徴量を統合することにより、低頻度でしか現れない異常を考慮できるため、より精度よく異常検知が可能となる。
【0073】
次に、特徴ベクトルの抽出単位となる区間の長さを様々な長さにして実験を行った結果について以下に説明する。識別器として、k-NNを用いた。ばらつきとして標準偏差を計算し、統合済み特徴ベクトルを生成した。
【0074】
区間を約1秒(32フレーム)とした場合の性能評価は、96.71%であり、区間を約2秒(64フレーム)とした場合の性能評価は、95.79%であり、区間を約4秒(128フレーム)とした場合の性能評価は、80.24%であり、区間を約8秒(256フレーム)とした場合の性能評価は、74.92%であった。
【0075】
以上より、区間の長さを長くなると異常判定の精度が悪くなることが分かった。これは、区間の長さが長くなると、区間の中に2つ以上のイベントが含まれるためである。すなわち、区間の長さは、少なくとも1つのイベント期間以上である必要があり、また、2つ以上のイベントが含まれないような長さであることが望ましい。
【0076】
以上説明したように、本発明の実施の形態に係る異常判定装置によれば、時系列データに対して、イベント期間に応じた区間ごとに、特徴ベクトルを抽出し、区間ごとの特徴ベクトルの対応する要素単位でばらつきを計算して、当該ばらつきを要素とした統合済み特徴ベクトルを生成し、時系列データの異常度合いを判定する。これにより、精度よく時系列データの異常を判定することができる。
【0077】
特に、本発明の実施の形態に係る異常判定装置によれば、一つの時系列データに対する区間分割された特徴量に対して統計量として標準偏差をとることにより、平均では見逃してしまうような低頻度で発生するスパイクを見逃さないような代表値として求めることができる。したがって、散発的にイベントが発生するような時系列データに対して、より精度よく異常を検知できる。
【0078】
また、本発明の実施の形態に係る異常判定装置によれば、特徴量抽出器において異なる環境を分離する機構を事前に学習することにより、異なる環境の時系列データが入力されたとしても、得られる統合特徴量が特徴量レベルで異なるものになることから、環境の違いに頑健な特徴量が後段の異常判定に利用されることになる。したがって、時系列データの取得環境が多様な場合であっても、それぞれの取得環境において精度よく異常を検知できる。
【0079】
また、統合済みベクトルを用いて異常判定することにより、異常判定の結果を統合する場合と比較して、高速処理が可能となる。
【0080】
<変形例>
なお、本発明は、上述した実施形態の装置構成及び作用に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0081】
(変形例1)
時系列データが、機械の動作音を表す音データである場合を例に説明したが、これに限定されるものではない。時系列データが、他の音データであってもよいし、散発的にイベントが発生する時系列データであれば、音データ以外の時系列データであってもよい。
【0082】
例えば、コンピュータでとれる各種ログのデータを時系列データとしてもよい。この場合、ファイルアクセス、ウェブアクセス、メール履歴、ログイン履歴等を時系列データとしてもよい。イベントとして、特定の業務で発生するファイルアクセス等を用い、ラベルとして、役職情報、ユーザID等を用いることができる。この例では、サイバーセキュリティに関する異常を判定することができる。
【0083】
また、センシングデータを時系列データとしてもよい。この場合、電力使用量、歩数、心拍数、睡眠等を時系列データとしてもよい。イベントとして、人間の特定の行動である寝ている時間、寝付く時間等を用い、ラベルとして、ユーザID、年齢、性別等を用いることができる。この例では、人の見守りに関する異常を判定することができる。
【0084】
(変形例2)
ラベルとして、時系列データのメタ情報から決定されるものを用いる場合を例に説明したが、これに限定されるものではない。時系列データ自体から決定されるものをラベルとして用いてもよい。例えば、時系列データに対してk-meansなどのクラスタリングアルゴリズムを用いて得られたクラスタをラベルとして利用する。
【0085】
(変形例3)
CNNを用いて特徴ベクトルを抽出する場合を例に説明したが、これに限定されるものではない。メルスペクトログラム、AutoEncoderなど、入力データの情報を集約できるものであれば、他の方法により、特徴ベクトルを抽出してもよい。
【0086】
(変形例4)
区間の長さが予め定められている場合を例に説明したが、これに限定されるものではない。異常判定学習装置及び異常判定装置において、時系列データのイベント期間を推定するイベント期間推定部を更に含み、特徴量抽出部は、イベント期間推定部によって推定されたイベント期間に応じた区間ごとに、特徴量を抽出するようにしてもよい。例えば、時系列データである音データの波形を解析して、所定の閾値以上の変化を示すスパイクの立ち上りが検知された時刻及び元に戻るまでの時刻を求め、両時刻の時間差からイベント期間を推定する。
【0087】
(変形例5)
特徴量として、特徴ベクトルを用いる場合を例に説明したが、これに限定されるものではない。スカラーや、行列、テンソルなどを特徴量として用いてもよい。
【0088】
(変形例6)
異常判定学習装置には、学習データとして音データのスペクトログラムが入力される場合を例に説明したが、これに限定されるものではない。異常判定学習装置には、学習データとして音データが入力されてもよい。この場合には、異常判定装置と同様に、音響処理部が音データをスペクトログラムに変換するようにしてもよい。
【0089】
以上のように、当業者は本発明の範囲内で、実施される形態に合わせて様々な変更を行うことができる。
【符号の説明】
【0090】
10 入力部
20 演算部
22 学習データ記憶部
24 特徴量抽出器学習部
26 特徴量抽出器記憶部
28 特徴量抽出部
30 統合部
32 識別器学習部
34 識別器記憶部
60 入力部
70 演算部
72 音響処理部
73 特徴量抽出器記憶部
74 特徴量抽出部
76 統合部
77 識別器記憶部
78 判定部
80 出力部
100 異常判定学習装置
150 異常判定装置
図1
図2
図3
図4