(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-10
(45)【発行日】2024-12-18
(54)【発明の名称】時系列データの情報処理装置
(51)【国際特許分類】
G06F 18/2433 20230101AFI20241211BHJP
G06F 18/213 20230101ALI20241211BHJP
G06F 18/40 20230101ALI20241211BHJP
G06F 123/02 20230101ALN20241211BHJP
【FI】
G06F18/2433
G06F18/213
G06F18/40
G06F123:02
(21)【出願番号】P 2022004566
(22)【出願日】2022-01-14
【審査請求日】2024-03-04
(73)【特許権者】
【識別番号】000005108
【氏名又は名称】株式会社日立製作所
(74)【代理人】
【識別番号】110002365
【氏名又は名称】弁理士法人サンネクスト国際特許事務所
(72)【発明者】
【氏名】河野 洋平
(72)【発明者】
【氏名】但馬 慶行
(72)【発明者】
【氏名】望月 義則
(72)【発明者】
【氏名】西村 卓真
(72)【発明者】
【氏名】堀越 優
【審査官】多賀 実
(56)【参考文献】
【文献】国際公開第2020/059498(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
G06F 18/00-18/40
G06F 123/02
G05B 23/00-23/02
(57)【特許請求の範囲】
【請求項1】
時系列データの情報処理装置であって、
対象設備の異常を監視する異常検知において用いられるモデルを教師無し学習により学習するための時系列の訓練データに対して、前記モデルの学習に使用される前記訓練データの範囲を定める窓幅の決定を支援するものであり、
演算部と、メモリとを備え、
前記演算部が、
複数の前記窓幅の候補値と、複数の前記候補値に対する前記訓練データの時間的特徴をそれぞれ表す複数の特徴量と、を算出する分析部と、
前記分析部により算出された複数の前記候補値と複数の前記特徴量との対応関係とを、ユーザに表示する表示処理部と、
を実行することを特徴とする時系列データの情報処理装置。
【請求項2】
請求項1に記載の時系列データの情報処理装置であって、
前記表示処理部は、前記窓幅の基準値を前記ユーザに選択させる表示画面を表示し、
前記分析部は、前記表示画面で前記ユーザに選択された前記基準値に基づいて複数の前記候補値を算出する
ことを特徴とする時系列データの情報処理装置。
【請求項3】
請求項2に記載の時系列データの情報処理装置であって、
前記分析部は、
前記基準値を含む複数の前記候補値について、前記訓練データの回帰モデルをそれぞれ構築し、
前記基準値について構築された前記回帰モデルから生成される第1特徴量と、前記基準値を除いた複数の前記候補値について構築された前記回帰モデルからそれぞれ生成される第2特徴量と、の差分から成る目的関数を算出し、複数の前記候補値の中で前記目的関数を最小化するものを前記窓幅の推奨値として抽出することで、前記窓幅の推奨値を算出する
ことを特徴とする時系列データの情報処理装置。
【請求項4】
請求項3に記載の時系列データの情報処理装置であって、
前記特徴量は、前記回帰モデルの固有値であり、
前記分析部は、複数の前記候補値のそれぞれについて、前記差分と、前記基準値と前記窓幅の前記候補値との比から成る目的関数と、を最小化し、
前記表示処理部は、複数の前記候補値のそれぞれについて、前記差分と、前記差分と前記基準値に対する比と、を二次元グラフ上に表示する
ことを特徴とする時系列データの情報処理装置。
【請求項5】
請求項1に記載の時系列データの情報処理装置であって、
前記表示処理部は、窓幅の変化に対する前記特徴量の変化を表示する
ことを特徴とする時系列データの情報処理装置。
【請求項6】
請求項1に記載の時系列データの情報処理装置であって、
前記分析部は、前記訓練データと、前記訓練データと異なる時系列データであるテストデータとに対し、複数の特徴量のそれぞれに関する寄与度を算出し、
前記表示処理部は、前記訓練データに対する前記寄与度と、前記テストデータに対する前記寄与度とを並べて表示し、2つの前記寄与度の差が大きい場合、対応する前記特徴量を強調して表示する
ことを特徴とする時系列データの情報処理装置。
【請求項7】
請求項1から6のいずれか一項に記載の時系列データの情報処理装置であって、
前記ユーザに決定された前記窓幅に応じた前記訓練データを用いて、前記モデルの教師無し学習を行うとともに、学習済みの前記モデルを用いた推論を行う学習推論部と、を備える
ことを特徴とする時系列データの情報処理装置。
【請求項8】
請求項7に記載の時系列データの情報処理装置であって、
学習済みの前記モデルを用いて前記異常検知を行う
ことを特徴とする時系列データの情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、時系列データの情報処理装置に関する。
【背景技術】
【0002】
産業分野では、インフラや設備の老朽化に伴いそれらの保守コストが増大している問題を抱えている。これを解決するため、従来行われてきた定期検査に代わり、予知保全(CBM:Condition Based Maintenance)を行うシステムやサービスの導入が進められている。これにより、インフラや設備の計測データから故障や経年劣化(以下、異常)を予測することで、その結果に基づいた保全が行われている。
【0003】
保守において表れる異常は、例えば、モータのトルクや電流、プラントに対する圧力や温度状況など、変化のある時系列性のデータが多い。このようなデータは動特性(時系列の振る舞い)が変化するため、時系列性のあるデータの遷移全体を見て異常かどうかを判断できるように、経年変化に対応した異常検知システムが必要になる。
【0004】
このような予知保全システムにおいて、このような時系列データによって観察できる異常の検知には、一般的な機械学習アルゴリズムが用いられるが、これに加えて時系列データから特徴量を構築すること(前処理)が重要となる。近年では、時系列性を直接的に考慮して前処理機構を内包している深層学習アーキテクチャが発展しており、例えばCNN(Convolutional neural network:畳み込みニューラルネットワーク)やLSTM(Long short-term memory)などが知られている。
【0005】
このような時系列データの前処理によって、時系列データについての特徴量を生成することで異常現象を検知する必要があるが、そのためには、時系列性の異常を検知する性能を大きく左右する「窓幅」という共通のパラメータを設定する必要がある。なお、この窓幅の定義は手法によって異なり、例えば、代表的な前処理の手法として滑走窓法(時系列データを窓幅に対応する次元のベクトルに変換する手法)の場合、時系列データをベクトル化する際の次元数が窓幅である。また、短時間フーリエ変換(時系列データの代表的な周波数成分であるピーク周波数と、それに対応する振幅および位相と、を抽出する手法)の場合、窓関数の定義域の長さが窓幅である。また、CNN(Convolutional neural network:畳み込みニューラルネットワーク)の場合、畳込み層のカーネルサイズが窓幅である。
【0006】
異常検知において、設定される窓幅の長さは対象設備の現象に適合しているかどうかが重要である。例えば、窓幅の設定が短すぎると時間変化が取れず、対象設備の長周期の振動や傾向を学習することができない。逆に、窓幅の設定が長すぎると時系列中において異なる特性を有する区別すべきパターンを区別できない。つまり、異常現象に合わせた適切な長さの窓幅を設定する必要があることが、時系列を対象とした一般的な異常検知の課題である。
【0007】
対象とする現象に適合する長さを選択する窓幅の決定手法は、異常検知の問題設定に応じて異なる。例えば、ラベル付きデータが利用可能である「教師あり学習」の場合は、ラベルの識別性能を目的関数とし、これを最小化する(最適化問題を解く)ことで、簡単に窓幅を決定できる。しかし、前述したように産業現場の多くでは、異常に関するラベル付きデータは得られないか、得られたとしてもそのデータ量は正常時のデータ量と比べて遥かに少ない。この場合は「教師無し学習」となり、教師あり学習で用いられるような自明な目的関数が得られないことで、窓幅の決定がケースバイケースになる。適切な窓幅が決定できないと、異常に対応できる対象設備への制御が決められないため、時系列データの特性や問題設定に応じた学習方法の検討が必要となる。
【0008】
教師無し学習を用いた異常検知の例として、例えば、特許文献1では、モータ機器を対象とし、モータの動作周波数が既知である場合に、その周波数幅に基づいて決定した窓幅を用いてモータ機器の異常状態を判定する異常検知システムが提案されている。
【先行技術文献】
【特許文献】
【0009】
【発明の概要】
【発明が解決しようとする課題】
【0010】
特許文献1では、動作周波数を対象設備の動作を表す特徴量として認識して、事前知識が得られることが前提となっていることで、窓幅を決定できている。しかしながら、多くの産業現場では、容易にこのような特性が得られるとは限らず、窓幅を決定する上での基準となる物理量が存在しないため、データから得られる統計量(異常検知における異常スコアなど)からアルゴリズムに入力して窓幅を決定するしかないため、判断結果の信頼性を損なう課題が生じる。
【0011】
これを鑑みて本発明では、ユーザに対して、異常検知に使用する学習モデルにおいての窓幅決定を支援する時系列データの情報処理装置を提供することが目的である。
【課題を解決するための手段】
【0012】
本発明の時系列データの情報処理装置は、対象設備の異常を監視する異常検知において用いられるモデルを教師無し学習により学習するための時系列の訓練データに対して、前記モデルの学習に使用される前記訓練データの範囲を定める窓幅の決定を支援するものであり、演算部とメモリと、を備え、前記演算部が、複数の前記窓幅の候補値と、複数の前記候補値に対する前記訓練データの時間的特徴をそれぞれ表す複数の特徴量と、を算出する分析部と、前記分析部により算出された複数の前記候補値と複数の前記特徴量との対応関係とを、前記ユーザに表示する表示処理部と、を実行する。
【発明の効果】
【0013】
ユーザに対して、異常検知に使用する学習モデルにおいての窓幅決定を支援する時系列データの情報処理装置を提供できる。
【図面の簡単な説明】
【0014】
【
図1A】本発明の一実施形態に係る、教師無し学習システム(異常検知システム)の全体構成を示すブロック図である。
【
図1B】本発明の一実施形態に係る、時系列データの情報処理装置のハードウェアの構成の実施例である。
【
図2】
図1の時系列データ管理テーブルの構成例を示す図である。
【
図3】本発明の一実施形態に係る、窓幅決定のフローである。
【
図4】本発明の一実施形態に係る、窓幅の基準値の選択画面例である。
【
図5】本発明の一実施形態に係る、選択した窓幅の基準値に基づいた回帰分析結果の表示画面例である。
【
図6】本発明の一実施形態に係る、推論結果の表示フローである。
【
図7】本発明の一実施形態に係る、推論結果の表示画面である。
【0015】
以下、図面を参照して本発明の実施形態を説明する。以下の記載および図面は、本発明を説明するための例示であって、説明の明確化のため、適宜、省略および簡略化がなされている。本発明は、他の種々の形態でも実施する事が可能である。特に限定しない限り、各構成要素は単数でも複数でも構わない。
【0016】
図面において示す各構成要素の位置、大きさ、形状、範囲などは、発明の理解を容易にするため、実際の位置、大きさ、形状、範囲などを表していない場合がある。このため、本発明は、必ずしも、図面に開示された位置、大きさ、形状、範囲などに限定されない。
【0017】
(本発明の一実施形態と全体構成)
(
図1A)
教師無し学習システム1は、本発明の時系列データの情報処理装置(
図1B)を備える、対象設備7の異常を検知する異常検知システムの一つである。以下、教師無し学習システム1は異常検知システム1として説明する。異常検知システム1は、時系列データ管理テーブル2、表示処理部3、表示部4、分析部5、学習推論部6を備えている。時系列データ管理テーブル2は、異常検知システム1が対象設備7を計測すると時系列のデータを取得し記録している。時系列データ管理テーブル2で記録される時系列データの例は、後述の
図2で説明する。
【0018】
時系列データ管理テーブル2は、表示処理部3、分析部5、学習推論部6に対して、対象設備7から取得した時系列データを送信する。表示部4は、表示処理部3で処理されたデータをユーザに表示する。表示処理部3、分析部5、学習推論部6については、
図3~
図7の説明において、詳細を説明する。
【0019】
(
図1B)
本発明の時系列データの情報処理装置に係るハードウェアの構成の実施例を説明する。教師無し学習システム1(異常検知システム1)を備える情報処理装置10は、入力デバイス11、出力表示デバイス12、入出力インターフェース13、通信インターフェース14、RAM(Random Access Memory)15、CPU(Central Processing Unit)16、ROM(Read Only Memory)17、を有している。
【0020】
情報処理装置10は、通信インターフェース14を介して、対象設備7から時系列データを取得し、取得された時系列データはストレージ機能を有するデータベース(図示なし)に保存される。メモリであるROM17は、予め書き込まれたデータ(プログラム等)を記憶保持している。CPU16による処理が起動(演算部として実行)することで、分析部5、学習推論部6、表示処理部3が機能し、データベースに格納されている時系列データを取得する。分析部5、学習推論部6、表示処理部3は、それぞれメモリであるRAM15の作業領域を用いてデータ処理を行う。
【0021】
表示処理部3、分析部5、学習推論部6によって処理されたデータは、入出力インターフェース13を介して、出力表示デバイス12(表示部4)によってユーザにデータを表示する。ユーザは表示されたデータを判断し、入力デバイス11を用いて入力動作を行うことで、情報処理装置10に指示を与えている。なお、入力デバイス11はタッチパネル式であれば表示部4であってもよい。
【0022】
(
図2)
図2に示した時系列データ管理テーブル2は、データ取得先の対象設備7が機械装置(特にモータ)である場合を想定した一例であり、対象設備7が備える複数の電流センサや加速度センサによって計測された電流および加速度の値が、取得データとしてタイムスタンプとともにテーブルに記録されている。なお、列201および列202にそれぞれ記載の♯1,♯2はセンサ番号を表している。また、時系列データ管理テーブル2は、データベースのスキーマで定義されてもよいし、エクセルファイルで都度入力される形でもよく、明確な規定はないものとする。
【0023】
(
図3、
図4)
異常検知システム1は、ユーザに対して、異常検知に用いられるモデルを学習するための時系列の訓練データ(学習データ)の範囲を定める窓幅の推奨値を提示する機能を有する。このユーザに提示する窓幅決定のフローを、
図3のフローチャートに沿いながら、
図4のデータ区間の選択画面を用いて説明する。なお、
図4の画面はユーザが入力操作可能であるものとする。
【0024】
まず、ユーザは、異常検知において用いられるモデルを教師無し学習により学習するための時系列の訓練データを、時系列データ管理テーブル2に格納されているデータから選択する(S1)。具体的には、
図4のデータ選択欄401において、ユーザは対象とする時系列データのファイルパスを入力する。なお、訓練データはファイル形式で読み取るだけでなく、データベースに記録された時系列データに対し、対象とする時間区間に対応するカラムを指定することで読み取るようにしてもよい。
【0025】
次に、表示処理部3は、データ選択欄401において選択された訓練データについての時間波形を、データ表示部402に表示する(S2)。ユーザは、データ表示部402に表示された時間波形を参考にして、入力部403において窓幅の基準値を入力する(S3)。入力部403では、ユーザは値入力部4031に値を入力し、プルダウン4032でその値の単位を選択することで、窓幅の基準値を決定できる。
【0026】
入力部403でユーザが設定する窓幅の基準値は、訓練データに内在する時間変動の長さよりも十分大きくなるような値とする。この十分大きくなるような値を取るという意味について説明する。例えば、データ表示部402に示す選択された訓練データの波形(電流、加速度)について、最初は一定値で推移しているが、その後波形が振動して上がっているデータとなっている。この波形が振動して上がっている部分の時間、つまり波形の変化が入るような時刻の長さをユーザが視認して、その時刻の長さが範囲内になるように、ユーザが入力部403で窓幅の基準値を設定する。
【0027】
具体的には、データ表示部402において、4つの時系列グラフは、おおよそ時刻10:24:20から10:24:40までの20秒間にグラフの変化が大きく表れているが、この20秒間が確実に範囲内になるように多めに見て30秒を窓幅の基準値として、ユーザが入力部403で値を入力する。
【0028】
ユーザが表示部4の画面上で入力部403において窓幅の基準値を設定すると、分析部5は、入力部403において入力された窓幅の基準値を表示処理部3から取得し、複数の窓幅の候補値を生成する。この生成された複数の窓幅の候補値に対して、分析部5が回帰分析を行うことで、後述の
図5のようにユーザに窓幅の推奨値を表示することができる。この回帰分析の実施は、前述した前処理のプロセスにあたる。
【0029】
窓幅の推奨値を求めるための分析部5での回帰分析について説明する。分析部5は、生成された一連のK個の窓幅の候補値τ∈{τ1、τ2、…、τK}の各候補値に対して、回帰分析を行う(S4)。なお、入力部403でユーザに入力された窓幅の基準値をτ0、窓幅の候補値をτ∈{τ1、τ2、…、τK}とする。また、候補値τ(の大小関係)は、τ0>τ1>τ2>…>τKを満たす値とする。また、K=10、τK=τ0/100として、τ0、τ1、τ2…、τKが対数的に等間隔になるように、十分多い窓幅の候補値を取る。
【0030】
回帰分析は、最初にベクトル化(後述の式(1)の計算)することを行う。何らか時系列データのうち、時刻に対応する離散的な時点tで取られた値ytというものがあり、かつ窓幅τが与えられたとして、時刻tからτだけ(τ-1遅らせたデータを含めて)あるベクトルを生成する。つまり、時刻tから過去のデータを並べたようなベクトルを生成するという意味をもつ操作になる。このように、分析部5では、窓幅の基準値を含む複数の窓幅の候補値について、生成されたベクトルのもとで、時刻tから次の時刻t+1のデータを予測するような訓練データの線形回帰モデル(後述の式(2)の計算)を構築する。
【0031】
具体的に説明する。まず、分析部5は、窓幅τのもとで、時系列の訓練データを次の式(1)によりベクトルへ変換する。なお、このベクトル変換は、統計解析や機械学習分野では滑走窓、力学系分野では遅れ座標系と呼ばれる一般的なベクトル変換である。また、時系列データにおいて、時点tでの訓練データの値をyt∈RM(t=0、…N-1)とする。ただし、Mは訓練データの次元であり、本実施形態においてはM=4である。
【0032】
【0033】
次に、分析部5は、時点t=τ-1、τ、…、N-1のデータXt
(τ)を用いて、最小二乗法あるいは最尤法により、以下の式(2)に示す線形回帰モデルを学習(構築)する。
【0034】
【0035】
ここで、Aτ∈RMτ×Mτは、1時点先の予測のための行列である。Aτは、固有値分解可能であるとすると、Aτの固有値λ1
(τ)、λ2
(τ)、…λτ
(t)∈C(ただし重複を許す)を用いて、訓練データに内在する時間スケール(変動の時定数や周期)を表すことができる。この時間スケールが、分析部5で生成された複数の窓幅の候補値に対して訓練データの時間的特徴をそれぞれ表す複数の特徴量としてユーザの表示に用いられる。
【0036】
具体的には、各次数p=1、2…τに対して、Re[lnλp
(τ)/Δt](次数pでの固有値λp
(τ)の自然対数を訓練データの時間間隔Δtで割った値の実数部)は単位時間あたりの発散ないし減衰の度合いを、Im[lnλp
(τ)/Δt](次数pでの固有値λp
(τ)の自然対数を訓練データの時間間隔Δtで割った値の虚数部)は単位時間あたりの振動の速さ(周波数)を表す。よって、窓幅τでの固有値λp
(τ)が窓幅基準値τ0のもとでの値に近ければ、窓幅τ0のもとで学習できる長周期の振動やトレンド成分を、窓幅τのもとでも学習できることを意味する。
【0037】
また、線形回帰モデルのAτは、窓幅分の次元の、次元×次元の正方行列をもつような、正方の要素を持つような行列になっている。これにより、何らか時系列の特徴、例えば窓幅がありその一時刻先の窓幅のデータを予測するような式として式(2)が機能している。つまり、式(2)を用いることで、時系列自体がどうずれているかというのがわかり、式(2)は、時系列異常を判断するのに適した回帰モデルとして機能している。
【0038】
なお、式(2)の線形回帰モデルについて上述したが、式(2)は非線形回帰モデルであってもよい。つまり、式(1)に示したxt
(τ)というベクトルを例えばニューラルネットワークで別のベクトルに変換した上で、変換したベクトル同士で線形回帰モデルを構築できるため、一段ニューラルネットワークの処理を行うことで、同様の処理ができる。
【0039】
以上を踏まえ、分析部5は、λp
(τ)とλp
(τ0)の間の差分から成る目的関数が最小となる際の窓幅τ=τ*を、ユーザに示す窓幅の推奨値として算出する。これが窓幅の推奨値を示す際の最適化問題を解くプロセスである。なお、目的関数f(τ)は、例えば以下の式(3)で表される。
【0040】
【0041】
式(3)を導入する理由を説明する。予測モデル(線形回帰モデル)を立てるときに窓幅τに依存しているが、異常検知の判断を別にして、窓幅が長ければ長いほど予測が正確にできる。そのため、一番長い基準窓幅τ0の下で、固有値λp
(τ)が、それぞれ窓幅の固有値(特徴量)について、基準窓幅τ0よりも短い窓幅で再現できていれば、訓練データに含まれる長周期の振動やトレンド成分を正しく学習できる。よって、基準値τ0の下での固有値(第1特徴量)とそれ以外の窓幅τとの固有値(第2特徴量)との差分を取って、式(3)を用いてそれが小さくなるように学習すれば、正しく適切な長さの窓幅で学習できる。
【0042】
つまり、窓幅決定の問題に線形回帰モデルの式(2)を用いて、それぞれの固有値の差分に基づいて最適化問題を解くために式(3)を用いることで、窓幅の推奨値を抽出してユーザに表示できる。
【0043】
式(3)について具体的に説明する。fd(τ)={Σp∈p|λp
(τ)-λp
(τ0)|2}1/2は、窓幅τのもとでの固有値と、窓幅τ0のもとでの値との間の距離である。インデックスpの集合p⊆{1、2、…、τ}は、固有値を絶対値などでソートすることにより定められる。本実施形態では、振動成分を抽出するため、固有値の虚部が正のもののうち、絶対値の大きい順に3つのインデックスを抽出およびソートし、集合Pとする。
【0044】
また、fr(τ)=τ0/τは、窓幅τが必要以上に長くなる(すなわちτ0に近づく)ことを防止するための項である。上の式では、窓幅τが長くなりすぎないように、2つの項のオーダーをそろえるため、fr(τ)に係数としてパラメータεを乗じている。
【0045】
このパラメータεは、データを機械学習でサンプリングする一種の手法であるブートストラップ法を用いて固有値のばらつきを求め、それを基に定められている。ブートストラップ法は、例えば、データの母集団の分散を推定したいがその分布の関数がわからなくてデータから推定しなければいけなかったりする場合に、学習するデータをサンプリング(適宜標本抽出)しながら変えていき、平均することでパラメータ推定できる役割を持つ。
【0046】
εの決定は、例えば、基準窓幅τ0のもとでのデータセット{(xt
(τ0)、xt+1
(τ0))|t=τー1、τ、・・・Nー2}に対して、復元抽出を行うことで複数個のデータセットを作成する。そして、そのデータセットそれぞれを用いて固有値λp
(τ0)(p∈P)を学習させる。それぞれ算出したデータセットによる固有値のバラツキ、つまり、それらの分散のp∈Pに関する平均を出すことで、εが決まる。
【0047】
なお、上記の回帰分析は、分析部5では線形回帰モデルを学習するものとしていたが、ニューラルネットワークやカーネル法を用いた非線形回帰モデルを学習する場合においても、Aτに相当する行列が存在すれば、同様の処理が可能である。
【0048】
以上の分析部5による回帰分析の結果を表示処理部3が処理し、表示部4がその処理結果を後述の
図5に示す窓幅算出結果表示部501として表示する(S5)。
【0049】
(
図5)
図5はデータの前処理を行った結果を表している。窓幅算出結果表示部501には、窓幅の候補値501aが二次元グラフ上に図示されている。具体的には、各窓幅τに対して、横軸には動特性再現誤差を意味するf
d(τ)/√(ε)、縦軸には相対データ量を意味するf
r(τ)として、窓幅の候補値501aが複数プロットされている。窓幅の候補値501aの中で、窓幅の推奨値は★マークで示されている窓幅推奨値501bである。
【0050】
前述の式(3)が小さくなるようになると適切な窓幅推奨値になる(対応する窓幅τの目的関数f(τ)の値が小さい)が、このグラフ上では窓幅の候補値501aの点が左下に向かうほど適切な窓幅となる。さらに、式(3)で求めた推奨値τ*のもとで、式(3)を変形して得られる下記の式(4)を用いて、動特性再現誤差と相対データ量の間のトレードオフを示す曲線であるトレードオフ曲線501cを、窓幅算出結果表示部501のグラフ上に描画する。なお下記の式(4)において、X、Yはそれぞれグラフの横軸および縦軸の座標を表す。
【0051】
【0052】
トレードオフ曲線501cは最小化している評価関数であるため、トレードオフ曲線501c上に表示される窓幅の候補値は、すべて推奨値となる(本発明では窓幅の推奨値501bを一点だけ表示)。このようにすることで、窓幅算出結果表示部501に表示された二次元グラフを参照することで、ユーザは窓幅の推奨値がどのようなトレードオフのもとで算出されたかを把握することができる。
【0053】
さらに、表示処理部3は、各窓幅で学習可能な成分の時間スケール(時間量)を、ユーザに示す機能を有している。これについて説明する。まず、窓幅算出結果表示部501において、二次元グラフ上の各点をクリックすることにより、プロパティとして回帰分析結果表示部5011が表示されることにより、対応する窓幅での回帰分析の詳細を確認することができる。回帰分析結果表示部5011には、動特性再現誤差、相対データ量に加えて、選択した窓幅での学習可能な固有周期τp
(τ)=Im[lnλp
(τ)/Δt]を示している(5s,14.5s,19.5s)。固有周期とは窓幅のもとでの固有値であり、固有値とは訓練データに内在する時間スケールを表示する特徴量である。
【0054】
固有周期の窓幅依存性表示部502では、窓幅算出結果表示部501が、物理的にどのような意味をもつかを示すための画面である。固有周期の窓幅依存性表示部502では、縦軸を固有周期τp
(τ)、横軸を窓幅τとした折れ線グラフを示す。ここでは固有値(固有周期)の上位3つ(5s,14.5s,19.5s)を抽出して、上位3つの固有周期が窓幅ごとによってどう変化するのかを表示している。
【0055】
これにより、窓幅の値を変化させた際の固有周期への影響を可視化することができ、ユーザが学習に用いる窓幅を最終的に決定する際の判断材料を提供することができる。言い換えれば、窓幅算出結果表示部501に示した別の窓幅の結果と照らし合わせながら、固有周期の窓幅依存性表示部502で窓幅の推奨値の妥当性を確認できる。
【0056】
(
図6、
図7)
学習推論部6は、
図4で設定された窓幅のもとで、滑走窓ないし短時間フーリエ変換などを行い、時系列データから特徴量を生成し、この特徴量を用いて機械学習モデルを学習する(教師無し学習を行う)機能部である。学習推論部6の機能について、
図6のフローチャートと
図7の推論結果の表示画面を用いて説明する。
【0057】
なお、機械学習モデルは、公知の機械学習モデル(アルゴリズム)であればよく、k近傍法、クラスタリング、線形回帰、オートエンコーダなどの周知の手法を用いることで実現できる。
【0058】
学習推論部6は、ユーザに決定された窓幅に応じた訓練データ(以後参照データ)を用いて、訓練データと異なる時系列データ(以後、テストデータ)を機械学習モデルに入力し教師無し学習を行うとともに、学習済みのモデルを用いた推論を行う(S11)。そして、その結果を表示処理部3が処理し、表示部4がこれを
図7のように表示する(S12)。このようにすることで、推論結果を固有周期τ
p
(τ)の観点からユーザに解釈を与えている。
【0059】
図7の推論結果表示部701では、推論により得られた異常スコアの時間波形7011とその閾値7012が表示されている。ここでは、異常スコアの時間波形7011が閾値7012を超えている場合は、対象設備7に異常が起きているということを示している。
【0060】
また、推論結果表示部701では、対象設備7の異常の詳細を表すため、電流♯1、電流♯2、加速度♯1、加速度♯2の各テストデータの時間波形7013と、機械学習モデルの基準となるような参照データの波形7014とが、異常スコアの時間波形7011と並べて表示されている。なお、参照データとは、機械学習モデルがテストデータとの間の距離を計算する際の基準とするデータであり、例えば、k近傍法であればテストデータの近傍、線形回帰モデルであれば予測結果に相当する。
【0061】
このように、電流♯1、電流♯2、加速度♯1、加速度♯2といった複数種類の変量について、テストデータと参照データの時間波形7013,7014が推論結果表示部701に並べて表示されることで、ユーザは、異常が生じた際のテストデータの波形7013と参照データの波形7014の間のずれを、視覚的に確認することができる。
【0062】
さらに、学習推論部6は、テストデータ、参照データ、学習および推論に用いた窓幅τならびに対応する固有値λp
(τ)を分析部5に送り、分析部5に推論結果の解釈を依頼する(S13)。
【0063】
学習推論部6が分析部5に依頼する解釈の具体的な処理について説明する。時点tにおいて、テストデータおよび参照データを窓幅τで遅れ座標変換したものをそれぞれxt
(τ)、x~
t
(τ)とする。このとき、分析部5は、各固有値λp
(τ)(p∈P)に対してz変換を行う。z変換の式は下記の式(5)の通りである。
【0064】
【0065】
式(5)は、テストデータおよび参照データにおける、固有値λp
(τ)に対応する発散成分、減衰成分、ないし振動成分の寄与度を表す。このように、分析部5は、参照データと、テストデータとに対し、複数の特徴量のそれぞれに関する寄与度を算出する。式(5)で算出された固有周期ごとの寄与度を踏まえて、表示処理部3は、固有周期Tp
(τ)毎にテストデータのz変換Xp
(τ)と(テストデータに対する寄与度)、参照データのz変換X~
p
(τ)と(訓練データに対する寄与度)を、推論結果解釈表示部702に並べて表示する(S14)。
【0066】
推論結果解釈表示部702に並べて表示される、5s,14.5s,19.5sという固有周期は、前述した窓幅の推奨値が決定されたときに得られた周期であり、その窓幅での特徴的な時間のスケールを表している。推論結果解釈表示部702では、3つの代表的な固有周期ごとに時系列データを分解して表示している。
【0067】
推論結果解釈表示部702には、推論時の結果であるテストデータ、モデル構築時の結果である参照データに対する寄与度の2つの棒グラフが、固有周期ごとに並べて表示されている。これを見ると、固有周期5sでは2つの棒グラフの寄与度が同程度、固有周期19.5sでも2つの棒グラフの寄与度が同程度であるが、固有周期14.5sのみ2つの棒グラフで寄与度が異なっており、強調表示されている。これによれば、テストデータと参照データが14.5sの変化の幅で波形がずれていることがわかる。
【0068】
ユーザは、推論結果解釈表示部702の結果を見て、Xp
(τ)とX~
p
(τ)の差が大きい場合、異常現象がどの程度の長さの時間で現れるか(すなわち異常の時間スケール)を、固有周期として確かめることができる。
【0069】
つまり、推論結果表示部701に示したテストデータの波形7013と参照データの波形7014とのそれぞれの波形のズレを特徴付けることで、対象設備7の異常の現象がどの程度の長さで現れるか、視認して確かめることができる。
【0070】
なお、上述の実施の形態においては、学習推論部6は、教師無し異常検知を行う場合について述べたが、本発明はこれに限らず、クラスタリングや要因分析といった様々な教師無し学習を行うようにしても良い。
【0071】
以上、本発明の異常検知システム1(教師無し学習システム)が備える時系列データの情報処理装置10は、対象設備7の計測値から成る多変量時系列データが利用でき、かつ窓幅決定のための教師無し学習モデルのテストや統計処理が不要である。また、時系列データに内在する動特性を再現し明らかにしつつ、対象設備7の事前情報を用いずに目的に沿った窓幅の値を決定して、対象設備7の動特性の経時変化を検知できる。また、異常検知の精度に関わる機械学習モデルの性能を維持しつつ、かつ窓幅決定のプロセス(学習時間・実行時間)を削減し、異常検知結果をユーザに視覚化させることができる。
【0072】
また、窓幅の値が教師無し学習モデルに与える影響を解析し、物理量として可視化することで、機械学習モデルの構築前に窓幅の値の妥当性を確認できるような解釈を与えることができ、ユーザの窓幅決定を支援できる。
【0073】
また、このような対処設備7の異常に関する予兆診断システムを用いることで、例えば顧客に異常のレポートを提示するときの内容として表示画面の内容を用いることができる。また顧客側の視点からでは、異常が出ている長さがわかることで設備担当者が機械設備の異常箇所が判断できるというような、異常検知箇所の支援を促すことができる。
【0074】
以上説明した本発明の一実施形態によれば、以下の作用効果を奏する。
【0075】
(1)時系列データの情報処理装置10は、対象設備7の異常を監視する異常検知において用いられるモデルを教師無し学習により学習するための時系列の訓練データに対して、モデルの学習に使用される訓練データの範囲を定める窓幅の決定を支援する。時系列データの情報処理装置10は、演算部と、メモリとを備えている。演算部は、複数の窓幅の候補値と、複数の候補値に対する訓練データの時間的特徴をそれぞれ表す複数の特徴量と、を算出する分析部5と、分析部5により算出された複数の候補値と複数の特徴量との対応関係とを、ユーザに表示する表示処理部3と、を実行する。このようにしたことで、ユーザに対して、異常検知に使用する学習モデルにおいての窓幅決定を支援する時系列データの情報処理装置10を提供できる。
【0076】
(2)表示処理部3は、窓幅の基準値をユーザに選択させる表示画面を表示し、分析部5は、表示画面でユーザに選択された基準値に基づいて複数の候補値を算出する。このようにしたことで、回帰分析の実施を行いユーザに窓幅の推奨値を提案できる。
【0077】
(3)分析部5は、基準値を含む複数の候補値について、訓練データの回帰モデルをそれぞれ構築し、基準値について構築された回帰モデルから生成される第1特徴量と、基準値を除いた複数の候補値について構築された回帰モデルからそれぞれ生成される第2特徴量と、の差分から成る目的関数を算出し、複数の候補値の中で目的関数を最小化するものを窓幅の推奨値として抽出することで、窓幅の推奨値を算出する。このようにしたことで、ユーザに対して窓幅の推奨値を提案できる。
【0078】
(4)特徴量は、回帰モデルの固有値である。分析部5は、複数の候補値のそれぞれについて、差分と、基準値と窓幅の候補値との比から成る目的関数と、を最小化する。表示処理部3は、複数の候補値のそれぞれについて、差分と、差分と基準値に対する比とを二次元グラフ上に表示する。このようにしたことで、ユーザに対して窓幅の推奨値を表示し、視認させることができる。
【0079】
(5)表示処理部3は、窓幅の変化に対する特徴量の変化を表示する。このようにしたことで、ユーザに対して窓幅の推奨値が物理的にどのような意味をもつかを示すことができる。
【0080】
(6)分析部5は、訓練データと、訓練データと異なる時系列データであるテストデータとに対し、複数の特徴量のそれぞれに関する寄与度を算出する。表示処理部3は、訓練データに対する寄与度と、テストデータに対する寄与度とを並べて表示し、2つの寄与度の差が大きい場合、対応する特徴量を強調して表示する。このようにしたことで、対象設備7の異常の現象がどの程度の長さで現れるか、視認して確かめることができる。
【0081】
(7)時系列データの情報処理装置10は、ユーザに決定された窓幅に応じた訓練データを用いて、モデルの教師無し学習を行うとともに、学習済みのモデルを用いた推論を行う学習推論部6を備える。このようにしたことで、対象設備7の異常について、ユーザに対して解釈を提示し、判断の支援を行うことができる。
【0082】
(8)本発明の時系列データの情報処理装置10は、学習済みのモデルを用いて異常検知を行う。このようにしたことで、対象設備7の異常検知に、本発明の時系列データの情報処理装置10を適用できる。
【0083】
なお、本発明は上記の実施形態に限定されるものではなく、その要旨を逸脱しない範囲内で様々な変形や他の構成を組み合わせることができる。また本発明は、上記の実施形態で説明した全ての構成を備えるものに限定されず、その構成の一部を削除したものも含まれる。
【符号の説明】
【0084】
1……教師無し学習システム(異常検知システム)、2……時系列データ管理テーブル、3……表示処理部、4……表示部、5……分析部、6……学習推論部、7……対象設備、情報処理装置……10