(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022061942
(43)【公開日】2022-04-19
(54)【発明の名称】異常推定方法、異常推定装置、異常推定システム
(51)【国際特許分類】
G06N 20/00 20190101AFI20220412BHJP
【FI】
G06N20/00 160
【審査請求】未請求
【請求項の数】13
【出願形態】OL
(21)【出願番号】P 2021113814
(22)【出願日】2021-07-08
(31)【優先権主張番号】P 2020170146
(32)【優先日】2020-10-07
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】516118109
【氏名又は名称】株式会社デバイス&システム・プラットフォーム開発センター
(74)【代理人】
【識別番号】100107928
【弁理士】
【氏名又は名称】井上 正則
(74)【代理人】
【識別番号】100101856
【弁理士】
【氏名又は名称】赤澤 日出夫
(72)【発明者】
【氏名】勝村 英則
(72)【発明者】
【氏名】小野 大騎
(57)【要約】
【課題】教師なし機械学習により装置の異常を推定可能な技術を提供することにある。
【解決手段】ステップS1において、作動する装置に取り付けられたセンサが測定した第1測定データを取得し、第1測定データに基づく変分オートエンコーダを用いた機械学習により、センサから新たに取得された第2測定データの第1測定データからの乖離度を、装置の状態異常の指標となる異常スコアとして潜在空間の分布中心からの距離尺度に基づいて算出する推定モデルを生成し、ステップS2において、推定モデル生成後にセンサが測定した第2測定データを取得し、取得された第2測定データと推定モデルとに基づいて前記異常スコアを算出すると共に、当該算出において、潜在空間における次元に関し、次元毎の相関に起因する異常スコアの増大を抑制するための補正を行った。
【選択図】
図7
【特許請求の範囲】
【請求項1】
作動する装置に取り付けられたセンサが測定した第1測定データを取得し、
前記第1測定データに基づく変分オートエンコーダを用いた機械学習により、前記センサから新たに取得された第2測定データの前記第1測定データからの乖離度を、前記装置の状態異常の指標となる異常スコアとして潜在空間の分布中心からの距離尺度に基づいて算出する推定モデルを生成し、
前記推定モデル生成後に前記センサが測定した前記第2測定データを取得し、
取得された前記第2測定データと前記推定モデルとに基づいて前記異常スコアを算出すると共に、該算出において、潜在空間における次元に関し、次元毎の相関に起因する異常スコアの増大を抑制するための補正を行う
ことを特徴とする異常推定方法。
【請求項2】
D次元の潜在空間に対して、前記第2測定データの次元数をNとした場合の潜在空間における次元i、次元jに対応する基底関数f
i、f
jの相互相関関数の式
【数1】
に基づいて、次元数補正値D
cmpsを
【数2】
として求め、該次元数補正値D
cmpsを潜在空間における次元に関する補正時に用いる
ことを特徴とする請求項1記載の異常推定方法。
【請求項3】
D次元の潜在空間における次元iの値をx
i、該潜在空間の分布での次元iの平均をx
i
-、該分布での次元iの標準偏差をσ
iとした場合の前記異常スコアVDは、
【数3】
として算出される
ことを特徴とする請求項2記載の異常推定方法。
【請求項4】
D次元の潜在空間における次元iの値をx
i、該潜在空間の分布での次元iの中央値をm
i
-、該分布での次元iの前記中央値に対する標準偏差をs
iとした場合の前記異常スコアVDは、
【数4】
として算出される
ことを特徴とする請求項2記載の異常推定方法。
【請求項5】
潜在空間の分布の相関に関する標本相関係数をr
i,j、次元数をDとした場合の次元数指標D
corrを、
【数5】
または
【数6】
として求め、次元数を該次元数指標D
corrにより除した値に基づいて、前記異常スコアの算出に用いる潜在空間の次元数を決定する
ことを特徴とする請求項1~請求項4のいずれか一項記載の異常推定方法。
【請求項6】
潜在空間の分布上の各サンプルのx
i軸での値をx
i(m)、x
i(m)の平均値をx
i
-、該分布上の各サンプルのx
j軸での値をx
j(m)、x
j(m)の平均値をx
j
-、サンプル数をMとした場合、前記標本相関係数r
i,jは、
【数7】
として算出される
ことを特徴とする請求項5記載の異常推定方法。
【請求項7】
潜在空間の分布上の各サンプルのx
i軸での値をx
i(m)、x
i(m)の中央値をm
i
-、該分布上の各サンプルのx
j軸での値をx
j(m)、x
j(m)の中央値をm
j
-、サンプル数をMとした場合、前記標本相関係数r
i,jは、
【数8】
として算出される
ことを特徴とする請求項5記載の異常推定方法。
【請求項8】
前記センサを有する測定装置が、前記第1測定データを取得し、該第1測定データを学習装置へ送信し、
前記学習装置が、前記第1測定データに基づく変分オートエンコーダを用いた機械学習により、前記推定モデルを生成して前記測定装置へ送信し、
前記測定装置が、前記推定モデルを取得した後、前記センサが測定した前記第2測定データを取得し、該第2測定データと前記推定モデルとに基づいて前記異常スコアを算出する
ことを特徴とする請求項1~請求項7のいずれか一項記載の異常推定方法。
【請求項9】
前記測定装置は、算出した前記異常スコア及び前記潜在変数を、前記推定モデルを有し、前記潜在変数から前記第2測定データを復元可能な装置へ送信する
ことを特徴とする請求項8記載の異常推定方法。
【請求項10】
前記第1および第2測定データは、前記センサにより前記装置に関する振動、超音波、音、電流、電圧、圧力、流量の少なくとも1つ以上が測定されることにより取得される
ことを特徴とする請求項1~請求項9のいずれか一項に記載の異常推定方法。
【請求項11】
前記第1および第2測定データは、周波数スペクトルである
ことを特徴とする請求項10記載の異常推定方法。
【請求項12】
作動する装置に取り付けられたセンサと、
前記センサが測定した複数の第1測定データを取得する第1取得部と、
前記第1測定データに基づく変分オートエンコーダを用いた機械学習により、前記センサから新たに取得された第2測定データの前記第1測定データからの乖離度を、前記装置の状態異常の指標となる異常スコアとして潜在空間の分布中心からの距離尺度に基づいて算出する推定モデルを格納する記憶部と、
前記センサが測定した前記第2測定データを取得する第2取得部と、
取得された前記第2測定データと前記推定モデルとに基づいて前記異常スコアを算出すると共に、該算出において、潜在空間における次元に関し、次元毎の相関に起因する異常スコアの増大を抑制するための補正を行うスコア算出部と
を備えることを特徴とする異常推定装置。
【請求項13】
作動する装置に取り付けられたセンサを有する測定装置と、
前記測定装置と通信可能な学習装置と
を備え、
前記測定装置は、
前記センサが測定した第1測定データを取得する第1取得部と、
取得された前記第1測定データを前記学習装置へ送信する第1送信部と、
前記第1測定データに基づく変分オートエンコーダを用いた機械学習により、前記センサから新たに取得された第2測定データの前記第1測定データからの乖離度を、前記装置の状態異常の指標となる異常スコアとして潜在空間の分布中心からの距離尺度に基づいて算出する推定モデルを前記学習装置から取得するモデル取得部と、
前記センサが測定した前記第2測定データを取得する第2取得部と、
取得された前記第2測定データと前記推定モデルとに基づいて前記異常スコアを算出すると共に、該算出において、潜在空間における次元に関し、次元毎の相関に起因する異常スコアの増大を抑制するための補正を行うスコア算出部と
を備え、
前記学習装置は、
前記測定装置から前記第1測定データを取得する第3取得部と、
前記第1測定データに基づく変分オートエンコーダを用いた機械学習により、前記推定モデルを生成するモデル生成部と、
前記推定モデルを前記測定装置に送信するモデル送信部と
を備える
ことを特徴とする異常推定システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の実施形態は、装置の異常を推定する技術に関する。
【背景技術】
【0002】
従来、稼働中にあるモータ等の各種装置の異常を推定する技術として、当該装置に取り付けたセンサから得られる音や振動等の測定データを用いた機械学習により推定モデルを生成し、以降に取得される測定データから当該推定モデルにより異常を推定する手法がある。この手法は、測定データとして正常時のものと異常時のものとを用意し、これらを教師データとして用いた教師ありの機械学習によりニューラルネットワークを構築することで推定モデルを生成している。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
発明が解決しようとする課題は、教師なし機械学習により装置の異常を推定可能な技術を提供することにある。
【課題を解決するための手段】
【0005】
上述した課題を解決するため、本発明の実施形態は、作動する装置に取り付けられたセンサが測定した第1測定データを取得し、前記第1測定データに基づく変分オートエンコーダを用いた機械学習により、前記センサから新たに取得された第2測定データの前記第1測定データからの乖離度を、前記装置の状態異常の指標となる異常スコアとして算出する推定モデルを生成し、前記推定モデル生成後に前記センサが測定した前記第2測定データを取得し、取得された前記第2測定データと前記推定モデルとに基づいて前記異常スコアを算出することを特徴とする。
【図面の簡単な説明】
【0006】
【
図1】第1の実施形態に係る異常推定システムの全体構成を示す概略図である。
【
図2】第1の実施形態に係る測定装置のハードウェア構成を示すブロック図である。
【
図3】第1の実施形態に係る学習装置のハードウェア構成を示すブロック図である。
【
図4】第1の実施形態に係る測定装置の機能構成を示すブロック図である。
【
図5】第1の実施形態に係る学習装置の機能構成を示すブロック図である。
【
図6】第1の実施形態に係る推定モデルを構築するニューラルネットワークを示す概念図である。
【
図7】第1の実施形態に係る異常推定方法を示すフローチャートである。
【
図8】第1の実施形態に係る学習処理を示すフローチャートである。
【
図9】第1の実施形態に係るスコア算出判定処理を示すフローチャートである。
【
図10】実施例1に係るホワイトノイズを含む高調波の試験データを示す図である。
【
図11】実施例1に係る試験データのピーク及びRMS(二乗平均平方根)を示す図である。
【
図12】実施例1に係る試験データのクレストファクタ及びエンベロープ・クレストファクタを示す図である。
【
図13】実施例1に係る試験データの異常スコアを示す図である。
【
図14】実施例1に係る周波数を変化させた試験データのピーク及びRMSを示す図である。
【
図15】実施例1に係る周波数を変化させた試験データのクレストファクタ及びエンベロープ・クレストファクタを示す図である。
【
図16】実施例1に係る周波数を変化させた試験データの異常スコアを示す図である。
【
図17】実施例2に係る潜在空間を1次元として次元数補正値D
cmpsを用いずに算出した異常スコアを示す図である。
【
図18】実施例2に係る潜在空間を2次元として次元数補正値D
cmpsを用いずに算出した異常スコアを示す図である。
【
図19】実施例2に係る潜在空間を3次元として次元数補正値D
cmpsを用いずに算出した異常スコアを示す図である。
【
図20】実施例2に係る潜在空間を1次元として次元数補正値D
cmpsを用いて算出した異常スコアを示す図である。
【
図21】実施例2に係る潜在空間を2次元として次元数補正値D
cmpsを用いて算出した異常スコアを示す図である。
【
図22】実施例2に係る潜在空間を3次元として次元数補正値D
cmpsを用いて算出した異常スコアを示す図である。
【
図23】第1の実施形態の変形例1に係る異常推定システムの全体構成を示す概略図である。
【
図24】第1の実施形態の変形例2に係る異常推定システムの全体構成を示す概略図である。
【
図25】第2の実施形態に係る潜在変数の分布の偏りを説明するための図である。
【
図26】第2の実施形態に係る潜在変数の分布における中央値m
iを説明するための図である。
【
図27】実施例3に係る潜在変数の分布の偏りが生じる状況における試験データに対して、偏り補正を適用せずに算出した異常スコアを示す図である。
【
図28】実施例3に係る潜在変数の分布の偏りが生じる状況における試験データに対して、偏り補正を適用して算出した異常スコアを示す図である。
【
図29】第3の実施形態に係る次元数算出処理を示すフローチャートである。
【
図30】実施例4に係る潜在空間の次元数を2次元~20次元とした場合の各D/D
corrの値をそれぞれ示す図である。
【
図31】実施例4に係る潜在空間の次元数を2次元~7次元とした場合のそれぞれの試験データの異常スコアを示す図である。
【発明を実施するための形態】
【0007】
以下、本発明の実施形態について図面を参照しつつ説明する。なお、本明細書及び図面において、実質的に同一の機能を有する構成要素については、同一の符号を付することにより重複説明を省略する。
【0008】
<第1の実施形態>
(全体構成)
本実施形態に係る異常推定システムの全体構成について説明する。
図1は、本実施形態に係る異常推定システムの全体構成を示す概略図である。
【0009】
本実施形態に係る異常推定システム1は、装置異常の推定対象をモータMとし、当該モータMの振動をセンサにより測定し、教師なし機械学習により生成された推定モデル(AIモデル)に測定データを入力することでモータMの装置異常を推定するものである。
図1に示されるように、異常推定システム1は、測定装置10と、学習装置20と、ゲートウェイ30とを備える。
【0010】
測定装置10は、後述するセンサ16(
図2参照)を有し、モータMに取り付けられてセンサ16によりモータM作動時における振動を測定し、測定結果である測定データから、推定モデルを生成するための学習データを生成する。また、測定装置10は、測定データに基づく異常スコアの算出を行う。異常スコアは、モータMの故障等の装置異常を推定するための指標となるものであり、推定モデルを用いて算出される。測定装置10は、ゲートウェイ30を介して無線通信可能に学習装置20に接続されており、学習データや異常スコア等を学習装置20に送信する。以上に説明した推定モデルや異常スコアについての詳細は後述する。
【0011】
学習装置20は、ゲートウェイ30を介して測定装置10から取得した学習データに基づく機械学習により推定モデルを生成し、測定装置10へ送信する。また、学習装置20は、測定装置10から送信される異常スコア等を取得し、異常スコアに基づく異常有無の判定等を行う、
【0012】
(ハードウェア構成)
測定装置10及び学習装置20のハードウェア構成について説明する。先ず、測定装置10のハードウェア構成について
図2を参照して説明する。
図2は測定装置のハードウェア構成を示すブロック図である。
【0013】
図2に示されるように測定装置10は、ハードウェアとして、CPU(Central Processing Unit)11、RAM(Random Access Memory)12、記憶装置13、電池14、無線通信I/F(Interface)15、センサ16、入力I/F17を備える。
【0014】
CPU11及びRAM12は協働して後述する各種機能を実行し、記憶装置13は各種機能により実行される処理に用いられる各種データを記憶する。ここで記憶するデータとしては、推定モデルやそのパラメータが挙げられる。電池14は、測定装置10を駆動する電力を供給する。無線通信I/F15は、ゲートウェイ30を介した学習装置20との無線通信接続を行う。センサ16は、モータMの振動を測定可能な加速度センサ等の所謂振動センサである。入力I/F17は、センサ16により測定された測定データの入力等を行う。
【0015】
本実施形態において測定装置10は、組み込まれた電池14により駆動するものであるため、電力消費を極力抑えることで長時間の稼働を実現することが好ましい。そのため、無線通信I/F15によりなされるゲートウェイ30を介した学習装置20との間の無線通信には、低電力での無線通信が可能な通信技術を用いるとよい。そのような通信技術としてはBLE(Bluetooth Low Energy:Bluetoothは登録商標)やLPWA(Low Power Wide Area)が挙げられる。特に、BLEと比較して広範囲な通信が可能なLPWAは、学習装置20を測定装置10近傍に配置する必要が無いため、より好ましい。
【0016】
次に、学習装置20のハードウェア構成について
図3を参照して説明する。
図3は学習装置のハードウェア構成を示すブロック図である。
【0017】
図3に示されるように学習装置20は、ハードウェアとして、CPU(Central Processing Unit)21、RAM(Random Access Memory)22、記憶装置23、供給部24、無線通信I/F(Interface)25、ディスプレイ26、入出力I/F27を備える。
【0018】
CPU21及びRAM22は協働して後述する各種機能を実行し、記憶装置23は各種機能により実行される処理に用いられる各種データを記憶する。ここで記憶するデータとしては、推定モデルやそのパラメータが挙げられる。供給部24は、インバータ等を有して図示しない商用電源に接続され、学習装置20に対して商用電源からの電力を供給する。無線通信I/F15は、ゲートウェイ30を介した測定装置10との無線通信接続を行う。ディスプレイ26は、後に詳述する推定モデルにより復元された測定データの表示等を行う。入出力I/F27は、ディスプレイ26や、不図示のマウスやキーボード等の入力装置、プリンター等の出力装置等の外部装置とのデータの入出力を行う。
【0019】
(機能構成)
測定装置10及び学習装置20の機能構成について説明する。先ず、測定装置10の機能構成について
図4を参照して説明する。
図4は、測定装置の機能構成を示すブロック図である。
【0020】
図4に示されるように測定装置10は、測定部101と、変換部102と、送受信部103と、算出部104、判定部105とを機能として備える。測定部101は、センサ16によりモータMの振動を一定周期で測定し、その測定データを取得する。ここで取得される測定データは、振動の時間波形となっている。変換部102は、測定データを機械学習用の学習データとするため、または推定モデルに入力する入力データとするため、FFT(Fast Fourier Transform)等により振動の時間波形である測定データを周波数(振幅)スペクトルに変換する。
【0021】
送受信部103は、生成された学習データ、推定モデルにより出力される潜在変数、及び異常スコア等の学習装置20への送信や、当該学習装置20からの推定モデル及びそのパラメータの受信等を行う。算出部104は、入力データと推定モデルとにより異常スコアの算出を行う。判定部105は、測定装置10が実行する処理における各種判定を行う。
【0022】
次に、学習装置20の機能構成について
図5を参照して説明する。
図5は、学習装置の機能構成を示すブロック図である。
【0023】
図5に示されるように学習装置20は、送受信部201と、学習部202と、判定部203と、提示部204とを機能として備える。送受信部201は、測定装置10からの学習データや異常スコア等の受信、生成した推定モデル及びそのパラメータの測定装置10への送信等を行う。
【0024】
学習部202は、学習データに基づく機械学習を行い、推定モデルを生成する。判定部203は、測定装置10から取得する異常スコアに基づいて、モータMが故障等の装置異常状態にあるか否かを判定する等、学習装置20が実行する処理における各種判定を行う。提示部204は、学習装置20のユーザに対して異常スコアの判定結果や推定モデルにより復元された入力データをディスプレイ26等に表示し、その判断を仰ぐ。
【0025】
(推定モデル)
本実施形態に係る推定モデルについて詳細に説明する。
図6は、本実施形態に係る推定モデルを構築するニューラルネットワークを示す概念図である。
図6に示されるように本実施形態に係る推定モデルは、ニューラルネットワーク40として構築される学習器であるエンコーダ41及びデコーダ42を有する変分オートエンコーダ(Variational Autoencoder:以後VAEとも称する)法を用いて生成されるものである。VAEは、教師なしのAI学習モデルであり、エンコーダ41により多次元の入力データを少ない次元数の潜在空間に写像するようにデータ圧縮(符号化)を行い、当該データ圧縮を適切なものとするために、デコーダ42により圧縮されたデータを二乗誤差などの損失関数を最小にして元の多次元のデータ、即ち入力データに復元するものである。
【0026】
本実施形態に係るニューラルネットワーク40は、エンコーダ41が入力層411、中間層412を有し、デコーダ42が出力層421、中間層422を有して構築されており、各層にノード43a~43dが含まれている。入力層411、中間層412、出力層421、及び中間層422の次元は、異常推定対象となる装置の種類や測定データの属性に応じて適宜設定すればよいが、本実施形態においては入力層411及び出力層421を512次元としている。中間層412,422の次元は単位数が少ないほど計算時間が短く、メモリの使用量も少ない。そのため、十分な表現力を示す範囲内で最小の数値を使用することが望ましく、安定した範囲内で十分な余裕を示すことができる16次元とすることが好ましい。
【0027】
潜在空間の次元数は、入力データの独立成分の数に合わせて調整するのが望ましいが、あまりに大きくなると処理時間が長くなりメモリの使用量も多くなる。一方、最小の1次元では変化が検出できない可能性があるが、2次元以上では異常スコアとほぼ同じ時間的変化が得られるため、少なくとも2次元以上であることが好ましく、さらに正確な異常の推定が行える次元数のうちの最小値であることがより好ましい。したがって、本実施形態では、デコーダ42によれば2次元の潜在変数z1,z2で512点のスペクトラムを表現できる。
【0028】
変分オートエンコーダでは、損失関数が最小となるように各層に含まれるノード43a~43d間の経路(シナプス)の重みや、バイアス等のパラメータを学習することとなる。この時、損失関数に、入出力間の再構成誤差に加えて、潜在変数の分布がどれだけ標準正規分布に似ているかの項として、KL(Kullback Leibler)発散項を加えることで、潜在空間内の各潜在変数の分布が標準的な多次元の正規分布となるように学習される。したがって、モータMのテスト時や初期作動時等にセンサ16により取得された測定データ、即ち故障時のデータではないと想定される正規データを学習データとして用いてVAEを十分に学習(訓練)することにより、潜在空間の分布は標準正規分布に近くなる。そのため、学習期間終了後に取得される、モータM異常時を含む可能性のある測定データの、潜在空間分布の位置を多次元偏差で推論することができる。つまりモータMの故障時における測定データは、故障ではないデータの潜在空間分布から大きく乖離することが予想されるため、潜在変数の潜在空間分布中心からの偏差で装置異常の度合いを評価することができる。この度合い、即ち正規データである学習データからの乖離度が異常スコアとなる。
【0029】
その際、変分オートエンコーダでは、
図6に示されるように、中間層412からの出力として、2組の中間変数μ及びσが生成され、それぞれの中間変数σと標準正規分布からランダムに選択したエポックごとに違う値である変数ε~N(0,I)との積に中間変数μが加算されることにより、潜在変数z
1,z
2が算出される。ここでの中間変数μ,σは、測定データの潜在空間内の確率的な位置の平均、分散を示す。このように、変分オートエンコーダでは、推論時における測定データの潜在空間内の確率的な位置の平均μと分散σが算出されるため、以下、異常スコアの算出においては、平均値μを潜在変数の値として用いる(参考非特許文献1)。
【0030】
(参考非特許文献1:Diederik P Kingma and Max Welling, “Auto-Encoding Variational Bayes”, International Conference on Learning Representations, 2014.)
【0031】
(異常スコア)
異常スコアについて詳細に説明する。各潜行次元に対応する入力データのパターン、つまり各潜在変数を決めるスペクトルである各基底関数間に相関がなければ、異常スコアはユークリッド距離(D
cmps=1)として算出できる。しかしながら、一部または全部に相関がある場合、ユークリッド距離の計算では、次元毎に重複して算出されることとなり、結果過大に評価される。本実施形態において異常スコアは、標準偏差を1とすると、潜在空間分布中心からの距離(偏差)として算出されるが、次元数補正値を用いて下記(1)式のように算出することにより、重複による過大評価を平均的に補正するようにしている。
【数1】
【0032】
この(1)式においてVDは異常スコア、Dcmpsは次元数補正値、Dは潜在空間の次元数、xiは各潜在変数の値、xi
-は正規分布での潜在変数の平均、σiは潜在変数の標準偏差である。なお、基底関数に相関関係がある場合は、その次元数に比例してVDの平方根の和の部分が大きくなることとなる。
【0033】
次元数補正値の算出方法について説明する。2次元としての次元i,次元jに対応する基底関数をf
i,f
jとすると、基底関数間の相互相関関数の値(遅延0の値)R(f
i,f
j)は下記(2)式となる。
【数2】
【0034】
この(2)式においてNは、周波数スペクトルに変換された入力データの周波数成分(入力シーケンス)の数であり、したがって本実施形態においては512となる。なお、ここでは基底関数の平均が0、分散が1に正規化されている。
【0035】
各基底関数のいずれかに一致する周波数成分は、この相互相関関数によって全次元に影響を与えることとなる。その結果、潜在空間をD次元とすると、下記(3)式に示される合計値D
cmpsの影響が(1)式の平方根の和の部分に現れることとなる。
【数3】
【0036】
この合計値Dcmpsの影響を補正するため、本実施形態においては異常スコアを計算する際、合計値Dcmpsを次元数補正値と称し、当該次元数補正値で平方根の和の部分を除している。これにより、上述した重複による過大評価を平均的に補正することができる。なお、Dcmpsは全ての基底関数が分布上で直交する場合、即ち相関がない場合は1となり、全ての基底関数に相関がある、即ち同一である場合はDと等しくなる。
【0037】
本実施形態においては、以上に説明した上述した(1)~(3)式が推定モデルに組み込まれており、したがって入力データを推定モデル、具体的にはエンコーダ41に入力することにより、512次元の入力データ(パターン)よりも低次元である2次元の潜在変数と共に、異常スコアが出力されることとなる。
【0038】
次に、ハイパーパラメータ設定を含むVAE(推定モデル)の設定について説明する。学習データを含むVAEへの入力データにはノイズが多い場合が想定される。そのため、前処理として入力データを平均化、即ち平均化された周波数スペクトルを入力することが好ましい。VAEの損失関数は非線形であり、VAEへの入力データは最適な範囲を持っている。そこで入力データ全体を標準正規分布に変換するようにするとよい。なお、入力データのダイナミックレンジが大きい場合には、スペクトルに対して対数圧縮などの非線形圧縮を行った後、標準正規分布への変換処理を行うことが望ましい場合がある。また、入力に対して直線的に変化する異常スコアを得ることが好ましく、そのためには各ノード43a~43dには活性化関数を全て線形に設定することよい。これによりVAE潜在空間の分布は、平均が0、分散が1に近づく。
【0039】
VAEの学習回数(エポック数)は、十分に収束する値であればよいが、実際の収束状態(損失変化)を確認すると、十分に収束する値としては1000回程度とすることが好ましい。バッチサイズは数が少ないほど学習時間は短くなるが、エポック数を大きくすると結果が大きく変動し、安定した結果が得られない可能性がある。そのため、バッチサイズは1とすることが好ましい。
【0040】
(異常推定方法)
本実施形態に係る異常推定システム1において実行される異常推定方法について説明する。
図7は本実施形態に係る異常推定方法を示すフローチャートである。
図7に示されるように、異常推定方法は、主としてVAEを用いた機械学習により推定モデルを生成する学習処理S1が行われ、その後に推定モデルを用いて測定データからモータMの異常スコアを算出し、これを判定するスコア算出判定処理S2が行われる。以下、学習処理とスコア算出判定処理とについて説明する。
【0041】
(学習処理)
学習処理について
図8を参照して詳細に説明する。
図8は、学習処理を示すフローチャートである。なお、学習処理は測定装置10及び学習装置20が協働して実行する処理であり、これはスコア算出判定処理においても同様である。
【0042】
図8に示されるように、先ず測定装置10の測定部101は、センサ16によりモータMの振動を測定し、測定データを取得する(S101)。ここで取得される測定データは、一定のサンプリング周波数(例えば20kHz)で一定の間隔(例えば10分)で取得される。測定データ取得後、変換部102は、取得した測定データの時間波形を変換し、周波数スペクトルとすることにより、推定モデルの学習に用いる入力データである学習データを生成する(S102)。
【0043】
学習データ生成後、判定部104は、学習データ数が予め設定された設定数に達したか否かを判定する(S103)。設定数は、推定モデル生成に十分な学習データの数、例えば数十個などに設定される。
【0044】
学習データ数が設定数に達したと判定された場合(S103,YES)、送受信部103は、学習データを学習装置20へ送信し(S104)、測定装置10は推定モデルを推定装置20から取得するまで待機することとなる(S105)。なお、学習データ数が設定数に達する前に、例えば設定数の1/3収集された段階で学習装置20へ送信するなど、複数に分割して収集された学習データを送信するようにしてもよい。一方、学習データ数が設定数に達していないと判定された場合(S103,NO)、ステップS101へ移行して、次の測定データの取得がなされる。
【0045】
学習データ送信後、学習装置20の送受信部201は、測定装置10から学習データを受信し(S201)、学習部202は設定したエポック数、バッチサイズに基づいて学習データをVAEに入力して訓練することにより、適切なパラメータの学習を行う(S202)。本実施形態においてはエポック数を1000、バッチサイズを1とするため、例えば学習データが50個であるとすると、1つの学習データ毎に1000回の学習がなされることから、計50,000回の学習がなされることとなる。
【0046】
学習後、損失関数が十分に収束するパラメータを学習した推定モデルが生成されることとなり(S203)、当該推定モデルが記憶装置23に格納される。推定モデル生成後、送受信部201は生成した推定モデル、より具体的には用いた変分オートエンコーダのモデルの構成と、学習したパラメータとを測定装置10へ送信する(S204)。
【0047】
推定モデル送信後、測定装置10の送受信部103は、推定モデルを取得し(S106)、これを記憶装置13へ格納して本フローは終了となる。なお、ステップS204にて送信する推定モデルとして変分オートエンコーダのモデルの構成と、学習したパラメータとを測定装置10へ送信すると説明したが、これはモデル構成とパラメータとから推定モデルを構築可能なプログラムを測定装置10が有する場合である。一方、そのようなプログラムを有していない場合は、モデル構成やパラメータを含む推定モデル自体のプログラムをコピーし、これを送信する推定モデルとして測定装置10へ送信するようにしてもよい。
【0048】
(スコア算出判定処理)
スコア算出判定処理について、
図9を参照して詳細に説明する。
図9は、スコア算出判定処理を示すフローチャートである。
図9に示されるように、先ず測定装置10の測定部101は、センサ16によりモータMの振動を測定し、測定データを取得する(S301)。測定データ取得後、変換部102は学習データと同様に当該測定データの時間波形を変換し、周波数スペクトルとすることにより、入力データを生成する(S302)。
【0049】
入力データ生成後、算出部104は、記憶装置13に格納されているモデル情報に含まれる推定モデル及びパラメータを読み出し、これらに基づいて入力データを推定モデルに入力し、異常スコア及び潜在変数を算出する(S303)。異常スコア及び潜在変数算出後、送受信部103は、異常スコア及び潜在変数を異常推定情報として学習装置20へ送信し(S304)、ステップS301へ移行して次周期の測定データを取得する。
【0050】
異常推定情報送信後、学習装置20の送受信部201は、異常推定情報を受信し(S401)、判定部203は取得された異常推定情報に含まれる異常スコアが、予め設定された閾値以上であるか否かを判定する(S402)。ここでの閾値は、異常スコアが装置異常を示すものであるのか否かを判定するための値であり、装置種類や測定データの属性(振動や音等)に応じてユーザが適宜設定すればよい。
【0051】
異常スコアが閾値以上であると判定された場合(S402,YES)、提示部403がディスプレイ15等に表示する等して装置異常の可能性があることをユーザに報知し(S403)、報知後にはステップS401へ移行して次の異常推定情報を取得するまで待機することとなる。ここでのユーザへの報知としては、例えば測定装置10が有する推定モデルのコピー元、即ちオリジナルの推定モデルにおけるデコーダ42に異常推定情報に含まれる潜在変数を入力することにより入力データを復元し、その周波数スペクトルをディスプレイ26に表示することが挙げられる。なお、ステップS402の処理を省き、異常推定情報を取得する度に、ユーザに報知するようにしてもよい。
【0052】
一方、異常スコアが閾値以上でないと判定された場合(S402,NO)、装置異常が生じていないとしてステップS401へ移行し、次の異常推定情報を取得するまで待機する。
【0053】
以下、本実施形態に係る異常推定システムを用いて異常スコアの有効性を確認した実施例1と、次元数補正の有効性を確認した実施例2とを説明する。なお、各実施例では、異常推定対象をモータMではなく、ベアリングとしている。また、ハイパーパラメータは上述した値を用いている。
【0054】
(実施例1)
異常スコアの評価には、用意したデータの先頭部分を、学習データ、試験データの各80%のデータとし、推定モデルの学習を行い、各データのシーケンス全体を推定モデルにおけるエンコーダ41に入力して異常スコアの変化を求めた。
【0055】
図10は、本実施例に係るホワイトノイズを含む高調波の試験データを示す図である。
図11は、本実施例に係る試験データのピーク及びRMS(二乗平均平方根)を示す図である。
図12は、本実施例に係る試験データのクレストファクタ及びエンベロープ・クレストファクタを示す図である。
図13は、本実施例に係る試験データの異常スコアを示す図である。
図14は、本実施例に係る周波数を変化させた試験データのピーク及びRMSを示す図である。
図15は、本実施例に係る周波数を変化させた試験データのクレストファクタ及びエンベロープ・クレストファクタを示す図である。
図16は、本実施例に係る周波数を変化させた試験データの異常スコアを示す図である。なお、
図10において(a)~(c)はそれぞれ振幅が1倍、1.5倍、2倍に増大された試験データである。また、
図11、
図14に示される符号Pはピーク、符号RはRMSを示しており、
図12、
図15に示される符号Cはクレストファクタ、符号Eはエンベロープ・クレストファクタを示している。
【0056】
図10に示されるように本実施例においては、125Hzを基本音とする3つの倍音周波数成分からなる振動信号に10%の振幅摂動とホワイトノイズを加えた単純な信号に適用した。3つの倍音とノイズの振幅比は4:6:2:1とした。
【0057】
この試験データ(試験信号)におけるスペクトルの時間信号は、
図11に示されるように、振幅が1倍、1.5倍、2倍となるのに比例してピークとRMSとが増加した。これは、
図12に示されるように、RMSが一定のノイズの影響でピークとは無関係に増加しているためである。なお、
図12に示されるエンベロープ波形のクレストファクタは、時間波形のエンベロープを作成して計算したクレストファクタである。試験データの最初の1/3周期、即ち振幅が1倍のものを学習データとして推定モデルに学習させた。その結果
図13に示されるように、2番目の1/3周期と最後の1/3周期は、同量(0.5倍の振幅増加に相当)の上昇を示した。
【0058】
さらに別の試験データとして、上記の試験データの基本音を125Hz、131.25Hz、137.5Hzと5%ずつ上げたものを用意した。その結果、
図14及び
図15に示されるように、ピーク、RMS、クレストファクタ、エンベロープ・クレストファクタは略変化しなかった。しかしながら
図16に示されるように、周波数変化の差には比例しないものの、異常スコアは大きな段階的な変化を示した。これらのことから、本実施形態に係る異常スコアは、測定データを線形に反映し、有効性があることがわかった。
【0059】
(実施例2)
同一条件での試験データを用い、一方は次元数補正値D
cmpsを用いずに異常スコアを算出し、他方は次元数補正値D
cmpsを用いて異常スコアを算出した。
図17~
図19は、それぞれ潜在空間を1次元、2次元、3次元として次元数補正値D
cmpsを用いずに算出した異常スコアを示す図であり、
図20~
図22は、それぞれ潜在空間を1次元、2次元、3次元として次元数補正値D
cmpsを用いて算出した異常スコアを示す図である。
【0060】
図17~
図19に示されるように、次元数補正値D
cmpsを用いずに算出した異常スコアの時間変化は、次元数が大きくなるにつれ、異常スコアの値が大きくなったことが縦軸に着目するとわかる。一方、次元数補正値D
cmpsを用いて算出した異常スコアは、
図20~
図22に示されるように、多少の変動はあるものの、略同程度の値になった。特に、モータMが正常状態に相当する左側部分の値が1付近になっている。このことにより、異常スコアの定量性が期待でき、有用なものであることがわかる。
【0061】
以上に説明した本実施形態によれば、測定データからVAEを用いた推定モデルを生成し、異常スコアを算出することができるため、異常時のデータを用意することなく装置の異常を推定することができる。また、異常スコアは、次元数補正値Dcmpsを用いて算出するため、極めて確度の高い装置異常の推定を行うことができる。測定データは、装置のテストまたは初期動作中の正規データであることから、リアルタイムでの装置異常の推定が可能となる。
【0062】
また、推定モデルはVAEを用いたものであるため、出力される潜在変数は入力データよりも低次元なものとなる。測定装置10は、測定データを自己の記憶装置13に格納された推定モデルに入力することで異常スコア及び潜在変数を出力することができ、これら異常スコア及び低次元な潜在変数は、測定データと比較すると容量が極めて低い。そのため、異常スコア及び潜在変数を送信せずに膨大な測定データを学習装置20に送信し続ける場合と比較して、送信時間の低減、延いては消費電力の低減を実現できる。特に、LPWAを用いた無線通信を用いた場合ではこの効果は顕著であり、例えばLPWAを用いて測定データを学習装置20へ送信し続ける形態であると電池14の消費は著しく、早期の電池交換が必要となってしまう。消費電力の低減を実現できることから、測定装置10は商用電源に接続することなく小型の電池14で長期稼動させることができる。また、一方、LPWAを用いて測定データを学習装置20へ送信し続ける形態とするならば、測定装置10と学習装置20とを有線接続すれば電池交換等することはないが、その配線工事が必要となりコストの増加、配線工事による周囲の作業等の影響が生じる。しかしながら、本実施形態によれば無線通信で且つ小型の電池14での長期稼動させることができるため、このような問題が生じることはない。
【0063】
また、測定装置10は推定モデルを自身で生成するのではなく、学習装置20から受信する形で獲得するため、高い装置性能を有する必要がなく低コスト化を実現できる。
【0064】
なお、本実施形態においては、異常推定システム1が測定装置10と学習装置20とを備えると説明したが、これに限定するものではない。例えば学習装置20の機能(送受信部201、学習部202、判定部203)をゲートウェイ30に移し、
図9のステップS403におけるユーザへの異常報知をゲートウェイ30に通信可能に接続されたユーザのPCといった情報処理装置へ行うようにしてもよい。また、算出された異常スコア及び潜在変数は、必ずしも学習装置20のみへ送信するものではなく、例えば上述したユーザの情報処理装置が、同一の推定モデル及びパラメータを有するのであれば、この情報処理装置へ送信することで少なくとも入力データの復元は可能となる。
【0065】
その他、例えば
図23に示されるように、学習装置20を、インターネットやイントラネット等のネットワークを介してゲートウェイ30と通信可能に接続されたサーバ20Aとして構築してもよい。また、
図24に示されるように、学習装置20をゲートウェイ30と通信可能に接続されたクラウドコンピューティング20Bにより構築してもよい。
【0066】
また、本実施形態においては測定装置10が電池14を備えると説明したが、これに限定するものではなく、光や振動、熱等により発電する所謂エネルギーハーベスト技術を組み込んで測定装置10を駆動するようにしてもよい。
【0067】
また、本実施形態においては、測定装置10がモータMに取り付けられているとしたが、これに限定されるものではなく、ポンプやベアリング等の作動することによりセンサで測定データを取得可能な装置であればどのようなものであっても異常推定対象とすることができる。測定データの属性においても、振動のみならず超音波、音、電流、電圧、圧力、流量等の物理量を対象とすることができ、これらのうち2つ以上を測定データとして取得したとしても異常スコア、潜在変数を良好に取得することができる。さらに、入力データは周波数スペクトルに変換することに限定するものではなく、VAEにおいて学習可能なデータであればどのようなデータ形式に変換してもよい。
【0068】
<第2の実施形態>
モータMが、インバータ制御モータのように運転条件が時々刻々変化するような回転機器である場合や、学習期間中に運転条件が変化するような状況である場合、得られる測定データも変化するため、学習データに潜在変数の値の分布(潜在空間分布)に偏りが生じる可能性がある。偏りが生じたとしても、変化する測定データはいずれも正常であるため、正常と学習する必要があり、したがって異常スコアは学習期間を通して偏りのない分布をしていて一定であることが望ましい。しかしながら、このような偏りが生じる場合には、学習期間において算出される異常スコアが一定でなくなり、上述したスコア算出判定処理における異常スコアの判定処理に影響を及ぼす可能性がある。本実施形態においては、潜在変数の分布の偏りを補正可能な異常推定システムについて説明する。
【0069】
本実施形態に係る異常推定システムでは、第1の実施形態に係る
図9に示されるステップS303の異常スコアの算出において、上記(1)式に代わり、下記(4)式を用いることにより潜在変数の分布の偏りを補正する。
【数4】
【0070】
この(4)式は、(1)式と比較すると、正規分布での潜在変数の平均xi
-に代わり、正規分布での潜在変数の中央値mi
-が代入され、潜在変数の標準偏差σiに代わり、正規分布での潜在変数の中央値に対する標準偏差siが代入されている。即ち潜在変数の平均値に代わり中央値が用いられている。
【0071】
図25は、本実施形態に係る潜在変数の分布の偏りを説明するための図であり、
図26は、本実施形態に係る潜在変数の分布における中央値m
iを説明するための図である。
図25及び
図26における縦軸x
1、横軸x
0はそれぞれ2次元における潜在変数の値を示している。
図25に示されるように、潜在変数の集合であるクラスタが、クラスタCL1とクラスタCL2とに分かれる状況となると、(x
1
-,x
0
-)の位置にある分布の平均点x
av(平均値x
i
-)は、クラスタC1に近接し、クラスタC2から離間することとなり、偏りが生じる。一方、分布の中央点x
miは、クラスタC1,C2の略中央に位置することとなるため、偏りが低減される。このことから、平均点であると偏りが生じるものの、中央点であれば、その偏りが低減されることがわかる。したがって、本実施形態においては、潜在変数の平均値に代わり中央値を用いて潜在変数の分布の偏りを補正するようにしている。
【0072】
本実施形態においては分布範囲の中央点x
miを中央値m
iとして算出する。具体的には、
図26に示されるように、潜在変数x
1における最大値x
1max、最小値x
1minの中央の値m
1と、潜在変数x
0における最大値x
0max、最小値x
0minの中央の値m
1とにより分布範囲の中央(近似)を求め、これを中央値m
iとする。なお、ここでは潜在変数の値x
1,x
0の最大値、最小値としているが、クラスタから突出した変数があることを考慮し、2番目の最大値、最小値とするようにしてもよい。
【0073】
以上に説明した本実施形態によれば、算出部104が異常スコアの算出の際、(4)式を用いることにより、潜在変数の分布の偏りが生じたとしてもこれを補正でき、異常スコアを略一定に保つことができるため、異常スコアの判定処理への影響を低減することが可能となる。
【0074】
(実施例3)
本実施形態に係る異常推定システムを用いて、潜在変数の分布の偏りの補正(以後、偏り補正と称する)の有効性を確認した。なお、本実施例では、ハイパーパラメータ等、各種条件は上述した実施例1,2と同様としている。
【0075】
図27は、本実施例に係る潜在変数の分布の偏りが生じる状況における試験データに対して、偏り補正を適用せず、即ち(1)式を用いて算出した異常スコアを示す図であり、
図28は、本実施例に係る潜在変数の分布の偏りが生じる状況における試験データに対して、偏り補正を適用し、即ち(4)式を用いて算出した異常スコアを示す図である。
図27に示されるように、(1)式を用いて異常スコアを算出する場合、学習期間LPにおいては3段の変動が生じていることがわかる。一方、
図28に示されるように、(4)式を用いて異常スコアを算出する場合、学習期間LPにおいては変動が略1段となっており、偏り補正が極めて有用なものであることがわかった。
【0076】
<第3の実施形態>
第1の実施形態では、潜在空間の次元数は2次元が好ましいと説明したが、本実施形態においては、最適な潜在空間の次元数を推定し、より的確な装置異常の推定を実現可能な異常推定システムについて説明する。
【0077】
本実施形態では、VAEの学習結果、即ち生成された推定モデルに基づいて最適な潜在空間の次元数である最適次元数を推定する。学習対象の情報である測定データの持つ次元数より潜在空間の次元数が小さい場合は、潜在空間での各軸に対する分布が独立に近いと予想されるが、潜在空間の次元数が十分に大きくなると、分布の相関が高くなる。この潜在空間の分布における相関関係の度合いを本実施形態ではPearsonの標本相関係数r
i,jにより評価する。標本相関係数r
i,jは下記(5)式により算出することができる。
【数5】
【0078】
(5)式において、x
i(m)は分布上の各サンプルのx
i軸での値、x
i
-はその平均値、x
j(m)は分布上の各サンプルのx
j軸での値、x
j
-はその平均値、Mはサンプル数を示す。この標本相関係数r
i,jを用い、各次元について標本相関係数r
i,jの冗長度が何倍になっているかを示す次元数指標D
corrを、下記(6)式または(7)式により算出することができ、この次元数指標D
corrに基づくことで最適次元数を推定することが可能となる。
【数6】
【数7】
【0079】
以下、最適次元数を推定する次元数推定処理について説明する。
図29は、本実施形態に係る次元数算出処理を示すフローチャートである。この処理は、
図8に示されるステップS203の推定モデル生成の処理時に実行されるものである。先ず、学習部202は、上記(5)式により標本相関係数r
i,jを算出し(S501)、算出された標本相関係数r
i,jを用いて上記(6)式または(7)式により次元数指標D
corrを算出する(S502)。
【0080】
この次元数指標Dcorrを算出において、次元数Dは所定の次元数範囲を対象とし、その数値範囲の分だけDcorrの値が算出される。ここでの次元数範囲は、後述するD/Dcorrの値の最大値を選定するのに十分であり且つ次元数の増大による処理時間の増加を考慮した次元数範囲とすることが好ましく、そのような範囲としては、2次元~20次元程度とするとよい。即ち学習部202は、次元数Dを2~20とし、次元数それぞれの次元数指標Dcorrの値を順次算出する。
【0081】
次元数指標Dcorr算出後、学習部202は、次元数Dを当該次元数Dに対応する次元数指標Dcorr、つまり当該次元数Dを用いて算出された次元数指標Dcorrを用いて除した、D/Dcorrの値(第2次元数指標)を算出する(S503)。算出後、学習部202は、D/Dcorrのうち飽和する値、即ち最大値を選定する(S504)。選定後、選定された最大値に補正を行うことにより最適次元数を算出し(S505)、本フローは終了となる。ここでの補正は、選定された最大値に対して四捨五入を行った値に更に1を加算することとしている。
【0082】
以上に説明した本実施形態によれば、最適次元数を算出することができるため、より的確な装置異常の推定が可能となる。また、最適次元数は所定数の次元数D毎にD/Dcorrの値を算出し、このうちの最大値を補正することにより算出可能であるため算出方法が極めて簡単であり、膨大な処理時間を要する必要がない。
【0083】
なお、本実施形態においては、(5)式において平均値x
i
-、平均値x
j
-を用いると説明したが、第2の実施形態のように平均値に代わり中央値に代えても同様に最適次元数を算出することができる。これは特に、第2の実施形態のように算出部104が異常スコアの算出の際、(4)式を用いる場合に好適である。具体的には、下記(8)式に示されるように、平均値x
i
-、平均値x
j
-に代わり、中央値m
i
-、中央値m
j
-が用いられる。
【数8】
【0084】
(実施例4)
本実施形態に係る異常推定システムの次元数算出処理により算出された最適次元数の有効性を確認した。具体的には、所定の試験データを用い、次元数を変えた際の異常スコアを学習期間および運用期間含めて算出し、異常スコアの感度の変化から最適次元数の有効性を確認した
【0085】
図30は、本実施例に係る潜在空間の次元数を2次元~20次元とした場合の各D/D
corrの値をそれぞれ示す図であり、
図31(a)~(f)は本実施例に係る潜在空間の次元数を2次元~7次元とした場合のそれぞれの試験データの異常スコアを示す図である。なお、
図30におけるD
corrの値は、上記(6)式を用いて算出した値である。
図30に示されるように、潜在空間の次元が8次元である場合、D/D
corrの値が最大値となった。この最大値を四捨五入し、1を加えると6となる。したがって最適次元数が6であると算出された。一方、
図31に示されるように、潜在空間の次元数を2次元~7次元とした場合の異常スコアは、
図31(e)に示される6次元が最も異常スコアの感度が増大していることがわかる。以上のことから、本実施形態において算出される最適次元数は十分に有効性が高いことがわかった。
【0086】
発明の実施形態を説明したが、これらの実施形態は、例として提示したものであり、発明の範囲を限定することは意図していない。これらの新規な実施形態は、その他の様々な形態で実施されることが可能であり、発明の要旨を逸脱しない範囲で、種々の省略、置き換え、変更を行うことができる。この実施形態やその変形は、発明の範囲や要旨に含まれるとともに、特許請求の範囲に記載された発明とその均等の範囲に含まれる。
【符号の説明】
【0087】
1 異常推定システム
10 測定装置(異常推定装置)
13 記憶装置(記憶部)
16 センサ
101 測定部(第1取得部、第2取得部)
103 送受信部(第1送信部、モデル取得部)
104 算出部(スコア算出部)
20 学習装置
201 送受信部(第3取得部、モデル送信部)
202 学習部(モデル生成部)