IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 東京瓦斯株式会社の特許一覧

<>
  • 特許-異常検知システム 図1
  • 特許-異常検知システム 図2
  • 特許-異常検知システム 図3
  • 特許-異常検知システム 図4
  • 特許-異常検知システム 図5
  • 特許-異常検知システム 図6
  • 特許-異常検知システム 図7
  • 特許-異常検知システム 図8
  • 特許-異常検知システム 図9
  • 特許-異常検知システム 図10
  • 特許-異常検知システム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2025-03-07
(45)【発行日】2025-03-17
(54)【発明の名称】異常検知システム
(51)【国際特許分類】
   G05B 23/02 20060101AFI20250310BHJP
   G06N 20/00 20190101ALI20250310BHJP
   G01M 99/00 20110101ALI20250310BHJP
【FI】
G05B23/02 302R
G06N20/00 130
G01M99/00 Z
【請求項の数】 7
(21)【出願番号】P 2024203301
(22)【出願日】2024-11-21
【審査請求日】2024-11-21
【早期審査対象出願】
(73)【特許権者】
【識別番号】000220262
【氏名又は名称】東京瓦斯株式会社
(74)【代理人】
【識別番号】100104880
【弁理士】
【氏名又は名称】古部 次郎
(72)【発明者】
【氏名】石丸 亮哉
(72)【発明者】
【氏名】波多江 徹
【審査官】田中 友章
(56)【参考文献】
【文献】特開2022-035686(JP,A)
【文献】特開2021-121888(JP,A)
【文献】国際公開第2023/188052(WO,A1)
【文献】国際公開第2023/042374(WO,A1)
【文献】米国特許第11080127(US,B1)
【文献】米国特許出願公開第2021/0116904(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 23/02
G01M 99/00
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
プロセッサを備え、
前記プロセッサは、
異常検知対象から複数の運転データを取得し、
前記異常検知対象が正常であるのに人間が異常である旨を示す偽陽性データまたは他の推論装置が異常である旨を示す偽陽性データを含む前記複数の運転データを、初期の学習データとして未だ学習を行っていない学習モデルに学習させる
ことを特徴とする異常検知システム。
【請求項2】
前記複数の運転データは、前記偽陽性データと前記偽陽性データ以外のデータを含み、
前記複数の運転データのうち前記偽陽性データを優先的に、前記初期の学習データとして学習モデルに学習させることを特徴とする請求項1記載の異常検知システム。
【請求項3】
前記偽陽性データだけを前記初期の学習データとして学習モデルに学習させることを特徴とする請求項2記載の異常検知システム。
【請求項4】
前記偽陽性データ以外のデータには、偽陽性データと類似したデータを含み、
前記複数の運転データのうち前記偽陽性データおよび/または前記偽陽性データと類似したデータを優先的に、前記初期の学習データとして学習モデルに学習させることを特徴とする請求項2記載の異常検知システム。
【請求項5】
プロセッサを備え、
前記プロセッサは、
推論対象の運転データを読み込み、
異常検知対象が正常であるのに人間が異常である旨を示す偽陽性データまたは他の推論装置が異常である旨を示す偽陽性データを含む過去の複数の運転データを初期の学習データとして未だ学習を行っていない学習モデルに学習させ学習を終えた当該学習モデルを取得し、
取得した前記学習モデルを用いて、前記推論対象の運転データが前記異常検知対象の異常を示すか否かを検知する
ことを特徴とする異常検知システム。
【請求項6】
前記学習モデルを、前記異常検知対象と異なる異常検知対象に対して転用することができることを特徴とする請求項5記載の異常検知システム。
【請求項7】
前記複数の運転データは、前記異常検知対象の振動から取得される振動データであり、
前記学習モデルは、前記振動データの特徴を学習することを特徴とする請求項1または請求項5記載の異常検知システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、異常検知システムに関する。
【背景技術】
【0002】
特許文献1は、故障検知対象の誤検知を低減させることが可能な学習データを選択することができる学習データ選択装置を提供することを課題としている。特許文献1には、この課題を解決するために、学習モデルの再学習に用いる学習データとして、偽陽性の検知データに係るセンサデータを選択することが開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】国際公開WO2023/188052号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
例えば、生産設備等の異常検知対象から取得したデータに対して学習モデルを利用する場合、整備直後データは、多くの場合、その構造が単純であり、学習モデルにとって異常検知が簡単なデータとなる。一方で、前回整備から長い時間経過した後のデータなどは、設備状態の変化とともにその構造が複雑化し、学習モデルにとって異常検知が難しいデータとなる場合がある。そこで、学習モデルの再学習に用いる学習データとして、異常検知対象が正常であるのに異常である旨を示す偽陽性データを学習させ、予想性能を向上させる方法がある。しかし、これにより再学習ができたとしても、元となる初期モデルの品質が低い場合、再学習後のモデルの予想性能に悪影響を及ぼす可能性がある。
本発明は、学習モデルの再学習のみに偽陽性データを用いる場合と比較して、予想性能をより高めた学習モデルを用いた異常検知システムを提供することを目的とする。
【課題を解決するための手段】
【0005】
請求項1に記載の発明は、プロセッサを備え、前記プロセッサは、異常検知対象から複数の運転データを取得し、前記異常検知対象が正常であるのに人間が異常である旨を示す偽陽性データまたは他の推論装置が異常である旨を示す偽陽性データを含む前記複数の運転データを、初期の学習データとして未だ学習を行っていない学習モデルに学習させることを特徴とする異常検知システムである。
請求項2に記載の発明は、前記複数の運転データは、前記偽陽性データと前記偽陽性データ以外のデータを含み、前記複数の運転データのうち前記偽陽性データを優先的に、前記初期の学習データとして学習モデルに学習させることを特徴とする請求項1記載の異常検知システムである。
請求項3に記載の発明は、前記偽陽性データだけを前記初期の学習データとして学習モデルに学習させることを特徴とする請求項2記載の異常検知システムである。
請求項4に記載の発明は、前記偽陽性データ以外のデータには、偽陽性データと類似したデータを含み、前記複数の運転データのうち前記偽陽性データおよび/または前記偽陽性データと類似したデータを優先的に、前記初期の学習データとして学習モデルに学習させることを特徴とする請求項2記載の異常検知システムである。
請求項5に記載の発明は、プロセッサを備え、前記プロセッサは、推論対象の運転データを読み込み、異常検知対象が正常であるのに人間が異常である旨を示す偽陽性データまたは他の推論装置が異常である旨を示す偽陽性データを含む過去の複数の運転データを初期の学習データとして未だ学習を行っていない学習モデルに学習させ学習を終えた当該学習モデルを取得し、取得した前記学習モデルを用いて、前記推論対象の運転データが前記異常検知対象の異常を示すか否かを検知することを特徴とする異常検知システムである。
請求項6に記載の発明は、前記学習モデルを、前記異常検知対象と異なる異常検知対象に対して転用することができることを特徴とする請求項5記載の異常検知システムである。
請求項7に記載の発明は、前記複数の運転データは、前記異常検知対象の振動から取得される振動データであり、前記学習モデルは、前記振動データの特徴を学習することを特徴とする請求項1または5記載の異常検知システムである。
【発明の効果】
【0006】
本発明は、学習モデルの再学習のみに偽陽性データを用いる場合と比較して、予想性能をより高めた学習モデルを用いた異常検知システムを提供することができる。
【図面の簡単な説明】
【0007】
図1】(a)、(b)は、異常検知システムの全体構成を示した図である。
図2】(a)、(b)は、学習装置または推論装置の機能構成を示した図である。
図3】データ蓄積装置、学習装置、推論装置のハードウェア構成である。
図4】(a)~(c)は、時系列に応じた振動データの特徴を示す図である。
図5】学習装置の処理の流れを示すフローチャートである。
図6】推論装置の処理の流れを示すフローチャートである。
図7】学習モデルの学習対象となる学習データについて説明する図である。
図8】偽陽性データについて説明する図である。
図9】(a)、(b)は、学習モデルの初期学習または再学習を示した図である。
図10】学習済の学習モデルにより出力された異常度を時系列に応じて示したグラフである。
図11】学習済の学習モデルの転用を示す図である。
【発明を実施するための形態】
【0008】
以下、添付図面を参照して、本発明の実施の形態について詳細に説明する。
図1(a)、(b)は、異常検知システムの全体構成を示した図である。図1(a)は、学習段階における異常検知システム1の構成を示しており、図1(b)は、推論段階における異常検知システム1の構成を示している。学習段階とは、学習装置100が有する学習モデル150が学習を行う段階であり、推論段階とは、推論装置200が、学習済の学習モデル150を利用してポンプ10の異常検知を行う段階である。なお学習済の学習モデル150については図2にて後述する。
【0009】
まず、図1(a)に示すように、学習段階において、異常検知システム1は、異常検知対象の一例であり、人間または推論装置200によって異常の有無を監視される機器であるポンプ10を有する。また、異常検知システム1は、ポンプ10の振動の状態を検出するセンサ20を有する。さらに、異常検知システム1は、ポンプ10の振動の状態を示すデータである振動データをセンサ20から取得し過去の振動データとして蓄積するデータ蓄積装置30を有する。また、異常検知システム1は、学習モデル150を有し運転データを学習データとして学習モデル150に学習させる学習装置100を有する。さらに、異常検知システム1は、学習装置100により学習された学習モデル150によりポンプ10が異常か否かを予測する推論装置200を有する。なお、学習装置100により学習された学習モデル150は学習済の学習モデル150と称することがある。
【0010】
ポンプ10は、LNG(液化天然ガス)の受入基地において、LNGを移送するためのポンプである。ポンプ10は人間の利用や時間経過により、設備状態が劣化する。劣化が進むと整備が必要な状態になる。人間は、データ蓄積装置30からポンプ10の振動データを確認し、振動データや振動データ以外の情報を基に、ポンプ10の異常の有無を監視する。振動データ以外の情報とは、例えば、ポンプ10の稼働音やLNGの流量のデータである。そして、ポンプ10に異常が生じていると人間が判断すると、人間によってポンプ10を分解する。このとき、実際にポンプ10に異常があればポンプ10は人間によって整備される。
【0011】
センサ20は、ポンプ10の内部に設置される。センサ20は、ポンプ10の稼働により生じる振動の情報を振動データとしてデータ蓄積装置30に出力する。振動データは運転データの一例である。なお、センサ20は振動を検知するものでなくてもよく、流量など、ポンプ10の他の情報を検知するセンサでもよい。
【0012】
データ蓄積装置30は、センサ20から取得した振動データに識別情報を付与して過去の振動データとして事前に蓄積する。また、データ蓄積装置30は、推論装置200から取得した振動データに識別情報を付与して過去の振動データとして事前に蓄積する。
【0013】
識別情報とは、振動データがポンプ10の正常データかポンプの異常データかを識別するための情報である。さらに、識別情報は、振動データが後述する偽陽性データか否かを識別する情報を含む。
【0014】
ここで、正常データとは、ポンプ10の正常を示す振動データである。例えば、正常データは、データ蓄積装置30がセンサ20から取得した振動データのうち、ポンプ10を分解した結果ポンプ10が実際に正常であったときの振動データである。また例えば、正常データは、データ蓄積装置30が推論装置200から取得した振動データのうち、ポンプ10を分解した結果ポンプ10が実際に正常であったときの振動データである。さらに例えば、正常データは、データ蓄積装置30が、ポンプ10が実際に正常であったときの振動データを取得するよりも前の期間に、データ蓄積装置30がセンサ20または推論装置200から取得した振動データである。ポンプ10が実際に正常であったときの振動データを取得するよりも前の期間とは、例えば、ポンプ10を一度分解し整備した後に、再度分解を行うまでの期間である。
【0015】
また、異常データとは、ポンプ10の異常を示す振動データである。例えば、異常データとは、ポンプ10を分解した結果ポンプ10が実際に異常であったときに、センサ20から取得した振動データである。
【0016】
学習装置100は、振動データの特徴に基づいて学習モデル150を学習させる学習装置である。例えば、学習装置100は、振動データの特徴に基づいて、振動の強度や振動の周波数の特徴を学習モデル150に学習させる。
【0017】
次に、図1(b)に示すように、推論段階において異常検知システム1は、ポンプ10、センサ20を有する。また、異常検知システム1は、推論装置200を有する。推論装置200は、センサ20から推論対象データを取得する。推論対象データとは、識別情報が付与されておらず、ポンプの異常を示すか否かが未知な状態の振動データである。推論対象データは推論対象の運転データの一例である。推論装置200は、推論対象データに基づいて、学習済の学習モデル150によりポンプ10が異常か否かを予測する。そして、予測した結果を人間の端末等に出力する。この出力結果に応じて、ポンプ10の整備が必要であると人間が判断すると、人間によってポンプ10は整備される。
【0018】
図2(a)、(b)は、学習装置100または推論装置200の機能構成を示した図である。図2(a)は、学習装置100の機能構成を示した図である。図2(b)は、推論装置200の機能構成を示した図である。
【0019】
図2(a)に示すように、学習装置100は、データ蓄積装置30から振動データを取得する取得部110を有する。また、学習装置100は、振動データに含まれる識別情報を基に、正常データか異常データかを分別する分別部120を有する。さらに、学習装置100は、振動データを学習モデル150に入力できる形式に加工し学習データを生成する前処理部130を有する。さらに、学習装置100は、学習データを学習モデル150に入力する入力部140を有する。また、学習装置100は、ニューラルネットワーク等で実現される学習モデル150を有する。さらに、学習装置100は、異常度の閾値を設定する設定部160を有する。
【0020】
分別部120は、識別情報が正常データを示している場合に、その振動データを正常データとして分別する。また、識別情報が異常データを示している場合は、その振動データを異常データとして分別する。
【0021】
入力部140は、前処理部130により加工された振動データのうち、データ蓄積装置30がセンサ20から取得した複数の振動データを初期の学習データとして学習モデル150に入力する。初期の学習データとは学習モデル150が初期学習を行うためのデータである。なお、ポンプ10、推論装置200が複数台ある場合、初期の学習データとして、一のポンプ10の推論装置から取得した振動データ以外にも、他のポンプ10の推論装置から取得した振動データを用いてもよい。また、初期の学習データとして、一のポンプ10から取得した振動データ以外にも他のポンプ10から取得した振動データを用いてもよい。
【0022】
また、入力部140は、データ蓄積装置30から取得され前処理部130により加工された振動データのうち、データ蓄積装置30が推論装置200から取得した複数の振動データを、再学習の学習データとして、学習モデル150に入力する。再学習の学習データとは学習モデル150が再学習を行うためのデータである。なお、再学習の学習データとして、データ蓄積装置30がセンサ20から取得した複数の振動データを、再学習の学習データとして、学習モデル150に入力してもよい。
【0023】
学習モデル150は、入力部140の初期の学習データの入力により初期学習を行う。初期学習とは、未だ学習を行っていない学習モデル150が初めて行う学習である。初期学習を終えると学習モデル150は学習済の学習モデル150となる。
【0024】
学習済の学習モデル150は、入力部140の再学習の学習データの入力により、再学習を行う。再学習とは、学習を行った学習モデル150が、その学習から所定時間が経過した後に再度行う学習である。
【0025】
学習済の学習モデル150は学習データに対して、異常度を出力する。異常度とはポンプ10の故障・劣化度合いを表す定量的な指標である。
【0026】
設定部160は、学習済の学習モデル150が出力した学習データに対する異常度を把握し、異常度の閾値を設定する。異常度の閾値とは、推論対象データが正常データか異常データかを分類するための値である。また、設定部160は、人間の指示等により学習の回数等を定めるハイパーパラメータ等を学習モデル150に設定する。
【0027】
また、図2(b)に示すように、推論装置200は、センサ20から推論対象データを取得する推論対象データ取得部210を有する。また、推論装置200は、学習装置100から学習済の学習モデル150を取得する学習済の学習モデル取得部220を有する。さらに、推論装置200は、推論対象データを学習モデルに入力できるように加工する前処理部230を有する。また、推論装置200は、加工された推論対象データを学習済の学習モデル150に入力する入力部240を有する。学習済の学習モデル150から出力された異常度に基づいて、ポンプ10が異常か否かを判定する判定部250を有する。
【0028】
前処理部230は、学習装置100の前処理部130と同様の処理を推論対象データに対して行う。
【0029】
入力部240が学習済の学習モデル150に対して前処理部230により加工された推論対象データを入力すると、学習済の学習モデル150は、推論対象データと学習データとの類似度に基づき、異常度を出力する。
【0030】
判定部250は、学習済の学習モデル150が出力した異常度を判定する。学習済の学習モデル150から出力した異常度が閾値を超えている場合、つまり、ポンプ10に異常があると学習モデル150が予測した場合、ポンプ10に異常があると判定する。また、学習済の学習モデル150から出力した異常度が閾値を超えていない場合、つまり、ポンプ10に異常がないと学習モデル150が予測した場合、ポンプ10は正常であると判定する。判定部250は判定した結果を人間等の端末等に出力する。なお、判定部250による異常度の判定は学習済の学習モデル150が行ってもよく、学習済の学習モデル150が判定した結果を人間の端末等に出力してもよい。
【0031】
図3は、データ蓄積装置30、学習装置100、推論装置200のハードウェア構成である。図3に示すように、データ蓄積装置30、学習装置100、推論装置200を実現するコンピュータは、プログラムに従ってデジタル演算処理を実行する処理部201を有する。また、データ蓄積装置30、学習装置100、推論装置200を実現するコンピュータは、情報を記憶する情報記憶装置202と、LAN(=Local Area Network)ケーブル等を介した通信を実現するネットワークインターフェイス203とを有する。
【0032】
処理部201は、コンピュータにより構成されている。処理部201は、各種の処理を実行するプロセッサの一例としてのCPU(=Central Processing Unit)211を有する。また、処理部201は、プログラムが記憶されたROM(Read Only Memory)212と、ワークエリアとして用いられるRAM(Random Access Memory)213とを有する。情報記憶装置202は、ハードディスクドライブ、半導体メモリ、磁気テープ等、既存の装置により実現される。なお、処理部201と、情報記憶装置202と、ネットワークインターフェイス203とは、バス206や不図示の信号線を通じて接続される。
【0033】
CPU211によって実行されるプログラムは、磁気記録媒体(磁気テープ、磁気ディスクなど)、光記録媒体(光ディスクなど)、光磁気記録媒体、半導体メモリなどのコンピュータが読取可能な記録媒体に記憶した状態で、学習装置100へ提供しうる。また、CPU211によって実行されるプログラムは、インターネットなどの通信手段を用いて、学習装置100へ提供してもよい。
【0034】
本実施の形態の場合、各処理は任意のコンピュータで実行される。任意のコンピュータは、ハードウェアとしてのプロセッサ、ソフトウェアとしてのプログラム、又はそれらの組み合わせとして実現してもよい。任意のコンピュータは、汎用コンピュータ、特定の用途向けコンピュータ、ワークステーション、又は、各処理を実行可能なその他のシステムでもよい。
【0035】
プロセッサは、プログラムとの協働により各種の処理を実行するよう構成される。プロセッサは、本実施の形態における各部(Unit)、又は、各手段(Means)として機能しうる。プロセッサによる処理の実行順序は、本実施の形態で説明する順序に限定されず、必要に応じて変更が可能である。
【0036】
プロセッサは、1又は複数のハードウェアによる構成が可能である。プロセッサを構成するハードウェアの種類は、特定の種類に限定されない。例えばプロセッサは、CPU211でもよく、MPU(=Micro Processing Unit)でもよく、FPGA(=Field Programmable Gate Array)等のプログラマブルロジックデバイスでもよく、ASIC(=Application Specific Integrated Circuit)等の特定の処理を実行させるための専用回路でもよく、GPU(=Graphic Processing Unit)でもよく、NPU(=Neural Processing Unit)等のハードウェアでもよい。
【0037】
プロセッサは、同じ種類の複数のハードウェアの組み合わせに限らず、異なる種類の複数のハードウェアの組み合わせによる構成も可能である。複数のハードウェアが、あるプロセッサの1又は複数の処理を実行するように構成される場合、複数のハードウェアは互いに物理的に離れた装置内に存在していてもよく、同じ装置内に存在してもよい。ハードウェアは、半導体素子などの回路素子を組み合わせた電気回路(circuitry)等により構成される。いずれの実施の形態においても、プロセッサによる各処理の実行順序は、各実施の形態で説明する順序に限定されず、必要に応じて変更が可能である。
【0038】
プログラムは、ファームウェアの他、マイクロコード等のソフトウェアでもよい。プログラムは、例えばプログラムモジュール群でもよい。プログラムモジュール群を構成する各機能は、各機能を実行するように構成されたプロセッサにより実現してもよい。各実施の形態におけるプログラムは、1又は複数の非一時的なコンピュータ可読媒体(例えば半導体メモリ、磁気又は光学式の記憶媒体、その他のストレージ)に保存されたプログラムコードや複数のコードセグメントでもよい。
【0039】
プログラムは、互いに物理的に離れた装置に存在する複数の非一時的なコンピュータ可読媒体に分割して保存されていてもよい。プログラムコードや複数のコードセグメントは、手順、関数、サブプログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、命令、データ構造、プログラムステートメントの任意の組み合わせで表し得る。プログラムコードや複数のコードセグメントは、情報、データ、引数、パラメータ、又はメモリの内容を送受信することで他のコードセグメント又はハードウェア回路と接続されてもよい。
【0040】
図4(a)~(c)は、時系列に応じた振動データの特徴を示す図である。図4(a)は、ポンプ10の整備直後の時期にセンサ20から取得される振動データであり、図4(b)は、中間期に取得される振動データであり、図4(c)は、ポンプ10の整備直前の時期に取得される振動データである。
【0041】
図4(a)に示すように、人間による整備を終えた後であり設備の摩耗や劣化が少ない整備直後においては、他の時期の振動データと比べてピークが少なく単純な構造を示す振動データがセンサ20から出力される。
【0042】
図4(b)に示すように、整備直後に比べて人間の利用や時間の経過により設備の摩耗や劣化が進んだ時期である中間期においては、整備直後の振動データよりもピークが増加・増大し構造が複雑になった振動データがセンサ20から出力される。
【0043】
図4(c)は、中間期に比べて人間の利用や時間の経過によりさらに設備の摩耗や劣化が進んだ時期でありポンプ10が異常を示す時期である整備直前期である。この整備直前の時期においては、中間期の振動データよりもさらにピークが増加・増大し構造が複雑になった振動データがセンサ20から出力される。
【0044】
図5は学習装置100の処理の流れを示すフローチャートである。まず、学習装置100の取得部110は、データ蓄積装置30から過去の振動データを取得する(ステップ601)。つぎに、分別部120は、取得した振動データから正常データ・異常データを分別する(ステップ602)。そして、前処理部130は、振動データの前処理を行い、振動データを学習モデル150に入力可能な形式に変換する(ステップ603)。その後、入力部140は、前処理部130によって処理された振動データを学習データとして学習モデル150に入力する(ステップ604)。そして、学習モデル150は、学習データに基づいて学習を行う(ステップ605)。そして、設定部160は、学習データの入力により学習モデル150が出力した異常度を基に、異常度の閾値を設定する(ステップ606)。
【0045】
図6は推論装置200の処理の流れを示すフローチャートである。まず、推論装置200の推論対象データ取得部210は、センサ20から推論対象データとして振動データを取得する(ステップ701)。そして、前処理部230は、振動データの前処理を行い、振動データを学習モデル150に入力可能な形式に変換する(ステップ702)。その後、学習モデル取得部220は、学習済の学習モデル150を学習装置100から取得する(ステップ703)。この際、学習モデル取得部220は、異常度の設定閾値やハイパーパラメータ等の情報を取得する。そして、入力部240は、前処理部230によって処理された振動データを推論対象データとして学習モデル150に入力する(ステップ704)。学習済の学習モデル150は、推論対象データの異常度を予測する(ステップ705)。判定部250は、異常度の設定閾値を基に異常判定を行い、異常判定を出力する(ステップ706)。
【0046】
図7は、本実施の形態における学習モデル150の学習対象となる学習データについて説明する図である。ポンプ10等の工場で使用される設備は、異常が稀にしか発生せず、ポンプ10の正常を示す正常データよりもポンプ10の異常を示す異常データの方が少ない。また、異常データは多種多様で全てを網羅することができない。よって、本実施の形態においては、ポンプ10の正常データのみを学習データとして用いて、学習モデル150の学習を行い、正常/正常でないをモデリングする。なお、本実施の形態においては、正常データのみを学習データとして用いているが、異常データを学習データとして用いてもよい。
【0047】
図8は、偽陽性データについて説明する図である。図8に示すようにポンプ10の振動データには、ポンプ10が正常であったときの振動データである正常データとポンプ10が異常であったときの振動データである異常データとがある。
【0048】
そして、正常データのうち、真陰性データは、ポンプ10が実際に正常であり、人間または学習モデル150が正常である旨を示したデータである。例えば、真陰性データは、ポンプ10の過去の分解整備事例において、一の振動データからポンプ10が正常だと学習モデル150が予測して、人間がポンプ10を分解し、実際にポンプ10が正常であったときの一の振動データである。また、例えば、真陰性データは、一の振動データまたは一の振動データ以外の情報から、ポンプ10が正常だと人間が予測して、人間がポンプ10を分解し、実際にポンプ10が正常であったときの一の振動データである。
【0049】
また、正常データのうち、偽陽性データは、ポンプ10が実際には正常であるのに、人間または学習モデル150が異常である旨を示したデータである。例えば、偽陽性データは、ポンプ10の過去の分解整備事例において、一の振動データからポンプ10が異常だと学習モデル150が予測して、人間がポンプ10を分解したのに、実際には正常であったときの一のデータである。また、例えば、偽陽性データは、一の振動データまたは一の振動データ以外の情報から、ポンプ10が異常だと人間が予測して、人間がポンプ10を分解したのに、実際にポンプ10が正常であったときの一の振動データである。
【0050】
また、異常データのうち、偽陰性データは、ポンプ10が実際には異常であるのに、人間または学習モデル150が正常である旨を示したデータである。例えば、偽陰性データは、ポンプ10の過去の分解整備事例において、一のデータからポンプ10が正常だと学習モデル150が予測して、人間がポンプ10を分解したのに、実際にはポンプ10が異常であったときのデータである。また、例えば、異常データのうち、偽陰性データは、一の振動データまたは一の振動データ以外の情報から、ポンプ10が正常だと人間が予測して、人間がポンプ10を分解したのに、実際にはポンプ10が異常であったときのデータである。
【0051】
そして、異常データのうち、真陽性データは、ポンプ10が実際に異常であり、人間または学習モデル150が異常である旨を示したデータである。ポンプ10の過去の分解整備事例において、一のデータからポンプ10が異常だと学習モデル150が予測して、人間がポンプ10を分解し、実際に異常であったときのデータである。また、真陽性データは、ポンプ10の過去の分解整備事例において、一のデータまたは一の振動データ以外の情報から、ポンプ10が異常だと人間が予測して、人間がポンプ10を分解し、実際に異常であったときのデータである。
【0052】
なお、ポンプ10が異常だと人間が予測して人間が分解したのに、実際にはポンプ10が正常であったときのデータを人間の偽陽性データと称することがある。また、ポンプ10が異常だと学習モデル150が予測して人間が分解したのに、実際にはポンプ10が正常であったときのデータを、学習モデル150の偽陽性データと称することがある。
【0053】
ここで、図4(c)の振動データのような、前回の整備から長い時間経過した後の振動データは、設備状態の変化とともにその構造が複雑化し、学習モデル150にとって異常データか否かの分類が難しい。このような振動データが、実際にはポンプ10が正常であるのに、学習済の学習モデル150に異常であると誤判定される場合がある。そして、誤判定された振動データには、データ蓄積装置30(図1参照)によって、学習モデル150の偽陽性データとして識別情報が付与される。
【0054】
また、図4(c)の振動データのような、前回の整備から長い時間経過した後の振動データは、設備状態の変化とともにその構造が複雑化し、人間にとって異常データか否かの分類が難しい。このような振動データが、実際にはポンプ10が正常であるのに、人間に異常であると誤判定される場合がある。
【0055】
ただし、図4(c)の振動データのような振動データをセンサ20が取得した場合、人間は、振動データとともに振動データ以外の情報であるポンプ10の稼働音やポンプ10の流量のデータを確認する。そして、人間は、振動データと振動データ以外の情報を含めて確認し、ポンプ10が異常であるか否かを総合的に予測する。その結果、実際にはポンプ10が正常であるのに、異常であると人間が誤判定した場合、予測に用いられた振動データには、データ蓄積装置30(図1参照)によって、人間の偽陽性データとして識別情報が付与される。
【0056】
また、図4(a)、(b)の振動データのような、設備の摩耗が少ない時期において振動データをセンサ20が取得した場合を想定する。この場合、人間は、振動データがポンプ10の正常を示すと予測しても、振動データ以外の情報がポンプ10の異常を示すと予測した場合は、ポンプ10の分解を行う場合がある。そして、ポンプ10の分解を行った結果、実際にはポンプ10が正常であった場合、予測に使われた振動データには、データ蓄積装置30(図1参照)によって、人間の偽陽性データとして識別情報が付与される。なお、この予測に使われたデータは、このデータだけを人間が確認してポンプ10の正常であると予測するデータであるが、誤判定するおそれがあったデータとして、後述する偽陽性データに類似したデータとして扱ってもよい。
【0057】
このように、人間は、振動データと振動データ以外の情報を基にポンプ10が異常であるか否かの予測をする。そのため、人間のポンプ10が異常であるか否かの予測と、学習済の学習モデル150が振動データを基に行ったポンプ10が異常であるか否かの予測とが異なる場合がある。また、振動データだけを人間が確認した場合と、振動データと振動データ以外の情報を人間が確認した場合とで、予測が異なる場合がある。
【0058】
例えば、一の振動データを基に学習済の学習モデル150は、ポンプ10が異常であると予測し、一の振動データと一の振動データ以外の情報を基に人間は、ポンプ10が正常であると予測する場合がある。また、例えば、一の振動データを基に学習済の学習モデル150は、ポンプ10が正常であると予測し、一の振動データと一の振動データ以外の情報を基に、人間は、ポンプ10が異常であると予測する場合がある。
【0059】
また、例えば、一の振動データだけを人間が確認した場合、人間は、ポンプ10が異常であると予測し、一の振動データと一の振動データ以外の情報を確認した場合、人間は、ポンプ10が正常であると予測する場合がある。また、例えば、一の振動データだけを人間が確認した場合、人間は、ポンプ10が正常であると予測し、一の振動データと一の振動データ以外の情報を人間が確認した場合、人間は、ポンプ10が異常であると予測する場合がある。
【0060】
そして、人間の偽陽性データには、振動データ以外の情報の特徴が振動の特徴として現れている場合がある。例えば、人間がポンプ10の異常であると誤判定するようなポンプ10の稼働音等の特徴が、振動データに振動の特徴として現れている場合がある。
【0061】
図9(a)、(b)は、学習モデル150の初期学習または再学習を示した図である。図9(a)は、学習モデル150の初期学習を示した図である。図9(b)は学習済の学習モデル150の再学習を示した図である。
【0062】
図9(a)において、実績正常データ群とは、データ蓄積装置から取得された振動データ群のうち分別部120によって正常データと分別され前処理部130によって加工された複数の正常データである。ここで、正常データには、ポンプ10を実際に分解したときのデータに限らず、ポンプ10を実際には分解していないものの、正常データの可能性が高いデータも含まれる。例えば、人間の偽陽性データをセンサ20から取得した日を基準日として、ポンプ10の整備後からその基準日の前までにセンサ20から取得したデータも含まれる。また、例えば、後述する基準時間の前にセンサ20から取得したデータも含まれる。
【0063】
また、実績正常データ群のうち、人間の偽陽性に類似したデータとは、人間の偽陽性データに類似した振動データである。例えば、人間の偽陽性に類似したデータとは、偽陽性データの周波数の強度等の特徴量と類似した振動データである。また、例えば、人間の偽陽性に類似したデータとは、人間の偽陽性データをセンサ20から取得した日を基準日として、基準日の周辺にセンサ20から取得された振動データである。基準日の周辺とは例えば、基準日の1週間前である。また、人間の偽陽性データをセンサ20から取得したときのポンプ10の運転時間を基準時間として、基準時間の周辺にセンサ20から取得したときの振動データを人間の偽陽性データに類似したデータとしてもよい。例えば、人間の偽陽性データをセンサ20から取得したときのポンプ10の運転時間が200時間であるとすると、ポンプ10の運転時間が175時間のときにセンサ20から取得された振動データを、人間の偽陽性データに類似したデータとして用いてもよい。なお、このポンプ10の運転時間は、一度整備した後から計測される時間である。
【0064】
さらに、実績正常データ群のうち、人間の偽陽性に類似していないデータとは、人間の偽陽性データと類似していない振動データである。例えば、偽陽性データの周波数の強度等の特徴量と振動データの特徴量とが類似していないデータである。また、例えば、人間の偽陽性データをセンサ20から取得した日を基準日として、基準日の周辺以外に取得された振動データである。
【0065】
入力部140は、人間の偽陽性データを優先的に学習モデル150に対して初期の学習データとして入力する。例えば、人間の偽陽性データを入力する量を、人間の偽陽性データ以外のデータよりも多くする。なお、人間の偽陽性データのみを学習モデル150に対して入力してもよい。
【0066】
また、入力部140は、初期の学習データとして、人間の偽陽性データおよび人間の偽陽性に類似したデータを学習モデル150に対して、優先的に入力してもよい。例えば、人間の偽陽性データおよび人間の偽陽性に類似したデータを入力する量を、人間の偽陽性データおよび人間の偽陽性に類似したデータ以外のデータよりも多くしてもよい。さらに、入力する学習データにおける偽陽性データおよび偽陽性に類似したデータの入力比率を時系列に応じて変更してもよい。例えば、偽陽性データをセンサ20から取得した日を基準日として、基準日を遡るにつれて入力する学習データにおける偽陽性データおよび偽陽性に類似したデータの入力比率を小さくしてもよい。なお、人間の偽陽性に類似したデータのみを学習モデル150に対して入力してもよい。
【0067】
入力部140の人間の偽陽性データを優先とした入力により、学習モデル150は、人間の偽陽性データの特徴に重点を置いた初期学習を行う。学習モデル150の偽陽性データの特徴とは、人間の偽陽性データ以外のデータに現れない振動の特徴である。振動の特徴としては、例えば、振動の周波数、強度が挙げられ、学習モデル150は、振動の周波数がどこで生じているか、振動の強度がどのくらいの度合いか等を学習する。そして、学習モデル150は、人間の偽陽性データの特徴に重点をおいて学習した学習済の学習モデル150となる。この学習済の学習モデル150は、推論対象データの入力に対して、推論対象データの特徴と人間の偽陽性データ以外の正常データの特徴との類似度の他に、推論対象データの特徴と人間の偽陽性データの特徴との類似度に基づき、異常度を出力できるようになる。
【0068】
図9(b)において、追加正常データ群とは、学習モデル150の偽陽性データと学習モデル150の偽陽性データに類似したデータである。学習モデル150の偽陽性データとは、先述した通り、学習済の学習モデル150が推論対象データからポンプ10を異常だと判定したが、実際はポンプは正常であった場合の推論対象データである。また、学習モデル150の偽陽性に類似したデータとは、学習モデル150の偽陽性データをセンサ20から取得した日を基準日として、その日の周辺に取得された追加データである。例えば、学習モデル150の偽陽性に類似したデータとは基準日の2、3日前までにセンサ20から取得された追加データである。なお、先述したようにポンプ10の運転時間を基準時間としてもよい。なお、追加正常データ群として、学習モデル150の偽陽性データと学習モデル150の偽陽性データに類似したデータに加えて、実績正常データ群を加えてもよい。
【0069】
入力部140は、学習モデル150の偽陽性データを優先的に再学習の学習データとして学習済の学習モデル150に対して入力する。例えば、学習モデル150の偽陽性データを入力する量を、学習モデル150の偽陽性データ以外のデータよりも多くする。なお、学習モデル150の偽陽性データのみを学習モデル150に対して入力してもよい。
【0070】
また、入力部140は、再学習の学習データとして、学習モデル150の偽陽性データおよび学習モデル150の偽陽性データに類似したデータを学習済の学習モデル150に対して、優先的に入力してもよい。例えば、学習モデル150の偽陽性データおよび学習モデル150の偽陽性データに類似したデータを入力する量を、学習モデル150の偽陽性データ以外のデータよりも多くしてもよい。さらに、入力する学習データにおける学習モデル150の偽陽性データおよび学習モデル150の偽陽性に類似したデータの入力比率を時系列に応じて変更してもよい。例えば、学習モデル150の偽陽性データをセンサ20から取得した日を基準日として、基準日を遡るにつれて学習モデル150の偽陽性データおよび学習モデル150の偽陽性に類似したデータの入力比率を小さくしてもよい。なお、学習モデル150の偽陽性データに類似したデータのみを学習モデル150に対して入力してもよい。
【0071】
入力部140の学習モデル150の偽陽性データを優先とした入力により、学習済の学習モデル150は、学習モデル150の偽陽性データの特徴に重点を置いた再学習を行う。学習モデル150の偽陽性データの特徴とは、学習モデル150の偽陽性データ以外のデータに現れない振動の特徴である。振動の特徴としては、例えば、振動の周波数、強度が挙げられ、学習済の学習モデル150は、振動の周波数がどこで生じているか、振動の強度がどのくらいの度合いか等を学習する。そして、学習済の学習モデル150は、学習モデル150の偽陽性データに重点を置いて再学習を行った学習済の学習モデル150となる。この学習済の学習モデル150は、推論対象データの入力に対して、推論対象データの特徴と学習モデル150の偽陽性データ以外の正常データの特徴との類似度の他に、推論対象データの特徴と学習モデル150の偽陽性データの特徴との類似度に基づき、異常度を出力できるようになる。
【0072】
図10は、学習済の学習モデル150により出力された異常度を時系列に応じて示したグラフである。図10のグラフにおいて縦軸は異常度、横軸は運転時間を示している。運転時間は、ポンプ10を一度整備した後のポンプ10の運転時間を示している。また、IVAは、整備直後の時期、IVBは中間期、IVCは整備直前の時期を示している。なお、異常度の閾値が30である場合を想定している。
【0073】
図10のIVAにおいて、例えば、図4(a)のような振動データを推論対象データとして推論装置200が取得した場合、学習済の学習モデル150は、その推論対象データの特徴と偽陽性データを含む正常データの振動データの特徴とが類似しているとして異常度を1と判定し、判定部250はポンプ10が正常であると判断する。
【0074】
図10のIVBにおいて、例えば、図4(b)のような振動データを推論対象データとして推論装置200が取得した場合を想定する。この場合、学習済の学習モデル150は、その推論対象データの特徴と偽陽性データを含む正常データの振動データの特徴とがやや類似しているとして異常度を17.5と判定し、判定部250はポンプ10が正常であると判断する。やや類似しているとは、IVAにおける段階よりは類似していないものの、ポンプ10が正常の範囲内であることを示す。
【0075】
図10のIVCにおいて、例えば、図4(c)のような振動データを推論対象データとして推論装置200が取得した場合を想定する。この場合、学習済の学習モデル150は、その推論対象データの特徴と、偽陽性データを含む正常データの振動データの特徴とが類似していないとして異常度を40と判定し、判定部250はポンプ10が異常であると判断する。そして、人間は、判定部250による検知結果を確認し、ポンプ10の分解を行い、実際に異常が生じていればポンプ10を整備する。一方で、ポンプ10の分解を行ったものの、実際に異常が生じていなかった場合は、図4(c)のような振動データは、学習モデル150の偽陽性データとして識別情報が付与される。
【0076】
図11は、学習済の学習モデル150の転用を示す図である。図11において、機器A11、機器B12、機器C13は、各々異なるポンプ10を示したものである。学習済の学習モデル150は機器A11、機器B12から振動データを取得し、その振動データを学習データとして学習を行う。そして、学習を終え、学習済の学習モデル150となる。この学習済の学習モデル150は、機器A11、機器B12から推論対象データを取得し、ポンプ10の異常を検知できるようになる。さらに、この学習済の学習モデル150は、機器C13に対しても推論対象データを取得し異常を検知できるようになる。機器C13は、学習モデル150がそもそも学習データを取得していない機器である。このように、学習済の学習モデル150は、その学習をした機器に対して適用することができるほか、そもそも学習していない機器に対しても転用することができる。
【符号の説明】
【0077】
10…ポンプ、20…センサ、30…データ蓄積装置、100…学習装置、200…推論装置
【要約】
【課題】学習モデルの再学習のみに偽陽性データを用いる場合と比較して、予想性能をより高めた学習モデルを用いた異常検知システムを提供することを目的とする。
【解決手段】異常検知システムは、プロセッサを備え、プロセッサは、異常検知対象から複数の運転データを取得し、異常検知対象が正常であるのに異常である旨を示す偽陽性データを含む複数の運転データを、初期の学習データとして学習モデルに学習させる。
【選択図】図9
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11