(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-21
(45)【発行日】2023-09-29
(54)【発明の名称】高次元センサデータにおける異常事象の自動化された根本原因分析を実行する方法及びシステム
(51)【国際特許分類】
G06N 7/01 20230101AFI20230922BHJP
G05B 19/418 20060101ALI20230922BHJP
G05B 23/02 20060101ALI20230922BHJP
G06F 11/07 20060101ALI20230922BHJP
【FI】
G06N7/01
G05B19/418 Z
G05B23/02 302R
G05B23/02 302Y
G06F11/07 140V
G06F11/07 190
(21)【出願番号】P 2020095164
(22)【出願日】2020-06-01
【審査請求日】2023-05-29
(32)【優先日】2019-06-21
(33)【優先権主張国・地域又は機関】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】504407000
【氏名又は名称】パロ アルト リサーチ センター インコーポレイテッド
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100158551
【氏名又は名称】山崎 貴明
(72)【発明者】
【氏名】ドクウー・ジュン
【審査官】山本 俊介
(56)【参考文献】
【文献】米国特許出願公開第2015/280969(US,A1)
【文献】米国特許出願公開第2018/211171(US,A1)
【文献】Sarah Nadi,DRACA: Decision-support for Root Cause Analysis and Change Impact Analysis,UWSpace [online],2009年,https://uwspace.uwaterloo.ca/bitstream/handle/10012/4889/NADI_SARAH.pdf,[2023年8月15日検索]
(58)【調査した分野】(Int.Cl.,DB名)
G06N 7/01
G05B 19/418
G05B 23/02
G06F 11/07
(57)【特許請求の範囲】
【請求項1】
1つ以上の機械の動作における異常の根本原因を識別する方法であって、
前記1つ以上の機械に関連付けられたセンサのセットからセンサデータを取得することと、
前記センサデータをセンサ状態のセットに変換することと、
を含み、
前記方法は、さらに、
入力のセット及び前記センサ状態のセットに基づいて有向非循環グラフ(DAG)のセットを構築し、
ベイジアンネットワーク発見技術を使用することにより、前記DAGのセットから前記最適なDAGを検索することによって、
前記センサ状態のセットに基づいて、前記センサのセットに対する最適な
前記DAGを構築して因果関係をモデル化することと、
前記DAGを使用することによって、直接隣接センサの状態に基づいて標的センサの異常状態の確率を判定することと、
前記DAGにおける前記異常状態をバックトラッキングすることによって、前記標的センサに関連付けられた前記異常状態の根本原因を判定することと、を備える、方法。
【請求項2】
前記センサデータをセンサ状態のセットに変換することが、
前記センサデータにデータ前処理技術を適用して、前記センサデータを統一されたグローバル基準時間と時間整合させることであって、前記統一されたグローバル基準時間が時間間隔のセットを含むことと、
前記前処理されたセンサデータにデータ要約技術を適用することと、を備える、請求項1に記載の方法。
【請求項3】
前記データ前処理技術を適用することが、更に、
前記時間整合されたセンサデータにデータ補間技術を適用して、欠落したセンサデータサンプルを置き換えることを備える、請求項2に記載の方法。
【請求項4】
前記データ要約技術を前記前処理されたセンサデータに適用することが、
データ変換技術を適用して、前記統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、
前記メトリックのセットに基づいて、クラスタリング技術を使用することによって前記センサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、前記強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、
メタノードのセットに基づいて、前記メタノードのDAGとしてメタグラフを構築することと、を備える、請求項2に記載の方法。
【請求項5】
前記入力のセットが、
気象データと、
ユーザ指定のブラックリストと、
ユーザ指定のホワイトリストと、のうちの1つ以上を含む、請求項
1に記載の方法。
【請求項6】
前記センサ状態のセットが、Kミーンズアルゴリズムを使用することによって取得される、請求項1に記載の方法。
【請求項7】
前記センサのセットの前記DAGが、
ノードのセットであって、前記グラフ内の各ノードがセンサクラスタのセット内のセンサを表す、ノードのセットと、
有向エッジのセットであって、前記エッジのセット内の各有向エッジが前記グラフ内の2つのノード間の因果関係を表す、有向エッジのセットと、を含む、請求項1に記載の方法。
【請求項8】
1つ以上の機械の動作における異常の根本原因を識別する装置であって、
1つ以上のプロセッサと、
前記1つ以上の機械に埋め込まれたセンサのセットと、
前記1つ以上のプロセッサによって実行されると、前記装置に、
前記1つ以上の機械に関連付けられたセンサのセットからセンサデータを取得させ、
前記センサデータをセンサ状態のセットに変換させ、
さらに、前記装置に、
入力のセット及び前記センサ状態のセットに基づいて有向非循環グラフ(DAG)のセットを構築し、
ベイジアンネットワーク発見技術を使用することにより、前記DAGのセットから前記最適なDAGを検索することにより、
前記センサ状態のセットに基づいて、前記センサのセットに対する最適な
前記DAGを構築させて因果関係をモデル化させ、
前記DAGを使用することによって、直接隣接センサの状態に基づいて標的センサの異常状態の確率を判定させ、
前記DAGにおける前記異常状態をバックトラッキングすることによって、前記標的センサに関連付けられた前記異常状態の根本原因を判定させる、命令を記憶するメモリと、を備える、装置。
【請求項9】
前記センサデータをセンサ状態のセットに変換することが、
前記センサデータにデータ前処理技術を適用して、前記センサデータを統一されたグローバル基準時間と時間整合させることであって、前記統一されたグローバル基準時間が時間間隔のセットを含むことと、
前記前処理されたセンサデータにデータ要約技術を適用することと、を備える、請求項
8に記載の装置。
【請求項10】
前記データ前処理技術を適用することが、更に、
前記時間整合されたセンサデータにデータ補間技術を適用して、欠落したセンサデータサンプルを置き換えることを備える、請求項
9に記載の装置。
【請求項11】
前記データ要約技術を前記前処理されたセンサデータに適用することが、
データ変換技術を適用して、前記統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、
前記メトリックのセットに基づいて、クラスタリング技術を使用することによって前記センサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、前記強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、
メタノードのセットに基づいて、前記メタノードのDAGとしてメタグラフを構築することと、を備える、請求項
9に記載の装置。
【請求項12】
前記入力のセットが、
気象データと、
ユーザ指定のブラックリストと、
ユーザ指定のホワイトリストと、のうちの1つ以上を含む、請求項
8に記載の装置。
【請求項13】
前記センサ状態のセットが、Kミーンズアルゴリズムを使用することによって取得される、請求項
8に記載の装置。
【請求項14】
前記センサのセットの前記DAGが、
ノードのセットであって、前記グラフ内の各ノードがセンサクラスタのセット内のセンサを表す、ノードのセットと、
有向エッジのセットであって、前記エッジのセット内の各有向エッジが前記グラフ内の2つのノード間の因果関係を表す、有向エッジのセットと、を含む、請求項
8に記載の装置。
【請求項15】
コンピュータによって実行されると、前記コンピュータに、1つ以上の機械の動作における異常の根本原因を識別する方法を実行させる命令を記憶する非一時的コンピュータ可読記憶媒体であって、前記方法が、
前記1つ以上の機械に関連付けられたセンサのセットからセンサデータを取得することと、
前記センサデータをセンサ状態のセットに変換することと、
を含み、
前記方法は、さらに、
入力のセット及び前記センサ状態のセットに基づいて有向非循環グラフ(DAG)のセットを構築し、
ベイジアンネットワーク発見技術を使用することにより、前記DAGのセットから前記最適なDAGを検索することによって、
前記センサ状態のセットに基づいて、前記センサのセットに対する最適な
前記DAGを構築して因果関係をモデル化することと、
前記DAGを使用することによって、直接隣接センサの状態に基づいて標的センサの異常状態の確率を判定することと、
前記DAGにおける前記異常状態をバックトラッキングすることによって、前記標的センサに関連付けられた前記異常状態の根本原因を判定することと、を備える、非一時的コンピュータ可読記憶媒体。
【請求項16】
前記センサデータをセンサ状態のセットに変換することが、
前記センサデータにデータ前処理技術を適用して、前記センサデータを統一されたグローバル基準時間と時間整合させることであって、前記統一されたグローバル基準時間が時間間隔のセットを含むことと、
前記前処理されたセンサデータにデータ要約技術を適用することと、を備える、請求項
15に記載の非一時的コンピュータ可読記憶媒体。
【請求項17】
前記データ要約技術を前記前処理されたセンサデータに適用することが、
データ変換技術を適用して、前記統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、
前記メトリックのセットに基づいて、クラスタリング技術を使用することによって前記センサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、前記強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、
メタノードのセットに基づいて、前記メタノードのDAGとしてメタグラフを構築することと、を備える、請求項
16に記載の非一時的コンピュータ可読記憶媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、一般に、異常事象の根本原因分析を実行するシステム及び方法に関する。より具体的には、本開示は、高次元センサデータから隠れた異常事象の根本原因を識別することに関する。
【背景技術】
【0002】
多数の産業用途、例えば、デジタル製造において、モノのインターネット(IoT)対応機器の使用が増加するのに伴い、大量のセンサデータが容易に利用可能である。多くのサイバー物理システム(CPS)用途では、センサデータは、IoT装備装置から連続的に生成される。そのようなセンサデータは、工場機械の動作効率を最適化するために使用されることができる実施可能な情報を含む。具体的には、CPSにおける動作効率の最適化及び障害事象のリスクの低減は、工場のダウンタイムを低減し、製造プロセスにおける生産性を改善するために、それらの直近の用途に対する最も追求された目的の1つであった。しかしながら、センサデータの次元性及びサイズが増加すると、工場レイアウトでの機械の動作中に異常事象の根本原因を識別するために、センサ間の因果関係を手動で試験して識別するために、非常に高価なタスクにすぐになる。
【0003】
実世界用途に十分にスケーリングするためには、センサデータからのセンサ間の因果関係を発見するために、根本原因分析ワークフローを自動化する必要がある。
【発明の概要】
【0004】
本発明の一実施形態によれば、1つ以上の機械の動作における異常の根本原因を識別するシステムが提供される。動作中、システムは、機械に関連付けられたセンサのセットからセンサデータを取得し、センサデータをセンサのセット内の各センサのセンサ状態のセットに変換し、センサ状態のセットに基づいて、センサのセット間で最適な有向非循環グラフ(DAG)を構築して因果関係をモデル化することができ、直接隣接センサの状態を与えられたユーザ定義型標的センサの異常状態の確率を判定し、グラフ構造における異常状態をバックトラッキングすることによって標的センサに関連付けられた異常状態の根本原因を判定する。
【0005】
この実施形態の変形例では、センサのセット内の各センサのセンサ状態のセットにセンサデータを変換することは、データ前処理技術をセンサデータに適用して、センサデータを、グローバル基準時間と時間整合させることであって、統一されたグローバル基準時間が時間間隔のセットを含むことと、データ要約技術を前処理されたセンサデータに適用することとを備える。
【0006】
この実施形態の更なる変形例では、データ前処理技術を適用することは、更に、データ補間技術を時間整合されたセンサデータに適用して、欠落したセンサデータサンプルを置き換えることを備える。
【0007】
この実施形態の更なる変形例では、データ要約技術を前処理されたセンサデータに適用することは、データ変換技術を適用して、統一されたグローバル基準時間に関連付けられた各時間間隔に対するメトリックのセットを生成することと、メトリックのセットに基づいて、クラスタリング技術を使用することによってセンサのセットに関連付けられた属性のセットにおいて、強力に接続されたコンポーネントである類似の属性をグループ化し、強力に接続されたコンポーネントのそれぞれを単一のメタノードに縮小させることと、メタノードのセットに基づいて、メタノードのDAGとしてメタグラフを構築することとを備える。有向グラフの強力に接続されたコンポーネントは、強力に接続されたサブグラフである。サブグラフ内の各ノードがサブグラフ内の全ての他のノードから到達可能である場合、有向グラフ内のサブグラフは、強力に接続されることができる。類似の属性のグループは、有向グラフ内の強力に接続されたコンポーネントとして表すことができる。
【0008】
この実施形態の変形例では、センサ状態のセットに基づいて、メタノードのセットの中で最適なDAG構造を構築することは、入力のセット及びセンサ状態のセットに基づいてDAG構造のセットを構築することと、ベイジアンネットワーク発見技術を使用することによって、グラフ構造のセットから最適なDAG構造を検索することとを備える。
【0009】
この実施形態の更なる変形例では、入力のセットは、気象データ、ユーザ指定のブラックリスト、及びユーザ指定のホワイトリストのうちの1つ以上を含む。
【0010】
更なる変形例では、センサ状態のセットは、Kミーンズアルゴリズムを使用することによって取得される。
【0011】
この実施形態の変形例では、センサのセットの中のDAG構造は、ノードのセットを備え、グラフ構造内の各ノードは、センサクラスタのセット(すなわち、メタノード)内のセンサと、有向エッジのセットとを表し、エッジのセット内の各有向エッジは、グラフ構造内の2つのノード間の因果関係を表す。
【図面の簡単な説明】
【0012】
特許又は出願ファイルには、カラーで作成された少なくとも1つの図面が含まれている。本特許又は特許出願公開のカラー図面の写しは、その請求に応じて、必要な料金を支払うことにより、特許庁から提供されることとなる。
【0013】
【
図1A】本発明の一実施形態に係る、例示的なデータ相関マップを示している。
【
図1B】本発明の一実施形態に係る、例示的なデータ品質マップを示している。
【
図2】本発明の一実施形態に係る、例示的な根本原因分析システムアーキテクチャを示している。
【
図3A】本発明の実施形態に係る、シミュレートされた規則的事象に対するクラスタリングトポロジーのプロットを示している。
【
図3B】本発明の実施形態に係る、シミュレートされた不規則的事象に対するクラスタリングトポロジーのプロットを示している。
【
図4】本発明の一実施形態に係る、時間平均データに基づいて、シミュレートされたセンサデータを三元状態にマッピングする例を示している。
【
図5】本発明の一実施形態に係る、DAGモデル構造事前データモデルを示している。
【
図6】本発明の一実施形態に係る、
図2のアーキテクチャについての根本原因分析システム設計を示している。
【
図7A】本発明の一実施形態に係る、例示的な有向依存性グラフを示している。
【
図7B】本発明の一実施形態に係る、有向依存性グラフを使用した根本原因分析の例示的な結果を示している。
【
図8】本発明の一実施形態に係る、異常事象の根本原因分析を実行するための例示的なプロセスを示すフローチャートを示している。
【
図9】本発明の一実施形態に係る、根本原因分析システムを容易にする例示的なコンピュータシステムを示している。
【
図10】本発明の一実施形態に係る、根本原因分析システムを容易にする例示的な装置を示している。
【0014】
図面において、同様の参照番号は、同様の図要素を指す。
【発明を実施するための形態】
【0015】
以下の説明は、当業者が実施形態を作製及び使用することを可能にするために提示され、特定の用途及びその要件に関連して提供される。開示される実施形態に対する様々な修正は、当業者には容易に明らかとなり、本明細書に定義される一般原理は、本開示の趣旨及び範囲から逸脱することなく、他の実施形態及び用途に適用され得る。したがって、本発明は、示される実施形態に限定されるものではなく、本明細書に開示される原理及び特徴と一致する最も広い範囲を与えられるものである。
【0016】
概要
多くの実世界業界のCPS用途では、1つ以上の機械の動作中に記録されたセンサデータは多数であり、多くの場合、信頼できない測定値を生成する不均一な種類のセンサを含む。例えば、CPS用途では、工場エネルギー管理システム(FEMS)は、例えば、毎分受信した600個のセンサからのデータなど、複数の工場のサブステーションに関連付けられた多数のセンサから周期的にデータを受信することができる。センサは、エネルギー、電流、電圧などを測定するための電気計器、温度、湿度、CO2などを測定するための環境センサ、及び空気流、冷却設定点などを測定するための制御状態センサを含むことができる。これらのセンサは、工場レイアウトにおいて様々なレベルで設置されることができる。
【0017】
様々なセンサからの記録されたセンサデータは、以下の不規則性を含むことができる。第1に、センサデータは、完全に異なるフォーマット及び物理的意味を有する不均質データを含むことができる。例えば、不均質データは、温度及び電力計の読み取り値を含むことができる。そのような不均質データでは、データ処理システムが、全ての変数を、根本原因分析ワークフローにおける更なる処理のために統一されたフレームワークとシームレスに変換することは困難である。第2に、センサと基地局との間の通信チャネルの不安定性に起因して、センサデータは、疎でエラーを起こしやすい可能性がある。したがって、信頼性の高い正確な分析結果を生み出す一方で、全ての種類のエラーを許容することが可能なデータ処理システムが必要とされている。第3に、CPS内の多数のセンサ及び他のデータソースが、更新をデータサーバにプッシュし続けるにつれて、データサーバは、これらの更新を短時間でフラッドされる。そのような大量のデータに対処するために、データ処理システムは、データサーバ内の蓄積されたデータに対して任意の種類の分析を実行する前に、データ要約及び圧縮技術を採用することができる。
【0018】
図1Aは、本発明の一実施形態に係る、例示的なデータ相関マップを示している。データ相関マップは、FEMSからのフィーダーから収集されたデータに基づいている。
図1Aでは、より明るい領域は、2つのセンサ測定値間のより高い相関を示している。一対のセンサ測定値間のそのような相関は、センサの設置位置及び種類に起因することができる。更にまた、分析されるセンサの数が増加するにつれて、より多くのセンサが相関する可能性が高い。センサデータ中のそのような高い相関の存在は、計算中に不必要なオーバーヘッドを損なう可能性がある。
【0019】
図1Bは、本発明の一実施形態に係る、例示的なデータ品質マップを示している。データ品質は、単位時間持続時間を考慮して受信されるデータサンプルの総数に対する通常のデータサンプルの比率として定義されることができる。
図1Bでは、データ品質は、1時間の時間ウィンドウについて計算され、暗い領域は、通常のサンプルを示す一方で、より明るい領域は、センサデータ内の相関又はランダムな損失を示している。
【0020】
従来の自動根本原因分析方法は、センサデータ内の固有の不規則性を考慮するものではない。換言すれば、それらは、データの品質、種類及びフォーマットの仮定に基づいており、したがって、それらの自動化能力は、データセットの特性に応じて制限される。本明細書に記載される実施形態は、高次元センサデータにおける異常事象の自動根本原因分析を実行することに関連する上述の技術的問題を解決する。
【0021】
より具体的には、根本原因分析システムは、センサデータを取得し、センサデータを前処理して、サンプリングレート及び欠落したセンサ読み取り値の不規則性に対処することができる。次いで、システムは、更なる処理のために関連するセンサデータのみを選択する。具体的には、システムは、前処理されたセンサデータをコンパクトかつ情報的データ表現に変換する。更に、システムは、センサのセット内の各センサに対するセンサ状態のセットを決定する。次いで、システムは、状態のセットに基づいて、センサクラスタのセット(すなわち、メタノード)間で最適なDAG構造を構築するように努力する。DAG構造を使用することにより、システムは、ユーザ指定の標的センサに関連付けられた異常事象の根本原因を判定することができる。具体的には、システムは、直接隣接センサの状態を与えられた標的センサの異常状態の確率を判定し、次いで、標的センサにおける異常事象の根本原因は、DAG構造における異常状態をバックトラッキングすることによって判定される。
【0022】
本明細書に記載される根本原因分析システムは、以下の利点を提供する:システムが分析のために利用可能なセンサの数によって十分にスケーリングすることができるため、システムは、寸法的にスケーラブルである;このシステムは、気象、時間、及びセンサデータから学習した因果関係モデルを使用して、様々な形態の異常事象の根本原因分析タスクを実行することができるために多目的に使用することができる;システムは、破損した、ノイズが多い、及び損失のあるセンサデータの分析を行うことができるためにロバストである。
【0023】
システムアーキテクチャ
図2は、本発明の一実施形態に係る、例示的な根本原因分析システムアーキテクチャを示している。根本原因分析システム200は、センサデータベース202、気象データベース204、及び3つの処理ステージを含むことができる。第1のステージは、データ前処理モジュール214を含むことができ、第2のステージは、データ要約モジュール220を含むことができ、第3のステージは、モデル発見モジュール228を含むことができる。データ前処理モジュール214は、更に、データ取得モジュール206、データ標準化モジュール208、外れ値検出モジュール210、及びデータ補間モジュール212を含むことができる。データ要約モジュール220は、更に、データ変換モジュール216及びセンサクラスタリングモジュール218を含むことができる。モデル発見モジュール228は、更に、自動状態分類モジュール222、ベイジアンネットワーク構造発見モジュール224、及び分析モジュール226を含むことができる。
【0024】
センサデータベース202は、工場レイアウトで1つ以上の機械に埋め込まれた複数のセンサから収集されたセンサデータを記憶する。センサデータは、多変量時系列として表すことができ、例えば、センサデータは、異なるタイムスタンプにおいて大きな変数群の記録を含むことができる。気象データベース204は、気象に関連付けられたデータ、例えば、温度、露点、湿度などを含むことができる公的に入手可能なデータベースである。データ取得モジュール206は、センサデータベース202及び気象データベース204を周期的に照会し、ローカル分析サーバ内のバイナリデータフォーマットに保持された対応するデータレコードを記憶及び/又は更新する。
【0025】
本発明の一実施形態では、ユーザは、全ての観察を網羅する時間間隔を示す2つのタイムスタンプ、すなわち、TsからTeを設定することができる。例えば、時間間隔は、1年に設定されることができる。この時間間隔は、分析期間と称されることができる。分析期間は、一対の(Ts、Te)として表すことができ、システムは、ユーザによって明示的に指定されない限り、周期的な更新をサポートするように分析周期を自動的に設定することができる。
【0026】
一実施形態では、データ標準化モジュール208は、Ts及びTeが予め定義されて変更されていないこと、及び複数のセンサに関連付けられた全ての収集された属性がインデックス
【0027】
【0028】
で順序付けられることを想定することができ、ここで、Nは、分析のためにデータ取得モジュール206によって収集された属性の総数を表す。用語「属性」はまた、データベース内の等価用語「カラム」とも称されることができる。データ標準化モジュール208は、収集された属性の全てを2つのグループに分割することができる。第1のグループ
【0029】
【0030】
は、センサデータベースによって収集された属性を含む。第2のグループ
【0031】
【0032】
は、公共データベースからの気象関連属性を含む。更にまた、データ標準化モジュール208は、Sにおける属性を2つのクラスに分類することができる。第1のクラスは、異常事象、例えば、電力計測定値からの異常な電力消費を対象とする一次センサ
【0033】
【0034】
についての属性インデックスのセットを含むことができる。第2のクラスは、S/P又はS-SPによって表される残りのセンサ属性を含むことができる。
【0035】
本発明の一実施形態では、データ標準化モジュール208は、カラム(又は属性)に基づいて、全ての取得されたセンサデータサンプルを時系列で変換することによって、センサデータの後続分析の効率を改善することができ、結果をカラムストアデータベースシステムに保存することができる。データ標準化モジュール208は、
【0036】
【0037】
として各i番目の属性についての列ベクトルを構築することができ、ここで、niは、分析期間(Ts、Te)中に収集されたサンプルの総数を表す。
【0038】
【0039】
は、aiについてのタイムスタンプの対応するアレイを示すものとし、ここで、
【0040】
【0041】
について、Ts≦ti,j≦Teである。
【0042】
センサと基地局との間のデータ通信チャネルの不安定性のために、2つの連続するタイムスタンプ間の差は、一定でないことがある。サンプリングレート内の任意の不規則性に対処するために、データ標準化モジュール208は、全てのサンプルを統一されたグローバル基準時間ドメインにマッピングすることができる。データ標準化モジュール208は、均一なグローバル基準時間を、等しい長さの間隔Δに秒で分割することができ、例えば、間隔の長さは、1時間とすることができる。
【0043】
【0044】
は、k番目の時間間隔の開始時間を表し、ここで、Kは、分析期間(Ts、Te)内の統一されたグローバル基準時間内の時間間隔の総数を表す。開始時間表記
【0045】
【0046】
は、センサ属性S及び気象属性Wの双方に使用されることができる。
【0047】
【0048】
の状態は、時間関連パラメータ表現トリプレットとして表すことができ、すなわち、θT=(θm、θd、θh)として表すことができる。トリプレットにおいて、θm、θd及びθhは、それぞれ、年の月、週の日、及び日の時間の略である。データ標準化モジュール208が、統一されたグローバル基準時間間隔に全てのタイムスタンプをマッピングした後、各属性について新しい列ベクトルを生成する。
【0049】
外れ値検出モジュール210は、各属性を3つの一般的な値タイプ、すなわち、連続的、離散的、及び一定の値のうちの1つに分類することができる。次いで、外れ値検出モジュール210は、列ベクトルのパターンを分析する。全てのグローバル基準時間間隔にわたって属性が一定のままである場合、これらの一定の種類の属性は、根本原因分析ワークフローにおいて可能な結果を生成しない場合があるため、更なる分析のために含まれなくてもよい。
【0050】
データ補間モジュール212は、時間間隔内でタイムスタンプを用いて全てのサンプルを集計して、数値を含む特定の属性に関連付けられた平均及び分散を計算することができ、その結果、時間間隔に少なくとも1つの有効なサンプルが存在する。そうでなければ、データ補間モジュール212は、隣接する間隔の集計結果に基づいて補間アルゴリズムを実行することができる。属性がカテゴリー値、例えば、{高、中央、低}を含む場合、データ補間モジュール212は、ランダムハッシュを適用して、具体的な値を整数領域にマッピングし、連続数値としてマッピング後に属性を処理することができる。例えば、データ補間モジュール212は、連続値タイプの線形補間、及び離散値タイプの最近傍補間を使用することによって、欠落したセンサ読み取り値を置き換えることができる。
【0051】
データ補間モジュール212の出力で利用可能なセンサデータ及び気象データに関連付けられた属性は、多様な属性タイプを含むことができる。属性タイプダイバーシティ及び多数の属性の悪影響を除去するために、データ要約モジュール220は、属性をコンパクトかつ情報的データ表現に変換することができる。データ要約モジュール220は、(データ変換モジュール216による)データ変換及び(センサクラスタリングモジュール218による)センサクラスタリングの2つの異なる動作を実行することができる。
【0052】
一実施形態では、データ変換モジュール216は、各時間間隔のサンプルを2つの明確な特徴に要約することができる;それぞれ、規則的事象及び不規則的事象の平均特徴及び分散特徴。次いで、データ変換モジュール216は、特徴行列を構築し、時間間隔及び属性は、行列の行及び列にそれぞれ表される。平均特徴は、周期的に発生する事象、例えば、日中又は毎週の正弦波サイクルを捕捉することができる。周期的に発生する事象は、規則的事象と称されることができる。分散特徴は、非周期的発生事象を捕捉することができ、これはまた、属性サンプル値の変動を定量化することもできる。非周期的発生事象は、不規則的事象と称されることができる。
【0053】
各時間間隔kについて、データ変換モジュール216は、センサデータの全ての属性に対する平均及び分散特徴を計算することができる。Ni、kは、時間間隔k中の属性iに関連付けられたサンプルの数を表し、Si、kは、時間間隔kの開始時の属性iのサンプルインデックス、すなわち、
【0054】
【0055】
の開始時の属性iのサンプルインデックスを示すものとする。そして、平均及び分散特徴は、以下のように計算される。
【0056】
【0057】
ここで、
【0058】
【0059】
は、時間間隔kについて属性iの平均及び分散特徴を示す。
【0060】
センサクラスタリングモジュール218は、センサ測定値が非常に相関性が高いことが多く、この高い相関がランク不足の特徴行列をもたらし得ることを考慮する。したがって、類似の属性群内の有限数の代表的属性(すなわち、特徴行列の列ベクトル)を選択する必要がある。同様の属性をグループ化する前に、センサクラスタリングモジュール218は、グループ化/クラスタリングに対する一貫性のない単位及び属性特徴のスケールの影響を排除するために、以下の動作を実行する。最初に、センサクラスタリングモジュール218は、単位長さ及びゼロ中心に対する各属性の特徴ベクトル(すなわち、特徴行列の列ベクトル)を正規化することができる。次いで、センサクラスタリングモジュール218は、各特徴ベクトルを単位K次元球体の表面上に等価にマッピングすることができる。
【0061】
本発明の一実施形態では、センサクラスタリングモジュール218は、親和性クラスタリングアルゴリズムを使用することができる。親和性クラスタリングアルゴリズムを使用して、各群が、例示的なものと呼ぶことができる対応する単一の代表的属性を有し、グループ内の残りの属性を従動するものと呼ぶことができるような方法でグループ化することができる。各例示的なものの場合、センサクラスタリングモジュール218は、2つの特徴行列、すなわち、平均特徴行列及び変動特徴行列を構築することができる。データセンサクラスタリングモジュール218で実行されるデータ処理動作は、多数の相関属性を排除することによって、モデル発見モジュール228内の探索空間を低減することができる。更にまた、親和性クラスタリングアルゴリズムは、データポイント間の距離測定基準を通過及び使用するメッセージを介してクラスタを構築することによって、大きなデータセットを処理するための高速かつ信頼性の高い方法を提供する。
【0062】
以下のセクションでは、センサクラスタリングモジュール218の動作について、更に詳細に説明する。本発明の一実施形態では、センサクラスタリングモジュール218は、それぞれ、式(1)及び(2)に従って属性iの平均及び分散特徴ベクトルを計算することができる。平均特徴ベクトルは、
【0063】
【0064】
として表すことができ、分散特徴ベクトルは、
【0065】
【0066】
として表すことができる。平均特徴ベクトル
【0067】
【0068】
は、
【0069】
【0070】
であるように、
【0071】
【0072】
によって示されるゼロ中心及び単位長さベクトルに変換されることができ、ここで、
【0073】
【0074】
である。同様に、分散特徴ベクトル
【0075】
【0076】
も変換されることができる。属性iとjとの間の平均特徴における相違性は、
【0077】
【0078】
としてユークリッド距離によって測定することができる。同様に、分散特徴ベクトル
【0079】
【0080】
における相違度を測定することができ、
【0081】
【0082】
として示される。
【0083】
平均特徴ベクトルにおける相違度はまた、
【0084】
【0085】
として定義することができ、ここで、
【0086】
【0087】
は、属性iとjとの間の平均特徴の相関係数である。更に、平均特徴ベクトルの相違度尺度は、実数
【0088】
【0089】
のセットによって境界付けられ、平均特徴ベクトルの類似度は、
【0090】
【0091】
として定義することができる。分散特徴ベクトルの類似度は、
【0092】
【0093】
として定義することができる。
【0094】
そして、センサクラスタリングモジュール218は、以下の条件が満たされた場合に、平均及び分散特徴ベクトルのゼロ分散属性を決定することができる。
【0095】
【0096】
ここで、
【0097】
【0098】
は、正規化された平均特徴ベクトル及び
【0099】
【0100】
は、正規化された分散特徴ベクトルの分散を示し、
【0101】
【0102】
は、
【0103】
【0104】
でのそれぞれの閾値である。
【0105】
【0106】
を、平均及び分散特徴ベクトルのゼロ分散属性のインデックスのグループ(又はクラスタ)をそれぞれ示すものとする。一実施形態では、センサクラスタリングモジュール218は、親和性クラスタリングアルゴリズムを使用して、平均特徴及び分散特徴のクラスタを計算することができる。親和性クラスタリングアルゴリズムは、それぞれ、全ての非ゼロ分散属性
【0107】
【0108】
について、類似度が
【0109】
【0110】
を使用する。そして、例示的な属性の平均及び分散特徴は、それぞれ、特徴行列
【0111】
【0112】
(式中、
【0113】
【0114】
は、平均及び分散特徴の例示の属性指数である。
【0115】
図3Aは、本発明の一実施形態に係る、シミュレートされた規則的事象についての例示的なもの及び従動するもののセンサのクラスタリングトポロジーのプロットを示している。
図3Bは、本発明の一実施形態に係る、シミュレートされた不規則的事象についての例示的なもの及び従動するもののセンサのクラスタリングトポロジーのプロットを示している。
図3A及び
図3Bのトポロジーは、シミュレートされた規則的及び不規則的事象についての親和性クラスタリングアルゴリズムを使用することによって得られている。
【0116】
図2に戻ると、モデル発見モジュール228は、以下のデータ処理モジュール:自動状態分類モジュール222、ベイジアンネットワーク構造発見モジュール224及び分析モジュール226を使用することによって、センサクラスタリングモジュール218によって出力されるデータを更に処理する。モデル発見モジュール228の目的は、観察されたセンサデータ及び気象データを所与として最適なベイジアンネットワーク(BN)構造を検索することによって、属性間の因果関係の単純なグラフ表示をDAGとして見つけることである。
【0117】
自動状態分類モジュール222は、ニーポイント検出によるKミーンズアルゴリズムを使用することができ、最適数のクラスタKは、KとKを与えられたモデルの対数尤度との間のトレードオフのニーポイントによって判定されることができる。それにより、三元状態、例えば、高、低、及び非ピーク、及び二元状態、例えば、それぞれ規則的及び不規則的変動によって表される、規則的事象及び不規則的事象を伴うBN構造の状態構成を簡略化する。
図4は、本発明の一実施形態に係る、シミュレートされたセンサデータの時間平均に基づいて、シミュレートされたセンサデータを三元状態にマッピングする例を示している。
図4のプロット(a)は、目標センサ測定値、すなわち、電力計データの電力消費プロファイルの例を示している。この電力計データを最初に15分の平均に変換することができ、そのような平均電力計データをプロット(b)に示している。次いで、自動状態分類モジュール222は、平均電力測定器データを三元状態、例えば、高、低、及び非ピークに変換することができる(プロット(c)に示す)。
【0118】
表1(以下に示す)は、自動状態分類モジュール222によって実行されるセンサ測定の事象分類を示している。表1はまた、平均及び変動特徴の特性間の比較を提供する。
【0119】
【0120】
図2に戻ると、ベイジアンネットワーク構造発見モジュール224は、次に、ノード間の有向エッジによってDAGとして表される属性間の因果関係を伴う特徴行列に基づいて、最も確率の高いグラフィック構造のセットを見つけることができる。グラフィック構造のそれぞれは、センサに関連付けられた属性に対応する各ノードを有するノードのセットと、ノード間の有向エッジのセットと、を含むことができる。
【0121】
以下のセクションでは、ベイジアンネットワーク構造発見モジュール224及び分析モジュール226の動作について、更に詳細に説明する。従来のシステムは、最適なBN構造を特定するための指数関数的探索空間を探索する必要があり、これは、BN構造及び状態に関する任意の制約なしに最適なBN構造を同定する必要がある。従来のシステムが、最適なBN構造を有限時間で見つけることができる場合であっても、得られる構造は、初期出発点に対して高度に敏感であり、したがって信頼できない。更にまた、BN構造中の状態が正確に定義されない場合、BN構造を学習するために使用されるアルゴリズムは、無限に遅い速度で最終解に収束し得る。
【0122】
上述の問題を克服するために、本発明の一実施形態は、探索を誘導するために、BN構造の従来のデータモデルを設定し、
図5は、そのような事前データモデルを示している。
図5は、本発明の一実施形態に係る、DAGモデル構造事前データモデルを示している。事前データモデルは、BN構造上の気象属性502の時間パラメータ506及びセンサ属性(標的センサ測定508及び非標的センサ測定504を含む)の間の因果関係の基本的な制約を課す。因果関係の1つの方向のみが、例えば、時間パラメータ506から気象属性502に許可されるが、気象属性502から時間パラメータ506までは許可されない。そのような因果的制約は、任意の種類のセンサ及び気象データに対して普遍的に保持された基本的なBN構造を定義することができる。システムは、
図2の自動状態分類モジュール222によって学習された個々の属性の隠れたパラメータを使用することによって因果関係モデルを表すことができる。一実施形態では、
図2の自動状態分類モジュール222は、連続状態の最適な量子化を見つけることと同等であり得る、属性の特徴の連続状態のために、最適な離散状態、すなわち隠れパラメータを見出すことができる。次いで、ユーザは、それらの既知の依存知識に基づいて、ブラック/ホワイトリスト510を提供して、BN構造を更に制約することができる。
【0123】
一実施形態では、表記Xは、Xavg及びXvarの双方を表すために使用される。表記X.iは、Xのi番目の列ベクトルを示し、属性iの観察された特徴サンプルを表す。標的センサ測定属性のための特徴行列は、
【0124】
【0125】
で表すことができる。同様に、非標的センサ測定属性504及び気象属性502についての
【0126】
【0127】
及びXWをそれぞれ定義することができる。一実施形態では、観察された特徴サンプルXi,kは、下にある又は隠れた離散した状態θi、すなわち、
【0128】
【0129】
に依存し得る。あるいは、θiは、量子化後の連続ランダム変数Xi,kの離散状態表現として解釈することができる。表記
【0130】
【0131】
は、
【0132】
【0133】
の隠れた状態を示し、
【0134】
【0135】
は、
【0136】
【0137】
の隠れた状態を示し、同様に、気象及び時間属性の隠れた状態は、それぞれθ
W及びθ
Tによって示され得る。属性間の因果関係は、
図5に示すDAGを使用することによって、隠れパラメータ
【0138】
【0139】
によってコンパクトに表すことができる。
図5では、ノード間の矢印は因果関係を表し、各プレートは、同じ属性を有するノード間の一例のみを示す。プレート内のノード間の依存性構造については、更なる想定はなされていない。
【0140】
図2に戻ると、ベイジアンネットワーク構造発見モジュール224は、
図5のグラフィックモデル及び特徴行列Xを考慮して、
【0141】
【0142】
を見つけるように、
【0143】
【0144】
コンパクトな確率的説明を見つける。この目的は、
図5のX及びモデルを考慮して、
【0145】
【0146】
について最良の図形構造を体系的に検索することを容易にするBNフレームワークを採用することによって達成することができる。
【0147】
G=(N、E)は、ノード
【0148】
【0149】
を有するDAG、及び変数間の直接的な依存性を表すエッジEを示す。更に、更なる変数は、以下のように定義することができる。
【表2】
【0150】
n次元のBNは、トリプレットB=(θ、G、Z)と、以下によって与えられるθに対する固有のジョイント確率分布として定義することができる:
【0151】
【0152】
n個の変数を有する全てのベイジアンネットワークのセットは、
【0153】
【0154】
によって表すことができる。一実施形態では、ベイジアンネットワーク構造発見モジュール224は、値
【0155】
【0156】
を最大化するベイジアンネットワーク
【0157】
【0158】
を探索することにより、ベイジアンネットワークを学習することができ、ここで、φはスコアリング機能を示し、
【0159】
【0160】
は、Xから見出される隠れ状態θのサンプルを示す。一実施形態では、ベイジアンネットワーク構造発見モジュール224は、ベイジアン情報基準(BIC)スコアによって
【0161】
【0162】
を検索するためのGreedyのヒルクライミング法を使用することができる。
【0163】
ベイジアンネットワーク構造発見モジュール224は、ベイジアンネットワークフレームワークを使用して、不規則事象及び規則的事象に対する依存性モデルを説明することができる。
図5に示す基本依存性モデルを考慮すると、ベイジアンネットワーク構造発見モジュール224は、不規則的及び規則的事象のために、完全な依存性構造(BN構造)を自動的に学習することができる。次いで、完全な依存性構造を所与として、ベイジアンネットワークパラメータ推定アルゴリズムを使用して、規則的及び不規則的事象に対する依存確率(すなわち、BN分布)を計算することができる。本発明の一実施形態では、ベイジアンネットワーク構造発見モジュール224は、センサ測定値、気象データ(例えば、温度、露点、湿度、イベント、及び条件)、及びタイムスタンプ(月、週、日、時間)から、BNを学習することができる。更に、システムはまた、ユーザが入力(例えば、ブラックリスト及びホワイトリスト)を
図5の学習モデルに手動で提供することを可能にすることができる。
【0164】
分析モジュール226は、次に、ノードiがリーフノード(すなわち、子なしのノード)であるまで、以下の動的方程式(6)を連続的に計算することによって、根本原因分析を実行する。
【0165】
【0166】
ここで、Jiはノードiの親ノードを示し、θJiは、ノードiの親ノードの状態を表し、
【0167】
【0168】
は標的センサの異常状態を示す。
【0169】
図6は、本発明の一実施形態に係る、
図2のアーキテクチャについての根本原因分析システム設計を示している。
図6は、2つの独立して実行されるシステム:トレーニングのためのシステム612、及び推論のためのシステム614を示している。一実施形態では、トレーニングシステム612は、データベースサーバからのデータストリーム602のバッチからベイジアンネットワーク構造606を学習し、工場レイアウト618の事前知識を学習することができる。推論システム614は、トレーニングデータセット608で利用可能でありかつユーザ定義の標的センサ616が与えられたベイジアンネットワーク構造の最新の更新を使用して、根本原因分析タスク610を実行することができる。メッセージ待ち行列604は、データベース、トレーニングシステム612、及び推論システム614の間のデータストリームを適切に制御することができる。
【0170】
図7Aは、本発明の一実施形態に係る、例示的な有向依存性グラフを示している。ノード702-732は、異なるセンサを表し、ノードを接続する有向エッジは、ノード間の接続を表す。
図7Bは、本発明の一実施形態に係る、有向依存性グラフを使用した根本原因分析の例示的な結果を示している。標的センサ710(黒影付き円)が与えられると、システムは、
図7Bに示される有向依存性グラフを使用して、根本原因分析を実行する。一実施形態では、根本原因分析は、式(6)を使用して計算される。例えば、所与の標的センサ710の異常状態が「アイドル」状態に設定されている場合、式(6)を使用して、以下の機械に存在する条件により、センサ710内の「アイドル」状態が最も起こりやすいと結論付けることができる:センサ720に関連付けられた機械もアイドル状態である場合、センサ716に関連付けられた機械の入力において利用可能な入力がない場合、及びセンサ712に関連付けられた機械の接触時間が通常よりも長い場合。また、異常の最も確率が高い原因は、その状態の最も確率の高い原因がセンサ716及び730のうちのセンサ730’のオフ状態である、センサ716の「入力なし」状態によるものである。したがって、所与の標的センサ710内の異常状態の根本原因は、センサ730の特定のオフ状態にトレースバックされることができる。
【0171】
図8は、本発明の一実施形態に係る、異常事象の根本原因分析を実行するための例示的なプロセスを示すフローチャートを示している。動作中、システムは、センサデータベースに記憶されたセンサデータを取得することができる(動作802)。センサデータは、工場レイアウトで1つ以上の機械に埋め込まれた複数のセンサに関連付けられる。
【0172】
産業用IoT用途では、センサの数の増加に起因して、収集されたセンサデータの量は大きくなり得る。更にまた、センサデータは、通常、欠落した、破損した、ノイズが多い、及び非常に相関がある値を含む、多数の悪状態データを含む。このような不良な品質のセンサデータが根本原因分析を実行するために使用される場合、結果は不正確であり、したがって信頼することができない。更にまた、根本原因分析の計算複雑性は、多数のセンサデータに起因して大幅に増加し得る。センサデータのコンパクトかつ情報的表現を提供するために、システムは、センサデータをセンサ状態のセットに変換する(動作804)。
【0173】
動作804に続いて、システムは、センサ状態のセットを使用して、最適なDAG構造を連続的に学習し、最も確率の高いBN構造を選択することによって、最適なBN構造を構築することができる(動作806)。次いで、システムは、最適なDAG構造について、グラフ内の直接隣接するもののうちのいくつかの状態を所与として、ユーザ指定の標的センサの異常状態の確率を判定することができる(動作808)。次いで、システムは、DAG上の異常状態をバックトラッキングすることによって、標的センサの異常状態の最も確率可能な原因を判定することができる(動作810)。
【0174】
例示的なコンピュータシステム及び装置
図9は、本発明の一実施形態に係る、根本原因分析システムを容易にする例示的なコンピュータシステムを示している。コンピュータシステム900は、プロセッサ902、メモリ904、及び記憶デバイス906を含む。コンピュータシステム900は、ディスプレイ装置910、キーボード912、及びポインティングデバイス914に結合されることができ、また、1つ以上のネットワークインターフェースを介してネットワーク908に結合されることができる。記憶装置906は、オペレーティングシステム918及び根本原因分析システム920を記憶することができる。
【0175】
根本原因分析システム920は、コンピュータシステム900によって実行されると、コンピュータシステム900に、本開示で説明される方法及び/又はプロセスを実行させることができる命令を含むことができる。根本原因分析システム920はまた、1つ以上のセンサに関連付けられたセンサデータを受信するための命令(センサデータ受信モジュール922)、センサデータ前処理を実行するための命令(センサデータ前処理モジュール924)、及びデータ前処理ステージの後にセンサデータを更に処理するための命令(データ要約モジュール926)と、を含むことができる。更にまた、根本原因分析システム920は、最も確率の高いグラフィカル構造を発見し、ユーザ指定の標的センサにおける異常の根本原因を判定するための命令(モデル発見モジュール928)を含むことができる。
【0176】
図10は、本発明の一実施形態に係る、監視されていない異常検出システムを容易にする例示的な装置を示している。装置1000は、有線、無線、量子光、又は電気通信チャネルを介して互いに通信し得る複数のユニット又は装置を備えることができる。装置1000は、1つ以上の集積回路を使用して実現されることができ、
図10に示されているものよりも少ない又は多いユニット又は装置を含むことができる。更に、装置1000は、コンピュータシステムに統合され得るか、又は他のコンピュータシステム及び/若しくはデバイスと通信することができる別個のデバイスとして実現され得る。具体的には、装置1000は、
図9のコンピュータシステム900のモジュール920-928と同様の機能又は動作を実行するユニット1002-1010を備えることができ、センサデータ受信ユニット1002と、センサデータ前処理ユニット1004と、データ要約ユニット1006と、モデル発見ユニット1008とを含む。装置1000は、通信ユニット1010を更に含むことができる。
【0177】
一般に、本発明の実施形態は、DAGを使用して高次元センサデータの異常事象の根本原因を追跡する方法及びシステムを提供する。センサデータを使用して工場機械動作における異常の根本原因を発見することが、例として使用されている。実際には、この解決策は、工場機械に関連付けられた異常の検出に限定されるものではない。また、他の種類の装置又は機械装置における異常を検出するために使用することもできる。
【0178】
「発明を実施するための形態」の節に記載される方法及びプロセスは、上に論じられるようなコンピュータ可読記憶媒体内に記憶され得るコード及び/又はデータとして具体化され得る。コンピュータシステムが、コンピュータ可読記憶媒体上に記憶されたコード及び/又はデータを読み取って実行すると、コンピュータシステムは、データ構造及びコードとして具体化され、コンピュータ可読記憶媒体内に記憶された方法及び処理を実行する。
【0179】
更に、上述の方法及び処理は、ハードウェアモジュール又は装置に含まれてもよい。ハードウェアモジュール又は装置としては、特定用途向け集積回路(application-specific integrated circuit、ASIC)チップ、フィールドプログラム可能ゲートアレイ(field-programmable gate array、FPGA)、特定の時刻に特定のソフトウェアモジュール又はコードを実行する専用又は共有プロセッサ、及び、既知の又は後に開発される他のプログラム可能論理デバイスを含むことができるが、これらに限定されない。ハードウェアモジュール又は装置が起動されると、それらの内部に含まれる方法及び処理が実行される。
【0180】
本明細書に記載される前述の実施形態は、例示及び説明のみを目的として提示されている。それらは、網羅的であること、又は本発明を開示される形態に限定することを意図するものではない。したがって、多くの修正及び変形が、当業者には明らかであろう。更に、上記の開示は、本発明を限定することを意図するものではない。本発明の範囲は、添付の特許請求の範囲によって定義される。