IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ アイオーカレンツ, インコーポレイテッドの特許一覧

特表2022-523563機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類
<>
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図1
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図2
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図3
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図4
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図5
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図6
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図7
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図8
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図9
  • 特表-機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2022-04-25
(54)【発明の名称】機械学習および人工知能を使用する、機械異常の近リアルタイム検出ならびに分類
(51)【国際特許分類】
   G06F 11/34 20060101AFI20220418BHJP
   G06N 20/00 20190101ALI20220418BHJP
【FI】
G06F11/34 152
G06N20/00
G06F11/34 147
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021552749
(86)(22)【出願日】2020-03-03
(85)【翻訳文提出日】2021-10-26
(86)【国際出願番号】 US2020020834
(87)【国際公開番号】W WO2020180887
(87)【国際公開日】2020-09-10
(31)【優先権主張番号】62/813,659
(32)【優先日】2019-03-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】521395816
【氏名又は名称】アイオーカレンツ, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】バタチャリヤ, バスカー
(72)【発明者】
【氏名】フリードマン, サミュエル
(72)【発明者】
【氏名】キング, コスモ
(72)【発明者】
【氏名】ヘンダーソン, キルステン
【テーマコード(参考)】
5B042
【Fターム(参考)】
5B042JJ29
5B042MA09
5B042MA14
5B042MC33
5B042MC38
5B042MC40
(57)【要約】
システムの異常な動作を決定する方法は、動作パラメータが感知されたときに、システムが安定した状態で動作していたかどうかを表す、安定性インジケータを伴って、動作状態の範囲にわたってシステムの感知された(または決定された)動作パラメータを表す、データのストリームを捕捉するステップと、安定した動作を表す動作体制に関して、振幅依存性パラメータと、経時的なその分散のパラメータとを含む、データのストリームの統計的性質を決定するステップと、システムの正常な動作と異常な動作とを区別する、統計的性質に関する統計ノルムを決定するステップと、新しい統計的性質を決定し、正常なシステム動作と異常なシステム動作とを区別するステップと、信号を出力するステップとを含む。
【特許請求の範囲】
【請求項1】
システムの異常な動作を決定する方法であって、
訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表す訓練データの複数のストリームを捕捉することであって、前記状態の範囲は、少なくとも前記システムの正常な状態を含む、ことと、
(a)個別の訓練データの予測値と前記個別の訓練データの測定値との間の複数の定量的標準化誤差、および(b)経時的な個別の複数の定量的標準化誤差の分散を決定することを含む、前記訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表す前記データの複数のストリームの合同統計的性質を決定することと、
前記システムの正常な状態と前記システムの異常な状態とを区別する特徴付けられた合同統計的性質に関する統計ノルムを決定することと、
不揮発性メモリ内に前記決定された統計ノルムを記憶することと
を含む、方法。
【請求項2】
訓練データの少なくとも1つのストリームは、前記訓練段階の間の前記システムの状態の範囲にわたって前記センサ読取値を表す前記データの複数のストリームの合同統計的性質を特徴付けることに先立って、集約および/またはフィルタ処理される、請求項1に記載の方法。
【請求項3】
クラウドデバイスが動作データの複数のストリームの合同統計的性質を特徴付けることに先立って、訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表す前記訓練データの捕捉された複数のストリームをエッジデバイスから前記クラウドデバイスに通信することと、
前記決定された統計ノルムを前記クラウドデバイスから前記エッジデバイスに通信することと
をさらに含み、
前記不揮発性メモリは、前記エッジデバイス内に提供される、請求項1に記載の方法。
【請求項4】
動作段階の間のセンサ読取値を表す動作データの複数のストリームを捕捉することと、
個別の動作データの予測値と前記個別の訓練データの測定値との間の複数の定量的標準化誤差、および前記エッジデバイス内の経時的な前記個別の複数の定量的標準化誤差の分散を決定することと、
前記複数の定量的標準化誤差および前記個別の複数の定量的標準化誤差の分散を前記決定された統計ノルムと比較し、前記動作段階の間の前記センサ読取値を表す前記動作データの複数のストリームが、システム動作の異常な状態を表すかどうかを決定することと
をさらに含む、請求項3に記載の方法。
【請求項5】
前記訓練段階の後続の前記システムの動作の間に取得されるセンサデータと前記統計ノルムとの間の統計的差異に基づいて、動作の異常な状態を決定することをさらに含む、請求項1に記載の方法。
【請求項6】
前記異常な状態の間に取得される前記センサデータに分析を実施し、前記異常な状態につながる取得される前記センサデータのシグネチャを定義し、前記異常な状態につながる取得される前記センサデータの定義されたシグネチャを第2のシステムに通信することをさらに含む、請求項5に記載の方法。
【請求項7】
第2のシステムから、前記第2のシステムの異常な状態につながる取得されるセンサデータの定義されたシグネチャを受信し、前記訓練段階後にセンサデータのストリームのシグネチャ分析を実施することをさらに含む、請求項6に記載の方法。
【請求項8】
第2のシステムから、前記第2のシステムの異常な状態につながる取得されるセンサデータの定義されたシグネチャを受信し、前記統計ノルムが、前記異常な状態に先行するセンサデータのパターンを動作の正常な状態と区別するために更新されるように、前記定義されたシグネチャを前記決定された統計ノルムと統合することをさらに含む、請求項6に記載の方法。
【請求項9】
前記複数の定量的標準化誤差に関してzスコアを決定することをさらに含む、請求項1に記載の方法。
【請求項10】
前記訓練データの複数のストリームを遠隔サーバに伝送することと、
前記特徴付けられた合同統計的性質を前記遠隔サーバに伝送することと、
前記統計ノルムを前記遠隔サーバに伝送することと、
前記統計ノルムに基づいて、前記システムが異常に動作しているかどうかの決定を表す信号を前記遠隔サーバに伝送することと、
前記遠隔サーバから前記特徴付けられた合同統計的性質を受信することと、
前記遠隔サーバから前記統計ノルムを受信することと、
前記統計ノルムに基づいて、前記遠隔サーバから前記システムが異常に動作しているかどうかの決定を表す信号を受信することと、
他のシステムに関する個別の統計ノルムに基づいて、前記訓練段階の間の前記状態の範囲外の前記システムの動作のタイプを表す前記システムの動作に関する予測される統計ノルムを表す信号を前記遠隔サーバから受信することと
のうちの少なくとも1つをさらに含む、請求項1に記載の方法。
【請求項11】
前記訓練段階後に受信されるセンサデータのストリームを受信することと、
前記訓練段階後に受信される前記受信されたセンサデータのストリームの間の差異に基づいて、前記システムの動作の異常な状態を決定することと、
前記訓練段階後に受信されるセンサデータのログを、動作の異常な状態の注釈でタグ付けすることと
をさらに含む、請求項1に記載の方法。
【請求項12】
前記動作の異常な状態を分類することをさらに含む、請求項11に記載の方法。
【請求項13】
少なくともk近傍法分析を実施することによって、前記訓練段階後に受信されるセンサデータのストリームを分類することをさらに含む、請求項1に記載の方法。
【請求項14】
前記訓練段階後に受信されるセンサデータのストリームが安定した動作状態であるかどうかを決定し、前記センサデータのストリームのログを安定性の特性評価でタグ付けすることをさらに含む、請求項1に記載の方法。
【請求項15】
前記合同統計的性質は、第1の合同統計的性質であり、前記訓練段階は、第1の訓練段階であり、前記統計ノルムは、第1の統計ノルムであり、前記方法はさらに、
少なくとも部分的に前記第1の統計ノルムに基づいて、前記システムの異常な状態の閾値数の誤検出事例を検出することに応答して、
第2の訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表すデータの複数のストリームの第2の合同統計的性質を決定することと、
前記システムの正常な状態と前記システムの異常な状態とを区別する前記第2の合同統計的性質に関する第2の統計ノルムを決定することと、
不揮発性メモリ内に前記決定された第2の統計ノルムを記憶することと
を含む、請求項1に記載の方法。
【請求項16】
前記第1の合同統計的性質は、第1の統計モデルに従って決定され、前記第2の合同統計的性質は、第2の統計モデルに従って決定される、請求項15に記載の方法。
【請求項17】
少なくとも部分的に前記第1の統計ノルムに基づいて予測される1つ以上の異常な状態と重複する時間窓の間に取得される前記システムの状態の範囲にわたってセンサ読取値を表すデータの複数のストリームに関して複数の統計モデルを発生させることをさらに含む、請求項16に記載の方法。
【請求項18】
誤検出率、正検出率、またはリードタイムのうちの少なくとも1つに基づいて、前記複数のモデルから前記第2の統計モデルを選択することをさらに含む、請求項17に記載の方法。
【請求項19】
異常な動作状態を決定するためのシステムであって、
入力ポートであって、前記入力ポートは、訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表す訓練データの複数のストリームを受信するように構成される、入力ポートと、
少なくとも1つの自動プロセッサであって、前記少なくとも1つの自動プロセッサは、
個別の訓練データの予測値と前記個別の訓練データの測定値との間の複数の定量的標準化誤差、および経時的な個別の複数の定量的標準化誤差の分散に基づいて、前記訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表すデータの複数のストリームの合同統計的性質を特徴付けることと、
前記システムの正常な状態と前記システムの異常な状態とを確実に区別する前記特徴付けられた合同統計的性質に関する統計ノルムを決定することと
を行うように構成される、少なくとも1つの自動プロセッサと、
前記決定された統計ノルムを記憶するように構成される不揮発性メモリと
を備える、システム。
【請求項20】
前記少なくとも1つの自動プロセッサはさらに、
動作段階の間のセンサ読取値を表す動作データの複数のストリームを捕捉することと、
個別の動作データの予測値と前記個別の訓練データの測定値との間の複数の定量的標準化誤差、および経時的な前記個別の複数の定量的標準化誤差の分散を決定することを含む、前記動作データの複数のストリームの合同統計的性質を特徴付けることと、
前記動作データの複数のストリームの特徴付けられた合同統計的性質を前記決定された統計ノルムと比較し、前記動作段階の間の前記センサ読取値を表す前記動作データの複数のストリームが、システム動作の異常な状態を表すかどうかを決定することと
を行うように構成される、請求項19に記載のシステム。
【請求項21】
前記少なくとも1つの自動プロセッサはさらに、
動作段階の間のセンサ読取値を表す動作データの複数のストリームを捕捉することと、
前記決定された統計ノルムに関する前記動作データの捕捉された複数のストリームのマハラノビス距離、バタチャリヤ距離、チェルノフ距離、マツシタ距離、KL発散、対称KL発散、パトリック・フィッシャー距離、リサック・フー距離、コルモゴロフ距離、またはマハラノビス角度のうちの少なくとも1つを決定することと
を行うように構成される、請求項19に記載のシステム。
【請求項22】
前記少なくとも1つの自動プロセッサはさらに、前記訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表す前記訓練データの複数のストリームと、前記システムの動作段階の間のセンサ読取値を表す動作データの捕捉された複数のストリームとの間のマハラノビス距離を決定するように構成される、請求項19に記載のシステム。
【請求項23】
前記少なくとも1つの自動プロセッサはさらに、前記訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表す前記訓練データの複数のストリームと、前記システムの動作段階の間のセンサ読取値を表す動作データの捕捉された複数のストリームとの間のバタチャリヤ距離を決定するように構成される、請求項19に記載のシステム。
【請求項24】
前記少なくとも1つの自動プロセッサはさらに、前記訓練段階後に受信されるセンサデータのストリームに関してzスコアを決定するように構成される、請求項19に記載のシステム。
【請求項25】
前記少なくとも1つの自動プロセッサはさらに、前記訓練段階後に受信されるセンサデータのストリームを間引くように構成される、請求項19に記載のシステム。
【請求項26】
前記少なくとも1つの自動プロセッサはさらに、前記訓練段階後に受信されるセンサデータのストリームを間引き、それに関してzスコアを決定するように構成される、請求項19に記載のシステム。
【請求項27】
前記システムの状態の範囲にわたって前記センサ読取値を表す前記訓練データの複数のストリームは、複数の異なるタイプのセンサからのデータを備える、請求項19に記載のシステム。
【請求項28】
前記システムの状態の範囲にわたって前記センサ読取値を表す前記訓練データの複数のストリームは、同一のタイプの複数の異なるセンサからのデータを備える、請求項19に記載のシステム。
【請求項29】
システムの非異常動作に関して統計ノルムを決定する方法であって、
遠隔サーバにおいて訓練データの複数の捕捉されたストリームを受信することであって、前記訓練データの捕捉された複数のストリームは、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、ことと、
前記訓練データの受信される複数の捕捉されたストリームを処理し、前記システムの正常な状態と前記システムの異常な状態とを確実に区別する特徴付けられた合同統計的性質に関する統計ノルムを決定することであって、前記特徴付けられた合同統計的性質は、個別の訓練データの予測値と前記個別の訓練データの測定値との間の定量的標準化誤差と、経時的な個別の複数の定量的標準化誤差の分散とを備える前記訓練段階の間の前記システムの状態の範囲にわたってセンサ読取値を表すデータの複数のストリームに基づく、ことと、
前記決定された統計ノルムを前記システムに伝送することと
を含む、方法。
【請求項30】
前記システムにおいて、動作段階の間の前記システムの状態の範囲にわたってセンサ読取値を表すデータのストリームを捕捉し、前記動作段階の間の前記システムの状態にわたってセンサ読取値を表す前記データのストリームが、前記統計ノルム内にあるかどうかに依存して、選択的に信号を生成することをさらに含む、請求項29に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本願は、参照することによってその全体として本明細書に組み込まれる、2019年3月4日に出願され、「SYSTEM AND METHOD FOR NEAR REAL-TIME DETECTION AND CLASSIFICATION OF MACHINE ANOMALIES USING MACHINE LEARNING」と題された、仮米国出願第62/813,659号の利益を主張する。
【0002】
本開示は、機械における異常検出の分野に関し、より具体的には、エンジン異常の近リアルタイム検出のための機械学習の使用に関する。
【背景技術】
【0003】
機械学習は、多くの異なる問題に適用されてきた。1つの着目問題は、システムが正常に動作しているかどうか、またはシステム自体、もしくはそれが動作しているコンテキストが異常であるかどうかを決定するためのセンサおよびコンテキスト情報、特に、そのような情報のストリームの分析である。これは、極端な条件下で正常に動作することと区別されることになる。本技術は、したがって、雑音および極端な事例に直面して、正常と異常(abnormalまたはanomalous)とを区別するための意思決定を伴う。
【0004】
多くの場合、データは、多次元であり、あるコンテキストが、推論的にのみ利用可能である。さらに、決定閾値が、異なるタイプの誤差、例えば、タイプI、タイプII、タイプIII、およびタイプIVの影響に敏感となるべきである。
【0005】
異常検出は、メトリックが、傾向を考慮して、過去と異なるように挙動しているかどうかを識別する方法である。これは、1つだけのクラス(正常)が訓練データに表されるため、1クラス分類として実装される。種々の異常検出技法が、セキュリティシステム、詐欺検出、および統計的プロセス監視等の分野で日常的に採用される。
【0006】
異常検出方法が、文献に説明され、種々の業界で多種多様な用途において広範囲に使用される。利用可能な技法は、ルールベースである、またはニューラルネットワークに基づく分類方法(en.wikipedia.org/wiki/Neural_network参照)、ベイズネットワーク(en.wikipedia.orgg/wiki/Bayesian_network参照)、もしくはサポートベクトルマシン(en.wikipedia.org/wiki/Support-vector_machine参照)、k近傍法(en.wikipedia.org/wiki/K-nearest_neighbors_algorithm参照)および相対密度を含む、最近傍ベースの方法(en.wikipedia.org/wiki/Nearest_neighbour_distribution参照)、クラスタ化ベースの方法(en.wikipedia.org/wiki/Cluster_analysis参照)、ならびにヒストグラムまたはカーネル関数に基づくパラメトリックおよび非パラメトリック方法を含む、統計的およびファジーセットベースの技法を含む(Chandola et al., 2009、Olson et al., 2018、Kanarachos et al., 2017、Zheng et al., 2016)。
【0007】
パターン認識では、k近傍法アルゴリズム(k-NN)は、分類および回帰のために使用される非パラメトリック方法である。両方の場合において、入力は、特徴空間内のk個の最も近い訓練実施例から成る。出力は、k-NNが分類または回帰のために使用されるかどうかに依存し、k-NN分類では、出力は、クラスメンバーシップである。オブジェクトが、その隣接物の複数の投票によって分類され、オブジェクトは、そのk個の最近傍の隣接物(kは、典型的には小さい、正の整数である)の中で最も一般的なクラスに割り当てられる。k=1である場合、オブジェクトは、単に、その単一の最近傍の隣接物のクラスに割り当てられる。k-NN回帰では、出力は、オブジェクトに関する性質値である。本値は、そのk個の最近傍の隣接物の値の平均である。k-NNは、あるタイプのインスタンスベースの学習、または関数が局所的にのみ近似され、全ての算出が分類までに延期される、遅延学習である。k-NNアルゴリズムは、全ての機械学習アルゴリズムのうちの最も単純なものの中にある。分類および回帰の両方に関して、より近傍の隣接物が、より遠隔のものよりも平均に寄与するように、有用な技法が、加重を隣接物の寄与に割り当てるために使用されることができる。例えば、一般的な加重スキームは、dが隣接物までの距離である、1/dの加重を各隣接物に与えることから成る。隣接物は、(k-NN分類に関して)クラスまたは(k-NN回帰に関して)オブジェクト性質値が把握される、オブジェクトのセットから取り込まれる。これは、アルゴリズムのための訓練セットと考えられることができるが、いずれの明示的訓練ステップも要求されない。k-NNアルゴリズムは、それがデータのローカル構造に敏感であることである。
【0008】
Zhou et al.(2006)は、サンプル類似性からアンサンブル類似性を特徴付けることに関与する問題を説明する。Ωが着目空間を表すとする。サンプルは、空間Ω内の要素である。α∈Ωおよびβ∈Ωが2つのサンプルであると仮定すると、サンプル類似性関数は、αとβとの間の接近性を測定する2入力関数k(α,β)である。アンサンブルは、複数のサンプルを含有するΩのサブセットである。α∈ΩおよびB={β,…,β}であり、β∈Ωである、A={α,…,α}は、2つのアンサンブルであり、MおよびNが必ずしも同一ではないと仮定すると、アンサンブル類似性は、AとBとの間の接近性を測定する2入力関数k(A,B)である。サンプル類似性k(α,β)から開始すると、理想的なアンサンブル類似性k(A,B)は、AおよびB内の全ての要素の間の全ての可能性として考えられる一対類似性関数を利用するべきである。全てのこれらの類似性関数は、いわゆるグラム行列でエンコードされる。アンサンブル類似性関数k(A,B)のアドホック構築の実施例は、クロスドット積の平均または中央値、すなわち、上記のグラム行列の右上隅を取り込むことを含む。アンサンブルAは、基礎的確率分布p(α)からの互いに独立で同一の分布に従う実現のセットと考えられる。したがって、アンサンブル類似性は、2つの確率分布の間の距離の同等の説明、すなわち、確率的距離尺度である。確率的距離尺度をJ(A,B)によって表すことによって、k(A,B)=J(A,B)を有する。
【0009】
確率的距離尺度は、重要な数量であり、確率および統計学、パターン認識、情報理論、通信等の多くの研究分野でのそれらの使用を見出す。統計学では、確率的距離は、多くの場合、漸近分析で使用される。パターン認識では、パターン分離可能性は、通常、誤差の確率のための境界を提供するため、チェルノフ距離またはバタチャリヤ距離等の確率的距離尺度を使用して評価される。情報理論では、カルバック・ライブラ(KL)距離または相対エントロピーの特別な実施例である、相互情報量が、チャネル容量に関連する基本数量である。通信では、KL発散およびバタチャリヤ距離尺度は、信号選択のために使用される。しかしながら、サンプル類似性関数k(α,β)と確率的距離尺度J(A,B)との間に間隙が存在する。空間Ωがベクトル空間である、例えば、Ω=Rであり、類似性関数が通常の内積k(α,β)=αβであるときのみ、確率的距離尺度Jは、R上で定義されるものと一致する。これは、内積と距離メトリックとの間の等価性に起因する。
【0010】
||α-β||=αα-2αβ+ββ=k(α,α)-2k(α,β)+k(β,β)
【0011】
これは、サンプル類似性関数k(α,β)が非線形特徴空間R内の内積を評価する、カーネル方法の考慮につながる。
k(α,β)=φ(α)φ(β) (1)
【0012】
式中、φ:Ω→Rは、非線形マッピングであり、fは、特徴空間の寸法である。これは、いわゆる「カーネルトリック」である。方程式(1)における関数k(α,β)は、再生カーネル関数と称される。非線形特徴空間は、カーネル関数kによって誘発される、再生カーネルヒルベルト空間(RKHS)Hと称される。関数が再生カーネルであるために、これは、正定値であり、すなわち、マーサーの定理を満たさなければならない。RKHS内の距離メトリックは、以下のように評価されることができる。
||φ(α)-φ(β)||=Φφ(α)φ(α)-2φ(α)φ(β)+φ(β)φ(β)=k(α,α)-2k(α,β)+k(β,β) (2)
x∈Rである、N(x;μ,Σ)が、N(x;μ,Σ)=1/(√((2π)|Σ|exp{-1/2(x-μ)Σ-1(x-μ)}として定義される多変量ガウス密度であり、x∈Rであり、|・|が行列式であると仮定されたい。p(x)=N(x;μ,Σ)およびp(x)=N(x;μ,Σ)であると、下記の表は、2つのガウス密度の間のいくつかの確率的距離を列挙する。
2つの密度に関する共分散行列が同一である、すなわち、Σ=Σ=Σであるとき、バタチャリヤ距離および対称発散は、マハラノビス距離:J=J=8Jに変換する。
【表1】
【0013】
【表2】
【0014】
【化1-1】

【化1-2】

【化1-3】

【化1-4】
【0015】
異常検出のために訓練段階および試験段階における算出複雑性を低減させながら、放射基底関数(RBF)カーネルに基づくサポートベクトルデータ記述(SVDD)方法が使用されてもよい。サポートベクトルマシン(SVM)の利点は、一般化能力がカーネルの適切な選択によって改良されることである。マハラノビスカーネルは、RBFカーネルが行うよりもデータ分布情報を活用する。Trinh et al.(2017年)は、実際の無線センサネットワークデータセットにおける異常検出への適用を伴って、調節可能な判別閾値とマハラノビスカーネルを併用して、SVDDを開発している。SVDD方法は、全ての(または殆どの)データを含有する最小量を伴う球体を推定することを目指す。また、概して、これらの訓練サンプルは、未知の分布に属すると仮定される。
【0016】
【化2-1】

【化2-2】

【化2-3】
【0017】
Gillespie et al.(2017)は、エッジにおけるリアルタイム分析、すなわち、異常な機器挙動を識別し、モノのインターネット用途のためにエッジの近傍のデータをフィルタ処理することを説明している。異常検出のための機械学習技法は、SAS(登録商標)イベントストリーム処理エンジンを使用し、ストリーミングセンサデータを分析し、ターボファンエンジンの性能が正常な動作条件から逸脱するときを決定する。エンジンからのセンサ読取値が、アセット劣化を検出し、予防保守用途に役立つために使用される。SVDDと呼ばれる、単一クラス分類機械学習技法が、データ内の異常を検出するために使用される。本技法は、各エンジンがそのライフサイクルにわたって劣化する様子を示す。本情報は、次いで、必要に応じた基準で、アラートを提供する、または特定のアセットのための保守をトリガするために、実践で使用されることができる。いったんモデルが訓練されると、スコアコードが、新しい観察上でSVDDをスコア化することの正当性を立証し、SVDDモデルがモノのインターネット(IoT)エッジ用途で機能し得る様子をシミュレートするように、SAS(登録商標)イベントストリーム処理を起動するシンクライアントデバイス上に展開された。
【0018】
エッジにおけるIoT処理またはエッジコンピューティングが、中心サーバから、データが発生される場所に近いデバイスに分析をプッシュする。したがって、エッジコンピューティングは、分析の意思決定能力を、データのソースにより近い集中型ノーズから移行させる。これは、いくつかの理由により、重要であり得る。これは、速度が重要である用途のために待ち時間を短縮することに役立ち得る。また、エッジデバイスにおける知的データフィルタリングの使用を通して、データ伝送および記憶コストを削減することもできる。Gillespie et al.の場合では、ターボファンエンジンの集合からのセンサが、エンジン劣化および将来の故障を決定するために評価された。スコア化モデルが、劣化を示す異常のリアルタイム検出を行うことが可能であるように構築された。
【0019】
SVDDは、単一クラス分類を行うために使用され得る、機械学習技法である。モデルは、モデルを構築するために使用される訓練データの周囲に最小半径の超球形を生成する。超球形は、カーネル関数の使用を通して柔軟に作製される(Chaudhuri et al. 2016)。したがって、SVDDは、多種多様のデータセットについての柔軟なデータ記述を提供することができる。方法論はまた、データの正常性に関していずれの仮定も要求せず、これは、多変量統計プロセス制御と関連付けられる他の異常検出技法に関する限界であり得る。モデルを構築するために使用されるデータが、正常な条件を表す場合、超球形の外側にある観察は、可能性として考えられる異常を表すことができる。これらは、以前に生じた異常、または履歴データで見出されていないであろう新しい異常であり得る。モデルが、正常と見なされるデータを用いて訓練されるため、モデルは、以前に異常な実施例と見なされていなかった場合でさえも、任意の観察を異常としてスコア化することができる。
【0020】
モデルを訓練するために、正常条件下で動作していると仮定された時系列の開始以内のエンジンの小さいセットからのデータが、サンプリングされた。SVDDアルゴリズムは、機器またはシステムに関する正常な動作条件の範囲を使用して構築された。例えば、鉱山内の運搬トラックは、ペイロードを伴わない平坦な道路上で進行しているとき、および鉱石を伴って丘を登っているときに、非常に異なるセンサデータ読取値を有し得る。しかしながら、両方の読取値は、機器に関する正常な動作条件を表す。モデルは、SAS視覚データマイニングおよび機械学習内のsvddアクションセットからのsvddTrainアクションを使用して訓練された。アクションによって発生されたASTOREスコア化コードが、次いで、ゲートウェイデバイス上のSASイベントストリーム処理を使用して、新しい観察をスコア化するために使用されるように保存された。Dell Wyse 3290が、Wind River Linux(登録商標)およびSASイベントストリーム処理(ESP)を用いて設定された。ESPモデルが、着信観察を取り込み、VDMMLプログラムによって発生されるASTOREコードを使用して、それらをスコア化し、観察毎にスコア化された距離メトリックを返すように構築された。本メトリックは、次いで、劣化を監視し、規定閾値を上回る場合、アラートをトリガし得るフラグを生成するために、使用され得る。
【0021】
Gillespie et al.からの結果は、各エンジンが、その耐用年数の第1の部分に関して比較的に安定した正常な動作状態を有し、故障点につながる、距離メトリックの上向きに傾斜した傾向が後に続くことを明らかにした。データの本上向き傾向は、観察が、SVDDモデルによって生成される正常な超球形の重心からますます移動することを示した。したがって、エンジン動作条件は、正常な動作挙動から、ますますさらに移動した。潜在的劣化を示す、距離の増加に伴って、アラートが、スコア化された距離が事前決定された閾値を上回って上昇し始める場合、またはスコア化された距離の移動平均がアセットの初期動作条件からある割合で逸脱する場合、トリガされるように設定されることができる。これは、モデルが監視するために使用される、具体的用途に合わせられることができる。
【0022】
Brandsaeter et al.(2017)は、海運産業で適用されるオンライン異常検出方法論を提供し、残差分析が後に続く、信号再構築に基づく異常検出方法論への修正を提案している。再構築は、クエリ観察が、正常な動作を表すメモリベクトルと呼ばれる履歴観察と比較される、自動連想カーネル回帰(AAKR)を使用して行われる。履歴観察を伴うデータセットが大きく増大するとき、全ての観察がメモリベクトルとして使用されるナイーブアプローチは、容認不可能な大きい算出負荷につながり、故に、メモリベクトルの削減されたセットが、知的に選択されるべきである。観察された信号と再構築された信号との間の残差は、適切なアラームが、残差の逐次挙動に基づいて発せられる、標準逐次確率比検定(SPRT)を使用して分析される。Brandsaeter et al.は、算出時間を短縮する、AAKRによって考慮されるべきメモリベクトルを選択するためのクラスタベースの方法、説明変数と応答変数とを区別することを可能にする、距離尺度の一般化、残差分析で使用される地域的信頼性推定を採用し、クエリベクトルのシーケンスが異常な状態を表すかどうかを識別するために使用される時間を、クエリベクトルの近くに、またはそれを囲繞して位置するデータの量に依存させる。異常検出方法は、正常な動作時の船舶用ディーゼルエンジンの動作の分析に関して試験され、データは、障害を合成するように手動で修正された。
【0023】
異常検出は、予期される挙動に一致しない、データ内のパターンを見出すことの問題を指す(Chandola et al.、2009)。換言すると、異常は、残りのデータセットと矛盾する、観察または観察のサブセットとして定義されることができる(Hodgeおよび Austin、2004;Barnett et al.、1994)。研究および用途の分野に応じて、異常はまた、多くの場合、 異常値、非調和的観察、例外、収差、驚き、特殊性、または汚染物質とも称される(HodgeおよびAustin、2004;Chandola et al.、2009)。異常検出は、雑音除去に関連するが、それと明確に異なる(Chandola et al.、2009)。異常検出の問題への基本的アプローチは、3つのカテゴリに分割されることができる(HodgeおよびAustin、2004;Chandola et al.、2009)。
【0024】
教師あり異常検出。正常および異常な挙動に関して標識されたインスタンスを伴う訓練データセットの可用性が、仮定される。典型的には、予測モデルが、正常および異常な挙動に関して構築され、目に見えないデータが、クラスのうちの1つに割り当てられる。
【0025】
教師なし異常検出。ここでは、訓練データセットは、標識されず、暗示的仮定は、正常なインスタンスが試験データにおける異常よりもはるかに頻繁であることである。本仮定が真ではない場合、そのような技法は、高い誤アラーム率に悩まされる。
【0026】
半教師あり異常検出。半教師あり異常検出では、訓練データは、正常なデータのみを含む。典型的異常検出アプローチは、正常な挙動に対応するクラスに関してモデルを構築し、モデルを使用して試験データの異常を識別することである。半教師ありおよび教師なし方法が、異常クラスのために標識を要求しないため、それらは、教師あり技法よりも広く適用可能である。
【0027】
Ahmad et al.(2017)は、ストリーミングデータのための教師なしリアルタイム異常検出について議論している。ストリーミングデータは、本質的に、概念ドリフトを呈し、持続的に学習するアルゴリズムを好む。さらに、実践では莫大な数の独立ストリームは、異常検出器が完全に自動であることを要求する。Ahmad et al.は、階層時間メモリ(HTM)と呼ばれる、オンラインシーケンスメモリアルゴリズムに基づく異常検出技法を提案している。彼らは、システムの挙動が普通ではなく、以前の正常な挙動と有意に異なる時点として、異常を定義している。異常は、可能性として、差し迫った故障を示す、ジェットエンジンのタービン回転数の変動のようなシステムの負の変化を表し得る。異常はまた、正常な需要よりも強いことを含意する、新製品ページ上の異常に多数のウェブクリックのような正の変化であり得る。いずれにしても、データの異常は、潜在的に有用な情報を伴う異常な挙動を識別する。異常は、個々のデータインスタンスが、それがデータストリーム内で生じる場所から独立して、残りのデータに関して異常と見なされ得る、空間的、またはデータの時間的シーケンスに関連性がある場合、文脈的であり得る。すなわち、データインスタンスは、具体的時間コンテキストのみにおいて異常であり、そうでなければ異常ではない。時間的異常は、多くの場合、微妙であり、実際のデータストリーム内で検出することが困難である。実用的用途において時間的異常を検出することは、基礎的システムに関する問題のための早期警告としての役割を果たし得るため、重要である。
【0028】
ストリーミング用途は、機械学習モデルのための一意の制約および課題を課する。これらの用途は、リアルタイムで生じるデータの連続シーケンスを分析することを伴う。バッチ処理と対照的に、完全データセットは、利用可能ではない。本システムは、収集されるにつれて順次各データ記録を観察し、任意の処理または学習が、オンライン様式で行われなければならない。各時点において、システムの挙動が普通ではないかどうかどうかを決定することが、所望される。決定は、好ましくは、リアルタイムで行われる。すなわち、次の入力を見る前に、アルゴリズムは、現在および前の状態を考慮し、システム挙動が異常であるかどうかを決定するとともに、任意のモデル更新および再訓練を実施しなければならない。バッチ処理と異なり、データは、訓練/試験セットに分割されず、アルゴリズムは、先を見越すことができない。実用的用途は、付加的制約を問題に課する。多くのシナリオでは、システムの統計は、経時的に変化し得、概念ドリフトとして公知の問題である。
【0029】
いくつかの異常検出アルゴリズムは、部分的にオンラインである。それらは、オフライン学習の初期段階を有するか、または先見に依拠し、以前に見られた異常データにフラグを付けるかのいずれかである。殆どのクラスタ化ベースのアプローチは、そのようなアルゴリズムの傘下に入る。いくつかの実施例は、分散型マッチングベースの群化アルゴリズム(DMGA)、オンライン新規性およびドリフト検出アルゴリズム(OLINDDA)、ならびにデータストリームのためのマルチクラス学習アルゴリズム(MINAS)を含む。別の実施例は、訓練データを使用し、異常検出に先立って加重を学習する、自己適応および動的k平均法である。カーネルベースの再帰最小二乗法(KRLS)もまた、いくつかの時間ステップ後に一時的にフラグを付けられたデータインスタンスを解法し、それらが異常であったかどうかを決定するため、先見なしの原理に違反する。しかしながら、EXPoSE等のいくつかのカーネル方法は、我々のリアルタイム異常検出の基準を順守する。
【0030】
ストリーミング異常検出に関して、実践で使用される方法の大部分は、計算上軽量である、統計的技法である。これらの技法は、浮動閾値、極限スチューデント化偏差(グラブスとしても公知である、ESD)およびkシグマ等の異常値検定、変化点検出、統計的仮説検定、ならびにホルト・ウィンターズ等の指数平滑化法を含む。典型性および偏心性的分析は、ユーザ定義パラメータを要求しない、効率的な技法である。これらの技法の殆どは、空間的異常に焦点を合わせ、時間依存性を伴う用途においてそれらの有用性を限定する。
【0031】
より進歩した時系列モデル化および予測モデルは、複雑なシナリオにおいて時間的異常を検出することが可能である。ARIMAは、季節性を伴って時間データをモデル化するための汎用技法である。これは、規則的な毎日または毎週のパターンを伴うデータの異常を検出することに効果的である。ARIMAの拡張は、ある用途のための季節性の自動決定を可能にする。時間的異常に対処することが可能なより近年の実施例は、相対エントロピーに基づく。モデルベースのアプローチが、具体的ユースケースのために開発されているが、明示的な領域知識を要求し、一般化可能ではない。領域特有の実施例は、航空機エンジン測定、クラウドデータセンター温度、およびATM詐欺検出における異常検出を含む。カルマンフィルタリングが、一般的な技法であるが、パラメータ同調は、多くの場合、領域知識および具体的残余誤差モデルを選定することを要求する。モデルベースのアプローチは、多くの場合、計算上効率的であるが、それらの一般化可能性の欠如は、それらの可用性を一般的なストリーミング用途に限定する。
【0032】
方法をリアルタイムストリーミング異常検出のために不適切にし得る、スケーラビリティを妨げる算出制約等のいくつかの他の制限が存在する。実施例は、O(n)において起動し、ストリームが恣意的に長い実践でその有用性を限定する、Lytics Anomalyzerである。次元性は、いくつかの方法を制限的にし得る、別の要因である。例えば、osPCAまたはウィンドウベースのPCA等の主要成分分析(PCA)のオンライン変異型が、低次元空間上に投影され得る、高次元多変量データストリームのみと協働することができる。教師あり分類ベースの方法等のデータ標識を要求する技法は、典型的には、リアルタイム異常検出および連続学習のために不適切である。
【0033】
Ahmad et al.(2017)は、階層時間メモリ(HTM)ネットワークを使用し、種々のデータストリーム上の異常を検出する方法を示す。結果として生じるシステムは、効率的であり、雑音の多いデータに極めて耐性があり、データの統計の変化に持続的に適応し、誤検出を最小限にしながら、微妙な時間的異常を検出する。皮質ニューロンの既知の性質に基づいて、HTMは、皮質内のシーケンス学習のための理論的フレームワークである。HTM実装は、リアルタイムで動作し、予測タスクのためにうまく機能することが示されている。HTMネットワークは、持続的に学習し、それらの入力の時空間特性をモデル化するが、それらは、異常を直接モデル化せず、使用可能な異常スコアを出力しない。予測誤差を直接閾値化するのではなく、Ahmad et al.は、間接的メトリックとして誤差値の分布をモデル化し、本分布を使用して、現在の状態が異常であるという尤度をチェックする。異常尤度は、したがって、HTMモデルの予測履歴に基づいて、現在の状態が異常である程度を定義する、確率的メトリックである。異常尤度を算出するために、最後のW個の誤差値の窓が維持され、分布は、サンプル平均μおよび分散σが、前の誤差値から持続的に更新される、回転正規分布としてモデル化される。次いで、予測誤差の最近の短期平均が、算出され、閾値が、異常を宣言するかどうかを決定するように、ガウステール確率(Q関数)に適用される。閾値化が、テール確率を閾値化することを伴うため、アラートの数に固有の上限および誤検出の数に対応する上界が存在する。異常尤度は、基礎的メトリック値の分布ではなく、予測誤差の分布に基づく。したがって、これは、最近の履歴に対して、モデルが予測することができる程度の尺度である。
【0034】
問題のない予測可能なシナリオでは、HTM異常検出ネットワークの異常尤度は、予測誤差と同様に挙動する。これらの場合において、誤差の分布は、非常に小さい分散を有し、0の近傍に集中されるであろう。予測誤差の任意の急上昇は、同様に、異常の尤度の対応する急上昇につながるであろう。しかしながら、ある固有のランダム性または雑音を伴うシナリオでは、分散は、より広く、平均は、0からより遠いであろう。予測誤差の単一の急上昇ではなく、一連の急上昇が、異常尤度の有意な増加につながるであろう。著しくランダムから完全に予測可能になるシナリオもまた、異常をトリガするであろう。
【0035】
【化3-1】

【化3-2】

【化3-3】

【化3-4】

【化3-5】

【化3-6】

【化3-7】

【化3-8】

【化3-9】

【化3-10】


【化3-11】

【化3-12】

【化3-13】

【化3-14】

【化3-15】

【化3-16】

【化3-17】

【化3-18】

【化3-19】

【化3-20】


【化3-21】

【化3-22】

【化3-23】

【化3-24】

【化3-25】

【化3-26】

【化3-27】

【化3-28】

【化3-29】

【化3-30】


【化3-31】

【化3-32】
【図面の簡単な説明】
【0036】
図1図1は、いくつかの実施形態による、例示的独立変数時系列、すなわち、タグボート上のエンジン冷却剤温度異常を検出するための訓練周期の間のエンジンRPMおよび負荷を示す。
【0037】
図2図2は、いくつかの実施形態による、訓練周期の間の例示的エンジン冷却剤温度および予測値の標準誤差を示す。
【0038】
図3図3は、いくつかの実施形態による、訓練周期の間の6つのエンジンセンサデータ(冷却剤温度)、冷却剤圧力(冷却剤圧力)、油温度(油温度)、油圧(油圧)、燃料圧力(燃料圧力)、および燃料アクチュエータ割合(燃料アクチュエータ割合)からの誤差の算出されたzスコアの例示的マハラノビス距離時系列を示す。
【0039】
図4図4は、いくつかの実施形態による、試験周期の間のエンジンRPMおよび負荷の例示的時系列を示す。
【0040】
図5図5は、いくつかの実施形態による、試験周期の間の例示的エンジン冷却剤温度および予測値の個別の標準誤差を示す。
【0041】
図6図6は、いくつかの実施形態による、試験周期の間の例示的ズームインエンジン冷却剤温度および予測値の対応する標準化誤差(誤差のzスコア)を示す。
【0042】
図7図7は、いくつかの実施形態による、試験周期の間の6つのエンジンセンサデータ(冷却剤温度)、冷却剤圧力(冷却剤圧力)、油温度(油温度)、油圧(油圧)、燃料圧力(燃料圧力)、および燃料アクチュエータ割合(燃料アクチュエータ割合)からの誤差の算出されたzスコアの例示的マハラノビス距離時系列を示す。
【0043】
図8図8は、いくつかの実施形態による、平均エンジン負荷、平均エンジン燃料圧力、および平均マニホールド圧力が示される、燃料ポンプ故障(8月28日発生)に先立った時間における、かつその間の例示的未加工エンジンセンサデータを示す。
【0044】
図9図9は、いくつかの実施形態による、燃料ポンプ故障(8月28日発生)に先立った時間における、かつその間の1次元における平均エンジン負荷、平均燃料圧力、および平均マニホールド圧力、ならびに誤差の例示的マハラノビス角度に関する算出された誤差zスコアの実施例を示す。
【0045】
図10図10は、いくつかの実施形態による、モデル発生のためのデータ前処理のフローチャートを示す。
【発明を実施するための形態】
【0046】
いくつかの実施形態では、本技術は、物理的システムの性能に関するデータのストリームを捕捉し、機械学習を使用して発生される統計モデルに関してストリームを処理し、使用の厳格な環境内で、正常な状態時のハードウェアと区別される、正常な状態からの目前または実際のハードウェア偏差を表す、異常の存在を予測するためのシステムおよび方法を提供する。
【0047】
多くの場合、観察されている、可能性として考えられるガウスプロセスの有限セットのうちの1つを決定することが必要である。例えば、動作の正常な状態がその統計的変動の範囲で観察されているか、または異なる公称動作点だけではなく、正常な状態と定量的に異なる統計的分散も仮定し得る、動作の異常な状態が観察されているかどうかを決定することが重要であり得る。実際、正常および異常な状態は、統計的プロファイルの差異のみが異なり得、全ての公称値は、公称値を有する、または公称値を維持するように制御される。そのような決定を行う能力は、nがプロセスを説明する特徴の数である、ガウスプロセスの間のn次元空間内の距離に依存し得、プロセスが相互に近い(類似する)場合、決定は困難であり得る。距離は、例えば、発散、バタチャリヤ距離、またはマハラノビス距離を使用して、測定されてもよい。加えて、これらの距離は、対応する軸からの角度(例えば、起点から多次元標準化誤差点まで及ぶマハラノビス距離のベクトルと標準化誤差の対応する軸との間のn個のマハラノビス角度)を決定することによって、n次元空間内のベクトルとして説明される、またはベクトルに変換されることができる。これらの距離および角度のうちのいくつかまたは全ては、システムが動作の正常または異常な状態であるかどうかを評価するために使用されることができ、本開示される技術のいくつかの実施形態に従って、特定の種類のエンジン故障として動作の異常な状態を分類するモデルへの入力として使用されることもできる。
【0048】
多くの場合、異常検出に関して監視および分析されているエンジンパラメータは、監視されているいくつかの他のエンジンパラメータと相関すると仮定される。例えば、yが、近リアルタイム予測に関して分析されているエンジンセンサ値であり、x1,x2,…が、同様に監視されている他のエンジンセンサである場合、yが従属変数であり、x1,x2,…,xn等が独立変数であり、yがx1,x2,…,xnの関数である、または
【化4】

である、y=f1(x1,x2,…,xn)であるような関数f1が存在する。
【0049】
いくつかの実施形態では、分析されている機械は、船舶内のディーゼルエンジンであり、分析システムの目標は、エンジンまたはその近傍にインストールされたエッジデバイスを使用して、近リアルタイム待ち時間においてディーゼルエンジン動作異常および/またはディーゼルエンジンセンサ異常を識別することである。当然ながら、他のタイプの車両、エンジン、または機械も、同様に監視および分析を受け得る。
【0050】
エッジデバイスは、エンジンの電子制御モジュール/ユニット(ECM/ECU)とインターフェースをとってもよく、内部GPS/DGPSまたは船舶のGPS/DGPSから、時系列(例えば、エンジン毎分回転数(RPM)、負荷率、冷却剤温度、冷却剤圧力、油温度、油圧、燃料圧力、燃料アクチュエータ割合等)としてのエンジンセンサデータならびに速度および場所データを収集する。
【0051】
エッジデバイスは、例えば、1分あたり60個のサンプルの近似率においてこれらのセンサデータの全てを収集し、データを毎秒のタイムスタンプ(例えば、12:00:00、12:00:01、12:00:02、…)に整合させてもよい。データが、より高い頻度において記録されることができる場合、総計(例えば、平均値)が、1秒毎に、または他の適切な周期にわたって計算されてもよい。次いで、1分毎の平均値(すなわち、算術平均)が、次いで、計算されてもよく、1分の平均時系列(例えば、12:00:00、12:01:00、12:02:00、…)を生成する。
【0052】
いくつかの実施形態では、1分の平均データは、未加工の高頻度サンプルよりも統計モデルを開発し、異常を予測するために安定していることが見出された。しかしながら、ある場合には、サンプル間雑音が、アルゴリズムの後続の段階で処理されることができる。
【0053】
エッジデバイスは、限定ではないが、タイムスタンプ(ts)と、以下のエンジンパラメータ、すなわち、エンジン速度(rpm)、エンジン負荷割合(負荷)、冷却剤温度(冷却剤温度)、冷却剤圧力(冷却剤圧力)、油温度(油温度)、油圧(油圧)、燃料圧力(燃料圧力)、および燃料アクチュエータ割合(燃料アクチュエータ割合)とを含み得る、n次元エンジンデータ時系列を収集する。
【0054】
ある場合には、周囲温度、大気圧、湿度、場所、保守情報、または他のデータが、収集される。
【0055】
ディーゼルエンジンデータの分散分析では、冷却剤温度を含む、エンジンパラメータの殆どは、エンジン速度の有界範囲内で、かつエンジンが定常状態である、すなわち、RPMおよびエンジン負荷が安定しているときに、エンジンRPMおよびエンジン負荷割合と強い相関を有することが見出される。したがって、(例えば、アイドルエンジンRPMよりも高い)エンジンRPMのその有界領域の内側に、以下であるような関数f1が存在する。
冷却剤温度=f1(rpm、負荷)
【0056】
【化5】
【0057】
この場合、nは、2(rpmおよび負荷)に等しく、mは、1(冷却剤温度)に等しい。
換言すると、f1は、2つの独立変数からの単一の従属変数の予測を可能にするマップである。同様に、
冷却剤圧力=f2(rpm、負荷)
油温度=f3(rpm、負荷)
油圧=f4(rpm、負荷)
燃料圧力=f5(rpm、負荷)
燃料アクチュエータ割合=f6(rpm、負荷)
である。
【0058】
これらのマップを1つのマップに群化することは、この場合、nが、2(rpmおよび負荷)に等しく、mが、6(冷却剤温度、冷却剤圧力、油温度、油圧、燃料圧力、および燃料アクチュエータ割合)に等しい、
【化6】

であるように、多次元マップ(すなわち、モデル)につながる。重要なこととして、多くのマップが、同一の入力変数を伴う単一のマップに群化され、潜在的に多くの相関変数(すなわち、変数のテンソル)が有界範囲内で予測されることを可能にする。具体的独立変数は、エンジンRPMおよびエンジン負荷である必要はなく、2つの変数に限定される必要はないことに留意されたい。例えば、エンジン動作時間数が、動作時間に伴うエンジン劣化を考慮するように、マップ内に独立変数として追加され得る。
【0059】
エンジンモデルを生成するために、エンジンが明白な動作問題を有していなかった訓練時間周期が、選択される。いくつかの実施形態では、機械学習アルゴリズムが、エッジデバイス上に直接、ローカルまたは遠隔サーバ内、もしくはクラウド内にエンジンモデルを発生させるために使用される。低いモデルバイアスを提供するモデル化技法(例えば、スプライン、ニューラルネットワークもしくはサポートベクトルマシン(SVM)、および/または一般化加法モデル(GAM))が、選択されることができる。以下を参照されたい。
【0060】
【化7-1】

【化7-2】

【化7-3】
【0061】
統計学では、一般化線形モデル(GLM)は、正規分布以外の誤差分布モデルを有する応答変数を可能にする、通常の線形回帰の柔軟な一般化である。GLMは、線形モデルがリンク関数を介して応答変数に関連することを可能にすることによって、かつ各測定の分散の規模がその予測値の関数であることを可能にすることによって、線形回帰を一般化する。一般化線形モデルは、線形回帰、ロジスティック回帰、およびポアソン回帰を含む、種々の他の統計モデルを統一し、モデルパラメータの最大尤度推定のために反復的再加重最小二乗方法を採用する。以下を参照されたい。
【0062】
【化8-1】

【化8-2】

【化8-3】

【化8-4】

【化8-5】

【化8-6】

【化8-7】

【化8-8】
【0063】
通常の線形回帰は、観察される値(予測因子)のセットの線形結合として、所与の未知の数量(応答変数、ランダム変数)の期待値を予測する。これは、予測因子の一定の変化が応答変数の一定の変化につながること(すなわち、線形応答モデル)を含意する。これは、応答変数が正規分布を有するときに(直観的に、応答変数が固定された「ゼロ値」を伴わずにいずれかの方向に本質的に無期限に変動し得るときに、またはより一般的には、比較的に少量だけ変動する任意の数量、例えば、ヒトの身長に関して)適切である。しかしながら、これらの仮定は、いくつかのタイプの応答変数にとって不適切であり得る。例えば、応答変数が、常に正であり、広範囲にわたって変動することが予期される場合において、一定の入力変化は、常に変動するのではなく、幾何学的に変動する出力変化につながる。
【0064】
GLMでは、従属変数の各成果Yは、とりわけ、正規、2項、ポアソン、およびガンマ分布を含む、広い範囲の確率分布である、指数分布族内の特定の分布から発生されると仮定される。
【0065】
GLMは、3つの要素、すなわち、指数分布族からの確率分布、線形予測因子η=Xβ、およびE(Y)=μ=g-1(η)であるようなリンク関数gから成る。線形予測因子は、独立変数についての情報をモデルの中に組み込む数量である。シンボルη(ギリシャ文字の「エータ」)は、線形予測因子を表す。これは、リンク関数を通してデータの期待値に関連する。ηは、未知のパラメータβの線形結合(したがって、「線形」)として表現される。線形結合の係数は、独立変数Xの行列として表される。ηは、したがって、リンク関数として表現され、線形予測因子と分布関数の平均との間の関係を提供することができる。多くの一般的に使用されているリンク関数が存在し、それらの選定は、いくつかの考慮事項によって知らされる。応答の密度関数の指数関数から導出される、明確に定義された正準リンク関数が常に存在する。しかしながら、ある場合には、リンク関数のドメインを分布関数の平均の範囲に合致させようとすること、またはアルゴリズムの目的、例えば、ベイズプロビット回帰のために、正準リンク関数を使用することが意味を成す。最も一般的な分布に関して、平均は、分布の密度関数の標準形態のパラメータのうちの1つであり、次いで、密度関数をその正準形態にマッピングする、上記に定義されるような関数である。一般化線形モデルの単純で重要な実施例(また、一般的線形モデルの実施例)は、線形回帰である。線形回帰では、最小二乗推定量の使用は、分布が正規であると仮定しない、ガウス・マルコフの定理によって正当化される。
【0066】
標準GLMは、観察が無相関であると仮定する。拡張が、例えば、縦断研究およびクラスタ化された設計で生じるような観察の間の相関を可能にするために開発されてきた。一般化推定方程式(GEE)が、相関の起源のために明示的な確率モデルを使用することなく、観察の間の相関を可能にするため、明示的な尤度が存在しない。それらは、その起源を解説することなく相関を可能にするため、変量効果およびそれらの分散が本質的に着目されないときに好適である。焦点は、所与の個人のXの1つまたはそれを上回る成分を変化させる効果の予測を可能にするであろう、回帰パラメータではなく、母集団にわたって平均応答を推定すること(「母集団平均」効果)にある。GEEは、通常、Huber-White標準誤差と併せて使用される。一般化線形混合モデル(GLMM)は、線形予測因子に変量効果を含み、相関の起源を解説する明示的確率モデルをもたらす、GLMへの拡張である。結果として生じる「対象特有の」パラメータ推定値は、焦点が所与の個人のXの1つまたはそれを上回る成分を変化させる効果を推定することにあるときに好適である。GLMMはまた、マルチレベルモデルおよび混合モデルとも称される。一般に、GLMMを適合させることは、GEEを適合させることよりも計算上複雑かつ集約的である。
【0067】
統計学では、一般化加法モデル(GAM)は、線形予測因子が、いくつかの予測因子変数の未知の平滑関数に直線的に依存し、関心が、これらの平滑関数についての推論に焦点を当てる、一般化線形モデルである。GAMは、本来、一般化線形モデルの性質を加法モデルと混成するためにTrevor HastieおよびRobert Tibshiraniによって開発された。
【0068】
モデルは、単変量応答変数をいくつかの予測因子変数に関連させる。指数分布族分布が、単変量応答変数の期待値を予測因子変数に関連させるリンク関数g(例えば、恒等または対数関数)とともに規定される(例えば、正規、2項、またはポアソン分布)。
【0069】
関数は、規定パラメトリック形態(例えば、変数の多項式もしくは非処罰化回帰スプライン)を有してもよい、または非パラメトリック手段によって推定されるように、単に「平滑関数」として非パラメトリックに、もしくは半パラメトリックに規定されてもよい。典型的GAMが、局所的加重平均等の散布図平滑化関数を使用し得る。応答と予測因子との間の実際の関係上で緩和した仮定との非パラメトリック適合を可能にするための本柔軟性は、ほぼ間違いなく解釈可能性のある程度の損失を伴うが、純パラメトリックモデルよりもデータへの良好な適合の潜在性を提供する。
【0070】
任意の多変量関数が、単変量関数の総和および組成として表されることができる。残念ながら、Kolmogorov-Arnold表現定理は、本形態の関数の存在を主張するが、それが構築され得る機構をもたらさない。ある構成的証明が存在するが、それらは、極めて複雑な(すなわち、フラクタル)関数を要求する傾向があり、したがって、モデル化アプローチのために好適ではない。任意の段階的(すなわち、バックフィッティングアルゴリズム)アプローチが解を近似さえし得ることは明確ではない。したがって、一般化加法モデルは、外側総和をドロップし、代わりに、関数がより単純なクラスに属することを要求する。
【0071】
本来のGAM適合方法は、バックフィッティングアルゴリズムを介して、非パラメトリック平滑化因子(例えば、平滑化スプラインまたは局所線形回帰平滑化因子)を使用して、モデルの平滑成分を推定した。バックフィッティングは、部分残余の反復平滑化によって稼働し、多種多様な平滑化方法を使用し、項を推定することが可能である、非常に一般的なモジュール式推定方法を提供する。GAMおよびそれらの拡張の多くの現代の実装が、比較的に控えめな算出コストにおいて成分平滑の平滑性の根拠の確かな推定を可能にし、また、他の方法ではより困難である方法でいくつかのモデル拡張の実装を促進するため、低減ランク平滑化アプローチの周囲に構築される。端的に言えば、発想は、モデル内の未知の平滑関数を基本拡張と置換することである。バイアスを平滑化することは、これらのモデルのための間隔推定を複雑にし、最も単純なアプローチは、ベイズアプローチを伴うことが判明する。本平滑化のベイズ見解を理解することはまた、平滑化パラメータ推定へのREMLおよび完全ベイズアプローチを理解することにも役立つ。あるレベルにおいて、平滑化罰則が課される。
【0072】
過剰適合は、特に、モデル化されていない残余自己相関またはモデル化されていない過剰分散が存在する場合、GAMでは問題であり得る。相互検証が、GAM(または他の統計的方法)に関する過剰適合問題を検出する、および/または低減させるために使用されることができ、ソフトウェアが、多くの場合、処罰化のレベルが増加されることを可能にし、より平滑な適合を強制する。非常に多数の平滑化パラメータを推定することはまた、統計的に困難である可能性が高く、予測誤差基準(GCV、AIC等)が、特に、中程度のサンプルサイズにおいて、場合によって実質的に平滑不足である既知の傾向が存在し、REMLは、この点に関して若干問題が少ない。適切である場合、GAMが、当該用途のために実質的に(検証セット内で)予測能力を改良しない限り、GLM等のより単純なモデルが、GAMよりも好ましくあり得る。加えて、単変量異常値検出アプローチが、有効である場合、実装されることができる。これらのアプローチは、所与の機械構成要素に関する分布の正常な範囲を超える値を探すことができ、(中央絶対偏差を使用する)ZスコアまたはロバストZスコアの計算を含み得る。
【0073】
【化9-1】

【化9-2】

【化9-3】

【化9-4】
【0074】
いくつかの実施形態では、プログラミング言語「R」が、統計的コンピューティングおよびグラフィックのため、かつ適切なモデルを生成するための環境として使用される。誤差統計および/または予測誤差のzスコアが、予測誤差をさらに最小限にするために使用される。
【0075】
エンジンの動作範囲は、複数の明確に異なる範囲に分割されることができ、複数の多次元モデルが、モデル正確度を改良するように構築されることができる。
【0076】
次に、エッジデバイスの能力(例えば、それがプログラミング言語「R」を実行することができるかどうか)に応じて、エンジンモデルが、Rモデルとして展開される、または独立変数の有界領域のためのモデルを説明する、同等のデータベースルックアップテーブルが、発生および展開される。
【0077】
モデルを構築するために使用された訓練データの同一のセットが、次いで、予測されるセンサ値時系列を生成するために、入力セットとしてモデルにパスされる。測定されるセンサ値から予測されるセンサ値を減算することによって、全ての従属センサ値に関する誤差時系列が、訓練データセットに関して生成される。訓練周期誤差系列の誤差統計、すなわち、平均および標準偏差等が、算出され、訓練周期誤差統計として保存される。
【0078】
いくつかの実施形態では、z統計が機能するために、エッジデバイスは、典型的には、全データ点のために30を上回るサンプルを選択し、毎分の平均値を提供する必要がある。いくつかの実施形態は、1分あたり約60個のサンプル(1秒間隔)を伴ってシステムを実装し、エッジデバイスは、毎分の値を平均すること(算術平均)によって、毎分の平均値を計算する。
【0079】
いったんモデルがエッジデバイスに展開され、本システムが動作すると、従属および独立センサ値が、近リアルタイムで測定されることができ、1分の平均データが、算出されてもよい。従属エンジンセンサに関する期待値が、独立センサ値をエンジンモデルにパスすることによって予測されることができる。従属変数の測定値とその予測値との間の誤差(すなわち、差異)が、次いで、算出されることができる。これらの誤差は、瞬間誤差から訓練誤差平均を減算し、本差異を所与のセンサに関する訓練誤差標準偏差で除算することによって標準化される。本プロセスは、異常を検出し、アラート処理システムを用いて、標準誤差がある数の誤差標準偏差を上回る/下回る、またはあるzスコアを上回る/下回るときに、近リアルタイムにおいて検出し、通知を船上および沿岸ベースのシステムに送信するために使用され得る、誤差または標準誤差時系列のzスコアを生成する。
【0080】
いくつかの実施形態によると、異常を特定の種類のエンジン故障に結び付ける異常分類システムもまた、展開されてもよい。複数のエンジンセンサからの誤差データ系列のzスコアは、近リアルタイムで、問題の事例、学習されたエンジン問題、および/またはエンジンセンサ問題についての前の訓練を通して高い確実度で、(故障もしくは故障ではないとして)分類される。
【0081】
本分類は、ニューラルネットワークまたはディープニューラルネットワーク、クラスタ化アルゴリズム、主要成分分析、種々の統計的アルゴリズム、もしくは同等物であってもよい。いくつかの実施例が、上記の組み込まれた参考文献に説明される。
【0082】
分類システムのいくつかの実施形態は、アセットに関して一意の短い時間周期を選択し、分類タイプを表す恣意的な文字列で選択された周期をタグ付けする(または標識する)ための機構(例えば、設計および展開ツール)を提供する。ユーザインターフェースが、履歴エンジンデータおよび/または誤差時系列データを閲覧するため、かつ着目時間周期を選択し、タグ付けするために、使用されてもよい。次いで、本システムは、複数の着目エンジンセンサからの誤差データのzスコアからロバストなマハラノビス距離(および/またはバタチャリヤ距離)を計算し、さらなる分析のために、エッジデバイスならびに/もしくはクラウドデータベース内にタグ付けされた時間周期にわたる計算された範囲を記憶する。
【0083】
バタチャリヤ距離は、2つの確率分布の類似性を測定する。これは、2つの統計的サンプルまたは母集団の間の重複の量の尺度である、バタチャリヤ係数に密接に関連する。係数は、考慮されている2つのサンプルの相対接近性を決定するために使用されることができる。これは、分類におけるクラスの分離可能性を測定するために使用され、2つのクラスの標準偏差が同一であるときに、マハラノビス距離がバタチャリヤ距離の特定の事例であるため、マハラノビス距離よりも信頼性があると見なされる。その結果として、2つのクラスが、類似平均を有するが、異なる標準偏差を有するとき、マハラノビス距離は、ゼロになる傾向があろう一方、バタチャリヤ距離は、標準偏差の間の差異に応じて増大する。
【0084】
バタチャリヤ距離は、発散の尺度である。これは、以下のように正式に定義されることができる。(Ω,B,ν)を測度空間とし、Pをνに関して絶対的に連続的であるBについての全ての確率測度(確率測度を参照)のセットとする。2つのそのような確率測度P、P、∈Pを考慮し、p1およびp2をνに関するそれらの個別の密度関数とする。
【0085】
ρ(P,P)によって表される、PとPとの間のバタチャリヤ係数は、以下によって定義される。
【化10】
【0086】
式中、dP/dνは、νに関するP(i=1,2)のラドン・ニコディム導関数(ラドン・ニコディムの定理を参照)である。これはまた、カクタニ係数およびマツシタ係数としても公知である。ρ(P,P)は、PおよびPを支配する尺度νに依存しないことに留意されたい。
【0087】
i)0≦ρ(P,P)≦1
【0088】
ii)P=Pである場合、かつその場合のみ、ρ(P,P)=1
【0089】
iii)PがPに直交する場合、かつその場合のみ、ρ(P,P)=0
【0090】
B(1,2)によって表される、2つの確率分布PとPとの間のバタチャリヤ距離は、B(1,2)=-lnρ(P,P)によって定義される。0≦B(1,2)≦∞である。距離B(1,2)は、三角不等式を満たさない。バタチャリヤ距離は、(t=1/2を取り込む)チェルノフ距離の特別な事例という結果になる。
【化11】
【0091】
H(1,2)によって表される、2つの確率測度PとPとの間のへリンガー距離は、以下の関係、すなわち、H(1,2)=2[1-ρ(P,P)]によって、バタチャリヤ係数に関連する。
【0092】
B(1,2)は、バタチャリヤ係数を通して定義されるため、バタチャリヤ距離と呼ばれる。分類のためにベイズ基準を使用し、等しいコストを各タイプの誤分類に付加する場合、誤分類の全確率は、e-B(1,2)によって優関数化される。等しい共分散の場合、B(1,2)の最大限化が、フィッシャー線形判別関数を生じさせる。
【化12-1】

【化12-2】
【0093】
マハラノビス距離は、点Pと分布Dとの間の距離の尺度である。これは、PがDの平均から離れている標準偏差の数を測定するという発想の多次元一般化である。本距離は、PがDの平均にある場合、ゼロであり、Pが各主要成分軸に沿って平均から離れるように移動するにつれて増大し、マハラノビス距離は、PからDの平均までの標準偏差の数を測定する。これらの軸がそれぞれ、単位分散を有するように再スケーリングされる場合、マハラノビス距離は、変換された空間内の標準ユークリッド距離に対応する。マハラノビス距離は、したがって、無単位およびスケール不変であり、データセットの相関を考慮する。
【0094】
マハラノビス距離は、X、Yがベクトルであり、Aが行列である(かつ□が転置を表す)、数量ρ(X,Y|A)={(X-Y)A(X-Y)}1/2である。これは、特に、仮説の試験および観察の分類のために、多次元統計的分析で使用される。数量ρ(μ,μ|Σ-1)は、期待値μおよびμならびに共分散行列Σを伴う2つの正規分布の間の距離である。(同じ共分散行列を伴う分布からの)2つのサンプルの間、またはサンプルと分布との間のマハラノビス距離は、対応する理論的モーメントをサンプリングモーメントに置換することによって、定義される。2つの分布の間のマハラノビス距離の推定値として、これらの分布から抽出されるサンプルの間のマハラノビス距離を使用する、または線形判別関数が利用される場合、αおよびβが、それぞれ、第1および第2の集合内の正しい分類の頻度であり、Φが、期待値0および分散1を伴う正規分布関数である、統計Φ-1(α)+Φ-1(β)を使用する。
【化13-1】

【化13-2】

【化13-3】
【0095】
実行時間において、本システムは、エンジンセンサデータ時系列から誤差データのzスコアを計算し、次いで、随意に、選択された次元(すなわち、エンジンセンサ)の誤差データのzスコアのロバストなマハラノビス距離(および/またはバタチャリヤ距離)を計算する。値は、展開された分類標識(具体的タイプの故障または具体的タイプの故障ではない)の一部として前もって記憶され、それに応じて分類された、正の合致およびタグ付けを有した訓練周期の間の誤差のzスコアのテンソルのセットに対して、試験周期の間の誤差のzスコアのテンソルのセットを分析および比較するために、マハラノビス距離(および/またはバタチャリヤ距離)の範囲に対して比較される。故障分類が取得されるとき、アラートシステムは、通知を人間のオペレータおよび/または自動システムに送信する。
【0096】
いくつかの実施形態は、次いで、センサ毎の標準化誤差値および/またはセンサ毎の組み合わせられたマハラノビス距離(もしくはバタチャリヤ距離)の形態で、入力としてデータのセットをユーザインターフェース(例えば、分析ゲージ)に提供することができる。これは、ユーザが、データが故障または異常として分類された理由を理解することを可能にする。
【0097】
注目すべきこととして、本システムは、必ずしも動作エンジン問題とエンジンセンサ問題とを差別化しない。むしろ、これは、いくつかの実施形態によると、深層学習訓練周期の間に行われる分類に依存する。また、本システムが、問題の知識ベースを生成するための標準化z誤差(すなわち、タグおよびマハラノビス/バタチャリヤ距離範囲ならびに標準化誤差範囲)を使用するため、モデルは、エンジン特有のモデルが生成される前に、類似タイプの他のエンジンおよび/または機械のためのプロトタイプとして展開されることができる。
【0098】
したがって、システムの感知または決定された動作パラメータを表す、データのストリームを捕捉するステップであって、動作パラメータは、動作パラメータが感知または決定されたときに、システムが安定した状態で動作していたかどうかを表す、安定性インジケータを伴って、システムの動作状態の範囲にわたってシステムの動作状態に依存して変動する、ステップと、安定した動作を表す動作体制に関して、少なくとも、振幅依存性パラメータと、経時的な振幅の分散のパラメータとを備える、データのストリームの統計的性質を特徴付けるステップと、システムの正常な動作とシステムの異常な動作とを確実に区別する、特徴付けられた統計的性質に関する統計ノルムを決定するステップと、システムの感知または決定された動作パラメータを表すデータの並列ストリームが、システムの異常な動作を表すかどうかに依存して、信号を出力するステップとを含む、システムの異常な動作を決定する方法を提供することが目的である。
【0099】
また、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、訓練データの複数のストリームを捕捉するステップと、個別の訓練データの予測値と個別の訓練データの測定値との間の複数の定量的標準化誤差、および経時的な個別の複数の定量的標準化誤差の分散を決定するステップを含む、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、データの複数のストリームの合同統計的性質を特徴付けるステップと、システムの正常な状態とシステムの異常な状態とを確実に区別する、特徴付けられた合同統計的性質に関する統計ノルムを決定するステップと、不揮発性メモリ内に決定された統計ノルムを記憶するステップとを含む、システムの異常な動作を決定する方法を提供することも目的である。
【0100】
また、個別の訓練データの予測値と個別の訓練データの測定値との間の定量的標準化誤差の経時的な統計的分散を決定するステップを含む、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、データの複数のストリームの統計的性質を特徴付けるステップと、システムの正常な動作状態とシステムの異常な動作状態とを確実に区別する、少なくとも1つの決定境界を備える、特徴付けられた統計的性質に関する統計ノルムを決定するステップと、不揮発性メモリ内に決定された統計ノルムを記憶するステップとを含む、システムの異常な動作を予測する方法を提供することも目的である。
【0101】
さらに、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、訓練データの複数のストリームを受信するように構成される、入力ポートと、個別の訓練データの予測値と個別の訓練データの測定値との間の複数の定量的標準化誤差、および経時的な個別の複数の定量的標準化誤差の分散に基づいて、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、データの複数のストリームの合同統計的性質を特徴付け、システムの正常な状態とシステムの異常な状態とを確実に区別する、特徴付けられた合同統計的性質に関する統計ノルムを決定するように構成される、少なくとも1つの自動プロセッサと、決定された統計ノルムを記憶するように構成される、不揮発性メモリとを備える、異常な動作状態を決定するためのシステムを提供することが目的である。
【0102】
別の目的は、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、訓練データの複数のストリームを捕捉するステップと、訓練データの捕捉されたストリームを遠隔サーバに伝送するステップと、遠隔サーバから、システムの正常な状態とシステムの異常な状態とを確実に区別する、特徴付けられた合同統計的性質に関する統計ノルムを受信するステップであって、特徴付けられた合同統計的性質は、個別の訓練データの予測値と個別の訓練データの測定値との間の定量的標準化誤差と、経時的な個別の複数の定量的標準化誤差の分散とを備える、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、データの複数のストリームに基づく、ステップと、動作段階の間のシステムの状態にわたってセンサ読取値を表す、データのストリームを捕捉するステップと、動作段階の間のシステムの状態にわたってセンサ読取値を表す、データのストリームが、統計ノルム内にあるかどうかに依存して、選択的に信号を生成するステップとを含む、システムの異常な動作を決定する方法を提供する。
【0103】
さらなる目的は、遠隔サーバにおいて訓練データの複数の捕捉されたストリームを受信するステップであって、訓練データの捕捉された複数のストリームは、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、ステップと、訓練データの受信される複数の捕捉されたストリームを処理し、システムの正常な状態とシステムの異常な状態とを確実に区別する、特徴付けられた合同統計的性質に関する統計ノルムを決定するステップであって、特徴付けられた合同統計的性質は、個別の訓練データの予測値と個別の訓練データの測定値との間の定量的標準化誤差と、経時的な個別の複数の定量的標準化誤差の分散とを備える、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、データの複数のストリームに基づく、ステップと、決定された統計ノルムをシステムに伝送するステップとを含む、システムの非異常動作に関して統計ノルムを決定する方法を提供する。本方法はさらに、システムにおいて、動作段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、データのストリームを捕捉し、動作段階の間のシステムの状態にわたってセンサ読取値を表す、データのストリームが、統計ノルム内にあるかどうかに依存して、選択的に信号を生成するステップとを含んでもよい。
【0104】
非一過性のコンピュータ可読媒体もまた、包含され、プログラマブルプロセッサを制御し、本明細書に開示されるコンピュータ実装方法の任意または全てのステップを実施するための命令をその中に記憶する。
【0105】
訓練データの少なくとも1つのストリームは、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、データの複数のストリームの合同統計的性質を特徴付けることに先立って、集約されてもよい。
【0106】
本方法はさらに、クラウドデバイスが動作データの複数のストリームの合同統計的性質を特徴付けることに先立って、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、訓練データの捕捉された複数のストリームをエッジデバイスからクラウドデバイスに通信するステップと、決定された統計ノルムをクラウドデバイスからエッジデバイスに通信するステップとを含んでもよく、不揮発性メモリは、エッジデバイス内に提供されてもよい。
【0107】
本方法はさらに、動作段階の間のセンサ読取値を表す、動作データの複数のストリームを捕捉するステップと、個別の動作データの予測値と個別の訓練データの測定値との間の複数の定量的標準化誤差、およびエッジデバイス内の経時的な個別の複数の定量的標準化誤差の分散を決定するステップと、複数の定量的標準化誤差および個別の複数の定量的標準化誤差の分散を決定された統計ノルムと比較し、動作段階の間のセンサ読取値を表す、動作データの複数のストリームが、システム動作の異常な状態を表すかどうかを決定するステップとを含んでもよい。
【0108】
本方法はさらに、動作段階の間のセンサ読取値を表す、動作データの複数のストリームを捕捉するステップと、個別の訓練データの予測値と個別の訓練データの測定値との間の複数の定量的標準化誤差、および経時的な個別の複数の定量的標準化誤差の分散を決定するステップを含む、動作データの複数のストリームの合同統計的性質を特徴付けるステップと、動作データの複数のストリームの特徴付けられた合同統計的性質を決定された統計ノルムと比較し、動作段階の間のセンサ読取値を表す、動作データの複数のストリームが、システム動作の異常な状態を表すかどうかを決定するステップとを含んでもよい。
【0109】
本方法はさらに、動作段階の間のセンサ読取値を表す、動作データの複数のストリームを捕捉するステップと、決定された統計ノルムに関する動作データの捕捉された複数のストリームのマハラノビス距離、バタチャリヤ距離、チェルノフ距離、マツシタ距離、KL発散、対称KL発散、パトリック・フィッシャー距離、リサック・フー距離、およびコルモゴロフ距離のうちの少なくとも1つを決定するステップとを含んでもよい。本方法はさらに、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、訓練データの複数のストリームと、システムの動作段階の間のセンサ読取値を表す、動作データの捕捉された複数のストリームとの間のマハラノビス距離を決定するステップを含んでもよい。本方法はさらに、訓練段階の間のシステムの状態の範囲にわたってセンサ読取値を表す、訓練データの複数のストリームと、システムの動作段階の間のセンサ読取値を表す、動作データの捕捉された複数のストリームとの間のバタチャリヤ距離を決定するステップを含んでもよい。
【0110】
本方法はさらに、訓練段階の後続のシステムの動作の間に取得されるセンサデータと統計ノルムとの間の統計的差異に基づいて、動作の異常な状態を決定するステップを含んでもよい。本方法はさらに、異常な状態の間に取得されるセンサデータに分析を実施し、異常な状態につながる、取得されるセンサデータのシグネチャを定義し、異常な状態につながる、取得されるセンサデータの定義されたシグネチャを第2のシステムに通信するステップを含んでもよい。本方法はなおもさらに、第2のシステムから、第2のシステムの異常な状態につながる、取得されるセンサデータの定義されたシグネチャを受信し、訓練段階後にセンサデータのストリームのシグネチャ分析を実施するステップを含んでもよい。本方法はさらに、第2のシステムから、第2のシステムの異常な状態につながる、取得されるセンサデータの定義されたシグネチャを受信し、統計ノルムが、異常な状態に先行するセンサデータのパターンを動作の正常な状態と区別するために更新され得るように、定義されたシグネチャを決定された統計ノルムと統合するステップを含んでもよい。
【0111】
本方法はさらに、複数の定量的標準化誤差に関してzスコアを決定するステップを含んでもよい。本方法はさらに、訓練段階後に受信されるセンサデータのストリームに関してzスコアを決定するステップを含んでもよい。本方法はさらに、訓練段階後に受信されるセンサデータのストリームを間引くステップを含んでもよい。本方法はさらに、訓練段階後に受信されるセンサデータのストリームを間引き、それに関してzスコアを決定するステップを含んでもよい。
【0112】
本方法はさらに、訓練段階後に受信される、センサデータのストリームを受信するステップと、訓練段階後に受信される、受信されたセンサデータのストリームの間の差異に基づいて、システムの動作の異常な状態を決定するステップと、訓練段階後に受信されるセンサデータのログを、動作の異常な状態の注釈でタグ付けするステップとを含んでもよい。本方法はさらに、動作の異常な状態を特定の種類のイベントとして分類するステップを含んでもよい。
【0113】
システムの状態の範囲にわたってセンサ読取値を表す、訓練データの複数のストリームは、複数の異なるタイプのセンサからのデータを備えてもよい。システムの状態の範囲にわたってセンサ読取値を表す、訓練データの複数のストリームは、同一のタイプの複数の異なるセンサからのデータを備えてもよい。本方法はさらに、少なくともk近傍法分析を実施することによって、訓練段階後に受信されるセンサデータのストリームを分類するステップを含んでもよい。本方法はさらに、訓練段階後に受信されるセンサデータのストリームが安定した動作状態であり得るかどうかを決定し、センサデータのストリームのログを安定性の特性評価でタグ付けするステップを含んでもよい。
【0114】
本方法は、訓練データの複数のストリームを遠隔サーバに伝送するステップ、特徴付けられた合同統計的性質を遠隔サーバに伝送するステップ、統計ノルムを遠隔サーバに伝送するステップ、統計ノルムに基づいて、システムが異常に動作しているかどうかの決定を表す信号を遠隔サーバに伝送するステップ、遠隔サーバから特徴付けられた合同統計的性質を受信するステップ、遠隔サーバから統計ノルムを受信するステップ、統計ノルムに基づいて、遠隔サーバからシステムが異常に動作しているかどうかの決定を表す信号を受信するステップ、および他のシステムに関する個別の統計ノルムに基づいて、訓練段階の間の状態の範囲外のシステムの動作のタイプを表す、システムの動作に関する予測される統計ノルムを表す信号を遠隔サーバから受信するステップのうちの少なくとも1つを含んでもよい。
【0115】
一実施形態によると、システムの開始に応じて、初期モデルが存在せず、エッジデバイスは、分析のために可逆非圧縮データをクラウドコンピュータに送信する。いったんモデルが構築され、通信ペアの両側によって同期化または通信されると、それらの間の通信は、データ通信の非可逆圧縮モードに同期して切り替わってもよい。異なる動作体制が異なる成熟度のモデルを有する場合において、エッジデバイスは、クラス毎の基準で採用する通信のモードの種類を決定してもよい。さらに、ある場合には、データの圧縮は、異なるアルゴリズムに従って試験されてもよく、最適なアルゴリズムが、通信コストまたは効率、異常検出における種々のリスクおよび誤差もしくはコスト加重リスクおよび誤差、または同等物を含み得る、基準に従って採用されてもよい。ある場合には、圧縮の算出複雑性および記憶要件もまた、特に、限定されたメモリおよび処理能力を伴う軽量IoTセンサでは、問題である。
【0116】
一実施形態では、本システムは、最初に、その具体的アセットのために構築されたカスタムまたはシステム特有のモデルが存在しないとき、初めに「ストック」モデルおよび対応する「ストック統計パラメータ」(誤差の標準偏差および平均誤差)を使用することができ、次いで、後に、エッジデバイスが新しい十分に完全なモデルを構築するとき、そのモデルをクラウドコンピュータに送信し、次いで、両側が、新しいモデルに同期して切り替わることができる。本スキームのみで、クラウドが、常に、非可逆データを受信するにつれて、エッジデバイスが、モデルを構築するであろう。上記に議論されるように、ストックモデルは、システムのクラスに関する母集団統計を用いて開始し、個人特有のデータが入手されるにつれて、デバイスの母集団ではなく具体的デバイスを反映するように、モデルを更新してもよい。モデルの間の遷移は、2項である必要はなく、母集団パラメータおよびデバイス特有のパラメータのある混成が、システム内に存在する、または持続的であり得る。これは、訓練データがある動作の体制のために疎もしくは利用不可能である場合、またはあるタイプの異常が訓練の間に模倣されることができない、もしくは模倣されるべきではない場合に、特に有用である。したがって、ある壊滅的異常が、ストックモデルに含まれ得る、シグネチャパターンによって先行され得る。典型的には、本システムは、訓練の間に、差し迫った故障に対応する動作領域を探索せず、したがって、それらの状態と関連付けられる動作体制は、未開拓のままであろう。したがって、これらの動作の体制に関するストックモデルの側面は、カスタムモデルが成熟した後でさえも、当然ながら持続し得る。
【0117】
いくつかの実施形態では、異常の連続有効監視を確実にするために、本システムは、ドリフトの存在に関してそれ自体を自動的に監視することができる。ドリフトは、モデルが直近のデータをもはやうまく適合しなくなり、本システムが検出するタイプI誤差の頻度が容認可能な事前規定された閾値を超えるときに、センサに関して検出されることができる。タイプI誤差は、モデルが異常を予測し、真の異常が予測される異常の周囲の定義された時間窓内で検出されないときを識別することによって、決定されることができる。
【0118】
真の異常は、ユーザが、予測される異常が誤ったアラートであるという入力を近リアルタイムで提供するとき、またはセンサ上に設定される閾値が超えられるときに、検出されることができる。閾値は、正常な動作範囲のための製造業者の仕様に従うことによって、または正常なセンサ動作の間のデータの分布を分析し、高および低閾値を識別することによって決定される、統計的閾値を設定することによってのいずれかで設定されることができる。
【0119】
これらの実施形態では、ドリフトが検出されるとき、本システムは、センサに関する直近のデータ上で(例えば、同一または異なるモデルタイプの)新しいモデルの発生をトリガすることができる。本システムは、直近のセンサデータからサンプリングされる同じ試験データ上で異なるモデルまたはモデルタイプの性能を比較し、選択されたモデル(例えば、最も効果的なモデル)を展開または生産に移すことができる。最も効果的なモデルは、最高再現率(最低タイプII誤差率)、最低誤検出率(最低タイプI誤差率)、および/または予測の最大リードタイム(製造業者推奨閾値が異常を検出する前にそれらを予測する最大時間量)を有する、モデルであり得る。しかしながら、その誤検出率が規定レベルを下回って降下するモデルが存在しない場合、本システムは、モデルを生産に移さないであろう。その場合において、いったんより近年のデータが捕捉されると、本システムは、成功するまでモデル発生における後続の試行を引き受けるであろう。
【0120】
いくつかの実施形態では、本明細書に説明される異常検出システムは、タグボート等の船舶上のエンジン冷却剤温度異常を決定するために使用されてもよい。図10は、機械学習モデルが記録された船舶エンジンデータに基づいて生成され得る様子の実施例を説明する。異常検出システムが始動する1002とき、独立エンジンパラメータおよびそれらの値への任意の制限、従属エンジンパラメータおよびそれらの値への任意の制限、モデル名等のモデル構成メタデータ1004が、データベース1006内に記憶されたモデルメタデータテーブルからアクセスされる。
【0121】
エンジンのデータ1008が、モデル発生のための入力データとして使用されるように、データベース1010からアクセスされる。図1は、モデル訓練セットに関するエンジンRPMおよび負荷の例示的独立変数を示す。要求される数のエンジンデータ行1008が、データベース1010内で利用可能ではない1014場合、エラーメッセージが、表示され1016、モデル発生ルーチンが、終了する1018。プロセスが、故障の場合にモデル構築を再試行する立場にあり得ることに留意されたい。
【0122】
十分な行のエンジンデータ1008が、利用可能である1012場合、モデル構築プロセスは、エンジンデータ時系列1008をフィルタ処理することによって開始する。イテレータ1050が、n行のセット1020からデータ行をスライスする。予測因子変数が、許容範囲内であり1022、エンジンデータが、モデルメタデータテーブル1006によって定義されるように安定している1024場合、データ行は、モデル1026で使用されるべきデータ行のセットに含まれる。予測因子変数のデータが、範囲内ではない、またはエンジンデータが、安定していない場合、データ行は、モデル1026で使用されるべきデータ行のセットから除外される1028。データフィルタリングプロセスは、次いで、エンジンデータ時系列1008内のデータ行毎に継続する。
【0123】
十分なデータ行がフィルタリング後に利用可能である1030場合、エンジンモデルが、機械学習1032を使用して発生される。アルゴリズム1は、加えて、予測因子変数の安定性が決定され、モデル入力データのためのフィルタとして使用される、データフィルタリングおよびモデル発生プロセスを詳述する。機械学習モデル1032は、いくつかの適切なモデル化技法または機械学習アルゴリズム(例えば、スプライン、サポートベクトルマシン、ニューラルネットワーク、および/または一般化加法モデル)を使用して生成されてもよい。いくつかの実装では、最低モデルバイアスおよび最低平均二乗誤差(MSE)を伴うモデルが、後続のステップで使用するためのモデルとして選択される。
少なすぎるデータ行がフィルタリング後に利用可能である1030場合、具体的エラーメッセージが、表示されてもよく1016、モデル発生ルーチンが、終了されてもよい1018。
【0124】
十分なデータ行が、利用可能であり1030、機械学習ベースのモデルが、発生された1032場合、モデルは、随意に、より高速の処理のためにモデルを直列化するための手段として、アルゴリズム2を使用して、ルックアップテーブルに変換されてもよい。ルックアップテーブルは、モデルが
【化14】

を表すことを考慮して、n+m列を含有することができる。0~2,000RPMのエンジンRPMおよび0~100%の負荷に関して、ルックアップテーブルは、独立変数毎に1の間隔を仮定して、200,000+1行を有することができる。モデルは、エンジンRPMおよび負荷の独立変数、ならびに冷却剤温度、冷却剤圧力、油温度、油圧、燃料圧力、燃料アクチュエータ割合の従属変数を仮定して、2+6=8列を有することができる。エンジンRPMおよび負荷毎に、モデルは、ルックアップテーブル内に記憶された結果を用いて従属パラメータの値を予測するために使用される。
【0125】
モデル1032が把握されると、訓練周期誤差統計が、アルゴリズム3に説明されるように計算されることができる。発生されたモデル1032を使用して、全ての従属センサ値に関する予測が、訓練周期の間に、その発生されたモデル1032および独立変数に関するデータに基づいて行われることができる。図1は、2つの独立変数、すなわち、エンジンRPMおよび負荷の時系列に関する例示的データを示す。誤差時系列は、時系列を横断して、従属センサのモデルの予測からその従属センサの測定値を減算することによって、発生されることができる。本誤差時系列の平均および標準偏差(すなわち、誤差統計)が、次いで、計算される。
【0126】
アルゴリズム4は、誤差統計が誤差zスコア系列に標準化され得る様子を説明する。誤差zスコア系列は、アルゴリズム3からの誤差統計を使用して、誤差時系列内の各誤差から誤差系列平均を減算し、結果を誤差標準偏差で除算することによって、計算される。図2は、訓練周期内の1つのセンサに関する例示的誤差zスコア系列を示す。概して、誤差zスコアは、±3の許容範囲200内であり、その範囲210外の短い急上昇が、エンジンが安定していない(すなわち、エンジンRPMおよび負荷が迅速に変化している)ときに生じる。範囲外のそれらの点は、モデルが構築されるときに除外される。
【0127】
誤差zスコア系列が計算され、モデルがエッジデバイスおよび/またはクラウドデータベースに展開されると、アルゴリズム5の設計時間ステップが、完了する。実行時間において、エンジンデータが、エッジにおける、またはクラウド内のいずれかのデータベース内に記憶される。アルゴリズム3の訓練誤差統計とアルゴリズム4を併用して、試験データ誤差zスコアが、計算されることができる。試験データ誤差zスコアの絶対値が、所与の閾値(例えば、ユーザ定義された、または自動的に発生された)を上回る場合、異常条件が、識別される。エラー通知が、送信される、または他の動作が、本エラー条件に基づいて講じられてもよい。
【0128】
図4図5、および図6は、冷却剤温度異常条件および故障条件を含有する、例示的周期を示す。図4は、独立変数、すなわち、エンジンRPMおよび負荷の値を描写する。冷却剤温度時系列500の開始と故障条件504の開始との間に、故障が接近していたという明確な傾向がデータに存在しなかった。第1の異常条件508が、故障条件504の20時間前に識別され、著しい異常510が、故障の1時間前に示された。図6は、軸の境界を変化させ、異常条件602、604、606、608、610の明確なビューを提供する。故障条件504は、予期される範囲(例えば、標準誤差範囲)の十分に外側で、著しい異常612条件によって突然引き起こされる。
【0129】
マハラノビス距離および/またはロバストなマハラノビス距離の計算を詳述する、アルゴリズム6が、異常を分類し、故障につながり得る異常を識別しようとするために、アルゴリズム7とともに使用されることができる。マハラノビスおよび/またはロバストなマハラノビス距離を生成するために、訓練周期誤差zスコア系列(例えば、図2の系列)が、マハラノビスならびに/もしくはロバストなマハラノビス距離アルゴリズムへの入力として使用される。結果は、「R」等の統計的コンピューティング言語およびその内蔵機能性を使用して、計算されてもよい。随意に、通常およびロバストなマハラノビス距離またはバタチャリヤ距離の最大値が、計算されることができる。図3は、訓練周期の間の6つのエンジンセンサデータ(冷却剤温度)、冷却剤圧力(冷却剤圧力)、油温度(油温度)、油圧(油圧)、燃料圧力(燃料圧力)、および燃料アクチュエータ割合(燃料アクチュエータ割合)からの誤差の算出されたzスコアの例示的マハラノビス距離時系列を示す。距離は、小さく(すなわち、ゼロに近く)、有界のままであることに留意されたい。前述の距離のうちの1つまたは多くをタグ値として使用して、既知の故障を含有する時間周期が、タグ付けされる。リアルタイムで、アルゴリズム7が、試験データを計算し、訓練の間に生成されるタグと合致させ、したがって、故障条件につながり得る異常条件を理解する手段を提供するために、使用されてもよい。
【0130】
図7は、試験周期の間の6つのエンジンセンサデータ(冷却剤温度)、冷却剤圧力(冷却剤圧力)、油温度(油温度)、油圧(油圧)、燃料圧力(燃料圧力)、および燃料アクチュエータ割合(燃料アクチュエータ割合)からの誤差の算出されたzスコアの例示的マハラノビス距離時系列を示す。第1の異常が識別されるとき700および故障条件がそのピークにあるとき702のピークに留意されたい。
【0131】
本明細書で使用されるように、用語「プロセッサ」は、レジスタおよび/またはメモリからの電子データを処理し、その電子データを、レジスタおよび/またはメモリ内に記憶され得る他の電子データに変換する、任意のデバイスもしくはデバイスの一部を指し得る。
【0132】
本開示される技術の種々の実施形態を実装するシステムが、以下のように構築されてもよい。本システムは、システムオンチップ、または市販の組み込みプロセッサ、すなわち、Arduino、MeOS、MicroPython、Raspberry Pi、もしくは他のタイプのプロセッサボードのうちのいずれか、またはそれらの任意の組み合わせを含み得る、少なくとも1つのコントローラを含む。本システムはまた、1つまたはそれを上回るソフトウェアもしくはファームウェアプログラムを実行し得る、特定用途向け集積回路(ASIC)、電子回路、プログラマブル組み合わせ回路(例えば、FPGA)、プロセッサ(共有、専用、もしくは群)、またはメモリ(共有、専用、もしくは群)、または説明される機能性を提供する他の好適なコンポーネントを含んでもよい。コントローラは、通信ポート、例えば、無線またはネットワークデバイスへのインターフェース、ユーザインターフェース、および他の周辺機器ならびに他のシステムコンポーネントを有する。
【0133】
いくつかの実施形態では、1つまたはそれを上回る他の特性に関するデータを決定する、感知する、および/またはコントローラに提供する、センサのうちの1つまたはそれを上回るものは、モノのインターネット(「IoT」)デバイスである、ならびに/もしくはそれを含んでもよい。IoTデバイスは、それぞれ、ネットワークへのコネクティビティを可能にし、典型的には、情報をコントローラ等のシステムに提供し得る、ハードウェアまたはソフトウェアを組み込まれ得る、物体もしくは「モノ」であってもよい。IoTデバイスは、ネットワークを経由して通信することを可能にされるため、IoTデバイスは、提供され得るサービスを向上させる、または補完するために、イベントベースのデータをサービスプロバイダもしくはシステムと交換してもよい。これらのIoTデバイスは、典型的には、自律的に、またはユーザ介入を殆どもしくは全く伴わずに、データを伝送することができる。いくつかの実施形態では、接続は、IoTデバイスとして車両センサを適応させてもよく、WiFi、LoRan、900MHz Wifi、BlueTooth(登録商標)、低エネルギーBlueTooth(登録商標)、USB、UWB等のうちのいずれかまたは全てを含み得る、IoT互換性コネクティビティを含んでもよい。Ethernet(登録商標) 100BaseT、1000baseT、CANBus、USB2.0、USB3.0、USB3.1等の有線接続が、採用されてもよい。
【0134】
実施形態が、所望に応じて構成するために任意の好適なハードウェアおよび/またはソフトウェアを使用して、システムに実装されてもよい。コンピューティングデバイスは、限定ではないが、プロセッサおよび少なくとも1つの通信インターフェースデバイスを含む、いくつかのコンポーネントを含み得る、マザーボード等のボードを収納してもよい。プロセッサは、マザーボードに物理的および電気的に結合される、1つまたはそれを上回るプロセッサコアを含んでもよい。少なくとも1つの通信インターフェースデバイスもまた、マザーボードに物理的および電気的に結合されてもよい。さらなる実装では、通信インターフェースデバイスは、プロセッサの一部であってもよい。実施形態では、プロセッサは、ハードウェアアクセラレータ(例えば、FPGA)を含んでもよい。
【0135】
その用途に応じて、本システムで使用されるコンピューティングデバイスは、限定ではないが、揮発性メモリ(例えば、DRAM)、不揮発性メモリ(例えば、ROM)、およびフラッシュメモリを含む、他のコンポーネントを含んでもよい。実施形態では、フラッシュおよび/またはROMは、アルゴリズム、オペレーティングシステム、アプリケーション、ユーザインターフェース、ならびに/もしくは本開示される技術の種々の実施形態による他の側面を実装するように構成される、実行可能プログラミング命令を含んでもよい。
【0136】
実施形態では、本システムで使用されるコンピューティングデバイスはさらに、アナログ/デジタルコンバータ、デジタル/アナログコンバータ、プログラマブル利得増幅器、サンプルホールド増幅器、データ入手サブシステム、パルス幅変調器入力、パルス幅変調器出力、グラフィックプロセッサ、デジタル信号プロセッサ、暗号プロセッサ、チップセット、セルラー無線、アンテナ、ディスプレイ、タッチスクリーンディスプレイ、タッチスクリーンコントローラ、バッテリ、オーディオコーデック、ビデオコーデック、電力増幅器、全地球測位システム(GPS)デバイスまたはサブシステム、コンパス(磁力計)、加速度計、バロメータ(圧力計)、ジャイロスコープ、スピーカ、カメラ、大容量記憶デバイス(SIMカードインターフェース、およびSDメモリもしくはマイクロSDメモリインターフェース、SATAインターフェース、ハードディスクドライブ、コンパクトディスク(CD)、デジタル多用途ディスク(DVD)等)、マイクロホン、フィルタ、発振器、圧力センサ、および/またはRFIDチップを含んでもよい。
【0137】
通信ネットワークインターフェースデバイスは、コンピューティングデバイスへおよびそれからのデータの転送のための無線通信を可能にし得る。用語「無線」およびその派生語は、非固体媒体を通した変調電磁放射線の使用を通してデータを通信し得る、回路、デバイス、システム、プロセス、技法、通信チャネル等を説明するために使用されてもよい。用語は、関連付けられるデバイスがいずれのワイヤも含有しないが、いくつかの実施形態では、含有しない場合があることを含意しない。通信チップ406は、限定ではないが、Wi-Fi(IEEE 802.11族)、IEEE 802.16規格(例えば、IEEE 802.16-2005年改正)を含む、Institute for Electrical and Electronic Engineers(IEEE)規格、任意の改正、更新、および/または改定付きのロングタームエボリューション(LTE)プロジェクト(例えば、アドバンストLTEプロジェクト、ウルトラモバイルブロードバンド(UMB)プロジェクト(「3GPP2」ともと称される)等)を含む、いくつかの無線規格またはプロトコルのうちのいずれかを実装してもよい。IEEE 802.16互換性BWAネットワークは、概して、IEEE 802.16規格のための適合性および相互運用性試験に合格する製品のための認証マークである、Worldwide Interoperability for Microwave Accessを表す頭字語である、WiMAXネットワークと称される。通信チップ406は、グローバルシステムフォーモバイルコミュニケーション(GSM(登録商標))、汎用パケット無線サービス(GPRS)、ユニバーサルモバイルテレコミュニケーションシステム(UMTS)、高速パケットアクセス(HSPA)、進化型HSPA(E-HSPA)、またはLTEネットワークに従って動作してもよい。通信チップ406は、GSM(登録商標)進化型強化データ(EDGE)、GSM(登録商標) EDGE無線アクセスネットワーク(GERAN)、ユニバーサル地上無線アクセスネットワーク(UTRAN)、または進化型UTRAN(E-UTRAN)に従って動作してもよい。通信チップ406は、符号分割多重アクセス(CDMA)、時分割多重アクセス(TDMA)、デジタル強化無線電気通信(DECT)、進化データ最適化(EV-DO)、それらの派生物、ならびに3G、4G、5G、およびそれ以上として指定される任意の他の無線プロトコルに従って動作してもよい。通信チップは、他の実施形態では、他の無線プロトコルに従って動作してもよい。コンピューティングデバイスは、複数の通信チップを含んでもよい。例えば、第1の通信チップは、Wi-FiおよびBluetooth(登録商標)等の短距離無線通信専用であり得、第2の通信チップは、GPS、EDGE、GPRS、CDMA、WiMAX、LTE、Ev-DO、およびその他等の長距離無線通信専用であり得る。
【0138】
本技術を実施するための例示的ハードウェアは、メモリに結合される、少なくとも1つの自動プロセッサ(またはマイクロプロセッサ)を含む。メモリは、ランダムアクセスメモリ(RAM)デバイス、キャッシュメモリ、プログラマブルまたはフラッシュメモリ等の不揮発性もしくはバックアップメモリ、読取専用メモリ(ROM)等を含んでもよい。加えて、メモリは、ハードウェアの他の場所に物理的に位置するメモリ記憶装置、例えば、プロセッサ内の任意のキャッシュメモリ、ならびに仮想メモリとして使用される、例えば、大容量記憶デバイス上に記憶されるような任意の記憶容量を含むと見なされ得る。
【0139】
ハードウェアは、外部で情報を通信するためのいくつかの入力および出力を受信してもよい。ユーザまたはオペレータとのインターフェースに関して、ハードウェアは、1つまたはそれを上回るユーザ入力デバイス(例えば、キーボード、マウス、撮像デバイス、スキャナ、マイクロホン)と、1つまたはそれを上回る出力デバイス(例えば、液晶ディスプレイ(LCD)パネル、音声再生デバイス(スピーカ))とを含んでもよい。本発明を具現化するために、ハードウェアは、少なくとも1つの画面デバイスを含んでもよい。
【0140】
付加的記憶、ならびにデータ入力および出力、ならびにユーザおよび機械インターフェースに関して、ハードウェアはまた、とりわけ、1つまたはそれを上回る大容量記憶デバイス、例えば、フロッピー(登録商標)または他のリムーバブルディスクドライブ、ハードディスクドライブ、直接アクセス記憶デバイス(DASD)、光学ドライブ(例えば、コンパクトディスク(CD)ドライブ、デジタル多用途ディスク(DVD)ドライブ)、および/またはテープドライブを含んでもよい。さらに、ハードウェアは、ネットワークに結合される他のコンピュータとの情報の通信を許容するための1つまたはそれを上回るネットワーク(例えば、とりわけ、ローカルエリアネットワーク(LAN)、広域ネットワーク(WAN)、無線ネットワーク、および/またはインターネット)とのインターフェースを含んでもよい。ハードウェアは、典型的には、当技術分野で公知である、プロセッサとコンポーネントのそれぞれとの間の好適なアナログおよび/またはデジタルインターフェースを含むことを理解されたい。
【0141】
ハードウェアは、オペレーティングシステムの制御下で動作し、種々のコンピュータソフトウェアアプリケーション、コンポーネント、プログラム、オブジェクト、モジュール等を実行し、上記に説明される技法を実装する。さらに、アプリケーションソフトウェアによって集合的に示される、種々のアプリケーション、コンポーネント、プログラム、オブジェクト等もまた、例えば、コンピュータプログラムの機能を実装するために要求される処理が、ネットワークを経由して複数のコンピュータに配分され得る、分散型コンピューティング環境内で、ネットワークを介してハードウェアに結合される別のコンピュータ内の1つまたはそれを上回るプロセッサ上で実行されてもよい。
【0142】
一般に、本開示の実施形態を実装するように実行されるルーチンは、オペレーティングシステムの一部、または具体的アプリケーション、コンポーネント、プログラム、オブジェクト、モジュール、もしくは「コンピュータプログラム」と称される命令のシーケンスとして、実装されてもよい。コンピュータプログラムは、典型的には、種々の時間においてコンピュータ内の種々のメモリおよび記憶デバイス内にあり、コンピュータ内の1つまたはそれを上回るプロセッサによって読み取られ、実行されると、コンピュータに、本発明の種々の側面を伴う要素を実行するために必要な動作を実施させる、1つまたはそれを上回る命令セットを備える。さらに、本技術は、完全に機能するコンピュータおよびコンピュータシステムとの関連で説明されているが、当業者は、本発明の種々の実施形態が種々の形態のプログラム製品として配布されることが可能であり、使用されるコンピュータ可読媒体の特定のタイプにかかわらず、配布を実際にもたらすように等しく適用され得ることを理解するであろう。コンピュータ可読媒体の実施例は、限定ではないが、とりわけ、揮発性および不揮発性メモリデバイス、リムーバブルディスク、ハードディスクドライブ、光ディスク(例えば、コンパクトディスク読取専用メモリ(CD-ROM)、デジタル多用途ディスク(DVD))、フラッシュメモリ等の記録可能なタイプの媒体を含む。別のタイプの配布が、インターネットダウンロードとして実装されてもよい。本技術は、ROM、持続的に記憶されたファームウェア、またはハードコードされた命令として提供されてもよい。
【0143】
ある例示的実施形態が説明され、付随する図面に示されているが、そのような実施形態は、広義の発明の制限ではなく例証にすぎず、本開示は、種々の他の修正が本開示を考察することに応じて当業者に想起され得るため、示され、説明される具体的構築および配列に限定されないことを理解されたい。開示される実施形態は、本開示の原理から逸脱することなく、その詳細のうちの1つまたはそれを上回るものにおいて容易に修正または再配列されてもよい。
【0144】
本明細書に説明される主題および動作の実装は、本明細書に開示される構造およびそれらの構造均等物を含む、デジタル電子回路、コンピュータソフトウェア、ファームウェア、またはハードウェアで、もしくはそれらのうちの1つまたはそれを上回るものの組み合わせで、実装されることができる。本明細書に開示される主題の実装は、1つまたはそれを上回るコンピュータプログラム、すなわち、データ処理装置の動作による実行のために、もしくは動作を制御するために、1つまたはそれを上回るコンピュータ記憶媒体上でエンコードされる、コンピュータプログラム命令の1つまたはそれを上回るモジュールとして、実装されることができる。代替として、または加えて、プログラム命令は、データ処理装置による実行のために好適な受信機装置に伝送するための情報をエンコードするように発生される、人工に発生された伝搬信号、例えば、機械で発生された電気、光学、もしくは電磁信号上でエンコードされることができる。コンピュータ記憶媒体は、コンピュータ可読記憶デバイス、コンピュータ可読記憶基板、ランダムまたはシリアルアクセスメモリアレイもしくはデバイス、またはそれらのうちの1つまたはそれを上回るものの組み合わせである、もしくはそれに含まれることができる。さらに、非一過性のコンピュータ記憶媒体は、伝搬信号ではないが、コンピュータ記憶媒体は、人工的に発生された伝搬信号でエンコードされるコンピュータプログラム命令のソースまたは宛先であり得る。コンピュータ記憶媒体はまた、1つまたはそれを上回る別個のコンポーネントもしくは媒体(例えば、複数のCD、ディスク、または他の記憶デバイス)である、もしくはそれに含まれることができる。
【0145】
故に、コンピュータ記憶媒体は、有形および非一過性であり得る。請求項の範囲内の全ての実施形態は、本質的に有形および非抽象的として解釈されるべきであり、したがって、本願は、抽象的主題を包含し得る任意の解釈を明示的に否認する。
【0146】
本技術は、それがインストールされる機械の機能を改良し、異なるアルゴリズムを採用する機械と明確に異なる結果を提供する、分析を提供する。
【0147】
本明細書に説明される動作は、1つまたはそれを上回るコンピュータ可読記憶デバイス上に記憶される、もしくは他のソースから受信されるデータにデータ処理装置によって実施される動作として、実装されることができる。
【0148】
用語「クライアント」または「サーバ」は、一例として、プログラマブルプロセッサ、コンピュータ、システムオンチップ、または前述の複数のものもしくは組み合わせを含む、データを処理するための種々の装置、デバイス、および機械を含む。本装置は、専用論理回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)を含むことができる。本装置はまた、ハードウェアに加えて、当該コンピュータプログラムのための実行環境を生成するコード、例えば、プロセッサファームウェア、プロトコルスタック、データベース管理システム、オペレーティングシステム、クロスプラットフォーム実行時間環境、仮想マシン、またはそれらのうちの1つまたはそれを上回るものの組み合わせを構成するコードを含むこともできる。本装置および実行環境は、ウェブサービス、分散型コンピューティングおよびグリッドコンピューティングインフラストラクチャ等の種々の異なるコンピューティングモデルインフラストラクチャを実現することができる。
【0149】
コンピュータプログラム(プログラム、ソフトウェア、ソフトウェアアプリケーション、スクリプト、またはコードとしても公知である)は、コンパイラ型またはインタープリタ型言語、宣言型言語もしくは手続き型言語を含む、プログラミング言語の任意の形態で書かれることができ、これは、独立型プログラムとして、またはモジュール、コンポーネント、サブルーチン、もしくはコンピューティング環境で使用するために好適な他のユニットとしてを含む、任意の形態で展開されることができる。コンピュータプログラムは、ファイルシステム内のファイルに対応し得るが、その必要はない。プログラムは、他のプログラムまたはデータを保持するファイルの一部(例えば、マークアップ言語文書内に記憶された1つまたはそれを上回るスクリプト)内に、該当プログラム専用の単一ファイル内に、もしくは複数の協調ファイル(例えば、1つまたはそれを上回るモジュール、サブプログラム、もしくはコードの一部を記憶するファイル)内に記憶されることができる。コンピュータプログラムは、1つのコンピュータ上で、または単一の地点に位置する、もしくは複数の地点を横断して分散され、通信ネットワークによって相互接続される複数のコンピュータ上で実行されるように展開されることができる。
【0150】
本明細書に説明されるプロセスおよび論理フローは、入力データに作用し、出力を発生させることによってアクションを実施するように、1つまたはそれを上回るコンピュータプログラムを実行する、1つまたはそれを上回るプログラマブルプロセッサによって、実施されることができる。アーキテクチャは、CISC、RISC、SISD、SIMD、MIMD、緩く結合された並列処理等であってもよい。プロセスおよび論理フローはまた、専用論理回路、例えば、FPGA(フィールドプログラマブルゲートアレイ)またはASIC(特定用途向け集積回路)によって実施されることもでき、装置もまた、それとして実装されることができる。
【0151】
コンピュータプログラムの実行のために好適なプロセッサは、一例として、汎用および専用マイクロプロセッサの両方、ならびに任意の種類のデジタルコンピュータのいずれか1つまたはそれを上回るプロセッサを含む。概して、プロセッサは、読取専用メモリ、またはランダムアクセスメモリ、もしくは両方から、命令およびデータを受信するであろう。コンピュータの不可欠な要素は、命令に従ってアクションを実施するためのプロセッサ、および命令ならびにデータを記憶するための1つまたはそれを上回るメモリデバイスである。概して、コンピュータはまた、データを記憶するための1つまたはそれを上回る大容量記憶デバイス、例えば、磁気、光磁気ディスク、または光ディスクを含む、もしくはそこからデータを受信する、またはそこにデータを転送する、もしくは両方を行うように、動作可能に結合されるであろう。しかしながら、コンピュータは、そのようなデバイスを有する必要はない。さらに、コンピュータは、別のデバイス、例えば、携帯電話(例えば、スマートフォン)、携帯情報端末(PDA)、モバイルオーディオまたはビデオプレーヤ、ゲーム機、もしくはポータブル記憶デバイス(例えば、ユニバーサルシリアルバス(USB)フラッシュドライブ)に埋め込まれることができる。コンピュータプログラム命令およびデータを記憶するために好適なデバイスは、一例として、半導体メモリデバイス、例えば、EPROM、EEPROM、およびフラッシュメモリデバイス、磁気ディスク、例えば、内部ハードディスクまたはリムーバブルディスク、光磁気ディスク、ならびにCD-ROMおよびDVD-ROMディスクを含む、全ての形態の不揮発性メモリ、媒体、およびメモリデバイスを含む。プロセッサおよびメモリは、専用論理回路によって補完される、またはそれに組み込まれることができる。
【0152】
ユーザとの相互作用を提供するために、本明細書に説明される主題の実装は、ディスプレイデバイス、例えば、LCD(液晶ディスプレイ)、OLED(有機発光ダイオード)、TFT(薄膜トランジスタ)、プラズマ、他の可撓性構成、またはユーザに情報を表示するための任意の他のモニタと、キーボードと、ポインティングデバイス、例えば、それによってユーザが入力をコンピュータに提供し得る、マウス、トラックボール等、またはタッチスクリーン、タッチパッド等とを有する、コンピュータ上に実装されることができる。他の種類のデバイスも、ユーザとの相互作用を提供するために使用されることができる。例えば、ユーザに提供されるフィードバックは、任意の形態の感覚フィードバック、例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバックであり得、ユーザからの入力が、音響、発話、または触覚入力を含む、任意の形態で受信されることができる。加えて、コンピュータは、ユーザによって使用されるデバイスに文書を送信し、そこから文書を受信することによって、ユーザと相互作用することができる。例えば、ウェブブラウザから受信される要求に応答して、ウェブページをユーザのクライアントデバイス上のウェブブラウザに送信することによる。
【0153】
本明細書に説明される主題の実装は、例えば、データサーバとして、バックエンドコンポーネントを含む、またはミドルウェアコンポーネント、例えば、アプリケーションサーバを含む、もしくはフロントエンドコンポーネント、例えば、それを通してユーザが本明細書に説明される主題の実装と相互作用し得る、グラフィカルユーザインターフェースまたはウェブブラウザを有する、クライアントコンピュータ、もしくは1つまたはそれを上回るそのようなバックエンド、ミドルウェア、もしくはまたはフロントエンドコンポーネントの任意の組み合わせを含む、コンピューティングシステムで実装されることができる。システムのコンポーネントは、任意の形態または媒体のデジタルデータ通信、例えば、通信ネットワークによって、相互接続されることができる。通信ネットワークの実施例は、ローカルエリアネットワーク(「LAN」)および広域ネットワーク(「WAN」)、インターネットワーク(例えば、インターネット)、ならびにピアツーピアネットワーク(例えば、アドホックピアツーピアネットワーク)を含む。
【0154】
本明細書は、多くの具体的実装詳細を含有するが、これらは、任意の発明または請求され得るものの範囲への限定として解釈されるべきではなく、むしろ、特定の発明の特定の実装に特有の特徴の説明として解釈されるべきである。別個の実装との関連で本明細書に説明される、ある特徴はまた、単一の実装において組み合わせで実装されることもできる。逆に、単一の実装との関連で説明される種々の特徴はまた、別個に、または任意の好適な副次的組み合わせにおいて、複数の実装で実装されることもできる。さらに、特徴は、ある組み合わせで作用するものとして上記に説明され、そのようなものとして最初に請求さえされ得るが、請求される組み合わせからの1つまたはそれを上回る特徴は、ある場合には、組み合わせから除外されることができ、請求される組み合わせは、副次的組み合わせまたは副次的組み合わせの変形例を対象とし得る。
【0155】
同様に、動作は、特定の順序で考慮されるが、これは、望ましい結果を達成するために、そのような動作が、示される特定の順序で、連続的順序で実施されること、または全ての動作が実施されることを要求すると理解されるべきではない。ある状況では、マルチタスクおよび並列処理が、有利であり得る。さらに、上記に説明される実装における種々のシステムコンポーネントの分離は、全ての実装においてそのような分離を要求するものとして理解されるべきではなく、説明されるプログラムコンポーネントおよびシステムは、概して、単一のソフトウェア製品にともに統合される、または複数のソフトウェア製品にパッケージ化され得ることを理解されたい。
【0156】
したがって、主題の特定の実装が、説明された。他の実装も、以下の請求項の範囲内である。ある場合には、請求項に記載されるアクションは、異なる順序で実施され、依然として、望ましい結果を達成することができる。加えて、付随する図に描写されるプロセスは、望ましい結果を達成するために、示される特定の順序または連続的順序を必ずしも要求するわけではない。ある実装では、マルチタスクおよび並列処理が、利用されてもよい。
【0157】
上記に説明される種々の実施形態は、さらなる実施形態を提供するように組み合わせられることができる。本明細書で参照される、および/または出願データシートに列挙される、米国特許、米国特許出願公開、米国特許出願、外国特許、外国特許出願、ならびに非特許出版物の全てが、参照することによってそれらの全体として本明細書に組み込まれる。実施形態の側面は、種々の特許、出願、および公開の概念を採用し、その上さらなる実施形態を提供するために、必要である場合、修正されることができる。参照することによって組み込まれる任意の文書が本願と矛盾する場合、本願が優先される。
【0158】
これらおよび他の変更が、上記に詳述される説明を踏まえて実施形態に行われることができる。一般に、以下の請求項では、使用される用語は、請求項を本明細書および請求項に開示される具体的実施形態に限定すると解釈されるべきではなく、そのような請求項が権利を与えられる均等物の全範囲とともに、全ての可能性として考えられる実施形態を含むと解釈されるべきである。故に、請求項は、本開示によって限定されない。


アルゴリズム
アルゴリズム1:機械学習を使用して、エンジンモデルを生成する。(図8参照)
データ:訓練周期に関するエンジンデータ時系列
【0159】
結果:機械学習初期化を使用するエンジンモデル;
【0160】
予測因子変数に関して予測可能な範囲を定義する;
【0161】
(例えば、1,000を上回るrpm);
【0162】
予測因子の複合安定性に関して真/偽を記憶し得る、isStableと呼ばれる新しいブール列を生成する;
【0163】
isStableを算出し、時系列内に値を記憶する;
【0164】
(例えば、最後のn分に、予測因子変数の変化がk標準偏差以内である場合、isStable=真であり、さもなければ、isStable=偽である);
if 予測因子変数が予測可能な範囲内であり、ある事前決定された時間にわたってisStable=真である then
【0165】
モード生成からの記録を含む;
else
【0166】
モード生成から記録を除外する;
end
【0167】
機械学習を使用して、フィルタ処理されたデータからエンジンモデルを生成する;
【0168】
複数の機械学習アルゴリズム(例えば、スプライン、サポートベクトルマシン、ニューラルネットワーク、および/または一般化加法モデル)を使用し、統計モデルを構築する;最低モデルバイアスを伴い、最も密接に訓練データに適合する(すなわち、最低平均二乗誤差(MSE)を有する)モデルを選択する;
アルゴリズム2:統計モデルをルックアップテーブルに変換する(随意のステップ)
データ:アルゴリズム1からのRモデル
結果:モデルルックアップテーブル
【0169】
初期化;
if モデル生成が成功した then
【0170】
モデルが
【化15】

を表すことを考慮して、n+m列を伴うモデルルックアップテーブルを生成する;
【0171】
例えば、エンジンRPM0~2,000および負荷0~100に関するルックアップテーブルは、独立変数毎に1の間隔を仮定して、200,000+1列を有するであろう。モデルは、エンジンRPMおよび負荷の独立変数、ならびに冷却剤温度、冷却剤圧力、油温度、油圧、燃料圧力、燃料アクチュエータ割合の従属変数を仮定して、2+6=8列を有するであろう。エンジンRPMおよび負荷毎に、Rモデルは、従属パラメータの値を予測するために使用され、それらの予測値は、次いで、ルックアップテーブル内に記憶される。
【0172】
例えば、有界領域のためのルックアップテーブルは、エンジンRPM1,000~2,000および負荷40~100であってもよく、独立変数毎に1の間隔を仮定して、60,000+1列を有するであろう;
else
動作なし
end
アルゴリズム3:訓練周期の間に着目エンジンパラメータに関して誤差統計を生成する
データ:アルゴリズム1および訓練データからのRモデル
結果:誤差統計
【0173】
初期化;
if モデル生成が成功した then
【0174】
モデルまたはルックアップテーブルを使用し、着目時系列を予測する;実際の値と予測値との間の差異を計算する;誤差時系列を生成する;
else
動作なし
end
【0175】
誤差平均および誤差標準偏差を計算する;
アルゴリズム4:z誤差スコアを算出する
データ:展開されたモデルおよび試験データ
結果:誤差のzスコア
【0176】
初期化;
if モデル生成が成功した then
【0177】
モデルを使用し、着目時系列を予測する;
【0178】
実際の値と予測値との間の差異を計算することによって、誤差時系列を生成する;
【0179】
訓練誤差平均を減算し、誤差をアルゴリズム3からの訓練誤差標準偏差で除算することによって、誤差系列のzスコアを算出する;
【0180】
error=(X-μtraining)/σtraining
誤差のzスコアを時系列として保存する
else
動作なし
end
アルゴリズム5:システムアルゴリズム
データ:エンジンデータ訓練および近リアルタイム試験データ
結果:近リアルタイムにおけるエンジンパラメータ異常検出
【0181】
初期化;
【0182】
設計時間ステップ1:アルゴリズム1を使用し、訓練データからエンジンモデルを生成する;
【0183】
設計時間ステップ2:アルゴリズム3を使用し、誤差統計を生成する;
【0184】
設計時間ステップ3:随意に、アルゴリズム2を使用し、モデルルックアップテーブルを生成する;
【0185】
設計時間ステップ4:エッジデバイスおよび/またはクラウドデータベース上にモデルを展開する;
実行時間ステップ1:while エンジンデータが利用可能であり、予測因子が範囲内であり、エンジンが定常状態である do
if モデル展開が成功した then
【0186】
ステップ5:アルゴリズム4を使用して、試験データからz誤差スコアを算出し、保存する;
if z_スコアの絶対値>k then
【0187】
エラー通知を送信する;
else
動作なし
end
else
動作なし
end
end
アルゴリズム6:深層学習のためのマハラノビス距離および/またはロバストなマハラノビス距離を生成する
データ:タイムスタンプと、アルゴリズム4からの訓練周期の間のエンジンデータ時系列からの誤差のzスコアとを含有する、エンジンデータ誤差時系列
結果:ロバストなマハラノビス距離時系列
【0188】
ステップ1:(例えば、内蔵「R」を介して)ロバストなマハラノビス距離アルゴリズムを通して、入力エンジンデータ誤差zスコアをパスする;
【0189】
ステップ2:随意に:通常およびロバストなマハラノビス距離の最大値を使用する、訓練データを分類するときに、バタチャリヤ距離を算出し、入力データとして使用する。
【0190】
Rcodesample library(MASS) X_trg ←訓練周期の間のエンジンデータからの多次元標準化誤差(誤差のzスコア)時系列;
【0191】
maha1.X_test ← sqrt(mahalanobis(X_trg, colMeans(X_trg), cov(X_trg)));
【0192】
covmve.X1_trg ← cov.rob(X1_trg);
maha2.X test ←
【0193】
sqrt(mahalanobis(X_trg, covmve.X trg$center, covmve.X trg$cov));
【0194】
max.maha.X ← max(c(maha1.X, maha2.X));
ステップ3:人間が時間周期を既知のエンジン問題でタグ付けする
【0195】
ステップ4:エンジンデータ異常についての将来の評価の近リアルタイム分類のためのタグとともに、マハラノビスまたはバタチャリヤ距離の範囲を算出および保存する。
アルゴリズム7:ロバストな距離を使用してリアルタイムでzスコアを分類する
データ:タイムスタンプと、アルゴリズム4からの試験周期の間のエンジンデータ時系列からの誤差のzスコアとを含有する、エンジンデータ誤差時系列
【0196】
結果:エンジン異常検出および分類初期化;
【0197】
ステップ1:(例えば、内蔵「R」を介して)ロバストなマハラノビス距離アルゴリズムを通して、入力エンジンデータ誤差zスコアをパスする;
【0198】
ステップ2:随意に:通常およびロバストなマハラノビス距離の最大値を使用する、試験データを分類するときに、バタチャリヤ距離を算出し、入力データとして使用する。
【0199】
Rcodesample library(MASS) X_trg ←訓練周期の間のエンジンデータからの多次元標準化誤差(誤差のzスコア)時系列;
【0200】
maha1.X_test ← sqrt(mahalanobis(X trg, colMeans(X trg), cov(X trg)));
【0201】
covmve.X1_trg ← cov.rob(X1_trg);
maha2.X_test ←
【0202】
sqrt(mahalanobis(X_trg, covmve.X trg$center, covmve.X trg$cov));
【0203】
max.maha.X ← max(c(maha1.X, maha2.X));
【0204】
library(MASS);
【0205】
X_test i-試験周期の間の試験エンジンデータからの多次元誤差時系列;
X_trg i-訓練周期の間のエンジンデータからの多次元誤差時系列
【0206】
maha1.X test i- sqrt(mahalanobis(X_test, colMeans(X_trg), cov(X_trg)));
【0207】
covmve.X1 trg i- cov.rob(X1 trg);
【0208】
maha2.X test i- sqrt(mahalanobis(X test, covmve.X trgcenter, covmve.X trgcov));
【0209】
max.maha.X i- max(c(maha1.X, maha2.X));
【0210】
算出されたマハラノビス/バタチャリヤ距離が、前もって学習された時間周期と同一の範囲内である場合、訓練からの同一のタグを用いて試験周期を分類する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
【国際調査報告】