IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ インターナショナル・ビジネス・マシーンズ・コーポレーションの特許一覧

<>
  • 特許-非線形特性を伴う性能低下の予測 図1
  • 特許-非線形特性を伴う性能低下の予測 図2
  • 特許-非線形特性を伴う性能低下の予測 図3
  • 特許-非線形特性を伴う性能低下の予測 図4
  • 特許-非線形特性を伴う性能低下の予測 図5A
  • 特許-非線形特性を伴う性能低下の予測 図5B
  • 特許-非線形特性を伴う性能低下の予測 図6A
  • 特許-非線形特性を伴う性能低下の予測 図6B
  • 特許-非線形特性を伴う性能低下の予測 図7
  • 特許-非線形特性を伴う性能低下の予測 図8
  • 特許-非線形特性を伴う性能低下の予測 図9
  • 特許-非線形特性を伴う性能低下の予測 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-24
(45)【発行日】2024-11-01
(54)【発明の名称】非線形特性を伴う性能低下の予測
(51)【国際特許分類】
   G06F 18/24 20230101AFI20241025BHJP
   G06F 18/232 20230101ALI20241025BHJP
   G06N 20/00 20190101ALI20241025BHJP
   G06F 123/02 20230101ALN20241025BHJP
【FI】
G06F18/24
G06F18/232
G06N20/00 130
G06F123:02
【請求項の数】 30
(21)【出願番号】P 2022562596
(86)(22)【出願日】2021-05-05
(65)【公表番号】
(43)【公表日】2023-06-20
(86)【国際出願番号】 IB2021053805
(87)【国際公開番号】W WO2021229371
(87)【国際公開日】2021-11-18
【審査請求日】2023-10-26
(31)【優先権主張番号】16/871,359
(32)【優先日】2020-05-11
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【弁理士】
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【弁理士】
【氏名又は名称】片岡 忠彦
(72)【発明者】
【氏名】コードジャジ、ネダ
(72)【発明者】
【氏名】サリュウ、モショド、オモレード
【審査官】多賀 実
(56)【参考文献】
【文献】特開2015-088078(JP,A)
【文献】特開2018-097616(JP,A)
【文献】特開2019-199874(JP,A)
【文献】特開2018-138327(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 18/00-18/40
G06F 123/02
G06N 3/00-99/00
G01M 99/00
F04C 2/08- 2/28
F04C 18/08-18/28
(57)【特許請求の範囲】
【請求項1】
新しいデータ・サンプルを故障予測モデルに入力することであって、前記故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、前記各トレーニング・サンプルが複数のクラスタにクラスタ化され、前記複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、前記入力することと、
前記複数のクラスタのうちの前記新しいデータ・サンプルを含んでいる第1のクラスタの第1の異常スコアを、前記異常スコアより大きい前記正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、前記新しいデータ・サンプルに関連付けられた分類を出力することとを含む、コンピュータ実装方法。
【請求項2】
前記分類が、前記新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す、請求項1に記載の方法。
【請求項3】
前記ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する、請求項1に記載の方法。
【請求項4】
前記予測範囲が、未来の事前に定義された時間の量を定義し、前記事前に定義された時間の量だけ未来の各データ点の各ラベルが、前記各トレーニング・サンプルに関連付けられる、請求項1に記載の方法。
【請求項5】
K平均クラスタ化を使用して前記各トレーニング・サンプルがクラスタ化される、請求項1に記載の方法。
【請求項6】
リモートのデータ処理システムから故障予測システムにダウンロードされたソフトウェアに従って、前記故障予測システムによって前記方法が実行される、請求項1に記載の方法。
【請求項7】
前記方法が、
前記ソフトウェアの使用を計測することと、
前記使用の計測に基づいてインボイスを生成することとをさらに含む、請求項6に記載の方法。
【請求項8】
前記方法が、一軸ねじポンプ(PCP)の摩耗に関連する劣化を予測するためのものであり、前記入力ステップが、PCPの新しいデータ・サンプルを、前記PCPの摩耗に関連する劣化を予測するように構成されたモデルに入力することを含み、前記モデルが、ラベル付けされた過去のPCPデータセットを使用してトレーニングされ、前記出力ステップの間に出力された前記分類が、前記PCPの前記摩耗に関連する劣化を示す、請求項1に記載の方法。
【請求項9】
1つまたは複数のPCPに関連付けられた過去のデータの2値のラベル付けを実行することによって、前記ラベル付けされた過去のデータを生成することを含み、前記複数のトレーニング・データ・サンプルが、ルックバック・ウィンドウおよび予測範囲を前記ラベル付けされた過去のデータの各データ点に適用することによって作成され、前記方法が、
前記複数のクラスタの各クラスタについて計算されるクラスタ・スコアを計算することであって、前記クラスタ・スコアが前記正常スコアおよび前記異常スコアである、前記計算することと、
PCPの前記新しいデータ・サンプルを前記複数のクラスタのうちの第1のクラスタに割り当てることと、
前記第1のクラスタに関連付けられたクラスタ・スコアに基づいて分類を前記新しいデータ・サンプルに割り当てることとを含む、請求項8に記載の方法。
【請求項10】
前記ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされる、請求項9に記載の方法。
【請求項11】
前記ラベル付けされた過去のデータが、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、および保守記録を含む、請求項9に記載の方法。
【請求項12】
前記各クラスタの前記クラスタ・スコアを計算することが、
前記第1のクラスタの正常スコアを計算することであって、前記正常スコアが、前記第1のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第1の比率を、前記複数のトレーニング・データ・サンプルにおける前記正常状態に関連付けられたトレーニング・データ・サンプルの第2の比率で割った値である、前記計算することと、
前記第1のクラスタの異常スコアを計算することであって、前記異常スコアが、前記第1のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第3の比率を、前記複数のトレーニング・データ・サンプルにおける前記劣化状態に関連付けられたトレーニング・データ・サンプルの第4の比率で割った値である、前記計算することとをさらに含む、請求項9に記載の方法。
【請求項13】
前記分類が、前記第1のクラスタの前記正常スコアまたは前記異常スコアのより大きい値に基づく、請求項12に記載の方法。
【請求項14】
前記方法が、
前記新しいデータ・サンプルに関する故障信号を生成することをさらに含み、前記故障信号が、既定の数の前のデータ点にわたる前記新しいデータ・サンプルに関する平均異常スコアを含む、請求項9に記載の方法。
【請求項15】
前記故障信号を生成することが、
異常スコアより大きい正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアを計算することと、
前記既定の数の前のデータ点の各々について、前記平均異常スコアより大きい前記第1のクラスタの異常スコアを有しているデータ点に1の値を関連付けることと、前記平均異常スコアより小さい前記第1のクラスタの異常スコアを有しているデータ点に0の値を関連付けることと、
前記既定の数の前のデータ点の各々に関連付けられた前記1の値および0の値の平均値として前記故障信号を計算することとをさらに含む、請求項14に記載の方法。
【請求項16】
1つまたは複数のプロセッサと、
プログラム命令を格納している1つまたは複数のコンピュータ可読ストレージ媒体とを備えているシステムであって、前記プログラム命令が、前記1つまたは複数のプロセッサによって実行された場合に、前記1つまたは複数のプロセッサに、
新しいデータ・サンプルを故障予測モデルに入力することであって、前記故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、前記各トレーニング・サンプルが複数のクラスタにクラスタ化され、前記複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、前記入力することと、
前記複数のクラスタのうちの前記新しいデータ・サンプルを含んでいる第1のクラスタの第1の異常スコアを、前記異常スコアより大きい前記正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、前記新しいデータ・サンプルに関連付けられた分類を出力することとを含んでいる方法を実行させるように構成される、システム。
【請求項17】
前記分類が、前記新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す、請求項16に記載のシステム。
【請求項18】
前記ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する、請求項16に記載のシステム。
【請求項19】
前記予測範囲が、未来の事前に定義された時間の量を定義し、前記事前に定義された時間の量だけ未来の各データ点の各ラベルが、前記各トレーニング・サンプルに関連付けられる、請求項16に記載のシステム。
【請求項20】
K平均クラスタ化を使用して前記各トレーニング・サンプルがクラスタ化される、請求項16に記載のシステム。
【請求項21】
請求項1ないし15のいずれか一項に記載の方法を実行させるコンピュータ・プログラムを記録したコンピュータ可読記録媒体。
【請求項22】
一軸ねじポンプ(PCP)の摩耗に関連する劣化を予測するためのコンピュータ実装方法であって、前記方法が、
PCPの新しいデータ・サンプルを、前記PCPの摩耗に関連する劣化を予測するように構成されたモデルに入力することであって、前記モデルが、ラベル付けされた過去のPCPデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、前記各トレーニング・サンプルが複数のクラスタにクラスタ化され、前記複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、前記入力することと、
前記複数のクラスタのうちの前記新しいデータ・サンプルを含んでいる第1のクラスタの第1の異常スコアを、前記異常スコアより大きい前記正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、前記新しいデータ・サンプルに関連付けられた分類を出力することとを含み、前記分類が、前記PCPの前記摩耗に関連する劣化を示す、コンピュータ実装方法。
【請求項23】
一軸ねじポンプ(PCP)の摩耗に関連する劣化を予測するためのコンピュータ実装方法であって、前記方法が、
1つまたは複数のPCPに関連付けられた過去のデータの2値のラベル付けを実行することによって、ラベル付けされた過去のデータを生成することと、
ルックバック・ウィンドウおよび予測範囲を前記ラベル付けされた過去のデータの各データ点に適用することによって、複数のトレーニング・データ・サンプルを生成することと、
前記複数のトレーニング・データ・サンプルを複数のクラスタにクラスタ化することと、
前記複数のクラスタのうちの各クラスタのクラスタ・スコアを計算することと、
PCPの新しいデータ・サンプルを前記複数のクラスタのうちの第1のクラスタに割り当てることと、
前記第1のクラスタに関連付けられたクラスタ・スコアに基づいて、分類を前記新しいデータ・サンプルに割り当てることとを含み、前記分類が、前記PCPの未来の摩耗に関連する劣化の可能性を示す、コンピュータ実装方法。
【請求項24】
前記ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされる、請求項23に記載の方法。
【請求項25】
前記ラベル付けされた過去のデータが、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、および保守記録を含む、請求項23に記載の方法。
【請求項26】
前記各クラスタの前記クラスタ・スコアを計算することが、
前記第1のクラスタの正常スコアを計算することであって、前記正常スコアが、前記第1のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第1の比率を、前記複数のトレーニング・データ・サンプルにおける前記正常状態に関連付けられたトレーニング・データ・サンプルの第2の比率で割った値である、前記計算することと、
前記第1のクラスタの異常スコアを計算することであって、前記異常スコアが、前記第1のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第3の比率を、前記複数のトレーニング・データ・サンプルにおける前記劣化状態に関連付けられたトレーニング・データ・サンプルの第4の比率で割った値である、前記計算することとをさらに含む、請求項23に記載の方法。
【請求項27】
前記分類が、前記第1のクラスタの前記正常スコアまたは前記異常スコアのより大きい値に基づく、請求項26に記載の方法。
【請求項28】
前記方法が、
前記新しいデータ・サンプルに関する故障信号を生成することをさらに含み、前記故障信号が、既定の数の前のデータ点にわたる前記新しいデータ・サンプルに関する平均異常スコアを含む、請求項23に記載の方法。
【請求項29】
前記故障信号を生成することが、
異常スコアより大きい正常スコアを有している前記複数のクラスタのクラスタの平均異常スコアを計算することと、
前記既定の数の前のデータ点の各々について、前記平均異常スコアより大きい前記第1のクラスタの異常スコアを有しているデータ点に1の値を関連付けることと、前記平均異常スコアより小さい前記第1のクラスタの異常スコアを有しているデータ点に0の値を関連付けることと、
前記既定の数の前のデータ点の各々に関連付けられた前記1の値および0の値の平均値として前記故障信号を計算することとをさらに含む、請求項28に記載の方法。
【請求項30】
求項1ないし15および請求項22ないし29のいずれか一項に記載の前記方法をコンピュータに実行させる、コンピュータ・プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、予測モデル化に関連しており、より詳細には、非線形特性を伴う性能低下の予測に関連している。
【背景技術】
【0002】
非線形の性能低下は、1つまたは複数の機械システムまたは機械要素の徐々の劣化に関連する現象を含むことがあり、この徐々の劣化は、最終的に、1つまたは複数の機械システムまたは機械要素の故障または永続的に準最適な性能をもたらす可能性がある。非線形の性能低下に関連するそのような徐々の劣化は、摩耗(例えば、別の物質との相互作用に基づく構成要素の徐々の除去または変形による弱化)、疲労(例えば、循環的負荷から生じる弱化)、クリープ(例えば、持続的な機械的応力から生じる変形)、またはその他の非線形の現象、あるいはその組み合わせのうちのいずれかの種類に関連することがある。非線形の性能低下は、機械的応力、化学的応力、熱的応力、またはその他の応力によって引き起こされる可能性がある。例えば、摩耗の現象は、アブレシブ摩耗、浸食摩耗、腐食摩耗、およびその他の種類の摩耗を含むことがある。
【0003】
しかし、摩耗によって引き起こされる劣化などの非線形の性能低下を予測することは、多くの課題を提起する。一例として、摩耗は、長期間にわたって進行する徐々の故障である。それに応じて、正常な状態と摩耗した状態の間の関係は非線形であり、線形モデル(例えば、単純ベイズ、サポート・ベクター・マシン(SVM:Support Vector Machines)など)を適応不可能にする。さらに、摩耗故障の進行は、類似する資産の間で、例えば使用特性に応じて、非常に変わりやすい(例えば、ある資産は50日以内に故障し、一方、他の資産は6か月以内に故障する)。1つの例として、一軸ねじポンプ(PCP:progressing cavity pump)における摩耗に関連する性能低下は、例えば、地下の地層の種類、砂の粒度、またはいずれかの特定のPCPの動作プロファイル、あるいはその組み合わせなどの、複数の要因に依存することがある。したがって、同じ時点での時間と故障の関数としての性能低下のレベルは、さまざまな動作上の要因に基づいて、異なる資産間で変化する可能性がある。
【0004】
非線形の性能低下を予測することの別の課題は、摩耗に関連する性能低下などの非線形の性能低下が発生している資産の、正常な動作状態と故障した動作状態の間の不均衡に関連している。言い換えると、正常な性能を示すトレーニング・データセットが大部分(例えば、90%を超える部分)を占め、極少数のデータが故障した性能を示す。不均衡なトレーニング・データから正確な予測を行うのは、難しいことで有名である。例えば、高度にパラメータ化された非線形の方法(例えば、人工ニューラル・ネットワーク(ANN:Artificial Neural Networks))を利用することは、ANN内の莫大な数のパラメータを微調整して最適化することができるために(両方のクラスの十分な例を含む)豊富なデータが必要とされる限りにおいて、賢明な解決策ではない。しかし、データが非常に不均衡な場合、異常状態での例の数が、ANNを効果的にトレーニングするのに不十分である。不均衡なデータの問題を改善するために、オーバサンプリング手法またはアンダーサンプリング手法あるいはその両方が採用されることができるが、これらの手法は、最終的にデータにおける元の分布をゆがめ、したがって、解決策を偏らせる可能性がある(例えば、増加した誤検出の指示によって精度が低下する)。
【0005】
非線形の性能低下を正確に予測することに関連するさらなる課題は、摩耗に関連する性能低下などの非線形の性能低下が必ずしも破局的故障ではないということである。PCPの例に再び戻ると、摩耗したPCPは、必ずしも機能を停止しないが、回転翼の摩耗のため、準最適に機能するであろう。このため、(破局的故障の日付とは対照的に)性能低下の特定のレベルでポンプを交換するための「故障日」が、オペレータの主観的な判断に影響されるようになる。これはさらに、データのラベル付け(例えば、実際にPCPが標準以下の性能で機能し続けているときに、いつPCPからのデータに故障としてラベル付けするかを決定すること)を複雑にする。
【0006】
現実世界の応用において非線形の性能低下を予測することに関連するさらに別の課題は、故障の特徴を適切に識別することに関連している。この課題は二重になっている。第一に、故障の特徴を識別するために使用できるデータが評価されなければならない。この評価は、非線形の性能低下に必ずしも直接関連していないデータから情報を推論することを伴うことがある。例えば、摩耗に関連する性能低下を起こしやすい資産は、摩耗を直接測定するための機器がめったに明示的に取り付けられていない。PCPの例に再び戻ると、速度、生産速度、トルク、およびケーシング圧の間の相互作用のみが、故障の特徴を推論するために使用できる情報であることがある。第2に、識別された故障の特徴の排他性が評価されなければならない。言い換えると、識別された故障の特徴が、2つ以上の現象と相関性があることがあり、このようにして誤検出を増やす。上記を踏まえて、非線形の性能低下が、(i)非線形の性能低下に関する使用可能なデータから故障の特徴を識別すること、および(ii)識別された故障の特徴が、非線形の性能低下を排他的に(または主に)表しているかどうかを判定することというさらなる課題を提起することが分かる。
【0007】
前述の問題の組み合わせは、非線形の性能低下の予測モデル化の問題を解決困難にする。したがって、非線形の現象に起因する性能低下を正確に予測する技術に対する必要性が存在する。
【発明の概要】
【0008】
本開示の態様は、新しいデータ・サンプルを故障予測モデルに入力することを含んでいるコンピュータ実装方法を対象にする。故障予測モデルは、ラベル付けされた過去のデータセットを使用してトレーニングされる。各データ点は、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられる。各トレーニング・サンプルは複数のクラスタにクラスタ化され、複数のクラスタは、正常スコアおよび異常スコアにそれぞれ関連付けられる。この方法は、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することをさらに含む。
【0009】
本発明は、有利に、不均衡なトレーニング・データセットから、非線形の性能低下を正確に予測することができるのが好ましい。さらに、正常スコアおよび異常スコアは、有利に、分類に関連付けられた異常の程度を定量化することができるのが好ましい。本発明のさらなる利点は、(不均衡なトレーニング・データを過度にパラメータ化する傾向がある)ANNに依存せず、(分類を偏らせる傾向がある)不均衡なトレーニング・データのオーバサンプリング技術またはアンダーサンプリング技術にも依存しないのが好ましいということである。
【0010】
好ましい実施形態によれば、本開示は、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義することをさらに含む。ルックバック・ウィンドウは、有利に、正常動作または異常動作を示す特徴のサイズを調節することができる。例えば、ルックバック・ウィンドウが短いほど、個々のデータ点に対する感度が高くなることがあり、一方、ルックバック・ウィンドウが長いほど、個々のデータ点に対する感度が低くなることがある。
【0011】
好ましい実施形態によれば、この方法は、予測範囲が、未来の事前に定義された時間の量を定義すること、および事前に定義された時間の量だけ未来の各データ点の各ラベルが各トレーニング・サンプルに関連付けられることをさらに含む。予測範囲は、有利に、ルックバック・ウィンドウによって定義されたさまざまな特徴を対応する未来の結果にリンクすることができる。例えば、予測範囲が短いほど、特定の予測に関する警告が短くなる(例えば、摩耗に関連する故障の1日前である)ことがあり、一方、予測範囲が長いほど、特定の予測に関する警告が長くなる(例えば、摩耗に関連する故障の1か月前である)ことがある。
【0012】
好ましい実施形態によれば、この方法は、K平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化されることをさらに含む。K平均クラスタ化は、有利に、効率的かつ拡張可能なクラスタ化技術である。
【0013】
1つの態様によれば、1つまたは複数のプロセッサと、プログラム命令を格納している1つまたは複数のコンピュータ可読ストレージ媒体とを備えているシステムが提供されており、プログラム命令が、1つまたは複数のプロセッサによって実行された場合に、1つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含む方法を実行させるように構成される。
【0014】
1つの態様によれば、1つまたは複数のコンピュータ可読ストレージ媒体と、1つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを備えているコンピュータ・プログラム製品が提供されており、プログラム命令が、1つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含む方法を実行させるように構成された命令を含む。
【0015】
本開示のさらなる態様は、一軸ねじポンプ(PCP)の摩耗に関連する劣化を予測するためのコンピュータ実装方法に関連しており、この方法は、PCPの新しいデータ・サンプルを、PCPの摩耗に関連する劣化を予測するように構成されたモデルに入力することを含む。このモデルは、ラベル付けされた過去のPCPデータセットを使用してトレーニングされる。各データ点は、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられる。各トレーニング・サンプルは複数のクラスタにクラスタ化され、複数のクラスタは、正常スコアおよび異常スコアにそれぞれ関連付けられる。この方法は、複数のクラスタのうちの新しいデータ・サンプルを含んでいる第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することをさらに含み、この分類は、PCPの摩耗に関連する劣化を示す。
【0016】
本開示の前述の態様は、有利に、PCPに関連するデータの不均衡なトレーニング・データセットから、PCPにおける摩耗に関連する劣化の非線形の性能低下を正確に予測できるのが好ましい。さらに、正常スコアおよび異常スコアは、有利に、分類に関連付けられた異常の程度を定量化することができるのが好ましい。
【0017】
本開示のさらなる態様は、一軸ねじポンプ(PCP)の摩耗に関連する劣化を予測するためのコンピュータ実装方法に関連しており、この方法は、1つまたは複数のPCPに関連付けられた過去のデータの2値のラベル付けを実行することによって、ラベル付けされた過去のデータを生成することを含む。この方法は、ルックバック・ウィンドウおよび予測範囲をラベル付けされた過去のデータの各データ点に適用することによって、複数のトレーニング・データ・サンプルを生成することをさらに含む。この方法は、複数のトレーニング・データ・サンプルを複数のクラスタにクラスタ化することをさらに含む。この方法は、複数のクラスタのうちの各クラスタのクラスタ・スコアを計算することをさらに含む。この方法は、PCPの新しいデータ・サンプルを複数のクラスタのうちの第1のクラスタに割り当てることをさらに含む。この方法は、第1のクラスタに関連付けられたクラスタ・スコアに基づいて、分類を新しいデータ・サンプルに割り当てることをさらに含み、この分類は、PCPの未来の摩耗に関連する劣化の可能性を示す。
【0018】
本開示は、有利に、PCPに関連するデータの不均衡なトレーニング・データセットから、PCPにおける摩耗に関連する劣化の非線形の性能低下を正確に予測することができるのが好ましい。さらに、クラスタ・スコアは、有利に、分類に関連付けられた異常の程度を定量化することができるのが好ましい。
【0019】
好ましい実施形態によれば、この方法は、ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされることをさらに含む。本開示のこの実施形態は、有利に、「正常な」データと「故障している」データの間の明確な決定境界を提供し、一方、その他の方法では、そのような確定的決定境界は、性能における摩耗に関連する劣化の非線形性および漸進性に起因して、必ずしも存在しない。
【0020】
好ましい実施形態によれば、この方法は、過去のデータが、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、およびPCPに関連する保守記録を含むことをさらに含む。これは、有利に、PCPに使用できるデータである。言い換えると、このデータを使用して、PCPの性能における摩耗に関連する劣化を予測することによって、追加のデータ計測器が不要になる。
【0021】
好ましい実施形態によれば、この方法は、各クラスタのクラスタ・スコアを計算することが、第1のクラスタの正常スコアを計算することをさらに含み、正常スコアが、第1のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第1の比率を、複数のトレーニング・データ・サンプルにおける正常状態に関連付けられたトレーニング・データ・サンプルの第2の比率で割った値であることをさらに含む。クラスタ・スコアを計算することは、第1のクラスタの異常スコアを計算することをさらに含み、異常スコアは、第1のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第3の比率を、複数のトレーニング・データ・サンプルにおける劣化状態に関連付けられたトレーニング・データ・サンプルの第4の比率で割った値である。正常スコアおよび異常スコアを計算することは、有利に、予測された分類の異常の相対的程度を定量化し、したがって、追加の精度および文脈を分類に与える。
【0022】
好ましい実施形態によれば、この方法は、新しいデータ・サンプルに関する故障信号を生成することをさらに含み、故障信号は、既定の数の前のデータ点にわたる新しいサンプルに関する平均異常スコアを含む。故障信号は、有利に、特定のデータ・サンプルに関する異常スコアの後処理された平滑化を表し、それによって、データのストリームの連続的な異常スコアにおける誤検出またはノイズあるいはその両方を減らす。
【0023】
本開示の追加の態様は、前述の方法を実行するように構成されたシステムおよびコンピュータ・プログラム製品を対象にする。本概要は、本開示のすべての実装またはすべての実施形態あるいはその両方の各態様を説明するよう意図されていない。
【0024】
以下の図面を単に例として参照し、本発明の好ましい実施形態について説明する。
【図面の簡単な説明】
【0025】
図1】本開示の一部の実施形態に従う、例示的な計算環境を示すブロック図である。
図2】本開示の一部の実施形態に従う、例示的な故障予測モデルを示すブロック図である。
図3】本開示の一部の実施形態に従う、非線形特性を伴う性能低下を予測するための例示的な方法のフローチャートを示す図である。
図4】本開示の一部の実施形態に従う、故障予測モデルをトレーニングするための例示的な方法のフローチャートを示す図である。
図5A】本開示の一部の実施形態に従う、故障予測モデルからの出力に基づいて結果を生成するための例示的な方法のフローチャートを示す図である。
図5B】本開示の一部の実施形態に従う、故障信号を計算するための例示的な方法のフローチャートを示す図である。
図6A】本開示の一部の実施形態に従う、故障までの日数の関数として累積異常スコアのグラフの実験結果を示す図である。
図6B】本開示の一部の実施形態に従う、故障までの日数の関数として故障ラベルの強度のグラフの実験結果を示す図である。
図7】本開示の一部の実施形態に従う、故障の前のさまざまな期間に関する混同行列の実験結果を示す図である。
図8】本開示の一部の実施形態に従う、例示的なコンピュータを示すブロック図である。
図9】本開示の一部の実施形態に従う、クラウド・コンピューティング環境を示す図である。
図10】本開示の一部の実施形態に従う、抽象モデル・レイヤを示す図である。
【発明を実施するための形態】
【0026】
本開示は、さまざまな変更および代替の形態を受け入れるが、その詳細が、図面において例として示されており、詳細に説明される。しかし、本開示を説明されている特定の実施形態に限定することが意図されていないということが、理解されるべきである。反対に、本開示の思想および範囲に含まれるすべての変更、同等のもの、および代替手段を対象にすることが意図されている。
【0027】
本開示の実施形態は、予測モデル化を対象にしており、より詳細には、非線形特性を伴う性能低下の予測を対象にしている。そのような応用に限定されないが、本開示の実施形態は、前述の文脈を踏まえてよりよく理解され得る。
【0028】
本開示の実施形態は、非線形の故障メカニズム(例えば、摩耗、疲労、クリープなど)の初期段階の間に資産の性能における劣化を検出して、資産の次回の故障を予測し、故障に先立つ資産の予防保守を推奨するための技術を対象にしている。本開示の実施形態は、資産の過去のデータを入力として取り込み、資産の未来の故障または性能低下の可能性を示す異常スコア、分類、または故障信号、あるいはその組み合わせを出力として生成する半教師あり機械学習方法を活用する。
【0029】
非線形現象の予測モデル化における前述の課題を克服することにおいて、本開示の実施形態は、(i)正常なデータと故障を示すデータを区別する非線形の決定境界、(ii)計算的に単純な実装(例えば、非線形にもかかわらず、ANNの場合にあり得るように過度にパラメータ化されない)、(iii)クラスのバランスを調整しない(したがって、データにおける元の分布をゆがめ、その後、解決策を偏らせることがない)、または(iv)任意の類似する一群の資産に容易に適用されることができる包括的な解決策、あるいはその組み合わせなどの、ただしこれらに限定されない、特徴を実現する。
【0030】
ここで図を参照すると、図1は、本開示の一部の実施形態に従って、例示的な計算環境100を示している。計算環境100は、ネットワーク108を介してセンサ・データ記録システム104およびエンドポイント・アプリケーション106に通信可能に結合された故障予測システム102を含んでいる。故障予測システム102は、センサ・データ記録システム104からデータを受信し、非線形現象に起因する関連する資産110の性能における未来の劣化に関連する予測(例えば、未来の時間間隔でのPCPの摩耗に関連する性能低下の予測)を行うように構成されることができる。故障予測システム102は、エンドポイント・アプリケーション106と情報をやりとりするようにさらに構成されることができる。例えば、故障予測システム102は、センサ・データ記録システム104から故障の指示を検出することの要求をエンドポイント・アプリケーション106から受信することができる。別の例として、故障予測システム102は、センサ・データ記録システム104から識別された可能性のある故障の特徴に関する更新情報をエンドポイント・アプリケーション106に配信することができる。
【0031】
センサ・データ記録システム104は、資産110の機能に直接的または間接的に関連するデータを取得するように構成された1つまたは複数のデータ収集システムを含むことができる。例えば、資産110が油井製造システム内のPCPである場合、センサ・データ記録システム104は、速度、トルク、ケーシング圧、または生産速度、あるいはその組み合わせなどの、ただしこれらに限定されない、データを収集することができる。別の例として、資産110が車両の機械的コンポーネント(例えば、燃料ポンプ、車輪軸受、ヘッド・ガスケットなど)である場合、センサ・データ記録システム104は、走行距離、速度、エンジン・エラー・コードなどの、ただしこれらに限定されない、データを収集することができる。これら2つの非限定的な例から分かるように、センサ・データ記録システム104は、資産110に直接関連付けられたデータを必ずしも収集する必要はない。反対に、一部の実施形態では、センサ・データ記録システム104は、資産110に関連するその他のコンポーネントに関連付けられたデータを収集するが、それでも、収集されたデータは、資産110の機能に関する間接的な推論を提供することに役立つことがある。これは、非線形の性能低下を予測するためのデータを収集するためにシステムの特定のコンポーネントを取り付けることが、経済的に実行不可能であるか、または技術的に実現困難であるか、あるいはその両方である限りにおいて、有益であることができる。したがって、多くの現実世界の応用では、非線形の性能低下の予測は、(i)非線形の性能低下に関する使用可能なデータから故障の特徴を識別すること、および(ii)識別された故障の特徴が、非線形の性能低下を排他的に(または主に)表しているかどうかを判定することという課題を含む。
【0032】
エンドポイント・アプリケーション106は、例えば、デスクトップ、ラップトップ、タブレット、スマートフォン、またはその他のエンドポイント・デバイスなどの、ユーザ・ワークステーション上で実行されるアプリケーションであることができる。エンドポイント・アプリケーション106は、故障予測システム102と情報をやりとりするためのインターフェイスをユーザに提供することができる。例えば、ユーザは、センサ・データ記録システム104からのデータに基づく資産110の予測故障分析を要求することができる。別の例として、故障予測システム102は、資産110に関連する、センサ・データ記録システム104からのデータから検出された故障の特徴に基づいて、更新情報、通知、または警告をエンドポイント・アプリケーション106に配信することができる。さらに、一部の実施形態では、エンドポイント・アプリケーション106は、ユーザが、ストリーミング・データを受信するようにトレーニング済みの故障予測システム102を構成することができるメカニズムを提供し、ストリーミング・データは、故障予測システム102をトレーニングするために使用される、資産110に類似する資産に関するものであることができる(例えば、油井オペレータは、自分自身のPCPデータを、1つまたは複数の他のPCPからの類似するPCPデータに対してすでにトレーニングされた故障予測システム102にストリーミング配信してよい)。
【0033】
故障予測システム102は、一部の実施形態では、クラウド・コンピューティング・アーキテクチャにおいて仮想的にプロビジョニングされることができる。一部の実施形態では、故障予測システム102は、例えば、メインフレーム、計算ノード、デスクトップ、ラップトップ、タブレット、または1つまたは複数のプロセッサおよび1つまたは複数のコンピュータ可読ストレージ媒体を含んでいる別のシステムなどの、コンピュータに存在することができる。
【0034】
故障予測システム102は、データ・ウェアハウス112、モデル・コンテナ114、および計算エンジン116を含むことができる。データ・ウェアハウス112は、センサ・データ記録システム104から収集されたデータであることができ、データの1つまたは複数のサンプルを含むことができる、集約されたセンサ・データ118を含むことができる。
【0035】
モデル・コンテナ114は、データ形式を整えられたセンサ・データ120を少なくとも部分的に生成するために、集約されたセンサ・データ118に対して実行されることができる、データ準備/工学ユーティリティ126を含むことができる。例えば、データ準備/工学ユーティリティ126は、集約されたセンサ・データ118をデータ形式を整えられたセンサ・データ120に変換するときに、外れ値を除去すること、データ形式整えの問題を修正すること、ヌル値を解決することなどを実行するように構成されることができる。一部の実施形態では、データ形式を整えられたセンサ・データ120は、例えば、集約されたセンサ・データ118に適用されたルックバック・ウィンドウを含むことができる。
【0036】
データ形式を整えられたセンサ・データ120は、故障予測モデル124に入力されることができる。一部の実施形態では、データ形式を整えられたセンサ・データ120および故障予測モデル124は、計算エンジン116のデプロイメント・リソース130に読み込まれる。データ形式を整えられたセンサ・データ120を入力として使用する故障予測モデル124の実行後に、計算エンジン116は、結果122を生成し、結果122をデータ・ウェアハウス112に格納することができる。結果122は、例えば、異常スコア、分類、または故障信号、あるいはその組み合わせを含むことができる。結果122は、非線形の性能低下に起因する未来の劣化した性能の可能性(例えば、PCPにおける摩耗に関連する性能低下の可能性)を示すことができる。
【0037】
計算エンジン116は、予測サービス128をさらに含むことができ、予測サービス128は、要求をエンドポイント・アプリケーション106から受信するか、または通知をエンドポイント・アプリケーション106に配信するように構成されることができる。予測サービス128は、故障予測システム102の機能を調整することができる。例えば、一部の実施形態では、予測サービス128は、データ形式を整えられたセンサ・データ120を生成する目的で、デプロイメント・リソース130を使用して、データ準備/工学ユーティリティ126が集約されたセンサ・データ118に対して実行されることを引き起こすことができる。上記の例を続けると、予測サービス128は、結果122を生成するために、データ形式を整えられたセンサ・データ120を入力として使用して、故障予測モデル124をデプロイメント・リソース130にデプロイするようにさらに構成されることができる。予測サービス128は、結果122をエンドポイント・アプリケーション106に送信するようにさらに構成されることができる。
【0038】
ここで図2を参照すると、本開示の一部の実施形態に従う、故障予測モデル124のブロック図が示されている。故障予測モデル124は、例えば、トレーニング・モード200およびデプロイメント・モード228を含むことができる。トレーニング・モード200では、故障予測モデル124が、摩耗に起因する故障または劣化などの非線形の性能低下を正確に予測するようにトレーニングされる。デプロイメント・モード228では、故障予測モデル124が、入力データを受信し、入力データのデータ形式を整え、データに関連する非線形現象に関連している予測(例えば、PCPにおける摩耗に起因する未来の準最適な性能の予測など)を行うように構成される。
【0039】
トレーニング・モード200では、故障予測モデル124は、1つまたは複数の資産110に関連付けられた1つまたは複数のセンサ・データ記録システム104から、過去のデータ202を受信することができ、過去のデータ202は、トレーニング・サブセット204-1およびテスト・サブセット204-2にセグメント化される。トレーニング・サブセット204-1は、故障予測モデル124をトレーニングして妥当性を確認するように構成されることができ、テスト・サブセット204-2は、故障予測モデル124をテストするために使用されることができ、テストは、例えば、精度、正確さ、再現率などの、故障予測モデル124の特性を定量化するために使用されることができる。
【0040】
トレーニング・モード200は、ラベル付けされた過去のデータ206をさらに含むことができ、ラベル付けされた過去のデータ206は、センサ読み取り値(例えば、速度、トルク、生産速度、ケーシング圧など)を含んでいる時間的に整列している過去の故障記録(例えば、PCPの交換を示す保守記録)から、導出されることができる。ラベル付けされた過去のデータ206は、資産110の正常動作を示している正常状態を示すデータ208-1、および資産110の準最適な性能、劣化している性能、または故障した性能を示している劣化状態(例えば、PCPの摩耗した状態)を示すデータ208-2を含む。正常状態を示しているデータ208-1と劣化状態を示しているデータ208-2の間の決定境界は、主題専門家(SME:subject matter expert)によって主観的に行われるか、統計的尺度(例えば、正常動作時の平均値から1標準偏差外側)によって客観的に行われるか、機械学習から推論されるか、またはその他の戦略もしくは技術を使用して決定されることができる。前述したように、劣化状態を示すデータ208-2は、必ずしも、機能していない資産110に関連するデータである必要はない。むしろ、劣化状態を示すデータ208-2は、資産110が機能したままである場合でも、資産110の準最適な性能を示す。例えば、一部の実施形態では、資産110に明示的な故障が発生するか、またはその他の理由でx日に交換される場合、x日の前の既定の期間のデータが、劣化状態を示すデータ208-2として自動的にラベル付けされることができる。
【0041】
トレーニング・モード200は、時間枠付きの過去のデータ210をさらに含むことができる。時間枠付きの過去のデータ210は、ルックバック・ウィンドウ212および予測範囲214を含むことができる。ルックバック・ウィンドウ212は、各データ・サンプルに含めるための現在のデータ点の前のデータ点の数(例えば、D)のことを指すことができる。予測範囲214は、現在のデータ点からある数(例えば、D)のデータ点だけ未来のデータ点のラベルのことを指すことができる。ルックバック・ウィンドウ212および予測範囲214は、トレーニング・サブセット204-1内の各データ点を、正常状態に関連付けられた各データ・サンプル216-1および劣化状態に関連付けられた各データ・サンプル216-2(集合的にデータ・サンプル216と呼ばれる)に変換するために使用されることができる。言い換えると、故障予測モデル124は、資産110の性能の履歴(ルックバック・ウィンドウ212に等しい)を使用して、性能の劣化のレベルに関して、資産110の可能性のある未来の状態に関する決定を行うように、トレーニングされる。各データ・サンプル216は、(ルックバック・ウィンドウ212に基づいて)データ・ストリームごとに現在のデータ点および複数の前のデータ点に対応する、データ点のベクトル、行列、またはテンソルを含むことができ、各データ・サンプル216は、予測範囲214によって、未来のデータ点のラベルにさらに関連付けられることができる(未来のデータ点のラベルは、ベクトル、行列、またはテンソル内の既定の位置に追加されるか、またはその他の方法でベクトル、行列、またはテンソルに関連付けられることができる)。言い換えると、正常状態に関連付けられたデータ・サンプル216-1は、正常状態を示すデータ208-1である予測範囲214でのデータ点によって、識別されることができる。同様に、劣化状態に関連付けられたデータ・サンプル216-2は、劣化状態を示すデータ208-2としてラベル付けされた予測範囲214でのデータ点を含んでいるデータ・サンプルであることができる。
【0042】
例えば、ルックバック・ウィンドウ212は10日であることができ、予測範囲214は20日であることができる。この状況では、トレーニング・サブセット204-1内のデータの単一のストリームからの最初の時間でのデータ点の場合、データ点が、前の10個のデータ点(例えば、ルックバック・ウィンドウ212)を含んでいるベクトルに変換されることができ、このベクトルが、20日後の未来のデータ点(例えば、ラベルが、正常状態を示すデータ208-1または劣化状態を示すデータ208-2のいずれかである、予測範囲214)のラベルに関連付けられることができる。この例では、20日後の未来のデータ点のラベルが、劣化状態を示すデータ208-2である場合、現在のデータ点および前の10個のデータ点のデータ点のベクトルは、トレーニングの目的のための予測的な故障の特徴と見なされることができる。反対に、20日後の未来のデータ点のラベルが、正常状態を示すデータ208-1である場合、現在のデータ点および前の10個のデータ点のデータ点のベクトルは、トレーニングの目的のための予測的な正常な特徴であると仮定されることができる。
【0043】
当業者によって理解されるように、ルックバック・ウィンドウ212および予測範囲214は、さまざまな尺度に従って、さまざまな数であることができる。例えば、一部の実施形態では、ルックバック・ウィンドウ212および予測範囲214の単位は、秒、分、日、週、月などであることができる。さまざまな実施形態では、ルックバック・ウィンドウ212は、予測範囲214と比較して小さいか、大きいか、または等しい。一部の実施形態では、ルックバック・ウィンドウ212は、有用性と計算オーバーヘッドの間のトレードオフに対処するようにサイズ設定される。例えば、相対的に大きいルックバック・ウィンドウ212は、故障の特徴を正確に検出するために使用される情報を増やすが、実施するために必要な計算能力も増やす。反対に、相対的に小さいルックバック・ウィンドウ212は、故障の特徴を正確に検出するために使用される情報を減らすが、実施するために必要な計算能力を減らす。一部の実施形態では、予測範囲214は、故障の特徴に基づいてサイズ設定される。例えば、資産110が、データにおいて故障の指示がそれ自身を明示し始めたときから20日の時間枠に関連付けられている場合、予測範囲214は、24日以下でなければならない(言い換えると、20日より大きい予測範囲214は誤検出の増加をもたらす)。さらに、一部の実施形態では、ルックバック・ウィンドウ212および予測範囲214の単位は、必ずしも時間に基づくインクリメントである必要は全くなく、単に前の、または後のデータ点の数によって参照されることができ、データ点の間隔は、非時間的特性に基づいてよい。さらに、上記の例で説明されたデータ・サンプル216はベクトル形式であるが、他の実施形態では、多次元データまたはマルチモーダル・データ・ストリームを表すために、行列またはテンソルが使用されることができる。1つの例として、3つのデータ・ストリームに関連付けられた資産110の場合、データ・サンプル216は、入力データと出力データの対を含むことができ、入力部分は、3つのデータ・ストリームごとに各ルックバック・ウィンドウ212のサンプルで構成されている3次元テンソルを含み、出力部分は、予測範囲214での未来の性能の2値(例えば、正常の場合に0、故障の場合に1)のインジケータを含む。
【0044】
トレーニング・モード200は、データ218をクラスタ化することをさらに含むことができる。クラスタ化218は、現在知られているか、または今後開発される任意のテスト可能なクラスタ化技術を使用して、データ・サンプル216をクラスタ化することができる。言い換えると、クラスタ化されたデータ218は複数のクラスタ220を含むことができ、各クラスタは、少なくとも1つのデータ・サンプル216を含む。特に、クラスタ220の数は、データ・サンプル216を(過学習せずに)正確に適合させるように構成可能である。
【0045】
一部の実施形態では、クラスタ220は、K平均クラスタ化を使用することによって決定される。K平均クラスタ化は、有利に、大きいデータセットに合わせて拡張可能な計算効率の良いクラスタ化技術である。さらに一般的には、使用されるクラスタ化技術の種類、使用されるクラスタの数、および使用されるクラスタのパラメータ(例えば、形状、サイズなど)は、本開示の一部の実施形態に従って故障予測モデル124の性能を改善するために必要に応じて調節されることができる、すべて調整可能なパラメータである。例えば、さまざまな正常な動作プロファイルおよびさまざまな劣化している動作プロファイルを捕捉するための十分な数のクラスタがあることは、有益であることがある。
【0046】
クラスタ化されたデータ218は、クラスタ220の各々に割り当てられたクラスタ・スコア222をさらに含むことができる。クラスタ・スコア222は、正常スコア224および異常スコア226を含むことができる。一部の実施形態では、正常スコア224が、方程式1に従って計算されることができる。
方程式1:
【数1】
【0047】
同様に、一部の実施形態では、異常スコア226が方程式2に従って計算されることができる。
方程式2:
【数2】
【0048】
方程式1に関しては、
【数3】

は、クラスタ220のうちの特定のクラスタC内の正常状態に関連付けられたデータ・サンプル216-1の数を参照することができ、一方、Nは、時間枠付きの過去のデータ210内の標準状態に関連付けられたデータ・サンプル216-1の総数を参照することができる。同様に、方程式2に関しては、項
【数4】

は、クラスタ220のうちの特定のクラスタC内の劣化状態に関連付けられたデータ・サンプル216-2の数を参照することができ、一方、Nは、時間枠付きの過去のデータ210内の劣化状態に関連付けられたデータ・サンプル216-2の総数を参照することができる。方程式1および方程式2の両方の項
【数5】

は、クラスタ220のうちの特定のクラスタC内のデータ・サンプル216の総数を参照することができ、一方、Nは、時間枠付きの過去のデータ206内のデータ・サンプル216の総数を参照することができる。
【0049】
言い換えると、正常スコア224は、特定のクラスタ内の正常状態に関連付けられたデータ・サンプル216-1の比率を、時間枠付きの過去のデータ210全体内の正常状態に関連付けられたデータ・サンプル216-1の比率で割った値であることができる。同様に、異常スコア226は、特定のクラスタ内の劣化状態に関連付けられたデータ・サンプル216-2の比率を、時間枠付きの過去のデータ210全体内の劣化状態に関連付けられたデータ・サンプル216-2の比率で割った値であることができる。
【0050】
クラスタ220を作成し、クラスタ・スコア222を生成した後に、故障予測モデル124はトレーニングされたと見なされることができる。一部の実施形態では、トレーニング・サブセット204-1を使用して故障予測モデル124をトレーニングした後に、テスト・サブセット204-2およびデプロイメント・モード228を使用して故障予測モデル124がテストされることができる。デプロイメント・モード228の説明がテスト・サブセット204-2に関して行われるが、デプロイメント・モード228の説明は、新しいデータに関連付けられた未来の非線形現象(例えば、PCPにおける摩耗に関連する性能低下)を予測する目的でストリーミング・リアルタイム・データを受信することにも、同じように適用可能である。
【0051】
デプロイメント・モード228で、故障予測モデル124は、テスト・サブセット204-2を時間枠付きのデータ・サンプル230へとデータ形式を整えることができる。時間枠付きのデータ・サンプル230は、データ・サンプル216に類似することができるが、(正常状態および劣化状態の指示が故障予測モデル124によって予測される情報であり、したがって、故障予測モデル124の性能をテストしている間に故障予測モデル124から隠蔽される限りにおいて)正常状態の指示も劣化状態の指示も含まない。したがって、時間枠付きのデータ・サンプル230内の各サンプルは、テスト・サブセット204-2からのデータ点、およびルックバック・ウィンドウ212に従う、前の複数のデータ点を含むことができる。前述したように、この一連のデータは、テスト・サブセット204-2内のデータの複雑さ、次元、およびモダリティに応じて、ベクトル形式、行列形式、またはテンソル形式で格納されることができる。一部の実施形態では、時間枠付きのデータ・サンプル230は、データ形式を整えられたセンサ・データ120と一致する。
【0052】
次に、時間枠付きのデータ・サンプル230の各サンプルが、各クラスタ220に関連付けられることができる。その後、クラスタ220のうちの関連するクラスタに基づいて、分類232が時間枠付きのデータ・サンプル230の各々に関連付けられることができる。例えば、異常スコア226より大きい正常スコア224を有している各クラスタ220内に配置された各時間枠付きのデータ・サンプル230の場合、その各時間枠付きのデータ・サンプル230は、正常(例えば、「0」のスコア)と見なされることができる。反対に、その各時間枠付きのデータ・サンプル230が、正常スコア224より大きい異常スコア226を有している各クラスタ220内に配置されている場合、その各時間枠付きのデータ・サンプル230は、異常または未来の故障の予測(例えば、「1」のスコア)と見なされることができる。一部の実施形態では、分類232は、時間枠付きのデータ・サンプル230を捕捉しているクラスタ220の異常スコア226を、異常スコア226より大きい正常スコア224を有しているすべてのクラスタ220の平均異常スコアと比較することを含む。このようにして、時間枠付きのデータ・サンプル230を捕捉しているクラスタ220の異常スコア226が、その他の点では正常と見なされている他のクラスタ220で見られる異常のベースライン・レベルと比較されることができる。
【0053】
故障予測モデル124は、故障信号234をさらに含むことができる。故障信号234は、前の既定の数のデータ点について異常スコアの平均値を取得することによって、異常スコア226または分類232を平滑化するように構成されることができる。例えば、故障信号234が、方程式3に従って計算されることができる。
方程式3:
【数6】
【0054】
方程式3では、項xが、既定の数の連続する前のデータ点を参照することができ、これらのデータ点に対して、特定の時間枠付きのデータ・サンプル230の平均異常スコアを決定する。一部の実施形態では、xは、故障予測モデル124の設計考慮事項に従う調整可能なパラメータであることができる。例えば、相対的に大きいxは、故障を示す特定の異常スコアに対する故障予測モデル124の感度を減らす(それによって誤検出を減らす)ことができ、一方、相対的に小さいxは、故障を示す各異常スコアに対する故障予測モデル124の感度を増やす(それによって検出漏れを減らす)ことができる。さらに、方程式3の項ASは、データ点nを含んでいるクラスタ220のうちの1つのクラスタの異常スコア226を参照することができるが、他の実施形態では、分類232が使用されることもできる。故障信号234は、図5Bに関してさらに詳細に説明される。
【0055】
ここで図3を参照すると、本開示の一部の実施形態に従う、故障予測モデル124を利用するための例示的な方法300のフローチャートが示されている。方法300は、例えば、故障予測モデル124、故障予測システム102、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。
【0056】
動作302は、故障予測モデル124をトレーニングすることを含む。故障予測モデル124をトレーニングすることは、故障予測モデル124のトレーニング・モード200に関して前述した態様を含むことができる。動作302は、図4に関して以下でさらに詳細に説明される。
【0057】
動作304は、集約されたセンサ・データ118をデータ形式を整えられたセンサ・データ120へとデータ形式を整えることを含む。一部の実施形態では、データ形式を整えられたセンサ・データ120は、時間枠付きのデータ・サンプル230と一致する。動作304は、データ形式を整えられたセンサ・データ120を生成するために、ルックバック・ウィンドウ212を集約されたセンサ・データ118内の各データ点に適用することを含むことができる。一部の実施形態では、動作304は、外れ値の除去、ヌル値の除去などの、その他のデータ・クレンジング動作またはデータ形式整え動作あるいはその両方をさらに含む。
【0058】
動作306は、データ形式を整えられたセンサ・データ120を故障予測モデル124に入力することを含む。動作308は、故障予測モデル124からの出力に基づいて結果122を生成することを含む。一部の実施形態では、結果122は、分類232(例えば、正常または未来の故障の指示)または故障信号234(例えば、未来の故障の可能性に関連する定量化)あるいはその両方を含む。
【0059】
動作310は、結果に基づいて緩和処置を実行することを含む。例えば、緩和処置は、通知、警告、報告、または別の送信の形態で結果122をエンドポイント・アプリケーション106に送信することを含むことができる。一部の実施形態では、動作310は、資産110の交換、再構築、またはその他の方法での保守などの、資産110の保守に関連するスケジューリング・イベントをトリガーすることを含む。一部の実施形態では、スケジューリング・イベントは結果122に基づく。例えば、しきい値を超える故障信号234は、保守イベントが時間ウィンドウ内(例えば、予測範囲214内)でスケジューリングされることをトリガーしてよい。一部の実施形態では、緩和処置は、必要な交換部品を発注すること、および発注された交換部品を資産110に関連付けられた場所に発送することなどの、物流活動に関連することができる。
【0060】
ここで図4を参照すると、本開示の一部の実施形態に従う、故障予測モデル124をトレーニングするための例示的な方法400のフローチャートが示されている。一部の実施形態では、方法400は、図3の動作302の下位の方法である。一部の実施形態では、方法400は、例えば、故障予測モデル124、故障予測システム102、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。
【0061】
動作402は、過去のデータ202をトレーニング・サブセット204-1およびテスト・サブセット204-2に集約することを含む。動作404は、過去のデータ202にラベルを付け、正常状態を示すデータ208-1および劣化状態を示すデータ208-2を含んでいるラベル付けされた過去のデータ206を生成することを含む。動作406は、ルックバック・ウィンドウ212および予測範囲214を過去のデータ202内の各データ点に適用することによって、正常状態に関連付けられたデータ・サンプル216-1および劣化状態に関連付けられたデータ・サンプル216-2を生成することを含む。
【0062】
動作408は、データ・サンプル216を複数のクラスタ220にクラスタ化することを含む。一部の実施形態では、動作408は、K平均クラスタ化を利用する。動作410は、クラスタ220の各々に関連付けられたクラスタ・スコア222を計算することを含む。クラスタ・スコア222は、クラスタ220内のクラスタごとに、各正常スコア224および各異常スコア226を含むことができる。
【0063】
動作412は、故障予測モデル124を調整することを含む。故障予測モデル124を調整することは、例えば、(i)正常状態を示すデータ208-1および劣化状態を示すデータ208-2の定義を変更することによって、ラベル付けされた過去のデータ206を変更すること、(ii)ルックバック・ウィンドウ212のサイズを変更すること、(iii)予測範囲214のサイズを変更すること、(iv)クラスタ220に関連付けられたパラメータ(例えば、クラスタの数、クラスタの形状、クラスタのサイズなど)を変更すること、またはその他のモデル調整技術もしくは戦略またはその両方、あるいはその組み合わせを含むことができる。一部の実施形態では、故障予測モデル124は、テスト・サブセット204-2のテストからの結果に基づいて調整される。
【0064】
動作414は、トレーニングされた故障予測モデル124を出力することを含む。一部の実施形態では、トレーニングされた故障予測モデル124を出力することは、トレーニングされた故障予測モデル124を、例えば、仮想的にプロビジョニングされたモデル・コンテナ114などの、コンピュータ可読ストレージ媒体に格納することを含む。
【0065】
ここで図5Aを参照すると、本開示の一部の実施形態に従う、故障予測モデル124からの出力に基づいて結果を生成するための例示的な方法500のフローチャートが示されている。一部の実施形態では、方法500は、図3の動作308の下位の方法である。一部の実施形態では、方法500は、例えば、故障予測モデル124、故障予測システム102、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。
【0066】
動作502は、2値分類結果232を、前に故障予測モデル124に入力された各データ・サンプル(例えば、時間枠付きのデータ・サンプル230)に関連付けることを含む。一部の実施形態では、分類232は、「正常」(例えば、0)、あるいは「異常」、「故障」、または別の非正常インジケータ(例えば、1)のいずれかである。分類232は、各時間枠付きのデータ・サンプル230を捕捉するクラスタ220の正常スコア224および異常スコア226に基づくことができる。より詳細には、正常スコア224が異常スコア226より大きい場合、対応する時間枠付きのデータ・サンプル230は正常と見なされる。反対に、異常スコア226が正常スコア224より大きい場合、対応する時間枠付きのデータ・サンプル230は、異常またはその他の方法で故障を示していると見なされる。
【0067】
動作504は、各入力データ・サンプル(例えば、時間枠付きのデータ・サンプル230)の故障信号234を生成することを含む。故障信号234は、時間枠付きのデータ・サンプル230に関連付けられた正常スコア224、異常スコア226、または分類232、あるいはその組み合わせに基づくことができる。一部の実施形態では、故障信号234は、真に異常なデータの、より信頼性のあるインジケータを表す(例えば、誤検出を減らす)。故障信号234は、図5Bに関して以下でさらに詳細に説明される。
【0068】
ここで図5Bを参照すると、本開示の一部の実施形態に従う、故障信号234を生成するための例示的な方法510のフローチャートが示されている。一部の実施形態では、方法510は、図5Aの動作504の下位の方法である。一部の実施形態では、方法510は、例えば、故障予測モデル124、故障予測システム102、コンピュータ、計算ノード、プロセッサ、あるいはハードウェアもしくはソフトウェアまたはその両方の別の組み合わせによって実装されることができる。
【0069】
動作512は、正常としてランク付けされたクラスタ220の平均異常スコアを計算することを含む。正常動作時の平均異常スコアを計算することは、正常スコア224が異常スコア226より大きいクラスタ220のクラスタごとに、異常スコア226の平均値を求めることを含むことができる。これは、誤検出を減らすように機能することができる異常のベースライン・レベルを確立する限りにおいて有益であることができる。
【0070】
動作514は、時間枠付きの受信データ・サンプル230を、異常スコア226および正常スコア224に関連付けられたクラスタ220に割り当てることを含む。指定されたクラスタの異常スコアが(動作512で決定された)正常動作時の平均異常スコアより大きい場合、そのデータ・サンプルが故障モードにあるとして分類され(1として分類され)、そうでない場合、そのデータ・サンプルが正常モードにあるとして分類される(0として分類される)。
【0071】
動作516は、既定の期間(例えば、10日)または既定の数の時間枠付きのデータ・サンプル230にわたって、その資産について、0または1の2値分類結果の平均値として故障信号234を計算することを含む。一部の実施形態では、動作516は、方程式3を利用することができる。
【0072】
図1~5を再び参照すると、本開示の態様の1つの特定の応用は、一軸ねじポンプ(PCP)内の回転子の摩耗によって引き起こされる性能低下を検出することに関連している。PCP内の回転子の摩耗によって引き起こされる性能低下が非線形現象であるため、本開示の態様は、PCP内の摩耗によって引き起こされる回転子の劣化を正確に予測することによく適している。
【0073】
PCPを利用する人工採油システムは、砂を伴った低温の重質原油の生産(CHOPS:coldheavy oil production with sand)などの、さまざまな非熱的石油およびガス回収方法を可能にする。PCPは、地下貯留層から地表へ、石油と砂の粘性混合物を引き上げることができ、他の人工採油システム(例えば、電動水中ポンプ(ESP:electric submersible pump))と比較して、採油コストを改善し、保守コストを改善し、応用の柔軟性を改善し、環境影響を減らす。
【0074】
PCPが重油内のより多い砂の含有量に対処することに適しているにもかかわらず、持続する砂の取り込みから生じる1つの問題は、アブレシブ摩耗故障である。アブレシブ摩耗は、回転子上の硬質クロムめっきが摩耗する際の、ポンプ性能における漸進的な劣化のことを指すことができ、PCPにおける故障の最も一般的な種類である。この摩耗は、回転子上のクロムめっきの表面に限定されるか、またはベースメタルに拡大する可能性がある。いずれの場合も、元の回転子の形状が変化する。形状におけるこの変化は、回転子と固定子の間のかみ合いが変化する限りにおいて、PCPの性能に影響を与えることがある。硬質クロムめっきが摩耗してベースメタルまで下がる激しいアブレシブ摩耗は、回転子内のエラストマーに永続的損傷を与え、ポンプの交換を必要とする可能性がある。
【0075】
油井内のポンプの故障は、失われる生産時間に関して多大な損失をもたらす。したがって、ポンプの摩耗故障を予測する能力は、故障に先立つPCPの積極的なスケジューリングされた保守を提供することによって、これらのコストを減らす。さらに、摩耗の初期段階の間のポンプの性能低下の改善された認識は、動作寿命を延ばすための業務的意思決定において、オペレータが適切な調整を行うのに役立つことがある。
【0076】
しかし、PCPにおける故障を予測することは、非線形特性を伴う性能低下を予測するのと同様の理由のため、困難である。一つには、故障メカニズムは漸進的であり、回転子が次第に摩耗する間に、PCPが長期間にわたって準最適な性能で機能したままであることがあるため、過去のデータに「正常」または「異常」として適切にラベル付けすることにおいて問題を引き起こす。別の課題は、PCPに使用できる不均衡な一連の過去のデータ(例えば、異常なデータよりも著しく多い正常なデータ)に関連している。さらに別の課題は、動作環境(例えば、砂の含有量が少ない地層と比較して砂の含有量が多い地層)によって変化する、変わりやすい故障メカニズムに関連している。したがって、PCPの故障を正確に予測するのは困難である。それにもかかわらず、本開示の態様は、PCPの予測監視の分野において実施された場合、摩耗に関連するメカニズムに起因するPCPの性能低下を正確に予測することができる。
【0077】
例えば、図4の説明に再び戻ると、この図は、PCPなどの資産110のための故障予測モデル124をトレーニングすることに関連しているため、動作402は、ポンプ速度、ポンプ・トルク、ケーシング圧、および生産速度などのセンサ・データを集約することができる。集約されたセンサ・データは、トレーニング・サブセット204-1(例えば、データの約80%)およびテスト・サブセット204-2(例えば、データの約20%)に分離されることができる。動作404は、正常状態を示すデータ208-1(トレーニング・サブセット204-1内の不均衡なデータの約97%)または劣化状態を示すデータ208-2(トレーニング・サブセット204-1内の不均衡なデータの約3%)として過去のデータにラベルを付けることができる。一部の実施形態では、劣化状態を示すデータ208-2は、(保守記録から決定された)既知のPCP交換日の25日~3日前のすべてのデータであることができ、一方、既知のPCP交換日の25日前に先立つデータは、正常状態を示すデータ208-1と見なされることができる。
【0078】
動作406は、ルックバック・ウィンドウ212および予測範囲214を各データ点に適用することによって、データ・サンプル216を生成することができる。動作408は、K平均クラスタ化を使用してデータ・サンプル216をクラスタ化することができ、動作410は、方程式1および方程式2に従って、正常スコア224および異常スコア226をそれぞれ計算することができる。動作412は、故障予測モデル124を調整することができ、動作414は、トレーニングされた故障予測モデル124を出力することができる。
【0079】
テスト・サブセット204-2をPCPの応用のトレーニングされた故障予測モデル124に適用することは、本開示の態様の有用性を示す。図6Aは、累積異常スコア226(y軸)のグラフの実験結果を、既知のポンプ交換日までの日数(x軸)の関数として示している。図に示されているように、故障の25日前と既知のポンプ交換日の間で、傾向線が急に増加している。したがって、図6Aは、異常スコア226がPCPの故障をうまく予測することに使用されることができるということを示している。
【0080】
図6Bは、故障を示す分類232の強度(y軸)のグラフの実験結果を、故障までの日数(x軸)の関数として示している。図に示されているように、故障を示す分類232の強度は、故障の約25日前と既知のポンプ交換日の間で著しく上昇している。したがって、図6Bは、分類232がPCPの故障を予測することにうまく使用されることができるということを示している。
【0081】
特に、故障信号234に関連するグラフは提供されていないが、故障信号234が、図6Aおよび6Bに示された結果と比較してノイズが減少した同様の予測力を示すということが、当業者にとって明らかである。これは、故障信号234が平均スコアを表し、一方、図6Aが累積スコアを示しており、図6Bが強度スコアを示しているためである。
【0082】
図7は、前述したように、テスト・サブセット204-2をPCPの故障予測モデル124に使用する、既知のポンプ交換日の前のさまざまな期間の混同行列に関連する実験結果を示している。図7に示されているように、故障の30日前700-1の場合、正常(実際のラベル702-1)-正常(予測されたラベル704-1)ボックスは0.76であり、故障-正常ボックスは0.38であり、正常-故障ボックスは0.24であり、故障-故障ボックスは0.62である。故障の14日前700-2の場合、正常(実際のラベル702-2)-正常(予測されたラベル704-2)ボックスは0.76であり、故障-正常ボックスは0.26であり、正常-故障ボックスは0.24であり、故障-故障ボックスは0.74である。故障の5日前700-3の場合、正常(実際のラベル702-3)-正常(予測されたラベル704-3)ボックスは0.76であり、故障-正常ボックスは0.12であり、正常-故障ボックスは0.24であり、故障-故障ボックスは0.88である。
【0083】
一般に、図7は、実際のポンプ交換日への近さの関数として、予測性能の改善を示している。さらに、図7は、故障の5日前700-3で約88%、故障の14日前700-2で約75%、および故障の30日前700-1で約62%の再現率(例えば、真の検出数を真の検出と検出漏れの総数で割った値)を示している。一方、本開示の態様は、約78%(故障の5日前700-3)、76%(故障の14日前700-2)、および72%(故障の30日前700-1)の精度(例えば、真の検出数を真の検出と誤検出の総数で割った値)を実現した。したがって、図7は、本開示の態様が、回転子の摩耗の結果としてのPCPの性能低下を予測するための堅牢な故障予測モデル124を実現するということを示している。
【0084】
図8は、本開示の一部の実施形態に従う、例示的なコンピュータ800のブロック図を示している。さまざまな実施形態では、コンピュータ800は、図3~5で説明された方法のいずれかまたはすべてを実行すること、または図1~2もしくは6~7またはその両方のうちのいずれか1つで説明された機能を実装すること、あるいはその両方を行うことができる。一部の実施形態では、コンピュータ800は、ネットワーク850を介してリモートのデータ処理システムからプロセッサ実行可能命令をダウンロードすることによって、前述の方法および機能に関連する命令を受信する。他の実施形態では、コンピュータ800は、コンピュータ800によって提供された命令に基づいてクライアント・マシンが方法または方法の一部を実行するように、前述の方法または機能あるいはその両方のための命令をクライアント・マシンに提供する。一部の実施形態では、コンピュータ800は、図1の故障予測システム102、図1の故障予測モデル124、または本開示の別の態様に組み込まれる(またはコンピュータ800に類似する機能が、これらに仮想的にプロビジョニングされる)。
【0085】
コンピュータ800は、メモリ825、ストレージ830、相互接続820(例えば、バス)、1つまたは複数のCPU805(本明細書ではプロセッサとも呼ばれる)、I/Oデバイス・インターフェイス810、I/Oデバイス812、およびネットワーク・インターフェイス815を含んでいる。
【0086】
各CPU805は、メモリ825またはストレージ830に格納されたプログラミング命令を取得して実行する。相互接続820は、プログラミング命令などのデータを、CPU805、I/Oデバイス・インターフェイス810、ストレージ830、ネットワーク・インターフェイス815、およびメモリ825の間で移動するために使用される。相互接続820は、1つまたは複数のバスを使用して実装されることができる。さまざまな実施形態では、CPU805は、単一のCPU、複数のCPU、または複数のプロセッシング・コアを含んでいる単一のCPUであることができる。一部の実施形態では、CPU805は、デジタル信号プロセッサ(DSP:digital signal processor)であることができる。一部の実施形態では、CPU805は、1つまたは複数の3D集積回路(3DIC:3D integrated circuit)(例えば、3Dウエハー・レベル・パッケージング(3DWLP:3D wafer-level packaging)、3Dインターポーザベースの統合、3DスタックIC(3D-SIC:3D stacked IC)、モノリシック3D IC、3D異種統合、3Dシステム・イン・パッケージ(3DSiP:3D system in package)、またはパッケージ・オン・パッケージ(PoP:package on package)CPU構成、あるいはその組み合わせ)を含む。メモリ825は、一般に、ランダム・アクセス・メモリ(例えば、スタティック・ランダム・アクセス・メモリ(SRAM:static random-access memory)、ダイナミック・ランダム・アクセス・メモリ(DRAM:dynamic random access memory)、またはフラッシュ)を表すために含められている。ストレージ830は、一般に、ハード・ディスク・ドライブ、半導体デバイス(SSD:solid state device)、取り外し可能メモリ・カード、光ストレージ、またはフラッシュ・メモリ・デバイスなどの、不揮発性メモリを表すために含められている。代替の実施形態では、ストレージ830は、I/Oデバイス・インターフェイス810を介してコンピュータ800に接続されたか、またはネットワーク・インターフェイス815を介してネットワーク850に接続された、ストレージ領域ネットワーク(SAN:storage area-network)デバイス、クラウド、またはその他のデバイスに置き換えられることができる。
【0087】
一部の実施形態では、メモリ825は命令860を格納する。しかし、さまざまな実施形態では、命令860は、メモリ825およびストレージ830それぞれに部分的に格納されるか、またはメモリ825もしくはストレージ830に完全に格納されるか、またはネットワーク・インターフェイス815を介してネットワーク850を経由してアクセスされる。
【0088】
命令860は、図3~5の方法のうちのいずれかの一部またはすべてを実行すること、または図1~2もしくは6~7またはその両方で説明された機能を実装すること、あるいはその両方のためのコンピュータ可読命令およびコンピュータ実行可能命令であることができる。一部の実施形態では、命令860は、非線形の性能低下予測プロトコル(または命令、メカニズムなど)または故障予測プロトコル(または命令、メカニズムなど)と呼ばれることができる。命令860がメモリ825内に示されているが、命令860は、多数のコンピュータ可読ストレージ媒体にわたって集合的に格納された、1つまたは複数のCPU805によって実行可能なプログラム命令を含むことができる。
【0089】
さまざまな実施形態では、I/Oデバイス812は、情報を提示し、入力を受信することができるインターフェイスを含む。例えば、I/Oデバイス812は、情報をコンピュータ800と対話しているユーザに提示し、ユーザから入力を受信することができる。
【0090】
コンピュータ800は、ネットワーク・インターフェイス815を介してネットワーク850に接続される。ネットワーク850は、物理的ネットワーク、無線ネットワーク、セルラー・ネットワーク、または異なるネットワークを含むことができる。
【0091】
本開示にはクラウド・コンピューティングに関する詳細な説明が含まれているが、本明細書において示された内容の実装は、クラウド・コンピューティング環境に限定されないと理解されるべきである。むしろ、本発明の実施形態は、現在既知であるか、または今後開発される任意のその他の種類のコンピューティング環境と組み合わせて実装できる。
【0092】
クラウド・コンピューティングは、構成可能な計算リソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、処理、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス)の共有プールへの便利なオンデマンドのネットワーク・アクセスを可能にするためのサービス提供モデルであり、管理上の手間またはサービス・プロバイダとのやりとりを最小限に抑えて、これらのリソースを迅速にプロビジョニングおよび解放することができる。このクラウド・モデルは、少なくとも5つの特徴、少なくとも3つのサービス・モデル、および少なくとも4つのデプロイメント・モデルを含んでよい。
【0093】
特徴は、次のとおりである。
オンデマンドのセルフ・サービス:クラウドの利用者は、サーバの時間、ネットワーク・ストレージなどの計算能力を一方的に、サービス・プロバイダとの人間的なやりとりを必要とせず、必要に応じて自動的にプロビジョニングすることができる。
幅広いネットワーク・アクセス:能力は、ネットワークを経由して利用可能であり、標準的なメカニズムを使用してアクセスできるため、異種のシン・クライアントまたはシック・クライアント・プラットフォーム(例えば、携帯電話、ラップトップ、およびPDA)による利用を促進する。
リソース・プール:プロバイダの計算リソースは、プールされ、マルチテナント・モデルを使用して複数の利用者に提供される。さまざまな物理的および仮想的リソースが、要求に従って動的に割り当ておよび再割り当てされる。場所に依存しないという感覚があり、利用者は通常、提供されるリソースの正確な場所に関して管理することも知ることもないが、さらに高い抽象レベルでは、場所(例えば、国、州、またはデータセンター)を指定できることがある。
【0094】
迅速な順応性:能力は、迅速かつ柔軟に、場合によっては自動的にプロビジョニングされ、素早くスケールアウトし、迅速に解放されて素早くスケールインすることができる。プロビジョニングに使用できる能力は、利用者には、多くの場合、任意の量をいつでも無制限に購入できるように見える。
【0095】
測定されるサービス:クラウド・システムは、計測機能を活用することによって、サービスの種類(例えば、ストレージ、処理、帯域幅、およびアクティブなユーザのアカウント)に適した抽象レベルで、リソースの使用を自動的に制御および最適化する。リソースの使用状況は監視、制御、および報告することができ、利用されるサービスのプロバイダと利用者の両方に透明性が提供される。
【0096】
サービス・モデルは、次のとおりである。
SaaS(Software as a Service):利用者に提供される能力は、クラウド・インフラストラクチャ上で稼働しているプロバイダのアプリケーションの利用である。それらのアプリケーションは、Webブラウザ(例えば、Webベースの電子メール)などのシン・クライアント・インターフェイスを介して、さまざまなクライアント・デバイスからアクセスできる。利用者は、ネットワーク、サーバ、オペレーティング・システム、ストレージ、または個々のアプリケーション機能を含む基盤になるクラウド・インフラストラクチャを、限定的なユーザ固有のアプリケーション構成設定を行う可能性を除き、管理することも制御することもない。
PaaS(Platform as a Service):利用者に提供される能力は、プロバイダによってサポートされるプログラミング言語およびツールを使用して作成された、利用者が作成または取得したアプリケーションをクラウド・インフラストラクチャにデプロイすることである。利用者は、ネットワーク、サーバ、オペレーティング・システム、またはストレージを含む基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、デプロイされたアプリケーション、および場合によってはアプリケーション・ホスティング環境の構成を制御することができる。
IaaS(Infrastructure as a Service):利用者に提供される能力は、処理、ストレージ、ネットワーク、およびその他の基本的な計算リソースのプロビジョニングであり、利用者は、オペレーティング・システムおよびアプリケーションを含むことができる任意のソフトウェアをデプロイして実行できる。利用者は、基盤になるクラウド・インフラストラクチャを管理することも制御することもないが、オペレーティング・システム、ストレージ、およびデプロイされたアプリケーションを制御することができ、場合によっては、選択されたネットワーク・コンポーネント(例えば、ホスト・ファイアウォール)を限定的に制御できる。
【0097】
デプロイメント・モデルは、次のとおりである。
プライベート・クラウド:このクラウド・インフラストラクチャは、ある組織のためにのみ運用される。この組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
コミュニティ・クラウド:このクラウド・インフラストラクチャは、複数の組織によって共有され、関心事(例えば、任務、セキュリティ要件、ポリシー、およびコンプライアンスに関する考慮事項)を共有している特定のコミュニティをサポートする。これらの組織またはサード・パーティによって管理することができ、オンプレミスまたはオフプレミスに存在することができる。
パブリック・クラウド:このクラウド・インフラストラクチャは、一般ユーザまたは大規模な業界団体が使用できるようになっており、クラウド・サービスを販売する組織によって所有される。
ハイブリッド・クラウド:このクラウド・インフラストラクチャは、データとアプリケーションの移植を可能にする標準化された技術または独自の技術(例えば、クラウド間の負荷バランスを調整するためのクラウド・バースト)によって固有の実体を残したまま互いに結合された2つ以上のクラウド(プライベート、コミュニティ、またはパブリック)の複合である。
【0098】
クラウド・コンピューティング環境は、ステートレス、疎結合、モジュール性、および意味的相互運用性に重点を置いたサービス指向の環境である。クラウド・コンピューティングの中心になるのは、相互接続されたノードのネットワークを含んでいるインフラストラクチャである。
【0099】
ここで図9を参照すると、例示的なクラウド・コンピューティング環境50が示されている。図示されているように、クラウド・コンピューティング環境50は、クラウドの利用者によって使用されるローカル・コンピューティング・デバイス(例えば、パーソナル・デジタル・アシスタント(PDA:personal digital assistant)または携帯電話54A、デスクトップ・コンピュータ54B、ラップトップ・コンピュータ54C、または自動車コンピュータ・システム54N、あるいはその組み合わせなど)が通信できる1つまたは複数のクラウド・コンピューティング・ノード10を含んでいる。ノード10は、互いに通信してよい。ノード10は、1つまたは複数のネットワーク内で、本明細書において前述されたプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、またはハイブリッド・クラウド、あるいはこれらの組み合わせなどに、物理的または仮想的にグループ化されてよい(図示されていない)。これによって、クラウド・コンピューティング環境50は、クラウドの利用者がローカル・コンピューティング・デバイス上でリソースを維持する必要のないインフラストラクチャ、プラットフォーム、またはSaaS、あるいはその組み合わせを提供できる。図9に示されたコンピューティング・デバイス54A~Nの種類は、例示のみが意図されており、コンピューティング・ノード10およびクラウド・コンピューティング環境50は、任意の種類のネットワークまたはネットワーク・アドレス可能な接続(例えば、Webブラウザを使用した接続)あるいはその両方を経由して任意の種類のコンピュータ制御デバイスと通信することができると理解される。
【0100】
ここで図10を参照すると、クラウド・コンピューティング環境50(図9)によって提供される機能的抽象レイヤのセットが示されている。図10に示されたコンポーネント、レイヤ、および機能は、例示のみが意図されており、本発明の実施形態がこれらに限定されないということが、あらかじめ理解されるべきである。図示されているように、次のレイヤおよび対応する機能が提供される。
【0101】
ハードウェアおよびソフトウェア・レイヤ60は、ハードウェア・コンポーネントおよびソフトウェア・コンポーネントを含む。ハードウェア・コンポーネントの例としては、メインフレーム61、RISC(Reduced Instruction Set Computer)アーキテクチャベースのサーバ62、サーバ63、ブレード・サーバ64、ストレージ・デバイス65、ならびにネットワークおよびネットワーク・コンポーネント66が挙げられる。一部の実施形態では、ソフトウェア・コンポーネントは、ネットワーク・アプリケーション・サーバ・ソフトウェア67およびデータベース・ソフトウェア68を含む。
【0102】
仮想化レイヤ70は、仮想サーバ71、仮想ストレージ72、仮想プライベート・ネットワークを含む仮想ネットワーク73、仮想アプリケーションおよびオペレーティング・システム74、ならびに仮想クライアント75などの仮想的実体を提供できる抽象レイヤを備える。
【0103】
一例を挙げると、管理レイヤ80は、以下で説明される機能を提供することができる。リソース・プロビジョニング81は、クラウド・コンピューティング環境内でタスクを実行するために利用される計算リソースおよびその他のリソースの動的調達を行う。計測および価格設定82は、クラウド・コンピューティング環境内でリソースが利用される際のコスト追跡、およびそれらのリソースの利用に対する請求書またはインボイスの送付を行う。一例を挙げると、それらのリソースは、アプリケーション・ソフトウェア・ライセンスを含んでよい。セキュリティは、クラウドの利用者およびタスクのID検証を行うとともに、データおよびその他のリソースの保護を行う。ユーザ・ポータル83は、クラウド・コンピューティング環境へのアクセスを利用者およびシステム管理者に提供する。サービス・レベル管理84は、必要なサービス・レベルを満たすように、クラウドの計算リソースの割り当てと管理を行う。サービス水準合意(SLA:Service Level Agreement)計画および実行85は、今後の要求が予想されるクラウドの計算リソースの事前準備および調達を、SLAに従って行う。
【0104】
ワークロード・レイヤ90は、クラウド・コンピューティング環境で利用できる機能の例を示している。このレイヤから提供されてよいワークロードおよび機能の例としては、マッピングおよびナビゲーション91、ソフトウェア開発およびライフサイクル管理92、仮想クラスルーム教育の配信93、データ解析処理94、トランザクション処理95、ならびに非線形の性能低下予測96が挙げられる。
【0105】
本発明の実施形態は、任意の可能な統合の技術的詳細レベルで、システム、方法、またはコンピュータ・プログラム製品、あるいはその組み合わせであることができる。コンピュータ・プログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令を含んでいるコンピュータ可読ストレージ媒体を含むことができる。
【0106】
コンピュータ可読ストレージ媒体は、命令実行デバイスによって使用するための命令を保持および格納できる有形のデバイスであることができる。コンピュータ可読ストレージ媒体は、例えば、電子ストレージ・デバイス、磁気ストレージ・デバイス、光ストレージ・デバイス、電磁ストレージ・デバイス、半導体ストレージ・デバイス、またはこれらの任意の適切な組み合わせであることができるが、これらに限定されない。コンピュータ可読ストレージ媒体のさらに具体的な例の非網羅的リストは、ポータブル・コンピュータ・ディスケット、ハード・ディスク、ランダム・アクセス・メモリ(RAM:random access memory)、読み取り専用メモリ(ROM:read-only memory)、消去可能プログラマブル読み取り専用メモリ(EPROM:erasable programmable read-only memoryまたはフラッシュ・メモリ)、スタティック・ランダム・アクセス・メモリ(SRAM:static random access memory)、ポータブル・コンパクト・ディスク読み取り専用メモリ(CD-ROM:compact disc read-only memory)、デジタル・バーサタイル・ディスク(DVD:digital versatile disk)、メモリ・スティック、フロッピー(R)・ディスク、命令が記録されているパンチカードまたは溝の中の隆起構造などの機械的にエンコードされるデバイス、およびこれらの任意の適切な組み合わせを含む。本明細書において使用されるとき、コンピュータ可読ストレージ媒体は、それ自体が、電波またはその他の自由に伝搬する電磁波、導波管またはその他の送信媒体を伝搬する電磁波(例えば、光ファイバ・ケーブルを通過する光パルス)、あるいはワイヤを介して送信される電気信号などの一過性の信号であると解釈されるべきではない。
【0107】
本明細書に記載されたコンピュータ可読プログラム命令は、コンピュータ可読ストレージ媒体から各コンピューティング・デバイス/処理デバイスへ、またはネットワーク(例えば、インターネット、ローカル・エリア・ネットワーク、広域ネットワーク、または無線ネットワーク、あるいはその組み合わせ)を介して外部コンピュータまたは外部ストレージ・デバイスへダウンロードされることができる。このネットワークは、銅伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイ・コンピュータ、またはエッジ・サーバ、あるいはその組み合わせを備えることができる。各コンピューティング・デバイス/処理デバイス内のネットワーク・アダプタ・カードまたはネットワーク・インターフェイスは、コンピュータ可読プログラム命令をネットワークから受信し、それらのコンピュータ可読プログラム命令を各コンピューティング・デバイス/処理デバイス内のコンピュータ可読ストレージ媒体に格納するために転送する。
【0108】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セット・アーキテクチャ(ISA:instruction-set-architecture)命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路のための構成データ、あるいは、Smalltalk(R)、C++などのオブジェクト指向プログラミング言語、および「C」プログラミング言語または同様のプログラミング言語などの手続き型プログラミング言語を含む1つまたは複数のプログラミング言語の任意の組み合わせで記述されたソース・コードまたはオブジェクト・コードであることができる。コンピュータ可読プログラム命令は、ユーザのコンピュータ上で全体的に実行すること、ユーザのコンピュータ上でスタンドアロン・ソフトウェア・パッケージとして部分的に実行すること、ユーザのコンピュータ上およびリモート・コンピュータ上でそれぞれ部分的に実行すること、あるいはリモート・コンピュータ上またはサーバ上で全体的に実行することができる。後者のシナリオでは、リモート・コンピュータは、ローカル・エリア・ネットワーク(LAN:local area network)または広域ネットワーク(WAN:wide area network)を含む任意の種類のネットワークを介してユーザのコンピュータに接続されることができ、または接続は、(例えば、インターネット・サービス・プロバイダを使用してインターネットを介して)外部コンピュータに対して行われることができる。一部の実施形態では、本発明の態様を実行するために、例えばプログラマブル論理回路、フィールドプログラマブル・ゲート・アレイ(FPGA:field-programmable gate array)、またはプログラマブル・ロジック・アレイ(PLA:programmable logic array)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用することによって、電子回路をカスタマイズするためのコンピュータ可読プログラム命令を実行することができる。
【0109】
本発明の態様は、本明細書において、本発明の実施形態に従って、方法、装置(システム)、およびコンピュータ・プログラム製品のフローチャート図またはブロック図あるいはその両方を参照して説明される。フローチャート図またはブロック図あるいはその両方の各ブロック、ならびにフローチャート図またはブロック図あるいはその両方に含まれるブロックの組み合わせが、コンピュータ可読プログラム命令によって実装されることができるということが理解されるであろう。
【0110】
これらのコンピュータ可読プログラム命令は、コンピュータまたはその他のプログラム可能なデータ処理装置のプロセッサを介して実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作を実施する手段を作り出すべく、汎用コンピュータ、専用コンピュータ、または他のプログラム可能なデータ処理装置のプロセッサに提供されてマシンを作り出すものであることができる。これらのコンピュータ可読プログラム命令は、命令が格納されたコンピュータ可読ストレージ媒体がフローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作の態様を実施する命令を含んでいる製品を備えるように、コンピュータ可読ストレージ媒体に格納され、コンピュータ、プログラム可能なデータ処理装置、または他のデバイス、あるいはその組み合わせに特定の方式で機能するように指示できるものであることもできる。
【0111】
コンピュータ可読プログラム命令は、コンピュータ上、その他のプログラム可能な装置上、またはその他のデバイス上で実行される命令が、フローチャートまたはブロック図あるいはその両方のブロックに指定される機能/動作を実施するように、コンピュータ、その他のプログラム可能なデータ処理装置、またはその他のデバイスに読み込まれることもでき、それによって、一連の動作可能なステップを、コンピュータ上、その他のプログラム可能な装置上、またはコンピュータ実装プロセスを生成するその他のデバイス上で実行させる。
【0112】
図内のフローチャートおよびブロック図は、本発明のさまざまな実施形態に従って、システム、方法、およびコンピュータ・プログラム製品の可能な実装のアーキテクチャ、機能、および動作を示す。これに関連して、フローチャートまたはブロック図内の各ブロックは、規定された論理機能を実装するための1つまたは複数の実行可能な命令を含んでいる、命令のモジュール、セグメント、またはサブセットを表すことができる。一部の代替の実装では、ブロックに示された機能は、図に示された順序とは異なる順序で発生することができる。例えば、連続して示された2つのブロックは、実際には、含まれている機能に応じて、実質的に同時に実行されるか、または場合によっては逆の順序で実行され得る。ブロック図またはフローチャート図あるいはその両方の各ブロック、ならびにブロック図またはフローチャート図あるいはその両方に含まれるブロックの組み合わせは、規定された機能もしくは動作を実行するか、または専用ハードウェアとコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実装されることができるということにも注意する。
【0113】
CD、DVDなどのストレージ媒体を読み込むことを介して、クライアント、サーバ、およびプロキシ・コンピュータに手動で直接読み込むことによって、プロセス・ソフトウェア(例えば、図3~5に関して説明された方法の任意の部分を実行するか、または図1~2もしくは6~7またはその両方で説明された機能の任意の部分を実装するか、あるいはその両方を行うように構成された、図8の命令860に格納された命令のいずれかまたは任意のソフトウェアあるいはその両方)がデプロイされることができるということが理解されるが、プロセス・ソフトウェアは、プロセス・ソフトウェアを中央サーバまたは中央サーバのグループに送信することによって、コンピュータ・システムに自動的または半自動的にデプロイされることもできる。その後、プロセス・ソフトウェアは、プロセス・ソフトウェアを実行するクライアント・コンピュータにダウンロードされる。代替として、プロセス・ソフトウェアは、電子メールを介してクライアント・システムに直接送信される。その後、プロセス・ソフトウェアは、ディレクトリに分離されるか、またはプロセス・ソフトウェアをディレクトリに分離するプログラム命令のセットを実行することによって、ディレクトリに読み込まれる。別の代替手段は、プロセス・ソフトウェアをクライアント・コンピュータのハード・ドライブ上のディレクトリに直接送信することである。プロキシ・サーバが存在する場合、プロセスは、プロキシ・サーバのコードを選択し、プロキシ・サーバのコードを配置するコンピュータを決定し、プロキシ・サーバのコードを送信し、その後、プロキシ・サーバのコードをプロキシ・コンピュータにインストールする。プロセス・ソフトウェアは、プロキシ・サーバに送信されてから、プロキシ・サーバに格納される。
【0114】
本発明の実施形態は、クライアント企業、非営利組織、政府機関、内部組織構造などとのサービス契約の一部として配信されることもできる。これらの実施形態は、本明細書に記載された方法の一部またはすべてを実装するソフトウェア、ハードウェア、およびWebサービスを実行するようにコンピュータ・システムを構成することと、そのようなソフトウェア、ハードウェア、およびWebサービスをデプロイすることとを含むことができる。これらの実施形態は、クライアントの動作を解析することと、解析に応答して推奨を作成することと、推奨のサブセットを実施するシステムを構築することと、システムを既存のプロセスおよびインフラストラクチャに統合することと、システムの使用を計測することと、費用をシステムのユーザの割り当てることと、請求書を送付するか、インボイスを送付する(例えば、インボイスを生成する)か、またはその他の方法でシステムの使用に対する支払いを受信することとを含むこともできる。
【0115】
本明細書で使用される用語は、特定の実施形態を説明することのみを目的としており、さまざまな実施形態を制限することを意図していない。本明細書において使用されるとき、単数形「a」、「an」、および「the」は、文脈で特に明示的に示されない限り、複数形も含むよう意図されている。「含む」または「含んでいる」あるいはその両方の用語は、本明細書で使用される場合、記載された機能、整数、ステップ、動作、要素、またはコンポーネント、あるいはその組み合わせの存在を示すが、1つまたは複数のその他の機能、整数、ステップ、動作、要素、コンポーネント、またはこれらのグループ、あるいはその組み合わせの存在または追加を除外していないということが、さらに理解されるであろう。さまざまな実施形態のうちの例示的な実施形態の前の詳細な説明では、本明細書の一部を形成する(類似する番号が類似する要素を表す)添付の図面への参照が行われ、特定の実施形態例が例として示されており、さまざまな実施形態が実践されることができる。これらの実施形態は、当業者が実施形態を実践できるようにするために十分詳細に説明されたが、他の実施形態が使用されることができ、さまざまな実施形態の範囲から逸脱することなく、論理的変更、機械的変更、電気的変更、およびその他の変更が行われることができる。前の説明では、さまざまな実施形態の完全な理解を可能にするために、多くの特定の詳細が示された。しかし、さまざまな実施形態は、それらの特定の詳細なしで実践されることができる。他の例では、実施形態を不明瞭にしないために、周知の回路、構造、および技術は詳細に示されていない。
【0116】
「実施形態」という用語の異なる事例は、本明細書内で使用されるとき、同じ実施形態を必ずしも参照しないが、同じ実施形態を参照することもできる。本明細書において示されたか、または説明されたすべてのデータおよびデータ構造は単なる例であり、他の実施形態では、異なるデータの量、データの種類、フィールド、フィールドの数および種類、フィールド名、行の数および種類、レコード、エントリ、またはデータの編成が使用されることができる。加えて、分離したデータ構造が必要でなくてよいように、任意のデータが論理と組み合わせられることができる。したがって、前の詳細な説明は、限定する意味で受け取られるべきではない。
【0117】
本開示のさまざまな実施形態の説明は、例示の目的で提示されているが、網羅的であることは意図されておらず、開示された実施形態に制限されない。説明された実施形態の範囲および思想から逸脱しない多くの変更および変形が、当業者にとって明らかであろう。本明細書で使用された用語は、実施形態の原理、実際の適用、または市場で見られる技術を超える技術的改良を最も適切に説明するため、または他の当業者が本明細書で開示された実施形態を理解できるようにするために選択されている。
【0118】
本開示は、特定の実施形態に関して説明されたが、実施形態の変更および修正が当業者にとって明らかになるということが予想される。したがって、以下の特許請求の範囲が、そのようなすべての変更および修正を、本開示の真の思想および範囲に含まれるとして、対象にすると解釈されるということが意図される。
【0119】
本開示で説明されたすべての利点は例示的な利点であり、本開示の思想および範囲内にとどまりながら、説明された利点のすべてまたは一部を実現するか、あるいはいずれも実現しない本開示の実施形態が存在することができる。
【0120】
以下では、本開示の一部の態様を示すために、実施例の非限定的リストが提供される。実施例1はコンピュータ実装方法である。この方法は、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのうちのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含む。
【0121】
実施例2は、任意選択的特徴を含んでいるか、または除外している、実施例1の方法を含む。この例では、分類が、新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す。
【0122】
実施例3は、任意選択的特徴を含んでいるか、または除外している、実施例1~2のうちのいずれか1つの方法を含む。この例では、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する。
【0123】
実施例4は、任意選択的特徴を含んでいるか、または除外している、実施例1~3のうちのいずれか1つの方法を含む。この例では、予測範囲が、未来の事前に定義された時間の量を定義し、事前に定義された時間の量だけ未来の各データ点の各ラベルが、各トレーニング・サンプルに関連付けられる。
【0124】
実施例5は、任意選択的特徴を含んでいるか、または除外している、実施例1~4のうちのいずれか1つの方法を含む。この例では、K平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化される。
【0125】
実施例6は、任意選択的特徴を含んでいるか、または除外している、実施例1~5のうちのいずれか1つの方法を含む。この例では、リモートのデータ処理システムから故障予測システムにダウンロードされたソフトウェアに従って、故障予測システムによって方法が実行される。任意選択的に、この方法は、ソフトウェアの使用を計測することと、使用の計測に基づいてインボイスを生成することとをさらに含む。
【0126】
実施例7はシステムである。このシステムは、1つまたは複数のプロセッサと、プログラム命令を格納している1つまたは複数のコンピュータ可読ストレージ媒体とを含み、プログラム命令は、1つまたは複数のプロセッサによって実行された場合に、1つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタのうちのクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含んでいる方法を実行させるように構成される。
【0127】
実施例8は、任意選択的特徴を含んでいるか、または除外している、実施例7のシステムを含む。この例では、分類が、新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す。
【0128】
実施例9は、任意選択的特徴を含んでいるか、または除外している、実施例7~8のうちのいずれか1つのシステムを含む。この例では、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する。
【0129】
実施例10は、任意選択的特徴を含んでいるか、または除外している、実施例7~9のうちのいずれか1つのシステムを含む。この例では、予測範囲が、未来の事前に定義された時間の量を定義し、事前に定義された時間の量だけ未来の各データ点の各ラベルが、各トレーニング・サンプルに関連付けられる。
【0130】
実施例11は、任意選択的特徴を含んでいるか、または除外している、実施例7~10のうちのいずれか1つのシステムを含む。この例では、K平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化される。
【0131】
実施例12はコンピュータ・プログラム製品である。コンピュータ・プログラム製品は、1つまたは複数のコンピュータ可読ストレージ媒体と、1つまたは複数のコンピュータ可読ストレージ媒体に集合的に格納されたプログラム命令とを含み、プログラム命令は、1つまたは複数のプロセッサに、新しいデータ・サンプルを故障予測モデルに入力することであって、故障予測モデルが、ラベル付けされた過去のデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタ内のクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含んでいる方法を実行させるように構成された命令を含む。
【0132】
実施例13は、任意選択的特徴を含んでいるか、または除外している、実施例12のコンピュータ・プログラム製品を含む。この例では、分類が、新しいデータ・サンプルに関連付けられた資産の摩耗に関連する性能低下の可能性を示す。
【0133】
実施例14は、任意選択的特徴を含んでいるか、または除外している、実施例12~13のうちのいずれか1つのコンピュータ・プログラム製品を含む。この例では、ルックバック・ウィンドウが、各トレーニング・サンプルに含めるための連続的な前のデータ点の数を定義する。
【0134】
実施例15は、任意選択的特徴を含んでいるか、または除外している、実施例12~14のうちのいずれか1つのコンピュータ・プログラム製品を含む。この例では、予測範囲が、未来の事前に定義された時間の量を定義し、事前に定義された時間の量だけ未来の各データ点の各ラベルが、各トレーニング・サンプルに関連付けられる。
【0135】
実施例16は、任意選択的特徴を含んでいるか、または除外している、実施例12~15のうちのいずれか1つのコンピュータ・プログラム製品を含む。この例では、K平均クラスタ化を使用して各トレーニング・サンプルがクラスタ化される。
【0136】
実施例17は、一軸ねじポンプ(PCP)の摩耗に関連する劣化を予測するためのコンピュータ実装方法であり、この方法は、PCPの新しいデータ・サンプルを、PCPの摩耗に関連する劣化を予測するように構成されたモデルに入力することであって、このモデルが、ラベル付けされた過去のPCPデータセットを使用してトレーニングされ、各データ点が、各トレーニング・サンプルを作成するために、ルックバック・ウィンドウおよび予測範囲に関連付けられ、各トレーニング・サンプルが複数のクラスタにクラスタ化され、複数のクラスタが、正常スコアおよび異常スコアにそれぞれ関連付けられる、入力することと、新しいデータ・サンプルを含んでいる複数のクラスタのうちの第1のクラスタの第1の異常スコアを、異常スコアより大きい正常スコアを有している複数のクラスタ内のクラスタの平均異常スコアと比較することに基づいて、新しいデータ・サンプルに関連付けられた分類を出力することとを含み、この分類は、PCPの摩耗に関連する劣化を示す。
【0137】
実施例18は、一軸ねじポンプ(PCP)の摩耗に関連する劣化を予測するためのコンピュータ実装方法であり、この方法は、1つまたは複数のPCPに関連付けられた過去のデータの2値のラベル付けを実行することによって、ラベル付けされた過去のデータを生成することと、ルックバック・ウィンドウおよび予測範囲をラベル付けされた過去のデータの各データ点に適用することによって、複数のトレーニング・データ・サンプルを生成することと、複数のトレーニング・データ・サンプルを複数のクラスタにクラスタ化することと、複数のクラスタのうちの各クラスタのクラスタ・スコアを計算することと、PCPの新しいデータ・サンプルを複数のクラスタのうちの第1のクラスタに割り当てることと、第1のクラスタに関連付けられたクラスタ・スコアに基づいて、分類を新しいデータ・サンプルに割り当てることとを含み、この分類は、PCPの未来の摩耗に関連する劣化の可能性を示す。
【0138】
実施例19は、任意選択的特徴を含んでいるか、または除外している、実施例18の方法を含む。この例では、ラベル付けされた過去のデータが、既知のポンプ交換日の前の既定の期間の間、故障としてラベル付けされる。
【0139】
実施例20は、任意選択的特徴を含んでいるか、または除外している、実施例18~19のうちのいずれか1つの方法を含む。この例では、ラベル付けされた過去のデータは、ポンプ速度データ、ポンプ・トルク・データ、ケーシング圧データ、生産速度データ、および保守記録を含む。
【0140】
実施例21は、任意選択的特徴を含んでいるか、または除外している、実施例18~20のうちのいずれか1つの方法を含む。この例では、各クラスタのクラスタ・スコアを計算することは、第1のクラスタの正常スコアを計算することであって、正常スコアが、第1のクラスタ内の正常状態に関連付けられたトレーニング・データ・サンプルの第1の比率を、複数のトレーニング・データ・サンプルにおける正常状態に関連付けられたトレーニング・データ・サンプルの第2の比率で割った値である、計算することと、第1のクラスタの異常スコアを計算することであって、異常スコアが、第1のクラスタ内の劣化状態に関連付けられたトレーニング・データ・サンプルの第3の比率を、複数のトレーニング・データ・サンプルにおける劣化状態に関連付けられたトレーニング・データ・サンプルの第4の比率で割った値である、計算することとをさらに含む。任意選択的に、分類は、第1のクラスタの正常スコアまたは異常スコアのより大きい値に基づく。
【0141】
実施例22は、任意選択的特徴を含んでいるか、または除外している、実施例18~21のうちのいずれか1つの方法を含む。この例では、この方法は、新しいデータ・サンプルに関する故障信号を生成することを含み、故障信号は、既定の数の前のデータ点にわたる新しいデータ・サンプルに関する平均異常スコアを含む。任意選択的に、故障信号を生成することは、異常スコアより大きい正常スコアを有している複数のクラスタのうちのクラスタの平均異常スコアを計算することと、既定の数の前のデータ点の各々について、平均異常スコアより大きい第1のクラスタの異常スコアを有しているデータ点に1の値を関連付けることと、平均異常スコアより小さい第1のクラスタの異常スコアを有しているデータ点に0の値を関連付けることと、既定の数の前のデータ点の各々に関連付けられた1の値および0の値の平均値として故障信号を計算することとをさらに含む。
図1
図2
図3
図4
図5A
図5B
図6A
図6B
図7
図8
図9
図10