(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-11-14
(54)【発明の名称】ラベルなしセンサデータを用いた産業システム内の稀な障害の自動化されたリアルタイムの検出、予測、及び予防に関する、方法または非一時的コンピュータ可読媒体
(51)【国際特許分類】
G06N 20/00 20190101AFI20231107BHJP
G06N 3/0455 20230101ALI20231107BHJP
【FI】
G06N20/00
G06N3/0455
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023524465
(86)(22)【出願日】2020-10-30
(85)【翻訳文提出日】2023-04-20
(86)【国際出願番号】 US2020058311
(87)【国際公開番号】W WO2022093271
(87)【国際公開日】2022-05-05
(81)【指定国・地域】
(71)【出願人】
【識別番号】520155228
【氏名又は名称】ヒタチ ヴァンタラ エルエルシー
(74)【代理人】
【識別番号】110000279
【氏名又は名称】弁理士法人ウィルフォート国際特許事務所
(72)【発明者】
【氏名】ザン, ヨンシャン
(72)【発明者】
【氏名】リン, ウェイ
(72)【発明者】
【氏名】シュマルゾ, ウィリアム
(57)【要約】
本明細書に記載する実装例は、複数の特徴を生成するために、ラベルなしセンサデータに対して特徴抽出を実行すること、障害検出ラベルを生成するために、障害検出モデルを用いて複数の特徴を処理することによって障害の検出を実行することであって、障害検出モデルは、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行すること、並びに、障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び障害検出ラベルを与えることを含み得る、ラベルなしセンサデータを与える複数の装置を含むシステムを管理することを対象とする。
【選択図】
図1
【特許請求の範囲】
【請求項1】
ラベルなしセンサデータを与える複数の装置を含むシステムのための方法であって、
複数の特徴を生成するために前記ラベルなしセンサデータに対して特徴抽出を実行すること、
障害検出ラベルを生成するために障害検出モデルを用いて前記複数の特徴を処理することによって障害検出を実行することであって、前記障害検出モデルは、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行すること、並びに
障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び前記障害検出ラベルを与えること
を含む、方法。
【請求項2】
前記機械学習フレームワークは、
前記特徴に基づいて前記教師なし機械学習モデルを生成するために前記教師なし機械学習を実行すること、
教師ありアンサンブル機械学習モデルを生成するために前記教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、前記教師ありアンサンブル機械学習モデルのそれぞれは前記教師なし機械学習モデルのそれぞれに対応する、実行すること、及び
前記教師ありアンサンブル機械学習モデルによって生成される予測に対する前記教師なし機械学習モデルの前記結果を評価することに基づいて、前記教師なし機械学習モデルの或るものを前記障害検出モデルとして選択すること
により、前記教師なし機械学習から生成される前記教師なし機械学習モデルに対して前記教師あり機械学習を適用することから前記障害検出モデルを生成する、請求項1に記載の方法。
【請求項3】
過去のセンサデータから最適化された特徴窓からの特徴を抽出すること、
前記過去のセンサデータからの障害に基づいて、最適化された障害窓及びリードタイム窓を決定すること、
長・短期記憶(LSTM)オートエンコーダを用いて前記特徴を符号化すること、
前記障害窓の中の障害を導出するために、前記特徴窓からの特徴シーケンス内のパターンを学習するように構成されるLSTMシーケンス予測モデルを訓練すること、
前記LSTMシーケンス予測モデルを前記障害予測モデルとして提供すること、及び
前記障害検出モデルからの検出された障害と、前記障害予測モデルからの予測された障害からなる障害をアンサンブルすることであって、前記障害予測は、検出された障害及び予測された障害からのアンサンブル障害である、アンサンブルすること
を含む、前記障害予測モデルを生成することを更に含む、請求項1に記載の方法。
【請求項4】
障害の根本原因を決定しアラートを抑制するための障害予防プロセスを提供することを更に含み、前記障害予防プロセスは、
アンサンブル障害の前記根本原因を識別し、前記アンサンブル障害に対処するための修復に関する推奨を自動化すること、
前記アンサンブル障害からアラートを生成すること、
緊急性のレベルに基づいて前記アラートの或るものを抑制するために、コスト重視型最適化技法を用いてアラート抑制プロセスを実行すること、及び
前記複数のシステムの1人又は複数のオペレータに前記アラートの残りを提供すること
によって前記障害の前記根本原因を決定し前記アラートを抑制する、請求項1に記載の方法。
【請求項5】
前記修復に関する推奨に基づいて前記複数のシステムのうちの1つ又は複数を制御するためのプロセスを実行することを更に含む、請求項4に記載の方法。
【請求項6】
ラベルなしデータを与える複数の装置を含むシステムのための方法であって、
複数の特徴を生成するために前記ラベルなしデータに対して特徴抽出を実行すること、
教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用することによって教師なし学習タスクを教師あり学習タスクに変換する機械学習フレームワークを実行すること
を含み、前記機械学習フレームワークを前記実行することが、
前記特徴に基づいて前記教師なし機械学習モデルを生成するために前記教師なし機械学習を実行すること、
教師ありアンサンブル機械学習モデルを生成するために前記教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、前記教師ありアンサンブル機械学習モデルのそれぞれは前記教師なし機械学習モデルのそれぞれに対応する、実行すること、
前記教師ありアンサンブル機械学習モデルによって生成される予測に対する前記教師なし機械学習モデルの前記結果を評価することに基づいて、前記教師なし機械学習モデルの或るものを選択すること、
前記教師なし学習モデルの前記評価の結果に基づいて特徴を選択すること、及び
説明可能な人工知能(AI)を促進するために、前記教師なし学習モデルの選択されたものを教師あり学習モデルに変換すること
を含む、方法。
【請求項7】
ラベルなしセンサデータを与える複数の装置を含むシステムを管理するための命令を記憶する非一時的コンピュータ可読媒体であって、前記命令は、
複数の特徴を生成するために前記ラベルなしセンサデータに対して特徴抽出を実行すること、
障害検出ラベルを生成するために障害検出モデルを用いて前記複数の特徴を処理することによって障害の検出を実行することであって、前記障害検出モデルは、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行すること、並びに
障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び前記障害検出ラベルを与えること
を含む、非一時的コンピュータ可読媒体。
【請求項8】
前記機械学習フレームワークは、
前記特徴に基づいて前記教師なし機械学習モデルを生成するために前記教師なし機械学習を実行すること、
教師ありアンサンブル機械学習モデルを生成するために前記教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、前記教師ありアンサンブル機械学習モデルのそれぞれは前記教師なし機械学習モデルのそれぞれに対応する、実行すること、及び
前記教師ありアンサンブル機械学習モデルによって生成される予測に対する前記教師なし機械学習モデルの前記結果を評価することに基づいて、前記教師なし機械学習モデルの或るものを前記障害検出モデルとして選択すること
により、前記教師なし機械学習から生成される前記教師なし機械学習モデルに対して前記教師あり機械学習を適用することから前記障害検出モデルを生成する、請求項7に記載の非一時的コンピュータ可読媒体。
【請求項9】
前記命令が前記障害予測モデルを生成することを更に含み、前記障害予測モデルを前記生成することは、
過去のセンサデータから最適化された特徴窓からの特徴を抽出すること、
前記過去のセンサデータからの障害に基づいて、最適化された障害窓及びリードタイム窓を決定すること、
長・短期記憶(LSTM)オートエンコーダを用いて前記特徴を符号化すること、
前記障害窓の中の障害を導出するために、前記特徴窓からの特徴シーケンス内のパターンを学習するように構成されるLSTMシーケンス予測モデルを訓練すること、
前記LSTMシーケンス予測モデルを前記障害予測モデルとして提供すること、及び
前記障害検出モデルからの検出された障害と、前記障害予測モデルからの予測された障害からなる障害をアンサンブルすることであって、前記障害予測は、検出された障害及び予測された障害からのアンサンブル障害である、アンサンブルすること
を含む、請求項7に記載の非一時的コンピュータ可読媒体。
【請求項10】
前記命令が、障害の根本原因を決定しアラートを抑制するための障害予防プロセスを提供することを更に含み、前記障害予防プロセスは、
アンサンブル障害の前記根本原因を識別し、前記アンサンブル障害に対処するための修復に関する推奨を自動化すること、
前記アンサンブル障害からアラートを生成すること、
緊急性のレベルに基づいて前記アラートの或るものを抑制するために、コスト重視型最適化技法を用いてアラート抑制プロセスを実行すること、及び
前記複数のシステムの1人又は複数のオペレータに前記アラートの残りを提供すること
によって前記障害の前記根本原因を決定し前記アラートを抑制する、請求項7に記載の非一時的コンピュータ可読媒体。
【請求項11】
前記命令が、前記修復に関する推奨に基づいて前記複数のシステムのうちの1つ又は複数を制御するためのプロセスを実行することを更に含む、請求項10に記載の非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は一般に産業システムに関し、より詳細にはラベルなしセンサデータを用いた産業システム内の稀な障害の自動化されたリアルタイムの検出、予測、及び予防に関する。
【背景技術】
【0002】
本明細書に記載する産業システムは、これだけに限定されないが製造業、テーマパーク、病院、空港、公共施設、鉱業、石油・ガス、倉庫、及び輸送システムを含む複合システムを運営する殆どの産業を含む。
【0003】
障害の徴候から障害までの時間という面で、障害がどの程度離れているのかによって2つの主な障害のカテゴリが定義される。コンベヤベルト上の過負荷の障害のような、早い種類の障害は、時間に関して近い徴候及び障害を含む。遅い(又は慢性的な)種類の障害は、障害からみて長く過去の(又は障害よりもはるかに前の)徴候を含む。この種の障害はより広い悪影響を通常有し、全システムをシャットダウンする可能性がある。そのような種類の障害はダムの破損又はひび割れ、又は金属疲労による破断を含み得る。
【0004】
複合システムにおける障害は稀だが、かかる障害のコストは金銭上のコスト(例えば運営、保守、修理、物流等)、評判上のコスト(例えばマーケティング、マーケットシェア、売上、品質等)、人的コスト(例えばスケジューリング、スキルセット等)、及び責任上のコスト(例えば安全、健康等)に関して膨大であり得る。
【発明の概要】
【課題を解決するための手段】
【0005】
本明細書に記載する実装例は、障害が徴候から短い時間窓のうちに生じる早い種類の障害を対象とする。短い時間窓は、特定の産業システム内の実際の問題に応じて、数分から数時間に及び得る。
【0006】
従来技術のシステム及び方法の幾つかの問題(限界及び制限)を以下で論じる。本明細書に記載する実装例はそれらの問題を解決するための技法を紹介する。
【0007】
教師なし学習タスクを含む従来技術の実装では、データサイエンスの実務者は通常1つのモデルを毎回構築し、結果を手動で検査し、結果に基づいてモデルを評価しなければならない。モデルベースの特徴選択は、従来技術の教師なし学習タスクでは利用できない。更にデータサイエンスの実務者は通常、結果を手動で説明しなければならない。教師なし学習タスクに関与する手動の作業は通常時間がかかり、誤りが起きやすく、主観的である。教師なし学習タスクに関するモデルの評価、特徴の選択、及び説明可能な人工知能(AI)を自動化するための汎用技法を提供する必要がある。
【0008】
従来技術の実装は、過去の正確な障害データに依存するところが大きい。しかし過去の深刻な障害は稀であり、過去の正確な障害データは幾つかの理由から通常は得ることができない。例えば、障害データを収集するために設定されたプロセスがない又はプロセスが限られている場合があるので、過去の障害は収集されないことがあり、モノのインターネット(IoT)データが大量にあることが原因で、障害データを手動で処理、検出、及び識別できない場合もある。更に、一般的な事象及び稀な事象の両方を効果的に及び効率的に検出し分類するための標準プロセスがないので、収集される過去の障害は正確ではない可能性がある。更に、ドメイン知識に基づいてセンサデータをラベル付けすることによって障害を収集するための手動プロセスは不正確であり、一貫性がなく、信頼できず、時間がかかる。従って、産業システム内で障害を正確に、効果的に、及び効率的に検出し収集するための自動化された及び標準のプロセス又は手法が求められている。
【0009】
従来技術の障害予測ソリューションは、要求される応答時間(又はリードタイム)において、稀な障害事象について上手く機能しない。その理由は、特徴/証拠及び障害を収集するための最適な窓を決定できないこと、又は障害を予測可能な正しい信号を識別できないことを含む。それに加え、産業システムは通常は正常状態で実行され、障害は通常は稀な事象なので、限られた量の障害のパターンを捕捉することが困難であり、従ってかかる障害を予測することが難しくあり得る。更に、従来技術の実装は正常な場合と稀な障害事象との間の時間的順序の正しい関係を構築できない場合があり、稀な障害の経過のシーケンスパターンを捕捉できない場合がある。従って、正常なケースと稀な障害との間の正しい関係及び稀な障害の経過を構築できるように、最適な障害窓の中の限られた量の障害データを与えられた最適な特徴窓、及び、要求される応答時間のなかで、最適な特徴窓の中の障害予測用の正しい信号を識別可能な手法が求められている。
【0010】
従来技術の実装では、障害の予防がドメイン知識に基づいて手動で通常行われ、かかる予防は主観的であり、時間がかかり、誤りが起きやすい。従って予測された障害の根本原因を識別し、ドメイン知識を組み込むことによって障害の修復に関する推奨を自動化し、アラート疲れを減らすためにアラートの抑制を最適化するための標準の手法が求められている。
【0011】
産業システム内の障害の膨大な悪影響のため、本明細書で提案するソリューションは悪影響を軽減し又は回避するためにかかる障害を検出し、予測し、予防することを目指す。本明細書に記載する障害予防ソリューションから、実装例は生産性、出力、及び運営の有効性を高めながら予定外の稼働不能時間及び動作遅延を減らすこと、産出量を最適化し利幅/利益を増加すること、生産の一貫性及び製品の品質を維持すること、物流、保守のスケジューリング、労働、及び補修費用のための予定外のコストを減らすこと、資産及び全産業システムに対する損害を減らすこと、及びオペレータへの事故を減らしオペレータの健康及び安全を改善することができる。提案するソリューションは一般にオペレータ、監督者/管理者、保守技術者、SME/ドメイン専門家等に利益をもたらす。
【0012】
本開示の態様は、ラベルなしセンサデータを与える複数の装置を有するシステムのための方法を含むことができ、この方法は、複数の特徴を生成するためにラベルなしセンサデータに対して特徴抽出を実行すること、障害検出ラベルを生成するために障害検出モデルを用いて複数の特徴を処理することによって障害の検出を実行することであって、障害検出モデルは教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行すること、並びに、障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び障害検出ラベルを与えることを含む。
【0013】
本開示の態様は、ラベルなしセンサデータを与える複数の装置を有するシステムを管理するための命令を記憶するコンピュータプログラムを含むことができ、命令は、複数の特徴を生成するためにラベルなしセンサデータに対して特徴抽出を実行すること、障害検出ラベルを生成するために障害検出モデルを用いて複数の特徴を処理することによって障害の検出を実行することであって、障害検出モデルは、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行すること、並びに障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び障害検出ラベルを与えることを含む。コンピュータプログラムは非一時的コンピュータ可読媒体上に記憶することができ、1つ又は複数のプロセッサによって実行され得る。
【0014】
本開示の態様は、ラベルなしセンサデータを与える複数の装置を有するシステムを含むことができ、このシステムは、複数の特徴を生成するためにラベルなしセンサデータに対して特徴抽出を実行するための手段と、障害検出ラベルを生成するために障害検出モデルを用いて複数の特徴を処理することによって障害の検出を実行するための手段であって、障害検出モデルは、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行するための手段と、障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び障害検出ラベルを与えるための手段とを含む。
【0015】
本開示の態様は、ラベルなしセンサデータを与える複数の装置を有するシステムのための管理装置を含むことができ、この管理装置は、複数の特徴を生成するためにラベルなしセンサデータに対して特徴抽出を実行すること、障害検出ラベルを生成するために障害検出モデルを用いて複数の特徴を処理することによって障害の検出を実行することであって、障害検出モデルは、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行すること、並びに、障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び障害検出ラベルを与えることを行うように構成されるプロセッサを含む。
【0016】
本開示の態様は、ラベルなしセンサデータを与える複数の装置を有するシステムのための方法を含むことができ、この方法は、複数の特徴を生成するためにラベルなしデータに対して特徴抽出を実行すること、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用することによって教師なし学習タスクを教師あり学習タスクに変換する機械学習フレームワークを実行することであって、特徴に基づいて教師なし機械学習モデルを生成するために教師なし機械学習を実行することを含む、実行すること、教師ありアンサンブル機械学習モデルを生成するために、教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、教師ありアンサンブル機械学習モデルのそれぞれは教師なし機械学習モデルのそれぞれに対応する、実行すること、教師ありアンサンブル機械学習モデルによって生成される予測に対する教師なし機械学習モデルの結果を評価することに基づいて、教師なし機械学習モデルの或るものを選択すること、教師なし学習モデルの評価結果に基づいて特徴を選択すること、及び、説明可能な人工知能(AI)を促進するために、教師なし学習モデルのうちの選択されたものを教師あり学習モデルに変換することを含む。
【0017】
本開示の態様は、ラベルなしデータを与える複数の装置を有するシステムのためのコンピュータプログラムを含むことができ、このコンピュータプログラムは、複数の特徴を生成するためにラベルなしデータに対して特徴抽出を実行すること、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用することによって教師なし学習タスクを教師あり学習タスクに変換する機械学習フレームワークを実行することであって、特徴に基づいて教師なし機械学習モデルを生成するために教師なし機械学習を実行することを含む、実行すること、教師ありアンサンブル機械学習モデルを生成するために、教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、教師ありアンサンブル機械学習モデルのそれぞれは教師なし機械学習モデルのそれぞれに対応する、実行すること、教師ありアンサンブル機械学習モデルによって生成される予測に対する教師なし機械学習モデルの結果を評価することに基づいて、教師なし機械学習モデルの或るものを選択すること、教師なし学習モデルの評価結果に基づいて特徴を選択すること、及び、説明可能な人工知能(AI)を促進するために、教師なし学習モデルの選択されたものを教師あり学習モデルに変換することを含む命令を有する。コンピュータプログラムは非一時的コンピュータ可読媒体上に記憶することができ、1つ又は複数のプロセッサによって実行され得る。
【0018】
本開示の態様は、ラベルなしデータを与える複数の装置を有するシステムを含むことができ、このシステムは、複数の特徴を生成するためにラベルなしデータに対して特徴抽出を実行するための手段と、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用することによって教師なし学習タスクを教師あり学習タスクに変換する機械学習フレームワークを実行するための手段であって、機械学習フレームワークを実行することは特徴に基づいて教師なし機械学習モデルを生成するために教師なし機械学習を実行することを含む、実行するための手段と、教師ありアンサンブル機械学習モデルを生成するために、教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行するための手段であって、教師ありアンサンブル機械学習モデルのそれぞれは教師なし機械学習モデルのそれぞれに対応する、実行するための手段と、教師ありアンサンブル機械学習モデルによって生成される予測に対する教師なし機械学習モデルの結果を評価することに基づいて教師なし機械学習モデルの或るものを選択するための手段と、教師なし学習モデルの評価結果に基づいて特徴を選択するための手段と、説明可能な人工知能(AI)を促進するために、教師なし学習モデルの選択されたものを教師あり学習モデルに変換するための手段とを含む。
【0019】
本開示の態様は、ラベルなしデータを与える複数の装置を有するシステムのための管理装置を含むことができ、この管理装置は、複数の特徴を生成するためにラベルなしデータに対して特徴抽出を実行すること、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用することによって教師なし学習タスクを教師あり学習タスクに変換する機械学習フレームワークを実行することであって、特徴に基づいて教師なし機械学習モデルを生成するために教師なし機械学習を実行することを含む、実行すること、教師ありアンサンブル機械学習モデルを生成するために、教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、教師ありアンサンブル機械学習モデルのそれぞれは教師なし機械学習モデルのそれぞれに対応する、実行すること、教師ありアンサンブル機械学習モデルによって生成される予測に対する教師なし機械学習モデルの結果を評価することに基づいて教師なし機械学習モデルの或るものを選択すること、教師なし学習モデルの評価結果に基づいて特徴を選択すること、及び説明可能な人工知能(AI)を促進するために、教師なし学習モデルの選択されたものを教師あり学習モデルに変換することを行うように構成されるプロセッサを含む。
【図面の簡単な説明】
【0020】
【
図1】一実装例による、産業システム内の稀な障害を検出し、予測し、予防するためのソリューションアーキテクチャを示す。
【0021】
【
図2】一実装例によるモデル選択のためのワークフローの一例を示す。
【0022】
【
図3】一実装例による教師あり学習モデルを訓練し、選択し、アンサンブルするための一実装例を示す。
【0023】
【
図4】一実装例による特徴及び障害を抽出するための特徴窓の一例を示す。
【0024】
【
図5】一実装例による多層の長・短期記憶(LSTM)オートエンコーダを示す。
【0025】
【
図6】一実装例による障害予測用の多層LSTMアーキテクチャを示す。
【0026】
【
図7A】一実装例による、障害予測用の特徴(又は主な要因)を決定するための一例を示す。
【0027】
【
図7B】一実装例による、同じ資産(asset)及び障害モードを有するアラートがある場合のフローダイアグラムの一例を示す。
【0028】
【
図7C】一実装例による、同じ資産(asset)及び障害モードを有するアラートがない場合のフローダイアグラムの一例を示す。
【0029】
【
図8】一実装例による、接続されたセンサ及び管理装置を有する複数のシステムを含むシステムを示す。
【0030】
【
図9】一部の実装例で使用するのに適したコンピュータデバイスの一例を有する計算環境の一例を示す。
【発明を実施するための形態】
【0031】
以下の詳細な説明は、図面の詳細及び本願の実装例を示す。図面間の冗長な要素の参照番号及び説明は明瞭にするために省いている。説明の全体を通して使用する用語は例として示し、限定的であることは意図しない。例えば「自動」という用語の使用は、本願の実装形態を実践する当業者の所望の実装形態に応じて、完全に自動の実装形態又は実装形態の一定の側面に対するユーザ若しくは管理者の制御を含む半自動の実装形態を含み得る。選択は、ユーザインタフェース又は他の入力手段によってユーザによって行われてもよく、又は所望のアルゴリズムによって実装され得る。本明細書に記載する実装例は単独で又は組み合わせで利用することができ、実装例の機能は所望の実装形態に応じて任意の手段によって実装され得る。
【0032】
従来技術の問題に対処するために、実装例は以下のような幾つかの技法を含む。
【0033】
教師あり学習技法を使って教師なし学習タスクを解決する:実装例は、教師なし学習タスクを解決するために、教師あり学習モデルで通常利用可能なモデルの評価、特徴の選択、及び説明可能なAIを自動化するための包括的な技法を含む。
【0034】
障害の検出:実装例は、異常検出モデルを使って障害を正確に、効率的に、及び効果的に検出するために手動プロセスを自動化し、教師あり学習技法(特徴の選択、モデルの選択、及び説明可能なAI)を適用して異常検出モデルを最適化し説明するために、導入された汎用フレームワーク及びソリューションアーキテクチャを活用する。
【0035】
障害の予測:実装例は、最適な特徴窓の中の信号/特徴を導出し、導出された特徴及び過去の障害の両方を使用することにより、要求された応答時間を与えられた最適な障害窓の中の稀な障害を予測するための技法を導入する。
【0036】
障害の予防:実装例は、予測された障害の根本原因を識別し、ドメイン知識を組み込むことによって障害の修復に関する推奨を自動化し、最適化されたデータ駆動型手法によってアラートを抑制するための技法を導入する。
【0037】
図1は、一実装例による、産業システム内の稀な障害を検出し、予測し、予防するためのソリューションアーキテクチャを示す。
【0038】
センサデータ100:複数のセンサからの時系列データが収集され、時系列データは、このソリューションにおける入力となる。時系列データはラベルなしであり、センサデータにラベル付け又はタグ付けして各データポイントが障害に対応するかどうかを示すために手動プロセスが必要ないことを意味する。
【0039】
障害検出110は、入力センサデータに基づいて障害を検出するように構成される以下のコンポーネントを含む。特徴エンジニアリング111は、障害検出及び障害予測モデルを構築するために使用される特徴/信号を導出するために使用される。このコンポーネントは、センサの選択、特徴の抽出、及び特徴の選択という3つのサブコンポーネントを含む。障害検出112は、産業システム内の稀な障害を検出するために異常検出技法を利用するように構成される。検出された稀な障害は、障害予測モデルを構築するためのターゲットとして使用される。障害予測モデルを構築するための特徴を形成するために、検出された過去の稀な障害も使用される。
【0040】
障害予測120は、特徴及び検出された障害を用いて障害を予測するように構成される以下のコンポーネントを含む。特徴トランスフォーマ121は、特徴エンジニアリングモジュールからの特徴、及び、検出された障害を、長・短期記憶(LSTM)オートエンコーダ及びLSTM障害予測モジュールによって消費可能な形式に変換する。時系列データ内の冗長情報を除去するために、オートエンコーダ122を使用して、特徴エンジニアリングコンポーネント111からの導出された特徴、及び、検出された稀な障害を符号化する。符号化された特徴は時系列データ内の信号を保ち、障害予測モデルを構築するために使用される。障害予測モジュール123は、(特徴として)符号化された特徴、(ターゲットとして)オリジナルの特徴、及び(ターゲットとして)検出された障害を有する障害予測モデルを構築するために使用されるLSTMネットワークアーキテクチャを有する深層再帰型ニューラルネットワーク(RNN)モデルを含む。予測された障害124は、障害になる尤度を示すためのスコアとして表される障害予測モジュール123の1つの出力である。予測された特徴125は、特徴エンジニアリングモジュール111の出力と同じ形式を有する1組の特徴である障害予測モジュール123の別の出力である。検出された障害126は、予測された特徴125に障害検出モデルを適用し、検出された障害スコアを生成することによる出力である。アンサンブル障害127は、予測された障害124と検出された障害126の出力をアンサンブルして、単一の障害スコアを形成する。様々なアンサンブル技法を使用することができる。例えば、予測された障害124と検出された障害126との平均値を単一の障害スコアとして使用することができる。
【0041】
障害の予防130は、根本原因を識別し、修復に関する推奨を自動化し、アラートを抑制するように構成される以下のコンポーネントを含む。予測された障害の根本原因を自動で突き止めるために根本原因の解析131が実行される。修復に関する推奨132は、ドメイン知識を組み込むことによって予測された障害に対する修復アクションを自動で生成するように構成される。実装例では、オペレータが障害の根本原因に基づいて障害を修復し又は回避することができるように、オペレータに通知するためのアラートが生成される。アラートの抑制133は、オペレータのアラート待ち行列があふれることを回避するためにアラートを抑制するように構成され、かかる抑制は自動化されたデータ駆動型最適化技法によって行われる。アラート134は本ソリューションの最終出力であり、予測された障害のスコア、根本原因、及び修復に関する推奨を含む。
【0042】
以下、ソリューションアーキテクチャ内の各コンポーネントを詳細に論じる。まず、教師あり学習技法を使用することにより教師なし学習タスクを解決するための汎用フレームワーク及びソリューションアーキテクチャを記載する。このフレームワークは全ソリューションの基礎を形成する。
【0043】
本明細書に記載の通り、教師あり学習技法を使用することにより教師なし学習タスクを解決するための汎用フレームワーク及びソリューションアーキテクチャを記載する。教師なし学習タスクは、データがターゲット又はラベル情報を含まないことを意味する。教師なし学習タスクは、クラスタ化、異常検出等を含み得る。教師あり学習技法は、ハイパーパラメータの最適化、特徴の選択、及び説明可能なAIによるモデルの選択を含む。
【0044】
図2は、一実装例によるモデル選択のためのワークフローの一例を示す。最良の教師なし学習モデルを選択するために教師あり学習のモデル選択技法を適用するためのソリューションアーキテクチャ、アンサンブルモデルがどのように機能するのか、及び最後にこのソリューションアーキテクチャの背後にある論拠を
図2に関して記載する。
【0045】
最初に、データセット及び教師なし学習の問題を与えられた際に、実装例は、与えられた問題及びデータセットのための最良の教師なし学習モデルを見つける。第1のステップは、与えられたデータセットから特徴を導出することであり、これは特徴エンジニアリングモジュール111によって行われる。
【0046】
次に、300で示すように、幾つかの教師なし学習モデルアルゴリズムが手動で選択され、モデルアルゴリズムごとの幾つかのパラメータセットも手動で選択される。モデルアルゴリズムとパラメータセットとの各組み合わせは、
図2に示すように特徴エンジニアリングステップから導出される特徴に対するモデルを構築するために使用される。しかし、教師なし学習タスクの性質により、モデルがどのように機能するのかを測定するために使用可能なグラウンドトルースファクトがない。クラスタリングモデル等の一部の教師なし学習モデルは、モデルの性能を測定するために使用可能なクラスタリングアルゴリズムに固有の幾らかのメトリクを有し得る。しかし、かかるメトリクは全ての教師なし学習モデルに適用するには十分汎用的ではない。
【0047】
実装例は、教師なし学習モデルの上に教師あり学習モデル301をスタックすることによりモデルがどのように機能するのかを評価するための汎用ソリューションを含む。それぞれの教師なし学習モデルについて、教師なしの結果を得るために、教師なし学習モデルが特徴又はデータポイントに適用される。かかる教師なしの結果は、クラスタリング問題に関して各データポイントがどのクラスタに属するのか、又は、異常検出問題に関してデータポイントが異常を示すかどうか等を含み得る。
【0048】
かかる結果及び特徴は教師ありアンサンブルモデルの入力となり、教師なし学習モデルからの特徴が教師あり学習モデルのための特徴として使用され、教師なし学習モデルからの結果が教師あり学習モデルのためのターゲットとして使用される。教師ありアンサンブルモデルは、ターゲット(教師なし学習モデルからの結果)と教師ありアンサンブルモデルからの予測された結果とを比較することによって評価され得る。かかる評価結果に基づき、どの教師ありアンサンブルモデルが最良の評価結果をもたらすことができるのかを識別することができる。
【0049】
次いで実装例は、どの教師なし学習モデルが最良の評価結果に対応するのかを識別し、302において最良モデルパラメータセットを有する最良の教師なし学習モデルとしてそれを得て、そのモデルを出力することができる。
【0050】
図3は、一実装例による教師あり学習モデルを訓練し、選択し、アンサンブルするための、教師あり学習モデルをアンサンブルするためのソリューションアーキテクチャの一実装例を示す。
図2の各「アンサンブルモデルxx」が
図3によって表される。
【0051】
最初に、この実装例はモデルを訓練する。幾つかの教師あり学習モデルアルゴリズムが手動で選択され、それぞれのモデルアルゴリズムのための幾つかのパラメータセットも手動で選択される。
【0052】
次に実装例は、ハイパーパラメータの最適化を有するモデルを選択する。グリッド探索、ランダム探索、ベイズの最適化、進化的最適化、及び強化学習を含む幾つかのハイパーパラメータ最適化技法を使用することができる。例示目的で、
図3に関してグリッド探索技法を記載する。それぞれのモデルアルゴリズムについて、プロセスは下記の通りである:
【0053】
a.パラメータセットごとに、特徴エンジニアリングからの特徴(複数)400及び教師なし学習モデルからの結果(複数)401に対して教師あり学習モデルが構築される。教師あり学習モデルは、予め定義された評価メトリクに対して評価され、評価スコアがこのモデルに関連付けられる。
【0054】
b.様々なパラメータセットを有するモデルからの評価スコアを比較することにより、現在の(current)モデルアルゴリズムについて最良のパラメータセットが選択される。
【0055】
c.各モデルアルゴリズムが、最良の評価結果を与えるパラメータセットに関連付けられる。
【0056】
次いで実装例はアンサンブルモデル402を形成する。全てのモデルアルゴリズムからのモデルをアンサンブルして最終的なアンサンブルモデル402を形成する。アンサンブルは、未知のデータに関する予測を行うための単一モデルへと複数の個々に訓練されたモデルを結合し又は集約するためのプロセスである。ベースモデルが多様であり独立していると仮定すれば、アンサンブル技法は予測の汎化誤差を減らすことを助ける。実装例では以下のように様々なアンサンブル技法を使用することができる:
【0057】
分類モデル:分類モデルをアンサンブルするために多数決技法を使用することができる。インスタンスごとに現在の(current)特徴セットに各モデルを適用し、予測クラスを得る。インスタンスの最終的な予測のために、最も頻繁に登場するクラスを使用する。
【0058】
回帰モデル:回帰モデルをアンサンブルするための幾つかの技法がある。
【0059】
回帰モデルに関する平均:インスタンスごとに現在の(current)特徴セットに各モデルを適用し、予測値を得る。次いで、様々なモデルからの予測値の平均を最終的な予測値として使用する。
【0060】
回帰モデルに関するトリミングされた平均:インスタンスごとに現在の(current)特徴セットに各モデルを適用し、予測値を得る。複数のモデルからの最も高い予測値及び最も低い予測値を除去し、残りの予測値の平均を計算する。最終的な予測値のためにトリミングされた平均値を使用する。
【0061】
回帰モデルに関する加重平均:インスタンスごとに現在の特徴セットに各モデルを適用し、予測値を得る。モデルの評価精度に基づいて予測値に重みを割り当てる。モデルの精度が高ければ高いほどモデルからの予測値に割り当てられる重みが多くなる。次いで加重予測値の平均を計算し、最終的な予測値のために加重平均値を使用する。重みの和が1に等しいように様々なモデルの重みを正規化する必要がある。
【0062】
教師なし学習モデルを評価するために、f
uが教師なし学習モデルアルゴリズムとパラメータセットとの組み合わせである教師なし学習モデルを表すと仮定されたい。例えば
図2では、1つのf
uが、教師なしモデル1とパラメータセット11との組み合わせであり得る。教師なし学習モデルf
uがどのように機能するのかを評価するために、実装例はモデルベースメトリク又はビジネスメトリクから生じ得る一部の予め定義されたメトリクに関してf
uからの結果が正しいかどうかを評価する。従来技術では、この評価は個々の事例を見てそれがビジネス知識に基づくモデルによって正しく処理されているかどうかを確認することによって通常手動で行われる。かかる手動のプロセスは時間がかかり、誤りが起きやすく、一貫性がなく、主観的である。
【0063】
実装例は教師なし学習モデルを効率的に、効果的に、及び客観的に評価することができるソリューションを含む。教師なし学習モデルf
uの評価は、f
uによって発見される特徴と結果との間の関係の評価へと変換することができる。このタスクのために、特徴エンジニアリングからの特徴400(
図3)を特徴Fとして、及び、教師なし学習モデルからの結果401をターゲットTとして使用することにより、1組の教師あり学習モデルをスタックして教師あり学習モデルを訓練する。1組の教師あり学習モデルに関して、性質的に異なる幾つかの教師あり学習モデルアルゴリズムが最初に手動で選択され、次いでそれぞれの教師あり学習モデルアルゴリズムについて幾つかのパラメータセットが選択される。モデルのアルゴリズムのレベルで、ハイパーパラメータ最適化技法がモデルアルゴリズムごとに最良のパラメータセットを決定することができる。
【0064】
fsをそれぞれの教師あり学習モデルアルゴリズムの最良モデルと仮定する。各fsは独立したエバリュエータと見なすことができ、fuのための評価スコアをもたらし、fuがF及びTから発見するのと同様の関係をfsが発見する場合は評価スコアが高くなり、さもなければスコアは低い。
【0065】
教師あり学習モデルfsごとに、教師なし学習モデルfuのための評価スコアとしてfsのモデル評価スコアを使用することができ、fsごとにターゲットTがfuによって計算される一方、予測値はfsによって計算される。ターゲットと予測値との間の近さとして計算されるfsの評価スコアは、教師なし学習モデルfu及び教師あり学習モデルfsによって発見されるFとTとの間の関係の類似性を測定するのに必須である。
【0066】
この時点で、教師なしモデルfuごとに幾つかの教師あり学習モデルfsが得られ、各fsはfuの評価スコアを与える。教師なし学習モデルfuがよいモデルかどうかを判定するために、スコアは集約され又はアンサンブルされる。
【0067】
fsの基礎を成すモデルアルゴリズムは多様であり互いに性質的に異なるので、それらは異なるスコアをfuに与え得る。次の2つの事例がある:
【0068】
fsの殆どがfuの高スコアをもたらす場合、FとTとの間の関係がfuによって上手く捕捉されており、fuがよいモデルだと見なされる。
【0069】
fsの殆どがfuの低スコアをもたらす場合、FとTとの間の関係がfuによって上手く捕捉されておらず、fuが悪いモデルだと見なされる。
【0070】
換言すれば、fuがFとTとの関係をよいと明らかにするとき且つそのときに限り、殆どのfsはfuが行うのと同様のやり方で関係を捕捉することができ、それらはfuに対するよいスコアをもたらし得る。それとは逆に、fuがFとTとの関係を悪いと明らかにする場合、殆どのfsはF及びTの基での関係を異なるように悪く捕捉し、fuが行うのと同様のやり方で関係を捕捉することができず、殆どのfsはfuの悪いスコアをもたらす。
【0071】
様々な教師なし学習モデルを比較するために、教師あり学習モデルfsが教師なし学習モデルfuに与える評価スコアに基づいて単一のスコアがfuごとに計算される。平均、トリミングされた平均、及び多数決等、評価スコアを集約するための幾つかのやり方がある。多数決では、実装例はSを上回るスコアをもたらす教師あり学習モデルの数をカウントする。但しSは予め定義されたの数である。平均では、実装例は教師あり学習モデルからの評価スコアの平均を計算する。トリミングされた平均では、実装例はK個の最高及び最低スコアを除去し、次いで平均を計算する。但しKは予め定義された数である。
【0072】
各教師なしモデルfuの評価スコアが得られると、最終的な教師なし学習モデルを選択することができる。最終的な教師なし学習モデルはグローバルベストモデルを利用することによって選択することができ、そこでは実装例はモデルアルゴリズム及びパラメータセットにわたって最良のスコアを有するモデルを選択し、それを最終的なモデルとして使用する。或いは最終的な教師なし学習モデルはローカルベストモデルを利用することによって選択することができ、そこでは実装例はモデルアルゴリズムごとに最良のスコアを有するモデルをまず選択し、次いでそれぞれがモデルアルゴリズムからのモデルをアンサンブルする。
【0073】
教師なし学習モデルでは、相関分析に基づく技法及び特徴の値のばらつきに基づく技法を含む、特徴を選択するための一部の基本的な特徴選択技法が従来技術の実装において入手可能である。しかし概して、教師なし学習モデルのモデル評価は入手できないので、教師なし学習モデルのための特徴を選択するために高度なモデルベースの特徴選択技法を適用することはできない。
【0074】
図2及び
図3に示すソリューションアーキテクチャの導入により、教師なし学習モデルを評価することができ、そのため教師なし学習モデルのための特徴を選択するためにモデルベースの特徴選択技法を適用することができる。
【0075】
特徴一式を与えられた際に、
図2及び
図3に示すように教師なしモデルを評価するためのソリューションアーキテクチャを活用することによって、どの特徴セットが最良の性能を提供可能か選択するために、教師あり学習において利用可能な前方(forward)特徴選択、後方(backward)特徴選択、及びハイブリッド特徴選択を利用することができる。
【0076】
教師なし学習モデルを説明するために、実装例は教師なしモデル上に教師ありモデルをスタックする。教師なし学習モデルの特徴は教師あり学習モデルの特徴として使用される。教師ありモデルのためのターゲットとして、教師なし学習モデルの結果が使用される。次いで実装例は、教師あり学習モデルの技法を使用して、予測を説明する。つまり、特徴の重要度の解析、根本原因の解析等を説明する。
【0077】
特徴の重要度はモデルのレベルで通常行われる。特徴の重要度は、教師あり学習タスク(即ち、回帰タスク及び分類タスク)内のターゲット変数を予測することにおいて、各入力特徴がどの程度有用であり関連性があるのかに基づいて、各入力特徴にスコアを割り当てる技法を指す。特徴の重要度のスコアを計算するための手法がある。例えば特徴の重要度のスコアの例は、統計的相関スコア、線形モデルの一部として計算される係数、決定木に基づくスコア、及びpermutation重要度スコアを含む。特徴の重要度はデータセットへの洞察を与えることができ、相対的な特徴の重要度のスコアはどの特徴がターゲットに最も関連し得るのかを強調し識別することができる。かかる洞察はモデルのための特徴の選択を助け、モデルを改善することができる。例えば、より重要でない特徴によって導入される雑音を回避するために、モデルを訓練するために上位F個の特徴だけが保たれる。
【0078】
他方で、根本原因の解析(RCA)はインスタンスのレベルで通常行われる。即ち、各予測が何らかの根本原因を有し得る。決定論的モデル及び確率論的モデルというRCAのモデルの2つの大まかな群がある。決定論的モデルは、知られている事実又は教師あり学習モデル内で表される推論における確実性だけを扱う。確率論的モデルは、教師あり学習モデル内のこの不確実性を扱うことができる。どちらのモデルも、根本原因を導出するために、ロジック、コンパイル済み、分類子、又はプロセスモデル技法を使用することができる。確率論的モデルでは、根本原因を導出するためにベイジアンネットワークを構築することもできる。根本原因が識別されると、その根本原因は、潜在的な問題及びリスクを修復し又は回避するための推奨を導出することを助け得る。
【0079】
例えば、データに基づいて特徴エンジニアリングモジュールから導出される特徴データに対する異常検出を行うために、「分離フォレスト」モデル等の教師なしモデルを利用することができる。異常検出の出力は、特徴データ内のインスタンスのための異常スコアである。回帰タスクを実行するために「決定木」モデル等の教師ありモデルを使用することができる。ここで、「決定木」モデルに関する特徴は「分離フォレスト」に関する特徴と同じであり、「決定木」モデルに関するターゲットは「分離フォレスト」モデルから出力される異常スコアである。決定木を説明するために、モデルのレベルで特徴の重要度を計算することができ、インスタンスのレベルで根本原因を識別することができる。
【0080】
モデルのレベルで特徴の重要度を計算するために、一実装形態はノードに到達する確率によって加重されるノードの不純度の減少を計算するものである。ノードの不純度はジニ指数として測定することができる。ノードに到達するサンプル数を総サンプル数で割ることによってノードの確率を計算することができる。特徴の重要度の値が高ければ高いほどその特徴はより重要である。
【0081】
インスタンスのレベルで予測の根本原因を見出すために、木の根から葉へと決定木をたどることができる。決定木内で各ノードは「sensor_1>0.5」等の条件に関連付けられる。ここで、sensor_1は特徴データ内の特徴である。木の根から決定木をたどる場合、かかる条件の一覧が得られる。例えば[「sensor_1>0.5」,「sensor_2<0.8」,「sensor_11>0.3」]。予測につながるかかる一連の条件により、ドメインの専門家は何が予測を引き起こし得るのかを推論することができる。
【0082】
与えられた教師なしモデルのための教師ありモデルを選択するために、1つの実装例は、関心のある教師なし学習モデルアルゴリズムと性質的に同様の教師あり学習モデルアルゴリズムを使用するものである。もう1つの実装例は、モデルの解釈又は説明がより容易であるように、教師あり学習モデルにより単純なモデルを使用するものである。
【0083】
図1で、障害検出110は、特徴エンジニアリング111及び障害検出112という2つのコンポーネントを含む。特徴エンジニアリング111は生の入力データを処理し、その後のモジュールに使用可能な特徴を準備する。特徴エンジニアリングモジュールには、センサの選択、特徴の抽出、及び特徴の選択という3つの主なタスクがある。センサの選択では、センサの全てが障害の検出に関連するわけではない。センサは、データ及び問題のドメイン知識に基づいて手動のプロセスによって選択できるが、かかる形態は時間がかかり、誤りが起きやすく、ドメインの専門家の専門知識に制約される。代わりに、上記で示したような特徴選択技法を適用することができる。各センサは特徴と見なすことができ、その後、センサを選択するために、上記の技法(前方(forward)選択、後方(backward)選択、ハイブリッド選択)を適用する。
【0084】
特徴を抽出するために、センサデータに対して幾つかの技法を実行して時系列データから特徴を抽出する。このプロセスにドメイン知識を組み込むことができる。
【0085】
技法の一例は、移動平均である。時系列データは或る時点から次の時点までに鋭く変化し得る。かかる変動は、モデルアルゴリズムが時系列データ内のパターンを学習することを困難にする。1つの技法は、その後のモデルによって時系列データが消費される前に時系列データを平滑化することである。時系列を平滑化することは、時系列データの移動平均を計算することによって行われる。単純移動平均(SMA)、指数平滑移動平均(EMA)、及び加重移動平均(WMA)を含む移動平均を計算する幾つかの手法が存在する。
【0086】
移動平均を使用する1つのリスクは、値を平滑化することによって実際の異常又は異常値が除去され得ることである。これを防ぐために、実装例は現在のデータポイントにより多くの重みを置くことができる。従って、実装例は加重移動平均(WMA)及び指数平滑移動平均(EMA)を使用することができる。具体的には、EMAは直近のデータポイントにより大きい重み及び有意性を置く移動平均であり、現在の時点よりも前の点に向けて重みが指数オーダで減少する。EMAは、ここでの移動平均計算タスクに使用するための優れた候補である。WMA及びEMAにおいてハイパーパラメータを調整して、後のモデルからの最良の評価結果を実現することができる。別の発見は、産業的な障害が通常短期間にわたって持続することであり、そのことは移動平均計算が異常及び異常値を除去するリスクを大幅に下げる。
【0087】
別の技法の例は、値の導出である。差分/導出技法は時系列のレベルの変化を除去することによって時系列の平均を安定化することを助け、従ってトレンド及び季節性をなくす(又は減らす)ことができる。結果の信号は、その特性が系列の観測時点に依存しない定常時系列である。通常、定常信号だけがモデリングに有用である。差分技法は値の変化が計算される一次差分/導出、値の変化の変化が計算される二次差分/導出とすることができる。実際には、時系列データを定常にするのに二次差分を超える必要はない。
【0088】
差分技法は、障害検出タスク内の時系列データに適用することができる。これは季節性及びトレンドの信号が障害検出タスクを通常助けないからであり、従ってそれらを除去して必要な定常信号だけを保持することが安全及び有益である。生のセンサデータに加えて、生のセンサデータに基づき、センサ値の変化(一次導出/差分)及びセンサ値の変化の変化(二次導出/差分)が特徴として計算される。それに加えて、ドメイン知識により、センサ値の変化は障害を検出するための強い信号を示す。
【0089】
特徴の選択は、障害検出及び予測モデルを構築するために使用される特徴のサブセットを選択するために適用可能な自動特徴選択技法を含む。特徴を選択するための上記の特徴選択技法を利用することができる。
【0090】
障害検出モジュール112は、特徴エンジニアリングモジュール111によって準備される特徴を入力として使用し、各データポイントにおける異常を検出するために異常検出を適用する。従来、結果を手動で見ることによって幾つかの異常検出モデルを試行し評価することができた。この方法は非常に時間がかかり、最良モデルを見つけられない場合がある。代わりに、実装例は本明細書に記載の技法を使用して、最良の障害検出モデルを自動で選択することができる。
図2の教師なしモデルxxは異常検出モデルであり、
図2の教師なし出力xxは異常スコアであり、
図3の教師ありモデルxxは回帰モデルである。かかるカスタマイズにより、最良の障害検出モデルを自動で選択するために本明細書に記載の技法を利用することができる。
【0091】
異常検出モデルの結果は、観測されるデータポイントが異常である尤度又は確率を示す異常スコアである。異常スコアは[0,1]の範囲内にあり、異常スコアが高ければ高いほど観測されるデータポイントが異常である尤度又は確率が上がる。
【0092】
現在の(current)センサ読取値を与えられた際に、障害予測120のタスクは将来起こり得る障害を予測することである。従来技術の手法はラベル付きセンサデータを想定し、障害を予測するために教師あり学習手法を使用する。しかし、かかる手法は幾つかの理由からあまり上手く機能しない。従来技術の手法は、特徴/証拠及び障害を収集するための最適な窓を決定することができない。従来技術の手法は、障害を予測可能な正しい信号を識別することができない。従来技術の手法は、限られた量の障害データからパターンを識別することができない。産業システムは通常は正常状態で実行され、障害は通常は稀な事象なので、限られた量の障害のパターンを捕捉することが困難であり、従ってかかる障害を予測することが難しい。従来技術の手法は、時間的順序における正常なケースと稀な障害事象との間の正しい関係を構築することができない。従来技術の手法は、稀な障害の経過のシーケンスパターンを捕捉することができない。
【0093】
以下の実装例は、最適な障害窓の中の限られた量の障害データ及び要求された応答時間を与えられた際の、最適な特徴窓の中の障害予測用の正しい信号を識別するための手法を紹介する。実装例は、正常なケースと稀な障害との間の正しい関係、及び、稀な障害の経過を効果的に構築する。
【0094】
特徴トランスフォーマモジュール121は、特徴エンジニアリングモジュール111からの特徴及び障害検出112からの検出された障害を或る形式に変換する。それにより、LSTMオートエンコーダ122及びLSTM障害予測モジュール123が、変換されたバージョンを使用して、障害に関する予測を行うことができる。
【0095】
図4は、一実装例による特徴及び障害を抽出するための特徴窓の一例を示す。後の障害予測モデルのための訓練データを準備するために、実装例は教師あり学習モデルによって必要とされる特徴及びターゲットの両方を準備する必要がある。
図4に示す特徴窓は特徴を取得するための時間窓であり、障害窓は障害予測モデルのためのターゲット(即ち、障害)を得る時間窓である。障害予測タスクでは、オペレータが潜在的な障害に応答するのに十分な時間を有することができるように、障害を前もって予測する必要がある。リードタイム窓は、現在時刻(「予測時刻」とも呼ぶ)と障害の開始時刻との間の時間窓である。この時間窓は「応答時間窓」とも呼ばれる。
【0096】
図4は、3つの窓の間の関係を示す。現在時刻において、特徴が特徴窓の中で収集される。また、障害が障害窓の中で収集される。特徴窓の終わりと障害窓の始まりとがリードタイム窓によって隔てられる。
【0097】
障害予測用の特徴を抽出するために、特徴窓の中の特徴は、特徴エンジニアリング111からの特徴及び障害検出112からの過去の障害という2つのソースから来る。特徴窓の中の各時点について、特徴エンジニアリング111からの特徴と障害検出112からの過去の障害との組み合わせがある。特徴窓の中の全ての時点において、これらの特徴及び過去の障害が全て特徴ベクトルへと連結される。
【0098】
障害予測用のターゲットを抽出するために、障害窓の中の障害は、特徴エンジニアリング111からの特徴及び障害検出112からの過去の障害という2つのソースから来る。障害窓の中の各時点について、特徴エンジニアリング111からの特徴と障害検出112からの過去の障害との組み合わせがある。障害窓の中の全ての時点において、全ての特徴及び過去の障害がターゲットベクトルへと連結される。
【0099】
LSTMシーケンス予測モデルは複数のシーケンスを同時に予測できることに留意されたい。このモデルでは、シーケンスの1つの種類が障害シーケンスであり、他方の種類のシーケンスが特徴シーケンスである。本明細書に記載の通り両方のシーケンスを利用することができる。
【0100】
図5は、一実装例による多層LSTMオートエンコーダを示す。時系列データ内の冗長情報を除去するために、オートエンコーダを使用して特徴エンジニアリングコンポーネント111からの導出された特徴及び障害検出コンポーネント112からの過去の障害を符号化する。符号化された特徴は時系列データ内の信号を保ち、障害予測モデルを構築するために使用される。
【0101】
オートエンコーダは多層ニューラルネットワークであり、
図5に見られるようにエンコーダ及びデコーダという2つのコンポーネントを有し得る。オートエンコーダのための以下の(following)ニューラルネットワークを訓練するために、実装例は、層E
1を、層D
L即ち符号化する必要がある特徴と、同じに設定する。次いで、隠れユニットの数が符号化された特徴のサイズになるまで、エンコーダの各層内の隠れユニットの数が減少する。次いで、ユニットの数がオリジナルの特徴のサイズになるまで、デコーダの各層内の隠れユニットの数が増加する。ニューラルネットワークが訓練されると、特徴を符号化するためにエンコーダコンポーネントが使用され得る。
【0102】
図6は、一実装例による障害予測123用の多層LSTMアーキテクチャを示す。特徴として符号化された(エンコードされた)特徴を有し、ターゲットとしてオリジナルの特徴及び検出された障害を有する、障害予測モデルを構築するために、LSTMネットワークアーキテクチャを有する深層再帰型ニューラルネットワーク(RNN)モデルが使用される。とりわけ
図6は、入力層が符号化された(エンコードされた)特徴を表し、出力層がオリジナルの特徴及び検出された障害を含み、隠れ層がデータに応じて複数の層であり得るLSTMモデルのためのネットワークアーキテクチャを示す。
【0103】
LSTMモデルは、幾つかの側面において障害予測に優れている。まず、センサからの導出された特徴及び検出された過去の障害の両方を組み込むことにより、LSTM障害予測モデルは、時間的順序における正常なケースと稀な障害事象との間の正しい関係を構築し、稀な障害の経過のシーケンスパターンを捕捉することができる。第2に、LSTMは、時系列データ内の2つの事象の関係を、たとえそれらの2つの事象が互いに相当離れていても捕捉するのが得意である。これは、時間に沿った勾配消失問題を解決するように設計される隠れユニットの固有の構造によって行われる。その結果、「リードタイム窓」によって生じる制約を上手く捕捉し解決することができる。第3に、LSTMモデルは幾つかの予測を同時に出力することができる。そのことは複数のシーケンス(特徴のシーケンス及び障害のシーケンスの両方)の予測を同時に可能にする。
【0104】
モデルの出力は、システム内の稀な障害によって引き起こされる問題を回避可能な連続障害スコアを含む。連続障害スコアをモデルのターゲットとすることにより、回帰モデルを構築することができる。さもなければ、正常のために2進値の0が使用され、障害のために1が使用される場合、データ内には非常に少ない「1」が存在することとなる。そのような不均衡なデータは、分類問題において障害のパターンを発見するために訓練するのが困難である。
【0105】
障害を直接予測するために、
図1に示すように、障害予測モジュール123の1つの出力は障害の尤度を示す障害スコアである。この障害スコアは、予測された障害124として与えられる。
【0106】
実装例は予測された特徴を最初に決定し、次いで障害を検出する。
図1に示すように、障害予測モジュール123の他方の出力は1組の予測された特徴125である。1組の予測された特徴125は、特徴エンジニアリングモジュール111の出力と同じ形式を有する。障害の尤度を示す障害スコアを生成するために、この1組の特徴に障害検出コンポーネントを適用することができる。この障害スコアが検出された障害126として与えられる。
【0107】
アンサンブル障害127は、単一の障害スコアを形成するために、予測された障害124と検出された障害126とをアンサンブルすることを含む。様々なアンサンブル技法を使用することができる。例えば、予測された障害124と検出された障害126との平均値を、単一の障害スコアとして使用することができる。他の選択肢は、所望の実装形態に応じて加重平均、最大値、又は最小値であり得る。
【0108】
実装例は障害を集約するようにも構成され得る。障害予測モデルは障害窓の中の複数の障害を予測することができるので、実装例は障害窓の中の障害を集約して、障害窓全体の単一の障害スコアを得ることができる。障害スコアは障害窓の中の全ての障害スコアの単純平均、指数平滑平均、加重平均、トリミングされた平均、最大値、又は最小値を得て、それを最終的な障害スコアとして使用することを含み得る。
【0109】
障害窓を使用する理由は、予測された障害スコアが或る時点から次の時点までに劇的に変化し得るからである。時間窓の中の複数の障害を予測し、それらを集約することは、予測スコアを平滑化することができる。それにより、異常値予測を防ぐことができる。
【0110】
ハイパーパラメータの最適化に関して、実装例はモデルのハイパーパラメータを最適化する。オートエンコーダ及びLSTM障害モデルでは、最適化しなければならない多くのハイパーパラメータがある。かかるハイパーパラメータは、これだけに限定されないが、隠れ層の数、各層内の隠れユニットの数、学習率、最適化方法、及びモメンタムレートを含む。幾つかのハイパーパラメータ最適化技法、つまりグリッド探索、ランダム探索、ベイズの最適化、進化的最適化、及び強化学習を、適用することができる。
【0111】
実装例は、窓のサイズを最適化するように構成することもできる。障害予測モデルでは、特徴窓、リードタイム窓、及び障害窓という3つの窓がある。これらの窓のサイズも最適化することができる。これらの窓のサイズを最適化するためにグリッド探索又はランダム探索を適用することができる。
【0112】
障害の予測後、実装例は131で障害の根本原因(複数可)を識別し、132で修復アクションを推奨することができる。次いで、障害が間もなく起きる可能性があることをオペレータに知らせるためにアラートが生成される。しかし、障害の閾値にもよるが、多過ぎる障害アラートが生成され、オペレータのジョブ待ち行列を溢れさせ、「アラート疲れ」問題を招く可能性がある。従って、133でアラートの生成を抑制することが有益になる。
【0113】
根本原因の解析131に関して、予測された障害ごとに、オペレータは、潜在的な障害を軽減し又は回避するよう行動できるように、何が障害を引き起こし得るのかを知る必要がある。予測の根本原因を識別することは、機械学習ドメイン内の予測を解釈することに対応し、かかるタスクのための幾つかの技法及びツールが存在する。例えば従来技術における説明可能なAIのパッケージは、予測を引き起こす重要な特徴を識別することを助け得る。重要な特徴は、予測に対するプラスの影響及び予測に対するマイナスの影響を有し得る。かかるパッケージは、上位P個のプラスの重要な特徴及び上位M個のマイナスの重要な特徴を出力し得る。かかるパッケージは、予測された障害の根本原因を識別するために利用することができる。
【0114】
図7Aは、一実装例による予測された障害に関する特徴(又は主な要因)を決定するための一例を示す。説明可能なAIがどのように機能するのかを示すために、実装例は
図7Aのフローを利用する。
図7Aのフローは、予測を引き起こす重要な特徴を発見するための単純な手法を紹介する。
【0115】
701で、このフローは予測(predictive)モデルから各特徴に関する特徴の重要度の重みを得る。702で、それぞれの予測についてこのフローは各特徴の値を得る。703で、このフローは各特徴の値と重みとを乗算し、予測に対する個々の寄与度を得る。704で、このフローは個々の寄与度をランク付けする。705で、このフローは重み、値、及び寄与度と共に各特徴を出力する。
【0116】
修復に関する推奨132の生成を自動化することに関し、各予測の根本原因が識別された後、潜在的な障害を回避するために、修復に関する推奨ステップが提供される。このステップは、複数の根本原因(又は複数の徴候)を障害モードに更にクラスタ化するためのドメイン知識を必要とし、障害モードに基づく。修復ステップは生成され、オペレータに推奨されることができる。
【0117】
根本原因を障害モードにクラスタ化し、障害モードごとに修復に関する推奨を生成するために、ビジネス規則を自動化することができる。ビジネス規則を活用することによって、障害を障害モードにクラスタ化又は分類することを助けるために、機械学習モデルを構築することもできる。
【0118】
アラートの抑制及び優先順位付け133に関して、予測された障害のためにアラートを生成することができる。アラートは(アラート時刻、資産(asset)、障害スコア、障害モード、修復に関する推奨、アラート表示フラグ)等の6つの要素を有するタプルとして表される。アラートは資産(asset)及び障害モードによって一意に識別される。各障害の処理コストに起因して、予測された障害の全てが、アラートをトリガし、オペレータに表示すべきというわけではない。「アラート表示フラグ」は、アラートを生成し顧客に表示すべきかどうかを示す。正しい時刻及び頻度でアラートを生成することは、障害を修復し、アラートの処理コストを制御するために極めて重要である。従って実装例は、アラートの量を制御し、「アラート疲れ」問題を解決するために、一部のアラートを抑制する。
【0119】
一部のアラートは緊急であり、他のものは緊急ではない場合がある。従ってオペレータを最初に緊急アラートに導くように、アラートを優先順位付けする必要がある。
【0120】
以下、データ駆動型手法並びにアラートを抑制し優先順位付けするための手法によって第1のアラートの生成を最適化するためのアルゴリズムを記載する。
【0121】
第1のアラートの生成を最適化するために、いつ第1のアラートを生成するかを制御するための以下の3つのパラメータがある:
・T:予測された障害スコアの閾値。予測された障害が閾値を上回る場合は、それが障害として予測され、さもなければ正常と予測される。
・N及びE:期間EのうちにN個の予測された障害が登場した後で、第1のアラートを生成する。
【0122】
これらの3つのパラメータを最適化するために、以下に記載の通り、T、N、及びEの最適値を見つけるために、下記のコスト重視型最適化アルゴリズムが用いられる。
【0123】
最適化問題を公式化するために、ターゲット関数及び制約を以下のように定める。
【0124】
コストを定義するために、誤った予測によって被るコストをCと仮定する。誤った予測は以下のものであり得る:
・偽陽性:実際の障害はないが、モデルが障害を予測する。各偽陽性インスタンスに関連するコストを「偽陽性コスト」と呼ぶ。
・偽陰性:実際の障害があるが、モデルが障害を予測しない。各偽陰性インスタンスに関連するコストを「偽陰性コスト」と呼ぶ。
【0125】
「偽陰性コスト」は「偽陽性コスト」よりも通常大きいが、それは「偽陰性コスト」が「偽陽性コスト」よりもどの程度大きいのかを決定する問題に依存する。最適化問題を解くために、「偽陰性コスト」及び「偽陽性コスト」がドメイン知識から決定される。
【0126】
予測された障害の深刻度又は尤度を考慮するかどうかに応じて、最適化問題についてコスト関数を以下のように定めることができる:
・予測された障害の深刻度又は尤度を考慮しない
C=偽陽性インスタンスの数・偽陽性のコスト+偽陰性インスタンスの数・偽陰性のコスト
・予測された障害の深刻度又は尤度を考慮する
C=Σ(予測された障害スコア・偽陽性のコスト)+Σ((1ー予測された障害スコア)・偽陰性のコスト)
【0127】
コスト関数の定義に基づき、最適化問題を以下のように公式化することができる:
【0128】
ターゲット関数:Minimize(Cost)
【0129】
次を条件とする:0<T<=Tmax、0<N<=Nmax、0<E<=Emax、ここで、Tmax、Nmax、及びEmaxはドメイン知識に基づいて予め定められる。
【0130】
最適化問題を解決するために履歴データが利用される。T、N、及びEの様々なパラメータ値を与えられた際に、履歴データから、偽陽性インスタンス及び偽陰性インスタンスの数はカウントされることができる。このタスクに必要な履歴データは、予測された障害スコア及び確認された障害を含む。確認された障害は、通常、オペレータによる予測された障害の認定又は拒否から生じる。
【0131】
確認された障害がない場合、センサ値に障害検出コンポーネントを適用することによって、検出された障害を使用することができる。コストを計算する1つのやり方は次の通りである:T、N、及びEのそれぞれの組み合わせについて、偽陽性インスタンスの数及び陰性インスタンスの数をカウントし、次いでコストを計算する。目標は最小コストをもたらすT、N、及びEの組み合わせを見つけることである。この手法はグリッド探索とも呼ばれ、この手法では問題を最適化するのに時間がかかり得る。他の最適化手法が使用され得る。例えばこの問題を解決するために、ランダム探索又はベイズの最適化を適用することができる。
【0132】
アラートを抑制し優先順位付けするために、予測された障害を与えられた際に、2つの決定を下す必要がある。その決定とは、アラートを生成するかどうか及びアラートの緊急性である。以下、履歴データに基づいて発見される最適なT、N、Eが利用され、産業システム内で生成されるアラートを抑制し優先順位付けするためにアルゴリズムが実行される。
【0133】
実装例はアラートを記憶するための待ち行列Qを保持する。アラートはオペレータによって処理されてもよく、処理されたアラートには「認定された」、「拒否された」、又は「解決された」という3つの結果がある。又は、アラートはまだ処理されていなくてもよい(「未処理」)。「解決された」アラートはQから除去される。ビジネス規則に応じて、「拒否された」アラートはQ内に保たれてもQから除去されてもよい。
【0134】
各アラートは、6要素のタプルとして表すことができる。Q内では、資産(asset)及び障害モードの値が同じである複数のアラートが「アラートグループ」として一緒に集約される。タプル内の残りの要素に関して:
・「アラート時刻」は、各アラートグループの全てのアラート時刻を記憶するためのリストとして保持される。
・「障害スコア」は、各アラートグループの全ての障害スコアを記憶するためのリストとして保持される。
・「修復に関する推奨」は「資産(asset)」及び「障害モード」によって決定される。そのため、「修復に関する推奨」はアラートグループごとに単一値を有する。
・「アラート表示フラグ」は、各アラートグループの全てのアラート表示フラグを記憶するためのリストとして保持される。
【0135】
アラートはその緊急性によって降順に順序付けることができる。アラートの緊急性は幾つかのレベル、つまり低、中、高で表すことができる。緊急性は「資産(asset)」及び「障害モード」のレベルにあるので、緊急性のレベルはアラートグループごとに単一値として保持される。
【0136】
所望の実装形態に応じて、資産(asset)の重要度、集約された障害スコア、障害モード、修復の時間及びコスト、アラートが生成される合計回数、アラートが生成される回数を第1のアラート及び最後のアラートによる期間で割った値等、各アラートグループの緊急性のレベルを決定するために幾つかの要素を使用することができる。
【0137】
これらの要素を使用することにより、ドメイン知識に基づいてアラートグループの緊急性のレベルを決定するための規則ベースアルゴリズムを設計することができる。代えて、一部の既存のアラートグループの緊急性のレベルが分かると、緊急性のレベルを予測するための教師あり学習分類モデルを構築することができる。ここで、特徴は上記で挙げた全ての要素を含み、ターゲットは緊急性のレベルである。待ち行列の中のアラートグループは緊急性のレベルによって順序付けられ、各アラートグループ内のアラートはアラートの第1のアラート時刻によって順序付けられる。
【0138】
新たな予測された障害がある場合、実装例はその障害スコア及び障害モードを得ることができる。次いで実装例はQ内で同じ資産(asset)及び障害モードを有するアラートがあるかどうかを確認する。
【0139】
図7Bは、一実装例による、同じ資産(asset)及び障害モードを有するアラートグループがある場合のフローダイアグラムの一例を示す。711で、このフローはQ内のアラートグループのアラート時刻リストにアラートのアラート時刻を付加する。712で、このフローはQ内のアラートグループの障害スコアリストにアラートの障害スコアを付加する。713で、このフローはQ内のアラートグループのアラート表示フラグリストにアラートのアラート表示フラグを付加する。714で、このフローはアラートグループの緊急性のレベルを再計算及び更新し、Q内のアラートグループの順序を設定し直す。715で、このフローはアラートが既に生成されているかどうかに応じてアラートを抑制する。実装例は「アラート表示フラグ」を確認することによってアラートが生成されているかどうかを知る。
【0140】
716で、アラートがまだ生成されていない場合、このフローは、Eの期間内にN個を上回る数のアラートが出現するか否かを確認する(N及びEは上記のように決定される)。答えがはいの場合はアラートを生成し、さもなければアラートを生成しない。717で、アラートが既に生成されている場合、このフローは、最後のアラートのトリガ時刻と現在時刻との間の期間が、予め定義されたアラート表示時間窓を上回るかどうかを確認する。上回る場合、このフローはアラートをトリガする。このフローは最後のアラートのトリガ時刻を現在時刻に設定する。さもなければアラートを生成しない。予め定義されたアラート表示時間窓は、ドメイン知識に基づいてオペレータによって設定されるパラメータである。
【0141】
図7Cは、一実装例による、同じ資産(asset)及び障害モードを有するアラートグループがない場合のフローダイアグラムの一例を示す。721で、このフローは、アラートグループエントリ(つまり、アラート時刻リスト、資産(asset)、障害スコアリスト、障害モード、修復に関する推奨、アラート表示フラグリスト、緊急性のレベル)を作成する。ここで、緊急性のレベルはデフォルトで「低」である。722で、このフローはQ内のアラートグループのアラート時刻リストにアラートのアラート時刻を付加する。723で、このフローはQ内のアラートグループの障害スコアリストにアラートの障害スコアを付加する。724で、このフローはQ内のアラートグループのアラート表示フラグリストにアラートのアラート表示フラグを付加する。725で、このフローはアラートグループの緊急性のレベルを計算及び更新し、Q内の緊急性のレベルに基づいてアラートグループの順序を設定し直す。
【0142】
Q内のアラートが失効する場合、即ちアラートが如何なる更新もなしに予め定義された失効期間よりも長くアラートグループ内に存在する場合、そのアラートはアラートグループから除去される。1つのアラートグループに関してアラートが存在しない場合、その1つのアラートグループ全体がQから除去される。予め定義された失効期間は、ドメイン知識に基づいてオペレータによって設定されるパラメータである。
【0143】
本明細書に記載の実装例は、終端間(end-toーend)ソリューション等の様々なシステムに適用することができる。産業障害のためのソリューションスイートとして障害の検出された障害の予測、及び障害の予防を提供することができる。この終端間(end-toーend)ソリューションは、ソリューションコア製品の一部としての解析ソリューションコアスイートとして提供され得る。障害の検出は、ソリューションコア製品の一部としての解析ソリューションコアとして提供され得る。障害の検出は、データに自動でラベル付けするためのソリューションコアとしても提供され得る。障害の予測は、ソリューションコア製品の一部としての解析ソリューションコアとして提供され得る。アラートの抑制は、ソリューションコア製品の一部としての解析ソリューションコアとして提供され得る。根本原因の識別及び修復に関する推奨は、ソリューションコア製品の一部としての解析ソリューションコアとして提供され得る。
【0144】
同様に、実装例は独立型の(standalone)機械学習ライブラリを含み得る。教師あり学習技法を使って教師なし学習タスクを解決するためのフレームワーク及びソリューションアーキテクチャは、教師なし学習タスクを解決するのを助ける独立型の(standalone)機械学習ライブラリとして提供され得る。
【0145】
図8は、一実装例に従った、接続されたセンサ及び管理装置を有する複数のシステムを含むシステムを示す。接続されたセンサを有する1つ又は複数のシステム801-1、801-2、801-3、及び801-4は、ネットワーク800に通信可能に結合される。ネットワーク800は管理装置802に接続される。管理装置802は、モノのインターネット(IoT)ゲートウェイ又は他の製造管理システムのための機能を促進する。管理装置802は、データベース803を管理する。データベース803は、システム801-1、801-2、801-3、及び801-4のセンサから収集される履歴データを含む。履歴データは、システム801-1、801-2、801-3、及び801-4から受信されるラベル付きデータ及びラベルなしデータを含み得る。代替的な実装例では、システム801-1、801-2、801-3、801-4のセンサからのデータは、企業資源計画システム等のデータを取り込む独自(proprietary)データベース等の中央リポジトリ又は中央データベースに記憶することができる。管理装置802は、中央リポジトリ又は中央データベースからのデータにアクセスすることができ又はかかるデータを取得することができる。かかるシステムは、所望の実装形態に応じて、センサを有するロボットアーム、センサを有するタービン、センサを有する旋盤等を含み得る。
【0146】
図9は、
図8に示す管理装置802等、一部の実装例で使用するのに適したコンピュータデバイスの一例を有する計算環境の一例を示す。
【0147】
計算環境900内のコンピュータデバイス905は、1つ又は複数の処理ユニット、コア、又はプロセッサ910、メモリ915(例えばRAM、ROM等)、内部ストレージ920(例えば磁気、光学、ソリッドステートストレージ、及び/又は有機)、及び/又はI/Oインタフェース925を含むことができる。これらの何れも、情報を伝達するために通信メカニズム又はバス930に結合することができ、又は、コンピュータデバイス905に埋め込まれ得る。I/Oインタフェース925は、所望の実装形態に応じて、カメラから画像を受信するように、又は、プロジェクタ若しくはディスプレイに画像を提供するようにも構成される。
【0148】
コンピュータデバイス905は、入力/ユーザインタフェース935及び出力装置/インタフェース940に通信可能に結合され得る。入力/ユーザインタフェース935及び出力装置/インタフェース940の何れか又は両方が、有線インタフェース又は無線インタフェースでもよく、取り外し可能であり得る。入力/ユーザインタフェース935は、入力を行うために使用可能な、物理的な又は仮想的な、任意のデバイス、コンポーネント、センサ、又はインタフェースを含み得る(例えばボタン、タッチスクリーンインタフェース、キーボード、ポインティング/カーソル制御、マイクロホン、カメラ、ブライユ点字、モーションセンサ、光学読取り装置等)。出力装置/インタフェース940は、ディスプレイ、テレビ、モニタ、プリンタ、スピーカ、ブライユ点字等を含み得る。一部の実装例では、入力/ユーザインタフェース935及び出力装置/インタフェース940がコンピュータデバイス905に埋め込まれてもよく、又はコンピュータデバイス905に物理的に結合され得る。他の実装例では、他のコンピュータデバイスが、コンピュータデバイス905のための入力/ユーザインタフェース935及び出力装置/インタフェース940として機能することができ、又はそれらの機能を提供することができる。
【0149】
コンピュータデバイス905の例は、これだけに限定されないが、高移動性のデバイス(例えばスマートフォン、車両及び他の機械内のデバイス、人間及び動物が運ぶデバイス等)、モバイルデバイス(例えばタブレット、ノートブック、ラップトップ、パーソナルコンピュータ、携帯型テレビ、ラジオ等)、及び移動性に関して設計されていないデバイス(例えばデスクトップコンピュータ、他のコンピュータ、情報キオスク、1つ又は複数のプロセッサが埋め込まれた及び/又は結合されたテレビ、ラジオ等)を含み得る。
【0150】
コンピュータデバイス905は、外部ストレージ945及びネットワーク950に(例えばI/Oインタフェース925を介して)通信可能に結合され得る。ネットワーク950は、同じ構成又は異なる構成(configuration)の1つ又は複数のコンピュータ装置を含む、任意の数のネットワーク化されたコンポーネント、デバイス、及び、システムと通信するためのものである。コンピュータデバイス905又は接続された任意のコンピュータデバイスは、サーバ、クライアント、シンサーバ、汎用マシン、専用マシン、又は別のラベルとして機能することができ、そのサービスを提供することができ、又はそのように言及され得る。
【0151】
I/Oインタフェース925は、これだけに限定されないが、計算環境900内の少なくとも全ての接続されたコンポーネント、デバイス、及びネットワークとの間で情報をやり取りするために、任意の通信プロトコル若しくは規格又はI/Oプロトコル若しくは規格(例えばイーサネット、802.11x、ユニバーサルシステムバス、WiMax、モデム、セルラネットワークプロトコル等)を使用する有線及び/又は無線インタフェースを含み得る。ネットワーク950は、任意のネットワーク又はネットワークの組み合わせ(例えばインターネット、ローカルエリアネットワーク、広域ネットワーク、電話網、セルラネットワーク、衛星ネットワーク等)とすることができる。
【0152】
コンピュータデバイス905は、一時的媒体及び非一時的媒体を含む、コンピュータ使用可能媒体又はコンピュータ可読媒体を使用する及び/又はそれらを使用して通信することができる。一時的媒体は、伝送媒体(例えば金属ケーブル、光ファイバ)、信号、搬送波等を含む。非一時的媒体は、磁気媒体(例えばディスク及びテープ)、光学媒体(例えばCD ROM、デジタルビデオディスク、ブルーレイディスク)、ソリッドステート媒体(例えばRAM、ROM、フラッシュメモリ、ソリッドステートストレージ)、及び他の不揮発性ストレージ又はメモリを含む。
【0153】
計算環境の一部の例では、コンピュータデバイス905を使用して技法、方法、アプリケーション、プロセス、又はコンピュータ実行可能命令を実装することができる。コンピュータ実行可能命令は、一時的媒体から取得し、非一時的媒体上に記憶しそこから取得することができる。実行可能命令は、任意のプログラミング言語、スクリプト言語、及び機械言語(例えばC、C++、C#、Java(登録商標)、Visual Basic(登録商標)、Python(登録商標)、Perl、JavaScript(登録商標)等)の1つ又は複数に由来し得る。
【0154】
プロセッサ910は、ネイティブ環境又は仮想環境内で任意のオペレーティングシステム(OS)(不図示)の下で実行可能である。1つ又は複数のアプリケーションを導入することができる。ここで、論理ユニット960、アプリケーションプログラミングインタフェース(API)ユニット965、入力ユニット970、出力ユニット975、並びに、ユニット間通信メカニズム995を含む。ユニット間通信メカニズム995は、様々なユニットが互いに通信するためのものであり、ユニットがOSと通信するためのものであり、及び、ユニットが他のアプリケーション(不図示)と通信するためのものである。記載されたユニット及び要素は、設計、機能、構成、又は実装の点で変更することができ、行った説明に限定されない。
【0155】
一部の実装例では、情報又は実行命令がAPIユニット965によって受信されると、それが1つ又は複数の他のユニット(例えば論理ユニット960、入力ユニット970、出力ユニット975)に伝達され得る。上記の一部の実装例において、一部の例では論理ユニット960がユニット間の情報フローを制御し、APIユニット965、入力ユニット970、出力ユニット975によって提供されるサービスを指示するように構成され得る。例えば1つ又は複数のプロセス又は実装形態のフローが、論理ユニット960によって単独で又はAPIユニット965と組み合わせて制御され得る。入力ユニット970は実装例の中で説明した計算のための入力を得るように構成することができ、出力ユニット975は実装例の中で説明した計算に基づいて出力を与えるように構成され得る。
【0156】
プロセッサ(複数可)910は、
図1の100及び111に示すように複数の特徴を生成するためにラベルなしセンサデータに対して特徴抽出を実行すること、
図1の112に示すように障害検出ラベルを生成するために障害検出モデルを用いて複数の特徴を処理することによって障害の検出を実行することであって、障害検出モデルは
図2及び
図3に示すように教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用する機械学習フレームワークから生成される、実行すること、並びに、
図1の123~125に示すように障害予測及び特徴のシーケンスを生成するために、障害予測モデルに、抽出された特徴及び障害検出ラベルを与えることを行うように構成され得る。
【0157】
プロセッサ(複数可)910は、
図2及び
図3に示すように、特徴に基づいて教師なし機械学習モデルを生成するために教師なし機械学習を実行すること、教師ありアンサンブル機械学習モデルを生成するために教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、教師ありアンサンブル機械学習モデルのそれぞれは教師なし機械学習モデルのそれぞれに対応する、実行すること、及び、教師ありアンサンブル機械学習モデルによって生成される予測に対する教師なし機械学習モデルの結果を評価することに基づいて教師なし機械学習モデルの或るものを障害検出モデルとして選択することにより、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用することから障害検出モデルを生成するように構成され得る。
【0158】
プロセッサ(複数可)910は、
図4及び
図5に示すように、過去のセンサデータから最適化された特徴窓からの特徴を抽出すること、過去のセンサデータからの障害に基づいて最適化された障害窓及びリードタイム窓を決定すること、長・短期記憶(LSTM)オートエンコーダを用いて特徴を符号化すること、障害窓の中の障害を導出するために特徴窓からの特徴シーケンス内のパターンを学習するように構成されるLSTMシーケンス予測モデルを訓練すること、LSTMシーケンス予測モデルを障害予測モデルとして提供すること、及び、障害検出モデルからの検出された障害からの障害と、障害予測モデルからの予測された障害をアンサンブルすることであって、障害予測は検出された障害及び予測された障害からのアンサンブル障害である、アンサンブルすることを含む、障害予測モデルを生成するように構成され得る。
【0159】
プロセッサ(複数可)910は、
図1の130に示すように、障害の根本原因を決定しアラートを抑制するための障害予防プロセスを提供し実行するように構成することができる。ここで、障害予防プロセスは、
図1の130~134に示すように及び
図7B及び
図7Cに示すように、アンサンブル障害の根本原因を識別し、アンサンブル障害に対処するための修復に関する推奨を自動化すること、アンサンブル障害からアラートを生成すること、緊急性のレベルに基づいてアラートの或るものを抑制するためにコスト重視型最適化技法を用いてアラート抑制プロセスを実行すること、及び、複数のシステムの1人又は複数のオペレータにアラートの残りを提供することによって、障害の根本原因を決定しアラートを抑制する。
【0160】
プロセッサ(複数可)910は、修復に関する推奨に基づいて複数のシステムのうちの1つ又は複数を制御するためのプロセスを実行するように構成され得る。一例として、プロセッサ(複数可)910は、予測された障害及び障害を修復するための推奨に基づいてシャットダウンする、リブートする、システムに関連する様々な行灯(andon lights)をトリガする等のために複数のシステムのうちの1つ又は複数を制御するように構成され得る。かかる実装形態は、基礎を成すシステムに基づいて及び所望の実装形態に応じて修正することができる。
【0161】
プロセッサ(複数可)910は、
図2、
図3、及び
図7Aに示すように、複数の特徴を生成するためにラベルなしデータに対して特徴抽出を実行すること、及び、教師なし機械学習から生成される教師なし機械学習モデルに対して教師あり機械学習を適用することによって、教師なし学習タスクを教師あり学習タスクに変換する機械学習フレームワークを実行するように構成することができる。ここで、機械学習フレームワークを実行することは、特徴に基づいて教師なし機械学習モデルを生成するために教師なし機械学習を実行すること、教師ありアンサンブル機械学習モデルを生成するために、教師なし機械学習モデルのそれぞれの結果に対して教師あり機械学習を実行することであって、教師ありアンサンブル機械学習モデルのそれぞれは教師なし機械学習モデルのそれぞれに対応する、実行すること、教師ありアンサンブル機械学習モデルによって生成される予測に対する教師なし機械学習モデルの結果を評価することに基づいて教師なし機械学習モデルの或るものを選択すること、教師なし学習モデルの評価結果に基づいて特徴を選択すること、及び、説明可能な人工知能(AI)を促進するために、教師なし学習モデルの選択されたものを教師あり学習モデルに変換することを行うように構成され得る。教師なし学習はモデルを説明するための技法を通常有さない。説明可能なAIが教師なし学習モデルを説明することを促進するために、実装例は、教師なし学習モデルの選択されたものを教師あり学習モデルに変換し、それにより、教師なし学習モデルの特徴が教師あり学習モデルの特徴として使用される。教師なし学習モデルの結果は教師ありモデルのためのターゲットとして使用される。次いで実装例は、所望の実装形態に応じて、
図7Aに示す特徴の重要度の解析、根本原因の解析131等、教師あり学習モデルの技法を使用して予測を説明して説明可能なAIを促進する。
【0162】
詳細な説明の一部はコンピュータ内の操作のアルゴリズム及び記号表現に関して提示した。これらのアルゴリズム的記述及び記号表現は、その革新の本質を他の当業者に伝えるためにデータ処理技術の当業者によって使用される手段である。アルゴリズムは、所望の終了状態又は結果をもたらす一連の定義済みのステップである。一実装例では、実行されるステップが具体的な結果を実現するために有形量の物理的操作を必要とする。
【0163】
別段の定めがない限り、解説から明らかなように説明の全体を通して「処理」、「コンピューティング」、「計算」、「決定」、「表示」等の用語を利用する解説は、コンピュータシステムのレジスタ及びメモリ内で物理(電子)量として表されるデータを操作し、コンピュータシステムのメモリ若しくはレジスタ、又は他の情報ストレージ、伝送若しくは表示デバイス内で物理量として同様に表される他のデータに変換するコンピュータシステム又は他の情報処理デバイスのアクション及びプロセスを含み得ることが理解されよう。
【0164】
実装例は、本明細書の操作を行うための装置にも関係し得る。この装置は、要求された目的のために特別に構築することができ、又は1つ若しくは複数のコンピュータプログラムによって選択的に活性化され又は再構成される1つ又は複数の汎用コンピュータを含み得る。かかるコンピュータプログラムは、コンピュータ可読記憶媒体又はコンピュータ可読信号媒体等のコンピュータ可読媒体の中に記憶され得る。コンピュータ可読記憶媒体は、これだけに限定されないが光ディスク、磁気ディスク、読取専用メモリ、ランダムアクセスメモリ、ソリッドステートデバイス及びドライブ等の有形媒体、又は、電子情報を記憶するのに適した他の任意の種類の有形媒体若しくは非一時的媒体を含み得る。コンピュータ可読信号媒体は搬送波等の媒体を含み得る。本明細書で提示したアルゴリズム及び表示は、或る特定のコンピュータ又は他の装置に固有に関係するものではない。コンピュータプログラムは所望の実装形態の操作を実行する命令を含む純粋なソフトウェア実装を含み得る。
【0165】
本明細書の例によるプログラム及びモジュールと共に様々な汎用システムが使用されてもよく、又は、所望の方法ステップを実行するためのより特化した装置を構築することが便利であることが証明され得る。加えて実装例は、或る特定のプログラミング言語に関して説明していない。本明細書に記載した実装例の技法を実装するために、様々なプログラミング言語を使用できることが理解されよう。プログラミング言語の命令は1つ又は複数の処理デバイス、例えば中央処理ユニット(CPU)、プロセッサ、又はコントローラによって実行され得る。
【0166】
当技術分野で知られているように、上述した操作はハードウェア、ソフトウェア、又はソフトウェアとハードウェアとの何らかの組み合わせによって行うことができる。実装例の様々な側面が回路及び論理デバイス(ハードウェア)を使用して実装できる。その一方で、機械可読媒体上に記憶される命令(ソフトウェア)を使用して他の側面が実装されてもよい。かかる命令は、プロセッサによって実行される場合、本願の実装形態を実行するための方法をプロセッサに実行させる。更に本願の一部の実装例はハードウェアのみで実行できるのに対し、他の実装例はソフトウェアのみで実行することができる。更に、記載した様々な機能は単一のユニット内で実行することができ、又は任意の数のやり方で幾つかのコンポーネントに分散させることができる。ソフトウェアによって実行される場合、方法はコンピュータ可読媒体上に記憶される命令に基づいて汎用コンピュータ等のプロセッサによって実行され得る。必要に応じて命令は圧縮形式及び/又は暗号化形式で媒体上に記憶することができる。
【0167】
更に、本明細書を検討すること及び本願の技法を実践することにより、本願の他の実装形態が当業者に明らかになる。記載した実装例の様々な側面及び/又はコンポーネントは、単独で又は任意の組み合わせで使用することができる。本明細書及び実装例は単に例として検討されることを意図し、本願の真の範囲及び趣旨は添付の特許請求の範囲によって示される。
【国際調査報告】