IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

7461440根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法
<>
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図1
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図2
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図3
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図4
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図5
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図6
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図7
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図8
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図9
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図10
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図11
  • -根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-26
(45)【発行日】2024-04-03
(54)【発明の名称】根本的原因分析を実行してプラントワイド操業での希少イベントの発生の予測モデルを構築するコンピュータシステムおよび方法
(51)【国際特許分類】
   G05B 23/02 20060101AFI20240327BHJP
   G06Q 50/04 20120101ALI20240327BHJP
【FI】
G05B23/02 302S
G05B23/02 T
G06Q50/04
【請求項の数】 20
(21)【出願番号】P 2022176105
(22)【出願日】2022-11-02
(62)【分割の表示】P 2019500349の分割
【原出願日】2017-07-06
(65)【公開番号】P2023017888
(43)【公開日】2023-02-07
【審査請求日】2022-11-02
(31)【優先権主張番号】62/359,527
(32)【優先日】2016-07-07
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】500204511
【氏名又は名称】アスペンテック・コーポレーション
【氏名又は名称原語表記】AspenTech Corporation
(74)【代理人】
【識別番号】100087941
【弁理士】
【氏名又は名称】杉本 修司
(74)【代理人】
【識別番号】100112829
【弁理士】
【氏名又は名称】堤 健郎
(74)【代理人】
【識別番号】100142608
【弁理士】
【氏名又は名称】小林 由佳
(74)【代理人】
【識別番号】100155963
【弁理士】
【氏名又は名称】金子 大輔
(74)【代理人】
【識別番号】100150566
【弁理士】
【氏名又は名称】谷口 洋樹
(72)【発明者】
【氏名】ノスコフ・ミハイル
(72)【発明者】
【氏名】ラオ・アショック
(72)【発明者】
【氏名】シャン・ビン
(72)【発明者】
【氏名】チャン・ミシェル
【審査官】松本 泰典
(56)【参考文献】
【文献】特開2015-148867(JP,A)
【文献】特開2010-122912(JP,A)
【文献】特開2012-99071(JP,A)
【文献】特開2016-99930(JP,A)
【文献】米国特許出願公開第2009/0083649(US,A1)
【文献】特開2014-92798(JP,A)
【文献】国際公開第2015/045091(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 23/02
G06Q 50/04
(57)【特許請求の範囲】
【請求項1】
コンピュータに実装され、産業プロセスに対して根本的原因分析を実行する方法であって、
前記産業プロセスにおける複数のセンサから、少なくとも1つのKPI(主要プロセス指標)イベントに関する、プラント全体の履歴時系列データを取得する取得過程と、
前記履歴時系列データにおける、KPIイベントが発生する可能性があることを示す前兆パターンであって、それぞれある時間幅に対応する前兆パターンを、前記少なくとも1つのKPIイベントの内容に基づいて特定する特定過程と、
特定された前記前兆パターンのうちの、対応する時間幅内でKPIイベント以前に頻繁に発生して且つ当該対応する時間幅外では稀にしか発生しない前兆パターンを選択する選択過程と、
前記履歴時系列データ及び選択された前記前兆パターンに基づく従属関係グラフを生成する従属関係グラフ生成過程であって、前記従属関係グラフはノードとエッジとを含み、前記ノードは、KPIイベントが発生する可能性があることを示す前兆パターンを表し、前記エッジは、前兆パターンの発生間の条件付き従属関係を表す、従属関係グラフ生成過程と、
前記従属関係グラフに基づき、各センサの信号表現であって前記履歴時系列データの離散時系列セットである信号表現を生成する信号表現生成過程と、
前記従属関係グラフ及び前記信号表現に基づき、時間幅のセットに対して前記KPIイベントが発生する確率を提供するように、確率ネットワークを生成及び訓練する過程であって、当該確率ネットワークは、有向非巡回グラフまたは双方向グラフとしてのベイジアンネットワークであって且つKPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられるように構成される、生成・訓練過程と、
を備える、方法。
【請求項2】
請求項1に記載の方法において、さらに、
前記少なくとも1つのKPIイベントとの関連性が低いセンサから取得される時系列データを除外することにより、前記時系列データを低減する過程、
を備える、方法。
【請求項3】
請求項2に記載の方法において、さらに、
センサが低い関連性のものであるか否かを判定する判定過程であって、
センサ挙動に基づいて制御ゾーンを生成する副過程、
前記時系列データの各時系列ごとに、イベントゾーンの実現値と制御ゾーンの実現値との関連性スコアを算出する副過程、および
センサに比較的低い関連性スコアが割り当てられた場合には、当該センサを低い関連性のものであると指定する副過程、
を含む、判定過程、
を備える、方法。
【請求項4】
請求項1に記載の方法において、前兆パターンを特定する前記特定過程が、同様の特性を有する前兆パターンをグループ化する副過程を含む、方法。
【請求項5】
請求項1に記載の方法において、前記従属関係グラフを生成する前記従属関係グラフ生成過程が、前兆が発生したか否かを判定するのに距離尺度を用いる、副過程を含む、方法。
【請求項6】
請求項1に記載の方法において、前記確率ネットワークが、ベイジアン有向非巡回グラフおよび連続時間ベイジアンネットワークグラフのうちの少なくとも1つである、方法。
【請求項7】
請求項1に記載の方法において、さらに、
前記前兆パターンに関連するセンサからのリアルタイム時系列データを取得する過程と、
取得した前記リアルタイム時系列データを、当該時系列データの信号表現を生成するように変換する変換過程と、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、特定のKPIイベントの確率を決定する決定過程と、
を備える、方法。
【請求項8】
請求項7に記載の方法において、特定のKPIイベントの確率を決定する前記決定過程が、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、時間幅の前記セットでの前記特定のKPIイベントの確率を決定する副過程、
時間幅の前記セットでの前記特定のKPIイベントの前記確率に基づく累積確率関数を算出する副過程、
時間幅の前記セットでの前記特定のKPIイベントの前記確率に基づく確率密度関数を算出する副過程、ならびに
前記累積確率関数及び前記確率密度関数に基づき、前記特定のKPIイベントの確率および前記特定のKPIイベントのリスクの集中度合を決定する副過程、
を含む、方法。
【請求項9】
産業プロセスに対して根本的原因分析を実行するシステムであって、
前記産業プロセスにおける複数のセンサと、
メモリと、
前記センサ及び前記メモリと通信する少なくとも1つのプロセッサと、
を備え、前記少なくとも1つのプロセッサが、
前記複数のセンサから、少なくとも1つのKPI(主要プロセス指標)イベントに関する、プラント全体の履歴時系列データを取得して前記メモリに記憶し、
前記履歴時系列データにおける、KPIイベントが発生する可能性があることを示す前兆パターンであって、それぞれある時間幅に対応する前兆パターンを、前記少なくとも1つのKPIイベントの内容に基づいて特定し、
特定された前記前兆パターンのうちの、対応する時間幅内でKPIイベント以前に頻繁に発生して且つ当該対応する時間幅外では稀にしか発生しない前兆パターンを選択し、
前記履歴時系列データ及び選択された前記前兆パターンに基づく従属関係グラフを前記メモリ内に生成し、
前記従属関係グラフに基づき、各センサの信号表現であって前記履歴時系列データの離散時系列セットである信号表現を前記メモリ内に生成し、
前記従属関係グラフ及び前記信号表現に基づき、時間幅のセットに対する確率ネットワークであって、KPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられるように構成される確率ネットワークを、前記KPIイベントが発生する確率を提供するように、前記メモリ内に生成して訓練するように構成されているシステムであって、前記確率ネットワークは有向非巡回グラフまたは双方向グラフとしてのベイジアンネットワークである、システム。
【請求項10】
請求項9に記載のシステムにおいて、前記プロセッサが、さらに、前記少なくとも1つのKPIイベントとの関連性が低いセンサから取得される時系列データを除外することにより、前記時系列データを低減するように構成されている、システム。
【請求項11】
請求項10に記載のシステムにおいて、前記プロセッサが、さらに、
センサ挙動に基づいて制御ゾーンを生成し、
前記時系列データの各時系列ごとに、イベントゾーンの実現値と制御ゾーンの実現値との関連性スコアを算出し、
センサに比較的低い関連性スコアが割り当てられた場合には、当該センサを低い関連性のものであると指定することにより、
センサが低い関連性のものであるか否かを判定するように構成されている、システム。
【請求項12】
請求項9に記載のシステムにおいて、前記プロセッサが、さらに、前記従属関係グラフの生成において、前兆が発生したか否かを判定するのに距離尺度を用いるように構成されている、システム。
【請求項13】
請求項9に記載のシステムにおいて、前記確率ネットワークが、ベイジアン有向非巡回グラフおよび連続時間ベイジアンネットワークグラフのうちの少なくとも1つである、システム。
【請求項14】
請求項9に記載のシステムにおいて、前記プロセッサが、さらに、
前記前兆パターンに関連するセンサからのリアルタイム時系列データを取得し、
取得した前記リアルタイム時系列データを、当該時系列データの信号表現を生成するように変換し、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、特定のKPIイベントの確率を決定する
ように構成されている、システム。
【請求項15】
請求項14に記載のシステムにおいて、前記プロセッサが、特定のKPIイベントの確率を、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、時間幅の前記セットでの前記特定のKPIイベントの確率を決定し、
時間幅の前記セットでの特定のKPIイベントの前記確率に基づく累積確率関数を算出し、
時間幅の前記セットでの特定のKPIイベントの前記確率に基づく確率密度関数を算出し、
前記累積確率関数及び確率密度関数に基づき、前記特定のKPIイベントの確率および前記特定のKPIイベントのリスクの集中度合を決定する
ことによって決定するように構成されている、システム。
【請求項16】
産業プロセスの根本的原因分析用のモデルであって、
KPI(主要プロセス指標)イベントが発生する可能性があることを示す前兆パターンを表すノードおよび前兆パターンの発生間の条件付き従属関係を表すエッジを含む、従属関係グラフと、
前記従属関係グラフに基づく確率ネットワークであって、前記KPIイベントが発生する確率を提供するように、前記産業プロセスの前記KPIイベントに関する時系列データが信号の形態で提示された離散データを用いて訓練された確率ネットワークと、
を備え、前記確率ネットワークは、有向非巡回グラフ又は双方向グラフとしてのベイジアンネットワークであり、KPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられるように構成される、モデル。
【請求項17】
請求項16に記載のモデルにおいて、前記確率ネットワークが、ベイジアン有向非巡回グラフおよび連続時間ベイジアンネットワークグラフのうちの少なくとも1つである、モデル。
【請求項18】
コンピュータに実装され、産業プロセスに対して根本的原因分析を実行するシステムであって、
産業プラント全体の履歴時系列データに基づいてKPI(主要プロセス指標)イベントの根本的原因分析を実行するように、かつ、リアルタイムデータに基づいてKPIイベントの発生を予測するように構成されたプロセッサエレメント、
を備え、前記プロセッサエレメントが、
KPIイベントの内容及び発生、複数のセンサの時系列データ、および前記産業プロセスにおいて対象のKPIイベントに繋がるダイナミクスが発現している間の遡り時間幅の指定を入力として受け取るデータ統合手段であって、イベントゾーンの実現値と制御ゾーンの実現値との間の関連性を表す関連性スコアを時系列ごとに算出し、低い関連性スコアの時系列を除外することにより、前記履歴時系列データの大規模なセットの低減を実行する、データ統合手段、
前記データ統合手段と通信し、高い関連性スコアの時系列を受け取るように構成された根本的原因アナライザであって、繰返し発生する前兆パターンを特定するために複数の長さに対する前兆パターン発見プロセスを用い、前記遡り時間幅において多く発生する前兆パターンを、各前兆パターンの観測値の最新のセットがあれば、前記産業プロセスにおける別個の時間幅でのイベントの確率を返すことができる確率グラフモデルの構築用に選択する、根本的原因アナライザ、ならびに
前記産業プロセスに対するオンラインインターフェースであって、当該オンラインインターフェースは、構築された前記確率グラフモデルを、どの前兆パターンがリアルタイムで監視されるべきかを指定するように配備し、配備された前記確率グラフモデルは、特定の前兆パターンに対する類似性を表す各前兆パターンの距離スコアに基づいて、対象のプラントイベントの実際の確率およびリスクの集中度合を返す、オンラインインターフェース、
を含む、システム。
【請求項19】
請求項18に記載のシステムにおいて、前記根本的原因アナライザが、さらに、
ベイジアンネットワークを提供する確率グラフモデル構築部を有し、当該ベイジアンネットワークの学習が、有向分離原理に基づくものであり、当該ベイジアンネットワークの訓練が、信号の形態で提示された離散データを用いるものであり、当該信号の表現は、各前兆パターンごとに、当該前兆パターンが観測されたか否かを示す、システム。
【請求項20】
請求項19に記載のシステムにおいて、前兆パターン観測値の決定が距離スコアに基づいて行われ、ベイジアンネットワークのセットが、累積密度関数及び確率密度関数を含む、時間幅の上限までの確率期間構造を確立するように訓練される、システム。
【発明の詳細な説明】
【関連出願】
【0001】
本願は、2016年7月7日付出願の米国仮特許出願第62/359,527号の利益を主張する。この仮特許出願の全教示内容は、参照をもって本明細書に取り入れたものとする。
【背景技術】
【0002】
プロセス産業では、プロセス制御やプロセス最適化での進歩以来、持続的なプラント操業及び保守が重要なタスクとなっている。資産最適化の一部としての持続的なプロセスパフォーマンスが、安全なプラント操業(プラント運転)および低い保守コストを長期にわたってもたらすことができる。操業上の目標を達成するために、主要プロセス指標(KPI)のセットが、オペレータの安全、製品の品質および効率的な製造プロセスを確実にするように綿密に監視される。KPIの動き(時系列)のトレンドは、数多くの見通しをもたらすことができ、不所望の事象を知らせるものとなり得る。ツールによって、プラント操業従事者が異常な/不所望の操業条件を早期に検出できれば、極めて有益となり得る。
【0003】
化学・プロセス工学産業では、プラント操業の安全性やコスト最適化がますます重要になり続けている。各種故障や事故は、操業再開コスト、環境浄化コスト、ならびに健康及び人命の損失の補償コストを招くことになる。やがて発生するマイナスなイベント(事故又は故障)を正確且つ適時に事前予測して、マイナスな結果を阻止するのを可能にすることがますます重要になっている。阻止のためには、(1)イベントの根本的原因を理解すること、(2)問題発現の実際のダイナミクスを明らかにすること、および(3)任意の所与の時間における問題確率の推定を行うことが重要である。
【0004】
これらの目的は、従来のアプローチでは満足に解決されない。(1)従来の第一原理モデルは、理想的な条件のセットに依拠して予測を開始する。事故はしばしば、実際の条件が特定のプラントの設計段階時に用いられた理想的な条件から外れることによって発生する。通常、上記条件のセットに対する任意の強烈な変更は、時間のかかる再計算に繋がるので、イベントが既に発生した後でしか結果が得られない可能性がある。(2)モンテカルロ法のような統計学的手法(例えば、主成分分析(PCA)及びANOVA)を用いたリスクシミュレーションも、観測される条件とは異なる可能性のある前提条件に依拠する。これらのシミュレーションは、特別な操業条件のセットに調整される必要がある。このような調整は、時間がかかり過ぎて、結果の提供が遅くなり過ぎる危険がある。これらの結果を説明するには、高度な統計学的・モデル化専門知識が求められる。(3)高度プロセス制御で広く用いられる経験モデル化は、小規模のユニットを考慮した局所的な作用を正確に推定するのに極めて効率的であることが証明されている。しかし、大規模な(例えば、プラントワイドの(プラント全体の))スケールでのこのような手法の適用は、プラントレベルのデータを予備処理する必要性(当該予備処理は、プラントでの実際の分布を踏まえるとあまりにも広範囲である)により、さらには、ニューラルネットの制限(マルチスケール、マルチ時間ホライズンのデータセットを取り扱いがない)により制限される。根本的原因分析に関する他のアプローチも存在するが、これらのアプローチはイベント駆動型分析に焦点を当てたものである。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本明細書で開示するシステム及び方法は、実際の時系列データに焦点を当てるので、上記の従来のアプローチとは完全に異なる。
【課題を解決するための手段】
【0006】
開示するシステム及び方法は、KPIで観測される最終的なイベントに繋がり得る前兆を手動で入力することを必要としない。代わりに、開示するシステム及び方法は、前兆イベントを抽出するための分析を実行した後、さらなる分析を実行する。時系列及び根本的原因発見に注目したアプローチは他にもあるが、これらのアプローチは、最も可能性の高い原因が相関係数の強さによって定まる相関ベースのアプローチである。これらの従来のアプローチは、誤相関のイベントを除外することができないだけでなく、原因から結果への方向を遡っていくことができない。開示するシステム及び方法は、単純な相関ではなく情報のフローに基づいて因果を徹底的に調査するという点で、それらの従来の手法とは異なる。本明細書で開示するシステム及び方法は、(1)根本的原因分析を実行するようにプラントワイドの履歴データを分析することで、イベントの前兆を見つけて、(2)前兆を因果に基づいて結合することにより、イベントダイナミクスを説明し、(3)前兆をオンライン領域で監視することが可能となるような、当該前兆の提示を行い、(4)条件付き確率を推定するようにモデルを訓練し、(5)前兆のリアルタイム観測値(オブザベーション)があれば、ある時間ホライズンでのイベントの確率を予測する。
【0007】
例示的な一実施形態は、産業プロセスに対して根本的原因分析を実行する、コンピュータに実装される方法である。例示的な当該方法では、前記産業プロセスにおける複数のセンサから、少なくとも1つのKPIイベントに関する、プラントワイドの履歴時系列データが取得される。KPIイベントが発生する可能性があることを示す前兆パターンが特定される。前兆パターンは、それぞれ、ある時間窓すなわち時間幅に対応する。対応する時間窓内でKPIイベント以前に頻繁に発生して且つ当該対応する時間窓外では稀にしか発生しない前兆パターンが選択される。前記時系列データ及び前兆パターンに基づく従属関係グラフが生成されて、当該従属関係グラフに基づき、各始点の信号表現が生成されて、当該従属関係グラフ及び当該信号表現に基づき、時間窓のセットに対して確率ネットワークが生成及び訓練される。当該確率ネットワークは、KPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられることができる。
【0008】
例示的な他の実施形態は、産業プロセスに対して根本的原因分析を実行するシステムである。例示的な当該システムは、前記産業プロセスにおける複数のセンサと、メモリと、当該センサ及び当該メモリと通信する少なくとも1つのプロセッサとを備える。当該少なくとも1つのプロセッサは、(i)前記複数のセンサから、少なくとも1つのKPIイベントに関する、プラントワイドの履歴時系列データを取得して前記メモリに記憶し、(ii)KPIイベントが発生する可能性があることを示す前兆パターンであって、それぞれある時間窓に対応する前兆パターンを特定し、(iii)対応する時間窓内でKPIイベント以前に頻繁に発生して且つ当該対応する時間窓外では稀にしか発生しない前兆パターンを選択し、(iv)前記時系列データ及び前兆パターンに基づく従属関係グラフを前記メモリ内に生成し、(v)前記従属関係グラフに基づき、各始点の信号表現を前記メモリ内に生成し、(vi)前記従属関係グラフ及び前記信号表現に基づき、時間窓のセットに対する確率ネットワークを前記メモリ内に生成して訓練するように構成されている。当該確率ネットワークは、KPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられることができる。
【0009】
数多くの実施形態において、前記確率ネットワークは、有向非巡回グラフ又は双方向グラフとしてのベイジアンネットワークであってもよい。前記従属関係グラフを生成することは、前兆が発生したか否かを判定するのに距離尺度を用いることを含んでもよい。一部の実施形態では、前記少なくとも1つのKPIイベントとの関連性が低いセンサから取得される時系列データを除外することにより、前記時系列データが低減され得る。センサが低い関連性のものであるか否かを判定することは、(i)センサ挙動に基づいて制御ゾーンを生成すること、(ii)前記時系列データの各時系列ごとに、イベントゾーンの実現値(リアリゼーション)と制御ゾーンの実現値との関連性スコアを算出すること、および(iii)センサに比較的低い関連性スコアが割り当てられた場合には、当該センサを低い関連性のものであると指定することを含むことができる。同様の特性を有する前兆パターンが、グループ化されることができる。
【0010】
前記確率ネットワークが生成された後、前記前兆パターン関連するセンサからのリアルタイム時系列データが取得可能である。当該リアルタイム時系列データは、当該時系列データの信号表現を生成するように変換可能である。そして、前記確率ネットワーク及び前記時系列データの当該信号表現に基づき、特定のKPIイベントの確率が決定可能である。一部の実施形態では、特定のKPIイベントの当該確率を決定することが、(i)前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、時間窓の前記セットでの前記特定のKPIイベントの確率を決定すること、(ii)時間窓の前記セットでの前記特定のKPIイベントの前記確率に基づく累積確率関数を算出すること、(iii)時間窓の前記セットでの前記特定のKPIイベントの前記確率に基づく確率密度関数を算出すること、ならびに(iv)前記累積確率関数及び確率密度関数に基づき、前記特定のKPIイベントの確率および前記特定のKPIイベントのリスクの集中度合を決定することを含むことができる。
【0011】
例示的な他の実施形態は、産業プロセスの根本的原因分析用のモデルである。当該モデルは、ノード及びエッジを含む従属関係グラフを備える。当該ノードは、KPIイベントが発生する可能性があることを示す前兆パターンを表し、当該エッジは、前兆パターンの発生間の条件付き従属関係を表す。前記モデルは、さらに、前記従属関係グラフに基づく、前記KPIイベントが発生する確率を提供するように訓練された確率ネットワークを備える。数多くの実施形態において、当該確率ネットワークは、有向非巡回グラフまたは双方向グラフである。
【0012】
例示的な他の実施形態は、コンピュータに実装され、産業プロセスに対して根本的原因分析を実行するシステムである。例示的な当該システムは、産業プラントワイドの履歴データに基づいてKPIイベントの根本的原因分析を実行するように、かつ、リアルタイムデータに基づいてKPIイベントの発生を予測するように構成されたプロセッサエレメントを備える。当該プロセッサエレメントは、データ統合手段、当該データ統合手段と通信する根本的原因アナライザ、および前記産業プロセスに対するオンラインインターフェースを含む。前記データ統合手段は、KPIイベントの内容及び発生、複数のセンサの時系列データ、および前記産業プロセスにおいて対象のKPIイベントに繋がるダイナミクスが発現している間の遡り時間窓の指定を入力として受け取る。前記データ統合手段は、データの大規模なセットの低減を実行して、各時系列ごとに関連性スコアを構築することができる。前記根本的原因アナライザは、高い関連性スコアの時系列を受け取り、繰返し発生する前兆パターンを特定するためにマルチ長さモチーフ発見プロセスを用い、前記遡り時間窓において多く発生する前兆パターンを、確率グラフモデルの構築用に選択する。構築される当該モデルは、各前兆パターンの観測値の最新のセットが与えられることにより(最新のセットがあれば)、前記産業プロセスにおける別個の時間ホライズンでのイベントの確率を返すことができる。前記オンラインインターフェースは、どの前兆パターンがリアルタイムで監視されるべきかを指定する。オンラインモデルは、各前兆パターンの距離スコアに基づいて、対象のプラントイベントの実際の確率およびリスクの集中度合を返す。
【0013】
一部の実施形態では、前記根本的原因アナライザが、ベイジアンネットワークを提供する確率グラフモデル構築部を有することができる。当該ベイジアンネットワークの学習は、有向分離原理に基づくものであってもよく、当該ベイジアンネットワークの訓練は、信号の形態で提示された離散データを用いて行われることができる。当該信号の表現は、各前兆パターンごとに、当該前兆パターンが観測されたか否かを示す。前兆パターン観測値の決定は距離スコアに基づいて行われることでき、ベイジアンネットワークのセットが、複数の時間ホライズンにわたって訓練されて確率の期間構造を確立することができる。当該期間構造は、累積密度関数および確率密度関数を含んでもよい。
【0014】
前述の内容は、添付の図面に示す、本発明の例示的な実施形態についての以下のより詳細な説明から明らかになる。異なる図をとおして、同一の参照符号は同一の構成/構成要素を指すものとする。図面は必ずしも縮尺どおりではなく、むしろ、本発明の実施形態を図示することに重点が置かれている。
【図面の簡単な説明】
【0015】
図1】例示的な実施形態のプラントプロセスのデータ収集・監視用の例示的なネットワーク環境を示すブロック図である。
図2】例示的な一実施形態において、産業プロセスに対して根本的原因分析を実行する様子を示すフロー図である。
図3】例示的な一実施形態において、産業プロセスに対して根本的原因分析を適用する様子を示すフロー図である。
図4】例示的な一実施形態において、産業プロセスに対して根本的原因分析を適用する様子を示す他のフロー図である。
図5】例示的な一実施形態において、産業プロセスに対して根本的原因分析を実行するシステムを示すブロック図である。
図6】例示的な一実施形態において、根本的原因モデルの構築の様子を示すフロー図である。
図7】複数の時系列及びKPIイベントの信号の表現を示す概略図であって、矩形信号は前兆パターンモチーフを表し、スパイク信号はKPIイベントを表す概略図である。
図8】例示的な一実施形態における、産業プロセスの根本的原因分析用のモデルを示す概略図である。
図9】例示的な一実施形態において、根本的原因モデルのオンライン配備の様子を示すフロー図である。
図10】例示的な実施形態により用いられる累積確率関数(CDF)及び確率密度関数(PDF)の例示的な出力を示すグラフである。
図11】本明細書に開示する例示的な実施形態が実装され得るコンピュータネットワーク環境の模式図である。
図12図11のネットワークの例示的なコンピュータノードを示すブロック図である。
【発明を実施するための形態】
【0016】
以下では、例示的な実施形態について説明する。
根本的原因分析を実行する新しい方法及びシステムについて記載する。この方法及びシステムは、この際、イベントダイナミクス(例えば、マイナスなイベントダイナミクス等)を説明し、リアルタイム監視用の前兆プロファイルを明らかにし、リアルタイムデータに基づいてイベントの発生の確率予測を行うモデルを構築する。当該方法及びシステムは、上流での(時間的に先に発現した)イベントと、下流センサデータ(「タグ」時系列)での(後で発生し、マイナスの可能性がある)結果的なイベントとの因果関係を確立する新規のアプローチを提供する。新しい当該方法及びシステムは、不所望のイベントを阻止するために、オンラインプロセス監視に早期の警告を提供することができる。
【0017】
[プラントプロセスのための例示的なネットワーク環境]
図1は、数多くの実施形態における、プラントプロセスを監視するための例示的なネットワーク環境100を示すブロック図である。システムコンピュータ101,102は、根本的原因アナライザとして動作してもよい。一部の実施形態では、システムコンピュータ101,102のそれぞれが単独で前記根本的原因アナライザとしてリアルタイムで動作してもよく、あるいは、コンピュータ101,102が単一の根本的原因アナライザとしてのリアルタイム処理に寄与する分散プロセッサとして協働で動作してもよい。他の実施形態では、追加のシステムコンピュータ112も、根本的原因アナライザとしての前記リアルタイム処理に寄与する分散プロセッサとして動作してもよい。
【0018】
システムコンピュータ101,102はデータサーバ103と通信して、ヒストリアンデータベース111から測定可能プロセス変数について収集されたデータにアクセスしてもよい。データサーバ103は、さらに、分散制御システム(DCS)104のような任意のプラント制御システムに通信可能に接続されてもよい。分散制御システム(DCS)104は、前記測定可能プロセス変数についてのデータを一定のサンプリング周期(例えば、1分あたり1個のサンプル等)で収集する計器109A~109I,106,107を具備するように構成されてもよい。106,107は、より長いサンプリング周期でデータを収集するオンライン分析計(例えば、ガスクロマトグラフ等)である。これらの計器は、収集された前記データを、計測コンピュータ105に通信してもよい。この計測コンピュータ105も、DCS104内に構成されている。計測コンピュータ105は当該収集されたデータを次に通信ネットワーク108を介してデータサーバ103へと通信してもよい。そして、データサーバ103が当該収集されたデータを、ヒストリアンデータベース111にモデル校正及び推論モデル訓練目的用にアーカイブしてもよい。収集される当該データは、目標プロセスの種類に応じて変動する。
【0019】
収集される前記データは、様々な測定可能プロセス変数についての測定値を含んでもよい。これらの測定値は、例えば、流量メータ109Bにより測定される原料ストリーム流量、温度センサ109Cにより測定される原料ストリーム温度、分析計109Aにより決定される成分原料濃度、温度センサ109Dにより測定されるパイプ内還流ストリーム温度等を含んでもよい。また、収集される前記データは、プロセス出力ストリーム変数についての測定値(例えば、製造物質の濃度等であって、分析計106,107により測定される濃度等)を含んでもよい。また、収集される前記データは、操作入力変数についての測定値(例えば、バルブ109Fにより設定されて且つ流量メータ109Hにより決定される還流流量、バルブ109Eにより設定されて且つ流量メータ109Iにより測定されるリボイラ蒸気流量、バルブ109Gにより制御される塔内圧力等)を含んでもよい。収集される前記データは、特定のサンプリング周期中の典型的なプラントの操業条件を反映している。収集された当該データは、ヒストリアンデータベース111にモデル校正及び推論モデル訓練目的用にアーカイブされる。収集される当該データは、目標プロセスの種類に応じて変動する。
【0020】
システムコンピュータ101,102は、オンライン配備目的用の少なくとも1つの確率ネットワークを実行してもよい。システムコンピュータ101上で当該少なくとも1つの確率ネットワークにより生成される出力値は、オペレータが閲覧できるようにネットワーク108を介して計測コンピュータ105に供給されてもよく、あるいは、DCS104の任意の他の構成要素またはDCS104に接続された任意の他のプラント制御システムもしくは処理システムを自動的にプログラムするように供給されてもよい。変形例として、計測コンピュータ105が、ヒストリアンデータ111をデータサーバ103を介してヒストリアンデータベース111に記憶し、前記少なくとも1つの確率ネットワークをスタンドアローンモードで実行してもよい。つまり、計測コンピュータ105、データサーバ103、ならびに各種センサ及び出力ドライバ(例えば、109A~109I、106、107等)が、DCS104を構成し、ここに記載のアプリケーションを協働で実装及び実行する。
【0021】
上記コンピュータシステムの例示的なアーキテクチャ100は、典型的なプラントのプロセス操業を支援する。この実施形態において、当該典型的なプラントは、例えば温度変数、圧力変数、及び流量変数等の複数の測定可能プロセス変数を有する、製油所または化学処理プラントであってもよい。なお、他の実施形態では、これら以外の種類の、有用な技術分野における多種多様な技術的プロセスや機器が用いられてもよいことを理解されたい。
【0022】
本発明の開示の一部として、根本的原因分析用の確率グラフモデル(PGM)を構築する新規な手法を開示する。当該手法は、履歴時系列データを操業診断及び問題阻止のためのPGM分析と組み合わせて、多数のイベントが絶え間なく発生するなかで1つ以上のイベントの根本的原因を特定する。
【0023】
図2は、例示的な一実施形態において、産業プロセスに対して根本的原因分析を実行する例示的な方法200を示すフロー図である。例示的な方法200では、前記産業プロセスにおける複数のセンサから、少なくとも1つのKPIイベントに関するプラントワイド(プラント全体)の履歴時系列データが取得される(205)。KPIイベントが発生する可能性があることを示す前兆パターンが特定される(210)。各前兆パターンは、ある時間窓に対応する。対応する時間窓内でKPIイベント以前に頻繁に発生して且つ当該対応する時間窓外ではめったに発生しない前兆パターンが選択される(215)。前記時系列データ及び前兆パターンに基づく従属関係グラフが生成される(220)。当該従属関係グラフに基づき各始点の信号表現が生成される(225)。当該従属関係グラフ及び当該信号表現に基づき時間窓のセットでの確率ネットワークが生成及び訓練される(230)。当該確率ネットワークは、KPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられることができる。
【0024】
図3は、例示的な一実施形態において、産業プロセスに対して根本的原因分析の結果を適用する例示的な方法300を示すフロー図である。確率ネットワークが生成された後、前記前兆パターンに関係するセンサから、リアルタイム時系列データが取得されることができる(305)。当該リアルタイム時系列データは、当該時系列データの信号表現を生成するように変換されることができる(310)。そして、前記確率ネットワーク及び前記時系列データの当該信号表現に基づき、特定のKPIイベントの確率が決定されることができる(315)。
【0025】
図4は、例示的な一実施形態において、産業プロセスに対して根本的原因分析の結果を適用する例示的な方法400を示すフロー図である。前述したように、確率ネットワークが生成された後、前記前兆パターンに関係するセンサから、リアルタイム時系列データが取得されることができる(405)。当該リアルタイム時系列データは、当該時系列データの信号表現を生成するように変換されることができる(410)。前記確率ネットワーク及び前記時系列データの当該信号表現に基づき、前記時間窓のセットでの特定のKPIイベントの確率が決定される(415)。前記時間窓のセットでの前記特定のKPIイベントの当該確率に基づく累積確率関数が算出される(420)。前記時間窓のセットでの前記特定のKPIイベントの当該確率に基づく確率密度関数が算出される(425)。そして、当該累積確率関数及び確率密度関数に基づき、前記特定のKPIイベントの確率および前記特定のKPIイベントのリスクの集中度合が決定される(430)。
【0026】
図5は、例示的な一実施形態において、産業プロセス505に対して根本的原因分析を実行するシステム500を示すブロック図である。システム500は、産業プロセス505の複数のセンサ510a~510nと、メモリ520と、センサ510a~510n及びメモリ520と通信する少なくとも1つのプロセッサ515とを備える。少なくとも1つのプロセッサ515は、複数のセンサ510a~510nから少なくとも1つのKPIイベントに関するプラントワイドの履歴時系列データを取得してメモリ520に記憶するように構成されている。少なくとも1つのプロセッサ515は、KPIイベントが発生する可能性があることを示す前兆パターンを特定する。各前兆パターンは、ある時間窓に対応する。少なくとも1つのプロセッサ515は、対応する時間窓内でKPIイベント以前に頻繁に発生して且つ当該対応する時間窓外ではめったに発生しない前兆パターンを選択する。少なくとも1つのプロセッサ515は、前記時系列データ及び前兆パターンに基づく従属関係グラフと、さらには、当該従属関係グラフに基づく各始点の信号表現とを、メモリ520内に生成する。少なくとも1つのプロセッサ515は、当該従属関係グラフ及び当該信号表現に基づき、時間窓のセットでの確率ネットワークをメモリ520内に生成及び訓練する。当該確率ネットワークは、KPIイベントが産業プロセス505において発生する可能性があるか否かを予測するのに用いられることができる。
【0027】
一具体例の方法又はシステムは、以下で詳述する複数の連続するステップで進行することができ、履歴データに基づく根本的原因モデルの構築と、得られた根本的原因モデルのオンライン配備との2つのフェーズに分けられることができる。
【0028】
[根本的原因モデルの構築(組立て)]
モデル生成方法600の一例は、図6に示すように概略的に表されることが可能である。以下では、例示的な各ステップについて詳細に説明する。
【0029】
(1)問題設定(605)。少なくとも1つのKPIタグ(センサ)がユーザによって指定される。KPIイベント(マイナスな結果、機能停止、オーバーフローなど、あるいは、プラスな結果、優れた製品品質、エネルギーや原材料の最小化など)が定義されており、当該イベントの発生が履歴データ内において多数見つけ出される。これらのイベントは、比較的希少で且つルールから逸脱している必要がある。このステップでは、全てのKPIイベントを含む連続時間期間(開始、終了)が暗黙的に指定されている。一部の実施形態は、いわゆる遡り時間(すなわち、各イベント前の、イベントに繋がるダイナミクスが発現している時間期間)を指定するようにユーザに要求してもよい。遡り時間(時間窓)がユーザにとって明確な範囲であることは維持される。当該遡り時間は、イベント発現の正確な時間尺度を提供する。
【0030】
(2)データ取得(610)。重要な可能性がある多数のタグについてのデータが選択される。重要な前兆を見逃さないように全ての候補タグが選択するために、欲張りな(しらみつぶしの)アプローチが用いられることができる。各タグごとに、ステップ(1)で指定された前記時間期間をカバーする時系列が提供される必要がある。このシステムは、不良データの発生に対応できるものであり、前記時間期間の大半が有効なセンサ時系列を含むのであれば、前記システムはデータがない場合にも対応できる。
【0031】
(3)データ削減(615)。重要な(関連性がある)タグの初期選択は、制御ゾーンの統計値及びイベントゾーンの統計値を用いて行われる。このステップは、明らかに重要でない(関連性がない)タグ(時系列)の大半をさらなる検討対象から除外する。このプロセスは、(a)KPIタグ挙動に基づく、イベントゾーンのようではない制御ゾーンの構築、および(b)各時系列ごとに個別の、イベントゾーンの実現値と制御ゾーンの実現値との差分スコア(いわゆる関連性スコア)の算出を用いることができる。イベントゾーン及び制御ゾーンのそれぞれについて、判別パラメータ(標準偏差、平均レベル、方向、広がり(スプレッド)、曲率など)についての統計値(つまり2種類の統計値)が算出される。
【0032】
関連性スコアは、下記のようにして決定されることができる。遡り時間窓は、NLBK>>1(1よりも十分大きい)個のノードを含むように指定される。イベント前の時間期間の長さは、NLBK個のノード分となる。制御ゾーンの時間窓も、長さ=NLBKの長さの複数の期間に等分割される。(イベント)ゾーンの遡り時間窓の集合はA={a1,2,…,aEC}であり、制御ゾーンの時間窓の集合はB={b1,2,…,bCC}である。ここで、判別演算子F={f1,2,…,fM}の集合を取り入れることにする。各演算子が適切な時間窓に適用されて、数値αik=fi(ak)及び数値βij=fi(bj)を得る。この表記は、その判別関数が制御ゾーンの時間窓又はイベントゾーンの時間窓の全体集合に適用された場合に得られる結果が数値集合になることを前提としている。各判別関数ごとに、イベントゾーン集合の統計値
【0033】
【数1】
【0034】
と制御ゾーン集合の統計値
【0035】
【数2】
【0036】
とが得られることができる。次に、条件が真である場合に「1」を返して条件が偽である場合に「0」を返すカウンタ演算子の表記Icondを取り入れることにする。これにより、前記関連性スコアの式は、次のように記述されることができる:
【0037】
【数3】
【0038】
指定された閾値Δが与えられることにより、各タグの関連性スコアの確定値が得られる。高い関連性スコアのタグは、KPIイベントの分析にとって極めて重要なタグである。
【0039】
各判別パラメータについて、(標準偏差で測定された)統計値の、閾値を超える差分が共に合計されて、前記スコアとなる。平均関連性スコアよりも高い関連性スコアを有するタグが、重要なタグとして選定される。一般的に、このステップは、全時系列のうちの80~90%を実際のプラントワイド分析の検討対象から除外する。これは、実用的なシステムを作り出すのに重要である。
【0040】
(4)イベントの前兆の予備識別(620)。このステップは、時系列を分析するという連続的問題を、前兆パターンを取り扱うという離散的問題に変換する。前兆は、時系列(パターン)のセグメントであって、イベント以前において独特な形状を有するセグメントのことである。重要なタグ(時系列)に対して、モチーフマイニング(モチーフ採掘)のプロセスが、多種多様なモチーフ長さで広範に配備される。マルチ長さモチーフ発見が、イベントの発生に欠かすことのできない真の前兆を割り出す。
【0041】
(5)タイプAの前兆の選定(625)。各前兆パターンごとに、遡り時間窓(ステップ(1)を参照)及び当該遡り時間窓外の任意の期間において当該前兆パターンがどれほどの頻度で発生しているのかについての分析が行われる。「タイプA」の前兆のみが残される。すなわち、各イベント以前に多く発生し且つ遡り時間窓外ではほとんど発生しない前兆のみが残される。タイプAの前兆の選定は、上限に対して普遍的ルールが設定されることができないため、反復的に実行される。
【0042】
(6)前兆の、複数の集団(塊)への分割(630)。モチーフマイニングアルゴリズムの副産物は、前兆パターンの複数の集団のセットが生成される点である。各集団内の前兆パターンは、同様の統計学的性質を有する。(共通の集団内であっても)前兆同士は、相異なる形状で表され、かつ/あるいは、相異なるタグ時系列に属する。
【0043】
(7)データからの従属関係グラフ構造学習(635)。前兆パターン及び集団の前記セット、履歴データ、ならびにKPIタグの全ての漸進的変化が与えられることにより、従属関係グラフが構築される。各時系列ごとに前兆パターンが規定されているので、時系列におけるどの瞬間においても、前兆が観測されるか観測されないかについての明確な条件が存在する。前兆の発生についての条件を提供するのに、ATD(AspenTech距離)尺度(米国仮特許出願第62/359,575号に記載されている。この仮特許出願の内容は、参照をもって本明細書に取り入れたものとする)が、予め定められた少なくとも1つの閾値と共に用いられてもよい。離散した観測値のセットに対して、問題は、データからベイジアンネットワークの構造を学習させることだけとなる。因果の流れ及び結合性を徹底的に確立するのに、モチーフ間の条件付き確率に基づく有向分離原理が用いられることができる。因果分析の結果として、因果の方向が一方向である有向非巡回グラフ(DAG)又は二方向である双方向グラフとしての従属関係グラフが生成されることができる。
【0044】
(8)前兆変換を用いた、信号表現への時系列の変換(640)。前兆変換は、下記のように実装されてもよい。前兆パターンが特定されて且つ当該前兆パターンの長さがNpreであると仮定する。この前兆の複数の観測値に基づいてATDスコアの閾値Δpreが設定されることが可能であると仮定する。一般的に、比較的低いノイズレベルの前兆パターンは高い閾値(例えば、0.9等)を取ることができ、極めてノイズが多いパターンには低いATDスコアレベル(例えば、0.7等)レベルが定められる。推奨されるのは、前兆の全ての実現値間のATDスコアをペア毎に算出し、その平均値を十分な開始値として確定することである。その前兆が見つかった時系列に対して、Npreから当該時系列の全長まで、各時間インデックスiごとに、次の数値を算出することができる。
【0045】
【数4】
【0046】
式中、ATDScore(i,pre)は同じ長さの2つの時系列間のスコアである。カウンタ演算子Icondの定義については、ステップ(3)(データ削減)で説明したとおりである。value(i)の上記式は、前兆が観測されるか観測されないかに応じて1又は0を返す。この式が、前記前兆変換を規定する。
【0047】
前記従属関係グラフにとって重要な各タグの連続時系列が、モチーフに対する矩形信号とKPIイベントに対するスパイク信号とからなる離散時系列セットに変換される。各時間インスタンス(インデックス)ごとに、各前兆パターンの発生/非存在についての二値観測値(Y/N)のセットが生成される。図7に、複数の時系列及びKPIイベントの信号の表現を概略的に示す。見やすくするために、異なる時系列が異なる縮尺である。実際には、全ての信号の数値は0又は1である。イベントの実際の時間インデックス以前においてn単位時間インデックス分発生した前兆に対して、(時間ホライズンmの長さに等しい)非ゼロのメモリが与えられる。二値観測値の前記セットは、次のm単位における各時間ステップごとの前兆の発生(又は非存在)とイベントの発生(又は非存在)とにより、時系列全体にわたって拡張される。連続時間ベイジアンネットワーク(CTBN)の場合には、時間ホライズンmまでの結果を提供する単一のネットワークが生成される。この場合、確率の経時的な漸進的変化は指数分布に従って決定される。Nodelman, U.、Shelton, C. R.及びKoller, D.(2002)による“Continuous time Bayesian networks.”(「連続時間ベイジアンネットワーク」)Proceedings of the Eighteenth Conference on Uncertainty in Artificial Intelligence (pp. 378-387)を参照のこと。カスタム確率の場合には、時間ホライズンmの異なる設定ごとに、別々のベイジアンネットワークが生成されることができる。mの設定のファミリーが、確率期間構造をもたらす。実用上、任意の予め定められた単位時間インデックスに合致しない時間でのイベントの確率が要求された場合には、隣り合うインデックス間の確率を内挿してもよい。
【0048】
(9)ベイジアンネットワーク訓練(645)。ベイジアンネットワーク(PGMの一種)が、前記従属関係グラフ(図8を参照)およびステップ(8)からの信号を用いて、重要なタグについての観測済パターンが与えられることにより、イベントの発生を予測するように訓練される。当該ネットワークのこの訓練は、予測が行われる各時間ホライズンごとに別々に行われる。異なる時間ホライズンごとに訓練を実行するために、各前兆及び各イベントから導き出された前記信号が、時間ホライズンの長さに対応するメモリラグ(メモリ位置のずれ)を伴って組み立てられる。確率の経時的な漸進的変化が指数分布に従ったものである場合には、CTBNが訓練される(650)。そうでない場合には、各時間ホライズンごとにベイジアンネットワークが訓練される(655)。
【0049】
[根本的原因モデルのオンライン配備]
モデルオンライン配備方法900の一例は、図9に示すように概略的に表されることが可能である。以下では、各ステップについて詳細に説明する。
【0050】
(1)リアルタイム更新の予約(905)。前記根本的原因モデルが、オンライン監視が可能である適切なプラットフォームに追加されることができる。前記従属関係グラフにおいて見つかる時系列の、常時供給の予約が可能である。以降のステップは、オンラインデータの新しい更新ごとに適用される。
【0051】
(2)前記前兆変換を用いた、信号形態へのデータの変換(910)。更新ごとに、時系列の全体が新しい時間インデックスに更新される。最新の時間インデックスを重要なタグの各時間期間の停止インデックスとして用いて、前兆変換が、重要な各時系列の前記信号表現を取得するように適用される。これにより、各時間インスタンスごとに、前兆が観測されたか否かについての情報が入手可能となる。
【0052】
(3)イベント確率の算出(915)。指数分布が用いられた場合には、単一のCTBNが、mの最大値を上限とする任意の時間ホライズンでの確率(CDFとPDFの両方)を提供することができる(920)。カスタム分布の場合には、利用可能な各時間ホライズンごとに別々のベイジアンネットワークが、前記KPIイベントの確率を提供することができる(925)。
【0053】
(4)カスタム分布の場合における、時間ホライズンの関数としての連続累積確率関数のフィッティング(930)。このステップは、様々なやり方で進められることが可能である。これらやり方としては、例えば、指数分布、又は対数正規分布などの許容可能な関数へのスプライン補間やパラメトリックフィッティング等が挙げられる。
【0054】
(5)カスタム分布の場合の、確率密度関数(PDF)の値を得るための、CDFの時間微分(935)。このステップは、実装に関して複数の選択肢を含む。数値微分であるか、あるいは、関数形式が分かっている場合には、アルゴリズムによってPDFが算出されることが可能である。
【0055】
カスタム分布の場合には、順方向時間ホライズンのセットでのイベントの確率を推定することにより、確率期間構造を生成することができる。ユーザは、CDFとPDFの両方が与えられることにより、指定された時間ホライズン内でのKPIイベントの発生の確率を推定できるだけでなく、近い将来のリスクの集中度合を見通すことができる。構築が完成したモデルは:(1)ノード(重要なタグの前兆パターン);(2)エッジ(各種前兆の発生間の条件付き従属関係を示す);(3)前兆パターンの表現;および(4)ノードで選択されたモチーフの観測値が与えられることにより、現在から(特定の時間インデックスの間)一定の期間内でのイベントの確率を提供するように訓練されたベイジアンネットワーク;を含む。
【0056】
リアルタイム配備では、従属グラフのノードにおいて見つかる前兆パターンを追跡することができる。所与のタグについての最新の信号の、シグネチャ前兆に対する類似性のスコア算出システムは、ATDスコアで決められる。最新の読出し値のスコアが閾値を超えるものであると、特定の前兆が観測されたと判断され、これにより、前記従属関係グラフ内の対応するノードがアクティブと見なされる。ベイジアンネットワーク(従属関係グラフおよび条件付き確率)は、アクティブなノード及び非アクティブなノードのセットが与えられることにより、確率値を返す。M個の時間インデックスのそれぞれについての全ベイジアンネットワーク(CTBNまたはカスタム)が、アクティブ/非アクティブなノードの所与のセットで評価される。この処理の結果として、図10に示すような、現在から経時的にCDF及びPDFが構築される。
【0057】
前述のように、根本的原因分析を実行して履歴時系列分析に基づき希少イベントの発生を予測する予測モデルを構築する(前兆パターンを抽出して確率グラフモデルを構築する)、新しいコンピュータシステム及び方法を本明細書は開示している。これら方法及びシステムは、前兆パターン並びに当該前兆パターンの条件付き従属関係及び確率を含め、イベント発現のダイナミクスに関する情報を含んだモデルを生成する。当該モデルは、リアルタイム監視および様々な時間ホライズンでのイベントの確率の予測のためにオンラインで配備されることができる。
【0058】
一具体例の実施形態(コンピュータベースのシステム又は方法)は、KPIイベントの根本的原因分析を実行し、プラントワイドの履歴データに基づくリアルタイムデータに基づいてKPIイベントの発生を予測する。当該システム/方法への入力は、KPIイベントの内容及び発生、多数のセンサの無制限の時系列データ(タグ)、およびイベントに繋がるダイナミクスが発現する間の遡り時間窓の指定であってもよい。当該システム/方法は、各時系列の関連性スコア構築を用いて大規模なデータセットの削減を実行する。高い関連性スコアの時系列のみが、根本的原因分析に用いられる。当該システム/方法は、マルチ長さモチーフ発見プロセスを配備して繰返し可能な前兆パターンを特定する。タイプAの前兆のみが、確率グラフモデルの構築用として選定される。第一のステップでは、有向分離原理に基づいてベイジアンネットワークを学習させる。第二のステップでは、信号の形態で提示された離散データを用いてベイジアンネットワークを(条件付き確率を定めるように)訓練する。その信号表現は、各前兆ごとに、当該前兆が観測されたか否かを示す。観測値の決定は、ATDスコアに基づいて行われることができる。単一のCTBNネットワーク又はベイジアンネットワークのセットが、複数の時間ホライズンにわたって訓練される。これにより、いわゆる確率期間構造(累積密度関数および確率密度関数)が確立する。このようにして、前記モデルは、各前兆の観測値(観測されたか否か)の最新のセットが与えられることにより、様々な時間ホライズンでのイベントの確率を返すことができる。当該モデルはオンラインで実装されることができ、前記システム/方法はどのパターンがリアルタイムで監視されるべきなのかを指定する。当該システム/方法は、各パターンのATDスコアに基づいて、イベントの実際の確率およびリスクの集中度合を返す。
【0059】
従来のアプローチと比べての利点
前述したように、従来のアプローチは、(1)第一原理システム、(2)統計値に基づくリスク分析、および(3)経験モデル化システムを含む。これらの従来のアプローチで検討対象となるイベントは、比較的希少である。当該イベントの実際の根本的原因は、例えば、機器の消耗、操業条件に合わないオペレータの行動等の理想的でない条件に起因する。これらのイベントに対しては、従来のアプローチの(式に基づく)第一原理システムでは全く適合しない。例えば、故障機器に由来する複雑な挙動をいかにして適切にシミュレーションすればよいのかが明確ではない。従来のアプローチのリスク分析システムでは、特定の要因を分析に含めるという明示的な選択がユーザに求められるところ、これはプラントワイドの大規模なデータになると現実的に実現可能性のあるものではない。経験モデルでは、データの十分な予備処理を必要とするところ、これはプラントワイドのデータセットの場合には極めて困難になる。そのほかにも、経験モデルは、ニューラルネットワークの性質上、当該モデルが訓練された領域と大幅に異なる領域では良好に機能することができない。
【0060】
説明した手法には、今日利用されているシステムに比べて、以下のような多数の利点がある。(1)開示した方法及びシステムは、イベントの発生に最終的に繋がるダイナミクスの起源を特定するための根本的原因分析を提供する。(2)当該方法及びシステムは、例えばオペレータのエラー、気象変動、及び原材料中の不純物等のデータを反映した実際の(理想的ではない)データを考慮して訓練される。(3)開示した当該方法及びシステムは、機器の故障に関係する複雑なパターンを特定し、これらパターンをリアルタイムで追跡することができる。(4)根本的原因分析用に選択されることのできるタグの数や履歴データの長さに制限はない。また、データの量にも制限がない。これは、データの選択がそれ自体負担の大きいプロセスとなる技術的環境において重要である。開示した前記方法及びシステムは、PCA、PLS、及びニューラルネットなどの標準的な統計学的手法とは大きく異なり、データの清浄性の要件が極めて低く抑えられている。(5)実際の機器について得られる典型的なセンサデータは、高い相関性を有する変数を多数含む。開示した前記方法及びシステムは、データの多重共線性に影響され難い。(6)分析が、元来の座標系で実行される。これにより、経験を積んだユーザであれば結果を容易に理解及び検証することができる。これは、座標系を変換することで結果の解釈が分かり難くなるPCAアプローチとは対照的である。(7)従属関係グラフのノードは、各種タグごとの、イベントの図式的な表現を含むことができる。当該従属関係グラフ内のノードを繋ぐ有向アーク(エッジ)は、経験を積んだユーザによる明確な解釈及び検証を可能にする。(8)訓練されたベイジアンネットワークは、例えば、どの次のイベントが発生すればKPIイベントの発生の可能性が高まることになるのか等の追加の情報を提供する。(9)カスタム分布を用いた場合には、複数の時間ホライズンでのCDFを推定することにより、PDFを最も自然なかたちで算出することができる。カスタム化された関数と指数分布の両方共、最もリスクが高い期間をピンポイントで特定することを支援し、プラント操業にとって最も重要な時点での意思決定を向上させることができる。CDF/PDFの関数形式は、分析の種類およびタイミングの要件により定まる。指数分布は、確率の関数形式として許可される関数形式の選択肢を制限することで、より高速なモデル生成をもたらす。(10)イベントのCDFは時間の関数として構築されるので、カスタム分布の場合には、PDFの計算が数値微分により自然に行われる。CTBNであれば、CDFとPDFとが同時に提供される。時間の関数としてのPDFの知識は、イベント確率の経時的な漸進的変化の理解を可能にする。一定のタグについての特定のモチーフの観測値に基づくリアルタイム監視の一部としてPDFを構築することにより、指定された時間ホライズンにおいて確率の上昇が観測された場合に、オペレータに早期の警告を提供することができる。
【0061】
図11に、本実施形態が実現されることができるコンピュータネットワーク又は同様のデジタル処理環境を示す。少なくとも1つのクライアントコンピュータ/装置50および少なくとも1つのサーバコンピュータ60は、アプリケーションプログラムなどを実行する処理装置、記憶装置および入出力装置を提供する。少なくとも1つのクライアントコンピュータ/装置50は、さらに、他のコンピューティングデバイス(他のクライアント装置/プロセス50および1つ以上の他のサーバコンピュータ60を含む)へと通信ネットワーク70を介して接続(リンク)されることが可能である。通信ネットワーク70は、リモートアクセスネットワーク、グローバルネットワーク(例えば、インターネット等)、クラウドコンピューティングサーバ又はサービス、世界中のコンピュータの集まり、ローカルアエリア又はワイドエリアネットワーク、および現在それぞれのプロトコル(TCP/IP, Bluetooth(登録商標)など)を用いて互いに通信するゲートウェイの一部であってもよい。それ以外の電子デバイス/コンピュータネットワークアーキテクチャも好適である。
【0062】
図12は、図11のコンピュータシステムにおけるコンピュータ(例えば、クライアントプロセッサ/装置50、サーバコンピュータ60等)の内部構造を示す図である。それぞれのコンピュータ50,60は、コンピュータ又は処理システムの構成要素間でのデータ伝送に利用される一連のハードウェアラインであるシステムバス79を備える。バス79は、本質的に、コンピュータシステムの相異なる構成要素(例えば、プロセッサ、ディスクストレージ、メモリ、入出力ポート、ネットワークポート等)を接続して当該構成要素間での情報の伝送を可能にする共有の導管である。システムバス79には、様々な入出力装置(例えば、キーボード、マウス、ディスプレイ、プリンタ、スピーカ等)をコンピュータ50,60に接続するための入出力装置インターフェース82が取り付けられている。ネットワークインターフェース86は、コンピュータが、ネットワーク(例えば、図11のネットワーク70等)に取り付けられた様々な他の装置へと接続することを可能にする。メモリ90は、数多くの実施形態(例えば、根本的原因モデル構築(200又は600)、モデル配備(300、400又は900)ならびに支援スコア算出アルゴリズム、変換アルゴリズム及び他のアルゴリズムを含む、図2図4図6及び図9に関して先述したコード等)を実現するように用いられるコンピュータソフトウェア命令92およびデータ94を記憶する揮発性の記憶部である。ディスクストレージ95は、数多くの実施形態を実現するように用いられるコンピュータソフトウェア命令92およびデータ94を記憶する不揮発性の記憶部である。システムバス79には、さらに、コンピュータ命令を実行する中央演算処理装置84が取り付けられている。
【0063】
一実施形態において、プロセッサルーチン92及びデータ94は、コンピュータプログラムプロダクト(概して符号92で表す)である。当該コンピュータプログラムプロダクトは、前記システム用のソフトウェア命令の少なくとも一部を提供するコンピュータ読取り可能媒体(例えば、少なくとも1つのDVD-ROM、CD-ROM、ディスケット、テープなどの取外し可能な記憶媒体等)を含む。コンピュータプログラムプロダクト92は、当該技術分野において周知である任意の適切なソフトウェアインストール方法によってインストールされることができる。また、他の実施形態では、前記ソフトウェア命令の少なくとも一部が、ケーブルおよび/または通信および/または無線接続を介してダウンロードされるものであってもよい。他の実施形態において、前記プログラムは、伝播媒体における伝播信号(例えば、電波、赤外線波、レーザ波、音波、インターネットなどのグローバルネットワーク又は他の少なくとも1つのネットワークによって伝播される電気波等)に組み込まれた、コンピュータプログラム伝播信号プロダクト75(図11)である。このような搬送媒体又は信号が、ルーチン/プログラム92用のソフトウェア命令の少なくとも一部を提供する。
【0064】
代替的な実施形態では、前記伝播信号が、伝播媒体で搬送されるアナログ搬送波又はデジタル信号である。例えば、前記伝播信号は、グローバルネットワーク(例えば、インターネット等)、電気通信網又は他のネットワークによって伝播されるデジタル信号であってもよい。一実施形態では、前記伝播信号が、ある期間に前記伝播媒体によって送信される信号であり、例えば、数ミリ秒、数秒、数分又はそれ以上の期間にネットワークによってパケットで送信される、ソフトウェアアプリケーション用の命令等である。他の実施形態において、コンピュータプログラムプロダクト92の前記コンピュータ読取り可能媒体は、コンピュータシステム50が受け取って読取りできる伝播媒体である。例えば、コンピュータシステム50は、前述したコンピュータプログラム伝播信号プロダクトの場合のように、伝播媒体を受け取ってその伝播媒体に組み込まれた伝播信号を特定する。一般的に言って、「搬送媒体」つまり過渡キャリアという用語は、前述した過渡的信号、伝播信号、伝播媒体、記憶媒体などを包含する。他の実施形態では、プログラムプロダクト92が、いわゆるサービスとしてのソフトウェア(Saas:「サース」)、またはエンドユーザをサポートする他のインストールもしくは通信として実現されてもよい。
【0065】
本明細書で引用した全ての特許、特許出願公開公報および刊行物の全教示内容は、参照をもって本明細書に取り入れたものとする。
【0066】
例示的な実施形態を具体的に図示・説明したが、当業者であれば、添付の特許請求の範囲に包含された実施形態の範囲を逸脱しない範疇で形態や細部に様々な変更を施せることを理解するであろう。
なお、本発明は、態様として以下の内容を含む。
〔態様1〕
コンピュータに実装され、産業プロセスに対して根本的原因分析を実行する方法であって、
前記産業プロセスにおける複数のセンサから、少なくとも1つの主要プロセス指標(KPI)イベントに関する、プラントワイドの履歴時系列データを取得する取得過程と、
KPIイベントが発生する可能性があることを示す前兆パターンであって、それぞれある時間窓に対応する前兆パターンを特定する特定過程と、
対応する時間窓内でKPIイベント以前に頻繁に発生して且つ当該対応する時間窓外では稀にしか発生しない前兆パターンを選択する選択過程と、
前記時系列データ及び前兆パターンに基づく従属関係グラフを生成する従属関係グラフ生成過程と、
前記従属関係グラフに基づき、各始点の信号表現を生成する信号表現生成過程と、
前記従属関係グラフ及び前記信号表現に基づき、時間窓のセットに対して確率ネットワークを生成及び訓練する過程であって、当該確率ネットワークは、KPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられるように構成される、生成・訓練過程と、
を備える、方法。
〔態様2〕
態様1に記載の方法において、さらに、
前記少なくとも1つのKPIイベントとの関連性が低いセンサから取得される時系列データを除外することにより、前記時系列データを低減する過程、
を備える、方法。
〔態様3〕
態様2に記載の方法において、さらに、
センサが低い関連性のものであるか否かを判定する判定過程であって、
センサ挙動に基づいて制御ゾーンを生成する副過程、
前記時系列データの各時系列ごとに、イベントゾーンの実現値と制御ゾーンの実現値との関連性スコアを算出する副過程、および
センサに比較的低い関連性スコアが割り当てられた場合には、当該センサを低い関連性のものであると指定する副過程、
を含む、過程、
を備える、方法。
〔態様4〕
態様1に記載の方法において、前兆パターンを特定する前記特定過程が、同様の特性を有する前兆パターンをグループ化する副過程を含む、方法。
〔態様5〕
態様1に記載の方法において、前記従属関係グラフを生成する前記従属関係グラフ生成過程が、前兆が発生したか否かを判定するのに距離尺度を用いる、副過程を含む、方法。
〔態様6〕
態様1に記載の方法において、前記確率ネットワークが、ベイジアン有向非巡回グラフおよび連続時間ベイジアンネットワークグラフのうちの少なくとも1つである、方法。
〔態様7〕
態様1に記載の方法において、さらに、
前記前兆パターンに関連するセンサからのリアルタイム時系列データを取得する過程と、
取得した前記リアルタイム時系列データを、当該時系列データの信号表現を生成するように変換する変換過程と、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、特定のKPIイベントの確率を決定する決定過程と、
を備える、方法。
〔態様8〕
態様7に記載の方法において、特定のKPIイベントの確率を決定する前記決定過程が、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、時間窓の前記セットでの前記特定のKPIイベントの確率を決定する副過程、
時間窓の前記セットでの前記特定のKPIイベントの前記確率に基づく累積確率関数を算出する副過程、
時間窓の前記セットでの前記特定のKPIイベントの前記確率に基づく確率密度関数を算出する副過程、ならびに
前記累積確率関数及び前記確率密度関数に基づき、前記特定のKPIイベントの確率および前記特定のKPIイベントのリスクの集中度合を決定する副過程、
を含む、方法。
〔態様9〕
産業プロセスに対して根本的原因分析を実行するシステムであって、
前記産業プロセスにおける複数のセンサと、
メモリと、
前記センサ及び前記メモリと通信する少なくとも1つのプロセッサと、
を備え、前記少なくとも1つのプロセッサが、
前記複数のセンサから、少なくとも1つの主要プロセス指標(KPI)イベントに関する、プラントワイドの履歴時系列データを取得して前記メモリに記憶し、
KPIイベントが発生する可能性があることを示す前兆パターンであって、それぞれある時間窓に対応する前兆パターンを特定し、
対応する時間窓内でKPIイベント以前に頻繁に発生して且つ当該対応する時間窓外では稀にしか発生しない前兆パターンを選択し、
前記時系列データ及び前兆パターンに基づく従属関係グラフを前記メモリ内に生成し、
前記従属関係グラフに基づき、各始点の信号表現を前記メモリ内に生成し、
前記従属関係グラフ及び前記信号表現に基づき、時間窓のセットに対する確率ネットワークであって、KPIイベントが前記産業プロセスにおいて発生する可能性があるか否かを予測するのに用いられるように構成される確率ネットワークを前記メモリ内に生成して訓練する
ように構成されている、システム。
〔態様10〕
態様9に記載のシステムにおいて、前記プロセッサが、さらに、前記少なくとも1つのKPIイベントとの関連性が低いセンサから取得される時系列データを除外することにより、前記時系列データを低減するように構成されている、システム。
〔態様11〕
態様10に記載のシステムにおいて、前記プロセッサが、さらに、
センサ挙動に基づいて制御ゾーンを生成し、
前記時系列データの各時系列ごとに、イベントゾーンの実現値と制御ゾーンの実現値との関連性スコアを算出し、
センサに比較的低い関連性スコアが割り当てられた場合には、当該センサを低い関連性のものであると指定することにより、
センサが低い関連性のものであるか否かを判定するように構成されている、システム。
〔態様12〕
態様9に記載のシステムにおいて、前記プロセッサが、さらに、前記従属関係グラフの生成において、前兆が発生したか否かを判定するのに距離尺度を用いるように構成されている、システム。
〔態様13〕
態様9に記載のシステムにおいて、前記確率ネットワークが、ベイジアン有向非巡回グラフおよび連続時間ベイジアンネットワークグラフのうちの少なくとも1つである、システム。
〔態様14〕
態様9に記載のシステムにおいて、前記プロセッサが、さらに、
前記前兆パターンに関連するセンサからのリアルタイム時系列データを取得し、
取得した前記リアルタイム時系列データを、当該時系列データの信号表現を生成するように変換し、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、特定のKPIイベントの確率を決定する
ように構成されている、システム。
〔態様15〕
態様14に記載のシステムにおいて、前記プロセッサが、特定のKPIイベントの確率を、
前記確率ネットワーク及び前記時系列データの前記信号表現に基づき、時間窓の前記セットでの前記特定のKPIイベントの確率を決定し、
時間窓の前記セットでの特定のKPIイベントの前記確率に基づく累積確率関数を算出し、
時間窓の前記セットでの特定のKPIイベントの前記確率に基づく確率密度関数を算出し、
前記累積確率関数及び確率密度関数に基づき、前記特定のKPIイベントの確率および前記特定のKPIイベントのリスクの集中度合を決定する
ことによって決定するように構成されている、システム。
〔態様16〕
産業プロセスの根本的原因分析用のモデルであって、
KPIイベントが発生する可能性があることを示す前兆パターンを表すノードおよび前兆パターンの発生間の条件付き従属関係を表すエッジを含む、従属関係グラフと、
前記従属関係グラフに基づく、前記KPIイベントが発生する確率を提供するように訓練された確率ネットワークと、
を備える、モデル。
〔態様17〕
態様16に記載のモデルにおいて、前記確率ネットワークが、ベイジアン有向非巡回グラフおよび連続時間ベイジアンネットワークグラフのうちの少なくとも1つである、モデル。
〔態様18〕
コンピュータに実装され、産業プロセスに対して根本的原因分析を実行するシステムであって、
産業プラントワイドの履歴データに基づいて主要プロセス指標(KPI)イベントの根本的原因分析を実行するように、かつ、リアルタイムデータに基づいてKPIイベントの発生を予測するように構成されたプロセッサエレメント、
を備え、前記プロセッサエレメントが、
KPIイベントの内容及び発生、複数のセンサの時系列データ、および前記産業プロセスにおいて対象のKPIイベントに繋がるダイナミクスが発現している間の遡り時間窓の指定を入力として受け取るデータ統合手段であって、データの大規模なセットの低減を実行して、各時系列ごとに関連性スコアを構築する、データ統合手段、
前記データ統合手段と通信し、高い関連性スコアの時系列を受け取るように構成された根本的原因アナライザであって、繰返し発生する前兆パターンを特定するためにマルチ長さモチーフ発見プロセスを用い、前記遡り時間窓において多く発生する前兆パターンを、各前兆パターンの観測値の最新のセットがあれば、前記産業プロセスにおける別個の時間ホライズンでのイベントの確率を返すことができる確率グラフモデルの構築用に選択する、根本的原因アナライザ、ならびに
前記産業プロセスに対するオンラインインターフェースであって、当該オンラインインターフェースは、構築された前記モデルを、どの前兆パターンがリアルタイムで監視されるべきかを指定するように配備し、前記オンラインモデルは、各前兆パターンの距離スコアに基づいて、対象のプラントイベントの実際の確率およびリスクの集中度合を返す、オンラインインターフェース、
を含む、システム。
〔態様19〕
態様18に記載のシステムにおいて、前記根本的原因アナライザが、さらに、
ベイジアンネットワークを提供する確率グラフモデル構築部を有し、当該ベイジアンネットワークの学習が、有向分離原理に基づくものであり、当該ベイジアンネットワークの訓練が、信号の形態で提示された離散データを用いるものであり、当該信号の表現は、各前兆パターンごとに、当該前兆パターンが観測されたか否かを示す、システム。
〔態様20〕
態様19に記載のシステム及び方法において、前兆パターン観測値の決定が距離スコアに基づいて行われ、ベイジアンネットワークのセットが、累積密度関数及び確率密度関数を含む、時間ホライズンの上限までの確率期間構造を確立するように訓練される、システム及び方法。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12