(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022188009
(43)【公開日】2022-12-20
(54)【発明の名称】コンピュータ実装方法、コンピュータプログラム、コンピュータシステム(情報技術動作のための人工知能に関する確率論的事象トリアージ)
(51)【国際特許分類】
G06N 7/00 20060101AFI20221213BHJP
G06N 20/00 20190101ALI20221213BHJP
G06F 11/34 20060101ALI20221213BHJP
【FI】
G06N7/00 150
G06N20/00
G06F11/34 176
【審査請求】未請求
【請求項の数】25
【出願形態】OL
(21)【出願番号】P 2022092854
(22)【出願日】2022-06-08
(31)【優先権主張番号】17/303,828
(32)【優先日】2021-06-08
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】390009531
【氏名又は名称】インターナショナル・ビジネス・マシーンズ・コーポレーション
【氏名又は名称原語表記】INTERNATIONAL BUSINESS MACHINES CORPORATION
【住所又は居所原語表記】New Orchard Road, Armonk, New York 10504, United States of America
(74)【代理人】
【識別番号】100112690
【弁理士】
【氏名又は名称】太佐 種一
(74)【代理人】
【識別番号】100120710
【弁理士】
【氏名又は名称】片岡 忠彦
(74)【復代理人】
【識別番号】110000877
【氏名又は名称】弁理士法人RYUKA国際特許事務所
(72)【発明者】
【氏名】井手 剛
(72)【発明者】
【氏名】コリアス ジョージオス
(72)【発明者】
【氏名】ファン ドズン ティエン
(72)【発明者】
【氏名】安倍 直樹
【テーマコード(参考)】
5B042
【Fターム(参考)】
5B042MA08
5B042MA14
5B042MC35
5B042MC40
(57)【要約】 (修正有)
【課題】確率論的事象トリアージのためのコンピュータ実装方法、コンピュータプログラム、およびコンピュータシステムを提供する。
【解決手段】プログラムは、タイムスタンプ及び事象タイプを含む事象ログを受信することと、濃度正規化によって、事象タイプの間の因果関係を表すスパースな影響度マトリクスを判断することと、尤度関数の変分境界を活用することによって、個別の事象インスタンスの間の因果関連確率を表すトリガリング確率を判断することと、事象トリアージのためのトリガリング確率をユーザに提供することと、タイプレベル因果分析及びインスタンスレベル因果分析を反復することによって、モデルパラメータを学習することと、をコンピュータに実行させる。
【選択図】
図4
【特許請求の範囲】
【請求項1】
確率論的事象トリアージのためのコンピュータ実装方法であって、前記コンピュータ実装方法は、
タイムスタンプおよび事象タイプを含む事象ログを受信する段階と、
濃度正規化によって、前記事象タイプの間の因果関係を表すスパースな影響度マトリクスを判断する段階と、
尤度関数の変分境界を活用することによって、個別の事象インスタンスの間の因果関連確率を表すトリガリング確率を判断する段階と、
事象トリアージのための前記トリガリング確率をユーザに提供する段階と、
を備える、コンピュータ実装方法。
【請求項2】
前記事象タイプのそれぞれの1つのベースラインインテンシティを判断する段階であって、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供する、判断する段階と、
前記事象タイプの前記それぞれの1つの減衰率を判断する段階であって、前記減衰率は前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、判断する段階と、
をさらに含む、請求項1に記載のコンピュータ実装方法。
【請求項3】
タイプレベル因果分析およびインスタンスレベル因果分析を反復することによってモデルパラメータを学習する段階であって、
前記タイプレベル因果分析は、前記スパースな影響度マトリクス、前記事象タイプのそれぞれの1つのベースラインインテンシティ、および前記事象タイプのそれぞれの1つの減衰率を含み、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供し、前記減衰率は、前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、判断する段階を含み、
前記インスタンスレベル因果分析は、前記トリガリング確率を判断することを含む、
学習する段階をさらに含む、請求項1に記載のコンピュータ実装方法。
【請求項4】
初期トリガリング確率を生成する段階と、
前記初期トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを計算する段階と、
をさらに含む、請求項3に記載のコンピュータ実装方法。
【請求項5】
計算の現在のラウンドにおいて、計算の前回のラウンドにおいて計算された、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスに基づいて、前記トリガリング確率を更新する段階と、
更新された前記トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを更新する段階と、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束するという判断に応答して、計算の前記現在のラウンドにおいて更新されたトリガリング確率を出力する段階と、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束しないという判断に応答して、前記トリガリング確率、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスの更新を反復する段階と、
をさらに含む、請求項4に記載のコンピュータ実装方法。
【請求項6】
確率論的事象トリアージのためのコンピュータプログラムであって、前記コンピュータプログラムは、それによって具現化されるプログラム命令を含み、前記プログラム命令は、1または複数のプロセッサによって実行可能であり、前記プログラム命令は、
タイムスタンプおよび事象タイプを含む事象ログを受信することと、
濃度正規化によって、前記事象タイプの間の因果関係を表すスパースな影響度マトリクスを判断することと、
尤度関数の変分境界を活用することによって、個別の事象インスタンスの間の因果関連確率を表すトリガリング確率を判断することと、
事象トリアージのための前記トリガリング確率をユーザに提供することと、を実行可能である、
コンピュータプログラム。
【請求項7】
前記事象タイプのそれぞれの1つのベースラインインテンシティを判断することであって、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するかに関する情報を提供する、判断することと、
前記事象タイプの前記それぞれの1つの減衰率を判断することであって、前記減衰率は前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、判断することと、
を実行可能な前記プログラム命令をさらに含む、請求項6に記載のコンピュータプログラム。
【請求項8】
タイプレベル因果分析およびインスタンスレベル因果分析を反復することによってモデルパラメータを学習することであって、
前記タイプレベル因果分析は、前記スパースな影響度マトリクス、前記事象タイプのそれぞれの1つのベースラインインテンシティ、および前記事象タイプのそれぞれの1つの減衰率を含み、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供し、前記減衰率は、前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、判断する段階を含み、
前記インスタンスレベル因果分析は、前記トリガリング確率を判断することを含む、
学習することを実行可能な前記プログラム命令をさらに含む、請求項6に記載のコンピュータプログラム。
【請求項9】
初期トリガリング確率を生成することと、
前記初期トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを計算することと、
を実行可能な前記プログラム命令をさらに含む、請求項8に記載のコンピュータプログラム。
【請求項10】
計算の現在のラウンドにおいて、計算の前回のラウンドにおいて計算された、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスに基づいて、前記トリガリング確率を更新することと、
更新された前記トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを更新することと、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束するという判断に応答して、計算の前記現在のラウンドにおいて更新されたトリガリング確率を出力することと、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束しないという判断に応答して、前記トリガリング確率、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスの更新を反復することと、
を実行可能な前記プログラム命令をさらに含む、請求項9に記載のコンピュータプログラム。
【請求項11】
確率論的事象トリアージのためのコンピュータシステムであって、前記コンピュータシステムは、
1または複数のプロセッサ、1または複数のコンピュータ可読有形記憶デバイス、および前記1または複数のプロセッサのうち少なくとも1つによる実行のために前記1または複数のコンピュータ可読有形記憶デバイスのうち少なくとも1つに格納されたプログラム命令を含み、前記プログラム命令は、
タイムスタンプおよび事象タイプを含む事象ログを受信することと、
濃度正規化によって、前記事象タイプの間の因果関係を表すスパースな影響度マトリクスを判断することと、
尤度関数の変分境界を活用することによって、個別の事象インスタンスの間の因果関連確率を表すトリガリング確率を判断することと、
事象トリアージのための前記トリガリング確率をユーザに提供することと、を実行可能である、
コンピュータシステム。
【請求項12】
前記事象タイプのそれぞれの1つのベースラインインテンシティを判断することであって、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するかに関する情報を提供する、判断することと、
前記事象タイプの前記それぞれの1つの減衰率を判断することであって、前記減衰率は前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、判断することと、
を実行可能な前記プログラム命令をさらに含む、請求項11に記載のコンピュータシステム。
【請求項13】
タイプレベル因果分析およびインスタンスレベル因果分析を反復することによってモデルパラメータを学習することであって、
前記タイプレベル因果分析は、前記スパースな影響度マトリクス、前記事象タイプのそれぞれの1つのベースラインインテンシティ、および前記事象タイプのそれぞれの1つの減衰率を含み、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供し、前記減衰率は、前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、判断することを含み、
前記インスタンスレベル因果分析は、前記トリガリング確率を判断することを含む、
学習することを実行可能な前記プログラム命令をさらに含む、請求項11に記載のコンピュータシステム。
【請求項14】
初期トリガリング確率を生成することと、
前記初期トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを計算することと、
を実行可能な前記プログラム命令をさらに含む、請求項13に記載のコンピュータシステム。
【請求項15】
計算の現在のラウンドにおいて、計算の前回のラウンドにおいて計算された、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスに基づいて、前記トリガリング確率を更新することと、
更新された前記トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを更新することと、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束するという判断に応答して、計算の前記現在のラウンドにおいて更新されたトリガリング確率を出力することと、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束しないという判断に応答して、前記トリガリング確率、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスの更新を反復することと、
を実行可能な前記プログラム命令をさらに含む、請求項14に記載のコンピュータシステム。
【請求項16】
確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータ実装方法であって、
トリガリング確率に基づいて、事象タイプのそれぞれの1つのベースラインインテンシティを更新する段階であって、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供し、前記トリガリング確率は、個別の事象インスタンスの間の因果関連確率を表す、更新する段階と、
前記トリガリング確率に基づいて、前記事象タイプの前記それぞれの1つの減衰率を更新する段階であって、前記減衰率は前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、更新する段階と、
前記トリガリング確率に基づいて、スパースな影響度マトリクスを更新する段階であって、前記スパースな影響度マトリクスは前記事象タイプの間の因果関係を表す、更新する段階と、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスに基づいて、前記トリガリング確率を更新する段階と、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束するという判断に応答して、事象トリアージのための前記トリガリング確率をユーザに提供する段階と、
を備える、コンピュータ実装方法。
【請求項17】
正規化強度に関する事前決定された定数を受信する段階と、
初期トリガリング確率を生成する段階と、
前記初期トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを計算する段階と、
をさらに含む、請求項16に記載のコンピュータ実装方法。
【請求項18】
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束しないという判断に応答して、前記ベースラインインテンシティ、前記減衰率、前記スパースな影響度マトリクスの収束、および前記トリガリング確率の更新を反復する段階
をさらに含む、請求項16に記載のコンピュータ実装方法。
【請求項19】
前記ベースラインインテンシティおよび前記減衰率は、尤度関数を最大化することによって更新され、前記スパースな影響度マトリクスの収束は、濃度正規化によって更新される、請求項16に記載のコンピュータ実装方法。
【請求項20】
前記トリガリング確率は、尤度関数の変分境界を活用することによって更新される、請求項16から19のいずれか一項に記載のコンピュータ実装方法。
【請求項21】
確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータプログラムであって、前記コンピュータプログラムは、それによって具現化されるプログラム命令を含み、前記プログラム命令は、1または複数のプロセッサによって実行可能であり、前記プログラム命令は、
トリガリング確率に基づいて、事象タイプのそれぞれの1つのベースラインインテンシティを更新することであって、前記ベースラインインテンシティは、前記事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供し、前記トリガリング確率は、個別の事象インスタンスの間の因果関連確率を表す、更新することと、
前記トリガリング確率に基づいて、前記事象タイプの前記それぞれの1つの減衰率を更新することであって、前記減衰率は前記事象タイプの前記それぞれの1つの時間スケールに関する情報を提供する、更新することと、
前記トリガリング確率に基づいて、スパースな影響度マトリクスを更新することであって、前記スパースな影響度マトリクスは前記事象タイプの間の因果関係を表す、更新することと、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスに基づいて、前記トリガリング確率を更新することと、
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束するという判断に応答して、事象トリアージのための前記トリガリング確率をユーザに提供することと、を実行可能である、
コンピュータプログラム。
【請求項22】
正規化強度に関する事前決定された定数を受信する段階と、
初期トリガリング確率を生成する段階と、
前記初期トリガリング確率に基づいて、前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスを計算する段階と、
を実行可能な前記プログラム命令をさらに含む、請求項21に記載のコンピュータプログラム。
【請求項23】
前記ベースラインインテンシティ、前記減衰率、および前記スパースな影響度マトリクスが収束しないという判断に応答して、前記ベースラインインテンシティ、前記減衰率、前記スパースな影響度マトリクスの収束、および前記トリガリング確率の更新を反復する段階
を実行可能な前記プログラム命令をさらに含む、請求項21に記載のコンピュータプログラム。
【請求項24】
前記ベースラインインテンシティおよび前記減衰率は、尤度関数を最大化することによって更新され、前記スパースな影響度マトリクスの収束は、濃度正規化によって更新される、請求項21に記載のコンピュータプログラム。
【請求項25】
前記トリガリング確率は、尤度関数の変分境界を活用することによって更新される、請求項21から24のいずれか一項に記載のコンピュータプログラム。
【発明の詳細な説明】
【背景技術】
【0001】
本発明は、概して、情報技術動作のための人工知能(AIOps)に関する確率論的事象トリアージに関し、より具体的には、事象タイプ間の因果関係の学習のみでなく、事象インスタンス間の因果関連確率の判断のフレームワークにも関する。
【0002】
事象トリアージは、しばしば「警告」事象に関するが、重要な事象の短いリストを生成するように多くの事象を優先順位付けするタスクを指す。この目標に向けての重大なサブタスクは、関心のある事象に因果的に関連する一時的な事象インスタンスを識別し、優先順位付けするサブタスクである。
【0003】
点処理を用いて、タイムスタンプされた事象をモデリングすることは、考慮すべき最近の関心を得ている、機械学習(ML)における新興の研究テーマである。独立しており同一の分散した(i.i.d.)ベクトルデータに関する、主流のML問題とは異なり、これらは、集合なしで確率論的オブジェクトとして個別の事象を処理することを要する。特に、Hawkes過程は、この文脈において用いられる、評判が高い点処理モデルである(Hawkes、いくつかの自己励起および相互励起する点処理のスペクトル、Biometrika,Vol.58,1971)。ML文献において、Hawkes過程の研究には今までに2つの大きな節目が有った。1つは、マイナー化-最大化(MM)アルゴリズム(Hunter et al.,MMアルゴリズムのチュートリアル、The American Statistician,58(1),2004)であり、他方は、Hawkes過程によるGranger因果発見(Granger,計量経済学およびクロススペクトル法による因果関係の調査、Econometrica,37(3),1969)である。
【0004】
第1の節目は、VeenおよびSchoenbergによってマークされる(EMタイプアルゴリズムを用いた、地震学における空間-時間分岐プロセスモデルの推定、Journal of the American Statistical Association,103(482),2008)。地震の余震の分岐プロセスの直感に基づいて、彼らは第1のMMベースの最大尤度アルゴリズムを導入し、それは、その類似度が原因で、しばしば大まかにEM(期待値最大化)と呼ばれる(Neal et al.,増分、スパース、および他の変形例を正当化するEMアルゴリズムの概要、Learning in graphical models,1998)。多変数Hawkes過程の標準勾配ベースの最尤推定法(MLE)は、実施におけるその適用可能性が限定される、数値安定性問題に悩まされている。第2の節目は、HawkesベースのGranger因果関係モデリングにおけるいくつかの先駆的な作業によって得られる。Kim et al.,(集団ニューラルスパイキング動作の点処理モデルに関するGranger因果関係測定、PLoS Comput Biol,7(3),2011)は、Hawkesベースの因果学習を提案する。Zhou et al.(多次元Hawkes過程を用いたスパースな低ランクネットワークにおける社会的感染性の学習、the 16th International Conference on Artificial Intelligence and Statistics,2013の予稿集)は、多変数Hawkes過程のMLEにおいてl1正規化を導入する。Eichler et al.(非パラメータリンク関数による多変数Hawkes過程に関するグラフィカルモデリング、arXiv:1605.06759v1,2016)は、Hawkesベースの因果関係とGranger因果関係との間に等価性を理論上確立する。
【0005】
これらの成果、およびGranger因果関係学習におけるスパース性のよく知られた重要度が与えられ(Arnold et al.,グラフィカルGranger方法による時間的因果関係モデリング、ACM SIGKDD,2007の予稿集:Lozano et al.,遺伝子発現調整ネットワーク発見のための、グループ化されたグラフィカルGrangerモデリング、Bioinformatics,2009 2009)、スパーシティエンフォーシング正規化と組み合わされたMMアルゴリズムは、確かな解決手段のための前途有望な道であると思われる。興味深いことに、しかしながら、MMアルゴリズムの尤度関数は、実際には、いかなるスパースな解も禁止するという特異性を有する。その有意性にもかかわらず、今までに、MLコミュニティにおいて、この問題にはわずかな注意しか払われていない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
MMアルゴリズムの尤度関数は、実際には、いかなるスパースな解も禁止するという特異性を有する。その有意性にもかかわらず、今までに、MLコミュニティにおいて、この問題にはわずかな注意しか払われていない。
【課題を解決するための手段】
【0007】
1つの態様において、確率論的事象トリアージのためのコンピュータ実装方法が提供される。コンピュータ実装方法は事象ログを受信することを含み、事象ログはタイムスタンプおよび事象タイプを含む。コンピュータ実装方法はさらに、濃度正規化によって、事象タイプの間の因果関係を表すスパースな影響度マトリクスを判断することを含む。コンピュータ実装方法はさらに、尤度関数の変分境界を活用することによって、個別の事象インスタンスの間の因果関連確率を表すトリガリング確率を判断することを含む。コンピュータ実装方法はさらに、事象トリアージのためのトリガリング確率をユーザに提供することを含む。
【0008】
確率論的事象トリアージのためのコンピュータ実装方法はさらに、それぞれの1つの事象タイプのベースラインインテンシティを判断することを含み、ベースラインインテンシティは、事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供する。コンピュータ実装方法はさらに、それぞれの1つの事象タイプの減衰率を判断することを含み、減衰率は、事象タイプのそれぞれの1つの時間スケールに関する情報を提供する。
【0009】
確率論的事象トリアージのためのコンピュータ実装方法はさらに、タイプレベル因果分析およびインスタンスレベル因果分析を反復することによってモデルパラメータを学習することを含む。タイプレベル因果分析は、スパースな影響度マトリクス、事象タイプのそれぞれの1つのベースラインインテンシティ、および事象タイプのそれぞれの1つの減衰率を判断することを含む。インスタンスレベル因果分析は、トリガリング確率を判断することを含む。
【0010】
確率論的事象トリアージのためのコンピュータ実装方法はさらに、初期トリガリング確率を生成することを含む。コンピュータ実装方法はさらに、初期トリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを計算することを含む。
【0011】
確率論的事象トリアージのためのコンピュータ実装方法はさらに、計算の前回のラウンドにおけいて計算されたベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスに基づいて、計算の現在のラウンドにおけるトリガリング確率を更新することを含む。コンピュータ実装方法はさらに、更新されたトリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを更新することを含む。コンピュータ実装方法はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束するという判断に応答して、計算の現在のラウンドにおいて更新されたトリガリング確率を出力することを含む。コンピュータ実装方法はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束しないという判断に応答して、トリガリング確率、ベースラインインテンシティ、減衰率、スパースな影響度マトリクスの更新を反復することを含む。
【0012】
別の態様において、確率論的事象トリアージのためのコンピュータプログラム製品が提供される。本コンピュータプログラム製品は、プログラム命令をそれに具現化して有するコンピュータ可読記憶媒体を含んでおり、プログラム命令は1または複数のプロセッサにより実行可能である。プログラム命令は、タイムスタンプおよび事象タイプを含む事象ログを受信すること、濃度正規化によって、事象タイプの間の因果関係を表すスパースな影響度マトリクスを判断すること、尤度関数の変分境界を活用することによって、個別の事象インスタンスの間の因果関連確率を表すトリガリング確率を判断すること、および、事象トリアージのためのトリガリング確率をユーザに提供することを実行可能である。
【0013】
確率論的事象トリアージのためのコンピュータプログラム製品において、プログラム命令はさらに、事象タイプのそれぞれの1つのベースラインインテンシティを判断することを実行可能であり、ベースラインインテンシティは、事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供する。プログラム命令はさらに、事象タイプのそれぞれの1つの減衰率を判断することを実行可能であり、減衰率は、事象タイプのそれぞれの1つの時間スケールに関する情報を提供する。
【0014】
確率論的事象トリアージのためのコンピュータプログラム製品において、プログラム命令はさらに、タイプレベル因果分析とインスタンスレベル因果分析とを反復することによってモデルパラメータを学習することを実行可能であり、タイプレベル因果分析は、スパースな影響度マトリクス、事象タイプのそれぞれの1つのベースラインインテンシティ、および、事象タイプのそれぞれの1つの減衰率を判断することを含み、インスタンスレベル因果分析は、トリガリング確率を判断することを含む。
【0015】
確率論的事象トリアージのためのコンピュータプログラム製品において、プログラム命令はさらに、初期トリガリング確率を生成することを実行可能である。プログラム命令はさらに、初期トリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを計算することを実行可能である。
【0016】
確率論的事象トリアージのためのコンピュータプログラム製品において、プログラム命令はさらに、計算の現在のラウンドにおいて、計算の前回のラウンドにおいて計算された、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスに基づいて、トリガリング確率を更新することと、更新されたトリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを更新することと、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束するという判断に応答して、計算の現在のラウンドにおいて更新されたトリガリング確率を出力することと、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束しないという判断に応答して、トリガリング確率、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスの更新を反復することと、を実行可能である。
【0017】
さらに別の態様において、確率論的事象トリアージのためのコンピュータシステムが提供される。本コンピュータシステムは、1または複数のプロセッサと、1または複数のコンピュータ可読有形記憶デバイスと、1または複数のプロセッサのうちの少なくとも1つによって実行するために1または複数のコンピュータ可読有形記憶デバイスのうちの少なくとも1つに格納されたプログラム命令とを含む。プログラム命令は、タイムスタンプおよび事象タイプを含む事象ログを受信することを実行可能である。プログラム命令はさらに、濃度正規化によって、事象タイプの間の因果関係を表すスパースな影響度マトリクスを判断することを実行可能である。プログラム命令はさらに、尤度関数の変分境界を活用することによって、個別の事象インスタンスの間の因果関連確率を表すトリガリング確率を判断することを実行可能である。プログラム命令はさらに、事象トリアージのためのトリガリング確率をユーザに提供することを実行可能である。
【0018】
確率論的事象トリアージのためのコンピュータシステムにおいて、プログラム命令はさらに、事象タイプのそれぞれの1つのベースラインインテンシティを判断することであって、ベースラインインテンシティは、事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供する、判断することと、事象タイプのそれぞれの1つの減衰率を判断することであって、減衰率は事象タイプのそれぞれの1つの時間スケールに関する情報を提供する、判断することと、を実行可能である。
【0019】
確率論的事象トリアージのためのコンピュータシステムにおいて、プログラム命令はさらに、タイプレベル因果分析とインスタンスレベル因果分析とを反復することによってモデルパラメータを学習することを実行可能である。タイプレベル因果分析は、スパースな影響度マトリクス、事象タイプのそれぞれの1つのベースラインインテンシティ、および事象タイプのそれぞれの1つの減衰率を判断することを含む。インスタンスレベル因果分析は、トリガリング確率を判断することを含む。
【0020】
確率論的事象トリアージのためのコンピュータシステムにおいて、プログラム命令はさらに、初期トリガリング確率を生成することと、初期トリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを計算することと、を実行可能である。
【0021】
確率論的事象トリアージのためのコンピュータシステムにおいて、プログラム命令はさらに、計算の現在のラウンドにおいて、計算の前回のラウンドにおいて計算されたベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスに基づいて、トリガリング確率を更新することを実行可能である。プログラム命令はさらに、更新されたトリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを更新することを実行可能である。プログラム命令はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束するという判断に応答して、計算の現在のラウンドにおいて更新されたトリガリング確率を出力することを実行可能である。プログラム命令はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束しないという判断に応答して、トリガリング確率、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスの更新を反復することを実行可能である。
【0022】
さらに別の態様において、確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータ実装方法が提供される。コンピュータ実装方法は、トリガリング確率に基づいて、事象タイプのそれぞれの1つのベースラインインテンシティを更新することを含み、ベースラインインテンシティは、事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供し、トリガリング確率は、個別の事象インスタンスの間の因果関連確率を表す。コンピュータ実装方法はさらに、トリガリング確率に基づいて、事象タイプのそれぞれの1つの減衰率を更新することを含み、減衰率は、事象タイプのそれぞれの1つの時間スケールに関する情報を提供する。コンピュータ実装方法はさらに、トリガリング確率に基づいて、スパースな影響度マトリクスを更新することを含み、スパースな影響度マトリクスは、事象タイプの間の因果関係を表す。コンピュータ実装方法はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスに基づいて、トリガリング確率を更新することを含む。コンピュータ実装方法はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束するという判断に応答して、事象トリアージのためのトリガリング確率をユーザに提供することを含む。
【0023】
確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータ実装方法はさらに、正規化強度に関する事前決定された定数を受信することを含む。コンピュータ実装方法はさらに、初期トリガリング確率を生成することを含む。コンピュータ実装方法はさらに、初期トリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを計算することを含む。
【0024】
確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータ実装方法はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束しないという判断に応答して、ベースラインインテンシティ、減衰率、スパースな影響度マトリクスの収束、およびトリガリング確率の更新を反復することを含む。
【0025】
さらに別の態様において、確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータプログラム製品が提供される。コンピュータプログラム製品は、それによって具現化されるプログラム命令を有するコンピュータ可読記憶媒体を含み、プログラム命令は1または複数のプロセッサによって実行可能である。プログラム命令は、トリガリング確率に基づいて、事象タイプのそれぞれの1つのベースラインインテンシティを更新することであって、ベースラインインテンシティは、事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供し、トリガリング確率は、個別の事象インスタンスの間の因果関連確率を表す、更新することと、トリガリング確率に基づいて、事象タイプのそれぞれの1つの減衰率を更新することであって、減衰率は事象タイプのそれぞれの1つの時間スケールに関する情報を提供する、更新することと、トリガリング確率に基づいて、スパースな影響度マトリクスを更新することであって、スパースな影響度マトリクスは事象タイプの間の因果関係を表す、更新することと、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスに基づいて、トリガリング確率を更新することと、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束するという判断に応答して、事象トリアージのためのトリガリング確率をユーザに提供することと、を実行可能である。
【0026】
確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータプログラム製品において、プログラム命令はさらに、正規化強度に関する事前決定された定数を受信することと、初期トリガリング確率を生成することと、初期トリガリング確率に基づいて、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスを計算することと、を実行可能である。
【0027】
確率論的事象トリアージにおけるモデルパラメータの学習のためのコンピュータプログラム製品において、プログラム命令はさらに、ベースラインインテンシティ、減衰率、およびスパースな影響度マトリクスが収束しないという判断に応答して、ベースラインインテンシティ、減衰率、スパースな影響度マトリクスの収束、およびトリガリング確率の更新を反復することを実行可能である。
【図面の簡単な説明】
【0028】
【
図1】本発明の一実施形態に従う、本発明において提案されるフレームワークの2つの主要結果を示す。(A)はトリガリング確率、(B)は影響度マトリクスを示す。
【
図2】本発明の一実施形態に従う、異なる事象タイプの強度関数および減衰関数を示す。
【0029】
【
図3】本発明の一実施形態に従う、本発明において提案されるフレームワークの全体の計算手順を示す。
【0030】
【
図4】本発明の一実施形態に従う、モデルパラメータを学習して、モデルパラメータに基づいてトリガリング確率を判断する、動作ステップを示すフローチャートを提示する。
【0031】
【
図5】(A)、(B)および(C)は、本発明において提案されたフレームワークと当技術分野における従来の手法とによって推定された、影響度マトリクスAのスパース性パターンの比較を提示する。
【0032】
【
図6A】本発明の一実施形態に従う、トリガリング確率のゼロ以外の成分を提示する。
【0033】
【
図6B】本発明の一実施形態に従う、150番目のインスタンスに関する、トリガリング確率を提示する。
【0034】
【
図7】本発明の一実施形態に従う、コンピューティングデバイスまたはサーバのコンポーネントを示す図である。
【0035】
【
図8】本発明の一実施形態に従う、クラウドコンピューティング環境を示す。
【0036】
【
図9】本発明の一実施形態に従う、クラウドコンピューティング環境における抽象化モデル層を示す。
【発明を実施するための形態】
【0037】
本発明の実施形態は、問題への統一された手法を提案し、学習された様々な事象タイプの間の因果関係のみでなく、個別の事象インスタンスの間の因果関連確率もまた判断される。前者に関して、本発明の実施形態は、多変数Hawkes過程に合わせた濃度正規化技法を開発する。これは、正確でかつスパースな因果推定を達成し、したがって、効率的な事象統合を可能にするのに役立つ。後者に関して、本発明において提案されるフレームワークは、因果関連確率を発見するために尤度関数の変分境界を活用し、それによって、同時のインスタンスレベル因果分析およびタイプレベル因果分析を達成する。
【0038】
本発明の実施形態は、特に事象トリアージと呼ぶ文脈において、事象データに関するスパースな因果関係学習への、数学的に明確に定義された解決手段を提供する。具体性のために、クラウドデータセンタ管理の使用事例を考える。様々なコンピュータデバイスが、多数の事象ログを連続的に生成する。デバイスの相互接続性が原因で、「応答時間が長すぎます」などの、1つのデバイスからの1つの警告事象が、下流サービスの多くの関連事象のトリガとなることがある。本来のエラーがより重大であるほど、結果となる事象のセットはより冗長となる傾向がある。事象トリアージ、または高優先度事象のショートリスティングの動作は、必要条件として、因果的に関連する事象インスタンスの関連および統合のタスクを要求する。これは、正確な判断のためにインスタンス固有の因果関係を要することに留意する。例えば、i番目の事象タイプがj番目のタイプと因果関係を有する平均的な可能性がある場合さえも、i番目の事象タイプの1つの特定のインスタンスは自然に発生したものであり得る。事象トリアージのための実際の解決手段は、したがって、事象の確率論的性質を適切に処理しながら、タイプレベル因果分析およびインスタンスレベル因果分析を同時に実行しなければならない。多くの業界にわたって「警告疲労」問題が蔓延している(Elshoush et al.,協力的でインテリジェントな侵入検出システムにおけるアラート相関-調査、Applied Soft Computing,2011;Moyne et al.,スマートマニュファクチャリングのためのビッグデータ分析:半導体製造のケーススタディ、Processes,2017;Dominiak et al.,家畜生産におけるセンサベースの検出モデルからの優先順位付アラーム-モデル性能およびアラーム低減方法に関するレビュー、Computers and Electronics in Agriculture,2017)にもかかわらず、今までに、この文脈における確率論的事象因果モデリングを活用してなされる作業は限られていた。
【0039】
本発明の実施形態は、新しい濃度正規化されたMMアルゴリズムに基づいた、事象トリアージのための新規なフレームワークを提案する。既存のl
1-正規化およびl
2,1正規化手法(Zhou et al.,2013;Xu et al.,Hawkes過程に関するGranger因果関係の学習、International conference on machine learningの予稿集、2016)とは異なり、ゼロにおける対数的な特異性が原因で、病理学的問題から免れており、数学的に明確に定義されたスパース性を実現する。本発明において提案されたフレームワークは、インスタンスレベルの因果関連を発見するためにMMアルゴリズムの変分境界を活用し、それによって、
図1の(A)および
図1の(B)に示されるように、インスタンスレベルの因果学習およびタイプレベルの因果学習を同時に達成する。
図1の(A)および
図1の(B)は、提案されたフレームワークの2つの主要結果をそれぞれ示し、それは(1)トリガリング確率が事象トリアージのためのインスタンス関連の因果関係を定量化する、(2)影響度マトリクスが事象タイプ/クラスの間のGranger因果関係を表す。
【0040】
次の段落は、確率論的ポイント処理の問題設定を提供し、基本を要約する。
【0041】
問題設定
【0042】
N+1個の事象インスタンスからなる事象シーケンスが与えられる。
【数1】
ここで、t
nおよびd
nはそれぞれ、n番目の事象のタイムスタンプおよび事象タイプである。タイムスタンプは、減少しない順番t
0≦t
1≦…≦t
Nでソートされている。D<<Nである、D個の事象タイプ{1,2,...,D}がある。第1のタイムスタンプt
0は時間の起点とみなされる。したがって、残りのN個のインスタンスは、d
0で与えられるランダム変数の実現性であると考えられる。一般的な規則として、時間を表す自由変数としてtまたはuを用い、下付き文字がついたそれらはインスタンスを示す。
【0043】
事象トリアージの主な目標は、インスタンスのトリガリング確率{q
n,i}を計算することであり、q
n,iはi番目の事象(i=0,...,n)によってトリガリングされるべきn番目の事象(n=1,...,N)インスタンスの確率である。定義によって、n≧iであり、
【数2】
である。q
n,nはセルフトリガ(または単にセルフ)確率と呼ばれる。インスタンスのトリガリング確率{q
n,i}を提供することは、候補に重み付けされたランキングを提供することになり、重みの合計は1になることに留意する。スパースな因果学習の補助により、可能な数のいくつかの候補を有することが望まれる。
【0044】
実際の事象トリアージは主に、教師なし学習課題である。1つの典型的な使用例は、既存のモニタリングシステムの強化としての事象フィルタリングである。例えば、エンドユーザは、コンピュータシステムを管理するシステム管理者であり得る。外部情報ソース(顧客からの苦情の電話など)から、システム管理者はシステムにおいて誤った何かがあることに気づき、次に、システム管理者は、関心のある事象に関するトリガリング確率をチェックする。
【0045】
相関事象の尤度
【0046】
全ての事象は相関しているものと仮定されるので、最も一般的な確率的モデルは、N個の事象の接合分布である。確率密度関数(PDF)の連鎖法則により、接合分布は以下のように表され得る。
【数3】
ここで
【数4】
は、t
n-1までの事象履歴を示し、すなわち、
【数5】
である。PDFを記号として示すように
【数6】
を用いる。この分解は容易に、基底尤度関数L
0の定義に至る。
【数7】
分布
【数8】
は、t
n-1≦t<∞において定義され、領域において正規化条件を満たす。
【0047】
事象トリアージのタスクに関して、式(5)の合計の第1項は中心的な役割を果たす。
【数9】
が一定であると仮定して、合計の第2項を省略する。
【0048】
強度関数
【0049】
【数10】
が与えられると、強度関数は、t
n-1以来の第1事象が発生する確率密度として定義される。これは条件付き密度である。tにおける密度を考慮すると、条件は「[t
n-1,t)において事象は発生しなかった」と読み取れる。したがって、
【数11】
である。ここで、履歴
【数12】
が与えられると、
【数13】
は、d番目の事象タイプの強度関数である。式(6)の右辺は、
【数14】
と書かれ得ることに留意する。式(6)の両辺を集約し、項を配置すると、
【数15】
を得る。強度に関してL
0で表すことが可能である。
【数16】
【0050】
第2項におけるn上の事象間隔の従属性に気づくであろう。D>1の場合、dnがnに従属していることが原因で、nにわたる合計は第2項においては実行され得ない。このことは、文献においては誤って無視される場合がある。
【0051】
次の段落は、強度関数に関する特定のモデルを提供し、インスタンスのトリガリング確率{qn,i}を導入する。
【0052】
強度関数およびGranger因果関係:
【0053】
式(6)および(9)は任意の点処理を保持する。ここで、Hawkes過程の特定のパラメータ化を導入する。
【数17】
ここで、μ
d≧0は、d番目のタイプのベースラインインテンシティと呼ばれ、
【数18】
は、影響度マトリクス
【数19】
の(d,d
i)要素であり、φ
d(t-t
i)はd番目のタイプの減衰関数である。ベースラインインテンシティ(μ
d)は、d番目の事象タイプが、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を与える。影響度マトリクスAは、事象タイプの間の因果関係を与える。影響度マトリクスAはまた、カーネル、またはトリガリングマトリクスとしても知られる。φ
dに関する一般的な選択肢は、指数およびべき乗分布である。指数分布に関して
【数20】
および、べき乗分布に関して
【数21】
ここで、β
d≧0は、d番目のタイプの減衰率と呼ばれ、それは、d番目の事象タイプの時間スケールに関する情報を与え、η>1はハイパーパラメータである。逆数1/β
dは、d番目の事象タイプの有効ウィンドウサイズと呼ばれ得る。後で用いるために、無次元バージョンも定義する。
【数22】
【0054】
図2は式(10)を図示し、
【数23】
は指数分布φ
dで示される。
【数24】
および
【数25】
と仮定する。より大きい
【数26】
にもかかわらず、時間減衰が原因で、第2インスタンスの影響は、第4インスタンスの影響よりも大きい。他方では、破線で示されるように、第1および第3の事象インスタンスは、任意の将来の時点における仮定されたd番目の事象タイプの発生確率に、全く影響を有さない。これは実際には、Eichler et al.(2016)がHawkesモデルにおいてGranger非因果性を定義した方法である(Achab et al.,多変数Hawkes統合キュミュラントから明らかになる因果関係、Journal of Machine Learning Research,18,2018も参照)。具体的には、過去のd'番目のタイプの事象インスタンスの存在が、d番目のタイプの事象発生確率に全く影響を有さない場合、次に、d'番目のタイプはd番目のタイプのGranger非因果である。式(10)の加法形式は、Granger因果関係への接続に関して明らかな利点を有する。影響度マトリクスAは、Granger因果関係を表す。この理由により、d
kへの従属性を減衰関数に導入することは、冗長であり得る。
【0055】
トリガリング確率の導入:
【0056】
図2に示されるように、影響度マトリクスAにおいてスパース性を達成することは、事象トリアージにおける重大な重要性である。それは、統合されるべき事象候補の数を減らすことに直接的に至る。スパース性を保証するように、以下の濃度正規化された最大尤度を提案する。
【数27】
【数28】
ここで、
【数29】
はAの濃度であり、すなわち、非ゼロ要素の数であり、
【数30】
は2-ノルムであり、
【数31】
はフロベニウスノルムである。また、
【数32】
および
【数33】
でもある。
【数34】
は、D個の事象タイプ{1,2,...,D}のそれぞれの1つの減衰率を表し、それは、D個の事象タイプのそれぞれの1つの時間スケールに関する情報を与える。
【数35】
は、D個の事象タイプ{1,2,...,D}のそれぞれの1つのベースラインインテンシティを表し、それは、D個の事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するかに関する情報を与える。τ、v
β、v
μ、およびv
Aは、正規化強度に関して一定である。
【0057】
最尤推定法等(MLE)に関する数値的解決は、主に式(9)の非線形対数項が原因で、τ=0の場合でさえも課題であることが知られている。マイナー化-最大化(MM)アルゴリズムは、混合モデルに関する期待値最大化(EM)アルゴリズム(Neal et al.,1998)と同様の方式で、Jensenの不等式を適用するように、式(10)におけるHawkes過程の追加構造を活用する。具体的には、式(10)をまず以下のように書き直す。
【数36】
ここで
【数37】
である。
すべてのn(∀n)に関して
【数38】
となるような、iにわたる任意の分布q
n,iによって、Jensenの不等式は以下を保証する。
【数39】
正規化条件
【数40】
の下でのq
n,iに関する式の右辺を最大化することによって、最も厳しい境界が取得される。
【0058】
qn,iは、Jensenの不等式における数学t系アーチファクトとして導入されたが、それはインスタンスレベル因果分析への新しいドアを開く。qn,iを、i番目のインスタンスによってトリガリングされたn番目のインスタンスという、インスタンスのトリガリング確率と解釈する。i番目のインスタンスは、(1)n番目のインスタンスにより近いとき、(2)その事象タイプdiがn番目のインスタンスの事象タイプにより因果的に関連する場合、より高いトリガリング確率を有する。
【0059】
式(19)は、事象統合における柔らかで適応的なウインドウイング(windowing)を達成することに留意する。文献におけるインスタンスレベルの因果発見への1つの標準的なアプローチは「ハードウインドウイング」であり(例えば、Lin et al.,顕微鏡:マイクロサービス環境における因果関係グラフによる特定性能問題、International Conference on Service-Oriented Computing,2018)、それは、事象インスタンスが与えられたサイズの同じ時間ウィンドウ内で発生した場合には、因果的に関連づけられることを意味する。現実の用途において、異なる事象タイプが影響の異なるタイムスケールを有すること、および手動でのウィンドウサイズの調整は困難なタスクであり得ることは、共通である。
【0060】
モデルパラメータの学習
【0061】
パラメータ推定に関して、不等式(18)を活用する。ここで、尤度関数は以下のように下界を有する。
【数41】
Δ
n,iおよびh
n,iを以下のように定義する。
【数42】
【数43】
インスタンスがトリガリングする確率{q
n,i}は未知のモデルパラメータに従属するが、それが何らかの形で数値的に取得されたと仮定する。MMアルゴリズムは、{q
n,i}と
【数44】
の推定を交互に繰り返す。
以下のように定義する場合、
【数45】
全体の手順は、以下のように簡潔に要約され得る。
与えられた{q
n,i}において
【数46】
与えられた
【数47】
において{q
n,i}=(式(19)) (25)
【0062】
次の段落は、ベースラインインテンシティ
【数48】
、減衰率
【数49】
、および影響度マトリクスAに関するパラメータ推定過程の詳細を提供する。
【0063】
【0064】
ここで、{q
n,i}に関する数値的推定値を有すると仮定して、
【数51】
に関する最大尤度解法を考えよう。最適性の条件は
【数52】
であり、ここで
【数53】
である。
【数54】
はKroneckerのデルタである。
以下のように定義する場合、
【数55】
【数56】
式(26)は、簡潔な二次式へと低減される。
【数57】
そこから、以下の解を得る。
【数58】
【0065】
【0066】
次に、
【数60】
に関して、導関数が以下によって与えられる。
【数61】
ここで、(n,i)はn=1,...,Nおよびi=1,...,n-1の値をとる。
【数62】
の場合も同様に、以下のように定義する。
【数63】
【数64】
最適性条件
【数65】
は再び、二次式になる。
【数66】
以下の解に至る。
【数67】
【0067】
濃度正規化による影響度マトリクスAの推定
【0068】
ここで、Aをどのように発見するかを説明しよう。式(24)において、Aに関する目的関数Lは以下のように書き直される。
【数68】
ここで、マトリクスQおよびHを以下のように定義する。
【数69】
【数70】
デポジションを容易にするために、以下のように定義する。
【数71】
【数72】
【数73】
問題のベクトル化されたバージョンを考える。
【数74】
ここで、q
m≧0,h
m≧0,v
A>0に保つ。これは、影響度マトリクスAの濃度正規化による推定値とみなす、主要な問題である。
【0069】
詳細に入る前に、ここで、知られているl1またはl2,1正規化を代わりに用いて何が発生するかを見よう。MMプロシージャは反復的である。全てのインスタンスを事象統合の候補に適格にするように、初期化qm≧0から開始する必要がある。この場合、xm=0は、lnxmの項が原因で解とはなり得ず、したがって、スパース性は達成されないであろう。換言すれば、MMアルゴリズムは、標準のスパースな正規化に適合しない。
【0070】
これは、Phan et al.によって説明された混合モデルの問題を思い起こさせる(確率論的混合モデルに関するl
0-正規化されたスパース性、SIAM Intl.Conf.Data Miningの予稿集,SIAM,2019)。ここで、それらの概念「ε-スパース性」を活用する。スパース性の判断のために、小さい定数ε>0を導入し、それは、要素が「ターンオフ(turned off)」される以下の閾値として直感的に理解され得る。ここで、我々の問題は、
【数75】
【数76】
となる。ここで、
【数77】
は、引数が真であれば1を戻し、さもなければ0を戻す指標関数である。各k、および各値
【数78】
に関して問題を解く。x
m≦εを満たす添え字の集合を
【数79】
とする。ここで、問題は以下のように書かれる。
【数80】
【0071】
ラグランジュ乗数ξ
mによって、Karush-Kuhn-Tucker(KKT)条件が以下に与えられる。
【数81】
【数82】
【数83】
【0072】
【数84】
に関して、式(48)を解いて以下を得る。
【数85】
ここで、
【数86】
である。
【0073】
【数87】
に関して、2つの可能性がある。
【数88】
【0074】
最後の質問は、集合
【数89】
をどのように選択するかである。これは、∀mに関して、
【数90】
を計算することによって容易に行われ得る。ΔΨ
mはx
mをターンオフして得たものとみなされるので、ΔΨ
m>0であるときはいつもmを
【数91】
に含める。
【0075】
濃度正規化による、影響度マトリクスAの推定に関するアルゴリズムは、式(24)における反復的MMプロシージャの一部として用いられる。全体の複雑性は
【数92】
であり、これは既存のMMアルゴリズムの場合と同じである。入力パラメータに関して、εは、ターンオフのための閾値である直感によって判断され得る。τに関して、式(36)は、Bernoulliの事前分布
【数93】
によるMAP(アポステリオリな最大値(maximum a posteriori))推定とみなされてよく、ここで、γは、行列成分において0を得る確率であり、そこから
【数94】
を有することに留意されたい。0.5<γ<1におけるユーザの選択の値は、τを判断する。式(24)の反復的なMMプロシージャにおいて、パラメータv
A、v
βおよびv
μは、安定収束において重大である。それは、10
-5などの、小さい正の値で開始し、数的な問題が発生した場合には増加させることが推奨される。パラメータは最終的に、事象データの独立エピソードによって相互に有効化されるべきである。検証データセットが利用不可な場合、赤池情報量規準(AIC)の使用が1つの実行可能な手法となり得、
【数95】
が、適合された自由パラメータの全体の数を近似すると仮定する。表1はL
0Hawkes、提案されたアルゴリズムを要約し、それは式(24)における反復的MMプロシージャの一部として用いられる。
表1. 濃度正規化による、影響度マトリクスAの推定のアルゴリズム
【表1】
【0076】
図3は、本発明の一実施形態に従う、本発明において提案されるフレームワークの計算手順を示す。提案されたフレームワークの計算手順は、コンピューティングデバイスまたはサーバによって実装される。コンピューティングデバイスまたはサーバは、以後の段落で
図7を参照してより詳細に説明される。いくつかの実施形態において、動作ステップがクラウドコンピューティング環境において実装され得る。クラウドコンピューティング環境は、
図8および
図9を参照して、以後の段落で説明される。
【0077】
図3を参照すると、コンピューティングデバイスまたはサーバは、入力として事象ログを受信する。事象ログはN+1個の事象インスタンス
【数96】
を含み、t
nはn番目の事象のタイムスタンプであり、d
nはn番目の事象の事象タイプである。
【0078】
さらに
図3を参照すると、コンピューティングデバイスまたはサーバは、マクロ(タイプレベルの)因果分析を実行する。コンピューティングデバイスまたはサーバは、マクロ(タイプレベルの)因果分析によって、様々な事象タイプの間の因果関係を判断する。影響度マトリクスAは、事象タイプの間の因果関係を与える。影響度マトリクスにおけるスパース性を達成することは、事象トリアージにおいて重大な重要性があり、したがって、コンピューティングデバイスまたはサーバは、濃度正規化によって、スパースな影響度マトリクス(A)を判断する。
【0079】
さらに
図3を参照すると、マクロ(タイプレベルの)因果分析において、コンピューティングデバイスまたはサーバは減衰率(
【数97】
)を判断する。
【数98】
は、D個の事象タイプ{1,2,...,D}のうちそれぞれの1つの減衰率を表し、D個の事象タイプのうちそれぞれの1つの時間スケールに関する情報を提供する。
【0080】
さらに
図3を参照すると、マクロ(タイプレベルの)因果分析において、コンピューティングデバイスまたはサーバは、ベースラインインテンシティ(
【数99】
)を判断する。
【数100】
は、D個の事象タイプのそれぞれの1つのベースラインインテンシティを表す。ベースラインインテンシティ(
【数101】
)は、D個の事象タイプの各々が、いかなるトリガリング事象もなしにひとりでに発生する傾向をどのように有するか、に関する情報を提供する。
【0081】
さらに
図3を参照すると、コンピューティングデバイスまたはサーバは、ミクロ(インスタンスレベルの)因果分析を実行する。コンピューティングデバイスまたはサーバは、個別の事象インスタンスの間の因果関連確率を判断する。トリガリング確率は、事象トリアージのためのインスタンス関連の因果関係を定量化する。コンピューティングデバイスまたはサーバは、尤度関数の変分境界を活用することにより、トリガリング確率{q
n,i}を判断する。提案されたフレームワークの2つの主要結果は、インスタンスのトリガリング確率{q
n,i}および影響度マトリクスAである。同時インスタンスレベル因果分析およびタイプレベル因果分析が、事象トリアージのための実際の解決手段として達成される。コンピューティングデバイスまたはサーバは、出力としてトリガリング確率{q
n,i}を提供する。トリガリング確率{q
n,i}は、事象トリアージのためのエンド・ユーザに提供される。典型的な使用例は、既存のモニタリングシステムを向上させる事象フィルタである。コンピュータシステムの管理の一例において、エンド・ユーザは、システムにおいて誤った何かがあることに気づき、次に、関心のある事象に関するトリガリング確率をチェックする。
【0082】
さらに
図3を参照すると、コンピューティングデバイスまたはサーバは、マクロ(タイプレベルの)因果分析およびミクロ(インスタンスレベルの)因果分析を反復することによって、ベースラインインテンシティ
【数102】
、減衰率
【数103】
、および影響度マトリクスAを含むモデルパラメータを学習する。コンピューティングデバイスまたはサーバは、ベースラインインテンシティ
【数104】
、減衰率
【数105】
、および影響度マトリクスAが収束するまで、分析を反復する。モデルパラメータを学習する動作ステップは、
図4を参照して以後の段落で説明されるであろう。
【0083】
図4は、本発明の一実施形態に従って、モデルパラメータを学習してモデルパラメータに基づいてトリガリング確率を判断する、動作ステップを示すフローチャートを提示する。
図4に示される動作ステップは、コンピューティングデバイスまたはサーバによって実装される。コンピューティングデバイスまたはサーバは、
図7を参照して以後の段落により詳細に説明される。いくつかの実施形態において、動作ステップはクラウドコンピューティング環境において実装され得る。クラウドコンピューティング環境は、
図8および
図9を参照して、以後の段落に説明される。
【0084】
ステップ401において、コンピューティングデバイスまたはサーバは、正規化強度に関して事前決定された定数(τ,vβ,vμ,vA,ε)を受信する。事前決定された定数τ,vβ,vμ,vA,εは、前の段落で説明されており、その値の例は、現実の使用例を参照して以後の段落に提示される。
【0085】
ステップ402において、コンピューティングデバイスまたはサーバは、初期トリガリング確率{qn,i}を生成する。例えば、より低次の三角行列が、カイ二乗分散(正値性のために)を用いてランダムに生成され、次に、より低次の三角行列が、各列にわたる合計が1になるように正規化される。
【0086】
ステップ403において、コンピューティングデバイスまたはサーバは、初期トリガリング確率{q
n,i}を用いて尤度関数を最大化することによって、ベースラインインテンシティ(
【数106】
)を計算する。初期トリガリング確率{q
n,i}に基づいて、事象タイプのそれぞれの1つのベースラインインテンシティ(
【数107】
)が、式(30)を用いて計算され得る。ベースラインインテンシティ(
【数108】
)を計算する際、尤度関数は最大化される。
【0087】
ステップ404において、コンピューティングデバイスまたはサーバは、初期トリガリング確率{q
n,i}を用いて尤度関数を最大化することによって、減衰率(
【数109】
)を計算する。初期トリガリング確率{q
n,i}に基づいて、事象タイプのそれぞれの1つの減衰率(
【数110】
)が、式(35)を用いて計算され得る。減衰率(
【数111】
)を計算する際、尤度関数は最大化される。
【0088】
ステップ405において、コンピューティングデバイスまたはサーバは、初期トリガリング確率{qn,i}を用いて、濃度正規化によってスパースな影響度マトリクスAを計算する。初期トリガリング確率{qn,i}に基づいて、スパースな影響度マトリクスAは、表1に提示されたアルゴリズムを用いることによって計算される。
【0089】
ステップ403-405は、上で説明されたそのような連続した順序で実行されることが不要であることが、理解されるであろう。ステップ403-405は、上で言及された順序とは異なる順序で実行されてよく、または、同時に実行されてよい。ベースラインインテンシティ
【数112】
、減衰率
【数113】
、および影響度マトリクスAの計算の順序は、再編成されてもよい。ベースラインインテンシティ
【数114】
、減衰率
【数115】
、および影響度マトリクスAの計算は、1つのステップにおいて行われてもよい。
【0090】
ステップ406において、コンピューティングデバイスまたはサーバは、ベースラインインテンシティ
【数116】
、減衰率
【数117】
、および影響度マトリクスAに基づいて、尤度関数の変分境界を活用することによって、トリガリング確率{q
n,i}を更新する。ひとたびベースラインインテンシティ
【数118】
、減衰率
【数119】
、および影響度マトリクスAが推定されると、トリガリング確率{q
n,i}は、式(19)を用いることによって更新され得る。
【0091】
ステップ407において、コンピューティングデバイスまたはサーバは、ステップ406において更新されたトリガリング確率を用いて、ベースラインインテンシティ
【数120】
、減衰率
【数121】
、および影響度マトリクスAを更新する。ステップ403-405と同様に、事象タイプのそれぞれの1つのベースラインインテンシティ
【数122】
は式(30)を用いて更新され、事象タイプのそれぞれの1つの減衰率
【数123】
は式(35)を用いて更新され、スパースな影響度マトリクスAは、表1に提示されたアルゴリズムを用いて更新される。
【0092】
ステップ408において、コンピューティングデバイスまたはサーバは、ベースラインインテンシティ
【数124】
、減衰率
【数125】
、および影響度マトリクスAが収束するかどうかを判断する。ベースラインインテンシティ
【数126】
、減衰率
【数127】
、および影響度マトリクスAの収束は、計算の前回のラウンドにおいて取得されたベースラインインテンシティ
【数128】
、減衰率
【数129】
、および影響度マトリクスAと、計算の現在のラウンドにおいて取得されたものとを比較することによって判断される。
【0093】
ベースラインインテンシティ
【数130】
、減衰率
【数131】
、および影響度マトリクスAが収束しないという判断(決定ブロック408の「いいえ」分岐)に応答して、コンピューティングデバイスまたはサーバはステップ406を反復する。ベースラインインテンシティ
【数132】
、減衰率
【数133】
、および影響度マトリクスAが収束するという判断(決定ブロック408の「はい」分岐)に応答して、ステップ409において、コンピューティングデバイスまたはサーバは、トリガリング確率{q
n,i}を出力し、事象トリアージのためのトリガリング確率をユーザに提供する。
【0094】
当方は、2つの現実の使用例によって提案されたフレームワークを立証した、その1つは送電網からであり、もう1つはクラウドデータセンタからである。当方の焦点は、提案されたフレームワーク(L0Hawkes)が、従来の手法と比較してどのようにMMアルゴリズムを進歩させたかを実証すること、および、現実世界の使用例におけるその実用性を示すことであった。当方は、L0Hawkesを、l1-正規化(Zhou et al.,2013)をベースとするもの、およびl2,1-正規化(Xu et al.,2016)をベースとするものの、2つの知られているMMベースのスパースな推論方法と比較した。
【0095】
第1の現実の使用例において、パブリックおよびプライベートなエンティティを連携させて、当方は米国送電網の障害事象データを取得した。故障事象は、位相測定ユニット(PMU)によって測定された電圧もしくは電流信号またはその組み合わせにおける突然の変化を表し、それは送電網において地理的に分散された位置で展開した。当方は、時間的な事象データから単独で、データドリブン方式で隠された因果関係を発見することに興味を持った。
【0096】
データセットは、2016年の10か月の期間にD=22個のPMUから「回線供給停止」とラベリングされたN=3811個の故障事象を記録した。当方は、(vμ,vβ,μA)について5×(10-3,10-4,10-4)、および(τ,ε)について(1,1)を取得して、AICに基づいてモデルパラメータをグリッドサーチした。εの値は、maxk,lAk,lの約3%に対応した。l1正規化およびl2,1正規化に関して同じτを用いた。η=2の電力減衰を用いて、ロングテール挙動を捕捉した。
【0097】
図5の(A)は、L
0Hawkesによって推定された影響度マトリクスAのスパース性パターンを示し、
図5の(B)は、l
1-正規化によって推定された影響度マトリクスAのスパース性パターンを示し、
図5の(C)は、l
2,1-正規化によって推定された影響度マトリクスAのスパース性パターンを示す。これらの図は計算されたAを比較し、非ゼロマトリクス要素を黒で示す。l
1およびl
2,1-正規化によって、ゼロ項目は、Q
k,lがたまたま数値的にゼロになっている場合にのみ現れ得る。対照的に、L
0Hawkesは保証されたスパース性を享受する。計算されたAから、PMUの間の隠された因果構造が正常に発見された。
【0098】
第2の現実の使用例において、当方はL0Hawkesを現実の事象トリアージタスクに適用した。当方は、現実のクラウドデータセンタ管理システムからN=718個の警告事象を取得した。フィルタログから得られたこれらの事象は、ネットワークデバイスによって発せられ、それぞれ自身のタイプを有している:当方のデータセットにおいてD=14個の一意的な事象タイプがあった。これらの現実の使用例において、当方は、インスタンスレベル因果分析の例を示すことに焦点をおいた。
【0099】
図6Aは、インスタンスのトリガリング確率{q
n,i}の非ゼロエントリを可視化し、q
n,i<0.01のものは省略される。予測されるように、{q
n,i}はかなりスパースであり、したがって、事象統合は非ゼロなトリガリング確率を拾うことによって直接に実行され得る。
図6Bは、q
150,iの一例を示し、最も右側のスロット(ETH_INIT)は、自己確率q
150,150に対応する。各iに関して、その事象タイプd
iが、バー以下に示される。問題になっている事象のタイプ、ETH_INITは、イーサネット(登録商標)インタフェースを初期化するプロセスに関する。
図6Bにおいて、同じタイプのいくつかの前出のインスタンスは、重複の抑制の成功に至る正のトリガリング確率を有するが、このインスタンスの自己確率は0として計算されたことに留意する。
【0100】
多くのインスタンスは、これらの時間近接(正の確率を有する6つの事象は、150番目の事象から27秒の範囲にあった)にかかわらず、Aのスパース性のおかげで、ゼロのトリガリング確率を有していた。例えば、このデータセットは、かなりのノイズを追加する事象タイプUPDOWNの416個のインスタンスを含んでいたが、それらは、提案されたプラットフォームL0Hawkesによって適切に無視された。ナイーブなハードウインドウイング手法とは異なり、当方のフレームワークは、純粋な因果関係に関して選別することができた。
【0101】
図7は、本発明の一実施形態に従う、コンピューティングデバイスまたはサーバ700の構成要素を示す図である。
図7は、一実装の例示のみを提供するに過ぎず、異なる実施形態が実装され得る環境に関していかなる限定も示唆するものではないことを理解されたい。
【0102】
図7を参照すると、コンピューティングデバイスまたはサーバ700は、プロセッサ720、メモリ710、および有形のストレージデバイス730を含む。
図7において、コンピューティングデバイスまたはサーバ700の上記構成要素間の通信は、数字790で示される。メモリ710は、ROM(リードオンリメモリ)711、RAM(ランダムアクセスメモリ)713、およびキャッシュ715を含む。1または複数のオペレーティングシステム731および1または複数のコンピュータプログラム733は、1または複数のコンピュータ可読有形記憶デバイス730上に存在する。
【0103】
コンピューティングデバイスまたはサーバ700はさらにI/Oインタフェース750を含む。I/Oインタフェース750は、コンピューティングデバイスまたはサーバ700に接続されてよい外部デバイス760との、データの入力および出力を可能にする。コンピューティングデバイスまたはサーバ700は、コンピューティングデバイスまたはサーバ700とコンピュータネットワークとの間の通信のためのネットワークインタフェース740をさらに含む。
【0104】
本発明は、統合のあらゆる可能な技術詳細レベルにおけるシステム、方法もしくはコンピュータプログラム製品、またはその組み合わせであってよい。コンピュータプログラム製品は、プロセッサに本発明の態様を実行させるためのコンピュータ可読プログラム命令をそこに有するコンピュータ可読記憶媒体(または複数の媒体)を含み得る。
【0105】
コンピュータ可読記憶媒体は、命令実行デバイスによって用いるように命令を保持および格納することができる有形デバイスとすることができる。コンピュータ可読記憶媒体は、例えば、限定されないが、電子ストレージデバイス、磁気ストレージデバイス、光学ストレージデバイス、電磁ストレージデバイス、半導体ストレージデバイス、または上記の任意の好適な組み合わせであり得る。コンピュータ可読記憶媒体のより具体的な例の非包括的リストはまた、以下の、ポータブルコンピュータディスケット、ハードディスク、ランダムアクセスメモリ(RAM)、リードオンリメモリ(ROM)、消去可能プログラマブルリードオンリメモリ(EPROMまたはフラッシュメモリ)、スタティックランダムアクセスメモリ(SRAM)、ポータブルコンパクトディスクリードオンリメモリ(CD-ROM)、デジタル多用途ディスク(DVD)、メモリスティック、フロッピディスク、命令が記録されたパンチカードまたは溝における凸構造などの機械的符号化デバイス、および、上記の任意の好適な組み合わせを含み得る。本明細書で用いる、コンピュータ可読記憶媒体は、電波または他の自由に伝播する電磁波、導波管または他の伝送媒体(例えば、光ファイバーケーブルを通過する光パルス)を伝播する電磁波、またはワイヤを介して伝送される電気信号などの一時的な信号そのものであると解釈されるものではない。
【0106】
本明細書において説明されるコンピュータ可読プログラム命令は、例えばインターネット、ローカルエリアネットワーク、ワイドエリアネットワークもしくは無線ネットワークまたはその組み合わせなどのネットワークを介して、コンピュータ可読記憶媒体からそれぞれのコンピューティング/処理デバイスへダウンロードされ得るか、または、外部コンピュータもしくは外部ストレージデバイスへダウンロードされ得る。ネットワークは、銅製伝送ケーブル、光伝送ファイバ、無線送信、ルータ、ファイアウォール、スイッチ、ゲートウェイコンピュータもしくはエッジサーバ、またはその組み合わせを含んでもよい。それぞれのコンピューティング/処理デバイス内のネットワークアダプタカードまたはネットワークインタフェースは、ネットワークからコンピュータ可読プログラム命令を受信し、それぞれのコンピューティング/処理デバイス内のコンピュータ可読記憶媒体に格納するためにコンピュータ可読プログラム命令を転送する。
【0107】
本発明の動作を実行するためのコンピュータ可読プログラム命令は、アセンブラ命令、命令セットアーキテクチャ(ISA)の命令、マシン命令、マシン依存命令、マイクロコード、ファームウェア命令、状態設定データ、集積回路用の構成データ、または、Smalltalk(登録商標)若しくはC++などといったオブジェクト指向プログラミング言語、およびCプログラミング言語若しくは同様のプログラミング言語などの手続き型プログラミング言語を含む、1または複数のプログラミング言語の任意の組み合わせで書かれたソースコード若しくはオブジェクトコードのいずれかであり得る。コンピュータ可読プログラム命令は、スタンドアロンのソフトウェアパッケージとして、ユーザのコンピュータで完全に実行してもよいし、ユーザのコンピュータで部分的に実行してもよいし、ユーザのコンピュータで部分的におよびリモートコンピュータで部分的に実行してもよいし、またはリモートコンピュータもしくはサーバで完全に実行してもよい。後者のシナリオにおいて、リモートコンピュータは、ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを通じてユーザのコンピュータに接続され得るか、または、接続は、(例えば、インターネットサービスプロバイダを使用してインターネットを通じて)外部コンピュータに行われ得る。いくつかの実施形態において、本発明の態様を実行するべく、例えば、プログラマブルロジック回路、フィールドプログラマブルゲートアレイ(FPGA)、または、プログラマブルロジックアレイ(PLA)を含む電子回路は、コンピュータ可読プログラム命令の状態情報を利用して電子回路をパーソナライズすることによって、コンピュータ可読プログラム命令を実行し得る。
【0108】
本発明の態様は、本明細書において、発明の実施形態による方法、装置(システム)、およびコンピュータプログラム製品のフローチャート図もしくはブロック図またはその組み合わせを参照して説明されている。フローチャート図もしくはブロック図またはその組み合わせの各ブロック、ならびにフローチャート図もしくはブロック図またはその組み合わせのブロックの組み合わせは、コンピュータ可読プログラム命令によって実装され得ることが理解されるであろう。
【0109】
これらのコンピュータ可読プログラム命令は、マシンを生成するために、コンピュータのプロセッサ、または、他のプログラム可能なデータ処理装置に提供され得る。それにより、コンピュータまたは他のプログラム可能なデータ処理装置のプロセッサを介して実行する命令は、フローチャートもしくはブロック図またはその組み合わせのブロックまたは複数のブロックにおいて指定される機能/動作を実装するための手段を作成する。これらのコンピュータ可読プログラム命令は、コンピュータ、プログラム可能なデータ処理装置、もしくは他のデバイスまたはその組み合わせに特定の方式で機能するように指示することができるコンピュータ可読記憶媒体に格納されてもよく、これによってその中に格納された命令を有するコンピュータ可読記憶媒体は、フローチャートもしくはブロック図またはその組み合わせのブロックまたは複数のブロックにおいて指定される機能/動作の態様を実装する命令を含む製品を含む。
【0110】
コンピュータ可読プログラム命令はまた、コンピュータ、他のプログラム可能なデータ処理装置、または他のデバイス上にロードされて、コンピュータ、他のプログラム可能な装置、または他のデバイス上で一連の動作ステップを実行させて、コンピュータ実装プロセスを生成し得、それにより、コンピュータ、他のプログラム可能な装置、または他のデバイス上で実行する命令は、フローチャートもしくはブロック図またはその組み合わせのブロックもしくは複数のブロックにおいて指定される機能/動作を実装する。
【0111】
図におけるフローチャートおよびブロック図は、本発明の様々な実施形態によるシステム、方法、およびコンピュータプログラム製品の実行可能な実装形態のアーキテクチャ、機能、および動作を示す。これに関して、フローチャートまたはブロック図における各ブロックは、指定される論理機能を実装する1または複数の実行可能命令を含む命令のモジュール、セグメント、または部分を表し得る。いくつかの代替実装形態において、ブロックに記載された機能は、図に記載された順序から外れて生じてもよい。例えば、連続して示される2個のブロックが、実際には、1つのステップとして実現されてもよく、部分的または全体的に時間重複する方式で同時にまたは実質的に同時に実行されてもよく、ブロックが関与する機能に依存して逆の順序で実行される場合があってもよい。ブロック図もしくはフローチャート図またはその組み合わせのそれぞれのブロック、並びに、ブロック図もしくはフローチャート図またはその組み合わせにおけるブロックの組み合わせは、指定された機能若しくは動作を実行する、または、専用ハードウェアおよびコンピュータ命令の組み合わせを実行する専用ハードウェアベースのシステムによって実装され得ることにも留意されたい。
【0112】
本開示はクラウドコンピューティングに関する詳細な説明を含むが、本明細書に記載された教示の実装形態がクラウドコンピューティング環境に限定されないことは理解されたい。むしろ、本発明の実施形態は、現在知られているかまたは今後開発される任意の他のタイプのコンピューティング環境と連携して実装することができる。
【0113】
クラウドコンピューティングは、サービスのプロバイダとの最小の管理努力ややり取りで迅速に供給かつリリースされ得る、構成可能なコンピューティングリソース(例えば、ネットワーク、ネットワーク帯域幅、サーバ、プロセス、メモリ、ストレージ、アプリケーション、仮想マシン、およびサービス)の共有プールへの便利かつオンデマンドなネットワークアクセスを可能にするサービス提供モデルである。このクラウドモデルは、少なくとも5つの特徴と、少なくとも3つのサービスモデルと、少なくとも4つのデプロイメントモデルとを含んでよい。
【0114】
特徴は以下のとおりである。
【0115】
オンデマンドセルフサービス:クラウド利用者は、サービスのプロバイダとの人的やり取りを要求することなく、必要に応じて自動的に、サーバ時間およびネットワークストレージなどのコンピューティング能力を一方的にプロビジョニングすることができる。
【0116】
ブロードネットワークアクセス:能力はネットワークを通じて利用可能であり、異種混合のシンまたはシッククライアントプラットフォームによる使用を促進する標準的なメカニズム(例えば携帯電話、ラップトップ、およびPDA)を通じてアクセスされる。
【0117】
リソースプーリング:プロバイダのコンピューティングリソースをプールし、マルチテナントモデルを使用して複数の消費者にサービスを提供するもので、需要に応じて異なる物理リソースおよび仮想リソースを動的に割り当て、かつ再割り当てする。一般に、消費者は提供されるリソースの正確な位置について全く制御せず知識もないが、抽象化の高次レベルで位置(例えば、国、州、またはデータセンタ)を指定可能かもしれないという点で、位置独立感がある。
【0118】
早急な弾力性:機能を早急にかつ弾力的に、場合によっては自動的にプロビジョニングされ、迅速にスケールアウトし、かつ早急にリリースして、迅速にスケールインすることができる。消費者にとっては、プロビジョニングに利用可能な各能力は、無制限であるように思えることが多く、いつでも必要なだけ購入できる。
【0119】
測定されるサービス:クラウドシステムは、サービスのタイプ(例えば、ストレージ、プロセス、帯域幅、およびアクティブなユーザアカウント)に適切なある抽象化レベルで計測機能を活用することによって、リソース使用を自動的に制御および最適化する。リソース使用量がモニタリング、制御、および報告され得、利用されるサービスのプロバイダおよび消費者の両方に透明性を提供する。
【0120】
サービスモデルは以下のとおりである。
【0121】
サービスとしてのソフトウェア(SaaS):消費者に提供される機能は、クラウドインフラストラクチャ上で動作するプロバイダのアプリケーションを用いることである。このアプリケーションは、さまざまなクライアントデバイスから、ウェブブラウザなどのシンクライアントインタフェース(例えば、ウェブベースの電子メール)を通じてアクセス可能である。消費者は、限定的なユーザ固有のアプリケーション構成設定の可能な例外かもしれないが、ネットワーク、サーバ、オペレーティングシステム、ストレージ、更には個々のアプリケーション機能を含む基本的なクラウドインフラストラクチャを管理することも制御することもしない。
【0122】
サービスとしてのプラットフォーム(PaaS:Platform as a Service):消費者に提供される機能は、プロバイダがサポートするプログラミング言語やツールを用いて作成された、消費者作成または獲得アプリケーションを、クラウドインフラストラクチャ上に導入することである。消費者は、ネットワーク、サーバ、オペレーティングシステム、またはストレージを含む基本的なクラウドインフラストラクチャを管理することも制御することもしないが、展開されたアプリケーション、および場合によってはアプリケーションをホストする環境構成に対する制御権を有する。
【0123】
サービスとしてのインフラストラクチャ(IaaS:Infrastructure as a Service):消費者に提供される機能は、プロセス、ストレージ、ネットワーク、ならびに消費者がオペレーティングシステムやアプリケーションを含み得る任意のソフトウェアを導入および実行させることができるその他の基礎的なコンピューティングリソースを供給することである。消費者は、基礎にあるクラウドインフラストラクチャは管理または制御しないが、オペレーティングシステム、ストレージ、展開されたアプリケーションに対する制御、および場合によってはネットワーキングコンポーネント(例えば、ホストファイアウォール)を選択する限定的な制御は有する。
【0124】
デプロイメントモデルは以下のとおりである。
【0125】
プライベートクラウド:クラウドインフラストラクチャは、ある組織のためだけに動作する。プライベートクラウドは、当該組織またはサードパーティによって管理されてよく、オンプレミスに存在しても、オフプレミスに存在してもよい。
【0126】
コミュニティクラウド:クラウドインフラストラクチャは、いくつかの組織によって共有され、共有の関心事(例えば、ミッション、セキュリティ要件、ポリシー、およびコンプライアンスの考慮事項)を有する特定のコミュニティをサポートする。組織またはサードパーティはこれを管理し得、あるいはこれはオンプレミスまたはオフプレミス上で存在し得る。
【0127】
パブリッククラウド:クラウドインフラストラクチャは、一般大衆または大規模な業界団体に利用可能にされ、クラウドサービスを販売する組織によって所有される。
【0128】
ハイブリッドクラウド:クラウドインフラストラクチャは、一意的なエンティティのままであるが、データおよびアプリケーションのポータビリティ(例えば、クラウド間の負荷分散のためのクラウドバースト)を可能にする標準化技術または特許技術によって共に結び付けられている、2またはそれより多くのクラウド(プライベート、コミュニティ、またはパブリック)の組み合わせである。
【0129】
クラウドコンピューティング環境は、ステートレス性、弱連結性、モジュール性、および意味的相互運用性に重点を置いたサービス指向である。クラウドコンピューティングの中核には、相互接続されたノードのネットワークを含むインフラストラクチャがある。
【0130】
ここで、
図8を参照すると、例示的なクラウドコンピューティング環境50が示される。図示されるように、クラウドコンピューティング環境50は、モバイルデバイス54A、デスクトップコンピュータ54B、ラップトップコンピュータ54C、もしくは自動車コンピュータシステム54N、またはその組み合わせなどにより通信可能なクラウド利用者によって用いられるローカルコンピューティングデバイスの1または複数のクラウドコンピューティングノード10を含む。ノード10は、互いに通信し得る。それらは、本明細書で上記したようなプライベート・クラウド、コミュニティ・クラウド、パブリック・クラウド、またはハイブリッドクラウド、あるいはその組み合わせなどの、1または複数のネットワーク内で物理的にまたは仮想的にグループ化されてもよい(図示せず)。これによって、クラウドコンピューティング環境50が、インフラストラクチャ、プラットフォーム、若しくは、ソフトウェア、またはその組み合わせを、クラウド利用者がローカルコンピューティングデバイス上でリソースを維持する必要がないサービスとして提供することを可能になる。コンピューティングデバイス54A-Nのタイプは例示のみを意図しており、コンピューティングノード10およびクラウドコンピューティング環境50は、任意のタイプのネットワークもしくはネットワークアドレス可能な接続またはその組み合わせを介して(例えば、ウェブブラウザを用いて)任意のタイプのコンピュータデバイスと通信できることは理解されるであろう。
【0131】
ここで、
図9を参照すると、クラウドコンピューティング環境50(
図8)によって提供される機能抽象化層のセットが示される。
図9に示される構成要素、層、および機能は、例示のみであることが意図され、本発明の実施形態はこれに限定されないことが、予め理解されるべきである。図示するように、以下に挙げる層および対応する機能が提供される。
【0132】
ハードウェアおよびソフトウェア層60は、ハードウェアおよびソフトウェアコンポーネントを含む。ハードウェアコンポーネントの例としては、メインフレーム61、RISC(縮小命令セットコンピュータ)アーキテクチャベースサーバ62、サーバ63、ブレードサーバ64、ストレージデバイス65、ならびにネットワークおよびネットワーキングコンポーネント66を含む。いくつかの実施形態において、ソフトウェアコンポーネントは、ネットワークアプリケーションサーバソフトウェア67、およびデータベースソフトウェア68を含む。
【0133】
仮想化層70は、仮想エンティティの以下の例、すなわち、仮想サーバ71、仮想ストレージ72、仮想プライベートネットワークを含む仮想ネットワーク73、仮想アプリケーションおよびオペレーティングシステム74、および仮想クライアント75が提供され得る抽象化層を提供する。
【0134】
一例において、管理層80は、以下で説明される機能を提供し得る。リソースプロビジョニング81は、クラウドコンピューティング環境内でタスクを実行するのに利用される、コンピューティングリソースおよび他のリソースの動的調達を提供する。計測および価格設定82は、リソースがクラウドコンピューティング環境内で利用される際のコスト追跡、およびそれらのリソースの消費に対する課金作成またはインボイス作成を提供する。一例では、これらのリソースは、アプリケーションソフトウェアライセンスを含み得る。セキュリティは、クラウド利用者およびタスクに対する識別情報確認、ならびにデータおよび他のリソースに対する保護を提供する。ユーザポータル83は、消費者およびシステム管理者に対してクラウドコンピューティング環境へのアクセスを提供する。サービスレベル管理84は、必要なサービスレベルが満たされるように、クラウドコンピューティングリソースの割り当ておよび管理を提供する。サービスレベルアグリーメント(SLA)計画および履行85は、将来の要件がSLAに従って予測されるクラウドコンピューティングリソースの事前調整および調達を提供する。
【0135】
ワークロード層90は、クラウドコンピューティング環境が利用され得る機能の例を提供する。この層から提供され得るワークロードおよび機能の例は、マッピングおよびナビゲーション91、ソフトウェア開発およびライフサイクル管理92、仮想教室教育の提供93、データ解析処理94、トランザクション処理95、および機能96を含む。本発明の機能96は、クラウドコンピューティング環境における情報技術動作のための人工知能(AIOps)に関する確率論的事象トリアージの機能である。