(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023053914
(43)【公開日】2023-04-13
(54)【発明の名称】問題検出システム
(51)【国際特許分類】
G06F 11/07 20060101AFI20230406BHJP
【FI】
G06F11/07 160
G06F11/07 140A
【審査請求】未請求
【請求項の数】18
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022154859
(22)【出願日】2022-09-28
(31)【優先権主張番号】17/491,807
(32)【優先日】2021-10-01
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】300015447
【氏名又は名称】エスアーペー エスエー
【住所又は居所原語表記】Dietmar-Hopp-Allee 16, 69190 Walldorf, Germany
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【弁理士】
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ペーター・エバーライン
(72)【発明者】
【氏名】フォルカー・ドリーゼン
【テーマコード(参考)】
5B042
【Fターム(参考)】
5B042JJ29
5B042KK13
5B042MA08
5B042MC22
5B042MC27
(57)【要約】 (修正有)
【課題】プロセスを中断する問題を識別し、影響を受けるユーザに通知する問題検出システム、方法及び媒体を提供する。
【解決手段】方法は、1つ又は複数のソフトウェアアプリケーションによって実行される第1のプロセスのインスタンスに関連付けられた第1のメトリックの値を決定するために、1つ又は複数のソフトウェアアプリケーションを監視することと、第1のメトリックの値が、第1のプロセスの第1の数の進行中のインスタンスにおいて、第1のプロセスに関連付けられたしきい値を超えたと判定することと、第1の数が、第1のプロセスに関連付けられた第1のカウント制限よりも大きいか判定することと、第1の数が第1のカウント制限よりも大きいと判定したことに応答して、第1のプロセスの進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信することと、を含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
第1のプロセスのインスタンスに関連付けられた第1のメトリックの値を決定するために、1つまたは複数のソフトウェアアプリケーションを監視するステップであって、前記第1のプロセスが、前記1つまたは複数のソフトウェアアプリケーションによって実行されるステップを含む、監視するステップと、
前記第1のメトリックの前記値が、前記第1のプロセスの第1の数の進行中のインスタンスにおいて、前記第1のプロセスに関連付けられたしきい値を超えたと判定するステップと、
前記第1の数が、前記第1のプロセスに関連付けられた第1のカウント制限よりも大きいと判定するステップと、
前記第1の数が前記第1のカウント制限よりも大きいと判定したことに応答して、前記第1のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信するステップと
を含む方法。
【請求項2】
前記第1の数が前記第1のカウント制限よりも大きいと判定したことに応答して、前記第1のプロセスに関連付けられたエラーメッセージをテクニカルサポート部門に送信するステップ
をさらに含む請求項1に記載の方法。
【請求項3】
前記エラーメッセージを送信した後、前記第1のメトリックの前記値が、前記第1のプロセスの第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定するステップと、
前記第1のメトリックの前記値が、前記第1のプロセスの前記第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定したことに応答して、前記第1のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信するステップと
をさらに含む請求項1に記載の方法。
【請求項4】
前記第1のメトリックの値が、前記第1のプロセスの第1の数の進行中のインスタンスにおいて、前記第1のプロセスに関連付けられたしきい値を超えたと判定するステップが、前記第1のプロセスの進行中のインスタンスに関連付けられたユーザの労働時間を決定するステップを含む、請求項1に記載の方法。
【請求項5】
第2のプロセスのインスタンスに関連付けられた第2のメトリックの値を決定するために、前記1つまたは複数のソフトウェアアプリケーションを監視するステップであって、前記第2のプロセスが、前記1つまたは複数のソフトウェアアプリケーションによって実行されるステップを含む、監視するステップと、
前記第2のメトリックの前記値が、前記第2のプロセスの第2の数の進行中のインスタンスにおいて、前記第2のプロセスに関連付けられた第2のしきい値を超えたと判定するステップと、
前記第2の数が、前記第2のプロセスに関連付けられた第2のカウント制限よりも大きいと判定するステップと、
前記第2の数が前記第2のカウント制限よりも大きいと判定したことに応答して、前記第2のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信するステップと
をさらに含む請求項1に記載の方法。
【請求項6】
前記第1のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザに前記エラーメッセージを送信した後、前記第1のメトリックの前記値が、前記第1のプロセスの第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定するステップと、
前記第1のメトリックの前記値が、前記第1のプロセスの前記第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定したことに応答して、前記第1のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信するステップと、
前記第2のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザに前記エラーメッセージを送信した後、前記第2のメトリックの前記値が、前記第2のプロセスの第2の進行中のインスタンスにおいて、前記第2のしきい値を超えたと判定するステップと、
前記第2のメトリックの前記値が、前記第2のプロセスの前記第2の進行中のインスタンスにおいて、前記第2のしきい値を超えたと判定したことに応答して、前記第2のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信するステップと
をさらに含む請求項1に記載の方法。
【請求項7】
第1のプロセスのインスタンスに関連付けられた第1のメトリックの値を決定するために、1つまたは複数のソフトウェアアプリケーションを監視することであって、前記第1のプロセスが、前記1つまたは複数のソフトウェアアプリケーションによって実行されるステップを含む、監視することと、
前記第1のメトリックの前記値が、前記第1のプロセスの第1の数の進行中のインスタンスにおいて、前記第1のプロセスに関連付けられたしきい値を超えたと判定することと、
前記第1の数が、前記第1のプロセスに関連付けられた第1のカウント制限よりも大きいと判定することと、
前記第1の数が前記第1のカウント制限よりも大きいと前記判定したことに応答して、前記第1のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信することと
をコンピューティングシステムに行わせるために、処理ユニットによって実行可能なプログラムコードを記憶した非一時的コンピュータ可読媒体。
【請求項8】
前記プログラムコードが、
前記第1の数が前記第1のカウント制限よりも大きいと前記判定したことに応答して、前記第1のプロセスに関連付けられたエラーメッセージをテクニカルサポート部門に送信すること
をコンピューティングシステムに行わせるために、処理ユニットによってさらに実行可能である、請求項7に記載の媒体。
【請求項9】
前記プログラムコードが、
前記エラーメッセージを送信した後、前記第1のメトリックの前記値が、前記第1のプロセスの第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定することと、
前記第1のメトリックの前記値が、前記第1のプロセスの前記第2の進行中のインスタンスにおいて、前記しきい値を超えたと前記判定したことに応答して、前記第1のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信することと
をコンピューティングシステムに行わせるために、処理ユニットによってさらに実行可能である、請求項7に記載の媒体。
【請求項10】
前記第1のメトリックの値が、前記第1のプロセスの第1の数の進行中のインスタンスにおいて、前記第1のプロセスに関連付けられたしきい値を超えたと前記判定することが、前記第1のプロセスの進行中のインスタンスに関連付けられたユーザの労働時間を決定することを含む、請求項7に記載の媒体。
【請求項11】
前記プログラムコードが、
第2のプロセスのインスタンスに関連付けられた第2のメトリックの値を決定するために、前記1つまたは複数のソフトウェアアプリケーションを監視することであって、前記第2のプロセスが、前記1つまたは複数のソフトウェアアプリケーションによって実行されるステップを含む、監視することと、
前記第2のメトリックの前記値が、前記第2のプロセスの第2の数の進行中のインスタンスにおいて、前記第2のプロセスに関連付けられた第2のしきい値を超えたと判定することと、
前記第2の数が、前記第2のプロセスに関連付けられた第2のカウント制限よりも大きいと判定することと、
前記第2の数が前記第2のカウント制限よりも大きいと前記判定したことに応答して、前記第2のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信することと
をコンピューティングシステムに行わせるために、処理ユニットによってさらに実行可能である、請求項7に記載の媒体。
【請求項12】
前記プログラムコードが、
前記第1のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザに前記エラーメッセージを送信した後、前記第1のメトリックの前記値が、前記第1のプロセスの第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定することと、
前記第1のメトリックの前記値が、前記第1のプロセスの前記第2の進行中のインスタンスにおいて、前記しきい値を超えたと前記判定したことに応答して、前記第1のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信することと、
前記第2のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザに前記エラーメッセージを送信した後、前記第2のメトリックの前記値が、前記第2のプロセスの第2の進行中のインスタンスにおいて、前記第2のしきい値を超えたと判定することと、
前記第2のメトリックの前記値が、前記第2のプロセスの前記第2の進行中のインスタンスにおいて、前記第2のしきい値を超えたと前記判定したことに応答して、前記第2のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信することと
をコンピューティングシステムに行わせるために、処理ユニットによってさらに実行可能である、請求項7に記載の媒体。
【請求項13】
システムであって、
1つまたは複数の処理ユニットと、
メモリであって、第1のプロセスのインスタンスに関連付けられた第1のメトリックの値を決定するために、1つまたは複数のソフトウェアアプリケーションを監視することであって、前記第1のプロセスが、前記1つまたは複数のソフトウェアアプリケーションによって実行されるステップを含む、監視することと、
前記第1のメトリックの前記値が、前記第1のプロセスの第1の数の進行中のインスタンスにおいて、前記第1のプロセスに関連付けられたしきい値を超えたと判定することと、
前記第1の数が、前記第1のプロセスに関連付けられた第1のカウント制限よりも大きいと判定することと、
前記第1の数が前記第1のカウント制限よりも大きいと前記判定したことに応答して、前記第1のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信することと
を前記コンピューティングシステムに行わせるために、前記1つまたは複数の処理ユニットによって実行可能なプログラムコードを記憶したメモリと
を含むシステム。
【請求項14】
前記プログラムコードが、
前記第1の数が前記第1のカウント制限よりも大きいと前記判定したことに応答して、前記第1のプロセスに関連付けられたエラーメッセージをテクニカルサポート部門に送信すること
を前記コンピューティングシステムに行わせるために、前記1つまたは複数の処理ユニットによって実行可能である、請求項13に記載のシステム。
【請求項15】
前記プログラムコードが、
前記エラーメッセージを送信した後、前記第1のメトリックの前記値が、前記第1のプロセスの第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定することと、
前記第1のメトリックの前記値が、前記第1のプロセスの前記第2の進行中のインスタンスにおいて、前記しきい値を超えたと前記判定したことに応答して、前記第1のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信することと
を前記コンピューティングシステムに行わせるために、前記1つまたは複数の処理ユニットによって実行可能である、請求項13に記載のシステム。
【請求項16】
前記第1のメトリックの値が、前記第1のプロセスの第1の数の進行中のインスタンスにおいて、前記第1のプロセスに関連付けられたしきい値を超えたと前記判定することが、前記第1のプロセスの進行中のインスタンスに関連付けられたユーザの労働時間を決定することを含む、請求項13に記載のシステム。
【請求項17】
前記プログラムコードが、
第2のプロセスのインスタンスに関連付けられた第2のメトリックの値を決定するために、前記1つまたは複数のソフトウェアアプリケーションを監視することであって、前記第2のプロセスが、前記1つまたは複数のソフトウェアアプリケーションによって実行されるステップを含む、監視することと、
前記第2のメトリックの前記値が、前記第2のプロセスの第2の数の進行中のインスタンスにおいて、前記第2のプロセスに関連付けられた第2のしきい値を超えたと判定することと、
前記第2の数が、前記第2のプロセスに関連付けられた第2のカウント制限よりも大きいと判定することと、
前記第2の数が前記第2のカウント制限よりも大きいと前記判定したことに応答して、前記第2のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信することと
を前記コンピューティングシステムに行わせるために、前記1つまたは複数の処理ユニットによって実行可能である、請求項13に記載のシステム。
【請求項18】
前記プログラムコードが、
前記第1のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザに前記エラーメッセージを送信した後、前記第1のメトリックの前記値が、前記第1のプロセスの第2の進行中のインスタンスにおいて、前記しきい値を超えたと判定することと、
前記第1のメトリックの前記値が、前記第1のプロセスの前記第2の進行中のインスタンスにおいて、前記しきい値を超えたと前記判定したことに応答して、前記第1のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信することと、
前記第2のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザに前記エラーメッセージを送信した後、前記第2のメトリックの前記値が、前記第2のプロセスの第2の進行中のインスタンスにおいて、前記第2のしきい値を超えたと判定することと、
前記第2のメトリックの前記値が、前記第2のプロセスの前記第2の進行中のインスタンスにおいて、前記第2のしきい値を超えたと前記判定したことに応答して、前記第2のプロセスの前記第2の進行中のインスタンスに関連付けられたユーザにエラーメッセージを送信することと
を前記コンピューティングシステムに行わせるために、前記1つまたは複数の処理ユニットによって実行可能である、請求項13に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、問題検出システムに関する。
【背景技術】
【0002】
エンタープライズコンピューティングシステムは、企業内の多くのプロセスの実行を容易にする。最善の努力にもかかわらず、根本的な技術的問題によって、そのようなプロセスの完了が遅れるか、または妨げられる可能性がある。技術的問題は、異なるコンピューティングシステム内に存在する場合があり、突発的であるか、またはその他の理由で責任のあるテクニカルサポートチームによる監視および/または検出が困難である場合がある。
【0003】
プロセスが遅延する、停止される、またはその他の不具合が生じたとき、影響を受けたユーザ(例えば、プロセスを開始したユーザ)は、サポートチケットを作成し、テクニカルサポートチームに提出する。第2のユーザは、後で、同じプロセスを開始し、最終的に、プロセスが適切に実行されていないことに気づき、第2のユーザが、別のサポートチケットを作成し、提出し得る。サポートチケットは、サポートチームによって待ち行列に入れられ、ユーザは、それぞれのチケットの進行状況について通知される。
【0004】
プロセスの問題が、1つまたは複数の根本的な技術的問題(たとえば、ネットワーク接続の誤動作)に起因する場合、多くのユーザが影響を受け、多くのサポートチケットを作成する。多数のチケットは、テクニカルサポートチームを圧倒する可能性があり、問題の識別および解決を試みながら、新しいチケットを受信し、待ち行列に入れ続ける。一方、全体的なユーザ満足度は低下する。
【0005】
一例では、ある会社は、従業員が、日常業務に必要な商品およびサービスの購入要求を提出することを可能にする。一定額を超える任意の品目の購入は、対応する購入要求を作成した従業員の管理者が承認する必要がある。最近の構成変更により、組織データに基づいて従業員の管理者を決定するルールが誤動作し始める。管理者を決定する代わりに、ルールは空の結果セットを返す。したがって、承認要求は送信されず、すべての購入要求が承認されないままとなる。
【0006】
判定ルールは、技術的に有効な結果を返し続けるので、技術的問題は検出されない。プロセス監視ソリューションは、購入要求の承認のための平均処理時間の増加を検出し得るが、そのような検出は、根本的な技術的問題の解決を検出またはトリガするのに特には役立たない。したがって、複数の従業員が独自に異常な遅延に気づき、管理者に確認し、同じ問題があるかどうか他の同僚に尋ね、最後にサポートチケットを作成した後に初めて問題が検出される。
【発明の概要】
【発明が解決しようとする課題】
【0007】
システムは、動作プロセスを中断する技術的問題を効率的かつ積極的に識別し、誤った通知を制限しながら、影響を受けるユーザに通知することが望まれる。
【課題を解決するための手段】
【0008】
第1の態様に係る方法は、第1のプロセスのインスタンスに関連付けられた第1のメトリックの値を決定するために、1つまたは複数のソフトウェアアプリケーションを監視するステップであって、前記第1のプロセスが、前記1つまたは複数のソフトウェアアプリケーションによって実行されるステップを含む、監視するステップと、前記第1のメトリックの前記値が、前記第1のプロセスの第1の数の進行中のインスタンスにおいて、前記第1のプロセスに関連付けられたしきい値を超えたと判定するステップと、前記第1の数が、前記第1のプロセスに関連付けられた第1のカウント制限よりも大きいと判定するステップと、前記第1の数が前記第1のカウント制限よりも大きいと判定したことに応答して、前記第1のプロセスの前記進行中のインスタンスの各々に関連付けられたユーザにエラーメッセージを送信するステップとを含む。
【図面の簡単な説明】
【0009】
【
図1】いくつかの実施形態による、アプリケーション層を監視することによって、技術層における潜在的な問題を検出し、対処するためのアーキテクチャのブロック図である。
【
図2】いくつかの実施形態による、アプリケーション層を監視することによって、技術層における潜在的な問題を検出し、対処するためのプロセスのフロー図である。
【
図3】いくつかの実施形態による、アプリケーションプロセスの監視およびユーザ通知の発行を経時的に示す図である。
【
図4】いくつかの実施形態による、アプリケーションプロセスの監視およびユーザ通知の発行を経時的に示す図である。
【
図5】いくつかの実施形態による、アプリケーションプロセスの監視およびユーザ通知の発行を経時的に示す図である。
【
図6】いくつかの実施形態による、アプリケーションプロセスの監視およびユーザ通知の発行を経時的に示す図である。
【
図7】いくつかの実施形態による、アプリケーションプロセスの監視およびユーザ通知の発行を経時的に示す図である。
【
図8】いくつかの実施形態による、アプリケーション監視のためのメトリックしきい値の設定を示す図である。
【
図9】いくつかの実施形態による、アプリケーション層を監視することによって、およびユーザの労働時間に基づいて、技術層における潜在的な問題を検出し、対処するためのアーキテクチャのブロック図である。
【
図10】いくつかの実施形態によるハードウェアシステムのブロック図である。
【発明を実施するための形態】
【0010】
以下の説明は、当業者が記載された実施形態を製作および使用することを可能にするために提供され、いくつかの実施形態を実施するために企図される最良の形態を説明する。しかしながら、当業者には、様々な修正が容易に明らかになるであろう。
【0011】
実施形態は、動作プロセスの遅延または失敗を引き起こす技術的問題を検出するための時間および労力を低減し得る。そのような技術的問題の検出を加速することによって、関連する通知および解決プロセスは、従来のシステムよりも速くトリガされ得る。
【0012】
実施形態は、問題を検出し、それに応答して解決プロセスを開始し、ユーザがサポートチケットの積み重ねを手動で作成する前に、ユーザに積極的に通知することができる。そのような特徴は、問題の検出に関わるユーザオーバーヘッドを低減し、問題解決を加速するだけでなく、問題が1つのユーザ固有のプロセスに関連するのみならず、多くのユーザおよびプロセスに同様に影響を及ぼす、より基本的である可能性が高いという迅速な指示をサポート担当者に提供し得る。
【0013】
いくつかの実施形態による問題の検出は、いくつかのプロセス関連メトリックの反復される違反を識別するためのプロセスの監視を含むことができる。違反の数があらかじめ定義された制限に達すると、影響を受けるユーザおよびサポートチームに違反が通知される。さらに、メトリックの後続の各違反は、関連するユーザへの通知をもたらす。これらの特徴は、関連する違反を分析すべき単一の問題に迅速にクラスタ化することを可能にし、それによって、問題を解決するために必要とされる労力および冗長な作業を低減し得る。
【0014】
図1は、いくつかの実施形態によるシステム100のアーキテクチャのブロック図である。システム100の図示された各要素は、知られている、または知られるようになるコンピューティングハードウェアおよび/またはソフトウェアの任意の適切な組合せを使用して実装され得る。そのような組合せは、需要、必要性、価格、および/または任意の他のメトリックに従ってコンピューティングリソースを弾力的に配分する実装を含み得る。いくつかの実施形態では、システム100の2つ以上の要素は、単一のコンピューティングデバイスによって実装される。システム100の2つ以上の要素は、同一場所に配置されてもよい。システム100の1つまたは複数の要素は、クラウドサービス(たとえば、サービスとしてのソフトウェア、サービスとしてのプラットフォーム)として実装され得る。
【0015】
一般に、システム100は、ユーザ132、134、および136に機能を提供するように動作する。ユーザ132、134、および136は、アプリケーション112、114、および116のソフトウェア実装ロジックにアクセスして、この機能を受信する。アプリケーション112、114、および116は、知られている、または知られるようになる任意のソフトウェアアプリケーションを含み得る。
【0016】
1つの非網羅的な例では、アプリケーション112、114、および116は、単一の企業によって運営される顧客関係管理アプリケーション、人的資源管理アプリケーション、およびサプライヤ関係管理アプリケーションを含む。ユーザ132、134、および136は、企業の従業員を含み得、ユーザ132、134、および136の各々は、アプリケーション112、114、および116のうちの1つまたは複数にアクセスすることを許可され得る。ユーザ132、134、および136の各々は、ユーザ132、134、および136の各々に付与された相対的許可に応じて、アプリケーション112、114、および116を介して異なるデータへのアクセスを有し得る。
【0017】
アプリケーション112、114、および116は、当技術分野で知られているように、基礎となるプラットフォームおよびインフラストラクチャ(図示せず)と通信し、それらを利用する。そのようなプラットフォームおよびインフラストラクチャは、限定はしないが、サーバ(スタンドアロンまたは仮想マシン内で実行される)プロトコル、ネットワーク、データベース、データセンターなどを含む。
【0018】
ユーザ132、134、および136は、ユーザインターフェース(UI)層120を介してアプリケーション112、114、および116と対話する。UIレイヤ120は、アプリケーション112、114、および116の機能にアクセスするためにユーザ132、134、および136によって操作されるユーザインターフェースを提示し得る。UIレイヤ120は、代替的に、アプリケーション112、114、および116の個々のUIコンポーネント(図示せず)にエントリポイントを提供し得る。
【0019】
アプリケーション監視コンポーネント150は、アプリケーション112、114、および116からデータを受信するように動作し得る。データに基づいて、当技術分野で知られているように、アプリケーション監視コンポーネント150は、所望のキーパフォーマンスインジケータ(KPI)値が満たされていない(たとえば、プロセスAが7日以内に完了していない)と決定し、対応するプロセスを開始したユーザに通知を送信し得る。そのような従来の動作は、上記の背景技術で説明したものと同様であり、ユーザが特定のプロセスの問題(たとえば、電子メールが意図された受信者によって読まれなかった)を診断し、解決するか、または技術的問題のためにKPI値が満たされていないと判定し、対応するサポートチケットを生成する必要がある。
【0020】
発行通知システム160は、アプリケーション監視コンポーネント150からアプリケーション監視データを受信する。このデータおよびメトリック定義164に基づいて、アラートエンジン162は、潜在的な技術的問題を識別し、以下に詳細に説明するように、影響を受けるユーザおよび問題追跡システム180に対応する通知を送信する。したがって、実施形態は、従来のアプリケーションプロセス監視システムと並行して実行し得る。
【0021】
メトリック定義164によって定義されるメトリックは、時間ベース(たとえば、プロセスAの処理時間)、発生ベース(たとえば、いくつかの失敗したソフトウェアモジュール展開)、または他のベースであり得る。各メトリックは、後述するように、しきい値とカウント制限の両方に関連付けられる。メトリックは、システム100の通常動作中に定義され監視されるKPIを含み得るが、実施形態はこれに限定されない。
【0022】
メトリックに関連付けられたしきい値は、適用可能なサービス水準合意(SLA)によって指定されたしきい値と一致し得るが、やはり実施形態はそれに限定されない。たとえば、メトリック定義164は、特定のプロセスの完了に関連付けられたメトリックを定義し得る。有効なSLAは、1日以内にプロセスを完了することを要求し、他のシステムは、この要求の遵守を監視するように動作し得るが、メトリック定義164におけるメトリックに関連付けられたしきい値は、18時間であってもよい。
【0023】
問題追跡システム180は、
図1のユーザ185によって表されるテクニカルサポートチームによって操作される。発行通知システム160は、発行追跡システム180によって提供されるインターフェースを介して、発行追跡システム180と通信して、後述するように、潜在的な技術的問題をシステム180に通知し得る。発行通知システム160は、同様に、メッセージングコンポーネント170(たとえば、電子メールサーバ)と通信して、本明細書で説明するアルゴリズムに従って、影響を受けるユーザに通知を送信し得る。
【0024】
図2は、いくつかの実施形態による、技術的問題を効率的に検出し、通知を提供するためのプロセス200のフロー図を含む。プロセス200および本明細書で言及するすべての他のプロセスは、1つまたは複数の処理ユニット(たとえば、プロセッサ、プロセッサコア、プロセッサスレッド)によって実行可能なプログラムコードで具現化され、ハードディスクドライブ、揮発性または不揮発性ランダムアクセスメモリ、DVD-ROM、フラッシュドライブ、および磁気テープなどの非一時的コンピュータ可読媒体のうちの1つまたは複数から読み取られ、次いで、圧縮、非コンパイル、および/または暗号化形式で記憶され得る。いくつかの実施形態では、ハードワイヤード回路は、いくつかの実施形態によるプロセスの実装のために、プログラムコードの代わりに、またはプログラムコードと組み合わせて使用され得る。したがって、実施形態は、ハードウェアおよびソフトウェアの任意の特定の組合せに限定されない。
【0025】
S205において、1つまたは複数のメトリックが最初に決定される。各メトリックは、それぞれのしきい値およびカウント制限に関連付けられ、その関連性について、以下で説明する。各決定されたメトリックおよびそのしきい値ならびにカウント制限は、発行通知システム160のメトリック定義164に記憶され得る。
【0026】
メトリックの初期セットは、発行通知システム160の開発者および/またはアプリケーション112、114、および116の開発者によって決定され得る。これらのメトリックは、システム100に配備された他のアプリケーション監視システムによって監視されるKPIを含むことができ、関連するしきい値は、適用可能なSLAによって必要とされるしきい値と等しくてもよい。決定されたしきい値は、以下で説明されるように、履歴性能データに基づいてSLAによって要求されるものよりも厳密であり得る。いくつかの実施形態によれば、メトリック、それらの関連するしきい値、またはそれらの関連するカウント制限は、(たとえば、管理者または何人かのユーザによって)必要に応じて修正、追加、または削除され得る。
【0027】
1つまたは複数のアプリケーションの監視が、S210で開始する。監視されるアプリケーションは、S205で決定されたメトリックがそれぞれのしきい値を満たすかどうかを判定するために監視が必要とされるアプリケーションである。たとえば、承認プロセスを完了するのに必要な時間がメトリックである場合、S210において、承認プロセスを管理するアプリケーションが監視される。
【0028】
次に、S215において、プロセスの進行中のインスタンスにおいて、メトリックがその関連するしきい値を超えたかどうかが判定される。S215~S250、そうでない場合、フローは、メトリックがその関連するしきい値を超えたと判定されるまで、S215で循環することに留意されたい。次いで、フローはS220に進み、メトリックに関連付けられたカウントをインクリメントする。S225において、カウントがメトリックに関連付けられたカウント制限を超えたかどうかが判定される。そうでない場合、フローはS215に戻り、上述のように継続する。
【0029】
図3~
図7は、いくつかの実施形態による、同じプロセスのいくつかの進行中のインスタンスの実行タイムラインを示す。実行タイムラインは、いくつかの実施形態によるプロセス200の一例を提供することを意図している。
【0030】
図3は、プロセスA
1~A
5の各々の開始を示す。各プロセスの進行は進行中であり、それ自体の時間枠のt
0で開始することに対して矢印によって表される。したがって、各タイムライン上のt
0、t
1、t
2、およびt
3の間の相対的な時間差が等しいにもかかわらず、プロセスA
5のt
0は、プロセスA
1のt
1の後に生じる。
【0031】
本説明の目的で、プロセスAの完了に関連付けられたしきい値時間がt
2であると仮定する。また、適用可能なSLAは、t
3までにプロセスAの完了を必要とすると仮定される。したがって、
図3によって表される時間において、その時間にはプロセスAのインスタンスが完了するのにt
2よりも長くかかっていないので、S215において、メトリックがそのしきい値を超えていないと判定される。
【0032】
図4に移動すると、プロセスA
1は、「x」によって示されるように、t
2までに完了していない。したがって、プロセスAの完了に関連付けられたカウンタは、S220において1にインクリメントされる。プロセスAの完了に関連付けられた(およびS205で決定された)カウント制限は2であると仮定する。したがって、プロセスA
1およびプロセスAの残りのインスタンスが引き続き実行され、フローは、S225からS215に戻る。
【0033】
図5に示す時間に、プロセスA
2はt
2までに完了しておらず(「x」によっても示されるように)、プロセスA
3はt
2までに完了している(「o」によって注釈が付けられている)ことに留意されたい。したがって、プロセスAの完了に関連付けられたカウンタは、S220において2にインクリメントされる。プロセスAの完了に関連付けられたカウント制限は2であり、超過していないので、フローは、再びS225からS215に戻る。
図6に示す時間まで経過し、t
2までに処理A
4が完了していないと判定される。したがって、プロセスAの完了に関連付けられたカウンタは、S220において3にインクリメントされる。次いで、プロセスAの完了に関連付けられたカウント制限を超えたので、フローはS230に進む。
【0034】
S230において、通信は、超過したしきい値に関連付けられた各ユーザおよび技術サポート担当者に送信される。
図3~
図6の例に関して、プロセスA
1、A
2、およびA
4を開始したユーザ、およびテクニカルサポート担当者に、通信が送信される。いくつかの実施形態では、アラートエンジン162は、メッセージングコンポーネント170に、電子メールを適切なユーザに送信するように命令し、単一の対応するチケットを開くために問題追跡システム180と通信する。ユーザへの電子メールは、エラーメッセージを含み得、たとえば、根本的な技術的問題が識別されたこと、サポート担当者に通知されたこと、およびユーザに技術的問題のステータスを知らせ続けることを示し得る。
【0035】
上記は、従来のシステムに勝るいくつかの利点を提供する。まず、対応するSLAに違反する前(すなわち、t2以前の完了)であっても、ユーザに通知される。第2に、ユーザは、そうでなければサポートチケットを生成する可能性が高くなる前に通知され、それによって、ユーザの労力を節約する。第3に、テクニカルサポートチームは、(おそらく)同じ根底にある問題に関連付けられた複数のサポートチケットではなく、単一のサポートチケットを受信する。
【0036】
S230における通信の送信後、プロセス200は、S235において、メトリックに関連付けられたしきい値を超えたかどうかを監視し続ける。そうでない場合、S245において、問題が解決されたかどうかが判定される。S245における判定は、問題が解決されたことを示す、テクニカルサポートチームから受信された通信、所与の時間量および/または発生回数についてメトリックがそのしきい値を超えなかったという決定、および/または任意の他の基礎に基づき得る。問題が解決されていない場合、フローはS235に戻る。
【0037】
S235において、メトリックがそのしきい値を超えたと判定された場合、S240において、通信が対応するユーザに送信される。通信は、S230においてユーザに送信された通信と同様であり得る。いくつかの実施形態では、S230においてすでに開かれたサポートチケットのために、S240においてテクニカルサポートチームに通信は送信されない。
【0038】
図7は、S235においてプロセスA
5が時間t
2を超えたと判定されたシナリオを示す。したがって、S240において、通信が対応するユーザに送信される。通信は、潜在的な技術的問題が存在することがすでに決定されているので、カウント制限に関係なく送信される。フローは、S245で問題が解決されたと決定されるまで、S235、S240、およびS245の間で、このように循環し続ける。次いで、S250において、問題が解決されたことを示す通信が、プロセス200によって以前に通信を受信したすべてのユーザに送信される。
【0039】
いくつかの実施形態によれば、S250は、問題が解決されたことを確認するためのアクションを含む。たとえば、チケットの解決時に、発行追跡システム180は、サポートチケットの提出者としてシステム160に通知する。システム160は、超えたしきい値のパーセンテージが減少するかどうか(たとえば、事前通知率の50%まで)を判定するために、対応するメトリックを引き続き監視する。そうである場合、ユーザは、上記のように通知される。そうでない場合、チケットは再度オープンされ、ユーザは、問題が解決されていないことが通知される。
【0040】
簡単にするために、S215~S250は、単一のメトリックに関して上述されている。S215において、2つ以上のメトリックが評価されてもよく、メトリックがそのしきい値を超えると決定されるときはいつでも、プロセス200の残りのステップがそのメトリックに対して実行され、一方、S215は、それらのそれぞれのしきい値を超えていない他のメトリックを引き続き評価することに留意されたい。
【0041】
メトリックに関連付けられたしきい値は、問題が識別される時間を決定する。低いしきい値は、問題があまりにも長く「検出されない」ままにならないことを確実にする。一方、いかなる対応する技術的問題がなくても、遅延が定期的に発生する場合、偽陽性を回避するために、しきい値を増加させることが望ましい。
【0042】
いくつかの実施形態によれば、しきい値は、履歴性能に関して定義され得る。この定義は、ルールベースであってもよく、しきい値は、定義に基づいて周期的に再計算されてもよい。一例では、しきい値は、履歴ランタイムに関して定義される。たとえば、しきい値は、プロセスの95%が完了するプロセスランタイムとして定義されてもよい。そのようなアプローチは、実際の問題を依然として検出しながら、偽陽性を最小限に抑え得る。この値は、分析コストが、問題のタイムリーな識別よりも懸念されるものである場合、(たとえば、98%、99%まで)増加され、または、早期の問題の検出がより重要である場合には、(たとえば、65%まで)減少されてもよい。
【0043】
図8は、いくつかの実施形態による、メトリックに関連付けられたしきい値の設定を示す。メトリックは、特定のプロセスの完了であり、グラフ800は、完了した開始されたプロセスのパーセンテージを経時的に示す。グラフ800は、開始されたプロセスの98%が時間t
2までに完了し、メトリックに関連付けられた現在のしきい値が時間t
2であることを示すと仮定される。完了パーセンテージを95%まで減少させることが望ましい場合がある。この値は時間t
2'に対応するので、メトリックに関連付けられたしきい値はt
2'まで減少する。
【0044】
同様に、特定のメトリックのカウント制限は、固定であっても可変であってもよい。カウント制限の設定は、対応するプロセスが実行される頻度に依存し得る。具体的には、非常に頻繁に開始されるプロセスは、低カウント制限に迅速に達し、より高いカウント制限に関連付けられるものとし、一方、まれに開始されるプロセスは、対応する技術的問題が検出されるまでの時間を短縮するために、より低いカウント制限に関連付けられ得る。
【0045】
図9は、アーキテクチャ900を示しており、同様の構成要素には、
図1の対応する構成要素と同じ番号が付けられている。アーキテクチャ900は、ユーザ時間正規化器166、職場人事システム190、および祝日データ195をさらに含む。ユーザ時間正規化器166は、メトリックしきい値の評価中に「勤務時間」を考慮に入れる際にアラートエンジン162を支援するために、職場人事システム190および祝日データ195と通信し得る。実施形態は、技術的問題を検出するために、全体的なプロセス時間をしきい値と比較するので、それらの時間は、典型的には、技術的問題が存在するかどうかに関連しないので、全体的なプロセス時間における非労働時間(たとえば、週末、休日、休暇日、病気の日など)を無視することが有益であり得る。
【0046】
たとえば、メッセージが業務時間の終了の直前に送信され、受信側ユーザが翌朝にタイムリーに反応する場合、介在時間は、特に、応答が受信されない勤務日の開始時に送信された要求から勤務日の終わりまでの経過時間と比較して、全体的な処理時間の一部と見なされないものとする。同様の事柄は、メッセージが金曜日の終わりに送信され、受信ユーザが翌月曜日の午前中に応答する場合にも当てはまる。
【0047】
後者の場合、勤務曜日および勤務休日は、ユーザが働いている地域に依存する。ユーザの場所は、職場HRシステム190から取得することができ、その場所の勤務曜日および勤務休日は、祝日データ195から読み取ることができる。場所はまた、ユーザタイムゾーンを確立し、全体のプロセス時間から対応する非労働時間を除外することを可能にする。職場HRシステム190はまた、除外するためのユーザ固有の休日期間を提供してもよい。
【0048】
いくつかの実施形態によれば、ユーザの勤務時間は、ユーザが定期的に勤務するシステムのログイン時間から導出することができる。そのような特徴は、パートタイムユーザまたは残業しているユーザの場合に、全体のプロセス時間を決定するのに有益であり得る。
【0049】
図10は、いくつかの実施形態によるコンピューティングシステムのブロック図である。システム1000は、汎用コンピューティング装置を備えていてもよく、限定はしないが、プロセス200を含む、本明細書で説明される機能のいずれかを実行するためのプログラムコードを実行し得る。システム1000は、スタンドアロンコンピューティングデバイス、分散クラウドベースのサーバ、または他のシステムによって実装され得、いくつかの実施形態による他の図示されていない要素を含み得る。
【0050】
システム1000は、I/Oデバイス1020、データ記憶デバイス1030、1つまたは複数の入力デバイス1040、1つまたは複数の出力デバイス1050、およびメモリ1060に動作可能に結合された処理ユニット1010を含む。I/Oデバイス1020は、外部ネットワーク、クラウド、またはデータ記憶デバイスなどの外部デバイスとの通信を容易にし得る。入力デバイス1040は、たとえば、キーボード、キーパッド、マウス、または他のポインティングデバイス、マイクロフォン、ノブまたはスイッチ、赤外線(IR)ポート、ドッキングステーション、および/またはタッチスクリーンを備え得る。入力デバイス1040は、たとえば、システム1000に情報を入力するために使用され得る。出力デバイス1050は、たとえば、ディスプレイ(たとえば、ディスプレイスクリーン)、スピーカ、および/またはプリンタを備え得る。
【0051】
データ記憶デバイス1030は、磁気記憶デバイス(たとえば、磁気テープ、ハードディスクドライブ、およびフラッシュメモリ)、光記憶デバイス、読取り専用メモリ(ROM)デバイス、およびRAMデバイスの組合せを含む、任意の適切な永続的記憶デバイスを備え得、メモリ1060は、RAMデバイスを備え得る。
【0052】
データ記憶デバイス1030は、処理ユニット1010によって実行され、システム1000に、構成要素のいずれかを実装させ、本明細書で説明するプロセスのうちのいずれか1つまたは複数を実行させるプログラムコードを記憶する。実施形態は、単一のコンピューティングデバイスによるこれらのプロセスの実行に限定されない。データ記憶デバイス1030はまた、追加の機能を提供するための、および/またはデバイスドライバ、オペレーティングシステムファイルなどのシステム1000の動作に必要なデータおよび他のプログラムコードを記憶し得る。
【0053】
上記の図は、いくつかの実施形態によるプロセスを説明するための論理アーキテクチャを表し、実際の実装形態は、他の方式で配列されたより多くのまたは異なる構成要素を含み得る。他のトポロジーが、他の実施形態とともに使用されてもよい。さらに、本明細書で説明される各構成要素またはデバイスは、任意の数の他のパブリックおよび/またはプライベートネットワークを介して通信する任意の数のデバイスによって実装され得る。そのようなコンピューティングデバイスのうちの2つ以上は、互いに離れて配置されてもよく、任意の既知の方法のネットワークおよび/または専用接続を介して互いに通信してもよい。各構成要素またはデバイスは、本明細書で説明する機能ならびに任意の他の機能を提供するのに適した任意の数のハードウェアおよび/またはソフトウェア要素を備え得る。たとえば、いくつかの実施形態の実装で使用される任意のコンピューティングデバイスは、コンピューティングデバイスが本明細書で説明されるように動作するように、プログラムコードを実行するためのプロセッサを含み得る。
【0054】
本明細書に記載される実施形態は、単に例示のためのものである。当業者は、他の実施形態が、上述したものに対する修正および変更を伴って実施され得ることを認識するであろう。
【符号の説明】
【0055】
100 システム
112 アプリケーション
114 アプリケーション
116 アプリケーション
120 ユーザインターフェース(UI)層
132 ユーザ
134 ユーザ
136 ユーザ
150 アプリケーション監視コンポーネント
160 発行通知システム
162 アラートエンジン
164 メトリック定義
166 ユーザ時間正規化器
170 メッセージングコンポーネント
180 問題追跡システム
185 ユーザ
190 職場人事システム
195 祝日データ
200 プロセス
900 アーキテクチャ
1000 システム
1010 処理ユニット
1020 I/Oデバイス
1030 データ記憶デバイス
1040 入力デバイス
1050 出力デバイス
1060 メモリ
【外国語明細書】