IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユーアイパス,インコーポレイテッドの特許一覧

<>
  • 特表-説明可能なプロセス予測 図1
  • 特表-説明可能なプロセス予測 図2
  • 特表-説明可能なプロセス予測 図3
  • 特表-説明可能なプロセス予測 図4
  • 特表-説明可能なプロセス予測 図5
  • 特表-説明可能なプロセス予測 図6
  • 特表-説明可能なプロセス予測 図7A
  • 特表-説明可能なプロセス予測 図7B
  • 特表-説明可能なプロセス予測 図7C
  • 特表-説明可能なプロセス予測 図8
  • 特表-説明可能なプロセス予測 図9
  • 特表-説明可能なプロセス予測 図10
  • 特表-説明可能なプロセス予測 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-02-27
(54)【発明の名称】説明可能なプロセス予測
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230217BHJP
【FI】
G06N20/00
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2021569965
(86)(22)【出願日】2020-09-04
(85)【翻訳文提出日】2022-02-02
(86)【国際出願番号】 US2020049302
(87)【国際公開番号】W WO2021137901
(87)【国際公開日】2021-07-08
(31)【優先権主張番号】16/729,971
(32)【優先日】2019-12-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】520262319
【氏名又は名称】ユーアイパス,インコーポレイテッド
【氏名又は名称原語表記】UiPath,Inc.
【住所又は居所原語表記】1 Vanderbilt Avenue, 60th Floor, New York, NY 10017, United States of America
(74)【代理人】
【識別番号】100180781
【弁理士】
【氏名又は名称】安達 友和
(74)【代理人】
【識別番号】100182903
【弁理士】
【氏名又は名称】福田 武慶
(72)【発明者】
【氏名】スチープンス,ローランド ヨハナス
(72)【発明者】
【氏名】バーホフ,セリーヌ
(57)【要約】
実行中のプロセスに関連する1または複数のプロセスパラメータについて、1または複数の機械学習に基づく予測モデルを使用して、予測を生成する方法およびシステムが提供される。生成された予測に対応し、生成された予測に関連する信頼性指標を含む説明指向のデータ要素が生成される。説明指向のデータ要素は、可視化プラットフォームの1または複数のダッシュボード内に提示される。説明指向のデータ要素は、機械学習に基づく予測モデルによって生成された事業プロセスパラメータの説明のための説明フレームワークを表現する際、ユーザーが予測の根拠を理解および信頼して、実行中のプロセスに対する有効かつ適切な介入が促進されるような様態で表現を行う。

【特許請求の範囲】
【請求項1】
実行中のプロセスに関連する1または複数のプロセスパラメータについて、1または複数の機械学習に基づく予測モデルを使用して予測を生成すること、
前記生成された予測に対応する説明指向のデータ要素を生成することであって、前記説明指向のデータ要素は、前記生成された予測に関連する信頼性指標を含むこと、および
前記説明指向のデータ要素を可視化プラットフォームの1または複数のダッシュボード内に提示すること、
を含む、コンピュータ実装方法。
【請求項2】
前記1または複数のプロセスパラメータは、前記実行中のプロセスの残り時間を示す残りプロセス時間パラメータを含む、請求項1に記載のコンピュータ実装方法。
【請求項3】
前記説明指向のデータ要素は、前記生成された予測のための説明フレームワークを表し、前記説明フレームワークは、前記1または複数の機械学習に基づく予測モデルに対してモデル非依存である、請求項1に記載のコンピュータ実装方法。
【請求項4】
予測を生成することは、
閉じられたケースを含むそれぞれの訓練セットを用いて、前記1または複数の機械学習に基づく予測モデルをオフラインモードで訓練することと、
前記実行中のプロセスについてオンラインモードで予測を生成するために、前記1または複数の機械学習に基づく予測モデルの中から特定の訓練されたモデルを選択することと、
をさらに含む、請求項3に記載のコンピュータ実装方法。
【請求項5】
前記1または複数の機械学習に基づく予測モデルを訓練することは、
閉じられたケースのイベントログからプレフィックストレースを抽出することと、
前記抽出されたプレフィックストレースを、前記抽出されたプレフィックストレースのそれぞれにおける最後の既知のアクティビティに基づいて、1または複数のバケットに関連付けることと、
前記抽出されたプレフィックストレースを、前記1または複数のバケットのそれぞれに関連付けられた特徴ベクトルにエンコードして、前記1または複数のバケットのそれぞれについて、それぞれの訓練済みモデルを生成することと、を含む、請求項4に記載のコンピュータ実装方法。
【請求項6】
前記説明指向のデータ要素を生成することは、
前記1または複数のプロセスパラメータに関連する予測値に特徴がどのように寄与したかを示す特徴寄与データ要素を生成すること、
を含む、請求項5に記載のコンピュータ実装方法。
【請求項7】
前記説明指向のデータ要素を生成することは、
近隣の類似したケースから比較属性を特定および適用すること、
をさらに含む、請求項6に記載のコンピュータ実装方法。
【請求項8】
前記説明指向のデータ要素を生成することは、
前記実行中のプロセスの予測されたプロセスパラメータを前記近隣の前記類似したケースと比較して、前記実行中のプロセスの前記予測されたプロセスパラメータについて信頼性指標を導出すること、
をさらに含む、請求項7に記載のコンピュータ実装方法。
【請求項9】
前記1または複数のダッシュボードは、概要ダッシュボード、寄与ダッシュボード、および訓練データダッシュボードからなる群から選択されたダッシュボードを含む、請求項7に記載のコンピュータ実装方法。
【請求項10】
前記概要ダッシュボードは、現在のアクティビティ、予測される終了時間、期日、経過時間、予測間隔での予測残り時間、および予測の信頼度からなる群から選択された1または複数のパラメータを含む、選択された開かれたケースにおける残り時間予測のビューを提供するように構成される、請求項9に記載のコンピュータ実装方法。
【請求項11】
前記寄与ダッシュボードは、選択された開かれたケースの特徴寄与のビューを提供するように構成される、請求項9に記載のコンピュータ実装方法。
【請求項12】
前記訓練データダッシュボードは、訓練データの調査、特定の近傍の選択、および前記特定の近隣のケースからの予測を容易にする1または複数のビューを提供するように構成される、請求項9に記載のコンピュータ実装方法。
【請求項13】
コンピュータ命令を格納するメモリと、
前記コンピュータ命令を実行するように構成された少なくとも1つのプロセッサと
を含むシステムであって、
前記コンピュータ命令は、
実行中のプロセスに関連する1または複数のプロセスパラメータについて、1または複数の機械学習に基づく予測モデルを使用して、予測を生成すること、
前記生成された予測に対応する説明指向のデータ要素を生成することであって、前記説明指向のデータ要素は、前記生成された予測に関連する信頼性指標を含むこと、および
前記説明指向のデータ要素を可視化プラットフォームの1または複数のダッシュボード内に提示すること、
の動作を前記少なくとも1つのプロセッサに実行させるように構成される、
システム。
【請求項14】
前記1または複数のプロセスパラメータは、前記実行中のプロセスの残り時間を示す残りプロセス時間パラメータを含む、請求項13に記載のシステム。
【請求項15】
前記説明指向のデータ要素は、前記生成された予測のための説明フレームワークを表し、前記説明フレームワークは、前記1または複数の機械学習に基づく予測モデルに対してモデル非依存である、請求項14に記載のシステム。
【請求項16】
予測を生成することは、
閉じられたケースを含むそれぞれの訓練セットを用いて、前記1または複数の機械学習に基づく予測モデルをオフラインモードで訓練することと、
前記実行中のプロセスについて予測をオンラインモードで生成するために、前記1または複数の機械学習に基づく予測モデルの中から特定の訓練されたモデルを選択することと、さらに含む、請求項14に記載のシステム。
【請求項17】
前記1または複数の機械学習に基づく予測モデルを訓練することは、
閉じられたケースのイベントログからプレフィックストレースを抽出することと、
前記抽出されたプレフィックストレースを、前記抽出されたプレフィックストレースのそれぞれにおける最後の既知のアクティビティに基づいて、1または複数のバケットに関連付けることと、
前記抽出されたプレフィックストレースを、前記1または複数のバケットのそれぞれに関連付けられた特徴ベクトルにエンコードして、前記1または複数のバケットのそれぞれについて、それぞれの訓練済みモデルを生成することと、
を含む、請求項16に記載のシステム。
【請求項18】
前記説明指向のデータ要素を生成することは、
前記残りプロセス時間パラメータに関連する予測値に特徴がどのように寄与したかを示す特徴寄与データ要素を生成することを含む、請求項17に記載のシステム。
【請求項19】
前記説明指向のデータ要素を生成することは、
近隣の類似したケースから比較属性を特定および適用することをさらに含む、請求項18に記載のシステム。
【請求項20】
前記1または複数のダッシュボードは、概要ダッシュボード、寄与ダッシュボード、および訓練データダッシュボードからなる群から選択されたダッシュボードを含む、請求項19に記載のシステム。
【請求項21】
非一時的なコンピュータ読み取り可能な媒体上に格納されたコンピュータプログラムであって、前記コンピュータプログラムは、
実行中のプロセスに関連する1または複数のプロセスパラメータについて、1または複数の機械学習に基づく予測モデルを使用して、予測を生成すること、
前記生成された予測に対応する説明指向のデータ要素を生成することであって、前記説明指向のデータ要素は、前記生成された予測に関連する信頼性指標を含むこと、および
前記説明指向のデータ要素を、可視化プラットフォームの1または複数のダッシュボード内に提示すること、
を含む動作を少なくとも1つのプロセッサに実行させるように構成される、コンピュータプログラム
【請求項22】
前記説明指向のデータ要素は、前記生成された予測のための説明フレームワークを表し、前記説明フレームワークは、前記1または複数の機械学習に基づく予測モデルに対してモデル非依存である、請求項21に記載のコンピュータプログラム。
【請求項23】
予測を生成することは、
閉じられたケースを含むそれぞれの訓練セットを用いて、前記1または複数の機械学習に基づく予測モデルをオフラインモードで訓練することと、
前記実行中のプロセスについて予測をオンラインモードで生成するために、前記1または複数の機械学習に基づく予測モデルの中から特定の訓練されたモデルを選択することと、
をさらに含む、請求項22に記載のコンピュータプログラム。
【請求項24】
前記説明指向のデータ要素を生成することは、
前記1または複数のプロセスパラメータに関連する予測値に特徴がどのように寄与したかを示す特徴寄与データ要素を生成することと、
近隣の類似したケースから比較属性を特定および適用することと、
をさらに含む、請求項23に記載のコンピュータプログラム。
【請求項25】
前記1または複数のダッシュボードは、概要ダッシュボード、寄与ダッシュボード、および訓練データダッシュボードからなる群から選択されたダッシュボードを含む、請求項21に記載のコンピュータプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願への相互参照)
本出願は、2019年12月30日に出願された米国特許出願第16/729,971号の優先権を主張し、その開示は、その全体が参照により本明細書に組み込まれる。
【0002】
本開示は概して、プロセスマイニングに関し、より詳細には、実行中のプロセスにおいて予測される事業プロセスパラメータを理解するための説明フレームワークに関する。
【背景技術】
【0003】
事業において、プロセスの監視および改善のために、プロセスの実行に関する大量のデータが格納される。プロセスマイニング技術は、プロセスモデルの発見、適合性の確認、プロセスモデルの改善、および開かれたケース(実行中のプロセスなど)における動作の予測などのさまざまな目的のために、この格納されたデータから知見を導き出すために使用される。
【0004】
従来のプロセスマイニング技術においては、プロセスの現在の動作に関する知見の提供のために、履歴データが用いられる。予測コンポーネントをプロセスマイニングに統合することにより、進行中のプロセスの実行時における例えばユーザーによる介入が容易になり得る。典型的には、予測コンポーネントは、機械学習モデルを使用して予測を行う必要がある。予測精度の向上のために、複雑な機械学習モデルが使用可能であるものの、これらのモデルの決定論理は、理解することが困難である。一般的に、モデルがどのように動作するか(例えば、グローバル)および/または特定の予測がどのように得られるか(例えば、ローカル)についての説明が提供され得る。モデルの決定論理を理解すること、特に特定の予測がどのように得られるかを理解することは、プロセスに介入する前に予測を信頼できなければならないユーザーにとって重要な考慮事項である。
【0005】
説明可能な機械学習に対する現在のアプローチは、機械学習の一般的適用に向けられており、プロセス予測の領域においては有効ではない。例えば、いくつかの現在のアプローチは、モデルの意思決定ロジックを説明するための特定の技術を提供するものがあるが、実行可能な意思決定および介入がプロセス実行中に実行され得るように、ユーザーがモデルによって生成された予測を信頼できるようにするために必要な説明を提供することはできない。
【発明の概要】
【0006】
これらおよびその他の問題は、様々な実施形態によって、機械学習に基づく予測モデルによって生成された予測された事業プロセスパラメータを説明するための説明フレームワーク(例えば、特定の予測がどのようにして得られたかの説明を提供する)を提供し、実行中のプロセスへの有効かつ適切な介入を容易にするために、ユーザーが予測の根拠を理解して信頼できるような方法で、対処される。
【0007】
実施形態では、実行中のプロセスに関連する1または複数のプロセスパラメータのために、1または複数の機械学習に基づく予測モデルを使用して、予測を生成するコンピュータ実装方法が提供される。生成された予測に対応する説明指向のデータ要素が生成され、説明指向のデータ要素は、生成された予測に関連する信頼性指標を含む。説明指向のデータ要素は、可視化プラットフォームの1または複数のダッシュボードに提示される。
【0008】
他の実施形態は、上述したコンピュータで実施する方法に従って、非一時的なコンピュータ読み取り可能な媒体に格納されたシステムおよびコンピュータプログラムを含む。
【0009】
1または複数の実施形態によると、プロセスパラメータは、例えば、実行中のプロセスの残り時間を示す、残りプロセス時間パラメータであり得る。様々な実施形態によると、説明指向のデータ要素は、生成された予測のための説明フレームワークを表し、説明フレームワークはモデル非依存型である一方、機械学習に基づく予測モデルは、予測のために使用され得る。1または複数の実施形態において、予測を生成することは、閉じられたケースを含むそれぞれの訓練セットを使用して機械学習に基づく予測モデルをオフラインモードで訓練することと、実行中のプロセスについて予測をオンラインモードで生成するために特定の訓練されたモデルを選択することとを含む。機械学習に基づく予測モデルを訓練することは、閉じられたケースのイベントログからプレフィックストレースを抽出することと、抽出されたプレフィックストレースのそれぞれにおける最後の既知のアクティビティに基づいて、抽出されたプレフィックストレースをバケットに関連付けることと、バケットのそれぞれに関連する特徴ベクトルに抽出されたプレフィックストレースをエンコードして、バケットそれぞれについてそれぞれの訓練されたモデルを生成することとを含み得る。様々な実施形態によると、説明指向のデータ要素を生成することは、特徴が予測値にどのように寄与したかを示す特徴寄与データ要素を生成することを含む。いくつかの例では、近隣の類似ケースからの比較属性が特定され、適用される。例えば、実行中のプロセスの予測されたプロセスパラメータを近隣の類似したケースと比較して、実行中のプロセスの予測されたプロセスパラメータのための信頼性指標を導出し得る。様々な実施形態において、可視化プラットフォームのダッシュボードは、概要ダッシュボード(例えば、開かれたケースのアクティビティの残り時間予測を示すためのもの)、寄与ダッシュボード(例えば、特徴寄与を示すためのもの)、および訓練データダッシュボード(例えば、訓練データの検査を容易にするためのもの)を含み得る。
【0010】
これらおよび他の利点は、以下の詳細な説明および添付の図面を参照することにより、当業者に明らかとなるであろう。
【図面の簡単な説明】
【0011】
図1】様々な実施形態で使用するための例示的な事業プロセスを示す。
【0012】
図2】1または複数の実施形態による方法のフローチャートを示す。
【0013】
図3】1または複数の実施形態によるプロセスパラメータを予測するための方法のフローチャートを示す。
【0014】
図4】1または複数の実施形態による例示的なダッシュボード構成のブロック図である。
【0015】
図5】1または複数の実施形態による視覚化プラットフォームからのダッシュボードの特徴を示すスクリーンショットである。
【0016】
図6】1または複数の実施形態による視覚化プラットフォームからのダッシュボードの特徴を示すスクリーンショットである。
【0017】
図7A】1または複数の実施形態によるダッシュボードビュー形態において提示される特徴寄与(例えば、特徴が属性に基づいている場合)の様々な例を示す。
図7B】1または複数の実施形態によるダッシュボードビュー形態において提示される特徴寄与(例えば、特徴が属性に基づいている場合)の様々な例を示す。
図7C】1または複数の実施形態によるダッシュボードビュー形態において提示される特徴寄与(例えば、特徴が属性に基づいている場合)の様々な例を示す。
【0018】
図8】1または複数の実施形態による視覚化プラットフォームからの訓練データダッシュボードの特徴を示す様々なスクリーンショットを示す。
図9】1または複数の実施形態による視覚化プラットフォームからの訓練データダッシュボードの特徴を示す様々なスクリーンショットを示す。
図10】1または複数の実施形態による視覚化プラットフォームからの訓練データダッシュボードの特徴を示す様々なスクリーンショットを示す。
【0019】
図11】1または複数の実施形態によるコンピューティングシステムの高レベルブロック図を示す。
【発明を実施するための形態】
【0020】
(詳細な説明)
本明細書に記載される様々な実施形態は、任意の種類のプロセスまたはワークフローに適用可能であり、これは、例えば、ロボティックプロセスオートメーション(RPA)で実施されたプロセスを含む様々な方法で実施され得る。そのため、本明細書で説明する例は、例示を目的としており、いかなる様態においても制限するものではない。
【0021】
図1は、様々な実施形態の有利な適用が可能な、請求書の支払いに関連する事業プロセスの例を示す。開始点101から開始され、終了点160において終了するプロセス100は、連続してまたは並行して実行され得る様々なアクティビティおよびパスを含む。いくつかのアクティビティは、処理される請求書の性質、有効であり得る特定のプロセス制御などに応じて、条件付きで実施され得る。簡潔にするために、典型的な事業プロセスに関連し得る複数のアクティビティを説明するために、一般的な説明のみを提供する。
【0022】
示されているように、プロセス100は、以下のアクティビティを含む:請求書を受け取ること(アクティビティ105)、受け取った請求書をチェックすること(アクティビティ110)、データを要求すること(アクティビティ115)、契約条件をチェックすること(アクティビティ120)、請求書の最終チェックを行うこと(アクティビティ125)、請求書を承認すること(アクティビティ130)、請求書を支払うこと(アクティビティ135)、さらなるデータが要求されていない場合または契約条件がチェックされていない場合に請求書をチェックおよび承認すること(アクティビティ140)、ならびに従業員へ払い戻しを行うこと(アクティビティ150)。プロセス100の実行に関連するデータは、典型的にはイベントログに格納され、これは、プロセス100中の様々なアクティビティの実行を表す1組のイベントであり得る。開かれたケースの完了までの残り時間(例えば、プロセス100が実行されている間)は、ユーザー(例えば、ビジネスアナリスト)が必要に応じて介入できるように、監視および予測することが有用であるプロセスパラメータの一例である。例えば、開かれたケースを完了するための残り時間の予測が期限を超えた場合、ユーザーはアクションを起こすことを決定し、プロセス実行に介入し得る。ただし、このような介入を最も有効にかつ混乱を最小限にしつつ行うためには、ユーザーは予測を信頼できなければならない。
【0023】
本明細書に記載されている様々な実施形態によると、実行中のプロセスへの有効かつ適切な介入の促進のために、ユーザーが予測の根拠を理解して信頼できるように、機械学習に基づくモデルによって生成された予測を説明するための説明フレームワークが記載される。図2は、様々な実施形態による方法200を示す高レベルフローチャートを示す。ステップ205では、実行中のプロセスに関連する1または複数のプロセスパラメータのための予測を生成するために、1または複数の機械学習に基づく予測モデルが使用される。説明したように、そのようなプロセスパラメータの1つは、残りのプロセス時間であり、これは、実行中のプロセスの残りの時間、例えば、各アクティビティにおける残りのプロセス時間などを示す。
【0024】
ステップ210では、生成された予測に対応する、説明指向のデータ要素が生成される。説明指向のデータ要素は、生成された予測に関連する信頼性指標(例えば、信頼が低いまたは高いなど)を含み得る。説明指向のデータ要素は、生成された予測に対する説明フレームワークの代表である。以下でさらに詳細に説明されるように、説明フレームワークは、モデル非依存であり得、これは、予測を行うために1または複数の機械学習に基づく予測モデルが選択される場合に有益であり得る。
【0025】
ステップ215で、説明指向のデータ要素は、可視化プラットフォームの1または複数のダッシュボード内に提示される。説明フレームワークの視覚化は、介入が必要になり得るケースをユーザが有効(かつタイムリーに)特定するのに役立つ。
【0026】
図3は、1または複数の実施形態によるプロセスパラメータ(例えば、残りのプロセス時間)を予測するための方法300を示すフローチャートを示す。ブロック301に示すように、1または複数の機械学習に基づく予測モデルが、オフラインモード(フェーズ)において、閉じられたケースを含むそれぞれの訓練セットを使用して訓練され、ブロック350において、特定の訓練されたモデルが、実行中のプロセス(例えば、開かれたケース)についてオンラインモード(フェーズ)で予測を生成するために選択される。
【0027】
ステップ306において、プレフィックストレースがイベントログ305から抽出され、抽出されたプレフィックスログ307に格納される。ステップ310において、プレフィックストレースの最後の既知のアクティビティに基づいてバケットにプレフィックストレースを割り当てるバケット化アプローチが適用される(例えば、バケット1に対応するトレースについてはブロック315として示され、バケットnに対応するトレースについてはブロック316として示される)。次に、プレフィックストレースは、対応する各バケットについてステップ320において特徴ベクトルにエンコードされ、例えば、バケット1に対応するエンコードされた特徴ベクトルについてはブロック321として示され、バケットnに対応するエンコードされた特徴ベクトルについてはブロック322として示される。ステップ330において、エンコードされた特徴ベクトルは、各バケットに対応する機械学習に基づく予測モデルを訓練するための入力として使用され、例えば、バケット1に対応する訓練されたモデルについてブロック331として示され、バケットnに対応する訓練されたモデルについてブロック332として示される。
【0028】
オンラインモード(ブロック350)では、開かれたケース351からのプレフィックストレースがステップ355においてエンコードされて、ステップ360において特徴ベクトルが生成される。ステップ365において、機械学習に基づくモデルは、格納された訓練されたモデルの中から選択され(例えば、ブロック331、332などで)、次いで、開かれたケースについて(例えば、残りのプロセス時間の)予測をステップ370において行うために使用され、それによって、ステップ371で予測結果を生成する。一例では、特定の訓練されたモデルを選択することは、開かれたケース(実行中のプロセス)に関連する特徴ベクトルにエンコードされた部分的なプレフィックストレースに基づいて、それぞれの訓練されたモデルを特定することを含む。
【0029】
様々な機械学習に基づくモデルが、説明した実施形態による予測を行うのに適し得る。非限定的な一例では、回帰アルゴリズムに基づく勾配ブースティングモデルが、その速度と実際的適用における有用性のために使用され得る。例えば、高品質の予測が、複数の機械学習モデルを使用して、単一のモデルから得られ得るよりも優れた予測品質を得る、いわゆるアンサンブル法によって得られ得る。勾配ブースティングモデルの場合、新しいモデルがアンサンブルに順次追加され得る。勾配ブースティングモデルの様々な実施の詳細は知られており、本明細書では詳細に説明しない。しかし、予測モデルの複雑性の取り扱いに関して、以下の議論は、説明された実施形態の文脈におけるこのような機械学習に基づくモデルの適用を理解するのに役立つであろう。
【0030】
詳細には、開示された実施形態において、予測を行うための機械学習に基づくモデルを適用するために(例えば、訓練時間、予測時間などを短縮するために)、様々な設計上の考慮事項が考慮され得る。例えば、Nは訓練データのサイズであり、Tは反復回数であり、dは前述の特徴ベクトルの次元であると仮定する。一実施形態では、勾配ブーストモデルを訓練するために得られる実行時間は、O(TdN)時間によって表され得、開かれたケースにおいて予測を行うための実行時間は、O(T)時間によって表され得る。したがって、次いで、訓練時間を短縮するために、例えば、訓練データのサイズNおよび特徴ベクトルの次元dを小さくするなどの設計上の選択を行い得る。
【0031】
プレフィックス抽出(例えば、図3のステップ306)に関しては、完全なトレースの最大/個のプレフィックスをランダムなギャップサイズgと共に選択することにより、サイズNの訓練データへの限定が得られ得る。この選択肢により、多くのアクティビティを実行し得るケースに対するバイアス可能性も排除される。また、サイズNの訓練データへの限定は、現在のプロセスモデルに従ったプロセス実行を有するトレースのみを考慮することによっても可能である。
【0032】
トレースのバケット化(ステップ310)に関して、プレフィックストレースを最後の既知のアクティビティに基づいてバケットに分割して、より直感的な1組の類似のケースを生成することができるが、これについては以下でさらに詳細に説明する。この選択肢は、訓練時間にも良い影響を与える。最後のアクティビティのみが考慮される状態バケット化アプローチの適応も、バケットごとの直感的な基本値と、常に訓練されたモデルが開かれたケースでの予測のための選択に利用可能であるという保証とが有るため、有利になり得る。
【0033】
特徴エンコーディングについては、プレフィックストレースが特徴ベクトルにどのようにエンコードされるかも、以下でさらに詳細に説明するように、予測について提供される説明に影響を与え得る。したがって、別の選択肢として、ワンショットエンコーディングと組み合わせたアグリゲートエンコーディングを使用することができ、これにより、正確な予測と、よく解釈され得る特徴を得ることができる。
【0034】
属性の選択に関して、エンコードされる特徴の数を制限するために属性が選択され得、それによって訓練時間を短縮し、予測の説明における複雑さを軽減し得る(例えば、より複雑でない説明)。ある例で、属性は、属性のカテゴリの数およびカテゴリ間の残り時間の分布の違いに基づいて選択され得る。上述した様々な設計上の考慮事項は、例示を目的としており、いかなる様態においても限定するものではない。
【0035】
本明細書に記載される様々な実施形態によると、機械学習に基づくモデルによって生成された予測に対して説明フレームワークが提供される(例えば、生成された予測に対するより深い理解および信頼性(信頼)レベルをユーザーに提供するための残りのプロセス時間予測の説明(複数可))。そして、説明フレームワークは、可視化プラットフォームを通じてユーザーに提示され得る(例えば、生成された予測に対応する説明指向のデータ要素をユーザーに提供する)。予測を行うために使用される機械学習に基づくモデルは1つ以上存在し得るため、説明フレームワークは、1または複数の実施形態において、モデル非依存である。
【0036】
説明フレームワークを構築する際には、どの目標を達成するかおよび/または実用的に実施され得る方法に基づいて、様々な技術が採用および/または組み合わされ得る。1または複数の実施形態によると、説明フレームワークは、特徴寄与(例えば、特徴が予測値にどのように寄与したか)および/または類似ケース(例えば、近隣の類似ケースから比較属性を特定および適用すること)などのコンポーネント(方法論)に基づき得る。
【0037】
以下の表は、これらのコンポーネントのそれぞれの目的および方法をまとめたものである。
【表1】
【0038】
特徴寄与は、予測に至る詳細について理解をユーザーに提供するための説明フレームワークの一部を形成し得る。特徴寄与を決定することは、実行中のプロセスに関連する特徴ベクトルにエンコードされた1または複数の種類の属性に基づいて、値を計算し、解釈することを含む。例えば、予測されたパラメータ値に対する特徴寄与は、SHAP(シャプレー加算の説明)値の形で計算され得る。イベントログ内のプレフィックストレースは、それらが予測モデルの入力として使用され得るように、特徴ベクトルにエンコードされる。プレフィックストレース内のいくつかのタイプの属性(例えば、制御フロー属性、ケース属性、およびイベント属性)が、特徴ベクトルにエンコードされ得る。特徴ベクトル中の属性のエンコードは、特徴のSHAP値がどのように解釈されるかに直接影響する。
【0039】
類似ケースによる説明も、予測値の理解と、予測の信頼性の評価(例えば、信頼性指標)と、予測に対するプロセスの影響の理解とをユーザーに提供するために、説明フレームワークの一部を形成し得る。一例では、1組の類似したケースは、以下に基づき得る:(1)SHAP値(例えば、予測に対する類似の寄与に基づくケース間の類似性)、および/または(2)特徴ベクトル(例えば、ケース間の類似性は、類似の制御フローおよびデータ属性に基づく)。
【0040】
予測値を理解することに関して、ユーザーは、ケースが類似する場合、残りのプロセス時間も類似する仮定に基づいて、開かれたケースの予測された残りのプロセス時間をその近隣のケースの残りのプロセス時間と比較し得る。予測値の確実性についての知見をユーザーに提供するために、予測間隔が計算され得る。
【0041】
予測に対するプロセスの影響を理解するために、(開かれたケースの)近隣のケースのプロセス実行における次のステップでの平均予測値が計算され得る。計算された平均予測値(複数可)により、ユーザーは、どのアクティビティが実行されそうかを特定し、予測値が変化するアクティビティを特定し、予測確実性が変化するアクティビティを特定することができる。
【0042】
説明フレームワークは、(説明指向のデータ要素を介して)可視化プラットフォームの1または複数のダッシュボード内に提示される。一実施形態では、この情報はプラットフォーム上で実行するアプリケーションにおいて視覚化され、このアプリケーションは、いくつかのダッシュボードを含み得、これらのダッシュボードはそれぞれ、データセットの特定の態様を提示し得る。説明フレームワークの視覚化のために、ダッシュボードは、プロセスデータ用のテンプレートアプリケーションに統合され得る。
【0043】
1または複数の実施形態では、説明フレームワークのコンポーネントは、3つのダッシュボードにおいて視覚化され、これらのダッシュボードはそれぞれ、1または複数のダッシュボード項目を含み得る。図4は、概要ダッシュボード405と、寄与ダッシュボード430と、訓練データダッシュボード450とを含むテンプレート400の簡略図である。概要ダッシュボード405は、選択された開かれたケースの残り時間予測の図を表示して、ユーザーが調査したい予測を選択できるように構成され得る。寄与ダッシュボード430は、選択されたケースの予測に対する特徴寄与表示するように構成され得る。訓練データダッシュボード450は、訓練データに関連する様々な情報を表示するように構成され得る。一例では、訓練データダッシュボードは、ユーザーが近隣を選択/定義し、その近隣の訓練データを調査することを可能にするビュー416を含み得る。また、訓練データダッシュボードは、(開かれたケースの)同じ近隣のケースからのプロセス中の次のステップにおける予測を表示するビュー417を含み得る。
【0044】
図5は、概要ダッシュボード505、寄与ダッシュボード530、および訓練データダッシュボード550のタブを有する統合ダッシュボード500のスクリーンショットを示す。概要ダッシュボード505は、データセット内の開かれたケースについて、機械学習に基づくモデル(複数可)によって生成された予測の概要を表示するように構成される。この例では、このビューにおいて、各ケースについて、以下が含まれる:ケースID506;現在のアクティビティ507;予測される終了時間508;期日509;経過時間、予測間隔を有する予測された残り時間を示す棒グラフ510;および予測の信頼性(例えば、低い、高い)。この提示ビューおよびビュー内の要素は、ひとえに例示目的であり、いかなる様態においても限定的なものではない。
【0045】
図6は、概要ダッシュボード605、寄与ダッシュボード630、および訓練データダッシュボード650のタブを有する統合ダッシュボード600のスクリーンショットを示す。寄与ダッシュボード630は、予測値に対する特徴寄与に関連するデータを示すように構成される。この非限定的な例では、寄与ダッシュボード630は、選択されたケースの予測と、特徴寄与の概要とを示すダッシュボード項目631を含む。寄与ダッシュボード630は、この例では、ユーザーによる選択のために、ケース属性(例えば、ケースごとに単一の値を有する属性)、アクティビティ、およびイベント属性(例えば、異なるイベントに対して異なる値を有することができる属性、すなわち、ケース実行の過程で値が変化することができる属性)に対応する、3つのタブ(セクション632)を有するように構成される。各タブは、属性タイプごとの特徴寄与のビュー(セクション633)を示す。
【0046】
図7A図7Bおよび図7Cは、特徴寄与のサブセクションである3つの属性タイプを示す図である。図7Aは、ケース属性705を示し、この例では、ケース属性705は、ケースタイプ706(例えば、「高額請求書」、「少額請求書」など)および寄与707(例えば、時間寄与)を含む。ケース属性705について、この例示的なビューにおいて、選択されたケースyの属性値に対応しない属性値を「グレーアウト」して示す。図7Bは、アクティビティ710を示し、この例では、アクティビティ710は、アクティビティタイプ711、発生回数712、および寄与713を含む。この例示的な図は、実行中のビュー(例えば、実行中のプロセス)を示す。図7Cは、イベント属性715を示し、この例では、イベント属性715は、国716、発生回数717、および寄与718を含む。図7Bと同様に、この例示的なビューは、実行中のビュー(例えば、実行中のプロセス)を示す。
【0047】
図8は、概要ダッシュボード805、寄与ダッシュボード830、および訓練データダッシュボード850のタブを有する統合ダッシュボード800のスクリーンショットを示す。訓練データダッシュボード850は、訓練データの概要を示すように構成される。この非限定的な例では、訓練データダッシュボード850は、選択されたケースの予測とその信頼性(例えば、「高」)のビューを示すダッシュボード項目851を含む。ダッシュボード項目852は、訓練データの2次元(2D)視覚化を示すように構成される。ダッシュボード項目853は、選択された訓練データの残り時間の分布を示し、ダッシュボード項目854は、選択された訓練データに関する情報(例えば、いくつの記録が選択されたかなど)を示す。前述のスクリーンショットと同様に、この提示ビューおよびその内部の要素は、ひとえに例示目的のためのものであり、いかなる様態においても限定的なものではない。
【0048】
図9は、訓練データの47個の記録選択物と、残り時間の分布に関する関連情報と、選択された訓練データ中のケースの説明に関する関連情報とを示す提示ビュー900である。この例では、ダッシュボード項目952は、訓練データの2D視覚化を示し、ダッシュボード項目953は、選択された記録の残り時間を示し、ダッシュボード項目954は、選択された訓練データに関する追加情報(例えば、ケースオーナーによって選択された記録の割合など)を示す。
【0049】
図10は、概要ダッシュボード1005、寄与ダッシュボード1030、および訓練データダッシュボード1050のタブを有する統合ダッシュボード1000のスクリーンショットを示す。訓練データダッシュボード1050は、図10に表示され、近隣のケースのプロセスにおける次のステップでの予測を示すように構成される。この例では、ダッシュボード項目1060は、アクティビティを実行するケースの平均予測を示し、ダッシュボード項目1061は、プロセスモデルのグラフィック表現を示す。ここでも、上記スクリーンショットと同様に、提示ビューおよびその内部の要素は、ひとえに例示目的のためのものであり、いかなる様態においても限定的なものではない。
【0050】
図11は、実施形態による、本明細書で説明した方法を実行するように構成されたコンピューティングシステム1100を例示するブロック図である。いくつかの実施形態では、コンピューティングシステム1100は、本明細書に図示および/または記載された1または複数のコンピューティングシステムであってもよい。コンピューティングシステム1100は、情報を通信するためにバス1105または他の通信機構と、情報を処理するためのバス1105に結合されたプロセッサ(複数可)1110とを含む。プロセッサ(複数可)1110は、中央処理ユニット(CPU)、特定用途集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、グラフィックスプロセッシングユニット(GPU)、それらの複数のインスタンス、および/またはそれらのいずれかの組み合わせを含む、任意のタイプの汎用または特定用途向けのプロセッサであり得る。プロセッサ(複数可)1110はまた、複数の処理コアを有してもよく、コアの少なくとも一部は、特定の機能を行うように構成され得る。いくつかの実施形態では、複数並列処理が使用されてもよい。
【0051】
コンピューティングシステム1100は、プロセッサ(複数可)1110によって実行される情報および命令を格納するメモリ1115をさらに含む。メモリ1115は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、フラッシュメモリ、キャッシュ、磁気ディスクもしくは光ディスクなどの静的記憶装置、または他のタイプの非一時的なコンピュータ読み取り可能な媒体、あるいはそれらのいずれかの組み合わせで構成され得る。非一時的なコンピュータ読み取り可能な媒体は、プロセッサ(複数可)1110によりアクセス可能ないずれかの利用可能な媒体であり得、揮発性媒体、不揮発性媒体またはこれら両方を含み得る。また、媒体は、取り外し可能なもの、取り外し不可能なもの、またはこれら両方であり得る。
【0052】
さらに、コンピューティングシステム1100は、現在存在するまたは将来実施される通信規格および/またはプロトコルに従って無線および/または有線接続を介して通信ネットワークへのアクセスを提供するために、トランシーバなどの通信装置1120を含む。
【0053】
プロセッサ(複数可)1110は、ユーザーに情報を表示するのに適したディスプレイ1125にバス1105を介してさらに結合されている。ディスプレイ1125はまた、タッチディスプレイおよび/または任意の適切な触覚I/Oデバイスとして構成されてもよい。
【0054】
コンピュータマウス、タッチパッドなどのようなキーボード1130およびカーソル制御装置1135は、ユーザーがコンピューティングシステムとインターフェースをとることを可能にするために、バス1105にさらに結合されている。しかしながら、特定の実施形態では、物理的なキーボードおよびマウスが存在しない場合があり、ユーザーは、ディスプレイ1125および/またはタッチパッド(図示せず)のみを介してデバイスと対話することができる。任意の入力デバイスの種類および組み合わせが、設計の選択の問題として使用され得る。特定の実施形態では、物理的な入力装置および/またはディスプレイは存在しない。例えば、ユーザーは、コンピューティングシステム1100と通信している別のコンピューティングシステムを介してリモートでコンピューティングシステム1100と対話してもよいし、コンピューティングシステム500が自律的に動作してもよい。
【0055】
メモリ1115は、プロセッサ(複数可)1110により実行されたときに機能を提供するソフトウェアモジュールを格納する。モジュールは、コンピューティングシステム1100のためのオペレーティングシステム1140と、本明細書に記載されるプロセスの全部もしくは一部、またはその派生物を実行するように構成された1もしくは複数の追加機能モジュール1150とを含む。
【0056】
当業者であれば、「システム」は、本発明の範囲から逸脱することなく、サーバー、組み込みコンピューティングシステム、パーソナルコンピュータ、コンソール、パーソナルデジタルアシスタント(PDA)、携帯電話、タブレットコンピューティングデバイス、量子コンピューティングシステム、または他のいずれかの適切なコンピューティングデバイス、またはデバイスの組み合わせとして具現化され得ることを理解するであろう。上述した機能を「システム」により実行されるものとして提示することは、本発明の範囲を限定することを何ら意図するものではなく、本発明の多くの実施形態の一例を提供することを意図するものである。実際、本明細書に開示された方法、システム、および装置は、クラウドコンピューティングシステムを含むコンピューティング技術と整合性のある局所的様態および分散的様態で実装され得る。
【0057】
本明細書で説明するシステム特色のいくつかは、実施の独立性をより強調するために、モジュールとして提示されていることに留意すべきである。例えば、モジュールは、カスタムの超大型集積(VLSI)回路またはゲートアレイ、ロジックチップ、トランジスタ、または他の個別部品のような既製の半導体を含むハードウェア回路として実施され得る。また、モジュールは、フィールドプログラマブルゲートアレイ、プログラマブルアレイロジック、プログラマブルロジック装置、グラフィックス処理ユニットなどのプログラマブルハードウェア装置に実施され得る。モジュールはまた、様々なタイプのプロセッサにより実行されるためのソフトウェアに少なくとも部分的に実施され得る。例えば、実行可能コードの特定された単位は、例えば、オブジェクト、プロシージャ、または関数として編成され得るコンピュータ命令の1または複数の物理的または論理的なブロックを含み得る。それにもかかわらず、実行可能な特定されたモジュールは、物理的に一緒に配置されている必要はなく、論理的に結合されたときにモジュールを含み、モジュールのために述べられた目的を達成するために、異なる場所に格納された別々の命令を含み得る。さらに、モジュールは、例えば、ハードディスクドライブ、フラッシュ装置、RAM、テープのようなコンピュータ読み取り可能な媒体、および/または本発明の範囲から逸脱することなくデータを格納するために使用される他のいずれかの非一時的なコンピュータ読み取り可能な媒体に格納され得る。実際、実行可能コードのモジュールは、単一の命令であってもよいし、多数の命令であってもよいし、さらには、複数の異なるコードセグメント、異なるプログラム間、および複数のメモリ装置間に分散されていてもよい。同様に、操作データは、モジュール内で特定され、ここで示されてもよく、いずれかの適切なタイプのデータ構造体内でいずれかの適切な形態で具現化され、組織化され得る。操作データは、単一のデータセットとして収集されてもよいし、または異なる記憶装置にわたり異なる場所に分散されてもよく、単にシステムまたはネットワーク上の電子信号として少なくとも部分的に存在していてもよい。
【0058】
上記は、単に開示の原則を例示しているに過ぎない。したがって、本明細書に明示的に記載または示されていないが、本開示の原理を具現化し、その精神および範囲内に含まれる様々なアレンジを、当業者が考案することができることが理解されるであろう。さらに、本明細書に引用された全ての実施例および条件文言は、主として、本開示の原理および本発明者が技術の発展に貢献した概念を理解するための読者を助けるための教育的な目的のみを意図しており、そのような具体的に引用された実施例および条件に限定されないものとして解釈されるべきである。さらに、本開示の原理、態様、および実施形態、ならびにそれらの具体的な実施例を引用する本明細書の全ての記述は、それらの構造的および機能的等価物を包含することを意図する。さらに、このような等価物には、現在知られている等価物だけでなく、将来開発される等価物も含まれることが意図される。

図1
図2
図3
図4
図5
図6
図7A
図7B
図7C
図8
図9
図10
図11
【国際調査報告】