特開2023-70074 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ユーアイパス，インコーポレイテッドの特許一覧

特開2023-70074ロボティックプロセスオートメーションのための長時間実行ワークフローを使用した人工知能フローの構築および管理

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6A
6B
7
8A
8B
8C
9
10
11

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023070074

(43)【公開日】2023-05-18

(54)【発明の名称】ロボティックプロセスオートメーションのための長時間実行ワークフローを使用した人工知能フローの構築および管理

(51)【国際特許分類】

G06N 20/00 20190101AFI20230511BHJP

【ＦＩ】

G06N20/00

【審査請求】未請求

【請求項の数】28

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2022159911

(22)【出願日】2022-10-04

(31)【優先権主張番号】17/518,855

(32)【優先日】2021-11-04

(33)【優先権主張国・地域又は機関】US

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＺＩＧＢＥＥ

２．ＢＬＵＥＴＯＯＴＨ

(71)【出願人】

【識別番号】520262319

【氏名又は名称】ユーアイパス，インコーポレイテッド

【氏名又は名称原語表記】ＵｉＰａｔｈ，Ｉｎｃ．

【住所又は居所原語表記】１ＶａｎｄｅｒｂｉｌｔＡｖｅｎｕｅ，６０ｔｈＦｌｏｏｒ，ＮｅｗＹｏｒｋ，ＮＹ１００１７，ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】110003487

【氏名又は名称】弁理士法人東海特許事務所

(72)【発明者】

【氏名】アントンマクゴネル

(72)【発明者】

【氏名】マルコアルバンヒダルゴ

(72)【発明者】

【氏名】プラブディープシング

(57)【要約】（修正有）

【課題】人工知能（ＡＩ）／機械学習（ＭＬ）モデルの訓練／再訓練のライフサイクルを管理する。
【解決手段】人工知能フローを有する長時間実行ワークフローを使用することが開示される。ＡＩ／ＭＬモデルが、長時間実行ワークフローを遂行するロボティックプロセスオートメーション（ＲＰＡ）ロボットによって呼び出されるとき、検証が望まれ得る。この検証は、ユーザーからの動的入力を含む。ＲＰＡロボットは、ユーザーからの動的入力を受信し、このデータを、代替ＡＩ／ＭＬモデルの訓練または呼び出されたＡＩ／ＭＬモデルの再訓練のために使用する。長時間実行ワークフローの状態は、訓練およびサービングの両方において保存され得る。長時間実行ワークフローは、現在の遂行がＭＬモデルのライフサイクルのどこにあるかを追跡し続けるために使用され得る。
【選択図】図８Ａ

【特許請求の範囲】

【請求項1】

コンピューティングシステム上で実行している現在の人工知能（ＡＩ）／機械学習（ＭＬ）モデルと、
前記現在のＡＩ／ＭＬモデルと同じコンピューティングシステムまたは別のコンピューティングシステム上で実行しているロボティックプロセスオートメーション（ＲＰＡ）ロボットと、を備え、前記ＲＰＡロボットは、
前記現在のＡＩ／ＭＬモデルを呼び出すＡＩフローを含む長時間実行ワークフローを遂行し、
前記ＲＰＡロボットによって前記現在のＡＩ／ＭＬモデルへの呼び出しが行われ、前記ＡＩ／ＭＬモデルに関連付けられた信頼度が人間による検証の閾値を下回った場合、
前記長時間実行ワークフローの遂行を一時停止し、前記人間による検証に関連する動的入力を待ち、
前記人間の検証から前記動的入力を収集し、前記動的入力は訓練データを含み、
前記動的入力を受信した後、前記長時間実行ワークフローの遂行を継続するように構成される、システム。

【請求項2】

前記ＲＰＡロボットはさらに、
収集された前記動的入力を用いて、代替ＡＩ／ＭＬモデルを訓練するか、または前記現在のＡＩ／ＭＬモデルを再訓練し、
訓練された前記代替ＡＩ／ＭＬモデルまたは再訓練された前記現在のＡＩ／ＭＬモデルを、前記現在のＡＩ／ＭＬモデルの代わりに使用するために展開するように構成される、請求項１に記載のシステム。

【請求項3】

前記ＲＰＡロボットはさらに、
前記長時間実行ワークフローの状態を保持するように構成され、
前記長時間実行ワークフローの前記状態は、前記ＲＰＡロボットが遂行中のアクティビティ、前記アクティビティに対する入力、および人間の検証データを含む、請求項１に記載のシステム。

【請求項4】

前記ＲＰＡロボットはさらに、
前記ＲＰＡロボットが遂行する前記コンピューティングシステムの電源が切られた後、前記コンピューティングシステムがクラッシュした後、または処理リソースが訓練している代替ＡＩ／ＭＬモデルもしくは再訓練している前記現在のＡＩ／ＭＬモデルから離れて再割り当てされた後に、保存された前記状態に基づいて前記長時間実行ワークフローを再開するように構成される、請求項３に記載のシステム。

【請求項5】

前記長時間実行ワークフローは、ワークフローの断片化を促進する１または複数の永続化アクティビティを含む、請求項１に記載のシステム。

【請求項6】

前記ＲＰＡロボットはさらに、
前記現在のＡＩ／ＭＬモデルがＡＩ／ＭＬモデルのライフサイクルのどこにあるかを追跡するように構成され、
前記ＡＩ／ＭＬモデルのライフサイクルは、ＡＩ／ＭＬモデルの初期訓練フェーズと、前記初期訓練されたＡＩ／ＭＬモデルを用いたサービング動作フェーズと、本番動作前の前記ＡＩ／ＭＬモデルの再訓練フェーズと、再訓練された前記ＡＩ／ＭＬモデルが本番動作のために展開される場合の本番動作フェーズとを含む、請求項１に記載のシステム。

【請求項7】

前記現在のＡＩ／ＭＬモデルに関連する前記信頼度は、前記現在のＡＩ／ＭＬモデルによって出力される信頼スコアである、請求項１に記載のシステム。

【請求項8】

前記現在のＡＩ／ＭＬモデルに関連する前記信頼度は、監視ＡＩ／ＭＬモデルによって生成され、
前記ＲＰＡロボットは、前記監視ＡＩ／ＭＬモデルを呼び出し、前記監視ＡＩ／ＭＬモデルから前記現在のＡＩ／ＭＬモデルに対する前記信頼度を受信するように構成される、請求項１に記載のシステム。

【請求項9】

前記ＲＰＡロボットは、前記現在のＡＩ／ＭＬモデルに対する前記信頼度を得るために確率的ビジネスルールを適用するように構成される、請求項１に記載のシステム。

【請求項10】

前記ＲＰＡロボットは、前記現在のＡＩ／ＭＬモデルのデータドリフトおよびコンセプトドリフトを経時的に監視するように構成される、請求項１に記載のシステム。

【請求項11】

コンピュータプログラムを格納した非一時的なコンピュータ読み取り可能な媒体であって、前記コンピュータプログラムは、少なくとも１つのプロセッサが、
現在の人工知能（ＡＩ）／機械学習（ＭＬ）モデルを呼び出す人工知能（ＡＩ）フローを含む長時間実行ワークフローを遂行し、
前記現在のＡＩ／ＭＬモデルに関連する信頼度を決定し、
前記ＡＩ／ＭＬモデルに関連する前記信頼度が、人間による検証の閾値を下回った場合、
前記長時間実行ワークフローの遂行を一時停止し、前記人間による検証に関連する動的入力を待ち、
前記人間の検証から前記動的入力を収集し、前記動的入力は訓練データを含み、
前記動的入力を受信した後、前記長時間実行ワークフローの遂行を継続するように構成される、非一時的なコンピュータ読み取り可能な媒体。

【請求項12】

前記コンピュータプログラムはさらに、前記少なくとも１つのプロセッサが、
収集された前記動的入力を用いて、代替ＡＩ／ＭＬモデルを訓練するか、または前記現在のＡＩ／ＭＬモデルを再訓練し、
訓練された前記代替ＡＩ／ＭＬモデルまたは再訓練された前記現在のＡＩ／ＭＬモデルを、前記現在のＡＩ／ＭＬモデルの代わりに使用するために展開するように構成される、請求項１１に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項13】

前記コンピュータプログラムはさらに、前記少なくとも１つのプロセッサが、
前記長時間実行ワークフローの状態を保持するように構成され、
前記コンピュータプログラムは、ロボティックプロセスオートメーション（ＲＰＡ）ロボットである、またはそれを含み、
前記長時間実行ワークフローの前記状態は、前記ＲＰＡロボットが遂行中のアクティビティ、前記アクティビティに対する入力、および人間の検証データを含む、請求項１１に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項14】

前記コンピュータプログラムはさらに、前記少なくとも１つのプロセッサが、
前記ＲＰＡロボットが遂行するコンピューティングシステムの電源が切られた後、前記コンピューティングシステムがクラッシュした後、または処理リソースが訓練している代替ＡＩ／ＭＬモデルもしくは再訓練している前記現在のＡＩ／ＭＬモデルから離れて再割り当てされた後に、保存された前記状態に基づいて前記長時間実行ワークフローを再開するように構成される、請求項１３に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項15】

前記コンピュータプログラムはさらに、前記少なくとも１つのプロセッサが、
前記現在のＡＩ／ＭＬモデルがＡＩ／ＭＬモデルのライフサイクルのどこにあるかを追跡するように構成され、
前記ＡＩ／ＭＬモデルのライフサイクルは、ＡＩ／ＭＬモデルの初期訓練フェーズと、前記初期訓練されたＡＩ／ＭＬモデルを用いたサービング動作フェーズと、本番動作前の前記ＡＩ／ＭＬモデルの再訓練フェーズと、再訓練された前記ＡＩ／ＭＬモデルが本番動作のために展開される場合の本番動作フェーズを含む、請求項１１に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項16】

前記現在のＡＩ／ＭＬモデルに関連する前記信頼度は、前記現在のＡＩ／ＭＬモデルによって出力される信頼スコアである、請求項１１に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項17】

前記現在のＡＩ／ＭＬモデルに関連する前記信頼度は、監視ＡＩ／ＭＬモデルによって生成され、
前記コンピュータプログラムは、前記少なくとも１つのプロセッサが、前記監視ＡＩ／ＭＬモデルを呼び出し、前記監視ＡＩ／ＭＬモデルから前記現在のＡＩ／ＭＬモデルに対する前記信頼度を受信するように構成される、請求項１１に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項18】

前記コンピュータプログラムは、前記少なくとも１つのプロセッサが、前記現在のＡＩ／ＭＬモデルに対する前記信頼度を得るために確率的ビジネスルールを適用するように構成される、請求項１１に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項19】

前記コンピュータプログラムは、前記少なくとも１つのプロセッサが、前記現在のＡＩ／ＭＬモデルのデータドリフトおよびコンセプトドリフトを経時的に監視するように構成される、請求項１１に記載の非一時的なコンピュータ読み取り可能な媒体。

【請求項20】

現在の人工知能（ＡＩ）／機械学習（ＭＬ）モデルを呼び出す人工知能（ＡＩ）フローを含む長時間実行ワークフローを遂行するためのコンピュータプログラム命令を格納するメモリと、
前記コンピュータプログラム命令を遂行するように構成された少なくとも１つのプロセッサとを含み、前記コンピュータプログラム命令は、前記少なくとも１つのプロセッサが、
前記現在のＡＩ／ＭＬモデルに関連する信頼度を決定し、
前記ＡＩ／ＭＬモデルに関連する前記信頼度が、人間による検証の閾値を下回った場合、
前記長時間実行ワークフローの遂行を一時停止し、前記人間による検証に関連する動的入力を待ち、
前記人間の検証から前記動的入力を収集し、前記動的入力は訓練データを含む、コンピューティングシステム。

【請求項21】

前記コンピュータプログラム命令はさらに、前記少なくとも１つのプロセッサが、
収集された前記動的入力を用いて、代替ＡＩ／ＭＬモデルを訓練するか、または前記現在のＡＩ／ＭＬモデルを再訓練し、
訓練された前記代替ＡＩ／ＭＬモデルまたは再訓練された前記現在のＡＩ／ＭＬモデルを、前記現在のＡＩ／ＭＬモデルの代わりに使用するために展開するように構成される、請求項２０に記載のコンピューティングシステム。

【請求項22】

前記コンピュータプログラム命令はさらに、前記少なくとも１つのプロセッサが、
前記長時間実行ワークフローの状態を保持するように構成され、
前記コンピュータプログラム命令は、ロボティックプロセスオートメーション（ＲＰＡ）ロボットである、またはそれを含み、
前記長時間実行ワークフローの前記状態は、前記ＲＰＡロボットが遂行中のアクティビティ、前記アクティビティに対する入力、および人間の検証データを含む、請求項２０に記載のコンピューティングシステム。

【請求項23】

前記コンピュータプログラム命令はさらに、前記少なくとも１つのプロセッサが、
前記ＲＰＡロボットが遂行するコンピューティングシステムの電源が切られた後、前記コンピューティングシステムがクラッシュした後、または処理リソースが訓練している代替ＡＩ／ＭＬモデルもしくは再訓練している前記現在のＡＩ／ＭＬモデルから離れて再割り当てされた後に、保存された前記状態に基づいて前記長時間実行ワークフローを再開するように構成される、請求項２２に記載のコンピューティングシステム。

【請求項24】

前記コンピュータプログラム命令はさらに、前記少なくとも１つのプロセッサが、
前記現在のＡＩ／ＭＬモデルがＡＩ／ＭＬモデルのライフサイクルのどこにあるかを追跡するように構成され、
前記ＡＩ／ＭＬモデルのライフサイクルは、ＡＩ／ＭＬモデルの初期訓練フェーズと、前記初期訓練されたＡＩ／ＭＬモデルを用いたサービング動作フェーズと、本番動作前の前記ＡＩ／ＭＬモデルの再訓練フェーズと、再訓練された前記ＡＩ／ＭＬモデルが本番動作のために展開される場合の本番動作フェーズを含む、請求項２０に記載のコンピューティングシステム。

【請求項25】

前記現在のＡＩ／ＭＬモデルに関連する前記信頼度は、前記現在のＡＩ／ＭＬモデルによって出力される信頼スコアである、請求項２０に記載のコンピューティングシステム。

【請求項26】

前記現在のＡＩ／ＭＬモデルに関連する前記信頼度は、監視ＡＩ／ＭＬモデルによって生成され、
前記コンピュータプログラム命令は、前記少なくとも１つのプロセッサが、前記監視ＡＩ／ＭＬモデルを呼び出し、前記監視ＡＩ／ＭＬモデルから前記現在のＡＩ／ＭＬモデルに対する前記信頼度を受信するように構成される、請求項２０に記載のコンピューティングシステム。

【請求項27】

前記コンピュータプログラム命令は、前記少なくとも１つのプロセッサが、前記現在のＡＩ／ＭＬモデルに対する前記信頼度を得るために確率的ビジネスルールを適用するように構成される、請求項２０に記載のコンピューティングシステム。

【請求項28】

前記コンピュータプログラム命令は、前記少なくとも１つのプロセッサが、前記現在のＡＩ／ＭＬモデルのデータドリフトおよびコンセプトドリフトを経時的に監視するように構成される、請求項２０に記載のコンピューティングシステム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は概して、人工知能（ＡＩ）および機械学習（ＭＬ）に関し、より具体的には、ＡＩフローで長時間実行ワークフローを使用して、ＡＩ／ＭＬモデルの訓練／再訓練ライフサイクルを管理することに関する。

【背景技術】

【0002】

ＧｏｏｇｌｅＡｕｔｏＭＬ（登録商標）およびＡｚｕｒｅ（登録商標）ＭＬなど、現在のＡＩツールは基本的にワークフローのようなものである。これらのシステムには、パイプラインと呼ばれる動作のセットが提供される。この機能は、データ変換、表形式データの準備、ビニング、およびクラスタリングなどの機能を提供する。これらは、ユーザーがワークプレースにドラッグアンドドロップすることで、あるコンポーネントから別のコンポーネントにデータを視覚的に送り込み得る基本的な動作である。例は、表形式のデータの準備を含み、この場合、データは、表形式のデータの値を取り込み、それらを個別のクラスに捨ててから、実際のモデルトレーナーに渡すビニングシステムに送り込まれる。

【0003】

しかし、ＡＩ／ＭＬモデルの動的入力は、これらのツールでは提供されない。したがって、改良されたアプローチが有益であり得る。

【発明の概要】

【0004】

本発明の特定の実施形態は、現在のＡＩ技術によってまだ十分に特定されていない、評価されていない、または解決されていない本分野における問題およびニーズのソリューションを提供し得る。例えば、本発明のいくつかの実施形態は、ＡＩ／ＭＬモデルの訓練／再訓練のライフサイクルを管理するために、ＡＩフローで長時間実行ワークフローを使用することに関する。

【0005】

実施形態では、システムは、コンピューティングシステム上で実行する現在のＡＩ／ＭＬモデルを含む。システムはまた現在のＡＩ／ＭＬモデルと同じコンピューティングシステムまたは別のコンピューティングシステム上で実行しているＲＰＡロボットを含む。ＲＰＡロボットは、現在のＡＩ／ＭＬモデルを呼び出すＡＩフローを含む長時間実行ワークフローを遂行するように構成される。ＲＰＡロボットによって現在のＡＩ／ＭＬモデルに呼び出しが行われ、ＡＩ／ＭＬモデルに関連する信頼度が人間による検証の閾値を下回った場合、ＲＰＡロボットは、長時間実行ワークフローの遂行を一時停止し、人間による検証に係る動的入力を待ち、訓練データを含む人間の検証からの動的入力を収集し、そして動的入力を受信した後に長時間実行ワークフローの遂行を継続するよう構成される。

【0006】

別の実施形態では、非一時的なコンピュータ読み取り可能な媒体は、コンピュータプログラムを格納する。コンピュータプログラムは、少なくとも１つのプロセッサが、現在のＡＩ／ＭＬモデルを呼び出すＡＩフローを含む長時間実行ワークフローを遂行し、現在のＡＩ／ＭＬモデルに関連する信頼度を決定するように構成される。ＡＩ／ＭＬモデルに関連する信頼度が人間による検証の閾値を下回った場合、コンピュータプログラムは、少なくとも１つのプロセッサが、長時間実行ワークフローの遂行を一時停止し、人間による検証に係る動的入力を待ち、訓練データを含む人間の検証からの動的入力を収集し、そして動的入力を受信した後に長時間実行ワークフローの遂行を継続するよう構成される。

【0007】

さらに別の実施形態では、コンピューティングシステムは、現在のＡＩ／ＭＬモデルを呼び出すＡＩフローを含む長時間実行ワークフローを遂行するためのコンピュータプログラム命令を格納するメモリを含む。コンピューティングシステムはまた、コンピュータプログラム命令を遂行するように構成された少なくとも１つのプロセッサを含む。コンピュータプログラム命令は、少なくとも１つのプロセッサが、現在のＡＩ／ＭＬモデルに関連する信頼度を決定するに構成される。ＡＩ／ＭＬモデルに関連する信頼度が人間による検証の閾値を下回った場合、コンピュータプログラム命令は、少なくとも１つのプロセッサが、長時間実行ワークフローの遂行を一時停止し、人間による検証に係る動的入力を待ち、そして人間の検証からの動的入力を収集するよう構成される。動的入力は、訓練データを含む。

【図面の簡単な説明】

【0008】

本発明の特定の実施形態の利点が容易に理解されるように、上記で簡単に説明した本発明のより特定の説明は、添付の図面に図示されている特定の実施形態を参照して描写される。これらの図面は、本発明の典型的な実施形態のみを描いており、したがって、その範囲を限定するものとは考えられないことが理解されるべきであるが、本発明は、以下の添付の図面を使用することにより、さらなる特定および詳細をもって描写され、説明されるであろう。

【0009】

【図1】本発明の実施形態による、ＲＰＡシステムを示すアーキテクチャ図である。

【0010】

【図2】本発明の実施形態による、展開したＲＰＡシステムを示すアーキテクチャ図である。

【0011】

【図3】本発明の実施形態による、デザイナ、アクティビティ、およびドライバの間の関係を示すアーキテクチャ図である。

【0012】

【図4】本発明の実施形態による、ＲＰＡシステムを示すアーキテクチャ図である。

【0013】

【図5】本発明の実施形態による、長時間実行ワークフローを使用してＡＩフローを構築および管理するように構成されたコンピューティングシステムを示すアーキテクチャ図である。

【0014】

【図6A】本発明の実施形態による、画像内のグラフィカル要素を認識するように訓練されたニューラルネットワークの例を示す。

【0015】

【図6B】本発明の実施形態によるニューロンの例を示す。

【0016】

【図7】本発明の実施形態による、ＡＩスキルスタジオのユーザーインターフェースを示す。

【0017】

【図8A】本発明の実施形態による、コンダクタアプリケーションのプロセスデザイナの設計図を示す。

【図8B】本発明の実施形態による、コンダクタアプリケーションのプロセスデザイナの設計図を示す。

【0018】

【図8C】本発明の実施形態による、コンダクタアプリケーションのプロセスデザイナの設計図を示す。

【0019】

【図9】本発明の実施形態による、長時間実行ワークフローを使用してＡＩフローを構築および管理するように構成されたシステムを示すアーキテクチャ図である。

【0020】

【図10】本発明の実施形態による、ＡＩを使用する例示的な長時間実行ワークフローのフローを示すフロー図である。

【0021】

【図11】本発明の実施形態による、ＡＩフローを構築および管理するために長時間実行ワークフローを使用するためのプロセスを示すフローチャートである。

【0022】

別段の記載がない限り、類似の参照文字は、添付の図面全体で一貫して対応する特徴を示す。

【発明を実施するための形態】

【0023】

（実施形態の詳細な説明）
いくつかの実施形態は、人工知能（ＡＩ）／機械学習（ＭＬ）モデルの訓練／再訓練のライフサイクルを管理するために、ＡＩフローを有する長時間実行ワークフローを使用することが開示される。ＡＩ／ＭＬモデルが、長時間実行ワークフローを遂行するロボティックプロセスオートメーション（ＲＰＡ）ロボットによって呼び出されるとき、検証が望まれ得る。この検証は、ユーザーからの動的入力を含む。ＲＰＡロボットは、ユーザーからの動的入力を受信し、このデータを、代替ＡＩ／ＭＬモデルの訓練または呼び出されたＡＩ／ＭＬモデルの再訓練のために使用する。長時間実行ワークフローの状態は、訓練および提供の両方において保存され得る。長時間実行ワークフローは、現在の遂行がパイプラインのどこにあるかを追跡し続けるために使用され得る。

【0024】

いくつかの実施形態におけるＲＰＡのための長時間実行ワークフローは、サービスオーケストレーション、人間の介入、およびアンアテンディッド環境における長時間実行トランザクションをサポートするマスタープロジェクトである。人間の介入は、特定のプロセスが、アクティビティの次のステップに進む前に、例外処理、承認、または検証のために人間の入力を必要とする場合に登場する。この場合、プロセスの遂行は一時停止され、人間のタスクが完了するまでＲＰＡロボットを開放する。

【0025】

長時間実行ワークフローは、永続化アクティビティを介してワークフローの断片化をサポートしてもよく、呼び出しプロセスおよび非ユーザーインタラクションアクティビティと組み合わされ、人間のタスクをRPAロボットタスクでオーケストレーションし得る。長時間実行ワークフローは、迅速な遂行を促進するためにセッションで実行し得る。いくつかの実施形態では、長時間実行ワークフローは、アプリケーションプログラミングインターフェース（ＡＰＩ）呼び出しを実行し、かつ長時間実行ワークフローセッションで実行するアクティビティを含み得るバックグラウンドプロセスをオーケストレーションしてもよい。これらのアクティビティは、いくつかの実施形態では、呼び出しプロセスアクティビティによって呼び出され得る。ユーザーセッションで実行するユーザーインタラクションアクティビティを有するプロセスは、コンダクタアクティビティからジョブを開始することによって呼び出され得る（コンダクタは、本明細書で後により詳細に説明する）。ユーザーは、いくつかの実施形態では、コンダクタでフォームを完成させる必要があるタスクを通じてインタラクションし得る。ＲＰＡロボットにフォームタスクが完了するのを待たせ、その後、長時間実行ワークフローを再開させるアクティビティが含まれ得る。

【0026】

いくつかの実施形態では、ＭＬプロセスは、それ自体がワークフローである。ＡＩ／ＭＬモデルのライフサイクルのステップ、すなわち、最初の訓練から、最初に訓練されたＡＩ／ＭＬモデルの遂行、再訓練、再訓練されたＡＩ／ＭＬモデルによるサービング動作、ドリフトするＡＩ／ＭＬモデルを人間の検証および訓練フェーズに戻す、などを追跡して、システムが、ＡＩ／ＭＬのプロセスのどこにいるのかを知ることができるようにし得る。例えば、いくつかの実施形態では、ＡＩ／ＭＬモデルの訓練／再訓練の長時間実行ワークフローがＲＰＡロボットによって遂行されている場合、長時間実行ワークフローの状態は、定期的におよび／または何らかのトリガ（例えば、達成されたタスク、ＡＩ／ＭＬモデルの更新など）に基づいて保存され得る。訓練／再訓練を実行するコンピューティングシステムの電源が切れたりまたはクラッシュしたりした場合、コンピューティングシステムが起動し直されたりまたは回復したりした後に、訓練／再訓練はこの保存された状態から再開し得る。各訓練または再訓練フェーズは、ＡＩ／ＭＬモデルが特定の目的を達成するために訓練され、人間の指導を受け、訓練が再開され、さらに人間の指導を受けるなど、複数のステップ／状態を有し得る。

【0027】

このような実施形態は、有限状態機械（ＦＳＭ）にやや類似した方法で実行し得る。システムは、ＲＰＡロボットがフローのどのステップにいるか、所定のステップまたはアクティビティが自動化され得るかどうか、ユーザー入力が必要であるかどうかなどを追跡する。ＡＩ／ＭＬモデルの再訓練は、ＲＰＡロボットまたはＡＩ／ＭＬモデルを呼び出す他のプロセスを停止させることなく再訓練を実行する非同期プロセスであり得る。ＡＩ／ＭＬモデルのバージョンが、ＡＩ／ＭＬモデルの現在展開されているバージョンよりも優れた性能を有するように訓練される場合、ＡＩ／ＭＬモデルの優れたバージョンがスワップインされかつ使用されて、ＲＰＡロボット／プロセスを呼び出すことに役立ち得る。これは、スワップが発生したことをＲＰＡロボット／プロセスに情報提供することなく発生し得る。

【0028】

いくつかの実施形態では、再訓練パイプラインに必要な全ての情報が保存され得る。これは、ＡＩ／ＭＬモデルの入力／出力、再訓練パイプラインのステップ、人間のレビュアーによって提供されるラベル付き修正などを含んでもよい。このように、システムは、ＭＬライフサイクル全体にわたってフロー内のロケーションを追跡し得る。

【0029】

このような状態保存は、多くのシナリオで有用であり得る。例えば、サーバーが再訓練にまたは再訓練中に利用できない場合を考えてみると、サーバーがより優先度の高い処理の実行を任される。また、自動化されたプロセスには管理者の入力が必要で、その管理者がボトルネックとなり、プロセスは承認を待つ必要がある場合も考えてみる。このように、複数のプロセスが同じチョークポイントでハングアップし得る。ＡＩ／ＭＬモデルが停止して待つことができる他のシナリオは、限定されないが、データまたはモデルドリフトが閾値を越えて検出された場合、新しいシナリオが証明されていない信頼度で検出された場合（例えば、自動運転車用にコンピュータビジョンを提供するＡＩ／ＭＬモデルが道路標識を検出し始めるが、検出信頼度はＧＰＳマップなどの異なるメカニズムを使用して動作する別のＡＩ／ＭＬモデルに取って代わるために本番環境で使用するにはまだ十分に高くない）などを含み得る。

【0030】

データサイエンスフローでは、ＵｉＰａｔｈ（登録商標）によるＡＩＣｅｎｔｅｒ（商標）などのＡＩセンターシステムが、サービングフェーズ、訓練フェーズ、および再訓練フェーズで使用され得る。いくつかの実施形態はさらに、ユーザーが、長時間実行ワークフローがこれらのフェーズに使用され得るカスタマイズされたデータパイプラインを構築することを可能にする。そのような実施形態は、データ準備、特徴づけ、モデル構築、モデル再訓練、モデル提供、および長時間実行ワークフローを促進し得る。ＡＩ／ＭＬモデルの訓練はある程度の時間がかかり得、インスタンスオペレータが訓練されているときに、提供されているＡＩ／ＭＬモデルをシャットダウンすることは、ユーザーにとってしばしば好ましくない。例えば、ＡＩ／ＭＬモデルが既存のＡＩ／ＭＬモデルとは異なるメカニズムを使用するように訓練されているが、新しいＡＩ／ＭＬモデルの性能がまだ許容できない場合、新しいＡＩ／ＭＬモデルのインスタンスは、新しいＡＩ／ＭＬモデルが本番環境展開に十分であるまで保存、追跡、および再訓練され得る。このため、いくつかの実施形態は、異なるコンポーネントにわたって状態完全な変更を実行し、追跡する。例えば、ＡＩ／ＭＬモデルがパイプラインのどこにあるのかに関する完全な情報が保存され得る。

【0031】

ＲＰＡデザイナアプリケーションなどのＲＰＡワークフローツールは、いくつかの実施形態では、ＡＩフローを構築および管理するための長時間実行ワークフローを含むように使用され得る。例えば、光学的文字認識（ＯＣＲ）アクティビティは、ファイル転送プロトコル（ＦＴＰ）ロケーションから文書を取り、ＯＣＲを用いて文書をデジタル化し、そしてデジタル化された文書を下流のアクティビティに送り込み得る。この下流のアクティビティは、抽出を実行し、またはエンティティ定義など、後の処理のためにデータを保存し得る。このシステムは、より柔軟で、従来のＡＩフレームワークによって公開された機能だけに制約されない場合がある。機能の各セットがそれ自身のＡＩ／ＭＬモデルまたはいくつかの実施形態におけるルールベースのシステムであってもよいので、この柔軟性は、部分的に生じ得る。従来、全てのＡＩ／ＭＬモデルは、モノリシックユニットとして実行される。しかしながら、いくつかの実施形態では、ＡＩ／ＭＬモデルのチェーンまたはパイプラインにおける個々のＡＩ／ＭＬモデルは、新しいシナリオに適合するように交換され得る。例えば、英語ＯＣＲを実行するためのＡＩ／ＭＬモデルは、日本語の請求書を処理するために、日本語ＯＣＲを実行するものと交換され得る。検証ステップは、いくつかの実施形態では、文書の各タイプにカスタムであるように生成され得る。例えば、請求書を処理することは、発注書を処理することとは異なる検証ロジックを必要とし得る。

【0032】

ＡＩシステムにおいて、ヒューマンインザループ（ｈｕｍａｎ－ｉｎ－ｔｈｅ－ｌｏｏｐ）による検証でフィードバックループを完成させることは難しいステップである。収集されたデータがＡＩ／ＭＬモデルを適切に訓練／再訓練するために、人間からどの程度のデータが収集されるべきかは、しばしば知られていない。例えば、人間のレビュアーが不正確な場合、悪い例が訓練データに含まれるため、ＡＩ／ＭＬモデルの学習／再学習にはより多くのデータが必要となる。また、データのタイプが分からない場合もある。実際の例では、船の赤い栓は、以前に船に乗っていたか、またはさもなくばそれが消火栓であることを知っていたレビュアーによってラベル付けされた。しかし、以前その栓に遭遇したことがない他のレビュアーは、栓を蛇口と誤ってラベルしてしまった。

【0033】

従来のＡＩフレームワークはシングルパスモデルジェネレータである。ＡＩ／ＭＬモデルは、転移学習を行い、パラメータを再度ロックし、そして新しいデータのバッチに送り込むことで再訓練され得る。しかし、これは、これらのシステムが自動的に行うことはできない時間のかかる手動プロセスである。

【0034】

いくつかの実施形態は、フィードバックループを完成させる長時間実行ワークフローおよびヒューマンインザループの検証を採用する。ＲＰＡは、任意のルールを設定するために使用され得る。例えば、企業は、ＡＩ／ＭＬモデルの信頼スコアが９０％を下回る場合、ＡＩ／ＭＬモデルを本番環境に投入したくない場合がある、または企業は、信頼スコアが９０％を下回る場合、本番環境でＡＩ／ＭＬモデルのみに依存したいと思う場合がある。そのようなルールは、ＲＰＡワークフローで設定され得、ＡＩ／ＭＬモデルを本番環境に入れるべきかどうかを統治し得る。さらに、いくつかの実施形態では、ＡＩ／ＭＬモデル、ルールセット、および展開または再訓練の基準は、より柔軟性を提供するために一緒に連鎖され得る。

【0035】

いくつかの実施形態では、ＡＩフローを含む長時間実行ワークフローを実装するＲＰＡロボット（複数可）が、修正が行われた画面上の要素、およびＡＩ／ＭＬモデルが予測したことを人間が検証した場所などの人間による検証結果を受信した後、これらの結果は、ＡＩ／ＭＬモデルの再訓練のために保存され得る。いくつかの実施形態では、複雑性はユーザーに公開されないかもしれないが、長時間実行ワークフローロジックは、同じスキーマにおいて、ＡＩ／ＭＬモデルが再訓練のためにマークされることを確実にする。人間のレビュアーによって検証された各新しいデータポイントは、ＡＩ／ＭＬモデルを自動的に更新し、改善するために使用され得る。再訓練は、一定期間経過後に、一定量のデータがデータサイエンティストにより収集され、手動で開始された後に、またはこれらのいずれかの組み合わせなど、定期的に行われ得る。

【0036】

電子メールの分類を例にとって考えてみる。電子メールは、特定のカテゴリを自動的に割り当てるように訓練されたＡＩ／ＭＬモデルによって、特定のカテゴリを自動的に割り当て得る。ＲＰＡロボットが電子メールを解析し、電子メールの内容（例えば、送信者、受信者（複数）、件名、本文）をＡＩ／ＭＬモデルに送信し得、これは、製品問い合わせ、クレジットカード請求に関する顧客の苦情などの分類を返送する。ＡＩ／ＭＬモデルの信頼スコアが特定の人間のレビュー閾値を下回る場合、電子メールおよび予測された分類は、人間のレビュアーに送信され得る。その後、人間のレビュアーは、電子メールを読み、分類を維持するか、またはそれを修正するかを選択し得る。肯定的な例と否定的な例の両方が、ＡＩ／ＭＬモデルの再訓練のために格納され、使用され得る。ＡＩ／ＭＬモデルの信頼スコアが人間のレビュー閾値を超える場合、ＡＩ／ＭＬモデルは、人間の入力なしに自動的に実行し得る。ＲＰＡロボットまたは他の何らかのプロセスは、ＡＩ／ＭＬモデルの性能を監視し続け、ＡＩ／ＭＬモデルの精度が時間の経過とともに（例えば、データドリフトまたはコンセプトドリフトにより）人間のレビュー閾値を下回る場合、人間のレビューを復活させ得る。

【0037】

図１は、本発明の実施形態による、ＲＰＡシステム１００を示すアーキテクチャ図である。ＲＰＡシステム１００は、開発者がワークフローを設計して実装することを可能にするデザイナ１１０を含む。デザイナ１１０は、アプリケーション統合のためのソリューションを提供するとともに、サードパーティアプリケーション、管理情報技術（ＩＴ）タスク、およびビジネスＩＴプロセスを自動化する。デザイナ１１０は、ビジネスプロセスのグラフィック表現である自動化プロジェクトの開発を容易にし得る。簡単に言えば、デザイナ１１０は、ワークフローおよびロボットの開発および展開を容易にする。

【0038】

自動化プロジェクトは、本明細書で「アクティビティ」と定義されるワークフローで開発されたステップのカスタムセット間の遂行順序および関係の制御を開発者に与えることにより、ルールベースのプロセスの自動化を可能にする。デザイナ１１０の実施形態の商業的な一例は、ＵｉＰａｔｈＳｔｕｄｉｏ（商標）である。各アクティビティは、ボタンをクリックする、ファイルを読む、ログパネルに書き込むなどのアクションを含み得る。いくつかの実施形態では、ワークフローは入れ子になっているか、または埋め込まれ得る。

【0039】

ワークフローのいくつかのタイプには、シーケンス、フローチャート、有限状態機械（ＦＳＭ）、および／またはグローバル例外ハンドラなどを含み得るが、これらに限定されない。シーケンスは、ワークフローを乱雑にすることなく、あるアクティビティから別のアクティビティへのフローを可能にする、線形プロセスに特に適し得る。フローチャートは、特により複雑なビジネスロジックに適し得、複数の分岐ロジックオペレータを介して、より多様な方法で意思決定の統合およびアクティビティの接続を可能にする。ＦＳＭは、大規模なワークフローに特に適し得る。ＦＳＭは、条件（すなわち、遷移）またはアクティビティによりトリガされる有限の数の状態をそれらの遂行中に使用し得る。グローバル例外ハンドラは、遂行エラーに遭遇したときのワークフローの挙動を決定したり、プロセスをデバッグしたりするのに特に適し得る。

【0040】

ワークフローがデザイナ１１０内で開発されると、ビジネスプロセスの遂行は、コンダクタ１２０によって調整され、デザイナ１１０内で開発されたワークフローを遂行する１または複数のロボット１３０を調整する。コンダクタ１２０の実施形態の商業的な一例は、ＵｉＰａｔｈＯｒｃｈｅｓｔｒａｔｏｒ（商標）である。コンダクタ１２０は、環境におけるリソースの生成、監視、および展開の管理を容易にする。コンダクタ１２０は、サードパーティのソリューションおよびアプリケーションとの統合ポイントとして動作し得る。

【0041】

コンダクタ１２０は、全てのロボット１３０を管理し得、ロボット１３０を集中ポイントから接続して遂行する。管理され得るロボット１３０のタイプには、アテンディッドロボット１３２、アンアテンディッドロボット１３４、開発ロボット（アンアテンディッドロボット１３４と同様であるが、開発およびテストの目的で使用される）、および非生産ロボット（アテンディッドロボット１３２と同様であるが、開発およびテストの目的で使用される）が含まれるが、これらに限定されない。アテンディッドロボット１３２は、ユーザーイベントによってトリガされ、同じコンピューティングシステム上で人と並んで動作する。アテンディッドロボット１３２は、集中プロセスデプロイメントおよびロギング媒体のためのコンダクタ１２０とともに使用され得る。アテンディッドロボット１３２は、人のユーザーが様々なタスクを達成するのを支援してもよく、ユーザーイベントによってトリガされてもよい。いくつかの実施形態では、プロセスは、このタイプのロボット上でコンダクタ１２０から開始することができず、および／またはそれらはロックされた画面の下で実行することができない。特定の実施形態では、アテンディッドロボット１３２は、ロボットトレイからまたはコマンドプロンプトからのみ起動され得る。アテンディッドロボット１３２は、いくつかの実施形態では、人の監督下で動作することが好ましい。

【0042】

アンアテンディッドロボット１３４は、仮想環境で無人で動作し、多くのプロセスを自動化し得る。アンアテンディッドロボット１３４は、リモート遂行、監視、スケジューリング、および作業キューのサポートの提供を担当し得る。全てのロボットタイプのためのデバッグは、いくつかの実施形態では、デザイナ１１０で実行され得る。アテンディッドロボットおよびアンアテンディッドロボットの両方は、メインフレーム、ウェブアプリケーション、ＶＭ、エンタープライズアプリケーション（例えば、ＳＡＰ（登録商標）、ＳａｌｅｓＦｏｒｃｅ（登録商標）、Ｏｒａｃｌｅ（登録商標）などにより生成されたもの）、およびコンピューティングシステムアプリケーション（例えば、デスクトップおよびラップトップアプリケーション、モバイルデバイスアプリケーション、ウェアラブルコンピュータアプリケーションなど）を含むが、これらに限定されない様々なシステムおよびアプリケーションを自動化し得る。

【0043】

コンダクタ１２０は、プロビジョニング、展開、構成、キューイング、監視、ロギング、および／または相互接続性の提供を含むがこれらに限定されない様々な能力を有し得る。プロビジョニングは、ロボット１３０とコンダクタ１２０（例えば、ウェブアプリケーション）との間の接続を作成し、維持することを含み得る。展開は、遂行のために割り当てられたロボット１３０へのパッケージバージョンの正しい配信を保証することを含み得る。構成は、ロボット環境およびプロセス構成の維持および配信を含み得る。キューイングは、キューおよびキュー項目の管理を提供することを含み得る。監視は、ロボットの特定データを追跡し、ユーザーの権限を維持することを含み得る。ロギングは、データベース（例えば、ＳＱＬデータベース）および／または別のストレージメカニズム（例えば、大規模なデータセットを格納し、迅速にクエリを実行する能力を提供するＥｌａｓｔｉｃＳｅａｒｃｈ（登録商標））へのログの保存およびインデックス作成を含み得る。コンダクタ１２０は、サードパーティのソリューションおよび／またはアプリケーションのための通信の集中点として操作することにより、相互接続性を提供し得る。

【0044】

ロボット１３０は、デザイナ１１０で構築されたワークフローを実行する遂行エージェントである。ロボット（複数可）１３０のいくつかの実施形態の１つの商業的な例は、ＵｉＰａｔｈＲｏｂｏｔｓ（商標）である。いくつかの実施形態では、ロボット１３０は、デフォルトで、ＭｉｃｒｏｓｏｆｔＷｉｎｄｏｗｓ（登録商標）ＳｅｒｖｉｃｅＣｏｎｔｒｏｌＭａｎａｇｅｒ（ＳＣＭ）管理サービスをインストールする。その結果、このようなロボット１３０は、ローカルシステムアカウントの下でインタラクティブなＷｉｎｄｏｗｓ（登録商標）セッションを開くことができ、Ｗｉｎｄｏｗｓ（登録商標）サービスの権利を有し得る。

【0045】

いくつかの実施形態では、ロボット１３０は、ユーザーモードで設置され得る。このようなロボット１３０については、所定のロボット１３０が設置されているユーザーと同じ権利を有することを意味する。この特色はまた、各マシンを最大限に全活用することを保証する高密度（ＨＤ）ロボットにも利用可能であり得る。いくつかの実施形態では、いずれかのタイプのロボット１３０は、ＨＤ環境で構成され得る。

【0046】

いくつかの実施形態におけるロボット１３０は、複数のコンポーネントに分割され、それぞれが特定の自動化タスクに特化されている。いくつかの実施形態におけるロボットコンポーネントは、ＳＣＭ管理ロボットサービス、ユーザーモードロボットサービス、エグゼキュータ、エージェント、およびコマンドラインを含むが、これらに限定されない。ＳＣＭ管理ロボットサービスは、Ｗｉｎｄｏｗｓ（登録商標）セッションを管理および監視し、コンダクタ１２０と遂行ホスト（すなわち、ロボット１３０が遂行されるコンピューティングシステム）との間のプロキシとして動作する。これらのサービスは、ロボット１３０の資格情報を任されて管理する。コンソールアプリケーションは、ローカルシステム下のＳＣＭにより起動される。

【0047】

いくつかの実施形態におけるユーザーモードロボットサービスは、Ｗｉｎｄｏｗｓ（登録商標）セッションを管理および監視し、コンダクタ１２０と遂行ホストとの間のプロキシとして動作する。ユーザーモードロボットサービスは、ロボット１３０の資格情報を任されて管理し得る。ＳＣＭ管理ロボットサービスがインストールされていない場合、Ｗｉｎｄｏｗｓ（登録商標）アプリケーションが自動的に起動され得る。

【0048】

エグゼキュータは、Ｗｉｎｄｏｗｓ（登録商標）セッションの下で与えられたジョブを遂行し得る（つまり、ワークフローを遂行し得る。エグゼキュータは、モニタ毎のドットパーインチ（ＤＰＩ）設定を意識し得る。エージェントは、システムトレイウィンドウに利用可能なジョブを表示するＷｉｎｄｏｗｓ（登録商標）ＰｒｅｓｅｎｔａｔｉｏｎＦｏｕｎｄａｔｉｏｎ（ＷＰＦ）アプリケーションであり得る。エージェントはサービスのクライアントとなり得る。エージェントは、ジョブの開始または停止、設定の変更を依頼し得る。コマンドラインはサービスのクライアントである。コマンドラインは、ジョブの開始を要求し、その出力を待つことができるコンソールアプリケーションである。

【0049】

上で説明したように、ロボット１３０のコンポーネントが分割されていることは、開発者、サポートユーザー、およびコンピューティングシステムが、各コンポーネントが何を遂行しているかをより容易に実行し、特定し、および追跡するのに役立つ。この方法では、エグゼキュータとサービスに異なるファイアウォールルールを設定するなど、コンポーネントごとに特別な挙動を構成し得る。エグゼキュータは常に、いくつかの実施形態では、モニタごとのＤＰＩ設定を認識し得る。その結果、ワークフローは、ワークフローが作成されたコンピューティングシステムの構成に関係なく、いずれかのＤＰＩで遂行し得る。また、いくつかの実施形態では、デザイナ１１０からのプロジェクトは、ブラウザのズームレベルに依存しないようにし得る。ＤＰＩを認識していないまたは意図的に認識していないとマークされているアプリケーションの場合、いくつかの実施形態ではＤＰＩを無効にし得る。

【0050】

図２は、本発明の実施形態による、展開したＲＰＡシステム２００を示すアーキテクチャ図である。いくつかの実施形態では、ＲＰＡシステム２００は、図１のＲＰＡシステム１００であってもよく、またはその一部であってもよい。クライアント側、サーバー側、またはその両方が、本発明の範囲から逸脱することなく、いずれかの所望の数のコンピューティングシステムを含むことができることに留意すべきである。クライアント側では、ロボットアプリケーション２１０は、エグゼキュータ２１２、エージェント２１４、およびデザイナ２１６を含む。しかし、いくつかの実施形態では、デザイナ２１６は、コンピューティングシステム２１０上で実行されていなくてもよい。エグゼキュータ２１２はプロセスを実行している。図２に示すように、複数のビジネスプロジェクトが同時に実行され得る。エージェント２１４（例えば、Ｗｉｎｄｏｗｓ（登録商標）サービス）は、本実施形態では、全てのエグゼキュータ２１２のための単一の接続ポイントである。この実施形態における全てのメッセージは、コンダクタ２３０に記録され、それは、データベースサーバー２４０、インデクササーバー２５０、またはその両方を介して、それらをさらに処理する。図１に関して上述したように、エグゼキュータ２１２は、ロボットコンポーネントであり得る。

【0051】

いくつかの実施形態では、ロボットは、マシン名とユーザー名との間の関連付けを表す。ロボットは、複数のエグゼキュータを同時に管理し得る。同時に実行される複数のインタラクティブセッションをサポートするコンピューティングシステム（Ｗｉｎｄｏｗｓ（登録商標）Ｓｅｒｖｅｒ２０１２など）では、複数のロボットが同時に実行され得、それぞれが一意のユーザー名を使用して別々のＷｉｎｄｏｗｓ（登録商標）セッションで実行され得る。これは、上記のＨＤロボットと呼ばれる。

【0052】

エージェント２１４はまた、ロボットの状態を送信し（例えば、ロボットがまだ機能していることを示す「ハートビート」メッセージを定期的に送信する）、遂行されるパッケージの要求されるバージョンをダウンロードすることにも責任を負う。エージェント２１４とコンダクタ２３０との間の通信は、いくつかの実施形態では、常にエージェント２１４によって開始される。通知シナリオでは、エージェント２１４は、後にコンダクタ２３０によってロボットにコマンド（例えば、開始、停止など）を送信するために使用されるＷｅｂＳｏｃｋｅｔチャネルを開いてもよい。

【0053】

サーバー側には、プレゼンテーション層（ウェブアプリケーション２３２、オープンデータプロトコル（ＯＤａｔａ）代表状態転送（ＲＥＳＴ）アプリケーションプログラミングインターフェース（ＡＰＩ）エンドポイント２３４、通知および監視２３６）、サービス層（ＡＰＩ実装／ビジネスロジック２３８）、永続層（データベースサーバー２４０、インデクササーバー２５０）が含まれる。コンダクタ２３０は、ウェブアプリケーション２３２、ＯＤａｔａＲＥＳＴＡＰＩエンドポイント２３４、通知および監視２３６、ならびにＡＰＩ実装／ビジネスロジック２３８を含む。いくつかの実施形態では、ユーザーがコンダクタ２３０のインターフェース（例えば、ブラウザ２２０を介して）で実行するほとんどのアクションは、様々なＡＰＩを呼び出すことによって実行される。このような動作は、本発明の範囲を逸脱することなく、ロボット上でのジョブの起動、キュー内のデータの追加／削除、無人で実行するジョブのスケジューリングなどを含み得るが、これらに限定されない。ウェブアプリケーション２３２は、サーバープラットフォームのビジュアル層である。この実施形態では、ウェブアプリケーション２３２は、ハイパーテキストマークアップ言語（ＨＴＭＬ）およびジャバスクリプト（ＪＳ）を使用する。しかし、本発明の範囲を逸脱することなく、いずれかの所望のマークアップ言語、スクリプト言語、または他のいずれかのフォーマットを使用し得る。ユーザーは、コンダクタ２３０を制御するための様々な動作を実行するために、本実施形態ではブラウザ２２０を介してウェブアプリケーション２３２からのウェブページとインタラクションする。例えば、ユーザーは、ロボットグループを作成し、ロボットへのパッケージの割り当てを行い、ロボット毎および／またはプロセス毎のログを解析し、ロボットを起動しおよび停止などし得る。

【0054】

ウェブアプリケーション２３２に加えて、コンダクタ２３０は、ＯＤａｔａＲＥＳＴＡＰＩエンドポイント２３４を公開するサービス層も含む。しかし、本発明の範囲を逸脱することなく、他のエンドポイントが含まれていてもよい。ＲＥＳＴＡＰＩは、ウェブアプリケーション２３２とエージェント２１４の両方により消費される。エージェント２１４は、本実施形態では、クライアントコンピュータ上の１または複数のロボットのスーパーバイザである。

【0055】

本実施形態のＲＥＳＴＡＰＩは、構成、ロギング、監視、およびキューイング機能をカバーする。構成エンドポイントは、いくつかの実施形態では、アプリケーションのユーザー、権限、ロボット、アセット、リリース、および環境を定義し、構成するために使用されてもよい。ロギングＲＥＳＴエンドポイントは、例えば、エラー、ロボットによって送信された明示的なメッセージ、およびその他の環境固有の情報など、様々な情報をログに記録するために使用され得る。デプロイメントＲＥＳＴエンドポイントは、コンダクタ２３０においてジョブ開始コマンドが使用された場合に遂行されるべきパッケージのバージョンを問い合わせるためにロボットにより使用されてもよい。キューイングＲＥＳＴエンドポイントは、キューへのデータの追加、キューからのトランザクションの取得、トランザクションのステータスの設定など、キューおよびキューアイテムの管理を担ってもよい。

【0056】

ＲＥＳＴエンドポイントの監視は、ウェブアプリケーション２３２およびエージェント２１４を監視してもよい。通知および監視ＡＰＩ２３６は、エージェント２１４の登録、エージェント２１４への構成設定の配信、ならびにサーバーおよびエージェント２１４からの通知の送受信に使用されるＲＥＳＴエンドポイントであってもよい。通知および監視ＡＰＩ２３６は、いくつかの実施形態では、ＷｅｂＳｏｃｋｅｔ通信を使用してもよい。

【0057】

永続層は、本実施形態では、一対のサーバー－データベースサーバー２４０（例えば、ＳＱＬサーバー）およびインデクササーバー２５０を含む。本実施形態におけるデータベースサーバー２４０は、ロボット、ロボットグループ、関連するプロセス、ユーザー、役割、スケジュールなどの構成を格納する。この情報は、いくつかの実施形態では、ウェブアプリケーション２３２を介して管理される。データベースサーバー２４０は、キューおよびキューアイテムを管理してもよい。いくつかの実施形態では、データベースサーバー２４０は、ロボットにより記録されたメッセージを（インデクササーバー２５０に加えて、またはそれに代えて）格納してもよい。

【0058】

いくつかの実施形態では任意であるが、インデクササーバー２５０は、ロボットにより記録された情報を保存し、インデックスを作成する。特定の実施形態では、インデクササーバー２５０は、構成設定を介して無効化されてもよい。いくつかの実施形態では、インデクササーバー２５０は、オープンソースプロジェクトの全文検索エンジンであるＥｌａｓｔｉｃＳｅａｒｃｈ（登録商標）を使用する。ロボットにより記録されたメッセージ（例えば、ログメッセージまたはライン書き込みのようなアクティビティを使用して）は、ロギングＲＥＳＴエンドポイント（複数可）を介してインデクササーバー２５０に送信されてもよく、そこで将来の利用のためにそれらはインデックス化される。

【0059】

図３は、本発明の実施形態による、デザイナ３１０、アクティビティ３２０、３３０、ドライバ３４０、およびＡＩ／ＭＬモデル３５０の間の関係３００を示すアーキテクチャ図である。以上のように、開発者は、デザイナ３１０を用いて、ロボットによって遂行されるワークフローを開発する。ワークフローは、ユーザー定義のアクティビティ３２０およびＵＩオートメーションアクティビティ３３０を含んでもよい。ユーザー定義アクティビティ３２０および／またはＵＩオートメーションアクティビティ３３０は、いくつかの実施形態では、ロボットが動作しているコンピューティングシステムに対してローカルに、および／またはそれに対してリモートに位置され得、１または複数のＡＩ／ＭＬモデル３５０を呼び出し得る。いくつかの実施形態では、画像中の非テキストの視覚的コンポーネントを特定することができ、これは、本明細書ではコンピュータビジョン（ＣＶ）と呼ばれる。このようなコンポーネントに関連するいくつかのＣＶアクティビティは、クリック、タイプ、テキストを取得、ホバー、要素の有無を検出、スコープの更新、ハイライトなどを含み得るが、これらに限定されない。いくつかの実施形態では、クリックは、例えば、ＣＶ、光学的文字認識（ＯＣＲ）、ファジーテキストマッチング、およびマルチアンカーを使用して要素を特定し、それをクリックする。タイプは、上記および要素内のタイプを用いて要素を特定してもよい。テキストの取得は、特定のテキストの場所を特定し、ＯＣＲを使用してそれをスキャンし得る。ホバーは、要素を特定し、その上にホバーし得る。要素の有無の検出は、上述した技法を用いて、画面上に要素の有無を検出するかどうかを確認し得る。いくつかの実施形態では、デザイナ３１０に実装され得る数百または数千でさえのアクティビティが存在してもよい。しかし、本発明の範囲を逸脱することなく、いずれかの数および／またはアクティビティのタイプを利用することができる。

【0060】

ＵＩオートメーションアクティビティ３３０は、低レベルのコード（例えば、ＣＶアクティビティ）で記述され、画面とのインタラクションを促進する特別な低レベルのアクティビティのサブセットである。ＵＩオートメーションアクティビティ３３０は、ロボットが所望のソフトウェアとインタラクションすることを可能にするドライバ３４０および／またはＡＩ／ＭＬモデル３５０を介して、これらのインタラクションを促進する。例えば、ドライバ３４０は、ＯＳドライバ３４２、ブラウザドライバ３４４、ＶＭドライバ３４６、エンタープライズアプリケーションドライバ３４８などを含み得る。コンピューティングシステムとのインタラクションを実行するために、１または複数のＡＩ／ＭＬモデル３５０はＵＩオートメーションアクティビティ３３０によって使用され得る。いくつかの実施形態では、ＡＩ／ＭＬモデル３５０は、ドライバ３４０を増強するか、またはそれらを完全に置き換え得る。実際、特定の実施形態では、ドライバ３４０は含まれない。

【0061】

ドライバ３４０は、フックを探したり、キーを監視したりするなど、低レベルでＯＳとインタラクションしてもよい。それらは、Ｃｈｒｏｍｅ（登録商標）、ＩＥ（登録商標）、Ｃｉｔｒｉｘ（登録商標）、ＳＡＰ（登録商標）などとの統合を促進してもよい。例えば、「クリック」アクティビティは、ドライバ３４０を介して、これらの異なるアプリケーションにおいて同じ役割を果たす。

【0062】

図４は、本発明の実施形態による、ＲＰＡシステム４００を示すアーキテクチャ図である。いくつかの実施形態では、ＲＰＡシステム４００は、図１および／または図２のＲＰＡシステム１００および／または２００であってもよいし、それを含んでもよい。ＲＰＡシステム４００は、ロボットを実行する複数のクライアントコンピューティングシステム４１０を含む。コンピューティングシステム４１０は、その上で実行されるウェブアプリケーションを介してコンダクタコンピューティングシステム４２０と通信することができる。コンダクタコンピューティングシステム４２０は、順番に、データベースサーバー４３０および任意のインデクササーバー４４０と通信することができる。

【0063】

図１および図３に関して、これらの実施形態ではウェブアプリケーションが使用されているが、本発明の範囲から逸脱することなく、任意の適切なクライアント／サーバーソフトウェアを使用することができることに留意すべきである。例えば、コンダクタは、クライアントコンピューティングシステム上で、非ウェブベースのクライアントソフトウェアアプリケーションと通信するサーバーサイドアプリケーションを実行してもよい。

【0064】

図５は、本発明の実施形態による、長時間実行ワークフローを使用してＡＩフローを構築および管理するように構成されたコンピューティングシステム５００を示すアーキテクチャ図である。いくつかの実施形態では、コンピューティングシステム５００は、本明細書に描かれたおよび／または記載された１または複数のコンピューティングシステムであってもよい。コンピューティングシステム５００は、情報を通信するためのバス５０５または他の通信機構と、情報を処理するためのバス５０５に結合されたプロセッサ（複数可）５１０とを含む。プロセッサ（複数可）５１０は、中央処理ユニット（ＣＰＵ）、特定用途集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、グラフィックスプロセッシングユニット（ＧＰＵ）、それらの複数のインスタンス、および／またはそれらのいずれかの組み合わせを含む、いずれかのタイプの一般的または特定用途向けプロセッサであり得る。プロセッサ（複数可）５１０はまた、複数の処理コアを有してもよく、コアの少なくとも一部は、特定の機能を実行するように構成され得る。いくつかの実施形態では、複数並列処理が使用されてもよい。特定の実施形態では、少なくとも１つのプロセッサ（複数可）５１０は、生物学的ニューロンを模倣する処理要素を含むニューロモーフィック回路であり得る。いくつかの実施形態では、ニューロモーフィック回路は、フォンノイマンコンピューティングアーキテクチャの典型的なコンポーネントを必要としない場合がある。

【0065】

コンピューティングシステム５００は、プロセッサ（複数可）５１０によって遂行される情報および命令を格納するためのメモリ５１５をさらに含む。メモリ５１５は、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、フラッシュメモリ、キャッシュ、磁気ディスクもしくは光ディスクなどの静的記憶装置、または他のタイプの非一時的なコンピュータ読み取り可能な媒体、あるいはそれらのいずれかの組み合わせで構成され得る。非一時的なコンピュータ読み取り可能な媒体は、プロセッサ（複数可）５１０によりアクセス可能ないずれかの利用可能な媒体であってもよく、揮発性媒体、不揮発性媒体または両方などを含み得る。また、媒体は、取り外し可能なもの、取り外し不可能なもの、または両方であってもよい。

【0066】

さらに、コンピューティングシステム５００は、無線および／または有線接続を介して通信ネットワークへのアクセスを提供するために、トランシーバなどの通信デバイス５２０を含む。いくつかの実施形態では、通信デバイス５２０は、周波数分割多元接続（ＦＤＭＡ）、シングルキャリアＦＤＭＡ（ＳＣ－ＦＤＭＡ）、時分割多元接続（ＴＤＭＡ）、符号分割多元接続（ＣＤＭＡ）、直交周波数分割多重方式（ＯＦＤＭ）、直交周波数分割多元接続（ＯＦＤＭＡ）、移動体用グローバルシステム（ＧＳＭ：ＧｌｏｂａｌＳｙｓｔｅｍｆｏｒＭｏｂｉｌｅ）通信、汎用パケット無線サービス（ＧＰＲＳ：ＧｅｎｅｒａｌＰａｃｋｅｔＲａｄｉｏＳｅｒｖｉｃｅ）、ユニバーサル移動体通信システム（ＵＭＴＳ：ＵｎｉｖｅｒｓａｌＭｏｂｉｌｅＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓＳｙｓｔｅｍ）、ｃｄｍａ２０００、広帯域ＣＤＭＡ（Ｗ－ＣＤＭＡ：ＷｉｄｅｂａｎｄＣＤＭＡ）、高速ダウンリンクパケットアクセス（ＨＳＤＰＡ：Ｈｉｇｈ－ＳｐｅｅｄＤｏｗｎｌｉｎｋＰａｃｋｅｔＡｃｃｅｓｓ）、高速アップリンクパケットアクセス（ＨＳＵＰＡ：Ｈｉｇｈ－ＳｐｅｅｄＵｐｌｉｎｋＰａｃｋｅｔＡｃｃｅｓｓ）、高速パケットアクセス（ＨＳＰＡ：Ｈｉｇｈ－ＳｐｅｅｄＰａｃｋｅｔＡｃｃｅｓｓ）、ロングタームエボリューション（ＬＴＥ：ＬｏｎｇＴｅｒｍＥｖｏｌｕｔｉｏｎ）、ＬＴＥアドバンスト（ＬＴＥ－Ａ：ＬＴＥＡｄｖａｎｃｅｄ）、８０２．１１ｘ、Ｗｉ－Ｆｉ、Ｚｉｇｂｅｅ、超広帯域無線（ＵＷＢ：Ｕｌｔｒａ－ＷｉｄｅＢａｎｄ）、８０２．１６ｘ、８０２．１５、ＨｏｍｅＮｏｄｅ－Ｂ（ＨｎＢ）、Ｂｌｕｅｔｏｏｔｈ、無線ＩＤタグ（ＲＦＩＤ：ＲａｄｉｏＦｒｅｑｕｅｎｃｙＩｄｅｎｔｉｆｉｃａｔｉｏｎ）、ＩｒＤＡ（ＩｎｆｒａｒｅｄＤａｔａＡｓｓｏｃｉａｔｉｏｎ）、近距離無線通信（ＮＦＣ：Ｎｅａｒ－ＦｉｅｌｄＣｏｍｍｕｎｉｃａｔｉｏｎｓ）、第５世代（５Ｇ）、ＮｅｗＲａｄｉｏ（ＮＲ）、それらのいずれかの組み合わせ、および／または本発明の範囲から逸脱することなく、いずれかの他の現在存在するまたは将来実装される通信標準および／またはプロトコルを使用するように構成され得る。いくつかの実施形態では、通信デバイス５２０は、本発明の範囲から逸脱することなく、単数のアンテナ、アレイ状のアンテナ、フェーズドアンテナ、スイッチドアンテナ、ビームフォーミングアンテナ、ビームステアリングアンテナ、それらの組み合わせ、および／またはいずれかの他のアンテナ構成である１または複数のアンテナを含み得る。

【0067】

プロセッサ（複数可）５１０は、バス５０５を介して、プラズマディスプレイ、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）ディスプレイ、電界放出ディスプレイ（ＦＥＤ）、有機発光ダイオード（ＯＬＥＤ）ディスプレイ、フレキシブルＯＬＥＤディスプレイ、フレキシブル基板ディスプレイ、プロジェクションディスプレイ、４Ｋディスプレイ、高精細ディスプレイ、Ｒｅｔｉｎａ（登録商標）ディスプレイ、ＩＰＳ（Ｉｎ－ＰｌａｎｅＳｗｉｔｃｈｉｎｇ）ディスプレイ、またはユーザーに情報を表示するためのいずれかの他の適切なディスプレイなどのディスプレイ５２５にさらに結合されている。ディスプレイ５２５は、抵抗方式、静電容量方式、表面弾性波（ＳＡＷ）静電容量方式、赤外線方式、光学イメージング方式、分散信号方式、音響パルス認識方式、フラストレート全内部反射方式などを用いて、タッチ（ハプティック）ディスプレイ、３次元（３Ｄ）タッチディスプレイ、マルチ入力タッチディスプレイ、マルチタッチディスプレイなどとして構成されていてもよい。本発明の範囲を逸脱することなく、いずれかの好適な表示デバイスおよびハプティックＩ／Ｏを使用することができる。

【0068】

コンピュータマウス、タッチパッドなどのようなキーボード５３０およびカーソル制御デバイス５３５は、ユーザーがコンピューティングシステムとインターフェースすることを可能にするために、バス５０５にさらに結合されている。しかしながら、特定の実施形態では、物理的なキーボードおよびマウスが存在しない場合があり、ユーザーは、ディスプレイ５２５および／またはタッチパッド（図示せず）のみを介してデバイスとインタラクションすることができる。任意の入力デバイスの種類および組み合わせは、設計の選択の問題として使用され得る。特定の実施形態では、物理的な入力デバイスおよび／またはディスプレイは存在しない。例えば、ユーザーは、コンピューティングシステム５００と通信している別のコンピューティングシステムを介してリモートでそれとインタラクションしてもよいし、コンピューティングシステム５００は自律的に動作してもよい。

【0069】

メモリ５１５は、プロセッサ（複数可）５１０により遂行されたときに機能を提供するソフトウェアモジュールを格納する。モジュールは、コンピューティングシステム５００のためのオペレーティングシステム５４０を含む。モジュールはさらに、本明細書に記載されたプロセスの全部もしくは一部またはその派生物を実行するように構成された長時間実行ワークフローモジュール５４５を含む。コンピューティングシステム５００は、付加的な機能を含む１または複数の付加的な機能モジュール５５０を含み得る。

【0070】

当業者であれば、「システム」は、本発明の範囲から逸脱することなく、サーバー、組み込みコンピューティングシステム、パーソナルコンピュータ、コンソール、パーソナルデジタルアシスタント（ＰＤＡ）、携帯電話、タブレットコンピューティングデバイス、量子コンピューティングシステム、または他のいずれかの適切なコンピューティングデバイス、またはデバイスの組み合わせとして具現化され得ることを理解するであろう。上述した機能を「システム」により実行されるものとして提示することは、何ら本発明の範囲を限定することを意図するものではなく、本発明の多くの実施形態の一例を提供することを意図するものである。実際、本明細書に開示された方法、システム、および装置は、クラウドコンピューティングシステムを含むコンピューティング技法と整合性のあるローカライズされた形態および分配された形態で実装されてもよい。コンピューティングシステムは、ローカルエリアネットワーク（ＬＡＮ）、モバイル通信ネットワーク、衛星通信ネットワーク、インターネット、パブリッククラウドまたはプライベートクラウド、ハイブリッドクラウド、サーバーファーム、それらのいずれかの組み合わせなどの一部またはその他の方法でアクセス可能であり得る。本発明の範囲から逸脱することなく、任意の局所または分散アーキテクチャが使用され得る。

【0071】

本明細書で説明するシステム特色のいくつかは、実装の独立性をより強調するために、モジュールとして提示されていることに留意すべきである。例えば、モジュールは、カスタムの非常に大規模な集積（ＶＬＳＩ）回路またはゲートアレイ、ロジックチップ、トランジスタ、または他の個別部品のような既製の半導体を含むハードウェア回路として実装され得る。また、モジュールは、フィールドプログラマブルゲートアレイ、プログラマブルアレイロジック、プログラマブルロジックデバイス、グラフィックス処理ユニットなどのプログラマブルハードウェアデバイスに実装され得る。

【0072】

モジュールはまた、様々なタイプのプロセッサにより遂行されるためのソフトウェアに少なくとも部分的に実装され得る。例えば、遂行可能コードの特定された単位は、例えば、オブジェクト、プロシージャ、または関数として編成されていてもよいコンピュータ命令の１または複数の物理的または論理的なブロックを含み得る。それにもかかわらず、遂行可能な特定されたモジュールは、物理的に一緒に配置されている必要はなく、論理的に結合されたときにモジュールを含み、モジュールのために述べられた目的を達成するために、異なる場所に格納された別々の命令を含んでいてもよい。さらに、モジュールは、例えば、ハードディスクドライブ、フラッシュデバイス、ＲＡＭ、テープのような非一時的なコンピュータ読み取り可能な媒体、および／または本発明の範囲から逸脱することなくデータを格納するために使用される他のいずれかの非一時的なコンピュータ読み取り可能な媒体に格納されていてもよい。

【0073】

実際、遂行可能コードのモジュールは、単一の命令であってもよいし、多数の命令であってもよいし、さらには、複数の異なるコードセグメント、異なるプログラム間、および複数のメモリデバイス間に分散されていてもよい。同様に、動作データは、モジュール内で特定され、ここで示されてもよく、いずれかの適切なタイプのデータ構造体内でいずれかの適切な形態で具現化され、組織化され得る。動作データは、単一のデータセットとして収集されてもよいし、または異なる記憶デバイスにわたり異なる場所に分散されていてもよく、少なくとも部分的には、単にシステムまたはネットワーク上の電子信号として存在していてもよい。

【0074】

図６Ａは、本発明の実施形態による、画像内のグラフィカル要素を認識するように訓練されたニューラルネットワーク６００の例を示す。ここで、ニューラルネットワーク６００は、入力層の入力「ニューロン」１～Ｉに関する入力として、１９２０×１０８０の画面のスクリーンショット画像のピクセルを受信する。この場合、Ｉは、スクリーンショット画像のピクセルの総数である２，０７３，６００である。

【0075】

ニューラルネットワーク６００はまた、多数の隠れ層を含む。深層学習ニューラルネットワーク（ＤＬＮＮ）と浅い学習ニューラルネットワーク（ＳＬＮＮ）はどちらも通常複数の層を有するが、ＳＬＮＮは場合によっては１または２つの層しか持たず、通常はＤＬＮＮよりも少ない場合がある。典型的に、ニューラルネットワークのアーキテクチャは、ニューラルネットワーク６００の場合のように、入力層、複数の中間層、および出力層を含む。

【0076】

多くの場合、ＤＬＮＮは多くの層（１０、５０、２００など）を有し、後続の層は通常、前の層からの機能を再利用して、より複雑で一般的な関数を計算する。一方、ＳＬＮＮは少数のレイヤーしか有さず、生データサンプルからエキスパート機能が事前に作成されるため、比較的迅速に訓練する傾向がある。ただし、特徴抽出は面倒である。ＤＬＮＮは通常、エキスパート機能を必要としないが、訓練に時間がかかり、より多くの層を有する傾向がある。

【0077】

どちらのアプローチでも、層は訓練セットで同時に訓練され、通常は分離された交差検証セットでオーバーフィッティングをチェックする。両方の技法でも優れた結果が得られ、両方のアプローチにかなりの熱意がある。個々の層の最適なサイズ、形状、および数は、それぞれのニューラルネットワークによって対処される問題に依存する。

【0078】

図６Ａに戻ると、入力層として提供されるピクセルは、隠れ層１のＪ個のニューロンへの入力として供給される。この例では、すべてのピクセルが各ニューロンに供給されるが、限定されないが、フィードフォワードネットワーク、ラジアルベーシスネットワーク、ディープフィードフォワードネットワーク、ディープコンボリューションインバースグラフィックスネットワーク、コンボリューションニューラルネットワーク、リカレントニューラルネットワーク、人工ニューラルネットワーク、長期／短期記憶ネットワーク、ゲーテッドリカレントユニットネットワーク、生成的敵対ネットワーク、リキッドステートマシン、オートエンコーダ、変分オートエンコーダ、ノイズ除去オートエンコーダ、スパースオートエンコーダ、エクストリームラーニングマシン、エコー状態ネットワーク、マルコフ連鎖、ホップフィールドネットワーク、ボルツマンマシン、制限付きボルツマンマシン、深層残差ネットワーク、コホーネンネットワーク、ディープビリーフネットワーク、ディープコンボリューションネットワーク、サポートベクターマシン、ニューラルチューリングマシン、または本発明の範囲から逸脱しない任意の他の適切なタイプまたは組み合わせのニューラルネットワークを含む、個々にまたは組み合わせて使用され得るさまざまなアーキテクチャが可能である。

【0079】

隠れ層２は隠れ層１から入力を受信し、隠れ層３は隠れ層２から入力を受信し、最後の隠れ層がその出力を出力層の入力として提供するまで、全ての隠れ層について同じように行われる。ニューロンＩ、Ｊ、Ｋ、およびＬの数は必ずしも等しくなく、したがって、本発明の範囲から逸脱することなく、ニューラルネットワーク６００の所定の層に対して任意の所望の数の層を使用することができることに留意されたい。実際、特定の実施形態では、所与の層におけるニューロンのタイプは、すべて同じでなくてもよい。

【0080】

ニューラルネットワーク６００は、画像内で発見されたと考えられるグラフィカル要素に信頼スコアを割り当てるように訓練される。許容できないほど低い尤度を有するマッチングを減らすために、いくつかの実施形態では、信頼閾値を満たすかまたはそれを超える信頼スコアを有するそれらの結果のみが提供され得る。例えば、信頼閾値が８０％である場合、この量を超える信頼スコアを有する出力が使用され、残りは無視されてもよい。この場合、出力層は、２つのテキストフィールド、テキストラベル、およびサブミットボタンが見つけられたことを示す。ニューラルネットワーク６００は、本発明の範囲から逸脱することなく、これらの要素の位置、寸法、画像、および／または信頼スコアを提供してもよく、これは、この出力を所定の目的のために使用するＲＰＡロボットまたは別のプロセスによってその後使用され得る。

【0081】

ニューラルネットワークは、典型的には信頼スコアを有する確率的構築物であることに留意されたい。これは、ＡＩ／ＭＬモデルが、訓練中に類似の入力が正しく特定された頻度に基づいて学習したスコアであり得る。例えば、テキストフィールドは、しばしば長方形の形状と白い背景を有する。ニューラルネットワークは、これらの特徴を有するグラフィカル要素を高い信頼度で特定することを学習し得る。信頼スコアの一般的なタイプは、０と１の間の１０進数（信頼度のパーセンテージとして解釈可能）、負の∞と正の∞の間の数、または表現のセット（例えば、「低」、「中」、および「高」）を含む。また、より正確な信頼スコアを得る試みとして、温度スケーリング、バッチ正規化、重み減衰、負対数尤度（ＮＬＬ）など、さまざまな後処理較正技法が採用され得る。

【0082】

ニューラルネットワークの「ニューロン」は、通常、生体ニューロンの機能に基づく数学的関数である。ニューロンは、重み付けされた入力を受信し、それらが出力を次の層に渡すかどうかを統治する和および活性化関数を有する。この活性化関数は、値が閾値を下回っている場合は何も起こらない非線形の閾値付きアクティビティ関数であり得、関数が閾値を超えると線形に応答する（つまり、正規化線形単位（ＲｅＬＵ）非線形性）。実際のニューロンはほぼ同様のアクティビティ関数を有し得るため、深層学習では合計関数およびＲｅＬＵ関数が使用される。線形変換を介して、情報が差し引かれたり、追加されたりするなどされ得る。本質的に、ニューロンは、それらの基礎となる数学的関数によって統治される次の層に出力を渡すゲーティング関数として機能する。いくつかの実施形態では、少なくともいくつかのニューロンに対して異なる関数が使用され得る。

【0083】

【0084】

【0085】

【0086】

この場合、ニューロン６１０は単層パーセプトロンである。しかしながら、本発明の範囲から逸脱することなく、任意の適切なニューロンタイプまたはニューロンタイプの組み合わせが使用され得る。

【0087】

目標、つまり「報酬関数」がしばしば採用される。この例では、目標は画像内のグラフィカル要素を正しく特定することである。報酬関数は、状態空間の検索を導き、目標（例えば、グラフィカル要素の成功した特定、ＲＰＡワークフローのアクティビティの次のシーケンスの成功した特定、など）の達成を試みるために、短期および長期の両方の報酬を使用して中間遷移およびステップを探索する。

【0088】

訓練中、さまざまなラベル付きデータ（この場合は画像）がニューラルネットワーク６００を介して供給される。特定に成功すると、ニューロンへの入力の重みが強化されるが、特定に失敗すると、それらの重みが弱まる。平均二乗誤差（ＭＳＥ）または勾配降下などのコスト関数を使用して、わずかに間違っている予測を、大きく間違っている予測よりもはるかに少ない罰で済むようにし得る。ＡＩ／ＭＬモデルの性能が一定回数の訓練反復後に改善されない場合、データサイエンティストは報酬関数を変更し、特定されていないグラフィカル要素がどこにあるかを示し、誤特定されたグラフィカル要素の修正を提供するなどし得る。

【0089】

バックプロパゲーションは、フィードフォワードニューラルネットワークでシナプスの重みを最適化するための手法である。バックプロパゲーションは、ニューラルネットワークの隠れ層を「ポップアップ」して、各ノードがどれだけの損失を負担しているかを確認し、その後、誤差率の高いノードに低い重みを与え、逆もまた同様、損失を最小化するように重みを更新するために使用され得る。つまり、バックプロパゲーションは、データサイエンティストが実際の出力と所望の出力との差を最小にするように、重みを繰り返し調整することを可能にする。

【0090】

バックプロパゲーションのアルゴリズムは、数学的に最適化理論に基づいている。教師あり学習では、出力が既知の訓練データをニューラルネットワークに通し、既知の目標出力からコスト関数を用いて誤差を計算し、これがバックプロパゲーションの誤差を与える。誤差は出力で計算され、この誤差は、誤差を最小化するネットワークの重みの修正に変換される。

【0091】

【0092】

【0093】

【0094】

【0095】

【0096】

ＡＩ／ＭＬモデルは、それが良好な精度のレベル（例えば、検出のためのＦ２またはＦ４閾値を使用して９７％以上、約２０００エポック）に達するまで、複数のエポックにわたって訓練される。この精度レベルは、いくつかの実施形態では、Ｆ１スコア、Ｆ２スコア、Ｆ４スコア、または本発明の範囲から逸脱しない任意の他の適切な技法を使用して決定され得る。訓練データで一旦訓練されると、ＡＩ／ＭＬモデルは、ＡＩ／ＭＬモデルが以前に遭遇したことのない評価データのセットでテストされる。これは、ＡＩ／ＭＬモデルが、訓練データ中のグラフィカル要素をよく特定するが、他の画像にうまく一般化しないような「過剰適合」をしないことを保証するのに役立つ。

【0097】

いくつかの実施形態では、どのような精度レベルが達成され得るかは、知られていない場合がある。したがって、評価データを分析する際にＡＩ／ＭＬモデルの精度が下がり始めている場合（すなわち、モデルは訓練データでは良好に実行しているが、評価データでは性能が低下し始めている）、ＡＩ／ＭＬモデルは、訓練データ（および／または新しい訓練データ）におけるさらなる訓練のエポックを経ることができる。いくつかの実施形態では、ＡＩ／ＭＬモデルは、精度が特定のレベルに達した場合、または訓練されたＡＩ／ＭＬモデルの精度が既存の展開されたＡＩ／ＭＬモデルより優れている場合にのみ展開される。

【0098】

特定の実施形態では、訓練されたＡＩ／ＭＬモデルの収集は、対象グラフィカル要素（例えば、画像用のもの、テキストフィールド用の別のもの、ラジオボタン用の別のものなど）のタイプごとにＡＩ／ＭＬモデルを採用する、ＡＩ／ＭＬモデルを採用してＯＣＲを実行する、さらに別のＡＩ／ＭＬモデルを展開してグラフィカル要素間の近接関係を認識する、さらに別のＡＩ／ＭＬモデルを採用して他のＡＩ／ＭＬモデルからの出力に基づいてＲＰＡワークフローを生成するなど、タスクを実現するために使用され得る。例えば、これにより、ＡＩ／ＭＬモデルが集合的にセマンティックオートメーションを可能にし得る。ＣＶおよびＯＣＲは、例えば、畳み込みおよび／またはリカレントニューラルネットワーク（ＲＮＮ）を使用して実行され得る。

【0099】

いくつかの実施形態では、最先端の文、テキスト、および画像埋め込み用のＰｙｔｈｏｎ（商標）フレームワークであるＳｅｎｔｅｎｃｅＴｒａｎｓｆｏｒｍｅｒｓ（商標）などのトランスフォーマーネットワークを使用することができる。このようなトランスフォーマーネットワークは、高いスコアと低いスコアの両方を持つ単語およびフレーズの関連付けを学習する。これは、ＡＩ／ＭＬモデルを訓練して、何が入力に近く、何がそうでないかをそれぞれ決定する。単語／フレーズの対だけを使用するのではなく、トランスフォーマーネットワークは、フィールド長およびフィールドタイプも使用してもよい。

【0100】

いくつかの実施形態では、機械学習パイプラインを構築するためにＡＩスキルスタジオが使用され得る。このようなＡＩスキルスタジオ７００は、図７に示される。ＡＩスキルスタジオ７００は、技術的に高度なデータ科学者と市民データ科学者の両方が、データ取り込み、前処理、（再）訓練、提供、および後処理のためのＭＬパイプラインを構築することを可能にする。このような機能は、ＲＰＡデザイナアプリケーションに組み込まれ得、１つのアプリケーションでＲＰＡ開発者とデータ科学者の両方が必要とする機能を提供する。

【0101】

インターフェースモードペイン７１０を使用して、ユーザーは、ＭＬパイプラインを構築するか、または既存のＭＬパイプラインをテストするかを選択し得る。ＭＬパイプライン設計ペイン７２０は、ユーザーがＭＬコンポーネントペイン７３０からＭＬコンポーネントをドラッグして、所望のＭＬパイプラインを構築することを可能にする。例えば、ユーザーは、ＭＬパイプラインの入力、ＭＬパイプラインにおけるＡＩ／ＭＬモデルのロケーションおよびその間のフロー、ならびにＭＬパイプラインの出力を定義し得る。いくつかの実施形態では、ユーザーは、各コンポーネントをクリックすることによって個別にそれを設定し得る。ＭＬパイプラインフローは、図７に示すように、直列、並列、またはそれらの組み合わせで接続されたＡＩ／ＭＬモデルを含み得る。

【0102】

図８Ａおよび図８Ｂは、本発明の実施形態による、コンダクタアプリケーション８００のプロセスデザイナの設計図を示す。この例では、情報技術（ＩＴ）業務における予防保守のための異常検出を実行するために、ＡＩ対応の長時間実行ワークフローが実装される。このビューは、ユーザーがロボット、マシン、プロセス、ＭＬスキル、ジョブ、スケジュール、プロセス設計、資産、およびキューに関連するビューを選択することができるタスク選択ペイン８０２を含む。ＭＬスキルは、ＡＩを使用した経験のないユーザーが潜在的にフローにプラグインされ得る（例えば、ドラッグアンドドロップされることによって）ＡＩ／ＭＬモデルである。例えば、あるＭＬスキルは、入力として収益のセットに基づいて予測を実行してもよく、そのＭＬスキルに連結された別のＭＬスキルは、入力として予測を取り、将来の売上に対する予測を行うなどしてもよい。キューは、ロボットとコンダクタアプリケーションとの間、２または複数のロボットの間などで利用可能な、複数のタイプのデータを潜在的に格納するコンテナであってよい。ＲＰＡプロセスは、ＲＰＡロボットによって実行される動作である。

【0103】

ビュータイプメニュー８０４により、ユーザーは設計ビューとランタイムビューの間で選択し得る。設計ビューは、図８Ａおよび図８Ｂに示される。一方、ランタイムビューは（例えば、図８Ｃを参照）、入力が期待されない場合は透過的に実行し得る、あるいは入力が要求される場合入力を入力するユーザー用の場所を提供および／または予期せぬエラーが生じる場合情報を表示するかもしくは支援を要求し得る。特定の実施形態は、ＭＬスキル８１２の信頼レベルがある量を下回る場合、人間の入力が要求され得る。これは、長時間実行ワークフローによって促進され得る。プロセスデザイナペイン８０６は、ユーザーがコンポーネントペイン８０８からデザイナペイン８０６にコンポーネントをドラッグし、それらを相互接続することを可能にする。

【0104】

データベース８１０（例えば、Ｓｐｌｕｎｋ（商標）リアルタイムログデータベース）は、比較的複雑なオンプレミスＩＴインフラストラクチャに関連するログを捕捉する。データ科学者は、いくつかの実施形態では、図７に示されるものと同様の方法で、データストリーミングパイプをデータベース８１０に接続するＭＬパイプラインを作成する。ここではＭＬスキル８１２が示されているが、これは、ＭＬパイプライン、別のワークフローなどに抽象化され得ることに留意されたい。特定の実施形態では、連鎖したＭＬスキルは、プロセスデザイナペイン８０６に追加され、かつ表示され得る。ＭＬパイプラインは、例えば、図７のＡＩスキルスタジオ７００またはＵｉＰａｔｈＡＩＳｋｉｌｌｓＳｔｕｄｉｏ（商標）などのＡＩスキルスタジオにおいて作成された異常検出ＡＩ／ＭＬモデルに供給される。

【0105】

異常がＭＬスキル８１２によって検出されるとき、その出力は、第１のキュー８１４（例えば、ＵｉＰａｔｈ（登録商標）キュー）に渡される。異常のタイプに基づいて、第１のキュー８１４は、ＭＬスキル８１２によって検出された異常に対する修正の共通セットを試みるために、いくつかの実施形態において多くの異なるワークフローのうちの１つをトリガし得る。この例では、ワークフロー（またはＲＰＡプロセス）８１６、８１８、８２０、８２２は、遂行されると、成功または失敗した修復が発生したかどうかを記述する第２のキュー８２４のための項目を生成する。キュー項目は、本発明の範囲から逸脱することなく、任意の所望のデータ型（複数可）であり得る。コンダクタアプリケーション、ＲＰＡロボットなどは、キューからこれらのデータ項目を取得し、それらを処理してもよい。項目は、いくつかの実施形態では、ＪＳＯＮを使用してキューに押し込まれ得る。

【0106】

成功した場合、異常検出パイプラインのパフォーマンスを経時的に改善するために、ラベルを付けて再訓練データストア（図示せず）にデータを送信する、成功した修復のためのＲＰＡプロセス８２６がトリガされる。しかし、修復が失敗した場合、失敗した結果のための第３のキュー８３０に項目を追加する、失敗した修復のためのＲＰＡプロセス８２８がトリガされる。問題は、高い優先度でＩＴサービス管理（ＩＴＳＭ）システムに追加されてもよく、人間の修復データは、ＩＴＳＭシステムから受信されて、ＲＰＡプロセス８３２を介して異常検出パイプラインの性能を改善するために再訓練データストアに送信され得る。ＭＬパイプラインが対処できなかったこれらの修復は、再訓練中のＭＬパイプラインの精度を向上させるために特に有益であり得る。

【0107】

この場合、ＭＬパイプラインは、長時間実行プロセスの最初であり、出力に基づいて遂行される後続のワークフローをトリガする。しかしながら、ＭＬパイプラインは、本発明の範囲から逸脱することなく、長時間実行プロセスにおける任意の所望のロケーションに含まれ得る。実際、特定の実施形態では、複数のＭＬパイプラインがさまざまなロケーションで使用され得る。

【0108】

ＡＩ／ＭＬモデルを長時間実行ワークフローに効果的に組み込むために、最初にソリューションアーキテクトまたはプロセスエキスパートがエンドツーエンドのフローをマッピングし得る。これは、最初に高レベルの「タスク」を設計することによって達成され得、その後、「タスク」は個々のコンポーネントを設計し構築するためにＲＰＡ開発者またはデータ科学者に割り当てられ得る。図８Ａでは、異常検出器ＭＬスキル８１２が選択され、そのプロパティがコンポーネントペイン８０８に示される。図８Ｂでは、サーバーから非クリティカルなプロセスを削除するためのＲＰＡプロセス８２０が選択され、そのプロパティがコンポーネントペイン８０８に示される。このメカニズムにより、ユーザーは個々のコンポーネントを設定し得る。

【0109】

図８Ｃは、本発明の実施形態による、コンダクタアプリケーションのプロセスデザイナ８００の設計図を示す。この実施形態では、ランタイムビューは、自動修復プロセスが機能しているとき、人間に入力を促す必要がない場合がある。しかしながら、ここでは、システムが問題に自動的に対処できなかったとき、ユーザー入力ペイン８４０は、コメントテキストボックス８４２にコメントを提供するように技術専門家を促す。次に、技術専門家は、提出ボタン８４４を使用してコメントを提出する、または、記録アクションボタン８４６を使用して彼または彼女の修復アクションを記録するようにプロセスデザイナ８００に指示し得る。記録されたアクションは、その後、データベース８１０に保存され、ＭＬスキル８１２を再訓練するために使用され得る。

【0110】

図９は、本発明の実施形態による、長時間実行ワークフローを使用してＡＩフローを構築および管理するように構成されたシステム９００を示すアーキテクチャ図である。システム９００は、デスクトップコンピュータ９０２、タブレット９０４、スマートフォン９０６などのユーザーコンピューティングシステムを含む。しかしながら、スマートウォッチ、ラップトップコンピュータなどを含むが、これらに限定されない、任意の所望のコンピューティングシステムが本発明の範囲から逸脱せずに使用され得る。また、図９には３つのユーザーコンピューティングシステムが示されているが、本発明の範囲から逸脱することなく、任意の適切な数のコンピューティングシステムが使用され得る。例えば、いくつかの実施形態では、数十、数百、数千、または数百万のコンピューティングシステムが使用されてもよい。

【0111】

各コンピューティングシステム９０２、９０４、９０６は、特定のタスク（例えば、１または複数のＡＩ／ＭＬモデル９３２、連鎖した（例えば、直列、並列、またはそれらの組み合わせ）または非連鎖のいずれか）の性能におけるＡＩ／ＭＬモデル（複数可）を呼び出す長時間実行ワークフローの全てまたは一部を遂行するＲＰＡロボット９１０、９１２、９１４をそれぞれ有する。例えば、１または複数のＲＰＡロボット９１０、９１２、９１４は、それぞれのコンピューティングシステム上でユーザーが何をしているかを認識するためにＣＶを使用するように訓練されたＡＩ／ＭＬモデルを呼び出し得る。コンピューティングシステム９０２、９０４、９０６は、ネットワーク９２０（例えば、ローカルエリアネットワーク（ＬＡＮ）、モバイル通信ネットワーク、衛星通信ネットワーク、インターネット、それらのいずれかの組み合わせなど）を介して、ＡＩ／ＭＬモデル９３２の遂行の要求および関連する入力情報などの情報をサーバー９３０に送信する。いくつかの実施形態では、サーバー９３０は、パブリッククラウドアーキテクチャ、プライベートクラウドアーキテクチャ、ハイブリッドクラウドアーキテクチャなどの一部であってもよい。特定の実施形態では、サーバー９３０は、単一のコンピューティングシステム９３０上で複数のソフトウェアベースのサーバーをホストしてもよい。いくつかの実施形態では、サーバー９３０は、１または複数の仮想マシン（ＶＭ）を介して実装され得る。サーバー９３０は、１または複数のＲＰＡロボット９１０、９１２、９１４によって呼び出され、自動化を完了する際にそれぞれの呼び出すＲＰＡロボットを支援する情報を提供する、本実施形態におけるＡＩ／ＭＬモデル９３２を含む。いくつかの実施形態では、ＲＰＡロボット９１０によって呼び出されるＡＩ／ＭＬモデル９３２は、統計的モデリング（例えば、隠れマルコフモデル（ＨＭＭ））などのさまざまな機能を実行する複数の層を有し得、深層学習技術（例えば、長短期記憶（ＬＳＴＭ）深層学習、以前の隠れ状態のエンコードなど）を利用してユーザーインタラクションのシーケンスを特定し得る。

【0112】

サーバー９３０は、長時間実行ワークフローに関連するサーバーセッションを実行し、コンピューティングシステム９０２、９０４、９０６は、自身のクライアントセッションを実行する。いくつかの実施形態では、コンピューティングシステム９０２、９０４、９０６の複数のＲＰＡロボット９１０、９１２、９１４は、同じ長時間実行ワークフローに関連してもよく、または長時間実行ワークフローはＲＰＡロボット９１０、９１２、９１４の１つとサーバー９３０との間であってもよい。各長時間実行ワークフローに対して、サーバー９３０上に別々のサーバーセッションが存在してもよい。

【0113】

非限定的な例として、コンピューティングシステム９０２の顧客ＲＰＡロボット９１０が、コンピューティングシステム９０４の顧客サービスＲＰＡロボット９１２によるアクションも必要とする長時間実行ワークフローを遂行している場合を考える。顧客ＲＰＡロボット９１０は、顧客サービスＲＰＡロボット９１２からの応答を必要とするそのワークフローの時点に達し得る。次に、顧客ＲＰＡロボット９１０は、必要な情報（例えば、請求書のコピーが添付された請求書に関する問い合わせ）を有する要求を顧客サービスＲＰＡロボット９１２に送信し、待つ。顧客サービスＲＰＡロボット９１２は、要求を受信し、サーバー９３０を介して、請求書に対する文書処理を行うＡＩ／ＭＬモデル９３２を呼び出す。そして、顧客サービスＲＰＡロボット９１２は、ＡＩ／ＭＬモデル９３２からの文書処理出力を受信し、請求書の不一致とソリューションを決定し、この情報を顧客ＲＰＡロボット９１０に送信する。顧客ＲＰＡロボット９１０は、その後、この情報を用いてそのワークフローを再開する。これは、長時間実行ワークフローを使用する可能な多くの機能の一例である。

【0114】

人間のレビュアーは、コンピューティングシステム９５０上のレビューアプリケーション９５２を介して、サーバー９３０に検証データを提供し得る。例えば、人間のレビュアーは、ＡＩ／ＭＬモデル９３２による予測が正確であることを検証してもよいし、そうでなければ修正を提供してもよい。この動的入力は、次に、ＡＩ／ＭＬモデル９３２を再訓練するための訓練データとして保存され、そしていくつかの実施形態ではデータベース９４０に格納され得る。

【0115】

いくつかの実施形態では、複数のＡＩ／ＭＬモデルが使用され得る。各ＡＩ／ＭＬモデルは、データ上で実行するアルゴリズム（またはモデル）であり、ＡＩ／ＭＬモデル自体は、例えば、訓練データにおいて訓練された、訓練された人工「ニューロン」のＤＬＮＮであり得る。ＡＩ／ＭＬモデルは、直列、並列、またはそれらの組み合わせで実行され得る。

【0116】

ＡＩ／ＭＬモデルは、限定されないが、シーケンス抽出モデル、クラスタリング検出モデル、視覚成分検出モデル、テキスト認識モデル（例えば、ＯＣＲ）、音声－テキスト翻訳モデル、またはそれらのいずれかの組み合わせを含み得る。しかし、本発明の範囲から逸脱することなく、ＡＩ／ＭＬモデルの任意の所望の数およびタイプ（複数可）が使用され得る。複数のＡＩ／ＭＬモデルを使用することで、システムが画面で何が起こっているのかのグローバルな画像を展開し得る。例えば、あるＡＩ／ＭＬモデルはＯＣＲを実行することができ、別のものはボタンを検出することができ、別のものはシーケンスを比較することができる、などである。パターンは、ＡＩ／ＭＬモデルによって個別に決定されてもよいし、または複数のＡＩ／ＭＬモデルによって集合的に決定されてもよい。

【0117】

図１０は、本発明の実施形態による、ＡＩを使用する例示的な長時間実行ワークフローのフロー１０００を示すフロー図である。ＲＰＡロボット１は、本実施形態では、セッションＡで顧客のコンピューティングシステム上で実行する顧客ロボットである。ＲＰＡロボット２は、顧客サービスエージェントのコンピューティングシステム上で動作する顧客サービスロボットであってもよいし、または潜在的には、自動的に顧客を支援しようとするアンアテンディッドロボットであってもよい。ＲＰＡロボット２はセッションＢで実行する。サーバーはセッションＣで、ＡＩ／ＭＬモデルの要求を聞き、ＡＩ／ＭＬモデルを遂行させ、ＡＩ／ＭＬモデルの遂行結果を返すプロセス（例えば、ＲＰＡロボットまたは他のプロセス）を実行する。

【0118】

この例は、上記の図９に関する例を反映しており、ユーザーは、請求書に関する問題を有する。顧客は、請求書の不一致に関する情報および請求書に関連するファイル（例えば、ＰＤＦファイル、請求書へのＨＴＴＰリンクなど）をＲＰＡロボット１に提供し、これは、ＳｅｎｄＭｅｓｓａｇｅアクティビティを介してＲＰＡロボット２にこの情報を送信する。その後、ＲＰＡロボット１はソリューションを待つ。

【0119】

ＲＰＡロボット２は、ＲｅｃｅｉｖｅＭｅｓｓａｇｅアクティビティ（例えば、要求を聞くリスナーアクティビティ）を介してＲＰＡロボット１から情報を受信し、ＡＩ／ＭＬモデルに依存して文書処理を実行する。例えば、ＡＩ／ＭＬモデルは、テキスト認識を行い、請求書の種類と形式を決定し、請求書から特定の関連データを引き出すなどしてもよい。ＲＰＡロボット２は、文書またはリンク、および潜在的に顧客からの問題に関する情報を、ＳｅｎｄＭｅｓｓａｇｅアクティビティを介してサーバーに送信し、待つ。サーバープロセス（例えば、ＲＰＡロボット）は、ＲｅｃｅｉｖｅＭｅｓｓａｇｅアクティビティを介してＲＰＡロボット２からこの情報を受信し、この情報を使用して適切なＡＩ／ＭＬモデルを遂行させる。次に、サーバープロセスは、ＡＩ／ＭＬモデルからの結果をＲＰＡロボット２に送信し、それは、結果を自動的または顧客サービスエージェントの支援を受けて処理し、ソリューションを決定する。そして、ソリューションはＲＰＡロボット１に送られ、これは顧客にソリューションを提供する。

【0120】

図１１は、本発明の実施形態による、ＡＩフローを構築および管理するために長時間実行ワークフローを使用するためのプロセス１１００を示すフローチャートである。プロセスは、１１０５で、ＡＩ／ＭＬモデルを呼び出すＡＩフローを含む１または複数のＲＰＡロボットを介して、長時間実行ワークフローを遂行することから始まる。ＡＩフローを遂行するＲＰＡロボット（複数可）は、本実施形態におけるステップ１１０５の一部として、人間のレビューが実行されるべきかどうかを決定するために、ＡＩ／ＭＬモデルによってなされた予測に対する信頼スコアおよび／またはＭＬモデルの信頼度（これは、しばしば規範に対する分布である）にだけ依存しない１または複数の他の技法を監視する。これらの他の技法は、ＡＩ／ＭＬモデル信頼度の潜在的な不正確さを切り離す。これらの他の技法はまた、高い信頼スコアを出力しているＡＩ／ＭＬモデルに対して、あまりにも多くの誤判定が受信されているかどうかを監視することができ得る。

【0121】

このような技法の１つは、監視が行われているＡＩ／ＭＬモデルが行っていることを超越した別の監視するＡＩ／ＭＬモデルを訓練することである。監視するＡＩ／ＭＬモデルは、監視されるＡＩ／ＭＬモデルにより出力される信頼スコアのパターンを認識し、監視されるＡＩ／ＭＬモデルの結果を人間に渡すべきか否かに関するより高い信頼スコアを取得するように訓練され得る。より具体的には、監視するＡＩ／ＭＬモデルは、監視されるＡＩ／ＭＬモデルからの予測、関連する信頼スコア、および監視されるＡＩ／ＭＬモデルに対する１または複数の人間のレビュー期間中に得られた人間による検証結果を使用して訓練され得る。

【0122】

使用され得る別の技法は、本質的に確率的であるヒューリスティックなビジネスルールを適用することである。これらは、時間ウィンドウにわたる支払額（例えば、ある時間帯はより高く重要な請求額を有する傾向がある）、提出量傾向（例えば、ある時間帯はより多くの顧客苦情を有する傾向がある）、提出物のタイプ（例えば、あるタイプの苦情は誤って分類される可能性が高くなる傾向がある）等の統計式に基づき得る。ＡＩ／ＭＬモデルの信頼スコア、１または複数の他の技法によって提供される信頼度、あるいはそれらの組み合わせが、１１１０で人間による検証の閾値を下回る場合、プロセス１１００は、人間のレビューおよび再訓練部分に進む。

【0123】

上記の監視する技法は、データドリフト（すなわち、ＡＩ／ＭＬモデルがより正確でなくなるようにデータが変化している）およびコンセプトドリフト（すなわち、データの変化が不正確さに実質的に寄与せずにＡＩ／ＭＬモデルによってなされる予測がより正確でなくなっている）を監視することが可能であり得る。これらの監視する技法により、再訓練データが収集されるまでの間、プロセス１１００は応急処置として人間のレビューが必要となる場合がある。その後、ＡＩ／ＭＬモデルは、人間のレビューがもはや必要とされない点まで精度を向上させることを目標として再訓練され得る。

【0124】

いくつかの実施形態では、長時間実行ワークフローは、ワークフローの断片化を促進する１または複数の永続化アクティビティを含む。ＡＩ／ＭＬモデルが以前に訓練された場合、トリガの有無にかかわらず、ＲＰＡワークフローの現在の状態が１１１５で保存され、ＡＩ／ＭＬモデルがＡＩ／ＭＬモデルライフサイクルのどこにあるかが１１２０で追跡される。ＲＰＡワークフローの状態は、ＲＰＡロボットがプロセスのどこにいるか（すなわち、ＲＰＡロボットがどのアクティビティを遂行しているか）、そのアクティビティのための入力（例えば、そのアクティビティをキックオフした入力データおよびトリガ）、および人間による検証データなど、ＲＰＡワークフローを遂行するＲＰＡロボット（複数可）のメタデータを含んでもよい。いくつかの実施形態では、状態データは、ＲＰＡロボットが遂行している場所ではなく、コンダクタアプリケーションがある場所（例えば、サーバー上）に格納され得る。

【0125】

いくつかの実施形態におけるＡＩ／ＭＬモデルのライフサイクルは、初期訓練、初期訓練されたＡＩ／ＭＬモデルによるサービング動作、ＡＩ／ＭＬモデルの再訓練、再訓練されたＡＩ／ＭＬモデルの本番環境動作、およびＡＩ／ＭＬモデルの精度が閾値を下回った場合にＡＩ／ＭＬモデルを人間のレビュープロセスに送り返すことを含む。また、いくつかの実施形態では、ステップ１１１５は、トリガに基づいて、ＲＰＡワークフローの状態および長時間実行ワークフローにおけるロケーションを定期的に保存するために実施され得る。訓練データが１１２５で受信され（例えば、ＡＩ／ＭＬモデルの初期訓練またはその再訓練のために）、そして再訓練基準が満たされている場合（例えば、ある量の再訓練データが収集される、ある数の例が収集される、ある期間が経過する、人間が手動で再訓練を開始する、など）、長時間実行ワークフローは、１１３０で代替ＡＩ／ＭＬモデルを訓練するかまたはＡＩ／ＭＬモデルを再訓練し、新しい訓練されたＡＩ／ＭＬモデルまたは再訓練されたＡＩ／ＭＬモデルが１１３５で展開され、長時間実行ワークフローの遂行は１１０５で継続する。新たに訓練されたもしくは再訓練されたＡＩ／ＭＬモデルおよび／または１もしくは複数の他の技法の信頼度が、１１１０で依然として人間による検証の閾値を超えない場合、プロセス１１００の人間のレビューおよび再訓練部分は、繰り返され得る。

【0126】

長時間実行ワークフローがＡＩ／ＭＬモデルによって生成された例外に遭遇した場合、またはさもなくば１１４０で人間による検証を必要とする場合、長時間実行ワークフローの遂行は一時中断され、１または複数のＲＰＡロボットは１１４５で必要とされる検証に関する動的入力を待つ。動的入力が受信された後、長時間実行ワークフローの遂行は、１１５０で継続する。いくつかの実施形態では、長時間実行ワークフローの遂行の再開は、コンピューティングシステムの電源が切られた後、コンピューティングシステムがクラッシュした後、または処理リソースがＡＩ／ＭＬモデル訓練もしくは再訓練から離れて再割り当てされた後の保存状態およびロケーションに基づく。

【0127】

図１１で実行されるプロセスステップは、本発明の実施形態に従って、図１１で説明したプロセス（複数可）の少なくとも一部を実行するようにプロセッサ（複数可）への命令をエンコードするコンピュータプログラムによって実行されてもよい。コンピュータプログラムは、非一時的なコンピュータ読み取り可能な媒体に格納されていてもよい。コンピュータ読み取り可能な媒体は、ハードディスクドライブ、フラッシュデバイス、ＲＡＭ、テープ、および／またはデータを格納するために使用される他のそのような媒体または媒体の組み合わせであってもよいが、これらに限定されるものではない。コンピュータプログラムは、図１１に記載されたプロセスステップの全部または一部を実装するために、コンピューティングシステム（例えば、図５のコンピューティングシステム５００のプロセッサ（複数可）５１０）のプロセッサ（複数可）を制御するためのコード化された命令を含んでもよく、これはまた、コンピュータ読み取り可能な媒体に格納されてもよい。

【0128】

コンピュータプログラムは、ハードウェア、ソフトウェア、またはハイブリッド実装で実装され得る。コンピュータプログラムは、互いに動作可能な通信を行うモジュールで構成され得、情報または指示をディスプレイに送るように設計されている。コンピュータプログラムは、汎用コンピュータ、ＡＳＩＣ、またはいずれかの他の好適なデバイスで動作するように構成され得る。

【0129】

本発明の様々な実施形態のコンポーネントは、本明細書に一般的に記載され、図示されているように、様々な異なる構成で配置され、設計されてもよいことが、容易に理解されるであろう。したがって、添付の図に表されるような本発明の実施形態の詳細な説明は、特許請求されるような本発明の範囲を限定することを意図するものではなく、本発明の選択された実施形態を代表するものにすぎない。

【0130】

本明細書を通して記載された本発明の特色、構造、または特徴は、１または複数の実施形態では、いずれかの好適な方法で組み合わせられ得る。例えば、本明細書全体を通して「特定の実施形態」、「いくつかの実施形態」、または類似の言語を参照することは、実施形態に関連して記載された特定の特色、構造、または特徴が、本発明の少なくとも１つの実施形態に含まれていることを意味する。したがって、本明細書全体を通して「特定の実施形態では」、「いくつかの実施形態では」、「他の実施形態では」、または類似の言語の出現は、必ずしも全ての実施形態の同じグループを指すものではなく、記載された特色、構造、または特徴は、１または複数の実施形態ではいずれかの好適な方法で組み合わせられ得る。

【0131】

本明細書全体を通して特色、利点、または類似の言語への参照は、本発明で実現され得る特色および利点の全てが、本発明のいずれかの単一の実施形態にあるべきであること、または本発明のいずれかの実施形態であることを意味するものではないことに留意すべきである。むしろ、特色および利点に言及する言語は、実施形態に関連して記載された特定の特色、利点、または特徴が、本発明の少なくとも１つの実施形態に含まれることを意味すると理解される。したがって、本明細書全体での特色および利点の議論、ならびに類似の言語は、同じ実施形態を参照することができるが、必ずしもその必要性はない。

【0132】

さらに、本発明の記載された特色、利点、および特徴は、１または複数の実施形態では、いずれかの好適な方法で組み合わせることができる。関連する技術の当業者は、本発明が、１または複数の特定の実施形態の特定の特徴または利点なしに実施され得ることを認識するであろう。他の例では、追加の特徴および利点は、本発明の全ての実施形態には存在しないかもしれない特定の実施形態では認識され得る。

【0133】

本分野における通常の技術を有する者は、上述したような本発明を、異なる順序でのステップを用いて、および／または開示されているものとは異なる構成のハードウェア要素を用いて実施することができることを容易に理解するであろう。したがって、本発明は、これらの好ましい実施形態に基づいて説明されてきたが、本発明の精神および範囲内にとどまりながら、特定の変更、変形、および代替的な構成が明らかになることは、当業者には明らかであろう。したがって、本発明の範囲を決定するためには、添付の特許請求の範囲を参照すべきである。

【図1】