IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユーアイパス,インコーポレイテッドの特許一覧

特表2023-548737ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション
<>
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図1
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図2
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図3
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図4
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図5
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図6
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図7
  • 特表-ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-11-21
(54)【発明の名称】ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーション
(51)【国際特許分類】
   G06Q 10/06 20230101AFI20231114BHJP
   G06N 20/00 20190101ALI20231114BHJP
   G06F 3/048 20130101ALI20231114BHJP
【FI】
G06Q10/06
G06N20/00
G06F3/048
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023518990
(86)(22)【出願日】2021-10-05
(85)【翻訳文提出日】2023-05-15
(86)【国際出願番号】 US2021053497
(87)【国際公開番号】W WO2022081380
(87)【国際公開日】2022-04-21
(31)【優先権主張番号】17/070,206
(32)【優先日】2020-10-14
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ZIGBEE
2.BLUETOOTH
3.WCDMA
(71)【出願人】
【識別番号】520262319
【氏名又は名称】ユーアイパス,インコーポレイテッド
【氏名又は名称原語表記】UiPath,Inc.
【住所又は居所原語表記】1 Vanderbilt Avenue, 60th Floor, New York, NY 10017, United States of America
(74)【代理人】
【識別番号】110003487
【氏名又は名称】弁理士法人東海特許事務所
(72)【発明者】
【氏名】シング,プラブディープ
【テーマコード(参考)】
5E555
5L049
【Fターム(参考)】
5E555AA09
5E555BA02
5E555BA03
5E555BA05
5E555BA06
5E555BA38
5E555BB02
5E555BB03
5E555BB05
5E555BB06
5E555BB38
5E555BC01
5E555BC10
5E555BD01
5E555CA02
5E555CA15
5E555CA18
5E555CB02
5E555CB12
5E555CB76
5E555CC01
5E555CC03
5E555DB03
5E555DB41
5E555DC14
5E555DD08
5E555EA19
5E555EA27
5E555FA00
5L049AA06
(57)【要約】
ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーションを開示する。RPAロボットは、2人以上のユーザーのコンピューティングシステム上および/または遠隔地に配置され得る。RPAロボットは、コンピュータビジョン(CV)を使用するように訓練された人工知能(AI)/機械学習(ML)モデルを使用して、それぞれのユーザーがコンピューティングシステムで実行しているタスクを認識し得る。そして、RPAロボットは、電子メールまたは他のアプリケーションを介した要求の受信、特定のタスクが完了したことの決定、ある期間が経過したことの指摘など、特定のアクションに応答して、それぞれのユーザーが定期的に特定のタスクを実行していると決定し、それぞれのタスクを自動化し得る。

【特許請求の範囲】
【請求項1】
サーバーと、
第1のリスナーロボティックプロセスオートメーション(RPA)ロボットを含む第1のユーザーコンピューティングシステムであって、前記第1のリスナーRPAロボットは、前記第1のコンピューティングシステムとの前記第1のユーザーのインタラクションを監視し、かつ前記第1のユーザーの前記インタラクションに関するデータを前記サーバーに提供するように構成される、第1のユーザーコンピューティングシステムと、
第2のリスナーRPAロボットを含む第2のユーザーコンピューティングシステムであって、前記第2のリスナーRPAロボットは、前記第2のコンピューティングシステムとの前記第2のユーザーのインタラクションを監視し、かつ前記第2のユーザーの前記インタラクションに関するデータを前記サーバーに提供するように構成される、第2のユーザーコンピューティングシステムと、を備え、
前記サーバーは、
人工知能(AI)/機械学習(ML)モデルを使用して、前記第1のユーザーおよび前記第2のユーザーの前記インタラクションに関する前記データに基づいて、前記第1のユーザーが開始タスクを実行し、前記第2のユーザーが応答タスクを実行することを決定し、
前記第1のコンピューティングシステム上で前記開始タスクを自動化し、前記第2のコンピューティングシステム上で前記応答タスクを自動化するそれぞれの自動化を生成し、展開するように構成される、システム。
【請求項2】
前記第1のコンピューティングシステム上の前記第1のユーザーの前記開始タスクの前記自動化、前記第2のコンピューティングシステム上の前記第2のユーザーの前記応答タスクの前記自動化、またはその両方は、
前記サーバーによって、それぞれの前記タスクに関連するユーザーインタラクションを実装するアクティビティを含む、それぞれのRPAワークフローを生成し、
前記サーバーによって、それぞれの前記RPAワークフローを実装するそれぞれのRPAロボットを生成し、
前記サーバーによって、生成された前記RPAロボットをそれぞれの前記ユーザーコンピューティングシステムに展開することを含む、請求項1に記載のシステム。
【請求項3】
前記第1のコンピューティングシステム上で前記開始タスクを自動化し、前記第2のコンピューティングシステム上で前記応答タスクを自動化するそれぞれの前記自動化を生成および展開する前に、それぞれの前記コンピューティングシステムは、それぞれの前記自動化をそれぞれの前記ユーザーに提案するように構成される、請求項1に記載のシステム。
【請求項4】
それぞれの前記ユーザーがそれぞれの前記自動化を承認すると、それぞれの前記自動化は、それぞれの前記自動化を実行する前に、それぞれの前記自動化によって実行されるタスクがそれぞれの前記ユーザーに提案される訓練段階に入る、請求項3に記載のシステム。
【請求項5】
それぞれの前記自動化によって提案されたコンテンツが不正確である場合、それぞれの前記ユーザーコンピューティングシステムは、
前記コンテンツの1または複数のマークされた不正確な部分、および正しいコンテンツの1または複数の指示を受信し、
前記コンテンツの受信した前記1または複数のマークされた不正確な部分と、前記正しいコンテンツの前記1または複数の指示を含むデータを前記サーバーに送信し、
前記サーバーにより、前記AI/MLモデルを再訓練するように構成される、請求項3に記載のシステム。
【請求項6】
それぞれの前記ユーザーによる修正なしで一定期間が経過した後、前記AI/MLモデルが一定の信頼を得るか、またはその両方であり、展開されたそれぞれの前記自動化が、それぞれの前記ユーザーからの入力なしにそれぞれの前記タスクを実行するように構成される、請求項5に記載のシステム。
【請求項7】
前記サーバーは、サーバー側RPAロボットを介して前記AI/MLモデルを使用する、請求項1に記載のシステム。
【請求項8】
前記サーバー側RPAロボットは、前記第1のコンピューティングシステムと前記第2のコンピューティングシステムとの間の通信を監視するように構成される、請求項7に記載のシステム。
【請求項9】
前記サーバー側RPAロボットは、前記第2のユーザーコンピューティングシステムが前記応答タスクの一部として第3のコンピューティングシステムと通信し、前記第3のコンピューティングシステムからの情報を使用して前記応答タスクを実行することを決定するように構成される、請求項8に記載のシステム。
【請求項10】
前記第2のユーザーの前記インタラクションに関する前記データは、前記サーバーが前記第1のコンピューティングシステムと共有しない、前記第1のユーザーの前記インタラクションに関する前記データは、前記サーバーが前記第2のコンピューティングシステムと共有しない、またはその両方である、請求項1に記載のシステム。
【請求項11】
前記第1のコンピューティングシステム上の前記開始タスクおよび前記第2のコンピューティングシステム上の前記応答タスクを自動化するそれぞれの前記自動化は、前記第1のコンピューティングシステムおよび前記第2のコンピューティングシステムのそれぞれの前記ユーザーに通知することなく展開される、請求項1に記載のシステム。
【請求項12】
監視ロボティックプロセスオートメーション(RPA)ロボットによって、複数のユーザーコンピューティングシステムのユーザーのインタラクションおよび前記複数のユーザーコンピューティングシステムの少なくともサブセット間の通信を含むデータを分析するように構成された人工知能(AI)/機械学習(ML)モデルを呼び出すことと、
前記監視RPAロボットによって、前記AI/MLモデルによる分析に基づいて、開始タスクが前記複数のユーザーコンピューティングシステムの1または複数のコンピューティングシステムによって実行されるとき、1または複数の応答タスクが前記複数のユーザーコンピューティングシステムの1または複数の他のユーザーコンピューティングシステムによって実行されると決定することと、
前記監視RPAロボットによって、前記開始タスクおよび前記1または複数の応答タスクを実装するそれぞれのRPAロボットを生成し、それぞれの前記ユーザーコンピューティングシステムに展開することと、を含む、コンピュータ実装方法。
【請求項13】
前記開始タスクおよび前記1または複数の応答タスクを実施する前記それぞれのRPAロボットの生成は、
前記監視RPAロボットによって、それぞれの前記タスクに関連するユーザーインタラクションを実装するアクティビティを含むそれぞれのRPAワークフローを生成することを含む、請求項12に記載のコンピュータ実装方法。
【請求項14】
前記開始タスクおよび前記1または複数の応答タスクを自動化するそれぞれの前記自動化を生成および展開する前に、前記監視RPAロボットは、それぞれの前記コンピューティングシステムのそれぞれのユーザーによる承認を必要とするように構成される、請求項12に記載のコンピュータ実装方法。
【請求項15】
それぞれの前記ユーザーがそれぞれの前記自動化を承認すると、それぞれの前記自動化を実行する前に、それぞれの前記自動化によって実行されるタスクがそれぞれの前記ユーザーに提案される訓練段階において、それぞれの前記自動化が前記監視RPAロボットによって展開される、請求項14に記載のコンピュータ実装方法。
【請求項16】
それぞれの前記自動化によって提案されたコンテンツが不正確である場合、前記方法はさらに、
前記監視RPAロボットによって、前記AI/MLモデルを再訓練するまたは前記AI/MLモデルを再訓練させるために、前記複数のユーザーコンピューティングシステムの1または複数からの、コンテンツのマークされた不正確な部分および正しいコンテンツの指示を含むデータを使用することを含む、請求項15に記載のコンピュータ実装方法。
【請求項17】
修正を受信せずに時間が経過した後、前記AI/MLモデルが一定の信頼度を得た後、またはその両方において、展開されたそれぞれの前記自動化が、それぞれの前記ユーザーからの入力なしにそれぞれの前記タスクを実行するように構成される、請求項16に記載のコンピュータ実装方法。
【請求項18】
ユーザーインタラクションに関する前記データは、前記監視RPAロボットによって、前記複数のユーザーコンピューティングシステムと共有されない、請求項12に記載のコンピュータ実装方法。
【請求項19】
コンピュータプログラムを格納した非一時的なコンピュータ読み取り可能な媒体であって、前記コンピュータプログラムは、少なくとも1つのプロセッサが、
複数のユーザーコンピューティングシステムのユーザーのインタラクションおよび前記複数のユーザーコンピューティングシステムの少なくともサブセット間の通信を含むデータを分析するように構成された人工知能(AI)/機械学習(ML)モデルを呼び出す監視ロボティックプロセスオートメーション(RPA)ロボットを遂行し、
前記監視RPAロボットによって、前記AI/MLモデルによる分析に基づいて、開始タスクが前記複数のユーザーコンピューティングシステムの1または複数のコンピューティングシステムによって実行されるとき、1または複数の応答タスクが前記複数のユーザーコンピューティングシステムの1または複数の他のユーザーコンピューティングシステムによって実行されると決定し、
前記開始タスク、前記1または複数の応答タスク、またはその両方を実装するそれぞれのRPAワークフローを生成するように構成され、
前記それぞれのRPAワークフローは、それぞれの前記タスクに関連するユーザーインタラクションを実装するアクティビティを含む、非一時的なコンピュータ読み取り可能な媒体。
【請求項20】
コンピュータプログラムは、ユーザーインタラクションに関する前記データを、前記複数のユーザーコンピューティングシステムと共有しないように構成される、請求項19に記載の非一時的なコンピュータ読み取り可能な媒体。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願への相互参照)
これは、2020年10月14日に出願された米国特許出願第17/070,206号の利益およびその優先権を主張する国際出願である。先に提出された本出願の主題は、その全体を参照することにより、本明細書に組み込まれる。
【0002】
本発明は概して、ユーザーインターフェース(UI)オートメーションに関し、より具体的には、ロボティックプロセスオートメーション(RPA)のためのサポートロボットによるタスクオートメーションに関する。
【背景技術】
【0003】
職場ではさまざまなコミュニケーションおよび承認が一般的である。例えば、従業員がある行動を起こす前に上司の承認が必要となり得たり、ステータスレポートが定期的および/または特定のタスクの完了後に送信され得たり、特定の内容を含む電子メールが定期的に送信され得たり、などである。このような通信は、従業員の生産性を低下させおよび/または特定の行動を遅らせ得る。したがって、改良されたアプローチが有益であり得る。
【発明の概要】
【0004】
本発明の特定の実施形態は、現在のUIオートメーション技術によってまだ十分に特定されていない、評価されていない、または解決されていない本分野における問題およびニーズのソリューションを提供し得る。例えば、本発明のいくつかの実施形態は、RPAのためのサポートロボットによるタスクオートメーションに関する。
【0005】
実施形態では、システムは、サーバーおよび第1のリスナーRPAロボットを含む第1のユーザーコンピューティングシステムを含む。第1のリスナーRPAロボットは、第1のユーザーの第1のコンピューティングシステムとのインタラクションを監視し、第1のユーザーのインタラクションに関するデータをサーバーに提供するように構成される。システムはまた、第2のリスナーRPAロボットを含む第2のユーザーコンピューティングシステムを含む。第2のリスナーRPAロボットは、第2のユーザーの第2のコンピューティングシステムとのインタラクションを監視し、第2のユーザーのインタラクションに関するデータをサーバーに提供するように構成される。サーバーは、AI/MLモデルを使用して、第1のユーザーおよび第2のユーザーのインタラクションに関するデータに基づいて、第1のユーザーが開始タスクを実行し、第2のユーザーが応答タスクを実行することを決定するように構成される。サーバーはまた、第1のコンピューティングシステム上で開始タスクを自動化し、第2のコンピューティングシステム上で応答タスクを自動化するそれぞれの自動化を生成し、展開するように構成される。
【0006】
別の実施形態では、コンピュータ実装方法は、監視RPAロボットによって、複数のユーザーコンピューティングシステムのユーザーのインタラクションおよび複数のユーザーコンピューティングシステムの少なくともサブセット間の通信を含むデータを分析するように構成されたAI/MLモデルを呼び出すことを含む。コンピュータ実装方法はまた、監視RPAロボットによって、AI/MLモデルによる分析に基づいて、開始タスクが複数のユーザーコンピューティングシステムの1または複数のコンピューティングシステムによって実行されるとき、1または複数の応答タスクが複数のユーザーコンピューティングシステムの1または複数の他のユーザーコンピューティングシステムによって実行されると決定することを含む。コンピュータ実装方法は、監視RPAロボットによって、開始タスクおよび1または複数の応答タスクを実装するそれぞれのRPAロボットを生成し、それぞれのユーザーコンピューティングシステムに展開することをさらに含む。
【0007】
さらに別の実施形態では、非一時的なコンピュータ読み取り可能な媒体は、コンピュータプログラムを格納する。コンピュータプログラムは、少なくとも1つのプロセッサが、複数のユーザーコンピューティングシステムのユーザーのインタラクションおよび複数のユーザーコンピューティングシステムの少なくともサブセット間の通信を含むデータを分析するように構成されたAI/MLモデルを呼び出す監視用RPAロボットを遂行ように構成される。コンピュータプログラムはまた、少なくとも1つのプロセッサが、監視RPAロボットによって、AI/MLモデルによる分析に基づいて、開始タスクが複数のユーザーコンピューティングシステムの1または複数のコンピューティングシステムによって実行されるとき、1または複数の応答タスクが複数のユーザーコンピューティングシステムの1または複数の他のユーザーコンピューティングシステムによって実行されると決定するように構成される。コンピュータプログラムは、少なくとも1つのプロセッサが、開始タスク、1もしくは複数の応答タスク、またはその両方を実装するそれぞれのRPAワークフローを生成するようにさらに構成される。それぞれのRPAワークフローは、それぞれのタスクに関連するユーザーインタラクションを実装するアクティビティを含む。
【図面の簡単な説明】
【0008】
本発明の特定の実施形態の利点が容易に理解されるように、上記で簡単に説明した本発明のより特定の説明は、添付の図面に図示されている特定の実施形態を参照して描写される。これらの図面は、本発明の典型的な実施形態のみを描いており、したがって、その範囲を限定するものとは考えられないことが理解されるべきであるが、本発明は、以下の添付の図面を使用することにより、さらなる特定および詳細をもって描写され、説明されるであろう。
【0009】
図1】本発明の実施形態による、ロボティックプロセスオートメーション(RPA)システムを示すアーキテクチャ図である。
【0010】
図2】本発明の実施形態による、展開したRPAシステムを示すアーキテクチャ図である。
【0011】
図3】本発明の実施形態による、デザイナ、アクティビティ、およびドライバの間の関係を示すアーキテクチャ図である。
【0012】
図4】本発明の実施形態による、RPAシステムを示すアーキテクチャ図である。
【0013】
図5】本発明の実施形態による、RPAのための支援ロボットによるタスクオートメーションを実行するように構成されたコンピューティングシステムを示すアーキテクチャ図である。
【0014】
図6】本発明の実施形態による、RPAのための支援ロボットによるタスクオートメーションを実行するように構成されたシステムを示すアーキテクチャ図である。
【0015】
図7】本発明の実施形態による、コンピューティングシステム間の通信を監視し、RPAロボットによるタスクオートメーションを実行するように構成されたシステムを示すアーキテクチャ図である。
【0016】
図8】本発明の実施形態による、RPAのためのサポートロボットによるタスクオートメーションを実行するためのプロセスを示すフローチャートである。
【発明を実施するための形態】
【0017】
別段の記載がない限り、類似の参照文字は、添付の図面全体で一貫して対応する特徴を示す。
【0018】
(実施形態の詳細な説明)
いくつかの実施形態は、RPAのためのサポートロボットによるタスクオートメーションに関する。RPAサポートロボットは、2人以上のユーザーのコンピューティングシステム上および/または遠隔地(例えば、サーバー上)に配置され得る。例えば、RPAロボットがマネージャーのコンピューティングシステムに配置され、別のRPAロボットがそのマネージャーに報告する従業員のコンピューティングシステム上に配置され得る。RPAロボットは、コンピュータビジョン(CV)を使用するように訓練された人工知能(AI)/機械学習(ML)モデルを使用して、ユーザーがコンピューティングシステムで実行しているタスクを認識し得る。そして、RPAロボットは、電子メールまたは他のアプリケーションを介した要求の受信、特定のタスクが完了したことの決定、ある期間が経過したことの指摘など、特定のアクションに応答して、ユーザーが定期的に特定のタスクを実行していると決定し得る。
【0019】
タスクが認識された後、RPAロボットはユーザーに自動化を提案することができるまたは自動化が自動的に実装され得る。例えば、RPAロボットは、ユーザーが特定の内容を含む一定額超の請求書を受け取った後、ユーザーが彼または彼女のマネージャーに承認要求を送信することにRPAロボットが気付いたことをユーザーを知らせるポップアップウィンドウを表示させ得る。ユーザーがこの自動化が有益であることに同意した場合、ロボットは、ユーザーの承認要求メールに表示されがちなコンテンツを含むメールを送信するなど、提案されたアクションをユーザーに提案し得る。その後、ロボットは、送信すべきコンテンツが最初にユーザーに提案される訓練段階に入り得る。コンテンツが正しくない場合、ユーザーは、コンテンツの正しくない部分と正しいコンテンツの指示をマークし得る。AI/MLモデルは、修正が提供されたとき、特定の数の修正が提供された後、特定の期間が経過した後などに、再訓練されるか、または代替のAI/MLモデルが訓練され得る。一定の信頼が得られると、RPAロボットはユーザーのインタラクションなしで自動的にアクションを実行し得る。
【0020】
いくつかの実施形態では、RPAロボットは、2つのコンピューティングシステム間の通信を監視し得る。例えば、RPAロボットは、メールサーバーシステムに位置し得、2人の従業員の間で往復して送信される電子メールを分析し得る。これは、ユーザー画面の分析および電子メールが送信または受信されたときに各コンピューティングシステムで発生していたものなど、ユーザーコンピューティングシステムからの補足的なコンテンツの有無にかかわらず発生し得る。サーバー側のRPAロボットは、ユーザーコンピューティングシステム上のいずれのRPAロボットにも単独では利用できないコンテキストを決定し得、プロセスをより効率的にするために各ロボットへのアクションを提案し得る。例えば、サーバー側のRPAロボットは、特定のコンテンツがマネージャーによって日常的に要求されていることに気付き、電子メールを傍受し、そして送信者システムのRPAロボットに、情報が不足しているので供給する必要があることを通知し得る。
【0021】
いくつかの実施形態では、RPAロボットまたは他のリスナー/レコーダープロセスは、それぞれのコンピューティングシステムとのユーザーインタラクションを監視し得る。リスナー/レコーダープロセスは、繰り返し行われるユーザーアクションおよびコンテンツを決定し得る。いくつかの実施形態では、ユーザーアクションの理由も決定され得る。次に、レコーダー/リスナープロセスは、ユーザーに自動化を提案するかまたは自動化を自動的に作成する(例えば、アクションに関連するアクティビティを有するRPAワークフローを作成し、ワークフローを実装するRPAロボットを生成し、そしてRPAロボットをユーザーのコンピューティングシステムに展開することによってことができる)。
【0022】
いくつかの実施形態では、レコーダー/リスナープロセスがユーザーのアクションを自動化する前にユーザーに確認し、AI/MLモデルをさらに訓練するためにラベル付き訓練データを受信する訓練段階があり得る。あるいは、自動的に生成されたRPAロボットは、最初にユーザーのサブセットにロールアウトされ、潜在的にこの段階中にAI/MLモデルをさらに訓練し得る。その後、自動化が成功/有益であれば、RPAロボットをより広範なユーザーコンピューティングシステムのグループにロールアウトされ得る。
【0023】
AI/MLモデルが、最初は決まった時間に電気をつけることを学習するケースを考えてみる。しかし、日が長くなったりまたは短くなったりするにつれて、照明の点灯が早すぎたりまたは遅すぎたりすることがあり得、ユーザーは手動で照明を点灯または消灯してエラーを修正し得る。AI/MLモデルは、アクションが修正されることを学習し、他の利用可能な情報を検索して理由を見つけようとし得る。例えば、AI/MLモデルは、日の出/日の入り表を有するウェブサイトからの情報に基づいて、ユーザーが照明のオン/オフを望む時間が、その所定の日付のその場所における夕暮れおよび夜明けにそれぞれ概ね対応すると決定し得る。
【0024】
いくつかの実施形態では、以前に成功したAI/MLモデルについて、そのようなデータおよび/またはモデルのドリフトが発生していると決定され得る。RPAロボットまたは他のプロセスは、その後、AI/MLモデルを訓練段階に戻し、モデルを再訓練し得る。再び正確になると、完全自動化が再び可能になり得る。
【0025】
いくつかの実施形態では、RPAロボットは、エンドユーザーコンピューティングシステムに展開されたRPAロボットに加えてまたはその代わりに、サーバー側に展開され得る。サーバー側のRPAロボットは、電子メールが第1のユーザーから第2のユーザーに送信されたときに、別の関連電子メールが第2のユーザーから第3のユーザーにも送信されたことに気付くなど、複数のコンピューティングシステム間の通信を見ることができる。これにより、エンドユーザーコンピューティングシステムに展開されたロボットだけでは提供できない、より多くのコンテキストを提供し得る。
【0026】
特定の実施形態は、ロボティックプロセスオートメーション(RPA)に採用されてもよい。図1は、本発明の実施形態による、RPAシステム100を示すアーキテクチャ図である。RPAシステム100は、開発者がワークフローを設計して実装することを可能にするデザイナ110を含む。デザイナ110は、アプリケーション統合のためのソリューションを提供するとともに、サードパーティアプリケーション、管理情報技術(IT)タスク、およびビジネスITプロセスを自動化する。デザイナ110は、ビジネスプロセスのグラフィック表現である自動化プロジェクトの開発を容易にし得る。簡単に言えば、デザイナ110は、ワークフローおよびロボットの開発および展開を容易にする。
【0027】
自動化プロジェクトは、本明細書で「アクティビティ」と定義されるワークフローで開発されたステップのカスタムセット間の遂行順序および関係の制御を開発者に与えることにより、ルールベースのプロセスの自動化を可能にする。デザイナ110の実施形態の商業的な一例は、UiPath Studio(商標)である。各アクティビティは、ボタンをクリックする、ファイルを読む、ログパネルに書き込むなどのアクションを含み得る。いくつかの実施形態では、ワークフローは入れ子になっているか、または埋め込まれ得る。
【0028】
ワークフローのタイプには、シーケンス、フローチャート、FSM、および/またはグローバル例外ハンドラなどを含み得るが、これらに限定されない。シーケンスは、ワークフローを乱雑にすることなく、あるアクティビティから別のアクティビティへのフローを可能にする、線形プロセスに特に適し得る。フローチャートは、特により複雑なビジネスロジックに適し得、複数の分岐ロジックオペレータを介して、より多様な方法で意思決定の統合およびアクティビティの接続を可能にする。FSMは、大規模なワークフローに特に適し得る。FSMは、条件(すなわち、遷移)またはアクティビティによりトリガされる有限の数の状態をそれらの遂行中に使用し得る。グローバル例外ハンドラは、遂行エラーに遭遇したときのワークフローの挙動を決定したり、プロセスをデバッグしたりするのに特に適し得る。
【0029】
ワークフローがデザイナ110内で開発されると、ビジネスプロセスの遂行は、コンダクタ120によって調整され、デザイナ110内で開発されたワークフローを遂行する1または複数のロボット130を調整する。コンダクタ120の実施形態の商業的な一例は、UiPath Orchestrator(商標)である。コンダクタ120は、環境におけるリソースの生成、監視、および展開の管理を容易にする。コンダクタ120は、サードパーティのソリューションおよびアプリケーションとの統合ポイント、または統合ポイントの1つとして動作し得る。
【0030】
コンダクタ120は、全てのロボット130を管理し得、ロボット130を集中ポイントから接続して遂行する。管理され得るロボット130のタイプには、アテンディッドロボット132、アンアテンディッドロボット134、開発ロボット(アンアテンディッドロボット134と同様であるが、開発およびテストの目的で使用される)、および非生産ロボット(アテンディッドロボット132と同様であるが、開発およびテストの目的で使用される)が含まれるが、これらに限定されない。アテンディッドロボット132は、ユーザーイベントによってトリガされ、同じコンピューティングシステム上で人と並んで動作する。アテンディッドロボット132は、集中プロセスデプロイメントおよびロギング媒体のためのコンダクタ120とともに使用され得る。アテンディッドロボット132は、人のユーザーが様々なタスクを達成するのを支援してもよく、ユーザーイベントによってトリガされてもよい。いくつかの実施形態では、プロセスは、このタイプのロボット上でコンダクタ120から開始することができず、および/またはそれらはロックされた画面の下で実行することができない。特定の実施形態では、アテンディッドロボット132は、ロボットトレイからまたはコマンドプロンプトからのみ起動され得る。アテンディッドロボット132は、いくつかの実施形態では、人の監督下で動作することが好ましい。
【0031】
アンアテンディッドロボット134は、仮想環境で無人で動作し、多くのプロセスを自動化し得る。アンアテンディッドロボット134は、リモート遂行、監視、スケジューリング、および作業キューのサポートの提供を担当し得る。全てのロボットタイプのためのデバッグは、いくつかの実施形態では、デザイナ110で実行され得る。アテンディッドロボットおよびアンアテンディッドロボットの両方は、メインフレーム、ウェブアプリケーション、VM、エンタープライズアプリケーション(例えば、SAP(登録商標)、SalesForce(登録商標)、Oracle(登録商標)などにより生成されたもの)、およびコンピューティングシステムアプリケーション(例えば、デスクトップおよびラップトップアプリケーション、モバイルデバイスアプリケーション、ウェアラブルコンピュータアプリケーションなど)を含むが、これらに限定されない様々なシステムおよびアプリケーションを自動化し得る。
【0032】
コンダクタ120は、プロビジョニング、展開、バージョニング、構成、キューイング、監視、ロギング、および/または相互接続性の提供を含むがこれらに限定されない様々な能力を有し得る。プロビジョニングは、ロボット130とコンダクタ120(例えば、ウェブアプリケーション)との間の接続を作成し、維持することを含み得る。展開は、遂行のために割り当てられたロボット130へのパッケージバージョンの正しい配信を保証することを含み得る。バージョニングは、いくつかの実施形態では、いくつかのプロセスまたは構成の固有のインスタンスの管理を含んでもよい。構成は、ロボット環境およびプロセス構成の維持および配信を含み得る。キューイングは、キューおよびキュー項目の管理を提供することを含み得る。監視は、ロボットの特定データを追跡し、ユーザーの権限を維持することを含み得る。ロギングは、データベース(例えば、SQLデータベース)および/または別のストレージメカニズム(例えば、大規模なデータセットを格納し、迅速にクエリを実行する能力を提供するElasticSearch(登録商標))へのログの保存およびインデックス作成を含み得る。コンダクタ120は、サードパーティのソリューションおよび/またはアプリケーションのための通信の集中点として操作することにより、相互接続性を提供し得る。
【0033】
ロボット130は、デザイナ110で構築されたワークフローを実行する遂行エージェントである。ロボット(複数可)130のいくつかの実施形態の1つの商業的な例は、UiPath Robots(商標)である。いくつかの実施形態では、ロボット130は、デフォルトで、Microsoft Windows(登録商標)Service Control Manager(SCM)管理サービスをインストールする。その結果、このようなロボット130は、ローカルシステムアカウントの下でインタラクティブなWindows(登録商標)セッションを開くことができ、Windows(登録商標)サービスの権利を有し得る。
【0034】
いくつかの実施形態では、ロボット130は、ユーザーモードで設置され得る。このようなロボット130については、所定のロボット130が設置されているユーザーと同じ権利を有することを意味する。この特色はまた、各マシンを最大限に全活用することを保証する高密度(HD)ロボットにも利用可能であり得る。いくつかの実施形態では、いずれかのタイプのロボット130は、HD環境で構成され得る。
【0035】
いくつかの実施形態におけるロボット130は、複数のコンポーネントに分割され、それぞれが特定の自動化タスクに特化されている。いくつかの実施形態におけるロボットコンポーネントは、SCM管理ロボットサービス、ユーザーモードロボットサービス、エグゼキュータ、エージェント、およびコマンドラインを含むが、これらに限定されない。SCM管理ロボットサービスは、Windows(登録商標)セッションを管理および監視し、コンダクタ120と遂行ホスト(すなわち、ロボット130が遂行されるコンピューティングシステム)との間のプロキシとして動作する。これらのサービスは、ロボット130の資格情報を任されて管理する。コンソールアプリケーションは、ローカルシステム下のSCMにより起動される。
【0036】
いくつかの実施形態におけるユーザーモードロボットサービスは、Windows(登録商標)セッションを管理および監視し、コンダクタ120と遂行ホストとの間のプロキシとして動作する。ユーザーモードロボットサービスは、ロボット130の資格情報を任されて管理し得る。SCM管理ロボットサービスがインストールされていない場合、Windows(登録商標)アプリケーションが自動的に起動され得る。
【0037】
エグゼキュータは、Windows(登録商標)セッションの下で与えられたジョブを遂行し得る(つまり、ワークフローを遂行し得る。エグゼキュータは、モニタ毎のドットパーインチ(DPI)設定を認識し得る。エージェントは、システムトレイウィンドウに利用可能なジョブを表示するWindows(登録商標) Presentation Foundation(WPF)アプリケーションであり得る。エージェントはサービスのクライアントであり得る。エージェントは、ジョブの開始または停止、設定の変更を依頼し得る。コマンドラインはサービスのクライアントである。コマンドラインは、ジョブの開始を要求し、その出力を待つことができるコンソールアプリケーションである。
【0038】
上で説明したように、ロボット130のコンポーネントが分割されていることは、開発者、サポートユーザー、およびコンピューティングシステムが、各コンポーネントが遂行していることをより容易に実行し、特定し、および追跡するのに役立つ。この方法では、エグゼキュータとサービスに異なるファイアウォールルールを設定するなど、コンポーネントごとに特別な挙動を構成し得る。エグゼキュータは常に、いくつかの実施形態では、モニタごとのDPI設定を認識し得る。その結果、ワークフローは、ワークフローが作成されたコンピューティングシステムの構成に関係なく、いずれかのDPIで遂行し得る。また、いくつかの実施形態では、デザイナ110からのプロジェクトは、ブラウザのズームレベルに依存しないようにし得る。DPIを認識していないまたは意図的に認識していないとマークされているアプリケーションの場合、いくつかの実施形態ではDPIを無効にし得る。
【0039】
図2は、本発明の実施形態による、展開したRPAシステム200を示すアーキテクチャ図である。いくつかの実施形態では、RPAシステム200は、図1のRPAシステム100であってもよく、またはその一部であってもよい。クライアント側、サーバー側、またはその両方が、本発明の範囲から逸脱することなく、いずれかの所望の数のコンピューティングシステムを含むことができることに留意すべきである。クライアント側では、ロボットアプリケーション210は、エグゼキュータ212、エージェント214、およびデザイナ216を含む。しかし、いくつかの実施形態では、デザイナ216は、コンピューティングシステム210上で実行されていなくてもよい。エグゼキュータ212はプロセスを実行している。図2に示すように、複数のビジネスプロジェクトが同時に実行され得る。エージェント214(例えば、Windows(登録商標)サービス)は、本実施形態では、全てのエグゼキュータ212のための単一の接続ポイントである。この実施形態における全てのメッセージは、コンダクタ230に記録され、それは、データベースサーバー240、インデクササーバー250、またはその両方を介して、それらをさらに処理する。図1に関して上述したように、エグゼキュータ212は、ロボットコンポーネントであり得る。
【0040】
いくつかの実施形態では、ロボットは、マシン名とユーザー名との間の関連付けを表す。ロボットは、複数のエグゼキュータを同時に管理し得る。同時に実行される複数のインタラクティブセッションをサポートするコンピューティングシステム(Windows(登録商標)Server 2012など)では、複数のロボットが同時に実行され得、それぞれが一意のユーザー名を使用して別々のWindows(登録商標)セッションで実行され得る。これは、上記のHDロボットと呼ばれる。
【0041】
エージェント214はまた、ロボットの状態を送信し(例えば、ロボットがまだ機能していることを示す「ハートビート」メッセージを定期的に送信する)、遂行されるパッケージの要求されるバージョンをダウンロードすることにも責任を負う。エージェント214とコンダクタ230との間の通信は、いくつかの実施形態では、常にエージェント214によって開始される。通知シナリオでは、エージェント214は、後にコンダクタ230によってロボットにコマンド(例えば、開始、停止など)を送信するために使用されるWebSocketチャネルを開いてもよい。
【0042】
サーバー側には、プレゼンテーション層(ウェブアプリケーション232、オープンデータプロトコル(OData)代表状態転送(REST)アプリケーションプログラミングインターフェース(API)エンドポイント234、通知および監視236)、サービス層(API実装/ビジネスロジック238)、永続層(データベースサーバー240、インデクササーバー250)が含まれる。コンダクタ230は、ウェブアプリケーション232、OData REST APIエンドポイント234、通知および監視236、ならびにAPI実装/ビジネスロジック238を含む。いくつかの実施形態では、ユーザーがコンダクタ230のインターフェース(例えば、ブラウザ220を介して)で実行するほとんどのアクションは、様々なAPIを呼び出すことによって実行される。このような動作は、本発明の範囲を逸脱することなく、ロボット上でのジョブの起動、キュー内のデータの追加/削除、無人で実行するジョブのスケジューリングなどを含み得るが、これらに限定されない。ウェブアプリケーション232は、サーバープラットフォームのビジュアル層である。この実施形態では、ウェブアプリケーション232は、ハイパーテキストマークアップ言語(HTML)およびジャバスクリプト(JS)を使用する。しかし、本発明の範囲を逸脱することなく、いずれかの所望のマークアップ言語、スクリプト言語、または他のいずれかのフォーマットを使用し得る。ユーザーは、コンダクタ230を制御するための様々な動作を実行するために、本実施形態ではブラウザ220を介してウェブアプリケーション232からのウェブページとインタラクションする。例えば、ユーザーは、ロボットグループを作成し、ロボットへのパッケージの割り当てを行い、ロボット毎および/またはプロセス毎のログを解析し、ロボットを起動および停止などし得る。
【0043】
ウェブアプリケーション232に加えて、コンダクタ230は、OData REST APIエンドポイント234を公開するサービス層も含む。しかし、本発明の範囲を逸脱することなく、他のエンドポイントが含まれていてもよい。REST APIは、ウェブアプリケーション232とエージェント214の両方により消費される。エージェント214は、本実施形態では、クライアントコンピュータ上の1または複数のロボットのスーパーバイザである。
【0044】
本実施形態のREST APIは、構成、ロギング、監視、およびキューイング機能をカバーする。構成エンドポイントは、いくつかの実施形態では、アプリケーションのユーザー、権限、ロボット、アセット、リリース、および環境を定義し、構成するために使用されてもよい。ロギングRESTエンドポイントは、例えば、エラー、ロボットによって送信された明示的なメッセージ、およびその他の環境固有の情報など、様々な情報をログに記録するために使用され得る。デプロイメントRESTエンドポイントは、コンダクタ230においてジョブ開始コマンドが使用された場合に遂行されるべきパッケージのバージョンを問い合わせるためにロボットにより使用されてもよい。キューイングRESTエンドポイントは、キューへのデータの追加、キューからのトランザクションの取得、トランザクションのステータスの設定など、キューおよびキューアイテムの管理を担ってもよい。
【0045】
RESTエンドポイントの監視は、ウェブアプリケーション232およびエージェント214を監視してもよい。通知および監視API236は、エージェント214の登録、エージェント214への構成設定の配信、ならびにサーバーおよびエージェント214からの通知の送受信に使用されるRESTエンドポイントであってもよい。通知および監視API236は、いくつかの実施形態では、WebSocket通信を使用してもよい。
【0046】
永続層は、本実施形態では、一対のサーバー-データベースサーバー240(例えば、SQLサーバー)およびインデクササーバー250を含む。本実施形態におけるデータベースサーバー240は、ロボット、ロボットグループ、関連するプロセス、ユーザー、役割、スケジュールなどの構成を格納する。この情報は、いくつかの実施形態では、ウェブアプリケーション232を介して管理される。データベースサーバー240は、キューおよびキューアイテムを管理してもよい。いくつかの実施形態では、データベースサーバー240は、ロボットにより記録されたメッセージを(インデクササーバー250に加えて、またはそれに代えて)格納してもよい。
【0047】
いくつかの実施形態では任意であるが、インデクササーバー250は、ロボットにより記録された情報を保存し、インデックスを作成する。特定の実施形態では、インデクササーバー250は、構成設定を介して無効化されてもよい。いくつかの実施形態では、インデクササーバー250は、オープンソースプロジェクトの全文検索エンジンであるElasticSearch(登録商標)を使用する。ロボットにより記録されたメッセージ(例えば、ログメッセージまたはライン書き込みのようなアクティビティを使用して)は、ロギングRESTエンドポイント(複数可)を介してインデクササーバー250に送信されてもよく、そこで将来の利用のためにそれらはインデックス化される。
【0048】
図3は、本発明の実施形態による、デザイナ310、アクティビティ320、330、ドライバ340、およびAI/MLモデル350の間の関係300を示すアーキテクチャ図である。以上のように、開発者は、デザイナ310を用いて、ロボットによって遂行されるワークフローを開発する。ワークフローは、ユーザー定義のアクティビティ320およびUIオートメーションアクティビティ330を含んでもよい。ユーザー定義アクティビティ320および/またはUIオートメーションアクティビティ330は、いくつかの実施形態では、ロボットが動作しているコンピューティングシステムに対してローカルに、および/またはそれに対してリモートに位置され得、1または複数のAI/MLモデル350を呼び出し得る。いくつかの実施形態では、画像中の非テキストの視覚的コンポーネントを特定することができ、これは、本明細書ではコンピュータビジョン(CV)と呼ばれる。このようなコンポーネントに関連するいくつかのCVアクティビティは、クリック、タイプ、テキストを取得、ホバー、要素の有無を検出、スコープの更新、ハイライトなどを含み得るが、これらに限定されない。いくつかの実施形態では、クリックは、例えば、CV、光学的文字認識(OCR)、ファジーテキストマッチング、およびマルチアンカーを使用して要素を特定し、それをクリックする。タイプは、上記および要素内のタイプを用いて要素を特定してもよい。テキストの取得は、特定のテキストの場所を特定し、OCRを使用してそれをスキャンし得る。ホバーは、要素を特定し、その上にホバーし得る。要素の有無の検出は、上述した技法を用いて、画面上に要素が存在するかどうかを確認し得る。いくつかの実施形態では、デザイナ310に実装され得る数百または数千もののアクティビティが存在してもよい。しかし、本発明の範囲を逸脱することなく、任意の数および/またはアクティビティのタイプを利用することができる。
【0049】
UIオートメーションアクティビティ330は、低レベルのコード(例えば、CVアクティビティ)で記述され、画面とのインタラクションを促進する特別な低レベルのアクティビティのサブセットである。UIオートメーションアクティビティ330は、ロボットが所望のソフトウェアとインタラクションすることを可能にするドライバ340および/またはAI/MLモデル350を介して、これらのインタラクションを促進する。例えば、ドライバ340は、OSドライバ342、ブラウザドライバ344、VMドライバ346、エンタープライズアプリケーションドライバ348などを含み得る。コンピューティングシステムとのインタラクションの実行を決定するために、1または複数のAI/MLモデル350はUIオートメーションアクティビティ330によって使用され得る。いくつかの実施形態では、AI/MLモデル350は、ドライバ340を増強するか、またはそれらを完全に置き換え得る。実際、特定の実施形態では、ドライバ340は含まれない。
【0050】
ドライバ340は、フックを探したり、キーを監視したりするなど、低レベルでOSとインタラクションしてもよい。それらは、Chrome(登録商標)、IE(登録商標)、Citrix(登録商標)、SAP(登録商標)などとの統合を促進してもよい。例えば、「クリック」アクティビティは、ドライバ340を介して、これらの異なるアプリケーションにおいて同じ役割を果たす。
【0051】
図4は、本発明の実施形態による、RPAシステム400を示すアーキテクチャ図である。いくつかの実施形態では、RPAシステム400は、図1および/または図2のRPAシステム100および/または200であってもよいし、それを含んでもよい。RPAシステム400は、ロボットを実行する複数のクライアントコンピューティングシステム410を含む。コンピューティングシステム410は、その上で実行されるウェブアプリケーションを介してコンダクタコンピューティングシステム420と通信することができる。コンダクタコンピューティングシステム420は、次に、データベースサーバー430および任意のインデクササーバー440と通信することができる。
【0052】
図1および図3に関して、これらの実施形態ではウェブアプリケーションが使用されているが、本発明の範囲から逸脱することなく、任意の適切なクライアント/サーバーソフトウェアを使用することができることに留意すべきである。例えば、コンダクタは、クライアントコンピューティングシステム上で、非ウェブベースのクライアントソフトウェアアプリケーションと通信するサーバーサイドアプリケーションを実行してもよい。
【0053】
図5は、本発明の実施形態による、RPAのためのサポートロボットによるタスクオートメーションを実行するように構成されたコンピューティングシステム500を示すアーキテクチャ図である。いくつかの実施形態では、コンピューティングシステム500は、本明細書に描かれたおよび/または記載された1または複数のコンピューティングシステムであってもよい。コンピューティングシステム500は、情報を通信するためのバス505または他の通信機構と、情報を処理するためのバス505に結合されたプロセッサ(複数可)510とを含む。プロセッサ(複数可)510は、中央処理ユニット(CPU)、特定用途集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、グラフィックスプロセッシングユニット(GPU)、それらの複数のインスタンス、および/またはそれらのいずれかの組み合わせを含む、いずれかのタイプの一般的または特定用途向けプロセッサであり得る。プロセッサ(複数可)510はまた、複数の処理コアを有してもよく、コアの少なくとも一部は、特定の機能を実行するように構成され得る。いくつかの実施形態では、複数並列処理が使用されてもよい。特定の実施形態では、少なくとも1つのプロセッサ(複数可)510は、生物学的ニューロンを模倣する処理要素を含むニューロモーフィック回路であり得る。いくつかの実施形態では、ニューロモーフィック回路は、フォンノイマンコンピューティングアーキテクチャの典型的なコンポーネントを必要としない場合がある。
【0054】
コンピューティングシステム500は、プロセッサ(複数可)510によって遂行される情報および命令を格納するためのメモリ515をさらに含む。メモリ515は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、フラッシュメモリ、キャッシュ、磁気ディスクもしくは光ディスクなどの静的記憶装置、または他のタイプの非一時的なコンピュータ読み取り可能な媒体、あるいはそれらのいずれかの組み合わせで構成され得る。非一時的なコンピュータ読み取り可能な媒体は、プロセッサ(複数可)510によりアクセス可能ないずれかの利用可能な媒体であってもよく、揮発性媒体、不揮発性媒体または両方などを含み得る。また、媒体は、取り外し可能なもの、取り外し不可能なもの、または両方であってもよい。
【0055】
さらに、コンピューティングシステム500は、無線および/または有線接続を介して通信ネットワークへのアクセスを提供するために、トランシーバなどの通信デバイス520を含む。いくつかの実施形態では、通信デバイス520は、周波数分割多元接続(FDMA)、シングルキャリアFDMA(SC-FDMA)、時分割多元接続(TDMA)、符号分割多元接続(CDMA)、直交周波数分割多重方式(OFDM)、直交周波数分割多元接続(OFDMA)、移動体用グローバルシステム(GSM:Global System for Mobile)通信、汎用パケット無線サービス(GPRS:General Packet Radio Service)、ユニバーサル移動体通信システム(UMTS:Universal Mobile Telecommunications System)、cdma2000、広帯域CDMA(W-CDMA:Wideband CDMA)、高速ダウンリンクパケットアクセス(HSDPA:High-Speed Downlink Packet Access)、高速アップリンクパケットアクセス(HSUPA:High-Speed Uplink Packet Access)、高速パケットアクセス(HSPA:High-Speed Packet Access)、ロングタームエボリューション(LTE:Long Term Evolution)、LTEアドバンスト(LTE-A:LTE Advanced)、802.11x、Wi-Fi、Zigbee、超広帯域無線(UWB:Ultra-WideBand)、802.16x、802.15、Home Node-B(HnB)、Bluetooth、無線IDタグ(RFID:Radio Frequency Identification)、IrDA(Infrared Data Association)、近距離無線通信(NFC:Near-Field Communications)、第5世代(5G)、New Radio(NR)、それらのいずれかの組み合わせ、および/または本発明の範囲から逸脱することなく、いずれかの他の現在存在するまたは将来実装される通信標準および/またはプロトコルを使用するように構成され得る。いくつかの実施形態では、通信デバイス520は、本発明の範囲から逸脱することなく、単数のアンテナ、アレイ状のアンテナ、フェーズドアンテナ、スイッチドアンテナ、ビームフォーミングアンテナ、ビームステアリングアンテナ、それらの組み合わせ、および/またはいずれかの他のアンテナ構成である1または複数のアンテナを含み得る。
【0056】
プロセッサ(複数可)510は、バス505を介して、プラズマディスプレイ、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、電界放出ディスプレイ(FED)、有機発光ダイオード(OLED)ディスプレイ、フレキシブルOLEDディスプレイ、フレキシブル基板ディスプレイ、プロジェクションディスプレイ、4Kディスプレイ、高精細ディスプレイ、Retina(登録商標)ディスプレイ、IPS(In-Plane Switching)ディスプレイ、またはユーザーに情報を表示するためのいずれかの他の適切なディスプレイなどのディスプレイ525にさらに結合されている。ディスプレイ525は、抵抗方式、静電容量方式、表面弾性波(SAW)静電容量方式、赤外線方式、光学イメージング方式、分散信号方式、音響パルス認識方式、フラストレート全内部反射方式などを用いて、タッチ(ハプティック)ディスプレイ、3次元(3D)タッチディスプレイ、マルチ入力タッチディスプレイ、マルチタッチディスプレイなどとして構成されていてもよい。本発明の範囲を逸脱することなく、いずれかの好適な表示デバイスおよびハプティックI/Oを使用することができる。
【0057】
コンピュータマウス、タッチパッドなどのようなキーボード530およびカーソル制御デバイス535は、ユーザーがコンピューティングシステム500とインターフェースすることを可能にするために、バス505にさらに結合されている。しかしながら、特定の実施形態では、物理的なキーボードおよびマウスが存在しない場合があり、ユーザーは、ディスプレイ525および/またはタッチパッド(図示せず)のみを介してデバイスとインタラクションすることができる。任意の入力デバイスの種類および組み合わせは、設計の選択の問題として使用され得る。特定の実施形態では、物理的な入力デバイスおよび/またはディスプレイは存在しない。例えば、ユーザーは、コンピューティングシステム500と通信している別のコンピューティングシステムを介してリモートでそれとインタラクションしてもよいし、コンピューティングシステム500は自律的に動作してもよい。
【0058】
メモリ515は、プロセッサ(複数可)510により遂行されたときに機能を提供するソフトウェアモジュールを格納する。モジュールは、コンピューティングシステム500のためのオペレーティングシステム540を含む。モジュールはさらに、本明細書に記載されたプロセスの全部もしくは一部またはその派生物を実行するように構成されたタスクオートメーションモジュール545を含む。コンピューティングシステム500は、付加的な機能を含む1または複数の付加的な機能モジュール550を含み得る。
【0059】
当業者であれば、「システム」は、本発明の範囲から逸脱することなく、サーバー、組み込みコンピューティングシステム、パーソナルコンピュータ、コンソール、パーソナルデジタルアシスタント(PDA)、携帯電話、タブレットコンピューティングデバイス、量子コンピューティングシステム、または他のいずれかの適切なコンピューティングデバイス、またはデバイスの組み合わせとして具現化され得ることを理解するであろう。上述した機能を「システム」により実行されるものとして提示することは、何ら本発明の範囲を限定することを意図するものではなく、本発明の多くの実施形態の一例を提供することを意図するものである。実際、本明細書に開示された方法、システム、および装置は、クラウドコンピューティングシステムを含むコンピューティング技法と整合性のあるローカライズされた形態および分配された形態で実装されてもよい。コンピューティングシステムは、ローカルエリアネットワーク(LAN)、モバイル通信ネットワーク、衛星通信ネットワーク、インターネット、パブリッククラウドまたはプライベートクラウド、ハイブリッドクラウド、サーバーファーム、それらのいずれかの組み合わせなどの一部またはその他の方法でアクセス可能であり得る。本発明の範囲から逸脱することなく、任意の局所または分散アーキテクチャが使用され得る。
【0060】
本明細書で説明するシステム特色のいくつかは、実装の独立性をより強調するために、モジュールとして提示されていることに留意すべきである。例えば、モジュールは、カスタムの非常に大規模な集積(VLSI)回路またはゲートアレイ、ロジックチップ、トランジスタ、または他の個別部品のような既製の半導体を含むハードウェア回路として実装され得る。また、モジュールは、フィールドプログラマブルゲートアレイ、プログラマブルアレイロジック、プログラマブルロジックデバイス、グラフィックス処理ユニットなどのプログラマブルハードウェアデバイスに実装され得る。
【0061】
モジュールはまた、様々なタイプのプロセッサにより遂行されるためのソフトウェアに少なくとも部分的に実装され得る。例えば、遂行可能コードの特定された単位は、例えば、オブジェクト、プロシージャ、または関数として編成されていてもよいコンピュータ命令の1または複数の物理的または論理的なブロックを含み得る。それにもかかわらず、遂行可能な特定されたモジュールは、物理的に一緒に配置されている必要はなく、論理的に結合されたときにモジュールを含み、モジュールのために述べられた目的を達成するために、異なる場所に格納された別々の命令を含んでいてもよい。さらに、モジュールは、例えば、ハードディスクドライブ、フラッシュデバイス、RAM、テープのような非一時的なコンピュータ読み取り可能な媒体、および/または本発明の範囲から逸脱することなくデータを格納するために使用される他のいずれかの非一時的なコンピュータ読み取り可能な媒体に格納されていてもよい。
【0062】
実際、遂行可能コードのモジュールは、単一の命令であってもよいし、多数の命令であってもよいし、さらには、複数の異なるコードセグメント、異なるプログラム間、および複数のメモリデバイス間に分散されていてもよい。同様に、動作データは、モジュール内で特定され、ここで示されてもよく、いずれかの適切なタイプのデータ構造体内でいずれかの適切な形態で具現化され、組織化され得る。動作データは、単一のデータセットとして収集されてもよいし、または異なる記憶デバイスにわたり異なる場所に分散されていてもよく、少なくとも部分的には、単にシステムまたはネットワーク上の電子信号として存在していてもよい。
【0063】
図6は、本発明の実施形態による、RPAのためのサポートロボットによるタスクオートメーションを実行するように構成されたシステム600を示すアーキテクチャ図である。システム600は、デスクトップコンピュータ602、603、タブレット604、スマートフォン606などのユーザーコンピューティングシステムを含む。しかしながら、スマートウォッチ、ラップトップコンピュータなどを含むが、これらに限定されない、任意の所望のコンピューティングシステムが本発明の範囲から逸脱せずに使用され得る。また、図6には3つのユーザーコンピューティングシステムが示されているが、本発明の範囲から逸脱することなく、任意の適切な数のコンピューティングシステムが使用され得る。例えば、いくつかの実施形態では、数十、数百、数千、または数百万のコンピューティングシステムが使用されてもよい。
【0064】
各コンピューティングシステム602、604、606は、一般的に繰り返されるタスク、そのトリガ、およびそのコンテンツを決定するために、ユーザーのコンピューティングシステムとのインタラクションを監視するAI/ML対応RPAロボット610を有する。RPAロボット610は、それぞれのコンピューティングシステム上でユーザーがしていることを認識するためにCVを使用するように訓練されたAI/MLモデルを使用し得る。そして、RPAロボットは、電子メールまたは他のアプリケーションを介した要求の受信、特定のタスクが完了したことの決定、ある期間が経過したことの指摘など、特定のアクションに応答して、ユーザーが定期的に特定のタスクを実行していると決定し得る。
【0065】
コンピューティングシステム602、604、606は、ネットワーク620(例えば、ローカルエリアネットワーク(LAN)、移動通信ネットワーク、衛星通信ネットワーク、インターネット、それらの任意の組み合わせなど)を介して、サーバー630に情報を送信し、その後、互いに送信し合う。いくつかの実施形態では、サーバー630は、パブリッククラウドアーキテクチャ、プライベートクラウドアーキテクチャ、ハイブリッドクラウドアーキテクチャなどの一部であってもよい。特定の実施形態では、サーバー630は、単一のコンピューティングシステム上で複数のソフトウェアベースのサーバーをホストしてもよい。サーバー630は、AI/MLモデルを使用して、サーバー630を介したコンピューティングシステム602、604、606間の通信を分析し、ローカルRPAロボット610だけでは決定することができ得ない情報を提供する、本実施形態ではAI対応RPAロボット632を含む。
【0066】
取締役会の例で考えてみる。ある取締役は他の取締役と通信し、その取締役はさらに他の取締役と通信する。エンドユーザーコンピューティングシステム602、604、606に展開されたRPAロボット(例えば、RPAロボット610)または他のプロセスは、このパターンを見ることができないだろう。一方、サーバー側RPAロボット632は、あるユーザーが電子メールを送信し、6人の他のユーザーがその電子メールに反応することなどを見ることができる。サーバー側RPAロボット632は、その後、最初のユーザーから電子メールを送信し、その後、他の6人のユーザーに後続の電子メールを送信するプロセス全体を自動化することを学習し得る。
【0067】
いくつかのそのような実施形態は、ガバナンス/プライバシーの目的のために有用であり得る。RPAロボット632はサーバー上に存在するので、データは、それを受け取るべきでないエンドユーザーと共有される必要はない。エンドユーザーの観点からは、彼らは、システムが何をするのかを提案し始める理由、または何かを自動的に自動化する理由を知らないかもしれない。
【0068】
所定のタスクがRPAロボット610によって認識された後、RPAロボット610は、いくつかの実施形態において、それぞれのコンピューティングシステムのユーザーに対して自動化の提案を行う。例えば、RPAロボット610は、ユーザーに自動化を提案するポップアップウィンドウを表示させ得る。それぞれのユーザーがこの自動化が有益であることに同意した場合、RPAロボット610は、提案されたアクションをユーザーに提案し得る。その後、RPAロボット610は、送信すべきコンテンツが最初にユーザーに提案される訓練段階に入り得る。コンテンツが正しくない場合、ユーザーは、コンテンツの正しくない部分をマークし、正しいコンテンツの指示を提供し得る。この情報は、訓練データを使用してそれぞれのAI/MLモデルを再学習させるように制御され得る訓練コンピューティングシステム650のアプリケーション652によるレビューのために、サーバー630に送信され、データベース640に格納され得る。一定の信頼性が達成された後、RPAロボット610は、訓練されたAI/MLモデルを使用して、ユーザーのインタラクションなしにアクションを自動的に実行し得る。しかしながら、特定の実施形態では、自動化は、潜在的にユーザーの知識なしで、自動的にユーザーコンピューティングシステム602、604、606に展開され得る。
【0069】
いくつかの実施形態では、サーバー側RPAロボット632および/またはクライアント側RPAロボット610によって呼び出されるAI/MLモデルは、統計的モデリング(例えば、隠れマルコフモデル(HMM))などのさまざまな機能を実行する複数の層を有し得、深層学習技術(例えば、長短期記憶(LSTM)深層学習、以前の隠れ状態のエンコードなど)を利用してユーザーインタラクションのシーケンスを特定し得る。
【0070】
AI層
【0071】
いくつかの実施形態では、複数のAI層が使用され得る。各AI層は、データ上で実行されるアルゴリズム(またはモデル)であり、AIモデル自体は、訓練データで訓練された人工「ニューロン」の深層学習ニューラルネットワーク(DLNN)であり得る。層は、直列、並列、またはそれらの組み合わせで実行され得る。
【0072】
Al層は、限定されないが、シーケンス抽出層、クラスタリング検出層、視覚成分検出層、テキスト認識層(例えば、OCR)、音声-テキスト翻訳層、またはそれらのいずれかの組み合わせを含み得る。しかしながら、本発明の範囲を逸脱することなく、いずれかの所望の数およびタイプ(複数可)の層を使用し得る。複数の層を使用することで、システムが画面で何が起こっているのかのグローバルな画像を展開し得る。例えば、あるAI層はOCRを実行し得、別のAI層はボタンを検出し得、別のAI層はシーケンスを比較し得るなど。パターンは、1つのAI層によって個別に決定されてもよいし、複数のAI層によってまとめて決定されてもよい。
【0073】
図7は、本発明の実施形態による、コンピューティングシステム710間の通信を監視し、RPAロボット712によるタスクオートメーションを実行するように構成されたシステム700を示すアーキテクチャ図である。いくつかの実施形態では、システム700は、図6のシステム600であってもよく、またはシステム600に実装されてもよい。システム700は、1または複数のRPAロボット712がその上で実行しているユーザーコンピューティングシステム710を含む。いくつかの実施形態では、コンピューティングシステム710は、図5のコンピューティングシステム500であってもよくまたはそれを含んでもよい。RPAロボット712は、1または複数のAI/MLモデルを呼び出すAI/ML対応RPAロボット、プロセスオートメーションを実行するために展開されたロボット、それぞれのコンピューティングシステム710とユーザーのインタラクションを監視するリスナーロボット、および/または本発明の範囲を逸脱しない任意の他のタイプ(複数可)のロボットを含み得る。また、同じタイプまたは複数のタイプの任意の数のロボット712が、本発明の範囲から逸脱することなくコンピューティングシステム710上で実行し得る。
【0074】
コンピューティングシステム710は、ネットワーク720(例えば、ローカルエリアネットワーク(LAN)、移動通信ネットワーク、衛星通信ネットワーク、インターネット、それらの任意の組み合わせなど)を介して、サーバー730またはネットワーク720内の他のコンピューティングシステムに情報を送信し、その後、互いに送信し合う。いくつかの実施形態では、サーバー730は、パブリッククラウドアーキテクチャ、プライベートクラウドアーキテクチャ、ハイブリッドクラウドアーキテクチャなどの一部であり得る。実際、サーバー730は、いくつかの実施形態では、部分的にまたは完全にソフトウェアに実装されてもよく、複数のソフトウェアおよび/またはハードウェアシステムを表してもよい。特定の実施形態では、サーバー730は、単一のコンピューティングシステム上で複数のソフトウェアベースのサーバーをホストし得る。
【0075】
サーバー730は、AI/MLモデル734を使用してコンピューティングシステム710間の通信を分析し、ローカルRPAロボット712および/またはコンピューティングシステム710だけでは判断でき得ない情報を提供する、本実施形態におけるAI対応RPAロボット732を含む。いくつかの実施形態では、AI/MLモデル734の1または複数は、異なるサーバーまたは他のコンピューティングシステム上に位置し、かつそこから呼び出され得る。AI対応RPAロボット732は、あるユーザーが特定のコンテンツを含む電子メールを送信する、特定のウェブフォームを送信する、データを入力するまたは特定のアプリケーションで要求を送信するなどの場合、1または複数の他のユーザーが、承認を提供する、別のユーザーに要求を送信するなど、それに対応するアクションを取るというような、通信のパターンを決定する。AI対応RPAロボット732は、その後、それぞれのユーザーにユーザーのそれぞれのタスクのための自動化を提案し得る、またはアクションに関連するそれぞれのコンピューティングシステム710とのユーザーインタラクションに対応するアクティビティを含む1または複数のRPAワークフローを自動的に生成し、それぞれのRPAロボット712を生成し、そして次にRPAロボット712を適切なコンピューティングシステム710に展開し得る。その後、ユーザーが実行する一連のタスク全体を自動化され得る。また、所定のユーザーがアクセスすべきでない情報を提供する必要がないため、プライバシーに関する懸念に対処し得る。例えば、ユーザーは、別のRPAロボットが、ユーザーから年次レビューを受信し、次いでそのユーザーの上司によるコメントおよびパフォーマンスレビュープロセスを促進する別のユーザーのコンピューティングシステムに展開されることを知らない場合がある。
【0076】
いくつかの実施形態では、AI対応RPAロボット732によって、展開された、展開させられた、または別の方法で促進された展開されたRPAロボット712は、最初に、RPAロボット712によって取られるアクションが最初にユーザーに提案される訓練段階に入る。コンテンツが正しくない場合、ユーザーは、それぞれのユーザーコンピューティングシステム710上のアプリケーションを介して、コンテンツの正しくない部分をマークし、正しいコンテンツの指示を提供し得る。この情報は、その後のAI/MLモデルのレビューおよび訓練のために、サーバー730または何らかの他のサーバーに送信され、データベース(例えば、図6のデータベース640と同様)に格納され得る。
【0077】
図8は、本発明の実施形態による、RPAのためのサポートロボットによるタスクオートメーションを実行するためのプロセス800を示すフローチャートである。プロセスは、805でユーザーと彼らのコンピューティングシステムとインタラクションを監視することから始まる。いくつかの実施形態では、監視は、ユーザーインタラクションを含むデータを生成し得るリスナーRPAロボットによって実行され得る。AI/MLモデルを使用して、ユーザーインタラクションを含むデータを分析し、810でユーザーが実行するタスクを決定する。例えば、AI/MLモデルは、あるユーザーが開始タスクを実行すると、別のユーザーが応答タスクを実行すると決定し得る。いくつかの実施形態では、応答タスクを実行するコンピューティングシステムが、例えば、開始タスクを実行したもの以外の別のコンピューティングシステムと通信し、そして応答タスクを実行するためにこの情報を使用することが、AI/MLモデルまたは呼び出しRPAロボットによって決定され得る。特定の実施形態では、ユーザーのインタラクションに関するデータは、他のユーザーのコンピューティングシステムと共有されることはない。
【0078】
いくつかの実施形態では、それぞれのコンピューティングシステムのユーザーは、815において、それぞれのタスクの自動化が望まれるかどうかを尋ねられる。しかしながら、特定の実施形態では、このステップは採用されない場合がある。ユーザーが815において自動化が望まれることを示す、または潜在的にユーザー入力なしで自動的にの場合、それぞれのタスク(複数可)(例えば、開始タスクおよび応答タスク)を実装するRPAワークフロー(複数可)が、820において生成される。RPAワークフロー(複数可)は、それぞれのタスクに関連するユーザーインタラクションを実装するアクティビティを含み得る。次いで、RPAワークフロー(複数可)を使用して825でRPAロボット(複数可)が生成され、830でRPAロボット(複数可)が展開される。
【0079】
いくつかの実施形態では、展開されたRPAロボット(複数可)は、最初の展開後に訓練段階に入る。しかし、特定の実施形態では、この訓練段階は、スキップされるかまたはさもなくば使用されないことがある。いくつかの実施形態では、それぞれのコンピューティングシステムのユーザーは、タスクを自動的に実行するかどうかに関して、835で展開されたRPAロボットによって促され得、提案されたアクション(複数可)がユーザーに提供され得る。RPAロボットがタスクを正しく実行しない場合、ユーザーは、コンテンツの不正確な部分をマークし、正しいコンテンツの1または複数の指示を840でラベル付き訓練データとして提供し得る。この訓練データを受信した後のある時点で(例えば、ある程度の時間が経過した後、ある量の訓練データを受信した後など)、845において、RPAロボットが呼び出すAI/MLモデルが再訓練され、および/またはRPAロボット自体が修正または交換されて代替RPAロボットが展開される。特定の基準が満たされた後(例えば、修正を受信せずにある時間が経過した後、一定期間内の修正量がしきい値未満である場合など)、850において、訓練段階が終了し得、RPAロボット(複数可)がそれぞれのタスクを実行するために自動的に使用され得る。
【0080】
図8で実行されるプロセスステップは、本発明の実施形態に従って、図8で説明したプロセス(複数可)の少なくとも一部を実行するようにプロセッサ(複数可)への命令をエンコードするコンピュータプログラムによって実行されてもよい。コンピュータプログラムは、非一時的なコンピュータ読み取り可能な媒体に格納されていてもよい。コンピュータ読み取り可能な媒体は、ハードディスクドライブ、フラッシュデバイス、RAM、テープ、および/またはデータを格納するために使用される他のそのような媒体または媒体の組み合わせであってもよいが、これらに限定されるものではない。コンピュータプログラムは、図8に記載されたプロセスステップの全部または一部を実装するために、コンピューティングシステム(例えば、図5のコンピューティングシステム500のプロセッサ(複数可)510)のプロセッサ(複数可)を制御するためのコード化された命令を含んでもよく、これはまた、コンピュータ読み取り可能な媒体に格納されてもよい。
【0081】
コンピュータプログラムは、ハードウェア、ソフトウェア、またはハイブリッド実装で実装され得る。コンピュータプログラムは、互いに動作可能な通信を行うモジュールで構成され得、情報または指示をディスプレイに送るように設計されている。コンピュータプログラムは、汎用コンピュータ、ASIC、またはいずれかの他の好適なデバイスで動作するように構成され得る。
【0082】
本発明の様々な実施形態のコンポーネントは、本明細書に一般的に記載され、図示されているように、様々な異なる構成で配置され、設計されてもよいことが、容易に理解されるであろう。したがって、添付の図に表されるような本発明の実施形態の詳細な説明は、特許請求されるような本発明の範囲を限定することを意図するものではなく、本発明の選択された実施形態を代表するものにすぎない。
【0083】
本明細書を通して記載された本発明の特色、構造、または特徴は、1または複数の実施形態では、いずれかの好適な方法で組み合わせられ得る。例えば、本明細書全体を通して「特定の実施形態」、「いくつかの実施形態」、または類似の言語を参照することは、実施形態に関連して記載された特定の特色、構造、または特徴が、本発明の少なくとも1つの実施形態に含まれていることを意味する。したがって、本明細書全体を通して「特定の実施形態では」、「いくつかの実施形態では」、「他の実施形態では」、または類似の言語の出現は、必ずしも全ての実施形態の同じグループを指すものではなく、記載された特色、構造、または特徴は、1または複数の実施形態ではいずれかの好適な方法で組み合わせられ得る。
【0084】
本明細書全体を通して特色、利点、または類似の言語への参照は、本発明で実現され得る特色および利点の全てが、本発明のいずれかの単一の実施形態にあるべきであること、または本発明のいずれかの実施形態であることを意味するものではないことに留意すべきである。むしろ、特色および利点に言及する言語は、実施形態に関連して記載された特定の特色、利点、または特徴が、本発明の少なくとも1つの実施形態に含まれることを意味すると理解される。したがって、本明細書全体での特色および利点の議論、ならびに類似の言語は、同じ実施形態を参照することができるが、必ずしもその必要性はない。
【0085】
さらに、本発明の記載された特色、利点、および特徴は、1または複数の実施形態では、いずれかの好適な方法で組み合わせることができる。関連する技術の当業者は、本発明が、1または複数の特定の実施形態の特定の特徴または利点なしに実施され得ることを認識するであろう。他の例では、追加の特徴および利点は、本発明の全ての実施形態には存在しないかもしれないが特定の実施形態では認識され得る。
【0086】
本分野における通常の技術を有する者は、上述したような本発明を、異なる順序でのステップを用いて、および/または開示されているものとは異なる構成のハードウェア要素を用いて実施することができることを容易に理解するであろう。したがって、本発明は、これらの好ましい実施形態に基づいて説明されてきたが、本発明の精神および範囲内にとどまりながら、特定の変更、変形、および代替的な構成が明らかになることは、当業者には明らかであろう。したがって、本発明の範囲を決定するためには、添付の特許請求の範囲を参照すべきである。

図1
図2
図3
図4
図5
図6
図7
図8
【国際調査報告】