(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-04-07
(54)【発明の名称】ロボティックプロセスオートメーション(RPA)ロボットのインターセッションオートメーション
(51)【国際特許分類】
G06F 11/36 20060101AFI20230331BHJP
【FI】
G06F11/36 164
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2022549439
(86)(22)【出願日】2020-12-09
(85)【翻訳文提出日】2022-10-11
(86)【国際出願番号】 US2020063964
(87)【国際公開番号】W WO2021167680
(87)【国際公開日】2021-08-26
(32)【優先日】2020-02-18
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2020-05-13
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】520262319
【氏名又は名称】ユーアイパス,インコーポレイテッド
【氏名又は名称原語表記】UiPath,Inc.
【住所又は居所原語表記】1 Vanderbilt Avenue, 60th Floor, New York, NY 10017, United States of America
(74)【代理人】
【識別番号】110003487
【氏名又は名称】弁理士法人東海特許事務所
(72)【発明者】
【氏名】ホール,アンドリュー
(72)【発明者】
【氏名】タイ,アリソン
【テーマコード(参考)】
5B042
【Fターム(参考)】
5B042GB07
5B042HH07
5B042HH49
(57)【要約】
ロボティックプロセスオートメーション(RPA)のためのインターセッションオートメーションが開示される。ユーザーセッションにおいて実行するロボットまたは別のアプリケーションまたはプロセスは、アプリケーションとインタラクションすることができるが、1または複数の子セッションの1または複数のアテンディッドRPAロボットは、動作を実行し、ユーザーセッションロボットがその後ユーザーセッションのアプリケーションとインタラクションするために使用するであろうデータをフェッチする。クライアントセッションにおけるアテンディッドRPAロボットは、スプレッドシート、オブジェクト指向データベース、プレーンテキストファイル、別のデータストアまたはファイルなどのような永続的データストアにデータを格納することによって、プロセス間通信(IPC)プロトコルを介してデータを共有することができる。ユーザーセッションロボット、または親セッションにおいて実行している別のアプリケーションまたはプロセスは、この情報を読み取り、それに応じて応答し得る。
【特許請求の範囲】
【請求項1】
ユーザーセッションにおいてユーザーセッションプロセスを起動し、
第1クライアントセッションにおいて第1クライアントセッションロボティックプロセスオートメーション(RPA)ロボットを起動し、
前記第1クライアントセッションRPAロボットによって、前記第1クライアントセッションにおける前記第1クライアントセッションRPAロボットのワークフローを遂行し、
前記第1クライアントセッションRPAロボットによって、前記第1クライアントセッションRPAロボットの前記ワークフローの前記遂行の結果を前記ユーザーセッションプロセスが利用できるようし、
前記ユーザーセッションプロセスによって、前記第1クライアントセッションRPAロボットの前記ワークフローの前記遂行の前記結果を使用して、前記ユーザーセッションにおけるアプリケーションとインタラクションすることを含む、コンピュータ実装方法。
【請求項2】
前記ユーザーセッションにおける前記アプリケーションとの前記インタラクションは、フォームへの情報の入力を含み、
RPAワークフローの前記遂行の前記結果は、前記フォームに前記情報を入力するために前記ユーザーセッションプロセスにより使用されるデータを含む、請求項1に記載のコンピュータ実装方法。
【請求項3】
前記ユーザーセッションプロセスがRPAロボットを含む、請求項1に記載のコンピュータ実装方法。
【請求項4】
前記第1クライアントセッションRPAロボットは、前記第1クライアントセッションに関連付けられたウィンドウ内で見ることができる、請求項1に記載のコンピュータ実装方法。
【請求項5】
前記第1クライアントセッションRPAロボットは見えない、請求項1に記載のコンピュータ実装方法。
【請求項6】
前記ユーザーセッションプロセスは、前記第1クライアントセッションRPAロボットが、前記第1クライアントセッションRPAロボットの前記ワークフローの前記遂行を完了するのを待つ、請求項1に記載のコンピュータ実装方法。
【請求項7】
前記ユーザーセッションプロセスは、前記第1クライアントセッションRPAロボットが、前記第1クライアントセッションRPAロボットの前記ワークフローの前記遂行を完了するのを待っている間、他のタスクを実行する、請求項1に記載のコンピュータ実装方法。
【請求項8】
前記第1クライアントセッションまたは第2クライアントセッションにおいて第2クライアントセッションRPAロボットを起動し、
前記第2クライアントセッションRPAロボットによって、前記第1クライアントセッションまたは前記第2クライアントセッションにおける前記第2クライアントセッションRPAロボットのワークフローを遂行し、
前記第2クライアントセッションRPAロボットによって、前記第2クライアントセッションRPAロボットの前記ワークフローの前記遂行の結果を前記ユーザーセッションプロセスが利用できるようにすることを、さらに含む、請求項1に記載のコンピュータ実装方法。
【請求項9】
前記第1クライアントセッションおよび前記第1クライアントセッションRPAロボットは、前記ユーザーセッションプロセスによって起動される、請求項1に記載のコンピュータ実装方法。
【請求項10】
前記第1クライアントセッションRPAロボットが前記第1クライアントセッションRPAロボットの前記ワークフローの遂行を完了した後、前記第1クライアントセッションRPAロボットおよび前記第1クライアントセッションを自動的に閉じることを、さらに含む、請求項1に記載のコンピュータ実装方法。
【請求項11】
前記ユーザーセッションプロセスはRPAロボットを含み、ユーザーセッションRPAロボットおよび前記第1クライアントセッションRPAロボットは、前記第1クライアントセッションRPAロボットの前記ワークフローを含むより大きなワークフローの遂行をまとめて完了する、請求項1に記載のコンピュータ実装方法。
【請求項12】
クライアントセッションRPAロボットによって、クライアントセッションにおけるクライアントセッションロボティックプロセスオートメーション(RPA)ロボットのワークフローを遂行し、
前記クライアントセッションRPAロボットによって、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行の結果をユーザーセッションRPAロボットが利用できるようにし、
前記ユーザーセッションRPAロボットによって、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行の前記結果を使用して、コンピューティングシステム上のアプリケーションとインタラクションすること、を含む、コンピュータ実装方法。
【請求項13】
前記コンピューティングシステム上の前記アプリケーションとの前記インタラクションは、フォームへの情報の入力を含み、
RPAワークフローの前記遂行の前記結果は、前記フォームに前記情報を入力するために前記ユーザーセッションRPAロボットにより使用されるデータを含む、請求項12に記載のコンピュータ実装方法。
【請求項14】
前記ユーザーセッションRPAロボットは、前記クライアントセッションRPAロボットが、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行を完了するのを待つ、請求項12に記載のコンピュータ実装方法。
【請求項15】
前記ユーザーセッションRPAロボットは、前記クライアントセッションRPAロボットが、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行を完了するのを待っている間、他のタスクを実行する、請求項12に記載のコンピュータ実装方法。
【請求項16】
前記ユーザーセッションRPAロボットによって、プロセス間通信(IPC)を介して前記クライアントセッションRPAロボットの前記ワークフローを遂行するように前記クライアントセッションRPAロボットに命令し、
前記ユーザーセッションRPAロボットによって、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行の前記結果を受信することを、さらに含む、請求項12に記載のコンピュータ実装方法。
【請求項17】
前記ユーザーセッションRPAロボットおよび前記クライアントセッションRPAロボットは、前記クライアントセッションRPAロボットの前記ワークフローを含むより大きなワークフローの遂行をまとめて完了する、請求項12に記載のコンピュータ実装方法。
【請求項18】
クライアントセッションRPAロボットによって、クライアントセッションにおけるクライアントセッションロボティックプロセスオートメーション(RPA)ロボットのワークフローを遂行し、
前記クライアントセッションRPAロボットによって、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行の結果をユーザーセッションRPAロボットが利用できるようにし、
前記ユーザーセッションRPAロボットによって、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行の前記結果を使用して、コンピューティングシステム上のアプリケーションとインタラクションすること、を含み、
前記ユーザーセッションRPAロボットおよび前記クライアントセッションRPAロボットは、前記クライアントセッションRPAロボットの前記ワークフローを含むより大きなワークフローの遂行をまとめて完了する、コンピュータ実装方法。
【請求項19】
前記ユーザーセッションRPAロボットによって、プロセス間通信(IPC)を介して前記クライアントセッションRPAロボットの前記ワークフローを遂行するように前記クライアントセッションRPAロボットに命令し、
前記ユーザーセッションRPAロボットによって、前記クライアントセッションRPAロボットの前記ワークフローの前記遂行の前記結果を受信することを、さらに含む、請求項18に記載のコンピュータ実装方法。
【請求項20】
前記ユーザーセッションにおける前記アプリケーションとの前記インタラクションは、フォームへの情報の入力を含み、
前記RPAワークフローの前記遂行の前記結果は、前記フォームに前記情報を入力するために前記ユーザーセッションRPAロボットにより使用されるデータを含む、請求項18に記載のコンピュータ実装方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願への相互参照)
本出願は、2020年5月13日に出願された米国非仮特許出願第15/930,906号の利益を主張し、これは、2020年2月18日に出願された米国非仮特許出願第16/793,064号の一部継続(CIP)であり、その利益を主張するものである。これらの先に出願された出願のこの主題は、その全体を参照することにより、本明細書に組み込まれる。
【0002】
本発明は概して、ロボティックプロセスオートメーション(RPA)に関し、より具体的には、RPAロボットのためのインターセッションオートメーションに関する。
【背景技術】
【0003】
アテンディッドオートメーションRPAロボットは通常、ユーザーによって操作されるコンピューティングシステム上で、そのユーザーと同じセッションで実行する。アテンディッドRPAロボットは、例えば、ユーザーのコマンドで特定のタスクを達成するためにユーザーと連携し得る。しかし、アテンディッドオートメーションシナリオでは、RPAロボットがユーザーのコンピューティングシステムを「引き継ぐ」場合がある。ユーザーは、ロボットがコンピューティングシステムとインタラクションしている間に他のアクティビティを実行したいと希望し得るが、ユーザーはそうすることができない。言い換えると、ロボットはユーザーインターフェース(UI)を介して、ユーザーが行う(例えば、マウスクリックおよびキーボード入力をシミュレートすること)こと同じ方法でアプリケーションを制御する。
【0004】
オペレーティングシステムまたはその上で実行しているアプリケーションの完全または部分的なコピーを作成するさまざまなテクノロジが存在する。エミュレータは何十年も前から存在しており、開発者にアプリケーションをテストするおよびデバッグを行う機能を提供し得る。例えば、エミュレータは、開発ツールの実行を直接サポートしていないオペレーティングシステムを使用するモバイルアプリケーションをテストおよびデバッグする機能を開発者に提供し得る。Android(登録商標)およびiOS(登録商標)はどちらも、これらのモバイルオペレーティングシステムでは開発者ツールをネイティブに実行できないため、開発マシンから実行されてAndroid(登録商標)またはiOS(登録商標)アプリケーションをテストおよびデバッグし得るエミュレータを提供する。
【0005】
シミュレータを使用すると、開発者は彼または彼女のローカルマシンでウィンドウをホストでき、これにより、開発者は、開発マシンでは実行が困難または不可能なアプリケーションの動作をテストおよびデバッグできる。例えば、シミュレータでは、開発者がボタンをクリックしてシミュレータを回転させることができ、これは、シミュレータ内で実行しているアプリケーションに、これらのイベントに応答するアプリケーションの動作をテストおよびデバッグする目的で、デバイスが回転されたことを通知する。別の一般的な例は、マルチタッチである。多くの開発者マシンはタッチをサポートしていないため、シミュレータを使用すると、開発者はアプリケーションが複数のタッチポイントにどのように応答するかをテストおよびデバッグできる。Android(登録商標)およびiOS(登録商標)エミュレータもシミュレーション機能を提供する。さらに、Microsoft(登録商標)は、ユニバーサルWindowsプラットフォーム(UWP)アプリケーション用のシミュレータを提供している。
【0006】
仮想マシンは、マシン上で第2オペレーティングシステムをホストし、開かれてウィンドウを通じて監視され得る。これは、まったく異なるオペレーティングシステムを実行し、ハードウェアをホストマシンと共有する。「ゲスト」マシンにはアプリケーションの独自のコピーがインストールされている必要があり、共通のリソースまたはファイルをユーザーマシンと共有しない。
【0007】
Docker(登録商標)コンテナは、概念的にはハイブリッド形式の仮想マシンである。遂行する必要のあるすべてのアプリケーションは、ホストオペレーティングシステムで直接遂行される不変パッケージにパッケージ化される。パッケージは、別のオペレーティングシステムの完全なコピーではないが、それは、デフォルトでは、ホストマシン上の任意のアプリケーションまたはリソースを共有したり、またはそれらにアクセスしたりしない。したがって、ユーザーエクスペリエンスの観点からは、Docker(登録商標)コンテナは仮想マシンに似ている気はするが、技術的には、コンテナは完全に別のオペレーティングシステム上で遂行していない。
【0008】
しかし、従来のエミュレータ、シミュレータ、仮想マシン(VM)、オペレーティングシステム(OS)レベルの仮想化(Docker(登録商標)コンテナなど)を提供するハイブリッドVMでは、ユーザーと同じコンピューティングシステム上で動作するアテンディッドオートメーションロボットで発生する問題には対処しない。したがって、ユーザーは基本的に彼または彼女のコンピューティングシステムの傍観者になり、ロボットの動作を監視し、ユーザーインタラクションを必要とするマシン上の他のアプリケーションとインタラクションすることができない。したがって、改良されたアプローチが有益であり得る。
【発明の概要】
【0009】
本発明の特定の実施形態は、現在のRPA技術によってまだ十分に特定されていない、評価されていない、または解決されていない本分野における問題およびニーズのソリューションを提供し得る。例えば、本発明のいくつかの実施形態は、RPAロボットのためのインターセッションオートメーションに関する。
【0010】
実施形態では、コンピュータ実装方法は、ユーザーセッションにおいてユーザーセッションプロセスを起動すること、および第1クライアントセッションにおいて第1クライアントセッションRPAロボットを起動することを含む。コンピュータ実装方法はまた、第1クライアントセッションRPAロボットによって、第1クライアントセッションにおける第1クライアントセッションRPAロボットのワークフローを遂行することを含み、第1クライアントセッションRPAロボットによって、第1クライアントセッションRPAロボットのワークフローの遂行の結果をユーザーセッションプロセスが利用できるようにすることを含む。コンピュータ実装方法はさらに、ユーザーセッションプロセスによって、第1クライアントセッションRPAロボットのワークフローの遂行の結果を使用して、ユーザーセッションにおけるアプリケーションとインタラクションすることをさらに含む。
【0011】
別の実施形態では、コンピュータ実装方法は、クライアントセッションRPAロボットによって、クライアントセッションにおけるクライアントセッションRPAロボットのワークフローを遂行することを含み、クライアントセッションRPAロボットによって、クライアントセッションRPAロボットのワークフローの遂行の結果をユーザーセッションRPAロボットが利用できるようにすることを含む。コンピュータ実装方法はまた、ユーザーセッションRPAロボットによって、クライアントセッションRPAロボットのワークフローの遂行の結果を使用して、コンピューティングシステム上のアプリケーションとインタラクションすること、を含む。
【0012】
さらに別の実施形態では、コンピュータ実装方法は、クライアントセッションRPAロボットによって、クライアントセッションにおけるクライアントセッションRPAロボットのワークフローを遂行することを含み、クライアントセッションRPAロボットによって、クライアントセッションRPAロボットのワークフローの遂行の結果をユーザーセッションRPAロボットが利用できるようにすることを含む。コンピュータ実装方法はまた、ユーザーセッションRPAロボットによって、クライアントセッションRPAロボットのワークフローの遂行の結果を使用して、コンピューティングシステム上のアプリケーションとインタラクションすること、を含む。ユーザーセッションRPAロボットおよびクライアントセッションRPAロボットは、クライアントセッションRPAロボットのワークフローを含むより大きなワークフローの遂行をまとめて完了する。
【図面の簡単な説明】
【0013】
本発明の特定の実施形態の利点が容易に理解されるように、上記で簡単に説明した本発明のより特定の説明は、添付の図面に図示されている特定の実施形態を参照して描写される。これらの図面は、本発明の典型的な実施形態のみを描いており、したがって、その範囲を限定するものとは考えられないことが理解されるべきであるが、本発明は、以下の添付の図面を使用することにより、さらなる特定および詳細をもって描写され、説明されるであろう。
【0014】
【
図1】本発明の実施形態による、ロボティックプロセスオートメーション(RPA)システムを示すアーキテクチャ図である。
【0015】
【
図2】本発明の実施形態による、展開したRPAシステムを示すアーキテクチャ図である。
【0016】
【
図3】本発明の実施形態による、デザイナ、アクティビティ、およびドライバの間の関係を示すアーキテクチャ図である。
【0017】
【
図4】本発明の実施形態による、RPAシステムを示すアーキテクチャ図である。
【0018】
【
図5】本発明の実施形態による、RPAロボットのためのインターセッションオートメーションを容易にするように構成されたコンピューティングシステムを示すアーキテクチャ図である。
【0019】
【
図6】本発明の実施形態による、ユーザーセッションにおけるユーザーによってアクセスされるユーザーコンピューティングシステムのいくつかのアプリケーションおよびファイルシステムと、ロボットセッションにおけるRPAロボットとを示す。
【0020】
【
図7A】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7B】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7C】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7D】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7E】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7F】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7G】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7H】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7I】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【
図7J】本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
【0021】
【
図8】本発明の実施形態による、インターセッションオートメーションのためのプロセスを示すフローチャートである。
【0022】
【
図9】本発明の実施形態による、一方のロボットがユーザーセッションで実行し、他方のロボットがクライアントセッションで実行するインターセッションオートメーションのプロセスを示すフローチャートである。
【0023】
【
図10】本発明の実施形態による、ワークフローの一部がユーザーセッションロボットによって完了され、ワークフローの他の部分がクライアントセッションロボットによって完了されるシナリオを示す。
【0024】
【
図11】本発明の実施形態による、ユーザーセッションロボットU1と一対のクライアントセッションロボットC1およびC2との間のマルチロボット集団ワークフローの遂行を示すフロー図である。
【0025】
別段の記載がない限り、類似の参照文字は、添付の図面全体で一貫して対応する特徴を示す。
【発明を実施するための形態】
【0026】
(実施形態の詳細な説明)
いくつかの実施形態は、アテンディッドRPAのインターセッションオートメーションに関する。例えば、フォーム(例えば、ウェブページ、スプレッドシート、入力可能なフィールドを有する別のアプリケーションなど)は、ユーザーセッション(本明細書ではメインセッションまたは親セッションとも呼ばれる)において表示され得る。ユーザーセッションにおいて実行するロボットまたは別のアプリケーションまたはプロセスはフォームとインタラクションすることができるが、1または複数の子セッション(本明細書では、クライアントセッション、ロボットセッション、または第2セッションとも呼ばれる)の1または複数のアテンディッドRPAロボットは、動作を実行し、ユーザーセッションロボットがその後ユーザーセッションのフォームに入力するために使用するであろうデータをフェッチし得る。クライアントセッションにおけるアテンディッドRPAロボットは、スプレッドシート、オブジェクト指向データベース、プレーンテキストファイル、別のデータストアまたはファイルなどを含むがこれらに限定されない永続的データストアにデータを格納することによって、プロセス間通信(IPC)プロトコルを介してデータを共有することができる。ユーザーセッションロボット、または親セッションにおいて実行している別のアプリケーションまたはプロセスは、この情報を読み取り、それに応じて応答し(例えば、情報を使用したフォームへの入力することによって)得る。このように、アテンディッドオートメーションロボット(複数可)の動作は、クライアントセッションRPAロボット(複数可)がワークフローを実行しているときにユーザーが他のアプリケーションまたはインスタンスを使用することを妨げ得ないが、ユーザーセッションRPAロボットによって提供された入力は、ユーザーセッションロボットがそれをアプリケーションに充填するときにユーザーセッションのユーザーに可視化される。
【0027】
いくつかの実施形態では、プロセスは以下のように動作し得る。ユーザーはボタンをクリックするか、またはさもなくばRPAロボットにユーザーセッションの子セッション(例えば、ユーザーが彼または彼女のコンピューティングシステムを起動したときに起動される親セッションまたはメインセッション)において起動させ得る。特定の実施形態では、ロボットセッションは、すでに実行しているか、または、例えば、ロボットトレイからユーザーによって別々に起動され得る。いくつかの実施形態におけるロボットトレイは、システムトレイウィンドウに利用可能なジョブを表示するWindows(登録商標) Presentation Foundation(WPF)アプリケーションであり得る。ユーザーは、子セッションにおいてロボットにそのワークフローを遂行させることができ、その後、ロボットはメインセッションにおいて1または複数のアプリケーションとインタラクションし得る。ロボット機能は、いくつかの実施形態におけるロボットを呼び出すメインセッションのボタンをユーザーがクリックすることによって開始され得る。特定の実施形態では、ユーザーセッションロボットは、クライアントセッションロボットを開始し得る。
【0028】
いくつかの実施形態では、ワークフローが動作する少なくとも1つのアプリケーションが起動されていない場合、クライアントセッションロボットは動作を停止し、メッセージを提供し得る。特定の実施形態では、ユーザーセッションロボットまたは他のユーザセッションアプリケーションまたはプロセスは、アプリケーション(複数可)が開いていない場合、それらを起動し得る。オペレーティングシステムがそのような動作を許可している場合、クライアントセッションロボットは親セッションにおいてアプリケーションを起動し得る。クライアントセッションロボットがデータをユーザーセッションロボットで使用できるようにすると、ユーザーセッションロボットがそれを入力すると、メインセッションにおいてデータが表示され得る。
【0029】
いくつかの実施形態では、ユーザーは、例えば、ウェブサイトに行き、いくつかの情報を収集し、そしてユーザーセッションロボットまたは別のアプリケーションまたはプロセスがアクセスしてメインセッションで見えるスプレッドシートに入力できるようにするワークフローを、クライアントセッションにおいてロボットに遂行させ得る。特定の実施形態では、Salesforce(登録商標)などのアプリケーションがメインセッションで開かれている。次に、ユーザーまたはユーザーセッションロボットは、クライアントセッションにおいて、例えば、メインセッションからクライアントIDを受信し、ウェブサイト(例えば、HubSpot(登録商標)に行き、そしてウェブサイトとのクライアントのインタラクションに関連する情報を収集するオートメーションを実行する。しかしながら、アテンディッドRPAロボットは、本発明の範囲から逸脱することなく、任意の適切なアプリケーション(複数可)とインタラクションしてもよく、および/または任意の適切なソース(例えば、データベース、別のアプリケーションなど)からデータを得てもよい。
【0030】
いくつかの実施形態では、メインセッションにおいて実行しているユーザーセッションロボットのRPAワークフローは、クライアントセッションロボットにクライアントセッションにおいて第2ワークフローを実行させることが可能である。オブジェクトは、IPCを介していくつかの実施形態におけるワークフロー間で前後に渡され得、例えば、データは、ユーザーセッションロボットがアクセスすることができるクライアントセッションロボットによって格納することができるなどである。これは、ワークフローの一部が完了するのに比較的長い時間を要する場合に有益であり得る。ユーザーが彼または彼女のコンピューティングシステムとインタラクションすることを妨げられた場合、ユーザーセッションロボットがワークフローアクティビティのすべてを実行すると、ユーザーは生産的でなくなる場合がある。しかし、ロボットを別のセッションから操作することによって、いくつかの実施形態は、ロボットがそのタスクを実行している間、ユーザーが他のアプリケーション/インスタンスにアクセスすることを可能にする。
【0031】
いくつかの実施形態のアプリケーションは、エミュレータ、シミュレータ、VM、およびOSレベルの仮想化を提供するハイブリッドVM(Docker(登録商標)コンテナなど)を含むが、これらに限定されない。いくつかの実施形態は、それぞれのアテンディッドオートメーションロボットによって制御されているアプリケーションのUIを含むウィンドウとして、1または複数のロボットセッションを作成し、ホストする。特定の実施形態では、ロボットセッションウィンドウは、クライアントセッションロボットがインタラクションしているアプリケーション(複数可)だけを含んでもよい。本明細書で使用される場合、「ウィンドウ」は、本発明の範囲から逸脱することなく、メインUI内に示されるUIを表すウィンドウ、コンピューティングシステムの第2ディスプレイの第2画面、仮想デスクトップ、隔離された環境(すなわち、環境内で起動されたすべてのアプリケーション(「子」と呼ばれる)のUIを描画し、ホストセッションのコンテキストでそれらを実行するウィンドウ(「ホスト」と呼ばれる))などに適用され得る。
【0032】
複数のセッションを実行することで、ユーザーとユーザーセッションロボットが第1セッション(例えば、親セッション)とインタラクションしながら、ロボット(複数可)がそれらのセッション(複数可)において動作し得る。このようにして、ユーザーはユーザーセッションおよびクライアントセッションロボットが使用していないアプリケーションとインタラクションすることができ(例えば、ユーザーセッションロボットがExcel(登録商標)からウェブブラウザにデータを移動している間、ユーザーはOutlook(登録商標)を使用できる)、またはそのアプリケーションがこの機能を実現できる場合、ユーザーとユーザーセッションロボットおよび/またはクライアントセッションロボットとは同じアプリケーションとインタラクションできる場合がある(例えば、ユーザーが別のインスタンスとインタラクションしながらユーザーセッションロボットまたはクライアントセッションロボットがウェブブラウザのあるインスタンスとインタラクションしている)。
【0033】
ユーザーおよびロボット(複数可)は両方とも、同じアプリケーションのインストールおよびいくつかの実施形態におけるファイルシステムとインタラクションしている。アプリケーションでロボット(複数可)およびユーザーを介して行われた変更は、ユーザーおよびロボットがそれぞれ別のバージョンのアプリケーションとファイルシステムで作業するのではなく、いくつかの実施形態で1人のユーザーがそれらを行ったかのように行われよう。言い換えると、そのような実施形態におけるアプリケーションは、ユーザーのローカルExcel(登録商標)、Outlook(登録商標)などである。また、ローカルファイルシステムは、追加の設定なしに利用され得る。これは、例えば、Docker(登録商標)コンテナとは異なっており、これは、コンテナ内で実行しているアプリケーションにホストオペレーティングシステムのファイルシステムへのアクセスを提供するために、追加の設定手順が必要である。
【0034】
いくつかの実施形態では、任意の数のロボットに対する任意の所望の数のセッションが、本発明の範囲から逸脱することなく作成され使用され得る。例えば、ユーザーおよびユーザーセッションロボットまたは別のアプリケーションまたはプロセスは、第1セッションで動作してもよく、第1クライアントセッションロボットは第2セッションで動作してもよく、第2クライアントセッションロボットは第3セッションで動作してもよい、などである。特定の実施形態では、複数のロボットが単一のセッションで動作し、潜在的に1または複数の共通のアプリケーションとのインタラクションのために交代し得る。
【0035】
セッションを作成するための機能は、例えば、Windows(登録商標)ターミナルサービス子セッションを介して実装されてもよく、これは、ユーザーがログアウトすることなく、ユーザー自身のマシンに戻ってセッションを作成することができる。新しく作成されたセッションは、子ウィンドウとして表示され、ユーザーのセッションに存在するアプリケーションを含み、起動し得る。言い換えると、ユーザーとロボットとの分離は、UIレベルで起こる。例えば、ファイルが削除された場合、これはコンピューティングシステム上で実行しているすべてのセッションで発生する。
【0036】
いくつかの実施形態では、Docker(登録商標)などのハイブリッド仮想マシンが使用され得る。ハイブリッド仮想マシンは、リモートUIを使用して、コンテナ内のアプリケーションおよびロボットを実行することを可能にする。そのような実施形態は、そこに含まれるロボットを分離し、権限単位で権限を付与し得る。ロボットは、コンテナの外側にあるものに対して「穴を開ける」必要がある。そのため、コンテナは、本質的に、どのように「脱出」するか(例えば、ポートを開く、フォルダをマウントする、など)の構成可能な権限を持つ、それ自身のサンドボックスである。特定の実施形態では、完全な仮想マシンが使用され得る。
【0037】
特定の実施形態は、ロボティックプロセスオートメーション(RPA)に採用されてもよい。
図1は、本発明の実施形態による、RPAシステム100を示すアーキテクチャ図である。RPAシステム100は、開発者がワークフローを設計して実装することを可能にするデザイナ110を含む。デザイナ110は、アプリケーション統合のためのソリューションを提供するとともに、サードパーティアプリケーション、管理情報技術(IT)タスク、およびビジネスITプロセスを自動化する。デザイナ110は、ビジネスプロセスのグラフィック表現である自動化プロジェクトの開発を容易にし得る。簡単に言えば、デザイナ110は、ワークフローおよびロボットの開発および展開を容易にする。
【0038】
自動化プロジェクトは、本明細書で「アクティビティ」と定義されるワークフローで開発されたカスタムセットのステップ間の遂行順序および関係の制御を開発者に与えることにより、ルールベースのプロセスの自動化を可能にする。デザイナ110の実施形態の商業的な一例は、UiPath Studio(商標)である。各アクティビティは、ボタンをクリックする、ファイルを読む、ログパネルに書き込むなどのアクションを含み得る。いくつかの実施形態では、ワークフローは入れ子になっているか、または埋め込まれ得る。
【0039】
ワークフローのタイプには、シーケンス、フローチャート、FSM、および/またはグローバル例外ハンドラなどを含み得るが、これらに限定されない。シーケンスは、ワークフローを乱雑にすることなく、あるアクティビティから別のアクティビティへのフローを可能にする、線形プロセスに特に適し得る。フローチャートは、特により複雑なビジネスロジックに適し得、複数の分岐ロジックオペレータを介して、より多様な方法で意思決定の統合およびアクティビティの接続を可能にする。FSMは、大規模なワークフローに特に適し得る。FSMは、条件(すなわち、遷移)またはアクティビティによりトリガされる有限の数の状態をそれらの遂行中に使用し得る。グローバル例外ハンドラは、遂行エラーに遭遇したときのワークフローの挙動を決定したり、プロセスをデバッグしたりするのに特に適し得る。
【0040】
ワークフローがデザイナ110内で開発されると、ビジネスプロセスの遂行は、コンダクタ120によって調整され、デザイナ110内で開発されたワークフローを遂行する1または複数のロボット130を調整する。コンダクタ120の実施形態の商業的な一例は、UiPath Orchestrator(商標)である。コンダクタ120は、環境におけるリソースの生成、監視、および展開の管理を容易にする。コンダクタ120は、サードパーティのソリューションおよびアプリケーションとの統合ポイント、または統合ポイントの1つとして動作し得る。
【0041】
コンダクタ120は、全てのロボット130を管理し得、ロボット130を集中ポイントから接続して遂行する。管理され得るロボット130のタイプには、アテンディッドロボット132、アンアテンディッドロボット134、開発ロボット(アンアテンディッドロボット134と同様であるが、開発およびテストの目的で使用される)、および非生産ロボット(アテンディッドロボット132と同様であるが、開発およびテストの目的で使用される)が含まれるが、これらに限定されない。アテンディッドロボット132は、ユーザーイベントによってトリガされてもよいし、自動的に発生するようにスケジュールされてもよく、同じコンピューティングシステム上で人と並んで動作し得る。アテンディッドロボット132は、集中プロセスデプロイメントおよびロギング媒体のためのコンダクタ120とともに使用され得る。アテンディッドロボット132は、人のユーザーが様々なタスクを達成するのを支援してもよく、ユーザーイベントによってトリガされてもよい。いくつかの実施形態では、プロセスは、このタイプのロボット上でコンダクタ120から開始することができず、および/またはそれらはロックされた画面の下で実行することができない。特定の実施形態では、アテンディッドロボット132は、ロボットトレイからまたはコマンドプロンプトからのみ起動され得る。アテンディッドロボット132は、いくつかの実施形態では、人の監督下で動作することが好ましい。
【0042】
アンアテンディッドロボット134は、仮想環境または物理マシン上で無人で動作し、多くのプロセスを自動化することができる。アンアテンディッドロボット134は、リモート遂行、監視、スケジューリング、および作業キューのサポートの提供を担当し得る。全てのロボットタイプのためのデバッグは、いくつかの実施形態では、デザイナ110から実行され得る。アテンディッドロボットおよびアンアテンディッドロボットの両方は、メインフレーム、ウェブアプリケーション、VM、エンタープライズアプリケーション(例えば、SAP(登録商標)、SalesForce(登録商標)、Oracle(登録商標)などにより生成されたもの)、およびコンピューティングシステムアプリケーション(例えば、デスクトップおよびラップトップアプリケーション、モバイルデバイスアプリケーション、ウェアラブルコンピュータアプリケーションなど)を含むが、これらに限定されない様々なシステムおよびアプリケーションを自動化し得る。
【0043】
コンダクタ120は、プロビジョニング、展開、バージョニング、構成、キューイング、監視、ロギング、および/または相互接続性の提供を含むがこれらに限定されない様々な能力を有し得る。プロビジョニングは、ロボット130とコンダクタ120(例えば、ウェブアプリケーション)との間の接続を作成し、維持することを含み得る。展開は、遂行のために割り当てられたロボット130へのパッケージバージョンの正しい配信を保証することを含み得る。バージョニングは、いくつかの実施形態では、いくつかのプロセスまたは構成の固有のインスタンスの管理を含んでもよい。構成は、ロボット環境およびプロセス構成の維持および配信を含み得る。キューイングは、キューおよびキュー項目の管理を提供することを含み得る。監視は、ロボットの特定データを追跡し、ユーザーの権限を維持することを含み得る。ロギングは、データベース(例えば、SQLデータベース)および/または別のストレージメカニズム(例えば、大規模なデータセットを格納し、迅速にクエリを実行する能力を提供するElasticSearch(登録商標))へのログの保存およびインデックス作成を含み得る。コンダクタ120は、サードパーティのソリューションおよび/またはアプリケーションのための通信の集中点として操作することにより、相互接続性を提供し得る。
【0044】
ロボット130は、デザイナ110で構築されたワークフローを実行する遂行エージェントである。ロボット(複数可)130のいくつかの実施形態の1つの商業的な例は、UiPath Robots(商標)である。いくつかの実施形態では、ロボット130は、デフォルトで、Microsoft Windows(登録商標)Service Control Manager(SCM)管理サービスをインストールする。その結果、このようなロボット130は、ローカルシステムアカウントの下でインタラクティブなWindows(登録商標)セッションを開くことができ、Windows(登録商標)サービスの権利を有し得る。
【0045】
いくつかの実施形態では、ロボット130は、ユーザーモードで設置され得る。このようなロボット130については、所定のロボット130が設置されているユーザーと同じ権利を有することを意味する。この特色はまた、各マシンを最大限に全活用することを保証する高密度(HD)ロボットにも利用可能であり得る。いくつかの実施形態では、いずれかのタイプのロボット130は、HD環境で構成され得る。
【0046】
いくつかの実施形態におけるロボット130は、複数のコンポーネントに分割され、それぞれが特定の自動化タスクに特化されている。いくつかの実施形態におけるロボットコンポーネントは、SCM管理ロボットサービス、ユーザーモードロボットサービス、エグゼキュータ、エージェント、およびコマンドラインを含むが、これらに限定されない。SCM管理ロボットサービスは、Windows(登録商標)セッションを管理および監視し、コンダクタ120と遂行ホスト(すなわち、ロボット130が遂行されるコンピューティングシステム)との間のプロキシとして動作する。これらのサービスは、ロボット130の資格情報を任されて管理する。コンソールアプリケーションは、ローカルシステム下のSCMにより起動される。
【0047】
いくつかの実施形態におけるユーザーモードロボットサービスは、Windows(登録商標)セッションを管理および監視し、コンダクタ120と遂行ホストとの間のプロキシとして動作する。ユーザーモードロボットサービスは、ロボット130の資格情報を任されて管理し得る。SCM管理ロボットサービスがインストールされていない場合、Windows(登録商標)アプリケーションが自動的に起動され得る。
【0048】
エグゼキュータは、Windows(登録商標)セッションの下で与えられたジョブを遂行し得る(つまり、ワークフローを遂行し得る。エグゼキュータは、モニタ毎のドットパーインチ(DPI)設定を意識し得る。エージェントは、システムトレイウィンドウに利用可能なジョブを表示するWindows(登録商標) Presentation Foundation(WPF)アプリケーションであり得る。エージェントはサービスのクライアントであり得る。エージェントは、ジョブの開始または停止、設定の変更を依頼し得る。コマンドラインはサービスのクライアントである。コマンドラインは、ジョブの開始を要求し、その出力を待つことができるコンソールアプリケーションである。
【0049】
上で説明したように、ロボット130のコンポーネントが分割されていることは、開発者、サポートユーザー、およびコンピューティングシステムが、各コンポーネントが何を遂行しているかをより容易に実行し、特定し、および追跡するのに役立つ。この方法では、エグゼキュータとサービスに異なるファイアウォールルールを設定するなど、コンポーネントごとに特別な挙動を構成し得る。エグゼキュータは常に、いくつかの実施形態では、モニタごとのDPI設定を認識し得る。その結果、ワークフローは、ワークフローが作成されたコンピューティングシステムの構成に関係なく、いずれかのDPIで遂行し得る。また、いくつかの実施形態では、デザイナ110からのプロジェクトは、ブラウザのズームレベルに依存しないようにし得る。DPIを認識していないまたは意図的に認識していないとマークされているアプリケーションの場合、いくつかの実施形態ではDPIを無効にし得る。
【0050】
図2は、本発明の実施形態による、展開したRPAシステム200を示すアーキテクチャ図である。いくつかの実施形態では、RPAシステム200は、
図1のRPAシステム100であってもよく、またはその一部であってもよい。クライアント側、サーバー側、またはその両方が、本発明の範囲から逸脱することなく、いずれかの所望の数のコンピューティングシステムを含むことができることに留意すべきである。クライアント側では、ロボットアプリケーション210は、エグゼキュータ212、エージェント214、およびデザイナ216を含む。しかし、いくつかの実施形態では、デザイナ216は、コンピューティングシステム210上で実行されていなくてもよい。エグゼキュータ212はプロセスを実行している。
図2に示すように、複数のビジネスプロジェクトが同時に実行され得る。エージェント214(例えば、Windows(登録商標)サービス)は、本実施形態では、全てのエグゼキュータ212のための単一の接続ポイントである。この実施形態における全てのメッセージは、コンダクタ230に記録され、それは、データベースサーバー240、インデクササーバー250、またはその両方を介して、それらをさらに処理する。
図1に関して上述したように、エグゼキュータ212は、ロボットコンポーネントであり得る。
【0051】
いくつかの実施形態では、ロボットは、マシン名とユーザー名との間の関連付けを表す。ロボットは、複数のエグゼキュータを同時に管理し得る。同時に実行される複数の対話型セッションをサポートするコンピューティングシステム(Windows(登録商標)Server 2012など)では、複数のロボットが同時に実行され得、それぞれが一意のユーザー名を使用して別々のWindows(登録商標)セッションで実行され得る。これは、上記のHDロボットと呼ばれる。
【0052】
エージェント214はまた、ロボットの状態を送信し(例えば、ロボットがまだ機能していることを示す「ハートビート」メッセージを定期的に送信する)、遂行されるパッケージの要求されるバージョンをダウンロードすることにも責任を負う。エージェント214とコンダクタ230との間の通信は、いくつかの実施形態では、常にエージェント214によって開始される。通知シナリオでは、エージェント214は、後にコンダクタ230によってロボットにコマンド(例えば、開始、停止など)を送信するために使用されるWebSocketチャネルを開いてもよい。
【0053】
サーバー側には、プレゼンテーション層(ウェブアプリケーション232、オープンデータプロトコル(OData)代表状態転送(REST)アプリケーションプログラミングインターフェース(API)エンドポイント234、通知および監視236)、サービス層(API実装/ビジネスロジック238)、永続層(データベースサーバー240、インデクササーバー250)が含まれる。コンダクタ230は、ウェブアプリケーション232、OData REST APIエンドポイント234、通知および監視236、ならびにAPI実装/ビジネスロジック238を含む。いくつかの実施形態では、ユーザーがコンダクタ230のインターフェース(例えば、ブラウザ220を介して)で実行するほとんどのアクションは、様々なAPIを呼び出すことによって実行される。このような動作は、本発明の範囲を逸脱することなく、ロボット上でのジョブの起動、キュー内のデータの追加/削除、無人で実行するジョブのスケジューリングなどを含み得るが、これらに限定されない。ウェブアプリケーション232は、サーバープラットフォームのビジュアル層である。この実施形態では、ウェブアプリケーション232は、ハイパーテキストマークアップ言語(HTML)およびジャバスクリプト(JS)を使用する。しかし、本発明の範囲を逸脱することなく、いずれかの所望のマークアップ言語、スクリプト言語、または他のいずれかのフォーマットを使用し得る。ユーザーは、コンダクタ230を制御するための様々な動作を実行するために、本実施形態ではブラウザ220を介してウェブアプリケーション232からのウェブページと対話する。例えば、ユーザーは、ロボットグループを作成し、ロボットへのパッケージの割り当てを行い、ロボット毎および/またはプロセス毎のログを解析し、ロボットを起動しおよび停止などし得る。
【0054】
ウェブアプリケーション232に加えて、コンダクタ230は、OData REST APIエンドポイント234を公開するサービス層も含む。しかし、本発明の範囲を逸脱することなく、他のエンドポイントが含まれていてもよい。REST APIは、ウェブアプリケーション232とエージェント214の両方により消費される。エージェント214は、本実施形態では、クライアントコンピュータ上の1または複数のロボットのスーパーバイザである。
【0055】
本実施形態のREST APIは、構成、ロギング、監視、およびキューイング機能をカバーする。構成エンドポイントは、いくつかの実施形態では、アプリケーションのユーザー、権限、ロボット、アセット、リリース、および環境を定義し、構成するために使用されてもよい。ロギングRESTエンドポイントは、例えば、エラー、ロボットによって送信された明示的なメッセージ、およびその他の環境固有の情報など、様々な情報をログに記録するために使用され得る。デプロイメントRESTエンドポイントは、コンダクタ230においてジョブ開始コマンドが使用された場合に遂行されるべきパッケージのバージョンを問い合わせるためにロボットにより使用されてもよい。キューイングRESTエンドポイントは、キューへのデータの追加、キューからのトランザクションの取得、トランザクションのステータスの設定など、キューおよびキューアイテムの管理を担ってもよい。
【0056】
RESTエンドポイントの監視は、ウェブアプリケーション232およびエージェント214を監視してもよい。通知および監視API236は、エージェント214の登録、エージェント214への構成設定の配信、ならびにサーバーおよびエージェント214からの通知の送受信に使用されるRESTエンドポイントであってもよい。通知および監視API236は、いくつかの実施形態では、WebSocket通信を使用してもよい。
【0057】
永続層は、本実施形態では、一対のサーバー-データベースサーバー240(例えば、SQLサーバー)およびインデクササーバー250を含む。本実施形態におけるデータベースサーバー240は、ロボット、ロボットグループ、関連するプロセス、ユーザー、役割、スケジュールなどの構成を格納する。この情報は、いくつかの実施形態では、ウェブアプリケーション232を介して管理される。データベースサーバー240は、キューおよびキューアイテムを管理してもよい。いくつかの実施形態では、データベースサーバー240は、ロボットにより記録されたメッセージを(インデクササーバー250に加えて、またはそれに代えて)格納してもよい。
【0058】
いくつかの実施形態では任意であるが、インデクササーバー250は、ロボットにより記録された情報を保存し、インデックスを作成する。特定の実施形態では、インデクササーバー250は、構成設定を介して無効化されてもよい。いくつかの実施形態では、インデクササーバー250は、オープンソースプロジェクトの全文検索エンジンであるElasticSearch(登録商標)を使用する。ロボットにより記録されたメッセージ(例えば、ログメッセージまたはライン書き込みのようなアクティビティを使用して)は、ロギングRESTエンドポイント(複数可)を介してインデクササーバー250に送信されてもよく、そこで将来の利用のためにそれらはインデックス化される。
【0059】
図3は、本発明の実施形態による、デザイナ310、アクティビティ320、330、およびドライバ340の間の関係300を示すアーキテクチャ図である。以上のように、開発者は、デザイナ310を用いて、ロボットによって遂行されるワークフローを開発する。ワークフローは、ユーザー定義のアクティビティ320およびUIオートメーションアクティビティ330を含んでもよい。いくつかの実施形態では、画像中の非テキストの視覚的コンポーネントを特定することができ、これは、本明細書ではコンピュータビジョン(CV)と呼ばれる。このようなコンポーネントに関連するいくつかのCVアクティビティは、クリック、タイプ、テキストを取得、ホバー、要素の有無を検出、スコープの更新、ハイライトなどを含み得るが、これらに限定されない。いくつかの実施形態では、クリックは、例えば、CV、光学的文字認識(OCR)、ファジーテキストマッチング、およびマルチアンカーを使用して要素を特定し、それをクリックする。タイプは、上記および要素内のタイプを用いて要素を特定してもよい。テキストの取得は、特定のテキストの場所を特定し、OCRを使用してそれをスキャンし得る。ホバーは、要素を特定し、その上にホバーし得る。要素の有無の検出は、上述した技術を用いて、画面上に要素の有無を検出するかどうかを確認し得る。いくつかの実施形態では、デザイナ310に実装され得る数百または数千でさえのアクティビティが存在してもよい。しかし、本発明の範囲を逸脱することなく、いずれかの数および/またはアクティビティのタイプを利用することができる。
【0060】
UIオートメーションアクティビティ330は、低レベルのコード(例えば、CVアクティビティ)で記述され、UI層を介したアプリケーションとの対話を促進する特別な低レベルのアクティビティのサブセットである。特定の実施形態では、UIオートメーションアクティビティ300は、例えば、ウィンドウメッセージなどを介したユーザー入力をシミュレートしてもよい。UIオートメーションアクティビティ330は、ロボットが所望のソフトウェアと対話することを可能にするドライバ340を介して、これらの対話を促進する。例えば、ドライバ340は、OSドライバ342、ブラウザドライバ344、VMドライバ346、エンタープライズアプリケーションドライバ348などを含んでもよい。
【0061】
ドライバ340は、フックを探したり、キーを監視したりするなど、低レベルでOSと対話してもよい。それらは、Chrome(登録商標)、IE(登録商標)、Citrix(登録商標)、SAP(登録商標)などとの統合を促進してもよい。例えば、「クリック」アクティビティは、ドライバ340を介して、これらの異なるアプリケーションにおいて同じ役割を果たす。
【0062】
図4は、本発明の実施形態による、RPAシステム400を示すアーキテクチャ図である。いくつかの実施形態では、RPAシステム400は、
図1および/または
図2のRPAシステム100および/または200であってもよいし、それを含んでもよい。RPAシステム400は、ロボットを実行する複数のクライアントコンピューティングシステム410を含む。コンピューティングシステム410は、その上で実行されるウェブアプリケーションを介してコンダクタコンピューティングシステム420と通信することができる。コンダクタコンピューティングシステム420は、順番に、データベースサーバー430および任意のインデクササーバー440と通信することができる。
【0063】
図1および
図3に関して、これらの実施形態ではウェブアプリケーションが使用されているが、本発明の範囲から逸脱することなく、いずれかの適切なクライアントおよび/またはサーバーソフトウェアを使用することができることに留意すべきである。例えば、コンダクタは、クライアントコンピューティングシステム上で、非ウェブベースのクライアントソフトウェアアプリケーションと通信するサーバーサイドアプリケーションを実行してもよい。
【0064】
図5は、本発明の実施形態による、RPAロボットのためのインターセッションオートメーションを容易にするように構成されたコンピューティングシステム500を示すアーキテクチャ図である。いくつかの実施形態では、コンピューティングシステム500は、本明細書に描かれたおよび/または記載された1または複数のコンピューティングシステムであってもよい。コンピューティングシステム500は、情報を通信するためのバス505または他の通信機構と、情報を処理するためのバス505に結合されたプロセッサ(複数可)510とを含む。プロセッサ(複数可)510は、中央処理ユニット(CPU)、特定用途集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、グラフィックスプロセッシングユニット(GPU)、それらの複数のインスタンス、および/またはそれらのいずれかの組み合わせを含む、いずれかのタイプの一般的または特定用途向けプロセッサであり得る。プロセッサ(複数可)510はまた、複数の処理コアを有してもよく、コアの少なくとも一部は、特定の機能を実行するように構成され得る。いくつかの実施形態では、複数並列処理が使用されてもよい。特定の実施形態では、少なくとも1つのプロセッサ(複数可)510は、生物学的ニューロンを模倣する処理要素を含むニューロモーフィック回路であり得る。いくつかの実施形態では、ニューロモーフィック回路は、フォンノイマンコンピューティングアーキテクチャの典型的なコンポーネントを必要としない場合がある。
【0065】
コンピューティングシステム500は、プロセッサ(複数可)510によって遂行される情報および命令を格納するためのメモリ515をさらに含む。メモリ515は、ランダムアクセスメモリ(RAM)、読み出し専用メモリ(ROM)、フラッシュメモリ、キャッシュ、磁気ディスクもしくは光ディスクなどの静的記憶装置、または他のタイプの非一時的なコンピュータ読み取り可能な媒体、あるいはそれらのいずれかの組み合わせで構成され得る。非一時的なコンピュータ読み取り可能な媒体は、プロセッサ(複数可)510によりアクセス可能ないずれかの利用可能な媒体であってもよく、揮発性媒体、不揮発性媒体または両方などを含み得る。また、媒体は、取り外し可能なもの、取り外し不可能なもの、または両方であってもよい。
【0066】
さらに、コンピューティングシステム500は、無線および/または有線接続を介して通信ネットワークへのアクセスを提供するために、トランシーバなどの通信デバイス520を含む。いくつかの実施形態では、通信デバイス520は、周波数分割多元接続(FDMA)、シングルキャリアFDMA(SC-FDMA)、時分割多元接続(TDMA)、符号分割多元接続(CDMA)、直交周波数分割多重方式(OFDM)、直交周波数分割多元接続(OFDMA)、移動体用グローバルシステム(GSM:Global System for Mobile)通信、汎用パケット無線サービス(GPRS:General Packet Radio Service)、ユニバーサル移動体通信システム(UMTS:Universal Mobile Telecommunications System)、cdma2000、広帯域CDMA(W-CDMA:Wideband CDMA)、高速ダウンリンクパケットアクセス(HSDPA:High-Speed Downlink Packet Access)、高速アップリンクパケットアクセス(HSUPA:High-Speed Uplink Packet Access)、高速パケットアクセス(HSPA:High-Speed Packet Access)、ロングタームエボリューション(LTE:Long Term Evolution)、LTEアドバンスト(LTE-A:LTE Advanced)、802.11x、Wi-Fi、Zigbee、超広帯域無線(UWB:Ultra-WideBand)、802.16x、802.15、Home Node-B(HnB)、Bluetooth、無線IDタグ(RFID:Radio Frequency Identification)、IrDA(Infrared Data Association)、近距離無線通信(NFC:Near-Field Communications)、第5世代(5G)、New Radio(NR)、それらのいずれかの組み合わせ、および/または本発明の範囲から逸脱することなく、いずれかの他の現在存在するまたは将来実装される通信標準および/またはプロトコルを使用するように構成され得る。いくつかの実施形態では、通信デバイス520は、本発明の範囲から逸脱することなく、単数のアンテナ、アレイ状のアンテナ、フェーズドアンテナ、スイッチドアンテナ、ビームフォーミングアンテナ、ビームステアリングアンテナ、それらの組み合わせ、および/またはいずれかの他のアンテナ構成である1または複数のアンテナを含み得る。
【0067】
プロセッサ(複数可)510は、バス505を介して、プラズマディスプレイ、液晶ディスプレイ(LCD)、発光ダイオード(LED)ディスプレイ、電界放出ディスプレイ(FED)、有機発光ダイオード(OLED)ディスプレイ、フレキシブルOLEDディスプレイ、フレキシブル基板ディスプレイ、プロジェクションディスプレイ、4Kディスプレイ、高精細ディスプレイ、Retina(登録商標)ディスプレイ、IPS(In-Plane Switching)ディスプレイ、またはユーザーに情報を表示するためのいずれかの他の適切なディスプレイなどのディスプレイ525にさらに結合されている。ディスプレイ525は、抵抗方式、静電容量方式、表面弾性波(SAW)静電容量方式、赤外線方式、光学イメージング方式、分散信号方式、音響パルス認識方式、フラストレート全内部反射方式などを用いて、タッチ(ハプティック)ディスプレイ、3次元(3D)タッチディスプレイ、マルチ入力タッチディスプレイ、マルチタッチディスプレイなどとして構成されていてもよい。本発明の範囲を逸脱することなく、いずれかの好適な表示デバイスおよびハプティックI/Oを使用することができる。
【0068】
コンピュータマウス、タッチパッドなどのようなキーボード530およびカーソル制御デバイス535は、ユーザーがコンピューティングシステム500とインターフェースすることを可能にするために、バス505にさらに結合されている。しかしながら、特定の実施形態では、物理的なキーボードおよびマウスが存在しない場合があり、ユーザーは、ディスプレイ525および/またはタッチパッド(図示せず)のみを介してデバイスと対話することができる。任意の入力デバイスの種類および組み合わせは、設計の選択の問題として使用され得る。特定の実施形態では、物理的な入力デバイスおよび/またはディスプレイは存在しない。例えば、ユーザーは、コンピューティングシステム500と通信している別のコンピューティングシステムを介してリモートでコンピューティングシステム500と対話してもよいし、コンピューティングシステム500は自律的に動作してもよい。
【0069】
メモリ515は、プロセッサ(複数可)510により遂行されたときに機能を提供するソフトウェアモジュールを格納する。モジュールは、コンピューティングシステム500のためのオペレーティングシステム540を含む。モジュールはさらに、本明細書に記載されたプロセスの全部もしくは一部またはその派生物を実行するように構成されたインターセッションオートメーションモジュール545を含む。コンピューティングシステム500は、付加的な機能を含む1または複数の付加的な機能モジュール550を含み得る。
【0070】
当業者であれば、「システム」は、本発明の範囲から逸脱することなく、サーバー、組み込みコンピューティングシステム、パーソナルコンピュータ、コンソール、パーソナルデジタルアシスタント(PDA)、携帯電話、タブレットコンピューティングデバイス、量子コンピューティングシステム、または他のいずれかの適切なコンピューティングデバイス、またはデバイスの組み合わせとして具現化され得ることを理解するであろう。上述した機能を「システム」により実行されるものとして提示することは、何ら本発明の範囲を限定することを意図するものではなく、本発明の多くの実施形態の一例を提供することを意図するものである。実際、本明細書に開示された方法、システム、および装置は、クラウドコンピューティングシステムを含むコンピューティング技術と整合性のあるローカライズされた形態および分配された形態で実装されてもよい。
【0071】
本明細書で説明するシステム特色のいくつかは、実装の独立性をより強調するために、モジュールとして提示されていることに留意すべきである。例えば、モジュールは、カスタムの非常に大規模な集積(VLSI)回路またはゲートアレイ、ロジックチップ、トランジスタ、または他の個別部品のような既製の半導体を含むハードウェア回路として実装され得る。また、モジュールは、フィールドプログラマブルゲートアレイ、プログラマブルアレイロジック、プログラマブルロジックデバイス、グラフィックス処理ユニットなどのプログラマブルハードウェアデバイスに実装され得る。
【0072】
モジュールはまた、様々なタイプのプロセッサにより遂行されるためのソフトウェアに少なくとも部分的に実装され得る。例えば、遂行可能コードの特定された単位は、例えば、オブジェクト、プロシージャ、または関数として編成されていてもよいコンピュータ命令の1または複数の物理的または論理的なブロックを含み得る。それにもかかわらず、遂行可能な特定されたモジュールは、物理的に一緒に配置されている必要はなく、論理的に結合されたときにモジュールを含み、モジュールのために述べられた目的を達成するために、異なる場所に格納された別々の命令を含んでいてもよい。さらに、モジュールは、例えば、ハードディスクドライブ、フラッシュデバイス、RAM、テープのようなコンピュータ読み取り可能な媒体、および/または本発明の範囲から逸脱することなくデータを格納するために使用される他のいずれかの非一時的なコンピュータ読み取り可能な媒体に格納されていてもよい。
【0073】
実際、遂行可能コードのモジュールは、単一の命令であってもよいし、多数の命令であってもよいし、さらには、複数の異なるコードセグメント、異なるプログラム間、および複数のメモリデバイス間に分散されていてもよい。同様に、動作データは、モジュール内で特定され、ここで示されてもよく、いずれかの適切なタイプのデータ構造体内でいずれかの適切な形態で具現化され、組織化され得る。動作データは、単一のデータセットとして収集されてもよいし、または異なる記憶デバイスにわたり異なる場所に分散されていてもよく、少なくとも部分的には、単にシステムまたはネットワーク上の電子信号として存在していてもよい。
【0074】
上記のように、アテンディッドオートメーションでは、ロボットは同じコンピューティングシステム上でユーザーと一緒に作業する。RPAにおけるロボットは、しばしば同様の方法(例えば、マウスクリックおよびキー押下イベントを生成し、APIを介してこれらのイベントをシミュレートする(例えば、ウィンドウメッセージを用いる)等)でコンピューティングシステムとインタラクションするので、いくつかの実施形態は、1または複数のロボットセッションを作成して、そこでアテンディッドオートメーションをホストおよび実行する。既存のRPAシステムとは異なり、ユーザーは、ロボット(複数可)がロボットセッション(複数可)においてアテンディッドオートメーションを実行している間、彼らのコンピューティングシステムとインタラクションする機能から利益を得ることができる。ユーザーは、ロボットが行っていることを引き続き監視し、同じ実施形態のロボットセッション(複数可)のためのホストオートメーションウィンドウ(複数可)を通じてロボットとインタラクションし得る。これにより、RPAロボットは、単に人ユーザーよりもより速くより確実にタスクを実行することから、ユーザーと並行して作業を実行できる真のデジタルアシスタントなることへと効果的に進化し、さらに大きな生産性向上を提供することができる。いくつかの実施形態では、ユーザーおよびロボットセッション(複数可)は、ユーザーのコンピューティングシステムによって制御されるリモートマシン上で実行していてもよい。
【0075】
特定の実施形態では、RPAロボットは、ユーザーのコンピューティングシステム上で実行することができ、リモートランタイムを介して(例えば、UiPath Remote Runtime(商標)を介して)リモートコンピューティングシステムを駆動することができる。UiPath Remote Runtime(商標)は、Citrix Virtual Apps and Desktops(商標)などのリモートアプリケーションまたはデスクトップと、専用のUiPath(登録商標)拡張機能(例えば、Citrix(登録商標)のためのUiPath(登録商標)拡張機能またはWindows(登録商標)リモートデスクトップのためのUiPath(登録商標)拡張機能)との間の通信を容易にするコンポーネントである。UiPath Remote Runtime(商標)は、リモートアプリケーションのターゲットとなるUI要素に関する情報を収集し、この情報を対応する拡張機能に送信して、UI Explorer(商標)でセレクタがネイティブに生成されるようにする。特定の実施形態では、ロボットは、クライアントアプリケーションをマシンに「仮想的に配信」するマイクロソフトのAppV技術を使用し得る。
【0076】
前述したとおり、いくつかの実施形態では、ユーザーおよびロボットは両方とも、同じアプリケーションインスタンスおよびファイルシステムとインタラクションしている。
図6は、本発明の実施形態による、ユーザーセッション610におけるユーザーによってアクセスされるユーザーコンピューティングシステム600のいくつかのアプリケーションおよびファイルシステム660と、ロボットセッション620におけるRPAロボットとを示す。
図6から分かるように、ウェブブラウザアプリケーション630、スプレッドシートアプリケーション640、および電子メールアプリケーション650は、ユーザーセッション610およびアテンディッドオートメーションロボットセッション620の両方によってアクセス可能である。ユーザーセッション610およびアテンディッドオートメーションロボットセッション620は、ウェブブラウザアプリケーション630および電子メールアプリケーション650と同時にインタラクションすることができる。
【0077】
しかし、ロボットがExcel(登録商標)スプレッドシートアプリケーション640の同じファイルとインタラクションしている場合、ユーザーはこのアプリケーションとインタラクションできない(例えば、ユーザーは「読み取り専用」ビューしか開けない場合がある、またはユーザーはファイル全体を開くことができない場合がある)。しかし、自動化がOffice 365 APIを使用して、例えばユーザーのOneDrive(登録商標)にホストされているスプレッドシートを使用し、ユーザーがウェブインターフェースを介してスプレッドシートにアクセスしている場合は、そのような制限は存在し得ない。例えば、Google Sheets(登録商標)は完全にウェブ配信されており、同時アクセスをサポートしている。ユーザーは、スプレッドシートアプリケーション640がロックされていること、別の「ユーザー」(つまり、ロボット)によってアクセスされていることなどを示すメッセージを受信し得る。ユーザーセッション610およびアテンディッドオートメーションロボットセッション620の両方は、ファイルシステム660とインタラクションすることも可能である。したがって、ロボットとユーザーがそれらのそれぞれのセッションを介してアプリケーションで行った変更は、ユーザーとロボットがそれぞれ別のバージョンのアプリケーションおよびファイルシステムで作業するのではなく、1人のユーザーがそれらを行ったかのように行われよう。
【0078】
図7A~
図7Jは、本発明の実施形態による、クライアントセッションにおける実行中のRPAロボット、およびユーザーセッションロボットまたはユーザーセッションで実行中の別のアプリケーションまたはプロセスを使用して、ユーザーセッションでフォームを完成させる例を示すスクリーンショットである。
図7Aでは、ユーザーセッションウィンドウ700が示され、ユーザーはUIのアプリケーションとインタラクションすることができ、ロボットは現在遂行していない。ユーザーセッションウィンドウ700の右下部分には、ロボットトレイアイコン710が表示されている。
【0079】
図7Bにおいて、ユーザーは、ウェブブラウザを起動し、インボイス作成ウェブページ720を訪問する。
図7Cにおいて、ユーザーは、(例えば、ロボットトレイアイコン710をクリックすることによって)ロボットトレイ712を引き上げ、ユーザーセッションにおいて彼または彼女のコンピューティングシステム上で遂行するために、ユーザーセッションロボットオプション714を選択する。ユーザーセッションロボットオプション714を選択した後、ユーザーセッションロボットウィンドウ730が表示される。
図7Dを参照。本実施形態では、ユーザーセッションロボットは、ステータスメッセージのみを表示する。しかし、ユーザーセッションロボットは、本発明の範囲から逸脱することなく、任意の所望のワークフロー機能を有し得る。いくつかの実施形態では、ユーザーセッションロボットは、クライアントセッションロボットを自動的に起動し、またはユーザーセッションロボットを実行するオプションを選択すると、それぞれのセッションで両方のロボットを自動的に起動する。
【0080】
ある実施形態では、ユーザーセッションロボットのためのウィンドウは表示されず、バックグラウンドで実行され得る。特定の実施形態では、別のアプリケーションまたはプロセスが、ユーザーセッションロボットの機能を実行する。この機能は、1または複数のクライアントセッションロボットとの通信、クライアントセッションロボット(複数可)によって提供されるデータの取得、取得した情報を入力するためにユーザーセッションで実行しているアプリケーションとのインタラクションを含み得るが、これらに限定されない。いくつかの実施形態では、ユーザーセッションロボット、別のアプリケーション、または別のプロセスを使用するのではなく、クライアントセッションロボットによって取得された情報が入力されるべきアプリケーションが、そのアプリケーション自体によって入力される。これは、いくつかの実施形態では、マウスのクリック、キーの押下などをシミュレートすることなく行われ得る。
【0081】
図7Eにおいて、ユーザーはロボットトレイ712を引き上げ、クライアントセッションロボットオプション716を選択して、クライアントセッションで彼または彼女のコンピューティングシステム上で遂行する。
図7Fに示すように、クライアントセッションロボットオプション716を選択した後、ロボットセッションのためのクライアントセッションウィンドウ740が画面上に子ウィンドウとして表示される。しかし、いくつかの実施形態では、クライアントセッションウィンドウ740は表示されず、クライアントセッションロボットは、ユーザーに見えることなくクライアントセッションで実行する。この実施形態では、クライアントセッションロボットのためのクライアントセッションウィンドウ742は、クライアントセッションウィンドウ740内で自動的に起動し、ユーザーセッション内のウェブページ720のフォームデータをフェッチするためのボタン744を含む。
【0082】
いくつかの実施形態では、ロボットセッションウィンドウは表示されず、クライアントセッションロボットは、ユーザーに見えることなく自動的に起動、動作、および閉じ得る。特定の実施形態では、クライアントセッションロボットは、そのワークフローを完了した後、そのセッションを閉じ得る。いくつかの実施形態では、ロボットトレイから起動するのではなく、クライアントセッションが開始され、ロボットトレイ712を使用せずに(例えば、ユーザーがメインセッションのアプリケーションでボタンをクリックすることに起因して)クライアントセッションロボットが起動し、動作し得る。
【0083】
図7Gに目を向けると、ユーザーがボタン744をクリックした後、クライアントセッションロボットは、ウェブページ720のためのフォームデータのフェッチを開始する。クライアントセッションロボットによってフェッチされたデータは、IPCを介してユーザーセッションロボットに提供されてもよく、スプレッドシート、オブジェクト指向データベース、プレーンテキストファイルなどに格納されてもよく、またはさもなくばユーザーセッションロボットに通信されるか、もしくは利用可能にされ得る。クライアントセッションロボットがそのワークフローを完了した後、メッセージがクライアントセッションロボットウィンドウ742に表示される。
図7Hを参照。次に、ユーザーセッションロボットは、クライアントセッションロボットによってフェッチされたフォームデータの使用を開始して、ウェブページ720のフィールドに入力する。ユーザーセッションロボットによって入力されたテキストは、ウェブページ720が別のウィンドウによって覆われていないか、または最小化されていないときに、ユーザーに視認可能である。ユーザーセッションロボットがフォームを完成させている間、ユーザーは他のアプリケーションとインタラクションすることができ、生産性を継続し得る。
【0084】
図7Iに目を向けると、背景に見られるように、ユーザーセッションロボットは、ウェブページ720のフォームフィールドを完成させた。その後、ユーザーは、クライアントセッションウィンドウ740およびユーザーセッションロボットウィンドウ730を閉じてよく、ユーザーセッションロボットまたはクライアントセッションロボットは、クライアントセッションを自動的に閉じてよく、あるいはクライアントセッションウィンドウ740は開いたままであってよい。次いで、ユーザーは、完成したフォームを送信してもよい。
図7Jを参照。
【0085】
図8は、本発明の実施形態による、インターセッションオートメーションのためのプロセス800を示すフローチャートである。プロセスは、810でユーザーセッションウィンドウを起動することから始まる。これは、例えば、ユーザーのコンピューティングシステム上で実行しているオペレーティングシステムに関連するメインウィンドウであってよい。次に、ユーザーセッションプロセス(例えば、RPAロボット、アプリケーション、別のプロセスなど)が、820においてユーザーセッション内で開始される。クライアントセッションが830で起動され、クライアントセッションロボットが840でクライアントセッションにおいて起動される。いくつかの実施形態では、クライアントセッションは、例えば、クライアントセッションロボットが開始されることまたはそうでなければ起動されることに応答して起動され得る。その後、クライアントセッションロボットは、850においてそのワークフローを遂行する。クライアントセッションロボットによって取得されたデータおよび/または実行されたアクションは、いくつかの実施形態におけるユーザーセッションプロセスに提供されまたは利用可能にされ得る。次に、ユーザーセッションプロセスは、860でクライアントセッションロボットによって生成されたデータにアクセスし、870でそのデータに基づいて適切なアプリケーション(複数可)(例えば、ウェブページ、スプレッドシート、ERPアプリケーション、販売アプリケーションなど)とインタラクションする。いくつかの実施形態では、インタラクションされるアプリケーション(複数可)は、ユーザーセッションプロセス自体であってもよい。クライアントセッションロボットがその遂行を完了した後、クライアントセッションは、いくつかの実施形態において、880で自動的に終了されてもよい。
【0086】
いくつかの実施形態では、クライアントセッションは、オペレーティングシステムの子セッションAPIを介して作成され得る。Windows(登録商標)Terminal Services Child Sessionsまたはオペレーティングシステムによって提供される他の子セッションAPIは、本発明の範囲から逸脱することなく、第2セッションを作成するためにいくつかの実施形態で使用され得る。ロボットトレイアプリケーション(例えば、UiPath(登録商標) Robot Agent Desktop)またはロボット(複数可)を起動するように構成された別のアプリケーションは、次に、適切な引数でオペレーティングシステムのプロセス作成APIを使用して、その子セッションでロボットプロセスを開始し得る。ロボットトレイアプリケーションまたは他の適切なアプリケーションは、その後、適切なプロトコル(例えば、名前付きパイプ上に構築されたもの)を使用してクライアントロボットプロセスと通信し得る。
【0087】
2つのセッション間のクライアントロボットとの通信は、いくつかの実施形態におけるIPCプロトコルを使用して達成され得る。これらのプロトコルは、ネットワーク、パイプ、コンポーネントオブジェクトモデル(COM)、リモートプロシージャコール(RPC)、ソケットなどを介して通信を容易化してもよい。適切なセッション作成メカニズムおよびIPCプロトコルは、サポートされている場合、他のオペレーティングシステムにも同様に使用され得る。ユーザーがロボットトレイ上のボタンをクリックするか、または別のアプリケーションにそのような機能を開始させる(例えば、ボタンをクリックすることによって)と、ロボットトレイアプリケーションまたは他の適切なアプリケーションは、IPCプロトコルを使用してクライアントセッションロボットプロセスにそのコマンドを送信し得る。クライアントセッションロボットは、同様にIPCプロトコルを介してロボットトレイアプリケーションまたは他の適切なプロセスにステータス通知(例えば、ロボットが起動中であること、実行中であること、一時停止中であることなどを示す)を送り返すことができる。
【0088】
図9は、本発明の実施形態による、一方のロボットがユーザーセッションで実行し、他方のロボットがクライアントセッションで実行するインターセッションオートメーションのプロセス900を示すフローチャートである。プロセスは、910でユーザーセッションロボットのワークフローの遂行を開始することから始まる。ユーザーセッションロボットが、920でクライアントロボットに遂行を求めるそのワークフロー内のアクティビティに到達すると、ユーザーセッションロボットは、930でクライアントセッションロボットにそのワークフローを実行させ、その完了を待機する。
【0089】
クライアントセッションロボットは、940でそのワークフローを完了し、ユーザーセッションロボットに通知する。次に、ユーザーセッションロボットは、950においてユーザーセッションロボットワークフローの残りを完了するためにクライアントセッションロボット遂行の結果を使用する。いくつかの実施形態では、ユーザーセッションロボットおよびクライアントセッションロボットは、まとめて単一の論理ワークフローを完了する。
【0090】
特定の実施形態では、複数のクライアントセッションロボットが使用されてもよく、潜在的に、異なるクライアントセッションにおける少なくともいくつかのクライアントセッションロボットを有する。これにより、ユーザーセッションロボットは、完了させるためにワークフローアクティビティの一部をクライアントセッションロボットに渡し得る。
図10は、本発明の実施形態による、ワークフローの一部がユーザーセッションロボットによって完了され、ワークフローの他の部分がクライアントセッションロボットによって完了されるシナリオ1000を示す。ユーザーセッション1010は、ユーザーセッションロボット1012およびアプリケーション1014を含む。第1クライアントセッション1020はクライアントセッションロボット1022を含み、第2クライアントセッション1030は2つのクライアントセッションロボット1032、1034を含み、第3クライアントセッション1040はクライアントセッションロボット1042を含む。ユーザーセッションロボット1012は、例えば、IPCを介してクライアントセッションロボット1022、1032、1034、1042と通信し、その動作を制御し得る。いくつかの実施形態では、クライアントセッションロボット(複数可)がそれらそれぞれのワークフローを完了する間、ユーザーセッションロボットはそのワークフローの遂行を継続することに留意されたい。
【0091】
図11は、本発明の実施形態による、ユーザーセッションロボットU1と一対のクライアントセッションロボットC1およびC2との間のマルチロボット集団ワークフローの遂行を示すフロー
図1100である。C1およびC2は、同じクライアントセッションに存在してもよいし、異なるクライアントセッションに存在してもよい。U1は、そのワークフローの遂行を開始し、C1がワークフローを完了することを求めるアクティビティに到達する。U1は、C1にそのワークフローを遂行させ、呼び出し元のアクティビティは待機する。この間、U1は、いくつかの実施形態における他のタスクを実行し得る。
【0092】
C1がそのワークフローを完了すると、U1は、C2にワークフローの完了を要求するアクティビティにそれが到達するまで遂行を再開する。U1は、C2にそのワークフローを遂行させ、呼び出し元のアクティビティは待機する。もう一度、U1は、いくつかの実施形態におけるC2を待っている間に他のタスクを実行し得る。
【0093】
C2がそのワークフローを完了すると、U1は、C1にワークフローの完了をもう一度要求するアクティビティにそれが到達するまで遂行を再開する。これは、以前に遂行されたのと同じワークフローアクティビティであっても、異なるワークフローまたはアクティビティのセットであってもよい。U1は、C1にそのワークフローを遂行させ、呼び出し元のアクティビティは待機する。もう一度、U1は、いくつかの実施形態におけるC1を待っている間に他のタスクを実行し得る。C1のそのワークフローが終了した後、U1のワークフローが終了するまで、U1の遂行を再開する。
【0094】
図8、
図9および
図11で実行されるプロセスステップは、本発明の実施形態に従って、
図8、
図9および
図11で説明したプロセス(複数可)の少なくとも一部を実行するようにプロセッサ(複数可)への命令をエンコードするコンピュータプログラムによって実行されてもよい。コンピュータプログラムは、非一時的なコンピュータ読み取り可能な媒体に格納されていてもよい。コンピュータ読み取り可能な媒体は、ハードディスクドライブ、フラッシュデバイス、RAM、テープ、および/またはデータを格納するために使用される他のそのような媒体または媒体の組み合わせであってもよいが、これらに限定されるものではない。コンピュータプログラムは、
図8、
図9および
図11に記載されたプロセスステップの全部または一部を実装するために、コンピューティングシステム(例えば、
図5のコンピューティングシステム500のプロセッサ(複数可)510)のプロセッサ(複数可)を制御するためのコード化された命令を含んでもよく、これはまた、コンピュータ読み取り可能な媒体に格納されてもよい。
【0095】
コンピュータプログラムは、ハードウェア、ソフトウェア、またはハイブリッド実装で実装され得る。コンピュータプログラムは、互いに動作可能な通信を行うモジュールで構成され得、情報または指示をディスプレイに送るように設計されている。コンピュータプログラムは、汎用コンピュータ、ASIC、またはいずれかの他の好適なデバイスで動作するように構成され得る。
【0096】
本発明の様々な実施形態のコンポーネントは、本明細書に一般的に記載され、図示されているように、様々な異なる構成で配置され、設計されてもよいことが、容易に理解されるであろう。したがって、添付の図に表されるような本発明の実施形態の詳細な説明は、特許請求されるような本発明の範囲を限定することを意図するものではなく、本発明の選択された実施形態を代表するものにすぎない。
【0097】
本明細書を通して記載された本発明の特色、構造、または特徴は、1または複数の実施形態では、いずれかの好適な方法で組み合わせられ得る。例えば、本明細書全体を通して「特定の実施形態」、「いくつかの実施形態」、または類似の言語を参照することは、実施形態に関連して記載された特定の特色、構造、または特徴が、本発明の少なくとも1つの実施形態に含まれていることを意味する。したがって、本明細書全体を通して「特定の実施形態では」、「いくつかの実施形態では」、「他の実施形態では」、または類似の言語の出現は、必ずしも全ての実施形態の同じグループを指すものではなく、記載された特色、構造、または特徴は、1または複数の実施形態ではいずれかの好適な方法で組み合わせられ得る。
【0098】
本明細書全体を通して特色、利点、または類似の言語への参照は、本発明で実現され得る特色および利点の全てが、本発明のいずれかの単一の実施形態にあるべきであること、または本発明のいずれかの実施形態にあることを意味するものではないことに留意すべきである。むしろ、特色および利点に言及する言語は、実施形態に関連して記載された特定の特色、利点、または特徴が、本発明の少なくとも1つの実施形態に含まれることを意味すると理解される。したがって、本明細書全体での特色および利点の議論、ならびに類似の言語は、同じ実施形態を参照することができるが、必ずしもその必要性はない。
【0099】
さらに、本発明の記載された特色、利点、および特徴は、1または複数の実施形態では、いずれかの好適な方法で組み合わせることができる。関連する技術の当業者は、本発明が、1または複数の特定の実施形態の特定の特徴または利点なしに実施され得ることを認識するであろう。他の例では、追加の特徴および利点は、本発明の全ての実施形態には存在しないかもしれない特定の実施形態では認識され得る。
【0100】
本分野における通常の技術を有する者は、上述したような本発明を、異なる順序でのステップを用いて、および/または開示されているものとは異なる構成のハードウェア要素を用いて実施することができることを容易に理解するであろう。したがって、本発明は、これらの好ましい実施形態に基づいて説明されてきたが、本発明の精神および範囲内にとどまりながら、特定の変更、変形、および代替的な構成が明らかになることは、当業者には明らかであろう。したがって、本発明の範囲を決定するためには、添付の特許請求の範囲を参照すべきである。
【国際調査報告】