特表2024-528527 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ユニベルシテ　ドゥ　カーン　ノルマンディの特許一覧 ▶ セントル・ナショナル・ドゥ・ラ・ルシェルシュ・サイエンティフィーク・セエヌアールエスの特許一覧 ▶ エコールナシオナルシュペリウールダンジェニユールドゥカーンの特許一覧

特表2024-528527自律システムを動作させるためのシステム及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-07-30

(54)【発明の名称】自律システムを動作させるためのシステム及び方法

(51)【国際特許分類】

G06F 9/50 20060101AFI20240723BHJP

G06F 11/30 20060101ALI20240723BHJP

G06F 9/44 20180101ALI20240723BHJP

【ＦＩ】

G06F9/50 120B

G06F11/30 158

G06F9/44

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023580581

(86)(22)【出願日】2022-06-28

(85)【翻訳文提出日】2023-12-27

(86)【国際出願番号】 IB2022056023

(87)【国際公開番号】W WO2023275765

(87)【国際公開日】2023-01-05

(31)【優先権主張番号】21305893.6

(32)【優先日】2021-06-29

(33)【優先権主張国・地域又は機関】EP

(31)【優先権主張番号】21305894.4

(32)【優先日】2021-06-29

(33)【優先権主張国・地域又は機関】EP

(31)【優先権主張番号】21305895.1

(32)【優先日】2021-06-29

(33)【優先権主張国・地域又は機関】EP

(31)【優先権主張番号】21305896.9

(32)【優先日】2021-06-29

(33)【優先権主張国・地域又は機関】EP

(81)【指定国・地域】

(71)【出願人】

【識別番号】515334773

【氏名又は名称】ユニベルシテドゥカーンノルマンディ

(71)【出願人】

【識別番号】506310061

【氏名又は名称】セントル・ナショナル・ドゥ・ラ・ルシェルシュ・サイエンティフィーク・セエヌアールエス

【氏名又は名称原語表記】ＣＥＮＴＲＥＮＡＴＩＯＮＡＬＤＥＬＡＲＥＣＨＥＲＣＨＥＳＣＩＥＮＴＩＦＩＱＵＥＣＮＲＳ

(71)【出願人】

【識別番号】521366931

【氏名又は名称】エコールナシオナルシュペリウールダンジェニユールドゥカーン

【氏名又は名称原語表記】ＥＣＯＬＥＮＡＴＩＯＮＡＬＥＳＵＰＥＲＩＥＵＲＥＤ’ＩＮＧＥＮＩＥＵＲＳＤＥＣＡＥＮ

(74)【代理人】

【識別番号】110002066

【氏名又は名称】弁理士法人筒井国際特許事務所

(72)【発明者】

【氏名】ムアディブ，アブデル－イラーフ

(72)【発明者】

【氏名】ジャンピエール，ローラン

【テーマコード（参考）】

5B042

5B376

【Ｆターム（参考）】

5B042JJ17

5B376AA32

5B376BC31

(57)【要約】

自律システムによるアクションストラテジの実行を管理するためのシステム及び方法が開示される。アクションストラテジは、対応するアクティブオブジェクティブを遂行するために自律システムによって実施される一連のアクションを含む。本方法は、自律システムのプロセッサによって、自律システムによって遂行されるアクティブオブジェクティブを識別することを含み、アクティブオブジェクティブは、対応するアクティブオブジェクティブを遂行するために実施されるアクションの階層を記述する。本方法は、プロセッサによって、アクティブオブジェクティブのアクションの階層からアクションストラテジを生成することであって、アクションストラテジのアクションは、アクティブオブジェクティブのアクションの階層のアクションに対応する、生成することと、アクションストラテジを実行することと、を含む。アクションの実行が完了すると、プロセッサは、アクションストラテジの完了の状態に関する情報を含むデータを提供する。
【選択図】図２

【特許請求の範囲】

【請求項1】

自律システムによるアクションストラテジの実行を管理するためのコンピュータ実装方法であって、前記自律システムは、所定の状態変数を検知するように構成された１つ以上の検知デバイスを備え、前記状態変数は、前記自律システムの状態を記述し、前記アクションストラテジの各アクションは、前記自律システムの状態と、前記アクションストラテジを実施するために前記自律システムによって必要とされるリソースと、に関連付けられ、
前記方法は、
前記自律システムのプロセッサによって、前記自律システムによって遂行されるアクティブオブジェクティブを識別することであって、前記アクティブオブジェクティブは、前記対応するアクティブオブジェクティブを遂行するために実施されるアクションの階層を記述する漸進的タスクユニット構造に関連付けられ、前記漸進的タスクユニット構造は、前記対応するアクティブオブジェクティブを遂行するための異なる方式を記述し、前記対応するアクティブオブジェクティブを遂行するために前記自律システムによって実行されるように構成された実行可能モジュールを含み、アクションの前記階層は、アクションを実施する際に検出されている前記自律システムの所与の障害状態に応答して実施されるリソース制限付きアクションを含む、識別することと、
前記プロセッサによって、アクションの前記階層からアクションストラテジを生成することであって、前記アクションストラテジの前記アクションは、前記アクティブオブジェクティブのアクションの前記階層の前記アクションに対応する、生成することと、
前記アクションストラテジを実行することと、を含み、前記実行は、
前記自律システムによって、前記アクションストラテジの一連のアクションを実行することであって、アクションの実行は、前記自律システムが障害状態にあるという判定が行われた場合、対応するリソース制限付きアクションを前記自律システムによって実行して前記障害状態から回復することができるように、前記自律システムの現在の状態によって条件付けられている、実行することと、
前記アクションストラテジのアクションの実行の完了時に、前記アクションストラテジの完了の状態及び前記アクションの結果に関する情報を含むデータを提供することと、を含む、
方法。

【請求項2】

前記自律システムの前記プロセッサによって、前記アクティブオブジェクティブを受信することは、複数のアクティブオブジェクティブを受信することを含み、各アクティブオブジェクティブは、優先度関数に関連付けられ、前記優先度関数は、前記対応するアクティブオブジェクティブの優先度の相対的レベルを示す、
請求項１に記載の方法。

【請求項3】

前記アクションストラテジの前記完了の状態に関する情報を含むデータを提供することは、現在のアクティブオブジェクティブの前記優先度関数を提供することを含む、
請求項２に記載の方法。

【請求項4】

前記複数のアクティブオブジェクティブに対応する複数のアクションストラテジの実行の順序は、前記１つ以上のアクティブオブジェクティブの前記優先度関数に基づいている、
請求項２又は３に記載の方法。

【請求項5】

前記プロセッサは、前記複数のアクティブオブジェクティブのうちの第２のアクティブオブジェクティブを受信する前に、前記複数のアクティブオブジェクティブのうちの第１のアクティブオブジェクティブを受信し、前記方法は、
前記第２のアクティブオブジェクティブが前記第１のアクティブオブジェクティブに対してより高い優先度レベルを有するという判定が前記プロセッサによって行われた場合、前記第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行を中断することと、
前記第２のアクティブオブジェクティブから第２のアクションストラテジを生成することと、
前記自律システムによって前記第２のアクションストラテジを実行することと、を更に含む、
請求項２～４のいずれか１項に記載の方法。

【請求項6】

前記アクティブオブジェクティブのアクションの前記階層内の各アクションは、優先度関数に関連付けられ、前記優先度関数は、前記対応するアクションの優先度の相対的レベルを示す、
請求項１～５のいずれか１項に記載の方法。

【請求項7】

前記アクションストラテジの完了の状態に関する情報を含むデータを提供することは、現在のアクションの前記優先度関数を提供することを含む、
請求項６に記載の方法。

【請求項8】

前記自律システムの前記プロセッサによって、アクティブオブジェクティブを受信することは、複数のアクティブオブジェクティブを受信することを含み、前記複数のアクティブオブジェクティブから選択された第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、第２のアクションストラテジが前記第１のアクションに対してより高い優先度レベルを有するアクションを含むという判定が前記プロセッサによって行われた場合、第１のアクションにおいて中断される、
請求項６又は７に記載の方法。

【請求項9】

前記複数のアクティブオブジェクティブは、前記自律システムの環境及び前記自律システムの状態に関する情報を含む、前記プロセッサによって受信されたデータに基づいて更新される、
請求項２～８のいずれか１項に記載の方法。

【請求項10】

アクションストラテジを実行するように構成された自律システムであって、プロセッサと、前記プロセッサによって実行されると、前記自律システムに請求項１～９のいずれか１項に記載の方法を実施させることをもたらす命令を記憶するように構成されたメモリと、を備える、
自律システム。

【請求項11】

命令を含むコンピュータ可読サポートであって、前記命令が実行されると、請求項１～９のいずれか１項に記載の方法のステップをコンピュータに実行させる、
コンピュータ可読サポート。

【請求項12】

アクションストラテジを実行するように構成された自律システムであって、前記システムは、
所定の状態変数を検知するように構成された１つ以上の検知デバイスであって、前記状態変数は、前記自律システムの状態を記述し、前記アクションストラテジの各アクションは、前記自律システムの状態と、前記アクションストラテジを実施するために前記自律システムによって必要とされるリソースと、に関連付けられる、１つ以上の検知デバイスと、
候補オブジェクティブがポピュレートされた第１のデータベースを含むメモリと、
前記メモリ及び前記１つ以上の検知デバイスに動作可能に結合され、命令を実行するように構成されたプロセッサであって、前記命令は、実行されると、
前記プロセッサに、前記第１のデータベース内の１つ以上の候補オブジェクティブを選択させる第１の命令を受信することと、
前記選択された候補オブジェクティブから１つ以上のアクティブオブジェクティブを生成することであって、各アクティブオブジェクティブは、前記対応するアクティブオブジェクティブを遂行するために実施されるアクションの階層を記述する漸進的タスクユニット構造に関連付けられ、前記漸進的タスクユニット構造は、前記対応するアクティブオブジェクティブを遂行するための異なる方式を記述し、前記自律システムによって実行されるように構成された実行可能モジュールを含む、生成することと、
前記１つ以上のアクティブオブジェクティブから１つ以上のアクションストラテジを生成することと、
前記１つ以上のアクションストラテジを実行することと、を含む動作をもたらす、プロセッサと、を備える、
自律システム。

【請求項13】

前記プロセッサは、アクションストラテジのアクションを実行すると、
前記アクションストラテジの完了の状態に関する情報を含むデータを提供し、
前記情報に基づいて、前記プロセッサに前記第１のデータベース内の１つ以上の候補オブジェクティブを選択させる第２の命令を受信するように更に構成されている、
請求項１２に記載のシステム。

【請求項14】

各アクティブオブジェクティブは、優先度関数に関連付けられ、前記優先度関数は、前記対応するアクティブオブジェクティブの優先度の相対的レベルを示す、
請求項１２又は１３に記載のシステム。

【請求項15】

前記１つ以上のアクションストラテジの実行の順序は、前記対応する１つ以上のアクティブオブジェクティブの前記優先度関数に基づいている、
請求項１４に記載のシステム。

【請求項16】

第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、第２のアクションストラテジが前記第１のアクションに対してより高い優先度レベルを有するアクションを含むという判定が前記プロセッサによって行われた場合、第１のアクションにおいて中断される、
請求項１４又は１５に記載のシステム。

【請求項17】

自律システムによるアクションストラテジの実行を管理するためのコンピュータ実装方法であって、前記アクションストラテジは、対応するアクティブオブジェクティブを遂行するために前記自律システムによって実施される一連のアクションを含み、
前記方法は、
前記自律システムのプロセッサによって、前記自律システムによって遂行されるアクティブオブジェクティブを識別することであって、前記アクティブオブジェクティブは、前記対応するアクティブオブジェクティブを遂行するために実施されるアクションの階層を記述する、識別することと、
前記プロセッサによって、前記アクティブオブジェクティブのアクションの前記階層からアクションストラテジを生成することであって、前記アクションストラテジの前記アクションは、前記アクティブオブジェクティブのアクションの前記階層の前記アクションに対応する、生成することと、
前記アクションストラテジを実行することと、を含み、前記実行は、
前記自律システムによって、前記アクションストラテジの前記一連のアクションを実行することであって、アクションの実行は、前記自律システムの状態によって条件付けられる、実行することと、
アクションの実行の完了時に、前記アクションストラテジの完了の状態に関する情報を含むデータを提供することと、を含む、
方法。

【請求項18】

前記自律システムの前記プロセッサによって、前記アクティブオブジェクティブを受信することは、複数のアクティブオブジェクティブを受信することを含み、各アクティブオブジェクティブは、優先度関数に関連付けられ、前記優先度関数は、前記対応するアクティブオブジェクティブの優先度の相対的レベルを示す、
請求項１７に記載の方法。

【請求項19】

前記アクションストラテジの前記完了の状態に関する情報を含むデータを提供することは、現在のアクティブオブジェクティブの前記優先度関数を提供することを含む、
請求項１８に記載の方法。

【請求項20】

前記複数のアクティブオブジェクティブに対応する複数のアクションストラテジの実行の順序は、前記１つ以上のアクティブオブジェクティブの前記優先度関数に基づいている、
請求項１８又は１９に記載の方法。

【請求項21】

【請求項22】

前記アクティブオブジェクティブのアクションの前記階層内の各アクションは、優先度関数に関連付けられ、前記優先度関数は、前記対応するアクションの優先度の相対的レベルを示す、
請求項１７～２１のいずれか１項に記載の方法。

【請求項23】

前記アクションストラテジの完了の状態に関する情報を含むデータを提供することは、現在のアクションの前記優先度関数を提供することを含む、
請求項２２に記載の方法。

【請求項24】

【請求項25】

前記複数のアクティブオブジェクティブは、前記自律システムの環境及び前記自律システムの状態に関する情報を含む、前記プロセッサによって受信されたデータに基づいて更新される、
請求項１８～２４のいずれか１項に記載の方法。

【請求項26】

アクションストラテジを実行するように構成された自律システムであって、プロセッサと、前記プロセッサによって実行されると、前記自律システムに請求項１６１７～２５のいずれか１項に記載の方法を実施させる命令を記憶するように構成されたメモリと、を備える、
自律システム。

【請求項27】

命令を含むコンピュータ可読サポートであって、前記命令が実行されると、請求項１６１７～２５のいずれか１項に記載の方法のステップをコンピュータに実行させる、
コンピュータ可読サポート。

【請求項28】

アクションストラテジを実行するように構成された自律システムであって、前記アクションストラテジは、対応するアクティブオブジェクティブを遂行するために前記自律システムによって実施される一連のアクションを含み、
前記システムは、
候補オブジェクティブがポピュレートされた第１のデータベースを含むメモリであって、前記候補オブジェクティブの各々は、前記自律システムによって実行されると、対応するアクティブオブジェクティブの前記一連のアクションを生成することをもたらすコンピュータ可読命令を含む、メモリと、
前記メモリに動作可能に結合され、命令を実行するように構成されたプロセッサであって、前記命令は、実行されると、
前記プロセッサに、前記第１のデータベース内の１つ以上の候補オブジェクティブを選択させる第１の命令を受信することと、
前記選択された候補オブジェクティブから１つ以上のアクティブオブジェクティブを生成することと、
前記１つ以上のアクティブオブジェクティブから１つ以上のアクションストラテジを生成することと、
前記１つ以上のアクションストラテジを実行することと、を含む動作をもたらす、プロセッサと、を備える、自律システム。

【請求項29】

前記プロセッサは、アクションストラテジのアクションを実行すると、
前記アクションストラテジの完了の状態に関する情報を含むデータを提供し、
前記情報に基づいて、前記プロセッサに前記第１のデータベース内の１つ以上の候補オブジェクティブを選択させる第２の命令を受信するように更に構成されている、
請求項２８に記載のシステム。

【請求項30】

各アクティブオブジェクティブは、優先度関数に関連付けられ、前記優先度関数は、前記対応するアクティブオブジェクティブの優先度の相対的レベルを示す、
請求項２８又は２９に記載のシステム。

【請求項31】

前記１つ以上のアクションストラテジの実行の順序は、前記対応する１つ以上のアクティブオブジェクティブの前記優先度関数に基づいている、
請求項３０に記載のシステム。

【請求項32】

第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、第２のアクションストラテジが前記第１のアクションに対してより高い優先度レベルを有するアクションを含むという判定が前記プロセッサによって行われた場合、第１のアクションにおいて中断される、
請求項３０又は３１に記載のシステム。

【発明の詳細な説明】

【技術分野】

【0001】

(関連出願の相互参照)
本特許出願は、２０２１年６月２９日に出願された欧州特許出願第２１３０５８９３.６号、２０２１年６月２９日に出願された欧州特許出願第２１３０５８９４.４号、２０２１年６月２９日に出願された欧州特許出願第２１３０５８９５.１号、及び２０２１年６月２９日に出願された欧州特許出願第２１３０５８９６.９号の優先権を主張するものであり、これらの内容全体は、参照により本明細書に組み込まれる。

【0002】

本技術は、アクションストラテジの実行を管理するためのシステム及び方法に関し、より具体的には、それらの動的環境内で対話するインテリジェント自律システムに関する。

【背景技術】

【0003】

自律意思決定プロセスにおける最近の開発は、自律システムの開発における大きな一歩である。潜在的な用途は、支援人間型ロボットシステム、又はネットワークフロー監視及び管理システムなどであるが、それらに限定されない、広範囲のドメインを網羅している。自律システムは、事前定義されたルール及び/又は変化するルールを遵守しながら、ユーザ、対話する人間、又は支援を必要とする任意の物体を満足させるタスクを実施することが期待されている。

【0004】

したがって、種々のアクティビティを処理するために開発されたかかる自律システムは、アクションストラテジ又は「ポリシー」を生成及び実行することによって、異常発生イベント又は異常状況を検出して、当該異常状況に対処するために満たされるべきオブジェクティブを更に識別することを可能とする必要があり得る。

【0005】

上記で特定された最近の開発が利益を提供し得るとしても、依然として改善が望まれている。

【0006】

背景技術の節で考察された主題は、単に背景技術の節で言及したことの結果として先行技術であると想定されるべきではない。同様に、背景技術の節で言及された問題、又は背景技術の節の主題に関連する問題は、従来技術において以前に認識されていたと想定されるべきではない。背景技術の節における主題は、単に異なる手法を表すものである。

【発明の概要】

【0007】

本技術の実施形態は、従来技術に関連する欠点についての開発者の認識に基づいて開発されている。

【0008】

特に、かかる欠点は、(１)自律システムが動作するように構成された所与の環境に依存する自律システムの挙動の不適切性、(２)所与の環境において動作している間に潜在的な中断をもたらすストラテジを確立するための長い計算時間、及び/又は(３)動的環境におけるアクションの静的ストラテジの不適切性を含み得る。

【0009】

一態様では、本技術の種々の実装形態は、自律システムによるアクションストラテジの実行を管理するための方法を提供し、アクションストラテジは、対応するアクティブオブジェクティブを遂行するために自律システムによって実施される一連のアクションを含む。

【0010】

本方法は、自律システムのプロセッサによって、自律システムによって遂行されるアクティブオブジェクティブを識別することであって、アクティブオブジェクティブは、対応するアクティブオブジェクティブを遂行するために実施されるアクションの階層を記述する、識別することと、プロセッサによって、アクティブオブジェクティブのアクションの階層からアクションストラテジを生成することであって、アクションストラテジのアクションは、アクティブオブジェクティブのアクションの階層のアクションに対応する、生成することと、アクションストラテジを実行することと、を含む。

【0011】

実行は、自律システムによって、アクションストラテジの一連のアクションを実行することを含み、アクションの実行は、自律システムの状態によって条件付けられ、アクションの実行の完了時に、アクションストラテジの完了の状態に関する情報を含むデータを提供する。

【0012】

本方法の一部の実施形態では、自律システムのプロセッサによって、アクティブオブジェクティブを受信することは、複数のアクティブオブジェクティブを受信することを含み、各アクティブオブジェクティブは、優先度関数に関連付けられ、優先度関数は、対応するアクティブオブジェクティブの優先度の相対的レベルを示す。

【0013】

本方法の一部の実施形態では、アクションストラテジの完了の状態に関する情報を含むデータを提供することは、現在のアクティブオブジェクティブの優先度関数を提供することを含む。

【0014】

本方法の一部の実施形態では、複数のアクティブオブジェクティブに対応する複数のアクションストラテジの実行の順序は、１つ以上のアクティブオブジェクティブの優先度関数に基づく。

【0015】

本方法の一部の実施形態では、プロセッサは、複数のアクティブオブジェクティブのうちの第２のアクティブオブジェクティブを受信する前に、複数のアクティブオブジェクティブのうちの第１のアクティブオブジェクティブを受信する。本方法は、第２のアクティブオブジェクティブが第１のアクティブオブジェクティブに対してより高い優先度レベルを有するという判定がプロセッサによって行われた場合、第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行を中断することと、第２のアクティブオブジェクティブから第２のアクションストラテジを生成することと、自律システムによって第２のアクションストラテジを実行することと、を更に含む。

【0016】

本方法の一部の実施形態では、アクティブオブジェクティブのアクションの階層内の各アクションは、優先度関数に関連付けられ、優先度関数は、対応するアクションの優先度の相対的レベルを示す。

【0017】

本方法の一部の実施形態では、アクションストラテジの完了の状態に関する情報を含むデータを提供することは、現在のアクションの優先度関数を提供することを含む。

【0018】

本方法の一部の実施形態では、自律システムのプロセッサによって、アクティブオブジェクティブを受信することは、複数のアクティブオブジェクティブを受信することを含み、複数のアクティブオブジェクティブから選択された第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、第２のアクションストラテジが第１のアクションに対してより高い優先度レベルを有するアクションを含むという判定がプロセッサによって行われた場合、第１のアクションにおいて中断される。

【0019】

本方法の一部の実施形態では、複数のアクティブオブジェクティブは、自律システムの環境及び自律システムの状態に関する情報を含む、プロセッサによって受信されたデータに基づいて更新される。

【0020】

第２の態様では、本技術の種々の実装形態は、アクションストラテジを実行するための自律システムを提供し、プロセッサと、プロセッサによって実行されると、自律システムが方法を実施することをもたらす命令を記憶するように構成される、メモリと、を備える。

【0021】

第３の態様では、本技術の種々の実装形態は、アクションストラテジを実行するように構成された自律システムを提供し、アクションストラテジは、対応するアクティブオブジェクティブを遂行するために自律システムによって実施される一連のアクションを含む。システムは、候補オブジェクティブがポピュレートされた第１のデータベースを含むメモリを備え、候補オブジェクティブの各々は、自律システムによって実行されると、対応するアクティブオブジェクティブの一連のアクションを生成することをもたらすコンピュータ可読命令を含む。

【0022】

システムは、メモリに動作可能に結合され、命令を実行するように構成されたプロセッサを備え、命令は、実行されると、プロセッサに、第１のデータベース内の１つ以上の候補オブジェクティブを選択させる第１の命令を受信することと、選択された候補オブジェクティブから１つ以上のアクティブオブジェクティブを生成することと、１つ以上のアクティブオブジェクティブから１つ以上のアクションストラテジを生成することと、１つ以上のアクションストラテジを実行することと、を含む動作をもたらす。

【0023】

システムの一部の実施形態では、プロセッサは、アクションストラテジのアクションを実行すると、アクションストラテジの完了の状態に関する情報を含む、データを提供し、当該情報に基づいて、プロセッサに、第１のデータベース内の１つ以上の候補オブジェクティブを選択させる、第２の命令を受信するように更に構成される。

【0024】

システムの一部の実施形態では、各アクティブオブジェクティブは、優先度関数に関連付けられ、優先度関数は、対応するアクティブオブジェクティブの優先度の相対的レベルを示す。

【0025】

システムの一部の実施形態では、１つ以上のアクションストラテジの実行の順序は、対応する１つ以上のアクティブオブジェクティブの優先度関数に基づく。

【0026】

システムの一部の実施形態では、第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、第２のアクションストラテジが第１のアクションに対してより高い優先度レベルを有するアクションを含むという判定がプロセッサによって行われた場合、第１のアクションにおいて中断される。

【0027】

第４の態様では、本技術の種々の実装形態は、自律システムによるアクティブオブジェクティブのリストを確立するための知識ベース推論のためのコンピュータ実装方法を提供する。

【0028】

本方法は、アクティブオブジェクティブのリストにアクセスすることを含み、アクティブオブジェクティブの各々は、パラメータのセットと、自律システムによって実行されると、自律システムがパラメータのセットに従ってタスクを実施することをもたらす第１のコンピュータ可読命令と、を含む。

【0029】

本方法は、静的環境プロパティがポピュレートされた第１のデータベースにアクセスすることを含み、静的環境プロパティは、エンティティのプロパティ及びエンティティ間の関係を定義する第２のコンピュータ可読命令を含む。エンティティ及びエンティティ間の関係は、自律システムが動作するように構成される環境を画定する。

【0030】

本方法は、動的環境プロパティがポピュレートされた第２のデータベースにアクセスすることを含み、動的環境プロパティは、自律システムによって観測されているイベントに基づいて自律システムによって生成された第３のコンピュータ可読命令を含み、イベントは、環境内の自律システムの動作中に発生していたものである。

【0031】

自律システムによって、環境内の新しいイベントを観測すると、本方法は、新しいイベントに基づいて新しい動的環境プロパティを生成することと、新しい動的環境プロパティを第２のデータベースに入力することと、新しい動的環境プロパティ及び静的環境プロパティに対してコヒーレンスチェックを実行することであって、コヒーレンスチェックは、新しい動的環境プロパティを静的環境プロパティと比較して、新しい動的環境プロパティが静的環境プロパティのうちの少なくとも１つと競合するかどうかを評価することを含む、実行することと、新しい動的環境プロパティが静的環境プロパティのうちの少なくとも１つと競合するという判定が行われた場合、新しい動的環境プロパティをインコヒーレントとして識別することと、を含む。

【0032】

本方法の一部の実施形態では、本方法は、新しい動的環境プロパティがインコヒーレントであるかどうかを判定することを更に含む。新しい動的環境プロパティがインコヒーレントである場合、本方法は、候補オブジェクティブがポピュレートされた第３のデータベースにアクセスすることであって、候補オブジェクティブの各々は、自律システムによって実行されると第１のコンピュータ可読命令を生成することをもたらす第４のコンピュータ可読命令を含む、アクセスすることと、新しいイベントに基づいて候補オブジェクティブから新しいアクティブオブジェクティブを生成することと、新しいアクティブオブジェクティブをアクティブオブジェクティブのリストに入力することと、を含む。

【0033】

本方法の一部の実施形態では、コヒーレンスチェックの実行は、新しい動的環境プロパティが第１のデータベースの少なくとも１つの静的環境プロパティと競合しているという判定が行われた場合、新しい動的環境プロパティをインコヒーレントとしてマークすることであって、新しい動的環境プロパティと少なくとも１つの静的環境プロパティとの間の競合は、それらのそれぞれのコンピュータ可読命令の反対によって引き起こされる、マークすることと、そうでない場合、新しい動的環境プロパティをコヒーレントとして識別することと、を含む。

【0034】

本方法の一部の実施形態では、新しいイベントに基づいて候補オブジェクティブから新しいアクティブオブジェクティブを生成することは、第３のデータベースの候補オブジェクティブから候補オブジェクティブを選択することと、新しいイベントに基づいて新しいアクティブオブジェクティブパラメータを生成することと、新しいアクティブオブジェクティブパラメータを選択された候補オブジェクティブに関連付けることと、を含む。

【0035】

本方法の一部の実施形態では、第３のデータベースの各候補オブジェクティブは、アクティブ化条件を含み、アクティブ化条件は、１つ以上の動的環境プロパティに対応し、アクティブ化条件は、対応する１つ以上の動的環境プロパティが第２のデータベース内で見つかったという判定が行われた場合に満たされ、第３のデータベースの候補オブジェクティブからの候補オブジェクティブの選択は、候補オブジェクティブのアクティブ化条件に基づく。

【0036】

本方法の一部の実施形態では、第１のデータベースは、常識ルールを更に含み、各常識ルールは、エンティティの一般的プロパティ及びエンティティ間の一般的関係を定義する第５のコンピュータ可読命令を含み、各一般的プロパティは、エンティティのグループのプロパティであり、エンティティ間の各一般的関係は、エンティティのグループ間の関係である。

【0037】

本方法の一部の実施形態では、常識ルールは、自律システムのオペレータによってポピュレートされ、自律システムが動作するように構成される環境の文化的コンテキストを記述する。

【0038】

本方法の一部の実施形態では、オペレータは、機械学習アルゴリズム(ＭＬＡ)を用いて、常識ルールのうちの１つ以上を生成する。

【0039】

本方法の一部の実施形態では、第２のデータベース内の新しいイベントに基づいて新しい動的環境プロパティを入力すると、新しい動的環境プロパティ及び常識ルールに対してコヒーレンスチェックが更に実行され、新しい動的環境プロパティが常識ルールのうちの少なくとも１つと競合するという判定が行われた場合、候補オブジェクティブがポピュレートされた第３のデータベースにアクセスし、新しいイベントに基づいて、候補オブジェクティブから新しいアクティブオブジェクティブを生成し、新しいアクティブオブジェクティブをアクティブオブジェクティブのリストに入力する。

【0040】

本方法の一部の実施形態では、新しい動的環境プロパティを第２のデータベースに入力すると、新しい動的環境プロパティ及びアクティブオブジェクティブのリストに対してコヒーレンスチェックが更に実行され、新しい動的環境プロパティがアクティブオブジェクティブのうちの少なくとも１つと競合するという判定が行われた場合、アクティブオブジェクティブのうちの少なくとも１つをアクティブオブジェクティブのリストから削除する。

【0041】

本方法の一部の実施形態では、動的環境プロパティは、対応するイベントの１つ以上の特性に関連付けられ、特性は、イベントの１人以上のアクタ、イベントのロケーション、イベントの時間、及びイベントの１人以上のアクタによって実施されるアクションを含む特性のグループにおいて選択される。

【0042】

本方法の一部の実施形態では、動的環境プロパティの事前定義された組み合わせが第２のデータベース内で見つかったという判定が行われた場合、メタイベントを記述する１つ以上の動的環境プロパティが生成され、動的環境プロパティの各事前定義された組み合わせは、メタイベントに対応し、第２のデータベース内の対応する動的環境プロパティの生成を引き起こす。

【0043】

第５の態様では、本技術の種々の実装形態は、命令を実行すると、コンピュータに方法のステップを実行させる命令を含むコンピュータ可読サポートを提供する。

【0044】

第６の態様では、本技術の種々の実装形態は、アクティブオブジェクティブのリストを管理するように構成された自律システムを提供する。アクティブオブジェクティブの各々は、パラメータのセットと、自律システムによって実行されると、自律システムがパラメータのセットに従ってタスクを実施することをもたらす第１のコンピュータ可読命令と、を含む。

【0045】

システムは、イベントを検出するように構成された１つ以上の検知デバイスを備え、イベントは、自律システムが動作するように構成される環境内で発生しているか、又は発生していたものである。システムは、静的環境プロパティがポピュレートされた第１のデータベースを含むメモリを備え、静的環境プロパティは、エンティティのプロパティ及びエンティティ間の関係を定義する第２のコンピュータ可読命令を含み、エンティティ及びエンティティ間の関係は、環境を画定する。

【0046】

メモリは、動的環境プロパティがポピュレートされた第２のデータベースであって、動的環境プロパティは、検出されたイベントに基づいて自律システムによって生成された第３のコンピュータ可読命令を含む、第２のデータベースと、候補オブジェクティブを含む第３のデータベースと、を含む。システムは、メモリに動作可能に結合され、命令を実行するように構成されたプロセッサを備え、命令は、実行されると、自律システムによって環境内の新しいイベントを観測すると、新しいイベントに基づいて新しい動的環境プロパティを生成することを含む動作をもたらす。

【0047】

システムは、新しい動的環境プロパティを第２のデータベースに入力し、新しい動的環境プロパティ及び静的環境プロパティに対してコヒーレンスチェックを実行するように構成され、コヒーレンスチェックは、新しい動的環境プロパティを静的環境プロパティと比較して、新しい動的環境プロパティが静的環境プロパティのうちの少なくとも１つと競合するかどうかを評価することを含む。

【0048】

システムは、新しい動的環境プロパティが静的環境プロパティのうちの少なくとも１つと競合するという判定が行われた場合、候補オブジェクティブがポピュレートされた第３のデータベースにアクセスすることであって、候補オブジェクティブの各々は、自律システムによって実行されると、第１のコンピュータ可読命令を生成することをもたらす第５のコンピュータ可読命令を含む、アクセスすることと、新しいイベントに基づいて候補オブジェクティブから新しいアクティブオブジェクティブを生成することと、新しいアクティブオブジェクティブをアクティブオブジェクティブのリストに入力することと、を行うように構成される。

【0049】

システムの一部の実施形態では、コヒーレンスチェックを実行すると、プロセッサは、新しい動的環境プロパティが第１のデータベースの少なくとも１つの静的環境プロパティと競合しているという判定が行われた場合、新しい動的環境プロパティをインコヒーレントとしてマークすることであって、新しい動的環境プロパティと少なくとも１つの静的環境プロパティとの間の競合は、それらのそれぞれのコンピュータ可読命令の反対によって引き起こされる、マークすることと、そうでない場合、新しい動的環境プロパティをコヒーレントとして識別することと、を行うように更に構成される。

【0050】

システムの一部の実施形態では、第１のデータベースは、常識ルールを更に含み、各常識ルールは、エンティティの一般的プロパティ及びエンティティ間の一般的関係を定義する第４のコンピュータ可読命令を含み、各一般的プロパティは、エンティティのグループのプロパティであり、エンティティ間の各一般的関係は、エンティティのグループ間の関係である。

【0051】

システムの一部の実施形態では、第２のデータベースに新しい動的環境プロパティを入力すると、新しい動的環境プロパティは新しいイベントに基づき、コヒーレンスチェックが新しい動的環境プロパティ及び常識ルールに対して更に実行される。新しい動的環境プロパティが常識ルールのうちの少なくとも１つと競合するという判定が行われた場合、システムは、候補オブジェクティブがポピュレートされた第３のデータベースにアクセスし、新しいイベントに基づいて候補オブジェクティブから新しいアクティブオブジェクティブを生成し、新しいアクティブオブジェクティブをアクティブオブジェクティブのリストに入力するように構成される。

【0052】

システムの一部の実施形態では、システムは、第３のデータベースの候補オブジェクティブから候補オブジェクティブを選択し、新しいイベントに基づいて新しいアクティブオブジェクティブパラメータを生成し、新しいアクティブオブジェクティブパラメータを選択された候補オブジェクティブに関連付けて、新しいイベントに基づいて候補オブジェクティブから新しいアクティブオブジェクティブを生成するように構成される。

【0053】

システムの一部の実施形態では、第３のデータベースの各候補オブジェクティブは、アクティブ化条件を含み、アクティブ化条件は、１つ以上の動的環境プロパティに対応し、アクティブ化条件は、対応する１つ以上の動的環境プロパティが第２のデータベース内で見つかったという判定が行われた場合に満たされ、第３のデータベースの候補オブジェクティブからの候補オブジェクティブの選択は、候補オブジェクティブのアクティブ化条件に基づく。

【0054】

システムの一部の実施形態では、新しい動的環境プロパティを第２のデータベースに入力すると、新しい動的環境プロパティ及びアクティブオブジェクティブに対してコヒーレンスチェックが更に実行され、新しい動的環境プロパティがアクティブオブジェクティブのうちの少なくとも１つと競合するという判定が行われた場合、アクティブオブジェクティブのうちの少なくとも１つをアクティブオブジェクティブのリストから削除する。

【0055】

システムの一部の実施形態では、プロセッサは、第２のデータベース内の動的環境プロパティの発生回数を判定し、発生回数が第１の閾値よりも高いという判定が行われた場合、対応する動的環境プロパティのコンピュータ可読命令に基づいて静的環境プロパティを生成するように更に構成される。

【0056】

第７の態様では、本技術の種々の実装形態は、自律システムによって実行されるアクションストラテジを生成するための方法を提供し、アクションストラテジは、異常イベントを検出したことに応答して、対応するアクティブオブジェクティブを遂行するために自律システムによって実施される一連のアクションを含み、異常イベントは、自律システムが動作するように構成される環境において発生しているか、又は発生していたものであり、異常イベントは、対応するイベントの記述と環境の特性との間のコヒーレンスチェック手順の結果に基づいて、インコヒーレントとして識別される。

【0057】

本方法は、自律システムによって検出された異常イベントに対応するイベント記述がポピュレートされた第１のデータベースにアクセスすることを含む。本方法は、候補オブジェクティブがポピュレートされた第２のデータベースにアクセスすることを含む。各候補オブジェクティブは、自律システムによって遂行可能なタスクを定義し、１つ以上のイベント記述に対応するアクティブ化条件であって、対応する１つ以上のイベント記述が第１のデータベース内で見つかったという判定が行われた場合に満たされる、アクティブ化条件と、対応する候補オブジェクティブを遂行するために実施されるアクションの階層を記述する漸進的タスクユニット構造であって、漸進的タスクユニット構造は、アクションの対応する階層を実施するために自律システムによって実行されるように構成された実行可能モジュールを備え、各実行可能モジュールは、アクションの階層のアクションに対応する、漸進的タスクユニット構造と、を含む。

【0058】

本方法は、イベント記述に基づいて１つ以上の候補オブジェクティブのアクティブ化条件が満たされるかどうかを判定することによって、第２のデータベースから１つ以上の候補オブジェクティブを選択することと、１つ以上の候補オブジェクティブを実行することと、を含む。候補オブジェクティブの実行は、候補オブジェクティブの選択を引き起こしたイベント記述のうちの少なくとも１つのパラメータを候補オブジェクティブに転送し、それによってアクティブオブジェクティブを定義することと、アクティブオブジェクティブの漸進的タスクユニット構造からアクションストラテジを生成することであって、アクションストラテジの一連のアクションは、漸進的タスクユニット構造の実行可能モジュールに対応するアクションに対応する、生成すること、アクションストラテジの一連のアクションを実行することと、を含む。

【0059】

本方法の一部の実施形態では、第１のデータベースのイベント記述は、自律システムによって検出された異常イベントに対応し、異常イベントの各々は、対応するイベントのイベント記述と環境のプロパティとの間のコヒーレンスチェック手順の結果に基づいてインコヒーレントとして識別され、第１のデータベースへアクセスすることは、自律システムによる異常イベントの検出に応答して行われる。

【0060】

本方法の一部の実施形態では、漸進的タスクユニット構造は、処理レベルの１つ以上のシーケンスを更に含み、処理レベルの各シーケンスは、実行可能モジュールのうちの１つ以上、候補オブジェクティブの実行の状態のパラメータを記述する状態変数の集合、観測可能なプロパティの集合、第１のデータベースのイベント記述のうちの１つ以上に対応する観測可能なプロパティ、又はそれらの組み合わせを含む。

【0061】

漸進的タスクユニット構造の本方法の一部の実施形態では、各実行可能モジュールは、対応する漸進的タスクユニット構造の状態変数の集合のうちの状態変数の部分集合の構成に対応し、所与の実行可能モジュールについて、所与の実行可能モジュールに対応するアクションの実行時に対応する構成が満たされていないという判定が行われた場合、当該アクションは、自律システムの障害として識別される。

【0062】

本方法の一部の実施形態では、候補オブジェクティブのうちの少なくとも１つの漸進的タスクユニット構造は、自律システムの対応する障害から回復するために自律システムによって実行されるように構成された障害回復モジュールを更に含み、自律システムの対応する障害は、状態変数の集合と、少なくとも１つの漸進的タスクユニット構造の実行可能モジュールに対応する状態変数の部分集合の構成との不一致に基づいて識別される。

【0063】

本方法の一部の実施形態では、候補オブジェクティブのうちの少なくとも１つは、実施されるリソース制限付きアクションの階層を含む１つ以上の障害回復漸進的タスクユニット構造を更に含み、各障害回復漸進的タスクユニット構造は、漸進的タスクユニット構造の障害回復モジュールに対応し、障害回復モジュールの実行は、自律システムによる障害回復漸進的タスクユニット構造のリソース制限付きアクションの実行を引き起こす。

【0064】

本方法の一部の実施形態では、実行可能モジュールは、対応する実行可能モジュールを実行するための実行スコアに更に関連付けられ、実行可能アクションストラテジを生成することは、グローバル実行スコアを最大化することを含み、グローバル実行スコアは、実行可能モジュールに関連付けられた実行スコアの組み合わせである。

【0065】

本方法の一部の実施形態では、実行可能モジュールの実行スコアは、グローバル実行スコアを決定するために、対応する実行可能モジュールの実行確率によって重み付けされ、実行確率は、自律システムによる対応する実行可能モジュールの実行の確率を記述する。

【0066】

本方法の一部の実施形態では、候補オブジェクティブの漸進的タスクユニット構造からアクションストラテジを生成することは、漸進的タスクユニット構造から確率的決定プロセスを生成することを含む。確率的決定プロセスは、少なくとも、漸進的タスクユニット構造の実行可能モジュールのアクションに対応するアクションのセットと、自律システムの状態を含む状態のセットとを含み、各状態は、実行可能モジュールの実行の結果に対応する。本方法は、確率的決定プロセスを実行することを含む。

【0067】

本方法の一部の実施形態では、確率的決定プロセスは、因数分解マルコフ決定プロセスである。

【0068】

本方法の一部の実施形態では、実行可能モジュールに対応する１つ以上のアクションは、１つ以上の候補オブジェクティブの実行を引き起こす。

【0069】

第８の態様では、本技術の種々の実装形態は、１つ以上の対応するタスクを遂行することによって、１つ以上のオブジェクティブを満たすように、自律システムによって実行されるアクションを計画するためのコンピュータ実装方法を提供する。

【0070】

本方法は、１つ以上のオブジェクティブのセットにアクセスすることを含む。１つ以上のオブジェクティブの各々は、対応する１つ以上のオブジェクティブの特性を識別するパラメータを含む。

【0071】

本方法は、漸進的タスクユニット構造を含む第１のデータベースにアクセスすることを含み、各漸進的タスクユニット構造は、実行可能モジュール及び障害回復モジュールによって記述される対応するタスクを遂行するためのアクションの階層を含み、各実行可能モジュールは、アクションの階層のリソース制限付きアクションを実施するために自律システムによって実行されるように構成される。各障害回復モジュールは、自律システムが、対応するタスクの遂行を追求するために、実行可能モジュールに対応するアクションを実施することに失敗したという判定が行われた場合、自律システムによって実行されるように構成される。

【0072】

本方法は、実施されるリソース制限付きアクションの階層を含む障害回復漸進的タスクユニット構造を含む第２のデータベースにアクセスすることを含み、各障害回復漸進的タスクユニット構造は、漸進的タスクユニット構造の障害回復モジュールに対応する。障害回復モジュールの実行は、自律システムによるリソース制限付きアクションの実行を引き起こす。

【0073】

本方法は、１つ以上のオブジェクティブのパラメータに基づいて第１のデータベースから１つ以上の漸進的タスクユニット構造を選択することであって、各オブジェクティブは、漸進的タスクユニット構造に対応する、選択することと、選択された１つ以上の漸進的タスクユニット構造を実行することと、を含む。実行は、選択された１つ以上の漸進的タスクユニット構造から１つ以上の確率的決定プロセスを生成することを含む。各確率的決定プロセスは、漸進的タスクユニット構造の実行可能モジュール及び障害回復モジュールのアクションに対応するアクションのセットと、実行可能モジュールのアクションの結果に対応する状態のセットと、を含む。

【0074】

本方法は、自律システムの現在の状態に基づいてアクションのセットのうちの１つ以上のアクションを実施することによって、１つ以上の確率的決定プロセスを実行することと、選択された１つ以上の漸進的タスクユニット構造を実行する際に、自律システムが障害回復モジュールに対応するアクションを実施するという判定が行われた場合、障害回復モジュールの障害回復漸進的タスクユニット構造のリソース制限付きアクションの階層を実行することと、を含む。

【0075】

本方法の一部の実施形態では、対応する障害回復漸進的タスクユニット構造のリソース制限付きアクションの階層を実行することは、障害回復漸進的タスクユニット構造から確率的決定プロセスを生成することを含む。確率的決定プロセスは、障害回復漸進的タスクユニット構造のリソース制限付きアクションに対応するアクションのセットと、リソース制限付きアクションの結果に対応する状態のセットと、を含む。本方法は、自律システムの現在の状態に基づいてアクションのセットのうちの１つ以上のアクションを実施することによって確率的決定プロセスを実行することを含む。

【0076】

本方法の一部の実施形態では、確率的決定プロセスは、因数分解マルコフ決定プロセスである。

【0077】

方法の一部の実施形態では、各実行可能モジュールは、候補オブジェクティブの実行の状態のパラメータを記述する状態変数の部分集合に関連付けられ、選択された１つ以上の漸進的タスクユニット構造から１つ以上の確率的決定プロセスを生成することは、所定の状態変数に対応する選択された１つ以上の漸進的タスクユニット構造の実行可能モジュールを選択することを含む。

【0078】

第９の態様では、本技術の種々の実装形態は、自律システムによるアクションストラテジの実行を管理するためのコンピュータ実装方法を提供し、自律システムは、所定の状態変数を検知するように構成された１つ以上の検知デバイスを備え、状態変数は、自律システムの状態を記述し、アクションストラテジの各アクションは、自律システムの状態及びアクションストラテジを行うために自律システムによって必要とされるリソースと関連付けられる。

【0079】

本方法は、自律システムのプロセッサによって、自律システムによって遂行されるアクティブオブジェクティブを識別することであって、アクティブオブジェクティブは、対応するアクティブオブジェクティブを遂行するために実施されるアクションの階層を記述する漸進的タスクユニット構造に関連付けられ、漸進的タスクユニット構造は、対応するアクティブオブジェクティブを遂行するための異なる方式を記述し、対応するアクティブオブジェクティブを遂行するために自律システムによって実行されるように構成された実行可能モジュールを含み、アクションの階層は、アクションを実施する際に検出される自律システムの所与の障害状態に応答して実施されるリソース制限付きアクションを含む、識別することと、プロセッサによって、アクションの階層からアクションストラテジを生成することであって、アクションストラテジのアクションは、アクティブオブジェクティブのアクションの階層のアクションに対応する、生成することと、アクションストラテジを実行することと、を含む。

【0080】

実行は、自律システムによって、アクションストラテジの一連のアクションを実行することを含み、アクションの実行は、自律システムが障害状態にあるという判定が行われた場合、対応するリソース制限付きアクションを自律システムによって実行して当該障害状態から回復することができるように、自律システムの現在の状態によって条件付けられる。アクションストラテジのアクションの実行の完了時に、本方法は、アクションストラテジの完了の状態及び当該アクションの結果に関する情報を含むデータを提供することを更に含む。

【0081】

第１０の態様では、本技術の種々の実装形態は、アクションストラテジを実行するために構成される自律システムを提供し、システムは、所定の状態変数を検知するように構成された１つ以上の検知デバイスであって、状態変数は、自律システムの状態を記述し、アクションストラテジの各アクションは、自律システムの状態と、アクションストラテジを実施するために自律システムによって必要とされるリソースと、に関連付けられる、１つ以上の検知デバイスと、候補オブジェクティブがポピュレートされた第１のデータベースを含むメモリと、メモリ及び１つ以上の検知デバイスに動作可能に結合されるプロセッサと、を備える。

【0082】

プロセッサは、実行されると、プロセッサに第１のデータベース内の１つ以上の候補オブジェクティブを選択させる第１の命令を受信することと、選択された候補オブジェクティブから１つ以上のアクティブオブジェクティブを生成することであって、各アクティブオブジェクティブは、対応するアクティブオブジェクティブを遂行するために実施されるアクションの階層を記述する漸進的タスクユニット構造に関連付けられ、漸進的タスクユニット構造は、対応するアクティブオブジェクティブを遂行するための異なる方式を記述し、自律システムによって実行されるように構成された実行可能モジュールを含む、生成することと、１つ以上のアクティブオブジェクティブから１つ以上のアクションストラテジを生成することと、１つ以上のアクションストラテジを実行することと、を含む動作をもたらす命令を実行するように構成される。

【0083】

第１１の態様では、本技術の種々の実装形態は、自律システムによって実行されるアクションストラテジを生成するためのシステムを提供し、システムは、プロセッサと、プロセッサによって実行されると、システムに方法を実施させる命令を記憶するように構成される、メモリと、を備える。

【0084】

第１２の態様では、本技術の種々の実装形態は、命令を実行すると、コンピュータに方法のステップを実行させる命令を含むコンピュータ可読サポートを提供する。

【0085】

本明細書の文脈では、明示的に別段の定めをした場合を除き、コンピュータシステムは、限定はしないが、「電子デバイス」、「オペレーティングシステム」、「システム」、「コンピュータベースのシステム」、「コントローラユニット」、「監視デバイス」、「制御デバイス」、及び/又は当面の関連タスクに適したそれらの任意の組み合わせを指すことができる。

【0086】

本明細書の文脈において、明示的に別段の定めをした場合を除き、「コンピュータ可読媒体」及び「メモリ」という表現は、任意の性質及び種類の媒体を含むことが意図されており、その非限定的な例には、ＲＡＭ、ＲＯＭ、ディスク(ＣＤ－ＲＯＭ、ＤＶＤ、フロッピーディスク、ハードディスクドライブなど)、ＵＳＢキー、フラッシュメモリカード、ソリッドステートドライブ、及びテープドライブが含まれる。更に、本明細書の文脈において、「１つの(ａ)」コンピュータ可読媒体及び「その(ｔｈｅ)」コンピュータ可読媒体は、同じコンピュータ可読媒体であると解釈されるべきでない。反対に、適切な場合にはいつでも、「１つの(ａ)」コンピュータ可読媒体及び「その(ｔｈｅ)」コンピュータ可読媒体は、第１のコンピュータ可読媒体及び第２のコンピュータ可読媒体と解釈することもできる。

【0087】

本明細書の文脈では、明示的に別段の定めをした場合を除き、「第１の」、「第２の」、「第３の」などの語は、それらが修飾する名詞を互いに区別することを可能にする目的のみのために形容詞として使用されており、それらの名詞間の任意の特定の関係を説明する目的のためではない。

【0088】

本技術の実装形態は、各々、上述の目的及び/又は態様のうちの少なくとも１つを有するが、必ずしもそれらの全てを有するとは限らない。上述の目的を達成しようとする試みから生じた本技術の一部の態様は、この目的を満足させない場合があり、かつ/又は本明細書に具体的に列挙されていない他の目的を満足させる場合があることを理解されたい。

【0089】

本技術の実装形態の追加及び/又は代替の特徴、態様、及び利点は、以下の説明、添付の図面、及び添付の特許請求の範囲から明らかになるであろう。

【図面の簡単な説明】

【0090】

本技術、並びに本技術の他の態様及び更なる特徴をよりよく理解するために、添付の図面と併せて使用される以下の説明を参照する。

【0091】

【図1】本技術の一実施形態によるコンピューティングシステムの図である。

【図2】本技術の一実施形態による自律システムの図である。

【図3】本技術の一実施形態による知識ベース推論モジュールの高レベル概略図である。

【図4】本技術の一実施形態による、漸進的タスクユニット構造の高レベル概略図である。

【図5】本技術の一実施形態による、漸進的タスクユニット構造の記述的表である。

【図6】本技術の一実施形態による、最適ポリシーを生成するための方法の動作を示すシーケンス図である。

【図7】本技術の一実施形態による、アクションストラテジの表現である。

【図8】本技術の一実施形態による、別のアクションストラテジの表現である。

【図9】本技術の一実施形態による、アクションストラテジの有限状態機械である。

【0092】

また、本明細書で明示的に指定されない限り、図面は一定の縮尺ではないことに留意されたい。

【発明を実施するための形態】

【0093】

本明細書に列挙される例及び条件付き言語は、主に、読者が本技術の原理を理解するのを助けることを意図しており、その範囲をかかる具体的に列挙された例及び条件に限定することを意図していない。当業者は、本明細書に明示的に記載又は図示されているが、本技術の原理を具現化するにもかかわらず種々の配置を考案し得ることが理解されるであろう。

【0094】

更に、理解を助けるものとして、以下の説明は、本技術の比較的簡略化された実装形態を説明し得る。当業者が理解するように、本技術の種々の実装形態は、より複雑であり得る。

【0095】

場合によっては、本技術に対する修正の有用な例であると考えられるものも記載され得る。これは、単に理解を助けるために行われるものであり、やはり、本技術の範囲を定義するものでも、本技術の境界を示すものでもない。これらの修正は網羅的なリストではなく、当業者は、それでもなお本技術の範囲内に留まりながら他の修正を行うことができる。更に、修正の例が記載されていない場合、修正が可能でないこと、及び/又は記載されているものが本技術のその要素を実装する唯一の様式であることを解釈すべきではない。

【0096】

更に、本技術の原理、態様、及び実装形態、並びにそれらの特定の例を列挙する本明細書の全ての記述は、それらが現在知られているか、又は将来開発されるかにかかわらず、それらの構造的均等物と機能的均等物の両方を包含するものとする。

【0097】

したがって、例えば、本明細書における任意のブロック図は、本技術の原理を具現化する例示的な回路の概念図を表すことが当業者によって理解されるであろう。同様に、任意のフローチャート、フロー図、状態遷移図、擬似コードなどは、非一時的コンピュータ可読媒体において実質的に表され、したがって、コンピュータ又はプロセッサが明示的に示されているか否かにかかわらず、かかるコンピュータ又はプロセッサによって実行され得る種々のプロセスを表すことが理解されよう。

【0098】

「プロセッサ」とラベル付けされた任意の機能ブロックを含む、図に示される種々の要素の機能は、専用ハードウェア、並びに適切なソフトウェアに関連してソフトウェアを実行することが可能なハードウェアの使用を通じて提供され得る。プロセッサによって提供されるとき、機能は、単一の専用プロセッサによって、単一の共有プロセッサによって、又はそのうちの一部が共有され得る複数の個々のプロセッサによって提供され得る。

【0099】

本技術の一部の実施形態では、プロセッサは、中央処理装置(ＣＰＵ)などの汎用プロセッサ、又はデジタルシグナルプロセッサ(ＤＳＰ)などの特定の目的に専用のプロセッサであってもよい。更に、「プロセッサ」という用語の明示的な使用は、ソフトウェアを実行することが可能なハードウェアを排他的に指すと解釈されるべきではなく、限定はしないが、特定用途向けＩＣ(ＡＳＩＣ)、フィールドプログラマブルゲートアレイ(ＦＰＧＡ)、ソフトウェアを記憶するための読み出し専用メモリ(ＲＯＭ)、ランダムアクセスメモリ(ＲＡＭ)、及び不揮発性ストレージを暗黙的に含み得る。従来型及び/又はカスタムの他のハードウェアも含まれ得る。

【0100】

ソフトウェアモジュール、又は単にソフトウェアであることが暗示されるモジュールは、本明細書では、プロセスステップ及び/又はテキスト記述の実施を示すフローチャート要素又は他の要素の任意の組み合わせとして表され得る。かかるモジュールは、明示的又は暗示的に示されるハードウェアによって実行され得る。更に、モジュールは、例えば、限定はしないが、必要とされる能力を提供する電算プログラム論理、電算プログラム命令、ソフトウェア、スタック、ファームウェア、ハードウェア回路、又はそれらの組み合わせを含み得ることを理解されたい。

【0101】

本技術は、自律システムが、利用可能なリソースに基づいて、最適なアクションストラテジ又は「アクションポリシー」を生成及び実行することを可能にすることによって、かかるシステムにより多くの自己充足性を提供する。アクションストラテジは、タスクを遂行するために実施される一連のアクションを含むことができ、アクションの実行は、他のアクションの結果、利用可能なリソース、及び/又は他の可能な実行条件などの実行条件に基づいて、リアルタイムで、又はほぼリアルタイムで調整することができる。アクションストラテジは、アクション計画とも称されることがあり、任意の時点で調整することができる。したがって、システムは、周囲環境を検知し、それと相互作用することが可能であり得る。

【0102】

加えて、本技術に従って実装される自律システムは、最も効率的かつ満足のいく様式でタスクを遂行するために、リアルタイムでストラテジを適応させ、予想されないイベント又は「異常」イベント及び/又は状態に反応することが可能であり得る。更に、自律システムは、タスクの実行前又は実行中に生じる状況に応答することが可能であり得る。

【0103】

本開示の種々の態様は、概して、従来の自律システムに見られる問題のうちの１つ以上に対処する。この目的を達成するために、本開示は、他の態様の中でもとりわけ、支援アクションストラテジを生成及び実行するように構成されたインテリジェント自律システムを導入する。

【0104】

これらの基礎を適所に置いて、次に、本技術の態様の種々の実装形態を例示するために、一部の非限定的な例を検討する。

【0105】

図１を参照すると、本技術の少なくとも一部の実施形態による使用に好適なコンピュータシステム１００が示されている。コンピュータシステム１００は、従来のパーソナルコンピュータ、ネットワークデバイス、及び/又は電子デバイス(モバイルデバイス、タブレットデバイス、サーバ、コントローラユニット、制御デバイスなどであるが、それらに限定されない)、及び/又は当面の関連タスクに適切なそれらの任意の組み合わせのうちのいずれかによって実装されてもよい。

【0106】

一部の実施形態では、コンピュータシステム１００は、プロセッサ１１０によって集合的に表される１つ以上のシングル又はマルチコアプロセッサ、ソリッドステートドライブ１２０、ランダムアクセスメモリ１３０、及び入力/出力インターフェース１５０を含む、種々のハードウェア構成要素を備える。コンピュータシステム１００は、機械学習アルゴリズム(ＭＬＡ)を動作させるように特に設計されたコンピュータとすることができる。コンピュータシステム１００は、汎用コンピュータシステムであり得る。コンピュータシステム１００は、ロボット車両に統合されてもよく、かつ/又はロボット車両を制御するように構成されてもよい。

【0107】

一部の実施形態では、コンピュータシステム１００は、上に列挙したシステムのうちの１つのサブシステムであり得る。一部の他の実施形態では、コンピュータシステム１００は、「既製の(ｏｆｆ－ｔｈｅ－ｓｈｅｌｆ)」汎用コンピュータシステムであり得る。一部の実施形態では、コンピュータシステム１００はまた、複数のシステム間に分散されてもよい。コンピュータシステム１００はまた、本技術の実装形態に特に専用であってもよい。本技術の当業者が理解し得るように、本技術の範囲から逸脱することなく、コンピュータシステム１００がどのように実装されるかに関する複数の変形形態が想定され得る。

【0108】

当業者は、プロセッサ１１０が概して処理能力を表すことを理解するであろう。一部の実施形態では、１つ以上の従来の中央処理装置(ＣＰＵ)の代わりに、又はそれに加えて、１つ以上の特殊処理コアが、提供されてもよい。例えば、１つ以上のグラフィック処理ユニット１１１(ＧＰＵ)、テンソル処理ユニット(ＴＰＵ)、及び/又は他のいわゆる加速プロセッサ(又は処理アクセラレータ)が、１つ以上のＣＰＵに加えて、又はその代わりに提供されてもよい。

【0109】

システムメモリは、典型的には、ランダムアクセスメモリ１３０を含むことになるが、より一般的には、静的ランダムアクセスメモリ(ＳＲＡＭ)、動的ランダムアクセスメモリ(ＤＲＡＭ)、シンクロナスＤＲＡＭ(ＳＤＲＡＭ)、読み出し専用メモリ(ＲＯＭ)、又はそれらの組み合わせなど、任意のタイプの非一時的システムメモリを包含することが意図される。ソリッドステートドライブ１２０は、大容量ストレージデバイスの一例として示されているが、より一般的には、かかる大容量ストレージは、データ、プログラム、及び他の情報を記憶し、データ、プログラム、及び他の情報を、システムバス１６０を介してアクセス可能にするように構成された任意のタイプの非一時的ストレージデバイスを備え得る。例えば、大容量ストレージは、ソリッドステートドライブ、ハードディスクドライブ、磁気ディスクドライブ、及び/又は光ディスクドライブのうちの１つ以上を備え得る。

【0110】

コンピュータシステム１００の種々の構成要素間の通信は、種々のハードウェア構成要素が電子的に結合される１つ以上の内部バス及び/又は外部バス(例えば、ＰＣＩバス、ユニバーサルシリアルバス、ＩＥＥＥ１３９４「ファイアワイヤ」バス、ＳＣＳＩバス、シリアルＡＴＡバス、ＡＲＩＮＣバスなど)を備えるシステムバス接続１６０によって可能にされ得る。

【0111】

入力/出力インターフェース１５０は、有線又は無線アクセスなどのネットワーキング能力を提供することができる。一例として、入力/出力インターフェース１５０は、限定はしないが、ネットワークポート、ネットワークソケット、ネットワークインターフェースコントローラなどのネットワーキングインターフェースを含み得る。ネットワーキングインターフェースがどのように実装され得るかの複数の例が、本技術の当業者には明らかになるであろう。

【0112】

例えば、ネットワーキングインターフェースは、イーサネット、ファイバチャネル、Ｗｉ－Ｆｉ又は任意の他の無線データリンクプロトコル、トークンリング又はシリアル通信プロトコルのような特定の物理層及びデータリンク層標準を実装することができる。特定の物理層及びデータリンク層は、完全なネットワークプロトコルスタックのためのベースを提供することができ、同じローカルエリアネットワーク(ＬＡＮ)上のコンピュータの小グループ間の通信、及びインターネットプロトコル(ＩＰ)などのルーティング可能なプロトコルを介した大規模ネットワーク通信を可能にする。

【0113】

入力/出力インターフェース１５０は、タッチスクリーン１９０に、並びに/あるいは１つ以上の内部及び/又は外部バス１６０に結合され得る。タッチスクリーン１９０は、ディスプレイの一部であり得る。

【0114】

一部の実施形態では、タッチスクリーン１９０はディスプレイである。タッチスクリーン１９０は、同様にスクリーン１９０と称されることがある。図１に例示される実施形態では、タッチスクリーン１９０は、タッチハードウェア１９４(例えば、ユーザとディスプレイとの間の物理的相互作用の検出を可能にする、ディスプレイの層内に埋め込まれた感圧セル)と、ディスプレイインターフェース１４０並びに/又は１つ以上の内部及び/若しくは外部バス１６０との通信を可能にする、タッチ入力/出力コントローラ１９２と、を備える。

【0115】

一部の実施形態では、入力/出力インターフェース１５０は、タッチスクリーン１９０に加えて、又はその代わりに、キーボード(図示せず)、マウス(図示せず)、トラックパッド(図示せず)、音声ヒューマンマシンインターフェース(ＨＭＩ)(図示せず)、及び/又はユーザがコンピュータシステム１００と対話することを可能にするのに好適な任意の他のデバイスに接続されてもよい。

【0116】

本技術の一部の実装形態によれば、ソリッドステートドライブ１２０は、本明細書で説明する１つ以上の方法の行為を実行するために、ランダムアクセスメモリ１３０にロードされ、プロセッサ１１０によって実行されるのに好適なプログラム命令を記憶する。例えば、プログラム命令の少なくとも一部は、ライブラリ又はアプリケーションの一部であってもよい。

【0117】

図２は、本技術の一実施形態による自律システム２００の高レベル概略図を例示している。自律システム２００は、コンピュータシステム２１０を備え得る。コンピュータシステム２１０は、コンピュータシステム１００であってもよく、かつ/又はコンピュータシステム１００の構成要素の一部又は全部を含んでもよい。コンピュータシステム２１０は、以下でより詳細に説明する推論モジュール２５０と、計画モジュール２６０と、実行モジュール２７０と、を備え得る。

【0118】

自律システム２００は、環境２３０内で動作することができ、支援タスクを行うことができる。環境２３０は、限定はしないが、ショッピングセンター、オフィスなどの物理的環境であってもよく、又はコンピューティングデバイスネットワーク、配電網などの論理的環境であってもよい。環境２３０は、限定はしないが、店舗、ドア、廊下、人々、又は物理環境２３０の場合に支援タスクを実施するためにその特徴が関連し得る任意の他のエンティティなどのエンティティと、論理環境２３０の場合に支援タスクを実施するためにその特徴が関連し得るプロセッサ、ネットワーキングデバイス、インターフェース、又は任意の他のエンティティと、を含み得る。したがって、エンティティ及びエンティティ間の関係を使用して、環境２３０を画定することができる。

【0119】

自律システム２００は、知覚ユニット２１２を介して環境２３０内の生データを取り込むように構成される。知覚ユニット２１２は、ヒューマンマシンインターフェース、カメラなどのセンサ、ＬｉＤＡＲセンサ、又は物理的環境２３０に適合された任意のタイプの検知デバイスを備えてもよく、電流計、データフローセンサ、接続インジケータ、又は論理的環境２３０に適合された任意のタイプのセンサを備えてもよい。生データは、知覚ユニット２１２に通信可能に接続されたコンピュータシステム２１０によって処理することができる。

【0120】

コンピュータシステム２１０は、環境２３０内で発生するイベントを記述するためのコンピュータ可読命令の形態で動的環境プロパティ又は「ファクト」を生成し、生成された動的環境プロパティのコヒーレンスチェックを実行し、更に、１つ以上の動的環境プロパティがインコヒーレント又は「異常」であるという判定が行われた場合、環境２３０のエンティティと対話するように構成される。かかるコンピュータ可読命令は、イベントに関するステートメントを作成する述語表現であってもよい。コヒーレンスチェックの実行のプロセスは、以下でより詳細に説明される。

【0121】

コンピュータシステム２１０は、自律システムに対して内部にあっても外部にあってもよく、自律システム２００に通信可能に接続される。一実施形態では、コンピュータシステム２１０は、外部にあり、ネットワーク(図示せず)を介して複数の自律システム２１０に通信可能に接続されてもよい。

【0122】

コンピュータシステム２１０は、動的環境プロパティと、コンピュータシステム２１０によって使用され得る任意の情報とを、以下で説明する特定のコンピュータ可読フォーマットの下でメモリ２１６に記憶するように構成され得る。メモリ２１６は、自律システム２００に組み込まれてもよく、又は外部の物理的なロケーションに位置してもよい。コンピュータシステム２１０は、ローカルエリアネットワーク(ＬＡＮ)などのネットワーク(図示せず)、及び/又はワイヤレスローカルエリアネットワーク(ＷＬＡＮ)若しくは広域通信網(ＷＡＮ)などのワイヤレス接続を介して、メモリ２１６のコンテンツにアクセスするように構成され得る。自律システムは、コンピュータシステム２１０に通信可能に接続され、自律システム２００の動作のための命令、動的環境プロパティ、又は任意の他の情報を受信する、ネットワーキングデバイス２１１を備え得る。

【0123】

メモリ２１６は、以下で説明する特定のコンピュータ可読フォーマットの下で候補オブジェクティブを含み得る。１つ以上の候補オブジェクティブは、異常イベントの検出時にコンピュータシステム２１０によってアクティブ化され、それによって１つ以上の対応する「アクティブオブジェクティブ」を定義することができる。アクティブオブジェクティブは、対応する異常イベントに対処するために、更に実行されてもよく、かつ/又は自律システム２００のオペレータに伝送されてもよい。アクティブオブジェクティブは、メモリ２１６に記憶され得る。

【0124】

自律システム２００は、アクティブオブジェクティブを実行することによって自律システム２００に環境２３０内で対話させるように構成された対話ユニット２２０を備える。対話ユニット２２０は、ヒューマンマシンインターフェース、１つ以上のスクリーン、スピーカ、マイクロフォン、物理アクチュエータ、駆動システム、又は環境２３０が物理環境である場合に物理環境内で対話するために使用され得る任意の好適なシステム、あるいは環境２３０が論理環境である場合に論理環境において使用され得る論理アクチュエータ、プロセッサ、又は任意の好適なシステムなどの対話要素を動作させることができる。

【0125】

本開示を明確にするために、以下の例は、物理環境２３０に関する。これは、単に本開示の読解を容易にするために行われるものであり、やはり、本技術の範囲を定義するものでも、本技術の境界を示すものでもない。

【0126】

コンピュータシステム２１０は、環境２３０内のイベントを記述するために動的環境プロパティを使用するように構成される。各動的環境プロパティは、イベントベースのステートメントを含むコンピュータ可読命令とすることができる。イベントベースのステートメントは、１つ以上のパラメータを有する事前定義された記述関数であり、事前定義された記述関数は、対応するイベントの特性を表す。例えば、ｐ１として識別され、走っているとして検出された人間は、コンピュータシステム２１０によって、イベントベースのステートメントｒｕｎｎｉｎｇ(ｐ１)で記述することができ、ここでｒｕｎｎｉｎｇ()は事前定義された記述関数であり、ｐ１はパラメータである。

【0127】

イベントは、

【数1】

などのイベントベースのステートメントの論理的な関連付けに対応することができ、ｐ１ｒｕｎｎｉｎｇとして識別される成人のイベントを表す。

【0128】

この例示的な例では、

【数2】

は、２つのイベントベースのステートメントｒｕｎｎｉｎｇ(ｐ１)及びａｄｕｌｔ(ｐ１)の論理積である動的環境プロパティである。

【0129】

当業者であれば理解するように、特定のコンピュータシステム２１０及び特定の知覚ユニット２１２が与えられると、自律システム２００に対して有限数の検出可能なイベントが存在し、したがって、それらの検出は少なくとも知覚ユニット２１２に含まれる検知デバイスの精度に依存するため、有限数の事前定義された記述関数が存在する。

【0130】

イベントベースのステートメントによる動的環境プロパティの前述の表現は、本技術の限定的な態様ではない。環境２３０内で発生するイベントの表現は、異なるコンピュータ可読実装形態を有し得るため、これはむしろ、他の可能な実施形態の中でも１つの例示的な実施形態である。動的環境プロパティは、他の形態の論理式によって表すことができる。上述のイベントベースのステートメントは、環境２３０において検出されたイベントの特性の記述に対応する任意の好適なコンピュータ可読命令の形態をとることができる。

【0131】

知覚ユニット２１２は、信号の処理及び/又はコンピュータビジョンソフトウェアアプリケーションを実行して、イベントの発生を検出するように構成され得る。イベントに対応する動的環境プロパティを提供するために、コンピュータシステム２１０は、イベントベースのステートメントのリスト内の１つ以上のイベントベースのステートメントを選択するように更に構成され、イベントベースのステートメントのリストは、知覚ユニット２１２によって検出され得るイベントの特性のリストである。

【0132】

一例として、知覚ユニット２１２は、成人がモール内で走っていることを検出することができる。コンピュータシステム２１０は、ａｄｕｌｔ(ｐ)、ａｔ(ｐ,ｍａｌｌ)、及びｒｕｎｎｉｎｇ(ｐ)という３つのイベントベースのステートメントを選択することができ、ここでｐは走っている人間を識別する。イベントベースのステートメントａｄｕｌｔ(ｐ)は、人間が成人であるという検出可能な特性に対応し、イベントベースのステートメントａｔ(ｐ,ｍａｌｌ)は、人間がモール内に位置するという検出可能な特性に対応し、イベントベースのステートメントｒｕｎｎｉｎｇ(ｐ)は、人間が走っているという検出可能な特性に対応する。人間は、ヘッドホンで音楽を聴いている場合がある。

【0133】

しかしながら、知覚ユニット２１２がこの特性を検出するように構成されていない場合、この特性を表すために利用可能なイベントベースのステートメントはない。したがって、この特性は、コンピュータシステム２１０によって生成される動的環境プロパティの一部でなくてもよい。

【0134】

計算ユニットは、イベントベースのステートメントを論理積に関連付けることによって動的環境プロパティを生成する。
Ｅ１:ａｄｕｌｔ(ｐ)^ａｔ(ｐ,ｍａｌｌ)^ｒｕｎｎｉｎｇ(ｐ)

【0135】

追加的又は代替的に、コンピューティングユニットは、以下の形式でイベントの記述を生成してもよい。Ｅｖｅｎｔ(ｉｄ,ｌｏｃａｔｉｏｎｌ,ｔｉｍｅｔ,ａｇｅｎｔｐ,ｓｅｍａｎｔｉｃ)、ここで、ｉｄは、イベントの識別子であり、ｌｏｃａｔｉｏｎｌは、イベントの発生ロケーションであり、ｔｉｍｅｔは、イベントの発生時間であり、ａｇｅｎｔｐは、イベントのアクタ又は主題であり、ｓｅｍａｎｔｉｃは、イベントベースのステートメントに基づくイベントのセマンティック記述である。例えば、セマンティック記述は、以下の属性を含み得る。
Ａｔ｜Ｉｎ｜Ｉｎｆｒｏｎｔｏｆ｜ｍｏｔｉｏｎｌｅｓｓ｜ｒｕｎｎｉｎｇ｜ｒｅｓｔａｒｅａ｜ｒｅｑｕｅｓｔ｜…

【0136】

イベントの記述は、メモリ２１６に記憶され得る。この実施形態によれば、上記の例の説明は以下の通りである。
Ｅｖｅｎｔ(１,ｍａｌｌ,１０:４０,ｐ,ｒｕｎｎｉｎｇ(ｐ);ａｄｕｌｔ(ｐ))

【0137】

動的環境プロパティと対応するイベントの記述との間の対応は、情報の表現の単なる選択であることに留意されたい。記述形式は、イベントベースのステートメントから生成することができ、その逆も可能である。

【0138】

ここで図３に目を向けると、推論モジュール２５０又は「知識ベース推論モジュール」２５０の高レベルの概略図が例示されている。推論モジュール２５０は、コンピュータシステム２１０に含まれてもよく、動的環境プロパティに対してコヒーレンスチェックを実行するように構成されてもよい。そのために、推論モジュール２５０は、静的環境プロパティを記憶するように構成された第１のデータベース３０２と、動的環境プロパティを記憶するように構成された第２のデータベース３０４と、を備える。限定はしないが、動的環境プロパティ及び静的環境プロパティは、論理プログラミング言語ＰＲＯＬＯＧの下で表すことができる。

【0139】

静的環境プロパティは、環境２３０のエンティティのプロパティ及びエンティティ間の関係を定義するように構成されたコンピュータ可読命令を含む。例えば、ショッピングセンターの特定のエリアに関する情報を有するショッピングセンターのセマンティックマップが第１のデータベース３０２にポピュレートされ得、エンティティは、ショッピングセンターの店舗及び/又は関心のあるポイントを備える。この例では、第１のデータベース３０２は、ショッピングセンターのエリア及び/又は店舗の間の距離関係、位相関係、及び/又は定性的空間関係を含み得る。より一般的には、第１のデータベース３０２は、環境２３０内のエンティティの記述的特性及び属性を記憶するように構成される。同じ又は別の実施形態では、静的環境プロパティは、以下のような静的ステートメント又は静的ステートメントの論理的関連付けとして表される。

【0140】

Ｐ１:ｎａｍｅ(ｓｔｏｒｅ１;ａｂｃ);
Ｐ２:ｓｅｌｌｓ(ａｂｃ;ｃｈｉｌｄｒｅｎＣｌｏｔｈｅｓ);
Ｐ３:ｓｅｌｌｓ(ａｂｃ;ｔｏｙｓ);
Ｐ４:￢ａｔ(ｐ,ｃｏｒｒｉｄｏｒ１)。

【0141】

静的ステートメントは、同様に表現され、同様の事前定義された記述関数から構成されるため、イベントベースのステートメントと同様である。しかしながら、静的環境プロパティを画定する静的ステートメントは、最初に自律システム２００のオペレータによって第１のデータベース３０２にポピュレートされ、イベントを表さない。この実施形態では、オペレータは、人間のオペレータ、又は第１のデータベース３０２に通信可能に接続され、動作コンピュータシステムによって受信された情報に基づいて当該データベースを自動的にポピュレートするように構成された動作コンピュータシステムであってもよい。

【0142】

更に、静的ステートメントの事前定義された記述関数は、同じパラメータに対応するあらゆるオブジェクトに適用することができる。一例として、誰もｃｏｒｒｉｄｏｒ１にいるべきではないことを示すＰ４は、人間である全てのオブジェクトｐに適用され、１人の人間だけに適用されるのではない。

【0143】

上記の例示的な静的環境プロパティでは、Ｐ１は、ａｂｃがｓｔｏｒｅ１として識別されるストアの名前であることを示し、Ｐ２及びＰ３は、それぞれ、ストアａｂｃが子供用の衣服及び玩具を販売することを示し、Ｐ４は、ｃｏｒｒｉｄｏｒ１として識別される廊下が、誰もここで発見されるべきではないので閉じられていることを示す。

【0144】

第１のデータベース３０２内の静的環境プロパティを画定する静的ステートメントは、特定の情報を更新するためにオペレータによって最初に及び/又は更に更新されてもよい。一例として、オペレータは、Ｐ４を削除して、ｃｏｒｒｉｄｏｒ１がもはや閉鎖されていないことを自律システム２００に通知し、ｃｏｒｒｉｄｏｒ２として識別された別の廊下が閉鎖されていることを示すために新しい静的環境プロパティを追加することができる。第１のデータベース３０２内の静的環境プロパティの更新は、オペレーティングコンピュータシステムからの情報に基づく定期的な自動更新とすることができる。例えば、第１のデータベース３０２は、オペレーティングコンピュータシステムから抽出された情報に基づいて、無線(ＯＴＡ)更新で更新されてもよい。

【0145】

第１のデータベース３０２は、オペレータによってポピュレートされ、「子供は玩具が好きである」など、全ての人間が知っていると予想される共通の事実に対応するコンピュータ可読命令である常識ルールをコンピュータ可読フォーマットで更に含む。一例として、第１のデータベース３０２は、コンピュータ可読フォーマットの下で、「人々は概してモール内で走っていない」又は「店内の火災は危険である」という情報を含み得る。

【0146】

常識ルールは、環境２３０の文化的コンテキストに適合するようにオペレータによって調整され、それによって自律システム２００による常識推論を発展させることができる。一実施形態では、オペレータは、機械学習アルゴリズム(ＭＬＡ)を用いて、訓練データセットに基づいて常識ルールを生成し、訓練データセットは、訓練常識ルールと、環境２３０の文化的コンテキストに関する情報とを含む。一例として、環境２３０の文化的コンテキストについての情報は、動的及び/又は静的環境プロパティから推論され得る。

【0147】

例えば、常識ルールは、自律システム２００が博物館で動作する場合には人間が走るべきではなく、自律システム２００がスポーツ施設で動作する場合には通常であることを示してもよい。

【0148】

常識ルールは、以下のような静的ステートメント又は静的ステートメントの論理的関連として表すことができる。

【数3】

【0149】

上記の例示的な静的環境プロパティでは、Ｋ１は、モール内の成人が通常は走っていないことを示し、Ｋ２は、モール内の子供が通常は玩具を買うことに関心があることを示し、Ｋ３は、成人であるモール内の人間が通常は衣服を買うこと又はレストランに行くことに関心があることを示す。

【0150】

コンピュータシステム２１０は、イベントが複数回発生したという判定が行われた場合に、第１のデータベース３０２に新しい常識ルール又は静的環境プロパティをポピュレートするか、又は新しい常識ルール又は静的環境プロパティのポピュレートを提案するためにオペレータに信号、通知などを送信するように構成されてもよい。例えば、発生の閾値は、オペレータによって第１の動的環境プロパティに関連付けられてもよい。したがって、コンピュータシステム２１０は、第１の動的環境プロパティに対応するイベントの発生回数を超えたという判定が行われた場合に、第１の動的環境プロパティに基づいて常識ルール又は静的環境プロパティを生成するように構成されてもよい。

【0151】

一例として、セキュリティエージェントが７日間毎日特定の時間に特定の店舗の前にいるという判定が自律システム２００によって行われた場合、知識ベースコンピュータシステム２１０は、セキュリティエージェントが毎日特定の時間に特定の店舗の前にいることを示す静的環境プロパティを第１のデータベース３０２に生成するように構成されてもよい。その場合、当該時間に当該店舗の前のセキュリティエージェントを検出しないことは「異常」であり得る。したがって、自律システムは、イベントの発生に基づいて「異常」イベントの定義を適合させることができる。

【0152】

第１のデータベース３０２は、常識ルールを含む第１のサブデータベースと、他の静的環境プロパティを含む第２のサブデータベースとに区分され得る。

【0153】

第２のデータベース３０４は、上述した動的環境プロパティを記憶するように構成され得る。第１のデータベース３０２とは異なり、第２のデータベース３０４は、環境２３０内で発生していた、又は発生しており、知覚ユニット２１２によって検出されたイベントに対応する動的環境プロパティを受信する。以下は、第２のデータベースに記憶された動的環境プロパティの例示的な例である。

【数4】

【0154】

上記の例示的な動的環境プロパティでは、Ｅ１は、ｐ１として識別された人間が成人であり、モールにおり、走っていることを示し、Ｅ２は、ｐ２として識別された人間がモールにおり、子供であり、玩具を買うことに関心がないことを示す。ｐ２が玩具を買うことに関心がないという情報は、タッチスクリーンパッドなどのヒューマンマシンインターフェース、又はこの情報を決定するための任意の好適な様式を介して決定され得る。

【0155】

知覚ユニット２１２を用いて環境２３０内の新しいイベントを観測すると、コンピュータシステム２１０は、新しいイベントに基づいて第２のデータベース３０４内に新しい動的環境を生成する。生成は、イベントベースのステートメントのリスト内の１つ以上のイベントベースのステートメントを選択することによって実施され得、イベントベースのステートメントのリストは、知覚ユニット２１２によって検出され得るイベントの特性のリストである。

【0156】

したがって、コンピュータシステム２１０は、知覚ユニット２１２に従って新しいイベントに対応するできるだけ多くのイベントベースのステートメントを選択し、新しい動的環境プロパティを更に生成するように構成され得る。特徴の検出は、知覚ユニット２１２によって使用されるコンピュータビジョン方法及びアルゴリズムに依存し得る。したがって、イベントを記述するために使用され得るイベントベースのステートメントのリストは、知覚ユニット２１２によって検出され得る各特性がイベントベースのステートメントによって記述され得るように、好適な様式で少なくともポピュレートされるべきである。

【0157】

推論モジュール２５０は、第２のデータベース３０４で見つかった動的環境プロパティの集合に基づいてメタ動的環境プロパティを生成するように構成され得る。メタ動的環境プロパティは、特定の動的環境プロパティの集合が第２のデータベース３０４に存在するという判定が推論モジュール２５０によって行われた場合に生成される動的環境プロパティである。同じセットの動的環境プロパティは、共通のロケーション、共通の発生時間などの共通のイベントベースのステートメントを有することができる。

【0158】

メタイベントは、イベント集約演算子を使用することによって生成することができる。例えば、ｒｕｎｎｉｎｇ(ｐ１)は、他の動的環境プロパティに基づいて生成されるメタ動的環境プロパティである。実際、一連の動的環境プロパティは、以下のように表される。同じ人間とのＥｖｅｎｔ(ｉｄ,ｌｏｃａｔｉｏｎ,ｔｉｍｅ,ｐｅｒｓｏｎ,ａｔ(ｐｅｒｓｏｎ,ｌｏｃａｔｉｏｎ))は、これらのイベントのロケーション及び時間に応じて、この人間がゆっくり歩いているか、速く歩いているか、走っているかを検出するのに役立ち得る。

【0159】

実際には、持続時間にわたる２つのロケーション間の距離が速度を導出し、推論モジュール２５０は、この速度を非常に高速、通常、又は低速として分類し、それによって、速度が非常に高速である場合、メタ動的環境プロパティｒｕｎｎｉｎｇ(ｐ１)を生成するように構成され得る。

【0160】

第１のデータベース３０２及び第２のデータベース３０４は、エンティティの特性を記述するコンピュータ可読フォーマットの下で論理式を含むことができ、したがって環境２３０の知識を与えることができるため、「知識ベース」と称されることがある。

【0161】

第１のデータベース３０２及び第２のデータベース３０４に基づいて、推論モジュール２５０は、以下に記載されるように、インコヒーレントなイベント又は「異常な」イベントを検出するように構成され得る。推論モジュール２５０は、第２のデータベース３０４内の全ての新しいエントリ、すなわち全ての動的環境プロパティ及びメタ動的環境プロパティに対してコヒーレンスチェック手順を実行するように構成された論理推論サブモジュール３１０を備える。第２のデータベースに新たなエントリＥ０があると、論理推論サブモジュール３１０は、第１のデータベース３０２をブラウズするように構成される。新しいエントリＥ０は、第１のデータベース３０２の常識ルール及び静的環境プロパティの全ての組み合わせと比較される。

【0162】

一実施形態では、比較は論理積＾にある。ルールベースの順方向推論を使用する動的環境プロパティのコヒーレンスチェックのための例示的で非限定的な擬似アルゴリズムを以下に提示する。

【0163】

【表1】

【0164】

以下は、動的環境プロパティＥ１及びＥ２に対するコヒーレンスチェックの実行の例示的な例である。

【数5】

【0165】

動的環境プロパティＥ１に対するコヒーレンスチェックの実行は、論理式

【数6】

の一貫性を検査することにある。この場合、論理推論サブモジュール３１０は、式

【数7】

が不一致である(すなわち、

【数8】

は、Ｋ１とＥ１との間の不一致により真である)ため、Ｅ１の不一致を返す。その結果、Ｅ１は「異常」又は「インコヒーレント」とマークされる。同様に、論理推論サブモジュール３１０は、

【数9】

が不一致である(Ｐ２とＥ２との間の不一致による)ため、Ｅ２の不一致を返す。

【0166】

動的環境プロパティが、環境２３０内のインコヒーレントなイベントに対応する異常であると判定すると、論理推論サブモジュール３１０は、異常な動的環境プロパティを、異常な動的環境プロパティのリスト、すなわち「異常イベントのリスト」３１２に追加することができる。第２のデータベース３０４に新しい動的環境プロパティが継続的にポピュレートされると、異常な動的環境プロパティ３１２のリストは、論理推論サブモジュール３１０によって継続的に更新され得る。代替的な実施形態では、イベントを「異常」として識別するための他のコヒーレンスチェック手順が企図される。

【0167】

自律システム２００の役割は、環境２３０及び環境２３０のエンティティと対話して、インコヒーレントなイベントを修正及び解決することである。推論モジュール２５０は、選択又は「アクティブ化」され、更に実行され、及び/又はオペレータに伝送されて、インコヒーレントイベントを訂正及び解決することができる候補オブジェクティブを含む候補オブジェクティブデータベース３０６を含む。

【0168】

アクティブ化及び実行されると、候補オブジェクティブは、自律システム２００のためのアクティブなオブジェクティブになり、インコヒーレントなイベントを訂正及び解決するために自律システム２００によって実施される１つのタスク又は複数のタスクを表す。候補オブジェクティブのアクティブ化は、以下でより詳細に説明される。

【0169】

各候補オブジェクティブは、コンピュータ可読命令を含むことができ、アクティブ化条件又は「選択条件」、識別子、オブジェクティブカテゴリ(例えば、監視、支援、ガイダンス、広告など)、ロケーション、時間、物体、人間などの可変状態を記述するパラメータ、及び漸進的タスクユニット構造、又はそれらの組み合わせによって、以下のように記述され得る。
Ｏｂｊｅｃｔｉｖｅ(ａｃｔｉｖａｔｉｏｎ＿ｃｏｎｄｉｔｉｏｎ,ｉｄｅｎｔｉｆｉｅｒ,ｏｂｊｅｃｔｉｖｅｃａｔｅｇｏｒｙ,ｐａｒａｍｅｔｅｒｓ,ｐｒｏｇｒｅｓｓｉｖｅｔａｓｋｕｎｉｔｓｔｒｕｃｔｕｒｅ)。

【0170】

漸進的タスクユニット構造は、一連のタスク、命令、アクションストラテジ、又は対応するオブジェクティブを満たすために実施されるアクションの任意の他の形態の指示を含み得る。

【0171】

候補オブジェクティブのアクティブ化条件は、１つ以上の動的環境プロパティに対応することができる。推論モジュール２５０は、異常な動的環境プロパティ３１２のリストの動的特性を候補オブジェクティブのアクティブ化条件と比較するように構成された比較サブモジュール３２０を備え得る。比較モジュール３２０によって、対応する１つ以上の動的環境プロパティが異常な動的環境プロパティのリスト３１２内に見つかったという判定が行われた場合、アクティブ化条件が満たされる。

【0172】

アクティブ化条件は、事前定義された記述関数内の特定のパラメータ又は非特定のパラメータを有するイベントベースのステートメントを有する動的環境プロパティとすることができる。起動すべき候補オブジェクティブを決定するための例示的で非限定的な擬似アルゴリズムを以下に示す。

【0173】

【表2】

【0174】

候補オブジェクティブがアクティブ化されると、比較サブモジュール３２０は、候補オブジェクティブからアクティブオブジェクティブを生成することによって候補オブジェクティブを実行するように構成される。比較サブモジュール３２０は、候補オブジェクティブのパラメータを、対応する候補オブジェクティブのアクティブ化条件を満たさせた動的環境プロパティのイベントベースのステートメントの事前定義された記述関数のパラメータで更新することによって、候補オブジェクティブからアクティブオブジェクティブを生成することができる。

【0175】

したがって、新しい異常イベントの検出によって引き起こされる新しいアクティブオブジェクティブの生成は、当該異常イベントのパラメータに基づく。比較サブモジュール３２０は、自律システム２００によって遂行されるアクティブオブジェクティブ３２２のリストを確立するように構成される。一例として、候補オブジェクティブを以下に示す。

【数10】

【0176】

動的環境プロパティＥ１:

【数11】

が異常とマークされた場合、ｐ１が人間を識別することができ、ｐが全ての人間を包含することができるため、前述の候補オブジェクティブをアクティブ化することができる。したがって、以下のアクティブオブジェクティブが、論理推論サブモジュール３１０によって生成される。

【数12】

【0177】

アクティブオブジェクティブ３２２のリストは、どのアクティブオブジェクティブが自律システム２００に従って遂行され得るかに関する情報を提供するために、自律システム２００のオペレータに伝送され得る。アクティブオブジェクティブ３２２のリストは、推論モジュール２５０から自律システム２００のオペレータに更に送信されてもよく、かつ/又はコンピュータシステム２１０の別のモジュールに伝送されて、自律システム２００にアクティブオブジェクティブを実行させてもよい。より正確には、自律システム２００は、アクティブオブジェクティブのリスト３２２に含まれるアクティブオブジェクティブの漸進的タスクユニット構造を実行するように構成されてもよい。

【0178】

アクティブオブジェクティブのリストは、推論モジュール２５０によって更新されてもよい。第１のデータベース３０２又は第２のデータベース３０４に新しいエントリがあると、論理推論サブモジュール３１０は、前述のプロセスに従って新しいエントリを用いてアクティブオブジェクティブ３２２のリストの各アクティブオブジェクティブのコヒーレンスチェックを実行するように、換言すれば「アクティブオブジェクティブの一貫性のコヒーレンスチェック」を実行するように構成され得る。１つのアクティブオブジェクティブが新しいエントリに関してインコヒーレントであるという判定が行われた場合、当該アクティブオブジェクティブは、アクティブオブジェクティブ３２２のリストから除去され得る。

【0179】

ここで図４に目を向けると、本技術の一実施形態による、オブジェクティブに対応する漸進的タスクユニット構造４００の高レベル概略図が例示されている。各漸進的タスクユニット構造は、対応するオブジェクティブを遂行するために増分的に実施されるアクションを記述し、自律システム２００に利用可能なリソースに従ってアクションを実行するための１つ以上の実行可能な異なるモジュールを含む。換言すれば、漸進的タスクユニット構造４００は、アクションの階層を記述することができ、各アクションは、漸進的タスクユニット構造４００の実行可能モジュールに対応する。

【0180】

実行可能モジュールは、対応する漸進的タスクユニット構造が実行されるときに実行されるように構成される。コンピュータシステム２１０は、漸進的タスクユニット構造から、対応する最適なアクションストラテジ、又は単に「アクションストラテジ」を生成することができる。以下の説明は、漸進的タスクユニット構造の例示的な表現を提供する。

【0181】

漸進的タスクユニットは、拡張可能マークアップ言語(ＸＭＬ)ファイルで符号化することができ、一連の処理レベルＬ＝(ｌ₀,ｌ₁,…,ｌ_|L|)、状態変数の集合Ｘ＝{Ｘ₁,Ｘ₂,…,Ｘ_|X|}、及び環境の観測可能なブールプロパティの集合Ｏ＝{ｏ₁,ｏ₂,…,ｏ_|O|}を含むことができ、式中、｜Ｌ｜、｜Ｘ｜、｜Ｏ｜は有限であり、｜Ｌ｜、｜Ｘ｜、｜Ｏ｜≧０である。各状態変数Ｘ_iには、有限値の集合内の値、すなわち、Ｘi∈Ｈi＝{┴,ｈ_1i,…,ｈi_|Hi|}を割り当てることができ、Ｈiは有限であり、┴は特別なヌル値を表す。

【0182】

各処理レベルｌ_iは、実行可能モジュールのセット、又は単に「モジュール」、Ｍ_i＝{ｍ¹ _i,…,ｍ_i ^|Mi|}から構成され得、アクティブ状態変数の集合、Ｖ_i⊂Ｘに関連付けられ得、アクティブ状態変数は、状態変数Ｘのサブセットである。加えて、又は代替として、各モジュールは、状態変数の別個のサブセットに対応し得る。

【数13】

で、漸進的タスクユニット構造の全てのレベルにおける全てのモジュールのセットを示す。

【0183】

各モジュールｍ_i ^jは、その実行の可能な結果を表すオプションの非空集合{α_i ^j,β_i ^j,..,,χ_i ^j}によって定義することができる。オプションを示すために使用される記号(例えば、α_i ^j)は、全ての漸進的タスクユニット構造において一意の識別子として設定され得る。各オプションは、以下の属性の１つ以上に関連付けることができる。

【0184】

－実行条件α_i ^jψ:Ｏにおける環境１３０の観測可能なブールプロパティの特定の構成。この構成は、対応する結果が発生したことを決定するために実行時に使用される観測可能な条件を表す。実行条件が満足された場合、１つ以上の対応する後続実行可能モジュールが実行され得る。換言すれば、実行条件は、前のモジュールの実行の結果を示す、知覚ユニット２１２によって検出されたイベントに対応し得る。所与の実行可能モジュールのオプションに対応する実行条件は、相互に排他的であってもよい。

【0185】

－確率α_i ^j.ｐ:対応する結果の発生の確率又は対応する実行可能モジュールの「実行確率」であり、モジュール内の全てのオプションに対する全ての確率値の合計は１に等しい。発生確率は、例えばＭＬＡ技術を使用して、動作中に自律システム２００によって学習され得るため、本技術は標準的な計画技術とは区別される。実際に、標準的な計画技術は、１つのアクションの実行が１つの結果のみを有し得ることを考慮し得る。一例として、標準的な計画技術では、自律システムがドアを開くことである場合、計画時におけるこのアクションの対応する結果は、ドアが開くことである。しかしながら、これは、ドアがロックされ又は壊れる可能性を考慮していない。コンピュータシステム２１０は、自律システムの動作中の経験に基づいて、及び/又はＭＬＡ技術を使用して、結果の発生の確率を確立することができる。

【0186】

－実行スコア又は「品質」、α_i ^j.ｑ:この結果を達成するための推定スコア。実行スコアは、一定値又は状態変数Ｘの関数であってもよい。それは、対応するタスクを実施するためにどの実行可能モジュールが優先的に実行されるべきかを示すアクションストラテジを生成するために使用されてもよい。

【0187】

－持続時間α_i ^j.ｄ:この結果を達成するための推定時間。一実施形態では、ｄは、アクションを実施するための特定のリソースの推定量を表す。例えば、ｄは、アクションを実施するために必要とされるメモリサイズ、又はアクションを実施するために必要とされる自律システム２００のバッテリの推定量を表すことができる。持続時間は、一定値として、又は状態変数の関数として表すことができる。

【0188】

－１つ以上の後続実行可能モジュールα_i ^j.ＳＭ:対応する結果の後にイネーブルされる後続実行可能モジュールのセット。同じ又は別の実施形態では、後続の実行可能モジュールは、同じレベルにあるか、又は現在の実行可能モジュールに対して次のレベルにある。

【0189】

－１つ以上の状態変数更新α_i ^j.ＳＶＵ:この結果の後に考慮されなければならない状態変数割り当てのセットであり、状態変数は自律システム２００の状態の記述に対応する。対応する結果が生じたと判定されると、１つ以上の状態変数を更新することができ、(Ｘ_k←ｈ^’ _k)∈α_i ^j.ＳＶＵ、Ｘｉ∈Ｖ_iであり、現在のレベルに対応する状態変数のみが更新され得ることを考慮し、ｈ^’ _i∈Ｈ_iである。

【0190】

各漸進的タスクユニット構造、したがって各オブジェクティブは、当該漸進的タスクユニット構造の優先度の相対的レベルを定義する優先度関数に関連付けることができる。追加的又は代替的に、各モジュールは、他の実行可能モジュール及び/又は漸進的タスクユニット構造の優先度のレベルと比較した、対応する実行可能モジュールの優先度の相対的レベルを定義する優先度関数に関連付けられ得る。優先度関数は、以下で説明するように、アクションストラテジの実行中に使用することができる。

【0191】

漸進的タスクユニット構造４００は、候補オブジェクティブ又は自律システム２００がユーザと対話する必要があるという判定が行われた場合に満たされるオブジェクティブに対応し得る。したがって、漸進的タスクユニット構造４００は、ユーザを待って当該ユーザと対話するために実施されるアクションを含み得る。

【0192】

この例示的な漸進的タスクユニット構造４００では、自律システム２００は、ユーザの要求に応じて２つのアクティビティＡ及びＢを実行することができる。しかしながら、ユーザは、これらの能力を認識していない場合がある。自律システム２００は、最初に待機状態にあってもよい。

【0193】

ユーザがロボットの前で検出されるときはいつでも、自律システム２００は、それが実施し得るアクティビティＡ及びＢを記述するためにユーザとの対話を開始することができる。ユーザは、次いで、それらのうちの１つを選択するか、又は関心がないと回答することができる。アクティビティが選択されると、自律システム２００は、それを実施するためのタスクを実行する。各アクティビティは、アクティビティＡのための２つの代替タスクＴａｓｋＡ１及びＴａｓｋＡ２、並びにアクティビティＢのためのＴａｓｋＢ１及びＴａｓｋＢ２の実行によって行われ得る。タスクの実行後、自律システム２００は、待機状態に戻り、次のユーザを待機することができる。

【0194】

例示的な漸進的タスクユニット構造４００は、３つの処理レベル、すなわち、実行可能モジュール４１２を含む初期層４１０と、実行可能モジュール４２２を含む対話層４２０と、実行可能モジュール４３２、４３４、４３６、及び４３８を含むアクション層４３０と、実行可能モジュール４４２を含む最終層４４０と、を含む。この例示的な例では、Ｘは空であり、Ｏ＝{ｐｅｒｓｏｎ;Ａ;Ｂ;ｎｏｎｅ}である。持続時間(ｄ)及び品質(ｑ)の特定の値が、対応する実行可能モジュールにおいて図４に示され、結果の確率及び実行可能モジュールＭのリストが図５に例示されている。

【0195】

ユーザとの対話中に、以下の不都合が発生する可能性がある。すなわち、ユーザが、例えば自律システム２００に応答しないことによって対話を完了しない、任意のアクションが、漸進的タスクユニット構造４００において定義されていない理由で失敗する可能性がある、並びに/又は任意のアクションが、一部の外部コマンド及び/若しくは条件に従って中止される可能性がある。

【0196】

本技術にロバスト性を提供するために、各実行可能モジュールは、状態変数Ｘのサブセットの所定の構成と関連付けられてもよい。例えば、カメラで写真を撮影する例示的アクションに対応する第１の実行可能モジュールは、状態変数の以下の構成と関連付けられてもよい。

【0197】

{ｃａｍｅｒａ:ＯＮ,ｂａｔｔｅｒｙ:ＨＩＧＨ}、状態変数は、自律システム２００のカメラ状態「ｃａｍｅｒａ」及びバッテリレベル「ｂａｔｔｅｒｙ」である。

【0198】

第１の実行可能モジュールに対応するアクションは、当該第１の実行可能モジュールの構成が満たされていないという判定が行われた場合、自律システム２００の障害又は「障害状態」として識別され得る。例えば、カメラがオフであり、かつ/又はバッテリが低い場合、自律システムは障害状態であると宣言され得る。漸進的タスクユニット構造は、自律システム２００が障害状態であると宣言されたときに実行されるように構成された障害回復モジュールを含み得る。

【0199】

以下でより詳細に説明されるように、障害回復モジュールは、自律システム２００が、対応するタスクの遂行を追求するために実行可能モジュールに対応するアクションを実施することに失敗したという判定が行われたときに、コンピュータシステム２１０によって実行され得るリソース有界を表す。換言すれば、状態変数又は状態変数の部分集合が値の１つ以上の特定の組み合わせを有するという判定が行われたとき、障害回復モジュールが実行され得る。

【0200】

障害回復モジュールは、状態変数の１つ以上の構成に対応することができる。換言すれば、障害回復モジュールは、異なる障害状況を「包含」し、当該状況から回復するために実行され得る。

【0201】

前の例に戻って参照すると、第１の実行可能モジュールが実行されることになり、状態変数の構成が{ｃａｍｅｒａ:ＯＦＦ,ｂａｔｔｅｒｙ:ＨＩＧＨ}の場合、自律システムは、カメラを用いて画像を捕捉しなくてもよい。状態変数{ｃａｍｅｒａ:ＯＦＦ,ｂａｔｔｅｒｙ:ＨＩＧＨ又はＬＯＷ}の構成に対応する障害回復モジュールを漸進的タスクユニット構造に組み込んで、例えば自律システムを修理ステーションに行かせることができる。したがって、アクションの起こり得る障害は、障害回復モジュールを用いて、障害の場合に実施されるリソース制限付きアクションを示すことによって、アクションストラテジの実行の前に予期され得る。

【0202】

本明細書で説明される漸進的タスクユニット構造は、タスクを記述する形式を包含する。この実施形態では、漸進的タスクユニット構造は、利用可能なリソースに従ってタスク遂行の深さ及び精緻化を適応させる能力が提供されるように、対応するタスクを遂行するための異なる方式を表す階層として形式化される。当業者は、本技術が統一された計画言語を記述することができ、階層的タスクネットワーク(ＨＴＮ)、動的ベイズネットワーク(ＤＢＮ)、及び代数的決定図(ＡＤＢ)が漸進的タスクユニット構造から検索及び/又は導出され得ることを理解するであろう。

【0203】

図５は、本技術の一実施形態による、漸進的タスクユニット構造の記述的表５００である。記述的表５００は、漸進的タスクユニット構造４００の実行可能モジュールの名前のリスト５１０を、それぞれのオプション４２０と組み合わせて含む。実行可能及びオプションの各組み合わせは、記述的表５００の列５３０におけるその対応する実行条件、列５４０におけるその対応する確率、及び列５５０におけるその後続の実行可能モジュールに関連付けられる。

【0204】

例えば、漸進的タスクユニット構造４００の実行可能モジュール４２２、すなわち記述的表５００内の実行可能モジュール

【数14】

は、３つのオプションを含む。

【0205】

【数15】

は、ユーザがアクティビティＡを選択した場合の結果に対応し、

【数16】

は、ユーザがアクティビティＢを選択した場合の結果に対応し、

【数17】

は、ユーザがいずれも選択しなかった場合の結果に対応する。

【0206】

漸進的タスクユニット構造は、図４に例示する木構造として、図５に例示する記述的表として、又は同等の特徴を有する任意の他の好適な様式として表すことができる。図４及び図５の図は、理解を助けるために設定されており、本技術の範囲を示すものではない。この態様は限定的ではない。

【0207】

計画モジュール２６０は、漸進的タスクユニット構造４００などの漸進的タスクユニット構造からアクションストラテジを導出するように構成されてもよく、アクションストラテジの実行は、当該漸進的タスクユニット構造に対応するアクティブオブジェクティブを遂行することをもたらす。したがって、実行可能なアクションストラテジは、自律システム２００の漸進的タスクユニット構造及び状態変数に依存する。

【0208】

一実施形態では、計画モジュール２６０は、コンピュータシステム２１０によって受信された各候補オブジェクティブに対して１つのアクションストラテジを生成するように構成されてもよい。計画モジュール２６０は、好ましくは、より高いレベルの優先度を有するアクティブオブジェクティブを選択し、他のアクティブオブジェクティブを処理する前に、それらの漸進的タスクユニット構造を処理するように構成されてもよい。

【0209】

加えて、計画モジュール２６０は、アクティブオブジェクティブの漸進的ユニット構造をマージし、漸進的ユニット構造のマージに基づいてアクションストラテジを生成することにより、複数のアクティブオブジェクティブに対応する複数のアクションストラテジを１つのグローバルアクションストラテジにマージすることができる。漸進的ユニット構造のマージは、それぞれの記述的表５００を連結することによって行うことができる。

【0210】

同じ又は別の実施形態では、計画モジュールは、確率的決定プロセスを使用して、因数分解マルコフ決定プロセスとして形式化された実行可能なアクションストラテジを生成する。マルコフ決定プロセス(ＭＤＰ)は、離散時間確率制御プロセスである。これは、結果が部分的にランダムであり、部分的に意思決定者、すなわちユーザの制御下にあり得る状況において意思決定をモデル化するように構成された数学的フレームワークからなる。当業者が理解するように、漸進的タスクユニット構造に基づいて最適なポリシーを計算するためのプロセスの種々の実装形態が可能であり得るが、それでもなお、本技術の範囲内に留まる。

【0211】

図６は、本技術の一実施形態による、最適アクションストラテジを生成するための方法の動作を示すシーケンス図である。計画モジュールは、図６に例示される動作を実行するように構成されてもよい。ＭＤＰは、ステップ６１０において、漸進的タスクユニット構造に基づいて生成され、ＭＤＰの生成は、以下に説明される。

【0212】

上述のような漸進的タスクユニット構造が与えられると、計画モジュールは、ＭＤＰを生成するように構成される。ＭＤＰは、(Ｓ;Ａ;Ｔ;Ｒ)として定義され、Ｓは、自律システム２００の状態の有限集合であり、Ａは、アクションの有限集合であり、Ｔ(ｓ;ａ_c;ｓ_f)は、アクションａ_cを使用して状態ｓから状態ｓ_fに進む確率を示す遷移関数であり、Ｒ(ｓ;ａ_c;ｓ_f)は、状態ｓにおいてアクションａ_cを使用し、状態ｓ_fに到達するための予想される利得を表す報酬関数である。

【0213】

ＭＤＰは、Ａｐｒａｔｉｃａｌｆｒａｍｅｗｏｒｋｆｏｒｒｏｂｕｓｔｄｅｃｉｓｉｏｎ－ｔｈｅｏｒｅｔｉｃｐｌａｎｎｉｎｇａｎｄｅｘｅｃｕｔｉｏｎｆｏｒｓｅｒｖｉｃｅｒｏｂｏｔｓ (Ｌ.Ｉｏｃｃｈｉｅｔａｌ.２０１６)に記載されているような漸進的タスクユニット構造に基づいて定義されてもよく、その内容は参照により組み込まれる。形式的には、動作６１０における計画モジュールの出力は、

【数18】

とすることができ、式中、

【数19】

は初期状態であり、Ｇは最終状態の集合であり、各タプル

【数20】

において、

【数21】

は、

【数22】

によって定義される状態であり、

【数23】

は、この状態で実行されるアクションであり、漸進的タスクユニット構造内の実行可能モジュールに対応し、ＳＳ_i ^jは、対

【数24】

の集合であり、

【数25】

は、後続状態及びα_i ^kである。ψは、漸進的タスクユニット構造において宣言され、対応する結果に関連付けられた実行条件である。

【0214】

計画モジュールは、動作６２０において、ＭＤＰに基づいて実行可能なアクションストラテジを定義するように更に構成される。計画モジュールは、グローバル実行スコアを決定するように構成されてもよく、グローバル実行スコアは、ＭＤＰの状態に対応する実行可能モジュールに関連付けられた実行スコアの組み合わせである。

【0215】

この実施形態では、実行スコアは、それぞれの実行可能モジュールの実行確率によって重み付けされる。同じ又は別の実施形態では、実行可能なアクションストラテジは、以下のように与えられるベルマン方程式を解くことによって定義される。

【数26】

【0216】

Ｖは、状態ｓ及びにおいてアクションａ_ｃを用いて行動する際の期待利得を表す期待値関数であり、Ｒ及びＴは、それぞれ、報酬関数及び遷移関数である。

【0217】

ＶａｌｕｅＩｔｅｒａｔｉｏｎ［ＲｉｃｈａｒｄＢｅｌｌｍａｎ.Ａｍａｒｋｏｖｉａｎｄｅｃｉｓｉｏｎｐｒｏｃｅｓｓ.ＩｎｄｉａｎａＵｎｉｖ.Ｍａｔｈ.Ｊ.］又はＰｏｌｉｃｙＩｔｅｒａｔｉｏｎ［Ｒ.Ａ.Ｈｏｗａｒｄ.ＤｙｎａｍｉｃＰｒｏｇｒａｍｍｉｎｇａｎｄＭａｒｋｏｖＰｒｏｃｅｓｓｅｓ］などの古典的なアルゴリズムは、最適なアクションストラテジ、又は「最適なポリシー」を効率的に計算するように構成される。

【0218】

図７は、本技術の一実施形態によるアクションストラテジ７００の表現である。アクションストラテジ７００は、例示的な漸進的タスクユニット構造４００に対応する。状態

【数27】

は初期状態であり、

【数28】

は目標状態の集合である。表現７００は、ＭＤＰの状態７１０と、それらの対応するアクション７２０と、それらの対応する集合ＳＳ_i ^jとを含み、これについては前述されている(７３０)。

【0219】

前述したように、漸進的タスクユニット構造の障害回復モジュールは、自律システム２００の障害状態を定義することができる。図８は、本技術の一実施形態によるアクションストラテジ８００の表現である。アクションストラテジの第１の部分８１０は、漸進的タスクユニットの実行可能モジュールに対応する状態、すなわち「安全」状態を含み、アクションストラテジの第２の部分８２０は、漸進的タスクユニットの障害回復モジュールに対応する障害状態、すなわち「非安全状態」を含む。

【0220】

一実施形態では、第１の部分８１０及び第２の部分８２０は、独立して実行され得る２つの異なるアクションストラテジ及び/又は２つの異なる漸進的タスクユニット構造に対応し得る。安全状態を障害状態から分離することは、アクションストラテジの実行中に状態変数の集合を低減し、本技術のスケーラビリティを向上させるのに役立つ。

【0221】

障害回復モジュールは、自律システム２００によって実施されるリソース制限付きアクション、又は別個の漸進的タスクユニット構造、すなわち「障害回復漸進的タスクユニット構造」のいずれかに対応することができる。

【0222】

換言すれば、自律システム２００が第１の漸進的タスクユニット構造の障害回復モジュールに対応する安全でない状態にあるという判定が行われた場合、第２の漸進的タスクユニット構造(例えば、障害回復漸進的タスクユニット構造)が実行され得る。第２の漸進的タスクユニット構造は、自律システムの安全でない状態に対応する障害から回復するために実施されるリソース制限付きアクションの階層を含み得る。第２のアクションストラテジは、第２の漸進的タスクユニット構造から生成され、上述したものと同様の方式で更に実行されてもよい。

【0223】

自律システム２００によって実施されるリソース制限付きアクションに対応する障害回復モジュールは、自律システム２００の「部分的障害状態」を表し、コンピュータシステム２１０による障害回復漸進的タスクユニット構造の実行を引き起こす障害回復モジュールは、自律システム２００の「全体的障害状態」を表すということができる。

【0224】

図７の例証的例では、自律システムは、望ましくない挙動又は「障害状態」であり得る、アクション「Ｂｙｅ」を際限なく繰り返すように構成される。図８では、実行条件

【数29】

が真であるときにシステムを障害状態ｆ₁に遷移させるために、状態変数ＢｙｅＣｏｕｎｔｅｒが対応する漸進的タスクユニット構造に追加されている。したがって、計画モジュールによって実行条件

【数30】

が真であるという判定が行われた場合に、自律システム２００によって特定のアクションが実施されてもよい。

【0225】

図９は、本技術の一実施形態による、実行可能なアクションストラテジ７００の有限状態機械である。この例示的な実施形態では、実行可能アクションストラテジ７００は、自律システム２００の状態

【数31】

を表すノードと、実行可能アクションストラテジアクション

【数32】

の実行を表す遷移と、を有するオートマトンとして表される。アクションストラテジは、有限ホライズン、すなわちアクションの最大数がコンピュータシステム２１０によって設定されるか、又は無限ホライズン、すなわちアクションの制限されていない数のいずれかを有することができる。

【0226】

図７及び図９の例示的な例は、最終状態の後続の実行可能モジュールが最終状態自体であるため、無限ホライズンを有するアクションストラテジを例示している。無限ホライズンは、自律システム２００がアクションストラテジの実行を決して完全に終了しない構成である。

【0227】

実行可能モジュールに対応する状態変数の部分集合を使用することは、アクションストラテジの生成を容易にすることができる。実際に、コンピュータシステムは、対応する漸進的タスクユニット構造における状態変数の部分集合に対応する実行可能モジュールを選択し、それらの実行可能モジュールのみに基づいてアクションストラテジを生成してもよい。

【0228】

例えば、自律システム２００によって人間を探索している間(例えば、当該人間が探索されるであることを示すオブジェクティブに基づくアクションストラテジの実行中)、バッテリがＬＯＷであるという判定が行われた場合、コンピュータシステム２１０は、状態変数:ｂａｔｔｅｒｙ:ＬＯＷを含む実行可能モジュールに対応する当該アクションストラテジのノードのみを考慮し得る。実際、この状況では、自律システム２００は、高レベルのバッテリを必要とするアクションを実施することができない場合がある。

【0229】

このため、状態変数の部分集合は、他の状態変数が実行時に考慮されないことがあるため、「焦点化変数」と称されることがある。例えば、実行可能モジュールの焦点化変数の使用は、アクションストラテジを５００.０００ノードから１００.０００ノードに低減する。

【0230】

例えば、図９のセマンティックマップを画定することによってアクションストラテジを定義すると、計画モジュールは、実行可能なアクションストラテジを実行モジュールに更に伝送するように構成される。実行モジュールは、対話ユニット２２０を介して実行可能なアクションストラテジを実行するように構成される。

【0231】

同じ又は別の実施形態では、実行モジュールは、知覚ユニット２１２に通信可能に接続されて、状態変数Ｘ＝{Ｘ₁,Ｘ₂,…,Ｘ_|X|}を決定し、それによって自律システム２００の現在の状態

【数33】

を決定することができる。対話ユニット２２０は、自律システム２００に環境２３０と対話させるように構成された物理的及び/又は論理的アクチュエータ、機構、デバイス、又は任意の要素を動作させる。

【0232】

実行モジュール２７０は、アクションストラテジを初期状態からブラウズすることによって、実行可能なアクションストラテジを実行するように構成され得る。ＭＤＰの各状態の後続状態のリストは、上述したような漸進的タスクユニット構造に従って生成されてもよく、アクションストラテジに含まれてもよい。したがって、環境２３０の観測可能な環境プロパティにわたる実行条件α_i ^k.ψは、アクションストラテジの実行中に知覚ユニット２１２によって評価されてもよい。

【0233】

自律システム２００がどの第１の状態

【数34】

にあるかを判定すると、実行モジュール２７０は、対応するアクション

【数35】

を実施するように構成され得る。このアクションが実施されると、実行モジュールは、第１の状態

【数36】

の後続状態の中で自律システム２００の新しい状態

【数37】

を決定するように構成され得る。

【0234】

自律システムがＧに含まれる最終状態にあると判定すると、実行モジュールは、計画の実行を終了し、アクションストラテジの実行が完了したことを示す第１の信号をコンピュータシステム２１０に返すように構成される。

【0235】

より一般的な態様では、実行モジュールは、実行モジュールを実行し、自律システム２００の現在の状態

【数38】

を決定すると、現在のアクションストラテジの完了の状態を示す信号をコンピュータシステム２１０に返す。

【0236】

この段落で「第１の」優先度レベルと称される現在の第１のアクティブオブジェクティブの優先度関数の指示は、推論モジュール２５０に更に伝送されてもよい。推論モジュール２５０は、オブジェクティブのリスト３２２内の各アクティブオブジェクティブの優先度関数を連続的に比較するように構成され得る。

【0237】

第１のアクティブオブジェクティブに対応する第１のアクションストラテジの生成及び/又は実行中に、第２のインコヒーレントな動的環境プロパティが受信され、推論モジュール２５０に第１の優先度レベルよりも高い優先度レベルを有する第２のアクティブオブジェクティブをアクティブ化させるという判定が推論モジュール２５０によって行われた場合、推論モジュール２５０は、第１のアクションストラテジの生成及び/又は実行の中断を引き起こす信号を計画モジュール２６０に送信する。

【0238】

第２のアクティブオブジェクティブは、計画モジュール２６０によって更に処理されてもよく、実行モジュール２７０は、第２のアクティブオブジェクティブに対応する第２のアクションストラテジを実行してもよい。第１のアクションストラテジの生成及び/又は実行は、第２のアクションストラテジの生成及び実行が完了すると再開され得る。

【0239】

追加的又は代替的に、実行モジュール２７０は、現在のアクションストラテジの実行の状態、対応するアクティブオブジェクティブの優先度関数及び/又は任意の他の情報を推論モジュール２５０に通信してもよい。それによって、推論モジュール２５０は、各アクティブオブジェクティブの優先度関数に基づいて、目的のリスト３２２のどのアクティブオブジェクティブが実行され得るかを判定することができる。

【0240】

更に、優先度関数のかかる比較は、実行可能モジュールとアクティブオブジェクティブとの間で、及び/又は実行可能モジュール間で実行され得る。アクションストラテジのアクション、したがって実行状態は、それらの対応する漸進的タスクユニット構造内のそれらの対応する実行可能モジュールの優先度関数に関連付けられ得る。したがって、所与のアクティブオブジェクティブの現在の優先度関数は、対応するアクションストラテジのアクションが実行されるにつれて変化すると言うことができる。換言すれば、実行されているアクティブオブジェクティブの現在の優先度レベルは、実行されているその現在のアクション又は実行状態の優先度レベルであり得る。

【0241】

第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、アクティブオブジェクティブのリスト３２２内の第２のアクティブオブジェクティブが第１のアクションに対してより高いレベルの優先度を有するという判定がコンピュータシステム２１０によって行われた場合、第１のアクションにおいて中断され得る。

【0242】

換言すれば、第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、第２のアクティブオブジェクティブが第１のアクティブオブジェクティブの現在の実行状態に対してより高い優先度レベルを有するという判定がコンピュータシステム２１０によって行われた場合、第１のアクションにおいて中断されてもよく、第１のアクティブオブジェクティブの優先度レベルは、対応するアクションストラテジの実行中に変化する。

【0243】

代替的に、第２のアクションストラテジ及び/又は対応する第２のアクティブオブジェクティブが、第１のアクションに対してより高い優先度レベルを有するアクション及び/又は対応する実行可能モジュールを含むという判定がコンピュータシステム２１０によって行われた場合、第１のアクティブオブジェクティブに対応する第１のアクションストラテジの実行は、第１のアクションにおいて中断されてもよい。いずれにしても、第２のアクションストラテジは、第１のアクションストラテジの実行を再開する前に実行することができる。

【0244】

したがって、異なるアクティブオブジェクティブの実行可能モジュールの優先度関数が比較され得ると仮定すると、割り込みの粒度が増加する。結果として、本開示の文脈では、アクションストラテジは、障害に対してロバストであり、中断可能であると言うことができる。

【0245】

上記の実装形態は、特定の順序で実施される特定のステップを参照して説明及び図示されているが、これらのステップは、本技術の教示から逸脱することなく、組み合わされ、細分され、又は順序変更され得ることが理解されよう。各ステップの少なくとも一部は、並列的に実行されてもよく、又は直列的に実行されてもよい。したがって、ステップの順序及びグループ化は、本技術の限定ではない。

【0246】

本明細書で言及される全ての技術的効果が、本技術のありとあらゆる実施形態において享受される必要はないことが明確に理解されるべきである。

【0247】

本技術の上述の実装形態に対する修正及び改良は、当業者に明白となり得る。前述の説明は、限定ではなく例示を意図している。したがって、本技術の範囲は、添付の特許請求の範囲の範囲によってのみ限定されることが意図される。

【図1】