IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ メイ モビリティー,インコーポレイテッドの特許一覧

特表2024-526037自律エージェントの遠隔支援のための方法及びシステム
<>
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図1
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図2
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図3A
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図3B
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図3C
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図4
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図5
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図6
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図7A
  • 特表-自律エージェントの遠隔支援のための方法及びシステム 図7B
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-07-17
(54)【発明の名称】自律エージェントの遠隔支援のための方法及びシステム
(51)【国際特許分類】
   B60W 30/10 20060101AFI20240709BHJP
   G08G 1/09 20060101ALI20240709BHJP
   B60W 40/04 20060101ALI20240709BHJP
   B60W 30/08 20120101ALI20240709BHJP
   B60W 50/10 20120101ALI20240709BHJP
   B60W 60/00 20200101ALI20240709BHJP
【FI】
B60W30/10
G08G1/09 V
B60W40/04
B60W30/08
B60W50/10
B60W60/00
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023573573
(86)(22)【出願日】2022-05-27
(85)【翻訳文提出日】2024-01-26
(86)【国際出願番号】 US2022031296
(87)【国際公開番号】W WO2022256249
(87)【国際公開日】2022-12-08
(31)【優先権主張番号】63/195,774
(32)【優先日】2021-06-02
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.BLUETOOTH
(71)【出願人】
【識別番号】521106164
【氏名又は名称】メイ モビリティー,インコーポレイテッド
【氏名又は名称原語表記】MAY MOBILITY,INC.
(74)【代理人】
【識別番号】110001302
【氏名又は名称】弁理士法人北青山インターナショナル
(72)【発明者】
【氏名】コスバウアー,メリンダ
(72)【発明者】
【氏名】ステルニアク,ジェフ
(72)【発明者】
【氏名】オルソン,エドウィン,ビー.
【テーマコード(参考)】
3D241
5H181
【Fターム(参考)】
3D241BA11
3D241BA15
3D241BA31
3D241BA32
3D241DC01Z
5H181AA01
5H181BB04
5H181CC03
5H181CC04
5H181CC14
5H181FF04
5H181FF05
5H181FF11
(57)【要約】
自律エージェントの遠隔支援のためのシステム100は、センサスイート(110)、コンピューティングシステム(120)、通信インタフェース(130)、及び/又は、任意の他の適切なコンポーネントのいずれか又はすべてを含んでもよく、及び/又は、それらとインタフェースしてもよい。システムはさらに、任意選択的に、インフラストラクチャデバイス(140)のセット、遠隔オペレータプラットフォーム(150)、及び/又は、任意の他の適切なコンポーネントを含んでもよい。システム(100)は、自律エージェントと遠隔アシストとの間で情報を交換することを可能にするように機能する。追加又は代替として、システム(100)は、(例えば、遠隔オペレータから間接的に受信された遠隔入力に基づいてなど)自律エージェントを操作するように機能してもよく、及び/又は、任意の他の適切な機能を実行してもよい。
【選択図】図5
【特許請求の範囲】
【請求項1】
車両の搭載コンピューティングシステムを用いて前記車両を自律的に制御するステップを含み、前記ステップは、選択サイクルの各選択ステップで、
センサ入力のセットに基づいて車両状態推定を決定するステップと、
前記車両状態推定に基づいて、選択可能ポリシーのセットを決定するステップと、
前記選択可能ポリシーのセットからポリシーを選択するステップと、
前記ポリシーに基づいて車両命令を決定するステップと、
前記車両命令に従って前記車両を制御するステップと、
前記車両を自律的に制御している間、
前記車両状態推定に基づいて、イベントトリガの充足を決定するステップと、
前記イベントトリガの充足に基づいて、遠隔支援プラットフォームに出力のセットを提供するステップと、
前記選択可能ポリシーのセットを更新して、前記遠隔支援プラットフォームで決定された遠隔オペレータ承認ポリシーを含めるステップと、を含む方法。
【請求項2】
複数のシミュレーションのセットを実行するステップをさらに含み、個々のポリシーが、前記複数のシミュレーションのセットから生じる結果のセットに基づいて、前記選択可能ポリシーのセットから自律的に選択される、請求項1に記載の方法。
【請求項3】
前記センサ入力のセットに基づいて、前記車両の環境内の動的オブジェクトのセットに対する状態推定のセットを推定するステップをさらに含み、前記複数のシミュレーションのセットの各々が、前記状態推定のセットと前記車両状態推定とに基づいて実行される、請求項2に記載の方法。
【請求項4】
前記車両状態推定は車両位置推定を含み、前記方法は、シナリオを決定するステップをさらに含み、前記選択可能ポリシーのセットは、
前記車両位置推定に基づいて既定のセットからポリシーのセットを決定するステップと、
前記シナリオに基づいて前記ポリシーのセットを改良するステップと、によって決定される、請求項1に記載の方法。
【請求項5】
前記搭載コンピューティングシステムを用いて自律的に選択不可能なポリシーを決定するステップをさらに含み、前記遠隔支援プラットフォームに提供される前記出力のセットが前記自律的に選択不可能なポリシーを含む、請求項1に記載の方法。
【請求項6】
前記遠隔支援プラットフォームに前記出力のセットを提供するステップの後、前記遠隔支援プラットフォームから前記自律的に選択不可能なポリシーの遠隔オペレータ承認を受信するステップと、それに応答して前記選択可能ポリシーのセットを更新するステップと、をさらに含む、請求項5に記載の方法。
【請求項7】
前記ポリシーは目標車両経路に基づいて選択され、前記方法は、前記遠隔支援プラットフォームから受信された遠隔オペレータ承認経路に基づいて、前記目標車両経路を更新するステップをさらに含む、請求項1に記載の方法。
【請求項8】
前記遠隔オペレータ承認経路は、障害を迂回するウェイポイントのセットを含む、請求項7に記載の方法。
【請求項9】
前記遠隔支援プラットフォームに提供される前記出力のセットは、前記障害に関連付けられた推定オブジェクトパラメータのセットを含む、請求項8に記載の方法。
【請求項10】
遠隔オペレータ承認経路に基づいて前記目標車両経路を更新するステップの後、前記車両を自律的に制御するステップが、前記選択可能ポリシーのセットから更新ポリシーを選択するステップを含み、前記更新ポリシーが前記遠隔オペレータ承認経路から逸脱する、請求項8に記載の方法。
【請求項11】
前記更新ポリシーは、前記目標車両経路への復帰に関連付けられる、請求項10に記載の方法。
【請求項12】
前記イベントトリガは、目標車両経路に沿った行き詰まりで停止している前記車両に対する時間閾値に対応する、請求項1に記載の方法。
【請求項13】
前記イベントトリガは、目標車両経路に沿った行き詰まり発生の確率閾値を含む、請求項1に記載の方法。
【請求項14】
前記遠隔オペレータ承認ポリシーは、50ミリ秒を超える待ち時間で、前記搭載コンピューティングシステムと前記遠隔支援プラットフォームとの間の無線接続を介して受信される、請求項1に記載の方法。
【請求項15】
自律エージェントの遠隔操作のための方法であって、
前記自律エージェントで、入力の第1セットを決定するステップと、
前記入力の第1セットに基づいて、目標経路に沿った行き詰まりに関連付けられたイベントトリガの充足を決定するステップと、
前記イベントトリガの充足に基づいて、遠隔支援プラットフォームに出力のセットを提供するステップと、
前記遠隔支援プラットフォームから入力の第2セットを受信するステップと、
前記入力の第1セット及び前記入力の第2セットに基づいて、選択可能ポリシーのセットを決定するステップと、
前記自律エージェントで、前記目標経路に基づいて前記選択可能ポリシーのセットからポリシーを選択するステップと、
前記ポリシーに基づいて前記車両を自律的に制御するステップと、を含む方法。
【請求項16】
前記ポリシーを選択するステップの前に、前記入力の第2セットに基づいて前記目標経路を更新するステップをさらに含む、請求項15に記載の方法。
【請求項17】
前記入力の第2セットがウェイポイントのセットを含む、請求項16に記載の方法。
【請求項18】
前記遠隔支援プラットフォームに提供された前記出力のセットは、前記目標経路から逸脱する提案ポリシーを含み、前記入力の第2セットは、ポリシー提案の遠隔オペレータ承認を含み、前記選択可能ポリシーのセットは前記提案ポリシーを含む、請求項15に記載の方法。
【請求項19】
前記選択ポリシーは前記提案ポリシーとは異なる、請求項18に記載の方法。
【請求項20】
前記入力の第2セットは遠隔オペレータ承認ポリシーを含み、前記入力の第1セットは位置推定及びシナリオを含み、前記選択可能ポリシーのセットは、
前記位置推定に基づいてラベル付きマップからポリシーのセットを決定するステップと、
前記遠隔オペレータ承認ポリシーに基づいて前記ポリシーのセットを拡張するステップと、
前記ポリシーのセットを改良して前記シナリオに基づいて前記選択可能ポリシーのセットを生成するステップと、によって決定される、請求項15に記載の方法。
【請求項21】
前記入力の第2セットは、遠隔オペレータによる二分決定を含む、請求項15に記載の方法。
【請求項22】
前記ポリシーは、遠隔オペレータポリシー決定ノード及び前記遠隔オペレータ決定ノードの下流の自律ポリシー決定ノードのセットを定義する前記自律エージェントのマルチポリシー決定モジュールを使用して選択される、請求項15に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
[0001] 本願は、2021年6月2日出願の米国仮出願第63/195,774号の利益を主張し、この参照により当該出願の全体が本明細書に組み込まれる。
【背景技術】
【0002】
[0002] 本発明は、概して、自律走行車の分野に関し、より具体的には、自律走行車の分野における自律エージェントの遠隔支援のための新規で有用なシステム及び方法に関する。
【0003】
[0003] 自律走行車に関連付けられた現在のシステム及び方法では、危険なシナリオ及び/又はそうでなければ困難なシナリオで車両の制御を引き継ぐ遠隔オペレータの有用性が認識されている。しかしながら、そのような場合、車両と遠隔オペレータとの間で完全な通信が必要とされる-要件は、確実に確立するのは、不可能ではないにしても非常に複雑である。遠隔オペレータを採用しない自律走行車のシステム及び方法の場合、従来は人間のオペレータが乗車する必要があるか、又は、自律走行車は、最もまれな状況であっても確実に理解して反応するために訓練されていなければならないか、のいずれかである。
【0004】
[0004] したがって、自律走行車の分野では、遠隔オペレータから遠隔支援を受けるための改良された有用なシステム及び方法を作成する必要がある。
【図面の簡単な説明】
【0005】
図1】[0005] 自律エージェントの遠隔支援のためのシステムの概略図である。
図2】[0006] 自律エージェントの遠隔支援のための方法の概略図である。
図3A】[0007] 自律エージェントの遠隔支援のための方法の変形例の概略図を示している。
図3B】[0007] 自律エージェントの遠隔支援のための方法の変形例の概略図を示している。
図3C】[0007] 自律エージェントの遠隔支援のための方法の変形例の概略図を示している。
図4】[0008] 自律エージェントの遠隔支援のためのシステムの変形例の概略図を示している。
図5】[0009] 自律エージェントの遠隔支援のための方法の変形例の概略図を示している。
図6】[0010] 自律エージェントの遠隔支援のための方法の変形例の概略図を示している。
図7A】[0011] 本方法の一変形例における遠隔オペレータ提供の経路に基づく制御の概略例を示している。
図7B】[0011] 本方法の一変形例における遠隔オペレータ提供の経路に基づく制御の概略例を示している。
【発明を実施するための形態】
【0006】
[0012] 本発明の好ましい実施形態についての以下の説明は、これらの好ましい実施形態に本発明を限定することを意図するものではなく、当業者が本発明を作成して使用することを可能にするようにすることを意図している。
【0007】
1. 概要
[0013] 自律エージェントの遠隔支援のためのシステム100は、その一例が図1に示されており:センサスイート110、コンピューティングシステム120、通信インタフェース130及び/又は任意の他の適切なコンポーネントのいずれか又はすべてを含んでもよく及び/又はそれらとインタフェースしてもよい。システムはさらに、任意選択的に、インフラストラクチャデバイス140のセット、遠隔オペレータプラットフォーム150及び/又は任意の他の適切なコンポーネントを含んでもよい。システム100は、自律エージェントと遠隔支援プラットフォーム(本明細書では遠隔オペレータプラットフォームともいう。)との間で情報の交換を可能にするように機能する。追加又は代替として、システム100は、(例えば、遠隔オペレータから間接的に受信された遠隔入力に基づいて、など)自律エージェントを操作するように機能してもよく、及び/又は、任意の他の適切な機能を実行してもよい。追加又は代替として、システムは、方法200の実行を容易にするように機能してもよい。
【0008】
[0014] 追加又は代替として、システムは、現在では米国特許第10,564,641号として発行された、2019年7月17日出願の米国出願第16/514,624号;現在では米国特許第10,614,709号として発行された、2019年7月8日出願の米国出願第16/505,372号;2019年8月14日出願の米国出願第16/540,836号;2020年2月17日出願の米国出願第16/792,780号;2021年7月1日出願の米国出願第17/365,538号;2021年12月14日出願の米国出願第17/550,461号;2021年12月17日出願の米国出願第17/554,619号;及び、2022年4月4日出願の米国出願第17/712,757号に記載されているコンポーネント又はそのすべてを含んでもよく、この参照によりこれらの出願の各々の全体が本明細書に組み込まれる。
【0009】
[0015] システム100は、方法200のいずれか又はすべてを実行するために使用されることが好ましいが、追加又は代替として、任意の他の方法及び/又はプロセスを実行するために使用されてもよい。
【0010】
[0016] 図2に示すように、自律エージェントの遠隔支援のための方法200は:自律エージェントに関連付けられた入力の第1セットを受信するステップS210と;任意選択的に、遠隔支援イベントを決定するステップS215と;遠隔支援プラットフォームに出力のセットを提供するステップS220と;遠隔支援プラットフォームから入力の第2セットを受信するステップS230と;入力の第1セット及び/又は入力の第2セットに基づいてエージェントのアクションを決定するステップS240と;及び任意選択的に、アクションを実装するステップS250と、のいずれか又はすべてを含んでもよい。追加又は代替として、方法200は、現在では米国特許第10,564,641号として発行された、2019年7月17日出願の米国出願第16/514,624号;現在では米国特許第10,614,709号として発行された、2019年7月8日出願の米国出願第16/505,372号;2019年8月14日出願の米国出願第16/540,836号;2020年2月17日出願の米国出願第16/792,780号;2021年7月1日出願の米国出願第17/365,538号;2021年12月14日出願の米国出願第17/550,461号;2021年12月17日出願の米国出願第17/554,619号;及び、2022年4月4日出願の米国出願第17/712,757号のいずれか又はすべてに記載されているプロセスのいずれか又はすべて、若しくは、任意の適切な順序で実行される任意の他の適切なプロセスを含んでもよく、この参照によりこれらの出願の各々の全体が本明細書に組み込まれる。
【0011】
[0017] 方法200は、上述したようなシステム及び/又は任意の他の適切なシステムを用いて実行されてもよい。
【0012】
2. 利点
[0018] 自律エージェントの遠隔支援のためのシステム及び方法は、現在のシステム及び方法に対していくつかの利点をもたらすことができる。
【0013】
[0019] 第1に、この技術の変形例は、自律エージェントのコンピューティングシステムによる完全な分類(例えば、エッジケースで)の負担を軽減するために、人間の遠隔オペレータとインタフェースするという利点をもたらすことができる。具体例では、例えば、人間の遠隔オペレータは、自律エージェントのコンピューティングシステムによる考慮に利用可能なポリシーに関連する遠隔入力を提供してもよい。具体例では、遠隔オペレータは、自律エージェントを直接操作することに代えて、(例えば、車両の搭載コンピュータが最終的な意思決定者であり続ける場合)自律エージェントの運行設計領域を効果的に拡張するために利用される。これは、エージェントと遠隔オペレータとの間で完全に低遅延の通信システムを構築することの重要性を低下させるように機能してもよい。追加又は代替として、遠隔オペレータは、自律エージェントの直接操作に参加してもよく、及び/又は、別の方法で利用されてもよい。
【0014】
[0020] 第2に、エージェントがあらゆるシナリオに応答することができるようにエージェントを訓練する必要がなく、まれな(例えば、エッジケース)シナリオで遠隔オペレータからの遠隔入力をシステムが利用することができるので、この技術の変形例は、自律エージェントに必要な訓練量を削減/最小限に抑えるという利点をもたらすことができる。
【0015】
[0021] 第3に、この技術の変形例は、自律走行車が目標車両経路に沿って行き詰まり(impasse)を克服又は迂回する(例えば、車両が前進することができない待機状態から車両を「引き離す」)ことを容易にすることができる。例えば、変形例では、目標車両経路に沿った障害を回避するために、一時的に実線白線車線、黄色車線又は二重黄色車線を越える;対向通行に関連付けられた車線に進入する;及び/又は、(例えば、交通従事者の指示により、エッジケース事象の場合など)名目上の運転規則/手順の一時的な停止を許可するため、遠隔オペレータの許可の提供を容易にすることができる。
【0016】
[0022] 第4に、この技術の変形例は、自律走行車の通知ベース及び/又は離散化(非連続)遠隔操作を容易にすることができ、これにより、1人の遠隔オペレータが複数の自律走行車の操作を容易にすることを可能にしてもよく(例えば、遠隔オペレータと自律走行車との1:Nの関係、Nは1より大きい)、これにより、遠隔車両操作に伴う負担及び/又は人件費を削減し得る。
【0017】
[0023] 追加又は代替として、当該システム及び方法は任意の他の利点をもたらすことができる。
【0018】
3. システム
[0024] 自律エージェントの遠隔支援のためのシステム100は、その一例が図1に示されており、センサスイート110、コンピューティングシステム120、通信インタフェース130及び/又は任意の他の適切なコンポーネントのいずれか又はすべてを含んでもよく及び/又はそれらとインタフェースしてもよい。システムは、任意選択的に、インフラストラクチャデバイス140のセット、遠隔オペレータプラットフォーム150及び/又は任意の他の適切なコンポーネントをさらに含んでもよい。システム100は、自律エージェントと遠隔支援プラットフォーム(本明細書では、遠隔オペレータプラットフォームともいう。)との間の情報の交換を可能にするように機能する。追加又は代替として、システム100は、(例えば、遠隔オペレータから間接的に受信された遠隔入力に基づいて、など)自律エージェントを操作するように機能してもよく、及び/又は、任意の他の適切な機能を実行してもよい。追加又は代替として、システムは、方法200の実行を容易にするように機能してもよい。
【0019】
[0025] 自律エージェントの遠隔支援のためのシステム100は、自律オペレーティングシステム及び自律エージェント102を含んでもよく及び/又はそれらとインタフェースしてもよい。追加又は代替として、システムは、現在では米国特許第10,564,641号として発行された、2019年7月17日出願の米国出願第16/514,624号;現在では米国特許第10,614,709号として発行された、2019年7月8日出願の米国出願第16/505,372号;2019年8月14日出願の米国出願第16/540,836号;2020年2月17日出願の米国出願第16/792,780号;2021年7月1日出願の米国出願第17/365,538号;2021年12月14日出願の米国出願第17/550,461号;2021年12月17日出願の米国出願第17/554,619号;及び、2022年4月4日出願の米国出願第17/712,757号に記載されたコンポーネント又はすべてを含んでもよく、この参照によりこれらの出願の各々の全体が本明細書に組み込まれる。
【0020】
3.1 システム-コンポーネント
[0026] システム100は、好ましくは、自律走行車(本明細書では、自律エージェント、エージェント及び/又は自エージェントともいう。)を含む及び/又はそれとインタフェースする(例えば、自律走行車内に統合される)。自律エージェントは、自律走行車であることが好ましく、完全自律走行車及び/又は完全自律走行車として操作可能な車両であることがさらに好ましいが、追加又は代替として、半自律走行車及び/又は任意の他の車両であってもよい。
【0021】
[0027] 追加又は代替として、自律エージェントは、半自律状態と完全自律状態(又は完全有人状態)との間で切り替わる車両であってもよく、及びしたがって、自律エージェントは、自律エージェントの状態に応じて、半自律走行車と完全自律走行車との両方の属性を有してもよい。
【0022】
[0028] 好ましい変形例では、自律走行車は、自動車(例えば、乗用車、無人運転車、バス、シャトル、タクシー、相乗り車両、トラック、セミトラックなど)である。追加又は代替として、自律走行車は:船舶(例えば、ボート、水上タクシーなど)、航空機(例えば、飛行機、ヘリコプタ、ドローン、VTOL航空機など)、地上車両(例えば、二輪車、自転車、オートバイ、スクータなど)、及び/又は、任意の他の適切な車両及び/又は輸送装置、自律機械、自律デバイス、自律ロボット及び/又は任意の他の適切なデバイスのいずれか又はすべてを含んでもよい。
【0023】
[0029] システムは、自律エージェントの1以上の軌道を決定するために使用可能なコンピューティングシステムへの入力を収集するように機能する、並びに/又は、ブロックS210及び/若しくは方法の任意の他のブロックを実行するように機能することができるセンサスイート110(本明細書ではセンサシステムともいう。)を含んでもよく又はそれとインタフェースしてもよい。追加又は代替として、センサスイートは、自律エージェントの操作(例えば、自律運転、軌道に沿った自律走行車の操縦など)、自律エージェントを取り巻く状況に関するデータの捕捉、自律エージェントの操作に関連するデータの捕捉、自律エージェントの保守ニーズの検出(例えば、エンジン診断センサ、外部圧力センサストリップ、センサ健全性センサなどを通じて)、自律エージェント内部の清浄度基準の検出(例えな、内部カメラ、アンモニアセンサ、メタンセンサ、アルコール蒸気センサ)を可能にするように機能してもよく、及び/又は、任意の他の適切な機能を実行するように機能してもよい。
【0024】
[0030] センサスイート(本明細書ではセンサシステムともいう。)は、慣性センサ(例えば、加速度計、ジャイロスコープ、磁力計、IMU、INSなど)、外部アンテナ(例えば、GPS、セルラー、Bluetooth、Wi-Fi、近距離無線通信など)、診断センサ(例えば、エンジン負荷、タイヤ空気圧、温度センサなど)、車両移動センサ(例えば、慣性センサ、ホイール速度センサ、エンコーダ、レゾルバなど)、環境センサ(例えば、カメラ、飛行時間センサ、温度センサ、風速/方向センサ、気圧計など)、誘導センサ(例えば、LIDAR、レーダ、ソナー、カメラなど)、コンピュータビジョン(CV)センサ、カメラ(例えば、ステレオカメラ、ハイパースペクトル、マルチスペクトル、ビデオカメラ、広角、CMOS、CCDなど)、飛行時間センサ(例えば、レーダ、LiDAR、ソナーなど)、及び/又は、任意の他の適切なセンサのいずれか又はすべてなど、自律エージェントに搭載された車両センサを含んでもよい。センサスイートは、自律走行車に搭載されたセンサ(例えば、エージェントの外面に結合されたレーダセンサ及び/又はLiDARセンサ及び/又はカメラ、エージェントに結合された及び/又はエージェント内に配置されたIMU及び/又はエンコーダなど)を含むことが好ましいが、追加又は代替として、エージェントから遠隔のセンサ(例えば、1以上のインフラストラクチャデバイスの一部として、エージェントと通信するセンサなど)、及び/又は、任意の適切な場所にある任意の適切なセンサを含んでもよい。
【0025】
[0031] ただし、センサスイートは、任意の他の適切なセンサのセットを含んでもよく、及び/又は、別の方法で適切に構成されてもよい。
【0026】
[0032] 自律エージェントは、好ましくは、コンピューティングシステム120を含み及び/又はそれらとインタフェースし、コンピューティングシステムは、車両の1以上の軌道のセットを決定するために情報(例えば、センサ入力)を処理するように機能する。追加又は代替として、コンピューティングシステムは、知覚、予測、位置特定、計画、制御及び/又は自律エージェントの操作に関与する任意の他のプロセスのいずれか又はすべてに関与するプロセスのいずれか又はすべてを実行するように機能してもよい。
【0027】
[0033] コンピューティングシステムは、好ましくは、自律エージェントに搭載されて配置された(例えば、自律エージェント内に統合された)搭載コンピューティングシステムを含む。追加又は代替として、コンピューティングシステムは、リモートコンピューティングシステム(例えば、クラウドコンピューティングシステム、搭載コンピューティングシステムと通信するリモートコンピューティング、搭載コンピューティングシステムに代えて、など)、補助デバイス(例えば、モバイルデバイス、ユーザデバイスなど)に統合されたコンピューティングシステム、モバイルコンピューティングデバイスを含むエッジデバイス、及び/又は、任意の他の適切なコンピューティングシステム及びデバイスのうちのいずれか又はすべてを含んでもよい。ある変形例では、例えば、自律エージェントは、ユーザデバイス(例えば、携帯電話、ラップトップなど)、リモートサーバ、クラウドサーバ、又は、車両から遠隔の任意の他の適切なローカル及び/又は分散コンピューティングシステムを含んでもよいリモート又は分散コンピューティングシステムと通信するように操作可能である。リモートコンピューティングシステムは、1以上のデータ接続(例えば、チャネル)を通じて自律エージェントの1以上のシステムに接続されてもよいが、代替として、任意の適切な方法で車両システムと通信してもよい。
【0028】
[0034] コンピューティングシステムは、処理システム(例えば、グラフィック処理装置又はGPU、中央処理装置又はCPU、若しくは、任意の適切な処理回路)及びメモリを含むことが好ましいが、追加又は代替として、任意の他の適切なコンポーネントを含んでもよい。メモリは、短期メモリ(例えば、揮発性、不揮発性、ランダムアクセスメモリ又はRAMなど)及び/又は長期メモリ(例えば、フラッシュメモリ、ハードディスクなど)であってもよい。
【0029】
[0035] ある変形例では、例えば、搭載コンピューティングシステムは、本明細書に記載の特定されたコンポーネント又はモジュールのうちの任意の1以上と相互作用し、及び/又は、操作可能に制御するように機能する。好ましい変形例では、例えば、搭載コンピューティングシステムは、MPDMプロセスを実装するマルチポリシー決定モジュール(MPDM)を実装するためのコンピュータ命令を実行する。具体例では、処理システム及びメモリは共同して、この参照により各々の全体が本明細書に組み込まれる2019年7月17日出願の米国出願第16/514,624号及び/又は2021年7月1日出願の米国出願第17/365,538号に記載されたものなどのマルチポリシー意思決定フレームワークのフレームワークにおいて自律エージェントが利用可能なポリシーのセットを動的に管理するように機能する。追加又は代替として、処理システム及びメモリ並びに/又は任意の他の任意の適切なコンポーネントが任意の他の適切な機能に使用されてもよい。
【0030】
[0036] 具体例では、システムは、自エージェント及び任意の関連コンポーネント(例えば、コンピュータ、プロセッサ、ソフトウェアモジュールなど)のマルチポリシー意思決定プロセス(例えば、コンピュータ可読媒体のマルチポリシー意思決定タスクブロック)とインタフェースする及び/又は実装するように構成され、コンピューティングシステム(例えば、搭載コンピューティングシステム)のマルチポリシー意思決定モジュールは、例えば、自エージェントで実装される将来の(すなわち、時間的に前進した)挙動ポリシー(操作又はアクション)、及び任意選択的に、設定された各環境エージェント(例えば、自エージェントの環境内の他の車両)及び/又は自エージェントの操作環境内で識別されるオブジェクト(例えば、歩行者)の挙動ポリシーの効果を予測(例えば、推定)するように機能するシミュレータモジュール(若しくは、同様のマシン又はシステム)(例えば、コンピュータ可読媒体のシミュレータタスクブロック)を含む。シミュレーションは、各エージェントの現在の状態(例えば、現在の仮説)及び/又は履歴データバッファ(好ましくは、現時点までのデータを含む)から導出されたエージェントの各々の過去のアクション又は過去の挙動に基づいていてもよい。シミュレーションはさらに、この目標経路に従ってシミュレーションが実行されるように、車両の所望のルーティング(例えば、固定経路に沿って、非固定経路に沿って、目的地に向かうなど)を記述する目標経路(本明細書では名目上の経路ともいう。)を考慮してもよい。シミュレーションは、各環境エージェントの予測された挙動ポリシーと、自律エージェントによって実行され得る1以上の潜在的な挙動ポリシーとの間の相互作用(例えば、相対位置、相対速度、相対加速度など)に関するデータを提供してもよい。シミュレーションからのデータは、任意の数の指標を決定(例えば、計算)するために使用されてもよく、これらの指標は:特定のポリシーを実行する際の環境エージェントのいずれか又はすべてに対する自エージェントの潜在的な影響、特定のポリシーを実行するリスク(例えば、衝突リスク)、特定のポリシーの実行によって自エージェントを特定の目標に向かってどの程度前進させるか、及び/又は、自エージェントが実装するためのポリシーの選択に関与する任意の他の指標の決定のいずれか又はすべてを評価するように個別に及び/又は共同して機能してもよい。
【0031】
[0037] 指標のセットは、任意選択的に、その提案ポリシーに対して実行されるシミュレーションのセットに基づいて各々提案された自エージェントポリシーに関連付けられたコスト関数(及び/又は損失関数)を含む及び/又は共同して(例えば、後述する指標のセットのいずれか又はすべてを集約することを通じて)決定してもよい。追加又は代替として、後述する指標のセットは個別に決定及び/又は分析されてもよく、他の指標が決定されてもよく、指標は、他の適切な方法で集約されてもよく、及び/又は、指標は別の方法で構成されてもよい。これらの指標及び/又は関数によれば、さまざまな提案ポリシー間で指標及び/又は関数を比較する(例えば、最小のコスト/損失関数を有するポリシーを選択する、目的関数を最適化する[例えば、最大化する、最小化するなど]ポリシーを選択する、リスクを最小化する及び/又は目標/目的地に向けた前進を最大化するポリシーを選択するなど)ことなどによって、ポリシーのセットから最良のポリシーが選択されてもよい。
【0032】
[0038] コンピューティングシステム(例えば、搭載コンピューティングシステム)は、好ましくは、自律エージェントの状態及び/又は自律エージェントの操作環境におけるオブジェクト(例えば、他の車両/エージェント、歩行者、自転車など)の状態を決定するために、自律エージェントを制御し、かつ、自律エージェントのセンサシステム(本明細書ではセンサスイートともいう。)(例えば、コンピュータービジョンシステム、LIDAR、フラッシュLIDAR、ホイール速度センサ、GPSなど)及び/又は他のセンサ(例えば、インフラストラクチャデバイスからの)及び/又は情報ソース(例えば、遠隔支援プラットフォーム)からの検出データを処理するように機能する。自律エージェント及び/又は操作環境内のオブジェクト(例えば、現実オブジェクト、仮想オブジェクトなど)の状態及び/又は任意の他の情報/命令(例えば、プログラム命令、学習命令など)に基づいて、搭載コンピューティングシステムは、マルチポリシー意思決定モジュールなどを通じて、挙動ポリシーを生成し、かつ、コンピューティングシステムが自律エージェントの挙動を制御するために実行する挙動ポリシー(例えば、車線変更、合流、現在の車線維持、左折、右折、停止、減速、加速、信号で停止、止まれ標識で停止、譲るなど)を選択してもよい。
【0033】
[0039] 変形例の第1セットでは、コンピューティングシステムは、車両制御システム及びセンサシステムとのI/O通信に適合した搭載汎用コンピュータを含むが、追加又は代替として、任意の適切なコンピューティングデバイスであってもよい。搭載コンピューティングシステムは、無線接続を介して(例えば、セルラーリンク又は接続を介して)インターネットに接続されることが好ましい。追加又は代替として、搭載コンピューティングシステムは、任意の数の無線又は有線通信システムに結合されてもよい。システムは、遠隔支援プラットフォームの、及び/又は、遠隔支援プラットフォーム(例えば、クラウドベースのコンピューティングシステム)に関連付けられた、第2コンピューティングシステム又はコンピューティングシステムのセットをさらに含んでもよく、搭載コンピューティングシステム及び遠隔支援コンピューティングシステムは、後述するように通信する。
【0034】
[0040] 追加又は代替として、任意の他のコンピューティングシステムが使用されてもよい。
【0035】
[0041] システム100は、好ましくは、コンピューティングシステムと通信する通信インタフェース130を含み、通信インタフェース130は、(例えば、インフラストラクチャデバイスから、リモートコンピューティングシステム及び/又はリモートサーバから、遠隔オペレータプラットフォームから、若しくは、別の自律エージェント又は他の車両からなど)コンピューティングシステムで情報を受信すること、及び、コンピューティングシステムから(例えば、リモートコンピューティングシステム及び/又はリモートサーバに、遠隔オペレータプラットフォームに、インフラストラクチャデバイスに、別の自律エージェント又は他の車両になど)情報を送信することを可能にするように機能する。通信インタフェースは、無線通信システム(例えば、Wi&#8722;Fi、Bluetooth、セルラー3G、セルラー4G、セルラー5G、多入力多出力又はMIMO、1以上の無線、若しくは、任意の他の適切な無線通信システム又はプロトコル)を含むことが好ましいが、追加又は代替として:有線通信システム(例えば、変調電力線データ転送、イーサネット、又は、任意の他の適切な有線データ通信システム又はプロトコル)、データ転送バス(例えば、CAN、FlexRay)、及び/又は、任意の他の適切なコンポーネント)のいずれか又はすべてを含んでもよい。具体例では、例えば、通信インタフェースは、搭載コンピューティングシステムと遠隔支援プラットフォーム(例えば、遠隔支援プラットフォームのコンピューティングシステム)との間の通信プロトコルを実装する。
【0036】
[0042] システム100は、任意選択的に、環境の1以上の側面及び/又は特徴を観察し、かつ、環境の1以上の側面及び/又は特徴に関する観察データを収集するように、個別に及び/又は共同して機能する、本明細書では路側ユニットともいう、(例えば、図4に示すような)インフラストラクチャデバイス140のセットを含んでもよい。インフラストラクチャデバイスのセットは、自律エージェントの搭載コンピューティングシステムと通信することが好ましいが、追加又は代替として、遠隔支援プラットフォーム、任意の他のコンポーネント及び/又は任意の組み合わせと通信してもよい。
【0037】
[0043] 好ましい変形例では、インフラストラクチャデバイスは、追加として、観察に関連付けられたデータを収集し、かつ、収集されたデータ及び/又は収集されたデータの処理された派生物を自律エージェントに送信するように機能する。追加又は代替として、インフラストラクチャデバイスは、データを収集し、かつ、遠隔オペレータプラットフォームに送信するように機能してもよく、遠隔オペレータは、そのデータを使用して、自律エージェントのコンピューティングシステムによる考慮に挙動ポリシーを含めるか、及び/又は、考慮から挙動ポリシーを除外するかなど、遠隔オペレータの意思決定を通知してもよい。具体例では、例えば、インフラストラクチャデバイスは、車両の隅の周りの景色を見ることを可能にしてもよく、エージェント及び/又はオペレータ及び/又はエージェントの遠隔オペレータは、それを使用して、(道路が曲がるために空いていることを見ることによって)旋回挙動ポリシーが自律エージェントによって考慮されることを可能にしてもよい。
【0038】
[0044] 第1変形例では、例えば、インフラストラクチャデバイスは、自律エージェントの1以上の機能と対話的に通信及び/又は制御するように操作する遠隔支援プラットフォームなどの自律走行車サービス及び/又はリモートプラットフォーム(例えば、分散コンピューティングシステムのネットワークを介して実装される)に、収集された観察データを転送する。
【0039】
[0045] インフラストラクチャデバイスは、好ましくは、自律エージェントの操作位置のすぐ近く及び/又はごく近くに若しくは近距離通信内にあるデバイスを含み、かつ、自律エージェントを取り巻く状況及び自律エージェントの操作ゾーンに近接したエリアの状況に関するデータを収集するように機能してもよい。ある実施形態では、路側ユニットは、フラッシュLIDAR、熱画像装置(熱カメラ)、静止画又はビデオ捕捉装置(例えば、画像カメラ及び/又はビデオカメラなど)、全地球測位システム、レーダシステム、マイクロ波システム、慣性測定ユニット(IMU)、及び/又は、任意の他の適切な検出装置又は検出装置の組み合わせを含む車外検出装置のうちの1以上を含む。
【0040】
[0046] インフラストラクチャデバイスは、任意選択的に、処理回路を介したコンピューティング機能と、インフラストラクチャデバイスが:自律エージェントのコンピューティングシステム、リモートコンピューティングシステム、遠隔オペレータプラットフォーム、及び/又は、任意の他の適切なコンポーネント又はコンポーネントの組み合わせのいずれか又はすべてと通信することを可能にする通信インタフェースと、含んでもよい。
【0041】
[0047] インフラストラクチャデバイスの実装によって達成される技術的利点には、自律エージェントの観察可能な範囲を越えた状況(例えば、角を曲がったところ、垂直な道路の下など)を観察することができる能力が含まれてもよく、この能力は、その後、エージェントで利用可能な(例えば、及びマルチポリシー意思決定[MPDM]モジュールでエージェントによって考慮可能な)1以上の挙動ポリシーのキュレーションで機能してもよい。例えば、所定の時点で、所定の環境の1以上の側面の観察が、自律エージェントによって行われてもよく、かつ、所定の環境の1以上の異なる及び/又は重複する側面の観察が、所定の環境に配置されて動作する1以上のインフラストラクチャデバイスによって異なる視点から行われてもよい。このような実施形態では、インフラストラクチャデバイスからの観察データを含むインフラストラクチャデバイスの視点が、自律エージェントの視点からの観察データに拡張されて、自律エージェントの操作環境の包括的な視点を生成し、及び/又は、遠隔オペレータプラットフォームの1以上の遠隔オペレータに追加の情報を提供してもよい。これにより、操作環境の予測を改善し、操作環境内で(乗っている人間のオペレータから)独立して安全に操作するための自律エージェントによって選択及び/又は実行されるべき挙動ポリシーの決定を改善することを可能にする。
【0042】
[0048] ある変形例では、自律エージェントは、自律エージェントによるポリシーキュレーション及び/又は軌道決定を改善するために、インフラストラクチャデバイス(例えば、路側ユニット)からの追加の観察を用いて、搭載センサスイートによって導出されたデータを拡張及び/又は融合してもよい。
【0043】
[0049]追加又は代替として、インフラストラクチャデバイスは、ビデオカメラ又はレーダを用いてなど、操作環境内の及び/又は操作環境に仮想的に挿入された任意のタイプ又は種類のオブジェクトを検出及び追跡してもよい。ある変形例では、例えば、ビデオカメラは、道路を横断しようとしている歩行者、又は左折しようとしている車、車のドアを開けて車から降りようとしている運転手、自転車レーンを走行している自転車に乗る人及び/又は、任意の他の適切な情報などの、オブジェクトの検出と、オブジェクトのタイプ及びオブジェクトの考えられる意図の意味論的分類と、を提供するように機能することができる。
【0044】
[0050] さらに追加又は代替として、インフラストラクチャデバイスのいずれか又はすべては:他のインフラストラクチャデバイス(例えば、路側ユニット)と;インフラストラクチャデバイスによって収集及び/又は検出されたデータ、インフラストラクチャデバイスの操作状態(例えば、赤信号又は青信号)に関するデータ、及び/又は、任意の他の情報のいずれか又はすべてに関して自律エージェントと直接;遠隔オペレータプラットフォームと直接通信するように機能し得る、及び/又は、任意の他の適切な方法で通信し得る環境内で動作する交通管理デバイス(例えば、交通センサ、信号機、歩行者用信号機など)などを含んでもよい。具体例では、信号機は、信号機が投影している光の色などの操作状態情報、又は、信号機の光が変わるタイミングなどの他の情報などを通信するように機能し得る、自律走行車を取り巻く環境におけるインフラストラクチャデバイスであってもよい。
【0045】
[0051] さらに追加又は代替として、交通管理デバイスからの情報が使用されて、遠隔オペレータへの通知をトリガする、又は、トリガ(例えば、誤検知)が遠隔オペレータに送信されることを防止してもよい。具体例では、例えば、車両が閾値時間を超えて停止した場合、これは遠隔オペレータに相談する必要があることを示している可能性があるが、交通管理デバイスに基づいて車両が赤信号で停止しているという表示が使用されて、支援の要請が遠隔オペレータに送信されることを防止してもよい。また代替として、車両が閾値時間を超えて停止し、かつ、車両が停止している信号が青である場合、支援の要請が遠隔オペレータに送信されてもよい。
【0046】
[0052] システムは、任意選択的に、1以上のコントローラ及び/又は制御システムを含む車両制御システムを含んでもよく及び/又は車両制御システムとインタフェースしてもよく、1以上のコントローラ及び/又は制御システムは、自律エージェントのルーティング目標及び選択された挙動ポリシー及び/又は自律エージェントの選択された軌道に従って自律エージェントを制御するための制御信号を生成するために利用される任意の適切なソフトウェア及び/又はハードウェアコンポーネント(例えば、プロセッサ及びコンピュータ可読記憶装置)を含む。
【0047】
[0053] 追加又は代替として、車両制御システムは、エージェントの設定された電子モジュールのいずれか又はすべて、これらに限定されないものの、電子制御ユニット[ECU]、テレマティクス制御ユニット[TCU]、トランスミッション制御モジュール[TCM]、アンチロックブレーキシステム[ABS]制御モジュール、ボディ制御モジュール[BCM]、及び/又は、任意の他の適切な制御サブシステム及び/又はモジュールのいずれか又はすべてを含んでもよく及び/又はそれらとインタフェースとしてもよい。
【0048】
[0054] 好ましい変形例では、車両制御システムは、車両のドライブ・バイ・ワイヤ・システムを含み、それとインタフェースし、及び/又は、車両のドライブ・バイ・ワイヤ・システムを実装する。追加又は代替として、車両は、1以上の機械コンポーネントの作動に従って操作されてもよく、及び/又は、別の方法で実装されてもよい。
【0049】
[0055] 追加又は代替として、システムは、センサ融合システム、測位システム(例えば、センサシステムの位置センサを含む)、誘導システム、及び/又は、任意の適切なコンポーネントのいずれか又はすべてを含んでもよい。ある変形例では、例えば、センサ融合システムは、センサデータを合成して処理し、かつ、マルチポリシー決定モジュールとともに、オブジェクトの存在、位置、分類及び/又は経路、並びに、自律エージェント(現実の又は仮想)の環境の特徴を予測する。さまざまな実施形態において、センサ融合システムは、これらに限定されないものの、カメラ、LIDAR、レーダ、インフラストラクチャデバイス、リモートデータフィード(インターネットベースのデータフィード)、及び/又は、任意の数の他のタイプのセンサを含む、複数のセンサ及び/又はデータソースからデータを組み込むように機能してもよい。
【0050】
[0056] 測位システムは、他のデータとともにセンサデータを処理して、環境に対する自律エージェントの位置(例えば、地図に対するローカル位置、道路の車線に対する正確な位置、車両の進行方向、速度など)を決定してもよく、(例えば、後述するように)どのような挙動ポリシーが自律エージェントに利用可能であるかを決定するように機能してもよい。誘導システムは、他のデータとともにセンサデータを処理して、車両が従うべき経路を決定してもよい。
【0051】
[0057] システムは、好ましくは、遠隔支援(遠隔オペレータ)プラットフォーム150を含み及び/又はそれとインタフェースし、遠隔アシスト(遠隔オペレータ)プラットフォーム150は、1以上のリモートの遠隔オペレータ及び関連コンポーネント(例えば、自律エージェントとの通信インタフェース、コンピューティングシステム、自律エージェントからの情報を表示するための出力装置及び/又は遠隔オペレータへのインフラストラクチャデバイス、遠隔オペレータからの命令/コマンドを受信するための入力デバイスなど)のことをいう。遠隔支援プラットフォームは、1以上の遠隔オペレータに出力を提供し、かつ、1以上の遠隔オペレータから入力を受信するように機能してもよく、これは、車両のキュレーションされた挙動ポリシーの決定に使用されてもよい。好ましい変形例では、例えば、遠隔オペレータからの遠隔入力は、車両の挙動ポリシーを承認及び/又は提案することによって、車両に関連付けられた運行設計領域(ODD)を効果的に拡張するように機能する。好ましい具体例では、遠隔オペレータによって承認及び/又は提案された挙動ポリシーは、やはり最終的には、自律エージェントに搭載されたコンピューティングシステムによって選択されるか又は拒否されるかのいずれかである(例えば、遠隔オペレータは、車両システムに対する直接のコマンド/制御権限を有していない可能性がある-ブレーキ、ステアリング、軌道の実行など)。MPDMモジュールを実装する具体例では、例えば、遠隔オペレータは、搭載コンピューティングシステムによる考慮のために挙動ポリシーを効果的に承認してもよく、搭載コンピューティングシステムは、実装するポリシーを最終的に選択する(及び、ポリシー決定に応じて車両制御命令を計画/実行する)。したがって、好ましい例では、エージェントを直接制御するためのコマンドは遠隔オペレータから受信されない。これには、遠隔オペレータは、安全性が重要なタスクには利用されず、搭載コンピューティングシステムにコンテキスト情報を提供するために利用されるので、遠隔支援プラットフォームから搭載コンピューティングシステムまでの待ち時間が重大な問題ではなくなるという利点があり、搭載コンピューティングシステムは、最終的に運転の意思決定を行う。例えば、遠隔オペレータの入力(例えば、遠隔オペレータ承認ポリシー)は、無線接続(例えば、搭載コンピューティングシステムと遠隔支援プラットフォームとの間)を介して受信されてもよく、及び/又は、50ミリ秒を超える待ち時間で実装されてもよく、これにより、無線通信範囲/接続が不十分な地域でも遠隔オペレータによる介入を容易にしてもよい。ただし、遠隔操作の待ち時間が50ミリ秒未満にされてもよく、及び/又は、人間のオペレータが自律エージェントに搭乗して、必要に応じて自律エージェントを迅速に制御してもよい。
【0052】
[0058] 代替として、遠隔オペレータによって承認及び/又は提案された挙動ポリシーのいずれか又はすべてが、自動的に実装されてもよく、最終的に実装されてもよく(例えば、他の挙動ポリシーを無効にする)、遠隔オペレータが車両を直接制御してもよく、及び/又は、遠隔オペレータの入力が別の方法で実装されてもよい。
【0053】
[0059] 遠隔支援プラットフォームの遠隔オペレータは、追加又は代替として、車両キャビン内のライダ/乗客を見る及び/又は(例えば、音声を通じて)通信するなど、自律エージェントの内部を監視するために使用されてもよい。ある変形例では、例えば、車両が移動する前にライダが着席及び/又はベルトを着用していることを確認し、乗客に指示を提供するために乗客と通信し、及び/又は、任意の他の機能を実行するために、遠隔オペレータが使用されてもよい。
【0054】
[0060] 上述したように、システムは、マルチポリシー意思決定(MPDM)モジュールを含む及び/又はそれとインタフェースすることが好ましい。MPDMモジュールの変形例の好ましいセットでは、MPDMモジュールは、シミュレータ又は同様の機械若しくはシステムを含み、これらは、この参照により各々の全体が組み込まれる2018年3月16日出願の米国出願第15/923,577及び2019年7月17日出願の米国出願第16/514,624号のいずれか又はすべてに記載されているような、自律エージェントによって実行され得る潜在的な挙動ポリシーを含む、自律エージェントの操作環境(例えば、道路上の他の車両、自転車に乗る人、歩行者など)で識別されるエージェントの各々のための将来の(すなわち、時間的に前進する)挙動ポリシー(操作又はアクション)を推定するように機能する。シミュレーションは、各エージェントの現在の状態(例えば、現在の仮説)、履歴データバッファ(好ましくは、現時点までのデータを含む)から導出されたエージェントの各々の履歴アクション又は履歴挙動、及び/又は、任意の組み合わせ又はその他の情報に基づいていてもよい。シミュレーションは、各エージェントの予測される挙動ポリシーと、自律エージェントによって実行され得る1以上の潜在的な挙動ポリシーとの間の相互作用(例えば、相対位置、相対速度、相対加速度など)に関連するデータを提供してもよい。MPDMモジュールは、その後、1以上の既定の又は動的な選択基準に基づいて、複数の挙動ポリシーのうちの1つを選択してもよい。選択基準は、自律エージェントを操作させる前に描写され得る任意の適切な挙動ポリシー選択要素に基づいていてもよく、若しくは、自律エージェントの操作環境又は操作モードに関する1以上の特徴に動的に基づいていてもよい。例えば、選択基準は、安全に実行される可能性が最も高い挙動ポリシーを自律エージェントが選択するように機能するように、事前に決定されてもよく及び/又は設定されてもよい。別の例では、自律走行車の操作環境に緊急事態が含まれる場合、選択基準は、動的であってもよく、かつ、コンピューティングシステムが、操作の効率と安全性などとの(重み付けされた)バランスを必要とする挙動ポリシーの扱いやすいセットから挙動ポリシーを選択するように設定されてもよい。追加又は代替として、自律エージェントによる実行の確率に関する1以上の既定の閾値に基づいて、自律エージェントによる実行のための潜在的な挙動ポリシーを制限するポリシーが選択されてもよい。すなわち、ある実施形態では、MPDMモジュールは、理論上、数千ではないにしても数百のシミュレーションを生成してもよく、その結果、所定の状況において自律エージェントによる実行のための数百又は数千の潜在的な挙動ポリシーが得られる。したがって、MPDMモジュールは、自律エージェントによるアクション又は操作を安全に実行するための1以上の最小確率値、若しくは、所定の状況又はリアルタイムのシナリオで自律エージェントによる操作又はアクションを成功裏に実行するための1以上の最小確率値を識別する既定の閾値に従って、それらの生成された挙動ポリシーのサブセットのみを識別するように機能してもよい。
【0055】
[0061] 追加又は代替として、システム100は、任意の他の適切なコンポーネントを含んでもよく及び/又はそれらとインタフェースしてもよい。
【0056】
4. 方法
[0062] 図2に示すように、自律エージェントの遠隔支援のための方法200は:自律エージェントに関連付けられた入力の第1セットを受信するステップS210と;任意選択的に、遠隔支援イベントを決定するステップS215と;遠隔支援プラットフォームに出力のセットを提供するステップS220と;遠隔支援プラットフォームから入力の第2セットを受信するステップS230と;入力の第1セット及び/又は入力の第2セットに基づいてエージェントのアクションを決定するステップS240と;任意選択的に、アクションを実装するステップS250と、のいずれか又はすべてを含んでもよい。追加又は代替として、方法200は、この参照によりこれらの出願の各々の全体が本明細書に組み込まれる、現在では米国特許第10,564,641号として発行された、2019年7月17日出願の米国出願第16/514,624号;現在では米国特許第10,614,709号として発行された、2019年7月8日出願の米国出願第16/505,372号;2019年8月14日出願の米国出願第16/540,836号;2020年2月17日出願の米国出願第16/792,780号;2021年7月1日出願の米国出願第17/365,538号;2021年12月14日出願の米国出願第17/550,461号;2021年12月17日出願の米国出願第17/554,619号;及び、2022年4月4日出願の米国出願第17/712,757号のいずれか又はすべてに記載されているプロセスのいずれか又はすべて、若しくは、任意の適切な順序で実行される任意の他の適切なプロセスを含んでもよい。
【0057】
[0063] 方法200は、上述したシステム100を用いて実行されることが好ましいが、追加又は代替として、任意の他の適切なシステムを用いて実行されてもよい。
【0058】
[0064] 方法200は、好ましくは、エージェントが分類することを学習していない環境など、不確実な及び/又はそうでなければ困難な環境を自律エージェントがナビゲートすることを支援するように機能する。追加又は代替として、方法200は、(例えば、乗客の安全のために)エージェントの内部の監視を可能にするように機能してもよく、及び/又は、任意の他の機能を実行してもよい。
【0059】
[0065] 方法200は、好ましくは、シャトルサービス、オンデマンド乗車サービス、ロボットタクシー、及び/又は、任意の他の乗客の使用事例のいずれか又はすべてなど、乗客の輸送を伴う相乗りの使用事例のコンテキストで実装される。追加又は代替として、方法200は、商品を輸送する(例えば、食料品を配達する)ために実装されてもよく、及び/又は、任意の他の使用事例に使用されてもよい。
【0060】
[0066] 方法200及び/又はそのサブ要素は、一度実行されてもよく、及び/又は、繰り返し、再帰的に、反復的に、周期的に、循環的に、連続的に及び/又は任意の他の適切なタイミングで実行されてもよい。例えば、自律エージェントは、選択サイクルの各ステップに対して(例えば、10Hz、15Hz、20Hz、25Hz、25Hzを超えるなどの所定の頻度で)ポリシーを選択し、かつ、新しいポリシーが選択されるまで(例えば、選択サイクルの次のステップ/後続ステップで)選択されたポリシーに基づいて車両を自律的に制御してもよい。変形例では、方法要素の組み合わせ/順列は、連続的に、同時に、同期的に、非同期的に、周期的に、非周期的に(例えば、イベント駆動ベースで)、及び/又は、任意の他の適切な頻度/タイミングで発生してもよい。
【0061】
4.1 方法-エージェントに関連付けられた入力の第1セットを受信するステップS210
[0067] 方法200は、好ましくは、エージェントに関連付けられた入力の第1セットを受信するステップS210を含み、ステップS210は、方法200の残りのプロセスのいずれか又はすべてを実行するための情報を受信するように機能する。好ましい変形例では、例えば、S210で受信された入力の第1セットは、搭載コンピューティングシステムで及び/又は遠隔支援プラットフォームで意思決定を行うための情報を収集するように機能する。追加又は代替として、S210は、任意の他の適切な機能を実行してもよい。
【0062】
[0068] 追加又は代替として、方法200は、S210なしで実行されてもよく、及び/又は、任意の他のプロセスを含んでもよい。
【0063】
[0069] S210は、方法200において最初に実行されることが好ましく、及び、自律エージェントの操作中に複数回(例えば、連続的に、既定の頻度で、既定の間隔のセットで、ランダムな間隔で、トリガに応答して、定期的/周期的に、MPDM及び/又は自律エージェントの選択サイクルごとに1回など)実行されることがさらに好ましい。追加又は代替として、S210は、方法200の任意の他のプロセスに応答して、方法200の任意の他のプロセスと並行して、及び/又は、任意の他の時点で実行されてもよい。さらに追加又は代替として、方法200はS210なしで実行されてもよい。
【0064】
[0070] 入力の第1セットは、好ましくは、(例えば、上述したような)自律エージェントのセンサシステム、例えば、上述したセンサのいずれか又はすべて(例えば、LIDARセンサ、RADARセンサ、カメラ、マイク、診断センサなど)から、少なくとも部分的に受信される。追加又は代替として、入力は、任意の適切なセンサ(例えば、エージェントから遠隔の、1以上のインフラストラクチャデバイスの一部など)、他の情報源(例えば、オンライン情報源、データベースなど)、他のエージェント及び/又はオブジェクト、及び/又は、任意の他の適切なソースから受信されてもよい。
【0065】
[0071] 入力のセットは、自律エージェントに搭載されて配列されたカメラのセットから収集されたカメラストリームのセット(本明細書ではビデオストリームともいう。)を含むことが好ましい。追加又は代替として、入力のセットには、自律エージェントの内部から収集されたカメラストリーム、ライダセンサのセットからの情報、レーダセンサのセットからの情報、自律エージェントの1以上のコンポーネントに関連付けられた診断情報(例えば、センサに関連付けられた健康情報)、及び/又は、任意の他の入力を含んでもよい。
【0066】
[0072] 第1変形例では、S210は、自律エージェントに搭載されて配列されたカメラのセットから収集されたビデオストリームのセットを受信するステップを含み、ビデオストリームのセットは自律エージェントの環境を表している。追加又は代替として、入力の第1セットには、ライダセンサのセットからの情報、レーダセンサのセットからの情報、自律エージェントの内部の視野を有するビデオストリームの第2セット、インフラストラクチャデバイスからの情報、及び/又は、任意の他の情報が含まれてもよい。
【0067】
[0073] 追加又は代替として、S210は、車両センサ(例えば、センサスイート)からセンサ測定値を受信するステップと、(例えば、コンピューティングシステムのメモリ及び/又はリモートデータストレージから;以前の自車両の状態及び/又は車両の知覚/追跡によって生成された以前の環境表現など)格納されたデータ/情報、(例えば、知覚/追跡システムによって生成された)現在の環境表現、現在の車両の状態(例えば、地球座標系における車両位置を含んでもよい)、現在の車両軌道、目標車両経路(例えば、既定の、及び/又は、誘導/制御システムから受信された)、及び/又は、任意の他の適切な入力を取得するステップと、のいずれか又はすべてを含んでもよい。
【0068】
[0074] 変形例では、S210は、任意選択的に、(例えば、この参照によりその全体が本明細書に組み込まれる2021年12月17日出願の米国出願第17/554,619号に記載されているような知覚及び/又は追跡システム/方法を使用して)環境表現及び現在の車両状態推定(例えば、場所/位置、速度、さまざまな軸の加速度、スロットル、ステアリング角度など)を生成するためにセンサ入力を処理するステップを含んでもよい。代替として、環境表現及び/又は現在の車両状態及び/又は任意の他の適切な(前処理された)入力はS210中に受信されてもよい(例えば、センサデータ処理パイプラインの上流要素によって前処理される)。
【0069】
[0075] 具体例では、入力には、自車両の環境の動的オブジェクトのセットと静的オブジェクトのセットとを含む環境表現が含まれてもよく、各々は、動的ラベル又は静的ラベル、オブジェクト分類(例えば、乗用車、歩行者、自転車など)、オブジェクト寸法、オブジェクト移動パラメータ(例えば、位置、速度、加速度など)、及び/又は、任意の他の適切な情報を含み得る識別子及びオブジェクトパラメータで一意にラベル付けされている。
【0070】
[0076] ただし、任意の他の適切な入力がS210中に受信されてもよい。
【0071】
4.2 方法-遠隔支援イベントを決定するステップS215
[0077] 方法200は、任意選択的に、(例えば、車両が行き詰まりにある/行き詰まりを予想している場合、又は、そうでなければ前進することができない場合)車両のリモート遠隔支援を開始するように機能し得る遠隔支援イベントS215を決定するステップを含んでもよい。例えば、遠隔支援は、遠隔支援イベントの決定に応答して、通知主導ベース、離散化ベース、及び/又は、不連続ベースで提供されてもよく、これにより、単一の遠隔オペレータが複数の車両を支援することを可能にしてもよい。
【0072】
[0078] 遠隔支援イベントは、自車両状態及び/又は環境表現(例えば、及び/又はその中の動的オブジェクト又は静的オブジェクト)、予測された確率/シナリオ、過去の車両状態、ポリシー、及び/又は、アクション決定(例えば、S240に従って)、及び/又は、任意の他の適切な情報など、S210中に受信されたセンサ入力に基づいて決定されてもよい。遠隔支援イベントは、車両が停止/静止している間の時間閾値など、1以上の閾値のセットに従って決定されてもよい。遠隔支援イベントは、車両が静止している場合(例えば、行き詰まりで停止している)、移動している場合、目標車両経路に沿って横断している場合、目標車両経路を越えて横断している場合(又は、そうでなければ、目標経路又は遠隔オペレータが承認した経路から逸脱している場合)、及び/又は、任意の適切な車両状態又は状況中に提供されてもよい。
【0073】
[0079] 追加又は代替として、閾値のセットは、他の時間閾値(例えば、15秒などの閾値時間を超えて車線の中央にいるなど、特定の状況で車両が静止している)、速度閾値(例えば、閾値速度を下回る車両速度など)、不確実性閾値(例えば、コンピューティングシステムで決定される)、及び/又は、任意の他の閾値若しくは他のトリガのいずれか又はすべてを含んでもよい。
【0074】
[0080] 追加又は代替として、遠隔支援イベントは、1以上の確率及び/又は予測シナリオに基づいて決定されてもよい。ある変形例では、例えば、遠隔支援イベントは、車両が立ち往生する確率(例えば、容易に交通に合流することができない、既定の時間内に再び移動することができないなど)に応じて決定されてもよく、確率は、実際の確率、予測確率(例えば、エージェントの前方の交通量に基づく、環境表現に基づく、訓練モデルのセットに基づくなど)及び/又はそれらの任意の組み合わせであってもよい。
【0075】
[0081] トリガのいずれか又はすべては、任意選択的に、信号機に接続されている及び/又は信号機の視界を有するインフラストラクチャデバイスなどのインフラストラクチャデバイスからの情報を利用してもよい。ある変形例では、例えば、車両が少なくとも最小時間閾値にわたって停止された場合、インフラストラクチャデバイスからの情報が使用されて、車両が赤信号で停止しているかどうかを決定してもよく、この場合、遠隔オペレータに対して通知はトリガされない。
【0076】
[0082] 第1変形例では、車両が少なくとも閾値時間(例えば、1分、2分、1分~5分、1分未満、5分超など;行き詰まりでなど)停止されたことの検出に応答して、遠隔支援イベントが決定されてもよい。
【0077】
[0083] 第2変形例では、エージェントの環境の分類をすることができないこと、及び/又は、分類に関連付けられた不確実性が既定の閾値を超えていることの検出に応答して、遠隔支援イベントが決定されてもよい。具体例では、例えば、自律エージェントが、自律エージェントに対向して後退するセミトラックに遭遇した場合など、その周囲の不確実性が高い搭載コンピューティングシステムに応答して遠隔オペレータがトリガされてもよい。
【0078】
[0084] 第3変形例では、フォールバックシステムの起動及び/又は搭載コンピュータによるポリシーの更新の失敗に応答して、遠隔支援イベントが決定されてもよい。
【0079】
[0085] 第4変形例では、車両が目標経路に沿って前進することができない(例えば、障害又は障害物が車両の邪魔をしている、障害又は障害物が目標経路に沿って停止/静止している、障害又は障害物が車両の前で停止/停止しているなど)という決定に応答して、遠隔支援イベントが決定されてもよい。
【0080】
[0086] 第5変形例では、遠隔許可を必要とする(例えば、名目上の運転規則から逸脱するため、二重黄色線を越えるため、工事担当者からの指示に従うなど)ポリシーが決定及び/又は選択されることに応答して、遠隔支援イベントが決定されてもよい。
【0081】
[0087] 第6変形例では、目標車両経路に沿った行き詰まりで車両が停止している時間閾値に基づいて、遠隔支援イベントが決定されてもよい。
【0082】
[0088] 第7変形例では、目標車両経路に沿った行き詰まり発生の確率閾値に基づいて、遠隔支援イベントが決定されてもよい。
【0083】
[0089] 第8変形例では、S230での入力に基づく事前のトリガに基づいて遠隔支援イベントが決定されてもよい。例えば、遠隔オペレータは、ポリシーを再確認する又は続行するために(例えば、ポリシーの一部のみが一度に承認される場合)、承認されたポリシー(又は経路)の実行中に1回以上/1以上の時点で車両に再度チェックインするよう促してもよい。したがって、そのようなトリガは、繰り返し、定期的に又は2次イベントトリガ(例えば、ウェイポイントに到達する、遠隔オペレータが承認した経路から逸脱するなど)に基づいて、及び/又は、任意の他の適切なタイミングで発生してもよい。
【0084】
[0090] ただし、遠隔支援イベントは別の方法で適切に決定されてもよい。代替として、遠隔オペレータが車両の操作を継続的に監視する場合など、ある実装では、遠隔支援イベントは決定されなくてもよい(例えば、イベント主導ベースで通知されなくてもよい)。
【0085】
4.2 方法-遠隔支援プラットフォームに出力のセットを提供するステップS220
[0091] 方法200は、遠隔支援プラットフォームに出力のセットを提供するステップS220を含むことが好ましく、ステップS220は、自律エージェントがその環境をナビゲートするのを支援するために遠隔オペレータが見る及び/又は分析することができる情報を提供するように機能する。追加又は代替として、S220は、遠隔オペレータに警告及び/又は通知を送信する、及び/又は、任意の他の機能を実行するように機能してもよい。
【0086】
[0092] 追加又は代替として、方法200は、S220なしで実行されてもよく、及び/又は、任意の他のプロセスを含んでもよい。
【0087】
[0093] S220は、好ましくは、S215及び/又はS210に応答して、かつ、それらに基づいて実行され、及びさらに好ましくは、S215の各事例(例えば、遠隔支援イベントの後の複数の選択サイクルの間、目標経路からの逸脱の期間の間、既定の期間の間など)に応答するなど、自律エージェントの操作中、複数回(例えば、連続的に、既定の頻度で、既定の間隔のセットで、ランダムな間隔で、トリガに応答してなど)実行される。追加又は代替として、S220は、方法200の任意の他のプロセスに応答して、方法200の任意の他のプロセスと並行して、及び/又は、任意の他の時点で、実行されてもよい。さらに追加又は代替として、方法200は、S220なしで(例えば、遠隔支援イベントが検出されない操作期間中に)実行されてもよい。
【0088】
[0094] 遠隔支援プラットフォームに関連付けられた遠隔オペレータは、人間の遠隔オペレータであることが好ましいが、追加又は代替として、ロボットオペレータを含んでもよく、及び/又は、ロボットオペレータとインタフェースしてもよい。
【0089】
[0095] 出力のセットは、好ましくは、S210で受信された入力の第1セットのいずれか又はすべて、例えば、自律エージェントの環境を見るカメラのセットから収集されたカメラストリーム;自律エージェントの内部を見るカメラのセットから収集されたカメラストリーム;自律エージェントに関連付けられた診断情報(例えば、センサの健全性など);自律エージェントの搭載診断ポートからの情報(例えば、速度、加速度、車両状態など);インフラストラクチャデバイスのセットで収集された情報;及び/又は、任意の他の入力のうちのいずれか又はすべてなどを含む。
【0090】
[0096] 出力のセットは、追加又は代替として、遠隔オペレータに提供される視覚化のセットなど、入力の第1セットに基づいて決定される(例えば、入力の第1セットから導出される、入力の第1セットのさらなる処理に基づいて決定されるなど)出力を含んでもよい。視覚化には、例えば、自エージェントのための提案軌道及び/又は予測軌道、自エージェントの環境における他のエージェントのための提案軌道及び/又は予測軌道、自律エージェントの提案操縦、及び/又は、任意の他の視覚化が含まれてもよい。
【0091】
[0097] 出力のセットは、さらに追加又は代替として、遠隔オペレータへの1以上の通知(例えば、メッセージ、警告など)を含んでもよく、これは、遠隔オペレータからの入力が必要とされる特定のシナリオ(例えば、車両が30秒間停止した、前方での減速が予測されるなど)に対して遠隔オペレータに警告するように機能してもよい。通知は、任意選択的に、自律エージェントに対する提案ポリシー(例えば、挙動、アクション、操縦、軌道など)及び/又は複数の提案ポリシーを含んでもよく、遠隔オペレータは、提案ポリシーを承認及び/又は拒否してもよい。(例えば、S230中に受信された)遠隔オペレータの入力に基づいて、1以上の提案ポリシーは、(例えば、遠隔オペレータによって許可/承認された場合に)含まれてもよく、又は、(例えば、現在又はその後の選択サイクル中、MPDMモジュールの一部として)自律エージェントに最適なポリシーを決定する際のコンピューティングシステムによる考慮のために除外されてもよい。
【0092】
[0098] 例えば、ある変形例では、コンピューティングシステム120(例えば、そのMPDM)は、(例えば、S215に応答して、車両が行き詰まりにあるという決定に応答して)S220で遠隔オペレータに出力として提供され得る自律的に選択不可能なポリシー又はポリシー提案を決定してもよい(例えば、データベースから取得してもよい)。ポリシーは、既定の閾値(例えば、最小閾値)を下回るそのポリシーに関連付けられた信頼スコア(例えば、車両がそのポリシーを実行することができるという信頼、車両がそのポリシーを安全に実行することができるという信頼など;自律的に選択不可能なポリシーは、遠隔オペレータの承認がなければ名目上選択不可能であるが、遠隔オペレータの承認があれば選択可能になるポリシーであり得る)、名目上の車道規則/慣例からのポリシーの逸脱、車両の現在の状況、及び/又は、任意の他の適切な理由の結果として、「自律的に選択不可能」であるとみなされてもよい。追加又は代替として、S220中に出力として提供されるポリシー提案は選択可能であってもよく、及び/又は、ポリシー提案は提供されなくてもよい。
【0093】
[0099] 出力のセットは、通信インタフェース130を介して遠隔オペレータプラットフォーム150に無線で通信されることが好ましい。さらに、出力のセットは、遠隔オペレータのセットに関連付けられたディスプレイに少なくとも部分的に提供されることがさらに好ましい。遠隔支援プラットフォームは、追加又は代替として、スピーカ、マイク及び/又は任意の他の出力デバイスを含んでもよい。遠隔支援プラットフォームはさらに追加又は代替として、これらに限定されないが、タッチスクリーン、ボタン、ジョイスティック、マイク(例えば、音声検出付き)、及び/又は、任意の他の入力デバイスなどの、入力の第2セット(例えば、後述する)を受信するように構成された任意の数の入力デバイスをさらに含んでもよい。
【0094】
[00100] 変形例では、出力のセットは、任意選択的に、環境表現のための推定オブジェクトパラメータ(例えば、寸法、分類など)を含む環境表現のトップダウン(鳥瞰的な)の視野を含んでもよく、それによって、(例えば、車両の周囲の障害を迂回するため)遠隔オペレータによるウェイポイントの提供を容易にしてもよい。
【0095】
[00101] ただし、任意の他の適切な出力のセットが遠隔支援プラットフォームに提供されてもよい。
【0096】
4.3 方法-遠隔支援プラットフォームから入力の第2セットを受信するステップS230
[00102] 方法200は、好ましくは、遠隔支援プラットフォームから入力の第2セットを受信するステップS230を含み、ステップS230は、自律エージェントの意思決定において遠隔オペレータから支援を受けるように機能する。追加又は代替として、S230は任意の他の機能を実行してもよい。
【0097】
[00103] 追加又は代替として、方法200は、S230なしで実行されてもよく、及び/又は、任意の他のプロセスを含んでもよい。
【0098】
[00104] S230は、好ましくは、S220に応答して、かつ、S220に基づいて実行され、及び任意選択的に、自律エージェントの操作中に複数回(例えば、連続的に、既定の頻度で、既定の間隔のセットで、ランダムな間隔で、トリガに応答してなど)実行される。追加又は代替として、S230は、方法200の任意の他のプロセスに応答して、方法200の任意の他のプロセスと並行して、及び/又は、任意の他の時点で実行されてもよい。さらに追加又は代替として、方法200はS230なしで実行されてもよい。
【0099】
[00105] 入力の第2セットは、好ましくは、遠隔支援プラットフォームから受信され、及びさらに好ましくは、出力のセットを見ることに応答して1以上の遠隔オペレータから受信されるが、追加又は代替として、任意の他の場所及び/又はエンティティから受信されてもよい。入力の第2セットは、閾値(例えば、停止時間)を超えたなどの遠隔支援イベントトリガの後又は遠隔支援イベントトリガに応答して受信されることが好ましい。追加又は代替として、入力の第2セットは、トリガなしで、異なるトリガに応答して、及び/又は、任意の他の時点で受信されてもよい。
【0100】
[00106] 第2の入力セットは、自律エージェントに利用可能なポリシー及び/又はポリシーのセットに関連することが好ましく、ポリシーは、特定の挙動(例えば、車線変更、車線維持、停止、速度を上げる、速度を下げるなど)及び/又は車両に対するアクションを規定する挙動ポリシーのことをいう。追加又は代替として、ポリシーは、車両のアクション、車両の操縦(例えば、車線のセットを越える)、車両の軌道(例えば、トレース、ウェイポイントのセットなど)、挙動を実装することに関連付けられたパラメータのセットのいずれか又はすべて(例えば、車両速度、他のオブジェクト及び/又は道路形状に対して維持されるべき距離、車両位置など)、及び/又は、エージェントに関連付けられた任意の他の情報のいずれか又はすべてを含んでもよく及び/又は規定してもよい。
【0101】
[00107] S230で受信されたポリシー入力のセットは、任意選択的に、エージェントが、独立して選択することができない、及び/又は、自身で選択を考慮することができない可能性があるポリシーに対応してもよく、当該ポリシーは、例えば:まれなポリシー及び/又はエッジケースに対応するポリシー、交通規則及び/又は慣習に反するポリシー(例えば、片側2車線の車線を越える)、エージェントを規定ルート及び/又は固定ルートの外側に移動させるポリシー、車両が通常選択することができるが異なるパラメータ及び/又は特徴を有する挙動(例えば、異なる速度、他のオブジェクトに対して維持される異なる距離、車線を越える車両の場所の包含など)、及び/又は、任意の他のポリシーいずれか又はすべてである。追加又は代替として、ポリシーには、エージェントが遠隔オペレータの入力なしで選択及び/又は選択を考慮することができるポリシーが含まれてもよい。
【0102】
[00108] 入力の第2セットには:特定の提案ポリシー(例えば、道路上の二重線を越える、路肩へ走行する、固定ルートからそれるなど)の承認(例えば、許可);特定の提案ポリシーの拒否;ポリシーの追加(例えば、車両自体が選択することができるセットの外側);カスタムポリシー(例えば、遠隔オペレータによって作成された軌道トレースに基づく);及び/又は、任意の他の入力のいずれか又はすべてが含まれてもよい。
【0103】
[00109] 変形例の第1セットでは、例えば、入力の第2セットは、自律システム(例えば、搭載コンピューティングシステム)による考慮のためのポリシー(例えば、アクション、挙動、操縦など)を含む。具体例の第1セットでは、入力の第2セットは、遠隔オペレータに提案されたポリシーの遠隔オペレータによる承認指示を含む。具体例の第2セットでは、入力の第1セットに対する追加又は代替として、入力の第2セットは、遠隔オペレータによって提案される追加ポリシーを含み、追加ポリシーは、例えば、非標準ポリシーのセットから選択されてもよい。追加又は代替として、入力の第2セットには、提案ポリシーの拒否が含まれてもよい。具体例では、例えば、遠隔オペレータが、最適ではない(例えば、非効率的、乗客にとって混乱を招く、車両が固定ルートから外れているなど)ものとして、危険である(例えば、工事区域に車両を移動させる、歩行者が多いエリアに車両を移動させるなど)ものとして、又は、それ以外の理想的ではないものとして識別するポリシーが遠隔オペレータに提案されてもよい。したがって、遠隔オペレータは、提案ポリシーを拒否してもよく、及びしたがって、エージェントが(例えば、MPDMフレームワークの)提案ポリシーを考慮することを妨げてもよい。
【0104】
[00110] 変形例の第2セットでは、入力の第2セットは、(例えば、タッチインタフェースで)描かれた車両の軌道のためのトレース及び/又はそれに関連付けられたウェイポイントのセットなど、及び/又は、別の方法で遠隔オペレータによって作成されたものなど、遠隔オペレータからのカスタム操縦を含んでもよい。具体例では、入力の第2セットは、目標車両経路に沿った障害(例えば、動的障害又は静的障害)を迂回するウェイポイントのセットの形態で遠隔オペレータが承認したトレース又は経路を含んでもよい。追加又は代替の具体例では、遠隔オペレータは、提案(自律的に選択不可能な)ポリシーが最適ではない(例えば、安全ではない、立ち往生している車両を克服することに成功していないなど)ことを決定することに応じて、ウェイポイントのセットを提供してもよい。
【0105】
[00111] 具体例のセットでは、この遠隔オペレータが承認した経路は、ポリシーがシミュレーションされ及び/又はこれらの経路の一方又は両方に従って選択される(例えば、障害を回避して目標経路に車両を戻すように車両を操縦するのに役立つポリシーが選択される)ように、(例えば、目標経路に代えて、目標経路とともになど)MPDMモジュールに対する入力として使用されてもよい。
【0106】
[00112] 変形例の第3セットでは、入力の第2セットは、遠隔オペレータによる二分決定(例えば、提案された最適なポリシーの承認/拒否)を含んでもよい。変形例の第4セットでは、入力の第2セットは、車両の遠隔オペレータからの、待機する(例えば、停止したままにする)などのコマンドを含んでもよく、コマンドは、車両がより多くのセンサデータを収集し、かつ、新しいポリシーを移動させる及び/又は選択する前にその環境のより良い理解を取得する(例えば、他のオブジェクトがどのように移動しているかをより良く理解する、オブジェクトタイプをより確実に分類するなど)ことを可能にするように機能してもよい。待機コマンドは、車両を移動させるポリシーが重み付け及び/又はスコアを下げられるように(例えば、それによって、それらの重み付けを下げられたスコアが他のポリシースコアを依然として上回る場合にのみ選択されるように、車両による選択にとって魅力的でなくすなど)、MPDMモジュールに従って利用されることが好ましい。具体例では、(例えば、S215がなしで)遠隔オペレータは自発的に待機コマンドを提供してもよい。代替として、待機挙動は、自律的に選択不可能なポリシーとして提案されてもよく、選択可能なポリシーのセットに含まれてもよく、車両の意思決定を無効にするために使用されてもよく、及び/又は、別の方法で使用されてもよい。追加又は代替として、遠隔オペレータは、「続行」ポリシーを提供及び/又は承認して、待機コマンドの提供後に車両が進行することを可能にしてもよい。例えば、待機コマンドは、車両の目的地に到着するとデフォルトで実行され、車両及び/又はポリシー選択を待機状態にし、車両が進行するために遠隔オペレータの承認を待機してもよい。代替として、車両は自律的に待機コマンドを終了させるように構成されてもよく、又は、待機コマンドは人間によって手動で無効にされてもよい(例えば、車両の出発を開始する)。
【0107】
[00113] 追加又は代替として、入力の第2セットには任意の他の情報が含まれてもよい。
【0108】
4.4 方法-入力の第1セット及び/又は入力の第2セットに基づいてエージェントのアクションを決定するステップS240
[00114] 方法200は、好ましくは、入力の第1セット及び/又は入力の第2セットに基づいてエージェントのアクションを決定するステップS240を含み、ステップS240は、上述した入力のいずれか又はすべてに基づいて自律エージェントの意思決定を実行するように機能する。
【0109】
[00115] 追加又は代替として、方法200は、S240なしで実行されてもよく、及び/又は、任意の他のプロセスを含んでもよい。
【0110】
[00116] S240は、好ましくは、S230に応答して、かつ、S230に基づいて、自律エージェントの操作中に、任意選択的に複数回(例えば、連続的に、既定の頻度で、既定の間隔のセットで、ランダムな間隔で、トリガに応答してなど)実行される。追加又は代替として、S240は、方法200の任意の他のプロセスに応答して、方法200の任意の他のプロセスと並行して、及び/又は、任意の他の時点で実行されてもよい。さらに追加又は代替として、方法200はS240なしで実行されてもよい。
【0111】
[00117] S240は、好ましくは、入力の第1セット及び入力の第2セットのいずれか又はすべてに基づいて、搭載コンピューティングシステムによって実行される。S240はさらに好ましくは、マルチポリシー意思決定モジュール(例えば、上述したようなもの)に従って実行され、S240で遠隔オペレータから受信された入力が使用されて、MPDMモジュールから自律エージェントがどのポリシーを選択することができるかを決定してもよい。ある変形例では、例えば、遠隔オペレータによる提案ポリシーが承認された場合、コンピューティングシステムが考慮して選択するためのポリシーのグループにその提案ポリシーを含め、提案ポリシーが拒否された場合、そのポリシーがコンピューティングシステムによる考慮から除外される。
【0112】
[00118] 変形例では、S240は、好ましくは、車両の既定の車両ルート又は経路(例えば、実行前に決定される、以前の選択サイクルで決定されるなど)などの目標車両経路に基づいて実行される。一例として、システム及び/又はMPDMは、目標経路に厳密に従うポリシーを優先するように構成されてもよい(例えば、コスト関数又は選択基準/ヒューリスティックのセットを使用するなど;システムは通常、名目上の操作下で目標経路に概ね従う;など)。追加又は代替として、遠隔オペレータがS240において自律エージェントの軌道に関するトレースを提供する場合、S250は、目標車両経路から逸脱したそのトレース(及び/又は、それに関連付けられたウェイポイントのセット)に基づいて、車両のための経路を計画するステップを含んでもよい。一例では、例えば、遠隔オペレータは、S240において自律エージェントにウェイポイントのセットを提供してもよく、S250において、コンピューティングシステムは、以下のいずれか又はすべてを行う自律エージェントのための経路を計画する:ウェイポイントをたどる(又は、ポリシー選択のウェイポイントをたどる軌道を優先する)、最大数のウェイポイントに到達する、少なくとも既定の数のウェイポイントに到達する、最初のウェイポイントに到達する、最終ウェイポイントに到達する、及び/又は、ウェイポイントに基づいて別の方法で経路を計画する。これは、車両が立ち往生している場合(例えば、工事区域内)、車両が立ち往生している又はこれから立ち往生すると遠隔オペレータが決定した場合、及び/又は、任意の他の時点で、エージェントに利用可能なポリシーとして含まれてもよい(例えば、エージェントが利用可能な実行可能ポリシーがない極端なエッジケースでは、これが唯一のポリシーになる可能性がある)。追加又は代替として、ポリシー/アクションの選択では、ウェイポイントから逸脱する、及び/又は、(以前の)目標経路に戻る決定権限を保持しながら、遠隔オペレータが承認した経路が考慮されてもよい。一例では、S230中に遠隔オペレータが承認した経路及び/又はウェイポイントの受信に応答して、目標車両経路がその経路に基づいて更新されてもよく、かつ、車両を自律的に制御するステップには:選択可能なポリシーのセットから更新されたポリシーを選択するステップが含まれてもよく、更新されたポリシーは、遠隔オペレータが承認した経路(及び/又は、目標経路;図7Bに一例が示されている)から逸脱する。代替として、車両は、遠隔オペレータが承認した経路(及び/又は、その一部)及び/又は目標経路の一部を正確にたどってもよい。
【0113】
[00119] 例示的な一例では、遠隔オペレータは、例えば、車両(例えば、大型トラックなど)の前の障害の推定されたオブジェクト寸法(車対、トラック対バスなどの分類されたオブジェクトタイプに基づいて決定される場合の、コンピューティングシステムの分類器を用いて決定されるようなもの)を含むトップダウン(俯瞰の)視野に基づいてウェイポイントを提供してもよい。ただし、障害の寸法、特に長さは、車両センサを介して直接又は簡単に観察可能ではない場合があり得る(例えば、72フィートのクラス8セミトラックは、後ろから見た場合に26フィートの移動トラックと視覚的に似ている場合がある)。したがって、車両は、その後の環境観察(例えば、車両がオブジェクトの周りを回り始め、その結果、搭載センサなどからより多くの情報を収集する場合に障害の寸法を直接観察する)に基づいて、遠隔オペレータが承認した経路から逸脱する場合がある(以前の目標経路に早く又は遅く戻る)。
【0114】
[00120] 第2例では、S240において、遠隔オペレータポリシー決定ノード及び遠隔オペレータ決定ノードの下流の一連の自律ポリシー決定ノードのセットを定義する自律エージェントのマルチポリシー決定モジュールを使用してポリシーが選択される。例えば、ポリシーは、遠隔オペレータによる二分決定に基づいて選択可能ポリシーのセットに追加され、かつ、選択可能ポリシーのセットとともにマルチポリシー決定モジュールによって(その後に)評価されてもよい。
【0115】
[00121] 変形例の1つのセットでは、S240は、入力の第1セット及び第2セットに基づいて(例えば、MPDMを使用して)選択可能なポリシーのセットを決定するステップを含んでもよい。ある変形例では、選択可能なポリシーのセットは、車両位置推定及び/又はシナリオ(例えば、環境表現、車両状態推定など)に基づいて既定のセットから決定されてもよく、シナリオは、選択可能なポリシーのセットを改良するために使用される。
【0116】
[00122] 追加又は代替として、S240は、任意の他のプロセスを含んでもよく、及び/又は、別の方法で適切に実行されてもよい。
【0117】
4.5 方法-アクションを実装するステップS250
[00123] 方法200は、アクションを実装するステップS250を含んでもよく、ステップS250は、自律エージェントのためにアクションを実行するように機能する。
【0118】
[00124] 追加又は代替として、方法200は、S250なしで実行されてもよく、及び/又は、任意の他のプロセスを含んでもよい。
【0119】
[00125] S250は、好ましくは、S240に応答して、かつ、S240に基づいて、自律エージェントの操作中に、任意選択的に複数回(例えば、連続的に、既定の頻度で、既定の間隔のセットで、ランダムな間隔で、トリガに応答してなど)実行される。追加又は代替として、S250は、方法200の任意の他のプロセスに応答して、方法200の任意の他のプロセスと並行して、及び/又は、任意の他の時点で実行されてもよい。さらに追加又は代替として、方法200はS250なしで実行されてもよい。
【0120】
[00126] S250は、好ましくは、ステップS240で決定された選択ポリシーを実装するステップを含むが、追加又は代替として、選択ポリシーに基づいて自律エージェントの軌道及び/又は経路計画を(例えば、操作プランナで)決定するステップ、選択ポリシーに基づいて自律エージェントの制御を操作するステップ、及び/又は、任意の他のプロセスのいずれか又はすべてを含んでもよい。一例として、S250は、(例えば、車両に搭載されたさまざまなシステム及び/又はECUに対する)車両命令を決定するステップと、その命令に従って車両を制御するステップと、を含んでもよい。
【0121】
[00127] 具体例では、遠隔オペレータは、車両の動作計画及び/又は車両のアクション/ポリシーの実行に対して直接的な許可を有していない場合がある。例えば、遠隔オペレータは、ステアリング角度を調整し、スロットルを操作し、ブレーキをかけ、又は、別の方法で車両アクションを実行するために直接介入する能力を有しない場合がある。例示的な一例では、遠隔オペレータは、その後のポリシー決定(例えば、一車線の高速道路を時速5マイルで走行する幅広のトラクタを追い越すのが安全かどうかを決定する)を容易にするために、車線の左側に少しずつ寄るポリシーを承認することができる可能性がある)。ただし、車両は、このポリシーを開始すると、遠隔オペレータの介入がなくても又は遠隔オペレータの直接関与によって生じる通信遅延がなくても、対向車を観察し、かつ、(例えば、車線の中央に戻ることによってなど)迅速に反応してもよい。
【0122】
[00128] 方法200の第1変形例では、方法は、自エージェントに関連付けられた入力の第1セットを受信するステップS210であって、入力の第1セットには、自エージェント上で収集されたセンサ情報と、任意選択的に、1以上のインフラストラクチャデバイスのセットからの情報と、が含まれる、ステップS210と;遠隔支援プラットフォームに出力のセットを提供するステップS220であって、出力のセットには、入力の第1セット、及び任意選択的に、1以上の警告及び/又は通知のセットのいずれか又はすべてが含まれる、ステップS220と;遠隔支援プラットフォームから入力の第2セットを受信するステップS230であって、入力の第2セットは、自エージェントに利用可能なポリシーのセットに関連する入力を含む、ステップS230と;任意選択的に、入力の第1セット及び第2セットに基づいて自のアクションを決定するステップS240と;任意選択的に、アクションを実装ステップS250と、を含む。追加又は代替として、方法200は、任意の適切な順序で実行される任意の他のプロセスを含んでもよい。
【0123】
[00129] 具体例(例えば、図3A図3Cに示すように)では、方法200は、自エージェントの経路が、車両に馴染みのない障害などの障害(例えば、時間閾値を超えたことに基づいて)によって妨げられていることを検出するステップ;エージェント(及び、任意選択的に1以上のインフラストラクチャデバイス)からのこのセンサ情報と、エージェントへの提案操縦と、を遠隔支援プラットフォームに送信するステップ;提案操縦に関して遠隔オペレータから入力を受信するステップ;遠隔オペレータが提案操縦を確認した場合、搭載コンピューティングシステム(例えば、搭載コンピューティングシステムのMPDMモジュール)による考慮のために、提案操縦をポリシーのセットに追加するステップ;遠隔オペレータが提案操縦を拒否した場合、搭載コンピューティングシステムによる考慮のために提案操縦をポリシーのセットに追加することをやめるステップ;(例えば、MPDMモジュールによって)利用可能ポリシーのセットから提案操縦を選択するステップ;選択操縦に基づいて自エージェントを操作するステップを含む。
【0124】
[00130] 第2変形例(例えば、図5に一例を示す)では、方法200は:車両の搭載コンピューティングシステムを用いて車両を自律的に制御するステップを含んでもよく、このステップは、選択サイクルの各選択ステップで:センサ入力のセットに基づいて車両状態推定を決定するステップ;車両状態推定に基づいて選択可能ポリシーのセットを決定するステップ;選択可能ポリシーのセットからポリシーを選択するステップ;ポリシーに基づいて車両命令を決定するステップ;車両命令に従って車両を制御するステップ;車両を自律的に制御しながら:車両状態推定に基づいて、イベントトリガの充足を決定するステップ;イベントトリガの充足に基づいて、遠隔支援プラットフォームに出力のセットを提供するステップ;選択可能ポリシーのセットを更新して、遠隔支援プラットフォームで決定された遠隔オペレータ承認ポリシーを含めるステップを含む。一例では、遠隔オペレータ承認ポリシーには、遠隔オペレータによって提供されるウェイポイントのセット(例えば、車両環境内の障害を迂回する)が含まれてもよく、車両はこれに従うことを選択してもよい(例えば、目標経路から一時的に逸脱する、目標経路を変更/更新するなど)。
【0125】
[00131] 第3変形例(例えば、図6に一例を示す)では、方法200は:自律エージェントで、入力の第1セットを決定するステップ;入力の第1セットに基づいて、目標経路に沿った行き詰まりに関連付けられたイベントトリガの充足を決定するステップ;イベントトリガの充足に基づいて、遠隔支援プラットフォームに出力のセットを提供するステップ;遠隔支援プラットフォームから入力の第2セットを受信するステップ;入力の第1セット及び第2セットに基づいて、選択可能ポリシーのセットを決定するステップ;自律エージェントで、目標経路に基づいて選択可能ポリシーのセットからポリシーを選択するステップ;ポリシーに基づいて車両を自律制御するステップを含んでもよい。
【0126】
[00132] 代替の実施形態は、コンピュータ可読命令を格納する非一時的コンピュータ可読媒体内に上記の方法及び/又は処理モジュールを実装する。命令は、コンピュータ可読媒体及び/又は処理システムと統合されたコンピュータ実行可能コンポーネントによって実行されてもよい。コンピュータ可読媒体には、RAM、ROM、フラッシュメモリ、EEPROM、光学デバイス(CD又はDVD)、ハードドライブ、フロッピードライブ、非一時的コンピュータ可読媒体又は任意の適切なデバイスなどの任意の適切なコンピュータ可読媒体が含まれてもよい。コンピュータ実行可能コンポーネントは、CPU、GPU、TPUS、マイクロプロセッサ又はASICなどの非一時的コンピュータ可読媒体に接続されたコンピューティングシステム及び/又は処理システム(例えば、1以上の共起又は分散、遠隔又はローカルプロセッサを含む)を含んでもよいが、命令は、代替又は追加として、任意の適切な専用ハードウェアデバイスによって実行されてもよい。
【0127】
[00133] 簡潔にするために省略したが、好ましい実施形態は、さまざまなシステムコンポーネント及びさまざまな方法プロセスのあらゆる組み合わせ及び順列を含み、方法プロセスは、任意の適切な順序で、連続的に又は同時に実行されてもよい。
【0128】
[00134] システム及び/又は方法の実施形態は、さまざまなシステムコンポーネント及びさまざまな方法プロセスのあらゆる組み合わせ及び順列を含んでもよく、本明細書に記載の方法及び/又はプロセスの1以上の事例は、非同期的に(例えば、連続的に)、同時期に(例えば、同時に、並行してなど)、又は、本明細書に記載されるシステム、要素、及び/又はエンティティのうちの1以上の事例によって及び/又は用いて任意の他の適切な順序で、実行されてもよい。以下のシステム及び/又は方法のコンポーネント及び/又はプロセスは、上述した出願に開示されたシステム及び/又は方法の全部又は一部に加えて、それらに代えて、又は、別の方法で統合して使用されてもよく、これらの出願の全体がこの参照により組み込まれる。
【0129】
[00135] 当業者であれば、前述した詳細な説明から、かつ、図面及び特許請求の範囲から理解するように、以下の特許請求の範囲で規定される本発明の範囲から逸脱することなく、本発明の好ましい実施形態に修正及び変更を加えることができる。
図1
図2
図3A
図3B
図3C
図4
図5
図6
図7A
図7B
【国際調査報告】