特表2022-518783 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ インペリアル　カレッジ　イノベイションズ　リミテッドの特許一覧

特表2022-518783ロボットデバイスの状態を使用した環境のマッピング

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
1D
1E
1F
1G
1H
2
3A
3B
4A
4B
5
6A
6B
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-03-16

(54)【発明の名称】ロボットデバイスの状態を使用した環境のマッピング

(51)【国際特許分類】

G06T 7/70 20170101AFI20220309BHJP

【ＦＩ】

G06T7/70 Z

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2021543212

(86)(22)【出願日】2020-01-15

(85)【翻訳文提出日】2021-07-26

(86)【国際出願番号】 GB2020050083

(87)【国際公開番号】W WO2020152436

(87)【国際公開日】2020-07-30

(31)【優先権主張番号】1901006.5

(32)【優先日】2019-01-24

(33)【優先権主張国・地域又は機関】GB

(81)【指定国・地域】

(71)【出願人】

【識別番号】519426058

【氏名又は名称】インペリアルカレッジイノベイションズリミテッド

【氏名又は名称原語表記】ＩＭＰＥＲＩＡＬＣＯＬＬＥＧＥＩＮＮＯＶＡＴＩＯＮＳＬＩＭＩＴＥＤ

【住所又は居所原語表記】Ｌｅｖｅｌ１ＦａｃｕｌｔｙＢｕｉｌｄｉｎｇ，Ｃ／ＯＩｍｐｅｒｉａｌＣｏｌｌｅｇｅ，ＥｘｈｉｂｉｔｉｏｎＲｏａｄＬｏｎｄｏｎＳＷ７２ＡＺ，ＵｎｉｔｅｄＫｉｎｇｄｏｍ

(74)【代理人】

【識別番号】100108453

【弁理士】

【氏名又は名称】村山靖彦

(74)【代理人】

【識別番号】100110364

【弁理士】

【氏名又は名称】実広信哉

(74)【代理人】

【識別番号】100133400

【弁理士】

【氏名又は名称】阿部達彦

(72)【発明者】

【氏名】チャールズ・フレッチャー・オウセアゴ

(72)【発明者】

【氏名】マイケル・ブロエッシュ

(72)【発明者】

【氏名】シュテファン・ロイテネッガー

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096AA09

5L096BA05

5L096CA02

5L096FA66

5L096FA67

5L096FA69

5L096GA30

(57)【要約】

本明細書に説明する特定の例は、ロボットデバイスが周囲環境を正確にマッピングすることを可能にする。ロボットデバイスは画像キャプチャデバイスを使用し、画像キャプチャデバイス及びロボットデバイスの少なくとも１つは環境内で移動する。画像キャプチャデバイス及びロボットデバイスの少なくとも１つの移動と関連する測定値は、ロボットデバイスの状態を決定するために使用される。ロボットデバイスの状態は、マッピングエンジンによって構築される環境のモデルに対して画像キャプチャデバイス及びロボットデバイスをモデル化する。ロボットデバイスの状態をロボットデバイスの測定された変化と比較することによって、ロボットデバイスの状態の正確な表現が構築され得る。この状態は、環境のモデルを更新するためにマッピングエンジンによって使用される。

【特許請求の範囲】

【請求項1】

ロボットデバイス用のマッピングシステムであって、前記ロボットデバイスが、環境内で前記ロボットデバイスを移動させるための１つ以上のアクチュエータと、画像キャプチャデバイス用の可動マウントとを備え、前記マッピングシステムが、
前記ロボットデバイスの現在の状態と、前記ロボットデバイスの以前の状態を、運動誤差、走行距離計誤差、及び幾何学的誤差に基づいてともに最適化するための状態エンジン
を備え、
前記ロボットデバイスの各状態が、前記環境のモデルに対する前記ロボットデバイスのポーズを示すデータ、及び前記モデルに対する前記画像キャプチャデバイスのポーズを示すデータを含み、
前記運動誤差が、前記可動マウントと関連する運動測定値、及び前記現在の状態から導出された前記ロボットデバイスに対する前記画像キャプチャデバイスのポーズの関数を含み、
前記走行距離計誤差が、前記１つ以上のアクチュエータと関連する走行距離計測法の測定値、及び前記現在の状態と前記以前の状態との間の走行距離計差異の関数を含み、
前記幾何学的誤差が、前記キャプチャデバイスからの画像データと、前記環境の前記モデルとの比較を含み、前記比較が、前記現在の状態に基づいた投影を使用し、
前記マッピングシステムが、前記状態エンジンによる最適化に続いて前記現在の状態を使用し、前記モデルを更新するように構成される
前記マッピングシステム。

【請求項2】

前記可動マウントが複数の関節を備え、前記ロボットデバイスに対する前記画像キャプチャデバイスの前記ポーズが、順運動学を使用して決定される、請求項１に記載のマッピングシステム。

【請求項3】

前記モデルに対する前記ロボットデバイスの前記ポーズ、及び前記モデルに対する前記画像キャプチャデバイスの前記ポーズが、６自由度の範囲内で定義される、請求項１または請求項２に記載のマッピングシステム。

【請求項4】

前記状態エンジンが、一次事前確率を使用して前記現在の状態と前記以前の状態をともに最適化するように構成され、前記状態エンジンが、前記運動誤差、前記走行距離計誤差、前記幾何学的誤差、及び前記以前の状態の周辺化に基づいて、最適化に続いて前記一次事前確率を更新するように構成される、請求項１～３のいずれか１項に記載のマッピングシステム。

【請求項5】

前記マッピングエンジンが、前記モデルの第１のセットの部分を前記モデルの第２のセットの部分とアラインさせるために変形グラフを使用するように構成され、前記変形グラフが、アライメント中に所与の位置で前記モデルを修正するために使用される、前記モデルの前記所与の位置の近接点のセットを示す、請求項４に記載のマッピングシステム。

【請求項6】

前記マッピングエンジンが、ループクロージャ中に前記モデルの前記第１のセットの部分を前記モデルの前記第２のセットの部分とアラインさせるように構成され、前記ループクロージャに続いて、前記一次事前確率及び前記以前の状態が再初期化される、請求項５に記載のマッピングシステム。

【請求項7】

前記モデルが面素モデルを含み、前記面素モデルの各面素が、少なくとも、３次元での前記面素の位置を定義するデータ、及び３次元での前記面素の法線ベクトルを定義するデータを含み、各面素が、３次元空間での２次元領域を表す、請求項１～６のいずれか１項に記載のマッピングシステム。

【請求項8】

前記マッピングシステムが、前記画像キャプチャデバイスのためのポーズグラフなしで前記モデルを生成するように構成される、請求項１～７のいずれか１項に記載のマッピングシステム。

【請求項9】

ロボットデバイスであって、
前記ロボットデバイスに対して移動できるように取り付けられた画像キャプチャデバイスと、
環境に対して前記ロボットデバイス及び前記画像キャプチャデバイスの１つ以上を移動させるための１つ以上のアクチュエータと、
前記ロボットデバイスの状態を更新するための状態エンジンと、
前記ロボットデバイスの前記状態を使用して前記環境の３次元モデルを生成するためのマッピングエンジンと
を備え、
前記ロボットデバイスの前記状態が、前記３次元モデルに対する前記画像キャプチャデバイスの少なくとも変換を含み、
前記状態エンジンが、前記ロボットデバイスの前記状態と、前記１つ以上のアクチュエータから取得した測定値との比較に基づいて、前記ロボットデバイスの前記状態を更新するように構成され、
前記マッピングエンジンが、前記３次元モデルを更新するために、前記ロボットデバイスの前記状態に基づいて、前記画像キャプチャデバイスからの画像を前記３次元モデルと比較するように構成される
前記ロボットデバイス。

【請求項10】

前記マッピングエンジンが、反復最接近点誤差を決定するように構成され、前記状態エンジンが、前記ロボットデバイスの前記状態を更新するために前記反復最接近点誤差をさらに使用するように構成される、請求項９に記載のロボットデバイス。

【請求項11】

前記１つ以上のアクチュエータが、
前記環境に対して前記ロボットデバイスを移動させるためのアクチュエータの第１のセットと、
前記ロボットデバイスに対して前記画像キャプチャデバイスを移動させるためのアクチュエータの第２のセットと、
を備え、
前記ロボットデバイスの前記状態が、前記３次元モデルに対する前記ロボットデバイスの変換をさらに含む、
請求項９または請求項１０に記載のロボットデバイス。

【請求項12】

前記アクチュエータの第１のセットが、前記ロボットデバイスと前記環境との間で複数の自由度を提供し、前記アクチュエータの第２のセットが、前記画像キャプチャデバイスと前記ロボットデバイスとの間で複数の自由度を提供する、請求項１１に記載のロボットデバイス。

【請求項13】

前記画像キャプチャデバイスが、カラー画像データ及び深度マップを出力するように構成され、前記マッピングエンジンが、前記３次元モデルを更新するために前記カラー画像データ及び前記深度マップを使用するように構成される、請求項９～１２のいずれか１項に記載のロボットデバイス。

【請求項14】

移動できるように結合された画像キャプチャデバイスを有するロボットデバイスを使用して環境の３次元モデルを更新する方法であって、
前記画像キャプチャデバイス及び前記ロボットデバイスの少なくとも１つの前記環境内での移動を命令することと、
前記画像キャプチャデバイスを用いて前記環境の観測を表す画像データを取得することと、
前記移動の測定値を取得することと、
前記ロボットデバイスのモデル状態を更新することであって、前記ロボットデバイスの前記モデル状態が、前記ロボットデバイス及び前記画像キャプチャデバイスのポーズデータを含み、前記更新することが前記モデル状態及び前記移動の前記測定値の関数を最適化することを含む、前記更新することと、
前記更新したモデル状態を使用する前記画像データと前記３次元モデルとの比較に基づいて、前記環境の前記３次元モデルを更新することであって、前記比較が、前記更新したモデル状態を使用する投影を含む、前記更新することと
を含む、前記方法。

【請求項15】

前記ポーズデータが、前記３次元モデルに対する前記ロボットデバイスの変換、及び前記ロボットデバイス及び前記３次元モデルの少なくとも１つに対する前記画像キャプチャデバイスの変換を含む、請求項１４に記載の方法。

【請求項16】

移動を命令することが、
アクチュエータの第１のセットに、前記環境内で前記ロボットデバイスを移動させるように命令することと、
アクチュエータの第２のセットに、前記ロボットデバイスに対して前記画像キャプチャデバイスを移動させるように命令することと
の１つ以上を含み、
前記ロボットデバイスから移動の測定値を取得することが、
前記アクチュエータの第１のセットから走行距離計測法データを取得することと、
前記アクチュエータの第２のセットから運動データを取得することと
の１つ以上を含む、請求項１４または請求項１５に記載の方法。

【請求項17】

前記ロボットデバイス及び前記画像キャプチャデバイスの前記モデル状態を更新することが、
コスト関数を最適化することであって、前記コスト関数が、運動誤差と関連する誤差項、及び走行距離計誤差と関連する誤差項を含む、前記最適化すること
を含み、
前記運動誤差が、前記画像キャプチャデバイスと前記ロボットデバイスとの間の空間関係と、前記ロボットデバイスからの運動測定値との比較を含み、
前記走行距離計誤差が、前記ロボットデバイスと前記環境の前記３次元モデルとの間の前記空間関係の変化と、前記ロボットデバイスからの走行距離計測法データとの比較を含む、
請求項１４～１６のいずれか１項に記載の方法。

【請求項18】

前記コスト関数が、一次事前確率と関連する誤差項を含み、前記一次事前確率が、誤差値、及び以前の更新操作からの前記ロボットデバイスの前記モデル状態を使用して構築される、請求項１７に記載の方法。

【請求項19】

前記コスト関数が、幾何学的アライメント誤差に関連する誤差項を含み、前記幾何学的アライメント誤差が、前記取得した画像データから導出された深度データと、前記更新前の前記ロボットデバイスの前記モデル状態を使用する前記３次元モデルとの比較を含む、請求項１７または請求項１８に記載の方法。

【請求項20】

プロセッサによる実行時に、コンピューティングデバイスに、請求項１４～１９のいずれか１項に記載の方法を実行させるコンピュータ実行可能命令を含む、非一時的なコンピュータ可読記憶媒体。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ロボットデバイスを使用し、環境をマッピングすることに関する。本発明は、ロボットデバイスの状態を使用して環境のモデルを生成することに特に関連するが、これに限定されるものではなく、状態は、ロボットデバイスが環境内で移動するにつれ、測定値に基づいて更新される。

【背景技術】

【0002】

コンピュータビジョン及びロボティックスの分野では、多くの場合、ロボットデバイスを使用してナビゲート可能である３次元空間など、環境の表現を構築する必要がある。３次元空間の表現を構築することによって、電子機器が環境のマップを使用及び操作し得る仮想領域またはデジタル領域に、現実世界環境をマッピングすることが可能になる。例えば、可動ロボットデバイスは、３次元空間の表現が、自己位置推定とマッピングの同時実行（多くの場合「ＳＬＡＭ」と呼ぶ）、したがってその環境のナビゲーションを可能にすることを必要とする場合がある。ロボットデバイスは、屋内の家庭環境もしくは商業環境、または屋外の自然環境において動作し得る。環境の表現は、その空間内のオブジェクトのモデルを識別及び／または抽出することを可能にし得る。これらは、現実世界環境で測定を実行するために使用し得る、及び／または例えば積層造形システムを介して３次元複製物を生成するために使用し得る。同様に、３次元空間での人体の部分の検出によって、新規のマンマシンインタラクションが可能になり得、現実の世界での動作を使用し、オブジェクトの仮想表現を操作することを可能にする。

【0003】

環境の表現を構築するために利用可能ないくつかの技術がある。例えば、運動からの構造復元及びマルチビューステレオは、これを行うために使用し得る２つの技術である。多くの技術が環境の画像から特徴を抽出し、次に、特徴が画像から画像に相互に関連付けられ、３次元表現を構築する。表現を生成するために、削減した数の点または特徴を使用する特定の技術を「スパース」技術と呼ぶ。例えば、これらの技術は、十から百の特徴及び／点を使用して表現を生成し得る。これらは、多くの数千または数百万の点を有する表現を生成する「高密度」技術と対比される場合がある。「スパース」技術は、例えば毎秒３０フレームのフレームレートなど、リアルタイムで実装するのがたやすいという利点を有する。限られた数の点または特徴を使用することによって、３次元表現を構築するために必要とされる処理の範囲が制限される。それに比べ、環境のリアルタイム「高密度」マッピングを実行することは、計算上の要件のためより困難である。例えば、３０分の提供された画像データから「高密度」表現を生成するには１０時間かかる場合があるなど、多くの場合、例えばオフラインで「高密度」マッピングを実施する方が好まれる。

【0004】

移動するキャプチャデバイスから環境の表現を生成するとき、空間内でのキャプチャデバイスの位置及び向きを決定し、例えば広範囲の「不安定な」または「混乱した」動きなど、予測不可能な動きに対処する課題がある。例えば、平らではない地形及び均一ではない操作条件は、キャプチャデバイスの位置及び向きに頻繁な変化を生じさせる場合があり、自律ロボットデバイスは３次元空間内の以前にキャプチャした場所を再訪する場合がある。また、画像データのキャプチャはリアルタイムで連続し、大量のキャプチャデータを生じさせる場合がある。これらの要因のすべては、現実世界のシステムに課題を提示している。多くの技術は、データが限られた、またはキャプチャ軌跡が厳しく定義された状態で成功し得るが、可動ロボットデバイスからリアルタイムで表現を構築することに苦労している。

【0005】

ＳｔｅｆａｎＬｅｕｔｅｎｅｇｇｅｒらは、その論文「Ｋｅｙｆｒａｍｅ－ＢａｓｅｄＶｉｓｕａｌＩｎｅｒｔｉａｌＳＬＡＭＵｓｉｎｇＮｏｎｌｉｎｅａｒＯｐｔｉｍｉｚａｔｉｏｎ」、Ｒｏｂｏｔｉｃｓ：ＳｃｉｅｎｃｅａｎｄＳｙｓｔｅｍｓ２０１３、Ｂｅｒｌｉｎ、Ｇｅｒｍａｎｙ、Ｊｕｎｅ２４－２８、２０１３の中で、ＳＬＡＭシステムで視覚的なキューと慣性キューを融合する方法を説明している。この論文は、ロボットデバイスが体験する力を測定するために一連の加速度計及びジャイロスコープを含む慣性計測装置（ＩＭＵ）の使用を説明している。しかしながら、実際には、この論文で提案されているＩＭＵを使用すると、３次元モデルの構築時に問題を引き起こすドリフト及び劣化に悩まされることが判明している。また、提案された解決策は、キーフレームに作用し、ポーズグラフベースのマッピングシステムを必要とする。ポーズグラフベースのマッピングシステムは、シーンの異なるビュー、及びその中のオブジェクトを提示し得るワールドモデルをキーフレームから構築しなければならない。また、モデリングが十分に定義されていない（ｕｎｄｅｒｄｅｆｉｎｅｄ）という問題もある。

【0006】

ＷＯ２０１６／１８９２７４Ａ１は、３次元空間をモデル化する方法を説明している。３次元空間の３次元モデルを生成するために、少なくとも１つのキャプチャデバイスからの画像データが使用される。特定の例では、３次元モデルは、少なくとも１つのモデル特性に基づいてアクティブ部分と非アクティブ部分にセグメント化される。例は、経時的に３次元モデルを更新するためにアクティブ部分を使用するように構成される。また、３次元モデルのアクティブ部分を３次元モデルの非アクティブ部分と経時的にアラインさせるために、位置合わせも実行される。位置合わせによって、３次元空間のリージョンの観測に続いて生成された３次元モデルのアクティブ部分は、該リージョンの少なくとも１つの以前の観測に続いて生成されたモデルの非アクティブ部分とアラインする。

【0007】

ＷＯ２０１６／１８９２７４Ａ１の方法は、ポーズグラフなしに動作する。これによって、方法は、Ｌｅｕｔｅｎｅｇｇｅｒらによって提示された、環境をマッピングしながらポーズグラフを構築する以前の手法と互換性がなくなる。ＷＯ２０１６／１８９２７４Ａ１に提示された方法は、環境のモデルを構築するための改善策を提供するが、方法を特定の現実世界ロボットデバイスに適用することには問題がある。例えば、ロボットデバイスは多くの場合、ハンドヘルドデバイスによって追跡される円滑な経路とは異なる画像経路を有するなど、例えば特定のロボットデバイスは円滑に移動しない。また、ロボットデバイスは、多くの場合、ぎくしゃくしたカメラの移動を生じさせる非平面状の地形を横切る。特定の状況では、ＷＯ２０１６／１８９２７４Ａ１の実施態様もリアルタイムでこれらのロボットデバイスから画像を処理しようと苦心していることが判明している。

【発明の概要】

【0008】

本発明の一態様によれば、ロボットデバイス用のマッピングシステムが提供され、ロボットデバイスは環境内でロボットデバイスを移動させるための１つ以上のアクチュエータ、及び画像キャプチャデバイス用の可動マウントを含む。マッピングシステムは、運動誤差、走行距離計誤差、及び幾何学的誤差に基づいてロボットデバイスの現在の状態及び以前の状態をともに最適化するために状態エンジンを含む。ロボットデバイスの各状態は、環境のモデルに対するロボットデバイスのポーズを示すデータ、及びモデルに対する画像キャプチャデバイスのポーズを示すデータを含む。運動誤差は、可動マウントと関連する運動測定値、及び現在の状態から導出されたロボットデバイスに対する画像キャプチャデバイスのポーズの関数を含む。走行距離計誤差は、１つ以上のアクチュエータと関連する走行距離計測法の測定値、及び現在の状態と以前の状態との走行距離計の差異の関数を含む。幾何学的誤差は、キャプチャデバイスからの画像データと環境のモデルとの比較を含み、比較は、現在の状態に基づいた投影を使用する。マッピングシステムは、状態エンジンによる最適化に続く現在の状態を使用し、モデルを更新するように構成される。

【0009】

特定の例では、可動マウントは複数の関節を含み、画像キャプチャデバイスのロボットデバイスに対するポーズは、順運動学を使用し、決定される。

【0010】

特定の例では、モデルに対するロボットデバイスのポーズ、及びモデルに対する画像キャプチャデバイスのポーズは、６自由度の範囲内で定義される。

【0011】

特定の例では、状態エンジンは、一次事前確率（ｌｉｎｅａｒｐｒｉｏｒ）を使用し、現在の状態と以前の状態をともに最適化するように構成され、状態エンジンは、運動誤差、走行距離計誤差、幾何学的誤差、及び以前の状態の周辺化に基づいて最適化に続いて一次事前確率を更新するように構成されている。そのような例では、マッピングエンジンは、モデルの第１のセットの部分をモデルの第２のセットの部分とアラインさせるために変形グラフを使用するように構成され得、変形グラフは、アライメント中に所与の位置でモデルを修正するために使用される、モデルの所与の位置の近接点（ｎｅｉｇｈｂｏｕｒｓ）のセットを示す。これらの例では、マッピングエンジンは、ループクロージャ中にモデルの第１のセットの部分をモデルの第２のセットの部分とアラインさせるように構成され得、ループクロージャに続いて、一次事前確率及び以前の状態は再初期化される。

【0012】

特定の例では、モデルは面素モデルを含み、面素モデルの各面素は、少なくとも、３次元における面素の位置を定義するデータ、及び３次元における面素の法線ベクトルを定義するデータを含み、各面素は３次元空間内の２次元領域を表す。

【0013】

特定の例では、マッピングシステムは、画像キャプチャデバイスのポーズグラフのないモデルを生成するように構成される。

【0014】

本発明の第２の態様によれば、ロボットデバイスに対して移動できるように取り付けられた画像キャプチャデバイス、環境に対してロボットデバイス及び画像キャプチャデバイスの１つ以上を移動させるための１つ以上のアクチュエータ、ロボットデバイスの状態を更新するための状態エンジン、及びロボットデバイスの状態を使用して環境の３次元モデルを生成するためのマッピングエンジンを含むロボットデバイスが提供される。ロボットデバイスの状態は、３次元モデルに対する画像キャプチャデバイスの少なくとも変換を含む。状態エンジンは、ロボットデバイスの状態と１つ以上のアクチュエータから取得される測定値との比較に基づいてロボットデバイスの状態を更新するように構成される。マッピングエンジンは、３次元モデルを更新するために、ロボットデバイスの状態に基づいて画像キャプチャデバイスからの画像を３次元モデルと比較するように構成される。

【0015】

特定の例では、マッピングエンジンは、反復最接近点誤差を決定するように構成され、状態エンジンは、反復最接近点誤差をさらに使用してロボットデバイスの状態を更新するように構成される。

【0016】

特定の例では、１つ以上のアクチュエータは、環境に対してロボットデバイスを移動させるためのアクチュエータの第１のセット、及びロボットデバイスに対して画像キャプチャデバイスを移動させるためのアクチュエータの第２のセットを含み、ロボットデバイスの状態は、３次元モデルに対するロボットデバイスの変換をさらに含む。そのような例では、アクチュエータの第１のセットは、ロボットデバイスと環境との間に複数の自由度を提供し得、アクチュエータの第２のセットは、画像キャプチャデバイスとロボットデバイスとの間に複数の自由度を提供し得る。

【0017】

特定の例では、画像キャプチャデバイスは、カラー画像データ及び深度マップを出力するように構成され、マッピングエンジンは、３次元モデルを更新するためにカラー画像データ及び深度マップを使用するように構成される。

【0018】

本発明の第３の態様によれば、移動できるように結合された画像キャプチャデバイスを有するロボットデバイスを使用し、環境の３次元モデルを更新する方法が提供される。方法は、画像キャプチャデバイス及びロボットデバイスの少なくとも１つの環境内での移動を命令すること、画像キャプチャデバイスを用いて環境の観測を表すデータを取得すること、移動の測定値を取得すること、ロボットデバイスのモデル状態を更新することであって、ロボットデバイスのモデル状態は、ロボットデバイス及び画像キャプチャデバイスのポーズデータを含み、更新することはモデル状態及び移動の測定値の関数を最適化することを含む、更新すること、及び更新したモデル状態を使用し、画像データと３次元モデルとの比較に基づき環境の３次元モデルを更新することであって、比較が更新したモデル状態を使用する投影を含む、更新することを含む。

【0019】

特定の例では、ポーズデータは、３次元モデルに対するロボットデバイスの変換、及びロボットデバイス及び３次元モデルの少なくとも１つに対する画像キャプチャデバイスの変換を含む。

【0020】

特定の例では、移動を命令することは、アクチュエータの第１のセットに環境内でロボットデバイスを移動させるように命令すること、及びアクチュエータの第２のセットにロボットデバイスに対して画像キャプチャデバイスを移動させるように命令することの１つ以上を含む。これらの例では、ロボットデバイスから移動の測定値を取得することは、アクチュエータの第１のセットから走行距離計測法データを取得すること、及びアクチュエータの第２のセットから運動データを取得することの１つ以上を含む。

【0021】

特定の例では、ロボットデバイス及び画像キャプチャデバイスのモデル状態を更新することは、コスト関数を最適化することを含み、コスト関数は、運動誤差と関連する誤差項及び走行距離計誤差と関連する誤差項を含む。そのような例では、運動誤差は、画像キャプチャデバイスとロボットデバイスの空間関係性と、ロボットデバイスからの運動測定値との比較を含み、走行距離計誤差は、ロボットデバイスと環境の３次元モデルの空間関係性の変化と、ロボットデバイスからの走行距離計測法データとの比較を含む。これらの例では、コスト関数は一次事前確率と関連する誤差項を含み得、一次事前確率は、以前の更新操作から誤差値、及びロボットデバイスのモデル状態を使用して構築される。これらの例では、コスト関数は幾何学的アライメント誤差と関連する誤差項を含み得、幾何学的アライメント誤差は、取得した画像データから導出した深度データと、更新前のロボットデバイスのモデル状態を使用する３次元モデルとの比較を含む。

【0022】

本発明の第４の態様によれば、プロセッサによる実行時に、コンピューティングデバイスに、上述の方法のいずれかを実行させるコンピュータ実行可能命令を含む非一時的なコンピュータ可読記憶媒体が提供される。

【0023】

本発明のさらなる特徴及び優位点は、添付図面を参照して行われる、ほんの一例として示される本発明の好ましい実施形態の以下の説明から明らかになる。

【図面の簡単な説明】

【0024】

【図1A】マッピングされる環境の第１の例を示す概略図である。

【図1B】例示的なデバイスの利用可能な自由度を示す概略図である。

【図1C】ロボットデバイスを、そのロボットデバイスの第１の例及び状態に従ってそれぞれ示す概略図である。

【図1D】ロボットデバイスを、そのロボットデバイスの第１の例及び状態に従ってそれぞれ示す概略図である。

【図1E】ロボットデバイスを、そのロボットデバイスの第２の例及び状態に従ってそれぞれ示す概略図である。

【図1F】ロボットデバイスを、そのロボットデバイスの第２の例及び状態に従ってそれぞれ示す概略図である。

【図1G】ロボットデバイスを、そのロボットデバイスの第３の例及び状態に従ってそれぞれ示す概略図である。

【図1H】ロボットデバイスを、そのロボットデバイスの第２の例及び状態に従ってそれぞれ示す概略図である。

【図2】Ａ～Ｃは、例示的なキャプチャデバイスを示す概略図である。

【図3A】第１の例によるロボットデバイスのマッピングシステムの概略図である。

【図3B】第２の例によるロボットデバイスのマッピングシステムの概略図である。

【図4A】一例による状態エンジンの概略図である。

【図4B】一例によるロボットデバイスの状態の構成要素を示す概略図である。

【図5】一例によるマッピングエンジンの特定のコンポーネントを示す概略図である。

【図6A】３次元面素モデルの例示的なデータを示す概略図である。

【図6B】一例による面素の属性を示す概略図である。

【図7】一例によるマッピングシステムによる画像データの処理を示す概略図である。

【図8】格納されている表現及び変形グラフを使用する一例を示す概略図である。

【図9】一例に従って環境のモデルを更新する方法を示す流れ図である。

【図10】一例に従って、ロボットデバイスの移動、及び状態最適化を使用するモデル空間内でのドリフトの補正を示す概略図である。

【図11】一例に係る状態最適化の状態グラフである。

【図12】例示的なマッピング性能を示すチャートである。

【図13】一例に係る非一時的なコンピュータ可読媒体を示す概略図である。

【発明を実施するための形態】

【0025】

本明細書で説明する特定の例によって、ロボットデバイスは周囲の環境を正確にマッピングすることが可能になる。ロボットデバイスは画像キャプチャデバイスを含み、画像キャプチャデバイス及びロボットデバイスの少なくとも１つは環境内で移動する。例えば、ロボットデバイスに対する画像キャプチャデバイスの移動または環境に対するロボットデバイスの移動の測定値などの画像キャプチャデバイス及びロボットデバイスの少なくとも１つと関連する測定値は、ロボットデバイスの状態を決定するために使用される。ロボットデバイスの状態は、マッピングエンジンによって構築される環境のモデルに関して、画像キャプチャデバイス及びロボットデバイスをモデル化する。状態は、ロボットデバイスと関連する測定値を使用して更新され得る。この状態は、環境のモデルを更新するためにマッピングエンジンによって使用される。ロボットデバイスの状態の精度を高めることによって、マッピング精度を高め得る。

【0026】

本明細書に説明する特定の例は、１つ以上の画像キャプチャデバイス用の複雑な機械的なマウントを有するロボットデバイスに適用し得る。また、特定の例は、非平面状の表面を有する、複雑な内部環境及び／外部環境をナビゲートするロボットデバイスに適用してもよい。これらの応用例では、説明した例は、環境な正確なマッピングを維持することができるシステム及び方法を提供する。それらはこのようにして自律性の探索及び救出ならびに災害復旧などの分野でのマッピングの改善を提供する。これらは、多くの比較手法が、正確なマッピングを提供しようと苦心している分野である。

【0027】

本明細書に説明する特定の例は、ポーズグラフを使用しないマッピングシステムと統合し得る。マッピングシステムは、このようにして、例えばハンドヘルドデバイスを使用する屋内シーンマッピングでのその証明された適用性など、３次元空間のマッピングにおけるその精度を強化することができる。マッピングシステムは、これらの手法をより広範囲な状況及び環境において確実に使用できるようにする。

【0028】

特定の例では、３次元空間の高密度で一貫性があり、包括的なモデルは、ロボットデバイスが画像キャプチャデバイスの可動マウントを有することから生じる「混乱した」及び／または「不安定な」キャプチャデバイスの軌跡から生成される場合がある。本明細書に説明する特定の例は、状態最適化及びモデル構築が、リアルタイムの、またはほぼリアルタイムのフレームレートで発生することを可能にする特徴を含む。例えば、特定の特徴は、例えば特定の問題をもたらし、マッピング精度を減少させる可能性があるキーフレームベースの手法を使用せずに、フレーム単位で自己位置推定と高密度マッピングの同時実行を可能にする。

【0029】

特定の例では、３次元モデルまたはマップ（本明細書では「モデル」と呼ぶ）は、モデルの少なくとも１つの特性に基づいて少なくともアクティブ部分と非アクティブ部分にセグメント化される。例えば、そのようなモデルの位置要素は、モデル修正の時間に基づいてアクティブまたは非アクティブに分類される場合があり、例えば、モデルのより古い部分は非アクティブと分類される場合がある、及び／またはキャプチャデバイスもしくは空間内の定義された場所から特定の距離上にある位置要素などの３次元空間内のキャプチャデバイスからの距離は、非アクティブと分類される場合がある。これらの場合、３次元モデルのアクティブ部分は、該モデルを更新するために使用され、非アクティブ部分は、モデルを更新するために使用されない。この更新は、画像データからモデルの新しい位置要素を決定するなど、画像データのフレームをモデルと融合することを含み得る。

【0030】

また、本明細書に説明する特定の例は、アクティブモデル部分と非アクティブモデル部分のアライメントも提供する。これによって、キャプチャデバイスが３次元空間内の所与の場所を再訪または再観測するときにいわゆる「ループ」クロージャが可能になる。キャプチャされた画像データが処理されるにつれ、フレーム単位の頻度で実行され得るこのアライメント、及びロボットデバイスの状態の正確な追跡によって、モデルの精度及び安定性が維持され、可動カメラマウントを有する現実世界のロボットデバイスによってキャプチャされる「混乱した」及び／または「不安定な」キャプチャデバイス軌跡に確実に対処する能力が提供される。特定の場合、アライメントは、２つの態様、つまり、アクティブモデルと非アクティブモデルの各々から生成された予測フレームをアラインさせようと試みる「ローカルループクロージャ」、及び画像データの所与のフレームを画像データの以前処理されたフレームの表現とアラインさせようと試みる「グローバルローカルクロージャ」を組み込み得る。アライメントは、例えばスペースデフォメーションを介してモデルを変形することによって実行され得る。特定の場合、この変形は剛体ではなく、変形グラフを使用してモデルの位置要素に変換を適用し得る。これによって、例えばモデリングプロセスの構造体であり、モデル化されている３次元空間を反映しない不連続点を低減することによって、３次元におけるモデルの精度及び一貫性をさらに高め得る。特に、そのような変形グラフはスパースであってよい、及び／または、例えばモデルの位置要素と関連付けられるなど、空間に埋め込まれ得る。これらの技術は、例えば画像フレームの独立キーフレームを剛体変換するために使用される、カメラデバイスの場所及び向きの確率論的表現など、ポーズグラフを必要とする技術とは異なる。

【0031】

本明細書に説明する特定の例は、運動測定値及び走行距離計測法の測定値などの移動測定値に基づいて追跡機能を提供する。精度は、幾何学的誤差に基づいて制約を組み込むことによってさらに高め得る。運動誤差は、ロボットデバイスに移動できるように取り付けられた画像キャプチャデバイスに対して定義され得る。走行距離計誤差は、ロボットデバイスの以前の状態と現在の状態の両方に対してロボットデバイスのポーズを制約するために定義され得る。特定の場合、追跡はフレーム単位でビデオデータに対して実行され得、以前の状態の構成要素と現在の状態の構成要素を含む状態グラフは、各フレームが受け取られるにつれ解決される。以前の状態及び誤差は一次事前確率に周辺化され得、一次事前確率は、状態推定値も制約し得る。上述のループクロージャは、手動処理され得る。ループクロージャの場合、一貫したモデルは、モデルを円滑に変形させ、次にロボットデバイスの少なくとも以前の状態を更新することによって維持され得る。

【0032】

図１Ａ、図１Ｂ、及び図１Ｃは、環境及びその環境と関連する画像データのキャプチャの例を概略で示す。これらの例は、本明細書に説明する特定の特徴をより良く説明するために提示されており、限定的と見なすべきではない。特定の特徴は、説明を容易にするために省略され、簡略化されている。

【0033】

図１Ａは、３次元空間１１０の形をとる環境の例１００を示す。３次元空間１１０は、例えば部屋または地理的な位置の少なくとも一部分などの内部及び／または外部の物理的な空間であってよい。３次元空間１１０は、惑星上の場所である場合がある。本例１００の３次元空間１１０は、３次元空間とともに位置するいくつかの物理オブジェクト１１５を含む。これらのオブジェクト１１５は、とりわけ、人、電子機器、家具、動物、建物の部分、及び設備の１つ以上を含む場合がある。また、例１００は、３次元空間１１０と関連する画像データをキャプチャしている画像キャプチャデバイス１２０も示す。画像キャプチャデバイス１２０は、３次元空間１１０を観測することから生じるデータを記録するように配置された、デジタル形式またはアナログ形式のどちらかのカメラを含み得る。図１Ａでは、画像キャプチャデバイス１２０は、アクチュエータ１３５を使用し、３次元空間１１０をナビゲートするように配置されたロボットデバイス１３０に取り付けられている。本例では、これらのアクチュエータは車輪を含む。他の場合、アクチュエータは、線路、穴堀機構、脚部、回転子などを含み得る。例えば、ロボットデバイス１３０は、制御されたまたは自律性の航空の及び／または地上のデバイスまたは車両を含み得る。図１Ａの３次元空間１１０は、より低い表面と示されているが、これはすべての実施態様でそうである必要はなく、例えば、環境は、気中空間または地球外の空間内である場合がある。図１Ａで、画像キャプチャデバイス１２０は、ロボットデバイス１３０に移動できるように取り付けられている。例えば、画像キャプチャデバイス１２０は、ロボットデバイス１３０に機械的に結合され得、ロボットデバイスは３次元空間１１０内で移動するように配置される。

【0034】

図１Ｂは、例示的な画像キャプチャデバイス１２０及び例示的なロボットデバイス１３０が利用可能な自由度の例１４０を示す。画像キャプチャデバイス１２０の場合、画像キャプチャデバイス１２０の方向１５０は、レンズまたは他の撮像装置の軸と同一直線上であってよい。３つの軸の１つの周りでの回転の例として、垂直軸１５５が図示されている。同様に、ロボットデバイス１３０の場合、ロボットデバイス１４５のアライメントの方向が定義され得る。これは、ロボットデバイスの向き及び／または移動の方向を示し得る。また、垂直軸１５５も図示されている。画像キャプチャデバイス１２０またはロボットデバイス１３０に関して単一の垂直軸だけしか示していないが、これらのデバイスは、以下に説明するように、１４０として概略で示す軸のいずれか１つ以上の周りで回転し得る。

【0035】

より一般的には、デバイスの位置及び向きは、６自由度に関して３次元で定義され得る。つまり、位置または場所は、例えば［ｘ、ｙ、ｚ］座標など３次元のそれぞれ内で定義され得、向きは、例えば［θ_ｘ、θ_ｙ、θ_ｚ］など３つの軸のそれぞれの周りでの回転を表す角度ベクトルによって定義され得る。本明細書に説明する例では、デバイスの位置及び向きは、デバイスのポーズとして定義される。デバイスのポーズは経時的に変わる場合があり、その結果、デバイスは時間ｔで時間ｔ＋１とは異なるポーズを有する場合がある。これは、画像キャプチャデバイスとロボットデバイスの両方に当てはまり得る。また、デバイスのポーズは、例えばロボットデバイスが環境内で動き回るにつれ、または画像キャプチャデバイスがロボットデバイスに関して移動するにつれなど、経時的に変化する場合がある。これは、以下に図１Ｃ～図１Ｈを参照してさらに説明される。

【0036】

図１Ｃ～図１Ｈは、３つの例示的なロボットデバイス１６０、１８０、及び１９０を示している。これらのロボットデバイスは例示的な例であり、本明細書に説明する方法及びシステムは、多種多様の構成及び構造を有するロボットデバイスに適用し得る。

【0037】

図１Ｃは、ロボットデバイス１６０の第１の例を示している。ロボットデバイス１６０は、シャシ１６２、アクチュエータ１６４のセット、可動マウント１６５、及び画像キャプチャデバイス１６６を含む。本例のアクチュエータ１６４のセットは、車輪のセットを含む。可動マウント１６５は、一端でシャシ１６２に、他端で（「エンドエフェクタ」位置で）画像キャプチャデバイス１６６に機械的に結合されている。可動マウント１６５は、例えばロボットデバイス１６０のシャシ１６２に対する、画像キャプチャデバイス１６６の移動に１以上の自由度を提供する。図１Ｃの可動マウント１６５は複数の関節を含む。可動マウント１６５の正確な構成及び各関節での可能な移動の範囲は、デバイスごとに変わり得る。本例では、可動マウントによって、画像キャプチャデバイス１６６は、ロボットデバイス１６０のシャシ１６２とは異なる位置及び向きを有することができる。アクチュエータ１６４のセットによって、ロボットデバイス１６０のシャシ１６２は、周囲の環境内で変化する位置及び向きを有することができる。したがって、シャシ１６２及び画像キャプチャデバイス１６６の各々は、最大６つまでの変数で表される異なる状態を有し得、例えば、シャシ１６２及び画像キャプチャデバイス１６６の各々の状態は、３次元空間の座標、及び空間内の各軸の周りの回転のセットを示すマトリクスによって定義され得る。３次元空間は、環境をナビゲートするためにロボットデバイスによって使用されるモデルに関して定義され得る。１つの場合では、可動マウントは、無指向性ロボットデバイスに取り付けられたアームまたはマニピュレータを含み得る。この場合、ロボットデバイスは、ほぼ一定な高さの表面で任意の方向に移動可能であり得る。

【0038】

図１Ｄは、ロボットデバイス１６０の状態がどのようにモデル化され得るのかを示す。図１Ｄは、定義された座標系を有するモデル空間を示している。モデル空間は、図１Ｂに示す軸によって定義された３次元ユークリッド空間であってよい。例えば、デバイスが起動されるときのロボットデバイス１６０の初期の位置、及び／または（例えば、多次元バーコードなど、符号化されたデータを使用し）環境内の１つ以上のオブジェクトに対して較正された位置に基づき得るなど、モデル空間内の原点は任意に選び得る。図１Ｄでは、ロボットデバイス１６０の状態は、モデル空間に対するロボットデバイス１６０のポーズを示すデータ１６８を含む。この場合、ロボットデバイス１６０のポーズは、ロボットデバイスのシャシ１６２のモデルの位置及び向きとして解釈される。例えば、データ１６８は、シャシ１６２の３次元表現（例えば、定義された直方体の角）と関連する所与の点のモデル空間の原点に対する変換－Ｔ_ＷＢ－として格納され得る。ここで、「Ｗ」は、モデル空間の「ワールド」を指し、「Ｂ」はシャシ１６２によって提供されるロボットデバイスの基部を指す。また、図１Ｄでは、ロボットデバイス１６０の状態は、モデル空間に対する画像キャプチャデバイス１６６のポーズを示すデータ１７０も含む。この場合、画像キャプチャデバイス１６６のポーズは、画像キャプチャデバイス１６６の位置及び向きとして解釈される。データ１６８と同様に、データ１７０は、画像キャプチャデバイス１６６の３次元表現と関連する所与の点のモデル空間の原点に対する変換－Ｔ_ＷＣ－として格納され得る。再び、「Ｗ」はモデル空間の「ワールド」を指し、「Ｃ」はキャプチャデバイスを指す。画像キャプチャデバイス１６６のポーズは、モデル空間に対する画像キャプチャデバイスの座標系の位置として表し得る。

【0039】

図１Ｅは、ロボットデバイス１８０の第２の例を示す。ロボットデバイス１８０は、本体１８２、及びこの場合、４本の脚１８４を有する脚型ロボットとして構築されている。各脚は、一連のアクチュエータで動き得る。ロボットデバイス１８０の頭部１８６は、頭部１８６に取り付けられた複数の画像キャプチャデバイスの可動マウントとして機能するネック１８５を介して本体１８２に機械的に結合されている。図１Ｆは、本体１８２のポーズを定義するデータ１６８、及び頭部１８６に取り付けられた複数の画像キャプチャデバイスのポーズをそれぞれ定義するデータ１７０Ａ、１７０Ｂを示す。この場合、ネック１８５は可動であってよく、頭部１８６はネック１８５の上で回転可能であってよい。特定の構成では、画像キャプチャデバイスは、頭部１８６上でさらに可動であってよい。

【0040】

図１Ｇは、ロボットデバイス１９０の第３の例を示す。ロボットデバイス１９０は、航空機（例えば、「ドローン」）を含む。ロボットデバイス１９０は、シャシ１９２及び４つのアクチュエータ１９４を含む。４つのアクチュエータは、大気空間内でロボットデバイス１９０を推進するためにロータブレードを含み得る。また、ロボットデバイス１９０は、画像キャプチャデバイス１９６を支持するジンバルの形をとる可動マウント１９５も含む。可動マウント１９５によって、画像キャプチャデバイス１９６はシャシ１９２とは関係なく移動することが可能である。図１Ｈは、シャシ１６８のポーズを定義するデータ１６８、及び画像キャプチャデバイス１９６のポーズを定義するデータ１７０を示す。

【0041】

図１Ｃ、図１Ｅ、及び図１Ｇは、ロボットデバイスがとり得る形のいくつかの非限定的な例を示す。図１Ｄ、図１Ｆ、及び図１Ｈは、様々なロボットデバイスの状態がどのように表されるのか、つまりロボットデバイスのポーズを表すデータ１６８、及び可動マウントを使用し、ロボットデバイスに機械的に結合された少なくとも１つの画像キャプチャデバイスのポーズを表すデータ１７０を示す。本例では、ロボットデバイス及び可動マウントは多数の形をとり得る。可動マウントは、ロボットデバイスに対する移動を可能にするために１つ以上のアクチュエータを含み得る。また、ロボットデバイスは、周囲環境に対する移動を可能にするために１つ以上のアクチュエータも有する場合もある。アクチュエータのセットは、移動を提供するために異なる機構を結合する変形可能なポリマー及び／またはシステムを含むいわゆる「ソフト」アクチュエータを含む、１つ以上の機械的、電気的、油圧、空気圧、ポリマー、熱的、及び／または磁気的な機構を含み得る。

【0042】

図２Ａ、図２Ｂ、及び図２Ｃは、異なる画像キャプチャデバイス構成の３つの包括的ではない例を概略で示す。これらの構成は、ロボットデバイスに移動できるように取り付けられた１つ以上の画像キャプチャデバイスに適用し得る。図２Ａの例２００では、画像キャプチャデバイス２１０は、画像データ２２０を生成するように構成される。画像キャプチャデバイス２１０がデジタルカメラである場合、これは直接的に実行され得、例えば、画像データ２２０が電荷結合素子または相補型金属酸化物半導体（ＣＭＯＳ）センサからの処理データを含み得る。画像データ２２０を、例えばアナログ信号源を変換するなど、他の画像ソースを処理することによって間接的に生成することも可能である。

【0043】

１つの場合では、画像データ２２０は、経時的にキャプチャされた画像データを含む。このフォーマットの一例２３０は、図２Ｂに示される。この場合、画像データ２２０は複数のフレーム２４０を含む。各フレーム２４０は、図１の環境１１０などの環境の画像がキャプチャされる期間のある特定のときｔに関する場合がある（つまり、Ｆ_ｔ）。したがって、画像データ２２０はビデオデータと見なされ得、画像キャプチャデバイス２１０はビデオカメラであると見なされ得る。フレーム２４０は、一般的に、測定されたデータの２次元表現から成る。例えば、フレーム２４０は、時間ｔで記録されたピクセル値の２次元配列または２次元マトリクスを含み得る。図２Ｂの例では、画像データ内のすべてのフレーム２４０は同じサイズであるが、これはすべての例でそうである必要はない。フレーム２３０内のピクセル値は、環境の３次元空間の特定の部分の測定値を表す。図２Ｂの例では、各フレーム２４０は、２つの異なる形の画像データの値を含む。値の第１のセットは、深度データ２５０（例えば、Ｄ_ｔ）に関する。深度データは、キャプチャデバイスからの距離の表示を含み得、例えば、各ピクセル値または各画素値は画像キャプチャデバイス２１０からの３次元空間の一部分の距離を表し得る。値の第２のセットは、測光データ２６０（例えば、色データＣ_ｔ）に関する。これらの値は、所与の解像度の赤、緑、青のピクセル値を含み得る。他の例では、他の色空間が使用され得る、及び／または測光データ２６０はモノピクセル値またはグレイスケールピクセル値を含み得る。１つの場合では、画像データは、圧縮ビデオストリームまたはファイルを含み得る。この場合、画像データのフレームは、例えばビデオデコーダの出力など、ストリームまたはファイルから再構築され得る。画像データは、ビデオストリームまたはファイルの前処理に続いて、記憶場所から取り出され得る。

【0044】

図２Ｂの画像キャプチャデバイス２１０は、ＲＧＢデータ２６０と深度（「Ｄ」）データ２５０の両方をキャプチャするように配置されたいわゆるＲＧＢ－Ｄカメラを含み得る。１つの場合では、ＲＧＢ－Ｄカメラは、経時的にビデオデータをキャプチャするように配置される。深度データ２５０及びＲＧＢデータの１つ以上は、どんなときにも使用され得る。深度データ２５０は、赤外線レーザープロジェクタが、次に白黒ＣＭＯＳ画像センサによって撮像される３次元空間の観測された部分の上に赤外光のパターンを投影する構造化光方式など、技術で既知の１つ以上の技術によって生成され得る。

【0045】

１つの場合では、画像キャプチャデバイス２１０は、結合されたデータストレージデバイスに画像データ２２０を格納するように配置され得る。データストレージデバイスは、画像キャプチャデバイス２１０、画像キャプチャデバイス２１０をロボットデバイスに結合する可動マウント、及びロボットデバイスの１つ以上内に位置する場合がある。別の場合、画像キャプチャデバイス２１０は、結合されたコンピューティングデバイスに画像データ２２０を送信し得る。コンピューティングデバイスは、画像キャプチャデバイス２１０とロボットデバイスの両方共から遠隔であってよい。他の場合、コンピューティングデバイスは、ロボットデバイスの組み込み型コンピューティングデバイスを含み得る。結合されたコンピューティングデバイスは、例えばユニバーサルシリアルバス（ＵＳＢ）接続を介して直接的に結合される場合もあれば、間接的に結合される場合もあり、例えば、画像データ２２０は１つ以上のコンピュータネットワークを介して送信され得る。さらに別の場合、画像キャプチャデバイス２１０は、ネットワークアタッチドストレージデバイスでの格納のために１つ以上のコンピュータネットワーク全体で画像データ２２０を送信するように構成され得る。画像データ２２０は、フレーム単位で、または例えば複数のフレームを互いにバンドルし得るなど、バッチ単位で格納及び／または送信され得る。深度データ２４０は、測光データ２５０と同じ解像度またはフレームレートである必要はない。例えば、深度データ２５０は、測光データ２６０よりも低い解像度で測定され得る。また、１つ以上の前処理操作は、画像データ２２０が以下に説明する例で使用される前に、画像データ２２０に対して実行され得る。本明細書に説明しないさらなる構成も可能である。

【0046】

図２Ｃは、画像データ２２０を取得するための別の可能な構成２７０を示す。本例では、２つの画像キャプチャデバイス、つまり深度データ２８０のフレームを含む画像データ２２０－Ａをキャプチャするように配置された第１の画像キャプチャデバイス２１０－Ａ、及び測光データ２９０のフレームを含む画像データ２２０－Ｂをキャプチャするように配置された第２の画像キャプチャデバイス２１０－Ｂが使用される。これらのデータチャネルは、任意のコンピューティングデバイスで別々に処理される場合もあれば、共通の画像処理パイプラインにマージされる場合もある。例えば、図２Ｃの構成２７０は、図１Ｅの構成に適用し得る。１つの場合では、第１の画像キャプチャデバイス２１０－Ａは、３次元空間（内の深度の）を測定し、その測定値を測定データのフレームに変換するように配置された赤外線デバイス、超音波デバイス、及び／またはレーダーデバイスであってよい。第２の画像キャプチャデバイス２１０－Ｂは、次にカラー画像データ２９０のフレームをキャプチャするように配置されたＲＧＢカメラを含み得る。深度データ２８０及び測光データ２９０のフレームサイズ及び／または解像度は、キャプチャのフレームレートがそうであるように異なる場合がある。１つの場合では、２つのフレームセットが１つの共通したサイズ及び解像度を有するように、前処理が適用され得る。この場合、図２Ｃのデータは、それが図２Ｂに示す形となるように前処理され得る。

【0047】

特定の例では、画像キャプチャデバイスは、例えばロボットデバイスなどのロボットデバイスの中に組み込まれ得、可動マウント及び画像キャプチャデバイスは単一のユニットを含み得る。他の例では、画像キャプチャデバイスは、ロボットデバイスに結合可能な分割可能なデバイスであってよい。特定の例では、可動マウントはロボットデバイスに内蔵され得る。他の例では、可動マウントは、ロボットデバイスに取り外し可能に結合され得る。特定の場合、ロボットデバイス、可動マウント、及び画像キャプチャデバイスの２つ以上は、様々な異なるデバイスに結合され得る別個のモジュール式コンポーネントであってよい。

【0048】

図２Ａ、図２Ｂ、及び図２Ｃはいくつかの例として提供されており、理解されるように、図に示す構成と異なる構成は、以下に説明する方法及びシステムで使用するための画像データ２２０を生成するために使用され得る。画像データ２２０は、画像キャプチャデバイスを用いてキャプチャまたは記録された環境のビューを表す２次元形式で配置された任意の測定された感覚入力をさらに含み得る。例えば、これは、とりわけ深度データまたは測光データ、電磁波イメージング、超音波イメージング、及びレーダー出力のうちの１つだけを含み得る。これらの場合、特定の形式のデータと関連する撮像デバイスだけが必要とされ得る。例えば、１つの場合では、画像キャプチャデバイスは、深度データのない単眼のＲＧＢデバイスを含み得る。同様に、特定の場合、画像データは、深度データしか含まない場合があり、例えば２６０と２９０などの測光データは省略され得る。

【0049】

特定の場合、画像キャプチャデバイスは深度データを生成するために前処理を実行するように配置され得る。例えば、ハードウェア検知デバイスは、相違データまたは複数の立体画像の形をとるデータを生成し得、このデータを処理して深度情報を計算するために、ソフトウェア及びハードウェアの１つ以上が使用される。他の場合、単眼のＲＧＢカメラからの画像データは、深度データを生成するために再構築システムによって処理され得る。同様に、深度データは、深度情報を再構築するために使用され得る位相画像を出力するフライトカメラの時間から生じ得る。深度データを利用する例では、任意の適切な技術は、画像データ２２０の一部を形成する深度データを生成するために使用され得る。

【0050】

図２Ａの画像データ及び図２Ｂと図２Ｃの測光データＣ_ｔはカラー画像を含み得、ｘ_Ｒ１掛けるｙ_Ｒ１の解像度を有するフレームの各［ｘ、ｙ］ピクセル値は、ＲＧＢベクトル［Ｒ、Ｇ、Ｂ］を含む。例として、解像度は６４０掛ける４８０ピクセルであってよい。図２Ｂ及び図２Ｃの深度データＤ_ｔは、深度値の２次元マトリクスを含み得る。これは、例えばｘ_Ｒ２掛けるｙ_Ｒ２の解像度を有するフレーム内の各［ｘ、ｙ］ピクセル値が、３次元空間の表面のキャプチャデバイスからの距離を表す深度値ｄを含むグレイスケール画像として表し得る。

【0051】

特定の場合、画像データ２２０は、例えば特定の３次元空間を観測している複数のカメラなど、複数のデータソースを結合することによって生成され得る。特定の場合、画像データ２２０はビデオデータである必要はない。代わりに、画像データ２２０は１つ以上のキャプチャデバイスを使用し、経時的に異なる場所からキャプチャした一連の静止画像を含み得る。特定の場合、深度データは、例えば空間の周りでのキャプチャデバイスの動きを表す測光データを処理することからなど、測光データから生成される。

【0052】

上述の図は、図３Ａ～図８の例と併せて使用し得るロボットデバイス及び画像キャプチャデバイスの例を提示する。

【0053】

図３Ａは、一例によるロボットデバイス３１０のコンポーネントを示す。ロボットデバイス３１０は、図１Ａ～図１Ｈのロボットデバイス１２０、１６０、１８０、及び１９０の１つなどのデバイスであってよい。ロボットデバイス３１０のコンポーネントは、図の中で統合されたコンポーネントとして示されているが、コンポーネントは別々に実装し得、例えば図２Ａ～図２Ｃの画像キャプチャデバイス２１０に関して上述したように、ロボットデバイス３１０に通信可能に結合し得る。

【0054】

図３Ａで、ロボットデバイス３１０は、画像キャプチャデバイス３２０、１つ以上のアクチュエータ３３０のセット、状態エンジン３４０、及びマッピングエンジン３５０を含む。画像キャプチャデバイス３２０は、図１Ａ～図１Ｈに示す画像キャプチャデバイス１２０、１６６、１８６、及び１９６の１つ、図２Ａ～図２Ｃに示す画像キャプチャデバイス２１０の１つ、または別のキャプチャデバイスであってよい。画像キャプチャデバイス３２０は、画像データをキャプチャするように構成される。アクチュエータ３３０のセットは、アクチュエータ１６４、１８４、及び１９４などのアクチュエータ、及び／または図１Ｃ～図１Ｈの可動マウント１６５、１８５、及び１９５で見られるアクチュエータを含み得る。アクチュエータ３３０は、環境に対してロボットデバイス及び画像キャプチャデバイスの１つ以上を移動させるように構成される。例えば、アクチュエータ３３０は、ロボットデバイスの基部またはシャシを環境内で移動させる、及び／または基部またはシャシに対して画像キャプチャデバイス３２０を移動させるように構成され得る。

【0055】

状態エンジン３４０及びマッピングエンジン３５０は、ロボットデバイス３１０用の処理デバイスを含む。状態エンジン３４０及びマッピングエンジン３５０は、専用の処理電子回路を含み得る、及び／または少なくとも１つのコンピューティングデバイスのプロセッサによって実行されるコンピュータプログラムコードによって実装され得る。状態エンジン３４０及びマッピングエンジン３５０の１つ以上は、１つ以上の組み込み型コンピューティングデバイスによって実装され得、例えば、別々の組み込み型コンピューティングデバイスまたは単一の共通の組み込み型コンピューティングデバイスを含み得る。各コンピューティングデバイスは、コンピュータ可読媒体にロードされたコンピュータプログラムコードを実行するためにメモリと関連して少なくとも１つのプロセッサを含み得る。この媒体は、消去可能プログラマブル読み取り専用メモリなどのソリッドステートストレージを含み得、コンピュータプログラムコードはファームウェアを含み得る。他の場合、状態エンジン３４０及びマッピングエンジン３５０の１つ以上は、適切に構成されたシステムオンチップ、特定用途向け集積回路、及び／または１つ以上の適切にプログラムされたフィールドプログラマブルゲートアレイを含み得る。特定の場合、状態エンジン３４０及びマッピングエンジン３５０の１つ以上は、コンピュータプログラムコードを実行する１つ以上の図形処理ユニットによって実装され得るだけではなく、上記の事例の代わりに実装され得る。特定の場合、状態エンジン３４０及びマッピングエンジン３５０の１つ以上は、例えば、複数のプロセッサ及び／または図形処理ユニットのコアになど、並行して実装される１つ以上の機能によって実装され得る。

【0056】

状態エンジン３４０は、ロボットデバイス３６０の状態を決定するように構成される。ロボットデバイス３６０の状態は、ロボットデバイス３１０のメモリ及び／またはストレージデバイスに格納されたデータを含み得る。マッピングエンジン３５０は、ロボットデバイス３６０の状態を使用し、環境３７０の３次元モデルを生成するように構成される。

【0057】

マッピングエンジン３５０によって生成された３次元モデル３７０は、画像データ内で表される環境の３次元空間内の位置または場所を表す位置要素を有する任意のモデルまたはマップを含み得る。また、３次元モデル３７０は、ロボットデバイス３１０のメモリ及び／またはストレージデバイスに格納されたデータも含み得る。特定の場合、３次元モデル３７０は、３次元空間の「高密度」モデルである。この場合、例えば数十万または数百万の要素など、モデルを形成する多数の位置要素がある。これは、特徴ベースのモデル、または数十または数百の定義されたモデル点しかない場合がある「スパース」モデルに比較され得る。１つの場合では、位置要素は、空間を有する表面が、３次元の特定の解像度のボクセル空間内のボクセル値に関して定義される、空間のボクセルモデルに基づいてよい。別の場合、面素（「ｓｕｒｆｅｌ」）モデルが使用されてよい。面素モデルは、図６Ａ及び図６Ｂに関してより詳細に説明される。面素モデルでは、特定の位置に配向されたいくつかの表面は位置要素として定義される。３次元モデル３７０の範囲は、画像キャプチャデバイス３２０によって観測された環境の範囲に依存し得る。

【0058】

図３Ａの例では、ロボットデバイス３６０の状態は、３次元モデル３７０に対する画像キャプチャデバイス３２０の少なくとも１つの変換を含む。例えば、３次元モデル３７０は、（本明細書では「Ｗ」で表す）「ワールドフレーム」を表し得、ロボットデバイス３６０の状態は、ワールドフレームの（本明細書では「Ｃ」で表す）画像キャプチャデバイス３２０のポーズ、及びワールドフレームのロボットデバイス３１０（例えば、基部、本体、メインシャシ、またはロボットデバイスの他の基準点－本明細書では「Ｂ」で表す）のポーズを含み得る。特定の場合、ワールドフレームの画像キャプチャデバイス３２０のポーズは、移動Ｗ^ｒＷＣを表すデータ、及び向きｑ_ＷＣを表すデータとして格納され得る。同様に、ワールドフレームのロボットデバイス３１０のポーズは、移動Ｗ^ｒＷＢを表すデータ、及び向きｑ_ＷＢを表すデータとして格納され得る。この場合、ロボットデバイス３６０の状態は、１２次元多様体に定義された点として存在する。

【0059】

図３Ａの例では、状態エンジン３４０は、ロボットデバイス３１０が環境を探索するにつれ、ロボットデバイス３６０の状態を決定するように構成される。例えば、経時的に、画像キャプチャデバイス３２０及びロボットデバイス３１０の少なくとも１つの位置及び向きは、空間内で変化する場合がある。変化は、１つ以上のアクチュエータ３３０を使用するアクティブな動き、及び／または環境内の画像キャプチャデバイス３２０及びロボットデバイス３１０のノイズが多い摂動に起因する（例えば、滑り、風、機械的反発力、凹凸した表面などに起因する）場合がある。したがって、これらの変化を反映するために、ロボットデバイス３６０の状態を更新する必要がある。本例では、状態エンジン３４０は、ロボットデバイスの状態の変化と、１つ以上のアクチュエータ３３０から取得された測定値との比較に基づいて、ロボットデバイス３６０の状態を更新するように構成される。特定の場合、ロボットデバイスの状態の変化は、連続する画像が画像キャプチャデバイス３２０によってキャプチャされる２回の間で決定される。画像キャプチャデバイス３２０がビデオカメラを含む場合、次に状態エンジン３４０は、フレーム単位でロボットデバイス３６０の状態を更新し得る。特定の場合、状態エンジン３４０は、例えばｎ番目のフレームごとに、キャプチャしたフレームの選択されたサブセットに対して状態更新を実行するように構成され得る。後続の例に関してより詳細に説明するように、特定の場合、ロボットデバイス３６０は、ロボットデバイスの現在の状態と以前の状態を含み得る。これらの場合、状態エンジン３４０は、現在の状態と以前の状態の構成要素をともに最適化するように構成され得る。例えば、これは、新しい更新された状態を計算すること、及び次の更新のために以前の状態として既存の現在の状態を格納することを含み得る。

【0060】

図３Ａの状態エンジン３４０及びマッピングエンジン３５０は、協力するように構成される。図３Ａの例で、マッピングエンジン３５０は、ロボットデバイス３６０の状態に基づいて画像キャプチャデバイス３２０からの画像を３次元モデル３７０の投影と比較し、この比較の結果を使用して３次元モデル３７０を更新するように構成される。投影は、画像キャプチャデバイス３２０の現在のポーズからのモデルの２次元ビューを表す合成画像の生成を含み得る。投影は、完全な画像のために、またはピクセル単位で実行され得る。例えば、合成画像のピクセル値は、３次元モデル３７０をカメラ平面上に投影することによって計算され得、カメラ平面の位置及び向きは、ロボットデバイス３６０の状態として表す画像キャプチャデバイス３２０の現在のポーズによって決定される。

【0061】

１つの場合では、画像キャプチャデバイス３２０からの画像データ内のピクセル値が処理され、３次元空間のモデリングに寄与するので、３次元モデル３７０は、「高密度」と見なし得る。例えば、「高密度」表現では、画像内のあらゆるピクセルは、可能な限り多くの情報を追跡及びマッピング推定手順に提供し得る。これによって、３次元モデル３７０、つまりシーンのマップの結果として生じる表現を合成キャプチャデバイスまたはカメラに投影し直して、「高密度」画像、つまり、合成された画像内のピクセルの大多数がモデルと格納された情報に基づいて合成されたデータを有する、画像キャプチャデバイス３２０の解像度での画像を再構築することが可能になる。この投影は、画像キャプチャデバイス３２０の少なくともポーズを表す、ロボットデバイス３６０の状態を使用し、実行され得る。対照的に、例えばキーポイントまたは抽出された特徴を利用するシステムなど、「スパース」システムは、モデルを生成するために画像データのピクセル値の小さいサブセットのみを使用する。「スパース」の場合、モデル内に十分な情報がないので、合成された画像はキャプチャデバイス解像度で作成することができない。このようにして、「高密度」システムは、例えば現実環境の所与の公差内など、高い精度で３次元空間内の１つ以上の表面を推定するために機能する。「スパース」システムが離散点の小さいセットに対して作用するのに対し、「高密度」システムは量子化された連続システムに類似すると見なし得る。

【0062】

図３Ｂは、図３Ａの例の変形形態であるロボットデバイス３８０を示す。この変形形態では、図３Ａの１つ以上のアクチュエータ３３０は、アクチュエータの２つの別々のセットを含む。ロボットアクチュエータ３３２の第１のセットは、環境に対してロボットデバイス３８０を移動させるために提供される。例えば、これらは、図１Ｃ～図１Ｈに示すように、車輪、脚部、または回転子のセットを含み得る。また、キャプチャデバイスアクチュエータ３３４の第２のセットは、次にロボットデバイス３８０に対して画像キャプチャデバイス３２０を移動させるために提供される。例えば、これらは、画像キャプチャデバイス３２０をロボットデバイス３８０に結合する可動マウントの用のアクチュエータのセットを含み得る。キャプチャデバイスアクチュエータ３３４は、複数の関節を有する可動マウントの１つ以上の関節を移動させるために使用される一連のモータを含み得る。特定の例では、ロボットアクチュエータ３３２は、ロボットデバイス３８０と環境との間で複数の自由度を提供し、キャプチャデバイスアクチュエータ３３４は、画像キャプチャデバイス３２０とロボットデバイス３８０との間で複数の自由度を提供する。

【0063】

また、図３Ｂのロボットデバイス３８０は、それが移動コントローラ３９０を含む点で図３Ａのロボットデバイス３１０とは異なる。移動コントローラ３９０は、環境内でのロボットデバイス３８０の移動を制御するために使用される、上述の追加の処理デバイスを含んでもよい。移動コントローラ３９０は、手動制御及び自律制御の１つ以上を可能にし得る。移動コントローラ３９０は、ロボットアクチュエータ３３２及びキャプチャデバイスアクチュエータ３３４に通信可能に結合される。移動コントローラ３９０は、このようにしてロボットデバイス３８０及び画像キャプチャデバイス３２０の移動を制御することができる。新しい環境を探索するとき、ロボットデバイス３８０は、ロボットデバイス３８０の移動及び画像キャプチャデバイス３２０の移動を含む探索戦略を実装し得る。例えば、検索及び救出の状況では、移動コントローラ３９０は、ロボットデバイス３８０を新しい場所に移動させるためにロボットアクチュエータ３３２を制御し得る。いったん新しい場所に入ると、移動コントローラ３９０は、ロボットデバイス３８０が静止しているときにキャプチャデバイスアクチュエータ３３４を制御して、その場所での環境の周りをパニングし得る。

【0064】

図３Ｂの例では、移動コントローラ３９０は、環境をナビゲートするために３次元モデル３７０を使用するように構成される。例えば、３次元モデル３７０は、環境内の物理的な境界及び障害物（例えば、図１Ａのオブジェクト１１５など）を示し得る。この場合、移動コントローラ３９０は、環境内でロボットデバイスを移動させながら、物理的な境界及び障害物を回避するための移動経路を決定し得る。別の場合、部屋または他の屋内場所の３次元モデル３７０は、ロボットデバイス３８０が部屋を出ることを可能にする退出点を示し得る。また、移動コントローラ３９０は、例えば低い高さの壁、物体、または通路などの物理的な境界及び障害物を回避するために、画像キャプチャデバイス３２０の場所を制御する必要がある場合もある。

【0065】

図３Ｂの例では、状態エンジン３４０は、ロボットデバイス３６０の状態を更新するために、画像キャプチャデバイス３２０及び３次元モデル３７０からの画像データを使用するようにさらに構成される。１つの場合では、状態エンジン３４０は、画像キャプチャデバイス３２０によってキャプチャされた画像の逆投影点と、３次元モデル３７０の対応する点との間の点対平面の誤差を最小限に抑えようと努めるようにロボットデバイス３６０の状態を更新するように構成される。この場合、逆投影は、ロボットデバイス３６０の状態によって示される画像キャプチャデバイス３２０の現在のポーズに基づく。この場合の画像データは深度データを含み得、状態の更新は、深度データと３次元モデル３７０との間の幾何学的誤差を最小限に抑えようと努め得る。

【0066】

特定の場合、マッピングエンジン３５０は、反復最接近点誤差を決定するように構成され得る。この場合、状態エンジン３４０は、ロボットデバイス３６０の状態を決定するために反復最接近点誤差をさらに使用するように構成されてもよい。

【0067】

特定の場合、画像キャプチャデバイス３２０は、例えば図２Ｂ及び図２Ｃに示すように、カラー画像データ及び深度マップを出力するように構成される。この場合、マッピングエンジン３５０は、３次元モデル３７０を更新するためにカラー画像データ及び深度マップを使用するように構成される。これは、図５及び図７の例に関して以下により詳細に説明される。特定の場合、状態エンジン３４０は、深度マップのみ使用し得る。状態エンジン３４０及びマッピングエンジン３５０は、図３Ａ及び図３Ｂの例で別個のコンポーネントとして説明されているが、特定の場合、それらの機能は、単一のコンポーネントに結合され得る、または全体としてシステムの機能を失うことなく、特定の機能を一方のコンポーネントから他方のコンポーネントに移動し得ることに留意されたい。

【0068】

１つの場合では、図３Ａ及び図３Ｂのロボットデバイス３１０、３８０は、１つ以上の機能を実行するように配置され得る。例えば、ロボットデバイスは、マッピング機能を実行し、（例えば、緊急時に）特定の人物及び／または物体の位置を突き止め、物体を移送し、清掃または保守を実行するなどのように配置され得る。１つ以上の機能を実行するために、ロボットデバイスは、さらなる知覚装置、真空システム、及び／またはアクチュエータなどの追加のコンポーネントを含んで環境とインタラクションし得る。

【0069】

図４Ａは、ロボットデバイスの例のマッピングシステム４００を示す。マッピングシステム４００は、図３Ａ及び図３Ｂではロボットデバイス３１０、３８０の一部として、または別の例のロボットデバイスの一部として使用され得る。マッピングシステム４００は、例えば、図３Ａ及び図３Ｂのアクチュエータ３３０及び３３２、または図１Ａ～図１Ｈのアクチュエータ１３５、１６４、１８４、及び１９４など、環境内でロボットデバイスを移動させるために１つ以上のアクチュエータを含むロボットデバイスと動作するように構成される。また、この場合のロボットデバイスは、画像キャプチャデバイス用の可動マウントも含む。可動マウントは、図１Ｃ、図１Ｅ、及び図１Ｇに示すマウント１６５、１８５、１９５、図３Ｂのキャプチャデバイスアクチュエータ３３４を含むマウント、またはロボットデバイスと画像キャプチャデバイスとの間で延びる別の可動機械結合の１つを含み得る。本例では、「可動マウント」は、対応するモータのセットによって移動できる１つ以上の関節を含み得る。したがって、特定の場合、可動マウントは、ロボットデバイスに対して移動でき、例えば、可動マウントは、ロボットデバイスの上に取り付けられ得るが、独立して移動できる。ロボットデバイス上で移動されるとき、可動マウントは、環境内で移動を達成し得る。可動マウントは、より複雑な多関節リンク機構だけではなく、単純な回転要素及び枢動要素を含む多種多様の可能な実施態様を有し得る。

【0070】

マッピングシステム４００は、エラーデータ４０５に作用する。本例のエラーデータ４０５は、運動誤差４１０、走行距離計誤差４２０、及び幾何学的誤差４３０を含む。エラーデータ４０５は、状態エンジン４４０によってアクセスされる。状態エンジン４４０は、図３Ａ及び図３Ｂから状態エンジン３４０の１つ、または別の処理デバイスを含み得る。状態エンジン４４０は、ロボットデバイスの状態データ４４５を更新するように構成される。本例では、状態データ４４５は、ロボットデバイス４５０の現在の状態を表すデータ、及びロボットデバイス４６０の以前の状態を表すデータに区分される。説明を簡単にするために、「現在の状態」と「以前の状態」に参照がなされ、これは、ロボットデバイスの少なくとも１つの構成を示すメモリまたはストレージデバイスに保持されるデータを指すと解釈されるべきである。状態エンジン４４０は、ロボットデバイス４５０の現在の状態、及びロボットデバイス４６０の以前の状態をともに最適化するように構成される。これによって、環境のモデルを更新するためにマッピングシステム４００によって使用され得る、ロボットデバイス４５０の更新された現在の状態を含む更新状態データ４４５が生じる。例えば、ロボットデバイス４５０の更新された現在の状態は、図３Ａ及び図３Ｂのマッピングエンジン３５０に類似したコンポーネントによって使用されてモデル３７０に類似した３次元モデルを更新し得る。

【0071】

本例では、ロボットデバイス４５０の現在の状態とロボットデバイス４６０の以前の状態の各々は２つのデータコンポーネントを含む。これは、ロボットデバイス４６２の一般的な状態に関して図４Ｂに示されている。図４Ｂで、ロボットデバイス４６２の一般的な状態は、環境４６４のモデルに対するロボットデバイスのポーズを示すデータ、及びモデル４６６に対する画像キャプチャデバイスのポーズを示すデータを含む。図４Ｂで、これらのポーズは、図１Ａ～図１Ｈに関して上述した２つの変換Ｔ_ＷＢとＴ_ＷＣとして表されている。ポーズはいくつかの異なる方法で格納され得、例えば、ポーズは、別々に格納され得る移動及び回転の態様に分解され得る。

【0072】

運動誤差４１０は、ロボットデバイスの可動マウントと関連する運動測定値、及びロボットデバイス４５０の現在の状態から導出されるロボットデバイスに対する画像キャプチャデバイスのポーズの関数を含む。例えば、運動測定値は、可動マウントを制御するロボットデバイスの１つ以上のアクチュエータから直接的にまたは間接的に取得される１つ以上の測定値を含み得る。

【0073】

走行距離計誤差４２０は、１つ以上のアクチュエータと関連する走行距離計測法の測定値、及び現在の状態と以前の状態との間の走行距離計差の関数を含む。この場合の１つ以上のアクチュエータは、図３Ｂのロボットアクチュエータ３３２または図１Ｃ、図１Ｅ、及び図１Ｇのアクチュエータ１６４、１８４、及び１９４などのアクチュエータ、つまり、環境内でロボットデバイスを移動させるアクチュエータを含み得る。走行距離計測定値は、これらのアクチュエータから直接的にまたは間接的に取得される１つ以上の測定値を含み得る。運動誤差４１０が可動マウントによって達成される画像キャプチャデバイスの移動に関するのに対し、走行距離計誤差４２０は、環境内でのロボットデバイスの移動に関する。

【0074】

幾何学的誤差４３０は、画像キャプチャデバイス及び環境のモデルからの画像データの比較を含み、比較は、ロボットデバイス４５０の現在の状態に基づいた投影を使用する。例えば、画像データはモデルの上に逆投影される場合もあれば、モデルが画像データのための平面上に投影される場合もある。逆投影は、例えばＴ_ＷＣなど、ロボットデバイスの現在の状態からのモデルに対する画像キャプチャデバイスのポーズを使用し得、投影は、ポーズの計算された逆数を使用し得る。どちらの手法も適用してもよい。幾何学的誤差４３０は、画像データの提供されたフレームのための深度データと、環境のモデルとの比較に基づいてよい。幾何学的誤差４３０は、例えば、図２Ｂ及び図２Ｃの深度データ２５０または２８０などの深度データからの複数の深度測定値など、画像データからの複数のピクセルについて計算され得る。複数のピクセルは、画像データのサブセット、または画像データの全ピクセルを含み得る。１つの場合では、幾何学的誤差４３０は、点対平面の反復最接近点誤差（ＩＣＰ）関数に基づいて計算され得る。

【0075】

１つの場合では、状態エンジン４４０は、運動誤差４１０、走行距離計誤差４２０、及び幾何学的誤差４３０を含むコスト関数を最適化する。例えば、状態エンジン４４０は、コスト関数を最小限に抑える以前の状態と現在の状態の値を決定し得、誤差４１０、４２０、及び４３０の各々は、現在の状態と以前の状態の１つ以上と関連する変数を有する関数として定義される。例えば、状態エンジン４４０は、少なくとも、現在の状態の変換Ｔ_ＷＢとＴ_ＷＣ及びコスト関数を最低限に抑える以前の状態の変換Ｔ_ＷＢの値を決定し得る。このようにして、モデルに対する画像キャプチャデバイスのポーズ、及びモデルに対するロボットデバイスのポーズは、幾何学的追跡、及びロボットデバイスと関連する運動データと走行距離計測法データによって制約されるとして決定され得る。運動誤差４１０は、ロボットデバイス４５０の現在の状態の中で表される２つの変換Ｔ_ＷＢ及びＴ_ＷＣの値を制約し得る。走行距離計誤差４２０は、ロボットデバイス４５０の現在の状態、及びロボットデバイス４６０の以前の状態の中で変換Ｔ_ＷＢの値を制約し得る。幾何学的誤差４３０は、ロボットデバイス４５０の現在の状態の中で変換Ｔ_ＷＣの値を制約し得る。

【0076】

運動誤差４１０を決定するために使用される運動測定値は、図３Ｂに示すキャプチャデバイスアクチュエータ３３４などのマウントアクチュエータ、つまり可動マウントを移動させるために使用されるアクチュエータから取得され得る。運動測定値は、例えば、ロボットデバイスのシステムバスを介して通信されるデータパケットまたは信号としてマウントアクチュエータから直接的に受信され得る、及び／または間接的に受信され得、例えば、状態エンジン４４０は、運動測定値を取り出すためにロボットデバイスのメモリまたはレジスタにアクセスし得る。１つの場合では、運動測定値は、可動マウントの観測を介して測定され得、例えば、ロボットデバイスを特徴付ける画像データから決定され得る。別の場合、運動測定値は、アクチュエータからフィードバックを受け取るように配置される、図３の移動コントローラ３９０など、アクチュエータのコントローラから取得され得る。

【0077】

運動測定値は、ロボットデバイスに対する画像キャプチャデバイスのポーズの変換の測定値、例えば

【数1】

を含み得る。可動マウントが、各関節が１つ以上のモータを使用し、移動される複数の関節を含む場合、運動測定値は、順運動学を使用し、決定され得る。順運動学は、例えば、可動マウントの最後の点などのエンドエフェクタの位置を、関節パラメータの指定された値に基づいて決定することを可能にするロボットデバイスと関連する運動方程式を使用することを指す。この場合、指定された値は、関節と関連するモータ位置の測定値から導出し得る。この場合、可動マウントは、２つのリンクが関節と接合されるリンクの連続チェーンとして定義され得る。第１の剛体変換は、関節で可能である相対的な移動を特徴付けるために各関節に定義され、第２の剛体変換は各関節の寸法を定義し得る。変換は、可動マウント及び／またはロボットデバイスの形に依存する。ロボットデバイスの基部からエンドエフェクタへの可動マウントの移動をモデル化する第１の剛体変換及び第２の剛体変換のシーケンスが定義され得、画像キャプチャデバイスはエンドエフェクタに取り付けられる。状態エンジン４４０は、「未処理の」関節測定値を受け取り、剛体変換のシーケンスを評価することによってロボットデバイスに対する画像キャプチャデバイスのポーズ

【数2】

を計算する場合もあれば、例えば、可動マウント及びロボットデバイスの１つ内に位置する可動マウントと関連するマイクロコントローラなど、外部コンポーネントからポーズを受け取る場合もある。

【0078】

特定の場合、その状態エンジン４４０は、運動測定値及び走行距離計測定値を使用してロボットデバイスの状態を初期化する。ロボットデバイス４６０の以前の状態の値の第１のセットは、０値のセットまたは所定の開始構成（例えば、既知の開始位置及び向き）であってよい。ロボットデバイス４５０の現在の状態の値の第１のセットは、次に初期化した以前の状態及び初期の運動測定値及び初期の走行距離計測定値（例えば、ビデオデータのフレームの開始位置と受け取りとの間で測定される）に基づいて決定され得る。例えば、ロボットデバイスは、任意の本体のポーズ及び順運動学の決定に基づいて決定された画像キャプチャデバイスのポーズで初期化され得る。

【0079】

１つの場合では、運動誤差４１０は、ロボットデバイスに対する画像キャプチャデバイスの位置を示す測定された移動と、ロボットデバイス４５０の現在の状態に基づいた移動との間の差を含む。また、運動誤差４１０は、ロボットデバイスに対する画像キャプチャデバイスの測定された向きと、ロボットデバイス４５０の現在の状態に基づいた移動との間の差も含み得る。ロボットデバイスに対する画像キャプチャデバイスのポーズは、

【数3】

として計算され得る。１つの場合では、運動誤差４１０は、以下のように決定され、

【数4】

上式で、

【数5】

は、ロボットデバイスに対する画像キャプチャデバイスの測定された移動であり、_Ｂｒ_ＢＣは、ロボットデバイスの状態で表されるロボットデバイスに対する画像キャプチャデバイスの移動であり、

【数6】

は、ロボットデバイスに対する画像キャプチャデバイスの測定された向きであり、ｑ_ＢＣは、ロボットデバイスの状態で表されるロボットデバイスに対する画像キャプチャデバイスの向きである。ロボットデバイスの状態を最適化することは、

【数7】

の提供された値を使用し、_Ｂｒ_ＢＣとｑ_ＢＣの値を決定することを含み得る。

【0080】

１つの場合では、走行距離計誤差４２０は、運動誤差と同様に決定され得る。走行距離計誤差４２０は、ロボットデバイスの現在の状態と以前の状態の両方を含む誤差である場合がある。例えば、走行距離計誤差は、２つの状態の時間の間のロボットデバイスのポーズの測定された変化と、現在の状態と以前の状態との間のロボットデバイスのポーズの変化との間の誤差を考慮する場合がある。例えば、ポーズの変化は、変換

【数8】

によって表され得、上式で、０は以前の状態を示し、１は現在の状態を示す。上記の例に従うと、１つの場合では、走行距離計誤差４２０は、以下のように決定され、

【数9】

上式で、

【数10】

は、ロボットデバイスの位置の測定された変化であり、_Ｂ０ｒ_Ｂ０Ｂ１は、ロボットデバイスの現在の状態と以前の状態によって表されるロボットデバイスの位置の変化であり、

【数11】

は、ロボットデバイスの向きの測定された変化であり、ｑ_Ｂ０Ｂ１は、ロボットデバイスの現在の状態と以前の状態によって表されるロボットデバイスの向きの変化である。ロボットデバイスの状態を最適化することは、

【数12】

の提供された値を使用し、_Ｂ０ｒ_Ｂ０Ｂ１とｑ_Ｂ０Ｂ１の値を決定することを含み得る。

【0081】

１つの場合では、幾何学的誤差４３０は、深度マップのｋ番目のピクセルについて、以下のように決定され、

【数13】

上式で、括弧に入れられた部分は、画像データから取得された逆投影点_ｃｖ_ｋ（ロボットデバイス４５０の現在の状態からモデルＴ_ＷＣに対する画像キャプチャデバイスのポーズを使用する投影）と、モデル_ｗｖ_ｋの対応する点の間の差異を表し、この差異はモデルに示される点の面法線_ｗｎ_ｋに沿って投影されている。

【0082】

１つの場合では、情報行列は、測定の不確実性をモデル化するために誤差項の各々のために構築される。例えば、運動誤差４１０及び／または走行距離計誤差４２０の情報行列は、以下として決定され得、

【数14】

上式で、σ_ｒは移動測定値の分散であり、σ_αは向き測定値の分散である。幾何学的誤差４３０の情報行列は、深度測定値と関連する逆共分散行列であってよい。

【0083】

状態エンジン４４０は、経時的にロボットデバイス４５０の現在の状態を維持するために反復して動作し得る。例えば、状態エンジン４４０は、画像キャプチャデバイスからのビデオデータの新しいフレームの到着に続いて起動され得る。状態エンジン４４０が、運動測定値及び走行距離計測定値に基づいて行われるロボットデバイス４５０の現在の状態の予測を精緻化するために動作するのが見られ得る。

【0084】

１つの場合では、状態エンジン４４０は、状態に対する局所摂動δｘとしてモデル化されるロボットデバイスの状態の変化を決定するように構成される。この局所摂動は、移動成分及び向き成分に分割され得る。この場合、状態エンジン４４０は、コスト関数を最小限に抑える最小の局所摂動を決定することによって上述のコスト関数を最適化し得る。最適化は、任意の既知の最適化手順を使用し、実行され得る。１つの場合では、ヤコビ行列及び残余のセットが、コスト関数の各項について計算される。各項のヤコビ行列及び残余は、コスト関数のヤコビ行列Ｊ及び残余のセットｂに結合され得る。１つの場合では、最適化は、以下のような最小二乗解を計算することによって実行され得る。

【数15】

【0085】

１つの場合では、ロボットデバイス４６０の以前の状態及びロボットデバイス４５０の現在の状態の各々に対する局所摂動が計算される。例えば、状態エンジン４４０の反復中の状態更新は、

【数16】

を決定することを含み得、０は、以前の状態を表し、１は現在の状態を表す。最適化は、正規方程式の２４ｘ２４システムから成る場合がある。これは、１つ以上のプロセッサを使用して解き得る。１つの場合では、３レベル粗密ピラミッドを有するガウス－ニュートン反復法を使用し、これを解き得る。特定の場合、１つ以上のプロセッサは、１つ以上の図形処理ユニットの一部を形成し得る。これらの図形処理ユニットは、ロボットデバイスの１つ以上の組み込みプロセッサに設けられ得る。

【0086】

特定の場合、図４Ａの状態エンジン４４０は、一次事前確率を使用し、現在の状態と以前の状態をともに最適化するように構成される。例えば、状態更新を決定するために状態エンジン４４０によって最適化されるコスト関数は、一次事前確率を表す追加の項を含む。一次事前確率は、運動誤差、走行距離計誤差、及び幾何学的誤差、及び／または後続の反復の準備が完了した以前の状態を周辺化することによって決定され得る。状態エンジン４４０は、上述したように状態最適化で使用されるヤコビ行列Ｈ＊及び残余ｂ＊のセットを計算するように構成され得る。１つの場合では、シューア補行列が、以下のように使用され得、

【数17】

上式で、Ｊ_ｉは、（例えば、０が以前の状態であり、１が現在の状態である）状態ｉのコスト関数のヤコビ行列であり、ｂｉは、（例えば、０が以前の状態であり、１が現在の状態である）状態ｉのコスト関数の残余のセットである。ヤコビ行列Ｈ＊及び残余のセットｂ＊は、例えば、ビデオデータの新しいフレームが受け取られるとき、次の最適化反復の一次事前確率として使用され得る。特定の場合、一次補正は、例えば、ｂ^＊’＝ｂ^＊＋Ｈ^＊Δｘなど、後続の更新の残余のセットのために実行され得、Δｘは、後続の線形化点と以前の線形化点の間の差異である。一次事前確率は、以下の形式を有する、

【数18】

つまり、モデル（「Ｗ」）に対するロボットデバイス（「Ｂ」）及び画像キャプチャデバイス（「Ｃ」）の移動及び向きの差異を示す項を有する、誤差項としてコスト関数に表されてよい。この誤差項は、最適化内で、及び／またはロボットデバイス及びループクロージャ補正の初期化の１つ以上のために使用され得る。最適化中、誤差項及び以前のヤコビ行列及び残余のセットを利用し得る。新しいヤコビ行列及び残余のセットは、各最適化手順の最後に取得され得、これらは、後続のフレームの最適化に使用され得る。

【0087】

特定の場合、可動マウントのエンドエフェクタに対するキャプチャデバイス固有の変換は、ビジュアルタグなどを使用し、較正し得る。例えば、カメラに固有の変換は、画像キャプチャデバイスの外来性（ｅｘｔｒｉｎｓｉｃｓ）及びモデルに対するビジュアルタグの相対的なポーズをともに最適化することによって検出された端点の再投影誤差を最小限に抑えることによって決定し得る。キャプチャデバイス固有の変換は、較正段階中に決定され、ロボットデバイスの動作にとって一定であると見なされ得る。

【0088】

図４Ａの例で、状態エンジン４４０は、ロボットデバイス４５０の現在の状態の少なくとも更新された値のセットを決定するように構成され得る。マッピングシステム４００は、次にロボットデバイス４５０の更新された現在の状態を使用し、環境のモデルを更新するように構成される。例えば、変換Ｔ_ＷＣで表すモデルに対する画像キャプチャデバイスのポーズは、画像キャプチャデバイスからの画像データを環境のモデルと融合するために使用され得る。モデルを更新するプロセスは、図５、図７、及び図８の例に関して以下により詳細に説明される。１つの場合では、状態エンジン４４０は、図３Ａ及び図３Ｂに示すマッピングエンジン３５０などのマッピングエンジン用の追跡モジュールとして使用され得る。

【0089】

特定の場合、マッピングシステム４００は、モデルの第１のセットの部分をモデルの第２のセットの部分とアラインさせるために変形グラフを使用するように構成される。これは、図７及び図８に関して以下により詳細に説明される。変形グラフは、アライメント中に所与の位置でモデルを修正するために使用されるモデルの所与の位置の近接点のセットを示す。このアライメントは、モデルに対して「ループクロージャ」を成立させる（ｅｎａｃｔ）ために実行され得る。マッピングシステム４００は、以下により詳細に説明するように「ループクロージャ」を検出し、実行するように構成され得る。「ループクロージャ」の場合、マッピングシステム４００は、画像キャプチャデバイスの新しいポーズ（例えば、Ｔ_ＷＣ’）を計算し得る。この場合、状態エンジン４４０は、図３Ａ及び図３Ｂのマッピングエンジン３５０などのマッピングエンジンから新しいポーズを受け取り得る。この新しいポーズは、例えばビデオデータの次のフレームの現在の状態を決定するとき、ロボットデバイス４６０の以前の状態をリセットするために使用し得る。以前の状態の画像キャプチャデバイスのポーズは、マッピングエンジンから受け取った新しいポーズに基づいて置換され得、ロボットデバイスのポーズは、例えば

【数19】

など、画像キャプチャデバイスの更新されたポーズを使用し、更新され得、Ｔ_ＢＣは、（例えば、新しいポーズが受け取られる前にロボットデバイスの状態を使用し、計算された）ロボットデバイスに対する画像キャプチャデバイスの計算されたポーズである。一次事前確率が使用される場合、それは、状態エンジン４４０の初期起動に類似した方法で初期化し得る。初期の本体ポーズ及び／または初期のカメラポーズは、一次事前確率を初期化するために測定され得る。

【0090】

図５は、環境のモデルを構築するために使用し得るマッピングエンジン５１０の例５００を示す。マッピングエンジン５１０は、ロボットデバイスの現在の状態が、環境のモデルを更新するためにどのように使用され得るのかをよりよく説明するために例として提示されているが、マッピングエンジンの異なる実施態様も、この状態を同様に使用し得ることに留意されたい。マッピングエンジン５１０は、画像データ５２０を取得するように構成される。これは、上記の図の画像キャプチャデバイス１２０、２１０、及び３２０など、画像キャプチャデバイスによってアクティブに生成される、または以前に生成された画像データであってよい。画像データ５２０は、例えば経時的に３次元空間のビューなど、キャプチャデバイスを使用し、環境の観測と関連付けられる。例えば、画像データ５２０は、所与の期間にわたってビデオデータを含み得、所与の期間にわたって、ロボットデバイスは環境内で移動する。マッピングエンジン５１０は、画像データ５２０を処理し、環境のモデル５３０を計算するように構成される。本例で、このモデルは、３次元空間の３次元モデルである。

【0091】

本例のマッピングエンジン５１０は、少なくとも１つのモデル区分器５４０及び位置合わせエンジン５５０を含む。モデル区分器５４０は、少なくとも１つのモデル特性に基づいて、３次元モデル５３０を少なくともアクティブ部分と非アクティブ部分にセグメント化するように構成される。位置合わせエンジン５５０は、経時的に３次元モデル５３０のアクティブ部分を３次元モデル５３０の非アクティブ部分とアラインさせるように構成される。マッピングエンジン５１０は、該モデルを経時的に更新するために３次元モデル５３０のアクティブ部分を使用するようにさらに構成される。つまり、非アクティブ部分は、モデルを更新するために使用されない。

【0092】

特定の場合、マッピングエンジン５１０は、フレーム単位で動作するように構成される。一実施態様では、マッピングエンジン５１０は、画像データの連続するフレームＦ_ｔをメモリにロードするように配置され得る。これらのフレームは、ロボットデバイスにとって内部のデータストレージに格納され得る、または外部データストレージから取得され得る。他の実施態様では、マッピングエンジン５１０は、ロボットデバイスにとって内部のメモリから画像データの１つ以上のフレームを取り出し得る。一実施態様では、内部メモリの一部分は、特定の時間ｔにフレームデータを保持し得、新しい画像データ５２０がキャプチャデバイスから受け取られると、上書きされ得る。

【0093】

マッピングエンジン５１０がフレーム単位で動作するように構成されるとき、マッピングエンジン５１０は、フレーム単位で３次元モデル５３０を更新するように構成され得る。これは、画像データ５２０の特定のフレームを３次元モデル５３０と「融合する」こと、つまり、画像データ５２０のフレームを使用して、３次元モデル５３０を修正及び更新することを含み得る。これは、画像データ５２０のフレームから導出され得る新しい位置要素を含むことを含み得る。３次元モデル５３０がどのように生成または更新され得るのかの特定の具体的な例は、以下により詳細に説明される。本明細書に説明する手法は、不完全である及び／またはノイズがある画像データのフレームに適用し得ることに留意されたい。３次元モデル５３０を更新することは、画像データの測光データ及び深度データのコンポーネントの１つ以上を使用し、実行され得る。１つの場合では、３次元モデル５３０を更新するために、深度データのみキャプチャし、使用し得る。

【0094】

１つの場合では、マッピングエンジン５１０は、例えば、図３Ａ及び図３Ｂの状態３６０または図４Ａ及び図４Ｂの状態４５０、４６２など、ロボットデバイスの現在の状態の中で表されるキャプチャデバイスのポーズを使用するように構成される。２つ以上のキャプチャデバイスが使用される場合、ロボットデバイスの状態は、各キャプチャデバイスのポーズを表すデータを含み得る。

【0095】

モデル区分器５４０は、モデルデータを修正することによって３次元モデル５３０をセグメント化するように構成され得る。例えば、１つの場合では、３次元モデル５３０の所与の位置要素は、それがモデルのアクティブ部分の一部を形成するのか、それともモデルの非アクティブ部分の一部を形成するのかを示す変数を有し得る。別の場合、モデル区分器５４０は、３次元モデル５３０を、該モデルに適用された関数としてセグメント化するように構成され得る。例えば、３次元モデル５３０は、モデル区分器５４０に入力され得、モデル区分器５４０は、３次元モデル５３０のアクティブ部分及び非アクティブ部分の１つ以上を出力するように構成され得る。どちらの手法を使用してもよい。

【0096】

３次元モデル５３０をセグメント化するためにモデル区分器５４０によって使用されるモデル特性は、３次元モデル５３０の確実性のレベルを示し得る。例えば、モデル区分器５４０は、時間及び距離の１つ以上に基づいて、３次元モデル５３０をセグメント化し得る。第１の場合、モデル特性は、３次元モデルの所与の位置のモデル生成の時間及びモデル更新の時間の1つを含み得る。この場合、非アクティブ部分は、現在の観測時間と、所定の量より多く異なる過去の観測時間を示し得る。例えば、モデル区分器５４０は、３次元モデル５３０を作り上げる位置要素ごとに時間データを処理して、３次元モデル５３０の位置要素のセットを、アクティブな要素を表す２つの互いの素なセットθ、及び非アクティブな要素を表すΨに分割するように配置されてよい。これを行うために、モデル区分器５４０は、各位置要素のタイムスタンプｔ_Pを処理し得（例えば、位置要素の時間は前回修正された）、その結果、（例えば、画像データＦ_ｔの特定の処理されたフレームに関係する）セグメント化の所与の時間ｔの間、各位置要素は、モデルＰ_ｃ（ｃは、３次元空間の座標である）内にあり、位置要素は、ｔ－ｔ_Ｐ＜δ_ｔの場合、集合θ（つまり、Ｐ_ｃ∈θ）内にあり、位置要素は、ｔ－ｔ_Ｐ≧δｔの場合、集合Ψ（つまり、Ｐ_ｃ∈Ψ）内にあり、δ_ｔは定めれた期間である。この形のセグメント化またはモデル要素分類は、期間δ_ｔの間、非アクティブと見なされていなかった位置要素に徐々にラベルを付ける。それは、時間ウィンドウの応用例と見なし得る。上述のように、マッピングエンジン５１０は、画像データの新しいフレームを３次元モデル５３０のアクティブ部分に融合するように構成され得、モデルの非アクティブ部分は、追跡及び／またはデータ融合に使用されない。この場合、位置合わせエンジン５５０によるアクティブ部分と非アクティブ部分のアライメントに続いて、アラインされた非アクティブ部分は、それらがいますぐアクティブ部分になるように修正され得る。例えば、非アクティブ部分のアライメント時、位置合わせエンジン５５０は、非アクティブ部分の各位置要素と関連する前回の修正の時間を更新し得る。これは、このアラインされた非アクティブ部分が、モデル区分器５４０による３次元モデル５３０の処理に続いて、いますぐアクティブになるという効果を有し得る。これによって、連続するフレーム対モデルの追跡及びモデル対モデルの追跡も可能になり、視点が不変のループクロージャが可能になる。

【0097】

１つの場合では、マッピングエンジン５１０は、モデルを更新する際に使用するための３次元モデル５３０のアクティブ部分からの投影に基づいてアクティブモデルフレームを計算するように構成される。例えば、そのような投影は、予測されたビューまたは３次元モデル５３０のアクティブ部分の観測を表す２次元の視点または仮想フレームを提供し得る。１つの場合では、アクティブモデルフレームは、（例えば、ビデオデータの所与のフレームの）所与の時間にロボットデバイスの現在の状態から取得されるモデルに対する画像キャプチャデバイスのポーズに基づいて生成され得る。１つの場合では、予測フレームは、画像データ５２０を作り上げる各データセットに計算され得る。例えば、図２Ｂ及び図２Ｃに示す画像データと同様の画像データを処理するとき、各アクティブモデルフレームは、深度データの予測フレーム

【数20】

及び特定の場合、測光データの予測フレーム

【数21】

を含み得る。これらは、画像データ５２０から記録またはキャプチャされた画像フレームＦ_ｔと同じ解像度であってよい。アクティブモデルフレームの使用は、以下に図５に関してより詳細に説明される。

【0098】

上述のように、マッピングエンジン５１０は、例えば記録した画像データ５２０の複数のフレームが処理されるとなど、経時的に３次元モデル５３０を生成するように配置され得る。１つの場合では、画像データ５２０は、例えばロボットデバイスの移動及びロボットデバイス上で可動マウントの移動の１つ以上を介して画像キャプチャデバイスが移動するにつれ、経時的に３次元空間の観測を表す。したがって、画像データ５２０のフレームがマッピングエンジン５１０によって処理されると、３次元モデル５３０はサイズが大きくなり、例えば３次元空間の異なる部分を表すより多くの位置要素を組み込む。さらに、位置合わせエンジン５５０は、経時的にモデルのアクティブ部分と非アクティブ部分のアライメントを実行するように構成される。これは、３次元空間の部分が再訪または再観測されると、つまりキャプチャデバイスの動きの「ループ」が閉じられると発生し得る。これは、画像データ５２０のより多くのフレームが処理されるにつれ、３次元モデル５３０の精度及び一貫性も高まることを意味する。

【0099】

マッピングエンジン５１０の出力は、観測された３次元空間の３次元モデル５３０を含むと見なし得る。このモデル５３０は、３次元に関して定義された少なくとも位置要素を含み得る。各位置要素は、３次元空間内の固体表面の存在を示すデータとさらに関連付けられ得る。例えば、ボクセルベースモデルでは、表面は、自由空間を表す変数のゼロ値または交差点として表し得る。面素モデルでは、位置要素は、３次元空間内の表面に定義され得、したがって各位置要素はモデル内の特定の面を示し得る。

【0100】

図６Ａは、例えば本明細書に説明する例で更新される環境のモデルの位置要素を格納するために使用し得るデータ構造６１０の概略表現を示す。データ構造６１０は、例のためだけに示され、限定的と見なされるべきではない。データを格納するための他の手法及びデータは、実施態様に応じて使用され得る。本例では、モデルは、３次元面素モデルを含む。面素モデルは、複数の面素つまり「サーフェル」のデータ定義を含み、各面素は、３次元空間内の２次元領域（つまり、表面）を表す。これは、例えば「｛ｓｕｒｆｅｌｓ：．．．｝など、面素のリストの定義とともに開くとき図６Ａに示される。このリストは、順序なしリストであってよい。この場合、面素モデルの各面素は、少なくとも３次元の面素（つまり、位置要素またはコンポーネント）の位置を定義するデータ、及び３次元の面素（つまり、要素と関連する表面の「面」方位）の法線ベクトルを定義するデータを含む。これは、図６Ｂに概略で示されている。「サーフェル」の１つの説明は、コンピュータグラフィックス及びインタラクティブ技術に関する第２７回年次会議の会議記録、ＡＣＭＰｒｅｓｓ／Ａｄｄｉｓｏｎ－ＷｅｓｌｅｙＰｕｂｌｉｓｈｉｎｇＣｏ．、２０００年７月に発表されたＰｆｉｓｔｅｒ，Ｈａｎｓｐｅｔｅｒ，ｅｔａｌ．による論文「Ｓｕｒｆｅｌｓ：Ｓｕｒｆａｃｅｅｌｅｍｅｎｔｓａｓｒｅｎｄｅｒｉｎｇｐｒｉｍｉｔｉｖｅｓ」に見られる。

【0101】

図６Ｂは、面素つまり「サーフェル」６２０の概略の表現を示す。サーフェル６２０は、３次元に表面ｓを含む。サーフェルは、３次元に位置ｐを有する。図６Ａで、この位置は、３次元座標、例えばｘ座標、ｙ座標、及びｚ座標を定義するデータ「位置：ｐ_ｘ、ｐ_ｙ、ｐ_ｚ；」など３次元座標を使用し、定義される。他の例では、他の座標系を使用し得る。図６Ｂで、サーフェルは、３次元内で定義される法線ベクトルｎも有する。図６Ａで、この位置は、例えばデータ「法線：ｎ_ｘ、ｎ_ｙ、ｎ_ｚ；」など３次元ベクトルを使用し、定義される。方向は、ベクトル定義内の符号付きの値を使用し、示し得る。また、図６Ａの例６１０は、特定の例では、面素を記述するために使用され得るさらなるデータも有する。この場合、サーフェルの表面は３次元空間の円または円盤である。したがって、図６Ａ及び図６Ｂの表面は、データ「半径：ｒ；」として提示されるように半径ｒによって定義される。各サーフェルの半径は、眼に見える穴を最小限に抑えつつ、所与の点の周りの局所的な表面積を表すことを目的とする。他の例では、異なるデータは、例えば、３次元内の表面の範囲を示す異なる形状定義及び／または変数を使用し、表面を定義するために使用され得る。図６Ａは、本例では、サーフェル定義が、表面の色（「色：Ｒ、Ｇ、Ｂ；」－この場合、ＲＧＢ色空間が使用されるが、任意の既知の色空間も可能である）、サーフェルの重み（「重み：ｗ；」－これは、新しい測定値をサーフェルと融合するときに使用される実数であってよい）、サーフェルが最初に生成されたときを示す初期化時間（「Ｉｎｉｔ＿Ｔｉｍｅ：ｔ０；」）、及びサーフェルが前回更新または修正された時間を示す前回修正時間（「Ｌａｓｔ＿Ｍｏｄｉｆｉｅｄ：ｔ；」）を定義するデータも含むことを示している。このモデル表現内のサーフェルは、そのサーフェルが前回更新または修正されて（例えば、データ融合のためにそれと関連する未処理画像データ値を有していた）からの時間がδ_ｔよりも大きいときに非アクティブとして宣言され得る。実施態様に応じて、サーフェルの属性を定義するデータを追加、修正、または省略し得ることを理解されたい。図６Ａに示すように、複数のサーフェルは、リスト内（例えば、例の「｛．．．｝」の間）で定義され得る。

【0102】

図７は、一例に係るマッピングシステム７００を示す。マッピングシステムは、図４Ａのマッピングシステム４００の実施態様を含み得る。図７のマッピングシステム７００は、状態エンジン７０５及びマッピングエンジン７１０を含む。状態エンジン７０５は、図３Ａ及び図３Ｂの状態エンジン３４０、及び／または図４Ａの状態エンジン４４０を含み得る。マッピングエンジン７１０は、図３Ａ及び図３Ｂのマッピングエンジン３５０及び／または図５のマッピングエンジン５１０を含み得る。図７の例７００は、マッピングエンジン７１０の特定のコンポーネントが、画像データのフレームの受け取りに続いて３次元モデルを更新するために、どのように状態エンジン７０５とインタラクションするのかを概略で示す。

【0103】

図７の状態エンジン７０５及びマッピングエンジン７１０は、画像データ７１５にアクセスする。画像データ７１５は、図１Ａ～図１Ｈの画像キャプチャデバイス１２０、または図３Ａ及び図３Ｂの画像キャプチャデバイス３２０などの画像キャプチャデバイスによって提供される。画像データ７１５は、図２Ａ～図２Ｃに示す画像データ２２０を含み得る。画像データ７１５は、状態エンジン７０５及びマッピングエンジン７１０のモデル融合コンポーネント７２５によってアクセスされる。画像データ７１５は、画像データのフレームを含み得る。１つの場合では、状態エンジン７０５は、図４Ａに関して説明するように、幾何学的誤差を計算するために時間ｔで画像データから深度データを受け取り得る。モデル融合コンポーネントは、時間ｔで、深度データ

【数22】

及び測光データ

【数23】

を受け取り得る。簡易な場合、これらは、例えば、６４０ｘ４８０ｘ１深度値及び６４０ｘ４８０ｘ３色値など、時間ｔでメモリ内の２次元配列に格納されたデータを含み得る。このデータは、キャプチャまたは以前に記録された画像データを表す時間インデックス付きデータ構造から取り出され得る、及び／またはライブビデオフィードの一部として提供され得、各々の場合、データは少なくとも１つのキャプチャデバイスによって現在提供されるライブフレームに関する。モデル融合コンポーネント７２５は、画像データ７１５からのフレームに基づいて３次元モデル７３０を更新するように構成される。

【0104】

図７の例では、状態エンジン７０５は、時間ｔで画像データ７１５を提供する少なくとも１つの画像キャプチャデバイスのポーズＰ_ｔを決定するように構成される。このポーズは、画像キャプチャデバイスを含むロボットデバイスの現在の状態を使用し、決定される。ポーズは、例えば、図４Ａ及び図４Ｂに関して説明する状態最適化手順に従って変換Ｔ_ＷＣの値を含み得る。状態エンジン７０５は、マッピングエンジン７１０のアクティブモデルフレームジェネレータ７２０に通信可能に結合される。アクティブモデルフレームジェネレータ７２０は、アクティブモデルフレーム－ＡＭＦ_ｔを計算するように構成される。

【0105】

また、図７は、モデル区分器７３５も示す。これは、図５に関して説明するように、モデル区分器５４０の実施態様を含み得る。モデル区分器７３５は、３次元モデル７３０を２つの部分またはセットに分割するように配置される。第１の部分またはセットは、本明細書では「アクティブ」部分７４０と呼ばれ、第２の部分またはセットは、本明細書では「非アクティブ」部分７４５と呼ばれる。これは、時間ウィンドウを３次元モデル７３０に適用することを含み得る。図７に見られるように、アクティブ部分７４０は、アクティブモデルフレームジェネレータ７２０及びモデル融合コンポーネント７２５によって使用される。非アクティブ部分７４５は、アクティブモデルフレームジェネレータ７２０及びモデル融合コンポーネント７２５によって使用されない。

【0106】

特に、アクティブモデルジェネレータ７２０は、アクティブモデルフレームを生成するためにアクティブ部分７４０にアクセスするように配置される。これは、３次元モデルのアクティブ部分７４０からの投影に基づいて実行され得る。アクティブモデルフレームジェネレータ７２０は、時間ｔのアクティブモデルフレームＡＭＦ_ｔを決定するために、時間ｔのポーズ推定値Ｐ_ｔを使用するように構成される。これは、３次元モデルのアクティブ部分７４０を含む位置要素を使用して投影形状を決定するためにポーズ推定値の可変値を使用することを含み得る。

【0107】

アクティブモデルフレームジェネレータ７２０だけではなく、図７のマッピングエンジン７１０は、非アクティブモデルフレームジェネレータ７５０をさらに含む。非アクティブモデルフレームジェネレータ７５０は、アクティブモデルフレームジェネレータ７２０に類似しているが、３次元モデルの非アクティブ部分７４５から非アクティブモデルフレームＩＭＦ_ｔを生成するように構成される。例えば、非アクティブモデルフレームは、非アクティブ部分７４５からの幾何学的投影に基づいて、非アクティブモデルフレームジェネレータ７５０によって計算され得る。１つの場合では、アクティブモデルフレームジェネレータ７２０及び非アクティブモデルフレームジェネレータ７５０は、アクティブモデルフレームと非アクティブモデルフレームをそれぞれ生成するために、差別化された入力としてモデルのアクティブ部分と非アクティブ部分を受け取るように構成された共通フレームジェネレータによって実装され得る。アクティブモデルフレームに関して説明されたように、各非アクティブフレームは、深度データの予測フレーム

【数24】

及び測光データの予測フレーム

【数25】

を含み得る。

【0108】

図７で、位置合わせエンジン７６０は、アクティブモデルフレームジェネレータ７２０からアクティブモデルフレームＡＭＦ_ｔ、及び非アクティブモデルフレームジェネレータ７５０から非アクティブモデルフレームＩＭＦ_ｔを受け取るように配置される。本例では、位置合わせエンジン７６０は、アクティブモデルフレームを非アクティブモデルフレームにアラインさせる変換を決定するためにこれら２つのフレームを比較するように構成される。図７の矢印で示すように、この変換は、次に、３次元モデル７３０を更新して、モデルのアクティブ部分と非アクティブ部分をアラインさせるために使用され得る。この変換は、アクティブ部分と非アクティブ部分の両方に位置要素の非剛体スペースデフォメーションを適用するために使用され得る。１つの場合では、変形は、変形グラフを使用し、適用し得る。これは、図８に関してより詳細に説明される。変形またはアライメントは、現在のポーズ推定値Ｐ_ｔを利用し得る。特定の場合、アクティブモデルフレームと非アクティブモデルフレームの位置合わせは、状態エンジン７０５によって決定されるように、ロボットデバイスの現在の状態を使用し得る。１つの場合では、位置合わせエンジン７６０は、以前に予測されたフレームを新規に受け取った画像データのフレームにアラインさせようと試みるよりむしろ、アクティブフレームと非アクティブフレームをアラインさせる変換、Ｈ_ｔ、を決定するように構成される。アライメントが実行される場合、位置合わせエンジン７６０は、例えば、非アクティブモデルフレーム内で見える位置要素など、すべての目に見える非アクティブ位置要素を、アクティブとなるように設定し得る。

【0109】

位置合わせエンジン７６０によって実行されるアライメントまたは変形は、「ループ」クロージャを成立させ得る、つまり新規に受け取った画像データから生成されたモデルの位置要素を、以前に受け取った画像データに基づいて以前に生成及び／または修正された３次元空間の同じリージョンに対応する位置要素とアラインさせ得る。例えば、位置合わせエンジン７６０なしで、キャプチャデバイスが、例えば以前に観測された空間のリージョンを見るために戻るなど、モーションループを完了すると、モデルの以前の部分はモデルのより新しい部分とのアライメントから外れる場合がある。モデルでのこのずれ、つまり「ドリフト」は、例えばモデルの生成が非確定的に動作するなど、推定値を使用し、誤差関数を最小限に抑えようとすると、発生し、その結果、モデルが生成されるにつれ、ポーズ推定値及びモデルの小さな誤差が生じ得る。図７の位置合わせエンジン７６０は、例えばフレームごとに、連続的に、現在の推定されたキャプチャデバイス内のモデル（つまり、アクティブモデル）フレームのアクティブ部分を、同じフレーム内のモデルの非アクティブ部分と位置合わせしようと試みる。例えば、アライメントメトリックまたは必要とされる変形のレベルに基づいて位置合わせが成功した場合、キャプチャデバイスのモーションループは閉じられ、より新しいアクティブ部分はより古い非アクティブ部分にアラインされ、３次元モデル７３０全体は、この位置合わせを反映するための場所に非剛体で変形され得る。特定の場合、位置合わせエンジン７６０は、例えば、非アクティブモデルフレームの生成で使用されたものなど、位置合わせを実行するために使用されたモデルの非アクティブ部分を再活性化するように構成される。これによって、モデル融合コンポーネント７２５によるモデル融合を、モデルの位置合わせされた領域間で行うことができる。上述のように、データを融合することは、直近で観測された（つまり、モデルのアクティブ部分７４０または領域）３次元モデル７３０の領域で実行され、一方、ある期間観測されなかったモデルのより古い部分は、モデル区分器７３５によって、追跡またはデータ融合に使用されていないモデルの非アクティブ部分７４５または領域にセグメント化され得る。

【0110】

図８は、特定の実施態様で使用し得る位置合わせエンジン８１０の追加の特徴の例８００を示す。図８で、以前に説明した位置合わせエンジン５５０または７６０のいずれかと同じ機能を有し得る位置合わせエンジン８１０は、データストレージデバイス８２０に通信可能に結合される。データストレージデバイス８２０は、経時的に３次元モデルの表現８３０（「ε」）を格納する。これらの表現８３０は、それらがモデルエンジンによって生成されると、アクティブモデルフレームＡＭＦ_ｔの表現を含み得、例えば深度データの表現

【数26】

及び測光データの表現

【数27】

を含み得る。１つの場合では、表現は、アクティブモデルフレームの圧縮及び／またはダウンサンプリングされた表現であってよい。任意のマッピングされた表面を欠いているアクティブモデルフレームの予測されたビューの部分は、特定の場合、画像データから現在のフレームを使用し、充填され得る。特定の場合、表現は、アクティブモデルフレームのファーン符号化（ｆｅｒｎ－ｅｎｃｏｄｉｎｇ）を含み得る。各表現は、ファーン符号化文字列、深度データのダウンサンプリングされた予測フレーム、測光データのダウンサンプリングされた予測フレーム、現在のポーズ推定値、及び表現の初期化時間の１つ以上と関連するデータを含み得る。例えば、８０ｘ６０などのダウンサンプリングされたフレームサイズを使用し得る。

【0111】

図８の例で、アクティブモデルフレームＡＭＦ_ｔは、位置合わせエンジン８１０によって受け取られる。次にアクティブモデルフレームＡＭＦ_ｔを、データストレージデバイス８２０の表現８３０の１つと一致させるようとする試みが行われる。例えば、新しい表現は、受け取ったアクティブモデルフレームＡＭＦ_ｔから生成され、データストレージデバイス８２０に格納された表現８３０と比較され得、例えば、一致は、ファーン符号化された表現を使用し実行され得る。一致は、比較関数の出力によって示され得、例えば、誤差または一致撮像メトリックは、比較されたフレームまたは表現の間の類似度を示し得る。例えば、比較はファーン符号化間で行い得る。この場合、ファーン符号化はバイナリコードを含み得、２つの画像は、２つのバイナリコード間の「距離」を合計することによって比較され得る。最小の距離は「最善の」一致であると見なされ、距離は、一致が「有効」であるかどうかを判断するために閾値に比較され得る。アクティブモデルフレーム、ＡＭＦ_ｔは、マッチングを実行するためにダウンサンプリングされ得、例えば、ファーン符号化はダウンサンプリングされたフレームに対して行い得る。この場合、最善の一致を示すメトリック値（例えば、差異または誤差を示す撮像メトリックの最低の値）は、マッチング格納表現ε^ｊを示すために使用され得る。マッチング（例えば、ファーン符号化）に使用されるデータを有するだけではなく、格納された表現は、例えば、

【数28】

など、モデルフレームの表現を含んでもよい。１つの場合では、最善の一致の撮像メトリック値は、一致が有効であるかどうかを判断するために所定の閾値とさらに比較され得る。例えば、「最善の」一致でも不十分な実際の一致である場合があり、例えば高い一致誤差を有する。したがって、閾値比較は、これらの不十分な一致の使用を回避する。ダウンサンプリングは、比較的に「粗い」一致が検出され、正しいかのように、位置合わせエンジン８１０によって使用され得、次に、後続のアクティブモデルフレームと非アクティブモデルフレームは、図８で実行するアライメントを可能にするほど十分に近く、例えば、それらが、より正確な「ローカル」ループクロージャが可能となるように、「グローバル」ループクロージャに続いて十分にアラインする。

【0112】

１つの場合では、例えばマッチング撮像メトリックが所与の誤差閾値を超えているなど、一致が検出されない場合、次にアクティブモデルフレームＡＭＦ_ｔと非アクティブモデルフレームの位置合わせが、例えば図７に示すように実行される。他方、例えばマッチング撮像メトリックも所与の誤差閾値以下であるなど、「最善の」一致が検出される場合、次にマッチング表現ε^ｊがデータストレージデバイス８２０から取り出され、位置合わせエンジン８１０によってアクセスされる。位置合わせエンジン８１０は、次に、図７に関して説明する操作に類似するアライメント操作を命令するように構成される。しかしながら、本例では、アライメントは、アクティブモデルフレームＡＭＦ_ｔとマッチング表現ε^ｉとの間で実行される。例えば、アクティブモデルフレームのコンポーネント、例えば

【数29】

は、例えば

【数30】

など、マッチング表現ε^ｊのコンポーネントとアラインされ得る。１つの場合では、アライメントメトリックは評価され、アライメントを実行すべきかどうかを判断するために閾値と比較され得、例えば、アライメントを続行するために、所定の閾値に比較して低レベルのずれが必要とされる。アライメントが実行されるべきではない場合、位置合わせエンジン８１０は、図７に関して説明したように、アクティブモデルフレームと非アクティブモデルフレームのアライメントを実行しようと試み得る。アライメントが実行されるべきである場合、位置合わせエンジン８１０は、モデルデフォーマ８４０に、例えばアクティブモデルフレームのコンポーネントをマッチング表現のコンポーネントとアラインさせるために機能する３次元での変形を決定するなど、既存の３次元モデル８５０を変形するように命令するように配置されてよい。特定の場合、「グローバルループクロージャ」と見なし得るこのアライメントに続いて、３次元モデルのアクティブ部分と非アクティブ部分は更新されない。これは、アライメントによってアクティブ部分と非アクティブ部分がより大きいアライメントになり、したがって図７に示す位置合わせが実行され得る（例えば、したがって「ローカルループクロージャ」が次のフレームで無事に実行され得る）ためである場合がある。また、部分を更新しないことによって、潜在的に不正確なアライメントを補正する、または後続の位置合わせ操作の中から回復することも可能になる。

【0113】

本例では、モデルデフォーマ８４０は、既存の３次元モデル８５０にアクセスし、アラインされた３次元モデル８７０を生成するために、変形グラフ８６０を使用し、このモデルを変形するように配置される。変形グラフ８６０は、既存の３次元モデル８５０の分散した位置要素と関連付けられたノード及び端縁のセットを含む。１つの場合では、各ノードは、タイムスタンプ、３次元の位置、変換の定義、及び近接点のセットを含み得る。各ノードの近接点は、有向であってよいグラフの端縁を作り上げる。このようにして、変形グラフは、モデルの変形が実行されるときに互いに影響を与える３次元モデルの部分を接続する。近接点の数は、例えば一実施態様では４つの近接点に制限される場合がある。変換の定義は、（単位行列に初期化された）３ｘ３行列及び（ゼロに初期化された）３ｘ１ベクトルによる、またはデュアルクオータニオンによって表すようなアフィン変換の定義を含み得る。変形を実行するとき、各ノードの変換の定義は、一連の表面制約に従って最適化され得る。変形が適用されると、３次元モデルの特定の位置要素のグラフ内の影響を与えるノードのセットが識別される。これに基づいて、３次元モデルの位置要素の位置は、例えば、現在の位置要素からそれらのノードの位置の距離に従って影響を与えるノードの各々に適用される変換の定義の加重和など、変換された影響を与えるノードの加重和に基づいて変形され得る。例えば、図６Ａ及び図６Ｂに関して説明されたように面素モデルを使用すると、面素の位置と法線の両方ともこのように変形され得る。例えば、変形グラフのノードはその初期化時間に基づいて面素と関連付けられ得る。これらのノードのリストは、次にこのタイムスタンプによってソートされ得る。変形が面素のために命令されると、時間的に近傍のノードのセットにデータを追加するために、二分探索がこのノードのリストを通して実行され得る。このセットから、ｋ個の最寄りのノードのセットが、距離メトリックに基づいて面素のために決定される。これらのノードは、次に要素を変形するために使用される。このプロセスは迅速であり、リアルタイムまたはほぼリアルタイムの実行を可能にするために役立つ。

【0114】

一例では、変形グラフは、フレーム単位で構築され得る。１つの特定の場合、３次元モデルの新しい変形グラフは、画像データの各フレームに構築され得る。これは、例えば各グラフノードの近接点のセットなど、変形グラフの接続性を決定することを含み得る。１つの場合では、変形グラフは、３次元モデルを使用し、初期化される。例えば、フレームのノード位置は、３次元モデル内の位置要素の位置（例えば、サーフェルモデル内のｐ）から決定され得、ノードタイムスタンプは、位置要素タイムスタンプ（例えば、図６Ａの「Ｉｎｉｔ＿Ｔｉｍｅ」）に設定され得る。１つの場合では、変形グラフのノードは、３次元モデルの位置要素の、体系的なサンプリングなどサンプリングに基づいて生成され得る。このサンプリングは、総数（ｐｏｐｕｌａｔｉｏｎ）に対して均一に分布し得、変形グラフの空間密度を３次元モデルの空間密度に酷似させる。サンプリングされたノードのセットは、ノードのタイムスタンプに基づいて順序付け得る。これに続いて、時間情報を使用し、変形グラフの接続性を決定し得る。１つの場合では、例えばノードのタイムスタンプに基づいて時間で近接点であるノードのセットを選択し得る。例えば、４つの近接点があり、所与のノードが検討されている場合、（時間順序を付けたリストの）以前の２つのタイムスタンプを有するノード、及び（リスト中の）後続の２つのタイムスタンプを有するノードは、所与のノードの近接点として選択され得る。これは、計算上効率的であるという優位点、及び３次元モデルの時間的に相互に関連付けられていない領域が互いに影響を与えることを防ぐ（例えば、アクティブ領域が非アクティブ領域に影響を与えるのを防ぐ）という優位点を有する。例えば、共通の３次元空間の複数のパスと関連する変形グラフは、空間的に考慮されるとき、複雑であり、それ自体の中で絡み合っている場合がある。しかしながら、グラフを時間的に順序付け、考慮することによって、複数のパスをばらばらにし、自由にアラインすることが可能になる。これは、例えば、ポーズグラフを使用する場合に、ポーズ時間に基づいてグラフ接続性を決定する比較方法と対比し得る。

【0115】

既存の３次元モデル８５０を変形して、変形したモデル８７０を生成するために変形グラフ８６０を使用するためにモデルデフォーマ８４０によって適用され得る例のプロセスをここでより詳細に説明する。モデルデフォーマ８４０は、既存の３次元モデル８５０の所与の位置要素（例えば、図６Ａに関して説明されたサーフェル定義または別のボクセルベースの定義）にアクセスすることによって開始する。第１の操作として、モデルデフォーマ８４０は、所与の位置要素に時間で最も近い変形グラフ８６０のノードの位置を突き止める。時間分離は変数として格納される。次に、モデルデフォーマ８４０は、時間的に近傍のノードの位置を突き止め、例えば、定義された数のノードが探索するために時間分離から離れる。これらの近傍のノードは、次に所与の位置要素の位置に対するユークリッド距離など、距離メトリックによってソートされてもよい。例えば、上述の近接点制限を使用する所与の数の「近接点」ノードは、次に最も近いｋ個のノードとして選択され得る。これらの近接点の各々の重みのセットは、次に、ノードと所与の位置要素との間の正規化距離に基づいて生成され得る。また、重みの合計も決定し得る。次に、最後の操作として、各近接点の個々の計算された重みを介して重み付けされ、重みの合計によって正規化されるとして、近接点の変換の定義を適用し得る。これは、所与の位置要素の位置及び法線ベクトルを変形するために、所与の位置要素に関して上述したアフィン変換に変数を適用することを含み得る。図６Ａの面素の場合、所与の位置要素の他の態様は同じままである（例えば、変形したモデル８７０にコピーし得る）。

【0116】

一例では、位置合わせエンジン５５０、７６０、または８１０によって実行されるアライメントは、モデルデフォーマ８４０を使用して実行される。本例では、これは、変形グラフ８６０のパラメータを最適化することによって達成される。最適化は、位置合わせエンジン５５０、７６０、または８１０の出力に基づいて設定された表面相応関係のセットを所与として、３次元モデルの面位置合わせを反映し得る。これらの表面相応関係は、第１の時間の特定のソース位置が、第２の時間の特定の目的位置に達するまたは一致することを示し得る。各個別表面相応関係は、絶対的（変形した位置を３次元空間の絶対位置に関連付ける）または相対的（変形された位置を異なる変形された位置に関連付ける）のどちらかであってよい。（例えば、図７に関して説明するように）アクティブフレームと非アクティブフレームをアラインさせると、ソース点は、アクティブモデルフレームの点を表す場合があり、目的点は、モデルのアクティブ部分及び非アクティブ部分をアラインさせるために機能する、非アクティブモデルフレームの点を表す場合がある。例えば、第１の時間は、所与の非アクティブモデルフレームを生成するために使用された非アクティブモデル位置要素の初期化の時間を含み得、第２の時間は、現在のフレーム時間であってよい。ソース点は、現在のポーズ推定値Ｐ_ｔに基づいて見られる、（例えば、

【数31】

を計算するために使用される）アクティブモデルフレームを生成するために使用されるサンプリングされた位置要素であってよく、目的点は、３次元において、定義された変換Ｈを加えた現在のポーズ推定値Ｐ_ｔに基づいて見られる、（例えば、

【数32】

を計算するために使用される）アクティブモデルフレームを生成するために使用されるサンプリングされた位置要素であってよい。この場合、モデルのアクティブ部分を非アクティブ部分にマッピングするために計算された定義された変換（Ｈ）を適用しているので、目的点は、非アクティブモデルフレームの点と同等であり、例えば、変換は図７の位置合わせエンジン７６０によって実行されるアライメントの少なくとも一部である。これらの表面相応関係は、「ローカルループクロージャ」を適用するために使用され得る。同様に、（例えば、図８に関して説明されるように）アクティブフレームを格納された表現とアラインさせるとき、第１の時間は、格納された表現の初期化の時間を含み得、第２の時間は、現在のフレーム時間であってよい。ソース点は、現在のポーズ推定値Ｐ_ｔに基づいて見られる、（例えば、

【数33】

を計算するために使用される）アクティブモデルフレームを生成するために使用されたサンプリングされた位置要素であってよく、目的点は、３次元において、定義された変換Ｈを加えた表現のポーズ推定値に基づいて見られるように、（例えば、

【数34】

を計算するために使用される）アクティブモデルフレームを生成するために使用されたサンプリングされた位置要素であってよい。再び、定義された変換がアクティブモデル部分に適用されると、目的点は、アクティブモデルと非アクティブモデルのアライメントを表す。これらの表面相応関係は、「グローバルループクロージャ」を適用するために使用され得る。表面相応関係は、例えば使用されるフレームについてなど、ピクセルのサンプリングされたセットについて計算されてよい。これらの場合、アライメントまたは位置合わせは、表面相応関係のセットに対して３次元の定義された変換を解決することを含み得る。

【0117】

上記例では、表面相応関係は、変形グラフのパラメータの最適化のために１つ以上のコスト関数で使用され得る。例えば、１つのコスト関数は、変形したソース点（例えば、変形グラフを適用するとき）と、目的点との間の距離誤差の合計に等しい誤差関数を含み得、ソース点と目的点は、表面相応関係で使用される点である。本明細書に説明する３次元モデルの時間的なパラメータ化によって、３次元空間の同じ部分の複数のパスをアライメントに非剛体で変形することが可能になり、モデリングの続行、及び３次元モデルの再訪された領域への新しいデータ融合が可能となる。また、３次元モデルの非アクティブ部分を適所に「ピンで固定する」、つまりモデルのアクティブ部分を非アクティブ部分に変形させるために別のコスト関数も使用し得る。このコスト関数は、変形したソース点（例えば、変形グラフを適用するとき）と変形していない目的点との間の距離誤差の合計に等しい誤差関数を含み得、目的点は、表面相応関係で使用される点である。３次元モデルの以前に位置合わせした領域を適所に保つために、つまりマップの別の領域を変形するとき、別のコスト関数も使用し得、以前に位置合わせした領域の相対的な位置を、同じままとなるように制約する必要がある場合がある。このコスト関数は、変形したソース点（例えば、変形グラフを適用するとき）と、変形した目的点との間の距離誤差の合計に等しい誤差関数を含み得る。このコスト関数は、ループクロージャ及びそれらの関連する変形が３次元モデルの以前に位置合わせされた領域を引き離すのを防ぐ。また、誤差関数は、（例えば、その転置行列で乗算された変換と単位行列との間の距離メトリックを最小限に抑えることによって）変形グラフの定義された変換の剛性を最大限にするために、及び（例えば、近接点変換を組み込んだ距離メトリックに基づいて）円滑な変形を確実にするために定義されてもよい。これらの説明した誤差関数の１つ以上は、変形グラフの変換定義を決定するために（例えば、加重和内で）最小限に抑え得る。コスト関数の１つ以上が、所定の閾値（例えば、変形したソース点と目的点を比較するコスト関数など）以下である誤差値を出力する場合、次にアライメントが受け入れられる。誤差値が所定の閾値を超える場合、次にアライメントは（等式事例が適切に割り当てられて）拒絶される。

【0118】

図９は、ロボットデバイスを使用し、環境の３次元モデルを更新する方法９００を示す。ロボットデバイスは、図１Ａ～図１Ｈに示すロボットデバイス１３０、１６０、１８０、１９０、または図３Ａ及び図３Ｂに示すロボットデバイス３１０、３８０であってよい。本例では、ロボットデバイスは、移動できるように結合された画像キャプチャデバイスを有する。つまり、画像キャプチャデバイスは、ロボットデバイスに対する画像キャプチャデバイスの移動を可能にするようにロボットデバイスに結合されている。例えば、画像キャプチャデバイスは、図１Ｃ、図１Ｅ、及び図１Ｇに関して図示し、説明するように取り付け得る。代替として、方法９００は、別の例示的なロボットデバイスを用いて実行し得る。

【0119】

ブロック９１０で、画像キャプチャデバイス及びロボットデバイスの少なくとも１つの環境内での移動が命令される。例えば、これは、図３Ｂの移動コントローラ３９０などの移動コントローラを介する場合がある。移動は、例えばリモコン装置を使用して手作業で命令し得る、及び／または例えばロボットデバイスのナビゲーションシステムによって命令されるなど、自律移動の一部である場合がある。移動は、単にロボットデバイスを移動させること、（例えば、可動マウントを使用し）単に画像キャプチャデバイスを移動させること、またはロボットデバイスと画像キャプチャデバイスの両方を移動させることを含み得る。移動が反復して実行される場合、ロボットデバイスの異なる部分は各反復で移動され得、例えば、ロボットデバイスが環境内で移動する探索段階、及び画像キャプチャデバイスを移動させるために可動マウントが移動される走査段階があり得る。これらの段階は、周期的に繰り返し得る。

【0120】

ブロック９２０で、画像キャプチャデバイスを用いた環境の観測を表す画像データが取得される。例えば、これは、図２Ａ～図２Ｃに示すように画像データ２２０を取得することを含み得る。画像データは、深度データ及び／または測光データのフレームを含み得る。

【0121】

ブロック９３０で、移動の測定値が取得される。これは、ロボットデバイス及び画像キャプチャデバイスの１つ以上の測定値を含み得る。測定値は、図３Ｂに示すように、ロボットアクチュエータ３３２及び／またはキャプチャデバイスアクチュエータ３３４などのアクチュエータのセットから取得され得る。他の場合、測定値は、ロボットデバイス及び画像キャプチャデバイスの１つ以上の観測から取得され得る。測定値は、運動コンポーネント用の駆動モータ及び／または関節キャプチャデバイスマウント用の関節モータなど、１つ以上のモータから取得し得る。

【0122】

ブロック９４０で、ロボットデバイスのモデル状態が更新される。モデル状態は、例えば図３Ａ及び図３Ｂの状態３６０に関して説明するようなロボットデバイスの状態を含み得る。モデル状態は、ロボットデバイス及び画像キャプチャデバイスの１つ以上のポーズを定義するポーズデータを使用して表し得る。例えば、モデル状態は、上述の変換Ｔ_ＷＣとＴ_ＷＢを定義するデータを含み得る。１つの場合では、ブロック９２０は、ビデオデータのフレームを取得することを含み、モデル状態は、ビデオデータの現在のフレームとビデオデータの以前のフレームの両方について決定される。この場合、ブロック９４０は、例えば、図４Ａの現在の状態と以前の状態４５０、４６０など、以前のモデル状態と現在のモデル状態を決定することを含み得る。ブロック９４０は、ロボットデバイスの追跡操作として見なし得る。この場合、追跡操作は、モデル状態を精緻化するために移動の測定値を使用する。ブロック９４０で更新することは、モデル状態及び移動の測定値の関数を最適化することを含む。例えば、これは、移動の測定値に基づいて、モデル状態の更新を制約することを含み得る。ブロック９４０は、図４Ａの状態エンジン４４０に関して説明する操作に類似した操作を含み得る。

【0123】

ブロック９５０で、環境の３次元モデルは、画像データと３次元モデルの比較に基づいて更新される。この比較は、ブロック９４０から更新されたモデル状態を使用する。比較は、例えば、ブロック９２０の画像データの３次元モデルへの逆投影または画像キャプチャデバイスの現在のポーズと関連する平面への３次元モデルの投影のどちらかなど、更新したモデル状態を使用する投影を含む。比較は、このようにして２次元空間でまたは３次元モデル空間で行い得る。３次元モデルの更新は、図５、図７、及び図８に関して説明する操作に類似した操作も含み得る。

【0124】

特定の場合、ブロック９１０は、アクチュエータの第１のセットに、環境内でロボットデバイスを移動させるように命令すること、及びアクチュエータの第２のセットに、ロボットデバイスに対して画像キャプチャデバイスを移動させるように命令することの１つ以上を含む。この場合、ブロック９３０は、アクチュエータの第１のセットから走行距離計測法データを取得すること、及びアクチュエータの第２のセットから運動データを取得することを含む。

【0125】

図４Ａの状態エンジン４４０に関して説明するように、ロボットデバイスのモデル状態を更新することは、コスト関数を最適化することを含み得る。コスト関数は、選択可能な誤差項のセットを含み得る。１つの場合では、コスト関数は、運動誤差と関連する誤差項、及び走行距離計誤差と関連する誤差項を含む。この場合、運動誤差は、画像キャプチャデバイスとロボットデバイスの空間関係と、ロボットデバイスからの運動測定値との比較を含む。例えば、空間関係は、画像キャプチャデバイス用の可動マウントに適用される順運動学を使用してモデル化され得る。走行距離計誤差は、ロボットデバイスと環境の３次元モデルの空間関係の変化と、ロボットデバイスからの走行距離計測法データとの比較を含み得る。走行距離計測法データは、ロボットデバイス用の駆動システムによって提供され得る。

【0126】

特定の場合、コスト関数は、一次事前確率と関連する誤差項を含む。一次事前確率は、誤差値及び以前の更新動作からのロボットデバイスのモデル状態を使用して構築し得る。特定の場合、ブロック９４０は、ロボットデバイスの以前の状態とロボットデバイスの現在の状態を最適化することを含む。特定の例で、コスト関数は、幾何学的アライメント誤差と関連する誤差項を含む。この場合、幾何学的アライメント誤差は、取得した画像データから導出したデータと、ブロック９４０の前のロボットデバイスのモデル状態を使用する３次元モデルとの比較を含み得る。例示的な誤差項は、図４Ａに関して説明する誤差項を含み得る。

【0127】

図１０及び図１１は、例えば、図３Ａ及び図３Ｂのロボットデバイス３１０、３８０、図４Ａの状態エンジン４４０を使用し、及び／または図９の方法９００を使用し、実行されるなど、状態更新の例を提供する。図１０は、現実世界での移動及びロボットデバイスの状態の対応する変化の例１０００を示す。図１１は、状態をどのようにモデル化し得るのかの例を示す。

【0128】

図１０では、左部分１０１０は、環境の第１の位置１０１５から環境の第２の位置１０２０に移動するロボットデバイスを示す。本例のロボットデバイスは、図１Ｃ及び図１Ｄのロボットデバイスである。移動は、ロボットデバイスのシャシの移動、及び例えば画像キャプチャデバイスをシャシに結合するアームの移動を介した画像キャプチャデバイスの移動の１つ以上を含み得る。

【0129】

図１０の右部分１０３０は、例えば図１Ｄに関して提示された慣例を使用してなど、モデル空間内のロボットデバイスの状態を示す。第１の位置１０１５で、ロボットデバイスは、シャシ１０３２のポーズを定義するデータ、及び画像キャプチャデバイス１０３４のポーズを定義するデータによって表される状態を有し、両方のポーズはモデル空間に関して定義されている。

【0130】

図１０は、比較方法を使用するときに、モデル空間のロボットデバイスの状態がどのようにドリフトする場合があるのかを示す。例えば、モデルドリフトは、シャシ１０４２のポーズを定義するデータ、及び図１０の画像キャプチャデバイス１０４４のポーズを定義するデータによって示されるように、発生する場合がある。モデルドリフトは、運動測定値及び走行距離計測定値が、例えば追加の幾何学的誤差項なしになど、状態最適化なしに使用される場合に発生する場合がある。同様に、モデルドリフトは、例えば画像キャプチャデバイスからのビデオデータのフレームを環境のモデルと一致させることによって、運動測定値及び走行距離計測定値を利用することなく、結合された測光誤差及び幾何学的誤差を使用し、発生する場合がある。本例では、状態最適化手順の中で移動測定値を使用すると、モデル空間内の状態がロボットデバイスの現実世界の構成をより正確に反映するのに役立つ。したがって、図１０で、状態最適化に続いてシャシ１０５２のポーズを定義するデータ、及び状態最適化に続いて画像キャプチャデバイス１０５４のポーズを定義するデータが、例えば図４Ａの状態エンジン４４０によって実行される操作に続いて示される。このデータ１０５２、１０５４は、ロボットデバイスの第２の位置１０２０をより正確に反映する。この向上した精度は、特に画像キャプチャデバイス及びロボットデバイスの移動の複雑な組合せに有用であり、比較手法は、容易にドリフトし、ロボットデバイス及び結合された画像キャプチャデバイスの現在の位置及び向きを「失う」場合がある。

【0131】

図１１は、ロボットデバイスの２つの状態の例の状態グラフ１１００を示す。状態グラフ１１００は、４つの部分１１０２～１１０８に分割される。第１の部分１１０２は以前の構成要素を表し、第２の部分１１０４は以前の状態の構成要素を表し、第３の部分１１０６は、誤差成分を表し、第４の部分１１０８は現在の状態の構成要素を表す。第１の部分１１０２は、一次事前確率１１１０を示す。一次事前確率１１１０は、特に画像キャプチャデバイス１１２０のポーズ及びロボットデバイス１１３０のポーズにおいて、以前の状態を制約するために使用される。各ポーズは、図４Ｂに関して説明した変換を使用し、表される（例えば、Ｔ_ＷＢとＴ_ＷＣ）。第３の部分１１０６の誤差成分は、幾何学的誤差項１１４０、運動誤差項１１５０、及び走行距離計誤差項１１６０を含む。例えば、これらの誤差項は、図４Ａの誤差項４１０～４３０に相当し得る。走行距離計誤差項１１６０は、以前の状態でのロボットデバイス１１３０のポーズ、及び（第４の部分１１０８に示す）現在の状態でのロボットデバイス１１８０のポーズを制約するために使用される。運動誤差項１１５０は、現在の状態でのロボットデバイス１１８０のポーズ、及び現在の状態の画像キャプチャデバイス１１７０のポーズを制約するために使用される。最後に、幾何学的誤差項１１４０も、現在の状態での画像キャプチャデバイス１１７０のポーズを制約するために使用される。

【0132】

図１１の例では、以前の状態と現在の状態は、画像キャプチャデバイスから取得したビデオデータの以前のフレームと現在のフレームに関する場合がある。ビデオの新しい「現在の」フレームが受け取られた後、状態最適化操作を介して以前のフレーム及び現在のフレームのポーズの値を決定し得る。第３の部分１１０６の誤差成分は、例えば電気機械制御システムなど、ロボットデバイスのサブシステムから行われる測定値に基づく場合がある。一次事前確率１１１０は、以前の時間反復からの状態及び誤差の周辺化から取得し得る。状態グラフは、このようにして以前の状態と現在の状態の値を決定するために反復して解決し得るスライドウィンドウ最適化問題を構築するために使用し得る。

【0133】

本明細書に説明する特定の例は、高密度ＳＬＡＭシステムなど、マッピングシステム内の可動ロボットデバイスからの運動データ及び走行距離計データの密結合を可能にする。例は、ロボットデバイスの（例えば、ロボットの「本体」、「コア」、または「シャシ」の）、及び（例えば、ロボットの「アーム」または「頭部」上で）ロボットデバイスに結合された画像キャプチャデバイスの最大６自由度を特徴とする多種多様のロボットデバイスにリアルタイムでまたはほぼリアルタイムで実装され得る。本明細書に説明する特定の例は、ロボットデバイス及び画像キャプチャデバイスのポーズを推定するために状態モデルをともに最適化する。この同時最適化は運動誤差項、走行距離計誤差項、幾何学的誤差項、及び以前の状態と誤差を表す一次事前確率の１つ以上を含み得る。

【0134】

本明細書に説明する特定の例は、ロボットデバイスが環境をナビゲートするにつれ、環境の高密度３次元モデルをリアルタイムでまたはほぼリアルタイムで構築することを可能にする。移動できる画像キャプチャデバイスを使用することにより、環境のより効率的かつ柔軟なマッピングが可能になり、生活空間及び／または災害激甚地もしくは紛争地帯など制約された環境をマッピングするために特に適用可能である。特定の例では、３次元モデルは、密なローカルループクロージャを達成するためにアクティブ領域を使用する。これは、面素モデル使用時の表面に関するものであり得る。モデルのアクティブ部分が、非アクティブ部分から遠くにドリフトしすぎて局所的なアライメントが集束できない場合、密なグローバルループクロージャ及びモデル一貫性のために、例えばモデルの表面に対して、モデルのアクティブ部分を下部の非アクティブ部分とアラインし直す変形をブートするために、外観ベースのグローバルループクロージャ方法を使用し得る。

【0135】

説明した例の実施態様の実行は、急速な回転を有する高速で不規則な動きなど、困難な動き及び視覚データの大幅な改善を提供しながら、簡略かつ円滑なカメラ軌跡のための比較手法に匹敵する。また、本明細書に説明する例は、（例えば、カメラがタイル張りの天井またはカーペットを敷いた床を観測する）共通の彩色の壁及び床など、著しい光度計の変動及び幾何学的な変動を欠く領域に改善されたマッピングも提供する。比較手法では、参考になる画像データが欠如していると、例えば図１０に示すような大規模なモデルドリフトにつながる場合がある。

【0136】

本明細書に説明する特定の例は、例えばグラウンドトゥルース測定値と比較して、定量的な追跡精度、及び定性的な再構築一貫性のための改善を提供する。図１２は、これらの改善を明示する例のテストデータを示す。図１２は、環境の２次元平面図を示す。テストケースでは、環境は、約５メートルかける５メートルの部屋であった。線１２１０は、ロボットデバイスの「グラウンドトゥルース」経路、つまり本明細書に説明するシステム及び方法とは関係なく測定されたロボットデバイスの実際の経路を表す。線１２２０は、次に、例えば図３Ａ、図３Ｂ、または図４Ａに示すコンポーネントを適用することによって、本明細書に説明する状態最適化の例でモデル化されるロボットデバイスのモデル化された位置を表す。線１２３０は、次に、例えば本明細書に説明する運動誤差項及び走行距離計誤差項なしに、結合された幾何学的誤差及び測光誤差を最小限に抑えることによって位置を追跡する比較システムを使用し、ロボットデバイスのモデル化された位置を示す。見られるように、線１２２０は、線１２１０と密接に一致しているが、線１２３０はいくつかの場所で線１２１０とは異なっている。このテストケースでは、比較システムは、高速回転中、特に画像データが変動を欠いていた場合に、正確な軌跡を維持することに苦心した。対照的に、本明細書に説明する例は、ナビゲーションを支援するために、ロボットデバイスからのオンボード測定値を利用することができた。

【0137】

本明細書に説明する特定の例は、ポーズグラフなしでＳＬＡＭシステムを使用するときに堅牢かつ一貫性のあるマップを生成することを可能にする。例えば、本例は、ポーズグラフのないＳＬＡＭシステムを改善するために使用し得、運動測定値及び走行距離計測定値の制約なしに、３次元モデルは実際の「グラウンドトゥルース」形状から逸脱するようにいびつになる場合がある。本例は、このようにして環境の３次元構造をマッピングし、生成された構造内でロボットデバイスの位置を突き止める高密度視覚ＳＬＡＭ方法を改善する。また、本明細書に説明する例は、繰り返し見られるオブジェクトを、環境のグローバルモデルで正確に位置決めすることも可能にし得る。また、モデルは、改善された局所的な一貫性も示す。

【0138】

本明細書に説明する特定の例は、ＩＭＵによって提供される慣性測定など、慣性測定値を使用する比較方法に優る改善も提供する。これらの方法は、慣性測定値のノイズ及びバイアスに起因する大局的なドリフトを受けやすい。ドリフトは、加速度計の測定値及びＩＭＵバイアスに対する依存に起因する場合がある。例えば、特定の比較システムは、画像の対（例えば、連続ビデオフレーム）間の変換を推定するために拡張カルマンフィルタを使用し得る。

【0139】

本明細書に説明する特定の例は、可動ロボットプラットフォーム使用時に「無料で」利用できる場合がある運動測定値及び走行距離計測定値を利用する。例えば、車輪付きのロボットは、多くの場合、アクセス可能な走行距離計測法データを提供し、マニピュレータ運動学は、マニピュレータ制御プロセスの一部として計算され得る。共通マニピュレータに基づいたデータなど、可動マウントからのデータを使用し行われる予測は、堅牢性の改善を提供しながらも、慣性系で見られるようにドリフトを低減できる直接的な関節角度測定値に基づき得る。また、マニピュレータ上のエンドエフェクタ位置に画像キャプチャデバイスを取り付けることは、環境マッピング時に改善を提供することが示されてきた。相対的な走行距離計測定値は、現在の状態と以前の状態の両方を最適化するために使用し得る。本明細書に説明する例は、リアルタイムフレームレート（例えば、毎秒３０フレーム）で実装し得るため、ポーズグラフを使用しないシステムなど高速ＳＬＡＭシステム及びサーフェルモデルでの柔軟な変形操作にも良好に適合する。

【0140】

本明細書に説明する特定のシステムコンポーネント及び方法は、非一時的な記憶媒体上に格納可能であるコンピュータプログラムコードによって実装し得る。図１３は、コンピュータ可読記憶媒体１３２０からデータを取り出すように配置された少なくとも１つのプロセッサ１３１０を含むシステムの特定の例１３００を示している。システムは、上述のような可動ロボットデバイスの一部を含み得る。コンピュータ可読記憶媒体１３２０は、その上に格納されたコンピュータ可読命令１３３０のセットを含む。命令１３３０は、少なくとも１つのプロセッサ１３１０に一連の動作を実行させるように配置される。これらの動作は、図９の方法９００またはその変形形態、及び／または図４Ａを参照して説明する状態エンジン４４０の動作を含み得る。

【0141】

上記例は、例示的と理解されるべきである。さらなる例が予想される。各例の特定のコンポーネントは別々に説明されたが、１つの例に関して説明された機能性は、別の例で適切に実装され得ること、及び特定のコンポーネントが実施態様に応じて省略し得ることを理解されたい。任意の一例に関して説明したいずれの特徴も単独で、または説明された他の特徴と組み合わせて使用し得、例のいずれか他の例の１つ以上の特徴またはいずれか他の例のいずれかの組み合わせと組み合わせて使用し得ることを理解されたい。さらに、上述していない均等物及び修正形態も、添付の特許請求の範囲に定義する本発明の範囲から逸脱することなく利用し得る。

【符号の説明】

【0142】

１１０３次元空間
１１５オブジェクト
１２０画像キャプチャデバイス
１３０ロボットデバイス
１３５アクチュエータ
１４５ロボットデバイス
１５５垂直軸
１６０ロボットデバイス
１６２シャシ
１６４アクチュエータ
１６５可動マウント
１６６画像キャプチャデバイス
１６８シャシ
１８０ロボットデバイス
１８２本体
１８４アクチュエータ
１８５ネック
１８５マウント
１８６頭部
１９０ロボットデバイス
１９２シャシ
１９４アクチュエータ
１９５可動マウント
１９６画像キャプチャデバイス
２１０画像キャプチャデバイス
２２０画像データ
２３０フレーム
２４０複数のフレーム
２５０測光データ
２６０測光データ
２８０深度データ
３１０ロボットデバイス
３２０画像キャプチャデバイス
３３０アクチュエータ
３３２ロボットアクチュエータ
３３４キャプチャデバイスアクチュエータ
３４０状態エンジン
３５０マッピングエンジン
３６０ロボットデバイス
３６０の状態
３８０ロボットデバイス
３９０移動コントローラ
４００マッピングシステム
４４０状態エンジン
４４５状態データ
４５０ロボットデバイス
４６０ロボットデバイス
４６２ロボットデバイス
５１０マッピングエンジン
５２０画像データ
５３０モデル
５４０モデル区分器
５５０位置合わせエンジン
６１０データ構造
６２０サーフェル
７００マッピングシステム
７０５状態エンジン
７１０マッピングエンジン
７１５画像データ
７２０アクティブモデルフレームジェネレータ
７２５モデル融合コンポーネント
７３５モデル区分器
７４０アクティブ部分
７４５非アクティブ部分
７５０非アクティブモデルフレームジェネレータ
７６０位置合わせエンジン
８１０位置合わせエンジン
８２０データストレージデバイス
８４０モデルデフォーマ
８６０変形グラフ
１０１５第１の位置
１０２０第２の位置
１０３２シャシ
１０３４画像キャプチャデバイス
１０４２シャシ
１０４４画像キャプチャデバイス
１３１０プロセッサ
１３２０コンピュータ可読記憶媒体
１３３０命令

【図1A】