(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-09
(45)【発行日】2023-08-18
(54)【発明の名称】機械知覚のためのシステム及び方法
(51)【国際特許分類】
G01C 3/06 20060101AFI20230810BHJP
G01B 11/00 20060101ALI20230810BHJP
【FI】
G01C3/06 110B
G01C3/06 120Q
G01B11/00 H
G01C3/06 130
(21)【出願番号】P 2019535248
(86)(22)【出願日】2017-12-23
(86)【国際出願番号】 US2017068377
(87)【国際公開番号】W WO2018125850
(87)【国際公開日】2018-07-05
【審査請求日】2020-12-16
(32)【優先日】2017-10-10
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2016-12-27
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2017-12-23
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】518216157
【氏名又は名称】スミッツ ジェラルド ディルク
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(72)【発明者】
【氏名】スミッツ ジェラルド ディルク
【審査官】眞岩 久恵
(56)【参考文献】
【文献】特開2010-197227(JP,A)
【文献】特開2000-304508(JP,A)
【文献】米国特許出願公開第2016/0335778(US,A1)
【文献】笠井 健 他,マルチカメラによる実時間3次元運動計測システム,バイオメカニズム,第8巻 ,1986年,第143-151頁
(58)【調査した分野】(Int.Cl.,DB名)
G01C 3/00-3/32
G01B 11/00-11/30
(57)【特許請求の範囲】
【請求項1】
1又は2以上の物体の位置を決定するシステムであって、
フォトンのビームを発して1又は2以上の物体の
ボクセルを順次的
かつ個々に照明するよう構成された送信機と、
ピクセルの
二次元アレイを各々が含む、互いに離間して配置された
3つ以上のカメラであって、前記ピクセルの各々が前記ピクセルによって受信されるフォトンを検出するよう構成される、
3つ以上のカメラと、
命令を格納する1又は2以上のメモリデバイスと、
前記格納された命令を実行して方法の動作を行う1又は2以上のプロセッサデバイスと、
を備え、前記方法は、
狭くコリメートされたピクセルサイズのレーザビームのパルスによって、事前に決められた時間期間の間、前記フォトンのビームで1又は2以上の物体の複数の
ボクセルの各々を順次的
かつ個々に照明するよう前記送信機に指示する段階
であって、前記ボクセルは前記ピクセルサイズで表わされるものである、前記段階と、
前記
ボクセルの各々に対して、前記
3つ以上のカメラから、前記事前に決められた時間期間以下の時間間隔内で前記1又は2以上の物体の
ボクセルによって反射又は散乱される前記ビームのフォトンを時間的解像度を伴って検出した前記
3つ以上のカメラにおける各ピクセルの
二次元アレイ位置を受信する段階と、
前記
3つ以上のカメラによって検出された前記
ボクセルの各々に対して、当該
ボクセルによって反射又は散乱された前記ビームのフォトンを検出した前記
3つ以上のカメラにおける前記ピクセルの受信された
二次元アレイ位置を前記検出したフォトンに時間的に関連付けることによって
、3つ以上の時間的に関連付けられた前記ピクセルの二次元アレイ位置の内の3つのピクセルの二次元アレイ位置に基づく三焦点テンソル法によって前記
ボクセルの位置を決定する段階と、
を含む、ことを特徴とするシステム。
【請求項2】
前記送信機に指示する段階は、前記事前に決められた時間期間未満で前記複数の
ボクセルの各
ボクセルを順次的
かつ個々に照明するよう前記送信機に指示する段階を含む、ことを特徴とする請求項1に記載のシステム。
【請求項3】
本体及び複数の付属物を更に備え、前記
3つ以上のカメラの各々は、前記付属物の1つに配置され、前記動作は更に、
前記
3つ以上のカメラの少なくとも3つが前記1又は2以上の物体の
ボクセルによって反射又は散乱されたフォトンを検出するまで、前記付属物の1又は2以上を移動させる段階を含む、
ことを特徴とする請求項1に記載のシステム。
【請求項4】
本体及び複数の付属物を更に備え、前記送信機は、前記付属物の1つに配置され、前記動作は、
前記
3つ以上のカメラの少なくとも3つが前記1又は2以上の物体の
ボクセルによって反射又は散乱されたフォトンを検出するまで、前記送信機が配置されている前記付属物を移動させる段階を含む、
ことを特徴とする請求項1に記載のシステム。
【請求項5】
前記動作は更に、
前記1又は2以上の物体上の複数の関心ポイント(POI)を識別する段階と、
前記POIの第1位置を決定する段階と、
その後の時点で、前記POIの第2位置を決定する段階と、
前記POIの第1及び第2位置に基づいて前記POIの軌跡を予測する段階と、
を含む、ことを特徴とする請求項1に記載のシステム。
【請求項6】
前記システムは、ユーザの頭部に装着可能である、ことを特徴とする請求項1に記載のシステム。
【請求項7】
前記送信機は、少なくとも3つの異なるカラーのビームを発するよう構成され、前記
3つ以上のカメラの少なくとも1つは、前記3つの異なるカラーのフォトンを区別するよう構成される、ことを特徴とする請求項1に記載のシステム。
【請求項8】
前記送信機及び前記
3つ以上のカメラの少なくとも1つは、車両の一部であることを特徴とする請求項1に記載のシステム。
【請求項9】
前記送信機に指示する段階は、ビーム強度の事前に決められたシーケンスに従って、前記フォトンのビームで前記1又は2以上の物体の複数の
ボクセルを順次的
かつ個々に照明するよう前記送信機に指示する段階を含む、ことを特徴とする請求項1に記載のシステム。
【請求項10】
1又は2以上の物体の位置を決定する方法であって、
狭くコリメートされたピクセルサイズのレーザビームのパルスによって、事前に決められた時間期間の間、フォトンのビームで1又は2以上の物体の複数の
ボクセルを順次的
かつ個々に照明するよう送信機に指示する段階
であって、前記ボクセルは前記ピクセルサイズで表わされるものである、前記段階と、
前記
ボクセルの各々に対して、
3つ以上のカメラから、前記事前に決められた時間期間以下の時間間隔内で前記1又は2以上の物体の
ボクセルによって反射又は散乱されたビームのフォトンを時間的解像度を伴って検出した前記
3つ以上のカメラにおける各ピクセルの
二次元アレイ位置を受信する段階と、
前記
3つ以上のカメラによって検出された前記
ボクセルの各々に対して、当該
ボクセルによって反射又は散乱された前記ビームのフォトンを検出した前記
3つ以上のカメラにおける前記受信されたピクセルの
二次元アレイ位置を前記検出したフォトンに時間的に関連付けることによって
、3つ以上の時間的に関連付けられた前記ピクセルの二次元アレイ位置の内の3つのピクセルの二次元アレイ位置に基づく三焦点テンソル法によって前記
ボクセルの位置を決定する段階と、
を含む方法。
【請求項11】
前記
二次元アレイ位置を受信する段階は、前記
ボクセルの各々に対して、前記事前に決められた時間期間以下の時間間隔内で及び前記
3つ以上のカメラから、前記1又は2以上の物体の
ボクセルによって反射又は散乱された前記ビームのフォトンを検出した前記
3つ以上のカメラにおける各ピクセルの
二次元アレイ位置を受信する段階を含む、ことを特徴とする請求項10に記載の方法。
【請求項12】
前記送信機に指示する段階は、事前に決められたカラーシーケンスに従って、前記フォトンのビームで前記1又は2以上の物体の複数の
ボクセルを順次的
かつ個々に照明するよう前記送信機に指示する段階を含む、ことを特徴とする請求項10に記載の方法。
【請求項13】
前記送信機に指示する段階は、ビーム強度の事前に決められたシーケンスに従って、前記フォトンのビームによって前記1又は2以上の物体の複数の
ボクセルを順次的
かつ個々に照明するよう前記送信機に指示する段階を含む、ことを特徴とする請求項10に記載の方法。
【請求項14】
1又は2以上の物体の位置を決定するための命令を含む非一時的プロセッサ可読ストレージ媒体であって、1又は2以上のプロセッサデバイスによる前記命令の実行により、前記1又は2以上のプロセッサデバイスに方法の動作を実行させ、
前記方法が、
狭くコリメートされたピクセルサイズのレーザビームのパルスによって、事前に決められた時間期間の間、フォトンのビームで1又は2以上の物体の複数の
ボクセルを順次的
かつ個々に照明するよう送信機に指示する段階
であって、前記ボクセルは前記ピクセルサイズで表わされるものである、前記段階と、
前記
ボクセルの各々に対して、
3つ以上のカメラから、前記事前に決められた時間期間以下の時間間隔内で前記1又は2以上の物体の
ボクセルによって反射又は散乱された前記ビームのフォトンを時間的解像度を伴って検出した前記
3つ以上のカメラにおける各ピクセルの
二次元アレイ位置を受信する段階と、
前記
3つ以上のカメラによって検出された前記
ボクセルの各々に対して、当該
ボクセルによって反射又は散乱された前記ビームのフォトンを検出した前記
3つ以上のカメラにおける前記受信されたピクセルの
二次元アレイ位置を前記検出したフォトンに時間的に関連付けることによって
、3つ以上の時間的に関連付けられた前記ピクセルの二次元アレイ位置の内の3つのピクセルの二次元アレイ位置に基づく三焦点テンソル法によって前記
ボクセルの位置を決定する段階と、
を含む、非一時的プロセッサ可読ストレージ媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2016年12月27日に以前に出願された米国仮特許出願米国連番第62/498,534号明細書、及び2017年10月10日に出願された米国仮特許出願米国連番第62/606、879号明細書に基づく実用特許出願であり、本件の出願日の利益は、35U.S.C.§119(e)の規定により本明細書で主張され、各々が全体的に引用により組み入れられる。
【0002】
本発明は、一般的には、画像化システム並びに画像化システムを実施及び使用する方法に関する。本発明はまた、各ボクセルの順次的照明及び複数の受信機を用いた検出を備えた順次的ボクセル画像化システムに関する。
【背景技術】
【0003】
従来の多くの画像化システムは、一連の静止画像として3Dモーションリアリティを取り込もうとしている。画像はフレームとして取り込まれ、すなわち、共有時間期間にわたって並行して取り込まれる数百万のピクセルから構成されるバッチ観測である。フレームとして画像を扱うことによって、従来のマルチビューシステムはフォトンスターベーションとモーションぼけの間のホブソンの選択を強いられる可能性があり、空間-時間的曖昧さとコンピューテーションの複雑さを結果として生じる。従来のフレームベースのモーションキャプチャシステムのレガシーの例は、ステレオカメラ、構造化光3D知覚システム、及びモーションシステムからの構造である。
【0004】
十分なフォトンが各カメラの数百万のピクセルの最小信号要件を満足できるようにするために、シャッターによって制御されるフレーム露出期間は一般的には数ミリ秒である。各ピクセルは、一般的には、少なくとも100フォトンを必要とし、10メガピクセルカメラで単一のフレームを最小限露出するために少なくとも膨大な数のフォトンを必要とし、これは通常の照明状態の下では数ミリ秒かかる。
【0005】
この時間期間の間の何れのモーションも重大なモーションのぼけを起こすことがある。例えば、1ミリ秒露出に対して、10m/秒の中程度の速度(22.5mph)の4Kセンサの4メートル視野(FoV)を横断する物体の端が1msで10mm動き、10ピクセルのモーションのぼけを起こす(すなわち、モーションはシステムの空間解像度を1/10、又は4kの代わりにカメラのFoVにわたって400ピクセルだけに効率的に低減する)。短い露出はこのぼけを低減するが、これらは、端及び形の検出が難しくなるようなコントラストを大幅に低減するフォトンの不足を結果として生じる。例えば、1/10露出時間は、フォトンバジェットを3フォトンの固有の(例えば、ポワゾンフラクチュエーション)ノイズを持つ10フォトン(100フォトンの1/10)に低減する(すなわち、33%信号対雑音比)。大きなアパーチャは、一般的には、大きく高価なセンサ及びオプティクスを含み、システムのフォーカスの深度を低減する。
【0006】
従来のマルチビューシステムは、エッジコントラストが極めて欠落した、ぼけ又は露光不足のノイズの多いモーション画像を生成する可能性がある。これは、推測的で誤りの多い特徴マッチを結果として生じる可能性がある。後者は、SIFT及び勾配降下法などの従来の特徴マッチングアルゴリズムを妨げる統計的グロスアウトライヤーを形成し、RanSacなどのコンピュータ的に強力なアウトライヤー拒絶アルゴリズムを必要とする。多くの従来のマルチビュー知覚システムにおけるフレーム毎の方式は第2の主要な欠点を有し、これは、カメラの数(N)と1つのカメラ当たりのピクセルの数(M)を有する(MN)の大きさで指数的に第2オーダーを増加させる固有のコンピューテーションの複雑さを結果として生じる。
【0007】
フレームベースのマルチビューシステムでは、ビュー又はピクセルの追加は、コンピューテーションの過負荷を直ちに生じることがあり、大量のセットアップ及び較正問題が付きまとう。複数の画像間の正確なピクセルレベル対応を設定する時に特にコンピューテーション問題が生じる。例えば、3カメラシステム(N=3)における正確な密度(ピクセルレベル)対応の設定は、重なり合う10メガピクセルの間の最大百万の3方向対応を並べ替え捜し出す段階を要求することがあり、これはコンピュ―テーション的に複雑である(例えば、1021可能ピクセル-ピクセル-ピクセル組み合わせ(MN=107x3)を介したサーチ及び並べ替え)。
【先行技術文献】
【特許文献】
【0008】
【文献】米国仮特許出願米国連番第62/498,534号明細書
【文献】米国仮特許出願米国連番第62/606、879号明細書
【発明の概要】
【発明が解決しようとする課題】
【0009】
オーダー(MN)の同様のコンピュ―テーション的複雑さがモーションからの構造(SfM)システムに生じ、ここで連続するフレーム間の画像(又はピクセル)対応を複数のフレームを通じて発見及び追跡する必要がある。
【図面の簡単な説明】
【0010】
【
図1】本発明の様々な実施形態を実施できる例示的環境の実施形態を示す図である。
【
図2】
図1に示すようなシステムに含めることができる例示的モバイルコンピュータの実施形態を示す図である。
【
図3】
図1に示すようなシステムに含めることができる例示的ネットワークコンピュータの実施形態を示す図である。
【
図4A】例示的位置決定システムの一部分の平面図の実施形態を示す図である。
【
図4B】順次的に照明を用いた位置決定の例示的方法の論理的流れ図の実施形態を示す図である。
【
図5】4つのポイントの照明及び3つのカメラを用いた検出の実施形態を示す図である。
【
図6A】例示的アレイ位置ベクトルを示す例示的位置決定システムの一部分の平面図の実施形態を示す図である。
【
図6B】例示的アレイ位置ベクトルを示す例示的位置決定システムの一部分の平面図の別の実施形態を示す図である。
【
図7A】モータ車両における例示的位置決定システムの実施形態を示す図である。
【
図7B】モータ車両における例示的位置決定システムの別の実施形態を示す図である。
【
図7C】拡張現実(AR)タイプの頭部装着ディスプレイ(HMD)システムにおける例示的位置決定システムの第3の実施形態を示す図である。
【
図8】2つの送信機を用いた例示的位置決定システムの一部分の実施形態を示す図である。
【
図9】手持式送信機及び手持式モニタリングデバイスを用いた例示的位置決定システムの実施形態を示す図である。
【
図10A】支援ステレオ構成における例示的位置決定システムの実施形態を示す図である。
【
図10B】頭部装着構成における例示的位置決定システムの実施形態を示す図である。
【
図11A】2つのスキャナ又はプロジェクタを用いた例示的位置決定方法の実施形態を示す図である。
【
図11B】2つのスキャナ又はプロジェクタを用いた例示的位置決定方法の実施形態を示す図である。
【
図11C】2つのスキャナ又はプロジェクタを用いた例示的位置決定方法の実施形態を示す図である。
【
図11D】2つのスキャナ又はプロジェクタを用いた例示的位置決定方法の実施形態を示す図である。
【
図11E】2つのスキャナ又はプロジェクタを用いた例示的位置決定方法の実施形態を示す図である。
【
図11F】2つのスキャナ又はプロジェクタを用いた例示的位置決定方法の実施形態を示す図である。
【
図12】位置決定システムを組み入れた例示的ロボット又は他のデバイスの実施形態を示す図である。
【
図13A】例示的基準追跡システムの実施形態を示す図である。
【
図13B】例示的基準追跡システムの実施形態を示す図である。
【
図14】ビーム軌跡マニホールド及び走査物体マニホールドを備えた例示的位置決定システムの実施形態を示す図である。
【
図15】例示的な確率的通知マルチビューカメラオーバーラップシステムの実施形態を示す図である。
【
図16】例示的ホログラフィックビデオキャプチャシステムの実施形態を示す図である。
【
図17A】例示的目標選択的3D基準モニタリングシステムの実施形態を示す図である。
【
図17B】例示的目標選択的3D基準モニタリングシステムの実施形態を示す図である。
【
図18】カラー照明を利用した例示的位置決定システムの実施形態を示す図である。
【
図19】位置決定システムを備えた例示的車両の実施形態を示す図である。
【
図20】カメラのスワップアウトを可能にする例示的位置決定システムの実施形態を示す図である。
【
図21A】プロジェクタによって生成される光ビーム軌跡の1つの実施形態を示す図である。
【
図21B】走査及び予測された軌跡部分を備えた1つの光ビーム軌跡の実施形態を示す図である。
【
図22】表面上の走査パターン及び異なるカメラ視野から観測されるパターンを投影するプロジェクタの応用の実施形態を示す図である。
【
図23】カメラのピクセルによる検出事象のトレール及びこのトレールに基づくフォトンビームの軌跡の補間の実施形態を示す図である。
【
図24A】カメラ1のピクセルによる検出事象のトレール及びこのトレールに基づくフォトンビームの軌跡の補間の別の実施形態を示す図である。
【
図24B】カメラ2のピクセルによる検出事象のトレール及びこのトレールに基づくフォトンビームの軌跡の補間の別の実施形態を示す図である。
【発明を実施するための形態】
【0011】
特定の実施形態によって実施することができる本発明の一部を形成し且つ例証によって本発明を示す添付の図面に関して様々な実施形態を以下に詳しく説明する。しかしながら、実施形態は、多くの異なる形式で実施でき且つ本明細書に示す実施形態に制限されるものとして解釈すべきではなく、逆にこれらの実施形態は本開示が詳細で完全なものになるよう提供され、当技術に精通した業者に実施形態の範囲を完全に伝えるものとする。とりわけ、様々な実施形態は、方法、システム、媒体、又はデバイスとすることができる。従って、様々な実施形態は、完全にハードウェアの実施形態、完全にソフトウェアの実施形態、又はソフトウェアとハードウェアの態様を組み合わせた実施形態の形式を取ることができる。従って以下の詳細な説明は制限の意味に捉えるべきではない。
【0012】
本明細書及び請求項を通して、以下の用語は、本文脈が他に明確に指示しない限り本明細書に明示的に関連付けられる意味を取る。本明細書で用いる「1実施形態では」という句は、同じ実施形態を示すことができるが必ずしも同じ実施形態を指すとは限らない。本明細書で用いる「別の実施形態では」という句は、異なる実施形態を示すことができるが必ずしも異なる実施形態を指すとは限らない。従って、以下に説明するように、本発明の様々な実施形態は、本発明の範囲又は精神から逸脱することなく容易に組み合わせることができる。
【0013】
加えて、本明細書で用いる「or」という語は、本文脈が他に明確に指示しない限り、包括的な「or」演算子であり、「and/or」という語と同等である。「に基づいて」という語は、本文脈が他に明確に指示しない限り、排他的であり且つ記述していない追加の要素に基づくことを可能にする。加えて、本明細書全体を通して、「a」、「an」、及び「the」は複数の引用を含む。「in」の意味は「in」及び「on」を含む。
【0014】
本明細書で用いる「フォトンビーム」、「光ビーム」、「電磁ビーム」、「画像ビーム」、又は「ビーム」という語は、EMスペクトラム内の様々な周波数又は波長のフォトン又は電磁(EM)波の幾分ローカライズされた(時間的及び空間的)ビーム又はバンドルを指す。出射光ビームは、本明細書で開示する様々な実施形態の様々なものによって送信されるビームである。入射光ビームは、本明細書で開示する様々な実施形態の様々なものによって検出されるビームである。
【0015】
本明細書で用いる「光源」、「フォトン源」、又は「ソース」という語は、EMスペクトラム内の1又は2以上の波長又は周波数の1又は2以上のフォトン又はEM波を発する、提供する、送信する、又は生成することができる様々なデバイスを指す。光又はフォトン源は、1又は2以上の出射光ビームを送信することができる。フォトン源は、レーザ、発光ダイオード(LED)、有機発光ダイオード(OLED)、光バルブなどとすることができる。フォトン源は、原子又は分子の刺激放出、白熱処理、又はEM波又は1又は2以上のフォトンを生成する様々な他の機構を介してフォトンを生成することができる。フォトン源は、事前に決められた周波数の連続又はパルス出射光ビーム、又は周波数の範囲を提供することができる。出射光ビームはコヒーレントな光ビームとすることができる。光源によって発せられたフォトンは、様々な波長又は周波数とすることができる。
【0016】
本明細書で用いる「受信機」、「フォトン受信機」、「フォトン検出器」、「光検出器」、「検出器」、「フォトンセンサ」、「光センサ」、又は「センサ」という語は、EMスペクトラムの1又は2以上の波長又は周波数の1又は2以上のフォトンの存在を検知する様々なデバイスを指す。フォトン検出器は、複数のフォトン検出又は検知ピクセルの配列などのフォトン検出器のアレイを含むことができる。ピクセルの1又は2以上は、1又は2以上のフォトンの吸収を検知するフォトセンサとすることができる。フォトン検出器は、1又は2以上のフォトンの吸収に応じて信号を生成することができる。フォトン検出器は、ピクセルの1次元(1D)アレイを含むことができる。しかし他の実施形態では、フォトン検出器は少なくともピクセルの2次元(2D)アレイを含むことができる。ピクセルは、能動ピクセルセンサ(APS)、電荷結合素子(CCD)、単一フォトンアバランシェ検出器(SPAD)(アバランシェモード又はガイガーモードで作動)、相補型金属酸化膜半導体(CMOS)デバイス、シリコン光電子増倍管(SiPM)、光電池セル、光トランジスタ、トゥイッチーピクセルなどの様々なフォトン検知技術を含むことができる。フォトン検出器は1又は2以上の入射光ビームを検出することができる。
【0017】
本明細書で用いる「目標」という語は、入射光、EM波、又はフォトンの少なくとも一部分を反射又は散乱する1又は2以上の様々な2D又は3D本体である。目標は、「物体」を指すこともできる。例えば、目標又は物体は、本明細書で開示する様々な実施形態の様々なものによって送信される出射光ビームを散乱又は反射することができる。本明細書で説明する様々な実施形態では、1又は2以上の光源は、受信機の1又は2以上及び/又は1又は2以上の目標又は物体に対して相対的に動くものとすることができる。同様に、1又は2以上の受信機は、光源の1又は2以上及び/又は1又は2以上の目標又は物体に対して相対的に動くものとすることができる。1又は2以上の目標又は物体は、光源の1又は2以上及び/又は1又は2以上の受信機に対して相対的に動くものとすることができる。
【0018】
本明細書で用いる「ボクセル」という語は、3D空間マニホールド(例えば、3D型表面)のサンプル表面要素である。
【0019】
以下は、本発明の一部の態様の基本的な理解を提供するために本発明の実施形態を簡潔に説明する。この簡潔な説明は、広範囲に及ぶ概要として意図するものではない。基本的な又は重要な要素の識別、又は範囲を描写する又はそうでなければ狭めることを意図するものではない。この目的は、単に、後で提示される詳細な説明の前置きとして単純化形式で一部の概念を提示することにある。
【0020】
簡潔に述べると、様々な実施形態は、1又は2以上の物体の位置を決定する方法又はシステムに向けられる。この方法又はシステムは、物体の領域(又はボクセル)を順次的に照明するためにフォトンのビームを発するためのビーム配列を用いる。この方法及びシステムは、互いに離間して配置された複数のカメラを含み、各カメラは、ピクセルによって受け取られたフォトンを検出する、且つ特に照明された物体によって反射又はそうでなければ散乱されたビームからのフォトンを検出するためのピクセルのアレイを有する。(「反射する」という語が本明細書で用いられるが、この語は、他に指示がない限り、他の光散乱機構を包含することを意図されることが理解されるであろう。)このシステムは、フォトンのビームで物体の領域又はボクセルを順次的に照明するためのビーム配列を向ける。これらの照明される領域の各々に対して、カメラの1又は2以上(好ましくは、少なくとも2又は3)は、この領域によって反射又はそうでなければ散乱されたフォトンを検出し、次にカメラが1又は2以上の物体の領域によって反射又は散乱されたビームのフォトンを検出した画像のアレイ位置を提供する。これらのアレイ位置を用いて物体の領域の位置を決定することができる。
【0021】
少なくとも一部の実施形態では、このピクセル/ボクセルの順次画像化方式は、(照明された物体の)ボクセルの非常に急速な順次ストリームとして現実を観測する受信機(例えば、カメラ)を利用する。少なくとも一部の実施形態では、このシステム(例えば、PhotonJet VoxelFlowシステム)は、固有のナノ秒照明間隔中の各ボクセル、1度に1つのボクセルを観測する。少なくとも一部の実施形態では、この方式は、1秒当たりの数百万のボクセルの正確な3D位置データの流れを結果として生じることができる。
【0022】
図示したオペレーティング環境
図1は、本発明の様々な例示的実施形態を実施することができる例示的環境の1つの実施形態の例示的構成要素を示す。本発明を実施するために構成要素の全てを必要とする訳ではなく、構成要素の構成及び種類の何れのバリエーションも、本発明の精神又は範囲から逸脱することなく行い得る。図のように、
図1のシステム100は、光源を含む送信機104、複数の受信機(例えば、カメラ)106a、106b、106c、106d、及びシステムコンピュータデバイス110を含む。送信機104からのフォトンは、受信機106a、106b、106c、106dに向けてフォトンの一部を反射する1又は2以上の物体又は目標108上の領域(すなわち、ボクセル)を照明する。一部の実施形態では、システム100は、ネットワーク102、及び限定されないがラップトップコンピュータ112及び/又は限定されないがスマートフォン又はタブレット114などのモバイルコンピュータなどの1又は2以上の他のコンピュータを含むことができるか、又はこれに結合することができる。一部の実施形態では、送信機104及び/又は受信機106a、106b、106c、106dは、限定されないがコンピュータ110、112、又は114の様々なものなどのコンピュータに含まれる1又は2以上の構成要素を含むことができる。送信機104及び受信機106a、106b、106c、106dを、何れかの無線又は有線技術によってコンピュータ110、112、又は114に直接結合することができるか、又はネットワーク102を介してコンピュータ110、112、又は114に結合することができる。
【0023】
物体108は3次元の物体とすることができ、何れかの数の個々の物体とすることができる。物体108は、理想的な黒い本体ではない、すなわち入射フォトンの少なくとも一部分を反射又は散乱する。
【0024】
送信機104は、光又はフォトンビームを送信する1又は2以上の光源を含むことができる。適切な光源の例は、レーザ、レーザダイオード、発光ダイオード、有機発光ダイオードなどを含む。例えば、送信機104は、1又は2以上の可視及び/又は不可視レーザ源を含むことができる。少なくとも一部の実施形態では、送信機104は、赤(R)、緑(G)、又は青(B)レーザ源の1又は2以上を含む。少なくとも一部の実施形態では、光源は、近距離(NIR)又は赤外線(IR)レーザなどの1又は2以上の不可視レーザ源を含む。光源は、事前に決められた周波数、又は周波数の範囲の連続又はパルス光ビームを提供することができる。提供される光ビームはコヒーレントな光ビームとすることができる。送信機104は、限定されないが、
図2のモバイルコンピュータ200及び/又は
図3のネットワークコンピュータ300を含むコンピュータデバイスの特徴、構成要素、又は機能の様々なものを含むことができる。
【0025】
送信機104は、送信された又は出射光ビームを向ける又はフォーカスするための光学構成要素を含む光学システムを含むことができる。この光学システムは、出射光ビームの空間的及び時間的ビームプロファイルを目指し形作ることができる。この光学システムは、出射光ビームを平行にする、扇形に広げる、又はそうでなければ操作することができる。送信機104は、物体108の上のビームとしてフォトンを走査することができる走査構成を含むことができる。
【0026】
送信機104は、1又は2以上の物体108上の領域(例えば、ボクセル)を個々に走査する。ボクセルは、3D空間マニホールドのサンプル表面要素(例えば、3D型表面)として説明することができる。少なくとも一部の実施形態では、ボクセルは、比較的小さく、「ピクセルサイズ」として表すことができる。受信機(例えば、カメラ)による順次リアルタイムピクセル位置検出に結合されたボクセルの順次的に照明は、マルチビュー3D検知システムを改善することができる。本システムの性能は、複数のカメラから流れる時間順次ピクセルデータの並行ストリームの同期化コンフルエンスの配列によって「ターボチャージ」される。少なくとも一部の実施形態では、これらの順次ピクセルデータフローは、送信機104の走査レーザプローブビームの反射によって提供される時間的基準のビートに同期される。
【0027】
少なくとも一部の実施形態では、較正中に短パルスのシーケンスが送信機によって任意選択的に発せられ、これによって反射された信号がカメラによって検出された時に、信号経路の「ジッタ」(例えば、センサ又は信号チェーンの差による)を、中心位置の各検出信号経路の差分到着時間を比較することによって(例えば、
図15に示した事象同時並行性チェック(ECC)回路において)決定することができる。
【0028】
受信機106a、106b、106c、106dは、1又は2以上のフォトン検知、又はフォトン検出のセンサピクセルのアレイを含むことができる。センサピクセルのアレイは、目標108から反射される連続又はパルス光ビームを検出する。ピクセルのアレイは、1次元アレイ又は2次元アレイとすることができる。ピクセルは、照明時に1又は数入射フォトンをアバランシェするSPADピクセル又は他のフォトセンシティブ要素を含むことができる。ピクセルは、数ナノ秒のオーダーである単一又は数フォトンを検出する場合の超高速反応時間を有することができる。ピクセルは、送信機104によって発生又は送信された周波数を検知することができ且つ他の周波数に対しては相対的に検知しない。受信機106a、106b、106c、106dは、ピクセルのアレイ全体に受信ビームを向ける及びフォーカスするための光学構成要素を含む光学システムを含むこともできる。受信機106a、106b、106c、106dは、限定されないが
図2のモバイルコンピュータ200及び/又は
図3のネットワークコンピュータ300を含むコンピュータデバイスの特徴、構成要素、又は機能の様々なものを含むことができる。
【0029】
コンピュータデバイス110の様々な構成要素は、
図2-3と共に以下に詳しく説明する(例えば、コンピュータデバイス110は、
図2のモバイルコンピュータ200及び/又は
図3のネットワークコンピュータ300の実施形態とすることができる)。しかしながら、簡潔には、コンピュータデバイス110は、限定されないが物体又は目標108の表面を含む1又は2以上の表面から反射されたフォトンの検出に基づいて本明細書で論じる様々な位置決定処理及び/又は方法を実行できる様々なコンピュータデバイスをバーチャルで含む。検出されたフォトン又は光ビームに基づいて、コンピュータデバイス110は、送信機104及び受信機106a、106b、106c、106dの1又は2以上の構成を改変又はそうでなければ修正することができる。コンピュータデバイス110の機能を、別のデバイスと通信することなく、送信機104、受信機106a、106b、106c、106d、又はこれらの組み合わせによって実行できることを理解すべきである。
【0030】
一部の実施形態では、位置決定機能の少なくとも一部は、限定されないがラップトップコンピュータ112及び/又は限定されないがスマートフォン又はタブレット114などのモバイルコンピュータを含む他のコンピュータによって実行することができる。このようなコンピュータの様々な実施形態は、
図2のモバイルコンピュータ200及び/又は
図3のネットワークコンピュータ300と共に以下に詳しく説明する。
【0031】
ネットワーク102は、送信機104、フォトン受信機106、追跡コンピュータデバイス110、ラップトップコンピュータ112、又はスマートフォン/タブレット114を含む他のコンピュータデバイスにネットワークコンピュータを結合するよう構成することができる。ネットワーク102は、限定されないが、USBケーブル、Bluetooth(登録商標)、Wi-Fi(登録商標)などの遠隔デバイスと通信するための有線及び/又は無線技術を含むことができる。一部の実施形態では、ネットワーク102は、ネットワークコンピュータに他のコンピューティングデバイスを結合するよう構成されたネットワークとすることができる。様々な実施形態では、デバイス間で伝送される情報は、限定されないが、プロセッサ可読命令、遠隔要求、サーバ応答、プログラムモジュール、アプリケーション、生データ、制御データ、システム情報(例えば、ログファイル)、ビデオデータ、音声データ、画像データ、テキストデータ、構造化/未構造化データなどを含む様々な種類の情報を含むことができる。一部の実施形態では、この情報は、1又は2以上の技術及び/又はネットワークプロトコルを用いてデバイス間で伝送することができる。
【0032】
一部の実施形態では、このようなネットワークは、様々な有線ネットワーク、無線ネットワーク、又はこれらの様々な組み合わせを含むことができる。様々な実施形態では、ネットワーク102は、1つの電子デバイスから別の電子デバイスに情報を伝送するための様々な形態の通信技術、トポロジー、コンピュータ可読媒体などを利用することができる。例えばネットワーク102は、インターネットに加えて、LAN、WAN、パーソナルエリアネットワーク(PAN)、キャンパスエリアネットワーク、都市エリアネットワーク(MAN)、直接通信接続(ユニバーサルシリアルバス(USB)ポートなどを介した)、又はこれらの様々な組み合わせを含むことができる。
【0033】
様々な実施形態では、ネットワーク内及び/又はネットワーク間の通信リンクは、限定されないが、ツイストペア線、光ファイバ、オープンエアレーザ、同軸ケーブル、一般電話サービス(POTS)、導波、音響、フル又はフラクショナル専用デジタル回線(T1、T2、T3、又はT4など)、E電話会社、総合デジタル通信網(ISDN)、デジタル加入者回線(DSL)、無線リンク(衛星リンクを含む)、又は他のリンク及び/又は当技術に精通した業者に公知の電話会社機構を含むことができる。通信リンクは、制限なしに、例えば、DS-0、DS-1、DS-2、DS-3、DS-4、OC-3、OC-12、OC-48などを含む多種多様なデジタルシグナリング技術の様々なものを用いることができる。一部の実施形態では、ルータ(又は他の中間ネットワークデバイス)は、異なるアーキテクチャ及び/又はプロトコルに基づくものを含む様々なネットワーク間のリンクとして作用し、1つのネットワークから別のネットワークに情報が転送されるようにする。他の実施形態では、遠隔コンピュータ及び/又は他の関係のある電子デバイスをモデム及び一時的電話リンクを介してネットワークに接続することができる。基本的には、ネットワーク102は、情報がそれによってコンピュータデバイス間を移動できる様々な通信技術を含むことができる。
【0034】
ネットワーク102は、一部の実施形態では、様々な携帯式ネットワークデバイス、遠隔コンピュータ、有線ネットワーク、他の無線ネットワークなどを結合するよう構成することができる様々な無線ネットワークを含むことができる。無線ネットワークは、独立型アドホックネットワークなどにオーバレイすることができる多種多様なサブネットワークの様々なものを含み、少なくともクライアントコンピュータ(例えば、ラップトップコンピュータ112又はスマートフォン又はタブレットコンピュータ114)(又は他の移動デバイス)のインフラストラクチャ指向接続を提供することができる。このようなサブネットワークは、メッシュネットワーク、無線LAN(WLAN)ネットワーク、セルラーネットワーなどを含むことができる。様々な実施形態の1又は2以上では、本発明のシステムは1つより多い無線ネットワークを含むことができる。
【0035】
ネットワーク102は、複数の有線及び/又は無線通信プロトコル及び/又は技術を用いることができる。ネットワークが用いることができる通信プロトコル及び/又は技術の様々な世代の例(例えば、第3(3G)、第4(4G)、又は第5(5G))は、限定されないが、グローバル・システム・フォー・モバイル・コミュニケーション(GSM(登録商標))、ジェネラル・パケット・ラジオ・サービス(GPRS)、拡張データGSM環境(EDGE)、符号分割多元接続(CDMA)、広帯域符号分割多元接続(W-CDMA)、符号分割多元接続2000(CDMA2000)、高速ダウンリンクパケットアクセス(HSDPA)、長期進化(LTE)、ユニバーサル・モバイル・テレコミュニケーション・システム(UMTS)、進化データ最適化(Ev-DO)、ワールドワイド・インターオペラビリティ・フォー・マイクロウェーブ・アクセス(WiMax)、時分割多元接続(TDMA)、直交周波数分割多重化(OFDM)、超広帯域(UWB)、無線アプリケーションプロトコル(WAP)、ユーザデータグラムプロトコル(UDP)、送信制御プロトコル/インターネットプロトコル(TCP/IP)、オープンシステム相互接続(OSI)モデルプロトコルの様々な部分、セッション初期化プロトコル/リアルタイムトランスポートプロトコル(SIR/RTP)、ショートメッセージサービス(SMS)、マルチメディアメッセージングサービス(MMS)、又は多種多様な他の通信プロトコル及び/又は技術の様々なものを含むことができる。基本的には、ネットワークは、情報が、送信機104、フォトン受信機106、及び追跡コンピュータデバイス110、並びに図示していない他のコンピュータデバイス間でそれによって移動できる通信技術を含むことができる。
【0036】
様々な実施形態では、ネットワーク102の少なくとも一部分を、様々な通信リンクによって接続することができるノード、リンク、経路、端末、ゲートウェイ、ルータ、スイッチ、ファイヤウォール、ロードバランサ、フォワーダー、リピータ、光学-電気コンバータなどの自律システムとして構成することができる。これらの自律システムは、ネットワークのネットワークトポロジーを修正できるように現在の作動状態及び/又は規則ベースのポリシーに基づいて自己編成するよう構成することができる。
【0037】
例示的なモバイルコンピュータ
図2は、図示した例示的構成要素より多い又は少ない構成要素を含むことができる例示的モバイルコンピュータ200の1つの実施形態を示す。モバイルコンピュータ200は、例えば、
図1のシステム100のラップトップコンピュータ112、スマートフォン/タブレット114、及び/又はコンピュータ110の1又は2以上の実施形態を表すことができる。従ってモバイルコンピュータ200は、移動デバイス(例えば、スマートフォン又はタブレット)、固定/デスクトップコンピュータなどを含むことができる。
【0038】
クライアントコンピュータ200は、バス206を介してメモリ204と通信するプロセッサ202を含むことができる。クライアントコンピュータ200は、電源208、ネットワークインタフェース210、プロセッサ可読固定ストレージデバイス212、プロセッサ可読取り外し可能ストレージデバイス214、入力/出力インタフェース216、カメラ218、ビデオインタフェース220、タッチインタフェース222、ハードウェアセキュリティモジュール(HSM)224、プロジェクタ226、ディスプレイ228、キーパッド230、照明器232、音声インタフェース234、全地球測位システム(GPS)送受信機236、オープンエアジェスチャインタフェース238、温度インタフェース240、触覚インタフェース242、及びポインティングデバイスインタフェース244を含むことができる。クライアントコンピュータ200は任意選択的に、基地局(図示せず)と、又は別のコンピュータと直接通信することができる。1つの実施形態では、図示していないが、クライアントコンピュータ200の向きを測定及び/又は維持するためにクライアントコンピュータ200の中でジャイロスコープを用いることができる。
【0039】
電源208は、クライアントコンピュータ200に電力を供給することができる。再充電可能又は再充電不可バッテリを用いて電力を供給することができる。電力は、バッテリを補足する及び/又は再充電するACアダプタ又は給電ドッキングクレードルなどの外部電源によって提供することもできる。
【0040】
ネットワークインタフェース210は、限定されないが、OSIモデル・フォー・モバイル・コミュニケーション(GSM)、CDMA、時分割多元接続(TDMA)、UDP、TCP/IP、SMS、MMS、GPRS、WAP、UWB、WiMax、SIP/RTP、GPRS、EDGE、WCDMA(登録商標)、LTE、UMTS、OFDM、CDMA2000、EV-DO、HSDPAのPSIモデルの様々な部分、又は多種多様な他の無線通信プロトコルの様々なものを実施するプロトコル及び技術を含む1又は2以上の通信プロトコル及び技術と共に使用するよう構成される。ネットワークインタフェース210は、送受信機、送受信デバイス、又はネットワークインタフェースカード(NIC)として公知であることがある。
【0041】
音声インタフェース234は、人間の声の音などの音声信号を生成及び受信するよう構成することができる。例えば音声インタフェース234は、スピーカ及びマイクロフォン(図示せず)に結合して、他者との通信を可能にする及び/又はある動作の音声肯定応答を生成することができる。音声インタフェース234のマイクロフォンは、例えば、音声認識、サウンドに基づくタッチの検出などを用いてクライアントコンピュータ200への入力又は制御に使用することができる。
【0042】
ディスプレイ228は、液晶ディスプレイ(LCD)、ガスプラズマ、電子インク、発光ダイオード(LED)、有機LED(OLED)又はコンピュータと共に使用できる光反射又は光透過ディスプレイの様々な他の種類とすることができる。ディスプレイ228は、スタイラスなどの物体からの入力又は人間の手からのディジットを受信するよう構成されたタッチインタフェース222を含むこともでき、抵抗性、容量性、表面音響波(SAW)、赤外線、レーダ、又は他の技術を用いてタッチ及び/又はジェスチャを検知することができる。
【0043】
プロジェクタ226は、遠隔の壁又は遠隔画面などの様々な他の反射物体に画像を投影することができる遠隔手持式プロジェクタ又は一体型プロジェクタとすることができる。
【0044】
ビデオインタフェース220は、静止画像、ビデオセグメント、赤外線ビデオなどのビデオ画像を取り込むよう構成することができる。例えばビデオインタフェース220は、デジタルビデオカメラ、ウェブカメラなどに結合することができる。ビデオインタフェース220は、レンズ、画像センサ、及び他の電子機器を含むことができる。画像センサは、相補型金属酸化膜半導体(CMOS)集積回路、電荷結合素子(CCD)、又は光を検知するための様々な他の集積回路を含むことができる。
【0045】
キーパッド230は、ユーザからの入力を受信するよう構成された様々な入力デバイスを含むことができる。例えばキーパッド230は、プッシュボタン数字ダイヤル、又はキーボードを含むことができる。キーパッド230は、画像の選択及び送信に関連付けられるコマンドボタンを含むこともできる。
【0046】
照明器232は、ステータス指示を提供する及び/又は光を提供することができる。照明器232は、特定の期間に又は事象メッセージに応答してアクティブのままにすることができる。例えば、照明器232がアクティブである場合、クライアントコンピュータが給電される間はキーパッド230のボタンをバックライトしてオンに留まることができる。照明器232は、別のクライアントコンピュータをダイヤルするなどの特定の動作が実行された場合に様々なパターンでこれらのボタンをバックライトすることができる。照明器232は、動作に応答してクライアントコンピュータの透明な又は半透明なケース内に位置付けられた光源を明るくすることができる。
【0047】
クライアントコンピュータ200は、キー、デジタル証明、パスワード、パスフレーズ、2因子認証情報などのセキュリティ/暗号情報を生成、格納及び/又は使用するための追加の不正使用できないセーフガードを提供するHSM224を含むこともできる。一部の実施形態では、ハードウェアセキュリティモジュールを用いて、1又は2以上の標準的公開鍵インフラストラクチャ(PKI)を支援することができ、鍵ペアなどを生成、管理、及び/又は格納するために利用することができる。一部の実施形態では、HSM224は、独立型コンピュータとすることができ、他のケースでは、HSM224をクライアントコンピュータに追加できるハードウェアカードとして構成することができる。
【0048】
クライアントコンピュータ200は、外部周辺デバイス又は他のクライアントコンピュータ及びネットワークコンピュータなどの他のコンピュータと通信するための入力/出力インタフェース216を含むこともできる。周辺デバイスは、音声ヘッドセット、仮想現実ヘッドセット、ディスプレイ画面グラス、遠隔スピーカシステム、遠隔スピーカ及びマイクロフォンシステムなどを含むことができる。入力/出力インタフェース216は、ユニバーサルシリアルバス(USB)、赤外線、Wi-Fi(商標)、WiMax、Bluetooth(登録商標)などの1又は2以上の技術を用いることができる。
【0049】
入力/出力インタフェース216は、ジオロケーション(例えば、GPS)を決定する、電力状態をモニタする(例えば、電圧センサ、電流センサ、周波数センサなど)、天気をモニタする(例えば,サーモスタット、バロメータ、風力計、湿度検出器、降水スケールなど)ための1又は2以上のセンサを含むこともできる。センサは、クライアントコンピュータ200の外部にあるデータを収集及び/又は測定する1又は2以上のハードウェアセンサとすることができる。
【0050】
触覚インタフェース242は、クライアントコンピュータのユーザに触知性フィードバックを提供するよう構成することができる。例えば、触覚インタフェース242を用いて、コンピュータの別のユーザが呼び出している場合に特定の方法でクライアントコンピュータ200を振動させることができる。温度インタフェース240を用いて、温度測定入力及び/又は温度変更出力をクライアントコンピュータ200のユーザに提供することができる。オープンエアジェスチャインタフェース238は、例えば、ユーザによって保持又は身に着けられたコンピュータ内部の単一の又はステレオビデオカメラ、レーダ、ジャイロスコープセンサを用いることによって、クライアントコンピュータ200のユーザの物理的ジェスチャーを検知することができる。カメラ218を用いて、クライアントコンピュータ200のユーザの物理的な眼の動きを追跡することができる。
【0051】
GPS送受信機236は、一般的に緯度及び経度値として位置を出力する地球の表面上のクライアントコンピュータ200の物理座標を決定することができる。GPS送受信機236は、限定ではないが、三角測量、支援GPS(AGPS)、拡張観測時間差分(E-OTD)、セル識別子(CI)、サービスエリア識別子(SAI)、拡張タイミングアドバンス(ETA)、基地局サブシステム(BSS)などを含む他のジオポジショニング機構を用いて、地球の表面上のクライアントコンピュータ200の物理的位置を決定することができる。異なる条件下で、GPS送受信機236は、クライアントコンピュータ200の物理的位置を決定できることを理解されたい。しかし1又は2以上の実施形態では、クライアントコンピュータ200は、他の構成要素を介して、例えば、媒体アクセス制御(MAC)アドレス、IPアドレスなどを含むクライアントコンピュータの物理的位置を決定するために用いることができる他の情報を提供することができる。
【0052】
ヒューマンインタフェース構成要素は、クライアントコンピュータ200への遠隔入力及び/又は出力を可能にするクライアントコンピュータ200から物理的に分離した周辺デバイスとすることができる。例えば、ディスプレイ228又はキーパッド230などのヒューマンインタフェース構成要素を介してここで説明するようにルーティングされる情報を、代わりにネットワークインタフェース210を介して遠隔に位置付けられた適切なヒューマンインタフェース構成要素にルーティングすることができる。遠隔とすることができるヒューマンインタフェース周辺構成要素の例は、限定ではないが、音声デバイス、ポインティングデバイス、キーパッド、ディスプレイ、カメラ、プロジェクタなどを含む。これらの周辺構成要素は、Bluetooth(商標)、Zigbee(商標)などのピコネットワークを通じて通信することができる。このような周辺ヒューマンインタフェース構成要素を備えたクライアントコンピュータの1つの制限ではない例は、ウェアラブルコンピュータであり、別々に位置付けられたクライアントコンピュータと遠隔で通信する1又は2以上のカメラと共に遠隔ピコプロジェクタを含み、壁又はユーザの手などの反射された表面にピコプロジェクタによって投影された画像の部分に向けてユーザのジェスチャを検知することができる。
【0053】
メモリ204は、RAM、ROM、及び/又は他の種類のメモリを含むことができる。メモリ204は、コンピュータ可読命令、データ構造、プログラムモジュール又は他のデータなどの情報のストレージのためのコンピュータ可読ストレージ媒体(デバイス)の例を示す。メモリ204は、クライアントコンピュータ200の低レベル作動を制御するBIOS236を格納することができる。メモリは、クライアントコンピュータ200の作動を制御するオペレーティングシステム248を格納することもできる。この構成要素は、UNIXのバージョン、又はLINUX(商標)などの汎用オペレーティングシステム、又はWindowsPhone(商標)などの特定クライアントコンピュータ通信オペレーティングシステム、又はSymbian(登録商標)オペレーティングシステムを含むことができることが理解されるであろう。オペレーティングシステムは、Java(登録商標)アプリケーションプログラムを介してハードウェア構成要素及び/又はオペレーティングシステム作動の制御を可能にするJava仮想機械モジュールを含むことができるか、又はこれに接続することができる。
【0054】
メモリ204は、とりわけ、アプリケーション252及び/又は他のデータを格納するためにクライアントコンピュータ200によって利用できる1又は2以上のデータストレージ250を含むことができる。例えば、データストレージ250を用いて、クライアントコンピュータ200の様々な機能を記述する情報を格納することができる。様々な実施形態の1又は2以上では、データストレージ250は位置情報251を格納することができる。情報251は、通信中のヘッダの一部として送信される、要求に応じて送信されるなどを含む多種多様な方法の様々な方法に基づいて別のデバイス又はコンピュータに提供することができる。データストレージ250を用いて、アドレスブック、バディリスト、エイリアス、ユーザプロファイル情報などを含むソーシャルネットワーキング情報を格納することができる。データストレージ250は、プロセッサ202などのプロセッサによって使用するプログラムコード、データ、アルゴリズムなどを含み、動作を実行及び行うことができる。1実施形態では、データストレージ250の少なくとも一部を、限定されないが、非一時的プロセッサ可読固定ストレージデバイス212、プロセッサ可読取り外し可能ストレージデバイス214、又はクライアントコンピュータの外部にあるものを含むクライアント構成要素200の別の構成要素に格納することができる。
【0055】
アプリケーション252は、クライアントコンピュータ200によって実行された場合に、命令及びデータを送信、受信、及び/又はそうでなければ処理するコンピュータ実行可能命令を含むことができる。アプリケーション252は、例えば、位置決定クライアントエンジン254、他のクライアントエンジン256、ウェブブラウザ258などを含むことができる。クライアントコンピュータは、問合せ、サーチ、メッセージ、通知メッセージ、事象メッセージ、警報、性能尺度、ログデータ、API呼び出し、これらの組み合わせなどの通信を、アプリケーションサーバ、ネットワークファイルシステムアプリケーション、及び/又はストレージ管理アプリケーションと交換するよう構成することができる。
【0056】
ウェブブラウザエンジン226は、ウェブページ、ウェブベースのメッセージ、グラフィクス、テキスト、マルチメディアなどを受信及び送信するよう構成することができる。クライアントコンピュータのブラウザエンジン226は、無線アプリケーションプロトコルメッセージ(WAP)などを含む様々なプログラミング言語をバーチャルで利用することができる。1又は2以上の実施形態では、ブラウザエンジン258は、手持式デバイスマークアップ言語(HDML)、無線マークアップ言語(WML)、WMLスクリプト、Javaスクリプト、標準的一般化マークアップ言語(SGML)、ハイパーテキストマークアップ言語(HTML)、拡張可能マークアップ言語(XML)、HTML5などを用いることができる。
【0057】
アプリケーションプログラムの他の例は、カレンダー、サーチプログラム、電子メールクライアントアプリケーション、IMアプリケーション、SMSアプリケーション、ボイス・オーバー・インターネット・プロトコル(VOIP)アプリケーション、コンタクトマネージャ、タスクマネージャ、トランスコーダ、データベースプログラム、ワードプロセッシングプログラム、セキュリティアプリケーション、スプレッドシートプログラム、ゲーム、サーチプログラムなどを含む。
【0058】
加えて、1又は2以上の実施形態(図示せず)では、クライアントコンピュータ200は、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルアレイ論理(PAL)など、又はこれらの組み合わせなどのCPUの代わりに組み込み式論理ハードウェアデバイスを含むことができる。組み込み式論理ハードウェアデバイスは、組み込まれた論理を直接実行して動作を行うことができる。1又は2以上の実施形態(図示せず)では、クライアントコンピュータ200は、CPUの代わりにハードウェアマイクロコントローラを含むことができる。1又は2以上の実施形態では、マイクロコントローラは、それに固有の組み込まれた論理を直接実行して動作を行い、それに固有の内部メモリ及びそれに固有の外部入力及び出力インタフェース(例えば、ハードウェアピン及び/又は無線送受信機)にアクセスして、システムオンチップ(SOC)などの動作を実行することができる。
【0059】
例示的なネットワークコンピュータ
図3は、様々な実施形態の1又は2以上を実施する例示的システムに含めることができる例示的ネットワークコンピュータ300の1実施形態を示す。ネットワークコンピュータ300は、
図3に示したものより多い又は少ない構成要素を含むことができる。しかし、図示した構成要素は、これらの革新を実践する例示的な実施形態を開示するのに十分である。ネットワークコンピュータ300は、デスクトップコンピュータ、ラップトップコンピュータ、サーバコンピュータ、クライアントコンピュータなどを含むことができる。ネットワークコンピュータ300は、例えば、
図1のシステム100のラップトップコンピュータ112、スマートフォン/タブレット114、及び/又はコンピュータ110の1又は2以上の1つの実施形態を表すことができる。
【0060】
図3に示すように、ネットワークコンピュータ300は、バス306を介してメモリ304と通信することができるプロセッサ302を含む。一部の実施形態では、プロセッサ302は、1又は2以上のハードウェアプロセッサ、又は1又は2以上のプロセッサコアを含むことができる。場合によっては、1又は2以上のプロセッサの1又は2以上は、本明細書で説明するものなどの1又は2以上の特定の動作を実行するよう設計された特定のプロセッサとすることができる。ネットワークコンピュータ300は、電源308、ネットワークインタフェース310、プロセッサ可読固定ストレージデバイス312、プロセッサ可読取り外し可能ストレージデバイス314、入力/出力インタフェース316、GPS送受信機318、ディスプレイ320、キーボード322、音声インタフェース324、ポインティングデバイスインタフェース326、及びHSM328を含む。電源308はネットワークコンピュータ300に電力を供給する。
【0061】
ネットワークインタフェース310は、ネットワークコンピュータ300を1又は2以上のネットワークに結合する回路を含み、限定されないが、オープンシステム相互接続モデル(OSIモデル)、グローバル・システム・フォー・モバイル・コミュニケーション(GSM)、符号分割多元接続(CDMA)、時分割多元接続(TDMA)、ユーザデータグラムプロトコル(UDP)、送信制御プロトコル/インターネットプロトコル(TCP/IP)、ショートメッセージサービス(SMS)、マルチメディアメッセージングサービス(MMS)、ジェネラルパケットラジオサービス(GPRS)、WAP、超広帯域(UWB)、IEEE802.16ワールドワイド・インターオペラビリティ・フォー・マイクロウェーブ・アクセス(WiMax)、セッション初期化プロトコル/リアルタイムトランスポートプロトコル(SIP/RTP)、又は多種多様な他の有線及び無線通信プロトコルの様々なプロトコルを含む1又は2以上の通信プロトコル及び技術と共に使用するよう構成される。ネットワークインタフェース310は、送受信機、送受信デバイス、又はネットワークインタフェースカード(NIC)として公知であることがある。ネットワークコンピュータ300は、基地局(図示せず)と、又は別のコンピュータと直接に任意選択的に通信することができる。
【0062】
音声インタフェース324は、人間の声の音などの音声信号を生成及び受信するよう構成される。例えば音声インタフェース324は、スピーカ及びマイクロフォン(図示せず)に結合して、他者とのテレコミュニケーションを可能にする及び/又はある動作に対する音声肯定応答を生成することができる。音声インタフェース324のマイクロフォンを、例えば音声認識を用いてネットワークコンピュータ300への入力又はこの制御に使用することができる。
【0063】
ディスプレイ320は、液晶ディスプレイ(LCD)、ガスプラズマ、電子インク、発光ダイオード(LED)、有機LED(OLED)、又はコンピュータと共に使用することができる光反射又は光透過型ディスプレイの様々な他の種類とすることができる。ディスプレイ320は、壁又は他の物体に画像を投影することができる手持式プロジェクタ又はピコプロジェクタとすることができる。
【0064】
ネットワークコンピュータ300は、
図3に図示していない外部デバイス又はコンピュータと通信する入力/出力インタフェース316を含むこともできる。入力/出力インタフェース316は、USB(商標)、ファイヤウォール(商標)、Wi-Fi(商標)、WiMax、Thunderbolt(商標)、赤外線、Bluetooth(商標)、Zigbee(商標)、シリアルポート、パラレルポートなどの1又は2以上の有線又は無線通信技術を用いることができる。
【0065】
入力/出力インタフェース316は、ジオロケーション情報(例えば、GPS)を決定する、電力状態をモニタする(例えば、電圧センサ、電流センサ、周波数センサなど)、天気をモニタする(例えば、サーモスタット、バロメータ、風力計、湿度検出器、降水量スケールなど)のための1又は2以上のセンサを含むこともできる。センサは、ネットワークコンピュータ300の外部のデータを収集及び/又は測定する1又は2以上のハードウェアセンサとすることができる。ヒューマンインタフェース構成要素は、ネットワークコンピュータ300から物理的に分離することができ、ネットワークコンピュータ300への遠隔入力及び/又は出力を可能にする。例えば、ディスプレイ320又はキーボード322などのヒューマンインタフェース構成要素を介して本明細書で説明するようにルーティングされる情報を、代わりにネットワークインタフェース310を介してネットワークの他の場所に位置付けられた適切なヒューマンインタフェース構成要素にルーティングすることができる。ヒューマンインタフェース構成要素は、コンピュータがコンピュータのヒューマンユーザから入力を取るか又は出力を送信するのを可能にする様々な構成要素を含む。従って,マウス、スタイラス、トラックボールなどのポインティングデバイスは、ポインティングデバイスインタフェース326を介して通信しユーザ入力を受信することができる。
【0066】
GPS送受信機318は、一般的に緯度及び経度値として位置を出力する地球の表面上のネットワークコンピュータ300の物理座標を決定することができる。GPS送受信機318は、限定ではないが、三角測量、支援GPS(AGPS)、拡張観測時間差(E-OTD)、セル識別子(CI)、サービスエリア識別子(SAI)、拡張タイミングアドバンス(ETA)、基地局サブシステム(BSS)などを含む他のジオポジショニング機構を用いて、地球の表面上のネットワークコンピュータ300の物理的位置を決定することができる。異なる条件下でGPS送受信機318がネットワークコンピュータ300の物理的位置を決定できることを理解されたい。しかし1又は2以上の実施形態では、ネットワークコンピュータ300は、他の構成要素を介して、例えば媒体アクセス制御(MAC)アドレス、IPアドレスなどを含むクライアントコンピュータの物理的位置を決定するために用いることができる他の情報を提供することができる。
【0067】
メモリ304は、ランダムアクセスメモリ(RAM)、読取り専用メモリ(ROM)、及び/又は他の種類のメモリを含むことができる。メモリ304は、コンピュータ可読命令、データ構造、プログラムモジュール又は他のデータなどの情報のストレージのためのコンピュータ可読ストレージ媒体(デバイス)の例を示す。メモリ304は、ネットワークコンピュータ300の低レベルの作動を制御する基本入力/出力システム(BIOS)330を格納する。メモリは、ネットワークコンピュータ300の作動を制御するオペレーティングシステム332を格納する。この構成要素は、UNIX(登録商標)のあるバージョン、又はLINUX(商標)などの汎用オペレーティングシステム、又はMicrosoft社のWindows(登録商標)オペレーティングシステム、又はApple社のIOS(登録商標)オペレーティングシステムなどの特定用途オペレーティングシステムを含むことができる。オペレーティングシステムは、Javaアプリケーションプログラムを介したハードウェア構成要素及び/又はオペレーティングシステム作動の制御を可能にするJava仮想機械モジュールを含むか又はこれに接続することができる。同様に、他のランタイム環境も含めることができる。
【0068】
メモリ304は、とりわけ、アプリケーション336及び/又は他のデータを格納するためにネットワークコンピュータ300によって用いることができる1又は2以上のデータストレージ334を含むことができる。例えばデータストレージ334は、ネットワークコンピュータ300の様々な機能を記述する情報を格納するために用いることもできる。様々な実施形態の1又は2以上では、データストレージ334は位置情報335を格納することができる。通信中にヘッダの一部として送信、要求時に送信などを含む多種多様な方法の様々な方法に基づいて位置情報335を別のデバイス又はコンピュータに提供することができる。データストレージ334を用いて、アドレスブック、バディリスト、エイリアス、ユーザプロファイル情報などを含むソーシャルネットワーキング情報を格納することができる。データストレージ334は、プロセッサ302などの1又は2以上のプロセッサによって使用するプログラムコード、データ、アルゴリズムなどを含み、以下に説明する動作などの動作を実行且つ実施することができる。1実施形態では、データストレージ334の少なくとも一部を、限定されないが、非一時的プロセッサ可読固定ストレージデバイス312、プロセッサ可読取り外し可能ストレージデバイス314、又はネットワークコンピュータ300内の様々な他のコンピュータ可読ストレージデバイス、又はネットワークコンピュータ300外部を含むネットワークコンピュータ300の別の構成要素に格納することもできる。
【0069】
アプリケーション336は、ネットワークコンピュータ300によって実行された場合に、メッセージ(例えば、SMS、マルチメディアメッセージングサービス(MMS)、インスタントメッセージ(IM)、電子メール、及び/又は他のメッセージ)、音声、ビデオを送信、受信、及び/又はそうでなければ処理するコンピュータ実行可能命令を含むことができ、別のモバイルコンピュータの別のユーザとのテレコミュニケーションを可能にする。アプリケーションプログラムの他の例は、カレンダー、サーチプログラム、電子メールクライアントアプリケーション、IMアプリケーション、SMSアプリケーション、ボイスオーバーインターネットプロトコル(VOIP)アプリケーション、コンタクトマネージャ、タスクマネージャ、トランスコーダ、データベースプログラム、ワードプロセッシングプログラム、セキュリティアプリケーション、スプレッドシートプログラム、ゲーム、サーチプログラムなどを含む。アプリケーション336は、以下に説明する動作を実行する位置決定エンジン346を含むことができる。様々な実施形態の1又は2以上では、アプリケーションの1又は2以上を別のアプリケーションのモジュール及び/又は構成要素として実施することができる。様々な実施形態の1又は2以上では、オペレーティングシステム拡張、モジュール、プラグインなどとしてアプリケーションを実施することができる。
【0070】
様々な実施形態の1又は2以上では、位置決定エンジン346をクラウドベースのコンピューティング環境で作動することができる。様々な実施形態の1又は2以上では、これらのアプリケーション及びその他を、クラウドベースのコンピューティング環境で管理することができる仮想機械及び/又は仮想サーバ内で実行することができる。様々な実施形態の1又は2以上では、本文脈においてアプリケーションはクラウドベースの環境内の1つの物理的ネットワークコンピュータから、クラウドコンピューティング環境によって自動的に管理される性能及びスケーリング検討事項に応じた別の物理的ネットワーク環境に流れることができる。同様に、様々な実施形態の1又は2以上では、位置決定エンジン346専用の仮想機械及び/又は仮想サーバを自動的に配備及び配備を外すことができる。
【0071】
様々な実施形態の1又は2以上では、位置決定エンジン346などを、1又は2以上の特定の物理的ネットワークコンピュータに結び付けられる以外のクラウドベースのコンピューティング環境で実行される仮想サーバに位置付けることができる。
【0072】
ネットワークコンピュータ300は、キー、デジタル証明、パスワード、パスフレーズ、2因子認証情報などのセキュリティ/暗号情報を生成、格納及び/又は使用する追加の不正使用防止安全装置を提供するHSM328を含むことができる。一部の実施形態では、ハードウェアセキュリティモジュールを用いて、1又は2以上の標準的公開鍵インフラストラクチャ(PKI)を支援することができ、鍵ペアなどを生成、管理、及び/又は格納するために用いることができる。一部の実施形態では、HSM328を独立型ネットワークコンピュータとすることができ、他の例では、HSM328を、ネットワークコンピュータにインストールできるハードウェアカードとして構成することができる。
【0073】
加えて、1又は2以上の実施形態(図に示していない)では、ネットワークコンピュータは、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルアレイ論理(PAL)などの1又は2以上のCPUの代わりに1又は2以上の組み込み式論理ハードウェアデバイスを含むことができる。組み込み式論理ハードウェアデバイスは、組み込み式論理を直接実行して動作を行うことができる。1又は2以上の実施形態(図示せず)では、ネットワークコンピュータは、CPUの代わりに1又は2以上のハードウェアマイクロコントローラを含むことができる。1又は2以上の実施形態では、1又は2以上のマイクロコントローラは、それに固有の組み込み式論理を直接実行して動作を行い、それに固有の内部メモリ及びそれに固有の外部入力及び出力インタフェース(例えば、ハードウェアピン及び/又は無線送受信機)にアクセスして、システムオンチップ(SOC)などの動作を実行することができる。
【0074】
例示的なシステム
図4Aは、送信機104及びカメラ106a、106b、106c、106dを含むシステム100の一部分を示している。(「カメラ」及び「受信機」という語は、他に指示がない限り本明細書では同義に用いられる。)システム100は、1つの時間に1又は2以上の目標108の1つのボクセルを順次的に照明する。
図4Aに示すように、走査されたボクセル照明が複数のカメラ106a、106b、106c、106dによって取り込まれるか又は検出され、ピクセルデータの幾つかのボクセル照明同期化ストリームをシステムコンピュータデバイス110(
図1)などの中央処理システムに流すことができる。物体108の単一のボクセルの照明に関連付けられる、各時間期間t(又はt+1又はt-1)に、カメラ106a、106b、106c、106dの各々は、目標108のボクセルから散乱された光を検出して、検出位置、例えば、光が検出されるカメラのアレイにおけるi番目のカメラの(x
i、y
i)を提供する。例えば、時間tにおいて、4つのカメラ106a、106b、106c、106dは、
図4に示すようにt+1及びt-1及び他の時間期間にて類似のセットを備えた位置のセット[x
1,y
1]t、[x
2,y
2]t、[x
3,y
3]t、[x
4,y
4]tを生成することができる。
【0075】
各時間期間tは、物体108の単一のボクセルの照明がカメラの各々によって受け取られると予想される時間の長さに対応する。時間期間tの長さは、少なくとも一部には、カメラの間の距離に基づいて選択することができる。例えば、10ナノ秒の時間期間は、4つのカメラの中心の間の相対的距離が10フィートより短い(又は3メートルより短い)場合のカメラのセットに用いることができる。一部の実施形態では、時間期間tは、複数のカメラのクローズインタイム検出事象のセットが送信機104による単一のボクセルの照明に関連付けられるように選択される。少なくとも一部の実施形態では、時間期間tは、少なくとも1、5、10、15、20、25、40、50、又は100ナノ秒又はそれ以上である。物体108の各ボクセルを順次的且つ個々に照明することによって、各照明されるボクセルは、複数のカメラの空間的に分離された検出事例のセットに時間的に関連付けられる。これらの検出事例を用いて、ボクセルの位置を決定することができる。ボクセルは迅速且つ個々に観測することができる。
【0076】
検出位置のセットは、システムコンピュータデバイス110などの中央処理システムに送信され、該中央処理システムは、複数のカメラからの検出位置のこれらのストリームを組み合わせてコンピュータ的に(例えば、一連の行列乗算によって)組み合わせ、カメラからの複数のピクセルストリーム(好ましくは最小待ち時間を持つ)を、例えばダウンストリーム知覚システムに直接フィードすることができる単一のボクセルフロー(例えば、物体108のボクセルの(xa、ya、za)などの物体108の照明されたボクセルの位置の流れ)に融合させる。
【0077】
図4Bは、ボクセルの位置を決定する方法の1つの実施形態を示す。ステップ402にて、送信機104は物体108のボクセルを照明する。ボクセルは、カメラ106a、106b、106c、106dによって受信される光を反射する(か又はそうでなければ散乱する)。ステップ404にて、システムコンピュータデバイスが、ボクセルによって反射されたフォトンを検出したピクセルに対するカメラからのアレイ位置を受信する。ステップ406にて、ボクセルの位置が、受信されたアレイ位置から決定される。ステップ408にて、追加のボクセルが観測されるかどうか決定される。観測される場合、ステップ402-406がボクセルの各々に対して繰り返される。多数のピクセル事象(例えば、期間内にトゥイッチする3又は4以上のピクセル)がカメラによって検出される限り、この処理は自動的に反復を継続することができる。
【0078】
図5は、光源からの走査ビーム(例えば、狭くコリメートされたピクセルサイズのレーザビーム)が特定の容積測定空間セクション(走査コーン)全体を走査する3つのカメラ106a、106b、106cを備えた構成を示している。物体の空間マニホールド(3D形状表面)は走査された軌跡の少なくとも一部分を反射する。
図5では、走査ビームが、時間t
1、t
2、t
3及びt
4それぞれに4つのポイントP
1、P
2、P
3及びP
4を照明する。3D表面の4つのポイントは、カメラ投影中心O
1、O
2及びO
3に位置付けられた3つのカメラに向けてビームの一部分を反射する。各ポイントPから、これらのカメラ中心の各々に対する1つのチーフレイが存在する。12のこのようなチーフレイが存在する。これらのチーフレイは12のピクセル位置のカメラに投影する:P
1’、P
2’、P
3’、P
4’、P
1’’、P
2’’、P
3’’、P
4’’、P
1’’’、P
2’’’、P
3’’’及びP
4’’’。3つのカメラによって取り込まれたこれらの12の離散的な位置は、カメラ中心の全位置及び4つの3DポイントP
1、P
2、P
3及びP
4を導くのに十分である。例として、これらの12のセンサ座標ペアは、フル三焦点テン
ソルの27の要素(3x3x3行列)を得るのに十分である。
【0079】
この順次的に照明は、これまでマルチビューシステムのコンピュータ的にボトルネックであった密度対応問題を取り除くことによって、従来のビューイングと比較して複雑系解決のコンピュータ的な簡便手法を開拓している。このボクセル順次システム100の少なくとも一部の事例では、余分のセンサデータが、物体及び表面の外観、モーション、方は形状、又はこれらの何れかの組み合わせなどの3Dリアリティの顕著な構造的態様を決定するための統計的及びAI方法を好むので、追加のカメラ(又は冗長観測者)の付加が実際にはコンピュータ的な複雑さを低減し、システムの堅牢性を向上させ且つシステム精度を上げることができる。システムにカメラを追加することによって追加の観測を結果として生じ、照明を必要とすることなくシステムを更に堅牢且つ正確にする点に留意されたい。
【0080】
少なくとも一部の実施形態では、システム100は、厳密に定義された3Dエッジ、並びに物体の3D位置、速度及び加速度を配信することができ、アートカメラ解像度の状態で等しく細粒の画像ピクセルデータ(例えば、RGB画像コントラスト機能)に一致(例えば、融合)できる細粒のボクセルモーションデータをもたらすことができる。
【0081】
少なくとも一部の実施形態では、ピクセル及び視野(例えば、カメラ又は受信機)が3Dリアリティの堅牢な知覚を結果として生じる。増分的視野によって提供される追加のデータストリームは、新しいレベルのコンピュータ的決定論を可能にすることができる。システム100の少なくとも一部の実施形態では、追加のビュー(例えば、カメラ又は受信機)の付加は、ビューの間の高程度のオーバーラップを結果として生じる。このオーバーラップは、オクルージョンを低減し、カメラポーズ推定及び物体モーション追跡を向上させ、モーションの連続性を向上させ、且つ量子化エラー及び他のサンプリングアーティファクトなどのシステムノイズを低減することができる。
【0082】
データフローをストリームラインし且つボトルネックアップストリームを取り除くことによって、システム100は、高解像度カメラを用いてカメラ視野におけるオーバーラップの大きな角度を利用することができる。オーバーラップの角度、すなわち3Dビュースペースにおける照明されたボクセルを同時に見るカメラの数は、各照明されたボクセルに対して自動的に設定される。多くの従来のシステムを超える本システムの知覚利点は直感的な感覚を作り、従来のマルチビューセットアップでは、デジタルカメラの各々は、微妙な連続(アナログ)3D光フィールドを2Dカラーコントラストの単純に離散的且つ粗くラスターされたバイヤーパターンモザイクに低減し、これによって道に沿った量子化エラーのホストを固有に導入する。加えて、検知された物体とカメラの間の何れの高速相対モーションも、ぼけ及びセンサノイズを起こす。較正ドリフト又は不十分な光学が更なる組織的なエラーを持ち込むことがある。
【0083】
システム100などのピクセル順次的照明システムでは、各ボクセルは、制限された時間、例えば、1-10ナノ秒の走査レーザによって照明される。この超短強力照明露出は、モーションのぼけ及びフォトンスターベーションを取り除くことができ、システムが高空間的並びに時間的解像度を備えた特徴を追跡するのを可能にする。例えば、少なくとも一部の実施形態では、1秒当たり最大100万程度の回転速度(1/100度回転/10ナノ秒の期間にわたって観測)を観測することができる。
【0084】
複数のカメラに渡る観測されたピクセル位置のマッチングは、順次的に照明されたボクセル毎にN個の同時(又はほぼ同時)視野をもたらす。この構成を用いて、システム100は、高ボクセルデータレートで極めて正確な3D位置検出を効率的に達成することができる。
【0085】
カメラを追加すると、視野が追加される。これらの追加の同時観測により、サンプリングエラーを低減することができる。少なくとも一部の実施形態では、追加されたカメラは、セットアップ又は何れかの特定のアラインメント又は較正を必要としない。少なくとも一部の実施形態では、カメラ位置は、時間の経過に伴って幾何学的に安定である必要はない。これらカメラは、例えばウィング又はフレームストラットなどの変形可能又は振動する構造体に取り付けることができる。
【0086】
少なくとも一部の実施形態では、カメラの内部較正は、追加のポイント観測によって達成することができる。少なくとも一部の実施形態では、カメラの内部(本質的な)特性(光学系及び歪み)を事前に知る必要はない。多くの観測によって、このような特性を決定することができる。
【0087】
少なくとも一部の実施形態では、システム100は、カメラ又は受信機(例えば、飛行しているカメラを装備したクアドコプターの小さな群れ)として移動観測者を可能にする。これらの移動カメラを用いて、走査プローブビームによって照明された複雑な動的3Dシーン(3Dシーンのスポットが順次的に照明される場合)を観測し、例えば1秒当たり1億ボクセルの検出速度(又は、各ボクセルに関連付けられる時間tに関係付けることができる早い又は遅い検出速度)で詳しくこのような3Dシーンを正確にマップすることができる。
【0088】
一般的に、システム100は、N個のカメラ(又は他の光受信機又は検出器)を包含し、Nは少なくとも2又は3であり、4、5、6、7、8、10、12、15、20、又はこれより多いか又は他の何れかの数とすることができる。システム100は、1つのレーザビームなどの光源を備えた送信機104を含み、スペースのセクションをビームアウト及び横断するフォトンのレイを用いて視野を照明する。このフォトンのレイ又はビームは、例えば、2つの座標、すなわち、方位角(α)及び仰角(ε)によって定められる同時ポインティング方向を有する。これらの2つの角座標は、(i)走査システムによって制御することができ、又は(ii)全てが引用により本明細書に組み入れられる米国特許第8,282,222、8,430,512及び8,696,141に記載されるような視覚フィードバックループのある種類によって観測(追跡)することができ、又は(iii)これらの座標は制御又は追跡しなくてもよい。少なくとも一部の実施形態では、何れかの時間での何れかのカメラのビューにおいて、物体108の表面上の領域(例えば、ボクセル)によってレーザビームの反射として生じる1つだけの照明スポットが存在する。本発明のシステムは、スペース内のほとんど1つの位置P(t)の何れかの瞬間に(例えば、物体108上の領域又はボクセル)がプロービングビームを反射するように動作するのが好ましい。ポイントがこのカメラの視野内に入り、この方向の反射される光が検出するのに十分強い、すなわち十分なフォトンがカメラのピクセルの少なくとも1つに達した場合に、Nカメラの何れも、ポイントPでこの反射ビームを観測することができる。
【0089】
少なくとも一部の実施形態では、各カメラは、即座に又はほぼ即座に(例えば、上述の時間期間tの1/10又は1/100未満の時間に)光を検出するよう構成される。何れかの適切なピクセル化カメラを含む何れかの適切なカメラを用いることができる。ピクセル化カメラの例は、限定されないが、空間-時間並べ替えアレイ(SSA)として、例えば、到着の方向及び時間の両方を記録する高速非同期SPAD(単一フォトンアバランシェダイオード)ピクセルのアレイとして配列されたピクセルを含む。SSAアレイの例は、米国特許第8,282,222号、第8,430,512号、及び第8,696,141号で見出すことができ、これら全てはその全体が引用により本明細書に組み入れられる。空間-時間並べ替えアレイは、入射レイ方向、個々のピクセルとの入射方向のマッチング小バンドルを空間的に量子化する画像化システムの焦点面に位置付けられた検出器アレイを有するカメラに類似することができる。SSAは、実際には2Dアレイのピクセル又は代替として、全ての全体が引用により本明細書に組み入れられる米国特許第8,282,222号、8,430,512号、8,696,141号、8,711,370号、9,377,553号、9,753,126号及び米国特許出願公開第2013/0300637及び2016/0041266に記載される非同期検知アレイの何れかを備えたカメラとすることができる。カメラは、少なくともピクセルの二次元(2D)アレイを含む。ピクセルは、能動ピクセルセンサ(APS)、電荷結合素子(CCD)、単一フォトンアバランシェ検出器(SPAD)(アバランシェモード又はガイガーモードで作動)、相補型金属酸化膜半導体(CMOS)デバイス、シリコン光電子倍増管(SiPM)、光電池セル、光トランジスタ、トゥイッチーピクセルなどの1又は2以上などの様々なフォトン検知技術を含むことができる。フォトン検出器は1又は2以上の入射光ビームを検出することができる。全体が引用により本明細書に組み入れられる米国特許第9,753,125号は、光電流が最小レベルを超えた状態でほぼ即時の信号出力を提供するセンサアレイピクセルとして「トゥイッチーピクセル」を記載している。例えば、少なくとも一部の実施形態では、「トゥイッチーピクセル」は、光ダイオードの電流を瞬時に増幅するソースフォロワー又は他の回路に接続された光ダイオードとすることができる。増幅された信号は検知線に接続される。検知線は、このような「トゥイッチーピクセル」の全列又は行の間の共有機能とすることができる。ピクセルの基本「トゥイッチ」機能はバイナリであり、その主機能は、信号フォトンがカメラに到着した時間及び/又は場所を報告することである。好ましくは、カメラのピクセルは、「トゥイッチーピクセル」であるか、又は数フォトン又は単一のフォトンの到着を検出又は「オントリガ」することができる高度に敏感なCCD、APD、SPADタイプピクセルである。
【0090】
ビームは連続して照明することができ、空間内でこれら3Dマニホールドを横断するためにビームのFoV内で物体の表面を走査する。少なくとも一部の実施形態では、走査ビームは、急速に、任意選択的に疑似ランダム方式で3D表面を走査することができるが、連続平滑走査方式でFoVのスペースを横断する。
【0091】
代替として、ビームの照明は、急速及び強力な方式でパルス化することができる。例えば、非連続スイープを用いて、空間内でランダムに又は特異的に選ばれた方向で光の「ピンプリック」又はパルスをプローブするか、又は例えばクアドコプターの飛行経路などの関心の一定の方向の周りの陥凹形式を用いて、又は他の何れかの規則的又は不規則なパターンを用いることができる。高速非連続走査システムの例はフェーズドアレイである(例えば、MEMSリボン光学フェーズドアレイ)。
【0092】
例として、10ナノ秒間隔でフォトンの短い100psバーストが送信機104などの走査機構(送信機Tx)によって送出することができる。反射パルスは、既知の間隔(例えば、100ピコ秒(ps))に制限され、アレイの単一のピクセルに一意的にマッチされる。
【0093】
カメラは、連続照明ボクセル位置から反射された光をピクセルが検出した場合にピクセルの位置を順次報告する。一部の実施形態では、ピクセル又はカメラからの報告データは、例えばピクセル位置(例えば、列数及び行数)だけを報告するなどの最小及びバイナリにすることができる。他の実施形態では、例えば、個々のピクセルがフォトンを検出した時のタイムスタンプを含むデータフローを増やすことができる。少なくとも一部の実施形態では、これらのタイムスタンプは、データダウンストリームの限度を超えた事後処理を容易にするか又は正確なモーション補間を提供することになる。
【0094】
カメラから取得できる追加のデータは、各主要なカラー(又はカラーの他の何らかのセット)の強度又は他の情報を含むことができる。この追加情報は、例えば、光強度(フォトン数又は即時ピークフォトン電流強度又は「グレースケール」)のプロキシとして作用する増幅光ダイオード電圧又は電流などのアナログ値の形式で取り込むことができ、任意選択的にカラー強度値(R、G、B、及び/又はM、C、Y、及び/又は1又は2以上のNIR波長)を観測することができる。
【0095】
少なくとも一部の実施形態では、コンピュータデバイス110などの受信システムが、各観測事象の後でほぼリアルタイムで(例えば、ナノ秒以内に)このデータ又は情報を受信する。例として、カメラ1は、時間tのカメラの行j、列iのピクセルの多数のフォトンの到着を、任意選択的に赤、緑、及び青の主カラー強度(又は他のセットの色又は波長)と共に検出する。少なくとも一部の実施形態では、カメラからのデータは、6つの値がデータの1又は2以上のバイト各々にすることができる検出ベクトル[カメラ#,i,j,t,r,g,b]を含むことができる。
【0096】
図6Aは、システム100の一部分の1つの実施形態を示す。走査送信機104によって生成された密にコリメートされたレーザプローブビーム(又は他の光源)が、表面S上の位置Pに交差する。ビームによって送出されたフォトンは、t=0の全方向に(例えば、ランバーティアン方式で)反射する。投影中心O
1、O
2、O
3、及びO
4に位置付けられた4つのカメラは各々、数ナノ秒後にこれらの反射の各々からフォトンの小さなバンドルを取り込む。各バンドルは、4つのカメラの各々のアパーチャの中心に入るチーフレイ(CR)を有する。CR
1は第1カメラに入り、t1で列番号700及び行番号500に着地する。他の3つのカメラは同様に、10ナノ秒ウィンドウ内の事象を記録する。
【0097】
従って、表面S上のスポットPから反射された光は、4つのベクトルを生成する4つのカメラによって検出される。
カメラ1:(#1、700、500、t1)
カメラ2:(#2、680、250、t2)
カメラ3:(#3、350、250、t3)
カメラ4:(#4、250、500、t4)
【0098】
第1の値はカメラ番号であり、第2の値は列数であり、第3の値は行数であり、第4の値は到着時間である。この例における4つのタイムスタンプは、4つのカメラ中心の間の相対的距離が10フィート未満であるので互いから10ナノ秒以内である。このような4カメラ構成のカメラ間差分時間制限値は、大きな車両上で構成されるシステムでもほぼ同様に成立する点に留意されたい。多くの場合、観測されたフォトンが5ナノ秒の固有のボクセル照明期間に関連付けられるので、カメラ間の相対的距離は5フィート未満になる。4つのカメラで観測される何れのフォトンも、1秒当たり1憶ボクセルの速度で個々に順次的に照明されるボクセルに明確に関連付けられる。
【0099】
カメラの相対的向き及び位置は全ての3つの変数を決定する。観測されたポイントPに向けたカメラの相対的向きは、カメラの現在の中心光軸に対してポイントPから反射するチーフレイの方位角及び仰角によって与えられる。
図6Aでは、ピクセル位置は、センサの各々に示された上部左ピクセル(0,0)からカウントされる。観測される何れの相対的な時間遅延も、フォトンが表面S上のポイントPの反射ボクセルから4つのカメラの各々のピクセルに移動するのに必要なToF(飛行時間)時間の差(1ナノ秒当たりのフィート)を表す。ポイントPのボクセルの照明で終わるフォトンの出発時間を知ることなく、相対的ToF差分は、ポイントPからのカメラの各々の相対的距離を直接伝えることができる。
【0100】
単純な高速走査LIDAR(例えば、本明細書に全体が引用により組み入れられる米国特許出願連番第15/799,149号明細書に記載)の特定の場合に、ポイントPの方位が公知である且つ従って走査送信システムTxによって駆動される光源の最新高速走査軌跡中のパルスの暗黙的出発時間も公知であるので、ポイントPからカメラまでの距離を推定することができる。特定の出発時間を推定することができる。これは、ポイントPの方向に光源及び送信システムTxによって送信される光の送信の最新瞬間である。対照的に、例えばSPADがカメラで使用される場合、ピコ秒精度を持つ極めて正確なパルス到着時間が利用可能である。相対的距離は、フィートではなくセンチメートルの高い精度で決定することができる。これは、観測の時間のカメラの各々の所在を伝える。実際に、4つの観測者間の相対的モーションはナノ秒観測間隔にわたって無視することができる。
【0101】
図6Bに示した4つのビューシステムでは、走査送信システムT
x104及びこの光源が時間の関数tの通りに空間軌跡τ(t)を走査する。T
x104及び光源の位置は事前に公知であるか、又は投影中心O
Tを持つ第5カメラの同等物としてT
x104及び光源を扱う三焦点テン
ソル方法などの幾何学法によって計算することができ、ここで各送信されたレイの方向は電子フィードバック及びT
xの制御から公知である(各受信されたレイの方向がセンサのピクセル位置によって決定されるカメラとは対照的に)。従って、他で説明される幾何学法によって、T
x、O
Tの位置、並びにP、O
1、O
2、O
3及びO
4の位置を決定することができる。最新の走査軌跡τ(t)では、一定の固有の時間tに一定の高速光学走査角度α(t)に対応する固有の走査方向O
tPが存在する。後者の時間tは、時間t
1、t
2、t
3及びt
4に到着する4つの受信カメラによって後で観測されるフォトンの何れかに対する出発の時間t
dである。
【0102】
Pの相対的位置、及び従って方向OtPが幾何学的計算から公知である場合、これらの計算は、Txの走査方向がポイントPの公知の位置に光学的に正確にアラインされることになる瞬間に一致するピコ秒精度によって光源をパルスすることによって、以下のような極めて正確なToF方法によって調整することができる。光源ブリーフ(ピコ秒持続)パルスバースト出発時間はピコ秒で公知になり、ポイントPの反射の後に、4つの到着時間は、(例えば)4つの「トゥイッチーピクセル」のファイヤリングによってピコ秒で等しく解像される(SPAD又は新しいSiPMタイプAPSアバランシェをピコ秒で正確に計ることができる。)。従って、4つのチーフレイ(CR1-4)によって移動される距離をインチに計算することができる(1nsのToFクロック精度=1フィート(約0.3m)、100ps=1インチ(約2.54cm))。
【0103】
少なくとも一部の実施形態では、システム100などのピクセル順次的照明システムは、多くの従来の照明システム(構造化すなわちコード化照明によるフル2Dフレーム又は1D全走査線を用いる構造化光又は能動ステレオシステムなど)に固有の観測の曖昧さを取り除くか又は低減することができる。少なくとも一部の実施形態では、各追加のポイント観測(例えば、各追加のカメラ又は他の受信機)は、カメラの位置、向き及び内在性を本システムが自己較正するのを可能にするために用いることができる知識を追加する。
【0104】
少なくとも一部の実施形態では、1秒当たりの数百万の走査ポイントにより、システム100などのポイント順次的照明システムは、急速に収束し、急速かつ効率的に、観測可能な不変性、観測可能なパターン、現実の堅い又は変形可能な構造を明らかにすることができる。
【0105】
少なくとも一部の実施形態では、機械視野の目的で、脳回神経網(CNN)などのコンピュータ的方法は、これらの結果生じたカメラからの豊富で明白なデータストリームから容易に学習することができる。不変空間図形の数百万の連続観測によってこれらのCNNを訓練することで、これらの新しい機械視野方法は、正確な3Dソリューションを迅速に収束することになる。
【0106】
少なくとも一部の実施形態では、システム100を用いて取得されるポイント順次的に照明の利点は、a)従来のシステムでは空間測定を厳しく制限するモーションのぼけの除去又は低減、及びb)ナノ秒のオーダー(単一の個々のピクセルの露出時間)までの高解像度で時間が測定される事実によるモーション推定精度の追加の程度の1又は2以上を含むことができる。従って、移動物体の追跡又は非剛性(変形可能)時間変化3D表面図形及びモーションを追跡する手順又はアルゴリズム方法は、ボクセル順次的に照明が追加された時に更に正確になる。
【0107】
少なくとも一部の実施形態では、追加のカメラの付加がオクルージョン問題を取り除くか又は低減する。多くの観測を生じる多くの観測者(例えば、カメラ又は他の受信機)は、本システムをオクルージョンに対してより堅牢にする。直感的に、システムにおけるビューポイントが多い程、表面の何れか1つのポイントを観測するための多数のカメラが存在する可能性が高い。深い割れ目及びクレーターが塞がれたままである可能性がある。
【0108】
少なくとも一部の実施形態では、正確なピクセルレベル対応を設定するシステム100などのピクセル順次的照明システムは比較的容易である可能性がある。時間の短い十分なインスタンスにおいて、全入射レイが3Dスペースの同じボクセルから発する。少なくとも一部の事例では、数ナノ秒のスパン内で同時に観測された事象又はほぼ同時に観測された事象は、カメラの位置及び向きを備えた完全な座標セット及び観測されたポイントの3D座標(すなわち、物体上のボクセル)をもたらす。
【0109】
少なくとも一部の実施形態では、システムに追加されるカメラが多い程、同時に取り込まれる視野も多くなり、オクルージョンの発生が減り、表面を早く且つ大きなモーションフィデリティで走査することができ、詳細を短い間隔で走査することができる。カメラが多くなれば、同じボクセル照明から取り込まれるフォトンが多くなり高い信号精度及び高い確実性又は信頼性を観測にもたらすことができる。内壁、建物及び通りなどの非変形可能表面の3D走査は、細かい詳細を累積的に追加し従ってこの結果生じた3Dポイントクラウド画像が急速にフィデリティを取得する。
【0110】
図7A-7Cは、ピクセル順次的照明システムの1つの例示的実施形態を示す。
図7A(側面図)では、運転者が前方経路の物体を運転者の車両の窓から見ている。走査レーザビーム(送信機から)が物体のポイントPを照明する。運転者は、車両の運転者側の窓の内側の反射を介して見える逆反射表面に立体画像を投影することができるヘッドセットなどの頭部装着ディスプレイデバイス(HMD)を身に着けている。(投影された立体画像化経路は
図7Aには示されていない。)AR HUDを生成するためのこのウェアラブルデバイスの使用は、例えば全体が引用により本明細書に組み入れられる米国特許出願公開第2017/0208292の
図15Eに図示された構成に類似である。この図のウェアラブルデバイスは、運転者の車内内側の基準による頭部追跡を示し、前方の道路を観測するためにHi-RES機械視野カメラを用いる。本明細書で説明する新しいシステムは、ボクセル毎に外側の世界を照明するビームを有する。
【0111】
運転者の眼の何れかの側に装着された2つのカメラ(
図7BのR
xL及びR
xR)は、物体上の照明されたボクセルPの広いベースラインビューを見る。運転者の上には、前方の道路を見ることができる第3の高解像度カメラ106がある。第3のカメラは、その高解像度センサの基準面のボクセルPの位置に注目する。合計でボクセルPの3つのビューがあり、従って4つのポイントが物体上で照明された後に、物体位置(物体の表面上の一連のボクセルの位置)とヘッドセット及び高解像度カメラの位置の両方が公知であり、運転者の頭部凝視のかなり正確な向き及び物体の運転者の即座の視野(運転者のHMDの視野)を描写する。従って本発明のシステムは、ユーザの3Dビューボリュームで正確に警告(例えば、「ここに注意!」)などのラベルを位置付けることができる。他のカメラ構成も使用できることが理解されるであろう。
【0112】
図7Bは、バックミラーの前などの高い中心位置に取り付けられた高解像度カメラと同じ構成の上面図を示している。これに代えて、このカメラ又はカメラのアレイを環境の視界をあまり遮らないように車両の上部に取り付けることができる。
図7Cは、組み込み式3Dカメラ(R
xT)の付いた拡張現実タイプヘッドセットを示しており、これによって実際には視野を観測する3つのカメラが存在し(装着者に「沿ってみる」)且つこの視野は小さな穴があり、走査システムの陥凹形式が装着者の注意及び凝視によって駆動され、ヘッドセットの視線追跡センサによって追跡される。
【0113】
図22は、反射されたビーム608を用いて表面114上のプロジェクタ402からの投影(及び投影された画像ビーム606)に対して空間におけるビューワ604の相対的位置の決定を可能にする頭部装着カメラ602を示す。
【0114】
複数の走査ビームを利用することができる。少なくとも一部の実施形態では、カメラの面を区別するのが難しい2つのスポットの反射に空間及び時間で走査軌跡をオーバーラップさせるマニホールド(物体)表面の何れかの部分における相対的に近い近似に同時に現れる2又は3以上のスポットの曖昧さを回避するために注意が払われる。一部の実施形態では、複数の照明スポットを使用した時に、軌跡のようなサーチビームは同じ表面をローカルに走査してはならず、走査されたスポット軌跡は互いに交差してはならない。軌跡がオーバーラップする時間及び場所で、カメラ面の「衝突」を起こし、これらの「衝突」を検出することができ、ビームの1つを、例えば制御システムフィードバックループによって一時的に消すことができる。複数のビームは、異なる角度で物体の表面から到達して反射するために、例えば影又はオクルージョンを回避するために用いることができる。マルチビーム検出の曖昧さを完全に回避するために、例えばこれらをデューティサイクルすることができる(例えば、交互の時間スロット又は他の何れかの適切な時間構成が与えられる。)
【0115】
図8では、2つの送信機T
x1及びT
x2によって生成された2つのレーザビーム(又は他の光ビーム)が、時間
t1のボクセル位置V
1から時間t
2及びt
3のボクセル位置V
2及びV
3それぞれへの物体108の表面上の同じ線形走査軌跡に沿って走査している(側面図)。T
x1からのビームは、V
1からV
3への全体の軌跡を照明することができるか、又はこれに代えて、T
x1は、t
2でボクセル位置V
2に到達するこの軌跡に沿って位置を照明することができ、T
x2は、V
2からV
3を照明し軌跡を完成する。T
x2はインスタンス1で即時に引き継ぎ且つ同じ軌跡に沿って継続することができるか、又はこれに代えて、ソースT
x2は後の時間に完了するようスケジュールすることができる。(この例では2つの走査ソース、及びこの走査モーションが同一平面になるよう並べられる。)少なくとも一部の実施形態では、交互の走査レーザ源のこの構成が、物体の周りに位置付けられたカメラによって観測される明るい反射を結果として生じることができる。この構成は、本発明のシステムがかなり少ないオクルージョンを有する重大な表面屈曲を持つ物体の走査を可能にする。
【0116】
図9に示すように、部屋又は詳細な3Dアーティファクトを走査する時に、手持式レーザスキャナ104´を用いて、「詳細ボクセル」を累積セットに追加することができる。手持式ツールは、単純なレーザポインタ又は「レーザブラシ」(例えば、固定又は疑似ランダム走査パターンに沿って順次的に照明するレーザ)とすることができ、進行中の「ブラシワーク」を示す
図9に示すようなスマートフォンなどの第2手持式デバイス106´を含むことができる。第2手持式デバイス106´自体は、1又は2以上のカメラを包含することができるか、又はカメラC
1、C
2、C
3は、レーザポインタ104´によって照明される各ボクセルが少なくとも3つのカメラで見ることができる構成におけるスペースの周りに別々に大まかに位置付けることができる(
図9に図示)。
【0117】
3つのカメラC1、C2、C3は、近くからの細かい「ブラシワーク」(ブラシの周りの連続照明ポイント)を直接観測することができ、走査される物体(又は顔)の周りに配置される他のカメラは周囲エリアに並べられる。これらの他のカメラは手持式でなくてもよいが、これらを固定する必要はない。走査される物体の周囲のカメラのセット、飛行クアドコプター又はロボットアームに取り付けられたカメラを用いて、可能な限り多くのレーザポイント照明位置を捉えることができる(各ボクセルに対して3つの観測される視野の最小値)。
【0118】
図9に示した例では、3つのカメラC
1、C
2、及びC
3を物体の周りの三焦点構成で位置付けることができる。手持式モニタリングデバイス106´は、「ブラシワーク」の進行のモニタリングを可能にし、走査される物体の細かい構造的詳細を明らかにする。手持式モニタリングデバイスは移動電話とすることができる。手持式であるレーザブラシデバイスは、物体の表面にレーザ光の数千の「ブラシストローク」を生成する走査レーザビームで物体を照明する。3又は4以上のカメラが各ブラシストロークを追跡する。上述のように、カメラは、「トゥイッチーピクセル」又はSPADアレイセンサタイプとすることができ、細かく三角測量する、又はそうでなければ、例えば物体の表面上にレーザビームの即時位置を位置付けるToF方法によって三角測量することができる。これに代えて、レーザブラシは、3又は4以上のカメラによって異なる視野から観測された各照明ボクセルをカメラが明確にし、識別し且つ一致させるのを可能にする空間-時間符号化方式を発することができる。任意選択的に、DeBruin又は他のカラータイプコード化方式を以下で詳しく説明するように用いることができる。
【0119】
支援ステレオ構成は、3つの共線デバイス、例えば
図10Aに示すようなカメラの立体ペアのベースライン上の画像プロジェクタを有する。この「ステレオ(立体)」構成は、画像トリプレット図形の特別なケースとすることができる。2つのカメラによって観測される投影画像は、合わせて3つの2D画像及び1つの投影現実を結果として生じる。3つの画像の相対的向きは、三焦点テン
ソルで完全に捉えられる。
【0120】
図10Aでは、「支援立体」構成には3つのビュー、すなわち1つのプロジェクタ(すなわち、送信機)T
x及びカメラの立体ペア、R
xL及びR
xRが存在する。送信機T
xの共鳴走査システムでは、走査ミラーから跳ね返る走査ビームの即時ポインティング方向は、周期関数であり、何れかの瞬間、tでは、時間的に特別なポインティング方向が、ミラー機構から電気又は光学フィードバックループによって正確に推定できる。従って、4つのポイントP
1、P
2、P
3及びP
4は、時間t
1からt
4に連続して走査ビームによって順次的に照明される。2つのカメラがこれらの4つの
照明されたボクセル位置を観測する。4つの照明されるボクセル位置の4つのレーザビームポインティング方向及び4つのペアの投影は、2つのカメラのセンサ面の各々に反射及び画像化される。これらの12の2D観測は、使用できる三焦点テン
ソルTに完全に取り込まれ、ポイントP
1、P
2、P
3及びP
4の位置を決定することができる。
【0121】
当技術の支援立体システムの状態は、一般的には、レーザ走査プロジェクタによるエピポーラアライン構成のローリングシャッターRGBカメラの立体ペアを用いる。システム100で用いる単純な代替の構成は、高解像度モノクロームトゥイッチーピクセルカメラ及び単一一次レーザスキャナのペアを含む。「予想」起動などの追加の選択肢(例えば、全体が引用により本明細書に組み入れられる米国特許出願連番第15/799,149号明細書を参照)及び狭バンドパスフィルタは、ローリングシャッター、エピポーラアラインメントを必要とすることなくこのような構成を日光で十分ロバストにする。システム100などのシステムは、最小限2つのトゥイッチーピクセルカメラと単一のモノクロームプロジェクタを含むことができる。少なくとも一部の実施形態では、これらの3つの各々を、数立方ミリメートルの容積に合わせることができ、3つの構成要素の各々を、
図10Bに示すように融通性のある調節可能な非剛性の快適且つ超軽量の頭部装着デバイスを実現するHMDにおける異なる位置に取り付けることができる。
【0122】
例えば、双方が引用により本明細書に組み入れられる米国特許出願公開第2015/0278992及びUS2017/028292に記載するように、頭部装着ディスプレイシステムは、ユーザの眼の各々に近く位置付けられる2画像投影デバイスTxL及びTxRを有することができる。投影デバイスは、逆反射投影表面に画像を投影し、逆反射画像が左眼と右眼のビュー視野を提供する。逆反射ディスプレイ表面の狭い逆反射によって角度的に及び狭く限られ且つ分離された2つの別々の「アイボックス」が存在する。原理上は、ユーザが眼の近くにプロジェクタを身に着けているとしても、何れの種類のフィルタ、レンズ又はオプティクスもユーザの視界を塞がない。同じ走査投影システムを「支援立体モード」に用いて、仮想協調セッションの一部として走査されるユーザの手にある物体を走査することができる。
【0123】
図11A-11Fは、FoV両端の走査線が20マイクロ秒未満を取るように、周囲の高速走査モーション、例えば25kHzを有するよう2つのプロジェクタを構成できることを示している。他の走査速度も用いることができる。各プロジェクタの走査の高速軸は、両方の横方向に正確に指などの物体の輪郭を追跡するように反対側の方向に設定することができる。
【0124】
図11Aでは、左側のプロジェクタビームが5ミリ秒でユーザの指を横断し、約5マイクロ秒離れたt
0とt
1の端輪郭ポイントをはっきりとマーキングする。最大500光コード又はボクセルのパターン(各照明に対して各々が約10ナノ秒)が指の両端に生成される。後の瞬間に、
図11Bでは、時間t
3で始まり時間t
4で終わる第2期間中に、第2ビームが対角線上に反対の方向に指を横断し、約500光コード又はボクセルの別のシリーズを広げる。本明細書で説明するシステム及び方法を用いて、少なくとも一部の実施形態では、約1000高精度3Dボクセル位置を示した追跡システムが、1秒の約1/100,000番目を走査することができ、達成されたサブミリメートル精度指位置及びモーションデータは、ほぼゼロの待ち時間で全3次元である。
図11Cはユーザの頭部の上面図を示し、左プロジェクタLPが対角線上を上に走査し、
図11Dでは右プロジェクタRPが対角線上を下に走査する。
【0125】
別の実施形態は、
図12に示すように複数の手又は把持部又は他の付属物に据え付けられたカメラC
1、C
2、C
3、C
4、C
5、C
6(例えば、「トゥイッチーピクセル」センサアレイを備えたカメラ)を有するマルチアームロボット(又は他のデバイス)である。これらのカメラは、柄の上にあり高度に移動可能である。これらの追跡カメラが検査される物体の周りに最適に位置付けられるように、付属物は6の自由度でカメラを平行移動及び回転することができる。これらを検査中に連続して移動することができ、本システムのリアルタイム且つ一定の再較正特徴によって可能になる。
【0126】
検査される物体はそれ自体で移動することができる。この表面は変形可能とすることができるか又は動作中にすることもできる。少なくとも一部の実施形態では、少なくとも3つのカメラが反射を検出する方法で、物体の表面の各及びあらゆる隅から隅までを(任意選択的に接触することなく)照明できるように、付属物LB1、LB2の1又は2以上が、送信機、光源、又は制御システムによって器用に操作される光ブラシを保持する。これに代えて又はこれに加えて、本発明のデバイスは、デバイスの本体又は他の付属物以外の部分に配置された送信機又は光源を含むことができる。少なくとも一部の実施形態では、少なくとも3つの反射が各レーザ照明表面ポイントに対して(記録される各ボクセルに対して)観測されるようにする段階は、試行錯誤の反復処理を含むことができる。例えば、小さなエリアを走査するために光源(例えば、レーザ)をオンにすることができる。少なくとも3つのカメラが互いに対して予想される期間内にフォトンを検出するまでカメラの1又は2以上を移動させることができる(例えば、カメラは「トゥイッチー」ピクセルでセンサの「トゥイッチング」を検出することができるか、又は代わりにSPADアレイのピクセルをほぼ同時にアバランシェする)。すぐに、ほぼ同一の時間スタンプを有する事象を持つ事象データのストリームが観測される。各場合の「ほぼ」は、例えば、1、5、10、15、20、又は25ナノ秒の間隔内の事象とすることができる。
【0127】
3つより多いカメラ及び1つより多い光源を有することが望ましい。例えば、検査ロボット(水中検査又は他の使用に有用とすることができる)は、6つのカメラ及び2つの光源を同時に又はカメラと光源の何れの他の数も用いるよう取り付けることができる。
図12は、検査中のエリアの別々のパッチを走査するためのカメラC
1-C
6及び2つのレーザブラシLB
1及びLB
2(すなわち、光源)を備えた6つのアームを持つロボットを示す。
【0128】
少なくとも一部の実施形態では、マルチアームロボットが、複数の表面上の構造的特徴を同時に発見、検査及び追跡できることは有利とすることができる。何れの公知の構造も、写真測量法を用いた6つの自由度(DoF)空間信頼基準として使用できるので、ロボットが環境における何れかの適切な位置基準(例えば、港の水底の錨)(好ましくは、固定)に対して6DoFで極めて精密にその固有の位置及び向きを追跡するのを可能にする。同様に、腕の追加のセットを奇妙な形の障害物の周りで精密なマイクロ操作をするために用いることができ、ロボットはアームの1つのセットを用いて、物体に対して任意選択的に自らを固定し同時にアームの第2セットが物体の細かい3Dクローズアップを迅速に走査する。
【0129】
一部の実施形態では、デバイスの何れのロボットアーム又は他の付属物も、光源及びカメラの両方を有することができ、作動中にこれらの特徴を交互に配備して、レーザビーム又はパルスを表面に向け反射を観測する。少なくとも一部の実施形態では、プロセッサベースの中央制御システムが進行中の検査をモニタする。少なくとも一部の実施形態では、この処理はCVアルゴリズム及び制御ソフトウェアを用いる。
【0130】
表面は、摩耗、腐食又は他の損傷などの欠陥を検査することができる。少なくとも一部の実施形態では、異常が、例えばAI(人工知能)ベースのコンピュータビジョンシステムを用いて検出されるエリアにズームインするクローズ検査によって検査処理を完全に自律的且つ自律とすることができる。例として、命綱なしの検査は、中央海嶺の船の船体、掘削基地、パイプライン、又はウェルヘッドの構造的完全性をチェックするための1又は2以上の高度に操作可能な水中ロボット又はデバイスを含むことができる。他の応用は、パイプラインの知的「ピギング」に用いられるいわゆる「スマートピッグ」を含むことができる。「スマートピッグ」は、パイプラインの内部状態に関する情報を記録する検査デバイスである。検査中、「スマートピッグ」はパイプラインに挿入され、パイプラインに流れる生成物によって推し進められる。
【0131】
これらの応用は、迅速な動作可能知的知覚の例であり、リアルタイムの観測が、即時の「現場での」動作(例えば、クローズ検査、デブリを消すことができる、修復する)をもたらすことができる。動作可能及び迅速な機械知覚は、十分強力且つ低待ち時間のオンボードコンピュータ資源を利用するのが好ましい。
【0132】
例えば、GPU及び専用AI加速度計の100+TeraFlop(TeraOP)クラスによって提供される十分な処理能力によって、三焦点レーザ知覚を備えた上述のシステム100を用いた超高速走査と組み合わされた時に、
図12に示すようなロボットは、好ましくは監督又は介入を必要とすることなく、自律的に、素早く且つ効率的に作動することができる。後者は、データ接続が制限されるか又は存在しない場所で有利である。
【0133】
迅速で動作可能な3D知覚は、ステルス偵察応用のため、及び惑星探査(光の速度の制限による極端な待ち時間、及び全てのシグナリング)などの極めて遠隔の位置で作動する時、又は遠隔自律衛星検査のために重要である。
【0134】
システム100の少なくとも一部の実施形態では、物体又は表面のミリメートル毎に、完全で詳細な「細粒度」3D構造マップを結果として生じる1秒当たり1億ボクセル又はそれ以上の速度で検査することができる。このようなマップは、振動及び構造的共振及び変形などの高密度ダイナミクスを明らかにする精密なモーション観測を含むことができる。
【0135】
各ボクセルが1平方mmである場合、システム100の少なくとも一部の実施形態は、1秒当たり最大100平方メートルを走査することができる。走査処理中、光源から発した反射されたフォトンの3又は4以上の同時検出からのデータ事象だけが次のコンピュータ段階に進む。これらのNタプル(ここでN>=3)事象観測が処理され且つ次に(少なくとも一部の実施形態では、ほぼ即座に)正確なボクセルデータのストリームを結果として生じる。正確な観測によって、3D走査のセクションの全てを迅速かつ正確に互いにスティッチすることができ、少なくとも一部の実施形態では、効率的にオンボードメモリに格納できる。対照的に、多くの従来のシステムは今日、生の未処理マルチビュービデオストリームを格納する必要があり、検査される物体に過度に大きなストレージ及び/又は複数のトリップを要求する。
【0136】
本発明のシステムは、フィードバックループの一部としてリアルタイムデータストリームを用いて連続して且つ自動的にアームを動かして、ボクセルデータの連続高速フロー、及び従って3D表面の効率的で高速の完全な検査を保証することができる。
【0137】
少なくとも一部の実施形態では、ナノ秒の精度を持つタイムスタンプを備えたコンピュータ計算されたボクセルが提供される。タイムスタンプは、3Dマニホールドのボクセル位置の順次的に照明に同期されるのでこのナノ秒精度を達成する。
【0138】
少なくとも一部の実施形態では、個々に観測されたボクセルのこの精密なタイミングが、検査ロボットシステムに異なる視野から観測される表面のパッチの観測に統合、融合及びスティッチし、モーション及び加速度の正確な記録を維持するのを可能にし、少なくとも一部の実施形態では、ナノ秒精密時間スケールで、しかしリアルタイム又は後の1つのシステムの観測を、この精度の損失なしに他の何れかのこのようなボクセル順次システムに統合(スティッチ又は融合-すなわち、データ融合の処理を介して)することができる。少なくとも一部の実施形態では、このようなシステムの2又はそれ以上の観測は、1秒の100万分の1まで観測された表面のmm毎の位置、速度、加速度及びカラーについて同意しなくてはならない。この固有の時間的及び空間的精度は、本発明のシステムの2又は3以上のデータを融合する処理を大幅に単純化する。
【0139】
少なくとも一部の実施形態では、4つの連続して観測されたボクセルの後に、更なる観測が、知覚システム100を用いたロボットが、移動アームの各々、及び可能であればひじの関節の位置及び向き、速度及び加速度を(6DoFで)較正し、且つ作業スペースでの固有の向き、速度、及び軌跡を再較正できるようにする。作動のマイクロ秒内で、適切に装備されたロボット検査及び操作システムは、身体的自覚と呼ばれる自己受容のバージョンを達成する。アリストテレスの時代の第六感として提案される自己受容は、手足の位置及び動きの正しい感覚、空間における体の認知自覚である。
【0140】
ロボットの各カメラ(又は眼、例えば、トゥイッチーピクセル又はSPADアレイ)が1秒当たりに最大100万回の速度で固有の位置を知らせるので、ロボットの全ての移動部分及び区分は、6DoFで即座に(又はほぼ即座に)一部分の全てを向ける及び協調するために共有観測を用いることができる。従って、ロボットの各接合位置及び姿勢を追跡することで、追加のハードウェアIMU又は回転復号器の必要性を取り除くことができる。
【0141】
自己受容は、器用さ、敏捷性及び衝突防止を可能にするか又は拡張することができ、例えばピザデリバリーロボット(又は多くの顧客又は他の個人又は危険を持つ場所の他のロボット又はデバイス)から期待されるように群衆の中をナビゲートするのに必要な基本的な迅速の器用さを向上させることができる。この追加の器用さ、操縦性、動的敏捷性、及び自己受容、平衡及び猶予は、レストラン及び他の類似の使用のロボットウェイター又はウェイトレスに知覚システム100を合わせる。
【0142】
レーザ「ブラシ」をAR(拡張現実)位置検知システムに加えて、形状を正確に検出及び迅速且つ効率的にチェックすることができるが、現実的な見た目の増強を検出された現実にシームレスに合わせることができる。後者は、人の顔又は指などの生きている変形可能な物に添加物(宝石、王冠、鼻輪、タトゥー、口ひげ、帽子、角など)を付けた時に特に重要である。
【0143】
システム100を用いて、頭部装着ディスプレイ(HMD)は、三焦点センサ構成を用いて添加物に対して現実世界で効率的に物体を追跡することができる。システム100などのエンドツーエンドピクセル順次システムを用いる(例えば、「トゥイッチーピクセル」センサを用いる)ことができるか、これに代えて、従来のフレームベースのRGBセンサを用いるレーザ及び、例えば、DeBruijnタイプカラー及び/又は強度光コード化構造化光技術、以下に説明するようにコード化レーザ光走査進行を用いてレーザによって順次的に照明されるピクセルを備えたハイブリッドシステムアーキテクチャとすることができる。
【0144】
機械ビジョン科学者は、畳み込みニューラルネットワーク(CNN又は「CovNets」)などの新しい「AI」ベースのコンピュータ方法に頼ることが多くなっている。RCモデル車を自律運転するためのCNNを訓練する時に、2つの個々のカメラデータストリームとしてカメラのステレオペアを扱うことが十分であることが最近になってUCバークレイの研究者によって示された。CNNは、RC車の運転者訓練セッションの間に取り込まれた視覚モーション画像で訓練された時に暗黙的に立体図形の同等物の学習に終わる。これは、図形変換(コンピュータ集中作動とすることができる右及び左立体ピクセルペアマッチングなど)に対する必要性を取り除く。生ピクセルから運転者動作に直接進むことは、運転時間の高速反応及び乏しいコンピュータ予算を結果として生じる。訓練後に、訓練された神経網は、暗黙的に立体視推定を用いてその動作を通知する。
【0145】
類推により、Nカメラシステム100からのデータフロー出力を用いて、CNNを訓練して、ロボット、自律運転システム、及び他のデバイス及びシステムのための視覚野のように機能することができる。神経網知覚システムの第1の数層は、効果的な細粒度低待ち時間3D空間-時間知覚能力を提供する。
【0146】
これは、人間の脳のように、神経ネットワークが、写真測量法、視覚走行距離計測法又はSLAMによって直接通知された数学的に明示的な規則及び訓練された神経網によって神経効果を「直観する」ことによる駆動に基づいて空間図形に関して明示的に知らされる(又は訓練される)ことなく、未知の3Dリアリティ風景における高速ナビゲーションに対する基本的な特性をマスターできることを示唆する。
【0147】
明示的規則ベースの図形変換がステレオカメラを備えた遠隔制御車に必要ないこと及び一連のステレオ画像ペアにおける3Dリアリティを取り込む2つのカメラから3Dボクセルを明示的に抽出する必要がないことが明らかである。双眼の人間は、一定の動きをする一対の低解像度の眼よりも上手に生き延びる。従って、上述のように、十分なビューポイント(N+ビュー)によってカメラを備えたロボットを未知の3D環境で高速で操作することが有効であることは説得力がある。進化は、ハエトリグモのビジョンシステムに類似の生体模倣の疑似ランダム走査ビジョンシステムを提案する。
【0148】
バンドル調節は、統計的に最適な方式でシーンポイントの内部及び外部パラメータ及び3D座標を同時に推定する統一された方法である。カメラ及びシーンポイントの数は任意に大きくすることができる。概念的には、逆問題を解決してグラフィクスをコンピュータ計算し、未知のシーンの画像が与えられた場合、タスクは、シーン構造を回復することであり、すなわちカメラを記載するパラメータと共に視覚表面は画像を撮影するために用いられ、従って全ての利用可能な情報を活用する。例えば、全体が引用により本明細書に組み入れられるW Forstner及びB.P.Wrobel、写真測量法コンピュータビジョンの15章を参照されたい。
【0149】
例えば、SIM(モーションからの構造)では、一連の観測(例えば、移動カメラによって撮影された順次ビデオフレーム)が存在する。各フレームは、時間が観測中に静止状態であると思われる時に準即時観測である。シーンにおける物体に対するカメラ自体のモーションによって起こるフレーム間の変更された視野は、カメラのシーン及び軌跡の元の3D図形を通知する。
【0150】
上述の三焦点テンソル方法では、4又は5以上の3Dシーンポイントが少なくとも3つのカメラによって観測される。シーンポイント、これらの3Dスペースマニホールド表面、及びカメラを移動させることができる。LSD SLAM(ラージスケール直接単眼同時ローカライゼーション及びマッピング)における移動ステレオカメラのような複数の同時ビューは、SLAM(同時ローカライゼーション及びマッピング)の高度形態を可能にする。
【0151】
少なくとも一部の実施形態では、システム100は、ボクセル位置の軌跡を順次的に照明して、ほぼ即時の同時検出事象を3又は4以上のカメラ(カメラの複数N、Nは3に等しいか又は大きい)で発生させる。これは、3(又は4以上)のカメラのピクセル位置間の対応、座標ペア、例えば、3つの異なるカメラにフォトンを検出するピクセルの[列数及び行数]を瞬時に設定する。照明の各インスタンス(すなわち、10ナノ秒毎)を意味する原理では、全ての以前の推定(表面、物体、及びカメラ中心の軌跡)に更新を行うことができる。
【0152】
基本的には、各連続ボクセル照明によって、本発明のシステムは、これらのパラメータを正確に取得することができ、この結果、この方法及びシステムは、多数の連続三焦点観測に基づいて(慣性力学を仮定して)極めて正確な過去、現在及び未来の(予測)3Dモーション軌跡の決定を可能にする。
【0153】
一連の連続照明ボクセルのN視野からの同時観測を備えた三焦点(マルチビュー)アプリケーション又はシステム100-ここで数Nは3より大きいか又は等しい-は、フレームベースの従来の方法よりも高度なSLAMを可能にする。カメラシステムのエクストリンシックの計算は効率的に行うことができ、パラメータの全セットを毎回再計算する必要がないか、又は再計算する必要がある場合、手順を素早く且つ効率的にすることができ、以前の最新の観測からの値をシードすることができる。モーション「フリーズ」、すなわち変化は、マイクロ秒の時間スケールで最小である。最新の観測に基づく予測、例えばカルマンフィルタ推定は、極めて近い可能性がある。
【0154】
図13A及び13Bを参照すると、標準的なカメラ画像が、2D画像として又は最初は粗く走査される3D走査として、例えば3D世界の関心ポイントを識別するために使用される従来のステレオ又は構造化光方法によって処理される。スキャナレーザ源Txは、従来のローリングシャッターカメラのビューを照明するために用いられ、このカメラの視野が走査レーザ照明器と同一の場所に位置付けられ、これによってカメラの各ピクセルP
ijに対する照明瞬間T
ijを正確に決定することができる。
図13Aでは、Txによって送信された走査レーザビームからの光は、物体Ocの表面ポイントPから反射する。同一場所カメラRxのピクセルP
ijは、時間T
ijの反射パルスを受信し、ポイントPの表面の時間、位置及びカラー(送信されたカラーR、G、Bに対する物体のアルベド)値をマーキングする。
図13Bでは、本発明のシステムは、例えば物体上の4つのスポット、基準マークt1、...t4にマーク付けする。ここで他のカメラC1...Cnは、これらの照明されたマークを見る(検出する)ことができ、「crop」がこのビューで物体を選択する。任意選択的に、マークの4(又は5以上)を検出する3又は4以上のカメラは、システム100に関して上述したように三焦点テン
ソル計算を用いてマーク付けポイントの3D位置を即座に計算することができる。任意選択的に、Nカメラからのデータフローを低減するために、物体を選択的に照明、及び/又は選択的に記録(「3Dクロップ」)することができる。
【0155】
ピクセルサイズRGBレーザビームは、従って各記録されたピクセルの位置をTijに時間的に(ナノ秒で)且つカメラの解像度の制限値に制限する。後者は、例えば、経済的な8Mピクセル「4k」センサによって、40×20度FoVによって、40度/4000列が良好なオプティクスを仮定する1列当たりの1/100度である場合、方位角又は仰角の何れかで1/100の程度と同じように細かくすることができる。
【0156】
システム100のピクセル順次的に照明は、高速モーションビデオ記録に対してもモーションのぼけを取り除くか又は低減する。レーザ照明フレームのシーケンスは、コンピュータシステムが関心ポイントの位置を識別、追跡及び予測するのを可能にする。本発明のシステムは特別な照明フレーム(又はわずか数走査線)を挿入することができ、関心ポイントだけが照明される(又はこれに代えて、特別に装備されたカメラが、照明された基準ポイントによって「ブラケットされる」ピクセルだけを選択的に起動又は読み出すことができる)。
【0157】
観測システムのおける他のカメラ(C1...Cn)は、関心のこれらの選択されたポイントの位置を記録することができる。これらの照明は疎らで順序良くすることができるので、
図13A及び13Bの立方体形の物体O
cなどの関心の物体は、容易に識別及び選択的に追跡することができる。
【0158】
閉ループシステム3D基準追跡システムの手順の1つの例示的な実施形態は以下を含む。
1.第1カメラの全フレームの照明を開始する。(任意選択的に、全モーションのぼけの除去又は低減及び高速高フィデリティモーションキャプチャを可能にするためにシステム100を用いる)。
2.ピクセル毎にフレームの関心ポイントを識別する。
3.後のフレームの関心ポイントを再識別する。(この後のフレームは、次のフレームとすることができ、可能であれば以前に識別された物体位置の周りの小さなエリアにサーチを制限する。)
4.ポイント(2D、ピクセルカメラ位置)の適切なセット及び各ポイントのタイムスタンプが取得されるまで、一連のフレームの上部ステップ3を繰り返す。
5.関心ポイントの(あるとすれば)モーション軌跡を決定する。
6.走査ビームの次の(数)パスの位置を予測する。
7.予測された軌跡に沿って関心のこれらのポイントだけを照明する。(これらは、送信機及び第1カメラの視野から見られる2D軌跡及び2D位置とすることができる。)
8.一連のカメラ位置の各々にできるだけ多くの照明ポイントのピクセル位置をマーク付けする。
9.任意選択的に、ポイントは照明されるカラーコードとすることができる(追加の観測者カメラが、色毎にポイント位置を識別することができる従来のRGBカメラであると仮定する。)
10.公知の測定学技術(例えば、三角測量、PnP及びバンドル調節)を用いて、観測カメラの3D位置及び関心ポイントの3D軌跡をコンピュータ計算する。
【0159】
ピクセルぼけの不存在及び各観測の極めて細粒の時間的解像度のせいで、世界クラスの3D知覚システムが生成される。
【0160】
長い距離で、パルス又は他のToF測距方法は、任意選択的に、シーンの3D図形を通知するために用いることができ、例えば観測者の間のベース分離が制限されすぎる距離で(例えば、カメラ中心間の不十分な距離がある時)。
【0161】
高速走査はモーションエラーを低減することができる。3つのカメラが、1ミリ秒の時間スパン中に最も広いFoV空間(例えば、2つの方向方位角及び仰角における4つの極端な走査ポイント)にわたって、ある期間に渡る4つの連続ポイントを見て且つカメラ間の相対的横軸(正接)速度が第4の限界観測の終わりによって1秒当たり10メートル(36km/h)の速さの程度であると仮定すると、真の移動カメラ位置(観測されるポイントに対する)は1センチメートルだけシフトすることができる。この1ミリ秒の観測期間にわたって、300,000[x,y]カメラ座標観測をもたらす100,000中間走査(毎10ナノ秒に1つ)を存在させることができ(3つの「トゥイッチー」カメラの各々における100,000同時観測)、これによって、十分なリアルタイムコンピュータパワーが与えられると、カメラ軌跡、及びカメラ軌跡の相対的位置を正確に推定することができる。
【0162】
3Dマニホールド両端の走査は、連続的3D表面から、表面全体の軌跡をモデル化、観測、追跡及び予測するために2つの表面の交差として軌跡を形成することができるが、一時的オクルージョン、「ドロップオフ」及び他の不連続性を扱う。目標は、本発明のシステムの周囲光に対する感度を上げ堅牢にするためにアレイの予測される2D軌跡に沿って個々のピクセルの予想ゲーティング(例えば、「トゥイッチーピクセル」又はSPADピクセル)を達成することである。目的は、3D空間マニホールド小区分及び2Dカメラ小区分でビームが次に現れる関数で表現できるように、すぐ前方の3D走査軌跡の確率的制限の数学的関数のレベルを導くことである。
【0163】
3又は4以上のカメラで観測された軌跡に基づいて、且つコンピュータ計算された軌跡に基づいて、これらの軌跡は動力学的に(例えば、数学的に)予測可能な仮定平滑非ランダムモーションであり、表面、レーザ源及び観測カメラの各々の間の相対的モーション(6DoF)が走査される。1つの実施形態を
図14に示している。走査線は、2つの表面の交差であり、表面Iはビーム軌跡マニホールド(BTM)であり表面IIは走査された物体マニホールド(SOM)である。
【0164】
3つのカメラC1、C2及びC3は、走査ビームの軌跡の反射を観測する。第1区分は、観測される実際の軌跡であり、第2区分は予測される将来の軌跡である。観測される軌跡に沿った何れのポイントPでも、レーザ照明ポイントが軌跡に沿って速度ベクトルVで移動する。このモーションは、カメラC1、C2及びC3それぞれのセンサ面における3つの2Dベクトル、V’、V’’及びV’’’として3つのカメラに投影される。数百ナノ秒の極めて短い間隔にわたって、ピクセルが次に「トゥイッチ」できる将来の位置を、到着ビームの前の「ジャストインタイム」方式で、予測、予想、及び必要に応じて起動することができる。従って、センサの予測される軌跡に沿った個々のピクセルを1マイクロ秒未満の期間に起動(露出)できる場合、SPADSは、最大利得に逆バイアスすることができ、センサダークノイズ、及び周囲光ノイズを最大値に抑えることができる。
【0165】
表面I:ビーム軌跡マニホールド(BTM)-走査ビームは、連続平滑方式で3Dスペースを走査する。定義により(古典物理学の法則に従って、すなわち非常に大きな重力場の不存在)、発せられたレーザビームのフォトンが、検出及び追跡される遠い物体又は表面に向けてミラーMから直線で自由空間内を移動する。ミラーMは、回転の瞬間軸r(t)の周りを回転する。
【0166】
入射高度コリメートレーザビームはミラーに反射して、ピボット、すなわちミラーの角速度の2倍で回転する(正反射のオプティクスに従う)。入射ビーム自体は、例えば、米国特許第8,282,222号、8,430,512号、8,696,141号、8,711,370号、9,377,553号、9,753,126号、及び米国特許出願公開第2013/0300637及び2016/0041266に記載されるようなリレーオプティクスによってリンクされた一連の走査ミラーを含む走査システムで以前の走査ミラーの動作によって事前回転することができ、これらの特許出願の全てはその全体が引用により本明細書に組み入れられる。例えば、長円体リレーは、長円体ミラーリレーの第1焦点F1に配置されたミラーから第2焦点ポイントF2(2つの焦点F1及びF2を有する長円)までの1次元(例えば、方位角水平方向)に走査モーションをリレーすることができる。このリレーの第2焦点で第2方向の回転が、一般的には第1走査ミラーの効果に直交する方向(例えば、垂直方向、又は「上昇」)に、走査ビームに伝えられる。
【0167】
従って、マイクロ秒で測定される短期間にわたって、ビームは、走査機構によって伝えられる高速回転の結果である高速走査方向に実質的に動くことになる。
【0168】
最適なマルチミラーリレーシステム、又は適切に設計された2軸ミラーによって、正味の効果は、特異点起点Oから発生するようにビームが走査機構を離れることになる。ビームがミラーの中心の周りをピボット(回転する)時に、Oがこの位置に現れる。他のシステムでは、ビーム起点Oが最後の走査表面全体でわずかに横方向に移動(遷移)することができ、この上にレーザ走査機構を離れる前に反射する。しかし、この遷移はある距離で見られる時にほとんど無視できる。
【0169】
最終結果は、ビームが空間を通して滑らかに走査し、3D表面に沿って形作られた薄いエンベロープ内のこの空間、わずかに曲線になった空間マニホールドを横断する。モデル化するための別の方法は、ミラーOから発生するレイのバンドルとしてモデル化することであり、時間的に小さな増分で各連続レイはほぼ一定方向(高速走査方向)に小さなステップで(例えば、ナノ秒毎の1/100の程度)回転した。短期間にフリースペースを介して横断する高コリメートされたレーザビームがレイの緊密なバンドルを形成し、時系列のように進行し、各々の微小なステップによってレイは小さな回転フラクションによって進む。
【0170】
少なくとも一部の実施形態では、第1表面、BTM表面は平滑であり、何れかの1つのポイントの1つの方向にのみわずかに曲線が付けられている。BTM表面上の各ポイントに対して、少なくとも1つのまっすぐな次元が存在し、且つこれに直交してわずかに曲線をつけられた第2の平面次元が存在する。BTM表面上の何れかのポイントPで、まっすぐな次元が起点Oから発生するレイの1つによって形成される。このレイは、走査機構におけるポイントPから発生する時間の異なるポイントでレーザビームによって形成される直線のバンドルの1つである。これに直交するのが走査方向である。何れかのポイントPの走査方向は、レイ方向に対して正接(従って、直交)である。BTMは、わずかに「波打つ」として説明することができる(空間のリボン、又は波打つ表面のような、Oから扇状に広がる)。
【0171】
表面II-走査された物体マニホールド-第2表面は、本システムによって走査及び追跡され、「走査物体マニホールド」(「SOM])である。ビームが照明するゼロ以外のサイズの何れかの物体に属する表面又は3D空間マニホールドである。発明者らは、ここで物体の表面が実質的に連続しており平滑である(隙間がない、髪がない、樹上突起など)であると仮定する。
【0172】
ローカルで両方の表面が平滑である(すなわち、「弁別可能」)である場合に、これらの交差は両方の表面によって共有される線であるので、BTM及びSOMの交差は、それ自体が平滑である線であり、従って2つの平滑な表面のこの交差は平滑でなくてはならない(弁別可能)。観測可能な走査線軌跡は平滑でなくてはならず、これは、連続スポットの位置が以前の観測から定義された直線軌跡に沿って予測可能であることを意味する。
【0173】
図21Aは、本システムがパターン化画像406をその上で操作するプロジェクタ402及び表面114を備えた「疑似ランダム」レーザシステムの例示的な実施例を示している。画像406上の各画面位置408は、1又は2以上の走査線404の上にかかることができる。
図21Bは、走査され予測された軌跡部分を備えた1つの疑似ランダムビーム軌跡の実施形態を示す。画像を投影する処理を2つの個別の段階、すなわち走査線404の既に走査された部分が検出されるフィードバック段階、及び組み合わされた画像ビームが走査線404の予測される部分に投影される投影段階に分割することができる。これに対応して、走査線404は2つの個別の部分、1つは走査されたビーム軌跡部分416と2つは予測された軌跡部分410を有する。走査線404の走査されたビーム軌跡部分416は現在のビーム位置412で終わり、この実施形態では、ナノ秒タイミングに基づいて一般的に生成されるパルスのシーケンス414を含む。予測される軌跡部分410は、パルスのシーケンス414に関連付けられるデータに基づいてプロセッサ116によって予測される部分である。組み合わされた画像ビーム120は、一般的には走査線404の予測される軌跡部分410に投影される。
【0174】
図23は、ビームの画像が真の軌跡に沿ってカメラを横断する場合に反射又は散乱されたフォトンビームとしてカメラのピクセルによって観測される検出事象のトレール2300を示す。このトレール2300は、結果生じた軌跡が空間的な精度(例えば、1/10ピクセル次元)及び時間的(例えば、事象の1/10時間解像度(平均ピクセル全体で送信時間に大体同等である))の両方で精密であるように、線形補間によって(例えば、線フィッティングによって)調整することができる。
図23は6つのピクセルトレールを示すが、ピクセルの何れの数のトレールも用いることができる。
【0175】
例えば、100サンプルが1マイクロ秒にわたって(すなわち、100,000,000生ボクセル/秒の走査速度(大体10ナノ秒毎に1つの事象))取られる場合及び走査が平滑であり連続的である場合、カメラの空間解像度は、1/10ピクセル次元と同じに適切とすることができ、即時軌跡位置をナノ秒に時間的に補間することができる。
【0176】
図24A及び24Bは、カメラ1及びカメラ2それぞれのピクセルによって観測される検出事象のトレールを示す。2つのカメラのピクセルアレイに(各カメラを位置付ける向けることができる、例えば中心光学軸の周りで―他の全てとは異なるように回転させることができるNカメラのセットの)2つの異なる位置又は方位で)画像化されるので、ピクセル照明の軌跡は、2つの異なる方位から見られる。各トレールは、ギザギザになり、カメラの各々の順次トゥイッチするピクセルから生じる。ピクセルの「トゥイッチ」は、完全に規則的な間隔ではない。しかし各トレールを補間して、実際の3D軌跡の2Dカメラ投影に密に合わせることができ、2つの補間は、
図24Cで静的に組み合わせることができる。マニホールド上のボクセル照明軌跡の小さなサブセクションに対するNのこのような補間の重なりは極めて近いフィットとすることができ、地面の観測される3D軌跡及び近い高解像度の観測が真である場合に正確な推定を提供することができる。
【0177】
各ピクセル化アレイは一部の空間的及び時間的量子化エラーを固有に有するが、ビームの画像がカメラの各々の両端を異なるように横断する場合、カメラが多い程、空間マニホールド上でフォトンビームの3D軌跡を観測する多様なビューポイントが多い程、ビームの即時位置が正確である程、その真の軌跡を決定することができる。個々のピクセルによって観測可能なものより小さな特徴にビーム位置を発見し、且つビームの反射(Nカメラの各々の移動スポットとして画像化)が何れか1つのピクセルを移動するのにかかる時間より短い期間にモーションを見ることができる。
【0178】
同様に、観測中のカメラ及び/又は位置センサからのフィードバックは、システム100が前方の軌跡を予測し且つ走査された照明(空間のマニホールドである画面上)の予想される軌跡に対して調節された走査パターンを描画するのを可能にする。同じ疑似ランダム非反復走査方法(例えば、オープンLissajour)は、正確な低待ち時間モーション精度追跡システムをもたらす。
【0179】
連続して又は一連の急速な「曳光弾」又は追跡スポットとしての何れかで、物体の表面の少なくとも一部-照明処理中の何れかの部分を観測することができる何れかの観測カメラC、何れのこのようなカメラも、センサの表面に投影されるスポットの時間進行の通りにアパーチャによって取り込まれ且つオプティクスによってフォーカスされる光からの反射の現在の並びに以前の軌跡の一部を観測できることになる。
【0180】
平滑な軌跡を観測することによって、センサでのスポットの進行、「次に来る」軌跡、換言すると将来のスポットの位置(将来の反射、すなわち、まだ観測されていない表面ボクセル照明)を予想できることになる。連続スポットの位置は、センサの表面の小さなサブセット以内に狭くすることができる。各観測された実際の位置は次の位置を通知する。軌跡に沿って正確に将来の位置を予測し、且つ直近の将来の(短いナノ秒間隔の)スポットを見ることができるピクセルの発生の位置及び時間であるスポットのピクセル横断軌跡の正確な位置を高確率で予想するための数学的方法(例えば、カルマンフィルタ)が存在する。
【0181】
重大な飛行時間(ToF)が、例えばLIDARシステムが500フィート距離の物体を走査する時に約1マイクロ秒がある場合、入射光ビームの実際の空間方向は正確に相関付けなくてはならず、本発明のシステムは、センサのピクセルの極めて小さなサブセットの起動をコンピュータ計算及び選択及び制御するための十分な時間を有する(1マイクロ秒は1000の1ナノ秒クロックである)。
【0182】
走査ビームが、別の視野から見られるように物体から「落ちる」(例えば、表面又は物体の予測しない端に遭遇する)場合、ビームは「ジャンプアヘッド」するように見えることがある。ビームが、予測される範囲を超えて予期しないように、予測される軌跡の前方にある起動されたピクセルを超えて着地するので、センサは、信号を検出できないことがある。このような端が起こった場合、サーチする(例えば、同じ軌跡に沿ったスライディングウィンドウを起動し、ビーム-センサ両端のトレースを再取得する)ことによって回復を即時又はほぼ即時とすることができる。3又は4以上の観測者の場合(例えば、三焦点又は四面体走査LIDAR構成)、SOMの表面上の照明されたボクセル軌跡を観測する3又は4以上のカメラが常に存在する点に留意されたい。従って、これらのカメラのあるサブセットは、信号を失うことはなく、信号の観測が信号の追跡を一時的に失くす残りのセンサの再取得を助けることになる。
【0183】
このようなジャンプアヘッドが起こった時にも、端又はオクルージョン又はギャップのせいで、ビームは、予測可能な軌跡、観測された実際の走査ディレクトリから正確に予測することができる可能な軌跡のエンベロープに近く従うことになる。予想しない「ジャンプアヘッド」は、同じ予測される軌跡に沿うが、実際にはこれから逸れることはない。
【0184】
わずかのピクセルだけが何れに1つの時間にも開いているので、外部からの信号の光を効率的にスクリーニングし且つ従ってマスクアウトする(選択起動、又はピクセル固有のシャッタリングによって)、例えば周囲の光を大部分シャッターアウトして、本システムが追跡ビームの検出を強く好むのを可能にできる空間-時間フィルタが生成される。例として、公知の(観測された)軌跡に沿って横断することによるカメラ内の百万ピクセル(1000行1000列)が存在する場合、カメラは、すぐ前方の予測される軌跡に沿って何れかの1つの時間にフォトン検出10ピクセルにだけ開くことができる。従ってカメラは、何れか1つの時間にカメラの1/100,000フラクションだけを露出(起動)し、周囲光が従って抑制され、トレーサ信号検出が100,000対1の因数によって指示される。効果的に、晴れた日の周囲照明が100,000ルクスである場合、カメラでは1ルクスに低減される。
【0185】
確率論的通知マルチビューカメラオーバーラップ(「SIMCO」)実施形態が
図15に示されている。一連のNカメラ又はセンサC
1...C
N(例えば、SPAD又は「トゥイッチーピクセル」アレイ)は、重なり合うカメラ視野によってビュー(図示せず)を観測する。例として、3つのカメラC
1、C
3及びC
5が(レーザプローブビームの-図示せず)の反射を検出し、事象同時並行性チェック(ECC)処理又は回路とほぼ同時に(すなわち、同じ短10ナノ秒期間内に)事象を報告する。ECCは、3つの事象の発生の(程度)を確認する。3つの事象(サブセットM、ここで3=<M=<N、この場合M=3)十分に同時である(例えば、5ナノ秒以内)と見なすと、事象をレーザプローブビームによって照明された同じボクセルから発した反射光でなくてはならないことになる。別の回路又は処理CVPがボクセル位置をコンピュータ計算しボクセルデータを分析のためのダウンストリーム知覚システムに送信する。任意選択的に、Mカメラの6つのDoF位置の較正データが更新される。
【0186】
マルチシステムを用いた360度走査物体又は人-例えば引用により全体が本明細書に組み入れられる米国特許第9、813,673号に記載されるホログラフィックビデオ取り込みシステム、又は他のVR没入型モーション取り込みシステムでは、多くのカメラがパフォーマー/ユーザの周りの剛性のフレーム(カメラリグ)に取り付けられる。この開示に記載するようなシステムは、一般的には注意深いセットアップ及び較正を必要とする。
【0187】
本明細書で説明するシステム100は、何れかの数(N)の視野(例えば、カメラ)から多くの同時事象データストリームを取り込み、規則的な超短(例えば10ns)間隔で同時に記録されたMカメラのサブセットからM事象の各々をマッチさせる及び対にすることができる。システム100がカメラモーションに対して完全に堅牢であるので、マイクロ秒での何れの新しいカメラ位置への継続的な再較正、カメラリギング及び較正は任意選択的である。
図16は、較正及びカメラリグをスキップし且つダンサーF(例えば、パーティ)のパフォーマンスを自発的に取り込む6つのカメラ(C
1...C
6)を備えた「アドホック」自然発生的(自己編成)「カメラクルー」を示す。
【0188】
「ブリンカー」-目標選択的3D基準インサーション及び測定、RFリフレクタ、及び又はブリンキングレーザダイオードメーカB
1、B
2、B
3及びB
4が
図17A及び17Bに示されている。次の車両に3又は4以上のカメラ(C
1、C
2、C
3...など)がある。
【0189】
カメラは、4つの個別の明るく照明されたポイントを発見及び追跡する標準的なカメラとすることができる。又は「ブリンカー」は、システム100の「トゥイッチーピクセル」又はSPADアレイセンサによって即時に検出される明るい単一波長レーザパルスの各々を連続して(同時ではなく)発するレーザダイオードソースとすることができるか、又は4つのポイントを、走査レーザビームを反射する且つ反射がシステム100のカメラによって検出されるレーザ反射器とすることができる。
図17Aは、車両の近くに4つの「ブリンカー」ポイントを検出する3つのカメラを示す。
図13Bは、「ペロトン」フォーメーションの2つの車両を示し、後方車両が前の車両に近接して従っている。
【0190】
コード化カラーストリング(別名「カラーベッド」)-レーザプロジェクタは、3又は4以上のカメラ(C
1、C
2及びC
3)の各々が、3Dマニホールド表面のカラーのコード化ストリングを観測して、
図18に示すようにシーケンスのカラーを認識できるように、一部の空間的に別々の固有のパターンにおける表面全体に投影されるカラーの公知の固有のシーケンス(例えば、R、G、B又はNIR)を生成する。3又は4以上のビューの間のポジティブ空間-時間マッチは、連続した各カラー照明に対して設定することができる。これは、各照明されたボクセルポイントがその3D位置及び時間シーケンスによって識別できることを意味する(各ボクセルに対するナノ秒の固有の時間スタンプ)。軌跡に沿ったカラーシーケンスは、一意的に識別可能な位置基準、例えばDeBruinコード化によって、一定の期間を通じて及びストリングに沿った一定の長さを通じてローカルに固有である3又は4以上のカラーのシーケンスを提供する。このようなコード化は、隙間及びオクルージョンが起こった時でも、4又は5以上のカラーのフラグメント、ストリングのシーケンスのフラグメントを識別するのに十分とすることができる。カラーシーケンスは、このような照明の長い(ミリ秒)シーケンスを取り込んだフレームにおける時間シーケンスキャプチャをカメラが理解するのを可能にするマーカである。本発明のシステムは、順次的に照明されるボクセルの軌跡に従い、照明のカラーコード化ストリングの空間-時間パターを描くことができる。各カラーベッドが、このフレーム露出で特定のナノ秒正確間隔中に起こった照明であるという知識によって、支援されていない高速グローバルシャッターカメラシステムを超える時間及び位置精度を持つ極めて正確な表面モーションを観測することができる。
【0191】
ストリングの固有のシーケンスを持つカラーベッドは、空間-時間マーカとして機能する。プロジェクタの空間-時間位置の知識は、本システムが作用するために厳密には必要ない。3つのカメラ及び4つのマッチポイントの三焦点構成は、シーケンスを復号(及びカメラ位置を再較正)するのに十分である。しかし、システムFOVにおけるカラーの正しいシーケンス及びパターンの空間-時間進行の以前の知識を知ることで重要な追加のクルーを提供できる可能性があり、コード化方式を完成し同時に、例えばフィードバックループを介して追跡システムに追加の堅牢性を提供することができ、レーザカラーシーケンス投影を、表面アルベドの変動、構造及びでこぼこなどの物体の観測可能な表面特性に対する強度及び空間周波数を調節することができる。
【0192】
本発明のシステムのFoVのシーンのある部分は、高い隆起の特別な又は強い関心、例えば前方の軌跡に直接起こる物体、又は切迫した衝突のリスクを提示することがあり、密なカラーシーケンスコード化要件に値する物体とすることができる。パターン又は投影は、クローズ形式(周期的)リサジュー、オープンリサジュー(非反復)又は他の形式の疑似ランダム空間パターン投影とすることができ、密度の高い「斜交平行」パターンの表面に交差する。このようなシステムは、関心の物体上に陥凹3Dクローズアップを提供するのに優れている。
【0193】
これに代えて、モノクロームシステムは、強度変動コード化方式を使用する3つの急速グローバルシャッターカメラを用いることができる。先行の実施形態では、ストリングシーケンスがカラーバリエーションを用いてコード化され、順次投影されるストリングに沿って時間の進行(ピクセルシーケンシャルのシーケンス)に目に見えるようにマーク付けして、同時に各ポイントに空間アイデンティティ及び認識可能な特異性をストリングセクションに追加し、従来のフレーム露出カメラを用いるNビューモーション追跡システムにおけるNタプルに容易にマッチ可能にする。
【0194】
代替のレーザ光コード化方式、例えば急速レーザパワー強度変動を用いることができ、高解像度及び完全狭帯域フィルタ化従来カメラがシーケンスを観測するのを可能にする。この方法は、例えばレンズスタックに適用されるかなり単純なグローバル狭帯域パスフィルタを用いることによって電力を消費せず且つ高い周囲堅牢性を獲得することができる。RGBモザイクセンサの全ての第4ではなく各位置を使用することによって空間解像度を2倍大きくすることができ、この方法は空間エイリアシングから影響を受けないはずである。標準的なCMOSカメラのいわゆる8又は10ビットグレースケール精度を十分利用するための直接フィードバックによってソースレーザ光の強度を調節することができる点に留意されたい。
【0195】
一部の実施形態では、本発明のシステムは、広く空間を開けられた交互のオープンリザジューパターンを用いて3又は4以上の高速グローバルシャッターカメラで観測することができる。強度コード化ストリング状パターンは、各連続フレームの10%未満を満たすことができるが、フレームの短いシーケンス後に数(約10)連続フレームのこのようなコード化ストリングを備えた全表面をカバーする物体の表面の全3D形状を取り込むことになる。100FPSで実行するN(3又は4以上)のカメラによるフレームの出力の各セットによって、Nフレームの各セットは、進行を観測して、合計フレームエリアの極めて小さなサブセット内の個々のNタプル対応にマッチすることができる。例えば、本発明のシステムは、N10メガピクセルカメラを用いることができ、各フレーム中に照明された1メガピクセルを約10%だけ露出する。
【0196】
ストリングに沿って続けると、セクションがその形状及び相対的位置によって位置付けられる。ストリングのセクション内で、N同時記録カメラフレームの各々にマッチ、位置付ける必要のある100可能位置だけが存在できる。1マイクロ秒で、100コード(又はボクセル)が、10ナノ秒ごとに1つ投影され、これによってサーチスペースが、107Nから102Nの大きさに105Nのオーダーだけ低減される。例えば、三焦点セットアップ(N=3)に対して、これは、1マイクロ秒で百万の組み合わせの初期サーチが空間の100ボクセルの連続をマッチ及び位置付けさせる。後者は、ドゥーエーブル(1クロック当たりGPU1000並行作動)を表す。
【0197】
図19では、3又はそれ以上の(N)カメラ(C
1、C
2、C
3...、C
i...C
N)が、ロービングロボット(例えば、ロボット配送車両)又は他の車両又はデバイスに取り付けられている。カメラC
iの各々は、ロボットの周りの環境の一部として一定の視野(FoVi)サンプリングを有する。小型のアクチュエータが、一定の範囲の方位角(アルファ)及び仰角(イプシロン)などの2つの方向の各カメラの視野を回転することができる。従ってカメラは、人間の眼のように陥凹形式にすることができる。陥凹形式が、ズームインし環境における移動する物体を追跡させる。パニング及び傾きカメラと同様に、レーザプローブビーム走査システム(それ自体(モータによって起動される)でパン及び傾斜、又は回転することができる)は、関心の物体を走査するためにそれ自体で有利に向きを合わせることができる。
【0198】
配送ロボット又は他のデバイス又は車両では、観測者が見られていることを理解できるように、パンティルトカメラを意図的に眼球に似せることができる。差し迫っていない状態で実施される時にこれはユーザ対話を容易にすることができる。眼は、機械を擬人化し(ロボットを人間らしくする)、ロボット画面インタフェースに表示される眼よりも外観上で生体模倣技術に類似する。単純なモーション位置ルーチンは、レーザチップが関心の物体に反射し少なくとも3つの眼(カメラ)によって追跡され、システム100が連続する急速走査で観測されるボクセルの位置をコンピュータ計算することを保証する。
【0199】
1つの例示的処理では、初期クイック走査が物体の輪郭及び3D位置を発見する。物体連続表面、穴及び端(輪郭)は、初期クイック走査パターンによって登録される。関心の物体の全ビューを遮ることがある他の(最前面)物体によるオクルージョンが、この初期クイック走査で発見されることがある。例えば、関心の物体が車又は歩行者であると推測される場合、スマートCVシステムは、物体の予想される輪郭をサーチし、オクルージョンを取り除けるかどうか見るためにレーザブラシ位置及び/又はカメラの一部を急速に動かす。
【0200】
第2の処理段階では、意図的なカメラ又はスキャナ源の移動がオクルージョンによる走査の不連続性を克服するのを助ける。オクルージョンの個別のケースが存在でき、すなわち1)最前面物体が背景物体又は表面上に影を投げる、又は2)最前面物体が背景物体を観測するカメラの少なくとも1つに対する背景物体のビューの一部を遮る。ケース1)では、背景物体上のボクセルの軌跡を現在追跡しているカメラ-通常は少なくとも3つ-が、突然及び同時にボクセルを検出するのを止め、3Dスペースの軌跡は突然終わる。新しい物体にシフトすることができるが、突然の空間的不連続性が生じる。ケース2)では、全ての3つ(又は4以上)のカメラが同時に事象の報告を止める可能性が高い。異なる視野によって、あるとすれば、各カメラのオクルージョンは、レーザビームの走査軌跡の異なる瞬間に始まる。
【0201】
本明細書にはマルチビューピクセル順次モーション追跡システム100を用いる主要な利点がある。まず、追加の(第4)カメラがオクルージョンが起こった時間及び場所をピックアップすることができる。スポーツイベントの制御ルームのように、スマートモーションキャプチャシステムを小さなオクルージョン(例えば、3Dモーションキャプチャリグで捉えられるダンサーの手又は腕)に対してロバストにすることができる。アクティブでスタンバイしている別の第4カメラに即座に切り替えることで、同じ3D軌跡を追跡する(後者は、第4カメラの2D軌跡が、スキャナのビームのポイント及び観測可能(図示)及び予測可能な反応速度まで第1の3つのカメラからコンピュータ計算される空間軌跡の2D再投影に一致することをチェックする方式である)。
【0202】
図20に示すように、走査スポットが表面S上の軌跡に沿って走査する場合の3つのボクセル位置、V
1、V
2及びV
3が示されている。システム100の4つのカメラC
1...C4が図示されている。第1の3つは、表面Sに沿って進行するV
1などのレーザ照明ポイントを観測することができる。あるポイントでカメラC
3は、V
2に達する前にビームの検出を止め、本発明のシステムは自動的に第4カメラC
4に切り替える。
【0203】
少なくとも一部の実施形態では、3つのカメラの各々の単一のピクセルを照明する十分な光がある限り、各特徴(すなわち、レーザがマニホールドに照明されたスポットを形成する現在の位置)が、同時でなく、全て連続してではなく、次々に観測されるので、理論的最小特徴サイズは単一ピクセルである。
【0204】
システム100は、空間(ピクセル)コントラストを必要とせず、照明中も観測に対しても空間パターンが必要ない。システム100はある方法で時間を用い、他の構造化光システムは時間を用いず、両方のコントラスト及びコード化及び復号の必要性を取り除く。
【0205】
システム100は、ピクセル、フォトンの最も効率的な使用を提供する。基本的には、あらゆるピクセル観測、あらゆる「トゥイッチ」がカウントする。1メガピクセルカメラを用いる本発明のシステムは、1メガピクセルボクセル空間解像度を達成することができる。
【0206】
サブピクセル解像度は線形補間によって可能である。本発明のシステムは、物体の3D表面(「空間マニホールド」)を横断する場合にレーザビームのチップによって走査される物理的、数学的軌跡を活用することができる。これらの軌跡は、カメラの各々の表面に投影された時に、2Dピクセル事象軌跡を形成する。一連の画像ポイント(すなわち、ピクセル位置の時系列)を観測した後に、本発明のシステムは、元の真2D走査軌跡並びに各個々の観測の基本的精度より高い精度を持つ3Dマニホールド表面軌跡を直線(又は他の)補間によって推定することができる。従って、観測された輪郭線は、3Dマニホールド上に高い精度で3Dスペース内に適合することができる。
【0207】
少なくとも一部の実施形態では、本発明のシステムは、3Dマニホールド全体に細かいチップのレーザビームで滑らかな連続弧を走査することができ、(少なくとも)3つのカメラの各々の「トゥイッチ」ピクセルのトレールを起こし、各カメラで、ピクセルはその連続位置を順次アサートにする。トゥイッチピクセル軌跡のこれらの3又は4以上の同時に観測可能な高度に相関付けられるトレール(ピクセルアサーション事象の時間連続トレール)は、空間的、時間的及び/又は波長固有の方法によってまだフィルタアウトされていないセンサ又は周囲光の熱又はダークノイズによって起こるような背景ノイズから統計的に明確に突出する。RANSACなどの統計的方法は、
図23に示すような線フィットを行う前に適用し、補間された軌跡2300から統計的に大きく離れた距離の何れの「トゥイッチ」ピクセル、すなわち2つピクセル以上に空間的に離れる及び/又は時間的に異常又は軌跡の時間シーケンスに合わない何れの「トゥイッチ」ピクセルも取り除くことができる。
【0208】
少なくとも一部の実施形態では、システム100は、例えばセンシティブ高利得「トゥイッチー」検出器(市販されているSPADなど)及び大量のセンサ及び周囲ノイズを克服することができる適度の照明パワー(ミリワットレーザダイオードソースなど)を用いて、効率的及びロバストにすることができる。
【0209】
少なくとも一部の実施形態では、システム100は、何れか1つの時間に1つのポイント、1つのボクセル位置を照明する走査ビームを用いることによってフォトンを有効利用し、結果ピクセル事象が即時に時間的に連続して観測される。システムフィードバックを用いて、発せられたフォトンの大部分がマニホールド(又は物体)に向けられることが保証され、一部は、少なくとも1つ、好ましくはカメラの少なくとも3つの観測可能な信号を結果として生じる。小型のレーザダイオードは、フォトンの非常に有効なソースとすることができ、タイトビームにかなり容易に且つ効率的にコリメートすることができる。
【0210】
動力学及び瞬時フィードバックは超効率的3D知覚を可能にする。要求される走査速度、所望の精度に基づいて、一定の距離で要求されるように無線でビームの強度を調節することができ、関心の物体のアルベドを調節する。例えば、大きな且つ変化する被写界深度(例えば、対話型ARで一般的)を持つシーンを動的且つ選択的に走査することができる(例えば、関心の一定の再前面物体だけを綿密に走査する)。
【0211】
陥凹形式は電力を節約する。一般的なフレーム照明構造光システムとは異なり、システム100の少なくとも一部の実施形態では、レーザダイオードによって生成されるフォトンのほぼ100%を、マニホールドの小さな観測可能な部分を連続的に照明するために向けることができ、この態様はシステム100の電力効率に大きく寄与する。
【0212】
別の実施形態は、100度×100度の視野で最大1メートル離れた物体を走査することができるAR知覚システムである。本発明のシステムは、約20mワットの屈折力を有するブルーレイダイオードレーザソース(λ=405nm)及び1秒当たり50,000ラインを走査することができる単純2D800ミクロンMEMS共振ミラーなどの何れかの適切な光源を用いることができる。本発明のシステムは、例えば、各々が1000x1000ピクセルを持つ3つのCMOS1Mピクセル「トゥイッチーピクセル」アレイカメラなどの3又は4以上のカメラを用いる。1実施形態では、ピクセルは、各々が最適分離及び最小クロスオーバを備えたわずか1マイクロメートルである(シャロー100フォトンウエル、405nm光に高感度)。この例では、センサのアレイエリアは、1平方mmより大きくなく5t又は6tバイナリ反応「トゥイッチー」ピクセル、固定アドレス行及び列復号器、A/Dなし、及び単純シリアルストリーム出力を備えた安価なモノクロームカメラを提供する。本発明のシステムは、3つの1Mピクセルカメラによって動的にポイントを走査することができ、最大0.1度の空間解像度を結果として生じ、補間によって、0.01度(センサの1/10ピクセル)の空間精度を達成することができる。本発明のシステムは、1M距離でボクセル配置の空間精度<0.5mmを達成するはずである。例えば、10度×10度のRoIを有するフィールドの関心の小さな物体(例えばリンゴを持つ手)を、例えば、このRoI(例えば、10平方度のコーン、10000、10,00000のFoVの1%)における3D陥凹を備えた1秒当たりの1,000,000ポイントで本発明のシステムによって走査することができる。陥凹形式によって、本発明のシステムは、合計システム資源の100mW未満を用いながら最大1m距離の約500マイクロメートル容積測定精度を達成することになる。
【0213】
流れ図の例示の各ブロック、及び流れ図の例示のブロックの組み合わせ(又は1又は2以上のシステム又はシステムの組み合わせに関して上記に説明した動作)をコンピュータプログラム命令によって実施できることが理解されるであろう。これらのプログラム命令は、プロセッサで実行する命令が、流れ図のブロック又は複数のブロックに指示された動作を実施するための手段を生成するように機械を製作するためにプロセッサに提供することができる。コンピュータプログラム命令は、プロセッサによって実行し、プロセッサで実行する命令が、流れ図のブロック又は複数のブロックに指示された動作を実施するためのステップを提供するようにコンピュータ実施処理を生成させることができる。コンピュータプログラム命令は、流れ図のブロックに示された動作ステップの少なくとも一部を並行して実行させることができる。ステップの一部は、マルチプロセッサコンピュータシステムで生じるように1つより多いプロセッサにわたって実行することもできる。加えて、流れ図の例示の1又は2以上のブロック又はブロックの組み合わせは、本発明の範囲又は精神から逸脱することなく他のブロック又はブロックの組み合わせと同時に又は図示されたものとは異なるシーケンスでも実行することができる。
【0214】
加えて、1又は2以上のステップ又はブロックでは、コンピュータプログラムの代わりに、特定用途向け集積回路(ASIC)、フィールドプログラマブルゲートアレイ(FPGA)、プログラマブルアレイ論理(PAL)など、又はこれらの組み合わせなどの組み込み式論理ハードウェアを用いて実施することができる。組み込み式論理ハードウェアは、組み込み式論理を直接実行して、1又は2以上のステップ又はブロックにおける動作の一部又は全部を行うことができる。1又は2以上の実施形態(図示せず)では、ステップ又はブロックの1又は2以上の動作の一部又は全部をCPUの代わりにハードウェアマイクロコントローラによって実行することができる。1又は2以上の実施形態では、マイクロコントローラは、それに固有の組み込み式論理を直接実行して、動作を行い且つそれに固有の内部メモリ及びそれに固有の外部入力及び出力インタフェース(例えば、ハードウェアピン及び/又は無線送受信機)にアクセスしてシステムオンチップ(SOC)などの動作を行うことができる。
【0215】
上記の明細書、実施例、及びデータは、本発明の製造及び使用の完全な説明を提供する。本発明の多くの実施形態を本発明の精神及び範囲から逸脱することなく行い得るので、本発明は以下に添付の請求項に存在する。
【0216】
100 システム
102 ネットワーク
104 送信機
106a 106b 106c 106d 受信機
108 物体
110 コンピュータ
112 コンピュータ
114 コンピュータ