(58)【調査した分野】(Int.Cl.,DB名)
前記物体認識手順を実行することは、前記現実のシーンの複数の画像フレームのうちの1つまたは複数に関する前記境界内の第1の領域上の物体認識手順を実行することを備え、前記方法はさらに、
前記境界内で物体が認識された連続回数である第1のカウント、または、前記境界内で物体が認識された回数である第2のカウントを、メモリに記憶することを備える、請求項1に記載の方法。
前記境界内の第1の領域において物体が認識されない場合、前記方法はさらに、前記境界内の第1の領域の中心へとズームする動作、前記境界を拡大する動作、または、省電力状態に入る動作、のうちの少なくとも1つを実行することを備える、請求項1に記載の方法。
前記物体認識手順を実行することは、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行することを備え、前記方法はさらに、
前記境界内で物体が認識された回数のカウントをメモリに記憶することを備える、請求項1に記載の方法。
前記物体認識手順を実行するための手段は、前記現実のシーンにおける複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行するように構成され、前記装置はさらに、
前記境界内で物体が認識された連続回数である第1のカウント、または、前記境界内で物体が認識された回数である第2のカウントを記憶するための手段を備え、
前記第1のカウントまたは前記第2のカウントがしきい値を超えたか否かを判定するための手段と、
前記第1のカウントまたは前記第2のカウントが前記しきい値を超えた場合に、前記物体を強調するための手段と、
前記第1のカウントまたは前記第2のカウントが前記しきい値を超えた場合に、前記物体に近接したアイコンを表示するための手段と
をさらに備える請求項10に記載の装置。
少なくとも1つの動作を実行するための手段をさらに備え、前記少なくとも1つの動作は、前記境界内の第1の領域において物体が認識されていない場合省電力状態に入る動作、前記境界を拡大する動作、または前記境界内の第1の領域の中心へとズームする動作、のうちの少なくとも1つを備える、請求項10に記載の装置。
前記物体認識手順を実行するための手段は、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行するように構成され、前記装置はさらに、
前記境界内において物体が認識された回数のカウントを記憶するための手段を備え、
物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定するための手段と、
前記カウントが、前記しきい値を超えたか否かを判定するための手段と、
前記カウントが前記しきい値を超えた場合、前記物体を強調するための手段と、
前記カウントが前記しきい値を超えた場合、前記物体に近接したアイコンを表示するための手段と
をさらに備える請求項10に記載の装置。
【発明を実施するための形態】
【0006】
[0023]添付図面とともに以下に説明する詳細な説明は、さまざまな構成の説明として意図されており、本明細書に記載された概念が実現される唯一の構成を表すことは意図されていない。この詳細な説明は、さまざまな概念の完全な理解を提供することを目的とした具体的な詳細を含んでいる。しかしながら、これらの概念は、これら具体的な詳細無しで実現されうることが当業者に明らかになるであろう。いくつかの事例では、周知の構成および構成要素が、このような概念を曖昧にすることを避けるために、ブロック図形式で示されている。
【0007】
[0024]拡張現実デバイスを制御するためのいくつかの態様が、さまざまな装置および方法に関して示されるであろう。これらの装置および方法は、さまざまなブロック、モジュール、構成要素、回路、ステップ、処理、アルゴリズム等によって、後述する詳細な説明に記述されており、添付図面に例示される。(集合的に「要素」と称される)これらの要素は、電子ハードウェア、コンピュータ・ソフトウェア、またはこれら任意の組み合わせを用いて実現されうる。それら要素がハードウェアとしてまたはソフトウェアとして実現されるかは、特定のアプリケーションおよびシステム全体に課せられている設計制約に依存する。
【0008】
[0025]例として、要素、要素の任意の部分、または、要素の任意の組み合わせは、1または複数のプロセッサを含む「処理システム」を用いて実現されうる。プロセッサの例は、マイクロプロセッサ、マイクロコントローラ、デジタル信号プロセッサ(DSP)、フィールド・プログラマブル・ゲート・アレイ(FPGA)、プログラマブル論理デバイス(PLD)、順序回路、ゲート・ロジック、ディスクリート・ハードウェア回路、およびこの開示の全体にわたって記載されたさまざまな機能を実行するように構成されたその他の適切なハードウェアを含んでいる。処理システムにおける1または複数のプロセッサは、ソフトウェアを実行しうる。ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語、またはその他で称されるに関わらず、命令群、命令群セット、コード、コード・セグメント、プログラム・コード、プログラム、サブプログラム、ソフトウェア・モジュール、アプリケーション、ソフトウェア・アプリケーション、パッケージ・ソフト、ルーチン、サブルーチン、オブジェクト、実行形式、実行スレッド、手順、機能等を意味するように広く解釈されるものとする。
【0009】
[0026]したがって、1または複数の典型的な実施形態では、記載された機能は、ハードウェア、ソフトウェア、ファームウェア、あるいはそれらの任意の組み合わせによって実現されうる。ソフトウェアで実現される場合、これら機能は、コンピュータ読取可能な媒体上に格納されるか、あるいは、コンピュータ読取可能な媒体上の1または複数の命令群またはコードとして符号化されうる。コンピュータ読取可能な媒体は、コンピュータ記憶媒体を含む。記憶媒体は、コンピュータによってアクセスされうる利用可能な任意の媒体である。例として、限定することなく、このようなコンピュータ読取可能な媒体は、RAM、ROM、EEPROM(登録商標)、CD−ROMまたはその他の光ディスク記憶装置、磁気ディスク記憶装置またはその他の磁気記憶デバイス、あるいは、所望のプログラム・コード手段を命令群またはデータ構造の形式で搬送または格納するために使用され、しかも、コンピュータによってアクセスされうるその他任意の媒体を備えうる。本明細書で使用されるようにディスク(diskおよびdisc)は、コンパクト・ディスク(disc)(CD)、レーザ・ディスク(disc)(登録商標)、光ディスク(disc)、デジタル多用途ディスク(disc)(DVD)、フロッピー(登録商標)ディスク(disk)、Blu−ray(登録商標)ディスク(disc)を含む。ここで、diskは通常、データを磁気的に再生し、discは、レーザを用いてデータを光学的に再生する。上記の組み合わせもまた、コンピュータ読取可能な媒体の範囲内に含まれるべきである。
【0010】
[0027]
図1は、コンテンツを表示するように構成された光学デバイス100を例示する図解である。
図1に図示されるように、光学デバイス100は、フレーム102と、つる104,106と、フレーム102に搭載されたレンズ108,110とを含む。光学デバイス100はさらに、背面カメラ112,118と、正面カメラ114,120と、センサ116,122とを含む。態様では、センサ116,122の各々は、ハンド・ジェスチャを検知するための1つまたは複数の近接タイプ・センサと、音声コマンドを検知するための1つまたは複数のマイクロホンとを含みうる。
【0011】
[0028]態様では、光学デバイス100は、ユーザが直観的な方式で毎日の環境とインタラクトすることを可能にする拡張現実(AR)ディスプレイ(「ARグラス」または「ヘッド・マウント・ディスプレイ」とも称される)として構成されうる。1つの構成では、レンズ108および/またはレンズ110は、ユーザが、光学デバイス100を装着した場合に、現実のシーンをクリアに観察することを可能にする、ガラスまたはプラスチックのようなクリアまたは透明な材料から形成されうる。光学デバイス100は、当該技術分野で周知の方法を用いて、レンズ108および/またはレンズ110を介して、デジタルAR画像のようなコンテンツを投影するように構成されうる。したがって、ユーザは、光学デバイス100を装着している間、現実のシーンと、投影されたデジタル・コンテンツとを同時に観察しうる。
【0012】
[0029]態様では、
図1に関して、正面カメラ114および/または背面カメラ120が、ユーザの視野をキャプチャしうる。ユーザがレンズ108,110を介して現実のシーンを観察すると、背面カメラ112および/または背面カメラ118は、ユーザの視線を検知しうる。レンズ108,110を介してユーザによって観察されたような現実のシーンの例が、
図2に例示されている。
図2に図示されるように、現実のシーン200は、前景に自動車202を含み、背景にマーケット204、バス標識206、およびビルディング208を含んでいる。
【0013】
[0030]
図3は、光学デバイス100のレンズ108,110を介してユーザによって観察される現実のシーン300を例示する。
図3では、ユーザは、自動車202を見つめ、光学デバイス100は、現実のシーン300内の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。その後、光学デバイス100は、領域を囲む境界310を設定しうる。光学デバイス100は、境界310内の領域において物体認識手順を実行し、境界310の外側の領域において物体認識手順を実行することを控えうる。
【0014】
[0031]
図4は、光学デバイス100のレンズ108,110を介してユーザによって観察される現実のシーン400を例示する。
図4では、自動車202が道路422に沿って移動すると、ユーザがこの自動車202を見つめ、光学デバイス100は、ユーザの視線が、移動している自動車202を追うと、この視線を検知しうる。
図4に図示されるように、光学デバイス100は先ず、ユーザの検知された視線に対応する現実のシーン400の領域に、境界409を設定しうる。その後、ユーザの視線が自動車202を追うと、光学デバイス100は、ユーザの視線を追跡し、検知された視線に対応する現実のシーン400の領域に境界410を動的に設定しうる。光学デバイス100はその後、境界410内の領域において物体認識手順を実行し、境界410の外側の領域において物体認識手順を実行することを控えうる。
【0015】
[0032]
図5は、光学デバイス100のレンズ108,110を介してユーザによって観察される現実のシーン500を例示する。
図5では、ユーザは、自動車202を見つめ、光学デバイス100は、現実のシーン500内の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。その後、光学デバイス100は、領域を囲む境界510を設定しうる。光学デバイス100は、境界510内の領域において物体認識手順を実行し、境界510の外側の領域において物体認識手順を実行することを控えうる。態様では、物体認識手順が、物体の判定に失敗したのであれば、光学デバイス100は、境界510のサイズを動的に調節しうる。例えば、
図5に図示されるように、物体認識手順が、境界510内の自動車202を特定することができないのであれば、光学デバイス100は、境界510のサイズを、境界520のサイズへと拡大させうる。1つの構成では、境界のサイズは、予め決定された量、拡大されうる。例えば、モバイル・デバイスは、オリジナルの境界のサイズを2倍にすることにより、境界のサイズを拡大させうる。
【0016】
[0033]別の態様では、
図6に図示されるように、光学デバイス100は境界のサイズを縮小させうる。例えば、光学デバイス100のバッテリ電力レベルが低く、光学デバイス100が省電力状態で動作しているのであれば、光学デバイス100は、境界630を、現実のシーン600の境界640のサイズへと縮小させうる。1つの構成では、境界のサイズは、予め決定された量、縮小されうる。例えば、光学デバイス100は、オリジナルの境界のサイズの半分に、境界のサイズを縮小させうる。光学デバイス100はその後、境界640内の領域において物体認識手順を実行し、境界640の外側の領域において物体認識手順を実行することを控えうる。したがって、境界のサイズを縮小し、縮小された境界内の領域において物体認識手順を実行することによって、光学デバイス100は、物体を認識するために必要な処理量を低減し、もって、バッテリ電力を節約しうる。
【0017】
[0034]
図7は、光学デバイス100のレンズ108,110を介してユーザによって観察される現実のシーン700を例示する。
図7では、ユーザは、バス標識206を見つめ、光学デバイス100は、現実のシーン700の領域におけるユーザの視線を検知しうる。ここで、バス標識206は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。光学デバイス100は、領域を囲む境界710を設定しうる。光学デバイス100はその後、境界710内の領域において物体認識手順を実行し、境界710の外側の領域において物体認識手順を実行することを控えうる。態様では、光学デバイス100は、
図8の現実のシーン800に図示されるような、境界710内の現実のシーン700の一部の拡大(「ズーム」とも称される)を調節しうる。態様では、光学デバイス100は、センサ116および/またはセンサ122を介して受け取られた音声コマンドおよび/またはハンド・ジェスチャに応じて拡大を実行しうる。1つの構成では、ハンド・ジェスチャは、「ピンチ・ズーム」ジェスチャでありうる。別の態様では、ユーザの視線の持続期間が、時間しきい値を超えた場合、光学デバイス100は、拡大を実行しうる。別の態様では、光学デバイス100は、物体をより良好に見せるために、境界710内の物体が時間しきい値を超える前に認識された場合に、拡大を実行しうる。1つの構成では、光学デバイス100によって物体に近接して表示される(
図8に図示されていない)アプリケーション・アイコンもまた拡大されうる。
【0018】
[0035]
図9は、光学デバイス100のレンズ108,110を介してユーザによって観察される現実のシーン900を例示する。
図9では、ユーザが、自動車202を見つめ、光学デバイス100が、現実のシーン900の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。その後、光学デバイス100は、領域を囲む境界910を設定しうる。光学デバイス100は、1つまたは複数の写真編集ツールを含む写真編集インタフェース912を表示しうる。これは、正面カメラ114および/または正面カメラ120を用いて現実のシーン900の写真をキャプチャする前に、境界910内の領域を編集するために使用されうる。例えば、写真編集ツールは、アート・フィルタ・アプリケーション・ツール914、および/または、例えば、クリップ・アート挿入ツール、彩度ツール、セピア・トーン変換ツール、および黒白変換ツールのようなその他の写真編集ツールを含みうる。態様では、写真編集ツールは、センサ116および/またはセンサ122を介して受け取られたハンド・ジェスチャおよび/または音声コマンドに応じて、適用または無効化されうる。光学デバイス100は、以前に説明された写真編集ツールを用いて編集されたような現実のシーン900の写真をキャプチャおよび記憶しうる。
【0019】
[0036]
図10は、光学デバイス100のレンズ108,110を介してユーザによって観察される現実のシーン1000を例示する。
図10では、ユーザが、自動車202を見つめ、光学デバイス100が、現実のシーン1000の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。その後、光学デバイス100は、領域を囲む境界1010を設定しうる。光学デバイス100はその後、境界1010内の領域において物体認識手順を実行し、境界1010の外側の領域において物体認識手順を実行することを控えうる。光学デバイス100はその後、自動車202を認識し、
図10に図示されているように、自動車202を強調しうる。
図10の構成では、光学デバイス100は、センサ116および/またはセンサ122を介して受け取られたハンド・ジェスチャおよび/または音声コマンドに応じて、光学デバイス100のメモリに、認識された自動車202を記憶しうる。ユーザは、その後、自動車1002を見つめ、光学デバイス100は、現実のシーン1000の領域におけるユーザの視線を検知しうる。ここで、自動車1002は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。光学デバイス100は、領域を囲む境界1012を設定しうる。光学デバイス100はその後、境界1012内の領域において物体認識手順を実行し、境界1012の外側の領域において物体認識手順を実行することを控えうる。その後、光学デバイス100は、自動車1002を認識しうる。光学デバイス100は、センサ116および/またはセンサ122を介して受け取られたハンド・ジェスチャおよび/または音声コマンドに応じて、光学デバイス100のメモリに、認識された自動車1002を記憶しうる。その後、光学デバイス100は、以前に認識され記憶された自動車202を、自動車1002と比較しうる。光学デバイス100は、自動車202が、自動車1002と同じであるか、または異なっているのかを示しうる。
【0020】
[0037]
図11は、コンテンツを表示するように構成された光学デバイスのための方法のフローチャート1100である。ステップ1102において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。態様では、
図1に示すように、ユーザが、光学デバイス100のレンズ108,110を介して現実のシーンを観察すると、背面カメラ112および/または背面カメラ118が、ユーザの視線を検知しうる。現実のシーンは、光学デバイス100のユーザの視野内の物理的環境を含みうる。レンズ108,110を介してユーザによって観察されるような現実のシーンの例が、
図2に例示されている。
図2に図示されるように、現実のシーン200は、前景に自動車202を含み、背景にマーケット204、バス標識206、およびビルディング208を含んでいる。他の態様では、現実のシーンは、自宅、事務所、または図書館の内部のような屋内の現実のシーンでありうる。例えば、ユーザが、自動車202を見つめ、光学デバイス100は、現実のシーン200の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。
【0021】
[0038]ステップ1104では、光学デバイス100が、第1の領域を囲む境界を設定する。この境界は、現実のシーンにおける少なくとも第2の領域を除外している。例えば、
図3に関して、光学デバイス100は、自動車202が位置決めされる現実のシーン300の領域を囲む境界310を設定しうる。態様では、この境界は、ユーザが光学デバイス100を用いて現実のシーンを観察すると、現実のシーン300の一部を覆い隠すように、光学デバイス100のレンズ108および/またはレンズ110において表示されうる。本明細書では、光学デバイス100によって設定された境界が、長方形の形状を有するものとして記載されているが、境界は、円形状のような多くの異なる形状のうちの何れかを有することが理解されるべきである。
【0022】
[0039]ステップ1106では、光学デバイス100が、境界内の第1の領域において物体認識手順を実行する。例えば、
図3に関して、光学デバイス100は、境界310内の領域において物体認識手順を実行しうる。1つの構成では、光学デバイス100は、正面カメラ114および/または正面カメラ120を用いて現実のシーン300の画像をキャプチャし、境界310内の領域に対応する画像の領域において物体認識アルゴリズムを適用することによって、物体認識手順を実行しうる。光学デバイス100は、物体を認識するために、物体認識アルゴリズムによって生成されたデータが、物体データベース内の物体の何れかに一致するか否かを判定するために、このデータを、物体データベースと比較しうる。態様では、データベースは、光学デバイス100内に記憶されうる。例えば、
図3に関して、光学デバイス100は、物体認識アルゴリズムによって生成されたデータが、物体データベースにおいて自動車として特定された物体に一致していると判定しうる。
【0023】
[0040]ステップ1108では、光学デバイス100は、少なくとも第2の領域において物体認識手順を実行することを控える。例えば、
図3に関して、光学デバイス100は、境界310の外側の、現実のシーン300の領域において物体認識手順を実行することを控えうる。
【0024】
[0041]
図12は、コンテンツを表示するように構成された光学デバイスのための方法のフローチャート1200である。ステップ1202において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。態様では、
図1に示すように、ユーザが、光学デバイス100のレンズ108,110を介して現実のシーンを観察すると、背面カメラ112および/または背面カメラ118が、ユーザの視線を検知しうる。現実のシーンは、光学デバイス100のユーザの視野内の物理的環境を含みうる。レンズ108,110を介してユーザによって観察されるような現実のシーンの例が、
図2に例示されている。
図2に図示されるように、現実のシーン200は、前景に自動車202を含み、背景にマーケット204、バス標識206、およびビルディング208を含んでいる。他の態様では、現実のシーンは、自宅、事務所、または図書館の内部のような屋内の現実のシーンでありうる。例えば、ユーザは自動車202を見つめ、光学デバイス100は、現実のシーン200の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。
【0025】
[0042]ステップ1204では、光学デバイス100が、第1の領域を囲む境界を設定する。この境界は、現実のシーンにおける少なくとも第2の領域を除外している。例えば、
図4に関して、光学デバイス100は、自動車202が位置決めされる領域を囲む境界409を設定しうる。態様では、ユーザが光学デバイス100を用いて現実のシーンを観察すると、境界が、現実のシーンの一部に重なるように、光学デバイス100のレンズ108および/またはレンズ110において表示されうる。本明細書では、光学デバイス100によって設定された境界が、長方形の形状を有するものとして記載されているが、境界は、円形状のような多くの異なる形状のうちの何れかを有することが理解されるべきである。
【0026】
[0043]ステップ1206では、光学デバイス100が、境界内の第1の領域において物体認識手順を実行する。例えば、
図4に関して、光学デバイス100は、境界409内の領域において物体認識手順を実行しうる。1つの構成では、光学デバイス100は、正面カメラ114および/または正面カメラ120を用いて現実のシーン400の画像をキャプチャし、境界409内の領域に対応する画像の領域において物体認識アルゴリズムを適用することによって、物体認識手順を実行しうる。光学デバイス100は、物体を認識するために、物体認識アルゴリズムによって生成されたデータが、物体データベース内の物体の何れかに一致するか否かを判定するために、このデータを、物体データベースと比較しうる。態様では、データベースは、光学デバイス100内に記憶されうる。例えば、
図4に関して、光学デバイス100は、物体認識アルゴリズムによって生成されたデータが、物体データベースにおいて自動車として特定された物体に一致していると判定しうる。
【0027】
[0044]ステップ1208では、光学デバイス100は、少なくとも第2の領域において物体認識手順を実行することを控える。例えば、
図4に関して、光学デバイス100は、境界409の外側の、現実のシーン400の領域において物体認識手順を実行することを控えうる。
【0028】
[0045]ステップ1210では、光学デバイス100は、現実のシーンにおける第3の領域における視線を検知する。例えば、ユーザは、自動車202が道路422に沿って移動すると、自動車202を見つめ、光学デバイス100は、現実のシーン400の領域においてユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。
【0029】
[0046]ステップ1212では、光学デバイス100が、第3の領域を囲む境界を設定する。この境界は、現実のシーンにおける少なくとも第4の領域を除外する。例えば、
図4に関して、光学デバイス100は、自動車202が位置決めされる領域を囲む境界410を設定しうる。態様では、ユーザが光学デバイス100を用いて現実のシーンを観察すると、境界が、現実のシーンの一部に重なるように、光学デバイス100のレンズ108および/またはレンズ110において表示されうる。
【0030】
[0047]ステップ1214では、光学デバイス100が、境界内の第3の領域において物体認識手順を実行する。例えば、
図4に関して、光学デバイス100は、境界410内の領域において物体認識手順を実行しうる。1つの構成では、光学デバイス100は、正面カメラ114および/または正面カメラ120を用いて現実のシーン400の画像をキャプチャし、境界410内の領域に対応する画像の領域において物体認識アルゴリズムを適用することによって、物体認識手順を実行しうる。光学デバイス100は、物体を認識するために、物体認識アルゴリズムによって生成されたデータが、物体データベース内の物体の何れかに一致するか否かを判定するために、このデータを、物体データベースと比較しうる。態様では、データベースは、光学デバイス100内に記憶されうる。例えば、
図4に関して、光学デバイス100は、物体認識アルゴリズムによって生成されたデータが、物体データベースにおいて自動車として特定された物体に一致していると判定しうる。
【0031】
[0048]ステップ1216では、光学デバイス100が、少なくとも第4の領域において物体認識手順を実行することを控える。例えば、
図4に関して、光学デバイス100は、境界410の外側の、現実のシーン400の領域において物体認識手順を実行することを控えうる。
【0032】
[0049]
図13は、コンテンツを表示するように構成された光学デバイスのための方法のフローチャート1300である。ステップ1302において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。態様では、
図1に示すように、ユーザが、光学デバイス100のレンズ108,110を介して現実のシーンを観察すると、背面カメラ112および/または背面カメラ118が、ユーザの視線を検知しうる。現実のシーンは、光学デバイス100のユーザの視野内の物理的環境を含みうる。レンズ108,110を介してユーザによって観察されるような現実のシーンの例が、
図2に例示されている。
図2に図示されるように、現実のシーン200は、前景に自動車202を含み、背景にマーケット204、バス標識206、およびビルディング208を含んでいる。他の態様では、現実のシーンは、自宅、事務所、または図書館の内部のような屋内の現実のシーンでありうる。例えば、ユーザは自動車202を見つめ、光学デバイス100は、現実のシーン200の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。
【0033】
[0050]ステップ1304では、光学デバイス100が、第1の領域を囲む境界を設定する。この境界は、現実のシーンにおける少なくとも第2の領域を除外している。例えば、
図3に関して、光学デバイス100は、自動車202が位置決めされる領域を囲む境界310を設定しうる。態様では、境界は、光学デバイス100のレンズ108および/またはレンズ110に表示され、これによって、ユーザが、光学デバイス100を用いて現実のシーンを観察すると、この境界が、現実のシーンのユーザの視野重なるようになる。本明細書では、光学デバイス100によって設定された境界が、長方形の形状を有するものとして記載されているが、境界は、円形状のような多くの異なる形状のうちの何れかを有することが理解されるべきである。
【0034】
[0051]ステップ1306では、光学デバイス100が、境界内の第1の領域において物体認識手順を実行する。例えば、
図3に関して、光学デバイス100は、境界310内の領域において物体認識手順を実行しうる。1つの構成では、光学デバイス100は、1つまたは複数の画像フレームを生成するために、正面カメラ114および/または正面カメラ120を用いて、現実のシーン300の1つまたは複数の画像をキャプチャすることによって、物体認識手順を実行しうる。その後、光学デバイス100は、境界310内の領域に対応する1つまたは複数の画像フレームの領域において物体認識アルゴリズムを適用しうる。光学デバイス100は、物体を認識するために、各画像フレームについて物体認識アルゴリズムによって生成されたデータを、物体データベースと比較し、このデータが、物体データベースにおける物体の何れかにマッチするか否かを判定しうる。態様では、データベースは、光学デバイス100内に記憶されうる。例えば、
図3に関して、光学デバイス100は、物体認識アルゴリズムによって生成されたデータが、物体データベースにおいて自動車として特定された物体に一致していると判定しうる。
【0035】
[0052]ステップ1308では、光学デバイス100は、少なくとも第2の領域において物体認識手順を実行することを控える。例えば、
図3に関して、光学デバイス100は、境界310の外側の、現実のシーン300の領域において物体認識手順を実行することを控えうる。
【0036】
[0053]ステップ1310では、光学デバイス100は、物体が境界内で認識された連続回数のカウントを記憶する。1つの構成では、このカウントは、連続する画像フレームの各々において、境界内で物体が認識された回数を表しうる。態様では、光学デバイス100はさらに、正しく認識された各物体を記憶しうる。
【0037】
[0054]ステップ1312では、光学デバイス100は、カウントがしきい値を超えたか否かを判定しうる。例えば、しきい値は、予め決定された整数でありうる。カウントがしきい値を超えるのであれば、ステップ1314において、光学デバイス100は、物体を強調しうる。態様では、光学デバイス100は、物体が位置する領域に対応する光学デバイス100のレンズ108および/またはレンズ110の領域に透明色(例えば、黄色)を表示することによって、物体を強調しうる。これによって、ユーザが物体を観察する場合、物体が強調されるように見える。別の態様では、光学デバイス100はさらに、カウントが、予め決定された期間内にしきい値を超えたか否かを判定し、予め決定された期間を超えているのであれば、最も早期の画像フレームを落としうる。
【0038】
[0055]ステップ1316では、光学デバイス100は、物体に近接したアイコンを表示しうる。態様では、光学デバイス100は、物体が位置しているところに近接した領域に対応する光学デバイス100のレンズ108および/またはレンズ110の領域にアイコンを表示しうる。1つの構成では、アイコンは、光学デバイス100の機能を開始するように構成されうる。別の構成では、アイコンは、物体に関連する情報を提供するように構成されうる。
【0039】
[0056]カウントがしきい値を超えない(1312)のであれば、ステップ1302において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。
【0040】
[0057]
図14は、コンテンツを表示するように構成された光学デバイスのための方法のフローチャート1400である。ステップ1402において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。1つの構成では、光学デバイス100は、音声コマンドおよび/またはハンド・ジェスチャに応じて、視線検知を開始しうる。態様では、
図1に示すように、ユーザが、光学デバイス100のレンズ108,110を介して現実のシーンを観察すると、背面カメラ112および/または背面カメラ118が、ユーザの視線を検知しうる。現実のシーンは、光学デバイス100のユーザの視野内の物理的環境を含みうる。レンズ108,110を介してユーザによって観察されるような現実のシーンの例が、
図2に例示されている。
図2に図示されるように、現実のシーン200は、前景に自動車202を含み、背景にマーケット204、バス標識206、およびビルディング208を含んでいる。他の態様では、現実のシーンは、自宅、事務所、または図書館の内部のような屋内の現実のシーンでありうる。例えば、ユーザが、自動車202を見つめ、光学デバイス100は、現実のシーン200の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。
【0041】
[0058]ステップ1404では、光学デバイス100が、第1の領域を囲む境界を設定する。この境界は、現実のシーンにおける少なくとも第2の領域を除外している。例えば、
図3に関して、光学デバイス100は、第1の領域を囲む境界310を設定しうる。態様では、境界は、光学デバイス100のレンズ108および/またはレンズ110に表示されうる。これによって、ユーザが、光学デバイス100を用いて、現実のシーンを観察すると、境界が、現実のシーンのユーザの視野に重なるようになる。本明細書では、光学デバイス100によって設定された境界が、長方形の形状を有するものとして記載されているが、境界は、円形状のような多くの異なる形状のうちの何れかを有することが理解されるべきである。
【0042】
[0059]ステップ1406では、光学デバイス100が、境界内の第1の領域において物体認識手順を実行する。例えば、
図3に関して、光学デバイス100は、境界310内の領域において物体認識手順を実行しうる。1つの構成では、光学デバイス100は、1つまたは複数の画像フレームを生成するために、正面カメラ114および/または正面カメラ120を用いて、現実のシーン300の1つまたは複数の画像をキャプチャすることによって、物体認識手順を実行しうる。その後、光学デバイス100は、境界310内の領域に対応する1つまたは複数の画像フレームの領域において物体認識アルゴリズムを適用しうる。光学デバイス100は、物体を認識するために、各画像フレームについて物体認識アルゴリズムによって生成されたデータを、物体データベースと比較し、このデータが、物体データベースにおける物体の何れかにマッチするか否かを判定しうる。態様では、データベースは、光学デバイス100内に記憶されうる。例えば、
図3に関して、光学デバイス100は、物体認識アルゴリズムによって生成されたデータが、物体データベースにおいて自動車として特定された物体に一致していると判定しうる。
【0043】
[0060]ステップ1408では、光学デバイス100は、少なくとも第2の領域において物体認識手順を実行することを控える。例えば、
図3に関して、光学デバイス100は、境界310の外側の、現実のシーン300の領域において物体認識手順を実行することを控えうる。
【0044】
[0061]ステップ1410では、光学デバイス100は、物体が境界内において認識された回数のカウントを記憶する。1つの構成では、カウントは、画像フレームのうちの1つまたは複数における境界内において物体が認識された回数を表しうる。態様では、光学デバイス100はさらに、正しく認識された各物体を記憶しうる。
【0045】
[0062]ステップ1412では、光学デバイス100は、物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定しうる。態様では、しきい値は整数でありうる。例えば、物体のタイプが、ビルディングのように、静止しており、識別することが単純である場合、より低いしきい値が使用されうる。別の例として、物体のタイプが自動車のように、移動しており、識別することがより困難である場合、より高いしきい値が使用されうる。
【0046】
[0063]ステップ1414では、光学デバイス100は、カウントがしきい値を超えたか否かを判定しうる。カウントがしきい値を超えるのであれば、ステップ1416において、光学デバイス100は、物体を強調しうる。態様では、光学デバイス100は、物体が位置する領域に対応する光学デバイス100のレンズ108および/またはレンズ110の領域に透明色(例えば、黄色)を表示することによって、物体を強調しうる。これによって、ユーザが物体を観察する場合、物体が強調されるように見える。別の態様では、光学デバイス100はさらに、カウントが、予め決定された期間内にしきい値を超えたか否かを判定し、予め決定された期間を超えているのであれば、最も早期の画像フレームを落としうる。
【0047】
[0064]ステップ1418では、光学デバイス100は、物体に近接したアイコンを表示しうる。態様では、光学デバイス100は、物体が位置しているところに近接した領域に対応する光学デバイス100のレンズ108および/またはレンズ110の領域にアイコンを表示しうる。1つの構成では、アイコンは、光学デバイス100の機能を開始するように構成されうる。別の構成では、アイコンは、物体に関連する情報を提供するように構成されうる。
【0048】
[0065]カウントがしきい値を超えない(1414)のであれば、ステップ1402において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。
【0049】
[0066]
図15は、コンテンツを表示するように構成された光学デバイスのための方法のフローチャート1500である。ステップ1502において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。1つの構成では、光学デバイス100は、音声コマンドおよび/またはハンド・ジェスチャに応じて、視線検知を開始しうる。態様では、
図1に示すように、ユーザが、光学デバイス100のレンズ108,110を介して現実のシーンを観察すると、背面カメラ112および/または背面カメラ118が、ユーザの視線を検知しうる。現実のシーンは、光学デバイス100のユーザの視野内の物理的環境を含みうる。レンズ108,110を介してユーザによって観察されるような現実のシーンの例が、
図2に例示されている。
図2に図示されるように、現実のシーン200は、前景に自動車202を含み、背景にマーケット204、バス標識206、およびビルディング208を含んでいる。他の態様では、現実のシーンは、自宅、事務所、または図書館の内部のような屋内の現実のシーンでありうる。例えば、ユーザは自動車202を見つめ、光学デバイス100は、現実のシーン200の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。
【0050】
[0067]ステップ1504では、光学デバイス100が、第1の領域を囲む境界を設定する。この境界は、現実のシーンにおける少なくとも第2の領域を除外している。例えば、
図3に関して、光学デバイス100は、自動車202が位置決めされる現実のシーン200の領域を囲む境界310を設定しうる。態様では、ユーザが光学デバイス100を用いて現実のシーンを観察すると、境界が、現実のシーンの一部に重なるように、光学デバイス100のレンズ108および/またはレンズ110において表示されうる。本明細書では、光学デバイス100によって設定された境界が、長方形の形状を有するものとして記載されているが、境界は、円形状のような多くの異なる形状のうちの何れかを有することが理解されるべきである。
【0051】
[0068]ステップ1506では、光学デバイス100は、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つを受け取る。態様では、音声コマンドおよびジェスチャ・コマンドは、光学デバイス100のセンサ116および/またはセンサ122を介して受け取られうる。
【0052】
[0069]ステップ1508では、光学デバイス100は、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに応じて、境界内の第1の領域の拡大を調節しうる。例えば、
図7における現実のシーン700に関して、光学デバイス100は、
図8の現実のシーン800において図示されるような、境界710内の現実のシーン700の部分の拡大を調節しうる。態様では、光学デバイス100は、音声コマンドおよび/またはハンド・ジェスチャに応じて拡大を実行しうる。1つの構成では、ハンド・ジェスチャは、「ピンチ・ズーム」ジェスチャであり、ユーザが、ピンチ・ジェスチャを実行すると、境界710内の現実のシーン700の一部の拡大が増加される。
【0053】
[0070]ステップ1510では、光学デバイス100が、境界内の第1の領域において物体認識手順を実行する。例えば、
図3に関して、光学デバイス100は、境界310内の領域において物体認識手順を実行しうる。1つの構成では、光学デバイス100は、正面カメラ114および/または正面カメラ120を用いて現実のシーン300の画像をキャプチャし、境界310内の領域に対応する画像の領域において物体認識アルゴリズムを適用することによって、物体認識手順を実行しうる。光学デバイス100は、物体を認識するために、物体認識アルゴリズムによって生成されたデータが、物体データベース内の物体の何れかに一致するか否かを判定するために、このデータを、物体データベースと比較しうる。態様では、データベースは、光学デバイス100内に記憶されうる。例えば、
図3に関して、光学デバイス100は、物体認識アルゴリズムによって生成されたデータが、物体データベースにおいて自動車として特定された物体に一致していると判定しうる。
【0054】
[0071]ステップ1512では、光学デバイス100は、少なくとも第2の領域において物体認識手順を実行することを控える。例えば、
図3に関して、光学デバイス100は、境界310の外側の、現実のシーン300の領域において物体認識手順を実行することを控えうる。
【0055】
[0072]ステップ1514では、光学デバイス100は、境界内の第1の領域の中心へとズームする動作、境界を拡大する動作、または省電力状態に入る動作、のうちの少なくとも1つを実行する。態様では、ユーザの視線の持続時間が、時間しきい値を超える場合、光学デバイス100は、境界内の第1の領域の中心にズームしうる。その他の態様では、物体をより良好に見るために、境界内の物体が、時間しきい値を超える前に認識された場合、光学デバイス100は、境界内の第1の領域の中心にズームしうる。1つの構成では、光学デバイス100はまた、物体に近接した1つまたは複数のアプリケーション・アイコンへズームしうる。
【0056】
[0073]例えば、
図5に関して、物体認識手順が物体を判定することに失敗したのであれば、光学デバイス100は、境界510のサイズを動的に調節しうる。例えば、物体認識手順が、境界510内の自動車202を識別することができないのであれば、光学デバイス100は、境界510のサイズを、境界520のサイズに拡大させうる。1つの構成では、境界のサイズは、予め決定された量、拡大されうる。例えば、光学デバイス100は、オリジナルの境界のサイズを2倍にすることにより、境界のサイズを拡大させうる。
【0057】
[0074]ステップ1516では、光学デバイス100は少なくとも1つの写真編集ツールを表示する。態様では、
図9に関して、光学デバイス100は、1つまたは複数の写真編集ツールを含む写真編集インタフェース912を表示しうる。例えば、写真編集ツールは、アート・フィルタ・アプリケーション・ツール914、および/または、例えば、クリップ・アート挿入ツール、彩度ツール、セピア・トーン変換ツール、および黒白変換ツールのようなその他の写真編集ツールを含みうる。態様では、写真編集ツールは、センサ116および/またはセンサ122を介して受け取られたハンド・ジェスチャおよび/または音声コマンドに応じて、適用または無効化されうる。
【0058】
[0075]ステップ1518では、光学デバイス100は、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに基づいて、少なくとも1つの写真編集ツールを使用して、境界内の第1の領域を編集しうる。例えば、
図9に関して、少なくとも1つの写真編集ツールは、正面カメラ114および/または正面カメラ120を用いて、現実のシーン900の写真をキャプチャする前に、境界910内の領域を編集するために使用されうる。
【0059】
[0076]ステップ1520では、光学デバイス100は、編集された第1の領域の画像を記憶しうる。例えば、
図9に関して、光学デバイス100は、以前に説明された写真編集ツールを使用して編集されたものとして現実のシーン900の写真をキャプチャおよび記憶しうる。
【0060】
[0077]
図16は、コンテンツを表示するように構成された光学デバイスのための方法のフローチャート1600である。ステップ1602において、光学デバイス100は、現実のシーンにおける第1の領域における視線を検知する。態様では、
図10に示すように、ユーザが、光学デバイス100のレンズ108,110を介して現実のシーンを観察すると、背面カメラ112および/または背面カメラ118が、ユーザの視線を検知しうる。現実のシーンは、光学デバイス100のユーザの視野内の物理的環境を含みうる。レンズ108,110を介してユーザによって観察されるような現実のシーンの例が、
図10に例示されている。
図10に図示されるように、現実のシーン1000は、前景に自動車202を含み、背景にマーケット204、バス標識206、およびビルディング208を含んでいる。他の態様では、現実のシーンは、自宅、事務所、または図書館の内部のような屋内の現実のシーンでありうる。例えば、ユーザは自動車202を見つめ、光学デバイス100は、現実のシーン1000の領域におけるユーザの視線を検知しうる。ここで、自動車202は、背面カメラ112および/または背面カメラ118を用いて位置決めされる。
【0061】
[0078]ステップ1604では、光学デバイス100が、第1の領域を囲む境界を設定する。この境界は、現実のシーンにおける少なくとも第2の領域を除外している。例えば、
図10に関して、光学デバイス100は、自動車202が位置決めされる領域を囲む境界1010を設定しうる。態様では、ユーザが光学デバイス100を用いて現実のシーンを観察すると、境界が、現実のシーンの一部を覆い隠すように、光学デバイス100のレンズ108および/またはレンズ110において表示されうる。本明細書では、光学デバイス100によって設定された境界が、長方形の形状を有するものとして記載されているが、境界は、円形状のような多くの異なる形状のうちの何れかを有することが理解されるべきである。
【0062】
[0079]ステップ1606では、光学デバイス100が、境界内の第1の領域において物体認識手順を実行する。例えば、
図10に関して、光学デバイス100は、境界1010内の領域において物体認識手順を実行しうる。1つの構成では、光学デバイス100は、正面カメラ114および/または正面カメラ120を用いて現実のシーン1000の画像をキャプチャし、境界1010内の領域に対応する画像の領域において物体認識アルゴリズムを適用することによって、物体認識手順を実行しうる。光学デバイス100は、物体を認識するために、物体認識アルゴリズムによって生成されたデータが、物体データベース内の物体の何れかに一致するか否かを判定するために、このデータを、物体データベースと比較しうる。態様では、データベースは、光学デバイス100内に記憶されうる。例えば、
図10に関して、光学デバイス100は、物体認識アルゴリズムによって生成されたデータが、物体データベースにおいて自動車として特定された物体に一致していると判定しうる。
【0063】
[0080]ステップ1608では、光学デバイス100は、少なくとも第2の領域において物体認識手順を実行することを控える。例えば、
図10に関して、光学デバイス100は、境界1010の外側の、現実のシーン1000の領域において物体認識手順を実行することを控えうる。
【0064】
[0081]ステップ1610では、モバイル・デバイスは、第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第1の認識された物体を記憶する。例えば、
図10に関して、光学デバイス100は、第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、光学デバイス100のメモリ内に自動車202を記憶しうる。
【0065】
[0082]ステップ1612では、光学デバイス100は、第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第2の認識された物体を記憶する。例えば、
図10に関して、光学デバイス100は、境界1012内の自動車1002を認識し、第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、光学デバイス100のメモリに、自動車1002を記憶しうる。
【0066】
[0083]ステップ1614では、光学デバイス100は、少なくとも第1の認識された物体を、第2の認識された物体と比較する。態様では、光学デバイス100は、自動車202が、自動車1002と同じであるか、または、異なっているのかを示しうる。
【0067】
[0084]
図17は、典型的な装置1702における異なるモジュール/手段/構成要素の動作を例示する概念的なフロー
図1700である。装置1702は、
図1に図示される光学デバイス100のような光学デバイスでありうる。装置1702は、視線検知モジュール1703、境界設定モジュール1704、物体認識モジュール1706、物体認識禁止モジュール1708、受け取りモジュール1710、拡大調節モジュール1712、写真編集ツール表示モジュール1714、編集モジュール1716、しきい値設定モジュール1718、判定モジュール1720、記憶モジュール1722、比較モジュール1724、強調モジュール1726、アイコン表示モジュール1728、および、動作実行モジュール1730を含む。
【0068】
[0085]態様では、視線検知モジュール1703は、現実のシーンの領域におけるユーザの視線を検知する。境界設定モジュール1704は、現実のシーンの領域を囲む境界を設定する。物体認識モジュール1706は、境界内の領域において物体認識手順を実行する。1つの構成では、物体認識手順は、現実のシーンの複数の画像フレームのうちの1つまたは複数について境界内の第1の領域において実行される。物体認識禁止モジュール1708は、境界の外側の領域において物体認識手順を実行することを控える。視線検知モジュール1703は、現実のシーンにおける第3の領域における視線を検知し、境界設定モジュール1704は、現実のシーンにおける少なくとも第4の領域を除外しながら、第3の領域を囲む境界を設定しうる。
【0069】
[0086]態様では、記憶モジュール1722は、境界内で物体が認識された連続回数である第1のカウントまたは、境界内で物体が認識された回数である第2のカウントを記憶する。判定モジュール1720は、第1のカウントまたは第2のカウントがしきい値を超えたか否かを判定する。第1のカウントまたは第2のカウントがしきい値を超えた場合、強調モジュール1726が、物体を強調する。第1のカウントまたは第2のカウントがしきい値を超えた場合、アイコン表示モジュール1728が、物体に近接したアイコンを表示する。
【0070】
[0087]別の態様では、記憶モジュール1722が、第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第1の認識された物体を記憶し、第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第2の認識された物体を記憶する。比較モジュール1724はその後、第1の認識された物体が、第2の認識された物体と同じであるか異なっているかを判定するために、少なくとも、第1の認識された物体を、第2の認識された物体と比較する。
【0071】
[0088]態様では、物体認識手順は、現実のシーンの複数の画像フレームの1つまたは複数について、境界内の第1の領域において実行され、記憶モジュール1722は、物体が境界内で認識された回数のカウントを記憶する。しきい値設定モジュール1718は、物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定する。判定モジュール1720は、カウントが、しきい値を超えたか否かを判定する。カウントがしきい値を超えた場合、強調モジュール1726が、物体を強調する。カウントがしきい値を超えた場合、アイコン表示モジュール1728が、物体に近接したアイコンを表示する。
【0072】
[0089]動作実行モジュール1730は、物体が境界内の第1の領域で認識されていないのであれば、省電力状態に入る動作、境界を拡大させる動作、または、境界内の第1の領域の中心へとズームする動作、のうちの少なくとも1つを実行する。
【0073】
[0090]受け取りモジュール1710は、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つを受け取る。拡大調節モジュール1712は、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに応じて、境界内の第1の領域の拡大を調節する。
【0074】
[0091]写真編集ツール表示モジュール1714は、少なくとも1つの写真編集ツールを表示する。編集モジュール1716は、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに基づいて、少なくとも1つの写真編集ツールを使用して、境界内の第1の領域を編集する。記憶モジュール1722は、編集された第1の領域の画像を記憶する。
【0075】
[0092]装置は、
図11−16の前述したフローチャートにおけるアルゴリズムのステップの各々を実行する追加モジュールを含みうる。そのため、
図11−16の前述したフローチャートにおける各ステップは、モジュールによって実行され、この装置は、これらモジュールのうちの1または複数を含みうる。これらモジュールは、前述した処理/アルゴリズムを実行するように特別に構成された1または複数のハードウェア構成要素であるか、前述した処理/アルゴリズムを実行するように構成されたプロセッサによって実行されうるか、プロセッサによる実施のためにコンピュータ読取可能な媒体内に格納されうるか、またはこれらのいくつかの組み合わせでありうる。
【0076】
[0093]
図18は、処理システム1814を適用する装置1702’のためのハードウェア実装の例を例示する概念図である。処理システム1814は、一般にバス1824によって表されるバス・アーキテクチャを用いて実現されうる。バス1824は、全体的な設計制約および処理システム1814の特定のアプリケーションに依存して、任意の数の相互接続バスおよびブリッジを含みうる。バス1824は、プロセッサ1804、モジュール1703,1704,1706,1708,1710,1712,1714,1716,1718,1720,1722,1724,1726,1728および1730、ならびにコンピュータ読取可能な媒体1806によって表される1つまたは複数のプロセッサ・モジュールおよび/またはハードウェア・モジュールを含むさまざまな回路をともに接続する。バス1824はさらに、例えば、タイミング・ソース、周辺機器、電圧制御装置、および電力管理回路のようなその他さまざまな回路をリンクしうる。これらは、当該技術分野で良く知られているので、さらなる説明はしない。
【0077】
[0094]処理システム1814は、コンピュータ読取可能な媒体1806に接続されたプロセッサ1804を含む。プロセッサ1804は、コンピュータ読取可能な媒体1806に格納されたソフトウェアの実行を含む一般的な処理を担当する。ソフトウェアは、プロセッサ1804によって実行された場合、処理システム1814に対して、任意の特定の装置のために記載されたさまざまな機能を実行させる。コンピュータ読取可能な媒体1806はまた、ソフトウェアが実行されている場合に、プロセッサ1804によって操作されるデータを格納するためにも使用されうる。処理システムはさらに、モジュール1703,1704,1706,1708,1710,1712,1714,1716,1718,1720,1722,1724,1726,1728および1730のうちの少なくとも1つを含む。これらモジュールは、プロセッサ1804において動作するソフトウェア・モジュールでありうるか、コンピュータ読取可能な媒体1806に常駐/格納されうるか、プロセッサ1804に接続された1または複数のハードウェア・モジュールであるか、またはこれらのいくつかの組み合わせでありうる。
【0078】
[0095]1つの構成において、装置1702/1702’は、現実のシーンにおける第1の領域における視線を検知するための手段と、第1の領域を囲む境界を設定するための手段であって、この境界は、現実のシーンにおける少なくとも第2の領域を除外する、設定するための手段と、境界内の第1の領域において物体認識手順を実行するための手段と、少なくとも第2の領域において物体認識手順を実行することを控えるための手段と、現実のシーンにおける第3の領域における視線を検知するための手段と、現実のシーンにおける少なくとも第4の領域を除外しながら、第3の領域を囲む境界を設定するための手段と、境界内で物体が認識される連続回数である第1のカウントと、境界内で物体が認識される回数である第2のカウントとを記憶するための手段と、第1のカウントまたは第2のカウントがしきい値を超えたか否かを判定するための手段と、第1のカウントまたは第2のカウントがしきい値を超えた場合に、物体を強調するための手段と、第1のカウントまたは第2のカウントがしきい値を超えた場合に、物体に近接したアイコンを表示するための手段と、少なくとも1つの動作を実行するための手段であって、少なくとも1つの動作は、物体が境界内の第1の領域において認識されていないのであれば、省電力状態に入る動作、境界を拡大する動作、または、境界内の第1の領域の中心へとズームする動作、のうちの少なくとも1つを含む、実行するための手段と、物体が境界において認識された回数であるカウントを記憶するための手段と、物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定するための手段と、カウントがしきい値を超えたか否かを判定するための手段と、カウントがしきい値を超えた場合に、物体を強調するための手段と、カウントがしきい値を超えた場合に、物体に近接したアイコンを表示するための手段と、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つを受け取るための手段と、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに応じて、境界内の第1の領域の拡大を調節するための手段と、少なくとも1つの写真編集ツールを表示するための手段と、音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに基づいて、少なくとも1つの写真編集ツールを用いて、境界内の第1の領域を編集するための手段と、編集された第1の領域の画像を記憶するための手段と、第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第1の認識された物体を記憶するための手段と、第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第2の認識された物体を記憶するための手段と、少なくとも第1の認識された物体と第2の認識された物体とを比較するための手段と、を含む。
【0079】
[0096]前述した手段は、前述した手段によって記載されている機能を実行するように構成された装置1702’の処理システム1814および/または装置1702の前述したモジュールのうちの1または複数でありうる。
【0080】
[0097]したがって、境界のサイズを縮小し、縮小された境界内の領域において物体認識手順を実行することによって、光学デバイスは、物体を認識するために必要な処理の量を低減し、もって、バッテリ電力を節約しうる。さらに、本明細書に開示された態様は、ハンド・ジェスチャ、目/頭追跡、および音声コマンドを調整することによって、拡張現実とのインタラクションを改善する。
【0081】
[0098]開示された処理のステップの具体的な順序または階層は、典型的なアプローチの例示であることが理解される。設計選択に基づいて、これら処理におけるステップの具体的な順序または階層は、再構成されうることが理解される。さらに、いくつかのステップは、結合または省略されうる。方法請求項は、さまざまなステップの要素を、サンプル順で示しており、示された具体的な順序または階層に限定されないことが意味される。
【0082】
[0099]前述の記載は、いかなる当業者であっても、ここで開示されたさまざまな態様を実現できるように提供される。これらの態様に対するさまざまな変形例は、当業者に容易に明らかになり、本明細書に定義された一般的な原理は、他の態様にも適用可能である。したがって、特許請求の範囲は、本明細書に示された態様に限定されず、請求項の文言と首尾一貫したすべての範囲が与えられることが意図されており、ここで、単数形による要素への参照は、明確に述べられていないのであれば、「1および1のみ」を意味するのではなく、「1または複数」を意味することが意図されている。特に明記されていない限り、用語「いくつか」は、1または複数を称する。当業者に周知であるか、または、後に周知になるべき本開示を通じて記載されたさまざまな態様の要素に対するすべての構造的および機能的な等価物が、参照によって本明細書に明確に組み込まれており、請求項に含められていると意図される。さらに、本明細書で開示されたいずれも、このような開示が請求項において明示的に述べられているかに関わらず、公衆に対して放棄されたものとは意図されていない。請求項の要素が、「〜する手段」という文言を用いて明示的に示されていないのであれば、請求項の何れの要素も、ミーンズ・プラス・ファンクション(means plus function)として解釈されるべきではない。
以下に、出願当初の特許請求の範囲に記載された発明を付記する。
[C1]
コンテンツを表示するように構成された光学デバイスを制御する方法であって、前記方法は下記を備える、
現実のシーンにおける第1の領域上の視線を検知することと、
前記第1の領域を囲む境界を設定すること、前記境界は、前記現実のシーンにおける少なくとも第2の領域を除外する、と、
前記境界内の前記第1の領域上の物体認識手順を実行することと、
前記少なくとも第2の領域上の物体認識手順を実行することを控えること。
[C2]
前記現実のシーンにおける第3の領域上の視線を検知することと、
前記現実のシーンにおける少なくとも第4の領域を除外しながら、前記第3の領域を囲む境界を設定することと、
をさらに備えるC1に記載の方法。
[C3]
前記物体認識手順を実行することは、前記現実のシーンの複数の画像フレームのうちの1つまたは複数に関する前記境界内の第1の領域上の物体認識手順を実行することを備え、前記方法はさらに、
前記境界内で物体が認識された連続回数である第1のカウントと、前記境界内で物体が認識された回数である第2のカウントとを、メモリに記憶することを備える、C1に記載の方法。
[C4]
前記第1のカウントまたは前記第2のカウントがしきい値を超えたか否かを判定することと、
前記第1のカウントまたは前記第2のカウントがしきい値を超えた場合に、前記物体を強調することと、
前記第1のカウントまたは前記第2のカウントがしきい値を超えた場合に、前記物体に近接したアイコンを表示することと、
をさらに備えるC3に記載の方法。
[C5]
前記境界内の第1の領域において物体が認識されない場合、前記方法はさらに、前記境界内の第1の領域の中心へとズームする動作、前記境界を拡大する動作、または、省電力状態に入る動作、のうちの少なくとも1つを実行することを備える、C1に記載の方法。
[C6]
前記物体認識手順を実行することは、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行することを備え、前記方法はさらに、
前記境界内で物体が認識された回数のカウントをメモリに記憶することを備える、C1に記載の方法。
[C7]
物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定することと、
前記カウントが、前記しきい値を超えたか否かを判定することと、
前記カウントが前記しきい値を超えた場合、前記物体を強調することと、
前記カウントが前記しきい値を超えた場合、前記物体に近接したアイコンを表示することと、
をさらに備える、C6に記載の方法。
[C8]
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つを受け取ることと、
前記音声コマンドおよび前記ジェスチャ・コマンドのうちの少なくとも1つに応じて、前記境界の第1の領域の拡大を調節することと、
をさらに備えるC1に記載の方法。
[C9]
少なくとも1つの写真編集ツールを表示することと、
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに基づいて、前記少なくとも1つの写真編集ツールを用いて、前記境界内の第1の領域を編集することと、
前記編集された第1の領域の画像を記憶することと、
をさらに備えるC1に記載の方法。
[C10]
第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第1の認識された物体を記憶することと、
第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第2の認識された物体を記憶することと、
少なくとも前記第1の認識された物体と、前記第2の認識された物体とを比較することと、
をさらに備えるC1に記載の方法。
[C11]
コンテンツを表示するように構成された光学デバイスを制御するための装置であって、前記装置は下記を備える、
現実のシーンにおける第1の領域上の視線を検知するための手段と、
前記第1の領域を囲む境界を設定するための手段、前記境界は、前記現実のシーンにおける少なくとも第2の領域を除外する、と、
前記境界内の前記第1の領域上の物体認識手順を実行するための手段と、
前記少なくとも第2の領域上の物体認識手順を実行することを控えるための手段。
[C12]
前記現実のシーンにおける第3の領域上の視線を検知するための手段と、
前記現実のシーンにおける少なくとも第4の領域を除外しながら、前記第3の領域を囲む境界を設定するための手段と、
をさらに備えるC11に記載の装置。
[C13]
前記物体認識手順を実行するための手段は、前記現実のシーンにおける複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行するように構成され、前記装置はさらに、
前記境界内で物体が認識された連続回数である第1のカウント、または、前記境界内で物体が認識された回数である第2のカウントを記憶するための手段を備える、C11に記載の装置。
[C14]
前記第1のカウントまたは前記第2のカウントがしきい値を超えたか否かを判定するための手段と、
前記第1のカウントまたは前記第2のカウントが前記しきい値を超えた場合に、前記物体を強調するための手段と、
前記第1のカウントまたは前記第2のカウントが前記しきい値を超えた場合に、前記物体に近接したアイコンを表示するための手段と、
をさらに備えるC11に記載の装置。
[C15]
少なくとも1つの動作を実行するための手段をさらに備え、前記少なくとも1つの動作は、前記境界内の第1の領域において物体が認識されていない場合省電力状態に入る動作、前記境界を拡大する動作、または前記境界内の第1の領域の中心へとズームする動作、のうちの少なくとも1つを備える、C11に記載の装置。
[C16]
前記物体認識手順を実行するための手段は、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行するように構成され、前記装置はさらに、
前記境界内において物体が認識された回数のカウントを記憶するための手段を備える、C11に記載の装置。
[C17]
物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定するための手段と、
前記カウントが、前記しきい値を超えたか否かを判定するための手段と、
前記カウントが前記しきい値を超えた場合、前記物体を強調するための手段と、
前記カウントが前記しきい値を超えた場合、前記物体に近接したアイコンを表示するための手段と、
をさらに備えるC16に記載の装置。
[C18]
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つを受け取るための手段と、
前記音声コマンドおよび前記ジェスチャ・コマンドのうちの少なくとも1つに応じて、前記境界内の第1の領域の拡大を調節するための手段と、
をさらに備えるC11に記載の装置。
[C19]
少なくとも1つの写真編集ツールを表示するための手段と、
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに基づいて、前記少なくとも1つの写真編集ツールを使用して、前記境界内の第1の領域を編集するための手段と、
前記編集された第1の領域の画像を記憶するための手段と、
をさらに備えるC11に記載の装置。
[C20]
第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第1の認識された物体を記憶するための手段と、第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第2の認識された物体を記憶するための手段と、少なくとも前記第1の認識された物体と、前記第2の認識された物体とを比較するための手段と、をさらに備えるC11に記載の装置。
[C21]
コンテンツを表示するように構成された光学デバイスを制御するための装置であって、前記装置は下記を備える、
現実のシーンにおける第1の領域上の視線を検知し、
前記第1の領域を囲む境界を設定し、前記境界は、前記現実のシーンにおける少なくとも第2の領域を除外する、
前記境界内の前記第1の領域上の物体認識手順を実行し、
前記少なくとも第2の領域上の物体認識手順を実行することを控える、
ように構成された処理システム。
[C22]
前記処理システムはさらに、
前記現実のシーンにおける第3の領域上の視線を検知し、
前記現実のシーンにおける少なくとも第4の領域を除外しながら、前記第3の領域を囲む境界を設定するように構成された、C21に記載の装置。
[C23]
前記物体認識手順は、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行することによって実行され、前記処理システムはさらに、
前記境界内で物体が認識された連続回数である第1のカウントまたは、前記境界内で物体が認識された回数である第2のカウントをメモリに記憶するように構成された、C21に記載の装置。
[C24]
前記処理システムはさらに、
前記第1のカウントまたは前記第2のカウントがしきい値を超えているか否かを判定し、
前記第1のカウントまたは前記第2のカウントがしきい値を超えている場合、前記物体を強調し、
前記第1のカウントまたは前記第2のカウントがしきい値を超えている場合、前記物体に近接したアイコンを表示する、
ように構成された、C23に記載の装置。
[C25]
前記処理システムはさらに、前記境界内の第1の領域において物体が認識されていない場合省電力状態に入る動作、前記境界を拡大する動作、または、前記境界内の第1の領域の中心へとズームする動作、のうちの少なくとも1つを実行するように構成された、C21に記載の装置。
[C26]
前記物体認識手順は、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の体認識手順を実行することによって実行され、前記処理システムはさらに、
前記境界内で物体が認識された回数のカウントをメモリに記憶するように構成された、C21に記載の装置。
[C27]
前記処理システムはさらに、
物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定し、
前記カウントが、前記しきい値を超えたか否かを判定し、前記カウントが前記しきい値を超えた場合、前記物体を強調し、
前記カウントが前記しきい値を超えた場合、前記物体に近接したアイコンを表示する、
ように構成された、C26に記載の装置。
[C28]
前記処理システムはさらに、
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つを受け取り、
前記音声コマンドおよび前記ジェスチャ・コマンドのうちの少なくとも1つに応じて、前記境界内の第1の領域の拡大を調節する、
ように構成された、C21に記載の装置。
[C29]
前記処理システムはさらに、
少なくとも1つの写真編集ツールを表示し、
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに基づいて、前記少なくとも1つの写真編集ツールを使用して、前記境界内の第1の領域を編集し、
前記編集された第1の領域の画像を記憶する、
ように構成された、C21に記載の装置。
[C30]
前記処理システムはさらに、
第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第1の認識された物体を記憶し、
第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第2の認識された物体を記憶し、
少なくとも前記第1の認識された物体と、前記第2の認識された物体とを比較する、
ように構成された、C21に記載の装置。
[C31]
コンピュータ・プログラム製品であって、前記コンピュータ・プログラム製品は下記を備える、
現実のシーンにおける第1の領域上の視線を検知することと、
前記第1の領域を囲む境界を設定すること、前記境界は、前記現実のシーンにおける少なくとも第2の領域を除外する、と、
前記境界内の前記第1の領域上の物体認識手順を実行することと、
前記少なくとも第2の領域上の物体認識手順を実行することを控えることと、
のためのコードを備えるコンピュータ読取可能な媒体。
[C32]
前記コンピュータ読取可能な媒体はさらに、
前記現実のシーンにおける第3の領域上の視線を検知することと、
前記現実のシーンにおける少なくとも第4の領域を除外しながら、前記第3の領域を囲む境界を設定することと、
のためのコードを備える、C31に記載のコンピュータ・プログラム製品。
[C33]
前記物体認識手順を実行することは、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行することを備え、前記コンピュータ読取可能な媒体はさらに、
前記境界内で物体が認識された連続回数である第1のカウントと、前記境界内で物体が認識された回数である第2のカウントとを、メモリに記憶するためのコードを備える、C31に記載のコンピュータ・プログラム製品。
[C34]
前記コンピュータ読取可能な媒体はさらに、
前記第1のカウントまたは前記第2のカウントがしきい値を超えているか否かを判定することと、
前記第1のカウントまたは前記第2のカウントがしきい値を超えている場合、前記物体を強調することと、
前記第1のカウントまたは前記第2のカウントがしきい値を超えている場合、前記物体に近接したアイコンを表示することと、
のためのコードを備える、C33に記載のコンピュータ・プログラム製品。
[C35]
前記コンピュータ読取可能な媒体はさらに、前記境界内の第1の領域において物体が認識されていない場合省電力状態に入る動作、前記境界を拡大する動作、または、前記境界内の第1の領域の中心へとズームする動作、のうちの少なくとも1つを実行するためのコードを備える、C31に記載のコンピュータ・プログラム製品。
[C36]
前記物体認識手順を実行することは、前記現実のシーンの複数の画像フレームのうちの1つまたは複数について、前記境界内の第1の領域上の物体認識手順を実行することを備え、前記コンピュータ読取可能な媒体はさらに、
前記境界内で物体が認識された回数のカウントをメモリに記憶するためのコードを備える、C31に記載のコンピュータ・プログラム製品。
[C37]
前記コンピュータ読取可能な媒体はさらに、
物体のタイプ、履歴、およびユーザ設定のうちの少なくとも1つに基づいて、しきい値を動的に設定することと、
前記カウントが、前記しきい値を超えたか否かを判定することと、
前記カウントが前記しきい値を超えた場合、前記物体を強調することと、
前記カウントが前記しきい値を超えた場合、前記物体に近接したアイコンを表示することと、
のためのコードを備える、C36に記載のコンピュータ・プログラム製品。
[C38]
前記コンピュータ読取可能な媒体はさらに、
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つを受け取ることと、
前記音声コマンドおよび前記ジェスチャ・コマンドのうちの少なくとも1つに応じて、前記境界内の第1の領域の拡大を調節することと、
のためのコードを備える、C31に記載のコンピュータ・プログラム製品。
[C39]
前記コンピュータ読取可能な媒体はさらに、
少なくとも1つの写真編集ツールを表示することと、
音声コマンドおよびジェスチャ・コマンドのうちの少なくとも1つに基づいて、前記少なくとも1つの写真編集ツールを使用して、前記境界内の第1の領域を編集することと、
前記編集された第1の領域の画像を記憶することと、
のためのコードを備える、C31に記載のコンピュータ・プログラム製品。
[C40]
前記コンピュータ読取可能な媒体はさらに、
第1の音声コマンドおよび第1のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第1の認識された物体を記憶することと、
第2の音声コマンドおよび第2のジェスチャ・コマンドのうちの少なくとも1つに応じて、少なくとも第2の認識された物体を記憶することと、
少なくとも前記第1の認識された物体と、前記第2の認識された物体とを比較することと、
のためのコードを備える、C31に記載のコンピュータ・プログラム製品。