(58)【調査した分野】(Int.Cl.,DB名)
光パターンは、互いに実質的に平行に配列された複数の縞を含み、前記手追跡器はさらに、光パターンにおいて、手のそれぞれの指による縞のセグメント化によって生じる縞セグメントの少なくとも1つのクラスタを識別し、指による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって指の動きを追跡するように構成される、請求項1に記載の装置。
前記手追跡器はさらに、追跡されたクラスタ内の縞のセグメントの数の変化を検知することによって、指の深度移動を識別するように構成される、請求項3に記載の装置。
前記手追跡器に関連付けられ、追跡された手の動きの中で予め定められたジェスチャを検知するように構成されたジェスチャ認識器をさらに含み、前記コンピュータ制御器はさらに、検知されたジェスチャに対し予め定められた方法でコンピュータ装置を制御するように構成される、請求項1に記載の装置。
前記画像提示器はさらに、予め定められたジェスチャを検知すると、第1画像を予め定められた位置に位置合せすること、第1画像のサイズを変更すること、及び第2画像のサイズを変更することからなる群からの1つの要素を実施するように構成される、請求項18に記載の装置。
投射された光パターンにおいて互いに実質的に平行に配列された複数の縞はそれぞれ、光パターンの伝搬方向に垂直な方向に変化する光強度プロファイルを有する、請求項27に記載の方法。
投射された光パターンにおいて互いに実質的に平行に配列された複数の縞はそれぞれ、光パターンの伝搬方向に垂直な方向に変化する光強度プロファイルを有する、請求項31に記載の方法。
【発明を実施するための形態】
【0033】
本発明の実施形態は、コンピュータ装置の遠隔手制御のため装置および方法を含む。
【0034】
本発明の例示的実施形態では、コンピュータ装置のユーザの手の動きが連続的に追跡される。
【0035】
ユーザに対し、手を表わす第1画像、および第2画像が提示される。
【0036】
第1画像は、スクリーン上に提示されるユーザの手の完全かつ正確な動画像とすることができる。代替的に、第1画像はむしろ、手の指先の位置を表わす5つのカーソルから構成される。第1画像はまた、以下でさらに詳述するように、第2画像に対する指(すなわち人差し指から小指までの指、親指、または両方)の位置についてのユーザ情報をもたらす、いずれかの他の視覚的外観とすることもできる。
【0037】
ユーザがその手(またはその人差し指から小指までの指もしくは親指だけ)を動かすと、第1画像は追跡された動きに呼応して動く。すなわち、第1画像の動きはユーザの手の動きと相関する。ユーザがその手を左に動かすと、第1画像は左に動く。ユーザがその指の1本を屈曲すると、第1画像も指を屈曲する(またはそれに応じて指の先の位置を表わすカーソルを動かす)などする。
【0038】
任意選択的に、第2画像は、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのような、コンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)である。
【0039】
コンピュータ装置は、あたかも第1画像がユーザ自身の手であり、かつ第2画像が、タッチスクリーンにユーザ自身の指をタッチすることによって、ユーザがGUIのメニュー、ボタン等と対話することを可能にするタッチスクリーンに提示されるGUIであるかのように、第1画像と第2画像との間の相互作用に従って制御される。
【0040】
すなわち、第1画像および第2画像を相互作用させるために、ユーザの手または指を動かすことによって、ユーザはコンピュータ装置を制御することが可能になる。
【0041】
任意選択的に、第2画像はむしろ、コンピュータ入力装置(例えば、当業界で公知の通り、コンピュータキーボード、コンピュータマウス、ジョイスティック等)を表わす画像である。
【0042】
コンピュータ装置は、あたかも画像内の手がユーザ自身の手であり、かつ第2画像が、コンピュータ装置に接続された、任意の標準的周辺コンピュータ装置(例えばキーボード、ジョイスティック等)のような実際のコンピュータ入力装置であるかのように、第1画像と第2画像との間の相互作用に従って制御される。ユーザはこのようにして、第1画像および第2画像を相互作用させるようにユーザの手を動かすことによって、コンピュータ装置を制御することが可能になる。
【0043】
したがって、ユーザの手の動きによるコンピュータ装置の遠隔制御は、(特定のジェスチャを定義することもできるが)特定のジェスチャの予め定められたセットに限定されたインタフェースというよりむしろ連続ユーザインタフェースに基づく。
こともできるが)。
【0044】
一実施例では、ユーザがその手を動かすと、第1画像がコンピュータキーボードの画像上で動き、ユーザがその指をタイピング動作するように動かすと、以下でさらに詳述する通り、コンピュータ装置は、あたかもユーザが実際のキーボードを用いてタイピングしたかのように応答する。
【0045】
本発明の例示的実施形態に係る装置および方法の原理および動作は、図面および関連する説明を参照することによって、理解を深めることができる。
【0046】
本発明の少なくとも1つの実施形態を詳しく説明する前に、本発明は、その適用において、下記の説明に示されるか、または図面において例示される構成要素の構成および配置の細部に必ずしも限定されないことを理解しなければならない。
【0047】
本発明は他の実施形態が可能であり、あるいは様々なやり方で実施もしくは実行することができる。また、本書で使用する表現および専門用語は説明を目的とするものであって、限定とみなすべきではないことを理解されたい。
【0048】
ここで
図1を参照すると、それは、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のための装置を模式的に示すブロック図である。
【0049】
装置1000はコンピュータ装置上に実装することができ、コンピュータ装置はデスクトップコンピュータ、ラップトップコンピュータ、携帯電話機等である。装置1000はまた、コンピュータ装置に接続可能な装置、例えばコンピュータ装置と連絡するコンピュータプロセッサを持つユニットに実装することもできる。さらに、装置1000はソフトウェアとして、ハードウェアとして、またはソフトウェアおよびハードウェアの組合せとして実装することができる。
【0050】
装置1000は手追跡器110を含む。
【0051】
手追跡器110は、以下でさらに詳述する通り、例えば指および親指の微細な動きを追跡するのに有用なパターンに構造化された光を投射された手の画像を用いて、コンピュータ装置のユーザの手の動きを追跡する。
【0052】
任意選択的に、手追跡器110は、以下でさらに詳述する通り、コンピュータ装置から遠隔位置にある。
【0053】
装置1000はさらに、手追跡器110と連絡する画像提示器120を含む。
【0054】
画像提示器120は、手を表わす第1画像、および第2画像を提示する。
【0055】
任意選択的に、第2画像は、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのような、コンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)である。
【0056】
任意選択的に、第2画像は、以下でさらに詳述する通り、むしろコンピュータ入力装置、例えばコンピュータマウスまたはコンピュータキーボードを表わす。
【0057】
任意選択的に、第2画像は別のグラフィカルオブジェクト、ピクチャ等である。
【0058】
第1画像は、スクリーン上に提示されるユーザの手の完全かつ正確な動画像とすることができる。代替的に、第1画像はむしろ、手の指先の位置を表わす5つのカーソルから構成される。第1画像はまた、第2画像に対する指(すなわち人差し指から小指までの指、親指、または両方)の位置についてのユーザ情報をもたらす、いずれかの他の視覚的外観とすることもできる。
【0059】
画像提示器120はさらに、以下でさらに詳述する通り、手追跡器110によって追跡されるユーザの手の動きに呼応して第1画像を動かす。
【0060】
装置1000はさらに、画像提示器120と連絡するコンピュータ制御器130を含む。
【0061】
任意選択的に、コンピュータ制御器130は、以下でさらに詳述する通り、デスクトップコンピュータ、ラップトップコンピュータ等の一部である。
【0062】
任意選択的に、コンピュータ制御器130は、以下でさらに詳述する通り、自動車に据え付けられる装置の一部である。
【0063】
任意選択的に、コンピュータ制御器130は、以下でさらに詳述する通り、携帯電話機(例えばスマートフォン)の一部である。
【0064】
コンピュータ制御器130は、第1画像と第2画像との間の相互作用に従ってコンピュータ装置を制御する。したがって、コンピュータ制御器130は、以下でさらに詳述する通り、第1画像および第2画像を相互作用させるように手を動かすことによって、ユーザがコンピュータ装置を制御することを可能にする。
【0065】
一実施例では、ユーザがその手を動かすと、画像提示器120がコンピュータキーボードの画像上で第1画像を動かす。ユーザが指をタイピング動作するように動かすと、コンピュータ制御器130はコンピュータ装置を制御し、以下でさらに詳述する通り、あたかもユーザが実際のキーボードを用いてタイピングしたかのように、コンピュータ装置に応答させる。
【0066】
第2実施例では、ユーザがその手を動かすと、画像提示器120がコンピュータマウスの画像上で第1画像を動かす。ユーザがその指をクリック動作するように動かすと、第1画像の指は、手の動作の動きに正確に相関してクリック動作するように動く。その結果として、コンピュータ装置は、コンピュータマウスの画像に対する第1画像の位置に従って(すなわち、第1画像の指が画像内のコンピュータマウスのボタン上に位置する状態で)、あたかもユーザが実際のコンピュータマウスのボタンの1つをクリックしたかのように応答する。
【0067】
第3実施例では、第2画像は、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのような、コンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)である。
【0068】
コンピュータ制御器130は、第1画像と第2画像との間の相互作用に従って、コンピュータ装置を制御する。コンピュータ装置は、あたかも第1画像がユーザ自身の手であり、かつ第2画像が、タッチスクリーンにその指をタッチすることによって、ユーザがGUIのメニュー、ボタン等と対話することを可能にするタッチスクリーン上に提示されるGUIであるかのように、制御される。
【0069】
任意選択的に、手追跡器110は、以下でさらに詳述する通り、手の動きを追跡するために、二次元ビデオデータ、例えば手追跡器110に接続されたカメラから流れる例えば二次元ビデオ画像を使用する。
【0070】
任意選択的に、手追跡器110は、手に投射される光パターンの連続的特徴のセグメント化(すなわち分割)を検知することによって動きを追跡する。光パターンは、以下でさらに詳述する通り、第1方向の連続的特徴、および第1方向に対し実質的に垂直な方向の非連続的(例えば周期的)特徴を有する。
【0071】
一実施例では、光パターンは、互いに平行(または実質的に平行)に配列された幾つかの縞を含む。
【0072】
手追跡器110は、以下でさらに詳述する通り、光パターンの中に、手の指(すなわち人差し指から小指までの指または親指)による縞のセグメント化によって生じる、1つ以上の縞セグメントの1つ以上のクラスタを識別する。
【0073】
手追跡器110は、指による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって、指の動きを追跡する。
【0074】
任意選択的に、手追跡器110はさらに、光パターンの中に、手の掌による縞のセグメント化によって生じる1つ以上の縞セグメントの1つ以上のクラスタを識別する。手追跡器110は、掌による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって、手の動きを追跡する。
【0075】
任意選択的に、手追跡器110はさらに、手に投射される光パターンの連続的特徴に沿ったノーテーションの位置のずれを検知することができる。手追跡器110は、以下でさらに詳述する通り、検知されたずれを手の追跡に使用する。
【0076】
任意選択的に、手追跡器110は、以下でさらに詳述する通り、指の深度移動(例えばクリックと同様の動作またはタッチスクリーンのような操作)をさらに識別する。
【0077】
任意選択的に、手の指および掌によって生じた縞セグメントのクラスタが検知された後、掌および指クラスタの縞セグメントだけが追跡され、それによって手の動きが追跡される。背景縞セグメントおよび追加的画像情報のような、縞セグメントクラスタ以外のビデオデータの部分は、こうして除外することができる。
【0078】
その結果、動きを追跡するための計算量および処理時間をかなり軽減することができる。
【0079】
任意選択的に、装置1000はさらに、以下でさらに詳述する通り、手追跡器110と連絡する投光器およびカメラを含む。
【0080】
一実施例では、以下でさらに詳述する通り、投光器、カメラ、または両方とも、コンピュータ装置から遠隔位置にある。
【0081】
任意選択的に、投光器は、当業界で公知の通り、光源および微細構造素子を含む。
【0082】
光源は、当業界で公知の通り、レーザダイオード、発光ダイオード(LED)、光ビームを放出する任意の他の素子とすることができる。
【0083】
光源から放出された光ビームは、微細構造素子を介してユーザの手の上に伝搬する。微細構造素子は、以下でさらに詳述する通り、ユーザの手に投射される光パターンを生成するために光ビームを修正する。
【0084】
任意選択的に、微細構造素子は光ビームを可変断面強度プロファイルの光ビームに変換する。その結果として、断面強度プロファイルは光ビームに沿って変化し、したがって、以下でさらに詳述する通り、光源からの物体(例えばユーザの指の1つ)の距離を示す情報を提供する。
【0085】
任意選択的に、投光器は、以下でさらに詳述する通り、第1方向に連続的特徴を有し、かつ第1方向に対し実質的に垂直な方向に非連続的特徴を有する光パターンを手の上に投射する。
【0086】
任意選択的に、微細構造素子は、当業界で公知の通り、回折光学素子である。
【0087】
回折光学素子は、当業界で公知の通り、一次元または二次元空間配列を有する離散数のスポットに光ビームを分割する周期的微細構造によって得ることができる。
【0088】
任意選択的に、円筒状マイクロ・レンズ・アレイのような追加的素子または追加的回折素子を使用して、スポットの各々から縞を形成する。
【0089】
任意選択的に、縞は、以下でさらに詳述する通り、縞に沿って互いに固定距離に位置する位相ノーテーションによりマーキングされる。
【0090】
円筒状マイクロ・レンズ・アレイのような追加的微細構造素子を使用する利点として考えられることは、当業界で公知の通り、追加的素子がレーザビームのような零次の光ビームを分散させることである。
【0091】
零次とは回折素子から出力される光スポットの中心であり、比較的高いエネルギによって特徴付けることができる。零次を縞のような光構造に分散することで、目の安全性限界を超えることなく、レーザ光ビームの強度を高めることができる。
【0092】
任意選択的に、投光器はさらに、投射された縞を反射する物体からの距離に関して、光パターンにおける各縞の断面強度プロファイルを変化させる、追加的回折素子を含む。断面強度プロファイルとは、投射された光の伝搬方向に垂直な強度プロファイルである。
【0093】
任意選択的に、強度プロファイルの変化は、投射された光が物体に伝搬し、かつ物体の表面から反射して戻る際に、投射された光の移動距離に沿って漸進的に実行される、ガウス断面強度プロファイルからトップハット断面強度プロファイルへの漸次変化である。
【0094】
任意選択的に、強度プロファイルの変化は、当業界で公知の通り、単一ピークを持つ強度プロファイルから2つ以上のピーク等を持つ強度プロファイルへの漸次変化である。
【0095】
光パターンを持つ光が投射された物体から反射した光の移動距離に沿った強度プロファイルの変化は、以下でさらに詳述する通り、異なる範囲で、異なる物体から反射した縞間の差別化を助長し、したがってさらにセグメント一体化問題の克服を助長することができる。
【0096】
さらに、強度プロファイルの変化はさらに、物体までの(例えばユーザの手、人差し指から小指までの指、および親指までの)距離を直接測定するために使用することができる。
【0097】
カメラは、投光器の隣に配置された、ウェブカメラまたは携帯電話機のカメラのようなビデオカメラとすることができる。
【0098】
カメラは光パターンを投射された手の1つ以上の画像を取得し、取得した画像を手追跡器110に転送する。手追跡器110は、以下でさらに詳述する通り、手の動きを追跡するために、取得された画像を使用する。
【0099】
任意選択的に、装置1000はさらに、手追跡器110と連絡するジェスチャ認識器を含む。
【0100】
ジェスチャ認識器は、追跡された手の動きの中で、装置1000の管理者によって予め定められたジェスチャを検知する。ジェスチャを検知すると、コンピュータ制御器130は、以下でさらに詳述する通り、検知されたジェスチャに対し予め定められた方法でコンピュータ装置を制御する。
【0101】
任意選択的に、特定の予め定められたジェスチャを検知すると、画像提示器120は第1画像を予め定められた位置に位置合せする。一実施例では、ユーザがその手を振ると、画像提示器120は、第1画像を第2画像(例えばコンピュータキーボードの画像)の中心位置に位置合せする。
【0102】
任意選択的に、特定の予め定められたジェスチャを検知すると、画像提示器120は、以下でさらに詳述する通り、第1画像(すなわち手の画像)のサイズを変更する。
【0103】
ここで
図2を参照すると、それは、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のための方法を示すフローチャートである。
【0104】
本発明の例示的実施形態に係る例示的方法は、コンピュータ装置上に実装することができ、コンピュータ装置はデスクトップコンピュータ、ラップトップコンピュータ、携帯電話機等である。
【0105】
例示的方法は、上で詳述した通り、コンピュータ装置に接続可能な装置上に、例えばコンピュータ装置と連絡するコンピュータプロセッサを持つユニット上に、実装することもできる。
【0106】
例示的方法では、以下でさらに詳述する通り、例えば指および親指の微細な動きを追跡するのに有用なパターンに構造化された光を投射された手の画像を用いて、コンピュータ装置のユーザの手の動きを追跡する210。任意選択的に、動きは、上で詳述した通り、手追跡器110を用いて追跡される。
【0107】
同時に、手を表わす第1画像、および第2画像をユーザに、例えばコンピュータ装置のスクリーン上に、提示する220。任意選択的に、第2画像および第1画像は、上で詳述した通り、画像提示器120によってユーザに提示される。
【0108】
任意選択的に、第2画像は、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのような、コンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)である。
【0109】
任意選択的に、第2画像はむしろ、以下でさらに詳述する通り、コンピュータ入力装置、例えばキーボードまたはコンピュータマウスを表わす。
【0110】
任意選択的に、第2画像は別のグラフィカルオブジェクト、ピクチャ等である。
【0111】
第1画像は、スクリーン上に提示されるユーザの手の完全かつ正確な動画像とすることができる。代替的に、第1画像はむしろ、手の指先の位置を表わす5つのカーソルから構成される。第1画像はまた、第2画像に対する指(すなわち人差し指から小指までの指、および親指)の位置に関するユーザ情報をもたらす、いずれかの他の視覚的外観を有することもできる。
【0112】
第1画像は、以下でさらに詳述する通り、手追跡器110によって追跡される210ユーザの手の動きに呼応して動く。
【0113】
コンピュータ装置は、第1画像と第2画像との間の相互作用に従って、例えばコンピュータ制御器130によって制御される230。
【0114】
その結果として、ユーザは、以下でさらに詳述する通り、第1画像および第2画像を相互作用させるように手を動かすことによって、コンピュータ装置を制御することが可能になる。
【0115】
一実施例では、ユーザがその手を動かすと、第1画像はコンピュータキーボードの画像上で動く。
【0116】
ユーザがその指をタイピング動作するように動かすと、コンピュータ装置は、以下でさらに詳述する通り、あたかもユーザがコンピュータ装置にワイヤ接続された実際のキーボードを用いてタイピングしたかのように、コンピュータ装置が応答するように制御される230。
【0117】
第2実施例では、ユーザがその手を動かすと、第1画像はコンピュータマウスの画像上で動く。
【0118】
ユーザがその指をクリック動作するように動くと、第1画像の指は、手の動作の動きに正確に相関してクリック動作するように動く。その結果として、コンピュータ装置は、コンピュータマウスの画像に対する第1画像の位置に従って(すなわち、第1画像の指が第2画像内のコンピュータマウスのボタン上に位置する状態で)、あたかもユーザが実際のコンピュータマウスのボタンの1つをクリックしたかのように応答する。
【0119】
第3実施例では、第2画像は、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのような、コンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)である。
【0120】
コンピュータ装置は、画像間の相互作用に従って(例えばコンピュータ制御器130によって)制御される230。コンピュータ装置は、あたかも第1画像がユーザ自身の手であり、第2画像が、ユーザがタッチスクリーンにその指をタッチすることによってGUIのメニュー、ボタン等と対話することを可能にする、タッチスクリーン上に提示されたGUIであるかのように、制御される230。
【0121】
任意選択的に、手の動きの追跡210は、上で詳述した通り、二次元ビデオデータ(例えば手追跡器110に接続されたカメラから流れる二次元ビデオ画像)を用いて実行される。
【0122】
任意選択的に、手に投射された光パターンの連続的特徴のセグメント化(すなわち分割)を検知することによって、動きは追跡される210。光パターンは、以下でさらに詳述する通り、第1方向に連続的特徴を有し、第1方向に対して実質的に垂直な方向に非連続的(例えば周期的)特徴を有する。
【0123】
一実施例では、光パターンは互いに平行(または実質的に平行)に配列された幾つかの縞を含む。
【0124】
任意選択的に、以下でさらに詳述する通り、光パターンの中に、手の指(すなわち人差し指から小指までの指または親指)による縞のセグメント化によって生じる、1つ以上の縞セグメントの1つ以上のクラスタを識別することができる。その結果として、指の動きの追跡210は、指による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって行なわれる。
【0125】
任意選択的に、さらに、以下でさらに詳述する通り、例えば追跡されたクラスタ内のセグメントの数の変化を検知することによって、指の深度移動(例えばクリックと同様の動作またはタッチスクリーンのような操作)が識別される。
【0126】
任意選択的に、さらに、光パターンの中で、手の掌による縞のセグメント化によって生じる1つ以上の縞セグメントの1つ以上のクラスタが識別される。その結果として、手の動きの追跡210は、掌による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって行なわれる。
【0127】
任意選択的に、さらに、手に投射された光パターンの連続的特徴に沿ったノーテーションの位置のずれが検知される。検知されたずれは、以下でさらに詳述する通り、例えば手追跡器110による手の追跡210に使用される。
【0128】
任意選択的に、例示的方法はさらに、追跡された210手の動きの中で、装置1000の管理者によって予め定められたジェスチャを検知することを含む。ジェスチャを検知すると、コンピュータ装置は、以下でさらに詳述する通り、検知されたジェスチャに対して予め定められた方法で(例えばコンピュータ制御器130によって)制御される230。
【0129】
任意選択的に、予め定められたジェスチャが検知されると、第1画像は予め定められた位置に位置合せされる。一実施例では、ユーザがその手を振ると、画像提示器120は、第1画像を第2画像(例えばコンピュータキーボード画像またはGUI)の中心位置に位置合せする。
【0130】
任意選択的に、予め定められたジェスチャが検知されると、第1画像は、以下でさらに詳述する通り、(例えば画像提示器120によって)サイズを変更される。
【0131】
ここで
図3を参照すると、それは、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のステップを実行するためのコンピュータ実行可能命令を格納するためのコンピュータ可読媒体を模式的に示すブロック図である。
【0132】
本発明の例示的実施形態では、CD−ROM、USBメモリ、携帯ハードディスク、ディスケット等のようなコンピュータ可読媒体3000を提供する。
【0133】
コンピュータ可読媒体3000は、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のステップを実行するためのコンピュータ実行可能命令を格納する。
【0134】
コンピュータ実行可能命令は、以下でさらに詳述する通り、例えば指および親指の微細な動きを追跡するのに有用なパターンに構造化された光を投射された手の画像を用いて、コンピュータ装置のユーザの手の動きを追跡するステップ310を含む。
【0135】
コンピュータ実行可能命令はさらに、上で詳述した通り、手を表わす第1画像および第2画像を、例えば装置のスクリーン上でユーザに提示するステップ320を含む。
【0136】
ステップ320で、第1画像はさらに、以下でさらに詳述する通り、追跡された310ユーザの手の動きに呼応して動く。
【0137】
任意選択的に、第2画像は、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのような、コンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)である。
【0138】
任意選択的に、第2画像は、以下でさらに詳述する通り、むしろコンピュータ入力装置、例えばキーボードまたはコンピュータマウスを表わす。
【0139】
任意選択的に、第2画像は別のグラフィカルオブジェクト、ピクチャ等である。
【0140】
第1画像は、スクリーンに提示されるユーザの手の完全かつ正確な動画像とすることができる。代替的に、第1画像はむしろ、手の指先の位置を表わす5つのカーソルから構成される。第1画像はまた、第2画像に対する指(すなわち人差し指から小指までの指、親指、または両方)の位置に関するユーザ情報をもたらす、いずれかの他の視覚的外観を有することもできる。
【0141】
コンピュータ実行可能命令はさらに、第1画像と第2画像との間の相互作用に従ってコンピュータ装置が制御されるステップ330を含む。
【0142】
その結果として、ユーザは、以下でさらに詳述する通り、第1画像および第2画像を相互作用させるように手を動かすことによって、コンピュータ装置を制御することが可能になる。
【0143】
一実施例では、ユーザがその手を動かすと、第1画像がコンピュータキーボードの画像上で動く。
【0144】
ユーザがその手をタイピング動作するように動かすと、コンピュータ装置は、以下でさらに詳述する通り、あたかもユーザが実際のキーボードを用いてタイピングしたかのように、コンピュータ装置が応答するように制御される330。
【0145】
第2実施例では、ユーザがその手を動かすと、第1画像はコンピュータマウスの画像上で動く。
【0146】
ユーザがその指をクリック動作するように動かすと、第1画像の指は、手の動作の動きと正確に相関してクリック動作するように動く。その結果として、コンピュータ装置は、コンピュータマウスの画像に対する第1画像の位置に従って(すなわち第1画像の指が第2画像のマウスのボタンに配置された状態で)、あたかもユーザが実際のコンピュータマウスのボタンの1つをクリックしたかのように応答する。
【0147】
第3実施例では、第2画像は、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのような、コンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)である。
【0148】
コンピュータ装置は、あたかも第1画像がユーザ自身の手であり、かつ第2画像が、ユーザがタッチスクリーンにその指をタッチすることによってGUIのメニュー、ボタン等と対話することを可能にする、タッチスクリーン上に提示されるGUIであるかのように、画像間の相互作用に従って制御される。
【0149】
任意選択的に、手の動きの追跡310は、上で詳述した通り、二次元ビデオデータ(例えばカメラから流れる二次元ビデオ画像)を用いて実行される。
【0150】
任意選択的に、動きは、手に投射される光パターンの連続的特徴のセグメント化(すなわち分割)を検知することによって、追跡される310。光パターンは、以下でさらに詳述する通り、第1方向に連続的特徴を有し、かつ第1方向に対し実質的に垂直な方向に非連続的特徴を有する。
【0151】
一実施例では、光パターンは、互いに平行(または実質的に平行)に配列された幾つかの縞を含む。
【0152】
任意選択的に、命令はさらに、以下でさらに詳述する通り、光パターンの中に、手の指(すなわち人差し指から小指までの指または親指)による縞のセグメント化によって生じる1つ以上の縞セグメントの1つ以上のクラスタを識別することを含む。その結果として、指による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって、指の動きを追跡することができる310。
【0153】
任意選択的に、命令はさらに、以下でさらに詳述する通り、例えば追跡されたクラスタ内のセグメントの数の変化を検知することによって、指の深度移動を識別することを含む。
【0154】
任意選択的に、命令はさらに、光パターンの中に、手の掌による縞のセグメント化によって生じる1つ以上の縞セグメントの1つ以上のクラスタを識別することを含む。その結果として、掌による縞のセグメント化(すなわち分割)によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって、手の動きを追跡することができる310。
【0155】
任意選択的に、命令はさらに、手に投射された光パターンの連続的特徴に沿ったノーテーションの位置のずれを検知することを含む。検知されたずれは、以下でさらに詳述する通り、手を追跡する310ために使用される。
【0156】
任意選択的に、命令はさらに、追跡された310手の動きの中に、管理者によって予め定められたジェスチャを検知することを含む。ジェスチャを検知すると、コンピュータ装置は、以下でさらに詳述する通り、検知されたジェスチャに対して予め定められた方法で制御される330。
【0157】
任意選択的に、命令はさらに、予め定められたジェスチャを検出すると、第1画像を予め定められた位置に位置合せするステップを含む。一実施例では、ユーザがその手を振ると、第1画像は、第2画像(例えばコンピュータキーボードの画像またはGUI)上の中心位置に位置合せされる。
【0158】
任意選択的に、命令はさらに、以下でさらに詳述する通り、予め定められたジェスチャを検出すると、第1画像がサイズを変更されるステップをさらに含む。
【0159】
ここで
図4を参照すると、それは、本発明の例示的実施形態に係る、光パターンを投射された手を模式的に示す。
【0160】
例示的実施形態では、手の動きの追跡は、人差し指から小指までの指および親指の微細な動きのような手の動きの検知を可能にするように設計された光パターンを用いて実行される。
【0161】
特別に設計された光パターンは、上で詳述した通り、三次元深度マップとは異なり、手が身体の残部から容易に分離されない二次元ビデオデータにおいてさえも、距離に従って動きを追跡することを可能にする。
【0162】
任意選択的に、光パターンは、二次元ビデオデータ(例えば通常のビデオカメラから流れるビデオ画像)において手の指の動きを追跡するように特別に設計される。さらに詳しくは、光パターンは、以下でさらに詳述する通り、指によるパターンの歪みに従って、二次元ビデオデータにおいて指(すなわち人差し指から小指までの指および親指)のみならず掌をも検知および追跡することを可能にするように設計することができる。
【0163】
任意選択的に、光パターンは第1方向(例えばX軸方向)に連続的特徴を有し、かつ第1方向に対し実質的に垂直な方向(例えばY軸方向)に非連続的(例えば周期的)特徴を有する。
【0164】
そのようなパターンの一実施例では、光パターンは、
図4を用いて模式的に示す通り、互いに平行(または実質的に平行)に配列された幾つかの縞を含む。
【0165】
カメラは、縞のパターンを手410および背景420(例えば手が載置されている台、壁等の表面)に投射する投光器より上の、Y軸方向に特定の距離に配置される。
【0166】
カメラの位置は、当業界で公知の通り、カメラ、投光器、ならびにユーザの手410および背景420から反射される光の間に三角効果(triangulation effect)を形成するように選択される。
【0167】
三角効果は、光パターンを投射された物体からの著しい深度ずれが存在する縞に沿った位置に、パターンの不連続性を生じる。
【0168】
不連続性は、縞を2つ以上の縞セグメント、例えば手に位置するセグメント431、手の左側に位置するセグメント432、および手の右側に位置するセグメント433にセグメント化(すなわち分割)する。
【0169】
そのような深度ずれから生じる縞セグメントは、カメラとユーザの身体との間に位置するユーザの手の掌または指の輪郭線上に位置付けることができる。
【0170】
すなわち、ユーザの指または掌は、縞を2つ以上の縞セグメントにセグメント化する。
【0171】
ひとたびそのような縞セグメントが検知されると、縞セグメントを縞セグメントの終わりまで追跡することは容易である。
【0172】
手追跡器110はこうして二次元ビデオデータ(例えばカメラから手追跡器110に転送されるビデオ・ストリーム)を解析して、縞セグメントのクラスタを生成することができる。
【0173】
例えば、手追跡器110は、光パターンの中に、手の指による縞のセグメント化によって生じる1つ以上の縞セグメントのクラスタ、例えば手の中指から反射される4つのセグメントのクラスタ441を識別することができる。その結果として、手追跡器110は、指による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって、指の動きを追跡する。
【0174】
指による縞のセグメント化(すなわち分割)によって生じる縞セグメントのクラスタは、X軸方向に重複する縞セグメントを含む。任意選択的に、クラスタ内の縞セグメントはさらに、同様の長さ(指の太さから導出される)またはY軸座標の相対的近接性を有する。
【0175】
X軸上で、セグメントは、まっすぐに置かれた指では完全に重複し、X−Y面内に斜めに置かれた指では部分的に重複する。
【0176】
任意選択的に、手追跡器110はさらに、例えば追跡されるクラスタ内のセグメントの数の変化を検知することによって、指の深度移動を識別する。
【0177】
例えば、ユーザがその中指を伸ばすと、その指と投光器およびカメラの平面(X−Y面)との間の角度が変化する。その結果として、クラスタ441内のセグメントの数が4から3に減少する。
【0178】
任意選択的に、手追跡器110はさらに、光パターンの中に、手の掌による縞のセグメント化によって生じる1つ以上の縞セグメントの1つ以上のクラスタを識別する。その結果として、掌による縞のセグメント化によって生じる縞セグメントのクラスタを追跡することによって、またはクラスタのセグメントの少なくとも1つを追跡することによって、手の動きが追跡される210。
【0179】
掌による縞のセグメント化によって生じる縞セグメントのクラスタは、X軸方向にユーザの手の指の縞セグメントクラスタと重複する上部縞セグメント431を含む。
【0180】
上部縞セグメント431はX軸方向に4つの指クラスタが重複するが、4つの指クラスタの最下セグメントの最小および最大X値を超えない。
【0181】
掌による縞のセグメント化によって生じる縞セグメントのクラスタはさらに、セグメント431の真下に、縞セグメント431とかなり重複する少数の縞セグメントを含む。掌による縞のセグメント化によって生じる縞セグメントのクラスタはさらに、ユーザの親指の縞セグメントクラスタ451の基部まで延びる、より長い縞セグメントを含む。
【0182】
指および掌クラスタの向きは、特定の手の位置および回転により変化する。
【0183】
ここで
図5を参照すると、それは、本発明の例示的実施形態に係る、強度ノーテーションを有する光パターンを投射された手を模式的に示す。
【0184】
これまでに示した光パターンによる1つの問題は、縞セグメント一体化問題である。
【0185】
場合によっては、手の背景から反射した縞セグメントは、手から反射した縞セグメントと一体化することがある。その結果として、掌および指の縞セグメントクラスタを見つけることができず、手を追跡することができなくなる。
【0186】
縞セグメント一体化問題を克服するのに役立つ1つの方法は、
図5に示す通り、各縞に沿った周期的ノーテーションの導入を介するものである。
【0187】
任意選択的に、ノーテーションは、縞に沿って変化する光強度320の形、または縞に沿って一定の間隔で現われる、短い垂直線のような特定の形状の形を取る。
【0188】
周期的ノーテーションの導入に加えて、カメラは投光器に対して、上で詳述したようにY軸方向に間隙を置くだけでなく、X軸方向にも間隙を置いて配置される。X軸方向のこの間隙は、物体の距離に対して縞に沿ったノーテーションの位置に位相ずれを生成する。
【0189】
その結果として、手から反射した縞セグメントが背景から反射したセグメントと一体化する場合に、セグメントは依然として、異なる位相の周期的ノーテーションを有する。任意選択的に、カメラと投光器との間の垂直方向および水平方向の距離の比は、セグメントが一体化される場合にセグメント間のノーテーションの位相ずれが最大になるように、慎重に選択される。
【0190】
一体化されるセグメントの問題を克服するのに有用であることが証明される第2の方法は、カメラおよび投光器のセットアップを、それらのZ軸上の位置も異なるように変更することによる。
【0191】
カメラと投光器との間のZ軸上の位置の相違は、カメラおよび投光器を異なるZ軸位置に物理的に配置することによって、または投光パターンの前に特定の距離を置いて負レンズまたは正レンズを配置することによって、もたらすことができる。
【0192】
その結果として、物体から反射される光パターンの縞セグメントは、異なる物体距離に異なる周期を有する。したがって、手から反射した縞セグメントの1つが背景から反射した縞セグメントとたとえ一体化しても、隣接する線は周期が異なるため一体化しない。
【0193】
一体化されるセグメントの問題を克服するのに有用であることが証明される第3の方法は、上で詳述した通り、光ビームを異なる断面強度プロファイルの光ビームに変換する微細構造素子を使用して実行される。
【0194】
断面強度プロファイルは、光パターンを反射する物体の投光器からの距離に従って変化する。
【0195】
その結果として、上で詳述した通り、手から反射した縞セグメントの断面強度プロファイルと、背景から反射した縞セグメントの断面強度プロファイルとは異なる。
【0196】
本発明の例示的実施形態に係る方法はさらに、指による縞のセグメント化によって生じた縞セグメントのクラスタの垂直移動、縞セグメントのノーテーションの水平移動、または両方を検知することによって、手の指の深度移動を追跡することを含むことができる。
【0197】
任意選択的に、指の深度移動の追跡は、指による縞のセグメント化によって生じる縞セグメントのクラスタにおける最上セグメントの垂直方向の移動を検知することによって実行される。最上セグメントは、Z−Y面内における指の最も重要な動きを実行する指の先を表わす。
【0198】
任意選択的に、深度移動の追跡は、追跡されるクラスタ内のセグメントの数の変化を検知することによって実行される。すなわち、手の指の深度移動(すなわちZ軸方向の動き)は、指の追跡される縞セグメントの1つを上方に移動させて消失させ、新しい縞セグメントを出現させるなどする。
【0199】
ここで
図6を参照すると、それは、本発明の例示的実施形態に係る、コンピュータキーボードの画像を用いるコンピュータ装置の遠隔手制御を模式的に示すブロック図である。
【0200】
本発明の例示的実施形態では、コンピュータ装置(例えばデスクトップコンピュータ)のユーザの手610の動きは連続的に追跡される。
【0201】
ユーザに対し、当業界で公知の通り、手を表わす第1画像620、およびコンピュータ入力装置、例えばコンピュータキーボード、コンピュータマウス、ジョイスティック等を表わす第2画像がスクリーン上に提示される。
【0202】
第1画像620は、スクリーン上に提示されるユーザの手の完全かつ正確な動画像とすることができる。代替的に、第1画像620は、手610の指先の位置を表わす5つのカーソルから構成することができる。第1画像620はまた、同じくスクリーン上に表示されるコンピュータ入力装置に対する指(すなわち人差し指から小指までの指および親指)の位置に関するユーザ情報をもたらす、いずれかの他の視覚的外観を持つこともできる。
【0203】
ユーザが手610(またはその人差し指から小指までの指もしくは親指)を動かすと、追跡された動きに呼応して第1画像620が動く。すなわち、第1画像620の動きはユーザ自身の手610の動きと相関する。ユーザがその手610を左に動かすと、第1画像620は左に動く。ユーザがその指の1本を屈曲すると、第1画像620も指を屈曲するなどする。
【0204】
コンピュータ装置は、あたかも画像620内の手がユーザ自身の手610であり、かつ入力装置がコンピュータ装置に接続された実際のコンピュータ入力装置であるかのように、第1画像620と第2画像との間の相互作用に従って制御される。コンピュータ入力装置は、キーボード、ジョイスティック、コンピュータマウス等のような標準的周辺コンピュータ装置を含むが、それらに限定されない。
【0205】
ユーザはこうして、第1画像620および第2画像を相互作用させるようにユーザの手610を動かすことによって、コンピュータ装置を遠隔的に制御することが可能になる。
【0206】
その結果として、ユーザの手610の動きによるコンピュータ装置の遠隔制御は、(特定のジェスチャを定義することもできるが)予め定められた特定のジェスチャのセットに限定されたインタフェースではなく、連続的ユーザインタフェースに基づく。
【0207】
一実施例では、ユーザがその手610を動かすと、第1画像620はコンピュータキーボードの画像上で動き、ユーザがその指をタイピング動作するように動かすと、コンピュータ装置は、以下でさらに詳述する通り、あたかもユーザが実際のキーボードをタイピングしているかのように応答する。
【0208】
一実施例では、第1画像620の第二指が、コンピュータキーボードの画像の「C」文字の真上に位置する。ユーザがその手610の第二指で押す動作を行なうと、第1画像620の第二指は平行移動して、スクリーン上に提示された画像のキーボード画像の「C」文字を押す。その結果として、コンピュータ装置は、コンピュータ装置にワイヤ接続された実際のキーボードの「C」文字がユーザによってユーザ自身の指を用いて押されたかのように、応答する。
【0209】
当該実施例では、三次元空間におけるユーザの手の絶対位置は関係せず、ユーザの指の動きだけを追跡する必要がある。
【0210】
第1画像620の動きは、ユーザ自身の手610の動きと正確に相関するが、異なる縮尺で実行することができる。すなわち、第1画像620のサイズは、ユーザの実際の手610のサイズとは異なってもよい。
【0211】
任意選択的に、装置1000のジェスチャ認識器はさらに、以下でさらに詳述する通り、ユーザが第1画像620のサイズを変更することを可能にする。
【0212】
ここで
図7を参照すると、それは、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のための第1ジェスチャを模式的に示すブロック図である。
【0213】
本発明の例示的実施形態に係る装置は、上で詳述した通り、ジェスチャ認識器を含むことができる。
【0214】
本発明の例示的実施形態に係る第1の例示的ジェスチャは、ユーザがその手710をカメラの前で(例えば指および手を側方に素早く小さく揺り動かすことによって)振るリセットジェスチャである。
【0215】
リセットジェスチャを検知すると、スクリーン上に提示された第1画像は、第2画像上で予め定められた位置に、例えば第2画像に提示されたコンピュータ入力装置上の予め定められた位置に、またはスクリーン上に提示されたスプレッドシートのようなグラフィカル・ユーザ・インタフェースの1行目の位置に移動する。
【0216】
一実施例では、例示的リセットジェスチャを検知すると、画像提示器120は、上で詳述した通り、第1画像を表示されたコンピュータキーボードの中心の位置に移動させる。
【0217】
例示的リセットジェスチャは各指の別々の動きを含むので、例示的リセットジェスチャはさらに、指の位置の検出を容易化することができる。
【0218】
ここで
図8を参照すると、それは、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のための第2ジェスチャを模式的に示すブロック図である。
【0219】
第2の例示的ジェスチャはサイズ変更ジェスチャ、例えばユーザがその手810を予め定められた方向に回転させるジェスチャである。
【0220】
任意選択的に、例示的サイズ変更ジェスチャを検知すると、画像提示器120は、サイズまたはズームレベルに関して第2画像を変更することなく、スクリーンに表示された第1画像のサイズを変更する。
【0221】
例えば、全スクリーンモードで表示されたキーボードの画像と対話するユーザは、ユーザの実際の手の比較的小さい動きにより(動きの規模は手の画像のサイズに依存するので)、キーボードの片側から反対側に移るために、より大きい第1画像(例えば手の画像)を使用することを希望することがある。しかし、ユーザは、自分のウェブブラウザ上で小さいフォントのテキストを選択するために、より小さい第1画像(例えば手の画像)を必要とすることがある。
【0222】
代替的に、第1画像(すなわち手の画像)のサイズは一定に維持され、画像提示器120はむしろ縮小、拡大、ズームイン、またはズームアウトする第2画像(例えばキーボード)のサイズを変更し、こうして第1画像と第2画像との間のサイズの割合を変更する。
【0223】
ここで
図9を参照すると、それは、本発明の実施形態に係る、コンピュータ装置を遠隔手制御するための第3ジェスチャを模式的に示すブロック図である。
【0224】
第3の例示的ジェスチャはクリック(またはダブルクリック)ジェスチャであり、例えばユーザがその手の1本または2本の指を用いてクリックする910ジェスチャである。
【0225】
任意選択的に、例示的クリック(またはダブルクリック)ジェスチャを検知すると、画像提示器120は、ユーザの指の動きと正確に同調して、第1画像の指をクリック動作するように動かす。
【0226】
例えば、ユーザはコンピュータマウスの画像を提示され、画像内のコンピュータマウスの上の位置に第1画像を動かすことができる。
【0227】
ユーザが自分自身の指をクリック動作するように動かすと、第1画像の指がコンピュータマウスの画像上でクリックし、コンピュータ制御器130は、あたかもユーザがユーザ自身の指で実際のコンピュータマウスをクリックしたかのように、コンピュータ装置に応答させる。
【0228】
ここで
図10を参照すると、それは、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のための第4ジェスチャを模式的に示すブロック図である。
【0229】
第4の例示的ジェスチャは、例えばユーザの手1010を引張り動作するように動かすことによって、または(スマートフォンのタッチスクリーン上で指を互いに離れるように動かすのと同様に)ユーザの指の2本を互いに離れるように動かすことによって、ユーザがコンピュータ装置のスクリーン上に提示された画像をズームインまたは単純に拡大するジェスチャのような、ズーミングジェスチャである。
【0230】
一実施例では、互いに離れる指の動きを検知すると、画像提示器120は、ユーザの指の動きと平行に、第1画像の2本の指を互いに離れるように動かす。コンピュータ制御器130は、コンピュータ装置のスクリーン上に提示された画像をズームインまたは拡大するようにコンピュータ装置(例えばセルラ・スマート・フォン)を制御し、こうして、ユーザに実際のタッチスクリーンをタッチさせることなく、ユーザにタッチスクリーンのような機能性を提供する。
【0231】
本発明の例示的実施形態は、種々の他のユーザジェスチャ、例えばユーザがその指を閉じるスクロール・ダウン・ジェスチャ、またはユーザがその指を反対方向に動かすスクロール・アップ・ジェスチャを提供する。ジェスチャは、片方または両方の手、1本以上の指、手および指等により実行することができる。
【0232】
しかし、本発明の例示的実施形態では、ユーザの手の動きによるコンピュータ装置の遠隔制御は、(特定のジェスチャを定義することもできるが)特定のジェスチャの予め定められたセットに限定されるインタフェースにではなく、連続的ユーザインタフェースに基づく。
【0233】
例えば、コンピュータ装置の遠隔制御は、コンピュータ装置のスクリーン上に提示されたコンピュータキーボードの画像とユーザの連続的対話に基づくことができる。ユーザは、その手を空中で動かし、こうして第1画像をキーボード上で動かして、上で詳述した通り、ユーザの指をタイピング動作するように動かし、こうして第1画像の指によりキーボード上でタイピングすること等が可能になる。
【0234】
別の実施例では、第1画像がスクリーン上に提示されるコンピュータマウスを保持し、マウスをドラッグするなど、対話を通して第1画像を動かすために(ユーザは)その手を動かす。コンピュータ装置は、あたかも実際のマウスがユーザによってユーザ自身の手を用いてドラッグされているかのように、スクリーン上でカーソルを動かす。
【0235】
任意選択的に、当該実施例では、ユーザはさらに、単一の小さい中指動作によってマウスを自動的に移動させることができる。その結果として、マウスはスクリーンの片側から反対側に自動的に移動し、あるいはマウスはむしろ、予め定められた距離または時間(例えば3秒間)移動する。
【0236】
さらに別の実施例では、ボタンおよびメニューオプションを持つMicrosoft(商標)Excelスプレッドシート、ハイパーリンク、ボタン等を持つウェブページのようなコンピュータアプリケーションのグラフィカル・ユーザ・インタフェース(GUI)が、コンピュータ装置のスクリーン上でユーザに提示される。
【0237】
コンピュータ装置は、あたかもユーザが、GUIをユーザに提示するタッチスクリーンに、ユーザ自身の指をタッチしたかのように、ユーザ自身の手および指の動きに呼応して動く手の画像とGUIのメニュー、ボタン等との間の連続的対話に従って制御される。
【0238】
ここで
図11を参照すると、それは、本発明の例示的実施形態に係る、コンピュータ装置の遠隔手制御のためのシステムを模式的に示すブロック図である。
【0239】
コンピュータ装置の遠隔手制御のための例示的システムは、上で詳述した通り、装置1000の部品を含む。
【0240】
任意選択的に、装置1000の部品の1つ以上、例えばカメラおよび投光器は移動ユニット1110に設置される。移動ユニット1110は、装置1000の他の部品、コンピュータ装置1120(例えば、Apple(商標)iMacコンピュータ、コンピュータプロセッサ付きTV受像機等のような、スクリーンと結合されたコンピュータ)、または両方と無線連絡する。
【0241】
ユーザは、移動ユニット1110をテーブル上に配置することができる。
【0242】
次いで、ユーザはテーブルの横の椅子に着座し、その手を動かし、それによってコンピュータ装置1120を制御することができる。ユーザは、上で詳述した通り、(ユーザの手を表わす)第1画像と、コンピュータ装置1120のスクリーンに提示されたコンピュータキーボードの画像との相互作用を介して、コンピュータ装置1120を制御する。
【0243】
本発明の例示的方法および装置は、さらなる用途に使用することができる。
【0244】
例えば、携帯電話機では、装置1000はユーザが携帯電話機に触れることなく、スクロール、テキストの打ち込み、ズーム、およびクリックを行なうことを可能にする。その結果として、携帯電話機は小さくすることができるが、あたかも電話機がフルサイズのコンピュータキーボードを有するかのように、依然として携帯電話機との対話が可能である。
【0245】
任意選択的に、携帯電話機は、壁に画像を映写することのできるプロジェクタを有する。装置1000を使用して、ユーザは、電話機の制御器の画像の隣に映写された第1画像を動かすことができ、制御器は通常の電話機のボタンまたはタッチスクリーンである。
【0246】
その結果として、ユーザは、あたかもユーザが自身の手を用いて実際の電話機の制御器を直接操作するかのように、第1画像(例えば手の画像)を電話機の制御器の画像と相互作用させ、こうして相互作用に従って電話機を操作することができる。
【0247】
別の実施例では、コンピュータ装置は、自動車に設置されたコンピュータ装置(例えばGPSユニットまたは電話ユニット)である。
【0248】
運転しながらコンピュータ装置を操作することは、運転者は自動車のフロントウィンドウを通して道路に目を向けるよりむしろ、コンピュータ装置を操作するために、脇に目を向けなければならないので、そのような装置に典型的に設けられたインタフェース(すなわち小さいボタンまたはタッチスクリーン)の性質上、危険である。
【0249】
本発明の実施形態の装置1000は自動車のコンピュータ装置に設置すること(または自動車のコンピュータ装置と連絡すること)ができる。
【0250】
手追跡器110は、運転者の手および指の動きを追跡し、それによって、運転者の目を道路からユニットの小さいボタンを操作するその指に動かすことなく、運転者がコンピュータ装置(例えばGPSまたは電話ユニット)を制御することを可能にする。
【0251】
任意選択的に、手の画像およびGPSまたは電話ユニットのキーの画像は、ウィンドウを介する視界を著しく妨げることなく、自動車のフロントウィンドウに設置された小さいスクリーン上で運転者に提示される。
【0252】
運転者自身の手の実際の正確な位置は変化してもよい。
【0253】
すなわち、運転者は、実際に番号をダイヤルするかまたはGPSユニットのガイドシステムで行先を選択するために、どこでも自分に便利と思う場所でクリックすることができる。
【0254】
その結果として、運転者は、スクリーンが設置されたフロントウィンドウを覗き込み、かつ目を道路に向け続けながら、ハンドルの任意の領域で自分の手を使用して、GPSまたは電話ユニットを制御することができる。
【0255】
さらに、運転者は、上で詳述した通り、リセット動作でその手を振ることができる。その結果として、第1画像は、スクリーン上に存在する自動車電話機の番号の中心、または自動車のGPSユニットのタッチスクリーンのボタンに配置される。
【0256】
装置1000はまた、楽器に、例えばシンセサイザ、DJターンテーブル、または上で詳述した通り、ユーザの手の動きによって案内される別の楽器に設置することもできる。
【0257】
本特許の存続期間の期間中には、多くの関連する装置およびシステムが開発されることが予想され、本明細書中の(特に、「コンピュータ」、「CD−ROM」、「USBメモリ」、「ハードディスク」、「カメラ」、「回折光学素子」、「レーザダイオード」、および「LED」)用語の範囲は、すべてのそのような新しい技術を先験的に包含することが意図される。
【0258】
明確にするため別個の実施形態で説明されている本発明の特定の特徴は単一の実施形態に組み合わせて提供することもできることは分かるであろう。逆に、簡潔にするため単一の実施形態で説明されている本発明の各種の特徴は別個にまたは適切なサブコンビネーションで提供することもできる。
【0259】
本発明はその特定の実施形態によって説明してきたが、多くの別法、変更および変形があることは当業者には明らかであることは明白である。従って、本発明は、本願の請求項の精神と広い範囲の中に入るこのような別法、変更および変形すべてを包含するものである。
【0260】
本明細書中で言及した刊行物、特許および特許願はすべて、個々の刊行物、特許または特許願が各々あたかも具体的にかつ個々に引用提示されているのと同程度に、全体を本明細書に援用するものである。さらに、本願で引用または確認したことは本発明の先行技術として利用できるという自白とみなすべきではない。
【0261】
さらなる概論
一部の方法は、デジタル・ビデオ・ストリームからの通常の画像解析を含む。
【0262】
ビデオ画像はしたがって、関心のある特定領域、通常は手、顔、腕等のような身体部分を検知するために解析される。
【0263】
身体部分の位置および姿勢が検知された後、身体のジェスチャが検知され、コンピュータスクリーン上またはTV上に表示された媒体を制御するように変換される。ユーザの手および指のような身体部分を検知するには、最初に画像内の各画素をその色値によって解析し、それをその環境内の他の画素と比較する必要がある。そのような方法は、長い計算時間ならびに誤りおよび読取りミスの比較的高い百分率を免れない。主な問題の1つは、検知すべき手の背後の背景に由来する。例えば、該方法は、皮膚の色に近い色のシャツまたは別の複雑な模様のあるシャツを着用しているユーザの手を検知することが困難である。部屋の照明も検出性能に影響を及ぼす。カメラに対する手の角度も、この方法では問題になることがある。手の形はその回転により変化し、指先は、手の残部をカメラの方向に向けて、同一軸上に存在し、したがって色の差によって検知されないことがある。
【0264】
手の検知およびジェスチャの認知のための他の方法は、3D深度マップを使用することを含む。深度マップとは、画素によって表わされる、深度カメラの前に位置する物体の部分までの距離を各画素に保持する画像である。深度は、通常の2Dビデオ解析に存在する問題の多くを解決する。手は通常身体の前に位置しており、したがって特定の距離を越える画像の部分を取り除くことによって分離することができるので、手の位置の抽出は比較的容易である。そのような方法により、カメラに対する手の角度は同じように重要性が低くなる。手または身体の最も近い部分は、背景の色を考慮することなく、距離だけで検知することができる。しかし、完全な3D深度マップを取得するには比較的複雑なハードウェアおよび計算量が必要である。
【0265】
人体の完全な深度マップは、ゲームのようなジェスチャ認知の特定のアプリケーションには重要である。例えば、テニス・ゲーム・アプリケーションでは、ユーザの手が、ボールを打つことができるように後ろに伸ばされるか、あるいはネット近くでボールを阻止するために前に伸ばされる場合に、ユーザの位置をいかに正確に突き止めるかが重要である。しかし、ジェスチャ駆動仮想キーボードまたはマウスのような他のアプリケーションは、アプリケーションを制御するために、手および指の完全な3D深度マップを必要としない。
【0266】
したがって、上で詳細に教示した通り、中間ステップとして完全な3D深度マップを取得することなく、光パターン画像から直接ジェスチャを抽出することは有利であることが証明されるであろう。
【0267】
画像の比較に基づく解決策は、ジェスチャを直接検知するために、グリッドパターンのような構造化光パターンを使用する。比較に基づく解決策は、グリッドパターンの歪みを検知し、該歪みを、特定のジェスチャを表わす、予め定められたグリッドパターンの歪みのセットと比較する。ひとたび検知されると、ジェスチャは、各ジェスチャに配属されたコンピュータ動作を起動させる。画像比較に基づく解決策は、取得された光パターン画像に対して手のジェスチャを直接抽出するが、それらは予め定められたジェスチャの離散的セットに限られており、上で詳述した通り、ユーザの手および指の柔軟な追跡および表現、ならびに連続的ユーザインタフェースを介するコンピュータ装置の制御を提案するものではない。