【課題を解決するための手段】
【0006】
(発明の概要)
その第1の側面において、本発明はビデオストリームの中のオブジェクト認識および追跡システムを提供する。本発明のシステムは2つの別々の論理的階層に基づいている。第1の階層はビデオストリームを環境内でスタンドアロン・モーションセンサとして機能する関心領域へと分割し、追跡されたオブジェクトが領域内に存在する可能性を計算する責任を他に依存しないで負う。第2の階層は領域セットの挙動を時間をかけて監視し、可能性のパターンに基づいて、追跡されたオブジェクトの位置およびモーションパラメータを計算する。
【0007】
本発明のシステムはシステムにより解析されるビデオストリームのフレームを格納するメモリを含んでいる。プロセッサがメモリ内に格納されたビデオストリームのフレームを読み込む。関心領域が予め定められた被追跡オブジェクトの少なくとも一部を含む確率に従って、オブジェクト検出モジュールが各フレーム内の関心領域を分類する。後述するように、オブジェクト検出モジュールによるオブジェクト検出はフレーム内のオブジェクトのエッジ検出を伴わない。オブジェクト追跡モジュールは、その入力として、オブジェクト検出モジュールから出力される分類されたフレームを受信し、連続する分類されたフレームを比較することにより、オブジェクトの動きを決定する。本発明のシステムはキーボード、マウスまたはジョイスティック等の装置に関連する任意の入力装置の代わりに、またはそれに加えて、装置にオペレーティングシステム(OS)コマンドを入力するのに使用することができる。本発明のシステムはパーソナルコンピュータ(PC)、PDA、ラップトップまたはパームプロット等のポータブルコンピュータ、携帯電話、ラジオその他のエンターテインメント装置、車両、デジタルカメラ、携帯ゲーム機、コンピュータ化医療装置およびスマートハウス製品等の任意タイプのデータ処理装置において使用することができる。
【0008】
応用に応じて、プロセッサはオブジェクトモーションの予め定められたセットの中から追跡されたオブジェクトのモーションパターンを識別するパターン認識モジュールを随意含むことができる。システムは、さらに、予め定められた1つ以上のモーションパターンの各々に対して、関連するOSコマンドを提供するルックアップテーブルを格納するOSコマンド実行モジュールを含むことができる。予め定められたオブジェクトモーションの1つが識別されると、そのモーションに関連するOSコマンドがシステムにより実行される。
【0009】
その第2の側面において、本発明は本発明のシステムを含むデータ処理装置を提供する。データ処理装置は、たとえば、パーソナルコンピュータ(PC)、PDA、ラップトップ等のポータブルコンピュータ、または携帯電話、ラジオその他のエンターテインメント装置、車両、デジタルカメラまたは携帯ゲーム機とすることができる。前記したように、本発明の装置はオブジェクト検出およびオブジェクト追跡を行うように構成されたビデオカメラおよびプロセッサを有する。被検出および追跡オブジェクトは、たとえば、ユーザの手または指、あるいはハンドヘルド・スタイラスあるいは他の予め定義されたまたは特定の装置とすることができる。
【0010】
本発明の装置は、認識された各動きに対して、関連するOSコマンドを提供するルックアップテーブルを格納するメモリを含んでいる。パターン識別モジュールによりモーションパターンが検出されると、動きに関連づけられたOSコマンドがルックアップ内で検索され(looked up)、次に、動きに関連づけられたOSコマンドが実行される。OSコマンドは、たとえば、Speaker On/Off、MP3/IPTV内のNext/Previous track、GPS応用におけるマップビュー・コントロール、ボイスメール・サービスをスイッチオンする、等の活性化機能(activate functions)とすることができる。
【0011】
本発明のこの側面に従って、ビデオストリームのフレームは2つ以上の関心領域に分割される。各関心領域に対して、関心領域内のピクセルの統計的解析が行われる。たとえば、統計的解析は関心領域のピクセル上に定義された1つ以上の関数の各々に対してヒストグラムを発生するステップを含むことができる。関数は、たとえば、ピクセルのレッド、グリーン、またはブルーの色の任意の1つの強度、またはピクセルの色相、彩度または輝度のいずれか1つとすることができる。ヒストグラムは単一変数ヒストグラムまたは多変数ヒストグラムとすることができ、ピクセル・プロパティのnタプルの頻度が集計される。統計的解析は任意の1つ以上のヒストグラムの平均、モード、標準偏差、または分散等の統計的パラメータの値を計算するステップを含むこともできる。関心領域の統計的解析の結果は、検出されるオブジェクトの少なくとも一部を領域が含む確率に従って領域を分類するのに使用される。解析された各フレームに対して、フレームの関心領域の分類を表す「関心領域(RI)フレーム」が発生される。
【0012】
1つ以上のパターン検出モジュールがRIフレームからオブジェクトの特定のモーションパターンを検出するのに使用される。各パターン検出モジュールはそれにより検出された特定のモーションパターンがタイムウィンドウ中に生じた確率を出力する。1つ以上のパターン認識モジュールの出力は発生した可能性が最も高いモーションパターンを決定するモーション認識モジュールへ入力される。モーション検出モジュールの決定はパターン認識モジュールから入力される確率に基づいており、外部入力、たとえば、オペレーティングシステムまたは実行されるアプリケーションからの入力を考慮することもできる。
【0013】
このように、第1の側面において、本発明はビデオストリームの中のオブジェクト検出および追跡システムを提供し、それは、
(a)オブジェクト検出モジュールおよびオブジェクト追跡モジュールを含むプロセッサを含み、
オブジェクト検出モジュールは、
(i)ビデオストリームの中の2つ以上の各フレーム内の1つ以上の関心領域の各々に対して、関心領域が被追跡オブジェクトの少なくとも一部を含む確率を計算し、
(ii)計算された確率に従って2つ以上の各フレーム内の関心領域を分類して各ビデオフレームに対する関心領域(RI)フレームを発生し、RIフレームは関心領域の分類を報告する、ように構成され、
オブジェクト追跡モジュールは、
(i)オブジェクト検出モジュールにより発生された2つのRIフレームを比較してオブジェクトの動きを決定する、ように構成される。
【0014】
オブジェクト追跡モジュールは1つ以上のパターン検出モジュールを含むことができ、各パターン検出モジュールはタイムウィンドウ中の追跡されたオブジェクトの動きの特定のパターンがタイムウィンドウ中に生じた確率を計算するように構成されている。オブジェクト追跡モジュールは、さらに、生じている可能性が最も高いモーションパターンを1つ以上のパターン検出モジュールにより発生された確率に基づいて決定するモーション認識モジュールを含むことができる。モーション認識モジュールの決定は外部信号を考慮することを伴うことがある。
【0015】
本発明のシステムは、さらに、動きの識別されたパターンに関連するOSコマンドを実行するように構成されたオペレーティングシステム(OS)コマンド実行モジュールを含むことができる。
【0016】
その第2の側面において、本発明はビデオストリームの中のオブジェクト検出および追跡方法を提供し、それは、
(i)ビデオストリームの中の2つ以上の各フレーム内の1つ以上の関心領域の各々に対して、関心領域が被追跡オブジェクトの少なくとも一部を含む確率を計算し、
(ii)計算された確率に従って2つ以上の各フレーム内の関心領域を分類して各ビデオフレームに対する関心領域(RI)フレームを発生し、RIフレームは関心領域の分類を報告し、かつ、
(i)オブジェクト検出モジュールにより発生された2つ以上のRIフレームを比較してオブジェクトの動きを決定する、ステップを含んでいる。
【0017】
関心領域が被追跡オブジェクトの少なくとも一部を含む確率は、
(a)ビデオストリームの中の各フレーム内の1つ以上の関心領域の各々に対して、関心領域内のピクセルの統計的解析を計算し、
(b)ビデオストリームの1つ以上の前のフレーム内の関心領域の統計的解析を伴う計算において関心領域の離散的分類を計算する、
ステップを含む方法により得ることができる。
【0018】
統計的解析は関心領域のピクセル上で定義された1つ以上の関数の各々に対してヒストグラムを発生するステップを含むことができる。1つ以上の関数は、
(a)ピクセルのレッド、グリーン、またはブルーの色の任意の1つの強度、
(b)ピクセルの色相、彩度または輝度のいずれか1つ、
を含むグループの中から選択することができる。
【0019】
本発明の方法は、さらに、1つ以上の関数の統計的パラメータの値を計算するステップを含むことができる。1つ以上の統計的パラメータは、
(a)平均、
(b)モード、
(c)標準偏差、
(d)分散
を含むグループから選択することができる。
【0020】
2つ以上のRIフレームを比較するステップは、
(a)各フレーム、およびフレーム内の分類された関心領域の各々に対して、関心領域の分類をフレームを含むタイムウィンドウ内で得られた複数のフレーム内の関心領域の分類と比較し、
(b)比較に基づいて、選択された関心領域が被追跡オブジェクトを含むか否かを決定し、
(c)この決定に基づいて、関心領域が被追跡オブジェクトを含むか否かに従って、関心領域を再分類し、
(d)タイムウィンドウ中の2つ以上の領域の状態の変化に基づいて、オブジェクトの動きの1つ以上の追跡パラメータを計算する、
ステップを含むことができる。
【0021】
追跡パラメータは、
(a)オブジェクトの動きの方向、
(b)オブジェクトの動きの速度、
(c)オブジェクトの加速度、
(d)ピクセル内のオブジェクトの幅、
(e)ピクセル内のオブジェクトの高さ、
(f)フレーム内のオブジェクトの位置、
を含むグループから選択することができる。
【0022】
そのもう1つの側面において、本発明は本発明のシステムを含むデータ処理装置を提供する。データ処理装置は、
(a)パーソナルコンピュータ(PC)、
(b)PDAまたはラップトップ等のポータブルコンピュータ、
(c)携帯電話、
(d)ラジオ、
(e)エンターテイメント装置、
(f)スマートホーム、
(g)車両、
(h)デジタルカメラ、
(i)キッチン用品、
(j)メディアプレーヤまたはメディアシステム、
(k)ロケーションベース装置、
(l)携帯ゲーム機、
(m)ピコプロジェクタまたは埋め込みプロジェクタ、
(n)医療ディスプレー装置、
(o)インカー/インエア情報システム、
を含むグループから選択することができる。
【0023】
本発明の装置は、さらに、ビデオカメラおよびディスプレー画面の一方または両方を含むことができる。
【0024】
追跡されたオブジェクトの動きの1つ以上のパターンは、
(a)ピクセル内のオブジェクトの幅がタイムウィンドウ中に増加した、
(b)ピクセル内のオブジェクトの幅がタイムウィンドウ中に減少した、
(c)オブジェクトがカメラにより近く動いた、
(d)オブジェクトがカメラから離れるように動いた、
(e)オブジェクトが予め定められたパス内を動いた、
(f)オブジェクトが回転した、
(g)オブジェクトが静止していた、
(h)オブジェクトが任意タイプの動きをした、
(i)オブジェクトがフリッキング動作を行った、
(j)オブジェクトが加速した、
(k)オブジェクトが減速した、および、
オブジェクトが動いた後で停止した、
を含むグループから選択することができる。
【0025】
プロセッサは、さらに、動きの識別されたパターンに関連する装置のOSコマンドを実行するように構成されたオペレーティングシステム(OS)コマンド実行モジュールを含むことができる。OSコマンドは、
(a)装置のディスプレー画面上にディスプレーされる仮想キーを押下する、
(b)装置のディスプレー画面上に現れるカーソルを画面上の新しい位置へ動かす、
(c)選択カルーセルを回転させる、
(d)デスクトップ間の切り替え、
(e)予め定められたソフトウエア・アプリケーションを中央処理装置上で実行する、
(f)アプリケーションをターンオフする。
(g)スピーカをターンオンまたはオフする、
(h)音量を上げ下げする、
(i)メディアプレーヤ内またはIPTVチャネル間で次または前のトラックへスキップする、
(j)GPSアプリケーションを制御する、
(k)ボイスメールサービスをスイッチオンする、
(l)写真/音楽アルバムギャラリ内でナビゲートする、
(m)ウェブページ、メール、ドキュメントまたはマップをスクロールする、
(n)携帯ゲーム内のアクションを制御する、および、
(o)インタラクティブビデオまたはアニメイテッドコンテンツを制御する、
を含むグループから選択することができる。
【0026】
本発明に従ったシステムは適切にプログラムされたコンピュータとすることもできる。同様に、本発明は本発明の方法を実行するためにコンピュータが読み取り可能なコンピュータプログラムを意図している。本発明は、さらに、本発明の方法を実行するために機械が実行可能な命令のプログラムを明白に具現化している機械読取可能なメモリを意図している。