(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6165513
(24)【登録日】2017年6月30日
(45)【発行日】2017年7月19日
(54)【発明の名称】ハンドジェスチャトラッキングシステム
(51)【国際特許分類】
G06T 7/20 20170101AFI20170710BHJP
【FI】
G06T7/20 300A
【請求項の数】4
【全頁数】7
(21)【出願番号】特願2013-125521(P2013-125521)
(22)【出願日】2013年6月14日
(65)【公開番号】特開2015-1804(P2015-1804A)
(43)【公開日】2015年1月5日
【審査請求日】2016年4月8日
(73)【特許権者】
【識別番号】504190548
【氏名又は名称】国立大学法人埼玉大学
(73)【特許権者】
【識別番号】511292161
【氏名又は名称】株式会社エクスビジョン
(74)【代理人】
【識別番号】100078031
【弁理士】
【氏名又は名称】大石 皓一
(74)【代理人】
【識別番号】100200942
【弁理士】
【氏名又は名称】岸本 高史
(74)【代理人】
【識別番号】100077779
【弁理士】
【氏名又は名称】牧 哲郎
(74)【代理人】
【識別番号】100078260
【弁理士】
【氏名又は名称】牧 レイ子
(74)【代理人】
【識別番号】100175891
【弁理士】
【氏名又は名称】原 一敬
(72)【発明者】
【氏名】小室 孝
(72)【発明者】
【氏名】樋口 政和
(72)【発明者】
【氏名】藤井 照穂
【審査官】
松田 直也
(56)【参考文献】
【文献】
特開2000−331170(JP,A)
【文献】
特開2007−316882(JP,A)
【文献】
特開2006−350434(JP,A)
【文献】
特開2013−031106(JP,A)
【文献】
特開2009−182662(JP,A)
【文献】
特開平10−063864(JP,A)
【文献】
特開平09−179988(JP,A)
【文献】
村井 陽介,弱識別器の応答に基づく類似シルエット画像選択によるChamfer Matchingを用いた人領域のセグメンテーション Human-Area Segmentation Using Chamfer Matching by Selecting Similar Silhouette Images Based on Weak-Classifier Response,電子情報通信学会論文誌 (J94−D) 第4号 THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS (JAPANESE EDITION),日本,社団法人電子情報通信学会 THE INSTITUTE OF ELECTRONICS,INFORMATION AND COMMUNICATION ENGINEERS,2011年 4月 1日,第J94-D巻
【文献】
岩切 裕太郎,事例に基づく筆順推定,電子情報通信学会技術研究報告 Vol.111 No.431 IEICE Technical Report,日本,社団法人電子情報通信学会 The Institute of Electronics,Information and Communication Engineers,2012年 2月 2日,第111巻
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/20
(57)【特許請求の範囲】
【請求項1】
動画像を撮影する撮影部と、前記撮影部で撮影した連続する撮影画像間での手指位置・形状の変化を推定する画像追跡部とを備え、
前記画像追跡部は、取得した撮影画像に対し、手指位置・形状推定パラメータの探索初期点を決定する第1のステップと、
探索初期点の並進成分を中心とした撮影画像内のROIを決定する第2のステップと、
ROIに対して輪郭抽出を行い、得られた輪郭画像に対して距離マップを作成する第3のステップと、
テンプレートマッチングにより、手指位置・形状のパラメータを推定する第4のステップと、
次の撮像画像を取得する第5のステップとを備え、
前記第1ないし第5のステップを繰り返すことで、ある時点において取得した撮像画像の探索初期点を、その直前に取得した撮像画像で得られた推定解とするように構成されており、
前記テンプレートマッチングは、手指の輪郭点と輪郭内部点の位置が記録されたテンプレート画像を用いて、テンプレート画像の手指の輪郭点をワープ関数によって変換した点の位置がROI内の輪郭点の位置に近いほど、項の値が小さくなる輪郭評価項に、テンプレート画像の手指の輪郭内部点をワープ関数によって変換した点の位置に対応するROI内の手の輪郭内部に輪郭が存在すればするほど、項の値が大きくなるペナルティ項を付加した評価関数を、目的関数としてパラメータの推定をすることにより行うとともに、推定したパラメータに基づいて評価関数によりマッチングスコアを算出するように構成されており、さらに、前記マッチングスコアが所定の閾値を下回ったとき、手指が検出されたと判定し、前記画像追跡部が手指の追跡を開始することを特徴とするハンドジェスチャトラッキングシステム。
【請求項2】
前記ROIは、画像フレーム内の手指の大きさに応じて縦横の長さが決定されることを特徴とする請求項1記載のハンドジェスチャトラッキングシステム。
【請求項3】
前記輪郭抽出は、ROI内の各ピクセルについて、各カラー成分(RGB)に対し空間フィルタを適用して成分毎に勾配強度を求め、これらの勾配強度の中で最大の値をそのピクセルの勾配強度とし、最終的に得られたROIの勾配強度をある閾値で二値化してROIの輪郭画像を得ることを特徴とする請求項1記載のハンドジェスチャトラッキングシステム。
【請求項4】
前記距離マップは、輪郭画像の各ピクセルから最も近い輪郭ピクセルまでの距離を、輪郭画像の各ピクセル位置に記述したマップであることを特徴とする請求項1記載のハンドジェスチャトラッキングシステム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、機器の前面にかざした手指を用いて操作を行う入力システムの実現に向けた、多様に運動する手指を追跡するハンドジェスチャトラッキングシステムに関する。
【背景技術】
【0002】
カメラで手指を撮影した場合、手指の他に背景や操作者の顔や衣服などが写り込むことが予想される。それにより、手指の認識が困難になる。さらに、低スペックなスマートTVのCPUでこのようなシステムを実現するためには認識処理の軽量化が要求される。また、想定している入力システムはポインティングデバイスであり、大雑把な認識で十分なジェスチャ入力システムと違い、高い応答性と位置精度が要求される。
【発明の概要】
【発明が解決しようとする課題】
【0003】
解決しようとする問題点は以上の点であり、本発明は、手指の輪郭とその内部情報に基く二値テンプレート画像を用いた手指位置・形状の推定方法を提案することを目的になされたものである。
【課題を解決するための手段】
【0004】
そのため本発明は、取得した撮影画像に対し、手指位置・形状推定パラメータの探索初期点を決定する手段と、探索初期点の並進成分を中心とした撮影画像内のROIを決定する手段と、ROIに対して輪郭抽出を行い、得られた輪郭画像に対して距離マップを作成する手段と、テンプレートマッチングにより、手指位置・形状のパラメータを推定する手段とを備えたことを最も主要な特徴とする。
【発明の効果】
【0005】
本発明は、各撮影画像から逐次手指を検出する検出ベースの手法ではなく、連側する撮影画像間での手指位置・形状の変化に基いてそれらを推定する追跡ベースな手法であることを特徴としており、手指周囲の領域のみで処理を行うことで。高い応答性と位置精度を確保できる。
【0006】
各撮影画像における手指の位置・形状の推定には処理領域の輪郭情報と手指内部に相当する領域での輪郭有無の情報を用いる。それにより、複雑な状況下においても正確な手指位置・形状の推定が可能となる。また、推定のための評価関数は、処理領域の輪郭情報から得られる輪郭点とテンプレートの輪郭点間の距離から構成されており、反復解法に適した滑らかな関数となる。従って、推定解に速く収束し高速性が確保される。このように、本発明は、スマートTVへの実装に要求される頑健性と高速性を兼ね備え、かつポインティングデバイスに要求される高い応答性と位置精度を実現した手法となっている。
【図面の簡単な説明】
【0007】
【
図1】本発明を実施したハンドジェスチャトラッキングシステムのブロック図である。
【
図2】ハンドジェスチャトラッキングシステムのフローチャートである。
【発明を実施するための最良の形態】
【0008】
以下、本発明の実施の形態について説明する。
【0009】
図1に、本発明を実施したハンドジェスチャトラッキングシステムのブロック図を示す。
ハンドジェスチャトラッキングシステムは、動画像を撮影するカメラ1と、カメラ1で撮影した連続する撮影画像間での手指位置・形状の変化を推定する画像追跡部2で構成し、画像追跡部2は、前のフレームで推定した追跡対象の位置を中心に任意の範囲で局所探索のための矩形領域(ROI:Region of Interest)を設定するROI設定部21と、ROIに対して空間フィルタを用いて手指の輪郭画像を抽出する輪郭抽出部22と、ROI内をラスタスキャンしてマッチング位置を求めるテンプレートマッチング部23で構成する。
【0010】
図2に、ハンドジェスチャトラッキングシステムのフローチャートを示す。
処理の流れは、まず、取得した撮影画像に対し、手指位置・形状推定パラメータの探索初期点を決定する(step1)。
【0011】
ここで、ある時点において取得した撮影画像をフレームkとすると、その直前に取得した撮影画像はフレームk−1で表わされる。フレームkでの手指位置・形状推定パラメータの探索初期点はフレームk−1で得られた推定解とする。想定した入力システムを手指で操作する場合、極端に早い手の動きは現実的ではないので、フレーム間での手指位置・形状の変化はそれほど大きくないと仮定しても問題はないと考えられる。従って、このように決定された推定パラメータの探索初期点とフレームkでの推定解は、探索空間内において互いに近い位置に存在し、初期点の推定解への収束速度は速くなる。これにより近傍領域を効率的に探索することができる。
【0012】
次に、探索初期点の並進成分を中心とした撮影画像内のROIを決定する(step2)。
ここで、フレームkでの推定パラメータの探索初期点をPk=(txk、tyk、sk、θk)Tとする。ただし、txkとtykはそれぞれ水平と垂直の並進成分であり、skとθkはそれぞれ倍率(スケール)と回転角の成分である。フレームk内のピクセル位置(txk、tyk)を中心として、適当な大きさのROIを設定する。具体的には、フレーム内の手指の大きさに応じてROIの縦横の長さが決定されるようにしている(
図3を参照)。このように、追跡対象物(手指)の移動は平行移動のみでなく、回転やスケール変化を考慮する。
【0013】
次に、ROIに対して輪郭抽出を行い、得られた輪郭画像に対して距離マップを作成する(step3)。
ここで、ROIに対する輪郭抽出は基本的にSobelフィルタを用いて行っている。具体的には、ROIの各カラー成分(RGB)に対しSobelフィルタを適用し、各成分毎に勾配強度を求める。そして、ROIの各ピクセルについて、上記で求めた各成分の勾配強度の中で最大の値をそのピクセルの勾配強度とする。最終的に得られたROIの勾配強度をある閾値で二値化し、ROIの輪郭画像を得る(
図4を参照)。
ROIの輪郭画像に対する距離マップとは、輪郭画像の各ピクセルから最も近い輪郭ピクセルまでの距離を、輪郭画像の各ピクセル位置に記述したマップである。輪郭ピクセルでの距離マップ上の値は0となり、輪郭ピクセルから遠いピクセルほど距離マップ上の値は大きくなる。
【0014】
次に、テンプレートマッチングにより、手指位置・形状のパラメータを推定する(step4)。ここで、手指の位置・形状の推定は、二値化した手指のテンプレート画像を用いたマッチングにより行う。まず、テンプレート画像内の手指の輪郭点と手指内部点の位置を記録し、それらの集合をそれぞれOUT,INとする(
図5を参照)。
マッチングの評価関数は次の数式(1)のように構成する。
数式(1)
【数1】
ただし、
【数2】
は推定パラメータ、I
Dは距離マップ、Wはワープ関数であり、
【数3】
で表される。
R(θ)はθに関する回転行列である。
【数4】
これを最小にするようなパラメータPを推定する。数式(1)の第1項は手指の輪郭評価項であり、テンプレート画像の手指の輪郭点をワープ関数によって変換した点の位置がROI内の輪郭点の位置に近いほど、この項の値は小さくなる。数式(1)の第2項は手指内部のペナルティ項であり、テンプレート画像の手指内部点をワープ関数によって変換した点の位置に対応するROIの輪郭画像内の位置に輪郭が存在すればするほど、この項の値は大きくなる。本来、手指の内部には輪郭は存在しないと考えられるので、そこに相当する領域に輪郭が多く存在すれば、それは手指ではないと判定される。これにより、複雑な状況下においてもある程度正確に手指の位置・形状の推定が可能となる。評価関数の最小化は勾配法により行う。
図6にマッチングの様子を示す。
評価関数は、ROIの輪郭点とテンプレートの輪郭点間の距離から構成されており、滑らかな関数となる。従って、この評価関数は反復解法に適しており、少ない反復回数で推定解に収束する。
【0015】
最後に、次の撮影画像を取得し、step1に戻る。
【0016】
以上のような構成で、まず、手指の初期検出は、撮影画像内の決められた範囲内に手指をかざすことにより行う。この範囲内では、ランダムに推定パラメータが選択され、絶えずマッチングスコアを数式(1)により算出しており、範囲内に手指が存在すれば算出されるマッチングスコアは小さい値となる。このマッチングスコアがある閾値を下回れば手指が検出されたと判定され、手指の追跡が始まる。
【0017】
また、連続する数枚の撮影画像に対し追跡失敗の判定がされた場合、手指追跡は失敗と判断され手指の初期検出に戻る。手指追跡の成否判定も、マッチングスコアにより行い、その値がある閾値を上回ったら追跡失敗と判定する。
【符号の説明】
【0018】
1 カメラ
2画像追跡部
21 ROI設定部
22 輪郭抽出部
23 テンプレートマッチング部