【文献】
大野 健太朗、弘畑 和秀,“Webカメラを用いた身振り認識によるユーザインタフェースの実現”,情報処理学会研究報告,日本,社団法人情報処理学会,2006年05月19日,Vol.2006, No.52,pp.57-61
【文献】
根本 祐也、中島 克人,“複雑背景下における単眼カメラによるハンドジェスチャの認識”,FIT2013 第12回情報科学技術フォーラム 講演論文集 第3分冊 査読付き論文・一般論文,日本,一般社団法人情報処理学会、社団法人電子情報通信学会,2013年08月20日,pp.113-114
(58)【調査した分野】(Int.Cl.,DB名)
ステップS5における前記手首の分割線の座標は、現在点の勾配が0で、次の点の勾配が0以上であることを決定基準として、手の勾配分布ヒストグラムにおける親指手根中手関節点を探した後の値によって決定されることを特徴とする請求項2に記載のスマートホームシーン向けのマルチジェスチャー精分割方法。
【発明の概要】
【発明が解決しようとする課題】
【0005】
以上をまとめると、従来技術を基に新規なスマートホームシーン向けのマルチジェスチャー精分割方法を提案し、ジェスチャー分割技術のスマートホーム機器における大規模の普及と応用を実現することは、現在の業者にとって解決を急がれる問題となっている。
【課題を解決するための手段】
【0006】
本発明の目的は、従来技術に存在する以上の不備に鑑み、スマートホームシーン向けのマルチジェスチャー精分割方法を提案することにある。当該方法は、以下のステップを含む。
S1)ジェスチャー画像Image0に対して前処理を行い、画像Image1を得る;
S2)前処理後の画像Image1に対して肌色分割を行い、処理後の画像Image4を得る;
S3)画像Image4において画像の最小結合矩形MBRを構築する;
S4)画像Image4における非ジェスチャーエリアを非ジェスチャーエリア除外基準によって除外して、ジェスチャー画像Image5を取得する;
S5)手の形状特徴に基づく腕冗長性除去アルゴリズムによって画像Image5を処理することによって、腕冗長性の除去を完了する。
【0007】
S1における前記前処理は、少なくとも、ジェスチャー画像ノイズ除去、ジェスチャー画像2値化およびモルフォロジー処理を含むことが好ましい。
【0008】
S2は、具体的に以下のステップを含むことが好ましい。
S21)Image1画像をRGB色空間からYCbCr色空間に変換して画像Image2を得て、さらにグローバル固定閾値2値化法により画素毎に閾値と比較して2値化画像Image3を得る;
S22)2値化画像Image3の穴と隙間をモルフォロジーにおける膨張腐食演算を用いて除去し、2値化画像をメディアンフィルタを用いて処理し、画像Image4を得る。
【0009】
S3は、具体的に、S2で得られた2値化ジェスチャー画像の輪郭情報をリストcontoursに格納し、座標情報から外接矩形の4つの頂点の座標をそれぞれtop_left、top_right、bottom_left、bottom_rightとして得るステップを含むことが好ましい。
【0010】
S4における前記非ジェスチャーエリア除外基準は、具体的に以下を含むことが好ましい。
1)640*480の画像サイズが取得された場合、外接矩形の面積が2500未満である場合、非ジェスチャーエリアとして認定される;
2)外接矩形の幅に対する長さの比が5より大きい場合、非ジェスチャーエリアとして認定される;
3)外接矩形内の画素値255の点の数が矩形面積に対する比が0.8より大きいか、0.4より小さい場合、非ジェスチャーエリアとして認定される。
【0011】
S5における前記手の形状特徴に基づく腕冗長性除去アルゴリズムは、具体的に、画像Image6に対して、幅の最大値およびその対応する座標を親指手根中手関節とする手の幅分布ヒストグラムと、手の勾配分布ヒストグラムとを統計することを含み、手首の分割線の座標は、手の勾配分布ヒストグラムにおける親指手根中手関節点を探した後の値によって決定されることが好ましい。
【0012】
ステップS5における前記手首の分割線の座標は、現在点の勾配が0で、次の点の勾配が0以上であることを決定基準として、手の勾配分布ヒストグラムにおける親指手根中手関節点を探した後の値によって決定されることが好ましい。
【発明の効果】
【0013】
従来技術に比較し、本発明の利点は、主に以下である。
【0014】
本発明によるスマートホームシーン向けのマルチジェスチャー精分割方法は、ジェスチャーをローカルでインテリジェントに分割することができ、ネットワークに依存しすぎるという従来技術の不備を克服し、本方法を適用する装置がネットワーク接続なしでも正常に動作することができる。
【0015】
本発明は、ジェスチャーピクチャーをRGB色空間からYCbCr色空間に変換し、さらにグローバル固定閾値2値化方法によって、肌色の分割を完了する。そして、非ジェスチャーエリアを除外して、ジェスチャー輪郭のMBRとMABRを構築し、ジェスチャー画像を回転させて手の幅を統計し、幅分布ヒストグラムと幅に基づく勾配分布ヒストグラムを構築し、手首の分割線を決定する。最後に、腕の冗長性の除去を完了し、完全なジェスチャー画像が得られる。本発明は、ホーム環境画像内のジェスチャーを迅速かつ正確に分割することを可能にし、ジェスチャーに基づく人間対コンピュータインタラクションシステムの使用の快適さを著しく向上させ、ユーザ満足度を向上させる。
【0016】
また、本発明は、当該分野における他の関連課題の参考になれるものであり、これに基づいて拡張を行うことができ、他のジェスチャー分割に関する技術案に応用することができ、十分に広い応用範囲を有する。
【発明を実施するための形態】
【0019】
本発明は、スマートホームシーン向けのマルチジェスチャー精分割方法を開示する。前記方法は、YCbCr色空間の肌色分割アルゴリズム、非ジェスチャーエリア除外基準、および手の形状特徴に基づく腕冗長性除去アルゴリズムに基づく。本発明の方法は、以下のステップを含む。S1)ジェスチャー画像Image0に対して前処理を行い、画像Image1を得る;S2)前処理後の画像Image1に対して肌色分割を行い、処理後の画像Image4を得る;S3)画像Image4において画像の最小結合矩形MBRを構築する;S4)画像Image4における非ジェスチャーエリアを非ジェスチャーエリア除外基準によって除外して、ジェスチャー画像Image5を取得する;S5)手の形状特徴に基づく腕冗長性除去アルゴリズムによって画像Image5を処理することによって、腕冗長性の除去を完了する。
【0020】
以上のステップの表現から明らかなように、本発明の方法は、主に肌色分割と腕冗長性の除去の2つの大きな側面を含む。
【0021】
以下、図面を参照して本発明の方法を具体的に説明する。
図1は、本発明の実施例によるジェスチャー画像の肌色分割方法を示す。当該方法のステップとして、主に、以下のステップを含む。
【0022】
S1において、ジェスチャー画像Image0に対して前処理を行い、画像Image1を得る。
【0023】
ジェスチャー画像は、取得時に不可避的にノイズの干渉が存在し、ジェスチャー画像の分割および認識に大きな影響を与えるため、ジェスチャー分割前の画像に対する前処理が特に重要となる。前記前処理は、少なくとも、ジェスチャー画像ノイズ除去、ジェスチャー画像2値化、およびモルフォロジー処理を含む。
【0024】
ここで、ジェスチャー画像ノイズ除去は、主に、線形フィルタに属するガウシアンフィルタを使用する。フィルタ窓の画素の値は、テンプレート中心からの距離が増大するにつれて減少するガウス分布に従い、2次元ガウシアン関数が以下である。
【0026】
ここで、h(x,y)は、ガウシアンフィルタにおける(x,y)座標上の値を表し、σは、標準偏差を表す。
【0027】
S21において、Image1画像をRGB色空間からYCbCr色空間に変換して画像Image2を得て、さらにグローバル固定閾値2値化法により画素毎に閾値と比較して2値化画像Image3を得る。
【0028】
YCbCr色空間は、ビデオ画像およびデジタル画像においてよく使用される色空間である。画像の明暗を表し、0〜255の範囲から値を取るY(luma)成分と、RGB色空間における青色成分とRGB色空間における輝度値の差を表し、0〜255の範囲から値を取るCb成分と、RGB色空間における赤色成分の値とRGB色空間における輝度の差を表し、0〜255の範囲から値を取るCr成分との3つの成分を含む。ここで、Cb成分とCr成分は、互いに独立しており、Y成分と効率よく分離することができる。
【0029】
RGB色空間からYCbCr色空間への変換式は、以下の通りである。
【0031】
以下のマトリックス形式へ変換される。
【0033】
上記ステップで説明した画素毎の閾値との比較は、具体的に、人の肌色のY、Cb、Cr値が「0:256,130:174,77:128」程度であるとして、画像中の画素のYCbCr値がこの区間に属する場合にはその画素値を255とし、そうでない場合には0として、2値化画像Image3を得ることができる。
【0034】
S22において、2値化画像Image3の穴と隙間をモルフォロジーにおける膨張腐食演算を用いて除去し、2値化画像をメディアンフィルタを用いて処理し、画像Image4を得る。
【0035】
ジェスチャー画像は、2値化処理を経ることにより、得られる画像に、隙間や欠け等が生じることがある。モルフォロジーの役割は、孤立した小さな点、バリの除去、小さな穴の充填、小さな隙間の埋め込み等であり、モルフォロジー操作は主に以下の4種類がある。
1、膨張。モルフォロジー演算における膨張演算過程は、物体が接触した背景点をその物体に統合するものである。その結果、対象物の面積が大きくなる。これは、対象領域に存在する空洞や隙間を埋めることを意味する。
2、腐食。モルフォロジー演算における腐食演算過程は、物体の全ての境界点を消去するものである。その結果、対象物の面積が小さくなる。これは、対象領域に存在する、意味を持たない小さな孤立点を除去することを意味する。
3、開演算。モルフォロジー演算における開演算過程は、まず2値化画像に対して腐食演算を行い、その後に膨張演算を行う。その意味は、目標領域に存在する小さな孤立点やバリ等の無意味な点を消去(腐食演算)し、空洞や隙間を埋める(膨張演算)ことである。
4、閉演算。モルフォロジー演算における閉演算過程は、まず2値化画像に対して膨張演算を行った後、腐食演算を行う。その意味は、対象領域に存在する空洞や隙間を埋める(膨張演算)こと、小さな孤立点やバリなどの無意味な点を消去する(腐食演算)ことである。
【0036】
前記メディアンフィルタは、非線形フィルタに属し、主に、現在点の周辺画素点の統計およびソートをし、その中央値を現在点の画素値として抽出することで、孤立したノイズ点を除去する。主にメディアンフィルタでジェスチャー2値化画像エッジのバリを平滑化し、そのエッジを平滑化し、手首の分割線の探索に与える影響を低減する。
【0037】
図2は、本発明の実施例によるジェスチャー画像に対し腕冗長性の除去を行う方法であり、当該方法のステップとして、主に以下のステップを含む。
【0038】
S3において、ジェスチャー画像の最小結合矩形MBRを構築する。
【0039】
画像Image4においてジェスチャー画像の最小結合矩形MBRを構築し、その頂点座標情報は、以下である。
【0041】
MBRを基に画像のMABRを構築し、輪郭が既知であることを前提に、Grahamスキャン法によりジェスチャー輪郭の凸包を求め、図形をそのMBRの中心を原点としてその90度の範囲内でβ尺度で等間隔に回転させることができる。回転角度に応じたパターンのMBR面積を同時に記録すると、記録の中の最小のMBR面積に対応するMBRは、求められるMABRとなる。
【0042】
S4において、画像Image4における非ジェスチャーエリアを非ジェスチャーエリア除外基準によって除外して、ジェスチャー画像Image5を取得する。
【0043】
前記非ジェスチャーエリア除外基準は、具体的に以下を含む。
1)640*480の画像サイズが取得された場合、外接矩形の面積が2500未満である場合、非ジェスチャーエリアとして認定される;
2)外接矩形の幅に対する長さの比が5より大きい場合、非ジェスチャーエリアとして認定される;
3)外接矩形内の画素値255の点の数が矩形面積に対する比が0.8より大きいか、0.4より小さい場合、非ジェスチャーエリアとして認定される。
【0044】
その後、2値化ジェスチャー画像を反時計回りに回転させると、上記ステップでMABRに対応する回転角度が得られ、ジェスチャー画像を反時計回りに回転させると、ジェスチャー方向を垂直にすることができる。
【0045】
S5において、手の形状特徴に基づく腕冗長性除去アルゴリズムによって画像Image5を処理することによって、腕冗長性の除去を完了する。
【0046】
S5における前記手の形状特徴に基づく腕冗長性除去アルゴリズムは、具体的に、画像Image6に対して、幅の最大値およびその対応する座標を親指手根中手関節とする手の幅分布ヒストグラムと、手の勾配分布ヒストグラムとを統計することを含み、手首の分割線の座標は、手の勾配分布ヒストグラムにおける親指手根中手関節点を探した後の値によって決定される。
【0047】
前記幅ヒストグラムの計算手順は以下の通りである。
rows = image.shape[0]
x_label = []
width = []
step = 3
for index in range(step,rows,step):
x_label.append(index)
width.appned(sum(sum(binary[index-3:index]/255))/3)
【0048】
前記勾配ヒストグラムの算出手順は以下の通りである。
gradient = [0]
for index in range(1,len(width)):
gradient.append(width[index]-width[index-1])
【0049】
その後、手首の分割線を決定する。手の幅分布ヒストグラムにおけるジェスチャー幅の最大値およびその対応する座標を親指手根中手関節であるため、手首の分割線の座標として、手の勾配分布ヒストグラムにおける親指手根中手関節点を探した後の値によって決定され、その決定方法として、現在点の勾配が0で、次の点の勾配が0以上である。
【0050】
最後に、腕冗長性の除去を完了する。上記ステップでは、手首の分割線の座標情報が得られ、手首分割線より下の画素値を0、すなわち上部ジェスチャー画像のみを残して、腕部分を除去する。
【0051】
以下、
図3を参照して、スマートホームシーン向けのマルチジェスチャー精分割方法の具体的な実施例を提案する。当該実施例は、主に以下のステップを含む。
【0052】
ステップS301において、画像を取得する。
【0053】
主に2Dカメラによってホーム画像を取得する。
【0054】
ステップS302において、取得された画像に対して前処理を行う。
【0055】
画像に対して、フィルタ処理、モルフォロジー処理、2値化処理等を行う。
【0056】
ステップS303において、画像に対して肌色分割を行う。
【0057】
YCbCr色空間においてグローバル固定閾値法を用いて2値化処理を行い、各領域の輪郭情報を8近傍法により取得する。
【0058】
ステップS304において、非ジェスチャーエリアをフィルタリングする。
【0059】
ステップS303で切り出されたジェスチャー画像に対して非ジェスチャーエリアフィルタリングを行うことによって、まず、ジェスチャー画像のMBRを構築し、条件に適合しないエリアをフィルタリングし、条件に適合するものは、ジェスチャー分割処理を行う。
【0060】
ステップS305において、画像に対してジェスチャー分割を行う。
【0061】
ジェスチャー画像MBRを基にMABRを構築し、ジェスチャー画像の偏向角度を取得し、手の幅分布ヒストグラムと手の勾配分布ヒストグラムを解析することにより、ジェスチャーの手首分割線を取得し、腕エリアをフィルタリングする。
【0062】
ステップS306において、完全なジェスチャー画像を取得する。
【0063】
ジェスチャー分割によって、0から複数のジェスチャーが生成される。画像内のジェスチャーは、後続のニーズのために抽出され、ジェスチャーに基づく人間対コンピュータインタラクションシステムのために使用され、人間からジェスチャーを通してのホームデバイスの制御を可能にする。
【0064】
本発明によるスマートホームシーン向けのマルチジェスチャー精分割方法は、ジェスチャーをローカルでインテリジェントに分割することができ、ネットワークに依存しすぎるという従来技術の不備を克服し、本方法を適用する装置がネットワーク接続なしでも正常に動作することができる。
【0065】
本発明は、ジェスチャーピクチャーをRGB色空間からYCbCr色空間に変換し、さらにグローバル固定閾値2値化方法によって、肌色の分割を完了する。そして、非ジェスチャーエリアを除外して、ジェスチャー輪郭のMBRとMABRを構築し、ジェスチャー画像を回転させて手の幅を統計し、幅分布ヒストグラムと幅に基づく勾配分布ヒストグラムを構築し、手首の分割線を決定する。最後に、腕の冗長性の除去を完了し、完全なジェスチャー画像が得られる。本発明は、ホーム環境画像内のジェスチャーを迅速かつ正確に分割することを可能にし、ジェスチャーに基づく人間対コンピュータインタラクションシステムの使用の快適さを著しく向上させ、ユーザ満足度を向上させる。
【0066】
また、本発明は、当該分野における他の関連課題の参考になれるものであり、これに基づいて拡張を行うことができ、他のジェスチャー分割に関する技術案に応用することができ、十分に広い応用範囲を有する。
【0067】
本発明は、上述した例示的な実施例の詳細に限定されるものではなく、本発明の要旨や基本的な構成を逸脱しない範囲内において、他の具体的な形態で実施し得ることは、当業者にとって自明である。したがって、いずれの点からも、実施例は、例示的かつ非限定的であると見なされるべきであり、本発明の範囲は、上述の説明ではなく添付の特許請求の範囲によって規定される。したがって、特許請求の範囲の均等物の意味および範囲内にあるすべての変更が、本発明内に包含されることが意図され、特許請求の範囲におけるいかなる参照符号も、関連する特許請求の範囲を制限するものと見なされるべきではない。
【0068】
さらに、本明細書は実施形態に従って説明されるが、各実施形態が独立した技術的解決手段のみを含むのではない。本明細書のこのような記載方式は、明瞭さのためにすぎない。当業者は、本明細書を全体として、各実施例における技術的解決手段が、当業者が理解し得る他の実施形態を形成するように、適切に組み合わされてもよいことが理解されるべきである。
【0069】
(付記)
(付記1)
以下のステップを含むことを特徴とするスマートホームシーン向けのマルチジェスチャー精分割方法。
S1)ジェスチャー画像Image0に対して前処理を行い、画像Image1を得る;
S2)前処理後の画像Image1に対して肌色分割を行い、処理後の画像Image4を得る;
S3)画像Image4において画像の最小結合矩形MBRを構築する;
S4)画像Image4における非ジェスチャーエリアを非ジェスチャーエリア除外基準によって除外して、ジェスチャー画像Image5を取得する;
S5)手の形状特徴に基づく腕冗長性除去アルゴリズムによって画像Image5を処理することによって、腕冗長性の除去を完了する。
【0070】
(付記2)
S1における前記前処理は、少なくとも、ジェスチャー画像ノイズ除去、ジェスチャー画像2値化およびモルフォロジー処理を含むことを特徴とする付記1に記載のスマートホームシーン向けのマルチジェスチャー精分割方法。
【0071】
(付記3)
S2は、具体的に以下のステップを含むことを特徴とする付記1に記載のスマートホームシーン向けのマルチジェスチャー精分割方法。
S21)Image1画像をRGB色空間からYCbCr色空間に変換して画像Image2を得て、さらにグローバル固定閾値2値化法により画素毎に閾値と比較して2値化画像Image3を得る;
S22)2値化画像Image3の穴と隙間をモルフォロジーにおける膨張腐食演算を用いて除去し、2値化画像をメディアンフィルタを用いて処理し、画像Image4を得る。
【0072】
(付記4)
S3は、具体的に、S2で得られた2値化ジェスチャー画像の輪郭情報をリストcontoursに格納し、座標情報から外接矩形の4つの頂点の座標をそれぞれtop_left、top_right、bottom_left、bottom_rightとして得るステップを含むことを特徴とする付記1に記載のスマートホームシーン向けのマルチジェスチャー精分割方法。
【0073】
(付記5)
S4における前記非ジェスチャーエリア除外基準は、具体的に以下を含むことを特徴とする付記1に記載のスマートホームシーン向けのマルチジェスチャー精分割方法。
1)640*480の画像サイズが取得された場合、外接矩形の面積が2500未満である場合、非ジェスチャーエリアとして認定される;
2)外接矩形の幅に対する長さの比が5より大きい場合、非ジェスチャーエリアとして認定される;
3)外接矩形内の画素値255の点の数が矩形面積に対する比が0.8より大きいか、0.4より小さい場合、非ジェスチャーエリアとして認定される。
【0074】
(付記6)
S5における前記手の形状特徴に基づく腕冗長性除去アルゴリズムは、具体的に、画像Image6に対して、幅の最大値およびその対応する座標を親指手根中手関節とする手の幅分布ヒストグラムと、手の勾配分布ヒストグラムとを統計することを含み、
手首の分割線の座標は、手の勾配分布ヒストグラムにおける親指手根中手関節点を探した後の値によって決定されることを特徴とする付記1に記載のスマートホームシーン向けのマルチジェスチャー精分割方法。
【0075】
(付記7)
ステップS5における前記手首の分割線の座標は、現在点の勾配が0で、次の点の勾配が0以上であることを決定基準として、手の勾配分布ヒストグラムにおける親指手根中手関節点を探した後の値によって決定されることを特徴とする付記6に記載のスマートホームシーン向けのマルチジェスチャー精分割方法。