【文献】
辛 貞殷,三次元人体スキャンデータからの衣服製作のための特徴点抽出,電子情報通信学会論文誌 D,日本,社団法人 電子情報通信学会,2008年 4月 1日,Vol.J91-D No.4,P.1103-1114
【文献】
岩井 儀雄,動画像からの人物動作計測と認識,情報処理学会論文誌 コンピュータビジョンとイメージメディア June 2002,日本,社団法人 情報処理学会,2002年 6月15日,Vol.43 No.SIG4 (CVIM4),P.24-32
(58)【調査した分野】(Int.Cl.,DB名)
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、認識した複数の領域が重なってしまうと、それらは一つの領域として認識されてしまうという問題があった。
【0005】
本発明は、上記のような課題を解決するもので、領域の識別を簡易に行うのに好適なプログラム、画像処理方法、及び、画像処理装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の観点に係るプログラムは、
コンピュータを、
動画像に含まれる第1フレーム画像及び第2フレーム画像を取得する取得部、
前記第1フレーム画像及び前記第2フレーム画像からラベル付領域を認識する認識部、
前記ラベル付領域に含まれる画素の空間的な分布の方向及び分布のサイズを求める計算部、
前記第2フレーム画像に含まれるラベル付領域の数が、前記第1フレーム画像に含まれるラベル付領域の数より少なく、前記第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、前記第1フレーム画像に含まれるラベル付領域ついて求められた分布のサイズより大きい場合、前記第2フレーム画像に含まれるラベル付領域を、当該領域の重心位置で切断する切断部、
前記第1フレーム画像に含まれるラベル付領域の重心位置と、前記第2フレーム画像に含まれるラベル付領域の重心位置と、前記切断された領域の重心位置と、に基づいて、前記第2フレーム画像に含まれるラベル付領域を、新たなラベル付領域として前記切断された領域に分割する分割部、
として機能させることを特徴とする。
【0007】
また、上記プログラムは、
前記分割部が、前記第1フレーム画像に含まれるラベル付領域の重心位置と、前記切断された領域の重心位置との距離が、前記第1フレーム画像に含まれるラベル付領域の重心位置と、前記第2フレーム画像に含まれるラベル付領域の重心位置との距離より短い場合、前記切断された領域を、当該領域の重心位置と最も近い重心位置を有する前記第1フレーム画像に含まれるラベル付領域と同じラベルが付された新たなラベル付領域とみなす
ように機能させることを特徴とする。
【0008】
また、上記プログラムは、
前記計算部が、前記画素について主成分分析を行い、第1主成分の方向及びサイズを、それぞれ前記分布の方向及び前記分布のサイズとし、
前記切断部が、前記第2フレーム画像に含まれるラベル付領域を、当該領域の重心位置で、第2主成分に沿って切断する
ように機能させることを特徴とする。
【0009】
本発明の第2の観点に係る画像処理方法は、
動画像に含まれる第1フレーム画像及び第2フレーム画像を取得する取得工程と、
前記第1フレーム画像及び前記第2フレーム画像からラベル付領域を認識する認識工程と、
前記ラベル付領域に含まれる画素の空間的な分布の方向及び分布のサイズを求める計算工程と、
前記第2フレーム画像に含まれるラベル付領域の数が、前記第1フレーム画像に含まれるラベル付領域の数より少なく、前記第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、前記第1フレーム画像に含まれるラベル付領域ついて求められた分布のサイズより大きい場合、前記第2フレーム画像に含まれるラベル付領域を、当該領域の重心位置で切断する切断工程と、
前記第1フレーム画像に含まれるラベル付領域の重心位置と、前記第2フレーム画像に含まれるラベル付領域の重心位置と、前記切断された領域の重心位置と、に基づいて、前記第2フレーム画像に含まれるラベル付領域を、新たなラベル付領域として前記切断された領域に分割する分割工程と、
を備えることを特徴とする。
【0010】
本発明の第3の観点に係る画像処理装置は、
動画像に含まれる第1フレーム画像及び第2フレーム画像を取得する取得部と、
前記第1フレーム画像及び前記第2フレーム画像からラベル付領域を認識する認識部と、
前記ラベル付領域に含まれる画素の空間的な分布の方向及び分布のサイズを求める計算部と、
前記第2フレーム画像に含まれるラベル付領域の数が、前記第1フレーム画像に含まれるラベル付領域の数より少なく、前記第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、前記第1フレーム画像に含まれるラベル付領域ついて求められた分布のサイズより大きい場合、前記第2フレーム画像に含まれるラベル付領域を、当該領域の重心位置で切断する切断部と、
前記第1フレーム画像に含まれるラベル付領域の重心位置と、前記第2フレーム画像に含まれるラベル付領域の重心位置と、前記切断された領域の重心位置と、に基づいて、前記第2フレーム画像に含まれるラベル付領域を、新たなラベル付領域として前記切断された領域に分割する分割部と、
を備えることを特徴とする。
【0011】
本発明のプログラムは、コンパクトディスク、フレキシブルディスク、ハードディスク、光磁気ディスク、ディジタルビデオディスク、磁気テープ、半導体メモリ等のコンピュータ読取可能な情報記録媒体に記録することができる。
【0012】
上記プログラムは、プログラムが実行されるコンピュータとは独立して、コンピュータ通信網を介して配布・販売することができる。また、上記情報記録媒体は、コンピュータとは独立して配布・販売することができる。
【発明の効果】
【0013】
領域の識別を簡易に行うのに好適なプログラム、画像処理方法、及び、画像処理装置を提供することができる。
【発明を実施するための形態】
【0015】
以下に本発明の実施形態を説明する。本実施形態は説明のためのものであり、本願発明の範囲を制限するものではない。したがって、当業者であればこれらの各要素もしくは全要素をこれと均等なものに置換した実施形態を採用することが可能であるが、これらの実施形態も本発明の範囲に含まれる。
【0016】
以下、本発明のプログラムを実行することにより実現される画像処理装置100について説明する。
【0017】
(1.情報処理装置の構成)
画像処理装置100は、典型的な情報処理装置700が有する機能を備える。情報処理装置700は、
図1に示すように、CPU(Central Processing Unit)701と、ROM(Read only Memory)702と、RAM(Random Access Memory)703と、NIC(Network Interface Card)704と、画像処理部705と、音声処理部706と、DVD−ROM(Digital Versatile Disc ROM)ドライブ707と、インターフェース708と、外部メモリ709と、コントローラ710と、モニタ711と、スピーカ712と、カメラ713を備える。
【0018】
CPU 701は、情報処理装置700全体の動作を制御し、各構成要素と接続され制御信号やデータをやりとりする。
【0019】
ROM 702には、電源投入直後に実行されるIPL(Initial Program Loader)が記録され、これが実行されることにより、所定のプログラムをRAM 703に読み出してCPU 701による当該プログラムの実行が開始される。また、ROM 702には、情報処理装置700全体の動作制御に必要なオペレーティングシステムのプログラムや各種のデータが記録される。
【0020】
RAM 703は、データやプログラムを一時的に記憶するためのもので、DVD−ROMから読み出したプログラムやデータ、その他、通信に必要なデータ等が保持される。
【0021】
NIC 704は、情報処理装置700をインターネット等のコンピュータ通信網に接続するためのものであり、LAN(Local Area Network)を構成する際に用いられる10BASE−T/100BASE−T規格やEthernet(登録商標)規格等にしたがうものや、電話回線を用いてインターネットに接続するためのアナログモデム、ISDN(Integrated Services Digital Network)モデム、ADSL(Asymmetric Digital Subscriber Line)モデム、ケーブルテレビジョン回線を用いてインターネットに接続するためのケーブルモデム等と、これらとCPU 701との仲立ちを行うインターフェース(図示せず)により構成される。
【0022】
画像処理部705は、DVD−ROM等から読み出されたデータやカメラ713により撮影したデータをCPU 701や画像処理部705が備える画像演算プロセッサ(図示せず)によって加工処理した後、これを画像処理部705が備えるフレームメモリ(図示せず)に記録する。フレームメモリに記録された画像情報は、所定の同期タイミングでビデオ信号に変換され、モニタ711に出力される。これにより、各種のページ表示が可能となる。
【0023】
音声処理部706は、DVD−ROM等から読み出した音声データをアナログ音声信号に変換し、これに接続されたスピーカ712から出力させる。また、CPU 701の制御の下、情報処理装置700が行う処理の進行の中で発生させるべき音を生成し、これに対応した音声をスピーカ712から出力させる。
【0024】
DVD−ROMドライブ707に装着されるDVD−ROMには、例えば、実施形態に係るサーバ装置100を実現するためのプログラムが記憶される。CPU 701の制御によって、DVD−ROMドライブ707は、これに装着されたDVD−ROMに対する読み出し処理を行って、必要なプログラムやデータを読み出し、これらはRAM 703等に一時的に記憶される。
【0025】
インターフェース708には、外部メモリ709、コントローラ710、モニタ711、及びスピーカ712が、着脱可能に接続される。
【0026】
外部メモリ709には、ユーザの個人情報に関するデータなどが書き換え可能に記憶される。
【0027】
コントローラ710は、情報処理装置700の各種の設定時などに行われる操作入力を受け付ける。情報処理装置700のユーザは、コントローラ710を介して指示入力を行うことにより、これらのデータを適宜外部メモリ709に記録することができる。
【0028】
モニタ711は、画像処理部705により出力されたデータを情報処理装置700のユーザに提示する。
【0029】
スピーカ712は、音声処理部706により出力された音声データを情報処理装置700のユーザに提示する。
【0030】
カメラ713は、ユーザの指示に従い周辺の空間等を撮影し、撮影した映像を電気信号に変換する。カメラ713は、例えば、CMOS(Complimentary MOS)センサ等から構成される。
【0031】
この他、情報処理装置700は、ハードディスク等の大容量外部記憶装置を用いて、ROM 702、RAM 703、外部メモリ709、DVD−ROMドライブ707に装着されるDVD−ROM等と同じ機能を果たすように構成してもよい。
【0032】
以下、本願発明に係るプログラムを実行することにより実現される画像処理装置100の構成について、
図1乃至12を参照して説明する。
【0033】
(2.実施形態の画像処理装置の構成)
実施形態に係る画像処理装置100は、
図2に示すように、取得部101と、認識部102と、計算部103と、切断部104と、分割部105と、を備える。
【0034】
取得部101は、動画像に含まれる第1フレーム画像及び第2フレーム画像を取得する。
【0035】
本実施形態において、第2フレーム画像は、動画像において、第1フレーム画像の次のフレーム画像であるとする。第1フレーム画像は、例えば、
図3(a)に示す画像である。また、第2フレーム画像は、例えば、
図4(a)に示す画像である。
【0036】
図3(a)及び
図4(a)は、それぞれ、人物200が映しだされた画像であり、顔や手の部分が肌色であるとする。
図3(a)では、人物200の顔と手は離れているが、
図4(a)では、人物200の顔と片方の手が重なって映しだされている。
【0037】
なお、第2フレーム画像は、第1フレーム画像の次のフレーム画像でなくてもよい。例えば、第2フレーム画像は、第1フレーム画像の数秒後のフレーム画像でもよい。第1フレーム画像と第2フレーム画像との間隔は適宜設定することができる。
【0038】
本実施形態において、CPU 701及び画像処理部705が協働して取得部101として機能する。
【0039】
認識部102は、第1フレーム画像及び第2フレーム画像からラベル付領域を認識する。
【0040】
ラベル付領域とは、ラベリング処理によりラベルが付された画素から構成される領域である。本実施形態では、ラベル付領域は、肌色の画素から構成される領域であって、所定の大きさ以上の領域であるとする。
【0041】
以下、認識部102がラベル付領域を認識する手順の例について説明する。
【0042】
まず、認識部102は、第1フレーム画像及び第2フレーム画像について2値化処理を行う。本実施形態では、肌色の領域とその他の領域が区別できるよう、2値化処理を行う。例えば、肌色の画素は白色に設定し、肌色以外の色の画素は黒色に設定する。
【0043】
例えば、
図3(a)のフレーム画像について2値化処理を施すと、
図3(b)の画像が得られ、
図4(a)のフレーム画像について2値化処理を施すと、
図4(b)の画像が得られる。
【0044】
そして、認識部102は、2値化処理が施された画像についてラベリング処理を施す。例えば、認識部102は、
図3(b)において、白色の画素が連結している領域に同一のラベルを付す。例えば、領域201、202、203に含まれる画素は、それぞれ、同一のラベルが付される。一方、
図4(b)において、領域204、205に含まれる画素は、それぞれ、同地のラベルが付される。
【0045】
認識部102は、各領域に含まれる画素数等から領域が所定の大きさ以上であるか否かを判断する。そして、認識部102は、所定の大きさ以上であると判断された領域をラベル付領域として認識する。
【0046】
例えば、領域203、205は所定の大きさ未満であったとすると、認識部102が認識するラベル付領域は、
図3(b)では領域201、202であり、
図4(b)では領域204である。
【0047】
本実施形態において、CPU 701及び画像処理部705が協働して認識部102として機能する。
【0048】
計算部103は、ラベル付領域に含まれる画素の空間的な分布の方向及び分布のサイズを求める。
【0049】
ここで、計算部103は、画素について主成分分析を行い、第1主成分の方向及びサイズを、それぞれ分布の方向及び分布のサイズとする。
【0050】
ラベル付領域に含まれる画素に対し主成分分析を行うことで、ラベル付領域の姿勢(傾き)を主成分ベクトル、ラベル付領域の大きさを固有値として得ることができる。
【0051】
例えば、計算部103が、領域201、202に含まれる画素について主成分分析を行うと、
図3(c)に示すように、領域201について第1主成分311、第2主成分321が得られ、領域202について第1主成分312、第2主成分322が得られる。同様に、計算部103が、領域204に含まれる画素について主成分分析を行うと、
図4(c)に示すように、領域204について第1主成分314、第2主成分324が得られる。
【0052】
なお、
図3(c)の第1主成分311、312と第2主成分321、322との交点は、領域201、202の重心位置331、332、
図4(c)の第1主成分314と第2主成分324との交点は、領域204の重心位置334である。
【0053】
計算部103は、第1主成分311、312、314の方向及びサイズを求め、ラベル付領域に含まれる画素の分布の方向及び分布のサイズとする。
【0054】
なお、計算部103が分布の方向及び分布のサイズを求める手法は主成分分析を用いる手法に限らない。例えば、計算部103は、画素について独立主成分分析により、画素の空間的な分布の方向及び分布のサイズを求めてもよい。この場合、例えば、長手方向の主成分の方向及びサイズを、分布の方向及び分布のサイズとする。
【0055】
本実施形態において、CPU 701が計算部103として機能する。
【0056】
切断部104は、第2フレーム画像に含まれるラベル付領域の数が、第1フレーム画像に含まれるラベル付領域の数より少なく、第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、第1フレーム画像に含まれるラベル付領域について求められた分布のサイズより大きい場合、第2フレーム画像に含まれるラベル付領域を、当該領域の重心位置で切断する。
【0057】
以下、切断部104が行う処理について、
図5乃至
図9を用いて説明する。
【0058】
図5乃至
図9には、簡略化したラベル付領域が描画されている。領域401〜405が、それぞれラベル付領域である。
図5乃至
図9の領域401、402は、例えば、それぞれ
図3(b)の領域201、202に対応するものである。
図5乃至
図7の上段は第1フレーム画像、下段は第2フレーム画像を示す。
図8、9は、それぞれ
図5、6の第1フレーム画像と第2フレーム画像とを重ね合わせた図である。
【0059】
また、領域404は、領域401と同一の物体についてのラベル付領域であり、領域405は、領域402と同一の物体についてのラベル付領域であるとする。
【0060】
なお、第1フレーム画像及び第2フレーム画像間のラベル付領域の対応付けは、例えば、以下のように行う。
【0061】
まず、
図8に示すように、領域401、402、404、405の重心位置531、532、534、535を求める。そして、第2フレーム画像に含まれるラベル付領域について、当該ラベル付領域の重心位置から最も近い第1フレーム画像に含まれるラベル付領域の重心位置を求め、求められた重心位置を有するラベル付領域と対応付ける。
【0062】
例えば、
図8において、領域404の重心位置534から、領域401の重心位置531までの距離と領域402の重心位置532までの距離を求める。この場合、重心位置534から重心位置531までの距離の方が、重心位置534から重心位置532までの距離より短い。したがって、第2フレーム画像に含まれる領域404は、第1フレーム画像の領域401に対応付けられる。領域405についても同様の処理が行われ、第2フレーム画像に含まれる領域405は、第1フレーム画像の領域402に対応付けられる。
【0063】
なお、第1フレーム画像及び第2フレーム画像間のラベル付領域の対応付けは、上記の例に限らない。例えば、領域の縁の距離や、領域の重複の度合い等に基づいて対応付けを行ってもよい。
【0064】
領域401〜405については、計算部103により、第1主成分511〜15、第2主成分521〜525が求められているとする。
【0065】
まず、切断部104は、第1フレーム画像に含まれるラベル付画像の数と第2フレーム画像に含まれるラベル付画像の数とを比較する。
【0066】
図5の第1フレーム画像は、領域401、402を含み、それらが所定の距離だけ離れている様子を示している。一方、
図5の第2フレーム画像は、領域404、405を含み、領域404、405は、それぞれ第1フレーム画像の領域401、402の位置からx軸の負の方向に離れた位置に存在する。
【0067】
図5の第1フレーム画像及び第2フレーム画像は、それぞれ、2つのラベル付領域を含む。したがって、このような場合、切断部104は、第1フレーム画像に含まれるラベル付領域の数と、第2フレーム画像に含まれるラベル付領域の数とは同じであると判断する。
【0068】
図6の第1フレーム画像は、領域401、402を含み、それらが所定の距離だけ離れている様子を示している。一方、
図6の第2フレーム画像は、領域401,402がそれぞれx軸の正の方向に移動し、領域401と領域402が重なって新たな領域403が生成された様子を示している。
【0069】
図6の第1フレーム画像は2つのラベル付領域を含み、
図6の第2フレーム画像は、1つのラベル付領域を含む。したがって、このような場合、切断部104は、第2フレーム画像に含まれるラベル付領域の数が、第1フレーム画像に含まれるラベル付領域の数より少ないと判断する。
【0070】
図7の第1フレーム画像は、領域401、402を含み、それらが所定の距離だけ離れている様子を示している。一方、
図7の第2フレーム画像は、領域404が映し出された様子を示している。
【0071】
図7の第1フレーム画像は2つのラベル付領域を含み、
図7の第2フレーム画像は、1つのラベル付領域を含む。したがって、このような場合も、切断部104は、第2フレーム画像に含まれるラベル付領域の数が、第1フレーム画像に含まれるラベル付領域の数より少ないと判断する。
【0072】
次に、切断部104は、第2フレーム画像に含まれるラベル付領域の方が少ないと判断された、
図6、7の第1フレーム画像及び第2フレーム画像についてラベル付領域の分布のサイズを比較する。
【0073】
すなわち、
図6の第1フレーム画像に含まれる領域401、402の第1主成分511、512の大きさと、
図6の第2フレーム画像に含まれる領域403の第1主成分513との大きさとを比較する。この場合、切断部104は、第2フレーム画像に含まれるラベル付領域について求められた分布のサイズ(第1主成分513の大きさ)が、第1フレーム画像に含まれるラベル付領域について求められた分布のサイズ(第1主成分511、512の大きさ)より大きいと判断する。
【0074】
一方、
図7の第1フレーム画像に含まれる領域401、402の第1主成分511、512の大きさと、
図7の第2フレーム画像に含まれる領域401の第1主成分514との大きさとを比較する。この場合、切断部104は、第2フレーム画像に含まれるラベル付領域について求められた分布のサイズ(第1主成分514の大きさ)は、第1フレーム画像に含まれるラベル付領域について求められた分布のサイズ(第1主成分511、512の大きさ)と同じであると判断する。
【0075】
そして、切断部104は、分布のサイズが大きいと判断された、
図6の第2フレーム画像に含まれる領域403を、当該領域の重心位置で切断する。重心位置は、第1主成分513と第2主成分523の交点である。
【0076】
ここで、切断部104は、第2フレーム画像に含まれるラベル付領域を、当該領域の重心位置で、第2主成分に沿って切断する。
【0077】
すなわち、切断部104は、第1主成分513と第2主成分523の交点で第2主成分523に沿って切断する。切断した領域を、
図9の領域406、407とする。
【0078】
なお、分布のサイズの比較において、「第1フレーム画像に含まれるラベル付領域の分布のサイズ」×α<「第2フレーム画像に含まれるラベル付領域の分布のサイズ」、の関係を満たす場合に、切断部104は、第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、第1フレーム画像に含まれるラベル付領域について求められた分布のサイズより大きいと判断するようにしてもよい。ここで、係数αは、1より大きな値とする。
【0079】
例えば、
図7において、第1主成分514のサイズが、第1主成分511、512のサイズより大きいとする。この場合、第1主成分の大きさをそのまま比較すると、切断部104は、第2フレーム画像に含まれるラベル付領域の分布のサイズの方が大きいと判断し、第2フレーム画像においてラベル付領域の重複(衝突)が起こっていないのにもかかわらず、領域404を衝突が起こった領域(衝突領域)として、当該領域の重心位置で切断してしまう。そこで、係数αを1より大きな値に設定することにより、第2フレーム画像に含まれるラベル付領域の分布のサイズが、第1フレーム画像に含まれるラベル付領域の分布のサイズより、ある程度大きくなった場合に領域を切断するようにすることができる。このような関係に基づき分布のサイズを判断することにより、フレームの変化に伴う分布のサイズの変化の誤差を吸収することができ、より正確に領域の切断を行うことができる。
【0080】
本実施形態において、CPU 701及び画像処理部705が協働して切断部102として機能する。
【0081】
分割部105は、第1フレーム画像に含まれるラベル付領域の重心位置と、第2フレーム画像に含まれるラベル付領域の重心位置と、切断された領域の重心位置と、に基づいて、第2フレーム画像に含まれるラベル付領域を、新たなラベル付領域として切断された領域に分割する。
【0082】
ここで、分割部105は、第1フレーム画像に含まれるラベル付領域の重心位置と、切断された領域の重心位置との距離が、第1フレーム画像に含まれるラベル付領域の重心位置と、第2フレーム画像に含まれるラベル付領域の重心位置との距離より短い場合、切断された領域を、当該領域の重心位置と最も近い重心位置を有する第1フレーム画像に含まれるラベル付領域と同じラベルが付された新たなラベル付領域とみなす。
【0083】
図9に各領域の重心位置を示す。
図9において、領域406と領域407とを合わせた領域が領域403である。重心位置531、532、533、536、537は、それぞれ、領域401、402、403、406、407の重心位置である。
【0084】
図9において、第1フレーム画像に含まれるラベル付領域は、領域401、402、第2フレーム画像に含まれる領域は、
図6における領域403に相当する領域406、407を合わせた領域、切断された領域は、領域406及び領域407である。
【0085】
領域401の重心位置531と領域406の重心位置536との距離及び領域402の重心位置532と領域407の重心位置537との距離の和は、領域401の重心位置531と領域403の重心位置533との距離及び領域402の重心位置532と領域403の重心位置533との距離の和より短い。そして、領域406の重心位置536と最も近い重心位置を有する領域は領域401であり、領域407の重心位置537と最も近い重心位置を有する領域は領域402である。したがって、分割部105は、領域406に領域401と同じラベルを付して、新たなラベル付領域とみなし、領域407に領域402と同じラベルを付し、新たなラベル付領域とみなす。
【0086】
本実施形態において、CPU 701及び画像処理部705が協働して分割部102として機能する。
【0087】
通常、
図3(a)が第1フレーム画像であり、
図4(a)が第2フレーム画像である場合、第1フレーム画像では、
図3(d)に示すように、顔と手がそれぞれ、別の領域341、342として認識されるが、第2フレーム画像では、
図4(d)に示すように、顔と手が重なり一つの領域344として認識される。
【0088】
しかし、本実施形態によれば、
図10(d)に示すように、顔と手とが重なっても、それぞれ異なる領域345、346として認識することができる。
【0089】
(3.実施形態の画像処理装置の動作)
以下、実施形態に係る画像処理装置100が行う動作について説明する。画像処理装置100に電源が投入されると、画像処理装置100は、
図11のフローチャートに示す処理を行う。以下、各部が行う処理について説明する。
【0090】
取得部101は、動画像に含まれる第1フレーム画像及び第2フレーム画像を取得する(ステップS101)。
【0091】
例えば、取得部101は、
図3(a)を第1フレーム画像として、
図4(a)を第2フレーム画像として、取得する。
【0092】
認識部102は、第1フレーム画像及び第2フレーム画像からラベル付領域を認識する(ステップS102)。
【0093】
例えば、認識部102は、
図3(a)及び
図4(a)について、2値化処理及びラベリング処理を施す。そして、認識部102は、
図3(b)に含まれる領域201、202、203のうち、所定の大きさ以上の領域である領域201、202をラベル付領域と認識し、
図4(b)に含まれる領域204、205のうち、所定の大きさ以上の領域である領域204をラベル付領域と認識する。
【0094】
計算部103は、ラベル付領域に含まれる画素の空間的な分布の方向及び分布のサイズを求める(ステップS103)。
【0095】
例えば、計算部103は、領域201、202、204に含まれる画素について主成分分析を行う。そして、計算部103は、
図3(c)に示すように、領域201について第1主成分311、第2主成分321を求め、領域202について第1主成分312、第2主成分322を求める。同様に、計算部103は、
図4(c)に示すように、領域204について第1主成分314、第2主成分324を求める。そして、計算部103は、第1主成分311、312、314の分布の方向及びサイズを求める。
【0096】
切断部104は、第2フレーム画像に含まれるラベル付領域の数が、第1フレーム画像に含まれるラベル付領域の数より少ないか否かを判断する(ステップS104)。切断部104が、第2フレーム画像に含まれるラベル付領域の数が、第1フレーム画像に含まれるラベル付領域の数より少ないと判断した場合(ステップS104;Yes)、次に、切断部104は、第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、第1フレーム画像に含まれるラベル付領域について求められた分布のサイズより大きいか否かを判断する(ステップS105)。一方、切断部104が、第2フレーム画像に含まれるラベル付領域の数が、第1フレーム画像に含まれるラベル付領域の数以上であると判断した場合(ステップS104;No)、処理は終了する。
【0097】
例えば、
図3(a)及び
図4(a)が第1フレーム画像及び第2フレーム画像である場合、第1フレーム画像に含まれるラベル付領域は領域201、202であり、第2フレーム画像に含まれるラベル付領域は領域204である。したがって、切断部104は、第2フレーム画像に含まれるラベル付領域の数が、第1フレーム画像に含まれるラベル付領域の数より少ないと判断する。
【0098】
ステップS105において、切断部104が、第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、第1フレーム画像に含まれるラベル付領域について求められた分布のサイズより大きいと判断すると(ステップS105;Yes)、切断部104は、第2フレーム画像に含まれるラベル付領域を、当該領域の重心位置で切断する(ステップS106)。一方、切断部104は、第2フレーム画像に含まれるラベル付領域について求められた分布のサイズが、第1フレーム画像に含まれるラベル付領域について求められた分布のサイズ以下であると判断すると(ステップS105;No)、処理は終了する。
【0099】
例えば、切断部104は、領域204について求められた第1主成分314(
図4(c))は、領域201、202について求められた第1主成分311、312(
図3(c))より大きいと判断し、領域204を、当該領域の重心位置で、第2主成分324に沿って分割する。
【0100】
次に、分割部105は、第1フレーム画像に含まれるラベル付領域の重心位置と、切断された領域の重心位置との距離が、第1フレーム画像に含まれるラベル付領域の重心位置と、第2フレーム画像に含まれるラベル付領域の重心位置との距離より短いか否かを判断する(ステップS107)。分割部105が、第1フレーム画像に含まれるラベル付領域の重心位置と、切断された領域の重心位置との距離が、第1フレーム画像に含まれるラベル付領域の重心位置と、第2フレーム画像に含まれるラベル付領域の重心位置との距離より短いと判断すると(ステップS107;Yes)、分割部105は、第2フレーム画像に含まれるラベル付領域を、新たなラベル付領域として切断された領域に分割する(ステップS108)。一方、分割部105が、第1フレーム画像に含まれるラベル付領域の重心位置と、切断された領域の重心位置との距離が、第1フレーム画像に含まれるラベル付領域の重心位置と、第2フレーム画像に含まれるラベル付領域の重心位置との距離以上であると判断すると(ステップS107;No)、処理は終了する。
【0101】
例えば、領域204が切断された領域の第1主成分、第2主成分、及び重心位置を、それぞれ、
図10(c)の第1主成分315、316、第2主成分325、326、重心位置335、336とする。そして、分割部105は、重心位置331と重心位置335との距離、及び重心位置332と重心位置336との距離の和は、重心位置331と重心位置334との距離、及び重心位置332と重心位置334との距離の和より短いと判断したとする。この場合、分割部105は、領域204を重心位置334で切断した領域を新たなラベル付領域とする。
【0102】
そして、
図4(d)の領域344は、2つの異なる領域345、346として認識される。これにより、顔と手が重なってもそれぞれを異なる領域として判別することができる。
【0103】
本実施形態によれば、異なる領域として認識された領域が、その後、重複(衝突)してしまった場合でも、それぞれの領域を異なる領域として認識することができる。
【0104】
また、本実施形態によれば、一般的に物体の姿勢推定に用いられる主成分分析の結果を利用することにより、計算の負担を抑えながら、簡易に重複領域の分離を行うことができる。例えば、映像に含まれる手の部分を抽出し、手の上にCG(Computer Graphics)を合成する場合、手が顔や他の物体と重なると、CGが不適切な位置に表示されてしまう。しかしながら、本実施形態に係る発明を用いることにより、手が他の物体と重なっても、適切な位置にCGを表示することができる。
【0105】
なお、ステップ104において、ラベル付領域の数の判断において、所定の条件を設けてもよい。例えば、
図4(a)のように、それまで別のラベル付領域と認識されていた顔と手が、1つのラベル付領域と認識される場合であっても、他の人物の手が映り込む等により当該手の領域がラベル付領域と認識されると、ラベル付領域の数は同じであると判断される。そこで、例えば、第2フレーム画像のラベル付領域の重心位置が、第1フレーム画像に含まれるラベル付領域の重心位置から所定の距離以上離れている場合、ステップS104の判断において、そのようなラベル付領域をカウントしないようにしてもよい。このように構成することにより、より正確に物体の重複(衝突)を検出できる。
【0106】
また、実施形態に係る画像処理装置100は、
図12のフローチャートに示す処理を行ってもよい。以下、処理について説明する。
【0107】
画像処理装置100は、カメラ713により周辺の空間を撮影する(ステップS201)。
【0108】
例えば、画像処理装置100は、
図4(a)のフレーム画像を現在撮影したとする。
【0109】
画像処理部100は、現在撮影したフレーム画像を第2フレーム画像として選択し、現在撮影したフレーム画像の直前のフレーム画像を第1フレーム画像として選択する(ステップS202)。
【0110】
例えば、
図4(a)のフレーム画像の直前のフレーム画像を
図3(a)のフレーム画像とする。この場合、画像処理装置100は、
図3(a)のフレーム画像を第1フレーム画像、
図4(a)のフレーム画像を第2フレーム画像として選択する。
【0111】
次に、画像処理装置100は、選択された第1フレーム画像及び第2フレーム画像に対して
図11に示す処理を行う(ステップS203、
図11)。
【0112】
例えば、
図3(a)のフレーム画像を第1フレーム画像、
図4(a)のフレーム画像を第2フレーム画像として、
図11に示す処理を行い、第2フレーム画像の
図4(a)について、
図10(d)に示すように顔と手を異なる領域として認識した処理結果を得る。
【0113】
図11に示す処理の結果、第2フレーム画像について、分割されたラベル付領域が求められ、又は、分割されないラベル付領域が求められると、画像処理装置100は、求められたラベル付領域について所定の画像認識を行う(ステップS204)。
【0114】
例えば、これまで求められたラベル付領域の時系列データにより、各領域の軌跡を求め、当該領域に対応付けられた物体の動きを追跡する。
【0115】
そして、ステップS201に戻り、ステップS201以降の処理を繰り返す。このように処理を進めることにより、撮影しながら、リアルタイムで所定の領域の追跡を行うことができる。例えば、手を振るような動作を認識する場合、動作の途中で顔と手が重なってしまっても、手の動作を正確に追跡することができる。
【0116】
なお、本実施形態において、ラベル付領域が2個から1個へ減少した場合を例に説明したが、これに限らない。例えば、認識されたラベル付領域がn個(nは3以上)の場合であっても、重心間距離や領域の縁の距離などに基づいて、各ラベル付領域の対応付けを行い、
図11に示す処理を施して領域の分離を行うことができる。