(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6516646
(24)【登録日】2019年4月26日
(45)【発行日】2019年5月22日
(54)【発明の名称】複数のカメラで撮影した画像から個々の被写体を識別する識別装置、識別方法及びプログラム
(51)【国際特許分類】
G06T 7/00 20170101AFI20190513BHJP
G06T 7/60 20170101ALI20190513BHJP
G06T 1/00 20060101ALI20190513BHJP
H04N 5/232 20060101ALI20190513BHJP
【FI】
G06T7/00 C
G06T7/60 110
G06T7/60 180D
G06T1/00 280
H04N5/232 290
H04N5/232 960
【請求項の数】8
【全頁数】9
(21)【出願番号】特願2015-194344(P2015-194344)
(22)【出願日】2015年9月30日
(65)【公開番号】特開2017-68650(P2017-68650A)
(43)【公開日】2017年4月6日
【審査請求日】2018年2月13日
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】100092772
【弁理士】
【氏名又は名称】阪本 清孝
(74)【代理人】
【識別番号】100119688
【弁理士】
【氏名又は名称】田邉 壽二
(72)【発明者】
【氏名】野中 敬介
【審査官】
新井 則和
(56)【参考文献】
【文献】
特開2010−187130(JP,A)
【文献】
特開2010−039580(JP,A)
【文献】
国際公開第2013/005815(WO,A1)
【文献】
Saad M. Khan, Mubarak Shah,Tracking Multiple Occluding People by Localizing on Multiple Scene Planes,IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE,IEEE,2009年 3月,VOL. 31, NO. 3,pp. 505-519,https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=4497204
(58)【調査した分野】(Int.Cl.,DB名)
G06T 1/00
G06T 7/00−7/90
H04N 5/232
(57)【特許請求の範囲】
【請求項1】
複数のカメラで撮影した複数の被写体を含む画像から個々の被写体を識別する識別装置であって、
各カメラで撮影した画像の前景領域を抽出する抽出手段と、
各カメラそれぞれについて、カメラで撮影した画像の前景領域を、当該カメラの内部パラメータ及び外部パラメータに基づき所定平面上に投影し、前景領域に対応する前記所定平面上の投影領域を求める投影手段と、
各カメラで撮影した画像の前景領域に対応する投影領域のそれぞれに識別子を付与する付与手段と、
前記所定平面上における前記投影領域の重なり数をカウントし、前記重なり数が閾値以上である前記所定平面上の領域を、被写体と前記所定平面との接触領域と判定する判定手段と、
接触領域のそれぞれについて、当該接触領域の元となった投影領域の識別子の組み合わせを判定し、当該組み合わせの同じ接触領域を同じ被写体と識別し、当該組み合わせの異なる接触領域を異なる被写体と識別する識別手段と、
を備えていることを特徴とする複数のカメラで撮影した画像から個々の被写体を識別する識別装置。
【請求項2】
前記所定平面は地面又は床面であることを特徴とする請求項1に記載の複数のカメラで撮影した画像から個々の被写体を識別する識別装置。
【請求項3】
前記識別子の組み合わせの数に基づき被写体の数を判定し、前記被写体の数が所定値より小さいと、前記抽出手段が抽出した前景領域を所定画素数だけ拡大し、前記投影手段、前記付与手段、前記判定手段及び前記識別手段に、前記拡大後の前景領域に基づき再度処理を行わせる誤差修正手段をさらに備えていることを特徴とする請求項1又は2に記載の複数のカメラで撮影した画像から個々の被写体を識別する識別装置。
【請求項4】
前記所定画素数は1画素であることを特徴とする請求項3に記載の複数のカメラで撮影した画像から個々の被写体を識別する識別装置。
【請求項5】
前記識別子の組み合わせの数に基づき被写体の数を判定し、前記被写体の数が所定値より大きいと、接触領域の元となった各投影領域に対応する各前景領域のサイズを求め、前記サイズの最小値が、前記最小値以外の値に基づく値より小さいと、当該接触領域は被写体ではないと判定する誤差修正手段をさらに備えていることを特徴とする請求項1又は2に記載の複数のカメラで撮影した画像から個々の被写体を識別する識別装置。
【請求項6】
前記最小値以外の値に基づく値は、前記サイズの中央値又は最大値に所定の係数を乗じた値であることを特徴とする請求項5に記載の複数のカメラで撮影した画像から個々の被写体を識別する識別装置。
【請求項7】
複数のカメラで撮影した複数の被写体を含む画像から個々の被写体を識別する識別装置における識別方法であって、
各カメラで撮影した画像の前景領域を抽出する抽出ステップと、
各カメラそれぞれについて、カメラで撮影した画像の前景領域を、当該カメラの内部パラメータ及び外部パラメータに基づき所定平面上に投影し、前景領域に対応する前記所定平面上の投影領域を求める投影ステップと、
各カメラで撮影した画像の前景領域に対応する投影領域のそれぞれに識別子を付与する付与ステップと、
前記所定平面上における前記投影領域の重なり数をカウントし、前記重なり数が閾値以上である前記所定平面上の領域を、被写体と前記所定平面との接触領域と判定する判定ステップと、
接触領域のそれぞれについて、当該接触領域の元となった投影領域の識別子の組み合わせを判定し、当該組み合わせの同じ接触領域を同じ被写体と識別し、当該組み合わせの異なる接触領域を異なる被写体と識別する識別ステップと、
を含むことを特徴とする複数のカメラで撮影した画像から個々の被写体を識別する識別方法。
【請求項8】
請求項1から6のいずれか1項に記載の識別装置としてコンピュータを機能させることを特徴とする複数のカメラで撮影した画像から個々の被写体を識別するプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数の被写体を複数のカメラで撮影した各画像から個々の被写体を識別する識別技術に関する。
【背景技術】
【0002】
例えば、スポーツの競技場の周囲に複数のカメラを設置し、各カメラが撮影する動画データに基づき、ユーザが指定する任意の視点における静止画又は動画を再現する自由視点映像システムを構築することが行われている。自由視点映像システムにおいては、複数のカメラで撮影した動画から個々の被写体を識別・追跡し、当該被写体の3次元空間位置を推定することで、疑似的な3次元空間を再現している。
【0003】
ここで、スポーツ映像の様に、被写体である選手が移動する場合、あるカメラが撮影する画像上では、被写体の移動により被写体に重なり(以下、オクルージョンと呼ぶ。)が生じる。オクルージョンが生じたとしても個々の被写体を識別するため、非特許文献1は、あるカメラで撮影した画像においてオクルージョンが生じると、他のカメラが撮影した画像を補完的に利用して被写体を識別し、各被写体の3次元空間位置を求める構成を開示している。
【先行技術文献】
【非特許文献】
【0004】
【非特許文献1】三功 浩嗣、内藤 整、"選手領域の抽出と追跡によるサッカーの自由視点映像生成"、映像情報メディア学会,Vol.68,No.3,pp.J125−J134,2014年
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、非特許文献1の構成は、あるカメラの画像において被写体の識別を精度良く行うことができない状態が生じた場合に、被写体の識別を精度よく行えている他のカメラの画像を補完的に使用するものである。したがって、バスケットボールやフットサルの様に人物の密集度が高く、多くのカメラの画像において同時にオクルージョンが生じる場合には適用できない。
【0006】
本発明は、オクルージョンの発生頻度に拘らず、複数のカメラで撮影した画像から個々の被写体を精度よく識別する識別装置、識別方法及びプログラムを提供するものである。
【課題を解決するための手段】
【0007】
本発明の一側面によると、複数のカメラで撮影した複数の被写体を含む画像から個々の被写体を識別する識別装置は、各カメラで撮影した画像の前景領域を抽出する抽出手段と、各カメラそれぞれについて、カメラで撮影した画像の前景領域を、当該カメラの内部パラメータ及び外部パラメータに基づき所定平面上に投影し、前景領域に対応する前記所定平面上の投影領域を求める投影手段と、各カメラで撮影した画像の前景領域に対応する投影領域のそれぞれに識別子を付与する付与手段と、前記所定平面上における前記投影領域の重なり数をカウントし、前記重なり数が閾値以上である前記所定平面上の領域を、被写体と前記所定平面との接触領域と判定する判定手段と、接触領域のそれぞれについて、当該接触領域の元となった投影領域の識別子の組み合わせを判定し、当該組み合わせの同じ接触領域を同じ被写体と識別し、当該組み合わせの異なる接触領域を異なる被写体と識別する識別手段と、を備えていることを特徴とする。
【0008】
本発明の一側面によると、複数のカメラで撮影した複数の被写体を含む画像から個々の被写体を識別する識別装置における識別方法は、各カメラで撮影した画像の前景領域を抽出する抽出ステップと、各カメラそれぞれについて、カメラで撮影した画像の前景領域を、当該カメラの内部パラメータ及び外部パラメータに基づき所定平面上に投影し、前景領域に対応する前記所定平面上の投影領域を求める投影ステップと、各カメラで撮影した画像の前景領域に対応する投影領域のそれぞれに識別子を付与する付与ステップと、前記所定平面上における前記投影領域の重なり数をカウントし、前記重なり数が閾値以上である前記所定平面上の領域を、被写体と前記所定平面との接触領域と判定する判定ステップと、接触領域のそれぞれについて、当該接触領域の元となった投影領域の識別子の組み合わせを判定し、当該組み合わせの同じ接触領域を同じ被写体と識別し、当該組み合わせの異なる接触領域を異なる被写体と識別する識別ステップと、を含むことを特徴とする。
【発明の効果】
【0009】
本発明によると、オクルージョンの発生頻度に拘らず、複数のカメラで撮影した画像から個々の被写体を精度よく識別することができる。
【図面の簡単な説明】
【0010】
【
図2】一実施形態による識別装置の処理を説明するための画像を示す図。
【
図6】各接触領域に対応する被写体の異同の判定方法の説明図。
【発明を実施するための形態】
【0011】
以下、本発明の例示的な実施形態について図面を参照して説明する。なお、以下の実施形態は例示であり、本発明を実施形態の内容に限定するものではない。また、以下の各図においては、実施形態の説明に必要ではない構成要素については図から省略する。
【0012】
図1は、本実施形態による識別装置の構成図である。識別装置は、複数のカメラ1−1〜1−3が撮影する動画に基づき被写体である人物と、その3次元空間位置を識別する。なお、
図1においては図の簡略化のため、カメラ1−1〜1−3の3つのみを表示しているが、カメラの設置台数は3つに限定されない。また、以下の説明においてカメラ1−1〜カメラ1−3を区別する必要がない場合には纏めてカメラ1として記述する。他の構成要素についても同様とする。カメラ1は、固定的に設置される。なお、設置される総てのカメラ1に対しては、事前にキャリブレーションを行っておき、各カメラ1の内部パラメータ及び外部パラメータは既知であるものとする。
【0013】
前景抽出部2は、背景差分法を用いて画像内の背景と前景を分類し、各画素が前景に対応するか背景に対応するかを示す2値画像を出力する。具体的には、前景抽出部2は、対応するカメラ1の撮影範囲の背景画像を示す画像データを保持している。そして、前景抽出部2は、対応するカメラ1からの動画データが示す各フレームの画像と、背景画像との差分により前景領域を抽出する。例えば、カメラ1−1が撮影した動画のある瞬間のフレームが
図2に示すものであったとする。
図3は、前景抽出部2−1が抽出した前景領域を黒色で示したものである。なお、図の簡略化のため、
図3においては、
図2の白枠で囲った部分のみを示している。ラベリング処理部3は、対応する前景抽出部2が抽出した2値画像の前景を示す画素が連続している領域を1つの前景領域とし、各前景領域に識別子(ラベル)を付与する。例えば、
図3の前景領域は、
図2に示す様に、3人の人物が重なった状態であるが、前景を示す画素(黒を示す画素)は連続しているため1つの前景領域と判定され、この1つの前景領域に対して識別子が付与される。
【0014】
識別部4は、各カメラ1の内部パラメータ及び外部パラメータに基づき、各前景抽出部2が出力する2値画像の前景領域をフィールド平面に投影する。以下では、1つのカメラ1が撮影した1つの前景領域をフィールド平面に投影してできる、フィールド平面上の領域を投影領域と呼ぶものとする。なお、フィールド平面とは地面又は床面等を意味する。
図4は、識別部4での処理の説明図であり、各前景抽出部2が出力する、
図2の白枠内の3人の人物に対応する前景領域の投影領域を、カメラ1−1の視点から表示している。なお、参考のため、
図4には
図3と同じ前景領域も表示している。各カメラ1はその設置位置が異なるため、各カメラ1が撮影した画像から得られる投影領域は、同じ人物を含む前景領域に対応するものであってもそれぞれ異なるものとなる。つまり、カメラ1毎に異なる投影領域が得られる。
【0015】
そして、識別部4は、フィールド平面上の各画素(位置)において投影領域の重なり数をカウントする。例えば、フィールド平面上において、カメラ1−1からカメラ1−3の総ての投影領域が重なっている画素のカウント値を3とし、カメラ1−1からカメラ1−3の内の2つのカメラ1の投影領域が重なっている画素のカウント値を2とし、1つのカメラ1のみの投影領域の画素のカウント値を1とし、投影領域が存在しない画素のカウント値を"0"とする。そして、識別部4は、カウント値が閾値以上の画素の画素値を"1"とし、カウント値が閾値未満の画素を0とした2値画像(以下、接触位置画像と呼ぶ)を生成する。
図5は、閾値処理して得られた接触位置画像を、カメラ1−1の視点から見たものである。なお、
図5において黒色部分の画素は、カウント値が閾値以上であった画素である。複数のカメラ1による投影領域は、人物がフィールド平面に接触している位置において重なりを持つ。したがって、
図5に示す様に閾値処理して得られた結果は、人物とフィールド平面とが接触している領域を示すことになる。なお、以下では、接触位置画像において画素値"1"が連続する領域を接触領域と呼ぶものとする。
図5の例においては、4つの接触領域61〜64が得られている。
【0016】
また、識別部4は、前景領域の識別子を、当該前景領域に対応する投影領域の識別子とし、各接触領域の元となった投影領域の識別子の組み合わせを判定することで、各接触領域が同一の被写体に対応するか、異なる被写体に対応するかを判定する。例えば、
図3は、カメラ1−1が撮影した画像に基づく2値画像であり、この場合、3人の人物は1つの前景領域として抽出され、よって、1つの識別子のみが付与されている。しかしながら、カメラ1−2及びカメラ1−3が撮影した画像に基づく2値画像では、当該3人の人物は、例えば、2つの異なる前景領域(つまり、2人の人物に重なりが生じているが、1人の人物は他の2人とは重なっていない)として検出されている場合や、3つの異なる前景領域(つまり、3人には全く重なりが生じていない)と検出されていることがあり得る。
図6は、
図2の白枠内の3人の人物A、B、Cと、カメラ1−1〜1−3で検出した前景領域との対応関係の一例を示している。
図6においては、カメラ1−1からは3人の人物が重なって1つの前景領域として検出され、よって、この1つの前景領域には1つの識別子#1のみが付与されている。一方、カメラ1−2では、人物Aと人物Bが重なって1つの前景領域として検出されているが、人物Cは1つの前景領域として検出され、よって、人物A及び人物Bに対応する前景領域と、人物Cに対応する前景領域それぞれに識別子が付与されている。さらに、カメラ1−3では、人物Bと人物Cが重なって1つの前景領域として検出されているが、人物Aは1つの前景領域として検出され、よって、人物B及び人物Cに対応する前景領域と、人物Aに対応する前景領域それぞれに識別子が付与されている。
【0017】
識別部4は、例えば、閾値処理して得られた各接触領域の各画素を、識別子の組み合わせ毎にグループ化する。例えば、
図6の例では、識別子#1、#2及び#4のグループと、識別子#1、#2及び#5のグループと、識別子#1、#3及び#5のグループとの3つのグループが存在する。そして、識別部4は、同じ識別子の組み合わせの画素で構成される接触領域が1人の人物に対応していると判定し、識別子の組み合わせが異なると、異なる人物に対応していると判定する。そして、接触領域のフィールド平面上の位置を、対応する人物の位置とする。
図6に示す様に、各カメラ1−1〜1−3の総てにおいてオクルージョンが生じたとしても、3人の人物を識別できることが分かる。例えば、
図5においては、接触領域62及び接触領域63の識別子の組み合わせは同じであり、接触領域61と、接触領域62と、接触領域64の識別子の組み合わせは異なる。したがって、識別部4は、3人の人物を識別することができる。
【0018】
識別部4は、この3人の人物のフィールド平面上の位置を、各人物の3次元空間位置と判定する。なお、同じ人物に対応する接触領域内の何れの位置を当該人物の3次元空間位置とするかは任意である。さらに、識別部4は、フレーム毎に以上の処理を行うことで各人物を特定してフィールド平面上の人物位置の追跡を行う。なお、フレーム間での人物の異同はフレーム間におけるフィールド平面上の位置の差に基づき判定する。
【0019】
なお、各ラベリング処理部3が前景領域の識別子を独立して付与する場合、識別部4は、各ラベリング処理部3に対応するカメラの識別子と、前景領域の識別子の組み合わせで各前景領域を特定する。例えば、各ラベリング処理部3が、数字の#1から順に前景領域に識別子を付与する場合、カメラ1−1で撮影した画像からの前景領域の識別子#1を、識別部4は、識別子(1−1,#1)と判定し、カメラ1−2で撮影した画像からの前景領域の識別子#2を、識別部4は、識別子(1−2,#1)と判定する。また、各ラベリング処理部3が、他のラベリング処理部3とは重複しない識別子を各前景領域に付与するように構成しておくこともできる。
【0020】
以上、本実施形態によると、複数のカメラ1で同時にオクルージョンが生じたとしても、個々の人物を識別することができる。非特許文献1に記載の方法では、あるカメラにおいてオクルージョンが発生した場合、他のカメラでは正確に検出できているものとして処理を行う。したがって、他のカメラにオクルージョンが生じていると精度良く人物の識別を行うことができない。或いは、正確に検出できているカメラを特定する処理を行う必要がある。本実施形態では、複数のカメラにおいてオクルージョンが生じていたとしても精度良く個々の人物を識別でき、かつ、正確に検出できているカメラを特定する必要もない。
【0021】
続いて、誤差修正部5での処理について説明する。例えば、スポーツ映像等の場合には被写体である選手の数は既知であり、この数をMとする。例えば、識別部4で識別された被写体の数m、つまり、接触領域の識別子の組み合わせの数mがMであると、識別部4では精度よく被写体を識別できていることになる。一方、識別部4で識別された被写体の数mがMより大きい場合や小さい場合には、識別部4では精度よく被写体を識別できていないことになる。
【0022】
誤差修正部5は、m<Mであると、各前景抽出部2が抽出した前景領域を1画素ずつ広げることを識別部4に通知する。つまり、前景領域と背景領域の境界に隣接する背景領域側の画素を前景領域に変換させる。そして、拡大した前景領域に基づき、再度、識別部4に被写体の識別を行わせる。以上の処理を、m=Mとなるまで繰り返す。拡大した前景領域により投影領域を求めることで、投影領域の重なりが増加し、よって、判定される被写体数が増加する。なお、被写体数が実際より少なく判定されるのは、背景差分法による前景領域の抽出において、被写体とフィールド平面の接触部分、つまり、足部分が欠損又は細くなることが主な原因であり、前景領域を拡大することで、識別精度を改良することができる。
【0023】
また、誤差修正部5は、m>Mであると、各接触領域について、接触領域の元となった各カメラ1の前景領域の大きさ(領域内の画素数)を判定する。そして、その最小値と、中央値又は最大値とを比較する。例えば、最小値をS
MINとし、中央値をS
MEDとし、所定の係数をτとすると、
S
MIN≦S
MED×τ
であるか否かを判定する。そして、S
MINがS
MED×τ以下であると、当該接触領域は前景領域として判定されたノイズによるものと判定して、当該接触領域は人物のものではないと判定する。なお、最小値と比較する値の元となる値は、最小値以外の値であれば良く、中央値や最大値に限定されない。被写体の数が実際の数より多くなるのは、一般的に、背景差分法により抽出した前景領域のノイズが原因である。例えば、
図7の参照符号71は、前景領域のノイズを示している。したがって、接触領域の元となった前景領域のサイズを各カメラ1について求め、この最小値が、その他の値、例えば、中央値や最大値よりかなり小さい場合には、ノイズによる誤検出と判定することができる。なお、τは、例えば、0.05といった、1よりかなり小さい値、例えば、0.1以下の値とする。以上の処理を、被写体の数がMとなるまで繰り返す。
【0024】
なお、本発明による識別装置は、コンピュータを上記識別装置として動作させるプログラムにより実現することができる。これらコンピュータプログラムは、コンピュータが読み取り可能な記憶媒体に記憶されて、又は、ネットワーク経由で配布が可能なものである。
【符号の説明】
【0025】
2:前景抽出部、3:ラベリング処理部、4:識別部