(58)【調査した分野】(Int.Cl.,DB名)
予め用意された複数の背景画像から背景画像を選択し、前記背景画像中の領域を抽出し、抽出した領域に該当する画像を、所定サイズの画像に拡大または縮小する背景抽出手段と、
複数の人物に関係する人物の状態の指示情報である複数人物状態制御指示と、前記複数の人物中の個別の人物の状態の指示情報である個別人物状態制御指示とに従って、群衆の人物状態を決定する人物状態決定手段と、
背景抽出手段によって得られた所定サイズの画像に対して、人物状態決定手段が決定した人物状態に該当する人物の画像を合成した画像である群衆状態画像を生成し、当該群衆状態画像に対する教師ラベルを特定し、群衆状態画像および教師ラベルの組を出力する群衆状態画像合成手段とを備える
ことを特徴とする教師データ生成装置。
群衆状態制御指示記憶手段は、人物の配置、人物の方向、および人数に関する項目毎に、複数人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する複数人物状態制御指示を、具体的な状態を指示する第1の態様、任意の状態に定めてよい旨を指示する第2の態様、定められたルールの範囲内で状態を定めてよいことを指示する第3の態様のいずれかの態様で記憶し、
人物状態制御指示記憶手段は、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆状態画像に合成するときの人物サイズに関する項目毎に、個別人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する個別人物状態制御指示を、前記第1の態様、前記第2の態様、前記第3の態様のいずれかの態様で記憶し、
人物状態決定手段は、群衆状態制御指示記憶手段に記憶された複数人物状態制御指示および人物状態制御指示記憶手段に記憶された個別人物状態制御指示に従って、群衆の人物状態を決定する
請求項3または請求項4に記載の教師データ生成装置。
群衆状態画像合成手段は、人物の状態として決定された、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型に合致する人物画像を、予め用意された人物画像群の中から選択し、選択した人物画像の中から、人物の領域を切り出すことによって、人物部分のみの画像を生成し、人物の状態として決定された人物の配置、および群衆状態画像に合成するときの人物サイズに合わせて、前記人物部分のみを画像を、背景抽出手段によって得られた所定サイズの画像に対して合成する
請求項1から請求項5のうちのいずれか1項に記載の教師データ生成装置。
第1の条件は、人物の基準部位が群衆状態画像に納まらない状態であること、あるいは、所定サイズに対して定められた人物の基準部位のサイズに対して、基準部位のサイズが極端に大きいか、または、極端に小さい状態であることのいずれかに該当することであり、
第2の条件は、人物の基準部位が群衆状態画像に納まり、かつ、前記基準部位のサイズが、所定サイズに対して定められた人物の基準部位のサイズと同程度であることである
請求項8に記載の教師データ生成装置。
群衆状態認識辞書記憶手段は、所望の状態に制御された人物の状態に合致する人物の画像を合成することによって得られた群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆の状態を認識する
請求項10に記載の群衆状態認識装置。
矩形領域群記憶手段は、画像を取得する画像取得装置の位置、姿勢、焦点距離、レンズ歪みを示すカメラパラメータと、所定サイズに対して定められた人物の基準部位のサイズとに基づいて、サイズが定められた矩形領域群を記憶し、
群衆状態認識手段は、与えられた画像から、前記矩形領域群が示す領域をそれぞれ抽出する
請求項10または請求項11に記載の群衆状態認識装置。
群衆状態認識辞書記憶手段は、群衆状態画像に表される人物の人数を変えて、人数毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆の人数を認識する
請求項10から請求項12のうちのいずれか1項に記載の群衆状態認識装置。
群衆状態認識辞書記憶手段は、群衆状態画像に表される人物の方向を変えて、人物の方向毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆の方向を認識する
請求項10から請求項13のうちのいずれか1項に記載の群衆状態認識装置。
群衆状態認識辞書記憶手段は、極端に混雑していない群衆と、極端に混雑した群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆が極端に混雑しているか否かを認識する
請求項10から請求項14のうちのいずれか1項に記載の群衆状態認識装置。
群衆状態認識辞書記憶手段は、人物の方向が統一されている群衆と、人物の方向が統一されていない群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆内で人物の方向が統一されているか否かを認識する
請求項10から請求項15のうちのいずれか1項に記載の群衆状態認識装置。
予め用意された複数の背景画像から背景画像を選択し、前記背景画像中の領域を抽出し、抽出した領域に該当する画像を、所定サイズの画像に拡大または縮小する背景抽出ステップと、
複数の人物に関係する人物の状態の指示情報である複数人物状態制御指示と、前記複数の人物中の個別の人物の状態の指示情報である個別人物状態制御指示とに従って、群衆の人物状態を決定する人物状態決定ステップと、
背景抽出ステップで得られた所定サイズの画像に対して、人物状態決定ステップで決定した人物状態に該当する人物の画像を合成した画像である群衆状態画像を生成し、当該群衆状態画像に対する教師ラベルを特定し、群衆状態画像および教師ラベルの組を出力する群衆状態画像合成ステップとを含む
ことを特徴とする教師データ生成方法。
画像上の群衆状態の認識対象箇所を示す矩形領域群を記憶する矩形領域群記憶手段と、群衆状態を表した所定サイズの画像であって、前記所定サイズに対して定められた人物の基準部位のサイズと同程度のサイズで基準部位が表されている人物を含む画像である群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段とを備えたコンピュータに、
与えられた画像から、矩形領域群記憶手段に記憶される矩形領域群が示す領域をそれぞれ抽出し、前記辞書に基づいて、抽出した画像に写っている群衆の状態を認識する群衆状態認識処理を実行させる
ための群衆状態認識プログラム。
【発明を実施するための形態】
【0021】
以下、本発明の実施形態を図面を参照して説明する。
【0022】
図1は、本発明の教師データ生成装置の構成例を示すブロック図である。本発明の教師データ生成装置10は、画像内の群衆状態を機械学習するための教師データを生成する。具体的には、教師データ生成装置10は、群衆状態の局所画像と、その局所画像に対応する教師ラベルの組を複数作成する。ここで、「局所」とは、群衆状態の認識対象となる画像(後述の画像取得装置3(
図7参照)が取得する画像)の領域よりも小さな領域であることを意味する。そして、群衆状態の局所画像とは、そのような領域内に、群衆を構成する人物の部位であって、基準となる部位(以下、基準部位と記す。)の集合を表している画像である。本実施形態では、基準部位として、頭部を用いる場合を例にして説明するが、頭部以外を基準部位としてもよい。また、群衆状態の局所画像を、群衆パッチと記す。群衆パッチには、基準部位(本例では頭部)以外の人物の部位が表されていてもよい。
【0023】
教師データ生成装置10は、プログラム制御によって動作するデータ処理装置1と、情報を記憶する記憶装置2とを備える。
【0024】
記憶装置2は、背景画像記憶手段21と、学習用局所画像情報記憶手段22と、群衆状態制御指示記憶手段23と、人物状態制御指示記憶手段24と、人物画像記憶手段25と、人物領域画像記憶手段26とを備える。
【0025】
背景画像記憶手段21は、群衆パッチで背景として用いられる複数の背景画像(背景画像群)を記憶する。この背景画像には、人物は含まれていない。群衆状態の認識対象となる画像を撮影する現地の画像を背景画像として用いてもよい。また、CG(Computer Graphics )等を用いて生成した背景画像を用いてもよい。
【0026】
学習用局所画像情報記憶手段22は、群衆パッチ(機械学習に用いられる群衆状態の局所画像)のサイズと、その群衆パッチに対する、人物の基準部位のサイズを記憶する。例えば、群衆パッチのサイズが、縦hピクセル、横wピクセルと決められているとする。そして、群衆パッチに写る群衆を構成する人物の基準部位(本例では頭部)の縦サイズが群衆パッチの縦サイズの1/α倍、すなわち、h/αピクセルであると定められているとする。この場合、縦hピクセル、横wピクセルを群衆パッチのサイズとして学習用局所画像情報記憶手段22に記憶させておく。また、縦h/αピクセルを、人物の基準部位のサイズとして学習用局所画像情報記憶手段22に記憶させておく。ここでは、基準部位のサイズとして縦サイズを記憶させておく場合を例にしたが、記憶させる基準部位のサイズは縦サイズに限定されない。例えば、人物の基準部位の横サイズが群衆パッチの横サイズの1/α倍、すなわち、w/αピクセルであると定められているとする。この場合、縦hピクセル、横wピクセルを群衆パッチのサイズとして学習用局所画像情報記憶手段22に記憶させるとともに、横w/αピクセルを人物の基準部位のサイズとして学習用局所画像情報記憶手段22に記憶させておけばよい。実際の利用時において、人物の基準部位のサイズは、縦サイズまたは横サイズのどちらか一方を決めて利用すればよい。また、群衆パッチのサイズと人物の基準部位のサイズとの関係が分かればよいので、対角サイズ等を利用してもよい。
【0027】
ここで、人物の基準部位のサイズとは、群衆パッチ内で人物の基準部位がそのサイズと同程度のサイズで写っていれば、その人物を、人物として認めることになるサイズである。例えば、群衆パッチ内で、人物の基準部位が極端に大きく写っている場合や、逆に極端に小さく写っている場合、その人物は、群衆を構成している人物ではあるものの、単なる背景とみなす。
【0028】
群衆状態制御指示記憶手段23は、群衆パッチ内に複数の人物画像を合成する際における、複数の人物に関係する人物の状態の指示情報(以下、複数人物状態制御指示と記す。)を記憶する。複数人物状態制御指示は、事前に、教師データ生成装置10の操作者によって定められ、群衆状態制御指示記憶手段23に記憶される。複数人物状態制御指示は、複数の人物画像を合成する際の人物の重なり具合、位置の偏り具合等の人物の配置関係に関する項目「人物の配置」や、人物同士の向きに関する項目「人物の方向」や、人数や密度に関する項目「人数」等の項目毎に定められる。複数人物状態制御指示が定められる項目はこれらの項目に限定されない。
図2は、群衆状態制御指示記憶手段23が記憶する情報の例を示す模式図である。
図2では、「人物の配置」、「人物の方向」、「人数」という項目に対して定められた複数人物状態制御指示を例示している。
【0029】
複数人物状態制御指示の態様には、「所定の状態」、「ランダム」、「所定のルール」等がある。
【0030】
「所定の状態」とは、対応する項目に関して、具体的な状態を指示する指示態様である。
図2に示す例では、「人数」という項目に対して定められた「3人」が、「所定の状態」に該当する。この例では、「人数」を「3人」として、具体的に指示している。「所定の状態」の他の例として、例えば、「人物の方向」という項目に関して、「全員右方向」と指示すること等が挙げられる。
【0031】
「ランダム」とは、対応する項目に関して任意に状態を定めてよいことを意味する。
図2に示す例では、「人物の配置」および「人物の方向」に関して「ランダム」という複数人物状態制御指示が定められている。
【0032】
また、「所定のルール」とは、操作者が指定したルールを満足する範囲内で、対応する項目の状態を定めてよいことを指示する指示態様である。例えば、「人物の配置」という項目に関し、「人物同士を50%重ねて配置する。」というルールが定められている場合、人物の配置に関して、少なくとも、そのルールを満たすように人物の状態を定めることを指示していることになる。また、例えば、「人物の方向」に関して、「群衆パッチの中心より右側に配置された人物は右方向を向き、中心より左側に配置された人物は左方向を向く。」というルールが定められている場合、人物の方向に関して、少なくとも、そのルールを満たすように人物の状態を定めることを指示していることになる。
【0033】
また、群衆状態制御指示記憶手段23は、項目毎に、教師ラベルの指定の有無を記憶する。
図2に示す例では、“○”が教師ラベルの指定ありという情報を表し、“×”が教師ラベルの指定なしという情報を表している。この点は、後述の
図3でも同様である。
【0034】
操作者は、複数人物状態制御指示が定められる各項目のうち、教師ラベルを指定する項目を1つ以上選択する。また、操作者は、教師ラベルを指定する項目であるか否かによらず、各項目に対して複数人物状態制御指示を定める。
図2に示す例では、教師ラベルの指定なしの項目「人物の配置」、「人物の方向」に関しても、複数人物状態制御指示(本例では、ランダムという指示)が定められている。ただし、操作者は、教師ラベルを指定する項目に関しては、複数人物状態制御指示の態様を「所定の状態」とする。
図2に示す例では、教師ラベルの指定ありの項目である「人数」に関して、3人という具体的な状態が指示されている。群衆状態制御指示記憶手段23には、項目毎に操作者が定めた複数人物状態制御指示、および、教師ラベルの指定有無を記憶させておく。
【0035】
図2では、「人物の配置」、「人物の方向」、「人数」という項目を例示しているが、操作者が複数人物状態制御指示および教師ラベルの指定の有無を定める項目は、これらの項目に限定されない。本実施形態では、群衆状態制御指示記憶手段23が、少なくとも、「人物の配置」、「人物の方向」、「人数」という項目に関し、操作者によって定められた複数人物状態制御指示と、教師ラベルの指定の有無を記憶している場合を例にして説明する。
【0036】
人物状態制御指示記憶手段24は、群衆パッチ内に複数の人物画像を合成する際における、各人物の状態を指示する情報(以下、個別人物状態制御指示と記す。)を記憶する。前述の「複数人物状態制御指示」が、複数の人物に関係する人物の状態を指示するのに対し、「個別人物状態制御指示」は、その複数の人物群に属する個別の人物の状態を指示する。個別人物状態制御指示は、事前に、教師データ生成装置10の操作者によって定められ、人物状態制御指示記憶手段24に記憶される。個別人物状態制御指示は、「人物の撮影角度」、「人物への照明」、「人物の姿勢」、「人物の服装」、「人物の体型」、「人物の髪型」、「群衆パッチに合成するときの人物サイズ」等の項目毎に定められる。個別人物状態制御指示が定められる項目はこれらの項目に限定されない。
図3は、人物状態制御指示記憶手段24が記憶する情報の例を示す模式図である。
図3では、「人物の撮影角度」、「人物への照明」、「人物の姿勢」という項目に対して定められた個別人物状態制御指示を例示している。
【0037】
個別人物状態制御指示の態様にも、複数人物状態制御指示と同様に、「所定の状態」、「ランダム」、「所定のルール」等がある。
【0038】
「所定の状態」は、複数人物状態制御指示で説明した場合と同様に、対応する項目に関して、具体的な状態を指示する指示態様である。
図3に示す例では、「人物の姿勢」という項目に関して定められた「歩行」が、「所定の状態」に該当する。この例では、「人物の姿勢」を歩行姿勢として、具体的に指示している。
【0039】
「ランダム」は、複数人物状態制御指示で説明した場合と同様に、対応する項目に関して任意に状態を定めてよいことを意味する。
図3に示す例では、「人物への照明」に「ランダム」という個別人物状態制御指示が定められている。
【0040】
「所定のルール」は、複数人物状態制御指示で説明した場合と同様に、操作者が指定したルールを満足する範囲内で、対応する項目の状態を定めることを指示する指示態様である。
図3に示す例では、「人物の撮影角度」に関して、所定のルールが定められている。本例では、合成時の人物配置からカメラパラメータに基づく式を用いて、人物の撮影角度を算出し、その撮影角度に応じて人物の状態を定めることを指示している。また、例えば、「群衆パッチに合成するときの人物サイズ」に関して、「合成時の人物配置と学習用局所画像情報記憶手段22に記憶された基準部位のサイズに基づいて、合成時の人物サイズを決定する。」というルールが定められている場合、少なくとも、そのルールを満たすように、人物のサイズを定めることを指示していることになる。
【0041】
人物状態制御指示記憶手段24も、項目毎に、教師ラベルの指定の有無を記憶する。
【0042】
操作者は、複数人物状態制御指示が定められる項目だけでなく、個別人物状態制御指示が定められる項目に関しても、教師ラベルを指定する項目を1つまたは複数選択してよい。この場合においても、操作者は、教師ラベルを指定する項目であるか否かによらず、各項目に対して個別人物状態制御指示を定める。
図3に示す例では、教師ラベルの指定なしの項目「人物の撮影角度」、「人物への照明」に関しても、個別人物状態制御指示が定められている。ただし、操作者は、教師ラベルを指定する項目に関しては、個別人物状態制御指示の態様を「所定の状態」とする。
図3に示す例では、教師ラベルの指定ありの項目である「人物の姿勢」に関して、歩行という具体的な状態が指示されている。人物状態制御指示記憶手段24には、項目毎にユーザが定めた個別人物状態制御指示、および、教師ラベルの指定有無を記憶させておく。
【0043】
操作者は、個別人物状態制御指示が定められる項目に関しては、全ての項目に関して、教師ラベルの指定なしとしてもよい。ただし、前述のように、複数人物状態制御指示が定められる項目に関しては、操作者は、1つ以上の項目を、教師ラベルを指定する項目として定める。
【0044】
本実施形態では、人物状態制御指示記憶手段24が、少なくとも、「人物の撮影角度」、「人物への照明」、「人物の姿勢」、「人物の服装」、「人物の体型」、「人物の髪型」、「群衆パッチに合成するときの人物サイズ」という項目に関し、操作者によって定められた個別人物状態制御指示と、教師ラベルの指定の有無を記憶している場合を例にして説明する。
【0045】
教師ラベルの指定ありとされた項目に関して定められた複数人物状態制御指示の内容が、群衆状態制御指示記憶手段23が記憶する情報に従って生成された群衆パッチに対応する教師ラベルとなる。同様に、教師ラベルの指定ありとされた項目に関して定められた個別人物状態制御指示の内容が、人物状態制御指示記憶手段24が記憶する情報に従って生成された群衆パッチに対応する教師ラベルとなる。なお、複数人物状態制御指示に基づく教師ラベルが主な教師ラベルであると言え、個別人物状態制御指示に基づく教師ラベルは、その教師ラベルに対する補足的な教師ラベルであると言える。
【0046】
具体的には、データ処理装置1(
図1参照)が、群衆状態制御指示記憶手段23に記憶された各項目の複数人物状態制御指示、および、人物状態制御指示記憶手段24に記憶された各項目の個別人物状態制御指示に従って、人物の状態を決定し、それらの人物を合成した群衆パッチを生成する。データ処理装置1は、その群衆パッチに対して、教師ラベルの指定ありとされた項目に関して定められた複数人物状態制御指示および個別人物状態制御指示の内容を教師ラベルとして定める。例えば、
図2、
図3に例示するそれぞれの複数人物状態制御指示および個別人物状態制御指示に応じて、データ処理装置1が群衆パッチを生成したとする。この場合、その群衆パッチには、3人が歩行している状態が写っている。データ処理装置1は、その群衆パッチの教師ラベルとして、「3人、歩行」という教師ラベルを定める。
【0047】
なお、人物状態制御指示記憶手段24に記憶される項目に「群衆パッチに合成するときの人物サイズ」がある。群衆パッチ内で、人として認めるべき人物を合成する場合には、例えば、「群衆パッチに合成するときの人物サイズ」の個別人物状態制御指示として、学習用局所画像情報記憶手段22に記憶された人物の基準部位のサイズを指定したり、あるいは、ランダムを指定したりしてもよい。なお、ランダムを指定した結果、学習用局所画像情報記憶手段22に記憶された人物の基準部位のサイズと大きく異なる基準部位のサイズで人物の状態が仮決定された場合には、人物の状態の仮決定をやり直せばよい。群衆パッチ内で、背景となるべき人物を合成する場合には、例えば、「群衆パッチに合成するときの人物サイズ」の個別人物状態制御指示として、学習用局所画像情報記憶手段22に記憶された人物の基準部位のサイズとは、大きく異なるサイズを指定したり、ランダムを指定したりしてもよい。なお、ランダムを指定した結果、背景に該当しないような人物の状態が仮決定された場合には、人物の状態の仮決定をやり直せばよい。
【0048】
また、後述するように、本実施形態では、データ処理装置1は、人として認めるべき人物(以下、前景の人物と記す場合がある。)の状態の決定と、背景の人物の状態の決定とをそれぞれ行う。前景の人物状態の決定のための複数人物状態制御指示および個別人物状態制御指示と、背景の人物状態の決定のための複数人物状態制御指示および個別人物状態制御指示とが操作者によって別々に定められていてもよい。その場合、群衆状態制御指示記憶手段23は、前景の人物状態の決定のための複数人物状態制御指示と、背景の人物状態の決定のための複数人物状態制御指示とをそれぞれ記憶する。また、人物状態制御指示記憶手段24は、前景の人物状態の決定のための個別人物状態制御指示と、背景の人物状態の決定のための個別人物状態制御指示とをそれぞれ記憶する。また、複数人物状態制御指示および個別人物状態制御指示が、前景の人物状態の決定用と、背景の人物状態の決定用とに分けられていなくてもよい。
【0049】
人物画像記憶手段25は、人物の方向、人物の撮影角度、人物への照明、人物の姿勢、服装、体型、髪型等の人物の状態の情報を人物画像毎に付加した複数の人物画像(人物画像群)を記憶する。すなわち、データ処理装置1は、決定した状態に合致する人物画像を人物画像記憶手段25から読み込むことができる。
【0050】
人物領域画像記憶手段26は、人物画像記憶手段25に記憶されている人物画像群に対応した人物領域画像群を記憶している。人物領域画像は、人物画像記憶手段25に記憶されている人物画像における人物の領域を示した画像である。
図4は、人物画像記憶手段25に記憶されている人物画像と、その人物画像に対応する人物領域画像の例を示す図である。
図4では、人物画像および人物領域画像の例を4組、例示している。人物領域画像は、例えば、人物画像に映された人物の領域を単色(
図4に示す例では白色)で表し、人物以外の領域を別の単色(
図4に示す例では黒色)で表した画像であってもよい。ただし、人物領域画像は、そのような例に限定されない。人物領域画像は、人物画像における人物の領域を特定できる画像であればよい。
【0051】
人物領域画像は、対応する人物画像から、人物のみを切り出す(換言すれば、人物の領域のみを切り出す)ために用いられる。
【0052】
なお、種々の人物画像群を予め用意して人物画像記憶手段25に記憶させておく構成ではなく、データ処理装置1が、決定した人物状態に合致する人物画像をCG等で生成する人物画像生成手段(図示せず)を備える構成であってもよい。
【0053】
データ処理装置1は、背景抽出手段11と、人物状態決定手段15と、群衆状態画像合成手段14と、制御手段16とを備える。
【0054】
背景抽出手段11は、背景画像記憶手段21に記憶されている背景画像群から背景画像を選択する。また、背景抽出手段11は、学習用局所画像情報記憶手段22に記憶されている群衆パッチサイズのアスペクト比を算出する。背景抽出手段11は、そのアスペクト比を満足するように、選択した背景画像から適当な位置、適当な大きさの背景を仮抽出する。さらに、背景抽出手段11は、仮抽出した背景を、学習用局所画像情報記憶手段22に記憶されている群衆パッチサイズに合致するように拡大または縮小する。このように、画像から抽出した領域を、群衆パッチサイズに合致するように拡大または縮小することを正規化と記す場合がある。
【0055】
背景抽出手段11が適当な位置、適当な大きさの背景を仮抽出する場合には、アスペクト比を満足するようにして、ランダムな位置でランダムな大きさの領域を抽出してもよい。また、画像中の各位置における人物の基準部位のサイズが既知であることを前提として、背景抽出手段11が、画像中の各位置の既知となっている基準部位のサイズに合わせて、学習用局所画像情報記憶手段22に記憶されている人物の基準部位のサイズを拡大または縮小したときの拡大率または縮小率で群衆パッチを拡大または縮小したときのサイズを求めてもよい。そして、背景抽出手段11が、画像中の任意の位置に対して求めたサイズの領域を抽出してもよい。背景抽出手段11が、選択した背景画像から領域を仮抽出する方法は、他の方法であってもよい。
【0056】
人物状態決定手段15は、群衆状態制御指示記憶手段23に記憶されている複数人物状態制御指示と、人物状態制御指示記憶手段24に記憶されている個別人物状態制御指示に基づいて人物状態を仮決定しながら、群衆パッチサイズに対する人物の基準部位のサイズおよび基準部位の表れ方に関する条件に基づいて最終的な人物状態を決定する。
【0057】
ここで、複数人物状態制御指示および個別人物状態制御指示を満たす人物の状態を決定した場合、それらの指示の中には「ランダム」等の指示もあり得るので、適切な人物の状態が得られない場合もある。その場合には、複数人物状態制御指示および個別人物状態制御指示を満たす人物の状態の決定をやり直す。そして、適切な人物の状態が得られた場合には、その人物の状態を最終的に決定する。このように、人物の状態の決定をやり直す事があり得るので、「仮決定」という表現を用いる場合がある。
【0058】
また、本実施形態では、人物状態決定手段15は、前景の人物状態の決定と、背景の人物状態の決定とを行う。このとき、人物状態決定手段15は、仮決定された前景の人物状態が適切か否かを判定する場合、群衆パッチサイズに対する人物の基準部位のサイズと同程度の基準部位のサイズが得られているかや、基準部位の表れ方に基づいて、判定を行う。また、人物状態決定手段15は、仮決定された背景の人物状態が適切か否かを判定する場合、群衆パッチサイズに対する人物の基準部位のサイズとは大きく異なる基準部位のサイズが得られているかや、基準部位の表れ方に基づいて、判定を行う。
【0059】
以下、人物状態決定手段15について、より詳細に説明する。人物状態決定手段15は、背景人物状態決定手段12と、前景人物状態決定手段13とを備える。
【0060】
背景人物状態決定手段12は、群衆状態制御指示記憶手段23に記憶されている複数人物状態制御指示および、人物状態制御指示記憶手段24に記憶されている個別人物状態制御指示に従って、人物の配置、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆パッチに合成するときの人物サイズ等を定め、背景に該当する人物の状態を仮決定する。そして、背景人物状態決定手段12は、仮決定した人物の状態が、背景の人物状態の条件を満たしているか否かを判定し、背景の人物状態の条件を満たしていなければ、人物の状態の仮決定を再度実行する。また、仮決定した人物の状態がその条件を満たしていれば、背景人物状態決定手段12は、仮決定した人物の状態を、背景に該当する人物の状態として最終的に決定する。
【0061】
背景の人物状態の条件とは、例えば、人物の基準部位が群衆パッチ内に納まらないような人物の配置状態になっていること、あるいは、学習用局所画像情報記憶手段22に記憶されている基準部位のサイズに対して、合成時の人物の基準部位のサイズが極端に大きいか、あるいは、極端に小さいことのいずれかに該当することである。このような条件を用いることで、群衆パッチサイズに対する人物の基準部位のサイズや基準部位の表れ方に基づいて、背景に該当する人物の状態を最終的に決定していると言える。ただし、ここで挙げた条件は例示であり、背景の人物状態の条件として、他の条件を用いてもよい。
【0062】
ここで、人物の基準部位が群衆パッチ内に納まるとは、その人物の基準部位を表す領域のうち、所定割合以上の領域が群衆パッチ内に写ることになる状態を言う。逆に、人物の基準部位が群衆パッチ内に納まらないとは、その人物の基準部位を表す領域のうち、所定割合未満の領域が群衆パッチ内に写ることになる状態を言う。例えば、所定割合が80%として予め定められているとする。この場合、例えば、基準部位を表す領域の85%が群衆パッチ内に写ることになる状態であれば、人物の基準部位が群衆パッチ内に納まると言える。また、例えば、基準部位を表す領域の20%のみが群衆パッチ内に写ることになる状態であれば、人物の基準部位が群衆パッチ内に納まっていないと言える。なお、上記の80%は例示であり、上記の所定割合として、80%以外の値が定められていてもよい。
【0063】
また、本実施形態では、学習用局所画像情報記憶手段22に記憶されている基準部位のサイズよりも大きなサイズを表す第1の閾値と、学習用局所画像情報記憶手段22に記憶されている基準部位のサイズよりも小さなサイズを表す第2の閾値とが、予め定められる。学習用局所画像情報記憶手段22に記憶されている基準部位のサイズに対して、合成時の人物の基準部位のサイズが同程度になっているとは、合成時の人物の基準部位のサイズが、第2の閾値以上、第1の閾値以下であることを意味する。そして、学習用局所画像情報記憶手段22に記憶されている基準部位のサイズに対して、合成時の人物の基準部位のサイズが極端に大きいとは、合成時の人物の基準部位のサイズが、第1の閾値よりも大きいことを意味する。また、学習用局所画像情報記憶手段22に記憶されている基準部位のサイズに対して、合成時の人物の基準部位のサイズが極端に小さいとは、合成時の人物の基準部位のサイズが、第2の閾値未満であることを意味する。
【0064】
図5は、背景の人物状態の条件を満たしている例を示す模式図である。本例では、人物の基準部位(本例では、頭部)の縦方向のサイズが群衆パッチの縦サイズhピクセルの1/α倍(すなわち、h/αピクセル)として、学習用局所画像情報記憶手段22に記憶されているものとする。
図5(a),(b)に例示する人物状態は、人物の基準部位が群衆パッチ内に表れない配置状態となっているので、背景の人物状態の条件を満たしている。
図5(c)に例示する人物状態は、基準部位のサイズが、定められた基準部位のサイズに対して極端に小さいので、背景の人物状態の条件を満たしている。
図5(d)に例示する人物状態は、基準部位のサイズが、定められた基準部位のサイズに対して極端に大きいので、背景の人物状態の条件を満たしている。
【0065】
前景人物状態決定手段13は、群衆状態制御指示記憶手段23に記憶されている複数人物状態制御指示および、人物状態制御指示記憶手段24に記憶されている個別人物状態制御指示に従って、人物の配置、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆パッチに合成するときの人物サイズ等を定め、前景に該当する人物の状態を仮決定する。そして、前景人物状態決定手段13は、仮決定した人物の状態が、前景の人物状態の条件を満たしているか否かを判定し、前景の人物状態の条件を満たしていなければ、人物の状態の仮決定を再度実行する。また、仮決定した人物の状態がその条件を満たしていれば、前景人物状態決定手段13は、仮決定した人物の状態を、前景に該当する人物の状態として最終的に決定する。
【0066】
前景の人物状態の条件とは、例えば、人物の基準部位が群衆パッチ内に納まるような配置状態になっていて、かつ、学習用局所画像情報記憶手段22に記憶されている基準部位のサイズに対して、合成時の人物の基準部位のサイズが同程度になっていることである。このような条件を用いることで、群衆パッチサイズに対する人物の基準部位のサイズや基準部位の表れ方に基づいて、前景に該当する人物の状態を最終的に決定していると言える。ただし、ここで挙げた条件は例示であり、前景の人物状態の条件として、他の条件を用いてもよい。
【0067】
図6は、前景の人物状態の条件を満たしている例を示す模式図である。
図5で説明した場合と同様に、人物の基準部位(本例では、頭部)の縦方向のサイズが群衆パッチの縦サイズhピクセルの1/α倍(すなわち、h/αピクセル)として、学習用局所画像情報記憶手段22に記憶されているものとする。
図6(a)〜(d)に示すいずれの人物状態も、人物の基準部位が群衆パッチ内に納まっていて、基準部位のサイズが、学習用局所画像情報記憶手段22に記憶されている基準部位のサイズと同程度になっている。従って、
図6(a)〜(d)に示すいずれの人物状態も、前景の人物状態の条件を満たしている。
【0068】
なお、既に説明したように、前景の人物状態の決定のための複数人物状態制御指示および個別人物状態制御指示と、背景の人物状態の決定のための複数人物状態制御指示および個別人物状態制御指示とが操作者によって別々に定められていてもよい。この場合、背景人物状態決定手段12は、背景の人物状態の決定のための複数人物状態制御指示および個別人物状態制御指示に従って、人物の状態を仮決定すればよい。そして、前景人物状態決定手段13は、前景の人物状態の決定のための複数人物状態制御指示および個別人物状態制御指示に従って、人物の状態を仮決定すればよい。このように、複数人物状態制御指示および個別人物状態制御指示を、前景の人物状態の決定用と、背景の人物状態の決定用とに分けてそれぞれ定めておいた場合には、前景人物の人数と背景人物の人数とを変えること等が可能となる。
【0069】
群衆状態画像合成手段14は、背景人物状態決定手段12が最終的に決定した人物状態(人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型等)を満たす人物画像を人物画像記憶手段25から読み込み、さらに、その人物画像に対応する人物領域画像を、人物領域画像記憶手段26から読み込む。そして、群衆状態画像合成手段14は、その人物領域画像を用いて、人物画像から、人物部分のみの画像を切り出す(換言すれば、人物の領域のみを切り出す)。同様に、群衆状態画像合成手段14は、前景人物状態決定手段13が最終的に決定した人物状態を満たす人物画像を人物画像記憶手段25から読み込み、さらに、その人物画像に対応する人物領域画像を、人物領域画像記憶手段26から読み込む。そして、群衆状態画像合成手段14は、その人物領域画像を用いて、人物画像から、人物部分のみの画像を切り出す。
【0070】
群衆状態画像合成手段14は、上記のように切り出した人物部分のみの画像を、背景画像に合成する。このとき、背景人物状態決定手段12が最終的に決定した人物状態に基づいて切り出した人物部分のみの画像に関しては、群衆状態画像合成手段14は、背景人物状態決定手段12が決定した「人物の配置」、「群衆パッチに合成するときの人物サイズ」に合わせて、背景画像に合成する。また、前景人物状態決定手段13が最終的に決定した人物状態に基づいて切り出した人物部分のみの画像に関しては、群衆状態画像合成手段14は、前景人物状態決定手段13が決定した「人物の配置」、「群衆パッチに合成するときの人物サイズ」に合わせて、背景画像に合成する。ここで、この背景画像は、背景抽出手段11による正規化後の画像である。この合成の結果が、群衆パッチとなる。
【0071】
群衆状態画像合成手段14は、人物部分のみの画像を背景画像に合成する場合には、カメラからより遠い配置位置に該当する人物の画像から順に、重ねて合成する。例えば、画像の上部ほどカメラから遠い場合には、群衆状態画像合成手段14は、画面上部の人物の画像から順に重ねて合成する。また、カメラキャリブレーションの情報が与えられている場合には、群衆状態画像合成手段14は、人物の画像の3次元位置を考慮してカメラから遠い順に、人物の画像を重ねて合成する。
【0072】
また、上記の例では、群衆状態画像合成手段14が、人物領域画像を用いて、人物画像から、人物部分のみの画像を切り出し、その人物部分のみの画像を背景画像に合成する場合を例に説明した。群衆状態画像合成手段14は、人物画像記憶手段25から読み込んだ人物画像に対して、その人物画像に対応する人物領域画像に基づいて、人物の領域と、それ以外の領域とに分け、人物の領域と、それ以外の領域に対して重み付けを行い、その重みに従って、人物画像をブレンディングして合成を行ってもよい。この場合、人物の領域の重みは、それ以外の領域の重みよりも大きくする。また、領域内で重みを変化させてもよい。
【0073】
また、既に説明したように、データ処理装置1が、指定された人物状態に合致する人物画像をCG等で生成する人物画像生成手段(図示せず)を備える構成であってもよい。この場合、背景人物状態決定手段12が決定した人物状態や、前景人物状態決定手段13が決定した人物状態に合致する人物画像を人物画像生成手段(図示せず)が生成し、群衆状態画像合成手段14は、その人物画像を合成することで群衆パッチを生成してもよい。
【0074】
また、群衆状態画像合成手段14は、群衆パッチを生成したときに、群衆状態制御指示記憶手段23および人物状態制御指示記憶手段24から教師ラベルを読み込む。すなわち、群衆状態画像合成手段14は、教師ラベルの指定ありに該当する項目の複数人物状態制御指示の内容を群衆状態制御指示記憶手段23から読み込み、また、教師ラベルの指定ありに該当する項目の個別人物状態制御指示の内容を人物状態制御指示記憶手段24から読み込む。そして、群衆状態画像合成手段14は、群衆パッチおよび教師ラベルの組を出力する。群衆パッチおよび教師ラベルは、画像内の群衆状態を認識するための機械学習の教師データとして用いられる。
【0075】
制御手段16は、背景抽出手段11、人物状態決定手段15(具体的には、背景人物状態決定手段12および前景人物状態決定手段13)および群衆状態画像合成手段14による一連の処理を、繰り返させる。この結果、データ処理装置1は、群衆パッチおよび教師ラベルの組を大量に出力する。
【0076】
操作者が、人物状態の指示や、教師ラベルを変更する場合には、複数人物状態制御指示、個別人物状態制御指示、および教師ラベルの指定の有無を再設定することによって、データ処理装置1は、その設定に応じた群衆パッチおよび教師ラベルの組を大量に出力する。従って、操作者は、所望の教師データを大量に得ることができる。
【0077】
図7は、本発明の群衆状態認識装置の構成例を示すブロック図である。本発明の群衆状態認識装置30は、与えられた画像内の群衆状態を認識する。群衆状態認識装置30は、画像取得装置3と、プログラム制御によって動作するデータ処理装置4と、情報を記憶する記憶装置5とを備える。
【0078】
画像取得装置3は、群衆状態の認識対象となる画像を取得するカメラである。
【0079】
記憶装置5は、探索窓記憶手段51と、群衆状態認識辞書記憶手段52とを備える。
【0080】
探索窓記憶手段51は、画像上の群衆状態の認識対象箇所を示す矩形領域群を記憶する。この矩形領域を探索窓と記す場合もある。矩形領域群は、画像取得装置3の位置・姿勢・焦点距離・レンズ歪みを示すカメラパラメータと、群衆パッチサイズに対応する基準部位のサイズ(学習用局所画像情報記憶手段22に記憶された基準部位のサイズ)に基づき、画像上の位置に応じて群衆パッチのサイズを変更した大きさを定めることで、設定してもよい。例えば、上記のようなカメラパラメータから、画像内に写る人物の基準部位のサイズを導出することができる。この基準部位のサイズに合わせて、学習用局所画像情報記憶手段22に記憶されている人物の基準部位のサイズを拡大または縮小したときの拡大率または縮小率で群衆パッチのサイズを拡大または縮小することで、矩形領域の大きさを設定してもよい。また、画像上の位置を網羅するように矩形領域群を設定してもよい。矩形領域群は、これらの方法に限らず、自由に設定してもよい。また、矩形領域群は、重ねて設定されてもよい。
【0081】
群衆状態認識辞書記憶手段52は、
図1に示す教師データ生成装置10によって生成される教師データ(群衆パッチと教師ラベルの大量の組)で学習した識別器の辞書を記憶する。識別器は、群衆状態を認識するためのアルゴリズムであり、識別器の辞書は、そのアルゴリズムに従って群衆状態の認識処理を行う際に用いる辞書である。群衆状態認識辞書記憶手段52に記憶される識別器の辞書は、例えば、教師データ生成装置10によって生成される群衆パッチと教師ラベルの大量の組を用いて、機械学習をすることによって得られる。この機械学習は、公知の機械学習でよい。
【0082】
データ処理装置4は、群衆状態認識手段41を備える。
【0083】
群衆状態認識手段41は、画像取得装置3が取得する画像から、探索窓記憶手段51に記憶されている矩形領域群に該当する局所領域画像を抽出し、抽出した局所領域画像を、群衆パッチサイズに合致するように正規化する。そして、群衆状態認識手段41は、群衆状態を認識アルゴリズム(すなわち、識別器)に従い、群衆状態認識辞書記憶手段52に記憶された識別器の辞書を用いて、正規化した局所領域画像内の群衆状態を認識する(判定する)。
【0084】
図1に示す教師データ生成装置10は、操作者が意図する教師データ(群衆パッチおよび教師ラベルの組)を大量に生成することができる。そのような教師データを用いて機械学習した結果得られる識別器の辞書を用いて、群衆状態認識手段41は、局所領域画像内の群衆状態を認識する。従って、群衆状態認識装置30は、多様な群衆状態を認識できる。
【0085】
図8は、画像内の群衆状態として、混雑度(人数)を認識する例を示す模式図である。例えば、教師データ生成装置10の操作者が、主に「人数」を段階的に制御して、大量の群衆パッチおよび教師ラベルを得たとする(
図8の上段参照)。そして、その教師データから機械学習によって得た識別器の辞書を、群衆状態認識辞書記憶手段52に記憶させたとする。
図8に示す画像61において、局所領域画像を抽出する矩形領域を破線で示す。また、その矩形領域に合わせて抽出した局所領域画像に関する群衆状態の認識結果を、破線で示した領域と対応させて表している。この点は、後述の
図9ないし
図11においても同様である。また、実際の矩形領域は、基本的には、画面全体に網羅的に設定されるが、ここでは、認識結果を分かりやすく示すために、数カ所のみの矩形領域を例として示している。本例では、群衆状態認識手段41は、
図8に示すように、画像61内の種々の領域における人数(混雑度)を認識することができる。
【0086】
図9は、画像内の群衆状態として、群衆の方向を認識する例を示す模式図である。例えば、教師データ生成装置10の操作者が、主に「人物の方向」を制御して、大量の群衆パッチおよび教師ラベルを得たとする(
図9の上段を参照)。そして、その教師データから機械学習によって得た識別器の辞書を、群衆状態認識辞書記憶手段52に記憶させたとする。本例では、群衆状態認識手段41は、
図9に示すように、画像62内の種々の領域における群衆の方向を認識することができる。
【0087】
図10は、画像内の群衆状態として、非異常群衆(極端に混雑していない群衆)か異常群衆(極端に混雑した群衆)かを認識する例を示す模式図である。例えば、教師データ生成装置10の操作者が、主に「人数」を制御して、大量の群衆パッチおよび教師ラベルを得たとする。ここでは、人数がn人未満という場合と、人数がn人以上という場合の2クラスに分けて、大量の教師データを得たとする(
図10の上段を参照)。そして、その教師データから機械学習によって得た識別器の辞書を、群衆状態認識辞書記憶手段52に記憶させたとする。本例では、群衆状態認識手段41は、
図10に示すように、画像63内の種々の領域における群衆状態が、非異常群衆であるか、異常群衆であるかを認識することができる。
【0088】
図11は、画像内の群衆状態として、無秩序状態(人物の方向が統一されていない状態)か、秩序状態(人物の方向が統一されている状態)かを認識する例を示す模式図である。例えば、教師データ生成装置10の操作者が、「人物の方向」を統一した場合と、統一しない場合の2クラスに分けて、大量の教師データを得たとする(
図11の上段を参照)。そして、その教師データから機械学習によって得た識別器の辞書を、群衆状態認識辞書記憶手段52に記憶させたとする。本例では、群衆状態認識手段41は、
図11に示すように、画像64内の種々の領域における群衆状態が、無秩序状態であるか、秩序状態であるかを認識することができる。
【0089】
操作者が意図する教師データを大量に生成することができるので、
図8ないし
図11に例示した場合の外にも、群衆状態認識手段41が、群衆が散らばって逃げるような離散状態、群衆が1箇所に集合してくるような集合状態、群衆が何かを避けるような回避状態、特殊な群衆の塊を示すたむろ状態や行列状態等、種々の状態を認識できるようにすることができる。
【0090】
次に、本発明の教師データ生成装置10の処理経過を説明する。
図12は、教師データ生成装置10の処理経過の例を示すフローチャートである。
【0091】
背景抽出手段11は、背景画像記憶手段21に記憶されている背景画像群から背景画像を選択し、群衆パッチの背景として用いる画像を抽出する(ステップS1)。
【0092】
図13は、ステップS1の処理経過の例を示すフローチャートである。背景抽出手段11は、ステップS1において、まず、背景画像記憶手段21に記憶されている背景画像群から背景画像を1枚選択する(ステップS101)。この選択方法は、特に限定されない。例えば、背景抽出手段11は、背景画像群から、任意に一枚の背景画像を選択してもよい。
【0093】
次に、背景抽出手段11は、学習用局所画像情報記憶手段22に記憶されている群衆パッチサイズのアスペクト比を算出し、そのアスペクト比を満足するように、選択した背景画像から適当な位置、適当な大きさの背景を仮抽出する(ステップS102)。
【0094】
背景抽出手段11は、仮抽出した背景の画像を、群衆パッチサイズに合致するように拡大または縮小する(換言すれば、正規化する)ことによって、群衆パッチの背景となる画像を得る(ステップS103)。以上でステップS1が終了する。
【0095】
ステップS1の後、背景人物状態決定手段12は、背景に該当する人物の状態を決定する(ステップS2)。
【0096】
図14は、ステップS2の処理経過の例を示すフローチャートである。背景人物状態決定手段12は、群衆状態制御指示記憶手段23に記憶されている複数人物状態制御指示および、人物状態制御指示記憶手段24に記憶されている個別人物状態制御指示に従って、人物の配置、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆パッチに合成するときの人物サイズ等を定め、背景に該当する人物の状態を仮決定する(ステップS201)。
【0097】
次に、背景人物状態決定手段12は、ステップS201で仮決定した人物の状態が、背景の人物状態の条件を満たしているか否かを判定する(ステップS202)。なお、この条件については既に説明したので、ここでは説明を省略する。
【0098】
複数人物状態制御指示や個別人物状態制御指示には、「ランダム」等の指示も含まれ得るので、ステップS201で仮決定した状態が、背景の人物状態の条件を満たしていない場合もある。このような場合(ステップS202のNo)、背景人物状態決定手段12は、ステップS201以降の処理を繰り返す。
【0099】
そして、ステップS201で仮決定した状態が、背景の人物状態の条件を満たしている場合には(ステップS202のYes)、背景人物状態決定手段12は、直近のステップS201で仮決定した人物の状態を、背景に該当する人物の状態として確定する(ステップS203)。以上でステップS2が終了する。
【0100】
ステップS2の後、前景人物状態決定手段13は、前景に該当する人物の状態を決定する(ステップS3)。
【0101】
図15は、ステップS3の処理経過の例を示すフローチャートである。前景人物状態決定手段13は、群衆状態制御指示記憶手段23に記憶されている複数人物状態制御指示および、人物状態制御指示記憶手段24に記憶されている個別人物状態制御指示に従って、人物の配置、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆パッチに合成するときの人物サイズ等を定め、前景に該当する人物の状態を仮決定する(ステップS301)。
【0102】
次に、前景人物状態決定手段13は、ステップS301で仮決定した人物の状態が、前景の人物状態の条件を満たしているか否かを判定する(ステップS302)。なお、この条件については既に説明したので、ここでは説明を省略する。
【0103】
複数人物状態制御指示や個別人物状態制御指示には、「ランダム」等の指示も含まれ得るので、ステップS301で仮決定した状態が、前景の人物状態の条件を満たしていない場合もある。このような場合(ステップS302のNo)、前景人物状態決定手段13は、ステップS301以降の処理を繰り返す。
【0104】
そして、ステップS301で仮決定した状態が、前景の人物状態の条件を満たしている場合には(ステップS302のYes)、前景人物状態決定手段13は、直近のステップS301で仮決定した人物の状態を、前景に該当する人物の状態として確定する(ステップS303)。以上でステップS3が終了する。
【0105】
ステップS3の後、群衆状態画像合成手段14は、ステップS2,S3で決定された人物の状態に基づいて、群衆パッチを生成し、その群衆パッチに対応する教師ラベルを読み込み、群衆パッチおよび教師ラベルの組を出力する(ステップS4)。
【0106】
図16は、ステップS4の処理経過の例を示すフローチャートである。群衆状態画像合成手段14は、ステップS2,S3で決定した人物状態(人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型等)を満たす人物画像を人物画像記憶手段25内の人物画像群から選択し、読み込む(ステップS401)。
【0107】
そして、群衆状態画像合成手段14は、ステップS401で選択した各人物画像に対応する各人物領域画像を人物領域画像記憶手段26から読み込む。群衆状態画像合成手段14は、人物画像毎に、人物画像に対応する人物領域画像を用いて、人物部分のみの画像を切り出す(ステップS402)。
【0108】
群衆状態画像合成手段14は、ステップS402で生成した人物部分のみの各画像について、ステップS2,S3で決定された「人物の配置」、「群衆パッチに合成するときの人物サイズ」に合わせて、配置状態を決定する(ステップS403)。そして、群衆状態画像合成手段14は、その配置状態に合わせて、人物部分のみの各画像を、ステップS1で得られた背景画像に合成することによって、群衆パッチを生成する(ステップS404)。
【0109】
そして、群衆状態画像合成手段14は、その群衆パッチに該当する教師ラベルを取得する(ステップS405)。すなわち、群衆状態画像合成手段14は、教師ラベルの指定ありに該当する項目の複数人物状態制御指示の内容を群衆状態制御指示記憶手段23から読み込み、また、教師ラベルの指定ありに該当する項目の個別人物状態制御指示の内容を人物状態制御指示記憶手段24から読み込む。これらの読み込んだ内容が、教師ラベルに相当する。
【0110】
群衆状態画像合成手段14は、ステップS404で生成した群衆パッチと、ステップS405で取得した教師ラベルの組を出力する(ステップS406)。以上でステップS4を終了する。
【0111】
ステップS4の後、制御手段16は、ステップS1〜S4の処理の繰り返し数が所定回数に達したか否かを判定する(ステップS5)。ステップS1〜S4の処理の繰り返し数が所定回数に達していない場合(ステップS5のNo)、制御手段16は、背景抽出手段11、人物状態決定手段15(具体的には、背景人物状態決定手段12および前景人物状態決定手段13)および群衆状態画像合成手段14に、ステップS1〜S4の処理を再度実行させる。
【0112】
ステップS1〜S4の処理の繰り返し数が所定回数に達した場合(ステップS5のYes)、処理を終了する。
【0113】
ステップS1〜S4の処理を1回行うことで、群衆パッチと教師ラベルの組が1組得られる。よって、データ処理装置1が、ステップS1〜S4の処理を所定回数繰り返すことで、大量の教師データが得られる。例えば、所定回数を100000回に定めておけば、複数人物状態制御指示および個別人物状態制御指示に合致する群衆パッチと教師ラベルの組が100000組得られる。
【0114】
なお、
図12に示すフローチャートにおいて、ステップS1,S2,S3の順番は、入れ替えてもよい。
【0115】
次に、本発明の群衆状態認識装置30の処理経過を説明する。
図17は、群衆状態認識装置30の処理経過の例を示すフローチャートである。
【0116】
画像取得装置3が、群衆状態の認識対象となる画像を取得し、その画像を群衆状態認識手段41に入力する(ステップS21)。
【0117】
すると、群衆状態認識手段41は、探索窓記憶手段51に記憶されている矩形領域群を全て選択済みであるか否かを判定する(ステップS22)。
【0118】
探索窓記憶手段51に記憶されている矩形領域群のうち、未選択の矩形領域がある場合(ステップS22のNo)、群衆状態認識手段41は、その矩形領域群のうち、未選択の矩形領域を1つ選択する(ステップS23)。
【0119】
次に、群衆状態認識手段41は、ステップS21で入力された画像から、選択した矩形領域に該当する局所領域画像を抽出する(ステップS24)。そして、群衆状態認識手段41は、その局所領域画像を群衆パッチサイズに合致するように正規化する(ステップS25)。
【0120】
次に、群衆状態認識手段41は、群衆状態認識辞書記憶手段52に記憶された識別器の辞書を用いて、正規化後の局所領域画像内の群衆状態を認識する(ステップS26)。
【0121】
ステップS26の後、群衆状態認識手段41は、ステップS22以降の処理を繰り返す。そして、群衆状態認識手段41は、矩形領域群を全て選択済みと判定した場合(ステップS22のYes)、処理を終了する。
【0122】
本発明の教師データ生成装置によれば、操作者によって定められた複数人物状態制御指示(「人物の配置」、「人物の方向」、「人数」等の複数の人物に関する状態指示)と、個別人物状態制御指示(「人物の撮影角度」、「人物への照明」、「人物の姿勢」、「人物の服装」、「人物の体型」、「人物の髪型」、「群衆パッチに合成するときの人物サイズ」等の個別の人物に関する状態指示)に応じて、人物状態決定手段15が、群衆を構成する人物の状態を決定する。そして、群衆状態画像合成手段14が、決定された状態の人物の画像を合成することによって群衆パッチを生成し、その群衆パッチに対応する教師ラベルを読み込む。そして、人物の状態の決定、群衆パッチの生成、教師ラベルの特定といった処理を定められた回数繰り返すので、操作者が意図する群衆状態の教師データ(群衆パッチと教師ラベルの組)を、多様に大量に自動生成することができる。
【0123】
さらに、そのような大量の教師データが得られれば、その教師データから識別器の辞書を機械学習することができる。そして、群衆状態認識装置30は、その辞書を用いることによって、静止画像内の複雑な群衆状態を容易に認識することができる。
【0124】
また、群衆を表した群衆パッチと、その群衆パッチに対応する教師ラベルとに基づいて学習された辞書を用いて、群衆状態認識装置30の群衆状態認識手段41は、与えられた画像内の群衆状態を認識する。従って、群衆状態認識手段41は、人物の頭部や、人物という単体ではなく、基準部位が写った人物の集合である群衆という大きな単位で、群衆状態の認識を行う。よって、頭部認識や、個別の人物認識等を行えないような小さなサイズの領域における群衆状態の認識も行える。
【0125】
また、本発明の群衆状態認識装置30によれば、群衆状態認識手段41は、上記のような辞書(識別器の辞書)を用いて群衆状態を認識する。従って、群衆状態の認識精度は、フレームレートに依存しない。よって、本発明の群衆状態認識装置は、フレームレートに依存せずに、良好に画像中の群衆状態を認識できる。例えば、本発明の群衆状態認識装置30は、一枚の静止画像であっても、静止画像内の群衆状態を良好に認識できる。
【0126】
また、上記の実施形態の教師データ生成装置10は、人物の重なり具合等の「人物の配置」に関する人物状態も、複数人物状態制御指示によって決定し、そのような人物の状態を表す群衆パッチを生成する。このような群衆パッチを用いて機械学習を行えば、人物同士のオクルージョンを含む状態も学習される。よって、その学習の結果得られた辞書を用いることで、群衆状態認識装置30は、頭部認識や人物認識では認識が難しい人物同士の重なり(オクルージョン)が生じている場合であっても、群衆状態を良好に認識できる。
【0127】
また、上記の実施形態の教師データ生成装置10は、複数人にまたがる人物状態を指示する情報(複数人物状態制御指示)と、各人物の人物状態を指示する情報(個別人物状態制御指示)とに従って、人物の状態を決定し、その状態の人物を写した群衆パッチを生成するとともに、その群衆パッチに対応する教師ラベルを特定する。従って、操作者は、複数人物状態制御指示や個別人物状態制御指示を定めることで、異なる性質の群衆状態を認識するための教師データを簡単に得ることができる。そして、それらの教師データを機械学習することで異なる性質の群衆状態を認識する群衆状態認識装置30を簡単に作ることができる。
【0128】
また、上記の実施形態において、群衆を撮影する環境における画像取得装置(カメラ)3の位置・姿勢・焦点距離・レンズ歪みを示すカメラパラメータが入手できれば、カメラパラメータを用いて、その環境に限定した形で、複数人物状態制御指示や個別人物状態制御指示を定めることができる。教師データ生成装置10が、そのような複数人物状態制御指示や個別人物状態制御指示によって人物状態を決定し、教師データを生成すれば、群衆を撮影する環境に適した識別器の辞書を学習することができる。その結果、群衆状態認識装置30は、静止画像等における複雑な群衆状態の認識を高精度に実現することができる。
【0129】
また、上記の実施形態では、認識環境における画像取得装置3の位置・姿勢・焦点距離・レンズ歪みを示すカメラパラメータが入手できれば、画像上の局所領域毎に、複数の人物に関係する人物の状態と、各人物の人物状態を制御できる。そして、制御された人物状態に基づく人物画像の合成によって、操作者が意図する群衆パッチと、その群衆パッチに対応した教師ラベルとを大量に自動生成できる。そして、その群衆パッチと教師ラベルに基づいて、画像上の局所領域毎の識別器の辞書を学習でき、画像上の領域毎の複数の識別器の辞書を用いて、複雑な群衆状態の認識精度を上げることができる。
【0130】
次に、本発明の教師データ生成装置および群衆状態認識装置の具体的な構成の例について説明する。
図18は、本発明の教師データ生成装置の具体的な構成の一例を示すブロック図である。
図1に示す要素と同様の要素については、
図1と同一の符号を付し、詳細な説明を省略する。
図18に示す構成例では、背景画像記憶手段21と、学習用局所画像情報記憶手段22と、群衆状態制御指示記憶手段23と、人物状態制御指示記憶手段24と、人物画像記憶手段25と、人物領域画像記憶手段26とを含む記憶装置2が、コンピュータ100に接続されている。また、教師データ生成プログラム101を記憶するコンピュータ可読記憶媒体102もコンピュータ100に接続されている。
【0131】
コンピュータ可読記憶媒体102は、例えば、磁気ディスクや半導体メモリ等で実現される。コンピュータ100は、例えば、起動時等に、コンピュータ可読記憶媒体102から教師データ生成プログラム101を読み取る。そして、コンピュータ100は、教師データ生成プログラム101に従って、
図1に示すデータ処理装置1内の背景抽出手段11、人物状態決定手段15(より具体的には、背景人物状態決定手段12および前景人物状態決定手段13)、群衆状態画像合成手段14および制御手段16として動作する。
【0132】
図19は、本発明の群衆状態認識装置の具体的な構成の一例を示すブロック図である。
図7に示す要素と同様の要素については、
図7と同一の符号を付し、詳細な説明を省略する。
図19に示す構成例では、探索窓記憶手段51と、群衆状態認識辞書記憶手段52とを含む記憶装置5が、コンピュータ150に接続されている。また、群衆状態認識プログラム103を記憶するコンピュータ可読記憶媒体104もコンピュータ150に接続されている。
【0133】
コンピュータ可読記憶媒体104は、例えば、磁気ディスクや半導体メモリ等で実現される。コンピュータ150は、例えば、起動時等に、コンピュータ可読記憶媒体104から群衆状態認識プログラム103を読み取る。そして、コンピュータ150は、群衆状態認識プログラム103に従って、
図7に示すデータ処理装置4内の群衆状態認識手段41として動作する。
【0134】
なお、上記の実施形態において、群衆状態認識辞書記憶手段52(
図7参照)が、教師データ生成装置10(
図1参照)に生成された教師データを用いた学習によって得られた辞書を記憶する場合を例に説明した。換言すれば、上記の実施形態では、所望の状態に制御された人物の状態に合致する人物の画像を合成することによって得られた群衆パッチと、群衆パッチに対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた辞書を群衆状態認識辞書記憶手段52に記憶させる場合を示した。
【0135】
群衆状態認識辞書記憶手段52は、教師データ生成装置10が生成した教師データ以外のデータを教師データとして用いて機械学習によって得られた辞書を記憶していてもよい。教師データ生成装置10が生成した教師データ以外の教師データであっても、群衆パッチのサイズに対して定められた人物の基準部位のサイズと同程度のサイズで基準部位が表されている人物を含む群衆パッチと、その群衆パッチに対する教師ラベルの組を複数用意し、それらを教師データとしてもよい。すなわち、そのような群衆パッチおよび教師ラベルの複数の組を用いて機械学習した結果得られた識別器の辞書を、群衆状態認識辞書記憶手段52に記憶させてもよい。そのような場合であっても、フレームレートに依存せずに、良好に画像中の群衆状態を認識できるという効果が得られる。
【0136】
以下、本発明の主要部について説明する。
図20は、本発明の教師データ生成装置の主要部を示すブロック図である。本発明の教師データ生成装置は、背景抽出部71と、人物状態決定部72と、群衆状態画像合成部73とを備える。
【0137】
背景抽出部71(例えば、背景抽出手段11)は、予め用意された複数の背景画像から背景画像を選択し、その背景画像中の領域を抽出し、抽出した領域に該当する画像を、所定サイズの画像に拡大または縮小する。
【0138】
人物状態決定部72(例えば、人物状態決定手段15)は、複数の人物に関係する人物の状態の指示情報である複数人物状態制御指示と、その複数の人物中の個別の人物の状態の指示情報である個別人物状態制御指示とに従って、群衆の人物状態を決定する。
【0139】
群衆状態画像合成部73は、背景抽出部71によって得られた所定サイズの画像に対して、人物状態決定部72が決定した人物状態に該当する人物の画像を合成した画像である群衆状態画像(例えば、群衆パッチ)を生成し、当該群衆状態画像に対する教師ラベルを特定し、群衆状態画像および教師ラベルの組を出力する。
【0140】
そして、例えば、背景抽出部71、人物状態決定部72および群衆状態画像合成部73は、順に、動作を繰り返す。ただし、背景抽出部71、人物状態決定部72および群衆状態画像合成部73の動作は順になっていなくてもよい。例えば、背景抽出部71および人物状態決定部72が並列に動作を行ってもよい。
【0141】
そのような構成によって、群衆状態を認識するための識別器の辞書を機械学習する際に用いる多くの教師データを容易に生成することができる。
【0142】
図21は、本発明の群衆状態認識装置の主要部を示すブロック図である。本発明の群衆状態認識装置は、矩形領域群記憶部81と、群衆状態認識辞書記憶部82と、群衆状態認識部83とを備える。
【0143】
矩形領域群記憶部81(例えば、探索窓記憶手段51)は、画像上の群衆状態の認識対象箇所を示す矩形領域群を記憶する。
【0144】
群衆状態認識辞書記憶部82(例えば、群衆状態認識辞書記憶手段52)は、群衆状態を表した所定サイズの画像であって、その所定サイズに対して定められた人物の基準部位のサイズと同程度のサイズで基準部位が表されている人物を含む画像である群衆状態画像(例えば、群衆パッチ)と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶する。
【0145】
群衆状態認識部83(例えば、群衆状態認識手段41)は、与えられた画像から、矩形領域群記憶部81に記憶される矩形領域群が示す領域をそれぞれ抽出し、辞書に基づいて、抽出した画像に写っている群衆の状態を認識する。
【0146】
そのような構成によって、フレームレートに依存せずに、良好に画像中の群衆状態を認識できる。
【0147】
上記の実施形態の一部または全部は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。
【0148】
(付記1)
予め用意された複数の背景画像から背景画像を選択し、前記背景画像中の領域を抽出し、抽出した領域に該当する画像を、所定サイズの画像に拡大または縮小する背景抽出手段と、
複数の人物に関係する人物の状態の指示情報である複数人物状態制御指示と、前記複数の人物中の個別の人物の状態の指示情報である個別人物状態制御指示とに従って、群衆の人物状態を決定する人物状態決定手段と、
背景抽出手段によって得られた所定サイズの画像に対して、人物状態決定手段が決定した人物状態に該当する人物の画像を合成した画像である群衆状態画像を生成し、当該群衆状態画像に対する教師ラベルを特定し、群衆状態画像および教師ラベルの組を出力する群衆状態画像合成手段とを備えることを特徴とする教師データ生成装置。
【0149】
(付記2)
人物状態決定手段は、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆の人物状態を仮決定し、仮決定した人物状態が、所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する条件を満たしている場合に、仮決定した人物状態を群衆の人物状態として決定し、仮決定した人物状態が前記条件を満たしていない場合に、再度群衆の人物状態を仮決定することを繰り返す
付記1に記載の教師データ生成装置。
【0150】
(付記3)
項目毎に定められた複数人物状態制御指示を記憶するとともに、前記項目毎に定められた教師ラベルの指定の有無を記憶する群衆状態制御指示記憶手段と、
項目毎に定められた個別人物状態制御指示を記憶するとともに、前記項目毎に定められた教師ラベルの指定の有無を記憶する人物状態制御指示記憶手段とを備え、
人物状態決定手段は、群衆状態制御指示記憶手段に記憶された複数人物状態制御指示および人物状態制御指示記憶手段に記憶された個別人物状態制御指示に従って、群衆の人物状態を決定し、
群衆状態画像合成手段は、
教師ラベルの指定ありと定められた項目の複数人物状態制御指示を群衆状態制御指示記憶手段から読み込み、教師ラベルの指定ありと定められた項目の個別人物状態制御指示を人物状態制御指示記憶手段から読み込むことによって、教師ラベルを特定する
付記1または付記2に記載の教師データ生成装置。
【0151】
(付記4)
群衆状態制御指示記憶手段は、
少なくとも1つの項目について、教師ラベルの指定をありとして記憶し、
群衆状態画像合成手段は、
教師ラベルの指定ありと定められた項目の複数人物状態制御指示を群衆状態制御指示記憶手段から読み込む
付記3に記載の教師データ生成装置。
【0152】
(付記5)
群衆状態制御指示記憶手段は、人物の配置、人物の方向、および人数に関する項目毎に、複数人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する複数人物状態制御指示を、具体的な状態を指示する第1の態様、任意の状態に定めてよい旨を指示する第2の態様、定められたルールの範囲内で状態を定めてよいことを指示する第3の態様のいずれかの態様で記憶し、
人物状態制御指示記憶手段は、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆状態画像に合成するときの人物サイズに関する項目毎に、個別人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する個別人物状態制御指示を、前記第1の態様、前記第2の態様、前記第3の態様のいずれかの態様で記憶し、
人物状態決定手段は、群衆状態制御指示記憶手段に記憶された複数人物状態制御指示および人物状態制御指示記憶手段に記憶された個別人物状態制御指示に従って、群衆の人物状態を決定する
付記3または付記4に記載の教師データ生成装置。
【0153】
(付記6)
群衆状態画像合成手段は、人物の状態として決定された、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型に合致する人物画像を、予め用意された人物画像群の中から選択し、選択した人物画像の中から、人物の領域を切り出すことによって、人物部分のみの画像を生成し、人物の状態として決定された人物の配置、および群衆状態画像に合成するときの人物サイズに合わせて、前記人物部分のみを画像を、背景抽出手段によって得られた所定サイズの画像に対して合成する
付記1から付記5のうちのいずれかに記載の教師データ生成装置。
【0154】
(付記7)
群衆状態画像合成手段は、カメラからより遠い配置位置に該当する人物部分のみの画像から順に、背景抽出手段によって得られた所定サイズの画像に対して合成する
付記6に記載の教師データ生成装置。
【0155】
(付記8)
人物状態決定手段は、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆状態画像で背景となる群衆の人物状態を仮決定し、仮決定した人物状態が、群衆状態画像のサイズである所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する第1の条件を満たしている場合に、仮決定した人物状態を背景となる群衆の人物状態として決定し、仮決定した人物状態が前記第1の条件を満たしていない場合に、再度、背景となる群衆の人物状態を仮決定することを繰り返す背景人物状態決定手段と、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆状態画像で前景となる群衆の人物状態を仮決定し、仮決定した人物状態が、群衆状態画像のサイズである所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する第2の条件を満たしている場合に、仮決定した人物状態を前景となる群衆の人物状態として決定し、仮決定した人物状態が前記第2の条件を満たしていない場合に、再度、前景となる群衆の人物状態を仮決定することを繰り返す前景人物状態決定手段とを含む
付記1から付記7のうちのいずれかに記載の教師データ生成装置。
【0156】
(付記9)
第1の条件は、人物の基準部位が群衆状態画像に納まらない状態であること、あるいは、所定サイズに対して定められた人物の基準部位のサイズに対して、基準部位のサイズが極端に大きいか、または、極端に小さい状態であることのいずれかに該当することであり、
第2の条件は、人物の基準部位が群衆状態画像に納まり、かつ、前記基準部位のサイズが、所定サイズに対して定められた人物の基準部位のサイズと同程度であることである
付記8に記載の教師データ生成装置。
【0157】
(付記10)
画像上の群衆状態の認識対象箇所を示す矩形領域群を記憶する矩形領域群記憶手段と、
群衆状態を表した所定サイズの画像であって、前記所定サイズに対して定められた人物の基準部位のサイズと同程度のサイズで基準部位が表されている人物を含む画像である群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段と、
与えられた画像から、矩形領域群記憶手段に記憶される矩形領域群が示す領域をそれぞれ抽出し、前記辞書に基づいて、抽出した画像に写っている群衆の状態を認識する群衆状態認識手段とを備える
ことを特徴とする群衆状態認識装置。
【0158】
(付記11)
群衆状態認識辞書記憶手段は、所望の状態に制御された人物の状態に合致する人物の画像を合成することによって得られた群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆の状態を認識する
付記10に記載の群衆状態認識装置。
【0159】
(付記12)
矩形領域群記憶手段は、画像を取得する画像取得装置の位置、姿勢、焦点距離、レンズ歪みを示すカメラパラメータと、所定サイズに対して定められた人物の基準部位のサイズとに基づいて、サイズが定められた矩形領域群を記憶し、
群衆状態認識手段は、与えられた画像から、前記矩形領域群が示す領域をそれぞれ抽出する
付記10または付記11に記載の群衆状態認識装置。
【0160】
(付記13)
群衆状態認識辞書記憶手段は、群衆状態画像に表される人物の人数を変えて、人数毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆の人数を認識する
付記10から付記12のうちのいずれかに記載の群衆状態認識装置。
【0161】
(付記14)
群衆状態認識辞書記憶手段は、群衆状態画像に表される人物の方向を変えて、人物の方向毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆の方向を認識する
付記10から付記13のうちのいずれかに記載の群衆状態認識装置。
【0162】
(付記15)
群衆状態認識辞書記憶手段は、極端に混雑していない群衆と、極端に混雑した群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆が極端に混雑しているか否かを認識する
付記10から付記14のうちのいずれかに記載の群衆状態認識装置。
【0163】
(付記16)
群衆状態認識辞書記憶手段は、人物の方向が統一されている群衆と、人物の方向が統一されていない群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識手段は、前記辞書に基づいて、画像に写っている群衆内で人物の方向が統一されているか否かを認識する
付記10から付記15のうちのいずれかに記載の群衆状態認識装置。
【0164】
(付記17)
予め用意された複数の背景画像から背景画像を選択し、前記背景画像中の領域を抽出し、抽出した領域に該当する画像を、所定サイズの画像に拡大または縮小する背景抽出ステップと、
複数の人物に関係する人物の状態の指示情報である複数人物状態制御指示と、前記複数の人物中の個別の人物の状態の指示情報である個別人物状態制御指示とに従って、群衆の人物状態を決定する人物状態決定ステップと、
背景抽出ステップで得られた所定サイズの画像に対して、人物状態決定ステップで決定した人物状態に該当する人物の画像を合成した画像である群衆状態画像を生成し、当該群衆状態画像に対する教師ラベルを特定し、群衆状態画像および教師ラベルの組を出力する群衆状態画像合成ステップとを含むことを特徴とする教師データ生成方法。
【0165】
(付記18)
人物状態決定ステップで、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆の人物状態を仮決定し、仮決定した人物状態が、所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する条件を満たしている場合に、仮決定した人物状態を群衆の人物状態として決定し、仮決定した人物状態が前記条件を満たしていない場合に、再度群衆の人物状態を仮決定することを繰り返す
付記17に記載の教師データ生成方法。
【0166】
(付記19)
群衆状態制御指示記憶手段が、項目毎に定められた複数人物状態制御指示を記憶するとともに、前記項目毎に定められた教師ラベルの指定の有無を記憶し、
人物状態制御指示記憶手段が、項目毎に定められた個別人物状態制御指示を記憶するとともに、前記項目毎に定められた教師ラベルの指定の有無を記憶し、
人物状態決定ステップで、群衆状態制御指示記憶手段に記憶された複数人物状態制御指示および人物状態制御指示記憶手段に記憶された個別人物状態制御指示に従って、群衆の人物状態を決定し、
群衆状態画像合成ステップで、
教師ラベルの指定ありと定められた項目の複数人物状態制御指示を群衆状態制御指示記憶手段から読み込み、教師ラベルの指定ありと定められた項目の個別人物状態制御指示を人物状態制御指示記憶手段から読み込むことによって、教師ラベルを特定する
付記17または付記18に記載の教師データ生成方法。
【0167】
(付記20)
群衆状態制御指示記憶手段が、少なくとも1つの項目について、教師ラベルの指定をありとして記憶し、
群衆状態画像合成ステップで、
教師ラベルの指定ありと定められた項目の複数人物状態制御指示を群衆状態制御指示記憶手段から読み込む
付記19に記載の教師データ生成方法。
【0168】
(付記21)
群衆状態制御指示記憶手段が、人物の配置、人物の方向、および人数に関する項目毎に、複数人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する複数人物状態制御指示を、具体的な状態を指示する第1の態様、任意の状態に定めてよい旨を指示する第2の態様、定められたルールの範囲内で状態を定めてよいことを指示する第3の態様のいずれかの態様で記憶し、
人物状態制御指示記憶手段が、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆状態画像に合成するときの人物サイズに関する項目毎に、個別人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する個別人物状態制御指示を、前記第1の態様、前記第2の態様、前記第3の態様のいずれかの態様で記憶し、
人物状態決定ステップで、群衆状態制御指示記憶手段に記憶された複数人物状態制御指示および人物状態制御指示記憶手段に記憶された個別人物状態制御指示に従って、群衆の人物状態を決定する
付記19または付記20に記載の教師データ生成方法。
【0169】
(付記22)
群衆状態画像合成ステップで、人物の状態として決定された、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型に合致する人物画像を、予め用意された人物画像群の中から選択し、選択した人物画像の中から、人物の領域を切り出すことによって、人物部分のみの画像を生成し、人物の状態として決定された人物の配置、および群衆状態画像に合成するときの人物サイズに合わせて、前記人物部分のみを画像を、背景抽出手段によって得られた所定サイズの画像に対して合成する
付記17から付記21のうちのいずれかに記載の教師データ生成方法。
【0170】
(付記23)
群衆状態画像合成ステップで、カメラからより遠い配置位置に該当する人物部分のみの画像から順に、背景抽出手段によって得られた所定サイズの画像に対して合成する
付記22に記載の教師データ生成方法。
【0171】
(付記24)
人物状態決定ステップは、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆状態画像で背景となる群衆の人物状態を仮決定し、仮決定した人物状態が、群衆状態画像のサイズである所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する第1の条件を満たしている場合に、仮決定した人物状態を背景となる群衆の人物状態として決定し、仮決定した人物状態が前記第1の条件を満たしていない場合に、再度、背景となる群衆の人物状態を仮決定することを繰り返す背景人物状態決定ステップと、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆状態画像で前景となる群衆の人物状態を仮決定し、仮決定した人物状態が、群衆状態画像のサイズである所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する第2の条件を満たしている場合に、仮決定した人物状態を前景となる群衆の人物状態として決定し、仮決定した人物状態が前記第2の条件を満たしていない場合に、再度、前景となる群衆の人物状態を仮決定することを繰り返す前景人物状態決定ステップとを含む
付記17から付記23のうちのいずれかに記載の教師データ生成方法。
【0172】
(付記25)
第1の条件は、人物の基準部位が群衆状態画像に納まらない状態であること、あるいは、所定サイズに対して定められた人物の基準部位のサイズに対して、基準部位のサイズが極端に大きいか、または、極端に小さい状態であることのいずれかに該当することであり、
第2の条件は、人物の基準部位が群衆状態画像に納まり、かつ、前記基準部位のサイズが、所定サイズに対して定められた人物の基準部位のサイズと同程度であることである
付記24に記載の教師データ生成方法。
【0173】
(付記26)
矩形領域群記憶手段が、画像上の群衆状態の認識対象箇所を示す矩形領域群を記憶し、
群衆状態認識辞書記憶手段が、群衆状態を表した所定サイズの画像であって、前記所定サイズに対して定められた人物の基準部位のサイズと同程度のサイズで基準部位が表されている人物を含む画像である群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
与えられた画像から、矩形領域群記憶手段に記憶される矩形領域群が示す領域をそれぞれ抽出し、前記辞書に基づいて、抽出した画像に写っている群衆の状態を認識する群衆状態認識ステップを含む
ことを特徴とする群衆状態認識方法。
【0174】
(付記27)
群衆状態認識辞書記憶手段が、所望の状態に制御された人物の状態に合致する人物の画像を合成することによって得られた群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識ステップで、前記辞書に基づいて、画像に写っている群衆の状態を認識する
付記26に記載の群衆状態認識方法。
【0175】
(付記28)
矩形領域群記憶手段が、画像を取得する画像取得装置の位置、姿勢、焦点距離、レンズ歪みを示すカメラパラメータと、所定サイズに対して定められた人物の基準部位のサイズとに基づいて、サイズが定められた矩形領域群を記憶し、
群衆状態認識ステップで、与えられた画像から、前記矩形領域群が示す領域をそれぞれ抽出する
付記26または付記27に記載の群衆状態認識方法。
【0176】
(付記29)
群衆状態認識辞書記憶手段が、群衆状態画像に表される人物の人数を変えて、人数毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識ステップで、前記辞書に基づいて、画像に写っている群衆の人数を認識する
付記26から付記28のうちのいずれかに記載の群衆状態認識方法。
【0177】
(付記30)
群衆状態認識辞書記憶手段が、群衆状態画像に表される人物の方向を変えて、人物の方向毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識ステップで、前記辞書に基づいて、画像に写っている群衆の方向を認識する
付記26から付記29のうちのいずれかに記載の群衆状態認識方法。
【0178】
(付記31)
群衆状態認識辞書記憶手段が、極端に混雑していない群衆と、極端に混雑した群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識ステップで、前記辞書に基づいて、画像に写っている群衆が極端に混雑しているか否かを認識する
付記26から付記30のうちのいずれかに記載の群衆状態認識方法。
【0179】
(付記32)
群衆状態認識辞書記憶手段が、人物の方向が統一されている群衆と、人物の方向が統一されていない群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶し、
群衆状態認識ステップで、前記辞書に基づいて、画像に写っている群衆内で人物の方向が統一されているか否かを認識する
付記26から付記31のうちのいずれかに記載の群衆状態認識方法。
【0180】
(付記33)
コンピュータに、
予め用意された複数の背景画像から背景画像を選択し、前記背景画像中の領域を抽出し、抽出した領域に該当する画像を、所定サイズの画像に拡大または縮小する背景抽出処理、
複数の人物に関係する人物の状態の指示情報である複数人物状態制御指示と、前記複数の人物中の個別の人物の状態の指示情報である個別人物状態制御指示とに従って、群衆の人物状態を決定する人物状態決定処理、および、
背景抽出処理で得られた所定サイズの画像に対して、人物状態決定処理で決定した人物状態に該当する人物の画像を合成した画像である群衆状態画像を生成し、当該群衆状態画像に対する教師ラベルを特定し、群衆状態画像および教師ラベルの組を出力する群衆状態画像合成処理を実行させる
ための教師データ生成プログラム。
【0181】
(付記34)
コンピュータに、
人物状態決定処理で、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆の人物状態を仮決定させ、仮決定した人物状態が、所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する条件を満たしている場合に、仮決定した人物状態を群衆の人物状態として決定させ、仮決定した人物状態が前記条件を満たしていない場合に、再度群衆の人物状態を仮決定することを繰り返させる
付記33に記載の教師データ生成プログラム。
【0182】
(付記35)
項目毎に定められた複数人物状態制御指示を記憶するとともに、前記項目毎に定められた教師ラベルの指定の有無を記憶する群衆状態制御指示記憶手段と、項目毎に定められた個別人物状態制御指示を記憶するとともに、前記項目毎に定められた教師ラベルの指定の有無を記憶する人物状態制御指示記憶手段とを備えたコンピュータに、
人物状態決定処理で、群衆状態制御指示記憶手段に記憶された複数人物状態制御指示および人物状態制御指示記憶手段に記憶された個別人物状態制御指示に従って、群衆の人物状態を決定させ、
群衆状態画像合成処理で、
教師ラベルの指定ありと定められた項目の複数人物状態制御指示を群衆状態制御指示記憶手段から読み込み、教師ラベルの指定ありと定められた項目の個別人物状態制御指示を人物状態制御指示記憶手段から読み込むことによって、教師ラベルを特定させる
付記33または付記34に記載の教師データ生成プログラム。
【0183】
(付記36)
少なくとも1つの項目について、教師ラベルの指定をありとして記憶する群衆状態制御指示記憶手段を備えたコンピュータに、
群衆状態画像合成処理で、
教師ラベルの指定ありと定められた項目の複数人物状態制御指示を群衆状態制御指示記憶手段から読み込ませる
付記35に記載の教師データ生成プログラム。
【0184】
(付記37)
人物の配置、人物の方向、および人数に関する項目毎に、複数人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する複数人物状態制御指示を、具体的な状態を指示する第1の態様、任意の状態に定めてよい旨を指示する第2の態様、定められたルールの範囲内で状態を定めてよいことを指示する第3の態様のいずれかの態様で記憶する群衆状態制御指示記憶手段と、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型、群衆状態画像に合成するときの人物サイズに関する項目毎に、個別人物状態制御指示および教師ラベルの指定の有無を記憶するとともに、各項目に対応する個別人物状態制御指示を、前記第1の態様、前記第2の態様、前記第3の態様のいずれかの態様で記憶する人物状態制御指示記憶手段とを備えたコンピュータに、
人物状態決定処理で、群衆状態制御指示記憶手段に記憶された複数人物状態制御指示および人物状態制御指示記憶手段に記憶された個別人物状態制御指示に従って、群衆の人物状態を決定させる
付記35または付記36に記載の教師データ生成プログラム。
【0185】
(付記38)
コンピュータに、
群衆状態画像合成処理で、人物の状態として決定された、人物の方向、人数、人物の撮影角度、人物への照明、人物の姿勢、人物の服装、人物の体型、人物の髪型に合致する人物画像を、予め用意された人物画像群の中から選択させ、選択した人物画像の中から、人物の領域を切り出すことによって、人物部分のみの画像を生成させ、人物の状態として決定された人物の配置、および群衆状態画像に合成するときの人物サイズに合わせて、前記人物部分のみを画像を、背景抽出処理によって得られた所定サイズの画像に対して合成させる
付記33から付記37のうちのいずれかに記載の教師データ生成プログラム。
【0186】
(付記39)
コンピュータに、
群衆状態画像合成処理で、カメラからより遠い配置位置に該当する人物部分のみの画像から順に、背景抽出処理で得られた所定サイズの画像に対して合成させる
付記38に記載の教師データ生成プログラム。
【0187】
(付記40)
コンピュータに、
人物状態決定処理で、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆状態画像で背景となる群衆の人物状態を仮決定し、仮決定した人物状態が、群衆状態画像のサイズである所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する第1の条件を満たしている場合に、仮決定した人物状態を背景となる群衆の人物状態として決定し、仮決定した人物状態が前記第1の条件を満たしていない場合に、再度、背景となる群衆の人物状態を仮決定することを繰り返す背景人物状態決定処理、および、
複数人物状態制御指示と個別人物状態制御指示とに従って、群衆状態画像で前景となる群衆の人物状態を仮決定し、仮決定した人物状態が、群衆状態画像のサイズである所定サイズに対して定められた人物の基準部位のサイズおよび前記基準部位の表れ方に関する第2の条件を満たしている場合に、仮決定した人物状態を前景となる群衆の人物状態として決定し、仮決定した人物状態が前記第2の条件を満たしていない場合に、再度、前景となる群衆の人物状態を仮決定することを繰り返す前景人物状態決定処理
を実行させる付記33から付記39のうちのいずれかに記載の教師データ生成プログラム。
【0188】
(付記41)
第1の条件は、人物の基準部位が群衆状態画像に納まらない状態であること、あるいは、所定サイズに対して定められた人物の基準部位のサイズに対して、基準部位のサイズが極端に大きいか、または、極端に小さい状態であることのいずれかに該当することであり、
第2の条件は、人物の基準部位が群衆状態画像に納まり、かつ、前記基準部位のサイズが、所定サイズに対して定められた人物の基準部位のサイズと同程度であることである
付記40に記載の教師データ生成プログラム。
【0189】
(付記42)
画像上の群衆状態の認識対象箇所を示す矩形領域群を記憶する矩形領域群記憶手段と、群衆状態を表した所定サイズの画像であって、前記所定サイズに対して定められた人物の基準部位のサイズと同程度のサイズで基準部位が表されている人物を含む画像である群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段とを備えたコンピュータに、
与えられた画像から、矩形領域群記憶手段に記憶される矩形領域群が示す領域をそれぞれ抽出し、前記辞書に基づいて、抽出した画像に写っている群衆の状態を認識する群衆状態認識処理を実行させる
ための群衆状態認識プログラム。
【0190】
(付記43)
所望の状態に制御された人物の状態に合致する人物の画像を合成することによって得られた群衆状態画像と、当該群衆状態画像に対する教師ラベルとの組を複数組用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段を備えたコンピュータに、
群衆状態認識処理で、前記辞書に基づいて、画像に写っている群衆の状態を認識させる
付記42に記載の群衆状態認識プログラム。
【0191】
(付記44)
画像を取得する画像取得装置の位置、姿勢、焦点距離、レンズ歪みを示すカメラパラメータと、所定サイズに対して定められた人物の基準部位のサイズとに基づいて、サイズが定められた矩形領域群を記憶する矩形領域群記憶手段を備えたコンピュータに、
群衆状態認識処理で、与えられた画像から、前記矩形領域群が示す領域をそれぞれ抽出させる
付記42または付記43に記載の群衆状態認識プログラム。
【0192】
(付記45)
群衆状態画像に表される人物の人数を変えて、人数毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段を備えたコンピュータに、
群衆状態認識処理で、前記辞書に基づいて、画像に写っている群衆の人数を認識させる
付記42から付記44のうちのいずれかに記載の群衆状態認識プログラム。
【0193】
(付記46)
群衆状態画像に表される人物の方向を変えて、人物の方向毎に複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段を備えたコンピュータに、
群衆状態認識処理で、前記辞書に基づいて、画像に写っている群衆の方向を認識させる
付記42から付記45のうちのいずれかに記載の群衆状態認識プログラム。
【0194】
(付記47)
極端に混雑していない群衆と、極端に混雑した群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段を備えたコンピュータに、
群衆状態認識処理で、前記辞書に基づいて、画像に写っている群衆が極端に混雑しているか否かを認識させる
付記42から付記46のうちのいずれかに記載の群衆状態認識プログラム。
【0195】
(付記48)
人物の方向が統一されている群衆と、人物の方向が統一されていない群衆とについてそれぞれ複数組用意された群衆状態画像と教師ラベルとの組を用いて機械学習を行うことによって得られた識別器の辞書を記憶する群衆状態認識辞書記憶手段を備えたコンピュータに、
群衆状態認識処理で、前記辞書に基づいて、画像に写っている群衆内で人物の方向が統一されているか否かを認識させる
付記42から付記47のうちのいずれかに記載の群衆状態認識プログラム。
【0196】
以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
【0197】
この出願は、2013年6月28日に出願された日本特許出願2013−135915を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【0198】
本発明は、群衆状態の認識に用いる識別器の辞書を学習する際の教師データを生成する教師データ生成装置に好適に適用可能である。
【0199】
本発明は、画像内の群衆状態を認識する群衆状態認識装置に好適に適用される。特に、静止画像や、フレームレートの低い画像内の群衆状態の認識に好適に利用できる。また、フレームレートが安定せず、時間情報を用いた群衆状態認識処理を行えない場合にも、好適に利用できる。また、人物同士の重なりを含む複雑な群衆状態を静止画像から認識する処理に好適に利用できる。また、本発明は、カメラによって得られた画像から群衆状態を認識する監視分野において、不審者認識、不審物の置き去り認識、ゲートの共連れ認識、異常状態認識、異常行動認識等にも利用可能である。さらに、画像内の群衆状態の認識結果を、群衆の位置(2次元位置あるいは3次元位置)とともに、他のシステムに出力する用途に利用してもよい。また、画像内の群衆状態の認識結果と、群衆の位置(2次元位置あるいは3次元位置)とを取得し、その取得をトリガとして、映像検索を行う用途に利用することもできる。