【文献】
松尾 賢治,異シードグラフカットによる拡大領域の重複現象を利用した多領域画像分割,電子情報通信学会論文誌 D,日本,社団法人 電子情報通信学会,2011年 8月 1日,Vol.J94-D No.8,P.1473-1485
【文献】
永橋 知行,平滑化処理の繰返しによるグラフカットを用いた画像セグメンテーション,情報処理学会論文誌 コンピュータビジョンとイメージメディア,日本,社団法人 情報処理学会,2008年11月15日,Vol.1 No.2,P.10-20
【文献】
柴 涼介,分割画像のグラフカットに基づく高速かつ省メモリな画像前景抽出,電子情報通信学会論文誌 D,日本,社団法人 電子情報通信学会,2012年 3月 1日,Vol.J95-D No.3,P.628-637
(58)【調査した分野】(Int.Cl.,DB名)
所定の対象物を背景と共に撮像した画像において、それぞれが少なくとも1つの画素からなる素領域ごとに当該素領域を対象物領域と背景領域とのいずれかに帰属させることにより、前記画像を領域分割する領域分割装置であって、
前記素領域それぞれに対して当該素領域が帰属する帰属領域と複数種類の画像特徴のうち当該素領域を評価するための一部の種類の評価対象特徴とを仮決めした試行設定において、前記素領域それぞれの前記評価対象特徴が前記試行設定にて仮決めされた帰属領域に帰属することの尤もらしさの程度を表す帰属度を前記画像内にて総和して積算評価値を算出する評価値算出部と、
複数通りの前記試行設定を設定し、前記評価値算出部により算出される前記各試行設定における前記積算評価値を比較し、前記画像全体での前記尤もらしさを最大化する前記試行設定における帰属領域を領域分割結果と決定する領域分割決定部と、
を備えたことを特徴とする領域分割装置。
前記領域分割決定部は、前記帰属領域を前記対象物領域とする前記素領域に対して前記評価対象特徴を第1の種類の前記画像特徴とし、且つ前記帰属領域を前記背景領域とする前記素領域に対して前記評価対象特徴を前記第1の種類とは異なる第2の種類の前記画像特徴とする前記試行設定を設定して前記積算評価値の前記比較を行うこと、を特徴とする請求項1に記載の領域分割装置。
【発明を実施するための形態】
【0021】
以下、本発明の領域分割装置を含んだ好適な実施の形態(以下実施形態という)の一例として、領域分割装置により監視画像上の人物領域を抽出し、人物領域の形状に基づく人物姿勢の推定により異常の発生を監視する画像監視装置1について、図面に基づいて説明する。本発明の領域分割装置は、領域分割部41として画像監視装置1に具備され、監視画像を注目人物が写っている人物領域とそれ以外の背景領域に分割する。
【0022】
[画像監視装置1の構成]
図1は画像監視装置1の概略の構成を示したブロック図である。画像監視装置1は撮像部2、記憶部3及び出力部5が制御部4に接続されてなる。
【0023】
撮像部2は監視カメラである。撮像部2は監視空間を移動する人物を撮像するために監視空間を臨むように設置され、監視空間を所定の時間間隔で撮影する。撮影された監視空間の監視画像は順次、制御部4へ出力される。本実施形態においては、人物の位置を3次元座標で特定するために、2つの撮像部2−1,2−2が共通視野を有して設置される。これらの撮像部2のカメラパラメータは、予めのキャリブレーションにより計測して記憶部3に記憶させておく。
【0024】
記憶部3は、ROM(Read Only Memory)、RAM(Random Access Memory)等の記憶装置である。記憶部3は、各種プログラムや各種データを記憶し、制御部4との間でこれらの情報を入出力する。
【0025】
各種データには、追跡情報30、人物形状モデル31、グラフ情報32及びカメラパラメータ(不図示)が含まれる。
【0026】
追跡情報30は人物を追跡した結果である人物位置、人物の追跡のために生成され当該人物を特徴づける人物テンプレートなどのデータである。人物ごとの人物IDに対応付けられて当該人物の人物位置及び人物テンプレートなどが記憶される。監視空間を模した3次元座標系における人物の頭部中心の座標が当該人物の人物位置として記憶される。
【0027】
人物形状モデル31は人物の形状を模した形状データである。本実施形態では、立位の人物の頭部、胴部及び脚部の3部分それぞれを鉛直軸を回転軸とする回転楕円体で近似し、これらを上から順に鉛直方向に整列した立体形状データを予め作成して記憶させておく。
【0028】
後述する領域分割部41は、監視画像に対して
図2に示すようなグラフを生成し、当該グラフを最小のエネルギーで人物領域と背景領域とに2分割する切断をα拡張(α-expansion)法を適用したグラフカット(Graph Cut)法により導出することで監視画像から人物領域を抽出する。
【0029】
図2に示すグラフにおいて、水平面の斜視図が画素の集合である画像を模式的に表している。領域分割部41は、例えば人物領域及び背景領域の最小単位(素領域)として1つ1つの画素をノードに設定すると共に人物領域側及び背景領域側の仮想のターミナルとしてソースS及びシンクTを設定する。また各隣接ノード間のリンク(n−link)を設定し、各ノードとソースとの間及び各ノードとシンクとの間にもリンク(t−link)を設定する。さらに各リンクに当該リンクの結合度を設定する。こうして領域分割部41は監視画像に対するグラフを生成する。本発明では特にソースとして色特徴量に関するソース(色ソースS
C)と色特徴量に関するソース(形状ソースS
S)の2種類を設ける。結合度は領域分割のために行うリンクの切断に要するコストとしてエネルギーに計上される。以下、結合度の値をコストと称する。
【0030】
領域分割部41は各n−linkに、領域分割に伴い当該n−linkを切断するときのエッジコストを設定する。また、各ノードと色ソースS
Cとの間のt−linkには当該t−linkを切断して当該ノードを背景領域に帰属させるときの色特徴量に係るコスト(背景帰属時色コスト)を設定し、各ノードと形状ソースS
Sとの間のt−linkには当該t−linkを切断して当該ノードを背景領域に帰属させるときの形状特徴量に係るコスト(背景帰属時形状コスト)を設定し、各ノードとシンクTとの間のt−linkには当該t−linkを切断して当該ノードを対象物領域に帰属させるときの色特徴量に係るコスト(対象物帰属時色コスト)と当該ノードを対象物領域に帰属させるときの形状特徴量に係るコスト(対象物帰属時形状コスト)を設定する。各コストは分割が正しくないときに高くなる値であるため、監視画像を人物領域側のノードと背景領域側のノードとに2分割する際に切断されるリンクのコストの総和が領域分割のエネルギーとして定義され、エネルギーを最小化する切断がα拡張法を適用したグラフカット法により導出される。エネルギーを最小化する切断を導出することは帰属の尤もらしさを最大化する領域分割を導出することと等価である。
【0031】
グラフ情報32は領域分割のエネルギーの基礎となるコストのデータである。隣接画素{p(x
p,y
p),q(x
q,y
q)}の組み合わせごとのエッジコストc
E(p,q)が記憶されると共に、画素p(x
p,y
p)ごとに、色ソースS
Cとの間の背景帰属時色コストα
C・c
C(p,S
C)、形状ソースS
Sとの間の背景帰属時形状コストα
S・c
S(p,S
S)、シンクTとの間の対象物帰属時色コストα
C・c
C(p,T)及びシンクTとの間の対象物帰属時形状コストα
S・c
S(p,T)が記憶される。
【0032】
ここで、α
Cは領域分割のエネルギーに対する色特徴量のエネルギー(色エネルギー)の寄与度合いと、α
Sは領域分割のエネルギーに対する形状特徴量のエネルギー(形状エネルギー)の寄与度合いの比率(特徴比率)である。α
C,α
Sには0より大きな値を設定する。
【0033】
制御部4は、CPU(Central Processing Unit)、DSP(Digital Signal Processor)、MCU(Micro Control Unit)等の演算装置を用いて構成され、記憶部3からプログラムを読み出して実行することで人物追跡部40、領域分割部41、異常姿勢判定部42等として機能する。
【0034】
人物追跡部40は撮像部2からの監視画像を処理して、監視画像上に写っている各人物の人物位置を追跡し、当該監視画像、当該人物位置、当該人物に付与した人物ID及び当該監視画像を撮像した撮像部2に予め付与されたカメラIDを領域分割部41に出力する。
【0035】
領域分割部41は人物追跡部40から監視画像及び各人物の人物位置を入力されると、当該監視画像を当該人物が写っている人物領域(対象物領域)とそれ以外の背景領域とに領域分割し、領域分割結果を異常姿勢判定部42に出力する。
【0036】
領域分割部41は、初期領域設定部410、分割コスト算出部411、エネルギー算出部412及び領域決定部413から構成される。
【0037】
以下、領域分割部41を構成する各部について説明する。
【0038】
初期領域設定部410は、人物領域の初期値として監視画像上に人物領域の概略位置と概略形状とを有した初期領域を設定し、初期領域の情報を分割コスト算出部411に出力する。初期領域は領域分割の手がかりとなる。
【0039】
具体的には初期領域設定部410は、人物追跡部40から入力された各人物の人物位置及び人物形状モデル31を参照し、人物位置を基準にして人物形状モデル31を監視画像上に配置することにより初期領域を設定する。そのために初期領域設定部410は、監視空間を模した仮想空間中の人物位置に人物形状モデル31を配置し、配置した人物形状モデル31をカメラパラメータを用いた座標変換により監視画像に投影し、投影した領域を初期領域に設定する。初期領域は人物ごとに設定され、さらに当該人物を複数の撮像部2により撮像している場合は各撮像部2が撮像した監視画像ごとに設定される。撮像部2とカメラパラメータと監視画像との対応関係はカメラIDにより特定される。
【0040】
図3は初期領域設定部410による処理を説明する模式図である。
図3(a)は人物101が写った監視画像100である。初期領域設定部410には当該監視画像100と、当該人物101を追跡して得た仮想空間110におけるXYZ座標系の人物位置112が入力される。入力される人物位置112は頭部中心座標で代表されている。
図3(b)は人物モデル113から初期領域121を生成する処理を説明する仮想空間110の模式的な斜視図であり、
図3(c)はその処理結果を示す模式図である。初期領域設定部410は、人物モデル113を、その頭部中心を人物位置112に合わせ、その下端を床面111に接地させて仮想空間110に配置し、カメラパラメータを用いて人物モデル113を撮像部2(カメラ114)の撮像面115のxy座標系に投影する。これにより監視画像100と同じxy座標系の投影画像120に人物モデル113を投影した初期領域121が算出される。
【0041】
領域分割部41は、互いに種類が異なる複数種類の画像特徴を用いて領域分割を行う。例えば領域分割部41は対象物及び背景の色特徴と対象物の形状特徴とを領域分割に用いる。複数種類の画像特徴を用いる。そして例えば対象物と背景との色特徴が似ており色特徴による領域分割の精度が低下する対象物の部位では形状特徴を利用し、周辺に背景のエッジが多くて形状特徴による領域分割の精度が低下する対象物の部位では色特徴を利用するといったように、ノードごとに当該ノードの帰属の尤もらしさを評価するために最良の1種類の画像特徴(評価対象特徴)を選択することで、単独の画像特徴を用いた場合よりも高精度な領域分割を行う。このとき対象物と背景との間の関係は多様であり、予めノードと評価対象特徴との最良の関係を設定するのは難しい。そこで領域分割部41は、ノードと評価対象特徴との最良の関係を監視画像ごとに動的に設定して領域分割結果を求める。
【0042】
本実施形態において領域分割部41は、積算評価値として下記式(1)で定義されるエネルギーEを計算する。エネルギーEは色エネルギーE
C、形状エネルギーE
S及びエッジエネルギーE
Eの線形和で定義される。領域分割部41は当該エネルギーEを最小化する領域分割結果をα拡張法を適用したグラフカット法により導出する。
【0044】
ここで、Aは各ノードがそれぞれ対象物領域と背景領域とのいずれに帰属するか、つまり各ノードがいずれの領域を帰属領域とするかを設定したラベル行列である。また、iは評価対象特徴であり、Cは色特徴、Sは形状特徴に対応するラベルである。
【0045】
すなわち式(1)の右辺第1項は、評価対象特徴が色特徴である背景画素pの背景帰属時色コストα
C・c
C(p,S
C)と、評価対象特徴が形状特徴である背景画素pの背景帰属時形状コストα
S・c
S(p,S
S)と、評価対象特徴が色特徴である人物画素pの対象物帰属時色コストα
C・c
C(p,T)と、評価対象特徴が形状特徴である人物画素pの対象物帰属時形状コストα
S・c
S(p,T)の和を表す。
【0046】
また式(1)の右辺第2項は、領域分割により切断されたn−linkすなわち人物画素と背景画素との境界に設定されたエッジコストc
E(p,q)の和を表す。
【0047】
分割コスト算出部411は、初期領域を基準にして、監視画像の各画素に対し、当該画素の画像特徴が対象物領域及び背景領域それぞれに帰属することの尤もらしくなさ、すなわち尤もらしさの程度の低さを表すコスト値を画像特徴ごとに算出する。
【0048】
具体的には分割コスト算出部411は、初期領域内外の色を基準に、監視画像から対象物の色特徴量(対象物色特徴)及び背景の色特徴量(背景色特徴)を抽出する。そして、対象物色特徴と各画素とを比較して当該画素が対象物領域に帰属することの尤もらしくなさを表す対象物帰属時色コストc
C(p,T)を算出し、これにα
Cを乗じたα
C・c
C(p,T)を記憶部3のグラフ情報32に記憶させる。また、背景色特徴と各画素の色特徴とを比較して当該画素が背景領域に帰属することの尤もらしくなさを表す背景帰属時色コストを算出し、これにα
Cを乗じたα
C・c
C(p,S
C)を記憶部3のグラフ情報32に記憶させる。
【0049】
さらに分割コスト算出部411は、初期領域の形状を基準に各画素の位置が対象物領域内である確率と背景領域内である確率とを設定する。そして分割コスト算出部411は各画素の位置が対象物領域内である確率に基づいて当該画素が対象物領域に帰属することの尤もらしくなさを表す対象物帰属時形状コストc
S(p,T)を算出し、これにα
Sを乗じたα
S・c
S(p,T)を記憶部3のグラフ情報32に記憶させる。また分割コスト算出部411は、各画素の位置が背景領域内である確率に基づいて当該画素が背景領域に帰属することの尤もらしくなさを表す背景帰属時形状コストを算出し、これにα
Sを乗じたα
S・c
S(p,S
S)を記憶部3のグラフ情報32に記憶させる。
【0050】
また分割コスト算出部411は各隣接画素間に対してその輝度差に応じたエッジコストc
E(p,q)を算出して記憶部3のグラフ情報32に記憶させる。
【0051】
以下、エッジコストc
E(p,q)の算出について説明する。
【0052】
分割コスト算出部411は、画素pとその隣接画素qの間に設定したn−linkそれぞれに対して次式で表されるエッジコストc
E(p,q)を算出する。
【0054】
ここで、Ipは画素pの画素値、Iqは隣接画素qの画素値、dist(p,q)は画素pの位置と隣接画素qの位置との間の距離を表す。βは調整用の定数であり、事前実験等を通じて適切な値が予め設定される。すなわち分割コスト算出部411は各隣接画素間に対して、互いの画素値が相違するほど小さく、互いの画素値が類似するほど大きなエッジコストc
E(p,q)を設定する。
【0055】
以下、対象物シードの設定と対象物帰属時色コストc
C(p,T)の算出について説明する。
【0056】
分割コスト算出部411は、監視画像における初期領域の内側の画素値から対象物の色特徴の基準とする対象物色特徴を抽出する。対象物領域を高精度に抽出するには、対象物色特徴は、対象物の一部である可能性が十分に高く、対象物を構成する色を網羅していることが望ましい。そこで、分割コスト算出部411は、初期領域の中心軸上の画素群を対象物シードと定め、当該対象物シードの画素値の正規化色ヒストグラムh
Oを対象物色特徴として抽出する。
【0057】
図4には
図3の初期領域121の中心軸上に設定した対象物シード200を例示している。対象物シード200は対象物領域か背景物領域かが曖昧な初期領域121の輪郭付近を含まないように設定されている。
【0058】
分割コスト算出部411は、以下に示す式(3)及び式(4)に従い対象物帰属時色コストc
C(p,T)を算出する。
【0061】
ここで、Ipは画素pの画素値、h
Oは対象物シードの正規化色ヒストグラムであり、h
O(Ip)は画素値Ipが対象物の色である確率を表す。L
C(p|оbj)の値は画素pの色が対象物の色である確率が高いほど小さく、同確率が低いほど大きくなる。K(>1)は大きなコスト値を表す定数であり、十分に大きな値が予め設定される。
【0062】
このように分割コスト算出部411は、各画素pとシンクTとの間に、当該画素pの色が対象物らしいほど低く、当該画素pの色が対象物らしくないほど高い対象物帰属時色コストc
C(p,T)を設定する。
【0063】
以下、背景シードの設定と背景帰属時色コストc
C(p,S
C)の算出について説明する。
【0064】
分割コスト算出部411は、監視画像における初期領域の外側の画素値から背景の色特徴の基準とする背景色特徴を抽出する。対象物領域を高精度に抽出するには、背景シードは、背景の一部である可能性が十分に高く、対象物との境界に存在する背景の色を網羅していることが望ましい。そこで、分割コスト算出部411は、初期領域を所定距離だけ離れて囲む外周部の画素群を背景シードと定め、当該背景シードの画素値の正規化色ヒストグラムh
Bを背景色特徴として抽出する。具体的には、分割コスト算出部411は、初期領域を所定回数だけ膨張して膨張領域の周囲画素を背景シードと定める。膨張回数は初期領域の近似誤差より大きく定めることができ、例えば10回程度とすることができる。また、α拡張法を適用したグラフカット法を用いる本実施形態では、2段階でグラフカット法を実行する。この第1段階において色特徴により抽出できなかった対象物画素を第2段階で抽出するために分割コスト算出部411は第1段階にて得られた対象物画素を第2段階の背景シードに加える。
【0065】
図4には初期領域121の輪郭から10画素だけ離れた外周部に設定した背景シード201を例示している。背景シード201は対象物領域か背景物領域かが曖昧な初期領域121の輪郭付近を含まないように設定されている。
【0066】
分割コスト算出部411は、以下に示す式(5)及び式(6)に従い背景帰属時色コストc
C(p,S
C)を算出する。
【0069】
ここで、h
Bは背景シードの正規化色ヒストグラムであり、h
B(Ip)は画素値Ipが背景領域の色である確率を表す。K,Ipは上述の通りである。L
C(p|bkg)の値は画素pの色が背景の色である確率が高いほど小さく、同確率が低いほど大きくなる。
【0070】
このように分割コスト算出部411は、各画素pと色ソースS
Cとの間に、当該画素pの色が背景らしいほど低く、当該画素pの色が背景らしくないほど高い背景帰属時色コストc
C(p,S
C)を設定する。
【0071】
以下、対象物帰属時形状コストc
S(p,T)の算出について説明する。
【0072】
分割コスト算出部411は、初期領域の位置及び形状に基づいて各画素位置における対象物画素の存在確率ρ
Oを設定する。具体的には分割コスト算出部411は、対象物画素の存在確率ρ
Oとして初期領域の外側の画素に0、初期領域の内側で初期領域の輪郭からの距離が遠い画素ほど1に近づく値を設定する。対象物画素の存在確率ρ
Oの例を
図4に示す。
図4に示す存在確率ρ
Oのグラフの横軸は、
図4の上部に示す初期領域121を含む画像にて一点鎖線で示すx軸方向の直線に沿った位置を画素数で表しており、縦軸がρ
Oである。この例ではρ
Oは対象物シード200で最大値である1となり、初期領域121の輪郭での値0へ向けて直線的に減少し、当該輪郭より外側では0となる。
【0073】
分割コスト算出部411は、以下に示す式(7)及び式(8)に従いρ
Oを基にした対象物帰属時形状コストc
S(p,T)を算出する。
【0076】
ここで、ρ
O(p)は画像中において画素pの位置が対象物領域内である確率を表す。Kは上述の通りである。L
S(p|оbj)の値は画素pの位置が対象物領域内である確率が高いほど小さく、同確率が低いほど大きくなる。
【0077】
すなわち、分割コスト算出部411は、各画素pとシンクTとの間に、当該画素pの位置が対象物らしいほど低く、当該画素pの位置が対象物らしくないほど高い対象物帰属時形状コストc
S(p,T)を設定する。
【0078】
以下、背景帰属時形状コストc
S(p,S
S)の算出について説明する。
【0079】
分割コスト算出部411は、初期領域の位置及び形状に基づいて各画素位置における背景画素の存在確率ρ
Bを設定する。具体的には分割コスト算出部411は、背景画素の存在確率ρ
Bとして背景シード201の内側の画素に0、背景シード201の外側で背景シード201からの距離が遠い画素ほど1に近づく値を設定する。背景画素の存在確率ρ
Bの例を
図4に示す。
図4に示す存在確率ρ
Bのグラフの横軸は、
図4の上部に示す初期領域121を含む画像にて一点鎖線で示すx軸方向の直線に沿った位置を画素数で表しており、縦軸がρ
Bである。この例ではρ
Bは背景シード201から外側へ向けて直線的に増加する。
【0080】
分割コスト算出部411は、以下に示す式(9)及び式(10)に従いρ
Bを基にした背景帰属時形状コストc
S(p,S
S)を算出する。
【0083】
ここで、ρ
B(p)は画像中において画素pの位置が背景領域内である確率を表す。Kは上述の通りである。L
S(p|bkg)の値は画素pの位置が背景領域内である確率が高いほど小さく、同確率が低いほど大きくなる。
【0084】
このように分割コスト算出部411は、各画素pとソースSとの間に、当該画素pの位置が背景らしいほど低く、当該画素pの位置が背景らしくないほど高い背景帰属時形状コストc
S(p,S
S)を設定する。
【0085】
なお、
図4では対象物画素の存在確率ρ
Oと背景画素の存在確率ρ
Bの値を初期領域121と背景シード201とに挟まれる周囲にて共に0とする例を示したが、
図5のように初期領域121の境界の外側及び内側にρ
O及びρ
Bが0より大きな値となる範囲を設定してもよい。
【0086】
このように分割コスト算出部411が各コストを設定することにより監視画像を領域分割するためのグラフが完成する。
【0087】
エネルギー算出部412(評価値算出部)は、各画素の帰属領域及び各画素の評価対象特徴を仮決めした試行設定において各画素の設定と対応するコストを当該画素の帰属度として記憶部3から読み出し、これらを画像内にて総和して当該試行設定が表す領域分割のエネルギー(積算評価値)を算出する。具体的にはエネルギー算出部412は式(1)に従いエネルギーEを算出する。
【0088】
試行設定は複数通り生成され、その生成は領域決定部413(領域分割決定部)が行う。つまり、エネルギー算出部412がエネルギーEを計算する際の式(1)における帰属領域設定A及び評価対象特徴の種別iは領域決定部413により都度仮決めされる。領域決定部413は複数通りの試行設定におけるエネルギーEを比較し、エネルギーEが最小となる試行設定における帰属領域設定を検出することで、各画素の評価対象特徴が当該画素の帰属領域に帰属することの尤もらしさが画像全体として最大となる試行設定を検出し、検出した試行設定における帰属領域を領域分割結果と決定する。領域決定部413は、決定した領域分割結果を異常姿勢判定部42に出力する。
【0089】
このように領域決定部413は、試行設定を変動させながら当該試行設定をエネルギー算出部412に入力してエネルギーを算出させる処理を繰り返して、エネルギーが最小となる試行設定を探索することにより、各画素の評価対象特徴と当該画素の帰属領域との尤もらしさが画像全体として最大となる領域分割結果を導出する。
【0090】
こうすることで監視画像ごとに各素領域を評価するための評価対象特徴を適応的に選択した領域分割が可能となる。これにより対象物の各部位にてそれぞれに精度低下しにくい画像特徴を選択できるので、対象物と背景との関係の多様性に適応した高精度な領域分割を行うことができる。
【0091】
エネルギーが最小となる帰属領域及び評価対象特徴はα拡張法を適用したグラフカット法により効率的に決定することができる。処理の詳細は動作の説明にて後述する。
【0092】
異常姿勢判定部42は、領域分割部41が抽出した各人物の人物領域の形状が異常事態の発生を示す異常姿勢であるか否かを判定し、人物領域のいずれかが異常姿勢と判定された場合に所定の異常信号を出力部5に出力する。具体的には、異常姿勢判定部42は各人物領域の形状と予め登録してある異常姿勢パターンとの類似度を算出して予め設定したしきい値と比較し、しきい値以上の類似度が算出された人物領域を異常姿勢であると判定し、そうでなければ異常姿勢でないと判定する。例えば、両手を挙げた姿勢の形状パターンを強盗事件の発生を示す異常姿勢パターンとして予め登録しておくことができる。
【0093】
出力部5は異常姿勢判定部42から異常信号が入力されると当該異常信号を外部に出力する外部出力装置である。例えば、出力部5は、電話網あるいはインターネットなどの広域網を介して警備センターと接続された通信回路で構成され、警備センターに異常信号を送信することによって異常事態の発生を通報する。
【0094】
[画像監視装置1の動作]
図6は画像監視装置1の監視動作の概略を示すフロー図である。
図6を参照して画像監視装置1の動作を説明する。監視空間が無人であることを確認した管理者が装置に電源を投入すると、各部、各手段が初期化され動作を開始する(S1)。初期化の後は、撮像部2から制御部4へ新たな監視画像が入力されるたびに、ステップS2〜S7の処理がループ処理として繰り返される。
【0095】
新たな監視画像が入力されると制御部4の人物追跡部40は、監視画像上の人物を追跡して監視画像上での当該人物の位置を特定する(S2)。人物追跡部40は新たな監視画像にて特定した人物位置を人物ID及びカメラIDと対応付けて記憶部3の追跡情報30に記憶させる。
【0096】
制御部4は、新たな監視画像上に人物が存在しているか否か、すなわち追跡情報30に新たな監視画像にて特定した人物位置が記憶されているか否かを確認する(S3)。人物が存在しなければ(ステップS3にてNO)、制御部4は以降の処理をスキップして処理をステップS1へ戻す。
【0097】
人物が存在していれば(ステップS3にてYES)、制御部4は新たな監視画像から得た追跡情報30を領域分割部41に入力し、領域分割部41は各人物の人物領域を抽出する(S4)。
【0098】
図7は人物領域抽出処理の概略のフロー図である。以下、
図7を参照してステップS4の人物領域抽出処理を説明する。
【0099】
α拡張法を適用したグラフカット法では、複数のソースを有するグラフを、複数のソースのうちの1つとシンクで構成されるグラフに分けて段階的にエネルギーの最小化を行う。この際に、ソース側のt−linkとシンク側のt−linkには異なる種類のコストを設定する。
【0100】
本実施形態では、
図2に示したグラフを、
図8に示す2つのグラフ400,401に分けてエネルギーの最小化を行う。
図9はα拡張法による人物領域抽出処理での画素の帰属領域及び評価対象特徴の一例を説明する画像の模式図を示している。
【0102】
まず、領域分割部41の初期領域設定部410は、記憶部3から人物形状モデル31と、監視画像に対応するカメラIDのカメラパラメータとを読みだし、各人物の人物位置を基準にして仮想空間中に人物形状モデル31を配置し、配置した人物形状モデル31をカメラパラメータにより監視画像上に投影して各人物の初期領域を設定する(S100)。
【0103】
次に、領域分割部41の分割コスト算出部411は、各人物の初期領域からの距離に応じて各画素における対象物画素の存在確率ρ
Oと背景画素の存在確率ρ
Bをそれぞれ対象物形状特徴、背景形状特徴として算出する(S101)。
【0104】
続いて、分割コスト算出部411は式(2)に従って隣接画素の組み合わせごとのエッジコストc
E(p,q)を算出してグラフ情報32に記憶させる(S102)。
【0105】
また、分割コスト算出部411は各人物の背景シードを設定して(S103)、人物ごとに背景シードに対する各画素の背景帰属時色コストを算出する(S104)。すなわち、分割コスト算出部411は各人物の初期領域の周辺部から正規化色ヒストグラムh
Bを背景色特徴として抽出し、人物ごとに式(5)及び式(6)に従って画素ごとの背景帰属時色コストα
C・c
C(p,S
C)を算出してグラフ情報32に記憶させる。
【0106】
さらに、分割コスト算出部411はステップS101にて算出した人物ごとの対象物画素の存在確率ρ
Oそれぞれを用い、式(7)及び式(8)に従って画素ごとの対象物帰属時形状コストα
S・c
S(p,T)を算出してグラフ情報32に記憶させる(S105)。ここまでの処理によって
図8のグラフ400、すなわち色ソースS
Cを含み形状ソースS
Sを含まない第1段階のグラフ400が生成される。
【0107】
領域分割部41の領域決定部413は、グラフ情報32で定義されるグラフ400にMinimum Cut/Maximum Flowアルゴリズムを適用して最小のエネルギーにて当該グラフを対象物領域のノードと背景領域のノードに2分割する帰属領域設定A1を導出する(S106)。すなわち領域決定部413は帰属領域設定を微小変動させながら仮決めした当該帰属領域設定をエネルギー算出部412に入力して式(1)のエネルギーEを算出させる処理を繰り返してエネルギーEを最小化する帰属領域設定を探索し決定する。第1段階において領域決定部413はシンク側のt−linkに対象物帰属時形状コストを、またソース側のt−linkに背景帰属時色コストをそれぞれ設定して領域分割を行った。この設定により、領域決定部413は、帰属領域を対象物領域とする画素に対して評価特徴を色特徴とし(α拡張法におけるラベルαを色特徴のラベルCとすることに相当)、且つ帰属領域を背景画像とする画素に対して評価対象特徴を形状特徴とする試行設定を設定してエネルギーの比較を行ったことになる。
【0108】
図9(1)は第1段階での様子を表しており、帰属領域設定500は第1段階で導出された帰属状態A1の例である。後のステップS111にて、この段階で得られた対象物領域は最終的にそのまま対象物領域の一部として採用される(
図9(1)の帰属領域設定501)。同対象物画素は評価対象特徴を色特徴に設定して選んだということになる(
図9(1)の評価対象特徴設定状態502)。
【0109】
分割コスト算出部411はグラフ情報32のコストをリセットして第2段階に移行する。
図9(2)は第2段階に移行した際の様子を示している。分割コスト算出部411は、ステップS106にて導出された各人物の対象物領域を第2段階のグラフ401における当該人物の背景シード(
図9(2)にて帰属領域設定503で示す背景シードB)に加える。シードに加えた対象物領域の帰属は第2段階に影響せず、また変更されないことになる。各人物の対象物シードを設定して(S107)、人物ごとに対象物シードに対する各画素の対象物帰属時色コストを算出する(S108)。すなわち分割コスト算出部411は、各人物の初期領域の中央部から正規化色ヒストグラムh
Oを対象物色特徴として抽出し、式(3)及び式(4)に従って画素ごとの対象物帰属時色コストα
C・c
C(p,T)を算出してグラフ情報32に記憶させる。
【0110】
続いて、分割コスト算出部411はステップS101にて算出した人物ごとの背景画素の存在確率ρ
Bそれぞれを用い、式(9)及び式(10)に従って画素ごとの背景帰属時形状コストα
S・c
S(p,S
S)を算出してグラフ情報32に記憶させる(S109)。ここまでの処理によって
図8のグラフ401、すなわち形状ソースS
Sを含み色ソースS
Cを含まない第2段階のグラフ401が生成される。
【0111】
領域決定部413は、グラフ情報32で定義されるグラフ401にMinimum
Cut/Maximum Flowアルゴリズムを適用して最小のエネルギーにて当該グラフを対象物領域のノードと背景領域のノードに2分割する帰属領域設定A2を導出する(S110)。すなわち領域決定部413は帰属領域設定を微小変動させながら仮決めした当該帰属領域設定をエネルギー算出部412に入力して式(1)のエネルギーEを算出させる処理を繰り返してエネルギーEを最小化する帰属領域設定A2を探索し決定する。
【0112】
図9(3)は第2段階での様子を表しており、帰属領域設定504は、この第2段階で導出された帰属領域設定A2の例である。第2段階において領域決定部413はシンク側のt−linkに対象物帰属時色コストを、またソース側のt−linkに背景帰属時形状コストをそれぞれ設定して領域分割を行った。この設定により、領域決定部413は、帰属領域を対象物領域とする画素に対して評価特徴を形状特徴とし(α拡張法におけるラベルαを形状特徴のラベルSとすることに相当)、且つ帰属領域を背景画像とする画素に対して評価対象特徴を色特徴とする試行設定を設定してエネルギーの比較を行ったことになる。
【0113】
領域決定部413は、ステップS106にて得られた対象物画素とステップS110にて得られた対象物画素とを連結して最終的な対象物領域を決定し、それ以外の領域を背景領域として決定する(S111)。
【0114】
図9(3)の帰属領域設定505は、最終的な帰属領域設定Aの例である。第2段階で得られた対象物画素は評価対象特徴を形状特徴に設定して選んだということになる(
図9(3)の状態506)。なお、この段階で得られた背景シード以外の背景画素(状態506にて“S/C”で示す画素)の評価対象特徴は当該画素に設定された対象物帰属時色コストと対象物帰属時形状コストのうち最小値を与える画像特徴とすることができる。
【0115】
以上の各段階において、領域決定部413は、帰属領域を対象物領域とする素領域に対して評価対象特徴を第1の種類の画像特徴とし、且つ帰属領域を背景領域とする素領域に対して評価対象特徴を第1の種類と異なる第2の種類の画像特徴とする試行設定を設定して積算評価値の比較を行った。このように異なる画像特徴を直接的に対比する設定を行うことによって各素領域にて評価すべき画像特徴を効率良く選択できるので、対象物と背景の関係の多様性に適応した高精度な領域分割を効率的に導出することができる。
【0116】
こうして領域分割部41は、各ノードにおいていずれか1つの画像特徴を評価対象特徴に選びながらエネルギーEを最小化する領域分割を決定する。
【0117】
以上の処理により各人物の人物領域が抽出されると、制御部4は
図6のステップS5へ処理を進める。
【0118】
再び
図6を参照して画像監視処理の続きを説明する。
【0119】
制御部4の異常姿勢判定部42は、領域決定部413から入力された各人物の人物領域の形状と異常姿勢パターンとの類似度を算出して予め設定したしきい値と比較し、しきい値以上の類似度が算出された人物領域を異常姿勢であると判定し、そうでなければ異常姿勢でないと判定する(S5)。
【0120】
異常姿勢判定部42は人物領域のいずれかが異常姿勢と判定された場合に(ステップS6にてYES)、所定の異常信号を生成して出力部5に当該信号を出力する(S7)。異常信号を入力された出力部5は警備センターに異常信号を送信し、通報を行う。他方、人物領域のいずれも異常姿勢と判定されなければ(ステップS6にてNO)、ステップS7の異常出力処理はスキップされる。
【0121】
以上の処理を終えると、制御部4は処理をステップS1に戻し、次の監視画像に対する処理が行われる。
【0122】
[変形例]
(1)上記実施形態では1つ1つの画素を素領域として領域分割を行う例を示した。しかし、ノードに対応付ける素領域は画素以外であってもよい。例えば、互いに画素値が類似する画素を予めまとめてセグメント化し、各セグメントをノードに設定して領域分割を行うこともできる。
【0123】
この場合、各セグメントに対する色コストは、当該セグメントの代表画素値(画素値の平均値、中央値または最頻値)を用いて算出する、あるいは当該セグメントを構成する画素それぞれに対する色コストを算出してそれらの色コストの代表値(コストの平均値、中央値または最大値)を当該セグメントの色コストとする。
【0124】
また各セグメントに対する形状コストは、当該セグメントと初期領域との重なり度合いを用いて算出する、あるいは当該セグメントを構成する画素に対する存在確率の代表値(存在確率の平均値、中央値または最頻値)を当該セグメントの形状コストとする。
【0125】
このようにすることで領域分割の精度を低下させずにノードを減らすことができるので、精度維持と負荷減少を両立することができる。
【0126】
(2)上記実施形態では画像特徴として色と形状とを用いる例を示したが、他の画像特徴を用いることもできる。例えば色と動き特徴量とを用いる。この場合、背景差分処理を行って各画素の背景差分値を動き特徴量とすることができる。また、オプティカルフロー分析を行って各画素の移動ベクトルの大きさを動き特徴量とすることもできる。
【0127】
(3)上記実施形態ではグラフカット法によりエネルギーを最小化する領域分割結果を導出した。別の実施形態ではグラフカット法に代えてマルコフ連鎖モンテカルロ (Markov Chain Monte Carlo:MCMC) 法、信念伝播(Belief Propagation)法、ツリー重み再配分メッセージ伝達(Tree-Reweighted Message Passing:TRW)法を用いてエネルギーを最小化する領域分割結果を導出できる。
【0128】
(4)上記実施形態では、α拡張法の第1段階にて
図8のグラフ400、第2段階にてグラフ401を生成してグラフカット法を行ったが、逆順とすることもできる。すなわち第1段階にて
図8のグラフ401、第2段階にてグラフ400を生成してグラフカット法を行ってもよい。
【0129】
(5)上記実施形態では、α拡張法により画像特徴を選択したが、α拡張法に代えてα−β交換(αβ-swap)法を利用することもできる。例えば、対象物領域の評価対象特徴をラベルαとし、背景領域の評価対象特徴の1つをラベルβとしてα−β交換法を適用することができる。上述の実施形態では画像特徴は色特徴と形状特徴との2種類であるので、ラベルαはそれらの一方であり、ラベルβはそれらの他方となる。
【0130】
(6)3種類以上の画像特徴を用いる場合にも本発明を適用することができ、その場合にも上述したα拡張法、α−β交換法、及びその他の方法を用いて領域分割結果を導出することができる。
【0131】
例えば、3種類の画像特徴A,B,Cを用いる場合、α拡張法は画像特徴A,B,Cを順次、ラベルαとして処理を繰り返す。すなわち、上述の画像特徴が2種類の場合には処理は2段階に行われたが、画像特徴が3種類の場合には3段階で行われる。
【0132】
また、α−β交換法では画像特徴A,B,Cにおいて指定可能なラベルα,βの全ての組み合わせについて処理が繰り返される。例えば、画像特徴Aを対象物領域の評価対象特徴とし、これをラベルαとする場合、画像特徴Bを背景領域の評価対象特徴とし、これをラベルβとする処理と、画像特徴Cを背景領域の評価対象特徴とし、これをラベルβとする処理とがそれぞれ行われる。
【0133】
(7)上記実施形態では、各画像特徴の特徴比率αを固定して領域分割を行ったが、別の実施形態では特徴比率αを動的に設定する。この場合、特徴比率αを複数通りに設定して各設定で領域分割を行い、各設定における領域分割結果を特徴比率に依存しない一律の基準にて評価して領域評価値(領域分割評価値)を算出し、領域評価値が最大の領域分割結果を採用することができる。
【0134】
領域評価値としては次式で定義される領域評価値Vを用いることができる。
【0138】
ここで、1/V
Cは色に関する領域評価値、1/V
Sは形状に関する領域評価値である。
【0139】
式(12)における総和対象とする画素pの集合Edgeは対象物の輪郭画素からなる集合であり、また、N(p)は対象物の輪郭画素に隣接する背景画素の集合、distは画素pとqとの距離である。γは調整用の定数であり、事前実験等を通じて適切な値が予め設定される。
図10はN(p)を説明する図であり、同図の左側に対象物の輪郭画素を含む部分画像の模式図を示している。ここで、n−linkのコストは
図2に示すように各画素の4近傍について算出している。これに対し、N(p)は
図10に示すように対象物の輪郭画素の8近傍から求めるなど、n−linkのコストを算出したときよりも多くの隣接画素との相違を評価するのがよい。こうすることで上述したエネルギー算出部412における色特徴のエネルギーによる評価よりも厳しい領域評価値を算出でき、領域分割候補間の優劣をより厳密に評価することができる。
【0140】
式(13)におけるM
λは領域分割候補における対象物領域と初期領域とで画素位置が一致する画素数であり、M
0は初期領域の画素数、M
Sは領域分割候補の画素数である。初期領域との一致画素数M
λが増えると1/V
Sは高くなる。つまり、1/V
Sは初期領域に対する対象物領域のマッチング率である。ただし1/M
Sの項により、対象物領域が単に大きいだけ(例えば対象物領域が初期領域を包含する状態)で1/V
Sが不当に高くなることを抑制している。
【0141】
また、この場合、特徴比率α
Cを定数として扱い、λ=α
S/α
Cとおけば特徴比率の制御を1変数にて行うことができる。すなわち、λを変えることで、各画像特徴を領域分割に寄与させる度合についての画像特徴相互間の比を変えることができる。例えば、領域分割部41に、寄与比λを複数通りに設定する寄与比設定部を設ける。そして、エネルギー算出部412は、画像特徴についての各帰属評価値を寄与比λで重み付けして画像内で総和し積算評価値を算出し、領域決定部413は、寄与比ごとに積算評価値に基づく探索を行って領域分割結果を求める。そして、寄与比に依存しない所定基準により各寄与比での領域分割結果である帰属状態の尤もらしさを評価して領域評価値を算出し、当該領域評価値に基づいていずれかの寄与比での領域分割結果を選択する。
【0142】
このように、特徴比率を動的に決定することによって、対象物と背景の状況に適応して色特徴量と形状特徴量を領域分割に寄与させる率を適切に調整する効果がさらに高まるので、領域分割をより高精度に行うことが可能になる。
【0143】
(8)上記実施形態において初期領域は初期領域設定部410により自動設定される例を示したが、本発明の領域分割装置を静止画からの領域分割処理に適用する場合、初期領域設定部410にポインティングデバイス等を含めて構成し、人手により初期領域を設定するのが好適である。