【文献】
永橋 知行 他,構造に基づく特徴量を用いたグラフマッチングによる物体識別,情報処理学会研究報告,日本,社団法人情報処理学会,2006年 5月19日,第2006巻 第51号,pp.69-74
(58)【調査した分野】(Int.Cl.,DB名)
部分領域分割部と、部分領域特徴抽出部と、被写体候補領域初期化部と、画像グラフ構築部と、グラフマッチング部と、全体グラフ構築部と、被写体候補領域更新部と、反復判定部と、を含む被写体領域抽出装置における被写体領域抽出方法であって、
前記部分領域分割部は、抽出対象の被写体を表す複数の画像を含む画像集合に含まれる画像の各々について、前記画像を複数の部分領域に分割し、
前記部分領域特徴抽出部は、前記画像集合に含まれる画像の各々に対し、前記部分領域分割部により分割された前記画像の複数の部分領域の各々について画像特徴量を抽出し、
前記被写体候補領域初期化部は、前記画像集合に含まれる画像の各々について、前記部分領域分割部により分割された前記画像の複数の部分領域からなる部分領域集合のうちの部分集合を、被写体候補領域として初期化し、
前記画像グラフ構築部は、前記画像集合に含まれる画像の各々に対し、初期化された被写体候補領域、又は前回更新された前記被写体候補領域について、前記被写体候補領域に含まれる部分領域の各々に対応するノード及び隣接する前記部分領域のペアに対応するノードの各々を結んだエッジからなるグラフ構造を構築し、
前記グラフマッチング部は、前記画像集合に含まれる画像のうちの画像ペアの各々について、前記画像ペアに含まれる画像の前記複数の部分領域の各々の画像特徴量に基づいて、前記画像ペアに含まれる画像の各々に対して構築された前記グラフ構造を比較して、前記画像ペア間で前記被写体候補領域に含まれる部分領域の対応付けを行い、
前記全体グラフ構築部は、前記グラフマッチング部による前記画像ペアの各々についての対応付けの結果に基づいて、前記画像集合に含まれる画像の前記被写体候補領域に含まれる部分領域の各々に対応するノード、隣接する前記部分領域のペアに対応するノードの各々を結んだエッジ、及び前記画像ペア間で対応付けられた前記部分領域の各々に対応するノードの各々を結んだエッジからなるグラフ構造を構築し、
前記被写体候補領域更新部は、前記画像集合に含まれる画像の各々に対し、前記画像の被写体候補領域に含まれる部分領域の各々について、前記全体グラフ構築部により構築されたグラフ構造についてクラスタリングを行って前記グラフ構造に含まれる複数のノードをクラスタに分類したときに、前記部分領域がクラスタに属するか否かを判定し、前記クラスタに属すると判定された前記部分領域の各々からなる前記被写体候補領域に更新し、
前記反復判定部は、予め定められた繰り返し終了条件を満たすまで、前記画像グラフ構築部によるグラフ構造の構築と、前記グラフマッチング部による対応付けと、前記全体グラフ構築部による全体グラフの構築と、前記被写体候補領域更新部による更新とを繰り返す、
被写体領域抽出方法。
【発明を実施するための形態】
【0018】
以下、図面を参照して本発明の実施の形態を詳細に説明する。
【0019】
<本実施の形態の原理>
まず、本実施の形態における原理について説明する。本実施の形態は、画像の各々について、複数の部分領域に分割することにより、各画像を構成するピクセル集合が部分領域としてまとめられるため、二次計画問題における行列の要素数を大幅に削減することができる。また、画像間の被写体マッチングを、被写体候補領域の抽出及びグラフマッチングを用いて実施する。具体的には、被写体候補領域を構成する部分領域をノード、部分領域間の隣接関係をエッジとするグラフを各画像で構築し、得られたグラフの類似度を画像間で比較することにより、被写体マッチングを行う。非特許文献1で用いられているSIFT−Flоwとは異なり、グラフマッチングは被写体を構成する部分領域の位相関係に基づいてマッチングする技術であるため、画像間で被写体の見えが異なっていたり変形したりしても、より精度よく被写体マッチングを行うことが可能となる。そのため、対象画像群の中に被写体が異なる見えや変形した状態で写っていても、各画像から被写体領域を精度よく抽出することが可能となる。
【0020】
<本発明の第1の実施の形態に係る被写体領域抽出装置の構成>
次に、本発明の第1の実施の形態に係る被写体領域抽出装置の構成について説明する。
図1に示すように、本発明の第1の実施の形態に係る被写体領域抽出装置100は、CPUと、RAMと、後述する被写体領域抽出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この被写体領域抽出装置100は、機能的には
図1に示すように入力部10と、演算部20と、出力部90とを備えている。
【0021】
入力部10は、抽出対象の被写体が映り込んだ複数の画像を含む画像集合I(I={I
0,I
1,…I
N−1})を受け付け、画像記憶部22に記憶する。ここで、Nは画像集合Iに含まれる画像の数であり、画像集合には、被写体そのものをまったく含まない画像が含まれていてもよい。
【0022】
演算部20は、画像記憶部22と、部分領域分割部24と、部分領域特徴抽出部26と、スコア算出部28と、被写体候補領域初期化部30と、画像グラフ構築部32と、グラフマッチング部34と、コセグメンテーション部35と、反復判定部42と、被写体領域記憶部44と、を備えている。
【0023】
画像記憶部22には、入力部10において受け付けた画像集合Iが記憶されている。
【0024】
部分領域分割部24は、画像記憶部22に記憶されている画像集合Iに含まれる画像I
nの各々について、部分領域の各々に分割する。画像I
nを構成する部分領域集合を
【0026】
とする。具体的には、画像I
nについて、非特許文献2に記載されているMean Shiftや(D. Comaniciu et. al., Mean Shift: A Robust Approach Toward Feature Space Analysis, in TPAMI, 24(5), pp.603.-619, 2002)、非特許文献3に記載されているTurbopixel(A. Levinstein, TurboPixels: Fast Superpixels Using Geometric Flows, in TPAMI, 31(12), pp., 2009)や、非特許文献4に記載されているSLICを用いる(R. Achanta et. al,, SLIC Superpixels Compared to State-of-the-art Superpixel Methods, TPAM, 34(11), pp. 2274-2282, 2012.)。なお、部分領域の分割は、各画像を構成する領域の境界線を可能な限り反映したものとする。
【0027】
部分領域特徴抽出部26は、部分領域分割部24において取得した各画像I
nの各部分領域s
n,iについて、画像特徴量f
n,iを抽出する。画像特徴量としては任意の特徴量を1つ以上用いることができ、第1の実施の形態においては、例えば、部分領域を構成する各ピクセルのHSV値に基づくカラーヒストグラムを用いる。
【0028】
スコア算出部28は、部分領域分割部24において取得した各画像I
nの各部分領域s
n,iについて、被写体らしさを示すスコア
【0030】
を算出する。具体的には、部分領域s
n,iを構成する各ピクセルの被写体らしさを評価し、部分領域s
n,iを構成する各ピクセルの被写体らしさに基づく統計量(例えば、平均等)を当該部分領域s
n,iの被写体らしさを示すスコアとして算出する。ここで、部分領域s
n,iを構成する各ピクセルの被写体らしさを評価する方法は、例えば、非特許文献5に記載されているObjectness指標を用いる(B. Alexe et.al., Measuring the Objectness of image windows, in TPAMI, 2012)。
【0031】
被写体候補領域初期化部30は、各画像I
nについて、当該画像I
nを構成する各部分領域s
n,iの被写体らしさを示すスコアp
n,iに基づいて、当該画像I
nの部分領域集合S
nの部分集合として、被写体候補領域V
n⊂S
nの初期化を行う。具体的には、当該画像I
nの各部分領域s
n,iについて、予め定められた閾値と、当該部分領域s
n,iの被写体らしさを示すスコアp
n,iとを比較し、当該部分領域s
n,iの被写体らしさを示すスコアp
n,iが予め定められた閾値以上の場合、当該部分領域を被写体候補領域とする。
【0032】
画像グラフ構築部32は、各画像I
nについて、被写体候補領域初期化部30において取得した、又は被写体候補領域更新部40において前回更新された当該画像の被写体候補領域V
nに基づいて、グラフG
n={E
n,V
n}を構築する。ここで、各画像I
nについて構築されるグラフG
nは、被写体候補領域V
nに含まれる部分領域の各々に対応するノードをノード集合とし、エッジ集合E
nは、空間的に隣接する被写体候補領域に含まれる部分領域ペアv
n,i、v
n,j(i≠j)を結んだエッジから構成されているものとする。なお、エッジには重みはないものとしてグラフを構築する。
【0033】
グラフマッチング部34は、画像集合Iに含まれる各画像I
nの組み合わせからなる画像ペア(I
n、I
m)の各々について、部分領域特徴抽出部26によって抽出された画像特徴量に基づいて、画像グラフ構築部32において構築された当該画像ペアにおける各画像のグラフG
n、G
m(n≠m)を比較して、当該画像ペア間での被写体候補領域に含まれる部分領域の対応付け、及び部分領域の対応付けの各々についてのマッチングスコアを取得する。なお、第1の実施の形態においては、以後グラフG
nのノード数
【0037】
が同一であるものとして説明する。具体的には、画像ペアの各々について、下記(1)式の目的関数F(P
nm)を最小化するような組み合わせ行列Pを求める問題である。なお、αは重みパラメータでありメモリ(図示省略)に記憶されており、F(P
nm)がマッチングスコアとなる。
【0045】
は、v
n,iとv
n,jがエッジで接続されている場合1を、それ以外の場合0をとる。組み合わせ行列P
nmは
【0047】
の行列であり、i行j列目の要素P
nm(i,j)は、v
n,iとv
m,jが対応する場合に1を、それ以外の場合に0をとる。また、行列C
nmは
【0049】
の行列であり、i行j列目の要素C
nm(i,j)は、被写体候補領域に含まれる部分領域の特徴量f
n,iとf
m,jの類似度である。ここで、f
n,iとf
m,jの類似度は、例えばf
n,iとf
m,jのユークリッド距離をd(f
n,i,f
m,i)として、下記(2)式に従って算出する。ここで、β、及びσは正の値をとるパラメータとし、メモリ(図示省略)に記憶されている。
【0051】
なお、グラフマッチングは、任意の方法を用いることが可能であり、例えば、第1の実施の形態においては、非特許文献6(M. Zaslavskiy et. al., A PATH Following Algorithm for the Graph Matching Problem, in TPAMI, 31(12), pp. 2227-2242, 2009)、及び非特許文献7(O. Duchenne et al., Tensor-based algorithm for High-Order Graph Matching, in TPAMI, 33(12), pp.2382-2395, 2011)に記載の方法を用いる。
【0052】
コセグメンテーション部35は、グラフマッチング部34により取得した画像ペアの各々の被写体候補領域に含まれる部分領域の対応付けを用いてコセグメンテーションを行い、画像I
nの各々の被写体候補領域V
nに含まれる部分領域s
n,iの各々を更新する。また、コセグメンテーション部35は、全体グラフ構築部36と、被写体候補領域更新部40とを備えている。なお、第1の実施の形態においては、非特許文献1に記載の技術について、各ピクセルに対する処理を、各画像I
nの被写体候補領域V
nに含まれる各部分領域s
n,iに対する処理と対応付けることにより行う。
【0053】
全体グラフ構築部36は、グラフマッチング部34において画像ペアの各々について取得した当該画像ペア間における部分領域の対応付け(組み合わせ行列集合P={P
01,P
02,…,P
nm,…})に基づいて、画像集合Iにおける被写体候補領域の部分領域の対応関係を示した全体グラフを構築する。具体的には、まず、各画像I
nについて、当該画像I
nの被写体候補領域集合V
nに含まれる部分領域の各々をノード、ノード間の関係性をエッジとするグラフを構築(空間的に隣接する被写体候補領域に含まれる部分領域間にエッジを張る。)する。そして、グラフマッチング部34において取得した画像ペアの各々の当該画像ペアの被写体候補領域に含まれる部分領域の対応付けに基づいて、構築された各画像I
nのグラフに対して、画像間における対応する被写体候補領域に含まれる部分領域同士のノード間に、関係性を示すエッジを張ることにより、全体グラフを構築する。ここで、画像間I
n、I
mにおけるエッジの重みについては、被写体候補領域に含まれる部分領域間の特徴量f
n,iとf
m,jと用いて、上記(2)式に従って類似度を算出し、当該類似度を重みとして用いる。
【0054】
被写体候補領域更新部40は、全体グラフ構築部36において構築された全体グラフに対してクラスタリングを行い、全体グラフ構造に含まれる複数のノードをクラスタに分類したときに、画像I
nの各々の被写体候補領域に含まれる部分領域の各々について、当該部分領域がクラスタに属するか否かを判定し、画像I
nの各々の被写体候補領域を、クラスタに属すると判定された部分領域の各々からなる被写体候補領域に更新する。具体的には、各画像I
nに含まれる被写体候補領域V
nに含まれる全部分領域の各々をクエリとし、ローカルグラフクラスタリングを用いて、クエリとなる部分領域が属するクラスタを発見し、クラスタが発見された部分領域を、更新後の被写体候補領域に含めるようにする(非特許文献8:R. Andersen et al.,, Local Graph Partitioning using PageRank Vectors in Proc. FOCS, 2006)。
【0055】
反復判定部42は、予め定められた繰り返し終了条件を満たしたか否かを判定する。第1の実施の形態では、被写体候補領域更新部40による、各画像I
nの被写体候補領域V
nの更新処理が、予め定められた繰り返し回数以上行われたか否かを判定する。各画像I
nの被写体候補領域V
nの更新処理が、予め定められた繰り返し回数以上行われている場合には、被写体候補領域更新部40により更新された、各画像I
nの被写体候補領域V
nを、各画像I
nの被写体領域として、被写体領域記憶部44に記憶すると共に、出力部90に出力する。各画像I
nの被写体候補領域V
nの更新処理が、予め定められた繰り返し回数行われていない場合には、画像グラフ構築部32による画像グラフの構築処理、グラフマッチング部34によるマッチング処理、全体グラフ構築部36による全体グラフの構築処理、被写体候補領域更新部40による被写体候補領域の更新処理を繰り返す。
【0056】
被写体領域記憶部44には、各画像I
nの被写体領域が記憶されている。なお、各画像I
nの被写体領域は、当該画像I
nの部分領域集合の部分集合として得られているものとする。
【0057】
<本発明の第1の実施の形態に係る被写体領域抽出装置の作用>
次に、本発明の第1の実施の形態に係る被写体領域抽出装置100の作用について説明する。まず、画像集合Iを受け付け、画像記憶部22に記憶する。そして、画像記憶部22から画像集合Iを読みだすと、被写体領域抽出装置100は、
図2に示す被写体領域抽出処理ルーチンを実行する。
【0058】
まず、ステップS102では、読み込んだ画像集合Iに含まれる、画像I
nの各々について、当該画像I
nを部分領域s
n,iの各々に分割する。
【0059】
次に、ステップS104では、画像I
nの各々に対し、ステップS102において取得した当該画像I
nの部分領域s
n,iの各々について、画像特徴量f
n,iを抽出する。
【0060】
次に、ステップS106では、画像I
nの各々に対し、ステップS102において取得した当該画像I
nの部分領域s
n,iの各々について、被写体らしさを示すスコアp
n,iを算出する。
【0061】
次に、ステップS108では、画像I
nの各々について、ステップS106において取得した、当該画像I
nの部分領域s
n,iの各々についての被写体らしさを示すスコアp
n,iと、予め定められた閾値と、に基づいて、当該画像I
nにおける被写体候補領域となる部分領域s
n,iの各々を判定し、当該画像I
nにおける被写体候補領域V
nを初期化する。
【0062】
次に、ステップS110では、画像I
nの各々について、ステップS108において取得した当該画像I
nにおける被写体候補領域V
nに含まれる部分領域の各々、又は前回の処理におけるステップS118において取得した更新された被写体候補領域に含まれる部分領域の各々に基づいて、グラフG
n={E
n,V
n}を構築する。
【0063】
次に、ステップS112では、画像集合Iに含まれる各画像I
nの組み合わせからなる画像ペア(I
n、I
m)の各々について、ステップS110において取得した当該画像ペアにおける各画像のグラフG
n、G
mと、ステップS104において取得した当該画像ペアにおける各画像の被写体領域に含まれる各部分領域の特徴量f
n,s、f
m,sと、メモリ(図示省略)に記憶されている重みパラメータαと、パラメータβ、及びσと、に基づいて、当該画像ペア間における被写体候補領域に含まれる部分領域の対応付け及びマッチングスコアを取得する。
【0064】
次に、ステップS114では、ステップS108において取得した、画像I
nの各々についての被写体候補領域V
nに含まれる部分領域の各々と、ステップS112において取得した画像ペアの各々についての被写体候補領域に含まれる部分領域の対応付けとに基づいて、全体グラフを構築する。
【0065】
次に、ステップS118では、画像I
nの各々について、ステップS108において取得した被写体候補領域V
nに含まれる部分領域の各々と、ステップS114において取得した全体グラフとに基づいて、当該画像I
nに含まれる被写体候補領域V
nに含まれる全部分領域の各々をクエリとし、ローカルグラフクラスタリングを用いて、クエリとなる部分領域が属するクラスタを発見し、当該画像I
nにおける被写体候補領域を、クラスタが発見された部分領域からなる被写体候補領域に更新する。
【0066】
次に、ステップS120では、繰り返し処理の終了条件を満たすか否かを判定する。繰り返しの終了条件を満たす場合には、ステップS122に移行し、繰り返しの終了条件を満たさない場合には、ステップS110に移行し、ステップS110〜ステップS120の処理を繰り返す。
【0067】
次に、ステップS122では、画像I
nの各々について、ステップS118において取得した当該画像I
nの被写体候補領域を、当該画像I
nの被写体領域として被写体領域記憶部44に記憶すると共に、出力部90に出力する。
【0068】
以上説明したように、本発明の第1の実施の形態に係る被写体領域抽出装置によれば、画像集合に含まれる画像の各々について、複数の部分領域に分割し、初期化された被写体候補領域、又は前回更新された被写体候補領域について、グラフを構築し、画像ペアの各々について、構築されたグラフを比較して、画像ペア間で被写体候補領域に含まれる部分領域の対応付けを行い、画像ペアの各々についての対応付けの結果に基づいて、全体グラフを構築し、画像の被写体候補領域に含まれる部分領域の各々について、構築された全体グラフについてクラスタリングを行ったときに、部分領域がクラスタに属するか否かを判定し、クラスタに属すると判定された部分領域の各々からなる被写体候補領域に更新することを繰り返すことにより、被写体領域を精度良く抽出することができる。
【0069】
また、被写体そのものを含まない画像を一部含む被写体画像の集合の各画像から、各画像に含まれる被写体の見えが変化、変形している場合であっても、精度よくかつ高速に被写体の写っている領域を自動で抽出することが可能となり、抽出された被写体領域を元に辞書データベースを構築することで、見えの変化に頑健な被写体検索が実現できる。
【0070】
また、初期化された被写体候補領域を更新していくことで、最終的に抽出される被写体領域の精度を向上させることができる。
【0071】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0072】
例えば、第1の実施の形態において、グラフG
nのエッジには重みはないものとする場合について説明したが、これに限定されるものではなく、空間的に隣接する被写体候補領域に含まれる部分領域ペアv
n,i、v
n,jの中心間の距離の逆乗を以ってノード間の重みとしてもよい。また、エッジの重みを任意で設定してもよい。
【0073】
また、第1の実施の形態において、部分領域の各々の画像特徴量として当該部分領域を構成する各ピクセルのHSV値に基づくカラーヒストグラムを用いる場合について説明したが、これに限定されるものではない。例えば、画像特徴量として、各ピクセルから抽出可能な局所特徴量(例えば、SIFTやColor-SIFTといった局所特徴量(非特許文献9:D.G.Lowe, Distinctive Image Features from Scale-Invariant Keypoints, in IJCV, 60(2),pp. 91-110, 2004.、非特許文献10:KEA van de Sande, Evaluating Color Descriptors for Object and Scene Recognition, in TPAMI, 32(9), pp. 1582-1596, 2010))を、あらかじめ作成しておいたコードブック(例えば256次元)に基づいて量子化することで得られるBag−of−Visual−Words特徴量を用いてもよい。
【0074】
また、第1の実施の形態において、各部分領域s
n,iを構成する各ピクセルの被写体らしさを評価する方法として、Objectness指標を用いる場合について説明したが、これに限定されるものではない。例えば、画像中に映り込んだ被写体が画像中に目立って映っていることが仮定できる場合には、非特許文献11に記載されている任意のSaliency指標(M.M. Cheng et al., Global Contrast based Salient Region Detection, in Proc. CVPR, 2013)を用いることができる。
【0075】
また、第1の実施の形態において、画像集合Iに含まれる各画像I
nにおける全ての組み合わせにおける画像ペアの各々について、被写体候補領域に含まれる部分領域の対応付け及びマッチングスコアを取得する場合について説明したが、これに限定されるものではない。例えば、全体の色味、全体から抽出される色、又は全体から抽出される模様が類似する画像ペアの各々についてのみ、被写体候補領域に含まれる部分領域の対応付け及びマッチングスコアを取得してもよい。
【0076】
また、第1の実施の形態において、被写体候補領域に含まれる部分領域を初期化する際に用いる閾値が予め定められている場合について説明したが、これに限定されるものではない。例えば、閾値は任意の設定方法を用いることができ、各画像I
nの中で最も被写体らしい部分領域が持つスコアをs
n,maxとした場合、閾値を0.6s
n,maxとしてもよい。
【0077】
次に、第2の実施の形態に係る被写体領域抽出装置について説明する。
【0078】
第2の実施の形態においては、画像ペアの各々について取得した当該画像ペア間における部分領域の対応付け、及び部分領域の対応付けの各々についてのマッチングスコアの双方を用いてコセグメンテーションを行い、画像I
nの各々の被写体候補領域V
nに含まれる部分領域の各々を更新する点が第1の実施の形態と異なる。なお、第1の実施の形態に係る被写体領域抽出装置と同様の構成及び作用については、同一の符号を付して説明を省略する。
【0079】
<本発明の第2の実施の形態に係る被写体領域抽出装置の構成>
次に、本発明の第2の実施の形態に係る被写体領域抽出装置の構成について説明する。
図3に示すように、本発明の第2の実施の形態に係る被写体領域抽出装置200は、CPUと、RAMと、後述する被写体領域抽出処理ルーチンを実行するためのプログラムや各種データを記憶したROMと、を含むコンピュータで構成することが出来る。この被写体領域抽出装置200は、機能的には
図3に示すように入力部10と、演算部220と、出力部90とを備えている。
【0080】
演算部220は、画像記憶部22と、部分領域分割部24と、部分領域特徴抽出部26と、スコア算出部28と、被写体候補領域初期化部30と、画像グラフ構築部232と、グラフマッチング部234と、コセグメンテーション部235と、反復判定部242と、被写体領域記憶部244と、を備えている。
【0081】
画像グラフ構築部232は、画像集合Iに含まれる各画像I
n、又は被写体画像判定部221において前回、被写体が写っていると判定された各画像I´
nについて、被写体候補領域初期化部30において取得した、又は被写体候補領域更新部40において前回更新された当該画像の被写体候補領域V
nに基づいて、グラフG
n={E
n,V
n}を構築する。ここで、各画像I
n又は各画像I´
nについて構築されるグラフG
nは、被写体候補領域V
nに含まれる部分領域の各々をノード集合とし、エッジ集合E
nは、空間的に隣接する被写体候補領域に含まれる部分領域ペアv
n,i、v
n,j(i≠j)間に張られたエッジから構成されているものとする。なお、エッジには重みはないものとしてグラフを構築する。
【0082】
グラフマッチング部234は、画像集合Iに含まれる各画像I
nの組み合わせからなる画像ペア(I
n、I
m)、又は被写体画像判定部221において前回、被写体が写っていると判定された各画像I´
nの組み合わせからなる画像ペア(I´
n、I´
m)の各々について、部分領域特徴抽出部26によって抽出された画像特徴量に基づいて、画像グラフ構築部232において構築された当該画像ペアにおける各画像のグラフG
n、G
m(n≠m)を比較して、当該画像ペア間での被写体候補領域に含まれる部分領域の対応付け、及び部分領域の対応付けの各々についてのマッチングスコアを取得する。
【0083】
コセグメンテーション部235は、グラフマッチング部234により取得した画像ペアの各々の被写体候補領域に含まれる部分領域の対応付け、及び部分領域の対応付けの各々についてのマッチングスコアを用いてコセグメンテーションを行い、被写体が写っていると判定された画像I´
nの各々の被写体候補領域V
nに含まれる部分領域の各々を更新する。また、コセグメンテーション部235は、被写体画像判定部221と、全体グラフ構築部236と、被写体候補領域更新部240とを備えている。
【0084】
被写体画像判定部221は、グラフマッチング部234により取得した画像ペアの各々の、部分領域の対応付け毎についてのマッチングスコアに基づいて、各画像が、被写体が写っている画像であるか否かを判定し、被写体が写っている画像I´
nの各々を取得する。具体的には、各画像I
n又は被写体画像判定部221の前回の処理において取得した各画像I´
nについて、当該画像の被写体候補領域V
nに含まれる部分領域に関するマッチングスコアの和を下記(3)式に従って算出し、当該算出された値と、予め定められた閾値とを比較し、当該値が、当該閾値以下である場合に、当該画像を被写体が写っている画像と判定する。
【0086】
全体グラフ構築部236は、グラフマッチング部234において画像ペアの各々について取得した当該画像ペア間における部分領域の対応付け(組み合わせ行列集合P={P
01,P
02,…,P
nm,…})に基づいて、被写体画像判定部221において被写体が写っていると判定された画像I´
nの各々における被写体候補領域の部分領域の対応関係を示した全体グラフを構築する。
【0087】
被写体候補領域更新部240は、全体グラフ構築部236において構築された全体グラフに対してクラスタリングを行い、全体グラフ構造に含まれる複数のノードをクラスタに分類したときに、画像I´
nの各々の被写体候補領域に含まれる部分領域の各々について、当該部分領域がクラスタに属するか否かを判定し、画像I´
nの各々の被写体候補領域を、クラスタに属すると判定された部分領域の各々からなる被写体候補領域に更新する。
【0088】
反復判定部242は、予め定められた繰り返し終了条件を満たしたか否かを判定する。被写体候補領域更新部240による、各画像I´
nの被写体候補領域V
nの更新処理が、予め定められた繰り返し回数以上行われたか否かを判定する。各画像I´
nの被写体候補領域V
nの更新処理が、予め定められた繰り返し回数以上行われている場合には、被写体候補領域更新部240により更新された、各画像I´
nの被写体候補領域V
nを、各画像I´
nの被写体領域として、被写体領域記憶部244に記憶すると共に、出力部90に出力する。各画像I´
nの被写体候補領域V
nの更新処理が、予め定められた繰り返し回数行われていない場合には、画像グラフ構築部232による画像グラフの構築処理、グラフマッチング部234によるマッチング処理、被写体画像判定部221による判定処理、全体グラフ構築部236による全体グラフの構築処理、被写体候補領域更新部240による被写体候補領域の更新処理を繰り返す。
【0089】
被写体領域記憶部244には、各画像I´
nの被写体領域が記憶されている。
【0090】
<本発明の第2の実施の形態に係る被写体領域抽出装置の作用>
次に、本発明の第2の実施の形態に係る被写体領域抽出装置200の作用について説明する。まず、画像集合Iを受け付け、画像記憶部22に記憶する。そして、画像記憶部22から画像集合Iを読み出すと、被写体領域抽出装置200は、
図4に示す被写体領域抽出処理ルーチンを実行する。
【0091】
ステップS200では、画像集合Iに含まれる画像I
nの各々又は後述するステップS204において前回取得した画像I´
nの各々について、ステップS108において取得した当該画像I
n又は当該画像I´
nにおける被写体候補領域V
nに含まれる部分領域の各々、又は後述するステップS208において前回取得した更新された被写体候補領域V
nに含まれる部分領域の各々に基づいて、グラフG
n={E
n,V
n}を構築する。
【0092】
次に、ステップS202では、画像集合Iに含まれる各画像I
nの組み合わせからなる画像ペア、又はステップS204において前回取得した各画像I´
nの組み合わせからなる画像ペアの各々について、ステップS200において取得した当該画像ペアにおける各画像のグラフG
n、G
mと、ステップS104において取得した当該画像ペアにおける各画像の被写体領域に含まれる各部分領域の特徴量f
n,s、f
m,sと、メモリ(図示省略)に記憶されている重みパラメータαと、パラメータβ、及びσと、に基づいて、当該画像ペア間における被写体候補領域に含まれる部分領域の対応付け及びマッチングスコアを取得する。
【0093】
次に、ステップS204では、ステップS202において取得した画像ペアの各々についての部分領域の対応付け及びマッチングスコアに基づいて、各画像が、被写体が写っている画像であるか否かを判定し、被写体が写っている画像I´
nの各々を取得する。
【0094】
次に、ステップS206では、ステップS108において取得した、ステップS204において取得した画像I´
nの各々についての被写体候補領域V
nに含まれる部分領域の各々と、ステップS202において取得した画像ペアの各々についての部分領域の対応付けとに基づいて、全体グラフを構築する。
【0095】
次に、ステップS208では、ステップS204において取得した画像I´
nの各々について、ステップS108において取得した被写体候補領域V
nに含まれる部分領域の各々と、ステップS206において取得した全体グラフとに基づいて、当該画像I´
nに含まれる被写体候補領域V
nに含まれる全部分領域の各々をクエリとし、ローカルグラフクラスタリングを用いて、クエリとなる部分領域が属するクラスタを発見し、当該画像I´
nにおける被写体候補領域を、クラスタが発見された部分領域からなる被写体候補領域に更新する。
【0096】
次に、ステップS210では、繰り返し処理の終了条件を満たすか否かを判定する。繰り返しの終了条件を満たす場合には、ステップS212に移行し、繰り返しの終了条件を満たさない場合には、ステップS200に移行し、ステップS200〜ステップS210の処理を繰り返す。
【0097】
次に、ステップS212では、画像I´
nの各々について、ステップS208において取得した当該画像I´
nの被写体候補領域を、当該画像I´
nの被写体領域として被写体領域記憶部244に記憶すると共に、出力部90に出力する。
【0098】
以上説明したように、本発明の第2の実施の形態に係る被写体領域抽出装置によれば、被写体が写っている画像を判定し、被写体が写っている画像について、被写体候補領域に含まれる部分領域の対応付け及びマッチングスコアに基づいて、被写体候補領域に含まれる部分領域の更新を繰り返すことにより、被写体領域を精度良く抽出することができる。
【0099】
なお、本発明は、上述した実施形態に限定されるものではなく、この発明の要旨を逸脱しない範囲内で様々な変形や応用が可能である。
【0100】
例えば、第2の実施の形態において、被写体が写っている画像を判定する際に用いた閾値を予め定める場合について説明したが、これに限定されるものではなく、上記(3)式で得られた値のうち最小のものから5倍以上の値を閾値として設定してもよい。
【0101】
また、第2の実施の形態において、コセグメンテーションの際に、被写体候補領域に含まれる部分領域の対応付け及びマッチングスコアを用いる場合について説明したが、これに限定されるものではない。例えば、マッチングスコアのみを用いてコセグメンテーションを行ってもよい。この場合、被写体候補領域に含まれる部分領域の対応付けは、マッチングスコアが存在するか否かにより行う。
【0102】
また、本願明細書中において、プログラムが予めインストールされている実施形態として説明したが、当該プログラムを、コンピュータ読み取り可能な記録媒体に格納して提供することも可能であるし、ネットワークを介して提供することも可能である。