(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0018】
以下、本発明の各実施の形態について、図面を参照して詳細に説明する。
【0019】
(実施の形態1)
本発明の実施の形態1は、本発明の基本的態様の一例である。
【0020】
図1は、本実施の形態に係る画像領域抽出装置の構成の一例を示すブロック図である。
【0021】
図1において、画像領域抽出装置100は、指定領域に基づいて画像から対象領域を抽出する装置であり、空間変化学習部180および領域分割部210を含む。
【0022】
空間変化学習部180は、画像の各部分の、画素値変化パターンおよび距離変化パターンを取得する。画素値変化パターンは、画素値成分の空間変化の特徴である。また、距離変化パターンは、基準位置から被写体までの距離成分の空間変化の特徴である。
【0023】
領域分割部210は、指定領域と、画像の各部分との間における、画素値変化パターンおよび距離変化パターンの類似度に基づいて、対象領域の抽出を行う。
【0024】
画像領域抽出装置100は、図示しないが、例えば、CPU(central processing unit)、制御プログラムを格納したROM(read only memory)などの記憶媒体、およびRAM(random access memory)などの作業用メモリを有する。この場合、上記した各部の機能は、CPUが制御プログラムを実行することにより実現される。
【0025】
このような画像領域抽出装置100は、指定領域と画像の各部分との間における、画素値変化パターンおよび距離変化パターンの類似度に基づいて、対象領域の抽出を行うことができる。
【0026】
具体的には、例えば、対象領域が、内部における画素値および距離の変化が大きく、境界部分の画素値および距離の変化が小さく、かつ、他の部分との間での画素値の差異が少ない領域であったとする。画像領域抽出装置100は、このような対象領域についても、画素値変化パターンおよび距離変化パターンの類似度を用いるため、対象領域の抽出することが可能となる。すなわち、画像領域抽出装置100は、従来技術に比べて、指定領域に基づいて対象領域を精度良く抽出することができる。
【0027】
(実施の形態2)
本発明の実施の形態2は、本発明を、ステレオカメラを備えた装置に適用した場合の、具体的態様の一例である。
【0028】
まず、本実施の形態にかかる画像領域抽出装置の構成について説明する。
【0029】
図2は、本実施の形態に係る画像領域抽出装置の構成の一例を示すブロック図である。
【0030】
図2において、画像領域抽出装置100は、画像から対象領域を抽出する装置である。画像領域抽出装置100は、ステレオ画像撮影部110、画像表示部120、ユーザ指示入力部130、距離情報計算部140、画素値・距離学習部150、および画素値・距離データベース(DB)160を有する。また、画像領域抽出装置100は、空間変化計算部170、空間変化学習部180、空間変化データベース(DB)190、スコア計算部200、領域分割部210、結果出力部220を有する。
【0031】
ステレオ画像撮影部110は、ステレオ画像を入力する。具体的には、ステレオ画像撮影部110は、ステレオカメラ(図示せず)によりステレオ画像を取得し、取得したステレオ画像の画像データ(以下、単に「ステレオ画像」という)を、画像表示部120および距離情報計算部140へ出力する。
【0032】
なお、ステレオ画像は、左目画像および右目画像から成る。本実施の形態では、左目画像を、領域抽出の対象とする場合について説明する。この場合、ステレオ画像撮影部110は、画像表示部120へは、ステレオ画像のうち左目画像のみを出力するようにしてもよい。
【0033】
画像表示部120は、入力された左目画像のデータ(以下、単に「左目画像」という)に基づき、左目画像を画面に表示する。画像表示部120は、例えば、液晶ディスプレイである。
【0034】
ユーザ指示入力部130は、ユーザから、指定領域の入力を受け付ける。ユーザ指示入力部130は、例えば、液晶ディスプレイに設けられたタッチパネル、あるいは、マウスなどの、ポインティングデバイスである。この場合、ユーザは、指もしくはスタイラスペンによるタッチパネルへの接触、あるいはマウスの操作などにより、左目画像の任意の領域を、指定領域として設定することができる。すなわち、本実施の形態において、領域とは、ユーザが左目画像に対して指定した領域である。そして、ユーザ指示入力部130は、指定領域を示す指定領域情報を、画素値・距離学習部150および空間変化計算部170へ出力する。
【0035】
距離情報計算部140は、左目画像から、左目画像の各部分の、画素値成分および距離成分を取得する。より具体的には、距離情報計算部140は、入力されたステレオ画像から、画像マッチングなどにより、左目画像と右目画像との間の対応画素対を特定する。そして、距離情報計算部140は、対応画素対の視差から、ステレオ法などにより、左目画像の各位置(例えば各画素位置)の距離成分を算出する。
【0036】
なお、ここで、画素値成分とは、画素が表示する色あるいは輝度、もしくは、色を示す色成分あるいは輝度を示す輝度成分である。また、距離成分とは、ステレオカメラの視点位置などの基準位置から被写体までの距離、もしくは、当該距離を示す距離成分である。また、ステレオ法とは、ステレオカメラの設置パラメータ(カメラパラメータ)を用いて、三角測量の原理により、対応画素対の視差から距離を算出する手法である。
【0037】
そして、距離情報計算部140は、取得した各部分の距離成分を示すデプス情報と、左目画像とを、画素値・距離学習部150および空間変化計算部170へ出力する。なお、距離情報計算部140は、各画素の距離成分を付加した左目画像を左目距離画像として生成し、これを出力してもよい。
【0038】
画素値・距離学習部150は、入力された左目画像の各部分と、入力された指定領域情報が示す領域(指定領域)との間における、画素値成分および距離成分の類似度を算出する。
【0039】
より具体的には、画素値・距離学習部150は、指定領域における画素値成分の平均および標準偏差と、指定領域における距離成分の平均および標準偏差とを算出する。そして、画素値・距離学習部150は、算出結果を、指定領域情報として、画素値・距離データベース160に記憶させる。
【0040】
そして、画素値・距離学習部150は、指定領域情報を用いて、左目画像の各部分について、上述の画素値成分の類似度および距離成分の類似度を算出する。そして、画素値・距離学習部150は、算出した各部分の画素値成分の類似度および距離成分の類似度を、スコア計算部200へ出力する。
【0041】
画素値・距離データベース160は、上記指定領域情報を記憶する。
【0042】
空間変化計算部170は、左目画像の各部分について、画素値成分の空間変化および距離成分の空間変化を算出する。ここで、空間変化とは、2つ以上の連続する画素間における値の変化であり、例えば、変化量ベクトルで表される。そして、空間変化計算部170は、算出した各部分の画素値成分の空間変化および距離成分の空間変化と、指定領域情報とを、空間変化学習部180へ出力する。
【0043】
なお、空間変化計算部170は、
図2に示すように、画素値成分の空間変化を算出する画素値空間変化計算部171と、距離成分の空間変化を算出する距離空間変化計算部172とを有してもよい。
【0044】
空間変化学習部180は、左目画像の各部分の、画素値成分の空間変化の傾向である画素値変化パターンと、距離成分の空間変化の傾向である距離変化パターンとを、取得する。画素値変化パターンは、画素値成分の空間変化の特徴である。また、距離変化パターンは、基準位置から被写体までの距離成分の空間変化の特徴である。そして、空間変化学習部180は、左目画像の各部分と、入力された指定領域情報が示す領域(指定領域)との間における、画素値変化パターンおよび距離変化パターンの類似度を算出する。
【0045】
より具体的には、空間変化学習部180は、指定領域における画素値変化パターンの平均およびガウス分布における標準偏差と、指定領域における距離変化パターンの平均およびガウス分布における標準偏差とを算出する。そして、空間変化学習部180は、算出結果を、指定領域空間変化情報として、空間変化データベース190に記憶させる。
【0046】
そして、空間変化学習部180は、指定領域空間変化情報を用いて、左目画像の各部分について、上述の画素値変化パターンの類似度および距離変化パターンの類似度を算出する。そして、画素値・距離学習部150は、算出した各部分の画素値変化パターンの類似度および距離変化パターンの類似度を、スコア計算部200へ出力する。
【0047】
空間変化データベース190は、上記指定領域空間変化情報を記憶する。
【0048】
スコア計算部200は、左目画像の部分ごとに、入力された空間変化パターンの類似度と、画素値成分および距離成分の類似度とに基づいて、スコアを算出する。ここで、スコアとは、対象領域であることの尤もらしさを示す指標値であり、例えば、後述のエネルギーE(p)である。この場合、スコアが高いほど、対象領域であることの尤もらしさがより高いことを示す。
【0049】
領域分割部210は、指定領域と左目画像の各部分との間における、画素値変化パターンおよび距離変化パターンの類似度(空間変化パターンの類似度)、および、画素値成分および距離成分の類似度に基づいて、対象領域の抽出を行う。より具体的には、領域分割部210は、グラフカット法(非特許文献1参照)により、入力された各部分のスコアに基づいて、左目画像からの対象領域の抽出を行う。そして、領域分割部210は、対象領域の抽出の結果を、結果出力部220へ出力する。
【0050】
結果出力部220は、入力された対象領域の抽出の結果を示す情報を、出力する。より具体的には、結果出力部220は、左目画像のうちどの領域が対象領域として抽出されたかを画像で示す抽出結果情報を、画像表示部120へ出力する。抽出結果情報は、例えば、画像表示部120に対して、表示中の左目画像から対象領域のみを切り出して表示させたり、表示中の左目画像に対象領域を示す画像を重畳表示させるような情報である。あるいは、抽出結果情報は、左目画像から対象領域のみを切り出した画像のデータである。
【0051】
画像領域抽出装置100は、図示しないが、例えば、CPU、制御プログラムを格納したROMなどの記憶媒体、およびRAMなどの作業用メモリを有する。この場合、上記した各部の機能は、CPUが制御プログラムを実行することにより実現される。
【0052】
このような構成を有する画像領域抽出装置100は、指定領域と画像の各部分との間における、画素値変化パターンおよび距離変化パターンの類似度に基づいて、対象領域の抽出を行うことができる。
【0053】
具体的には、例えば、対象領域が、内部における画素値および距離の変化が大きく、境界部分の画素値および距離の変化が小さく、かつ、他の部分との間での画素値の差異が少ない領域であったとする。画像領域抽出装置100は、このような対象部分についても、抽出することが可能となる。
【0054】
すなわち、画像領域抽出装置100は、従来技術に比べて、指定領域に基づいて対象領域を精度良く抽出することができる。
【0055】
また、画像領域抽出装置100は、ステレオ画像を利用して、画像の各部分の距離成分を取得することができる。すなわち、画像領域抽出装置100は、ステレオカメラを備えた装置に対する軽微な変更により、かかる装置に簡単に搭載することができる。例えば、画像領域抽出装置100は、ステレオカメラおよびタッチパネルを備えたスマートフォンに対して、アプリケーション・プログラムのダウンロードにより、容易に実現することができる。
【0056】
また、画像領域抽出装置100は、ユーザが抽出を望む領域を精度良く抽出し、更に、抽出した領域をユーザに提示することができる。
【0057】
以上で、画像領域抽出装置100の構成についての説明を終える。
【0058】
次は、画像領域抽出装置100の動作について説明する。
【0059】
図3は、画像領域抽出装置100の動作の一例を示すフローチャートである。
【0060】
まず、ステップS1000において、ステレオ画像撮影部110は、ステレオ画像を入力する。
【0061】
そして、ステップS2000において、距離情報計算部140は、左目画像の各部分(例えば、各画素)の距離成分を算出する。
【0062】
次は、距離成分の算出手法の一例について説明する。
【0063】
距離情報計算部140は、まず、左目画像と右目画像との間で画像マッチングを行い、左目画像の画素と右目画像の画素との組み合わせごとに、マッチングスコアを算出する。マッチングスコアは、左目画像の画素と右目画像の画素とが、同一の物体または背景部分を撮影していることの尤もらしさを示す値である。そして、距離情報計算部140は、左目画像の画素ごとに、マッチングスコアが最も高い右目画像の画素を特定し、特定された画素との組を、対応画素対に決定する。
【0064】
画像マッチングの手法としては、例えば、両画像をブロック化し、ブロック間の一致度を求める手法を用いることができる。この場合、かかる一致度に基づく値を、マッチングスコアとして用いることができる。ブロック間の一致度の評価手法は、例えば、輝度差の総和(SAD:Sum of Absolute Difference)、および、輝度値の2乗和(SSD:Sum of Squared Difference)が使用できる。また、ブロック間の一致度の評価手法としては、正規化互換相関(NCC:Normalized Cross-Correlation)が使用できる。
【0065】
SAD、SSDでは、評価値は正値であり、評価値が小さいほど一致度が高い。このため、マッチングスコアは、例えば評価値の逆数、あるいは、定数から評価値を引いた値を採用するなど、評価値が小さいほど高い値になるような関数で表現すればよい。NCCでは、評価値は1〜−1の値を取り、評価値が1のときに一致度が最も高い。このため、評価値は、マッチングスコアとしてそのまま用いることが可能である。もちろん、例えば、マッチングスコアは、評価値の3乗値を採用するなど、評価値が高いほどより重みが大きくなるような関数を用いて表現してもよい。
【0066】
そして、距離情報計算部140は、対応画素対ごとに視差を取得し、取得した視差とカメラパラメータとから、ステレオ法により、当該対応画素対の距離を算出する。そして、距離情報計算部140は、算出した各対応画素対の距離を、当該対応画素対のうち、左目画像上の画素の位置の距離成分とする。
【0067】
図4は、ステレオ画像撮影部110が入力する左目画像の一例を示す図である。また、
図5は、
図4に示す左目画像の距離画像の一例を示す図である。
【0068】
図4に示す左目画像311は、カラー画像あるいはグレースケール画像である。左目画像311は、緑色の地に花柄の壁紙312の前に、観葉植物313およびボール314が置かれている風景の画像とする。
【0069】
図5において、距離画像321は、距離の遠近を濃淡で示したグレースケール画像である。ここでは、距離が近いほど、輝度を高く表現し、より白に近い色で表現している。距離画像321は、物体のもつテクスチャ情報とは無関係である。すなわち、
図4に示すように、壁紙312に模様がある場合でも、
図5に示すように、距離画像321の壁紙312の領域には、模様の情報は反映されず、その距離成分は一様な値となる。
【0070】
この場合、
図4および
図5から分かるように、観葉植物313の領域は、内部における画素値および距離の変化が大きく、他の部分(壁紙312およびボール314の領域)との境界部分における画素値および距離の変化が小さい。そして、観葉植物313の領域は、他の部分との間での画素値の差異が少ない。すなわち、上述の従来技術では、観葉植物313を抽出することは困難である。
【0071】
そして、
図3のステップS3000において、空間変化計算部170は、左目画像の各部分の画素値成分の空間変化および距離成分の空間変化を算出する。
【0072】
次は、画素値成分の空間変化および距離成分の空間変化の一例について説明する。
【0073】
図6は、画素値の空間変化の算出手法の一例を説明するための図である。また、
図7は、画素値の空間変化の算出手法の他の例を説明するための図である。
【0074】
図6および
図7に示す各ブロック331は、左目画像における1画素を示す。なお、
図6および
図7では、注目画素から2画素分の距離までの画素のみを図示している。
【0075】
ここでは、
図6に示すように、中央の注目画素tを端点とする直線上の連続画素を、空間変化の表現に用いられる画素(以下「近傍画素」という)とする。この場合、近傍画素群は、例えば、注目画素tから近い順に、近傍画素t−1、t−2、・・・、t−mと表現される。また、
図7に示すように、近傍画素は、注目画素tを端点とするのではなく、注目画素tを通過する直線上の連続画素を、近傍画素としてもよい。この場合、この場合、近傍画素群は、例えば、注目画素tから近い順に、近傍画素t−1、t−2、・・・、t−m、および、近傍画素t+1、t+2、・・・、t+mと表現される。
【0076】
近傍画素群の並びの方向は、空間変化を見る方向である。
図6に示すように、空間変化を見る方向は、例えば、右上がり斜め45度の方向332であってもよいし、右水平方向333であってもよい。また、空間変化を見る方向は、1方向であってもよいし、複数の方向であってもよい。空間変化計算部170は、空間変化を見る方向の数が少ないほど、処理負荷を低減することができ、空間変化を見る方向の数が多いほど、検出精度を向上させることができる。また、例えば、空間変化計算部170は、指定領域が、ユーザのドラッグ操作により指定される場合、そのドラッグ操作が行われたラインの方向を、空間変化を見る方向としてもよい。
【0077】
本実施の形態では、一例として、近傍画素がm個であり、近傍画素が近傍画素t−1、t−2、・・・、t−mと表現されるとする。この場合、空間変化計算部170は、以下の式(1)で表される変化量ベクトルv
combを、画素値成分および距離成分の空間変化として出力する。V
colorは、画素値成分の空間変化を示す変化量ベクトルである。また、V
distは、画素値成分の空間変化を示す変化量ベクトルである。
【数1】
【0078】
ただし、変化量ベクトルV
colorは、以下の式(2)および式(4)を満たし、変化量ベクトルV
distは、以下の式(3)および式(4)を満たす。なお、以下の説明において、画素値成分および距離成分は、pで表す。また、添え字のcolor、distは、それぞれ、画素値成分に関するパラメータ、距離成分に関するパラメータであることを示する。
【数2】
【数3】
【数4】
【0079】
そして、ステップS4000において、画像表示部120は、左目画像を表示する。そして、ユーザ指示入力部130は、ユーザから指定領域の入力を受け付ける。
【0080】
図8は、指定領域の入力の様子の一例を示す図であり、
図4に対応するものである。ここでは、観葉植物313をユーザが対象領域として指定する場合を例示する。
【0081】
図8に示すように、ユーザは、タッチパネルにおいて、例えば、左目画像311のうち観葉植物313の領域内で、指341をドラッグさせる。ユーザ指示入力部130は、指341が接触した領域342を、指定領域として取得する。なお、ユーザが対象領域の中央付近でドラッグを行うことを想定して、ユーザ指示入力部130は、指341が接触した領域342から一定範囲の幅を持たせ、より大きい領域を、対象領域として取得してもよい。対象領域の大きさは、大きいほうが、対象領域が持つより多くの情報を学習に利用できるため、指定領域の特徴が対象領域の特徴をより良く表すものとなり、対象領域の抽出精度が向上するからである。
【0082】
なお、ステップS4000の処理は、ステップS3000の処理の前、あるいは、ステップS2000の処理の前に行われてもよい。
【0083】
そして、ステップS5000において、画像領域抽出装置100は、指定領域学習処理を行う。指定領域学習処理は、画素値変化パターンおよび距離変化パターンを含む、指定領域の特徴を学習する処理である。
【0084】
図9は、指定領域学習処理(
図3のステップS5000)の一例を示すフローチャートである。
【0085】
まず、ステップS5100において、画素値・距離学習部150は、指定領域について、画素値成分の平均値および標準偏差と、距離成分の平均値および標準偏差とを、指定領域情報として算出する。そして、画素値・距離学習部150は、算出した指定領域情報を、画素値・距離データベース160に記憶させる。
【0086】
以下の説明において、指定領域における画素値成分の平均値および標準偏差は、それぞれ、バー付きのp
color、バー付きのσ
colorで表す。また、指定領域における距離成分の平均値および標準偏差は、それぞれ、バー付きのp
dist、バー付きのσ
distで表す。
【0087】
なお、対象領域の内部には、画素値成分の空間変化の傾向あるいは距離成分の空間変化の傾向が、大きく変化する箇所が存在し得る。本実施の形態において、空間変化学習部180は、このような大きな変化を含めて、指定領域の画素値成分の空間変化の傾向あるいは距離成分の空間変化の傾向を抽出し、指定領域空間変化情報を生成する。
【0088】
図10は、画素値成分の空間変化および距離成分の空間変化の一例を示す図であり、
図4、
図5、および
図8に対応するものである。
【0089】
図10の左側には、左目画像311に指定領域342を重畳した画像と、距離画像321に指定領域342を重畳した画像とを示す。また、
図10の右側には、指定領域342としてユーザが指定した軌跡と、画素値および距離との関係を示すグラフ351、352を示す。グラフ351において、横軸は、指定軌跡を示し、縦軸は画素値成分を示す。グラフ352において、横軸は指定軌跡を示し、縦軸は距離成分を示す。
【0090】
指定領域342の指定軌跡は、画面手前側に伸びた葉の区間(1)、奥に位置する当該葉の根元の区間(2)、更に奥に位置する別の葉の区間(3)、鉢の土の区間(4)、および鉢の縁の区間(5)を含む。これらの区間の間では、グラフ351、352に示すように、画素値成分および距離成分の少なくとも一方の空間変化の度合い(傾き)が、大きく変化する。例えば、区間(1)と区間(2)との間において、画素値成分は、同様に緩やかに上昇しているが、距離成分は、急激な上昇に変化している。
【0091】
例えば、区間(1)と区間(2)との間では、画素値成分の空間変化の仕方はほとんど変化していないが、距離成分の空間変化の仕方は大きく変化している。すなわち、区間(1)と区間(2)との間では、距離が緩やかに小さくなる空間変化が、距離が急激に大きくなる空間変化に転じている。空間変化計算部170は、このような空間変化の急激な変化の傾向をも含めて、指定領域空間変化情報を生成する。
【0092】
そして、ステップS5200において、空間変化学習部180は、指定領域について、空間変化パターンの平均値および標準偏差を、指定領域空間変化情報として算出する。そして、空間変化学習部180は、算出した指定領域空間変化情報を、空間変化データベース190に記憶させて、
図3の処理へ戻る。
【0093】
図3のステップS6000において、画像領域抽出装置100は、対象領域分割処理を行う。対象領域分割処理は、画素値変化パターンおよび距離変化パターンを含む指定領域の特徴に基づいて、画像から対象画像を抽出する処理である。
【0094】
図11は、対象領域分割処理(
図3のステップS6000)の一例を示すフローチャートである。
【0095】
まず、ステップS6100において、画素値・距離学習部150および空間変化学習部180は、左目画像の部分(画素)を、1つ選択する。なお、選択の対象となる領域は、画像のうち、指定領域を除いた領域であることが望ましい。また、画素値・距離学習部150および空間変化学習部180がどの画素を選択するかは、スコア計算部200により制御されてもよい。
【0096】
そして、ステップS6200において、画素値・距離学習部150は、選択中の部分について、記憶されている指定領域情報を用いて、画素値スコアおよび距離スコアを算出する。ここで、画素値スコアは、選択中の部分と指定領域との間の画素値成分の類似度を示す指標値である。距離スコアは、選択中の部分と指定領域との間の距離成分の類似度を示す指標値である。
【0097】
次は、画素値スコアおよび距離スコアの算出手法の一例について説明する。
【0098】
画素値・距離学習部150は、単一ガウス分布を仮定した場合、例えば、以下の式(5)を用いて、選択中の部分(画素)の画素値成分に対する生起確率を、画素値スコアscore(p
color)として求める。また、画素値・距離学習部150は、例えば、以下の式(6)を用いて、選択中の部分(画素)の距離成分に対する生起確率を、画素値スコアscore(p
dist)として求める。
【数5】
【数6】
【0099】
また、画素値・距離学習部150は、混合ガウス分布を仮定した場合、例えば、以下の式(7)を用いて、選択中の部分(画素)の画素値成分に対する生起確率を、画素値スコアscore(p
color)として求める。また、画素値・距離学習部150は、例えば、以下の式(8)を用いて、選択中の部分(画素)の距離成分に対する生起確率を、画素値スコアscore(p
dist)として求める。なお、ここで、Nは、分布数を示し、D
nは、n番目のガウス分布を示す。
【数7】
【数8】
【0100】
混合ガウス分布は、学習サンプルを複数のガウス分布の集合で表現したものである。したがって、混合ガウス分布の利用は、指定領域が、画素値が大きく異なる複数の色グループ、あるいは、距離が大きく異なる複数の距離グループを含む場合など、単一ガウス分布による表現が困難な場合に有効である。混合ガウス分布により得られる類似度は、各分布の生起確率および各分布における評価対象画素の類似度の積を、各分布について総和をとった値となる。
【0101】
そして、ステップS6300において、空間変化学習部180は、選択中の部分について、記憶されている指定領域空間変化情報を用いて、空間変化パターンスコアを算出する。ここで、空間変化パターンスコアは、選択中の部分と指定領域との間の、空間変化パターンの類似度を示す指標値である。画素値成分の空間変化と距離成分の空間変化との組は、以下、「画素値・距離空間変化」という。
【0102】
次は、空間変化パターンスコアの算出手法の一例について説明する。
【0103】
空間変化学習部180は、単一ガウス分布を仮定した場合、例えば、以下の式(9)を用いて、選択中の部分(画素)の画素値・距離空間変化に対する生起確率を、空間変化パターンスコアscore(v
comb)として求める。
【数9】
【0104】
また、空間変化学習部180は、混合ガウス分布を仮定した場合、例えば、以下の式(10)を用いて、選択中の部分(画素)の画素値・距離空間変化に対する生起確率を、空間変化パターンスコアscore(v
comb)として求める。
【数10】
【0105】
そして、ステップS6400において、スコア計算部200は、左目画像のうち、選択の対象となる領域の全てを処理したか否かを判断する。スコア計算部200は、全てを処理していない場合(S6400:NO)、ステップS6100へ戻る。また、スコア計算部200は、全てを処理した場合(S6400:YES)、ステップS6500へ進む。
【0106】
ステップS6500において、スコア計算部200は、計算された各部分の、画素値スコアscore(p
color)、画素値スコアscore(p
dist)、および空間変化パターンスコアscore(v
comb)を取得する。領域分割部210は、スコア計算部200により取得された画素値スコアscore(p
color)、画素値スコアscore(p
dist)、および空間変化パターンスコアscore(v
comb)に基づいて、左目画像からの対象画像の抽出を行う。そして、領域分割部210は、
図3の処理へ戻る。
【0107】
次は、対象画像の抽出手法の一例について説明する。
【0108】
領域分割部210は、グラフカット手法により、スコアを最適化する画素の組み合せを得ることで領域分割を行う。より具体的には、領域分割部210は、以下の式(11)で表されるエネルギーE(p)が最小となるような、左目画像の二分割線を求める。エネルギーE(p)は、つまり、対象領域であることの尤もらしさを示す指標値としてのスコアである。エネルギーE(p)を最小化する方法としては、例えば、最大流最小カット定理を用いることができる。なお、λは、所定のパラメータ係数である。
【数11】
【0109】
ここで、g(X
color,X
dist)は、以下の式(12)で表される。また、h(X
color,X
dist,m)は、以下の式(13)で表される。
【数12】
【数13】
【0110】
式(11)において、1つ目の項は、指定領域と他の部分との間の類似度など、画像中の各画素値に依存する値である。そして、2つ目の項は、隣接画素間の画素値差など、隣接画素間の値の変化に依存する値である。この点、本実施の形態におけるグラフカット手法は、従来のグラフカット手法と同一である。また、エネルギー計算式は、式(11)に示すように従来のグラフカットの定式と同じ形式となっているため、グラフカット法と同じ方法で領域分割を行うことができる。
【0111】
ところが、従来のグラフカット手法のエネルギー計算式では、2つ目の項の値は、隣接画素間の画素値差など隣接画素間の値の変化が小さいほど、小さくなる。これに対し、本実施の形態におけるエネルギー計算法では、2つ目の項の値は、指定領域と他の部分との間で空間変化のパターンが類似しているほど、大きくなる。したがって、本実施の形態においてグラフカット手法により得られる効果は、従来のグラフカット手法とは異なる。
【0112】
そして、
図3のステップS7000において、結果出力部220は、対象領域の抽出結果を示す抽出結果情報(対象領域分割処理の結果)を出力する。
【0113】
そして、ステップS8000において、ステレオ画像撮影部110は、ユーザ操作などにより処理の終了を指示されたか否かを判断する。ステレオ画像撮影部110は、処理の終了を指示されていない場合(S8000:NO)、ステップS1000へ戻る。また、ステレオ画像撮影部110は、処理の終了を指示された場合(S8000:YES)、一連の処理を終了する。
【0114】
このような動作により、画像領域抽出装置100は、指定領域と画像の各部分との間における、画素値変化パターンおよび距離変化パターンの類似度に基づいて、対象領域の抽出を行うことができる。
【0115】
以上で、画像領域抽出装置100の動作についての説明を終える。
【0116】
以上のように、本実施の形態に係る画像領域抽出装置100は、指定領域と画像の各部分との間における、画素値変化パターンおよび距離変化パターンの類似度に基づいて、対象領域の抽出を行うことができる。これにより、画像領域抽出装置100は、従来技術に比べて、指定領域に基づいて対象領域を精度良く抽出することができる。
【0117】
(実施の形態3)
本発明の実施の形態3は、画素値成分の類似度および距離成分の類似度に対して、それぞれの対象領域の特徴に対する寄与度に応じた重み付けを行うようにした例である。
【0118】
図12は、本実施の形態に係る画像領域抽出装置の構成の一例を示すブロック図であり、実施の形態2の
図2に対応するものである。
図2と同一部分には、同一符号を付し、これについての説明を省略する。
【0119】
図12において、画像領域抽出装置100aは、
図2の構成に加えて、分布計算部230a、画素値・距離重み計算部240a、および画素値・距離データベース(DB)250aを更に有する。また、画像領域抽出装置100aは、
図2のスコア計算部200および領域分割部210に代えて、スコア計算部200aおよび領域分割部210aを有する。
【0120】
なお、本実施の形態において、距離情報計算部140は、デプス情報および左目画像を、分布計算部230aへも出力する。また、ユーザ指示入力部130は、指定領域情報を、分布計算部230aへも出力する。
【0121】
分布計算部230aは、指定領域における、画素値成分の分布および距離成分の分布を取得する。本実施の形態において、画素値成分の分布は、画素値成分のガウス分布の分散を含む。また、距離成分の分布は、距離成分のガウス分布の分散を含むものとする。そして、分布計算部230aは、取得した画素値成分の分布および距離成分の分布を、画素値・距離重み計算部240aへ出力する。
【0122】
なお、分布計算部230aは、
図12に示すように、画素値成分の分布を算出する画素値分布計算部231aと、距離成分の分布を算出する距離分布計算部232aを有してもよい。
【0123】
画素値・距離重み計算部240aは、入力された画素値成分の分布から、指定領域の画素値成分の特徴の、対象領域の特徴に対する寄与度を、画素値情報係数(第1の重み)αとして決定する。また、画素値・距離重み計算部240aは、入力された距離成分の分布から、指定領域の距離成分の特徴の対象領域の特徴に対する寄与度を、距離情報係数(第2の重み)βとして決定する。より具体的には、画素値・距離重み計算部240aは、画素値成分の分散が高いほど、画素値情報係数αをより低く決定し、距離成分の分散が高いほど、距離情報係数βをより低く決定する。これは、分散が高い成分ほど、情報の均一性が高く、対象領域の特徴に対する寄与度が低いと考えられるからである。そして、画素値・距離重み計算部240aは、決定した画素値情報係数αおよび距離情報係数βを、画素値・距離データベース250aに記憶させる。
【0124】
画素値・距離重み計算部240aは、例えば、画素値成分の分散と画素値情報係数α、および、距離成分の分散と距離情報係数βをそれぞれ対応付けた、重み決定テーブルを予め有している。この場合、画素値・距離重み計算部240aは、重み決定テーブルを参照して、指定領域ごとに、画素値情報係数αおよび距離情報係数βを決定する。
【0125】
図13は、重み決定テーブルの内容の一例を示す図である。
【0126】
図13に示すように、重み決定テーブル360は、距離成分の分散361と画素値成分の分散362との組み合わせごとに、画素値情報係数(α)363および距離情報係数(β)364を記述している。
【0127】
画素値・距離データベース250aは、上記画素値情報係数αおよび距離情報係数βを記憶する。
【0128】
スコア計算部200aは、実施の形態2のスコア計算部200と同様の機能を有する。ただし、スコア計算部200aは、画素値成分の類似度(画素値スコア)に画素値情報係数αを掛けた値と、距離成分の類似度(距離スコア)に距離情報係数βを掛けた値とを加算して得られる値に基づいて、スコアを算出する。
【0129】
領域分割部210aは、実施の形態2の領域分割部210と同様の機能を有する。ただし、領域分割部210aは、画素値情報係数αおよび距離情報係数βを適用して得られるスコアに基づいて、対象領域の抽出を行う。
【0130】
図14は、本実施の形態における指定領域学習処理(
図3のステップS5000)の一例を示すフローチャートであり、実施の形態2の
図9に対応するものである。
図9と同一部分には、同一ステップ番号を付し、これについての説明を省略する。
【0131】
ステップS5300aにおいて、分布計算部230aは、指定領域について、画素値成分の分散および距離成分の分散を算出する。
【0132】
そして、ステップS5400aにおいて、画素値・距離重み計算部240aは、画素値成分の分散および距離成分の分散から、画素値情報係数αおよび距離情報係数βを決定し、画素値・距離データベース250aに記憶させる。
【0133】
図15は、本実施の形態における対象領域分割処理(
図3のステップS6000)の一例を示すフローチャートであり、実施の形態2の
図11に対応するものである。
図11と同一部分には同一ステップ番号を付し、これについての説明を省略する。
【0134】
ステップS6500aにおいて、領域分割部210aは、画素値情報係数αおよび距離情報係数βを適用して得られるスコアに基づいて、対象領域の抽出を行う。より具体的には、領域分割部210aは、例えば、以下の式(14)を用いて、式(11)に示したエネルギー計算式の1つ目の項のg(X
color,X
dist)を計算する。
【数14】
【0135】
そして、領域分割部210aは、実施の形態2と同様に、式(11)で表されるエネルギーE(p)が最小となるような、左目画像の二分割線を求める。エネルギーE(p)は、上述の通り、対象領域であることの尤もらしさを示す指標値としてのスコアである。
【0136】
このように、本実施の形態に係る画像領域抽出装置100aは、画素値成分の類似度および距離成分の類似度に対して、それぞれの対象領域の特徴に対する寄与度に応じた重み付けを行ってスコアを算出し、対象領域の抽出を行う。すなわち、画像領域抽出装置100aは、指定領域における画素値成分および距離成分の分布のばらつきに応じて、画素値成分の類似度および距離成分の類似度に対する重み付けを動的に変更させることができる。
【0137】
類似度に対する重み付けは、例えば、指定領域内の距離成分の分散および画素値成分の分散の両方が小さい場合、色分布の分散が小さい場合、いずれの成分も対象領域の特徴に対する寄与度は高く、いずれかに偏重させる必要性は低い。
【0138】
一方、例えば、画素値成分の分散が大きい場合、画素値成分については、対象領域の特徴に対する寄与度は低く、指定領域との間の類似度が大きくばらつく可能性が高くなる。このような場合は、安定した類似度が得られる距離成分の類似度に対する重みを大きくすることにより、画素値成分の変動による影響を抑えることができ、領域抽出の安定性を向上させることができる。逆に、距離成分の分散が大きい場合は、同様に、画素成分の類似度に対する重みを大きくすることにより、距離成分の変動による影響を抑えることができ、領域抽出の安定性を向上させることができる。
【0139】
したがって、本実施の形態に係る画像領域抽出装置100aでは、領域分割の安定性・精度の向上が期待できる。
【0140】
なお、指定画像における距離成分の分散および画素値成分の分散が一定であるような場合、画素値情報係数αおよび距離情報係数βは、固定値であってもよい。また、画素値情報係数αおよび距離情報係数βは、ユーザ指定など、別の手段により決定されてもよい。
【0141】
また、本実施の形態では、画素値成分の類似度および距離成分の類似度に対して重み付けを行う例について説明した。なお、画像領域抽出装置100aは、同様に、画素値空間パターンの類似度および距離空間パターンの類似度に対して、重み付けを行ってもよい。この重み付けは、画素値成分の類似度および距離成分の類似度に対する重み付けと独立して行われてもよいし、画素値成分の類似度および距離成分の類似度に対する重み付けと対応する値で行われてもよい。
【0142】
なお、以上説明した実施の形態2および実施の形態3では、ステレオ画像からステレオ法により各部分の距離成分を取得する例について説明したが、距離成分の取得手法は、これに限定されない。例えば、画像領域抽出装置は、無線信号による測距を行うことにより、距離成分を取得してもよい。
【0143】
また、画像領域抽出装置は、類似度の算出を、画素ごとに行ってもよいし、複数の画素から成る小領域ごとに行ってもよい。