(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0012】
以下、本発明の一実施形態を図面に基づいて説明する。
図1は、本実施形態による画像処理装置100の機能構成例を示すブロック図である。
図1に示すように、本実施形態の画像処理装置100は、その機能構成として、撮影画像取得部11、物体抽出部12、主成分分析部13、正規化処理部14、境界抽出部15、特徴量算出部16、比較画像取得部17、比較データ生成部18、画像マッチング部19および比較データ記憶部20を備えている。
【0013】
上記各機能ブロック11〜19は、ハードウェア、DSP(Digital Signal Processor)、ソフトウェアの何れによっても構成することが可能である。例えばソフトウェアによって構成する場合、上記各機能ブロック11〜19は、実際にはコンピュータのCPU、RAM、ROMなどを備えて構成され、RAMやROM、ハードディスクまたは半導体メモリ等の記録媒体に記憶されたプログラムが動作することによって実現される。
【0014】
撮影画像取得部11は、単眼カメラ200を用いて実空間を撮影することにより生成される2次元画像を取得する。なお、
図1の例では、パーソナルコンピュータ等の画像処理装置100に単眼カメラ200を接続しておき、単眼カメラ200で撮影された2次元画像を撮影画像取得部11がリアルタイムに取得する例を示しているが、本発明はこれに限定されない。例えば、単眼カメラ200で撮影した2次元画像をメモリに記憶させ、このメモリに記憶された2次元画像を撮影画像取得部11が後から取り込むようにしてもよい。
【0015】
物体抽出部12は、撮影画像取得部11により取得された撮影画像から背景を除去して対象物体の画像である対象画像を抽出する。例えば、物体抽出部12は、撮影画像に対して前景抽出処理を行うことにより、撮影画像内に写っている認識対象物体の画像を抽出する。前景抽出処理には公知の手法を採用することが可能である。例えば、グラフカットを用いた前景抽出処理を適用することが可能である。また、対象物体の画像および背景の画像を教師データとして用い、当該教師データから生成した学習データを用いて前景抽出処理を行うようにしてもよい。
【0016】
主成分分析部13は、物体画像(物体抽出部12により抽出された対象画像および後述する比較画像取得部17により取得された比較画像)に対して主成分分析を行い、第1主成分方向および第2主成分方向を定める。主成分分析とは、元の多数の説明変数で表わされる情報を数個の主成分に要約して表現するための公知の処理である。本実施形態では、物体画像の各ピクセル値を説明変数として、これらの説明変数に座標変換を行って、総合指標となる2つの変数(第1主成分方向および第2主成分方向)を生成する。
図2に示すように、第1主成分方向は物体のおよその長尺方向であり、第2主成分方向は物体のおよその短尺方向である。
【0017】
正規化処理部14は、物体画像が正規化された大きさとなるように、物体画像を正規化する。具体的には、正規化処理部14は、主成分分析部13により特定された第1主成分方向および第2主成分方向により物体画像を正規化する。ここで言う正規化とは、第1主成分方向および第2主成分方向に対する特徴ベクトルの大きさが1となるように、物体画像の大きさを拡大または縮小する処理のことである。これにより、同じ対象物体を撮影した場合には、例えば撮影距離の違いによって撮影画像内に写る物体画像の大きさが異なっても、正規化処理後は略同じ大きさの物体画像に整えることができる。
【0018】
境界抽出部15は、正規化処理部14により正規化された物体画像から、物体の境界(シルエット)を抽出する。境界の抽出は、例えば、いわゆるエッジ検出処理(画像の輝度や色などが鋭敏に(不連続に)変化している箇所を特定する処理)によって行うことが可能である。
【0019】
特徴量算出部16は、境界抽出部15により抽出された境界の各ピクセル位置および当該各ピクセル位置における各特徴量を算出する。境界のピクセル位置ごとに特徴量が求まるのであれば、その算出方法は任意である。例えば、特徴量算出部16は、以下に説明するバイナリ特徴量を境界のピクセル位置毎に算出する。
図3は、バイナリ特徴量の算出方法を説明するための図である。
【0020】
まず、特徴量算出部16は、
図3(a)に示すように、物体のシルエット画像の注目するピクセル31を中心として、一辺の大きさをn(nは2以上の任意の整数)とするn×nのボクセル32を設定する。
図3(a)の例は、n=5としてボクセル32を設定した場合を示している。注目ピクセル31は、シルエット画像において物体の境界線33があるピクセルの中の1つである。
【0021】
次に、特徴量算出部16は、
図3(b)に示すように、各ボクセル32の符号化を行う。具体的には、特徴量算出部16は、境界線33のピクセルを含むボクセル32は値を1とし、含まないボクセル32は値を0とする。なお、0と1の符号化は逆パターンとしてもよい。すなわち、境界線33のピクセルを含むボクセル32は値を0、含まないボクセル32は値を1としてもよい。
【0022】
さらに、特徴量算出部16は、
図3(c)に示すように、符号化された各ボクセル32の値を横方向、縦方向、斜め2方向の4方向に取得し、それらを順に配列して20次元のバイナリ列を生成する。これが求めるバイナリ特徴量である。なお、ここに挙げた4方向およびその配列の順番は一例であって、これに限定されるものではない。特徴量算出部16は、物体の境界線33に沿って注目ピクセル31を1つずつ移動させ、境界線33上のピクセル位置ごとにバイナリ特徴量を算出する。
【0023】
比較画像取得部17は、撮影画像から認識したい対象物体と同じ画像を比較画像として取得する。例えば、比較画像取得部17は、パーソナルコンピュータ等で生成された物体のCG画像を取得する。取得の形態は任意である。例えば、画像処理装置100にパーソナルコンピュータを接続し、比較画像取得部17がパーソナルコンピュータからダイレクトに比較画像を取得する。あるいは、パーソナルコンピュータ等で生成された比較画像をメモリに記憶させ、このメモリに記憶された比較画像を比較画像取得部17が取り込むようにしてもよい。
【0024】
撮影画像から対象物体の形状を認識したい場合、比較画像取得部17は、形状の異なる様々な物体に関する比較画像を取得する。また、撮影画像から対象物体の姿勢(対象物体が向いている方向)を認識したい場合、比較画像取得部17は、同じ物体に関して姿勢の異なる様々な比較画像を取得する。撮影画像から対象物体の形状および姿勢の両方を認識したい場合、比較画像取得部17は、形状の異なる様々な物体のそれぞれに関して、姿勢の異なる様々な比較画像を取得する。ここで、比較画像取得部17は、各種の比較画像を、当該比較画像が表す物体の形状または姿勢の少なくとも何れか一方を示す情報と共に取得する。
【0025】
上述した主成分分析部13、正規化処理部14、境界抽出部15および特徴量算出部16は、比較画像取得部17により取得された比較画像についても同様の処理を行う。これは、認識したい対象物体を単眼カメラ200で撮影する前に、あらかじめ行っておく。この場合、主成分分析部13は、比較画像取得部17により取得された比較画像に対して主成分分析を行い、第1主成分方向および第2主成分方向を定める。
【0026】
正規化処理部14は、比較画像取得部17により取得された比較画像が正規化された大きさとなるように、比較画像を正規化する。これにより、正規化された比較画像により表される物体画像の大きさと、撮影画像から抽出され正規化される物体画像の大きさとを略同じ大きさに整えることができる。境界抽出部15は、正規化処理部14により正規化された比較画像から物体の境界(シルエット)を抽出する。特徴量算出部16は、境界抽出部15により抽出された境界の各ピクセル位置および当該各ピクセル位置における各バイナリ特徴量を算出する。
【0027】
比較データ生成部18は、物体に関する複数の比較画像について主成分分析部13、正規化処理部14、境界抽出部15および特徴量算出部16の各処理を行うことによってあらかじめ生成された各ピクセル位置および各バイナリ特徴量のセットを、複数の比較画像毎に、当該比較画像が表す物体の形状または姿勢の少なくとも何れか一方を示す情報と合わせて比較データを生成する。そして、生成した比較データを比較データ記憶部20に記憶させる。
【0028】
画像マッチング部19は、特徴量算出部16により対象画像について算出された各ピクセル位置および各バイナリ特徴量と、比較データ記憶部20に複数の比較画像毎にあらかじめ記憶されている各ピクセル位置および各バイナリ特徴量とに基づいて、最も一致度の高い比較画像を検索する。そして、当該検索した比較画像に関する物体の形状または姿勢を、撮影画像に写る対象物体の形状または姿勢として特定する。
【0029】
具体的には、画像マッチング部19は、特徴量算出部16により対象画像について算出された各ピクセル位置と比較画像について算出された各ピクセル位置との差、および、特徴量算出部16により対象画像について算出された各バイナリ特徴量と比較画像について算出された各バイナリ特徴量との差に基づいて、各ピクセル位置でのバイナリ特徴量の差の大きさが全体として最も小さくなる比較画像を、最も一致度の高い比較画像として検索する。
【0030】
図4は、画像マッチング部19の処理例を説明するための図である。
図4(a)は、撮影画像から抽出された対象物体のシルエット画像を示す。また、
図4(b)〜(d)は、複数の比較画像から抽出された比較物体のシルエット画像を示す。
【0031】
まず、画像マッチング部19は、
図4(a)に示すように、特徴量算出部16により対象画像について算出されたピクセル位置(x1,y1)と、そのピクセル位置において算出されたバイナリ特徴量P11とを取得する。次に、画像マッチング部19は、
図4(b)〜(d)に示す複数の比較画像を対象として、ピクセル位置(x1,y1)から所定の距離以内(符号41で示す範囲)のピクセル位置に、バイナリ特徴量P11とのハミング距離が所定の閾値以下となるバイナリ特徴量を持つ比較画像があるか否かを検索する。
【0032】
ハミング距離とは、対象画像および比較画像のそれぞれから算出された20ビットから成るバイナリ特徴量の対応ビットどうしを比較して、異なる値を示すビットの数をカウントした値のことである。画像マッチング部19は、ハミング距離が所定の閾値以下となる比較画像が検索された場合、その比較画像に対してスコアを加算する。
【0033】
図4(b)に示す比較画像は、
図4(a)の対象画像と略同形同大(大きさは正規化されている)であり、ピクセル位置(x1,y1)から所定の距離以内のピクセル位置に、バイナリ特徴量P11とのハミング距離が所定の閾値以下となるバイナリ特徴量を持つ。よって、この比較画像に対してスコアを加算する。一方、
図4(c)、(d)に示す比較画像は、
図4(a)の対象画像と形状が異なるため、ピクセル位置(x1,y1)から所定の距離以内のピクセル位置に、バイナリ特徴量P11とのハミング距離が所定の閾値以下となるバイナリ特徴量を持たない。よって、これらの比較画像に対してはスコアを加算しない。
【0034】
画像マッチング部19は、以上のような処理を、
図4(a)に示す対象物体の境界線上の各ピクセル位置について順次行う。そして、その結果としてスコアが最も大きくなった比較画像を、対象画像と最も一致度の高い比較画像として抽出する。そして、当該抽出した比較画像に関する物体の形状または姿勢(比較データ記憶部20に記憶されている)を、撮影画像に写る対象物体の形状または姿勢として特定する。
【0035】
図5および
図6は、上記のように構成した本実施形態による画像処理装置100の動作例を示すフローチャートである。
図5は、あらかじめ比較データを生成して記憶させる処理の手順を示す。
図6は、撮影画像から対象物体の形状または姿勢を認識する処理の手順を示す。
【0036】
図5において、まず、比較画像取得部17は、パーソナルコンピュータ等で生成された物体のCG画像を比較画像として取得する(ステップS1)。例えば、比較画像取得部17は、形状の異なる様々な物体に関して、姿勢の異なる様々な比較画像を、当該比較画像が表す物体の形状および姿勢を示す情報と共に取得する。次に、主成分分析部13は、比較画像取得部17により取得された比較画像に対して主成分分析を行い、第1主成分方向および第2主成分方向を定める(ステップS2)。
【0037】
さらに、正規化処理部14は、比較画像取得部17により取得された比較画像が正規化された大きさとなるように、比較画像を正規化する(ステップS3)。続いて、境界抽出部15は、正規化処理部14により正規化された比較画像から物体の境界(シルエット)を抽出する(ステップS4)。そして、特徴量算出部16は、境界抽出部15により抽出された境界の各ピクセル位置および当該各ピクセル位置における各バイナリ特徴量を算出する(ステップS5)。
【0038】
最後に、比較データ生成部18は、特徴量算出部16により複数の比較画像について生成された各ピクセル位置および各バイナリ特徴量のセットを、当該複数の比較画像毎に、当該比較画像が表す物体の形状および姿勢を示す情報と共に比較データ記憶部20に記憶させる(ステップS6)。以上により、撮影画像から対象物体の形状および姿勢を認識するための前準備が完了する。
【0039】
図6において、撮影画像取得部11は、単眼カメラ200を用いて実空間を撮影することにより生成される2次元画像を取得する(ステップS11)。また、物体抽出部12は、撮影画像取得部11により取得された撮影画像から背景を除去して物体の対象画像を抽出する(ステップS12)。次に、主成分分析部13は、物体抽出部12により抽出された対象画像に対して主成分分析を行い、第1主成分方向および第2主成分方向を定める(ステップS13)。
【0040】
さらに、正規化処理部14は、物体抽出部11により抽出された対象画像が正規化された大きさとなるように、対象画像を正規化する(ステップS14)。さらに、境界抽出部15は、正規化処理部14により正規化された対象画像から、物体の境界(シルエット)を抽出する(ステップS15)。続いて、特徴量算出部16は、境界抽出部15により抽出された境界の各ピクセル位置および当該各ピクセル位置における各特徴量を算出する(ステップS16)。
【0041】
最後に、画像マッチング部19は、特徴量算出部16により対象画像について算出された各ピクセル位置および各バイナリ特徴量と、比較データ記憶部20に複数の比較画像毎にあらかじめ記憶されている各ピクセル位置および各バイナリ特徴量とに基づいて、最も一致度の高い比較画像を検索し、当該検索した比較画像に関する物体の形状または姿勢を、撮影画像に写る対象物体の形状または姿勢として特定する(ステップS17)。
【0042】
以上詳しく説明したように、本実施形態では、撮影画像から対象物体を抽出して大きさを正規化した対象画像について、境界の各ピクセル位置および当該各ピクセル位置における各特徴量を算出する。そして、当該算出した各ピクセル位置および各特徴量と、複数の比較画像について同様にしてあらかじめ算出しておいた各ピクセル位置および各特徴量とに基づいて、最も一致度の高い比較画像を検索し、当該検索した比較画像に関する物体の形状または姿勢を、撮影画像に写る対象物体の形状または姿勢として特定するようにしている。
【0043】
このように構成した本実施形態によれば、対象物体の境界を構成するそれぞれのピクセル位置毎に、撮影画像から抽出された物体の対象画像と比較画像との間で特徴量の比較が行われる。そして、最も一致度の高い比較画像が対象画像に最も近い画像として検索され、検索された比較画像により物体の形状または姿勢が特定されることとなる。これにより、従来のように物体上の代表点のみの特徴量に基づき比較を行う場合や、物体の全体の形状等から計算した1つの特徴量に基づき比較を行う場合に比べて精度の高い比較を行うことができ、撮影画像内に写る対象物体の形状や姿勢をより正しく認識することができる。
【0044】
なお、上記実施形態では、主成分分析を行って第1主成分方向および第2主成分方向を特定し、これら2つの方向により物体画像を正規化する例について説明したが、本発明はこれに限定されない。物体画像を正規化することができれば、必ずしも主成分分析による方法によらずともよい。
【0045】
また、上記実施形態では、画像マッチングにおいてハミング距離を算出する例について説明したが、本発明はこれに限定されない。対象画像から算出された特徴量と比較画像から算出された特徴量との類似度を算出することが可能な手法であれば、何れも本発明に適用することが可能である。
【0046】
また、上記実施形態では、対象画像から物体の特徴量を算出する処理と、比較画像から物体の特徴量を抽出する処理とを同じ画像処理装置100の主成分分析部13、正規化処理部14、境界抽出部15および特徴量算出部16を用いて行う例について説明したが、本発明はこれに限定されない。例えば、比較画像から物体の特徴量を抽出する処理を画像処理装置100とは別のパーソナルコンピュータ等で行い、その結果得られた比較データを比較データ記憶部20にあらかじめ記憶しておくようにしてもよい。
【0047】
その他、上記実施形態は、何れも本発明を実施するにあたっての具体化の一例を示したものに過ぎず、これによって本発明の技術的範囲が限定的に解釈されてはならないものである。すなわち、本発明はその要旨、またはその主要な特徴から逸脱することなく、様々な形で実施することができる。