(58)【調査した分野】(Int.Cl.,DB名)
前記符号照合部は、前記符号生成部によって入力画像群から生成された三値符号とテンプレートの三値符号の照合により相違度を算出するものであり、前記輝度勾配の強度の上位同士または下位同士の符号がそれぞれ一致した場合に相違度の評価値を下げ、中位の符号については相違度の算出に寄与させないことを特徴とする、請求項5に記載の物体認識装置。
前記符号生成部は、前記各光源の明滅を選択的に切り替えて撮影した画像の輝度勾配の強度の大きさに基づいて、画素毎に符号の有効または無効を判定し、有効または無効に関する情報を生成することを特徴とする、請求項9に記載の物体認識装置。
前記符号生成部は、同一対象物を撮影した複数の画像をもとに計算した各画素の安定度に基づいて、画素毎に符号の有効または無効を判定し、有効または無効に関する情報を生成することを特徴とする、請求項9に記載の物体認識装置。
前記符号生成部が行う符号の生成、および前記符号照合部が行う符号の照合において、使用する光源の数と方向を事前に最適化する機能を有することを特徴とする、請求項1から14のいずれか1項に記載の物体認識装置。
発光輝度を能動的に制御することが可能な光源を複数備え、事前に撮影された画像中の各画素の明るさを調べ、明るさに応じて前記各光源の発光輝度を制御して再撮影することを特徴とする、請求項1から15のいずれか1項に記載の物体認識装置。
前記カメラはシャッタースピードとゲインの少なくともいずれか一方の能動的な制御が可能なカメラであって、事前に撮影された画像中の各画素の明るさを調べ、明るさに応じて前記カメラのシャッタースピードおよびゲインを制御して再撮影することを特徴とする、請求項1から16のいずれか1項に記載の物体認識装置。
【発明を実施するための形態】
【0015】
以下、本発明に係る実施形態について図面を参照して説明する。なお、以下の各実施形態において、同様の構成要素については同一の符号を付している。本発明に係る実施形態では、物体に対して異なる方向から光を照射しながら画像を取得し、これらの画像から生成した符号を用いたマッチングを行うことにより、従来技術に比較して、対象物の見えの変化に対する頑健性を高めた高精度な物体認識装置を提供する。
【0016】
実施の形態1.
図1は、実施の形態1に係る物体認識装置100の構成を示している。
図1において、実施の形態1に係る物体認識装置100は、カメラ101と、複数N個の光源102−1〜102−Nと、制御部103と、符号生成部104と、テンプレート記憶部105と、符号照合部106とを備えて構成される。これらの構成部分について、以下に詳細説明する。
【0017】
図1において、カメラ101は、制御部103からの制御信号を受信すると、認識対象物の画像を撮影し、撮影した画像の画像データを符号生成部104に送出する。光源102−1〜102−Nは上記認識対象物に光を照射する。光源102−1〜102−Nはそれぞれ、制御部103からの制御信号を受けて1個ずつ順次独立して選択的に明滅する。すなわち、N個の光源102−1〜102−Nのうち2個以上が同時に点灯することはないものとする。ここでは、N個の光源102に対し1番からN番まで順番に付番し、以降この番号を光源IDと呼ぶこととする。
【0018】
制御部103は例えばディジタル計算機などのコントローラであって、N個の光源102−1〜102−Nのうち1つに対して制御信号を送出し、これと同時にカメラ101に対して制御信号を送出し、また符号生成部104に対して光源ID情報を送出する。この動作をN個の光源102−1〜102−Nのそれぞれに対して1個ずつ順次選択的に行う。符号生成部104は、カメラ101から受信したN枚の画像データから符号を生成する。なお、符号生成部104は、各光源102−1〜102−Nの光源IDと、その光源102−1〜102−Nからの光の照射方向とを対応付ける、
図2に示すような光源方向情報テーブルを内部メモリ104mに保持しているものとする。この光源方向情報テーブルの情報は、後に述べる符号生成部104の内部処理で使用する。以降、光源からの光の照射方向のことを光源方向と呼ぶこととする。なお、光の照射方向は、例えば
図3に示すように、カメラ101を中心として、各光源102−1〜102−Nの位置の角度を示す。
【0019】
テンプレート記憶部105は、認識対象物のテンプレート符号を記憶する。物体認識装置100で認識させたい認識対象物の符号をあらかじめ生成しておき、テンプレート符号として保持しておく。符号照合部106は、テンプレート記憶部105に記憶されているテンプレート符号を読み出し、符号生成部104で生成された参照画像の符号との照合、すなわちテンプレートマッチング処理を行う。テンプレート符号と参照画像の符号を照合することにより、参照画像中での認識対象物の位置を認識し、当該認識結果を出力する。
【0020】
図3は、実施の形態1に係る物体認識装置100の外観と、各光源102−1〜102−Nに光源IDを割り当てた一例を示した模式図である。
図3の例では、N=8であり、8個の光源102−1〜102−8がカメラ101の光軸から等距離、かつ互いに等間隔になるように配置されている。それぞれの光源102−1〜102−8の光源IDは、カメラ101の上方の光源102−1から、時計回りに順番に付番してある。なお、N個の光源102−1〜102−8の配置は、
図3のように必ずしも等間隔である必要はなく、カメラ101の光軸から等距離である必要もない。また、
図3の例のようにカメラ101と光源102−1〜102−8を一体化した筐体とする必要はなく、別個の筐体としてもよい。
【0021】
図4は、平面の背景201の上に認識対象物の直方体202を配置したシーンにおいて、シーンの真上から物体認識装置100で直方体202を撮影する様子を示した模式図である。このような状況で、物体認識装置100に備えられる光源102−1〜102−Nの明滅を順次選択的に切り替えながら撮影した画像の模式図を
図5A及び
図5Bに示す。
図5Aでは、直方体202に対して画像の上方向から光を照射した場合の例を示し、
図5Bでは、左下方向から光を照射した場合の撮影画像の場合の例を示している。直方体202に光を照射することにより、直方体202の背面にある平面の背景201に影203が生じる。光源102による光の照射方向を変化させることにより、直方体202の周囲に現れる影203の位置が変化する。
【0022】
次に、本発明の実施の形態1に係る物体認識装置100が物体認識を行う流れを説明する。
【0023】
はじめに、物体認識装置100で認識させたい対象物をテンプレートとして登録するため、基準となる物体を用いてテンプレート符号を生成する。
【0024】
カメラ101の視野内に認識対象物(基準物体)を配置し、制御部103の制御によりN個の光源102−1〜102−Nを1個ずつ順次選択的に点灯させながら、カメラ101で画像データをN枚取得する。N枚の画像データを撮影している間、カメラ101と認識対象物の相対的な位置関係は不変であることとする。こうして得られたN枚の画像データから、符号生成部104で符号を生成する。生成した符号は、テンプレート記憶部105へ送出され、テンプレート符号としてテンプレート記憶部105で記憶される。
【0025】
物体認識を行う際の流れは、符号生成部104での符号生成までは同じである。すなわち、カメラ101の視野に認識対象シーンを配置し、光源102−1〜102−Nの明滅を順次選択的に切り替えながらN枚の参照画像を撮影し、符号生成部104で符号を生成する。その後、テンプレート記憶部105に記憶されている符号と、N枚の参照画像から生成された符号との照合を符号照合部106で実行し、物体の位置を認識する。
【0026】
以上が、物体認識装置100がテンプレートを事前登録する流れと、物体認識を実行する流れである。
【0027】
次に、符号生成部104による符号の生成手順について説明する。
【0028】
まず、カメラ101の視野内に対象物を配置し、N個の光源102−1−1〜102−Nを1個ずつ順次選択的に点灯させながらカメラ101で画像を取得する。こうして得られたN枚の画像データをそれぞれI
1からI
Nとおく。その後、画像データI
1からI
Nのそれぞれに対し、光源方向に沿う方向の輝度勾配の強度(隣接画素間の輝度の差の絶対値をいい、「輝度勾配強度」という。)を計算し、輝度勾配の画像データ(以下、「輝度勾配画像データ」という。)I
1’からI
N’を求める。ここで光源方向は、
図2に示すような光源方向情報テーブルを参照することにより得られる。カメラ101で撮影した画像(a)とその輝度勾配画像(b)の模式図を
図6A及び
図6Bに示す。
図6A及び
図6Bではそれぞれ、
図5A及び
図5Bと同様に2方向の光源方向についての輝度勾配画像の模式図を示している。例えば、左下から光を照射したときの画像の輝度勾配画像は、左下の画素の輝度の差の絶対値を表現した画像である。
【0029】
輝度勾配画像において勾配強度が大きくなるのは、光の照射によって明るく照らされた領域と影の領域の境界部分であり、この部分にエッジが現れる。このエッジは、対象物の奥行きが急激に変化する箇所、すなわち物理形状の輪郭に沿って現れる。したがって、異なる方向から光を当てたときの輝度勾配強度の違いは、対象物の奥行き形状がどの向きに変化しているかという情報を与えているとみることができる。符号生成部104によって生成される符号は、画素毎にN次元ベクトルで表現する。光源IDがkの輝度勾配画像データI’
kの、座標(x,y)の輝度勾配強度をI’
k(x,y)とすると、座標(x,y)に割り当てる符号u(x,y)を次式で表す。
【0031】
ここで、記号Tは転置を表す。画像内の全ての画素について、上記のように符号を生成する。以上が、符号生成部104が撮影画像から符号を生成する手順である。
【0032】
図7は、カメラ101により撮影されたN枚の画像データから、符号生成部104が生成した符号を濃淡画像として表現した模式図を示している。撮影した物体を基準物体として登録する事前登録の段階では、認識対象物を含む範囲(点線で図示)を符号から切り出し、テンプレート記憶部105へ格納しておく。
【0033】
次に、符号照合部106において符号を照合することにより物体の位置を認識する手順について説明する。前に述べたように、符号照合部106では、認識対象シーンの撮影画像(参照画像)から生成された符号を、テンプレート記憶部105に記憶されている符号と照合し、符号の相違度が最小となる位置を求める。
【0034】
いま、参照画像から求められた勾配強度により構成される、座標(i,j)の画像データの符号をs(i,j)とおく。また、テンプレート記憶部105に記憶されている、座標(i,j)のテンプレート符号をt(i,j)とし、そのサイズを横W画素、縦H画素とおく。このとき相違度は、2つの符号ベクトルの内積を<,>と表記すると、内積の総和、すなわち次式により求める。
【0036】
そして、認識対象物の物体の位置は、上記の式(1)を最小にする座標(x,y)として求める。なお、認識対象物の画像上での大きさ(スケール)が事前登録時と物体認識時とで変化する場合は、符号照合部106においてテンプレート符号のスケールを変動させ、相違度を評価すればよい。例えば、テンプレート符号t(i,j)を成分t
1(i,j),t
2(i,j),…に分割し、成分毎に2次元最近傍法やスプライン補間法などを用いて拡大・縮小することにより、異なるスケールのテンプレート符号が得られる。これらのテンプレート符号を切り替えながら照合を繰り返し、相違度が最小となる位置とスケールを求める。
【0037】
以上のように構成された実施の形態1によれば、符号生成部104で生成される符号は、異なる方向から光を当てたときの輝度勾配強度に関する情報を持つことになる。この輝度勾配は、光を当てる方向と対象物の物理形状に依存する。すなわち符号生成部104では、対象物の物理形状に関する有効な情報を画素毎に符号として割り当てるため、この符号を用いてテンプレートマッチングを行えば、物体の立体形状情報に基づいた高精度な物体認識を実現することが可能となる。
【0038】
以上の実施の形態において、各光源102−1〜102−Nの明滅を制御して当該各光源102−1〜102−Nの明滅に同期してカメラ101に撮像トリガ信号を送出しているが、本発明はこれに限らず、当該各光源102−1〜102−Nの明滅に非同期で(ただし、各光源102−1〜102−Nとの対応は必要)カメラ101に撮像トリガ信号を送出してもよい。
【0039】
実施の形態2.
実施の形態1に係る物体認識装置100に備えられる符号生成部104は、実施の形態2において、輝度勾配強度の順位を符号として生成するようにしてもよい。実施の形態1に係る物体認識装置100が備える符号生成部104との違いは、カメラ101により撮影されたN枚の画像データから勾配強度を算出した後、勾配強度の順位を求める点である。
【0040】
図8は、N=8の場合について、ある座標の輝度勾配強度とその順位の一例を示した図である。輝度勾配強度の大きい光源方向に対応する光源IDから順番に、1から8まで順位付けを行う。実施の形態2に係る符号生成部104によって生成される符号は、画素毎にN次元ベクトルで表現する。座標(x,y)の画像データにおいて、光源IDがkの勾配強度の順位をr
k(x,y)(ただし
【数3】
)と表記すると、座標(x,y)に割り当てる符号r(x,y)を次式で表す。
【0042】
画像データ内の全ての画素について、上記のように符号を生成する。以上が、符号生成部104が撮影画像から符号を生成する手順である。
【0043】
符号照合部106による符号の照合は、輝度勾配強度の順位の差を相違度として評価することにより実行する。いま、参照画像データから求められた輝度勾配強度により構成される、座標(i,j)の画像データにおける符号を次式で表す。
【0045】
また、テンプレート記憶部105に記憶されている、座標(i,j)のテンプレート符号を次式で表す。
【0047】
そのサイズを横W画素、縦H画素とおく。このときの相違度は、輝度勾配強度の順位の差の総和、すなわち次式として求める。
【0049】
そして、認識対象物の物体の位置は、上記の式(2)を最小にする座標(x,y)として求める。なお、認識対象物の画像上での大きさ(スケール)が事前登録時と物体認識時とで変化する場合は、実施の形態1に係る符号照合部106と同様に、テンプレート符号のスケールを変動させ、相違度を評価すればよい。
【0050】
以上のように構成された実施の形態2によれば、符号生成部104で生成される符号は勾配強度の順位であるため、勾配強度の順位が入れ替わらない範囲での勾配強度の変動に対して頑健な物体認識を実現することができる。
【0051】
実施の形態3.
実施の形態1に係る物体認識装置100に備えられる符号生成部104は、実施の形態3において、輝度勾配強度の順位を2段階に分類した結果を表現した二値符号を生成し、符号照合部106は符号生成部104で生成された二値符号をハミング距離によって照合するように構成してもよい。
【0052】
実施の形態3に係る符号生成部104によって生成される符号は、画素毎にNビットの二進数で表現する。各画素の符号を構成するNビットを、それぞれ光源IDの1からNに対応させる。実施の形態2に係る符号生成部104によって生成される符号との違いは、画素毎の輝度勾配強度の順位を求めた後、順位を上位と下位の2段階に分類し、その結果を二値符号とする点である。輝度勾配強度の順位が上位に含まれる光源IDは、対応する二値符号のビットを1にセットし、下位に含まれる光源IDは、対応する二値符号のビットを0にセットする。このような手順により、画像データ内の全ての画素について、Nビットからなる二値符号を生成する。
【0053】
図9は、N=8の場合について、ある画素の輝度勾配強度とその順位、さらに順位を2段階に分類して二値符号を生成した例を示している。勾配強度の順位r
kを求めるまでの処理の流れは、
図8と同様である。本実施の形態では、勾配強度の順位を求めた後、順位が上位4つの光源ID(2,3,4,6)について、対応するビットに1をセットし、下位4つの光源ID(1,5,7,8)について、対応するビットに0をセットする。こうして得られた8ビットが、この画素の二値符号となる。符号照合部106による符号の照合は、参照画像から生成した符号とテンプレート符号とのハミング距離に基づいて相違度を評価することにより実行する。ハミング距離とは、ビット長が同じ2つの2進数を比較したときの、値が異なっているビットの個数である。
【0054】
図10は、ある画素について、テンプレートの二値符号と参照画像から生成した二値符号からハミング距離を求める一例を示している。値が一致している部分には○を、異なっている部分には×を記している。
図10の例の場合、値が異なっているビットは4個であるため、この画素のハミング距離は4である。
【0055】
いま、参照画像データから生成された符号をSとおく。また、テンプレート記憶部105に記憶されているテンプレート符号をTとし、そのサイズをW×Hとおく。2つの2進数b
1,b
2の間のハミング距離をH(b
1,b
2)と表記すると、相違度はハミング距離の総和、すなわち次式により求める。
【0057】
そして、認識対象物の物体の位置は、上記の式(3)を最小にする座標(x,y)として求める。なお、ハミング距離H(b
1,b
2)は以下の手順で高速に求めることができる。あらかじめ、10進数a(0≦a<2
N)を2進数に変換した際に値が1となる桁の数をサイズ2
Nのテーブルt(a)に格納しておく。例えば、10進数151を2進数に変換すると10010111であり、1となる桁の数は5であるから、t(151)=5である。
【0058】
いま、2進数b
1とb
2の排他的論理和を10進数化した値をXOR
10(b
1,b
2)と表すとすると、2つの2進数b
1,b
2の間のハミング距離は、テーブルt(・)の参照により次式によって求められる。
【0060】
このように、あらかじめテーブルを作成しておくことにより、ハミング距離を高速に計算することが可能となる。
【0061】
また、認識対象物の画像上での大きさ(スケール)が事前登録時と物体認識時とで変化する場合は、符号照合部106においてテンプレート符号T(i,j)のスケールを変動させ、相違度を評価すればよい。例えば、T(i,j)を2次元最近傍法によって拡大・縮小することにより、大きさの異なるテンプレートが得られる。これらのテンプレートを切り替えながら照合を繰り返し、相違度が最小となる位置とスケールを求める。
【0062】
以上のように構成された実施の形態3によれば、符号生成部104で生成される符号は、勾配強度順位を上位と下位の2段階に分類した結果を二値化したものであるから、物体の位置ずれやノイズなどの外乱に起因する勾配強度の変動だけでなく、順位の入れ替わりに対しても頑健に物体認識を行うことができる。
【0063】
さらに、符号照合部106による相違度の評価はハミング距離に基づくことから、ビット演算とテーブルの参照に基づく演算として実現できるので、ディジタル計算機上で高速に符号の照合を実行することができる。
【0064】
実施の形態4.
実施の形態1に係る物体認識装置100に備えられる符号生成部104は、実施の形態4において、輝度勾配強度の順位を上位、中位及び下位の3段階に分類した結果を表現した三値符号を生成し、符号照合部106は符号生成部104で生成された三値符号を照合するように構成してもよい。実施の形態4に係る符号生成部104によって生成される符号は、1画素につきN桁の三値符号で表現する。
【0065】
図11は、N=8の場合について、ある座標の輝度勾配強度からN桁の三値符号を生成する流れの一例を示した図である。輝度勾配強度の順位r
kを求めるまでの処理の流れは、
図8および
図9と同様である。本実施の形態では、輝度勾配強度の順位を求めた後、順位が上位2つの光源ID(2,3)について、対応する桁に1をセットし、中位4つの光源ID(1,4,5,6)について、符号*をセットし、下位2つの光源ID(7,8)について、対応するビットに0をセットする。
図11では、上位、中位及び下位に分類する光源IDの数をそれぞれ2,4,2としているが、上位、中位及び下位のそれぞれに分類する数の配分はこの限りではない。
【0066】
次に、本発明の実施の形態4に係る符号生成部104により生成される三値符号を、符号照合部106で照合する手順を説明する。本発明の実施の形態3に係る符号照合部106での照合との相違点は、順位が中位に分類された光源IDに対応する符号*を、ワイルドカードとみなす点である。ワイルドカードとは、どの符号とも一致する(相違度が0となる)符号のことである。
【0067】
図12は、ある画素について、テンプレートの三値符号と参照画像から生成した三値符号を照合する一例を示している。値が一致している部分には○を、異なっている部分には×を記している。前に述べたように、ワイルドカードの符号*は、どの符号とも一致する符号として定義する。
図9の例の場合、値が異なっているビットの個数は2であるので、この画素の相違度は2である。
【0068】
本発明の実施の形態3に係る物体認識装置100に備えられる符号照合部106では、ハミング距離に基づいて相違度を定義した。本実施の形態では、この相違度の考え方を
図12のように三値符号へと拡張し、これを拡張ハミング距離と呼ぶこととする。参照画像から生成された三値符号をS’、テンプレート記憶部105に記憶されているテンプレート三値符号をT’とおき、そのサイズをW×Hとする。2つの三値符号s
1,s
2の拡張ハミング距離をH’(s
1,s
2)と表記すると、物体の位置は次式を最小にする座標(x,y)として得られる。
【0070】
認識対象物の画像上での大きさ(スケール)が事前登録時と物体認識時とで変化する場合は、実施の形態3に係る符号照合部106と同様に、テンプレート符号のスケールを変動させ、相違度を評価すればよい。
【0071】
以上のように構成された実施の形態4によれば、符号生成部104で生成される符号は、勾配強度の順位が中位の光源IDにワイルドカードとなる符号、すなわちどの符号とも一致するような符号を割り当てるため、中位(N/2番目前後)での勾配強度の順位の入れ替わりが生じても、相違度の評価に影響を与えることなく、頑健に物体認識を行うことができるようになる。
【0072】
実施の形態5.
実施の形態1に係る物体認識装置100に備えられる符号生成部104は、実施の形態5において、輝度勾配が最大となる光源方向を求め、この方向を符号化するようにし、符号照合部106では勾配の方向(角度)の差に基づいて相違度を評価するように構成してもよい。
【0073】
図13は、N=8の場合について、ある座標の輝度勾配強度から光源方向符号を生成する流れの一例を示した図である。ここで、輝度勾配強度を求めるまでの流れは、
図8、
図9、
図11と同様である。本実施の形態に係る符号生成部104では、勾配強度が最大となる光源方向を求め、これに対応する光源IDをこの画素の符号(光源方向符号)とする。
【0074】
符号照合部106では、参照画像から生成した符号とテンプレート符号との光源方向の角度差に基づいて相違度を評価する。参照画像から生成された符号をS”、テンプレート記憶部105に記憶されているテンプレート符号をT”とし、そのサイズをW×Hとおく。参照画像の座標(i,j)における光源方向、すなわち符号S”(i,j)をキーとして
図2に示す内部メモリ104m内の光源方向情報テーブルを参照し、対応する光源方向を求める。これをθ
s(i,j)と表す。同様に、テンプレート符号の座標(i,j)における光源方向、すなわち符号T”(i,j)をキーとして
図2に示す光源方向情報テーブルを参照し、得られる光源方向をθ
t(i,j)と表記する。すると、物体の位置は参照画像の光源方向θ
sとテンプレートの光源方向θ
tの角度差の総和、すなわち次式を最小にする座標(x,y)として得られる。
【0076】
ここで、%は剰余を表す演算子とする。また、min(X,Y)はXとYのうち小さい方を選択する最小値選択関数を意味する。認識対象物の画像上での大きさ(スケール)が事前登録時と物体認識時とで変化する場合は、実施の形態3で述べた手順と同様に、符号照合部106においてテンプレート符号のスケールを変動させ、相違度を評価すればよい。
【0077】
以上のように構成された実施の形態5によれば、符号生成部104での符号生成処理は、画素ごとにN個の輝度勾配強度の数値のうち最も輝度勾配強度が大きい光源IDを選択するだけで済むため、高速に符号を生成することができる。また、符号生成部104で生成される符号は各画素につきlog
2Nビットで表現できるため、コンパクトな符号とすることができる。
【0078】
実施の形態6.
本発明の実施の形態1に係る物体認識装置100に備えられる符号生成部104は、実施の形態6において、各光源を点灯して撮影した画像データについて輝度勾配の方向を画素毎に求めて符号を構成し、符号照合部106では輝度勾配の方向(角度)の差に基づいて相違度を評価するように構成してもよい。本実施の形態に係る符号生成部104が符号を生成する符号は、画素毎にN次元ベクトルで表現する。符号を生成する流れは以下の通りである。
【0079】
本実施の形態において、説明を簡単にするため、物体認識装置100が備える光源102−1〜102−8は、
図3に示すように同心円状に等間隔に配置されているものとする。光源102−1〜102−8の配置が等間隔ではない場合についても、以下に述べる処理に対して各光源102−1〜102−8の間隔に応じて適宜必要な変更を加えれば実現が可能である。あらかじめ、全周360度を(360/N)度ずつに等間隔に分割し、それぞれの範囲に0からN−1までの符号を割り当て、これを勾配方向特徴量とする。
【0080】
まず、物体認識装置が備えるN個の光源102−1〜102−Nを1個ずつ順次選択的に点灯させながら、カメラ101で画像の画像データを取得する。こうして得られたN枚の画像データをそれぞれ、I
1からI
Nとおく。その後、画像データI
1からI
Nのそれぞれに対し、画素毎に輝度勾配の方向を求める。画像データIのx軸方向(横方向)の輝度勾配をI’
x、y軸方向(縦方向)の輝度勾配をI’
yとすると、座標(x,y)の勾配方向は次式によって求められる。
【0082】
ここで、関数「atan2」は4象限表現の逆正接関数を表し、C言語等の一般的なプログラミング言語では標準で用意されている。こうして得られた勾配方向情報をN段階に量子化することにより、勾配方向特徴量を求め、これを座標(x,y)における画像データの符号とする。
【0083】
図14は、N=8の場合について、ある画素の輝度勾配の方向と、それに対応する輝度勾配方向特徴量を示している。輝度勾配方向と特徴量の対応関係は、
図14の右側に示している。光源IDがkの光源102−kを点灯させたときの撮影画像データI
kの、座標(x,y)の画像データにおける勾配方向特徴量を
【数13】
(ただし
【数14】
)と表記すると、座標(x,y)の画像データに割り当てる符号
【数15】
を次式で表す。
【0085】
画像内の全ての画素について、上記のように符号を生成する。以上が、符号生成部104が撮影画像から符号を生成する手順である。符号照合部106による符号の照合は、輝度勾配方向(角度)の差を相違度として評価することにより実行する。いま、参照画像データから求められた輝度勾配方向の特徴量により構成される、座標(i,j)の画像データにおける符号を次式で表す。
【0087】
また、テンプレート記憶部105に記憶されている、座標(i,j)の画像データのテンプレート符号を次式で表す。
【0089】
そのサイズを横W画素、縦H画素とおく。このとき相違度は、勾配方向の差の総和、すなわち次式として求める。
【0091】
そして、物体の位置は、上記の式(4)を最小にする座標(x,y)として求める。
【0092】
なお、認識対象物の画像データ上での大きさ(スケール)が事前登録時と物体認識時とで変化する場合は、符号照合部106においてテンプレート符号のスケールを変動させ、相違度を評価すればよい。例えば、テンプレート符号
【数20】
を成分
【数21】
に分割し、成分毎に2次元最近傍法を用いて拡大又は縮小することにより、異なるスケールのテンプレート符号が得られる。これらのテンプレート符号を切り替えながら照合を繰り返し、相違度が最小となる位置とスケールを求める。
【0093】
以上のように構成された実施の形態6によれば、輝度勾配強度やその順位は、照明などの環境や物体表面の状態などの要因で変動することがある。しかし、輝度勾配の方向は物体の形状に強く依存し、環境による変動が起こりにくいという特徴があるため、このような構成により物体認識装置の認識精度を向上させることができる。
【0094】
実施の形態7.
本発明の実施の形態1から6に係る物体認識装置100に備えられる符号照合部106においては、物体のスケールの変化に対応するため、テンプレート符号を拡大又は縮小するという方法を採っていた。これとは別の方法として、実施の形態7では、N個の光源102−1〜102−Nのそれぞれを点灯させたときの撮影画像をテンプレート記憶部に保持しておき、これらN枚の画像データを照合の際に拡大又は縮小しながら符号を生成するように構成してもよい。
【0095】
図15は、本発明の実施の形態7に係る物体認識装置100の構成を示している。実施の形態7に係る物体認識装置100は、
図1の実施の形態1に係る物体認識装置100に比較して、N個の光源102−1〜102−Nをそれぞれ順次選択的に点灯させて撮影したN枚の輝度画像データを制御部103からの制御信号に基づいてテンプレート記憶部105に格納する点が異なる。符号生成部104は、制御部103からの光源IDと、カメラ101からの画像データと、テンプレート記憶部105からのテンプレート画像データに基づいて、テンプレート画像データに対する符号を生成するとともに、参照画像データの符号を生成して符号照合部106に出力する。符号照合部106は、テンプレート画像データと参照画像データの各符号を照合するときに、テンプレート記憶部105から読み出したN枚のテンプレート画像データから符号生成部104にて生成した符号と、認識対象物を撮影した参照画像から符号生成部104にて生成した符号とを照合する。
【0096】
認識対象物の画像上での大きさ(スケール)が事前登録時と物体認識時とで変化する場合は、符号生成部104はテンプレート記憶部105から読み込んだN枚のテンプレート画像を拡大又は縮小する。これらのテンプレート画像データは輝度画像であるため、拡大又は縮小には画像の拡大又は縮小の手法として一般的に用いられている2次元スプライン補間法などの滑らかな補間法を用いることができる。当該補間法によって拡大又は縮小したN枚の画像データから符号を生成し、これをテンプレート画像データの符号とする。N枚の画像データから符号を生成する手順については、実施の形態1から6に係る物体認識装置100が備える符号生成部104の手順と同様である。また、参照画像データに対する符号の生成、およびその後に実行するテンプレート画像データの符号との照合についても、実施の形態1から6における手順と同様である。
【0097】
以上のように構成された実施の形態7によれば、テンプレート記憶部105はN枚の輝度画像データの形式で基準物体の情報を保持することから、輝度画像に対する滑らかな補間による拡大又は縮小が行える。滑らかな拡大又は縮小を行った画像から生成した符号を用いて照合を行うため、物体のスケール変化に対する認識処理の信頼性を向上させることができる。
【0098】
実施の形態8.
本発明の実施の形態1から7に係る物体認識装置100に備えられる符号生成部104は、実施の形態8において、テンプレート記憶部105へ記憶するテンプレート画像データの符号を生成する際、各実施の形態において生成する符号に加えて、画素毎に符号を有効化または無効化する情報、いわゆるマスク情報を生成するようにし、符号照合部106はマスク情報を参照し符号が有効な画素のみについて、参照画像データから生成した符号とテンプレート画像データの符号とを照合するように構成してもよい。
【0099】
はじめに、マスク情報を生成する方法として、輝度勾配強度に基づく方法について説明する。
【0100】
各撮影画像データから算出される輝度勾配強度は、物体の立体形状に由来する輪郭の部分で大きな値を取る傾向となる。そこで、輝度勾配強度に基づいて、符号の有効または無効を画素毎に設定する。具体的には、符号生成部104は、二値のマスク情報m(x,y)を生成するようにし、座標(x,y)の符号が有効ならばマスク情報m(x,y)=1、無効ならばマスク情報m(x,y)=0とする。各座標の符号の有効または無効は、例えば以下のように判定する。
【0101】
1つの方法は、N枚の撮影画像データI
k(kは1からN)の輝度勾配画像データI’
kを求め、座標(x,y)の画像データにおける勾配強度I’
k(x,y)の最大値があるしきい値τ
aよりも大きいようなkが少なくとも1つ存在すれば、すなわち
【数22】
が成り立てばマスク情報m(x,y)=1とし、そうでなければマスク情報m(x,y)=0とする。
【0102】
別の方法では、座標(x,y)の画像データにおける勾配強度I’
k(x,y)の最大値と最小値の差があるしきい値τ
bよりも大きいようなkが少なくとも1つ存在すれば、すなわち
【数23】
が成り立てばマスク情報m(x,y)=1とし、そうでなければマスク情報m(x,y)=0とする。
【0103】
なお、上記のように輝度勾配強度の値またはその差をしきい値で判定する方法の他に、画素数全体に占める有効画素の数がある一定の割合になるよう、勾配強度の値またはその差の大きさが上位の画素から選択するようにしてもよい。
【0104】
次いで、マスク情報を生成する別の方法として、各画素の安定度に基づく方法について以下説明する。
【0105】
図16は、物体認識装置100が
図4のようなシーンで認識対象物を撮影した時の撮影画像の模式図である。ここで、背景201は、認識対象物の直方体202が持つ奥行きに対して十分に平坦であり、平面とみなすこととする。
図16において、点(x
1,y
1)は認識対象物の直方体202と背景201の境界に位置する点とし、点(x
2,y
2)は背景201に位置する点とする。また、物体認識装置100に対し、
図3に示すように隣接の位置関係にある光源に対して1から8まで順番に光源IDを割り当ててあるものとする(
図3においては、N=8)。
【0106】
さて、カメラ101から見て、認識対象物の直方体202の左下側から光を照射したとき、直方体202の右上側に影が生じるため、このときの撮影画像データの点(x
1,y
1)の勾配強度は大きくなる。直方体202の下側から光を照射したときは上側に影が生じ、右下側から光を照射したときは左上側に影が生じることから、同様に点(x
1,y
1)の輝度勾配強度は大きくなる。すなわち、各光源IDに対応する勾配強度は、
図17の上段に示すように、隣接しているもの同士で互いに大きい値、または互いに小さい値を取る傾向になる。ここで、光源IDが1である光源102−1と光源IDが8である光源102−8は隣接しているとみなす。一方、光源102−1〜102−8を選択的に切り替えても、点(x
2,y
2)の近傍では影の発生又は消滅が生じないため、
図17の下段に示すように点(x
2,y
2)の勾配強度はランダムな値、例えば単にノイズによる勾配の大小変化が生じるのみとなる。このように、隣接する光源同士で勾配強度の大きさが近いかどうかを安定度の指標として用いる。
【0107】
また、安定度は、例えば以下のような演算で定義する。点(x
1,y
1)の輝度勾配強度が
図18の上段に示すように得られているとする。
【0108】
はじめに、勾配強度の順位を2段階に分類した二値符号であるNビットの2進数bを生成する。次に、2進数bを1ビット左にローテートした2進数b’を生成する。ここで、2進数の左ローテートとは、ビットシフトによりあふれた最上位ビットを最下位ビットに移す演算である。この後、2進数bとb’の間で値が一致するビットの個数、すなわち2進数bとb’のハミング距離を光源数Nから引いた数を求め、これを安定度として用いる。なお、2つの2進数b,b’のハミング距離は、実施の形態3で述べた方法により高速に求めることができる。
【0109】
こうして得られた安定度があらかじめ設定されたしきい値よりも大きければ、マスク情報m(x,y)=1、そうでなければマスク情報m(x,y)=0とする。あるいは、画素数全体に占める有効画素の数がある一定の割合になるように安定度が上位の画素から選択するようにしてもよい。
【0110】
次いで、本実施の形態における各構成要素の説明に戻る。
【0111】
テンプレート記憶部105では、符号生成部104で生成した符号と、前述の手順により求めたマスク情報m(x,y)とを記憶する。符号照合部106では、相違度の評価にマスク情報m(x,y)を導入する。例えば、本発明の実施の形態1に係る符号照合部106の相違度の評価式に対し、以下のようにマスク情報を組み込む。すなわち次式を最小にするような座標(x,y)を、物体の位置として出力する。
【0113】
本発明の実施の形態2から7に係る符号照合部106における相違度の評価式についても同様に、画素毎の相違度の評価式にマスク情報m(x,y)を組み込むことができる。
【0114】
以上のように構成された実施の形態8によれば、符号生成部104では輝度勾配強度が大きい画素、または安定度が高い画素のみを有効にするようなマスク情報を生成し、符号照合部106ではマスク情報m(x,y)に基づいて有効な画素のみを用いて符号の相違度を評価する。輝度勾配強度または安定度は物体の立体形状に由来する輪郭の部分で大きくなることから、このような画素のみを有効化して符号の照合に用いることにより、認識精度の向上とマッチング処理の高速化の両立を実現することができる。
【0115】
実施の形態9.
本発明の実施の形態1から8に係る物体認識装置100に備えられる光源102は、実施の形態9において、2つ以上の複数の同心多重円を含む同心多重円状に配置してもよい。さらには、物体認識装置100が備える複数の光源のうち、符号の生成および照合の目的に最適な光源を事前に選択する最適化機能を持たせてもよい。
【0116】
図19は、二重の同心円状に光源を8個ずつ配置した例である。内側(カメラ101に近い側)の光源として光源102−11から102−18を、外側の光源として光源102−21から102−28を配置している。
【0117】
まず、光源102−11〜102−28を多重円状に配置することによる効果を以下に説明する。
図20A、
図20B及び
図20Cは、カメラ101と光源(102−1〜102−8のうちの1つである102)の位置関係が影203の現れ方に与える影響を示した図である。
図20Aに示すように、認識対象物の直方体202が背景201に接触していてかつカメラ101と光源102の距離が近い場合、光の照射によってできる影203の大きさが小さくなる。影203が小さすぎると、画像中の直方体202と影203の境界部分で大きな輝度勾配強度が得られない可能性がある。そこで、
図20Bに示すようにカメラ101から離れた光源102を用いれば、光の照射によってできる影203の大きさも大きくなるため、直方体202と影203の境界部分で明瞭な輝度勾配が得られる。
【0118】
しかしながら、
図20Cに示すように認識対象物の直方体202が背景201から物理的に離れている場合、カメラ101と光源102と認識対象物の直方体202との間の位置関係によっては、認識対象物の直方体202から離れた位置に影203が現れることがある。このような場合の撮影画像は、認識対象物の直方体202と背景201との間に明瞭な輝度勾配が現れず、反対に認識対象ではない背景201に生じる影203の付近に大きな輝度勾配が生じる。したがって、
図20Cの配置条件では、カメラ101と光源102の距離を近づけた方がよいということになる。
【0119】
すなわち、カメラ101と光源102の間の最適な距離は、認識対象物の形状やカメラ101の位置といった条件に応じて適切に設定することが望ましい。物体の認識に最適な光源102を選択するためには、各光源102−1〜102−8を点灯させて撮影した画像を目視で確認する方法の他、各光源102−1〜102−8を順次独立して選択的に明滅させた時に発生する影203の大きさや位置、輝度勾配強度を画像から解析する方法が考えられる。
【0120】
次に、最適な光の照射方向について述べる。認識対象物の形状によっては、ある特定の光源方向では明瞭な輝度勾配が生じないことがある。これは、例えば光源102−1〜102−8の照射方向の形状変化が丸みをもっていて、奥行きが緩やかに変化するような場合などに起こりうる。
【0121】
そこで、複数M個の光源(M>N)102−1〜102−Mを持った物体認識装置を利用する。基準物体を用いてテンプレートを作成する段階では、M個の光源102−1〜102−Mの明滅を順次選択的に切り替えて撮影したM枚の画像データ間で、例えば輝度勾配強度を比較し、N枚の画像データを選択する。輝度勾配強度の評価尺度としては、例えばある撮影画像I
kの輝度勾配強度の最大値と最小値の差や、輝度勾配強度の分散などを用いることができる。このようにして選択された最適なN枚に対応するN個の光源102−1〜102−Nに対して、光源IDを1からNまで割り当てる。この後の処理は全て、選択されたN個の光源102−1〜102−Nに対応するN枚の撮影画像データを利用すればよい。
【0122】
符号生成部104では、N枚の画像データからテンプレート符号を作成し、テンプレート記憶部105に格納する。物体認識時には、符号照合部106は、N枚の画像データを用いて符号生成部104で生成された参照画像データの符号と、テンプレート記憶部105に格納されているテンプレート画像データの符号とを照合する。符号の照合については、本発明の実施の形態1から7に係る符号照合部106の手順を用いることができる。
【0123】
以上のように構成された実施の形態9によれば、複数の光源102−11〜102−28を同心多重円状に配置することによって、一つの方向から対象物に光線を照射する場合にカメラ光軸と各光源光軸のなす角度を調整することができるため、対象物の起伏によって生じる影の大きさを適切に設定することができ、物体の認識に用いる符号を精度良く生成することができる。
【0124】
さらに、事前に配置した照射角度が異なる多数の光源をもとに、方向による明暗差が大きくなる配置の組み合わせを求めて、その配置にある光源102のみを点滅制御することによって、明暗差に敏感な認識を実現し、マッチングの信頼性を向上させることができる。
【0125】
実施の形態10.
本発明の実施の形態1から9に係る物体認識装置100に備えられる光源102は、実施の形態10において、発光輝度を能動的に制御することが可能とし、物体認識装置100は、カメラ101で撮影した画像の明るさに応じて光源102の発光輝度を調整して再撮影するようにしてもよい。あるいは、カメラ101がシャッタースピードとゲインの少なくともいずれか一方の能動的な制御が可能とし、物体認識装置100は、カメラ101で撮影した画像の明るさに応じてカメラ101のシャッタースピードおよびゲインを調整して再撮影するようにしてもよい。
【0126】
本発明の実施形態に係る物体認識装置100は、各光源102−1〜102−Nを順次選択的に点灯させたときの撮影画像の輝度勾配強度や方向に基づいて符号を生成し、この符号を用いて物体認識を行う。つまり、高精度な物体認識を行うためには符号が正確に生成されること、すなわち十分大きな輝度勾配が得られることが重要である。このためには、光源102の発光輝度、またはカメラ101のシャッタースピードとゲインといったパラメータを適切に設定し、画素値の飽和を抑制しながら高いコントラストを得る必要がある。
【0127】
光源102−1〜102−Nの発光輝度、またはカメラ101のシャッタースピード・ゲインの調整は次のように行う。基準物体を用いてテンプレートを作成する段階で、適当なパラメータを設定し、一度撮影してみる。撮影した画像データに対し、輝度値の分布を調べる。輝度値が飽和している場合は画像が明るすぎるため、光源102−1〜102−Nの発光輝度を下げるか、カメラ101のシャッタースピードを早くするか、もしくはカメラ101のゲインを下げた上で再撮影する。反対に、輝度値が小さい方に偏っている場合は画像が暗すぎるため、光源102−1〜102−Nの発光輝度を上げるか、カメラ101のシャッタースピードを遅くするか、もしくはカメラ101のゲインを上げた上で再撮影する。再撮影した画像に対して前述の手順を繰り返し、輝度値の分布が適切と判断されるまで繰り返す。このようにして、適切なパラメータ設定を求める。
【0128】
以上のように構成された実施の形態10によれば、物体認識装置100は光源102−1〜102−Nの輝度やカメラ101のシャッタースピード、ゲインといったパラメータを能動的に制御し、適切な輝度分布を持った画像を得ることができるため、認識処理の信頼性が向上する。
【0129】
実施の形態のまとめ.
以上のように説明した各実施の形態の態様及びその効果は以下の通りである。
【0130】
第1の態様に係る物体認識装置は、
認識対象物を撮影するカメラと、
前記カメラの周辺に複数個配置され各々が独立して選択的に明滅する光源と、
前記各光源の明滅を制御して当該各光源の明滅に同期してあるいは非同期でカメラに撮像トリガ信号を送出し符号生成部に光源ID情報を送出する制御部と、
前記各光源の点灯または消灯時にカメラで撮影された各画像の輝度値から符号を生成する符号生成部と、
所定の基準物体の情報を格納したテンプレート記憶部と、
前記認識対象物を撮影した画像群から生成した符号を前記テンプレート記憶部に格納した情報から生成した符号と照合し照合結果を出力する符号照合部とを備えたことを特徴とする。
【0131】
この構成により、認識対象物が奥行きを有していてカメラの視点の変化による画像中の見えの変化が大きい場合でも高精度にテンプレートマッチングを実行することができる。
【0132】
第2の態様に係る物体認識装置は、第1の態様に係る物体認識装置において、前記符号生成部によって生成される符号は、前記光源の明滅を選択的に切り替えて撮影した画像の輝度値から算出される勾配の強度を表現したものであることを特徴とする。
【0133】
この構成により、認識対象物の深度情報(カメラから見て奥行き方向の形状情報)を用いたテンプレートマッチングが実現できるため、認識精度が向上する。
【0134】
第3の態様に係る物体認識装置は、第1または第2の態様に係る物体認識装置において、前記符号生成部によって生成される符号は、前記光源の明滅を選択的に切り替えて撮影した画像の輝度値から算出される輝度勾配の強度の順位を表現したものであることを特徴とする。
【0135】
この構成により、勾配強度の変動に対して頑健にテンプレートマッチングを実行できる。
【0136】
第4の態様に係る物体認識装置は、第1〜第3の態様のいずれか1つに係る物体認識装置において、前記符号生成部は、ビット数が光源の数に一致しかつ各ビットが光源に対応するような二値符号を画素毎に生成し、前記光源の明滅を選択的に切り替えて撮影した画像の各々に対して輝度勾配を算出して、当該輝度勾配の強度が上位に分類された光源に対応するビットと下位に分類された光源に対応するビットにそれぞれ異なるビット値を割り当てることを特徴とする。
【0137】
この構成により、テンプレートマッチングをビット演算として高速に実行することができる。さらに、勾配強度を二値化することにより、勾配強度の順位変動に対する頑健性が向上する。
【0138】
第5の態様に係る物体認識装置は、第1〜第4の態様のいずれか1つに係る物体認識装置において、前記符号照合部は、前記符号生成部によって入力画像群から生成された二値符号と、あらかじめテンプレートとして登録した二値符号との間のハミング距離によって相違度を算出することを特徴とする。
【0139】
この構成により、テーブルの参照によって画素毎の相違度を求めることができるため、符号照合処理を高速に実行することができる。
【0140】
第6の態様に係る物体認識装置は、第1〜第5の態様のいずれか1つに係る物体認識装置において、前記符号生成部は、桁数が光源の数に一致する三値符号を画素毎に生成し、当該三値符号は、前記光源の明滅を選択的に切り替えて撮影した画像各々に対して輝度勾配を算出して当該輝度勾配の強度を上位、中位及び下位の3段階に分類した結果を表現したものとすることを特徴とする。
【0141】
この構成と第7の態様に係る物体認識装置との組み合わせにより、勾配強度の順位が入れ替わっても相違度に影響を与えずに済むため、認識のロバスト性が向上する。
【0142】
第7の態様に係る物体認識装置は、第6の態様に係る物体認識装置において、前記符号照合部は、前記符号生成部によって入力画像群から生成された三値符号とテンプレートの三値符号の照合により相違度を算出するものであり、前記輝度勾配の強度の上位同士または下位同士の符号がそれぞれ一致した場合に相違度の評価値を下げ、中位の符号については相違度の算出に寄与させないことを特徴とする。
【0143】
この構成により、テンプレートと参照画像との間で勾配強度順位の入れ替わりが発生した場合でも、上位と下位の入れ替わりが生じない限り相違度に影響を及ぼさないため、ロバストなマッチングが実現できる。
【0144】
第8の態様に係る物体認識装置は、第1〜第7の態様のいずれか1つに係る物体認識装置において、前記符号生成部は、前記符号を画素毎に生成し、前記光源の明滅を選択的に切り替えて撮影した画像各々から算出した輝度勾配の強度のうち最も大きい方向をその画素の方向として符号化することを特徴とする。
【0145】
この構成により、1画素あたりの符号のサイズがlog
2Nビットのコンパクトな符号とすることができる。
【0146】
第9の態様に係る物体認識装置は、第1〜第7の態様のいずれか1つに係る物体認識装置において、前記符号生成部は、次元数が前記光源の数に一致する符号を画素毎に生成し、前記光源の明滅を選択的に切り替えて撮影した画像各々から算出した輝度勾配の方向を前記符号の各次元に割り当てる特徴量とすることを特徴とする。
【0147】
この構成により、光の照射方向を変えても輝度勾配の方向が変化しないことを利用した、環境や認識対象物のばらつきに強い符号を生成できる。
【0148】
第10の態様に係る物体認識装置は、第8又は第9の態様に係る物体認識装置において、前記符号照合部は前記輝度勾配の方向の差が小さいほど一致度が高くなるような評価基準によって符号の照合を行うことを特徴とする。
【0149】
この構成により、環境や認識対象物のばらつきにより輝度勾配強度やその順位は変動しやすいが、勾配の方向は変わりにくいという性質を利用することにより、認識精度を向上させることができる。
【0150】
第11の態様に係る物体認識装置は、第1〜第9の態様のいずれか1つに係る物体認識装置において、前記符号生成部は、前記各光源の明滅を選択的に切り替えて撮影した画像の輝度値に基づいて、画素毎に符号の有効または無効を判定し、有効または無効に関する情報を生成することを特徴とする。
【0151】
この構成により、照合に有効な画素のみを選択することにより、マッチングの高精度化と高速化を両立することができる。
【0152】
第12の態様に係る物体認識装置は、第10の態様に係る物体認識装置において、前記符号生成部は、前記各光源の明滅を選択的に切り替えて撮影した画像の輝度勾配の強度の大きさに基づいて、画素毎に符号の有効または無効を判定し、有効または無効に関する情報を生成することを特徴とする。
【0153】
この構成により、物理形状に由来する輪郭の部分では勾配強度が大きくなることから、勾配強度の大きい画素のみを選択して符号の照合に利用することにより、マッチングの高精度化と高速化を両立することができる。
【0154】
第13の態様に係る物体認識装置は、第10の態様に係る物体認識装置において、前記符号生成部は、同一対象物を撮影した複数の画像をもとに計算した各画素の安定度に基づいて、画素毎に符号の有効または無効を判定し、有効または無効に関する情報を生成することを特徴とする。
【0155】
この構成により、同一対象物を撮影した複数のテンプレート画像から各画素の安定度合いを推定し、安定度が高い画素を有効、低い画素を無効と判定して有効な画素のみを選択して符号の照合に利用することにより、マッチングの高精度化と高速化を両立することができる。
【0156】
第14の態様に係る物体認識装置は、第1〜第12の態様のいずれか1つに係る物体認識装置において、前記符号照合部は、前記符号生成部が有効と設定した画素のみについて入力画像の符号とテンプレート符号とを照合することを特徴とする。
【0157】
この構成により、光の照射方向を変えても輝度勾配が変化しない、安定した画素のみをマッチングに用いる。すなわち強度変化が不安定な画素をマスクすることにより、マッチング精度の向上と処理の高速化を同時に実現する。
【0158】
第15の態様に係る物体認識装置は、第1〜第14の態様のいずれか1つに係る物体認識装置において、前記複数個配置された光源を、複数の同心多重円状に配置することを特徴とする。
【0159】
この構成により、複数の光源を同心多重円状に配置することによって、一つの方向から対象物に光線を照射する場合にカメラ光軸と各光源光軸のなす角度を調整することができ、対象物の起伏によって生じる影の大きさを適切に設定することができる。
【0160】
第16の態様に係る物体認識装置は、第1〜第15の態様のいずれか1つに係る物体認識装置において、前記符号生成部が行う符号の生成、および前記符号照合部が行う符号の照合において、使用する光源の数と方向を事前に最適化する機能を有することを特徴とする。
【0161】
この構成により、事前に配置した照射角度が異なる多数の光源をもとに、方向による明暗差が大きくなる配置の組み合わせを求めて、その配置にある光源のみを点滅制御することによって、明暗差に敏感な認識を実現し、マッチングの信頼性が向上する。
【0162】
第17の態様に係る物体認識装置は、第1〜第16の態様のいずれか1つに係る物体認識装置において、発光輝度を能動的に制御することが可能な光源を複数備え、事前に撮影された画像中の各画素の明るさを調べ、明るさに応じて前記各光源の発光輝度を制御して再撮影することを特徴とする。
【0163】
この構成により、計測前に一度撮影してみて、明るすぎる場合には光源の強さを弱め、暗すぎる場合には強めるように制御することによって、適切な明るさ範囲を持つ画像を得ることができ、計測の信頼性が向上する。
【0164】
第18の態様に係る物体認識装置は、第1〜第17の態様のいずれか1つに係る物体認識装置において、前記カメラはシャッタースピードとゲインの少なくともいずれか一方の能動的な制御が可能なカメラであって、事前に撮影された画像中の各画素の明るさを調べ、明るさに応じて前記カメラのシャッタースピードおよびゲインを制御して再撮影することを特徴とする。
【0165】
この構成により、計測前に一度撮影してみて、明るすぎる場合にはカメラのシャッタースピードを早くするかゲインを下げ、暗すぎる場合にはシャッタースピードを遅くするかゲインを上げるように制御することによって、適切な明るさ範囲を持つ画像を得ることができ、計測の信頼性が向上する。