特許7438713 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7438713撮像装置、方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-02-16

(45)【発行日】2024-02-27

(54)【発明の名称】撮像装置、方法及びプログラム

(51)【国際特許分類】

G06T 7/593 20170101AFI20240219BHJP

【ＦＩ】

G06T7/593

【請求項の数】 12

(21)【出願番号】P 2019195059

(22)【出願日】2019-10-28

(65)【公開番号】P2021068356

(43)【公開日】2021-04-30

【審査請求日】2022-10-11

(73)【特許権者】

【識別番号】000001007

【氏名又は名称】キヤノン株式会社

(74)【代理人】

【識別番号】100114775

【弁理士】

【氏名又は名称】高岡亮一

(74)【代理人】

【識別番号】100121511

【弁理士】

【氏名又は名称】小田直

(74)【代理人】

【識別番号】100208580

【弁理士】

【氏名又は名称】三好玲奈

(72)【発明者】

【氏名】西山知宏

【審査官】小池正彦

(56)【参考文献】

【文献】特開２０２０－１４０４９７（ＪＰ，Ａ）

【文献】特開２０１８－１５１９９９（ＪＰ，Ａ）

【文献】二宮芳樹，走行環境認識のためのステレオ視の一方法，電子情報通信学会論文誌（Ｊ９１－Ｄ）第３号 THE IEICE TRANSACTIONS ON INFORMATION AND SYSTEMS (JAPANESE EDITION)，第J91-D巻第3号，日本，電子情報通信学会，2008年03月01日，p803-812

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／５９３

(57)【特許請求の範囲】

【請求項1】

互いに異なる複数の視点から同一の被写体を見た場合の画像である複数の画像を示す画像データを取得する取得手段と、
前記画像データにおいて、背景と被写体が隣接もしくは被写体同士が隣接しているか否かを判定する判定手段と、
前記隣接する領域は、二つ以上、それ以外の領域は、少なくとも一つ以上の概算距離値を取得する取得手段と、
前記複数の画像のうちの一つの画像に設定した参照ウィンドウに対し、前記概算距離値のそれぞれに基づいて設定される探索範囲内で、前記複数の画像のうちの前記一つの画像とは異なる画像における類似度の高いウィンドウを検出し、前記検出したウィンドウの位置に基づいて、距離候補値を算出する算出手段と、
前記距離候補値及び前記類似度に基づき、距離値を決定する決定手段と、を有する
ことを特徴とする撮像装置。

【請求項2】

前記隣接する領域には、前記取得した概算距離値のうちの複数を付与する付与手段を有する
ことを特徴とする請求項１に記載の撮像装置。

【請求項3】

前記概算距離値は、無限遠の距離値を含む
ことを特徴とする請求項１または２に記載の撮像装置。

【請求項4】

前記取得手段は、前記画像データに対して膨張処理を行って前記概算距離値を取得する
ことを特徴とする請求項１から３のいずれか１項に記載の撮像装置。

【請求項5】

前記取得手段は、前記画像データに対して被写体認識を行い、認識した被写体の既知の大きさと焦点距離に基づき前記概算距離値を取得する
ことを特徴とする請求項１から４のいずれか１項に記載の撮像装置。

【請求項6】

前記取得手段は、前記複数の画像のうちの一つの画像と視差画像とでマッチングを行って得た結果に基づき距離値でクラスタリングし、クラスタ内の代表値を概算距離値として取得する
ことを特徴とする請求項１から４のいずれか１項に記載の撮像装置。

【請求項7】

前記算出手段は、複数の概算距離値を付与した領域では、それ以外の領域よりもウィンドウサイズを小さくする
ことを特徴とする請求項１から６のいずれか１項に記載の撮像装置。

【請求項8】

前記算出手段は、前記概算距離値に応じて前記探索範囲を狭める
ことを特徴とする請求項１から７のいずれか１項に記載の撮像装置。

【請求項9】

前記決定手段は、前記距離候補値の中から、前記複数の画像のうちの一つの画像と視差画像との相関値に応じて距離値を決定する
ことを特徴とする請求項１から８のいずれか１項に記載の撮像装置。

【請求項10】

前記決定手段は、前記複数の画像のうちの一つの画像と視差画像との相関値の最小値との差分の絶対値が閾値未満である距離候補値が少なくとも２つ以上ある場合、前記膨張処理を行った領域に含まれている値は前記距離候補値から除外することを特徴とする請求項４に記載の撮像装置。

【請求項11】

互いに異なる複数の視点から同一の被写体を見た場合の画像である複数の画像を示す画像データを取得する取得工程と、
前記画像データにおいて、背景と被写体が隣接もしくは被写体同士が隣接しているか否かを判定する判定工程と、
前記隣接する領域は、二つ以上、それ以外の領域は、少なくとも一つ以上の概算距離値を取得する取得工程と、
前記複数の画像のうちの一つの画像に設定した参照ウィンドウに対し、前記概算距離値のそれぞれに基づいて設定される探索範囲内で、前記複数の画像のうちの前記一つの画像とは異なる画像における類似度の高いウィンドウを検出し、前記検出したウィンドウの位置に基づいて、距離候補値を算出する算出工程と、
前記距離候補値及び前記類似度に基づき、距離値を決定する決定工程と、を有する
ことを特徴とする方法。

【請求項12】

請求項１乃至１０のいずれか１項に記載の撮像装置の各手段としてコンピュータを機能させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、撮像装置、方法及びプログラムに関する。

【背景技術】

【0002】

同一の被写体を互いに異なる複数の視点から見た場合の複数の画像を用いて被写体までの距離を推定し、推定した距離情報を画像処理に応用する技術がある。異なる視点に対応する複数の画像から距離情報を推定する方法としては、各画像間に生じた視差を利用する方法がある。ここで視差は、同じ被写体領域に対応する画像領域の位置の、各視点に対応する画像間でのずれを表わす。視差の大きさは被写体までの距離の大きさに依存するため、各画像間に生じた視差の大きさと、各視点間の距離等に基づいて、被写体までの距離を推定することが可能である。視差は、ブロックマッチング法などの方法を用いて、各視点の画像間で同じ被写体領域に対応する画像領域を検出することで求められる。

【0003】

特許文献１では、予め被写体までの距離の概算値を算出し、得られた概算値をもとにブロックマッチング時の探索範囲を限定することで、高速かつ高精度に視差を求める技術が開示されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１７－４５２８３号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかし、特許文献１に記載の技術では、画像中において、異なる距離にある被写体同士や、被写体と背景が近接している領域（以下、遠近競合部という）において、誤った概算値が付与される可能性が存在する。その場合、探索範囲を限定することにより、通常のブロックマッチングより、精度が劣化するという課題がある。

【0006】

本発明は上述した課題に鑑みたものであり、高速かつ高精度に距離を求められる技術を提供することを目的とする。

【課題を解決するための手段】

【0007】

本発明の一実施形態の撮像装置は、互いに異なる複数の視点から同一の被写体を見た場合の画像である複数の画像を示す画像データを取得する取得手段と、前記画像データにおいて、背景と被写体が隣接もしくは被写体同士が隣接しているか否かを判定する判定手段と、前記隣接する領域は、二つ以上、それ以外の領域は、少なくとも一つ以上の概算距離値を取得する取得手段と、前記複数の画像のうちの一つの画像に設定した参照ウィンドウに対し、前記概算距離値のそれぞれに基づいて設定される探索範囲内で、前記複数の画像のうちの前記一つの画像とは異なる画像における類似度の高いウィンドウを検出し、前記検出したウィンドウの位置に基づいて、距離候補値を算出する算出手段と、前記距離候補値及び前記類似度に基づき、距離値を決定する決定手段と、を有することを特徴とする。

【発明の効果】

【0008】

本発明によれば、高速かつ高精度に距離を求められる技術を提供することができる。

【図面の簡単な説明】

【0009】

【図1】本発明の第１の実施形態に係る撮像装置の構成例を示すブロック図である。

【図2】視差マップの概念図である。

【図3】距離マップ生成部１６１の構成例を示すブロック図である。

【図4】距離マップ生成部１６１が行う処理のフローチャートである。

【図5】概算視差の付与方法を説明する概念図である。

【図6】視差候補値の算出方法を説明する概念図である。

【図7】第２の実施形態におけるフローチャートである。

【発明を実施するための形態】

【0010】

以下、添付図面を参照し、本発明の実施形態について説明する。なお、以下説明する実施形態は、本発明を具体的に実施した場合の一例を示すもので、特許請求の範囲に記載した構成の具体的な実施例の１つである。

【0011】

［第１の実施形態］
（本実施形態の構成）
図１を参照して、本実施形態における撮像装置の構成について説明する。図１は、本発明の第１の実施形態に係る撮像装置の構成例を示すブロック図である。撮像装置は、情報処理装置の一例である。
撮像装置１００は、被写体を撮影して、動画や静止画のデータをテープ、固体メモリ、光ディスク、及び磁気ディスクなどの各種メディアに記録するデジタルスチルカメラやビデオカメラなどであるが、本発明はこれらに限定されるものではない。撮像装置１００内の各ユニットは、バス１６０を介して互いに接続されている。また各ユニットは、主制御部１５１により制御される。

【0012】

レンズユニット１０１は、固定１群レンズ１０２、ズームレンズ１１１、絞り１０３、固定３群レンズ１２１、及び、フォーカスレンズ１３１を備えて構成される。
絞り制御部１０５は、主制御部１５１の指令に従い、絞りモータ１０４（図中の「ＡＭ」は、アパーチャーモータの略称である。）を介して絞り１０３を駆動することにより、絞り１０３の開口径を調整して撮影時の光量調節を行う。
ズーム制御部１１３は、ズームモータ１１２（図中の「ＺＭ」は、ズームモータの略称である。）を介してズームレンズ１１１を駆動することにより、焦点距離を変更する。
フォーカス制御部１３３は、レンズユニット１０１のピント方向のずれ量に基づいてフォーカスモータ１３２（図中の「ＦＭ」は、フォーカスモータの略称である。）を駆動する駆動量を決定する。加えてフォーカス制御部１３３は、フォーカスモータ１３２を介してフォーカスレンズ１３１を駆動することにより、焦点調節状態を制御する。フォーカス制御部１３３及びフォーカスモータ１３２によるフォーカスレンズ１３１の移動制御により、ＡＦ制御が実現される。ＡＦは、オートフォーカスの略称である。フォーカスレンズ１３１は、焦点調節用レンズであり、図１には単レンズで簡略的に示されているが、通常は複数のレンズで構成される。

【0013】

レンズユニット１０１を介して撮像素子１４１上に結像する被写体像は、撮像素子１４１により電気信号に変換される。撮像素子１４１は、被写体像（光学像）を電気信号に光電変換を行う光電変換素子である。撮像素子１４１は、横方向にｍ画素、縦方向にｎ画素の受光素子が配置されている。撮像素子１４１上に結像されて光電変換された画像は、撮像信号処理部１４２により画像信号（画像データ）として整えられ、撮像面の画像を取得することができる。

【0014】

撮像信号処理部１４２から出力される画像データは、撮像制御部１４３に送られ、一時的にＲＡＭ１５４（ランダム・アクセス・メモリ）に蓄積される。ＲＡＭ１５４に蓄積された画像データは、画像圧縮解凍部１５３にて圧縮された後、画像記録媒体１５７に記録される。これと並行して、ＲＡＭ１５４に蓄積された画像データは、画像処理部１５２に送られる。

【0015】

画像処理部１５２は、ＲＡＭ１５４に蓄積された画像データに対して予め定められた画像処理を適用する。画像処理部１５２が適用する画像処理には、ホワイトバランス調整処理、色補間（デモザイク）処理、及びガンマ補正処理といった所謂現像処理のほか、信号形式変換処理、スケーリング処理などがあるが、これらに限定されない。

【0016】

操作スイッチ１５６は、タッチパネルやボタンなどを含む入力インターフェイスであり、ユーザーが表示部１５０に表示される種々の機能アイコンを選択操作することなどにより、様々な操作が行える。

【0017】

主制御部１５１は、例えばＣＰＵやＭＰＵなどのプログラマブルプロセッサを１つ以上有し、例えばフラッシュメモリ１５５に記憶されたプログラムをＲＡＭ１５４に読み込んで実行することにより各部を制御し、撮像装置１００の機能を実現する。ＣＰＵは、ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略称である。ＭＰＵは、ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔの略称である。

【0018】

主制御部１５１は、また、被写体輝度の情報に基づいて露出条件（シャッタースピードもしくは蓄積時間、絞り値、感度）を自動的に決定するＡＥ処理を実行する。被写体輝度の情報は、例えば画像処理部１５２から取得することができる。主制御部１５１は、例えば人物の顔など、特定被写体の領域を基準として露出条件を決定することもできる。

【0019】

フォーカス制御部１３３では、ＲＡＭ１５４に保存された主被写体の位置に対するＡＦ制御を行う。
絞り制御部１０５では、特定の被写体領域の輝度値を用いた露出制御を行う。
表示部１５０では、画像や動体検出結果などを表示する。
バッテリ１５９は、電源管理部１５８により適切に管理され、撮像装置１００の全体に安定した電源供給を行う。

【0020】

フラッシュメモリ１５５には、撮像装置１００の動作に必要な制御プログラムや、各部の動作に用いるパラメータ等が記録されている。撮像装置１００は、ユーザーの操作により起動すると（電源ＯＦＦ状態から電源ＯＮ状態へ移行すると）、フラッシュメモリ１５５に格納された制御プログラム及びパラメータを読み出してＲＡＭ１５４の一部に書き込むことでロードを行う。主制御部１５１は、ＲＡＭ１５４にロードされた制御プログラム及びパラメータに従って撮像装置１００の動作を制御する。

【0021】

距離マップ生成部１６１では距離マップを生成する。距離マップは、画素のそれぞれが被写体距離を表す距離情報の１つであり、デプスマップ、又は奥行きマップと呼ばれることもある。距離マップの生成過程の例については後述する。生成された距離マップは、ＲＡＭ１５４に保存され、画像処理部１５２から参照される。
なお、図１に示した構成は、撮像装置の構成の一例に過ぎない。

【0022】

（本実施形態の処理）
本実施形態では、１つのマイクロレンズを共有する複数の光電変換素子を備えた撮像素子１４１を用いて視差画像を取得するものとする。視差画像とは、視点をずらして得られる画像のことである。このときの撮像素子の構成や光学原理は、周知の技術を適用可能であるため、詳しい説明は省略する。なお、撮像装置１００をステレオカメラや多眼カメラとして視差画像を取得してもよい。

【0023】

また、本実施形態では、視差画像に基づいて視差マップを生成するものとする。視差マップとは、画素ごとに視差値（像ズレ量）を格納した画像のことである。
図２は、視差マップの概念図である。
図２に示す視差マップ２０１は、［０，２５５］のグレースケールの画像として表されている。背景領域は０の値が割り当てられ、画素値が小さいほど遠くの被写体を、画素値が大きいほど近くの被写体を表す。視差の算出方法としては、ブロックマッチングや位相限定相関法などの手法が知られており、本実施形態では、ブロックマッチングを例にとって説明する。ブロックマッチングでは、画像を小領域に分割したブロックごとに相関演算を行う。三角測量の式を用いることで、視差マップから距離マップに変換することができる。

【0024】

【数1】

【0025】

数１において、ｚは被写体までの距離［ｍｍ］である。また、ｆはレンズユニット１０１を１枚のレンズとみなしたときの合成レンズの焦点距離をピクセル単位に換算した値［ｐｉｘ］である。また、ｌは視差画像を取得する際の基線長［ｍｍ］である。また、ｄは視差［ｐｉｘ］である。

【0026】

以下、第１の実施形態の距離マップ生成部１６１で行われる処理について、図３に示す機能ブロック図及び図４に示すフローチャートを用いて説明する。図３に示すように距離マップ生成部１６１は、画像取得部３０１、カメラパラメータ取得部３０２、概算視差値取得部３０３、視差候補値算出部３０４、視差決定部３０５及び視差マップ変換部３０６を含む。
本実施形態では視差を求めてから被写体までの距離に変換するようにしている。ここで、視差は被写体までの距離に対応するので、後述の概算視差すなわち概算視差値を求めることは概算距離すなわち概算距離値を求めることに対応し、視差候補値を求めることは距離候補値を求めることに対応する。

【0027】

Ｓ４０１において、画像取得部３０１は、撮像制御部１４３から画像データを取得する。
Ｓ４０２において、カメラパラメータ取得部３０２は、フラッシュメモリ１５５から撮像装置１００に関するパラメータを取得する。ここでは、カメラパラメータ取得部３０２は、カメラパラメータとして、視差画像を取得する際の基線長、及びレンズユニット１０１に含まれるレンズ群の焦点距離値ｆを取得するものとする。カメラパラメータ取得部３０２は、その他にも、二台のカメラが平行配置されていない場合は、カメラの向きを取得するなど、距離を算出するために必要なパラメータを取得する。

【0028】

Ｓ４０３において、概算視差値取得部３０３は、各画素に対し、概算視差を取得する。概算視差の取得方法については後述する。本実施形態では、画素ごとに概算視差を取得する例について説明するが、画像中の領域ごとに取得しても構わない。後で説明するように、一つの画素（領域）には、複数の概算視差が与えられる場合がある。

【0029】

Ｓ４０４において、視差候補値算出部３０４は、ｉ番目の概算視差に基づいて、より精度の高い視差値を算出する。これをｉ番目の視差候補値と呼称する。視差候補値の算出方法については後述する。
Ｓ４０５において、視差候補値算出部３０４は、着目画素に付与されたすべての概算視差に対して、視差候補値を算出したかを判定する。
Ｓ４０５の判定の結果、全てに対して処理した場合は、Ｓ４０６において、視差決定部３０５は、複数の視差候補値の中から、一つの視差値を決定し、着目画素の視差とする。視差の決定方法に関しては、後述する。
Ｓ４０５の判定の結果、全てに対して処理していない場合は、Ｓ４０７において、概算視差値のインデックスｉを１つインクリメントし、Ｓ４０４に戻る。

【0030】

Ｓ４０８において、視差決定部３０５は、すべての画素に対して視差を決定したかを判定する。
Ｓ４０８の判定の結果、すべての画素に対して処理した場合は、Ｓ４１０において、視差マップ変換部３０５は、数１に基づいて各画素の視差を距離に変換して距離マップを生成し、ＲＡＭ１５４に距離マップを保存して処理を終了する。
Ｓ４０８の判定の結果、すべての画素に対して処理していない場合は、Ｓ４０９において、視差決定部３０５は、着目画素の位置を更新し、Ｓ４０３に戻る。以上が、距離マップ生成部１６１の動作である。

【0031】

（概算視差の取得方法）
概算視差値取得部３０３は、被写体ごとの概算視差を簡易的に取得する。まず、被写体の典型的な大きさの情報（既知のサイズ）を利用する場合について説明する。例えば被写体が人物である場合、顔検出（被写体認識）を行って、検出した顔（認識した被写体）を含むバウンディングボックスの画像上での大きさＬ［ｐｉｘ］を取得する。Ｌとしては、バウンディングボックスの縦・横幅の最大値とするが、対角線など他の量を用いてもよい。人間の顔の平均的な直径をＲ_ａｖｅ［ｍｍ］とし、レンズユニット１０１の焦点距離をｆ［ｐｉｘ］とすると、顔検出された人物までの距離の概算値ｚ［ｍｍ］は、以下の数２で得られる。

【0032】

【数2】

【0033】

次に、人物検出を行って、全身のマスクやバウンディングボックスを取得し、上で得られた距離値を数１に基づいて視差に変換し、領域内の画素に割り当てる。顔検出や人物検出の方法としては、機械学習を用いた手法など周知の技術を用いることができるため、ここでは説明を割愛する。

【0034】

その他にも、例えば視差画像を縮小し、それらを用いてブロックマッチングを実施してもよい。また、視差画像を縮小する代わりに、サイズの大きなブロックを用いてブロックマッチングを行ってもよい。ブロックマッチングの結果、得られた概略視差マップに対して、視差値が近いもの同士でクラスタリングして、クラスタごとに視差の代表値を割り当てることで、概ね被写体ごとに概算視差を得ることができる。ここで、視差の代表値としては、クラスタ内の視差の平均値や最頻値を用いることができる。

【0035】

このとき、被写体の一部が、実際の視差とは異なる概算視差を有する別のクラスタに含まれてしまう可能性がある。そこで、クラスタの領域を広げる膨張処理を施すことで、各クラスタ同士に重複領域を発生させることが望ましい。このことにより、それぞれの被写体が本来のクラスタに含まれるようにすることが可能になる。ブロックマッチングとは異なる手法で概算視差を算出した場合においても、概算視差が一定の領域に対し、膨張処理を行っても構わない。

【0036】

各画素や領域に対する概算視差の割り当て方の概念図を図５に示す。
図５は、人物検出を用いて、概算視差を算出した例を表している。
図５において、視差画像５００は撮影された視差画像を表している。被写体５０１及び５０２は視差画像５００に含まれる被写体である。領域５０３及び５０４は、それぞれ概算視差が一定の領域を表している。例えば、領域５０３には距離１０００［ｍｍ］に対応する概算視差Ｄ１が付与されており、領域５０４には距離２０００［ｍｍ］に対応する概算視差Ｄ２が付与されているものとする。距離から視差へは、数１を用いて換算することができる。

【0037】

図５では、同一被写体に対し、同一の概算視差を対応させている。概算視差値取得部３０３は、着目する画素が、複数の領域に含まれるか、被写体境界の近傍であるかを判定し、前述の条件を満たす画素に対しては、複数の概算視差を付与する。これは、遠近競合部に対して、複数の概算視差値を付与することに対応する。例えば、領域５０５は、領域５０３と５０４が重なった領域であるため、領域５０５に対しては、領域５０３に対応する概算視差値Ｄ１、及び領域５０４に対応する概算視差値Ｄ２の両方を付与する。さらに、領域５０５には、背景（無限遠）に対応する視差である０も付与してもよい。すなわち、概算視差値取得部３０３は、背景と被写体もしくは被写体同士が隣接しているか否かを判定している。

【0038】

同様に、領域５０３における被写体境界の近傍の領域に対しては、概算視差Ｄ１のほかに背景に対応する視差０も概算視差として付与する。被写体境界は、ソーベル法、ラプラシアン法やキャニー法など周知の技術を用いて検出することができる。検出された被写体境界に対して、閾値未満の距離にある画素の集合を被写体境界の近傍領域とする。なお、別の手法で被写体境界近傍の領域を特定しても構わない。領域５０４に対しても同様である。
以上のように、遠近競合部に対しては、概算視差を２つ以上与える。

【0039】

（視差候補値の算出方法）
視差候補値算出部３０４は、概算視差値取得部３０３が取得した概算視差をもとにブロックマッチングを行う際の探索範囲を限定する（探索範囲を狭める）。概念図を図６に示す。図６は、領域５０５における画素に対して、ブロックマッチングを行う際のシフト量と評価値の関係を示したものである。評価値は、相関値の一例である。図６において、横軸はシフト量であり、縦軸は評価値を表している。シフト量は、視差値に対応するため、図６では、横軸に概算視差値Ｄ１及びＤ２を記載している。視差＝０は、無限遠に対応する。概算視差値Ｄ１は、距離値１０００［ｍｍ］に対応した視差を表している。概算視差値Ｄ２は、距離値２０００［ｍｍ］に対応した視差を表している。

【0040】

評価値としては、ＳＡＤ（差分絶対値和）、ＳＳＤ（差分２乗和）やＺＮＣＣ（正規化相互相関）を用いることができる。以下では、ＳＡＤを用いた場合について説明する。グレースケール画像に対するＳＡＤは以下の数３で与えられる。評価値としてのＳＡＤは、値が最小になる場所が類似度が最も高い。

【0041】

【数3】

【0042】

数３において、Ｉ１は基準画像、Ｉ２は探索対象の視差画像を表し、（ｘ，ｙ）は画像上の座標、ｄは視差を表す。基準画像は、複数の画像のうちの一つの画像の一例である。視差画像は、複数の画像のうちの一つの画像とは異なる画像の一例である。和はブロック内に含まれる画素に対してとるものとし、Ｎはブロック内に含まれる画素数とする。カラー画像の場合は、ＲＧＢの各チャネルで差分絶対値を算出し、和をとって３で除算する。数３により、ＳＡＤの値が小さいほど、ブロック間の類似性が高いことが分かる。なお、ブロック内の画素値の類似度を表す指標であれば、上記以外のものを用いても構わない。

【0043】

図６の説明に戻る。探索範囲６０１、６０２及び６０３は、各概算視差に対する探索範囲を表している。探索範囲ｓの決め方としては、概算視差値Ｄを中心として、以下の数４のように決める。

【0044】

【数4】

【0045】

数４において、Δは一定値であり、例えばΔ＝５［ｐｉｘ］ととることができる。なお、Δは視差に基づいて決定してもよい。例えば、Δを概算視差Ｄの２乗に比例して決めても構わない。これは、ある距離ｚに対して、範囲［ｚ－δ，ｚ＋δ］にある被写体の視差の取りうる値の幅は、ｚに対応する視差Ｄを中心として、おおむねαδＤ^２で与えられることに起因する。αは定数である。

【0046】

視差候補値算出部３０４は、探索範囲６０１、６０２及び６０３のそれぞれに対し、評価値の探索範囲内の最小値６０４、６０５及び６０６を検出し、各最小値に対応する視差ｄ０、ｄ２、ｄ１を取得する。即ち、探索範囲内で最も類似度が高い視差を取得する。ここで、最小値は必ずしも極小値である必要はない。例えば、探索範囲６０２には極小値は存在しないが、最小値６０５に対応する視差ｄ２を取得する。最小値が複数存在する場合は、概算視差値に最も近い視差を選択する。また、視差候補値の値が近接しており、探索範囲同士に重なりがある場合は、探索範囲の和集合をとり、その範囲内において評価値が最小となる視差を取得する。

【0047】

なお、点６０７は探索対象の視差画像上に、基準画像のブロックと類似したテクスチャパターンが表れたため、極値となった点を示している。このような偽の極値は、被写体上に類似したテクスチャパターンが周期的に存在する場合に発生する。それ以外にも、ブロックサイズが小さい場合は、ブロック内テクスチャパターンが偶然類似する頻度が多くなるため、ノイズなどの影響により、偽の極値が発生する確率が高くなる。視差距離値に基づいて、探索範囲を限定することにより、このような偽の極値を除外することができる。ブロックマッチングにおけるブロックサイズは、マッチングにおけるウィンドウサイズの一例である。ブロックマッチングにおけるブロックは、マッチングにおける参照ウィンドウの一例である。

【0048】

視差候補値算出部３０４は、複数の概算視差が与えられている画素に対しては、ブロックサイズを小さくしてマッチングを行うことが好ましい。これは、遠近競合部において、被写体の境界部における視差を高精度に算出するためである。例えば、ある画素における概算視差の個数に応じて、ブロックサイズを決めても構わない。前述したように、ブロックサイズを小さくした場合、偽の極値の発生確率が高くなるため、探索範囲の限定がより有効に作用する。

【0049】

（視差の決定方法）
視差決定部３０５は、各視差候補値ｄ０、ｄ１、ｄ２における評価値を比較し、最も評価値の値が小さい（最も類似度が高い）視差候補値を最終的な視差ｄとして決定する。図６の例では、最小値６０６に対応する視差が選択される。

【0050】

以上説明したように、本実施形態によれば、遠近競合部においても高精度に被写体までの距離（視差）を算出することが可能になる。

【0051】

［第２の実施形態］
第１の実施形態では、評価値の値が近接する視差候補値が複数存在する場合、誤った視差を選択する可能性がある。そこで、本実施形態では、上記のような場合において、より精度の高い視差の決定方法について説明する。

【0052】

第２の実施形態の処理について、図７のフローチャートを参照して説明する。なお、第１の実施形態と同一の処理に関しては、同じ符号を付して詳しい説明を省略する。また、第１の実施形態と同様、評価値として、ＳＡＤ（差分絶対値和）を用いた場合について説明する。

【0053】

概算視差値取得部３０３は、Ｓ７０１において、概算視差に加えて、概算視差の信頼度を取得する。信頼度の算出方法については後述する。
Ｓ７０２において、視差決定部３０５は、評価値の最小値Ｖｍｉｎを検出し、｜Ｖ（ｄ）―Ｖｍｉｎ｜＜Ｔｈとなる視差候補値ｄが複数存在するか判定する。Ｖ（ｄ）はｄに対する評価値、Ｔｈは予め定めた閾値である。ここでは、最小値Ｖｍｉｎとの値の近さを測る尺度として絶対値を用いたが、別の関数を用いても構わない。

【0054】

｜Ｖ（ｄ）―Ｖｍｉｎ｜＜Ｔｈとなる視差候補値ｄが１つしか存在しない場合は、Ｓ７０３において、視差決定部３０５は、Ｖｍｉｎに対応する視差候補値ｄを最終的な視差として決定する。
｜Ｖ（ｄ）―Ｖｍｉｎ｜＜Ｔｈとなる視差候補値ｄが複数存在する場合は、Ｓ７０４において、視差決定部３０５は、｜Ｖ（ｄ）―Ｖｍｉｎ｜＜Ｔｈとなる視差候補値の中で、最も信頼度の高い視差候補値を最終的な視差として決定する。
なお、ここでは、信頼度のみを用いて視差を決定したが、信頼度と、評価値の重みづけ和を用いて最終的な視差を決定してもよい。

【0055】

（信頼度の算出方法）
概算視差値取得部３０３は、同一の概算視差を有する領域の境界に近いほど信頼度を低く設定し、遠いほど信頼度を高く設定する。例えば、境界からの距離に定数を乗じたものを信頼度とすることができる。信頼度は連続値や複数の値を用いてもよいし、２値でも構わない。また、第１の実施形態で述べたように、領域を膨張させた場合は、膨張領域に対して信頼度を低く設定する。膨張領域に含まれている値は、信頼度を低く設定することで、視差候補値から除外するようにしてもよい。｜Ｖ（ｄ）―Ｖｍｉｎ｜＜Ｔｈとなる視差候補値ｄが複数存在する場合には、膨張領域に含まれている値は、予め視差候補値から除外するようにしてもよい。
ブロックマッチングを用いて、概算視差を決めた場合は、ブロックマッチングをした際の評価値を用いて信頼度を決めても構わない。例えば、評価値が大きい場合は、信頼度を低くする。

【0056】

以上説明したように、本実施形態によれば、概算視差の信頼度も考慮することにより、より高精度に視差を決定することが可能になる。

【0057】

（その他の実施形態）
本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサーがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

【0058】

以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。

【符号の説明】

【0059】

１００撮像装置
１５２画像処理部
３０１画像取得部
３０２カメラパラメータ取得部
３０３概算視差値取得部
３０４視差候補値算出部
３０５視差決定部
３０６視差マップ変換部

【図1】