特許第5734460号(P5734460)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ テレコム・イタリア・エッセ・ピー・アーの特許一覧

特許5734460画像を比較するための方法およびシステム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5734460
(24)【登録日】2015年4月24日
(45)【発行日】2015年6月17日
(54)【発明の名称】画像を比較するための方法およびシステム
(51)【国際特許分類】
   G06T 7/00 20060101AFI20150528BHJP
   G06F 17/30 20060101ALI20150528BHJP
【FI】
   G06T7/00 300G
   G06F17/30 170B
   G06F17/30 350C
【請求項の数】17
【全頁数】37
(21)【出願番号】特願2013-550768(P2013-550768)
(86)(22)【出願日】2011年1月25日
(65)【公表番号】特表2014-508349(P2014-508349A)
(43)【公表日】2014年4月3日
(86)【国際出願番号】EP2011050994
(87)【国際公開番号】WO2012100819
(87)【国際公開日】20120802
【審査請求日】2013年9月17日
(73)【特許権者】
【識別番号】503148270
【氏名又は名称】テレコム・イタリア・エッセ・ピー・アー
(74)【代理人】
【識別番号】100140109
【弁理士】
【氏名又は名称】小野 新次郎
(74)【代理人】
【識別番号】100075270
【弁理士】
【氏名又は名称】小林 泰
(74)【代理人】
【識別番号】100101373
【弁理士】
【氏名又は名称】竹内 茂雄
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100120112
【弁理士】
【氏名又は名称】中西 基晴
(72)【発明者】
【氏名】コルダラ,ジョヴァンニ
(72)【発明者】
【氏名】フランシニ,ジャンルーカ
(72)【発明者】
【氏名】レプソイ,スキャルグ
(72)【発明者】
【氏名】ポルト,ブアルキ・ディ・グスマオ・ペドロ
【審査官】 佐藤 実
(56)【参考文献】
【文献】 Sam S. Tsai et al.,FAST GEOMETRIC RE-RANKING FOR IMAGE-BASED RETRIEVAL,2010 IEEE 17th International Conference on Image Processing(ICIP),IEEE,2010年 9月26日,pages 1029-1032
【文献】 金谷健一 外1名,テンプレートマッチングによる対応探索の自動しきい値設定法,情報処理学会研究報告 2002−CVIM−132,社団法人情報処理学会,2002年 3月 8日,第2002巻 第26号,第23-30頁
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
第1画像と第2画像とを比較する方法であって、
前記第1画像の複数の第1キーポイントと前記第2画像の複数の第2キーポイントとを識別するステップと、
各第1キーポイントを、対応する第2キーポイントと関連付けして、対応するキーポイントマッチを形成するステップと、
第1キーポイントの各ペアについて、それらの間の距離を計算して、対応する第1長さを得るステップと、
第2キーポイントの各ペアについて、それらの間の距離を計算して、対応する第2長さを得るステップと、
複数の距離比率を計算するステップであって、各距離比率は、それぞれ、第1長さと第2長さとの間での選択されたものと、第2長さと第1長さとの間での対応する選択されたものとの間での長さ比率に基づく、ステップと、
前記複数の距離比率の統計的分布を計算するステップと、
前記第1画像および前記第2画像のキーポイントのランダムな選択に対応する更なる距離比率の統計的分布を表すモデル関数を生成するステップと、
前記複数の距離比率の前記統計的分布と、前記モデル関数とを比較するステップと、
前記比較に基づいて、前記第1画像が、前記第2画像に描写されたオブジェクトのビューを含むかを評価するステップと
を含む方法。
【請求項2】
請求項1に記載の方法であって、
前記複数の距離比率の前記分布を、複数の順序付けられたビンを有するヒストグラムの形にするステップであって、各ビンは距離比率の値のそれぞれの間隔に対応するものであり、前記ヒストグラムは、各ビンに関して、前記それぞれの間隔内に含まれる値を有する分布の距離比率の対応する数を列挙する、ステップと、
各ビンに関して、前記ビンにわたっての前記モデル関数の積分に対応する、対応するモデル確率を生成するステップと
を更に含み、
前記複数の距離比率の分布と前記モデル関数とを比較する前記ステップは、前記ヒストグラムと前記モデル確率とを比較するステップを含む、
方法。
【請求項3】
請求項2に記載の方法であって、前記ヒストグラムと前記モデル確率とを比較する前記ステップは、ピアソンのカイ2乗検定を行うステップを含む、方法。
【請求項4】
請求項1から3の何れかに記載の方法であって、前記距離比率を計算する前記ステップは、前記長さ比率の対数の計算を提供する、方法。
【請求項5】
請求項2、請求項3、または、請求項2もしくは3に従属する場合の請求項4に記載の方法であって、誤ったキーポイントマッチの数を推定するステップを更に含み、誤ったキーポイントマッチは、前記第1画像と前記第2画像とに描写された同じオブジェクトの同じポイントに対応しない第1キーポイントと第2キーポイントとにより形成され、誤ったキーポイントマッチの数を推定する前記ステップは、
重みパラメータを初期値へと初期化するステップと、
以下のa)およびb)のステップ、
a)前記重みパラメータを用いて前記モデル確率を重み付けするステップと、
b)前記重みパラメータの値を増加させるステップと
を少なくとも1つの重み付けされたモデル確率の値が、前記モデル確率に対応する前記ビンにおいて前記ヒストグラムにより列挙されている距離比率の数に到達するまで反復するステップと、
前記重みパラメータがとる最新の値に基づいて、誤ったキーポイントマッチの数を求めるステップと
を含む、方法。
【請求項6】
請求項5に記載の方法であって、正しいキーポイントマッチの数を推定するステップを更に含み、正しいキーポイントマッチは、前記第1画像と前記第2画像とに描写された同じオブジェクトの同じポイントに対応する第1キーポイントと第2キーポイントとにより形成されるものであり、正しいキーポイントマッチの数を推定する前記ステップは、第1キーポイントマッチの数に、前記重みパラメータがとる前記最新の値を1から減算した値の平方根と等しい項を乗算したものに基づく、方法。
【請求項7】
請求項6に記載の方法であって、
マトリックスを計算するステップであって、前記マトリックスの各エレメントは、キーポイントマッチのそれぞれのペアに対応し、且つ、前記キーポイントマッチのそれぞれのペアの前記距離比率を含む前記ビンのところで前記ヒストグラムがとる値と、前記ビンに対応する重み付けされた前記モデル確率との間の差に対応する値を有する、ステップと、
前記マトリックスの主な固有ベクトルを見つけるステップと、
前記主な固有ベクトルに基づいて、何れのキーポイントマッチが最も正しいと考えられるキーポイントマッチであるかを識別するステップと
を更に含む方法。
【請求項8】
請求項7に記載の方法であって、何れのキーポイントマッチが最も正しいと考えられるキーポイントマッチであるかを識別する前記ステップは、最も大きな絶対値を有する前記固有ベクトルの前記エレメントを識別するステップを含む、方法。
【請求項9】
第1画像と第2画像とを比較するための装置であって、
前記第1画像の複数の第1キーポイントと前記第2画像の複数の第2キーポイントとを識別するように構成された第1識別ユニットと、
各第1キーポイントと、対応する第2キーポイントとを関連付けて、対応するキーポイントマッチを形成するように構成された関連付けユニットと、
第1キーポイントの各ペアについて、それらの間の距離を計算して、対応する第1長さを得るように構成された第1計算ユニットと、
第2キーポイントの各ペアについて、それらの間の距離を計算して、対応する第2長さを得るように構成された第2計算ユニットと、
複数の距離比率を計算するように構成された第3計算ユニットであって、各距離比率は、それぞれ、第1長さと第2長さとの間での選択されたものと、第2長さと第1長さとの間での対応する選択されたものとの間での長さ比率に基づく、第3計算ユニットと、
前記複数の距離比率の統計的分布を計算するように構成された第4計算ユニットと、
前記第1画像および前記第2画像のキーポイントのランダムな選択に対応する更なる距離比率の統計的分布を表すモデル関数を生成するように構成された第1生成ユニットと、
前記複数の距離比率の前記統計的分布と前記モデル関数とを比較するように構成された第1比較ユニットと、
前記比較に基づいて、前記第1画像が、前記第2画像に描写されたオブジェクトのビューを含むかを評価するように構成された評価ユニットと
を含む装置。
【請求項10】
請求項9に記載の装置であって、
前記複数の距離比率の分布を、複数の順序付けられたビンを有するヒストグラムの形に配置するように構成された配置手段であって、各ビンは距離比率の値のそれぞれの間隔に対応し、前記ヒストグラムは、各ビンに関して、前記それぞれの間隔内に含まれる値を有する前記分布の距離比率の対応する数を列挙する、配置手段と、
各ビンについて、前記ビンにわたっての前記モデル関数の積分に対応する、対応するモデル確率を生成するように構成された第2生成ユニットと
を更に含み、
前記第1比較ユニットは、前記ヒストグラムと前記モデル確率とを比較するように構成された第2比較ユニットを含む、
装置。
【請求項11】
請求項10に記載の装置であって、
誤ったキーポイントマッチの数を推定するように構成された第1推定ユニットを更に含み、誤ったキーポイントマッチは、前記第1画像と前記第2画像とに描写された同じオブジェクトの同じポイントに対応しない第1キーポイントと第2キーポイントとにより形成され、前記第1推定ユニットは、
重みパラメータを初期値へと初期化するように構成された初期化ユニットと、
重み付けユニットであって、以下のa)およびb)の動作、
a)前記重みパラメータを用いて前記モデル確率に重み付けすること、および
b)前記重みパラメータの値を増加させること
を、少なくとも1つの重み付けされたモデル確率の値が、前記モデル確率に対応する前記ビンにおいて前記ヒストグラムにより列挙されている距離比率の数に到達するまで反復するように構成された重み付けユニットと、
前記重みパラメータがとる最新の値に基づいて、誤ったキーポイントマッチの数を求めるように構成された決定ユニットと
を含む、装置。
【請求項12】
請求項11に記載の装置であって、
正しいキーポイントマッチの数を推定するように構成された第2推定ユニットを更に含み、正しいキーポイントマッチは、前記第1画像と前記第2画像とに描写された同じオブジェクトの同じポイントに対応する第1キーポイントと第2キーポイントとにより形成され、前記第2推定ユニットは、第1キーポイントマッチの数に、前記重みパラメータがとる最新の値を1から減算した値の平方根と等しい項を乗算したものに基づいて、正しいキーポイントマッチの数を推定するように構成された、装置。
【請求項13】
請求項12に記載の装置であって、
マトリックスを計算するように構成された第5計算ユニットであって、前記マトリックスの各エレメントは、キーポイントマッチのそれぞれのペアに対応し、且つ、前記キーポイントマッチのそれぞれのペアの前記距離比率を含む前記ビンにおいて前記ヒストグラムがとる値と、前記ビンに対応する重み付けされた前記モデル確率との間の差に対応する値を有する、第5計算ユニットと、
前記マトリックスの主な固有ベクトルを見つけるように構成された発見ユニットと、
前記主な固有ベクトルに基づいて、何れのキーポイントマッチが最も正しいキーポイントマッチと考えられるかを識別するように構成された第2識別ユニットと
を更に含む装置。
【請求項14】
クエリ画像を受け取り、前記画像における対応する第1キーポイントを識別するように構成されたキーポイント検出ユニットと、
前記第1キーポイントのローカルのアスペクトを、対応する第1ローカル記述子を通じて記述するように構成された特徴計算ユニットと、
複数の参照画像を記憶する参照データベースであって、各参照画像に関して、対応する第2キーポイントと、前記第2キーポイントの対応する第2ローカル記述子とを更に記憶する参照データベースと、
少なくとも1グループの参照画像のうちの各参照画像に関して、前記第1ローカル記述子と前記参照画像の前記第2ローカル記述子とを比較するように構成された特徴マッチングユニットであって、前記第1キーポイントと前記参照画像の前記第2キーポイントとを関連付けて、対応するキーポイントマッチの組を生成するように構成された特徴マッチングユニットと、
前記特徴マッチングユニットにより行われた比較に基づいて参照図のサブセットを選択するように構成された選択ユニットと、
前記クエリ画像と前記サブセットの1つの参照画像とを含む各ペアに関して、正しいキーポイントマッチの数を計算するように構成された最適化ユニットであって、請求項12または請求項13に記載の装置を含む最適化ユニットと
を含むシステム。
【請求項15】
請求項14に記載のシステムであって、ビジュアル・サーチ・サーバと、ネットワークを通じて前記ビジュアル・サーチ・サーバへクエリ画像を供給するように構成された複数の端末とを更に含み、
前記ビジュアル・サーチ・サーバは、前記キーポイント検出ユニットと、前記特徴計算ユニットと、前記参照データベースと、前記特徴マッチングユニットと、前記選択ユニットと、前記最適化ユニットとを含む、
システム。
【請求項16】
請求項14に記載のシステムであって、ビジュアル・サーチ・サーバと、ネットワークを通じて前記ビジュアル・サーチ・サーバへクエリ画像を供給するように構成された複数の端末とを更に含み、
前記ビジュアル・サーチ・サーバは、前記参照データベースと、前記特徴マッチングユニットと、前記選択ユニットと、前記最適化ユニットとを含み、
各端末は、それぞれのキーポイント検出ユニットと、それぞれの特徴計算ユニットとを含む、
システム。
【請求項17】
請求項14に記載のシステムであって、ビジュアル・サーチ・サーバと、ネットワークを通じて前記ビジュアル・サーチ・サーバとデータを交換するように構成された複数の端末とを更に含み、
前記ビジュアル・サーチ・サーバは前記参照データベースを含み、
各端末は、それぞれのキーポイント検出ユニットと、それぞれの特徴計算ユニットと、それぞれの特徴マッチングユニットと、それぞれの選択ユニットと、それぞれの最適化ユニットと、それぞれのローカル・データベースとを含み、
各端末は、前記参照データベースに記憶されている第2キーポイントと前記第2キーポイントの対応する第2ローカル記述子とのそれぞれのセットを、前記ビジュアル・サーチ・サーバから受け取るように構成され、
前記端末の前記ローカル・データベースは、受け取った第2キーポイントと第2ローカル記述子との前記セットを記憶するように構成され、記憶された第2キーポイントと第2ローカル記述子との前記セットは、少なくとも1グループの参照画像のうちの前記参照画像に対応する、
システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像分析の分野に関する。
【背景技術】
【0002】
画像分析の分野では、一般的な動作において、2つの画像の双方が同じシーンや同じオブジェクトの少なくとも一部を含む場合、2つの画像の間の関係を見つけるために、2つの画像の比較を行う。
【0003】
多数のアプリケーションの中では、画像の比較は、マルチカメラ・システムに属するビデオ・カメラの校正のため、ビデオ撮影の2つのフレーム間で生じる運動を評価するため、および画像(例えば、ピクチャ)内の物を認識するために、最も重要である。後者のアプリケーションは、現在、重要性が増してきていると考えられる。その理由は、ビジュアル・サーチ・エンジンと呼ばれるもので用いられるように特定的に設計されたオブジェクト認識アルゴリズム、即ち、ピクチャから開始して、そのピクチャ内に描写されているオブジェクト(1または複数)を識別し、その識別されたオブジェクト(1または複数)と関連する情報を提供することができる自動サービスの、最近の発展に起因する。このタイプの既知のサービスの例は、Google(登録商標) Goggles(グーグル・ゴーグル)、Nokia(登録商標) Point&Find(ノキア・ポイント・アンド・ファインド)、kooaba Smart Visuals(クアバ・スマート・ビジュアルズ)を含む。オブジェクト認識アルゴリズムは、第1画像、即ち、認識対象のオブジェクトを描写しており、専門用語で「クエリ画像(query image、問合せ画像)」と呼ばれる第1画像と、それぞれが個々の既知のオブジェクトを描写している複数の参照画像(reference image)との比較を行えるようにする。これにより、クエリ画像に描写されたオブジェクトと参照画像に描写されたオブジェクトとの間での比較を可能とする。
【0004】
参照画像は、典型的には、適切な参照データベースに配される。データベースに含まれる参照画像の数が多いほど、行われる比較動作の数が多くなる。幾つかの場合、参照データベースは、非常に大きくなる場合があり、オブジェクト認識プロセスの効率に関して悪影響を与える。例えば、オブジェクト認識をオンライン・ショッピングのシナリオにおいて用いる場合、それぞれの参照画像(例えば、ブック・カバーや、DVDやCDのカバーのピクチャ)がオンライン・ストアで販売されている物品に対応するので、参照画像の数は数百万の個体数を超え得る。更に、そのような大量のデータを効率的に管理するために、比較動作は、十分な処理能力のある処理ユニットにより行われるべきである。
【0005】
この10年、オブジェクト認識を行うために必要な時間を低減するための様々なアルゴリズムが提案されてきた。それらのアルゴリズムは、クエリ画像に描写されたオブジェクトを含む候補である参照画像の数を、大きく低減するものである。
【0006】
2つの画像間での比較の動作を行うための非常に効率的な方法は、第1画像において、専門用語でキーポイントと呼ばれるポイントの組を選択し、次に、その1組のキーポイントのそれぞれを、第2画像における対応するキーポイントとマッチングする。第1画像における何れのポイントをキーポイントとすべきかの選択は、ポイント自体を囲む画像の範囲のローカルの特徴(local feature)を考慮して行われる。この点に関しては、2004年のInternational Journal of computer visionにおけるDavid G. Loweによる「Distinctive image features from scale-invariant keypoints(スケール不変キーポイントからの区別される画像特徴)」を参照されたい。
【0007】
第1画像のキーポイントと第2画像の対応するキーポイントとの双方が、同じオブジェクト(2つの画像の双方に描写されている)の同じポイントに対応するという意味において、第1画像のキーポイントと第2画像の対応するキーポイントとのマッチング(matching)が正しい場合、そのようなキーポイントのマッチ(match)を「インライア(inlier)」という。
【0008】
逆に、第1画像のキーポイントと第2画像の対応するキーポイントとの双方が、同じオブジェクトの同じポイントに対応しないという意味において、第1画像のキーポイントと第2画像の対応するキーポイントとのマッチングが正しくない場合、そのようなキーポイントのマッチを「アウトライア(outlier)」という。
【0009】
従って、信頼性のある結果を得るために、アウトライアとインライアを区別できる手順が、キーポイントのマッチが決定された後に好都合に行われる。
【0010】
このタイプの手順の幾つかの例は、従来技術において既に知られている。
【0011】
最もよく使用される手順は、1981年6月のCommunications of the ACMの24(6)の第381−395ページにおけるMartin A. FischlerおよびRobert C. Bollesによる「Random sample consensus: A paradigm for model fitting with applications to image analysis and automated cartography(ランダム・サンプル・コンセンサス:画像分析および自動地図作成に対するアプリケーションと適合するモデルのパラダイム)」に開示されているRANSACアルゴリズムを使用する。しかし、このアルゴリズムは、反復手法に基づくので、時間を浪費する。
【0012】
2010年10月のInternational Conference on Image ProcessingにおけるSam S. Tsai、Davide Chen、Gabriel Takacs、Vijay Chandrasekhar、Ramakrishna Vedantham、Radek Grzeszczuk、Bernd Girodによる「Fast geometric re-ranking for image-based retrieval(画像ベースの検索のための高速の幾何学的な再整列)」に開示されているアルゴリズムと、国際特許出願のWO2009/130451に開示されているアルゴリズムとは、変換、回転、およびスケーリングが行われてもキーポイントの距離の間の比率が不変であるという事実に基づく。更に、このタイプのアルゴリズムは、2010年8月のInternational Conference on Pattern Recognitionの第842−845ページのZhipeng Wu、Qianqian Xu、Shuqiang Jiang、Qingming Huang、Peng Cui、およびLiang Liによる「Adding Affine Invariant Geometric Constraint for Partial-Duplicate Image Retrieval(部分的複製画像検索のためのアファイン不変量幾何学制約の付加)」、および2010年の20th International Conference on Pattern Recognitionの第1844−1847ページにおける Daniel FleckおよびZoran Duricによる「Using Local Affine Invariants to Improve Image Matching(画像のマッチングを改善するためのローカル・アファイン不変量の使用)」に開示されている。
【0013】
更に、US 2010/0135527 A1は、キーポイント・ベースの比較と認識ベースの色比較とを含む画像認識アルゴリズムを開示する。そのアルゴリズムを用いてターゲット画像を識別する方法は、処理デバイスにおいて、ターゲット画像に関連するデータを含む入力を受けるステップと、画像データベースから画像を検索することと、その画像が受け入れられるまで又は拒否されるまで、その画像を候補画像として指定することとを含む検索ステップを行うステップと、処理デバイスを用いて、ターゲット画像および候補画像に対して画像認識アルゴリズムを実行し、画像認識アルゴリズム出力を得ることを含む画像認識ステップを行うステップと、画像認識アルゴリズム出力が予め選択された範囲内にあるとき、候補画像をターゲット画像として受け入れることと、画像認識アルゴリズム出力が予め選択された範囲内にないとき、候補画像を拒否し、検索ステップ、画像認識ステップ、および比較ステップを反復することとを含む比較ステップを行うステップとを含む。
【0014】
US 2010/0183229 A1は、画像のマッチングのための方法、システム、およびコンピュータ・プログラム製品について言及している。マッチングされる画像は、特徴ポイント(feature point)と、特徴ポイントと関連する特徴ベクトル(feature vector)および向きとにより表される。最初に、特徴ベクトルを用いて、推測される対応(putative correspondence)を決定する。推測される対応のサブセットが選択され、そのサブセットの位相同形が決定される。推測される対応の位相同形サブセットは、運動推定(motion estimation)モデルを確立するために使用される。向き整合性テスト(orientation consistency test)が、推測される対応と、決定された対応する運動推定変換とに対して行われて、実行不可能な変換を避けるようにする。向き整合性テストを満足させるマッチに対して、被写域(coverage)テストが行われる。画像のうちの1つの画像の重要部分を包含していない候補のマッチングは、拒否される。複数の画像が全てのテストの要求を満足させる場合、マッチングが低減する順に、最終的なマッチ画像が提供される。
【発明の概要】
【発明が解決しようとする課題】
【0015】
出願人は、オブジェクト認識サービスを実現させるための上記の既知のアプローチが、幾つかの欠点の影響を受けることを発見した。特に、これらのアプローチは、反復する手順に基づいたり、大量のデータの処理を必要としたりするので、時間を浪費する。
【0016】
出願人は、時間の浪費および大量のデータの処理に関して、これらのアプローチを改善することに関する問題に取り組んだ。
【0017】
特に、出願人は、データ処理に関して信頼性があり、且つ時間の浪費に関して良好な能力を有する、画像を比較する方法を提供することに関する問題に取り組んだ。
【課題を解決するための手段】
【0018】
出願人は、キーポイントの組が第1画像(クエリ画像)上に生成され、そのキーポイントの組が第2画像(参照画像)上に生成される対応するキーポイントの組と関連付けされて、対応するキーポイントマッチの組を形成するところから始めることにより、本発明に従った画像を比較する方法が、主段階と2つの後続のオプション段階とを含むことができることを発見した。
【0019】
主段階は、キーポイントマッチを生成した後に適用されるものであり、キーポイントマッチの統計的な処理を提供し、それに従って、幾何学的整合性テスト(geometric consistency test)を通じて、クエリ画像と参照画像とが同じオブジェクトを描写しているようであるか否かについての評価を行う。より詳細には、誤ったマッチ(アウトライア)の統計的分布を表すモデル関数を生成後、適合度テストを行い、参照画像が、クエリ画像に存在するオブジェクトのビュー(view)を含んでいるかを決定する。
【0020】
肯定的結果が得られた場合、方法は、参照画像に描写されているオブジェクトと、クエリ画像に描写されているオブジェクトとの間の実際の相似性のランク付けに使用されるスコアを計算することができる。
【0021】
第2段階は、キーポイントマッチの全ての組の中で幾つのキーポイントマッチがインライアであるかを評価することを可能にする。
【0022】
この段階は、ビジュアル・サーチ・アプリケーションにおける精度を向上させるように、好都合に行うことができる。
【0023】
第3段階は、何れのキーポイントマッチがインライアであり、何れのキーポイントマッチがアウトライアであるかを、特に識別することを可能にする。
【0024】
このような段階は、拡張現実(augmented reality)などのような幾つかの特定のアプリケーションにおいて、好都合に行うことができる。
【0025】
より詳細には、本発明の1つの態様によると、本発明は、第1画像と第2画像とを比較する方法と関連する。方法は、第1画像の複数の第1キーポイントと第2画像の複数の第2キーポイントとを識別し、各第1キーポイントと、対応する第2キーポイントとを関連付けし、対応するキーポイントマッチを形成することを含む。第1キーポイントの各ペアに関して、方法は更に、それらの間の距離を計算して、対応する第1長さを得ることを含む。同様に、第2キーポイントの各ペアに関して、方法は、それらの間の距離を計算して、対応する第2長さを求めることを含む。方法は更に、複数の距離比率を計算することを含み、それぞれの距離比率は、第1長さと第2長さとの間での選択されたものと、第2長さと第1長さとの間での対応する選択されたものとの間での、それぞれの、長さ比率に基づく。方法は更に、複数の距離比率の統計的分布を計算することと、第1画像および第2画像のキーポイントのランダムな選択に対応する更なる距離比率の統計的分布を表すモデル関数を生成することとを含む。方法は、前記の複数の距離比率の統計的分布と、前記のモデル関数とを比較することと、前記の比較に基づいて、第1画像が、第2画像に描写されたオブジェクトのビューを含むかを評価することとを含む。
【0026】
本発明の1つの実施形態に従うと、方法は、複数の距離比率の分布を、複数の順序付けられたビン(bin)を有するヒストグラムの形に配置することを含み、各ビンは距離比率値のそれぞれの間隔に対応する。ヒストグラムは、各ビンに関して、それぞれの間隔内に含まれる値を有する分布の距離比率の対応する数を列挙する。各ビンに関して、方法は更に、前記のビンにわたってのモデル関数の積分に対応する、対応するモデル確率を生成することを含む。前記の、複数の距離比率の分布と前記のモデル関数とを比較することは、ヒストグラムとモデル確率とを比較することを含む。
【0027】
好適には、前記のヒストグラムとモデル確率とを比較することは、ピアソンのカイ2乗検定を行うことを含む。
【0028】
好都合なことに、前記の距離比率を計算することは、長さ比率の対数を計算することを提供する。
【0029】
本発明の1つの実施形態に従うと、方法は更に、誤ったキーポイントマッチの数を推定することを含む(誤ったキーポイントマッチは、第1画像と第2画像とに描写された同じオブジェクトの同じポイントに対応しない第1キーポイントと第2キーポイントとにより形成される)。前記の誤ったキーポイントマッチの数を推定することは、重みパラメータを初期値へと初期化することと、次のa)およびb)を反復することと、即ち、a)重みパラメータを用いてモデル確率に重み付けすること、およびb)重みパラメータの値を増加させることを、少なくとも1つの重み付けされたモデル確率の値が、前記のモデル確率に対応するビンにおいてヒストグラムにより列挙されている距離比率の数に到達するまで反復することとを含む。方法は更に、重みパラメータがとる最新の値に基づいて、誤ったキーポイントマッチの数を求めることを含む。
【0030】
本発明の1つの実施形態に従うと、方法は更に、正しいキーポイントマッチの数を推定することを含む(正しいキーポイントマッチは、第1画像と第2画像とに描写された同じオブジェクトの同じポイントに対応する第1キーポイントと第2キーポイントとにより形成される)。前記の正しいキーポイントマッチの数を推定することは、第1キーポイントマッチの数に、重みパラメータがとる最新の値を1から減算した値の平方根と等しい項を、乗算したものに基づく。
【0031】
本発明の更なる実施形態に従うと、方法は更に、マトリックスを計算することを含み、そのマトリックスの各エレメントは、キーポイントマッチのそれぞれのペアに対応し、且つ、キーポイントマッチのそれぞれのペアの距離比率を含むビンのところでヒストグラムがとる値と、前記のビンに対応する重み付けされたモデル確率(weighted model probability)との間の差に対応する値を有する。方法は更に、マトリックスの主な固有ベクトルを見つけることと、前記の主な固有ベクトルに基づいて、何れのキーポイントマッチが最も正しいと考えられるキーポイントマッチであるかを識別することとを含む。
【0032】
前記の、何れのキーポイントマッチが最も正しいと考えられるキーポイントマッチであるかを識別することは、最も大きな絶対値を有する固有ベクトルのエレメントを識別することを含む。
【0033】
本発明の1つの態様では、第1画像と第2画像とを比較するための装置を提供する。装置は、第1画像の複数の第1キーポイントと第2画像の複数の第2キーポイントとを識別するように構成される第1識別ユニットと、対応するキーポイントマッチを形成するために、各第1キーポイントと、対応する第2キーポイントとを関連付けように構成される関連付けユニットとを含む。第1計算ユニットは、第1キーポイントの各ペアに対して、それらの間の距離を計算して、対応する第1長さを得るように構成され、第2計算ユニットは、第2キーポイントの各ペアに対して、それらの間の距離を計算して、対応する第2長さを得るように構成される。装置は更に、複数の距離比率を計算するように構成された第3計算ユニットを含み、各距離比率は、それぞれ、第1長さと第2長さとの間での選択されたものと、第2長さと第1長さとの間での対応する選択されたものとの間での長さ比率に基づく。装置は更に、複数の距離比率の統計的分布を計算するように構成された第4計算ユニットと、第1画像および第2画像のキーポイントのランダムな選択に対応する更なる距離比率の統計的分布を表すモデル関数を生成するように構成された第1生成ユニットとを含む。装置は、前記の複数の距離比率の統計的分布と前記のモデル関数とを比較するように構成された第1比較ユニットと、前記の比較に基づいて、第1画像が、第2画像に描写されたオブジェクトのビューを含むかを評価するように構成される評価ユニットとを含む。
【0034】
本発明の1つの実施形態に従うと、装置は更に、複数の距離比率の分布を、複数の順序付けられたビンを有するヒストグラムの形に配置するよう構成された配置手段(arranging means)を含み、各ビンは距離比率値のそれぞれの間隔に対応し。ヒストグラムは、各ビンに関して、それぞれの間隔内に含まれる値を有する分布の距離比率の対応する数を列挙する。装置は更に、各ビンに関して、前記のビンにわたってのモデル関数の積分に対応する、対応するモデル確率を生成するように構成された第2生成ユニットを含む。前記の第1比較ユニットは、ヒストグラムとモデル確率とを比較するように構成された第2比較ユニットを含む。
【0035】
本発明の更なる実施形態に従うと、装置は、誤ったキーポイントマッチの数を推定するように構成される第1推定ユニットを含み、誤ったキーポイントマッチは、第1画像と第2画像とに描写された同じオブジェクトの同じポイントに対応しない第1キーポイントと第2キーポイントとにより形成される。第1推定ユニットは、重みパラメータを初期値へと初期化するように構成された初期化ユニットと、a)重みパラメータを用いてモデル確率を重み付けする操作と、b)重みパラメータの値を増加させる操作とを、少なくとも1つの重み付けされたモデル確率の値が、前記のモデル確率に対応するビンにおいてヒストグラムにより列挙されている距離比率の数に到達するまで反復するように構成された重み付けユニットとを含む。装置は更に、重みパラメータがとる最新の値に基づいて、誤ったキーポイントマッチの数を求めるように構成された決定ユニットを含む。
【0036】
好ましくは、装置は更に、正しいキーポイントマッチの数を推定するように構成された第2推定ユニットを含み、前記の第2推定ユニットは、第1キーポイントマッチの数に、重みパラメータがとる最新の値を1から減算した値の平方根と等しい項を乗算したものに基づいて、正しいキーポイントマッチの数を推定するように構成される。
【0037】
本発明の更なる実施形態に従うと、装置は更に、マトリックスを計算するように構成された第5計算ユニットを含み、そのマトリックスの各エレメントは、キーポイントマッチのそれぞれのペアに対応し、且つ、キーポイントマッチのそれぞれのペアの距離比率を含むビンにおいてヒストグラムがとる値と、前記のビンに対応する重み付けされたモデル確率(weighted model probability)との間の差に対応する値を有する。装置は更に、マトリックスの主な固有ベクトルを見つけるように構成された発見ユニットと、前記の主な固有ベクトルに基づいて、何れのキーポイントマッチが最も正しいと考えられるキーポイントマッチであるかを識別するように構成された第2識別ユニットとを含む。
【0038】
本発明の更なる態様では、クエリ画像を受け取り、前記の画像における対応する第1キーポイントを識別するように構成されたキーポイント検出ユニットと、前記の第1キーポイントのローカルのアスペクトを、対応する第1ローカル記述子を通じて記述するように構成された特徴計算ユニットとを含むシステムを提供する。システムは更に、複数の参照画像を記憶する参照データベースを含み、各参照画像に関して、参照データベースは更に、対応する第2キーポイントと、それら第2キーポイントの対応する第2ローカル記述子とを記憶する。システムは更に、少なくとも1グループの参照画像のうちの各参照画像に関して、第1ローカル記述子と前記の参照画像の第2ローカル記述子とを比較するように構成され、それに従って、第1キーポイントと前記の参照画像の第2キーポイントとを関連付けて、対応するキーポイントマッチの組を生成するように構成された特徴マッチングユニットを含む。システムは更に、特徴マッチングユニットにより行われた比較に基づいて参照図のサブセットを選択するように構成された選択ユニットと、クエリ画像とサブセットの参照画像とを含む各ペアに関して、正しいキーポイントマッチの数を計算するように構成された最適化ユニットとを含む。
【0039】
本発明の1つの実施形態に従うと、システムは更に、ビジュアル・サーチ・サーバと、ネットワークを通じてビジュアル・サーチ・サーバとデータを交換するように構成された複数の端末とを含む。
【0040】
本発明の1つの実施形態に従うと、ビジュアル・サーチ・サーバは、キーポイント検出ユニットと、特徴計算ユニットと、参照データベースと、特徴マッチングユニットと、選択ユニットと、最適化ユニットとを含む。
【0041】
本発明の別の実施形態に従うと、ビジュアル・サーチ・サーバは、参照データベースと、特徴マッチングユニットと、選択ユニットと、最適化ユニットとを含み、各端末は、それぞれのキーポイント検出ユニットと、それぞれの特徴計算ユニットとを含む。
【0042】
本発明の更に別の実施形態に従うと、ビジュアル・サーチ・サーバは参照データベースを含み、各端末は、それぞれのキーポイント検出ユニットと、それぞれの特徴計算ユニットと、それぞれの特徴マッチングユニットと、それぞれの選択ユニットと、それぞれの最適化ユニットと、それぞれのローカル・データベースとを含む。各端末は、参照データベースに記憶された、第2キーポイントと、第2キーポイントの対応する第2ローカル記述子とのそれぞれのセットを、ビジュアル・サーチ・サーバから受け取るように構成され、端末のローカル・データベースは、受け取った前記の第2キーポイントと第2ローカル記述子とのセットを記憶するように構成され、前記の記憶された第2キーポイントと第2ローカル記述子とのセットは、少なくとも1グループの参照画像のうちの参照画像に対応する。
【0043】
本発明のこれらおよび他の特徴および利点は、例示であり制限を加えるためのものではない幾つかの実施形態についての以下の説明を、添付の図面と関連させて読むことにより、明らかになる。
【図面の簡単な説明】
【0044】
図1A図1Aは、2つの画像のキーポイントが互いに関連付けされてキーポイントマッチを形成する例を示す。
図1B図1Bは、図1Aの例を示すが、インライアのみが示されている。
図1C図1Cは、図1Aの例に対応するLDRヒストグラムを示す。
図2図2は、本発明の1つの実施形態に従ったアウトライア・モデル関数の形状を示す。
図3A図3A図3Fは、チューリッヒ・ビルディング・イメージ・データベースから取り出した画像のペアから生成されるLDRヒストグラムの幾つかの例を示す。
図3B図3A図3Fは、チューリッヒ・ビルディング・イメージ・データベースから取り出した画像のペアから生成されるLDRヒストグラムの幾つかの例を示す。
図3C図3A図3Fは、チューリッヒ・ビルディング・イメージ・データベースから取り出した画像のペアから生成されるLDRヒストグラムの幾つかの例を示す。
図3D図3A図3Fは、チューリッヒ・ビルディング・イメージ・データベースから取り出した画像のペアから生成されるLDRヒストグラムの幾つかの例を示す。
図3E図3A図3Fは、チューリッヒ・ビルディング・イメージ・データベースから取り出した画像のペアから生成されるLDRヒストグラムの幾つかの例を示す。
図3F図3A図3Fは、チューリッヒ・ビルディング・イメージ・データベースから取り出した画像のペアから生成されるLDRヒストグラムの幾つかの例を示す。
図4図4は、クエリ画像と参照画像とが、同じ平面状オブジェクトを、大きく異なる角度から見て描写している例示的なケースを示す。
図5A図5A図5Bとは、2つの例示的なケースを示すものであり、大きくは異ならない角度から見られているほぼ平面状のオブジェクトが示されている。
図5B図5A図5Bとは、2つの例示的なケースを示すものであり、大きくは異ならない角度から見られているほぼ平面状のオブジェクトが示されている。
図6図6は、本発明の1つの実施形態に従った、インライアの数を推定するためにモデル確率をスケーリングする例を示す。
図7A図7Aは、本発明の1つの実施形態に従った方法の第1段階の主なステップを示すフローチャートである。
図7B図7Bは、本発明の1つの実施形態に従った方法の第2段階の主なステップを示すフローチャートである。
図7C図7Cは、本発明の1つの実施形態に従った方法の第3段階の主なステップを示すフローチャートである。
図8図8は、可能なシナリオを概略的に示すものであり、このシナリオにおいて、本発明の1つの実施形態に従った方法を用いてビジュアル・サーチ・サービスを実現できる。
図9A図9Aは、本発明の1つの実施形態に従ったビジュアル・サーチ・サービスを実現するシステムを示す。
図9B図9Bは、本発明の別の実施形態に従ったビジュアル・サーチ・サービスを実現するシステムを示す。
図9C図9Cは、本発明の更に別の実施形態に従ったビジュアル・サーチ・サービスを実現するシステムを示す。
図10図10は、本発明の1つの実施形態に従った自動的ビデオ・カメラ校正方法の主なステップを示すフローチャートである。
【発明を実施するための形態】
【0045】
既に述べたように、2つの画像の比較は、第1画像のキーポイントと第2画像の対応するキーポイントとのマッチングのために行われる。キーポイントマッチは、2つの画像の対応するキーポイントが、同じオブジェクト(2つの画像の双方に描写)の同じポイントに対応する場合に、正しい(インライアである)と言われ、逆に、キーポイントマッチは、2つのキーポイントが、同じオブジェクトの同じポイントに対応しない場合に、誤り(アウトライアである)と言われる。図1Aに示す例では、各画像は同じオブジェクト(教会)のピクチャであり、それぞれのキーポイントマッチは、それぞれの実線で示されている。図1Aの例示的ケースで示されているキーポイントマッチは、インライアとアウトライアとの双方を含んでいる。同じ例示的ケースにおいてアウトライアを除いたものを、図1Bに示している。
【0046】
以下の説明において、新規な画像比較方法を提示する。ここで提案する方法は、クエリ画像または単にクエリと呼ばれる第1画像上で生成されたキーポイントの組と、参照画像と呼ばれる第2画像上で生成された対応するキーポイントの組とを関連付けて、対応するキーポイントマッチの組を形成するようにしたところから開始するものであり、主段階と2つの後続するオプション段階とを含む。
【0047】
1) 主段階は、キーポイントマッチを生成した後に適用されるものであり、キーポイントマッチを統計的に処理し、それに従って、幾何学的整合性検査を通じて、クエリ画像と参照画像とが同じオブジェクトを描写しているようであるか否かについての評価を行う。より詳細には、誤ったマッチ(アウトライア)の確率的モデルを生成後、適合度テストを行い、参照画像が、クエリ画像に存在するオブジェクトのビューを含んでいるかを決定する。肯定的結果が得られた場合、方法は、参照画像に描写されているオブジェクトと、クエリ画像に描写されているオブジェクトとの間の実際の相似性のランク付けに使用されるスコアを計算することができる。
【0048】
2) 第2段階(オプション)は、キーポイントマッチの全ての組の中で幾つのキーポイントマッチがインライアであるかを評価することを可能にする。この段階は、ビジュアル・サーチ・アプリケーションにおける精度を向上させるように、好都合に行うことができる。
【0049】
3) 第3段階(これもオプション)は、何れのキーポイントマッチがインライアであり、何れのキーポイントマッチがアウトライアであるかを、特定的に識別することを可能にする。このような段階は、拡張現実などのような幾つかの特定のアプリケーションにおいて、好都合に行うことができる。
【0050】
この説明のセクション1では、この方法で用いる特定の統計の特性と、ログ距離比率(log distance ratio)の概念とを紹介するが、これらの双方とも、誤ったマッチおよび正しいマッチと関連する。後続の3つのセクション(セクション2〜4)では、提案される方法の3つの段階の数学的および統計的な面について開示する。セクション5は、方法の3つの段階の主なステップを開示する。最後のセクション(セクション6)は、提案される方法の例示的な応用に関するものである。
【0051】
セクション1 −距離の比率の統計
N個のマッチングされたキーポイントの組を考慮する。
【0052】
(x1,y1),・・・(xi,yi),・・・(xN,yN) (1)
上記の組において、xは、クエリ画像における第iのキーポイントの座標を含み、yは、参照画像におけるマッチングされるキーポイントの座標を含む。ペア(x,y)は、2つのキーポイントが正しくマッチングされている場合、インライアと呼ばれる。逆に、キーポイントが誤ってマッチングされている場合、ペアはアウトライアと呼ばれる。
【0053】
提案される方法は、上記で引用したTsaiその他による論文で提案されているログ距離比率(省略形ではLDR)と呼ばれるものを用いる。
【0054】
【数1】
【0055】
キーポイントは別個である必要があり、従って、下記のような関係である。
≠x,y≠y
また、LDRは、i=jの場合には定義されない。LDRは、長さの比率の関数であり、相似性に関しては不変である。対数演算子が存在しているので、クエリ画像が参照画像と交換される場合(xがyになる場合、またはその逆の場合)、LDRは符号を逆にする。
【0056】
N個のマッチングされたキーポイント(x,y)の組は、クエリ画像上のN個のキーポイントxと参照画像上のN個の対応するキーポイントyとを含むものであり、そのN個のマッチングされたキーポイントの組が与えられた場合、「n=N(N−1)/2」であるn個の別個のログ距離比率が存在する。そのようなログ距離比率の統計的分布は、対応するヒストグラムの形で表すことができ、それをここでは「LDRヒストグラム」という。LDRヒストグラムは、アレイ「h=[h・・・h」により表すことができる。hは、K個の予め定めた間隔T,・・・,Tのそれぞれの間隔内に含まれる観察されたログ距離比率を計数しているときに生じる頻度のアレイであり、以下では、予め定めた間隔をビンと呼ぶ。例えば、ビン(bins、複数のビン)は、下記の例のように、幅が0.2であり、下の値が−2.5であり、上の値が2.5である25の間隔とすることができる。
【0057】
T1=[-2.5,-2.3>, T2=[-2.3,-2.1>, ・・・ T25=[2.3,2.5]
図1Aの場合のLDRヒストグラムの例は、図1Cに示している。
【0058】
LDRの主な利点は、インライアのペアとアウトライアのペアとに対して異なる挙動を示すことである。多くの画像変換(インライアの挙動を決定する)に関して、LDRは、間隔に限定される。アウトライアに関しては、LDRは、そのような間隔の外へ延び、また、適合度検定に使用できる特有の確率密度関数を有する。
【0059】
LDRは、2つの総称的なキーポイント・ペア、即ち、(x,y)と(x,y)の関数である。3つの状態が発生し得るが、それらは、双方のペアがアウトライアである状態と、双方がインライアである状態と、一方のペアがインライアであり他方のペアがアウトライアである状態とである。
【0060】
1.1 双方のペアがアウトライアのときのLDR
マッチングプロセスは、画像中のシーンの幾何図形的配列の何れの知識によっても制限されない。なぜなら、そのような知識は、マッチングが行われる前には使用できないからである。たとえ2つの画像が同じオブジェクトを示す場合でも、誤ったマッチを妨げる機構はない。2つの画像が、同じまたは非常に似たオブジェクトを示さない場合、何れのマッチングも誤りであると考えられる。
【0061】
たとえマッチングプロセスが決定性(deterministic、静的)であるとしても、誤ってマッチングされたキーポイントの位置は予測できない。一般に、アウトライアの幾何学パターンを発見するのは不可能であり、そのようなパターンを導き出せる優れた原理はない。従って、誤ったマッチングはランダム・プロセスとして考慮され、アウトライアの挙動は、アウトライア・モデル関数と呼ばれる適切な密度関数を通じてモデル化される。
【0062】
「アウトライア・モデル関数の定義」。AおよびBが矩形であるとする。x,x∈Aおよびy,y∈Bが、ランダムに描かれたポイントであり、確率変数(random variable)X,XおよびY,Yに対応するものとする。ランダムな変数CをLDRとする。
【0063】
C=ldr(X,X,Y,Y
アウトライア・モデル関数は、Cに対する確率密度関数fc(c)である。
【0064】
アウトライア・モデル関数は、正規(normal)と一様(uniform)との2つのタイプのキーポイント分布に関して表すことができる。
【0065】
「正規に分布されたキーポイント座標」。キーポイントが正規に分布しているという仮定は、アウトライア・モデル関数の定式化を簡単なものとし、これは実際のケースに対しての良い近似である。
【0066】
クエリ画像のキーポイントは独立同分布(independent and identically distributed)(i.i.d.)であると想定され、平均μおよび分散(1/2)Iを有し、正規に分布する確率変数Xとして挙動する。
【0067】
【数2】
【0068】
座標は適切にスケーリングされ、それにより、キーポイントは画像全体に分布していると仮定される(分散は、水平方向および垂直方向において同じであることに留意されたい)。従って、2つのキーポイントの間の差は正規分布となる。
【0069】
−X〜 N(0,I); i≠j (4)
参照画像のキーポイント{Y}が{X}と同じ統計を有し、キーポイントXがキーポイントYとマッチングされると想定する。その場合、平方の距離比率(squared distance ratio)は、(2,2)の自由度のF分布を有する。
【0070】
【数3】
【0071】
これは、例えば、Prentice-Hallの出版のR.J.LarsenおよびM.L.Marxによる「An introduction to Mathematical Statistics and its Applications(数学的統計およびその応用の概論)」1896年、第2版の第338ページに示されている。
【0072】
確率密度関数F(2,2)は下記のとおりである。
【0073】
【数4】
【0074】
上記の式では、簡素化のために、式(5)の確率変数「Rij」をSに置き換えている。ログ距離比率(平方の距離比率ではない)が考慮されているので、平方根および対数が確率変数「S=Rij」に適用される。更に、2つの画像のサイズの違いや2つの画像におけるキーポイントの広がりの違いを考慮に入れるために、関数は、2つの画像におけるキーポイントの標準偏差のプロポーション(proportion)に対応するパラメータa、即ち、以下の式に示すパラメータaを確率変数に乗算することにより、そのようなケースに対しての拡張が行われる。
【0075】
【数5】
【0076】
F(2,2)のp.f.d.に対するこれらの変更により、下記のアウトライア・モデル関数が導き出される。
【0077】
「アウトライア・モデル関数」。2つの画像がランダムなキーポイント{X}および{Y}を有するものとし、それら全てが二変量正規分布を有し、第1画像において分散σ、第2画像において分散σを有するものとする。aを分散のプロポーションとする。
【0078】
【数6】
【0079】
出願人は、ログ距離比率が確率密度関数を有すると判断した。
【0080】
【数7】
【0081】
式7のアウトライア・モデル関数は、提案する方法の基礎である。アウトライア・モデル関数の形は、図2に示されている。このアウトライア・モデル関数が矩形画像のアスペクト比を考慮しないことに、留意すべきである。なぜなら、水平の分散と垂直の分散とが同じと想定されているからである。
【0082】
図3A図3Fは幾つかの例を示し、それぞれが、チューリッヒ・ビルディング・イメージ・データベース(Zurich Building Image Database)(1005の画像を含み、201のビルディングのそれぞれについての5つのビューを含む)からの画像の個々のペア(クエリ画像−参照画像)を示す。キーポイントは円で示し、ラインは、別の画像におけるマッチングされるキーポイントの位置を指す。それぞれの画像ペアに関して、LDRヒストグラムと、式7の定式化での、対応するアウトライア・モデル関数とが示されている。これらの画像は異なるビルディングを示すので、全てのキーポイントマッチをアウトライアと考える必要があることに、留意されたい。これらの例から、アウトライア・モデル関数は、全てのマッチがアウトライアであるときには常にLDRヒストグラムにかなり近いものとなる、ということを観察することができる。
【0083】
1.2 双方のペアがインライアのときのLDR
一般に、全てのキーポイントマッチがインライアである場合のLDRヒストグラムは、アウトライアに対するLDRヒストグラムと大きく異なることが多い。多数の実際的なケースにおいて、インライアのみに対してのLDRヒストグラムは、アウトライアのみに対してのLDRヒストグラムよりも狭い。即ち、インライアのみに対してのLDRヒストグラムは、アウトライアのLDRヒストグラムがゼロではない幾つかのビン(特に、横方向のビン)にわたって、ゼロとなる。
【0084】
2つの画像における関連付けされたキーポイントxおよびyは、見られているオブジェクト上の同じポイントのマッピングを通じて関連するので、確率的モデリングを用いる代わりに、LDRヒストグラムの上界および下界を考慮することが好都合である。
【0085】
ここで行われた研究は、3Dシーンにおける平面上のポイントに限定される。なぜなら、深さの変化が限定されたオブジェクトを認識することを、主に考えているからである。平面は、ビルディングや本や看板などのような、画像内の多くの対象となるオブジェクトの可視部分を近似したものとして表す。
【0086】
平面上の部分にある2つの画像は、ホモグラフィ(homography)Hを通じて関連する。
【0087】
【数8】
【0088】
y=h/d (9)
上記の式において、xおよびyは2つの画像における同じ点の投射の座標である。従って、同じ平面上のインライアのペアは、同じホモグラフィを通じて関連する。アファイン変換および一般的ホモグラフィに対してのLDRヒストグラムの特徴を、ここで開示する。
【0089】
「アファイン変換」。アファイン変換は、下記のようなホモグラフィの特別のケースである。
【0090】
【数9】
【0091】
上記の式に関して、「y=Kx+t」である。
【0092】
距離比率は、「2×2マトリックスK」の特異値(singular value)により与えられる間隔に制限される。
【0093】
【数10】
【0094】
この場合、LDRは下記の間隔にある。
【0095】
ldr(xi,xj,yi,yj)∈[-lnσmax,-lnσmin] (10)
従って、LDRヒストグラムの非ゼロ部分の幅は、アファイン変換がオブジェクトを変形させる度合いに応じたものとなる。相似変換(similarity transformation)に関しては、2つの特異値は等しく、従って、LDRヒストグラムは、ゼロではないビンを1つのみ有する。アファイン変換により、長さが、最小限度として1/3まで縮められ、最大限度として2倍まで伸ばされる場合、2つの特異値は1/3と2とであり、LDRの非ゼロ値に対する間隔は下記のようになる。
【0096】
【数11】
【0097】
「ホモグラフィ」。x、xとy、yとが、式8および式9のように、下記のホモグラフィを通じて関連するものとする。
【0098】
【数12】
【0099】
この場合、LDRも下記の間隔に制限される。
【0100】
ldr(xi,xj,yi,yj)∈[-lnb,-lna] (11)
上記の式においてaは最大数であり、bは最小であり、下記のような関係である。
【0101】
【数13】
【0102】
ホモグラフィの最も実際的なケースでは、この間隔は、アウトライアに対するLDRのヒストグラムに関しては、用いられる機構の性質に大きく影響されるので、狭いものとなる。SIFT(Scale−Invariant Feature Transform)やSURF(Speeded Up Robust Fetures)のような機構は、相似変換に対しては不変であるが、アファイン変換に対してはそうではなく、特にホモグラフィに対してはそうではない。これは、遠近法的な歪みが強くて[-lnb,-lna]が理論的に広くなり得る場合に、極端なLDR値を生成し得るキーポイントは関連付けされないことを意味する。なぜなら、それらのキーポイントの特徴は、異なる記述子を有するからである。従って、正しく関連付けされたキーポイントに関するインライアのヒストグラムは、相対的に狭い間隔に留まることになるであろう。
【0103】
図4は、クエリ画像と参照画像とが、大きく異なる角度(この例では−75度と0度)から見た同じ平面オブジェクト(矩形)を描写する例示的ケースを示す。図4の下部の図は、前記の画像ペアから計算されたアウトライア・モデル関数とLDRヒストグラムとを示す。
【0104】
図5Aおよび図5Bは、大きくは異ならない角度から見られているほぼ平面状のオブジェクト(ビルディングの面)が示された2つの例示的ケースを示す。図5Aおよび図5Bの下部の図は、対応するLDRヒストグラムとアウトライア・モデル関数とを示す。
【0105】
1.3 双方のタイプのペアのときのLDR
第3の代替例は、ペアx、yがインライアであり、ペアx、yがアウトライアである場合(または、その逆の場合)のためのものである。この場合も、1つの画像のキーポイントがランダムに分布していると仮定する。なぜなら、未知の画像に含まれるキーポイントの位置を制限する幾何学的なパターンや規則を前もって知ることができないからである。
【0106】
従って、それぞれのキーポイントは、式3のように、例えば、正規分布を用いて、確率変数により表すことができる。2つのキーポイントの間の差ベクトルは、式4における場合のようにモデル化される。なぜなら、1つはインライアとして取られ、別の1つはアウトライアとしてとられ、それらの間には相関が無いからである。
【0107】
しかし、式5のF分布は正確に維持できない。なぜなら、F分布の仮定とは異なって、分子と分母とは独立していないからである。インライアとアウトライアとのペアの場合のキーポイントは下記のようである。
【0108】
(xi,yi),(xj,π(xj))
上記の式において、πは、1つの画像のインライアのキーポイントの、別の画像へのマッピングである(未知であるにもかかわらず)。この場合における平方の距離比率を表す確率変数は下記のとおりである。
【0109】
【数14】
【0110】
上記の式において、分子と分母とは明らかに独立していない。なぜなら、双方ともXjの関数だからである。式13における変数の確率密度を見つけるのは非常に難しいが、ここで提案される方法を考慮するかぎり、見つける必要はないであろう。同じモデル確率、従って、式7のアウトライア・モデル関数を用いて、これら2つのケース(インライア/アウトライア・ペアではなく双方がインライアのペア)に対してのLDRのヒストグラムを、僅かな誤差はあるがモデル化することが可能であることを、経験により仮定することができる。
【0111】
セクション2 − マッチングされない画像の拒絶(提案される方法の第1段階)
LDRヒストグラムは、画像(クエリ画像)において見ることができるオブジェクトを識別するために用いることができる。従って、「識別(identification)」は、クエリ画像に描写されているオブジェクトのビューを含む参照画像を、参照コレクション(参照データベース)の参照画像の中から見つけることを意味する。提案される方法の第1段階は、クエリ画像と参照画像との間でのインライアのキーポイント・ペアを明確に検出することを必要とせずに、オブジェクトを識別することを可能にする。
【0112】
提案される方法の第1段階は幾何学的整合性テストであり、これは、以下の仮定
:参照画像はクエリに対応しない、
:参照画像はクエリに対応する
の間での二者択一を行うためのものである。
【0113】
の仮定は、物事の予期される状態を表すものであり、ほぼ全ての参照画像に、クエリにおけるオブジェクトのビューが含まれていないことが知られている。Hを拒絶してHを受け入れるには(これは例外的イベントである)、或る程度の根拠が必要である。この根拠は、LDRヒストグラムとアウトライア・モデル関数との間の関係において見つけられる。そのヒストグラムがアウトライア・モデル関数に良く適合する場合、Hを受け入れ、そうでない場合はHの仮定を受け入れる。
【0114】
そのような仮定をテストするために、提案される方法では、ピアソンのカイ2乗検定を行う(例えば、上記で引用したR.J.Larsenその他による文献の第402〜403ページを参照)。
【0115】
ピアソンの検定を適用する前に、「離散化アウトライア・モデル関数(discretized outlier model function)」の概念を紹介する。
【0116】
ビン、即ち、LDRヒストグラムを構成するために用いられるLDR値の間隔を、「k=1,・・・,K」であるTkで表すものとする。離散化アウトライア・モデル関数は、確率値をK個のビンのそれぞれに割り当てる。
【0117】
p:{1,・・・,K}→[0,1]
第kのビンのそれぞれにおいて、値は、そのビンにわたってのアウトライア・モデル関数を積分したものと等しい。
【0118】
【数15】
【0119】
上記の式において、それぞれの値p(k)は、「モデル確率」と呼ばれる。表記を統一するために、モデル確率を、シーケンスpのエレメントとして考慮する。
=p(k); k=1,・・・,K
ピアソンのカイ2乗検定は、LDRヒストグラムと離散化アウトライア・モデル関数との間で行われる。
【0120】
「ピアソンの検定」。αレベルの重要度(significance)において、Hの仮定は、下記の場合に受け入れられる。
【0121】
【数16】
【0122】
上記の式において、「n=N(N−1)/2」であるnは、LDRヒストグラムを構築するために用いた観測結果の合計数、即ち、キーポイントマッチ(x,y)、(x,y)のペアの数である。スレッショルド「χ1−α,K−1」は、K−1の自由度でのカイ2乗検定の100(1−α)パーセンタイルである。
【0123】
の仮定を受け入れるということは、参照画像が、クエリ画像内のオブジェクトを表す候補であることを意味する。スレッショルドを超えるマージンは、2つの画像の類似度の測定値として使用することができる。
【0124】
【数17】
【0125】
式15を参照されたい。最大のρを有する参照画像(のインデックス)を、クエリ画像内のオブジェクトと同一のもの(identity)として選択することができる。
【0126】
1つより多くの参照画像が大きいρを有する場合、クエリ画像が、前記の参照画像の全てに存在する幾つかのオブジェクトを示すか、または、前記の参照画像が、非常に似たオブジェクトを描写するかの何れかである。この問題は、参照コレクションの知識を通じてや、手近な識別タスクを通じて、特定の解法を見つけることができる。
【0127】
αパラメータは、確率密度としてアウトライア・モデル関数をもつソースからLDRヒストグラムを実際に生じさせた場合において、誤った参照画像を受け入れる確率である。
【0128】
セクション3 − インライアの数の推定(提案される方法の第2段階)
関連付けされたキーポイントマッチの組において存在するインライアの数を知ることは、興味のあることである場合が多い。そのような数は、それ自体が有用であり得、また、セクション4で説明するように、アウトライアとインライアとを分離するために必要であり得る。
【0129】
この数は、LDRヒストグラムを用いて推定することができる。キーポイントマッチは2つの互いに素のカテゴリに分類されるので、ヒストグラムは、それぞれのカテゴリに対して1つのヒストグラム・コンポーネント(histogram component)と呼ばれる2つの項により形成される。インライアに対するヒストグラムとアウトライアに対するヒストグラムとは全く異なり、実際、その差異は、2つのコンポーネントを分離するためおよびそれらの相対的重みを表すために、有用である。
【0130】
先に説明したように、キーポイントマッチがアウトライアである場合、ヒストグラムはアウトライア・モデル関数のように見える。更には、ヒストグラムがアウトライア・モデル関数と似ている場合、ペアはアウトライアである。より一般的には、ヒストグラムを2つの項に分解でき、その1つの項がアウトライア・モデル関数のように見える場合、その項はアウトライアに起因するものである。この原理は、アウトライアの数を推測するため、更には、アウトライアを識別するために使用される。
【0131】
(x,y)と(x,y)との双方が正しく関連付けされている場合、キーポイントマッチのペアはインライアである。キーポイントマッチの一方または双方が誤って関連付けされている場合、キーポイントマッチのペアはアウトライアである。Pinは、キーポイントマッチのペアがインライアのみを含む確率を示し、Poutは、ペアのエレメントのうちの少なくとも1つがアウトライアである確率を示す。zを、キーポイントマッチのペアに対するLDRの値とし、p(z|in)およびp(z|out)は、条件付き確率密度(conditional probability density)を表すものとする。アウトライアに対する条件付き確率は、式7のアウトライア・モデル関数となると仮定される。
【0132】
p(z|out)=f(z)
従って、全体の確率密度は下記の形を有する。
【0133】
(z)=Pin・p(z|in)+Pout・f(z) (17)
この式は、LDRヒストグラムを2つの項に分解したもの対応する。
【0134】
=d+g; k=1,・・・,K (18)
上記の式において、hはLDRヒストグラムを表し、dはインライアに起因するコンポーネントであり、gはアウトライアに起因するコンポーネントである。インライアの数を推定する方法は、アウトライア・コンポーネントgは予測される値に近いものである、という仮定に基づくものであり、以下の式が導きだされる。
【0135】
=d+E(g)=d+n・Pout (19)
上記の式において、モデル確率pは、第kのビンの間隔にわたってのアウトライア・モデル関数の積分であり、「n=N(N−1)/2」であるnは、LDRヒストグラムを構築するために用いたキーポイントマッチのペアの数である。式19には2つの未知の数量があり、それらはアウトライア確率Poutと、インライア・コンポーネントdとである。インライア・コンポーネントは負ではない必要があるので、式19は下記のように書き換えることができる。
【0136】
−n・Pout ≧0 (20)
上記のようにすると、式からインライア・コンポーネントが除かれる。ここでは、セクション1で説明したように、幾つかの間隔にわたってインライア・コンポーネントがゼロであると仮定しているので、それらの間隔にわたって、アウトライア・コンポーネントはヒストグラムの値と等しくなければならない。これは、式20における差が、インデックスkの幾つかのビンに関して下界0へ到達するように、アウトライア確率Poutが十分に大きいものであるべきことを、意味する。従って、予め定めた値の小さい組においてアウトライア確率の可能な最大値を見つけるためのサーチが行われる。
【0137】
「アウトライア確率のサーチ」。k=1,・・・,Kであるhが、LDRヒストグラムのビンを表すものとする。pがモデル確率を表し、nがヒストグラムの構築に使用されるキーポイントマッチのペアの数を表すものとする。「B={β,・・・,β}⊂[0,1]」を、Poutの予め定めた適格な値の組とする。出願人は、キーポイントマッチのペアが少なくとも1つのアウトライアを含む確率の推定が、下記のようであると判断した。
【0138】
out=max{β:β∈B,h≧nβp;k=1,・・・,K} (21)
確率「1−Pout」は、全てのキーポイントマッチのペア(x,y)、(x,y)の中でのインライアの相対的な関数である。インライアのペア(x,y)の数を求めるためには、キーポイント・ペアの数Nと、キーポイントマッチのペアの数「n=N(N−1)/2」とが考慮されねばならない。なぜなら、ヒストグラムは全てのペア(x,y)、(x,y)を計数することにより作られるからである。なお、ここではi≦jである。インライアのペアの数がmで表される場合、インライアからなるキーポイント・ペアの一対(keypoint pair couples)の端数(fraction)は下記のようになる。
【0139】
【数18】
【0140】
分布についての推定および仮定に基づくと、式22の精度は低いものである。従って、mについての仮定の解が好ましい。
【0141】
従って、推定されるインライアのキーポイント・ペアの数は下記のようになる。
【0142】
【数19】
【0143】
図6は、モデル確率をスケーリングしてインライアの数を推定する例を示す。この例では、同じオブジェクト(家)が2つの画像に描写されている。下部の図は、LDRヒストグラムh(実線でプロット)と、推定されたアウトライアのヒストグラム(破線でプロット)とを示す。この場合、インライアの数は、キーポイントの総数の1/3であると推定された。
【0144】
セクション4 − 最もインライアでありそうなものの識別(提案される方法の第3段階)
先のステップが完了した後、インライアのヒストグラム・コンポーネントを決定するための全ての必要な数量が使用可能とされる(式19を参照されたい)。
【0145】
=h−n・Pout
このコンポーネントは、このセクションで示すように、インライアとアウトライアとを分離するために使用できる。
【0146】
キーポイントマッチの各ペアはログ距離比率の値に対応し、インライアのヒストグラム・コンポーネントは、その対がインライアを含む確率を表す。この情報は、パラメータとしてキーポイントのそれぞれのペアに対するバイナリ値をもつ尤度関数(likelihood function)を定式化するために使用される。1という値は、ペアがインライアであることを意味し、0はペアがアウトライアであることを意味する。インライアの所与の数を制約として用いる場合、この尤度関数を最大化するパラメータは、最もインライアでありそうなものの組を示す。
【0147】
Nをキーポイントマッチの数とし、uをNエレメントのバイナリ・ベクトルとする。
【0148】
u∈{0,1} (24)
値1を持つエレメントは、対応するキーポイント・ペアがインライアであることを示し、値0を持つものはアウトライアであることを示す。前のセクションにおける手順のような手順は、インライアの数mの推定を行うので(式22)、制約を加えることができる。
【0149】
【数20】
【0150】
式2のLDRは、キーポイントマッチの各ペアについて知られている。
【0151】
ij=ldr(x,x,y,y);i≠j (26)
理想的には、インライアに対しての条件付き確率密度を知っている場合、単に、インライアに対する全ての確率を加算することにより、尤度の値を、インライアの組の何れの仮定へも割り当てることができる。
【0152】
【数21】
【0153】
uはバイナリであるので、この合計を下記のように書き換えることができる。
【0154】
【数22】
【0155】
式23および式24の制約の下で式27のLを最大化するバイナリ・ベクトルuは、最もインライアでありそうなm個のインライアの組を表す。
【0156】
式27は、実際的なアルゴリズムを作るために変更する必要がある。インライアの確率密度p(z|in)についての閉じた形(closed form)が無い場合、それは式19のインライアのヒストグラム・コンポーネントdと置換される。この推移を理解するために、下記の量子化手段(quantizer)qを紹介するのが有益である。
【0157】
【数23】
【0158】
この量子化手段qは、値zに最も近いビン・センター(全てのビン・センターξ,・・・,ξの中でのビン・センター(bin center))に対するインデックスを生成する。これは下記の近似を可能とする。
【0159】
【数24】
【0160】
下記の式は、この確率の近似値がLDRヒストグラムのインライア・コンポーネントに対して予測される値に比例することを示す。
【0161】
【数25】
【0162】
上記の式において、比例定数は、キーポイントマッチのペアの総数であるnと、一対における双方のペアがインライアである確率であるPinと、ビンの幅であるδとである。
【0163】
ここで、式27における理想的な尤度関数を下記のものと置き換えることができる。
【0164】
【数26】
【0165】
上記の式において、式31の定数ファクタは、G(u)を最大化する解を動かさないので、省略されている。
【0166】
マトリックスの形では、上記の式は下記のようになる。
【0167】
G(u)=uDu (33)
上記の式において、マトリックスDは、エレメントi,jとして下記のものを有するインライアのヒストグラムからの値を含む。
【0168】
【数27】
【0169】
ここで、インライアの識別の問題を以下のように表すことができる。
【0170】
【数28】
【0171】
マトリックスDが全ランクを有する場合、最適のものを計算するのは難しい。近似の解法への道筋は、IEEE Transactions on Image Processing、vol 19、2010年5月の第1319〜1326ページのA.Egozi、Y.Keller、およびH.Gutermanによる「Improving shape retrieval by spectral matching and met similarity(スペクトルマッチングおよび満たされた相似性による形状検索の改善)」に提供されており、ここでも、式33に関するものと同様の問題に直面している。ここで、バイナリの最適化は簡単なものに置き換えられる。
【0172】
Dw を最大化する (36)
w∈R,||w||=1 を条件とする。
【0173】
解は、Dの主な固有ベクトル(dominant eigenvector)(最大の固有値に対応する固有ベクトル)である。このベクトルのエレメントは、ゼロに近い場合または最大値に近い場合が多い(符号は選択されているので、最大値は正である)。従って、固有ベクトルwは、下記の関係に従って、m個の最大のエレメント(mは、式22のインライアの推定された数)を取ることにより、バイナリ・ベクトルuを得るために使用される。
【0174】
[w,i]=sort(w,’descend’) (37)
【0175】
【数29】
【0176】
上記の式において、「sort(w,’descend’)」(ソート(w,’降順’))は、Matlab(MathWorksによるもの)の関数であり、これは、アレイwのエレメントを降順にソートして、対応する順序付けられたアレイwを生成する。関数「sort(w,’descend’)」は、更なるアレイiを生成し、そのエレメントは、アレイwのエレメントのインデックスであり、アレイwの場合と同様に、順序付けられている。
【0177】
結果uは、インライアの組に良く近似したものであり、それは実際的な実験において証明できる。
【0178】
「高速固有ベクトル計算(fast eigenvector computation)」。推定したインライアは、Dの主な固有ベクトルのm個の最大エレメントに対応する。目的は、固有ベクトルの計算を、可能な限り、また幾らかは精度を犠牲にしてでも、高速に維持することである。主な固有ベクトルを見つける方法は当技術分野では知られている(例えば、The Society for Industrial and Applied Mathematics、1997年の、L.TredethenおよびD.Bauによる「Numerical Linear Algebra(数値的線形数学)」に開示されているパワー反復およびレイリー商反復(the power iteration and the Rayleigh quotient iteration)を参照)。
【0179】
双方の方法とも、反復法であり、主な固有ベクトルの最初の推測に依存するものであり、にわか仕立ての候補は中間コラム(mean column)であり、これは、Dのような負ではないエントリのマトリックスに対して近くなる。
【0180】
セクション5 − 方法の主なステップ
先に説明した方法の主なステップを図7Aないし図7Cに示す。
【0181】
より詳細には、図7Aは、本発明の1つの実施形態に従った方法の第1段階の主なステップを示すフローチャートである。既に説明したように、方法の第1段階は、第1画像と第2画像とが同じオブジェクトを描写しているか否かを評価するものである。
【0182】
画像のペアが比較されるところから、即ち、第1画像(クエリ画像)がN個のキーポイントxを含み、第2画像(参照画像)がN個のキーポイントyを含むところから開始するものと仮定している。クエリ画像上の各キーポイントxは、参照画像上の対応するキーポイントyと関連付けされて、個々のキーポイントマッチ(x,y)を定める。
【0183】
第1ステップは、相似性に関して不変である距離比率の関数を用いて、キーポイントマッチ(x,y)から距離比率のヒストグラムを生成する。例えば、式2を用いてキーポイントマッチ(x,y)からログ距離比率(LDR)ヒストグラムが生成される(ブロック702)。
【0184】
次に、式2で定義されたログ距離比率(LDR)関数を用いる場合には、第1ステップで使用される距離比率の関数と関連する確率密度関数、例えば、式7を用いて、対応するアウトライア・モデル関数が生成される(ブロック704)。
【0185】
次のステップは、以前に計算したアウトライア・モデル関数の離散化(discretize)を行うが(ブロック706)、このステップでは、例えば、式14を、以前に計算したアウトライア・モデル関数に適用して、その離散化版を得る。
【0186】
次に、ピアソンの検定(式15)を用いて、LDRヒストグラムを、離散化アウトライア・モデル関数と比較し、全てのキーポイントマッチがランダムであると考えられるか否かの評価を行う(ブロック708)。
【0187】
特に、ピアソンの検定の結果が、離散化アウトライア・モデル関数とのLDRヒストグラムの良好な適合を伴う場合(ブロック710の出口側分岐Y)、それは、キーポイントマッチの全てまたはほぼ全てがアウトライアであることを意味し、従って、参照画像は、クエリ画像に描写されている何れのオブジェクトも示さない。従って、方法は終了する。
【0188】
逆に、ピアソンの検定の結果が、LDRヒストグラムが離散化アウトライア・モデル関数と適合しないことを示す場合(ブロック710の出口側分岐N)、それは、キーポイントマッチの多くがインライアであり得ることを意味し、従って、参照画像は、おそらく、クエリ画像に描写されているオブジェクトを示す。このケースにおいて、望まれる場合には、方法は第2段階へ進む。
【0189】
図7Bは、本発明の1つの実施形態に従った方法の第2段階の主なステップを示すフローチャートである。この段階は、先に説明した「アウトライア確率のサーチ」に基づいて、キーポイントマッチの組のうちの何個のキーポイントマッチがインライアであるかを評価することを可能にする。
【0190】
第1ステップでは、式21のファクタβを初期化する(ブロック712)。例えば、βをゼロに初期化する。
【0191】
ファクタβは、離散化アウトライア・モデル関数を重み付けするために使用され、LDRヒストグラムと比較されるようにする。このステップの目的は、式21を通じてキーポイントマッチの所与の一対が少なくとも1つのアウトライアを含む確率を推定することである。より特定時には、各kに対してnβpが計算され(ブロック714)、項βが、以前にとった値へ所定数量を加算することにより更新されると(ブロック716)、以前に計算したnβpと対応するh(各kについて)との間での比較が行われる。
【0192】
各kについて、hが、以前に計算したnβpよりも高いという結果となった場合(ブロック718の出口側分岐Y)、重み付けされた離散化アウトライア・モデル関数がLDRヒストグラムよりも低いことを意味し、βの更新された値を用いてnβpの新たな計算が行われる(ブロック714へ戻る)。
【0193】
上記のようではなく、nβpが、少なくとも1つのkに関して、hへ到達した場合(ブロック718の出口側分岐N)、これは、重み付けされた離散化アウトライア・モデル関数の一部(特定的には、その横方向のテール)が、LDRヒストグラムの対応する部分に到達したまたはそれらを超越したことを意味する。従って、式21に従い、キーポイントマッチのペアが少なくとも1つのアウトライアを含む確率Poutは、βがとる最新の値と等しいと考えられる(ブロック720)。従って、キーポイントマッチのペアが少なくとも1つのインライアを含む推定される確率Pinは、「1−Pout」と等しく設定される(ブロック722)。
【0194】
次に、インライアの数mは、式23を用いて計算される(ブロック724)。
【0195】
この時点で、望まれる場合には、方法は第3段階へ進む。
【0196】
図7Cは、本発明の1つの実施形態に従った方法の第3段階の主なステップを示すフローチャートである。この段階は、何れのキーポイントマッチがインライアであるかと、何れのキーポイントマッチがアウトライアであるかを特定的に識別することを可能にするものであり、36の最大化の問題を解く。
【0197】
第1ステップでは、34の関係において示されるインライア・マトリックスDを構築する(ブロック726)。
【0198】
次に、最大化の問題36は、インライア・マトリックスDの主な固有ベクトルwを見つけるように解かれる(ブロック728)。
【0199】
最後に、インライアの組の近似値を、関係37および38における以前に見つけた固有ベクトルwを用いて、計算する(ブロック730)。
【0200】
このセクションで説明される方法のステップは、適切な処理ユニットにより行うことができ、それらの構造および機能は、それらに対して定められた特定の応用分野に応じたものとなる。例えば、それぞれの処理ユニットは、方法の1以上のステップを行うように特別に設計されたハードウェア・ユニットとすることができる。更には、方法のステップは、プログラマブルの機械(例えば、コンピュータ)により、対応する1組の命令による制御の下で、行うことができる。
【0201】
セクション6 − 方法の幾つかの例示的な応用
図8は、考えられ得るシナリオを概略的に示すものであり、本発明の1つの実施形態に従って、先に説明した方法を用いて、ビジュアル・サーチ・サービスを実施することができる。参照符号800で示される図8のシナリオは、クライアント−サーバ構成に従って構築されるものであり、ビジュアル・サーチ・サーバ810は、複数の端末820と、外部ネットワーク830を通じてデータを交換するために、対話するように構成される。外部ネットワーク830は、MAN、WAN、VPN、インターネット、電話網などである。各端末820は、パーソナル・コンピュータ、ノートブック、ラップトップ、パーソナル・デジタル・アシスタント、スマートフォン、またはデジタル画像を管理できる任意の電子デバイスとすることができる。
【0202】
図9Aに示す本発明の1つの実施形態に従うと、ビジュアル・サーチ・サービスの全ての主な動作は、ビジュアル・サーチ・サーバ810により行われる。
【0203】
ピクチャに描写されているオブジェクトと関連する情報を要求する端末820のユーザは、そのピクチャ(クエリ画像となる)を、ネットワーク830を通じてビジュアル・サーチ・サーバ810へ送信する。
【0204】
ビジュアル・サーチ・サーバ810は、端末820との間でのデータの送信/受信のためにネットワーク830と対話するためのサーバ・インターフェース902を含む。サーバ・インターフェース902を通じて、ビジュアル・サーチ・サーバ810は、分析対象となるクエリ画像を受信する。
【0205】
クエリ画像は、そのクエリ画像に含まれるキーポイントを識別するように構成されたキーポイント検出ユニット904へ供給される。
【0206】
キーポイントが生成されると、そのローカルのアスペクト(aspect)が特徴計算ユニット(feature computation unit)906により記述される。この動作は、特徴計算ユニット906により、SIFT(Scale−Invariant Feature Transform)やSURF(Speeded Up Robust Fetures)などのような既知のローカル記述子を用いて、行われる。
【0207】
ビジュアル・サーチ・サーバ810は更に特徴マッチングユニット(feature matching unit)908を含み、特徴マッチングユニット908は、画像認識に使用される参照画像を記憶する参照データベース910と結合される。クエリ画像から抽出されたローカル記述子と、参照データベースに記憶された参照画像のローカル記述子との比較は、特徴マッチングユニット908により、例えば、記述子間のユークリッド距離に基づく技術のような、既知の画像特徴比較技術を用いて、行われる。参照データベースのそれぞれの参照画像について、特徴マッチングユニット908は、対応するキーポイントマッチの組を含む、対応するリストを出力する。このリストは、クエリ画像に描写されたオブジェクトが何れの参照画像に描写された何れのオブジェクトにも対応しない場合、空であり得る。
【0208】
特徴マッチングユニット908により生成されたリストに基づいて、選択ユニット912は、最高数のキーポイントマッチをクエリ画像と共有する第1のq個の参照画像を選択する。これらの参照画像は、クエリ画像に描写されたオブジェクトを含む最適の候補であると想定されている。
【0209】
本発明の1つの実施形態に従うと、ビジュアル・サーチ・サーバ810は更に、先に説明した方法を実施するように構成される最適化ユニット914を含む。最適化ユニット914は、前記の方法を、選択ユニット912により選択されたq参照画像の組に対応するキーポイントマッチに適用する。クエリ画像と組の中の1つの参照画像とで構成される各ペアに関して、最適化ユニット914は、正しいキーポイントマッチ(インライア)の数を計算する。この計算は、方法の第1段階に従って行われ、好適には、方法の最初の2つの段階(即ち、図7A図7Bとに示されたもの)に従って行われる。図7Cに示される方法の第3段階も行われる場合(例えば、クエリ画像に描写されているオブジェクトが参照画像に配されているかを示す指示を得ることが望まれる場合)、最適化ユニット914は、何れのキーポイントマッチがインライアと考えられるかを、特定的に識別することができる。クエリ画像の対応するキーポイントと正しくマッチングされたキーポイントを十分な数だけ含む、という結果が得られた組の中の参照画像は、少なくとも、クエリ画像に描写されたオブジェクトと同じオブジェクト(同じオブジェクトの一部)を含むものと考えられる。後者の参照画像は、次に、ビジュアル・サーチに要求の結果として、ネットワーク830を通じて端末へ送られるが、その場合において、数えられたインライアの数に基づいて順序付けすることができる。
【0210】
図9Bに示す本発明の別の実施形態に従うと、キーポイント検出ユニット904と特徴計算ユニット906とは、ビジュアル・サーチ・サーバ810に含まれるのではなく、端末820に含まれる。この場合、クエリ画像をビジュアル・サーチ・サーバ810へ送信するのではなく、それぞれの端末820は、クエリ画像からローカルで生成したローカル記述子を直接に送信することができる。
【0211】
先の実施形態と比較して、この解決法は、送信する必要のあるデータ(クエリ画像全体ではなくローカル記述子)の量が少ない。更に、この実施形態に従うと、ビジュアル・サーチ・サーバ810の計算負荷が低減され、ビジュアル・サーチ・サーバ810が、より多くの画像サーチの要求を同時に管理できるようになる。
【0212】
図9Cに示す本発明の更に別の実施形態に従うと、ビジュアル・サーチ・サービスの主な動作のほぼ全てが端末820により行われ、ビジュアル・サーチ・サーバ810は、単に、参照画像のキーポイントとローカル記述子とを記憶し、それらのものの選択されたサブセットを、端末のユーザから要求された特定のビジュアル・サーチに基づいて端末へ送信する。例えば、端末820が、GPSシステムを装備したスマートフォンであり、クエリ画像が、スマートフォンのカメラで撮られたピクチャである場合、ビジュアル・サーチ・サーバ810により送信するキーポイントとローカル記述子との選択は、端末820の実際の位置に基づくことができる。この解決法は、モニュメント認識サービスなどのような幾つかのビジュアル・サーチ・サービスにおいて好都合に用いることができる。
【0213】
画像比較動作を管理できるようにするために、端末820は、ローカル参照データベース916と更新ユニット920とを備え、更新ユニット920は、ビジュアル・サーチ・サーバ810により送信されたキーポイントおよびローカル記述子を受信するように適用され、従って、ローカル参照データベース916を更新する。なお、既に記憶されているキーポイントおよびローカル記述子を用いても十分であるので、画像の比較を行うとき毎にローカル参照データベース916の更新を必ず行う必要があるという訳ではいことを、理解すべきである。例えば、ローカル参照データベース916を、1日に1回のみ、ビジュアル・サーチ・サーバ810により更新することができる。
【0214】
先の実施形態と比較して、この解決法は、送信されるデータの量が大きく低減されるので、速い。従って、この解決法は、特に、拡張現実の応用に適する。
【0215】
提案される方法の更に可能な応用は、立体カメラ・システムに属するビデオ・カメラの自動校正である。校正の目的は、基礎的マトリックス(fundamental matrix)と呼ばれるもの、即ち、取得システム(acquisition system)の内在的および外来的なパラメータを記述するマトリックスの生成である。内在的パラメータはカメラの構成を記述し、外来的パラメータは空間内のカメラの位置を記述する。
【0216】
図10の概略的なフローチャートに示すように、第1カメラ1001は第1画像を取得し(ブロック1004)、第1画像は、対応する第1キーポイントを識別するために処理される(ブロック1006)。第1キーポイントが識別されると、そのローカルのアスペクトが、対応する第1ローカル記述子を通じて記述される(ブロック1008)。同様に、第2カメラ1010は第2画像を取得し(ブロック1012)、第2画像は、対応する第2キーポイントを見つけるために処理される(ブロック1014)。次に、それらのキーポイントのローカルのアスペクトが、対応する第2ローカル記述子を通じて記述される(ブロック1016)。
【0217】
第1ローカル記述子と第2ローカル記述子とを比較することにより、第1画像と第2画像との間でのキーポイントマッチが生成される(ブロック1018)。次に、図7A図7Cに示す方法の3つの段階を適用することにより、インライアであるキーポイントマッチが識別される(ブロック1020)。
【0218】
インライアが識別されると、基礎的マトリックスを推定するために反復する手順が行われ(ブロック1022)、それにより、新たなキーポイントマッチが見つけられる(ブロック2014)。これらの動作は、IEEE Transactions on pattern analysis and machine intelligence、Vol.19、No.6のR.Hartleyによる「In defense of the Eight-Point Algorithm(8ポイント・アルゴリズムを守る)」に記載された手順に続いて行うことができる。次に、新たなキーポイントマッチは、図7A図7Cに示す方法の3つの段階により再び処理され、インライアが識別される(ブロック1026)。この手順(即ち、ブロック1022、1024、1026に対応する手順)は、インライアの数が安定するまで反復される。
【0219】
上記の記載では、本発明の幾つかの実施形態を詳細に呈示し説明したが、特許請求の範囲に定めた範囲から出ることなく、説明した実施形態に対して幾つかの変更を行うことができ、また、別の実施形態も可能である。
【0220】
例えば、ここでの説明では、ログ距離比率(LDR)を参照しているが、ヒストグラムが、対数を用いない単純な距離比率などのような別の距離比率を用いて解釈される場合には、ログ距離比率の場合と類似の考え方を適用することができ、更には、ヒストグラムが、ログ距離比率の倍数や累乗を用いて解釈される場合にも、ログ距離比率の場合と類似の考え方を適用することができる。
【0221】
更に、距離比率の統計的分布をヒストグラムとは異なる表現で表すことに、何の妨げもない。その場合、ピアソンの検定は、選択された特定の表現と矛盾しない等価の検定に置き換えるべきである。
【0222】
更に、本発明の構成要素は、ヒストグラムのビンの幅が互いに異なっている場合でも、適用することができる。
図1A
図1B
図1C
図2
図3A
図3B
図3C
図3D
図3E
図3F
図4
図5A
図5B
図6
図7A
図7B
図7C
図8
図9A
図9B
図9C
図10