【課題を解決するための手段】
【0012】
本発明によれば、リファレンス画像から抽出されたリファレンスベクトルの集合から、クエリ画像のクエリベクトルに類似したベクトルを検索する検索装置であって、
リファレンス画像について、リスト識別子LIDn毎に、リファレンス画像識別子と、粗量子化及び直積量子化を用いて符号化した画像特徴符号との複数の組を対応付けた転置インデックスを登録する転置インデックス登録手段と、
クエリ画像についてリスト識別子LIDnと画像特徴符号の複数の組を入力する検索手段とを有し、
検索手段は、
クエリ画像の各リスト識別子と画像特徴符号の組について、当該リスト識別子に対応する転置インデックスのリストを取得し、
クエリ画像の画像特徴符号と、取得したリスト中のリファレンス画像の各画像特徴符号との間の距離を算出し、
距離が短いほど高くなるスコア値を算出し、
当該リファレンス画像毎に該スコア値を累積加算し、
スコア値が最も高くなるリファレンス画像を検索結果として出力する
ことを特徴とする。
【0013】
本発明の検索装置における他の実施形態によれば、検索手段は、距離が短い上位所定件数(K)に相当するスコア値のみを当該リファレンス画像に累積加算することも好ましい。
【0014】
本発明の検索装置における他の実施形態によれば、検索手段について、上位所定件数(K)は、予め設定された固定数か、又は、予め設定された距離に関する閾値THに基づいて当該距離が閾値TH以下となる距離の数であることも好ましい。
【0015】
本発明の検索装置における他の実施形態によれば、
検索手段について、上位所定件数(K)のうちi件目に対応する加算スコアは、
(1)k番目の距離の二乗からi番目の距離の二乗を引いたものとするか、
(2)k番目の距離の二乗とi番目の距離の二乗の比から1を引いたものとするか、
(3)k番目の距離とi番目の距離の比の二乗から1を引いたものとするか、又は、
(4)k番目の距離とi番目の距離の比から1を引いたものの二乗とする
ことも好ましい。
【0016】
本発明の検索装置における他の実施形態によれば、
画像特徴符号は、直積量子化のための残差コードブックの代表ベクトルの識別子の列で表されており、
画像特徴符号間の距離は、第1の識別子列x及び第2の識別子列yについて、第1の識別子列xのl番目の識別子に対応する代表ベクトルと第2の識別子列yのl番目の識別子に対応する代表ベクトルとの間の各距離を1≦l≦Lについて総和したものである
ことも好ましい。
【0017】
本発明の検索装置における他の実施形態によれば、
画像特徴符号間の距離は、残差コードブックにおける2つの第1の識別子列x及び第2の識別子列yの総当りの組み合わせについて、第1の識別子列xの代表ベクトルと第2の識別子列yの代表ベクトルとの間の距離を登録したテーブルTを用いて算出されることも好ましい。
【0018】
本発明の検索装置における他の実施形態によれば、
クエリ画像及びリファレンス画像から局所特徴のクエリベクトル及びリファレンスベクトルを抽出する局所特徴抽出手段と、
局所特徴抽出手段から出力されたクエリベクトル及びリファレンスベクトルに対して、コードブックを用いて第1階層で粗量子化し、その量子化誤差を残差コードブックを用いて第2階層で直積量子化し、当該クエリ画像についてリスト識別子LIDn毎に画像特徴符号の複数の組を検索手段へ出力し、当該リファレンス画像についてリスト識別子LIDn毎に画像特徴符号の複数の組を転置インデックス登録手段へ出力する符号化手段と
を有することも好ましい。
【0019】
本発明の検索装置における他の実施形態によれば、
局所特徴抽出手段は、ORB(Oriented FAST and Rotated BRIEF)又はFREAK(Fast
Retina Keypoint)に基づくバイナリ局所特徴ベクトルを抽出し、
コードブックは、バイナリ局所特徴ベクトルのリファレンスベクトルを、K-Medoids法を用いてクラスタリングしたものであり、
粗量子化は、バイナリ局所特徴ベクトルのクエリベクトルを、コードブック内の最も類似したバイナリ代表ベクトルに割り当て、
量子化誤差は、バイナリ特徴ベクトルと、そのバイナリ特徴ベクトルに最も類似したバイナリ代表ベクトルとの排他的論理和によって算出されることも好ましい。
【0020】
本発明によれば、前述した検索装置として機能するサーバと、クエリ画像を入力する端末とを有するシステムであって、
端末は、
クエリ画像から局所特徴のクエリベクトルを抽出する局所特徴抽出手段と、
局所特徴抽出手段から出力されたクエリベクトルに対して、コードブックを用いて第1階層で粗量子化し、その量子化誤差を残差コードブックを用いて第2階層で直積量子化し、当該クエリ画像についてリスト識別子LIDn毎に画像特徴符号の複数の組を出力する符号化手段と、
クエリ画像におけるリスト識別子LIDn毎の画像特徴符号の複数の組を、サーバへ送信するクエリ符号送信手段と、
サーバから、検索された1つ以上のリファレンス画像を受信し且つ出力するリファレンス画像受信手段とを有し、
サーバは、
リファレンス画像から局所特徴のリファレンスベクトルを抽出する局所特徴抽出手段と、
局所特徴抽出手段から出力されたリファレンスベクトルに対して、コードブックを用いて第1階層で粗量子化し、その量子化誤差を残差コードブックを用いて第2階層で直積量子化し、当該リファレンス画像についてリスト識別子LIDn毎に画像特徴符号の複数の組を、転置インデックス登録手段へ出力する符号化手段と、
端末から、クエリ画像についてリスト識別子LIDn毎に画像特徴符号の複数の組を受信するクエリ符号受信手段と、
スコア値が最も高くなるリファレンス画像を検索結果として送信するリファレンス画像送信手段と
を有することを特徴とする。
【0021】
本発明のシステムにおける他の実施形態によれば、
局所特徴抽出手段は、ORB又はFREAKに基づくバイナリ局所特徴ベクトルを抽出し、
コードブックは、バイナリ局所特徴ベクトルのリファレンスベクトルを、K-Medoids法を用いてクラスタリングしたものであり、
粗量子化は、バイナリ局所特徴ベクトルのクエリベクトルと、コードブック内のバイナリ代表ベクトルとを排他的論理和によって算出する
ことも好ましい。
【0022】
本発明によれば、装置に搭載されたコンピュータを、リファレンス画像から抽出されたリファレンスベクトルの集合から、クエリ画像のクエリベクトルに類似したベクトルを検索するように機能させるプログラムであって、
リファレンス画像について、リスト識別子LIDn毎に、リファレンス画像識別子と、粗量子化及び直積量子化を用いて符号化した画像特徴符号との複数の組を対応付けた転置インデックスを登録する転置インデックス登録手段と、
クエリ画像についてリスト識別子LIDnと画像特徴符号の複数の組を入力する検索手段とを有し、
検索手段は、
クエリ画像の各リスト識別子と画像特徴符号の組について、当該リスト識別子に対応する転置インデックスのリストを取得し、
クエリ画像の画像特徴符号と、取得したリスト中のリファレンス画像の各画像特徴符号との間の距離を算出し、
距離が短いほど高くなるスコア値を算出し、
当該リファレンス画像毎に該スコア値を累積加算し、
スコア値が最も高くなるリファレンス画像を検索結果として出力する
ようにコンピュータを機能させることを特徴とする。
【0023】
本発明によれば、装置を用いて、リファレンス画像から抽出されたリファレンスベクトルの集合から、クエリ画像のクエリベクトルに類似したベクトルを検索する検索方法であって、
リファレンス画像について、リスト識別子LIDn毎に、リファレンス画像識別子と、粗量子化及び直積量子化を用いて符号化した画像特徴符号との複数の組を対応付けた転置インデックスを登録する転置インデックス登録部を有し、
クエリ画像についてリスト識別子LIDnと画像特徴符号の複数の組を入力する第1のステップと、
クエリ画像の各リスト識別子と画像特徴符号の組について、当該リスト識別子に対応する転置インデックスのリストを取得する第2のステップと、
クエリ画像の画像特徴符号と、取得したリスト中のリファレンス画像の各画像特徴符号との間の距離を算出する第3のステップと、
距離が短いほど高くなるスコア値を算出する第4のステップと、
当該リファレンス画像毎に該スコア値を累積加算する第5のステップと、
スコア値が最も高くなるリファレンス画像を検索結果として出力する第6のステップと
を有することを特徴とする。