IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特許7431563画像検索装置、画像検索方法、及びプログラム
<>
  • 特許-画像検索装置、画像検索方法、及びプログラム 図1
  • 特許-画像検索装置、画像検索方法、及びプログラム 図2
  • 特許-画像検索装置、画像検索方法、及びプログラム 図3
  • 特許-画像検索装置、画像検索方法、及びプログラム 図4
  • 特許-画像検索装置、画像検索方法、及びプログラム 図5
  • 特許-画像検索装置、画像検索方法、及びプログラム 図6
  • 特許-画像検索装置、画像検索方法、及びプログラム 図7
  • 特許-画像検索装置、画像検索方法、及びプログラム 図8
  • 特許-画像検索装置、画像検索方法、及びプログラム 図9
  • 特許-画像検索装置、画像検索方法、及びプログラム 図10
  • 特許-画像検索装置、画像検索方法、及びプログラム 図11
  • 特許-画像検索装置、画像検索方法、及びプログラム 図12
  • 特許-画像検索装置、画像検索方法、及びプログラム 図13
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-02-06
(45)【発行日】2024-02-15
(54)【発明の名称】画像検索装置、画像検索方法、及びプログラム
(51)【国際特許分類】
   G06F 16/535 20190101AFI20240207BHJP
   G06T 1/00 20060101ALI20240207BHJP
   H04N 7/18 20060101ALI20240207BHJP
   G06F 16/532 20190101ALI20240207BHJP
【FI】
G06F16/535
G06T1/00 200E
H04N7/18 D
G06F16/532
【請求項の数】 19
(21)【出願番号】P 2019215596
(22)【出願日】2019-11-28
(65)【公開番号】P2021086438
(43)【公開日】2021-06-03
【審査請求日】2022-11-28
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】松下 昌弘
【審査官】齊藤 貴孝
(56)【参考文献】
【文献】国際公開第2018/159095(WO,A1)
【文献】特開2000-331009(JP,A)
【文献】特開2010-218479(JP,A)
【文献】高橋 昌弘、外2名,検索結果の評価を用いた類似画像検索の高精度化に関する検討,映像情報メディア学会技術報告,日本,(一社)映像情報メディア学会,2015年02月16日,第39巻,第7号,p.83-88
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
G06T 1/00
H04N 7/18
(57)【特許請求の範囲】
【請求項1】
第1の評価方式によるクエリ画像との第1の類似度に基づいて、前記クエリ画像と関連する画像を複数の検索対象画像から検索する検索手段と、
前記検索手段により検索された画像について正解であることと不正解であることとの少なくとも一方を示すフィードバックを取得する第1の取得手段と、
前記フィードバックに従って類似度の評価方式を前記第1の評価方式から第2の評価方式に変更することが前記画像の検索結果に与える影響の評価を取得する第2の取得手段と、
前記第2の評価方式による前記クエリ画像との第2の類似度に基づく、前記クエリ画像と関連する画像の前記複数の検索対象画像からの検索を、前記影響の評価に応じて制御する制御手段と、
を備え、
前記第1の取得手段は、前記第1の類似度に従って選択された前記複数の検索対象画像の一部である第1の画像群をユーザに提示し、前記第1の画像群のうちの少なくとも1つの画像について、前記ユーザからの前記フィードバックを取得し、
前記第2の取得手段は、前記複数の検索対象画像から前記第1の類似度の高い順に所定数の画像が選択される第2の画像群のそれぞれについて、前記第2の類似度を算出し、ここで前記第2の画像群は前記第1の画像群を含むことを特徴とする、画像検索装置。
【請求項2】
前記第1の取得手段は、前記第1の類似度に従って選択された前記複数の検索対象画像の一部である前記第1の画像群をユーザに表示し、第1の配列に表示される前記第1の画像群のうちの前記少なくとも1つの画像について、前記ユーザからの前記フィードバックを取得し、前記第1の画像群は、第1の評価手法に従う検索の際に、前記第1の類似度の高い順に前記第1の配列で前記ユーザに表示されることを特徴とする、請求項1に記載の画像検索装置。
【請求項3】
前記第2の取得手段は、前記第2の画像群の少なくとも一部を前記第2の類似度に応じた第1の配列で表示し、前記第1の配列に対するユーザの評価を前記影響の評価として取得し、前記第2の画像群の少なくとも一部は、前記第1の取得手段が前記フィードバックを取得した後に、前記第2の類似度の高い順に、前記第1の配列とは異なる第2の配列で前記ユーザに表示されることを特徴とする、請求項1に記載の画像検索装置。
【請求項4】
前記第2の画像群は、前記第1の画像群よりも多くの画像を含み、
前記第2の画像群の少なくとも一部は、前記第2の画像群から前記第2の類似度に従って選択された、前記第1の画像群と同数の画像であることを特徴とする、請求項3に記載の画像検索装置。
【請求項5】
前記第2の取得手段は、前記第1の取得手段がフィードバックを取得するたびに、前記第2の画像群の少なくとも一部を、前記フィードバックに従って評価された類似度に応じた配列で表示することを特徴とする、請求項3又は4に記載の画像検索装置。
【請求項6】
前記第2の取得手段は、ユーザの指示に応じて、前記第2の画像群の少なくとも一部を、前記フィードバックに従って評価された類似度に応じた配列で表示することを特徴とする、請求項3又は4に記載の画像検索装置。
【請求項7】
前記第2の取得手段は、前記第2の画像群についての、前記第1の類似度に応じた配列と、前記第2の類似度に応じた配列と、の関係に基づいて、前記影響の評価を行うことを特徴とする、請求項1乃至6の何れか1項に記載の画像検索装置。
【請求項8】
前記第2の取得手段は、前記第2の画像群に含まれる画像についての、前記第1の類似度に応じた前記第2の画像群における順位と、前記第2の類似度に応じた前記第2の画像群における順位と、の間の変動量に基づいて、前記影響の評価を行うことを特徴とする、請求項7に記載の画像検索装置。
【請求項9】
前記第2の取得手段は、前記第2の画像群についての、前記第1の類似度と前記第2の類似度との関係に基づいて、前記影響の評価を行うことを特徴とする、請求項1乃至8の何れか一項に記載の画像検索装置。
【請求項10】
前記第2の取得手段は、前記第2の画像群に含まれる画像についての、前記第1の類似度と前記第2の類似度との間の変動量に基づいて、前記影響の評価を行うことを特徴とする、請求項9に記載の画像検索装置。
【請求項11】
前記第2の取得手段は、前記第1の画像群又は前記第2の画像群が有する前記第1の類似度の分布と、前記第2の画像群のうちの前記第2の類似度がより大きい第3の画像群が有する前記第1の類似度の分布と、の関係に基づいて、前記影響の評価を行うことを特徴とする、請求項1乃至10の何れか一項に記載の画像検索装置。
【請求項12】
前記第2の取得手段は、前記第3の画像群が有する前記第1の類似度の分布が、前記第2の画像群が有する前記第1の類似度の分布の内部に収まっているか否かに基づいて、前記影響の評価を行うことを特徴とする、請求項11に記載の画像検索装置。
【請求項13】
前記第2の取得手段は、前記第2の評価方式で用いられる評価パラメータに基づいて、前記影響の評価を行うことを特徴とする、請求項1乃至12の何れか一項に記載の画像検索装置。
【請求項14】
前記第2の取得手段は、前記影響の評価結果をユーザに提示することを特徴とする、請求項7乃至13の何れか一項に記載の画像検索装置。
【請求項15】
前記第2の取得手段は、前記影響が有効であると評価すると、前記第2の類似度に基づく前記クエリ画像と関連する画像の前記複数の検索対象画像からの検索をユーザに提案することを特徴とする、請求項14に記載の画像検索装置。
【請求項16】
前記第1の取得手段は、前記フィードバックを取り消す指示をさらに取得し、
前記第2の取得手段は、取り消されていない前記フィードバックに従って類似度の評価方式を前記第1の評価方式から前記第2の評価方式に変更することが前記画像の検索結果に与える影響の評価を取得することを特徴とする、請求項1乃至15の何れか一項に記載の画像検索装置。
【請求項17】
前記第2の取得手段は、前記フィードバックに基づいて、前記第2の類似度を算出するために用いる、画像が有する特徴量の次元ごとの重みを決定することを特徴とする、請求項1乃至16の何れか一項に記載の画像検索装置。
【請求項18】
画像検索装置が行う制御方法であって、
第1の評価方式によるクエリ画像との第1の類似度に基づいて、前記クエリ画像と関連する画像を複数の検索対象画像から検索する工程と、
検索された画像について正解であることと不正解であることとの少なくとも一方を示すフィードバックを取得する工程と、
前記フィードバックに従って類似度の評価方式を前記第1の評価方式から第2の評価方式に変更することが前記画像の検索結果に与える影響の評価を取得する工程と、
前記第2の評価方式による前記クエリ画像との第2の類似度に基づく、前記クエリ画像と関連する画像の前記複数の検索対象画像からの検索を、前記影響の評価に応じて制御する工程と、
を備え、
前記フィードバックを取得する工程は、前記第1の類似度に従って選択された前記複数の検索対象画像の一部である第1の画像群をユーザに提示し、前記第1の画像群のうちの少なくとも1つの画像について、前記ユーザからの前記フィードバックを取得し、
前記評価を取得する工程は、前記複数の検索対象画像から前記第1の類似度の高い順に所定数の画像が選択される第2の画像群のそれぞれについて、前記第2の類似度を算出し、ここで前記第2の画像群は前記第1の画像群を含むことを特徴とする、制御方法。
【請求項19】
コンピュータを、請求項1乃至17の何れか一項に記載の画像検索装置の各手段として機能させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、画像検索装置、画像検索方法、及びプログラムに関する。
【背景技術】
【0002】
近年、監視カメラの映像内から特定の人物が映っているシーンを、人物画像をクエリとして検索するシステムの実用化が進んでいる。人物画像を用いた検索を行う際には、多次元ベクトルからなる特徴量を画像から抽出し、特徴量の類似度に基づいて検索を行う方法が一般的である。
【0003】
また、そのような検索方法において、ユーザが検索結果に満足できなかった場合には、その検索結果に正解又は不正解であるというラベルをユーザの手で付与することにより、そのラベルを用いて検索結果を更新する適合性フィードバックと呼ばれる技術が開発されてきた。古典的な適合性フィードバックの一例は、非特許文献1に記載されている方式をベースとするものであり、クエリ特徴量を補正して再検索を行う。
【先行技術文献】
【非特許文献】
【0004】
【文献】Rocchio, J. Relevance feedback in information retrieval,1971
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、検索母集団が大きく、及び検索に時間を要するような場合には、検索実施時の待ち時間が長くなりやすい。例えば、複数の監視カメラの数日分の映像を対象に検索する場合などでは、分オーダーの時間がかかる場合もある。加えてフィードバックと再検索を数回繰り返すことにより検索結果を絞り込んでいく場合には、何分も待たされる処理を数回実行することになり、ユーザにとっては煩雑な作業となる。
【0006】
本発明は、画像検索において再検索の実施回数を抑制することを目的とする。
【課題を解決するための手段】
【0007】
本発明の目的を達成するために、例えば、一実施形態に係る画像検索装置は以下の構成を備える。すなわち、第1の評価方式によるクエリ画像との第1の類似度に基づいて、前記クエリ画像と関連する画像を複数の検索対象画像から検索する検索手段と、前記検索手段により検索された画像について正解であることと不正解であることとの少なくとも一方を示すフィードバックを取得する第1の取得手段と、前記フィードバックに従って類似度の評価方式を前記第1の評価方式から第2の評価方式に変更することが前記画像の検索結果に与える影響の評価を取得する第2の取得手段と、前記第2の評価方式による前記クエリ画像との第2の類似度に基づく、前記クエリ画像と関連する画像の前記複数の検索対象画像からの検索を、前記影響の評価に応じて制御する制御手段と、を備えることを特徴とする。
【発明の効果】
【0008】
画像検索において再検索の実施回数を抑制する。
【図面の簡単な説明】
【0009】
図1】実施形態1に係る機能構成及びハードウェア構成の一例を示す図。
図2】実施形態1に係る画像検索装置の検索処理の一例を示す図。
図3】実施形態1に係る画像検索装置のフィードバック処理の一例を示す図。
図4】実施形態1に係る画像検索装置の再検索処理の一例を示す図。
図5】実施形態1に係る画像検索方法における処理例のフローチャート。
図6】実施形態1に係る画像検索装置の再検索ボタンを説明するための図。
図7】実施形態1に係る画像検索装置のフィードバック画面の一例を示す図。
図8】実施形態2に係る機能構成及びハードウェア構成の一例を示す図。
図9】実施形態2に係る画像検索方法における処理例のフローチャート。
図10】実施形態2に係る特徴空間における類似度の分布の一例を示す図。
図11】実施形態2に係る画像検索方法における評価処理の一例のフローチャート。
図12】実施形態3に係る機能構成及びハードウェア構成の一例を示す図。
図13】実施形態3に係る画像検索方法における処理例のフローチャート。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0011】
[実施形態1]
本実施形態に係る画像検索装置は、検索母集団となる検索対象画像から、クエリ画像との類似度に基づいて、クエリ画像と関連する検索結果を取得する。次いで、検索結果に対するユーザのフィードバックを取得し、及び、そのフィードバックの有効性を評価する。つまり、画像検索装置は、フィードバックに従って類似度の評価方式を変更し、その変更が画像の検索結果に与える影響を評価する。さらに、そのような影響の評価結果に応じて、変更された評価方式に従う類似度に基づく検索母集団からの再検索を行うかどうかを制御する。ユーザのフィードバックとは、画像についての、その画像がクエリ画像に対して正解か不正解かのラベルを含む、ユーザから与えられる情報である。本実施形態においては、ユーザのフィードバックは、検索対象画像の画像群から取得された検索結果に含まれる画像について与えられる。
【0012】
また、本実施形態に係る画像検索装置は、上述のフィードバックに応じた影響の評価のため、検索結果の上位(つまり、類似度の高いもの)のみに対して、新たに算出された類似度に基づいて再検索(リランキング)を行い、その結果を提示することができる。以下においては、そのような検索結果の上位のみに対して実施する再検索を「リランキング」と呼び、及び、検索母集団に対する再検索を単に「再検索」と呼ぶものとする。また、本実施形態に係る画像検索装置は、上述の検索結果の上位について、リランキングに用いるため、RAMなどの比較的読み込み速度の速いストレージにデータを格納してもよい。このような構成によれば、件数が少ない検索結果の上位のみを対象としてリランキングを行うため、高速な再検索(リランキング)が可能となり、及び、フィードバックの効果が早急に確認可能となる。
【0013】
本実施形態においては、フィードバックの有効性を、リランキングの結果に基づいてユーザが評価する。すなわち、ユーザが、リランキングの結果に基づいて検索に対するフィードバックの有効性が確認できたと判断した時に、検索母集団に対する再検索を指示することにより、多大な処理時間を要しやすい再検索の実施回数を抑制することが可能となる。したがって、検索結果上位のみについてリランキングを行う迅速な処理の結果に基づいてフィードバックの有効性を確認することにより、ユーザのフィードバックによる検索の利便性を向上させることができる。
【0014】
以下、フィードバックの有効性とは、無用な再検索とはならない可能性を示す情報であるとし、及び、有効であるとはそのような可能性が高いことを示すものとする。すなわち、フィードバックとして、何枚の画像を正解又は不正解データとして指定すれば期待通りの検索結果が得られるかは、クエリ画像と検索母集団に依存する。例えば、首周りの色を指定すれば特定の人物を他の人物と弁別できるのであれば、首周りの色がクエリ画像とは異なる画像を不正解として指定することにより、有効な再検索を行うことができる。一方で、首周りの色、鞄の色、及びシャツの色を指定することが、特定の人物を他の人物と弁別するために必要なことがある。この場合、首周りの色及び鞄の色がクエリ画像とは異なる画像を不正解として指定しても、シャツの色が異なる画像を検索結果からは排除できないため、このようなフィードバックは有効ではないフィードバックと呼べるかもしれない。また、無用な再検索とは、再検索の総計実施回数を増やしてしまうような再検索であるものとする。つまり、例えば、時間を要しやすい再検索を行ったにも関わらずユーザの所望の結果が得られず、再びフィードバックを行う必要が生じてしまうような再検索のことである。さらに、単に類似度と記載されている場合は、その類似度は、その例においてクエリ画像として設定される特徴量との類似度であるとする。
【0015】
本実施形態に係る画像検索装置は、撮像デバイスから送信された映像を解析し、ユーザに検索結果を提示するサーバである。図1(A)は、本実施形態に係る画像検索装置のハードウェア構成の一例を示すブロック図である。CPU101は、ROM102に格納されている制御プログラムを実行することにより、本実施形態に係る画像検索装置全体の制御を行う。ROM102に格納されている制御プログラムは、オブジェクト抽出部103、特徴量抽出部104、登録部105、特徴量検索部106、及び算出部124を有する。ROM102の有する各機能部については後述する。RAM107は、本実施形態に係る画像検索装置の各構成要素からの各種データを一時的に格納する。また、RAM107は、プログラムを展開することにより、それらのプログラムをCPU101が実行可能な状態にする。また、後述の通常検索部117、フィードバック検索部119、及びリランキング部123など、図1(B)に示される画像検索装置120が有する各構成も、同様に、CPU101がメモリ上のプログラムを実行することにより実現される。
【0016】
記憶部108は、本実施形態に係る画像検索装置の処理対象(つまり、検索対象)となるデータを格納する。記憶部108の媒体としては、HDD、フラッシュメモリ、又は各種光学メディアなどが用いられてもよい。入力部109は、例えばキーボード又はタッチパネルなどで構成されており、画像検索装置へのユーザからの入力を取得する。処理の詳細は図5において後述するが、ユーザは、入力部109を用いて、例えば、検索条件、クエリ画像、又は検索結果に対するフィードバック情報(正解又は不正解の指定)などを情報処理措置へと入力することができる。表示部110は、例えば液晶ディスプレイなどで構成されており、画像検索装置における処理の結果をユーザに対して表示する。本実施形態においては、表示部110は、検索結果、リランキング結果、又は再検索結果などを表示することができる。また、本実施形態に係る画像検索装置は、通信部111を介して撮像装置などの他の装置と通信をすることができる。
【0017】
図1(B)は本実施形態に係る画像検索装置が行う情報処理のデータフローの一例を示すブロック図である。図1(B)の例においては、本実施形態に係る画像検索装置は、画像検索装置120として示される部分であり、及び、通信部111を介して外部にある撮像装置121が取得した監視映像112を取得する。監視映像112は、ここでは逐次的に撮像される画像で構成されるものとするが、特にそのように限定されるわけではない
【0018】
画像検索装置120が行うデータ登録処理においては、オブジェクト抽出部103は、取得した監視映像112を解析し、及び映像内に映っているオブジェクトを抽出する。本実施形態においては説明のため、オブジェクト抽出部103が抽出するオブジェクトは人物領域であるものとするが、特にそれに限定されるわけではない。例えば、オブジェクト抽出部103はオブジェクトとして顔領域を抽出してもよい。次いで、特徴量抽出部104は、オブジェクト抽出部103が抽出したオブジェクトから、そのオブジェクトの特徴量である登録特徴量113を抽出する。登録部105は、特徴量抽出部104が抽出した登録特徴量113をデータベース114に登録する。データベース114は、検索母集団となる情報を格納する。データベース114には、監視映像112を構成する画像について、オブジェクト領域を切り出したサムネイル画像、撮像時刻情報、及び撮像カメラ情報などが登録されていてもよい。そのような構成によれば、ユーザが検索を行う際に、データベース114に登録されたそれらの情報と登録特徴量113とを対応付けて利用することができる。図1(B)の例においては、データベース114は記憶部108に配置される。
【0019】
本実施形態に係る検索処理においては、画像検索装置120は、まず入力部109を介してユーザからクエリ画像115を取得する。次いで、画像検索装置120が行うデータ登録処理と同様に、オブジェクト抽出部103がクエリ画像115に映っているオブジェクトを抽出する。さらに、特徴量抽出部104が、クエリ画像115内に抽出されたオブジェクトの特徴量であるクエリ特徴量116を抽出する。
【0020】
通常検索部117は、通常検索(つまり、初回の検索)を行う。通常検索部117は、データベース114に登録された登録特徴量113から、特徴量に基づいて算出される類似度に応じて、クエリ特徴量116と類似する特徴量を検索する。また、通常検索部117は、リランキングを行うオブジェクト(リランキング対象)のリストとして、類似度に従って検索対象画像から選択されるオブジェクトのリストを検索結果122として取得する。この例においては、通常検索部117は、類似度の高い順に所定件数の特徴量に対応するオブジェクトのリストを検索結果122として取得する。通常検索部117は、通常検索時には、算出部124を介して、予め定められた類似度算出方式を用いて類似度を算出するが、詳細な説明は後述する。また、ここで検索結果の件数として設定される所定件数は特に限定されず、適宜所望の値として設定されてもよい。さらに、通常検索部117は、検索結果122を、該当するオブジェクトの特徴量と共にRAM107上に保存する。次に、通常検索部117は、検索結果122のオブジェクトのサムネイル画像を表示部110に出力する。例えば検索結果122の件数が多い場合において、通常検索部117は、1画面中に所定の数のサムネイル画像を提示し、及びスクロール操作によって続く結果を確認できるようにしてもよい。ここで1画面中に表示されるサムネイル画像の数は特に限定されず、例えば50件の画像が表示されてもよい。
【0021】
表示部110は、通常検索部117による検索結果122をユーザに提示する。ユーザは、入力部109を介して、表示部110に表示されている検索結果122のサムネイル画像の中から、クエリ画像115内のオブジェクトと一致したオブジェクトを映している正解画像、又は正解ではない不正解画像を指定することができる。リランキング部123は、画像についての正解又は不正解のユーザによる指定結果を示すラベル情報を、フィードバック情報118として取得する。また、フィードバック検索部119がフィードバック情報118を取得し、及び再度検索処理を行ってもよい。以下においては簡単のため、正解又は不正解とは、ユーザが表示部110上で選択する画像に関する上述の正解又は不正解を指すものとする。
【0022】
フィードバック情報118は、ユーザが指定した画像について、その画像が正解又は不正解画像のいずれかであるかを示すラベル情報と、その画像に対応するオブジェクトの特徴量とを含んでいる。算出部124は、フィードバックに従って類似度の評価方式を変更する。本実施形態に係る算出部124は、クエリ特徴量116と、正解データ又は不正解データの特徴量と、の共通性に基づいて、クエリ画像と検索対象画像との間の類似度算出方式を作成する。ここで作成した類似度算出方式を用いてリランキング部123がリランキングを行い、及びそのリランキング結果からユーザがフィードバックの有効性を確認することにより、検索精度の向上を図ることができる。類似度算出方式の作成方法については、ステップS506~S509において詳述する。
【0023】
リランキング部123は、検索結果122のオブジェクトの特徴量を対象として、算出部124で作成した類似度算出方式を用いて類似度を算出することにより、類似度に応じた配列のリランキング結果125を取得する。取得したリランキング結果125は表示部110に表示される。例えば、検索対象画像が数百万件ある場合においても、検索結果122が1000件として設定されている場合、リランキング部123は、検索結果122と同数の1000件の類似度を算出し、及び類似度の高い順にリランキングして提示することができる。そのような場合、リランキング部123は、1000件の検索結果に含まれていなかった正解画像を新たに検出することはないが、検索結果に含まれる処理対象の少なさから、迅速に表示部110へと反映させることが可能である。したがって、検索結果122のみを母集団としたフィードバックの効果をユーザが即座に確認することが可能となる。
【0024】
本実施形態においては、リランキング結果125をユーザが評価することにより、フィードバックの有効性が確認できたかどうかが判断される。リランキング結果125は表示部110に提示され、及びユーザは表示部110上に即座に反映されたリランキングの結果を確認することができる。次いでユーザは、リランキング結果を評価することにより、自身が与えたフィードバックによって検索結果の精度を向上させることができると判断した場合に、フィードバック検索(再検索)の指示を出すことができる。
【0025】
フィードバック検索部119は、データベース114が有する特徴量を対象として、算出部124が作成した類似度算出方式を用いて類似度を算出する。このような処理によれば、1000件の検索結果122からは漏れてしまっていた正解画像を検出できる可能性がある。リランキング部123及びフィードバック検索部119によるリランキング結果125及び検索結果122は、通常検索時と同様に表示部110に出力されてもよい。リランキング結果として表示部110に提示されるサムネイル画像を提示する形式及び件数は特に限定されないが、この例においては説明のため、通常検索結果において提示されるサムネイル画像とそれぞれ同様に行われるものとする。
【0026】
なお、入力部109及び表示部110は別の装置に備わっている装置であってもよく、通信部111を介してクエリ特徴量及び検索結果の送受信を行ってもよい。また、制御プログラムはROM102に格納されているもののみに限らず、そのいくつかを別装置に備える構成であってもよい。例えば、オブジェクト抽出部103及び特徴量抽出部104を別のサーバに備え、並びに、画像検索装置120は登録部105及び特徴量検索部106のみを備える構成としてもよい。このような構成とする場合には、映像を解析する処理と検索に関する処理で装置を分けることが可能となり、したがってそれぞれの処理に適したハードウェアスペックを選択することができる。
【0027】
オブジェクト抽出部103が人体領域を検出する方法は特に限定されない。以下においては、オブジェクト抽出部103は、人物領域の特徴を事前に学習しておき、並びにその上で入力画像内を探索窓で走査することにより、各探索窓が人体領域であるか否かを判定する方式を用いるものとする。そのための学習方法としては、例えば、アンサンブル学習又はCNN(Convolutional Neutral Network)等の深層学習手法が用いられてもよい。また、特徴量抽出部104がオブジェクトの特徴量を検出する方法も特に限定はされない。例えば、特徴量抽出部104は、人物領域内の部分領域の色ヒストグラムを特徴量として検出してもよいし、CNN等の深層学習手法によって抽出する方法を用いてもよい。
【0028】
本実施形態において記述されるフローチャートの各ステップに対応する処理は、CPUを用いてソフトウェアで実現されてもよいし、電子回路などのハードウェアで実現されるようにしてもよい。
【0029】
図2図4は、本実施形態に係る検索操作及びフィードバックに基づく検索精度向上の概要を示すものである。この例では、ユーザは、表示部110上に表示されたサムネイル画像から、検索したい人物とは明らかに異なる箇所がある画像を不正解画像として指定する。またユーザは、不正解画像を選択した後にリランキングを指示することができる。次いで、画像検索装置120はリランキングを実行し、及びリランキング結果125を提示する。さらにユーザは、リランキング結果から検索精度向上の効果が充分な結果となったと判断した場合に、再検索を指示してもよい。その結果、画像検索装置120は、最初の検索では漏れてしまっていた画像も含んだ検索結果を取得することが可能となる。このような処理によれば(この例においては3回のリランキングと1回の再検索とによれば)、効果が充分なフィードバックによる検索結果を取得することができる。したがって、リランキングを行わずに毎回再検索を行う場合と比べ、高速に結果を得やすくなる。
【0030】
以下に、図2図4に示される例の詳細なステップを説明する。図2(A)は、ユーザが検索したい人物の画像(クエリ画像201)の特徴のある箇所を表した図である。画像検索装置120は、クエリ画像201が入力されると、データベース内からクエリ画像201と類似する服装の画像を検索し、並びに、図2(B)に示すように、例えば類似度が上位1000件となる検索結果リスト202を取得し及び提示することができる。画像検索装置120は、1000件の結果を1つの画像には表示できないため、50件ごとにページをわけて表示することができる。つまり、画像検索装置120は、検索結果1ページ目には類似度上位1~50件の結果、検索結果2ページ目には上位51~100件の結果、及び検索結果3ページ目には上位101~150件の結果、のように検索結果を表示することができる。画像検索装置120は、検索直後は検索結果1ページ目203を表示し、並びに、ユーザの指示に従って次のページ、前のページ、又は指定のページを表示してもよい。また、画像検索装置120は、図2に示されるようなページ分割ではなく、画面スクロールで同様の機能を実現してもよい。
【0031】
この例では、検索結果205が最もクエリ画像201との類似度が高く、検索結果内の先頭に表示されている。しかし、検索結果205は、クエリ画像201とシャツ及び首回りの色柄は類似しているが、カバンを持っていないことから、クエリ画像201に写る人物とは異なる人物が写されている。また、検索結果1ページ目203には、クエリ画像201とは首回りの色柄が異なる検索結果207が存在する。さらに、検索結果3ページ目204には、クエリ画像201とはシャツの色柄が異なる検索結果207が存在する。データベース114内には、クエリ画像201と同一人物の画像ではあるが、撮影条件(撮影方向及び照明条件等)が異なるなどの理由で、検索結果208のように1ページ目の下位に表示される画像が記録されていることがある。また、データベース114内には、検索結果209として後のページで表示される予定になっている画像や、又は上位1000件の検索結果リスト202には入らずに210のようにランク外211のリストに含まれる画像が記録されていることもある。ランク外のリストは本来ユーザには把握し得ないリストであるが、以下においては説明のため、ランク外のリストもランク外211として明記される。
【0032】
ユーザは、図3(A)に示されるように、検索結果205が不正解である旨をフィードバック内容312として入力する。画像検索装置120は、そのフィードバックに基づいて即座にリランキングを実行し、及び検索画面にリランキングの結果を反映することができる。クエリ画像201と検索結果205とが比較された場合には、両者の間で鞄が異なっているため、画像検索装置120は、鞄を示す特徴の重みを大きくした類似度算出方式を作成し、及び作成した類似度算出方式を用いてリランキングを行う。その結果、画像検索装置120は、図3(B)の検索結果リスト313に示されるように、検索結果の上位から、クエリ画像201と鞄に違いのある結果を排除する。
【0033】
しかしながら、検索結果リスト313に表示される上位には、首回りの色柄がクエリ画像201と異なる検索結果206が残ったままである。したがってユーザは、図3(C)に示されるように、引き続き検索結果リスト313内の検索結果206が不正解である旨をフィードバック内容314として入力する。画像検索装置120は、そのフィードバックに基づいて(つまり、首回りの色柄を示す特徴の重みを大きくした類似度算出方式を作成し、及び作成した類似度算出方式を用いて)即座にリランキングを実行し、検索画面にリランキングの結果を反映することができる。その結果、画像検索装置120は、図3(D)の検索結果リスト315に示されるように、検索結果の上位から、クエリ画像201と首回りの色柄に違いのある結果を排除する。
【0034】
しかし、今度は、シャツの色柄が異なる検索結果207が検索結果の1ページ目に表示されるようになる。したがってユーザは、図4(A)に示されるように、検索結果リスト315に表示される検索結果207が不正解である旨をフィードバック内容416として入力する。画像検索装置120は、そのフィードバックに基づいて即座にリランキングを実行し、検索画面にリランキングの結果を反映することができる。その結果、画像検索装置120は、図4(B)の検索結果リスト417に示されるように、検索結果の上位から、クエリ画像201とシャツの色柄に違いのある結果を排除する。ここまでの操作が実行されても、ランク外211の画像210は、リランキング対象ではないため、検索結果としては表示されない。
【0035】
ユーザは、ここまでのリランキング結果に基づいてフィードバック内容の効果を確認し、及び再検索の指示を出すことができる。画像検索装置120は、再検索の指示を取得した場合、直前のリランキングで用いられた類似度算出方式を用いて、クエリ画像201の特徴量とデータベース114内の画像の特徴量との類似度を算出し、及び算出された類似度に基づいた再検索結果を表示する。その結果、ランク外211の画像210も検索対象として検索が行われるため、図4(C)の検索結果リスト418に示されるように、画像210が検索結果として検出されるようになる。このような構成によれば、画像検索装置120は、ユーザがフィードバックを入力するたびにリアルタイムでリランキングを行い、リランキング結果を表示することができる。また、ユーザは、フィードバックの有効性が確認できたと判断した時に、再検索を実行する指示を出すことができる。
【0036】
また、本実施形態においては、ユーザは、リランキング結果を確認することでフィードバック内容の効果を確認したうえで、再検索ボタンを押下する。しかしながら、再検索ボタンが新規に用意されることは必須ではない。例えば図6(A)に示されるように、通常検索部117が行う検索の指示を出すボタンと再検索用のボタンが共通のボタンであってもよい。そのような構成の場合は、フィードバックが与えられた状態で検索ボタンが押下された時に、再検索が実施される。また、図6(B)に示されるように、検索ボタンと再検索ボタンの両方のボタンが設けられていてもよい。再検索ボタンは、フィードバックが与えられて初めてアクティブになるように設定されることで、無用な再検索が実施されにくいように構成されていてもよい。
【0037】
なお、図2ではユーザが不正解の画像を指定する例が示されたが、検索結果に正解画像が含まれている場合には、不正解の代わりに正解が指定されるような構成であってもよい。ユーザが正解を指定した場合、正解画像同士の特徴量又はクエリ画像及び正解画像の特徴量の共通部分に、クエリ画像に写るオブジェクトの特徴がよく表れていると考えられる。このため、画像検索装置120は、図2~4の例と同様に、上述の共通部分の次元の重みを大きくした類似度算出方式を作成し、及び作成した類似度算出方式でリランキングを行うことができる。次いで、画像検索装置120は、再検索の指示が与えられた場合に、直前に作成した類似度算出方式で再検索を行うことにより、フィードバックに基づく再検索の精度向上の効果を得ることができる。また、正解と不正解との両方を指定した場合には、双方の重み計算方法を組み合わせることで統合した重みを得ることができる。
【0038】
なお、フィードバックとしては、正解又は不正解の画像を追加指定するのみではなく、正解又は不正解の画像の過去の指定を取り消すことができるようにしてもよい。その場合、画像検索装置120は、指定が取り消されていない正解又は不正解画像とクエリ画像とに基づいて、リランキング及び再検索を行えばよい。その際は、画像検索装置120は、図7に示されるようなユーザフィードバック画面を設けることにより、ユーザが正解及び不正解の確認と再設定とを実行できるようにしてもよい。
【0039】
また、フィードバック内容を設定する方法は特に限定されない。入力部109は、例えば、ユーザが画像をクリックした場合に正解か不正解かを選択するリストを表示してもよく、マウスの左クリックで正解の選択を、及び右クリックで不正解の選択を行うようにしてもよい。本実施例においては、正解又は不正解の選択がなされた場合、即座にリランキングを実行し、及びその結果を画面に反映するが、特にそのように限定されるわけではない。例えば、リランキング部123は、リランキングを行うユーザの指示に応じて、リランキングを行ってもよい。つまり、リランキング部123がリランキングボタンを用意し、及び、ユーザは、1つ以上の正解又は不正解画像を選択した後にリランキングボタンを押下することによりリランキングを行う指示を入力してもよい。次いで、リランキング部123は、そのリランキング受付(検索指示受付)により、リランキングを実行してもよい。
【0040】
以下、画像検索装置120が行う上述の処理のうち、検索関連の処理について、フローチャートに従って説明する。図5は、本実施形態に係る画像検索装置120が行う特徴量検索処理の一例を示したフローチャートである。まず、ステップS501で通常検索部117は、ユーザが入力したクエリ画像から抽出されたクエリ特徴量を取得する。また、通常検索部117は、検索対象である画像の撮像時刻及びカメラ等の、データベース114に対して検索範囲を指定するユーザ入力を取得することができる。通常検索部117に入力される検索範囲は、データベース114内のすべての画像であってもよく、特定の時刻に写された人物、若しくは特定のカメラで写された人物を検索したい場合には、撮影時刻又はカメラ名で照合対象を絞り込んだ画像であってもよい。ステップS502で通常検索部117は、指定された検索範囲の画像の特徴量を照合対象に設定する。次に、ステップS503で通常検索部117は、算出部124を介して、クエリ画像の特徴量と照合対象の特徴量との類似度を算出する。特徴量の類似度の算出方法は特に限定されないが、例えば、各種距離関数の逆数を利用することにより、特徴量間の距離が近いほど類似度が高くなるように算出してもよい。本実施形態においては、算出部124は、距離の計算にユークリッド距離を用いるものとする。
【0041】
この時、通常検索部117は、照合対象の特徴量のうち、予め設定される所定閾値よりも類似度が高くなる特徴量、又は類似度が高い方から所定件数(例えば1000件)の特徴量などの基準により、類似度が高い特徴量を選定する。次いで、通常検索部117は、選定した特徴量とその特徴量に対応する画像とをRAM107上に保持しておく。ここで通常検索部117が用いる上出の閾値及び所定件数の値は特に限定されず、それぞれ適宜所望の値が設定されてもよい。
【0042】
ステップS504で通常検索部117は、ステップS503で選定した類似度が高い特徴量から、類似度上位から所定件数分(例えば50件)の特徴量を取得し、及び選択した特徴量に対応するサムネイル画像を表示部110に出力する。ここで通常検索部117が取得する所定件数は、表示画面の大きさなどに応じて事前に定められていてもよく、ユーザが閲覧したい件数として動的に指定されてもよい。検索結果のサムネイル画像を表示する形態は、類似度の降順にソート及び表示する形態が一般的であるが、特にそのようには限定されない。検索結果として、通常検索部117は、例えば、撮影時刻などでソートした画像を表示部110上に表示してもよい。以下においては説明のため、検索結果は類似度上位から降順に取得及び表示されるものとする。
【0043】
ステップS505で通常検索部117は、ユーザからのフィードバックがあるかどうか、すなわち、ユーザが検索結果に対して正解又は不正解画像の指定を行ったかどうかを確認する。フィードバックがある場合には、処理はステップS506へと進み、ステップS509までの一連のリランキング処理が行われる。フィードバックがない場合には、処理はステップS510へと進み、及びユーザからの再検索の指示があるかどうかが確認される。再検索の指示がある場合には、処理はステップS511からステップS512にかけての再検索処理へと進む。再検索の指示がない場合には、処理はステップS513へと進み、及び検索を終了するかどうかが確認される。検索を終了しない場合には、処理はステップS505へと戻り、及び画像検索装置120が各処理を再び行う。検索を終了する場合には、通常検索部117は本フローを終了する。
【0044】
次に、ステップS506からステップS509までのリランキング処理について説明する。本実施形態に係るリランキング処理においては、ユーザが指定した画像に対応するラベル情報と特徴量とに基づいて、類似度算出方式が作成される。ステップS506でリランキング部123は、ステップS503で選定された画像の特徴量を、照合対象として設定する。ステップS507でリランキング部123は、ステップS505でユーザが正解又は不正解画像として指定した検索結果に対応する特徴量と、その検索結果が正解又は不正解画像のいずれであるかを判別するラベル情報と、をセットで取得する。つまり、ユーザが指定した画像についてのフィードバック情報を取得する。次いでリランキング部123は、S507で取得した画像の特徴量を、その画像のラベル情報に応じて、類似度算出方式を作成するために用いる特徴量として設定する。なお、本処理の実行が2回目以降である場合は、その回のステップS505でユーザによって指定された結果のフィードバック情報は、前回までのフィードバック情報に追加される。
【0045】
ステップS508で算出部124は、ステップS507で取得したフィードバック情報に基づいて、類似度算出方式を作成するためのパラメータ群として、重みベクトルw=(w、w、・・・、w)を算出する。ここで、dは用いられる特徴空間の次元数である。また、重みベクトルwは、各要素として、特徴量の次元ごとの変換のための重み係数を有している。特徴量の次元ごとにこの重みベクトルの各要素をかけ合わせたものを特徴量として用いることで、類似度算出方式を変更した類似度を算出することができる。
【0046】
まずユーザからのフィードバックによって不正解の特徴量が指定された場合の重み計算について説明を行う。ユーザからa個の不正解特徴量nが指定された場合には、クエリ特徴量をqとすると、i番目の次元の重みwは、例えば以下の式(1)及び式(2)によって算出される。
【数1】
【数2】
【0047】
式(1)で算出部124は、次元ごとにクエリ特徴量と書く不正解特徴量との差分の総和を取ることで、次元ごとの重み値w_localを計算する。本式によれば、クエリ特徴量と不正解特徴量の数値との差が大きい次元ほど、算出される重み値が大きくなる。クエリ特徴量と不正解特徴量の数値の差が大きい次元は、クエリと不正解を識別するための特徴をよく示していると考えられるため、そのような次元の重みを大きくすることで、不正解との違いを強調する効果が得られる。逆に、クエリ特徴量と不正解特徴量の数値の差が小さい次元ほど、算出される重み値が小さくなる。クエリ特徴量と不正解特徴量の数値の差が小さい次元は、クエリと不正解の違いの識別に寄与しにくいと考えられるため、そのような次元の重みを小さくすることで検索結果に与える影響を小さくする。
【0048】
式(2)で算出部124は、最終重み値wを得るための正規化を行う。この式においては、算出部124は、各次元の重みの総和が次元数dとなるように正規化を行う。このような処理によれば、類似度算出方式の変更前後での距離の絶対値の取り得る値の差を小さくすることができる。
【0049】
式(1)及び式(2)においては、クエリ特徴量と不正解特徴量との差分の次元間の相対値に基づいて重みが決定されるため、一部の次元にのみわずかな差がある場合にでも、その次元の重みが大きくなってしまう。この問題を回避するために、例えば、クエリ特徴量と不正解特徴量の数値の差が所定値以下の場合には、式(1)で算出する重みを0としてもよい。
【0050】
次に、ユーザからのフィードバックによって正解の特徴量が指定された場合の重み計算について説明を行う。ユーザからのフィードバックによってa個の正解特徴量qが指定された場合には、クエリ特徴量をqとすると、i番目の次元の重みwは、例えば以下の式(3)及び上述の式(2)によって算出される。
【数3】
【0051】
式(3)で算出部124は、次元ごとに正解特徴量の集合の偏差平方和の逆数を取ることで、次元ごとの重みを計算する。本式によれば、正解特徴量同士の数値の分散が小さい次元ほど、算出される重み値が大きくなる。正解特徴量の数値の分散が小さい次元は正解の特徴をよく示していると考えられるため、そのような次元の重みを大きくすることにより、正解特徴量に基づく類似度を高くしやすくなる。逆に、正解特徴量同士の数値の分散が大きい次元ほど、算出される重み値が小さくなる。正解特徴量の数値の分散が大きい次元は、正解の識別に寄与しにくいと考えられるため、そのような次元の重みを小さくすることで検索結果に与える影響を小さくする。次いで算出部124は、式(3)を用いて相対的な重みを得た後に、最終重み値を得るための正規化を式(2)によって行う。なお、正解特徴量の集合にさらにクエリ特徴量を追加することにより、正解とクエリとの共通性を考慮する構成としてもよい。
【0052】
正解及び不正解がユーザによって両方指定された場合では、算出部124は、例えば式(1)及び式(3)を組み合わせた以下の式(4)を用いることにより、重みを計算することができる。
【数4】
【0053】
ステップ509でリランキング部123は、重みベクトルを用いて作成した類似度算出方式を利用して、クエリ特徴量と照合対象との特徴量の類似度を算出する。リランキング部123は、作成した類似度算出方式で類似度を算出する場合では、特徴量に重みをかけた上で特徴量間のユークリッド距離を算出してもよく、重み付きユークリッド距離を用いて距離を直接算出してもよい。リランキング部123は、クエリ特徴量qと照合対象の特徴量xとの重み付きユークリッド距離を、例えば以下の式(5)を用いることにより算出することができる。式(5)によれば、正解と不正解との識別に有効な次元の重みが大きくなるため、識別に有効な次元の特徴量の差が大きい場合に距離が大きく(類似度が小さく)なり、及び識別に有効な次元の特徴量の差が小さい場合に距離が小さく(類似度が大きく)なる。また、識別に有効ではない次元は重みが小さくなるため、そのような次元の違いは距離計算結果へと影響を与えにくくなっている。
【数5】
【0054】
次に、処理はステップS504に戻る。通常検索部117は、ステップS509で算出した類似度が高い特徴量を、上位から所定件数分(例えば50件)取得し、及び取得した特徴量に対応するサムネイル画像を表示部110へと出力する。
【0055】
次に、ステップS511からステップS512までの再検索処理についての説明を行う。まず、ステップS511でフィードバック検索部119は、ステップS501で指定された検索範囲の画像の特徴量を照合対象に設定する。そして、ステップS512でフィードバック検索部119は、直前のリランキング処理で算出した(つまり、直前のステップS508で算出した)重みベクトルを用いて作成した類似度算出方式を用いて、クエリ特徴量と照合対象との特徴量の類似度を算出する。次に、処理はステップS504に戻る。フィードバック検索部119は、S509で算出した類似度が高い特徴量を、上位所定数件分(例えば50件)選択し、及び選択された特徴量に対応するサムネイル画像を表示部110に出力する。
【0056】
なお、算出部124が利用可能な重み計算方法は、前述の式(1)~(4)に限定されるものではない。算出部124は、式(1)においては、例えば、クエリと不正解との差分の絶対値ではなく差分の割合を利用してもよく、又は算出される重みを0又は1の2値にしてもよい。重みを2値にした場合では、重みが0の次元については類似度に全く寄与しなくなるため、次元削減の効果がある。つまり、計算量を削減することができる。
【0057】
また、ステップS503において通常検索部117は、リランキング結果として出力される所定件数(例えば1000件)よりも多くの件数(例えば5000件)の特徴量及びサムネイル画像を、RAM107上に保存してもよい。そのような場合、リランキング部123は、RAM上に保存したすべての特徴量を用いてリランキングを行い、及び、上述のリランキング結果として出力する所定件数のみのサムネイル画像を表示部に表示してもよい。このような処理によれば、リランキングと再検索との間の誤差が小さくなるため、リランキングの精度を向上させることができる。ここで、通常検索部117がRAM107上に保存する特徴量及びサムネイル画像の件数は特に限定されない。通常検索部117は、例えば、リランキング結果として所定件数の画像が出力される場合には、その所定件数の定数倍(N倍)(N>1)の件数の特徴量を、リランキング対象の特徴量としてRAM107上に保存してもよい。また例えば、通常検索部117は、所定閾値よりも類似度が高くなる照合対象がリランキング結果として出力される場合には、その所定閾値の定数倍(K倍)(K<1)よりも類似度が高くなる照合対象をRAM107上に保存してもよい。
【0058】
このような構成によれば、ユーザによってフィードバックが指定された場合に、直前の検索結果の上位のみをリランキング及び表示することにより、フィードバックの効果を早急に確認することができる。さらに、フィードバックの有効性が確認できたと判断された時に再検索の指示がなされることにより、処理時間を要する再検索の実施回数を抑制することができる。したがって、ユーザのフィードバックによる検索の利便性を向上させることができる。
【0059】
[実施形態2]
以下、実施形態2に係る画像検索装置についての説明を行う。実施形態1に係る画像検索装置は、フィードバックの効果をユーザが確認し、及び、フィードバックの有効性が確認できたと判断された場合には、ユーザが再検索を指示するように構成されている。しかしながら、リランキング結果の上位を確認しただけでは、フィードバックの効果が充分には確認できない場合がある。例えば、通常検索部117による検索結果の上位に既に正解画像が集まっていて、ユーザによるフィードバックを与えたリランキング(再検索)を実行しても上位の結果が変わらない場合などである。
【0060】
そのような観点から、本実施形態に係る画像検索装置においては、結果評価部827が、フィードバックの有効性を評価する。つまり、再検索を実施するための充分なフィードバックが与えられたかどうかを評価する。特に本実施形態においては、結果評価部827は、リランキング結果を評価することにより、再検索に有効なフィードバックが与えられたかどうかを評価することができる。結果評価部827は、有効なフィードバックが与えられたと判断した場合には、例えば、再検索ボタンを目立つ表示にする又は再検索ボタンをアクティブにするなどにより、ユーザに再検索の実施を提案するように構成されていてもよい。有効なフィードバックが与えられたことを確認した後にユーザが再検索を実施することにより、無用な再検索の実施を抑制することが可能となる。したがって、ユーザのフィードバックによる検索の利便性を向上させることができる。
【0061】
図8(A)は、本実施形態に係る画像検索装置のハードウェア構成の一例を示すブロック図である。図8(A)に示される画像検索装置は、ROM102に評価部826が格納されていることを除いて図1(A)と同様の構成を有するため、重複する説明は省略する。また、図8(B)は本実施形態に係る画像検索装置820が行う情報処理のデータフローの一例を示すブロック図であり、評価部826として結果評価部827を有することを除き図1(B)と同様の構成を有するため、重複する説明は省略する。本実施形態においては、結果評価部827がリランキング結果125を評価することにより、再検索に有効なフィードバックが与えられたかどうかを評価する。
【0062】
図9は、本実施形態に係る画像検索装置820が行う特徴量検索処理の一例を示したフローチャートである。図9に示される例においては、画像検索装置820は、類似度算出後にフィードバックの有効性を評価するステップS914を行うことを除き、実施形態1の図5と同様の処理を行う。
【0063】
ステップS914においては、結果評価部827がフィードバックの有効性を評価する。結果評価部827は、例えば、各リランキング対象について、検索時とリランキング後との配列の関係に基づいてフィードバックが有効であるかどうかを判断してもよい。また例えば、結果評価部827は、各リランキング対象について、検索時とリランキング後との類似度の関係に基づいてフィードバックが有効であるかどうかを判断してもよい。さらに例えば、結果評価部827は、リランキング対象の検索時の(つまり、リランキング前の)類似度の分布とリランキング後の上位の結果の検索時の類似度の分布との関係に基づいてフィードバックが有効であるかどうかを判断してもよい。以下、上記3つの方法についてそれぞれ説明を行う。
【0064】
[1.検索時とリランキング後との配列の関係に基づいて判断を行う方法]
リランキング対象の検索時とリランキング後との各検索結果の順位の変動があった場合には、前回の検索では検出できなかった画像との順位の入れ替えが発生し得る。再検索により前回の検索で検出できなかった画像が検出できた時、順位の変動が小さい場合には検索結果の下位に現れる程度であることが推測されるが、順位の変動が大きい場合には再検索結果の上位に現れる可能性がある。したがって、この例においては、結果評価部827は、リランキング対象の検索時とリランキング後との順位の変動量が所定閾値を超えた場合に再検索に有効なフィードバックが与えられたと判断する。
【0065】
検索時とリランキング後との順位の変動量diff_rankの算出方法の一例として、結果評価部827は、リランキング対象の検索時の順位をi、及びリランキング後の順位のrerankとした場合に、下記の式(6)を用いることができる。
【数6】
【0066】
ここで、結果評価部827は、順位の変動量を算出するために、すべての順位の差の絶対値を足し合わせているが、特にこの方法に限定されるわけではない。例えば、結果評価部827は、順位が上がったリランキング対象のみ、又は順位が下がったリランキング対象のみについて、式(6)に示されるように差の絶対値を足し合わせてもよい。また例えば、結果評価部827は、検索時の順位が上位であるリランキング対象のみ、又はリランキング後の順位が上位であるリランキング対象のみを用いてもよい。さらに例えば、リランキング前後での差が大きいリランキング対象のみ(例えば差が最大となるリランキング対象のみ)を用いるようにしてもよい。また、式(6)においては差の絶対和を算出しているが、代わりに差の二乗和を算出するようにしてもよい。
【0067】
そして、結果評価部827は、算出されたdiff_rankが所定閾値よりも大きくなった時に、有効なフィードバックが与えられたと判断する。ここで所定閾値として設定される値は特に限定されない。所定閾値の値は、例えば予め所望の値に設定されていてもよく、又はdiff_rankがリランキング対象の数に依存するという観点から、リランキング対象の数に基づいて動的に決定されてもよい。
【0068】
[2.検索時とリランキング後との類似度の関係に基づいて判断を行う方法]
リランキングにより各リランキング対象の類似度の変動があった場合には、再検索を行うことで、前回の検索では検出できなかった画像の類似度も変動することにより、順位の入れ替えが発生する可能性がある。したがって、この例においては、結果評価部827は、検索時とリランキング後との類似度の変動量が所定閾値を超えた時に、有効なフィードバックが与えられたと判断する。
【0069】
検索時とリランキング後との類似度の変動量diffsimの算出方法の一例として、結果評価部827は、下記の式(7)を用いることができる。ここで、リランキング対象の検索時の類似度をsim_search、及びリランキング後の類似度を時sim_rerankとする。
【数7】
【0070】
ここでは、結果評価部827は、リランキング前後で類似度の上昇が最も大きいものと類似度の下降が最も大きいものとを抽出し、及び、それらの差を類似度の変動量diffsimとしているが、類似度の変動量の算出方法は特にこれには限定されない。例えば、結果評価部827は、類似度の差の絶対値が最大のものを類似度の変動量としてもよい。また、結果評価部827は、類似度の差の大きい方から所定個数の類似度を用いて上記式(7)の計算を行うことにより類似度の算出を行ってもよい。
【0071】
そして、結果評価部827は、算出されたdiffsimが所定閾値よりも大きくなった場合に、有効なフィードバックが与えられたと判断する。ここで所定閾値として設定される値は特に限定されない。所定閾値の値は、例えば予め所望の値に設定されていてもよく、又はdiffsimが検索時の類似度及びリランキング後の類似度に依存するという観点から、それらの値に基づいて動的に決定されてもよい。
【0072】
[3.リランキング対象の検索時の類似度の分布とリランキング後の上位の結果の検索時の類似度の分布との関係に基づいて判断を行う方法]
リランキング結果の上位の一部は、再検索結果の上位にも含まれている可能性が高い。例えば、再検索結果の上位100件がすべてリランキング対象に含まれている場合には、リランキング結果の上位100件が再検索結果の上位100件と一致することは自明である。つまり、再検索を行っても、その再検索結果はリランキング結果と変わらないことになる。リランキング結果の上位と再検索結果の上位とで何件が一致するのかは、どのようなフィードバックが与えられたかに依存する。
【0073】
この例においては、結果評価部827は、リランキング対象の検索時の類似度の分布とリランキング後の上位の結果の検索時の類似度の分布との関係が所定の関係を満たす場合に、有効なフィードバックが与えられたと判断する。例えば、結果評価部827は、上述の所定の関係として、リランキング後の上位の結果の検索時の類似度の分布が、リランキング対象の検索時の類似度の分布の十分に内側に存在しているかどうかを評価する。十分に内側に収まっている場合には、リランキング後の上位の結果は、再検索を行っても大きく変動しない可能性が高い。つまり、有効なフィードバックが与えられていない可能性が高い。
【0074】
本実施形態に係る通常検索部117は、ユーザに提示するリランキング結果の件数よりも多くの件数の検索結果122を取得し、及びリランキング部123はその取得した検索結果122に対してリランキングを行ってもよい。つまり、例えば検索結果又はリランキング結果を1000件取得したい場合においても、内部的には通常検索部117は上位5000件の検索結果を保持しておき、及び、リランキング部123その5000件を対象にリランキングを行ってもよい。そのような場合においては、結果評価部827は、リランキングを行った中の上位1000件の類似度の分布に基づいて、有効なフィードバックが与えられたかどうかを判断する。
【0075】
図10は、特徴空間におけるリランキング対象の検索時の類似度の分布とリランキング後の上位の結果の検索時の類似度の分布との関係を説明するための図である。特徴量の次元数は特に限定されず、実際には3次元以上であることが想定されるが、ここでは説明のため2次元として表現される。図10(A)の1001はクエリ画像の特徴量である。なお、上述のように、クエリ画像の特徴量との距離が近い点ほど類似度が高くなる。正円1002は、リランキング対象(例えば検索結果の上位5000件)の特徴量の範囲であるリランキング範囲であり、及び、重みベクトルwが次元ごとに異なる重みを有していない場合は、クエリ画像1001を中心とした正円となる。楕円1003は、リランキング後の上位の結果(例えばリランキング結果の上位1000件)の特徴量を同じ特徴空間にマッピングした例であり、及び、重みベクトルwが次元ごとの重みを有しているため、クエリ画像1001を中心とした楕円となる。
【0076】
ここで、結果評価部827は、リランキング後の上位の結果の特徴量のうち、類似度が最小値となる特徴量を取得する。図10(A)の例においては、上述の特徴量は1004であるとする。次いで、結果評価部827は、リランキング後の類似度が1004と同じ値になる特徴量のうちの、検索時の類似度が最小となる特徴量の値を取得する。すなわち、楕円1003の周上で、クエリ画像1001から最も離れた特徴量1005及び1006の値を取得する。この特徴量は、特徴空間の楕円1003上で類似度が最小となる点を、類似度演算式を用いて算術的に取得した特徴量であるので、必ずしもリランキング対象として存在するとは限らない。さらに、結果評価部827は、1005及び1006の特徴量の検索時の類似度を求め、及びその値をmin_resultとする。
【0077】
次に、結果評価部827は、リランキング対象の特徴量の検索時の類似度の最小値min_rerankを取得する。図10(A)の例においては、結果評価部827は、正円1002の円周上の特徴量1007を取得する。min_resultがmin_rerankよりも大きい場合は、図10(A)のように、楕円1003は正円1002に接することなく内部に存在することになる。この時、リランキング後の上位の結果はリランキング範囲内に収まっていることが保証される。したがって、リランキング範囲外を含めた再検索を実施したとしても、すなわち、正円1002よりも広い範囲を検索対象としたとしても、再検索結果は楕円1003のまま変わらない。
【0078】
一方で、min_resultがmin_rerank以下となる場合の一例が図10(B)に示されている。楕円1009は、リランキング後の上位の結果(例えばリランキング結果の上位1000件)の特徴量を同じ特徴空間にマッピングした例であり、及び、正円1002は図10(A)と同様である。図10(B)の例においては、リランキング後の上位の結果の特徴量のうちの類似度が最小となる特徴量は、楕円1009上の特徴量1008であるとする。また、リランキング後の類似度が1008と同じ値になる特徴量のうちの検索時の類似度が最小となる特徴量は、特徴量1010及び1011であり、並びに、これらの類似度の値がmin_resultとなる。結果評価部827は、このmin_resultと、上述のmin_rerank(つまり、特徴量1007)とを取得する。min_resultがmin_rerankより小さくなる場合には、図10(B)のように、楕円1009は正円1002をはみ出している。この時、正円1002からはみ出した領域に存在する点1012は、リランキングでは検出されないが、リランキング範囲外を含めた再検索時には検出されることが推測される特徴量である。したがって、結果評価部827は、このような場合に再検索に有効なフィードバックが与えられたと判断することができる。
【0079】
また、min_resultと同値の結果の全てがリランキング範囲に入っているとは限らない(すなわち、正円1002上の特徴量が必ずしもリランキング対象として存在するとは限らない)。したがって、min_resultとmin_rerankが等しい場合も、再検索により新たな特徴量が検出される可能性がある。したがって、結果評価部827は、そのような場合にも再検索に必要なフィードバックが与えられたと判断してもよい。さらに、結果評価部827は、min_rerankからmin_resultを引いた差分が所定閾値以上である時に、再検索に必要なフィードバックが与えられたと判断してもよい。つまり、10(B)の例では、楕円1009が正円1002から充分にはみ出している時に、再検索に必要なフィードバックが与えられたと判断してもよい。ここでの閾値は特に限定されず、適宜所望の値として設定されてもよい。
【0080】
また、検索を高速に実現するために、クラスタリングなどにより分類されたインデクスを用いる場合があり、及び、そのような場合は、min_rerankよりも類似度が高い結果がリランキング範囲に入っていない時もある。したがって、結果評価部827は、min_resultとmin_rerankを直接比較するのではなく、min_rerankに1よりも大きい係数をかけ合わせてから比較するようにしてもよい。
【0081】
図11は、本実施形態に係る結果評価部827が類似度の分布を評価する処理の一例を示すフローチャートである。まず、ステップS1101で結果評価部827は、リランキング結果の上位N件(例えば1000件)のうちの最小の類似度を取得する。これは、図10(A)における特徴量1004の類似度であり、また図10(B)においては特徴量1008の類似度である。ステップS1102で結果評価部827は、リランキング後の類似度がステップS1101で取得した類似度と同値になる特徴空間上の点の中で、検索時の類似度が最小となる点の類似度を取得し、及びここで取得した類似度をmin_resultとする。これは、図10(A)における特徴量1005及び1006の類似度、また図10(B)における特徴量1010及び1011の類似度である。ステップS1103で結果評価部827は、リランキング範囲(例えば5000件)の検索時での最小の類似度を取得し、及びここで取得した類似度をmin_rerankとする。これは図10(A)及び図10(B)における特徴量1007の類似度である。
【0082】
次いで、ステップS1103で結果評価部827は、min_rerankとmin_resultとを比較する。min_resultがmin_rerankよりも大きい場合は、すなわち、例えば図10(A)に示されるような状態である場合は、処理はステップS1105へと進む。ステップS1105で結果評価部827は、再検索は不要と判断し、及び本フローを終了する。一方で、min_resultがmin_rerank以下である場合は、すなわち、例えば図10(B)に示されるような状態である場合は、処理はステップS1106へと進む。ステップS1106で結果評価部827は、再検索に有効なフィードバックが与えられたと判断し、及び本フローを終了する。
【0083】
図11の例においては、リランキング結果1000件に基づくmin_resultと、リランキング範囲5000件に基づくmin_rerankと、が比較されている。しかし、min_resultの取得の過程は上述のようには限らず、例えば、結果評価部827は、表示しているページに応じて、min_resultを取得しなおすようにしてもよい。すなわち、各ページ50件の結果を表示できる装置で1ページ目のみを閲覧している場合はリランキング結果50件のみに基づいて、又は2ページ目までを閲覧した場合はリランキング結果100件に基づいてmin_resultを取得してもよい。そのような場合、min_resultはページを送るたびに小さくなっていく。結果評価部827は、min_resultがmin_rerank以下になった時に再検索ボタンを目立つ表示に変えてもよい。また、そのmin_resultがmin_rerank以下になった時に再検索を行った場合、閲覧していた直前のページまでの再検索結果はリランキング結果と変わらないことが推測される。したがって、そのような場合、結果評価部827は、閲覧していたページからリランキング結果の表示を開始してもよい。
【0084】
結果評価部827は、上記3つの方法のうちの1つを実施することにより評価を行ってもよく、これらのうちの複数を実施することにより総合的な評価を行ってもよい。例えば、1つ目の順位の変動量で判断する方法では、最初の検索結果が特徴空間上で偏りがある場合に正しく機能しないことがある。すなわち、検索結果の上位の順位の変動は小さいが、それらの類似度の変動は大きくなりやすい場合では、1つ目の方法は正しく機能しないことがある。このような場合においては、2つ目の類似度の変動量で判断する方法が有効となる。逆に、順位が変わっても類似度はあまり変わらない場合もある。そのような場合においては、1つ目の方法が有効となる。また、結果評価部827は、1つ目の方法及び2つ目の方法のどちらかの条件がそろった場合に、再検索に有効なフィードバックが与えられたと判断してもよい。
【0085】
3つ目の類似度の分布を用いる方法は、リランキング後の順位が再検索の順位と同じであることを保証することが可能な方法である。結果評価部827は、リランキング後の順位が再検索の順位と同じであることが保証できなくなった時に、1つ目の方法及び二つ目の方法と併用してもよい。
【0086】
本実施形態に係る結果評価部827は、リランキング結果を評価することで、再検索に有効なフィードバックが与えられたかどうかを判断する。結果評価部827は、有効なフィードバックが与えられたと判断したときに、その有効性の提示を行ってもよい。例えば、結果評価部827は、有効性の提示を行うために、再検索ボタンを目立つ表示にしてもよく、再検索ボタンをアクティブにしてもよい。また、結果評価部827は、バー表示などのデータを視覚化した形で有効性の度合いを表示してもよい。ユーザは、結果評価部による有効性の提示を確認した後に再検索を実施することにより、無用な再検索の実施を抑制することが可能となる。
【0087】
このような構成によれば、リランキング結果を目視確認するだけではフィードバックの有効性を評価できない場合であっても、結果評価部827による評価に基づいて、ユーザのフィードバックの効果を確認することができる。したがって、ユーザのフィードバックによる検索の利便性を向上させることができる。
【0088】
なお、本実施形態に係る画像検索装置820は、フィードバックの効果を判断するための構成を有するため、リランキング結果125をユーザに確認させるために表示部110に表示することは特に必須ではない。また、ユーザが再検索ボタンの表示などを確認してから再検索を実施する指示を出してもよく、画像検索装置820が、フィードバックが有効であると判断した時に再検索を自動で実施するように構成されていてもよい。さらに、画像検索装置820は、フィードバックが有効であると判断した場合に、バックグラウンドで再検索を実施しておき、及び、ユーザによる再検索指示を取得した時に再検索結果を表示することにより、体感的な返答時間を削減するように構成されていてもよい。
【0089】
[実施形態3]
以下、実施形態3に係る画像検索装置についての説明を行う。実施形態3に係る画像検索装置は、実施形態2に係る画像検索装置は、リランキング結果を評価することにより、再検索に有効なフィードバックが与えられたかどうかを判断した。本実施形態に係る画像検索装置は、類似度を算出するために用いられる評価パラメータに基づいて、フィードバックの有効性を評価する。すなわち、類似度算出方式を評価することにより、再検索に有効なフィードバックが与えられたかどうかを判断することができる。したがって、本実施形態に係る画像検索装置は、リランキングを行うことなく、類似度がどのように変わるかにより、フィードバックの有効性の評価を行うことが可能である。
【0090】
実施形態1及び実施形態2に係るリランキング部123は、検索結果の中から正解又は不正解の画像をユーザが指定することにより、フィードバック情報を取得した。次いで、リランキング部123はフィードバック情報とクエリ画像との特徴量の共通性に基づいて類似度算出方式を作成した。本実施形態に係る画像検索装置が用いる正解又は不正解の画像は、検索結果の中から選択されるのではなく、手持ち画像の中から提供される。つまり、例えば見た目が似ていない正解画像、又は見た目が似ている不正解画像を予め与えられることにより、本実施形態に係る画像検索装置は、その画像とクエリ画像との特徴量の共通性に基づいた類似度算出方式を作成することができる。したがって、ここで作成した類似度算出方式を用いることにより、初回の検索から、特徴のある箇所を強調した検索を実施することができる。
【0091】
本実施形態に係る画像検索装置のハードウェア構成の一例は、図8(A)と同様である。図12は、本実施形態に係る画像検索装置が行う情報処理のデータフローの一例を示すブロック図である。図12は、リランキング部123及びリランキング結果125が削除され、並びに、評価部826として、結果評価部827の代わりに方式評価部1228を有していることを除き、図8(B)と同様の構成を有するため、重複する説明は省略する。本実施形態においては、方式評価部1228が、類似度算出方式を評価することにより、再検索に有効なフィードバックが与えられたかどうかを評価する。つまり、実施形態1及び実施形態2で実行されていたリランキング処理は不要である。
【0092】
図13は、本実施形態に係る画像検索装置が行う特徴量検索処理の一例を示すフローチャートである。図13においては、ステップS914の代わりにステップS1316が実行されることを除き図9と同様の処理を行うため、重複する説明は省略する。以下、ステップS1316で行われる評価方法の一例についての説明を行う。
【0093】
S508で作成された重みベクトルの次元ごとの重みのばらつきが大きい場合は、類似度に変動があると考えられ、及び、前回の検索では検出できなかった画像の類似度も変わってくると考えられる。したがって、方式評価部1228は、そのような場合において、再検索に有効なフィードバックが与えられたと判断する。
【0094】
ステップS1316において方式評価部1228は、重みベクトルの次元ごとの重みのばらつきdiff_weightを算出する方法の一例として、下記の式(8)を用いることができる。ここで、重みベクトルについて、各次元の重みをwとし、及び各次元の重みの平均のw重みベクトルの次元ごとの重みのばらつきをw’とする。式(8)においては、重みのばらつきとして各次元の重みの偏差平方和を算出しているが、各次元の重みの最大の値が重みのばらつきとされてもよい。
【数8】
【0095】
方式評価部1228は、例えば、diff_weightが所定閾値よりも大きくなった場合に、有効なフィードバックが与えられたと判断することができる。また、方式評価部1228は、次元ごとに重みが所定閾値を超えているかを判定し、及び、所定閾値を超えている次元の数に基づいて、有効なフィードバックが与えられたどうかを評価してもよい。ここで、所定閾値とされる値はそれぞれ予め与えられているものとするが、それらの値は特に限定はされない。
【0096】
なお、本実施形態に係る画像検索装置は、次元ごとの重みを用いて有効なフィードバックが与えられたかどうかを判断する場合においては、リランキングを行う必要はない。したがって、ステップS508の後に上述の判断を行うことが可能である。方式評価部1228は、有効なフィードバックが与えられたと判断したときに、その有効性の提示を、実施形態2における結果評価部827と同様に行ってもよい。つまり、ステップS1316での判断に基づいて、再検索ボタンを目立つ表示にしたり、又は再検索ボタンをアクティブにしたりすることができる。
【0097】
本実施形態では、予め与えられた正解又は不正解の画像に基づく類似度算出方式を用いることにより、初回の検索から特徴のある箇所を強調した検索が行われた。一方で、実施形態1,2と同様に、正解又は不正解の画像は予め与えられていなくてもよい。この場合において、初回の検索においては、上述のように予め定められた類似度算出方式を用いることができ、例えば、初期状態の重みベクトルを用いることができる。初期状態の重みベクトルは、予め与えられており、その値は特に限定はされない。具体例として、初期状態の重みベクトルの各要素は等しい値(例えばw=1)を有していてもよい。このような場合、方式評価部1228は、重み係数がフラットでなくなった場合に、再検索に有効なフィードバックが与えられたと判断してもよい。例えば、方式評価部1228は、ステップS508で得られた各次元の重み係数の分散が所定閾値を超えた場合に、再検索に有効なフィードバックが与えられたと判断してもよい。ここで所定閾値とされる値は予め与えられているものとするが、それらの値は特に限定はされない。
【0098】
このような構成によれば、類似度算出方式を評価することにより、再検索に有効なフィードバックが与えられたかどうかを判断することができる。したがって、リランキングを行うことなく、類似度がどのように変わるかによる評価により、無用な再検索の実施を抑制することが可能となる。
【0099】
また、本実施形態に係る画像検索装置は、実施形態2に記載される評価方法を用いて評価を行うようにしてもよい。つまり、リランキング結果の評価と、類似度算出方式の評価と、を併用することにより、有効なフィードバックが与えられたかどうかを判断してもよい。
【0100】
(その他の実施形態)
上述の実施形態においては、人物領域から抽出した特徴量が例として用いられているが、特にこれに限定するものではない。例えば、人物画像から年齢及び性別などの属性が推測され、並びにそれらの属性を用いた検索において、本手法が用いられてもよい。すなわち、クエリ画像と正解又は不正解画像との属性の共通性に基づいて類似度算出方式が変更されてもよい。
【0101】
本発明は、上述の実施形態の1以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける1つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、1以上の機能を実現する回路(例えば、ASIC)によっても実現可能である。
【0102】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0103】
101:CPU、102:ROM、103:オブジェクト抽出部、104:特徴量抽出部、105:登録部、106:特徴量検索部、107:RAM、108:記憶部、109:入力部、110:表示部、111:通信部、124:算出部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13