特許7208955 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7208955情報処理装置、情報処理方法、情報処理プログラム、情報検索装置、情報検索方法、及び情報検索プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-01-11

(45)【発行日】2023-01-19

(54)【発明の名称】情報処理装置、情報処理方法、情報処理プログラム、情報検索装置、情報検索方法、及び情報検索プログラム

(51)【国際特許分類】

G06F 16/245 20190101AFI20230112BHJP

G06F 16/28 20190101ALI20230112BHJP

【ＦＩ】

G06F16/245

G06F16/28

【請求項の数】 24

(21)【出願番号】P 2020133955

(22)【出願日】2020-08-06

(65)【公開番号】P2022030165

(43)【公開日】2022-02-18

【審査請求日】2021-08-19

【新規性喪失の例外の表示】特許法第３０条第２項適用公開日令和２年３月２５日令和２年８月７日時点における本願に関連するソフトウェアを公開するページｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｙａｈｏｏｊａｐａｎ／ＮＧＴ／ｒｅｌｅａｓｅｓ／ｔａｇ／ｖ１．１０．０

(73)【特許権者】

【識別番号】319013263

【氏名又は名称】ヤフー株式会社

(74)【代理人】

【識別番号】110002147

【氏名又は名称】弁理士法人酒井国際特許事務所

(72)【発明者】

【氏名】岩崎雅二郎

【審査官】三橋竜太郎

(56)【参考文献】

【文献】特開２０１９－１９４８１５（ＪＰ，Ａ）

【文献】特開２０１７－１３４５８２（ＪＰ，Ａ）

【文献】岩崎雅二郎，外１名，「木構造型インデックスを用いた近似ｋ最近傍グラフによる近傍検索」，情報処理学会論文誌論文誌ジャーナル，日本，一般社団法人情報処理学会，2011年02月15日，第52巻Ｖｏｌ．５２Ｎｏ．２，p.817-828

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

(57)【特許請求の範囲】

【請求項1】

複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値であって、前記近似検索を要求するユーザが指定した指定値を、前記ユーザが利用する端末装置から取得し、前記評価指標の値に対応する前記近似検索で用いるパラメータの値を示す変換用情報を記憶部から取得する取得部と、
前記取得部により取得された前記変換用情報に基づいて、前記ユーザが指定した前記指定値を、前記ユーザに結果を提供するための前記近似検索で用いる前記パラメータの値に変換する変換部と、
を備えることを特徴とする情報処理装置。

【請求項2】

前記取得部は、
前記複数のオブジェクトの各々に対応する複数のノードがエッジにより連結されたグラフを前記インデックスとして用いた前記近似検索の前記指定値を取得し、
前記変換部は、
前記評価指標の前記指定値を、前記グラフを用いた前記近似検索で用いる前記パラメータの値に変換する
ことを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記パラメータは、
前記グラフを用いた検索処理における探索範囲を決定するための係数である検索範囲係数である
ことを特徴とする請求項２に記載の情報処理装置。

【請求項4】

前記取得部は、
前記評価指標の各値と前記パラメータの各値との対応関係を示すルックアップテーブルを前記変換用情報として取得し、
前記変換部は、
前記ルックアップテーブルを参照して、前記評価指標の前記指定値を前記近似検索で用いる前記パラメータの値に変換する
ことを特徴とする請求項１～３のいずれか１項に記載の情報処理装置。

【請求項5】

前記インデックスを用いた検索処理を含む生成処理により、前記ルックアップテーブルを生成する生成部、
をさらに備えることを特徴とする請求項４に記載の情報処理装置。

【請求項6】

前記生成部は、
前記複数のオブジェクトから選択された評価用オブジェクトに基づく評価用クエリを用いた前記検索処理を含む前記生成処理により、前記ルックアップテーブルを生成する
ことを特徴とする請求項５に記載の情報処理装置。

【請求項7】

前記生成部は、
前記複数のオブジェクトから選択された複数の評価用オブジェクトを用いて生成される評価用クエリを用いた前記検索処理を含む前記生成処理により、前記ルックアップテーブルを生成する
ことを特徴とする請求項５または請求項６に記載の情報処理装置。

【請求項8】

前記生成部は、
前記複数の評価用オブジェクトの平均を前記評価用クエリとする前記検索処理を含む前記生成処理により、前記ルックアップテーブルを生成する
ことを特徴とする請求項７に記載の情報処理装置。

【請求項9】

前記生成部は、
前記評価用クエリを用いた前記近似検索の結果である近似正解検索結果を生成し、生成した前記近似正解検索結果を用いた前記評価指標を測定する測定処理を含む前記生成処理により、前記ルックアップテーブルを生成する
ことを特徴とする請求項６～８のいずれか１項に記載の情報処理装置。

【請求項10】

前記生成部は、
前記インデックスがグラフである場合、当該グラフを用いた検索処理における探索範囲を決定するための係数である検索範囲係数を調整することにより、前記近似正解検索結果を生成する
ことを特徴とする請求項９に記載の情報処理装置。

【請求項11】

前記生成部は、
前記検索範囲係数の値を第１値から増加させ、前記近似検索の結果に新たなオブジェクトが出現しなくなった時点の第２値を、前記近似正解検索結果を生成する際の前記検索範囲係数の値として用いる
ことを特徴とする請求項１０に記載の情報処理装置。

【請求項12】

前記生成部は、
前記複数のオブジェクトから前記評価用オブジェクトを除いたオブジェクト群を検索対象とする前記インデックスを用いた前記検索処理を含む前記生成処理により、前記ルックアップテーブルを生成する
ことを特徴とする請求項６～１１のいずれか１項に記載の情報処理装置。

【請求項13】

前記生成部は、
前記パラメータの複数の値の各々を用いた前記検索処理により得られた前記評価指標の複数の値の各々を、対応する前記パラメータの複数の値の各々に対応付ける前記生成処理により、前記ルックアップテーブルを生成する
ことを特徴とする請求項５～１２のいずれか１項に記載の情報処理装置。

【請求項14】

前記生成部は、
前記ルックアップテーブルを用いて、前記評価指標の値を入力として、入力された前記評価指標の値に対応する前記パラメータに値を出力する関数を生成する
ことを特徴とする請求項５～１３のいずれか１項に記載の情報処理装置。

【請求項15】

前記取得部は、
前記評価指標の値を入力として、入力された前記評価指標の値に対応する前記パラメータに値を出力する関数を前記変換用情報として取得し、
前記変換部は、
前記評価指標の前記指定値を前記関数に入力することにより、前記評価指標の前記指定値を前記近似検索で用いる前記パラメータの値に変換する
ことを特徴とする請求項１～３のいずれか１項に記載の情報処理装置。

【請求項16】

前記近似検索を、前記変換用情報に基づいて前記評価指標の前記指定値が変換された前記パラメータの値を用いて実行する検索部、
ことを特徴とする請求項１～１５のいずれか１項に記載の情報処理装置。

【請求項17】

前記評価指標は、
前記インデックスを用いた検索処理の検索精度である
ことを特徴とする請求項１～１６のいずれか１項に記載の情報処理装置。

【請求項18】

前記評価指標は、
前記インデックスを用いた検索処理の処理時間である
ことを特徴とする請求項１～１６のいずれか１項に記載の情報処理装置。

【請求項19】

前記複数のオブジェクトの各々は、
電子商取引サービスにおいて取引される取引対象に対応する
ことを特徴とする請求項１～１８のいずれか１項に記載の情報処理装置。

【請求項20】

コンピュータが実行する情報処理方法であって、
複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値であって、前記近似検索を要求するユーザが指定した指定値を、前記ユーザが利用する端末装置から取得し、前記評価指標の値に対応する前記近似検索で用いるパラメータの値を示す変換用情報を記憶部から取得する取得工程と、
前記取得工程により取得された前記変換用情報に基づいて、前記ユーザが指定した前記指定値を、前記ユーザに結果を提供するための前記近似検索で用いる前記パラメータの値に変換する変換工程と、
を含むことを特徴とする情報処理方法。

【請求項21】

複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値であって、前記近似検索を要求するユーザが指定した指定値を、前記ユーザが利用する端末装置から取得し、前記評価指標の値に対応する前記近似検索で用いるパラメータの値を示す変換用情報を記憶部から取得する取得手順と、
前記取得手順により取得された前記変換用情報に基づいて、前記ユーザが指定した前記指定値を、前記ユーザに結果を提供するための前記近似検索で用いる前記パラメータの値に変換する変換手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。

【請求項22】

複数のオブジェクトを検索対象とするインデックスと、前記インデックスを用いた近似検索の評価指標の値を指定する指定値であって、前記近似検索を要求するユーザが指定した指定値とを、前記ユーザが利用する端末装置から取得し、前記評価指標の値に対応する前記近似検索で用いるパラメータの値を示す変換用情報を記憶部から取得する取得部と、
前記ユーザに結果を提供するための前記近似検索を、前記変換用情報に基づいて前記ユーザが指定した前記指定値が変換された前記パラメータの値を用いて実行する検索部と、
を備えることを特徴とする情報検索装置。

【請求項23】

コンピュータが実行する情報検索方法であって、
複数のオブジェクトを検索対象とするインデックスと、前記インデックスを用いた近似検索の評価指標の値を指定する指定値であって、前記近似検索を要求するユーザが指定した指定値とを、前記ユーザが利用する端末装置から取得し、前記評価指標の値に対応する前記近似検索で用いるパラメータの値を示す変換用情報を記憶部から取得する取得工程と、
前記ユーザに結果を提供するための前記近似検索を、前記変換用情報に基づいて前記ユーザが指定した前記指定値が変換された前記パラメータの値を用いて実行する検索工程と、
を含むことを特徴とする情報検索方法。

【請求項24】

複数のオブジェクトを検索対象とするインデックスと、前記インデックスを用いた近似検索の評価指標の値を指定する指定値であって、前記近似検索を要求するユーザが指定した指定値とを、前記ユーザが利用する端末装置から取得し、前記評価指標の値に対応する前記近似検索で用いるパラメータの値を示す変換用情報を記憶部から取得する取得手順と、
前記ユーザに結果を提供するための前記近似検索を、前記変換用情報に基づいて前記評価指標の前記指定値が変換された前記パラメータの値を用いて実行する検索手順と、
をコンピュータに実行させることを特徴とする情報検索プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法、情報処理プログラム、情報検索装置、情報検索方法、及び情報検索プログラムに関する。

【背景技術】

【0002】

従来、様々なインデックスを用いて近似検索を行う技術が提供されている。例えば、有向エッジや無向エッジによってノード間が接続されたグラフインデックスを用いて近似検索を行う技術が提供されている。このような近似検索の技術は、例えば画像検索等に用いられる。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１１－０９０３５１号公報

【文献】特許第５２０８００１号公報

【文献】特許第６２９３３３５号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、上記の従来技術では、適切なパラメータの値を用いた近似検索を行うことが難しい場合がある。例えば、近似検索を行うユーザには通常、所望の検索精度や検索時間等について要求する基準（評価指標）がある。そのため、ユーザが所望する評価指標を満たす近似検索を行うために、パラメータを調整して評価指標を測定する等の試行錯誤を繰り返して、所望の検索精度や検索時間となるパラメータを求めなければならない。このように、ユーザが所望する評価指標を満たすためのパラメータをユーザ自身が求めるにはコストが大きく、また試行錯誤のやり方によっては適切なパラメータが求まらない可能性がある。

【0005】

本願は、上記に鑑みてなされたものであって、適切なパラメータの値を用いた近似検索を可能にする情報処理装置、情報処理方法、情報処理プログラム、情報検索装置、情報検索方法、及び情報検索プログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本願に係る情報処理装置は、複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値と、前記評価指標の値に対応する前記近似検索で用いるパラメータの値を示す変換用情報とを取得する取得部と、前記取得部により取得された前記変換用情報に基づいて、前記評価指標の前記指定値を前記近似検索で用いる前記パラメータの値に変換する変換部と、を備えたことを特徴とする。

【発明の効果】

【0007】

実施形態の一態様によれば、適切なパラメータの値を用いた近似検索を可能にすることができるという効果を奏する。

【図面の簡単な説明】

【0008】

【図1】図１は、実施形態に係る情報処理の一例を示す図である。

【図2】図２は、実施形態に係る情報処理の一例を示す図である。

【図3】図３は、ツリーインデックスの一例を示す図である。

【図4】図４は、実施形態に係る情報処理システムの構成例を示す図である。

【図5】図５は、実施形態に係る情報処理装置の構成例を示す図である。

【図6】図６は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。

【図7】図７は、実施形態に係るツリー情報記憶部の一例を示す図である。

【図8】図８は、実施形態に係るグラフ情報記憶部の一例を示す図である。

【図9】図９は、実施形態に係る近似正解検索結果情報記憶部の一例を示す図である。

【図10】図１０は、実施形態に係る変換用情報記憶部の一例を示す図である。

【図11】図１１は、実施形態に係る情報処理の一例を示すフローチャートである。

【図12】図１２は、実施形態に係る情報処理の一例を示すフローチャートである。

【図13】図１３は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。

【発明を実施するための形態】

【0009】

以下に、本願に係る情報処理装置、情報処理方法、情報処理プログラム、情報検索装置、情報検索方法、及び情報検索プログラムを実施するための形態（以下、「実施形態」と呼ぶ）について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、情報処理プログラム、情報検索装置、情報検索方法、及び情報検索プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。

【0010】

（実施形態）
〔１．情報処理〕
以下では、図１及び図２を用いて、情報処理装置１００が実行する情報処理について説明する。なお、以下では、グラフインデックス（単に「グラフ」ともいう）を用いた近似検索を、インデックスを用いた近似検索の一例として説明するが、インデックスを用いた近似検索は、インデックスを用いた近似検索であれば、どのような近似検索であってもよい。例えば、インデックスを用いた近似検索（単に「近似検索」ともいう）は、直積量子化を利用した近似検索、ハッシュを利用した近似検索、木構造のインデックス（「ツリーインデックス」ともいう）を用いた近似検索等であってもよい。すなわち、近似検索に用いるインデックスは、グラフに限らず、ツリーインデックス、コードブック等の直積量子化を利用した近似検索で用いるインデックス、ハッシュテーブル等のハッシュを利用した近似検索で用いるインデックス等であってもよい。

【0011】

例えば、近似検索とは、検索漏れが生じ得る検索であり、正しい検索結果を近似する検索である。近似検索は、検索クエリ（単に「クエリ」ともいう）に対して、検索対象となる複数のオブジェクトから、そのクエリに近いオブジェクトを検索し、検索漏れが生じ得る近似近傍検索を含む概念である。以下では、クエリとして用いる検索対象オブジェクトに対して、検索対象となる複数のオブジェクトから、その検索対象オブジェクトのベクトルに類似するベクトルのオブジェクトを検索する近似近傍検索を近似検索の一例として示す。

【0012】

また、詳細は後述するが再現率を、インデックスを用いた近似検索の検索精度の一例として説明するが、検索精度は再現率に限らず、検索処理の精度が示すものであればどのような指標であってもよい。なお、評価指標は、検索精度に限らず、検索時間や距離計算回数やノードのアクセス数等、種々の指標が用いられてもよい。また、以下では、検索範囲係数を、近似検索で用いるパラメータの一例として説明するが、パラメータは検索範囲係数に限らず、近似検索で用いるパラメータであれば、グラフの検索時に参照するエッジ数（参照エッジ数）等の様々なパラメータであってもよい。なお、検索範囲係数の詳細については後述する。

【0013】

また、以下では、検索精度と検索範囲係数との対応関係を示すルックアップテーブルを、評価指標の値に対応する近似検索で用いるパラメータの値を示す情報（「変換用情報」ともいう）の一例として示す。なお、変換用情報は、評価指標の値をパラメータの値に変換することができれば、ルックアップテーブルに限らず、評価指標の値を入力として、パラメータの値を出力する関数（近似関数）等の様々な情報であってもよい。

【0014】

〔２－１．生成処理〕
ここから、図１を用いて、変換用情報の一例であるルックアップテーブルを生成する処理（「生成処理」ともいう）について説明する。図１は、実施形態に係る情報処理の一例を示す図である。

【0015】

図１の例では、情報処理装置１００は、オブジェクトＯＢ１、ＯＢ２、ＯＢ３、ＯＢ１０１等の複数のオブジェクトを含むデータセットＤＳ１を用いて、検索精度の値を検索範囲係数の値に変換するルックアップテーブルＴＢ１（図２参照）を生成する。データセットＤＳ１中の各オブジェクトは、ベクトル化され、ベクトル化されたオブジェクト（ベクトル情報）を対象として、後述する検索処理などの各種処理を行う。なお、データセットＤＳ１に含まれ検索対象となる情報（オブジェクト）は、ベクトルとして表現可能であれば、どのような情報であってもよい。なお、以下では、画像情報（単に「画像」ともいう）を対象としたベクトル情報について説明するが、ベクトル情報の対象は、動画情報や音声情報等の他の対象であってもよい。

【0016】

また、情報処理装置１００が用いる情報は、ベクトルに限らず、各対象の類似性を表現可能な情報であれば、どのような形式の情報であってもよい。例えば、情報処理装置１００は、各対象に対応する所定のデータや値を用いて対象をグラフ構造化したグラフ情報を用いてもよい。例えば、情報処理装置１００は、各対象から生成された所定の数値（例えば２進数の値や１６進数の値）を用いて対象をグラフ構造化したグラフ情報を用いてもよい。例えば、ベクトルに代えて、データ間の距離（類似度）が定義されていれば任意の形態のデータであっても良い。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図６参照）からデータセットＤＳ１を取得する。

【0017】

まず、情報処理装置１００は、評価用クエリを決定する（ステップＳ１）。情報処理装置１００は、与えられたデータセットからクエリオブジェクトセットを生成する。情報処理装置１００は、データセットからランダムに選択したオブジェクト、または、ランダムに選択した二つ以上のオブジェクトの平均値を、クエリオブジェクト（評価用クエリ）に決定する。これにより、情報処理装置１００は、データセットに含まれないオブジェクトを評価用クエリとすることができる。

【0018】

図１の例では、情報処理装置１００は、データセットＤＳ１から評価用クエリの生成に用いるオブジェクトを選択する。例えば、情報処理装置１００は、データセットＤＳ１からランダムに二つ以上の所定数のオブジェクトを評価用オブジェクトとして選択する。情報処理装置１００は、データセットＤＳ１からオブジェクトＯＢ５００とオブジェクトＯＢ１０００との２つのオブジェクトを評価用オブジェクトとして選択する。そして、情報処理装置１００は、オブジェクトＯＢ５００とオブジェクトＯＢ１０００との平均である「７，３５，１３，９３．．．」の多次元のベクトル情報を生成する。このように、図１の例では、情報処理装置１００は、評価用クエリＲＱ１に示すように、オブジェクトＯＢ５００とオブジェクトＯＢ１０００とに基づいて、クエリＱＥ１を生成する。これにより、情報処理装置１００は、「７，３５，１３，９３．．．」の多次元のベクトル情報であるクエリＱＥ１を評価用クエリに決定する。

【0019】

なお、上記は一例であり、情報処理装置１００は、種々の情報を適宜用いて、評価用クエリを決定してもよい。情報処理装置１００は、近傍の複数点の平均を評価用クエリとしてもよい。情報処理装置１００は、二つより多い、例えば三つのオブジェクトの平均値を、クエリオブジェクト（評価用クエリ）に決定してもよい。平均値を求める複数のオブジェクトは、ランダムに選択した一つのオブジェクトと、そのオブジェクトに対して距離が近いオブジェクトを一つ以上選択したオブジェクトとしてもよい。

【0020】

また、情報処理装置１００は、データセットＤＳ１から選択した１つのオブジェクト（選択オブジェクト）と、その選択オブジェクト以外のオブジェクトとを用いて、クエリオブジェクト（評価用クエリ）を生成してもよい。生成済みのグラフがある場合、情報処理装置１００は、選択オブジェクトに対応するノード（選択ノード）と、その選択ノードからのエッジが接続されたノードに対応するオブジェクトとを用いて、評価用クエリを生成してもよい。例えば、情報処理装置１００は、選択オブジェクトに対応するノード（選択ノード）と、その選択ノードからのエッジが接続されたノードに対応するオブジェクト（接続オブジェクト）とを用いて、評価用クエリを生成してもよい。例えば、情報処理装置１００は、選択オブジェクトと、接続オブジェクトのうち最も近いオブジェクトとの平均値を、評価用クエリに決定してもよい。例えば、情報処理装置１００は、選択オブジェクトと、接続オブジェクトのうち最も遠いオブジェクトとの平均値を、評価用クエリに決定してもよい。例えば、情報処理装置１００は、選択オブジェクトと、全接続オブジェクトとの平均値を、評価用クエリに決定してもよい。なお、情報処理装置１００は、選択オブジェクトをランダムに選択してもよいし、所定の基準を基に選択してもよい。

【0021】

また、例えば、情報処理装置１００は、後述するグラフ生成にデータセットのうち一部のオブジェクトが用いられる場合、データセットのうちグラフに含まれないオブジェクトを評価用クエリとして用いてもよい。情報処理装置１００は、グラフ（インデックス）に登録しないオブジェクトを用意して評価用クエリとして用いてもよい。情報処理装置１００は、生成したグラフから、一部のオブジェクトに対応するノードを削除して、削除したノードに対応するオブジェクトを評価用クエリとして用いてもよい。また、各次元ごとに、そのデータ分布に従ったランダムデータを生成した上で、ベクトルを生成しても良い。

【0022】

そして、情報処理装置１００は、グラフを生成する（ステップＳ２）。情報処理装置１００は、与えられたデータセットのすべて、または、一部のデータに対してグラフを作成する。例えば、情報処理装置１００は、データセットＤＳ１中の全オブジェクトを用いて、グラフを生成してもよいし、データセットＤＳ１のうち一部のオブジェクトを用いて、グラフを生成してもよい。上述したように、情報処理装置１００は、データセットＤＳ１のうち、評価用オブジェクトとして用いるオブジェクトを除く、オブジェクト群を用いて、グラフを生成してもよい。情報処理装置１００は、評価用オブジェクトとして用いるデータセットＤＳ１のうち、オブジェクトＯＢ５００とオブジェクトＯＢ１０００を除いたオブジェクト群を用いて、グラフを生成してもよい。

【0023】

図１の例では、情報処理装置１００は、データセットＤＳ１中の全オブジェクトを用いて、グラフＧＲ１１を生成する。情報処理装置１００は、グラフ生成に関する種々の技術を適宜用いて、グラフＧＲ１１を生成する。ここで、グラフＧＲ１１について説明する。図１に示すグラフＧＲ１１は、データセットＤＳ１に含まれる各オブジェクトに対応するノードが有向エッジで連結されたグラフ情報を示す。なお、図１中のグラフＧＲ１１に示すようなグラフ情報は、情報処理装置１００が生成する場合に限らず、情報処理装置１００は、図１中のグラフＧＲ１１に示すようなグラフ情報を情報提供装置５０（図４参照）等の他の外部装置から取得してもよい。

【0024】

また、ここでいう、有向エッジとは、一方向にしかデータを辿れないエッジを意味する。以下では、エッジにより辿る元、すなわち始点となるノードを参照元とし、エッジにより辿る先、すなわち終点となるノードを参照先とする。例えば、所定のノード「Ａ」から所定のノード「Ｂ」に連結される有向エッジとは、参照元をノード「Ａ」とし、参照先をノード「Ｂ」とするエッジであることを示す。なお、各ノードを連結するエッジは、有向エッジに限らず、種々のエッジであってもよい。例えば、各ノードを連結するエッジは、ノードを連結する方向のないエッジであってもよい。例えば、各ノードを連結するエッジは、相互に参照可能なエッジであってもよい。例えば、各ノードを連結するエッジは、全て無向エッジ（双方向エッジ）であってもよい。

【0025】

例えば、このようにノード「Ａ」を参照元とするエッジをノード「Ａ」の出力エッジという。また、例えば、このようにノード「Ｂ」を参照先とするエッジをノード「Ｂ」の入力エッジという。すなわち、ここでいう出力エッジ及び入力エッジとは、一の有向エッジをその有向エッジが連結する２個のノードのうち、いずれのノードを中心として捉えるかの相違であり、一の有向エッジが出力エッジ及び入力エッジになる。すなわち、出力エッジ及び入力エッジは、相対的な概念であって、一の有向エッジについて、参照元となるノードを中心として捉えた場合に出力エッジとなり、参照先となるノードを中心として捉えた場合に入力エッジとなる。なお、本実施形態においては、エッジについては、出力エッジや入力エッジ等の有向エッジを対象とするため、以下では、有向エッジを単に「エッジ」と記載する場合がある。また、ここでいう、各ノードは、各オブジェクトに対応する。例えば、画像から抽出された複数の局所特徴量のそれぞれがオブジェクトであってもよい。また、例えば、オブジェクト間の距離が定義された種々のデータがオブジェクトであってもよい。

【0026】

また、図１中のグラフＧＲ１１には、データセットＤＳ１中の多数のオブジェクト（ノード）が含まれるが、図面においてはその一部のみを図示する。例えば、情報処理装置１００は、図１中のグラフＧＲ１１に示すように、ノードＮ１～Ｎ３、Ｎ４３、Ｎ５３等の複数のノード（ベクトル）を含むグラフ情報を生成する。図１の例では、説明を簡単にするために、５個のノードを図示して処理の概要を説明するが、グラフＧＲ１１にはデータセットＤＳ１中のオブジェクト数に対応する数のノードが含まれる。

【0027】

図１の例では、例えば、情報処理装置１００は、各オブジェクトに対応する各ノードから所定数以上の出力エッジが他のエッジに連結されるように、グラフＧＲ１１を生成する。情報処理装置１００は、グラフＧＲ１１における各ノードが、そのノードとの間の距離が近い方から所定数のノードへのエッジ（出力エッジ）が連結されるようにグラフＧＲ１１を生成する。例えば、所定数は、オブジェクトの数またはグラフの目的や用途等に応じて、２や５や１０や１００等の種々の値であってもよい。例えば、所定数が２である場合、ノードＮ１からは、ノードＮ１からの距離が最も近いノード及び２番目に距離が近い２個のノードに出力エッジが連結される。なお、類似度を示す指標としての距離は、ベクトル（Ｎ次元ベクトル）間の距離として適用可能であれば、どのような距離であってもよく、例えば、ユークリッド距離やマハラノビス距離等の種々の距離が用いられてもよい。例えば、距離は、２つのオブジェクト間の類似度を反映するものであれば、どのような情報であってもよく、例えばコサイン類似度等の角度に関する情報であってもよい。

【0028】

このように「ノードＮ＊（＊は任意の数値）」と記載した場合、そのノードはノードＩＤ「Ｎ＊」により識別されるノードであることを示す。例えば、「ノードＮ１」と記載した場合、そのノードはノードＩＤ「Ｎ１」により識別されるノードである。

【0029】

また、図１中のグラフＧＲ１１では、ノードＮ１は、ノードＮ５３へ向かう有向エッジであるエッジＥ２が連結される。すなわち、ノードＮ１は、ノードＮ５３とエッジＥ２により連結される。このように「エッジＥ＊（＊は任意の数値）」と記載した場合、そのエッジはエッジＩＤ「Ｅ＊」により識別されるエッジであることを示す。例えば、「エッジＥ３１」と記載した場合、そのエッジはエッジＩＤ「Ｅ３１」により識別されるエッジである。例えば、ノードＮ１を参照元とし、ノードＮ５３を参照先として連結されるエッジＥ２により、ノードＮ１からノードＮ５３に辿ることが可能となる。この場合、有向エッジであるエッジＥ２は、ノードＮ１を中心として識別される場合、出力エッジとなり、ノードＮ５３を中心として識別される場合、入力エッジとなる。

【0030】

言い換えると、有向エッジであるエッジＥ２は、ノードＮ１側からの視点でとらえた場合、自身から他のエッジへ矢印が向いているエッジ、すなわち外向きエッジとなり、ノードＮ５３側からの視点でとらえた場合、自身の方に矢印が向いているエッジ、すなわち内向きエッジとなる。つまり、ここでいう出力エッジは、外向きエッジと読み替えることができ、入力エッジは、内向きエッジと読み替えることができる。また、図１では図示を省略するが、ノードＮ５３は、ノードＮ１へ向かう有向エッジ（エッジＥ５３１とする）が連結されてもよい。このように、ノードＮ５３からの出力エッジであるエッジＥ５３１がノードＮ１に連結されてもよい。この場合、ノードＮ１とノードＮ５３との間には、ノードＮ１からノードＮ５３へ向かう有向エッジであるエッジＥ２と、ノードＮ５３からノードＮ１へ向かう有向エッジであるエッジＥ５３１との２個のエッジが連結される。

【0031】

また、図１中のグラフＧＲ１１は、ユークリッド空間であってもよい。また、図１に示すグラフＧＲ１１は、各ベクトル間の距離等の説明のための概念的な図であり、グラフＧＲ１１は、多次元空間である。例えば、図１に示すグラフＧＲ１１は、平面上に図示するため２次元の態様にて図示されるが、例えば１００次元や１０００次元等の多次元空間であるものとする。なお、各ノードに対応するベクトルデータは、Ｎ次元の実数値ベクトルであってもよい。

【0032】

また、図１の例では、グラフＧＲ１１においては、適宜「ノードＮ＊（＊は任意の数値）」の図示を省略し、各ノードに対応する「○」内に「ノードＮ＊」の「＊」の値を付すことにより表現する。すなわち、「ノードＮ＊」の部分の「＊」が一致するノードに対応する。例えば、グラフＧＲ１１中の左上の「○」であって、内部に「４３」が付された「○」は、ノードＩＤ「Ｎ４３」により識別されるノード（ノードＮ４３）に対応する。

【0033】

ここで、各ノード間の距離は、ノード（画像）の類似性を示し、距離が近いほど類似している。本実施形態においては、グラフＧＲ１１における各ノードの距離を対応する各オブジェクト間の類似度とする。例えば、各ノードに対応する画像の類似性が、グラフＧＲ１１内におけるノード間の距離として写像されているものとする。例えば、各ノードに対応する概念間の類似度が各ノード間の距離に写像されているものとする。ここで、図１の例では、グラフＧＲ１１における各ノード間の距離が短いオブジェクト同士の類似度が高く、グラフＧＲ１１における各ノード間の距離が長いオブジェクト同士の類似度が低い。

【0034】

例えば、図１中のグラフＧＲ１１において、ノードＮ４３とノードＮ２とは近接している、すなわち距離が短い（近い）。そのため、ノードＮ４３に対応するオブジェクトと、ノードＮ２に対応するオブジェクトとは類似度が高いことを示す。また、図１中のグラフＧＲ１１において、ノードＮ４３とノードＮ５３とは遠隔にある、すなわち距離が長い（遠い）。そのため、ノードＮ４３に対応するオブジェクトと、ノードＮ５３に対応するオブジェクトとは類似度が低いことを示す。なお、上記は一例であり、情報処理装置１００は、種々の条件を用いて、グラフを生成してもよい。例えば、情報処理装置１００は、各オブジェクトに対応する各ノードから所定の数以上の入力エッジが他のエッジから連結されるように、グラフＧＲ１１を生成してもよい。

【0035】

そして、情報処理装置１００は、近似正解検索結果を取得する（ステップＳ３）。情報処理装置１００は、クエリＱＥ１を対象とする近似正解検索結果を取得する。情報処理装置１００は、クエリＱＥ１を用いて、ｋ個（ｋは任意の数）のノードを近似ノードとして抽出した結果を示す近似正解検索結果を取得する。情報処理装置１００は、近似正解検索結果情報記憶部１２４（図９参照）からクエリＱＥ１に対応する近似正解検索結果を取得する。

【0036】

ここで、精確な正解検索結果を生成するには、すべてのオブジェクトとの距離を計算する必要があり、大規模なデータセットの場合には現実的な時間でできない。そのため、情報処理装置１００が近似正解検索結果を生成する場合、評価用クエリに対して正解検索結果を得る代わりに、何らかの評価対象のインデックスを用いて近似検索結果を事前に取得する。例えば、情報処理装置１００は、近似検索（近傍検索）に関する種々の技術を適宜用いて、クエリＱＥ１に対応する近似正解検索結果を生成する。

【0037】

例えば、情報処理装置１００は、図１２に示すような処理により、クエリＱＥ１に対応する近似正解検索結果を生成する。この場合、情報処理装置１００は、後述する検索範囲係数「ε」の値を所定値以上大きくした値（「正解生成用値」とする）に設定して、図１２に示すような（検索）処理をグラフＧＲ１１を用いて行うことにより、クエリＱＥ１に対応する近似正解検索結果を生成する。これにより、情報処理装置１００は、すべてのオブジェクトとの距離を計算して正解情報を生成する場合に比べて、処理時間を短くすることができる。なお、上記は一例であり、すべてのオブジェクトとの距離を計算して正解情報を生成するよりも短い処理時間で、近似正解検索結果を生成することができれば、情報処理装置１００は、どのような処理により、近似正解検索結果を生成してもよい。

【0038】

ここで、検索範囲係数「ε」の概念について簡単に説明する。図１中のグラフＧＲ１１－１は、グラフＧＲ１１であり、「○」内に「Ｑ」を記載したクエリＱＥ１に対応する範囲ＡＲ１及び範囲ＡＲ２を図示するために、ノードのみを図示し、エッジの図示を省略したものである。情報処理装置１００は、クエリＱＥ１を中心とする半径ｒ内の範囲ＡＲ１と、クエリＱＥ１を中心とする半径ｒ（１＋ε）内の範囲ＡＲ２とを用いて、グラフＧＲ１１を検索し、近似ノードを抽出する。このように、情報処理装置１００は、検索範囲係数「ε」を適用した処理により、近似ノードを抽出する処理を行うが、検索範囲係数「ε」を用いた処理の詳細は図１２において説明する。

【0039】

上述した係数「ε」の正解生成用値の導出の点について記載する。まず、近似正解検索結果と正解データとして利用する場合、検索範囲係数「ε」を所定値以上に大きくした正解生成用値に設定することが望ましいが、検索範囲係数「ε」を大きくすると処理時間が増大する。そのため、十分な精度を得られ、かつ値ができる限り小さい検索範囲係数「ε」を求める必要がある。そこで、情報処理装置１００は、検索範囲係数「ε」を徐々に大きくして、検索結果に新たなオブジェクトを出現しなくなった時点の検索範囲係数「ε」の値を、近似正解検索結果（正解データ）を得る際に用いる検索範囲係数「ε」の値とする。例えば、情報処理装置１００は、検索範囲係数の値を第１値（例えば０や０．０５等）から所定の間隔（例えば０．０５や０．１等）で増加させ、近似検索の結果に新たなオブジェクトが出現しなくなった時点の第２値を、近似正解検索結果を生成する際の検索範囲係数の値として用いる。なお、検索範囲係数「ε」の正解生成用値の導出は、近似正解検索結果（正解データ）の生成前であればいずれの時点で行われてもよく、情報処理装置１００以外の装置が行ってもよい。

【0040】

図１の例では、情報処理装置１００は、クエリＱＥ１に対応する近似正解検索結果ＲＲ１を生成する。近似正解検索結果ＲＲ１に示すように、クエリＱＥ１に対応する近似正解情報は、Ｎｏが「１」である、すなわち最も近傍のノードがオブジェクトＯＢ１０１に対応するノードであることを示す。また、クエリＱＥ１に対応する近似正解情報は、Ｎｏが「ｋ」である、すなわち最も遠いノード（最遠オブジェクト）がオブジェクトＯＢ５５に対応するノードであることを示す。情報処理装置１００は、近似正解検索結果ＲＲ１を用いて、後述する測定処理等の処理を行う。

【0041】

そして、情報処理装置１００は、パラメータの値を設定する（ステップＳ４）。情報処理装置１００は、パラメータである検索範囲係数「ε」の値を初期値（例えば０や０．０１等）に設定する。以下、設定されたパラメータの値を測定対象値とする場合がある。図１では、情報処理装置１００は、検索範囲係数「ε」の測定対象値を「ＶＬ２１」に設定する。

【0042】

そして、情報処理装置１００は、設定したパラメータの値（測定対象値）を用いてグラフＧＲ１１の評価指標を測定する測定処理を行う（ステップＳ５）。これにより、情報処理装置１００は、パラメータを測定対象値に設定した場合のグラフＧＲ１１の評価指標の値を得ることができる。図１の例では、情報処理装置１００は、設定した検索範囲係数「ε」の値を用いてグラフＧＲ１１の再現率である検索精度を測定する測定処理を行う。

【0043】

ここでいう再現率は、「（正解検索結果の中で実際に検索された結果）／（正解検索結果）」で得られる。すなわち、再現率は、精度測定対象となる検索処理における「正解検索結果の中で実際に検索された結果」を、「正解検索結果」で除算することにより算出される。なお、検索範囲係数「ε」以外のパラメータについては、グラフＧＲ１１が用いられる際の設定値（デフォルト値）が用いられてもよい。例えば、参照エッジ数は、全エッジを対象とする値に設定されてもよいし、所定値に設定されてもよい。

【0044】

情報処理装置１００は、設定したパラメータの測定対象値を用いて、評価用クエリを対象として検索処理を行い、抽出した検索結果を用いて、再現率を検索精度として算出する。情報処理装置１００は、その検索処理の時間を計測してもよい。具体的には、情報処理装置１００は、図１２に示す検索処理を行い、評価用クエリの近似ノードを取得する。そして、情報処理装置１００は、検索処理により取得した近似ノードと、近似正解検索結果とを比較することで、設定した検索範囲係数「ε」の測定対象値での検索精度（再現率）の値を測定する。図１では、情報処理装置１００は、検索範囲係数「ε」の値が「ＶＬ２１」である場合、検索精度（再現率）の値が「ＶＬ１１」である測定する。

【0045】

そして、情報処理装置１００は、パラメータの値と評価指標の値とを対応付けて記憶する（ステップＳ６）。情報処理装置１００は、ルックアップテーブルＴＢ１－１に示すように、検索範囲係数「ε」の値「ＶＬ２１」に、再現率である検索精度の値「ＶＬ１１」を対応付けて記憶する。

【0046】

また、情報処理装置１００は、変換用情報の生成が完了したか否かを判定する（ステップＳ７）。例えば、情報処理装置１００は、閾値（例えば１０回や５０回等）を用いて、測定処理を繰り返した回数がその閾値以上になった場合、変換情報を生成したと判定する。

【0047】

情報処理装置１００は、変換用情報の生成が完了していないと判定した場合（ステップＳ７：Ｎｏ）、パラメータの値を変更する（ステップＳ８）。例えば、情報処理装置１００は、パラメータの測定対象値を変更する。図１では、情報処理装置１００は、検索範囲係数「ε」の測定対象値を所定値だけ増加させることにより、検索範囲係数「ε」の測定対象値を変更する。例えば、情報処理装置１００は、検索範囲係数「ε」の測定対象値を「ＶＬ２１」から「ＶＬ２２」に変更する。そして、情報処理装置１００は、ステップＳ５に戻り、変更した測定対象値を用いて処理を繰り返す。情報処理装置１００は、変換用情報の生成が完了した場合（ステップＳ７：Ｙｅｓ）、処理を終了する。これにより、情報処理装置１００は、検索精度と検索範囲係数との対応関係を示すルックアップテーブルＴＢ１（図２参照）を生成する。このように、情報処理装置１００は、検索時のパラメータとなる検索範囲係数「ε」の値を変化させて検索精度を求めてルックアップテーブルを作成する。

【0048】

上述のように、情報処理装置１００は、パラメータの値を変更して、評価指標を測定する処理を繰り返すことにより、評価指標の値に対応するパラメータの値を導出するための変更要情報を適切に生成することができる。なお、情報処理装置１００が生成するルックアップテーブルは、図１に示すような１つの評価指標と１つのパラメータとのルックアップテーブル、すなわち２次元のルックアップテーブルに限らず、３次元等、２次元よりも大きい多次元のルックアップテーブルであってもよい。例えば、情報処理装置１００は、評価指標「検索精度」の値を、第１パラメータ「検索範囲係数」の値及び第２パラメータ「参照エッジ数」や「検索数」の値の組合せに変換するために用いる３次元のルックアップテーブルを生成してもよい。このように、パラメータが二つの場合、情報処理装置１００は、二つのパラメータを変化させて、検索精度を測定し３次元のルックアップテーブルを生成してもよい。なお、上記は一例であり、情報処理装置１００は、種々の処理を行って、様々なルックアップテーブルを生成してもよい。

【0049】

〔２－２．検索処理〕
次に、図２を用いて、図１に示した生成処理により生成されたルックアップテーブルＴＢ１を用いた検索処理について説明する。図２は、実施形態に係る情報処理の一例を示す図である。図２の例では、情報処理装置１００が端末装置１０から取得したクエリに応じて、端末装置１０に検索結果を提供する場合を示す。例えば、情報処理装置１００は、クエリに近似するｋ個（例えば５個等）のベクトルを検索（抽出）する画像検索サービスを提供する場合を一例として説明する。

【0050】

図２の例では、情報処理装置１００は、グラフデータＧＤ１に示すデータセットＤＳ１を対象として生成されたグラフを用いて近似検索を行う。グラフデータＧＤ１のグラフはグラフＧＲ１１であってもよい。

【0051】

まず、情報処理装置１００は、ユーザＵ１が利用する端末装置１０からグラフを用いた近似検索の評価指標の指定値を示す情報を取得する（ステップＳ２１）。図２の例では、情報処理装置１００は、端末装置１０から検索精度（再現率）の指定値「ＶＬ１１－２」を取得する。例えば、情報処理装置１００は、端末装置１０から画像をクエリＱＥ２１として取得する。

【0052】

そして、情報処理装置１００は、ルックアップテーブルＴＢ１に基づいて、検索精度の指定値「ＶＬ１１－２」を検索範囲係数「ε」の値に変換する（ステップＳ２２）。例えば、情報処理装置１００は、ルックアップテーブルＴＢ１に検索精度の指定値が含まれる場合、その指定値に対応付けられた検索範囲係数「ε」の値を用いる。

【0053】

また、情報処理装置１００は、ルックアップテーブルＴＢ１に検索精度の指定値が含まれない場合、ルックアップテーブルＴＢ１に基づいて、その指定値に対応する検索範囲係数「ε」の値を生成する。情報処理装置１００は、検索時に指定された検索精度の指定値「ＶＬ１１－２」によりルックアップテーブルＴＢ１を参照し、ルックアップテーブルＴＢ１の離散値を補間する補間処理により、検索範囲係数「ε」の値を求める。なお、補間処理は線形補間でもよい。また、情報処理装置１００は、ルックアップテーブルＴＢ１から近似関数を事前に計算しておき、近似関数を用いて検索範囲係数「ε」の値を求めてもよい。この場合、情報処理装置１００は、記憶部１２０（図５参照）に記憶された近似関数を変換用情報として取得し、取得した近似関数を用いて、検索精度の指定値を検索範囲係数「ε」の値に変換する。これにより、情報処理装置１００は、近似関数を用いて検索精度の指定値から検索範囲係数「ε」の値を求めてもよい。

【0054】

図２では、情報処理装置１００は、ルックアップテーブルＴＢ１に検索精度の指定値が含まれないため、補間処理により、検索精度の指定値「ＶＬ１１－２」から検索範囲係数「ε」の値「ＶＬ２１－２」を求める。これにより、情報処理装置１００は、変換後情報ＣＶに示すように、検索精度の指定値「ＶＬ１１－２」を検索範囲係数「ε」の値「ＶＬ２１－２」に変換する。

【0055】

そして、情報処理装置１００は、ユーザＵ１が利用する端末装置１０からクエリを取得する（ステップＳ２３）。図２の例では、情報処理装置１００は、端末装置１０からクエリＱＥ２１を取得する。例えば、情報処理装置１００は、端末装置１０から画像をクエリＱＥ２１として取得する。なお、情報処理装置１００は、検索精度の指定値とクエリとを一括して端末装置１０から取得（受信）してもよい。

【0056】

そして、情報処理装置１００は、検索範囲係数「ε」の値を「ＶＬ２１－２」に設定し、クエリＱＥ２１を対象としてグラフデータＧＤ１のグラフを用いた近似検索の処理を実行する（ステップＳ２４）。情報処理装置１００は、検索範囲係数「ε」の値を「ＶＬ２１－２」に設定し、クエリＱＥ２１を対象としてグラフデータＧＤ１のグラフを用いて図１２に示す検索処理を行い、クエリＱＥ２１の近似ノードを取得する。例えば、情報処理装置１００は、グラフデータＧＤ１のグラフを探索することにより、クエリＱＥ２１について、所定数（例えば５個等）の近似ノード（近似オブジェクト）を抽出する。

【0057】

そして、情報処理装置１００は、抽出した近似オブジェクトを示す情報を検索結果として端末装置１０に提供する（ステップＳ２５）。例えば、情報処理装置１００は、抽出した所定数（例えば５個等）の近似オブジェクトである画像を、ユーザＵ１が指定したクエリＱＥ２１に類似する画像として端末装置１０に提供する。

【0058】

このように、ユーザが検索時のパラメータを指定する代わりに、所望の検索精度または検索時間等の評価指標の値を指定することにより、情報処理装置１００は、ユーザが指定した評価指標の値をパラメータの値に変換する。これにより、情報処理装置１００は、適切なパラメータの値を用いた近似検索を可能にすることができる。例えば、ユーザ自身が所望の評価指標の基準を満たすためのパラメータの値を設定することができない場合であっても、情報処理装置１００は、ユーザの要求に応じて、適切なパラメータの値を用いた近似検索を可能にすることができる。

【0059】

そして、情報処理装置１００は、変換したパラメータの値を用いて検索する。すなわち、情報処理装置１００は、ユーザにより指定された検索精度や検索時間の指定値をパラメータの値に変換した後に検索を行う。これにより、情報処理装置１００は、適切なパラメータの値を用いた近似検索を実行することができる。なお、上記は一例であり、情報処理装置１００は、ルックアップテーブルに限らず、変換関数等の様々な変換用情報を用いてもよい。

【0060】

〔２－３．ツリーインデックス〕
上述した例では、グラフのみを用いる場合を示したが、情報処理装置１００は、ツリーインデックスなど、各種のインデックスを用いて、処理を高速化してもよい。例えば、情報処理装置１００は、図３中の情報群ＧＩＮＦ１１に示すようなツリーインデックスＩＮＤ１１を用いて、検索の起点となるノード（以下「起点ノード」ともいう）を決定してもよい。図３は、ツリーインデックスの一例を示す図である。なお、ツリーインデックスＩＮＤ１１は、情報処理装置１００が生成してもよいし、情報処理装置１００は、ツリーインデックスＩＮＤ１１を情報提供装置５０等の他の外部装置から取得してもよい。

【0061】

例えば、情報処理装置１００は、ツリーインデックスＩＮＤ１１に基づいて、クエリＱＥ１に対応する起点ノードを決定してもよい。情報処理装置１００は、ツリー情報記憶部１２２（図７参照）に記憶されたツリーインデックスＩＮＤ１１を用いて、起点ノードを決定する。例えば、ツリーインデックスＩＮＤ１１は、グラフＧＲ１１中のいくつかのノードに到達可能なツリー構造を有するツリーである。図３の例では説明を簡単にするために、ツリーインデックスＩＮＤ１１は、ノードＮ１～Ｎ５の５個のノードに到達するルートのみを図示するが、多数（例えば５００や１０００等）の他のノードへ到達するルートが含まれてもよい。

【0062】

例えば、情報処理装置１００は、図３中のツリーインデックスＩＮＤ１１に示すような木構造型のツリーインデックスを用いて、グラフＧＲ１１における起点ノードを決定する。図１の例では、情報処理装置１００は、クエリＱＥ１に基づいて、ツリーインデックスＩＮＤ１１を上（ルートＲＴ）から下へ辿ることにより、ツリーインデックスＩＮＤ１１の近傍候補となる起点ノードを決定（特定）する。これにより、情報処理装置１００は、効率的に検索クエリ（クエリＱＥ１）に対応する起点ノードを決定することができる。

【0063】

例えば、情報処理装置１００は、ツリーインデックスＩＮＤ１１をルートＲＴからリーフノード（グラフＧＲ１１中のノード）まで辿ることにより、クエリＱＥ１に対応する起点ノードを決定してもよい。例えば、情報処理装置１００は、木構造に関する種々の従来技術を適宜用いて、ツリーインデックスＩＮＤ１１をルートＲＴからリーフノードまで辿ることにより、辿りついたリーフノードを起点ノードとして決定してもよい。例えば、情報処理装置１００は、クエリＱＥ１との類似度に基づいて、ツリーインデックスＩＮＤ１１を下へ辿ることにより、起点ノードを決定してもよい。例えば、情報処理装置１００は、ルートＲＴから節点ＶＴ１、ＶＴ２等のいずれの節点に辿るかを、クエリＱＥ１と節点ＶＴ１、ＶＴ２との類似度に基づいて決定してもよい。例えば、情報処理装置１００は、ルートＲＴから節点ＶＴ１、ＶＴ２等のうち、クエリＱＥ１との類似度が最も高い節点ＶＴ２へ辿ると決定してもよい。また、例えば、情報処理装置１００は、節点ＶＴ２から節点ＶＴ２－１～ＶＴ２－４等のうち、クエリＱＥ１との類似度が最も高い節点ＶＴ２－２へ辿ると決定してもよい。

【0064】

図３の例に示すツリーインデックス（ツリーデータ）は一例であり、情報処理装置１００は、種々のツリーインデックスを用いて、グラフ情報を検索してもよい。情報処理装置１００は、検索時の起点ノードの決定に用いるツリーを生成してもよい。なお、ツリーを用いることは一例であり、情報処理装置１００は、検索時の起点ノードの決定の高速化が可能であれば、ツリーに限らず種々の情報を用いてもよい。例えば、情報処理装置１００は、高次元ベクトルを高速に検索するための検索ツリー（ツリーインデックス）を生成する。ここでいう高次元ベクトルとは、例えば、数百次元から数千次元のベクトルであってもよいし、それ以上の次元のベクトルであってもよい。

【0065】

例えば、情報処理装置１００は、図３に示すようなツリー構造（木構造）に関するツリーインデックスＩＮＤ１１を生成してもよい。例えば、情報処理装置１００は、ｋｄ木（k-dimensional tree）に関する検索ツリーを生成してもよい。例えば、情報処理装置１００は、ＶＰ木（Vantage-Point tree）に関する検索ツリーを生成してもよい。

【0066】

また、例えば、情報処理装置１００は、その他の木構造を有するツリーとして生成してもよい。例えば、情報処理装置１００は、木構造のツリーのリーフがグラフに接続する種々のツリーを生成してもよい。例えば、情報処理装置１００は、木構造のツリーのリーフがグラフ中のノードに対応する種々のツリーを生成してもよい。また、情報処理装置１００は、このようなツリーを用いて検索を行う場合、ツリーを辿って到達したリーフ（ノード）からグラフを探索してもよい。

【0067】

なお、上述したようなツリーは一例であり、情報処理装置１００は、グラフ中のクエリを高速に特定することが可能であれば、どのようなデータ構造のツリーを生成してもよい。例えば、情報処理装置１００は、クエリに対応するグラフ情報中のノードを高速に特定することが可能であれば、バイナリ空間分割に関する技術等の種々の従来技術を適宜用いて、ツリーを生成してもよい。例えば、情報処理装置１００は、高次元ベクトルの検索に対応可能なツリーであれば、どのようなデータ構造のツリーを生成してもよい。情報処理装置１００は、上述のようなツリーとグラフとを用いることにより、所定の対象に関してより効率的な検索を可能にすることができる。すなわち、情報処理装置１００は、上述のようなツリーとグラフとを用いることにより、所定の対象に関してより高速な検索を可能にすることができる。

【0068】

また、情報処理装置１００は、ツリーインデックスＩＮＤ１１のような木構造のインデックスのみを用いて近似検索を行ってもよい。例えば、情報処理装置１００は、検索対象となる複数の各々がツリーのリーフとなるツリーインデックス（ツリーインデックスＴＸ）を用いた近似検索を行う。この場合、クエリＱＥ１について、ツリーインデックスＴＸを辿ってたどり着いたリーフであるノードが近似ノードとして抽出される。すなわち、情報処理装置１００は、クエリＱＥ１が与えられた場合、ツリーインデックスＴＸをルートからリーフまで辿ることにより、クエリＱＥ１に近似するノードを検索する近似検索を行う。この場合、パラメータは、分岐において辿る本数（枝（ブランチ）の数）等であってもよい。

【0069】

〔３．情報処理システムの構成〕
図４に示すように、情報処理システム１には、端末装置１０と、情報提供装置５０と、情報処理装置１００とが含まれる。端末装置１０と、情報提供装置５０と、情報処理装置１００とは所定のネットワークＮを介して、有線または無線により通信可能に接続される。図４は、実施形態に係る情報処理システムの構成例を示す図である。なお、図４に示した情報処理システム１には、複数台の端末装置１０や、複数台の情報提供装置５０や、複数台の情報処理装置１００が含まれてもよい。

【0070】

端末装置１０は、ユーザによって利用される情報処理装置である。端末装置１０は、ユーザによる種々の操作を受け付ける。なお、以下では、端末装置１０をユーザと表記する場合がある。すなわち、以下では、ユーザを端末装置１０と読み替えることもできる。なお、上述した端末装置１０は、例えば、スマートフォンや、タブレット型端末や、ノート型ＰＣ（Personal Computer）や、デスクトップＰＣや、携帯電話機や、ＰＤＡ（Personal Digital Assistant）等により実現される。

【0071】

情報処理装置１００は、複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値を、近似検索で用いるパラメータの値に変換するコンピュータである。また、情報処理装置１００は、インデックスを用いた近似検索を、評価指標の指定値が変換されたパラメータの値を用いて実行する情報検索装置である。

【0072】

情報処理装置１００は、ユーザ等に種々の情報提供を行うための情報が格納する。例えば、情報処理装置１００は、ユーザ等に画像検索サービスを提供する。この場合、情報処理装置１００は、画像検索サービスを提供するための各情報が格納される。例えば、情報処理装置１００は、情報提供装置５０が提供する電子商取引サービスにおいて取引される取引対象に関する画像を検索する画像検索サービスを提供する。すなわち、データセットＤＳ１は、情報提供装置５０が提供する電子商取引サービスにおいて取引される取引対象に関するオブジェクトであってもよい。

【0073】

情報処理装置１００は、近似検索により、クエリに類似するオブジェクトを抽出する。例えば、情報処理装置１００は、端末装置１０からクエリ情報（クエリ）を受信すると、クエリに類似する対象（ベクトル情報等）を検索し、検索結果を端末装置に提供する。情報処理装置１００は、端末装置１０から受信したクエリを用いて近似検索を行い、その結果を端末装置１０に送信する。

【0074】

なお、情報処理装置１００が端末装置に提供するデータは、画像等のデータ自体であってもよいし、ＵＲＬ（Uniform Resource Locator）等の対応するデータを参照するための情報であってもよい。また、クエリや検索対象のデータは、画像、音声、テキストデータなど、如何なる種類のデータであってもよい。本実施形態において、情報処理装置１００が画像を検索する場合を一例として説明する。

【0075】

情報提供装置５０は、ユーザに電子商取引サービスを提供する情報処理装置である。情報提供装置５０は、情報処理装置１００に種々の情報提供を行う。情報提供装置５０は、電子商取引サービスにおいて取引される取引対象に関する情報を情報処理装置１００に提供する。情報提供装置５０は、電子商取引サービスにおいて取引される取引対象の画像やその画像のベクトルデータを情報処理装置１００に提供する。

【0076】

なお、情報提供装置５０は、情報処理装置１００と一体であってもよい。また、情報提供装置５０は、ウェブサーバ等の種々の外部装置から収集した画像等に基づくオブジェクトＩＤを格納してもよい。例えば、情報提供装置５０は、画像検索サービスの対象となる画像に対応するベクトル情報を情報処理装置１００に提供してもよい。

【0077】

〔４．情報処理装置の構成〕
次に、図５を用いて、実施形態に係る情報処理装置１００の構成について説明する。図５は、実施形態に係る情報処理装置１００の構成例を示す図である。図５に示すように、情報処理装置１００は、通信部１１０と、記憶部１２０と、制御部１３０とを有する。なお、情報処理装置１００は、情報処理装置１００の管理者等から各種操作を受け付ける入力部（例えば、キーボードやマウス等）や、各種情報を表示するための表示部（例えば、液晶ディスプレイ等）を有してもよい。

【0078】

（通信部１１０）
通信部１１０は、例えば、ＮＩＣ（Network Interface Card）等によって実現される。そして、通信部１１０は、ネットワーク（例えば図４中のネットワークＮ）と有線または無線で接続され、端末装置１０や情報提供装置５０との間で情報の送受信を行う。

【0079】

（記憶部１２０）
記憶部１２０は、例えば、ＲＡＭ（Random Access Memory）、フラッシュメモリ（Flash Memory）等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部１２０は、図５に示すように、オブジェクト情報記憶部１２１と、ツリー情報記憶部１２２と、グラフ情報記憶部１２３と、近似正解検索結果情報記憶部１２４と、変換用情報記憶部１２５とを有する。

【0080】

（オブジェクト情報記憶部１２１）
実施形態に係るオブジェクト情報記憶部１２１は、オブジェクトに関する各種情報を記憶する。例えば、オブジェクト情報記憶部１２１は、データセットごとにオブジェクトＩＤやベクトルデータを記憶する。図６は、実施形態に係るオブジェクト情報記憶部の一例を示す図である。図６に示すオブジェクト情報記憶部１２１は、「データセットＩＤ」、「オブジェクトＩＤ」、「ベクトル情報」といった項目が含まれる。

【0081】

「データセットＩＤ」は、データセットを識別するための識別情報を示す。「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。また、「ベクトル情報」は、オブジェクトＩＤにより識別されるオブジェクトに対応するベクトル情報を示す。すなわち、図６の例では、オブジェクトを識別するオブジェクトＩＤに対して、オブジェクトに対応するベクトルデータ（ベクトル情報）が対応付けられて登録されている。

【0082】

図６の例では、データセットＩＤ「ＤＳ１」により識別されるデータセット（データセットＤＳ１）には、オブジェクトＩＤ「ＯＢ１」、「ＯＢ２」、「ＯＢ３」等により識別される複数のオブジェクト（対象）が含まれることを示す。オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（オブジェクトＯＢ１）は、「１０，２４，５４，２．．．」の多次元のベクトル情報が対応付けられることを示す。また、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（オブジェクトＯＢ２）は、「３２，１，１２０，３１．．．」の多次元のベクトル情報が対応付けられることを示す。

【0083】

なお、オブジェクト情報記憶部１２１は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

【0084】

（ツリー情報記憶部１２２）
実施形態に係るツリー情報記憶部１２２は、ツリーに関する各種情報を記憶する。図７は、実施形態に係るツリー情報記憶部の一例を示す図である。具体的には、図７の例では、ツリー情報記憶部１２２は、木構造のツリーインデックスを示す。図７の例では、ツリー情報記憶部１２２は、「ルート階層」、「第１階層」、「第２階層」、「第３階層」等といった項目が含まれる。なお、「第１階層」～「第３階層」に限らず、ツリーの階層数に応じて、「第４階層」、「第５階層」、「第６階層」等が含まれてもよい。

【0085】

「ルート階層」は、ツリーを用いた起点ノードの決定の開始点となるルート（最上位）の階層を示す。「第１階層」は、ツリーの第１階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第１階層」に格納されるノードは、ツリーの根（ルート）に直接結ばれる階層に対応するノードとなる。

【0086】

「第２階層」は、ツリーの第２階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第２階層」に格納されるノードは、第１階層のノードに結ばれる直下の階層に対応するノードとなる。「第３階層」は、ツリーの第３階層に属するノード（節点またはグラフ情報中のベクトル）を識別（特定）する情報が格納される。「第３階層」に格納されるノードは、第２階層のノードに結ばれる直下の階層に対応するノードとなる。

【0087】

図７に示す例においては、ツリー情報記憶部１２２には、図１中のツリー情報ＩＮＤ１１に対応する情報が記憶される。例えば、ツリー情報記憶部１２２は、第１階層のノードが、節点ＶＴ１～ＶＴ３等であることを示す。また、各節点の下の括弧内の数値は、各節点に対応するベクトルの値を示す。

【0088】

また、ツリー情報記憶部１２２は、節点ＶＴ２の直下の第２階層のノードが、節点ＶＴ２－１～ＶＴ２－４であることを示す。また、ツリー情報記憶部１２２は、節点ＶＴ２－１の直下の第３階層のノードが、ノードＮ１、ノードＮ２のグラフＧＲ１１中のノード（ベクトル）であることを示す。ツリー情報記憶部１２２は、節点ＶＴ２－２の直下の第３階層のノードが、ノードＮ３、ノードＮ４、ノードＮ５のグラフＧＲ１１中のノード（ベクトル）であることを示す。

【0089】

なお、ツリー情報記憶部１２２は、上記に限らず、目的に応じて種々の情報を記憶してもよい。

【0090】

（グラフ情報記憶部１２３）
実施形態に係るグラフ情報記憶部１２３は、グラフに関する各種情報を記憶する。例えば、グラフ情報記憶部１２３は、検索処理等の情報処理に用いられるグラフ情報を記憶する。図８の例は、グラフ情報記憶部１２３は、近傍グラフデータを記憶する。図８は、実施形態に係るグラフ情報記憶部の一例を示す図である。図８に示すグラフ情報記憶部１２３は、「ノードＩＤ」、「オブジェクトＩＤ」、および「有向エッジ情報」といった項目を有する。また、「有向エッジ情報」には、「エッジＩＤ」や「参照先」といった情報が含まれる。

【0091】

「ノードＩＤ」は、グラフデータにおける各ノード（対象）を識別するための識別情報を示す。また、「オブジェクトＩＤ」は、オブジェクトを識別するための識別情報を示す。

【0092】

また、「有向エッジ情報」は、対応するノードに接続されるエッジに関する情報を示す。図８の例では、「有向エッジ情報」は、対応するノードから出力される出力エッジに関する情報を示す。また、「エッジＩＤ」は、ノード間を連結するエッジを識別するための識別情報を示す。また、「参照先」は、エッジにより連結された参照先（ノード）を示す情報を示す。すなわち、図８の例では、ノードを識別するノードＩＤに対して、そのノードに対応するオブジェクト（対象）を識別する情報やそのノードからの有向エッジ（出力エッジ）が連結される参照先（ノード）が対応付けられて登録されている。

【0093】

図８の例では、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）は、オブジェクトＩＤ「ＯＢ１」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ１からは、エッジＩＤ「Ｅ１」により識別されるエッジ（エッジＥ１）が、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）に連結されることを示す。すなわち、図８の例では、グラフ情報におけるノードＮ１からはエッジＥ１によりノードＮ２へ辿ることができることを示す。

【0094】

また、図８の例では、ノードＩＤ「Ｎ２」により識別されるノード（ノードＮ２）は、オブジェクトＩＤ「ＯＢ２」により識別されるオブジェクト（対象）に対応することを示す。また、ノードＮ２からは、エッジＩＤ「Ｅ２１」により識別されるエッジ（エッジＥ２１）が、ノードＩＤ「Ｎ１」により識別されるノード（ノードＮ１）に連結されることを示す。すなわち、図８の例では、グラフ情報におけるノードＮ２からはエッジＥ２１によりノードＮ１へ辿ることができることを示す。

【0095】

なお、グラフ情報記憶部１２３は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、グラフ情報記憶部１２３は、各ノード（ベクトル）間を連結するエッジの長さが記憶されてもよい。すなわち、グラフ情報記憶部１２３は、各ノード（ベクトル）間の距離を示す情報が記憶されてもよい。グラフ情報記憶部１２３には、有向エッジにより連結されたグラフ情報に限らず、種々のグラフ情報が記憶されてもよい。グラフ情報記憶部１２３には、無向エッジにより連結されたグラフ情報が記憶されてもよい。

【0096】

（近似正解検索結果情報記憶部１２４）
実施形態に係る近似正解検索結果情報記憶部１２４は、近似正解検索に関する各種情報を記憶する。近似正解検索結果情報記憶部１２４は、各クエリを用いた場合の検索処理の精度を測定するために用いる近似正解情報を記憶する。例えば、近似正解検索結果情報記憶部１２４は、各クエリに対応付けてそのクエリのｋ個の近似ノードを近似正解検索結果として記憶する。図９は、実施形態に係る近似正解検索結果情報記憶部の一例を示す図である。図９に示す近似正解検索結果情報記憶部１２４は、「クエリＩＤ」、「ベクトル情報」、「近似正解検索結果」といった項目を有する。また、「近似正解検索結果」には、「Ｎｏ」や「オブジェクト」といった項目が含まれる。

【0097】

「クエリＩＤ」は、クエリを識別するための識別情報を示す。例えば、「クエリＩＤ」は、評価用クエリを識別するための識別情報を示す。また、「ベクトル情報」は、対応するクエリのベクトル情報を示す。「近似正解検索結果」は、対応するクエリの近似正解情報として用いる近似正解検索結果が記憶される。「Ｎｏ」は、対応するクエリの各近似ノードの順位を示す。「オブジェクト」は、対応する順位の近似ノード（オブジェクト）を示す。

【0098】

図９の例では、クエリＩＤ「ＱＥ１」により識別されるクエリ（クエリＱＥ１）は、「７，３５，１３，９３．．．」の多次元のベクトル情報であることを示す。クエリＱＥ１に対応する近似正解情報は、Ｎｏが「１」である、すなわち最も近傍のノードがオブジェクトＯＢ１０１に対応するノードであることを示す。また、クエリＱＥ１に対応する近似正解情報は、Ｎｏが「ｋ」である、すなわち最も遠いノード（最遠オブジェクト）がオブジェクトＯＢ５５に対応するノードであることを示す。

【0099】

なお、近似正解検索結果情報記憶部１２４は、上記に限らず、目的に応じて種々の情報を記憶してもよい。近似正解検索結果情報記憶部１２４は、複数のグラフ情報を使い分ける場合、閾値に、その閾値が用いられるグラフ情報を対応付けて記憶してもよい。例えば、近似正解検索結果情報記憶部１２４は、グラフＧＲ１１以外のグラフ情報が用いられる場合、各閾値が用いられるグラフ情報と、対応する閾値とを対応付けて記憶してもよい。

【0100】

（変換用情報記憶部１２５）
実施形態に係る変換用情報記憶部１２５は、評価指標の値をパラメータの値に変換するために用いる各種情報を記憶する。図１０は、実施形態に係る変換用情報記憶部の一例を示す図である。図１０の例では、変換用情報記憶部１２５は、評価指標の値とパラメータの値との対応付けを示すルックアップテーブルを記憶する場合を一例として示す。

【0101】

変換用情報記憶部１２５は、評価指標「検索精度」の値をパラメータ「検索範囲係数」の値に変換するために用いるルックアップテーブルＴＢ１、評価指標「処理時間」の値をパラメータ「検索範囲係数」の値に変換するために用いるルックアップテーブルＴＢ２等を記憶する。なお、ルックアップテーブルは、１つの評価指標と１つのパラメータとのルックアップテーブル、すなわち２次元のルックアップテーブルに限らず、３次元等、２次元よりも大きい多次元のルックアップテーブルであってもよい。

【0102】

図６に示すように、ルックアップテーブルは、評価指標「検索精度」の値を、第１パラメータ「検索範囲係数」の値及び第２パラメータ「参照エッジ数」の値の組合せに変換するために用いるルックアップテーブルＴＢ３のような３次元のルックアップテーブルであってもよい。また、ルックアップテーブルは、第１評価指標「検索精度」の値及び第２評価指標「処理時間」の値の組合せを、パラメータ「検索範囲係数」の値に変換するために用いる３次元のルックアップテーブルであってもよい。なお、上記は一例であり、変換用情報記憶部１２５は、様々なルックアップテーブルを記憶する。

【0103】

図１０のルックアップテーブルＴＢ１は、評価指標「検索精度」の値と、パラメータ「検索範囲係数」の値との対応関係を示すルックアップテーブルを示す。

【0104】

ルックアップテーブルＴＢ１の評価指標「検索精度」の欄には、例えば再現率である検索精度の値である「ＶＬ１１」、「ＶＬ１２」、「ＶＬ１３」、「ＶＬ１４」等が格納される。なお、図１０の例では、「ＶＬ１１」といった抽象的な符号で示すが、検索精度の値は具体的な数値（例えば０．６５や０．９等）である。

【0105】

また、ルックアップテーブルＴＢ１のパラメータ「検索範囲係数」の欄には、例えば「ε」である検索範囲係数の値である「ＶＬ２１」、「ＶＬ２２」、「ＶＬ２３」、「ＶＬ２４」等が格納される。なお、図１０の例では、「ＶＬ２１」といった抽象的な符号で示すが、検索範囲係数の値は具体的な数値（例えば０．０５や０．２等）である。

【0106】

このように、ルックアップテーブルＴＢ１は、検索精度の値「ＶＬ１１」が、検索範囲係数の値「ＶＬ２１」に対応付けられ、検索精度の値「ＶＬ１２」が、検索範囲係数の値「ＶＬ２２」に対応付けられていることを示す。

【0107】

また、ルックアップテーブルＴＢ２の評価指標「処理時間」の欄には、検索処理に要する時間である処理時間の値である「ＰＴ１１」等が格納される。なお、図１０の例では、「ＰＴ１１」といった抽象的な符号で示すが、処理時間の値は具体的な数値（例えば０．５秒や３０秒等）である。

【0108】

また、ルックアップテーブルＴＢ２のパラメータ「検索範囲係数」の欄には、例えば「ε」である検索範囲係数の値である「ＶＬ３１」等が格納される。

【0109】

このように、ルックアップテーブルＴＢ２は、処理時間の値「ＰＴ１１」が、検索範囲係数の値「ＶＬ３１」に対応付けられていることを示す。

【0110】

なお、変換用情報記憶部１２５は、上記に限らず、目的に応じて種々の情報を記憶してもよい。変換用情報記憶部１２５は、各テーブルＴＢ１～ＴＢ３等の各々から生成した関数の情報を記憶してもよい。例えば、変換用情報記憶部１２５は、各テーブルＴＢ１における、評価指標「検索精度」の値と、パラメータ「検索範囲係数」の値との対応関係を基に生成された関数を、テーブルＴＢ１に対応付けて記憶してもよい。

【0111】

（制御部１３０）
図５の説明に戻って、制御部１３０は、コントローラ（controller）であり、例えば、ＣＰＵ（Central Processing Unit）やＭＰＵ（Micro Processing Unit）等によって、情報処理装置１００内部の記憶装置に記憶されている各種プログラム（情報処理プログラムの一例に相当）がＲＡＭを作業領域として実行されることにより実現される。また、制御部１３０は、コントローラであり、例えば、ＡＳＩＣ（Application Specific Integrated Circuit）やＦＰＧＡ（Field Programmable Gate Array）等の集積回路により実現される。

【0112】

図５に示すように、制御部１３０は、取得部１３１と、生成部１３２と、変換部１３３と、決定部１３４と、検索部１３５と、提供部１３６とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部１３０の内部構成は、図５に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。

【0113】

（取得部１３１）
取得部１３１は、各種情報を取得する。取得部１３１は、記憶部１２０から各種情報を取得する。取得部１３１は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、変換用情報記憶部１２５等から各種情報を取得する。

【0114】

また、取得部１３１は、各種情報を外部の情報処理装置から受信する。取得部１３１は、端末装置１０等の外部装置から各種情報を取得する。取得部１３１は、グラフ情報記憶部１２３からグラフ情報を取得する。取得部１３１は、ツリー情報記憶部１２２からツリー情報を取得する。

【0115】

取得部１３１は、複数のオブジェクトを検索対象とするインデックスを取得する。取得部１３１は、複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値を取得する。取得部１３１は、評価指標の値に対応する近似検索で用いるパラメータの値を示す変換用情報を取得する。

【0116】

取得部１３１は、複数のオブジェクトの各々に対応する複数のノードがエッジにより連結されたグラフをインデックスとして用いた近似検索の指定値を取得する。取得部１３１は、評価指標の各値とパラメータの各値との対応関係を示すルックアップテーブルを変換用情報として取得する。取得部１３１は、評価指標の値を入力として、入力された評価指標の値に対応するパラメータに値を出力する関数を変換用情報として取得する。

【0117】

取得部１３１は、グラフ情報記憶部１２３からグラフＧＲ１１を取得する。取得部１３１は、オブジェクト情報記憶部１２１（図６参照）からデータセットＤＳ１を取得する。取得部１３１は、ツリー情報記憶部１２２からツリー情報ＩＮＤ１１を取得する。

【0118】

取得部１３１は、近似正解検索結果を取得する。取得部１３１は、クエリＱＥ１を対象とする近似正解検索結果を取得する。取得部１３１は、クエリＱＥ１を用いて、ｋ個（ｋは任意の数）のノードを近似ノードとして抽出した結果を示す近似正解検索結果を取得する。取得部１３１は、近似正解検索結果情報記憶部１２４（図９参照）からクエリＱＥ１に対応する近似正解検索結果を取得する。

【0119】

取得部１３１は、端末装置１０から検索精度（再現率）の指定値「ＶＬ１１－２」を取得する。取得部１３１は、クエリＱＥ２１をユーザＵ１が利用する端末装置１０から取得する。

【0120】

（生成部１３２）
生成部１３２は、各種情報を生成する。生成部１３２は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を生成する。生成部１３２は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、変換用情報記憶部１２５等に基づいて、各種情報を生成する。

【0121】

生成部１３２は、取得部１３１により取得された各種情報に基づいて、種々の情報を生成する。生成部１３２は、変換部１３３により変換された各種情報に基づいて、種々の情報を生成する。生成部１３２は、決定部１３４により決定された各種情報に基づいて、種々の情報を生成する。生成部１３２は、検索部１３５により抽出された各種情報に基づいて、種々の情報を生成する。生成部１３２は、グラフ情報を生成してもよい。

【0122】

生成部１３２は、インデックスを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。生成部１３２は、複数のオブジェクトから選択された評価用オブジェクトに基づく評価用クエリを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。生成部１３２は、複数のオブジェクトから選択された複数の評価用オブジェクトを用いて生成される評価用クエリを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。生成部１３２は、複数の評価用オブジェクトの平均を評価用クエリとする検索処理を含む生成処理により、ルックアップテーブルを生成する。

【0123】

生成部１３２は、評価用クエリを用いた近似検索の結果である近似正解検索結果を生成し、生成した近似正解検索結果を用いた評価指標を測定する測定処理を含む生成処理により、ルックアップテーブルを生成する。生成部１３２は、インデックスがグラフである場合、当該グラフを用いた検索処理における探索範囲を決定するための係数である検索範囲係数を調整することにより、近似正解検索結果を生成する。生成部１３２は、検索範囲係数の値を第１値から増加させ、近似検索の結果に新たなオブジェクトが出現しなくなった時点の第２値を、近似正解検索結果を生成する際の検索範囲係数の値として用いる。

【0124】

生成部１３２は、複数のオブジェクトから評価用オブジェクトを除いたオブジェクト群を検索対象とするインデックスを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。生成部１３２は、パラメータの複数の値の各々を用いた検索処理により得られた評価指標の複数の値の各々を、対応するパラメータの複数の値の各々に対応付ける生成処理により、ルックアップテーブルを生成する。

【0125】

生成部１３２は、ルックアップテーブルを用いて、評価指標の値を入力として、入力された評価指標の値に対応するパラメータに値を出力する関数を生成する。例えば、生成部１３２は、各テーブルＴＢ１における評価指標「検索精度」の値と、パラメータ「検索範囲係数」の値との対応関係を基に、評価指標「検索精度」の値を入力として、その値に対応するパラメータ「検索範囲係数」の値を出力する関数（近似関数）を生成する。例えば、情報処理装置１００は、関数のフィッティングに関する種々の技術を適宜用いて、評価指標「検索精度」の値を入力として、その値に対応するパラメータ「検索範囲係数」の値を出力する近似関数を生成してもよい。なお、上記は一例に過ぎず、情報処理装置１００は、評価指標の値をパラメータの値に変換可能であれば、どのような処理により関数を生成してもよい。また、情報処理装置１００が生成する近似関数は、線形関数であってもよいし、非線形関数であってもよい。

【0126】

生成部１３２は、グラフを生成する。生成部１３２は、データセットＤＳ１中の全オブジェクトを用いて、グラフを生成してもよいし、データセットＤＳ１のうち一部のオブジェクトを用いて、グラフを生成してもよい。例えば。生成部１３２は、データセットＤＳ１のうち、オブジェクトＯＢ３等を除く、オブジェクトＯＢ１、ＯＢ２、ＯＢ１０１等の一部のオブジェクトを用いて、グラフを生成してもよい。生成部１３２は、データセットＤＳ１中の全オブジェクトを用いて、グラフＧＲ１１を生成する。生成部１３２は、グラフ生成に関する種々の技術を適宜用いて、グラフＧＲ１１を生成する。生成部１３２は、図１中のグラフＧＲ１１に示すように、ノードＮ１～Ｎ３、Ｎ４３、Ｎ５３等の複数のノード（ベクトル）を含むグラフ情報を生成する。

【0127】

生成部１３２は、各オブジェクトに対応する各ノードから所定数以上の出力エッジが他のエッジに連結されるように、グラフＧＲ１１を生成する。生成部１３２は、グラフＧＲ１１における各ノードが、そのノードとの間の距離が近い方から所定数のノードへのエッジ（出力エッジ）が連結されるようにグラフＧＲ１１を生成する。

【0128】

生成部１３２は、近似検索または近傍検索に関する種々の技術を適宜用いて、クエリＱＥ１に対応する近似正解検索結果を生成する。例えば、生成部１３２は、図１２に示すような処理により、クエリＱＥ１に対応する近似正解検索結果を生成する。この場合、生成部１３２は、後述する検索範囲係数「ε」の値を所定値以上大きくして、図１２に示すような処理をグラフＧＲ１１を用いて行うことにより、クエリＱＥ１に対応する近似正解検索結果を生成する。生成部１３２は、クエリＱＥ１に対応する近似正解検索結果ＲＲ１を生成する。

【0129】

（変換部１３３）
変換部１３３は、各種情報を変換する。変換部１３３は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を変換する。変換部１３３は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、変換用情報記憶部１２５等に基づいて、各種情報を変換する。変換部１３３は、取得部１３１により取得された各種情報に基づいて、種々の情報を変換する。変換部１３３は、生成部１３２により生成された各種情報に基づいて、種々の情報を変換する。変換部１３３は、検索部１３５により抽出された各種情報に基づいて、種々の情報を変換する。変換部１３３は、決定部１３４により決定された各種情報に基づいて、種々の情報を変換する。

【0130】

変換部１３３は、取得部１３１により取得された変換用情報に基づいて、評価指標の指定値を近似検索で用いるパラメータの値に変換する。変換部１３３は、評価指標の指定値を、グラフを用いた近似検索で用いるパラメータの値に変換する。変換部１３３は、ルックアップテーブルを参照して、評価指標の指定値を近似検索で用いるパラメータの値に変換する。変換部１３３は、評価指標の指定値を関数に入力することにより、評価指標の指定値を近似検索で用いるパラメータの値に変換する。

【0131】

変換部１３３は、ルックアップテーブルに評価指標の指定値が含まれない場合、補間処理により、評価指標の指定値からパラメータの値を求める。変換部１３３は、補間処理により、検索精度の指定値「ＶＬ１１－２」を検索範囲係数「ε」の値「ＶＬ２１－２」に変換する。

【0132】

（決定部１３４）
決定部１３４は、各種情報を決定する。決定部１３４は、各種情報を生成する。決定部１３４は、各種情報を選択する。決定部１３４は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を決定する。決定部１３４は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、変換用情報記憶部１２５等に基づいて、各種情報を決定する。

【0133】

決定部１３４は、取得部１３１により取得された各種情報に基づいて、種々の情報を決定する。決定部１３４は、取得部１３１により取得された各種情報に基づいて、種々の情報を判定する。決定部１３４は、変換部１３３により変換された各種情報に基づいて、種々の情報を決定する。決定部１３４は、検索部１３５により検索された各種情報に基づいて、種々の情報を決定する。

【0134】

決定部１３４は、評価用クエリを決定する。決定部１３４は、データセットＤＳ１から評価用クエリの生成に用いるオブジェクトを選択する。決定部１３４は、データセットＤＳ１からランダムに二つ以上の所定数のオブジェクトを評価用オブジェクトとして選択する。決定部１３４は、データセットＤＳ１からオブジェクトＯＢ５００とオブジェクトＯＢ１０００との２つのオブジェクトを評価用オブジェクトとして選択する。

【0135】

決定部１３４は、与えられたデータセットからクエリオブジェクトを生成する。決定部１３４は、データセットからランダムに選択したオブジェクト、または、ランダムに選択した二つ以上のオブジェクトの平均値であるクエリオブジェクト（評価用クエリ）を生成する。決定部１３４は、オブジェクトＯＢ５００とオブジェクトＯＢ１０００との平均である「７，３５，１３，９３．．．」の多次元のベクトル情報を生成する。決定部１３４は、評価用クエリＲＱ１に示すように、オブジェクトＯＢ５００とオブジェクトＯＢ１０００とに基づいて、クエリＱＥ１を生成する。

【0136】

（検索部１３５）
検索部１３５は、インデックスを用いた近似検索の処理を行う。検索部１３５は、記憶部１２０に記憶された各種情報に基づいて、種々の情報を検索する。検索部１３５は、オブジェクト情報記憶部１２１や、ツリー情報記憶部１２２や、グラフ情報記憶部１２３や、近似正解検索結果情報記憶部１２４や、変換用情報記憶部１２５等に基づいて、各種情報を検索する。検索部１３５は、取得部１３１により取得された各種情報に基づいて、種々の情報を検索する。検索部１３５は、生成部１３２により生成された各種情報に基づいて、種々の情報を検索する。検索部１３５は、変換部１３３により変換された各種情報に基づいて、種々の情報を検索する。検索部１３５は、決定部１３４により決定された各種情報に基づいて、種々の情報を検索する。検索部１３５は、検索により各種情報を抽出する。

【0137】

検索部１３５は、近似検索を、変換用情報に基づいて評価指標の指定値が変換されたパラメータの値を用いて実行する。検索部１３５は、クエリに近似（類似）するノードである近似ノードを抽出する。検索部１３５は、グラフ情報を探索することにより、オブジェクトを検索する。検索部１３５は、取得部１３１により取得されたクエリが取得された場合、グラフ情報を探索することにより、クエリに類似するオブジェクトを検索する。検索部１３５は、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。検索部１３５は、図１２に示すような処理手順に基づいて、グラフデータを探索することにより、クエリに類似するオブジェクトを抽出する。

【0138】

検索部１３５は、クエリＱＥ１を中心とする半径ｒ内の範囲ＡＲ１と、クエリＱＥ１を中心とする半径ｒ（１＋ε）内の範囲ＡＲ２とを用いて、グラフＧＲ１１を検索し、近似ノードを抽出する。検索部１３５は、検索範囲係数「ε」の値を「ＶＬ２１－２」に設定し、クエリＱＥ２１を対象としてグラフデータＧＤ１のグラフを用いた近似検索の処理を実行する。

【0139】

（提供部１３６）
提供部１３６は、各種情報を提供する。提供部１３６は、端末装置１０や情報提供装置５０に各種情報を提供する。提供部１３６は、端末装置１０に各種情報を送信する。提供部１３６は、検索部１３５により抽出された各種情報に基づいて、種々の情報を提供する。

【0140】

提供部１３６は、検索部１３５により抽出された近似ノードに関する情報を提供する。提供部１３６は、近似ノードに関する情報を所定のユーザが利用する端末装置１０（図４参照）に提供する。提供部１３６は、クエリの送信元へ検索結果を提供する。提供部１３６は、ユーザＵ１が利用する端末装置１０に検索結果を送信する。

【0141】

〔５．情報処理のフロー〕
次に、図１１を用いて、実施形態に係る情報処理システム１による情報処理の手順について説明する。図１１は、実施形態に係る情報処理の一例を示すフローチャートである。

【0142】

図１１に示すように、情報処理装置１００は、複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値を取得する（ステップＳ１０１）。例えば、情報処理装置１００は、オブジェクト情報記憶部１２１（図６参照）から、データセットＤＳ１を取得する。

【0143】

そして、情報処理装置１００は、評価指標の値に対応する近似検索で用いるパラメータの値を示す変換用情報を取得する（ステップＳ１０２）。例えば、情報処理装置１００は、変換用情報記憶部（図１０参照）から、ルックアップテーブルＴＢ１を取得する。

【0144】

そして、情報処理装置１００は、変換用情報に基づいて、評価指標の指定値を近似検索で用いるパラメータの値に変換する（ステップＳ１０３）。情報処理装置１００は、変換したパラメータの値を用いて近似検索を実行する（ステップＳ１０４）。

【0145】

〔６．検索処理のフロー〕
次に、情報処理装置１００による検索処理のフローについて、図１２を一例として説明する。図１２は、実施形態に係る情報処理の一例を示すフローチャートである。具体的には、図１２は、グラフデータを用いた検索処理の一例を示すフローチャートである。なお、図１２に示す検索処理には、選択処理も含まれる。以下に説明する検索処理は、情報処理装置１００によって行われる。また、以下でいうオブジェクトは、ノードと読み替えてもよい。なお、情報処理装置１００によるグラフデータを用いた検索は下記に限らず、種々の手順により行われてもよい。

【0146】

ここでは、近傍集合Ｎ（Ｇ，ｙ）は、ノードｙに付与されているエッジにより関連付けられている近傍のオブジェクトの集合である。例えば、近傍集合Ｎ（Ｇ，ｙ）は、ノードｙからの出力エッジが連結されたオブジェクト（ノード）の集合である。「Ｇ」は、所定のグラフデータ（例えば、グラフＧＲ１１等）であってもよい。例えば、情報処理装置１００は、ｋ近傍検索処理を実行する。

【0147】

例えば、情報処理装置１００は、超球の半径ｒを∞（無限大）に設定し（ステップＳ３００）、既存のオブジェクト集合から集合Ｓを抽出する（ステップＳ３０１）。例えば、情報処理装置１００は、起点ノードとして決定（選択）されたオブジェクト（ノード）を集合Ｓとして抽出してもよい。また、例えば、超球とは、検索範囲を示す仮想的な球である。なお、ステップＳ３０１において抽出された集合Ｓに含まれるオブジェクト（ノード）は、検索結果（抽出候補）の集合Ｒの初期集合にも含められる。また、ステップＳ３０１において抽出された集合Ｓに含まれるオブジェクト（ノード）は、集合Ｃに含められてもよい。集合Ｃは、重複検索を回避するために便宜上設けられるものであり、処理開始時には空集合に設定されてもよい。

【0148】

次に、情報処理装置１００は、集合Ｓに含まれるオブジェクトの中で、検索クエリオブジェクトをｙとするとオブジェクトｙとの距離が最も短いオブジェクトを抽出し、オブジェクトｓとする（ステップＳ３０２）。次に、情報処理装置１００は、オブジェクトｓを集合Ｓから除外する（ステップＳ３０３）。

【0149】

次に、情報処理装置１００は、オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えるか否かを判定する（ステップＳ３０４）。ここで、εは拡張要素であり、ｒ（１＋ε）は、探索範囲（この範囲内のノードのみを探索する。検索範囲よりも大きくすることで精度を高めることができる）の半径を示す値である。オブジェクトｓとオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超える場合（ステップＳ３０４：Ｙｅｓ）、情報処理装置１００は、集合Ｒをオブジェクトｙの近傍集合として出力し（ステップＳ３０５）、処理を終了する。

【0150】

オブジェクトｓと検索クエリオブジェクトｙとの距離ｄ（ｓ，ｙ）がｒ（１＋ε）を超えない場合（ステップＳ３０４：Ｎｏ）、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトの中から集合Ｃに含まれないオブジェクトを、所定の基準に基づいて一つ選択し、選択したオブジェクトｕを、集合Ｃに格納する（ステップＳ３０６）。

【0151】

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下であるか否かを判定する（ステップＳ３０７）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下である場合（ステップＳ３０７：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕを集合Ｓに追加する（ステップＳ３０８）。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ（１＋ε）以下ではない場合（ステップＳ３０７：Ｎｏ）、情報処理装置１００は、ステップＳ３０９の判定（処理）を行う。

【0152】

次に、情報処理装置１００は、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下であるか否かを判定する（ステップＳ３０９）。オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒを超える場合、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下ではない場合（ステップＳ３０９：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。

【0153】

オブジェクトｕとオブジェクトｙとの距離ｄ（ｕ，ｙ）がｒ以下である場合（ステップＳ３０９：Ｙｅｓ）、情報処理装置１００は、オブジェクトｕを集合Ｒに追加する（ステップＳ３１０）。そして、情報処理装置１００は、集合Ｒに含まれるオブジェクト数がｋｓを超えるか否かを判定する（ステップＳ３１１）。所定数ｋｓは、任意に定められる自然数である。例えば、ｋｓは、検索における抽出数を示し、「３」や「２０」や「１００」等の任意の値であってもよい。集合Ｒに含まれるオブジェクト数がｋｓを超えない場合（ステップＳ３１１：Ｎｏ）、情報処理装置１００は、ステップＳ３１３の判定（処理）を行う。

【0154】

集合Ｒに含まれるオブジェクト数がｋｓを超える場合（ステップＳ３１１：Ｙｅｓ）、情報処理装置１００は、集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトを、集合Ｒから除外する（ステップＳ３１２）。

【0155】

次に、情報処理装置１００は、集合Ｒに含まれるオブジェクト数がｋｓと一致するか否かを判定する（ステップＳ３１３）。集合Ｒに含まれるオブジェクト数がｋｓと一致しない場合（ステップＳ３１３：Ｎｏ）、情報処理装置１００は、ステップＳ３１５の判定（処理）を行う。また、集合Ｒに含まれるオブジェクト数がｋｓと一致する場合（ステップＳ３１３：Ｙｅｓ）、情報処理装置１００は、集合Ｒに含まれるオブジェクトの中でオブジェクトｙとの距離が最も長い（遠い）オブジェクトと、オブジェクトｙとの距離を、新たなｒに設定する（ステップＳ３１４）。

【0156】

そして、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから閾値に対応する個数のオブジェクトを選択したか否かを判定する（ステップＳ３１５）。なお、情報処理装置１００は、閾値を用いない場合、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから全てのオブジェクトを選択したか否かを判定してもよい。オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから閾値に対応する個数のオブジェクトを選択していない場合（ステップＳ３１５：Ｎｏ）、情報処理装置１００は、ステップＳ３０６に戻って処理を繰り返す。

【0157】

オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）の要素であるオブジェクトから閾値に対応する個数のオブジェクトを選択した場合（ステップＳ３１５：Ｙｅｓ）、情報処理装置１００は、集合Ｓが空集合であるか否かを判定する（ステップＳ３１６）。なお、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）から閾値に対応する個数までオブジェクトを選択する前であっても、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）中の全オブジェクトが選択済みである場合、ステップＳ３１６の処理を行ってもよい。すなわち、情報処理装置１００は、オブジェクトｓの近傍集合Ｎ（Ｇ，ｓ）中のオブジェクト数が閾値以下であり、近傍集合Ｎ（Ｇ，ｓ）中の全オブジェクトを選択した場合、ステップＳ３１５がＹｅｓである場合と同様に、ステップＳ３１６の処理を行ってもよい。集合Ｓが空集合でない場合（ステップＳ３１６：Ｎｏ）、情報処理装置１００は、ステップＳ３０２に戻って処理を繰り返す。また、集合Ｓが空集合である場合（ステップＳ３１６：Ｙｅｓ）、情報処理装置１００は、集合Ｒを出力し、処理を終了する（ステップＳ３１７）。例えば、情報処理装置１００は、集合Ｒに含まれるオブジェクト（ノード）を検索クエリ（入力オブジェクトｙ）に対応する検索結果として、検索を行った端末装置１０等へ提供してもよい。

【0158】

〔７．効果〕
上述してきたように、実施形態に係る情報処理装置１００は、取得部１３１と、変換部１３３とを有する。取得部１３１は、複数のオブジェクトを検索対象とするインデックスを用いた近似検索の評価指標の値を指定する指定値と、評価指標の値に対応する近似検索で用いるパラメータの値を示す変換用情報とを取得する。変換部１３３は、取得部１３１により取得された変換用情報に基づいて、評価指標の指定値を近似検索で用いるパラメータの値に変換する。

【0159】

このように、実施形態に係る情報処理装置１００は、指定された評価指標の値を、近似検索で用いるパラメータの値に変換することにより、指定された評価指標の値に対応するパラメータの値を適切に導出することができる。したがって、情報処理装置１００は、適切なパラメータの値を用いた近似検索を可能にすることができる。

【0160】

また、実施形態に係る情報処理装置１００において、取得部１３１は、複数のオブジェクトの各々に対応する複数のノードがエッジにより連結されたグラフをインデックスとして用いた近似検索の指定値を取得する。変換部１３３は、評価指標の指定値を、グラフを用いた近似検索で用いるパラメータの値に変換する。

【0161】

このように、実施形態に係る情報処理装置１００は、指定された評価指標の値を、グラフを用いた近似検索で用いるパラメータの値に変換することにより、指定された評価指標の値に対応するパラメータの値を適切に導出することができる。

【0162】

また、実施形態に係る情報処理装置１００において、パラメータは、グラフを用いた検索処理における探索範囲を決定するための係数である検索範囲係数である。

【0163】

このように、実施形態に係る情報処理装置１００は、グラフを用いた検索処理における探索範囲を決定するための係数である検索範囲係数の値を、指定された評価指標の値から適切に導出することができる。したがって、情報処理装置１００は、適切な検索範囲係数の値を用いた近似検索を可能にすることができる。

【0164】

また、実施形態に係る情報処理装置１００において、取得部１３１は、評価指標の各値とパラメータの各値との対応関係を示すルックアップテーブルを変換用情報として取得する。変換部１３３は、ルックアップテーブルを参照して、評価指標の指定値を近似検索で用いるパラメータの値に変換する。

【0165】

このように、実施形態に係る情報処理装置１００は、ルックアップテーブルを参照して、評価指標の指定値を近似検索で用いるパラメータの値に変換することにより、指定された評価指標の値に対応するパラメータの値を適切に導出することができる。

【0166】

また、実施形態に係る情報処理装置１００は、生成部１３２を有する。生成部１３２は、インデックスを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。

【0167】

このように、実施形態に係る情報処理装置１００は、ルックアップテーブルを生成することにより、ルックアップテーブルを参照して、指定された評価指標の値に対応するパラメータの値を適切に導出することができる。

【0168】

また、実施形態に係る情報処理装置１００において、生成部１３２は、複数のオブジェクトから選択された評価用オブジェクトに基づく評価用クエリを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。

【0169】

このように、実施形態に係る情報処理装置１００は、複数のオブジェクトから選択された評価用オブジェクトに基づく評価用クエリを用いた検索処理により、ルックアップテーブルを適切に生成することができる。

【0170】

また、実施形態に係る情報処理装置１００において、生成部１３２は、複数のオブジェクトから選択された複数の評価用オブジェクトを用いて生成される評価用クエリを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。

【0171】

このように、実施形態に係る情報処理装置１００は、複数のオブジェクトから選択された複数の評価用オブジェクトから生成される評価用クエリを用いた検索処理により、ルックアップテーブルを適切に生成することができる。

【0172】

また、実施形態に係る情報処理装置１００において、生成部１３２は、複数の評価用オブジェクトの平均を評価用クエリとする検索処理を含む生成処理により、ルックアップテーブルを生成する。

【0173】

このように、実施形態に係る情報処理装置１００は、複数の評価用オブジェクトの平均を評価用クエリとして用いた検索処理により、ルックアップテーブルを適切に生成することができる。

【0174】

また、実施形態に係る情報処理装置１００において、生成部１３２は、評価用クエリを用いた近似検索の結果である近似正解検索結果を生成し、生成した近似正解検索結果を用いた評価指標を測定する測定処理を含む生成処理により、ルックアップテーブルを生成する。

【0175】

このように、実施形態に係る情報処理装置１００は、近似正解検索結果を用いて評価指標を測定することにより、ルックアップテーブルを適切に生成することができる。

【0176】

また、実施形態に係る情報処理装置１００において、生成部１３２は、インデックスがグラフである場合、当該グラフを用いた検索処理における探索範囲を決定するための係数である検索範囲係数を調整することにより、近似正解検索結果を生成する。

【0177】

このように、実施形態に係る情報処理装置１００は、インデックスがグラフである場合、検索範囲係数を調整して生成した近似正解検索結果を用いて評価指標を測定することにより、ルックアップテーブルを適切に生成することができる。

【0178】

また、実施形態に係る情報処理装置１００において、生成部１３２は、検索範囲係数の値を第１値から増加させ、近似検索の結果に新たなオブジェクトが出現しなくなった時点の第２値を、近似正解検索結果を生成する際の検索範囲係数の値として用いる。

【0179】

このように、実施形態に係る情報処理装置１００は、検索範囲係数の値を変動させて、近似正解検索結果の生成に適切な検索範囲係数を導出することで、ルックアップテーブルを適切に生成することができる。

【0180】

また、実施形態に係る情報処理装置１００において、生成部１３２は、複数のオブジェクトから評価用オブジェクトを除いたオブジェクト群を検索対象とするインデックスを用いた検索処理を含む生成処理により、ルックアップテーブルを生成する。

【0181】

このように、実施形態に係る情報処理装置１００は、複数のオブジェクトから評価用オブジェクトを除いたオブジェクト群を検索対象とする検索処理により、ルックアップテーブルを適切に生成することができる。

【0182】

また、実施形態に係る情報処理装置１００において、生成部１３２は、パラメータの複数の値の各々を用いた検索処理により得られた評価指標の複数の値の各々を、対応するパラメータの複数の値の各々に対応付ける生成処理により、ルックアップテーブルを生成する。

【0183】

このように、実施形態に係る情報処理装置１００は、パラメータの各値と評価指標の各値とを対応付けることにより、ルックアップテーブルを適切に生成することができる。

【0184】

また、実施形態に係る情報処理装置１００において、生成部１３２は、ルックアップテーブルを用いて、評価指標の値を入力として、入力された評価指標の値に対応するパラメータに値を出力する関数を生成する。

【0185】

このように、実施形態に係る情報処理装置１００は、ルックアップテーブルを用いることで、評価指標の値を入力として、入力された評価指標の値に対応するパラメータに値を出力する関数を生成することができる。

【0186】

また、実施形態に係る情報処理装置１００において、取得部１３１は、評価指標の値を入力として、入力された評価指標の値に対応するパラメータに値を出力する関数を変換用情報として取得する。変換部１３３は、評価指標の指定値を関数に入力することにより、評価指標の指定値を近似検索で用いるパラメータの値に変換する。

【0187】

このように、実施形態に係る情報処理装置１００は、評価指標の指定値を関数に入力し、評価指標の指定値を近似検索で用いるパラメータの値に変換することにより、指定された評価指標の値に対応するパラメータの値を適切に導出することができる。

【0188】

また、実施形態に係る情報処理装置１００は、検索部１３５を有する。検索部１３５は、近似検索を、変換用情報に基づいて評価指標の指定値が変換されたパラメータの値を用いて実行する。

【0189】

このように、実施形態に係る情報処理装置１００は、近似検索を、変換用情報に基づいて評価指標の指定値が変換されたパラメータの値を用いて実行することで、適切なパラメータの値を用いた近似検索を行うことができる。

【0190】

また、実施形態に係る情報処理装置１００において、評価指標は、インデックスを用いた検索処理の検索精度である。

【0191】

このように、実施形態に係る情報処理装置１００は、インデックスを用いた検索処理の検索精度の値を、近似検索で用いるパラメータの値に変換することにより、指定された検索精度の値に対応するパラメータの値を適切に導出することができる。したがって、情報処理装置１００は、適切なパラメータの値を用いた近似検索を可能にすることができる。

【0192】

また、実施形態に係る情報処理装置１００において、評価指標は、インデックスを用いた検索処理の処理時間である。

【0193】

このように、実施形態に係る情報処理装置１００は、インデックスを用いた検索処理の処理時間の値を、近似検索で用いるパラメータの値に変換することにより、指定された処理時間の値に対応するパラメータの値を適切に導出することができる。したがって、情報処理装置１００は、適切なパラメータの値を用いた近似検索を可能にすることができる。

【0194】

また、実施形態に係る情報処理装置１００において、複数のオブジェクトの各々は、電子商取引サービスにおいて取引される取引対象に対応する。

【0195】

このように、実施形態に係る情報処理装置１００は、電子商取引サービスにおいて取引される取引対象に対応する複数のオブジェクトを対象とする近似検索を、適切なパラメータの値を用いて実行することを可能にすることができる。

【0196】

実施形態に係る情報検索装置（実施形態では情報処理装置１００）は、取得部１３１と、検索部１３５とを有する。取得部１３１は、複数のオブジェクトを検索対象とするインデックスと、インデックスを用いた近似検索の評価指標の値を指定する指定値と、評価指標の値に対応する近似検索で用いるパラメータの値を示す変換用情報とを取得する。検索部１３５は、近似検索を、変換用情報に基づいて評価指標の指定値が変換されたパラメータの値を用いて実行する。

【0197】

このように、実施形態に係る情報処理装置１００は、インデックスを用いた近似検索を、変換用情報に基づいて評価指標の指定値が変換されたパラメータの値を用いて実行することにより、適切なパラメータの値を用いた近似検索を可能にすることができる。

【0198】

〔８．ハードウェア構成〕
上述してきた実施形態に係る情報処理装置１００は、例えば図１３に示すような構成のコンピュータ１０００によって実現される。図１３は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ１０００は、ＣＰＵ１１００、ＲＡＭ１２００、ＲＯＭ（Read Only Memory）１３００、ＨＤＤ（Hard Disk Drive）１４００、通信インターフェイス（Ｉ／Ｆ）１５００、入出力インターフェイス（Ｉ／Ｆ）１６００、及びメディアインターフェイス（Ｉ／Ｆ）１７００を有する。

【0199】

ＣＰＵ１１００は、ＲＯＭ１３００またはＨＤＤ１４００に格納されたプログラムに基づいて動作し、各部の制御を行う。ＲＯＭ１３００は、コンピュータ１０００の起動時にＣＰＵ１１００によって実行されるブートプログラムや、コンピュータ１０００のハードウェアに依存するプログラム等を格納する。

【0200】

ＨＤＤ１４００は、ＣＰＵ１１００によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス１５００は、ネットワークＮを介して他の機器からデータを受信してＣＰＵ１１００へ送り、ＣＰＵ１１００が生成したデータをネットワークＮを介して他の機器へ送信する。

【0201】

ＣＰＵ１１００は、入出力インターフェイス１６００を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。ＣＰＵ１１００は、入出力インターフェイス１６００を介して、入力装置からデータを取得する。また、ＣＰＵ１１００は、生成したデータを入出力インターフェイス１６００を介して出力装置へ出力する。

【0202】

メディアインターフェイス１７００は、記録媒体１８００に格納されたプログラムまたはデータを読み取り、ＲＡＭ１２００を介してＣＰＵ１１００に提供する。ＣＰＵ１１００は、かかるプログラムを、メディアインターフェイス１７００を介して記録媒体１８００からＲＡＭ１２００上にロードし、ロードしたプログラムを実行する。記録媒体１８００は、例えばＤＶＤ（Digital Versatile Disc）、ＰＤ（Phase change rewritable Disk）等の光学記録媒体、ＭＯ（Magneto-Optical disk）等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。

【0203】

例えば、コンピュータ１０００が実施形態に係る情報処理装置１００として機能する場合、コンピュータ１０００のＣＰＵ１１００は、ＲＡＭ１２００上にロードされたプログラムを実行することにより、制御部１３０の機能を実現する。コンピュータ１０００のＣＰＵ１１００は、これらのプログラムを記録媒体１８００から読み取って実行するが、他の例として、他の装置からネットワークＮを介してこれらのプログラムを取得してもよい。

【0204】

以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。

【0205】

〔９．その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。

【0206】

また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。

【0207】

また、上述してきた各実施形態に記載された各処理は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。

【0208】

また、上述してきた「部（section、module、unit）」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。

【符号の説明】

【0209】

１情報処理システム
１００情報処理装置
１２０記憶部
１２１オブジェクト情報記憶部
１２２ツリー情報記憶部
１２３グラフ情報記憶部
１２４近似正解検索結果情報記憶部
１２５変換用情報記憶部
１３０制御部
１３１取得部
１３２生成部
１３３変換部
１３４決定部
１３５検索部
１３６提供部
１０端末装置
５０情報提供装置
Ｎネットワーク

【図1】