特許7375657 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 富士通株式会社の特許一覧

特許7375657検索プログラム、検索方法、及び、検索装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-10-30

(45)【発行日】2023-11-08

(54)【発明の名称】検索プログラム、検索方法、及び、検索装置

(51)【国際特許分類】

G06F 16/9032 20190101AFI20231031BHJP

G06F 16/9038 20190101ALI20231031BHJP

【ＦＩ】

G06F16/9032

G06F16/9038

【請求項の数】 8

(21)【出願番号】P 2020065952

(22)【出願日】2020-04-01

(65)【公開番号】P2021163316

(43)【公開日】2021-10-11

【審査請求日】2023-01-12

(73)【特許権者】

【識別番号】000005223

【氏名又は名称】富士通株式会社

(74)【代理人】

【識別番号】100092978

【弁理士】

【氏名又は名称】真田有

(74)【代理人】

【識別番号】100189201

【弁理士】

【氏名又は名称】横田功

(72)【発明者】

【氏名】森川裕章

【審査官】松尾真人

(56)【参考文献】

【文献】特許第５３１５４８５（ＪＰ，Ｂ１）

【文献】米国特許出願公開第２０１９／０１１４３２５（ＵＳ，Ａ１）

【文献】米国特許出願公開第２０１９／０３９２０７７（ＵＳ，Ａ１）

【文献】特開平０７－２３４８７７（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

特定のカテゴリの指定を受け付け、
ナレッジグラフにおける前記特定のカテゴリに関連付けられた複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数に基づく第１指標と、前記ナレッジグラフにおける前記特定のカテゴリと前記複数のファセットのそれぞれとの距離に基づく第２指標と、のうち少なくとも一方に基づいて算出される前記複数のファセットの優先度に応じて、前記複数のファセットを順に並べて出力する、
処理をコンピュータに実行させる、検索プログラム。

【請求項2】

前記第１指標は、前記ナレッジグラフにおける全てのカテゴリの個数を、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数でそれぞれ除算した結果を含む、
請求項１に記載の検索プログラム。

【請求項3】

前記複数のファセットのそれぞれについての前記結果を含む前記第１指標を算出し、
算出した前記第１指標を含む情報を記憶領域に格納する、
処理を前記コンピュータに実行させる、請求項２に記載の検索プログラム。

【請求項4】

前記第２指標は、前記ナレッジグラフにおける前記特定のカテゴリの階層と、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの階層のそれぞれとの距離に基づく、
請求項１～請求項３のいずれか１項に記載の検索プログラム。

【請求項5】

前記第２指標は、前記複数のファセットのそれぞれが標準語彙であるか否かに基づく、
請求項１～請求項４のいずれか１項に記載の検索プログラム。

【請求項6】

前記出力する処理は、前記特定のカテゴリの指定を受け付けた画面からの遷移先である検索画面であって、前記特定のカテゴリに関連付けられた前記複数のファセットを対象とした検索を行なうための前記検索画面に、前記複数のファセットの優先度に応じて順に並べた前記複数のファセットを表示する処理を含む、
請求項１～請求項５のいずれか１項に記載の検索プログラム。

【請求項7】

【請求項8】

特定のカテゴリの指定を受け付ける受付部と、
ナレッジグラフにおける前記特定のカテゴリに関連付けられた複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数に基づく第１指標と、前記ナレッジグラフにおける前記特定のカテゴリと前記複数のファセットのそれぞれとの距離に基づく第２指標と、のうち少なくとも一方に基づいて算出される前記複数のファセットの優先度に応じて、前記複数のファセットを順に並べて出力する出力部と、
を備える、検索装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、検索プログラム、検索方法、及び、検索装置に関する。

【背景技術】

【0002】

様々な情報源から情報を収集した知識ベース（ＫＢ；Knowledge Base）の一例として、ナレッジグラフ（ＫＧ；Knowledge Graph）が知られている。

【0003】

ＫＧは、例えば、ＫＧが格納するデータ全体を対象としたファセット検索（Faceted Search）に利用されることがある。ファセット検索は、データ検索システムにより用意された検索条件をユーザが選択することで、ＫＧ内のコンテンツの絞り込みを可能とする検索手法である。

【先行技術文献】

【特許文献】

【0004】

【文献】特表２０１１－５１３８１９号公報

【文献】特表２００５－５１４６７３号公報

【非特許文献】

【0005】

【文献】駒水孝裕、天笠俊之、北川博之，“D-022 XMLデータに対するファセット検索のためのファセット抽出の自動化”，第13回情報科学技術フォーラム（FIT2014），第2分冊第133頁－第134頁，2014年

【文献】駒水孝裕、天笠俊之、北川博之，“XMLデータに対するファセットナビゲーションのためのフレームワークFoXの提案”，第1回データ工学と情報マネジメントに関するフォーラム（DEIM），B7-6，2009年

【発明の概要】

【発明が解決しようとする課題】

【0006】

ファセット検索において、ＫＧデータを或る特定のカテゴリに絞り込んで検索を行なう場合、適切なキー（ファセットキー）による絞り込みが行なわれない場合がある。

【0007】

例えば、プロ野球選手というカテゴリの場合、当該カテゴリとの関連度が高い、打席や利き腕、甲子園出場経験等の適切なファセットキーで絞り込むことで、ユーザの知識に即したファセット検索が可能となる。

【0008】

しかし、従来のファセット検索システムでは、或る特定のカテゴリに絞り込んだ検索を行なう場合であっても、生年月日や出身地、会社種別等の、重要ではない又は適切ではないファセットキーにより絞り込みが行なわれる場合がある。

【0009】

このように、適切なファセットキーによる絞り込みが行なわれない場合、ファセット検索において、ユーザの目的のデータに辿り着くまでの手番が増加する可能性がある。

【0010】

１つの側面では、本発明は、カテゴリに関連付けられたファセットの集合から適切な複数のファセットを出力することを目的の１つとする。

【課題を解決するための手段】

【0011】

１つの側面では、検索プログラムは、コンピュータに、以下の処理を実行させてよい。前記処理は、特定のカテゴリの指定を受け付けてよい。また、前記処理は、ナレッジグラフにおける前記特定のカテゴリに関連付けられた複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数に基づく第１指標と、前記ナレッジグラフにおける前記特定のカテゴリと前記複数のファセットのそれぞれとの距離に基づく第２指標と、のうち少なくとも一方に基づいて算出される前記複数のファセットの優先度に応じて、前記複数のファセットを順に並べて出力してよい。

【発明の効果】

【0012】

１つの側面では、本発明は、カテゴリに関連付けられたファセットの集合から適切な複数のファセットを出力することができる。

【図面の簡単な説明】

【0013】

【図1】ＲＤＦ（Resource Description Framework）の記述方式の一例であるグラフ形式の表現例を示す図である。

【図2】ＫＧデータにおける、カテゴリによる絞り込み対象と、カテゴリごとのファセットとを例示する図である。

【図3】ファセット検索システムのＵＩ（User Interface）の画面表示例を示す図である。

【図4】一実施形態に係るファセット検索システムの機能構成例を示すブロック図である。

【図5】サーバの機能を実現するコンピュータのハードウェア構成例を示すブロック図である。

【図6】頻度表作成部による頻度表の作成処理の一例を示す図である。

【図7】クラス集合、Ｐ頻度表、及び、ＰＯ頻度表の一例を示す図である。

【図8】各指標の算出式の一例を示す図である。

【図9】指標値の一例を示す図である。

【図10】カテゴリ重要度を表形式で表したカテゴリ重要度表の一例を示す図である。

【図11】ファセットスコアを表形式で表したファセットスコア表の一例を示す図である。

【図12】ＲＤＦスキーマにおける、クラス及びファセットキーを表すグラフの一例を示す図である。

【図13】ＲＤＦスキーマにおける、クラス及びファセットキーを表すグラフの一例を示す図である。

【図14】スコア（org_score）、ファセットスコア（new_score）、スコア（ont_score）、並びに、最終的なスコア（final_score）を表形式で例示する図である。

【図15】項目一覧領域に表示されるファセットキーの一例を示す図である。

【図16】“org_score”及び“new_score”のそれぞれをベースとしてファセットキーをソートした場合のＭＲＲ（Mean Reciprocal Rank）の比較例を示す図である。

【図17】“new_score”及び“final_score”のそれぞれをベースとしてファセットキーをソートした場合のＭＲＲの比較例を示す図である。

【図18】一実施形態に係るＤＢ（Database）作成処理の動作例を説明するフローチャートである。

【図19】図１８のステップＳ１の頻度表作成処理の動作例を説明するフローチャートである。

【図20】図１８のステップＳ２のスコアＤＢ作成処理の動作例を説明するフローチャートである。

【図21】一実施形態に係るファセット検索処理の動作例を説明するフローチャートである。

【発明を実施するための形態】

【0014】

以下、図面を参照して本発明の実施の形態を説明する。ただし、以下に説明する実施形態は、あくまでも例示であり、以下に明示しない種々の変形又は技術の適用を排除する意図はない。例えば、本実施形態を、その趣旨を逸脱しない範囲で種々変形して実施することができる。なお、以下の説明で用いる図面において、同一符号を付した部分は、特に断らない限り、同一若しくは同様の部分を表す。

【0015】

〔１〕一実施形態
〔１－１〕ファセット検索システムの説明
まず、ファセット検索システムについて簡単に説明する。ファセット検索システムは、例えば、大規模なナレッジグラフ（ＫＧ）に対するファセット検索を行なうためのシステムである。

【0016】

一実施形態に係るファセット検索システムは、例えば、ＫＧ内の検索対象のデータ全体に対するファセット検索を実施する代わりに、カテゴリで候補を絞り込み、その後、カテゴリ内のファセット検索を実施することにより、効率化を実現する。

【0017】

ＫＧに格納されるデータは、主語（Subject）、述語（Predicate）、目的語（Object）の３つの要素を１セットとする、ＲＤＦ（Resource Description Framework）と呼ばれる記述方式により表現される。

【0018】

ＫＧを利用するファセット検索において、カテゴリは、インスタンスのクラスである。また、ファセットキーは、「述語」となり、ファセット値は、「目的語」となる。ファセット検索により、ファセット検索システムは、検索条件に合致したインスタンス、例えば「主語」の集合を探索する。

【0019】

ここで、「インスタンス」とは、世の中の事象や事物を表現するものであり、エンティティとも呼ばれる。例えば、野球選手である「山田太郎」は、インスタンスの一例であり、「山田太郎」のように文字列で表されてもよく、ＤＢ（Database）内のＩＤで表されてもよい。

【0020】

ＤＢの一例としては、データ（オープンデータ）を格納しインターネット上で公開する種々のＤＢ、例えば、ＬＯＤ（Linked Open Data）の技術を利用するＤＢが挙げられる。

【0021】

当該ＤＢ内のＩＤとは、当該ＤＢにおいて「山田太郎」の情報を参照できる場所のＵＲＩ（Uniform Resource Indicator）、例えば「山田太郎」の記事を含むウェブ（Ｗｅｂ）ページのＵＲＬ（Uniform Resource Locator）が挙げられる。一例として、ＤＢのドメインが“aaa.org”である場合、「山田太郎」のＤＢ内のＩＤは、“http://aaa.org/resource/Taro_Yamada”となる。

【0022】

一実施形態において、ＫＧには、インスタンスとして、１以上のＤＢ内のＩＤが設定可能であってよい。換言すれば、ＫＧは、情報源として１以上のＤＢから情報を収集した知識ベースである。

【0023】

「クラス」とは、インスタンスの種別を表すものであり、例えば、「山田太郎」のクラスは、「野球選手」である。インスタンスは、複数のクラスに属する場合があり、「山田太郎」は、「野球選手」“http://aaa.org/ontology/BaseballPlayer”であり、「アスリート」“http://aaa.org/ontology/Athlete”であり、「人」“http://aaa.org/ontology/Person”である。

【0024】

クラスは、上位及び下位の関係を保持できる。例えば、ＲＤＦスキーマを利用すると、“BaseballPlayer”（野球選手）と“Athlete”（アスリート）は、“rdfs:subClassOf”（サブクラス）の関係となる。

【0025】

以下、ＲＤＦスキーマ（ＲＤＦＳスキーマと称されてもよい）、及び、他の標準語彙や独自に定義した語彙を利用して定義したスキーマを、「オントロジー」（Ontology）と呼ぶ。

【0026】

図１は、ＲＤＦの記述方式の一例であるグラフ形式の表現例を示す図である。なお、図１の説明では、東京都の知事である「鈴木花子」について、ＤＢ“http://aaa.org/”内のＵＲＩをインスタンスに含む例を示す。

【0027】

また、以下に、図１に示す表現例をテキスト（ｎ３）形式で示す。

【0028】

<http://ja.aaa.org/resource/東京都> <http://aaaa.org/ontology/leader> <http://ja.aaa.org/resource/鈴木花子>.
<http://ja.aaa.org/resource/鈴木花子>
rdf:type <http://aaa.org/ontology/Politician>;
<http://aaa.org/ontology/birthPlace> <http://ja.aaa.org/resource/兵庫県>;
<http://aaa.org/ontology/birthDate> “1960-01-01”.

【0029】

このように、ＲＤＦは、「もの」、「こと」を、「主語」（Ｓ；Subject）、「述語」（Ｐ；Predicate）、「目的語」（Ｏ；Object）の３つ組みで表現する。図１及び上記テキスト（ｎ３）形式で示す表現例により、以下のように「もの」、「こと」が整理される。なお、“rdf:type”は、インスタンスとクラスとの関係を定義する述語である。

【0030】

「東京都（Ｓ）の知事（Ｐ）は鈴木花子（Ｏ）である」
「鈴木花子（Ｓ）は（Ｐ）政治家（Ｏ）、出身（Ｐ）は兵庫県（Ｏ）、生年月日（Ｐ）は1960-01-01（Ｏ）である」

【0031】

図２は、ＫＧデータにおける、カテゴリによる絞り込み対象と、カテゴリごとのファセットとを例示する図である。例えば、ＫＧデータは、「主語」、「述語」、「目的語」のセットとして、「山田太郎」、「rdf:type」、「プロ野球選手」のセットや、「山田太郎」、「打席」、「左」のセットを含んでよい。

【0032】

ファセット検索システムは、例えば、「事物」から「人」又は「組織」、「人」から「政治家」、「プロ野球選手」又は「サッカー選手」、「組織」から「会社」又は「プロ野球チーム」のように、階層的に、カテゴリの絞り込み（探索）を可能としてよい。

【0033】

例えば、ユーザは、ファセット検索システムにおいて、いずれかのカテゴリのファセットを選択し、提示された候補となる値を選択することで、検索結果を絞り込むことができる。なお、図２の例において、「政治家」のカテゴリに着目すると、ファセットは、｛名前、所属政党、出身地、生年月日｝であり、それぞれに対応付けられる文字列やＤＢ内のＩＤがファセットに対する値である。

【0034】

図３は、ファセット検索システムのＵＩ（User Interface）の画面表示例を示す図である。図３に示すように、ファセット検索システムのＵＩは、ユーザの端末に表示する画面として、カテゴリ探索画面１００と、カテゴリ探索画面１００から遷移するファセット検索画面２００とを含んでよい。

【0035】

カテゴリ探索画面１００は、ＫＧデータからカテゴリを絞り込むための画面、換言すれば、特定のカテゴリの指定を受け付ける画面であり、例えば、カテゴリの選択領域１１０及びクラスの選択領域１２０を含んでよい。なお、カテゴリ探索画面１００は、ファセット検索画面２００において保存された検索条件を表示するためのボタン１３０を含んでもよい。

【0036】

選択領域１１０は、例えば、図２に示す「事物」からデータセット、例えば「人」又は「組織」の選択を受け付けるための領域であり、図３の例では「データセットＡ」及び「データセットＢ」が表示されている。選択領域１２０は、選択領域１１０で選択された「人」又は「組織」に対応付けられたクラスの一覧を表示する領域であって、例えば、図２に示す「人」から「政治家」、「プロ野球選手」又は「サッカー選手」等の選択を受け付けるための領域である。

【0037】

なお、図３の例では、便宜上、選択領域１１０を「データセット」、選択領域１２０を「クラス」の選択領域と表記しているが、選択領域１１０及び１２０で選択された「データセット」の「クラス」を「カテゴリ」と捉えてよい。

【0038】

ＵＩは、選択領域１２０で選択されたクラス（カテゴリ）の情報に基づき、ファセット検索画面２００を表示する。

【0039】

ファセット検索画面２００は、カテゴリ探索画面１００で選択されたクラス（カテゴリ）から、ファセットを検索するための画面である。すなわち、ファセット検索画面２００は、カテゴリ探索画面１００からの遷移先である検索画面であって、特定のカテゴリに関連付けられた複数のファセットを対象とした検索を行なうための検索画面である。

【0040】

ファセット検索画面２００は、例えば、項目一覧領域２１０、検索条件の設定領域２３０、出力項目の設定領域２５０、出力言語の設定領域２６０、及び、一覧表示領域２８０を含んでよい。

【0041】

項目一覧領域２１０は、カテゴリ探索画面１００で選択されたクラス（カテゴリ）に基づき、ＫＧデータ内のファセットキーを表示する領域である。

【0042】

検索条件の設定領域２３０は、項目一覧領域２１０で選択された状態で追加ボタン２２０が押下されたファセットキーについての検索条件を設定するための領域である。出力項目の設定領域２５０は、項目一覧領域２１０で選択された状態で追加ボタン２４０が押下されたファセットキーについて、エンティティを出力する項目及び出力順序を設定するための領域である。出力言語の設定領域２５０は、エンティティの出力言語を設定するための領域である。

【0043】

一覧表示領域２８０は、検索ボタン２７０が押下された場合に、設定領域２３０、２５０及び２６０の設定内容に基づき、エンティティの一覧を表示する領域である。

【0044】

なお、ファセット検索画面２００は、一覧表示領域２８０の表示内容や、設定領域２３０、２５０及び２６０の設定内容、項目一覧領域２１０の表示内容、のいずれか１つ以上についての操作ボタン２９０を表示してもよい。操作ボタン２９０は、例えば、ＣＳＶ（Comma Separated Value）形式での出力ボタン、ＲＤＦ問合せ言語の一例であるＳＰＡＲＱＬ（SPARQL Protocol and RDF Query Language）文の確認ボタン、及び、検索条件の保存ボタン、等を含んでよい。

【0045】

ところで、ファセット検索画面２００における項目一覧領域２１０には、カテゴリに適したファセットキーが表示されない場合がある。以下、このような場合を比較例として説明する。

【0046】

（比較例）
例えば、図３に示す画面表示を、非特許文献１に記載された技術を用いて実行する場合を想定する。この技術では、例えば、サーバは、ＸＭＬ（eXtensible Markup Language）データを用いて、以下の手順でファセットの値の抽出を行なう。

【0047】

（ｉ）サーバは、ＸＭＬデータから構造要約を抽出する。
構造要約は、ＸＭＬデータ中の各要素の親子関係や、親要素に対する子要素の出現頻度等を示す情報である。

【0048】

（ii）構造要約からクラス候補及びファセット候補を抽出する。
なお、上記技術においては、構造要約内の或るノードでＸＭＬデータ中のオブジェクトに対応するものをクラスといい、構造要約中のクラスノードの子孫ノードのうちの、選ばれたノードをファセットという。

【0049】

（iii）クラス候補及びファセット候補から適切なものを抽出する。
（iv）ＸＭＬデータから抽出されたクラスに該当するＸＭＬ部分木をオブジェクトとして抽出する。
（ｖ）抽出されたファセットに該当する要素の値をファセットの値として抽出する。

【0050】

例えば、サーバは、上記（ｉ）～（ｖ）の手順において、ＸＭＬデータに代えて、ＲＤＦの記述形式のＫＧデータを対象とすることが考えられる。

【0051】

非特許文献１に記載された技術において、上記（iii）の手順では、サーバは、頻度によるアプローチと、意味に基づくアプローチとを組み合わせた手法を採用する。頻度によるアプローチでは、サーバは、ＫＧデータ内でより多くのインスタンスを取得できるファセットキーを抽出することができる。意味に基づくアプローチでは、サーバは、WordNetやWikipedia（登録商標）等の既存知識を利用し、ファセットキーが人間により解釈可能か否かを判定する。

【0052】

なお、上記技術では、ファセットキーの重要度については考慮されていない。一方、非特許文献２には、ファセットキーをランキングする指標が記載されている。

【0053】

ここで、非特許文献１及び２に記載された技術を用いて、ファセット検索画面２００における項目一覧領域２１０を表示する場合、換言すれば、或る特定のカテゴリ内のファセット検索を行なう場合を考える。或る特定のカテゴリ内のファセット検索を行なう場合、カテゴリ固有のファセットキーで絞り込んだ方が良いケースがある。例えば、カテゴリ探索画面１００において、プロ野球選手というカテゴリが選択された場合を想定する。

【0054】

この場合、非特許文献２に記載された技術では、ＫＧデータ全体の統計的傾向により、甲子園出場経験よりも、出身地や生年月日が重要なファセットキーとして上位にランキングされてしまう。

【0055】

また、非特許文献１に記載された技術では、知識ベースにファセットが存在するか否かを利用するに留まっており、知識のオントロジーは利用されない。例えば、「日付」のファセットキーについて、人の場合は「生まれた日」、プロ野球選手の場合は「初出場の年月日」等の方が重要なファセットとなる。これらの情報は、オントロジー等によりＫＧの中で構造化されている。

【0056】

しかし、プロ野球選手というカテゴリが選択された場合、ファセットキーとして、生年月日や出身地、会社種別等よりも、打席や利き腕、甲子園出場経験等で絞り込まれる方が、ユーザの知識に即したファセット検索を実現できる。

【0057】

そこで、以下で説明する一実施形態に係るファセット検索システムは、主に、下記（ａ）及び（ｂ）の手法を採用して、項目一覧領域２１０に表示する、カテゴリに適したファセットキーのランキングを行なう。

【0058】

（ａ）カテゴリ固有のファセットキーを重要視する指標の導入。
（ｂ）ＫＧの知識構造を考慮したファセットキーの意味解釈の実施。

【0059】

これにより、カテゴリに関連付けられたファセットの集合から適切な複数のファセットを出力することができ、ユーザの目的のデータに辿り着くまでの手番を減少させることができる。

【0060】

〔１－２〕ファセット検索システムの構成例
図４は、一実施形態に係るファセット検索システム１の機能構成例を示すブロック図である。ファセット検索システム１は、ファセット検索を行なう検索システムの一例であり、図４に示すように、例示的に、サーバ２、ナレッジグラフ（ＫＧ）３、及び、１以上（図４の例では１台）の端末４を備えてよい。

【0061】

ＫＧ３は、知識ベースの一例であり、例えば、ＲＤＦの記述形式で記述されたデータを記憶してよい。

【0062】

端末４は、ファセット検索システム１のユーザが使用する情報処理端末の一例であり、サーバ２に対してファセットの検索に関するアクセスを行なうＰＣ（Personal Computer）又はサーバ等のコンピュータである。

【0063】

ＫＧ３とサーバ２との間、及び、端末４とサーバ２との間は、それぞれ、図示しないネットワークを介して相互に通信可能に接続されてよい。ネットワークは、ＷＡＮ（Wide Area Network）、ＬＡＮ（Local Area Network）、又はこれらの組み合わせを含んでよい。ＷＡＮにはインターネットが含まれてよく、ＬＡＮにはＶＰＮ（Virtual Private Network）が含まれてよい。

【0064】

サーバ２は、検索装置、情報処理装置、又は、コンピュータの一例である。例えば、サーバ２は、ファセット検索システム１において、端末４からのファセットの検索に関する種々のアクセスに応じて、ＫＧ３の参照、端末４への応答や情報の通知等の種々の処理を行なう。

【0065】

サーバ２は、例えば、端末４に対して、アクセスを可能とするための機能を提供してよい。当該機能としては、例えば、端末４によるアクセスに用いられる、ウェブページ等の画面の生成及び表示制御が挙げられる。例えば、端末４は、ブラウザ等のアプリケーションを用いてサーバ２にアクセス要求を送信し、サーバ２から受信する画面情報に基づきアプリケーションに表示されるウェブページを介して、サーバ２へのアクセスを行なってよい。

【0066】

サーバ２は、仮想サーバ（ＶＭ；Virtual Machine）であってもよいし、物理サーバであってもよい。また、サーバ２の機能は、１台のコンピュータにより実現されてもよいし、２台以上のコンピュータにより実現されてもよい。さらに、サーバ２の機能のうちの少なくとも一部は、クラウド環境により提供されるＨＷ（Hardware）リソース及びＮＷ（Network）リソースを用いて実現されてもよい。

【0067】

（ハードウェア構成例）
図５は、サーバ２の機能を実現するコンピュータ１０のハードウェア（ＨＷ）構成例を示すブロック図である。サーバ２の機能を実現するＨＷリソースとして、複数のコンピュータが用いられる場合は、各コンピュータが図５に例示するＨＷ構成を備えてよい。

【0068】

図５に示すように、コンピュータ１０は、ＨＷ構成として、例示的に、プロセッサ１０ａ、メモリ１０ｂ、記憶部１０ｃ、ＩＦ（Interface）部１０ｄ、Ｉ／Ｏ（Input / Output）部１０ｅ、及び読取部１０ｆを備えてよい。

【0069】

プロセッサ１０ａは、種々の制御や演算を行なう演算処理装置の一例である。プロセッサ１０ａは、コンピュータ１０内の各ブロックとバス１０ｉで相互に通信可能に接続されてよい。なお、プロセッサ１０ａは、複数のプロセッサを含むマルチプロセッサであってもよいし、複数のプロセッサコアを有するマルチコアプロセッサであってもよく、或いは、マルチコアプロセッサを複数有する構成であってもよい。

【0070】

プロセッサ１０ａとしては、例えば、ＣＰＵ、ＭＰＵ、ＧＰＵ、ＡＰＵ、ＤＳＰ、ＡＳＩＣ、ＦＰＧＡ等の集積回路（ＩＣ；Integrated Circuit）が挙げられる。なお、プロセッサ１０ａとして、これらの集積回路の２以上の組み合わせが用いられてもよい。ＣＰＵはCentral Processing Unitの略称であり、ＭＰＵはMicro Processing Unitの略称である。ＧＰＵはGraphics Processing Unitの略称であり、ＡＰＵはAccelerated Processing Unitの略称である。ＤＳＰはDigital Signal Processorの略称であり、ＡＳＩＣはApplication Specific ICの略称であり、ＦＰＧＡはField-Programmable Gate Arrayの略称である。

【0071】

メモリ１０ｂは、種々のデータやプログラム等の情報を格納するＨＷの一例である。メモリ１０ｂとしては、例えばＤＲＡＭ（Dynamic Random Access Memory）等の揮発性メモリ、及び、ＰＭ（Persistent Memory）等の不揮発性メモリ、の一方又は双方が挙げられる。

【0072】

記憶部１０ｃは、種々のデータやプログラム等の情報を格納するＨＷの一例である。記憶部１０ｃとしては、ＨＤＤ（Hard Disk Drive）等の磁気ディスク装置、ＳＳＤ（Solid State Drive）等の半導体ドライブ装置、不揮発性メモリ等の各種記憶装置が挙げられる。不揮発性メモリとしては、例えば、フラッシュメモリ、ＳＣＭ（Storage Class Memory）、ＲＯＭ（Read Only Memory）等が挙げられる。

【0073】

また、記憶部１０ｃは、コンピュータ１０の各種機能の全部若しくは一部を実現するプログラム１０ｇ（検索プログラム）を格納してよい。例えば、サーバ２のプロセッサ１０ａは、記憶部１０ｃに格納されたプログラム１０ｇをメモリ１０ｂに展開して実行することにより、図４に例示するサーバ２としての機能を実現できる。

【0074】

ＩＦ部１０ｄは、ネットワークとの間の接続及び通信の制御等を行なう通信ＩＦの一例である。例えば、ＩＦ部１０ｄは、イーサネット（登録商標）等のＬＡＮ（Local Area Network）、或いは、ＦＣ（Fibre Channel）等の光通信等に準拠したアダプタを含んでよい。当該アダプタは、無線及び有線の一方又は双方の通信方式に対応してよい。例えば、サーバ２は、ＩＦ部１０ｄを介して、ＫＧ３及び端末４のそれぞれと相互に通信可能に接続されてよい。また、例えば、プログラム１０ｇは、当該通信ＩＦを介して、ネットワークからコンピュータ１０にダウンロードされ、記憶部１０ｃに格納されてもよい。

【0075】

Ｉ／Ｏ部１０ｅは、入力装置、及び、出力装置、の一方又は双方を含んでよい。入力装置としては、例えば、キーボード、マウス、タッチパネル等が挙げられる。出力装置としては、例えば、モニタ、プロジェクタ、プリンタ等が挙げられる。

【0076】

読取部１０ｆは、記録媒体１０ｈに記録されたデータやプログラムの情報を読み出すリーダの一例である。読取部１０ｆは、記録媒体１０ｈを接続可能又は挿入可能な接続端子又は装置を含んでよい。読取部１０ｆとしては、例えば、ＵＳＢ（Universal Serial Bus）等に準拠したアダプタ、記録ディスクへのアクセスを行なうドライブ装置、ＳＤカード等のフラッシュメモリへのアクセスを行なうカードリーダ等が挙げられる。なお、記録媒体１０ｈにはプログラム１０ｇが格納されてもよく、読取部１０ｆが記録媒体１０ｈからプログラム１０ｇを読み出して記憶部１０ｃに格納してもよい。

【0077】

記録媒体１０ｈとしては、例示的に、磁気／光ディスクやフラッシュメモリ等の非一時的なコンピュータ読取可能な記録媒体が挙げられる。磁気／光ディスクとしては、例示的に、フレキシブルディスク、ＣＤ（Compact Disc）、ＤＶＤ（Digital Versatile Disc）、ブルーレイディスク、ＨＶＤ（Holographic Versatile Disc）等が挙げられる。フラッシュメモリとしては、例示的に、ＵＳＢメモリやＳＤカード等の半導体メモリが挙げられる。

【0078】

上述したコンピュータ１０のＨＷ構成は例示である。従って、コンピュータ１０内でのＨＷの増減（例えば任意のブロックの追加や削除）、分割、任意の組み合わせでの統合、又は、バスの追加若しくは削除等は適宜行なわれてもよい。例えば、サーバ２において、Ｉ／Ｏ部１０ｅ及び読取部１０ｆの少なくとも一方は、省略されてもよい。

【0079】

なお、情報処理端末の一例である端末４は、上述したコンピュータ１０と同様のＨＷ構成により実現されてよい。

【0080】

例えば、端末４のプロセッサ１０ａは、記憶部１０ｃに格納されたプログラム１０ｇをメモリ１０ｂに展開して実行することにより、図４に示す端末４としての機能を実現できる。

【0081】

なお、図４に示す端末４は、Ｉ／Ｏ部１０ｅの一例である入力装置及び表示装置を備えてよい。例えば、端末４のプロセッサ１０ａは、ＩＦ部１０ｄを介してサーバ２から受信した情報に基づき、各画面を表示装置に表示してよい。また、端末４のプロセッサ１０ａは、入力された情報を、ＩＦ部１０ｄを介してサーバ２に送信してよい。

【0082】

（機能構成例）
図４の説明に戻り、サーバ２は、例示的に、メモリ部２１、検索制御部２２、統計処理部２３、意味解釈処理部２４、及びランキング調整部２５を備えてよい。

【0083】

メモリ部２１は、記憶領域の一例であり、ファセットの検索に関する種々の情報を記憶する。図４に示すように、メモリ部２１は、例示的に、頻度表２１ａ及びスコアＤＢ２１ｂを記憶してよい。以下の説明では、便宜上、頻度表２１ａ及びスコアＤＢ２１ｂのデータ形式をテーブル形式として説明するが、これに限定されるものではなく、種々のＤＢのデータ形式であってよい。

【0084】

なお、頻度表２１ａ及びスコアＤＢ２１ｂは、例えば、図５に示すメモリ１０ｂ及び記憶部１０ｃの少なくとも１つが有する記憶領域に格納されてよい。換言すれば、メモリ部２１は、メモリ１０ｂ及び記憶部１０ｃの少なくとも１つが有する記憶領域により実現されてよい。

【0085】

検索制御部２２は、端末４に対して、図３に例示するカテゴリ探索画面１００及びファセット検索画面２００を含むＵＩを提供する。例えば、検索制御部２２は、カテゴリ探索画面１００及びファセット検索画面２００のそれぞれの画面情報を生成し、端末４に送信するとともに、端末４でＵＩを介して入力された文字列や選択項目を示す制御情報を、端末４から受信してよい。

【0086】

一例として、検索制御部２２は、カテゴリ探索画面１００の選択領域１１０及び１２０で選択されたクラス（カテゴリ）を含む制御情報を端末４から受信すると、当該制御情報を統計処理部２３及び意味解釈処理部２４のそれぞれに通知してよい。換言すれば、検索制御部２２は、特定のカテゴリの指定を受け付ける受付部の一例である。

【0087】

また、検索制御部２２は、複数のファセットキーを示す情報をランキング調整部２５から通知されると、当該情報に含まれるファセットキーを、その表示順序（並び順）も含めて、項目一覧領域２１０に表示させる。換言すれば、検索制御部２２は、ランキング調整部２５により算出される優先度に応じて、複数のファセットを順に並べて出力する（例えば項目一覧領域２１０に表示する）、出力部の一例である。

【0088】

統計処理部２３は、ファセット検索が行なわれる前の事前フェーズ（準備フェーズ）として、ＫＧ３及び制御情報に基づき、スコアＤＢ２１ｂを作成又は更新する。例えば、統計処理部２３は、頻度表作成部２３ａ及びスコア算出部２３ｂを備えてよい。

【0089】

頻度表作成部２３ａは、頻度表２１ａを作成する。例えば、頻度表作成部２３ａは、図６に示すように、ＫＧ３から、ファセット検索の対象となる全てのクラス集合２１ａ１を取得する。例えば、頻度表作成部２３ａは、図６に示すクラス取得クエリＱ１を実行し、ＫＧ３からクラス集合２１ａ１を取得してよい。

【0090】

そして、頻度表作成部２３ａは、クラス集合２１ａ１に含まれるクラスとＫＧ３とに基づき、ファセットキー頻度表２１ａ２、及び、ファセットキー・ファセット値頻度表２１ａ３（図７参照）を算出する。例えば、頻度表作成部２３ａは、図６に示すファセットキー頻度表クエリＱ２及びファセットキー・ファセット値頻度表クエリＱ３をそれぞれ実行し、ＫＧ３からファセットキー頻度表２１ａ２、及び、ファセットキー・ファセット値頻度表２１ａ３を取得してよい。

【0091】

なお、ＫＧ３において、クラスは、主語（Ｓ）、ファセットキーは、述語（Ｐ）、ファセット値は、目的語（Ｏ）にそれぞれ相当する。このため、ファセットキー頻度表２１ａ２は、Ｐ頻度表２１ａ２と称されてもよく、ファセットキー・ファセット値頻度表２１ａ３は、ＰＯ頻度表２１ａ３と称されてもよい。

【0092】

図６に示す各クエリＱ１～Ｑ３は、ＲＤＦ問合せ言語の一例であるＳＰＡＲＱＬを用いたクエリの一例である。クエリＱ１～Ｑ３において、“?s”は主語（Ｓ）、“?p”は述語（Ｐ）、“?o”は目的語（Ｏ）に相当し、クエリＱ２及びＱ３における“%CLASS%”は、クエリＱ１で取得された各クラスによって置換される。

【0093】

図７は、クラス集合２１ａ１、Ｐ頻度表２１ａ２、及び、ＰＯ頻度表２１ａ３の一例を示す図である。

【0094】

図７に例示するように、クラス集合２１ａ１は、ＫＧ３から、“政治家”等のカテゴリごとに、“名前”、所属政党”等のファセットキー（Ｐ）を抽出した情報である。

【0095】

Ｐ頻度表２１ａ２は、ＫＧ３から、クラス集合２１ａ１に含まれるファセットキー（Ｐ）ごとに、ＫＧ３における「頻度」（例えば、クエリＱ２で得られたレコードの「数」）を抽出した情報である。

【0096】

ＰＯ頻度表２１ａ３は、ＫＧ３から、クラス集合２１ａ１に含まれるファセットキー（Ｐ）ごと、且つ、ファセット値（Ｏ）ごとに、ＫＧ３における「頻度」（例えば、クエリＱ３で得られたレコードの「数」）を抽出した情報である。

【0097】

頻度表作成部２３ａは、クラス集合２１ａ１、Ｐ頻度表２１ａ２、及び、ＰＯ頻度表２１ａ３のうちの少なくともＰＯ頻度表２１ａ３の情報を、頻度表２１ａとしてメモリ部２１に格納してよい。なお、頻度表２１ａとして、少なくともＰＯ頻度表２１ａ３の情報を格納するものとしたのは、ＰＯ頻度表２１ａ３のファセット値をファセットキー単位で合計することでＰ頻度表２１ａ２を導出可能だからである。

【0098】

スコア算出部２３ｂは、頻度表作成部２３ａが作成した頻度表２１ａに基づき、スコアＤＢ２１ｂを算出する。

【0099】

図８は、各指標の算出式の一例を示す図であり、図９は、指標値２１ｂ１の一例を示す図である。例えば、スコア算出部２３ｂは、下記式（１）～式（４）に例示する各指標の算出式（図８参照）を用いて、図９に例示する指標値２１ｂ１を算出してよい。

【数1】

【0100】

上記式（１）に示すファセット頻度（freq(f)）は、ＫＧ３の検索対象データ全体でのファセットの出現頻度を示す指標である。ファセット頻度が大きいファセットほど、多くの検索対象データに出現することを意味し、ファセット頻度が小さいファセットほど、検索対象データ内で出現する頻度がより局所的であることを意味する。上記式（１）において、“N”は、検索対象のデータの全体数であり、“n(facet)”は、ファセットあたりの検索対象のデータ数である。

【0101】

上記式（２）に示すファセット均衡度（bala(f)）は、ファセットごとの検索できるデータ数の分布である。ファセット均衡度の大きいファセットほど、検索できるデータの範囲が広く、バランスのよいファセットであり、ファセット均衡度の小さいファセットほど、検索対象データ内でのファセットキーの出現の偏りが大きいことを意味する。上記式（２）において、“n(key_i)”はファセットキー“key_i”において検索できる検索対象データ数であり、“n_key”はファセット“f”におけるキーの数であり、“μ”は“n(key_i)”の平均である。

【0102】

上記式（３）に示すキー濃度（card(f)）は、各ファセットにおけるファセットキーの数の分布である。上記式（３）において、“n_key”はファセット“f”におけるキーの数であり、“μ”は“n_key”の平均であり、“σ²”は分散である。

【0103】

上記式（４）に示すキー単調性（mono(f)）は、ファセットキーの単調性の指標であり、或るファセットにおけるファセットキーごとに検索できるデータ数の平均を評価する指標である。上記式（４）において、“avg”は“n(key_i)”の平均であり、“μ”及び“σ²”はその平均及び分散である。

【0104】

なお、上記式（１）～式（４）は、例えば非特許文献２に記載された各指標の算出式と同様であり、これらの詳細な説明を省略する。

【0105】

スコア算出部２３ｂは、頻度表２１ａと上記式（１）～（４）とに基づき、図９に例示するように、ファセットキーごとの指標値２１ｂ１を算出してよい。

【0106】

また、スコア算出部２３ｂは、頻度表２１ａと、指標値２１ｂ１とに基づいて、カテゴリごと、且つ、ファセットキーごとにカテゴリ重要度（signif(f, C)）を算出する。カテゴリ重要度（signif(f, C)）は、クラス内のファセットの出現頻度を考慮した指標であって、カテゴリ固有のファセットキーを重要視する指標である。

【0107】

図１０は、カテゴリ重要度（signif(f, C)）を表形式で表したカテゴリ重要度表２１ｂ２の一例を示す図である。

【0108】

例えば、スコア算出部２３ｂは、下記式（５）に基づきカテゴリ重要度（signif(f, C)）を算出してよい。
signif(f, C) = weight(f, C) * uniq(f) （５）

【0109】

上記式（５）において、“weight(f, C)”は、クラス内のファセットの出現頻度の重みであり、例えば、下記式（６）により表されてよい。
weight(f, C) = n(f, C) / N_d （６）

【0110】

ここで、上記式（６）において、“N_d”はクラス“C”内の“f”の総数であり、“n(f, C)”はクラス“C”内のファセットの数である。

【0111】

また、上記式（５）において、“uniq(f)”は、ファセットごとのユニーク度を示す指標である。ユニーク度とは、ファセットが複数のクラスのうちの特定のクラスに偏って（例えば特定のクラスのみに）出現するか否かを示す指標である。例えば、“uniq(f)”は、下記式（７）により表されてよい。
uniq(f) = NC / uniq_count(f) （７）

【0112】

ここで、上記式（７）において、“NC”はＫＧ３内の総クラス数であり、“uniq_count(f)”はＫＧ３内の“f”が含まれるクラス数である。このように、ユニーク度は、ＫＧ３内のクラス総数をファセットが出現するクラス数で除算することで得られてよい。

【0113】

このように、カテゴリ重要度（signif(f, C)）は、ＫＧ３における特定のカテゴリに関連付けられた複数のファセットのそれぞれがＫＧ３において関連付けられているカテゴリの個数に基づく第１指標の一例である。

【0114】

スコア算出部２３ｂは、頻度表２１ａ及び上記式（５）を用いて、ファセットキーごとのカテゴリ重要度（signif(f, C)）を算出してよい。なお、図１０に示すように、スコア算出部２３ｂは、カテゴリ重要度（signif(f, C)）を“0”～“1”の範囲に正規化する。

【0115】

そして、スコア算出部２３ｂは、上述した指標値２１ｂ１に基づくスコア（org_score）と、上記式（５）に基づくスコア（signif）とを用いて、ファセットスコア（new_score）を算出する。

【0116】

例えば、スコア算出部２３ｂは、下記式（８）に例示するように、スコア（org_score）と、スコア（signif）との重み付き線形和を算出し、ファセットスコア（new_score）を取得してよい。
new_score(f) = ω * org_score(f) + (1 - ω) * signif(f) （８）

【0117】

上記式（８）において、“ω”は重みである。一実施形態においては、非限定的な例として、“ω=0.5”であるものとする。“ω=0.5”の場合、上記式（８）は、下記式（８’）のように表される。
new_score(f) = 0.5 * org_score(f) + 0.5 * signif(f) （８’）

【0118】

ここで、上記式（８）又は（８’）において、“org_score(f)”は、下記式（９）により表されてよい。なお、下記式（９）において、α＋β＋γ＋θ＝１であるものとする。

【数2】

【0119】

図１１は、ファセットスコア（new_score）を表形式で表したファセットスコア表２１ｂ３の一例を示す図である。例えば、スコア算出部２３ｂは、指標値２１ｂ１、カテゴリ重要度表２１ｂ２、及び、ファセットスコア表２１ｂ３のうちの少なくともファセットスコア表２１ｂ３の情報を、スコアＤＢ２１ｂとしてメモリ部２１に格納してよい。

【0120】

図１１に例示するように、クラス（カテゴリ）内でのファセットの重要度を加味したスコア（new_score）により、例えば、“政治家”については、“名前”や“生年月日”よりも“所属政党”の方が高いスコアとなり、“プロ野球選手”については、“名前”や“生年月日”よりも“守備位置”の方が高いスコアとなる。

【0121】

すなわち、図３に示す項目一覧領域２１０において、“政治家”についての“所属政党”や、“プロ野球選手”についての“守備位置”等のファセットキーが優先度の高い項目として表示されることになる。従って、サーバ２は、カテゴリに関連付けられたファセットの集合から、よりスコアの高いファセットキーにより絞り込まれた適切な複数のファセットを出力することができる。

【0122】

このように、スコア算出部２３ｂは、複数のファセットのそれぞれについてのuniq(f)を含むカテゴリ重要度を算出し、算出したカテゴリ重要度を含む情報（例えばスコアＤＢ２１ｂ）をメモリ部２１に格納する算出部の一例である。

【0123】

図４の説明に戻り、意味解釈処理部２４は、ファセット検索が行なわれる際に、カテゴリ探索画面１００（図３参照）において選択されたクラス（カテゴリ）から、或るファセットが所属するクラスまでのＫＧ３上のパスを、スコアに反映する。このように、意味解釈処理部２４は、ファセット検索が行なわれる際に、選択されたクラスに応じて、オントロジーを考慮した優先度の高いファセットが抽出されるように、スコアを変更する。

【0124】

例えば、意味解釈処理部２４は、下記式（１０）に示すように、オントロジーにおけるグラフ上の距離を考慮したスコア（ont_score）を算出してよい。スコア（ont_score）は、ＫＧ３における選択されたクラスと複数のファセットのそれぞれとの距離に基づく第２指標の一例である。
ont_score(f, C) = 1 / (distance(C, C_f) + 1) （１０）

【0125】

ここで、上記式（１０）において、“f”はスコアを計算する対象のファセットであり、“C”は項目一覧領域２１０で選択されたクラス（カテゴリ）であり、“C_f”は、項目一覧領域２１０に表示される候補のファセットが所属するクラスである。

【0126】

また、上記式（１０）において、“distance(C, C_f)”は、選択されたクラスと選択されたファセットが所属するクラスとの間のスキーマ（オントロジー）上、すなわちグラフ上の距離である。グラフ上の距離とは、クラス（カテゴリ）の階層間の距離を意味してよい。例えば、意味解釈処理部２４は、階層的な各クラスを、木構造における各ノードと捉え、既知の手法により、ノード間の距離をグラフ上の距離として算出してよい。なお、“C = C_f”である場合、“distance(C, C_f) = 0”となる。

【0127】

図１２は、ＲＤＦスキーマにおける、クラス及びファセットキーを表すグラフの一例を示す図である。以下、図１２の例において、選択されたカテゴリが“BaseballPlayer”（破線参照）である場合の、スコア（ont_score）の算出例を説明する。

【0128】

一例として、スコア算出対象のファセットが“名前（人）”である場合、スコア（ont_score）は、下記式（１１）に示すように算出される。
ont_score(名前（人）, BaseballPlayer)
= 1 / (distance(BaseballPlayer, Person) + 1)
= 1 / (1 + 1) = 0.5 （１１）

【0129】

他の例として、スコア算出対象のファセットが“本社所在地”である場合、スコア（ont_score）は、下記式（１２）に示すように算出される。
ont_score(本社所在地, BaseballPlayer)
= 1 / (distance(BaseballPlayer, Company) + 1)
= 1 / (3 + 1) = 0.25 （１２）

【0130】

他の例として、スコア算出対象のファセットが“所属政党”である場合、スコア（ont_score）は、下記式（１３）に示すように算出される。
ont_score(所属政党, BaseballPlayer)
= 1 / (distance(BaseballPlayer, Politician) + 1)
= 1 / (2 + 1) = 0.33 （１３）

【0131】

このように、意味解釈処理部２４は、オントロジーにおける関連度が大きいファセットキー、一例として、グラフ上の距離が近い（distance(C, C_f)が小さい）ファセットキーほど、優先度が高くなるようなスコア（ont_score）を算出する。また、意味解釈処理部２４は、オントロジーにおける関連度が小さいファセットキー、一例として、グラフ上の距離が遠い（distance(C, C_f)が大きい）ファセットキーほど、優先度が低くなるようなスコア（ont_score）を算出する。換言すれば、スコア（ont_score）は、ＫＧ３の知識構造を考慮したファセットキーの意味解釈が反映されたスコアであるといえる。

【0132】

なお、意味解釈処理部２４は、ＫＧ３上のファセットキーと選択されたクラスとの間のグラフ上の距離（distance(C, C_f)）に加えて、又は、代えて、意味上の距離を考慮した指標に基づきスコア（ont_score）を算出してもよい。

【0133】

意味上の距離を考慮した指標（意味上の距離指標）としては、例えば、ファセットキーとなる述語（Ｐ；Predicate）の語彙が、標準語彙であるか否かに応じて定まる指標が挙げられる。標準語彙であるか否かの判断は、例えば、標準語彙を蓄積するＤＢに、ファセットキーとなる語彙が登録されているか否かの判断により行なわれてよい。標準語彙を蓄積するＤＢとしては、例えば、“prefix.cc”や、“Linked Open Vocabularies”等のＤＢが挙げられる。

【0134】

例えば、意味解釈処理部２４は、下記式（１４）に示すように、オントロジーにおける意味上の距離を考慮したスコア（ont_score）を算出してよい。
ont_score(f, C) = (1 / (distance(C, C_f) + 1)) * std_vocab(f) （１４）

【0135】

ここで、上記式（１４）において、(1 / (distance(C, C_f) + 1))の項は、上記式（１０）と同様であり、“std_vocab(f)”は、下記式（１５）に示すように、標準語彙であれば“1.0”、標準語彙ではなければ“0.5”、等となる関数であってよい。

【数3】

【0136】

例えば、意味解釈処理部２４は、上記式（１４）に示すように、上記式（１０）に示すグラフ上の距離を考慮したスコアに対して、上記式（１５）に示す意味上の距離指標を乗算することで、グラフ上及び意味上の距離の双方を考慮したスコアを算出してよい。

【0137】

或いは、意味解釈処理部２４は、上記式（１４）に代えて、上記式（１５）に示す“std_vocab(f)”を、意味上の距離のみを考慮したスコア（ont_score）として採用してもよい。

【0138】

図１３は、ＲＤＦスキーマにおける、クラス及びファセットキーを表すグラフの一例を示す図である。以下、図１３の例において、選択されたカテゴリが“BaseballPlayer”（破線参照）である場合の、意味上の距離指標を考慮したスコア（ont_score）の算出例を説明する。

【0139】

なお、図１３において、例えば、“名前（人）”は、“foat:name”で表される標準語彙であり、“名前（会社）”は、“skos:prefLabel”で表される標準語彙であり、“本社所在地”は、“14a-ont:本社所在地”で表される独自語彙（非標準語彙）であるものとする。

【0140】

一例として、スコア算出対象のファセットが、“名前（会社）”である場合、スコア（ont_score）は、下記式（１６）に示すように算出される。
ont_score(名前（会社）, BaseballPlayer)
= (1 / (distance(BaseballPlayer, Company) + 1)) * std_vocab(名前（会社）)
= (1 / (3 + 1)) * 0.5 = 0.125 （１６）

【0141】

他の例として、スコア算出対象のファセットが“本社所在地”である場合、スコア（ont_score）は、下記式（１７）に示すように算出される。
ont_score(本社所在地, BaseballPlayer)
= (1 / (distance(BaseballPlayer, Company) + 1)) * std_vocab(本社所在地)
= (1 / (3 + 1)) * 1.0 = 0.25 （１７）

【0142】

このように、意味解釈処理部２４は、オントロジーにおける関連度が大きいファセットキー、一例として、意味上の距離（std_vocab）が近い（大きい）ファセットキーほど、優先度が高くなるようなスコア（ont_score）を算出する。また、意味解釈処理部２４は、オントロジーにおける関連度が小さいファセットキー、一例として、意味上の距離（std_vocab）が遠い（小さい）ファセットキーほど、優先度が低くなるようなスコア（ont_score）を算出する。

【0143】

これにより、図３に示す項目一覧領域２１０において、選択されたカテゴリとの間で、グラフ上の距離及び意味上の距離の一方又は双方が近いファセットキーが、優先度の高い項目として表示されることになる。従って、サーバ２は、カテゴリに関連付けられたファセットの集合から、よりスコアの高いファセットキーにより絞り込まれた適切な複数のファセットを出力することができる。

【0144】

図４の説明に戻り、ランキング調整部２５は、ファセット検索において、最終的なファセットスコア（final_score）を算出する。

【0145】

例えば、ファセット検索では、上述した検索制御部２２により、カテゴリ探索画面１００において、エンティティに付与されているクラスの階層を辿りながら、目的のカテゴリが選択され、ファセット検索画面２００が表示される。

【0146】

このとき、選択されたカテゴリに基づいて、意味解釈処理部２４により、知識構造を利用したファセット重要度としてのスコア（ont_score）が計算される。

【0147】

ランキング調整部２５は、事前フェーズにおいてスコア算出部２３ｂが算出したファセットスコア（new_score）と、意味解釈処理部２４が算出したスコア（out_score）とに基づいて、最終的なスコア（final_score）を算出してよい。例えば、ランキング調整部２５は、下記式（１８）に基づいて、ファセットスコア（new_score）と、スコア（out_score）とを乗算することで、スコア（final_score）を算出してよい。
final_score(f, C) = new_score(f, C) * ont_score(f, C) （１８）

【0148】

図１４は、上記式（９）に示すスコア（org_score）、上記式（８）に示すファセットスコア（new_score）、上記式（１０）又は式（１４）に示すスコア（ont_score）、並びに、上記式（１８）に示す最終的なスコア（final_score）を表形式で例示する図である。

【0149】

図１４の例では、カテゴリ探索画面１００において、カテゴリとして“プロ野球選手”が選択された場合を示す。この場合、最終的なスコア（final_score）は、ファセットスコア（new_score）及びスコア（ont_score）のいずれのスコアも高い値となっている“守備位置”がもっと高い“0.562”となっている。この“守備位置”は、上記式（９）に示すスコア（org_score）では、“名前”や“生年月日”よりも低いスコアである。

【0150】

このように、カテゴリ固有のファセットキーを重要視する指標と、ＫＧ３の知識構造を考慮したファセットキーの意味解釈とにより、“プロ野球選手”のカテゴリに対する“守備位置”のように、適切なファセットキーのスコアが高くなるように算出される。

【0151】

例えば、ランキング調整部２５は、算出した最終的なスコア（final_score）に基づいて、項目一覧領域２１０に表示するファセットキーを当該スコアが高い順にソートし、ソートしたファセットキーの情報を検索制御部２２に出力してよい。

【0152】

ランキング調整部２５により算出される最終的なスコア（final_score）は、複数のファセットの優先度の一例である。

【0153】

これにより、検索制御部２２は、図１５に例示するように、項目一覧領域２１０に、上記式（９）に示すスコア（org_score）ベースのリスト２１１に代えて、最終的なスコア（final_score）ベースのファセットキーのリスト２１２を表示することができる。当該リスト２１２は、ランキング調整部２５により算出される優先度に応じて、複数のファセットを順に並べたリストの一例である。

【0154】

図１６及び図１７は、“org_score”、“new_score”及び“final_score”のそれぞれをベースとしてファセットキーをソートした場合のＭＲＲ（Mean Reciprocal Rank）の比較例を示す図である。ＭＲＲは、検索結果の品質の評価指標であり、“0”～“1”の範囲の値となる。ＭＲＲが“1”に近いほど、項目一覧領域２１０に表示された上位のファセットキーが検索（選択）されることを意味し、ユーザの知識に即したファセット検索が実現されていることを意味する。

【0155】

図１６では、上記式（９）に示すスコア（org_score）ベースのファセット順位及びＭＲＲと、上記式（８）に示すファセットスコア（new_score）ベースのファセット順位及びＭＲＲとの比較例を示す。図１６の例では、ファセット対象のデータ数“11401”を持つデータセットから、“野球選手”のカテゴリを選択し、“打席”、“ドラフト順位”、“初出場”の各ファセットキーを選択する場合を想定する。

【0156】

図１６に例示するように、“org_score”ベースでは、ファセット順位はいずれのファセットキーも１００位前後であり、ＭＲＲは“0.0094”である。これに対し、“new_score”ベースでは、ファセット順位は３位～６位であり、ＭＲＲは“0.2333”となっている。

【0157】

このように、“new_score”ベースでは、“野球選手”固有のファセットである“打席”、“ドラフト順位”、“初出場”のファセット順位及びＭＲＲが、“org_score”ベースよりも高くなっている。

【0158】

図１７では、上記式（８）に示すファセットスコア（new_score）ベースのファセット順位及びＭＲＲと、上記式（１８）に示す最終的なスコア（final_score）ベースのファセット順位及びＭＲＲとの比較例を示す。図１７の例では、ファセット対象のデータ数“11401”を持つデータセットから、“野球選手”のカテゴリを選択し、“名前”、“出生地”、“生年月日”の各ファセットキーを選択する場合を想定する。

【0159】

図１７に例示するように、“new_score”ベースでは、ファセット順位は３１位～６６位であり、ＭＲＲは“0.2333”である。これに対し、“final_score”ベースでは、ファセット順位は１４１位～２１１位であり、ＭＲＲは“0.0057”となっている。

【0160】

このように、“名前”、“出生地”、“生年月日”は、いずれも“野球選手（BaseballPlayer）”固有のファセットではなく、“人（Person）”に関するファセットである。このため、オントロジーにおける関連度（ont_score）が考慮された“final_score”ベースでは、“new_score”ベースよりもファセット順位及びＭＲＲが低くなっている。

【0161】

以上のように、一実施形態に係るサーバ２は、ＫＧ３において、ファセットに付与されているカテゴリ（クラス）で先に絞り込み、その後、カテゴリ内のファセットで絞り込みを行なうことにより、効率的にファセット検索を実現する。

【0162】

このとき、サーバ２は、クラス固有のファセットを重要視する指標を導入するとともに、ファセット間の関係をファセット検索対象のＫＧ３から取り出し、当該関係を利用することにより、或る特定のクラスに所属するエンティティの集合を効率的に取り出す。

【0163】

【0164】

〔１－３〕動作例
以下、上述したファセット検索システム１の動作例を、フローチャートを参照しながら説明する。

【0165】

〔１－３－１〕ＤＢ作成処理
図１８は、一実施形態に係るＤＢ作成処理の動作例を説明するフローチャートである。

【0166】

図１８に例示するように、サーバ２において、統計処理部２３の頻度表作成部２３ａは、頻度表２１ａを作成する（ステップＳ１）。また、統計処理部２３のスコア算出部２３ｂは、頻度表２１ａに基づきスコアＤＢ２１ｂを作成し（ステップＳ２）、処理が終了する。

【0167】

図１９は、図１８のステップＳ１の頻度表作成処理の動作例を説明するフローチャートである。図１９に例示するように、頻度表作成部２３ａは、頻度表作成処理として、ＫＧ３内の全クラスＣ_ａｌｌを取得する（ステップＳ１１）。

【0168】

頻度表作成部２３ａは、全クラスＣ_ａｌｌの要素であるクラスＣを全て処理したか否かを判定する（ステップＳ１２）。全て処理した場合（ステップＳ１２でＹＥＳ）、処理が終了する。

【0169】

全て処理していない場合（ステップＳ１２でＮＯ）、頻度表作成部２３ａは、クラスがＣであるインスタンスが持つ述語（Predicate）ごとのインスタンス数、換言すれば、ファセットキー頻度を算出し（ステップＳ１３）、Ｐ頻度表２１ａ２に格納する。

【0170】

そして、頻度表作成部２３ａは、クラスがＣであるインスタンスが持つ述語ごとに目的語（Object）の数、換言すれば、ファセットキー・ファセット値頻度を算出し（ステップＳ１４）、ＰＯ頻度表２１ａ３に格納して、処理がステップＳ１２に移行する。

【0171】

図２０は、図１８のステップＳ２のスコアＤＢ作成処理の動作例を説明するフローチャートである。図２０に例示するように、スコア算出部２３ｂは、スコアＤＢ作成処理として、頻度表２１ａ及びＫＧ３に基づき、ファセット頻度、ファセット均衡度、キー濃度、及び、キー単調性をそれぞれ算出する（ステップＳ２１～Ｓ２４）。

【0172】

スコア算出部２３ｂは、ＫＧ３におけるクラス及びファセットの情報に基づき、カテゴリ重要度を算出する（ステップＳ２５）。

【0173】

そして、スコア算出部２３ｂは、ファセット頻度、ファセット均衡度、キー濃度、及び、キー単調性を利用して、上記式（９）に示すスコアorg_scoreを算出する（ステップＳ２６）。

【0174】

また、スコア算出部２３ｂは、ステップＳ２６で算出したスコアorg_scoreと、ステップＳ２５で算出したカテゴリ重要度とを利用し、ファセットスコアnew_scoreを算出して、スコアＤＢ２１ｂに格納し（ステップＳ２７）、処理が終了する。

【0175】

〔１－３－２〕ファセット検索処理
図２１は、一実施形態に係るファセット検索処理の動作例を説明するフローチャートである。

【0176】

図２１に例示するように、サーバ２において、検索制御部２２は、端末４に対して提示するカテゴリ探索画面１００上で、端末４によるクラスＣの選択を受け付ける（ステップＳ３１）。

【0177】

意味解釈処理部２４は、クラスＣに所属するインスタンスが保有する述語（Predicate）を取得する（ステップＳ３２）。

【0178】

意味解釈処理部２４は、述語（Predicate）の要素であるファセットキーｆを全て処理したか否かを判定する（ステップＳ３３）。全て処理していない場合（ステップＳ３３でＮＯ）、意味解釈処理部２４は、スコアＤＢ２１ｂからクラスＣにおけるファセットキーｆのスコアnew_scoreを取得する（ステップＳ３４）。

【0179】

意味解釈処理部２４は、クラスＣとファセットキーｆとを利用し、ＫＧ３内のオントロジーに基づき、距離スコアont_scoreを算出し（ステップＳ３５）、処理がステップＳ３３に移行する。

【0180】

ステップＳ３３において、全て処理した場合（ステップＳ３３でＹＥＳ）、意味解釈処理部２４は、new_score及びont_scoreを用いて、ファセットキーｆのスコアfinal_scoreを算出する（ステップＳ３６）。

【0181】

ランキング調整部２５は、final_scoreに基づきソートしたファセットキーを検索制御部２２に通知する。検索制御部２２は、ソートされたファセットキーを、カテゴリ探索画面１００からの遷移先であるファセット検索画面２００の項目一覧領域２１０に表示し（ステップＳ３７）、項目一覧領域２１０の表示に係るファセット検索処理が終了する。

【0182】

〔２〕その他
上述した一実施形態に係る技術は、以下のように変形、変更して実施することができる。

【0183】

例えば、図４に示すサーバ２が備える検索制御部２２、統計処理部２３（頻度表作成部２３ａ及びスコア算出部２３ｂ）、意味解釈処理部２４及びランキング調整部２５は、任意の組み合わせで併合してもよく、それぞれ分割してもよい。

【0184】

また、図１に示すサーバ２は、複数の装置がネットワークを介して互いに連携することにより、各処理機能を実現する構成であってもよい。一例として、検索制御部２２はＷｅｂサーバ、統計処理部２３、意味解釈処理部２４及びランキング調整部２５はアプリケーションサーバ、メモリ部２１はＤＢサーバ、等であってもよい。この場合、Ｗｅｂサーバ、アプリケーションサーバ及びＤＢサーバが、ネットワークを介して互いに連携することにより、サーバ２としての各処理機能を実現してもよい。

【0185】

さらに、一実施形態において、ランキング調整部２５に入力される最終的なスコア（final_score）は、上記式（８）及び式（１８）に示すように、signifが考慮されたnew_scoreと、ont_scoreとを乗算したスコアであるものとして説明した。最終的なスコア（final_score）は、これに限定されるものではなく、少なくとも、signif及びont_scoreの一方が考慮されればよい。

【0186】

例えば、最終的なスコア（final_score）は、下記式（１９）に示すように、ont_scoreを考慮せず、new_scoreと一致してもよい。

【0187】

final_score(f, C) = new_score(f, C) （１９）

【0188】

或いは、最終的なスコア（final_score）は、下記式（２０）に示すように、signifを考慮しないスコアであってもよい。なお、一実施形態では、下記式（２０）において、重みωは、例示的に“0.5”であるものとする。

【0189】

final_score(f, C) = ω * org_score(f, C) + (1 - ω) * ont_score(f, C) （２０）

【0190】

上記式（１９）又は式（２０）に示す最終的なスコア（final_score）によっても、図１６又は図１７に例示するような一実施形態と同様の効果を奏することができる。

【0191】

〔３〕付記
以上の実施形態に関し、さらに以下の付記を開示する。

【0192】

（付記１）
特定のカテゴリの指定を受け付け、
ナレッジグラフにおける前記特定のカテゴリに関連付けられた複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数に基づく第１指標と、前記ナレッジグラフにおける前記特定のカテゴリと前記複数のファセットのそれぞれとの距離に基づく第２指標と、のうち少なくとも一方に基づいて算出される前記複数のファセットの優先度に応じて、前記複数のファセットを順に並べて出力する、
処理をコンピュータに実行させる、検索プログラム。

【0193】

（付記２）
前記第１指標は、前記ナレッジグラフにおける全てのカテゴリの個数を、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数でそれぞれ除算した結果を含む、
付記１に記載の検索プログラム。

【0194】

（付記３）
前記複数のファセットのそれぞれについての前記結果を含む前記第１指標を算出し、
算出した前記第１指標を含む情報を記憶領域に格納する、
処理を前記コンピュータに実行させる、付記２に記載の検索プログラム。

【0195】

（付記４）
前記第２指標は、前記ナレッジグラフにおける前記特定のカテゴリの階層と、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの階層のそれぞれとの距離に基づく、
付記１～付記３のいずれか１項に記載の検索プログラム。

【0196】

（付記５）
前記第２指標は、前記複数のファセットのそれぞれが標準語彙であるか否かに基づく、
付記１～付記４のいずれか１項に記載の検索プログラム。

【0197】

（付記６）
前記出力する処理は、前記特定のカテゴリの指定を受け付けた画面からの遷移先である検索画面であって、前記特定のカテゴリに関連付けられた前記複数のファセットを対象とした検索を行なうための前記検索画面に、前記複数のファセットの優先度に応じて順に並べた前記複数のファセットを表示する処理を含む、
付記１～付記５のいずれか１項に記載の検索プログラム。

【0198】

（付記７）
特定のカテゴリの指定を受け付け、
ナレッジグラフにおける前記特定のカテゴリに関連付けられた複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数に基づく第１指標と、前記ナレッジグラフにおける前記特定のカテゴリと前記複数のファセットのそれぞれとの距離に基づく第２指標と、のうち少なくとも一方に基づいて算出される前記複数のファセットの優先度に応じて、前記複数のファセットを順に並べて出力する、
処理をコンピュータが実行する、検索方法。

【0199】

（付記８）
前記第１指標は、前記ナレッジグラフにおける全てのカテゴリの個数を、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数でそれぞれ除算した結果を含む、
付記７に記載の検索方法。

【0200】

（付記９）
前記複数のファセットのそれぞれについての前記結果を含む前記第１指標を算出し、
算出した前記第１指標を含む情報を記憶領域に格納する、
処理を前記コンピュータが実行する、付記８に記載の検索方法。

【0201】

（付記１０）
前記第２指標は、前記ナレッジグラフにおける前記特定のカテゴリの階層と、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの階層のそれぞれとの距離に基づく、
付記７～付記９のいずれか１項に記載の検索方法。

【0202】

（付記１１）
前記第２指標は、前記複数のファセットのそれぞれが標準語彙であるか否かに基づく、
付記７～付記１０のいずれか１項に記載の検索方法。

【0203】

（付記１２）
前記出力する処理は、前記特定のカテゴリの指定を受け付けた画面からの遷移先である検索画面であって、前記特定のカテゴリに関連付けられた前記複数のファセットを対象とした検索を行なうための前記検索画面に、前記複数のファセットの優先度に応じて順に並べた前記複数のファセットを表示する処理を含む、
付記７～付記１１のいずれか１項に記載の検索方法。

【0204】

（付記１３）
特定のカテゴリの指定を受け付ける受付部と、
ナレッジグラフにおける前記特定のカテゴリに関連付けられた複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数に基づく第１指標と、前記ナレッジグラフにおける前記特定のカテゴリと前記複数のファセットのそれぞれとの距離に基づく第２指標と、のうち少なくとも一方に基づいて算出される前記複数のファセットの優先度に応じて、前記複数のファセットを順に並べて出力する出力部と、
を備える、検索装置。

【0205】

（付記１４）
前記第１指標は、前記ナレッジグラフにおける全てのカテゴリの個数を、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの個数でそれぞれ除算した結果を含む、
付記１３に記載の検索装置。

【0206】

（付記１５）
前記複数のファセットのそれぞれについての前記結果を含む前記第１指標を算出し、
算出した前記第１指標を含む情報を記憶領域に格納する、
算出部を備える、付記１４に記載の検索装置。

【0207】

（付記１６）
前記第２指標は、前記ナレッジグラフにおける前記特定のカテゴリの階層と、前記複数のファセットのそれぞれが前記ナレッジグラフにおいて関連付けられているカテゴリの階層のそれぞれとの距離に基づく、
付記１３～付記１５のいずれか１項に記載の検索装置。

【0208】

（付記１７）
前記第２指標は、前記複数のファセットのそれぞれが標準語彙であるか否かに基づく、
付記１３～付記１６のいずれか１項に記載の検索装置。

【0209】

（付記１８）
前記出力部は、前記特定のカテゴリの指定を受け付けた画面からの遷移先である検索画面であって、前記特定のカテゴリに関連付けられた前記複数のファセットを対象とした検索を行なうための前記検索画面に、前記複数のファセットの優先度に応じて順に並べた前記複数のファセットを表示する、
付記１３～付記１７のいずれか１項に記載の検索装置。

【符号の説明】

【0210】

１ファセット検索システム
１０コンピュータ
２サーバ
２１メモリ部
２１ａ頻度表
２１ｂスコアＤＢ
２２検索制御部
２３統計処理部
２３ａ頻度表作成部
２３ｂスコア算出部
２４意味解釈処理部
２５ランキング調整部
３ＫＧ（ナレッジグラフ）
４端末

【図1】