IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 三菱電機株式会社の特許一覧

特許7558450関連情報表示装置、プログラム及び関連情報表示方法
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-19
(45)【発行日】2024-09-30
(54)【発明の名称】関連情報表示装置、プログラム及び関連情報表示方法
(51)【国際特許分類】
   G06F 16/904 20190101AFI20240920BHJP
【FI】
G06F16/904
【請求項の数】 20
(21)【出願番号】P 2024511962
(86)(22)【出願日】2022-04-04
(86)【国際出願番号】 JP2022017063
(87)【国際公開番号】W WO2023195051
(87)【国際公開日】2023-10-12
【審査請求日】2024-02-21
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】100116964
【弁理士】
【氏名又は名称】山形 洋一
(74)【代理人】
【識別番号】100120477
【弁理士】
【氏名又は名称】佐藤 賢改
(74)【代理人】
【識別番号】100135921
【弁理士】
【氏名又は名称】篠原 昌彦
(74)【代理人】
【識別番号】100203677
【弁理士】
【氏名又は名称】山口 力
(72)【発明者】
【氏名】池田 久美子
(72)【発明者】
【氏名】小路 悠介
(72)【発明者】
【氏名】斉藤 辰彦
(72)【発明者】
【氏名】成政 国郎
(72)【発明者】
【氏名】深川 浩史
(72)【発明者】
【氏名】伊藤 槙紀
【審査官】鹿野 博嗣
(56)【参考文献】
【文献】米国特許出願公開第2020/0356604(US,A1)
【文献】国際公開第2021/234896(WO,A1)
【文献】米国特許出願公開第2022/0067056(US,A1)
【文献】国際公開第2017/221858(WO,A1)
【文献】特開2004-287827(JP,A)
【文献】特表2009-510591(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 16/00-16/958
(57)【特許請求の範囲】
【請求項1】
複数のノードと、前記複数のノードを連結するリンクとで知識情報を保持する知識グラフを記憶する知識グラフ記憶部と、
キーワードに関連する関連情報を前記知識グラフから推論する関連情報推論部と、
前記キーワードと、前記関連情報との関連度を算出する関連度算出部と、
前記キーワードと、前記キーワードに関連する前記関連情報とを帯でつなぐことで、前記キーワードと、前記関連情報との関連性を示す流量図を表示するための表示データを生成する表示データ生成部と、を備え
前記帯の幅は、前記関連度が高いほど広いこと
を特徴とする関連情報表示装置。
【請求項2】
前記流量図は、サンキー図であること
を特徴とする請求項1に記載の関連情報表示装置。
【請求項3】
前記サンキー図では、前記帯の幅は、前記キーワードを表示する幅に基づいて、正規化されていること
を特徴とする請求項2に記載の関連情報表示装置。
【請求項4】
前記キーワード及び情報種別を取得するインターフェース部をさらに備え、
前記関連情報推論部は、前記キーワードに関連し、前記情報種別に属する情報を前記関連情報として推論すること
を特徴とする請求項1から3の何れか一項に記載の関連情報表示装置。
【請求項5】
テキスト文及び情報種別を取得するインターフェース部と、
前記テキスト文から前記キーワードを抽出するキーワード抽出部と、をさらに備え、
前記関連情報推論部は、前記キーワードに関連し、前記情報種別に属する情報を前記関連情報として推論すること
を特徴とする請求項1から3の何れか一項に記載の関連情報表示装置。
【請求項6】
前記インターフェース部は、前記表示データが生成された後に、新たな情報種別を取得し、
前記関連情報推論部は、前記関連情報を新たなキーワードとして、前記新たなキーワードに関連し、前記新たな情報種別に属する情報を新たな関連情報として推論し、
前記関連度算出部は、前記新たなキーワードと、前記新たな関連情報との関連度である新たな関連度を算出し、
前記表示データ生成部は、前記新たなキーワードと、前記新たなキーワードに関連する前記新たな関連情報とを帯でつなぐことで、前記新たなキーワードと前記新たな関連情報との関連性を示す新たな流量図を表示するための新たな表示データを生成し、
前記新たなキーワードと、前記新たな関連情報とをつなぐ前記帯の幅は、前記新たな関連度が高いほど広いこと
を特徴とする請求項4に記載の関連情報表示装置。
【請求項7】
前記インターフェース部は、前記表示データが生成された後に、新たな情報種別を取得し、
前記関連情報推論部は、前記関連情報を新たなキーワードとして、前記新たなキーワードに関連し、前記新たな情報種別に属する情報を新たな関連情報として推論し、
前記関連度算出部は、前記新たなキーワードと、前記新たな関連情報との関連度である新たな関連度を算出し、
前記表示データ生成部は、前記新たなキーワードと、前記新たなキーワードに関連する前記新たな関連情報とを帯でつなぐことで、前記新たなキーワードと前記新たな関連情報との関連性を示す新たな流量図を表示するための新たな表示データを生成し、
前記新たなキーワードと、前記新たな関連情報とをつなぐ前記帯の幅は、前記新たな関連度が高いほど広いこと
を特徴とする請求項5に記載の関連情報表示装置。
【請求項8】
複数の文書のそれぞれのテキストを示すテキスト情報を記憶するテキスト情報記憶部と、
前記キーワード又はテキスト文を取得するインターフェース部と、をさらに備え、
前記関連情報推論部は、前記キーワード又は前記テキスト文に関連する文書を前記複数の文書から推論し、前記関連する文書に関連する前記関連情報を前記知識グラフから推論すること
を特徴とする請求項1から3の何れか一項に記載の関連情報表示装置。
【請求項9】
前記インターフェース部は、前記関連情報又は前記帯に関する詳細情報を取得する指示を取得し、
前記指示に応じて、前記関連情報又は前記帯に関する詳細情報を取得する詳細情報取得部をさらに備えること
を特徴とする請求項4に記載の関連情報表示装置。
【請求項10】
前記インターフェース部は、前記関連情報又は前記帯に関する詳細情報を取得する指示を取得し、
前記指示に応じて、前記関連情報又は前記帯に関する詳細情報を取得する詳細情報取得部をさらに備えること
を特徴とする請求項5に記載の関連情報表示装置。
【請求項11】
前記インターフェース部は、前記関連情報又は前記帯に関する詳細情報を取得する指示を取得し、
前記指示に応じて、前記関連情報又は前記帯に関する詳細情報を取得する詳細情報取得部をさらに備えること
を特徴とする請求項6に記載の関連情報表示装置。
【請求項12】
前記インターフェース部は、前記関連情報又は前記帯に関する詳細情報を取得する指示を取得し、
前記指示に応じて、前記関連情報又は前記帯に関する詳細情報を取得する詳細情報取得部をさらに備えること
を特徴とする請求項7に記載の関連情報表示装置。
【請求項13】
前記インターフェース部は、前記関連情報又は前記帯に関する詳細情報を取得する指示を取得し、
前記指示に応じて、前記関連情報又は前記帯に関する詳細情報を取得する詳細情報取得部をさらに備えること
を特徴とする請求項8の何れか一項に記載の関連情報表示装置。
【請求項14】
前記詳細情報を用いて前記関連情報に対してフィルタリングを行うフィルタリング部をさらに備えること
を特徴とする請求項9に記載の関連情報表示装置。
【請求項15】
前記詳細情報を用いて前記関連情報に対してフィルタリングを行うフィルタリング部をさらに備えること
を特徴とする請求項10に記載の関連情報表示装置。
【請求項16】
前記詳細情報を用いて前記関連情報に対してフィルタリングを行うフィルタリング部をさらに備えること
を特徴とする請求項11に記載の関連情報表示装置。
【請求項17】
前記詳細情報を用いて前記関連情報に対してフィルタリングを行うフィルタリング部をさらに備えること
を特徴とする請求項12に記載の関連情報表示装置。
【請求項18】
前記詳細情報を用いて前記関連情報に対してフィルタリングを行うフィルタリング部をさらに備えること
を特徴とする請求項13に記載の関連情報表示装置。
【請求項19】
コンピュータを、
複数のノードと、前記複数のノードを連結するリンクとで知識情報を保持する知識グラフを記憶する知識グラフ記憶部、
キーワードに関連する関連情報を前記知識グラフから推論する関連情報推論部、
前記キーワードと、前記関連情報との関連度を算出する関連度算出部、及び、
前記キーワードと、前記キーワードに関連する前記関連情報とを帯でつなぐことで、前記キーワードと、前記関連情報との関連性を示す流量図を表示するための表示データを生成する表示データ生成部、として機能させ、
前記帯の幅は、前記関連度が高いほど広いこと
を特徴とするプログラム。
【請求項20】
キーワードに関連する関連情報を、複数のノードと、前記複数のノードを連結するリンクとで知識情報を保持する知識グラフから推論し、
前記キーワードと、前記関連情報との関連度を算出し、
前記キーワードと、前記キーワードに関連する前記関連情報とを帯でつなぐことで、前記キーワードと、前記関連情報との関連性を示す流量図を表示するための表示データを生成し、
前記帯の幅は、前記関連度が高いほど広いこと
を特徴とする関連情報表示方法。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、関連情報表示装置、プログラム及び関連情報表示方法に関する。
【背景技術】
【0002】
従来から、専門的な知識情報を、知識の関連する事象又は関連性を表す知識グラフを用いたデータベース(以下、DBという)に保持し、その知識情報を検索して、検索された情報を提示する技術がある。例えば、特許文献1には、入力された文書の語句を抽出し、ユーザの指定した条件を元に、抽出された語句に関する概念構造情報である知識グラフから、検索条件又は検索するDBを指定し、知識を抽出し、グラフ構造又は文へと変換して提示する方法が示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2020-140604号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の技術は、知識グラフからデータを抽出した結果を、その関係性を示すために、グラフ構造のまま提示している。
しかしながら、グラフ構造のままでは、グラフ構造を理解していないと理解しづらい、又は、入力されたデータとの関係を読み取ることが難しいという問題点があった。
【0005】
そこで、本開示の一又は複数の態様は、知識グラフの構造を理解していなくても、キーワードと、キーワードを用いて知識グラフから抽出された知識との関連性を分かりやすく提示できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本開示の一態様に係る関連情報表示装置は、複数のノードと、前記複数のノードを連結するリンクとで知識情報を保持する知識グラフを記憶する知識グラフ記憶部と、キーワードに関連する関連情報を前記知識グラフから推論する関連情報推論部と、前記キーワードと、前記関連情報との関連度を算出する関連度算出部と、前記キーワードと、前記キーワードに関連する前記関連情報とを帯でつなぐことで、前記キーワードと、前記関連情報との関連性を示す流量図を表示するための表示データを生成する表示データ生成部と、を備え前記帯の幅は、前記関連度が高いほど広いことを特徴とする。
【0007】
本開示の一態様に係るプログラムは、コンピュータを、複数のノードと、前記複数のノードを連結するリンクとで知識情報を保持する知識グラフを記憶する知識グラフ記憶部、キーワードに関連する関連情報を前記知識グラフから推論する関連情報推論部、前記キーワードと、前記関連情報との関連度を算出する関連度算出部、及び、前記キーワードと、前記キーワードに関連する前記関連情報とを帯でつなぐことで、前記キーワードと、前記関連情報との関連性を示す流量図を表示するための表示データを生成する表示データ生成部、として機能させ、前記帯の幅は、前記関連度が高いほど広いことを特徴とする。
【0008】
本開示の一態様に係る関連情報表示方法は、キーワードに関連する関連情報を、複数のノードと、前記複数のノードを連結するリンクとで知識情報を保持する知識グラフから推論し、前記キーワードと、前記関連情報との関連度を算出し、前記キーワードと、前記キーワードに関連する前記関連情報とを帯でつなぐことで、前記キーワードと、前記関連情報との関連性を示す流量図を表示するための表示データを生成し、前記帯の幅は、前記関連度が高いほど広いことを特徴とする。
【発明の効果】
【0009】
本開示の一又は複数の態様によれば、知識グラフの構造を理解していなくても、キーワードと、キーワードを用いて知識グラフから抽出された知識との関連性を分かりやすく提示することができる。
【図面の簡単な説明】
【0010】
図1】実施の形態1に係る関連情報表示装置の構成を概略的に示すブロック図である。
図2】文書を中心とした知識グラフの構造であるオントロジーを表す概略図である。
図3】知識グラフの第1の例を表す概略図である。
図4】サンキー図の第1の例を表す概略図である。
図5】部分グラフの第1の例を表す概略図である。
図6】部分グラフの第2の例を表す概略図である。
図7】入力クエリと、検索結果である関連情報との関連度をまとめた表である。
図8】知識グラフの第2の例を表す概略図である。
図9】部分グラフの第3の例を表す概略図である。
図10】サンキー図の第2の例を表す概略図である。
図11】ハードウェア構成例を概略的に表すブロック図である。
図12】実施の形態1に係る関連情報表示装置での動作を示すフローチャートである。
図13】実施の形態2に係る関連情報表示装置の構成を概略的に示すブロック図である。
図14】サンキー図の第3の例を表す概略図である。
図15】サンキー図の第4の例を表す概略図である。
図16】部分グラフの第4の例を表す概略図である。
図17】実施の形態2に係る関連情報表示装置での動作を示すフローチャートである。
図18】サンキー図の第5の例を表す概略図である。
図19】サンキー図の第6の例を表す概略図である。
図20】実施の形態3に係る関連情報表示装置の構成を概略的に示すブロック図である。
図21】実施の形態3に係る関連情報表示装置での動作を示すフローチャートである。
図22】実施の形態4に係る関連情報表示装置の構成を概略的に示すブロック図である。
図23】実施の形態5に係る関連情報表示装置の構成を概略的に示すブロック図である。
図24】ポップアップで詳細情報を表示する例を示す概略図である。
図25】詳細情報として帯の情報を表示する例を示す概略図である。
【発明を実施するための形態】
【0011】
実施の形態1.
図1は、実施の形態1に係る関連情報表示装置100の構成を概略的に示すブロック図である。
関連情報表示装置100は、知識グラフDB(Data Base)101と、DB操作部102と、ユーザI/F(interFace)部103と、関連情報推論部104と、関連度算出部105と、表示データ生成部106とを備える。
【0012】
知識グラフDB101は、知識情報を保持する。例えば、知識グラフDB101は、事前に得られた知識情報をノードとし、そのノード間の関係をリンクとして、グラフ構造で知識情報を保持している知識グラフのデータベースである。言い換えると、知識グラフDB101は、複数のノードと、その複数のノードを連結するリンクとで知識情報を保持する知識グラフを記憶する知識グラフ記憶部として機能する。
【0013】
知識グラフには、プロパティグラフ又はRDF(Resource Description Framework)等、様々な形式がある。ここでは、知識グラフは、プロパティグラフで表されているのとして説明を行う。但し、その他のグラフ形式で表されているものでもよい。さらに、ここでは、知識グラフDB101は、設計書類又は論文等の業務文書から得られる知識情報を、知識グラフとして保持しているものとする。
【0014】
図2及び図3は、実施の形態1における知識グラフを説明するための概略図である。
図2は、文書を中心とした知識グラフの構造であるオントロジーを表す概略図である。
図3は、知識グラフの一例を表す概略図である。
【0015】
図2では、「文書」、「人物」、「部署」、「製品」及び「特徴語」といった情報種別の情報をノードとし、「文書」と「著者関係」を「WRITTEN」、「文書」とその「文書」を発行する「部署」の関係を「PUBLISH」、「製品」とその「製品」に関連する「文書」の関係を「RELATED」、「人物」とその「人物」が所属している「部署」の所属関係を「BELONG_TO」、及び、「文書」とその「文書」に含まれる「特徴語」の関係を「CONTAIN」として表している。なお、「特徴語」は、ここでは、文書の内容を表すような単語を示している。知識グラフのノードには、必ず情報種別が定義されている。
【0016】
図3に示されている知識グラフ101#1は、図2に示されているオントロジーに沿って、文書及びそれに関連する情報等から知識情報をグラフとして保持している。
なお、図3に示されている知識グラフ101#1は、業務文書に関連した知識情報を保持する例を説明したが、このような知識グラフ101#1は、一例であり、別の情報が保持されていてもよい。
【0017】
図1に戻り、DB操作部102は、知識グラフDB101を操作する。例えば、DB操作部102は、知識グラフDB101に対して、知識を登録、更新又は削除し、指定された条件で知識を検索する等の操作を行う。DB操作部102は、知識グラフDB101の種類に応じた処理を行うものとし、関連情報推論部104から、入力クエリとなるキーワードと、検索する情報種別とを受け取り、指定された検索方法で検索を実施するものとする。例えば、DB操作部102は、検索方法として、知識グラフの構造を元に指定の経路パスを介してつながっている知識の検索を行う。
【0018】
ユーザI/F部103は、キーワード及び情報種別を取得するインターフェース部として機能する。ここで、ユーザI/F部103は、ユーザからの入力を受け付ける入力受付部、及び、関連情報を表示する表示処理部として機能する。例えば、ユーザI/F部103は、入力部として機能するキーボード又はマウス等の入力装置(図示せず)を介して、ユーザからの入力を受け付け、受け付けた入力クエリを関連情報推論部104へと渡す。そして、ユーザI/F部103は、表示データ生成部106より受け取った表示データに基づいて、表示部として機能するディスプレイで、関連情報とその関連度をユーザへと提示する。
【0019】
言い換えると、ユーザI/F部103は、ユーザに関連情報を検索するための検索画面を提示し、ユーザから検索に必要なデータとして、キーワードと、そのキーワードが属する情報の種別である情報種別と、検索したい情報の種別である情報種別との入力を受け付ける。そして、ユーザI/F部103は、表示データに基づいて、関連情報を、図4に示されているようなサンキー図IM1を代表とする工程間の流量を表すような流量図を用いて、入力クエリと、関連情報との関連度をユーザに提示する。
【0020】
ここで、表示データ生成部106から受け取る表示データには、少なくとも、入力クエリである各キーワードと、検索結果である関連情報と、キーワード及び検索結果をつなぐ帯の幅、並びに、キーワード及び検索結果を表示ための幅の情報とが含まれている。これらの情報を元に、ユーザI/F部103は、サンキー図IM1の形式で、表示部に関連情報を表示させる。
【0021】
サンキー図IM1では、入力クエリであるキーワードと、関連情報と、キーワード及び関連情報をつなぐ帯とが描画される。
入力クエリは、サンキー図IM1の左側に並べて表示され、関連情報は、サンキー図IM1の右側に並べて表示され、キーワード及び関連情報をつなぐ帯の幅は、キーワード及び関連情報の関連度が高いほど広くなる。
【0022】
この際、関連情報の並びは、帯の幅の大きい順に上から表示されてもよい。これにより、キーワードにより関連の深い情報が上位に来るため、結果が見やすくなる。
また、例えば、人物と、その所属情報とのように、関連情報がグルーピングできるような場合には、そのグループでまとめて表示されてもよい。これにより、ユーザが関連情報のまとまりを把握することができ、結果を見やすくすることができる。
【0023】
図1に戻り、例えば、ユーザI/F部103がWebアプリケーションとして実装された場合、ユーザがブラウザから指定のURL(Uniform Resource Locator)にアクセスすることで、検索画面が表示される。そして、ユーザは、キーボードを使ってキーワードを入力する。ユーザからの入力を元に得られた関連情報は、ディスプレイに表示されたWebブラウザ上でサンキー図として描画される。他にも、ユーザからの入力を音声での受け付けるようにしてもよい。
【0024】
図4に示されている例では、流量図は二次元で表示されているが、それが三次元で表示されてもよい。例えば、入力されたキーワードに関連する人物と文書のように、複数種類の関連情報を一度に表示したい場合に、横方面には人物との関連性が示され、奥方向には、文書とのつながりが表されることで、情報種別毎に関連情報との関係性を表示することができる。
【0025】
関連情報推論部104は、キーワードに関連する関連情報を知識グラフDB101に記憶されている知識グラフから推論する。ここでは、関連情報推論部104は、ユーザからの入力を受けて関連情報を推論する。例えば、関連情報推論部104は、ユーザからの入力された、入力クエリとしてのキーワードと、検索したい情報の情報種別とから、DB操作部102を使って、ユーザの望む関連情報を抽出する。ここでは、関連情報推論部104は、そのキーワードに関連し、その情報種別に属する情報を関連情報として推論する。
【0026】
具体的には、関連情報推論部104は、知識グラフの構造を元に、検索するパス経路を指定することで、関連情報を抽出する。例えば、ユーザが「音声認識」及び「対話」に詳しい「人物」の情報を知りたい場合に、関連情報推論部104は、「音声認識」を特徴語にもつ文書の著者と、「対話」を特徴語にもつ文書の著者とを、DB操作部102を使って抽出し、共通する人物を、関連情報である関連人物として推論する。言い換えると、関連情報推論部104は、ユーザの欲しい関連情報に応じた推論方法を選択して、関連情報を推論する。
【0027】
また、関連情報推論部104は、「音声認識」及び「対話」の両方を特徴語として含む文書の著者を関連人物としてもよい。さらに、ユーザが検索する情報として指定した情報種別毎に想定されるグラフ構造が保持されている場合には、関連情報推論部104は、そのグラフ構造と類似する部分グラフを抽出し、そこに含まれた、検索する情報として指定した情報種別のノードを関連情報として求めてもよい。また、関連情報推論部104は、入力クエリからの最短経路パスを算出して、関連情報を抽出してもよい。関連情報推論部104は、その他の方法を用いて関連情報を抽出してもよい。
【0028】
さらに、ユーザが特定の情報種別を指定するのではなく、関連情報推論部104が様々な情報種別の情報を関連情報として提示するようにしてもよい。例えば、関連情報推論部104は、グラフ構造を用いて、キーワードからの指定したホップ数以内の情報を関連情報として抽出してもよい。また、関連情報推論部104は、入力されたクエリの情報種別に応じて、抽出される情報種別を予め決めておき、そのデータのみを抽出するようにしてもよい。
【0029】
関連度算出部105は、キーワードと、関連情報との関連度を算出する。ここでは、関連度算出部105は、関連情報の推論結果から、入力されたキーワードとの関連度を算出する。例えば、関連度算出部105は、関連情報推論部104が抽出した関連情報の検索結果と、抽出を行った知識グラフのグラフ構造とを使って、入力されたクエリであるキーワードと、抽出された関連情報との関連度を算出する。
【0030】
ここで、具体例として、「対話」及び「音声認識」の関連情報である関連人物として、「人物A」及び「人物B」が抽出された場合における、関連度の算出処理を説明する。
例えば、特徴語であるキーワードと、人物との間にある文書数を関連度とする場合、図3に示されている知識グラフ101#1において、「対話」と。それぞれの関連人物との関連度は、図5に示されているような部分グラフ101#2の構造を元に、「対話」から「人物A」は、「文書4」及び「文書5」を介してつながっているため、関連度は「2」となる。また、「対話」から「人物B」は、「文書1」を介してつながっているため、関連度は「1」となる。
【0031】
同様に、図6に示されているような部分グラフ101#3の構造を元に、「音声認識」から「文書4」を介して「人物A」とつながっているため、関連度は、「1」となる。また、「音声認識」から「人物B」は、「文書1」を介してつながっているため、関連度は「1」となる。入力クエリと、検索結果である関連情報との関連度をまとめると図7のようになる。
【0032】
以上の例では、関連度算出部105は、ノード構造を元に、中継する文書数を関連度として算出したが、文書に重要度を設定し、関連度を、中継する文書の重要度の合計として算出してもよい。また、関連度算出部105は、キーワードの文書における重要度をtf-idf(Term Frequency - Inverse Document Frequency)等を用いて算出し、その結果を合計することで、関連度を算出してもよい。他にも、関連度算出部105は、PageRankを用いて設定したリンクの重みの合計を、入力クエリと、関連情報との関連度として算出してもよい。また、関連度算出部105は、ノードの種別毎に算出方法を変えてもよい。さらに、関連度算出部105は、いくつかの方法を組み合わせて、関連度を算出してもよい。また、関連度算出部105は、ここに記載されている以外の情報を用いて算出してもよい。
【0033】
表示データ生成部106は、キーワードと、そのキーワードに関連する関連情報とを帯でつなぐことで、そのキーワードとその関連情報との関連性を示す流量図を表示するための表示データを生成する。ここでは、帯の幅は、その関連度が高いほど広くなっている。流量図は、例えば、サンキー図であり、その帯の幅は、キーワードを表示する幅に基づいて、正規化されているものとする。
【0034】
実施の形態1では、表示データ生成部106は、関連情報及び関連度を元に、表示用のデータである表示データを生成する。例えば、表示データ生成部106は、関連情報推論部104から受け取った関連情報と、関連度算出部105から受け取った関連度とに基づいて、キーワードと、関連情報との関連性を、サンキー図で表すための必要な表示データを生成する。表示データには、少なくとも、入力クエリとなる各キーワード、検索結果である関連情報、入力キーワードと検索結果とをつなぐ帯、及び、表示に必要なそれぞれの幅を示す情報が含まれている。その他、表示に必要な色、又は、表示位置関係を表す情報等が含まれていてもよい。
【0035】
具体的には、表示データ生成部106は、関連度算出部105で算出された関連度を用いて、各キーワードと、各関連情報との帯の幅を、キーワード毎に正規化する。言い換えると、表示データ生成部106は、キーワードの幅を、関連情報との関連度に比例して分割した値を、帯の幅として計算し、関連情報のノードの幅は、そのノードに接続される帯の幅の合計とする。この時、ユーザが入力するキーワードは、いずれも重要性は等しいものとして、キーワードの幅は、すべて同じとする。
【0036】
例えば、図8に示されている知識グラフ101#4から、「特徴語X」と「特徴語Z」に関連する製品を検索した場合を例に説明する。
まず、前提として、「特徴語X」及び「特徴語Z」の幅を30とする。
これらに関連する関連情報である関連製品は、図9に示されている部分グラフ101#5に示されているように、「製品1」及び「製品2」である。「特徴語X」と「製品1」との関連度は「1」、「特徴語X」と「製品2」との関連度は「1」であるため、それぞれの帯の幅は、「特徴語X」の幅の1/2=15となる。
【0037】
また、「特徴語Z」と「製品1」との関連度は「1」、「特徴語Z」と「製品2」との関連度は「2」である。このため、「特徴語Z」と「製品1」との間の帯の幅は、「特徴語Y」の幅の1/3=10となり、「特徴語Z」と「製品2」との間の帯の幅は、「特徴語Y」の幅の2/3=20となる。
【0038】
以上から、「製品1」の幅は、15+10=25であり、「製品2」の幅は、15+20=35となる。このため、図10に示されているように、表示されるサンキー図IM2では、製品1のノードの幅よりも、製品2のノードの幅の方が大きくなる。
【0039】
また、別の例として、一方の入力クエリからの関連度のみが大きい場合を説明する。ここでは、それぞれのキーワードに対して、帯の幅を正規化する。これにより、一方のキーワードからの関連度の値が大きい場合にも、それぞれのキーワードで幅を正規化することで、一方の入力クエリへの関連度の値のみが結果に影響しないようにすることができる。
【0040】
例えば、「特徴語A」と「製品P」との関連度が「18」、「特徴語A」と「製品Q」との関連度が「12」、「特徴語B」と「製品P」との関連度が「1」、「特徴語B」と「製品Q」との関連度が「4」の場合、関連度の合計では、「製品P」が18+1=19、「製品Q」が12+4=16となり、「製品P」の方が大きくなる。ここでは、「製品P」はあまり「特徴語B」と関連度が大きくないが、「特徴語A」との関連度が大きいため、全体として関連度が大きいと判定されていることになる。
【0041】
しかしながら、本来ユーザの意図としては、「特徴語A」及び「特徴語B」の何れにも関連している関連情報を検索したい。そのため、本実施の形態では、表示データ生成部106は、関連度から帯の幅を正規化する。この例では、「特徴語A」と、「製品P」との帯の幅は、30×18÷(18+12)=18、「特徴語A」と、「製品Q」との帯の幅は、30×12÷(18+12)=12、「特徴語B」と「製品P」との帯の幅は、30×1÷(1+4)=6、「特徴語B」と「製品Q」との帯の幅は、30×4÷(1+4)=24となる。「製品P」の幅は、18+6=24となり、「製品Q」の幅は、12+24=36となる。これにより、製品Qの幅を、製品Pの幅よりも大きく表示することができる。以上により、表示データ生成部106は、ユーザに対して、本来検索したい、「特徴語A」と、「特徴語B」とのいずれにも関連が強い関連情報を上位の結果として、表示することができる。そして、一方の入力クエリからの関連度が全体に影響してしまうのを防ぐことができる。
【0042】
ここでは、各入力キーワードの重要性は等しいとして、同じ幅としたが、例えば、ユーザがキーワード毎にその重要度を指定し、それに応じて入力キーワードの幅が変えられてもよい。その場合は、表示データ生成部106は、設定されたキーワードの幅に応じて各帯の幅を正規化して計算する。
【0043】
図11は、実施の形態1に係る関連情報表示装置100のハードウェア構成図である。
図11に示されているように、関連情報表示装置100は、入力I/F121と、出力I/F122と、補助記憶装置123と、メモリ124と、プロセッサ125とからなるコンピュータ120により実現することができる。
【0044】
入力I/F121は、ユーザからの入力を受け付けるための、例えば、キーボード又はマウス等の入力装置である。入力I/F121は、ユーザからの入力を受け付けるための入力部として機能する。
出力I/F122は、ユーザに情報を提供するための、例えば、ディスプレイのような出力装置である。出力I/F122は、ユーザに情報を表示するための表示部として機能する。
【0045】
補助記憶装置123は、知識グラフ等のように、関連情報表示装置100での処理に必要な情報及びプログラムを記憶するためのHDD(Hard Disk Drive)又はSSD(Solid State Drive)等の記憶装置である。
メモリ124は、プロセッサ125に作業領域を提供する揮発性メモリ又は不揮発性メモリである。
【0046】
プロセッサ125は、補助記憶装置123に記憶されているプログラムをメモリ124にロードして、そのプログラムを実行することで、関連情報表示装置100での処理を実行する。
【0047】
例えば、知識グラフDB101は、補助記憶装置123により実現することができる。
また、DB操作部102、ユーザI/F部103、関連情報推論部104、関連度算出部105及び表示データ生成部106は、プロセッサ125が、補助記憶装置123に記憶されているプログラムをメモリ124にロードして、そのプログラムを実行することで、実現することができる。
【0048】
そのようなプログラムは、ネットワークを通じて提供されてもよく、また、記録媒体に記録されて提供されてもよい。即ち、このようなプログラムは、例えば、プログラムプロダクトとして提供されてもよい。
【0049】
図12は、実施の形態1に係る関連情報表示装置100での動作を示すフローチャートである。
まず、ユーザI/F部103は、ユーザから、入力部(図示せず)及び表示部(図示せず)を介して、キーワード、キーワードの情報種別及び検索対象の情報種別の入力を受け付ける(S10)。言い換えると、ユーザI/F部103は、ユーザから入力されたキーワードと、ユーザから選択の入力を受けた情報種別とを受け取る。
【0050】
次に、関連情報推論部104は、キーワードの情報種別、及び、検索する情報の情報種別を元に、関連情報の推論方法を選択する(S11)。関連情報推論部104は、ユーザI/F部103から受け取った情報種別に応じて、予め定められた複数の検索方法から、知識グラフDBへの検索方法を選択する。言い換えると、情報種別に応じて、使用する検索方法が予め定められている。
【0051】
次に、関連情報推論部104は、選択された推論方法を用いて、入力されたキーワードに関連する関連情報を推論する(S12)。言い換えると、関連情報推論部104は、ユーザI/F部103から受け取ったキーワードに対して、選択された推論方法を用いることで、そのキーワードと関連する知識情報を、知識グラフより抽出する。
【0052】
次に、関連度算出部105は、推論された関連情報に対して、各キーワードとの関連度を、グラフ構造を用いて算出する(S13)。言い換えると、関連度算出部105は、キーワードと、抽出された関連情報とを含む部分グラフの構造を元に、経由するノード数又はその重要度等の情報を用いて、関連度を算出する。
【0053】
次に、表示データ生成部106は、算出された関連度を用いて、サンキー図として必要な帯の幅及びノードの幅を算出し、表示データを生成する(S14)。言い換えると、表示データ生成部106は、関連情報推論部104が抽出した関連情報と、関連度算出部105が算出した関連度とに基づいて、キーワードと、関連情報との関連性を表す帯の幅を算出し、表示データを生成する。表示データ生成部106は、キーワードと、関連情報との帯の幅を、入力側であるキーワードの幅を元に正規化した値とし、キーワードの幅及び帯の幅を合計したものを関連情報の幅の値とする。そして、表示データ生成部106は、以上の値を含む表示データを生成する。
【0054】
最後に、ユーザI/F部103は、生成された表示データに基づいて、図示しない表示部に、サンキー図を描画する(S15)。言換えると、ユーザI/F部103は、受け取った表示データを元に、サンキー図を描画し、ユーザへと提示する。
【0055】
以上のように、実施の形態1によれば、ユーザにより入力されたキーワードと、推論された関連情報との関係性がサンキー図を用いて表すことで、入力されたキーワードと、得られた関連情報との関連性を帯の幅で表すことができる。このため、ユーザは、一目で入力されたキーワードと、得られた関連情報との関係性を把握することができる。
【0056】
さらに、キーワードと、関連情報との関係性を表す帯の幅の算出に、知識グラフから得られた関連度を正規化した値が用いられているため、両方のキーワードのいずれにも関連のあるものが上位に表示でき、ユーザがより欲しい情報を提示することができる。
【0057】
実施の形態2.
以上の実施の形態1では、キーワードからの関連情報を表示するようにしたものであるが、次に、キーワードから得られた関連情報を入力として、新たな関連情報を検索及び表示を行う場合を、実施の形態2として、説明する。
【0058】
図13は、実施の形態2に係る関連情報表示装置200の構成を概略的に示すブロック図である。
関連情報表示装置200は、知識グラフDB101と、DB操作部102と、ユーザI/F部203と、関連情報推論部204と、関連度算出部205と、表示データ生成部206と、表示データ記憶部207とを備える。
実施の形態2に係る関連情報表示装置200の知識グラフDB101及びDB操作部102は、実施の形態1に係る関連情報表示装置100の知識グラフDB101及びDB操作部102と同様である。
【0059】
ユーザI/F部203は、実施の形態1と同様に、ユーザからの入力を受け付ける入力受付部、及び、関連情報を表示する表示処理部として機能する。例えば、ユーザI/F部203は、実施の形態1と同様に、ユーザに関連情報を検索するための検索画面を提示し、ユーザから検索に必要なデータとして、キーワードと、そのキーワードが属する情報の種別である情報種別と、検索したい情報の種別である情報種別との入力を受け付ける。そして、ユーザI/F部203は、実施の形態1と同様に、表示データに基づいて、関連情報を、流量図を用いて、入力クエリと、関連情報との関連度をユーザに提示する。ここで、ユーザから入力されたキーワードに基づいて推論された関連情報を第1の関連情報ともいう。なお、第1の関連情報を推論する際に使用された、検索したい情報の情報種別を第1の情報種別ともいう。
【0060】
また、ユーザI/F部203は、図示しない入力部を介して、ユーザから、第1の関連情報を表示する画面において、第1の関連情報から検索を行う情報種別の入力を受け付ける。
例えば、図14に示されているように、第1の関連情報を推論した際のサンキー図IM3が表示されている画面において、第1の関連情報をキーワードとして、さらに検索する情報の情報種別を選択するための選択領域SA1において、情報種別が選択されると、ユーザI/F部203は、第1の関連情報をキーワードとし、選択された情報種別の情報の検索を行うように、関連情報推論部204にそれらの情報を与える。ここで選択される情報種別を、新たな情報種別又は第2の情報種別ともいう。言い換えると、実施の形態2では、ユーザI/F部203は、表示データが生成された後に、新たな情報種別を取得する。
【0061】
関連情報推論部204は、実施の形態1と同様に、ユーザからの入力を受けて第1の関連情報を推論する。
そして、関連情報推論部204は、ユーザI/F部203から、第1の関連情報であるキーワードと、選択された情報種別とを受け取ると、それらに基づいて、そのキーワードに関連する関連情報である第2の関連情報を推論する。例えば、関連情報推論部204は、図14における第1の検索結果である第1の関連情報としての人物1~5を入力キーワードとして、DB操作部102及び知識グラフDB101を用いて、選択された情報種別の関連情報を知識グラフから抽出する。言い換えると、関連情報推論部204は、第1の関連情報を新たなキーワードとして、その新たなキーワードに関連し、新たな情報種別に属する情報を新たな関連情報である第2の関連情報として推論する。
【0062】
具体的には、第1の関連情報が「人物」の場合に、さらにその人物に関連する関連情報として、情報種別「製品」を検索する場合には、関連情報推論部204は、知識グラフの構造を用いて、入力された人物のいずれかが著者である文書に関連する製品を、関連情報とするように推論方法を選択する。
【0063】
関連度算出部205は、第1の関連情報又は第2の関連情報の推論結果から、キーワードとの関連度を算出する。例えば、関連度算出部205は、第1の関連情報を入力ノードとし、第2の関連情報を出力ノードとした場合にグラフ上で経由するノード数又はその経由ノードの重要度を用いて計算する。具体的には、関連度算出部205は、入力ノードと、出力ノードとの間にあるノード数の合計を関連度として算出する。また、関連度算出部205は、経由するノードの重要度の合計を関連度として算出してもよい。
なお、第1の関連情報における関連度を第1の関連度ともいい、第2の関連情報における関連度を新たな関連度又は第2の関連度ともいう。
【0064】
表示データ記憶部207は、表示データ生成部206で生成された表示データを記憶する。
【0065】
表示データ生成部206は、実施の形態1と同様に、第1の関連情報及びその関連度を元に表示データを生成する。ここで生成される表示データを第1の表示データともいう。
また、表示データ生成部206は、第1の関連情報、第2の関連情報及びそれらの関連度を元に表示データを生成する。ここで生成される表示データを新たな表示データ又は第2の表示データともいう。
但し、第1の表示データには、第1の関連情報に基づいて、さらに推論を行うための選択領域を表示するためのデータも含まれている。
【0066】
例えば、表示データ生成部206は、実施の形態1と同様の処理により、第1の表示データを生成すると、その第1の表示データをユーザI/F部203に与えるとともに、その第1の表示データを表示データ記憶部207に記憶させる。
【0067】
具体的には、表示データ生成部206は、関連情報推論部204からの第2の関連情報及び関連度算出部205からの第2の関連度を受け取ると、キーワードとしての第1の関連情報と第2の関連情報との間の帯の幅、及び、第2の関連情報の幅を、第1の実施の形態と同様の処理により算出する。そして、表示データ生成部206は、表示データ記憶部207に記憶されている第1の表示データを読み出し、その第1の表示データで示されているキーワードの幅、キーワード及び第1の関連情報の帯の幅、第1の関連情報のノードの幅、第1の関連情報及び第2の関連情報の帯の幅、並びに、第2の関連情報のノードの幅を示す第2の表示データを生成する。
【0068】
例えば、表示データ生成部206は、第1の関連情報のノードの幅をもとに、第1の関連情報と第2の関連情報とをつなぐ帯の幅を、第1の関連情報のノードの幅に対して、関連度計算部で算出した関連度に応じて正規化することで、決定する。言い換えると、表示データ生成部206は、第1の関連情報の幅を、第2の関連情報との関連度に比例して分割した値を帯の幅として算出し、第2の関連情報のノードの幅は、帯の幅の合計とする。言い換えると、表示データ生成部206は、新たなキーワードと、新たなキーワードに関連する新たな関連情報とを帯でつなぐことで、その新たなキーワードとその新たな関連情報との関連性を示す新たな流量図を表示するための新たな表示データを生成する。ここで、新たなキーワードと、新たな関連情報とをつなぐ帯の幅は、新たな関連度が高いほど広くなる。
【0069】
なお、第2の表示データには、第1の関連情報、第2の関連情報を表示するための順序情報として、第何列目のデータであるかを示すオーダ情報、上から順に幅の大きいノードから表示するための情報、又は、グルーピング表示するための表示順序を表す情報等が含まれてもよい。
【0070】
以上のような第2の表示データを受け取ることで、ユーザI/F部203は、図15に示されているように、キーワード、第1の関連情報及び第2の関連情報を含むサンキー図IM4を、図示しない表示部に表示させる。
【0071】
サンキー図IM4では、左端に入力キーワード、真ん中に第1の関連情報、その左側に第2の関連情報が表示される。そして、各検索結果との関連度が帯の幅で表される。
具体的には、入力キーワードである「キーワードX」及び「キーワードY」の関連人物として、第1の関連情報である「人物1」、「人物2」、「人物3」、「人物4」及び「人物5」がそれぞれ表示されている。
【0072】
そして、「人物1」、「人物2」、「人物3」、「人物4」及び「人物5」のそれぞれの関連情報である「製品」が第2の関連情報として表示される。例えば、右側に第2の関連情報として、「人物1」の関連する製品として、「製品A」及び「製品D」、「人物2」の関連する製品として、「製品A」及び「製品C」、「人物3」の関連する製品として、「製品B」及び「製品E」、「人物4」に関連する製品として、「製品C」及び「製品D」、並びに、「人物5」の関連する製品として、「製品D」及び「製品E」がそれぞれ帯でつながっており、その帯の幅で関連の強さが表される。
【0073】
ここでは、関連情報推論部204は、第1の関連情報が「人物」で、その人物に関連する「製品」を検索する場合、知識グラフの構造を用いて、人物のいずれかが著者である文書に関連する製品を関連情報とするように推論方法を選択する。例えば、図16に示されている部分グラフ101#6では、「人物A」を著者とする「文書2」、「文書3」、「文書4」及び「文書5」に関連する「製品1」、「製品2」及び「製品3」と、「人物B」を著者とする「文書1」及び「文書6」に関連する「製品1」及び「製品4」が、関連する第2の製品情報として推論される。他にも、推論方法を、PageRank等を用いて知識グラフから算出する方式が選択されてもよく、その他の推論方法が使用されてもよい。
【0074】
以上に記載された関連情報表示装置200も、図11に示されているようなコンピュータ120で実現することができる。例えば、表示データ記憶部207は、補助記憶装置123で実現することができる。
【0075】
図17は、実施の形態2に係る関連情報表示装置200での動作を示すフローチャートである。
実施の形態2に係る関連情報表示装置200において、第1の関連情報を表示するまでの動作は、実施の形態1に係る関連情報表示装置100の動作と同様であるため、ここでは、第1の関連情報が表示されてから、第2の関連情報を表示するまでの動作を説明する。
【0076】
まず、ユーザI/F部203は、第1の関連情報を表す流量図を含む画面を介して、ユーザから第2の関連情報を検索する情報種別の入力を受け付ける(S20)。ここでは、ユーザI/F部203は、ユーザから、第1の関連情報に関連する情報を表示するため、第2の関連情報の情報種別の選択を受け付ける。例えば、図18に示されている例では、「キーワードX」及び「キーワードY」に関連する第1の関連情報「人物A」及び「人物B」がサンキー図IM5に示されており、ユーザは、選択領域SA2において、第1の関連情報「人物A」及び「人物B」に関連する第2の関連情報を検索するための情報種別を選択する。ここでは、第2の関連情報の情報種別として、「製品」が選択されている。
【0077】
次に、関連情報推論部204は、第1の関連情報の情報種別と、第2の関連情報の情報種別とに基づいて、推論方法を選択する(S21)。言い換えると、関連情報推論部204は、ユーザI/F部203から受け取った第1の関連情報の情報種別と、第2の関連情報の情報種別とに応じて予め定められている、知識グラフの推論方法を選択する。図18に示されている例では、「人物」から関連する「製品」を推論するため、「人物」を著者として持つ「文書」を検索し、さらにその「文書」に関連する「製品」を第2の関連情報として抽出する推論方法が選択される。
【0078】
次に、関連情報推論部204は、第1の関連情報に対して、選択された推論方法を用いて、第2の関連情報を推論する(S22)。言い換えると、関連情報推論部204は、ユーザI/F部203から受け取った第1の関連情報に対して、選択された推論方法を用いることで、関連する知識情報を知識グラフより抽出する。図16に示されている例では、人物Aを著者とする文書は、「文書2」、「文書3」、「文書4」及び「文書5」であり、これらの文書に関連する製品は、「製品1」、「製品2」及び「製品3」であるため、「人物A」に関連する製品情報は、「製品1」、「製品2」及び「製品3」である。
【0079】
また、「人物B」を著者とする文書は、「文書1」及び「文書6」であり、これらの文書に関連する製品が、「製品1」及び「製品4」であるため、「人物B」に関連する製品は、「製品1」及び「製品4」である。
【0080】
次に、関連度算出部205は、推論された第2の関連情報に対して、第1の関連情報との関連度を、グラフ構造を用いて、算出する(S23)。言い換えると、関連度算出部205は、キーワードである第1の関連情報と、抽出された第2の関連情報とを含む部分グラフの構造を元に、経由するノード数又はその重要度等の情報を用いて、関連度を算出する。
【0081】
図16に示されている部分グラフ101#6では、「人物A」と「製品1」とは、「文書2」を介して関連しているため、経由ノード数は「1」であり、「文書2」は、他の文書から参照されている重要度が高い文書であるため、重要度が「2」となっている。このため、関連度算出部205は、その関連度を2×1=2と算出する。
【0082】
また、「人物A」と「製品2」とは、「文書3」及び「文書4」を介して関連しているため、経由ノード数は「2」であり、これらの文書の重要度は「1」となっている。このため、関連度算出部205は、その関連度を1×2=2と算出する。
【0083】
「人物A」と「製品3」とは、「文書5」を介して関連しているため、経由ノード数は「1」であり、その重要度は「1」となっている。このため、関連度算出部205は、その関連度を1×1=1と算出する。
【0084】
同様に、「人物B」と「製品1」とは、「文書1」を介して関連しているため、経由ノード数は「1」であり、その重要度は「1」となっている。このため、関連度算出部205は、その関連度を1×1=1と算出する。
【0085】
図17に戻り、次に、表示データ生成部206は、表示データ記憶部207に記憶されている第1の関連情報の表示データを取得する(S24)。そして、表示データ生成部206は、すでにユーザに表示している入力クエリのキーワードと、第1の関連情報との表示データとして、キーワードのノードの幅と、第1の関連情報のノードの幅と、キーワード及び第1の関連情報の帯の幅とを特定する。
【0086】
例えば、図18に示されている例では、特徴語である「キーワードX」及び「キーワードY」のノードの幅はそれぞれ「50」であり、第1の関連情報である「人物A」のノードの幅は「65」、「人物B」のノードの幅は「35」である。「キーワードX」及び「人物A」の帯の幅は「35」であり、「キーワードY」及び「人物A」の帯の幅は「30」であり、「キーワードX」及び「人物B」の帯の幅は「15」であり、「キーワードY」及び「人物B」の帯の幅は「20」である。
【0087】
次に、表示データ生成部206は、算出された関連度を用いて、サンキー図として必要な帯の幅及びノードの幅を算出して、新たな表示データを生成する(S25)。例えば、表示データ生成部206は、関連情報推論部204により推論された第2の関連情報と、関連度算出部205により算出された関連度とを元に、第1の関連情報と、第2の関連情報との関連性を表す帯の幅を算出し、新たな表示データを生成する。ここでは、表示データ生成部206は、第1の関連情報と、第2の関連情報との帯の幅を、入力側である第1の関連情報のノードの幅を元に正規化した値とし、各帯の幅を合計した値を、第2の関連情報のノードの幅とする。
【0088】
図19は、新たな表示データを用いて描画されたサンキー図IM6を含む画面の一例を示す概略図である。
図19に示されている例では、第1の関連情報と第2の関連情報とをつなぐ帯の幅、及び、第2の関連情報のノードの幅は、以下のようにして決定されている。
「人物A」のノードの幅が「65」であり、「人物A」に関連する製品は、関連度2の「製品1」、関連度2の「製品2」及び関連度1の「製品3」である。表示データ生成部206は、関連する製品の関連度に応じて帯の幅を正規化するため、(入力側のノード幅)×(関連度)/(関連度の合計)を算出する。このため、「人物A」から「製品1」への帯の幅は、65×2/(2+2+1)=26となる。同様に、「人物A」から「製品2」への帯の幅は、65×2/(2+2+1)=26となり、「人物A」から「製品1」への帯の幅は、65×1/(2+2+1)=13となる。
また、「人物B」から「製品1」への帯の幅は、35×1/(1+1)=17.5であり、「人物B」から「製品4」への幅も、35×1/(1+1)=17.5となる。
【0089】
以上から、「製品1」のノードの幅は、「人物A」及び「人物B」のそれぞれからの帯の幅の合計となるため、26+17.5=43.5となる。また、「製品2」、「製品3」及び「製品4」のノード幅は、それぞれ、26、13、17.5となる。
【0090】
図17に戻り、最後に、ユーザI/F部203は、新たな表示データを元にサンキー図を描画する(S26)。例えば、ユーザI/F部203は、受け取った表示データを元に、サンキー図を描画し、ユーザへと提示する。
【0091】
以上のように、実施の形態2によれば、検索された結果を入力として、関連情報に関連する関連情報をさらに表示することで、検索を最初からやり直すことなく、更なる関連情報を検索し、関連情報同士の関係性を提示できるため、よりユーザの所望する関連情報を効率的に見つけることができる。
【0092】
また、入力クエリから第1の関連の深い情報のノードの幅が大きくなり、その幅の大きさを使って、さらに関連する情報の幅を表していくため、帯の幅を見ることで、入力したクエリから関連の度合いをわかりやすく読み取ることができる。
【0093】
実施の形態2では、第1の関連情報を用いて、第2の関連情報を表示する方法を説明したが、同様に、さらに、第2の関連情報を入力クエリとして第3の関連情報を表示、さらに、第3の関連情報を入力クエリとして第4の関連情報を表示することができる。言い換えると、関連情報の検索結果を用いて、次々と関連情報の検索を行うことができる。
【0094】
実施の形態3.
実施の形態1では、ユーザが、キーワードを入力していたが、実施の形態3は、文又は文書を入力とし、キーワードを自動的に抽出することで、そのキーワードと特徴語として関連情報を提示できるようにする。
【0095】
図20は、実施の形態3に係る関連情報表示装置300の構成を概略的に示すブロック図である。
関連情報表示装置300は、知識グラフDB101と、DB操作部102と、ユーザI/F部303と、関連情報推論部304と、関連度算出部105と、表示データ生成部106と、重要語抽出部308とを備える。
実施の形態3に係る関連情報表示装置300の知識グラフDB101、DB操作部102、関連度算出部105及び表示データ生成部106は、実施の形態1に係る関連情報表示装置100の知識グラフDB101、DB操作部102、関連度算出部105及び表示データ生成部106と同様である。
【0096】
ユーザI/F部303は、実施の形態1と同様に、ユーザからキーワード及びそのキーワードの情報種別の入力を受け付ける。この場合における関連情報表示装置300の動作は、実施の形態1における関連情報表示装置300と同様であるため、以下、説明を省略する。
【0097】
実施の形態3におけるユーザI/F部303は、ユーザからキーワード及び情報種別の代わりに、文又は文書と、検索したい情報の情報種別との入力を受け付けることもできる。これにより、ユーザI/F部303は、テキスト文及び情報種別を取得する。そして、ユーザI/F部303は、取得されたテキスト文を関連情報推論部304に与える。ユーザからの入力は、テキストデータ又は文書ファイル等、その形式はどのようなものであってもよく、テキスト文を取得できるものであればよい。例えば、ユーザからテキスト文を受け付ける方法としては、入力ボックスに文字列の入力を受け付けてもよく、また、文書ファイルのファイル名の入力を受け付けてもよい。文書ファイルのファイル名を受け付けた場合には、ユーザI/F部303は、そのファイル名の文書ファイルからテキストデータをテキスト文として抽出し、そのテキスト文を関連情報推論部304に与えればよい。
【0098】
また、ユーザI/F部303は、実施の形態1と同様に、表示データ生成部106から表示データを受け取り、その表示データに基づいて、関連情報を、流量図を用いて、入力クエリと、関連情報との関連度をユーザに提示する。
なお、ユーザI/F部303は、実施の形態2と同様に、関連情報を表示する画面において、さらなる検索を行う情報種別の入力を受け付けることで、関連情報に関連する関連情報をさらに提供することもできる。
【0099】
関連情報推論部304は、ユーザI/F部303から受け取ったテキスト文を重要語抽出部308へと渡す。そして、関連情報推論部304は、重要語抽出部308から、抽出された重要語を受け取る。
関連情報推論部304は、受け取った重要語をキーワードとし、その情報種別を「特徴語」とし、ユーザから入力された検索する情報の情報種別をもとに、推論方法を決定し、関連情報を推論する。ここでは、関連情報推論部304は、キーワードに関連し、検索情報の情報種別に属する情報を関連情報として推論する。
そして、関連情報推論部304は、推論された関連情報を関連度算出部105へと渡す。
【0100】
重要語抽出部308は、関連情報推論部304から受け取ったテキスト文から、重要語の抽出を行う。抽出した重要語は、関連情報推論部304へ渡される。重要語の抽出は、公知の技術が用いられればよい。例えば、重要語抽出部308は、テキスト文を形態素解析し、TF-IDF(TermFrequency - Inverse Document Frequency)を用いて、テキスト文から重要語を抽出する。他にも、予め登録された単語が重要語として抽出されてもよく、名詞が重要語として抽出されてもよい。ここで抽出された重要語は、キーワードとして扱われるため、重要語抽出部308は、テキスト文からキーワードを抽出するキーワード抽出部として機能する。
【0101】
関連度算出部105及び表示データ生成部106での処理については、実施の形態1と同様である。但し、表示データ生成部106は、重要語抽出部308での重要語の抽出における重要度(例えば、TF-IDFで算出された重要度)によって、重要語であるキーワードの幅を変えるようにしてもよい。また、ユーザが入力キーワードの帯の幅を決めてもよい。
【0102】
以上に記載された関連情報表示装置300も、図11に示されているようなコンピュータ120で実現することができる。例えば、重要語抽出部308は、プロセッサ125が、補助記憶装置123に記憶されているプログラムをメモリ124にロードして、そのプログラムを実行することで実現することができる。
【0103】
図21は、実施の形態3に係る関連情報表示装置300での動作を示すフローチャートである。
図21に示されているフローチャートにおいて、図12に示されている実施の形態1におけるフローチャートと同じ処理を行うステップについては、図12と同じ符号を付す。
【0104】
まず、ユーザI/F部203は、ユーザからテキスト文及び検索した情報種別を取得する(S30)。例えば、ユーザI/F部203は、ユーザから入力ボックスに文字列の入力、又は、文書ファイルのファイル名の入力を受け付ける。ここで、ユーザからの入力が文書ファイルのファイル名であった場合には、ユーザI/F部203は、その文書ファイルからテキスト文を抽出する。具体的には、ユーザI/F部203は、その文書ファイルにアクセスし、その文書ファイルからテキスト文を抽出する。テキスト文は、関連情報推論部304を介して、重要語抽出部308に与えられる。
【0105】
次に、重要語抽出部308は、関連情報推論部304からのテキスト文から重要語を抽出する(S31)。例えば、重要語抽出部308は、そのテキスト文に対し、重要語抽出処理を実施し、重要語を抽出し、関連情報に用いる入力キーワードとして、関連情報推論部304に与える。
【0106】
図21のステップS11~S15の処理については、図12のステップS11~S15の処理と同じである。
但し、関連情報推論部304は、重要語抽出部308からの重要語を、情報種別「特徴語」のキーワードとして関連情報の推論を行う。
【0107】
以上のように、実施の形態3は、テキスト文から関連情報を検索できるようにすることで、ユーザがキーワードを検討することなく、関連する情報を得ることができ、ユーザの所望する情報を簡単に得ることができる。
【0108】
また、自動抽出された重要語を提示し、ユーザが削除等の修正できるようにすることで、よりユーザにとって重要なキーワードのみを用いて検索することができ、よりユーザの所望する結果を提示することができる。
【0109】
なお、ここではテキスト文から自動抽出された重要語を入力ノードとして表示するようにしたが、文書ファイルを入力ノードとして表示し、重要語から得られた関連情報を、そのファイルに関連する情報としてサンキー図が表示されてもよい。これにより、複数の文書ファイルを入力とした場合に、ユーザが重要なキーワードを取り出すことなく、ファイルとの関連情報を得ることができる。
【0110】
実施の形態4.
以上に記載された実施の形態1又は3では、知識グラフ上のデータ構造を使って、関連情報を検索しているが、知識グラフDB101以外のデータベースを併用して関連情報の検索を行う場合を、実施の形態4として説明する。
【0111】
図22は、実施の形態4に係る関連情報表示装置400の構成を概略的に示すブロック図である。
関連情報表示装置400は、知識グラフDB101と、DB操作部402と、ユーザI/F部303と、関連情報推論部404と、関連度算出部105と、表示データ生成部106と、全文検索DB409とを備える。
実施の形態4に係る関連情報表示装置400の知識グラフDB101、関連度算出部105及び表示データ生成部106は、実施の形態1に係る関連情報表示装置100の知識グラフDB101、関連度算出部105及び表示データ生成部106と同様である。
また、実施の形態4に係る関連情報表示装置400のユーザI/F部303は、実施の形態3に係る関連情報表示装置300のユーザI/F部303と同様である。このため、実施の形態4におけるユーザI/F部303は、キーワード及びその情報種別、又は、文若しくは文章と、検索を行う情報の情報種別との入力を受け付ける。言い換えると、ユーザI/F部303は、キーワード又はテキスト文を取得するインターフェース部として機能する。
【0112】
関連情報推論部404は、ユーザI/F部303から、キーワード又はテキスト文と、情報種別とを受け取り、これらに応じて、全文検索を併用した推論方法を選択する。言い換えると、関連情報推論部404は、キーワード又はテキスト文と関連する文書を、全文検索DB409を用いて検索し、検索された文書に関連する関連情報を、知識グラフの構造を用いて推論する。
【0113】
例えば、関連情報推論部404は、DB操作部402に、入力されたキーワード又はテキスト文をクエリとして全文検索を行わせ、DB操作部402から、関連度順に関連する文書を示す文書情報を取得する。そして、関連情報推論部404は、DB操作部402に、検索結果である文書情報で示される文書を知識グラフDB101への入力として、関連情報を検索させる。
【0114】
具体的には、入力キーワードが「知識グラフ」及び「要約」であり、検索する情報の情報種別が「人物」である場合、関連情報推論部404は、DB操作部402に対して、全文検索DB409において、「知識グラフ」及び「要約」という単語を用いて、それぞれ関連する文書を検索させる。検索の結果、関連度の高い文書として、「知識グラフ」では、「文書1」、「文書2」及び「文書3」が検索され、「要約」では、「文書2」、「文書4」及び「文書5」が検索されたものとする。関連情報推論部404は、関連度の高い文書を、閾値を用いて特定してもよく、予め定められた数の文書を、関連度の高い順に特定してもよい。
【0115】
次に、関連情報推論部404は、DB操作部402に対して、知識グラフDB101において、「文書1」、「文書2」及び「文書3」を入力とし、これらの文書に関連する人物(例えば、文書の著者情報)を検索させる。なお、「文書1」、「文書2」及び「文書3」の情報種別は、「文書」である。ここでは、「人物A」及び「人物B」が検索されたものとする。同様に、DB操作部402に対して、知識グラフDB101において、「文書2」、「文書4」及び「文書5」を入力とし、これらの文書に関連する人物を検索させる。ここでは、「人物A」、「人物B」及び「人物C」が検索されたものとする。この場合、DB操作部402は、検索結果として、関連情報推論部404に、「知識グラフ」及び「要約」に関連する人物として、「人物A」及び「人物B」を返す。
以上のように、実施の形態4における関連情報推論部404は、キーワード又はテキスト文に関連する文書を、全文検索DB409に記憶されているテキスト情報でテキストが示されている複数の文書から推論し、その関連する文書に関連する関連情報を知識グラフから推論する。
【0116】
全文検索DB409は、知識グラフDB101において、「文書」の情報種別のノードで示される文書のテキストを示すテキスト情報を記憶するデータベースである。言い換えると、全文検索DB409は、複数の文書のそれぞれのテキストを示すテキスト情報を記憶するテキスト情報記憶部として機能する。
【0117】
DB操作部402は、関連情報推論部404からキーワード又はテキスト文を受け取り、そのキーワード又はテキスト文を用いて、全文検索DB409に記憶されているテキスト情報に対して全文検索を行うことで、そのキーワード又はテキスト文に関連する度合いを示す関連度の順で、文書を検索する。そして、DB操作部402は、検索された文書を示す文書情報を関連情報推論部404に与える。
【0118】
以上に記載された関連情報表示装置400も、図11に示されているようなコンピュータ120で実現することができる。例えば、全文検索DB409は、補助記憶装置123で実現することができる。
【0119】
以上のように、実施の形態4によれば、関連情報の推論に、全文検索DB409を併用することで、知識グラフ上では表示されていない関連する文書の抽出を行うことができる。このため、ユーザに関連情報をより多く提示することができ、所望する情報を抜けなく提示することができる。
【0120】
また、実施の形態3のように、文書ファイルのファイル名が入力された場合、実施の形態3では、文書のテキスト文から重要語を抽出し、その重要語であるキーワードから検索することで関連情報を抽出している。実施の形態4では、関連情報推論部404で受け取ったテキスト文を、全文検索における入力とし、類似文書を抽出することで、関連情報を抽出する。これにより、ユーザが重要語を検討する必要もなく、またテキスト文全体を入力とすることで、入力されたテキスト文により類似した文書を抽出することができるため、よりユーザの所望する関連情報を提示することができる。
【0121】
実施の形態5.
実施の形態5は、実施の形態1~4において表示される関連情報について、さらなる詳細情報を提供する場合について示したものである。
【0122】
図23は、実施の形態5に係る関連情報表示装置500の構成を概略的に示すブロック図である。
関連情報表示装置500は、知識グラフDB501と、DB操作部502と、ユーザI/F部503と、関連情報推論部104と、関連度算出部105と、表示データ生成部106と、詳細情報取得部510とを備える。
実施の形態5に係る関連情報表示装置500の関連情報推論部104、関連度算出部105及び表示データ生成部106は、実施の形態1に係る関連情報表示装置100の関連情報推論部104、関連度算出部105及び表示データ生成部106と同様である。
【0123】
知識グラフDB501は、実施の形態1と同様に、知識情報を保持する。
実施の形態5における知識グラフDB501は、知識情報としての知識グラフを構成する各ノードに関する詳細情報も記憶する。詳細情報は、例えば、ノードのプロパティ情報又は隣接ノード情報である。関連情報が「文書」であった場合、そのプロパティ情報は、例えば、文書のタイトル、作成日、更新日時又はページ数等の情報であり、隣接ノード情報として、著者、検収者又は更新者等である人物のノード、発行部署のノード、関連する製品やプロジェクト、ソリューション等のノード等のように関連情報に対応するノードに隣接するノードを示す情報である。
【0124】
DB操作部502は、実施の形態1と同様の処理を行う他、詳細情報取得部510からの指示に応じて、詳細情報取得部510から与えられた関連情報に関係する詳細情報を知識グラフDB501から取得して、その詳細情報を詳細情報取得部510に与える。
【0125】
ユーザI/F部503は、実施の形態1におけるユーザI/F部103と同様の処理を行う他、以下の処理を行う。
ユーザI/F部503は、表示データ生成部106から表示データを受け取ると、詳細情報取得部510から、表示データに含まれている関連情報及び帯の詳細情報を受け取る。そして、ユーザI/F部503は、実施の形態1と同様に、表示データに基づいて流量図を、図示しない表示部に表示させ、その流量図において、ユーザから指示があった場合に、関連情報又は帯の詳細情報を、図示しない表示部に表示させる。
【0126】
詳細情報取得部510は、ユーザI/F部503から関連情報を受け取り、DB操作部502を用いて知識グラフDB501から詳細情報を取得する。言い換えると、詳細情報取得部510は、ユーザI/F部503から受け取った関連情報に関する詳細情報を得るために、DB操作部502を用いて、知識グラフDB501から詳細情報を取得する。
【0127】
また、詳細情報取得部510は、詳細情報として、キーワードと関連情報との関係を表す帯の情報を取得するようにしてもよい。帯の情報とは、関連情報推論部104にて、関連情報の推論方法に用いた情報である。言い換えると、知識グラフの構造を用いて、経由するノードを決めて推論を行った場合には、その経由するノードを示す情報が帯の情報となる。さらに経由するノードのプロパティ情報及び隣接ノード情報が、帯の情報に含められてもよい。また、帯の関連度の情報が、帯の情報に含まれてもよい。
詳細情報取得部510は、以上のような詳細情報を、ユーザI/F部503に与える。
【0128】
ユーザI/F部503は、取得された詳細情報をユーザへと提示する。例えば、図示しない表示部にサンキー図が表示されている場合に、サンキー図に含まれている関連情報を、図示しない入力部を介して、ユーザがクリックした際に、ポップアップで、その関連情報の詳細情報を表示させる。例えば、図24は、ポップアップで詳細情報を表示する例を示す概略図である。また、ユーザI/F部503は、図示しない表示部に、ブラウザを介してサンキー図を表示している場合には、そのブラウザのタブで、詳細情報を表示させてもよい。言い換えると、実施の形態5におけるユーザI/F部503は、関連情報又は帯に関する詳細情報を取得する指示を取得し、その指示に応じて、詳細情報取得部510に、対応する詳細情報を取得させる。
【0129】
また、ユーザI/F部503は、図示しない表示部にサンキー図が表示されている場合に、サンキー図に含まれている帯を、図示しない入力部を介して、ユーザがクリックした際に、その帯の情報に基づいて、経由するノードの詳細情報を一覧表としてポップアップで表示させたり、そこから詳細な経由ノードの情報を表示させたりしてもよい。図25は、詳細情報として帯の情報を表示する例を示す概略図である。
【0130】
以上に記載された関連情報表示装置500も、図11に示されているようなコンピュータ120で実現することができる。例えば、詳細情報取得部510は、プロセッサ125が、補助記憶装置123に記憶されているプログラムをメモリ124にロードして、そのプログラムを実行することで実現することができる。
【0131】
以上のように、実施の形態5によれば、ユーザは、関連情報の詳細情報を得ることで、よりほしい関連情報がどれであるかを容易に見つけ出すことができる。
【0132】
なお、ユーザI/F部503は、詳細情報を使って、図示しない表示部に表示させる関連情報をフィルタリングして、指定された表示データに関連する部分のみを抽出するフィルタであるフィルタリング部(図示せず)を持つようにしてもよい。フィルタリング部は、詳細情報を用いて関連情報に対してフィルタリングを行う。
【0133】
そのフィルタリング部は、表示データの内、ユーザが図示しない入力部を介して指定した条件を満たす部分のみを抽出し、ユーザI/F部503は、その抽出された部分のみを用いて表示データを更新する。言い換えると、ユーザI/F部503は、詳細情報で得られたプロパティ情報又は隣接ノード情報をフィルタ情報として、ユーザへと提示し、ユーザがフィルタ部における条件を選択することで、特定の条件を満たした関連情報のみを表示させることができる。その際、フィルタ部は、帯の情報を使ったフィルタリングを行うようにしてもよい。例えば、プロパティに、ある値を持つ結果のみを表示したり、指定されたプロパティを詳細情報に含む帯のみを表示させたり、指定した値以上の関連度を持つ関連情報のみを表示させるようにする。
【0134】
ユーザが指定した条件を満たす関連情報のみを提示することで、ユーザが関連情報を探す際に、不要な情報を見ることなく、必要な情報のみを取り出すことが容易となる。
【符号の説明】
【0135】
100,200,300,400,500 関連情報表示装置、 101,501 知識グラフDB、 102,402,502 DB操作部、 103,203,303,503 ユーザI/F部、 104,204,304,404 関連情報推論部、 105,205 関連度算出部、 106,206 表示データ生成部、 207 表示データ記憶部、 308 重要語抽出部、 409 全文検索DB、 510 詳細情報取得部。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25