特許第5803902号(P5803902)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許5803902関連情報出力装置、関連情報出力方法および関連情報出力プログラム
<>
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000002
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000003
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000004
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000005
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000006
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000007
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000008
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000009
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000010
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000011
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000012
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000013
  • 特許5803902-関連情報出力装置、関連情報出力方法および関連情報出力プログラム 図000014
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5803902
(24)【登録日】2015年9月11日
(45)【発行日】2015年11月4日
(54)【発明の名称】関連情報出力装置、関連情報出力方法および関連情報出力プログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20151015BHJP
【FI】
   G06F17/30 380D
   G06F17/30 340B
【請求項の数】12
【全頁数】38
(21)【出願番号】特願2012-504286(P2012-504286)
(86)(22)【出願日】2010年12月28日
(86)【国際出願番号】JP2010073724
(87)【国際公開番号】WO2011111284
(87)【国際公開日】20110915
【審査請求日】2013年11月11日
(31)【優先権主張番号】特願2010-55699(P2010-55699)
(32)【優先日】2010年3月12日
(33)【優先権主張国】JP
(73)【特許権者】
【識別番号】000004237
【氏名又は名称】日本電気株式会社
(74)【代理人】
【識別番号】110002044
【氏名又は名称】特許業務法人ブライタス
(72)【発明者】
【氏名】水口 弘紀
(72)【発明者】
【氏名】楠村 幸貴
(72)【発明者】
【氏名】村岡 優輔
(72)【発明者】
【氏名】久寿居 大
【審査官】 長 由紀子
(56)【参考文献】
【文献】 特開2008−250625(JP,A)
【文献】 西本 一志 外2名,発想支援システムに関する一考察,全国大会講演論文集 第46 回平成5 年前期(6),日本,社団法人情報処理学会,1993年 3月 1日,p.283-284
【文献】 鳥澤 健太郎 外3名,自動生成された検索ディレクトリ「鳥式」の現状,言語処理学会第14回年次大会発表論文集,日本,言語処理学会,2008年 3月17日,p.729-732
【文献】 石井 恵 外2名,ネット上の会話からの話題即時抽出技術の評価について,情報処理学会研究報告,日本,社団法人情報処理学会,2005年 9月30日,第2005巻第94号,p.33-40
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
関連元情報に関連する情報を出力するための関連情報出力装置であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するための関連情報検索部と、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するための認知度計算部と、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる、1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するための高関心情報絞込み部とを備える、関連情報出力装置。
【請求項2】
前記高関心情報絞込み部は、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、請求の範囲第1項に記載の関連情報出力装置。
【請求項3】
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、請求の範囲第1項または請求の範囲第2項に記載の関連情報出力装置。
【請求項4】
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、請求の範囲第1項または請求の範囲第2項に記載の関連情報出力装置。
【請求項5】
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記認知度を計算すべき前記関係である対象関係に対応する前記関連元情報および前記関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記カテゴリ間の関係の出現確率を前記対象関係の認知度として計算する、請求の範囲第1項から請求の範囲第項のいずれかに記載の関連情報出力装置。
【請求項6】
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報のカテゴリの出現確率を前記対象情報の認知度として計算する、請求の範囲第1項から請求の範囲第項のいずれかに記載の関連情報出力装置。
【請求項7】
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と前記対象情報のカテゴリの出現頻度との差を前記対象情報の認知度として計算する、請求の範囲第1項から請求の範囲第項のいずれかに記載の関連情報出力装置。
【請求項8】
前記関連情報検索部は、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度計算部は、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記高関心情報絞込み部は、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる、1または複数の前記関連先情報を選択し、更に、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係
の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる、1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、請求の範囲第1項から請求の範囲第項のいずれかに記載の関連情報出力装置。
【請求項9】
前記高関心情報絞込み部は、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を選択し、かつ、
前記各関連先情報の中から、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
前記高関心情報絞込み部は、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、請求の範囲第項に記載の関連情報出力装置。
【請求項10】
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記認知度を計算すべき前記関連内容に対応する前記関連元情報および前記関連先情報の各々のカテゴリ間の関係について、前記カテゴリ間の関係の出現頻度の総和および前記関連内容の出現頻度に基づいて前記関連内容の出現確率を計算し、計算した前記出現確率を前記関連内容の認知度とする、請求の範囲第または請求の範囲第9項に記載の関連情報出力装置。
【請求項11】
関連元情報に関連する情報を出力するための関連情報出力装置における関連情報出力方法であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するステップと、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる、1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するステップとを含む、関連情報出力方法。
【請求項12】
関連元情報に関連する情報を出力するための関連情報出力装置において用いられる関連情報出力プログラムであって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するステップと、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる、1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するステップとをコンピュータに実行させるための、関連情報出力プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、関連情報出力装置、関連情報出力方法および関連情報出力プログラムに関し、特に、関連元情報から、ユーザの興味を引く意外性のある情報を出力する関連情報出力装置、関連情報出力方法および関連情報出力プログラムに関する。
【背景技術】
【0002】
関連情報出力装置とは、関連元情報(source information)に関連する情報(以下、関連情報とも称する。)を出力する装置である。以下では、関連情報(linkage information)とは、関連元情報と関連先情報(destination information)との組み合わせ、または、関連元情報と関連先情報と関連内容(relation content)との組み合わせを含むものとする。すなわち、関連情報とは、キーワード、文書、画像および音声の間にある関連を示す情報である。また、関連内容とは、関連の種類および特徴を示すキーワードおよび文である。
【0003】
ユーザに提示する情報として興味を引く意外性のある情報を選択することは重要である。なぜならば、Webサービス等の場合、ユーザの興味を引く情報を提示することは、Webサイトへのユーザの再訪問を促進し、Webサイトのアクセス数に直結するからである。また、マーケティングにおいても、他者が気づきにくい新しい情報を得ることは新たな気づきを得ることとなるため、他者とは異なる新しい商品開発につなげることができるからである。
【0004】
従来の関連情報出力装置の一例が、大塚信吾ら,”大域ウェブアクセスログを用いた関連語の発見法に関する一考察”,情報処理学会論文誌,vol.46 No.SIG8(TOD26),pp.82-92(2005)(非特許文献1)に開示されている。非特許文献1において、関連元情報および関連先情報はキーワードである。関連情報を提示する際、関連元のキーワードを入力として、これまで閲覧したWebページに存在するキーワードのうち、最も頻度の高いキーワードを出力する。したがって、非特許文献1に記載の関連情報出力装置では、関連元情報に最も関連するキーワードを提示することを目的としている。
【0005】
また、ある情報が意外性を持つ情報であるか否かを判定する方法の一例が、野田陽平ら,"意外性のある知識発見のためのWikipedia カテゴリ間の関係分析",第20回セマンティックウェブとオントロジー研究会,SIG-SWO-A803-02,pp.08-01-pp.08-04(2008)(非特許文献2)に開示されている。すなわち、非特許文献2では、二つのカテゴリの共起頻度に基づいて意外性のある情報であるか否かを評価する手法が開示されている。ここで、情報は複数のカテゴリに属しており、二つのカテゴリの共起頻度とは、二つのカテゴリが1つの情報に同時に属している回数である。カテゴリの共起頻度の少ない二つのカテゴリに同時に属する情報Zは、これら二つのカテゴリにまたがった意外性のある知識が含まれていると仮定する。情報Zが共起頻度の少ない任意の2つのカテゴリに含まれている場合、この情報Zを意外性のある情報として出力する。
【0006】
たとえば、情報「麻生太郎」がカテゴリ「総理大臣」とカテゴリ「オリンピック選手」とに属しているとする。このとき、これら二つのカテゴリの共起頻度が低い場合には、情報「麻生太郎」は意外性のある情報であるとして出力される。
【先行技術文献】
【非特許文献】
【0007】
【非特許文献1】大塚信吾ら,”大域ウェブアクセスログを用いた関連語の発見法に関する一考察”,情報処理学会論文誌,vol.46 No.SIG8(TOD26),pp.82-92(2005)
【非特許文献2】野田陽平ら,"意外性のある知識発見のためのWikipedia カテゴリ間の関係分析",第20回セマンティックウェブとオントロジー研究会,SIG-SWO-A803-02,pp.08-01-pp.08-04(2008)
【発明の概要】
【発明が解決しようとする課題】
【0008】
非特許文献1に記載の関連情報出力装置は、関連元情報に最も関連する関連先情報を提示することを目的として作られている。このため、利用者が知っているような情報(既知情報)を提示してしまい、利用者の興味を引くような関連情報を提示できないことから、Webサイトにおけるクリック率が低いという問題があった。また、判定方法を反転し、逆に、関連しない情報を提示したとしても、誰も知らないような未知の関連情報ばかりでは利用客の興味を引かないために提示情報はやはり選択されず、クリック率が低いという問題があった。
【0009】
また、非特許文献2に記載の技術だけでは、同様に、利用者の興味を引くような意外性のある関連情報を提示することはできない。なぜならば、単に共起頻度が低いカテゴリに属しているからといって、意外性のある情報とは言えないからである。
【0010】
この理由を具体的に説明する。たとえば、関連情報の提示方法として、項目を関連元情報とし、カテゴリを関連先情報とする方法を考える。この方法において、カテゴリ「総理大臣」とカテゴリ「オリンピック選手」の共起頻度は低く、これら二つのカテゴリに属する項目「麻生太郎」があったとする。この例において、関連元情報として「麻生太郎」を出力し、関連先情報としてカテゴリ「総理大臣」を出力しても意外性を感じない。一方、関連先情報として「オリンピック選手」と出力すると、出力された関連情報は興味を引く情報となる。なぜならば、関連元情報「麻生太郎」と関連先情報「総理大臣」との間に関係があることは既知情報であるが、関連元情報「麻生太郎」と関連先情報「オリンピック選手」との間に関係があることは未知情報であるからである。
【0011】
また、別の関連情報の提示方法として、二つのカテゴリをそれぞれ関連元情報および関連先情報とし、項目を関連内容とする方法がある。上記と同様に、これら二つのカテゴリに属する項目「麻生太郎」がある例では、関連元情報として「総理大臣」を出力し、関連先情報として「オリンピック選手」と出力し、関連内容として「麻生太郎」と出力する。この場合、出力された情報は興味を引く情報となる。なぜならば、関連元情報そのものと関連先情報そのものは既知であるが、この2つに関連があることは未知であるからである。
【0012】
しかしながら、非特許文献2に記載の技術では、共起頻度の低い情報を提示することから、関連元情報自身および関連先情報自身があまり出現しないものであっても出力されてしまう。関連元情報自身および関連先情報自身が未知情報である場合には、出力された情報がユーザにとって全く興味のない情報となってしまうため、ユーザは意外性を感じない。
【0013】
この発明は、上述の課題を解決するためになされたもので、その目的は、ユーザの興味を引く意外性のある情報を出力することが可能な関連情報出力装置、関連情報出力方法および関連情報出力プログラムを提供することである。
【課題を解決するための手段】
【0014】
上記課題を解決するために、この発明のある局面に係わる関連情報出力装置は、関連元情報に関連する情報を出力するための関連情報出力装置であって、上記関連元情報を受けて、上記関連元情報に関連する複数の関連先情報と、上記関連元情報の出現頻度と、関連する各上記関連先情報の出現頻度と、上記関連元情報および上記各関連先情報の関係の出現頻度とを上記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するための関連情報検索部と、取得された各上記出現頻度に基づいて、上記関連元情報の認知度、取得された上記各関連先情報の認知度、および各上記関係の認知度を計算するための認知度計算部と、上記関連元情報の認知度、上記関連先情報の認知度および上記関係の認知度のうち、2つ以上の組み合わせに基づいて上記各関連先情報の中から1または複数の上記関連先情報を選択し、選択した上記関連先情報を少なくとも出力するための高関心情報絞込み部とを備える。
【0015】
上記課題を解決するために、この発明のある局面に係わる関連情報出力方法は、関連元情報に関連する情報を出力するための関連情報出力装置における関連情報出力方法であって、上記関連元情報を受けて、上記関連元情報に関連する複数の関連先情報と、上記関連元情報の出現頻度と、関連する各上記関連先情報の出現頻度と、上記関連元情報および上記各関連先情報の関係の出現頻度とを上記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、取得された各上記出現頻度に基づいて、上記関連元情報の認知度、取得された上記各関連先情報の認知度、および各上記関係の認知度を計算するステップと、上記関連元情報の認知度、上記関連先情報の認知度および上記関係の認知度のうち、2つ以上の組み合わせに基づいて上記各関連先情報の中から1または複数の上記関連先情報を選択し、選択した上記関連先情報を少なくとも出力するステップとを含む。
【0016】
上記課題を解決するために、この発明のある局面に係わる関連情報出力プログラムは、関連元情報に関連する情報を出力するための関連情報出力装置において用いられる関連情報出力プログラムであって、上記関連元情報を受けて、上記関連元情報に関連する複数の関連先情報と、上記関連元情報の出現頻度と、関連する各上記関連先情報の出現頻度と、上記関連元情報および上記各関連先情報の関係の出現頻度とを上記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、取得された各上記出現頻度に基づいて、上記関連元情報の認知度、取得された上記各関連先情報の認知度、および各上記関係の認知度を計算するステップと、上記関連元情報の認知度、上記関連先情報の認知度および上記関係の認知度のうち、2つ以上の組み合わせに基づいて上記各関連先情報の中から1または複数の上記関連先情報を選択し、選択した上記関連先情報を少なくとも出力するステップとをコンピュータに実行させるためのプログラムである。
【発明の効果】
【0017】
本発明によれば、ユーザの興味を引く意外性のある情報を出力することができる。
【図面の簡単な説明】
【0018】
図1】本発明の第1の実施の形態に係る関連情報出力装置の概略構成図である。
図2】本発明の第1の実施の形態に係る関連情報出力装置が提供する制御構造を示すブロック図である。
図3】本発明の第1の実施の形態に係る関連情報出力装置が関連情報出力処理を行なう際の動作手順を示すフローチャートである。
図4】本発明の第1の実施の形態に係る関連情報出力装置における関連情報蓄積部の蓄積情報の一例を示す図である。
図5】高関心情報絞込み部54における意外性判断のルールの一例を示す図である。
図6】本発明の第2の実施の形態に係る関連情報出力装置が提供する制御構造を示すブロック図である。
図7】本発明の第2の実施の形態に係る関連情報出力装置における関連情報蓄積部の蓄積情報の一例を示す図である。
図8】本発明の第2の実施の形態に係る関連情報出力装置が関連情報出力処理を行なう際の動作手順を示すフローチャートである。
図9】高関心情報絞込み部64における意外性判断のルールの一例を示す図である。
図10】本発明の第3の実施の形態に係る位置情報表示装置が提供する制御構造を示すブロック図である。
図11】本発明の第3の実施の形態に係る位置情報表示装置における入力部が提供する入力内容の一例を示す図である。
図12】本発明の第3の実施の形態に係る位置情報表示装置における位置情報蓄積部の蓄積情報の一例を示す図である。
図13】本発明の第3の実施の形態に係る位置情報表示装置の出力内容の一例を示す図である。
【発明を実施するための形態】
【0019】
以下、本発明の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
【0020】
<第1の実施の形態>
[概要]
前述のように、ユーザにとって既知情報であるか未知情報であるかは、ユーザの興味を引く情報であるかどうかに対して非常に重要な要素である。したがって、関連情報が既知情報であるか未知情報であるかを判断する際、関連元情報に関する判断、関連先情報に関する判断、および関連の存在に関する判断の3つの判断を行なうことが重要となる。非特許文献2に記載の技術では、関連の存在に関する判断は行われているが、関連元情報に関する判断、および関連先情報に関する判断が行われてない。
【0021】
ここでは、既知情報であるか未知情報であるかは、一般的に知られているか否かによって代用できると考える。すなわち、既知情報は一般的に良く知られているメジャーな情報であり、未知情報は一般的にあまり知られていないマイナーな情報であると考える。したがって、関連元情報および関連先情報が持つメジャー度合いおよびマイナー度合いと、関連の存在についてのメジャー度合いおよびマイナー度合いとに基づいて、すなわちこれらの組み合わせによって関連先情報を絞り込み、絞り込んだ関連先情報をユーザに提示することで意外性の高い興味を引く情報を提示することができると考えられる。また、以下では、関連の存在を「リンク」または「関係」と呼ぶ。たとえば、関連元情報「オリンピック選手」と関連先情報「総理大臣」にリンクがある、とは、「オリンピック選手」と「総理大臣」に関連が存在することを意味する。
【0022】
前述の非特許文献1および2に記載の技術では、関連元情報、関連先情報、およびリンクのうち、2つ以上の組み合わせのメジャー度合いおよびマイナー度合いを考慮していないため、ユーザの興味を引く意外性のある情報を提示できない、という問題点があった。
【0023】
これに対して、本発明の第1の実施の形態に係る関連情報出力装置は、一つ以上の関連元情報を入力とし、WebおよびWikipedia(登録商標)など指定されたデータベースから関連元情報に関する関連情報を検索する関連情報検索部と、検索された関連元情報のメジャー度すなわち認知度(recognition degree)と関連先情報の認知度とリンクの認知度とを計算する認知度計算部と、これら関連情報の認知度に基づいて意外で面白い情報を絞り込む高関心情報絞込み部とを備える。認知度計算部が、関連元情報、関連先情報、およびリンクの認知度をそれぞれ計算し、高関心情報絞込み部が、これらの認知度のうち2つ以上の組み合わせに基づいてユーザが興味を持つ意外性のある情報に絞り込むことで、課題を解決する。
【0024】
また、本発明の第1の実施の形態に係る関連情報出力装置は、典型的には、汎用的なアーキテクチャを有するコンピュータを基本構造としており、あらかじめインストールされたプログラムを実行することで、後述するような各種機能を提供する。一般的に、このようなプログラムは、フレキシブルディスク(Flexible Disk)およびCD-ROM(Compact Disk Read Only Memory)などの記録媒体に格納されて、あるいはネットワークなどを介して流通する。このような汎用的なコンピュータを利用する場合には、本発明の第1の実施の形態に係る機能を提供するためのアプリケーションに加えて、コンピュータの基本的な機能を提供するためのOS(Operating System)がインストールされていてもよい。この場合には、本発明の第1の実施の形態に係るプログラムは、OSの一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の順序および/またはタイミングで呼出して処理を実行するものであってもよい。すなわち、本発明の第1の実施の形態に係るプログラム自体は、上記のようなモジュールを含んでおらず、OSと協働して処理が実行される場合もある。したがって、本発明の第1の実施の形態に係るプログラムとしては、上記のようなモジュールを含まない形態であってもよい。
【0025】
さらに、本発明の第1の実施の形態に係るプログラムは、OS等の他のプログラムの一部に組み込まれて提供されるものであってもよい。この場合でも、本発明の第1の実施の形態に係るプログラム自体は、上記のような組み込み先の他のプログラムが有するモジュールを含んでおらず、当該他のプログラムと協働して処理が実行される。すなわち、本発明の第1の実施の形態に係るプログラムとしては、このような他のプログラムに組み込まれた形態であってもよい。
【0026】
なお、代替的に、プログラムの実行により提供される機能の一部もしくは全部を専用のハードウェア回路として実装してもよい。
【0027】
[装置構成]
図1は、本発明の第1の実施の形態に係る関連情報出力装置の概略構成図である。図1を参照して、関連情報出力装置201は、携帯情報端末、パーソナルコンピュータおよびサーバ等の情報処理装置であり、演算処理部であるCPU(Central Processing Unit)101と、メインメモリ102およびハードディスク103と、入力インターフェイス104と、表示コントローラ105と、データリーダ/ライタ106と、通信インターフェイス107とを備える。これらの各部は、バス121を介して互いにデータ通信可能に接続される。
【0028】
CPU101は、ハードディスク103に格納されたプログラム(コード)をメインメモリ102に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ102は、典型的には、DRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、ハードディスク103から読み出されたプログラムに加えて、各種の演算処理結果を示すデータなどを保持する。また、ハードディスク103は不揮発性の磁気記憶装置であり、CPU101で実行されるプログラムに加えて、各種設定値などが格納される。このハードディスク103にインストールされるプログラムは、後述するように、記録媒体111に格納された状態で流通する。なお、ハードディスク103に加えて、あるいはハードディスク103に代えて、フラッシュメモリなどの半導体記憶装置を採用してもよい。
【0029】
入力インターフェイス104は、CPU101とキーボード108、マウス109および図示しないタッチパネルなどの入力部との間のデータ伝送を仲介する。すなわち、入力インターフェイス104は、ユーザが入力部を操作することで与えられる操作指令などの外部からの入力を受け付ける。
【0030】
表示コントローラ105は、表示部の典型例であるディスプレイ110と接続され、ディスプレイ110での表示を制御する。すなわち、表示コントローラ105は、CPU101による画像処理の結果などをユーザに対して表示する。ディスプレイ110は、たとえばLCD(Liquid Crystal Display)またはCRT(Cathode Ray Tube)である。
【0031】
データリーダ/ライタ106は、CPU101と記録媒体111の間のデータ伝送を仲介する。すなわち、記録媒体111は、関連情報出力装置201で実行されるプログラムなどが格納された状態で流通し、データリーダ/ライタ106は、この記録媒体111からプログラムを読み出す。また、データリーダ/ライタ106は、CPU101の内部指令に応答して、関連情報出力装置201における処理結果などを記録媒体111へ書き込む。なお、記録媒体111は、たとえば、CF(Compact Flash)およびSD(Secure Digital)などの汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)などの磁気記憶媒体、またはCD-ROM(Compact Disk Read Only Memory)などの光学記憶媒体である。
【0032】
通信インターフェイス107は、CPU101とパーソナルコンピュータおよびサーバ装置などの間のデータ伝送を仲介する。通信インターフェイス107は、典型的には、イーサネット(登録商標)またはUSB(Universal Serial Bus)の通信機能を有する。なお、記録媒体111に格納されたプログラムを関連情報出力装置201にインストールする形態に代えて、通信インターフェイス107を介して配信サーバなどからダウンロードしたプログラムを関連情報出力装置201にインストールしてもよい。
【0033】
また、関連情報出力装置201には、必要に応じてプリンタなどの他の出力装置が接続されてもよい。
【0034】
[制御構造]
次に、関連情報出力装置201における各種機能を提供するための制御構造について説明する。
【0035】
図2は、本発明の第1の実施の形態に係る関連情報出力装置が提供する制御構造を示すブロック図である。
【0036】
図2に示す関連情報出力装置201の各ブロックは、ハードディスク103に格納されたプログラム(コード)などをメインメモリ102に展開して、CPU101に実行させることで提供される。なお、図2に示すモジュールの一部もしくは全部がハードウェアに実装されているファームウェアによって提供される場合もある。あるいは、図2に示す制御構造の一部もしくは全部を専用ハードウェアおよび/または配線回路によって実現してもよい。
【0037】
図2を参照して、関連情報出力装置201は、CPU101と、関連情報蓄積部56とを備える。CPU101は、その制御構造として、入力となる一つ以上の関連元情報を入力する入力部51と、関連情報蓄積部56を参照し、関連元情報に基づいて関連先情報等を検索する関連情報検索部52と、関連元情報、関連先情報およびリンクの認知度を計算する認知度計算部53と、関連元情報、関連先情報およびリンクの認知度のうち2つ以上の組み合わせに基づいてユーザにとって興味のある情報を絞り込む高関心情報絞込み部54と、絞り込まれた関連情報を出力する出力部55とを備える。関連情報蓄積部56は、たとえば図1に示すメインメモリ102またはハードディスク103に相当する。出力部55は、たとえば図1に示すハードディスク103またはディスプレイ110に関連情報を出力する。
【0038】
CPU101は、図2に示す各部の他に、多くのユニットによって構成されるのが一般的であるが、説明を簡単にするために、本発明に関係しないユニットについては図示していない。
【0039】
より詳細には、関連情報蓄積部56は、関連元情報、関連先情報、およびこれらの出現頻度(以下、単に頻度とも称する。)すなわちリンクの数を保持する。たとえば、関連情報蓄積部56において、ハイパーテキスト文書が蓄積されており、あるハイパーテキスト文書とそのハイパーリンク先文書とを、それぞれ関連元情報および関連先情報としてもよい。また、あるハイパーテキスト文書の特徴語とそのハイパーリンク先文書の特徴語とを、それぞれ関連元情報および関連先情報としてもよい。
【0040】
入力部51は、1つ以上の関連元情報を受け取り、関連情報検索部52に渡す。関連情報検索部52は、入力部51から一つ以上の関連元情報を受け取り、関連情報蓄積部56を参照し、受け取った関連元情報と一致する関連元情報を含んだ関連情報を取得して認知度計算部53に渡す。この関連情報は、関連元情報、関連先情報およびこれらの頻度を含む。
【0041】
認知度計算部53は、関連情報検索部52から検索結果である関連情報を受け取り、関連元情報、関連先情報およびリンクの認知度をそれぞれ計算する。ここで、認知度計算部53は、関連情報蓄積部56の全体の頻度に対する関連元情報、関連先情報およびリンクの各々の頻度の割合、または、検索結果全体の頻度に対する関連先情報、関連元情報およびリンクの各々の頻度の割合などを認知度として計算する。
【0042】
高関心情報絞込み部54は、認知度計算部53によって計算された各認知度に基づいて、関連情報の絞込みを行なう。ここで、関連元情報、関連先情報およびリンクのどの認知度も高い場合には、これらの関連情報は誰もが知っているような当たり前の関連情報であると考えられる。逆に、どの認知度も低い場合には、これらの情報はユーザにとって知らないがあまり知りたいと思わない情報と考えられる。また、関連先情報および関連元情報の少なくとも一方の認知度が高く、リンク(関連の存在)の認知度が低い場合には、これらの情報は、ユーザにとって関連先情報および関連元情報の少なくとも一方は知っているがその関係が意外な情報であると考えられる。
【0043】
すなわち、高関心情報絞込み部54は、関連元情報と関連先情報の両方の認知度が高く、リンクの認知度が低い場合には、これらの情報は意外性ありと判断する。さらに、高関心情報絞込み部54は、関連元情報および関連先情報の一方の認知度が高くて他方が低く、かつリンクの認知度が低い場合には、これらの情報は意外性ありと判断し、その他の場合は意外性なしと判断する。さらに、高関心情報絞込み部54は、後述するように、これらのルールに意外性の度合いを含めても良い。
【0044】
出力部55は、高関心情報絞込み部54から関連情報を受け取り、受け取った関連情報を出力する。
【0045】
[動作]
次に、本発明の第1の実施の形態に係る関連情報出力装置の動作について図面を用いて説明する。本発明の第1の実施の形態では、関連情報出力装置201を動作させることによって、本発明の第1の実施の形態に係る関連情報出力方法が実施される。よって、本発明の第1の実施の形態に係る関連情報出力方法の説明は、以下の関連情報出力装置201の動作説明に代える。なお、以下の説明においては、適宜図2を参照する。
【0046】
図3は、本発明の第1の実施の形態に係る関連情報出力装置が関連情報出力処理を行なう際の動作手順を示すフローチャートである。
【0047】
図4は、本発明の第1の実施の形態に係る関連情報出力装置における関連情報蓄積部の蓄積情報の一例を示す図である。
【0048】
図4を参照して、関連情報蓄積部56は、テーブルT1およびT2を有する。テーブルT1には関連情報が蓄積されており、一つのレコードが一つの関連情報を示す。テーブルT1の各関連情報は、関連元情報、関連先情報およびリンク頻度からなる。テーブルT2には関連元情報および関連先情報に該当する実際の情報の出現頻度が蓄積されており、一つのレコードが一つの情報を示す。
【0049】
なお、図4に示す内容は一例であり、関連元情報および関連先情報は各情報のIDであってもよい。あるいは、ハイパーテキスト文書が蓄積されており、ハイパーテキスト文書のうちハイパーリンク元に含まれる特徴的な単語を関連元情報とし、ハイパーリンク先のハイパーテキストに含まれる特徴的な単語を関連先情報とし、各単語の出現頻度を関連元情報および関連先情報の出現頻度としてもよい。また、ハイパーテキスト文書が蓄積されており、これらのハイパーテキスト文書にカテゴリを対応付け、あるカテゴリのハイパーテキスト文書から別のカテゴリのハイパーテキスト文書へのリンクがある場合、このリンクを関連情報とし、カテゴリ内のハイパーテキスト文書数を出現頻度としても良い。すなわち、関連情報蓄積部56は、関連元情報、関連先情報およびこれらの頻度を計算できるデータ、ならびに情報およびその頻度を計算できるデータを蓄積していればよい。
【0050】
図3を参照して、まず、入力部51は、関連元情報を一つ以上受け取る。たとえば「日本武道館」が入力される(ステップS1)。
【0051】
次に、関連情報検索部52は、関連情報を検索する(ステップS2)。より詳細には、関連情報検索部52は、関連情報蓄積部56を参照し、入力部51から渡された関連元情報が存在するレコードを取得して検索結果として返す。関連情報蓄積部56の蓄積内容が図4に示す例の場合、関連情報検索部52は、関連情報(「日本武道館」および「山口百恵」)のリンク数は50、関連情報(「日本武道館」および「自衛隊」)のリンク数は2、関連情報(「日本武道館」および「松永光」)のリンク数は20、情報「日本武道館」の頻度は5000、情報「山口百恵」の頻度は10000、情報「自衛隊」の頻度は200、情報「松永光」の頻度は30、という検索結果を返す(ステップS2)。
【0052】
次に、認知度計算部53は、各関連情報について、関連元情報、関連先情報およびリンクの各々の認知度を計算する(ステップS3)。ここで、認知度は、関連元情報、関連先情報およびリンクの各々の頻度が多いほど高い値となる。たとえば、認知度計算部53は、関連情報全体すなわち関連情報蓄積部56に蓄積されたすべての関連情報の頻度総和に対する相対頻度、関連情報検索部52による検索結果のすべての関連情報の頻度総和に対する相対頻度、関連情報蓄積部56に蓄積されたすべての関連情報の平均出現頻度との相対差、または関連情報全体の推定分布における出現確率を認知度として計算する。あるいは、認知度計算部53は、関連元情報と関連先情報の各々のカテゴリを利用し、カテゴリ内での出現確率を関連元情報と関連先情報の各々の認知度として計算し、カテゴリ間の出現確率をリンクの認知度として計算する(ステップS3)。
【0053】
具体的には、認知度計算部53は、たとえば、以下の各式に従い、平均出現頻度との相対差を関連元情報Aの認知度、関連先情報Bの認知度およびこれらのリンク(A、B)の認知度として計算する。
認知度(関連元情報A)=頻度(関連元情報A)−平均出現頻度(関連元情報)
認知度(関連先情報B)=頻度(関連先情報B)−平均出現頻度(関連先情報)
認知度(リンク(A、B))=頻度(リンク(A、B))−平均出現頻度(リンク)
【0054】
そして、認知度計算部53は、計算された認知度が、あらかじめ設定された所定の閾値以上であれば、当該情報の認知度が高く、メジャーであると判断する。
【0055】
なお、認知度計算部53があらかじめ平均出現頻度を計算しておき、保存しておく構成であってもよい。ここでは、関連元情報と関連先情報の各々の平均出現頻度が150であり、リンクの平均出現頻度が20であるとする。
【0056】
この場合、関連情報(「日本武道館」、「山口百恵」)の認知度は以下のように計算さ
れる。
認知度(日本武道館)=5000-150=4850
認知度(山口百恵)=10000-150=9850
認知度(リンク(日本武道館、山口百恵))=50-20=30
【0057】
また、関連情報(「日本武道館」、「自衛隊」)の認知度は以下のように計算される。
認知度(日本武道館)=5000-150=4850
認知度(自衛隊)=200-150=50
認知度(リンク(日本武道館、自衛隊))=2-20=-18
【0058】
また、関連情報(「日本武道館」、「松永光」)の認知度は以下のように計算される。
認知度(日本武道館)=5000-150=4850
認知度(松永光)=30-150=-120
認知度(リンク(日本武道館、松永光))=20-20=0
【0059】
また、関連情報の分布を用いる場合は、次のように計算される。まず、モデルを二項分布と考える。確率変数がパラメータn,pの二項分布に従うとき、X~B(n,p)と記述する。ちょうどk回の成功を得る確率P(X)は、以下のように表わされる。ただし、^はべき乗をあらわす演算記号である。
P(X)=B(n,p,k)=nCk×p^k×(1-p)^(1-k)
【0060】
関連元情報を確率変数と考え、関連元情報の全頻度をnとし、特定の関連元情報が出現する確率をpとし、特定の関連元情報の頻度をkとする。なお、関連元情報の全頻度nとは、関連情報蓄積部56に蓄積されたすべての関連元情報の頻度の総和である。図4に示す関連情報蓄積部56では、「日本武道館」、「福田屋旅館」、「森の音楽堂」、・・・の頻度である5000,30,500,…の総和が、関連元情報の全頻度となる。
【0061】
ここで、特定の関連元情報Aの出現頻度がnAであったとする。この場合、関連元情報Aが出現頻度nA以下である確率は、上記分布を利用して以下のように計算できる。
Σ_(k=0,nA)P(X)=Σ_(k=0,nA){nCk×p^k×(1-p)^(1-k)}
【0062】
この確率値を関連元情報の認知度とする。この場合、パラメータpは関連元情報が出現する確率であると推定する。すなわち、パラメータpは以下の値となる。
p=関連元情報の平均頻度/関連元情報の全頻度
【0063】
なお、関連先情報の認知度も関連元情報と同様にして求められる。次に、リンクの認知度は以下のように計算される。
【0064】
すなわち、リンクを確率変数と考え、リンクの全頻度をnとし、リンクが出現する確率をpとし、特定のリンク(A、B)の頻度をkABとする。なお、リンクの全頻度nとは、関連情報蓄積部56に蓄積されたすべてのリンクの頻度の総和である。図4に示す関連情報蓄積部56では、(「日本武道館」、「山口百恵」)、(「日本武道館」、「自衛隊」)、(「日本武道館」、「松永光」)、・・・の頻度である50,2,20,…の総和が、リンクの全頻度となる。
【0065】
ここで、特定のリンク(A、B)の出現頻度がnABであったとする。この場合、リンク(A、B)が出現頻度nAB以下である確率は、以下のように計算される。
Σ_(k=0,nAB)P(X)=Σ_(k=0,nAB){nCk×p^k×(1-p)^(1-k)}
【0066】
ただし、リンクの全頻度は、関連元情報の全頻度×関連先情報の全頻度で計算される。
また、パラメータpは以下のように計算される。
p=リンクの出現頻度/リンクの全頻度
【0067】
認知度計算部53は、以上のような計算を行なって得られた認知度が所定の閾値以上であれば、当該情報の認知度が高く、メジャーであると判断する。
【0068】
[カテゴリを用いた認知度の計算]
ここで、一般的に、Webページにおけるリンクは1つである場合が多く、関連元情報と関連先情報との関係(リンク)の頻度は1である場合が多い。このような場合でもリンクの認知度を適切に計算できるように、本発明の第1の実施の形態に係る関連情報出力装置では、カテゴリ情報を用いてリンクの認知度を計算することも可能である。すなわち、リンクをカテゴリ毎で考え、カテゴリ間リンクの認知度を計算する。
【0069】
まず、関連元情報のカテゴリと関連先情報のカテゴリについて前述のような関連元情報の方法と同様にして分布を計算する。
【0070】
次に、リンク(A、B)を形成する関連元情報AのカテゴリCAと関連先情報BのカテゴリCB間の認知度を計算する。関連元情報Aまたは関連元情報Bが複数のカテゴリに属している場合は、複数のカテゴリ間リンクの認知度の平均値、最大値または最小値を求める。
【0071】
すなわち、カテゴリCAとカテゴリCBのカテゴリ間リンクの認知度は、以下のように計算される。
Σ_(k=0,nCAB)P(X)=Σ_(k=0,nCAB){nCk×p^k×(1-p)^(1-k)}
【0072】
ただし、nCABは、カテゴリCAとカテゴリCBの間にリンクが存在する頻度とする。nは、カテゴリCAとカテゴリCBのリンクの全頻度、すなわち(カテゴリCAに属する関連元情報数)×(カテゴリCBに属する関連先情報数)である。また、パラメータpは、以下のように計算される。
p=カテゴリ間にリンクが存在する数/全カテゴリ間のリンクの全頻度
【0073】
次に、高関心情報絞込み部54は、認知度計算部53から認知度を受け取り、高関心情報絞込み部54自身の内部に組み込まれたルールを参照することにより、関連情報に意外性があるか否かを判定する(ステップS4)。
【0074】
図5は、高関心情報絞込み部54における意外性判断のルールの一例を示す図である。
【0075】
図5を参照して、このルールは、関連元情報、関連先情報およびリンクがそれぞれメジャーであるか否かの組み合わせ毎に、意外性があるか否かを示すものである。
【0076】
図5に示す例では、関連元情報、関連先情報およびリンクがすべてメジャーな場合は意外性がないと判断される。なぜならば、既に知っている情報である可能性が高いためである。逆に、関連元情報、関連先情報およびリンクのすべてがマイナーである場合も意外性がないと判断される。なぜならば、全く知らない情報を提示されたとしてもその意味を類推できないからである。
【0077】
すなわち、高関心情報絞込み部54は、関連元情報および関連先情報のいずれかまたは両方がメジャーであり、かつ、リンクがマイナーである場合に、関連元情報および関連先情報の組み合わせすなわち関連情報は意外性があると判定する。
【0078】
図5に示すルールを適用すると、関連情報(「日本武道館」、「山口百恵」)は、関連元情報、関連先情報およびリンクがすべてメジャーであり、誰もが知っている情報であるため、意外性はないと判定される。
【0079】
また、関連情報(「日本武道館」、「自衛隊」)は、関連元情報がメジャーであり、関連先情報もメジャーであり、リンクがマイナーであるため、それぞれの情報は知られているが、関係があることが意外である。したがって、高関心情報絞込み部54は、当該関連情報は意外性が高いと判定し、出力すべき情報として選択する。
【0080】
また、関連情報(「日本武道館」、「松永光」)は、関連元情報がメジャーであり、関連先情報がマイナーであり、リンクがマイナーである。したがって、高関心情報絞込み部54は、当該関連情報の意外性は中程度であると判定し、出力すべき情報として選択する。
【0081】
そして、高関心情報絞込み部54は、関連情報(「日本武道館」、「自衛隊」)の意外性が高であること、関連情報(「日本武道館」、「松本光」)の意外性が中であることを示す情報を出力部55に渡す(ステップS4)。
【0082】
最後に、出力部55は、高関心絞込み部から情報を受け取り、これを出力する(ステップS5)。たとえば、出力部55は、ディスプレイ110において関連情報(「日本武道館」、「自衛隊」)と関連情報(「日本武道館」、「松本光」)を表示する。
【0083】
ところで、非特許文献1および2に記載の技術では、ユーザの興味を引く意外性のある情報を提示できないという問題点があった。
【0084】
これに対して、本発明の第1の実施の形態に係る関連情報出力装置では、関連情報検索部52は、入力部51から関連元情報を受けて、関連元情報に関連する複数の関連先情報と、関連元情報の出現頻度と、関連する各関連先情報の出現頻度と、関連元情報および各関連先情報の関係の出現頻度とを関連情報蓄積部56から取得する。認知度計算部53は、取得された各出現頻度に基づいて、関連元情報の認知度、取得された各関連先情報の認知度、および各関係の認知度を計算する。そして、高関心情報絞込み部54は、関連元情報の認知度、関連先情報の認知度および関係の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択し、出力部55へ出力する。
【0085】
このように、関連元情報、関連先情報およびリンクの認知度を利用することで、複数の関連情報から意外性のある高関心情報への絞り込みを行なうことができるため、ユーザの興味を引く意外性のある情報を提示することが可能となる。
【0086】
また、本発明の第1の実施の形態に係る関連情報出力装置では、高関心情報絞込み部54は、図5に示すように、各関連先情報の中から、関連元情報の認知度および関連先情報の認知度の少なくとも一方が所定の閾値より高い、すなわちメジャーであり、かつ関係の認知度が所定の閾値より低い、すなわちマイナーである関連先情報を意外性のある情報として選択する。
【0087】
このような構成により、複数の関連情報から意外性のある高関心情報を適切に絞り込むことができる。
【0088】
また、本発明の第1の実施の形態に係る関連情報出力装置では、高関心情報絞込み部54は、さらに、図5に示すように、選択した関連先情報の中から、関連元情報の認知度および関連先情報の認知度が所定の閾値より高く、かつ関係の認知度が所定の閾値より低くなる関連先情報を、高程度に意外性の高い関連先情報として選択する。
【0089】
このような構成により、さらに意外性のある高関心情報をユーザに提示することが可能となり、ユーザの満足度をさらに向上させることができる。
【0090】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、関連元情報、取得された各関連先情報および各関係のうちの認知度を計算すべき対象情報について、関連情報蓄積部56に蓄積されたすべての関連元情報の出現頻度の総和、関連情報蓄積部56に蓄積されたすべての関連先情報の出現頻度の総和、および関連情報蓄積部56に蓄積されたすべての関係の出現頻度の総和のうち対象情報に対応する出現頻度総和を取得する。具体的には、認知度計算部53は、関連情報蓄積部56に蓄積されたすべての関連元情報、すべての関連先情報およびすべての関係の出現頻度を関連情報検索部52経由で取得し、取得したこれらの出現頻度から関連元情報の出現頻度総和、関連先情報の出現頻度総和およびリンクの出現頻度総和を計算する。そして、認知度計算部53は、取得した出現頻度総和から出現確率分布を推定し、推定した出現確率分布を用いて、対象情報の出現確率を対象情報の認知度として計算する。
【0091】
このような構成により、認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0092】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、上記のようにして取得した出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と対象情報の出現頻度との差を対象情報の認知度として計算する。
【0093】
このような構成により、認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0094】
また、本発明の第1の実施の形態に係る関連情報出力装置では、関連情報検索部52は、さらに、関連元情報のカテゴリ情報および関連する各関連先情報のカテゴリ情報を関連情報蓄積部56から取得する。そして、認知度計算部53は、認知度を計算すべき関係である対象関係に対応する関連元情報および関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した出現確率分布を用いて、カテゴリ間の関係の出現確率を対象関係の認知度として計算する。
【0095】
このような構成により、カテゴリの観点からリンクの認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0096】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、対象関係に対応する関連元情報および関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各カテゴリについて計算した認知度の平均値、最大値または最小値を対象関係の認知度とする。
【0097】
このような構成により、複数のカテゴリが存在する場合でも、認知度を適切に計算することができる。
【0098】
なお、図5の説明においては、高関心情報絞込み部54は、関連元情報の認知度、関連先情報の認知度および関係の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であるとしたが、これに限定するものではない。高関心情報絞込み部54は、関連元情報の認知度、関連先情報の認知度および関係の認知度のうち、2つ以上の組み合わせに基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であってもよい。この場合、高関心情報絞込み部54は、関連元情報、関連先情報および関係のうちのいずれか2つを選択し、たとえば、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる関連先情報を各関連先情報の中から選択する。
【0099】
たとえば、高関心情報絞込み部54は、関連元情報および関連先情報を選択し、関連元情報がメジャーであり、関連先情報がマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部54は、関連元情報およびリンクを選択し、関連元情報がメジャーであり、リンクがマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部54は、関連先情報およびリンクを選択し、関連先情報がメジャーであり、リンクがマイナーである場合には、この関連情報は意外性があると判定する。
【0100】
また、本発明の第1の実施の形態に係る関連情報出力装置は、関連情報蓄積部56を備える構成であるとしたが、これに限定するものではない。関連情報出力装置201の外部に関連情報蓄積部56が設けられる構成であってもよい。
【0101】
また、本発明の第1の実施の形態に係る関連情報出力装置では、出力部55は、関連情報として関連元情報および関連先情報を出力する構成であるとしたが、これに限定するものではない。出力部55は、少なくとも関連先情報を出力する構成であればよく、また、関連元情報および関連先情報に加えて、他の情報をさらに出力する構成であってもよい。
【0102】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、たとえば、関連情報蓄積部56に蓄積されたすべての関連元情報、すべての関連先情報およびすべての関係の出現頻度を関連情報検索部52経由で取得し、取得したこれらの出現頻度から関連元情報の出現頻度総和、関連先情報の出現頻度総和およびリンクの出現頻度総和を計算する構成であるとしたが、これに限定するものではない。関連情報蓄
積部56が関連元情報の出現頻度総和、関連先情報の出現頻度総和およびリンクの出現頻度総和を保存しており、認知度計算部53が、関連情報検索部52経由で関連情報蓄積部56からこれらの出現頻度総和を取得する構成であってもよい。
【0103】
また、認知度計算部53が関連情報のメジャーまたはマイナーを判定するための閾値は、関連元情報、関連先情報およびリンクで共通であってもよいし、異なる値であってもよい。
【0104】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、カテゴリ情報を用いてリンクの認知度を計算する構成であるとしたが、これに限定するものではない。認知度計算部53は、関連元情報のカテゴリの認知度をさらに計算してもよいし、関連先情報のカテゴリの認知度をさらに計算してもよい。
【0105】
より詳細には、関連情報検索部52は、関連元情報のカテゴリ情報および関連する各関連先情報のカテゴリ情報を関連情報蓄積部56から取得する。そして、認知度計算部53は、関連元情報および取得された各関連先情報のうちの認知度を計算すべき対象情報について、関連情報蓄積部56に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および関連情報蓄積部56に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち対象情報に対応する出現頻度総和を取得する。認知度計算部53は、取得した出現頻度総和から出現確率分布を推定し、推定した出現確率分布を用いて、対象情報のカテゴリの出現確率を対象情報の認知度として計算する。あるいは、認知度計算部53は、取得した出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と対象情報のカテゴリの出現頻度との差を対象情報の認知度として計算する。
【0106】
このような構成により、カテゴリの観点から関連元情報の認知度および関連先情報の認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0107】
なお、この場合、認知度計算部53は、対象情報が複数のカテゴリに属している場合には、各カテゴリについて計算した認知度の平均値、最大値または最小値を対象情報の認知度とする。このような構成により、複数のカテゴリが存在する場合でも、認知度を適切に計算することができる。
【0108】
次に、本発明の他の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
【0109】
<第2の実施の形態>
本実施の形態は、第1の実施の形態に係る関連情報出力装置と比べて意外性判断の基準として関連内容を追加した関連情報出力装置に関する。以下で説明する内容以外は第1の実施の形態に係る関連情報出力装置と同様である。
【0110】
[概要]
本発明の第1の実施の形態に係る関連情報出力装置では、関連元情報、関連先情報、およびリンクに着目したが、これらに加えて、関連内容も重要である。たとえば、地理的な場所とその場所に関連する人物とを考える。関連元情報「森の音楽堂」と関連先情報「小澤征爾」が関連情報として出力されてもあまり意外ではない。なぜならば、この関連元情報はコンサートホールであり、この関連先情報は指揮者であり、したがって、コンサートをやることを推測できるため関連の存在は既知だからである。しかしながら、関連内容が「森の音楽堂は小澤征爾が設計した」であれば、これは意外性が高く興味を引く情報である。なぜならば、関連内容は既知の推測した情報と異なるからである。
【0111】
前述の非特許文献1および2に記載の技術では、関連元情報、関連先情報、リンク、および関連内容の2つ以上の組み合わせのメジャー度合いおよびマイナー度合いを考慮していないため、ユーザの興味を引く意外性のある情報を提示できない、という問題点があった。
【0112】
[制御構造]
図6は、本発明の第2の実施の形態に係る関連情報出力装置が提供する制御構造を示すブロック図である。
【0113】
図6に示す関連情報出力装置202の各ブロックは、ハードディスク103に格納されたプログラム(コード)などをメインメモリ102に展開して、CPU101に実行させることで提供される。なお、図6に示すモジュールの一部もしくは全部がハードウェアに実装されているファームウェアによって提供される場合もある。あるいは、図6に示す制御構造の一部もしくは全部を専用ハードウェアおよび/または配線回路によって実現してもよい。
【0114】
図6を参照して、関連情報出力装置202は、本発明の第1の実施の形態に係る関連情報出力装置と比べて、関連情報蓄積部56の代わりに関連情報蓄積部66を備える。CPU101は、本発明の第1の実施の形態に係る関連情報出力装置と比べて、その制御構造として、認知度計算部53および高関心情報絞込み部54の代わりに認知度計算部63および高関心情報絞込み部64を備える。関連情報蓄積部66は、たとえば図1に示すメインメモリ102またはハードディスク103に相当する。
【0115】
CPU101は、図6に示す各部の他に、多くのユニットによって構成されるのが一般的であるが、説明を簡単にするために、本発明に関係しないユニットについては図示していない。
【0116】
以下では、本発明の第1の実施の形態と異なる点について主に説明する。図7は、本発明の第2の実施の形態に係る関連情報出力装置における関連情報蓄積部の蓄積情報の一例を示す図である。
【0117】
図7を参照して、関連情報蓄積部66は、本発明の第1の実施の形態に係る関連情報出力装置と比べて、テーブルT1の代わりにテーブルT3を有する。テーブルT3には関連情報が蓄積されており、一つのレコードが一つの関連情報を示す。そして、テーブルT3は、関連情報として、関連元情報、関連先情報および頻度だけでなく、関連内容を含んでいる点がテーブルT1と異なる。一レコード目は「日本武道館」と「山口百恵」の関連内容が「コンサート」であることを示している。また、2レコード目は、関連元情報と関連先情報は1レコード目と同じであるが関連内容は「ロケ」であることを示している。
【0118】
認知度計算部63は、関連内容の認知度をさらに計算する点が認知度計算部53と異なる。認知度計算部63は、関連元情報と関連先情報、あるいはこれらのカテゴリにおいて、関連内容が良く出現するか否かで当該関連内容の認知度を計測する。
【0119】
たとえば、関連元情報のカテゴリが「ホール」であり、関連先情報のカテゴリが「芸能人」である場合を考える。この場合、関連内容「コンサート」の頻度は47と高いため、認知度は高い。また、関連内容「設計」の頻度は25と低いため、認知度は低い。
【0120】
あるいは、あらかじめ関連内容として認知度が高いと考えられる関連内容を関連情報出力装置202が保存しておき、認知度判定対象の関連内容がこの関連内容を含む場合には、認知度が高いと判断してもよい。
【0121】
高関心情報絞込み部64は、後述するように、関連内容の認知度もさらに考慮したルールを適用する点が高関心情報絞込み部54と異なる。
【0122】
[動作]
次に、本発明の第2の実施の形態に係る関連情報出力装置の動作について図面を用いて説明する。本発明の第2の実施の形態では、関連情報出力装置202を動作させることによって、本発明の第2の実施の形態に係る関連情報出力方法が実施される。よって、本発明の第2の実施の形態に係る関連情報出力方法の説明は、以下の関連情報出力装置202の動作説明に代える。なお、以下の説明においては、適宜図6を参照する。
【0123】
図8は、本発明の第2の実施の形態に係る関連情報出力装置が関連情報出力処理を行なう際の動作手順を示すフローチャートである。
【0124】
図8を参照して、まず、入力部51は、関連元情報を一つ以上受け取る。たとえば、「日本武道館」が入力される(ステップS11)。
【0125】
次に、関連情報検索部52は、関連情報を検索する。ただし、検索結果が関連内容を含むことが本発明の第1の実施の形態と異なる。すなわち、第2の関連情報蓄積部206の蓄積内容が図7に示す例の場合、関連情報検索部52は、関連情報(「日本武道館」、「山口百恵」、「コンサート」)のリンク頻度は47、関連情報(「日本武道館」、「山口百恵」、「ロケ」)のリンク頻度は3などを検索結果として返す(ステップS12)。
【0126】
次に、認知度計算部63は、各関連情報について、関連元情報、関連先情報、リンクおよび関連内容の各々の認知度を計算する。関連元情報、関連先情報およびリンクの認知度は、本発明の第1の実施の形態と同様に計算する。そして、認知度計算部63は、関連情報全体との相対頻度、関連情報検索部52による検索結果との相対頻度、平均出現頻度との相対差、または関連情報全体の推定分布における出現確率を関連内容の認知度として計算する。あるいは、認知度計算部63は、関連内容の認知度を、あらかじめ設定したキーワードが存在するか否かに基づいて計算する。あるいは、認知度計算部63は、関連元情報と関連先情報のカテゴリを利用し、関連元情報のカテゴリと関連先情報のカテゴリの関連内容の出現確率を関連内容の認知度として計算する(ステップS13)。
【0127】
関連情報出力装置202では、たとえば、以下の各式に従い、関連元情報のカテゴリと関連先情報のカテゴリの関連内容の出現確率によって認知度を求める。
認知度(関連内容AB)=関連元情報AのカテゴリCAと関連先情報BのカテゴリCBの関連内容ABの頻度/関連元情報AのカテゴリCAと関連先情報BのカテゴリCBのリンク頻度
【0128】
そして、認知度計算部63は、計算された認知度が、あらかじめ設定された所定の閾値以上であれば、当該情報の認知度が高く、メジャーであると判断する。
【0129】
たとえば、関連情報(「日本武道館」、「山口百恵」、「ロケ」)における関連内容の認知度は、以下のように計算される。
認知度(ロケ)=カテゴリ「ホール」とカテゴリ「芸能人」の関連内容「ロケ」の頻度/カテゴリ「ホール」とカテゴリ「芸能人」のリンク頻度
【0130】
ここで、関連元情報のカテゴリが「ホール」となり、関連先情報のカテゴリが「芸能人」となる関連情報の中で、関連内容が「ロケ」である頻度が30であり、リンク頻度が500であるとすると、認知度(ロケ)=30/500=0.06となる。
【0131】
また、関連情報(「福田屋旅館」、「山口百恵」、「ロケ」)の場合には、関連内容の認知度は以下のように計算される。
認知度(ロケ)=カテゴリ「宿」とカテゴリ「芸能人」の関連内容「ロケ」の頻度/カテゴリ「宿」とカテゴリ「芸能人」のリンク頻度
【0132】
ここで、関連元情報のカテゴリが「宿」となり、関連先情報のカテゴリが「芸能人」となる関連情報の中で、関連内容が「ロケ」である頻度が80であり、リンク頻度が400であるとすると、認知度(ロケ)=80/400=0.20となる。
【0133】
すなわち、ホールで芸能人がロケをすることに比べ、宿で芸能人がロケをする方がメジャーであることがわかる。
【0134】
次に、高関心情報絞込み部64は、認知度計算部63から認知度を受け取り、高関心情報絞込み部64の内部に組み込まれたルールを参照することにより、関連情報に意外性があるか否かを判定する(ステップS14)。
【0135】
図9は、高関心情報絞込み部64における意外性判断のルールの一例を示す図である。
図9を参照して、このルールは、関連元情報、関連先情報、リンクおよび関連内容がそれぞれメジャーであるか否かの組み合わせ毎に、意外性があるか否かを示すものである。
【0136】
図9に示す例では、関連元情報、関連先情報、リンクおよび関連内容がすべてメジャーな場合は意外性がないと判断される。なぜならば、これらの情報は誰もが知っているような当たり前の関連情報であると考えられ、既に知っている情報である可能性が高いためである。
【0137】
逆に、関連元情報、関連先情報、リンクおよび関連内容のすべてがマイナーである場合も意外性がないと判断される。なぜならば、これらの情報はユーザにとって知らないがあまり知りたいと思わない情報であると考えられ、提示されたとしてもその意味を類推できないからである。また、関連元情報および関連先情報の一方の認知度が高くて他方が低く、リンクおよび関連内容の認知度が低い場合には、これらの情報はユーザにとって関連先情報または関連元情報は知っているがその関連内容が意外な情報であると考えられる。
【0138】
より詳細には、高関心情報絞込み部64は、関連元情報、関連先情報およびリンクの認知度が高く、関連内容の認知度が低い場合には、これらの情報は意外性ありと判断する。また、高関心情報絞込み部64は、関連元情報、関連先情報およびリンクのすべての認知度が低く、関連内容の認知度が高い場合、意外性ありと判断する。また、高関心情報絞込み部64は、関連元情報および関連先情報の一方の認知度が高くて他方が低く、かつ、リンクの認知度が低い場合には、これらの情報は意外性ありと判断する。また、高関心情報絞込み部64は、関連元情報と関連先情報の認知度が高く、リンクおよび関連内容の少なくとも一方の認知度が低い場合には、これらの情報は意外性ありと判断する。そして、高関心情報絞込み部64は、その他の場合には、意外性のない情報であると判断する。
【0139】
さらに、高関心情報絞込み部64は、これらのルールに意外性の度合いを含めても良い。たとえば、高関心情報絞込み部64は、関連元情報と関連先情報の認知度が高く、リンクおよび関連内容の少なくとも一方の認知度が低い場合、これらは高程度に意外性の高い情報であると判断する。また、高関心情報絞込み部64は、関連元情報および関連先情報の一方の認知度が高くて他方が低く、リンクの認知度が低く、かつ関連内容の認知度が高い場合には、これらは中程度に意外性の高い情報であると判断する。このような構成により、意外性の度合いが高い関連情報のみを出力部55に渡すことができる。
【0140】
最後に、出力部55は、高関心情報絞込み部64から情報を受け取り、これを出力する(ステップS15)。
【0141】
以上のように、本発明の第2の実施の形態に係る関連情報出力装置では、関連情報検索部52は、入力部51から関連元情報を受けて、関連元情報に関連する複数の関連先情報と、関連元情報および各関連先情報の関連内容と、関連元情報の出現頻度と、各関連先情報の出現頻度と、関連元情報および各関連先情報の関係の出現頻度と、各関連内容の出現頻度とを関連情報蓄積部66から取得する。認知度計算部63は、取得された各出現頻度に基づいて、関連元情報の認知度、取得された各関連先情報の認知度、各関係の認知度および取得された各関連内容の認知度を計算する。そして、高関心情報絞込み部64は、関連元情報の認知度、関連先情報の認知度、関係の認知度および関連内容の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択し、出力部55へ出力する。
【0142】
このように、関連元情報、関連先情報、リンクおよび関連内容の認知度を利用することで、本発明の第1の実施の形態に係る関連情報出力装置と比べて、より意外性のある高関心情報への絞り込みを行なうことができるため、さらにユーザの興味を引く意外性のある情報を提示することが可能となる。
【0143】
また、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、図9に示すように、各関連先情報の中から、関連元情報の認知度、関連先情報の認知度および関係の認知度が所定の閾値より高く、かつ関連内容の認知度が所定の閾値より低くなる関連先情報を選択する。また、高関心情報絞込み部64は、各関連先情報の中から、関連元情報の認知度、関連先情報の認知度および関係の認知度が所定の閾値より低く、かつ関連内容の認知度が所定の閾値より高くなる関連先情報を選択する。また、高関心情報絞込み部64は、各関連先情報の中から、関連元情報の認知度および関連先情報の認知度が所定の閾値より高く、かつ関係の認知度および関連内容の認知度の少なくとも一方が所定の閾値より低くなる関連先情報を選択する。また、高関心情報絞込み部64は、各関連先情報の中から、関連元情報の認知度および関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ関係の認知度が所定の閾値より低くなる関連先情報を選択する。
【0144】
このような構成により、複数の関連情報から意外性のある高関心情報を適切に絞り込むことができる。
【0145】
また、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、図9に示すように、選択した関連先情報の中から、関連元情報の認知度および関連先情報の認知度が所定の閾値より高く、かつ関係の認知度および関連内容の認知度の少なくとも一方が所定の閾値より低くなる関連先情報を、選択した関連先情報の中で高程度に意外性の高い関連先情報として選択する。また、高関心情報絞込み部64は、選択した関連先情報の中から、関連元情報の認知度および関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、関係の認知度が所定の閾値より低く、かつ関連内容の認知度が所定の閾値より高くなる関連先情報を、選択した関連先情報の中で中程度に意外性の高い関連先情報として選択する。
【0146】
このような構成により、意外性のある高関心情報をユーザに段階的に提示することが可能となり、ユーザの満足度をさらに向上させることができる。
【0147】
また、本発明の第2の実施の形態に係る関連情報出力装置では、関連情報検索部52は、さらに、関連元情報のカテゴリ情報および関連する各関連先情報のカテゴリ情報を関連情報蓄積部66から取得する。そして、認知度計算部63は、認知度を計算すべき関連内容に対応する関連元情報および関連先情報の各々のカテゴリ間の関係について、カテゴリ間の関係の出現頻度の総和および関連内容の出現頻度に基づいて関連内容の出現確率を計算し、計算した出現確率を関連内容の認知度とする。
【0148】
このような構成により、カテゴリの観点からリンクの認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0149】
なお、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、関連元情報の認知度、関連先情報の認知度、関係の認知度および関連内容の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であるとしたが、これに限定するものではない。高関心情報絞込み部64は、関連元情報の認知度、関連先情報の認知度、関係の認知度および関連内容の認知度のうち、2つ以上の組み合わせに基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であってもよい。
【0150】
この場合、本発明の第1の実施の形態における絞り込みルールを本発明の第2の実施の形態に係る関連情報出力装置に適用することが可能である。これ以外では、たとえば、高関心情報絞込み部64は、関連元情報および関連内容を選択し、関連元情報がメジャーであり、関連内容がマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部64は、関連先情報および関連内容を選択し、関連先情報がメジャーであり、関連内容がマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部64は、リンクおよび関連内容を選択し、リンクがメジャーであり、関連内容がマイナーである場合には、この関連情報は意外性があると判定する。
【0151】
また、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、図9に示すルールに従って意外性を判断する構成であるとしたが、これに限定するものではない。高関心情報絞込み部64は、たとえば、関連元情報、関連先情報、リンクがメジャーであり、関連内容がマイナーである場合、および関連元情報、関連先情報、リンクがマイナーであり、関連内容がメジャーである場合にのみ意外性があると判断する構成であってもよい。
【0152】
次に、本発明の他の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
【0153】
<第3の実施の形態>
本実施の形態は、第2の実施の形態に係る関連情報出力装置を適用した位置情報表示装置に関する。以下で説明する内容以外は第1の実施の形態または第2の実施の形態に係る関連情報出力装置と同様である。
【0154】
図10は、本発明の第3の実施の形態に係る位置情報表示装置が提供する制御構造を示すブロック図である。
【0155】
図10に示す位置情報表示装置401の各ブロックは、ハードディスク103に格納されたプログラム(コード)などをメインメモリ102に展開して、CPU101に実行させることで提供される。なお、図10に示すモジュールの一部もしくは全部がハードウェアに実装されているファームウェアによって提供される場合もある。あるいは、図10に示す制御構造の一部もしくは全部を専用ハードウェアおよび/または配線回路によって実現してもよい。
【0156】
図10を参照して、位置情報表示装置401は、CPU101と、位置情報蓄積部305と、関連情報蓄積部306とを備える。CPU101は、その制御構造として、入力部301と、位置情報検索部302と、関連情報絞込み部303と、出力部304とを備える。位置情報蓄積部305および関連情報蓄積部306は、たとえば図1に示すメインメモリ102またはハードディスク103に相当する。
【0157】
CPU101は、図10に示す各部の他に、多くのユニットによって構成されるのが一般的であるが、説明を簡単にするために、本発明に関係しないユニットについては図示していない。
【0158】
位置情報蓄積部305は、駅、ビルおよび寺院などのスポット情報を、その名称と、住所および緯度経度など場所を特定する情報と、分類を示すカテゴリとともに蓄積する。
【0159】
関連情報蓄積部306は、位置情報に関連する関連情報を蓄積する。すなわち、関連情報蓄積部306は、関連元情報を位置情報とし、関連先情報をその位置に関連する事物(以下、関連物とも称する。)の名称とし、関連内容を位置情報および関連物の関連を示すキーワードおよび文とする情報を蓄積する。
【0160】
位置情報検索部302は、位置情報蓄積部305を参照し、位置情報の名称、位置情報の住所、位置情報の緯度経度、および位置情報のカテゴリを条件として、位置情報を検索する。
【0161】
関連情報絞込み部303は、本発明の第2の実施の形態に係る関連情報出力装置における関連情報検索部52、認知度計算部63および高関心情報絞込み部64に相当する。ただし、関連情報絞込み部303は、高関心情報絞込み部64の出力に対して、関連情報のカテゴリおよび関連内容のキーワードによるフィルタリングも行なう。
【0162】
図11は、本発明の第3の実施の形態に係る位置情報表示装置における入力部が提供する入力内容の一例を示す図である。
【0163】
図11を参照して、まず、入力部301は、ユーザからの入力を受け付ける。すなわち、入力部301は、ユーザからの情報として、検索条件を受け取る。
【0164】
より詳細には、入力部301は、位置情報の名称、住所および緯度経度など空間的な絞り込み条件と、位置情報カテゴリという位置に関する条件と、関連物の名称、関連物カテゴリ、および関連内容キーワードといった関連物に関する条件とのうち一つ以上の検索条件を受け付ける。たとえば、図12の例では、入力部301は、緯度経度、位置情報の範囲、住所、関連物のカテゴリ、および関連内容のキーワードを受け取る。また、図11の例では、関連情報の出力時に表示する位置情報リストの上限および関連物情報リストの上限を指定するためのフィールドも存在する。
【0165】
次に、位置情報検索部302は、位置情報蓄積部305を参照し、位置情報を絞り込む。
【0166】
図12は、本発明の第3の実施の形態に係る位置情報表示装置における位置情報蓄積部の蓄積情報の一例を示す図である。
【0167】
図12を参照して、位置情報蓄積部305は、位置情報の名称、位置情報の住所、位置情報の緯度経度、および位置情報のカテゴリを蓄積するデータベースである。
【0168】
位置情報検索部302は、位置情報に関する条件に基づいて位置情報を検索する。たとえば、検索の結果、「日本武道館」と「森の音楽堂」が得られたとする。
【0169】
次に、関連情報絞込み部303は、位置情報の名称と関連物に関する条件を入力として、関連情報蓄積部306を参照し、意外性のある関連情報に絞り込む。たとえば、「日本武道館」を入力として、関連情報(「日本武道館」、「山口百恵」、「ロケ」)、関連情報(「日本武道館」、「自衛隊」、「音楽会」)、および関連情報(「森の音楽堂」、「小澤征爾」、「設計」)を返す。
【0170】
出力部304は、ユーザからの検索条件に適合する結果、すなわち位置情報検索部302および関連情報絞込み部303によって得られた位置情報および関連情報を表示する。出力部304は、たとえば図1に示すハードディスク103またはディスプレイ110に関連情報を出力する。
【0171】
図13は、本発明の第3の実施の形態に係る位置情報表示装置の出力内容の一例を示す図である。
【0172】
図13を参照して、出力部304は、たとえばディスプレイ110の画面の上部(位置情報表示領域)に位置情報リストを出力し、下部(関連物情報表示領域)に関連物リストを出力する。また、当該画面においてユーザが画面上部の位置情報を選択すると、出力部304により、画面下部の関連物リストが、選択された位置情報に関連するもののみに絞り込まれる。また、出力部304は、ユーザが関連物を選択すると、選択された関連物の詳細ページを表示する。
【0173】
その他の構成および動作は第2の実施の形態に係る関連情報出力装置と同様であるため、ここでは詳細な説明を繰り返さない。
【0174】
上記実施の形態の一部または全部は以下の付記のようにも記載されうるが、本発明の範囲は、以下の付記に限定されるものではない。
【0175】
[付記1]
関連元情報に関連する情報を出力するための関連情報出力装置であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するための関連情報検索部と、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するための認知度計算部と、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するための高関心情報絞込み部とを備える、関連情報出力装置。
【0176】
[付記2]
前記高関心情報絞込み部は、前記関連元情報、前記関連先情報および前記関係のうちのいずれか2つを選択し、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる前記関連先情報を前記各関連先情報の中から選択する、付記1に記載の関連情報出力装置。
【0177】
[付記3]
前記高関心情報絞込み部は、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択する、付記1または付記2に記載の関連情報出力装置。
【0178】
[付記4]
前記高関心情報絞込み部は、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、付記2または付記3に記載の関連情報出力装置。
【0179】
[付記5]
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、付記1から付記4のいずれかに記載の関連情報出力装置。
【0180】
[付記6]
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、付記1から付記4のいずれかに記載の関連情報出力装置。
【0181】
[付記7]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記認知度を計算すべき前記関係である対象関係に対応する前記関連元情報および前記関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記カテゴリ間の関係の出現確率を前記対象関係の認知度として計算する、付記1から付記6のいずれかに記載の関連情報出力装置。
【0182】
[付記8]
前記認知度計算部は、前記対象関係に対応する前記関連元情報および前記関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象関係の認知度とする、付記7に記載の関連情報出力装置。
【0183】
[付記9]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報のカテゴリの出現確率を前記対象情報の認知度として計算する、付記1から付記8のいずれかに記載の関連情報出力装置。
【0184】
[付記10]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と前記対象情報のカテゴリの出現頻度との差を前記対象情報の認知度として計算する、付記1から付記8のいずれかに記載の関連情報出力装置。
【0185】
[付記11]
前記認知度計算部は、前記対象情報が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象情報の認知度とする、付記9または付記10に記載の関連情報出力装置。
【0186】
[付記12]
前記関連情報検索部は、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度計算部は、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記高関心情報絞込み部は、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、付記1から付記11のいずれかに記載の関連情報出力装置。
【0187】
[付記13]
前記高関心情報絞込み部は、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる前記関連先情報を選択し、かつ、
前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を選択する、付記12に記載の関連情報出力装置。
【0188】
[付記14]
前記高関心情報絞込み部は、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を選択し、かつ、
前記各関連先情報の中から、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
前記高関心情報絞込み部は、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、付記13に記載の関連情報出力装置。
【0189】
[付記15]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記認知度を計算すべき前記関連内容に対応する前記関連元情報および前記関連先情報の各々のカテゴリ間の関係について、前記カテゴリ間の関係の出現頻度の総和および前記関連内容の出現頻度に基づいて前記関連内容の出現確率を計算し、計算した前記出現確率を前記関連内容の認知度とする、付記12から付記14のいずれかに記載の関連情報出力装置。
【0190】
[付記16]
関連元情報に関連する情報を出力するための関連情報出力装置における関連情報出力方法であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するステップと、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するステップとを含む、関連情報出力方法。
【0191】
[付記17]
前記関連先情報を選択するステップにおいては、前記関連元情報、前記関連先情報および前記関係のうちのいずれか2つを選択し、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる前記関連先情報を前記各関連先情報の中から選択する、付記16に記載の関連情報出力方法。
【0192】
[付記18]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択する、付記16または付記17に記載の関連情報出力方法。
【0193】
[付記19]
前記関連先情報を選択するステップにおいては、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、付記17または付記18に記載の関連情報出力方法。
【0194】
[付記20]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、付記16から付記19のいずれかに記載の関連情報出力方法。
【0195】
[付記21]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、付記16から付記19のいずれかに記載の関連情報出力方法。
【0196】
[付記22]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関係である対象関係に対応する前記関連元情報および前記関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記カテゴリ間の関係の出現確率を前記対象関係の認知度として計算する、付記16から付記21のいずれかに記載の関連情報出力方法。
【0197】
[付記23]
前記認知度を計算するステップにおいては、前記対象関係に対応する前記関連元情報および前記関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象関係の認知度とする、付記22に記載の関連情報出力方法。
【0198】
[付記24]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報のカテゴリの出現確率を前記対象情報の認知度として計算する、付記16から付記23のいずれかに記載の関連情報出力方法。
【0199】
[付記25]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と前記対象情報のカテゴリの出現頻度との差を前記対象情報の認知度として計算する、付記16から付記23のいずれかに記載の関連情報出力方法。
【0200】
[付記26]
前記認知度を計算するステップにおいては、前記対象情報が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象情報の認知度とする、付記24または付記25に記載の関連情報出力方法。
【0201】
[付記27]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記関連先情報を選択するステップにおいては、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、付記16から付記26のいずれかに記載の関連情報出力方法。
【0202】
[付記28]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる前記関連先情報を選択し、かつ、 前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を選択する、付記27に記載の関連情報出力方法。
【0203】
[付記29] 前記関連先情報を選択するステップにおいては、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、
前記各関連先情報の中から、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、付記28に記載の関連情報出力方法。
【0204】
[付記30]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関連内容に対応する前記関連元情報および前記関連先情報の各々のカテゴリ間の関係について、前記カテゴリ間の関係の出現頻度の総和および前記関連内容の出現頻度に基づいて前記関連内容の出現確率を計算し、計算した前記出現確率を前記関連内容の認知度とする、付記27から付記29のいずれかに記載の関連情報出力方法。
【0205】
[付記31]
関連元情報に関連する情報を出力するための関連情報出力装置において用いられる関連情報出力プログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するステップと、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するステップとをコンピュータに実行させるための関連情報出力プログラムを記録した、コンピュータ読み取り可能な記録媒体。
【0206】
[付記32]
前記関連先情報を選択するステップにおいては、前記関連元情報、前記関連先情報および前記関係のうちのいずれか2つを選択し、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる前記関連先情報を前記各関連先情報の中から選択する、付記31に記載のコンピュータ読み取り可能な記録媒体。
【0207】
[付記33]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択する、付記31または付記32に記載のコンピュータ読み取り可能な記録媒体。
【0208】
[付記34]
前記関連先情報を選択するステップにおいては、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、付記32または付記33に記載のコンピュータ読み取り可能な記録媒体。
【0209】
[付記35]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、付記31から付記34のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0210】
[付記36]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、付記31から付記34のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0211】
[付記37]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関係である対象関係に対応する前記関連元情報および前記関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記カテゴリ間の関係の出現確率を前記対象関係の認知度として計算する、付記31から付記36のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0212】
[付記38]
前記認知度を計算するステップにおいては、前記対象関係に対応する前記関連元情報および前記関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象関係の認知度とする、付記37に記載のコンピュータ読み取り可能な記録媒体。
【0213】
[付記39]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報のカテゴリの出現確率を前記対象情報の認知度として計算する、付記31から付記38のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0214】
[付記40]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記
関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情
報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と前記対象情報のカテゴリの出現頻度との差を前記対象情報の認知度として計算する、
付記31から付記38のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0215】
[付記41]
前記認知度を計算するステップにおいては、前記対象情報が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象情報の認知度とする、付記39または付記40に記載のコンピュータ読み取り可能な記録媒体。
【0216】
[付記42]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記関連先情報を選択するステップにおいては、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、付記31から付記41のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0217】
[付記43]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる前記関連先情報を選択し、かつ、 前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を選択する、付記42に記載のコンピュータ読み取り可能な記録媒体。
【0218】
[付記44]
前記関連先情報を選択するステップにおいては、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、
前記各関連先情報の中から、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、付記43に記載のコンピュータ読み取り可能な記録媒体。

【0219】
[付記45]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関連内容に対応する前記関連元情報および前記関連先情報の各々のカテゴリ間の関係について、前記カテゴリ間の関係の出現頻度の総和および前記関連内容の出現頻度に基づいて前記関連内容の出現確率を計算し、計算した前記出現確率を前記関連内容の認知度とする、付記42から付記44のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0220】
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記説明ではなく特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0221】
この出願は、2010年3月12日に出願された日本出願特願2010−055699を基礎とする優先権を主張し、その開示の全てをここに取り込む。
【産業上の利用可能性】
【0222】
本発明は、位置情報の関連物の検索装置、およびテキスト検索におけるキーワード入力補助装置などに利用できるため、産業上の利用可能性を有している。
【符号の説明】
【0223】
51 入力部
52 関連情報検索部
53 認知度計算部
54 高関心情報絞込み部
55 出力部
56 関連情報蓄積部
64 高関心情報絞込み部
66 関連情報蓄積部
101 CPU
102 メインメモリ
103 ハードディスク
104 入力インターフェイス
105 表示コントローラ
106 データリーダ/ライタ
107 通信インターフェイス
108 キーボード
109 マウス
110 ディスプレイ
111 記録媒体
121 バス
201 関連情報出力装置
301 入力部
302 位置情報検索部
303 関連情報絞込み部
304 出力部
305 位置情報蓄積部
306 関連情報蓄積部
401 位置情報表示装置
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13