【文献】
西本 一志 外2名,発想支援システムに関する一考察,全国大会講演論文集 第46 回平成5 年前期(6),日本,社団法人情報処理学会,1993年 3月 1日,p.283-284
【文献】
鳥澤 健太郎 外3名,自動生成された検索ディレクトリ「鳥式」の現状,言語処理学会第14回年次大会発表論文集,日本,言語処理学会,2008年 3月17日,p.729-732
【文献】
石井 恵 外2名,ネット上の会話からの話題即時抽出技術の評価について,情報処理学会研究報告,日本,社団法人情報処理学会,2005年 9月30日,第2005巻第94号,p.33-40
(58)【調査した分野】(Int.Cl.,DB名)
前記高関心情報絞込み部は、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、請求の範囲第1項に記載の関連情報出力装置。
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、請求の範囲第1項または請求の範囲第2項に記載の関連情報出力装置。
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、請求の範囲第1項または請求の範囲第2項に記載の関連情報出力装置。
前記関連情報検索部は、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度計算部は、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記高関心情報絞込み部は、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて、前記各関連先情報の中から、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる、1または複数の前記関連先情報を選択し、更に、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係
の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる、1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、請求の範囲第1項から請求の範囲第7項のいずれかに記載の関連情報出力装置。
前記高関心情報絞込み部は、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を選択し、かつ、
前記各関連先情報の中から、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
前記高関心情報絞込み部は、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、請求の範囲第8項に記載の関連情報出力装置。
【発明を実施するための形態】
【0019】
以下、本発明の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
【0020】
<第1の実施の形態>
[概要]
前述のように、ユーザにとって既知情報であるか未知情報であるかは、ユーザの興味を引く情報であるかどうかに対して非常に重要な要素である。したがって、関連情報が既知情報であるか未知情報であるかを判断する際、関連元情報に関する判断、関連先情報に関する判断、および関連の存在に関する判断の3つの判断を行なうことが重要となる。非特許文献2に記載の技術では、関連の存在に関する判断は行われているが、関連元情報に関する判断、および関連先情報に関する判断が行われてない。
【0021】
ここでは、既知情報であるか未知情報であるかは、一般的に知られているか否かによって代用できると考える。すなわち、既知情報は一般的に良く知られているメジャーな情報であり、未知情報は一般的にあまり知られていないマイナーな情報であると考える。したがって、関連元情報および関連先情報が持つメジャー度合いおよびマイナー度合いと、関連の存在についてのメジャー度合いおよびマイナー度合いとに基づいて、すなわちこれらの組み合わせによって関連先情報を絞り込み、絞り込んだ関連先情報をユーザに提示することで意外性の高い興味を引く情報を提示することができると考えられる。また、以下では、関連の存在を「リンク」または「関係」と呼ぶ。たとえば、関連元情報「オリンピック選手」と関連先情報「総理大臣」にリンクがある、とは、「オリンピック選手」と「総理大臣」に関連が存在することを意味する。
【0022】
前述の非特許文献1および2に記載の技術では、関連元情報、関連先情報、およびリンクのうち、2つ以上の組み合わせのメジャー度合いおよびマイナー度合いを考慮していないため、ユーザの興味を引く意外性のある情報を提示できない、という問題点があった。
【0023】
これに対して、本発明の第1の実施の形態に係る関連情報出力装置は、一つ以上の関連元情報を入力とし、WebおよびWikipedia(登録商標)など指定されたデータベースから関連元情報に関する関連情報を検索する関連情報検索部と、検索された関連元情報のメジャー度すなわち認知度(recognition degree)と関連先情報の認知度とリンクの認知度とを計算する認知度計算部と、これら関連情報の認知度に基づいて意外で面白い情報を絞り込む高関心情報絞込み部とを備える。認知度計算部が、関連元情報、関連先情報、およびリンクの認知度をそれぞれ計算し、高関心情報絞込み部が、これらの認知度のうち2つ以上の組み合わせに基づいてユーザが興味を持つ意外性のある情報に絞り込むことで、課題を解決する。
【0024】
また、本発明の第1の実施の形態に係る関連情報出力装置は、典型的には、汎用的なアーキテクチャを有するコンピュータを基本構造としており、あらかじめインストールされたプログラムを実行することで、後述するような各種機能を提供する。一般的に、このようなプログラムは、フレキシブルディスク(Flexible Disk)およびCD-ROM(Compact Disk Read Only Memory)などの記録媒体に格納されて、あるいはネットワークなどを介して流通する。このような汎用的なコンピュータを利用する場合には、本発明の第1の実施の形態に係る機能を提供するためのアプリケーションに加えて、コンピュータの基本的な機能を提供するためのOS(Operating System)がインストールされていてもよい。この場合には、本発明の第1の実施の形態に係るプログラムは、OSの一部として提供されるプログラムモジュールのうち、必要なモジュールを所定の順序および/またはタイミングで呼出して処理を実行するものであってもよい。すなわち、本発明の第1の実施の形態に係るプログラム自体は、上記のようなモジュールを含んでおらず、OSと協働して処理が実行される場合もある。したがって、本発明の第1の実施の形態に係るプログラムとしては、上記のようなモジュールを含まない形態であってもよい。
【0025】
さらに、本発明の第1の実施の形態に係るプログラムは、OS等の他のプログラムの一部に組み込まれて提供されるものであってもよい。この場合でも、本発明の第1の実施の形態に係るプログラム自体は、上記のような組み込み先の他のプログラムが有するモジュールを含んでおらず、当該他のプログラムと協働して処理が実行される。すなわち、本発明の第1の実施の形態に係るプログラムとしては、このような他のプログラムに組み込まれた形態であってもよい。
【0026】
なお、代替的に、プログラムの実行により提供される機能の一部もしくは全部を専用のハードウェア回路として実装してもよい。
【0027】
[装置構成]
図1は、本発明の第1の実施の形態に係る関連情報出力装置の概略構成図である。
図1を参照して、関連情報出力装置201は、携帯情報端末、パーソナルコンピュータおよびサーバ等の情報処理装置であり、演算処理部であるCPU(Central Processing Unit)101と、メインメモリ102およびハードディスク103と、入力インターフェイス104と、表示コントローラ105と、データリーダ/ライタ106と、通信インターフェイス107とを備える。これらの各部は、バス121を介して互いにデータ通信可能に接続される。
【0028】
CPU101は、ハードディスク103に格納されたプログラム(コード)をメインメモリ102に展開し、これらを所定順序で実行することにより、各種の演算を実施する。メインメモリ102は、典型的には、DRAM(Dynamic Random Access Memory)などの揮発性の記憶装置であり、ハードディスク103から読み出されたプログラムに加えて、各種の演算処理結果を示すデータなどを保持する。また、ハードディスク103は不揮発性の磁気記憶装置であり、CPU101で実行されるプログラムに加えて、各種設定値などが格納される。このハードディスク103にインストールされるプログラムは、後述するように、記録媒体111に格納された状態で流通する。なお、ハードディスク103に加えて、あるいはハードディスク103に代えて、フラッシュメモリなどの半導体記憶装置を採用してもよい。
【0029】
入力インターフェイス104は、CPU101とキーボード108、マウス109および図示しないタッチパネルなどの入力部との間のデータ伝送を仲介する。すなわち、入力インターフェイス104は、ユーザが入力部を操作することで与えられる操作指令などの外部からの入力を受け付ける。
【0030】
表示コントローラ105は、表示部の典型例であるディスプレイ110と接続され、ディスプレイ110での表示を制御する。すなわち、表示コントローラ105は、CPU101による画像処理の結果などをユーザに対して表示する。ディスプレイ110は、たとえばLCD(Liquid Crystal Display)またはCRT(Cathode Ray Tube)である。
【0031】
データリーダ/ライタ106は、CPU101と記録媒体111の間のデータ伝送を仲介する。すなわち、記録媒体111は、関連情報出力装置201で実行されるプログラムなどが格納された状態で流通し、データリーダ/ライタ106は、この記録媒体111からプログラムを読み出す。また、データリーダ/ライタ106は、CPU101の内部指令に応答して、関連情報出力装置201における処理結果などを記録媒体111へ書き込む。なお、記録媒体111は、たとえば、CF(Compact Flash)およびSD(Secure Digital)などの汎用的な半導体記憶デバイス、フレキシブルディスク(Flexible Disk)などの磁気記憶媒体、またはCD-ROM(Compact Disk Read Only Memory)などの光学記憶媒体である。
【0032】
通信インターフェイス107は、CPU101とパーソナルコンピュータおよびサーバ装置などの間のデータ伝送を仲介する。通信インターフェイス107は、典型的には、イーサネット(登録商標)またはUSB(Universal Serial Bus)の通信機能を有する。なお、記録媒体111に格納されたプログラムを関連情報出力装置201にインストールする形態に代えて、通信インターフェイス107を介して配信サーバなどからダウンロードしたプログラムを関連情報出力装置201にインストールしてもよい。
【0033】
また、関連情報出力装置201には、必要に応じてプリンタなどの他の出力装置が接続されてもよい。
【0034】
[制御構造]
次に、関連情報出力装置201における各種機能を提供するための制御構造について説明する。
【0035】
図2は、本発明の第1の実施の形態に係る関連情報出力装置が提供する制御構造を示すブロック図である。
【0036】
図2に示す関連情報出力装置201の各ブロックは、ハードディスク103に格納されたプログラム(コード)などをメインメモリ102に展開して、CPU101に実行させることで提供される。なお、
図2に示すモジュールの一部もしくは全部がハードウェアに実装されているファームウェアによって提供される場合もある。あるいは、
図2に示す制御構造の一部もしくは全部を専用ハードウェアおよび/または配線回路によって実現してもよい。
【0037】
図2を参照して、関連情報出力装置201は、CPU101と、関連情報蓄積部56とを備える。CPU101は、その制御構造として、入力となる一つ以上の関連元情報を入力する入力部51と、関連情報蓄積部56を参照し、関連元情報に基づいて関連先情報等を検索する関連情報検索部52と、関連元情報、関連先情報およびリンクの認知度を計算する認知度計算部53と、関連元情報、関連先情報およびリンクの認知度のうち2つ以上の組み合わせに基づいてユーザにとって興味のある情報を絞り込む高関心情報絞込み部54と、絞り込まれた関連情報を出力する出力部55とを備える。関連情報蓄積部56は、たとえば
図1に示すメインメモリ102またはハードディスク103に相当する。出力部55は、たとえば
図1に示すハードディスク103またはディスプレイ110に関連情報を出力する。
【0038】
CPU101は、
図2に示す各部の他に、多くのユニットによって構成されるのが一般的であるが、説明を簡単にするために、本発明に関係しないユニットについては図示していない。
【0039】
より詳細には、関連情報蓄積部56は、関連元情報、関連先情報、およびこれらの出現頻度(以下、単に頻度とも称する。)すなわちリンクの数を保持する。たとえば、関連情報蓄積部56において、ハイパーテキスト文書が蓄積されており、あるハイパーテキスト文書とそのハイパーリンク先文書とを、それぞれ関連元情報および関連先情報としてもよい。また、あるハイパーテキスト文書の特徴語とそのハイパーリンク先文書の特徴語とを、それぞれ関連元情報および関連先情報としてもよい。
【0040】
入力部51は、1つ以上の関連元情報を受け取り、関連情報検索部52に渡す。関連情報検索部52は、入力部51から一つ以上の関連元情報を受け取り、関連情報蓄積部56を参照し、受け取った関連元情報と一致する関連元情報を含んだ関連情報を取得して認知度計算部53に渡す。この関連情報は、関連元情報、関連先情報およびこれらの頻度を含む。
【0041】
認知度計算部53は、関連情報検索部52から検索結果である関連情報を受け取り、関連元情報、関連先情報およびリンクの認知度をそれぞれ計算する。ここで、認知度計算部53は、関連情報蓄積部56の全体の頻度に対する関連元情報、関連先情報およびリンクの各々の頻度の割合、または、検索結果全体の頻度に対する関連先情報、関連元情報およびリンクの各々の頻度の割合などを認知度として計算する。
【0042】
高関心情報絞込み部54は、認知度計算部53によって計算された各認知度に基づいて、関連情報の絞込みを行なう。ここで、関連元情報、関連先情報およびリンクのどの認知度も高い場合には、これらの関連情報は誰もが知っているような当たり前の関連情報であると考えられる。逆に、どの認知度も低い場合には、これらの情報はユーザにとって知らないがあまり知りたいと思わない情報と考えられる。また、関連先情報および関連元情報の少なくとも一方の認知度が高く、リンク(関連の存在)の認知度が低い場合には、これらの情報は、ユーザにとって関連先情報および関連元情報の少なくとも一方は知っているがその関係が意外な情報であると考えられる。
【0043】
すなわち、高関心情報絞込み部54は、関連元情報と関連先情報の両方の認知度が高く、リンクの認知度が低い場合には、これらの情報は意外性ありと判断する。さらに、高関心情報絞込み部54は、関連元情報および関連先情報の一方の認知度が高くて他方が低く、かつリンクの認知度が低い場合には、これらの情報は意外性ありと判断し、その他の場合は意外性なしと判断する。さらに、高関心情報絞込み部54は、後述するように、これらのルールに意外性の度合いを含めても良い。
【0044】
出力部55は、高関心情報絞込み部54から関連情報を受け取り、受け取った関連情報を出力する。
【0045】
[動作]
次に、本発明の第1の実施の形態に係る関連情報出力装置の動作について図面を用いて説明する。本発明の第1の実施の形態では、関連情報出力装置201を動作させることによって、本発明の第1の実施の形態に係る関連情報出力方法が実施される。よって、本発明の第1の実施の形態に係る関連情報出力方法の説明は、以下の関連情報出力装置201の動作説明に代える。なお、以下の説明においては、適宜
図2を参照する。
【0046】
図3は、本発明の第1の実施の形態に係る関連情報出力装置が関連情報出力処理を行なう際の動作手順を示すフローチャートである。
【0047】
図4は、本発明の第1の実施の形態に係る関連情報出力装置における関連情報蓄積部の蓄積情報の一例を示す図である。
【0048】
図4を参照して、関連情報蓄積部56は、テーブルT1およびT2を有する。テーブルT1には関連情報が蓄積されており、一つのレコードが一つの関連情報を示す。テーブルT1の各関連情報は、関連元情報、関連先情報およびリンク頻度からなる。テーブルT2には関連元情報および関連先情報に該当する実際の情報の出現頻度が蓄積されており、一つのレコードが一つの情報を示す。
【0049】
なお、
図4に示す内容は一例であり、関連元情報および関連先情報は各情報のIDであってもよい。あるいは、ハイパーテキスト文書が蓄積されており、ハイパーテキスト文書のうちハイパーリンク元に含まれる特徴的な単語を関連元情報とし、ハイパーリンク先のハイパーテキストに含まれる特徴的な単語を関連先情報とし、各単語の出現頻度を関連元情報および関連先情報の出現頻度としてもよい。また、ハイパーテキスト文書が蓄積されており、これらのハイパーテキスト文書にカテゴリを対応付け、あるカテゴリのハイパーテキスト文書から別のカテゴリのハイパーテキスト文書へのリンクがある場合、このリンクを関連情報とし、カテゴリ内のハイパーテキスト文書数を出現頻度としても良い。すなわち、関連情報蓄積部56は、関連元情報、関連先情報およびこれらの頻度を計算できるデータ、ならびに情報およびその頻度を計算できるデータを蓄積していればよい。
【0050】
図3を参照して、まず、入力部51は、関連元情報を一つ以上受け取る。たとえば「日本武道館」が入力される(ステップS1)。
【0051】
次に、関連情報検索部52は、関連情報を検索する(ステップS2)。より詳細には、関連情報検索部52は、関連情報蓄積部56を参照し、入力部51から渡された関連元情報が存在するレコードを取得して検索結果として返す。関連情報蓄積部56の蓄積内容が
図4に示す例の場合、関連情報検索部52は、関連情報(「日本武道館」および「山口百恵」)のリンク数は50、関連情報(「日本武道館」および「自衛隊」)のリンク数は2、関連情報(「日本武道館」および「松永光」)のリンク数は20、情報「日本武道館」の頻度は5000、情報「山口百恵」の頻度は10000、情報「自衛隊」の頻度は200、情報「松永光」の頻度は30、という検索結果を返す(ステップS2)。
【0052】
次に、認知度計算部53は、各関連情報について、関連元情報、関連先情報およびリンクの各々の認知度を計算する(ステップS3)。ここで、認知度は、関連元情報、関連先情報およびリンクの各々の頻度が多いほど高い値となる。たとえば、認知度計算部53は、関連情報全体すなわち関連情報蓄積部56に蓄積されたすべての関連情報の頻度総和に対する相対頻度、関連情報検索部52による検索結果のすべての関連情報の頻度総和に対する相対頻度、関連情報蓄積部56に蓄積されたすべての関連情報の平均出現頻度との相対差、または関連情報全体の推定分布における出現確率を認知度として計算する。あるいは、認知度計算部53は、関連元情報と関連先情報の各々のカテゴリを利用し、カテゴリ内での出現確率を関連元情報と関連先情報の各々の認知度として計算し、カテゴリ間の出現確率をリンクの認知度として計算する(ステップS3)。
【0053】
具体的には、認知度計算部53は、たとえば、以下の各式に従い、平均出現頻度との相対差を関連元情報Aの認知度、関連先情報Bの認知度およびこれらのリンク(A、B)の認知度として計算する。
認知度(関連元情報A)=頻度(関連元情報A)−平均出現頻度(関連元情報)
認知度(関連先情報B)=頻度(関連先情報B)−平均出現頻度(関連先情報)
認知度(リンク(A、B))=頻度(リンク(A、B))−平均出現頻度(リンク)
【0054】
そして、認知度計算部53は、計算された認知度が、あらかじめ設定された所定の閾値以上であれば、当該情報の認知度が高く、メジャーであると判断する。
【0055】
なお、認知度計算部53があらかじめ平均出現頻度を計算しておき、保存しておく構成であってもよい。ここでは、関連元情報と関連先情報の各々の平均出現頻度が150であり、リンクの平均出現頻度が20であるとする。
【0056】
この場合、関連情報(「日本武道館」、「山口百恵」)の認知度は以下のように計算さ
れる。
認知度(日本武道館)=5000-150=4850
認知度(山口百恵)=10000-150=9850
認知度(リンク(日本武道館、山口百恵))=50-20=30
【0057】
また、関連情報(「日本武道館」、「自衛隊」)の認知度は以下のように計算される。
認知度(日本武道館)=5000-150=4850
認知度(自衛隊)=200-150=50
認知度(リンク(日本武道館、自衛隊))=2-20=-18
【0058】
また、関連情報(「日本武道館」、「松永光」)の認知度は以下のように計算される。
認知度(日本武道館)=5000-150=4850
認知度(松永光)=30-150=-120
認知度(リンク(日本武道館、松永光))=20-20=0
【0059】
また、関連情報の分布を用いる場合は、次のように計算される。まず、モデルを二項分布と考える。確率変数がパラメータn,pの二項分布に従うとき、X~B(n,p)と記述する。ちょうどk回の成功を得る確率P(X)は、以下のように表わされる。ただし、^はべき乗をあらわす演算記号である。
P(X)=B(n,p,k)=nCk×p^k×(1-p)^(1-k)
【0060】
関連元情報を確率変数と考え、関連元情報の全頻度をnとし、特定の関連元情報が出現する確率をpとし、特定の関連元情報の頻度をkとする。なお、関連元情報の全頻度nとは、関連情報蓄積部56に蓄積されたすべての関連元情報の頻度の総和である。
図4に示す関連情報蓄積部56では、「日本武道館」、「福田屋旅館」、「森の音楽堂」、・・・の頻度である5000,30,500,…の総和が、関連元情報の全頻度となる。
【0061】
ここで、特定の関連元情報Aの出現頻度がnAであったとする。この場合、関連元情報Aが出現頻度nA以下である確率は、上記分布を利用して以下のように計算できる。
Σ_(k=0,nA)P(X)=Σ_(k=0,nA){nCk×p^k×(1-p)^(1-k)}
【0062】
この確率値を関連元情報の認知度とする。この場合、パラメータpは関連元情報が出現する確率であると推定する。すなわち、パラメータpは以下の値となる。
p=関連元情報の平均頻度/関連元情報の全頻度
【0063】
なお、関連先情報の認知度も関連元情報と同様にして求められる。次に、リンクの認知度は以下のように計算される。
【0064】
すなわち、リンクを確率変数と考え、リンクの全頻度をnとし、リンクが出現する確率をpとし、特定のリンク(A、B)の頻度をkABとする。なお、リンクの全頻度nとは、関連情報蓄積部56に蓄積されたすべてのリンクの頻度の総和である。
図4に示す関連情報蓄積部56では、(「日本武道館」、「山口百恵」)、(「日本武道館」、「自衛隊」)、(「日本武道館」、「松永光」)、・・・の頻度である50,2,20,…の総和が、リンクの全頻度となる。
【0065】
ここで、特定のリンク(A、B)の出現頻度がnABであったとする。この場合、リンク(A、B)が出現頻度nAB以下である確率は、以下のように計算される。
Σ_(k=0,nAB)P(X)=Σ_(k=0,nAB){nCk×p^k×(1-p)^(1-k)}
【0066】
ただし、リンクの全頻度は、関連元情報の全頻度×関連先情報の全頻度で計算される。
また、パラメータpは以下のように計算される。
p=リンクの出現頻度/リンクの全頻度
【0067】
認知度計算部53は、以上のような計算を行なって得られた認知度が所定の閾値以上であれば、当該情報の認知度が高く、メジャーであると判断する。
【0068】
[カテゴリを用いた認知度の計算]
ここで、一般的に、Webページにおけるリンクは1つである場合が多く、関連元情報と関連先情報との関係(リンク)の頻度は1である場合が多い。このような場合でもリンクの認知度を適切に計算できるように、本発明の第1の実施の形態に係る関連情報出力装置では、カテゴリ情報を用いてリンクの認知度を計算することも可能である。すなわち、リンクをカテゴリ毎で考え、カテゴリ間リンクの認知度を計算する。
【0069】
まず、関連元情報のカテゴリと関連先情報のカテゴリについて前述のような関連元情報の方法と同様にして分布を計算する。
【0070】
次に、リンク(A、B)を形成する関連元情報AのカテゴリCAと関連先情報BのカテゴリCB間の認知度を計算する。関連元情報Aまたは関連元情報Bが複数のカテゴリに属している場合は、複数のカテゴリ間リンクの認知度の平均値、最大値または最小値を求める。
【0071】
すなわち、カテゴリCAとカテゴリCBのカテゴリ間リンクの認知度は、以下のように計算される。
Σ_(k=0,nCAB)P(X)=Σ_(k=0,nCAB){nCk×p^k×(1-p)^(1-k)}
【0072】
ただし、nCABは、カテゴリCAとカテゴリCBの間にリンクが存在する頻度とする。nは、カテゴリCAとカテゴリCBのリンクの全頻度、すなわち(カテゴリCAに属する関連元情報数)×(カテゴリCBに属する関連先情報数)である。また、パラメータpは、以下のように計算される。
p=カテゴリ間にリンクが存在する数/全カテゴリ間のリンクの全頻度
【0073】
次に、高関心情報絞込み部54は、認知度計算部53から認知度を受け取り、高関心情報絞込み部54自身の内部に組み込まれたルールを参照することにより、関連情報に意外性があるか否かを判定する(ステップS4)。
【0074】
図5は、高関心情報絞込み部54における意外性判断のルールの一例を示す図である。
【0075】
図5を参照して、このルールは、関連元情報、関連先情報およびリンクがそれぞれメジャーであるか否かの組み合わせ毎に、意外性があるか否かを示すものである。
【0076】
図5に示す例では、関連元情報、関連先情報およびリンクがすべてメジャーな場合は意外性がないと判断される。なぜならば、既に知っている情報である可能性が高いためである。逆に、関連元情報、関連先情報およびリンクのすべてがマイナーである場合も意外性がないと判断される。なぜならば、全く知らない情報を提示されたとしてもその意味を類推できないからである。
【0077】
すなわち、高関心情報絞込み部54は、関連元情報および関連先情報のいずれかまたは両方がメジャーであり、かつ、リンクがマイナーである場合に、関連元情報および関連先情報の組み合わせすなわち関連情報は意外性があると判定する。
【0078】
図5に示すルールを適用すると、関連情報(「日本武道館」、「山口百恵」)は、関連元情報、関連先情報およびリンクがすべてメジャーであり、誰もが知っている情報であるため、意外性はないと判定される。
【0079】
また、関連情報(「日本武道館」、「自衛隊」)は、関連元情報がメジャーであり、関連先情報もメジャーであり、リンクがマイナーであるため、それぞれの情報は知られているが、関係があることが意外である。したがって、高関心情報絞込み部54は、当該関連情報は意外性が高いと判定し、出力すべき情報として選択する。
【0080】
また、関連情報(「日本武道館」、「松永光」)は、関連元情報がメジャーであり、関連先情報がマイナーであり、リンクがマイナーである。したがって、高関心情報絞込み部54は、当該関連情報の意外性は中程度であると判定し、出力すべき情報として選択する。
【0081】
そして、高関心情報絞込み部54は、関連情報(「日本武道館」、「自衛隊」)の意外性が高であること、関連情報(「日本武道館」、「松本光」)の意外性が中であることを示す情報を出力部55に渡す(ステップS4)。
【0082】
最後に、出力部55は、高関心絞込み部から情報を受け取り、これを出力する(ステップS5)。たとえば、出力部55は、ディスプレイ110において関連情報(「日本武道館」、「自衛隊」)と関連情報(「日本武道館」、「松本光」)を表示する。
【0083】
ところで、非特許文献1および2に記載の技術では、ユーザの興味を引く意外性のある情報を提示できないという問題点があった。
【0084】
これに対して、本発明の第1の実施の形態に係る関連情報出力装置では、関連情報検索部52は、入力部51から関連元情報を受けて、関連元情報に関連する複数の関連先情報と、関連元情報の出現頻度と、関連する各関連先情報の出現頻度と、関連元情報および各関連先情報の関係の出現頻度とを関連情報蓄積部56から取得する。認知度計算部53は、取得された各出現頻度に基づいて、関連元情報の認知度、取得された各関連先情報の認知度、および各関係の認知度を計算する。そして、高関心情報絞込み部54は、関連元情報の認知度、関連先情報の認知度および関係の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択し、出力部55へ出力する。
【0085】
このように、関連元情報、関連先情報およびリンクの認知度を利用することで、複数の関連情報から意外性のある高関心情報への絞り込みを行なうことができるため、ユーザの興味を引く意外性のある情報を提示することが可能となる。
【0086】
また、本発明の第1の実施の形態に係る関連情報出力装置では、高関心情報絞込み部54は、
図5に示すように、各関連先情報の中から、関連元情報の認知度および関連先情報の認知度の少なくとも一方が所定の閾値より高い、すなわちメジャーであり、かつ関係の認知度が所定の閾値より低い、すなわちマイナーである関連先情報を意外性のある情報として選択する。
【0087】
このような構成により、複数の関連情報から意外性のある高関心情報を適切に絞り込むことができる。
【0088】
また、本発明の第1の実施の形態に係る関連情報出力装置では、高関心情報絞込み部54は、さらに、
図5に示すように、選択した関連先情報の中から、関連元情報の認知度および関連先情報の認知度が所定の閾値より高く、かつ関係の認知度が所定の閾値より低くなる関連先情報を、高程度に意外性の高い関連先情報として選択する。
【0089】
このような構成により、さらに意外性のある高関心情報をユーザに提示することが可能となり、ユーザの満足度をさらに向上させることができる。
【0090】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、関連元情報、取得された各関連先情報および各関係のうちの認知度を計算すべき対象情報について、関連情報蓄積部56に蓄積されたすべての関連元情報の出現頻度の総和、関連情報蓄積部56に蓄積されたすべての関連先情報の出現頻度の総和、および関連情報蓄積部56に蓄積されたすべての関係の出現頻度の総和のうち対象情報に対応する出現頻度総和を取得する。具体的には、認知度計算部53は、関連情報蓄積部56に蓄積されたすべての関連元情報、すべての関連先情報およびすべての関係の出現頻度を関連情報検索部52経由で取得し、取得したこれらの出現頻度から関連元情報の出現頻度総和、関連先情報の出現頻度総和およびリンクの出現頻度総和を計算する。そして、認知度計算部53は、取得した出現頻度総和から出現確率分布を推定し、推定した出現確率分布を用いて、対象情報の出現確率を対象情報の認知度として計算する。
【0091】
このような構成により、認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0092】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、上記のようにして取得した出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と対象情報の出現頻度との差を対象情報の認知度として計算する。
【0093】
このような構成により、認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0094】
また、本発明の第1の実施の形態に係る関連情報出力装置では、関連情報検索部52は、さらに、関連元情報のカテゴリ情報および関連する各関連先情報のカテゴリ情報を関連情報蓄積部56から取得する。そして、認知度計算部53は、認知度を計算すべき関係である対象関係に対応する関連元情報および関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した出現確率分布を用いて、カテゴリ間の関係の出現確率を対象関係の認知度として計算する。
【0095】
このような構成により、カテゴリの観点からリンクの認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0096】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、対象関係に対応する関連元情報および関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各カテゴリについて計算した認知度の平均値、最大値または最小値を対象関係の認知度とする。
【0097】
このような構成により、複数のカテゴリが存在する場合でも、認知度を適切に計算することができる。
【0098】
なお、
図5の説明においては、高関心情報絞込み部54は、関連元情報の認知度、関連先情報の認知度および関係の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であるとしたが、これに限定するものではない。高関心情報絞込み部54は、関連元情報の認知度、関連先情報の認知度および関係の認知度のうち、2つ以上の組み合わせに基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であってもよい。この場合、高関心情報絞込み部54は、関連元情報、関連先情報および関係のうちのいずれか2つを選択し、たとえば、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる関連先情報を各関連先情報の中から選択する。
【0099】
たとえば、高関心情報絞込み部54は、関連元情報および関連先情報を選択し、関連元情報がメジャーであり、関連先情報がマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部54は、関連元情報およびリンクを選択し、関連元情報がメジャーであり、リンクがマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部54は、関連先情報およびリンクを選択し、関連先情報がメジャーであり、リンクがマイナーである場合には、この関連情報は意外性があると判定する。
【0100】
また、本発明の第1の実施の形態に係る関連情報出力装置は、関連情報蓄積部56を備える構成であるとしたが、これに限定するものではない。関連情報出力装置201の外部に関連情報蓄積部56が設けられる構成であってもよい。
【0101】
また、本発明の第1の実施の形態に係る関連情報出力装置では、出力部55は、関連情報として関連元情報および関連先情報を出力する構成であるとしたが、これに限定するものではない。出力部55は、少なくとも関連先情報を出力する構成であればよく、また、関連元情報および関連先情報に加えて、他の情報をさらに出力する構成であってもよい。
【0102】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、たとえば、関連情報蓄積部56に蓄積されたすべての関連元情報、すべての関連先情報およびすべての関係の出現頻度を関連情報検索部52経由で取得し、取得したこれらの出現頻度から関連元情報の出現頻度総和、関連先情報の出現頻度総和およびリンクの出現頻度総和を計算する構成であるとしたが、これに限定するものではない。関連情報蓄
積部56が関連元情報の出現頻度総和、関連先情報の出現頻度総和およびリンクの出現頻度総和を保存しており、認知度計算部53が、関連情報検索部52経由で関連情報蓄積部56からこれらの出現頻度総和を取得する構成であってもよい。
【0103】
また、認知度計算部53が関連情報のメジャーまたはマイナーを判定するための閾値は、関連元情報、関連先情報およびリンクで共通であってもよいし、異なる値であってもよい。
【0104】
また、本発明の第1の実施の形態に係る関連情報出力装置では、認知度計算部53は、カテゴリ情報を用いてリンクの認知度を計算する構成であるとしたが、これに限定するものではない。認知度計算部53は、関連元情報のカテゴリの認知度をさらに計算してもよいし、関連先情報のカテゴリの認知度をさらに計算してもよい。
【0105】
より詳細には、関連情報検索部52は、関連元情報のカテゴリ情報および関連する各関連先情報のカテゴリ情報を関連情報蓄積部56から取得する。そして、認知度計算部53は、関連元情報および取得された各関連先情報のうちの認知度を計算すべき対象情報について、関連情報蓄積部56に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および関連情報蓄積部56に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち対象情報に対応する出現頻度総和を取得する。認知度計算部53は、取得した出現頻度総和から出現確率分布を推定し、推定した出現確率分布を用いて、対象情報のカテゴリの出現確率を対象情報の認知度として計算する。あるいは、認知度計算部53は、取得した出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と対象情報のカテゴリの出現頻度との差を対象情報の認知度として計算する。
【0106】
このような構成により、カテゴリの観点から関連元情報の認知度および関連先情報の認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0107】
なお、この場合、認知度計算部53は、対象情報が複数のカテゴリに属している場合には、各カテゴリについて計算した認知度の平均値、最大値または最小値を対象情報の認知度とする。このような構成により、複数のカテゴリが存在する場合でも、認知度を適切に計算することができる。
【0108】
次に、本発明の他の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
【0109】
<第2の実施の形態>
本実施の形態は、第1の実施の形態に係る関連情報出力装置と比べて意外性判断の基準として関連内容を追加した関連情報出力装置に関する。以下で説明する内容以外は第1の実施の形態に係る関連情報出力装置と同様である。
【0110】
[概要]
本発明の第1の実施の形態に係る関連情報出力装置では、関連元情報、関連先情報、およびリンクに着目したが、これらに加えて、関連内容も重要である。たとえば、地理的な場所とその場所に関連する人物とを考える。関連元情報「森の音楽堂」と関連先情報「小澤征爾」が関連情報として出力されてもあまり意外ではない。なぜならば、この関連元情報はコンサートホールであり、この関連先情報は指揮者であり、したがって、コンサートをやることを推測できるため関連の存在は既知だからである。しかしながら、関連内容が「森の音楽堂は小澤征爾が設計した」であれば、これは意外性が高く興味を引く情報である。なぜならば、関連内容は既知の推測した情報と異なるからである。
【0111】
前述の非特許文献1および2に記載の技術では、関連元情報、関連先情報、リンク、および関連内容の2つ以上の組み合わせのメジャー度合いおよびマイナー度合いを考慮していないため、ユーザの興味を引く意外性のある情報を提示できない、という問題点があった。
【0112】
[制御構造]
図6は、本発明の第2の実施の形態に係る関連情報出力装置が提供する制御構造を示すブロック図である。
【0113】
図6に示す関連情報出力装置202の各ブロックは、ハードディスク103に格納されたプログラム(コード)などをメインメモリ102に展開して、CPU101に実行させることで提供される。なお、
図6に示すモジュールの一部もしくは全部がハードウェアに実装されているファームウェアによって提供される場合もある。あるいは、
図6に示す制御構造の一部もしくは全部を専用ハードウェアおよび/または配線回路によって実現してもよい。
【0114】
図6を参照して、関連情報出力装置202は、本発明の第1の実施の形態に係る関連情報出力装置と比べて、関連情報蓄積部56の代わりに関連情報蓄積部66を備える。CPU101は、本発明の第1の実施の形態に係る関連情報出力装置と比べて、その制御構造として、認知度計算部53および高関心情報絞込み部54の代わりに認知度計算部63および高関心情報絞込み部64を備える。関連情報蓄積部66は、たとえば
図1に示すメインメモリ102またはハードディスク103に相当する。
【0115】
CPU101は、
図6に示す各部の他に、多くのユニットによって構成されるのが一般的であるが、説明を簡単にするために、本発明に関係しないユニットについては図示していない。
【0116】
以下では、本発明の第1の実施の形態と異なる点について主に説明する。
図7は、本発明の第2の実施の形態に係る関連情報出力装置における関連情報蓄積部の蓄積情報の一例を示す図である。
【0117】
図7を参照して、関連情報蓄積部66は、本発明の第1の実施の形態に係る関連情報出力装置と比べて、テーブルT1の代わりにテーブルT3を有する。テーブルT3には関連情報が蓄積されており、一つのレコードが一つの関連情報を示す。そして、テーブルT3は、関連情報として、関連元情報、関連先情報および頻度だけでなく、関連内容を含んでいる点がテーブルT1と異なる。一レコード目は「日本武道館」と「山口百恵」の関連内容が「コンサート」であることを示している。また、2レコード目は、関連元情報と関連先情報は1レコード目と同じであるが関連内容は「ロケ」であることを示している。
【0118】
認知度計算部63は、関連内容の認知度をさらに計算する点が認知度計算部53と異なる。認知度計算部63は、関連元情報と関連先情報、あるいはこれらのカテゴリにおいて、関連内容が良く出現するか否かで当該関連内容の認知度を計測する。
【0119】
たとえば、関連元情報のカテゴリが「ホール」であり、関連先情報のカテゴリが「芸能人」である場合を考える。この場合、関連内容「コンサート」の頻度は47と高いため、認知度は高い。また、関連内容「設計」の頻度は25と低いため、認知度は低い。
【0120】
あるいは、あらかじめ関連内容として認知度が高いと考えられる関連内容を関連情報出力装置202が保存しておき、認知度判定対象の関連内容がこの関連内容を含む場合には、認知度が高いと判断してもよい。
【0121】
高関心情報絞込み部64は、後述するように、関連内容の認知度もさらに考慮したルールを適用する点が高関心情報絞込み部54と異なる。
【0122】
[動作]
次に、本発明の第2の実施の形態に係る関連情報出力装置の動作について図面を用いて説明する。本発明の第2の実施の形態では、関連情報出力装置202を動作させることによって、本発明の第2の実施の形態に係る関連情報出力方法が実施される。よって、本発明の第2の実施の形態に係る関連情報出力方法の説明は、以下の関連情報出力装置202の動作説明に代える。なお、以下の説明においては、適宜
図6を参照する。
【0123】
図8は、本発明の第2の実施の形態に係る関連情報出力装置が関連情報出力処理を行なう際の動作手順を示すフローチャートである。
【0124】
図8を参照して、まず、入力部51は、関連元情報を一つ以上受け取る。たとえば、「日本武道館」が入力される(ステップS11)。
【0125】
次に、関連情報検索部52は、関連情報を検索する。ただし、検索結果が関連内容を含むことが本発明の第1の実施の形態と異なる。すなわち、第2の関連情報蓄積部206の蓄積内容が
図7に示す例の場合、関連情報検索部52は、関連情報(「日本武道館」、「山口百恵」、「コンサート」)のリンク頻度は47、関連情報(「日本武道館」、「山口百恵」、「ロケ」)のリンク頻度は3などを検索結果として返す(ステップS12)。
【0126】
次に、認知度計算部63は、各関連情報について、関連元情報、関連先情報、リンクおよび関連内容の各々の認知度を計算する。関連元情報、関連先情報およびリンクの認知度は、本発明の第1の実施の形態と同様に計算する。そして、認知度計算部63は、関連情報全体との相対頻度、関連情報検索部52による検索結果との相対頻度、平均出現頻度との相対差、または関連情報全体の推定分布における出現確率を関連内容の認知度として計算する。あるいは、認知度計算部63は、関連内容の認知度を、あらかじめ設定したキーワードが存在するか否かに基づいて計算する。あるいは、認知度計算部63は、関連元情報と関連先情報のカテゴリを利用し、関連元情報のカテゴリと関連先情報のカテゴリの関連内容の出現確率を関連内容の認知度として計算する(ステップS13)。
【0127】
関連情報出力装置202では、たとえば、以下の各式に従い、関連元情報のカテゴリと関連先情報のカテゴリの関連内容の出現確率によって認知度を求める。
認知度(関連内容AB)=関連元情報AのカテゴリCAと関連先情報BのカテゴリCBの関連内容ABの頻度/関連元情報AのカテゴリCAと関連先情報BのカテゴリCBのリンク頻度
【0128】
そして、認知度計算部63は、計算された認知度が、あらかじめ設定された所定の閾値以上であれば、当該情報の認知度が高く、メジャーであると判断する。
【0129】
たとえば、関連情報(「日本武道館」、「山口百恵」、「ロケ」)における関連内容の認知度は、以下のように計算される。
認知度(ロケ)=カテゴリ「ホール」とカテゴリ「芸能人」の関連内容「ロケ」の頻度/カテゴリ「ホール」とカテゴリ「芸能人」のリンク頻度
【0130】
ここで、関連元情報のカテゴリが「ホール」となり、関連先情報のカテゴリが「芸能人」となる関連情報の中で、関連内容が「ロケ」である頻度が30であり、リンク頻度が500であるとすると、認知度(ロケ)=30/500=0.06となる。
【0131】
また、関連情報(「福田屋旅館」、「山口百恵」、「ロケ」)の場合には、関連内容の認知度は以下のように計算される。
認知度(ロケ)=カテゴリ「宿」とカテゴリ「芸能人」の関連内容「ロケ」の頻度/カテゴリ「宿」とカテゴリ「芸能人」のリンク頻度
【0132】
ここで、関連元情報のカテゴリが「宿」となり、関連先情報のカテゴリが「芸能人」となる関連情報の中で、関連内容が「ロケ」である頻度が80であり、リンク頻度が400であるとすると、認知度(ロケ)=80/400=0.20となる。
【0133】
すなわち、ホールで芸能人がロケをすることに比べ、宿で芸能人がロケをする方がメジャーであることがわかる。
【0134】
次に、高関心情報絞込み部64は、認知度計算部63から認知度を受け取り、高関心情報絞込み部64の内部に組み込まれたルールを参照することにより、関連情報に意外性があるか否かを判定する(ステップS14)。
【0135】
図9は、高関心情報絞込み部64における意外性判断のルールの一例を示す図である。
図9を参照して、このルールは、関連元情報、関連先情報、リンクおよび関連内容がそれぞれメジャーであるか否かの組み合わせ毎に、意外性があるか否かを示すものである。
【0136】
図9に示す例では、関連元情報、関連先情報、リンクおよび関連内容がすべてメジャーな場合は意外性がないと判断される。なぜならば、これらの情報は誰もが知っているような当たり前の関連情報であると考えられ、既に知っている情報である可能性が高いためである。
【0137】
逆に、関連元情報、関連先情報、リンクおよび関連内容のすべてがマイナーである場合も意外性がないと判断される。なぜならば、これらの情報はユーザにとって知らないがあまり知りたいと思わない情報であると考えられ、提示されたとしてもその意味を類推できないからである。また、関連元情報および関連先情報の一方の認知度が高くて他方が低く、リンクおよび関連内容の認知度が低い場合には、これらの情報はユーザにとって関連先情報または関連元情報は知っているがその関連内容が意外な情報であると考えられる。
【0138】
より詳細には、高関心情報絞込み部64は、関連元情報、関連先情報およびリンクの認知度が高く、関連内容の認知度が低い場合には、これらの情報は意外性ありと判断する。また、高関心情報絞込み部64は、関連元情報、関連先情報およびリンクのすべての認知度が低く、関連内容の認知度が高い場合、意外性ありと判断する。また、高関心情報絞込み部64は、関連元情報および関連先情報の一方の認知度が高くて他方が低く、かつ、リンクの認知度が低い場合には、これらの情報は意外性ありと判断する。また、高関心情報絞込み部64は、関連元情報と関連先情報の認知度が高く、リンクおよび関連内容の少なくとも一方の認知度が低い場合には、これらの情報は意外性ありと判断する。そして、高関心情報絞込み部64は、その他の場合には、意外性のない情報であると判断する。
【0139】
さらに、高関心情報絞込み部64は、これらのルールに意外性の度合いを含めても良い。たとえば、高関心情報絞込み部64は、関連元情報と関連先情報の認知度が高く、リンクおよび関連内容の少なくとも一方の認知度が低い場合、これらは高程度に意外性の高い情報であると判断する。また、高関心情報絞込み部64は、関連元情報および関連先情報の一方の認知度が高くて他方が低く、リンクの認知度が低く、かつ関連内容の認知度が高い場合には、これらは中程度に意外性の高い情報であると判断する。このような構成により、意外性の度合いが高い関連情報のみを出力部55に渡すことができる。
【0140】
最後に、出力部55は、高関心情報絞込み部64から情報を受け取り、これを出力する(ステップS15)。
【0141】
以上のように、本発明の第2の実施の形態に係る関連情報出力装置では、関連情報検索部52は、入力部51から関連元情報を受けて、関連元情報に関連する複数の関連先情報と、関連元情報および各関連先情報の関連内容と、関連元情報の出現頻度と、各関連先情報の出現頻度と、関連元情報および各関連先情報の関係の出現頻度と、各関連内容の出現頻度とを関連情報蓄積部66から取得する。認知度計算部63は、取得された各出現頻度に基づいて、関連元情報の認知度、取得された各関連先情報の認知度、各関係の認知度および取得された各関連内容の認知度を計算する。そして、高関心情報絞込み部64は、関連元情報の認知度、関連先情報の認知度、関係の認知度および関連内容の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択し、出力部55へ出力する。
【0142】
このように、関連元情報、関連先情報、リンクおよび関連内容の認知度を利用することで、本発明の第1の実施の形態に係る関連情報出力装置と比べて、より意外性のある高関心情報への絞り込みを行なうことができるため、さらにユーザの興味を引く意外性のある情報を提示することが可能となる。
【0143】
また、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、
図9に示すように、各関連先情報の中から、関連元情報の認知度、関連先情報の認知度および関係の認知度が所定の閾値より高く、かつ関連内容の認知度が所定の閾値より低くなる関連先情報を選択する。また、高関心情報絞込み部64は、各関連先情報の中から、関連元情報の認知度、関連先情報の認知度および関係の認知度が所定の閾値より低く、かつ関連内容の認知度が所定の閾値より高くなる関連先情報を選択する。また、高関心情報絞込み部64は、各関連先情報の中から、関連元情報の認知度および関連先情報の認知度が所定の閾値より高く、かつ関係の認知度および関連内容の認知度の少なくとも一方が所定の閾値より低くなる関連先情報を選択する。また、高関心情報絞込み部64は、各関連先情報の中から、関連元情報の認知度および関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ関係の認知度が所定の閾値より低くなる関連先情報を選択する。
【0144】
このような構成により、複数の関連情報から意外性のある高関心情報を適切に絞り込むことができる。
【0145】
また、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、
図9に示すように、選択した関連先情報の中から、関連元情報の認知度および関連先情報の認知度が所定の閾値より高く、かつ関係の認知度および関連内容の認知度の少なくとも一方が所定の閾値より低くなる関連先情報を、選択した関連先情報の中で高程度に意外性の高い関連先情報として選択する。また、高関心情報絞込み部64は、選択した関連先情報の中から、関連元情報の認知度および関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、関係の認知度が所定の閾値より低く、かつ関連内容の認知度が所定の閾値より高くなる関連先情報を、選択した関連先情報の中で中程度に意外性の高い関連先情報として選択する。
【0146】
このような構成により、意外性のある高関心情報をユーザに段階的に提示することが可能となり、ユーザの満足度をさらに向上させることができる。
【0147】
また、本発明の第2の実施の形態に係る関連情報出力装置では、関連情報検索部52は、さらに、関連元情報のカテゴリ情報および関連する各関連先情報のカテゴリ情報を関連情報蓄積部66から取得する。そして、認知度計算部63は、認知度を計算すべき関連内容に対応する関連元情報および関連先情報の各々のカテゴリ間の関係について、カテゴリ間の関係の出現頻度の総和および関連内容の出現頻度に基づいて関連内容の出現確率を計算し、計算した出現確率を関連内容の認知度とする。
【0148】
このような構成により、カテゴリの観点からリンクの認知度を適切に計算することができるため、より高い精度で高関心情報を絞り込むことができる。
【0149】
なお、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、関連元情報の認知度、関連先情報の認知度、関係の認知度および関連内容の認知度に基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であるとしたが、これに限定するものではない。高関心情報絞込み部64は、関連元情報の認知度、関連先情報の認知度、関係の認知度および関連内容の認知度のうち、2つ以上の組み合わせに基づいて各関連先情報の中から1または複数の関連先情報を選択する構成であってもよい。
【0150】
この場合、本発明の第1の実施の形態における絞り込みルールを本発明の第2の実施の形態に係る関連情報出力装置に適用することが可能である。これ以外では、たとえば、高関心情報絞込み部64は、関連元情報および関連内容を選択し、関連元情報がメジャーであり、関連内容がマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部64は、関連先情報および関連内容を選択し、関連先情報がメジャーであり、関連内容がマイナーである場合には、この関連情報は意外性があると判定する。また、高関心情報絞込み部64は、リンクおよび関連内容を選択し、リンクがメジャーであり、関連内容がマイナーである場合には、この関連情報は意外性があると判定する。
【0151】
また、本発明の第2の実施の形態に係る関連情報出力装置では、高関心情報絞込み部64は、
図9に示すルールに従って意外性を判断する構成であるとしたが、これに限定するものではない。高関心情報絞込み部64は、たとえば、関連元情報、関連先情報、リンクがメジャーであり、関連内容がマイナーである場合、および関連元情報、関連先情報、リンクがマイナーであり、関連内容がメジャーである場合にのみ意外性があると判断する構成であってもよい。
【0152】
次に、本発明の他の実施の形態について図面を用いて説明する。なお、図中同一または相当部分には同一符号を付してその説明は繰り返さない。
【0153】
<第3の実施の形態>
本実施の形態は、第2の実施の形態に係る関連情報出力装置を適用した位置情報表示装置に関する。以下で説明する内容以外は第1の実施の形態または第2の実施の形態に係る関連情報出力装置と同様である。
【0154】
図10は、本発明の第3の実施の形態に係る位置情報表示装置が提供する制御構造を示すブロック図である。
【0155】
図10に示す位置情報表示装置401の各ブロックは、ハードディスク103に格納されたプログラム(コード)などをメインメモリ102に展開して、CPU101に実行させることで提供される。なお、
図10に示すモジュールの一部もしくは全部がハードウェアに実装されているファームウェアによって提供される場合もある。あるいは、
図10に示す制御構造の一部もしくは全部を専用ハードウェアおよび/または配線回路によって実現してもよい。
【0156】
図10を参照して、位置情報表示装置401は、CPU101と、位置情報蓄積部305と、関連情報蓄積部306とを備える。CPU101は、その制御構造として、入力部301と、位置情報検索部302と、関連情報絞込み部303と、出力部304とを備える。位置情報蓄積部305および関連情報蓄積部306は、たとえば
図1に示すメインメモリ102またはハードディスク103に相当する。
【0157】
CPU101は、
図10に示す各部の他に、多くのユニットによって構成されるのが一般的であるが、説明を簡単にするために、本発明に関係しないユニットについては図示していない。
【0158】
位置情報蓄積部305は、駅、ビルおよび寺院などのスポット情報を、その名称と、住所および緯度経度など場所を特定する情報と、分類を示すカテゴリとともに蓄積する。
【0159】
関連情報蓄積部306は、位置情報に関連する関連情報を蓄積する。すなわち、関連情報蓄積部306は、関連元情報を位置情報とし、関連先情報をその位置に関連する事物(以下、関連物とも称する。)の名称とし、関連内容を位置情報および関連物の関連を示すキーワードおよび文とする情報を蓄積する。
【0160】
位置情報検索部302は、位置情報蓄積部305を参照し、位置情報の名称、位置情報の住所、位置情報の緯度経度、および位置情報のカテゴリを条件として、位置情報を検索する。
【0161】
関連情報絞込み部303は、本発明の第2の実施の形態に係る関連情報出力装置における関連情報検索部52、認知度計算部63および高関心情報絞込み部64に相当する。ただし、関連情報絞込み部303は、高関心情報絞込み部64の出力に対して、関連情報のカテゴリおよび関連内容のキーワードによるフィルタリングも行なう。
【0162】
図11は、本発明の第3の実施の形態に係る位置情報表示装置における入力部が提供する入力内容の一例を示す図である。
【0163】
図11を参照して、まず、入力部301は、ユーザからの入力を受け付ける。すなわち、入力部301は、ユーザからの情報として、検索条件を受け取る。
【0164】
より詳細には、入力部301は、位置情報の名称、住所および緯度経度など空間的な絞り込み条件と、位置情報カテゴリという位置に関する条件と、関連物の名称、関連物カテゴリ、および関連内容キーワードといった関連物に関する条件とのうち一つ以上の検索条件を受け付ける。たとえば、
図12の例では、入力部301は、緯度経度、位置情報の範囲、住所、関連物のカテゴリ、および関連内容のキーワードを受け取る。また、
図11の例では、関連情報の出力時に表示する位置情報リストの上限および関連物情報リストの上限を指定するためのフィールドも存在する。
【0165】
次に、位置情報検索部302は、位置情報蓄積部305を参照し、位置情報を絞り込む。
【0166】
図12は、本発明の第3の実施の形態に係る位置情報表示装置における位置情報蓄積部の蓄積情報の一例を示す図である。
【0167】
図12を参照して、位置情報蓄積部305は、位置情報の名称、位置情報の住所、位置情報の緯度経度、および位置情報のカテゴリを蓄積するデータベースである。
【0168】
位置情報検索部302は、位置情報に関する条件に基づいて位置情報を検索する。たとえば、検索の結果、「日本武道館」と「森の音楽堂」が得られたとする。
【0169】
次に、関連情報絞込み部303は、位置情報の名称と関連物に関する条件を入力として、関連情報蓄積部306を参照し、意外性のある関連情報に絞り込む。たとえば、「日本武道館」を入力として、関連情報(「日本武道館」、「山口百恵」、「ロケ」)、関連情報(「日本武道館」、「自衛隊」、「音楽会」)、および関連情報(「森の音楽堂」、「小澤征爾」、「設計」)を返す。
【0170】
出力部304は、ユーザからの検索条件に適合する結果、すなわち位置情報検索部302および関連情報絞込み部303によって得られた位置情報および関連情報を表示する。出力部304は、たとえば
図1に示すハードディスク103またはディスプレイ110に関連情報を出力する。
【0171】
図13は、本発明の第3の実施の形態に係る位置情報表示装置の出力内容の一例を示す図である。
【0172】
図13を参照して、出力部304は、たとえばディスプレイ110の画面の上部(位置情報表示領域)に位置情報リストを出力し、下部(関連物情報表示領域)に関連物リストを出力する。また、当該画面においてユーザが画面上部の位置情報を選択すると、出力部304により、画面下部の関連物リストが、選択された位置情報に関連するもののみに絞り込まれる。また、出力部304は、ユーザが関連物を選択すると、選択された関連物の詳細ページを表示する。
【0173】
その他の構成および動作は第2の実施の形態に係る関連情報出力装置と同様であるため、ここでは詳細な説明を繰り返さない。
【0174】
上記実施の形態の一部または全部は以下の付記のようにも記載されうるが、本発明の範囲は、以下の付記に限定されるものではない。
【0175】
[付記1]
関連元情報に関連する情報を出力するための関連情報出力装置であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するための関連情報検索部と、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するための認知度計算部と、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するための高関心情報絞込み部とを備える、関連情報出力装置。
【0176】
[付記2]
前記高関心情報絞込み部は、前記関連元情報、前記関連先情報および前記関係のうちのいずれか2つを選択し、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる前記関連先情報を前記各関連先情報の中から選択する、付記1に記載の関連情報出力装置。
【0177】
[付記3]
前記高関心情報絞込み部は、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択する、付記1または付記2に記載の関連情報出力装置。
【0178】
[付記4]
前記高関心情報絞込み部は、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、付記2または付記3に記載の関連情報出力装置。
【0179】
[付記5]
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、付記1から付記4のいずれかに記載の関連情報出力装置。
【0180】
[付記6]
前記認知度計算部は、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、付記1から付記4のいずれかに記載の関連情報出力装置。
【0181】
[付記7]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記認知度を計算すべき前記関係である対象関係に対応する前記関連元情報および前記関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記カテゴリ間の関係の出現確率を前記対象関係の認知度として計算する、付記1から付記6のいずれかに記載の関連情報出力装置。
【0182】
[付記8]
前記認知度計算部は、前記対象関係に対応する前記関連元情報および前記関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象関係の認知度とする、付記7に記載の関連情報出力装置。
【0183】
[付記9]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報のカテゴリの出現確率を前記対象情報の認知度として計算する、付記1から付記8のいずれかに記載の関連情報出力装置。
【0184】
[付記10]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と前記対象情報のカテゴリの出現頻度との差を前記対象情報の認知度として計算する、付記1から付記8のいずれかに記載の関連情報出力装置。
【0185】
[付記11]
前記認知度計算部は、前記対象情報が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象情報の認知度とする、付記9または付記10に記載の関連情報出力装置。
【0186】
[付記12]
前記関連情報検索部は、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度計算部は、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記高関心情報絞込み部は、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、付記1から付記11のいずれかに記載の関連情報出力装置。
【0187】
[付記13]
前記高関心情報絞込み部は、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる前記関連先情報を選択し、かつ、
前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を選択する、付記12に記載の関連情報出力装置。
【0188】
[付記14]
前記高関心情報絞込み部は、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を選択し、かつ、
前記各関連先情報の中から、前記関連元情
報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
前記高関心情報絞込み部は、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情
報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、付記13に記載の関連情報出力装置。
【0189】
[付記15]
前記関連情報検索部は、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度計算部は、前記認知度を計算すべき前記関連内容に対応する前記関連元情報および前記関連先情報の各々のカテゴリ間の関係について、前記カテゴリ間の関係の出現頻度の総和および前記関連内容の出現頻度に基づいて前記関連内容の出現確率を計算し、計算した前記出現確率を前記関連内容の認知度とする、付記12から付記14のいずれかに記載の関連情報出力装置。
【0190】
[付記16]
関連元情報に関連する情報を出力するための関連情報出力装置における関連情報出力方法であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するステップと、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するステップとを含む、関連情報出力方法。
【0191】
[付記17]
前記関連先情報を選択するステップにおいては、前記関連元情報、前記関連先情報および前記関係のうちのいずれか2つを選択し、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる前記関連先情報を前記各関連先情報の中から選択する、付記16に記載の関連情報出力方法。
【0192】
[付記18]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択する、付記16または付記17に記載の関連情報出力方法。
【0193】
[付記19]
前記関連先情報を選択するステップにおいては、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、付記17または付記18に記載の関連情報出力方法。
【0194】
[付記20]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、付記16から付記19のいずれかに記載の関連情報出力方法。
【0195】
[付記21]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、付記16から付記19のいずれかに記載の関連情報出力方法。
【0196】
[付記22]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関係である対象関係に対応する前記関連元情報および前記関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記カテゴリ間の関係の出現確率を前記対象関係の認知度として計算する、付記16から付記21のいずれかに記載の関連情報出力方法。
【0197】
[付記23]
前記認知度を計算するステップにおいては、前記対象関係に対応する前記関連元情報および前記関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象関係の認知度とする、付記22に記載の関連情報出力方法。
【0198】
[付記24]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報のカテゴリの出現確率を前記対象情報の認知度として計算する、付記16から付記23のいずれかに記載の関連情報出力方法。
【0199】
[付記25]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と前記対象情報のカテゴリの出現頻度との差を前記対象情報の認知度として計算する、付記16から付記23のいずれかに記載の関連情報出力方法。
【0200】
[付記26]
前記認知度を計算するステップにおいては、前記対象情報が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象情報の認知度とする、付記24または付記25に記載の関連情報出力方法。
【0201】
[付記27]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記関連先情報を選択するステップにおいては、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、付記16から付記26のいずれかに記載の関連情報出力方法。
【0202】
[付記28]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる前記関連先情報を選択し、かつ、 前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を選択する、付記27に記載の関連情報出力方法。
【0203】
[付記29] 前記関連先情報を選択するステップにおいては、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、
前記各関連先情報の中から、前記関連元情
報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情
報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、付記28に記載の関連情報出力方法。
【0204】
[付記30]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関連内容に対応する前記関連元情報および前記関連先情報の各々のカテゴリ間の関係について、前記カテゴリ間の関係の出現頻度の総和および前記関連内容の出現頻度に基づいて前記関連内容の出現確率を計算し、計算した前記出現確率を前記関連内容の認知度とする、付記27から付記29のいずれかに記載の関連情報出力方法。
【0205】
[付記31]
関連元情報に関連する情報を出力するための関連情報出力装置において用いられる関連情報出力プログラムを記録した、コンピュータ読み取り可能な記録媒体であって、
前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報の出現頻度と、関連する各前記関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度とを前記関連情報出力装置の内部または外部に設けられた関連情報蓄積部から取得するステップと、
取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、および各前記関係の認知度を計算するステップと、
前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力するステップとをコンピュータに実行させるための関連情報出力プログラムを記録した、コンピュータ読み取り可能な記録媒体。
【0206】
[付記32]
前記関連先情報を選択するステップにおいては、前記関連元情報、前記関連先情報および前記関係のうちのいずれか2つを選択し、選択したうちの一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低くなる前記関連先情報を前記各関連先情報の中から選択する、付記31に記載のコンピュータ読み取り可能な記録媒体。
【0207】
[付記33]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度の少なくとも一方が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択する、付記31または付記32に記載のコンピュータ読み取り可能な記録媒体。
【0208】
[付記34]
前記関連先情報を選択するステップにおいては、さらに、選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を、高程度に意外性の高い関連先情報として選択する、付記32または付記33に記載のコンピュータ読み取り可能な記録媒体。
【0209】
[付記35]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報の出現確率を前記対象情報の認知度として計算する、付記31から付記34のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0210】
[付記36]
前記認知度を計算するステップにおいては、前記関連元情報、取得された前記各関連先情報および前記各関係のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報の出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報の出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係の出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した前記平均出現頻度と前記対象情報の出現頻度との差を前記対象情報の認知度として計算する、付記31から付記34のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0211】
[付記37]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関係である対象関係に対応する前記関連元情報および前記関連先情報の、カテゴリ間の関係の出現頻度の総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記カテゴリ間の関係の出現確率を前記対象関係の認知度として計算する、付記31から付記36のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0212】
[付記38]
前記認知度を計算するステップにおいては、前記対象関係に対応する前記関連元情報および前記関連先情報の少なくとも一方が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象関係の認知度とする、付記37に記載のコンピュータ読み取り可能な記録媒体。
【0213】
[付記39]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から出現確率分布を推定し、推定した前記出現確率分布を用いて、前記対象情報のカテゴリの出現確率を前記対象情報の認知度として計算する、付記31から付記38のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0214】
[付記40]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記
関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情
報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記関連元情報および取得された前記各関連先情報のうちの前記認知度を計算すべき対象情報について、前記関連情報蓄積部に蓄積されたすべての関連元情報のカテゴリの出現頻度の総和、前記関連情報蓄積部に蓄積されたすべての関連先情報のカテゴリの出現頻度の総和、および前記関連情報蓄積部に蓄積されたすべての関係のカテゴリの出現頻度の総和のうち前記対象情報に対応する出現頻度総和を取得し、取得した前記出現頻度総和から平均出現頻度を計算し、計算した平均出現頻度と前記対象情報のカテゴリの出現頻度との差を前記対象情報の認知度として計算する、
付記31から付記38のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0215】
[付記41]
前記認知度を計算するステップにおいては、前記対象情報が複数のカテゴリに属している場合には、各前記カテゴリについて計算した前記認知度の平均値、最大値または最小値を前記対象情報の認知度とする、付記39または付記40に記載のコンピュータ読み取り可能な記録媒体。
【0216】
[付記42]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、前記関連元情報を受けて、前記関連元情報に関連する複数の関連先情報と、前記関連元情報および各前記関連先情報の関連内容と、前記関連元情報の出現頻度と、前記各関連先情報の出現頻度と、前記関連元情報および前記各関連先情報の関係の出現頻度と、各前記関連内容の出現頻度とを前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、取得された各前記出現頻度に基づいて、前記関連元情報の認知度、取得された前記各関連先情報の認知度、各前記関係の認知度および取得された前記各関連内容の認知度を計算し、
前記関連先情報を選択するステップにおいては、前記関連元情報の認知度、前記関連先情報の認知度、前記関係の認知度および前記関連内容の認知度のうち、2つ以上の組み合わせに基づいて前記各関連先情報の中から1または複数の前記関連先情報を選択し、選択した前記関連先情報を少なくとも出力する、付記31から付記41のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0217】
[付記43]
前記関連先情報を選択するステップにおいては、前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より高く、かつ前記関連内容の認知度が所定の閾値より低くなる前記関連先情報を選択し、かつ、 前記各関連先情報の中から、前記関連元情報の認知度、前記関連先情報の認知度および前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を選択する、付記42に記載のコンピュータ読み取り可能な記録媒体。
【0218】
[付記44]
前記関連先情報を選択するステップにおいては、さらに、前記各関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、
前記各関連先情報の中から、前記関連元情
報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、かつ前記関係の認知度が所定の閾値より低くなる前記関連先情報を選択し、
選択した前記関連先情報の中から、前記関連元情報の認知度および前記関連先情報の認知度が所定の閾値より高く、かつ前記関係の認知度および前記関連内容の認知度の少なくとも一方が所定の閾値より低くなる前記関連先情報を、選択した前記関連先情報の中で高程度に意外性の高い関連先情報として選択し、かつ、前記関連元情
報および前記関連先情報の一方の認知度が所定の閾値より高く、他方の認知度が所定の閾値より低く、前記関係の認知度が所定の閾値より低く、かつ前記関連内容の認知度が所定の閾値より高くなる前記関連先情報を、選択した前記関連先情報の中で中程度に意外性の高い関連先情報として選択する、付記43に記載のコンピュータ読み取り可能な記録媒体。
【0219】
[付記45]
前記各関連先情報および前記各出現頻度を取得するステップにおいては、さらに、前記関連元情報のカテゴリ情報および関連する前記各関連先情報のカテゴリ情報を前記関連情報蓄積部から取得し、
前記認知度を計算するステップにおいては、前記認知度を計算すべき前記関連内容に対応する前記関連元情報および前記関連先情報の各々のカテゴリ間の関係について、前記カテゴリ間の関係の出現頻度の総和および前記関連内容の出現頻度に基づいて前記関連内容の出現確率を計算し、計算した前記出現確率を前記関連内容の認知度とする、付記42から付記44のいずれかに記載のコンピュータ読み取り可能な記録媒体。
【0220】
上記実施の形態は、すべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は、上記説明ではなく特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【0221】
この出願は、2010年3月12日に出願された日本出願特願2010−055699を基礎とする優先権を主張し、その開示の全てをここに取り込む。