(58)【調査した分野】(Int.Cl.,DB名)
前記レビュー情報取得部が、前記第1のコンテンツデータに関する一または複数の第1のレビュー情報と前記第2のコンテンツデータに関する一または複数の第2のレビュー情報とを取得し、
前記レビュー情報類似度計算部が、前記一または複数の第1のレビュー情報と前記一または複数の第2のレビュー情報との全ての組み合わせそれぞれについての類似度を計算し、その最大値を前記レビュー情報類似度とする、
請求項1または請求項2に記載のリンク情報生成装置。
前記レビュー情報類似度計算部が、前記一または複数の第1のレビュー情報と前記一または複数の第2のレビュー情報との全ての組み合わせそれぞれについての類似度を計算し、その平均値を前記レビュー情報類似度とする、
請求項3記載のリンク情報生成装置。
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、EPGデータのみでは、番組内容の情報を網羅して的確に内容を表すことが困難である。また、例えば、連続ドラマ番組のような同一シリーズの番組では、おのずとEPGデータの内容が似てしまうため、必然的に関連度が高くなり、当然関連しているはずの同一シリーズの番組ばかりが検索されてしまうこととなる。
本発明は、上記課題に鑑みてなされたものであり、コンテンツデータ間の潜在的な関係を抽出して関係付けることができる、リンク情報生成装置およびリンク情報生成プログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
[1]上記の課題を解決するため、本発明の一態様であるリンク情報生成装置は、第1のコンテンツデータの概要を表す第1の概要情報と第2のコンテンツデータの概要を表す第2の概要情報とを取得する概要情報取得部と、前記概要情報取得部が取得した前記第1の概要情報と前記第2の概要情報との類似度である概要情報類似度を計算する概要情報類似度計算部と、前記第1のコンテンツデータを視聴したユーザの端末からの第1のレビュー情報と前記第2のコンテンツデータを視聴したユーザの端末からの第2のレビュー情報とを取得するレビュー情報取得部と、前記レビュー情報取得部が取得した前記第1のレビュー情報と前記第2のレビュー情報との類似度であるレビュー情報類似度を計算するレビュー情報類似度計算部と、前記概要情報類似度計算部が計算した前記概要情報類似度が第1の閾値以下であり、且つ前記レビュー情報類似度計算部が計算した前記レビュー情報類似度が前記第1の閾値よりも高い第2の閾値よりも高い場合に、前記第1のコンテンツデータと前記第2のコンテンツデータとを関係付けるリンク情報を生成するリンク情報生成部と、を備える。
【0006】
[2]上記[1]記載のリンク情報生成装置において、前記レビュー情報類似度を計算するために用いられた前記第1のレビュー情報と前記第2のレビュー情報とに共通する単語に基づいてラベル情報を生成するラベル生成部、をさらに備え、前記リンク情報生成部は、前記リンク情報に前記ラベル生成部が生成した前記ラベル情報を関係付ける。
[3]上記[2]記載のリンク情報生成装置において、前記ラベル生成部は、前記共通する単語の出現頻度を求め、前記リンク情報生成部は、前記リンク情報と前記ラベル情報とに、前記出現頻度を表す頻度情報を関係付ける。
[4]上記[1]から[3]いずれか一項記載のリンク情報生成装置において、前記レビュー情報取得部が、前記第1のコンテンツデータに関する一または複数の第1のレビュー情報と前記第2のコンテンツデータに関する一または複数の第2のレビュー情報とを取得し、前記レビュー情報類似度計算部が、前記一または複数の第1のレビュー情報と前記一または複数の第2のレビュー情報との全ての組み合わせそれぞれについての類似度を計算し、その最大値を前記レビュー情報類似度とする。
[5]上記[4]記載のリンク情報生成装置において、前記レビュー情報類似度計算部が、前記一または複数の第1のレビュー情報と前記一または複数の第2のレビュー情報との全ての組み合わせそれぞれについての類似度を計算し、その平均値を前記レビュー情報類似度とする。
[6]上記[1]記載のリンク情報生成装置において、前記第1の概要情報と前記第1のレビュー情報との第1の類似度と、前記第2の概要情報と前記第2のレビュー情報との第2の類似度とを計算する第1の類似度計算部、をさらに備え、前記リンク情報生成部は、前記第1の類似度計算部が計算した前記第1の類似度または前記第2の類似度いずれかが閾値よりも大きい場合に、前記リンク情報を生成しない。
[7]上記[1]記載のリンク情報生成装置において、前記第1の概要情報と前記第2のレビュー情報との類似度を計算する第2の類似度計算部、をさらに備え、前記リンク情報生成部は、前記類似度が閾値よりも大きい場合に、前記第1のコンテンツデータと前記第2のコンテンツデータとを関係付けるリンク情報を生成する。
【0007】
[8]上記の課題を解決するため、本発明の一態様であるリンク情報生成プログラムは、コンピュータを、第1のコンテンツデータの概要を表す第1の概要情報と第2のコンテンツデータの概要を表す第2の概要情報とを取得する概要情報取得手段、前記概要情報取得手段が取得した前記第1の概要情報と前記第2の概要情報との類似度である概要情報類似度を計算する概要情報類似度計算手段、前記第1のコンテンツデータを視聴したユーザの端末からの第1のレビュー情報と前記第2のコンテンツデータを視聴したユーザの端末からの第2のレビュー情報とを取得するレビュー情報取得手段、前記レビュー情報取得手段が取得した前記第1のレビュー情報と前記第2のレビュー情報との類似度であるレビュー情報類似度を計算するレビュー情報類似度計算手段、前記概要情報類似度計算手段が計算した前記概要情報類似度が第1の閾値以下であり、且つ前記レビュー情報類似度計算手段が計算した前記レビュー情報類似度が前記第1の閾値よりも高い第2の閾値よりも高い場合に、前記第1のコンテンツデータと前記第2のコンテンツデータとを関係付けるリンク情報を生成するリンク情報生成手段、として機能させる。
【発明の効果】
【0008】
本発明によれば、コンテンツデータ間の潜在的な関係を抽出して関係付けることができる。
【発明を実施するための形態】
【0010】
以下、本発明を実施するための形態について、図面を参照して詳細に説明する。
図1は、本実施形態であるリンク情報生成装置を適用したコンテンツ配信システム全体の構成図である。同図に示すように、コンテンツ配信システム1は、コンテンツサーバ10と、リンク情報管理装置20と、端末30−1と、端末30−2と、端末30−3とを含む。コンテンツサーバ10と、リンク情報管理装置20と、端末30−1と、端末30−2と、端末30−3とは、ネットワーク40を介して接続される。
コンテンツサーバ10およびリンク情報管理装置20は、例えば、コンテンツデータの配信事業者側の装置である。端末30−1、端末30−2、および端末30−3は、ユーザ(視聴者)側の装置である。
以下の説明において、端末30−1〜30−3を区別しないで述べるときに、単に端末30と記載する場合がある。
【0011】
ネットワーク40は、インターネットプロトコル(Internet Protocol;IP)により通信可能なコンピュータネットワークである。ネットワーク40は、ローカルエリアネットワーク(Local Area Network;LAN)を含んでもいてもよいし、インターネット(Internet)に接続されていてもよい。また、ネットワーク40は、例えば、携帯電話ネットワークを含んでいてもよい。
【0012】
端末30は、コンテンツサーバ10が送信するコンテンツデータを受信し、このコンテンツデータを再生する。具体的に、例えば、端末30は、所望のコンテンツデータを要求するためのコンテンツ要求情報をコンテンツサーバ10に送信し、そのコンテンツ要求情報を受信したコンテンツサーバ10が送信するコンテンツデータを受信する。端末30は、その受信したコンテンツデータにより、図示しない表示装置に映像を表示させたり、図示しない音声出力装置から音声を出力させたりする。また、端末30は、コンテンツを視聴したユーザによって入力されたレビュー(感想)を表すコンテンツレビュー情報をコンテンツサーバ10に送信する。言い換えると、端末30は、コンテンツレビュー情報をコンテンツサーバ10のVODサイト(Video On Demand Site)に投稿する。
【0013】
コンテンツサーバ10は、コンテンツレビュー機能を備えたVODサービスを実現する。具体的に、コンテンツサーバ10は、端末30が送信するコンテンツ要求情報を受信すると、このコンテンツ要求情報にしたがってコンテンツデータを取得し、このコンテンツデータを要求元の端末30に送信する。この送信は、例えば、ストリーミング送信である。また、コンテンツサーバ10は、端末30が送信したコンテンツレビュー情報を受信し、このコンテンツレビュー情報を格納する。
図1に示すように、コンテンツサーバ10は、コンテンツデータベース11と、メタ情報データベース12と、レビュー情報データベース13とを備える。
【0014】
コンテンツデータベース11は、複数のコンテンツ情報を格納する。それぞれのコンテンツ情報は、例えば、コンテンツ識別情報とコンテンツデータとを関係付けて含む。コンテンツ識別情報は、コンテンツデータを識別する情報である。コンテンツデータは、例えば、放送番組、映画等のコンテンツのデータである。
【0015】
メタ情報データベース12は、複数のコンテンツメタ情報を格納する。それぞれのコンテンツメタ情報は、例えば、コンテンツ識別情報とメタ情報とを関係付けて含む。メタ情報は、例えば、コンテンツ識別情報に関係付けられたコンテンツデータに関する、ジャンル、番組概要テキストデータ、演出家の情報、出演者の情報等、コンテンツデータに関する概要情報である。
【0016】
レビュー情報データベース13は、複数のコンテンツレビュー情報を格納する。それぞれのコンテンツレビュー情報は、例えば、コンテンツ識別情報とレビュー情報とを関係付けて含む。レビュー情報は、例えば、コンテンツ識別情報に関係付けられたコンテンツデータに対する感想文の情報等、コンテンツを視聴したユーザによって表される、当該コンテンツに関する様々な情報である。
【0017】
リンク情報管理装置20は、複数のコンテンツ情報における全てのペアについて、それぞれ、メタ情報およびレビュー情報を用いた類似度を求めて、この類似度に応じてペアのリンク情報を生成し、少なくともそのリンク情報を格納する。端末30が所望のコンテンツデータを再生した場合、リンク情報管理装置20は、そのコンテンツデータに対応するリンク情報をコンテンツサーバ10に送信する。コンテンツサーバ10は、リンク情報管理装置20が送信したリンク情報を受信すると、このリンク情報に基づく推薦情報を、コンテンツデータを再生した端末30に送信する。
図1に示すように、リンク情報管理装置20は、リンク情報生成装置21と、リンク情報データベース22とを備える。
【0018】
リンク情報生成装置21は、コンテンツデータベース11に格納された複数のコンテンツ情報における全てのペアについて、それぞれ、メタ情報データベース12に格納されたメタ情報とレビュー情報データベース13に格納されたレビュー情報とを用いた類似度を求めて、この類似度に応じてペアのリンク情報を生成し、少なくともそのリンク情報を含めた出力情報を出力する。
リンク情報データベース22は、リンク情報生成装置21が出力した出力情報を格納する。
【0019】
図2は、本実施形態であるリンク情報生成装置21の機能構成の例を示すブロック図である。ここでは、リンク情報生成装置21は、コンテンツデータベース11に格納された第1のコンテンツ情報と第2のコンテンツ情報とに関するリンク情報を生成する場合を例として説明する。同図に示すように、リンク情報生成装置21は、メタ情報取得部211(概要情報取得部)と、メタ情報類似度計算部212(概要情報類似度計算部)と、レビュー情報取得部213と、レビュー情報類似度計算部214と、ラベル生成部215と、リンク情報生成部216とを備える。
【0020】
メタ情報取得部211は、メタ情報データベース12から、第1のコンテンツメタ情報および第2のコンテンツメタ情報を取り込む。つまり、メタ情報取得部211は、第1のコンテンツデータに関係付けられた第1のメタ情報(第1の概要情報)と第2のコンテンツデータに関係付けられた第2のメタ情報(第2の概要情報)とをメタ情報データベース12から取得し、これら第1のメタ情報および第2のメタ情報をメタ情報類似度計算部212に供給する。
【0021】
メタ情報類似度計算部212は、メタ情報取得部211が供給した第1のメタ情報および第2のメタ情報を取り込み、これら第1のメタ情報および第2のメタ情報の類似度(関連度)であるメタ情報類似度(概要情報類似度)を計算する。具体的に、例えば、メタ情報類似度計算部212は、第1のメタ情報および第2のメタ情報について形態素解析を実行して第1の名詞の集合および第2の名詞の集合を抽出する。そして、メタ情報類似度計算部212は、公知のベクトル空間モデルを適用し、第1の名詞の集合による第1のベクトルと第2の名詞の集合による第2のベクトルとの類似度を計算する。メタ情報類似度計算部212は、類似度として、例えばコサイン類似度を計算する。この場合、第1のベクトルと第2のベクトルとのコサイン類似度が“1”に近いほど、第1のメタ情報と第2のメタ情報との類似性は高くなる。
【0022】
レビュー情報取得部213は、レビュー情報データベース13から、一または複数の第1のコンテンツレビュー情報と一または複数の第2のコンテンツレビュー情報とを取り込む。つまり、レビュー情報取得部213は、第1のコンテンツデータに関する一または複数の第1のレビュー情報と、第2のコンテンツデータに関する一または複数の第2のレビュー情報とをレビュー情報データベース13から取得し、これら一または複数の第1のレビュー情報と一または複数の第2のレビュー情報とを、レビュー情報類似度計算部214に供給する。
【0023】
レビュー情報類似度計算部214は、レビュー情報取得部213が供給した一または複数の第1のレビュー情報と一または複数の第2のレビュー情報とを取り込み、これら全ての組み合わせそれぞれについての類似度(関連度)を、メタ情報類似度計算部212と同様に計算する。そして、レビュー情報類似度計算部214は、その計算結果である一または複数の類似度における最大値をレビュー情報類似度として選択する。つまり、レビュー情報類似度計算部214は、最も似ているレビュー情報間の類似度をレビュー情報類似度として決定する。言い換えると、レビュー情報類似度計算部214は、共通性が高いレビュー情報間の類似度をレビュー情報類似度として決定する。
【0024】
ラベル生成部215は、レビュー情報類似度を計算するために用いられた第1のレビュー情報および第2のレビュー情報に共通する一または複数の単語(例えば、名詞)に基づいてラベル情報を生成する。このラベル情報は、例えば、その共通する一または複数の単語を含む情報である。
また、ラベル生成部215は、共通する単語の出現頻度を求める。なお、この共通する単語は、レビュー情報類似度を計算するために用いられた第1のレビュー情報および第2のレビュー情報に共通する単語であってもよいし、レビュー情報取得部213が取得した一または複数の第1のレビュー情報と一または複数の第2のレビュー情報とに共通する単語であってもよい。また、ラベル生成部215は、出現頻度が高い順に所定数の単語を選択し、これら所定数の単語を含めたラベル情報を生成してもよい。
【0025】
リンク情報生成部216は、メタ情報類似度計算部212が計算したメタ情報類似度が第1の閾値以下であり、且つレビュー情報類似度計算部214が計算したレビュー情報類似度が第1の閾値よりも高い第2の閾値よりも高い場合に、第1のコンテンツデータと第2のコンテンツデータとを関係付けるリンク情報を生成する。このリンク情報は、例えば、第1のコンテンツデータの所在を表す第1の所在情報と、第2のコンテンツデータの所在を表す第2の所在情報とのペアの情報である。所在情報は、例えば、コンテンツデータのURL(Uniform Resource Locator)である。リンク情報生成部216は、リンク情報を生成する場合、このリンク情報とラベル生成部215が生成したラベル情報と出現頻度を表す頻度情報とを関係付ける。そして、リンク情報生成部216は、リンク情報とラベル情報と頻度情報とを関係付けた出力情報を出力する。
【0026】
図3は、リンク情報生成装置21が出力する出力情報のデータ構成の例を示す図である。同図に示すように、出力情報は、第1のコンテンツ所在情報と、第2のコンテンツ所在情報と、ラベル情報と、頻度情報とを含む。第1のコンテンツ所在情報は、第1のコンテンツデータの所在を表す情報である。第2のコンテンツ所在情報は、第2のコンテンツデータの所在を表す情報である。ラベル情報は、レビュー情報類似度に対応する第1のレビュー情報および第2のレビュー情報に基づき得られたラベルを表す情報である。頻度情報は、ラベル情報が示すラベルの出現頻度を表す情報である。
図3の出力情報によれば、第1のコンテンツ所在情報が示す第1のコンテンツデータと、第2のコンテンツ所在情報が示す第2のコンテンツデータとはリンク付けられており、このリンクにはラベル情報が示すラベルと、頻度情報が示す出現頻度とが関係付けられている。
【0027】
図4は、本実施形態であるリンク情報生成装置21の処理手順の例を示すフローチャートである。
ステップS1において、リンク情報生成装置21は、検査対象である二つのコンテンツデータ(第1のコンテンツデータおよび第2のコンテンツデータ)を選択する。
【0028】
次に、ステップS2において、メタ情報取得部211は、第1のコンテンツデータに関係付けられた第1のメタ情報と第2のコンテンツデータに関係付けられた第2のメタ情報とをメタ情報データベース12から取得し、これら第1のメタ情報および第2のメタ情報をメタ情報類似度計算部212に供給する。
次に、メタ情報類似度計算部212は、メタ情報取得部211が供給した第1のメタ情報および第2のメタ情報を取り込み、これら第1のメタ情報および第2のメタ情報の類似度であるメタ情報類似度を計算する。
【0029】
次に、ステップS3からステップS5において、リンク情報生成装置21は、第1のコンテンツデータに関する一または複数の第1のレビュー情報と第2のコンテンツデータに関する一または複数の第2のレビュー情報との全ての組み合わせそれぞれについて、次の処理を実行する。つまり、レビュー情報取得部213は、第1のレビュー情報および第2のレビュー情報を取得し、これら第1のレビュー情報および第2のレビュー情報をレビュー情報類似度計算部214に供給する。次に、レビュー情報類似度計算部214は、レビュー情報取得部213が供給した第1のレビュー情報および第2のレビュー情報を取り込み、類似度を計算する。
【0030】
次に、ステップS6において、レビュー情報類似度計算部214は、ステップS3からステップS6における計算結果である一または複数の類似度のうち最大値をレビュー情報類似度として選択する。
【0031】
次に、メタ情報類似度計算部212が計算したメタ情報類似度が第1の閾値以下であり、且つレビュー情報類似度計算部214が計算したレビュー情報類似度が第1の閾値よりも高い第2の閾値よりも高い場合(ステップS7:YES)はステップS8の処理に移し、それ以外の場合(ステップS7:NO)はステップS1の処理に戻す。
【0032】
ステップS8において、リンク情報生成部216は、第1のコンテンツデータと第2のコンテンツデータとを関係付けるリンク情報を生成する。
次に、ステップS9において、ラベル生成部215は、レビュー情報類似度を計算するために用いられた第1のレビュー情報および第2のレビュー情報に共通する単語に基づいてラベル情報を生成する。そして、ラベル生成部215は、共通する単語の出現頻度を求める。
次に、ステップS10において、リンク情報生成部216は、リンク情報とラベル生成部215が生成したラベル情報と出現頻度を表す頻度情報とを関係付けた出力情報をリンク情報データベース22に格納させる。
【0033】
図5は、リンク情報生成装置21が出力情報を生成する処理の例を説明するための図である。同図は、ユーザxがコンテンツデータである番組Aを視聴してレビュー情報PBxをVODサイトに投稿し、ユーザyがコンテンツデータである番組Bを視聴してレビュー情報PByをVODサイトに投稿したことを表している。そして、同図は、番組Aに関するレビュー情報と番組Bに関するレビュー情報との全ての組み合わせのうち、レビュー情報PBxおよびレビュー情報PByが、類似度が最大となるレビュー情報のペアである場合を示している。ラベル生成部215は、レビュー情報PBxおよびレビュー情報PByに共通する単語(名詞)のうち、出現頻度が高い順から所定数(2個)の単語(“劇団P”、“ダンス”)をラベル情報として選出し、それぞれ、頻度情報を対応付ける。リンク情報生成部216は、番組Aと番組Bとをリンク付けるリンク情報にラベル情報および頻度情報を関係付けた出力情報を、リンク情報データベース22に格納させる。
【0034】
図6は、
図5の例によりリンク情報データベース22に格納されたリンク情報およびラベル情報を利用したコンテンツ推薦処理の例を説明するための図である。同図において、コンテンツレビュー機能を備えたVODサービスのユーザが番組Aを視聴したものとする。番組Aを視聴したユーザに対して番組B、番組C、および番組Dを推薦する場合、コンテンツサーバ10は、次の情報を当該ユーザの端末30に送信する。つまり、コンテンツサーバ10は、番組Bを示す情報(例えば、番組Bの代表画像であるインデックス画像)と、番組Aおよび番組Bのリンク情報と、このリンク情報に関係付けられたラベル情報(“劇団P”、“ダンス”)とを端末30に送信する。また、コンテンツサーバ10は、番組Cを示す情報(例えば、番組Cの代表画像であるインデックス画像)と、番組Aおよび番組Cのリンク情報と、このリンク情報に関係付けられたラベル情報(“イタリアン”)とを端末30に送信する。また、コンテンツサーバ10は、番組Dを示す情報(例えば、番組Dの代表画像であるインデックス画像)と、番組Aおよび番組Dのリンク情報と、このリンク情報に関係付けられたラベル情報(“病院”、“兄弟”)とを端末30に送信する。
【0035】
以上、詳述したように、本実施形態であるリンク情報生成装置21は、第1のコンテンツデータの概要を表す第1のメタ情報と第2のコンテンツデータの概要を表す第2のメタ情報とを取得するメタ情報取得部211を備える。また、リンク情報生成装置21は、メタ情報取得部211が取得した第1のメタ情報と第2のメタ情報との類似度であるメタ情報類似度を計算するメタ情報類似度計算部212を備える。また、リンク情報生成装置21は、第1のコンテンツデータを視聴したユーザの端末30からの第1のレビュー情報と第2のコンテンツデータを視聴したユーザの端末30からの第2のレビュー情報とを取得するレビュー情報取得部213を備える。また、リンク情報生成装置21は、レビュー情報取得部213が取得した第1のレビュー情報と第2のレビュー情報との類似度であるレビュー情報類似度を計算するレビュー情報類似度計算部214を備える。また、リンク情報生成装置21は、メタ情報類似度計算部212が計算したメタ情報類似度が第1の閾値以下であり、且つレビュー情報類似度計算部214が計算したレビュー情報類似度が第1の閾値よりも高い第2の閾値よりも高い場合に、第1のコンテンツデータと第2のコンテンツデータとを関係付けるリンク情報を生成するリンク情報生成部216を備える。
【0036】
この構成により、リンク情報生成装置21は、第1のメタ情報および第2のメタ情報の類似度が比較的小さく、且つ第1のレビュー情報および第2のレビュー情報の類似度が比較的大きい場合に、第1のコンテンツデータおよび第2のコンテンツデータのリンク情報を生成する。具体的に、例えば、リンク情報生成装置21は、コンテンツデータの概要情報同士の類似性が低い一方、コンテンツデータに関する投稿情報の類似性が高い場合のコンテンツデータ同士をリンク付ける。これにより、リンク情報生成装置21は、当然関連する同一シリーズのコンテンツデータの組み合わせを除外または減少させて、視聴者の知見や感想に基づくコンテンツ間の意外な関係を抽出することができる。
【0037】
[その他の実施形態]
図7は、その他の実施形態であるリンク情報生成装置がリンク情報を生成する例を説明するための図である。このリンク情報生成装置は、図示しない類似度計算部を備える。同図に示したように、類似度計算部は、コンテンツデータAのメタ情報SAとコンテンツデータAに関するレビュー情報PAとの類以度Sim_SA-PAを計算する。そして、リンク情報生成装置のリンク情報生成部は、その類似度Sim_SA-PAを用いてリンク情報を生成する。例えば、リンク情報生成部は、類以度Sim_SA-PAに応じてリンクを張るために用いるレビュー情報をフィルタリングする。具体的に、例えば、類似度Sim_SA-PAが所定の閾値よりも大きい場合、レビュー情報PAの内容は、コンテンツデータAの内容を説明している文章である可能性が高い。意外な観点に基づいたリンクを張るためには、レビュー情報にのみ含まれる単語が重要なファクタとなる。よって、リンク情報生成部は、類似度Sim_SA-PAが所定の閾値よりも大きなレビュー情報PAについては、リンク情報の生成に利用しないこととする。
【0038】
また、一方で、リンク情報生成装置は、コンテンツデータAに関するレビュー情報PAと、別のコンテンツデータBのメタ情報SBとの間の類以度Sim_PA-SBを利用してもよい。この場合、類似度Sim_PA-SBが高いほど、コンテンツデータAとコンテンツデータBとの間の潜在的な関係が高いと考えられる。よって、リンク情報生成部は、類似度Sim_PA-SBが所定の閾値よりも大きなコンテンツデータ間にはリンクを張る、という処理を行う。
【0039】
また、リンク情報生成部は、これら4種類の類以度、Sim_SA-SB(メタ情報SAおよびメタ情報SBの類似度)、Sim_PA-PB(レビュー情報PAおよびレビュー情報PBの類似度)、Sim_SA-PA、およびSim_PA-SBの全てを統合的に用いて、コンテンツデータAとコンテンツデータBとの間にリンクを張るか否かの判断を行ってもよい。
【0040】
また、前述した実施形態において、レビュー情報類似度計算部214は、レビュー情報取得部213が供給した一または複数の第1のレビュー情報と一または複数の第2のレビュー情報とを取り込み、これら全ての組み合わせそれぞれについての類似度を、メタ情報類似度計算部212と同様に計算し、その計算結果である一または複数の類似度の平均値をレビュー情報類似度として選択してもよい。つまり、レビュー情報類似度計算部214は、平均的に似ているレビュー情報間の類似度をレビュー情報類似度として決定してもよい。
【0041】
また、リンク情報生成部216は、メタ情報類似度計算部212が計算したメタ情報類似度に関係なく、レビュー情報類似度計算部214が計算したレビュー情報類似度が所定の閾値よりも高い場合に、第1のコンテンツデータと第2のコンテンツデータとを関係付けるリンク情報を生成してもよい。
【0042】
また、リンク情報生成部216は、コンテンツデータベース11に格納された全てのコンテンツデータから得られるペアそれぞれにリンク情報を付与し、且つ、各リンク情報に、メタ情報類似度およびレビュー情報類似度を重みとして関係付けてもよい。
【0043】
また、上述した実施形態であるリンク情報生成装置21の一部の機能をコンピュータで実現するようにしてもよい。この場合、その機能を実現するためのリンク情報生成プログラムをコンピュータ読み取り可能な記録媒体に記録し、この記録媒体に記録されたリンク情報生成プログラムをコンピュータシステムに読み込ませて、このコンピュータシステムが実行することにより、当該機能を実現してもよい。なお、このコンピュータシステムとは、オペレーティングシステム(Operating System;OS)や周辺装置のハードウェアを含むものである。また、コンピュータ読み取り可能な記録媒体とは、フレキシブルディスク、光磁気ディスク、光ディスク、メモリカード等の可搬型記録媒体、コンピュータシステムに備えられる磁気ハードディスクやソリッドステートドライブ等の記憶装置のことをいう。さらに、コンピュータ読み取り可能な記録媒体とは、インターネット等のコンピュータネットワーク、および電話回線や携帯電話網を介してプログラムを送信する場合の通信回線のように、短時間の間、動的にプログラムを保持するもの、さらには、その場合のサーバ装置やクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持するものを含んでもよい。また上記のリンク情報生成プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに、前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせにより実現するものであってもよい。
【0044】
以上、本発明の実施の形態について図面を参照して詳述したが、具体的な構成はその実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲の設計等も含まれる。