(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6040137
(24)【登録日】2016年11月11日
(45)【発行日】2016年12月7日
(54)【発明の名称】アイテム推薦装置、アイテム推薦方法およびアイテム推薦プログラム
(51)【国際特許分類】
G06F 17/30 20060101AFI20161128BHJP
【FI】
G06F17/30 340A
G06F17/30 320Z
G06F17/30 350C
【請求項の数】5
【全頁数】14
(21)【出願番号】特願2013-216573(P2013-216573)
(22)【出願日】2013年10月17日
(65)【公開番号】特開2015-79381(P2015-79381A)
(43)【公開日】2015年4月23日
【審査請求日】2016年1月25日
(73)【特許権者】
【識別番号】000004226
【氏名又は名称】日本電信電話株式会社
(74)【代理人】
【識別番号】100086232
【弁理士】
【氏名又は名称】小林 博通
(74)【代理人】
【識別番号】100104938
【弁理士】
【氏名又は名称】鵜澤 英久
(74)【代理人】
【識別番号】100140361
【弁理士】
【氏名又は名称】山口 幸二
(74)【代理人】
【識別番号】100096459
【弁理士】
【氏名又は名称】橋本 剛
(72)【発明者】
【氏名】遠藤 結城
(72)【発明者】
【氏名】戸田 浩之
(72)【発明者】
【氏名】佐藤 隆
(72)【発明者】
【氏名】鷲崎 誠司
【審査官】
樋口 龍弥
(56)【参考文献】
【文献】
特開2013−097700(JP,A)
【文献】
米国特許出願公開第2014/0282733(US,A1)
【文献】
国際公開第2007/043322(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
番組と関連するアイテムを推薦するアイテム推薦装置であって、
テキストの集合が格納されたテキストストリーム記憶部から特徴語を含むトピックを抽出するトピック抽出手段と、
前記トピック抽出手段により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、前記トピックとともに記憶するトレンドスコア計算手段と、
Web情報が格納されたWeb情報データベースから番組情報と関連するWeb情報を抽出し、該抽出した番組関連Web情報を記憶する番組関連Web情報抽出手段と、
番組情報、前記番組関連Web情報抽出手段により抽出された番組関連Web情報および前記トレンドスコア計算手段により記憶されたトピックに基づいて、番組とトピックの関連度を計算する番組・トピック関連度計算手段と、
アイテムとそれに関する情報が格納されたアイテム情報データベースと、
前記アイテム情報データベース内のアイテム、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度および前記トレンドスコア計算手段により計算し記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する番組・アイテム関連度計算手段と、
前記番組・アイテム関連度計算手段によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する出力手段と、
を備えたことを特徴とするアイテム推薦装置。
【請求項2】
前記トレンドスコア計算手段は、前記テキストストリーム記憶部に格納されたテキスト集合Dの各テキストをd
j、前記抽出された各トピックをz
iとし、各トピックz
iのトレンドスコアTz
iを、
【数1】
なる計算式によって算出し、
前記番組・トピック関連度計算手段は、前記番組情報をtv、番組関連Web情報をa∈A(Aは番組関連Web情報の集合)、前記トピックをz∈Z(Zはトピック集合)、前記特徴語をw∈W(Wは語彙全体の集合)とし、これらとの関係を表すグラフを想定し、(1+|W|+|Z|+|A|)×(1+|W|+|Z|+|A|)の隣接行列C=(c
j,
k)を構築し、該隣接行列Cに基づいて番組tvおよびトピックzの各特徴量を求め、それらの特徴量を比較することによって番組とトピックの関連度R
tv,ziを算出し、
前記番組・アイテム関連度計算手段は、トピック−アイテム確率をP(z
i|l
k)、トピック−単語確率をP(z
i|w)、単語−アイテム確率をP(w|l
k)、テキストd
jにおけるトピックz
iの生起確率をP(z
i|d
j)、アイテムメタデータl
kにおいて単語wが発生する回数をn
lk(w)とし、アイテムとトピックの関連度R
lk,ziを、
【数4】
なる計算式によって算出し、
さらに、トレンドスコアおよび関連度の比重を決定する定数λ、前記トレンドスコア計算手段により計算されたトピックのトレンドスコアT
zi、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度R
tv,ziおよび前記算出されたアイテムとトピックの関連度R
lk,ziとによって、番組とアイテムの関連度R
tv,lkを、
【数5】
なる計算式によって算出する
ことを特徴とする請求項1に記載のアイテム推薦装置。
【請求項3】
番組と関連するアイテムを推薦するアイテム推薦方法であって、
トピック抽出手段が、テキストの集合が格納されたテキストストリーム記憶部から特徴語を含むトピックを抽出するトピック抽出ステップと、
トレンドスコア計算手段が、前記トピック抽出手段により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、前記トピックとともに記憶するトレンドスコア計算ステップと、
番組関連Web情報抽出手段が、Web情報が格納されたWeb情報データベースから番組情報と関連するWeb情報を抽出し、該抽出した番組関連Web情報を記憶する番組関連Web情報抽出ステップと、
番組・トピック関連度計算手段が、番組情報、前記番組関連Web情報抽出手段により抽出された番組関連Web情報および前記トレンドスコア計算手段により記憶されたトピックに基づいて、番組とトピックの関連度を計算する番組・トピック関連度計算ステップと、
番組・アイテム関連度計算手段が、アイテムとそれに関する情報が格納されたアイテム情報データベース内のアイテム、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度および前記トレンドスコア計算手段により計算し記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する番組・アイテム関連度計算ステップと、
出力手段が、前記番組・アイテム関連度計算手段によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する出力ステップと、
を備えたことを特徴とするアイテム推薦方法。
【請求項4】
前記トレンドスコア計算ステップは、前記テキストストリーム記憶部に格納されたテキスト集合Dの各テキストをd
j、前記抽出された各トピックをz
iとし、各トピックz
iのトレンドスコアTz
iを、
【数1】
なる計算式によって算出し、
前記番組・トピック関連度計算ステップは、前記番組情報をtv、番組関連Web情報をa∈A(Aは番組関連Web情報の集合)、前記トピックをz∈Z(Zはトピック集合)、前記特徴語をw∈W(Wは語彙全体の集合)とし、これらとの関係を表すグラフを想定し、(1+|W|+|Z|+|A|)×(1+|W|+|Z|+|A|)の隣接行列C=(c
j,
k)を構築し、該隣接行列Cに基づいて番組tvおよびトピックzの各特徴量を求め、それらの特徴量を比較することによって番組とトピックの関連度R
tv,ziを算出し、
前記番組・アイテム関連度計算ステップは、トピック−アイテム確率をP(z
i|l
k)、トピック−単語確率をP(z
i|w)、単語−アイテム確率をP(w|l
k)、テキストd
jにおけるトピックz
iの生起確率をP(z
i|d
j)、アイテムメタデータl
kにおいて単語wが発生する回数をn
lk(w)とし、アイテムとトピックの関連度R
lk,ziを、
【数4】
なる計算式によって算出し、
さらに、トレンドスコアおよび関連度の比重を決定する定数λ、前記トレンドスコア計算手段により計算されたトピックのトレンドスコアT
zi、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度R
tv,ziおよび前記算出されたアイテムとトピックの関連度R
lk,ziとによって、番組とアイテムの関連度R
tv,lkを、
【数5】
なる計算式によって算出する
ことを特徴とする請求項3に記載のアイテム推薦方法。
【請求項5】
コンピュータを請求項1又は2に記載の各手段として機能させるアイテム推薦プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ある情報に関連するアイテムを推薦する装置、特に世の中のトレンドに基づいて、TVやVOD(ビデオオンデマンド)等の番組と関連するアイテムを推定し、推薦するためのアイテム推薦装置、方法、プログラムに関する。
【背景技術】
【0002】
TVのデジタル化やインターネットの普及に伴い、単に番組を視聴するだけでなく、TVを媒介とした様々なサービスを利用できるようになった。具体的には、番組関連情報の閲覧やショッピング等のサービスが提供されている(例えば特許文献1、2、3参照)。
【0003】
特許文献1においては、推薦するアイテムについて、予め番組とアイテムが関連付けられていることが前提である。しかし、膨大な数のアイテムから、人手で関連するアイテムを選ぶのは、多大なコストを要する作業である。
【0004】
これに対し、特許文献2によれば、電子番組表(EPG)やクローズドキャプション(CC)のメタデータを基に、映像データの所定のタイミングで関連情報を提供することができる。
【0005】
また、特許文献3によれば、ユーザの番組視聴履歴に基づいて、過去に視聴していた番組情報を解析し、ユーザの嗜好を把握することで、ユーザの好みに合った番組を推薦する方法が提案されている。
【0006】
尚、本発明においてトピック抽出の際に利用する、トピックモデルであるLatent Dirichlet Allocation(LDA)は非特許文献1に記載され、また本発明の番組トピック関連度計算部が、隣接行列に基づいて番組およびトピックの各特徴量を求める際に利用するPower Iterationの技術は非特許文献2に記載されている。
【先行技術文献】
【特許文献】
【0007】
【特許文献1】特開2002−330422号公報
【特許文献2】特開2013−164770号公報
【特許文献3】特開2008−199406号公報
【非特許文献】
【0008】
【非特許文献1】D.M. Blei,A.Y. Ng,and M.I. Jordan. Latent Dirichlet Allocation, in Journal of Machine Learning Research (JMLR), vol.3,pp.993−1022 (2003).
【非特許文献2】Lin, F. and Cohen, W. W.: Power iteration clustering, In Proc. Of ICML, pp.655−662, 2010.
【発明の概要】
【発明が解決しようとする課題】
【0009】
しかし、従来の番組情報や視聴履歴を用いた技術は、ユーザの好みに基づいてアイテムを推薦できる一方で、世の中のトレンドに基づいた推薦はできなかった。例えばスポーツ番組を視聴しているユーザに対して、スポーツ映像や用品等のアイテムを推薦することはできるが、今何のスポーツ映像や用品に関する内容が話題になっているのかといった、今話題のトピックに関連するアイテムを推薦することができないという問題があった。
【0010】
また、特許文献2をはじめとする従来技術の多くは、推薦するアイテムを番組情報に基づいて検索しているが、用いる番組の情報量が不十分な場合が多く、番組と関連する多くのアイテムを推薦できないという問題がある。一般的な番組情報としては、放送波と共に配信されるEPGやクローズドキャプションCCがある。
【0011】
しかし、EPGは番組の概要であるため具体的な情報に乏しく、CCを含まない番組も多く存在する。例えば、箱根駅伝の視聴者にシューズやウェアを推薦したい場合、箱根駅伝の番組情報にはシューズという単語が含まれていることはなく、逆にシューズのメタデータにおいては箱根駅伝という単語が含まれていないため、従来技術では推薦することができない。これに対し、人手により番組情報を増やすサービスも存在するが、これは非常にコストがかかるという問題がある。
【0012】
本発明は上記課題を解決するものであり、その目的は、世の中のトレンドに基づいた話題のトピックと関連し、かつ番組と関連するアイテムを推薦することができるアイテム推薦装置、方法、プログラムを提供することにある。
【課題を解決するための手段】
【0013】
上記課題を解決するための本発明のアイテム推薦装置は、番組と関連するアイテムを推薦するアイテム推薦装置であって、テキストの集合が格納されたテキストストリーム記憶部から特徴語を含むトピックを抽出するトピック抽出手段と、前記トピック抽出手段により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、前記トピックとともに記憶するトレンドスコア計算手段と、Web情報が格納されたWeb情報データベースから番組情報と関連するWeb情報を抽出し、該抽出した番組関連Web情報を記憶する番組関連Web情報抽出手段と、番組情報、前記番組関連Web情報抽出手段により抽出された番組関連Web情報および前記トレンドスコア計算手段により記憶されたトピックに基づいて、番組とトピックの関連度を計算する番組・トピック関連度計算手段と、アイテムとそれに関する情報が格納されたアイテム情報データベースと、前記アイテム情報データベース内のアイテム、前記番組・トピック関連度計算手段により計算された番組とトピックの関連度および前記トレンドスコア計算手段により計算し記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する番組・アイテム関連度計算手段と、前記番組・アイテム関連度計算手段によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する出力手段と、を備えたことを特徴としている。
【0014】
なお、テキストストリームとはマイクロブログ(例えばTwitter(登録商標))等のリアルタイム性の高いテキストを想定している。
【発明の効果】
【0015】
本発明によれば、世の中のトレンドに基づいた話題のトピックと関連し、かつ番組と関連するアイテムを推薦することができる。また、番組情報がEPGおよびCCのみの少ない情報量であっても、番組関連Web情報を抽出し利用しているので、幅広く番組とアイテムとを関連付け、関連アイテムを推薦することができる。
【図面の簡単な説明】
【0016】
【
図2】本発明の一実施形態例における、テキストストリームからトレンドトピックを計算するまでのフローチャート。
【
図3】本発明の一実施形態例における、テキストストリーム記憶部のテキストストリームの例を示す説明図。
【
図4】本発明の一実施形態例における、抽出されたトピックと計算されたトレンドスコアの例を示す説明図。
【
図5】本発明の一実施形態例における、番組と関連するトレンドトピックに基づくアイテム推薦のフローチャート。
【
図6】本発明の一実施形態例における、番組関連情報とトピックの関連度を計算する際に用意する隣接行列の一例を示す説明図。
【
図7】本発明の一実施形態例におけるアイテム情報DB(データベース)の一例を示す説明図。
【
図8】本発明の一実施形態例における出力部が出力する、番組に関連する推薦アイテムの一例を示す説明図。
【発明を実施するための形態】
【0017】
以下、図面を参照しながら本発明の実施の形態を説明するが、本発明は下記の実施形態例に限定されるものではない。
図1は本発明の一実施形態例によるアイテム推薦装置の構成を示している。
【0018】
図1に示すアイテム推薦装置は、テキストストリーム記憶部10、トピック抽出手段としてのトピック抽出部20、トレンドスコア計算手段を構成するトレンドスコア計算部30およびトピック・トレンドスコア記憶部40、Web情報DB50、番組関連Web情報抽出手段を構成する番組関連Web情報抽出部60および番組関連Web情報記憶部70、番組・トピック関連度計算手段としての番組・トピック関連度計算部80、アイテム情報DB90、番組・アイテム関連度計算手段としての番組・アイテム関連度計算部100、出力手段としての出力部110を備えている。
【0019】
トピック抽出部20は、マイクロブログ(例えばTwitter)等のテキストの集合が格納されたテキストストリーム記憶部10から特徴語を含むトピックを抽出する。
【0020】
トレンドスコア計算部30は、トピック抽出部20により抽出されたトピックのトレンド度合いを表すトレンドスコアを計算し、トピックとともにトピック・トレンドスコア記憶部40に記憶する。
【0021】
番組関連Web情報抽出部60は、Web情報が格納されたWeb情報DB50から番組情報(EPG(電子番組表)、CC(クローズドキャプション)のデータ)と関連するWeb情報を抽出し、該抽出した番組関連Web情報を番組関連Web情報記憶部70に記憶する。
【0022】
番組・トピック関連度計算部80は、番組情報、番組関連Web情報記憶部70に記憶された番組関連Web情報およびトピック・トレンドスコア記憶部40に記憶されたトピックに基づいて、番組とトピックの関連度を計算する。
【0023】
アイテム情報DB90には、アイテムとそれに関する情報が格納されている。
【0024】
番組・アイテム関連度計算部100は、アイテム情報DB90内のアイテム、番組・トピック関連度計算部80により計算された番組とトピックの関連度およびトピック・トレンドスコア記憶部40に記憶されたトピックのトレンドスコアに基づいて、番組とアイテムの関連度を計算する。
【0025】
出力部110は、番組・アイテム関連度計算部100によって計算された番組とアイテムの関連度に基づいて、当該番組において推薦するアイテムを出力する。
【0026】
図1のアイテム推薦装置は、例えばコンピュータにより構成され、通常のコンピュータのハードウェアリソース、例えばROM、RAM、CPU、入力装置、出力装置、通信インターフェース、ハードディスク、記録媒体およびその駆動装置を備えている。
【0027】
このハードウェアリソースとソフトウェアリソース(OS、アプリケーションなど)との協働の結果、アイテム推薦装置は、
図1に示すように、テキストストリーム記憶部10、トピック抽出部20、トレンドスコア計算部30、トピック・トレンドスコア記憶部40、Web情報DB50、番組関連Web情報抽出部60、番組関連Web情報記憶部70、番組・トピック関連度計算部80、アイテム情報DB90、番組・アイテム関連度計算部100、出力部110を実装する。
【0028】
前記テキストストリーム記憶部10、トピック・トレンドスコア記憶部40、Web情報DB50、番組関連Web情報記憶部70、アイテム情報DB90は、ハードディスクあるいはRAMなどの保存手段・記憶手段に構築されているものとする。
【0029】
次に、上記のように構成された装置の動作を具体的に説明する。本実施形態例における処理は、テキストストリームからのトレンドトピックの計算、番組と関連するトレンドトピックに基づくアイテム推薦の二つに分かれる。
【0030】
最初に、テキストストリームからのトレンドトピックの計算について説明する。
図2は、本発明の一実施の形態におけるテキストストリームからのトレンドトピックを計算する処理のフローチャートを示している。
【0031】
<ステップS210> コンピュータは、一定時間分のテキストストリームに関して、発生時間、テキスト情報とテキストIDをテキストストリーム記憶部10に記憶する。記憶例を
図3に示す。記憶されたテキストストリームは一定時間後削除され、再度新たに一定時間分のテキストストリームを記憶する。ここで、テキストストリームとはマイクロブログ(例えばTwitter)等のリアルタイム性の高いテキストを想定している。
【0032】
<ステップS220> トピック抽出部20が、テキストストリーム記憶部10に記憶されたテキストd∈Dからトピックz∈Zを抽出する。ここでDはテキスト集合、Zはトピック集合であり、トピックzは特徴語w∈Wの集合で表される(Wは語彙全体の集合)。トピック抽出のために、トピック抽出部20は形態素解析器を用いて、テキストを名詞・動詞・形容詞等の単語集合に分割する。トピックの抽出には、代表的なトピックモデルであるLatent Dirichlet Allocation(LDA)(非特許文献1)等、公知のものを用いることができる。
図4に抽出されたトピックの例を示す。各トピックはトピックIDおよびトレンドスコアを持つ。トレンドスコアの算出方法は後述する。
【0033】
<ステップS230> トレンドスコア計算部30が、抽出された各トピックz
iのトレンドスコアT
ziを計算する。トレンドスコアは、あるトピックに関係するテキストが多く発生しているほど、そのトピックはトレンド度合が高いとみなして算出する。例えば以下の式(1)のように算出する。
【0035】
ここで、iおよびjはそれぞれトピックとテキストのIDであり、P(z
i|d
j)はテキストd
jにおけるトピックz
iの生起確率である。
図4に各トピックに関して計算されたトレンドスコアの例を示す。
【0036】
<ステップS240> 抽出・計算したトピックとトレンドスコアを、トピック・トレンドスコア記憶部40に記憶する。記憶例は
図4に示す通りである。
【0037】
次に、番組と関連するトレンドトピックに基づくアイテム推薦について説明する。
図5は、本発明の一実施の形態における番組と関連するトレンドトピックに基づくアイテムを推薦する処理のフローチャートを示している。
【0038】
<ステップS310> Web情報DB50には、例えばインターネットをクロールして得られた、Wikipedia(登録商標)記事やTwitterの番組ハッシュタグ付きTweet(登録商標)等が格納されており、番組関連Web情報抽出部60からの要求に従って、番組EPGやCCと関連するWeb情報を送信する。番組関連Web情報抽出部60は、例えばEPGやCCとWeb情報DB50内のWeb情報のテキストを形態素解析器によって単語単位に分割した後、各テキストに関して出現する単語情報に基づき、テキストの特徴を表すベクトルを構築する。それら特徴ベクトルの関連度をコサイン類似度等によって計算し、番組と関連するWeb情報を抽出する。
【0039】
<ステップS320> 番組関連Web情報抽出部60の要求に応じてWeb情報DB50から送信された情報を番組関連Web情報記憶部70に記憶する。視聴中の番組情報であるEPGやCCが時間と共に変わる度に、番組関連Web情報記憶部70に記憶される番組関連Web情報を更新する。
【0040】
<ステップS330> 番組・トピック関連度計算部80が番組(EPG・CCテキスト)を示すtv、番組関連Web情報記憶部70に記憶された番組関連Web情報a∈A(Aは番組関連Web情報の集合)、およびトピック・トレンドスコア記憶部40に記憶されたトピックz∈Zとの関連度を算出する。番組tvとトピックzとを幅広く関連付けるために、番組関連Web情報aをそれらの情報を繋ぐ橋渡しとして用いる。具体的には、例えば番組tv、番組関連Web情報a、トピックzおよび特徴語w∈Wとの関係を表すグラフを想定し、隣接行列Cを算出する。その隣接行列Cに基づいて、各々の特徴量を計算し、各特徴量を比較することで関連度を算出する。
【0041】
隣接行列Cは番組情報やトピック、特徴語の関係を、
図6に示すような一つの行列として表現したものである。隣接行列Cは次の手順で構築される。隣接行列として(1+|W|+|Z|+|A|)×(1+|W|+|Z|+|A|)の行列C=(c
j,
k)を用意する。jはj=1のときに番組を表し、2≦j≦|W|+1のときに特徴語を表す。また、|W|+2≦j≦|W|+|Z|+1のときにトピックを表し、|W|+|Z|+2≦j≦|W|+|Z|+|A|+1のとき番組関連Web情報を表す。これはkも同様とする。例えば、c
j,k=1(j=1,2≦k≦|W|+1)は、行列中の番組と特徴語の関係を表す値が1であることを表す。
【0042】
行列の各要素の値は次のように計算する。トピックzと特徴語wとの組み合わせを表す行列の値c
j,kには、例えば前述の非特許文献1のLDAによって算出した、単語−トピック確率P(w
k|z
j)を代入する。番組tvおよび番組関連Web情報aと特徴語wとの組み合わせを表す行列の値c
j,kには、例えばtvおよびaのテキスト中に単語wが発生する単語頻度tfに基づいて、tf/σを代入する。ここでσは定数である。最後に、まだ値の代入していない要素c
j,kには0を代入する。
【0043】
番組tvとトピックzとの関連度を計算するために、構築した隣接行列Cに基づき、各々の特徴量を計算する。特徴量は、例えば以下の式(2)のように、隣接行列からグラフラプラシアンを構築し、固有値分解によって計算する。
【0045】
ここでBは隣接行列Cの各行の和を対角成分の値に持つ対角行列、Pは固有ベクトルを列成分に保持した行列、∧は固有値を対角成分に保持した行列である。Pの行成分のベクトルをP
iとしたとき、例えば、隣接行列において第一成分に位置する番組tvの特徴量はP
1となる。この特徴量は、隣接行列Cに基づくグラフの内在的な構造を表しており、関連度の強いノードほど似た特徴量になる。したがって、これらの特徴量を比較することで関連度を計算できる。また、固有ベクトルPの算出は、非特許文献2に記載されたPower Iteration等の公知の技術を用いることができる。
【0046】
上記の通りに算出した特徴量をもとに、番組tvとトピックzとの関連度R
tv,ziを、例えばコサイン類似度等によって以下の式(3)のように計算する。
【0049】
<ステップS340> 番組・アイテム関連度計算部100が、アイテム情報DB90に記憶されたアイテムl∈Lと番組tvとの関連度を、トレンドトピックzとの関連度も考慮して計算する。
図7にアイテム情報DB90の記憶例を示す。各アイテムに関してアイテムID、ジャンル、アイテム名、アイテムメタデータ等が記憶されている。
【0050】
まずアイテムとトピックの関連度R
lk,ziを算出する。関連度R
lk,ziは、例えば前述したテキストストリームにトピックモデル(LDA)を適用して抽出した結果(トピックz
i)を用いて、以下の式(4)のように計算できる。
【0052】
ここで、kはアイテムのIDを示す。またn
lk(w)はアイテムメタデータl
kにおいて単語wが発生する回数を表す。
【0053】
以上の通り計算した、トピックのトレンドスコアT
zi、番組とトピックの関連度R
tv,zi、アイテムとトピックの関連度R
lk,zi、を用いて、最終的に番組tvとアイテムl
kの関連度R
tv,lkを例えば次の式(5)ように算出する。
【0055】
ここでλはトレンドスコアや関連度の比重を決定する定数である。
【0056】
<ステップS350> 出力部110は、番組tvとアイテムl
kの関連度R
tv,lkに基づき、関連度の高い順にアイテムを出力する。ここで、出力とは、ディスプレイへの表示、プリンタへの印字、音出力、外部装置への送信等を含む概念である。出力部110は出力デバイスのドライバソフトまたは、出力デバイスのドライバソフトと出力デバイス等で実現され得る。出力の具体例を
図8に示す。
図8はマラソン番組を視聴中のユーザに話題のシューズを推薦する例である。SNS(Social Networking Service)においてトレンドトピックを特定することで、例えば話題の商品を検出し、番組関連Web情報によってマラソンとシューズを連想させることで、関連性のあるトレンドアイテムの推薦を可能にしている。
【0057】
また、本実施形態のアイテム推薦装置における各手段の一部もしくは全部の機能をコンピュータのプログラムで構成し、そのプログラムをコンピュータを用いて実行して本発明を実現することができること、本実施形態のアイテム推薦方法における手順をコンピュータのプログラムで構成し、そのプログラムをコンピュータに実行させることができることは言うまでもなく、コンピュータでその機能を実現するためのプログラムを、そのコンピュータが読み取り可能な記録媒体、例えばFD(Floppy(登録商標) Disk)や、MO(Magneto−Optical disk)、ROM(Read Only Memory)、メモリカード、CD(Compact Disk)−ROM、DVD(Digital Versatile Disk)−ROM、CD−R、CD−RW、HDD、リムーバブルディスクなどに記録して、保存したり、配布したりすることが可能である。また、上記のプログラムをインターネットや電子メールなど、ネットワークを通して提供することも可能である。
【0058】
本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において種々変更・応用が可能である。
【符号の説明】
【0059】
10…テキストストリーム記憶部
20…トピック抽出部
30…トレンドスコア計算部
40…トピック・トレンドスコア記憶部
50…Web情報DB
60…番組関連Web情報抽出部
70…番組関連Web情報記憶部
80…番組・トピック関連度計算部
90…アイテム情報DB
100…番組・アイテム関連度計算部
110…出力部