特許第6137960号(P6137960)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本放送協会の特許一覧

特許6137960コンテンツ検索装置、方法及びプログラム
<>
  • 特許6137960-コンテンツ検索装置、方法及びプログラム 図000002
  • 特許6137960-コンテンツ検索装置、方法及びプログラム 図000003
  • 特許6137960-コンテンツ検索装置、方法及びプログラム 図000004
  • 特許6137960-コンテンツ検索装置、方法及びプログラム 図000005
  • 特許6137960-コンテンツ検索装置、方法及びプログラム 図000006
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6137960
(24)【登録日】2017年5月12日
(45)【発行日】2017年5月31日
(54)【発明の名称】コンテンツ検索装置、方法及びプログラム
(51)【国際特許分類】
   G06F 17/30 20060101AFI20170522BHJP
【FI】
   G06F17/30 419B
   G06F17/30 340A
【請求項の数】13
【全頁数】15
(21)【出願番号】特願2013-130518(P2013-130518)
(22)【出願日】2013年6月21日
(65)【公開番号】特開2015-5174(P2015-5174A)
(43)【公開日】2015年1月8日
【審査請求日】2016年4月25日
【権利譲渡・実施許諾】特許権者において、実施許諾の用意がある。
(73)【特許権者】
【識別番号】000004352
【氏名又は名称】日本放送協会
(74)【代理人】
【識別番号】100106002
【弁理士】
【氏名又は名称】正林 真之
(74)【代理人】
【識別番号】100120891
【弁理士】
【氏名又は名称】林 一好
(72)【発明者】
【氏名】宮崎 勝
(72)【発明者】
【氏名】山田 一郎
【審査官】 川▲崎▼ 博章
(56)【参考文献】
【文献】 特開2002−288221(JP,A)
【文献】 特開平06−318202(JP,A)
【文献】 特開2007−241753(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
複数の単語の関係を記述した単語関係データを記憶する単語ネットワーク蓄積部と、
コンテンツ情報を記憶するコンテンツ蓄積部と、
前記コンテンツ情報に含まれる単語を抽出する単語情報獲得部と、
コンテンツ毎に、前記単語情報獲得部により抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成部と、
ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較部と、を備えるコンテンツ検索装置。
【請求項2】
前記単語マップ比較部は、前記ユーザが選択したコンテンツに対する単語マップに含まれる単語のうち、重要度が相対的に高いと判定される重要語の少なくとも一部が共通し、かつ、単語マップ同士の距離が遠いコンテンツを優先的に抽出する請求項1に記載のコンテンツ検索装置。
【請求項3】
前記単語マップ比較部は、前記単語関係データにおける関係リンクの種類に基づいて、前記単語マップ同士の距離に重み付けを行う請求項2に記載のコンテンツ検索装置。
【請求項4】
前記単語マップ生成部は、前記単語情報獲得部により抽出された単語のうち、所定の重要度に満たない単語を除外して、前記単語マップを生成する請求項1から請求項3のいずれかに記載のコンテンツ検索装置。
【請求項5】
前記重要度は、前記単語情報獲得部により抽出された単語に対するTF−IDFに基づく指標である請求項4に記載のコンテンツ検索装置。
【請求項6】
前記重要度は、前記単語情報獲得部により抽出された単語に対する前記単語関係データにおける関係リンクの数に基づく指標である請求項4に記載のコンテンツ検索装置。
【請求項7】
ユーザ毎のコンテンツの選択履歴を記憶する履歴蓄積部を備え、
前記単語マップ比較部は、前記選択履歴に含まれないコンテンツを優先的に抽出する請求項1から請求項6のいずれかに記載のコンテンツ検索装置。
【請求項8】
前記単語関係データのうち、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、当該ユーザと関連付けて記憶する選択マップ蓄積部を備え、
前記単語マップ比較部は、前記選択マップ蓄積部に記憶されている単語群と共通部分が少ない単語マップに対応するコンテンツを優先的に抽出する請求項1から請求項7のいずれかに記載のコンテンツ検索装置。
【請求項9】
前記選択マップ蓄積部は、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、選択回数と共に記憶し、
前記単語マップ比較部は、前記選択回数が少ない単語を含む単語マップに対応するコンテンツを優先的に抽出する請求項8に記載のコンテンツ検索装置。
【請求項10】
前記単語関係データと、前記選択マップ蓄積部における前記ユーザ毎の単語データとの比較情報を生成する比較情報生成部を備える請求項8又は請求項9に記載のコンテンツ検索装置。
【請求項11】
前記コンテンツ情報は、コンテンツに対するユーザの投稿文である請求項1から請求項10のいずれかに記載のコンテンツ検索装置。
【請求項12】
複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータが、
前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、
コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、
ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行するコンテンツ検索方法。
【請求項13】
複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータに、
前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、
コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、
ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行させるためのコンテンツ検索プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、推薦コンテンツを検索する装置、方法及びプログラムに関する。
【背景技術】
【0002】
近年、文書、音声、画像及び映像等、様々な種類の膨大なコンテンツがインターネット上で閲覧可能となっている。これらを効率よく検索するために、キーワード等で高速にコンテンツを検索する技術はもとより、より高度な、ユーザの嗜好を反映したコンテンツ検索技術等が求められている。
【0003】
個人の嗜好を利用した情報検索を拡張する試みとして、ソーシャルメディアを利用し、他者の視点で情報を検索する技術も提案されている。例えば、インターネット上のショッピングサイトでは、他のユーザのレビューや購買履歴を利用した商品の推薦方法が用いられている。この推薦方法によれば、「この商品を買ったユーザは、こんな商品も買っています」といった「協調フィルタリング」と呼ばれる機能を利用することで、ユーザが暗黙的に好む商品等の検索、推薦等を行うことができる。
【0004】
さらに、SNS(Social Networking Service)上での人と人との繋がりを利用し、SNS上での友人が閲覧した(興味を持った)コンテンツを自動抽出する技術が提案されている(例えば、特許文献1参照)。また、不特定多数の人々が記録したコメント情報を用いて注目度の高いコンテンツを抽出して自動的にそのコンテンツを録画する技術が提案されている(例えば、特許文献2参照)。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】特開2012−256252号公報
【特許文献2】特開2012−049995号公報
【発明の概要】
【発明が解決しようとする課題】
【0006】
ところで、コンテンツには、ある1つのテーマについて様々な観点から作られたものが多数含まれていると考えられる。例えば、テレビ放送等の「番組」を例にとると、「消費税増税」という事柄に対して、その「デメリット(例:景気の落ち込み)」という観点から作られた番組もあれば、逆にその「メリット(例:福祉の充実)」の観点から作られたものもある。したがって、ユーザは、これらの様々な観点に基づく情報をバランス良く閲覧することを望む場合が多い。
【0007】
しかしながら、これらの様々な番組を検索する場合、ユーザの「経済情報を好む」という嗜好情報を用いると、消費税に対してはデメリットに関係する番組を多く検索及び推薦していくことになっていた。
また、前述の技術によっても、他者の行動履歴等を利用することで、個人の嗜好に囚われないコンテンツへの接触が可能となるが、様々な観点からバランス良く情報を得ることは難しかった。
【0008】
本発明は、ユーザが今まで接してこなかった概念を含むコンテンツを抽出できるコンテンツ検索装置、方法及びプログラムを提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明に係るコンテンツ検索装置は、複数の単語の関係を記述した単語関係データを記憶する単語ネットワーク蓄積部と、コンテンツ情報を記憶するコンテンツ蓄積部と、前記コンテンツ情報に含まれる単語を抽出する単語情報獲得部と、コンテンツ毎に、前記単語情報獲得部により抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成部と、ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較部と、を備える。
【0010】
この構成によれば、コンテンツ検索装置は、事前に用意した単語同士の関係を記述した単語関係データを利用して、ユーザが視聴したコンテンツの情報から生成した単語マップと、他のコンテンツの情報から生成した単語マップとを比較し、互いに共通部分が少ないコンテンツを優先的に抽出する。したがって、視聴したコンテンツと関連しつつも、ユーザが今まで接してこなかった概念を含むコンテンツが推薦される。
この結果、ユーザは、視聴したコンテンツのテーマに関連しつつも、多数の観点が含まれたコンテンツ群が網羅的に推薦されることにより、知識や思考の範囲を拡大させることができる。
【0011】
前記単語マップ比較部は、前記ユーザが選択したコンテンツに対する単語マップに含まれる単語のうち、重要度が相対的に高いと判定される重要語の少なくとも一部が共通し、かつ、単語マップ同士の距離が遠いコンテンツを優先的に抽出してもよい。
【0012】
この構成によれば、コンテンツ検索装置は、重要単語が共通しているため関連性が高く、かつ、単語マップ間の距離が遠いため視点が異なるコンテンツを優先して推薦できる。この結果、コンテンツ検索装置は、ユーザに適切なコンテンツを推薦できる。
【0013】
前記単語マップ比較部は、前記単語関係データにおける関係リンクの種類に基づいて、前記単語マップ同士の距離に重み付けを行ってもよい。
【0014】
この構成によれば、コンテンツ検索装置は、関係リンクの種類に基づいて、単語マップ同士の距離に重み付けを行うので、コンテンツ間の概念の相違をより正確に判定し、ユーザへコンテンツを適切に推薦できる。
【0015】
前記単語マップ生成部は、前記単語情報獲得部により抽出された単語のうち、所定の重要度に満たない単語を除外して、前記単語マップを生成してもよい。
【0016】
この構成によれば、コンテンツ検索装置は、単語マップを生成する際に、所定の重要度に満たない単語を除外する。したがって、コンテンツ検索装置は、コンテンツの内容とは関係の薄いノイズとなる単語を排除して、コンテンツ内容をより正確に表した単語マップを生成できる。
【0017】
前記重要度は、前記単語情報獲得部により抽出された単語に対するTF−IDFに基づく指標であってもよい。
【0018】
この構成によれば、コンテンツ検索装置は、TF−IDFに基づく指標を用いて、精度良く容易に単語の重要度を算出できる。
【0019】
前記重要度は、前記単語情報獲得部により抽出された単語に対する前記単語関係データにおける関係リンクの数に基づく指標であってもよい。
【0020】
この構成によれば、コンテンツ検索装置は、関係リンクの数に基づく指標を用いて、精度良く容易に単語の重要度を算出できる。
【0021】
本発明に係るコンテンツ検索装置は、ユーザ毎のコンテンツの選択履歴を記憶する履歴蓄積部を備え、前記単語マップ比較部は、前記選択履歴に含まれないコンテンツを優先的に抽出してもよい。
【0022】
この構成によれば、コンテンツ検索装置は、ユーザがコンテンツを視聴した選択履歴に含まれないコンテンツを優先的に推薦するので、ユーザが視聴したことのない、すなわちユーザが今まで接してこなかった概念を含むコンテンツを優先して推薦できる。
【0023】
本発明に係るコンテンツ検索装置は、前記単語関係データのうち、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、当該ユーザと関連付けて記憶する選択マップ蓄積部を備え、前記単語マップ比較部は、前記選択マップ蓄積部に記憶されている単語群と共通部分が少ない単語マップに対応するコンテンツを優先的に抽出してもよい。
【0024】
この構成によれば、コンテンツ検索装置は、ユーザが視聴したことのあるコンテンツに関する単語群との共通部分が少ない単語マップを抽出してコンテンツを推薦する。したがって、コンテンツ検索装置は、単語ネットワーク上でユーザが今まで接してこなかった単語を含む、すなわち概念の異なるコンテンツを優先して推薦できる。
【0025】
前記選択マップ蓄積部は、前記ユーザが選択したコンテンツに対する単語マップに合致する単語を、選択回数と共に記憶し、前記単語マップ比較部は、前記選択回数が少ない単語を含む単語マップに対応するコンテンツを優先的に抽出してもよい。
【0026】
この構成によれば、コンテンツ検索装置は、視聴したコンテンツに関する単語を選択回数と共に記憶し、この選択回数を平準化するように単語マップを選択するので、様々な概念のコンテンツを効率よく選択できる。
【0027】
本発明に係るコンテンツ検索装置は、前記単語関係データと、前記選択マップ蓄積部における前記ユーザ毎の単語データとの比較情報を生成する比較情報生成部を備えてもよい。
【0028】
この構成によれば、コンテンツ検索装置は、単語ネットワークとユーザが視聴したコンテンツから得られる単語群又は単語マップとの比較情報を生成し、出力できる。したがって、コンテンツ検索装置は、ユーザが頻繁に視聴している領域、及び視聴頻度の低い領域等をユーザに容易に把握させることができる。
【0029】
前記コンテンツ情報は、コンテンツに対するユーザの投稿文であってもよい。
【0030】
この構成によれば、コンテンツ検索装置は、コンテンツ情報として、ユーザの投稿文を採用できるので、情報量が増えると共に、投稿文にはユーザの思考が反映されるため、ユーザ毎にそれぞれ適したコンテンツが推薦される。
【0031】
本発明に係るコンテンツ検索方法は、複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータが、前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行する。
【0032】
本発明に係るコンテンツ検索プログラムは、複数の単語の関係を記述した単語関係データを含む単語ネットワーク、及びコンテンツ情報を参照可能なコンピュータに、前記コンテンツ情報に含まれる単語を抽出する単語情報獲得ステップと、コンテンツ毎に、前記単語情報獲得ステップにおいて抽出された単語に対して、前記単語関係データを付加した単語マップを生成する単語マップ生成ステップと、ユーザが選択したコンテンツに対する単語マップを、他のコンテンツに対する単語マップと比較し、当該他のコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する単語マップ比較ステップと、を実行させる。
【発明の効果】
【0033】
本発明によれば、ユーザが今まで接してこなかった概念を含むコンテンツが抽出される。
【図面の簡単な説明】
【0034】
図1】実施形態に係るコンテンツ推薦システムの構成を示すブロック図である。
図2】実施形態に係る単語ネットワークの一例を示す図である。
図3】実施形態に係る単語マップの生成処理を示す図である。
図4】実施形態に係る単語マップの比較処理例を示す図である。
図5】実施形態に係る番組推薦の一例を示す図である。
【発明を実施するための形態】
【0035】
以下、本発明の実施形態の一例について説明する。
本実施形態のコンテンツ推薦システム1は、コンテンツ視聴装置20によりユーザが視聴したコンテンツ(例えば、番組)と関連し、かつ、視聴したコンテンツとは異なる観点のコンテンツを、コンテンツ検索装置10(コンテンツ検索装置)が検索し、ユーザに対して推薦する。
【0036】
図1は、本実施形態に係るコンテンツ推薦システム1の構成を示すブロック図である。
コンテンツ推薦システム1を構成するコンテンツ検索装置10は、記憶部11と、制御部12とを備える。また、コンテンツ検索装置10は、コンテンツ視聴装置20と所定のネットワーク(例えば、インターネット)を介して接続されている。
【0037】
コンテンツ検索装置10は、ユーザのコンテンツ視聴履歴、及びコンテンツに対して行うレビュー等の投稿データを含むコンテンツ情報を用いて、新たにユーザに提示すべきコンテンツを抽出する。
【0038】
記憶部11は、ハードウェア群をコンテンツ検索装置10として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ROM、RAM、フラッシュメモリ又はハードディスク(HDD)等であってよい。具体的には、記憶部11は、本実施形態の各機能を制御部12に実行させるコンテンツ検索プログラムを記憶する他、単語ネットワーク蓄積部111と、コンテンツ蓄積部112と、履歴蓄積部113と、選択マップ蓄積部114とを備える。
【0039】
単語ネットワーク蓄積部111は、複数の単語の関係を記述した単語関係データを記憶する。この単語関係データは、既存のコーパスから作成される大規模データであり、自動で作成されてもよいし、管理者等により手動で作成されてもよい。
【0040】
図2は、本実施形態に係る単語ネットワークの一例を示す図である。
単語関係データは、単語間が関係リンクで結ばれた単語ネットワークを形成している。関係リンクには、単語同士が文書中で同時に出現する共起関係、一方の単語が他方の単語の原因又は結果を表す因果関係、一方の単語が他方の単語の上位又は下位概念である関係、同義語、類義語、対義語等が設定される。
なお、本実施形態において使用される単語ネットワークは、単語関係全てから構成されたものであってもよいし、一部のみを用いて構成されたものであってもよい。
【0041】
コンテンツ蓄積部112は、ユーザへ提供して視聴可能なコンテンツ、及びこれらのコンテンツに付随するコンテンツ情報を記憶する。コンテンツ情報は、コンテンツの内容を示すテキストデータであり、例えば、番組表データ、番組紹介データ、字幕又は文字放送データ等を含む。
【0042】
履歴蓄積部113は、ユーザ毎のコンテンツの選択履歴、すなわちユーザが視聴したコンテンツの履歴を記憶する。この履歴には、コンテンツを視聴した日時情報が含まれる。
【0043】
選択マップ蓄積部114は、単語関係データのうち、ユーザが視聴(選択)したコンテンツに対して生成された単語マップに合致する単語を、視聴したユーザと関連付けて、選択回数と共に記憶する。
【0044】
制御部12は、コンテンツ検索装置10の全体を制御する部分であり、記憶部11に記憶された各種プログラムを適宜読み出して実行することにより、本実施形態における各種機能を実現している。制御部12は、CPU(Central Processing Unit)であってよい。
【0045】
また、制御部12は、単語情報獲得部121と、単語マップ生成部122と、単語マップ比較部123と、コンテンツ提供部124と、比較情報生成部125とを備える。
【0046】
単語情報獲得部121は、コンテンツ視聴装置20又はコンテンツ蓄積部112から取得したコンテンツ情報に含まれる単語を抽出する。
ここで、コンテンツ視聴装置20は、ユーザ(U)がコンテンツ(C0)を選択して視聴・閲覧した際に、コンテンツ(C0)がユーザ(U)に視聴されたという情報と共に、コンテンツ(C0)に付与されているコンテンツ情報(CI0)を、コンテンツ検索装置10へ送信する。
【0047】
単語情報獲得部121は、コンテンツ視聴装置20から受信したコンテンツ情報(CI0)、及びコンテンツ蓄積部112から受け取ったコンテンツ情報(CI1〜n)のそれぞれに対して、単語分割して重要語を抽出する。
具体的には、単語情報獲得部121は、コンテンツ情報に含まれるテキストに対して形態素解析処理を行い、単語に分割する。さらに、単語情報獲得部121は、分割された単語それぞれに関して重要度算出処理を行い、各単語に重要度の値を付与する。単語情報獲得部121は、所定の重要度に満たない単語を除外して、重要語を抽出する。
【0048】
ここで、重要度は、例えば、単語分割により抽出された単語それぞれに対して、出現頻度に基づいて算出される指標(例えば、TF−IDF)である。
また、重要度は、例えば、単語分割により抽出された単語に対する単語関係データにおける関係リンクの数に基づく指標である。
【0049】
単語マップ生成部122は、単語ネットワーク蓄積部111に蓄積された単語ネットワークの情報を用いて、コンテンツ毎に、単語情報獲得部121により抽出された単語群に対して、単語関係データを付加した単語マップ(M0、M1〜n)を生成する。
【0050】
図3は、本実施形態に係る単語マップの生成処理を示す図である。
単語マップ生成部122は、単語情報獲得部121から得られた各単語が、単語ネットワーク上に存在するかどうかを検索する。単語ネットワーク上に存在した場合は、単語マップ生成部122は、これらの単語を取り出す。さらに、単語マップ生成部122は、単語ネットワーク上にこれらの単語間の関係リンクが存在した場合、これらの関係リンクも抽出する。
【0051】
例えば、単語情報獲得部121から得られた単語群がA,E,F,G,Jだった場合、単語マップ生成部122は、単語ネットワークから、これらの単語及び単語間に存在する関係リンクを抽出し、単語マップM0とする。
また、単語情報獲得部121から得られた単語群にはそれぞれ重要度が付与されているため、単語マップ生成部122は、この重要度を利用してフィルタリングし、重要度の高い単語A,E,Fのみを利用した単語マップM0’を生成してもよい。
【0052】
単語マップ比較部123は、ユーザが選択したコンテンツに対する単語マップを、コンテンツ蓄積部112に蓄積されている他のコンテンツに対する単語マップと比較し、これらのコンテンツの中から、単語マップの共通部分が少ないコンテンツを優先的に抽出する。
具体的には、単語マップ比較部123は、ユーザが選択したコンテンツに対する単語マップに含まれる単語のうち、重要度が相対的に高いと判定される重要語の少なくとも一部が共通し、かつ、単語マップ同士の距離が遠いコンテンツを優先的に抽出する。
【0053】
このとき、単語マップ比較部123は、単語関係データにおける関係リンクの種類に基づいて、単語マップ同士の距離に重み付けを行う。例えば、同義語又は類義語に比べて、対義語の関係にある単語間の距離は遠いと判定される。
【0054】
また、単語マップ比較部123は、履歴蓄積部113の視聴履歴に含まれないコンテンツを優先的に抽出する。さらに、単語マップ比較部123は、選択マップ蓄積部114に記憶されている単語群と共通部分が少ない単語マップに対応するコンテンツを優先的に抽出する。また、選択マップ蓄積部114に選択回数も記憶されている場合、単語マップ比較部123は、選択回数が少ない単語を含む単語マップに対応するコンテンツを優先的に抽出する。
【0055】
そして、単語マップ比較部123は、ユーザが視聴したコンテンツに対する単語マップM0に関し、コンテンツ蓄積部112に記憶されている他のコンテンツに対する単語マップM1〜Mnのそれぞれとのマップの比較を行い、距離が最も遠いものから順にランキングし、ランキングデータをコンテンツ提供部124に渡す。
【0056】
図4は、本実施形態に係る単語マップの比較処理例を示す図である。
まず、単語マップ比較部123は、コンテンツ情報CI0から生成された単語マップM0に含まれる1又は複数の重要単語を選択する。この重要単語は、例えば、単語情報獲得部121によって重要度が最も高く判定された単語、又は所定以上の重要度が付与された単語、あるいは、多数のユーザに視聴されたコンテンツに関する単語等である。
【0057】
この例では、重要単語として単語Aが選択されている。単語マップ比較部123は、コンテンツ蓄積部112のコンテンツ情報CI1〜CInから生成された単語マップM1〜Mnの中から、単語Aを含む単語マップを抽出する。この結果、単語マップM1及びM2が抽出された。
【0058】
ここで、M0とM1とでは、単語4つ(A,E,F,G)及び関係リンク3つ(a,g,h)が共通しており、M0とM2とでは、単語2つ(A,D)及び関係リンク1つ(b)が共通している。このことから、コンテンツ情報CI0とCI1とは共通する単語及び関係の数が多いので内容が近く、コンテンツ情報CI0とCI2とは共通する単語及び関係の数が少ないので内容が遠いと判定される。すなわち、コンテンツC1は、既に視聴されたコンテンツC0と類似した内容であり、コンテンツC2は異なった内容であると判定される。
【0059】
重要単語Aを共通して含んでいることから、C1及びC2は共通の話題に関したコンテンツであるが、C2はC0とは違った観点を多く含むコンテンツである可能性が高い。つまり、ユーザに対しては、C1に代えて、又はC1と共にC2を推薦することにより、視聴したコンテンツC0とは違った観点の内容を含んだコンテンツを提供し、ユーザの視点を広げることができる。
【0060】
コンテンツ提供部124は、単語マップ比較部123から取得したランキングデータに基づいて、単語マップM0との距離が遠い単語マップMxを選択し、この単語マップに対応するコンテンツCxを、ユーザへ提供又は推薦する。
【0061】
また、単語マップ比較部123は、履歴蓄積部113又は選択マップ蓄積部114を参照し、ユーザがまだ触れていない単語領域を効率的に埋めるためのコンテンツを優先的に抽出する。これにより、コンテンツ検索装置10は、様々な観点に基づいたコンテンツをユーザにバランス良く視聴させることができる。
【0062】
比較情報生成部125は、単語関係データと、選択マップ蓄積部114におけるユーザ毎の単語データとの比較情報を生成する。この比較情報を出力することにより、単語ネットワークにおけるユーザ毎の視聴範囲及び頻度が把握される。
【0063】
また、コンテンツ検索装置10は、ユーザがコンテンツを視聴する度に単語ネットワーク上の単語に対して重みを加算し、選択マップ蓄積部114に記憶していくことで、このユーザが視聴した領域、及び未知の領域が明確になる。比較情報生成部125は、これらの情報をユーザへ提示できる。
【0064】
図5は、本実施形態に係るコンテンツ推薦システム1を番組推薦に適用した一例を示す図である。
コンテンツ検索装置10は、例えば、VOD(Video On Demand)機能及び番組レビュー機能を備えたWebサイトの形態により実現される。
【0065】
ユーザは、自分の好みに合った番組C0を検索して視聴する。この際、ユーザは、視聴した番組C0に関してレビューを投稿する。また、各番組には、番組の概要等を示す番組関連情報が付与されている。コンテンツ検索装置10は、ユーザの視聴履歴、投稿データ及び番組関連情報を蓄積する。
【0066】
コンテンツ検索装置10は、大規模な言語資源(コーパス)から生成された単語ネットワークを蓄積している。コンテンツ検索装置10は、ユーザへ提供するための番組(C0〜Cn)が登録される際には、各番組の番組関連情報又は投稿データから抽出された単語を単語ネットワークと照合し、単語マップ(M0〜Mn)を生成する。
【0067】
ユーザが番組C0を視聴すると、コンテンツ検索装置10は、この番組C0に対応した単語マップM0の重要単語Kをキーとして、同一の重要単語Kを含む他の番組の単語マップを検索する。そして、コンテンツ検索装置10は、M0と検索の結果得られた単語マップとの比較を行い、共通する単語や関係リンクの数が少ないものから順に単語マップをランキングする。
【0068】
コンテンツ検索装置10は、ランキングの結果、最も共通単語及び関係リンクの数が少ない単語マップMxが抽出されると、この単語マップMxに対応した番組Cxをユーザに推薦する。コンテンツ検索装置10は、例えば、あるテーマ「増税」に関しての課題的側面(例えば、人件費削減、買い控え等)を扱った番組を視聴したユーザに対し、別の側面(例えば、福祉の向上等)を扱った番組を推薦することができ、ユーザの知識の幅を広げることが可能となる。
【0069】
また、コンテンツ検索装置10は、番組関連情報のみではなく、複数のユーザが番組C0に対して投稿したレビュー又はコメント等の投稿文を利用して単語マップを生成できる。これにより、ユーザの考えに含まれない新しい視点の番組を提供することが可能となる。
【0070】
なお、ユーザの投稿文を対象とする場合、コンテンツ蓄積部112には、各コンテンツに対してユーザが投稿したテキスト文が蓄積される。単語の抽出及び単語マップの生成に用いられる投稿データは、コンテンツ視聴中のユーザとは別のユーザのものであってよい。
このとき、多くのユーザに視聴されているコンテンツに関する単語マップは、単語間の重みが大きく設定されてもよい。これにより、多数のユーザが興味を持った領域の優先度が調整されるので、コンテンツ検索装置10は、他のユーザの嗜好に合わせる又は合わせないといった要求に従って、コンテンツの推薦順を制御できる。
【0071】
以上のように、本実施形態によれば、コンテンツ推薦システム1は、ユーザが視聴したコンテンツの情報から生成した単語マップと、他のコンテンツの情報から生成した単語マップとを比較し、互いに共通部分が少ないコンテンツを優先的に抽出する。したがって、視聴したコンテンツと関連しつつも、ユーザが今まで接してこなかった概念を含むコンテンツが推薦される。
このとき、コンテンツ推薦システム1は、重要単語が共通しているため関連性が高く、かつ、単語マップ間の距離が遠いため視点が異なるコンテンツを優先して推薦できる。
【0072】
また、コンテンツ推薦システム1は、関係リンクの種類に基づいて、単語マップ同士の距離に重み付けを行うので、コンテンツ間の概念の相違をより正確に判定し、ユーザへコンテンツを適切に推薦できる。
【0073】
また、コンテンツ推薦システム1は、単語マップを生成する際に、所定の重要度に満たない単語を除外する。したがって、コンテンツ推薦システム1は、コンテンツの内容とは関係の薄いノイズとなる単語を排除して、コンテンツ内容をより正確に表した単語マップを生成できる。
このとき、コンテンツ推薦システム1は、例えば、TF−IDF又は関係リンクの数等に基づく指標を用いて、精度良く容易に重要度を算出できる。
【0074】
また、コンテンツ推薦システム1は、ユーザがコンテンツを視聴した選択履歴を記憶し、選択履歴に含まれないコンテンツを優先的に推薦する。したがって、コンテンツ推薦システム1は、ユーザが視聴したことのない、すなわちユーザが今まで接してこなかった概念を含むコンテンツを優先して推薦できる。
【0075】
また、コンテンツ推薦システム1は、ユーザが視聴したコンテンツに対する単語マップに合致する単語を記憶し、これらの単語群との共通部分が少ない単語マップを抽出してコンテンツを推薦する。したがって、コンテンツ推薦システム1は、単語ネットワーク上でユーザが今まで接してこなかった単語を含む、すなわち概念の異なるコンテンツを優先して推薦できる。
さらに、コンテンツ推薦システム1は、視聴したコンテンツに関する単語を選択回数と共に記憶し、この選択回数を平準化するように単語マップを選択するので、様々な概念のコンテンツを効率よく選択できる。
【0076】
また、コンテンツ推薦システム1は、単語ネットワークとユーザが視聴したコンテンツから得られる単語群又は単語マップとの比較情報を生成し、出力できる。したがって、コンテンツ推薦システム1は、ユーザが頻繁に視聴している領域、及び視聴頻度の低い領域等をユーザに容易に把握させることができる。
【0077】
また、コンテンツ推薦システム1は、コンテンツ情報として、ユーザの投稿文を採用できる。これにより、情報量が増えると共に、投稿文にはユーザの思考が反映されるため、ユーザ毎にそれぞれ適したコンテンツが推薦される。
【0078】
以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、本実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、本実施形態に記載されたものに限定されるものではない。
【0079】
選択マップ蓄積部114には、前回若しくは所定回数の視聴履歴、特定期間(例えば、過去1週間)の視聴履歴、又は蓄積されている全期間の視聴履歴等を用いて、それぞれに対応した単語マップが生成され蓄積されてもよい。
このように、ユーザがコンテンツを視聴していく過程において、所定の期間に見たコンテンツに関連した単語が記録されることにより、比較情報生成部125は、単語ネットワーク上で所定の期間にユーザが既に視聴したコンテンツに関する領域、及び視聴されていない領域を出力できる。
【0080】
本実施形態において、単語マップを生成する際に使用するコンテンツ情報は、番組関連情報、番組に関する投稿文、又はこれらの組み合わせであってよい。
また、ユーザの視聴履歴を利用する場合、及びユーザの投稿文を利用する場合のいずれにおいても、コンテンツ推薦システム1は、ユーザが過去に視聴したコンテンツに関する単語マップと近い単語マップ及び遠い単語マップそれぞれに対応するコンテンツを提示してもよい。これにより、コンテンツ推薦システム1は、ユーザの関心が高い領域に近いコンテンツと、関心が低い領域のコンテンツとの双方を提示でき、ユーザの選択に合わせていずれかを提供できる。
【0081】
また、本発明に係るコンテンツ検索方法は、前述のWebサイトにより実現されるコンテンツ推薦システム1には限られず、例えば、スマートテレビ等における番組推薦機能として実装されてもよい。
さらに、本実施形態では、コンテンツとして、番組等の映像コンテンツを想定して説明したが、対象のコンテンツはこれには限られず、本発明は、コンテンツプロバイダによるコンテンツサービス全般の他、情報サービス全般及び実商品の小売サービス全般等で扱われる無形コンテンツ又は有形コンテンツに適用可能である。
【0082】
例えば、対象のコンテンツを「旅行ツアーの情報」とすると、コンテンツ推薦システム1は、ユーザが過去に選択した旅行ツアーの情報(概要、地名等)から単語マップを生成し、この単語マップと距離が離れている他の単語マップに対応したツアーを推薦してもよい。これにより、過去に行ったことのない、ユーザが新しいと思える旅行ツアーが推薦される。
また、例えば、対象コンテンツが有形の商品である場合、コンテンツ推薦システム1は、過去に購入した商品とは異なる視点の商品を推薦できる。
【0083】
本実施形態において、コンテンツ検索装置10が備える各部は、複数の装置に分散されてもよい。例えば、コンテンツ提供部124に相当するコンテンツ提供装置は、コンテンツ検索装置10からコンテンツのランキング情報を受信し、コンテンツ視聴装置20へ推薦コンテンツを提示する構成であってもよい。また、履歴蓄積部113は、コンテンツ提供装置又はコンテンツ視聴装置20等が備えてもよい。
【0084】
本実施形態では、主にコンテンツ検索装置の構成と動作について説明したが、本発明はこれに限られず、各構成要素を備え、ユーザに適切なコンテンツを推薦するための方法、又はプログラムとして構成されてもよい。
【0085】
さらに、コンテンツ検索装置の機能を実現するためのプログラムをコンピュータで読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。
【0086】
ここでいう「コンピュータシステム」とは、OSや周辺機器等のハードウェアを含むものとする。また、「コンピュータで読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD−ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。
【0087】
さらに「コンピュータで読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時刻の間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時刻プログラムを保持しているものも含んでもよい。また、上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【符号の説明】
【0088】
1 コンテンツ推薦システム
10 コンテンツ検索装置
20 コンテンツ視聴装置
111 単語ネットワーク蓄積部
112 コンテンツ蓄積部
113 履歴蓄積部
114 選択マップ蓄積部
121 単語情報獲得部
122 単語マップ生成部
123 単語マップ比較部
124 コンテンツ提供部
125 比較情報生成部
図1
図2
図3
図4
図5