(58)【調査した分野】(Int.Cl.,DB名)
前記推薦コンテンツ特定手段は、前記特徴量判定手段により特徴量が大きいと判定されたタームを含み、前記興味度判定手段により興味度が高いと判定されたタームを含むコンテンツを推薦コンテンツとして特定することを特徴とする請求項1に記載のコンテンツ推薦装置。
前記推薦コンテンツ特定手段は、前記特徴量判定手段により特徴量が小さいと判定されたタームを含み、前記興味度判定手段により興味度が高いと判定されたタームを含むコンテンツを推薦コンテンツとして特定することを特徴とする請求項1又は2に記載のコンテンツ推薦装置。
前記推薦コンテンツ特定手段は、前記特徴量判定手段により特徴量が大きいと判定されたタームを含み、前記興味度判定手段により興味度が低いと判定されたタームを含むコンテンツを推薦コンテンツとして特定することを特徴とする請求項1から3の何れか1項に記載のコンテンツ推薦装置。
前記推薦コンテンツ特定手段は、前記特徴量判定手段により特徴量が小さいと判定されたタームを含み、前記興味度判定手段により興味度が低いと判定されたタームを含むコンテンツを推薦コンテンツとして特定することを特徴とする請求項1から4の何れか1項に記載のコンテンツ推薦装置。
前記推薦コンテンツ特定手段は、前記コンテンツ検索手段により検索されたコンテンツのうち直近のコンテンツから順に推薦する推薦コンテンツとして特定することを特徴とする請求項1から5の何れか1項に記載のコンテンツ推薦装置。
ドキュメントを該ドキュメントが含まれるカテゴリごと、該ドキュメントに含まれるタームごとに体系化した第1のデータベースと、所定のタームに対するユーザの興味度を体系化した第2のデータベースと、に基づいてコンテンツを推薦するコンテンツ推薦方法であって、
コンピュータが、検索キーワードを用いてコンテンツを検索するステップと、
コンピュータが、前記検索されたコンテンツが有するドキュメントに含まれるタームを出現頻度に基づいて分類するステップと、
コンピュータが、前記分類されたタームの前記カテゴリにおける特徴量を、前記タームの特定の前記カテゴリにおける出現頻度を、特定のカテゴリに含まれる全てのタームの出現頻度に全ての前記カテゴリ中に含まれる前記タームの出現頻度を乗算した値で除算して算出することで、特定のタームに対する世間一般における注目度を示すものとして判定するステップと、
コンピュータが、前記分類されたタームごとの興味度を前記第2のデータベースに基づいて判定するステップと、
コンピュータが、前記特徴量及び前記興味度に基づいて前記検索されたコンテンツから推薦コンテンツを特定するステップと、
を含むことを特徴とするコンテンツ推薦方法。
ドキュメントを該ドキュメントが含まれるカテゴリごと、該ドキュメントに含まれるタームごとに体系化した第1のデータベースと、所定のタームに対するユーザの興味度を体系化した第2のデータベースと、に基づいてコンテンツを推薦する情報処理装置のプログラムであって、
検索キーワードを用いてコンテンツを検索する手順と、
前記検索されたコンテンツが有するドキュメントに含まれるタームを出現頻度に基づいて分類する手順と、
前記分類されたタームの前記カテゴリにおける特徴量を、前記タームの特定の前記カテゴリにおける出現頻度を、特定のカテゴリに含まれる全てのタームの出現頻度に全ての前記カテゴリ中に含まれる前記タームの出現頻度を乗算した値で除算して算出することで、特定のタームに対する世間一般における注目度を示すものとして判定する手順と、
前記分類されたタームごとの興味度を前記第2のデータベースに基づいて判定する手順と、
前記特徴量及び前記興味度に基づいて前記検索されたコンテンツから推薦コンテンツを特定する手順と、
をコンピュータに実行させることを特徴とするプログラム。
【発明を実施するための形態】
【0010】
本発明の実施形態のコンテンツ推薦装置について図面を用いて以下説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化乃至省略する。また、以下に記載する実施形態は本発明の最良の形態であって、本発明に係る特許請求の範囲を限定するものではない。
【0011】
なお、本実施形態における「コンテンツ」は、コンテンツという語句そのものが有する通常の意味に加え、例えば、映像、音楽、文章、又はそれらの組合せ等の、メディアが記録又は伝送し、人間が鑑賞するひとまとまりの情報をいい、実例でいえば例えばインターネットで配信されるアプリケーションやダウンロード可能な映像コンテンツ若しくは音楽コンテンツ等をいう。
【0012】
<本実施形態におけるコンテンツ推薦装置を含むシステム構成について>
本実施形態におけるコンテンツ推薦装置を含むシステム構成について
図1を参照して説明する。本実施形態のシステム構成は、コンテンツを推薦するコンテンツ推薦装置10とサーバ20とがネットワークを介して接続された構成となっている。ネットワークの形態としては、LANでもWANでもよく、また、有線によって接続されるものであっても、無線によって接続されるものであってもよい。
【0013】
コンテンツ推薦装置10は、後述する本実施形態による各処理を実行可能な例えばPC等の情報処理装置である。また、サーバ20は、例えばLANで接続された宅内サーバであっても、WANで接続された外部サーバであってもよい。なお、本実施形態においては、サーバを実現するハードウェアの総称として「サーバ」の用語を使用する。サーバ20は、例えばPCでもストレージでもサーバ専用機でもよい。
【0014】
また、本実施形態においては、サーバ20がコンテンツ推薦装置10の外部に接続されたシステム構成を用いて説明するが、コンテンツ推薦装置10がサーバの機能を有する構成であってもよい。なお、サーバ20は、ネットワークを介して外部から定期的に情報やデータを取得し、取得した情報やデータを所定の方式でデータベースとして蓄積しておくことが好ましい。サーバ20に蓄積されるデータベースの詳細については後述する。
【0015】
コンテンツ推薦装置10は、外部サーバ30から取得した複数のコンテンツについてサーバ20に蓄積された情報やデータに基づいてユーザ40の興味度等を分析して、ユーザ40に最適なコンテンツを推薦する。外部サーバ30は、例えばインターネット等により接続されたwebサーバ等であり、外部サーバ30から提供されるコンテンツは、例えばアプリケーションの形態で提供されるものであっても、画像データとして提供されるものであっても、映像若しくは音声の形態で提供されるものであっても、これらを組み合わせた形態で提供されるものであってもよい。
【0016】
<本実施形態におけるコンテンツ推薦装置のハードウェア構成について>
次に、本実施形態におけるコンテンツ推薦装置10のハードウェア構成について
図2を参照して説明する。コンテンツ推薦装置10は、ハードウェア構成として、CPU51と、RAM52と、ROM53と、NW I/F54と、HDD55と、入力部56と、出力部57を備えている。なお、これらは、コンテンツ推薦装置10が後述する機能(処理)を実行するための構成の一例を示したものであり、これら以外のハードウェアを排除するものではない。また、これらの構成を全て備える必要もない。例えば、HDD55は必須の構成ではない。
【0017】
CPU51は、コンテンツ推薦装置10における後述する各処理を実現するためのメイン制御部である。CPU51は、ROM53に格納された各処理を規定する処理プログラムがRAM52に読み込まれたものを実行することで、コンテンツ推薦装置10における各機能を実現する。
【0018】
RAM52は、上記のようにCPU51のワークメモリとして機能する記憶部である。ROM53は、上記のように各処理を規定した処理プログラムやその他コンテンツ推薦装置10の制御に要する各種パラメータ等を記憶する記憶部である。
【0019】
NW I/F54は、
図1に示した外部サーバ30と接続するためのネットワークインタフェースである。HDD55は、コンテンツを記憶する大容量記憶部である。
【0020】
入力部56は、例えばキーボードやマウス等の入力デバイスである。また、後述する表示部に重畳されたタッチパネルのようにユーザのタッチ操作を受け付けるデバイスであってもよい。さらに、入力部56には、映像を撮影することで画像を取得するカメラや、音声入力を受け付けるマイクが含まれてもよい。
【0021】
出力部57は、例えばディスプレイ等の表示部である。また、出力部57には、音声を出力するスピーカが含まれてもよい。
【0022】
<本実施形態におけるコンテンツ推薦装置の機能ブロックについて>
次に、本実施形態におけるコンテンツ推薦装置10の機能ブロックについて
図3を参照して説明する。コンテンツ推薦装置10は、第1のデータベース21と、第2のデータベース22と、特定手段11と、検索キーワード抽出手段12と、コンテンツ検索手段13と、分類手段14と、特徴量判定手段15と、興味度判定手段16と、推薦コンテンツ特定手段17を備える。
【0023】
第1のデータベース21は、ドキュメントを該ドキュメントが含まれるカテゴリごと、ドキュメントに含まれるタームごとに体系化したデータベースである。本実施形態において「ドキュメント」とは、例えばwebサイトを構成する文書データ等をいう。また、本実施形態において「ターム」とは、ドキュメントに出現する単語のことをいい、第1のデータベース21は、このタームを例えば形態素解析等によりドキュメントから抽出する。
【0024】
第2のデータベース22は、所定のタームに対するユーザの興味度を体系化したデータベースである。所定のタームに対する興味度は、例えば、所定のタームを含むコンテンツの閲覧履歴や、閲覧コンテンツに対するユーザによる特定の操作履歴等に基づいて、その高低が判定できるように付与されたポイント等により判定できればよい。なお、これらのデータベースについて「第1の」「第2の」としたのは便宜的なものであり、いずれかが優位である等の優劣や序列を規定するものではなく、それぞれのデータベースを区別できるようにするためでしかない。
【0025】
特定手段11は、ネットワークを経由して取得したドキュメントのカテゴリや、該ドキュメントに含まれるタームを前記第1のデータベースに基づいて特定する手段である。ここで取得するドキュメントとは、ネットワークを介して閲覧するコンテンツに含まれる文書データ等である。なお、タームを特定するとは、例えばタームの出現頻度やタームに対する世間一般の注目度等を特定することをいう。つまり、第1のデータベース21は、個々のタームに関する各タームを特徴づける情報を各タームと共に蓄積する。これにより、取得したドキュメントのカテゴリを特定するとともに、取得したドキュメントに含まれるタームの詳細を特定することができる。
【0026】
検索キーワード抽出手段12は、特定手段11により特定されたドキュメントのカテゴリやタームに関連するタームを検索キーワードとして抽出する手段である。ドキュメントのカテゴリやタームに関連するタームを検索キーワードとして検索することにより、取得したドキュメントに関連する情報を検索することができる。
【0027】
コンテンツ検索手段13は、検索キーワード抽出手段12により抽出された検索キーワードを用いてコンテンツを所定のコンテンツサーバ等において検索する手段である。なお、コンテンツ検索手段13は、検索キーワード抽出手段12により複数の検索キーワードが抽出された場合は、複数の検索キーワードのうち、1つの検索キーワードごとに検索処理を行っても、複数の検索キーワードを用いてAND検索やOR検索を行ってもよい。
【0028】
分類手段14は、コンテンツ検索手段13により検索されたコンテンツが有するドキュメントに含まれるタームを出現頻度に基づいて分類する手段である。分類の手法としては、例えば出現頻度の高いものからランク付けにより行っても、出現頻度が同程度のタームを一纏めにして分類しても、その他の所定の法則で分類可能な形態で行ってもよい。かかる分類により、検索コンテンツにおけるタームの出現傾向を把握することが可能になる。なお、ドキュメントからタームを抽出する手法については、上述したように例えば形態素解析等により行えばよい。
【0029】
特徴量判定手段15は、分類手段14により分類されたタームのカテゴリにおける特徴量を判定する手段である。タームのカテゴリにおける特徴量は、そのタームの特定のカテゴリにおける出現頻度(これを「P1」とする。)を、特定のカテゴリに含まれる
ターム全体の出現頻度(これを「P2」とする。)に全カテゴリ中に含まれるタームの出現頻度(これを「P3」とする。)を乗じたもので除すること(数式で表すと「P1/(P2×P3)」となる)により算出することができる。これにより、特定のタームに対する世間一般における注目度を判定することができる。つまり、カテゴリにおける特徴量が大きいタームは、世間一般における注目度が高く、カテゴリにおける特徴量が小さいタームは、世間一般における注目度が低いということが分かる。また、上記算出により、カテゴリを特徴づけるものではないが頻度高く出現する、例えば助詞や日時等の一般的な単語が多く含まれている場合であっても、これらに影響することなく適切なタームを判定対象として選定することができる。
【0030】
興味度判定手段16は、分類手段14により分類されたタームごとの興味度を第2のデータベース22に基づいて判定する手段である。分類されたタームに対する興味度が高ければ、そのタームを含むコンテンツはユーザが興味ある情報である可能性が高い。
【0031】
推薦コンテンツ特定手段17は、上記のカテゴリにおける特徴量や興味度に基づいてコンテンツ検索手段13により検索されたコンテンツから推薦コンテンツを特定する手段である。コンテンツ(ドキュメント)に含まれるタームのカテゴリにおける特徴量が大きく、当該タームの興味度が高ければ、そのタームを含むコンテンツはよりユーザが得たい情報ということになり、このようなコンテンツを推薦することがユーザにとって有益である。推薦コンテンツ特定手段17による詳細な処理内容については後述する。
【0032】
<本実施形態における推薦コンテンツの特定処理について>
次に、本実施形態における推薦コンテンツの特定処理について
図4を参照して説明する。
図4は、縦軸に「タームの特徴量」「興味度」をとり、横軸にカテゴリとしてアイドルグループ名の一例を示す「NKB」、アイドルの氏名の一例を示す「○原△由」、特定のニュースカテゴリの一例を示す「××情勢」、特定のトピックの一例を示す「次世代カー」をとったものである。なお、これらのカテゴリは一例に過ぎない。なお、タームの特徴量は上述したカテゴリにおける特徴量をいい、興味度はタームに対する個人の興味度をいう。
【0033】
そして、推薦コンテンツ特定手段17は、特徴量判定手段15により特徴量が大きいと判定され、興味度判定手段16により興味度が高いと判定された「NKB」を含むコンテンツを推薦コンテンツとして特定する。これにより、ユーザは最も欲しいと思っている情報を推薦することが可能になる。
【0034】
また、推薦コンテンツ特定手段17は、特徴量判定手段15により特徴量が小さいと判定されても、興味度判定手段16により興味度が高いと判定された「○原△由」を含むコンテンツを推薦コンテンツとして特定することとしてもよい。特徴量が小さくても、興味度が高いものを推薦すれば、ユーザにとっては有益である。
【0035】
また、推薦コンテンツ特定手段17は、特徴量判定手段15によりタームの特徴量が大きいと判定され、興味度判定手段16により興味度が低いと判定された「××情勢」を含むコンテンツを推薦コンテンツとして特定することとしてもよい。興味度が低いカテゴリでも、特徴量が大きいコンテンツについては、推薦しなければユーザに不利益を及ぼす場合も考えられるため、このようなコンテンツも推薦することがユーザに有益である。
【0036】
また、推薦コンテンツ特定手段17は、特徴量が小さいと判定され、興味度判定手段16により興味度も低いと判定された「次世代カー」を含むコンテンツを推薦コンテンツとして特定することとしてもよい。このようなコンテンツはユーザが欲しくない情報である可能性は高い。他方、このようなコンテンツでも、ユーザがこれまでに全く無関心で知らない情報である場合が考えられる。よって、このようなコンテンツでも場合によってはユーザに有益である。具体的には、例えば上記「次世代カー」等のようにニュース性の高いトピックタームを含むコンテンツである。
【0037】
なお、推薦コンテンツ特定手段17は、コンテンツ検索手段13により検索されたコンテンツのうち直近のコンテンツから順に推薦する推薦コンテンツとして特定することとしてもよい。これにより、情報の鮮度が高いコンテンツを優先的に推薦することが可能である。直近であるか、すなわち鮮度の高い情報であるか否かは、コンテンツ検索手段13により所定のコンテンツサーバにおいて検索キーワードを用いてコンテンツを検索した際の検索結果に基づいて特定される。例えば、ファイルのタイムスタンプ、配信日情報、サーバ登録日等の、コンテンツに付加された時間情報に基づいて鮮度の高い情報であるか否かを特定してもよい。また、コンテンツサーバの検索ランキングに基づいて鮮度の高い情報であるか否かを特定してもよい。例えば、日付順であったり、アクセスランキングであったり、販売数量等に基づいたランキングであってもよい。時間情報に限らず、タイムリーな人気度や注目度であっても、鮮度の高い情報であるか否かを特定することが可能である。
【0038】
また、推薦コンテンツ特定手段17は、コンテンツ検索手段13により検索されたコンテンツのうち取得したドキュメントとの類似度が高いコンテンツを推薦コンテンツとして特定することとしてもよい。検索されたコンテンツと取得したドキュメントとの類似度は、取得したドキュメントに含まれるタームがコンテンツに一定数以上含まれているか、検索されたコンテンツのカテゴリと取得したドキュメントのカテゴリが一致又は関連するか等により判定することが可能である。より具体的には、例えばドキュメントから特定された検索キーワードとコンテンツとの類似度を計算することに得た計算結果に基づいて判定すればよい。なお、カテゴリが関連するとは、例えば「経済」と「金融」や、「自動車」と「原油高」等である。検索されたコンテンツのカテゴリについては、例えば、コンテンツ自体がデータとして有しているものによって判断しても、コンテンツ推薦装置10側で検索されたコンテンツ中に含まれる特定のタームの出現頻度等から判断することとしてもよい。カテゴリの関連性については、例えば予め関連すると推定されるものをグループ分けしておき、このグループ化された中の情報を元に判定する等の手法をとってよい。
【0039】
<本実施形態におけるコンテンツ推薦処理手順について>
本実施形態におけるコンテンツ推薦処理手順について
図5を参照して説明する。まず、特定手段11は、取得したドキュメントのカテゴリと、そのドキュメントに含まれるタームを特定する(ステップS1)。
【0040】
次に、検索キーワード抽出手段12は、特定手段11により特定されたカテゴリやタームに関連するタームを検索キーワードとして抽出する(ステップS2)。
【0041】
そして、コンテンツ検索手段13は、検索キーワード抽出手段12により抽出された検索キーワードを用いてコンテンツを検索する(ステップS3)。
【0042】
続いて、分類手段14は、検索されたコンテンツ内のドキュメントに含まれるタームのそれぞれをそれぞれの出現頻度に基づいて分類する(ステップS4)。
【0043】
特徴量判定手段15は、分類されたタームのカテゴリにおける特徴量を判定する(ステップS5)。
【0044】
また、興味度判定手段16は、第2のデータベース22に基づいて、分類されたタームごとの興味度を判定する(ステップS6)。
【0045】
そして、推薦コンテンツ特定手段17は、特徴量判定手段15により判定された特徴量、興味度判定手段16により判定された興味度に基づいて、推薦コンテンツを特定する(ステップS7)。
【0046】
なお、上述する各実施の形態は、本発明の好適な実施の形態であり、本発明の要旨を逸脱しない範囲内において種々変更実施が可能である。例えば、上述した本実施形態のコンテンツ推薦装置、又はこれを含むシステムにおける各処理を、ハードウェア、又は、ソフトウェア、あるいは、両者の複合構成を用いて実行することも可能である。
【0047】
なお、ソフトウェアを用いて処理を実行する場合には、処理シーケンスを記録したプログラムを、専用のハードウェアに組み込まれているコンピュータ内のメモリにインストールして実行させることが可能である。あるいは、各種処理が実行可能な汎用コンピュータにプログラムをインストールして実行させることが可能である。
【0048】
また、上述した本実施形態の説明においては、外部サーバ30からインターネット等のネットワークを介してコンテンツを取得する形態を中心として説明したが、本発明は次のようなシステムにも適用可能である。例えば、ユーザが所有するデジタルテレビと、これに接続されたデジタル放送局の端末で構成されるシステムにも本発明は適用可能である。すなわち、ユーザがあるテレビ番組を視聴中であるとき、当該テレビ番組の放送波と共に配信されるデータ内のタームを分析し、タームの特徴量と当該タームに対するユーザの興味度に基づいて別の番組を推薦することとしてもよい。あるいは、インターネット等とリンクさせることで、テレビ番組に含まれるタームに関連する商品等を推薦するという利用シーンにも適用することが可能である。
【0049】
また、ユーザごとに例えばNFC等の近距離無線通信が可能な端末を所持させ、コンテンツ推薦装置10が近距離無線通信を介して認証された特定のユーザに対してコンテンツを推薦することとしてもよい。これにより、より個人の興味度に特化したコンテンツを推薦することが可能になる。