(58)【調査した分野】(Int.Cl.,DB名)
前記文字列に対する前記ユーザの興味度は、前記ユーザの嗜好を反映した視聴履歴に基づいて機械学習により作成された文字列に対する興味度であることを特徴とする請求項1に記載の情報処理装置。
前記文字列に対する前記ユーザの興味度は、前記文字列に対する興味度と前記文字列の順位との関係のうち、少なくとも非線形領域を正規化することにより推定されることを特徴とする請求項1又は2に記載の情報処理装置。
前記得られたお勧め度に対し、前記閾値設定手段により設定された閾値に基づいて、所定のジャンル興味度が設定されたジャンルに属するコンテンツの、全ジャンルのコンテンツに占めるお勧め割合を推定する手段をさらに含むことを特徴とする請求項1から3の何れか1項に記載の情報処理装置。
【発明を実施するための形態】
【0020】
次に、本発明を実施するための形態について図面を参照して詳細に説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化乃至省略する。本発明の内容を簡潔に説明すると、コンテンツのジャンル毎に予め設定された設定興味度と、コンテンツの視聴により推定された推定興味度とを合成する合成手段と、合成により、推定興味度に対する設定興味度のジャンルに属するコンテンツのお勧め度を生成する生成手段と、任意の設定興味度を有するジャンルに属するコンテンツの、全ジャンルのコンテンツに占めるお勧め割合を決定するための閾値を、生成されたお勧め度に対して設定する設定手段と、を含むことにより、ユーザの嗜好にフレキシブルに対応したコンテンツを推薦することができるのである。
【0021】
すなわち、ユーザが設定したコンテンツのジャンル毎の興味度に応じた非線形の数式で、自動的に学習した興味度の推定値を変換している。この変換において、自動的に学習した興味度の推定値の分布を制御することを目的としている。そして、ジャンルに対する興味度に対して平均的なお勧め度を生成する場合と比較して、ジャンルに対する興味度が設定されたコンテンツが、全ジャンルのコンテンツに対してどれくらいの割合でお勧めされるかを決定するために閾値を設けることとしている。要するに、どれくらいの重み付け(傾斜)をつけてジャンルに対する興味度毎にお勧め度を生成するかを決定するために閾値を設けることとしている。
【0022】
まず、本発明の実施形態における情報処理装置を含む情報処理システム全体の構成について説明する。
図1は、本発明の実施形態における情報処理装置を含む情報処理システム全体の構成を示す図である。
図1を参照すると、本発明の実施形態における情報処理装置を含む情報処理システム10は、例えば、パーソナルコンピュータ(以下、PCともいう。)を一例とする情報処理装置200が、インターネット等の広く公衆によって接続可能なネットワーク300を介してWebサーバ400に接続されている。また、PC200は、放送局100から送信される放送波や、Webサーバ400から送出されるコンテンツを受信することができるようになっている。なお、情報処理装置200には、PC以外に図示しないスマートフォン等の携帯情報端末も含まれることは勿論である。
【0023】
また、Webサーバ400は、PC200、及び図示しないスマートフォン等と、インターネット等のネットワーク300を介して接続されている。そして、PC200、及び図示しないスマートフォン等から発せられた任意のWebページに接続したい旨のアクセス要求に対して、URL(Uniform Resource Locator)で特定されたWebサーバ400から提供されるWebページの閲覧が可能となる。なお、
図1中には、インターネット等のネットワーク300に対してPC200のみ接続されているが、情報処理装置は1台に限定されず、複数台接続されていることはいうまでも無い。
【0024】
次に、本発明の実施形態における情報処理装置の全体構成について説明する。
図2は、本発明の実施形態における情報処理装置の全体構成について説明する概略ブロック図である。PC200は、TVチューナ部201と、ネットワーク接続部205と、CPU(Central Processing Unit)206と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、HDD(Hard Disk Drive)204と、表示部207と、入力部208と、電源部209とから構成される。
【0025】
TVチューナ部201は、放送局100(
図1)から送信される地上デジタル、BS(Broadcasting Satellite)、及びCS(Communications Satellite)放送をアンテナから受信し復調するものである。ネットワーク接続部205は、インターネットに代表されるネットワーク300に接続され、ネットワーク300とのインタフェースを図るものである。CPU206は、PC200全体の動作を制御するものであり、ROM202に格納された制御プログラムをロードし、PC200の動作によって得られた様々なデータをRAM203に展開するものである。HDD204は、PC200のアプリケーションソフトウェアプログラムを格納したり、TVチューナ部201によって受信されたテレビ番組や、Webサーバ400から送出されるコンテンツ(以下、これ等をまとめてコンテンツともいう。)を録画したりするものである。
【0026】
表示部207は、LCD(Liquid Crystal Display)等で構成される表示画面であり、PC200によって実行されたアプリケーションソフトウェアプログラムの結果やTVチューナ部201によって受信されたテレビ番組、及びWebサーバ400から受信したコンテンツを表示するものである。入力部208は、キーボード、マウス、タッチパネル等、ユーザがPC200に対して指示を与えるものである。そして、電源部209は、PC200に対してAC(Alternative Current:交流)、又はDC(Direct Current:直流)電源を与えるものである。
【0027】
次に、本発明の実施形態におけるWebサーバの全体構成について説明する。
図3は、本発明の実施形態におけるWebサーバの全体構成について説明する概略ブロック図である。Webサーバ400は、ネットワーク接続部403と、CPU404と、ROM401と、データベース部402と、表示部405と、操作部406と、電源部407とから構成される。
【0028】
ネットワーク接続部403は、インターネットに代表されるネットワーク300(
図1)に接続され、ネットワーク300とのインタフェースを図るものである。CPU404は、Webサーバ400全体の動作を制御するものであり、ROM401に格納された制御プログラムをロードし、CPU404の動作によって得られた様々なデータをデータベース部402に展開したり、後述するように、ユーザの嗜好に合致するコンテンツを送出したりするものである。表示部405は、LCD等で構成される表示画面であり、Webサーバ400によってデータベース部402に格納されたデータの格納状況等を表示するものである。操作部406は、キーボード、マウス、タッチパネル等、Webサーバ400の保守者が、Webサーバ400に対して指示を与えるものである。そして、電源部407は、Webサーバ400に対してAC又はDC電源を与えるものである。
【0029】
次に、本発明の実施形態における情報処理装置の機能ブロックについて説明する。
図4は、本発明の実施形態における情報処理装置の機能ブロック図である。
【0030】
図4において、PC200は、放送局100(
図1)から送信される放送波を受信する複数のチューナ部210、211、212、及び213と、チューナ部210、211、212、及び213により復調されたテレビ番組や、Webサーバ400から送出されるコンテンツを記録し再生するするコンテンツ記録再生部214と、放送局100から送信される電波の隙間を使って送信される電子番組ガイド(EPG)を管理するEPG情報管理部217と、液晶(LCD)等のディスプレイ221にテレビ番組やコンテンツを表示する動画表示処理部215と、を含んで構成されている。なお、チューナ部の数は、4個に限定されないことは勿論である。
【0031】
また、ディスプレイ221には、ライブ放送されているテレビ番組の画面、録画されたテレビ番組の再生画面、録画されたテレビ番組の一覧表、Webサーバ400から受信するコンテンツが表示されることは勿論であるが、後述するEPG情報管理部217により取得された、過去に放送された番組、現在放送されている番組、又は今後放送される予定の番組の番組表も表示される。また、テレビ番組とFacebook(登録商標)画面とを並べて表示したり、Facebook画面をテレビ画面のバックグラウンドで表示したりすることも可能である。
【0032】
さらに、PC200は、インターネット等の公衆に利用可能なネットワーク300(
図1)を介してWebサーバ400に接続するためのネットワーク接続処理部220と、チューナ部210、211、212、及び213により受信されたテレビ番組や、Webサーバ400から取得されたコンテンツに対するユーザの視聴履歴に基づいて、文字列(ワード、単語)を取得し記録する動画情報取得記録部219と、EPG情報管理部217から送信される電子番組表、及び興味情報取得部218を介して設定されたコンテンツのジャンル毎の興味度と、受信されたユーザの視聴履歴に基づいて機械学習により作成した文字列(ワード、単語)に対する興味度と順位との関係を正規化したものとの間で所定の演算を実行し、お勧め度を解析する映像解析処理部216と、映像解析処理部216で解析されたお勧め度をディスプレイ221に表示する動画表示処理部215と、PC200の動作を遠隔操作するリモコン222と、を含んで構成されている。
【0033】
次に、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の設定について説明する。
図5は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の設定について説明する図である。
【0034】
図5に示すように、PC200のユーザは、チューナ部210、211、212、及び213を介して受信されるテレビ番組について、番組ジャンル501と各番組ジャンルに対する興味度502とを設定することができる。番組ジャンル501は、ニュース/報道、スポーツ、情報/ワイドショー、ドラマ、音楽、バラエティ、映画、アニメ/特撮、ドキュメンタリー/教養、劇場/公演、趣味/教育、福祉といった12ジャンルに分類されている。このジャンル分けは、ARIB(Association of Radio Industries and Business:社団法人電波産業界)で定められたジャンル分類にしたがっているが、これ以外にも任意のジャンル分類を用いることができる。また、興味度502は、興味なし(0)から興味あり(4)の5段階で設定することができる。
【0035】
図5の例では、ニュース/報道は興味度1、スポーツは興味なし(0)、情報/ワイドショーは興味度1、ドラマは興味度2、音楽は興味あり(4)、バラエティは興味度2、映画は興味度3、アニメ・特撮は興味度3、ドキュメンタリー/教養は興味度2、劇場/公演は興味度3、趣味/教育は興味度1、福祉は興味なし(0)、にそれぞれ設定されている。この各番組ジャンルに対する興味度の設定は、ユーザがPC200を購入した直後、又はユーザがPC200を購入後、ある一定期間コンテンツを視聴した後に設定するようにしても良い。そして、この各番組ジャンルに対する興味度の設定は、表示部207に
図5に示す画面が表示された状態で、興味情報取得部218(
図4)に対してユーザがPC200の入力部208を用いて行うようにする。
【0036】
次に、本発明の実施形態における情報処理装置において視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係について説明する。
図6は、本発明の実施形態における情報処理装置において視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を示す図である。
【0037】
図6に示すように、ユーザの嗜好を反映した視聴履歴に基づいて機械学習(マシンラーニング)により作成した文字列に対する興味度、換言すれば、視聴履歴に含まれる文字列(ワード、単語)を分析評価することにより得られた当該文字列(ワード、単語)に対する興味度を縦軸に、順位を横軸にとる。
図6において、文字列に対する興味度が平均値にあるとき機械学習による順位は略網羅されるが、文字列に対する興味度が極端に大きくなるに連れて機械学習による順位は低下して飽和状態となり、文字列に対する興味度が極端に小さくなるに連れて機械学習による順位は増大して飽和状態となる。
【0038】
ここで、機械学習(マシンラーニング)について若干説明する。本実施形態では、お勧め度を生成する計算過程において、文字列による興味度推定アルゴリズムを利用している。文字列による興味度推定アルゴリズムは、電子番組ガイド(EPG)から取得される番組の概要や人名といった文字列情報から、ユーザの興味度を推定するものである。この推定は、例えば、TF/IDF(Term Frequency Inverse Document Frequency)、ナイーブベイズ、ベクトル空間法、サポートベクタマシン等、公知の機械学習(マシンラーニング)を用いて行っている。本実施形態では、
図6に示した文字列に対する興味度と順位との関係のうち、非線形領域(飽和状態となっている領域)だけでなく、線形領域(文字列に対する興味度が略平均値にある非飽和領域)をも用いてコンテンツの推薦を行うことにより、推薦数の自由度を高めている。
【0039】
次に、
図6で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化したものについて説明する。
図7は、
図6で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化した図である。
【0040】
図7において、
図6における非線形曲線を線形式で正規化すると、
図7の曲線Cに示すように、順位の平均値である0.5を中心として歪んでいる。本実施形態では、(0、1)の正規化を行うことにより、曲線Cを直線Dに近くなるように計算し変換している。そうすると、順位0.9の点を境として文字列に対する興味度が、約9対1に分割される。このように直線Dに近似しておけば、直線Dから超えた曲線Cの部分の長さは、全体に占める番組数と合い易くなる。
【0041】
次に、本発明の実施形態における情報処理装置のお勧め度計算アルゴリズムについて説明する。
図8は、本発明の実施形態における情報処理装置のお勧め度計算アルゴリズムについて説明する機能ブロック図である。
【0042】
図8に示すように、本実施形態の対象となるお勧め度計算アルゴリズム804は、1週間分の電子番組ガイド(EPG)801と、
図5で説明したジャンル興味度802と、閾値803とを入力とし、最終的に閾値以上のお勧め度付き番組リスト806を出力するものである。1週間分のEPG801は、EPG情報管理部217(
図4)によりテレビ放送の各番組の情報を格納したテーブルである。番組毎にタイトル、ジャンル、放送日時、放送局、その他のテキスト情報を保持する。
【0043】
ジャンル興味度802は、
図5において説明したように、明示的にユーザが各ジャンルに対して設定した興味度である。“ドラマ”、“ニュース/報道”、“バラエティ”等の各ジャンルに対して、興味度を段階的に設定可能なものとする。
【0044】
閾値803は、ジャンルに対する興味度毎に生成されたお勧め度に対する切り捨て位置(お勧め度の割合)を設定するものである。この閾値に関して、お勧め度計算アルゴリズム804と相関性を持たせることも本実施形態の特徴である。お勧め度計算アルゴリズム804は、本実施形態の主眼となる機能であり、お勧め度計算アルゴリズム804の計算過程において、
図7で説明した文字列による興味度推定アルゴリズム805を利用する。
【0045】
なお、1週間分の電子番組ガイド(EPG)801は、EPG情報管理部217(
図4)によって取得された後、RAM203(
図2)に格納され、ジャンル興味度802、及び閾値803は、入力部208を用いて入力された後、HDD204に格納される。文字列による興味度推定アルゴリズム805、及びお勧め度計算アルゴリズム804は、CPU206によって実行され、閾値以上のお勧め度付き番組リスト806は、HDD204又はRAM203に格納される。
【0046】
次に、本発明の実施形態における情報処理装置の動作について説明する。
図9は、本発明の実施形態における情報処理装置の動作について説明するフローチャートである。
【0047】
本実施形態のお勧め度計算アルゴリズムは、特に興味度の正規化手順を有すること、ジャンル興味度による非線形変換を有することを特徴としている。また、足切りに用いる閾値設定も、本実施形態の特徴である。以下、動作の流れについて説明する。
【0048】
図9において、まず、ステップ(以下、Sという。)901の処理では、文字列による番組の興味度が計算される。具体的には、
図6で説明したような、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係が求められる。S902の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S902:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S902:YES)と判断されると、S903の処理へ移行する。
【0049】
S903の処理では、興味度の正規化が行われる。具体的には、
図7で説明したような、
図6で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化する処理である。興味度の正規化は、文字列による番組の興味度の推定値に対して、最大値を1、平均値を0.5、最小値を0とするような変換を行う。以後の計算の精度のためには、まず第1に、最大値、平均値、最小値は、直近のある期間の統計量を用いることである。例えば、TF/IDFやナイーブベイズを用いた演算の場合、理論的な最大/最小を規定することができないので、学習状況や番組表の状況に応じて、異なる統計量となる。状況に応じて最適に制御するためには、ある期間での統計量を用いることが望ましい。
【0050】
第2に、非線形な変換を用いて、正規化後の興味度の分布を一様分布に近づけることである。一様分布から大きく離れる場合、ジャンル興味度を用いた非線形変換による分布の制御が困難となるからである。
【0051】
S904の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S904:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S904:YES)と判断されると、S905の処理へ移行する。
【0052】
S905の処理では、ジャンル興味度による非線形変換が行われる。ジャンル興味度による非線形変換は、
図10に示すように正規化された文字列による興味度を非線形に変換する操作である。入力、出力共に、0−1の範囲を領域とするが、ジャンル興味度により、分布が制御される。変換式のイメージを
図10に示す。
図10は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係を示す図である。
【0053】
ジャンル興味度は1から3で、数値が大きいほど興味があるものとする。
図10では、興味度3の変換式で生成されるお勧め度は高い方向に、興味度1の変換式で生成されるお勧め度は低い方向に、分布が移動することが分かる。また、興味度3の変換式で生成されるお勧め度は、正規化済み文字列に対する興味度が少しでも高くなればお勧め度は高くなり、興味度1の変換式で生成されるお勧め度は、正規化済み文字列に対する興味度が高くならない限り、お勧め度は高くならない。興味度1の変換式で生成されるお勧め度は、視聴履歴中に非常に興味度が高い文字列(ワード、単語)が書かれている番組に対しては高くなる傾向にある。したがって、ジャンル興味度が低いジャンルに属するコンテンツであっても、当該コンテンツに関連する派生コンテンツに対する視聴履歴に基づいて機械学習により作成された正規化文字列に対する興味度が高ければ、お勧め度が高くなるため、録画対象に成り易くなる。
【0054】
分布を制御するため、ジャンル興味度が1(興味度1の変換式)であっても、正規化済み文字列による興味度推定値が十分高い場合には、お勧め度として上位に入ることができる。このような変換式は、べき乗や、座標点(0、0)、(1、1)を通る円弧形状等、複数想定される。何れの場合であっても類似する効果を与えることが可能である。このように、
文字列による興味度推定値を、
ジャンルに対する興味度を用いて変換し、順位を振り直している。その際、文字列による興味度を正規化し、番組の属するジャンルに設定されている興味度に応じてさらにお勧め度を上下させているのである。
【0055】
図9に戻り、S906の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S906:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S906:YES)と判断されると、S907の処理へ移行する。
【0056】
S907の処理では、お勧め度によるソートが行われる。具体的には、
図10に示すように、お勧め度の高い方から低い方へソートが行われ、お勧め度が生成される。S908の処理では、閾値による足切り処理が行われる。閾値設定方法のイメージを
図11に示す。
図11は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係に対して閾値を設定したときの状態について説明する図である。
【0057】
各興味度に対応するコンテンツが、全ジャンルのコンテンツに対して平均的な割合で録画されるように閾値を設定する場合、正規化済みの文字列に対する興味度が0.5の場合の、各興味度における変換式の値を閾値に設定すれば良い。この場合、閾値は、閾値1、閾値2、閾値3のように設定する。同様に、例えば、各興味度に対応するコンテンツが、全ジャンルのコンテンツに対して30%の割合で録画されるように閾値を設定する場合には、正規化済みの文字列に対する興味度が0.7の場合の、各興味度における変換式の値を閾値に設定すれば良い。この場合、閾値は、閾値1´、閾値2´、閾値3´のように設定する。S908の処理における閾値による足切りが行われた後、処理を終了する。
【0058】
ここで、ユーザに対し閾値に対する意味をどのようにして提示するかについて若干説明する。具体的には、閾値を十番単位の切り番となるように設定しておき、例えば閾値が50の場合には、画面イメージとして録画される番組と録画されない番組とに色分けして表示したり、録画されない番組はどれであり、全体的にいくつの番組が録画されるかをGUI(Graphical User Interface)で表示したりする等、閾値に対する意味を報知するユーザインタフェースは任意の形態を取り得る。
【0059】
このように、本実施形態では、ユーザが設定したコンテンツのジャンル毎の興味度に応じた非線形の数式で、自動的に学習した興味度の推定値を変換している。この変換において、自動的に学習した興味度の推定値の分布を制御することを目的としている。そして、ジャンルに対する興味度に対して平均的なお勧め度を生成する場合と比較して、どれくらいの重み付け(傾斜)をつけてジャンルに対する興味度毎にお勧め度を生成するかを決定するために閾値を設けることとしている。
【0060】
次に、本発明の実施形態における情報処理装置のお勧め度逆計算アルゴリズムのシステム構成について説明する。
図12は、本発明の実施形態における情報処理装置のお勧め度逆計算アルゴリズムについて説明する機能ブロック図である。
【0061】
図8では、閾値を離散的に設定する方法について説明した。ここまでの説明を応用すれば、ユーザが閾値を連続値として設定した場合であっても、閾値に対応する各ジャンルの興味度の変換式を用いて、ジャンル毎にどれくらいの割合で録画されるかを推定することができる。
図12に示す機能ブロック図では、ジャンル興味度121と閾値122とを入力とし、お勧め度の逆算を行うアルゴリズムであるお勧め度逆算アルゴリズム123を用いてジャンル毎の推定録画割合124を提示することにより、設定された閾値の意味するところをユーザに対して提示することができる。
【0062】
お勧め度を逆算するアルゴリズムのイメージを
図13に示す。
図13は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係に対して設定された閾値から逆算するときの状態について説明する図である。
【0063】
コンテンツのジャンル毎の興味度と、文字列に対する興味度と順位との関係を正規化したものと、を演算したときに生成されたお勧め度に対して、ユーザによって連続値として設定された任意の閾値と、ジャンル興味度1から3の変換式との交点を求める。交点の正規化済み文字列に対する興味度が、それぞれ、0.4、0.76、0.96となったとする。その結果、ジャンル興味度3の番組は、全ジャンルの番組に対して60%、ジャンル興味度2の番組は、全ジャンルの番組に対して24%、ジャンル興味度1の番組は、全ジャンルの番組に対して4%録画されるものと推定される。
【0064】
また、上記実施形態では、ジャンル興味度が1、2、3といった離散値を取るという想定で説明した。ジャンル興味度については、実数値として表現することも可能である。ジャンル興味度毎の変換式について、パラメータを興味度に応じて変化する実数として表現すれば良い。
【0065】
具体的には、べき乗を用いる場合には、べき数を実数としてジャンル興味度から算出すれば良い。すなわち、y=x
nを用いる場合には、nを興味度にしたがって加減すれば良い。要するに、ジャンル興味度3の場合にはn=1/2、ジャンル興味度2の場合にはn=1、ジャンル興味度1の場合にはn=2のように、nを興味度に応じて連続値に設定すれば良い。
【0066】
また、円弧を用いる場合には、中心点が上下どちらにあるかという点と、円弧の半径をジャンル興味度から算出するようにすれば良い。
図14に、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の実数値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係を示す。
図14におけるE領域が、コンテンツのジャンル毎の興味度を実数とした場合の領域である。
【0067】
さらに、上記実施形態では、ジャンル興味度は、
図5に示すようにユーザが明示的に設定するものとしていたが、異なる方式により学習するようにしても良い。例えば、自動的に学習するようにしても良い。
図14ではジャンル興味度を実数化できることを説明したが、ジャンル興味度として自動学習の値を用いても良い。特に、ユーザの意識と番組表の表現とがずれている場合に有効となる。さらに、お勧め度を録画目的以外の用途に用いることも可能である。
【0068】
また、上記実施形態では、文字列(ワード、単語)に対する興味度推定値を正規化済み興味度として採用しているが、適当な判断手段を搭載することが可能であれば、画像データや音声データに対する興味度を、正規化済み興味度として採用することも可能である。さらに、各ジャンルに対する興味度をWebサーバから取得したりすることも可能である。
【0069】
また、本実施形態では、テレビ番組を一例として説明しているが、同様な情報量が存在する他の分野に応用することが可能である。例えば、YouTube(登録商標)を一例とするVOD(Voice On Demand)やWebニュースといった、何らかのコンテンツがジャンル分けされており、ジャンル以外に興味度を取得することができ、ジャンル自体も別途興味度を評価できるものであれば、お勧め度を生成することが可能である。例えば、コンテンツに関するテキスト情報が一緒になっており、コンテンツに対する操作履歴に基づいて興味度又は好みを学習して行く。そして、テキスト情報の単語ベースでの学習に対して順位、得点を付与して行き、最終的に正規化されていれば良いのである。また、ジャンルに対する興味度が別途設定されており、ジャンルに対する興味度に対し、この正規化された重み付けを用いて変換すればお勧め度を生成することができる。
【0070】
以上説明したように、本発明によれば、ジャンルに対する興味度と、文字列に対する興味度推定値の双方を合成したお勧めを行うことができる。そして、興味度が低いジャンルであっても、文字列に対する興味度推定値が特に高い場合には、お勧め度が高くなる。また、閾値を設定することにより、各ジャンルの録画割合の推定値という形で、提示することができる。
【0071】
なお、
図9に示した本発明の実施形態における情報処理装置(PC)200を構成する各機能ブロックの各動作は、コンピュータ上のプログラムに実行させることもできる。すなわち、情報処理装置200のCPU206が、ROM202、RAM203等から構成される記憶部に格納されたプログラムをロードし、プログラムの各処理ステップが順次実行されることによって行われる。
【0072】
以上説明してきたように、本発明によれば、コンテンツのジャンル毎に予め設定された設定興味度と、コンテンツの視聴により推定された推定興味度とを合成する合成手段と、合成により、推定興味度に対する設定興味度のジャンルに属するコンテンツのお勧め度を生成する生成手段と、任意の設定興味度を有するジャンルに属するコンテンツの、全ジャンルのコンテンツに占めるお勧め割合を決定するための閾値を、生成されたお勧め度に対して設定する設定手段と、を含むことにより、ユーザの嗜好にフレキシブルに対応したコンテンツを推薦することができるのである。
【0073】
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範囲な趣旨及び範囲から逸脱することなく、これら具体例に様々な修正及び変更が可能である。