(58)【調査した分野】(Int.Cl.,DB名)
前記ユーザの嗜好は、前記ユーザによるコンテンツの視聴に伴って学習され、前記学習が進行するに連れ、前記シリーズコンテンツに対する興味度、又は前記新コンテンツに対する興味度に乗ずるパラメータは漸減し、前記お勧めコンテンツに対する興味度に乗ずるパラメータは漸増することを特徴とする請求項1に記載の情報処理装置。
前記ユーザに対して推薦するコンテンツは、前記所定期間連続して放送されるシリーズコンテンツ、又は新たに放送が開始される新コンテンツ以外のコンテンツをも含み、前記学習が進行するに連れ、前記ユーザの嗜好を反映したお勧めコンテンツの数は増加することを特徴とする請求項2に記載の情報処理装置。
前記学習の進行が、前記ジャンル興味度が設定されたコンテンツがすべてのコンテンツに対して如何なる割合でお勧めされるかを決定するために設定される所定の閾値と前記パラメータの値とが一致する所定段階に到達すると、以後前記学習の進行が終了するまで、前記ユーザの嗜好を反映したお勧めコンテンツの数は等速で増加することを特徴とする請求項3に記載の情報処理装置。
前記学習の進行が初期段階から前記所定段階に到達するまで、前記ユーザの嗜好を反映したお勧めコンテンツの興味度は線形的に増加し、前記所定段階から前記学習の進行が終了するまで、前記お勧めコンテンツの数は等速に増加することを特徴とする請求項4に記載の情報処理装置。
前記推定興味度は、前記コンテンツに含まれる情報に対する興味度と、該興味度の順位との関係のうち、少なくとも非線形領域を正規化することにより推定されることを特徴とする請求項6に記載の情報処理装置。
【発明を実施するための形態】
【0026】
次に、本発明を実施するための形態について図面を参照して詳細に説明する。なお、各図中、同一又は相当する部分には同一の符号を付しており、その重複説明は適宜に簡略化乃至省略する。本発明の内容を簡潔に説明すると、所定期間連続して放送されるシリーズコンテンツに対する興味度、又は新たに放送が開始される新コンテンツに対する興味度と、ユーザの嗜好を反映したお勧めコンテンツに対する興味度との各々に対し、異なるパラメータを乗じて加算することにより、ユーザに対して推薦するコンテンツのお勧め度を決定することにより、シリーズコンテンツ及び新コンテンツを満遍なくお勧めすると共に、ユーザの嗜好を反映したコンテンツも併せてお勧めすることができるのである。
【0027】
すなわち、番組改変期には、それまで放送されていた番組が終了し、新番組が始まるので、それまでの蓄積によって学習されたユーザの嗜好に基づくお勧め番組の精度が低下するので、番組改編後、視聴履歴等に基づくユーザの嗜好を反映した興味度の学習が進行する所定の時期までは、新番組及び改編後も継続する番組をお勧めする比重を高くし、学習が進行するに連れて、徐々にユーザの嗜好に合致する番組をお勧めする比重を高くしていくことにより、ユーザに対して推薦するコンテンツのお勧め度を決定しているのである。
【0028】
まず、本発明の実施形態における情報処理装置を含む情報処理システム全体の構成について説明する。
図1は、本発明の実施形態における情報処理装置を含む情報処理システム全体の構成を示す図である。
図1を参照すると、本発明の実施形態における情報処理装置を含む情報処理システム10は、例えば、パーソナルコンピュータ(以下、PCともいう。)を代表とする情報処理装置200が、インターネット等の広く公衆によって接続可能なネットワーク300を介してWebサーバ400に接続されている。また、PC200は、放送局100から送信される放送波や、Webサーバ400から送出されるコンテンツを受信することができるようになっている。なお、情報処理装置200には、PC以外に図示しないスマートフォン等の携帯情報端末も含まれることは勿論である。
【0029】
また、Webサーバ400は、PC200、及び図示しないスマートフォン等と、インターネット等のネットワーク300を介して接続されている。そして、PC200、及び図示しないスマートフォン等から発せられた任意のWebページに接続したい旨のアクセス要求に対して、URL(Uniform Resource Locator)で特定されたWebサーバ400から提供されるWebページの閲覧が可能となる。なお、
図1中には、インターネット等のネットワーク300に対してPC200のみ接続されているが、情報処理装置は1台に限定されず、複数台接続されていることはいうまでも無い。
【0030】
次に、本発明の実施形態における情報処理装置の全体構成について説明する。
図2は、本発明の実施形態における情報処理装置の全体構成について説明する概略ブロック図である。PC200は、TVチューナ部201と、ネットワーク接続部205と、CPU(Central Processing Unit)206と、ROM(Read Only Memory)202と、RAM(Random Access Memory)203と、HDD(Hard Disk Drive)204と、表示部207と、入力部208と、電源部209とから構成される。
【0031】
TVチューナ部201は、放送局100(
図1)から送信される地上デジタル、BS、及びCS放送をアンテナから受信し復調するものである。ネットワーク接続部205は、インターネットに代表されるネットワーク300に接続され、ネットワーク300とのインタフェースを図るものである。CPU206は、PC200全体の動作を制御するものであり、ROM202に格納された制御プログラムをロードし、PC200の動作によって得られた様々なデータをRAM203に展開するものである。HDD204は、PC200のアプリケーションソフトウェアプログラムを格納したり、TVチューナ部201によって受信されたテレビ番組や、Webサーバ400から送出されるコンテンツ(以下、これ等をまとめてコンテンツともいう。)を録画したりするものである。
【0032】
表示部207は、LCD(Liquid Crystal Display)等で構成される表示画面であり、PC200によって実行されたアプリケーションソフトウェアプログラムの結果やTVチューナ部201によって受信されたテレビ番組、及びWebサーバ400から受信したコンテンツを表示するものである。入力部208は、キーボード、マウス、タッチパネル等、ユーザがPC200に対して指示を与えるものである。そして、電源部209は、PC200に対してAC(Alternative Current:交流)、又はDC(Direct Current:直流)電源を与えるものである。
【0033】
次に、本発明の実施形態におけるWebサーバの全体構成について説明する。
図3は、本発明の実施形態におけるWebサーバの全体構成について説明する概略ブロック図である。Webサーバ400は、ネットワーク接続部403と、CPU404と、ROM401と、データベース部402と、表示部405と、操作部406と、電源部407とから構成される。
【0034】
ネットワーク接続部403は、インターネットに代表されるネットワーク300(
図1)に接続され、ネットワーク300とのインタフェースを図るものである。CPU404は、Webサーバ400全体の動作を制御するものであり、ROM401に格納された制御プログラムをロードし、CPU404の動作によって得られた様々なデータをデータベース部402に展開したり、後述するように、ユーザの嗜好に合致するコンテンツを送出したりするものである。表示部405は、LCD等で構成される表示画面であり、Webサーバ400によってデータベース部402に格納されたデータの格納状況等を表示するものである。操作部406は、キーボード、マウス、タッチパネル等、Webサーバ400の保守者が、Webサーバ400に対して指示を与えるものである。そして、電源部407は、Webサーバ400に対してAC又はDC電源を与えるものである。
【0035】
次に、本発明の実施形態における情報処理装置の機能ブロックについて説明する。
図4は、本発明の実施形態における情報処理装置の機能ブロック図である。
【0036】
図4において、PC200は、放送局100(
図1)から送信される放送波を受信する複数のチューナ部210、211、212、及び213と、チューナ部210、211、212、及び213により復調されたテレビ番組や、Webサーバ400から送出されるコンテンツを記録し再生するするコンテンツ記録再生部214と、放送局100から送信される電波の隙間を使って送信される電子番組ガイド(EPG)を管理するEPG情報管理部217と、液晶(LCD)等のディスプレイ221にテレビ番組やコンテンツを表示する動画表示処理部215と、を含んで構成されている。なお、チューナ部の数は、4個に限定されないことは勿論である。
【0037】
また、ディスプレイ221には、ライブ放送されているテレビ番組の画面、録画されたテレビ番組の再生画面、録画されたテレビ番組の一覧表、Webサーバ400から受信するコンテンツが表示されることは勿論であるが、後述するEPG情報管理部217により取得された、過去に放送された番組、現在放送されている番組、又は今後放送される予定の番組の番組表も表示される。また、テレビ番組とFacebook(登録商標)画面とを並べて表示したり、Facebook画面をテレビ画面のバックグラウンドで表示したりすることも可能である。
【0038】
さらに、PC200は、インターネット等の公衆に利用可能なネットワーク300(
図1)を介してWebサーバ400に接続するためのネットワーク接続処理部220と、チューナ部210、211、212、及び213により受信されたテレビ番組や、Webサーバ400から取得されたコンテンツに対するユーザの視聴履歴に基づいて、文字列(ワード、単語)を取得し記録する動画情報取得記録部219と、EPG情報管理部217から送信される電子番組表、及び興味情報取得部218を介して設定されたコンテンツのジャンル毎の興味度と、受信されたユーザの視聴履歴に基づいて機械学習により作成した文字列(ワード、単語)に対する興味度と順位との関係を正規化したものとの間で所定の演算を実行し、お勧め度を解析する映像解析処理部216と、映像解析処理部216で解析されたお勧め度をディスプレイ221に表示する動画表示処理部215と、PC200の動作を遠隔操作するリモコン222と、を含んで構成されている。
【0039】
次に、本発明の実施形態における情報処理装置において同一興味度の新番組と通常番組とにおけるお勧め度の違いを概念的に説明する。
図5は、本発明の実施形態における情報処理装置において同一興味度の新番組と通常番組とにおけるお勧め度の違いを概念的に説明する図である。なお、
図5に示す正規化済み文字列に対する興味度とお勧め度との関係については後述する。
【0040】
今、正規化済み文字列に対する興味度を横軸に、お勧め度を縦軸にとったとき、曲線Sは、所定のジャンルにおけるユーザの興味度が3である通常番組、すなわち、番組改変の影響を受けない通常番組(シリーズ番組、連続番組)の正規化済み文字列に対する興味度とお勧め度との関係を示している。これに対して、曲線Nは、所定のジャンルにおけるユーザの興味度が3である新番組の正規化済み文字列に対する興味度とお勧め度との関係を示している。すなわち、曲線Sに対して曲線Nのお勧め度を値Dだけ嵩上げしているのである。
【0041】
すなわち、興味度3の新番組はユーザの視聴履歴を学習する上での未知の単語が多いため、それまで行われてきた学習の精度が著しく低下する。そうすると、新番組をお勧めする確率も低下してしまうので、
図5に示すように、同一の興味度3を有するジャンルに属する番組であっても、新番組の正規化済み文字列に対する興味度に対するお勧め度を、通常番組よりも値Dだけ嵩上げしているのである。これにより、新番組が全くお勧めされないといった状況を改善することができる。
【0042】
次に、本発明の実施形態における情報処理装置のお勧め度計算アルゴリズムについて説明する。
図6は、本発明の実施形態における情報処理装置のお勧め度計算アルゴリズムについて説明する機能ブロック図である。
【0043】
図6に示すように、本実施形態の対象となるお勧め度計算アルゴリズム605は、1週間分の電子番組ガイド(EPG)601と、視聴中であるシリーズ番組(番組改変前後で変化がない番組)に関する情報602と、
図7で説明する番組ジャンル701とそれに対する興味度702とに基づいて定められるジャンル興味度603と、閾値604とを入力とし、最終的に閾値以上のお勧め度付き番組リスト607を出力するものである。1週間分のEPG601は、EPG情報管理部217(
図4)によりテレビ放送の各番組の情報を格納したテーブルである。番組毎にタイトル、ジャンル、放送日時、放送局、その他のテキスト情報を保持する。
【0044】
視聴中シリーズ番組602は、入力部208(
図2)を用いてチャンネルを合わせ、当該シリーズ番組を視聴することにより、HDD204に視聴したというフラグが立った状態で格納される。視聴中シリーズ番組602の情報を入力に持つことは、本実施形態の特徴の一つである。番組改編の有無に係わらず、シリーズ番組はできる限り連続して視聴したいという、ユーザの普遍的な要求の反映に利用する。
【0045】
ジャンル興味度603は、
図7において説明するように、明示的にユーザが各ジャンルに対して設定した興味度である。“ドラマ”、“ニュース/報道”、“バラエティ”等の各ジャンルに対して、興味度を段階的に設定可能なものとする。
【0046】
ここで、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の設定について説明する。
図7は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の設定について説明する図である。
【0047】
図7に示すように、PC200のユーザは、チューナ部210、211、212、及び213を介して受信されるテレビ番組について、番組ジャンル701と各番組ジャンルに対する興味度702とを選択することができる。番組ジャンル701は、ニュース/報道、スポーツ、情報/ワイドショー、ドラマ、音楽、バラエティ、映画、アニメ/特撮、ドキュメンタリー/教養、劇場/公演、趣味/教育、福祉といった12ジャンルに分類されている。このジャンル分けは、ARIB(Association of Radio Industries and Business:社団法人電波産業界)で定められたジャンル分類にしたがっているが、これ以外にも任意のジャンル分類を用いることができる。また、興味度702は、興味なし(0)から興味あり(4)の5段階で設定することができる。
【0048】
図7の例では、ニュース/報道は興味度1、スポーツは興味なし(0)、情報/ワイドショーは興味度1、ドラマは興味度2、音楽は興味あり(4)、バラエティは興味度2、映画は興味度3、アニメ・特撮は興味度3、ドキュメンタリー/教養は興味度2、劇場/公演は興味度3、趣味/教育は興味度1、福祉は興味なし(0)、にそれぞれ設定されている。この各番組ジャンルに対する興味度の設定は、ユーザがPC200を購入した直後、又はユーザがPC200を購入後、ある一定期間コンテンツを視聴した後に設定するようにしても良い。そして、この各番組ジャンルに対する興味度の設定は、表示部207に
図7に示す画面が表示された状態で、興味情報取得部218(
図4)に対してユーザがPC200の入力部208を用いて行うようにする。
【0049】
図6に戻り、閾値604は、ジャンルに対する興味度毎に生成されたお勧め度に対する切り捨て位置(足切り位置)を設定するものである。この閾値に関して、お勧め度計算アルゴリズム605と相関性を持たせることも本実施形態の特徴である。お勧め度計算アルゴリズム605は、本実施形態の主眼となる機能であり、お勧め度計算アルゴリズム605の計算過程において、後述する文字列による興味度推定アルゴリズム606を利用する。
【0050】
なお、1週間分の電子番組ガイド(EPG)601は、EPG情報管理部217(
図4)によって取得された後、RAM203(
図2)に格納され、ジャンル興味度603、及び閾値604は、入力部208を用いて入力された後、HDD204に格納される。文字列による興味度推定アルゴリズム606、及びお勧め度計算アルゴリズム605は、CPU206によって実行され、閾値以上のお勧め度付き番組リスト607は、HDD204又はRAM203に格納される。
【0051】
次に、本発明の実施形態における情報処理装置の動作について説明する。
図8は、本発明の実施形態における情報処理装置の動作について説明するフローチャートである。
【0052】
本実施形態のお勧め度計算アルゴリズムは、特に、シリーズ(連続)番組、又は新番組に対する興味度と、ユーザの嗜好を反映したお勧め番組に対する興味度とのそれぞれに対し所定の異なるパラメータを乗じ、それらの加重平均をとることを特徴としている。また、足切りに用いる閾値設定も、本実施形態の特徴である。以下、動作の流れについて説明する。
【0053】
図8において、まず、ステップ(以下、Sという。)801の処理では、文字列による番組の興味度が計算される。この点について
図9を用いて説明する。
図9は、本発明の実施形態における情報処理装置において視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を示す図である。
【0054】
図9に示すように、ユーザの嗜好を反映した視聴履歴に基づいて機械学習(マシンラーニング)により作成した文字列に対する興味度、換言すれば、視聴履歴に含まれる文字列(ワード、単語)を分析評価することにより得られた当該文字列(ワード、単語)に対する興味度を縦軸に、順位を横軸にとる。
図9において、文字列に対する興味度が平均値にあるとき機械学習による順位は略網羅されるが、文字列に対する興味度が極端に大きくなるに連れて機械学習による順位は低下して飽和状態となり、文字列に対する興味度が極端に小さくなるに連れて機械学習による順位は増大して飽和状態となる。
【0055】
ここで、機械学習(マシンラーニング)について若干説明する。本実施形態では、お勧め度を生成する計算過程において、文字列による興味度推定アルゴリズムを利用している。文字列による興味度推定アルゴリズムは、電子番組ガイド(EPG)から取得される番組の概要や人名といった文字列情報から、ユーザの興味度を推定するものである。この推定は、例えば、TF/IDF(Term Frequency Inverse Document Frequency)、ナイーブベイズ、ベクトル空間法、サポートベクタマシン等、公知の機械学習(マシンラーニング)を用いて行っている。本実施形態では、
図9に示した文字列に対する興味度と順位との関係のうち、非線形領域(飽和状態となっている領域)だけでなく、線形領域(文字列に対する興味度が略平均値にある非飽和領域)をも用いてコンテンツの推薦を行うことにより、推薦数の自由度を高めている。
【0056】
図8に戻り、S802の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S802:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S802:YES)と判断されると、S803の処理へ移行する。
【0057】
S803の処理では、興味度の正規化が行われる。この点について
図10を用いて説明する。
図10は、
図9で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化した図である。
図10において、
図9の曲線を(0、1)の非線形の正規化を行うことにより、直線Lに近くなるように計算し変換している。
【0058】
図8に戻り、S803の処理では、
図10で説明したような、
図9で作成した機械学習により作成した文字列に対する興味度と順位との関係を正規化する処理である。興味度の正規化は、文字列による番組の興味度の推定値に対して、最大値を1、平均値を0.5、最小値を0とするような変換を行う。以後の計算の精度のためには、まず第1に、最大値、平均値、最小値は、直近のある期間の統計量を用いることである。例えば、TF/IDFやナイーブベイズを用いた演算の場合、理論的な最大/最小を規定することができないので、学習状況や番組表の状況に応じて、異なる統計量となる。状況に応じて最適に制御するためには、ある期間での統計量を用いることが望ましい。
【0059】
第2に、非線形な変換を用いて、正規化後の興味度の分布を一様分布に近づけることである。一様分布から大きく離れる場合、ジャンル興味度を用いた非線形変換による分布の制御が困難となるからである。
【0060】
図8に戻り、S804の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S804:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S804:YES)と判断されると、S805の処理へ移行する。
【0061】
S805の処理では、ジャンル興味度による非線形変換が行われる。ジャンル興味度による非線形変換は、
図11に示すように正規化された文字列による興味度を非線形に変換する操作である。入力、出力共に、0−1の範囲を領域とするが、ジャンル興味度により、分布が制御される。変換式のイメージを
図11に示す。
図11は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係を示す図である。
【0062】
ジャンル興味度は1から3で、数値が大きいほど興味があるものとする。
図11では、興味度3の変換式で生成されるお勧め度は高い方向に、興味度1の変換式で生成されるお勧め度は低い方向に、分布が移動することが分かる。また、興味度3の変換式で生成されるお勧め度は、正規化済み文字列に対する興味度が少しでも高くなればお勧め度は高くなり、興味度1の変換式で生成されるお勧め度は、正規化済み文字列に対する興味度が高くならない限り、お勧め度は高くならない。興味度1の変換式で生成されるお勧め度は、視聴履歴中に非常に興味度が高い文字列(ワード、単語)が書かれている番組に対しては高くなる傾向にある。したがって、ジャンル興味度が低いジャンルに属するコンテンツであっても、当該コンテンツに関連する派生コンテンツに対する視聴履歴に基づいて機械学習により作成された正規化文字列に対する興味度が高ければ、お勧め度が高くなるため、録画対象に成り易くなる。
【0063】
分布を制御するため、ジャンル興味度が1(興味度1の変換式)であっても、正規化済み文字列による興味度推定値が十分高い場合には、お勧め度として上位に入ることができる。このような変換式は、べき乗や、座標点(0、0)、(1、1)を通る円弧形状等、複数想定される。何れの場合であっても類似する効果を与えることが可能である。このように、ジャンルに対する興味度を、文字列による興味度推定値を用いて変換し、順位を振り直している。その際、文字列による興味度を正規化し、番組の属するジャンルに設定されている興味度に応じてさらにお勧め度を上下させているのである。
【0064】
図8に戻り、S806の処理では、コンテンツの数分ループしたか否かが判断される。コンテンツの数分ループしていない(S806:NO)と判断されると、コンテンツの数分ループするまで待機する。コンテンツの数分ループした(S806:YES)と判断されると、S807の処理へ移行する。
【0065】
S807の処理では、シリーズ(連続)番組、又は新番組に対する興味度と、ユーザの嗜好を反映したお勧め番組に対する興味度とのそれぞれに対し所定の異なるパラメータを乗じ、それらの加重平均をとることが行われる。ここで、連続番組補正との加重平均について説明する。本実施形態では、学習による動的な評価値を、
図11に示すコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係に基づいて算出するものとする。
【0066】
このとき、シリーズ(連続)番組を継続して視聴したい、又は新番組を視聴したいという補正(S)と、動的な評価(f(x))とは、以下に示す加重平均式で表すことができる。αは加重平均のパラメータで、0≦α≦1である。xは正規化された興味度であり、f(x)はジャンル興味度による非線形変換である。そうすると、お勧め度は、以下の式で表すことができる。
お勧め度=(1−α)S+αf(x)
【0067】
すなわち、ユーザの嗜好の学習が進行するに連れて、シリーズ(連続)番組、又は新番組に対する興味度に乗ずるパラメータαは次第に小さくなり、ユーザの嗜好を反映したお勧め番組に対する興味度に乗ずるパラメータαは次第に大きくなる。
【0068】
本実施形態の目的として、学習の進行に合わせて加重平均のパラメータαが変化しても、平均的な視聴中のシリーズ番組、又は新番組が録画されるような閾値を設定する。このとき、お勧め度に対する閾値をTとすると、以下に示す式が成り立つことになる。
T=(1−α)S+αf(0.5)
ここで、xの平均値は、
図10に示すように0.5となるように正規化されている。
【0069】
また、α=0の場合、すなわち、未学習でシリーズ番組、又は新番組だけが録画される場合、T=Sとなる。また、α=1の場合、すなわち、学習された番組だけが録画される場合、T=f(0.5)となることから、S=f(0.5)となる。
【0070】
結局のところ、シリーズ番組、又は新番組を録画するという普遍的な評価と、学習による番組を録画するという動的な評価との何れを重視するかといった目的に応じて、αの最大値を決定すれば良いことになる。
【0071】
上記説明した実施形態では、平均的に視聴中のシリーズ番組、又は新番組が録画対象となるようにパラメータαを設定している。ここでは、その他の番組の録画数を念頭にα(t)を設定し、録画数の増加を線形に近づける方法について説明する。
【0072】
一般的に、視聴可能な番組数は、ジャンル毎の番組数に比べて十分に小さくなる。このため、学習が進行することにより、学習による番組を録画する動的な評価が加算されると、録画数は大きくなっていく。すなわち、学習が進行するに連れ、ユーザの嗜好を反映したお勧めコンテンツの数は増加する。このイメージを
図12に示す。
図12は、本発明の実施形態における情報処理装置においてある加重平均のパラメータにおいて閾値を設定したときの当該ジャンルが録画される割合について説明する図である。
【0073】
図12では、あるα値において、特にジャンル興味度が高い(例えば、興味度3)ジャンルについて、閾値を設定したときの当該ジャンルが録画される割合を示している。
図12から、パラメータαを学習進度に応じて線形に制御すると、学習の進行の初期段階では録画数が急激に増加し、学習の進行が終了する段階では、ほとんど変化しないことが分かる。
【0074】
次に、本発明の実施形態における情報処理装置において学習が経過し、加重平均のパラメータが増加するに連れて録画番組数の増加量を一定にすることについて説明する。
図13は、本発明の実施形態における情報処理装置において学習が経過し、加重平均のパラメータが増加するに連れて録画番組数の増加量を一定にすることを説明する図である。
【0075】
図13において、本来のαminからαmaxへ向けて、学習進度に応じて制御すると、α値が小さいときは録画数が全く増加しないが、ある閾値(点E)を超えると一気に録画数が増加し、学習が進行しαmaxに近づくと、録画数がほとんど変化しないという現象が生じてしまう。この現象を回避するため、
図13において、正規化済み文字列に対する興味度1とあるα値との交点Eを新たなαminとして設定し、ここから学習を開始させるようにする。これにより、αの時間に対する増分(時間変数の増え方)が一定となるため、αminからαmaxに至るまで学習が進行することにより、点Eから、αmaxにおける閾値とが交差する点Fに到達するまでのお勧めコンテンツの数(録画番組数)の増え方が等速(線形)となる。以下、学習経過での録画番組数の増加量を等速(線形)にすることについて検討する。
【0076】
α(t)の最大値をAとし、tは未学習時に0、学習完了時に1まで増加する変数とする。このとき、録画される割合を線形に増加させることを考える。まず、閾値とf(x)とが交差するxの値は以下の式で求められる。
α(t)f(x)=T
f(x)=T/α(t)
x=f
-1(T/α(t))
【0077】
すなわち、α(t)の最大値Aのときのxの値は次のようになる。
x=f
-1(T/A)
tが0から1に増加するにしたがって、交点はx=1から上記値に線形移動する。
【0078】
つまり、xの移動は以下の式で表される。
x=1−{1−f
-1(T/A)}t=f
-1(T/α(t))
この式をα(t)について解くと、以下のようになる。
α(t)=T/f(1−{1−f
-1(T/A)}t)
このようにαを設定することにより、加重平均のパラメータα(t)を、
図13に示すように学習進度に応じて線形に制御することができる。
【0079】
図8に戻り、S808の処理では、お勧め度によるソートが行われる。具体的には、
図14に示すように、お勧め度の高い方から低い方へソートが行われ、お勧め度が生成される。S809の処理では、閾値による足切り処理が行われる。閾値設定方法のイメージを
図14に示す。
図14は、本発明の実施形態における情報処理装置においてコンテンツのジャンル毎の興味度の離散値と、視聴履歴に基づいて機械学習により作成した文字列に対する興味度と順位との関係を正規化したものと、を演算したときの正規化済み文字列に対する興味度とお勧め度との関係に対して閾値を設定したときの状態について説明する図である。
【0080】
各興味度に対応するコンテンツが、全ジャンルのコンテンツに対して平均的な割合で録画されるように閾値を設定する場合、正規化済みの文字列に対する興味度が0.5の場合の、各興味度における変換式の値を閾値に設定すれば良い。この場合、閾値は、閾値1、閾値2、閾値3のように設定する。同様に、例えば、各興味度に対応するコンテンツが、全ジャンルのコンテンツに対して30%の割合で録画されるように閾値を設定する場合には、正規化済みの文字列に対する興味度が0.7の場合の、各興味度における変換式の値を閾値に設定すれば良い。この場合、閾値は、閾値1´、閾値2´、閾値3´のように設定する。S809の処理における閾値による足切りが行われた後、処理を終了する。
【0081】
このように、本実施形態では、学習初期の段階では、継続して視聴しているシリーズ(連続)番組や新番組を優先的にお勧めされるようパラメータαの値を小さくしておき、学習が進行すれば、ユーザの嗜好に合致する番組も徐々にお勧めされるようパラメータαの値を大きくしている。そして、継続して視聴しているシリーズ(連続)番組や新番組と、ユーザの嗜好を反映した番組とがバランス良くお勧めされるように両者の加重平均を取っている。これにより、シリーズコンテンツ及び新コンテンツを満遍なく視聴すると共に、ユーザの嗜好を反映したコンテンツも併せて視聴することができるのである。
【0082】
なお、
図13において、新たに設定するαminを閾値との交点(点E)により決定したが、この場合、学習が少しでも進行すると、機械学習結果による自動録画が開始される。そうすると、学習の進度において、本来のαminから新たに設定するαminまでの間、自動学習の開始に対して猶予を持たせることができる。このとき、自動録画が開始される猶予期間についても、お勧め度を段階的に増加させることにより、猶予期間の経過を暗黙かつ直感的に表現することができる。
【0083】
すなわち、
図13において、本来のαminを0、新たに設定するαminをαmidとする。そして、学習進行の猶予期間であるお勧めコンテンツが実際に推薦されるまでの間は、0(αmin)からαmidに向かってαの値を直接線形に制御する。これにより、お勧めコンテンツの興味度は線形的に増加する。学習進行の猶予期間を経過した後は、αmidからαmaxに向かって録画数を等速(線形)に制御する。これにより、お勧めコンテンツの数は、等速に増加する。このような制御を行うことで、猶予期間の間は全体的な順位(得点)の増加傾向によってユーザは学習進度を把握することができ、猶予期間を経過した後は録画数の確認によってユーザによる閾値制御が可能となるのである。
【0084】
さらに、シリーズ(連続)番組や新番組と加重平均を取る対象として何を用いるかについては、最初のうちはあまり当てにならないが、学習が段々進むに連れて信憑性が高くなるものであれば、加重平均の対象となり得る。その際、加重平均の対象として、上記実施形態で説明した機械学習(マシンラーニング)に限定されることなく、学習によって所定の傾向を得ることができるものであれば何でも良い。要するに、番組改変期等は、従来行ってきた学習が役に立たないので、シリーズ(連続)番組や新番組がお勧めされる確度を高くしているのである。
【0085】
また、上記実施形態では、学習初期段階では、シリーズ(連続)番組や新番組のお勧め度合いを高くしているが、Webサーバ400(
図1)からダウンロードされるYouTube(登録商標)を一例とするVOD(Voice On Demand)やWebニュースといったコンテンツのうち、ページビューの高いもの(いいね!の数が多いもの)や、ユーザの思考に合致するもののお勧め度合いを高くするようにしても良い。
【0086】
さらに、上記実施形態では、ジャンル興味度は、
図7に示すようにユーザが明示的に設定するものとしていたが、異なる方式により学習するようにしても良い。例えば、自動的に学習するようにしても良い。さらに、ジャンル興味度は実数化することも可能であり、ジャンル興味度として自動学習の値を用いても良く、離散値に限定されることなく連続した実数値を用いても良い。特に、ユーザの意識と番組表の表現とがずれている場合に有効となる。さらに、お勧め度を録画目的以外の用途に用いることも可能である。
【0087】
そして、上記実施形態では、文字列(ワード、単語)に対する興味度推定値を正規化済み興味度として採用しているが、適当な判断手段を搭載することが可能であれば、画像データや音声データに対する興味度を、正規化済み興味度として採用することも可能である。さらに、各ジャンルに対する興味度をWebサーバから取得したりすることも可能である。
【0088】
また、本実施形態では、テレビ番組を一例として説明しているが、同様な情報量が存在する他の分野に応用することが可能である。例えば、YouTubeを一例とするVOD(Voice On Demand)やWebニュースといった、何らかのコンテンツがジャンル分けされており、ジャンル以外に興味度を取得することができ、ジャンル自体も別途興味度を評価できるものであれば、加重平均の対象として用いることが可能である。
【0089】
以上説明したように、本発明によれば、シリーズ(連続)コンテンツ、または新コンテンツは継続してお勧めして欲しいという普遍的な要求と、学習効果によるお勧めという動的な要求との双方を満たすことができる。また、未学習の段階では、普遍的な要求だけをお勧めしてもらい、学習が進行する過程において、普遍的な要求によるお勧めと、学習に基づく動的な要求によるお勧めとを、線形的に変化させることができる。
【0090】
なお、
図8に示した本発明の実施形態における情報処理装置(PC)200を構成する各機能ブロックの各動作は、コンピュータ上のプログラムに実行させることもできる。すなわち、情報処理装置200のCPU206が、ROM202、RAM203等から構成される記憶部に格納されたプログラムをロードし、プログラムの各処理ステップが順次実行されることによって行われる。
【0091】
以上説明してきたように、本発明によれば、所定期間連続して放送されるシリーズコンテンツに対する興味度、又は新たに放送が開始される新コンテンツに対する興味度と、ユーザの嗜好を反映したお勧めコンテンツに対する興味度との各々に対し、異なるパラメータを乗じて加算することにより、ユーザに対して推薦するコンテンツのお勧め度を決定することにより、シリーズコンテンツ及び新コンテンツを満遍なくお勧めすると共に、ユーザの嗜好を反映したコンテンツも併せてお勧めすることができるのである。
【0092】
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範囲な趣旨及び範囲から逸脱することなく、これら具体例に様々な修正及び変更が可能である。