(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0009】
<概要>
以下、図面を参照し、本発明のコンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラムの実施形態について説明する。コンテンツ評価装置は、ネットワークを介して利用者に配信されるコンテンツを評価する装置である。コンテンツ評価装置やコンテンツ配信システムは、一以上のプロセッサにより実現される。コンテンツとは、例えばニュース記事であるが、動画などの他のコンテンツであってもよい。以下の説明では、コンテンツはニュース記事であるものとする。また、報道性の有無を問わず、何らかの情報を伝えるものであればニュース記事に該当するものとする。ニュース記事には、少なくともテキスト情報が含まれ、そのため文字数がカウント可能である。また、ニュース記事には、テキストでないもの、例えば静止画や動画、インターフェースとして機能する図形(スイッチ)、装飾エフェクトなどが含まれてもよい。
【0010】
コンテンツ評価装置は、所定規則に基づいてコンテンツを評価した第1評価結果と、コンテンツを利用者が視聴すると予測される時間である予測滞在時間と、に基づく第2評価結果を導出する。この第2評価結果は、コンテンツの掲載有無や掲載順を決定する際の指標として用いられる。コンテンツ評価装置は、第1評価結果を自ら導出することで取得してもよいし、他装置から第1評価結果を取得してもよい。また、コンテンツ評価装置は、コンテンツを配信する装置と統合されてもよいし、別体として構成されてもよい。以下の実施形態ではコンテンツ評価装置は、コンテンツを配信する装置と統合されてコンテンツ配信システムとして機能するものとする。
【0011】
<第1実施形態>
[構成]
以下、第1実施形態について説明する。
図1は、第1実施形態のコンテンツ評価装置(コンテンツ評価部110)を利用したコンテンツ配信システム100の利用環境および構成の一例を示す図である。
【0012】
コンテンツ配信システム100は、ネットワークNWを介して利用者の端末装置10と通信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などを含む。
【0013】
端末装置10は、例えば、スマートフォンなどの携帯電話、タブレット端末、各種パーソナルコンピュータなどの、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。通信装置は、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどを含む。端末装置10では、ブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、利用者の入力する内容に応じたリクエストをコンテンツ配信システム100に送信する。また、UAは、コンテンツ配信システム100から取得した情報に基づいて、各種画像を表示する。
【0014】
コンテンツ配信システム100は、ブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供する端末装置10に提供するアプリサーバとして機能する。コンテンツ配信システム100は、NICなどのネットワークカードを備える。
【0015】
コンテンツ配信システム100は、例えば、コンテンツ評価部110と、コンテンツ選択部140と、コンテンツ配信部150と、コンテンツ実績解析部160とを備える。コンテンツ評価部110は、第1評価部112と、第2評価部114とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0016】
コンテンツ配信システム100は、記憶部190に記憶された情報を参照し、適宜、処理結果を記憶部190に書込みながら処理を行う。記憶部190は、RAM(Random Access Memory)やROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリなどにより実現される。記憶部190には、コンテンツ配信システム100のハードウェアプロセッサが実行するプログラムが格納されていてもよい。記憶部190は、コンテンツ配信システム100に附属する(コンテンツ配信システム100またはコンテンツ評価部110が備える)ものであってもよいし、コンテンツ配信システム100がネットワークNWを介してアクセス可能なNAS(Network Attached Storage)などの外部装置であってもよい。記憶部190には、例えば、上記のプログラムの他、コンテンツ情報191、利用者情報192、行動ログ193、コンテンツ実績情報194、学習モデル情報195などの情報が格納される。
【0017】
コンテンツ情報191は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。利用者情報192は、利用者の識別情報である利用者ID、利用者のデモグラ情報(年齢、性別、職業、住所その他の情報をいう)等を含む。行動ログ193は、利用者によるコンテンツの閲覧履歴に基づく情報である。コンテンツ実績情報194は、コンテンツごとの閲覧実績に基づく情報である。学習モデル情報195は、第1評価部112により学習される学習モデルを規定する情報である。これらの詳細については、以下において適宜説明を追加する。
【0018】
[第1評価部]
第1評価部112は、例えば、利用者の属性に依存しない所定規則に基づいて、コンテンツを評価した推定重要度(第1評価結果の一例)を導出する。
図2は、第1評価部112による処理の内容を模式的に示す図である。第1評価部112は、例えば、最初の数回はコンテンツ情報191のみを用いて推定重要度を求め、過去の実績値が入力され始めると、それを用いて修正が入るように、RNN(Recurrent Neural Network)を構成する。なお、所定規則は、以下に説明する規則に加えて、利用者の属性に依存する何らかの要素が加味された規則であってもよい。
【0019】
まず、第1評価部112は、ニュース記事が入稿され、コンテンツ情報191として記憶部190に格納された段階で、当該ニュース記事に関するコンテンツ情報の疎ベクトルxから分散表現y
0を求める。係る処理は、式(1)で表される。式中、Aは行列であり、aはベクトルである。関数f()は、式(2)で表される。すなわち、関数f()は、ベクトルの各要素について負であればゼロに置換する関数である。
【0021】
前述したように、コンテンツ情報191は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。第1評価部112は、例えば、tf−idf(Term Frequency-Inverse Document Frequency)やword2vec等の技術を用いて、テキスト情報をベクトル化する。また、画像や音声に対しては種々の技術に基づいてベクトル形式の特徴量を求める。第1評価部112は、上記の各種情報から得られるベクトルデータを統合し(例えば加算し)、コンテンツ情報の疎ベクトルxを求める。
【0022】
第1評価部112は、時間の経過と共に、以下の処理を繰り返し実行する。
【0023】
第1評価部112は、繰り返し実行される中でのk回目の処理として、k−1回目の処理で求められた特徴情報y
k−1と、当該回の時刻情報t
kおよび実績情報h
kとに基づいて、特徴情報y
kを求める処理を行う。係る処理は、式(3)で表される。実績情報の詳細については後述する。式中、Bは行列であり、bはベクトルであり、Tは転置を表している。第1評価部112は、特徴情報y
k−1の転置ベクトルと時刻情報t
kの転置ベクトルと実績情報h
kの転置ベクトルとを並べて得られる行列と行列Bを乗算し、ベクトルbを加算することで、特徴情報y
kを求める。
【0025】
次に、第1評価部112は、特徴情報y
kに基づいて、時刻「k」における推定素性z
kを算出する。係る処理は、式(4)で表される。式中、Cは行列であり、cはベクトルである。関数σ()は、式(5)で表されるシグモイド関数である。
【0027】
次に、第1評価部112は、推定素性z
kに基づいて、推定重要度w
kを算出する。係る処理は、式(6)で表される。式中、Dは行列であり、dはベクトルである。
【0029】
このようにして繰り返し求められる推定重要度w
kのうち最新のものが、当該コンテンツの推定重要度wkとして扱われる。
【0030】
第1評価部112は、例えば、確率的勾配降下法(SGD;Stochastic Gradient Descent)等の手法を用いて、行列A〜D、およびベクトルa〜dの値を学習する。そして、第1評価部112は、学習結果に基づいて、RNNにおける接続係数を修正する。これによって、推定重要度w
kの推定精度を向上させることができる。学習された接続係数は、学習モデル情報195の一部として記憶部190に格納される。学習モデル情報195は、ニューロンの接続情報や接続係数などを含む情報である。
【0031】
[実績情報について]
以下、実績情報h
kについて説明する。コンテンツ配信部150は、コンテンツを配信する際に、行動ログ193を蓄積する。なお、係る処理はコンテンツ配信システム100とは別体のログ収集装置によって行われてもよい。行動ログ193は、例えば、利用者ごとのコンテンツの閲覧履歴を示す情報である。コンテンツ実績解析部160は、行動ログ193に基づいてコンテンツ実績情報194を生成する。コンテンツ実績情報194は、例えば、コンテンツごと、過去の所定時間前まで振り返った場合の時間帯ごとのインプレッション数、クリック数、ツイート数などの情報である。あるコンテンツに対応するコンテンツ実績情報194が、前述した実績情報h
kとして扱われる。例えば、実績情報h
kは、対象となっているコンテンツの過去の所定時間前まで振り返った場合の時間帯ごとのインプレッション数をベクトル化したものである。
【0032】
第1評価部112が繰り返し処理を行う中で、コンテンツであるニュース記事の入稿直後には、実績情報h
kはゼロベクトルとなる。このため、入稿直後には、専らコンテンツ情報191に基づいて推定重要度w
kが導出される。その後、実績情報h
kが有意な値を持ち始めると、推定重要度w
kにおける実績情報h
kの影響が大きくなっていく。これによって、より柔軟に推定重要度w
k(第1評価結果)を導出することができる。
【0033】
[第2評価部]
第2評価部114は、対象となるコンテンツについて、第1評価部112により導出された推定重要度w
kと、予測滞在時間とに基づいて第2評価結果を導出する。予測滞在時間とは、対象となるコンテンツを利用者が視聴すると予測される時間である。第2評価部は、例えば、コンテンツの文字数が多くなるほど予測滞在時間が長くなるように、予測滞在時間を推定する。但し、コンテンツの文字数が余り多くなると利用者が途中で視聴を止めることも生じ得るため、第2評価部114は、コンテンツの文字数の増加に応じて予測滞在時間の変化率が小さくなるように予測滞在時間を推定してもよい。
図3は、コンテンツの文字数と予測滞在時間との関係の一例を示す図である。
【0034】
また、予測滞在時間の推定における他の要素として、画像の有無、画像の特性などが考慮されてもよい。例えば、第2評価部114は、画像の特性として、ニュース記事の内容を端的に示唆している画像であることを示す情報が、画像またはコンテンツに付与されている場合、そうでない場合に比して予測滞在時間を短く推定する。逆に、画像の特性として、ニュース記事の内容と余り関係の無い画像であることを示す情報が、画像またはコンテンツに付与されている場合、そうでない場合に比して予測滞在時間を長く推定してもよい。いずれの場合も、第2評価部114は、画像の表示位置がコンテンツの表示面に対して上側にあるほど、予測滞在時間を短く、或いは長くする修正量を大きくしてよい。
【0035】
第2評価部114は、上記の傾向を統合して予測滞在時間を推定する。第2評価部114による予測滞在時間tcの推定手法は、例えば、式(7)で表される。g()は、上記の傾向を実現するための任意の関数である。
【0036】
tc=g{(文字数)、(画像の有無)、(画像の特性)、(画像の位置)} …(7)
【0037】
そして、第2評価部114は、例えば、推定重要度w
kに予測滞在時間tcを乗算し、コンテンツを配信する際の指標として用いられる第2評価結果SCを導出する。係る処理は、式(8)で表される。第2評価結果SCが高いということは、コンテンツ自体の重要度が高いため利用者のクリック率が高いと推定され、且つそのコンテンツの視聴が開始されると比較的長い時間、視聴が継続されることを意味する。従って、第2評価結果SCが長いコンテンツを優先的に配信することで、利用者への満足度を向上させたり、サービスへの定着を促進したり、利用者の位置情報などを多く取得できたりするといった効果が期待できる。これらの効果は、コンテンツの配信者のニーズに応じたものである場合がある。従って、コンテンツ評価部110によれば、配信者のニーズに応じた評価基準でコンテンツを評価することができる。
【0039】
[コンテンツの配信]
コンテンツ選択部140は、第2評価結果SCに基づいて、利用者に配信するコンテンツを選択する。例えば、コンテンツ選択部140は、第2評価結果SCが高い順にコンテンツを選択すると共に、一定割合でランダムに選択したコンテンツを混入させる。コンテンツ配信部150は、コンテンツ選択部140により選択されたコンテンツを利用者の端末装置10に配信する。
【0040】
[処理フロー]
図4は、第1実施形態のコンテンツ評価部110により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、繰り返し実行される。まず、コンテンツ評価部110は、評価タイミングが到来したか否かを判定する(S100)。評価タイミングとは、例えば、定期的に到来するタイミングであってもよいし、更に、新たにニュース記事が入稿されたタイミングを含んでもよい。
【0041】
評価タイミングが到来すると、コンテンツ評価部110は、S110〜S118の処理を、対象となるコンテンツごとに行う。対象となるコンテンツとは、全てのコンテンツであってもよいし、新たにニュース記事が入稿されたタイミングにおいては、入稿されたコンテンツに限定されてもよい。また、古くなったコンテンツについては適宜、対象から外れるようにしてもよい。
【0042】
まず、コンテンツ実績解析部160が、コンテンツ実績情報194を更新する(S110)。なお、S110の処理は、本フローチャートの処理とは非同期で実行されてもよい。
【0043】
次に、第1評価部112が、第1評価値(推定重要度w
k)を導出する(S112)。次に、第2評価部114が、対象となるコンテンツの予測滞在時間tcを導出、または記憶部190から読み出す(S114)。予測滞在時間tcが経時的変化をしないものである場合、第2評価部114は、あるコンテンツについて一度、予測滞在時間tcを導出すると、結果を記憶部190に記憶させておき、以降の処理では記憶部190から読み出すようにしてよい。
【0044】
次に、第2評価部114が、第2評価結果SCを導出する(S116)。コンテンツ評価部110は、上記の処理の過程で得られた各種情報、および第2評価結果SCを、記憶部190に格納する(S118)。これによって、本フローチャートの1ルーチンの処理が終了する。
【0045】
図5は、第1実施形態のコンテンツ選択部140およびコンテンツ配信部150により実行される処理の流れの一例を示すフローチャートである。まず、コンテンツ配信部150は、コンテンツのリクエストがあったか否かを判定する(S120)。
【0046】
コンテンツのリクエストがあった場合、コンテンツ選択部140が、前述したように第2評価結果SCに基づいてコンテンツを選択し(S130)、コンテンツ配信部150がS130で選択されたコンテンツを利用者の端末装置10に配信する(S132)。そして、コンテンツ配信部150は、当該利用者の行動ログを更新する(S134)。これによって、本フローチャートの1ルーチンの処理が終了する。
【0047】
以上説明した第1実施形態のコンテンツ評価部110(コンテンツ評価装置)によれば、所定規則に基づいて、ネットワークNWを介して利用者に配信されるコンテンツを評価した第1評価結果を導出する(取得する)第1評価部112と、第1評価部112により導出された第1評価結果および予測滞在時間に基づく第2評価結果を、コンテンツを配信する際の指標として導出する第2評価部114と、を備えることにより、配信者のニーズに応じた評価基準でコンテンツを評価することができる。
【0048】
なお、第1実施形態における第1評価結果の導出手法は、あくまで一例である。第1評価結果は、他の規則によって導出されてもよい。
【0049】
<第2実施形態>
以下、第2実施形態について説明する。
図6は、第2実施形態のコンテンツ評価装置(コンテンツ評価部220)を利用したコンテンツ配信システム200の利用環境および構成の一例を示す図である。
【0050】
コンテンツ配信システム200は、ネットワークNWを介して利用者の端末装置10と通信する。端末装置10に関しては第1実施形態と同様であるため説明を省略する。コンテンツ配信システム200は、ブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供する端末装置10に提供するアプリサーバとして機能する。コンテンツ配信システム200は、NICなどのネットワークカードを備える。
【0051】
コンテンツ配信システム200は、例えば、コンテンツ評価部220と、コンテンツ選択部240と、コンテンツ配信部250と、コンテンツ実績解析部260とを備える。コンテンツ評価部220は、第1評価部222と、第2評価部224とを備える。これらの構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0052】
コンテンツ配信システム200は、記憶部290に記憶された情報を参照し、適宜、処理結果を記憶部290に書込みながら処理を行う。記憶部290は、RAMやROM、HDD、フラッシュメモリなどにより実現される。記憶部290には、コンテンツ配信システム200のハードウェアプロセッサが実行するプログラムが格納されていてもよい。記憶部290は、コンテンツ配信システム200に附属する(コンテンツ配信システム200またはコンテンツ評価部220が備える)ものであってもよいし、コンテンツ配信システム200がネットワークNWを介してアクセス可能なNASなどの外部装置であってもよい。記憶部290には、例えば、上記のプログラムの他、コンテンツ情報291、利用者情報292、行動ログ293、コンテンツ実績情報294、学習モデル情報295などの情報が格納される。
【0053】
コンテンツ情報291は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。利用者情報292は、利用者の識別情報である利用者ID、利用者のデモグラ情報等を含む。行動ログ293は、利用者によるコンテンツの閲覧履歴に基づく情報である。コンテンツ実績情報294は、コンテンツごとの閲覧実績に基づく情報である。学習モデル情報295は、第1評価部222により学習される学習モデルを規定する情報である。これらの詳細については、以下において適宜説明を追加する。
【0054】
[第1評価部]
図7は、第2実施形態の第1評価部222の構成および機能の一例を示す図である。第1評価部222は、コンテンツベクトル生成部222Aと、利用者ベクトル生成部222Bと、類似度判定部222Cとを備える。第1評価部222は、以下に説明するように利用者の行動ログに基づく属性に依存する規則によってコンテンツを評価する。
【0055】
コンテンツベクトル生成部222Aは、まず、コンテンツの内容に対して形態素解析などを行って、テキスト情報を単語(形態素)に分割する。次に、コンテンツベクトル生成部222Aは、各単語に対してword2vecなどの手法を適用して、分散表現化された単語ベクトルを取得する。形態素解析とword2vecとのうち一方または双方は、コンテンツベクトル生成部222Aが自ら処理を行うのではなく、外部装置に処理を依頼することで実現されてもよい。
【0056】
そして、コンテンツベクトル生成部222Aは、コンテンツから取得された一以上の単語ベクトルをコンテンツベクトル導出モデルに入力することで、コンテンツベクトルVcを導出する。コンテンツベクトル導出モデルは、例えば、機械学習によって生成されるモデルである。コンテンツベクトル導出モデルは、例えば、ディープラーニングなどの手法により、既知の単語ベクトルとコンテンツベクトルVcとの関係が再現できるような、隠れ層の活性化関数のパラメータ(接続係数)を求めることで生成される。
【0057】
なお、上記の定義に拘わらず、コンテンツベクトル導出モデルは、word2vecの特定、すなわち、どのようなコーパスをword2vecに与えるか、までを含んでもよい。
【0058】
コンテンツベクトル生成部222Aは、生成したコンテンツベクトルVcを、コンテンツIDと共に学習モデル情報295の一部として記憶部290に格納する。
【0059】
利用者ベクトル生成部222Bは、行動ログ293を参照し、利用者が閲覧したコンテンツのコンテンツIDを取得し、取得したコンテンツIDに対応するコンテンツベクトルVcを記憶部290から取得する。利用者ベクトル生成部222Bは、取得された一以上のコンテンツベクトルVcを利用者ベクトル導出モデルに入力することで、利用者ベクトルVuを導出する。利用者ベクトル導出モデルは、例えば、機械学習によって生成されるモデルである。利用者ベクトル導出モデルは、例えば、ディープラーニングなどの手法により、既知のコンテンツベクトルVcと利用者ベクトルVuとの関係が再現できるような、隠れ層の活性化関数のパラメータ(接続係数)を求めることで生成される。利用者ベクトル生成部222Bは、生成した利用者ベクトルVuを、利用者IDと共に学習モデル情報295の一部として記憶部290に格納する。学習モデル情報295には、更に、コンテンツベクトル導出モデルや利用者ベクトル導出モデルを規定する情報(例えば、それらのニューロン接続情報や接続係数など)が含まれる。なお、利用者ベクトルVuは、閲覧したコンテンツのコンテンツベクトルVc以外の要素を反映させて作成されてもよい。コンテンツベクトルVc以外の要素とは、例えば、利用者の入力したクエリ、コンテンツに該当しないウェブページの閲覧履歴、利用者のデモグラ情報などのうち一部または全部である。
【0060】
類似度判定部222Cは、例えば、対象となる利用者について、利用者ベクトルVuとコンテンツベクトルVcとのコサイン類似度Smを、利用者ごとにコンテンツを評価した第1評価結果として導出する。
【0061】
[第2評価部]
第2評価部224は、第1実施形態の第2評価部114と同様に、第1評価結果であるコサイン類似度Smに予測滞在時間tcを乗算し、コンテンツを配信する際の指標として用いられる第2評価結果SC*を導出する。第2評価結果SC*は、利用者の属性(行動ログ)に依存する規則でコンテンツを評価した結果である。
【0062】
[コンテンツの配信]
コンテンツ選択部240は、第2評価結果SC*に基づいて、利用者に配信するコンテンツを選択する。例えば、コンテンツ選択部240は、第2評価結果SC*が高い順にコンテンツを選択すると共に、一定割合でランダムに選択したコンテンツを混入させる。コンテンツ配信部250は、コンテンツ選択部240により選択されたコンテンツを利用者の端末装置10に配信する。
【0063】
[処理フロー]
図8は、第2実施形態のコンテンツ評価部220により実行される部分的な処理の流れの一例を示すフローチャートである。まず、コンテンツ評価部220は、コンテンツが入稿されたか否かを判定する(S200)。
【0064】
コンテンツが入稿されると、第1評価部222のコンテンツベクトル生成部222Aは、コンテンツベクトルVcを導出し、記憶部290に格納する(S210)。また、第2評価部224は、当該コンテンツの予測滞在時間を導出し、記憶部に格納しておく(S212)。これによって、本フローチャートの1ルーチンが終了する。
【0065】
図9は、第2実施形態のコンテンツ配信システム200により実行される処理の流れの一例を示すフローチャートである。
【0066】
まず、コンテンツ配信部250は、コンテンツのリクエストがあったか否かを判定する(S220)。
【0067】
コンテンツのリクエストがあった場合、コンテンツ選択部240が、第2評価結果SC*に基づいてコンテンツを選択し(S230)、コンテンツ配信部250がS230で選択されたコンテンツを利用者の端末装置10に配信する(S232)。そして、コンテンツ配信部250は、当該利用者の行動ログを更新する(S234)。
【0068】
次に、利用者ベクトル生成部222Bが、更新された行動ログに基づいて、利用者ベクトルVuを生成する(S236)。次に、類似度判定部222Cが、S236で生成された利用者ベクトルVuと、既に生成されている各コンテンツのコンテンツベクトルVcとに基づいて、コンテンツごとに第1評価結果(コサイン類似度Sm)を導出する(S238)。
【0069】
次に、第2評価部224が、S238で導出された第1評価結果と、予め導出された予測滞在時間とに基づいて、コンテンツごとに第2評価結果SC*を導出し(S240)、第2評価結果SC*を記憶部290に格納する(S242)。これによって、本フローチャートの1ルーチンの処理が終了する。
【0070】
以上説明した第2実施形態のコンテンツ評価部210(コンテンツ評価装置)によれば、第1実施形態と同様の効果を奏することができる。
【0071】
<第3実施形態>
以下、第3実施形態について説明する。
図10は、第3実施形態のコンテンツ評価装置(マス・コンテンツ評価部310)を利用したコンテンツ配信システム300の利用環境および構成の一例を示す図である。
【0072】
コンテンツ配信システム300は、ネットワークNWを介して利用者の端末装置10と通信する。端末装置10に関しては第1実施形態と同様であるため説明を省略する。コンテンツ配信システム300は、ブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供する端末装置10に提供するアプリサーバとして機能する。コンテンツ配信システム300は、NICなどのネットワークカードを備える。
【0073】
コンテンツ配信システム300は、例えば、マス・コンテンツ評価部310と、利用者ごとコンテンツ評価部322と、コンテンツ選択部340と、コンテンツ配信部350と、コンテンツ実績解析部360とを備える。マス・コンテンツ評価部310は、第1評価部312と、第2評価部314とを備える。これらの構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0074】
コンテンツ配信システム300は、記憶部390に記憶された情報を参照し、適宜、処理結果を記憶部290に書込みながら処理を行う。記憶部390は、RAMやROM、HDD、フラッシュメモリなどにより実現される。記憶部390には、コンテンツ配信システム300のハードウェアプロセッサが実行するプログラムが格納されていてもよい。記憶部390は、コンテンツ配信システム300に附属する(コンテンツ配信システム300、マス・コンテンツ評価部310、または利用者ごとコンテンツ評価部322が備える)ものであってもよいし、コンテンツ配信システム300がネットワークNWを介してアクセス可能なNASなどの外部装置であってもよい。記憶部390には、例えば、上記のプログラムの他、コンテンツ情報391、利用者情報392、行動ログ393、コンテンツ実績情報394、学習モデル情報395などの情報が格納される。
【0075】
コンテンツ情報391は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。利用者情報392は、利用者の識別情報である利用者ID、利用者のデモグラ情報等を含む。行動ログ393は、利用者によるコンテンツの閲覧履歴に基づく情報である。コンテンツ実績情報394は、コンテンツごとの閲覧実績に基づく情報である。学習モデル情報395は、第1評価部312および利用者ごとコンテンツ評価部322によりそれぞれ学習される学習モデルを規定する情報である。これらの詳細については、以下において適宜説明を追加する。
【0076】
マス・コンテンツ評価部310の第1評価部312および第2評価部314は、第1実施形態に係るコンテンツ評価部110の第1評価部112および第2評価部114と同様の機能を有する。すなわち、マス・コンテンツ評価部310は、推定重要度w
kに予測滞在時間tcを乗算し、コンテンツを配信する際の指標として用いられる第2評価結果SCを導出する。
【0077】
利用者ごとコンテンツ評価部322は、第2実施形態に係るコンテンツ評価部220の第1評価部222と同様の機能を有する。すなわち、利用者ごとコンテンツ評価部322は、対象となる利用者について、利用者ベクトルVuとコンテンツベクトルVcとのコサイン類似度Smを、利用者ごとにコンテンツを評価した指標として導出する。
【0078】
第3実施形態に係るコンテンツ選択部340は、第2評価結果SCの値が上位であるコンテンツと、コサイン類似度Smの値が上位であるコンテンツとを、所定の割合で混合したコンテンツ群を選択する。コンテンツ配信部350は、コンテンツ選択部340により選択されたコンテンツ群を利用者の端末装置10に配信する。コンテンツ実績解析部360の機能は第1実施形態に係るコンテンツ実績解析部160の機能と同様である。
【0079】
以上説明した第3実施形態のマス・コンテンツ評価部310(コンテンツ評価装置)によれば、第1実施形態と同様の効果を奏することができる。
【0080】
なお、コンテンツ選択部340は、第2評価結果SCの値が上位であるコンテンツと、コサイン類似度Smの値が上位であるコンテンツとを、所定の割合で混合したコンテンツ群を選択するものとしたが、これに限らず、ページ、サイト、サービス、ドメインなどに応じて、第2評価結果SCの値が上位であるコンテンツと、コサイン類似度Smの値が上位であるコンテンツとのいずれか一方を選択してもよい。また、コンテンツ選択部340は、利用者の行動ログが十分に蓄積されていない段階では第2評価結果SCの値が上位であるコンテンツを選択し、利用者の行動ログが蓄積されるのに応じてコサイン類似度Smの値が上位であるコンテンツの割合を増やすようにしてもよい。また、コンテンツ選択部340は、ランダムな要素を加味してコンテンツを選択してもよい。
【0081】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。