特許第6986943号(P6986943)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許6986943コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム
<>
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000006
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000007
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000008
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000009
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000010
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000011
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000012
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000013
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000014
  • 特許6986943-コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム 図000015
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6986943
(24)【登録日】2021年12月2日
(45)【発行日】2021年12月22日
(54)【発明の名称】コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラム
(51)【国際特許分類】
   G06F 13/00 20060101AFI20211213BHJP
   G06Q 30/06 20120101ALI20211213BHJP
   H04N 21/258 20110101ALI20211213BHJP
【FI】
   G06F13/00 540C
   G06Q30/06 300
   H04N21/258
【請求項の数】7
【全頁数】17
(21)【出願番号】特願2017-233200(P2017-233200)
(22)【出願日】2017年12月5日
(65)【公開番号】特開2019-101842(P2019-101842A)
(43)【公開日】2019年6月24日
【審査請求日】2020年3月6日
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】大倉 俊平
(72)【発明者】
【氏名】湯浅 翔悟
(72)【発明者】
【氏名】山本 悠
(72)【発明者】
【氏名】星野 真吾
(72)【発明者】
【氏名】宇野 秀平
【審査官】 今川 悟
(56)【参考文献】
【文献】 特開2015−207321(JP,A)
【文献】 特開2009−152683(JP,A)
【文献】 特開2014−120012(JP,A)
【文献】 特開2007−213586(JP,A)
【文献】 特開2010−205279(JP,A)
【文献】 特開2002−015207(JP,A)
【文献】 特開2015−099265(JP,A)
【文献】 米国特許出願公開第2014/0279043(US,A1)
【文献】 米国特許出願公開第2011/0197130(US,A1)
【文献】 中国特許出願公開第108921624(CN,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06F 13/00
G06Q 30/06
H04N 21/258
(57)【特許請求の範囲】
【請求項1】
所定規則に基づいて、ネットワークを介して利用者に配信されるコンテンツを評価した第1評価結果を取得する取得部と、
前記取得部により取得された前記第1評価結果および前記コンテンツを利用者が視聴すると予測される時間である予測滞在時間に基づく第2評価結果を、前記コンテンツを配信する際の指標として導出する評価部と、
を備え
前記評価部は、前記コンテンツに含まれる画像の位置に基づいて、前記予測滞在時間を導出する、
コンテンツ評価装置。
【請求項2】
前記評価部は、前記コンテンツに含まれる文字数に基づいて、前記予測滞在時間を導出する、
請求項1記載のコンテンツ評価装置。
【請求項3】
前記所定規則は、利用者の属性に依存しない規則である、
請求項1または2記載のコンテンツ評価装置。
【請求項4】
利用者の属性に依存する規則によってコンテンツを評価する利用者ごとコンテンツ評価部を更に備え、
前記第2評価結果と、前記利用者ごとコンテンツ評価部の評価結果とを前記コンテンツを配信するための指標として出力する、
請求項記載のコンテンツ評価装置。
【請求項5】
請求項1からのうちいずれか1項記載のコンテンツ評価装置と、
前記コンテンツ評価装置の評価結果に基づいてコンテンツを選択する選択部と、
前記選択部により選択されたコンテンツを利用者の端末装置に配信する配信部と、
を備えるコンテンツ配信システム。
【請求項6】
コンピュータが、
所定規則に基づいて、ネットワークを介して利用者に配信されるコンテンツを評価した第1評価結果を取得し、
前記取得された前記第1評価結果および前記コンテンツを利用者が視聴すると予測される時間である予測滞在時間に基づく第2評価結果を、前記コンテンツを配信する際の指標として導出し、
前記指標の導出において、前記コンテンツに含まれる画像の位置に基づいて、前記予測滞在時間を導出する、
コンテンツ評価方法。
【請求項7】
コンピュータに、
所定規則に基づいて、ネットワークを介して利用者に配信されるコンテンツを評価した第1評価結果を取得させ、
前記取得された前記第1評価結果および前記コンテンツを利用者が視聴すると予測される時間である予測滞在時間に基づく第2評価結果を、前記コンテンツを配信する際の指標として導出させ
前記指標の導出において、前記コンテンツに含まれる画像の位置に基づいて、前記予測滞在時間を導出させる、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラムに関する。
【背景技術】
【0002】
ネットワークを介して利用者に提供されるニュース記事等のコンテンツをその内容に基づいて評価し、評価結果に基づいて、インターネットのサイト等におけるコンテンツの掲載有無や掲載順を決定することが行われている。例えば、特許文献1に記載の発明では、記事情報の重要度と情報鮮度とに基づいて掲載順を決定している。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2017−59057号公報
【特許文献2】特開2016−29536号公報
【特許文献3】特開2015−19771号公報
【特許文献4】特開2009−3740号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記特許文献2〜4に記載の発明では、コンテンツを利用者が視聴する時間を測定または予測することが記載されているが、それらの情報をコンテンツの掲載有無や掲載順と結び付けて利用することについて記載されていない。このため、従来の技術では、配信者のニーズに応じた評価基準でコンテンツを評価することができない場合があった。
【0005】
本発明は、このような事情を考慮してなされたものであり、配信者のニーズに応じた評価基準でコンテンツを評価することが可能なコンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、所定規則に基づいて、ネットワークを介して利用者に配信されるコンテンツを評価した第1評価結果を取得する取得部と、前記取得部により取得された前記第1評価結果および前記コンテンツを利用者が視聴すると予測される時間である予測滞在時間に基づく第2評価結果を、前記コンテンツを配信する際の指標として導出する評価部と、を備えるコンテンツ評価装置である。
【発明の効果】
【0007】
本発明の一態様によれば、配信者のニーズに応じた評価基準でコンテンツを評価することが可能なコンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラムを提供することができる。
【図面の簡単な説明】
【0008】
図1】第1実施形態のコンテンツ評価装置(コンテンツ評価部110)を利用したコンテンツ配信システム100の利用環境および構成の一例を示す図である。
図2】第1評価部112による処理の内容を模式的に示す図である。
図3】コンテンツの文字数と予測滞在時間との関係の一例を示す図である。
図4】第1実施形態のコンテンツ評価部110により実行される処理の流れの一例を示すフローチャートである。
図5】第1実施形態のコンテンツ選択部140およびコンテンツ配信部150により実行される処理の流れの一例を示すフローチャートである。
図6】第2実施形態のコンテンツ評価装置(コンテンツ評価部220)を利用したコンテンツ配信システム200の利用環境および構成の一例を示す図である。
図7】第2実施形態の第1評価部222の構成および機能の一例を示す図である。
図8】第2実施形態のコンテンツ評価部220により実行される部分的な処理の流れの一例を示すフローチャートである。
図9】第2実施形態のコンテンツ配信システム200により実行される処理の流れの一例を示すフローチャートである。
図10】第3実施形態のコンテンツ評価装置(マス・コンテンツ評価部310)を利用したコンテンツ配信システム300の利用環境および構成の一例を示す図である。
【発明を実施するための形態】
【0009】
<概要>
以下、図面を参照し、本発明のコンテンツ評価装置、コンテンツ配信システム、コンテンツ評価方法、およびプログラムの実施形態について説明する。コンテンツ評価装置は、ネットワークを介して利用者に配信されるコンテンツを評価する装置である。コンテンツ評価装置やコンテンツ配信システムは、一以上のプロセッサにより実現される。コンテンツとは、例えばニュース記事であるが、動画などの他のコンテンツであってもよい。以下の説明では、コンテンツはニュース記事であるものとする。また、報道性の有無を問わず、何らかの情報を伝えるものであればニュース記事に該当するものとする。ニュース記事には、少なくともテキスト情報が含まれ、そのため文字数がカウント可能である。また、ニュース記事には、テキストでないもの、例えば静止画や動画、インターフェースとして機能する図形(スイッチ)、装飾エフェクトなどが含まれてもよい。
【0010】
コンテンツ評価装置は、所定規則に基づいてコンテンツを評価した第1評価結果と、コンテンツを利用者が視聴すると予測される時間である予測滞在時間と、に基づく第2評価結果を導出する。この第2評価結果は、コンテンツの掲載有無や掲載順を決定する際の指標として用いられる。コンテンツ評価装置は、第1評価結果を自ら導出することで取得してもよいし、他装置から第1評価結果を取得してもよい。また、コンテンツ評価装置は、コンテンツを配信する装置と統合されてもよいし、別体として構成されてもよい。以下の実施形態ではコンテンツ評価装置は、コンテンツを配信する装置と統合されてコンテンツ配信システムとして機能するものとする。
【0011】
<第1実施形態>
[構成]
以下、第1実施形態について説明する。図1は、第1実施形態のコンテンツ評価装置(コンテンツ評価部110)を利用したコンテンツ配信システム100の利用環境および構成の一例を示す図である。
【0012】
コンテンツ配信システム100は、ネットワークNWを介して利用者の端末装置10と通信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などを含む。
【0013】
端末装置10は、例えば、スマートフォンなどの携帯電話、タブレット端末、各種パーソナルコンピュータなどの、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。通信装置は、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどを含む。端末装置10では、ブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、利用者の入力する内容に応じたリクエストをコンテンツ配信システム100に送信する。また、UAは、コンテンツ配信システム100から取得した情報に基づいて、各種画像を表示する。
【0014】
コンテンツ配信システム100は、ブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供する端末装置10に提供するアプリサーバとして機能する。コンテンツ配信システム100は、NICなどのネットワークカードを備える。
【0015】
コンテンツ配信システム100は、例えば、コンテンツ評価部110と、コンテンツ選択部140と、コンテンツ配信部150と、コンテンツ実績解析部160とを備える。コンテンツ評価部110は、第1評価部112と、第2評価部114とを備える。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0016】
コンテンツ配信システム100は、記憶部190に記憶された情報を参照し、適宜、処理結果を記憶部190に書込みながら処理を行う。記憶部190は、RAM(Random Access Memory)やROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリなどにより実現される。記憶部190には、コンテンツ配信システム100のハードウェアプロセッサが実行するプログラムが格納されていてもよい。記憶部190は、コンテンツ配信システム100に附属する(コンテンツ配信システム100またはコンテンツ評価部110が備える)ものであってもよいし、コンテンツ配信システム100がネットワークNWを介してアクセス可能なNAS(Network Attached Storage)などの外部装置であってもよい。記憶部190には、例えば、上記のプログラムの他、コンテンツ情報191、利用者情報192、行動ログ193、コンテンツ実績情報194、学習モデル情報195などの情報が格納される。
【0017】
コンテンツ情報191は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。利用者情報192は、利用者の識別情報である利用者ID、利用者のデモグラ情報(年齢、性別、職業、住所その他の情報をいう)等を含む。行動ログ193は、利用者によるコンテンツの閲覧履歴に基づく情報である。コンテンツ実績情報194は、コンテンツごとの閲覧実績に基づく情報である。学習モデル情報195は、第1評価部112により学習される学習モデルを規定する情報である。これらの詳細については、以下において適宜説明を追加する。
【0018】
[第1評価部]
第1評価部112は、例えば、利用者の属性に依存しない所定規則に基づいて、コンテンツを評価した推定重要度(第1評価結果の一例)を導出する。図2は、第1評価部112による処理の内容を模式的に示す図である。第1評価部112は、例えば、最初の数回はコンテンツ情報191のみを用いて推定重要度を求め、過去の実績値が入力され始めると、それを用いて修正が入るように、RNN(Recurrent Neural Network)を構成する。なお、所定規則は、以下に説明する規則に加えて、利用者の属性に依存する何らかの要素が加味された規則であってもよい。
【0019】
まず、第1評価部112は、ニュース記事が入稿され、コンテンツ情報191として記憶部190に格納された段階で、当該ニュース記事に関するコンテンツ情報の疎ベクトルxから分散表現yを求める。係る処理は、式(1)で表される。式中、Aは行列であり、aはベクトルである。関数f()は、式(2)で表される。すなわち、関数f()は、ベクトルの各要素について負であればゼロに置換する関数である。
【0020】
【数1】
【0021】
前述したように、コンテンツ情報191は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。第1評価部112は、例えば、tf−idf(Term Frequency-Inverse Document Frequency)やword2vec等の技術を用いて、テキスト情報をベクトル化する。また、画像や音声に対しては種々の技術に基づいてベクトル形式の特徴量を求める。第1評価部112は、上記の各種情報から得られるベクトルデータを統合し(例えば加算し)、コンテンツ情報の疎ベクトルxを求める。
【0022】
第1評価部112は、時間の経過と共に、以下の処理を繰り返し実行する。
【0023】
第1評価部112は、繰り返し実行される中でのk回目の処理として、k−1回目の処理で求められた特徴情報yk−1と、当該回の時刻情報tおよび実績情報hとに基づいて、特徴情報yを求める処理を行う。係る処理は、式(3)で表される。実績情報の詳細については後述する。式中、Bは行列であり、bはベクトルであり、Tは転置を表している。第1評価部112は、特徴情報yk−1の転置ベクトルと時刻情報tの転置ベクトルと実績情報hの転置ベクトルとを並べて得られる行列と行列Bを乗算し、ベクトルbを加算することで、特徴情報yを求める。
【0024】
【数2】
【0025】
次に、第1評価部112は、特徴情報yに基づいて、時刻「k」における推定素性zを算出する。係る処理は、式(4)で表される。式中、Cは行列であり、cはベクトルである。関数σ()は、式(5)で表されるシグモイド関数である。
【0026】
【数3】
【0027】
次に、第1評価部112は、推定素性zに基づいて、推定重要度wを算出する。係る処理は、式(6)で表される。式中、Dは行列であり、dはベクトルである。
【0028】
【数4】
【0029】
このようにして繰り返し求められる推定重要度wのうち最新のものが、当該コンテンツの推定重要度wkとして扱われる。
【0030】
第1評価部112は、例えば、確率的勾配降下法(SGD;Stochastic Gradient Descent)等の手法を用いて、行列A〜D、およびベクトルa〜dの値を学習する。そして、第1評価部112は、学習結果に基づいて、RNNにおける接続係数を修正する。これによって、推定重要度wの推定精度を向上させることができる。学習された接続係数は、学習モデル情報195の一部として記憶部190に格納される。学習モデル情報195は、ニューロンの接続情報や接続係数などを含む情報である。
【0031】
[実績情報について]
以下、実績情報hについて説明する。コンテンツ配信部150は、コンテンツを配信する際に、行動ログ193を蓄積する。なお、係る処理はコンテンツ配信システム100とは別体のログ収集装置によって行われてもよい。行動ログ193は、例えば、利用者ごとのコンテンツの閲覧履歴を示す情報である。コンテンツ実績解析部160は、行動ログ193に基づいてコンテンツ実績情報194を生成する。コンテンツ実績情報194は、例えば、コンテンツごと、過去の所定時間前まで振り返った場合の時間帯ごとのインプレッション数、クリック数、ツイート数などの情報である。あるコンテンツに対応するコンテンツ実績情報194が、前述した実績情報hとして扱われる。例えば、実績情報hは、対象となっているコンテンツの過去の所定時間前まで振り返った場合の時間帯ごとのインプレッション数をベクトル化したものである。
【0032】
第1評価部112が繰り返し処理を行う中で、コンテンツであるニュース記事の入稿直後には、実績情報hはゼロベクトルとなる。このため、入稿直後には、専らコンテンツ情報191に基づいて推定重要度wが導出される。その後、実績情報hが有意な値を持ち始めると、推定重要度wにおける実績情報hの影響が大きくなっていく。これによって、より柔軟に推定重要度w(第1評価結果)を導出することができる。
【0033】
[第2評価部]
第2評価部114は、対象となるコンテンツについて、第1評価部112により導出された推定重要度wと、予測滞在時間とに基づいて第2評価結果を導出する。予測滞在時間とは、対象となるコンテンツを利用者が視聴すると予測される時間である。第2評価部は、例えば、コンテンツの文字数が多くなるほど予測滞在時間が長くなるように、予測滞在時間を推定する。但し、コンテンツの文字数が余り多くなると利用者が途中で視聴を止めることも生じ得るため、第2評価部114は、コンテンツの文字数の増加に応じて予測滞在時間の変化率が小さくなるように予測滞在時間を推定してもよい。図3は、コンテンツの文字数と予測滞在時間との関係の一例を示す図である。
【0034】
また、予測滞在時間の推定における他の要素として、画像の有無、画像の特性などが考慮されてもよい。例えば、第2評価部114は、画像の特性として、ニュース記事の内容を端的に示唆している画像であることを示す情報が、画像またはコンテンツに付与されている場合、そうでない場合に比して予測滞在時間を短く推定する。逆に、画像の特性として、ニュース記事の内容と余り関係の無い画像であることを示す情報が、画像またはコンテンツに付与されている場合、そうでない場合に比して予測滞在時間を長く推定してもよい。いずれの場合も、第2評価部114は、画像の表示位置がコンテンツの表示面に対して上側にあるほど、予測滞在時間を短く、或いは長くする修正量を大きくしてよい。
【0035】
第2評価部114は、上記の傾向を統合して予測滞在時間を推定する。第2評価部114による予測滞在時間tcの推定手法は、例えば、式(7)で表される。g()は、上記の傾向を実現するための任意の関数である。
【0036】
tc=g{(文字数)、(画像の有無)、(画像の特性)、(画像の位置)} …(7)
【0037】
そして、第2評価部114は、例えば、推定重要度wに予測滞在時間tcを乗算し、コンテンツを配信する際の指標として用いられる第2評価結果SCを導出する。係る処理は、式(8)で表される。第2評価結果SCが高いということは、コンテンツ自体の重要度が高いため利用者のクリック率が高いと推定され、且つそのコンテンツの視聴が開始されると比較的長い時間、視聴が継続されることを意味する。従って、第2評価結果SCが長いコンテンツを優先的に配信することで、利用者への満足度を向上させたり、サービスへの定着を促進したり、利用者の位置情報などを多く取得できたりするといった効果が期待できる。これらの効果は、コンテンツの配信者のニーズに応じたものである場合がある。従って、コンテンツ評価部110によれば、配信者のニーズに応じた評価基準でコンテンツを評価することができる。
【0038】
SC=w×tc …(8)
【0039】
[コンテンツの配信]
コンテンツ選択部140は、第2評価結果SCに基づいて、利用者に配信するコンテンツを選択する。例えば、コンテンツ選択部140は、第2評価結果SCが高い順にコンテンツを選択すると共に、一定割合でランダムに選択したコンテンツを混入させる。コンテンツ配信部150は、コンテンツ選択部140により選択されたコンテンツを利用者の端末装置10に配信する。
【0040】
[処理フロー]
図4は、第1実施形態のコンテンツ評価部110により実行される処理の流れの一例を示すフローチャートである。本フローチャートの処理は、繰り返し実行される。まず、コンテンツ評価部110は、評価タイミングが到来したか否かを判定する(S100)。評価タイミングとは、例えば、定期的に到来するタイミングであってもよいし、更に、新たにニュース記事が入稿されたタイミングを含んでもよい。
【0041】
評価タイミングが到来すると、コンテンツ評価部110は、S110〜S118の処理を、対象となるコンテンツごとに行う。対象となるコンテンツとは、全てのコンテンツであってもよいし、新たにニュース記事が入稿されたタイミングにおいては、入稿されたコンテンツに限定されてもよい。また、古くなったコンテンツについては適宜、対象から外れるようにしてもよい。
【0042】
まず、コンテンツ実績解析部160が、コンテンツ実績情報194を更新する(S110)。なお、S110の処理は、本フローチャートの処理とは非同期で実行されてもよい。
【0043】
次に、第1評価部112が、第1評価値(推定重要度w)を導出する(S112)。次に、第2評価部114が、対象となるコンテンツの予測滞在時間tcを導出、または記憶部190から読み出す(S114)。予測滞在時間tcが経時的変化をしないものである場合、第2評価部114は、あるコンテンツについて一度、予測滞在時間tcを導出すると、結果を記憶部190に記憶させておき、以降の処理では記憶部190から読み出すようにしてよい。
【0044】
次に、第2評価部114が、第2評価結果SCを導出する(S116)。コンテンツ評価部110は、上記の処理の過程で得られた各種情報、および第2評価結果SCを、記憶部190に格納する(S118)。これによって、本フローチャートの1ルーチンの処理が終了する。
【0045】
図5は、第1実施形態のコンテンツ選択部140およびコンテンツ配信部150により実行される処理の流れの一例を示すフローチャートである。まず、コンテンツ配信部150は、コンテンツのリクエストがあったか否かを判定する(S120)。
【0046】
コンテンツのリクエストがあった場合、コンテンツ選択部140が、前述したように第2評価結果SCに基づいてコンテンツを選択し(S130)、コンテンツ配信部150がS130で選択されたコンテンツを利用者の端末装置10に配信する(S132)。そして、コンテンツ配信部150は、当該利用者の行動ログを更新する(S134)。これによって、本フローチャートの1ルーチンの処理が終了する。
【0047】
以上説明した第1実施形態のコンテンツ評価部110(コンテンツ評価装置)によれば、所定規則に基づいて、ネットワークNWを介して利用者に配信されるコンテンツを評価した第1評価結果を導出する(取得する)第1評価部112と、第1評価部112により導出された第1評価結果および予測滞在時間に基づく第2評価結果を、コンテンツを配信する際の指標として導出する第2評価部114と、を備えることにより、配信者のニーズに応じた評価基準でコンテンツを評価することができる。
【0048】
なお、第1実施形態における第1評価結果の導出手法は、あくまで一例である。第1評価結果は、他の規則によって導出されてもよい。
【0049】
<第2実施形態>
以下、第2実施形態について説明する。図6は、第2実施形態のコンテンツ評価装置(コンテンツ評価部220)を利用したコンテンツ配信システム200の利用環境および構成の一例を示す図である。
【0050】
コンテンツ配信システム200は、ネットワークNWを介して利用者の端末装置10と通信する。端末装置10に関しては第1実施形態と同様であるため説明を省略する。コンテンツ配信システム200は、ブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供する端末装置10に提供するアプリサーバとして機能する。コンテンツ配信システム200は、NICなどのネットワークカードを備える。
【0051】
コンテンツ配信システム200は、例えば、コンテンツ評価部220と、コンテンツ選択部240と、コンテンツ配信部250と、コンテンツ実績解析部260とを備える。コンテンツ評価部220は、第1評価部222と、第2評価部224とを備える。これらの構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0052】
コンテンツ配信システム200は、記憶部290に記憶された情報を参照し、適宜、処理結果を記憶部290に書込みながら処理を行う。記憶部290は、RAMやROM、HDD、フラッシュメモリなどにより実現される。記憶部290には、コンテンツ配信システム200のハードウェアプロセッサが実行するプログラムが格納されていてもよい。記憶部290は、コンテンツ配信システム200に附属する(コンテンツ配信システム200またはコンテンツ評価部220が備える)ものであってもよいし、コンテンツ配信システム200がネットワークNWを介してアクセス可能なNASなどの外部装置であってもよい。記憶部290には、例えば、上記のプログラムの他、コンテンツ情報291、利用者情報292、行動ログ293、コンテンツ実績情報294、学習モデル情報295などの情報が格納される。
【0053】
コンテンツ情報291は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。利用者情報292は、利用者の識別情報である利用者ID、利用者のデモグラ情報等を含む。行動ログ293は、利用者によるコンテンツの閲覧履歴に基づく情報である。コンテンツ実績情報294は、コンテンツごとの閲覧実績に基づく情報である。学習モデル情報295は、第1評価部222により学習される学習モデルを規定する情報である。これらの詳細については、以下において適宜説明を追加する。
【0054】
[第1評価部]
図7は、第2実施形態の第1評価部222の構成および機能の一例を示す図である。第1評価部222は、コンテンツベクトル生成部222Aと、利用者ベクトル生成部222Bと、類似度判定部222Cとを備える。第1評価部222は、以下に説明するように利用者の行動ログに基づく属性に依存する規則によってコンテンツを評価する。
【0055】
コンテンツベクトル生成部222Aは、まず、コンテンツの内容に対して形態素解析などを行って、テキスト情報を単語(形態素)に分割する。次に、コンテンツベクトル生成部222Aは、各単語に対してword2vecなどの手法を適用して、分散表現化された単語ベクトルを取得する。形態素解析とword2vecとのうち一方または双方は、コンテンツベクトル生成部222Aが自ら処理を行うのではなく、外部装置に処理を依頼することで実現されてもよい。
【0056】
そして、コンテンツベクトル生成部222Aは、コンテンツから取得された一以上の単語ベクトルをコンテンツベクトル導出モデルに入力することで、コンテンツベクトルVcを導出する。コンテンツベクトル導出モデルは、例えば、機械学習によって生成されるモデルである。コンテンツベクトル導出モデルは、例えば、ディープラーニングなどの手法により、既知の単語ベクトルとコンテンツベクトルVcとの関係が再現できるような、隠れ層の活性化関数のパラメータ(接続係数)を求めることで生成される。
【0057】
なお、上記の定義に拘わらず、コンテンツベクトル導出モデルは、word2vecの特定、すなわち、どのようなコーパスをword2vecに与えるか、までを含んでもよい。
【0058】
コンテンツベクトル生成部222Aは、生成したコンテンツベクトルVcを、コンテンツIDと共に学習モデル情報295の一部として記憶部290に格納する。
【0059】
利用者ベクトル生成部222Bは、行動ログ293を参照し、利用者が閲覧したコンテンツのコンテンツIDを取得し、取得したコンテンツIDに対応するコンテンツベクトルVcを記憶部290から取得する。利用者ベクトル生成部222Bは、取得された一以上のコンテンツベクトルVcを利用者ベクトル導出モデルに入力することで、利用者ベクトルVuを導出する。利用者ベクトル導出モデルは、例えば、機械学習によって生成されるモデルである。利用者ベクトル導出モデルは、例えば、ディープラーニングなどの手法により、既知のコンテンツベクトルVcと利用者ベクトルVuとの関係が再現できるような、隠れ層の活性化関数のパラメータ(接続係数)を求めることで生成される。利用者ベクトル生成部222Bは、生成した利用者ベクトルVuを、利用者IDと共に学習モデル情報295の一部として記憶部290に格納する。学習モデル情報295には、更に、コンテンツベクトル導出モデルや利用者ベクトル導出モデルを規定する情報(例えば、それらのニューロン接続情報や接続係数など)が含まれる。なお、利用者ベクトルVuは、閲覧したコンテンツのコンテンツベクトルVc以外の要素を反映させて作成されてもよい。コンテンツベクトルVc以外の要素とは、例えば、利用者の入力したクエリ、コンテンツに該当しないウェブページの閲覧履歴、利用者のデモグラ情報などのうち一部または全部である。
【0060】
類似度判定部222Cは、例えば、対象となる利用者について、利用者ベクトルVuとコンテンツベクトルVcとのコサイン類似度Smを、利用者ごとにコンテンツを評価した第1評価結果として導出する。
【0061】
[第2評価部]
第2評価部224は、第1実施形態の第2評価部114と同様に、第1評価結果であるコサイン類似度Smに予測滞在時間tcを乗算し、コンテンツを配信する際の指標として用いられる第2評価結果SC*を導出する。第2評価結果SC*は、利用者の属性(行動ログ)に依存する規則でコンテンツを評価した結果である。
【0062】
[コンテンツの配信]
コンテンツ選択部240は、第2評価結果SC*に基づいて、利用者に配信するコンテンツを選択する。例えば、コンテンツ選択部240は、第2評価結果SC*が高い順にコンテンツを選択すると共に、一定割合でランダムに選択したコンテンツを混入させる。コンテンツ配信部250は、コンテンツ選択部240により選択されたコンテンツを利用者の端末装置10に配信する。
【0063】
[処理フロー]
図8は、第2実施形態のコンテンツ評価部220により実行される部分的な処理の流れの一例を示すフローチャートである。まず、コンテンツ評価部220は、コンテンツが入稿されたか否かを判定する(S200)。
【0064】
コンテンツが入稿されると、第1評価部222のコンテンツベクトル生成部222Aは、コンテンツベクトルVcを導出し、記憶部290に格納する(S210)。また、第2評価部224は、当該コンテンツの予測滞在時間を導出し、記憶部に格納しておく(S212)。これによって、本フローチャートの1ルーチンが終了する。
【0065】
図9は、第2実施形態のコンテンツ配信システム200により実行される処理の流れの一例を示すフローチャートである。
【0066】
まず、コンテンツ配信部250は、コンテンツのリクエストがあったか否かを判定する(S220)。
【0067】
コンテンツのリクエストがあった場合、コンテンツ選択部240が、第2評価結果SC*に基づいてコンテンツを選択し(S230)、コンテンツ配信部250がS230で選択されたコンテンツを利用者の端末装置10に配信する(S232)。そして、コンテンツ配信部250は、当該利用者の行動ログを更新する(S234)。
【0068】
次に、利用者ベクトル生成部222Bが、更新された行動ログに基づいて、利用者ベクトルVuを生成する(S236)。次に、類似度判定部222Cが、S236で生成された利用者ベクトルVuと、既に生成されている各コンテンツのコンテンツベクトルVcとに基づいて、コンテンツごとに第1評価結果(コサイン類似度Sm)を導出する(S238)。
【0069】
次に、第2評価部224が、S238で導出された第1評価結果と、予め導出された予測滞在時間とに基づいて、コンテンツごとに第2評価結果SC*を導出し(S240)、第2評価結果SC*を記憶部290に格納する(S242)。これによって、本フローチャートの1ルーチンの処理が終了する。
【0070】
以上説明した第2実施形態のコンテンツ評価部210(コンテンツ評価装置)によれば、第1実施形態と同様の効果を奏することができる。
【0071】
<第3実施形態>
以下、第3実施形態について説明する。図10は、第3実施形態のコンテンツ評価装置(マス・コンテンツ評価部310)を利用したコンテンツ配信システム300の利用環境および構成の一例を示す図である。
【0072】
コンテンツ配信システム300は、ネットワークNWを介して利用者の端末装置10と通信する。端末装置10に関しては第1実施形態と同様であるため説明を省略する。コンテンツ配信システム300は、ブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供する端末装置10に提供するアプリサーバとして機能する。コンテンツ配信システム300は、NICなどのネットワークカードを備える。
【0073】
コンテンツ配信システム300は、例えば、マス・コンテンツ評価部310と、利用者ごとコンテンツ評価部322と、コンテンツ選択部340と、コンテンツ配信部350と、コンテンツ実績解析部360とを備える。マス・コンテンツ評価部310は、第1評価部312と、第2評価部314とを備える。これらの構成要素は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0074】
コンテンツ配信システム300は、記憶部390に記憶された情報を参照し、適宜、処理結果を記憶部290に書込みながら処理を行う。記憶部390は、RAMやROM、HDD、フラッシュメモリなどにより実現される。記憶部390には、コンテンツ配信システム300のハードウェアプロセッサが実行するプログラムが格納されていてもよい。記憶部390は、コンテンツ配信システム300に附属する(コンテンツ配信システム300、マス・コンテンツ評価部310、または利用者ごとコンテンツ評価部322が備える)ものであってもよいし、コンテンツ配信システム300がネットワークNWを介してアクセス可能なNASなどの外部装置であってもよい。記憶部390には、例えば、上記のプログラムの他、コンテンツ情報391、利用者情報392、行動ログ393、コンテンツ実績情報394、学習モデル情報395などの情報が格納される。
【0075】
コンテンツ情報391は、ニュース記事に含まれるテキスト情報、画像、音声等の内容、ニュース記事の配信元や著者等の情報を含む。利用者情報392は、利用者の識別情報である利用者ID、利用者のデモグラ情報等を含む。行動ログ393は、利用者によるコンテンツの閲覧履歴に基づく情報である。コンテンツ実績情報394は、コンテンツごとの閲覧実績に基づく情報である。学習モデル情報395は、第1評価部312および利用者ごとコンテンツ評価部322によりそれぞれ学習される学習モデルを規定する情報である。これらの詳細については、以下において適宜説明を追加する。
【0076】
マス・コンテンツ評価部310の第1評価部312および第2評価部314は、第1実施形態に係るコンテンツ評価部110の第1評価部112および第2評価部114と同様の機能を有する。すなわち、マス・コンテンツ評価部310は、推定重要度wに予測滞在時間tcを乗算し、コンテンツを配信する際の指標として用いられる第2評価結果SCを導出する。
【0077】
利用者ごとコンテンツ評価部322は、第2実施形態に係るコンテンツ評価部220の第1評価部222と同様の機能を有する。すなわち、利用者ごとコンテンツ評価部322は、対象となる利用者について、利用者ベクトルVuとコンテンツベクトルVcとのコサイン類似度Smを、利用者ごとにコンテンツを評価した指標として導出する。
【0078】
第3実施形態に係るコンテンツ選択部340は、第2評価結果SCの値が上位であるコンテンツと、コサイン類似度Smの値が上位であるコンテンツとを、所定の割合で混合したコンテンツ群を選択する。コンテンツ配信部350は、コンテンツ選択部340により選択されたコンテンツ群を利用者の端末装置10に配信する。コンテンツ実績解析部360の機能は第1実施形態に係るコンテンツ実績解析部160の機能と同様である。
【0079】
以上説明した第3実施形態のマス・コンテンツ評価部310(コンテンツ評価装置)によれば、第1実施形態と同様の効果を奏することができる。
【0080】
なお、コンテンツ選択部340は、第2評価結果SCの値が上位であるコンテンツと、コサイン類似度Smの値が上位であるコンテンツとを、所定の割合で混合したコンテンツ群を選択するものとしたが、これに限らず、ページ、サイト、サービス、ドメインなどに応じて、第2評価結果SCの値が上位であるコンテンツと、コサイン類似度Smの値が上位であるコンテンツとのいずれか一方を選択してもよい。また、コンテンツ選択部340は、利用者の行動ログが十分に蓄積されていない段階では第2評価結果SCの値が上位であるコンテンツを選択し、利用者の行動ログが蓄積されるのに応じてコサイン類似度Smの値が上位であるコンテンツの割合を増やすようにしてもよい。また、コンテンツ選択部340は、ランダムな要素を加味してコンテンツを選択してもよい。
【0081】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0082】
100、200、300 コンテンツ配信システム
110、220 コンテンツ評価部
112、222、312 第1評価部
114、224、314 第2評価部
140、240、340 コンテンツ選択部
150、250、350 コンテンツ配信部
160、260、360 コンテンツ実績解析部
190、290、390 記憶部
191、291、391 コンテンツ情報
192、292、392 利用者情報
193、293、393 行動ログ
194、294、394 コンテンツ実績情報
195、295、395 学習モデル情報
310 マス・コンテンツ評価部
322 利用者ごとコンテンツ評価部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10