IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7179033コンテンツ選択装置、コンテンツ選択方法、およびプログラム
<>
  • 特許-コンテンツ選択装置、コンテンツ選択方法、およびプログラム 図1
  • 特許-コンテンツ選択装置、コンテンツ選択方法、およびプログラム 図2
  • 特許-コンテンツ選択装置、コンテンツ選択方法、およびプログラム 図3
  • 特許-コンテンツ選択装置、コンテンツ選択方法、およびプログラム 図4
  • 特許-コンテンツ選択装置、コンテンツ選択方法、およびプログラム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-11-17
(45)【発行日】2022-11-28
(54)【発明の名称】コンテンツ選択装置、コンテンツ選択方法、およびプログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20221118BHJP
【FI】
G06Q50/10
【請求項の数】 6
(21)【出願番号】P 2020032705
(22)【出願日】2020-02-28
(65)【公開番号】P2021135855
(43)【公開日】2021-09-13
【審査請求日】2021-07-19
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】岩▲瀬▼ 智亮
【審査官】山内 裕史
(56)【参考文献】
【文献】特開2019-164703(JP,A)
【文献】特開2019-113943(JP,A)
【文献】特開2011-039575(JP,A)
【文献】特開2007-293377(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
ネットワークを介してユーザに提供されるコンテンツの候補となるコンテンツ候補から特徴情報を抽出する抽出部と、
特徴情報を入力すると前記ユーザに提供されるコンテンツとして選択されるか否かを表す結果を出力するように学習された学習済モデルに対して、前記抽出部により抽出された特徴情報を入力することで、前記コンテンツ候補を前記ユーザに提供されるコンテンツとして選択するか否かを決定する決定部と、を備え、
前記学習済モデルは、
k回目の処理において、前記抽出部により抽出された特徴情報と、k-1回目以前の処理における処理結果の少なくとも一部とが入力データとして入力される再帰型モデルであり、
複数のコンテンツ候補のそれぞれを前記コンテンツとして選択するか否かを、前記ユーザと異なるコンテンツ編集者が順次判断した結果を含む学習データセットを用いて学習されたものである、
コンテンツ選択装置。
【請求項2】
k-1回目以前の処理における処理結果の少なくとも一部は、前記k-1回目以前の処理における、前記ユーザに提供されるコンテンツとして選択されるか否かを表す結果を含む、
請求項1記載のコンテンツ選択装置。
【請求項3】
前記コンテンツおよび前記コンテンツ候補は、電子記事であり、
前記抽出部は、前記コンテンツ候補に含まれる単語の有無をベクトル化した情報を、前記特徴情報の少なくとも一部として抽出する、
請求項1または2記載のコンテンツ選択装置。
【請求項4】
複数のコンテンツ候補の特徴情報と、前記複数のコンテンツ候補のそれぞれを前記コンテンツとして選択するか否かを前記コンテンツ編集者が順次判断した結果とを、学習データセットとして再帰型モデルに適用し、前記学習済モデルを生成する学習部を更に備える、
請求項1から3のうちいずれか1項記載のコンテンツ選択装置。
【請求項5】
コンピュータが、
ネットワークを介してユーザに提供されるコンテンツの候補となるコンテンツ候補から特徴情報を抽出し、
特徴情報を入力すると前記ユーザに提供されるコンテンツとして選択されるか否かを表す結果を出力するように学習された学習済モデルに対して、前記抽出された特徴情報を入力することで、前記コンテンツ候補を前記ユーザに提供されるコンテンツとして選択するか否かを決定するコンテンツ選択方法であって、
前記学習済モデルは、
k回目の処理において、前記抽出された特徴情報と、k-1回目以前の処理における処理結果の少なくとも一部とが入力データとして入力される再帰型モデルであり、
複数のコンテンツ候補のそれぞれを前記コンテンツとして選択するか否かを、前記ユーザと異なるコンテンツ編集者が順次判断した結果を含む学習データセットを用いて学習されたものである、
コンテンツ選択方法。
【請求項6】
コンピュータに、
ネットワークを介してユーザに提供されるコンテンツの候補となるコンテンツ候補から特徴情報を抽出させ、
特徴情報を入力すると前記ユーザに提供されるコンテンツとして選択されるか否かを表す結果を出力するように学習された学習済モデルに対して、前記抽出された特徴情報を入力することで、前記コンテンツ候補を前記ユーザに提供されるコンテンツとして選択するか否かを決定させるプログラムであって、
前記学習済モデルは、
k回目の処理において、前記抽出された特徴情報と、k-1回目以前の処理における処理結果の少なくとも一部とが入力データとして入力される再帰型モデルであり、
複数のコンテンツ候補のそれぞれを前記コンテンツとして選択するか否かを、前記ユーザと異なるコンテンツ編集者が順次判断した結果を含む学習データセットを用いて学習されたものである、
プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンテンツ選択装置、コンテンツ選択方法、およびプログラムに関する。
【背景技術】
【0002】
従来、サイトにおける表示を希望するコンテンツとして入稿された入稿コンテンツを取得し、入稿コンテンツを評価してランキングを行う発明が開示されている(特許文献1)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2018-45394号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記従来の技術は、電子商取引のサイトでの情報表示におけるガイドラインに関する情報に基づいて入稿コンテンツを評価しているが、それ以外の評価手法について考察されていない。
【0005】
本発明は、このような事情を考慮してなされたものであり、より人の判断に近い選択をすることが可能なコンテンツ選択装置、コンテンツ選択方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、ネットワークを介して提供されるコンテンツの候補となるコンテンツ候補から特徴情報を抽出する抽出部と、特徴情報を入力すると前記コンテンツとして選択されるか否かを表す結果を出力するように学習された学習済モデルに対して、前記抽出部により抽出された特徴情報を入力することで、前記コンテンツ候補を前記コンテンツとして選択するか否かを決定する決定部と、を備え、前記学習済モデルは、k回目の処理において、前記抽出部により抽出された特徴情報と、k-1回目以前の処理における処理結果の少なくとも一部とが入力データとして入力される再帰型モデルであり、複数のコンテンツ候補のそれぞれを前記コンテンツとして選択するか否かを人が順次判断した結果を含む学習データセットを用いて学習されたものであるものである。
【発明の効果】
【0007】
本発明の一態様によれば、より人の判断に近い選択をすることが可能なコンテンツ選択装置、コンテンツ選択方法、およびプログラムを提供することができる。
【図面の簡単な説明】
【0008】
図1】コンテンツ選択装置を利用したコンテンツ配信装置100の利用環境および構成の一例を示す図である。
図2】コンテンツ配信部110によって端末装置10に配信させるコンテンツ画面の一例を示す図である。
図3】抽出部134の処理内容を模式的に示す図である。
図4】決定部136の処理内容を模式的に示す図である。
図5】学習部138の処理内容を模式的に示す図である。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明のコンテンツ選択装置、コンテンツ選択方法、およびプログラムの実施形態について説明する。コンテンツ選択装置は、一以上のプロセッサにより実現される。コンテンツ選択装置は、ネットワークを介して提供されるコンテンツの候補となるコンテンツ候補を、コンテンツとして選択するか否かを決定する装置である。コンテンツとは、例えば電子記事(電子記事)であるが、動画などの他のコンテンツであってもよい。以下の説明では、コンテンツは電子記事であるものとする。また、報道性の有無を問わず、何らかの情報を伝えるものであれば電子記事に該当するものとする。電子記事には、少なくともテキスト情報が含まれる。また、電子記事には、テキストでないもの、例えば静止画や動画、インターフェースとして機能する図形(スイッチ)、装飾エフェクトなどが含まれてもよい。
【0010】
コンテンツ選択装置は、コンテンツ候補から特徴情報を抽出し、特徴情報を入力するとコンテンツとして選択されるか否かを表す結果を出力するように学習された学習済モデルに対して、抽出した特徴情報を入力することで、コンテンツ候補をコンテンツとして選択するか否かを決定する。学習済モデルは、k回目の処理において、抽出された特徴情報と、k-1回目以前の処理における処理結果の少なくとも一部とが入力データとして入力される再帰型モデルである。学習済モデルは、過去に、複数のコンテンツ候補の特徴情報と、それらの複数のコンテンツ候補のそれぞれをコンテンツとして選択するか否かを人が順次判断した結果とを、学習データセットとして学習されたものである。これによって、コンテンツ選択装置は、より人の判断に近い選択をすることができる。
【0011】
コンテンツ選択装置は、単体で処理を行う装置であってもよいし、他の装置に包含される仮想的な装置であってもよい。以下の説明では、コンテンツ選択装置がコンテンツ配信装置に包含されるものとして説明する。
【0012】
[構成]
図1は、コンテンツ選択装置を利用したコンテンツ配信装置100の利用環境および構成の一例を示す図である。コンテンツ配信装置100は、ネットワークNWを介して利用者の端末装置10と通信する。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、セルラー網などを含む。
【0013】
端末装置10は、例えば、スマートフォンなどの携帯電話、タブレット端末、パーソナルコンピュータなどである。端末装置10では、ブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、利用者の入力する内容に応じたリクエストをコンテンツ配信装置100に送信する。また、UAは、コンテンツ配信装置100から取得した情報に基づいて、各種画像を表示する。
【0014】
コンテンツ配信装置100は、NICなどのネットワークカードを備える。コンテンツ配信装置100は、ブラウザからのリクエストに応じてウェブページを端末装置10に提供するウェブサーバ、またはアプリケーションプログラムからのリクエストに応じて画像や音声を提供する端末装置10に提供するアプリサーバとして機能する。
【0015】
コンテンツ配信装置100は、例えば、コンテンツ配信部110と、第1コンテンツ選択部120と、第2コンテンツ選択部130とを備える。第2コンテンツ選択部130は、例えば、取得部132と、抽出部134と、決定部136と、学習部138とを備える。第2コンテンツ選択部130がコンテンツ選択装置に相当する。これらの構成要素は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。また、これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0016】
コンテンツ配信装置100は、記憶部150に記憶された情報を参照し、適宜、処理結果を記憶部150に書込みながら処理を行う。記憶部150は、RAM(Random Access Memory)やROM(Read Only Memory)、HDD(Hard Disk Drive)、フラッシュメモリなどにより実現される。記憶部150には、コンテンツ配信装置100のハードウェアプロセッサが実行するプログラムが格納されていてもよい。記憶部150は、コンテンツ配信装置100に附属する(コンテンツ配信装置100が備える)ものであってもよいし、コンテンツ配信装置100がネットワークNWを介してアクセス可能なNAS(Network Attached Storage)などの外部記憶装置であってもよい。記憶部150には、例えば、上記のプログラムの他、利用者情報152、第1コンテンツ候補154、第1コンテンツ実績情報156、第1コンテンツ158、第2コンテンツ候補160、第2コンテンツ実績情報162、第2コンテンツ164、学習済モデル166、学習データセット168などの情報が格納される。
【0017】
図2は、コンテンツ配信部110によって端末装置10に配信させるコンテンツ画面の一例を示す図である。コンテンツ画面CCは、縦方向にスクロールされることで全体が視認されるものである。コンテンツ画面CCは、第1コンテンツ表示枠C1と、第2コンテンツ表示枠C2とを含む。第1コンテンツ表示枠C1では、複数の第1コンテンツの中から第1コンテンツ選択部120によって選択された複数の第1コンテンツが配列されて表示される。第2コンテンツ表示枠C2では、複数の第2コンテンツの中から第2コンテンツ選択部130によって選択された一以上の第2コンテンツが表示される。
【0018】
第2コンテンツは、第1コンテンツに比して大きいサイズで表示されるものであり、第1コンテンツに比して情報量が多く、それ故に十分な数の第2コンテンツ候補が集まらない状況が生じ得るものである。このため、再帰型モデルを生成するのに十分なデータセットが得られず、自動選択の手法を適用するのが困難な場合があった。コンテンツ選択装置は、そのような問題を以下に説明する手法で解決するものである。
【0019】
利用者情報152は、利用者の識別情報である利用者ID、利用者のデモグラ情報(年齢、性別、職業、住所その他の情報をいう)等を含む。
【0020】
第1コンテンツ候補154は、第1コンテンツの候補となる第1コンテンツ候補の情報(テキスト、画像、その他を含む)である。第1コンテンツ候補は、入稿者により入稿されるものである。第1コンテンツ実績情報156は、第1コンテンツ選択部120が第1コンテンツ候補154から第1コンテンツを選択するために使用する情報であり、過去に第1コンテンツとして選択されたコンテンツの特徴情報などを含むものである。第1コンテンツ選択部120によって選択された第1コンテンツは、第1コンテンツ158として記憶部150に格納され、コンテンツ配信部110によってコンテンツ画面CCの第1コンテンツ表示枠C1に埋め込まれる。
【0021】
第2コンテンツ候補160は、第2コンテンツの候補となる第2コンテンツ候補の情報(テキスト、画像、その他を含む)である。第2コンテンツ候補は、入稿者により入稿されるものである。第2コンテンツ実績情報162は、第2コンテンツ選択部130が第2コンテンツ候補160から第2コンテンツを選択するために使用する情報であり、過去に第2コンテンツとして選択されたコンテンツの特徴情報などを含むものである。第2コンテンツ選択部130によって選択された第2コンテンツは、第2コンテンツ164として記憶部150に格納され、コンテンツ配信部110によってコンテンツ画面CCの第2コンテンツ表示枠C2に埋め込まれる。学習済モデル166は、第2コンテンツ選択部130が第2コンテンツ候補160から第2コンテンツを選択するために使用するモデルである。学習データセット168は、学習済モデル166を生成するために使用されたデータセットである。
【0022】
第1コンテンツ選択部120は、利用者情報152に含まれるデモグラ情報との親和性、過去に配信実績のあった第1コンテンツとの類似性などに基づいて、第1コンテンツを選択する。第1コンテンツ選択部120の選択処理は、第2コンテンツ選択部130と同様に、再帰型モデルを使用した処理であってもよい。第1コンテンツ選択部120については本発明の中核をなすものではないため、詳細な説明を省略する。
【0023】
第2コンテンツ選択部130の取得部132は、第2コンテンツ候補160から第2コンテンツ候補を読み出すことで、第2コンテンツ候補を取得する。例えば、取得部132は、利用者が前回コンテンツを閲覧した時点よりも後に記憶部150に登録された第2コンテンツ候補160の中から、第2コンテンツ候補を取得する。
【0024】
抽出部134は、取得部132によって取得された第2コンテンツ候補から特徴情報を抽出する。図3は、抽出部134の処理内容を模式的に示す図である。抽出部134は、第2コンテンツ候補のタイトルと本文のテキスト情報に対してそれぞれ形態素解析を行い、助詞や助動詞などを除外して単語を抽出する。次に、抽出部134は、抽出した単語を元にバグオブワーズと称されるベクトルを作成する。バグオブワーズとは、0か1で表される各要素のそれぞれに特定の単語が割り当てられており、0がその単語を含まないことを、1がその単語を含むことを表すものである。これに代えて、単語の出現数を要素として含むベクトルを作成してもよい。そして、抽出部134は、バグオブワーズにその他特徴情報を結合(コンカチネット)し、結合したベクトルを、特徴情報として生成する。その他特徴情報とは、第2コンテンツ候補を取得するのに用いられた媒体などの情報である。
【0025】
決定部136は、特徴情報を入力すると第2コンテンツとして選択されるか否かを表す結果を出力するように学習された学習済モデル166に対して、抽出部134により抽出された特徴情報を入力することで、第2コンテンツ候補を第2コンテンツとして選択するか否かを決定する。図4は、決定部136の処理内容を模式的に示す図である。学習済モデル166は、RNN(Recurrent Neural Network)に代表される再帰型モデルである。図示するように、決定部136は、k回目の処理において、k回目に取得された第2コンテンツ候補(着目コンテンツ)の特徴情報と、過去に(すなわちk-1回目までの処理において)決定部136自身が第2コンテンツとして選択した第2コンテンツ候補(過去選択コンテンツ)の特徴情報とを学習済モデル166に入力する。過去選択コンテンツは、第2コンテンツ実績情報162から取得することができる。なお、過去選択コンテンツは無制限に蓄積されるのではなく、所定数を超えた場合には古いデータから削除されるようにしてよい。学習済モデル166は、例えば、中間層と選択確率導出層とを含む。中間層の出力は選択確率導出層に入力され、選択確率導出層が、第2コンテンツとして選択される確率を出力する。決定部136は、出力された確率が閾値以上であれば、着目コンテンツを第2コンテンツとして選択する。なお、学習済モデル166は閾値と比較する機能を含んでもよい。決定部136は、このような処理を繰り返し実行する。k回目の処理において、学習済モデル166には、更に、k-1回目の処理における中間層の処理結果の少なくとも一部が入力される。これによって、過去に選択された第2コンテンツとの関係を、学習済モデル166が学習した特性で選択確率に反映させることができる。
【0026】
学習部138は、学習済モデル166が確立される以前に、複数の第2コンテンツ候補のそれぞれを第2コンテンツとして選択するか否かを、人(コンテンツ編集者)が順次判断した結果を含む学習データセット168を用いて学習されたものである。学習データセット168は、例えば、選択対象となった複数の第2コンテンツ候補(あるいはそれらから抽出された特徴情報)と、人の判断結果とを含む。図5は、学習部138の処理内容を模式的に示す図である。学習部138は、学習済モデル166と同じモデル構造を有する学習中モデルに対して、人が順次判断したのと同じように、着目コンテンツの特徴情報と過去選択コンテンツの特徴情報とを繰り返し入力する。そして、当該回の着目コンテンツに対する人による判断結果を教師データとして、例えば逆誤差伝播法(バックプロパゲーション)などの手法で、選択確率導出層の出力が人による判断結果に近づくように、学習中モデルのパラメータを順次更新する。上記の処理を所定回数行われると、その時点の学習中モデルが学習済モデル166となる。
【0027】
このように学習された学習済モデル166を用いて第2コンテンツを選択することにより、より人の判断に近い選択をすることが可能となる。例えば、選択する人が、直近の過去コンテンツと重複しないように第2コンテンツを選択したり、ジャンルが偏らないように第2コンテンツを選択したり、入稿(第2コンテンツ候補として登録されること)の数が急増している内容の第2コンテンツを優先して選択したりするような選択傾向で判断を行った場合、再帰型モデルである学習済モデル166は、その選択傾向を真似て選択確率を導出することが期待される。従って、学習済モデル166の特性を意識しながら人が判断を行うことで、学習済モデル166の特性を如何様にも調整することができ、ひいてはコンテンツ第2コンテンツを自動的に選択することで魅力あるコンテンツ画面CCを提供することができる。
【0028】
なお、第2コンテンツ候補として登録されたコンテンツは、決定部136による一回の判断で選択されなかった場合に、そのまま破棄されてもよいが、保留コンテンツとして記憶部150にプールされ、所望のタイミングで再度、選択有無の判断がなされるようにしてもよい。また、特徴情報は、上記説明したものに限らず、情報鮮度すなわち入稿からの経過時間などを含んでもよい。
【0029】
以上説明した実施形態によれば、より人の判断に近い選択をすることができる。
【0030】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0031】
100 コンテンツ配信装置
110 コンテンツ配信部
120 第1コンテンツ選択部
130 第2コンテンツ選択部
132 取得部
134 抽出部
136 決定部
138 学習部
150 記憶部
152 利用者情報
154 第1コンテンツ候補
156 第1コンテンツ実績情報
158 第1コンテンツ
160 第2コンテンツ候補
162 第2コンテンツ実績情報
164 第2コンテンツ
166 学習済モデル
168 学習データセット
図1
図2
図3
図4
図5