特許第5661689号(P5661689)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

<>
  • 特許5661689-コンテンツ配信装置 図000002
  • 特許5661689-コンテンツ配信装置 図000003
  • 特許5661689-コンテンツ配信装置 図000004
  • 特許5661689-コンテンツ配信装置 図000005
  • 特許5661689-コンテンツ配信装置 図000006
  • 特許5661689-コンテンツ配信装置 図000007
  • 特許5661689-コンテンツ配信装置 図000008
  • 特許5661689-コンテンツ配信装置 図000009
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5661689
(24)【登録日】2014年12月12日
(45)【発行日】2015年1月28日
(54)【発明の名称】コンテンツ配信装置
(51)【国際特許分類】
   G06Q 30/02 20120101AFI20150108BHJP
【FI】
   G06Q30/02 150
【請求項の数】5
【全頁数】12
(21)【出願番号】特願2012-141697(P2012-141697)
(22)【出願日】2012年6月25日
(65)【公開番号】特開2014-6684(P2014-6684A)
(43)【公開日】2014年1月16日
【審査請求日】2013年3月5日
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】田中 祐介
(72)【発明者】
【氏名】田島 玲
(72)【発明者】
【氏名】塚本 浩司
【審査官】 貝塚 涼
(56)【参考文献】
【文献】 特開2006−120135(JP,A)
【文献】 国際公開第2009/099879(WO,A1)
【文献】 国際公開第2011/105487(WO,A1)
【文献】 特開2009−271661(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 − 50/34
(57)【特許請求の範囲】
【請求項1】
1つの商材についての複数の広告コンテンツを管理する広告データベースの個々の広告コンテンツに対し、当該広告コンテンツの特徴を表わす特徴量を生成する手段と、
前記広告データベースから対象となる一群の広告コンテンツを選択する手段と、
選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する手段と、
係数ベクトルを初期設定する手段と、
選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する手段と、
配信確率が設定された広告コンテンツを配信し、実績CTRを記録する手段と、
広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する手段と、
前記実績CTRに基づいて前記係数ベクトルを更新する手段と
を備えたことを特徴とするコンテンツ配信装置。
【請求項2】
請求項1に記載のコンテンツ配信装置において、
前記特徴量は、広告コンテンツの構成要素の種類毎のパターン数の総和の要素数をもつベクトルであり、実際に用いられる構成要素の種類毎のパターン位置に対応する要素を「1」とし、他の要素を「0」とする
ことを特徴とするコンテンツ配信装置。
【請求項3】
請求項1に記載のコンテンツ配信装置において、
前記特徴量は、各広告コンテンツと他の全ての広告コンテンツとの画像類似度を要素にもつベクトルである
ことを特徴とするコンテンツ配信装置。
【請求項4】
請求項1乃至3のいずれか一項に記載のコンテンツ配信装置において、
前記強化学習として、追跡法もしくは行動選択規則のいずれかを用いる
ことを特徴とするコンテンツ配信装置。
【請求項5】
コンテンツ配信装置が、1つの商材についての複数の広告コンテンツを管理する広告データベースの個々の広告コンテンツに対し、当該広告コンテンツの特徴を表わす特徴量を生成する工程と、
前記コンテンツ配信装置が、前記広告データベースから対象となる一群の広告コンテンツを選択する工程と、
前記コンテンツ配信装置が、選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する工程と、
前記コンテンツ配信装置が、係数ベクトルを初期設定する工程と、
前記コンテンツ配信装置が、選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する工程と、
前記コンテンツ配信装置が、配信確率が設定された広告コンテンツを配信し、実績CTRを記録する工程と、
前記コンテンツ配信装置が、広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する工程と、
前記コンテンツ配信装置が、前記実績CTRに基づいて前記係数ベクトルを更新する工程と
を備えたことを特徴とするコンテンツ配信方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、インターネット等のネットワークを介して広告コンテンツを配信する技術に関する。
【背景技術】
【0002】
インターネットのホームページ等においては、バナー広告に代表されるディスプレイ広告による広告欄が設けられることが多い。
【0003】
また、広告主は1つの商材につき、視聴者の嗜好を考慮して複数の広告コンテンツを用意する場合が多い。どのような広告コンテンツが視聴者に受け入れられるかについては、予め知ることはできないので、ランダムに配信したり(例えば、4つの広告コンテンツがある場合は0.25(25%)ずつ)、所定期間のCTR(Click Through Rate)に比例した配信確率を用いたりする(例えば、4つの広告コンテンツのCTRが0.8%、0.6%、0.4%、0.2%であった場合、配信確率をCTRに比例させて40%、30%、20%、10%)。なお、CTRとは、ディスプレイ広告のような広告コンテンツが選択(クリック)された数を、配信数で割った値であり、広告効果を評価する指標の一つである。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2009−271661号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上述したように、1商材について複数の広告コンテンツが存在する場合、従来は配信確率を均等にしたり、CTRに比例した値を用いたりしていたため、広告効果を高める上で充分ではないという問題があった。
【0006】
すなわち、トータルのクリック数を最大化するためには、最も評判のいい広告コンテンツ1本に絞ることが必要であり、2位以下の広告コンテンツに相当量の配信確率を割くということはクリック数の最大化には反するからである。
【0007】
しかしながら、CTRは変動が大きく、ある時点で最高の値を示していた広告コンテンツが最も評判がいい広告コンテンツであると断ずることは危険である。そのため、従来の手法を踏襲するほか術がなかった。
【0008】
また、昨今ではボタン、メインビジュアル、キャッチコピー等をそれぞれ複数パターン用意し、それらの組み合わせにより広告コンテンツを構成する場合が多く、1商材について大量の広告コンテンツ(大量クリエイティブ)を用意する場合も多い。
【0009】
図1は大量クリエイティブの例を示す図であり、ロゴを6パターン、メインビジュアルを6パターン、キャッチコピーを18パターンとしたものである。この場合、広告コンテンツの総数は、それぞれの要素の組み合わせである6×6×18=648となる。
【0010】
このような大量クリエイティブの場合、広告の掲載期間(日時で掲載期間が定められる場合や、所定のインプレッション数(提示数)に達するまでとする場合等)内にCTRが記録されない広告コンテンツが発生することも多く、CTRに基づいて広告コンテンツの配信確率を定めること自体が困難である。
【0011】
一方、特許文献1には、少ない露出回数で的確にクリエイティブ(広告)の有効性を評価し、クリエイティブが効率よく露出されるようにする技術が開示されている。しかし、正規分布を用いた統計的手法に基づくものであり、必ずしも広告効果を高める上では充分ではなかった。
【0012】
本発明は上記の従来の問題点に鑑み提案されたものであり、その目的とするところは、強化学習の考え方を導入するとともに、各広告コンテンツのCTRを予測することで、1商材について大量の広告コンテンツが存在する場合の広告効果を高めることにある。
【課題を解決するための手段】
【0013】
上記の課題を解決するため、本発明にあっては、1つの商材についての複数の広告コンテンツを管理する広告データベースの個々の広告コンテンツに対し、当該広告コンテンツの特徴を表わす特徴量を生成する手段と、前記広告データベースから対象となる一群の広告コンテンツを選択する手段と、選択された一群の広告コンテンツの個々に対して初回の配信確率を設定する手段と、係数ベクトルを初期設定する手段と、選択された一群の広告コンテンツの個々に対して前記係数ベクトルと前記特徴量から予測CTRを算出する手段と、配信確率が設定された広告コンテンツを配信し、実績CTRを記録する手段と、広告コンテンツ毎の所定期間の前記予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する手段と、前記実績CTRに基づいて前記係数ベクトルを更新する手段とを備えるようにしている。
【発明の効果】
【0014】
本発明のコンテンツ配信装置にあっては、強化学習の考え方を導入するとともに、各広告コンテンツのCTRを予測することで、1商材について大量の広告コンテンツが存在する場合の広告効果を高めることができる。
【図面の簡単な説明】
【0015】
図1】大量クリエイティブの例を示す図である。
図2】本発明の一実施形態にかかるシステムの構成例を示す図である。
図3】広告DBのデータ構造例を示す図である。
図4】実施形態の処理例を示すフローチャートである。
図5】広告コンテンツの特徴量の生成の例を示す図(その1)である。
図6】広告コンテンツの特徴量の生成の例を示す図(その2)である。
図7】初期配信確率の設定の例を示す図である。
図8】配信確率の設定の例を示す図である。
【発明を実施するための形態】
【0016】
以下、本発明の好適な実施形態につき説明する。
【0017】
<構成>
図2は本発明の一実施形態にかかるシステムの構成例を示す図である。
【0018】
図2において、インターネット等のネットワーク1には、ユーザが操作するPC(Personal Computer)、携帯電話、PDA(Personal Digital Assistants)等の端末装置2が複数接続されている。端末装置2は、一般的なブラウザ(Webブラウザ)21を備えている。ブラウザ21は、インターネットの標準プロトコルであるHTTP(Hyper Text Transfer Protocol)等に従い、HTML(Hyper Text Markup Language)等の言語で記述されたページデータの要求・取得・表示およびフォームデータの送信等を行う機能を有している。
【0019】
一方、ネットワーク1には、端末装置2のブラウザ21に対して広告情報を提供する広告情報提供装置3が接続されている。
【0020】
広告情報提供装置3は、機能部として、特徴量生成部301と対象広告選択部302と初期配信確率設定部303と係数ベクトル初期設定部304と予測CTR算出部305と広告情報配信・CTR記録部306と配信確率算出・設定部307と係数ベクトル更新部308とを備えている。
【0021】
これらの機能部は、広告情報提供装置3を構成するコンピュータのCPU(Central Processing Unit)、ROM(Read Only Memory)、RAM(Random Access Memory)等のハードウェア資源上で実行されるコンピュータプログラムによって実現されるものである。これらの機能部は、単一のコンピュータ上に配置される必要はなく、必要に応じて分散される形態であってもよい。
【0022】
また、広告情報提供装置3が利用するデータベースとして、広告DB(Data Base)309が設けられている。このデータベースは、広告情報提供装置3を構成するコンピュータ内のHDD(Hard Disk Drive)等の記憶媒体上に所定のデータを体系的に保持するものである。なお、広告DB309は広告情報提供装置3内に配置される必要はなく、他の装置上に配置してもよい。
【0023】
図3は広告DB309のデータ構造例を示す図である。広告DB309は、「広告ID」「広告コンテンツ数」「広告コンテンツID」「広告コンテンツデータ/リファレンス」「特徴量」「実績CTR」「予測CTR(Q値)」「配信確率」等の項目を含んでいる。「広告ID」は、一の広告主の一の商材にかかる一群の広告コンテンツを識別する情報である。「広告コンテンツ数」は、一の広告主の一の商材にかかる一群の広告コンテンツに含まれる広告コンテンツの数である。「広告コンテンツID」は、個々の広告コンテンツを識別する情報である。「広告コンテンツデータ/リファレンス」は、広告コンテンツの実データもしくは格納場所の情報である。
【0024】
「特徴量」は、各広告コンテンツの特徴を表わす情報である。詳細については後述する。「実績CTR」は、その広告コンテンツについてのCTRの実績値の記録である。「予測CTR(Q値)」は、各広告コンテンツについて「特徴量」に基づいて算出した予測されるCTRである。詳細については後述する。「配信確率」は、算出されて決定された広告コンテンツ毎の配信確率である。
【0025】
図2に戻り、広告情報提供装置3の特徴量生成部301は、広告DB309の各広告コンテンツに対して特徴量を生成し、広告DB309に設定する機能を有している。
【0026】
対象広告選択部302は、広告DB309から処理対象となる広告(一の広告主の一の商材にかかる一群の広告コンテンツ)を選択する機能を有している。
【0027】
初期配信確率設定部303は、対象広告選択部302の選択した一群の広告コンテンツにつき、初期の配信確率を設定する機能を有している。
【0028】
係数ベクトル初期設定部304は、予測CTRの算出に用いる係数ベクトルを初期化する機能を有している。
【0029】
予測CTR算出部305は、各広告コンテンツにつき、特徴量と係数ベクトルを用いて予測CTRを算出する機能を有している。
【0030】
広告情報配信・CTR記録部306は、広告DB309に登録された広告コンテンツを、設定された配信確率に基づいて端末装置2のブラウザ21に配信(一般には、端末装置2からページ要求が行われた場合に、本来のページ内容に付加する形で広告コンテンツの配信を行う)するとともに、端末装置2のブラウザ21による広告コンテンツの選択操作(バナー広告のクリック操作等)を検出し、実績CTRとして広告DB309に記録する機能を有している。
【0031】
配信確率算出・設定部307は、広告DB309に記録された広告コンテンツ毎の所定期間の予測CTRに基づき、強化学習の手法により新たな配信確率を広告コンテンツ毎に算出して広告DB309に設定する機能を有している。強化学習は、大きい報酬に続く行動はより再現しやすく、小さい報酬に続く行動はより再現しづらくなるという経験的事実を基本とした方法であり、数値化された報酬信号を最大にするために、何をすべきか(どのようにして状況に基づく動作選択を行うか)を学習する(「強化学習」、三上貞芳・皆川雅章 訳、森北出版株式会社、2000年12月20日発行等を参照。)。
【0032】
すなわち、配信確率算出・設定部307は、広告コンテンツ毎の所定期間の予測CTRを報酬として、当該報酬に基づき複数の広告コンテンツの中から一の広告コンテンツの配信確率を最大化しつつ、残りの広告コンテンツにも最小限の配信確率を残すように強化学習を行い、新たな配信確率を広告コンテンツ毎に算出して設定する。
【0033】
係数ベクトル更新部308は、実績CTRに基づいて係数ベクトルを更新する機能を有している。
【0034】
<動作>
図4は上記の実施形態の処理例を示すフローチャートである。
【0035】
先ず、図4(a)において、広告情報提供装置3の特徴量生成部301は、広告DB309の各広告コンテンツに対して特徴量を生成し、広告DB309に設定する(ステップS100)。
【0036】
図5は広告コンテンツの特徴量の生成の例を示す図である。
【0037】
例えば、広告コンテンツがメインビジュアルとキャッチコピーとボタンという種類の異なる構成要素の組み合わせにより構成されるものであり、メインビジュアルが7パターン、キャッチコピーが7パターン、ボタンが4パターンである場合、特徴量のベクトルとして、図5(a)に示すように、先頭からメインビジュアルに対応する7要素、キャッチコピーに対応する7要素、ボタンに対応する4要素の計18要素とする。
【0038】
そして、例えば、メインビジュアルが第3パターン、キャッチコピーが第4パターン、ボタンが第2パターンの広告コンテンツの場合、特徴量は、図5(b)に示すように、先頭から3要素目と11要素目と16要素目を「1」とし、他を「0」とする。
【0039】
図6は広告コンテンツの特徴量の生成の他の例を示す図であり、広告コンテンツが多様で構成要素の組み合わせで表現できない場合に対応したものである。
【0040】
この場合、画像類似度に基づいて、各広告コンテンツにつき、他の広告コンテンツ(自己を含む)との距離(画像類似度)を算出し、特徴量として、
(第1の広告コンテンツとの距離,第2の広告コンテンツとの距離,・・・)
というベクトルを生成する。
【0041】
図4に戻り、配信確率の設定等の処理を説明する。
【0042】
図4(b)において、処理を開始すると(ステップS101)、広告情報提供装置3の対象広告選択部302は、広告DB309から処理対象となる広告(一の広告主の一の商材にかかる一群の広告コンテンツ)を選択する(ステップS102)。図3の広告DB309では広告IDを一つ選択する。
【0043】
次いで、図4(b)に戻り、広告情報提供装置3の初期配信確率設定部303は、対象広告選択部302の選択した一群の広告コンテンツにつき、初期の配信確率を設定する(ステップS103)。初期の配信確率は一群の広告コンテンツについて同じ配信確率にすべく、選択した広告IDに対応する広告コンテンツ数を得て、逆数とすることで初期の配信確率を算出する。例えば、196個の広告コンテンツがある場合は1/196=0.0051ずつとなる。図7は初期の配信確率が設定された状態における広告DB309を示している。
【0044】
次いで、図4(b)に戻り、広告情報提供装置3の係数ベクトル初期設定部304は、係数ベクトルθ(=A−1b)を規定する行列A、ベクトルbを初期設定する(ステップS104)。すなわち、行列Aに特徴量の要素数に相当するd次元の単位行列を設定し、ベクトルbにd次元のゼロベクトルを設定する。
【0045】
次いで、広告情報提供装置3の予測CTR算出部305は、選択された広告に含まれる全ての広告コンテンツa(特徴量x)に対して、予測CTR(Q値)であるQ
←xθ+α・root(x−1
により算出して設定する(ステップS105)。上付きのTは転置を示す。なお、αは誤差の許容範囲を規定する定数である。
【0046】
次いで、広告情報提供装置3の広告情報配信・CTR記録部306は、広告DB309に登録された広告コンテンツを、端末装置2からページ要求が行われた際に、設定された配信確率に基づいて端末装置2のブラウザ21に配信するとともに、端末装置2のブラウザ21による広告の選択操作(バナー広告のクリック操作等)を検出し、実績CTRを広告DB309に記録する(ステップS106)。
【0047】
その後、配信確率を見直す所定の期間経過後、広告情報提供装置3の配信確率算出・設定部307は、広告DB309に記録された広告コンテンツ毎の所定期間の予測CTRに基づき、強化学習の手法により新たな配信確率を広告コンテンツ毎に算出する(ステップS107)。
【0048】
例えば、追跡法(Pursuit Methods)を用いる場合、iを広告コンテンツのインデックス(例えば、広告コンテンツが196個の場合はi=0〜195)、aを広告コンテンツ、Π(a)を広告コンテンツaの直前の配信確率、βを所定の学習率(0〜1の間の値)とすると、予測CTRが最大の広告コンテンツの配信確率は、
(Π(a)+β(1−Π(a)))/ΣΠ(a
その他の広告コンテンツの配信確率は、
(Π(a)+β(0−Π(a)))/ΣΠ(a
とする。ΣΠ(a)で割っているのは正規化するためである。
【0049】
行動選択規則(εグリーディ手法)を用いる場合、εを所定の定数(0〜1の間の値)、広告コンテンツの数をnとすると、予測CTRが最大の広告コンテンツの配信確率は、
1−ε
その他の広告コンテンツの配信確率は、
ε/(n−1)
とする。
【0050】
次いで、広告情報提供装置3の配信確率算出・設定部307は、算出された新たな配信確率を広告DB309に設定する(ステップS108)。図8は、εグリーディ手法によりε=0.1とした場合に、配信確率が更新された状態の広告DB309を示している。
【0051】
次いで、図4(b)に戻り、広告情報提供装置3の係数ベクトル更新部308は、広告コンテンツaの実績CTRの算出の元となるインプレッション数v、クリック数rに基づいて係数ベクトルθを更新する(ステップS109)。すなわち、
A←A+v
b←b+r
とする。
【0052】
その後、予測CTRの算出(ステップS105)に戻り、同様の処理を繰り返す。
【0053】
<総括>
以上説明したように、本実施形態によれば、強化学習の考え方を導入することで、1商材について複数の広告コンテンツが存在する場合の広告効果を高めることができる。
【0054】
また、広告コンテンツが大量に存在する場合であっても、全ての広告コンテンツについて予測CTRを付与することで、配信確率の設定の精度を高めることができる。
【0055】
以上、本発明の好適な実施の形態により本発明を説明した。ここでは特定の具体例を示して本発明を説明したが、特許請求の範囲に定義された本発明の広範な趣旨および範囲から逸脱することなく、これら具体例に様々な修正および変更を加えることができることは明らかである。すなわち、具体例の詳細および添付の図面により本発明が限定されるものと解釈してはならない。
【符号の説明】
【0056】
1 ネットワーク
2 端末装置
21 ブラウザ
3 広告情報提供装置
301 特徴量生成部
302 対象広告選択部
303 初期配信確率設定部
304 係数ベクトル初期設定部
305 予測CTR算出部
306 広告情報配信・CTR記録部
307 配信確率算出・設定部
308 係数ベクトル更新部
309 広告DB
図2
図3
図4
図5
図6
図7
図8
図1