【解決手段】本願に係る抽出装置は、取得部と、抽出部とを有する。取得部は、ユーザの行動履歴を取得する。抽出部は、取得部によって取得された行動履歴のうち所定の行動よりも前の行動履歴を用いて、所定の行動をすることが予測される対象のユーザを抽出する。例えば、抽出装置は、取得部によって取得された行動履歴に含まれる所定の行動よりも前の行動履歴と類似する行動であるか否かを判定するモデルを生成し、抽出部は、生成されたモデルを用いて、対象のユーザを抽出する。
前記取得部によって取得された行動履歴に含まれる前記所定の行動よりも前の行動履歴と類似する行動であるか否かを判定するモデルを生成するモデル生成部をさらに備え、
前記抽出部は、
前記モデル生成部によって生成されたモデルを用いて、前記対象のユーザを抽出する、
ことを特徴とする請求項1又は2に記載の抽出装置。
【発明を実施するための形態】
【0010】
以下に、本願に係る抽出装置、抽出方法及び抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る抽出装置、抽出方法及び抽出プログラムが限定されるものではない。また、各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0011】
〔1.抽出処理の概要〕
まず、
図1を用いて、実施形態に係る抽出処理の一例について説明する。
図1は、実施形態に係る抽出処理の一例を示す図である。
図1では、本願に係る抽出装置に対応する広告装置100によって、広告配信先の対象となるユーザの抽出処理が行われる例を示す。
【0012】
ここで、広告装置100は、ユーザ情報を利用することで、広告効果が高いと想定されるユーザを抽出し、抽出されたユーザに対して広告コンテンツの配信を行う情報処理装置である。広告配信を依頼する広告主(例えば、商品等を扱う企業)は、広告装置100を利用することにより、広告配信を契機としてユーザから何らかの成果を得ることのできる可能性が高い広告配信、すなわち、広告効果の高い広告配信を実現できる。なお、ユーザ情報とは、一般ユーザによって操作される情報処理端末であるユーザ端末10(
図1での図示は省略する)がウェブサイトにアクセス(ウェブページにおいてバナー広告をクリックしたことを示す情報の送信や、ショッピングページにおいて商品を購買するための要求の送信などを含む)した際のログ(Log)のデータ(すなわち、ユーザの行動履歴)や、ウェブサイトへのアクセス履歴や購入履歴等から導かれるユーザ自体の属性情報(例えば、ユーザの年齢、性別、嗜好など)等を含む。
【0013】
図1の例において、実施形態に係る広告装置100は、所定の製品Aを購入する可能性の高いユーザを抽出し、抽出されたユーザに対して広告コンテンツを配信することで、広告コンテンツのコンバージョン(Conversion)を向上させる。コンバージョンとは、広告コンテンツの配信によって、広告主が獲得できる最終成果を示し、広告主への利益に繋がるユーザの行動を意味する。コンバージョンの例としては、ウェブページ上で商品を購入する行動や、会員登録を行う行動や、資料請求を行う行動や、商品等に関する問い合わせを行う行動等が挙げられる。以下では、広告装置100による実施形態に係る抽出処理の一例として、製品Aを購入する可能性の高いユーザを広告装置100が抽出する処理を説明する。
【0014】
まず、広告装置100は、過去に製品Aを購入したユーザU11及びU12のユーザ情報を取得し、ユーザU11及びU12の行動履歴を分析する。
図1では、広告装置100が取得した各ユーザのオンライン上における行動履歴を、所定の記号を用いて時間軸t上に示している。なお、以下では、ユーザのオンライン上の行動を「イベント」と表記する場合がある。また、実施形態に係る抽出処理における「製品Aの購入」など、抽出処理の目的となるイベントを「指定イベント」と表記する場合がある。
【0015】
図1に示すように、ユーザU11には、製品Aを過去に購入した履歴がある。また、ユーザU11には、製品Aの購入に至るまでに、検索サイト等を利用して製品Aを検索した履歴と、製品Aを検索した後に製品Aの販売ページを閲覧した履歴とがある。
【0016】
ここで、広告装置100は、ユーザU11が製品Aの購入に至った時点から過去に向かう所定の時間幅DU1を設定する。例えば、広告装置100は、時間幅DU1を24時間と設定する。すなわち、ユーザU11の行動履歴における時間幅DU1は、ユーザU11が製品Aを購入する24時間前から、製品Aの購入に至った時点までの24時間を示す。
図1に示すように、時間幅DU1には、ユーザU11の行動履歴として、製品Aの検索及び製品Aの販売ページの閲覧が含まれる。これにより、広告装置100は、ユーザU11が製品Aの購入に至るまでの時間幅DU1にどのような行動をしていたかという、ユーザU11のイベント情報を取得する。
【0017】
続いて、広告装置100は、ユーザU11とは異なるユーザであって、製品Aを過去に購入したユーザU12の行動履歴を参照する。ここで、広告装置100は、ユーザU12が製品Aの購入に至った時点から過去に向かう時間幅DU1に含まれるユーザU12の行動履歴を参照する。
図1の例では、ユーザU12の行動履歴における時間幅DU1には、ユーザU12の行動履歴として、ユーザU11の行動履歴と同様、製品Aの検索及び製品Aの販売ページの閲覧が含まれる。このように、広告装置100は、ユーザU12についても、製品Aの購入に至るまでの時間幅DU1のイベント情報を取得する。
【0018】
なお、広告装置100は、ユーザU11及びユーザU12のみならず、製品Aを購入したその他のユーザ(
図1での図示は省略する)についても同様に、製品Aの購入に至るまでの時間幅DU1のイベント情報を取得する。なお、広告装置100は、製品Aを購入したユーザとの比較のため、製品Aを過去に購入していないユーザのイベント情報についても取得してもよい。
【0019】
そして、広告装置100は、集計した情報に基づき、製品Aの購入に至るまでの時間幅DU1の行動について、製品Aを購入したユーザのイベントに関するモデルを生成する。
図1の例では、広告装置100は、所定のユーザの行動履歴をモデルと照らし合わせた場合に、「製品Aを検索した履歴」と、「製品Aを検索した後に製品Aの販売ページを閲覧した履歴」という行動履歴があるユーザは、24時間以内に製品Aを購入する可能性が高い、と評価されるモデルを生成する。なお、モデルの生成処理については後述する。
【0020】
図1の例において、広告装置100は、製品Aを購入したユーザのモデルを利用して、製品Aを購入すると予測されるユーザを抽出する(ステップS11)。
図1に示すユーザU21、ユーザU22及びユーザU23は、任意の判定基準時T(ここでは、現時点とする)において、製品Aの購入履歴がないユーザである。
【0021】
まず、広告装置100は、判定基準時Tから過去に向かう時間幅DU1におけるユーザU21の行動履歴を分析する。具体的には、広告装置100は、ユーザU21の行動履歴について、製品Aを購入したユーザのモデルに照らし合わせる。そして、広告装置100は、照らし合わせた結果に基づいて、モデルと関連する度合いであるスコアを求める。すなわち、ユーザU21の行動履歴と、製品Aを購入したユーザの時間幅DU1における行動履歴との関連する度合いが高く、両者が類似すると判定される場合、ユーザU21には、相対的に高いスコアが付与される。
【0022】
図1に示すように、ユーザU21には、時間幅DU1において、「製品Aを検索した履歴」と、「製品Aを検索した後に製品Aの販売ページを閲覧した履歴」とがある。この場合、広告装置100は、ユーザU21の行動履歴と製品Aを購入したユーザのモデルとを照らし合わせた結果、ユーザU21の行動履歴とモデルとが類似すると判定する。したがって、広告装置100は、ユーザU21に高いスコアを付与する。
【0023】
同様に、広告装置100は、判定基準時Tから過去に向かう時間幅DU1におけるユーザU22の行動履歴を分析する。
図1に示すように、ユーザU22には、時間幅DU1において、「製品Aの販売ページを閲覧した履歴」はあるものの、「製品Aを検索した履歴」や、「製品Aを検索した後に製品Aの販売ページを閲覧した履歴」はない。この場合、広告装置100は、ユーザU22の行動履歴と製品Aを購入したユーザのモデルとを照らし合わせた結果、ユーザU22の行動履歴とモデルとの類似性が低いと判定する。したがって、広告装置100は、ユーザU22に比較的低いスコアを付ける。
【0024】
同様に、広告装置100は、判定基準時Tから過去に向かう時間幅DU1におけるユーザU23の行動履歴を分析する。
図1に示すように、ユーザU23には、時間幅DU1において、「製品Aを検索した履歴」と、「製品Aを検索した後に製品Aの販売ページを閲覧した履歴」とがある。しかし、ユーザU23には、通常、製品Aの購入後に実行すると想定される、「製品Aのレビュー投稿」という行動履歴がある。この場合、ユーザU23は、例えば、オンライン上ではなく、オフラインにおいて既に製品Aを購入した可能性が高い。あるいは、広告装置100が、ユーザU23が実行した「製品Aを購入」という行動履歴に関する情報を取得することができなかった可能性がある。
【0025】
この場合、広告装置100は、ユーザU23の行動履歴と製品Aを購入したユーザのモデルとを照らし合わせた結果、ユーザU23の行動履歴とモデルとの類似性が低いと判定する。製品Aを購入したユーザのモデルには、通常、製品Aの購入後に実行される「製品Aのレビュー投稿」という行動履歴は含まれないため、ユーザU23の行動履歴と製品Aを購入したユーザのモデルとの関連性が低く判定される。
【0026】
上記のように、広告装置100は、任意の判定基準時Tにおいて製品Aを購入していないユーザU21〜U23と、製品Aを購入したユーザのモデルとを、時系列上のイベント情報を用いて照らし合わせることにより、ユーザU21〜U23をスコア付けし、ユーザU21〜U23における製品Aの購入可能性を判定する(ステップS12)。
【0027】
広告装置100は、製品Aを購入したユーザのモデルにおけるスコアの高いユーザほど、製品Aの購入可能性が高いと判定する。
図1の例では、広告装置100は、ユーザU21について、製品Aの購入可能性が高いと判定する。また、広告装置100は、ユーザU22及びユーザU23について、製品Aの購入可能性が低いと判定する。
【0028】
そして、広告装置100は、製品Aの購入可能性が高いユーザU21について、製品Aに関する広告コンテンツの配信対象度が高いものと判定する。一方、広告装置100は、製品Aの購入可能性が低いユーザU22及びU23について、製品Aに関する広告コンテンツの配信対象度が低いものと判定する。そして、広告装置100は、広告コンテンツの配信対象度が高いユーザから順に表示されるユーザリストを形成し、広告コンテンツの配信対象度が高いユーザを抽出する。
【0029】
この場合、広告装置100は、広告コンテンツの配信対象度が高いユーザ、すなわち、高いスコア付けのなされたユーザを広告配信の対象とすることができる。一方、広告装置100は、広告コンテンツの配信対象度が低いユーザは広告配信の対象としないことができる。
【0030】
このように、実施形態に係る広告装置100は、ユーザの行動履歴を取得する。そして、実施形態に係る広告装置100は、取得した行動履歴のうち所定の行動よりも前の行動履歴を用いて、当該所定の行動をすることが予測される対象のユーザを抽出する。
【0031】
すなわち、実施形態に係る広告装置100は、製品Aを購入したユーザが購入に至るまでに実行した行動と類似した行動を判定することにより、実際に製品Aを購入したユーザと同様に、将来、製品Aを購入するであろうと予測されるユーザを抽出する。また、広告装置100は、時系列上における、製品Aを購入した時点までのユーザの行動履歴に基づいて、製品Aを購入する可能性の高いユーザを抽出し、抽出されたユーザを広告配信の対象とする。例えば、広告装置100は、製品Aを購入した後に実行されると想定される製品Aのレビュー投稿をしたユーザについては、広告配信の対象度を低くする。これにより、広告装置100は、製品Aを購入するといったコンバージョンにつながる可能性の高いユーザを抽出して、広告コンテンツの配信をすることができる。さらに、広告装置100は、広告主の目的に沿う購買行動等を将来行うユーザを高精度に抽出して広告を配信するので、対象とするマーケットとなるユーザ層を精度良く拡張することができる。このように、広告装置100は、広告効果を高めることができる。
【0032】
〔2.抽出処理システムの構成〕
次に、
図2を用いて、実施形態に係る広告装置100が含まれる抽出処理システムの構成について説明する。
図2は、実施形態に係る抽出処理システム1の構成例を示す図である。
図2に例示するように、実施形態に係る抽出処理システム1には、ユーザ端末10と、広告主装置20と、ウェブサーバ30と、広告装置100とが含まれる。これらの各種装置は、ネットワークNを介して、有線又は無線により通信可能に接続される。なお、
図2に示した抽出処理システム1には、複数台のユーザ端末10や、複数台の広告主装置20や、複数台のウェブサーバ30が含まれてもよい。
【0033】
ユーザ端末10は、例えば、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット型端末や、携帯電話機、PDA(Personal Digital Assistant)等の情報処理装置である。ユーザ端末10は、ウェブサーバ30にアクセスすることで、ウェブサーバ30の提供するウェブサイトからウェブページを取得し、取得したウェブページを表示装置(例えば、液晶ディスプレイ)に表示する。
【0034】
広告主装置20は、広告装置100に広告配信を依頼する広告主によって利用される情報処理装置である。広告主装置20は、広告主による操作に従って、広告装置100に広告コンテンツを入稿したり、広告コンテンツを配信するユーザについての条件を指定したりする。
【0035】
なお、広告主は、広告主装置20を用いて、広告装置100に広告コンテンツを入稿したり、広告コンテンツを配信するユーザについての条件を指定したりせずに、かかる入稿等を代理店に依頼する場合もある。この場合、広告装置100に広告コンテンツを入稿等するのは代理店となる。以下では、「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主装置」といった表記は、広告主装置だけでなく代理店によって利用される代理店装置を含む概念であるものとする。
【0036】
ウェブサーバ30は、ユーザ端末10からアクセスされた場合に、各種ウェブページを提供するサーバ装置である。ウェブサーバ30は、例えば、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関する各種ウェブページを提供する。
【0037】
なお、ウェブサーバ30によって提供されるウェブページには、ウェブビーコン(web beacon)等によって実現される、ユーザ情報に関する通知機能が埋め込まれる場合がある。例えば、ウェブビーコンは、ウェブページにアクセスしたユーザ端末10を広告装置100内に格納される透明な画像又は非常に小さな画像(「クリアGIF」と呼ばれることもある)にアクセスさせる機能を有する。これにより、広告装置100は、ユーザ端末10からユーザ情報を受信し、取得することができる。
【0038】
また、ウェブサーバ30によって配信されるウェブページには、広告コンテンツを表示するための広告枠が含まれる。そして、広告枠を含むウェブページには、広告枠に表示する広告コンテンツを取得するための広告取得命令が含まれる。例えば、ウェブページを形成するHTML(HyperText Markup Language)ファイル等には、広告装置100のURL等が広告取得命令として記述される。この場合、ユーザ端末10は、HTMLファイル等に記述されているURLにアクセスすることで、広告装置100から広告コンテンツの配信を受ける。
【0039】
広告装置100は、上述のように、ユーザ情報を利用することで、指定イベントを実行する可能性が高いと想定されるユーザを抽出し、抽出されたユーザに対して広告コンテンツの配信を行う情報処理装置である。
【0040】
なお、広告装置100は、広告コンテンツの配信にあたって、ユーザ端末10を識別し、広告コンテンツを配信するユーザ端末10を特定する。ここで、ユーザの識別は、例えば、ユーザ端末10のウェブブラウザと広告装置100との間でやり取りされるHTTPクッキー(HyperText Transfer Protocol Cookie:以下、単に「クッキー」と表記する)にユーザ識別情報を含めることよって行うことができる。なお、ユーザを識別する手法は上記に限られない。例えば、ユーザ端末10に専用のプログラムを設定し、かかる専用プログラムからユーザ識別情報を広告装置100に送信させるようにすることもできる。
【0041】
〔3.広告装置の構成〕
次に、
図3を用いて、実施形態に係る広告装置100の構成について説明する。
図3は、実施形態に係る広告装置100の構成例を示す図である。
図3に示すように、広告装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、広告装置100は、広告装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0042】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。かかる通信部110は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、ユーザ端末10や広告主装置20やウェブサーバ30との間で情報の送受信を行う。
【0043】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、広告コンテンツ記憶部121と、ユーザ情報記憶部122とを有する。
【0044】
(広告コンテンツ記憶部121について)
広告コンテンツ記憶部121は、広告主装置20から入稿された広告コンテンツに関する情報を記憶する。また、広告コンテンツ記憶部121は、入稿された広告コンテンツに対応付けて、広告主から指定される条件であって、広告コンテンツの配信対象とするユーザに関する条件を記憶する。ここで、
図4に、実施形態に係る広告コンテンツ記憶部121の一例を示す。
図4に示した例では、広告コンテンツ記憶部121は、「広告主ID」、「広告コンテンツID」、「入札価格」、「指定条件」といった項目を有する。
【0045】
「広告主ID」は、広告主又は広告主装置20を識別するための識別情報を示す。また、「広告コンテンツID」は、広告主から広告装置100に入稿される広告コンテンツを識別するための識別情報を示す。
【0046】
なお、実際にユーザ端末10に配信される広告コンテンツのデータは、広告装置100とは別に備えられた所定の広告配信サーバに記憶されてもよい。この場合、広告装置100は、広告コンテンツ記憶部121に記憶された広告コンテンツIDに基づいて、外部の広告配信サーバに記憶された広告コンテンツを特定する。そして、広告装置100は、広告配信サーバに対して、特定された広告コンテンツをユーザ端末10に対して配信するよう制御する。また、以下では、
図4に示した広告主ID及び広告コンテンツIDに記憶されている識別情報を広告主及び広告コンテンツの参照符号として用いる場合がある。例えば、広告主ID「CL01」によって識別される広告主を「広告主CL01」と、または、広告コンテンツID「AD01」によって識別される広告コンテンツを「広告コンテンツAD01」と表記する場合がある。
【0047】
「入札価格」は、広告配信に係る入札価格を示す。
図4の例においては、入札価格は、広告主が指定するものとし、広告コンテンツ毎に記憶される。入札価格が高い広告コンテンツは、例えば、ユーザ端末10への広告配信時に複数の広告コンテンツの間で配信の競争が行われる際に、優先的に選出される。具体的には、入札価格「100円」の広告コンテンツと、入札価格「140円」の広告コンテンツとが、ユーザ端末10への広告配信を競争した場合には、入札価格の高い「140円」で入札された広告コンテンツが選出され、ユーザ端末10へ配信される。
【0048】
「指定条件」は、広告コンテンツの配信対象とするユーザに関して指定される条件を示す。指定条件には、「イベント」、「期間」、「配信希望数」といった小項目が含まれる。
【0049】
「イベント」は、広告コンテンツの配信を契機として、配信対象とするユーザに実行させたい行動(指定イベント)を示す。指定イベントは、広告コンテンツの配信によって広告主が獲得できる最終成果であるコンバージョンと一致する場合がある。例えば、製品Aに係る広告コンテンツAD01を入稿する広告主CL01は、製品Aをユーザに購入させることを広告コンテンツAD01の配信の目的とする。この場合、広告主CL01は、指定イベントを「製品A購入」として、広告コンテンツAD01を入稿する。そして、広告装置100は、製品Aを購入する可能性の高いユーザを抽出して、抽出されたユーザに広告コンテンツAD01を配信する。
【0050】
「期間」は、広告コンテンツの配信を契機として、配信対象とするユーザが指定イベントを実行すると想定される期間を示す。「期間」は、
図1で示した例における、所定の時間幅DU1を設定するために用いられる場合がある。すなわち、広告装置100は、広告主から指定された期間内に指定イベントを実行する可能性の高いユーザを抽出し、広告コンテンツを配信する。
【0051】
「配信希望数」は、広告主から指定される広告コンテンツの配信希望数を示す。配信希望数が「2000」回と指定された広告コンテンツAD01であれば、広告主は2000回の広告配信が行われることを希望していることを示す。なお、ここでいう「配信」とは、単にユーザ端末10に広告コンテンツが配信されたことのみをいうのではなく、広告コンテンツがユーザに視認可能なようにユーザ端末10に表示されたこと、いわゆる「インプレッション(Impression)数」を示すものであってもよい。広告装置100は、広告コンテンツの配信数が指定された配信希望数に達した場合には、配信希望数に達した広告コンテンツの配信を中止する。
【0052】
すなわち、
図4では、広告主ID「CL01」によって識別される広告主が、入札価格「100円」を提示して、広告コンテンツID「AD01」で識別される広告コンテンツを入稿した例を示す。また、広告主CL01は、広告コンテンツAD01について、指定条件として、イベント「製品A購入」を指定し、製品A購入に至るまでの期間「24時間以内」を指定し、配信希望数「2000」回を指定している例を示す。
【0053】
なお、
図4では図示することを省略したが、広告コンテンツ記憶部121は、実際に広告コンテンツが配信されている期間や、配信がされた後に、広告コンテンツの実績を記憶してもよい。例えば、広告コンテンツ記憶部121は、広告コンテンツの実績として、広告効果を示す指標であるCVR(Conversion Rate)などの情報を記憶してもよい。CVRは、広告コンテンツを配信した回数に対して何割がコンバージョンに至るかの割合を示す。また、広告コンテンツ記憶部121は、その他の広告効果を示す指標として、「CTR(Click Through Rate)」などを記憶してもよい。「CTR」は、広告コンテンツがユーザによりクリックされた回数を広告コンテンツの表示回数によって除算した値を示す。
【0054】
(ユーザ情報記憶部122について)
ユーザ情報記憶部122は、広告装置100が取得したユーザ情報を記憶する。具体的には、ユーザ情報記憶部122は、ユーザ端末10がウェブサーバ30に対してアクセスしたり、ウェブサーバ30が提供するウェブページにおいて検索をしたり、製品の購入要求を送信したりしたことを契機として作成されるユーザの行動のログを含む情報であって、後述する取得部132により受信されるユーザ端末10に関するユーザ情報を記憶する。
【0055】
ここで、
図5に、実施形態に係るユーザ情報記憶部122の一例を示す。
図5は、実施形態に係るユーザ情報記憶部122の一例を示す図である。
図5に示した例では、ユーザ情報記憶部122は、「ユーザID」、「イベントが発生した日時」、「イベント内容」といった項目を含むログ情報の一群から構成されるユーザ情報ファイルF01を記憶する。ユーザ情報ファイルF01は、広告装置100に取得されたユーザ情報を単純化し、概念的に示したものである。
図5では、ユーザ情報ファイルF01を構成するログはユーザID毎に記載されているが、実際には、ログは、イベントが発生した日時順にリアルタイムに追加される。
【0056】
「ユーザID」は、ユーザ端末10を識別する識別情報である。
図5において、ユーザIDは、「UserID=U11」と表記される。これは、ユーザ端末10がユーザID「U11」により識別されていることを示す。ここでは、ユーザIDは、ユーザ端末10を操作するユーザの参照符号と一致するものとする。すなわち、「UserID=U11」が記載されたログは、ユーザU11が操作するユーザ端末10によって行われたイベントに関する情報を示すものとする。
【0057】
「イベントが発生した日時」は、
図5において、「2014/05/10_1:00」といった数値で表される。また、「イベント内容」は、ユーザ端末10の実行したイベントの内容を示す。例えば、ユーザ端末10が検索を実行した場合、ログには、「“検索 => 製品A”」といったように、行動と、行動の内容が記載される。ここで、「製品A」は、検索クエリであることを示す。
【0058】
すなわち、
図5に示したユーザ情報ファイルF01を構成するログの一例は、ユーザIDが「U11」であるユーザU11により操作されるユーザ端末10が、検索クエリ「製品A」を入力して、「2014年5月10日 1:00」に検索を実行したことを示している。
【0059】
なお、
図5では図示することを省略したが、ユーザ情報記憶部122には、ウェブサイトへのアクセス履歴や購入履歴等から導かれるユーザ自体の属性情報(例えば、ユーザの年齢、性別、嗜好など)等が含まれてもよい。また、ユーザ情報記憶部122には、ユーザ端末10自体を識別する情報であるデバイスID等を記憶してもよい。デバイスIDは、ユーザIDと異なり、端末装置自体に記録されている識別情報を示す。
【0060】
また、ユーザ情報記憶部122は、広告装置100の内部に存在せず、例えば外部に接続された所定のログ記憶サーバなどであってもよい。この場合、取得部132は、ネットワークNを介して、所定のログ記憶サーバに記憶されているログを取得することができる。広告装置100は、随時ユーザ情報を取得する場合には、ユーザ情報に係るデータを格納するための大量の記憶容量を要する。ここで、広告装置100は、ユーザ情報記憶部122に対応する外部のログ記憶サーバを利用することにより、記憶容量の要求を満たすことができる。
【0061】
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告装置100内部の記憶装置に記憶されている各種プログラム(予測プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0062】
図3に示すように、制御部130は、入稿受付部131と、取得部132と、第1モデル生成部133と、第2モデル生成部134と、要求受付部135と、抽出部136と、配信部137とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、
図3に示した接続関係に限られず、他の接続関係であってもよい。
【0063】
(入稿受付部131について)
入稿受付部131は、広告主装置20から広告コンテンツの入稿を受け付ける。具体的には、実施形態に係る入稿受付部131は、入札価格の指定と、広告配信の対象とするユーザに関する条件とともに、広告コンテンツの入稿を受け付ける。そして、入稿受付部131は、入稿元の広告主に対応する広告主IDに対応付けて、入稿された広告コンテンツと、入札価格と、指定条件とを対応付けて、広告コンテンツ記憶部121に記憶する。
【0064】
入稿受付部131は、配信の条件として、指定イベントや、イベント発生に至るまでの期間や、配信希望数などの指定を受け付ける。前述のように、指定イベントは、広告コンテンツにおけるコンバージョンに対応する場合がある。
図4に示すように、広告主は、「製品A購入」や、「マンションB資料請求」や、「ウェブサイトC会員登録」など、広告コンテンツの配信を契機としてユーザに実行させたいイベントを指定する。後述する第1モデル生成部133及び第2モデル生成部134は、広告主に指定されたイベントに基づいて、指定イベントを実行したユーザのモデルを生成する。
【0065】
なお、入稿受付部131は、指定条件について、必ずしも広告コンテンツの入稿と同時に受け付けることを要しない。すなわち、入稿受付部131は、広告コンテンツの入稿の後に指定条件を受け付けてもよいし、指定条件を受け付けた後に、指定条件の変更を受け付けてもよい。広告主からの条件の受付は、例えば、広告主装置20に表示される、広告装置100が提供するユーザーインターフェース(User Interface)画面を介して行われる。
【0066】
(取得部132について)
取得部132は、ユーザの行動履歴を取得する。具体的には、実施形態に係る取得部132は、ユーザ情報記憶部122に記憶されるユーザ情報ファイルF01で示されるような、ユーザ端末10のログに基づいて、ユーザの行動履歴を取得する。
【0067】
ユーザ情報ファイルF01には、ユーザ識別情報であるユーザIDと所定の行動履歴に関する情報とから構成されるログが含まれる。行動履歴には、例えば、ウェブページへのアクセスであったり、クエリを入力することで行う検索行動であったり、ショッピングページにおける購買行動等が含まれる。そして、取得部132が取得する複数のログに基づいて、後述する第1モデル生成部133及び第2モデル生成部134は、指定イベントを実行したユーザのモデルを生成する。この場合、取得部132は、指定イベントを実行したユーザの行動履歴と、指定イベントを実行していないユーザの行動履歴とを取得する。
【0068】
なお、前述のように、取得部132が取得するログにはユーザIDが含まれる。したがって、取得部132は、ユーザIDに基づいて、クッキーなどのユーザ識別情報に含まれるユーザ属性に係る情報等をユーザ情報として取得することもできる。また、取得部132は、ユーザIDに基づいて、クッキーに含まれるユーザの過去のアクセス情報などをトラッキングすることにより、ユーザ情報を取得してもよい。例えば、取得部132は、ユーザ情報として、ユーザの年齢や、性別や、興味や、行動履歴や、居住地域等の情報を取得することができる。
【0069】
(第1モデル生成部133及び第2モデル生成部134について)
第1モデル生成部133及び第2モデル生成部134は、所定の行動が、取得部132によって取得された行動履歴に含まれる指定イベントよりも前の行動履歴と類似する行動であるか否かを判定するモデルを生成する。第1モデル生成部133は、指定イベントを実行したユーザの第1モデルを生成する。具体的には、実施形態に係る第1モデル生成部133は、入稿受付部131によって受け付けられた指定イベントをしたユーザの行動履歴から抽出した行動履歴と、指定イベントをしていないユーザの行動履歴から抽出した行動履歴とを用いて、第1モデルを生成する。
【0070】
第2モデル生成部134は、第1モデル生成部133によって生成された第1モデルを用いて、指定イベントをしていないユーザのうち指定イベントをしたユーザの行動履歴に含まれる指定イベントよりも前の行動履歴と類似する行動をしたユーザを抽出し、抽出したユーザの行動履歴と、指定イベントをしたユーザの行動履歴とを用いて、第2モデルを生成する。このように、第1モデル生成部133及び第2モデル生成部134は、2種類の異なるモデルを生成することにより、高精度に配信対象とするユーザを抽出する。
【0071】
ここで、実施形態に係るモデル生成処理の説明に先立ち、従来実施されている、いわゆるターゲティング広告等のユーザ抽出手法(以下、「従来手法」と表記する)について説明する。従来手法では、ユーザの行動履歴に基づいて、広告配信したいユーザのセグメント(segment)を設定する手法が用いられる。ここで、セグメントとは、マーケティングにおいて、ユーザを所定の属性で分類した群を示す。例えば、従来手法では、「現時点から所定の期間までの行動履歴に、製品Aを販売するウェブページの閲覧を1回以上実行、かつ、製品Aの検索を3回以上実行、が含まれるユーザ」のように条件を指定することで、ユーザのセグメントを設定する。そして、従来手法においては、設定されたセグメントに含まれるユーザに対し、かかるユーザに訴求力があると想定される広告コンテンツの配信が行われる。このように、従来手法では、ターゲットとなるユーザを過去の行動履歴に基づきセグメントに分類することで、広告効果が高くなると想定されるユーザに広告配信することを可能とする。
【0072】
しかし、従来手法では、ユーザをセグメントに分類した場合に、「既に製品Aを購入したユーザ」と、「将来、製品Aを購入すると予測されるユーザ」が混同する可能性がある。この場合、「既に製品Aを購入したユーザ」に対して、広告コンテンツを配信したとしても、製品Aの購入というコンバージョンにつながらないおそれがある。
【0073】
また、従来手法では、対象ユーザを拡張する場合に処理を要する場合がある。例えば、ユーザをセグメントに分類し、分類されたユーザに広告コンテンツを配信するとする。この場合、広告主が希望する配信数よりも配信対象となるユーザ数が少数の場合には、配信対象とするユーザを拡張することが要求される。そこで、従来手法では、例えば、配信対象とするユーザを「行動履歴に、製品Aを販売するウェブページの閲覧を1回以上実行、かつ、製品Aの検索を3回以上実行、が含まれるユーザ」から、「行動履歴に、製品Aを販売するウェブページの閲覧を1回以上実行、かつ、製品Aの検索を2回以上実行、が含まれるユーザ」のように条件を変更する。変更する条件については、ターゲットの精度をなるべく落とさない範囲で設定されることが望ましいため、最適な条件を検出するために処理を要する可能性がある。
【0074】
そこで、実施形態に係る第1モデル生成部133及び第2モデル生成部134は、従来手法と異なる手法によってユーザを抽出するため、指定イベントよりも前の行動と類似する行動であるか否かを段階的に判定する複数のモデルである第1モデル及び第2モデルを生成する。以下に、第1モデル生成部133及び第2モデル生成部134が行う生成処理について、
図6を用いて説明する。
【0075】
図6は、実施形態に係るモデル生成処理の一例を示す図である。
図6では、実施形態に係る第1モデル生成部133及び第2モデル生成部134によるモデル生成処理の流れを示している。なお、
図6の例において、モデルの目的となる指定イベントは、「製品Aの購入」であるものとする。
【0076】
図6において、グループG01に含まれるユーザは、製品Aを過去に購入したユーザである。ここで、製品Aを過去に購入したユーザに関するユーザ情報等のデータを、モデル生成における「正例」とする。正例とは、モデルの生成にあたって利用されるデータであり、指定イベントを実行した行動履歴のデータである。
【0077】
一方、グループG02に含まれるユーザは、所定の判定基準時において、製品Aを購入していないユーザである。製品Aを過去に購入していないユーザの行動履歴のデータを、モデル生成における「負例」とする。負例は、正例以外の全てのユーザの行動履歴のデータが該当する。
【0078】
ここで、モデルの生成は、単に正例の行動履歴を解析することのみでは達成されない。すなわち、生成したモデルと所定のユーザの行動履歴とを照らした場合に、所定のユーザが指定イベントを実行する側と高精度に判定されるか否かは、正例に類似する負例による学習を要する。具体的には、モデルの生成においては、負例に含まれる「正例に類似するが、製品Aを購入しなかった」行動履歴のデータを学習することを要する。このような負例の学習により、判定対象とするユーザの行動履歴のデータが正例と類似するような紛らわしいデータであっても、微少な差異を区別することが可能となり、高精度に正例と類似するか否かを判定するモデルを生成することができる。
【0079】
まず、第1モデル生成部133は、グループG01から所定数の正例を集計する(ステップS21)。また、第1モデル生成部133は、グループG02からランダムに抽出した所定数(例えば、ステップS21で集計した正例と同数)のユーザ群であるグループG03から負例を集計する(ステップS22)。
【0080】
第1モデル生成部133は、正例のデータについて、指定イベントである「製品Aの購入」が起きた時点を基準とし、「製品Aの購入」が起きた時点から過去の所定の時間幅DU1におけるイベント情報を集計する。そして、第1モデル生成部133は、負例のデータについてもイベント情報を集計する。ところで、負例には指定イベントである「製品Aを購入」が起きた時点が存在しないため、第1モデル生成部133は、各負例について、それぞれランダムな時点を指定イベントが起きた時点と仮定する。そして、第1モデル生成部133は、仮定した時点を基準として、正例でイベント情報を集計した期間と同じ期間である時間幅DU1におけるイベント情報を集計する。このように、第1モデル生成部133は、ランダムな時点を指定イベントが起きた時点と仮定することにより、特定期間のみに発生する流行的なイベントの影響を受けずに、負例におけるイベント情報を集計することができる。
【0081】
続いて、第1モデル生成部133は、集計した正例及び負例の行動履歴のデータに基づいて、第1モデルを生成する(ステップS23)。ここで、第1モデル生成部133が集計する負例には、上述したような、「正例に類似するが、製品Aを購入しなかった」行動履歴のデータが含まれる可能性が低くなることが想定される。これは、集計対象とする正例(グループG01)に対して、集計対象とする負例(グループG02)の数が膨大であるため、負例からランダムに抽出したグループG03の中に、「正例に類似するが、製品Aを購入しなかった」行動履歴のデータが含まれる割合が極めて低いことによる。
【0082】
すなわち、第1モデル生成部133により生成される第1モデルは、負例に含まれる「正例に類似するが、製品Aを購入しなかった」行動履歴のデータを加えて学習することを目的とするモデルではなく、負例に含まれる「大量の自明な負例」を除去するためのモデルとなる。自明な負例とは、一見して、製品Aの購入とは無関係な行動履歴のみを含む負例である。第1モデルによれば、所定のユーザの行動履歴のデータを照らした場合に、正例と、自明な負例とを判定することができる。
【0083】
続いて、第2モデル生成部134による第2モデルの生成処理について説明する。第2モデル生成部134は、第1モデルの生成で集計したグループG03の負例以外の負例であって、グループG03と比べて大量の負例(例えば、グループG03の10倍など)をグループG02から集計する(ステップS24)。
【0084】
そして、第2モデル生成部134は、集計した大量の負例を第1モデルに照らすことにより、スコア付けを行う(ステップS25)。これにより、第2モデル生成部134は、集計した大量の負例の中から、一定のスコア以上の負例であるグループG04を抽出する。この場合の一定のスコアは、例えば、スコアの具体的な数値を設定してもよいし、後述する第2モデルの生成において用いられる正例の数と等しくなるよう調整されたスコアを設定してもよい。
【0085】
続いて、第2モデル生成部134は、第1モデルの生成処理と同様に、グループG01から所定数の正例を集計する(ステップS26)。また、第2モデル生成部134は、上記の第1モデルでのスコア付けで抽出されたグループG04から、所定数(例えば、ステップS26で集計した正例と同数)の負例を集計する(ステップS27)。
【0086】
そして、第2モデル生成部134は、集計した正例の行動履歴のデータと、負例のデータとに基づいて、第2モデルを生成する(ステップS28)。ここで、第2モデル生成部134が集計する負例には、上述したような、「正例に類似するが、製品Aを購入しなかった」行動履歴のデータが含まれる可能性が高くなることが想定される。これは、ステップS25において、大量の負例を第1モデルでスコア付けすることにより、「正例に類似するが、製品Aを購入しなかった」行動履歴のデータが抽出された上で、第2モデルを生成していることによる。
【0087】
すなわち、第2モデル生成部134により生成される第2モデルは、第1モデルと異なり、負例に含まれる「正例に類似するが、製品Aを購入しなかった」行動履歴のデータを加えて学習することを目的とするモデルとなる。第2モデルによれば、所定のユーザの行動履歴のデータを照らした場合に、正例と、「正例に類似するが、製品Aを購入しなかった」負例とを、高精度に判定することができる。
【0088】
このように、第1モデル生成部及び第2モデル生成部により、2種類のモデルが生成される。ここで、実施形態に係るモデル生成処理においては、指定イベントが起きた時点から過去の所定の時間幅DU1における行動履歴のデータを正例とするので、「既に製品Aを購入したユーザ」と、「将来、製品Aを購入すると予測されるユーザ」が混同するような従来手法の問題が発生しない。また、実施形態に係るモデル生成処理においては、指定イベントを実行したユーザの「指定イベントを実行するに至るまでの所定の行動」がそのままモデル生成の対象となるため、上記従来手法のような、セグメントの設定が不要となる。
【0089】
また、第1モデル生成部133と、第2モデル生成部134とはともにモデルを生成するが、取り扱う負例が異なる。上述のように、第2モデル生成部134は、「自明な負例」を排除した上で第2モデルを生成する。これにより、第2モデル生成部134は、大量の「自明な負例」から影響を受けずに第2モデルを生成できる。結果として、第2モデルは、正例と、「正例に類似するが、製品Aを購入しなかった」負例とを判定する処理に優れたモデルとなる。
【0090】
(要求受付部135について)
要求受付部135は、広告配信に関する要求を受け付ける。具体的には、実施形態に係る要求受付部135は、ウェブページを表示するユーザ端末10から送信される要求であって、ウェブページに含まれる広告枠で表示する広告コンテンツの配信に関する要求を受け付ける。
【0091】
(抽出部136について)
抽出部136は、取得部132によって取得された行動履歴のうち所定の行動よりも前の行動履歴を用いて、当該所定の行動をすることが予測される対象のユーザを抽出する。また、抽出部136は、対象のユーザとして、現時点から所定期間内に指定イベントをすることが予測されるユーザを抽出する。具体的には、実施形態に係る抽出部136は、入稿受付部131により受け付けられた指定イベントである製品Aの購入をしたユーザの行動の時点よりも前の行動履歴を用いて、現時点から将来において製品Aを購入することが予測される対象のユーザを抽出する。
【0092】
ここで、抽出部136は、第1モデル生成部133及び第2モデル生成部134によって生成された複数のモデルである第1モデル及び第2モデルを用いて、対象のユーザを抽出する。すなわち、抽出部136は、任意の判定基準時において、取得部132が取得したユーザの行動履歴を用いて、各ユーザをスコア付けすることにより、広告配信の対象とするユーザを抽出する。
【0093】
まず、抽出部136は、取得部132が取得したユーザ情報に含まれるユーザの行動履歴を第1モデルと照らし合わせる。すなわち、抽出部136は、各ユーザを第1モデルによりスコア付けする。そして、抽出部136は、スコアが一定以上であるユーザを抽出する。
【0094】
続いて、抽出部136は、一定のスコア以上であったユーザについて、さらに第2モデルと照らし合わせる。すなわち、抽出部136は、各ユーザを第2モデルによりスコア付けする。そして、抽出部136は、各ユーザをスコア順に抽出する。この場合、抽出部136は、ユーザをスコア順に表示するユーザリストのようなものを作成してもよい。
【0095】
なお、抽出部136は、上記のように、各ユーザを第1モデルと照らし合わせた後に、第2モデルと照らし合わせるよう、各処理を順番に実行する。これは、第1モデルと第2モデルで判定対象とする要素が異なるため、第1モデルを照らし合わせずに第2モデルを照らし合わせた場合、適切にユーザが抽出されない可能性があるためである。
【0096】
(配信部137について)
配信部137は、広告コンテンツの配信要求に対して、広告コンテンツを配信する。具体的には、実施形態に係る配信部137は、抽出部136によって抽出されたユーザに対して、入稿受付部131により受け付けられた広告コンテンツを配信する。例えば、配信部137は、要求受付部135が広告配信の要求を受け付けた所定のユーザであって、抽出部136により、スコア上位者として抽出されたユーザである場合に、かかるユーザに対して、指定イベントに対応する広告コンテンツを配信する。
【0097】
なお、上述のように、実際に配信される広告コンテンツのデータ自体は、広告装置100に係る記憶部120内に記憶されていなくてもよい。例えば、配信部137は、外部に備えられた所定の広告配信サーバに広告配信の制御命令を送信することで、ユーザ端末10に広告コンテンツを配信させてもよい。
【0098】
〔4.抽出処理手順〕
次に、
図7及び
図8を用いて、実施形態に係る広告装置100による抽出処理の手順について説明する。以下においては、
図7を参照して広告装置100によるモデル生成処理手順を説明し、
図8を参照して広告装置100による抽出処理手順を説明する。
【0099】
まず、
図7を用いて、実施形態に係る広告装置100によるモデル生成処理手順について説明する。
図7は、実施形態に係る広告装置100によるモデル生成処理手順を示すフローチャートである。
【0100】
図7に示すように、入稿受付部131は、広告主から広告コンテンツの入稿とともに、広告配信の条件を受け付けたか否かを判定する(ステップS101)。そして、入稿受付部131は、広告主から広告配信の条件を受け付けていない場合(ステップS101;No)、受け付けるまで待機する。
【0101】
一方、広告主から広告配信の条件を受け付けた場合(ステップS101;Yes)、入稿受付部131は、広告配信の条件に関する情報を取得部132に渡し、取得部132は、かかる条件に関するユーザ情報を取得する(ステップS102)。
【0102】
そして、第1モデル生成部133は、取得部132の取得したユーザ情報に基づいて、製品Aの購入者の行動履歴を集計する(ステップS103)。また、第1モデル生成部133は、ランダムに選出された未購入者の行動履歴についても集計する(ステップS104)。そして、第1モデル生成部133は、集計した情報に基づいて、第1モデルを生成する(ステップS105)。
【0103】
そして、第2モデル生成部134は、第1モデルの生成で利用した未購入者の行動履歴と比較して多数の未購入者の行動履歴を第1モデルでスコア付けする(ステップS106)。そして、第2モデル生成部134は、第2モデル生成のため、一定のスコア付け以上の未購入者のサンプルを抽出する(ステップS107)。
【0104】
続いて、第2モデル生成部134は、抽出した一定のスコア付け以上の未購入者のサンプルと、正例である購入者の行動履歴とに基づいて、第2モデルを生成する(ステップS108)。以上により、広告装置100によるモデル生成処理は完了する。
【0105】
次に、
図8を用いて、実施形態に係る広告装置100による抽出処理手順を説明する。
図8は、実施形態に係る広告装置100による抽出処理手順を示すフローチャートである。
【0106】
図8に示すように、要求受付部135は、ユーザ端末10から、広告配信の要求を受け付けたか否かを判定する(ステップS201)。そして、要求受付部135は、広告配信の要求を受け付けていない場合(ステップS201;No)、受け付けるまで待機する。
【0107】
一方、広告配信を受け付けた場合(ステップS201;Yes)、要求受付部135は、広告配信に関する要求を抽出部136に渡す。そして、抽出部136は、広告コンテンツを配信する可能性のあるユーザに該当するユーザの行動履歴を取得する(ステップS202)。
【0108】
続いて、抽出部136は、取得したユーザの行動履歴について、第1モデルでスコア付けする(ステップS203)。そして、抽出部136は、スコア付けされたスコアが一定以上であるか否かを判定する(ステップS204)。一定スコア以上でない場合、抽出部136は、かかるユーザを広告配信の対象としない(ステップS207)。
【0109】
一方、一定のスコア以上である場合(ステップS204;Yes)、抽出部136は、さらに、かかるユーザの行動履歴を第2モデルでスコア付けする(ステップS205)。そして、抽出部136は、広告配信の要求を送信したユーザの行動履歴がスコア上位者に該当するか否かを判定する(ステップS206)。スコア上位者に該当しない場合、抽出部136は、かかるユーザを広告配信の対象としない(ステップS207)。
【0110】
一方、スコア上位者に該当する場合(ステップS206;Yes)、抽出部136は、かかるユーザを広告配信の対象として抽出する(ステップS208)以上により、広告装置100による抽出処理は完了する。
【0111】
〔5.変形例〕
上述した広告装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、広告装置100の他の実施形態について説明する。
【0112】
〔5−1.複数の指定イベント〕
上述した実施形態において、入稿受付部131は、広告主から一つのイベントの指定を受け付ける例を示した。また、第1モデル生成部133及び第2モデル生成部134は、広告主から受け付けた一つの指定イベントに関して、指定イベントを実行したユーザのモデルを生成する例を示した。しかし、指定イベントは一つに限られず、複数のイベントが指定されてもよい。すなわち、抽出部136は、複数のイベントの組合せである指定イベントよりも前の行動履歴を用いて、複数のイベントの組合せである指定イベントをすることが予測される対象のユーザを抽出する。
【0113】
例えば、入稿受付部131は、「バナー広告をクリックする」というイベントの後に、「製品Aを購入する」というイベントが実行される、という二つのイベントの指定を受け付けてもよい。
【0114】
この場合、第1モデル生成部133及び第2モデル生成部134は、「バナー広告をクリックする」というイベントの後に、「製品Aを購入する」というイベントを実行したユーザの行動履歴を正例として、モデルを生成する。
【0115】
このように、広告装置100は、複数のイベントの指定を受け付ける。そして、広告装置100は、複数のイベントを指定イベントとして、指定イベントを実行する可能性の高いユーザを抽出する。これにより、広告装置100は、広告主からの詳細な要望に対応して、広告コンテンツの配信対象とするユーザを抽出することができる。また、複数のイベントを指定した場合には、広告配信の対象となるユーザが抽出される数が絞りこまれることが想定される。この場合、広告主は、少ない広告コンテンツの配信数で、コンバージョンが高く見込めるユーザに広告コンテンツを配信できるので、広告配信にかかる費用を抑えつつ、広告効果を向上させることができる。
【0116】
〔5−2.行動履歴の重み付け〕
上述した実施形態において、第1モデル生成部133及び第2モデル生成部134が、所定数の正例と負例との例を用いて、モデルを生成する例を示した。ここで、第1モデル生成部133及び第2モデル生成部134は、モデルの生成に用いる正例や負例の行動履歴データについて重み付けを行い、モデルを生成してもよい。すなわち、第1モデル生成部133及び第2モデル生成部134は、ユーザ毎に重み付けがなされた行動履歴に基づいて、第1モデル及び第2モデルを生成する。
【0117】
例えば、第1モデル生成部133は、インプレッション数が多いユーザに関する行動履歴であって、コンバージョンが低いユーザに関する行動履歴について、モデルの生成における重み付けを行う。具体的には、第1モデル生成部133は、インプレッション数が多く、かつ、負例となるユーザの行動履歴については、学習の度合いを高く設定する。言い換えれば、第1モデル生成部133は、インプレッション数が多く、かつ、負例となるユーザの行動履歴については、他の負例に比べて、モデルへの影響が大きくなるように設定する。
【0118】
インプレッション数が多いユーザには、頻繁に広告コンテンツが配信される。ところが、頻繁に広告コンテンツが配信されるにもかかわらず、コンバージョンがない、あるいは、コンバージョンが少ないユーザに対しては、頻繁に広告コンテンツを配信することは広告効果の向上につながらない。また、広告主にとっては、広告効果が向上しないユーザに広告コンテンツが頻繁に配信されることで、広告配信にかかる費用が無駄に増大することになる。そのため、第1モデル生成部133は、かかるユーザについては、他の負例に比べて、モデルへの影響が大きくなるように設定し、インプレッション数が多く、コンバージョンの低いユーザには広告コンテンツが配信されにくくなるように調整した上で、モデルを生成する。
【0119】
また、第1モデル生成部133は、インプレッション数が少ないユーザであって、かつ、正例であるユーザについても重み付けをしてモデルを生成する。すなわち、インプレッション数が少ないユーザであって正例であるユーザは、コンバージョン率が高く、広告効果の向上につながりやすい。この場合、第1モデル生成部133は、かかるユーザについては、他の正例に比べて、モデルへの影響が大きくなるように設定し、インプレッションが低いようなユーザに広告コンテンツが配信されやすく調整した上で、モデルを生成する。
【0120】
このように、広告装置100は、取り扱う正例、負例のデータについて、重み付けを行ってモデルを生成し、広告配信の対象となるユーザを抽出する。これにより、広告装置100は、ユーザの行動の実態に即して抽出処理を行うことができる。結果として、広告装置100は、インプレッション数を抑えた上で、広告効果が向上するような広告コンテンツの配信を実現できる。また、広告主にとっては、広告コンテンツの配信にかかる費用を抑えた上で、広告効果の高い広告配信が実現できる。
【0121】
〔5−3.データの取得〕
上述した実施形態に係る抽出処理において、取得部132は、ユーザ端末10がウェブサーバ30の提供するウェブサイトにアクセスした場合におけるユーザ情報を取得する例を示した。しかし、取得部132は、ユーザ端末10がウェブサーバ30の提供するウェブサイトにアクセスする場合に限らず、ユーザ端末10からユーザ情報を取得することもある。この点について、以下に説明する。
【0122】
上述のように、実施形態に係る取得部132は、ウェブサーバ30の提供するウェブサイトに埋め込まれたウェブビーコンのような通知機能を利用することにより、ユーザ端末10からユーザ情報を取得する。すなわち、取得部132は、ユーザ端末10が上記のような通知機能を備えないウェブサイトにアクセスした場合には、ユーザ情報を取得することができない。
【0123】
しかし、ユーザ端末10がアクセスしたウェブサイトが、広告装置100を管理する管理装置(例えば、広告装置100に対するフロントエンドサーバ)と同じ管理装置に管理される所定のウェブサーバから提供されている場合、取得部132は、ユーザ端末10からユーザ情報を取得することができる。すなわち、ユーザ端末10は、管理装置に管理される所定のウェブサーバが提供するウェブサイトにアクセスする際、ユーザ端末10のユーザ情報を上記管理装置に送信する。これは、ユーザ端末10が管理装置にクッキーを送信することなどにより実現される。この場合、ユーザ端末10の送信したユーザ情報は、管理装置を介して、広告装置100の備える取得部132に送信される。これにより、取得部132は、ウェブサーバ30を介することなく、ユーザ端末10のユーザ情報を取得することができる。
【0124】
なお、取得部132は、ウェブサーバ30を介さずに蓄積されたユーザ情報に対応するユーザ端末10がウェブサーバ30にアクセスした場合には、ウェブサーバ30を介さずに蓄積されたユーザ情報に含まれるユーザID「U1」と同一のユーザID「U1」を含むユーザ情報を取得する。すなわち、取得部132は、ウェブサーバ30を介したユーザ情報であっても、ウェブサーバ30を介さないユーザ情報であっても、ユーザ端末10にかかるユーザ識別情報については、同一のユーザID「U1」を取得することができる。このことは、ユーザ端末10が同一のブラウザを用いてウェブサイトにアクセスすることで、ユーザ端末10が、ウェブサーバ30と管理装置とに対応するクッキーを送信することにより実現される。あるいは、ユーザ端末10のデバイスIDを照合することにより実現される。
【0125】
〔5−4.抽出処理のタイミング〕
上記実施形態においては、抽出部136は、ユーザ端末10から広告配信の要求があったことを契機として、ユーザの抽出処理を行う例を示した。しかし、抽出部136がユーザの抽出処理を行うのは、任意のタイミングでよい。例えば、抽出部136は、随時抽出処理を行い、ユーザリストを更新してもよい。また、抽出部136は、所定の一定期間毎にユーザの抽出処理を行ってもよい。この場合、取得部132は、所定の一定期間毎にユーザ情報を取得し、ユーザ情報を更新する。
【0126】
〔5−5.複数のモデル生成〕
上記実施形態におけるモデル生成処理においては、第1モデル生成部133及び第2モデル生成部134によって、2種類のモデルが生成される例を示した。しかし、モデル生成処理においては、さらに多くのモデルが生成されてもよい。すなわち、抽出処理の精度向上が見込まれる場合には、広告装置100は、さらに多くのモデルを生成し、抽出処理を行うことができる。また、上記実施形態においては、モデルの生成が第1モデル生成部133と、第2モデル生成部134によって行われる例を示したが、両者は、モデル生成部として統合されてもよい。
【0127】
〔5−6.広告主から受け付ける条件〕
上述した実施形態では、入稿受付部131は、広告主から広告コンテンツの配信希望数を受け付ける例を示した。その他にも、入稿受付部131は、広告主から、所定の行動をすることが予測される対象のユーザに関する条件を受け付けてもよい。そして、抽出部136は、入稿受付部131により受け付けられた条件に基づいて、当該条件を満たすユーザを所定の行動をすることが予測される対象のユーザとして抽出する。
【0128】
例えば、入稿受付部131は、広告主から、配信希望数とともに、CPA(Cost Per Acquisition)の指定を受け付けてもよい。CPAは、広告コンテンツによってコンバージョンにつながった(新規顧客を獲得した)場合における、新規顧客の獲得人数あたりの費用を示す。CPAは、広告費用をコンバージョン数で除算することで求められ、CPAの値が低いほど、広告の効率がよいことを意味している。
【0129】
この場合、抽出部136は、広告主が指定したCPAの範囲内(例えば、500円以下など)において、ユーザの抽出度合いを調整してもよい。例えば、抽出部136は、所定の行動をすることが予測される対象のユーザとして抽出される度合いを低くすることで、抽出されるユーザ数を増やすことができる。この場合、CPAは上昇するものの、抽出部136は、多くのユーザ数を抽出することができる。
【0130】
このように、広告装置100は、広告主から受け付けた条件に基づいて、条件を満たすユーザを抽出できる。これにより、広告主は、顧客の範囲を精度良く拡張することができる。なお、上記例において、入稿受付部131は、広告主から、CPC(Cost Per Click)の指定を受け付けてもよい。CPCは、広告コンテンツがユーザにクリックされた際に、広告主から得られる報酬の単価を示す。例えば、CPCは、クリック1回あたりの料金に該当する。
【0131】
また、抽出されたユーザに関する情報は、広告配信に利用される態様に限られず、他の様々な用途に利用されてもよい。例えば、広告装置100の抽出したユーザに関する情報は、広告装置100により生成されるユーザリスト等に基づいて、新たなユーザの獲得のための行動(例えば、抽出されたユーザへのメール配信など)に利用されてもよい。
【0132】
〔6.ハードウェア構成〕
また、上述してきた実施形態に係る広告装置100は、例えば
図9に示すような構成のコンピュータ1000によって実現される。以下、広告装置100を例に挙げて説明する。
図9は、広告装置100の機能を実現するコンピュータ1000の一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0133】
CPU1100は、ROM1300又はHDD1400に記憶されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を記憶する。
【0134】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を記憶する。通信インターフェイス1500は、通信網500(
図2に示したネットワークNに対応)を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを通信網500を介して他の機器へ送信する。
【0135】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、入出力インターフェイス1600を介して生成したデータを出力装置へ出力する。
【0136】
メディアインターフェイス1700は、記録媒体1800に記憶されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0137】
例えば、コンピュータ1000が実施形態に係る広告装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが記憶される。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置から通信網500を介してこれらのプログラムを取得してもよい。
【0138】
〔7.その他〕
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0139】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。例えば、
図3に示した取得部132、第1モデル生成部133及び第2モデル生成部134は統合されてもよい。また、例えば、第1モデル生成部133及び第2モデル生成部134は統合されたモデル生成部であってもよい。また、例えば、記憶部120に記憶される情報は、ネットワークNを介して、外部に備えられた記憶装置に記憶されてもよい。
【0140】
また、例えば、上記実施形態では、広告装置100が、広告配信対象の候補となるユーザを抽出する抽出処理と、広告コンテンツを配信する配信処理とを行う例を示した。しかし、上述した広告装置100は、抽出処理を行う抽出装置と、配信処理を行う配信装置とに分離されてもよい。この場合、抽出装置は、入稿受付部131と、取得部132と、第1モデル生成部133と、第2モデル生成部134と、抽出部136とを有する。また、配信装置は、入稿受付部131と、要求受付部135と、配信部137とを有する。
【0141】
そして、抽出装置の入稿受付部131は、広告主から、広告配信の対象とするユーザに関する条件を受け付ける。また、抽出装置の取得部132、第1モデル生成部133及び第2モデル生成部134は、上述したモデルを生成する。また、抽出装置の抽出部136は、入稿受付部131によって受け付けられた条件に対応する広告配信対象のユーザを抽出する。このとき、抽出部136は、例えば、モデルによって出力されるスコア順にユーザがソートされたユーザリストのようなものを作成する。このように、抽出部136は、上記条件を入稿した広告主に対応するユーザリストを作成する。
【0142】
また、配信装置の入稿受付部131は、広告主から広告コンテンツの入稿を受け付ける。このとき、入稿受付部131は、CPCやCPAや広告予算を受け付けてもよい。そして、配信装置の配信部137は、要求受付部135によって広告配信に関する要求が受け付けられた場合に、要求元であるユーザ(すなわち、ユーザ端末10)が上述したようなユーザリストに含まれるか否かを抽出装置に問い合わせる。この場合、抽出装置は、問い合わせ対象のユーザがユーザリストに含まれる場合に、かかるユーザリストに対応する広告主に関する情報を配信装置に通知する。そして、配信部137は、抽出装置から広告主に関する情報が通知された場合に、かかる広告主に対応する広告コンテンツを優先的にユーザ端末10に配信する。
【0143】
また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0144】
〔8.効果〕
上述してきたように、実施形態に係る広告装置100は、ユーザの行動履歴を取得する取得部132と、取得部132によって取得された行動履歴のうち指定イベント(所定の行動の一例)よりも前の行動履歴を用いて、指定イベントをすることが予測される対象のユーザを抽出する抽出部136とを備える。
【0145】
これにより、実施形態に係る広告装置100は、設定した時間幅DU1内に、指定イベントである「製品A購入」をする可能性の高いユーザを抽出することができる。このように、広告装置100は、取得したユーザ情報を活用することで、広告主の目的に沿う購買行動等を将来行うユーザを高精度に抽出するので、対象とするマーケットとなるユーザ層を精度良く拡張することができる。
【0146】
また、抽出部136は、対象のユーザとして、現時点から所定期間内に指定イベントをすることが予測されるユーザを抽出する。これにより、実施形態に係る広告装置100は、ユーザの将来において予測されうる行動に関する情報を利用することができる。
【0147】
また、実施形態に係る広告装置100は、ユーザの行動履歴に含まれる指定イベントよりも前の行動と判定対象とする行動とが類似するか否かを判定するモデルを生成する第1モデル生成部133及び第2モデル生成部134をさらに備える。そして、抽出部136は、第1モデル生成部133及び第2モデル生成部134の生成したモデルを用いて、予測される対象のユーザを抽出する。
【0148】
これにより、実施形態に係る広告装置100は、指定イベントを実行すると想定されるユーザを精度よく判定できる。このため、実施形態に係る広告装置100は、広告配信の対象とするユーザを高精度に抽出することができる。
【0149】
また、取得部132は、指定イベントをしたユーザの行動履歴と、指定イベントをしていないユーザの行動履歴とを取得する。第1モデル生成部133及び第2モデル生成部134は、指定イベントをしたユーザの行動履歴のうち指定イベントをした時点から所定期間(例えば時間幅DU1)だけ過去の時点までに含まれる行動履歴と、指定イベントをしていないユーザの行動履歴のうち任意の時点から所定期間だけ過去の時点までに含まれる行動履歴とを用いて、第1モデル及び第2モデルを生成する。
【0150】
ここで、第1モデル生成部133及び第2モデル生成部134は、前記モデル生成部は、任意の時点として、指定イベントをしていないユーザの行動履歴毎にランダムな時点を用いる。
【0151】
このように、実施形態に係る広告装置100は、各負例について、それぞれランダムな時点を指定イベントが起きた時点と仮定し、仮定した時点を基準として、正例でイベント情報を集計した期間と同じ期間でイベント情報を集計する。これにより、実施形態に係る広告装置100は、負例について学習された、判定に優れたモデルを生成することができる。また、実施形態に係る広告装置100は、ランダムな時点を指定イベントが起きた時点と仮定することにより、特定期間のみに発生する流行的なイベントの影響を受けずに、負例におけるイベント情報を集計することができる。
【0152】
また、第1モデル生成部133及び第2モデル生成部134は、指定イベントよりも前の行動と類似する行動であるか否かを段階的に判定する複数のモデルである第1モデル及び第2モデルを生成する。抽出部136は、第1モデル生成部133及び第2モデル生成部134によって生成された複数のモデルである第1モデル及び第2モデルを用いて、対象のユーザを抽出する。
【0153】
ここで、第1モデル生成部133は、指定イベントをしたユーザの行動履歴から抽出した行動履歴と、指定イベントをしていないユーザの行動履歴から抽出した行動履歴とを用いて、複数のモデルのうちの一つである第1モデルを生成する。また、第2モデル生成部134は、第1モデル生成部133によって生成された第1モデルを用いて、指定イベントをしていないユーザのうち指定イベントをしたユーザの行動履歴に含まれる指定イベントよりも前の行動履歴と類似する行動をしたユーザを抽出し、抽出したユーザの行動履歴と、指定イベントをしたユーザの行動履歴とを用いて、複数のモデルのうちの一つである第2モデルを生成する。
【0154】
このように、実施形態に係る広告装置100は、モデルを複数生成することで、一つのモデルが扱うオンライン上の大量な負例等を処理する負担を軽くし、データを効率良く取扱う。これにより、実施形態に係る広告装置100は、短時間で抽出処理を実行することができる。
【0155】
また、抽出部136は、複数の行動の組合せである指定イベントよりも前の行動履歴を用いて、複数の行動の組合せである指定イベントをすることが予測される対象のユーザを抽出する。
【0156】
これにより、実施形態に係る広告装置100は、広告主からの詳細な要望に対応して、広告コンテンツの配信対象とするユーザを抽出することができる。また、複数のイベントを指定した場合には、広告配信の対象となるユーザが抽出される数が絞りこまれることが想定される。この場合、広告主は、少ない広告コンテンツの配信数により、コンバージョンが高く見込めるユーザに広告コンテンツを配信できるので、広告配信にかかる費用を抑えつつ、広告効果を向上させることができる。
【0157】
また、第1モデル生成部133及び第2モデル生成部134は、ユーザ毎に重み付けがなされた行動履歴に基づいて、第1モデル及び第2モデルを生成する。
【0158】
これにより、実施形態に係る広告装置100は、ユーザの行動の実態に即して抽出処理を行うことができる。結果として、実施形態に係る広告装置100は、インプレッション数を抑えた上で、広告効果が向上するような広告コンテンツの配信を実現できる。
【0159】
また、実施形態に係る広告装置100は、イベントの指定を受け付ける入稿受付部(受付部の一例)をさらに備える。また、抽出部136は、入稿受付部131により受け付けられた指定イベントをすることが予測される対象のユーザを抽出する。
【0160】
これにより、実施形態に係る広告装置100は、広告主の詳細な要望に応じて、広告配信の対象となるユーザを抽出することができる。
【0161】
また、入稿受付部131は、対象のユーザに関する条件を受け付ける。抽出部136は、入稿受付部131により受け付けられた条件に基づいて、条件を満たすユーザを対象のユーザとして抽出する。
【0162】
このように、実施形態に係る広告装置100は、広告主から受け付けた条件に基づいて、条件を満たすユーザを抽出できる。このため、実施形態に係る広告装置100によれば、広告主は顧客の範囲を精度良く拡張することができる。
【0163】
また、実施形態に係る広告装置100は、広告コンテンツ(任意のコンテンツの一例)を配信する配信部137をさらに備える。また、入稿受付部131は、イベントの指定とともに、広告コンテンツの入稿を受け付ける。また、配信部137は、抽出部136によって抽出されたユーザに対して、入稿受付部131により受け付けられた広告コンテンツを配信する。
【0164】
これにより、実施形態に係る広告装置100は、製品Aに関する広告コンテンツが配信されることを契機として、実際に製品Aを購入するというイベントを実行する可能性が高いユーザに対して、広告コンテンツを配信することができる。このため、実施形態に係る広告装置100は、コンバージョン率の高い広告配信を実現できるので、広告コンテンツの広告効果を向上させることができる。
【0165】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0166】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。