(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
以下に、本願に係る広告抽出装置、広告抽出方法及び広告抽出プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る広告抽出装置、広告抽出方法及び広告抽出プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0012】
〔1.広告抽出処理〕
まず、
図1を用いて、実施形態に係る広告抽出処理の一例について説明する。
図1は、実施形態に係る広告抽出処理の一例を示す説明図である。
図1の例では、広告配信装置100によって広告抽出処理が行われる。
図1に示した広告配信装置100は、広告主によって利用される広告主装置10
1〜10
nから広告コンテンツの入稿を受け付け、受け付けた広告コンテンツを保持する。そして、広告配信装置100は、ユーザによって利用される端末装置20等から広告コンテンツの取得要求を受信した場合に、保持している広告コンテンツの中から所定の広告コンテンツを端末装置20等に配信する。
【0013】
図1に示した例では、広告配信装置100は、広告主装置10
1から広告コンテンツC11の入稿を受け付け、広告主装置10
2から広告コンテンツC21の入稿を受け付け、広告主装置10
nから広告コンテンツC31の入稿を受け付け、これらの広告コンテンツC11、C21及びC31を広告コンテンツ記憶部121に格納する(ステップS11)。このとき、広告配信装置100は、広告コンテンツ毎に、かかる広告コンテンツの特徴を示すキーワードを対応付けて広告コンテンツ記憶部121に格納する。このようなキーワードは、広告配信装置100によって広告コンテンツから抽出されてもよいし、広告主装置10によって広告コンテンツとともに入稿されてもよいが、この点については後述する。
【0014】
また、広告配信装置100は、広告コンテンツ記憶部121に格納されている各広告コンテンツに対応するキーワードに基づいて、広告主から入稿される広告コンテンツの傾向を解析する(ステップS12)。具体的には、広告配信装置100は、広告コンテンツ記憶部121から、現在日時よりも所定の期間(例えば、2週間や1ヶ月)だけ過去の日時以降に入稿された広告コンテンツのキーワードを抽出し、抽出した各キーワードの数を計数する。そして、広告配信装置100は、計数結果が多いキーワードに関する広告コンテンツほど広告主から多く入稿されている傾向にあると判定し、かかるキーワードに高い重みを付与する。
【0015】
この点について
図1に示した広告コンテンツ記憶部121を例に挙げて説明する。なお、実際の広告コンテンツ記憶部121には膨大な量の広告コンテンツが格納されており、キーワードの数も膨大であるが、ここでは説明を簡単にするために、広告コンテンツ記憶部121が
図1に示した状態であるものとする。
図1の例において、広告配信装置100は、キーワード「クリスマス」を2個計数し、キーワード「旅行」を1個計数する。そして、広告配信装置100は、キーワード「旅行」の計数結果「1」よりもキーワード「クリスマス」の計数結果「2」の方が多いので、キーワード「旅行」よりもキーワード「クリスマス」に対して高い重みを付与する。
図1の例では、広告配信装置100は、キーワード「クリスマス」に重み「2.0」を付与し、キーワード「旅行」に重み「1.2」を付与する。そして、広告配信装置100は、このようなキーワード毎の重みを傾向記憶部122に格納する。
【0016】
続いて、広告配信装置100は、端末装置20に広告コンテンツを配信する際に、傾向記憶部122を参照し、重みが高いキーワードを含む広告コンテンツを優先して端末装置20に配信する(ステップS13)。例えば、
図1の例の場合、広告配信装置100は、キーワード「旅行」よりもキーワード「クリスマス」を含む広告コンテンツC11又はC12を優先して端末装置20に配信する。
【0017】
なお、広告配信装置100は、ユーザが閲覧するウェブページに含まれるキーワードと合致する広告コンテンツを選択的に配信する「コンテンツマッチ」や、ユーザ属性に基づいて広告コンテンツを選択的に配信する「ターゲティング配信」といった手法とともに、上述したステップS13におけるキーワードの重みを考慮した広告抽出処理を行う場合もある。この場合、広告配信装置100は、必ずしも広告コンテンツC11又はC12を配信するとは限らないが、少なくともキーワード「クリスマス」を含む広告コンテンツが優先的に配信されるよう制御する。
【0018】
このように、実施形態に係る広告配信装置100は、所定の期間内に広告主から入稿された広告コンテンツに含まれるキーワードに基づいて、広告主から入稿される広告コンテンツの種別(上記例では、キーワード)に関する傾向を解析し、かかる解析結果に基づいて広告コンテンツの配信処理を行うので、広告主の意向に沿った広告配信を行うことができる。具体的には、広告主は、一般的に、今後販売する商品等に関する広告コンテンツを先行して入稿する。このため、広告配信装置100は、所定の期間内に入稿された広告コンテンツを解析することで、広告主が望む今後の流行を特定することができるので、広告主の意向と合致した流行に関する広告コンテンツを優先的に配信することが可能になる。また、広告主は、世間に知られていない商品に関する広告コンテンツについても先行して入稿する場合がある。すなわち、広告配信装置100は、所定の期間内に入稿された広告コンテンツを解析することで、テレビニュースやウェブサイト等からは予測することが困難である今後の流行についても特定することができるので、広告主が望む今後の流行と合致した広告コンテンツを配信することが可能になる。以上のことから、実施形態に係る広告配信装置100は、広告主の意向に沿った広告配信を行うことができる。以下、このような広告抽出処理を行う広告配信装置100について詳細に説明する。
【0019】
〔2.広告配信システムの構成〕
次に、
図2を用いて、実施形態に係る広告配信システムの構成について説明する。
図2は、実施形態に係る広告配信システム1の構成例を示す図である。
図2に示すように、広告配信システム1には、広告主装置10
1〜10
nと、端末装置20と、情報提供装置30と、広告配信装置100とが含まれる。広告主装置10
1〜10
n、端末装置20、情報提供装置30及び広告配信装置100は、ネットワークNを介して、有線又は無線により通信可能に接続される。なお、
図2に示した広告配信システム1には、複数台の端末装置20や、複数台の情報提供装置30や、複数台の広告配信装置100が含まれてもよい。
【0020】
広告主装置10
1〜10
nは、広告配信装置100に広告配信を依頼する広告主によって利用される情報処理装置である。かかる広告主装置10
1〜10
nは、広告主による操作に従って、広告コンテンツを広告配信装置100に入稿する。例えば、広告主装置10
1〜10
nは、静止画像や、動画像や、テキストデータや、広告主が管理する広告主サーバによって提供されるウェブページにアクセスするためのURL(Uniform Resource Locator)などに該当する広告コンテンツを広告配信装置100に入稿する。なお、広告主は、広告主装置10
1〜10
nを用いて、広告コンテンツを広告配信装置100に入稿せずに、広告コンテンツの入稿を代理店に依頼する場合もある。この場合、広告配信装置100に広告コンテンツを入稿するのは代理店となる。以下では、「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主装置」といった表記は、広告主装置だけでなく代理店によって利用される代理店装置を含む概念であるものとする。また、広告主装置10
1〜10
nは、それぞれ同様の機能を有するので、以下では、広告主装置10
1〜10
nを区別する必要がない場合には、これらを総称して「広告主装置10」と表記する場合がある。
【0021】
端末装置20は、例えば、デスクトップ型PC(Personal Computer)や、ノート型PCや、タブレット型端末や、携帯電話機、PDA(Personal Digital Assistant)等の情報処理装置である。例えば、端末装置20は、情報提供装置30にアクセスすることで、情報提供装置30からウェブページを取得し、取得したウェブページを表示装置(例えば、液晶ディスプレイ)に表示する。また、端末装置20は、ウェブページに広告枠が含まれる場合には、広告配信装置100にアクセスすることで、広告配信装置100から広告コンテンツを取得し、取得した広告コンテンツをウェブページ上に表示する。ただし、この例に限られず、端末装置20は、広告コンテンツを含むウェブページを情報提供装置30から取得してもよい。この場合、情報提供装置30は、広告配信装置100によって提供される広告コンテンツを組み込んだウェブページを端末装置20に配信する。
【0022】
情報提供装置30は、端末装置20にウェブページを提供するWebサーバ等である。かかる情報提供装置30は、例えば、ニュースサイト、オークションサイト、天気予報サイト、ショッピングサイト、ファイナンス(株価)サイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関する各種ウェブページを提供する。
【0023】
広告配信装置100は、広告主装置10から入稿された広告コンテンツを配信するサーバ装置である。上記の通り、広告配信装置100は、端末装置20からアクセスされた場合に、広告コンテンツを端末装置20に配信する。また、広告配信装置100は、情報提供装置30からアクセスされた場合には、広告コンテンツを情報提供装置30に配信する。
【0024】
〔3.広告配信装置の構成〕
次に、
図3を用いて、実施形態に係る広告配信装置100の構成について説明する。
図3は、実施形態に係る広告配信装置100の構成例を示す図である。
図3に示すように、広告配信装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、広告配信装置100は、広告配信装置100を利用する管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0025】
(通信部110について)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。かかる通信部110は、ネットワークNと有線又は無線で接続され、ネットワークNを介して、広告主装置10や端末装置20や情報提供装置30との間で情報の送受信を行う。
【0026】
(記憶部120について)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。かかる記憶部120は、
図3に示すように、広告コンテンツ記憶部121と、傾向記憶部122とを有する。
【0027】
(広告コンテンツ記憶部121について)
広告コンテンツ記憶部121は、広告主装置10から入稿された広告コンテンツを記憶する。ここで、
図4に、実施形態に係る広告コンテンツ記憶部121の一例を示す。
図4に示した例では、広告コンテンツ記憶部121は、「広告主ID」、「広告コンテンツ」、「入稿日時」、「キーワード」といった項目を有する。
【0028】
「広告主ID」は、広告主又は広告主装置10を識別するための識別情報を示す。「広告コンテンツ」は、広告主装置10から入稿された広告コンテンツを示す。
図4に示した例では、広告コンテンツ記憶部121の広告コンテンツに、「C11」や「C12」といった概念的な情報が格納される例を示したが、実際には、静止画像や動画像やテキストデータやURL、又は、これらの格納場所を示すファイルパス名などが記憶される。
【0029】
「入稿日時」は、広告主装置10から広告コンテンツが入稿された日時を示す。「キーワード」は、広告コンテンツから抽出される文字列等であり、広告コンテンツの分野や特徴を示す文字列に該当する。
図4に示した例のように、1個の広告コンテンツには複数のキーワードが記憶される場合もある。
【0030】
すなわち、
図4では、広告主ID「A10」によって識別される広告主が、「2012年11月30日 11時00分」に広告コンテンツ「C11」を入稿した例を示している。また、
図4では、広告コンテンツ「C11」から抽出されるキーワードが「クリスマス」及び「プレゼント」である例を示している。
【0031】
なお、
図4では図示することを省略したが、広告コンテンツ記憶部121は、「入札価格」や「CTR(Click Through Rate)」などを記憶してもよい。「入札価格」は、広告主が広告コンテンツを入稿する際に指定する広告料金を示し、例えば、広告コンテンツがユーザに1回クリックされた際に広告主から広告配信者(例えば、広告配信装置100の管理者)に支払われる単価に該当する。「CTR」は、例えば、広告コンテンツが端末装置20に配信された場合における広告効果を示す。
【0032】
(傾向記憶部122について)
傾向記憶部122は、広告主から入稿される広告コンテンツの傾向を示す指標値を記憶する。ここで、
図5に、実施形態に係る傾向記憶部122の一例を示す。
図5に示した例では、傾向記憶部122は、「キーワード」、「重み」といった項目を有する。
【0033】
「キーワード」は、広告コンテンツから抽出される文字列等であり、
図4に示したキーワードに対応する。「重み」は、所定の期間内に広告主から入稿された広告コンテンツの傾向を示す。
図5に示した例では、「重み」の値が大きいキーワードほど、所定の期間内において広告主から多く入稿されている広告コンテンツの種別(ジャンル)であることを示す。
【0034】
すなわち、
図5では、所定の期間内において、キーワード「クリスマス」に対応する広告コンテンツが最も多く入稿され、キーワード「正月」に対応する広告コンテンツが2番目に多く入稿された例を示している。
【0035】
(制御部130について)
制御部130は、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、広告配信装置100内部の記憶装置に記憶されている各種プログラム(広告抽出プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0036】
かかる制御部130は、
図3に示すように、入稿受付部131と、受信部132と、広告抽出部133と、配信部136とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、
図3に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部130が有する各処理部の接続関係は、
図3に示した接続関係に限られず、他の接続関係であってもよい。
【0037】
(入稿受付部131について)
入稿受付部131は、広告主装置10から広告コンテンツの入稿を受け付け、受け付けた広告コンテンツを広告コンテンツ記憶部121に格納する。具体的には、入稿受付部131は、広告主装置10から広告コンテンツの入稿を受け付けた場合に、入稿された広告コンテンツから、広告コンテンツの特徴を示すキーワードを抽出する。そして、入稿受付部131は、入稿された広告コンテンツとともに、入稿日時及びキーワードを広告コンテンツ記憶部121に格納する。
【0038】
なお、入稿受付部131が広告コンテンツからキーワードを抽出する処理はいくつか考えられる。例えば、入稿受付部131は、広告コンテンツがHTML(HyperText Markup Language)ファイルである場合には、HTMLファイルに記述されているテキストを形態素解析し、高頻度で登場する形態素をキーワードとして抽出したり、HTMLファイルのタイトルとして指定されている文字列をキーワードとして抽出したり、HTMLファイルのメタデータ(例えば、metaタグに記述される文字列)をキーワードとして抽出したりする。また、例えば、入稿受付部131は、広告コンテンツが画像データである場合には、画像データのメタデータをキーワードとして抽出したりする。
【0039】
また、例えば、入稿受付部131は、広告コンテンツからキーワードを抽出するのではなく、広告主(広告主装置10)から広告コンテンツとともにキーワードの入稿を受け付けてもよい。この場合、入稿受付部131は、広告主から入稿されたキーワードを広告コンテンツ記憶部121に格納する。
【0040】
(受信部132について)
受信部132は、端末装置20や情報提供装置30から広告コンテンツの取得要求を受信する。例えば、受信部132は、HTTP(Hypertext Transfer Protocol)リクエスト等により、広告コンテンツの取得要求を受信する。
【0041】
なお、受信部132に広告コンテンツの取得要求を送信する装置は、情報提供装置30によって配信されるウェブページによって異なる。例えば、広告配信装置100にアクセスするためのURLが埋め込まれたウェブページが端末装置20に配信される場合、受信部132は、端末装置20から広告コンテンツの取得要求を受信する。また、広告コンテンツが既に埋め込まれたウェブページが端末装置20に配信される場合、受信部132は、情報提供装置30から広告コンテンツの取得要求を受信する。
【0042】
(広告抽出部133について)
広告抽出部133は、受信部132によって広告コンテンツの取得要求が受信された場合に、広告コンテンツを広告コンテンツ記憶部121から抽出する。かかる広告抽出部133は、
図3に示すように、解析部134と、抽出部135とを有する。
【0043】
(解析部134について)
解析部134は、広告主から入稿された各広告コンテンツに含まれるキーワードに基づいて、広告主から入稿される広告コンテンツの種別に関する傾向を解析する。具体的には、実施形態に係る解析部134は、広告コンテンツ記憶部121から、入稿日時が所定の日時以降である広告コンテンツのキーワードを取得し、各キーワードの数を計数する。そして、解析部134は、計数結果が多いキーワードほど高い重みを算出し、算出した重みをキーワードと対応付けて傾向記憶部122に格納する。
【0044】
例えば、解析部134は、広告コンテンツ記憶部121から抽出した全てのキーワード数に占める各キーワード数の割合を算出し、算出した割合に所定値を乗算することで各キーワードの重みを算出する。例えば、解析部134が、全てのキーワード数に占めるキーワードK1の数の割合として「10%」を算出したものとする。この場合、解析部134は、例えば、算出した割合「10%」に所定値「0.2」などを乗算することで、キーワードK1の重み「2.0」を算出する。
【0045】
また、例えば、解析部134は、複数の重みに対応する複数の閾値を保持しておき、上記例のように算出した割合が超える閾値に対応する重みを各キーワードの重みとする。例えば、解析部134が、重み「2.0」の閾値「10%」、重み「1.9」の閾値「9%」、重み「1.8」の閾値「8%」などを保持し、全てのキーワード数に占めるキーワードK2の数の割合として「12%」を算出したものとする。この場合、解析部134は、算出した割合「12%」が閾値「10%」を超えるので、キーワードK2の重みを「2.0」とする。また、この例において、全てのキーワード数に占めるキーワードK3の数の割合として「9.5%」を算出したものとする。この場合、解析部134は、算出した割合「9.5%」が閾値「9%」を超えるものの閾値「10%」以下であるので、キーワードK3の重みを「1.9」とする。
【0046】
図4の例を用いて解析部134による処理の一例を説明する。ここでは、現在日時が「2012年12月23日」であり、解析部134が1ヶ月以内に入稿された広告コンテンツについて処理するものとする。この場合、解析部134は、広告コンテンツ記憶部121から、入稿日時が「2012年11月23日」以降である広告コンテンツに対応するキーワードを取得する。すなわち、解析部134は、入稿日時が「2012年11月23日」よりも過去である広告コンテンツ「C41」及び「C42」については抽出しない。そして、解析部134は、取得したキーワードの数を計数する。ここの例では、解析部134は、例えば、キーワード「クリスマス」を5個計数し、キーワード「正月」を2個計数し、キーワード「玩具」を1個計数し、キーワード「プレゼント」を1個計数する。そして、解析部134は、上記例のように、計数結果に基づいて、キーワード「クリスマス」、「正月」、「玩具」などの重みを算出する。
【0047】
このようにして、解析部134は、上述した解析処理を行うことで傾向記憶部122を更新する。解析部134によって求められたキーワード毎の重みは、所定の期間内において、どのような種別(ジャンル)の広告コンテンツが広告主から多く入稿されているかを示す指標値となる。すなわち、各キーワードの重みは、広告主が望む今後の流行を示す指標値である言える。なお、解析部134は、定期的(例えば、1時間毎、1日毎、1週間毎)に解析処理を行ってもよいし、受信部132によって広告コンテンツの取得要求が受信されるたびに解析処理を行ってもよい。
【0048】
(抽出部135について)
抽出部135は、解析部134によって解析された広告コンテンツの傾向に基づいて、広告コンテンツ記憶部121に記憶されている広告コンテンツから、配信候補の広告コンテンツを抽出する。具体的には、抽出部135は、傾向記憶部122に記憶されている重みが大きいキーワードに対応する広告コンテンツを優先して抽出する。
【0049】
ここで、抽出部135による抽出処理について説明するが、最初に一般的な広告コンテンツの抽出処理の一例について説明する。抽出部135は、一例として、以下の式(1)により、配信候補の各広告コンテンツのスコアを算出する。
【0050】
スコア = α
1・k
1+α
2・k
2+・・・+α
m・k
m
+β
1・j
1+w
2・j
2+・・・+w
n・j
n ・・・ (1)
【0051】
上記式(1)のうち、k
1〜k
mは、広告コンテンツに含まれるキーワードを示す。すなわち、上記(1)の場合、広告コンテンツにm個のキーワードが含まれていることを示す。また、α
1〜α
nは、k
1〜k
mに対応する重みを示す。また、j
1〜j
nは、広告コンテンツを入稿した広告主属性(例えば、食品系、金融系、旅行系などカテゴリ)を示す。また、β
1〜β
nは、j
1〜j
nに対応する重みを示す。
【0052】
例えば、抽出部135は、コンテンツマッチにより広告コンテンツを抽出する場合には、上記(1)のうち、ユーザが閲覧するウェブページに含まれるキーワードの重み(α
1〜α
nのいずれか)や、ユーザが閲覧するウェブページに含まれるキーワードと合致する広告主属性の重み(β
1〜β
nのいずれか)を大きい値に調整する。また、例えば、抽出部135は、ターゲティング配信により広告コンテンツを抽出する場合には、上記(1)のうち、ユーザ属性と合致するキーワードや広告主属性の重み(α
1〜α
n、β
1〜β
nのいずれか)を大きい値に調整する。そして、抽出部135は、上記(1)により算出したスコアが大きい広告コンテンツを優先して抽出する。
【0053】
ここで、実施形態に係る抽出部135は、上記式(1)の重みα
1〜α
nに対して、傾向記憶部122に記憶されている重みを乗算又は加算する。例えば、傾向記憶部122が
図5に示した状態であり、上記式(1)におけるキーワードk
1が「クリスマス」であるものとする。この場合、抽出部135は、上記式(1)における重み「α
1」に、傾向記憶部122に記憶されているキーワード「クリスマス」の重み「2.0」を乗算又は加算することで、「2.0α
1」又は「2.0+α
1」とする。
【0054】
このようにして、抽出部135は、傾向記憶部122に記憶されている重みを上記式(1)に反映した上で、スコアが大きい広告コンテンツを優先的に配信候補の広告コンテンツとして抽出する。すなわち、実施形態に係る抽出部135は、広告主が望む今後の流行と合致した広告コンテンツを優先的に抽出することができる。
【0055】
なお、抽出部135によって抽出される広告コンテンツの数は任意の数であってもよい。例えば、抽出部135は、上記例のように算出されるスコアの高い順に、端末装置20に配信する広告コンテンツの数と同一数の広告コンテンツを広告コンテンツ記憶部121から抽出してもよいし、端末装置20への配信数よりも多い広告コンテンツを抽出してもよい。
【0056】
(配信部136について)
配信部136は、受信部132によって受信された取得要求の送信元である端末装置20に対して、抽出部135によって抽出された広告コンテンツを配信する。なお、配信部136は、端末装置20への配信数よりも多い広告コンテンツが抽出部135により抽出された場合には、抽出された広告コンテンツのうち、例えば、入札価格や、CTRや、入札価格及びCTRの双方が高い順に広告コンテンツを選択し、選択した広告コンテンツを端末装置20に配信する。
【0057】
〔4.広告抽出処理手順〕
次に、
図6を用いて、実施形態に係る広告配信装置100による処理の手順について説明する。
図6は、実施形態に係る広告配信装置100による処理手順を示すフローチャートである。なお、
図6では、解析部134が広告コンテンツの配信前に解析処理を行う例について説明する。
【0058】
図6に示すように、広告配信装置100の受信部132は、端末装置20や情報提供装置30から広告コンテンツの取得要求を受信したか否かを判定する(ステップS101)。そして、受信部132は、広告コンテンツの取得要求を受信していない場合には(ステップS101;No)、取得要求を受信するまで待機する。
【0059】
一方、受信部132によって広告コンテンツの取得要求が受信された場合(ステップS101;Yes)、解析部134は、所定の期間内に入稿された広告コンテンツに対応するキーワード毎の数を計数する(ステップS102)。具体的には、解析部134は、広告コンテンツ記憶部121に記憶されている広告コンテンツのうち、入稿日時が所定日時以降である広告コンテンツを特定し、特定した広告コンテンツに対応するキーワード毎に、かかるキーワードの数を計数する。そして、解析部134は、計数結果が多いキーワードほど大きい重みを付与する(ステップS103)。
【0060】
続いて、抽出部135は、広告コンテンツ記憶部121から、重みが大きいキーワードを含む広告コンテンツを優先的に抽出する(ステップS104)。例えば、抽出部135は、解析部134によって付与された重みに基づいて、上記式(1)における重み(α
1〜α
n、β
1〜β
n)を調整する。そして、配信部136は、ステップS101において取得要求を送信した端末装置20又は情報提供装置30に対して、抽出部135によって抽出された広告コンテンツを配信する(ステップS105)。
【0061】
なお、
図6の例では、解析部134が広告コンテンツの配信前に解析処理を行うこととしたが、抽出部135は、定期的に解析処理を行ってもよい。この場合、解析部134は、
図6のステップS102及びS103における処理を定期的に行う。そして、抽出部135及び配信部136は、受信部132によって広告コンテンツの取得要求が受信されるたびに、ステップS104及びS105における処理を行う。
【0062】
〔5.変形例〕
上述した実施形態に係る広告配信装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、上記の広告配信装置100の他の実施形態について説明する。
【0063】
〔5−1.広告主の種別毎における重み〕
上記実施形態では、解析部134が、所定の期間内に入稿された全ての広告コンテンツに基づいて解析処理を行う例を示した。このとき、解析部134は、広告主のカテゴリ(種別)毎に、解析処理を行ってもよい。この点について
図7を用いて説明する。
図7は、実施形態に係る広告抽出処理の一例を示す説明図である。なお、
図7の例では、広告主のカテゴリ毎に解析処理を行う例について説明する。
【0064】
図7に示した例において、解析部134は、広告主のカテゴリ毎に、入稿日時が所定の日時以降である広告コンテンツを広告コンテンツ記憶部121から取得する。
図7では、広告主A11及びA12のカテゴリが「食品系」であり、広告主A21及びA22のカテゴリが「金融系」であり、広告主A31及びA32のカテゴリが「旅行系」であるものとする。この場合、解析部134は、広告主A11及びA12によって所定の期間内に入稿された広告コンテンツを取得し、取得した広告コンテンツに対応するキーワード毎の数を計数することで各キーワードの重みを算出する。
図7の例では、解析部134は、広告主A11及びA12によって入稿された広告コンテンツに対応するキーワードのうち、キーワード「塩チョコ」の数が最も多く、かかるキーワード「塩チョコ」に最も大きい重みを付与する。
【0065】
同様にして、解析部134は、広告主A21及びA22によって所定の期間内に入稿された広告コンテンツに対応する各キーワードの重みを算出し、広告主A31及びA32によって所定の期間内に入稿された広告コンテンツに対応する各キーワードの重みを算出する。
【0066】
このように、解析部134は、広告主のカテゴリ毎に各キーワードの重みを算出することで、広告分野毎に、広告主が望む今後の流行を高精度に特定することができる。例えば、広告配信装置100は、所定の広告分野に関する広告コンテンツを配信するような場合に、
図7の例のように算出した重みを用いることで、かかる所定の広告分野において広告主により望まれている今後の流行を特定することができるので、より広告主の意向に沿った広告配信を行うことが可能になる。
【0067】
なお、
図7に示した例の場合、広告配信装置100は、各広告主のカテゴリを所定の記憶部の予め保持しているものとする。または、広告配信装置100は、広告主から入稿された広告コンテンツに含まれるキーワードに基づいて、広告主のカテゴリを判定し、判定結果を所定の記憶部に保持しておく。
【0068】
〔5−2.キーワード数の計数期間〕
また、
図7に示した例において、解析部134は、広告主のカテゴリ毎に、キーワードを取得する期間を変動させてもよい。例えば、解析部134は、広告主のカテゴリが「食品系」である場合には、直近2週間に入稿された広告コンテンツのキーワードについて重みを付与し、広告主のカテゴリが「金融系」である場合には、直近2ヶ月に入稿された広告コンテンツのキーワードについて重みを付与する。このように、解析部134は、広告主のカテゴリ毎に処理対象期間を変動させることで、広告主が望む今後の流行を高精度に特定することができる。具体的に説明すると、広告主のカテゴリによって、広告コンテンツを入稿するタイミングが異なる場合がある。例えば、「食品系」の広告主は、商品発売の2週間前から広告コンテンツを入稿し始めることが多く、「金融系」の広告主は、サービス開始の2ヶ月前から広告コンテンツを入稿し始めることが多い、といったケースがある。すなわち、広告配信装置100は、広告主のカテゴリ毎に処理対象期間を変動させることで、広告分野毎に、広告主により望まれている今後の流行を高精度に特定することが可能となる。
【0069】
〔5−3.入稿数の変動率に基づく重み〕
また、上記実施形態では、解析部134が、キーワード数に基づいて、各キーワードの重みを算出する例を示した。しかし、解析部134は、キーワード数の変動率に基づいて、各キーワードの重みを算出してもよい。この点について
図8を用いて説明する。
図8は、入稿された広告コンテンツに対応するキーワード数の時間変動例を示す図である。
図8に示した横軸は、日時を示す。また、
図8に示した縦軸は、対応する日時において入稿されたキーワード数(すなわち、広告主から入稿された広告コンテンツに含まれるキーワードの数)を示す。
【0070】
図8に示すように、キーワードK11における日毎のキーワード数は、期間T11において急激に増加し、期間T12において横ばいとなり、期間T13において減少傾向にある。また、キーワードK12における日毎のキーワード数は、期間T11において微増傾向にあり、期間T12において急激に増加し、期間T13において急激に減少している。
【0071】
図8の例において、解析部134は、現在日時がt11である場合に、キーワードK12よりもキーワードK11の方が、キーワード数の増加率が高いので、キーワードK12よりもキーワードK11に対して高い重みを付与する。これは、キーワード数の増加率が高いキーワードほど、今後の流行を示すキーワードである可能性が高いからである。
【0072】
同様に、解析部134は、現在日時がt12である場合には、キーワードK11よりもキーワードK12の方が、キーワード数の増加率が高いので、キーワードK11よりもキーワードK12に対して高い重みを付与する。
【0073】
また、例えば、解析部134は、現在日時がt13である場合に、キーワードK12よりもキーワードK11の方が、キーワード数の減少率が低いので、キーワードK12よりもキーワードK11に対して高い重みを付与する。これは、キーワード数の減少率が高いキーワードほど、過ぎ去った流行を示すキーワードである可能性が高いからである。なお、解析部134は、キーワード数が減少傾向にあるキーワードには低い重みを付与してもよい。例えば、解析部134は、現在日時がt13である場合には、キーワードK11及びK12の双方に対して、マイナスの重みを付与してもよい。
【0074】
このように、解析部134は、キーワード数の変動率に基づいて、各キーワードの重みを算出することで、広告主が望む今後の流行を高精度に特定することができ、より広告主の意向に沿った広告配信を行うことが可能になる。
【0075】
なお、解析部134は、
図1〜
図6を用いて説明したように、「キーワード数」に基づいて重みを算出した上で、算出した重みを「キーワード数の変動率」に基づいて調整してもよい。例えば、解析部134は、「キーワード数」に基づいて重みを算出し、「キーワード数の増加率」が高いほど、算出済みの重みを大きい値に調整し、「キーワード数の減少率」が高いほど、算出した重みを小さい値に調整する。
【0076】
また、解析部134は、
図7に示した例のように、広告主のカテゴリ毎に各キーワードの重みを算出する場合において、「キーワード数の変動率」に基づいて重みを算出してもよい。
【0077】
〔5−4.広告主の数に基づく重み〕
また、上記実施形態では、解析部134が、キーワード数に基づいて、各キーワードの重みを算出する例を示した。しかし、解析部134は、広告コンテンツを入稿した広告主の数に基づいて、各キーワードの重みを算出してもよい。すなわち、解析部134は、同一の広告主から入稿された複数の広告コンテンツに同一のキーワードが含まれる場合には、1個のキーワードとして計数する。
【0078】
例えば、
図4の例の場合、広告主ID「A10」の広告主が、キーワード「クリスマス」を含む広告コンテンツ「C11」、「C12」及び「C15」を入稿しており、広告主ID「A20」の広告主が、キーワード「クリスマス」を含む広告コンテンツ「C21」を入稿しており、広告主ID「A30」の広告主が、キーワード「クリスマス」を含む広告コンテンツ「C32」を入稿している。この場合、解析部134は、広告コンテンツ「C11」、「C12」及び「C15」に含まれるキーワード「クリスマス」については1個として計数する。すなわち、解析部134は、キーワード「クリスマス」については合計3個を計数する。同様に、解析部134は、キーワード「正月」については合計1個を計数する。そして、解析部134は、計数結果に基づいて各キーワードの重みを算出する。
【0079】
このように、広告配信装置100は、広告コンテンツを入稿した広告主の数に基づいて、各キーワードの重みを算出することで、大量の広告コンテンツを入稿する特定の広告主に偏った広告コンテンツが配信されることを防止できる。
【0080】
〔5−5.キーワードの出現頻度等に基づく重み〕
また、上記実施形態では、入稿受付部131が、広告コンテンツからキーワードを抽出する例を示した。ここで、入稿受付部131は、1個の広告コンテンツに同一のキーワードが複数含まれる場合には、複数のキーワードを1個のキーワードとして抽出する。ただし、入稿受付部131によるキーワード抽出処理はこの例に限られない。例えば、入稿受付部131は、広告コンテンツからキーワードを抽出した場合に、かかるキーワードが広告コンテンツに出現する出現数を計数し、計数した出現数を広告コンテンツ記憶部121に格納してもよい。この場合、解析部134は、キーワード毎に、広告コンテンツ記憶部121に記憶されている出現数の総和を計数し、出現数の総和が多いキーワードほど高い重みを算出する。これにより、解析部134は、複数の広告コンテンツに多く含まれるキーワードだけでなく、1個の広告コンテンツに多く含まれるキーワードについても高い重みを付与することができる。
【0081】
また、上記例に限られず、入稿受付部131は、例えば、広告コンテンツからキーワードを抽出する際に、tf−idf(term frequency inverse document frequency)等の手法を用いて、キーワード毎の重要度(出現頻度、希少度)を求め、求めた重要度を広告コンテンツ記憶部121に格納してもよい。この場合、解析部134は、キーワード毎に、広告コンテンツ記憶部121に記憶されているキーワードの数だけでなく、重要度の総和を計数する。そして、解析部134は、計数した数が多いキーワードほど高い重みを算出し、また、重要度の総和が高いキーワードほど高い重みを算出する。これにより、解析部134は、複数の広告コンテンツに多く含まれるキーワードだけでなく、重要度(出現頻度や希少度)の高いキーワードについても高い重みを付与することができる。
【0082】
〔5−6.関連キーワードの調整〕
また、上記実施形態において、解析部134は、計数結果が大きいキーワードに高い重みを付与するとともに、かかるキーワードと関連する関連キーワードについても高い重みを付与してもよい。例えば、
図5に示した例において、解析部134は、キーワード「クリスマス」に重み「2.0」を付与しているが、キーワード「クリスマス」とキーワード「プレゼント」とは一般的に関連度が高い。このため、解析部134は、仮にキーワード「プレゼント」の計数結果が小さい場合であっても、キーワード「プレゼント」の重みが高い値となるよう調整する。例えば、解析部134は、
図5の例において、キーワード「プレゼント」の重みを「1.1」等に調整する。
【0083】
なお、上記の通り、同一の広告コンテンツには複数のキーワードが含まれる。そこで、解析部134は、多くの同一広告コンテンツに含まれるキーワードの組合せについては互いに関連していると判定してもよい。例えば、解析部134は、キーワードの組合せ毎に、キーワードの組合せが同一広告コンテンツに含まれる度合いを示す共起度を求め、求めた共起度が所定の閾値以上である場合に、かかるキーワードの組合せが互いに関連していると判定する。
【0084】
〔5−7.一般流通情報〕
また、上記実施形態において、抽出部135は、インターネット上で他のサーバ装置から取得可能なウェブサイト(例えば、ウェブログ)等からキーワードを抽出し、抽出したキーワードについても考慮して、配信候補の広告コンテンツを抽出してもよい。例えば、抽出部135は、「キーワード数」や「キーワード数の変動率」に基づいて解析部134が算出した重みについて、ウェブサイト等から抽出したキーワードの数に応じて調整してもよい。例えば、抽出部135は、ウェブサイト等から抽出した数が多いキーワードほど、解析部134によって算出されたキーワードを大きい値に調整する。このとき、抽出部135は、キーワードのカテゴリ毎に、ウェブサイトから抽出したキーワードを考慮する割合を変動させてもよい。
【0085】
〔5−8.その他〕
また、上記実施形態において、抽出部135は、種々の手法による広告コンテンツ抽出処理を段階的に行ってもよい。例えば、抽出部135は、最初に、広告コンテンツ記憶部121から、ユーザが閲覧するウェブページに含まれるキーワードと合致する所定数(例えば、1000個や2000個)の広告コンテンツを抽出した後に、抽出した所定数の広告コンテンツの中から、傾向記憶部122に記憶されている重みを考慮した抽出処理を行ってもよい。また、この例に限られず、抽出部135は、最初に、ユーザ属性と合致する所定数の広告コンテンツや、ユーザが入力した検索キーワードと合致する所定数の広告コンテンツを抽出してもよい。また、例えば、抽出部135は、最初に、傾向記憶部122に記憶されている重みを考慮した抽出処理により所定数(例えば、1000個や2000個)の広告コンテンツを抽出し、抽出した所定数の広告コンテンツの中から、ユーザが閲覧するウェブページに含まれるキーワードと合致する広告コンテンツや、ユーザ属性と合致する広告コンテンツや、ユーザが入力した検索キーワードと合致する広告コンテンツを抽出してもよい。
【0086】
また、上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0087】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0088】
例えば、
図3に示した記憶部120は、広告配信装置100が保持せずに、ストレージサーバ等に保持されてもよい。この場合、広告配信装置100は、ストレージサーバにアクセスすることで、広告コンテンツを取得する。
【0089】
また、例えば、上述してきた広告配信装置100は、ウェブページを配信する情報提供装置30と一体となって構成されてもよい。また、広告配信装置100は、広告コンテンツの提供処理は行わず、広告抽出部133による広告抽出処理のみを行う広告抽出装置であってもよい。この場合、広告抽出装置は、少なくとも入稿受付部131や配信部136を有しない。そして、入稿受付部131や配信部136を有する広告配信装置が、広告抽出装置によって抽出された広告コンテンツを端末装置20等に配信する。
【0090】
また、上記実施形態では、ユーザに閲覧されるウェブページのキーワードに関連する広告コンテンツを配信するコンテンツマッチングを例に挙げて説明したが、上述してきた各実施形態は、他の広告配信手法を用いられる広告配信システムにも適用することができる。具体的には、上述してきた各実施形態は、ユーザが検索エンジンに指定した検索キーワードとマッチする広告コンテンツを配信する検索連動型広告や、ユーザの属性情報(サイコグラフィック属性、デモグラフィック属性など)とマッチする広告コンテンツを配信するターゲティング配信などにも適用することができる。
【0091】
〔6.効果〕
上述してきたように、実施形態に係る広告配信装置100は、解析部134と、抽出部135とを有する。解析部134は、広告主から入稿された各広告コンテンツに基づいて、各広告コンテンツに関する傾向を解析する。また、抽出部135は、解析部134によって解析された傾向に基づいて、配信候補の広告コンテンツを抽出する。
【0092】
これにより、実施形態に係る広告配信装置100は、広告主が望む今後の流行と合致した広告コンテンツを配信することができるので、広告主の意向に沿った広告配信を行うことができる。
【0093】
また、実施形態に係る広告配信装置100において、解析部134は、所定の期間だけ過去の日時以降に入稿された各広告コンテンツに基づいて、キーワードの傾向を解析する。
【0094】
これにより、実施形態に係る広告配信装置100は、最近の入稿傾向から広告主の意向を解析するので、時間経過とともに変動する広告主の意向に沿った広告配信を行うことができる。
【0095】
また、実施形態に係る広告配信装置100において、解析部134は、広告主の種別(カテゴリ)毎に、当該広告主から入稿された各広告コンテンツに対応するキーワードの傾向を解析する。
【0096】
これにより、実施形態に係る広告配信装置100は、広告分野毎に、広告主が望む今後の流行を高精度に特定することができる。
【0097】
また、実施形態に係る広告配信装置100において、解析部134は、広告主の種別(カテゴリ)毎に、キーワードを取得する期間を変動させる。
【0098】
これにより、実施形態に係る広告配信装置100は、広告主が望む今後の流行を高精度に特定することができる。
【0099】
また、実施形態に係る広告配信装置100において、解析部134は、キーワード毎に、キーワードに対応する広告コンテンツの入稿数に応じた重みを算出する。また、抽出部135は、解析部134によって算出された重みが高いキーワードに対応する広告コンテンツほど、配信候補の広告コンテンツとして優先的に抽出する。
【0100】
これにより、実施形態に係る広告配信装置100は、広告主が望む今後の流行と合致した広告コンテンツを配信することができるので、広告主の意向に沿った広告配信を行うことができる。
【0101】
また、実施形態に係る広告配信装置100において、解析部134は、キーワード毎に、キーワードに対応する広告コンテンツを入稿した広告主の数に応じた重みを算出する。
【0102】
これにより、実施形態に係る広告配信装置100は、大量の広告コンテンツを入稿する特定の広告主に偏った広告コンテンツが配信されることを防止できる。
【0103】
また、実施形態に係る広告配信装置100において、解析部134は、キーワード毎に、キーワードに対応する広告コンテンツの入稿数の変動率に応じた重みを算出する。
【0104】
これにより、実施形態に係る広告配信装置100は、広告主が望む今後の流行を高精度に特定することができる。
【0105】
また、実施形態に係る広告配信装置100において、抽出部135は、解析部134によって解析されたキーワードの傾向と、他のサーバ装置から取得可能なコンテンツ(ウェブサイトなど)に含まれるキーワードの傾向とに基づいて、配信候補の広告コンテンツを抽出する。
【0106】
これにより、実施形態に係る広告配信装置100は、広告主の意向と、一般的に得られる流行情報とに基づいて広告配信を行うことができる。
【0107】
以上、本願の実施形態のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0108】
また、上述した広告配信装置100は、複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。
【0109】
また、特許請求の範囲に記載した「手段」は、「部(section、module、unit)」や「回路」などに読み替えることができる。例えば、解析手段は、解析部や解析回路に読み替えることができる。