(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
以下に、本願に係る情報処理装置、情報処理方法および情報処理プログラムの実施形態について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法および情報処理プログラムが限定されるものではない。
【0012】
[1.情報処理装置の処理]
まず、
図1を用いて、実施形態に係る情報処理装置10が実行する処理の一例について説明する。
図1は、実施形態に係る情報処理装置10が実行する処理の概要を示す図である。
【0013】
情報処理装置10は、広告配信装置、広告主の端末装置(いずれも
図1で図示せず)および急上昇ワード検出装置30とインターネット等を介して接続されており、これらの装置との間で各種情報の送受信を行うサーバである。上述した各種情報には、広告情報40や急上昇ワード31の情報などが含まれており、情報処理装置10は、これらの情報等に基づき、例えば複数の広告情報40から所定の条件を満たす広告情報40を抽出する抽出処理を行う。
【0014】
なお、上述した情報処理装置10および急上昇ワード検出装置30は、単体の処理装置である必要はなく、クラウドシステム等の複数の処理装置が協調して動作することで実現されてもよい。また、
図1では、情報処理装置10と急上昇ワード検出装置30とを別々の装置としたが、これは例示であって限定されるものではなく、例えば情報処理装置10が急上昇ワード検出装置30を備えるようにしてもよい。
【0015】
広告情報40は、広告主の端末装置から情報処理装置10に対して入稿される広告情報である。かかる広告情報40には、例えば、キーワード41の情報と、タイトル42aおよびディスクリプション42bの情報と、ランディングページ43(Landing Page。以下「LP43」と記載する場合がある)の情報とが含まれる。なお、以下では、タイトル42aおよびディスクリプション42bをまとめてTD(Title and Description)42と記載する場合がある。
【0016】
キーワード41は、例えば、広告コンテンツを配信する際の条件を示す情報である。具体的には、例えば、広告配信装置においては、ユーザによって検索サイトに入力された検索ワードと、広告情報40のキーワード41とが照合され、それらがマッチした場合に検索結果ページに広告コンテンツが配信される。かかる広告コンテンツは、タイトル42aおよびディスクリプション42bを含み、ランディングページ43をリンク先とするコンテンツである。
【0017】
なお、上述した例は、検索連動型広告と呼ばれる広告配信手法であるが、この例に限られない。例えば、キーワード41が、ユーザによって選択されたウェブページと関連する場合に広告コンテンツを配信するコンテンツマッチングと呼ばれる広告配信手法であってもよい。さらには、例えば、キーワード41が、ユーザの属性情報(サイコグラフィック属性など)とマッチする場合に広告コンテンツを配信するターゲティング配信などの手法であってもよい。なお、上述した広告コンテンツのマッチングは、キーワード41に加え、または、キーワード41に代えてTD42やLP43の情報に基づいて行われてもよい。
【0018】
TD42のタイトル42aは、ウェブページに掲載される広告コンテンツにタイトルとして表示される文章を示す情報であり、ディスクリプション42bは、広告コンテンツの説明として表示される文章を示す情報である。
【0019】
LP43は、ウェブページに掲載された広告コンテンツのリンク先のウェブページの情報であり、例えば、LP43のデータが置かれたURL(Uniform Resource Locator)を示す情報や、LP43を構成するHTML(HyperText Markup Language)ファイル等である。なお、
図1では、理解の便宜のため、LP43を図示しないユーザの端末装置に表示されるウェブページで示した。
【0020】
以下、上述した広告情報40のキーワード41、TD42およびLP43について、
図1に示す具体例を用いて説明するが、これはあくまでも例示であって限定されるものではない。
【0021】
広告情報40は、サプリメントの販売に関する広告情報である。キーワード41には、「サプリメント」、「ビタミン」および「人気俳優A」など複数個のテキストデータが含まれている。なお、ここでは、「サプリメント」および「ビタミン」は、サプリメントの販売に対応した適切なキーワード41であるものとする。他方、「人気俳優A」は、サプリメントの販売とは対応しない不適切なキーワード41、換言すれば、サプリメントの販売とは関連性が極めて低いキーワード41であるものと仮定する。
【0022】
また、TD42のタイトル42aには「サプリメント販売」、ディスクリプション42bには「今売れているサプリメントはこちら・・・」等のテキストデータが含まれている。また、LP43には、サプリメント販売のウェブページのURL等が含まれている。
【0023】
なお、上記では、広告情報40のキーワード41やTD42としてテキストデータが含まれるようにしたが、これに限定されるものではなく、例えば、画像や動画などその他のデータであってもよい。
【0024】
急上昇ワード検出装置30は、例えば検索サイトやニュースサイトなどにアクセスして、急上昇ワード31の情報を検出し、検出された急上昇ワード31の情報を記憶する処理を行うサーバである。かかる急上昇ワード31の情報の検出については、後述する。
【0025】
ここで、急上昇ワード31とは、例えばインターネット上での注目度が急上昇しているワードを意味しており、言い換えれば、例えば多くのユーザによって検索サイトなどに入力される可能性が比較的高い検索ワードである。
【0026】
なお、
図1の具体例を挙げて説明すると、急上昇ワード31の情報としては、「人気俳優A」、「人気スポーツ選手B」、「大ヒット映画C」、「地震」および「花粉対策」等のテキストデータが含まれている。
【0027】
ところで、インターネット上のウェブページに掲載される広告コンテンツは、広告主から入稿される広告情報40が適正であるか否かの審査を事前に行った上で掲載されることが好ましい。
【0028】
しかしながら、上述した広告審査の件数は年々増加している。そのため、例えば、入稿される複数の広告情報40から、不適切なキーワード41が含まれている可能性のある広告情報40を抽出し、抽出された広告情報40を審査対象とすることができれば、審査の負担軽減を図ることができる。
【0029】
そこで、本実施形態に係る情報処理装置10では、不適切なキーワード41が含まれている可能性のある広告情報40を抽出することができるような構成とした。
【0030】
以下、詳しく説明すると、情報処理装置10は、急上昇ワード情報要求を急上昇ワード検出装置30へ送信し、急上昇ワード検出装置30は、送信された急上昇ワード情報要求を受け付ける(ステップS1)。
【0031】
続いて、急上昇ワード検出装置30は、急上昇ワード31の情報を情報処理装置10へ送信し、情報処理装置10は、送信された急上昇ワード31の情報を取得する(ステップS2)。
【0032】
また、情報処理装置10は、広告主の端末装置から広告情報40の入稿を受け付ける(ステップS3)。なお、
図1では、広告情報40を1つのみ示したが、これに限られず、複数であってもよい。また、ステップS1〜S3の処理の順番は上記に限られず、例えば、ステップS1,S2の処理とステップS3の処理とが、同じタイミング、または、ステップS3、ステップS1,S2の順番で行われてもよい。
【0033】
そして、情報処理装置10は、取得された急上昇ワード31が広告情報40のキーワード41の一部または全部として含まれる広告情報40を複数の広告情報40から抽出する(ステップS4)。
【0034】
図1に示す例では、破線Dで囲んで示すように、「人気俳優A」という急上昇ワード31が、広告情報40のキーワード41にも含まれていることから、情報処理装置10は、かかる広告情報40を抽出する。
【0035】
すなわち、「人気俳優A」は、上述したように、多くのユーザによって検索サイトなどに入力される可能性が比較的高い急上昇ワード31である。そのため、例えば広告コンテンツが掲載され易くすることを意図して、広告主が、検索サイトに入力され易いと考えた検索ワード(ここでは「人気俳優A」)を、広告情報40のキーワード41として不正に含ませた可能性がある、と推定することができる。
【0036】
そこで、情報処理装置10は、このようなキーワード41を含む広告情報40を抽出するようにした。これにより、情報処理装置10にあっては、不適切なキーワード41が含まれている可能性のある広告情報40を抽出することができる。
【0037】
そして、例えば、入稿された複数の広告情報40の審査がなされる際、複数の広告情報40のうち、抽出された広告情報40を審査対象とするようにすれば、審査の負担軽減を図ることも可能である。
【0038】
なお、上記では、「人気俳優A」はサプリメントの販売とは関連性が極めて低いキーワード41であると仮定した。しかしながら、例えば、人気俳優Aが当該サプリメントの宣伝活動を行っている場合などは、「人気俳優A」はサプリメントの販売と関連性があるキーワード41であるといえる。このような場合は、審査において、上述の広告情報40が適切であるという審査結果がなされる。
【0039】
[2.情報処理システムの構成]
次に、
図2を用いて、実施形態に係る情報処理装置10が含まれる情報処理システム1の構成について説明する。
図2は、実施形態に係る情報処理システム1の構成例を示す図である。
【0040】
図2に示すように、実施形態に係る情報処理システム1には、ユーザUの端末装置50と、複数の広告主M1,M2の端末装置60,60と、ウェブサーバ70と、急上昇ワード検出装置30と、広告配信装置80とが含まれる。なお、以下では、ユーザUの端末装置50を「ユーザ端末50」、広告主M1,M2の端末装置60,60を「広告主端末60,60」と記載する場合がある。
【0041】
これらの各種装置は、ネットワークN(例えば、インターネット等の通信ネットワーク)を介して、有線または無線により相互に通信可能に接続される。ネットワークNは、例えば、インターネットなどのWAN(Wide Area Network)である。
【0042】
なお、情報処理システム1を構成する各種装置の数は、
図2に例示したものに限られない。例えば、
図2に示した情報処理システム1には、複数台のユーザ端末50や、1台の広告主端末60や、複数台のウェブサーバ70が含まれていてもよい。
【0043】
ユーザ端末50は、例えば、デスクトップ型PC(Personal Computer)、ノート型PC、スマートフォン、タブレット端末、携帯電話機、PDA(Personal Digital Assistant)等により実現される。
【0044】
例えば、ユーザ端末50は、ウェブサーバ70にアクセスすることで、ウェブサーバ70から提供されるウェブページを取得し、取得したウェブページを表示装置(例えば、液晶ディスプレイ)に表示する。そして、ユーザ端末50は、ウェブページ内の広告枠に表示される広告コンテンツを配信させるため、広告コンテンツの配信要求を広告配信装置80に送信する。
【0045】
広告主端末60,60は、広告コンテンツの配信を依頼する広告主M1,M2によって利用される。また、広告主端末60,60は、例えば、デスクトップ型PC、ノート型PC、スマートフォン、タブレット端末、携帯電話機、PDA等により実現される。
【0046】
広告主端末60,60は、広告主M1,M2による操作に従って、情報処理装置10に広告情報40を入稿する。なお、
図2に示す例では、広告主M1,M2が、別々の人物であるように示したが、同一人物であってもよく、また同じ広告主端末60,60から複数の広告情報40を情報処理装置10に入稿するようにしてもよい。
【0047】
また、広告主M1,M2は、広告主端末60,60を用いて、情報処理装置10に広告情報40を入稿せずに、かかる入稿を代理店に依頼する場合もある。この場合、情報処理装置10に広告情報40を入稿するのは代理店となる。したがって、以下では、「広告主」といった表記は、広告主だけではなく代理店を含む概念であり、「広告主端末」といった表記は、広告主端末だけではなく代理店によって利用される代理店装置を含む概念であるものとする。
【0048】
ウェブサーバ70は、ユーザ端末50からアクセスされた場合に、各種ウェブページを提供するサーバ装置である。ウェブサーバ70は、例えば、検索サイト、ニュースサイト、投稿サイト、ブログサイト、ショッピングサイト、路線検索サイト、地図提供サイト、旅行サイト、飲食店紹介サイト、ウェブブログなどに関する各種ウェブページを提供する。
【0049】
なお、上述のように、ウェブサーバ70によって配信されるウェブページには、広告コンテンツを表示するための広告枠が含まれる。そして、広告枠を含むウェブページには、上述した配信要求が含まれる。例えば、ウェブページを形成するHTMLファイル等には、広告配信装置80のURL等が配信要求として記述される。この場合、ユーザ端末50は、HTMLファイル等に記述されているURLにアクセスすることで、広告配信装置80から広告コンテンツの配信を受ける。
【0050】
急上昇ワード検出装置30は、上述したように、急上昇ワード31の情報を検出する処理を行う。例えば、急上昇ワード検出装置30は、ウェブサーバ70から提供される検索サイトやニュースサイト、投稿サイト、ブログサイトなどに所定期間ごとにアクセスし、各サイト内のワードを含むコンテンツ情報を取得する。
【0051】
そして、急上昇ワード検出装置30は、今回取得されたコンテンツと前回取得されたコンテンツとを比較して、新たなワードが含まれるコンテンツの数を新たなワードの種類ごとに集計する。続いて、急上昇ワード検出装置30は、集計したコンテンツの数が基準値を超えたワードを急上昇ワード31として検出するようにしている。
【0052】
なお、急上昇ワード検出装置30における急上昇ワード31の検出は、上記に限られない。すなわち、上記では、ワードが含まれるコンテンツの数を集計したが、ワード自体の数を集計して、集計したワードの数(すなわち出現数)の上昇率が基準値を超えたワードを急上昇ワード31とするなどその他の手法で急上昇ワード31を検出するようにしてもよい。
【0053】
広告配信装置80は、上述のように、ウェブページが表示されたユーザ端末50から送信される広告コンテンツの配信要求に基づいて、広告コンテンツの配信を行うサーバ装置である。
【0054】
[3.情報処理装置10の構成例]
図2に示すように、情報処理装置10は、通信部11と、記憶部12と、制御部13とを備える。なお、以下においては、「データベース」を「DB」と記載するものとする。
【0055】
[3.1.通信部11の構成例]
通信部11は、ネットワークNを介して広告主端末60や急上昇ワード検出装置30などと通信するための通信インターフェイスであり、例えば、NIC(Network Interface Card)等によって実現される。
【0056】
[3.2.記憶部12の構成例]
記憶部12は、例えば、RAM、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。また、記憶部12は、急上昇ワードDB14、予測ワードDB15、優先度合いワードDB16、および、広告情報DB17を記憶する。
【0057】
急上昇ワードDB14には、急上昇ワード検出装置30から取得した急上昇ワード31の情報が登録されている。
図3は、急上昇ワードDB14に記憶された急上昇ワードテーブルの一例を示す図である。
【0058】
図3に示すように、急上昇ワードテーブルは、「検索サイト」、「ニュースサイト」、「投稿サイト」および「ブログサイト」など、急上昇ワード31が検出されたサイトの情報を含み、かかるサイトごとに順位付けされた急上昇ワード31が登録されている。
【0059】
上述した順位付けは、例えば、所定期間の間に各サイト内での注目度の上昇率が高い順番で行われるが、これは例示であって限定されるものではない。なお、
図3に示す例では、例えば検索サイトにおいては、「人気俳優A」、「人気スポーツ選手B」、「大ヒット映画C」の順番で上昇率が高いものとする。
【0060】
予測ワードDB15は、例えば、インターネット上での注目度が急上昇すると予測されるワードと期間とを、「予測ワード」および「予測期間」として関連付けた情報が登録されている。
図4は、予測ワードDB15に記憶された予測ワードテーブルの一例を示す図である。
【0061】
なお、
図4に示す例では、予測期間「夏期」と予測ワード「夏休み、海水浴、・・・」とが関連付けられている。また、予測期間「12月」と予測ワード「クリスマス、プレゼント、・・・」とが関連付けられ、予測期間「7月〜9月」と予測ワード「イベント名、イベント開催地名、・・・」とが関連付けられて登録される。
【0062】
このように、予測ワードとは、例えば、季節的な意味合いをもつワードや、予め開催日程が決まっているイベント名など、注目度がその時期になれば上昇すると予め予測することのできるワードである。
【0063】
優先度合いワードDB16は、後述する広告情報40の抽出処理において、優先的に抽出するワードが登録されており、詳しくは、所定の基準に基づいて優先度合いが関連付けられたワード(以下、「優先ワード」ともいう)の情報が登録されている。
図5は、優先度合いワードDB16に記憶された優先度合いワードテーブルの一例を示す図である。
【0064】
ここで、所定の基準の一例は、優先ワードが比較的ネガティブな要素や意味合いを含んでいるか否かであり、ネガティブな要素を含んでいる優先ワードの優先度合いが高くなるように設定される。なお、
図5に示す例では、「地震」や「事件名」、「事故名」などの優先ワードは、ネガティブな要素や意味合いを含んでいることが多いため、高い優先度合いが関連付けられている。他方、「人気俳優A」や「人気スポーツ選手B」などの優先ワードは、ネガティブな要素を含まないことが多いため、低い優先度合いが関連付けられている。
【0065】
広告情報DB17には、広告情報40が登録されている。
図6は、広告情報DB17に記憶された広告情報テーブルの一例を示す図である。
図6に示すように、広告情報テーブルの一例は、「広告ID」、「広告主アドレス」、「キーワード」、「TD」、「LP」、「キーワード更新回数」、「キーワード同士の関連性」、「分析結果とキーワードとの関連性」、「判定フラグ」および「通知フラグ」などの情報を含み、これらの情報は互いに関連付けられている。
【0066】
「広告ID」は、広告情報40毎に割り当てられる識別情報である。「広告主アドレス」は、広告主M1,M2のアドレスを示す情報であり、後述する通知処理の際に利用される。
【0067】
「キーワード」は、上述した広告情報40のうちのキーワード41の情報である。なお、
図6に示す例では、広告ID「a001」、「a002」のキーワード41に、急上昇ワード31である「人気俳優A」および「地震」がそれぞれ含まれていることを示している。
【0068】
「TD」は、広告情報40のTD42の情報であり、「LP」は広告情報40のLP43の情報である。なお、
図6に示す例においては、「LP」として、LP43のデータが置かれたURLを示している。
【0069】
「キーワード更新回数」は、情報処理装置10が、広告情報40の入稿後に受け付けたキーワード41の更新回数を示す情報である。
図6に示す例では、広告ID「a001」、「a002」ではキーワード41の更新を「10回」受け付け、広告ID「a003」では「1回」受け付けたことを示している。
【0070】
「キーワード同士の関連性」は、キーワード41同士の関連性の有無を示す情報である。なお、
図6に示す例では、例えば広告ID「a001」にあっては、キーワード41「サプリメント」、「ビタミン」および「人気俳優A」の関連性の意味であり、ここでは「関連性なし」とされていることを示している。他方、例えば広告ID「a003」にあっては、キーワード41「サプリメント」および「ビタミン」について、「関連性あり」とされていることを示している。
【0071】
「分析結果とキーワードとの関連性」は、TD42およびLP43に基づいて行われるクラスタ分析(後述)の結果と、キーワード41との関連性の有無を示す情報である。
【0072】
「判定フラグ」は、広告情報40に対する判定処理の結果を示す情報である。例えば、情報処理装置10は、広告情報40に不適切なキーワード41が含まれている可能性があると判定した場合は、対応する広告IDの判定フラグに「0」を登録する。一方、情報処理装置10は、広告情報40に不適切なキーワード41が含まれている可能性がない、あるいは低いと判定した場合は、判定フラグに「1」を登録する。
【0073】
「通知フラグ」は、後述する判定処理の内容に応じ、かかる内容を広告配信業者や広告主に対して通知するか否かを示す情報である。なお、
図6に示す例では、情報処理装置10は、広告情報40に不適切なキーワード41が含まれている可能性があると判定した場合は、通知フラグに「1」を登録して通知を行う。また、情報処理装置10は、広告情報40に不適切なキーワード41が含まれている可能性がない、あるいは低いと判定した場合は、通知フラグに「0」を登録して通知を行わない。
【0074】
なお、上記では、「判定フラグ」および「通知フラグ」に「1」や「0」を登録する条件を示したが、これらは例示であって、かかる条件は任意に設定可能である。
【0075】
[3.3.制御部13の構成例]
制御部13は、例えば、CPUやMPU等によって、制御部13内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部13は、例えば、ASICやFPGA等の集積回路により実現される。
【0076】
図2に示すように、制御部13は、要求部20と、取得部21と、受付部22と、抽出部23と、判定部24と、分析部25と、通知部26とを備える。なお、制御部13の内部構成は、
図2に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。また、制御部13が有する各処理部の接続関係は、
図2に示した接続関係に限られず、他の接続関係であってもよい。
【0077】
要求部20は、急上昇ワード検出装置30に対し、急上昇ワード情報要求を送信する。取得部21は、上述した急上昇ワード情報要求に応じて急上昇ワード検出装置30から送信された急上昇ワード31の情報を取得する。
【0078】
このとき、取得部21は、例えば、所定期間の間にインターネット上での注目度の上昇率が所定条件を満たすワードを急上昇ワード31として取得する。かかる所定条件の例としては、例えば、上昇率の上位100番までのワードを急上昇ワード31として取得する。これにより、例えば、検索サイト等に入力され易い検索ワードを、急上昇ワード31として確実に取得することができる。なお、上記した「上位100番」という具体的な数値は、あくまでも例示であって限定されるものではなく、任意に設定可能である。
【0079】
また、取得部21は、予測ワードDB15に登録された予測期間の開始タイミングから終了タイミングの間である場合、予測ワードDB15から予測ワードを読み出し、かかる予測ワードを急上昇ワード31として取得する。
【0080】
すなわち、上述した急上昇ワード検出装置30から得られる急上昇ワード31は、各サイト内での注目度の上昇率に基づくワードであり、言い換えると、ユーザUがリアルタイムに興味を持っているワード、あるいは興味を持ち始めているワードといえる。
【0081】
これに対し、予測ワードは、上述したように、季節的な要因等で注目度が上昇すると予測されるワード(例えば「夏休み」や「クリスマス」)である。このような予想ワードを、急上昇ワード31とすることで、季節的な要因で注目度が上昇するワードをも適切に反映させた急上昇ワード31とすることができ、よって後述する広告情報40の抽出精度をより向上させることができる。そして、取得部21は、取得した急上昇ワード31の情報を急上昇ワードDB14に登録する。
【0082】
受付部22は、広告主端末60,60から入稿される複数の広告情報40を直接または他の装置を介して受け付ける。受付部22は、受け付けた広告情報40を広告情報DB17に登録する。また、受付部22は、入稿後に広告主端末60,60から送信される、広告情報40のキーワード41の更新を受け付ける。受付部22は、キーワード41の更新を受け付けると、広告情報DB17の広告情報40のキーワード41を更新するとともに、広告情報40の「キーワード更新回数」を1つ増やす。
【0083】
抽出部23は、急上昇ワードDB14から急上昇ワード31を読み出すとともに、広告情報DB17から広告情報40を読み出す。また、抽出部23は、優先度合いワードDB16から優先ワードを読み出す。抽出部23は、急上昇ワード31等に基づいて広告情報40の抽出処理を行うがこれについては、後述する。
【0084】
判定部24は、広告情報DB17から広告情報40を読み出し、広告情報40に含まれる複数のキーワード41の関連性が所定条件を満たしているか否かを判定する、具体的には、複数のキーワード41の間に関連性があるか否かを判定する。
【0085】
例えば、判定部24は、広告情報40に複数のキーワード41が含まれている場合、かかるキーワード41がいずれのカテゴリ(例えば食品、車、旅行など)に属するかを分類する。
【0086】
判定部24は、例えば、キーワード41が同じまたは類似のカテゴリに属していた場合、キーワード41同士の関連性がある、すなわち、所定条件を満たすと判定する。一方、判定部24は、キーワード41が非類似で異なるカテゴリに属していた場合、キーワード41同士の関連性はないと判定する、すなわち、所定条件を満たさないと判定する。
【0087】
そして、判定部24は、上述したキーワード41同士の関連性の有無を示す情報を、広告情報DB17の広告情報40の「キーワード同士の関連性」に登録する。
【0088】
分析部25は、広告情報DB17から広告情報40を読み出し、広告情報40に含まれるTD42およびLP43のうち少なくとも一つに基づいて、広告情報40のクラスタ分析を行う。そして、分析部25は、分析結果とキーワード41との関連性が所定条件を満たしているか否かを判定する、具体的には、分析結果とキーワード41との間に関連性があるか否かを判定する。
【0089】
詳しくは、TD42やLP43のテキストデータは、数量が比較的多いことから、分析部25は、まずクラスタ分析によって、TD42やLP43の複数のテキストデータの中から、互いに似たものを集めて分類する。
【0090】
そして、分析部25は、例えば互いに似ていると最も多く分類されたTD42等の類似のテキストデータを分析の結果とし、かかる分析結果とキーワード41との関連性の有無を判定する。例えば、分析部25は、上述した類似のテキストデータおよびキーワード41がいずれのカテゴリ(例えば食品、車、旅行など)に属するかを分類する。
【0091】
分析部25は、例えば、分析結果である類似のテキストデータおよびキーワード41が同じまたは類似のカテゴリに属していた場合、これらには関連性があると判定する、すなわち、所定条件を満たすと判定する。一方、判定部24は、類似のテキストデータおよびキーワード41が非類似で異なるカテゴリに属していた場合、これらには関連性はないと判定する、すなわち、所定条件を満たさないと判定する。
【0092】
そして、分析部25は、上述した類似のテキストデータおよびキーワード41の関連性の有無を示す情報を、広告情報DB17の広告情報40の「分析結果とキーワードとの関連性」に登録する。
【0093】
通知部26は、広告配信業者や広告主に対して通知を行う。具体的には、通知部26は、例えば、入稿された広告情報40において不適切なキーワード41が含まれている可能性があるとして抽出されたことを、広告配信業者や広告主に対して通知する。
【0094】
[4.情報処理装置10の処理フロー]
次に、情報処理装置10による広告情報40の抽出処理の手順の一例について説明する。
図7は、情報処理装置10による抽出処理手順を示すフローチャートである。
【0095】
なお、
図7に示す処理は、広告情報40が入稿されたときのみならず、入稿されて広告情報40の広告コンテンツがウェブページに掲示された後も、情報処理装置10の制御部13によって繰り返し実行されるようにしてもよい。
【0096】
図7に示すように、制御部13は、急上昇ワード31の取得タイミングであるか否かを判定する(ステップS101)。なお、かかる取得タイミングは、任意に設定可能である。また、制御部13は、例えば現在、上述した予測期間の開始タイミングから終了タイミングの間である場合には、急上昇ワード31の取得タイミングであると判定するようにしてもよい。
【0097】
制御部13は、急上昇ワード31の取得タイミングであると判定した場合(ステップS101,Yes)、急上昇ワード31を急上昇ワードDB14や予測ワードDB15から取得する(ステップS102)。
【0098】
制御部13は、ステップS102の処理後、または、急上昇ワード31の取得タイミングではないと判定した場合(ステップS101,No)、広告情報40が広告主端末60,60から入稿されたか否かを判定する(ステップS103)。
【0099】
制御部13は、広告情報40の入稿があると判定された場合(ステップS103,Yes)、広告情報40が不適切なキーワードが含まれている可能性のある広告情報40であるか否かの判定処理を行う(ステップS104)。
図8は、かかる判定処理の処理手順を示すフローチャートである。
【0100】
図8に示すように、制御部13は、急上昇ワード31が広告情報40のキーワード41の一部または全部として含まれているか否かを判定する(ステップS201)。制御部13は、広告情報40のキーワード41に急上昇ワード31が含まれていないと判定された場合(ステップS201,No)、判定フラグを1にセットする(ステップS202)。すなわち、制御部13は、広告情報40に不適切なキーワード41が含まれている可能性がない、あるいは低いと判定する。
【0101】
他方、制御部13は、広告情報40のキーワード41に急上昇ワード31が含まれていると判定された場合(ステップS201,Yes)、広告情報40のキーワード41について更新がなされ、かかる更新が所定条件を満たすか否かを判定する(ステップS203)。
【0102】
ここで、ステップS203の所定条件は、例えば、更新回数が任意に設定された所定回数以上である場合、または、更新されてからの期間が任意に設定された所定時間未満である場合などであるが、これに限定されるものではない。
【0103】
制御部13は、キーワード41の更新が所定条件を満たさないと判定された場合(ステップS203,No)、後述するステップS204の処理をスキップする。一方、制御部13は、キーワード41の更新が所定条件を満たすと判定された場合(ステップS203,Yes)、急上昇ワード31が広告主端末60,60によって更新がなされたキーワード41に含まれるか否かを判定する(ステップS204)。
【0104】
制御部13は、急上昇ワード31が更新されたキーワード41に含まれていない場合(ステップS204,No)、例えばステップS201で急上昇ワード31とされたキーワード41は、入稿時にも存在して審査を既に通過したものと推定できることから、判定フラグを1にセットする(ステップS202)。
【0105】
他方、制御部13は、急上昇ワード31が更新されたキーワード41に含まれていると判定した場合(ステップS204,Yes)、続いて、キーワード41同士に関連性があるか否かを判定する(ステップS205)。
【0106】
ステップS205の処理は、キーワード41には急上昇ワード31が含まれていることから、急上昇ワード31とその他のキーワード41との関連性の有無を判定する処理である。
【0107】
制御部13は、キーワード41同士に関連性があると判定された場合(ステップS205,Yes)、例えば急上昇ワード31は、他のキーワード41と同様、広告コンテンツに適したキーワード41であると推定できることから、判定フラグを1にセットする(ステップS202)。
【0108】
制御部13は、広告情報40についてキーワード41同士に関連性がないと判定された場合(ステップS205,No)、広告情報40のクラスタ分析を行う(ステップS206)。
【0109】
続いて、制御部13は、分析結果とキーワード41とに関連性があるか否かを判定する(ステップS207)。ステップS207の処理は、キーワード41には急上昇ワード31が含まれていることから、急上昇ワード31を含むキーワード41とTD42やLP43との関連性の有無を判定する処理である。
【0110】
制御部13は、分析結果とキーワード41とに関連性があると判定された場合(ステップS207,Yes)、例えば急上昇ワード31は、TD42やLP43などの広告コンテンツに適したキーワード41であると推定できることから、判定フラグを1にセットする(ステップS202)。
【0111】
他方、分析結果とキーワード41とに関連性がないと判定された場合(ステップS207,No)、広告情報40に不適切なキーワード41が含まれている可能性があると判定し、判定フラグを0にセットする(ステップS208)。
【0112】
このように、情報処理装置10にあっては、ステップS203〜S207の処理を行うことで、急上昇ワード31が含まれている広告情報40を、直ちに、不適切なキーワード41が含まれている可能性のある広告情報40とは判定しないようにした。これにより、情報処理装置10にあっては、広告情報40に不適切なキーワード41が含まれている可能性があるか否かをより正確に判定することができる。
【0113】
なお、上記したステップS203,S204と、ステップS205と、ステップS206,S207とについては、必ずしも全てを実行することを要せず、例えば、これらのうちのいずれか1つまたは2つを組み合わせてもよく、さらには処理を行わなくてもよい。
【0114】
図7の説明に戻ると、制御部13は、ステップS104の処理後、または、広告情報40の入稿がないと判定された場合(ステップS103,No)、上記した判定処理の内容に基づいて、広告情報40の抽出および通知設定処理を行う(ステップS105)。
【0115】
具体的には、制御部13は、上記した判定処理において、判定フラグが0とされ、広告情報40に不適切なキーワード41が含まれている可能性がある広告情報40を、複数の広告情報40から抽出する。
【0116】
なお、このとき、制御部13は、キーワード41に含まれた急上昇ワード31に優先度合いの高い優先ワードが含まれる場合、かかる優先ワードを優先して、広告情報40の抽出を行うことが好ましい。
【0117】
すなわち、優先度合いの高い優先ワードは、ネガティブな要素や意味合いを含んでいるため、このような優先ワードをキーワード41として含む広告情報40は、不適切なキーワード41が含まれている可能性がより一層高いと推定することができる。
【0118】
このように、制御部13は、上述した優先ワードを優先して広告情報40の抽出を行うことで、例えば、不適切なキーワードが含まれている可能性がより一層高いと推定される広告情報40を早期に審査の対象にすることが可能となる。
【0119】
また、制御部13は、上記した判定処理の内容に基づき、かかる内容を広告配信業者や広告主に対して通知するか否かの設定を行う。ここでは、例えば、広告情報40に不適切なキーワード41が含まれている可能性があると判定されて抽出された広告情報40について、その旨を広告配信業者等に通知するように設定する、すなわち、通知フラグに「1」を登録する。
【0120】
続いて、制御部13は、広告配信業者等に対して通知を行う対象があるか否かを判定する(ステップS106)。制御部13は、通知対象がないと判定された場合(ステップS106,No)、そのまま処理を終了する。一方、制御部13は、通知対象があると判定された場合(ステップS106,Yes)、通知フラグが「1」に登録された広告情報40について、広告配信業者へ通知を行う(ステップS107)。そして、広告配信業者は、通知された広告情報40に対して審査を開始するようにしてもよい。なお、制御部13は、広告主に通知を行う場合は、広告情報40に対応する「広告主アドレス」を用いてもよい。
【0121】
[5.効果]
実施形態に係る情報処理装置10は、ネットワーク上での注目度が急上昇するキーワード41の情報を取得し、キーワード41を含む複数の広告情報40を受け付ける。そして、情報処理装置10は、複数の広告情報40のうち、急上昇ワード31がキーワード41の一部または全部として含まれる広告情報40を複数の広告情報40から抽出する。これにより、不適切なキーワードが含まれている可能性のある広告情報40を抽出することができる。
【0122】
また、情報処理装置10は、所定期間の間にネットワーク上での注目度の上昇率が所定条件を満たすワードを急上昇ワード31として取得する。これにより、例えば、検索サイト等に入力され易い検索ワードを、急上昇ワード31として確実に取得することができる。
【0123】
情報処理装置10は、ネットワーク上での注目度が急上昇すると予測されるワードと期間とを予測ワードおよび予測期間として関連付けて記憶し、予測期間の開始タイミングから終了タイミングの間、予測ワードを急上昇ワード31として取得する。これにより、季節的な要因で注目度が上昇するワードをも適切に反映させた急上昇ワード31とすることができ、よって広告情報40の抽出精度をより向上させることができる。
【0124】
情報処理装置10は、キーワード41の更新を受け付け、キーワード41の更新が所定条件を満たし、かつ、急上昇ワード31が更新されるキーワード41の一部または全部として含まれる場合に、更新されるキーワード41を含む広告情報40を複数の広告情報40から抽出する。これにより、例えばキーワード41の更新頻度が高く、不適切なキーワードが含まれている可能性がより一層高いと推定される広告情報40を抽出することができる。
【0125】
また、情報処理装置10は、広告情報40に含まれる複数のキーワード41の関連性を判定し、キーワード41の関連性が所定条件を満たさないと判定され、かつ、キーワード41が複数のキーワード41の一部または全部として含まれる場合に、複数のキーワード41を含む広告情報40を複数の広告情報40から抽出する。これにより、広告情報40に不適切なキーワード41が含まれている可能性がより一層高いと推定される広告情報40を抽出することができる。
【0126】
また、情報処理装置10は、広告情報40に含まれる広告のTD42およびLP43の情報のうち少なくとも一つに基づいて、広告情報40のクラスタ分析を行い、クラスタ分析された結果とキーワード41との関連性が所定条件を満たさず、かつ、急上昇ワード31がキーワード41の一部または全部として含まれる場合に、複数のキーワード41を含む広告情報40を複数の広告情報40から抽出する。これにより、広告情報40に不適切なキーワード41が含まれている可能性がより一層高いと推定される広告情報40を抽出することができる。
【0127】
情報処理装置10は、所定の基準に基づいて優先度合いをワード(優先ワード)に関連付けて記憶し、急上昇ワード31のうち、優先度合いの高い優先ワードを優先して広告情報40の抽出を行う。これにより、例えば、不適切なキーワードが含まれている可能性がより一層高いと推定される広告情報40を早期に審査の対象にすることが可能となる。
【0128】
[6.ハードウェア構成]
なお、上述した実施形態における情報処理装置10は、例えば、
図9に示すような構成のコンピュータ100がプログラムを実行することによって実現される。
図9は、プログラムを実行するコンピュータ100のハードウェア構成の一例を示す図である。コンピュータ100は、CPU101、RAM102、ROM(Read Only Memory)103、HDD(Hard Disk Drive)104、通信インターフェイス(I/F)105、入出力インターフェイス(I/F)106、およびメディアインターフェイス(I/F)107を備える。
【0129】
CPU101は、ROM103またはHDD104に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM103は、コンピュータ100の起動時にCPU101によって実行されるブートプログラムや、コンピュータ100のハードウェアに依存するプログラム等を格納する。
【0130】
HDD104は、CPU101によって実行されるプログラムによって使用されるデータ等を格納する。通信インターフェイス105は、ネットワークNを介して他の機器からデータを受信してCPU101へ送り、CPU101が生成したデータを、ネットワークNを介して他の機器へ送信する。
【0131】
CPU101は、入出力インターフェイス106を介して、ディスプレイやプリンタ等の出力装置、および、キーボードやマウス等の入力装置を制御する。CPU101は、入出力インターフェイス106を介して、入力装置からデータを取得する。また、CPU101は、生成したデータを、入出力インターフェイス106を介して出力装置へ出力する。
【0132】
メディアインターフェイス107は、記録媒体108に格納されたプログラムまたはデータを読み取り、RAM102を介してCPU101に提供する。CPU101は、当該プログラムを、メディアインターフェイス107を介して記録媒体108からRAM102上にロードし、ロードしたプログラムを実行する。記録媒体108は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0133】
コンピュータ100が上述した実施形態に係る情報処理装置10として機能する場合、コンピュータ100のCPU101は、RAM102上にロードされたプログラムを実行することにより、例えば、制御部13の機能を実現する。また、HDD104には、記憶部12内のデータが記憶される。コンピュータ100のCPU101は、プログラムを、記録媒体108から読み取って実行するが、他の例として、他の装置から、ネットワークNを介してこれらのプログラムを取得してもよい。
【0134】
なお、上述した実施形態では、審査や抽出する対象として広告情報を例に挙げたが、これに限定されるものではない。すなわち、例えば、審査や抽出する対象としては、キーワードなどを含むものであればどのような情報であってもよい。
【0135】
[7.その他]
以上、本願の実施形態の一態様を図面に基づいて詳細に説明したが、これは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0136】
上述した情報処理装置10は、それぞれ複数のサーバコンピュータで実現してもよく、また、機能によっては外部のプラットフォーム等をAPI(Application Programming Interface)やネットワークコンピューティングなどで呼び出して実現するなど、構成は柔軟に変更できる。また、情報処理装置10および急上昇ワード検出装置30を一つのサーバコンピュータで実現してもよい。
【0137】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、抽出部は、抽出手段や抽出回路に読み替えることができる。