IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7654599情報処理装置、情報処理方法、及び情報処理プログラム
<>
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図1
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図2
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図3
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図4
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図5
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図6
  • 特許-情報処理装置、情報処理方法、及び情報処理プログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-03-24
(45)【発行日】2025-04-01
(54)【発明の名称】情報処理装置、情報処理方法、及び情報処理プログラム
(51)【国際特許分類】
   G06Q 30/02 20230101AFI20250325BHJP
   G06Q 30/0241 20230101ALI20250325BHJP
【FI】
G06Q30/02
G06Q30/0241
【請求項の数】 20
(21)【出願番号】P 2022098772
(22)【出願日】2022-06-20
(65)【公開番号】P2024000166
(43)【公開日】2024-01-05
【審査請求日】2024-07-19
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】武井 聡水
(72)【発明者】
【氏名】田中 祐介
(72)【発明者】
【氏名】岩崎 祥太
【審査官】上田 智志
(56)【参考文献】
【文献】特開2016-62275(JP,A)
【文献】原 隆,行動ターゲティング広告 提携サイトの数、多様さと広告のカテゴリー分けに注目,日経ネットマーケティング 第4号,日本,日経BP社,2008年01月25日,pp. 38-39
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
検索に用いられた検索クエリ群から、所定の条件を満たす検索クエリを第1キーワードとして抽出する抽出部と、
前記抽出部により抽出された前記第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、前記第1キーワードの入稿先として提案する区分である提案区分を決定する決定部と、
を備えることを特徴とする情報処理装置。
【請求項2】
前記決定部は、
前記第1キーワードがベクトルに変換された第1ベクトル情報と、前記区分の各々に対応する前記第2キーワードのベクトル変換に基づく前記区分の各々の第2ベクトル情報とに基づいて、前記第1キーワードの前記提案区分を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記決定部は、
文字列を入力とし、前記文字列に対応するベクトルを出力するベクトル変換モデルを用いて生成された前記第1キーワードの前記第1ベクトル情報と、前記ベクトル変換モデルを用いて生成された前記区分の各々の前記第2ベクトル情報との比較に基づいて、前記第1キーワードの前記提案区分を決定する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項4】
前記決定部は、
前記第1キーワードの前記第1ベクトル情報と、前記区分の各々の前記第2ベクトル情報との比較に基づいて、前記第1キーワードの前記提案区分を決定する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項5】
前記決定部は、
前記第1キーワードの前記第1ベクトル情報と、前記区分の各々の前記第2ベクトル情報との類似度に基づいて、前記第1キーワードの前記提案区分を決定する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項6】
前記決定部は、
前記第1キーワードの前記第1ベクトル情報と、前記区分の各々の前記第2ベクトル情報とのコサイン類似度である前記類似度に基づいて、前記第1キーワードの前記提案区分を決定する
ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記決定部は、
前記区分のうち、前記第1キーワードの前記第1ベクトル情報との前記第2ベクトル情報の類似度が最大である類似区分を前記提案区分に決定する
ことを特徴とする請求項4に記載の情報処理装置。
【請求項8】
前記決定部は、
ベクトルを入力とし、前記ベクトルに対応するキーワードの検索広告に関する広告指標の予測値を出力する予測モデルを用いて、前記第1キーワードの前記広告指標の予測値を決定する
ことを特徴とする請求項2に記載の情報処理装置。
【請求項9】
前記決定部は、
コンバージョンに関する前記広告指標の予測値を出力する予測モデルを用いて、前記第1キーワードを用いた検索による前記コンバージョンに関する前記広告指標の予測値を決定する
ことを特徴とする請求項8に記載の情報処理装置。
【請求項10】
前記決定部は、
コンバージョンに至った回数に関する前記広告指標の予測値を出力する予測モデルを用いて、前記第1キーワードを用いた検索により前記コンバージョンに至った回数に関する前記広告指標の予測値を決定する
ことを特徴とする請求項9に記載の情報処理装置。
【請求項11】
前記決定部は、
コンバージョン率の予測値を出力する予測モデルを用いて、前記第1キーワードを用いた検索によるコンバージョン率の予測値を決定する
ことを特徴とする請求項10に記載の情報処理装置。
【請求項12】
前記抽出部は、
前記検索クエリ群のうち、検索を行ったユーザが所定の行動を行った検索クエリを前記第1キーワードとして抽出する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項13】
前記抽出部は、
前記検索クエリ群のうち、前記ユーザが所定のサイトにアクセスした検索クエリを前記第1キーワードとして抽出する
ことを特徴とする請求項12に記載の情報処理装置。
【請求項14】
前記決定部は、
前記第1キーワードと、キャンペーンまたは広告グループである前記区分の各々に対応する前記第2キーワードとに基づいて、前記第1キーワードの前記提案区分を決定する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項15】
前記第1キーワードを提案キーワードとして、情報提供先となる広告主である対象広告主が利用する端末装置に提供する提供部、
をさらに備えることを特徴とする請求項1に記載の情報処理装置。
【請求項16】
前記提供部は、
前記決定部により決定された前記第1キーワードの前記提案区分を、前記提案キーワードとともに前記端末装置に提供する
ことを特徴とする請求項15に記載の情報処理装置。
【請求項17】
前記検索クエリ群を取得する取得部、
をさらに備え、
前記抽出部は、
前記取得部により取得された前記検索クエリ群から、前記第1キーワードを抽出する
ことを特徴とする請求項1に記載の情報処理装置。
【請求項18】
前記取得部は、
前記区分の各々に対応する前記第2キーワードを示す情報を取得し、
前記決定部は、
前記第1キーワードと、前記取得部により取得された前記第2キーワードとに基づいて、前記第1キーワードの前記提案区分を決定する
ことを特徴とする請求項17に記載の情報処理装置。
【請求項19】
コンピュータが実行する情報処理方法であって、
検索に用いられた検索クエリ群から、所定の条件を満たす検索クエリを第1キーワードとして抽出する抽出工程と、
前記抽出工程により抽出された前記第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、前記第1キーワードの入稿先として提案する区分である提案区分を決定する決定工程と、
を含むことを特徴とする情報処理方法。
【請求項20】
検索に用いられた検索クエリ群から、所定の条件を満たす検索クエリを第1キーワードとして抽出する抽出手順と、
前記抽出手順により抽出された前記第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、前記第1キーワードの入稿先として提案する区分である提案区分を決定する決定手順と、
をコンピュータに実行させることを特徴とする情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。
【背景技術】
【0002】
従来、広告に関する種々の技術が提供されている。例えば、広告等のコンテンツの入稿に関する技術が提供されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2022-003474号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の従来技術には、改善の余地がある。例えば、上記の従来技術では、広告等のコンテンツの入稿元からの入稿を受け付けているに過ぎず、入稿元が広告の入稿先に関する区分を選択する場合、入稿元が適切な入稿先の区分を選択できるとは限らない。そのため、適切な提案を可能にすることが望まれている。
【0005】
本願は、上記に鑑みてなされたものであって、適切な提案を可能にする情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本願に係る情報処理装置は、検索に用いられた検索クエリ群から、所定の条件を満たす検索クエリを第1キーワードとして抽出する抽出部と、前記抽出部により抽出された前記第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、前記第1キーワードの入稿先として提案する区分である提案区分を決定する決定部と、を備えたことを特徴とする。
【発明の効果】
【0007】
実施形態の一態様によれば、適切な提案を可能にすることができるという効果を奏する。
【図面の簡単な説明】
【0008】
図1図1は、実施形態に係る情報処理の一例を示す図である。
図2図2は、情報処理の具体例を示す図である。
図3図3は、実施形態に係る情報処理システムの構成例を示す図である。
図4図4は、実施形態に係る情報処理装置の構成例を示す図である。
図5図5は、実施形態に係るモデル情報記憶部の一例を示す図である。
図6図6は、情報処理装置が実行する情報処理の流れの一例を示すフローチャートである。
図7図7は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。
【発明を実施するための形態】
【0009】
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、この実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下の各実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。
【0010】
(実施形態)
〔1.情報処理〕
まず、図1を用いて、情報処理装置100が実行する情報処理の一例について説明する。図1は、実施形態に係る情報処理の一例を示す図である。以下では、情報処理装置100が検索クエリ群から抽出した検索クエリ(「第1キーワード」ともいう)と、広告の入稿先に関する区分(単に「区分」ともいう)の各々に対応するキーワード(「第2キーワード」ともいう)とに基づいて、第1キーワードの入稿先として提案する区分(「提案区分」ともいう)を決定する場合を一例として説明する。
【0011】
広告の入稿先に関する区分とは、例えば広告を出稿する際の設定上の区分けである。以下で、広告の入稿先に関する区分として、キャンペーンや広告グループを一例として説明する。キャンペーンや広告グループは、検索広告を入稿(出稿)する際の設定上の区分けの概念である。例えば、広告グループは、キーワード(クエリ)と広告とを対応付けて登録する役割(構成単位)であり、キーワードをクエリとして用いて検索されるとそのキーワードに対応付けられた広告がキーワードを用いた検索を行ったユーザに配信される。例えば、キャンペーンは、広告グループを含む構成単位であり、予算やターゲティングに応じて同じ広告対象を分けて設定可能である。
【0012】
〔1-1.情報処理システムの構成〕
図1に示す処理の説明に先立って、図3を用いて情報処理システム1の構成について説明する。図3は、実施形態に係る情報処理システムの構成例を示す図である。図3に示すように、情報処理システム1は、端末装置10と、ユーザ端末20と、情報提供装置50と、情報処理装置100とが含まれる。端末装置10と、ユーザ端末20と、情報提供装置50と、情報処理装置100とは所定のネットワークNを介して、有線または無線により通信可能に接続される。なお、図3に示した情報処理システム1には、複数の端末装置10や、複数のユーザ端末20や、複数の情報提供装置50や、複数の情報処理装置100が含まれてもよい。
【0013】
情報処理装置100は、検索クエリ群から抽出した第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、第1キーワードの入稿先として提案する提案区分を決定するコンピュータである。例えば、情報処理装置100は、キーワード等の文字列を入力として、その文字列に対応するベクトル情報(単に「ベクトル」ともいう)を出力するベクトル変換モデルを用いて、ベクトル化した情報を用いて提案区分を決定する。
【0014】
情報処理装置100は、決定した提案区分を広告主へ提案する。例えば、情報処理装置100は、情報の要求元である広告主に、決定した提案区分を示す情報を提供する。情報処理装置100は、第1キーワードを提案キーワードとして、情報提供先となる広告主(「対象広告主」ともいう)が利用する端末装置10に提供する。情報処理装置100は、第1キーワードの提案区分を、提案キーワードとともに端末装置10に提供する。
【0015】
端末装置10は、広告主によって利用されるコンピュータ(広告主装置)である。なお、広告主は、法人等であってもよく、例えば、端末装置10の使用者は、広告主の宣伝担当者等であってもよい。例えば、端末装置10は、スマートフォンや、タブレット型端末や、ノート型PCや、デスクトップPCや、携帯電話機や、PDA等により実現される。なお、図1の例では、端末装置10がノート型PCである場合を一例として示す。広告主は、端末装置10を用いて、情報処理装置100との間で情報の送受信を行う。例えば、端末装置10は、情報処理装置100から提供された各種の情報を表示する。
【0016】
端末装置10は、情報処理装置100から情報提供を受信し、情報処理装置100へ情報を送信する。例えば、端末装置10は、広告主による指定を受け付けるためのコンテンツ(「指定用コンテンツ」ともいう)を情報処理装置100から受信する。例えば、端末装置10は、広告主によるキーワードの指定を受け付けるための指定用コンテンツを情報処理装置100から受信する。例えば、端末装置10は、指定用コンテンツにより広告主が指定したキーワード(指定キーワード)を示す情報を情報処理装置100へ送信する。端末装置10は、広告主が指定するキーワードを示す情報を情報処理装置100へ送信する。例えば、端末装置10は、広告主が指定するキーワードを示す情報を情報処理装置100へ送信する。
【0017】
なお、広告主は、端末装置10を用いて、広告コンテンツ(以下、単に「広告」ともいう)を情報処理装置100に入稿せずに、広告の入稿を代理店に依頼する場合もある。この場合、情報処理装置100に広告を入稿するのは代理店となる。「広告主」といった表記は、広告主だけでなく代理店を含む概念であり、「広告主装置」といった表記は、広告主装置だけでなく代理店によって利用される代理店装置を含む概念であるものとする。
【0018】
ユーザ端末20は、ユーザによって利用されるコンピュータである。ユーザ端末20は、ユーザが携帯可能なデバイス(端末装置)である。ユーザ端末20は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal Computer)や、携帯電話機や、PDA(Personal Digital Assistant)等により実現される。図1は、ユーザ端末20がスマートフォンである場合を示す。なお、以下では、ユーザ端末20をユーザと表記する場合がある。すなわち、以下では、ユーザをユーザ端末20と読み替えることもできる。例えば、ユーザ端末20は、情報処理装置100が提供する広告を表示するコンピュータである。例えば、ユーザ端末20は、表示アプリにより広告等の各種の情報を表示する。
【0019】
情報提供装置50は、サービスに関する種々の情報提供を行うための情報が格納されたコンピュータである。例えば、情報提供装置50は、ウェブサーバ等の種々の外部装置から情報を収集し、収集した情報を情報処理装置100へ提供する。例えば、情報提供装置50は、例えば、サーバ装置又はクラウドシステム等により実現される。例えば、情報提供装置50は、各種情報として、サービスに関する情報(サービス情報)、サービスを利用する利用者に関する情報(利用者情報)を提供する。
【0020】
例えば、情報提供装置50は、情報処理装置100へ学習に用いるデータ(「学習用データ」ともいう)を提供するサービスを提供してもよい。この場合、情報提供装置50は、情報処理装置100がモデルの学習に用いるデータ(学習用データ)を情報処理装置100へ提供する。例えば、情報提供装置50は、情報処理装置100が生成モデルの学習に用いるデータ(学習用データ)を情報処理装置100へ提供する。また、情報提供装置50は、情報処理装置100へ学習済みのモデルを提供するサービスを提供してもよい。例えば、情報提供装置50は、ベクトル変換に用いるモデル(例えばモデルM1)を情報処理装置100へ提供する。例えば、情報提供装置50は、広告指標の予測に用いるモデル(例えば予測モデルM2)を情報処理装置100へ提供する。
【0021】
〔1-2.情報処理システムにおける処理の全体概要〕
ここから、図1を用いて、情報処理システム1が行う情報処理の一例について説明する。なお、情報処理システム1において行なわれる情報処理について、従来の処理と同様の点についての詳細な説明は適宜省略する。
【0022】
図1では、情報処理装置100は、提案区分を決定する決定処理を実行するために用いる情報を情報提供装置50から取得する(ステップS1)。情報処理装置100は、決定処理を実行するために用いる情報を情報提供装置50から受信する。例えば、情報処理装置100は、文字列をベクトルに変換するベクトル変換モデルM1(単に「モデルM1」ともいう)を情報提供装置50から取得する。モデルM1は、文字列を入力として、その文字列に対応するベクトルを出力するベクトル変換モデルである。モデルM1は、word2vec等の単語埋め込み(Word Embedding)の手法により文字列をベクトルに変換したベクトルを出力する。例えば、モデルM1は、入力された文字列に対応する複数次元(例えば200次元等)のベクトルを出力する。なお、上記は一例に過ぎず、モデルM1は、入力された文字列の特徴に対応するベクトルを出力するモデルでれば、任意のモデルが採用可能である。また、情報処理装置100は、モデルM1を学習する場合、モデルM1の学習処理に用いるデータ(学習用データ)を情報提供装置50から取得してもよい。
【0023】
情報処理装置100は、情報提供装置50から取得した情報を記憶部120(図6参照)に格納する(ステップS2)。情報処理装置100は、情報提供装置50から受信した情報を記憶部120に記憶する。例えば、情報処理装置100は、情報提供装置50からモデルM1を情報提供装置50から取得した場合、モデルM1をモデル情報記憶部121(図4参照)に記憶する。また、情報処理装置100は、情報提供装置50から学習処理に用いる学習用データを情報提供装置50から取得した場合、取得したモデルM1の学習処理に用いる学習用データをモデルM1に対応付けてモデル情報記憶部121(図4参照)に記憶する。なお、情報処理装置100は、提案区分を決定する決定処理を実行するために用いる情報を取得済みの場合、ステップS1、S2の処理を行わなくてもよい。
【0024】
情報処理装置100は、検索に用いられた検索クエリ群CDから、第1キーワードを抽出する(ステップS3)。情報処理装置100は、検索クエリ情報記憶部122(図4参照)に記憶された検索クエリ群CDから、第1キーワードを抽出する。情報処理装置100は、検索クエリ群CDのうち、その検索クエリ(単位「クエリ」ともいう)を用いたユーザが所定のサイトにアクセスした検索クエリを第1キーワードとして抽出する。図1では、情報処理装置100は、抽出クエリリストCLに示すように、検索クエリ群CDから、キーワードKW1やキーワードKW2等を第1キーワードとして抽出する。
【0025】
なお、図1では、キーワードKW1、KW2等という抽象的な文字列で示すが、各キーワードは、「那覇 ホテル」、「京都観光」等といった具体的な内容を示す文字列であるものとする。このように、各キーワードは、複数のキーワードの組み合わせであってもよい。複数のキーワードの組み合わせである場合、各キーワードを個別にベクトル化してもよいし、複数のキーワードの組み合わせごとにベクトル化してもよい。
【0026】
そして、情報処理装置100は、各第1キーワードをベクトル化する処理を実行する。情報処理装置100は、各第1キーワードに対応するベクトル(「第1ベクトル」ともいう)を生成する処理を実行する。図1では、情報処理装置100は、第1ベクトルリストFVに示すように、各第1キーワードに対応する第1ベクトルを生成する。
【0027】
まず、情報処理装置100は、第1キーワードの各々を入力情報としてモデルM1に入力する(ステップS4-1)。図1では、情報処理装置100は、キーワードKW1、KW2等の各第1キーワードを入力情報としてモデルM1に入力する。
【0028】
入力情報が入力されたモデルM1は、ベクトルを出力する(ステップS4-2)。図1では、キーワードKW1が入力されたモデルM1は、ベクトルKV1を出力する。また、キーワードKW2が入力されたモデルM1は、ベクトルKV2を出力する。このように、情報処理装置100は、モデルM1を用いることにより、キーワードKW1、KW2等の各第1キーワードに対応する第1ベクトルであるベクトルKV1、KV2等を生成する。
【0029】
また、情報処理装置100は、各第1キーワードに対応する広告指標を予測する予測処理を実行する。図1では、情報処理装置100は、予測値リストILに示すように、各第1キーワードに対応する広告指標を予測する。
【0030】
情報処理装置100は、キーワードがベクトル化されたベクトルを入力情報として、そのベクトルに対応するキーワードが検索クエリとして用いられた場合のCVR(コンバージョン率)の予測値を出力する予測モデルM2を用いて、各第1キーワードの予測CVRを予測する。例えば、予測モデルM2は、ベクトルの入力に応じて、そのベクトルに対応するキーワードが検索クエリとして用いられた場合の予測されるCVRの値(0~100(%))を出力する。情報処理装置100は、第1キーワードのベクトルを予測モデルM2に入力することにより、その第1キーワードの予測CVRを予測する。なお、予測モデルM2は、広告主ごとに生成されてもよいが、この点については後述する。
【0031】
なお、図1では、CVR(コンバージョン率)を広告指標の一例として説明するが、広告指標は、CVRに限らず、任意の指標が採用可能である。例えば、広告指標は、CVR以外にも、コンバージョンに至った回数等、任意のコンバージョンに関する指標が採用可能である。なお、ここでいうコンバージョンは、ユーザのどのような行動であってもよい。例えば、コンバージョンは、広告の広告対象についての商品購入(サービス利用)や会員登録の利益につながるユーザの行動であってもよい。なお、購入(利用)、会員登録等は一例に過ぎず、コンバージョンは、資料請求や広告に対応するサイトの閲覧(表示)、実店舗への訪問等であってもよい。このように、ユーザのどのような行動をコンバージョンとするかは任意の設定が可能である。例えば、各広告について、ユーザのどのような行動をコンバージョンとみなすかは、情報処理装置100の管理者や広告主等によって個別に設定されてもよい。また、広告指標は、コンバージョンに関する指標以外にも、クリックされた回数(クリック数)、CTR(クリック率)等、任意のクリックに関する指標が採用可能である。なお、上記の広告指標は一例に過ぎず、広告指標は、任意の指標が採用可能である。
【0032】
まず、情報処理装置100は、第1ベクトルの各々を入力情報として予測モデルM2に入力する(ステップS5-1)。図1では、情報処理装置100は、ベクトルKV1、KV2等の各第1ベクトルを入力情報として予測モデルM2に入力する。
【0033】
入力情報が入力された予測モデルM2は、入力されたベクトルに対応するキーワードの予測CVRを出力する(ステップS5-2)。図1では、ベクトルKV1が入力された予測モデルM2は、予測CVRの値VL1を出力する。また、ベクトルKV2が入力された予測モデルM2は、予測CVRの値VL2を出力する。このように、情報処理装置100は、予測モデルM2を用いることにより、ベクトルKV1、KV2等の各々に対応するキーワードKW1、KW2等の各第1キーワードに対応する予測CVRを予測する。
【0034】
情報処理装置100は、広告情報群ADから、第2キーワードを抽出する(ステップS6)。情報処理装置100は、広告情報記憶部123(図4参照)に記憶された広告情報群ADから、第2キーワードを抽出する。情報処理装置100は、広告情報群AD中の各広告キャンペーンに対応付けられたキーワードを第2キーワードとして抽出する。図1では、情報処理装置100は、区分リストDLに示すように、区分CP1(例えば広告キャンペーンA)について、キーワードKW11やキーワードKW12等を第2キーワードとして抽出する。また、情報処理装置100は、区分CP2(例えば広告キャンペーンB)について、キーワードKW21やキーワードKW22等を第2キーワードとして抽出する。
【0035】
そして、情報処理装置100は、各区分の第2キーワードを用いて、各区分に対応するベクトル(「第2ベクトル」ともいう)を生成する処理を実行する。情報処理装置100は、各区分に対応する第2キーワードをベクトル化したベクトル(「サブベクトル」ともいう)を基に第2ベクトルを生成する処理を実行する。情報処理装置100は、各区分に対応する第2キーワードのサブベクトルの平均を算出し、算出した平均を第2ベクトルとする。図1では、情報処理装置100は、第2ベクトルリストSVに示すように、各区分に対応する第2ベクトルを生成する。
【0036】
まず、情報処理装置100は、各区分に対応する第2キーワードの各々を入力情報としてモデルM1に入力する(ステップS7-1)。図1では、情報処理装置100は、区分CP1について、キーワードKW11、KW12等の各第2キーワードを入力情報としてモデルM1に入力する。また、情報処理装置100は、区分CP2について、キーワードKW21、KW22等の各第2キーワードを入力情報としてモデルM1に入力する。
【0037】
入力情報が入力されたモデルM1は、ベクトルを出力する(ステップS7-2)。図1では、キーワードKW11が入力されたモデルM1は、ベクトルKV11を出力する。また、キーワードKW12が入力されたモデルM1は、ベクトルKV12を出力する。情報処理装置100は、ベクトルKV11、KV12等の平均であるベクトルKV10を、区分CP1の第2ベクトルとして算出する。また、キーワードKW21が入力されたモデルM1は、ベクトルKV21を出力する。また、キーワードKW22が入力されたモデルM1は、ベクトルKV22を出力する。情報処理装置100は、ベクトルKV21、KV22等の平均であるベクトルKV20を、区分CP1の第2ベクトルとして算出する。このように、情報処理装置100は、モデルM1を用いることにより、各区分に対応する第2ベクトルであるベクトルKV1、KV2等を生成する。
【0038】
情報処理装置100は、第1キーワードの第1ベクトルと、区分の各々に対応する第2ベクトルとに基づいて、第1キーワードの提案区分を決定する(ステップS8)。情報処理装置100は、各第1キーワードの第1ベクトルと、区分の各々の第2ベクトルとの比較に基づいて、各第1キーワードの提案区分を決定する。情報処理装置100は、第1キーワードの第1ベクトルと、区分の各々の第2ベクトルとのコサイン類似度に基づいて、第1キーワードの提案区分を決定する。図1では、情報処理装置100は、区分リストDLに示す各区分のうち、第1キーワードの第1ベクトルとの第2ベクトルのコサイン類似度が最大である類似区分を提案区分に決定する。
【0039】
図1では、情報処理装置100は、提案リストPKに示すように、第1キーワードであるキーワードKW1については、ベクトルKV1とのコサイン類似度が最大であるベクトルKV20に対応する区分CP2を提案区分に決定する。また、情報処理装置100は、第1キーワードであるキーワードKW2については、ベクトルKV2とのコサイン類似度が最大であるベクトルKV10に対応する区分CP1を提案区分に決定する。
【0040】
そして、情報処理装置100は、上記処理により生成した情報を、広告主へ提供する(ステップS9)。例えば、情報処理装置100は、第1キーワード(提案キーワード)とともに、その提供キーワードに対応する提案区分を示す情報を、広告主が利用する端末装置10へ送信する。情報処理装置100は、第1キーワード(提案キーワード)とともに、その提供キーワードに対応する予測CVRを示す情報を、広告主が利用する端末装置10へ送信する。例えば、情報処理装置100は、第1キーワードをポテンシャルキーワードとして、そのポテンシャルキーワードに対応する情報とともに、ポテンシャルキーワードを一覧表示するポテンシャルキーワード一覧情報を端末装置10へ送信する。ポテンシャルキーワード一覧情報には、各ポテンシャルキーワードについて、各種の実績値、予測CVR、推奨キャンペーンや推奨広告グループ等の提案区分、検索広告を経由した流入の有無等を示す情報が含まれる。端末装置10は、ポテンシャルキーワード一覧情報を表示する。
【0041】
このように、情報処理装置100は、検索クエリ群から第1キーワードを抽出し、抽出した第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。また、情報処理装置100は、第1キーワードを提案キーワードとして、対象広告主が利用する端末装置10に提供することにより、適切に決定された提案区分を広告主に提供することができ、適切な提案を行うことができる。
【0042】
〔1-2-1.処理具体例〕
上述した情報処理システム1が行う情報処理を前提として、情報処理装置100による処理の具体例について、図2を用いて説明する。図2は、情報処理の具体例を示す図である。なお、上記で説明した内容と同様の点については適宜説明を省略する。
【0043】
図2では、第1キーワードであるキーワードKW2が「那覇 ホテル」であり、そのキーワードKW2に対応する第1ベクトルが「0.6、0.3」であるベクトルKV2である。情報処理装置100は、モデルM1を用いて、「那覇 ホテル」を「0.6、0.3」に変換する。
【0044】
図2では、広告キャンペーンAである区分CP1は、「沖縄」であるキーワードKW11、「美ら海」であるキーワードKW12等が対応付けられる。情報処理装置100は、モデルM1を用いて、「沖縄」をベクトルKV11である「0.7、0.2」に変換する。また、情報処理装置100は、モデルM1を用いて、「美ら海」をベクトルKV12である「0.5、0.2」に変換する。また、情報処理装置100は、サブベクトルである「0.7、0.2」及び「0.5、0.2」の平均を算出することにより、ベクトルKV10である「0.6、0.2」を生成する。情報処理装置100は、類似度情報DS1に示すように、第1ベクトルであるベクトルKV2(「0.6、0.3」)と、第2ベクトルであるベクトルKV10(「0.6、0.2」)とのコサイン類似度を「0.9」と算出する。
【0045】
また、図2では、広告キャンペーンBである区分CP2は、「北海道」であるキーワードKW21、「知床半島」であるキーワードKW22等が対応付けられる。情報処理装置100は、モデルM1を用いて、「北海道」をベクトルKV21である「0.2、0.8」に変換する。また、情報処理装置100は、モデルM1を用いて、「知床半島」をベクトルKV22である「0.4、0.4」に変換する。また、情報処理装置100は、サブベクトルである「0.2、0.8」及び「0.4、0.4」の平均を算出することにより、ベクトルKV20である「0.3、0.6」を生成する。情報処理装置100は、類似度情報DS2に示すように、第1ベクトルであるベクトルKV2(「0.6、0.3」)と、第2ベクトルであるベクトルKV20(「0.3、0.6」)とのコサイン類似度を「0.5」と算出する。
【0046】
図2では、情報処理装置100は、第1キーワード(キーワードKW2)である「沖縄」については、ベクトルKV2とのコサイン類似度が最大であるベクトルKV10に対応する区分CP1である広告キャンペーンAを提案区分に決定する。すなわち、図2では、情報処理装置100は、第1キーワード(キーワードKW2)である「沖縄」については、広告キャンペーンAを広告主に推薦すると決定する。
【0047】
以下、情報提供の対象が広告主Xである場合を一例として詳細な具体例を簡単に説明する。情報処理装置100は、広告主Xの登録キーワードからコンバージョンしやすさを予測する予測モデルM2を生成する。例えば、情報処理装置100は、広告主Xの検索広告のアカウントについての登録済キーワードとCVRの実績値を計算する。
【0048】
情報処理装置100は、登録済キーワードについて前処理として以下の処理を行う。例えば、情報処理装置100は、設定ファイル等を参照し、ブランド名等の表記ゆれを修正した上で、部分一致検索でブランド名等を除外してもよい。なお、ブランド名等の指名系キーワードはCVRが高く外れ値になる場合があるため、情報処理装置100は、この除外によりキーワードの異常値を除外し、予測精度の低下を抑制することができる。また、情報処理装置100は、CVRの外れ値を除外するとともに、CVRを0から1に収まるよう正規化の処理を行う。なお、情報処理装置100は、処理負荷軽減のため学習データが一定の閾値以上の場合ランダムサンプリングを行ってもよい。
【0049】
情報処理装置100は、登録キーワードを形態素解析する。情報処理装置100は、形態素解析後の単語をベクトル化する。例えば、情報処理装置100は、各ベクトルをキーワードごとに平均集約し200次元のベクトルとする。情報処理装置100は、CVRを目的変数、各単語の200次元のベクトルから予測モデルM2を学習する。
【0050】
情報処理装置100は、検索クエリにコンバージョンしやすさの確率をスコアリングする。情報処理装置100は、広告主Xおよびその競合に流入した検索クエリを抽出し、提案キーワードの一覧を生成する。情報処理装置100は、提案キーワードについて、上述した前処理を実行する。
【0051】
情報処理装置100は、検索クエリを形態素解析する。情報処理装置100は、形態素解析後の単語をベクトル化する。情報処理装置100は、予測モデルM2にベクトルを入力し、CVRを予測したスコア(予測CVR)を生成する。例えば、情報処理装置100は、スコアを最小値が0、最大値が1となるように正規化する。
【0052】
情報処理装置100は、検索広告に登録されているキャンペーン、広告グループ等の各区分のキーワードを抽出する。情報処理装置100は、広告主Xの検索広告のアカウントに登録済キーワードと、所属する広告キャンペーンおよび広告グループを抽出する。
【0053】
そして、情報処理装置100は、広告主Xの検索広告のアカウントに登録済キーワードについて、CVRの外れ値除外を除く前処理を実行する。情報処理装置100は、登録済キーワードを形態素解析する。情報処理装置100は、キャンペーンと広告グループの単語をベクトル化し平均値を算出し、算出した平均値と、各提案キーワードのベクトルとのコサイン類似度を全通り算出する。情報処理装置100は、図2に示すように、算出したコサイン類似度を基に広告主Xへ提案する情報を決定する。
【0054】
上述したように、情報処理装置100は、検索広告の運用においてリーチできていないキーワード(クエリ)を発見し、運用の指標となる数値とともに提案する。情報処理装置100は、提案先となる広告主(事業主)のサイトとその広告主の競合のサイトとに流入したクエリのうち、未入稿のクエリを抽出クエリとして抽出する。情報処理装置100は、抽出クエリに予測スコア(予測CVR等)を付与する。例えば、情報処理装置100は、クエリを品詞ごとに分解し、その意味をベクトル変換し数値化し、機械学習モデルを生成しスコア(予測CVR等)を予測する。情報処理装置100は、例えば広告主のアカウント構造と入稿キーワードから、最適なキャンペーンまたは広告グループ等の区分を提案する。
【0055】
情報処理装置100は、入力された際に所定の広告の配信対象となるクエリの候補と、広告とをベクトル化し、クエリの候補のベクトルが広告のベクトルと類似する場合は、クエリの候補を新たなクエリとして提案する。例えば、情報処理装置100は、類似する意図のテキストを類似するベクトルに変換するモデルを用いる。従来、広告のキャンペーン等では、登録されたキーワードが入力されると、広告が表示されているようにしており、キーワードは人手で登録されるので、キーワード漏れが発生する。また、従来、新語が発生した際に対応できない。
【0056】
そこで、情報処理装置100は、広告に関するキーワードをベクトル化する。具体的には、情報処理装置100は、広告文章、設定済みの広告キーワード、その他広告に関する各種メタデータ等の任意の情報からキーワードを抽出する。情報処理装置100は、抽出したキーワードを品詞ごとに分解する。情報処理装置100は、品詞ごとのキーワードを、モデルを用いてベクトル化する。情報処理装置100は、ベクトルの平均値を広告に紐づけておく。情報処理装置100は、所定の時間間隔で、複数の単語からなる複合クエリや長いクエリを生成してもよいし、検索クエリの履歴を用いてもよい。情報処理装置100は、品詞ごとに分解してベクトル化し、平均を求める。情報処理装置100は、検索クエリのベクトルと、広告のベクトルとを比較して、類似度が高い検索クエリを特定する。情報処理装置100は、特定した検索クエリのうち設定されていない検索クエリを提案対象とする。情報処理装置100は、類似度が高いほど優先的に提案対象としてもよい。なお、上述した処理は一例に過ぎず、情報処理装置100は、様々な情報を適宜用いて、提案する情報を決定し、広告主への提案を行ってもよい。
【0057】
〔2.情報処理装置の構成〕
次に、図4を用いて、実施形態に係る情報処理装置100の構成について説明する。図4は、実施形態に係る情報処理装置100の構成例を示す図である。図4に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。なお、情報処理装置100は、情報処理装置100の管理者等から各種操作を受け付ける入力部(例えば、キーボードやマウス等)や、各種情報を表示するための表示部(例えば、液晶ディスプレイ等)を有してもよい。
【0058】
(通信部110)
通信部110は、例えば、NIC(Network Interface Card)等によって実現される。そして、通信部110は、ネットワークと有線または無線で接続され、端末装置10、ユーザ端末20及び情報提供装置50との間で情報の送受信を行う。
【0059】
(記憶部120)
記憶部120は、例えば、RAM(Random Access Memory)、フラッシュメモリ(Flash Memory)等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。実施形態に係る記憶部120は、図4に示すように、モデル情報記憶部121と、検索クエリ情報記憶部122と、広告情報記憶部123とを有する。また、記憶部120は、上記に限らず、種々の情報を記憶してもよい。
【0060】
(モデル情報記憶部121)
実施形態に係るモデル情報記憶部121は、モデルに関する情報を記憶する。例えば、モデル情報記憶部121は、学習処理により学習(生成)された学習済みモデル(モデル)の情報(モデルデータ)を記憶する。図5に示すモデル情報記憶部121は、学習に用いたデータ(学習データ)を学習済みモデル(モデル)に対応付けて記憶する。図5は、実施形態に係るモデル情報記憶部の一例を示す図である。図5に示した例では、モデル情報記憶部121は、「モデルID」、「用途」、「モデルデータ」、「学習データ」といった項目が含まれる。図5の例では、モデル情報記憶部121は、学習に用いたデータ(学習データ)を学習済みモデル(モデル)に対応付けて記憶する。
【0061】
「モデルID」は、モデルを識別するための識別情報を示す。「用途」は、対応するモデルの用途を示す。「モデルデータ」は、モデルのデータを示す。図5等では「モデルデータ」に「MDT1」といった概念的な情報が格納される例を示したが、実際には、モデルの構成(ネットワーク構成)の情報やパラメータに関する情報等、そのモデルを構成する種々の情報が含まれる。例えば、「モデルデータ」には、ネットワークの各層におけるノードと、各ノードが採用する関数と、ノードの接続関係と、ノード間の接続に対して設定される接続係数とを含む情報が含まれる。
【0062】
「学習データ」は、学習済みモデル(モデル)の学習に用いられたデータを示す。「学習データ」には、対応するモデルの学習に用いられたデータセットを示す情報が記憶される。例えば、「学習データ」は、データ(入力情報)とそのデータに対応する正解情報(出力情報)とを対応付けて、学習データ(「学習用データ」ともいう)として記憶する。図5では「学習データ」に「LDT1」といった概念的な情報が格納される例を示したが、実際には、データ(入力情報)とそのデータに対応する正解情報(出力情報)等、対応するモデルの学習に用いられたデータに関する種々の情報が含まれる。
【0063】
図5では、モデルID「M1」により識別されるモデル(モデルM1)は、用途が「ベクトル変換」であることを示す。すなわち、モデルM1は、入力された文字列(キーワード)に対応するベクトルを出力(生成)するモデルであることを示す。また、モデルM1のモデルデータは、モデルデータMDT1であることを示す。また、モデルM1の学習に用いられた学習データは、学習データLDT1であることを示す。
【0064】
また、モデルID「M2」により識別されるモデル(予測モデルM2)は、用途が「CVR予測」であることを示す。すなわち、予測モデルM2は、入力されたベクトルに対応するキーワードについて予測されるCVRを示す情報(スコア)を出力するモデルであることを示す。例えば、予測モデルM2は、0~100(%)の値を出力する。例えば、予測モデルM2は、入力されたベクトルに対応するキーワードのCVRの予測値を出力する。予測モデルM2のモデルデータは、モデルデータMDT2であることを示す。また、予測モデルM2の学習に用いられた学習データは、学習データLDT2であることを示す。学習データLDT2は、広告文にその広告文のCVRの値(実績値等)が正解情報として対応付けられた複数の教師データを含む。
【0065】
なお、モデル情報記憶部121は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、モデル情報記憶部121は、CVRに限らず、他の広告指標を予測するモデルを記憶してもよい。例えば、モデル情報記憶部121は、CTRを予測するモデルM3を記憶してもよい。この場合、モデル情報記憶部121は、CTRを予測するモデルM3に、その学習に用いたデータ(正解情報であるCTRとそのCTRの実績が得られた広告文との組み合わせ)を対応付けて記憶する。
【0066】
(検索クエリ情報記憶部122)
実施形態に係る検索クエリ情報記憶部122は、検索クエリに関する各種情報を記憶する。検索クエリ情報記憶部122は、検索クエリとして用いられたキーワードに関する情報を記憶する。
【0067】
例えば、検索クエリ情報記憶部122は、検索クエリとして用いられたキーワードに、そのキーワードを用いたユーザを識別する情報(ユーザID)を対応付けて記憶する。例えば、検索クエリ情報記憶部122は、検索クエリとして用いられたキーワードに、そのキーワードを用いたユーザの検索後の行動を示す行動情報を対応付けて記憶する。例えば、検索クエリ情報記憶部122は、検索クエリとして用いられたキーワードに、そのキーワードを用いたユーザが所定のサイトにアクセスしたことを示す行動情報を対応付けて記憶する。
【0068】
なお、検索クエリ情報記憶部122は、上記に限らず、目的に応じて種々の情報を記憶してもよい。
【0069】
(広告情報記憶部123)
実施形態に係る広告情報記憶部123は、広告に関する各種情報を記憶する。例えば、広告情報記憶部123は、検索広告に関する各種情報を記憶する。例えば、広告情報記憶部123は、キャンペーンや広告グループ等の広告の入稿先に関する区分に関する各種情報を記憶する。
【0070】
例えば、広告情報記憶部123は、アカウント(広告主)ごとに広告の入稿先に関する区分に関する各種情報を記憶する。例えば、広告情報記憶部123は、各広告主が設定したキャンペーンや広告グループ等の広告の入稿先に関する区分に関する各種情報を、各広告主を識別する情報(広告主ID等)に対応付けて記憶する。なお、広告主は、入稿作業等を代理店に依頼する場合もある。「広告主」といった表記は、広告主だけでなく代理店を含む概念であるものとする。
【0071】
例えば、広告情報記憶部123は、キャンペーンごとに、そのキャンペーンに設定された予算、期間、ターゲティング(ターゲットとするユーザ属性等)を記憶する。広告情報記憶部123は、キャンペーンごとに、そのキャンペーンで設定された広告グループを記憶する。例えば、広告情報記憶部123は、キャンペーンごとに、そのキャンペーンでの配信実績を記憶する。
【0072】
例えば、広告情報記憶部123は、広告グループごとに、その広告グループに設定されたキーワード及び広告を記憶する。例えば、広告は、広告主から指定されたキーワードである。例えば、広告は、広告主から入稿された広告である。例えば、広告は、広告として用いられた文章、または、これらの格納場所を示すファイルパス名などが格納される。なお、広告は、広告文を含むものであれば、画像を含んでもよく、動画像や音声等のデータであってもよい。
【0073】
例えば、広告情報記憶部123は、広告グループごとに、その広告グループでの配信実績を記憶する。例えば、広告情報記憶部123は、広告グループごとに、その広告グループでの配信実績に基づく広告指標を記憶する。例えば、広告情報記憶部123は、広告グループごとに、その広告グループについて収集された配信実績に基づく広告指標、または、これらの格納場所を示すファイルパス名などが格納される。例えば、広告情報記憶部123は、広告グループごとに、広告グループの広告に対応するCTR、CVR等の各種の広告指標の実績値を記憶する。
【0074】
なお、広告情報記憶部123は、上記に限らず、目的に応じて種々の情報を記憶してもよい。例えば、広告情報記憶部123は、入札価格に関する情報等を記憶してもよい。
【0075】
(制御部130)
図4の説明に戻って、制御部130は、コントローラ(controller)であり、例えば、CPU(Central Processing Unit)やMPU(Micro Processing Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラム(情報処理プログラムの一例に相当)がRAMを作業領域として実行されることにより実現される。また、制御部130は、コントローラであり、例えば、ASIC(Application Specific Integrated Circuit)やFPGA(Field Programmable Gate Array)等の集積回路により実現される。
【0076】
図4に示すように、制御部130は、取得部131と、学習部132と、抽出部133と、決定部134と、提供部135とを有し、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図4に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。
【0077】
(取得部131)
取得部131は、種々の情報を取得する。取得部131は、端末装置10、ユーザ端末20、情報提供装置50等の外部装置から各種情報を取得する。また、取得部131は、記憶部120から各種情報を取得する。また、取得部131は、モデル情報記憶部121や、検索クエリ情報記憶部122や、広告情報記憶部123等から各種情報を取得する。
【0078】
取得部131は、通信部110を介して、外部の情報処理装置から各種情報を受信する。取得部131は、受信した情報を記憶部120に格納する。取得部131は、端末装置10、ユーザ端末20または情報提供装置50から各種情報を受信する。取得部131は、ユーザが利用する端末装置10から情報を取得する。例えば、取得部131は、情報提供装置50から各種情報を取得する。例えば、取得部131は、情報提供装置50からモデルの学習に用いる学習用データを受信する。例えば、取得部131は、情報提供装置50からモデルを受信する。
【0079】
取得部131は、検索クエリ群を取得する。取得部131は、区分の各々に対応する第2キーワードを示す情報を取得する。
【0080】
(学習部132)
学習部132は、学習モデル(モデル)を学習する学習処理を実行する。なお、情報処理装置100は、情報提供装置50からモデルM1、M2等の学習モデルを取得する場合、学習部132を有しなくてもよい。
【0081】
例えば、学習部132は、取得部131により取得された各種情報に基づいて、学習処理を実行する。学習部132は、外部の情報処理装置からの情報や記憶部120に記憶された情報に基づいて、学習処理を実行する。学習部132は、モデル情報記憶部121に記憶された情報に基づいて、学習処理を実行する。学習部132は、学習により生成したモデルをモデル情報記憶部121に格納する。
【0082】
学習部132は、学習処理を行う。学習部132は、各種学習を行う。学習部132は、取得部131により取得された情報に基づいて、各種情報を学習する。学習部132は、モデルを学習(生成)する。学習部132は、モデル等の各種情報を学習する。学習部132は、学習によりモデルを生成する。学習部132は、種々の機械学習に関する技術を用いて、モデルを学習する。例えば、学習部132は、モデル(ネットワーク)のパラメータを学習する。学習部132は、種々の機械学習に関する技術を用いて、モデルを学習する。
【0083】
学習部132は、モデルM1等の各種の学習モデルを生成する。学習部132は、ネットワークのパラメータを学習する。例えば、学習部132は、モデルM1等の各種の学習モデルのネットワークのパラメータを学習する。学習部132は、モデル情報記憶部121に記憶された学習用データを用いて、学習処理を行うことにより、モデルM1等の各種の学習モデルを生成する。例えば、学習部132は、ベクトル変換に用いられるモデルを生成する。学習部132は、モデルM1等の各種の学習モデルのネットワークのパラメータを学習することにより、モデルM1等の各種の学習モデルを生成する。
【0084】
学習部132は、モデル情報記憶部121に記憶された学習用データ(教師データ)に基づいて、学習処理を行う。学習部132は、モデル情報記憶部121に記憶された学習用データを用いて、学習処理を行うことにより、モデルM1等の各種の学習モデルを生成する。
【0085】
例えば、学習部132は、モデルM1が出力するベクトルが、モデルM1に入力した文字列(入力情報)に対応付けられた正解情報(望ましいベクトル)に近づくように、バックプロパゲーション(誤差逆伝播法)等の手法により学習処理を行う。例えば、学習部132は、キーワード等の文字列である入力情報が入力されたモデルM1が出力するベクトルが、その入力情報に対応付けられた正解情報に近づくように学習処理を行う。
【0086】
例えば、学習部132は、学習処理によりノード間で値が伝達する際に考慮される重み(すなわち、接続係数)の値を調整する。このように、学習部132は、モデルM1における出力と、入力に対応する正解情報との誤差が少なくなるようにパラメータ(接続係数)を補正するバックプロパゲーション等の処理によりモデルM1を学習する。例えば、学習部132は、所定の損失(ロス)関数を最小化するようにバックプロパゲーション等の処理を行うことによりモデルM1を生成する。これにより、学習部132は、モデルM1のパラメータを学習する学習処理を行うことができる。
【0087】
なお、モデルの学習手法については、上述した手法に限定されるものではなく、任意の公知技術が適用可能である。なお、各モデルの生成は、機械学習に関する種々の従来技術を適宜用いて行われてもよい。例えば、モデルの生成は、SVM(Support Vector Machine)等の教師あり学習の機械学習に関する技術を用いて行われてもよい。また、例えば、モデルの生成は、教師なし学習の機械学習に関する技術を用いて行われてもよい。例えば、モデルの生成は、深層学習(ディープラーニング)の技術を用いて行われてもよい。例えば、モデルの生成は、DNN(Deep Neural Network)やRNN(Recurrent Neural Network)やCNN(Convolutional Neural Network)等の種々のディープラーニングの技術を適宜用いて行われてもよい。なお、上記モデルの生成に関する記載は例示であり、モデルの生成は、取得可能な情報等に応じて適宜選択された学習手法により行われてもよい。すなわち、学習部132は、学習用データに含まれる入力情報が入力された場合に、正解情報に対応するスコアを出力するようにモデルM1を学習可能であれば、どのような手法によりモデルM1の生成を行ってもよい。
【0088】
上記のように、学習部132による学習の手法は特に限定されないが、例えば、データ(入力情報)とその正解情報(出力情報)とを紐づけた学習用データを用意し、その学習用データを多層ニューラルネットワークに基づいた計算モデルに入力して学習してもよい。また、例えばCNN、3D-CNN等のDNNに基づく手法が用いられてもよい。学習部132は、音声等のような時系列データを対象とする場合、再帰型ニューラルネットワーク(RNN)やRNNを拡張したLSTM(Long Short-Term Memory units)に基づく手法を用いてもよい。
【0089】
また、学習部132は、広告指標の予測に用いるモデルである予測モデルM2を学習してもよい。例えば、学習部132は、CVRの予測に用いるモデルである予測モデルM2を学習してもよい。例えば、学習部132は、広告文にその広告文のCVRの値(0~100(%)等の実績値等)が正解情報として対応付けられた複数の教師データを含む学習データLDT2を用いて予測モデルM2を学習する。例えば、学習部132は、ベクトルが入力された場合に、そのベクトルに対応するキーワードに対応付けられた正解情報(値)が出力されるように予測モデルM2を学習する。例えば、学習部132は、ベクトルの入力に応じて、そのベクトルに対応するキーワードが検索クエリとして用いられた場合の予測されるCVRの値(0~100(%))を出力する予測モデルM2を学習する。なお、予測モデルM2を情報提供装置50から取得する場合、学習部132は、予測モデルM2を学習しなくてもよい。
【0090】
(抽出部133)
抽出部133は、種々の情報を抽出する。例えば、抽出部133は、端末装置10やユーザ端末20や情報提供装置50等の外部の情報処理装置から取得された各種情報から種々の情報を抽出する。例えば、抽出部133は、記憶部120に記憶された各種情報から種々の情報を抽出する。例えば、取得部131は、モデル情報記憶部121や、検索クエリ情報記憶部122や、広告情報記憶部123等に記憶された各種情報から種々の情報を抽出する。取得部131は、検索クエリ情報記憶部122から条件を満たすクエリを抽出する。
【0091】
例えば、抽出部133は、取得部131により取得された各種情報から種々の情報を抽出する。抽出部133は、抽出した情報を用いて、各種の情報を生成する。抽出部133は、抽出した情報を用いて、各種の情報を算出する。抽出部133は、抽出した情報を用いて、各種の情報を推定する。
【0092】
抽出部133は、検索に用いられた検索クエリ群から、所定の条件を満たす検索クエリを第1キーワードとして抽出する。抽出部133は、検索クエリ群のうち、検索を行ったユーザが所定の行動を行った検索クエリを第1キーワードとして抽出する。抽出部133は、検索クエリ群のうち、ユーザが所定のサイトにアクセスした検索クエリを第1キーワードとして抽出する。抽出部133は、第1キーワードと、取得部131により取得された第2キーワードとに基づいて、第1キーワードの提案区分を決定する。抽出部133は、取得部131により取得された検索クエリ群から、第1キーワードを抽出する。
【0093】
(決定部134)
決定部134は、種々の情報を決定する決定処理を実行する。決定部134は、決定処理により決定した情報を記憶部120に格納する。例えば、決定部134は、取得部131により取得された各種情報に基づいて、決定処理を実行する。例えば、決定部134は、抽出部133により抽出された各種情報に基づいて、決定処理を実行する。決定部134は、記憶部120に記憶された各種情報に基づいて、決定処理を実行する。例えば、決定部134は、外部の情報処理装置から受信された各種情報に基づいて、決定処理を実行する。
【0094】
決定部134は、学習部132により学習されたモデルを用いて、決定処理を実行する。決定部134は、モデル情報記憶部121に記憶されたモデルを用いて、決定処理を実行する。
【0095】
決定部134は、学習モデルにより生成された第2広告文から、広告に利用される候補となる広告候補文を決定する。決定部134は、広告指標が所定の条件を満たす第2広告文を広告候補文に決定する。決定部134は、言語らしさの条件を満たす第2広告文を広告候補文に決定する。
【0096】
決定部134は、抽出部133により抽出された第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、第1キーワードの入稿先として提案する区分である提案区分を決定する。決定部134は、第1キーワードがベクトルに変換された第1ベクトル情報と、区分の各々に対応する第2キーワードのベクトル変換に基づく区分の各々の第2ベクトル情報とに基づいて、第1キーワードの提案区分を決定する。
【0097】
決定部134は、文字列を入力とし、文字列に対応するベクトルを出力するベクトル変換モデルM1を用いて生成された第1キーワードの第1ベクトル情報と、ベクトル変換モデルM1を用いて生成された区分の各々の第2ベクトル情報との比較に基づいて、第1キーワードの提案区分を決定する。決定部134は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報との比較に基づいて、第1キーワードの提案区分を決定する。
【0098】
決定部134は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報との類似度に基づいて、第1キーワードの提案区分を決定する。決定部134は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報とのコサイン類似度である類似度に基づいて、第1キーワードの提案区分を決定する。決定部134は、区分のうち、第1キーワードの第1ベクトル情報との第2ベクトル情報の類似度が最大である類似区分を提案区分に決定する。
【0099】
決定部134は、ベクトルを入力とし、ベクトルに対応するキーワードの検索広告に関する広告指標の予測値を出力する予測モデルM2を用いて、第1キーワードの広告指標の予測値を決定する。決定部134は、コンバージョンに関する広告指標の予測値を出力する予測モデルM2を用いて、第1キーワードを用いた検索によるコンバージョンに関する広告指標の予測値を決定する。決定部134は、コンバージョンに至った回数に関する広告指標の予測値を出力する予測モデルM2を用いて、第1キーワードを用いた検索によりコンバージョンに至った回数に関する広告指標の予測値を決定する。決定部134は、コンバージョン率の予測値を出力する予測モデルM2を用いて、第1キーワードを用いた検索によるコンバージョン率の予測値を決定する。
【0100】
決定部134は、第1キーワードと、キャンペーンまたは広告グループである区分の各々に対応する第2キーワードとに基づいて、第1キーワードの提案区分を決定する。
【0101】
決定部134は、各種情報を生成する生成処理を実行する。例えば、決定部134は、取得部131により取得された各種情報に基づいて、生成処理を実行する。例えば、決定部134は、記憶部120に記憶された情報に基づいて、生成処理を実行する。決定部134は、決定した情報に基づいて、生成処理を実行する。
【0102】
決定部134は、コンテンツを生成する。決定部134は、例えば、決定部134は、Java(登録商標)等の種々の技術を適宜用いて、端末装置10へ提供する画面(コンテンツ)を生成する。なお、決定部134は、CSSやJavaScript(登録商標)やHTMLの形式に基づいて、端末装置10へ提供する画面(コンテンツ)を生成してもよい。また、例えば、決定部134は、JPEG(Joint Photographic Experts Group)やGIF(Graphics Interchange Format)やPNG(Portable Network Graphics)など様々な形式で画面(コンテンツ)を生成してもよい。決定部134は、評価受付用コンテンツを生成する。
【0103】
(提供部135)
提供部135は、各種情報を提供する。提供部135は、通信部110を介して、外部の情報処理装へ各種情報を送信する。提供部135は、端末装置10やユーザ端末20や情報提供装置50へ各種情報を送信する。提供部135は、決定処理の結果を端末装置10へ送信する。
【0104】
提供部135は、抽出部133により抽出された情報を提供する。提供部135は、決定部134により決定された情報を提供する。提供部135は、決定した広告候補文を端末装置10へ送信する。提供部135は、決定部134により生成された情報を提供する。提供部135は、決定した広告をユーザ端末20へ送信する。
【0105】
提供部135は、第1キーワードを提案キーワードとして、情報提供先となる広告主である対象広告主が利用する端末装置10に提供する。提供部135は、決定部134により決定された第1キーワードの提案区分を、提案キーワードとともに端末装置10に提供する。
【0106】
〔3.処理手順〕
次に、図6を用いて、実施形態に係る情報処理装置100が実行する情報処理の手順について説明する。図6は、情報処理装置が実行する情報処理の流れの一例を示すフローチャートである。
【0107】
図6では、情報処理装置100は、検索に用いられた検索クエリ群から、所定の条件を満たす検索クエリを第1キーワードとして抽出する(ステップS101)。例えば、情報処理装置100は、検索クエリ群のうち、ユーザが所定のサイトにアクセスした検索クエリを第1キーワードとして抽出する。
【0108】
また、情報処理装置100は、第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、第1キーワードの入稿先として提案する区分である提案区分を決定する(ステップS102)。例えば、情報処理装置100は、第1キーワードと、第2キーワードとに基づいて、キャンペーンまたは広告グループを第1キーワードの提案区分に決定する。
【0109】
〔4.効果〕
上述してきたように、実施形態に係る情報処理装置100は、抽出部133と、決定部134とを有する。抽出部133は、検索に用いられた検索クエリ群から、所定の条件を満たす検索クエリを第1キーワードとして抽出する。決定部134は、抽出部133により抽出された第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、第1キーワードの入稿先として提案する区分である提案区分を決定する。
【0110】
このように、実施形態に係る情報処理装置100は、検索クエリ群から第1キーワードを抽出し、抽出した第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0111】
また、実施形態に係る情報処理装置100において、決定部134は、第1キーワードがベクトルに変換された第1ベクトル情報と、区分の各々に対応する第2キーワードのベクトル変換に基づく区分の各々の第2ベクトル情報とに基づいて、第1キーワードの提案区分を決定する。
【0112】
このように、実施形態に係る情報処理装置100は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報とに基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0113】
また、実施形態に係る情報処理装置100において、決定部134は、文字列を入力とし、文字列に対応するベクトルを出力するベクトル変換モデルM1を用いて生成された第1キーワードの第1ベクトル情報と、ベクトル変換モデルM1を用いて生成された区分の各々の第2ベクトル情報との比較に基づいて、第1キーワードの提案区分を決定する。
【0114】
このように、実施形態に係る情報処理装置100は、文字列を入力とし、文字列に対応するベクトルを出力するベクトル変換モデルM1を用いて生成した第1ベクトル情報と第2ベクトル情報とに基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0115】
また、実施形態に係る情報処理装置100において、決定部134は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報との比較に基づいて、第1キーワードの提案区分を決定する。
【0116】
このように、実施形態に係る情報処理装置100は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報との比較に基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0117】
また、実施形態に係る情報処理装置100において、決定部134は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報との類似度に基づいて、第1キーワードの提案区分を決定する。
【0118】
このように、実施形態に係る情報処理装置100は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報との類似度に基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0119】
また、実施形態に係る情報処理装置100において、決定部134は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報とのコサイン類似度である類似度に基づいて、第1キーワードの提案区分を決定する。
【0120】
このように、実施形態に係る情報処理装置100は、第1キーワードの第1ベクトル情報と、区分の各々の第2ベクトル情報とのコサイン類似度である類似度に基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0121】
また、実施形態に係る情報処理装置100において、決定部134は、区分のうち、第1キーワードの第1ベクトル情報との第2ベクトル情報の類似度が最大である類似区分を提案区分に決定する。
【0122】
このように、実施形態に係る情報処理装置100は、区分のうち、第1キーワードの第1ベクトル情報との第2ベクトル情報の類似度が最大である類似区分を提案区分に決定することにより、適切な提案を可能にすることができる。
【0123】
また、実施形態に係る情報処理装置100において、決定部134は、ベクトルを入力とし、ベクトルに対応するキーワードの検索広告に関する広告指標の予測値を出力する予測モデルM2を用いて、第1キーワードの広告指標の予測値を決定する。
【0124】
このように、実施形態に係る情報処理装置100は、予測モデルM2を用いて、第1キーワードの広告指標の予測値を決定することにより、第1キーワードの広告指標の予測値を適切に予測することができる。
【0125】
また、実施形態に係る情報処理装置100において、決定部134は、コンバージョンに関する広告指標の予測値を出力する予測モデルM2を用いて、第1キーワードを用いた検索によるコンバージョンに関する広告指標の予測値を決定する。
【0126】
このように、実施形態に係る情報処理装置100は、予測モデルM2を用いて、第1キーワードのコンバージョンに関する広告指標の予測値を決定することにより、第1キーワードの広告指標の予測値を適切に予測することができる。
【0127】
また、実施形態に係る情報処理装置100において、決定部134は、コンバージョンに至った回数に関する広告指標の予測値を出力する予測モデルM2を用いて、第1キーワードを用いた検索によりコンバージョンに至った回数に関する広告指標の予測値を決定する。
【0128】
このように、実施形態に係る情報処理装置100は、予測モデルM2を用いて、第1キーワードのコンバージョンに至った回数に関する広告指標の予測値を決定することにより、第1キーワードの広告指標の予測値を適切に予測することができる。
【0129】
また、実施形態に係る情報処理装置100において、決定部134は、コンバージョン率の予測値を出力する予測モデルM2を用いて、第1キーワードを用いた検索によるコンバージョン率の予測値を決定する。
【0130】
このように、実施形態に係る情報処理装置100は、予測モデルM2を用いて、第1キーワードのコンバージョン率の予測値を決定することにより、第1キーワードのコンバージョン率を適切に予測することができる。
【0131】
また、実施形態に係る情報処理装置100において、抽出部133は、検索クエリ群のうち、検索を行ったユーザが所定の行動を行った検索クエリを第1キーワードとして抽出する。
【0132】
このように、実施形態に係る情報処理装置100は、検索クエリ群のうち、検索を行ったユーザが所定の行動を行った検索クエリを第1キーワードとして抽出することにより、適切な提案を可能にすることができる。
【0133】
また、実施形態に係る情報処理装置100において、抽出部133は、検索クエリ群のうち、ユーザが所定のサイトにアクセスした検索クエリを第1キーワードとして抽出する。
【0134】
このように、実施形態に係る情報処理装置100は、検索クエリ群のうち、ユーザが所定のサイトにアクセスした検索クエリを第1キーワードとして抽出することにより、適切な提案を可能にすることができる。
【0135】
また、実施形態に係る情報処理装置100において、決定部134は、第1キーワードと、キャンペーンまたは広告グループである区分の各々に対応する第2キーワードとに基づいて、第1キーワードの提案区分を決定する。
【0136】
このように、実施形態に係る情報処理装置100は、第1キーワードと、キャンペーンまたは広告グループである区分提案区分に決定することにより、適切な提案を可能にすることができる。
【0137】
また、実施形態に係る情報処理装置100は、提供部135を有する。提供部135は、第1キーワードを提案キーワードとして、情報提供先となる広告主である対象広告主が利用する端末装置10に提供する。
【0138】
このように、実施形態に係る情報処理装置100は、第1キーワードを提案キーワードとして、情報提供先となる広告主である対象広告主が利用する端末装置10に提供することにより、適切に決定された提案区分を広告主に提供することができ、適切な提案を行うことができる。
【0139】
また、実施形態に係る情報処理装置100において、提供部135は、決定部134により決定された第1キーワードの提案区分を、提案キーワードとともに端末装置10に提供する。
【0140】
このように、実施形態に係る情報処理装置100は、第1キーワードの提案区分を、提案キーワードとともに端末装置10に提供することにより、適切に決定された提案区分を第1キーワードとともに広告主に提供することができ、適切な提案を行うことができる。
【0141】
また、実施形態に係る情報処理装置100は、取得部131を有する。取得部131は、検索クエリ群を取得する。抽出部133は、取得部131により取得された検索クエリ群から、第1キーワードを抽出する。
【0142】
このように、実施形態に係る情報処理装置100は、取得した検索クエリ群から第1キーワードを抽出し、抽出した第1キーワードと、広告の入稿先に関する区分の各々に対応する第2キーワードとに基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0143】
また、実施形態に係る情報処理装置100において、取得部131は、区分の各々に対応する第2キーワードを示す情報を取得する。抽出部133は、第1キーワードと、取得部131により取得された第2キーワードとに基づいて、第1キーワードの提案区分を決定する。
【0144】
このように、実施形態に係る情報処理装置100は、第1キーワードと、取得した第2キーワードとに基づいて、第1キーワードの提案区分を決定することにより、適切な提案を可能にすることができる。
【0145】
〔5.ハードウェア構成〕
上述してきた実施形態に係る情報処理装置100は、例えば図7に示すような構成のコンピュータ1000によって実現される。図7は、情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD(Hard Disk Drive)1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
【0146】
CPU1100は、ROM1300またはHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。
【0147】
HDD1400は、CPU1100によって実行されるプログラム、及び、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、ネットワークNを介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータをネットワークNを介して他の機器へ送信する。
【0148】
CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを入出力インターフェイス1600を介して出力装置へ出力する。
【0149】
メディアインターフェイス1700は、記録媒体1800に格納されたプログラムまたはデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital Versatile Disc)、PD(Phase change rewritable Disk)等の光学記録媒体、MO(Magneto-Optical disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
【0150】
例えば、コンピュータ1000が実施形態に係る情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。コンピュータ1000のCPU1100は、これらのプログラムを記録媒体1800から読み取って実行するが、他の例として、他の装置からネットワークNを介してこれらのプログラムを取得してもよい。
【0151】
以上、本願の実施形態及び変形例のいくつかを図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の行に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。
【0152】
〔6.その他〕
また、上記実施形態及び変形例において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。例えば、各図に示した各種情報は、図示した情報に限られない。
【0153】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0154】
また、上述してきた実施形態及び変形例は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。
【0155】
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、取得部は、取得手段や取得回路に読み替えることができる。
【符号の説明】
【0156】
1 情報処理システム
100 情報処理装置
121 モデル情報記憶部
122 検索クエリ情報記憶部
123 広告情報記憶部
130 制御部
131 取得部
132 学習部
133 抽出部
134 決定部
135 提供部
10 端末装置
20 ユーザ端末
50 情報提供装置
N ネットワーク
図1
図2
図3
図4
図5
図6
図7