(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-01-23
(45)【発行日】2023-01-31
(54)【発明の名称】予測プログラム、予測方法及び予測装置
(51)【国際特許分類】
G06Q 30/0241 20230101AFI20230124BHJP
G06Q 10/04 20230101ALI20230124BHJP
【FI】
G06Q30/02 396
G06Q10/04
(21)【出願番号】P 2019093717
(22)【出願日】2019-05-17
【審査請求日】2022-02-08
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】後藤 啓介
(72)【発明者】
【氏名】浅井 達哉
(72)【発明者】
【氏名】大堀 耕太郎
(72)【発明者】
【氏名】塩田 好伸
【審査官】永野 一郎
(56)【参考文献】
【文献】特開2015-111382(JP,A)
【文献】特開2019-45899(JP,A)
【文献】米国特許出願公開第2009/0327029(US,A1)
【文献】特開2019-57189(JP,A)
【文献】特開2016-177536(JP,A)
【文献】特開2017-173912(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
コンピュータに、
ユーザの特徴情報とユーザによる商品の購入行動又は前記購入行動につながる所定の行動の有無を示す情報とを対応付けたデータを学習データとして、前記ユーザの特徴情報に応じたユーザの前記購入行動又は前記所定の行動の有無を予測するモデルを生成し、
前記特徴情報に共通部分を有するユーザのグループと対応付けて表示部に表示された入力欄への予算金額の入力を受け付け、
前記入力欄に対応するグループのユーザの特徴情報、前記入力欄に入力された前記予算金額、前記商品の広告ページに対する予測クリック数、前記モデルを用いて算出される前記購入行動又は前記所定の行動の発生率である予測発生率、に基づいて算出される、前記購入行動又は前記所定の行動の発生数である予測発生数を、前記予算金額と対応付けて前記表示部に表示する、
処理を実行させることを特徴とする予測プログラム。
【請求項2】
前記モデルに、前記グループのユーザの特徴情報を入力して得られたユーザの前記購入行動又は前記所定の行動の有無を基に前記予測発生率を計算し、
前記表示する処理は、前記計算する処理によって計算された予測発生率に基づいて算出される予測発生数を表示する、
ことを特徴とする請求項1に記載の予測プログラム。
【請求項3】
前記表示する処理は、
前記広告ページに対するクリック数の実績値に基づく予測クリック数に基づいて算出される予測発生数を表示する、
ことを特徴とする請求項1又は2に記載の予測プログラム。
【請求項4】
前記生成する処理は、前記ユーザの、広告ページへの初回アクセス時から経過時間を含む特徴情報に応じたユーザの前記購入行動又は前記所定の行動の有無を予測するモデルを生成することを特徴とする請求項1から3のいずれか1項に記載の予測プログラム。
【請求項5】
コンピュータが、
ユーザの特徴情報とユーザによる商品の購入行動又は前記購入行動につながる所定の行動の有無を示す情報とを対応付けたデータを学習データとして、前記ユーザの特徴情報に応じたユーザの前記購入行動又は前記所定の行動の有無を予測するモデルを生成し、
前記特徴情報に共通部分を有するユーザのグループと対応付けて表示部に表示された入力欄への予算金額の入力を受け付け、
前記入力欄に対応するグループのユーザの特徴情報、前記入力欄に入力された前記予算金額、前記商品の広告ページに対する予測クリック数、前記モデルを用いて算出される前記購入行動又は前記所定の行動の発生率である予測発生率、に基づいて算出される、前記購入行動又は前記所定の行動の発生数である予測発生数を、前記予算金額と対応付けて前記表示部に表示する、
処理を実行することを特徴とする予測方法。
【請求項6】
ユーザの特徴情報とユーザによる商品の購入行動又は前記購入行動につながる所定の行動の有無を示す情報とを対応付けたデータを学習データとして、前記ユーザの特徴情報に応じたユーザの前記購入行動又は前記所定の行動の有無を予測するモデルを生成する生成部と、
前記特徴情報に共通部分を有するユーザのグループと対応付けて表示部に表示された入力欄への予算金額の入力を受け付ける入力部と、
前記入力欄に対応するグループのユーザの特徴情報、前記入力欄に入力された前記予算金額、前記商品の広告ページに対する予測クリック数、前記モデルを用いて算出される前記購入行動又は前記所定の行動の発生率である予測発生率、に基づいて算出される、前記購入行動又は前記所定の行動の発生数である予測発生数を、前記予算金額と対応付けて前記表示部に表示する表示制御部と、
を有することを特徴とする予測装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、予測プログラム、予測方法及び予測装置に関する。
【背景技術】
【0002】
従来、広告出稿の最適化を図る技術が知られている。特にデジタルマーケティングにおいては、ログデータの分析結果に基づき、予算配分の最適化が行われる場合がある。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記の技術では、予算配分の最適化を効率化することが困難な場合があるという問題がある。例えば、従来の手法では、予算配分を行った際に、各広告のCV(conversion:コンバージョン)数の見積もりを得ることが難しく、当該予算配分が最適であるか否かを評価することができない場合がある。
【0005】
1つの側面では、予算配分の最適化を効率化することを目的とする。
【課題を解決するための手段】
【0006】
1つの態様において、予測プログラムは、ユーザの特徴情報とユーザによる商品の購入行動又は購入行動につながる所定の行動の有無を示す情報とを対応付けたデータを学習データとしてモデルを生成する処理をコンピュータに実行させる。モデルは、ユーザの特徴情報に応じたユーザの購入行動又は所定の行動の有無を予測する。予測プログラムは、特徴情報に共通部分を有するユーザのグループと対応付けて表示部に表示された入力欄への予算金額の入力を受け付ける処理をコンピュータに実行させる。予測プログラムは、入力欄に対応するグループのユーザの特徴情報、入力欄に入力された予算金額、商品の広告ページに対する予測クリック数、予測発生率に基づいて算出される予測発生数を予算金額と対応付けて表示部に表示する処理をコンピュータに実行させる。
【発明の効果】
【0007】
1つの側面では、予算配分の最適化を効率化することができる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、実施例1に係る予測装置の機能構成の一例を示す図である。
【
図5】
図5は、グループ情報の一例を示す図である。
【
図6】
図6は、予算配分の周期について説明する説明図である。
【
図7】
図7は、データの分類について説明する説明図である。
【
図10】
図10は、変数とデータの関係を説明する説明図である。
【
図14】
図14は、生成された仮説の一例を示す説明図である。
【
図15】
図15は、ロジスティック回帰による重要度の計算を説明する説明図である。
【
図19】
図19は、実施例1に係る予測処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0009】
以下に、本発明に係る予測プログラム、予測方法及び予測装置の実施例を図面に基づいて詳細に説明する。なお、この実施例により本発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。
【実施例1】
【0010】
[機能構成]
図1を用いて、実施例1に係る予測装置の機能構成について説明する。
図1は、実施例1に係る予測装置の機能構成の一例を示す図である。
図1に示すように、予測装置10は、通信部11、入力部12、出力部13、記憶部14及び制御部15を有する。記憶部14は、ログデータ141、仮説情報142、変数情報143及びグループ情報144を記憶する。
【0011】
ログデータ141は、CV率を導出するためのモデルを訓練するための訓練データとして利用される。このため、例えば、ログデータ141は、ユーザの特徴情報とユーザによる商品の購入行動又は購入行動につながる所定の行動の有無を示す情報である。ユーザによる商品の購入行動又は購入行動につながる所定の行動の有無を示す情報は、ユーザが商品に対してCVしたか否かを示す情報と言い換えられてもよい。また、ログデータ141は、配信された広告ごとのCVの実績を表すデータということができる。
【0012】
ここで、CV(conversion:コンバージョン)とは、マーケティングにおける成果が得られたことを意味する用語である。マーケティングにおける成果とは、例えば、出稿した広告の内容に対応した、商品の購入や購入予約、会員登録、商品に関する問合せ、等の、成果指標となり得る事象である。あるいは、CV(conversion:コンバージョン)とは商品の購入につながる行動や購入に対する肯定的な動作(の発生)ということもできる。
【0013】
図2は、ログデータの一例を示す図である。
図2に示すように、ログデータ141は、説明変数として「ユーザID」、「性別」、「年代」、「アクセス回数」、「広告配信時間帯」、「居住地」を有する。また、ログデータ141は、目的変数として「CV」を有する。目的変数「CV」は、当該広告のCVが発生したか否かを表すものである。例えば、当該広告に対応する製品が購入された場合、又は当該広告に対応する製品の購入ページに遷移した場合にCVが発生したとみなされる。
【0014】
例えば、
図2の1行目には、ユーザIDが「U001」であるユーザの性別が「女性」、年代が「若者」、居住地が「首都圏」であり、広告配信時間帯が「午前」であり、アクセス回数が10回であり、かつCVが発生しなかったことが示されている。また、例えば、
図2の2行目には、ユーザIDが「U002」であるユーザの性別が「男性」、年代が「中年」、居住地が「北海道」であり、広告配信時間帯が「午後」であり、アクセス回数が20回であり、かつCVが発生したことが示されている。
【0015】
仮説情報142は、目的変数と目的変数に対応する1つ以上の説明変数に関する条件との組み合わせと、重要度とを対応付けた情報である。以降の説明では、仮説情報142における組み合わせを、仮説と呼ぶ場合がある。また、重要度の計算方法については後に説明する。
【0016】
図3は、仮説情報の一例を示す図である。仮説はログデータを基に生成される。例えば、
図3の1行目には、「性別=男性∧アクセス回数≧20回∧居住地=北海道」の場合にCVが発生するという仮説の重要度が20であることが示されている。なお、仮説に対する重要度は、CVが発生する可能性が高いほど大きくなる。
【0017】
変数情報143は、変数ごとの重要度である。
図4は、変数情報の一例を示す図である。例えば、
図4の1行目には、変数「残予算」の重要度が0.91であることが示されている。変数ごとの重要度は、仮説の重要度と同じ方法で計算されたものであってもよいし、仮説の重要度とは異なる方法で計算されたものであってもよい。例えば、変数ごとの重要度は、ロジスティック回帰等の既知の手法により計算されたものであってもよい。
【0018】
グループ情報144は、仮説をグループに分類するための分類条件である。
図5は、グループ情報の一例を示す図である。
図5に示すように、グループ情報144には、「グループID」及び「分類条件」が含まれる。
【0019】
制御部15は、生成部151、計算部152及び表示制御部153を有する。生成部151は、学習処理を行う。具体的には、生成部151は、データに含まれる複数の項目値に関する条件の組み合わせ、すなわち仮説を生成する。生成部151は、ログデータ141のような、説明変数と目的変数を持つデータから仮説を生成することができる。この場合、生成部151は、目的変数と目的変数に対応する1つ以上の説明変数に関する条件との組み合わせを仮説として生成する。
【0020】
ここで、予測装置10の生成部151による学習手法の一例を説明する。予測装置10は、学習により、仮説と重要度とを組み合わせたモデルを生成する。
図8と
図9は、学習手法を説明する説明図である。一般的に、深層学習(Deep Learning)は、人間の脳の神経回路の構造を模倣したニューラルネットワークを何層にも重ね、1つのモデルを洗練化することで精度向上を実現するので、人間が理解できない複雑なモデルである。一方、
図8に示すように、予測装置10は、データ項目を組み合わせて大量の仮説を抽出し、仮説(ナレッジチャンク(以下では、単に「チャンク」と記載する場合がある))の重要度を調整し高精度な分類モデルを構築する機械学習(例えば、Wide Learning)を実行する。ナレッジチャンクとは、人間が理解できる単純なモデルであり、入出力の関係として成立する可能性のある仮説を論理的な表現で記載したモデルである。
【0021】
具体的には、予測装置10は、入力データの全てのデータ項目の組み合わせパターンを仮説(チャンク)とし、各仮説に対する分類ラベルのヒット率で、その仮説の重要度を判断する。そして、予測装置10は、抽出した複数のナレッジチャンクとラベル(目的変数)に基づきモデルを構築する。この際に、予測装置10は、ナレッジチャンクを構成する項目が他のナレッジチャンクを構成する項目と重複が多い場合に、重要度が小さくなるように制御する。
【0022】
図9を用いて具体例を説明する。ここでは、ある商品やサービスを購入する顧客を判断したい時の例を考える。顧客データには、「性別」、「免許の有無」、「婚姻」、「年齢」、「年収」等様々な項目がある。これらの項目の全ての組み合わせを仮説とし、各仮説の重要度を考える。例えば、「「男」、「所有」、「既婚」」という項目を組み合わせた仮説に当てはまる顧客がデータの中に10人いる。この10人のうち、9人が商品等を購入していれば、「「男」、「所有」、「既婚」の人は購入」というヒット率の高い仮説とし、これをナレッジチャンクとして抽出する。なお、ここでは、例として、商品を購入したか否かを二値で表したものをラベル、すなわち目的変数としている。
【0023】
一方、「「男」、「所有」」という項目を組み合わせた仮説に当てはまる顧客がデータの中に100人いる。この100人のうち60人しか商品等を購入してない場合、購入するヒット率が60%となり、閾値(例えば80)未満であることから、「「男」、「所有」の人は購入」というヒット率の低い仮説とし、ナレッジチャンクとして抽出しない。
【0024】
また、「「男」、「未所有」、「未婚」」という項目を組み合わせた仮説に当てはまる顧客がデータの中に20人いる。この20人のうち18人が商品等を未購入の場合、未購入であるヒット率が90%となり、閾値(例えば80)以上であることから、「「男」、「未所有」、「未婚」の人は未購入」というヒット率の高い仮説とし、ナレッジチャンクとして抽出する。
【0025】
このようにして、予測装置10は、購入を支持するナレッジチャンクや未購入を支持するナレッジチャンクを数千万や数億個取り出し、モデルの学習を実行する。このように学習されたモデルは、特徴の組み合わせを仮説(チャンク)として列挙し、各仮説には確からしさを示す尤度の一例である重要度が付加され、入力データに出現する仮説の重要度の総和がスコアとなり、スコアが閾値以上であれば正例と出力する。
【0026】
すなわち、スコアとは、その状態の確からしさを示す指標であり、各モデル生成されるチャンク(仮説)のうち、属する特徴をすべて満たすチャンクの重要度の合算値である。例えば、チャンクAに「重要度:20,特徴(A1、A2)」、チャンクBに「重要度:5,特徴(B1)」、チャンクCに「重要度:10,特徴(C1、C2)」が対応付けられている状態で、ユーザログに行動(A1、A2、B1、C1)が存在したとする。このとき、チャンクAとチャンクBの特徴がすべて出現していることになるので、スコアは「20+5=25」となる。また、ここでの特徴とは、ユーザの行動等が該当する。
【0027】
図10から
図14を用いて、生成部151による具体的なモデルの生成方法を説明する。
図10は、変数とデータの関係を説明する説明図である。ここで、
図10に示すように、ログデータ141の各説明変数に関する条件には、A、B、C及びDの4つがあるものとする。また、Aの否定を
-A(Aの直上に-)のように表す。例えば、Aが「残り予算が存在」という条件を表している場合、
-Aは、「残り予算が存在しない」という条件を表す。また、例えば、Bが「クリック数≧100」という条件を表している場合、
-Bは、「クリック数<100」という条件を表す。
【0028】
また、P
1、P
2、P
3、P
4、N
1、N
2、N
3は、ログデータ141に含まれるデータであって、目的変数と説明変数の条件とを対応付けたデータを表す。ここでは、P
iは目的変数の値が「上げ」であるデータを表し、P
jは目的変数の値が「下げ」であるデータを表すものとする(ただし、i及びjは任意の整数)。なお、
図2に示すように、ログデータ141において、目的変数の値には「上げ」、「下げ」の他に「価格維持」が存在するが、ここでは、目的変数の値が「上げ」又は「下げ」の2種類であるものとして説明する。また、以降説明では、「上げ」を+、「下げ」を-と表現する場合がある。
【0029】
まず、
図11に示すように、生成部151は、P
1、P
2、P
3、P
4、N
1、N
2、N
3に含まれる説明変数のそれぞれについて、取り得る値の組み合わせを網羅的に列挙する。
図11は、仮説の生成を説明する説明図である。ここで、取り得る値は、*(使用しない)、1(使用する)、0(条件の否定を使用する)である。
【0030】
なお、生成部151は、組み合わせる説明変数の数が所定の数以下となるように制限してもよい。例えば、生成部151は、A~Dの4つの説明変数の場合、組み合わせる説明変数の数を2以下とするように制限してもよい。この場合、生成部151は、4つの説明変数のうち*(使用しない)とするものを少なくとも2つ組み合わせる。説明変数の数が増加すると(例えば1000個)、組み合わせの数は爆発的に増加する。このため、制限により、列挙する組み合わせの数の増加を事前に抑止できる。
【0031】
そして、生成部151は、列挙した組み合わせがP1、P2、P3、P4、N1、N2、N3のいずれであるかを分類し、また、特定の条件を満たす有効な組み合わせであるか否かを判定する。例えば、特定の条件は、説明変数の条件が、ログデータ141のデータに合致する回数が所定値以上であることである。この場合、生成部151は、条件のうち、データと合致する回数が所定値以上である条件の組み合わせを生成することができる。
【0032】
図11の例では、生成部151は、A~Dの4つの説明変数の全てが*である組み合わせC01、
-Cである組み合わせC04、CD(C及びDが1、かつA及びBが*)である組み合わせC09等を列挙する。
【0033】
図11に示すように、生成部151は、P
1、P
2、P
3、P
4、N
1、N
2、N
3の説明変数を基に、組み合わせC01~C09のそれぞれに該当するデータを列挙する。例えば、生成部151は、組み合わせC02に該当するデータとして、P
2、N
1、N
2を列挙する。この場合、組み合わせC02について列挙されたデータには、目的変数が+であるデータ(P
2)と目的変数が-であるデータ(N
1、N
2)とが混在している。このため、組み合わせC02は、目的変数が+であるか-であるかを正しく説明する仮説としての可能性が低い。その結果、生成部151は、組み合わせC02を有効な仮説として採用しない。
【0034】
一方、生成部151は、組み合わせC08に該当するデータとして、N1、N2を列挙する。この場合、組み合わせC08について列挙されたデータには、目的変数が-であるデータ(N1、N2)のみが存在する。このため、生成部151は、組み合わせC08を有効な仮説として採用する。
【0035】
また、生成部151は、異なる目的変数が混在している場合であっても、混在の割り合いに応じて組み合わせを有効な仮説として採用してもよい。例えば、ある組み合わせに対応するデータの例えば80%以上の目的変数が+であれば、生成部151は当該組み合わせを有効な仮説として採用するようにしてもよい。
【0036】
また、生成部151は、ある組み合わせの特殊ケースに該当する組み合わせを仮説から除外する。例えば、
図11の組み合わせC05及びC06は、組み合わせC04の特殊ケースである。これは、組み合わせC05及びC06が、組み合わせC04にリテラルを付加したものに過ぎないからである。
【0037】
そして、生成部151は、
図12に示す組み合わせを仮説として採用する。
図12は、仮説の生成を説明する説明図である。すなわち、生成部151は、組み合わせC01、C02、C03、C04a、C07、C08、C09を仮説として採用する。なお、組み合わせC04aは、
-Cを満たす組み合わせのうち、C04の特殊ケースを省略したものである。
【0038】
図13は、仮説の生成を説明する説明図である。
図13は、
図11及び
図12の内容をカルノー図で表したものである。
図13に示すように、生成部151は、A(B、C、Dは*(使用しない))の組み合わせ(S31)、
-A(B、C、Dは*(使用しない))の組み合わせ(S32)…の順に組み合わせを変更して有効な組み合わせを検討する(S31~S35…)。
【0039】
ここで、S33の-Cの組み合わせには、目的変数が+であるデータ(P1、P3、P4)が該当する。すなわち、S33では、+のクラスに分類されるデータ(P1、P3、P4)の数又は割合が所定の値以上である。よって、生成部151は、S33の-Cの組み合わせを+のクラスに分類する有効な組み合わせ(仮説)と判定する。なお、以下の処理では、-Cにリテラルを加える組み合わせは除外する。
【0040】
次に、生成部151は、3つの説明変数を*(使用しない)とする全ての組み合わせの検討後に、2つの説明変数を*(使用しない)とする組み合わせの検討を開始する(S34)。ここで、S35のA-Bの組み合わせでは、目的変数が+である訓練データ(P1、P2)が該当する。すなわち、S35では、+のクラスに分類される訓練データ(P1、P2)の数又は割合が所定の値以上である。よって、生成部151は、S35のA-Bの組み合わせを+のクラスに分類する有効な組み合わせ(仮説)と判定する。
【0041】
図14は、生成された仮説の一例を示す説明図である。
図14に示すように、生成部151は、P
1、P
2、P
3、P
4、N
1、N
2、N
3から、分類結果が+又は-となる仮説H1~H11を生成し、生成した仮説を仮説情報142として記憶部14に格納する。
【0042】
仮説H1~H11のそれぞれは、各データの分類結果が+又は-となることについて正しく説明していることを要件とする独立した仮説である。よって、仮説H2と、仮説H6のように、相互には矛盾した仮説が存在する場合がある。
【0043】
計算部152は、学習済みのモデルを用いて、組み合わせごとの、データにおける共起性の度合いである重要度を計算する。例えば、計算部152は、各仮説の重要度をロジスティック回帰により計算する。
図15は、ロジスティック回帰による重要度の計算を説明する説明図である。計算部152は、
図15に示すモデル式にログデータ141を適用し、最適な係数β
1~β
11を計算する。計算部152は、仮説情報142の重要度を計算した係数で更新する。
【0044】
このとき、各仮説の重要度は、ログデータ141における共起性が大きいほど大きくなる。また、重要度は、各説明変数の条件が満たされるときの目的変数の尤もらしさということができる。このため、計算部152は、組み合わせごとに、条件が満たされることに対する目的変数の尤度を、重要度として計算する。
【0045】
本実施例において、モデルは、グループごとに、テストデータの説明変数から得られるスコアを基に、CVの有無を予測することができる。ここで、CVの有無は、ユーザによる商品の購入行動又は購入行動につながる所定の行動の有無ということができる。例えば、モデルは、スコアがプラスである場合にCVが発生する(CV)と予測し、スコアがマイナスの場合にCVが発生しない(not CV)と予測する。
【0046】
つまり、生成部151は、ユーザの特徴情報とユーザが商品に対してCVしたか否かを示す情報とを対応付けたデータを学習データとして、ユーザの特徴情報に応じたユーザのCVの有無を予測するモデルを生成する。
【0047】
計算部152は、学習済みのモデルを使って、CVの有無及びデータ数から購入行動又は所定の行動の発生率である予測発生率(以降、予測CV率)、購入行動又は所定の行動の発生数である予測発生数(以降、予測CV数)を計算する。
図16は、予測について説明する説明図である。
図16に示すように、計算部152は、グループ単位のスコアの平均から予測CV率及び予測CV数を計算する。さらに、
図17に示すように、計算部152は、グループ1と同様に、他のグループについても予測CV率を計算する。
図17は、予測について説明する説明図である。
【0048】
表示制御部153は、入力欄に対応するグループのユーザの特徴情報、入力欄に入力された予算金額、商品の広告ページに対する予測クリック数、モデルを用いて算出される予測CV率に基づいて算出される予測CV数を、予算金額と対応付けて表示部に表示する。出力部13は、表示部の一例である。
【0049】
図18に示すように、表示制御部153は、入力欄、予測クリック数、予測CV数を予測結果表示画面として表示する。
図18は、予測結果表示画面の一例を示す図である。
【0050】
図18の予測CV率は、計算部152が学習済みのモデルを用いて計算した値である。計算部152は、モデルに、グループのユーザの特徴情報を入力して得られたCVの有無を基に予測CV率を計算する。表示制御部153は、計算部152によって計算された予測CV率に基づいて算出される予測CV数を表示する。例えば、予測CV数は、例えば、予測クリック数×予測CV率により計算される。
【0051】
なお、予測クリック数は、実績クリック率及び予算配分から計算される。入力部12は、特徴情報に共通部分を有するユーザのグループと対応付けて表示部に表示された入力欄への予算金額の入力を受け付ける。そして、表示制御部153は、各行に、入力された予算金額に応じた予測クリック数及び予測CV数を表示する。表示制御部153は、予算金額が変更されるたびに、予測クリック数及び予測CV数を更新して表示する。
【0052】
例えば、
図18の例では、グループ1の実績クリック率は1円あたり「3」である。このため、予算配分が「1000円」であれば、表示制御部153は、「3×1000」により、予測クリック数を「3000」と計算する。
【0053】
さらに、表示制御部153は、広告ページに対するクリック数の実績値に基づく予測クリック数に基づいて算出される予測CV数を表示する。例えば、表示制御部153は、予測クリック数×予測CV率を予測CV数として計算し、表示する。
【0054】
予測結果表示画面は、Webページであってもよいし、表計算ソフトのテーブルであってもよいし、専用のアプリケーションであってもよい。例えば、
図18において予算配分の列の各セルは、ユーザが数値を入力可能なテキストボックスである。また、予算配分以外の列の各セルは、表示のみを行う。
【0055】
例えば、グループ1の予算配分のセルに「1000」が入力されたタイミング、又は当該セルからカーソルが離れたタイミングで、表示制御部153は、予測クリック数に「3000」を表示し、予測CV数に「1000」を表示する。また、グループ4の予算配分のセルは空欄であるため、表示制御部153は、グループ4の予測クリック数及び予測CV数のセルを空欄にしておく。また、予算配分のセルに入力した値が削除された場合、表示制御部153は、当該削除されたセルに対応する予測クリック数及び予測CV数のセルを空欄にする。
【0056】
[処理の流れ]
図19を用いて、予測装置10による処理の流れを説明する。
図19は、実施例1に係る抽出処理の流れを示すフローチャートである。
図19に示すように、まず、予測装置10は、学習データを用いてCV予測モデルを生成する(ステップS101)。そして、予測装置10は、モデルを使ってグループごとの予測CV率を計算する(ステップS102)。
【0057】
さらに、予測装置10は、予算配分の入力を受け付ける(ステップS103)。そして、予測装置10は、予測クリック数と予測CV率から求めた予測CV数を表示する(ステップS104)。
【0058】
[効果]
これまで説明してきたように、予測装置10は、ユーザの特徴情報とユーザによる商品の購入行動又は購入行動につながる所定の行動の有無を示す情報とを対応付けたデータを学習データとしてモデルを生成する。モデルは、ユーザの特徴情報に応じたユーザの購入行動又は所定の行動の有無を予測する。予測装置10は、特徴情報に共通部分を有するユーザのグループと対応付けて表示部に表示された入力欄への予算金額の入力を受け付ける。予測装置10は、入力欄に対応するグループのユーザの特徴情報、入力欄に入力された予算金額、商品の広告ページに対する予測クリック数、予測発生率に基づいて算出される、予測発生数を、予算金額と対応付けて表示部に表示する。このため、実施例によれば、予算配分に指定に応じてグループごとの予測CV数を計算し表示するので、予算配分の最適化を効率化することができる。
【0059】
また、予測装置10は、モデルに、グループのユーザの特徴情報を入力して得られたCVの有無を基に予測CV率を計算する。予測装置10は、計算した予測CV率に基づいて算出される予測CV数を表示する。このように、予測装置10は、予測CV数だけでなく、予測CV率を表示することができる。
【0060】
予測装置10は、広告ページに対するクリック数の実績値に基づく予測クリック数に基づいて算出される予測CV数を表示する。これにより、より精度良く予測CV数を得ることが可能になる。
【0061】
また、説明変数は、
図4等に示すものに限られない。例えば、生成部151は、ユーザの、広告ページへの初回アクセス時から経過時間を含む特徴情報に応じたユーザのCVの有無を予測するモデルを生成する。つまり、説明変数には、広告ページへの初回アクセス日時、広告ページへの2回目以降のアクセス日時、広告ページへのアクセス周期等が含まれていてもよい。これは、例えば、広告ページへの初回アクセスからある程度時間を置いて、再度当該広告ページへアクセスしCVに至るユーザが存在するためである。
【0062】
また、表示制御部153が表示する項目は、
図18に示すものに限られない。例えば、表示制御部153は、
図18の項目のうち、実績CV率、実績クリック率及び予測CV率を非表示にしてもよい。また、表示制御部153は、
図18の項目に加え、予算1円当たりの予測CV数の変動率を表示してもよい。
[システム]
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。また、実施例で説明した具体例、分布、数値等は、あくまで一例であり、任意に変更することができる。
【0063】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部又は一部を、各種の負荷や使用状況等に応じて、任意の単位で機能的又は物理的に分散・統合して構成することができる。さらに、各装置にて行われる各処理機能は、その全部又は任意の一部が、CPU及び当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
【0064】
[ハードウェア]
図20は、ハードウェア構成例を説明する図である。
図20に示すように、予測装置10は、通信インタフェース10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、
図20に示した各部は、バス等で相互に接続される。
【0065】
通信インタフェース10aは、ネットワークインタフェースカード等であり、他のサーバとの通信を行う。HDD10bは、
図1に示した機能を動作させるプログラムやDBを記憶する。
【0066】
プロセッサ10dは、
図1に示した各処理部と同様の処理を実行するプログラムをHDD10b等から読み出してメモリ10cに展開することで、
図1等で説明した各機能を実行するプロセスを動作させる。すなわち、このプロセスは、予測装置10が有する各処理部と同様の機能を実行する。具体的には、プロセッサ10dは、生成部151、計算部152及び表示制御部153と同様の機能を有するプログラムをHDD10b等から読み出す。そして、プロセッサ10dは、生成部151、計算部152及び表示制御部153等と同様の処理を実行するプロセスを実行する。プロセッサ10dは、例えば、CPU、MPU、ASIC等のハードウェア回路である。
【0067】
このように予測装置10は、プログラムを読み出して実行することで分類方法を実行する情報処理装置として動作する。また、予測装置10は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、予測装置10によって実行されることに限定されるものではない。例えば、他のコンピュータ又はサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
【0068】
このプログラムは、インターネット等のネットワークを介して配布することができる。また、このプログラムは、ハードディスク、フレキシブルディスク(FD)、CD-ROM、MO(Magneto-Optical disk)、DVD(Digital Versatile Disc)等のコンピュータで読み取り可能な記録媒体に記録され、コンピュータによって記録媒体から読み出されることによって実行することができる。
【符号の説明】
【0069】
10 予測装置
11 通信部
12 入力部
13 出力部
14 記憶部
15 制御部
141 ログデータ
142 仮説情報
143 変数情報
144 グループ情報
151 生成部
152 計算部
153 表示制御部