(58)【調査した分野】(Int.Cl.,DB名)
URL毎に、ターゲットユーザ群がアクセスした第1の確率と、非ターゲットユーザ群がアクセスした第2の確率とが、所定条件を満たす当該URLを、前記センサURLとして決定するセンサURL決定手段と
してコンピュータを機能させることを特徴とする請求項1から3のいずれか1項に記載のプログラム。
【発明の概要】
【発明が解決しようとする課題】
【0007】
前述した従来技術は、各ユーザにおける時系列の行動履歴(アクセス履歴)を用いている。一方で、予測目標行動に至るまでの様々な関連行動を考慮したものではない。
本願の発明者らは、予測目標行動に至るであろう関連行動に基づいて、潜在対象ユーザを推定すべきではないか、と考えた。
【0008】
そこで、本発明は、URLのアクセス履歴を用いて、予測対象行動に至るであろう潜在対象ユーザを推定するプログラム、装置及び方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
本発明によれば、予測対象行動に至るであろう潜在対象ユーザを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
ユーザ毎に、アクセスしたURLを蓄積するアクセス履歴蓄積手段と、
予測対象行動に関連する複数のセンサURLを登録したセンサURL登録手段と
して機能させ、
学習段階として、
予測対象行動が、指定されたターゲットURLへのアクセスである場合、当該ターゲットURLにアクセスした(正例)か否か(負例)を分類条件とし、
アクセス履歴蓄積手段を用いて、分類条件に対して、正例となるターゲットユーザ群と、負例となる非ターゲットユーザ群とに分類するユーザ群分類手段と、
正例となるターゲットユーザ毎に対応付けた、各センサURLのアクセス回数と、負例となる非ターゲットユーザ毎に対応付けた、各センサURLのアクセス回数とを入力して学習する機械学習エンジンと
して機能させ、
推定段階として、
機械学習エンジンは、推定対象ユーザについて各センサURLのアクセス回数を入力し、正例類似スコアを出力し、
正例類似スコアが所定閾値以上となる推定対象ユーザを、潜在対象ユーザとして推定する潜在対象ユーザ推定手段と
してコンピュータを機能させることを特徴とする。
本発明のプログラムにおける他の実施形態によれば、
推定対象ユーザに対して、複数のターゲットURLそれぞれについて学習段階及び推定段階を実行し、ターゲットURL毎に正例類似スコアを推定し、
推定対象ユーザの端末へ、ターゲットURL毎に各ターゲットURLに基づく広告情報を配信する広告情報配信手段と、
ターゲットURL毎に、広告情報に対して推定対象ユーザの反応操作有り/無しを検知する広告反応検知手段と、
推定対象ユーザについて、ターゲットURL毎における正例類似スコア及び広告反応有り/無しに基づいて、広告反応有りと無しとの回帰係数を、正例受容スコアとして算出する正例受容スコア算出手段と
して更に機能させ、
潜在対象ユーザ推定手段は、正例受容スコアを重み付けて算出した正例類似スコアを用いて、潜在対象ユーザを推定する
ようにコンピュータを機能させることも好ましい。
本発明によれば、予測対象行動に至るであろう潜在対象ユーザを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
ユーザ毎に、アクセスしたURLを蓄積するアクセス履歴蓄積手段と、
予測対象行動に関連する複数のセンサURLを登録したセンサURL登録手段と
して機能させ、
学習段階として、
予測対象行動が、指定された検索キーによって検索されたURLへのアクセスである場合、当該検索キーによって検索されたURLにアクセスした(正例)か否か(負例)を分類条件とし、又は、
予測対象行動が、ユーザ毎に行動履歴が記録された中で、指定された行動である場合、当該行動をした(正例)か否か(負例)を分類条件とし、
アクセス履歴蓄積手段を用いて、分類条件に対して正例となるターゲットユーザ群と、負例となる非ターゲットユーザ群とに分類するユーザ群分類手段と、
正例となるターゲットユーザ毎に対応付けた、各センサURLのアクセス回数と、負例となる非ターゲットユーザ毎に対応付けた、各センサURLのアクセス回数とを入力して学習する機械学習エンジンと
して機能させ、
推定段階として、
機械学習エンジンは、推定対象ユーザについて各センサURLのアクセス回数を入力し、正例類似スコアを出力し、
正例類似スコアが所定閾値以上となる推定対象ユーザを、潜在対象ユーザとして推定する潜在対象ユーザ推定手段と
してコンピュータを機能させることを特徴とする。
【0010】
本発明のプログラムにおける他の実施形態によれば、
URL毎に、ターゲットユーザ群がアクセスした第1の確率と、非ターゲットユーザ群がアクセスした第2の確率とが、所定条件を満たす当該URLを、センサURLとして決定するセンサURL決定手段と
してコンピュータを機能させることも好ましい。
【0011】
本発明のプログラムにおける他の実施形態によれば、
センサURL決定手段は、第1の確率と第2の確率とのオッズ比が所定閾値以上となるURLを、センサURLとして決定する
ようにコンピュータを機能させることも好ましい。
【0016】
本発明によれば、予測対象行動に至るであろう潜在対象ユーザを推定する推定装置であって、
ユーザ毎に、アクセスしたURLを蓄積するアクセス履歴蓄積手段と、
予測対象行動に関連する複数のセンサURLを登録したセンサURL登録手段と
を有し、
学習段階として、
予測対象行動が、指定されたターゲットURLへのアクセスである場合、当該ターゲットURLにアクセスした(正例)か否か(負例)を分類条件とし、
予測対象行動が、指定された検索キーによって検索されたURLへのアクセスである場合、当該検索キーによって検索されたURLにアクセスした(正例)か否か(負例)を分類条件とし、又は、
予測対象行動が、ユーザ毎に行動履歴が記録された中で、指定された行動である場合、当該行動をした(正例)か否か(負例)を分類条件とし、
アクセス履歴蓄積手段を用いて、分類条件に対して正例となるターゲットユーザ群と、負例となる非ターゲットユーザ群とに分類するユーザ群分類手段と、
正例となるターゲットユーザ毎に対応付けた、各センサURLのアクセス回数と、負例となる非ターゲットユーザ毎に対応付けた、各センサURLのアクセス回数とを入力して学習する機械学習エンジンと
を有し、
推定段階として、
機械学習エンジンは、推定対象ユーザについて各センサURLのアクセス回数を入力し、正例類似スコアを出力し、
正例類似スコアが所定閾値以上となる推定対象ユーザを、潜在対象ユーザとして推定する潜在対象ユーザ推定手段と
を有することを特徴とする。
【0017】
本発明によれば、予測対象行動に至るであろう潜在対象ユーザを推定する装置の推定方法であって、
装置は、
ユーザ毎に、アクセスしたURLを蓄積するアクセス履歴蓄積部と、
予測対象行動に関連する複数のセンサURLを登録したセンサURL登録部と、
機械学習エンジンと
を有し、
装置は、学習段階として、
予測対象行動が、指定されたターゲットURLへのアクセスである場合、当該ターゲットURLにアクセスした(正例)か否か(負例)を分類条件とし、
予測対象行動が、指定された検索キーによって検索されたURLへのアクセスである場合、当該検索キーによって検索されたURLにアクセスした(正例)か否か(負例)を分類条件とし、又は、
予測対象行動が、ユーザ毎に行動履歴が記録された中で、指定された行動である場合、当該行動をした(正例)か否か(負例)を分類条件とし、
アクセス履歴蓄積部を用いて、分類条件に対して正例となるターゲットユーザ群と、負例となる非ターゲットユーザ群とに分類する第11のステップと、
機械学習エンジンを用いて、正例となるターゲットユーザ毎に対応付けた、各センサURLのアクセス回数と、負例となる非ターゲットユーザ毎に対応付けた、各センサURLのアクセス回数とを入力して学習する第12のステップと
を実行し、
装置は、推定段階として、
機械学習エンジンを用いて、推定対象ユーザについて各センサURLのアクセス回数を入力し、正例類似スコアを出力する第21のステップと、
正例類似スコアが所定閾値以上となる推定対象ユーザを、潜在対象ユーザとして推定する第22のステップと
を実行することを特徴とする。
【発明の効果】
【0018】
本発明のプログラム、装置及び方法によれば、URLのアクセス履歴を用いて、予測対象行動に至るであろう潜在対象ユーザを推定することができる。
【発明を実施するための形態】
【0020】
以下、本発明の実施の形態について、図面を用いて詳細に説明する。
【0021】
図1は、予測目標行動と関連行動との関係を表す説明図である。
【0022】
マーケティング分析として、予測目標行動を「ターゲットURL」へのアクセスとし、関連行動を「センサURL」へのアクセスとして表現する。ここで、センサURLとは、ターゲットURLへアクセスするに至るであろうとして、予め登録されたものである。例えば、ターゲットURLが「A社製の自動車aのホームページ」である場合、関連URLは、「自動車の比較サイトのホームページ」のようなものである。
【0023】
図1によれば、ターゲットURLを中心として、そのターゲットURLに関連するセンサURLと、それ以外のURLとが表されている。
また、各ユーザについて、アクセス履歴として、ターゲットURLにアクセスしたターゲットユーザ群と、アクセスしていない非ターゲットユーザ群とに分類する。
【0024】
ターゲットURLにアクセスしたユーザ群は、そのターゲットURLへ到達するために、様々な関連URLにアクセスしている。このとき、その関連URLにアクセスしたユーザ群は、高い確率でターゲットURLにアクセスすることが想定できる。即ち、ターゲットURLにアクセスしたユーザ群が、関連URLにアクセスする傾向を学習することができれば、推定対象ユーザが、関連URLへアクセスする傾向から、ターゲットURLにアクセスする確率を推定することができる。
本発明によれば、ターゲットURLにアクセスする確率が高い潜在対象ユーザを推定するために、あえて、その関連URLにアクセスする確率が高いユーザを推定しようとしている。
【0025】
図2は、本発明における推定装置の機能構成図である。
【0026】
本発明の推定装置1は、URLのアクセス履歴を用いて、予測目標行動に至るであろう関連行動に基づいて潜在対象ユーザを推定する。
図2によれば、推定装置1は、アクセス履歴蓄積部101と、センサURL登録部102とを有する。
【0027】
[アクセス履歴蓄積部101]
アクセス履歴蓄積部101は、ユーザ(ID)毎に、アクセスしたURLを対応付けて蓄積したものである。
[ユーザID]<->[URL]
001 http://www.aaa.com
002 http://www.bbb.com
003 http://www.aaa.com
002 http://www.ccc.com
001 http://www.aaa.com
・・・・・・・・・・・・・・・・・・
【0028】
[センサURL登録部102]
センサURL登録部102は、予測対象行動に関連する複数のセンサURLを登録したものである。
センサURLは、予測対象行動(例えばターゲットURLへのアクセス)に関連するページを公開するURLであって、オペレータによって予め登録されたものであってもよい。具体的には、後述するセンサURL決定部14によって決定されたものであってもよい。
【0029】
尚、ターゲットURLやセンサURLは、URL全体そのものに限られず、ドメイン名のみであってもよいし、クラスタリングに基づくカテゴリ名であってもよい。
【0030】
推定装置1は、<学習段階>として、ユーザ群分類部11と、機械学習エンジン12と、センサURL決定部14とを有する。また、<推定段階>として、機械学習エンジン12と、潜在対象ユーザ推定部13とを有する。
これら機能構成部は、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。また、これら機能の処理の流れは、装置における推定方法としても理解できる。
【0031】
<学習段階>
[ユーザ群分類部11]
ユーザ群分類部11は、アクセス履歴蓄積部101を用いて、分類条件に対して正例となるターゲットユーザ群と、負例となる非ターゲットユーザ群とに分類する。
【0032】
ここで、「分類条件」とは、正例/負例に分類するために条件であって、以下のように様々に規定することができる。
(条件1)指定されたターゲットURLにアクセスしたか否か
例えば指定されたターゲットURLの「A社製の自動車aのホームページ」にアクセスした(正例)か否か(負例)
(条件2)指定された検索キーによって検索されたURLをターゲットURLとしてアクセスしたか否か
例えば指定された検索キー「A社」によって検索されたURL「A社製の自動車aのホームページ」をターゲットURLとしてアクセスした(正例)か否か(負例)
(条件3)ユーザ毎に行動履歴が記録されており、指定された行動をしたか否か
例えばユーザ毎の行動履歴の中に、「自動車発表会に参加」という行動履歴が記録されている(正例)か否か(負例)
【0033】
[センサURL決定部14]
センサURL決定部14は、URL毎に、ターゲットユーザ群がアクセスした第1の確率と、非ターゲットユーザ群がアクセスした第2の確率とが、所定条件を満たす当該URLを、センサURLとして決定する。
【0034】
具体的には、センサURL決定部14は、第1の確率と第2の確率とのオッズ比が所定閾値以上となるURLを、センサURLとして決定する。
「オッズ比(Odds ratio)」とは、ある事象の起こりやすさを2つの群で比較して表す統計学的尺度である。ある事象の起こる確率pに対して、以下のように表される。
Odds=p/(1−p)、Odds≧0
ある事象について、第1の群における事象発生確率pと、第2の群における事象発生確率qとのオッズ比は、以下のように表される。
{p/(1−p)}/{q/(1−q)}
オッズ比=1ということは、事象発生確率が両群で同じということであり、1より大きい(又は小さい)とは、その事象が第1の群(又は第2の群)でより発生しやすいことを意味する。
【0035】
例えば、100人のアクセス履歴について、例えば以下のように算出される。
ターゲットユーザ群が当該センサURLにアクセスした人数=80人
Odds=80/(100−80)=4
非ターゲットユーザ群が当該センサURLにアクセスした人数=20人
Odds=20/(100−20)=0.25
オッズ比=4/0.25=16
【0036】
URL毎に、オッズ比を算出し、そのオッズ比が、所定閾値以上、又は、上位一定数となる当該URLを、センサURLとして決定する。
【0037】
図3は、
図2の機械学習エンジンの入出力データを表す説明図である。
【0038】
[機械学習エンジン12(学習段階)]
機械学習エンジン12は、学習段階として、ユーザ群分類部11から出力された以下のデータを入力する。
正例となるターゲットユーザ毎における各センサURLのアクセス回数
負例となる非ターゲットユーザ毎における各センサURLのアクセス回数
具体的には、ユーザ毎に、各センサURLを要素して、アクセス回数を要素値とした、ベクトルのような構成データが、機械学習エンジン12に入力される。
センサURL:[URL1][URL2][URL3]・・・・・[URLn]
ターゲットユーザ1: 1 0 2 ・・・・・・0
ターゲットユーザ2: 0 1 0 ・・・・・・2
・・・・:・・・・・・・・・・・・・・・・
非ターゲットユーザm: 0 1 0 ・・・・・・1
・・・・:・・・・・・・・・・・・・・・・
【0039】
機械学習エンジン12は、教師あり学習(Supervised learning)に基づくものである。教師データx及びy(二値分類問題)を対応付けて入力し、x及びyのデータ間の写像関数を近似的に学習する。これによって、未知データxを入力することよって予測データyを得ることができる。具体的には、サポートベクタマシンやニューラルネットワークなどを用いることができる。
【0040】
<推定段階>
[機械学習エンジン12(推定段階)]
機械学習エンジン12は、推定対象ユーザについて各センサURLのアクセス回数を入力する。
センサURL:[URL1][URL2][URL3]・・・・・[URLn]
推定対象ユーザ: 2 1 1 ・・・・・・0
そして、機械学習エンジン12は、正例類似スコアを出力する。
「正例類似スコア」とは、推定対象ユーザについて、予測目標行動(正例)に至るであろうスコアである。スコアは、一般的な機械学習エンジンから出力される確率値(スコア)である。
【0041】
[潜在対象ユーザ推定部13]
潜在対象ユーザ推定部13は、正例類似スコアが所定閾値以上となる推定対象ユーザを、潜在対象ユーザとして推定する。
具体的には、正例類似スコアが70%以上となる推定対象ユーザを、潜在対象ユーザとして推定する。
【0042】
図4は、本発明における受容反応学習段階を有する推定装置の機能構成図である。
【0043】
図4によれば、予測対象行動を、例えば広告配信によってユーザにレコメンド(推奨)した際に、各ユーザが、その予測対象行動を起こすか否かの行動生起確率に基づいて、潜在対象ユーザを推定しようとするものである。
【0044】
例えば、過去に広告配信(レコメンド)によってお得な経験をしたユーザは、その後の広告配信に興味を示し、高い受容性を持つの対し、逆に、過去に不快な経験をしたユーザは、広告配信に全く興味を示さず、低い受容性しか持たない。
【0045】
前述した
図2及び
図3の実施形態によれば、ユーザ自ら行動したアクセス履歴に基づいて予測対象行動を起こすか否かの生起確率を算出しようとしているが、
図4の実施形態によれば、レコメンドに対するユーザの受容性に基づいて予測対象行動を起こすか否かの生起確率を算出しようとしている。
即ち、予測対象行動に対して適した潜在対象ユーザであっても、そのユーザがレコメンドに対する受容性が低い場合、潜在対象ユーザとなり得ないためである。
【0046】
図4によれば、
図2の推定装置1と比較して、受容反応学習段階として、広告情報配信部15と、広告反応検知部16と、正例受容スコア算出部17と、正例受容スコア記憶部18とを更に有する。これら機能構成部も、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
【0047】
図4によれば、推定対象ユーザに対して、複数のターゲットURLそれぞれについて学習段階を実行し、機械学習エンジン12は、ターゲットURL毎に、異なる学習モデルを構築する。
その上で、異なるターゲットURLの学習モデル毎に、1人の推定対象ユーザにおけるセンサURLのアクセス履歴を入力して、推定段階を実行する。これによって、機械学習エンジン12は、ターゲットURL毎に、正例類似スコアを推定する。これらターゲットURL及び正例類似スコアは、潜在対象ユーザ推定部13へ出力される。
[ターゲットURL] <-> [正例類似スコア]
http://www.trg1.com <-> 60%
http://www.trg2.com <-> 50%
http://www.trg3.com <-> 30%
【0048】
[広告情報配信部15]
広告情報配信部15は、推定対象ユーザの端末へ、ターゲットURL毎に各ターゲットURLに基づく広告情報を配信する。
例えばターゲットURLが記述された広告情報を、推定対象ユーザの端末へ、電子メールやメッセージで送信するものであってもよい。
【0049】
[広告反応検知部16]
広告反応検知部16は、ターゲットURL毎に、広告情報に対して推定対象ユーザの反応操作有り/無しを検知する。
反応操作としては、例えばURLに対するタップ操作や、電子メール(又はメッセージ)の返信操作がある。反応操作は、ユーザの端末から推定装置1へ直接的に通知されるものに限られず、アクセス履歴として収集されたものであってもよい。
【0050】
ここで、広告情報配信部15は、ターゲットURL自体を広告情報に記述するのではなく、推定装置1へのリダイレクト要求に基づくURLを記述するものであってもよい。これによって、ユーザが、そのURLをタップすることによって、リダイレクト要求が推定装置1の広告反応検知部16へ送信される。広告反応検知部16は、ターゲットURLを含むリダイレクト応答を、ユーザの端末へ返信する。これによって、ユーザの広告反応を検知することができる。
【0051】
広告反応検知部16は、ユーザ毎に、受容反応を記憶する。
[ターゲットURL] <-> [正例類似スコア] <-> [広告反応]
http://www.trg1.com <-> 60% <-> 1(有り)
http://www.trg2.com <-> 50% <-> 1(有り)
http://www.trg3.com <-> 30% <-> 0(無し)
【0052】
[正例受容スコア算出部17]
正例受容スコア算出部17は、推定対象ユーザについて、ターゲットURL毎における正例類似スコアa及び広告反応有り/無しr(=0,1)に基づいて、広告反応有りと無しとの回帰係数Iを、正例受容スコアとして算出する。具体的には、以下のように単なる乗算であってもよい。
I=Σ
i(a*r)/j
i:ターゲットURL
a:正例類似スコア
r:広告反応有り/無しr(=0,1)
j:広告反応有りの数
【0053】
前述した正例受容スコア記憶部18によれば、正例受容スコアは、例えば以下のように算出される。
I=(60%*1+50%*1+30%*0)/2=55%
即ち、この推定対象ユーザについて、正例受容スコア=55%と算出される。
【0054】
[正例受容スコア記憶部18]
正例受容スコア記憶部18は、推定対象ユーザ毎に、正例受容スコアを記憶する。
【0055】
図5は、正例受容スコアに基づいて潜在対象ユーザを推定する推定装置の機能構成図である。
【0056】
図5によれば、受容反応推定段階として、正例受容スコア算出部17を更に有する。これら機能構成部も、装置に搭載されたコンピュータを機能させるプログラムを実行することによって実現される。
【0057】
潜在対象ユーザ推定部13は、推定対象ユーザにおけるセンサURLへのアクセス履歴を用いて、ターゲットURLに対して算出された正例類似スコアに、推定対象ユーザの正例受容スコアを重み付ける。
A=a*R
a:正例類似スコア
R:正例受容スコア
そして、潜在対象ユーザ推定部13は、正例類似スコアが所定閾値以上となる推定対象ユーザを、潜在対象ユーザとして推定する。
【0058】
以上、詳細に説明したように、本発明のプログラム、装置及び方法によれば、URLのアクセス履歴を用いて、予測対象行動に至るであろう潜在対象ユーザを推定することができる。また、本発明によれば、ユーザ群に対する正例/負例の条件に対して、機械学習エンジンにおける正例類似スコアに、推定対象ユーザにおける正例受容スコアを重み付けることによって、広告対象ユーザ群を高い精度で絞り込むことができ、広告効果を向上させることが期待できる。
【0059】
前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。