(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-06
(45)【発行日】2023-11-14
(54)【発明の名称】解析装置
(51)【国際特許分類】
G06Q 30/02 20230101AFI20231107BHJP
【FI】
G06Q30/02
(21)【出願番号】P 2022528531
(86)(22)【出願日】2021-05-19
(86)【国際出願番号】 JP2021019033
(87)【国際公開番号】W WO2021246178
(87)【国際公開日】2021-12-09
【審査請求日】2022-11-22
(31)【優先権主張番号】P 2020096117
(32)【優先日】2020-06-02
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】392026693
【氏名又は名称】株式会社NTTドコモ
(74)【代理人】
【識別番号】100088155
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100121980
【氏名又は名称】沖山 隆
(74)【代理人】
【識別番号】100128107
【氏名又は名称】深石 賢治
(72)【発明者】
【氏名】井上 義隆
(72)【発明者】
【氏名】篠田 謙司
(72)【発明者】
【氏名】廣川 典昭
(72)【発明者】
【氏名】川崎 愛実
【審査官】鈴木 和樹
(56)【参考文献】
【文献】国際公開第2016/135784(WO,A1)
【文献】国際公開第2017/158798(WO,A1)
【文献】特開2016-006606(JP,A)
【文献】Manami Kawasaki et al.,A Recommendation System by Collaborative Filtering Including Information and Characteristics on User and Items,2017 IEEE Symposium Series on Computational Intelligence (SSCI),米国,IEEE,2017年12月01日,pp.1-8
【文献】今井拓司,専門家の意図とが分かる模倣学習を逆強化学習でNECが単発の意志決定問題から実用へ,NIKKEI Robotics,日本,日経BP,2019年09月10日,第51号,pp.22-26
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 - 99/00
(57)【特許請求の範囲】
【請求項1】
商品についてのユーザの購入履歴と広告主に関連づけられた広告についての前記ユーザの閲覧履歴と
を参照して、前記商品を購入した前記ユーザが前記広告主に関連づけられた前記広告を閲覧している場合に当該ユーザを共通ユーザとしてカウントし、カウントされた前記共通ユーザ
の数を介して互いにリンクした前記商品と前記広告主との関係
情報を
作成する関係構築部と、
前記関係構築部によって
作成された
前記関係情報を構成する前記商品及び前記広告主を
同時にクラスタリングすることによって、前記商品及び前記広告主が所属するクラスタを生成するクラスタリング部と
、を備える、解析装置。
【請求項2】
前記商品と前記広告主との前記関係情報は、前記共通ユーザの数を要素とする行列であって、
前記クラスタリング部は、前記行列について行列分解を利用して分解することにより、前記商品及び前記広告主が所属する前記クラスタを生成する、請求項1に記載の解析装置。
【請求項3】
前記クラスタリング部は、前記関係構築部によって作成された前記行列について、行及び列のいずれか一方を前記クラスタとする前記商品についての行列と行及び列のいずれか他方を前記クラスタとする前記広告主についての行列とに分解し、分解された前記商品についての行列と前記広告主についての行列とにおいて要素が最大値となっている前記クラスタに前記商品及び前記広告主を所属させる、請求項2に記載の解析装置。
【請求項4】
機械学習によって構築された購買予測モデルを用いて、前記クラスタに属する前記商品を購入しやすい前記ユーザを導出する推論部をさらに備える、請求項1
~3のいずれか一項に記載の解析装置。
【請求項5】
前記推論部によって導出された前記商品を購入しやすい前記ユーザの数と当該商品の情報とを出力するレコメンド部をさらに備える、請求項
4に記載の解析装置。
【請求項6】
前記購買予測モデルは、前記ユーザの属性情報を説明変数とし、前記クラスタに属する前記商品によって構成される商品群の購入履歴を目的変数とする、請求項
4又は請求項
5に記載の解析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の一側面は、解析装置に関する。
【背景技術】
【0002】
特許文献1には、集計システムが開示されている。当該集計システムは、第1の集計装置と、第2の集計装置とを含む。第1の集計装置は、消費者の分類ID(Identifier)を取得する分類ID取得部と、商品又はサービスの購入品IDを取得する購入品ID取得部と、分類IDと購入品IDとを集計し、購入品IDに対する分類IDの分布を示す第1の集計情報を分析する分析部と、を有する。第2の集計装置は、消費者の所定の行動の頻度に基づき、分類IDを生成する分類ID生成部と、第1の集計装置から入力した第1の集計情報と、分類IDとに基づき、購入品IDに対する所定の行動の頻度の分布を示す第2の集計情報を計算する計算部と、を有する。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ユーザに対して広告を配信する場合、どのような属性を有するユーザに広告を配信するかが、当該広告の効果に影響を与え得る。例えば、特定の商品を購入しやすいユーザに対して、当該特定の商品に関連する他の商品の広告を配信する場合、その広告には一定の効果が期待できる。そこで、当該他の商品の広告主に対して、特定の商品を購入しやすいユーザに広告を配信することがレコメンドされ得る。しかしながら、商品同士の関連性は、人の知見に基づいて判断されるため、必ずしも適切ではないユーザが配信先となることが考えられる。
【0005】
本開示の一側面は、広告主に対して適切なユーザをレコメンドできる解析装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の一側面に係る解析装置は、商品についてのユーザの購入履歴と広告主に関連づけられた広告についてのユーザの閲覧履歴とに基づいて、共通ユーザ数をリンクとして商品と広告主との関係を構築する関係構築部と、関係構築部によって構築された商品と広告主との関係に基づいて、商品及び広告主を纏めてクラスタにクラスタリングするクラスタリング部とを、備え、共通ユーザ数は、互いにリンクされた商品及び広告主について、当該商品を購入し、且つ、当該広告主に関連づけられた広告を閲覧した、ユーザの数である。
【0007】
上記解析装置では、共通ユーザ数をリンクとして構築された商品及び広告主の関係に基づいて、商品と広告主とを纏めてクラスタリングしているため、人の知見を排除して、商品と広告主とを関連づけることができる。この場合、ある商品を購入したユーザは、当該商品と共にクラスタリングされた広告主の広告に興味があると推定することが可能となる。したがって、広告主に対して、広告の配信に適したユーザをレコメンドできる。
【発明の効果】
【0008】
本開示の一側面によれば、広告主に対して適切なユーザをレコメンドできる解析装置を提供することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、一例の解析装置を含む解析システムの構成を示すブロック図である。
【
図2】
図2は、ユーザマスタデータベースの構成の一例を示す図である。
【
図3】
図3は、商品マスタデータベースの構成の一例を示す図である。
【
図4】
図4は、広告主マスタデータベースの構成の一例を示す図である。
【
図5】
図5は、広告マスタデータベースの構成の一例を示す図である。
【
図6】
図6は、商品購入ログデータベースの構成の一例を示す図である。
【
図7】
図7は、広告接触ログデータベースの構成の一例を示す図である。
【
図8】
図8は、関係構築部によって構築された商品と広告主との関係を示す図である。
【
図9】
図9は、関係構築部によって構築された行列の分解例を示す図である。
【
図10】
図10は、データ作成部によって作成される目的変数の例を示す図である。
【
図11】
図11は、推論部による推定結果の一例を示す図である。
【
図12】
図12は、解析装置の動作フローの一例を示すフロー図である。
【
図13】
図13は、解析装置のハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0010】
以下、添付図面を参照して、例示的な実施形態について詳細に説明する。なお、図面の説明において同一又は相当要素には同一符号を付し、重複する説明を省略する。
【0011】
図1は、一例に係る解析装置10を含む解析システム1の機能構成を示す図である。解析システム1は、解析装置10と、データベース装置50と、を備えている。解析装置10は、例えば、データベース装置50と通信可能に構成されたサーバ装置であってよい。解析装置10は、1台の装置によって構成されてもよいし、複数台の装置によって構成されてもよい。
【0012】
解析装置10は、クラスタリング装置20と、スコアリング装置30と、レコメンド装置40とを含む。解析装置10は、データベース装置50に記憶されたユーザの商品購入履歴と広告閲覧履歴とに基づいて構築された、共通ユーザ数をリンクとする商品及び広告主の関係に基づいて、商品と広告主とを纏めてクラスタリングする。一例の解析装置10は、広告主に対して、広告を送信するのに相応しいユーザ群を広告の送信対象としてレコメンドしてもよい。以下、詳細に説明する。
【0013】
データベース装置50は、ユーザマスタデータベース51と、商品マスタデータベース52と、広告マスタデータベース53と、広告主マスタデータベース54と、商品購入ログデータベース55と、広告接触ログデータベース56とを含む。
【0014】
図2は、ユーザマスタデータベースの構成の一例を示す図である。ユーザマスタデータベース51は、解析装置10の解析対象となるユーザに関する情報として、各ユーザの属性を示す情報を格納している。例えば、ユーザマスタデータベース51は、各ユーザを識別するための識別子であるユーザIDと、ユーザIDに関連付けられたユーザの属性を示す情報とを格納している。ユーザの属性を示す情報は、例えば、性別、年齢等であってよい。さらに、ユーザの属性を示す情報は、居住地、職業等を含んでもよい。
【0015】
図3は、商品マスタデータベースの構成の一例を示す図である。商品マスタデータベース52は、解析装置10の解析対象となる商品に関する情報を格納している。例えば、商品マスタデータベース52は、各商品を識別するための識別子である商品IDと、商品IDに関連づけられた商品に関する情報とを格納している。商品に関する情報は、例えば、商品名等であってよい。さらに、商品に関する情報は、商品のジャンル(タイプ)、商品の価格等を含んでもよい。
【0016】
図4は、広告主マスタデータベースの構成の一例を示す図である。広告主マスタデータベース54は、解析装置10の解析対象となる広告主に関する情報を格納している。例えば、広告主マスタデータベース54は、各広告主を識別するための識別子である広告主IDと、広告主IDに関連づけられた広告主に関する情報とを格納している。広告主に関する情報は、例えば、企業名、広告部門における担当者のメールアドレス等であってよい。さらに、広告主に関する情報は、広告主である企業の資本金、広告費予算等を含んでもよい。
【0017】
図5は、広告マスタデータベースの構成の一例を示す図である。広告マスタデータベース53は、解析装置10の解析対象となる広告主の広告に関する情報を格納している。例えば、広告マスタデータベース53は、各広告を識別するための識別子である広告IDと、広告IDに関連づけられた広告に関する情報とを格納している。広告に関する情報は、例えば、広告の内容、広告の広告主ID等であってよい。広告の内容は、広告の対象が商品の場合には、商品名であってよい。また、広告の対象がサービス等である場合、広告の内容は、サービス等を示すキーワードであってもよい。広告マスタデータベース53における広告主IDは、広告主マスタデータベース54における広告主IDと共通していてよい。さらに、広告に関する情報は、広告の対象のジャンル、広告の対象の価格、広告画像データ等を含んでもよい。なお、一例において、広告とは、ユーザによる閲覧が直接的又は間接的に確認できる形態の広告であり、特定のユーザをターゲットとして配信等することが可能な広告をいう。一例として、広告は、WEBバナー広告、動画広告等であってよい。
【0018】
図6は、商品購入ログデータベースの構成の一例を示す図である。商品購入ログデータベース55は、解析装置10の解析対象となるユーザによる商品の購入履歴を示す情報を格納している。例えば、商品購入ログデータベース55は、各ユーザを識別するための識別子であるユーザIDと、ユーザIDに関連付けられた商品購入履歴を示す情報とを格納している。商品購入ログデータベース55におけるユーザIDは、ユーザマスタデータベース51におけるユーザIDと共通していてよい。購入履歴を示す情報は、例えば、商品の購入日時、商品ID等であってよい。一例において、購入履歴は、小売店に導入されているPOS(Point Of Sales)システムに登録されたデータに基づいて格納されてもよい。商品購入ログデータベース55における商品IDは、商品マスタデータベース52における商品IDと共通していてよい。さらに、商品購入履歴を示す情報は、購入店舗の情報、購入価格等を含んでもよい。
【0019】
図7は、広告接触ログデータベースの構成の一例を示す図である。広告接触ログデータベース56は、解析装置10の解析対象となるユーザによる購入の閲覧履歴を示す情報を格納している。例えば、広告接触ログデータベース56は、ユーザIDに関連づけられたスマートフォン等の情報端末装置によって広告が閲覧されたときに、閲覧に関連する情報を情報端末装置から取得してもよい。広告の閲覧は、ユーザによる能動的なWEBバナー広告のクリックであってもよいし、受動的な広告の表示、動画広告の視聴等でもよい。例えば、広告接触ログデータベース56は、各ユーザを識別するための識別子であるユーザIDと、ユーザIDに関連付けられた広告閲覧履歴を示す情報とを格納している。広告接触ログデータベース56におけるユーザIDは、ユーザマスタデータベース51におけるユーザIDと共通していてよい。閲覧履歴を示す情報は、例えば、広告の接触(閲覧)日時、広告ID等であってよい。広告接触ログデータベース56における広告IDは、広告マスタデータベース53における広告IDと共通していてよい。さらに、広告閲覧履歴を示す情報は、画面上の広告の配置、直前に閲覧したWEBページのURL等を含んでもよい。
【0020】
クラスタリング装置20は、関係構築部21と、クラスタリング部22とを有する。関係構築部21は、商品についてのユーザの購入履歴と複数の広告主にそれぞれ関連づけられた広告についてのユーザの閲覧履歴とに基づいて、共通ユーザ数をリンクとしてそれぞれの商品とそれぞれの広告主との関係を構築する。共通ユーザ数は、互いにリンクされた商品及び広告主について、当該商品を購入し、且つ、当該広告主に関連づけられた広告を閲覧した、ユーザの数である。
【0021】
図8は、関係構築部21によって構築された商品と広告主との関係の一例を示す図である。図に示す商品と広告主との関係の一例は、商品IDを行にとり、広告主IDを列にとった行列として示されている。行列の要素は、共通ユーザ数となっている。すなわち、商品と広告主とは、共通ユーザ数によって互いにリンクされている。一例の関係構築部21は、広告マスタデータベース53、商品購入ログデータベース55及び広告接触ログデータベース56を参照して、商品及び広告主のセットごとに、当該商品を購入し、且つ、当該広告主に関連づけられた広告を閲覧したユーザの数を要素としてカウントする。
【0022】
例えば、
図6及び
図7に示されるように、ユーザIDがU001であるユーザは、商品IDがP003である商品を購入し、且つ、広告IDがA001である広告を閲覧している。この場合、ユーザIDがU001であるユーザは、広告IDがA001である広告の広告主、すなわち広告主IDがC001である広告主と商品IDがP003である商品とをリンクする共通ユーザ数(要素)にカウントされる。
図8に示す例では、広告主IDがC001である広告主と商品IDがP003である商品との共通ユーザ数が200となっている。すなわち、商品IDがP003である商品を購入し、且つ、広告主IDがC001である広告主の広告を閲覧したユーザが200人いたことが分かる。
【0023】
なお、
図7に示すように、ユーザIDがU001であるユーザは、広告IDがA002である広告、及び、広告IDがA003である広告も閲覧している。
図5に示すように、広告IDがA002である広告の広告主は、広告IDがA001である広告の広告主と共通する。この場合、ユーザIDがU001であるユーザが重複してカウントされることはない。一方、広告IDがA003である広告主は、広告IDがA001である広告の広告主と異なっており、C002という広告主IDを有する。この場合には、ユーザIDがU001であるユーザは、広告主IDがC002である広告主と商品IDがP003である商品とをリンクする共通ユーザ数(要素)にもカウントされてよい。
【0024】
クラスタリング部22は、関係構築部21によって構築されたそれぞれの商品とそれぞれの広告主との関係に基づいて、商品及び広告主を纏めてクラスタにクラスタリングする。一例において、クラスタリング部22は、行列分解を利用して行列を分解することによって、商品及び広告主を纏めてクラスタにクラスタリングする。行列分解は、非負値行列因子分解(Non-negative matrix factorization)等の公知の手法であってよい。なお、クラスタリングの手法として、他の手法、例えばGraph (Node) Embedding等を用いてもよい。
【0025】
図9は、関係構築部21によって構築された行列の分解例を示す図である。すなわち、
図9は、
図8に示される行列の分解例である。クラスタリング部22は、
図9に示すように、関係構築部21によって構築された行列を、商品IDを行にとった行列Wと広告主IDを列にとった行列Hとに分解する。すなわち、行列Wと行列Hとの積は、関係構築部21によって構築された行列に近似することになる。行列Wの列及び行列Hの行は、生成されるクラスタのIDである。クラスタ数は、解析装置10の管理者によって設定されるパラメータである。クラスタ数は、管理者によって任意に決定され得る。一例において、クラスタ数は、商品数未満であり、且つ、広告主数未満である。
【0026】
説明の簡単のために、
図8において関係構築部21によって構築された行列が、5行5列であるものとして説明する。すなわち、商品IDはP001~P005、広告主IDはC001~C005のみであると仮定する。また、クラスタIDはK001~K002のみであると仮定する。クラスタリング部22は、生成された行列Wにおいて、商品IDごとに横方向に数値(要素)を見て、最大値を持つクラスタIDに商品IDの商品を所属させる。また、クラスタリング部22は、生成された行列Hにおいて、広告主IDごとに縦方向に数値を見て、最大値を持つクラスタIDに広告主IDの広告主を所属させる。すなわち、
図9の例では、クラスタK001:{P002,P003,C001,C003,C005}及びクラスタK002:{P001,P004,P005,C002,C004}が生成される。この結果は、解析対象のユーザ全体として、商品IDがP002,P003である商品を購入した場合、広告主IDがC001,C003,C005である広告主の広告を閲覧する傾向があり、商品IDがP001,P004,P005である商品を購入した場合、広告主IDがC002,C004の広告主の広告を閲覧する傾向があることを示す。なお、クラスタリング部22は、所定の閾値以上の値を持つクラスタIDに商品IDの商品を所属させてもよい。また、クラスタリング部22は、所定の閾値以上の値を持つクラスタIDに広告主IDの広告主を所属させてもよい。
【0027】
スコアリング装置30は、データ作成部31と、学習部32と、推論部33とを有する。スコアリング装置30は、クラスタリング装置20によって導出されたクラスタを構成する商品群を購入しやすいユーザを推定する。
【0028】
データ作成部31は、クラスタを構成する商品群を購入しやすいユーザを推定するための購買予測モデルの構築に用いられるデータ(目的変数)を作成する。一例のデータ作成部31は、クラスタリング装置20によって導出されたクラスタのデータと、商品購入ログデータベース55のデータとに基づいて、目的変数を含むデータを作成する。
図10は、データ作成部31によって作成される目的変数の例を示す図である。
図10では、クラスタK001に対応して作成される目的変数が例示されているが、データ作成部31は、他のクラスタについても同様に目的変数を作成する。
図10に示すように、データ作成部31は、商品購入ログデータベース55に出現するそれぞれのユーザIDについて、クラスタK001に所属する商品群{P002,P003}のいずれかについて購入経験がある場合に、目的変数として1を付与する。また、データ作成部31は、商品購入ログデータベース55に出現するそれぞれのユーザIDについて、クラスタK001に所属する商品群{P002,P003}のいずれについても購入経験がない場合に、目的変数として0を付与する。また、データ作成部31は、商品購入ログデータベース55に出現しないユーザIDについて、目的変数としてNULLを付与する。
【0029】
学習部32は、クラスタを構成する商品群を購入しやすいユーザを推定するための購買予測モデルを作成する。この購買予測モデルは、ユーザの属性情報を説明変数とし、一のクラスタを構成する商品(商品群)の購入履歴を目的変数とする。すなわち、購買予測モデルは、どのような属性を有するユーザがどのような商品群を購入しやすいかを予測するモデルであってよい。一例の学習部32は、ユーザマスタデータベース51から入力される各ユーザIDに対応する属性情報を説明変数として取得する。また、学習部32は、データ作成部31によって作成された目的変数を含むデータをデータ作成部31から取得する。学習部32は、取得された説明変数及び目的変数に基づいて、購買予測モデルを作成する。
【0030】
一例の学習部32は、重回帰分析に基づいて購買予測モデルを作成する。なお、学習部32は、重回帰分析に限らず、決定木、ロジスティック回帰、ランダムフォレスト、勾配ブースティング決定木等の公知の技術を用いて購買予測モデルを作成してもよい。例えば、学習部32は、パラメータα、β、γを用いて、重回帰分析のモデル式として、目的変数=α×{女性フラグ}+β×{20代フラグ}+γ×{30代フラグ}のような式を生成する。パラメータα、β、γは重回帰分析によって自動的に決定される。{女性フラグ}とは、ユーザが女性であれば「1」、そうでなければ「0」となるような説明変数である。同様に、{20代フラグ}とは、ユーザが20代であれば「1」、そうでなければ「0」となるような説明変数であり、{30代フラグ}とは、ユーザが30代であれば「1」、そうでなければ「0」となるような説明変数である。
【0031】
推論部33は、一のクラスタを構成する商品群及び広告主群について、機械学習によって構築された購買予測モデルを用いて、商品群を購入しやすいユーザを導出する。一例の推論部33は、クラスタリング部22によって生成されたそれぞれのクラスタに所属する商品群に関して、学習部32によって作成された購買予測モデルに基づいて、当該商品群を購入しやすいユーザを推定する。
図11は、推論部33による推定結果の一例を示す図である。
図11は、クラスタK001に属する商品群{P002,P003}を購入しやすいユーザを推定する推定結果である。この推定結果では、推定値が「1」に近いほど、商品群{P002,P003}を購入しやすいユーザ(すなわち商品購入予兆ユーザ)といえる。推論部33は、データ作成部31で作成された目的変数にかかわらず、全ユーザについての推定値を導出してもよい。
【0032】
レコメンド装置40は、レコメンド部41を有する。レコメンド部41は、推論部33によって導出された商品群の商品購入予兆ユーザの数と、当該商品群を構成する商品の情報と、当該商品群にクラスタリングされた広告主の情報と、を出力する。商品の情報は、商品マスタデータベース52から取得され得る。広告主の情報は、広告主マスタデータベース54から取得され得る。商品購入予兆ユーザは、例えば、所定の閾値以上の推定値を有するユーザであってよい。
【0033】
また、レコメンド装置40は、レコメンド部41によって出力された商品購入予兆ユーザの数とこれに対応する商品群に含まれる商品の情報とを商品群が属するクラスタに属する広告主の担当者のメールアドレスに送信してもよい。例えばクラスタK001について解析が実行された場合、レコメンド装置40は、商品P002及び商品P003の商品名と、当該商品の購入予兆ユーザの数とを、広告主C001,C003,C005の各担当者のメールアドレスに送信してもよい。
【0034】
図12は、解析装置10の動作フローの一例を示すフロー図である。解析装置10が広告主に対して適切なユーザをレコメンドする場合、まず、関係構築部21によって、共通ユーザ数をリンクとした商品と広告主との関係(一例では行列)が構築される(ステップS1)。続いて、クラスタリング部22によって、構築された商品と広告主との関係に基づいて、商品及び広告主が纏めてクラスタにクラスタリングされる(ステップS2)。続いて、データ作成部31によって、クラスタに属する商品(商品群)を購入しやすいユーザを推定するための購買予測モデルの構築に用いられるデータ(目的変数)が作成される(ステップS3)。続いて、学習部32によって、クラスタを構成する商品群を購入しやすいユーザを推定するための購買予測モデルが作成される(ステップS4)。続いて、推論部33によって、クラスタを構成する商品群の購入予兆ユーザが購買予測モデルに基づいて導出される(ステップS5)。続いて、レコメンド部41によって、推論部33で導出された商品群の購買予兆ユーザの数と、当該商品群を構成する商品の情報とが、当該商品群が所属するクラスタに所属する広告主に対してレコメンドされる(ステップS6)。なお、ステップS6では、広告主に対してレコメンドするための情報として、商品群の購買予兆ユーザの数と、当該商品群を構成する商品の情報とが出力されてもよい。続いて、ステップS2で導出された全てのクラスタについてのステップS3~ステップS6までの処理が終了されたかが判定され、終了していない場合(すなわち「NO」の場合)には、次のクラスタについてステップS3~ステップS6までの処理が実行される(ステップS7)。全てのクラスタについてステップS6までの処理が終了している場合(すなわと「YES」の場合)には、解析装置10による解析が終了する。
【0035】
以上説明した解析装置10では、共通ユーザ数をリンクとして構築された商品及び広告主の関係に基づいて、商品と広告主とを纏めてクラスタリングしているため、人の知見を排除して、商品群と広告主群とを関連づけることができる。この場合、ある商品群を購入したユーザは、当該商品群と共にクラスタリングされた広告主の広告に興味があると推定することが可能となる。したがって、広告主に対して、広告の配信に適したユーザをレコメンドできる。
【0036】
また、解析装置10は、一のクラスタを構成する商品群について、機械学習によって構築された購買予測モデルを用いて、当該商品群を購入しやすいユーザを導出する推論部を備えていてもよい。この購買予測モデルは、ユーザの属性情報を説明変数とし、一のクラスタを構成する商品群の購入履歴を目的変数とする。この構成では、複数の商品によって構成される商品群について、機械学習によって購買予測モデルを構築しているため、単体の商品を購入しやすいユーザを推定する場合に比べて、目的変数における正例の数を大きくすることができ、より精度の高い推定結果を得ることができる。
【0037】
また、解析装置10は、推論部33によって導出された商品を購入しやすいユーザの数と当該商品の情報とを出力するレコメンド部を備える。広告主に対して、商品群に含まれる商品の情報、及び、購入予兆ユーザの数をレコメンドすることで、広告主による広告出稿検討を容易にすることができる。
【0038】
なお、関係構築部21は、商品購入ログデータベース55及び広告接触ログデータベース56から、直近の時期(例えば過去数週間程度)の商品購入履歴及び広告閲覧履歴を取得してもよい。この場合、ユーザについての情報の鮮度が保たれることにより、広告のターゲットとしてより相応しいユーザを絞り込むことができる。
【0039】
また、データ作成部31においては、ユーザ一人当たりの購入回数が2以上の所定の閾値以上である場合に目的変数に1を付与し、閾値未満である場合に目的変数にゼロを付与してもよい。このように、閾値を設定することで、ユーザによる偶然の購入、興味の薄さ等を排除することができ、購買予測モデルの精度が向上し得る。
【0040】
また、レコメンド部41において、データ作成部31における目的変数が1であるユーザ群、すなわち実際に購入したことのあるユーザ群を商品購入予兆ユーザ群に含めてもよい。この場合、広告のターゲットとしてより相応しいユーザ群を構築することができる。
【0041】
なお、上記実施形態の説明に用いたブロック図は、機能単位のブロックを示している。これらの機能ブロック(構成部)は、ハードウェア及びソフトウェアの少なくとも一方の任意の組み合わせによって実現される。また、各機能ブロックの実現方法は特に限定されない。すなわち、各機能ブロックは、物理的又は論理的に結合した1つの装置を用いて実現されてもよいし、物理的又は論理的に分離した2つ以上の装置を直接的又は間接的に(例えば、有線、無線などを用いて)接続し、これら複数の装置を用いて実現されてもよい。機能ブロックは、上記1つの装置又は上記複数の装置にソフトウェアを組み合わせて実現されてもよい。
【0042】
機能には、判断、決定、判定、計算、算出、処理、導出、調査、探索、確認、受信、送信、出力、アクセス、解決、選択、選定、確立、比較、想定、期待、見做し、報知(broadcasting)、通知(notifying)、通信(communicating)、転送(forwarding)、構成(configuring)、再構成(reconfiguring)、割り当て(allocating、mapping)、割り振り(assigning)などがあるが、これらに限られない。
【0043】
例えば、本開示の一実施の形態における解析システム1(解析装置10、データベース装置50)は、本開示の方法を行うコンピュータとして機能してもよい。
図13は、本開示の解析システム1のハードウェア構成の一例を示す図である。上述の解析システム1は、物理的には、プロセッサ1001、メモリ1002、ストレージ1003、通信装置1004、入力装置1005、出力装置1006、バス1007などを含むコンピュータ装置として構成されてもよい。
【0044】
なお、以下の説明では、「装置」という文言は、回路、デバイス、ユニットなどに読み替えることができる。解析装置10のハードウェア構成は、
図1に示した各装置を1つ又は複数含むように構成されてもよいし、一部の装置を含まずに構成されてもよい。
【0045】
解析システム1における各機能は、プロセッサ1001、メモリ1002などのハードウェア上に所定のソフトウェア(プログラム)を読み込ませることによって、プロセッサ1001が演算を行い、通信装置1004による通信を制御したり、メモリ1002及びストレージ1003におけるデータの読み出し及び書き込みの少なくとも一方を制御したりすることによって実現される。
【0046】
プロセッサ1001は、例えば、オペレーティングシステムを動作させてコンピュータ全体を制御する。プロセッサ1001は、周辺装置とのインターフェース、制御装置、演算装置、レジスタなどを含む中央処理装置(CPU:Central Processing Unit)によって構成されてもよい。
【0047】
また、プロセッサ1001は、プログラム(プログラムコード)、ソフトウェアモジュール、データなどを、ストレージ1003及び通信装置1004の少なくとも一方からメモリ1002に読み出し、これらに従って各種の処理を実行する。プログラムとしては、上述の実施の形態において説明した動作の少なくとも一部をコンピュータに実行させるプログラムが用いられる。例えば、関係構築部21は、メモリ1002に格納され、プロセッサ1001において動作する制御プログラムによって実現されてもよく、他の機能ブロックについても同様に実現されてもよい。上述の各種処理は、1つのプロセッサ1001によって実行される旨を説明してきたが、2以上のプロセッサ1001により同時又は逐次に実行されてもよい。プロセッサ1001は、1以上のチップによって実装されてもよい。なお、プログラムは、電気通信回線を介してネットワークから送信されても良い。
【0048】
メモリ1002は、コンピュータ読み取り可能な記録媒体であり、例えば、ROM(Read Only Memory)、EPROM(Erasable Programmable ROM)、EEPROM(Electrically Erasable Programmable ROM)、RAM(Random Access Memory)などの少なくとも1つによって構成されてもよい。メモリ1002は、レジスタ、キャッシュ、メインメモリ(主記憶装置)などと呼ばれてもよい。メモリ1002は、本開示の一実施の形態に係る通信制御方法を実施するために実行可能なプログラム(プログラムコード)、ソフトウェアモジュールなどを保存することができる。
【0049】
ストレージ1003は、コンピュータ読み取り可能な記録媒体であり、例えば、CD-ROM(Compact Disc ROM)などの光ディスク、ハードディスクドライブ、フレキシブルディスク、光磁気ディスク(例えば、コンパクトディスク、デジタル多用途ディスク、Blu-ray(登録商標)ディスク)、スマートカード、フラッシュメモリ(例えば、カード、スティック、キードライブ)、フロッピー(登録商標)ディスク、磁気ストリップなどの少なくとも1つによって構成されてもよい。ストレージ1003は、補助記憶装置と呼ばれてもよい。上述の記憶媒体は、例えば、メモリ1002及びストレージ1003の少なくとも一方を含むデータベース、サーバその他の適切な媒体であってもよい。
【0050】
通信装置1004は、有線ネットワーク及び無線ネットワークの少なくとも一方を介してコンピュータ間の通信を行うためのハードウェア(送受信デバイス)であり、例えばネットワークデバイス、ネットワークコントローラ、ネットワークカード、通信モジュールなどともいう。
【0051】
入力装置1005は、外部からの入力を受け付ける入力デバイス(例えば、キーボード、マウス、マイクロフォン、スイッチ、ボタン、センサなど)である。出力装置1006は、外部への出力を実施する出力デバイス(例えば、ディスプレイ、スピーカー、LEDランプなど)である。なお、入力装置1005及び出力装置1006は、一体となった構成(例えば、タッチパネル)であってもよい。
【0052】
また、プロセッサ1001、メモリ1002などの各装置は、情報を通信するためのバス1007によって接続される。バス1007は、単一のバスを用いて構成されてもよいし、装置間ごとに異なるバスを用いて構成されてもよい。
【0053】
また、解析システム1は、マイクロプロセッサ、デジタル信号プロセッサ(DSP:Digital Signal Processor)、ASIC(Application Specific Integrated Circuit)、PLD(Programmable Logic Device)、FPGA(Field Programmable Gate Array)などのハードウェアを含んで構成されてもよく、当該ハードウェアにより、各機能ブロックの一部又は全てが実現されてもよい。例えば、プロセッサ1001は、これらのハードウェアの少なくとも1つを用いて実装されてもよい。
【0054】
以上、本実施形態について詳細に説明したが、当業者にとっては、本実施形態が本明細書中に説明した実施形態に限定されるものではないということは明らかである。本実施形態は、特許請求の範囲の記載により定まる本発明の趣旨及び範囲を逸脱することなく修正及び変更態様として実施することができる。したがって、本明細書の記載は、例示説明を目的とするものであり、本実施形態に対して何ら制限的な意味を有するものではない。
【0055】
本開示において説明した各態様/実施形態の処理手順、シーケンス、フローチャートなどは、矛盾の無い限り、順序を入れ替えてもよい。例えば、本開示において説明した方法については、例示的な順序を用いて様々なステップの要素を提示しており、提示した特定の順序に限定されない。
【0056】
入出力された情報等は特定の場所(例えば、メモリ)に保存されてもよいし、管理テーブルを用いて管理してもよい。入出力される情報等は、上書き、更新、又は追記され得る。出力された情報等は削除されてもよい。入力された情報等は他の装置へ送信されてもよい。
【0057】
判定は、1ビットで表される値(0か1か)によって行われてもよいし、真偽値(Boolean:true又はfalse)によって行われてもよいし、数値の比較(例えば、所定の値との比較)によって行われてもよい。
【0058】
本開示において説明した各態様/実施形態は単独で用いてもよいし、組み合わせて用いてもよいし、実行に伴って切り替えて用いてもよい。また、所定の情報の通知(例えば、「Xであること」の通知)は、明示的に行うものに限られず、暗黙的(例えば、当該所定の情報の通知を行わない)ことによって行われてもよい。
【0059】
ソフトウェアは、ソフトウェア、ファームウェア、ミドルウェア、マイクロコード、ハードウェア記述言語と呼ばれるか、他の名称で呼ばれるかを問わず、命令、命令セット、コード、コードセグメント、プログラムコード、プログラム、サブプログラム、ソフトウェアモジュール、アプリケーション、ソフトウェアアプリケーション、ソフトウェアパッケージ、ルーチン、サブルーチン、オブジェクト、実行可能ファイル、実行スレッド、手順、機能などを意味するよう広く解釈されるべきである。
【0060】
また、ソフトウェア、命令、情報などは、伝送媒体を介して送受信されてもよい。例えば、ソフトウェアが、有線技術(同軸ケーブル、光ファイバケーブル、ツイストペア、デジタル加入者回線(DSL:Digital Subscriber Line)など)及び無線技術(赤外線、マイクロ波など)の少なくとも一方を使用してウェブサイト、サーバ、又は他のリモートソースから送信される場合、これらの有線技術及び無線技術の少なくとも一方は、伝送媒体の定義内に含まれる。
【0061】
本開示において説明した情報、信号などは、様々な異なる技術のいずれかを使用して表されてもよい。例えば、上記の説明全体に渡って言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、チップなどは、電圧、電流、電磁波、磁界若しくは磁性粒子、光場若しくは光子、又はこれらの任意の組み合わせによって表されてもよい。
【0062】
また、本開示において説明した情報、パラメータなどは、絶対値を用いて表されてもよいし、所定の値からの相対値を用いて表されてもよいし、対応する別の情報を用いて表されてもよい。
【0063】
上述したパラメータに使用する名称はいかなる点においても限定的な名称ではない。さらに、これらのパラメータを使用する数式等は、本開示で明示的に開示したものと異なる場合もある。様々な情報要素は、あらゆる好適な名称によって識別できるので、これらの様々な情報要素に割り当てている様々な名称は、いかなる点においても限定的な名称ではない。
【0064】
本開示において使用する「に基づいて」という記載は、別段に明記されていない限り、「のみに基づいて」を意味しない。言い換えれば、「に基づいて」という記載は、「のみに基づいて」と「に少なくとも基づいて」の両方を意味する。
【0065】
本開示において使用する「第1の」、「第2の」などの呼称を使用した要素へのいかなる参照も、それらの要素の量又は順序を全般的に限定しない。これらの呼称は、2つ以上の要素間を区別する便利な方法として本開示において使用され得る。したがって、第1及び第2の要素への参照は、2つの要素のみが採用され得ること、又は何らかの形で第1の要素が第2の要素に先行しなければならないことを意味しない。
【0066】
本開示において、「含む(include)」、「含んでいる(including)」及びそれらの変形が使用されている場合、これらの用語は、用語「備える(comprising)」と同様に、包括的であることが意図される。さらに、本開示において使用されている用語「又は(or)」は、排他的論理和ではないことが意図される。
【0067】
本開示において、例えば、英語でのa, an及びtheのように、翻訳により冠詞が追加された場合、本開示は、これらの冠詞の後に続く名詞が複数形であることを含んでもよい。
【0068】
本開示において、「AとBが異なる」という用語は、「AとBが互いに異なる」ことを意味してもよい。なお、当該用語は、「AとBがそれぞれCと異なる」ことを意味してもよい。「離れる」、「結合される」などの用語も、「異なる」と同様に解釈されてもよい。
【符号の説明】
【0069】
10…解析装置、21…関係構築部、22…クラスタリング部、33…推論部、41…レコメンド部。