IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日本データサイエンス研究所の特許一覧

特開2024-2569情報処理装置、情報処理システム、情報処理方法、及びプログラム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024002569
(43)【公開日】2024-01-11
(54)【発明の名称】情報処理装置、情報処理システム、情報処理方法、及びプログラム
(51)【国際特許分類】
   G06Q 30/0202 20230101AFI20231228BHJP
【FI】
G06Q30/02 310
【審査請求】未請求
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022101837
(22)【出願日】2022-06-24
(71)【出願人】
【識別番号】519059340
【氏名又は名称】株式会社JDSC
(74)【代理人】
【識別番号】100141139
【弁理士】
【氏名又は名称】及川 周
(74)【代理人】
【識別番号】100145481
【弁理士】
【氏名又は名称】平野 昌邦
(74)【代理人】
【識別番号】100181722
【弁理士】
【氏名又は名称】春田 洋孝
(72)【発明者】
【氏名】杉崎 琢人
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB01
(57)【要約】
【課題】ダイレクトマーケティングにおける介入効果の予測精度を向上させること。
【解決手段】情報処理装置は、顧客情報および購買情報を取得する取得部と、キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得部が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習部と、前記将来の介入効果の予測値を、トレンドを用いて補正する予測部と、を備える。
【選択図】図2
【特許請求の範囲】
【請求項1】
顧客情報および購買情報を取得する取得部と、
キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得部が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習部と、
前記将来の介入効果の予測値を、トレンドを用いて補正する予測部と、
を備える情報処理装置。
【請求項2】
キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習部と、
前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測部と、
を備える情報処理装置。
【請求項3】
前記予測部は、前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータのサンプリング数と、前記キャンペーン介入した期間における前記ユーザごとの条件付き介入効果を示すデータのサンプリング数とを変化させて前記影響を抑制する、
請求項2に記載の情報処理装置。
【請求項4】
前記トレンドは、類似の実績をモデル化することで得られる予測値である、
請求項1または請求項2に記載の情報処理装置。
【請求項5】
前記トレンドは、類似の傾向を示す指標をモデル化することで得られる予測値である、
請求項1または請求項2に記載の情報処理装置。
【請求項6】
顧客情報および購買情報を取得する取得部と、
キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得部が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習部と、
前記将来の介入効果の予測値を、トレンドを用いて補正する予測部と、
を備える情報処理システム。
【請求項7】
キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習部と、
前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測部と、
を備える情報処理システム。
【請求項8】
情報処理装置のコンピュータが、
顧客情報および購買情報を取得する取得過程と、
キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得過程により取得された顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習過程と、
前記将来の介入効果の予測値を、トレンドを用いて補正する予測過程と、
を有する情報処理方法。
【請求項9】
情報処理装置のコンピュータが、
キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習過程と、
前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測過程と、
を有する情報処理方法。
【請求項10】
情報処理装置のコンピュータに、
顧客情報および購買情報を取得する取得ステップと、
キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得ステップにより取得された顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習ステップと、
前記将来の介入効果の予測値を、トレンドを用いて補正する予測ステップと、
を実行させるためのプログラム。
【請求項11】
情報処理装置のコンピュータに、
キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習ステップと、
前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測ステップと、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
ダイレクトマーケティングとは、企業が顧客と直接コミュニケーションを図りながら購入を働きかける手法である。例えば、ある百貨店が顧客にカタログ発行し、カタログ経由での注文を受注する。この場合、百貨店は、カタログ作成やその配布に必要とするコストと、カタログ経由で発生した売上、利益を比較することで、そのマーケティング施策に投下したコストに対してどの程度のリターンがあったかを定量的に計測することが可能である。
【0003】
ダイレクトマーケティング活動における損益分岐点の構造は、固定生産費用、変動生産費用、およびプロモーション費用に関連する。ダイレクトマーケティングにおける意思決定では、固定生産費と変動生産費との構造が所与である場合、自らの利益を最大化するようにプロモーション費用を決定する。一方で、プロモーション費用に関する正確な意思決定のためには、プロモーション費用が需要に及ぼす影響を把握している必要がある。プロモーション費用が需要に及ぼす影響は、そのキャンペーンにおけるターゲット、タイミング、クリエイティブ、オファー内容などにより変動する。そのため、ダイレクトマーケティング全体としては、プロモーション費用あたりの需要獲得を最大化するようなキャンペーンを企画しつつ、最終利益が最大化するようなプロモーション費用の総額を決定するという2つの意思決定要素から成り立つ。
【0004】
ここで、キャンペーンの対象とした場合のiROAS(incremental Return on Ad Spend:広告支出によって増加する収入)が顧客ごとに正確に算定できると仮定する。この場合、意思決定要素のうち、最適なターゲティングとプロモーション費用との総額は、一度に求めることが可能である。例えば、iROASが正となる顧客全てをキャンペーンの対象とし、その場合に必要な費用が最適なプロモーション費用の総額となる。
しかしながら、現実のダイレクトマーケティングにおいては、必ずしもそのような理想的意思決定が行われていない。主な要因としては次のようなものがある。
【0005】
(1)Upliftの予測
因果推論の根本的問題により、キャンペーンによる増幅効果(Uplift)を推定、予測するには困難が伴う。
【0006】
(2)消費者異質性の考慮
顧客一人一人によってキャンペーンによるUplift効果は異なるが、これを高精度で予測するためには、機械学習等の手法が必要となる。機械学習を活用する組織的ノウハウの無い場合は、RFM(Recency Frequency Monetary)ベースでのセグメンテーションなどを用いて消費者異質性を加味する方法が採用されていることが多い。ただし、この場合も多くはResponseベースでの異質性の予測に止まっている。ダイレクトマーケティングにUplift Modelingを活用し、Uplift効果における消費者異質性を加味した意思決定を行う先行研究は幾つか存在する。
【0007】
(3)時間的異質性の考慮
顧客毎にUplift効果が異なるだけでなく、キャンペーンの実施タイミングによってもUplift効果は異なる。介入時と非介入時におけるアウトカムの数値的変化を元に介入効果を推定する技術は、経済学分野を中心に数多く存在する。しかしながら、Uplift効果自体が時間とともに変動することを前提として、将来のUplift効果の予測からダイレクトマーケティングの意思決定を行う技術は、存在しない。
現実のダイレクトマーケティングにおいては、UpliftではなくResponseベースで季節ごとのキャンペーン結果の傾向を定量化し、季節ごとにRFMセグメントの異なる閾値を用いたり、前年同時期のキャンペーン結果を元にターゲットを選定するなどの方法により季節性やトレンドを極力反映させるように工夫したりする技術も存在する。
【0008】
(4)クリエイティブ・オファー内容によるUpliftへの影響の定量化
マーケティングの効果を事前に予測するには、ターゲットやそのタイミングだけでなく、どのようなオファー、クリエイティブが提示されるかによる影響も考慮する必要がある。一方で、顧客の反応をモデリングするには、オファー、クリエイティブなどの要素を定量的に示すことが難しい。オファーにおける対象商品が毎回異なる、クリエイティブが毎回異なるなどの性質を持つキャンペーンの予測は、モデルに含めることができないオファー・クリエイティブによる変動要因が大きいほど難易度が増大する。
【0009】
例えば、非特許文献1に記載の技術では、シミュレーションデータが一定の精度を示す。
【先行技術文献】
【非特許文献】
【0010】
【非特許文献1】Shu Li and Peter Buhlmann, Estimating heterogeneoustreatment effects in non-stationary time series with state-space models, December, 2018.
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、非特許文献1に記載の技術では、実データを用いた検証した場合に、将来トレンドの推定をする際に季節成分が消失してしまうことがある。このため、ダイレクトマーケティングにおけるトレンドを算出できないことがあった。また、季節成分の消失により介入効果の予測ができないことがあった。このように、ダイレクトマーケティングにおける介入効果の予測精度が十分でないという課題があった。
【0012】
本発明は、上記の課題を解決すべくなされたもので、その目的は、ダイレクトマーケティングにおける介入効果の予測精度を向上させることができる情報処理装置、情報処理システム、情報処理方法、およびプログラムを提供することにある。
【課題を解決するための手段】
【0013】
本発明の一態様は、上記課題を鑑みてなされたものであり、顧客情報および購買情報を取得する取得部と、キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得部が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習部と、前記将来の介入効果の予測値を、トレンドを用いて補正する予測部と、を備える情報処理装置である。
【0014】
また、本発明の一態様は、上記課題を鑑みてなされたものであり、キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習部と、前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測部と、を備える情報処理装置である。
【0015】
また、本発明の一態様は、上記課題を鑑みてなされたものであり、顧客情報および購買情報を取得する取得部と、キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得部が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習部と、前記将来の介入効果の予測値を、トレンドを用いて補正する予測部と、を備える情報処理システムである。
【0016】
また、本発明の一態様は、上記課題を鑑みてなされたものであり、キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習部と、前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測部と、を備える情報処理システムである。
【0017】
また、本発明の一態様は、上記課題を鑑みてなされたものであり、情報処理装置のコンピュータが、顧客情報および購買情報を取得する取得過程と、キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得部が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習過程と、前記将来の介入効果の予測値を、トレンドを用いて補正する予測過程と、を有する情報処理方法である。
【0018】
また、本発明の一態様は、上記課題を鑑みてなされたものであり、情報処理装置のコンピュータが、キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習過程と、前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測過程と、を有する情報処理方法である。
【0019】
また、本発明の一態様は、上記課題を鑑みてなされたものであり、情報処理装置のコンピュータに、顧客情報および購買情報を取得する取得ステップと、キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、前記取得部が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習ステップと、前記将来の介入効果の予測値を、トレンドを用いて補正する予測ステップと、を実行させるためのプログラムである。
【0020】
また、本発明の一態様は、上記課題を鑑みてなされたものであり、情報処理装置のコンピュータに、キャンペーン介入した期間と、前記キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習ステップと、前記キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測ステップと、を実行させるためのプログラムである。
【発明の効果】
【0021】
上記少なくとも一つの態様によれば、ダイレクトマーケティングにおける介入効果の予測精度を向上させることができる。
【図面の簡単な説明】
【0022】
図1】第1実施形態に係る情報処理システムの構成の一例を示す概略図である。
図2】本実施形態に係る情報処理装置の機能構成を示す概略ブロック図である。
図3】本実施形態に係るCCEUTの一例を示す概略図である。
図4】本実施形態に係るCCEPTAの一例を示す概略図である。
図5】本実施形態に係る顧客情報の構成の一例を示すテーブルである。
図6】本実施形態に係る購買情報の構成の一例を示すテーブルである。
図7】本実施形態に係るDM情報の構成の一例を示すテーブルである。
図8】本実施形態に係る送付先情報の構成の一例を示すテーブルである。
図9】本実施形態に係る情報処理装置のハードウェア構成を示す概略ブロック図である。
図10】本実施形態に係る学習処理の一例を示すフローチャートである。
図11】本実施形態に係る予測処理の一例を示すフローチャートである。
図12】本実施形態に係る予測処理の一例を示すフローチャートである。
図13】本実施形態に係る検証データの一例を示す図である。
図14】本実施形態に係る各共変量の分布の一例を示す図である。
図15】本実施形態に係る各共変量の分布の他の一例を示す図である。
図16】本実施形態に係る各共変量の分布の他の一例を示す図である。
図17】本実施形態に係る各共変量と潜在アウトカムの関係性の一例を示す図である。
図18】本実施形態に係る各個体の真の介入効果の時系列プロットの一例を示す図である。
図19】本実施形態に係る学習・予測期間のデータ諸元の一例を示す図である。
図20】本実施形態に係る各Policyでサンプリングされたデータの一例を示す図である。
図21】本実施形態に係る各Policyでのトレンドの一例を示す図である。
図22】本実施形態に係るサンプリングの検証結果の一例を示す図である。
図23】本実施形態に係るCalibration方式の検証結果の一例を示す図である。
【発明を実施するための形態】
【0023】
(第1実施形態)
以下、図面を参照して、第1実施形態について詳しく説明する。
【0024】
<情報処理システム>
図1は、第1実施形態に係る情報処理システムSysの一例を示す概略図である。
情報処理システムSysは、情報処理装置1と、企業Bと、ユーザU1、ユーザU2とを含む。情報処理装置1は、企業Bから顧客情報、購買情報、ダイレクトメッセージ(DM)情報、その他情報などの各種情報IDを受け付ける。情報処理装置1は、受け付けた各種情報IDに対応する情報に基づいて機械学習し、学習結果として、ダイレクトメッセージ等の送信先などの予測情報ODを出力する。
【0025】
企業Bは、予測情報ODに基づいて、ユーザにダイレクトメッセージを送信する。例えば、企業Bは、ユーザU1に対して商品紹介などのダイレクトメッセージDM1を送信する。また、企業BはユーザU2に対して商品紹介などのダイレクトメッセージDM2を送信する。これに対して、ユーザU1は、応答R1として商品の購入などを行わなかったとする。一方、ユーザU2は、応答R2として商品紹介のダイレクトメッセージDM2を受けて、商品の購入を行ったとする。
ダイレクトマーケティングにおいて、企業Bは、ダイレクトメッセージに対して購買などのアクションにつながるユーザU2のようなユーザに対してより多くのダイレクトメッセージを送付できれば、高い広告効果が得られる。
【0026】
情報処理装置1は、広告費用に対する需要獲得を最大化するようなキャンペーンを企画しつつ、最終利益が最大化するような広告費用の総額を決定する。また、情報処理装置1は、トレンドを考慮したユーザごとの条件付き介入効果の予測と将来の介入効果の予測とを行う。ここで、トレンドには、トレンド成分と季節成分とが含まれる。また、トレンドを考慮するとは、トレンドを用いて予測値の補正を行うことである。情報処理装置1は、介入効果の側に基づいて、ダイレクトメッセージの送付先やダイレクトメッセージの送付タイミングを予測する。換言すれば、情報処理装置1は、ダイレクトマーケティングにおける意思決定の一要素であるターゲティングの最適化を行い、広告効果が高い、つまり広告の内容への親和性が高いと見込まれるユーザを抽出するために、ユーザごとの条件付き介入効果の予測を行う。また、情報処理装置1は、親和性が高いと見込まれるユーザのみがダイレクトメッセージを受けられるように、ダイレクトメッセージの送付先を決定する。このため、情報処理装置1は、この最適化の核となるプロセスである介入効果の推定(Uplift Modeling)において、個人ごとの違い(消費者異質性)とタイミングによる違い(時間的異質性)の両者を共に考慮することで、より精度の高いUplift Modelingを行う。
【0027】
ここで、個人別に広告によるUpliftの多寡を予測した場合のUplift Modelの精度は、理想的には、真のUplift値と予測値の二乗誤差などで測定することが可能である。しかしながら、実キャンペーンにおいてUplift Modelの精度を評価・測定しようとする場合は、先述の因果推論の根本問題により、直接的に二乗誤差などを測定することが不可能である。このような実キャンペーンにおけるUplift Modelの精度評価には、AUUC(Area Under the Uplift Curve)などを用いることがある。しかしながら、本願における検証には、直接的に真のUplift値を知ることが可能な人工データを利用するため、通常の機械学習の評価に使われるようなMSE、MAEなどの指標を利用する。この場合、予想されるUplift値が、人工データの実際のUplift値に近いほど精度が高いとして評価する。
【0028】
ここで、顧客情報は、ユーザ名、氏名、住所、電話番号、メールアドレス、性別、年齢、世帯構成などを含むデータである。購買情報は、ユーザごとの購買履歴のデータであり、購入日、ジャンル、商品名、購買店などを含むデータである。DM情報は、ダイレクトメッセージごとのDM識別情報、ジャンル、依頼元、ターゲット、種別などを含むデータである。なお、顧客情報は、顧客の属性や顧客ごとの購買履歴等によってあらかじめグルーブ、サブグループに分類されていてもよい。
【0029】
また、ダイレクトメッセージは、宛名を指定して送付するメール、カタログや手紙・はがきなどの郵便送付、営業電話などである。不特定多数を対象とする新聞折り込みチラシ、無記名ダイレクトメール、エリアポスティング、屋外広告、雑誌広告、新聞広告、ラジオコマーシャル、テレビコマーシャル、インターネットコマーシャルなどはダイレクトメッセージに含まれないものとする。また、トレンドは、季節要素、時期要素、流行要素などの時限的傾向要素(成分)である。
【0030】
<情報処理装置>
図2は、本実施形態に係る情報処理装置1の一例を示す機能ブロック図である。
情報処理装置1は、制御部110と、記憶部130と、入力部140と、出力部150と、を含んで構成される。
【0031】
記憶部130は、例えば、ハードディスクドライブ、SSD、メモリなどの記憶装置である。記憶部130は、ファームウェアやアプリケーションプログラムなど、制御部110が実行するための各種プログラム、及び、制御部110が実行した処理の結果などを記憶する。
【0032】
制御部110は、中央演算装置(CPU)などのプロセッサである。制御部110は、例えば、入力部140から入力された入力情報と記憶部130が記憶する情報に基づいて、入力情報に対する出力情報を生成する。
具体的には、制御部110は、記憶部130に記憶された、購買情報と、DM情報と、送付先情報とを読み出し、読み出した情報に基づいて学習データセットを生成する。制御部110は、生成した学習データセットに基づいて個人別の条件付き介入効果を学習する。当該学習モデルは、例えば、Uplift Modelingを用いる。詳細は後述する。
【0033】
制御部110は、顧客情報、購買情報、DM情報、送付先情報などの統計に基づいて、ユーザごと、すなわち、個人別の条件付き介入効果(CATE)を推定する。また、制御部110は、Uplift値と類似の傾向を示すと考えられる指標の季節成分・トレンド成分をモデル化し、Uplift値の予測値を補正する。つまり、制御部110は、個人別の条件付き介入効果を推定し、また、将来の介入効果をCalibration Scoreとして予測することで、個人別のAdjusted CATEを予測する。制御部110は、予測したAdjusted CATEに基づいて、ダイレクトメッセージの送付先を決定する。
【0034】
入力部140は、例えば、キーボードやタッチパネルなどの入力装置である。入力部140は、ユーザ操作に基づく入力情報を受け付ける。入力部140は、受け付けた入力情報を制御部110に出力する。
【0035】
出力部150は、例えば表示部であり、制御部110から入力された出力情報を表示する。
【0036】
なお、入力部140、出力部150に代えて、または加えて通信部(不図示)によって、外部装置からの入力情報を受け付け、また、外部装置への出力情報を出力してもよい。
【0037】
制御部110について、より詳細に説明する。
【0038】
制御部110は、取得部111と、学習部112と、予測部113と、出力処理部114と、を含んで構成される。
取得部111は、入力部140を介して入力情報を取得する。また、取得部111は、記憶部130に記憶された各種情報を読み出して取得する。取得部111は、取得した情報を、学習部112、予測部113に出力する。
【0039】
学習部112は、取得部111が取得した情報、および記憶部130に記憶された情報に基づいて、機械学習する。具体的には、学習部112は、記憶部130に記憶された購買情報と、DM情報と、送付先情報とを読み出し、読み出した情報に基づいて学習データセットを生成する。学習部112は、生成した学習データセットに基づいて個人別の条件付き介入効果を学習する。ここで、個人別の条件付き介入効果の学習モデルには、Uplift Modelingを用いる。
【0040】
Uplift Modelingは、iROASを最大化するために個人ごとの介入効果をモデル化・予測するモデルである。本実施形態では、消費者異質性及び時間的異質性を要素として加味し、状態空間モデルのような複雑なモデル設定を行うことなく将来の個人ごとの介入効果である個人別Uplift値を予測する。
【0041】
本実施形態では、このような性質を満たすモデルとして、CALIBRATED CATE Estimatorを用いる。CALIBRATED CATE Estimatorには、2つのモデルが含まれる。1つ目のモデルは、過去データから消費者異質性を学習するCATE Estimatorである。2つ目のモデルは、過去データにおけるUpliftの時間経過に伴う振る舞いの変化を捉え、将来の予測したい時点におけるUpliftの水準を示すTimeseries Forecasterである。制御部110は、CATE Estimatorの個人別Uplift値を、Timeseries Forecasterによって得られるCATE Estimatorの学習時点と予測時点とにおけるUplift水準の差である、Calibration Scoreによって補正する。これにより、制御部110は、CATE Estimatorの学習時点から予測時点における時間的異質性を加味した予測を行う。ここで、CATEは、Conditional Average Treatment Effect、すなわち条件付き介入効果のことであり、時間的異質性を含む。
【0042】
消費者異質性を加味したUplift Modelingは、その精度やデータに対する制約は様々ながらも多くの手法が存在する。本実施形態では、Meta-Learnerの一種であるX-LearnerをCATE Estimatorとして用い、消費者異質性を推定する。なお、本発明は、適用範囲をX-Learnerに限定するものではなく、条件付き介入効果(CATE)を推定するあらゆるアルゴリズムを利用することが可能である。この性質により、分析者は、自らが利用するデータセットの量は複雑さに応じて、或いは自身の慣れ親しんだアルゴリズムを選択して利用することができる。
【0043】
Meta Learnerは、単一のアルゴリズムの中で介入効果を推定するのではなく、通常の機械学習モデルの結果に対してメタ的な操作を加えることで、介入効果を推定する。Meta Learnerには、T-learner、S-learner、X-learnerなどがある。T-learnerは、介入を受けたグループだけで学習されたモデルと、介入を受けないグループだけで学習されたモデルの出力を比較することで介入効果を推定する。S-learnerは、対象群と処置群双方を同時に学習し、介入条件wをw=0とした時の出力とw=1とした時の出力を比較する。X-learnerは、T-learnerの方に介入グループごとにモデリングをした後、介入グループごとに処置効果を求め、予測したい個体のCATEの算出のために、両モデルのCATEを、それぞれのグループに対する傾向スコアで重み付けを行う。
【0044】
Meta-Learnerの特徴は、介入群と非介入群のデータ量が不均衡な場合であっても良好な推定精度が期待できる点である。また、Meta-Learnerの特徴は、ベースとなる学習器を自由に指定できるため、データの特性に合ったアルゴリズムを利用することができる点にもある。後者は、例えば線形性が仮定できるデータ量が少ないケースでは線形モデルを用い、逆に非線形な関係が期待されデータ量が多い場合は勾配ブースティングなどの表現力の高いアルゴリズムを利用するなどの使い分けができる。
【0045】
時間的異質性の推定は、一般的な時系列データ解析、SARIMA、ETS、Prophetなどを用いることが可能である。本実施形態では、季節トレンドや外生変数の取り込みやその解釈が容易で、精度も良好なProphetをTimeseries Forecasterとして用いる場合について説明する。
【0046】
Timeseries Forecasterにおいてトレンドや季節性を予測するためには、予測対象の過去の一定期間のデータが必要である。この時、過去データには介入があった期間と介入がなかった期間が入り交じることになる。CCEPTAでは、並行トレンドの仮定を置く指標が介入の影響を受ける場合、本来のトレンドとは関係ない、介入による指標の変動がトレンド推定に含まれてしまうことがある。対応策としては、トレンド推定時に介入の有無やこの規模を外生変数として加えることも可能である。しかしながら、介入回数が1~2回しかなかったり、特定の曜日などに集中していたりした場合、介入による影響を正確に本来のトレンド変動から排除するのは困難である。また、介入を受けていないデータのみでトレンドを推定する場合には、介入がない期間で全データの平均を用いることになるが、介入があった期間は、介入がなかったデータの平均となってしまう。このため、介入前後で平均を算出するための前提となる母集団の分布が変化することによるバイアスを生じる。
【0047】
このバイアスを回避するために、トレンドや季節性の予測には、Timeseries Forecasterの学習に用いるデータに対するPropensity Based Sampling(式(1))を用いる。介入が発生していないタイムウィンドウにおいては、介入を受ける確率であるpropensity score,e(X)を1から減じた確率でサンプリングする。介入期間においては、介入を受けなかった全ての個体をサンプルリングする。これにより、情報処理装置1は、学習期間に介入がある期間と介入がない期間が混在している場合においてもバイアスのないトレンドの推定が可能となる。
【0048】
【数1】
【0049】
CATE Estimatorにより一時点で学習された予測値を、時間的異質性を加味する形で変換することは、Dataset Shiftの一種であるConcept Shiftの問題として捉えることができる。Concept Shiftの定義は式(2)の通り、学習時と予測時とにおいて、x(共変量)で条件付けた時のy(ターゲット)の分布、またyで条件付けた時のxの分布が変化している状況である。
【0050】
【数2】
【0051】
Dataset Shiftが発生している際には、一般的にはモデルの再トレーニングを頻繁に実施したり、直近の学習サンプルにより強い重みを付けて学習させたりする。本実施形態では、将来時点であるPtest(y|x)の水準を予測することで、Ptraining(y|x)を変換してPtest(y|x)と一致させるスコアzを算出することで、時間的異質性を考慮する際のConcept Shiftの問題を対処する。
【0052】
【数3】
【0053】
なお、式(3)では、予測結果を補正するためにCalibration Scoreを利用しているが、それ以外にも過去データの学習時にCalibration Scoreによって補正した値を学習することも可能である。
【0054】
この場合、スコアzの算出に用いるxtsと、Yの予測に用いるxcateが異なるものである。個人別の細かなuplift値(効果)を予測するためのxcateは、通常の機械学習のプロセスのように、有効と考えられる特徴量は基本的に全て含めることが望ましい。UnconfoundednessをCATE算出の前提としている場合は、未観測の交絡因子が無いことを担保する上でも、特徴量の範囲は広い方が望ましい。
【0055】
一方で、Calibration Score(スコアz)を算出する際のxtsは、「どの単位で時系列トレンドが異なるか」というグルーピングの単位に過ぎない。ここで、xtsを必要以上に細かくしても、スコアzの推定精度には寄与せず、過学習を引き起こす可能性もある。xtsの例としては、旅行関連のマーケティングの場合には夏休み、冬休みに対する時間的異質性が異なるグルーピングとして、「小中学生の子供の有無」などの変数を含めることも可能である。
【0056】
本実施形態で用いる時間的異質性の推定には、利用可能なデータの制約からCALIBRATED CATE Estimator with Uplift Trend(CCEUT)と、CALIBRATED CATE Estimator with Parallel Trend Assumption(CCEPTA)を用いる。
【0057】
CCEUTは、Uplift値自体の推移を時系列データとして扱い、そのトレンドをモデル化することでCalibration Scoreを算出する手法である。CCEUTは、Uplift値の推定に足るデータが、ある程度複数期間にまたがって利用可能な場合に適用可能である。
【0058】
一方、CCEPTAは、Uplift値自体とは別の観察可能な指標(Control群の売上水準など)がUplift値のトレンドと並行トレンドを持つと仮定し、当該指標の推移を時系列データとしてトレンドをモデル化することでCalibration Scoreを算出する手法である。
【0059】
CCEUTについてより詳細に説明する。
図3は、本実施形態で用いるCCEUTの一例を示す概略図である。
CCEUTは、CATE Estimatorとして用いるMeta Learnerによって推定される個人別の条件付き介入効果(CATE)に対する補正値であるCalibration Scoreを算出するため手法である。CCEUTは、過去のキャンペーンのUplift実績から、Upliftの季節成分、トレンド成分をモデル化することで、個人別のCalibration Score、すなわち、未来の介入効果を予測する。Meta Learnerによって推定されるCATEに対して、CCEUTによって算出されるClibration Scoreを乗算することでAdjusted CATEを得る。
【0060】
次いで、CCEPTAについてより詳細に説明する。
図4は、本実施形態で用いるCCEPTAの一例を示す概略図である。
CCEPTAは、CATE Estimatorとして用いるMeta Learnerによって推定される個人別の条件付き介入効果(CATE)に対する補正値であるCalibration Scoreを算出するため手法である。CCEPTAは、Uplift値と類似の傾向を示すと考えられる指標の季節成分、トレンド成分をモデル化することで、個人別のCalibration Score、すなわち、未来の介入効果を予測する。Meta Learnerによって推定されるCATEに対して、CCEPTAによって算出されるClibration Scoreを乗算することでAdjusted CATEを得る。
【0061】
CCEPTAは、Uplift値自体の推移を時系列データとして扱えるほど潤沢に過去データが存在しない場合にも適用可能である。並行トレンドの仮定は、一見強い制約となり得る。しかしながら、例えば製品のプロモーション効果を考えた場合、全く需要がないタイミングでプロモーションを行ってもその効果は限られる。一方で、一定の需要があるタイミングでプロモーションを行った場合にはより大きなUplift効果を見込むことができる。
【0062】
このようなケースを考えると、例えば、プロモーションを除いた素の需要トレンドは、プロモーション効果のトレンドとある程度は正の相関を持つことが予想される。ドメイン知識をもつ実務家であれば、そのようなCCEPTAに好ましい特性を持つ観測可能な指標を見つけることは、CCEUTのために反復的なキャンペーンの効果検証とデータ蓄積を行うことよりも容易である。ただし、例外として、素の需要トレンドが高まり過ぎて、もはやプロモーションによるUpliftの余地がなくなるような局面においては、素の需要トレンドとプロモーション効果が負の相関関係となるような可能性もある。このように、一定条件下で並行トレンドの仮定をすることが困難な状況もあるため、並行トレンドの仮定が本当に成り立つのかを慎重に判断する必要がある。
本実施形態では、CCEPTAを用いる場合の一例について説明する。
【0063】
図2に戻って、学習部112は、顧客情報、購買情報、DM情報、送付先情報に基づいて機械学習し、個人別の条件付き介入効果を学習する。学習部112は、学習結果を記憶部130に記憶させる。また、学習部112は、過去のキャンペーンのUplift実績からUpliftの季節成分、トレンド成分を学習することでモデル化し、個人別のCalibration Scoreを学習する。
【0064】
予測部113は、学習部112による学習結果に基づいて、個人別CATEおよびCalibration ScoreによってAdjusted CATEを算出する。予測部113は、Adjusted CATEに基づいて、ダイレクトメッセージの送付先を決定し、記憶部130に記憶させる。
【0065】
出力処理部114は、記憶部130に記憶された送付先情報を読み出して、出力部150に出力させる。
【0066】
次いで、記憶部130について、より詳細に説明する。
【0067】
記憶部130は、顧客情報記憶部131と、購買情報記憶部132と、DM情報記憶部133と、送付先情報記憶部134と、学習結果記憶部135と、を含んで構成される。
顧客情報記憶部131は、顧客情報を記憶する。顧客情報は、識別情報、ユーザ名、氏名、住所、電話番号、メールアドレス、性別、年齢、世帯構成などが対応付けられた情報である。図5を参照して説明する。
【0068】
図5は、顧客情報記憶部131が記憶する顧客情報の構成の一例を示すテーブルである。
図示する例では、識別情報に、ユーザ名、氏名、住所、電話番号、メールアドレス、性別、年齢、世帯構成が対応付けられている。
識別情報は、ユーザを識別するための情報である。ユーザ名は、ユーザの登録名である。氏名は、ユーザの氏名である。住所は、ユーザの住所である。電話番号は、ユーザの電話番号である。メールアドレスは、ユーザの電子メールアドレスである。性別、年齢は、ユーザの性別および年齢である。世帯構成は、ユーザが属する世帯の世帯構成である。
これらの各項目の情報は、例えば、各ユーザによって予め登録された情報である。
【0069】
図2に戻って、購買情報記憶部132は、購買情報を記憶する。購買情報は、顧客ごとの購買履歴を示す情報であり、購入日、ジャンル、商品名、購入店などの情報が対応付けられた情報である。図6を参照して説明する。
【0070】
図6は、購買情報記憶部132が記憶する購買情報の構成の一例を示すテーブルである。
図示する例では、ユーザを識別する識別情報ごとに、購入日、ジャンル、商品名、購入店が対応付けられている。
購入日は、商品を購入した日付である。ジャンルは、商品のジャンルである。商品名は、商品の名称である。購入店は、商品を購入した店舗などである。
これらの各項目の情報は、各ユーザによって予め登録されてもよいし、決済履歴情報等に基づいて作成されてもよい。
【0071】
図2に戻って、DM情報記憶部133は、DM情報を記憶する。DM情報は、ダイレクトメッセージの情報であり、DM識別情報、ジャンル、依頼元、ターゲット、種別などの情報が対応付けられた情報である。図7を参照して説明する。
【0072】
図7は、DM情報記憶部133が記憶するDM情報の構成の一例を示すテーブルである。
図示する例では、DM識別情報に、ジャンル、依頼元、ターゲット、種別が対応づけられている。
DM識別情報は、ダイレクトメッセージを識別する識別情報である。ジャンルは、ダイレクトメッセージが関連するジャンルである。依頼元は、ダイレクトメッセージの送付を依頼する依頼元である。ターゲットは、ダイレクトメッセージを送付するターゲットである。種別は、ダイレクトメッセージの送付方法である。
これらの各項目の情報は、依頼元からの依頼によって作成される。
【0073】
図2に戻って、送付先情報記憶部134は、送付先情報を記憶する。送付先情報は、DM識別情報ごとに、送付先となるユーザの識別情報が対応付けられた情報である。図8を参照して説明する。
【0074】
図8は、送付先情報記憶部134が記憶する送付先情報の構成の一例を示すテーブルである。
図示する例では、DM識別情報ごとに、送付先となるユーザの識別情報が対応付けられている。
当該送付先情報は、予測部113によってダイレクトメッセージの送付先候補として決定されることで生成される。
【0075】
図2に戻って、学習結果記憶部135は、学習部112による学習結果を記憶する。
【0076】
<ハードウェア構成>
次いで、情報処理装置1のハードウェア構成について説明する。図9は、本実施形態に係る情報処理装置1のハードウェア構成の一例を示すブロック図である。
情報処理装置1は、CPU11と、ドライブ部12と、記憶媒体13と、入力部14と、出力部15と、ROM16(Read Only Memory)と、RAM17(Random Access Memory)と、補助記憶部18と、インターフェース部19と、を備える。CPU11と、ドライブ部12と、入力部14と、出力部15と、ROM16と、RAM17と、補助記憶部18と、インターフェース部19とは、バスを介して相互に接続される。
【0077】
なお、ここで言うCPU11は、プロセッサ一般のことを示すものであって、狭義のいわゆるCPUと呼ばれるデバイスのことだけではなく、例えばGPUやDSP等も含む。また、ここで言うCPU11は、一つのプロセッサで実現されることに限られず、同じ、または異なる種類の複数のプロセッサを組み合わせることで実現されてもよい。
【0078】
CPU11は、補助記憶部18、ROM16およびRAM17が記憶するプログラムを読み出して実行し、また、補助記憶部18、ROM16およびRAM17が記憶する各種データを読み出し、補助記憶部18、RAM17に対して各種データを書き込むことにより、情報処理装置1を制御する。また、CPU11は、ドライブ部12を介して記憶媒体13が記憶する各種データを読み出し、また、記憶媒体13に各種データを書き込む。記憶媒体13は、光磁気ディスク、フレキシブルディスク、フラッシュメモリなどの可搬記憶媒体であり、各種データを記憶する。
【0079】
ドライブ部12は、光ディスクドライブ、フレキシブルディスクドライブなどの記憶媒体13の読み出し装置である。
【0080】
入力部14は、マウス、キーボード、タッチパネル、電源ボタン、設定ボタンなどの入力装置である。
【0081】
出力部15は、表示部、スピーカなどの出力装置である。
【0082】
ROM16、RAM17は、表示装置10の各機能部を動作させるためのプログラムや各種データを記憶する。
【0083】
補助記憶部18は、ハードディスクドライブ、フラッシュメモリなどであり、情報処理装置1の各機能部を動作させるためのプログラム、各種データを記憶する。
【0084】
インターフェース部19は、通信インターフェースを有し、有線または無線によりネットワークNWに接続される。
【0085】
例えば、後述する図2における情報処理装置1の機能構成における制御部110は、図9におけるCPU11に対応する。また、図2における入力部140は、図9における入力部14に対応する。また、図2における出力部150は、図9における出力部15に対応する。また、図2における記憶部130は、図9における記憶媒体13に対応する。
【0086】
<動作について>
図10は、本実施形態に係る情報処理装置1の動作の一例を示すフローチャートである。この図は、学習段階における情報処理装置1の動作を示す。
【0087】
(ステップS100)取得部111は、記憶部130から顧客情報、DM情報、購買情報、送付先情報、学習結果、を読み出す。取得部111は処理が終了すると処理をステップS102に進める。
(ステップS102)取得部111は、読み出した各情報に基づいて、学習データセットを作成し、記憶部130に記憶させる。取得部111は処理が終了すると、処理をステップS104に進める。
(ステップS104)学習部112は、記憶部130から学習データセットを読み出し、読み出した情報に基づいて学習を行う。学習部112は、学習が終了すると、学習結果を記憶部130に記憶させる。その後、本図の動作を終了する。
【0088】
図11は、本実施形態に係る情報処理装置1の動作の別の一例を示すフローチャートである。この図は、CATE、Calibration Score推定(算出)段階における情報処理装置1の動作を示す。
【0089】
(ステップS200)学習部112は、顧客情報記憶部131から顧客情報を取得する。DM情報記憶部133からDM情報を取得する。学習部112は、処理が終了すると、処理をステップS202に進める。ステップS202~ステップS204までは、個人ごと(ユーザごと)に行う。
(ステップS202)学習部112は、顧客情報に含まれる顧客の識別情報に対応する購買情報を、購買情報記憶部132から取得する。学習部112は、処理が終了すると、処理をステップS204に進める。
【0090】
(ステップS204)学習部112は、学習結果と購買履歴とに基づいて、CATEおよびCalibration Scoreを予測する。学習部112は、学習結果と予測結果を記憶部130に記憶させる。学習部112は、全てのユーザについて、処理が終了すると、本図の動作を終了する。
【0091】
図12は、本実施形態に係る情報処理装置1の動作の別の一例を示すフローチャートである。
(ステップS300)予測部113は、顧客情報に含まれる顧客の識別情報を顧客情報記憶部131から取得する。予測部113は、顧客の識別情報に対応する購買情報を購買情報記憶部132から取得する。予測部113は、DM情報を、DM情報記憶部133から取得する。予測部113は、処理が終了すると、処理をステップS302に進める。
(ステップS302)予測部113は、DM情報と購買情報都に基づいて、顧客ごとのCATEを算出する。予測部113は、処理が終了すると、処理をステップS304に進める。
【0092】
(ステップS304)予測部113は、DM情報と購買情報都に基づいて、顧客ごとのCalibration Scoreを算出する。予測部113は、処理が終了すると、処理をステップS306に進める。
(ステップS306)予測部113は、CATEおよびCalibration Scoreに基づいて、Adjusted CATEを算出する。情報処理装置1は、処理が終了すると、処理をステップS308に進める。
【0093】
(ステップS308)予測部113は、顧客情報に含まれる識別情報と、算出したAdjuted CATEに基づいて、送付先を予測する。情報処理装置1は、処理が終了すると、処理をステップS310に進める。
【0094】
(ステップS310)出力処理部114は、送付先情報記憶部134から送付先情報を取得し、出力画像を生成する。出力処理部114は、生成した画像を、出力部150に出力させる。情報処理装置1は、処理が終了すると、本図の処理を終了する。
【0095】
このように、本実施形態に係る情報処理装置1は、顧客情報および購買情報を取得する取得部111と、キャンペーン介入によるユーザごとの条件付き介入効果を示すデータと、キャンペーン介入による将来の介入効果を示すデータとを学習データセットとして学習された学習モデルに、取得部111が取得した顧客情報および購買情報を入力することで、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とを算出する学習部112と、将来の介入効果の予測値を、トレンドを用いて補正する予測部113と、を備える。
【0096】
これにより、情報処理装置1は、将来の介入効果の予測値を、トレンドを用いて補正することで、ダイレクトマーケティングにおける意思決定の一要素であるターゲティングの最適化を行うことができる。このため、ユーザごとの条件付き介入効果の予測値と、将来の介入効果の予測値とに基づいて、広告効果が高い、つまり広告の内容への親和性が高いと見込まれる人物を抽出することできる。また、ダイレクトマーケティングにおける介入効果の予測精度を向上させることができる。
【0097】
また、本実施形態に係る情報処理装置1は、キャンペーン介入した期間と、キャンペーン介入しない期間とを少なくとも含む所定期間におけるユーザごとの条件付き介入効果を示すデータと、将来の介入効果を示すデータとを学習データセットとして学習する学習モデルによって、将来の介入効果の予測値を算出する学習部112と、キャンペーン介入しない期間における前記ユーザごとの条件付き介入効果を示すデータによる影響を抑制して前記将来の介入効果の予測値を補正するためのトレンドを算出する予測部113と、を備える。
【0098】
これにより、情報処理装置1は、学習期間にキャンペーン介入がある期間とキャンペーン介入がない期間が混在している場合であっても、介入前後で平均を算出するための前提となる母集団の分布が変化を抑制することができる。そのため、母集団の分布が変化することによるバイアスがないトレンドを推定することができる。そのため、ダイレクトマーケティングにおける介入効果の予測精度を向上させることができる。
【0099】
次いで、上記で説明した内容についての検証結果について説明する。
【0100】
Calibrated CATE Estimatorを利用する前提としては、異質性の推定に足るだけの個体数と、時系列予測が行えるだけの期間に亘り利用可能なパネルデータ形式で、且つ、推定されたUplift値の精度を評価するために、RCTまたは反実アウトカムが計測可能な人工データを利用する必要がある。しかしながら、そのような理想的な条件で実施され、且つ検証に利用可能な形でオープンにされているデータは存在しない。そのため、本検証では人工データを用いて検証を行う。
【0101】
一方で、理想的な条件下で生成された人工データでの時系列予測の精度が高かったとしても、現実のマーケティングにおいて、複雑なトレンドの変化を捉えることができるとは必ずしも限らない。このことから、本検証では、実際のマーケティングキャンペーンに対する反応データをトレンド成分のベースとして用い、そこに人工的に生成した個体レベルの異質性を加えた、実データと人工データとのハイブリッド形式のパネルデータを分析対象として用いる。これにより、人工データの長所である、反実アウトカムを観測できることからなる個体レベルでのUplift値の検証と、時系列成分の予測に関してある程度実データと同等の条件での検証することができる。
【0102】
時系列成分のベースとなるデータには、Geoexperiments Research version 1.0.3を用いる。図13を参照して説明する。図13は、本実施形態に係る検証データの一例を示す図である。この検証では、100地域を売上の合計が概ね等しくなるようTreatment群とControl群にランダムに割り振り、Pretest、intervention、cooldownの3つの期間において各地域の日次の売上げを観測したものである。Treatment群のintervention期間のみオンライン広告が配信され、それ以外の対象、期間における介入はないものとする。当該データは、2015年1月1日から2015年4月7日という比較的長期間におけるRCTのパネルデータである。当該データは、本検証において理想的なデータに近いが、100地域しか存在しないために異質性をモデル化するためのサンプル数としては十分ではない。Pretest期間においては、Treatment群とContro群のSalesの動きが極めて高い精度で一致しているが、2月15日から始まるIntervention期間において、Treatment群のSalesが上昇し、Cooldown期間にまたControl群と同等の水準に戻る。
【0103】
また、Salesの水準が週次と思われる周期性を持ちながら、データ収集期間の後半に掛けて緩やかに上昇トレンドを持つ。このように時系列データにおいて、時間の経過とともに観察データの平均や分散が変化するデータは、非定常データと呼ばれ、分析の前提として独立同時分布(i.i.d)を仮定している通常の機械学習等では分析が難しい。このため、分析前に差分変換、対数差分変換などを用いて定常性を持たせるよう変換することが多い。
【0104】
Geoexperiments Research version 1.0.3のデータのみでは、異質性の推定のために利用可能な個体が100地域(100通り)しか存在しない。ここでは、10000人の顧客がランダムに100地域のいずれかに属し、各顧客がランダム生成された共変量を持つようなデータを式(4)、式(5)により生成する。生成した各共変量の分布は、図14図16の通りである。図14図16は、本実施形態に係る各共変量の分布の一例を示す図である。
【0105】
【数4】
【0106】
【数5】
【0107】
各顧客は、それぞれ潜在アウトカムY(0)とY(1)とを持ち、実際に観測されるのは介入条件と一致するY(w)=Yと設定する。潜在アウトカムは、それぞれ式(6)、式(7)、式(8)のように生成する。なお、baseitは、図13のデータにおいて個体iが所属するグループのその時点tにおけるSalesの値であり、時間的異質性を表現しているwはxitが実際に受けた介入の有無を表す。
【0108】
【数6】
【0109】
【数7】
【0110】
【数8】
【0111】
各共変量と潜在アウトカムの関係性をDAG(Directed Acyclic Graph)で示した結果は、図17のようになる。図17は、本実施形態に係る各共変量と潜在アウトカムの関係性の一例を示す図である。
【0112】
このDAGから生成された各個体の真の介入効果τitの時系列プロットを図18に示す。図18は、本実施形態に係る各個体の真の介入効果の時系列プロットの一例を示す図である。
それぞれの個体ごとに異なる介入効果の水準(消費者異質性)があり、かつ曜日によって大きく介入効果が変動する個体から、ほぼ介入効果がない個体まで、様々な時間的異質性を持っている。
【0113】
本検証で用いた学習・予測期間のデータ諸元は、図19の通りである。図19は、本実施形態に係る検証で用いた学習・予測期間のデータ諸元の一例を示す図である。
介入については、各個体が紐づく地域ごとにRCTで割付けた場合と、xiuを、介入を受ける確率(propensity score)とした場合と、のそれぞれで検証を行った。
【0114】
Calibrated CATE Estimatorは、メタ的な学習アルゴリズムであり、CATE EstimatorとTimeseries Forecasterとのそれぞれに、任意のアルゴリズムを利用することが可能である。
本検証では、実施形態と同様にMeta Learnerの一種であるX-LearnerをCATE Estimatorとして用いる。X-LearnerのアウトカムモデルおよびCATEモデルには、Microsoft社(登録商標)が開発するLightgbm のversion3.2.1を用いた。
【0115】
また、本検証では、Facebook社(登録商標)が開発するProphet のversion0.7.1をTimeseriesForecasterとして用いた。なお、Prophetの学習に用いるデータは、Propensity based sampling後のものを用いたが、Propensity based sampling自体の有効性も検証をする。
【0116】
検証における評価は、以下の3つのパターンにおいて学習および予測を行い、介入効果の予測と介入効果の真値とを比較した次の3つの指標により評価を行った。
【0117】
(1)Mean Absolute Error(MAE)
MAEは、式(9)で表される。MAEは、誤差の絶対値の平均であるため、精度として解釈しやすい指標である。
【0118】
【数9】
【0119】
(2)Mean Squared Error(MSE)
MSEは、式(10)で表される。MSEは、誤差を二乗した値の平均であるため、MAEと比較して、外れ値の影響を受けやすい指標である。本検証では、大きく外したケースが他の試行と比べて極端に多くないかどうかを確認する意味合いで、補助的な指標として用いている。
【0120】
【数10】
【0121】
(3)Mean Error(ME)
MEは、式(11)で表される。MEは、通常あまり使われることがないが、今回のケースではTimeseries Forecasterによって時間的異質性によって起こるバイアスを軽減できるかどうかがを評価することから、予測値にバイアスがどの程度残っているかを判断するための指標として用いる。誤差が正規分布に従っている場合、0に近いほどバイアスなく予測できていると解釈できる。
【0122】
【数11】
【0123】
ここではまず、Propensity Based Samplingの有効性を検証する。以下4通りのパターンでデータのサンプリングおよびCalibration Scoreの算定を実施した。
【0124】
(1)Ground Truth
Ground Truthは、シミュレーションデータでのみ利用可能な、全個体に対して、実際の観測値Yitではなく、介入が一切発生しなかった場合のデータY(0)itを集計したものである。
【0125】
(2)Propensity Based Sampling
Propensity Based Samplingは、実施形態と同様にしてサンプリングされたデータである。
【0126】
(3)All Samples
All Samplesは、介入を受けた/受けなかったかを問わず、全てのデータを抽出したものである。
【0127】
(4)Untreated Samples
Untreated Samplesは、介入ありの期間/なしの期間を問わず、介入がなかったYitの全てを抽出したデータである。
【0128】
(1)~(4)のそれぞれのPolicyでサンプリングされたデータを可視化した。図20は、本実施形態に係る各Policyでサンプリングされたデータの一例を示す図である。
図示する例では、All Samplesは、非介入期間においてはGround Truthと完全に一致しているものの、介入期間に入るとGround Truthに比べて上方乖離する。これは、単純に介入の効果によって実際のトレンドよりも強い数字が観測されたために生じている。
一方、Untreated Samplesは、同じく非介入期間においてはGround Truthと完全に一致しているものの、介入期間に入るとGround Truthに比べて下方乖離する。これは、今回の検証データにおいて、売上期待値が高い個体ほど介入を受けやすいような傾向があるため、介入期間において介入を受けていない個体の売上平均は、全サンプルの平均である介入前の売上平均を下回ってしまうことから生じるバイアスである。
【0129】
Propensity Based Samplingのデータは、同様の理由から非介入期間、介入期間のいずれもGround Truthに比べて下方乖離する。しかしながら、上記とは異なり、介入期間に入った際にもトレンドに変化がなく、可視化の結果からは安定したトレンドが抽出可能となる。
【0130】
図21は、本実施形態に係る各Policyでのトレンドの一例を示す図である。
図21の通り、(3)及び(4)のデータにより抽出されたトレンドは、真のデータから抽出されたトレンド1と比較して、上方および下方乖離する。(2)のデータから抽出されたトレンドは、ここでも真のトレンドと並行なトレンドを構成している。
【0131】
図22は、本実施形態に係るサンプリングの検証結果の一例を示す図である。
上記のように、それぞれ抽出されたトレンドに基づいて、学習期間および予測期間でCalibrationScoreを計算すると、Propensity Based Samplingが最もGround Truthに近く、誤差にして0.0017と、他手法に比べて10分の1以下の誤差を達成した。
【0132】
このことから、Propensity Based Samplingは今回比較対象とした(1)、(3)、(4)の他のサンプリングと比べて、介入期間と非介入期間が入り交じるような状況におけるトレンド推定に効果的な手法である。
【0133】
次いで、以下の検証の前提の2通りとCalibrationの3通りとの組み合わせによる6通りのパターンにより予測期間における個人別の介入効果を推定し、その結果を正の値と比較した。
【0134】
検証の前提
(1)完全ランダムな介入割付であるRTCデータ
(2)各個体に対する割付確率だけが既知である準実験データ
Calibration方式
(1)予測結果をCalibrationする(Post-Train)
(2)学習データをCalibrationする(Pre-Train)
(3)Calibrationを行わない(No Calibration)
【0135】
図23は、本実施形態に係るCalibrationの検証結果の一例を示す図である。
図示するように、検証の前提におけるRCTデータ、準実験データのいずれにおいても、Calibrated CATE Estimatorが、Calibrationを行わない通常のモデルNo Calibrationや、学習データをCalibrationするPre-trainと比べて精度が向上していることが示されている。
【0136】
このように、上記実施形態で説明した内容の有効性検証のために人工データを用いて有効性を検証した結果、特徴量と学習・予測データの指定のみで精度高い消費者異質性の推定が可能という機械学習ベースの利点を残しながらも、目的変数の非定常性から生じる予測値のバイアスを、通常の機械学習ベースと比較して抑えることができ、また、高精度な予測が実現できることを確認した。
【0137】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【0138】
例えば、上述した各実施形態では、情報処理装置1が学習、予測する例を説明したが、これには限られない。例えば、情報処理装置1のうち、学習を行う学習装置と、予測を行う予測装置とが個別のものであってもよい。
【0139】
また、上述した各実施形態における情報処理装置1の一部、例えば、制御部110などをコンピュータで実現するようにしてもよい。その場合、この機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、情報処理装置1に内蔵されたコンピュータシステムであって、OS(Operating System)や周辺機器等のハードウェアを含むものとする。
【0140】
また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM、CD-ROM等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバ装置やクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
【0141】
また、上述した実施形態における情報処理装置1の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。サーバ装置20(20a)の各機能部は個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
【符号の説明】
【0142】
Sys 情報処理システム
1 情報処理装置
B 企業
U1、U2 ユーザ
110 制御部
111 取得部
112 学習部
113 予測部
114 出力処理部
130 記憶部
131 顧客情報記憶部
132 購買情報記憶部
133 DM情報記憶部
134 送付先情報記憶部
135 学習結果記憶部
140 入力部
150 出力部
11 CPU
12 ドライブ部
13 記憶媒体
14 入力部
15 出力部
16 ROM
17 RAM
18 補助記憶部
19 インターフェース部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23