IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7351887情報処理装置、情報処理システム、および情報処理方法
<>
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図1
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図2
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図3
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図4
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図5
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図6
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図7
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図8
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図9
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図10
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図11
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図12
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図13
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図14
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図15
  • 特許-情報処理装置、情報処理システム、および情報処理方法 図16
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-09-19
(45)【発行日】2023-09-27
(54)【発明の名称】情報処理装置、情報処理システム、および情報処理方法
(51)【国際特許分類】
   G06Q 30/0207 20230101AFI20230920BHJP
【FI】
G06Q30/0207
【請求項の数】 11
(21)【出願番号】P 2021192687
(22)【出願日】2021-11-29
(65)【公開番号】P2023079293
(43)【公開日】2023-06-08
【審査請求日】2022-03-11
(73)【特許権者】
【識別番号】319013263
【氏名又は名称】ヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】田中 康貴
(72)【発明者】
【氏名】小出 明弘
(72)【発明者】
【氏名】市丸 朋史
(72)【発明者】
【氏名】塚本 浩司
(72)【発明者】
【氏名】手塚 健志
【審査官】山崎 誠也
(56)【参考文献】
【文献】特開2020-177262(JP,A)
【文献】特開2019-046173(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
対象のユーザの特徴を取得する取得部と、
前記対象のユーザの特徴を第1モデルおよび第2モデルに入力し、前記第1モデルが出力した第1スコアと前記第2モデルが出力した第2スコアとを統合して得られた統合スコアに基づいて、前記対象のユーザに付与するインセンティブを決定する決定部と、を備え、
前記第1モデルは、インセンティブ無またはユーザに第1インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第2モデルは、前記第1インセンティブより高い第2インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第1モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に前記第1インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第2モデルは、前記意図した行動をユーザが行った場合に前記第2インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第1モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第1スコアを出力し、または、
前記第1モデルは、前記意図した行動をユーザが行った場合に第1インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第1インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第1スコアを出力し、
前記第2モデルは、前記意図した行動をユーザが行った場合に第2インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第2インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第2スコアを出力する、
情報処理装置。
【請求項2】
前記決定部は、前記第2スコアから前記第1スコアを減算した統合スコアに基づいて前記ユーザに付与するインセンティブを決定する、
請求項1に記載の情報処理装置。
【請求項3】
前記ユーザの特徴は、ネットワークにおけるユーザの行動履歴に基づく特徴である、
請求項1または2に記載の情報処理装置。
【請求項4】
前記ユーザの行動履歴は、電子商取引のサービスにおける行動履歴、オークションサービスにおける行動履歴、または検索サービスにおける行動履歴のうち一以上の行動履歴である、
請求項3に記載の情報処理装置。
【請求項5】
電子商取引のサービスにおける行動履歴またはオークションサービスにおける行動履歴は、ユーザが購入した商品の情報、または購入に要した金額の大きさを含む、
請求項4に記載の情報処理装置。
【請求項6】
意図する行動は、カード入会、アンケートの回答、会員登録、またはアプリケーションプログラムのインストールである、
請求項1から5のうちいずれか1項に記載の情報処理装置。
【請求項7】
インセンティブは、割引、ポイントの付与、またはクーポンの付与である、
請求項1から6のうちいずれか1項に記載の情報処理装置。
【請求項8】
請求項1から7のうちいずれか1項に記載の情報処理装置と、
ユーザの端末装置と協働してユーザにサービスを提供するサービスサーバと、を備え、
前記情報処理装置は、決定したユーザに対するインセンティブの内容を前記サービスサーバに提供し、
前記サービスサーバは、提供された前記インセンティブに基づくコンテンツを前記端末装置の表示部に表示させる、
情報処理システム。
【請求項9】
第1学習情報および第2学習情報を取得する取得部と、
前記第1学習情報を学習して第1モデルを生成する第1学習部と、
前記第2学習情報を学習して第2モデルを生成する第2学習部と、を備え、
前記第1学習情報は、意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に第1インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第1モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第1スコアを出力するように学習されたモデル、または、
前記第1モデルは、前記意図した行動をユーザが行った場合に第1インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第1インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第1スコアを出力するように学習されたモデルであり、
前記第2学習情報は、前記意図した行動をユーザが行った場合に第2インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第2モデルは、前記意図した行動をユーザが行った場合に第2インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第2インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第2スコアを出力するように学習されたモデルである、
情報処理装置。
【請求項10】
コンピュータが、
対象のユーザの特徴を取得し、
前記対象のユーザの特徴を第1モデルおよび第2モデルに入力し、前記第1モデルが出力した第1スコアと前記第2モデルが出力した第2スコアとを統合して得られた統合スコアに基づいて、前記対象のユーザに付与するインセンティブを決定し、
前記第1モデルは、インセンティブ無またはユーザに第1インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第2モデルは、前記第1インセンティブより高い第2インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第1モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に前記第1インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第2モデルは、前記意図した行動をユーザが行った場合に前記第2インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第1モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第1スコアを出力し、または、
前記第1モデルは、前記意図した行動をユーザが行った場合に第1インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第1インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第1スコアを出力し、
前記第2モデルは、前記意図した行動をユーザが行った場合に第2インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第2インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第2スコアを出力する、
情報処理方法。
【請求項11】
コンピュータが、
第1学習情報および第2学習情報を取得し、
前記第1学習情報を学習して第1モデルを生成し、
前記第2学習情報を学習して第2モデルを生成し、
前記第1学習情報は、意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に第1インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第1モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第1スコアを出力するように学習されたモデル、または、
前記第1モデルは、前記意図した行動をユーザが行った場合に第1インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第1インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第1スコアを出力するように学習されたモデルであり、
前記第2学習情報は、前記意図した行動をユーザが行った場合に第2インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第2モデルは、前記意図した行動をユーザが行った場合に第2インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第2インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第2スコアを出力するように学習されたモデルである、
情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理システム、情報処理方法、およびプログラムに関する。
【背景技術】
【0002】
従来、インセンティブが付与されたユーザの購入履歴と、前記インセンティブが付与されたユーザごとの素性情報に基づいて生成されたインセンティブごとのユーザによる購入傾向をモデル化した予測モデルを用いて、インセンティブを付与することによって生じる購入行動に関する事象を最適化するための確率を予測する情報解析装置が開示されている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2018-073349号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、上記従来の技術では、ユーザごとに適切なインセンティブを決定することができない場合があった。
【0005】
本発明は、このような事情が考慮されたものであり、ユーザごとにより適切なインセンティブを決定することができる情報処理装置、情報処理システム、情報処理方法、およびプログラムを提供することを目的の一つとする。
【課題を解決するための手段】
【0006】
本発明の一態様は、対象のユーザの特徴を取得する取得部と、前記対象のユーザの特徴を第1モデルおよび第2モデルに入力し、前記第1モデルが出力した第1スコアと前記第2モデルが出力した第2スコアとを統合して得られた統合スコアに基づいて、前記対象のユーザに付与するインセンティブを決定する決定部と、を備え、前記第1モデルは、インセンティブ無またはユーザに第1インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、前記第2モデルは、前記第1インセンティブより高い第2インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルである情報処理装置である。
【発明の効果】
【0007】
本発明の一態様によれば、ユーザごとにより適切なインセンティブを決定することができる。
【図面の簡単な説明】
【0008】
図1】情報処理装置を含む情報処理システム1の機能構成の一例を示す図である。
図2】学習装置100の機能構成の一例を示す図である。
図3】第1学習情報122の内容の一例を示す図である。
図4】第1入会情報について説明するための図である。
図5】第2学習情報126の内容の一例を示す図である。
図6】第2入会情報について説明するための図である。
図7】情報処理装置200の機能構成の一例を示す図である。
図8】ユーザ情報222の内容の一例を示す図である。
図9】第1スコアおよび第2スコアが取得される処理について説明するための図である。
図10】統合スコアが取得される処理について説明するための図である。
図11】インセンティブが決定される処理について説明するための図である。
図12】所定のユーザから得られた統合スコアと入会率との関係を示す図である。
図13】閾値の決定手法の一例について説明するための図(その1)である。
図14】閾値の決定手法の一例について説明するための図(その2)である。
図15】本実施形態および比較例の処理による入会者数およびインセンティブの合計を示す図である。
図16】情報処理システム1により実行される処理の流れの一例を示すシーケンス図である。
【発明を実施するための形態】
【0009】
以下、図面を参照し、本発明の情報処理装置、情報処理システム、情報処理方法、およびプログラムの実施形態について説明する。
【0010】
[概要]
本実施形態の一態様の情報処理装置は、対象のユーザの特徴を取得する取得部と、対象のユーザの特徴を第1モデルおよび第2モデルに入力し、第1モデルが出力した第1スコアと第2モデルが出力した第2スコアとを統合して得られた統合スコアに基づいて、対象のユーザに付与するインセンティブを決定する決定部とを備える。
【0011】
ユーザの特徴とは、例えば、ユーザの行動履歴やユーザの属性などである。ユーザの行動履歴とは、商品またはサービスの購買を示す情報や、購買の金額を示す情報など種々の情報である。ユーザの行動履歴とは、ネットワーク上におけるユーザの行動履歴である。ユーザの行動履歴は、例えば、ネットワークを介して提供されているサービスにおけるユーザの行動履歴(購入した商品やサービス、商品の価格、サービスの価格などの購買履歴情報や、決済金額、検索クエリなど)である。
【0012】
統合スコアとは、第1スコアと第2スコアから得られたスコアである。統合スコアは、第1スコアと第2スコアとを統計処理して得られたスコアである。統合スコアは、例えば、第1スコアと第2スコアとの差分に基づくスコアである。
【0013】
第1モデルは、インセンティブ無またはユーザに第1インセンティブを付与したと想定した場合に意図する行動を対象のユーザが行う確からしさを示すスコアを出力するモデルである。第2モデルは、第1インセンティブより高い第2インセンティブを付与したと想定した場合に意図する行動を対象のユーザが行う確からしさを示すスコアを出力するモデルである。
【0014】
意図する行動とは、情報処理システム1の管理者やサービス提供者などのインセンティブの付与の主体(またはユーザ以外の所定の者)が意図する行動である。意図する行動とは、例えば、所定のサービスに対する申し込みや、アンケートの回答、会員登録、アプリケーションプログラムのインストール、商品の購入、サービスの購入など任意の行動である。意図する行動は、インセンティブの付与の主体(またはユーザ以外の所定の者)が意図するものであればよい。以下の説明では、意図する行動は、クレジットカードの入会(申し込み)であるものとして説明する。
【0015】
[情報処理システム]
図1は、情報処理装置を含む情報処理システム1の機能構成の一例を示す図である。情報処理システム1は、例えば、一以上のユーザの端末装置Uと、一以上のサービスサーバ10と、学習装置100と、情報処理装置200とを備える。一以上のサービスサーバ10と、学習装置100と、情報処理装置200とは(或いは情報処理装置200と一以上のサービスサーバ10とは)、一つのまたは同じグループに属する管理者によって管理されている。サービスサーバ10と、学習装置100と、情報処理装置200とは、ネットワークNWを介して互いに通信する。ネットワークNWは、インターネットやLAN(Local Area Network)、WAN(Wide Area Network)、セルラー網などを含む。また、サービスサーバ10と端末装置Uとは、上記のネットワークNWまたは他のネットワークを介して互いに通信する。
【0016】
[端末装置]
端末装置Uは、スマートフォンやパーソナルコンピュータ、タブレット端末などの通信機能と表示機能を有するコンピュータ装置である。端末装置Uでは、CPU(Central Processing Unit)などのプロセッサが端末装置Uの記憶装置に記憶されたプログラムを実行することで各種処理を実行する。
【0017】
[サービスサーバ]
サービスサーバ10は、端末装置Uにサービスを提供する装置である。サービスサーバ10は、例えば、ショッピングサービス(電子商取引のサービス)を提供するサーバ装置や、オークションサービスを提供するサーバ装置、フリーマーケットサービスを提供するサーバ装置、レストランの予約やホテルの予約、旅行の予約などのサービスを提供するサーバ装置、検索サービスを提供するサーバ装置など種々のサービスを提供するサーバ装置を含む。
【0018】
[学習装置]
図2は、学習装置100の機能構成の一例を示す図である。学習装置100は、例えば、取得部102と、第1学習部104と、第2学習部106と、提供部108と、記憶部120とを備える。取得部102、第1学習部104、第2学習部106、および提供部108は、例えば、CPU(Central Processing Unit)などのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSI(Large Scale Integration)やASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)などのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDD(Hard Disk Drive)やフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。各構成要素の機能については後述する。
【0019】
記憶部120は、例えば、例えば、ROM(Read Only Memory)、フラッシュメモリ、SDカード、RAM(Random Access Memory)、HDD(Hard Disc Drive)、レジスタ等によって実現される。また、記憶部120の一部または全部は、NAS(Network Attached Storage)や外部ストレージサーバ装置等であってもよい。
【0020】
記憶部120には、例えば、第1学習情報122、第1モデル124、第2学習情報126、および第2モデル128が記憶されている。これらの情報の詳細については後述する。第1モデル124または第2モデル128は、例えば、機械学習を利用したモデルであって、勾配ブースティングを用いたモデルや、決定木アルゴリズムを用いたモデルであってもよいし、サポートベクターマシンや、ニューラルネットワークを、ディープラーニングなどを用いたモデルであってもよい。なお、第1学習情報122は、「意図した行動をユーザが行ってもインセンティブ無であることを示してまたは意図した行動をユーザが行った場合に第1インセンティブが付与されることを示してユーザが意図した行動を行ったことを示す情報と、意図した行動を行ったユーザの特徴とが対応付けられた情報」の一例である。第2学習情報126は、「意図した行動をユーザが行った場合に第2インセンティブが付与されることを示してユーザが意図した行動を行ったことを示す情報と、意図した行動を行ったユーザの特徴とが対応付けられた情報」の一例である。
【0021】
取得部102は、記憶部120に記憶された第1学習情報122および第2学習情報126(後述)を取得し、取得した第1学習情報122を第1学習部104に提供し、取得した第2学習情報126を第2学習部106に提供する。
【0022】
第1学習部104は、第1学習情報122を学習して第1モデル124を生成する。図3は、第1学習情報122の内容の一例を示す図である。第1学習情報122は、ユーザの識別情報(ID)に対して、ネットワークNW上におけるユーザの行動履歴と、インセンティブなしでクレジットカードの入会の案内がユーザに提供された場合のユーザが入会を行ったか否かを示す第1入会情報とが対応付けられた情報である。ユーザのIDは、例えば、サービスサーバ10が提供するサービスを利用するために、ユーザがログインに利用するユーザのIDである。ユーザのIDは、HTTP Cookieを利用したユーザのIDであってもよい。
【0023】
ユーザの行動履歴は、例えば、電子商取引のサービスにおける行動履歴、オークションサービスにおける行動履歴、または検索サービスにおける行動履歴のうち一以上の行動履歴である。ユーザの行動履歴とは、例えば、どのサービスをどの程度利用しているかを示す情報や、どのような商品またはサービスを購入したかを示す情報(購買履歴情報)、どの程度の金額をサービスで利用したかを示す情報(例えば購入した商品の金額など)、検索に用いた検索クエリなど任意の行動履歴である。
【0024】
図4は、第1入会情報について説明するための図である。サービスサーバ10は、例えば、ユーザが端末装置Uを操作して商品の購入を行う操作を行った場合、図4に示すコンテンツを端末装置Uに提供する。ユーザは、例えば、ユーザIDを用いてサービスサーバ10が提供するサービスを利用するためにログインしたユーザである。このコンテンツは、クレジットカードの入会をレコメンドするコンテンツであり、クレジットカードのデザインや機能、年会費などクレジットカードに関する情報、およびクレジットカードの入会に申し込むための申し込みボタンが含まれる。
【0025】
例えば、ユーザが申し込みボタンを操作した場合、クレジットカードの申し込み画面が表示され、この画面においてユーザは、各種情報を入力することでクレジットカードの申し込みを行うことができる。クレジットカードの申し込み画面は、サービスサーバ10が提供してもよいし、サービスサーバ10と連携している他のサービスサーバ10(クレジットカードの申し込みを受けるためのサービスサーバ10やクレジットカードのサービスを管理するサービスサーバ)が提供してもよい。サービスサーバ10は、上記のユーザの操作に関する情報を管理し、管理する情報を学習装置100に提供する。学習装置100は、サービスサーバ10から取得した情報を第1学習情報122として管理する。
【0026】
クレジットカードの申し込みを行ったユーザの情報は正例データ(第1正例データ)であり、クレジットカードの申し込みを行わなかったユーザの情報は負例データ(第1負例データ)である。第1学習部104は、第1正例データおよび第1負例データのユーザの行動履歴をベクトル化したユーザベクトルを生成する。ユーザベクトルは、ユーザの行動履歴を分散表現化したものである。ユーザベクトルは、ユーザの特徴を示す。第1学習部104は、第1正例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値(例えば「1」)に近づき、第1負例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値(例えば「ゼロ」)に近づくように学習を行って、第1モデル124を生成する。
【0027】
これにより、第1モデル124は、第1正例データのユーザベクトルが入力された場合に「1」または「1」に近いスコアを出力する傾向となり、第1負例データのユーザベクトルが入力された場合に「ゼロ」または「ゼロ」に近いスコアを出力する傾向となる。第1モデル124が出力するスコアは、「インセンティブ無またはユーザに第1インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコア」の一例である。
【0028】
第1モデル124は、「意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても意図した行動を行ったユーザの特徴が入力されると、インセンティブが与えられなくても意図する行動を行う傾向が高いことを示す第1スコアを出力するように学習されたモデル」または「意図した行動をユーザが行った場合に第1インセンティブが付与されることを示して意図した行動を行ったユーザの特徴が入力されると、第1インセンティブが与えられることで意図する行動を行う傾向が高いことを示す第1スコアを出力するように学習されたモデル」の一例である。
【0029】
第2学習部106は、第2学習情報126を学習して第2モデル128を生成する。図5は、第2学習情報126の内容の一例を示す図である。第2学習情報126は、ユーザの識別情報(ID)に対して、ネットワークNW上におけるユーザの行動履歴と、インセンティブありでクレジットカードの入会の案内がユーザに提供された場合のユーザが入会を行ったか否かを示す第2入会情報とが対応付けられた情報である。
【0030】
図6は、第2入会情報について説明するための図である。第1入金情報との相違点について説明する。サービスサーバ10は、例えば、ユーザIDを用いてサービスサーバ10が提供するサービスを利用するためにログインしたユーザが端末装置Uを操作して商品の購入を行う操作を行った場合、図6に示すコンテンツを端末装置Uに提供する。このコンテンツには、前述した図4で示したコンテンツに含まれる情報の他にインセンティブに関する情報が含まれる。インセンティブは、例えば、申し込みの特典である。インセンティブは、例えば、クレジットカードにユーザが入会した場合にユーザに所定のポイントが付与されることである。学習装置100は、サービスサーバ10から取得した情報を第2学習情報126として管理する。なお、インセンティブは、ポイントに限られず、ユーザが入会を行う動機付けとなると考えられる他の特典(例えば割引、クーポン付与等)であってもよい。
【0031】
クレジットカードの申し込みを行ったユーザの情報は正例データ(第2正例データ)であり、クレジットカードの申し込みを行わなかったユーザの情報は負例データ(第2負例データ)である。第2学習部106は、第2正例データおよび第2負例データのユーザの行動履歴をベクトル化したユーザベクトルを生成する。第2学習部106は、第2正例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値(例えば「1」)に近づき、第2負例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値(例えば「ゼロ」)に近づくように学習を行って、第2モデル128を生成する。
【0032】
これにより、第2モデル128は、第2正例データのユーザベクトルが入力された場合に「1」または「1」に近いスコアを出力する傾向となり、第2負例データのユーザベクトルが入力された場合に「ゼロ」または「ゼロ」に近いスコアを出力する傾向となる。第2モデル128が出力するスコアは、「前記第1インセンティブより高い第2インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコア」の一例である。
【0033】
第2モデル128は「意図した行動をユーザが行った場合に第2インセンティブが付与されることを示して意図した行動を行ったユーザの特徴が入力されると、第2インセンティブが与えられることで意図する行動を行う傾向が高いことを示す第2スコアを出力するように学習されたモデル」の一例である。
【0034】
提供部108は、生成された第1モデル124および第2モデル128を情報処理装置200に提供する。
【0035】
なお、上記の例では、ユーザの行動履歴に基づいてユーザベクトルが生成されるものとして説明したが、ユーザの行動履歴に加え(または代えて)、ユーザの属性が加味されたユーザベクトルが利用されてもよい。また、後述するように情報処理装置200も同様に、ユーザの行動履歴に加え(または代えて)、ユーザの属性が加味されたユーザベクトルを利用して、ユーザに対するインセンティブを決定してもよい。ユーザの属性とは、例えば、ユーザのIDに対応付けられている性別や年齢、家族構成などの種々の情報である。
【0036】
[情報処理装置]
図7は、情報処理装置200の機能構成の一例を示す図である。情報処理装置200は、例えば、情報管理部202と、第1処理部204と、第2処理部206と、決定処理部208と、記憶部220とを備える。情報管理部202、第1処理部204、第2処理部206、および決定処理部208は、例えば、CPUなどのハードウェアプロセッサがプログラム(ソフトウェア)を実行することにより実現される。これらの構成要素のうち一部または全部は、LSIやASIC、FPGA、GPUなどのハードウェア(回路部;circuitryを含む)によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めHDDやフラッシュメモリなどの記憶装置(非一過性の記憶媒体を備える記憶装置)に格納されていてもよいし、DVDやCD-ROMなどの着脱可能な記憶媒体(非一過性の記憶媒体)に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。各構成要素の機能については後述する。
【0037】
記憶部220は、例えば、ROM、フラッシュメモリ、SDカード、RAM、HDD、レジスタ等によって実現される。また、記憶部220の一部または全部は、NASや外部ストレージサーバ装置等であってもよい。記憶部220には、例えば、ユーザ情報222、第1モデル224、および第2モデル226が記憶されている。
【0038】
図8は、ユーザ情報222の内容の一例を示す図である。ユーザ情報222は、サービスサーバ10に提供された情報や、サービスサーバ10の情報を管理するサーバ装置により提供された情報である。ユーザ情報222は、ユーザの識別情報と、ユーザの行動履歴とが対応付けられた情報である。
【0039】
情報管理部202は、サービスサーバ10や学習装置100に提供された情報を取得し、取得した情報を管理する。
【0040】
第1処理部204は、第1モデル224を用いて第1スコア(後述)を取得する。第2処理部206は、第2モデル226を用いて第2スコア(後述)を取得する。決定処理部208は、第1スコアと第2スコアとを統合して統合スコアを取得する。決定処理部208は、取得した統合スコアに基づいて対象のユーザに付与するインセンティブを決定する。決定処理部208は、例えば、第2スコアから第1スコアを減算した統合スコアに基づいてユーザに付与するインセンティブを決定する。インセンティブを決定するとは、インセンティブを付与することを決定することや、インセンティブの内容を決定することである。
【0041】
[情報処理装置に行われる処理]
図9は、第1スコアおよび第2スコアが取得される処理について説明するための図である。情報管理部202が、対象のユーザの行動履歴を取得する。第1処理部204は、対象のユーザの行動履歴に基づいて生成されたユーザベクトルを生成する。
【0042】
第1処理部204は、ユーザベクトルを第1モデル224に入力し、第1モデル224が出力した第1スコアを取得する。第1スコアは、インセンティブなしでクレジットカードに入会する可能性を示すスコアである。例えば、第1スコアが「1」に近いほど、入会する可能性が高い。
【0043】
第2処理部206は、前述したユーザベクトルを第2モデル226に入力し、第2モデル226が出力した第2スコアを取得する。第2スコアは、インセンティブありでクレジットカードに入会する可能性を示すスコアである。例えば、第2スコアが「1」に近いほど、入会する可能性が高い。
【0044】
図10は、統合スコアが取得される処理について説明するための図である。決定処理部208は、第2スコアから第1スコアを減算したスコアを統合スコアとして取得する。例えば、インセンティブありに対応する第2スコア「0.9」からインセンティブなしに対応する第1スコア「0.5」を減算した統合スコアが「プラス0.4」である場合、すなわち統合スコアが正である場合、比較的、対象のユーザはインセンティブなしでは入会を行わずにインセンティブありで入会を行う傾向であると推測される。
【0045】
例えば、インセンティブありに対応する第2スコア「0.5」からインセンティブなしに対応する第1スコア「0.9」を減算した統合スコアが「マイナス0.4」である場合、すなわち統合スコアが負である場合、比較的、対象のユーザはインセンティブなしでも入会を行う傾向であると推測される。
【0046】
図11は、インセンティブが決定される処理について説明するための図である。決定処理部208は、統合スコアと閾値とを比較してインセンティブを付与するかを決定する。決定処理部208は、例えば、図11の上図のように統合スコアが閾値Th以上である場合、対象のユーザにインセンティブを付与すると決定し、図11の下図のように統合スコアが閾値Th未満である場合、対象のユーザにインセンティブを付与しないと決定する。閾値の決定手法については後述する。
【0047】
これにより、例えば、インセンティブを付与しないと決定されたユーザに対しては、インセンティブなしでクレジットカードを入会するレコメンドがされ、インセンティブを付与すると決定されたユーザに対しては、インセンティブの付与ありでクレジットカードを入会するレコメンドがされる。
【0048】
なお、上述した図9図11で説明した処理の一部または全部は、サービスサーバ10において実行されてもよい。例えば、上記の情報処理装置200の機能構成の一部または全部は、他の装置に搭載されてもよい。
【0049】
図12は、所定のユーザから得られた統合スコアと入会率との関係を示す図である。図12の縦軸は入会率を示し、図12の横軸は統合スコアを示している。図12のプロット線のそれぞれは、インセンティブなしの場合の入会率と統合スコアとの関係を示すプロット線(インセンティブなし)、インセンティブAを付与した場合の入会率と統合スコアとの関係を示すプロット線(インセンティブA)、インセンティブB(>A)を付与した場合の入会率と統合スコアとの関係を示すプロット線(インセンティブB)を示している。
【0050】
具体的には、プロット線(インセンティブなし)は、過去にインセンティブなしで入会をレコメンドしたユーザごとの統合スコアおよび入会の有無の情報から得たものである。プロット線(インセンティブなし)の統合スコア「ゼロ」に着目した場合の入会率は、例えば、過去にインセンティブなしで入会をレコメンドされたユーザのうち統合スコアが「ゼロ」のユーザにおいて、入会を行った割合である。他のプロット線も同様のため、具体的な説明は省略する。このように、プロット線の統合スコアからレコメンドの条件および統合スコアが同じユーザにおける入会率が認識可能である。
【0051】
プロット線(インセンティブなし)を参照すると、統合スコアが大きい場合よりも小さい場合(ゼロやマイナスである場合)の方が、入会率が高いことがわかる。これにより、統合スコアが高くないユーザは、インセンティブを付与しなくても比較的入会する可能性が高いことがわかる。プロット線(インセンティブA)およびプロット線(インセンティブB)を参照すると、インセンティブの付与度合が小さい場合よりも大きい場合の方が、入会率が高いことがわかる。更に、各プロット線の統合スコアに着目すれば、インセンティブの付与度合によって、どの程度、入会率が変化するかがわかる。
【0052】
[閾値が設定される処理]
上記の傾向に基づいて、インセンティブの付与が決定される。例えば、決定処理部208が用いる閾値が決定される。図13は、閾値の決定手法の一例について説明するための図(その1)である。図12との相違点について説明する。例えば、統合スコアに対して閾値を設定する。例えば、閾値未満の統合スコアのユーザに対してインセンティブなしで入会をレコメンドした場合に想定される入会者数と、閾値以上の統合スコアのユーザに対してインセンティブありで入会をレコメンドした場合に想定される入会者数との合計が所望の入会数以上や最大になるように閾値が最適化される。
【0053】
更に、最適化される際に、インセンティブの合計が条件を満たすように最適化されてもよい。例えば、インセンティブがポイント付与の場合、ユーザに付与されるポイントの合計が所望のポイント内で入会者数の合計が所望の入会数以上や最大になるように最適化されてもよい。更に、上記と同じ考え方で、各種条件が設定されてもよい。各種条件とは、インセンティブの合計が最小となることや、サービスサーバ10の利用頻度が所定度合以上のユーザの入会が基準を満たすことなどである。
【0054】
例えば、閾値Th1が設定されてもよい。閾値Th1は、図13に示すように、インセンティブなしであっても所望の入会率や入会者数の獲得が見込まれる統合スコアに対応する閾値である。閾値Th1は、例えば、プロット線(インセンティブなし)の入会率が、プロット線(インセンティブB)の入会率と交わる(超える)統合スコアであってもよい。このように、閾値Th1が設定されることで、閾値Th1未満のユーザに対してはインセンティブを付与しなくても、高い入会率や入会者数が期待される。これにより、インセンティブの付与を抑制しつつ、効率的に入会へ誘導することができる。
【0055】
上記の例では、統合スコアが閾値Th1未満であるか否かによってインセンティブの付与を決定したが、これに代えて、2以上の閾値に基づいて、インセンティブの付与や、付与するインセンティブの度合が決定されてもよい。
【0056】
図14は、閾値の決定手法の一例について説明するための図(その2)である。図13との相違点について説明する。図14では、閾値Th2が設定される。閾値Th2は、閾値Th1よりも大きい統合スコアに対応する値である。統合スコアが、閾値Th1以上、且つ閾値Th2未満のユーザに対しては、インセンティブAが付与され、統合スコアが、閾値Th2以上のユーザに対しては、インセンティブBが付与される。上記の場合においても、例えば、付与するインセンティブの合計や、獲得が期待できるユーザ数、期待される入会率、種々の制約条件等に基づいて、閾値Th1および閾値Th2が設定される。
【0057】
なお、上記の閾値は、情報処理装置200(決定処理部208)が統計処理を行って導出してもよいし、他の装置から提供されてもよい。また、例えば、管理者の所望の条件(所望の獲得入会者数や制約条件)が入力されると、例えば、情報処理装置200が、自動で条件を満たすように閾値を導出してもよい。また、この場合に、一つの閾値を導出することや、複数の閾値を導出することを指定することが入力された場合、この指定に基づいて、情報処理装置200は、閾値を導出してもよい。更に、この場合、情報処理装置200は、閾値で区切られた区分ごとに、インセンティブの有無や内容を自動で決定してもよい。
【0058】
[比較例との比較]
図15は、本実施形態および比較例の処理による入会者数およびインセンティブの合計を示す図である。図15の左図は、比較例の処理による入会者数およびインセンティブの合計である。比較例では、経路ごとにインセンティブの有無や度合を変更している。経路とは、どのようなコンテンツを辿ったかなどのネットワークにおける経路である。
【0059】
図15の右図は、本実施形態の情報処理装置200を利用してユーザごとにインセンティブの付与の有無や度合を変更した場合の入会者数およびインセンティブの合計である。本実施形態では、上述したようにインセンティブを付与しなくても入会が期待されるユーザに対してはインセンティブを付与せずに、インセンティブを付与することで入会が期待されるユーザに対してはインセンティブを付与する。本実施形態では、インセンティブを効率的に付与することで、より多くの入会者数を効率的に獲得することができる。
【0060】
特に、本実施形態では、第2スコアから第1スコアを減算した統合スコアを用いて(統合スコアと閾値を用いて)、ユーザに対するインセンティブを決定することができる。例えば、上記とは異なる他の比較例である「インセンティブが付与されたユーザの購入履歴と、前記インセンティブが付与されたユーザごとの素性情報に基づいて生成されたインセンティブごとのユーザによる購入傾向をモデル化した予測モデルを用いて、インセンティブを付与することによって生じる購入行動に関する事象を最適化するための確率を予測する情報解析装置」では、上記のような統合スコアは用いていなく、適切なインセンティブを決定することができなかったり、適切なインセンティブを簡易に決定することができなかったりすることがあった。これに対して、本実施形態では、簡易な手法で、適切なインセンティブを決定することができる。
【0061】
[シーケンス図]
図16は、情報処理システム1により実行される処理の流れの一例を示すシーケンス図である。まず、情報処理装置200が、学習装置100から第1モデル224および第2モデル226を取得する(S10)。次に、ユーザの端末装置Uが、ユーザの操作に応じて所定の画面(例えば商品購入の決済を行うための画面)を表示するためのリクエストをサービスサーバ10に送信する(S12)。
【0062】
次に、サービスサーバ10が、リクエストを取得したことに応じて、統合スコアの提供のリクエストを、情報処理装置200に送信する(S14)。S14のリクエストには、例えば、ユーザの行動履歴が含まれている。次に、情報処理装置200が、リクエストに応じて統合スコアを導出する(S16)。情報処理装置200は、ユーザの行動履歴から得たユーザベクトルを、上述したように第1モデル224および第2モデル226に入力して、第1モデル224が出力した第1スコアおよび第2モデル226が出力した第2スコアを統合して統合スコアを取得する。
情報処理装置200は、統合スコアと閾値とに基づいて、ユーザにインセンティブを付与するか、ユーザに付与するインセンティブの内容を決定する(S18)。
【0063】
なお、S14のリクエストには、ユーザIDが含まれ、情報処理装置200は、ユーザ情報222を参照して、ユーザIDからユーザの行動履歴を取得してもよい。
【0064】
次に、情報処理装置200は、決定したインセンティブの情報をサービスサーバ10に送信する(S20)。次に、サービスサーバ10は、送信されたインセンティブの情報に基づいて、ユーザに対するインセンティブを決定し、決定したインセンティブの情報を含むコンテンツを端末装置Uの表示部に表示させる(S22)。例えば、インセンティブなしのユーザに対して、前述した図4に示すようなコンテンツが提供され、例えば、インセンティブありのユーザに対して、前述した図6に示すようなコンテンツが提供される。
【0065】
上記のように、情報処理システム1は、ユーザに対する適切なインセンティブを決定し、決定したインセンティブの情報をユーザに提供することで、効率的にユーザに意図した行動の実施を促すことができる。
【0066】
以上説明した実施形態によれば、情報処理装置200が、対象のユーザの特徴を第1モデルおよび第2モデルに入力し、第1モデルが出力した第1スコアと第2モデルが出力した第2スコアとを統合して得られた統合スコアに基づいて、対象のユーザに付与するインセンティブを決定することにより、ユーザごとにより適切なインセンティブを決定することができる。
【0067】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0068】
1‥情報処理システム
100‥学習装置
102‥取得部
104‥第1学習部
106‥第2学習部
108‥提供部
122‥第1学習情報
124‥第1モデル
126‥第2学習情報
128‥第2モデル
200‥情報処理装置
202‥情報管理部
204‥第1処理部
206‥第2処理部
208‥決定処理部
224‥第1モデル
226‥第2モデル
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16