特許7351887 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ ヤフー株式会社の特許一覧

特許7351887情報処理装置、情報処理システム、および情報処理方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-09-19

(45)【発行日】2023-09-27

(54)【発明の名称】情報処理装置、情報処理システム、および情報処理方法

(51)【国際特許分類】

G06Q 30/0207 20230101AFI20230920BHJP

【ＦＩ】

G06Q30/0207

【請求項の数】 11

(21)【出願番号】P 2021192687

(22)【出願日】2021-11-29

(65)【公開番号】P2023079293

(43)【公開日】2023-06-08

【審査請求日】2022-03-11

(73)【特許権者】

【識別番号】319013263

【氏名又は名称】ヤフー株式会社

(74)【代理人】

【識別番号】100149548

【弁理士】

【氏名又は名称】松沼泰史

(74)【代理人】

【識別番号】100154852

【弁理士】

【氏名又は名称】酒井太一

(74)【代理人】

【識別番号】100181124

【弁理士】

【氏名又は名称】沖田壮男

(74)【代理人】

【識別番号】100194087

【弁理士】

【氏名又は名称】渡辺伸一

(72)【発明者】

【氏名】田中康貴

(72)【発明者】

【氏名】小出明弘

(72)【発明者】

【氏名】市丸朋史

(72)【発明者】

【氏名】塚本浩司

(72)【発明者】

【氏名】手塚健志

【審査官】山崎誠也

(56)【参考文献】

【文献】特開２０２０－１７７２６２（ＪＰ，Ａ）

【文献】特開２０１９－０４６１７３（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

対象のユーザの特徴を取得する取得部と、
前記対象のユーザの特徴を第１モデルおよび第２モデルに入力し、前記第１モデルが出力した第１スコアと前記第２モデルが出力した第２スコアとを統合して得られた統合スコアに基づいて、前記対象のユーザに付与するインセンティブを決定する決定部と、を備え、
前記第１モデルは、インセンティブ無またはユーザに第１インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第２モデルは、前記第１インセンティブより高い第２インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第１モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に前記第１インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第２モデルは、前記意図した行動をユーザが行った場合に前記第２インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第１モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第１スコアを出力し、または、
前記第１モデルは、前記意図した行動をユーザが行った場合に第１インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第１インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第１スコアを出力し、
前記第２モデルは、前記意図した行動をユーザが行った場合に第２インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第２インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第２スコアを出力する、
情報処理装置。

【請求項2】

前記決定部は、前記第２スコアから前記第１スコアを減算した統合スコアに基づいて前記ユーザに付与するインセンティブを決定する、
請求項１に記載の情報処理装置。

【請求項3】

前記ユーザの特徴は、ネットワークにおけるユーザの行動履歴に基づく特徴である、
請求項１または２に記載の情報処理装置。

【請求項4】

前記ユーザの行動履歴は、電子商取引のサービスにおける行動履歴、オークションサービスにおける行動履歴、または検索サービスにおける行動履歴のうち一以上の行動履歴である、
請求項３に記載の情報処理装置。

【請求項5】

電子商取引のサービスにおける行動履歴またはオークションサービスにおける行動履歴は、ユーザが購入した商品の情報、または購入に要した金額の大きさを含む、
請求項４に記載の情報処理装置。

【請求項6】

意図する行動は、カード入会、アンケートの回答、会員登録、またはアプリケーションプログラムのインストールである、
請求項１から５のうちいずれか１項に記載の情報処理装置。

【請求項7】

インセンティブは、割引、ポイントの付与、またはクーポンの付与である、
請求項１から６のうちいずれか１項に記載の情報処理装置。

【請求項8】

請求項１から７のうちいずれか１項に記載の情報処理装置と、
ユーザの端末装置と協働してユーザにサービスを提供するサービスサーバと、を備え、
前記情報処理装置は、決定したユーザに対するインセンティブの内容を前記サービスサーバに提供し、
前記サービスサーバは、提供された前記インセンティブに基づくコンテンツを前記端末装置の表示部に表示させる、
情報処理システム。

【請求項9】

第１学習情報および第２学習情報を取得する取得部と、
前記第１学習情報を学習して第１モデルを生成する第１学習部と、
前記第２学習情報を学習して第２モデルを生成する第２学習部と、を備え、
前記第１学習情報は、意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に第１インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第１モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第１スコアを出力するように学習されたモデル、または、
前記第１モデルは、前記意図した行動をユーザが行った場合に第１インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第１インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第１スコアを出力するように学習されたモデルであり、
前記第２学習情報は、前記意図した行動をユーザが行った場合に第２インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第２モデルは、前記意図した行動をユーザが行った場合に第２インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第２インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第２スコアを出力するように学習されたモデルである、
情報処理装置。

【請求項10】

コンピュータが、
対象のユーザの特徴を取得し、
前記対象のユーザの特徴を第１モデルおよび第２モデルに入力し、前記第１モデルが出力した第１スコアと前記第２モデルが出力した第２スコアとを統合して得られた統合スコアに基づいて、前記対象のユーザに付与するインセンティブを決定し、
前記第１モデルは、インセンティブ無またはユーザに第１インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第２モデルは、前記第１インセンティブより高い第２インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、
前記第１モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に前記第１インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第２モデルは、前記意図した行動をユーザが行った場合に前記第２インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた学習情報が学習されて生成された学習済モデルであり、
前記第１モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第１スコアを出力し、または、
前記第１モデルは、前記意図した行動をユーザが行った場合に第１インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第１インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第１スコアを出力し、
前記第２モデルは、前記意図した行動をユーザが行った場合に第２インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第２インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第２スコアを出力する、
情報処理方法。

【請求項11】

コンピュータが、
第１学習情報および第２学習情報を取得し、
前記第１学習情報を学習して第１モデルを生成し、
前記第２学習情報を学習して第２モデルを生成し、
前記第１学習情報は、意図した行動をユーザが行ってもインセンティブ無であることを示してまたは前記意図した行動をユーザが行った場合に第１インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第１モデルは、前記意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても前記意図した行動を行った前記ユーザの特徴が入力されると、前記インセンティブが与えられなくても前記意図する行動を行う傾向が高いことを示す第１スコアを出力するように学習されたモデル、または、
前記第１モデルは、前記意図した行動をユーザが行った場合に第１インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第１インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第１スコアを出力するように学習されたモデルであり、
前記第２学習情報は、前記意図した行動をユーザが行った場合に第２インセンティブが付与されることを示して前記ユーザが前記意図した行動を行ったことを示す情報と、前記意図した行動を行った前記ユーザの特徴とが対応付けられた情報であり、
前記第２モデルは、前記意図した行動をユーザが行った場合に第２インセンティブが付与されることを示して前記意図した行動を行った前記ユーザの特徴が入力されると、前記第２インセンティブが与えられることで前記意図する行動を行う傾向が高いことを示す第２スコアを出力するように学習されたモデルである、
情報処理方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理システム、情報処理方法、およびプログラムに関する。

【背景技術】

【0002】

従来、インセンティブが付与されたユーザの購入履歴と、前記インセンティブが付与されたユーザごとの素性情報に基づいて生成されたインセンティブごとのユーザによる購入傾向をモデル化した予測モデルを用いて、インセンティブを付与することによって生じる購入行動に関する事象を最適化するための確率を予測する情報解析装置が開示されている（例えば、特許文献１参照）。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０１８－０７３３４９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

しかしながら、上記従来の技術では、ユーザごとに適切なインセンティブを決定することができない場合があった。

【0005】

本発明は、このような事情が考慮されたものであり、ユーザごとにより適切なインセンティブを決定することができる情報処理装置、情報処理システム、情報処理方法、およびプログラムを提供することを目的の一つとする。

【課題を解決するための手段】

【0006】

本発明の一態様は、対象のユーザの特徴を取得する取得部と、前記対象のユーザの特徴を第１モデルおよび第２モデルに入力し、前記第１モデルが出力した第１スコアと前記第２モデルが出力した第２スコアとを統合して得られた統合スコアに基づいて、前記対象のユーザに付与するインセンティブを決定する決定部と、を備え、前記第１モデルは、インセンティブ無またはユーザに第１インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルであり、前記第２モデルは、前記第１インセンティブより高い第２インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコアを出力するモデルである情報処理装置である。

【発明の効果】

【0007】

本発明の一態様によれば、ユーザごとにより適切なインセンティブを決定することができる。

【図面の簡単な説明】

【0008】

【図1】情報処理装置を含む情報処理システム１の機能構成の一例を示す図である。

【図2】学習装置１００の機能構成の一例を示す図である。

【図3】第１学習情報１２２の内容の一例を示す図である。

【図4】第１入会情報について説明するための図である。

【図5】第２学習情報１２６の内容の一例を示す図である。

【図6】第２入会情報について説明するための図である。

【図7】情報処理装置２００の機能構成の一例を示す図である。

【図8】ユーザ情報２２２の内容の一例を示す図である。

【図9】第１スコアおよび第２スコアが取得される処理について説明するための図である。

【図10】統合スコアが取得される処理について説明するための図である。

【図11】インセンティブが決定される処理について説明するための図である。

【図12】所定のユーザから得られた統合スコアと入会率との関係を示す図である。

【図13】閾値の決定手法の一例について説明するための図（その１）である。

【図14】閾値の決定手法の一例について説明するための図（その２）である。

【図15】本実施形態および比較例の処理による入会者数およびインセンティブの合計を示す図である。

【図16】情報処理システム１により実行される処理の流れの一例を示すシーケンス図である。

【発明を実施するための形態】

【0009】

以下、図面を参照し、本発明の情報処理装置、情報処理システム、情報処理方法、およびプログラムの実施形態について説明する。

【0010】

［概要］
本実施形態の一態様の情報処理装置は、対象のユーザの特徴を取得する取得部と、対象のユーザの特徴を第１モデルおよび第２モデルに入力し、第１モデルが出力した第１スコアと第２モデルが出力した第２スコアとを統合して得られた統合スコアに基づいて、対象のユーザに付与するインセンティブを決定する決定部とを備える。

【0011】

ユーザの特徴とは、例えば、ユーザの行動履歴やユーザの属性などである。ユーザの行動履歴とは、商品またはサービスの購買を示す情報や、購買の金額を示す情報など種々の情報である。ユーザの行動履歴とは、ネットワーク上におけるユーザの行動履歴である。ユーザの行動履歴は、例えば、ネットワークを介して提供されているサービスにおけるユーザの行動履歴（購入した商品やサービス、商品の価格、サービスの価格などの購買履歴情報や、決済金額、検索クエリなど）である。

【0012】

統合スコアとは、第１スコアと第２スコアから得られたスコアである。統合スコアは、第１スコアと第２スコアとを統計処理して得られたスコアである。統合スコアは、例えば、第１スコアと第２スコアとの差分に基づくスコアである。

【0013】

第１モデルは、インセンティブ無またはユーザに第１インセンティブを付与したと想定した場合に意図する行動を対象のユーザが行う確からしさを示すスコアを出力するモデルである。第２モデルは、第１インセンティブより高い第２インセンティブを付与したと想定した場合に意図する行動を対象のユーザが行う確からしさを示すスコアを出力するモデルである。

【0014】

意図する行動とは、情報処理システム１の管理者やサービス提供者などのインセンティブの付与の主体（またはユーザ以外の所定の者）が意図する行動である。意図する行動とは、例えば、所定のサービスに対する申し込みや、アンケートの回答、会員登録、アプリケーションプログラムのインストール、商品の購入、サービスの購入など任意の行動である。意図する行動は、インセンティブの付与の主体（またはユーザ以外の所定の者）が意図するものであればよい。以下の説明では、意図する行動は、クレジットカードの入会（申し込み）であるものとして説明する。

【0015】

［情報処理システム］
図１は、情報処理装置を含む情報処理システム１の機能構成の一例を示す図である。情報処理システム１は、例えば、一以上のユーザの端末装置Ｕと、一以上のサービスサーバ１０と、学習装置１００と、情報処理装置２００とを備える。一以上のサービスサーバ１０と、学習装置１００と、情報処理装置２００とは（或いは情報処理装置２００と一以上のサービスサーバ１０とは）、一つのまたは同じグループに属する管理者によって管理されている。サービスサーバ１０と、学習装置１００と、情報処理装置２００とは、ネットワークＮＷを介して互いに通信する。ネットワークＮＷは、インターネットやＬＡＮ（Local Area Network）、ＷＡＮ（Wide Area Network）、セルラー網などを含む。また、サービスサーバ１０と端末装置Ｕとは、上記のネットワークＮＷまたは他のネットワークを介して互いに通信する。

【0016】

［端末装置］
端末装置Ｕは、スマートフォンやパーソナルコンピュータ、タブレット端末などの通信機能と表示機能を有するコンピュータ装置である。端末装置Ｕでは、ＣＰＵ（Central Processing Unit）などのプロセッサが端末装置Ｕの記憶装置に記憶されたプログラムを実行することで各種処理を実行する。

【0017】

［サービスサーバ］
サービスサーバ１０は、端末装置Ｕにサービスを提供する装置である。サービスサーバ１０は、例えば、ショッピングサービス（電子商取引のサービス）を提供するサーバ装置や、オークションサービスを提供するサーバ装置、フリーマーケットサービスを提供するサーバ装置、レストランの予約やホテルの予約、旅行の予約などのサービスを提供するサーバ装置、検索サービスを提供するサーバ装置など種々のサービスを提供するサーバ装置を含む。

【0018】

［学習装置］
図２は、学習装置１００の機能構成の一例を示す図である。学習装置１００は、例えば、取得部１０２と、第１学習部１０４と、第２学習部１０６と、提供部１０８と、記憶部１２０とを備える。取得部１０２、第１学習部１０４、第２学習部１０６、および提供部１０８は、例えば、ＣＰＵ（Central Processing Unit）などのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩ（Large Scale Integration）やＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field-Programmable Gate Array）、ＧＰＵ（Graphics Processing Unit）などのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤ（Hard Disk Drive）やフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ－ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。各構成要素の機能については後述する。

【0019】

記憶部１２０は、例えば、例えば、ＲＯＭ（Read Only Memory）、フラッシュメモリ、ＳＤカード、ＲＡＭ（Random Access Memory）、ＨＤＤ（Hard Disc Drive）、レジスタ等によって実現される。また、記憶部１２０の一部または全部は、ＮＡＳ（Network Attached Storage）や外部ストレージサーバ装置等であってもよい。

【0020】

記憶部１２０には、例えば、第１学習情報１２２、第１モデル１２４、第２学習情報１２６、および第２モデル１２８が記憶されている。これらの情報の詳細については後述する。第１モデル１２４または第２モデル１２８は、例えば、機械学習を利用したモデルであって、勾配ブースティングを用いたモデルや、決定木アルゴリズムを用いたモデルであってもよいし、サポートベクターマシンや、ニューラルネットワークを、ディープラーニングなどを用いたモデルであってもよい。なお、第１学習情報１２２は、「意図した行動をユーザが行ってもインセンティブ無であることを示してまたは意図した行動をユーザが行った場合に第１インセンティブが付与されることを示してユーザが意図した行動を行ったことを示す情報と、意図した行動を行ったユーザの特徴とが対応付けられた情報」の一例である。第２学習情報１２６は、「意図した行動をユーザが行った場合に第２インセンティブが付与されることを示してユーザが意図した行動を行ったことを示す情報と、意図した行動を行ったユーザの特徴とが対応付けられた情報」の一例である。

【0021】

取得部１０２は、記憶部１２０に記憶された第１学習情報１２２および第２学習情報１２６（後述）を取得し、取得した第１学習情報１２２を第１学習部１０４に提供し、取得した第２学習情報１２６を第２学習部１０６に提供する。

【0022】

第１学習部１０４は、第１学習情報１２２を学習して第１モデル１２４を生成する。図３は、第１学習情報１２２の内容の一例を示す図である。第１学習情報１２２は、ユーザの識別情報（ＩＤ）に対して、ネットワークＮＷ上におけるユーザの行動履歴と、インセンティブなしでクレジットカードの入会の案内がユーザに提供された場合のユーザが入会を行ったか否かを示す第１入会情報とが対応付けられた情報である。ユーザのＩＤは、例えば、サービスサーバ１０が提供するサービスを利用するために、ユーザがログインに利用するユーザのＩＤである。ユーザのＩＤは、ＨＴＴＰＣｏｏｋｉｅを利用したユーザのＩＤであってもよい。

【0023】

ユーザの行動履歴は、例えば、電子商取引のサービスにおける行動履歴、オークションサービスにおける行動履歴、または検索サービスにおける行動履歴のうち一以上の行動履歴である。ユーザの行動履歴とは、例えば、どのサービスをどの程度利用しているかを示す情報や、どのような商品またはサービスを購入したかを示す情報（購買履歴情報）、どの程度の金額をサービスで利用したかを示す情報（例えば購入した商品の金額など）、検索に用いた検索クエリなど任意の行動履歴である。

【0024】

図４は、第１入会情報について説明するための図である。サービスサーバ１０は、例えば、ユーザが端末装置Ｕを操作して商品の購入を行う操作を行った場合、図４に示すコンテンツを端末装置Ｕに提供する。ユーザは、例えば、ユーザＩＤを用いてサービスサーバ１０が提供するサービスを利用するためにログインしたユーザである。このコンテンツは、クレジットカードの入会をレコメンドするコンテンツであり、クレジットカードのデザインや機能、年会費などクレジットカードに関する情報、およびクレジットカードの入会に申し込むための申し込みボタンが含まれる。

【0025】

例えば、ユーザが申し込みボタンを操作した場合、クレジットカードの申し込み画面が表示され、この画面においてユーザは、各種情報を入力することでクレジットカードの申し込みを行うことができる。クレジットカードの申し込み画面は、サービスサーバ１０が提供してもよいし、サービスサーバ１０と連携している他のサービスサーバ１０（クレジットカードの申し込みを受けるためのサービスサーバ１０やクレジットカードのサービスを管理するサービスサーバ）が提供してもよい。サービスサーバ１０は、上記のユーザの操作に関する情報を管理し、管理する情報を学習装置１００に提供する。学習装置１００は、サービスサーバ１０から取得した情報を第１学習情報１２２として管理する。

【0026】

クレジットカードの申し込みを行ったユーザの情報は正例データ（第１正例データ）であり、クレジットカードの申し込みを行わなかったユーザの情報は負例データ（第１負例データ）である。第１学習部１０４は、第１正例データおよび第１負例データのユーザの行動履歴をベクトル化したユーザベクトルを生成する。ユーザベクトルは、ユーザの行動履歴を分散表現化したものである。ユーザベクトルは、ユーザの特徴を示す。第１学習部１０４は、第１正例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値（例えば「１」）に近づき、第１負例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値（例えば「ゼロ」）に近づくように学習を行って、第１モデル１２４を生成する。

【0027】

これにより、第１モデル１２４は、第１正例データのユーザベクトルが入力された場合に「１」または「１」に近いスコアを出力する傾向となり、第１負例データのユーザベクトルが入力された場合に「ゼロ」または「ゼロ」に近いスコアを出力する傾向となる。第１モデル１２４が出力するスコアは、「インセンティブ無またはユーザに第１インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコア」の一例である。

【0028】

第１モデル１２４は、「意図した行動をユーザが行ってもインセンティブ無であることをユーザに示しても意図した行動を行ったユーザの特徴が入力されると、インセンティブが与えられなくても意図する行動を行う傾向が高いことを示す第１スコアを出力するように学習されたモデル」または「意図した行動をユーザが行った場合に第１インセンティブが付与されることを示して意図した行動を行ったユーザの特徴が入力されると、第１インセンティブが与えられることで意図する行動を行う傾向が高いことを示す第１スコアを出力するように学習されたモデル」の一例である。

【0029】

第２学習部１０６は、第２学習情報１２６を学習して第２モデル１２８を生成する。図５は、第２学習情報１２６の内容の一例を示す図である。第２学習情報１２６は、ユーザの識別情報（ＩＤ）に対して、ネットワークＮＷ上におけるユーザの行動履歴と、インセンティブありでクレジットカードの入会の案内がユーザに提供された場合のユーザが入会を行ったか否かを示す第２入会情報とが対応付けられた情報である。

【0030】

図６は、第２入会情報について説明するための図である。第１入金情報との相違点について説明する。サービスサーバ１０は、例えば、ユーザＩＤを用いてサービスサーバ１０が提供するサービスを利用するためにログインしたユーザが端末装置Ｕを操作して商品の購入を行う操作を行った場合、図６に示すコンテンツを端末装置Ｕに提供する。このコンテンツには、前述した図４で示したコンテンツに含まれる情報の他にインセンティブに関する情報が含まれる。インセンティブは、例えば、申し込みの特典である。インセンティブは、例えば、クレジットカードにユーザが入会した場合にユーザに所定のポイントが付与されることである。学習装置１００は、サービスサーバ１０から取得した情報を第２学習情報１２６として管理する。なお、インセンティブは、ポイントに限られず、ユーザが入会を行う動機付けとなると考えられる他の特典（例えば割引、クーポン付与等）であってもよい。

【0031】

クレジットカードの申し込みを行ったユーザの情報は正例データ（第２正例データ）であり、クレジットカードの申し込みを行わなかったユーザの情報は負例データ（第２負例データ）である。第２学習部１０６は、第２正例データおよび第２負例データのユーザの行動履歴をベクトル化したユーザベクトルを生成する。第２学習部１０６は、第２正例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値（例えば「１」）に近づき、第２負例データのユーザベクトルをモデルに入力した場合にモデルが出力するスコアが所定値（例えば「ゼロ」）に近づくように学習を行って、第２モデル１２８を生成する。

【0032】

これにより、第２モデル１２８は、第２正例データのユーザベクトルが入力された場合に「１」または「１」に近いスコアを出力する傾向となり、第２負例データのユーザベクトルが入力された場合に「ゼロ」または「ゼロ」に近いスコアを出力する傾向となる。第２モデル１２８が出力するスコアは、「前記第１インセンティブより高い第２インセンティブを付与したと想定した場合に意図する行動を前記対象のユーザが行う確からしさを示すスコア」の一例である。

【0033】

第２モデル１２８は「意図した行動をユーザが行った場合に第２インセンティブが付与されることを示して意図した行動を行ったユーザの特徴が入力されると、第２インセンティブが与えられることで意図する行動を行う傾向が高いことを示す第２スコアを出力するように学習されたモデル」の一例である。

【0034】

提供部１０８は、生成された第１モデル１２４および第２モデル１２８を情報処理装置２００に提供する。

【0035】

なお、上記の例では、ユーザの行動履歴に基づいてユーザベクトルが生成されるものとして説明したが、ユーザの行動履歴に加え（または代えて）、ユーザの属性が加味されたユーザベクトルが利用されてもよい。また、後述するように情報処理装置２００も同様に、ユーザの行動履歴に加え（または代えて）、ユーザの属性が加味されたユーザベクトルを利用して、ユーザに対するインセンティブを決定してもよい。ユーザの属性とは、例えば、ユーザのＩＤに対応付けられている性別や年齢、家族構成などの種々の情報である。

【0036】

［情報処理装置］
図７は、情報処理装置２００の機能構成の一例を示す図である。情報処理装置２００は、例えば、情報管理部２０２と、第１処理部２０４と、第２処理部２０６と、決定処理部２０８と、記憶部２２０とを備える。情報管理部２０２、第１処理部２０４、第２処理部２０６、および決定処理部２０８は、例えば、ＣＰＵなどのハードウェアプロセッサがプログラム（ソフトウェア）を実行することにより実現される。これらの構成要素のうち一部または全部は、ＬＳＩやＡＳＩＣ、ＦＰＧＡ、ＧＰＵなどのハードウェア（回路部；circuitryを含む）によって実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。プログラムは、予めＨＤＤやフラッシュメモリなどの記憶装置（非一過性の記憶媒体を備える記憶装置）に格納されていてもよいし、ＤＶＤやＣＤ－ＲＯＭなどの着脱可能な記憶媒体（非一過性の記憶媒体）に格納されており、記憶媒体がドライブ装置に装着されることで記憶装置にインストールされてもよい。各構成要素の機能については後述する。

【0037】

記憶部２２０は、例えば、ＲＯＭ、フラッシュメモリ、ＳＤカード、ＲＡＭ、ＨＤＤ、レジスタ等によって実現される。また、記憶部２２０の一部または全部は、ＮＡＳや外部ストレージサーバ装置等であってもよい。記憶部２２０には、例えば、ユーザ情報２２２、第１モデル２２４、および第２モデル２２６が記憶されている。

【0038】

図８は、ユーザ情報２２２の内容の一例を示す図である。ユーザ情報２２２は、サービスサーバ１０に提供された情報や、サービスサーバ１０の情報を管理するサーバ装置により提供された情報である。ユーザ情報２２２は、ユーザの識別情報と、ユーザの行動履歴とが対応付けられた情報である。

【0039】

情報管理部２０２は、サービスサーバ１０や学習装置１００に提供された情報を取得し、取得した情報を管理する。

【0040】

第１処理部２０４は、第１モデル２２４を用いて第１スコア（後述）を取得する。第２処理部２０６は、第２モデル２２６を用いて第２スコア（後述）を取得する。決定処理部２０８は、第１スコアと第２スコアとを統合して統合スコアを取得する。決定処理部２０８は、取得した統合スコアに基づいて対象のユーザに付与するインセンティブを決定する。決定処理部２０８は、例えば、第２スコアから第１スコアを減算した統合スコアに基づいてユーザに付与するインセンティブを決定する。インセンティブを決定するとは、インセンティブを付与することを決定することや、インセンティブの内容を決定することである。

【0041】

［情報処理装置に行われる処理］
図９は、第１スコアおよび第２スコアが取得される処理について説明するための図である。情報管理部２０２が、対象のユーザの行動履歴を取得する。第１処理部２０４は、対象のユーザの行動履歴に基づいて生成されたユーザベクトルを生成する。

【0042】

第１処理部２０４は、ユーザベクトルを第１モデル２２４に入力し、第１モデル２２４が出力した第１スコアを取得する。第１スコアは、インセンティブなしでクレジットカードに入会する可能性を示すスコアである。例えば、第１スコアが「１」に近いほど、入会する可能性が高い。

【0043】

第２処理部２０６は、前述したユーザベクトルを第２モデル２２６に入力し、第２モデル２２６が出力した第２スコアを取得する。第２スコアは、インセンティブありでクレジットカードに入会する可能性を示すスコアである。例えば、第２スコアが「１」に近いほど、入会する可能性が高い。

【0044】

図１０は、統合スコアが取得される処理について説明するための図である。決定処理部２０８は、第２スコアから第１スコアを減算したスコアを統合スコアとして取得する。例えば、インセンティブありに対応する第２スコア「０．９」からインセンティブなしに対応する第１スコア「０．５」を減算した統合スコアが「プラス０．４」である場合、すなわち統合スコアが正である場合、比較的、対象のユーザはインセンティブなしでは入会を行わずにインセンティブありで入会を行う傾向であると推測される。

【0045】

例えば、インセンティブありに対応する第２スコア「０．５」からインセンティブなしに対応する第１スコア「０．９」を減算した統合スコアが「マイナス０．４」である場合、すなわち統合スコアが負である場合、比較的、対象のユーザはインセンティブなしでも入会を行う傾向であると推測される。

【0046】

図１１は、インセンティブが決定される処理について説明するための図である。決定処理部２０８は、統合スコアと閾値とを比較してインセンティブを付与するかを決定する。決定処理部２０８は、例えば、図１１の上図のように統合スコアが閾値Ｔｈ以上である場合、対象のユーザにインセンティブを付与すると決定し、図１１の下図のように統合スコアが閾値Ｔｈ未満である場合、対象のユーザにインセンティブを付与しないと決定する。閾値の決定手法については後述する。

【0047】

これにより、例えば、インセンティブを付与しないと決定されたユーザに対しては、インセンティブなしでクレジットカードを入会するレコメンドがされ、インセンティブを付与すると決定されたユーザに対しては、インセンティブの付与ありでクレジットカードを入会するレコメンドがされる。

【0048】

なお、上述した図９－図１１で説明した処理の一部または全部は、サービスサーバ１０において実行されてもよい。例えば、上記の情報処理装置２００の機能構成の一部または全部は、他の装置に搭載されてもよい。

【0049】

図１２は、所定のユーザから得られた統合スコアと入会率との関係を示す図である。図１２の縦軸は入会率を示し、図１２の横軸は統合スコアを示している。図１２のプロット線のそれぞれは、インセンティブなしの場合の入会率と統合スコアとの関係を示すプロット線（インセンティブなし）、インセンティブＡを付与した場合の入会率と統合スコアとの関係を示すプロット線（インセンティブＡ）、インセンティブＢ（＞Ａ）を付与した場合の入会率と統合スコアとの関係を示すプロット線（インセンティブＢ）を示している。

【0050】

具体的には、プロット線（インセンティブなし）は、過去にインセンティブなしで入会をレコメンドしたユーザごとの統合スコアおよび入会の有無の情報から得たものである。プロット線（インセンティブなし）の統合スコア「ゼロ」に着目した場合の入会率は、例えば、過去にインセンティブなしで入会をレコメンドされたユーザのうち統合スコアが「ゼロ」のユーザにおいて、入会を行った割合である。他のプロット線も同様のため、具体的な説明は省略する。このように、プロット線の統合スコアからレコメンドの条件および統合スコアが同じユーザにおける入会率が認識可能である。

【0051】

プロット線（インセンティブなし）を参照すると、統合スコアが大きい場合よりも小さい場合（ゼロやマイナスである場合）の方が、入会率が高いことがわかる。これにより、統合スコアが高くないユーザは、インセンティブを付与しなくても比較的入会する可能性が高いことがわかる。プロット線（インセンティブＡ）およびプロット線（インセンティブＢ）を参照すると、インセンティブの付与度合が小さい場合よりも大きい場合の方が、入会率が高いことがわかる。更に、各プロット線の統合スコアに着目すれば、インセンティブの付与度合によって、どの程度、入会率が変化するかがわかる。

【0052】

［閾値が設定される処理］
上記の傾向に基づいて、インセンティブの付与が決定される。例えば、決定処理部２０８が用いる閾値が決定される。図１３は、閾値の決定手法の一例について説明するための図（その１）である。図１２との相違点について説明する。例えば、統合スコアに対して閾値を設定する。例えば、閾値未満の統合スコアのユーザに対してインセンティブなしで入会をレコメンドした場合に想定される入会者数と、閾値以上の統合スコアのユーザに対してインセンティブありで入会をレコメンドした場合に想定される入会者数との合計が所望の入会数以上や最大になるように閾値が最適化される。

【0053】

更に、最適化される際に、インセンティブの合計が条件を満たすように最適化されてもよい。例えば、インセンティブがポイント付与の場合、ユーザに付与されるポイントの合計が所望のポイント内で入会者数の合計が所望の入会数以上や最大になるように最適化されてもよい。更に、上記と同じ考え方で、各種条件が設定されてもよい。各種条件とは、インセンティブの合計が最小となることや、サービスサーバ１０の利用頻度が所定度合以上のユーザの入会が基準を満たすことなどである。

【0054】

例えば、閾値Ｔｈ１が設定されてもよい。閾値Ｔｈ１は、図１３に示すように、インセンティブなしであっても所望の入会率や入会者数の獲得が見込まれる統合スコアに対応する閾値である。閾値Ｔｈ１は、例えば、プロット線（インセンティブなし）の入会率が、プロット線（インセンティブＢ）の入会率と交わる（超える）統合スコアであってもよい。このように、閾値Ｔｈ１が設定されることで、閾値Ｔｈ１未満のユーザに対してはインセンティブを付与しなくても、高い入会率や入会者数が期待される。これにより、インセンティブの付与を抑制しつつ、効率的に入会へ誘導することができる。

【0055】

上記の例では、統合スコアが閾値Ｔｈ１未満であるか否かによってインセンティブの付与を決定したが、これに代えて、２以上の閾値に基づいて、インセンティブの付与や、付与するインセンティブの度合が決定されてもよい。

【0056】

図１４は、閾値の決定手法の一例について説明するための図（その２）である。図１３との相違点について説明する。図１４では、閾値Ｔｈ２が設定される。閾値Ｔｈ２は、閾値Ｔｈ１よりも大きい統合スコアに対応する値である。統合スコアが、閾値Ｔｈ１以上、且つ閾値Ｔｈ２未満のユーザに対しては、インセンティブＡが付与され、統合スコアが、閾値Ｔｈ２以上のユーザに対しては、インセンティブＢが付与される。上記の場合においても、例えば、付与するインセンティブの合計や、獲得が期待できるユーザ数、期待される入会率、種々の制約条件等に基づいて、閾値Ｔｈ１および閾値Ｔｈ２が設定される。

【0057】

なお、上記の閾値は、情報処理装置２００（決定処理部２０８）が統計処理を行って導出してもよいし、他の装置から提供されてもよい。また、例えば、管理者の所望の条件（所望の獲得入会者数や制約条件）が入力されると、例えば、情報処理装置２００が、自動で条件を満たすように閾値を導出してもよい。また、この場合に、一つの閾値を導出することや、複数の閾値を導出することを指定することが入力された場合、この指定に基づいて、情報処理装置２００は、閾値を導出してもよい。更に、この場合、情報処理装置２００は、閾値で区切られた区分ごとに、インセンティブの有無や内容を自動で決定してもよい。

【0058】

［比較例との比較］
図１５は、本実施形態および比較例の処理による入会者数およびインセンティブの合計を示す図である。図１５の左図は、比較例の処理による入会者数およびインセンティブの合計である。比較例では、経路ごとにインセンティブの有無や度合を変更している。経路とは、どのようなコンテンツを辿ったかなどのネットワークにおける経路である。

【0059】

図１５の右図は、本実施形態の情報処理装置２００を利用してユーザごとにインセンティブの付与の有無や度合を変更した場合の入会者数およびインセンティブの合計である。本実施形態では、上述したようにインセンティブを付与しなくても入会が期待されるユーザに対してはインセンティブを付与せずに、インセンティブを付与することで入会が期待されるユーザに対してはインセンティブを付与する。本実施形態では、インセンティブを効率的に付与することで、より多くの入会者数を効率的に獲得することができる。

【0060】

特に、本実施形態では、第２スコアから第１スコアを減算した統合スコアを用いて（統合スコアと閾値を用いて）、ユーザに対するインセンティブを決定することができる。例えば、上記とは異なる他の比較例である「インセンティブが付与されたユーザの購入履歴と、前記インセンティブが付与されたユーザごとの素性情報に基づいて生成されたインセンティブごとのユーザによる購入傾向をモデル化した予測モデルを用いて、インセンティブを付与することによって生じる購入行動に関する事象を最適化するための確率を予測する情報解析装置」では、上記のような統合スコアは用いていなく、適切なインセンティブを決定することができなかったり、適切なインセンティブを簡易に決定することができなかったりすることがあった。これに対して、本実施形態では、簡易な手法で、適切なインセンティブを決定することができる。

【0061】

［シーケンス図］
図１６は、情報処理システム１により実行される処理の流れの一例を示すシーケンス図である。まず、情報処理装置２００が、学習装置１００から第１モデル２２４および第２モデル２２６を取得する（Ｓ１０）。次に、ユーザの端末装置Ｕが、ユーザの操作に応じて所定の画面（例えば商品購入の決済を行うための画面）を表示するためのリクエストをサービスサーバ１０に送信する（Ｓ１２）。

【0062】

次に、サービスサーバ１０が、リクエストを取得したことに応じて、統合スコアの提供のリクエストを、情報処理装置２００に送信する（Ｓ１４）。Ｓ１４のリクエストには、例えば、ユーザの行動履歴が含まれている。次に、情報処理装置２００が、リクエストに応じて統合スコアを導出する（Ｓ１６）。情報処理装置２００は、ユーザの行動履歴から得たユーザベクトルを、上述したように第１モデル２２４および第２モデル２２６に入力して、第１モデル２２４が出力した第１スコアおよび第２モデル２２６が出力した第２スコアを統合して統合スコアを取得する。
情報処理装置２００は、統合スコアと閾値とに基づいて、ユーザにインセンティブを付与するか、ユーザに付与するインセンティブの内容を決定する（Ｓ１８）。

【0063】

なお、Ｓ１４のリクエストには、ユーザＩＤが含まれ、情報処理装置２００は、ユーザ情報２２２を参照して、ユーザＩＤからユーザの行動履歴を取得してもよい。

【0064】

次に、情報処理装置２００は、決定したインセンティブの情報をサービスサーバ１０に送信する（Ｓ２０）。次に、サービスサーバ１０は、送信されたインセンティブの情報に基づいて、ユーザに対するインセンティブを決定し、決定したインセンティブの情報を含むコンテンツを端末装置Ｕの表示部に表示させる（Ｓ２２）。例えば、インセンティブなしのユーザに対して、前述した図４に示すようなコンテンツが提供され、例えば、インセンティブありのユーザに対して、前述した図６に示すようなコンテンツが提供される。

【0065】

上記のように、情報処理システム１は、ユーザに対する適切なインセンティブを決定し、決定したインセンティブの情報をユーザに提供することで、効率的にユーザに意図した行動の実施を促すことができる。

【0066】

以上説明した実施形態によれば、情報処理装置２００が、対象のユーザの特徴を第１モデルおよび第２モデルに入力し、第１モデルが出力した第１スコアと第２モデルが出力した第２スコアとを統合して得られた統合スコアに基づいて、対象のユーザに付与するインセンティブを決定することにより、ユーザごとにより適切なインセンティブを決定することができる。

【0067】

以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。

【符号の説明】

【0068】

１‥情報処理システム
１００‥学習装置
１０２‥取得部
１０４‥第１学習部
１０６‥第２学習部
１０８‥提供部
１２２‥第１学習情報
１２４‥第１モデル
１２６‥第２学習情報
１２８‥第２モデル
２００‥情報処理装置
２０２‥情報管理部
２０４‥第１処理部
２０６‥第２処理部
２０８‥決定処理部
２２４‥第１モデル
２２６‥第２モデル

【図1】