IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ヤフー株式会社の特許一覧

特許7428860情報処理装置、情報処理方法、及びプログラム
<>
  • 特許-情報処理装置、情報処理方法、及びプログラム 図1
  • 特許-情報処理装置、情報処理方法、及びプログラム 図2
  • 特許-情報処理装置、情報処理方法、及びプログラム 図3
  • 特許-情報処理装置、情報処理方法、及びプログラム 図4
  • 特許-情報処理装置、情報処理方法、及びプログラム 図5
  • 特許-情報処理装置、情報処理方法、及びプログラム 図6
  • 特許-情報処理装置、情報処理方法、及びプログラム 図7
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-30
(45)【発行日】2024-02-07
(54)【発明の名称】情報処理装置、情報処理方法、及びプログラム
(51)【国際特許分類】
   G06Q 30/0601 20230101AFI20240131BHJP
【FI】
G06Q30/0601 304
【請求項の数】 8
(21)【出願番号】P 2022031087
(22)【出願日】2022-03-01
(62)【分割の表示】P 2020049277の分割
【原出願日】2020-03-19
(65)【公開番号】P2022067113
(43)【公開日】2022-05-02
【審査請求日】2022-05-20
(73)【特許権者】
【識別番号】500257300
【氏名又は名称】LINEヤフー株式会社
(74)【代理人】
【識別番号】100149548
【弁理士】
【氏名又は名称】松沼 泰史
(74)【代理人】
【識別番号】100154852
【弁理士】
【氏名又は名称】酒井 太一
(74)【代理人】
【識別番号】100181124
【弁理士】
【氏名又は名称】沖田 壮男
(74)【代理人】
【識別番号】100194087
【弁理士】
【氏名又は名称】渡辺 伸一
(72)【発明者】
【氏名】谷川 奈穂
(72)【発明者】
【氏名】堀田 徹
(72)【発明者】
【氏名】小河 有史
(72)【発明者】
【氏名】荻野 明子
(72)【発明者】
【氏名】西村 純
(72)【発明者】
【氏名】藤木 貴之
【審査官】速水 雄太
(56)【参考文献】
【文献】米国特許出願公開第2018/0197200(US,A1)
【文献】Naoki Nishimura, et al.,A Latent-class Model for Estimating Product-choice Probabilities from Clickstream Data,arXiv:1612.06589 [cs.AI] [online],2016年12月20日,[2023年6月7日検索],インターネット:<URL: https://arxiv.org/abs/1612.06589>
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
電子商取引において扱われる商品又はサービスの分類先となる複数のカテゴリのそれぞれについて、前記カテゴリに分類された商品又はサービスに対してユーザがコンバージョンに至ってから経過した時間と、前記カテゴリに分類された商品又はサービスに対して前記ユーザが前記コンバージョンに至った回数と、を算出する算出部と、
前記複数のカテゴリのそれぞれの前記時間及び前記回数に基づいて、前記ユーザが将来のある時点で前記コンバージョンに至ることが想定される商品又はサービスのカテゴリであるコンバージョンカテゴリを予測する予測部と、を備え、
前記算出部は、更に、前記カテゴリごとに算出した前記時間及び前記回数に基づいて、前記カテゴリに対する前記ユーザの嗜好を表すスコアを、前記カテゴリごとに算出し、
前記予測部は、前記カテゴリごとに算出された前記スコアに基づいて、前記コンバージョンカテゴリを予測し、
前記算出部は、前記複数のカテゴリが階層化されている場合、ある対象階層に含まれる一つ又は複数のカテゴリの其々について前記スコアを算出し、
前記予測部は、前記対象階層よりも上位の階層に含まれるカテゴリの前記スコアと、前記対象階層に含まれるカテゴリの前記スコアとに基づいて、前記対象階層において前記コンバージョンカテゴリを予測する、
報処理装置。
【請求項2】
前記算出部は、前記カテゴリに分類された商品又はサービスに対して前記ユーザが至った、互いに種類の異なる複数のコンバージョンの其々について、前記時間及び前記回数を算出し、
前記予測部は、各カテゴリにおける前記複数のコンバージョンの其々の前記時間及び前記回数に基づいて、前記ユーザが将来のある時点で前記複数のコンバージョンのいずれかに至ることが想定される商品又はサービスの前記コンバージョンカテゴリを予測する、
請求項1に記載の情報処理装置。
【請求項3】
前記複数のコンバージョンには、前記カテゴリに分類された商品又はサービスを閲覧することと、前記カテゴリに分類された商品又はサービスを購入することが含まれる、
請求項2に記載の情報処理装置。
【請求項4】
前記算出部は、ロジスティック回帰モデルに対して、前記時間及び前記回数を説明変数として入力することで、前記ロジスティック回帰モデルの目的変数として前記スコアを得る、
請求項に記載の情報処理装置。
【請求項5】
前記ロジスティック回帰モデルは、学習対象のユーザの前記時間及び前記回数が入力されたときに、前記学習対象のユーザが前記コンバージョンに至った商品又はサービスのカテゴリの前記スコアが高くなるように学習される、
請求項に記載の情報処理装置。
【請求項6】
前記算出部は、前記対象階層よりも上位の階層に含まれるカテゴリと、前記対象階層よりも下位の階層に含まれるカテゴリとに依存せずに、前記対象階層のカテゴリの前記スコアを算出する、
請求項に記載の情報処理装置。
【請求項7】
コンピュータが、
電子商取引において扱われる商品又はサービスの分類先となる複数のカテゴリのそれぞれについて、前記カテゴリに分類された商品又はサービスに対してユーザがコンバージョンに至ってから経過した時間と、前記カテゴリに分類された商品又はサービスに対して前記ユーザが前記コンバージョンに至った回数と、を算出し、
前記複数のカテゴリのそれぞれの前記時間及び前記回数に基づいて、前記ユーザが将来のある時点で前記コンバージョンに至ることが想定される商品又はサービスのカテゴリであるコンバージョンカテゴリを予測
前記カテゴリごとに算出した前記時間及び前記回数に基づいて、前記カテゴリに対する前記ユーザの嗜好を表すスコアを、前記カテゴリごとに算出し、
前記カテゴリごとに算出された前記スコアに基づいて、前記コンバージョンカテゴリを予測し、
前記複数のカテゴリが階層化されている場合、ある対象階層に含まれる一つ又は複数のカテゴリの其々について前記スコアを算出し、
前記対象階層よりも上位の階層に含まれるカテゴリの前記スコアと、前記対象階層に含まれるカテゴリの前記スコアとに基づいて、前記対象階層において前記コンバージョンカテゴリを予測する、
情報処理方法。
【請求項8】
コンピュータに、
電子商取引において扱われる商品又はサービスの分類先となる複数のカテゴリのそれぞれについて、前記カテゴリに分類された商品又はサービスに対してユーザがコンバージョンに至ってから経過した時間と、前記カテゴリに分類された商品又はサービスに対して前記ユーザが前記コンバージョンに至った回数と、を算出すること、
前記複数のカテゴリのそれぞれの前記時間及び前記回数に基づいて、前記ユーザが将来のある時点で前記コンバージョンに至ることが想定される商品又はサービスのカテゴリであるコンバージョンカテゴリを予測すること、
前記カテゴリごとに算出した前記時間及び前記回数に基づいて、前記カテゴリに対する前記ユーザの嗜好を表すスコアを、前記カテゴリごとに算出すること、
前記カテゴリごとに算出された前記スコアに基づいて、前記コンバージョンカテゴリを予測すること、
前記複数のカテゴリが階層化されている場合、ある対象階層に含まれる一つ又は複数のカテゴリの其々について前記スコアを算出すること、
前記対象階層よりも上位の階層に含まれるカテゴリの前記スコアと、前記対象階層に含まれるカテゴリの前記スコアとに基づいて、前記対象階層において前記コンバージョンカテゴリを予測すること、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、及びプログラムに関する。
【背景技術】
【0002】
コンピュータに、電子商取引ウェブサイトのウェブページ上で表示する理想的な商品を選択させる技術が知られている(例えば、特許文献1参照)。
【先行技術文献】
【特許文献】
【0003】
【文献】特表2019-504406号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、従来の技術では、電子商取引において、ユーザがコンバージョンに至りやすい商品又はサービスのカテゴリについて十分な精度で予測できていない場合があった。
【0005】
本発明は、上記の課題に鑑みてなされたものであり、ユーザがコンバージョンに至りやすい商品又はサービスのカテゴリを精度よく予測することができる情報処理装置、情報処理方法、及びプログラムを提供することを目的としている。
【課題を解決するための手段】
【0006】
本発明の一態様は、電子商取引において扱われる商品又はサービスの分類先となる複数のカテゴリのそれぞれについて、前記カテゴリに分類された商品又はサービスに対してユーザが最後に第1コンバージョンに至ってから経過した第1時間と、前記カテゴリに分類された商品又はサービスに対して前記ユーザが過去のある期間に前記第1コンバージョンに至った第1累計回数と、前記カテゴリに分類された商品又はサービスに対して前記ユーザが最後に第2コンバージョンに至ってから経過した第2時間と、前記カテゴリに分類された商品又はサービスに対して前記ユーザが過去のある期間に前記第2コンバージョンに至った第2累計回数と、を算出する第1算出部と、前記第1算出部によって前記カテゴリごとに算出された前記第1時間、前記第1累計回数、前記第2時間、及び前記第2累計回数に基づいて、前記カテゴリに対する前記ユーザの嗜好を表すスコアを、前記カテゴリごとに算出する第2算出部と、前記第2算出部によって前記カテゴリごとに算出された前記スコアに基づいて、前記ユーザが将来のある時点で前記第1コンバージョン又は前記第2コンバージョンに至ることが想定される商品又はサービスのカテゴリであるコンバージョンカテゴリを予測する予測部と、を備える情報処理装置である。
【発明の効果】
【0007】
本発明の一態様によれば、ユーザがコンバージョンに至りやすい商品又はサービスのカテゴリを精度よく予測することができる。
【図面の簡単な説明】
【0008】
図1】第1実施形態における情報処理装置100を含む情報処理システム1の一例を示す図である。
図2】サービス提供装置20により提供されるウェブページの一例を示す図である。
図3】第1実施形態における情報処理装置100の構成の一例を示す図である。
図4】第1実施形態における情報処理装置100によるランタイムの一連の処理の流れを示すフローチャートである。
図5】第1実施形態における情報処理装置100によるトレーニングの一連の処理の流れを示すフローチャートである。
図6】階層化されたカテゴリの一例を表す図である。
図7】実施形態の情報処理装置100のハードウェア構成の一例を示す図である。
【発明を実施するための形態】
【0009】
以下、本発明を適用した情報処理装置、情報処理方法、及びプログラムを、図面を参照して説明する。
【0010】
[概要]
情報処理装置は、一つ又は複数のプロセッサにより実現される。情報処理装置は、電子商取引において扱われる商品又はサービスの分類先となる複数のカテゴリのそれぞれについて、リーセンシー(Recency)及びフリークエンシー(Frequency)を算出する。
【0011】
リーセンシーとは、あるカテゴリに分類された商品又はサービスに対して、ユーザが最後にコンバージョンに至ってから経過した時間である。コンバージョンとは、例えば、商品又はサービスが閲覧されたり、購入されたり、ショッピングカートに投入したり、お気に入りに登録されたり、レビューや口コミがなされたりすることである。
【0012】
フリークエンシーとは、あるカテゴリに分類された商品又はサービスに対して、ユーザが過去のある期間にコンバージョンに至った累計回数である。
【0013】
情報処理装置は、カテゴリごとにリーセンシー及びフリークエンシーを算出すると、それらリーセンシー及びフリークエンシーに基づいて、カテゴリに対するユーザの嗜好を表すスコアを、カテゴリごとに算出する。そして、情報処理装置は、算出したスコアに基づいて、コンバージョンカテゴリを予測する。コンバージョンカテゴリとは、ユーザが将来のある時点でコンバージョンに至ることが想定(或いは期待)される商品又はサービスのカテゴリである。このようにリーセンシー及びフリークエンシーを基にスコアを算出することで、ユーザがコンバージョンに至りやすい商品又はサービスのカテゴリを精度よく予測することができる。以下、商品又はサービスをまとめて「商品」と称して説明する。
【0014】
<第1実施形態>
[全体構成]
図1は、第1実施形態における情報処理装置100を含む情報処理システム1の一例を示す図である。第1実施形態における情報処理システム1は、例えば、一以上の端末装置10と、サービス提供装置20と、情報処理装置100とを備える。これらの装置は、ネットワークNWを介して接続される。また、これらの装置のうち一部は、他の装置に仮想的な装置として包含されてもよく、例えば、サービス提供装置20の機能の一部または全部が、情報処理装置100の機能によって実現される仮想マシンであってもよい。
【0015】
図1に示す各装置は、ネットワークNWを介して種々の情報を送受信する。ネットワークNWには、例えば、インターネット、WAN(Wide Area Network)、LAN(Local Area Network)、プロバイダ端末、無線通信網、無線基地局、専用回線などが含まれる。なお、図1に示す各装置の全ての組み合わせが相互に通信可能である必要はなく、ネットワークNWには、一部にローカルなネットワークが含まれてもよい。
【0016】
端末装置10は、例えば、入力装置、表示装置、通信装置、記憶装置、および演算装置を備える端末装置である。より具体的には、端末装置10は、スマートフォンなどの携帯電話、タブレット端末、各種パーソナルコンピュータなどである。通信装置は、NIC(Network Interface Card)などのネットワークカード、無線通信モジュールなどを備える。端末装置10では、ウェブブラウザやアプリケーションプログラムなどのUA(User Agent)が起動し、ユーザの入力する内容に応じたリクエストをサービス提供装置20に送信する。また、UAが起動された端末装置10は、サービス提供装置20から取得した情報に基づいて、表示装置に各種情報を表示させる。
【0017】
サービス提供装置20は、例えば、UAとして起動されたウェブブラウザからのリクエストに応じて端末装置10にウェブページを提供するウェブサーバである。ウェブページは、例えば、インターネット上において複数の店舗が出店するショッピングサイトや、商品がオークション形式で売買されるオークションサイトやフリーマーケットサイトといった種々のウェブサイトを構成するウェブページであってよい。また、サービス提供装置20は、UAとして起動されたアプリケーションからのリクエストに応じて端末装置10にコンテンツを提供することで、ショッピングサイトや、オークションサイト、フリーマーケットサイトなどの各種ウェブサイトと同様のサービスを提供するアプリケーションサーバであってもよい。以下、一例として、サービス提供装置20によって提供されるサービスが、「ショッピングサイト」であるものとして説明するが、このショッピングサイトはオークションサイトやフリーマーケットサイトなどの他のサービスに読み替えてよい。この場合、サイト上での販売は出品と読み替え、購入は落札と読み替えてよい。
【0018】
図2は、サービス提供装置20により提供されるウェブページの一例を示す図である。図示の例では、ショッピングサイトにおいて、商品を購入可能なウェブページを模式的に示している。このようなウェブページには、図中R1の領域のように、例えば、情報処理装置100によって予測されたコンバージョンカテゴリの商品が併せて表示される。例えば、ウェブページにアクセスしたユーザのコンバージョンカテゴリとして、カテゴリAとカテゴリBの2種類のカテゴリが予測されたとする。このような場合、ウェブページには、カテゴリAに分類される商品と、カテゴリBに分類される商品とがおすすめ商品などとして表示される。これにより、ユーザに対して閲覧や購入といった所望のコンバージョンを促すことができる。コンバージョンカテゴリの予測方法の詳細については後述する。
【0019】
情報処理装置100は、例えば、ショッピングサイト上にアクセスしたユーザの各種コンバージョン情報を取得し、取得したコンバージョン情報に基づいて、上述したリーセンシー及びフリークエンシーを算出し、算出したリーセンシー及びフリークエンシーに基づいて、カテゴリに対するユーザの嗜好を表すスコアをカテゴリごとに算出する。そして、情報処理装置100は、算出したスコアに基づいて、ユーザのコンバージョンカテゴリを予測する。
【0020】
[情報処理装置の構成]
図3は、第1実施形態における情報処理装置100の構成の一例を示す図である。図示のように、情報処理装置100は、例えば、通信部102と、制御部110と、記憶部130とを備える。
【0021】
通信部102は、例えば、NIC等の通信インターフェースを含む。通信部102は、ネットワークNWを介して、端末装置10やサービス提供装置20などと通信する。
【0022】
制御部110は、例えば、取得部112と、第1算出部114と、第2算出部116と、予測部118と、学習部120と、通信制御部122とを備える。
【0023】
制御部110の構成要素は、例えば、CPU(Central Processing Unit)やGPU(Graphics Processing Unit)などのプロセッサが記憶部130に格納されたプログラムを実行することにより実現される。また、制御部110の構成要素の一部または全部は、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、またはGPU(Graphics Processing Unit)などのハードウェア(回路部;circuitry)により実現されてもよいし、ソフトウェアとハードウェアの協働によって実現されてもよい。
【0024】
記憶部130は、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、EEPROM(Electrically Erasable Programmable Read Only Memory)、ROM(Read Only Memory)、RAM(Random Access Memory)などの記憶装置により実現される。記憶部130には、ファームウェアやアプリケーションプログラムなどの各種プログラムの他に、第1コンバージョン情報132と、第2コンバージョン情報134と、モデル情報136とが格納される。これらの各種情報については後述する。
【0025】
[ランタイムの処理フロー]
以下、制御部110の各構成要素の処理内容についてフローチャートを用いて説明する。図4は、第1実施形態における情報処理装置100によるランタイムの一連の処理の流れを示すフローチャートである。ランタイムとは、後述する学習済みのロジスティック回帰モデルMDLを使用(実行)することである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われてよい。
【0026】
まず、取得部112は、通信部102を介して、サービス提供装置20から、ショッピングサイトにアクセスしたユーザ(以下、アクセスユーザと称する)の第1コンバージョン情報132及び第2コンバージョン情報134を取得する(ステップS100)。
【0027】
第1コンバージョン情報132とは、過去のある第1所定期間において、アクセスユーザが至った第1コンバージョンに関する情報である。第1コンバージョンとは、例えば、ショッピングサイト上で商品を閲覧することである。第1所定期間は、数日、数週間、数か月、数年といった期間であってよく、典型的には数か月間である。第1コンバージョン情報132には、例えば、第1コンバージョンに至った日時などが含まれる。
【0028】
第2コンバージョン情報134とは、過去のある第2所定期間において、アクセスユーザが至った第2コンバージョンに関する情報である。第2コンバージョンとは、例えば、ショッピングサイト上で商品を購入することである。第2所定期間は、第1所定期間と同様に、数日、数週間、数か月、数年といった期間であってよく、典型的には数年間である。第2コンバージョン情報134には、例えば、第2コンバージョンに至った日時などが含まれる。
【0029】
次に、第1算出部114は、取得部112によって取得された第1コンバージョン情報132及び第2コンバージョン情報134に基づいて、複数のカテゴリの其々について、アクセスユーザのリーセンシー及びフリークエンシーを算出する(ステップS102)。
【0030】
例えば、第1算出部114は、第1コンバージョン情報132を参照して、アクセスユーザが最後に第1コンバージョンに至ってから経過した時間を、第1コンバージョンのリーセンシーとして算出する。言い換えれば、第1算出部114は、アクセスユーザがショッピングサイトにアクセスした日時から、過去の第1所定期間内において第1コンバージョンに至った直近の日時までの期間(日数)を、第1コンバージョンのリーセンシーとして算出する。第1コンバージョンのリーセンシーは「第1時間」の一例である。
【0031】
また、例えば、第1算出部114は、第1コンバージョン情報132を参照して、アクセスユーザが過去の第1所定期間内に第1コンバージョンに至った累計回数(総回数)を、第1コンバージョンのフリークエンシーとして算出する。第1コンバージョンのフリークエンシーは「第1累計回数」の一例である。
【0032】
また、例えば、第1算出部114は、第2コンバージョン情報134を参照して、アクセスユーザが最後に第2コンバージョンに至ってから経過した時間を、第2コンバージョンのリーセンシーとして算出する。言い換えれば、第1算出部114は、アクセスユーザがショッピングサイトにアクセスした日時から、過去の第2所定期間内において第2コンバージョンに至った直近の日時までの期間を、第2コンバージョンのリーセンシーとして算出する。第2コンバージョンのリーセンシーは「第2時間」の一例である。
【0033】
また、例えば、第1算出部114は、第2コンバージョン情報134を参照して、アクセスユーザが過去の第2所定期間内に第2コンバージョンに至った累計回数を、第2コンバージョンのフリークエンシーとして算出する。第2コンバージョンのフリークエンシーは「第2累計回数」の一例である。
【0034】
次に、第2算出部116は、第1算出部114によってカテゴリごとに算出された第1コンバージョンのリーセンシー、第1コンバージョンのフリークエンシー、第2コンバージョンのリーセンシー、及び第2コンバージョンのフリークエンシーに基づいて、各カテゴリに対するアクセスユーザの嗜好を表すスコア(以下、カテゴリ嗜好スコアSと称する)を、カテゴリごとに算出する(ステップS104)。
【0035】
例えば、第2算出部116は、モデル情報136が示すロジスティック回帰モデルMDLを用いて、各カテゴリのカテゴリ嗜好スコアSを算出する。
【0036】
モデル情報136は、ロジスティック回帰モデルMDLを定義した情報(プログラムまたはデータ構造)である。例えば、モデル情報136には、複数の偏回帰係数aやバイアス成分bなどが含まれる。ロジスティック回帰モデルMDLは、例えば、数式(1)及び(2)によって表される。
【0037】
【数1】
【0038】
【数2】
【0039】
からxは、ロジスティック回帰モデルMDLの説明変数を表している。aは説明変数xの偏回帰係数を表し、aは説明変数xの偏回帰係数を表し、aは説明変数xの偏回帰係数を表し、aは説明変数xの偏回帰係数を表している。また、bは、上記の通りバイアス成分を表している。これら複数の偏回帰係数a及びバイアス成分bは、後述する学習部120によって予め決定される。
【0040】
は、ある対象カテゴリcについて算出された第1コンバージョンのリーセンシーを表し、Fは,対象カテゴリcについて算出された第1コンバージョンのフリークエンシーを表し、Rは,対象カテゴリcについて算出された第2コンバージョンのリーセンシーを表し、Fは,対象カテゴリcについて算出された第2コンバージョンのフリークエンシーを表している。数式(2)の通り、説明変数xは、第1コンバージョンのリーセンシーRの対数値であり、説明変数xは、第1コンバージョンのフリークエンシーFの対数値であり、説明変数xは、第2コンバージョンのリーセンシーRの対数値であり、説明変数xは、第2コンバージョンのフリークエンシーFの対数値である。ユーザによってはリーセンシーRやフリークエンシーFが他人よりも非常に大きかったり小さかったりする場合がある。そのため、各リーセンシーRやフリークエンシーFの対数をとることで、それらリーセンシーRやフリークエンシーFの値が他者と著しく異なる場合であっても簡単にスコアSを計算することができる。
【0041】
例えば、第2算出部116は、ロジスティック回帰モデルMDLを表す数式(1)に対して、第1コンバージョンのリーセンシーRの対数値を説明変数xとして入力し、第1コンバージョンのフリークエンシーFの対数値を説明変数xとして入力し、第2コンバージョンのリーセンシーRの対数値を説明変数xとして入力し、第2コンバージョンのフリークエンシーFの対数値を説明変数xとして入力する。これによって、ロジスティック回帰モデルMDLは、対象カテゴリcのカテゴリ嗜好スコアSを目的変数として出力する。ロジスティック回帰モデルMDLによって出力されるカテゴリ嗜好スコアSは、確率として扱われてよい。
【0042】
例えば、ショッピングサイトで扱われる商品の分類先となるカテゴリがm種類存在する場合、第2算出部116は、m個のカテゴリの中で対象カテゴリcを変更しながらカテゴリ嗜好スコアSを算出することを繰り返し、m個の全てのカテゴリについてカテゴリ嗜好スコアSを算出する。
【0043】
次に、予測部118は、第2算出部116によってカテゴリごとに算出されたカテゴリ嗜好スコアSに基づいて、アクセスユーザが将来のある時点で第1コンバージョン又は第2コンバージョンに至ることが想定或いは期待される商品のカテゴリ、すなわちコンバージョンカテゴリを予測する(ステップS106)。
【0044】
例えば、予測部118は、m個のカテゴリの其々のカテゴリ嗜好スコアSを比較し、最もスコアSの高いカテゴリを、コンバージョンカテゴリとして予測してよい。また、予測部118は、スコアSが高い上位所定数のカテゴリを、コンバージョンカテゴリとして予測してもよい。
【0045】
次に、通信制御部122は、通信部102を介して、サービス提供装置20に、予測部118によって予測されたコンバージョンカテゴリの情報を送信する(ステップS108)。これを受けて、サービス提供装置20は、アクセスユーザが利用する端末装置10に、コンバージョンカテゴリに分類される商品を掲載したウェブページなどを表示させてよい。これによって、ユーザの興味関心を高めることができ、ショッピングサイト等で商品を販売する販売者によって所望されるコンバージョン(例えば購入等)が生じやすくなる。
【0046】
[トレーニングの処理フロー]
以下、第1実施形態における情報処理装置100のトレーニングの一連の処理の流れをフローチャートに即して説明する。トレーニングとは、ランタイムに使用されるロジスティック回帰モデルMDLを学習させることである。図5は、第1実施形態における情報処理装置100によるトレーニングの一連の処理の流れを示すフローチャートである。本フローチャートの処理は、例えば、所定の周期で繰り返し行われてよい。
【0047】
まず、取得部112は、通信部102を介して、サービス提供装置20から、不特定多数の利用済みユーザの其々の第1コンバージョン情報132及び第2コンバージョン情報134を取得する(ステップS200)。利用済みユーザとは、過去にショッピングサイトにアクセスし、そのショッピングサイトにおいて第2コンバージョンに至ったことのあるユーザである。例えば、第2コンバージョンが商品を購入することである場合、利用済みユーザを、過去にショッピングサイトで商品を購入したユーザと読み替えてよい。利用済みユーザは「学習対象のユーザ」の一例である。
【0048】
次に、第1算出部114は、取得部112によって取得された第1コンバージョン情報132及び第2コンバージョン情報134に基づいて、複数のカテゴリの其々について、不特定多数の利用済みユーザの其々のリーセンシー及びフリークエンシーを算出する(ステップS202)。
【0049】
例えば、第1算出部114は、第1コンバージョン情報132において、ある過去の基準日を定め、その基準日よりも更に過去の第1所定期間内において利用済みユーザが第1コンバージョンに至った直近の日時までの期間を、第1コンバージョンのリーセンシーとして算出する。
【0050】
また、例えば、第1算出部114は、第1コンバージョン情報132において、基準日よりも更に過去の第1所定期間内に利用済みユーザが第1コンバージョンに至った累計回数を、第1コンバージョンのフリークエンシーとして算出する。
【0051】
また、例えば、第1算出部114は、第2コンバージョン情報134において、基準日よりも更に過去の第2所定期間内において利用済みユーザが第2コンバージョンに至った直近の日時までの期間を、第2コンバージョンのリーセンシーとして算出する。
【0052】
また、例えば、第1算出部114は、第2コンバージョン情報134において、基準日よりも更に過去の第2所定期間内に利用済みユーザが第2コンバージョンに至った累計回数を、第2コンバージョンのフリークエンシーとして算出する。
【0053】
次に、学習部120は、第1算出部114によって算出されたリーセンシー及びフリークエンシーに基づいて、ロジスティック回帰モデルMDLを学習する(ステップS204)。
【0054】
例えば、学習部120は、基準日よりも将来の第3所定期間において利用済みユーザが第2コンバージョンに至った商品のカテゴリを正解のコンバージョンカテゴリとしてロジスティック回帰モデルMDLを学習する。第3所定期間は、第1所定期間や第2所定期間と同様に、数日、数週間、数か月、数年といった期間であってよく、典型的には数週間であってよい。例えば、数週間よりも更に将来のコンバージョンカテゴリを予測したい場合、第3所定期間は、数か月や数年といった期間に設定されてよい。
【0055】
より具体的には、学習部120は、上記の基準日以前のリーセンシー及びフリークエンシーの対数値を説明変数xとして入力したときに、基準日よりも将来の第3所定期間において利用済みユーザが第2コンバージョンに至った商品のカテゴリのカテゴリ嗜好スコアSが高くなるように(1に近くなるように)、且つ第3所定期間において利用済みユーザが第2コンバージョンに至らなかった商品のカテゴリのカテゴリ嗜好スコアSが低くなるように(0に近くなるように)、ロジスティック回帰モデルMDLの偏回帰係数a及びバイアス成分bを最小二乗法などで決定する。
【0056】
そして、学習部120は、学習によって偏回帰係数a及びバイアス成分bを決定したロジスティック回帰モデルMDLのモデル情報136を記憶部130に記憶させる(ステップS206)。これによって、本フローチャートの処理が終了する。このようなトレーニングによって、ランタイムに第2コンバージョンに至りやすい商品のカテゴリがコンバージョンカテゴリとして予測されることになる。
【0057】
なお、上述したトレーニングのフローチャートでは、学習部120が、基準日よりも将来の第3所定期間において利用済みユーザが「第2コンバージョン」に至った商品のカテゴリを正解のコンバージョンカテゴリとしてロジスティック回帰モデルMDLを学習するものとして説明したがこれに限られない。例えば、学習部120は、基準日よりも将来の第3所定期間において利用済みユーザが「第1コンバージョン」に至った商品のカテゴリを正解のコンバージョンカテゴリとしてロジスティック回帰モデルMDLを学習してもよい。これによって、ランタイムに第1コンバージョンに至りやすい商品のカテゴリがコンバージョンカテゴリとして予測される。
【0058】
以上説明した第1実施形態によれば、情報処理装置100は、ショッピングサイト等において扱われる商品の分類先となる複数のカテゴリのそれぞれについて、第1コンバージョンのリーセンシーと、第1コンバージョンのフリークエンシーと、第2コンバージョンのリーセンシーと、第2コンバージョンのフリークエンシーとを算出する。情報処理装置100は、算出した各種リーセンシー及びフリークエンシーに基づいて、各カテゴリのカテゴリ嗜好スコアSを算出する。そして、情報処理装置100は、算出した各カテゴリのカテゴリ嗜好スコアSに基づいて、ユーザが将来のある時点で第1コンバージョン又は第2コンバージョンに至ることが想定される商品のカテゴリを、コンバージョンカテゴリとして予測する。このような処理によって、ユーザがコンバージョンに至りやすい商品又はサービスのカテゴリを精度よく予測することができる。
【0059】
<第2実施形態>
以下、第2実施形態について説明する。第2実施形態では、カテゴリが階層化されている点で上述した第1実施形態と相違する。以下、第1実施形態との相違点を中心に説明し、第1実施形態と共通する点については説明を省略する。なお、第2実施形態の説明において、第1実施形態と同じ部分については同一符号を付して説明する。
【0060】
図6は、階層化されたカテゴリの一例を表す図である。図示のように、第1階層に含まれる「食品」というカテゴリには、第2階層のカテゴリがあり、その第2階層のカテゴリには、「お米、「野菜」、「麺類」、「パン」」、「ドリンク」といった複数のカテゴリが含まれている。第2階層の「お米」というカテゴリと「ドリンク」というカテゴリには、第3階層のカテゴリが存在している。「お米」という第2階層のカテゴリの下位階層である第3階層のカテゴリには、「精白米」、「無洗米」、「玄米」、「穀物米」といった複数のカテゴリが含まれている。「ドリンク」という第2階層のカテゴリの下位階層である第3階層のカテゴリには、「ワイン」、「焼酎」、「日本酒」、「ビール」といった複数のカテゴリが含まれている。
【0061】
このように複数のカテゴリが階層化されている場合、第2算出部116は、階層構造に依存せずに、第1実施形態のときと同様に、各階層の其々のカテゴリのカテゴリ嗜好スコアSを算出する。例えば、第2算出部116は、複数の階層の中から、第3階層を対象階層として選択したとする。この場合、第2算出部116は、選択した第3階層に含まれる複数のカテゴリの其々のカテゴリ嗜好スコアSを、第3階層よりも上位の第1階層や第2階層に含まれるカテゴリと、第3階層よりも下位の第4階層以降に含まれるカテゴリとに依存せずに算出する。
【0062】
そして、予測部118は、対象階層よりも上位の階層に含まれるカテゴリのカテゴリ嗜好スコアSと、対象階層に含まれるカテゴリのカテゴリ嗜好スコアSとに基づいて、対象階層においてコンバージョンカテゴリを予測する。
【0063】
例えば、第3階層を対象階層とした場合、予測部118は、「精白米」や「無洗米」といったカテゴリのカテゴリ嗜好スコアSだけでなく、その上位層の「お米」というカテゴリのカテゴリ嗜好スコアSを考慮して、第3階層においてコンバージョンカテゴリを予測してよい。具体的には、予測部118は、第3階層のカテゴリのカテゴリ嗜好スコアSに対して、第2階層のカテゴリのカテゴリ嗜好スコアSを加重平均したり、相加平均したり、重み付き加算したりしてよい。
【0064】
これによって、例えば、第2階層において「お米」というカテゴリよりも「ドリンク」というカテゴリのカテゴリ嗜好スコアSの方が高い場合、、第3階層において「精白米」や「無洗米」といった「お米」に関するカテゴリのカテゴリ嗜好スコアSに比べて、「ワイン」や「焼酎」といった「ドリンク」に関するカテゴリのカテゴリ嗜好スコアSが同程度或いは低い場合であっても、第3階層において「ワイン」や「焼酎」といった「ドリンク」に関するカテゴリがコンバージョンカテゴリに選ばれやすくなる。
【0065】
以上説明した第2実施形態によれば、情報処理装置100は、対象階層よりも上位の階層に含まれるカテゴリのカテゴリ嗜好スコアSと、対象階層に含まれるカテゴリのカテゴリ嗜好スコアSとに基づいて、対象階層においてコンバージョンカテゴリを予測する。これによって、更にユーザがコンバージョンに至りやすい商品又はサービスのカテゴリを精度よく予測することができる。
【0066】
<ハードウェア構成>
上述した実施形態の情報処理装置100は、例えば、図7に示すようなハードウェア構成により実現される。図7は、実施形態の情報処理装置100のハードウェア構成の一例を示す図である。
【0067】
情報処理装置100は、NIC100-1、CPU100-2、RAM100-3、ROM100-4、フラッシュメモリやHDDなどの二次記憶装置100-5、およびドライブ装置100-6が、内部バスあるいは専用通信線によって相互に接続された構成となっている。ドライブ装置100-6には、光ディスクなどの可搬型記憶媒体が装着される。二次記憶装置100-5、またはドライブ装置100-6に装着された可搬型記憶媒体に格納されたプログラムがDMAコントローラ(不図示)などによってRAM100-3に展開され、CPU100-2によって実行されることで、制御部110が実現される。制御部110が参照するプログラムは、ネットワークNWを介して他の装置からダウンロードされてもよい。
【0068】
以上、本発明を実施するための形態について実施形態を用いて説明したが、本発明はこうした実施形態に何ら限定されるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形及び置換を加えることができる。
【符号の説明】
【0069】
1…情報処理システム、10…端末装置、20…サービス提供装置、100…情報処理装置、102…通信部、110…制御部、112…取得部、114…第1算出部、116…第2算出部、118…予測部、120…学習部、122…通信制御部、130…記憶部
図1
図2
図3
図4
図5
図6
図7