(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-15
(45)【発行日】2024-10-23
(54)【発明の名称】情報処理方法、情報処理装置、及び、プログラム
(51)【国際特許分類】
G06Q 30/0207 20230101AFI20241016BHJP
【FI】
G06Q30/0207 350
(21)【出願番号】P 2020209615
(22)【出願日】2020-12-17
【審査請求日】2023-07-18
(73)【特許権者】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】佐々木 紀之
【審査官】野元 久道
(56)【参考文献】
【文献】特開2019-008343(JP,A)
【文献】特開2019-061525(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
(57)【特許請求の範囲】
【請求項1】
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回答に基づく、前記学習対象ユーザの消費行動に関する特徴を
ラベルとして学習に用いる、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を含
み、
前記学習対象ユーザの前記消費行動に関する特徴を入力とし、前記学習対象ユーザによる複数のアクションに対する評価をラベルとして学習に用いる、前記複数の学習対象ユーザについての第2の学習データによって学習された第2の学習済みモデルへの、前記推定対象ユーザの消費行動に関する特徴の前記推定値の入力に対する出力として、前記複数のアクションに対する評価の推定値を取得することと、をさらに実行し、
前記複数のアクションに対する評価の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを判定する、
情報処理方法。
【請求項2】
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回答に基づく、前記学習対象ユーザの消費行動に関する特徴をラベルとして学習に用いる、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を含み、
前記第1の学習済みモデルの前記第1の学習データは、前記学習対象ユーザの前記行動履歴情報を入力とし、前記学習対象ユーザの前記消費行動に関する特徴と、前記学習対象ユーザによる複数のアクションに対する評価を
ラベルとして学習に用いており、
前記第1の学習済みモデルへの前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の前記推定値とともに、前記複数のアクションに対する評価の推定値を取得し、
前記複数のアクションに対する評価の前記推定値に基づいて、前記推定対象ユーザに有効と判定されるアクションを判定する
、
情報処理方法。
【請求項3】
前記第1の学習済みモデルの前記第1の学習データは、前記学習対象ユーザによる前記アンケートの回答に基づく、前記学習対象ユーザの前記消費行動に関する特徴の分類を
ラベルとして学習に用いており、
前記第1の学習済みモデルの前記推定対象ユーザの行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の分類の前記推定値を取得する、
請求項1
又は2に記載の情報処理方法。
【請求項4】
前記行動履歴情報は、ウェブページの閲覧アクセスログデータである、
請求項1から
3のいずれか一項に記載の情報処理方法。
【請求項5】
前記ウェブページの閲覧アクセスログデータを、ウェブページのジャンルごとの、アクセス数、アクセス頻度、及び、閲覧時間の少なくとも1つを用いて、ウェブページの閲覧の特性をスコアリングすることをさらに実行し、
前記第1の学習済みモデルは、前記ウェブページの閲覧の特性のスコアを入力とする、請求項
4に記載の情報処理方法。
【請求項6】
前記第1の学習済みモデルは、前記学習対象ユーザの前記行動履歴情報に加え、前記学習対象ユーザの属性情報を前記学習データの入力とする、
請求項1から
5のいずれか一項に記載の情報処理方法。
【請求項7】
前記第1の学習済みモデルに、前記学習データによって学習させることをさらに含む、請求項1から
6のいずれか一項に記載の情報処理方法。
【請求項8】
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回答に基づく、前記学習対象ユーザの消費行動に関する特徴を
ラベルとして学習に用いる、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を実行する制御部、
を備
え、
前記制御部は、
前記学習対象ユーザの前記消費行動に関する特徴を入力とし、前記学習対象ユーザによる複数のアクションに対する評価をラベルとして学習に用いる、前記複数の学習対象ユーザについての第2の学習データによって学習された第2の学習済みモデルへの、前記推定対象ユーザの消費行動に関する特徴の前記推定値の入力に対する出力として、前記複数のアクションに対する評価の推定値を取得することと、をさらに実行し、
前記複数のアクションに対する評価の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを判定する、
情報処理装置。
【請求項9】
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回答に基づく、前記学習対象ユーザの消費行動に関する特徴をラベルとして学習に用いる、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を実行する制御部、
を備え、
前記第1の学習済みモデルの前記第1の学習データは、前記学習対象ユーザの前記行動履歴情報を入力とし、前記学習対象ユーザの前記消費行動に関する特徴と、前記学習対象ユーザによる複数のアクションに対する評価を
ラベルとして学習に用いており、
前記制御部は、
前記第1の学習済みモデルへの前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の前記推定値とともに、前記複数のアクションに対する評価の推定値を取得し、
前記複数のアクションに対する評価の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを判定する
、
情報処理装置。
【請求項10】
前記第1の学習済みモデルの前記第1の学習データは、前記学習対象ユーザによる前記アンケートの回答に基づく、前記学習対象ユーザの前記消費行動に関する特徴の分類を
ラベルとして学習に用いており、
前記制御部は、前記第1の学習済みモデルの前記推定対象ユーザの行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の分類の前記推定値を取得する、
請求項
8又は9に記載の情報処理装置。
【請求項11】
前記行動履歴情報は、ウェブページの閲覧アクセスログデータである、
請求項
8から
10のいずれか一項に記載の情報処理装置。
【請求項12】
前記制御部は、前記ウェブページの閲覧アクセスログデータを、ウェブページのジャンルごとの、アクセス数、アクセス頻度、及び、閲覧時間の少なくとも1つを用いて、ウェブページの閲覧の特性をスコアリングすることをさらに実行し、
前記第1の学習済みモデルは、前記ウェブページの閲覧の特性のスコアを入力とする、請求項
11に記載の情報処理装置。
【請求項13】
前記第1の学習済みモデルは、前記学習対象ユーザの前記行動履歴情報に加え、前記学習対象ユーザの属性情報を前記学習データの入力とする、
請求項8から
12のいずれか一項に記載の情報処理装置。
【請求項14】
前記制御部は、前記第1の学習済みモデルに、前記学習データによって学習させることをさらに含む、
請求項
8から
13のいずれか一項に記載の情報処理装置。
【請求項15】
コンピュータに
実行させるためのプログラムであって、
前記コンピュータは、
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回
答に基づく、前記学習対象ユーザの消費行動に関する特徴を
ラベルとして学習に用いる、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を実行
し、
前記コンピュータが、
前記学習対象ユーザの前記消費行動に関する特徴を入力とし、前記学習対象ユーザによる複数のアクションに対する評価をラベルとして学習に用いる、前記複数の学習対象ユーザについての第2の学習データによって学習された第2の学習済みモデルへの、前記推定対象ユーザの消費行動に関する特徴の前記推定値の入力に対する出力として、前記複数のアクションに対する評価の推定値を取得することと、をさらに実行し、
前記複数のアクションに対する評価の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを判定する、
プログラム。
【請求項16】
コンピュータに実行させるためのプログラムであって、
前記コンピュータは、
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回答に基づく、前記学習対象ユーザの消費行動に関する特徴をラベルとして学習に用いる、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を実行し、
前記第1の学習済みモデルの前記第1の学習データは、前記学習対象ユーザの前記行動履歴情報を入力とし、前記学習対象ユーザの前記消費行動に関する特徴と、前記学習対象ユーザによる複数のアクションに対する評価を
ラベルとして学習に用いており、
前記コンピュータは、
前記第1の学習済みモデルへの前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の前記推定値とともに、前記複数のアクションに対する評価の推定値を取得し、
前記複数のアクションに対する評価の前記推定値に基づいて、前記推定対象ユーザに有効と推定されるアクションを判定する
、
プログラム。
【請求項17】
前記第1の学習済みモデルの前記第1の学習データは、前記学習対象ユーザによる前記アンケートの回答に基づく、前記学習対象ユーザの前記消費行動に関する特徴の分類を
ラベルとして学習に用いており、
前記コンピュータは、前記第1の学習済みモデルの前記推定対象ユーザの行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の分類の前記推定値を取得する、
請求項
15又は16に記載のプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、情報処理方法、情報処理装置、及び、プログラムに関する。
【背景技術】
【0002】
アンケートの回答に基づいて、複数の対象ユーザを複数の特性のうちのいずれかに分類し、行動履歴が所定の基準を満たす対象ユーザを教師ユーザとして、教師ユーザの行動履歴と特性とによって学習された学習済みモデルを生成する技術が開示されている(例えば、特許文献1)。推定ユーザの行動履歴と当該学習済みモデルとを用いることで、当該推定ユーザの特性を推定することができる。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
開示の態様の一つは、各ユーザに応じた有効なアクションを提案可能な情報処理方法、情報処理装置、及び、プログラムを提供することを課題とする。
【課題を解決するための手段】
【0005】
本開示の態様の一つは、
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回答に基づく、前記学習対象ユーザの消費行動に関する特徴を出力とする、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づく、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を含む情報処理方法である。
【0006】
本開示の他の態様の一つは、
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、前記学習対象ユーザによるアンケートの回答に基づく、前記学習対象ユーザの消費行動に関する特徴を出力とする、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づく、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を実行する制御部、
を備える情報処理装置である。
【0007】
本開示の他の態様の一つは、
コンピュータに、
推定対象ユーザの行動履歴情報を取得することと、
学習対象ユーザの行動履歴情報を入力とし、学習対象ユーザによるアンケートの回答に基
づく、前記学習対象ユーザの消費行動に関する特徴を出力とする、複数の学習対象ユーザについての第1の学習データによって学習された第1の学習済みモデルへの、前記推定対象ユーザの前記行動履歴情報の入力に対する出力として、前記推定対象ユーザの消費行動に関する特徴の推定値を取得することと、
前記推定対象ユーザの消費行動に関する特徴の前記推定値に基づく、前記推定対象ユーザに有効と推定されるアクションを出力することと、
を実行させるためのプログラムである。
【発明の効果】
【0008】
本開示によれば、各ユーザに応じた有効なアクションを提案することができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、第1実施形態に係るアクション推定システムにおけるアクションの推定の流れを示す図の一例である。
【
図2】
図2は、情報処理装置のハードウェア構成の一例を示す図である。
【
図3】
図3は、情報処理装置の機能構成の一例を示す図である。
【
図4】
図4は、ウェブ閲覧アクセスログデータの一例である。
【
図6】
図6は、価値観及び消費行動の傾向に関するアンケートの回答データの一例である。
【
図7】
図7は、施策評価に関するアンケートの回答データの一例である。
【
図8】
図8は、クラスタ推定モデルの学習データとなる統合データの一例である。
【
図9】
図9は、クラスタ推定モデルの学習時の入力データ及び出力データの一例を示す図である。
【
図10】
図10は、施策推定モデルの学習データとなる統合データの一例である。
【
図11】
図11は、施策推定モデルの入力データ及び出力データの一例を示す図である。
【
図12】
図12は、アクション推定システムにおけるクラスタ推定モデル及び施策推定モデルの学習処理のフローチャートの一例である。
【
図13】
図13は、アクション推定システムにおける推定制御処理のフローチャートの一例である。
【
図14】
図14は、変形例に係るアクション推定システムにおけるアクションの推定の流れを示す図の一例である。
【発明を実施するための形態】
【0010】
本開示の態様の一つは、情報処理方法である。情報処理方法は、例えば、サーバ等のコンピュータによって実行される。当該情報処理方法は、推定対象ユーザの行動履歴情報を取得することと、第1の学習済みモデルへの、推定対象ユーザの行動履歴情報の入力に対する出力として、推定対象ユーザの消費行動に関する特徴の推定値を取得することと、推定対象ユーザの消費行動に関する特徴の推定値に基づいて、推定対象ユーザに有効と推定されるアクションを出力することと、を含む。第1の学習済みモデルは、学習対象ユーザの行動履歴情報を入力とし、学習対象ユーザによるアンケートの回答に基づく、学習対象ユーザの消費行動に関する特徴を出力とする、複数の学習対象ユーザについての第1の学習データによって学習済みである。
【0011】
学習対象ユーザは、学習済みモデルの学習データの対象となるユーザである。推定対象ユーザは、学習済みモデルを用いた推定の対象となるユーザである。行動履歴情報は、例えば、ウェブページの閲覧アクセスログデータである。ただし、行動履歴情報は、ウェブページの閲覧アクセスログデータに限定されず、ウェブページの検索ログデータであってもよい。また、行動履歴情報は、ウェブ上の行動履歴情報に限定されず、実世界上の行動
に関する履歴情報であってもよい。行動履歴情報として採用される実世界上の行動は、例えば、実店舗への来店、及び、購入等である。
【0012】
消費行動に関する特徴は、例えば、購入する商品又はサービスに対する価値観、及び、消費行動の傾向等である。購入する商品又はサービスに対する価値観とは、購入の際に何を重視するかということである。例えば、ブランドを重視するユーザもいれば、機能性を重視するユーザもいる。または、コストパフォーマンス又はエコロジーであるかを重視するユーザもいる。消費行動の傾向は、例えば、即決するのか、又は、慎重に検討するのか、といった購入までにかかる時間的傾向、及び、独断で購入を決めるのか、又は、他人の意見に傾聴するのか、といった検討方法の傾向等がある。
【0013】
消費行動に関する特徴は、客観的な事実を示す情報である行動履歴情報に反映されている。そのため、本開示の態様の一つでは、学習対象ユーザの行動履歴情報を入力とし、学習対象ユーザのアンケート回答という主観的な情報に基づいて取得された消費行動に関する特徴を出力とする第1の学習データで学習済みの第1の学習済みモデルが用いられる。これによって、推定対象ユーザの行動履歴情報から当該推定対象ユーザの消費行動に関する特徴を推定することができる。
【0014】
推定対象ユーザに有効と推定されるアクションは、例えば、販売促進のためのアクション、及び、商品企画のためのアクション等がある。販売促進のためのアクションには、例えば、提案する商品の決定、販売促進の方法、提案する購入方法の決定、及び、提案する利用形態の決定がある。販売促進の方法には、例えば、ウェブページに広告を表示する、電話をかける、ダイレクトメールを郵送する、電子メールを送信する、及び、訪問する等がある。購入方法には、例えば、現金一括払い、ローン、及び、リース等がある。利用形態には、例えば、購入、リース、及び、シェア等がある。
【0015】
本開示の態様の一つによれば、推定対象ユーザの行動履歴情報から当該推定対象ユーザの消費行動に関する特徴が推定され、推定された推定対象ユーザの消費行動に関する特徴に応じて有効なアクションを推定することができる。これによって、推定対象ユーザに対して有効なアクションを行うことができ、推定対象ユーザに対して行われるアクションの効果を向上させることができる。
【0016】
本開示の態様の一つでは、推定対象ユーザに有効と推定されるアクションは、第2の学習済みモデルへ、推定対象ユーザの消費行動に関する特徴の推定値を入力して、出力として、複数のアクションに対する評価の推定値を取得し、複数のアクションに対する評価の推定値に基づいて、取得されてもよい。第2の学習済みモデルは、学習対象ユーザの消費行動に関する特徴を入力とし、学習対象ユーザによる複数のアクションに対する評価を出力とする、当該複数の学習対象ユーザについての第2の学習データによって学習されたモデルである。
【0017】
または、推定対象ユーザに有効と推定されるアクションは、学習対象ユーザの行動履歴情報を入力とし、学習対象ユーザの消費行動に関する特徴と、学習対象ユーザによる複数のアクションに対する評価を出力とする第1の学習データによって学習させた上述の第1の学習済みモデルを用いて取得されてもよい。具体的には、当該第1の学習済みモデルへ推定対象ユーザの行動履歴情報を入力して、当該推定対象ユーザの消費行動に関する特徴の推定値とともに、複数のアクションに対する評価の推定値を取得し、複数のアクションに対する評価の推定値に基づいて、推定対象ユーザに有効と推定されるアクションを判定してもよい。
【0018】
学習対象ユーザによる複数のアクションに対する評価は、例えば、アンケート調査、購
入実績の調査、及び、行動実績の調査等から取得される。例えば、アクションが販売促進の方法である場合には、学習対象ユーザによる複数のアクションに対する評価は、アンケート調査によって取得される。例えば、アクションが提案する商品の決定である場合には、学習対象ユーザによる複数のアクションに対する評価は、学習対象ユーザの購入した商品の調査によって取得される。
【0019】
本開示の態様の一つによれば、推定対象ユーザの評価が高くなることが推定されるアクションを特定することができる。これによって、推定対象ユーザに効率よくアクションを行うことができる。
【0020】
本開示の態様の一つでは、第1の学習済みモデルの第1の学習データは、学習対象ユーザによるアンケートの回答に基づく、学習対象ユーザの消費行動に関する特徴の分類を出力としてもよい。この場合に、第1の学習済みモデルの推定対象ユーザの行動履歴情報の入力に対する出力として、推定対象ユーザの消費行動に関する特徴の分類の推定値を取得してもよい。これによって、行動履歴情報が一万単位で存在する場合でも、分類の数だけ消費行動に関する特徴をスケールダウンさせることができ、処理効率を向上させることができる。
【0021】
また、本開示の態様の一つでは、情報処理方法は、第1の学習済みモデルに、第1の学習データによって学習させることを含んでもよい。これによって、例えば、第1の学習済みモデルを定期的に新たな第1の学習データで学習させて、更新することができる。
【0022】
本開示の他の態様として、上述の情報処理方法を実行する情報処理装置、コンピュータに上述の情報処理方法の処理を実行させるためのプログラム、及び、当該プログラムを記憶した非一時的なコンピュータ読み取り可能な記録媒体としても特定することができる。
【0023】
以下、図面に基づいて、本発明の実施の形態を説明する。以下の実施形態の構成は例示であり、本発明は実施形態の構成に限定されない。
【0024】
<第1実施形態>
図1は、第1実施形態に係るアクション推定システム100におけるアクションの推定の流れを示す図の一例である。アクション推定システム100は、ユーザの行動履歴情報から当該ユーザに対して有効なアクションを推定するシステムである。第1実施形態では、アクションは販売促進の施策であり、行動履歴情報はウェブページの閲覧アクセスログデータであることを想定する。すなわち、第1実施形態に係るアクション推定システム100は、ユーザのウェブページの閲覧アクセスログデータから、当該ユーザに対して有効な販売促進の施策を推定するシステムである。
【0025】
アクション推定システム100は、クラスタ推定モデルM1と施策推定モデルM2とを用いる。クラスタ推定モデルM1は、ユーザのウェブ閲覧アクセスログデータD1から当該ユーザの消費行動に関する特徴を推定するモデルである。ユーザの消費行動に関する特徴は、例えば、購入する商品又はサービスに対する価値観、及び、消費行動の傾向等である。購入する商品又はサービスに対する価値観とは、例えば、ブランド重視、機能性重視、コストパフォーマンス重視、及び、エコロジー重視等である。消費行動の傾向は、例えば、即決派又は慎重派等の購入までにかかる時間的傾向、及び、独断派又は傾聴派等の検討方法の傾向等がある。第1実施形態では、ユーザの消費行動に関する特徴は、価値観と消費行動の傾向との所定数の組み合わせで分類される。ユーザに関する特徴の分類を、以下、価値観クラスタと称する。すなわち、第1実施形態では、クラスタ推定モデルM1は、ユーザのウェブ閲覧アクセスログデータD1から当該ユーザの価値観クラスタD2を推定するためのモデルである。施策推定モデルM2は、価値観クラスタD2から当該ユーザ
に対して有効な施策データD3を推定するためのモデルである。
【0026】
クラスタ推定モデルM1及び施策推定モデルM2は、それぞれ、学習済みモデルである。クラスタ推定モデルM1は、学習対象ユーザのウェブ閲覧アクセスログデータL1、サイト分類マスタL2、学習対象ユーザの価値観及び消費行動に関するアンケート回答データL3から作成された統合データL4を学習データとして学習している。施策推定モデルM2は、価値観及び消費行動に関するアンケート回答データL3と施策評価に関するアンケート回答データL5から作成された統合データL6を学習データとして学習している。クラスタ推定モデルM1は、「第1の学習済みモデル」の一例である。施策推定モデルM2は、「第2の学習済みモデル」の一例である。
【0027】
ウェブ閲覧アクセスログデータL1及びD1は、ユーザが所定のユーザ端末を用いてアクセスし、閲覧したウェブページの履歴情報である。ウェブ閲覧アクセスログデータL1及びD1には、例えば、ユーザの識別情報、アクセス日時、アクセスしたURL、及び、アクセス回数等が含まれている。ウェブ閲覧アクセスログデータL1及びD1は、例えば、ブラウザを提供する所定の組織によって収集されており、当該組織から取得することができる。
【0028】
サイト分類マスタL2は、ウェブサイトの分類を定義するマスタである。サイト分類マスタL2は、例えば、所定の組織によって公開されている。サイト分類マスタL2を用いて、ウェブ閲覧アクセスログデータL1及びD1のそれぞれが示すウェブページのジャンルが特定される。アンケート回答データL3及びL5は、例えば、ウェブを通じて、アクション推定システム100の管理組織又は所定のアンケート実施組織によって収集されたアンケートの回答データである。当該アンケートは、それぞれのユーザに対して、所定のタイミングで実施される。
【0029】
ウェブ閲覧アクセスログデータは、ユーザの価値観及び消費行動の傾向が反映されたデータであり、客観的事実を示すデータである。第1実施形態では、ウェブ閲覧アクセスログデータから当該ユーザの価値観クラスタを推定し、推定したユーザの価値観クラスタから有効な施策データを推定することで、当該ユーザの価値観及び消費行動の傾向に合わせた施策を行うことができる。これによって、当該施策によるユーザの消費行動への影響を高めることができる。
【0030】
また、ウェブ閲覧アクセスログデータは、例えば、ブラウザを提供する所定の組織等によってリアルタイムに収集されていることが多く、比較的収集しやすいデータである。したがって、ウェブ閲覧アクセスログデータを用いることによって、情報収集に係る人的コスト及び金銭的コストを低く抑えることができ、アクション推定システム100を容易に構築しやすくなっている。
【0031】
図2は、情報処理装置1のハードウェア構成の一例を示す図である。情報処理装置1は、アクション推定システム100の推定処理を実施する装置である。情報処理装置1は、例えば、サーバ等の専用のコンピュータ、又は、PC(Personal Computer)等の汎用のコンピュータである。情報処理装置1は、ハードウェア構成として、CPU(Central Processing Unit)101、メモリ102、外部記憶装置103、入力部104、出力部1
05、及び、通信部106を有する。メモリ102および外部記憶装置103は、コンピュータで読み取り可能な記録媒体である。
【0032】
外部記憶装置103は、様々なプログラムや、各プログラムの実行に際してCPU 101が使用するデータを格納する。外部記憶装置103は、例えば、EPROM(Erasable Programmable ROM)やハードディスクドライブ(Hard Disk Drive)である。外部記憶
装置103に保持されるプログラムには、例えば、オペレーティングシステム(OS)、アクション推定プログラム、その他様々なアプリケーションプログラムを保持する。アクション推定プログラムは、ユーザの行動履歴情報から当該ユーザに対して有効なアクションを推定するためのプログラムである。
【0033】
メモリ102は、CPU 101に、外部記憶装置103に格納されているプログラムをロードする記憶領域および作業領域を提供したり、バッファとして用いられたりする記憶装置である。メモリ102は、例えば、ROM(Read Only Memory)、RAM(Random
Access Memory)のような半導体メモリを含む。
【0034】
CPU 101は、外部記憶装置103に保持されたOSや様々なアプリケーションプログラムをメモリ102にロードして実行することによって、様々な処理を実行する。CPU 101は、1つに限られず、複数備えられてもよい。CPU 101は、「情報処理装置」の「制御部」の一例である。
【0035】
入力部104は、例えば、キーボード、又は、マウス等のポインティングデバイス等の入力装置である。入力部104から入力された信号は、CPU 101へ出力される。出力部105は、ディスプレイ、及び、プリンタ等の出力装置である。出力部105は、CPU 101からの信号の入力に応じて情報を出力する。なお、入力部104及び出力部105は、それぞれ、音声の入力装置及び出力装置であってもよい。
【0036】
通信部106は、ネットワークとの情報の入出力を行うインタフェースである。通信部106は、有線のネットワークと接続するインタフェースであってもよいし、無線のネットワークと接続するインタフェースであってもよい。通信部106は、例えば、NIC(Network Interface Card)や無線回路等である。なお、情報処理装置1のハードウェア構成は、
図2に示されるものに限定されない。
【0037】
図3は、情報処理装置1の機能構成の一例を示す図である。情報処理装置1は、機能構成要素として、学習制御部11、推定制御部12、クラスタ推定モデル13、施策推定モデル14、ウェブ閲覧アクセスログデータベース(DB) 15、サイト分類マスタ16、及び、アンケート回答DB 17を備える。これらの機能構成要素は、例えば、情報処理装置1のCPU 101がアクション推定プログラムを実行することによって達成される。
【0038】
学習制御部11は、クラスタ推定モデル13及び施策推定モデル14の作成及び更新の処理を行う。クラスタ推定モデル13及び施策推定モデル14の作成及び更新のいずれについても、学習制御部11は、学習データを取得し、クラスタ推定モデル13及び施策推定モデル14に学習データを入力して学習させる。学習データは、所定期間における、ウェブ閲覧アクセスログデータL1、アンケート回答データL3及びL5を収集し、統合データL4及びL6を生成することによって取得される。学習データが取得される期間は、例えば、1カ月から1年単位の任意の期間である。また、学習データが取得される期間は、クラスタ推定モデル13及び施策推定モデル14の作成時と更新時とで同じであってもよいし、異なっていてもよい。
【0039】
学習制御部11は、クラスタ推定モデル13及び施策推定モデル14の更新を所定のタイミングで行う。クラスタ推定モデル13及び施策推定モデル14の更新のタイミングは、例えば、予め決められた周期、予め決められたイベントの発生、及び、学習指示の入力等である。クラスタ推定モデル13及び施策推定モデル14の更新の周期は、例えば、1カ月から1年の間の任意の期間に設定される。なお、クラスタ推定モデル13及び施策推定モデル14の更新は、同じタイミングで行われてもよいし、それぞれが独立したタイミ
ングで行われてもよい。クラスタ推定モデル13及び施策推定モデル14の学習の詳細については、後述される。
【0040】
推定制御部12は、例えば、推定開始の指示が入力されると、アクションの推定を開始する。推定開始の指示は、例えば、入力部104を通じて、又は、ネットワーク経由でユーザ端末から入力される。具体的には、推定制御部12は、所定期間におけるウェブ閲覧アクセスログデータを取得する。取得されるウェブ閲覧アクセスログデータは、例えば、最新のものである。推定制御部12は、取得したウェブ閲覧アクセスログデータに含まれるユーザごとに、クラスタ推定モデル13への入力データを生成する。クラスタ推定モデル13への入力データは、例えば、1ユーザについての、閲覧したウェブページのジャンルごとのアクセス数、アクセス頻度、ウェブページの閲覧時間等をスコアリングしたものである。推定制御部12は、各ユーザについて、生成した入力データをクラスタ推定モデル13に入力して、価値観クラスタD2の推定値を取得する。次に、推定制御部12は、クラスタ推定モデル13から取得した価値観クラスタD2の推定値を施策推定モデル14へ入力して、各施策についての評価の推定値を取得する。推定制御部12は、評価の推定値が上位の所定数の施策をリスト化して出力する。出力される施策のリストを、以降、提案施策リストと称する。第1実施形態では、1ユーザについて1つの提案施策リストが出力される。提案施策リストは、例えば、推定開始の指示に応じて、出力部105から出力されたり、又は、ネットワーク経由でユーザ端末へ送信されたりする。推定処理の詳細については、後述される。
【0041】
クラスタ推定モデル13及び施策推定モデル14は、それぞれ、学習済みモデルである。クラスタ推定モデル13及び施策推定モデル14は、入力値を与えられると、所定の演算を行い、演算結果を出力値として出力する。第1実施形態では、クラスタ推定モデル13は、ウェブ閲覧アクセスログデータに基づく入力値に対して、価値観クラスタD2の推定値を出力値として出力するように、学習済みである。施策推定モデル14は、価値観クラスタD2の推定値の入力値に対して、各施策の評価の推定値を出力値として出力するように、学習済みである。
【0042】
クラスタ推定モデル13及び施策推定モデル14は、それぞれ、ニューラルネットワーク、ロジスティック回帰、木、ベイズ、時系列等の教師あり学習を行う機械学習モデルである。ただし、クラスタ推定モデル13及び施策推定モデル14は、特定の機械学習モデルに限定されない。また、クラスタ推定モデル13及び施策推定モデル14の学習方法も特定の学習方法に限定されない。また、クラスタ推定モデル13及び施策推定モデル14は、同じ方式の機械学習モデルであってもよいし、異なる方式の機械学習モデルであってもよい。
【0043】
例えば、クラスタ推定モデル13及び施策推定モデル14がニューラルネットワークを有する場合の処理は以下の通りである。以下、クラスタ推定モデル13及び施策推定モデル14をまとめて、推定モデルと称する。推定モデルには、パラメータ列{xi、i=1、2、・・・、N}が入力される。推定モデルは、入力されたパラメータ列に重み係数{wi,j,l,(ここで、jは1から畳み込み演算される要素数Mまでの値、lは1から階層の数Lまでの値)}で積和演算する畳み込み処理と、畳み込み処理の結果を判定する活性化関数と、畳み込み処理に対する活性化関数の判定結果から一部を間引く処理であるプーリング処理とを実行する。推定モデルは、以上の処理をパラメータ列が入力される入力層から最上位の全結合層まで複数階層Lに渡って繰り返し実行し、最終段階の全結合層で出力パラメータ(または出力パラメータ列){yk、k=1,・・・、P}を出力する。教師ありモデルでの学習では、出力パラメータ(出力値)と正解データ(ラベル)とが比較され、エラーが算出される。エラーは、上記ニューラルネットワークを複数階層に渡って最上位の全結合層から入力層に逆伝搬され、重み係数が調整される。また、学習済み
の推定モデルに新たなパラメータ列が入力されると、推定モデルは、入力されたパラメータ列に対して、出力パラメータを出力する。
【0044】
ウェブ閲覧アクセスログDB 15、サイト分類マスタ16、及び、アンケート回答DB 17は、それぞれ、外部記憶装置103の記憶領域に作成される。ウェブアクセスログDB 15には、ウェブ閲覧アクセスログデータが格納されている。サイト分類マスタ16には、ウェブサイトのジャンルを定義するマスタが格納されている。アンケート回答DB 17には、価値観及び消費行動の傾向に関するアンケートの回答データ、及び、各施策に対する評価のアンケートの回答データが格納されている。これらの各データの詳細については、後述される。
【0045】
なお、
図3に示される情報処理装置1のそれぞれの又は複数の機能構成要素は、他の装置による処理によって達成されてもよい。例えば、1の情報処理装置1が学習制御部11、推定制御部12、ウェブ閲覧アクセスログDB 15、サイト分類マスタ16、及び、アンケート回答DB 17を備え、他の情報処理装置1がクラスタ推定モデル13及び施策推定モデル14を備え、両方の情報処理装置1が連携してアクション推定システム100の処理を行ってもよい。
【0046】
<データの説明>
図4から
図7では、アクション推定システム100で用いられるデータについて説明される。
図4は、ウェブ閲覧アクセスログデータの一例である。ウェブ閲覧アクセスログデータには、例えば、ユーザの識別情報、アクセス日時、アクセス先のウェブページのURL、及び、アクセス回数等が含まれている。ウェブ閲覧アクセスログデータは、例えば、ブラウザを通じてウェブページにアクセスする際に、当該ブラウザによって、当該ブラウザの提供組織へ送信される。ウェブ閲覧アクセスログデータに含まれるユーザの識別情報は、ブラウザの提供組織によって自動付与されるものであり、当該ブラウザの提供組織が管轄する範囲において用いられる識別情報であり、ユーザ個人を特定できるような識別情報ではない。
【0047】
ウェブ閲覧アクセスログデータは、例えば、学習制御部11によって所定の周期でウェブ閲覧アクセスログデータを保有する組織から取得され、ウェブアクセスログDB 15に格納されてもよい。または、学習制御部11は、クラスタ推定モデル13及び施策推定モデル14の学習の際に、最新の所定期間におけるウェブアクセスログデータを所定の組織から取得するようにしてもよい。また、推定制御部12は、例えば、推定開始の指示が入力されたことを契機に、所定の組織から最新の所定期間におけるウェブアクセスログデータを所定の組織から取得するようにしてもよい。なお、ウェブ閲覧アクセスログデータに含まれる情報は、
図4に示される例に含まれる情報に限定されない。
【0048】
図5は、サイト分類マスタの一例である。サイト分類マスタは、例えば、ブラウザの提供組織によって公開されており、学習制御部11によって、当該組織から予め取得されてサイト分類マスタ16に格納されている。サイト分類マスタには、例えば、URL、分類の大項目、及び中項目等の対応付けが含まれている。サイト分類マスタを用いることによって、ウェブ閲覧アクセスログデータに含まれるアクセス先のウェブページのジャンルを特定することができ、例えば、ジャンルごとにアクセス数及びアクセス頻度等を算出することができる。サイト分類マスタは、所定の周期で更新されるので、学習制御部11は、公開している組織から所定の周期でサイト分類マスタを取得し、サイト分類マスタ16を更新する。なお、サイト分類マスタに含まれる情報は、
図5に示される例に含まれる情報に限定されない。
【0049】
図6は、価値観及び消費行動の傾向に関するアンケートの回答データの一例である。価
値観及び消費行動の傾向に関するアンケートの回答データは、ウェブを通じてユーザ端末から収集される。価値観及び消費行動の傾向に関するアンケートの回答データは、アンケートの実施組織によって保持されており、学習制御部11は、当該組織から当該アンケートの回答データを取得する。なお、アンケートの実施組織は、アクション推定システム100の管理組織と同一である場合もある。
【0050】
価値観及び消費行動の傾向に関するアンケートには、例えば、ユーザ属性に関する1又は複数の質問、消費に関する価値観についての質問、及び、消費行動の傾向についての質問が含まれている。それぞれの質問の回答方式は、例えば、複数の選択肢からユーザ自身にあっている選択肢を選択する方式である。例えば、
図6に示される回答データには、ユーザの識別情報、ユーザ属性、価値観に関する質問に対する回答、及び、消費行動の傾向に関する質問に対する回答が含まれている。ユーザの識別情報は、ブラウザの提供組織によって自動付与されるものである。1のユーザ端末は、同じブラウザを用いてウェブページにアクセスする際には、同じユーザの識別情報を用いるので、
図6に示される回答データに含まれるユーザの識別情報と、ウェブ閲覧アクセスログデータに含まれるユーザ識別情報とは、同じユーザ端末であれば同じ識別情報となる。すなわち、ユーザの識別情報によって、ウェブ閲覧アクセスログデータとアンケートの回答データとを紐づけることができる。
【0051】
図6に示される価値観及び消費行動の傾向に関するアンケートの回答データには、価値観に関する質問の回答、及び、消費行動の傾向に関するの質問の回答には、それぞれの選択肢が含まれている。ユーザが選択した選択肢のフィールドには、フラグが立っている。すなわち、
図6に示される例は、購入についての価値観についての質問として、例えば、「購入の際にどのような点を重視しますか?」という質問に対して、「ブランド重視」、「機能性重視」、...等の選択肢、消費行動の傾向についての質問として、「購入の決定はどのような傾向がありますか?」という質問に対して、「慎重派」、「独断派」、...等の選択肢が含まれたアンケートが実施された場合の回答例である。なお、価値観及び消費行動の傾向に関するアンケート、及び、当該アンケートの回答データは、それぞれ、
図6において説明された例に限定されない。
【0052】
図7は、施策評価に関するアンケートの回答データの一例である。施策評価に関するアンケートの回答データは、ウェブを通じてユーザ端末から収集される。施策評価に関するアンケートの回答データは、アンケートの実施組織によって保持されており、学習制御部11は、当該組織から当該アンケートの回答データを取得する。なお、施策評価に関するアンケートと価値観及び消費行動の傾向に関するアンケートとの実施組織は、同じであっても異なっていてもよい。
【0053】
施策評価に関するアンケートには、例えば、各施策に対する評価についての質問が含まれている。したがって、施策評価に関するアンケートの回答データは、各施策についての評価である。
図7に示される例では、各施策についての評価値として、各施策に対するユーザの反応率が用いられている。施策に対するユーザの反応率は、例えば、施策の実施回数に対して、施策を受けてユーザが施策の対象の商品又はサービスに対して何らかの行動を行ったと回答した数の割合である。施策の対象の商品又はサービスに対する行動は、例えば、当該商品又はサービスに対するウェブページの検索及び閲覧、当該商品又はサービスについての検討のための来店、及び、当該商品又はサービス等の購入である。なお、施策評価に関するアンケート、及び、当該アンケートの回答データは、それぞれ、
図7において説明された例に限定されない。
【0054】
<学習済みモデルの学習及び推定>
図8及び
図9は、クラスタ推定モデル13の学習及びクラスタ推定モデル13による推
定を説明するための図である。
図10及び
図11は、施策推定モデル14の学習及び施策推定モデル14による推定を説明するための図である。以降、学習データの対象のユーザは、学習対象ユーザと称される。また、推定の対象のユーザは、推定対象ユーザと称される。
【0055】
図8は、クラスタ推定モデル13の学習データとなる統合データの一例である。学習制御部11は、所定期間における、ウェブ閲覧アクセスログデータ(
図4参照)、サイト分類マスタ(
図5参照)、価値観及び消費行動の傾向に関するアンケートの回答データ(
図6参照)を統合して、統合データを生成する。
図8に示される例では、1つのウェブ閲覧アクセスログデータに対して、URLのジャンルに該当するサイト分類マスタのレコードと、同じユーザの識別情報を有するアンケートの回答データとを結びつけて、1つの統合データが生成されている。
【0056】
ウェブ閲覧アクセスログデータ及び価値観及び消費行動の傾向に関するアンケートの回答データのいずれか一方にしか存在しないユーザの識別情報に該当するデータは、学習データの対象からは除外される。すなわち、学習データ用に取得された所定期間におけるウェブ閲覧アクセスログデータと価値観及び消費行動の傾向に関するアンケートの回答データとの両方に存在するユーザが、クラスタ推定モデル13の学習対象ユーザとなる。
【0057】
統合データのうち、ウェブ閲覧アクセスログデータ部分、サイト分類マスタ部分、及び、価値観及び消費行動の傾向に関するアンケートの回答データに含まれるユーザ属性部分が、クラスタ推定モデル13の学習データの入力データに相当する部分である。価値観及び消費行動の傾向に関するアンケートの回答データに含まれる選択肢部分が、クラスタ推定モデル13の学習データのラベルである。
【0058】
図9は、クラスタ推定モデル13の学習時の入力データ及び出力データの一例を示す図である。学習制御部11は、学習時のクラスタ推定モデル13への入力データを統合データから作成する。例えば、以下のようにして入力データが取得される。
【0059】
学習制御部11は、統合データの入力データに相当する部分を、学習対象ユーザの識別情報ごとにまとめる。したがって、1の学習対象ユーザにつき1つの入力データが作成される。学習制御部11は、各学習対象ユーザの統合データの入力データに相当する部分から、例えば、ウェブページの各ジャンルについて、ウェブページのアクセス数、アクセス頻度、及び、平均閲覧時間等を取得する。ウェブページのジャンルは、サイト分類マスタで定義されているもののうち、大項目、大項目と中項目の組み合わせ、及び、さらに細かい分類のいずれかが用いられ、ジャンルの粒度は任意に設定可能である。
【0060】
学習制御部11は、全ジャンルについての、アクセス数、アクセス頻度、及び、平均閲覧時間等とから、各ジャンルをスコアリングする。スコアリングは、例えば、学習対象ユーザの興味及び関心が高いジャンルほど高いスコアが取得され、学習対象ユーザの興味及び関心の低いジャンルほど小さいスコアが取得されるように行われる。学習制御部11は、入力データとして、全ジャンルのスコアとユーザ属性である年齢と性別とを取得する。
【0061】
入力データがクラスタ推定モデル13に入力されると、例えば、各学習対象ユーザについて、価値観及び消費行動の傾向に関するアンケートの回答データと同様のフォーマットの出力データが取得される。当該出力データは、各学習対象ユーザの価値観クラスタの推定値を示す。クラスタ推定モデル13の学習時には、クラスタ推定モデル13の出力と統合データ内のラベル相当部分との値を比較し、その誤差が小さくなるようにクラスタ推定モデル13のパラメータが調整されることが所定回数繰り返されることで学習が行われる
。
【0062】
クラスタ推定モデル13を用いて価値観クラスタの推定値を取得する場合には、推定制御部12は、所定期間におけるウェブ閲覧アクセスログデータを取得する。推定制御部12によって取得されたウェブ閲覧アクセスログデータに含まれるユーザが推定対象ユーザとなる。
【0063】
推定制御部12は、学習時の入力データの作成と同様にして、取得したウェブ閲覧アクセスログデータとサイト分類マスタとに基づいて、
図9に示されるような入力データを作成する。ただし、ウェブ閲覧アクセスログデータには、年齢及び性別等のユーザ属性の情報は含まれていないため、推定時の入力データには、ユーザ属性の情報は不明又はNullを示すデータが用いられる。
【0064】
推定制御部12は、クラスタ推定モデル13に作成した入力データを入力して、クラスタ推定モデル13の出力データを取得する。クラスタ推定モデル13の出力データは、例えば、
図9に示されるような価値観及び消費行動の傾向に関するアンケートの回答データと同様のフォーマットの、価値観及び消費行動の傾向に関するアンケートの各選択肢が選択される確率である。学習時にラベルとして用いられる価値観及び消費行動の傾向に関するアンケートの回答データでは、各選択肢が選択される確率は1から0であるが、推定時のクラスタ推定モデル13の出力データは各選択肢が選択される確率を示すため、0から1の間の値となる。そのため、推定制御部12は、所定の閾値を用いて、各選択肢が選択される確率を0と1の2値化を行う。その結果、推定制御部12は、1となった選択肢の組み合わせで、推定対象ユーザの価値観クラスタの推定値を得る。例えば、価値観の項目でブランド重視のフィールドの値が1であり、消費行動傾向の項目で慎重派のフィールドの値が1である推定対象ユーザの価値観クラスタは、「ブランド重視で慎重派」ということになる。
【0065】
図10は、施策推定モデル14の学習データとなる統合データの一例である。学習制御部11は、所定期間における、価値観及び消費行動の傾向に関するアンケートの回答データ(
図6参照)、及び、施策評価に関するアンケートの回答データ(
図7参照)を統合して、統合データを生成する。
図10に示される例では、同じユーザの識別情報を有する両アンケートの回答データを結びつけて、1つの統合データが生成されている。
【0066】
価値観及び消費行動の傾向に関するアンケートの回答データ及び施策評価に関するアンケートの回答データのいずれか一方にしか存在しないユーザの識別情報に該当するデータは、学習データの対象からは除外される。すなわち、学習データ用に取得された所定期間における価値観及び消費行動の傾向に関するアンケートの回答データと施策評価に関するアンケートの回答データとの両方に存在するユーザが、施策推定モデル14の学習対象ユーザとなる。
【0067】
統合データのうち、価値観及び消費行動の傾向に関するアンケートの回答データの部分が、施策推定モデル14の学習データの入力データに相当する部分である。施策評価に関するアンケートの回答データ部分が、施策推定モデル14の学習データのラベルである。
【0068】
図11は、施策推定モデル14の入力データ及び出力データの一例を示す図である。学習時の施策推定モデル14の入力データは、所定期間における学習対象ユーザの価値観及び消費行動の傾向に関するアンケートの回答データである。
【0069】
入力データがクラスタ推定モデル13に入力されると、例えば、各学習対象ユーザについて、各施策に対する評価値の推定値が出力データとして取得される。施策推定モデル1
4の学習時には、施策推定モデル14の出力データと統合データ内のラベル相当部分との値を比較し、その誤差が小さくなるように施策推定モデル14のパラメータが調整されることを所定回数繰り返すことで学習が行われる。
【0070】
施策推定モデル14を用いて各施策の評価値の推定値を取得する場合には、推定制御部12は、クラスタ推定モデル13の出力データとして取得された価値観クラスタの推定値を施策推定モデル14に入力する。施策推定モデル14からの出力データとして、各推定対象ユーザの各施策に対する評価値の推定値が取得される。推定制御部12は、例えば、評価値が大きいほど評価が高いことを示す場合には、各ユーザの出力データについて、評価値の推定値が大きい順で施策を並び替え、上位所定数の施策をリスト化して出力する。
【0071】
<処理の流れ>
図12は、アクション推定システム100におけるクラスタ推定モデル13及び施策推定モデル14の学習処理のフローチャートの一例である。
図12に示される処理は、例えば、学習開始指示の入力、又は、所定の周期で実行される。
図12に示される処理の実行主体は、情報処理装置1のCPU 101であるが、便宜上、機能構成要素を主体として説明する。
図13についても同様である。なお、
図12の処理は、クラスタ推定モデル13及び施策推定モデル14それぞれについて実行される。
図12では、クラスタ推定モデル13と施策推定モデル14とを区別せず、単に、学習済みモデルと称する。
【0072】
OP101では、学習制御部11は、統合データを生成する(
図8、
図10参照)。OP102では、学習制御部11は、統合データから学習済みモデルへの入力データを生成する(
図9、
図11参照)。OP103では、学習制御部11は、生成した入力データとラベルとを学習済みモデルへ入力して学習させる。学習済みモデルの学習が終了すると、
図12に示される処理が終了する。
【0073】
図13は、アクション推定システム100における推定制御処理のフローチャートの一例である。
図13に示される処理は、例えば、推定開始指示の入力、又は、所定の周期で実行される。
【0074】
OP201では、推定制御部12は、所定の組織から、最新の所定期間におけるウェブ閲覧アクセスログデータを取得する。推定制御部12は、取得したウェブ閲覧アクセスログデータからクラスタ推定モデル13への各推定対象ユーザの入力データを作成する(
図9参照)。OP203では、推定制御部12は、作成した入力データをクラスタ推定モデル13へ入力する、OP204では、推定制御部12は、クラスタ推定モデル13の出力データから、各推定対象ユーザの価値観クラスタの推定値を取得する。
【0075】
OP205では、推定制御部12は、各推定対象ユーザの価値観クラスタの推定値を施策推定モデル14へ入力する。OP206では、推定制御部12は、施策推定モデル14の出力データとして、各推定対象ユーザの各施策の評価値の推定値を取得する。OP207では、推定制御部12は、各推定対象ユーザに浮いて、各施策を評価の高い順で並び変えて、上位所定数の施策を含む提案施策リストを作成する。OP208では、推定制御部12は、各推定対象ユーザの提案施策リストを出力する。その後、
図13に示される処理が終了する。
【0076】
なお、
図12及び
図13に示される処理は一例であって、実施の態様によって、適宜、実行順の変更、処理の変更等が可能である。
【0077】
<第1実施形態の作用効果>
第1実施形態によれば、推定対象ユーザのウェブ閲覧アクセスログデータから当該推定
対象ユーザの価値観及び消費行動の傾向が推定され、さらに、当該推定対象ユーザに対して有効な販売促進の施策が推定される。これによって、推定対象ユーザに対して販売促進に有効な施策を実施することができ、当該販売促進の効率を向上させることができる。
【0078】
また、推定対象ユーザの価値観及び消費行動の傾向の推定には、学習済みモデルが用いられる。学習済みモデルは、例えば、未学習のモデルのパッケージを購入し、学習させることで取得可能である。また、ウェブ閲覧アクセスログデータは、収集している組織が既存であるので、比較的入手しやすい。したがって、第1実施形態によれば、人的コストや金銭的コストを抑えて、容易に、推定対象ユーザの価値観及び消費行動の傾向の推定及び推定対象ユーザに対して有効な販売促進の施策の推定を行うことができる。
【0079】
1のユーザの所定期間のウェブ閲覧アクセスログデータは大量のデータとなることが多い。第1実施形態では、ウェブページのジャンルごとの統計値をクラスタ推定モデル13への入力データとして用いることによって、ウェブ閲覧アクセスログデータをそのまま入力データとして用いるよりもデータ量を削減させることができ、処理量を低減させることができる。また、クラスタ推定モデル13の出力データをそのまま用いずに、価値観クラスタとすることで、施策推定モデル14への入力データの量を低減させることができ、処理量を低減させることができる。
【0080】
<変形例>
図14は、変形例に係るアクション推定システム100Bにおけるアクションの推定の流れを示す図の一例である。第1実施形態に係るアクション推定システム100では、学習済みモデルを2つ用いているが、変形例では、用いる学習済みモデルを1つとする。
【0081】
変形例における施策推定モデルM10は、ウェブ閲覧アクセスログデータD10を入力とし、施策データD20と価値観クラスタD30とを出力とする。また、価値観クラスタD30は、施策推定モデルM10へフィードバックされ、施策データD20の推定の入力値として用いられる。
【0082】
施策推定モデルM10の学習データは、ウェブ閲覧アクセスログデータL1、サイト分類マスタL2、価値観及び消費行動の傾向に関するアンケートの回答データL3、及び、施策評価に関するアンケートの回答データL5から取得される。ウェブ閲覧アクセスログデータL1及びサイト分類マスタL2は、学習データの入力データに相当する。価値観及び消費行動の傾向に関するアンケートの回答データL3、及び、施策評価に関するアンケートの回答データL5は、学習データのラベルに相当する。
【0083】
施策推定モデルM10への入力データ及び出力データのフォーマットは、それぞれ、入力データ及び出力データとして用いられるデータと同名の、第1実施形態で説明されたデータと同様である。
【0084】
変形例によれば、1つの学習済みモデルで、推定対象ユーザのウェブ閲覧アクセスログデータから推定対象の価値観クラスタ及び有効なアクションの推定を行うことができる。
【0085】
<その他の実施形態>
上記の実施形態はあくまでも一例であって、本発明はその要旨を逸脱しない範囲内で適宜変更して実施しうる。
【0086】
第1実施形態では、価値観クラスタの推定値から施策を推定する場合に施策推定モデル14が用いられるが、施策推定モデル14を用いずに施策が推定されてもよい。例えば、価値観クラスタごとに、有効な1又は複数の施策が予め設定されておいてもよい。
【0087】
ユーザの行動履歴情報としては、ウェブ閲覧アクセスログデータの他に、ウェブ検索ログデータ、ウェブ上での商品又はサービスの購入履歴情報、及び、ウェブ上で再生した動画データの履歴情報等を用いることもできる。また、ウェブ上の行動に限定されず、実世界における行動履歴情報も用いることができる。実世界における行動履歴情報は、実店舗への来店履歴情報、及び、商品又はサービスの購入履歴情報等がある。
【0088】
また、推定可能なアクションは、販売促進の施策に加えて、提案する商品の決定、提案する購入方法の決定、及び、提案する利用方法の決定等であってもよい。
【0089】
本開示において説明した処理や手段は、技術的な矛盾が生じない限りにおいて、自由に組み合わせて実施することができる。
【0090】
また、1つの装置が行うものとして説明した処理が、複数の装置によって分担して実行されてもよい。あるいは、異なる装置が行うものとして説明した処理が、1つの装置によって実行されても構わない。コンピュータシステムにおいて、各機能をどのようなハードウェア構成(サーバ構成)によって実現するかは柔軟に変更可能である。
【0091】
本開示は、上記の実施形態で説明した機能を実装したコンピュータプログラムをコンピュータに供給し、当該コンピュータが有する1つ以上のプロセッサがプログラムを読み出して実行することによっても実現可能である。このようなコンピュータプログラムは、コンピュータのシステムバスに接続可能な非一時的なコンピュータ可読記憶媒体によってコンピュータに提供されてもよいし、ネットワークを介してコンピュータに提供されてもよい。非一時的なコンピュータ可読記憶媒体は、例えば、磁気ディスク(フロッピー(登録商標)ディスク、ハードディスクドライブ(HDD)等)、光ディスク(CD-ROM、DVDディスク、ブルーレイディスク等)など任意のタイプのディスク、読み込み専用メモリ(ROM)、ランダムアクセスメモリ(RAM)、EPROM、EEPROM、磁気カード、フラッシュメモリ、光学式カード、電子的命令を格納するために適した任意のタイプの媒体を含む。
【符号の説明】
【0092】
1・・情報処理装置
11・・学習制御部
12・・推定制御部
13・・クラスタ推定モデル
14・・施策推定モデル
15・・ウェブアクセスログDB
16・・サイト分類マスタ
17・・アンケート回答DB
100・・アクション推定システム
101・・CPU
102・・メモリ
103・・外部記憶装置
104・・入力部
105・・出力部
106・・通信部