IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ KDDI株式会社の特許一覧 ▶ 国立大学法人大阪大学の特許一覧 ▶ 国立大学法人名古屋大学の特許一覧

<>
  • 特開-情報処理装置及び情報処理方法 図1
  • 特開-情報処理装置及び情報処理方法 図2
  • 特開-情報処理装置及び情報処理方法 図3
  • 特開-情報処理装置及び情報処理方法 図4
  • 特開-情報処理装置及び情報処理方法 図5
  • 特開-情報処理装置及び情報処理方法 図6
  • 特開-情報処理装置及び情報処理方法 図7
  • 特開-情報処理装置及び情報処理方法 図8
  • 特開-情報処理装置及び情報処理方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023144417
(43)【公開日】2023-10-11
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
   G06Q 30/0202 20230101AFI20231003BHJP
【FI】
G06Q30/02 310
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2022051378
(22)【出願日】2022-03-28
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和3年度、国立研究開発法人科学技術振興機構、戦略的創造研究推進事業「データ処理とペルソナマッチング・行動予測転移」委託研究、「実空間行動モデリングと行動予測転移」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(71)【出願人】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(71)【出願人】
【識別番号】504139662
【氏名又は名称】国立大学法人東海国立大学機構
(74)【代理人】
【識別番号】100166006
【弁理士】
【氏名又は名称】泉 通博
(74)【代理人】
【識別番号】100154070
【弁理士】
【氏名又は名称】久恒 京範
(74)【代理人】
【識別番号】100153280
【弁理士】
【氏名又は名称】寺川 賢祐
(72)【発明者】
【氏名】黒川 茂莉
(72)【発明者】
【氏名】米川 慧
(72)【発明者】
【氏名】春田 秀一郎
(72)【発明者】
【氏名】原 隆浩
(72)【発明者】
【氏名】河口 信夫
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB01
(57)【要約】      (修正有)
【課題】第1ドメインに対応するユーザの行動から第2ドメインに対応するユーザの行動を推定する情報処理装置及び情報処理方法を提供する。
【解決手段】情報処理装置1は、通信部11と、記憶部12と、制御部13と、を有する。データ取得部131は情報処理装置1を使用する分析者の端末から、第1ユーザの第1関連行動データと、第2ユーザの第2関連行動データとを取得する。データ取得部131は、第1ユーザの第1サイトにおける購買行動に関連する、第1サイトにおける閲覧行動に対応する第1アイテムの第1アイテムIDと、第1ユーザの第1ユーザIDとを含む第1関連行動データを取得する。データ取得部131は、第2ユーザの第2サイトにおける購買行動に関連する、第2サイトにおける閲覧行動に対応する第2アイテムの第2アイテムIDと、第2ユーザの第2ユーザIDとを含む第2関連行動データを取得する。
【選択図】図2
【特許請求の範囲】
【請求項1】
第1ドメインのユーザである第1ユーザの第1行動に関連する第1関連行動に対応するアイテムである第1アイテムを識別するための第1アイテム識別情報と、前記第1ユーザを識別するための第1ユーザ識別情報とを含む第1関連行動データと、前記第1ドメインとは異なる第2ドメインのユーザである第2ユーザの第2行動に関連する第2関連行動に対応するアイテムである第2アイテムを識別するための第2アイテム識別情報と、前記第2ユーザを識別するための第2ユーザ識別情報とを含む第2関連行動データと、を取得するデータ取得部と、
前記第1関連行動データを用いて、前記第1ユーザ識別情報に対応する第1ユーザベクトル、及び前記第1アイテム識別情報に対応する第1アイテムベクトルの入力を受け付ける第1受付部、入力されたベクトルを、前記ベクトルの特徴を示す所定の次元数の第1特徴ベクトルに変換する第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1関連行動に関する情報である第1コンテキスト情報を出力する第1出力部を有する第1コンテキスト推定モデルを構築する第1構築部と、
前記第2関連行動データを用いて、前記第2ユーザ識別情報に対応する第2ユーザベクトル、及び前記第2アイテム識別情報に対応するとともに前記第1アイテムベクトルと同じ特徴空間で表現される第2アイテムベクトルの入力を受け付ける第2受付部、入力されたベクトルを、前記ベクトルの特徴を示す前記所定の次元数の第2特徴ベクトルに変換する第2変換部、及び変換された前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2関連行動に関する情報であって、前記第1コンテキスト情報と同じ表現形式を有する第2コンテキスト情報を出力する第2出力部を有する第2コンテキスト推定モデルを構築する第2構築部と、
前記第1関連行動データと、前記第1関連行動に対する前記第1行動の発生結果を示すデータとを用いて、前記第1受付部、前記第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1行動の発生確率を示す第1行動予測情報を出力する第3出力部を有する第1行動推定モデルを構築する第3構築部と、
前記第2構築部により構築された前記第2受付部及び前記第2変換部と、前記第3構築部により構築された前記第3出力部であって、前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2行動の発生確率を示す第2行動予測情報を出力する前記第3出力部とを有する第2行動推定モデルを構築する第4構築部と、
を有する情報処理装置。
【請求項2】
前記第1関連行動データは、前記第1関連行動の発生時刻を示す時刻情報を含むとともに、前記第2関連行動データは、前記第2関連行動の発生時刻を示す時刻情報を含み、
前記第1構築部は、前記第1コンテキスト情報として、前記第1ユーザの前記第1関連行動の発生時刻を示す時刻情報を出力する前記第1出力部を有する前記第1コンテキスト推定モデルを構築し、
前記第2構築部は、前記第1コンテキスト情報と同じ表現形式を有する前記第2コンテキスト情報として、前記第2ユーザの前記第2関連行動の発生時刻を示す時刻情報を出力する前記第2出力部を有する前記第2コンテキスト推定モデルを構築する、
請求項1に記載の情報処理装置。
【請求項3】
前記第1関連行動データは、前記第1関連行動の発生場所を示す場所情報を含むとともに、前記第2関連行動データは、前記第2関連行動の発生場所を示す場所情報を含み、
前記第1構築部は、前記第1コンテキスト情報として、前記第1ユーザの前記第1関連行動の発生場所を示す場所情報を出力する前記第1出力部を有する前記第1コンテキスト推定モデルを構築し、
前記第2構築部は、前記第1コンテキスト情報と同じ表現形式を有する前記第2コンテキスト情報として、前記第2ユーザの前記第2関連行動の発生場所を示す場所情報を出力する前記第2出力部を有する前記第2コンテキスト推定モデルを構築する、
請求項1又は2に記載の情報処理装置。
【請求項4】
前記第1アイテム識別情報と、前記第2アイテム識別情報とのそれぞれには、アイテムを説明するテキスト情報が関連付けられており、
前記第1構築部は、前記第1アイテム識別情報に関連付けられている前記テキスト情報に基づく前記第1アイテムベクトルの入力を受け付ける前記第1受付部と、前記第1コンテキスト情報として、前記第1アイテムベクトルが示す前記第1アイテムに関連する他の第1アイテムに対応する前記第1アイテムベクトルを出力する前記第1出力部とを有する前記第1コンテキスト推定モデルを構築し、
前記第2構築部は、前記第2アイテム識別情報に関連付けられている前記テキスト情報に基づく前記第2アイテムベクトルの入力を受け付ける前記第2受付部と、前記第2コンテキスト情報として、前記第2アイテムベクトルが示す前記第2アイテムに関連する他の第2アイテムに対応する前記第2アイテムベクトルを出力する前記第2出力部とを有する前記第2コンテキスト推定モデルを構築する、
請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
前記データ取得部は、前記第1行動に関連する前記第1関連行動に対応する前記第1アイテム識別情報と、前記第1ユーザ識別情報とを含む前記第1関連行動データを取得するとともに、前記第1行動と所定の関係を有する前記第2行動に関連する第2関連行動に対応する前記第2アイテム識別情報と、前記第2ユーザ識別情報とを含む前記第2関連行動データを取得する、
請求項1から4のいずれか1項に記載の情報処理装置。
【請求項6】
前記第1ユーザベクトルと前記第1アイテムベクトルとから前記第1変換部が変換した前記第1特徴ベクトル、及び前記第2ユーザベクトルと前記第2アイテムベクトルとから前記第2変換部が変換した前記第2特徴ベクトルの少なくともいずれかの入力を受け付け、入力された特徴ベクトルが前記第1特徴ベクトルであるか前記第2特徴ベクトルであるかを示す判定情報を出力する判定部をさらに有し、
前記判定部は、前記判定情報の出力結果の正解率が高くなるように学習し、
前記第1構築部及び第2構築部の少なくともいずれかは、自身が生成する特徴ベクトルを前記判定部が判定した場合における前記判定部の判定結果の正解率が50%に近くなるように学習する、
請求項1から5のいずれか1項に記載の情報処理装置。
【請求項7】
前記第1受付部は、複数の前記第1ユーザベクトルを平均化したベクトル、及び前記複数の第1ユーザベクトルに対応する前記第1アイテム識別情報に対応する第1アイテムベクトルの入力を受け付け、
前記第2受付部は、複数の前記第2ユーザベクトルを平均化したベクトル、及び前記複数の第2ユーザベクトルに対応する前記第2アイテム識別情報に対応する第2アイテムベクトルの入力を受け付ける、
請求項1から6のいずれか1項に記載の情報処理装置。
【請求項8】
コンピュータが実行する、
第1ドメインのユーザである第1ユーザの第1行動に関連する第1関連行動に対応するアイテムである第1アイテムを識別するための第1アイテム識別情報と、前記第1ユーザを識別するための第1ユーザ識別情報とを含む第1関連行動データと、前記第1ドメインとは異なる第2ドメインのユーザである第2ユーザの第2行動に関連する第2関連行動に対応するアイテムである第2アイテムを識別するための第2アイテム識別情報と、前記第2ユーザを識別するための第2ユーザ識別情報とを含む第2関連行動データと、を取得するステップと、
前記第1関連行動データを用いて、前記第1ユーザ識別情報に対応する第1ユーザベクトル、及び前記第1アイテム識別情報に対応する第1アイテムベクトルの入力を受け付ける第1受付部、入力されたベクトルを、前記ベクトルの特徴を示す所定の次元数の第1特徴ベクトルに変換する第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1関連行動に関する情報である第1コンテキスト情報を出力する第1出力部を有する第1コンテキスト推定モデルを構築するステップと、
前記第2関連行動データを用いて、前記第2ユーザ識別情報に対応する第2ユーザベクトル、及び前記第2アイテム識別情報に対応するとともに前記第1アイテムベクトルと同じ特徴空間で表現される第2アイテムベクトルの入力を受け付ける第2受付部、入力されたベクトルを、前記ベクトルの特徴を示す前記所定の次元数の第2特徴ベクトルに変換する第2変換部、及び変換された前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2関連行動に関する情報であって、前記第1コンテキスト情報と同じ表現形式を有する第2コンテキスト情報を出力する第2出力部を有する第2コンテキスト推定モデルを構築するステップと、
前記第1関連行動データと、前記第1関連行動に対する前記第1行動の発生結果を示すデータとを用いて、前記第1受付部、前記第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1行動の発生確率を示す第1行動予測情報を出力する第3出力部を有する第1行動推定モデルを構築するステップと、
前記第2コンテキスト推定モデルを構築するステップにおいて構築された前記第2受付部及び前記第2変換部と、前記第1行動推定モデルを構築するステップにおいて構築された前記第3出力部であって、前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2行動の発生確率を示す第2行動予測情報を出力する前記第3出力部とを有する第2行動推定モデルを構築するステップと、
を有する情報処理方法。

【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
従来、第1ドメインにおいて学習した内容を、第1ドメインとは異なる第2ドメインの学習に応用する転移学習が知られている。例えば、特許文献1には、第1ドメインに対応する特定サービスにおける購買行動履歴データと、第2ドメインに対応するウェブページ閲覧に関するオンライン行動履歴データを、第1ドメインと第2ドメインの共通ユーザを元に結合する技術が開示されている。結合された行動履歴データを用いることで、共通ユーザとは異なる第2ドメインに対応するユーザに対しても、共通ユーザのオンライン行動との類似性から第1ドメインに対応する当該ユーザの購買行動を推定することができる。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特許第6596605号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来の技術では、第1ドメインのデータと第2ドメインのデータとにおいてユーザの対応付けを行うことができず、共通ユーザが存在しない場合、第1ドメインに対応するユーザの行動から第2ドメインに対応する当該ユーザの行動を推定することができないという問題がある。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、第1ドメインのデータと第2ドメインのデータとにおいてユーザの対応付けを行うことなく、第1ドメインに対応するユーザの行動から第2ドメインに対応するユーザの行動を推定することを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る情報処理装置は、第1ドメインのユーザである第1ユーザの第1行動に関連する第1関連行動に対応するアイテムである第1アイテムを識別するための第1アイテム識別情報と、前記第1ユーザを識別するための第1ユーザ識別情報とを含む第1関連行動データと、前記第1ドメインとは異なる第2ドメインのユーザである第2ユーザの第2行動に関連する第2関連行動に対応するアイテムである第2アイテムを識別するための第2アイテム識別情報と、前記第2ユーザを識別するための第2ユーザ識別情報とを含む第2関連行動データと、を取得するデータ取得部と、前記第1関連行動データを用いて、前記第1ユーザ識別情報に対応する第1ユーザベクトル、及び前記第1アイテム識別情報に対応する第1アイテムベクトルの入力を受け付ける第1受付部、入力されたベクトルを、前記ベクトルの特徴を示す所定の次元数の第1特徴ベクトルに変換する第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1関連行動に関する情報である第1コンテキスト情報を出力する第1出力部を有する第1コンテキスト推定モデルを構築する第1構築部と、前記第2関連行動データを用いて、前記第2ユーザ識別情報に対応する第2ユーザベクトル、及び前記第2アイテム識別情報に対応するとともに前記第1アイテムベクトルと同じ特徴空間で表現される第2アイテムベクトルの入力を受け付ける第2受付部、入力されたベクトルを、前記ベクトルの特徴を示す前記所定の次元数の第2特徴ベクトルに変換する第2変換部、及び変換された前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2関連行動に関する情報であって、前記第1コンテキスト情報と同じ表現形式を有する第2コンテキスト情報を出力する第2出力部を有する第2コンテキスト推定モデルを構築する第2構築部と、前記第1関連行動データと、前記第1関連行動に対する前記第1行動の発生結果を示すデータとを用いて、前記第1受付部、前記第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1行動の発生確率を示す第1行動予測情報を出力する第3出力部を有する第1行動推定モデルを構築する第3構築部と、前記第2構築部により構築された前記第2受付部及び前記第2変換部と、前記第3構築部により構築された前記第3出力部であって、前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2行動の発生確率を示す第2行動予測情報を出力する前記第3出力部とを有する第2行動推定モデルを構築する第4構築部と、を有する。
【0007】
前記第1関連行動データは、前記第1関連行動の発生時刻を示す時刻情報を含むとともに、前記第2関連行動データは、前記第2関連行動の発生時刻を示す時刻情報を含み、前記第1構築部は、前記第1コンテキスト情報として、前記第1ユーザの前記第1関連行動の発生時刻を示す時刻情報を出力する前記第1出力部を有する前記第1コンテキスト推定モデルを構築し、前記第2構築部は、前記第1コンテキスト情報と同じ表現形式を有する前記第2コンテキスト情報として、前記第2ユーザの前記第2関連行動の発生時刻を示す時刻情報を出力する前記第2出力部を有する前記第2コンテキスト推定モデルを構築してもよい。
【0008】
前記第1関連行動データは、前記第1関連行動の発生場所を示す場所情報を含むとともに、前記第2関連行動データは、前記第2関連行動の発生場所を示す場所情報を含み、前記第1構築部は、前記第1コンテキスト情報として、前記第1ユーザの前記第1関連行動の発生場所を示す場所情報を出力する前記第1出力部を有する前記第1コンテキスト推定モデルを構築し、前記第2構築部は、前記第1コンテキスト情報と同じ表現形式を有する前記第2コンテキスト情報として、前記第2ユーザの前記第2関連行動の発生場所を示す場所情報を出力する前記第2出力部を有する前記第2コンテキスト推定モデルを構築してもよい。
【0009】
前記第1アイテム識別情報と、前記第2アイテム識別情報とのそれぞれには、アイテムを説明するテキスト情報が関連付けられており、前記第1構築部は、前記第1アイテム識別情報に関連付けられている前記テキスト情報に基づく前記第1アイテムベクトルの入力を受け付ける前記第1受付部と、前記第1コンテキスト情報として、前記第1アイテムベクトルが示す前記第1アイテムに関連する他の第1アイテムに対応する前記第1アイテムベクトルを出力する前記第1出力部とを有する前記第1コンテキスト推定モデルを構築し、前記第2構築部は、前記第2アイテム識別情報に関連付けられている前記テキスト情報に基づく前記第2アイテムベクトルの入力を受け付ける前記第2受付部と、前記第2コンテキスト情報として、前記第2アイテムベクトルが示す前記第2アイテムに関連する他の第2アイテムに対応する前記第2アイテムベクトルを出力する前記第2出力部とを有する前記第2コンテキスト推定モデルを構築してもよい。
【0010】
前記データ取得部は、前記第1行動に関連する前記第1関連行動に対応する前記第1アイテム識別情報と、前記第1ユーザ識別情報とを含む前記第1関連行動データを取得するとともに、前記第1行動と所定の関係を有する前記第2行動に関連する第2関連行動に対応する前記第2アイテム識別情報と、前記第2ユーザ識別情報とを含む前記第2関連行動データを取得してもよい。
【0011】
前記情報処理装置は、前記第1ユーザベクトルと前記第1アイテムベクトルとから前記第1変換部が変換した前記第1特徴ベクトル、及び前記第2ユーザベクトルと前記第2アイテムベクトルとから前記第2変換部が変換した前記第2特徴ベクトルの少なくともいずれかの入力を受け付け、入力された特徴ベクトルが前記第1特徴ベクトルであるか前記第2特徴ベクトルであるかを示す判定情報を出力する判定部をさらに有し、前記判定部は、前記判定情報の出力結果の正解率が高くなるように学習し、前記第1構築部及び第2構築部の少なくともいずれかは、自身が生成する特徴ベクトルを前記判定部が判定した場合における前記判定部の判定結果の正解率が50%に近くなるように学習してもよい。
【0012】
前記第1受付部は、複数の前記第1ユーザベクトルを平均化したベクトル、及び前記複数の第1ユーザベクトルに対応する前記第1アイテム識別情報に対応する第1アイテムベクトルの入力を受け付け、前記第2受付部は、複数の前記第2ユーザベクトルを平均化したベクトル、及び前記複数の第2ユーザベクトルに対応する前記第2アイテム識別情報に対応する第2アイテムベクトルの入力を受け付けてもよい。
【0013】
本発明の第2の態様に係る情報処理方法は、コンピュータが実行する、第1ドメインのユーザである第1ユーザの第1行動に関連する第1関連行動に対応するアイテムである第1アイテムを識別するための第1アイテム識別情報と、前記第1ユーザを識別するための第1ユーザ識別情報とを含む第1関連行動データと、前記第1ドメインとは異なる第2ドメインのユーザである第2ユーザの第2行動に関連する第2関連行動に対応するアイテムである第2アイテムを識別するための第2アイテム識別情報と、前記第2ユーザを識別するための第2ユーザ識別情報とを含む第2関連行動データと、を取得するステップと、前記第1関連行動データを用いて、前記第1ユーザ識別情報に対応する第1ユーザベクトル、及び前記第1アイテム識別情報に対応する第1アイテムベクトルの入力を受け付ける第1受付部、入力されたベクトルを、前記ベクトルの特徴を示す所定の次元数の第1特徴ベクトルに変換する第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1関連行動に関する情報である第1コンテキスト情報を出力する第1出力部を有する第1コンテキスト推定モデルを構築するステップと、前記第2関連行動データを用いて、前記第2ユーザ識別情報に対応する第2ユーザベクトル、及び前記第2アイテム識別情報に対応するとともに前記第1アイテムベクトルと同じ特徴空間で表現される第2アイテムベクトルの入力を受け付ける第2受付部、入力されたベクトルを、前記ベクトルの特徴を示す前記所定の次元数の第2特徴ベクトルに変換する第2変換部、及び変換された前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2関連行動に関する情報であって、前記第1コンテキスト情報と同じ表現形式を有する第2コンテキスト情報を出力する第2出力部を有する第2コンテキスト推定モデルを構築するステップと、前記第1関連行動データと、前記第1関連行動に対する前記第1行動の発生結果を示すデータとを用いて、前記第1受付部、前記第1変換部、及び変換された前記第1特徴ベクトルに基づいて、前記第1ユーザの前記第1行動の発生確率を示す第1行動予測情報を出力する第3出力部を有する第1行動推定モデルを構築するステップと、前記第2コンテキスト推定モデルを構築するステップにおいて構築された前記第2受付部及び前記第2変換部と、前記第1行動推定モデルを構築するステップにおいて構築された前記第3出力部であって、前記第2特徴ベクトルに基づいて、前記第2ユーザの前記第2行動の発生確率を示す第2行動予測情報を出力する前記第3出力部とを有する第2行動推定モデルを構築するステップと、を有する。
【発明の効果】
【0014】
本発明によれば、第1ドメインのデータと第2ドメインのデータとにおいてユーザの対応付けを行うことなく、第1ドメインに対応するユーザの行動から第2ドメインに対応するユーザの行動を推定することができるという効果を奏する。
【図面の簡単な説明】
【0015】
図1】第1の実施の形態に係る情報処理装置の概要を説明する図である。
図2】第1の実施の形態に係る情報処理装置の構成を示す図である。
図3】第1関連行動データ及び第2関連行動データを示す図である。
図4】第1コンテキスト推定モデルを示す図である。
図5】第2コンテキスト推定モデルを示す図である。
図6】第1行動推定モデルを示す図である。
図7】第2行動推定モデルを示す図である。
図8】第1の実施の形態に係る情報処理装置における処理の流れの一例を示すフローチャートである。
図9】第2の実施の形態に係る情報処理装置の構成を示す図である。
【発明を実施するための形態】
【0016】
<第1の実施の形態>
[情報処理装置の概要]
図1は、第1の実施の形態に係る情報処理装置1の概要を説明する図である。情報処理装置1は、ユーザの行動に関連する関連行動に基づいて、ユーザの所定の行動の発生確率を推定するためのコンピュータである。
【0017】
以下の説明において、第1ドメインのユーザを第1ユーザ、第1ユーザの所定の行動を第1行動、第1行動に関連する関連行動を第1関連行動という。また、第1ドメインとは異なるドメインである第2ドメインのユーザを第2ユーザ、第2ユーザの所定の行動を第2行動、第2行動に関連する関連行動を第2関連行動という。
【0018】
第1ユーザは、例えば第1ドメインのサイトである第1サイトを利用するユーザである。第1行動は、情報処理装置1が検出可能な行動であり、例えば実店舗や仮想店舗におけるユーザの購買行動である。本実施の形態では、第1行動は、第1サイトにおける第1ユーザの購買行動であるものとする。第1関連行動は、例えば第1ユーザの第1サイトの閲覧行動である。
【0019】
第2ユーザは、例えば第2ドメインのサイトを利用するユーザである。第2行動は、第1行動と所定の関係を有する行動である。所定の関係とは、例えば、第1行動の種別と、第2行動の種別とが同じであることである。第2行動は、例えば、第1ドメインに対応するサイトとは異なる他のサイトである第2ドメインのサイトである第2サイトにおける第2ユーザの購買行動である。第2関連行動は、例えば第2ユーザの第2サイトの閲覧行動である。
【0020】
まず、情報処理装置1は、第1ドメインの第1ユーザの第1関連行動に対応する第1関連行動データと、当該第1関連行動に対する第1行動の発生結果を示すデータと、第2ドメインの第2ユーザの第2関連行動に対応する第2関連行動データを取得する。第1関連行動データには、第1ユーザを識別するための第1ユーザIDと、第1関連行動に対応するアイテムを識別するための第1アイテム識別情報としての第1アイテムIDとが含まれている。第2関連行動データには、第2ユーザを識別するための第2ユーザIDと、第2関連行動に対応するアイテムを識別するための第2アイテム識別情報としての第2アイテムIDとが含まれている。
【0021】
情報処理装置1は、取得した第1関連行動データに含まれている第1ユーザIDと、第1アイテムIDとを用いて、第1ユーザIDに対応する第1ユーザベクトル、及び第1アイテムIDに対応する第1アイテムベクトルが入力されたことに応じて、第1ユーザの第1関連行動に関する情報である第1コンテキスト情報を出力するプログラムである第1コンテキスト推定モデルを構築する。
【0022】
情報処理装置1は、取得した第2関連行動データに含まれている第2ユーザIDと、第2アイテムIDとを用いて、第2ユーザIDに対応する第2ユーザベクトル、及び、第2アイテムIDに対応し、第1アイテムベクトルと同じ特徴空間で表現される第2アイテムベクトルが入力されたことに応じて、第2ユーザの第2関連行動に関する情報であり、第1コンテキスト情報と同じ表現形式である第2コンテキスト情報を出力するプログラムである第2コンテキスト推定モデルを構築する。これにより、第1コンテキスト推定モデルと、第2コンテキスト推定モデルとは、同じ表現形式のコンテキスト情報を出力することができる。
【0023】
情報処理装置1は、第1関連行動データと、第1関連行動に対する第1行動の発生結果を示すデータとを用いて、第1ユーザIDに対応する第1ユーザベクトル、及び第1アイテムIDに対応する第1アイテムベクトルが入力されたことに応じて、第1ユーザの第1行動の発生確率を示す第1行動予測情報を出力する第1行動推定モデルを構築する。情報処理装置1は、第1行動推定モデルの入力部分、及び中間処理部分を流用することにより、第1コンテキスト推定モデルと共通の処理を行う部分を有するプログラムである第1行動推定モデルを構築する。
【0024】
第1コンテキスト推定モデルと、第1行動推定モデルとは、入力部分、及び中間処理部分が共通であり、第1コンテキスト推定モデルと、第2コンテキスト推定モデルとは、同じ表現形式のコンテキスト情報を出力することから、第2コンテキスト推定モデルの出力部分を、第1行動推定モデルの出力部分に置き換えることができる。
【0025】
このため、情報処理装置1は、第2コンテキスト推定モデルの出力部を、第1行動推定モデルの出力部に置き換えることにより、第2ユーザIDに対応する第2ユーザベクトル、及び第2アイテムIDに対応する第2アイテムベクトルが入力されたことに応じて、第2ユーザの第2行動の発生確率を示す第2行動予測情報を出力するプログラムである第2行動推定モデルを構築する。このようにすることで、情報処理装置1は、第1ドメインのデータと第2ドメインのデータとにおいてユーザの対応付けを行うことなく、第1ドメインに対応するユーザの行動から第2ドメインに対応するユーザの行動を推定することができる。
【0026】
続いて、情報処理装置1の構成を説明する。情報処理装置1の構成を説明するにあたり、第1行動が第1ドメインのサイトである第1サイトにおけるユーザの購買行動、第1関連行動が第1サイトにおけるユーザの閲覧行動、第2行動が第2ドメインのサイトである第2サイトにおけるユーザの購買行動、第2関連行動が第2サイトにおけるユーザの閲覧行動であるものとして説明を進める。
【0027】
[情報処理装置1の構成例]
続いて、情報処理装置1の構成について説明する。図2は、第1の実施の形態に係る情報処理装置1の構成を示す図である。情報処理装置1は、通信部11と、記憶部12と、制御部13とを有する。制御部13は、データ取得部131と、教師データ生成部132と、第1構築部133と、第2構築部134と、第3構築部135と、第4構築部136と、予測部137とを有する。
【0028】
通信部11は、インターネット等のネットワークを介して外部装置とデータを送受信するための通信インターフェースである。
記憶部12は、例えば、ROM(Read Only Memory)及びRAM(Random Access Memory)等である。記憶部12は、情報処理装置1を機能させるための各種プログラムを記憶する。例えば、記憶部12は、情報処理装置1の制御部13を、データ取得部131、教師データ生成部132、第1構築部133、第2構築部134、第3構築部135、第4構築部136、及び予測部137として機能させるプログラムを記憶する。
【0029】
制御部13は、例えばCPU(Central Processing Unit)である。制御部13は、記憶部12に記憶されている各種プログラムを実行することにより、情報処理装置1に係る機能を制御する。制御部13は、記憶部12に記憶されているプログラムを実行することにより、データ取得部131、教師データ生成部132、第1構築部133、第2構築部134、第3構築部135、第4構築部136、及び予測部137として機能する。
【0030】
データ取得部131は、例えば、情報処理装置1を使用する分析者の端末(不図示)から、第1ユーザの第1行動に関連する第1関連行動に対応する第1関連行動データと、第2ユーザの第2行動に関連する第2関連行動に対応する第2関連行動データとを取得する。データ取得部131は、第1ユーザの第1サイトにおける購買行動(第1行動)に関連する、第1サイトにおける閲覧行動(第1関連行動)に対応する第1アイテムの第1アイテムIDと、第1ユーザの第1ユーザIDとを含む第1関連行動データを取得する。また、データ取得部131は、第2ユーザの第2サイトにおける購買行動(第2行動)に関連する、第2サイトにおける閲覧行動(第2関連行動)に対応する第2アイテムの第2アイテムIDと、第2ユーザの第2ユーザIDとを含む第2関連行動データを取得する。
【0031】
具体的には、データ取得部131は、第1ユーザIDと、第1サイトにおいて第1ユーザが閲覧した第1アイテムを示す第1アイテムIDと、第1アイテムを閲覧した時刻を示す時刻情報と、第1アイテムを閲覧した場所を示す場所情報とを関連付けた第1関連行動データを取得する。また、データ取得部131は、第2ユーザIDと、第2サイトにおいて第2ユーザが閲覧した第2アイテムを示す第2アイテムIDと、第2アイテムを閲覧した時刻を示す時刻情報と、第2アイテムを閲覧した場所を示す場所情報とを関連付けた第1関連行動データを取得する。
【0032】
図3は、第1関連行動データ及び第2関連行動データを示す図である。図3(a)は、第1関連行動データを示し、図3(b)は、第2関連行動データを示している。図3(a)に示すように、第1関連行動データにおいて、第1ユーザIDと、第1アイテムIDと、第1アイテムを閲覧した時刻を示す時刻情報と、第1アイテムを閲覧した場所を示す場所情報とを関連付けられていることが確認できる。同様に、図3(b)に示すように、第2関連行動データにおいて、第2ユーザIDと、第2アイテムIDと、第2アイテムを閲覧した時刻を示す時刻情報と、第2アイテムを閲覧した場所を示す場所情報とを関連付けられていることが確認できる。なお、図3(a)及び図3(b)に示すように、第1ユーザIDと、第2ユーザIDとは別体系のIDであり、第1ユーザIDと第2ユーザIDとの関連付けができないものとする。
【0033】
また、データ取得部131は、第1サイトにおける第1アイテムの閲覧行動(第1関連行動)に対する当該第1アイテムの購買行動(第1行動)の発生結果を示す第1行動データを取得する。例えば、データ取得部131は、第1行動データとして、第1ユーザの第1ユーザIDと、当該第1ユーザが第1サイトにおいて購入した第1アイテムの第1アイテムIDと、第1アイテムを購入した時刻を示す時刻情報とを関連付けた購買履歴情報を取得する。
【0034】
教師データ生成部132は、第1関連行動データに基づいて、第1コンテキスト推定モデルの構築に用いる第1教師データを生成する。第1教師データは、第1コンテキスト推定モデルに入力する入力ベクトルと、当該入力ベクトルの入力に対し、第1コンテキスト推定モデルから出力させたい出力ベクトルとの組み合わせである。教師データ生成部132は、第1教師データを複数生成する。
【0035】
教師データ生成部132は、第1コンテキスト推定モデルの構築に用いる入力ベクトルとして、第1ユーザに対応する第1ユーザベクトルと、第1アイテムに対応する第1アイテムベクトルとしての第1アイテムコンテンツベクトルとを生成する。
【0036】
例えば、教師データ生成部132は、第1関連行動データに含まれる第1ユーザIDに対応する1hotベクトルを第1ユーザベクトルとして生成する。また、教師データ生成部132は、第1関連行動データにおいて、当該第1ユーザIDに関連付けられている第1アイテムIDに対応する第1アイテムの特徴を示す第1アイテムコンテンツベクトルを生成する。
【0037】
例えば、記憶部12には、第1アイテムのアイテムIDと、所定の言語を用いて当該第1アイテムを説明するテキスト情報としての説明文とが関連付けて記憶されている。教師データ生成部132は、第1アイテムのアイテムIDに関連付けられている説明文に含まれている語彙に基づいて、第1アイテムコンテンツベクトルを生成する。
【0038】
第1アイテムコンテンツベクトルは、例えば、n個の語彙それぞれが第1アイテムの説明文に含まれるか否かを示すベクトルであり、(V、V、…、V)で示される。V(ただし、1≦i≦n)は、語彙iが第1アイテムの説明文に含まれている場合、1となり、語彙iが当該説明文に含まれていない場合、0となる。
【0039】
教師データ生成部132は、第1関連行動データに含まれる第1ユーザIDに対応する第1ユーザベクトルと、当該第1ユーザIDに関連付けられているアイテムIDに対して生成した第1アイテムコンテンツベクトルとのセットを、入力ベクトルとする。
【0040】
教師データ生成部132は、第1コンテキスト推定モデルの構築に用いる出力ベクトルとして、入力ベクトルに対応して、第1時刻ベクトルと、第1場所ベクトルと、第1アイテムコンテキストベクトルとを生成する。
【0041】
教師データ生成部132は、第1関連行動データにおいて、生成した入力ベクトルに対応する第1ユーザID及び第1アイテムIDに関連付けられている時刻情報及び場所情報に基づいて、第1時刻ベクトルと、第1場所ベクトルとを生成する。
【0042】
第1時刻ベクトルは、第1アイテムに関連付けられている時刻情報が示す時刻に対応するベクトルであり、例えば、アイテムIDと関連付けられている時刻情報が何時であるかに基づいて生成される。例えば、第1時刻ベクトルは、0時~23時それぞれに対応して24個の要素を有している。第1アイテムに関連付けられている時刻が19時である場合は、19時に対応する要素の値が1となり、それ以外の要素の値が0となる。
【0043】
第1場所ベクトルは、第1アイテムに関連付けられている場所情報が示す場所に対応するベクトルである。第1場所ベクトルは、例えば、アイテムIDと関連付けられている場所がどの都道府県に属しているかに基づいて生成される。例えば、第1場所ベクトルは、都道府県の数に対応して47個の要素を有している。第1アイテムに関連付けられている場所が東京である場合は、東京に対応する要素の値が1となり、それ以外の要素の値が0となる。
【0044】
教師データ生成部132は、第1関連行動データを参照し、入力ベクトルに含まれる第1アイテムIDの前後の時間に出現する複数の第1アイテムIDを特定する。教師データ生成部132は、入力ベクトルに含まれる第1アイテムIDに対応する第1アイテムコンテンツベクトルと、特定した複数の第1アイテムIDそれぞれの第1アイテムコンテンツベクトルとを含む第1アイテムコンテキストベクトルを生成する。
【0045】
例えば、第1アイテムコンテキストベクトルは、入力ベクトルに含まれる第1アイテムIDに対応するアイテムコンテンツベクトルと、当該第1アイテムIDが示す第1アイテムの閲覧時刻の直前に閲覧された2つのアイテムコンテンツベクトルと、当該第1アイテムの閲覧時刻の直後に閲覧された2つのアイテムコンテンツベクトルとを含んでいる。
【0046】
教師データ生成部132は、第1コンテキスト推定モデルの構築に用いる教師データを生成するのと同様に、第2関連行動データに基づいて、第2コンテキスト推定モデルの構築に用いる教師データとしての入力ベクトルと、出力ベクトルとの組み合わせを複数生成する。
【0047】
教師データ生成部132は、第2コンテキスト推定モデルの構築に用いる入力ベクトルとして、第2ユーザに対応する第2ユーザベクトルと、第2アイテムに対応する第2アイテムベクトルとしての第2アイテムコンテンツベクトルとを生成する。
【0048】
教師データ生成部132は、第1ユーザベクトルと同様に、第2関連行動データに含まれる第2ユーザIDに対応する1hotベクトルを第2ユーザベクトルとして生成する。また、記憶部12には、第2アイテムのアイテムIDと、第1アイテムの説明文と同じ言語を用いて第2アイテムを説明するテキスト情報としての説明文とが関連付けて記憶されている。教師データ生成部132は、第2アイテムのアイテムIDに関連付けられている説明文に含まれている語彙に基づいて、第2アイテムコンテンツベクトルを生成する。第2アイテムコンテンツベクトルは、第1アイテムコンテンツベクトルと同様に、(V、V、…、V)で示される。これにより、第1アイテムコンテンツベクトルと第2アイテムコンテンツベクトルとは、共通の特徴空間で表現されるものとなる。
【0049】
また、教師データ生成部132は、生成した入力ベクトルに対応して、第2コンテキスト推定モデルの構築に用いる出力ベクトルとして、第2時刻ベクトル、第2場所ベクトル、及び第2アイテムコンテキストベクトルを生成する。第2時刻ベクトル、第2場所ベクトル、及び第2アイテムコンテキストベクトルは、それぞれ、第1時刻ベクトル、第1場所ベクトル、及び第1アイテムコンテキストベクトルと同様の手法で生成される。これにより、第2時刻ベクトル、第2場所ベクトル、及び第2アイテムコンテキストベクトルは、それぞれ、第1時刻ベクトル、第1場所ベクトル、及び第1アイテムコンテキストベクトルと共通の特徴空間で表現されるものとなる。
【0050】
第1構築部133は、第1関連行動データを用いて、第1ユーザの閲覧行動(第1関連行動)を示す入力ベクトルが入力されると、当該閲覧行動に関する情報である第1コンテキスト情報を出力する第1コンテキスト推定モデルを構築する。
【0051】
第1ユーザの閲覧行動を示す入力ベクトルは、第1ユーザを示す第1ユーザIDに対応する第1ユーザベクトル、及び当該第1ユーザが閲覧した第1のアイテムを示す第1アイテムIDに対応する第1アイテムコンテンツベクトルである。第1コンテキスト情報は、時空間コンテキスト情報、及びアイテムコンテキスト情報である。時空間コンテキスト情報は、第1ユーザの閲覧行動の発生時刻を示す時刻情報としての第1時刻ベクトル、及び第1ユーザの閲覧行動の発生場所を示す場所情報としての第1場所ベクトルである。アイテムコンテキスト情報は、第1ユーザの閲覧行動に対応する第1アイテムの第1アイテムコンテンツベクトルと、当該第1アイテムに関連する他の第1アイテムに対応する第1アイテムコンテンツベクトルとを含むベクトルである。第1アイテムに関連する他の第1アイテムは、例えば、第1ユーザの閲覧行動の前後の閲覧行動に対応する第1アイテムである。
【0052】
図4は、第1コンテキスト推定モデルを示す図である。第1コンテキスト推定モデルは、例えばニューラルネットワークモデルであり、図4に示すように、第1受付部、第1変換部、第1出力部を有している。コンピュータが第1コンテキスト推定モデルを実行することにより、コンピュータは、第1受付部、第1変換部、第1出力部として機能する。
【0053】
第1受付部は、第1ユーザIDに対応する第1ユーザベクトル、及び第1アイテムIDに対応する第1アイテムコンテンツベクトルの入力を受け付ける。
第1変換部は、入力されたベクトル、すなわち、第1ユーザベクトル及び第1アイテムコンテンツベクトルを、これらのベクトルの特徴を示す所定の次元数の第1特徴ベクトルである第1埋込ベクトルに変換する。
第1出力部は、第1変換部により変換された第1埋込ベクトルに基づいて、第1コンテキスト情報としての出力ベクトルを出力する。
【0054】
第1構築部133は、教師データ生成部132が生成した入力ベクトルと、当該入力ベクトルに対応する出力ベクトルとを教師データとする。第1構築部133は、教師データに含まれる入力ベクトルを第1コンテキスト推定モデルに入力すると、第1コンテキスト推定モデルから、当該入力ベクトルに対応する出力ベクトルが出力されるように第1コンテキスト推定モデルの学習を行うことにより、第1コンテキスト推定モデルを構築する。第1構築部133は、構築した第1コンテキスト推定モデルを記憶部12に記憶させる。
【0055】
第2構築部134は、第2関連行動データを用いて、第2ユーザの閲覧行動(第2関連行動)を示す入力ベクトルが入力されると、当該閲覧行動に関する第2コンテキスト情報を出力する第2コンテキスト推定モデルを構築する。第2構築部134は、第1コンテキスト情報と同じ表現形式を有する第2コンテキスト情報を出力する。
【0056】
第2関連行動を示す入力ベクトルは、第2ユーザを示す第2ユーザIDに対応する第2ユーザベクトル、及び当該第2ユーザが閲覧した第2のアイテムを示す第2アイテムIDに対応する第2アイテムコンテンツベクトルである。第2アイテムコンテンツベクトルは、将来第2ユーザが閲覧する可能性があるアイテムとしての第1のアイテムを示す第1アイテムIDに対応するアイテムコンテンツベクトルであってもよい。第2コンテキスト情報は、時空間コンテキスト情報、及びアイテムコンテキスト情報である。時空間コンテキスト情報は、第2ユーザの閲覧行動の発生時刻を示す時刻情報としての第2時刻ベクトル、及び第2ユーザの閲覧行動の発生場所を示す場所情報としての第2場所ベクトルである。アイテムコンテキスト情報は、第2ユーザの閲覧行動に対応する第1アイテム又は第2アイテムの第2アイテムコンテンツベクトルと、当該第2アイテムに関連する他の第2アイテムに対応する第2アイテムコンテンツベクトルとを含むベクトルである。第2アイテムに関連する他の第2アイテムは、例えば、第2ユーザの閲覧行動の前後の閲覧行動に対応する第2アイテムである。
【0057】
図5は、第2コンテキスト推定モデルを示す図である。図5に示すように、第2コンテキスト推定モデルは、例えばニューラルネットワークモデルであり、第1コンテキスト推定モデルと同様の構成を有している。第2コンテキスト推定モデルは、第2受付部、第2変換部、第2出力部を有する。コンピュータが第2コンテキスト推定モデルを実行することにより、コンピュータは、第2受付部、第2変換部、第2出力部として機能する。
【0058】
第2受付部は、第2ユーザIDに対応する第2ユーザベクトル、及び第2アイテムIDに対応するとともに第1アイテムコンテンツベクトルと同じ特徴空間で表現される第2アイテムコンテンツベクトルの入力を受け付ける。
【0059】
第2変換部は、入力されたベクトル、すなわち、第2ユーザベクトル及び第2アイテムコンテンツベクトルを、これらのベクトルの特徴を示す所定の次元数の第2特徴ベクトルである第2埋込ベクトルに変換する。第2変換部は、第2ユーザベクトル及び第2アイテムコンテンツベクトルを、第1埋込ベクトルと同じ次元数を有する第2埋込ベクトルに変換する。
【0060】
第2出力部は、第2変換部により変換された第2埋込ベクトルに基づいて、第2ユーザの第2関連行動に関する情報であって、第1コンテキスト情報と同じ表現形式を有する第2コンテキスト情報を出力する。
【0061】
第2構築部134は、教師データ生成部132が第2関連行動データから生成した第2ドメインに対応する入力ベクトルを第2コンテキスト推定モデルに入力すると、第2コンテキスト推定モデルから、当該入力ベクトルに対応する出力ベクトルが出力されるように第2コンテキスト推定モデルの学習を行うことにより、第2コンテキスト推定モデルを構築する。第2構築部134は、構築した第2コンテキスト推定モデルを記憶部12に記憶させる。
【0062】
第3構築部135は、第1関連行動データと、第1関連行動データに含まれる第1関連行動に対する第1行動の発生結果を示すデータとを用いて、第1ユーザの閲覧行動(第1関連行動)を示す入力ベクトルが入力されると、第1ユーザの購買行動(第1行動)の発生確率を示す第1行動予測情報を出力する第1行動推定モデルを構築する。
【0063】
第1関連行動を示す入力ベクトルは、第1コンテキスト推定モデルに入力される入力ベクトルと同じく、第1ユーザを示す第1ユーザIDに対応する第1ユーザベクトル、及び当該第1ユーザが閲覧した第1のアイテムを示す第1アイテムIDに対応する第1アイテムコンテンツベクトルである。
【0064】
図6は、第1行動推定モデルを示す図である。第1行動推定モデルは、例えばニューラルネットワークモデルであり、図6に示すように、第1受付部、第1変換部、第3出力部を有している。コンピュータが第1行動推定モデルを実行することにより、コンピュータは、第1受付部、第1変換部、第3出力部として機能する。
【0065】
第1受付部及び第1変換部は、第1行動推定モデルが有する第1受付部及び第1変換部と同じであるため、説明を省略する。
第3出力部は、第1変換部により変換された第1埋込ベクトルに基づいて、第1ユーザの購買行動(第1行動)の発生確率を示す第1行動予測情報を出力する。第1行動予測情報は、例えば、第1ユーザが入力ベクトルに対応する第1アイテムを購入する評価値を示すレーティング情報である。当該レーティング情報は、第1ユーザの第1アイテムに対する閲覧行動や購入行動に伴う5段階等の明示的評価値でもよく、閲覧行動や購入行動が発生したか否かを表す暗黙的評価値でもよい。
【0066】
第3構築部135は、教師データ生成部132が生成した入力ベクトルと、当該入力ベクトルに含まれる第1アイテムコンテンツベクトルに対応する第1アイテムの購買結果を示す購買結果情報とを教師データとする。購買結果情報は、データ取得部131が取得した購買履歴情報に基づいて生成され、0又は1のいずれかをとる二値情報である。例えば、第1ユーザが第1アイテムを購入した場合、購買結果情報の値は1であり、第1ユーザが第1アイテムを購入しなかった場合、購買結果情報の値は0である。なお、購買結果情報は、第1ユーザが第1アイテムを購入する確率を示す情報であってもよく、例えば分析者等が分析することにより生成されてもよい。
【0067】
第3構築部135は、教師データを用いて、当該教師データに含まれる入力ベクトルを第1行動推定モデルに入力すると、第1行動推定モデルから、当該入力ベクトルに対応する第1アイテムを購入する確率を示すレーティング情報が出力されるように第1行動推定モデルの学習を行うことにより、第1行動推定モデルを構築する。第3構築部135は、構築した第1行動推定モデルを記憶部12に記憶させる。
【0068】
第4構築部136は、第2構築部134により構築された第2コンテキスト推定モデルと、第3構築部135により構築された第1行動推定モデルとを用いて、第2ユーザの閲覧行動(第2関連行動)を示す入力ベクトルが入力されると、第2ユーザの購買行動(第2行動)の発生確率を示す第2行動予測情報を出力する第2行動推定モデルを構築する。
【0069】
具体的には、第4構築部136は、第2構築部134により構築された第2受付部及び第2変換部と、第3構築部により構築された第3出力部であって、第2変換部が生成した第2埋込ベクトルに基づいて、第2ユーザの第2行動の発生確率を示す第2行動予測情報を出力する第3出力部とを有する第2行動推定モデルを構築する。
【0070】
図7は、第2行動推定モデルを示す図である。第2行動推定モデルは、例えばニューラルネットワークモデルであり、図7に示すように、第2コンテキスト推定モデルが有する第2受付部、第2変換部を有している。また、第2行動推定モデルは、第1行動推定モデルが有する第3出力部を有している。コンピュータが第2行動推定モデルを実行することにより、コンピュータは、第2受付部、第2変換部、第3出力部として機能する。第4構築部136は、構築した第2行動推定モデルを記憶部12に記憶させる。
【0071】
予測部137は、第2ユーザの第2行動の発生確率を予測する。例えば、予測部137は、分析者が使用する端末から、第2ドメインの第2ユーザの第2ユーザIDと、当該第2ユーザの第2サイトにおける閲覧行動(第2関連行動)に対応する第2アイテムの第2アイテムIDとを取得する。予測部137は、第2アイテムの第2アイテムIDを取得したが、これに限らず、第1アイテムの第1アイテムIDを取得してもよい。
【0072】
予測部137は、取得した第2ユーザIDに対応する1hotベクトルを第2ユーザベクトルとして生成する。予測部137は、取得した第1アイテムID又は第2アイテムIDに対応する第2アイテムコンテンツベクトルを生成する。予測部137は、記憶部12に記憶されている第2行動推定モデルを実行し、生成した第2ユーザベクトルと、第2アイテムコンテンツベクトルとを、第2行動推定モデルに入力し、第2行動推定モデルから第2行動予測情報を取得する。予測部137は、取得した第2行動予測情報を分析者の端末に出力する。予測部137は、候補となる第2アイテムコンテンツベクトルを複数入力し、その中で発生確率の高い第1アイテムID又は第2アイテムIDを出力してもよい。
【0073】
[動作フロー]
図8は、本実施の形態に係る情報処理装置1における処理の流れの一例を示すフローチャートである。
まず、データ取得部131は、第1関連行動データ、第2関連行動データ、第1行動データを取得する(S1)。
続いて、教師データ生成部132は、S1において取得した第1関連行動データ、第2関連行動データ、第1行動データに基づいて、第1コンテキスト推定モデル、第2コンテキスト推定モデル、第1行動推定モデルの構築に用いる教師データを生成する(S2)。
【0074】
続いて、第1構築部133は、教師データ生成部132が生成した教師データを用いて第1コンテキスト推定モデルを構築する(S3)。
続いて、第2構築部134は、教師データ生成部132が生成した教師データを用いて第2コンテキスト推定モデルを構築する(S4)。
ここで、S3に係る処理が実行された後にS4に係る処理が実行されることとしたが、これに限らない。S4に係る処理が実行された後にS3に係る処理が実行されてもよいし、並列に非同期で実行してもよい。
続いて、第3構築部135は、教師データ生成部132が生成した教師データを用いて第1行動推定モデルを構築する(S5)。
【0075】
続いて、第4構築部136は、第2コンテキストモデルが有する第2受付部及び第2変換部と、第1行動推定モデルが有する第3出力部とを組み合わせて第2行動推定モデルを構築する(S6)。
【0076】
続いて、予測部137は、分析者の端末から、第2ユーザIDと、第2アイテムIDとを取得する(S7)。なお、上述したように、予測部137は、第2アイテムIDを取得する代わりに、将来の行動として第1アイテムIDを取得してもよい。
【0077】
続いて、予測部137は、取得した第2ユーザIDに対応する第2ユーザベクトルを生成するとともに、取得した第2アイテムIDに対応する第2アイテムコンテンツベクトルを生成する。なお、予測部137は、第2アイテムIDに代わりに第1アイテムIDを取得した場合には、第1アイテムIDに対応する第1アイテムコンテンツベクトルを生成する。そして、予測部137は、生成した第2ユーザベクトルと、第2アイテムコンテンツベクトルとを、第2行動推定モデルに入力し、第2行動推定モデルから第2行動予測情報を取得する(S8)。なお、予測部137は、第2アイテムIDに代わりに第1アイテムIDを取得した場合には、生成した第2ユーザベクトルと、第1アイテムコンテンツベクトルとを、第2行動推定モデルに入力し、第2行動推定モデルから第2行動予測情報を取得する。
続いて、予測部137は、S8において取得した第2行動予測情報を分析者の端末に出力する(S9)。
【0078】
[変形例]
なお、上述の実施形態において、第1コンテキスト推定モデルの第1受付部は、一人の第1ユーザに対応する第1ユーザベクトルを受け付け、第2コンテキスト推定モデルの第2受付部は、一人の第2ユーザに対応する第1ユーザベクトルを受け付けたが、これに限らない。第1受付部は、複数の第1ユーザに対応する複数の第1ユーザベクトルを平均化したベクトルと、複数の第1ユーザベクトルに対応する第1アイテムIDに対応する第1アイテムコンテンツベクトルの入力を受け付けてもよい。同様に、第2受付部は、複数の第2ユーザに対応する複数の第2ユーザベクトルを平均化したベクトルと、複数の第2ユーザベクトルに対応する第2アイテムIDに対応する第2アイテムコンテンツベクトルの入力を受け付けてもよい。
【0079】
この場合、複数の第1ユーザベクトルに対応する第1アイテムIDは、例えば、複数の第1ユーザが第1ドメインのサイトにおいて閲覧した回数が相対的に多い第1アイテムに対応する第1アイテムIDである。また、複数の第2ユーザベクトルに対応する第2アイテムIDは、例えば、複数の第2ユーザが第2ドメインのサイトにおいて閲覧した回数が相対的に多い第1アイテムに対応する第1アイテムIDである。このようにすることで、情報処理装置1は、ユーザのプライバシーを考慮して、それぞれのドメインの複数のユーザに対応するコンテキスト情報を取得することができる。
【0080】
[第1の実施の形態における効果]
以上の通り、本実施の形態に係る情報処理装置1は、第1関連行動データと、第1関連行動に対する第1行動の発生結果を示すデータとを用いて、第1ユーザIDに対応する第1ユーザベクトル、及び第1アイテムIDに対応する第1アイテムコンテンツベクトルの入力を受け付ける第1受付部、入力されたベクトルを、ベクトルの特徴を示す所定の次元数の第1埋込ベクトルに変換する第1変換部、及び変換された第1埋込ベクトルに基づいて、第1ユーザの第1行動の発生確率を示す第1行動予測情報を出力する第3出力部を有する第1行動予測モデルを構築する。また、情報処理装置1は、第2関連行動データを用いて、第2ユーザIDに対応する第2ユーザベクトル、及び第2アイテムIDに対応するとともに第1アイテムコンテンツベクトルと同じ特徴空間で表現される第2アイテムコンテンツベクトルの入力を受け付ける第2受付部、入力されたベクトルを、ベクトルの特徴を示す所定の次元数の第2埋込ベクトルに変換する第2変換部、及び変換された第2埋込ベクトルに基づいて、第2ユーザの第2関連行動に関する情報であって、第1コンテキスト情報と同じ表現形式を有する第2コンテキスト情報を出力する第2出力部を有する第2コンテキスト推定モデルを構築する。そして、情報処理装置1は、第2受付部及び第2変換部と、第3構築部により構築された第3出力部であって、第2埋込ベクトルに基づいて、第2ユーザの第2行動の発生確率を示す第2行動予測情報を出力する第3出力部とを有する第2行動推定モデルを構築する。このようにすることで、第1ドメインのデータと第2ドメインのデータとにおいてユーザの対応付けを行うことなく、第1ドメインに対応するユーザの行動から第2ドメインに対応するユーザの行動を推定することができる。
【0081】
<第2の実施の形態>
続いて、第2の実施の形態について説明する。第2の実施の形態に係る情報処理装置1は、第1コンテキスト推定モデル及び第2コンテキスト推定モデルにより生成される埋込ベクトルが、あたかも同一のコンテキスト推定モデルから出力された埋込ベクトルであるかのように、第1埋込ベクトル及び第2埋込ベクトルが生成されるように、第1コンテキスト推定モデル及び第2コンテキスト推定モデルの調整を行う点で第1の実施の形態と異なる。以下に、第2の実施の形態に係る情報処理装置1について説明する。なお、第1の実施の形態と同じ部分については適宜説明を省略する。
【0082】
図9は、第2の実施の形態の情報処理装置1の構成を示す図である。図9に示すように、第2の実施の形態の情報処理装置1は、判定部138をさらに有する。
【0083】
判定部138は、第1ユーザベクトルと第1アイテムコンテンツベクトルとから、第1コンテキスト推定モデルの第1変換部が変換した第1埋込ベクトル、及び第2ユーザベクトルと第2アイテムコンテンツベクトルとから第2コンテキスト推定モデルの第2変換部が変換した第2特徴ベクトルの少なくともいずれか入力を受け付け、入力された埋込ベクトルが第1埋込ベクトルであるか第2埋込ベクトルであるかを示す判定情報を出力する。例えば、判定部138は、入力された埋込ベクトルの特徴量に基づいて、入力された埋込ベクトルが第1埋込ベクトルであるか第2埋込ベクトルであるかの判定を行い、判定結果を示す判定情報を出力する。
【0084】
また、判定部138は、判定情報の出力結果の正解率が高くなるように学習する。例えば、判定部138は、埋込ベクトルの入力を受け付けるとともに、当該埋込ベクトルが第1埋込ベクトルであるか、第2埋込ベクトルであるかを示す正解情報を取得する。判定部138は、自身の判定結果が、正解情報が示す正解となる確率が高くなるように学習する。
【0085】
第1構築部133及び第2構築部134は、自身が生成する埋込ベクトルを判定部138が判定した場合における、判定部138の判定結果の正解率が50%に近くなるように学習する。例えば、第1構築部133は、第1変換部により生成した第1埋込ベクトルを判定部138に入力し、判定部138から判定結果を取得する処理を複数回行い、判定部138から出力された判定結果の正解率が50%に近くなるように学習を行う。第2構築部134も、第1構築部133と同様に、第1変換部により生成した第1埋込ベクトルを判定部138に入力し、判定部138から判定結果を取得する処理を複数回行い、判定部138から出力された判定結果の正解率が50%に近くなるように学習を行う。
【0086】
なお、本実施の形態では、第1構築部133及び第2構築部134が、自身が生成する埋込ベクトルを判定部138が判定した場合における、判定部138の判定結果の正解率が50%に近くなるように学習したが、これに限らない。第1構築部133及び第2構築部134のいずれか一方のみが、自身が生成する埋込ベクトルを判定部138が判定した場合における、判定部138の判定結果の正解率が50%に近くなるように学習してもよい。
【0087】
[第2の実施の形態における効果]
以上の通り、本実施の形態に係る情報処理装置1において、判定部138は、判定情報の出力結果の正解率が高くなるように学習し、第1構築部133及び第2構築部134の少なくともいずれかは、自身が生成する特徴ベクトルを判定部138が判定した場合における判定結果の正解率が50%に近くなるように学習する。このようにすることで、第1コンテキスト推定モデル及び第2コンテキスト推定モデルにより生成される埋込ベクトルが、あたかも同一のコンテキスト推定モデルから出力された埋込ベクトルであるかのように、第1コンテキスト推定モデル及び第2コンテキスト推定モデルが調整される。これにより、第1コンテキスト推定モデル及び第2コンテキスト推定モデルの中間表現である埋込ベクトルのドメイン間での差異が小さくなり、第2コンテキスト推定モデルの第2受付部及び第2変換部と、第1行動推定モデルの第3出力部とを組み合わせて生成される第2行動推定モデルの推定精度を向上させることができる。
【0088】
なお、本発明により、国連が主導する持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」に貢献することが可能となる。
【0089】
また、例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0090】
1 情報処理装置
11 通信部
12 記憶部
13 制御部
131 データ取得部
132 教師データ生成部
133 第1構築部
134 第2構築部
135 第3構築部
136 第4構築部
137 予測部
138 判定部
図1
図2
図3
図4
図5
図6
図7
図8
図9