(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-09
(45)【発行日】2024-12-17
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
G06Q 30/0202 20230101AFI20241210BHJP
G06F 16/9035 20190101ALI20241210BHJP
【FI】
G06Q30/0202
G06F16/9035
(21)【出願番号】P 2022058400
(22)【出願日】2022-03-31
【審査請求日】2023-09-11
(73)【特許権者】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100109380
【氏名又は名称】小西 恵
(74)【代理人】
【識別番号】100109036
【氏名又は名称】永岡 重幸
(72)【発明者】
【氏名】平手 勇宇
(72)【発明者】
【氏名】ラーマン エムディ モスタフィズ
(72)【発明者】
【氏名】蛭子 ▲たく▼磨
(72)【発明者】
【氏名】コンダパカ マノゥチ
(72)【発明者】
【氏名】菊田 大輔
(72)【発明者】
【氏名】アブロール サティアン
(72)【発明者】
【氏名】ルメルシエ マクサンス
【審査官】谷川 智秀
(56)【参考文献】
【文献】特開2017-097717(JP,A)
【文献】特開2021-120874(JP,A)
【文献】特開2019-197422(JP,A)
【文献】特開2010-073195(JP,A)
【文献】清水 良太郎,ファッション系ECサイトにおける多様な補助情報を有したグラフ構造の学習アルゴリズムに関する一考察,日本経営工学会 2021年 春季大会 予稿集,日本経営工学会,2021年05月16日,pp.334-335
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00-99/00
G06F 16/9035
(57)【特許請求の範囲】
【請求項1】
複数のユーザにより使用される複数のユーザ装置から前記複数のユーザ
のユーザ特徴であって、ウェブサービスを通じた商品やサービスを含むアイテムに対する購入履歴、検索履歴、または閲覧履歴であるアイテムに関連する特徴を含むユーザ特徴を取得し、所定のデータベースから複数のアイテムのアイテム特徴を取得する取得手段と、
前記複数のユーザのユーザ特徴から、
前記複数のユーザのうちのウェブサービスを通じて所与の商品やサービスの購入、利用、およびポジティブな評価のうちの少なくともいずれかを行ったユーザ群であるモデルユーザ群
のユーザ特徴と、
前記複数のユーザのうちの前記モデルユーザ群と異なる
ユーザ群である対象のユーザ群
のユーザ特徴とを選択する選択手段と、
前記複数のユーザのユーザ特徴間の共通性を用いて、前記複数のユーザを表す複数のユーザノードをリンクで接続して、前記複数のユーザ間の関係を表すユーザ間関係グラフを構築するユーザ間グラフ構築手段と、
前記複数のアイテムのアイテム特徴間の関係性を用いて、前記複数のアイテムを表す複数のアイテムノードをリンクで接続して、前記複数のアイテム間の関係を表すアイテム間関係グラフを構築するアイテム間グラフ構築手段と、
前記複数のユーザのユーザ特徴のうちアイテムに関連する特徴を用いて、前記複数のユーザノードそれぞれと前記複数のアイテムノードをリンクで接続して、前記複数のユーザそれぞれと前記複数のアイテム間の関係を表すユーザ-アイテム間関係グラフを構築するユーザ-アイテム間グラフ構築手段と、
前記ユーザ間関係グラフ、前記アイテム間関係グラフ、および、前記ユーザ-アイテム間グラフにおいて、共通するユーザノードまたはアイテムノードを接続点として用いて、前記複数のユーザノードと前記複数のアイテムノードをリンクで接続することにより、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を表すグラフを構築するグラフ構築手段と、
前記グラフを、ベクトル空間に埋め込み、前記ベクトル空間における各ノードおよび各リンクのベクトル表現を学習し、前記対象のユーザ群のそれぞれのユーザのユーザノードについての前記グラフにおけるベクトル表現を、ユーザ表現として生成する生成手段と、
前記ユーザ表現に基づいて、前記対象のユーザ群のうち、前記モデルユーザ群に含まれるユーザ
の特徴と類似した特徴を有する1以上のユーザを、類似ユーザ群として予測する予測手段と、
を有し、
前記予測手段は、前記対象のユーザ群のユーザ特徴と前記ユーザ表現を入力とし、前記モデルユーザ群のユーザ特徴に類似したユーザ特徴を有する確率を出力するように構成された機械学習のための学習モデルを用いて、前記確率が所定の閾値より大きい1以上のユーザを前記類似ユーザ群として予測する、ことを特徴とする情報処理装置。
【請求項2】
前記アイテム特徴から、前記複数のアイテムの分類
を設定する
設定手段を更に有し、
前記
グラフ構築手段は、前記複数のユーザの
ユーザ特徴のうちアイテムに関連する特徴と、前記
複数のアイテムのアイテム特徴と
、前記複数の
アイテムの分類とにおける相互の関係を表すグラフネットワークを、前記グラフとして構築することを特徴とする請求項
1に記載の情報処理装置。
【請求項3】
前記複数の
アイテムの分類のそれぞれは、前記複数のアイテムそれぞれのブランド名であることを特徴とする請求項
2に記載の情報処理装置。
【請求項4】
前記類似ユーザ群に対して広告を配信する配信手段を更に有することを特徴とする請求項1から
3のいずれか1項に記載の情報処理装置。
【請求項5】
情報処理装置により実行される情報処理方法であって、
複数のユーザにより使用される複数のユーザ装置から前記複数のユーザ
のユーザ特徴であって、ウェブサービスを通じた商品やサービスを含むアイテムに対する購入履歴、検索履歴、または閲覧履歴であるアイテムに関連する特徴を含むユーザ特徴を取得し、所定のデータベースから複数のアイテムのアイテム特徴を取得する取得工程と、
前記複数のユーザのユーザ特徴から、
前記複数のユーザのうちのウェブサービスを通じて所与の商品やサービスの購入、利用、およびポジティブな評価のうちの少なくともいずれかを行ったユーザ群であるモデルユーザ群
のユーザ特徴と、
前記複数のユーザのうちの前記モデルユーザ群と異なる
ユーザ群である対象のユーザ群
のユーザ特徴とを選択する選択工程と、
前記複数のユーザのユーザ特徴間の共通性を用いて、前記複数のユーザを表す複数のユーザノードをリンクで接続して、前記複数のユーザ間の関係を表すユーザ間関係グラフを構築するユーザ間グラフ構築工程と、
前記複数のアイテムのアイテム特徴間の関係性を用いて、前記複数のアイテムを表す複数のアイテムノードをリンクで接続して、前記複数のアイテム間の関係を表すアイテム間関係グラフを構築するアイテム間グラフ構築工程と、
前記複数のユーザのユーザ特徴のうちアイテムに関連する特徴を用いて、前記複数のユーザノードそれぞれと前記複数のアイテムノードをリンクで接続して、前記複数のユーザそれぞれと前記複数のアイテム間の関係を表すユーザ-アイテム間関係グラフを構築するユーザ-アイテム間グラフ構築工程と、
前記ユーザ間関係グラフ、前記アイテム間関係グラフ、および、前記ユーザ-アイテム間グラフにおいて、共通するユーザノードまたはアイテムノードを接続点として用いて、前記複数のユーザノードと前記複数のアイテムノードをリンクで接続することにより、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を表すグラフを構築するグラフ構築工程と、
前記グラフを、ベクトル空間に埋め込み、前記ベクトル空間における各ノードおよび各リンクのベクトル表現を学習し、前記対象のユーザ群のそれぞれのユーザのユーザノードについての前記グラフにおけるベクトル表現を、ユーザ表現として生成する生成工程と、
前記ユーザ表現に基づいて、前記対象のユーザ群のうち、前記モデルユーザ群に含まれるユーザ
の特徴と類似した特徴を有する1以上のユーザを、類似ユーザ群として予測する予測工程と、
を有し、
前記予測工程では、前記対象のユーザ群のユーザ特徴と前記ユーザ表現を入力とし、前記モデルユーザ群のユーザ特徴に類似したユーザ特徴を有する確率を出力するように構成された機械学習のための学習モデルを用いて、前記確率が所定の閾値より大きい1以上のユーザを前記類似ユーザ群として予測する、ことを特徴とする情報処理方法。
【請求項6】
情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
複数のユーザにより使用される複数のユーザ装置から前記複数のユーザ
のユーザ特徴であって、ウェブサービスを通じた商品やサービスを含むアイテムに対する購入履歴、検索履歴、または閲覧履歴であるアイテムに関連する特徴を含むユーザ特徴を取得し、所定のデータベースから複数のアイテムのアイテム特徴を取得する取得処理と、
前記複数のユーザのユーザ特徴から、
前記複数のユーザのうちのウェブサービスを通じて所与の商品やサービスの購入、利用、およびポジティブな評価のうちの少なくともいずれかを行ったユーザ群であるモデルユーザ群
のユーザ特徴と、
前記複数のユーザのうちの前記モデルユーザ群と異なる
ユーザ群である対象のユーザ群
のユーザ特徴とを選択する選択処理と、
前記複数のユーザのユーザ特徴間の共通性を用いて、前記複数のユーザを表す複数のユーザノードをリンクで接続して、前記複数のユーザ間の関係を表すユーザ間関係グラフを構築するユーザ間グラフ構築処理と、
前記複数のアイテムのアイテム特徴間の関係性を用いて、前記複数のアイテムを表す複数のアイテムノードをリンクで接続して、前記複数のアイテム間の関係を表すアイテム間関係グラフを構築するアイテム間グラフ構築処理と、
前記複数のユーザのユーザ特徴のうちアイテムに関連する特徴を用いて、前記複数のユーザノードそれぞれと前記複数のアイテムノードをリンクで接続して、前記複数のユーザそれぞれと前記複数のアイテム間の関係を表すユーザ-アイテム間関係グラフを構築するユーザ-アイテム間グラフ構築処理と、
前記ユーザ間関係グラフ、前記アイテム間関係グラフ、および、前記ユーザ-アイテム間グラフにおいて、共通するユーザノードまたはアイテムノードを接続点として用いて、前記複数のユーザノードと前記複数のアイテムノードをリンクで接続することにより、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を表すグラフを構築するグラフ構築処理と、
前記グラフを、ベクトル空間に埋め込み、前記ベクトル空間における各ノードおよび各リンクのベクトル表現を学習し、前記対象のユーザ群のそれぞれのユーザのユーザノードについての前記グラフにおけるベクトル表現を、ユーザ表現として生成する生成処理と、
前記ユーザ表現に基づいて、前記対象のユーザ群のうち、前記モデルユーザ群に含まれるユーザ
の特徴と類似した特徴を有する1以上のユーザを、類似ユーザ群として予測する予測処理と、を含む処理を実行させるためのものであ
り、
前記予測処理は、前記対象のユーザ群のユーザ特徴と前記ユーザ表現を入力とし、前記モデルユーザ群のユーザ特徴に類似したユーザ特徴を有する確率を出力するように構成された機械学習のための学習モデルを用いて、前記確率が所定の閾値より大きい1以上のユーザを前記類似ユーザ群として予測することを含む、
情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、広告提供に関連した技術に関する。
【背景技術】
【0002】
近年、インターネットを介した広告配信において、広告の配信対象のユーザ群の選定(ターゲティング)が行われている。ターゲティングの技術として、例えば、特許文献1に開示される技術が知られている。当該文献では、広告に対応する商品の購買履歴がない場合であっても、他の商品の購買履歴に基づき、当該広告に対応する商品を購入していると推定される消費者群を、広告配信対象として決定することが記載されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1による技術では、予め設定された複数の消費者グループに属する各消費者の消費行動に関する特徴を表すデータベースに基づいて、広告配信対象を決定している。しかしながら、当該技術では、消費者(ユーザ)の消費行動に影響を与えうる、複数のユーザおよび広告される複数のアイテムにおける関係性は考慮されておらず、効果的なターゲティングが実現されていないという課題があった。
【0005】
本発明は上記課題に鑑みてなされたものであり、複数のユーザおよび広告される複数のアイテムにおける関係性を考慮したターゲティングを実現するための技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明による情報処理装置の一態様は、複数のユーザから、モデルユーザ群と、当該モデルユーザ群と異なる対象のユーザ群とを選択する選択手段と、前記対象のユーザ群のそれぞれのユーザについて、前記複数のユーザと複数のアイテムとの関係を表すユーザ表現を生成する生成手段と、前記ユーザ表現に基づいて、前記対象のユーザ群のうち、前記モデルユーザ群に含まれるユーザと類似した特徴を有する1以上のユーザを類似ユーザ群として予測する予測手段と、を有する。
【0007】
前記情報処理装置は、前記複数のユーザそれぞれのユーザについての事実特徴をユーザ特徴として取得するユーザ特徴取得手段を更に有し、前記予測手段は、前記対象のユーザ群の前記ユーザ特徴と、前記ユーザ表現とから、前記類似ユーザ群を予測しうる。
【0008】
前記情報処理装置は、前記複数のユーザと前記複数のアイテムにおける相互の関係を表すグラフを構築する構築手段と、を更に有し、前記生成手段は、前記グラフから、前記ユーザ表現を生成しうる。
【0009】
前記情報処理装置は、複数のアイテムに関する特徴をアイテム特徴として取得するアイテム特徴取得手段と、を更に有し、前記構築手段は、前記複数のユーザの前記ユーザ特徴と、前記アイテム特徴とに基づいて、前記グラフを構築しうる。
【0010】
前記構築手段は、前記複数のユーザの前記ユーザ特徴と、前記アイテム特徴とに基づいて、前記複数のユーザ間の関係である第1関係、前記複数のアイテム間の関係である第2関係、および、前記複数のユーザと前記複数のアイテム間の関係である第3関係を構築し、前記第1関係、前記第2関係、および前記第3関係を用いて、前記グラフを構築しうる。
【0011】
前記情報処理装置は、前記アイテム特徴から、前記複数のアイテムの分類を表す複数のタスクを設定するタスク設定手段を更に有し、前記構築手段は、前記複数のユーザの前記ユーザ特徴と、前記アイテム特徴とに基づいて、前記複数のユーザ、前記複数のアイテム、および前記複数のタスクにおける相互の関係を表すグラフネットワークを、前記グラフとして構築しうる。
【0012】
前記複数のタスクのそれぞれは、前記複数のアイテムそれぞれのブランド名でありうる。
【0013】
前記予測手段は、前記対象のユーザ群の前記ユーザ特徴と前記ユーザ表現を入力とし、前記モデルユーザ群に含まれるユーザと類似した特徴を有する可能性を出力するように構成された機械学習のための学習モデルを用いて、前記類似ユーザ群を予測しうる。
【0014】
前記予測手段は、前記可能性が所定の閾値より大きい1以上のユーザを前記類似ユーザ群として予測しうる。
【0015】
前記情報処理装置は、前記類似ユーザ群に対して広告を配信する配信手段を更に有しうる。
【0016】
上記課題を解決するために、本発明による情報処理方法の一態様は、複数のユーザから、モデルユーザ群と、当該モデルユーザ群と異なる対象のユーザ群とを選択する選択工程と、前記対象のユーザ群のそれぞれのユーザについて、前記複数のユーザと複数のアイテムとの関係を表すユーザ表現を生成する生成工程と、前記ユーザ表現に基づいて、前記対象のユーザ群のうち、前記モデルユーザ群に含まれるユーザと類似した特徴を有する1以上のユーザを類似ユーザ群として予測する予測工程と、を有する。
【0017】
上記課題を解決するために、本発明によるプロプラムの一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、複数のユーザから、モデルユーザ群と、当該モデルユーザ群と異なる対象のユーザ群とを選択する選択処理と、前記対象のユーザ群のそれぞれのユーザについて、前記複数のユーザと複数のアイテムとの関係を表すユーザ表現を生成する生成処理と、前記ユーザ表現に基づいて、前記対象のユーザ群のうち、前記モデルユーザ群に含まれるユーザと類似した特徴を有する1以上のユーザを類似ユーザ群として予測する予測処理と、を含む処理を実行させるためのものである。
【発明の効果】
【0018】
本発明によれば、複数のユーザおよび広告される複数のアイテムにおける関係性を考慮したターゲティングが可能となる。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
【図面の簡単な説明】
【0019】
【
図2】
図2は、第1実施形態による情報処理装置10の機能構成例を示す。
【
図3】
図3は、知識グラフの作成手順のフローチャートを示す。
【
図5】
図5は、リンク間の関係性の推論処理を説明するための図である。
【
図6A】
図6Aは、ユーザペアの関係の近さに基づくスコア(近さスコア)の概念図を示す。
【
図6B】
図6Bは、スコア予測モデル112の概略アーキテクチャを示す。
【
図7】
図7は、アイテム間関係グラフの概念図を示す。
【
図8】
図8は、ユーザ-アイテム間関係グラフの概念図を示す。
【
図9】
図9は、知識グラフとユーザ表現の概念図を示す。
【
図10】
図10は、第1実施形態による見込みユーザ予測処理を説明するための図である。
【
図11】
図11は、情報処理装置10とユーザ装置11のハードウェア構成例を示す。
【
図12】
図12は、第1実施形態による情報処理装置10により実行される処理のフローチャートを示す。
【
図13】
図13は、第2実施形態による情報処理装置10の機能構成例を示す。
【
図14】
図14は、GNNの作成手順のフローチャートを示す。
【
図16】
図16は、第2実施形態による見込みユーザ予測処理を説明するための図である。
【
図17】
図17は、第2実施形態による情報処理装置10により実行される処理のフローチャートを示す。
【発明を実施するための形態】
【0020】
以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【0021】
(第1実施形態)
[情報処理システムの構成]
図1に、本実施形態による情報処理システムの構成例を示す。本情報処理システムは、その一例として、
図1に示すように、情報処理装置10と、任意の複数のユーザ1~Nにより使用される複数のユーザ装置11-1~11-N(N>1)を含んで構成される。なお、以下の説明において、特に説明がない限り、ユーザ装置11-1~11-Nをユーザ装置11と総称しうる。また、以下の説明において、ユーザ装置とユーザという語は同義に使用されうる。
【0022】
ユーザ装置11は、例えば、スマートフォンやタブレットといったデバイスであり、LTE(Long Term Evolution)等の公衆網や、無線LAN(Local Area Network)等の無線通信網を介して、情報処理装置10と通信可能に構成されている。ユーザ装置11は、液晶ディスプレイ等の表示部(表示面)を有し、各ユーザは、当該液晶ディスプレイに装備されたGUI(Graphic User Interface)により各種操作を行うことができる。当該操作は、指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、画面に表示された画像等のコンテンツに対する各種の操作を含む。
なお、ユーザ装置11は、
図1に示すような形態のデバイスに限らず、デスクトップ型のPC(Personal Computer)や、ノート型のPCといったデバイスであってもよい。その場合、各ユーザによる操作は、マウスやキーボードといった入力装置を用いて行われうる。また、ユーザ装置11は、表示面を別に備えてもよい。
【0023】
ユーザ装置11は、情報処理装置10から、または、不図示の他の装置から情報処理装置10を介して提供されるウェブサービス(インターネット関連サービス)にログインして、サービスを利用することができる。当該ウェブサービスは、インターネットを介して提供される、オンラインモールやネットスーパー、あるいは、通信、金融、不動産、スポーツ、旅行に関するサービスを含むことができる。ユーザ装置11は、このようなウェブサービスを利用することにより、ユーザ装置11のユーザに関する情報を情報処理装置10に伝達することができる。
【0024】
例えば、ユーザ装置11は、ユーザ装置11のIP(Internet Protocol)アドレスや、ユーザの住所やユーザの氏名といった、ユーザ装置やユーザに関する特徴の情報を、情報処理装置10へ伝達することができる。
また、ユーザ装置11は、GPS(Global Positioning System)衛星(不図示)から受信される信号等に基づいて測位計算を行い、当該計算により得られた情報を、ユーザ装置11の位置情報として生成し、情報処理装置10へ伝達することができる。
情報処理装置10は、ユーザ装置11から各種情報を取得し、所定のデータベースからアイテムに関する特徴を取得し、当該情報に基づいて、グラフネットワーク(グラフ)を作成する。本実施形態では、情報処理装置10はグラフネットワークとして知識グラフを作成する。知識グラフは、現実世界での知識(ナレッジ)を、構造化された事実(ファクト)構造で表現した有向グラフである。本実施形態では、当該知識グラフは、ユーザ間関係(インタラクション)グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフから構成される。そして、情報処理装置10は、当該知識グラフから、任意のユーザに対するユーザ表現(知識グラフなどの有向グラフにおけるユーザの特徴ベクトル、埋め込み表現、ベクトル表現)を抽出する。
【0025】
[情報処理装置10の機能構成]
本実施形態による情報処理装置10は、まず、ユーザ装置11-1~11-Nから各種ユーザ特徴を取得し、また、所定のデータベースから、アイテムに関する特徴を取得する。本実施形態において、アイテムとは、様々なサービスに関して提供可能な有形または無形のモノ(Thing)でありうる。例えば、金融(フィンテック)サービスに関しては、銀行口座、株式や投資信託や保険商品といった金融商品、暗号通貨、スマホアプリ決済等のアイテムが存在する。また、デジタルコンテンツサービスに関しては、映画やアニメといった動画コンテンツや、写真やイラストやテキストといった静止画コンテンツ等のアイテムが存在する。また、Eコマースサービスに関しては、ネットショッピングで扱う無形または有形の商品等のアイテムが存在する。また、トラベルサービスに関しては、ホテルやパックツアーや交通機関に関する情報や予約等のアイテムが存在する。また、モバイルサービスに関しては、モバイル機器、公衆網/インターネット接続、通信利用料金等のアイテムが存在する。また、広告およびメディアサービスに関しては、オフラインやオフラインの広告商品、ダイレクトメール、放送やインターネットを介した広告等のアイテムが存在する。また、カードサービスに関しては、クレジットカード決済やポイント取引等のアイテムが存在する。また、スポーツおよび文化サービスに関しては、スポーツイベントやコンサートといったイベントやイベントで販売される商品等のアイテムが存在する。
【0026】
情報処理装置10は、取得した特徴ユーザ特徴とアイテムから知識グラフを構築し、当該知識グラフから、任意のユーザに対するユーザ表現を抽出する。当該知識グラフは、後述するように、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフから構成される。さらに、情報処理装置10は、当該ユーザ表現を用いて、所定の(所与の)シードユーザ(モデルユーザ)と同様の特徴を有する(例えば、当該シードユーザと所定のアイテムを購入する可能性の高い)見込みユーザを予測する。
【0027】
図2は、本実施形態による情報処理装置10の機能構成の一例を示す。
図2に示す情報処理装置10は、ユーザ特徴取得部101、アイテム特徴取得部102、グラフ構築部103、表現抽出部104、見込みユーザ予測部105、学習部106、出力部107、学習モデル記憶部110、および特徴記憶部120を備える。学習モデル記憶部110は、見込みユーザ予測モデル111およびスコア予測モデル112を記憶している。当該各種学習モデルについては後述する。また、特徴記憶部120は、ユーザ特徴121およびアイテム特徴122を記憶するように構成される。
【0028】
ユーザ特徴取得部101は、ユーザ装置11-1~11-Nのそれぞれから、当該ユーザ装置やユーザについての事実特徴(事実情報)(以下、ユーザ特徴)を取得する。ユーザ特徴は、当該ユーザ装置やユーザから実際に、または、客観的に得られる、事実に基づく特徴(情報)である。ユーザ特徴取得部101は例えば、ユーザ装置11から直接ユーザ特徴を取得することができる。また、ユーザ特徴取得部101は、ユーザ装置11のユーザにより所定のウェブサービスに登録された情報として、ユーザ特徴を取得することができる。
【0029】
ユーザ特徴は、ユーザ装置のIPアドレス、ユーザの住所やユーザの氏名、ユーザが保持するクレジットカードの番号、ユーザのデモグラフィック情報(性別、年齢、居住地域、職業、家族構成等の人口統計学的なユーザ属性)等を含む。また、ユーザ特徴は、所定のウェブサービス利用時における登録番号や登録名を含んでもよい。また、ユーザ特徴は、通話履歴、所定のウェブサービス利用時における商品のユーザの住所以外の配送先住所、所定のウェブサービス利用時の利用状況、利用履歴(購入履歴や販売履歴も含む)、検索履歴、閲覧履歴(クリック履歴を含む)、サービスの利用により貯めることが可能なポイントに関する情報を含んでもよい。このように、ユーザ特徴は、ユーザ装置またはユーザ自身に関連する情報や、通信を介した所定のサービス利用に関する情報を含む、あらゆる情報を含むことができる。
ユーザ特徴取得部101は、取得したユーザ特徴を、ユーザ特徴121として特徴記憶部120に記憶させる。
【0030】
アイテム特徴取得部102は、所定のデータベース(不図示)から、様々なウェブサービスにおける登録情報や取引履歴に基づく、アイテムの特徴(属性)を取得する。当該アイテムの特徴には、アイテムを識別する情報(以下、アイテムID)、当該アイテムのジャンル(上位分類)を識別する情報(以下、ジャンルID)、当該アイテムが販売されているショップを識別する情報(以下、ショップID)等が含まれる。アイテム特徴は、取引履歴に応じて、アイテムIDとジャンルID間、アイテムIDとショップID間の取引情報(取引回数等)も含むことができる。アイテム特徴取得部102は、取得したアイテムの特徴を、アイテム特徴122として特徴記憶部120に記憶させる。
【0031】
グラフ構築部103は、ユーザ特徴取得部101とアイテム特徴取得部102から取得した各種特徴に基づいて、知識グラフを構築する。当該知識グラフについては後述する。
【0032】
表現抽出部104は、グラフ構築部103により構築された知識グラフから、任意のユーザに対するユーザ表現を抽出する。また、表現抽出部104は、当該知識グラフから、任意のアイテムに対するアイテム表現を抽出してもよい。ユーザ表現(またはアイテム表現)の抽出処理については後述する。また、表現抽出部104は、構築された知識グラフにおける任意のノードにかかる埋め込み表現(ベクトル表現)を、例としてショップ表現やジャンル表現として、抽出してよい。
【0033】
見込みユーザ予測部105は、所定のシードユーザと同様の特徴を有すると予測されるユーザを、見込みユーザ(類似ユーザ)として予測する。当該シードユーザは、ウェブサービスを通じて所与の商品やサービスを購入および/または利用、および/または、当該ウェブサービスを通じて当該商品やサービスをポジティブに評価した1以上のユーザである。当該シードユーザは、ユーザ装置11-1~11-Nから選択および設定された1以上のユーザである。当該シードユーザは、見込みユーザ予想部105により選択および設定されうる。また、当該シードユーザは、操作者が入力部(
図12の入力部205)による入力操作により設定されてもよいし、予めシステムにおいて設定されていてもよいし、記憶部(
図11のROM202やRAM203)に格納されている任意のプログラムによって設定されてもよい。本実施形態では、学習部106により学習済みの見込みユーザ予測モデル111を用いて、当該見込みユーザを予測する。当該見込みユーザの予測処理については後述する。
【0034】
学習部106は、見込みユーザ予測モデル111とスコア予測モデル112を学習(トレーニング)させ、学習済みの見込みユーザ予測モデル111とスコア予測モデル112を、学習モデル記憶部110に格納する。各学習モデルの学習処理については後述する。
【0035】
出力部107は、表現抽出部104により抽出されたユーザ表現や、見込みユーザ予測部105により予測された見込みユーザの情報を出力する。当該出力は、あらゆる出力処理であってよいし、通信I/F(
図11の通信I/F207)を介した外部装置への出力であってもよいし、表示部(
図11の表示部206)への表示であってもよい。
【0036】
[知識グラフの構築手順]
次に、本実施形態による知識グラフの作成手順について説明する。当該知識グラフは、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフから構成される。
図3に、本実施形態によるグラフ構築部103により実行される知識グラフの構築手順のフローチャートを示す。以下、まず、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフそれぞれの作成手順(
図3のS30の処理に対応)を説明する。
【0037】
(1)ユーザ間関係グラフの作成手順
ユーザ間関係グラフの作成手順について説明する。なお、以下の説明においてユーザA~Eは、説明のために参照するユーザであり、ユーザ装置11のユーザでありうる。また、ユーザ間関係グラフは、
図4Aと
図4Bにおいて丸で囲まれた各ユーザノード(ユーザの識別情報を有するノード)の接続で構成され、以下の説明では、当該ユーザノードを単にユーザと称する。以下、ユーザ間関係グラフについての、
図3のS30の処理の各工程について説明する。
【0038】
<S31:リンクの作成>
S31では、グラフ構築部103は、複数のユーザ間のリンクを予測して作成する。
リンクの作成処理について、
図4Aと
図4Bを参照して説明する。
図4Aは、明示的リンクを説明するための図であり、
図4Bは、暗示的リンクを説明するための図である。明示的リンクとは、2ユーザ間(ユーザペア)の明示的な共通の特徴により作成されるリンクである。暗示的リンクとは、ユーザペアの明示的な共通の特徴の存在は不明確であるものの、すでに作成されている明示的リンクを利用して、間接的な関係として作成されるリンクである。このように、ユーザ間のリンクは、明示的リンクと暗示的リンクで識別される。
【0039】
図4Aに、ユーザのユーザ装置のIPアドレスを共通な特徴として用いて明示的リンクを作成する例を示す。
図4Aは、ユーザA~Cが利用可能なウェブサービスとして、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43、およびカード管理システム44が存在する例を示す。
図4Aでは、これら4つのウェブサービスが示されているが、ウェブサービスの数は特定の数に限定されない。
【0040】
オンラインモール41は、オンラインで(インターネットを使用して)利用可能なショッピングモールである。オンラインモール41は、例えば、ファッション、書籍、食品、コンサートチケット、不動産といった多種多様な商品やサービスを提供することができる。
ゴルフ場予約サービス42は、オンラインでゴルフ場に関するサービスを提供するウェブサイトで運営され、例えばゴルフ場の検索および予約やレッスン情報を提供することができる。
旅行関連予約サービス43は、オンラインで利用可能な各種旅行サービスを提供するウェブサイトで運営される。旅行関連予約サービス43は、例えば、ホテルやトラベルツアーの予約、航空券やレンタカーの予約、観光情報、ホテル、ホテル周辺の情報を提供することができる。
カード管理システム44は、所定のカード管理会社により発行および管理されるクレジットカードに関するサービスを提供するウェブサイトで運営される。カード管理システム44は、オンラインモール41、ゴルフ場予約サービス42、および旅行関連予約サービス43の少なくともいずれかと関連して、サービスを提供してもよい。
【0041】
図4Aの例では、ユーザA~Cはそれぞれ、同じIPアドレス(=198.45.66.xx)を用いて、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43を利用している。IPアドレスの情報は、ユーザ特徴取得部101により取得されうる。
このような場合、グラフ構築部103は、ユーザA~Cは、リンク状態45に示すように、同じIPアドレスの特徴で、明示的リンク(例えば、ユーザAとユーザCの間のリンクL1)を相互に作成する。明示的リンクは実線で表されている。
【0042】
図4Aのほか、共通の特徴として、ユーザの住所の特徴や、ユーザが使用するクレジットカード番号の特徴等を共通な特徴として用いて、明示的リンクを作成することができる。
【0043】
図4Bに、ユーザ間に暗示的リンクを作成する例を示す。
図4Bの例では、ユーザAに対して、ユーザC、ユーザD、ユーザEが明示的リンクで接続され、ユーザBに対して、ユーザC、ユーザD、ユーザEが明示的リンクで接続されている。このようなリンク特徴(リンク間の関係を示す特徴)を、共通の特徴空間へ埋め込み、各ユーザ(各ノード)間で暗黙的に関係性が構築されるとして推論されたリンクが、暗示的リンクとして作成(確立)される。
図4Bの例では、ユーザAとユーザBは、明示的リンクで接続されていないが、共通の特徴空間で関係性を有すると推論された結果、破線で示す暗示的リンクL2が作成されている。なお、グラフ構築部103は、明示的リンクで接続されたノード(ユーザ)で構成されるユーザ間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、ユーザ間の暗示的リンクを予測し作成する。このとき、グラフ構築部103は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
【0044】
<S32:リンク間の関係性の推論>
S32では、グラフ構築部103は、S31で予測および作成されたリンク間の関係性を推論する。リンク間の関係性の推論処理について、
図5を参照して説明する。
図5は、リンク間の関係性の推論処理を説明するための図であり、明示的リンクで接続されたユーザAとユーザB間のリンクの関係性を推論する例を示す。
【0045】
グラフ構築部103は、S31で作成されたリンクで接続されたユーザのペアをデータポイントとして扱い、ユーザ特徴取得部101により取得された各種情報を用いて、当該ペア(データポイント)を、共通のタイプを表すクラスタにグループ化する。当該各種情報は、IPアドレス、住所、クレジットカード、年齢、性別、友人といった情報でありうる。また、各クラスタは、配偶者、親子、近所の人、同じ世帯、同僚、友達、同性別きょうだい、異性別きょうだい等の関係を持つクラスタでありうる。
図5の例では、ユーザのペアをバツ印で示し、当該ペアがグループ化されうるクラスタとして、親子クラスタ51、配偶者クラスタ52、同性別きょうだいクラスタ53、友人クラスタ54、同僚クラスタを示す。なお、
図5では5つのクラスタを示すが、クラスタの数は特定の数に限定されない。
【0046】
例えば、グラフ構築部103は、ユーザAとユーザBが、同じ名字、年齢差が10歳未満、逆の性別、同じ住所、という特徴50を有する(共有する)場合、グラフ構築部103は、ユーザAとユーザBのペアを、夫と妻(配偶者)の関係を表すクラスタ(配偶者クラスタ52)にグループ化することができる。
【0047】
<S33:関係の近さに基づくスコア割り当て>
S33では、グラフ構築部103は、S32で推論されたペアに対する関係の近さに基づくスコアを予測し、当該スコアを当該ペアに割り当てる。本実施形態において、スコアは、0~1の間の数値であるが、スコアが取りうる数値に特定の限定はない。
図6Aに、ユーザペアの関係の近さに基づくスコア(以下、近さスコア)の概念図を示す。
【0048】
図6Aの例では、明示的リンクで接続されたユーザAとユーザBが有する(共有する)特徴によって、当該ユーザペア間の関係の近さが変化する。
図6Aの上部では、ユーザAからユーザBの関係が、同性別きょうだい、同じ住所、1200回の通話履歴、50回のギフトのやり取り、という特徴60を有する場合、当該ユーザペア間の関係の近さ(すなわち、近さスコア)は高くなる。一方、
図6Aの下部では、ユーザAからユーザBの関係が、同性別きょうだい、異なる住所、30回の通話履歴、2回のギフトのやり取り、というという特徴61を有する場合、当該ユーザペア間の関係の近さ(すなわち、近さスコア)は低くなる。このように、
図6Aの例のように、同性別きょうだいであるユーザAとユーザBであっても、当該ユーザのペアで共有される他の特徴により、当該ペアの関係の近さは異なるものとなる。関係の近さの高いペアは、互いの社会的距離が近く、高い影響を有することが観察される。一方、関係の近さの低いペアは、互いの社会的距離が遠く、近しい関係にないことが観察される。
【0049】
本実施形態では、ユーザペアに対する近さスコアを、スコア予測モデル112を用いて予測する。
図6Bに、スコア予測モデル112の概略アーキテクチャを示す。スコア予測モデル112は、ユーザペアの特徴63を入力として、当該特徴63に対する近さスコア64を予測する学習モデルである。
【0050】
スコア予測モデル112は例えば、弱教師付き学習(Weak Supervised Learning)を行う学習モデルであり、例えば、畳み込みニューラルネットワーク(CNN)による学習モデルである。本実施形態では、スコア予測モデル112は、
図6Aに示したような、ユーザペアに対する複数の特徴に対して付された近さスコア(0~1)を教師データとして学習された学習モデルとする。例えば、学習段階では、教師データとしては、
図6Aの特徴60に設定された1に近い近さスコアと、特徴61に設定された0に近い近さスコアといった組み合わせデータが使用される。当該学習処理は学習部108により実施される。
【0051】
なお、本実施形態では、ユーザペアに対する近さスコアを、スコア予測モデル112を用いて予測したが、グラフ構築部103は、他の手法により、当該スコアを予測するように構成されてもよい。
【0052】
以上の処理により、複数のユーザ間で明示的リンクまたは暗示的リンクが形成され、各リンク間では近さスコアが割り当てられ、ユーザ間関係グラフが作成される。ユーザ間関係グラフの概念図を
図6Cに示す。各ユーザのペアに対しては上記のように予測された近さスコアが割り当てられる。
【0053】
(2)アイテム間関係グラフの作成手順
次に、アイテム間関係グラフの作成手順について説明する。ユーザ間関係グラフの作成手順と同様に、グラフ構築部103は、
図3におけるS30の関係グラフの作成処理のフローチャートに従って、アイテム間関係グラフを作成する。なお、アイテム間関係グラフの作成では、S32の工程は行われない。
【0054】
<S31:リンクの作成>
S31では、グラフ構築部103は、特徴記憶部120に記憶されているアイテム特徴122に基づいて、複数のアイテム間のリンクを作成する。前述したように、本実施形態による当該アイテム特徴は、アイテムID、ジャンルID、およびショップIDを含む。すなわち、1つのアイテムIDに、少なくとも1つのジャンルIDおよび/またはショップIDが関連付けられている。なお、ジャンルIDやショップIDはそれぞれ、階層的に構成されてもよい。例えば、ジャンルが階層的に構成され、それぞれがジャンルIDを有してもよい。また、アイテム特徴は、アイテムID、ジャンルID、およびショップIDに限らず、アイテムのブランド、色、プロパティに関する情報といった他の情報(属性)を含んでもよい。
【0055】
グラフ構築部103は、任意のアイテムIDに関連付けられるジャンルIDやショップIDを、当該アイテムIDとリンクさせる。
図7に、アイテム間関係グラフの概念図を示す。アイテム間関係グラフは、
図7において丸で囲まれたアイテムID、ジャンルID、またはショップIDを示す各ノードの接続で構成され、以下の説明では、当該ノードを単にアイテム、ジャンル、またはショップと称する。
【0056】
図7において、アイテム特徴から接続されるリンクは明示的リンクであり、実線で示される(例えば、アイテムAとショップAとの間のリンクL1)。また、アイテム間の色やプロパティが類似している場合(類似度が所定の閾値より高い場合)、アイテム間を明示的リンクで接続することができる(例えば、アイテムAとアイテムBとの間のリンク)。一方、例えば、同じショップにおいて異なるアイテムが販売されている場合もある。
図7において、アイテムAとアイテムCは、いずれもショップAで販売されていることから、ショップAにリンクされている。このことから、グラフ構築部103は、アイテムAとアイテムCを、破線で示す暗示的リンクで接続することができる(
図7の例では、アイテムAとアイテムCの間のリンクL2)。なお、グラフ構築部103は、明示的リンクで接続されたノード(ユーザ)で構成されるアイテム間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、アイテム間の暗示的リンクを予測し作成する。このとき、グラフ構築部103は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
【0057】
<S33:関係の近さに基づくスコア割り当て>
S33では、グラフ構築部103は、S31で作成されたリンクにおける各ペアに対する関係の近さに基づくスコア(近さスコア)を予測し、当該スコアを当該ペアに割り当てる。
図7において、例えば、ジャンルAのうち、アイテムBよりアイテムAがよく売れる(よく取引される)場合、アイテムAとジャンルAのペアに高いスコアが割り当てられる。また、アイテムAについて、ジャンルAに属する確率が高いと判定される場合、アイテムAとジャンルAのペアに当該確率に基づくスコアが高く割り当てられる。また、任意のアイテム間の類似度がより高い場合、当該アイテムのペアに高いスコアが割り当てられる。
【0058】
グラフ構築部103は、各ペアに対する近さスコアを、前述のスコア予測モデル112を用いて予測してもよい。スコア予測モデル112を用いる場合、アイテム、ジャンル、ショップのうちの任意のペアに対する取引回数や、アイテム間の類似度の特徴に対して付された近さスコア(0~1)を教師データとして学習される(
図6B参照)。例えば、学習段階では、教師データとしては、取引回数が多い、または、類似度が高いという特徴に設定された1に近い近さスコアと、取引回数が少ない、または、類似度が低いという特徴に設定された0に近い近さスコアといった組み合わせデータが使用される。当該学習処理は学習部108により実施される。スコア割り当てにより、
図6Cに示すユーザ間関係グラフと同様に、各ペア間に対する数値としてスコアを表すことができる。
【0059】
(2)ユーザ-アイテム間関係グラフの作成手順
次に、ユーザ-アイテム間関係グラフの作成手順について説明する。ユーザ間関係グラフの作成手順と同様に、グラフ構築部103は、
図3におけるS30関係グラフの作成処理のフローチャートに従って、ユーザ-アイテム間関係グラフを作成する。なお、ユーザ-アイテム間関係グラフの作成では、S32の工程は行われない。
【0060】
<S31:リンクの作成>
S31では、グラフ構築部103は、特徴記憶部120に記憶されているユーザ特徴121に基づいて、任意のユーザと1以上のアイテム間のリンクを作成する。まず、グラフ構築部103は、特徴記憶部120に記憶されているユーザ特徴121から、各ユーザの購入履歴、検索履歴、または閲覧履歴(クリック履歴を含む)といった、各ユーザに対するアイテムに関連するユーザ特徴を取得する。グラフ構築部103は、各ユーザに対する当該アイテムに関連するユーザ特徴を用いて、各ユーザについての、ユーザ-アイテム間関係グラフを作成する。
【0061】
図8に、ユーザ-アイテム間関係グラフの概念図を示す。アイテム間関係グラフは、
図7において丸で囲まれたユーザノードとアイテムIDを示すノードの接続で構成され、以下の説明では、当該ユーザノードとアイテムIDを示すノードを単にユーザとアイテムと称する。
【0062】
図8において、ユーザAによるアイテムAのクリック履歴から、ユーザAとアイテムAがリンクされる。当該アイテムAのクリック履歴は、アイテムAに関する所定の画面領域(例えば、ボタン、写真、アイコン等)をクリックしたことを含む。また、ユーザAによるアイテムBの購入履歴から、ユーザAとアイテムBがリンクされる。また、ユーザAによるアイテムCの販売履歴から、ユーザAとアイテムCがリンクされる。なお、
図8では、ユーザAと各アイテム間は明示的リンクで接続されているが、ユーザAによる任意のアイテムへの間接的な接続を、暗示的リンクで表してもよい。また、ユーザへのアイテムに関する広告配信履歴から、ユーザとアイテムがリンクされてよい。なお、グラフ構築部103は、明示的リンクで接続されたノード(ユーザ)で構成されるユーザ-アイテム間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、ユーザ-アイテム間の暗示的リンクを予測し作成する。このとき、グラフ構築部103は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
【0063】
<S33:関係の近さに基づくスコア割り当て>
S33では、グラフ構築部103は、S31で作成されたリンクにおける各ペアに対する関係の近さに基づくスコア(近さスコア)を予測し、当該スコアを当該ペアに割り当てる。グラフ構築部103は、上述のクリック履歴、購入履歴、販売履歴および広告配信履歴などのアイテムの取引に関連する履歴に基づき、ユーザとアイテムのペアに関する近さスコアを予測してよい。例えば、ユーザが任意のアイテムをクリックしたのみの場合より、当該アイテムを実際に購入した場合に、ユーザとアイテムの距離がより近いといえる。よって、
図8の例では、ユーザAとアイテムAのペアより、ユーザAとアイテムBのペアに高いスコアが割り当てられる。また、ユーザがアイテムを販売することは、クリック動作よりも関係が近いと考えられ、
図8の例では、ユーザAとアイテムAのペアより、ユーザAとアイテムCのペアに高いスコアが割り当てられる。また、例えば、ユーザにアイテムに関する広告が複数に亘って配信されたにも関わらず、アイテムに関するクリックや購入がなされなかった場合に、ユーザとアイテムのペアに低いスコアが割り当てられてよい。
【0064】
グラフ構築部103は、各ペアに対する近さスコアを、前述のスコア予測モデル112を用いて予測してもよい。スコア予測モデル112を用いる場合、ユーザとアイテムのペアに対する特徴に対して付された近さスコア(0~1)を教師データとして学習される(
図6B参照)。例えば、学習段階では、教師データとしては、購入という特徴に設定された1に近い近さスコアと、クリックという特徴に設定された0に近い近さスコアといった組み合わせデータが使用される。当該学習処理は学習部108により実施される。スコア割り当てにより、
図6Cに示すユーザ間関係グラフと同様に、各ペア間に対する数値としてスコアを表すことができる。
【0065】
なお、
図8では、ユーザとアイテムのペアとしてユーザ-アイテム間関係グラフを定義したが、ユーザが特定のアイテムに対して、クリック、購入、または販売の履歴がある場合は、ユーザとジャンル(ジャンルID)のペアがリンクされる。そして、当該ペアで共有される特徴に対して近さスコアが割り当てられる。
【0066】
(4)全体の知識グラフの構築手順
上記の(1)~(3)の手順により、ユーザ間関係グラフ、ユーザ-アイテム間関係グラフ、および、アイテム間関係グラフが作成された後、
図3のS34において、グラフ構築部103は、これらのグラフを連結して、全体の知識グラフを構築(作成)する。
図9の上部に、知識グラフの概念図(知識グラフ90)を示す。グラフ構築部103は、作成したユーザ間関係グラフ、ユーザ-アイテム間関係グラフ、および、アイテム間関係グラフにおいて、共通するノードを接続点として用いて、全グラフを接続する。続いて、グラフ構築部103は、重複するリンク等を削除するなどして整理し、知識グラフを構築する。
図9には示されていないが、各ノード(ユーザ、アイテム、ジャンル等)間に、ノード間の近さを示す近さスコアが表されている。なお、当該近さスコアは、矢印の長さで表してもよい。また、
図9には示されていないが、各ユーザは、ユーザ特徴を含む、または、ユーザ特徴がノードとして接続されている。なお、ユーザ、アイテム、ジャンルなどのノードは知識グラフにおけるエンティティ(ヘッドエンティティまたはテイルエンティティ)に相当し、ペアおよびリンクはリレーションに相当する。
【0067】
グラフ構築部103は、明示的リンクで接続されたノードと明示的リンクとからなるファクトベースのユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフを連結して全体の知識グラフを構築してよい。また、グラフ構築部103は、明示的リンクで接続されたノードと明示的リンクとからなるファクトベースのユーザ関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフのうち一部の関係グラフと、明示的リンクで接続されたノードと明示的リンクと暗示的リンクで接続されたノードと暗示的リンクとからなるユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフのうち残りの関係グラフと、を連結して全体の知識グラフを構築してよい。つまり、全体の知識グラフは、ユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフの少なくとも1つの暗示的リンクを含まなくてもよい。また、グラフ構築部103は、作成した知識グラフの特徴空間(ベクトル空間)への埋め込むことで、ノード間の暗示的リンクを予測し作成してもよい。すなわち、グラフ構築部103は、明示的リンクのみから構成された知識グラフから、暗示的リンクを予測し、作成してもよい。なお、ユーザ表現などのエンティティの埋め込み表現(ベクトル表現)の抽出(取得)は、ユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフの少なくとも1つの暗示的リンクを含まない全体の知識グラフに基づき行われてもよい。
【0068】
[ユーザ表現の抽出手順]
次に、本実施形態によるユーザ表現の抽出手順について説明する。表現抽出部104は、グラフ構築部103により構築された知識グラフから、任意のユーザについてのユーザ表現を抽出する。具体的には、表現抽出部104は、当該知識グラフを特徴空間(ベクトル空間)に埋め込み、当該特徴空間における各ノード(エンティティ)および各リンク(リレーション)の埋め込み表現(ベクトル表現)を学習する。表現抽出部104は、知識グラフの学習(表現学習、関係学習、埋込学習)を行い、任意のユーザの埋め込み表現(低次元のベクトル表現)を、ユーザ表現(ユーザの特徴ベクトル)として抽出する(取得する)。
【0069】
表現抽出部104は、知識グラフの学習(埋め込み)に用いられる埋め込みモデルとして、TransE、TransD、RotatEなどのエンティティのベクトル表現間の距離に基づき学習を行うTranslation-basedモデルを採用してよい。また、表現抽出部104は、TransH、TransR、STransEなどのエンティティのベクトル表現を、リレーション毎に異なるベクトル空間へ写像し学習を行うEmbedding-projectionモデルを採用してよい。また、表現抽出部104は、ComplExなどのベクトル表現の複素数空間への変換を利用して学習を行うモデルを採用してよい。また、表現抽出部104は、ConvE、ConvR、R-GCNなどの畳み込みニューラルネットワーク(NN)を含むNNを利用して学習を行うモデルを採用してよい。また、表現抽出部104は、Knowledge Graph Attention Network(KGAT)などのアテンション機構を利用するモデルを採用してよく、TorusEなど、既知のモデルまたはその拡張を適宜、採用してよい。なお、表現抽出部104は、知識グラフの学習に際して適宜、正則化(L1正則化やL2正則化等)を用いてよい。
【0070】
当該ユーザ表現には、各ノードの特徴およびノード間(ペア、リンク)に割り当てられた近さスコアが反映されうる。このとき、表現抽出部104は、ノード間の近さスコアに基づきノード間のリンク(リレーション)にかかるベクトル表現に重み付けをしながら、各ノードおよび各リンクのベクトル表現の学習(知識グラフの埋め込み)を行ってよい。また、表現抽出部104は、近さスコアが所定の閾値を超える、または、下回るリンクおよび当該リンクを介して接続されるノードのそれぞれのベクトル表現を、重点的または限定的に学習し、任意のユーザなどのエンティティのベクトル表現を抽出してよい。このとき、ノードは、少なくとも任意のユーザなどのエンティティと対応するノードを含む。また、表現抽出部104は、任意のユーザなどのエンティティと対応するノードのN次近傍(N>1)における各ノードおよび各リンクのベクトル表現を、重点的または限定的に学習し、任意のユーザなどのエンティティのベクトル表現を抽出してよい。このように、学習を行う対象を、近さスコアに応じてスクリーニングすることにより、計算負荷を低減すること可能となる。
【0071】
図9の下部に、ユーザAについて抽出されたユーザ表現(ノード表現)の概念図(ユーザ表現91)を示す。ユーザ表現91において、ユーザAに暗示的または明示的リンクで接続される、1つ以上のユーザ、アイテム、ジャンル、ショップ等にかかる情報が、1つのユーザ表現に反映される。当該ユーザ表現にはまた、ユーザAに対する各ノード(アイテム、ジャンル等)の近さスコアも表現されうる。すなわち、ユーザAのユーザ表現は、ユーザAと各ノードとの関係性の近さが反映された隣接表現に相当しうる。
なお、表現抽出部104は、グラフ構築部103により構築された知識グラフから、任意のアイテムについてのアイテム表現(ノード表現)を抽出してもよい。
【0072】
[見込みユーザの予測処理]
次に、本実施形態による見込みユーザの予測処理について説明する。見込みユーザ予測モデル111は、シードユーザと同様の特徴を有するユーザを、見込みユーザとして予測する学習モデルである。シードユーザは、ウェブサービスを通じて所与の商品やサービスを購入および/または利用、および/または、当該ウェブサービスを通じて当該商品やサービスをポジティブに評価したユーザである。
【0073】
見込みユーザ予測モデル111は、例えば、XGBoostをベースにした機械学習のための学習モデルである。学習段階では、学習部106は、シードユーザ(ポジティブユーザ)のユーザ特徴と、当該シードユーザ以外のユーザ(ネガティブユーザ)のユーザ特徴、およびこれらのユーザのユーザ表現を用いて、見込みユーザ予測モデル111を学習させる。ユーザ特徴は、ベースとなるユーザ特徴であり、当該ウェブサービスでの購買履歴(商品のジャンルやタイプの情報等)を含む。当該デモグラフィック情報と当該購買履歴はそれぞれ、複数の細分化された特徴を含みうる。なお、当該ユーザ特徴は、デモグラフィック情報や購買履歴に限らず、ポイント状況(利用可能なポイント等)、ポイント特徴(オンラインまたはオフラインショップから獲得した/使用したポイントといったポイント取引に関する情報等)等、他の特徴を含んでもよい。
【0074】
学習部106は、グリッドサーチおよびクロスバリデーションにより、ハイパーパラメータ(見込みユーザ予測モデル111の挙動を制御するパラメータ)の検証およびチューニング(調整)を行う。見込みユーザ予測モデル111は、XGBoostはツリー(決定木)ベースのモデルであるため、入力データ(ユーザ特徴)がモデルの出力にどのように影響するかを示す結果を生成することができる。これにより、例えば、シードユーザは、どのユーザ特徴(細分化された特徴の組み合わせ)等に、より影響しているのかを検証することが可能となる。
【0075】
学習された見込みユーザ予測モデル111は、任意のユーザに対して、シードユーザと類似したユーザ特徴を有する可能性(見込みユーザの可能性)を出力するように構成される。当該可能性は、例えば、最大可能性を1として、0~1の数値で表される。ここで、例えば閾値を0.5と設定すると、見込みユーザ予測部105は、0.5より大きい可能性を有するユーザを、見込みユーザ(すなわち、シードユーザと同様の特徴を有する潜在的ユーザ)と予測(決定)することができる。なお、シードユーザは複数であってもよく、その場合、見込みユーザ予測部105は当該複数のシードユーザ(シードユーザ群(モデルユーザ群))に含まれるユーザと類似したユーザ特徴を有するユーザを、見込みユーザとして予測することができる。
【0076】
本実施形態では、見込みユーザ予測部105は、任意のユーザについて、表現抽出部105により抽出されたユーザ表現と、ベースとなるユーザ特徴とを、見込みユーザ予測モデル111に入力して、当該任意のユーザが見込みユーザか否かを予測する。
図10に、本実施形態による、見込みユーザ予測処理を説明するための図を示す。ユーザAを任意のユーザ(対象のユーザ)として設定されると、見込みユーザ予測部105は、ユーザAのベースとなるユーザ特徴1001と、表現抽出部104により抽出されたユーザ表現91を、見込みユーザ予測モデル111に入力して、ユーザAが見込みユーザか否かを予測する。具体的には、見込みユーザ予測部105は、ユーザAのユーザ特徴1001とユーザ表現91から、ユーザAがシードユーザと同様のユーザ特徴を有する可能性(見込みユーザの可能性1002)を予測して出力する。
【0077】
[情報処理装置10のハードウェア構成]
図11は、本実施形態による情報処理装置10のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置10は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図11を参照して、情報処理装置10は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置10は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。
【0078】
図11に示すように、情報処理装置10は、CPU201と、ROM202と、RAM203と、HDD204と、入力部205と、表示部206と、通信I/F207と、システムバス208とを備えてよい。情報処理装置10はまた、外部メモリを備えてよい。
CPU(Central Processing Unit)201は、情報処理装置10における動作を統括的に制御するものであり、データ伝送路であるシステムバス208を介して、各構成部(202~207)を制御する。
【0079】
ROM(Read Only Memory)202は、CPU201が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、HDD(Hard Disk Drive)204、SSD(Solid State Drive)等の不揮発性メモリや着脱可能な記憶媒体(不図示)等の外部メモリに記憶されていてもよい。
RAM(Random Access Memory)203は、揮発性メモリであり、CPU201の主メモリ、ワークエリア等として機能する。すなわち、CPU201は、処理の実行に際してROM202から必要なプログラム等をRAM203にロードし、当該プログラム等を実行することで各種の機能動作を実現する。
図2に示す学習モデル記憶部110と特徴記憶部102は、RAM203で構成されうる。
【0080】
HDD204は、例えば、CPU201がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、HDD204には、例えば、CPU201がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部205は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部206は、液晶ディスプレイ(LCD)等のモニターにより構成される。表示部86は、入力部205と組み合わせて構成されることにより、GUI(Graphical User Interface)として機能してもよい。
【0081】
通信I/F207は、情報処理装置10と外部装置との通信を制御するインタフェースである。
通信I/F207は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信I/F207を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信I/F207は、イーサネット(登録商標)等の通信規格に準拠する有線LAN(Local Area Network)や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wide Band)等の無線PAN(Personal Area Network)を含む。また、Wi-Fi(Wireless Fidelity)(登録商標)等の無線LAN(Local Area Network)や、WiMAX(登録商標)等の無線MAN(Metropolitan Area Network)を含む。さらに、LTE/3G、4G、5G等の無線WAN(Wide Area Network)を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
【0082】
図2に示す情報処理装置10の各要素のうち少なくとも一部の機能は、CPU201がプログラムを実行することで実現することができる。ただし、
図2に示す情報処理装置10の各要素のうち少なくとも一部の機能が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、CPU201の制御に基づいて動作する。
【0083】
[ユーザ装置11のハードウェア構成]
図1に示すユーザ装置11のハードウェア構成は、
図11と同様でありうる。すなわち、ユーザ装置10は、CPU201と、ROM202と、RAM203と、HDD204と、入力部205と、表示部206と、通信I/F207と、システムバス208とを備えうる。ユーザ装置11は、情報処理装置10により提供された各種情報を、表示部206に表示し、GUI(入力部205と表示部206による構成)を介してユーザから受け付ける入力操作に対応する処理を行うことができる。
【0084】
[処理の流れ]
図12に、本実施形態による情報処理装置10により実行される処理のフローチャートを示す。
図12に示す処理は、情報処理装置10のCPU201がROM202等に格納されたプログラムをRAM203にロードして実行することによって実現されうる。
図12の説明のために、
図1に示した情報処理システムを参照する。学習部105により学習済みの、見込みユーザ予測モデル111およびスコア予測モデル112は、学習モデル記憶部110に格納されているものとする。
【0085】
S1201において、ユーザ特徴取得部101は、ユーザ装置11-1~11-Nから、各ユーザのユーザ特徴を取得し、ユーザ特徴121として特徴記憶部120に格納する。また、アイテム特徴取得部102は、所定のデータベースから、様々なウェブサービスにおける登録情報や取引履歴に基づく、アイテムの特徴(属性)を取得し、アイテム特徴122として特徴記憶部120に格納する。S1201の処理は、過去の一定の期間におけるユーザ特徴やアイテム特徴の取得(収集)処理であってもよい。
【0086】
S1202において、グラフ構築部103は、知識ブラフを構築する。当該知識グラフの構築手順は、
図3を参照して上述した通りである。
【0087】
S1203において、表現抽出部104は、S1202で作成された知識グラフから、任意のユーザに対するユーザ表現を抽出する。当該ユーザ表現の抽出手順は、
図9を参照して上述した通りである。
【0088】
S1204において、見込みユーザ予測部105は、任意のユーザが、所定のシードユーザと同様の特徴を有する見込みユーザの可能性を予測する。本実施形態では、
図10に示したように、当該任意のユーザについて、当該ユーザのベースとなるユーザ特徴と、当該ユーザのユーザ表現を、見込みユーザ予測モデル111へ入力して、当該ユーザがシードユーザと同様の特徴を有する(見込みユーザの可能性)を予測して出力する。
【0089】
見込みユーザ予測部105はまた、ユーザ装置11-1~11-Nのうち、シードユーザ(もしくはシードユーザ群)以外の複数のユーザ(対象のユーザ群)を選択および設定してもよい。そして、見込みユーザ予測部105は、当該対象のユーザ群から、当該シードユーザと同様の特徴を有する見込みユーザを見込みユーザ群(類似ユーザ群)として予測することができる。この場合、見込みユーザ予測部105は、対象のユーザ群の各ユーザについて、当該ユーザのベースとなるユーザ特徴と、当該ユーザのユーザ表現を、見込みユーザ予測モデル111へ入力して、見込みユーザ群を予測する。また、シードユーザが複数である場合(シードユーザ群)、見込みユーザ予測部105は、当該対象のユーザ群から、当該シードユーザ群に含まれるユーザと類似したユーザ特徴を有するユーザを、見込みユーザ群として予測することができる。
【0090】
S1205において、出力部107は、S1204で予測された見込みユーザの可能性についての結果を出力する。例えば、複数のユーザに対して、S1203とS1204の処理が行われる場合、出力部107は、当該複数のユーザから予測された見込みユーザ群の情報に関する情報を生成して、外部装置(不図示)へ出力することができる。
【0091】
このように、本実施形態による情報処理装置は、複数のユーザのユーザ特徴と、複数のアイテムの特徴とから、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフを作成し、当該各関係グラフを用いて、知識グラフを作成する。当該知識グラフは、任意のユーザについて、当該ユーザに関係する全ての他のユーザとアイテム(ジャンルやショップ等を含む)がリンクされており、プラットフォームビジネスへの活用が期待される。
【0092】
また、本実施形態による情報処理装置は、当該知識グラフから、任意のユーザについて、当該ユーザに関係する全ての他のユーザとアイテムを表現したユーザ表現を作成する。当該ユーザ表現は、あらゆる他のユーザおよびアイテムの特徴(属性)を、1ユーザに対して紐づけた表現である。すなわち、当該ユーザ表現は、任意のユーザについて、他のユーザやアイテム毎の個別の表現ではなく、他のユーザおよびアイテムとの複合的な関係を包含して構成された表現である。これにより、任意のユーザの、他のユーザおよびアイテムとの繋がりを、1つの表現として扱うことができ、当該ユーザ表現をプラットフォームビジネスに対する任意の予測処理に用いる場合に、演算処理量が減るという有利な効果が得られる。
【0093】
さらに、本実施形態による情報処理装置は、任意のユーザについての当該ユーザ表現およびユーザ特徴を用いて、当該ユーザが、所定のシードユーザと同様の特徴を有するか否か(見込みユーザの可能性)を予測する。当該ユーザ特徴だけでなく、当該ユーザ表現を用いることにより、ユーザの嗜好をより考慮した予測が可能となり、予測の精度が向上しうる。そして、予測により得られた見込みユーザの情報により、よりターゲットを絞ったマーケティングが可能となる。
【0094】
(第2実施形態)
次に、第2実施形態について説明する。本実施形態による情報処理システムは、第1実施形態と同様に、
図1に示すように構成されうる。以下、第1実施形態と異なる点について説明し、同様の構成や特徴については説明を省略する。
【0095】
[情報処理装置10の機能構成]
本実施形態による情報処理装置10は、まず、ユーザ装置11-1~11-Nから各種ユーザ特徴を取得し、また、所定のデータベースから、アイテムに関する特徴を取得する。そして、情報処理装置10は、取得した特徴から、グラフネットワーク(グラフ)としてグラフニューラルネットワーク(GNN)を作成し、当該GNNから、任意のユーザに対するユーザ表現を抽出する。さらに、情報処理装置10は、当該ユーザ表現を用いて、所定のシードユーザと同様のユーザ特徴を有する(例えば、当該シードユーザと所定のアイテムを購入する可能性の高い)見込みユーザを予測する。
【0096】
図13は、本実施形態による情報処理装置10の機能構成の一例を示す。
図13に示す情報処理装置10は、ユーザ特徴取得部101、アイテム特徴取得部102、GNN構築部1301、表現抽出部1302、見込みユーザ予測部1303、学習部1304、出力部107、学習モデル記憶部110、および特徴記憶部120を備える。学習モデル記憶部110は、見込みユーザ予測モデル113およびスコア予測モデル112を記憶している。また、特徴記憶部120は、ユーザ特徴121およびアイテム特徴122を記憶するように構成される。
【0097】
GNN構築部1301は、ユーザ特徴とアイテム特徴とタスクに基づいて、GNNを作成する。GNNの構築手順については後述する。
表現抽出部1302は、GNN構築部1301により構築されたGNNから、任意のユーザに対するユーザ表現を抽出する。また、表現抽出部1302は、当該GNNから、任意のアイテムに対するアイテム表現を抽出してもよい。ユーザ表現(またはアイテム表現)の抽出処理については後述する。
【0098】
見込みユーザ予測部1303は、所定のシードユーザと同様の特徴を有すると予測されるユーザ群を、見込みユーザとして予測する。本実施形態では、学習部106により学習済みの見込みユーザ予測モデル113を用いて、当該見込みユーザを予測する。当該見込みユーザの予測処理については後述する。
【0099】
[GNNの構築手順]
次に、本実施形態によるGNNの構築手順について説明する。
図14に、本実施形態によるGNN構築部1301により実行される知識グラフの構築手順のフローチャートを示す。まず、S1401において、GNN構築部1301は、第1実施形態において説明した、ユーザ間関係グラフの作成手順に従い、ユーザ間関係グラフを作成する。また、GNN構築部1301は、第1実施形態において説明した、アイテム間関係グラフの作成手順に従い、アイテム間関係グラフを作成する。
【0100】
S1402において、GNN構築部1301は、特徴記憶部120に記憶されているユーザ特徴121に基づいて、複数のユーザ(ユーザノード)と複数のアイテム(アイテムノード)の関係グラフ(ユーザ-アイテム間関係グラフ)を作成する。具体的には、まず、GNN構築部1301は、特徴記憶部120に記憶されているユーザ特徴121から、各ユーザの購入履歴、検索履歴、または閲覧履歴(クリック履歴を含む)といった、各ユーザに対するアイテムに関連するユーザ特徴を取得する。続いて、GNN構築部1301は、各ユーザに対する当該アイテムに関連するユーザ特徴を用いて、ユーザ-アイテム間関係グラフを作成する。例えば、GNN構築部1301は、任意のユーザに対して購入履歴、検索履歴、または閲覧履歴がある1以上のアイテムに対して、エッジ(ノード間の関係、リレーション)を形成する。
【0101】
続いて、S1403において、GNN構築部1301は、ユーザ-アイテム間関係グラフに含まれる複数のアイテムの分類を表す複数のタスク(タスクノード)を設定(定義)し、当該グラフに追加する。当該タスクは、マーケットのターゲットとする1つの分類であり、例えば、アイテムのブランド名や、アイテムが販売されている地域名、アイテムを扱う代理店名を示す情報でありうる。S1404において、GNN構築部1301は、GNNを学習させ、ノード間のエッジを整理して、GNNを構築する。
【0102】
図15の上部に、GNNの概念図(GNN150)を示す。GNN150では、複数のユーザノードと複数のアイテムノード間のエッジに加えて、複数のタスクノードのエッジが追加されている。GNN構築部1301は、ユーザ特徴とアイテム特徴から、前記複数のユーザノードと前記複数のタスクノードの関係および、前記複数のアイテムノードと前記複数のタスクノードとの関係を取得し、当該取得した関係を用いて、GNNを学習させる。
【0103】
[ユーザ表現の抽出手順]
次に、本実施形態によるユーザ表現の抽出手順について説明する。表現抽出部1302は、GNN構築部1301により構築されたGNNから、任意のユーザについてのユーザ表現を抽出する。具体的には、表現抽出部1302は、当該GNNを共通の特徴空間(ベクトル空間)に埋め込み、当該特徴空間における各ノード(エンティティ)および各エッジ(リレーション)の埋め込み表現(ベクトル表現)を学習する。GNNが示すグラフネットワークの学習(表現学習、関係学習、埋込学習)を行い、任意のユーザの埋め込み表現(低次元のベクトル表現)を、ユーザ表現(ユーザの特徴ベクトル)として抽出する(取得する)。
【0104】
図15の下部に、ユーザAについて抽出されたユーザ表現の概念図(ユーザ表現151)を示す。ユーザ表現151において、ユーザAと関係性を有する1つ以上のユーザ、アイテム、ジャンル、ショップ等にかかる情報に加えて、タスク(例えばブランド名)にかかる情報が、1つのユーザ表現に反映される。
なお、表現抽出部104は、GNN構築部1301により構築されたGNNから、任意のアイテムについてのアイテム表現を抽出してもよい。
【0105】
[見込みユーザの予測処理]
次に、本実施形態による見込みユーザの予測処理について説明する。見込みユーザ予測モデル113は、シードユーザと同様の特徴を有するユーザを、見込みユーザとして予測する学習モデルである。シードユーザは、ウェブサービスを通じて所与の商品やサービスを購入および/または利用、および/または、当該ウェブサービスを通じて当該商品やサービスをポジティブに評価したユーザである。
【0106】
見込みユーザ予測モデル113は、例えば、XGBoostをベースにした学習モデルである。学習段階では、学習部106は、シードユーザのユーザ特徴と、当該シードユーザ以外のユーザ(ネガティブユーザ)のユーザ特徴、およびこれらのユーザのユーザ表現を用いて、見込みユーザ予測モデル113を学習させる。ユーザ特徴は、第1実施形態と同様に、ベースとなるユーザ特徴(デモグラフィック情報および購買履歴)でありうる。
【0107】
学習部106は、グリッドサーチおよびクロスバリデーションにより、ハイパーパラメータ(見込みユーザ予測モデル113の挙動を制御するパラメータ)の検証およびチューニング(調整)を行う。見込みユーザ予測モデル113は、XGBoostはツリー(決定木)ベースのモデルであるため、入力データ(ユーザ特徴)がモデルの出力にどのように影響するかを示す結果を生成することができる。これにより、例えば、シードユーザは、どのユーザ特徴(細分化された特徴の組み合わせ)等に、より影響しているのかを検証することが可能となる。
【0108】
学習された見込みユーザ予測モデル113は、任意のユーザに対して、シードユーザと同様のユーザ特徴を有する可能性(見込みユーザの可能性)を出力するように構成される。当該可能性は、例えば、最大可能性を1として、0~1の数値で表される。ここで、例えば閾値を0.5と設定すると、見込みユーザ予測部1303は、0.5より大きい可能性を有するユーザを、見込みユーザ(すなわち、シードユーザと同様の特徴を有する潜在的ユーザ)と予測(決定)することができる。
【0109】
本実施形態では、見込みユーザ予測部1303は、任意のユーザについて、表現抽出部1302により抽出されたユーザ表現と、ベースとなるユーザ特徴とを、見込みユーザ予測モデル113に入力して、当該任意のユーザが見込みユーザか否かを予測する。
図16に、本実施形態による、見込みユーザ予測処理を説明するための図を示す。ユーザAを任意のユーザ(対象のユーザ)として設定されると、見込みユーザ予測部1303は、ユーザAのベースとなるユーザ特徴1601と、表現抽出部1302により抽出されたユーザ表現151を、見込みユーザ予測モデル113に入力して、ユーザAが見込みユーザか否かを予測する。具体的には、見込みユーザ予測部1303は、ユーザAのユーザ特徴1601とユーザ表現151から、ユーザAがシードユーザと同様のユーザ特徴を有する可能性(見込みユーザの可能性1602)を予測して出力する。
【0110】
[処理の流れ]
図17に、本実施形態による情報処理装置10により実行される処理のフローチャートを示す。
図17に示す処理は、情報処理装置10のCPU201がROM202等に格納されたプログラムをRAM203にロードして実行することによって実現されうる。
図17の説明のために、
図1に示した情報処理システムを参照する。学習部105により学習済みの、見込みユーザ予測モデル113およびスコア予測モデル112は、学習モデル記憶部110に格納されているものとする。
【0111】
S1701の処理は、
図12のS1201の処理と同様である。S1702において、GNN構築部1301は、GNNを構築する。当該GNNの構築手順は、
図14を参照して上述した通りである。
【0112】
S1703において、表現抽出部1302は、S1702で作成されたGNNから、任意のユーザに対するユーザ表現を抽出する。当該ユーザ表現の抽出手順は、
図16を参照して上述した通りである。
【0113】
S1704において、見込みユーザ予測部1303は、任意のユーザが、所定のシードユーザと同様の特徴を有する見込みユーザの可能性を予測する。本実施形態では、
図16に示したように、当該任意のユーザについて、当該ユーザのベースとなるユーザ特徴と、当該ユーザのユーザ表現を、見込みユーザ予測モデル113へ入力して、当該ユーザがシードユーザと同様の特徴を有する(見込みユーザの可能性)を予測して出力する。
【0114】
見込みユーザ予測部1303はまた、ユーザ装置11-1~11-Nのうち、シードユーザ(もしくはシードユーザ群)以外の複数のユーザ(対象のユーザ群)を選択および設定してもよい。そして、見込みユーザ予測部1303は、当該対象のユーザ群から、当該シードユーザと同様の特徴を有する見込みユーザを見込みユーザ群(類似ユーザ群)として予測することができる。この場合、見込みユーザ予測部1303は、対象のユーザ群の各ユーザについて、当該ユーザのベースとなるユーザ特徴と、当該ユーザのユーザ表現を、見込みユーザ予測モデル113へ入力して、見込みユーザ群を予測する。また、シードユーザが複数である場合(シードユーザ群)、見込みユーザ予測部1303は、当該対象のユーザ群から、当該シードユーザ群に含まれるユーザと類似したユーザ特徴を有するユーザを、見込みユーザ群として予測することができる。
【0115】
S1705において、出力部107は、S1704で予測された見込みユーザの可能性についての結果を出力する。例えば、複数のユーザに対して、S1703とS1704の処理が行われる場合、出力部107は、当該複数のユーザから予測された見込みユーザ群の情報に関する情報を生成して、外部装置(不図示)へ出力することができる。
【0116】
このように、本実施形態による情報処理装置は、複数のユーザのユーザ特徴と、複数のアイテムの特徴、および、アイテムの一つの分類として定義した複数のタスクから、GNNを作成する。当該GNNは、任意のユーザについて、当該ユーザに関係する全ての他のユーザとアイテム(ジャンルやショップ等を含む)、およびタスクがエッジで接続されており、プラットフォームビジネスへの活用が期待される。
【0117】
また、本実施形態による情報処理装置は、当該GNNから、任意のユーザについて、当該ユーザに関係する全ての他のユーザ、アイテム、およびタスクを表現したユーザ表現を作成する。当該ユーザ表現は、あらゆる他のユーザ、アイテムの特徴(属性)、およびタスクを、1ユーザに対して紐づけた表現である。すなわち、当該ユーザ表現は、任意のユーザについて、他のユーザやアイテム毎の個別の表現ではなく、他のユーザ、アイテム、およびタスクとの複合的な関係を包含して構成された表現である。これにより、任意のユーザの、他のユーザ、アイテム、およびタスクとの繋がりを、1つの表現として扱うことができ、当該ユーザ表現をプラットフォームビジネスに対する任意の予測処理に用いる場合に、演算処理量が減るという有利な効果が得られる。
【0118】
さらに、本実施形態による情報処理装置は、任意のユーザについての当該ユーザ表現およびユーザ特徴を用いて、当該ユーザが、所定のシードユーザと同様の特徴を有するか否か(見込みユーザの可能性)を予測する。当該ユーザ特徴だけでなく、タスクを含めた当該ユーザ表現を用いることにより、ユーザの嗜好をより考慮した予測が可能となり、予測の精度が向上しうる。そして、予測により得られた見込みユーザの情報により、よりターゲットを絞ったマーケティングが可能となる。例えば、タスクをブランド名に設定した場合、任意のユーザによるブランドの嗜好性が明確になり、当該ユーザに対しては、当該ブラントに絞ったマーケティングを展開することが可能となる。
【0119】
なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。
【符号の説明】
【0120】
1~N:ユーザ、10:情報処理装置、11-1~11-N:ユーザ装置、101:ユーザ特徴取得部、102:アイテム特徴取得部、103:グラフ構築部、104;1302:表現抽出部、105;1303:見込みユーザ予測部、106:学習部、107:出力部、110:学習モデル記憶部、111;113:見込みユーザ予測モデル、112:スコア予測モデル、120:特徴記憶部、121:ユーザ特徴、122:アイテム特徴、1301:GNN構築部