(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024047942
(43)【公開日】2024-04-08
(54)【発明の名称】情報処理装置、情報処理方法、および情報処理プログラム
(51)【国際特許分類】
G06Q 30/0202 20230101AFI20240401BHJP
【FI】
G06Q30/02 310
【審査請求】有
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2022153721
(22)【出願日】2022-09-27
(71)【出願人】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100109380
【弁理士】
【氏名又は名称】小西 恵
(74)【代理人】
【識別番号】100109036
【弁理士】
【氏名又は名称】永岡 重幸
(72)【発明者】
【氏名】菊田 大輔
(72)【発明者】
【氏名】ラーマン エムディ モスタフィズ
(72)【発明者】
【氏名】アブロール サティアン
(72)【発明者】
【氏名】平手 勇宇
(72)【発明者】
【氏名】ロヨラ パブロ
(72)【発明者】
【氏名】蛭子 ▲たく▼磨
(72)【発明者】
【氏名】コンダパカ マノゥチ
【テーマコード(参考)】
5L049
【Fターム(参考)】
5L049BB01
(57)【要約】
【課題】時系列的な関係を反映した知識グラフを構成する。
【解決手段】情報処理装置は、複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得し、該複数のユーザと該複数のアイテムとの時系列的な相互作用を示す時系列情報を取得し、該ユーザ特徴、該アイテム特徴、および該時系列情報に基づいて、該複数のユーザを表す複数のユーザノードと該複数のアイテムを表す複数のアイテムノードと、該複数のユーザノードと該複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築し、該グラフから、該複数のユーザノードと該複数のアイテムノードのうち任意のノードについての該グラフにおけるノード表現を抽出する。
【選択図】
図8B
【特許請求の範囲】
【請求項1】
複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得手段と、
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得手段と、
前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築手段と、
前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出手段と、
を有することを特徴とする情報処理装置。
【請求項2】
前記構築手段は、前記時系列情報に基づいて、前記リンクの重みづけを行うことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記時系列情報は、前記複数のユーザのうちいずれかのユーザによる、前記複数のアイテムのうち2つ以上のアイテムそれぞれとの相互作用が生じた日時の情報を含む、ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記構築手段は、前記ユーザを表すユーザノードと、前記2以上のアイテムのうち相互作用が生じた日時がより現在に近いアイテムを表すアイテムノードの関係を示すリンクに、より高く重みづけを行う、ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記時系列情報は、前記複数のユーザのうち2以上のユーザによる、前記複数のアイテムのうちいずれかのアイテムとの相互作用が生じた日時の情報を含む、ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項6】
前記構築手段は、前記アイテムを表すアイテムノードと、前記2以上のユーザのうち相互作用が生じた日時がより現在に近いユーザを表すユーザの関係を示すリンクに、より高く重みづけを行う、ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用は、前記複数のユーザのいずれかによる前記複数のアイテムのいずれかの購入を含む、ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用は、所定の基準日時から、過去の所定期間までに生じた相互作用である、ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記ユーザ特徴は、前記複数のユーザそれぞれのユーザについての事実特徴である、ことを特徴とする請求項1に記載の情報処理装置。
【請求項10】
複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得工程と、
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得工程と、
前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築工程と、
前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出工程と、
を含むことを特徴とする情報処理方法。
【請求項11】
情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得処理と、
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得処理と、
前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築処理と、
前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出処理と、を含む処理を実行させるためのものである、
情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、および情報処理プログラムに関する。
【背景技術】
【0002】
近年、知識グラフなどのグラフ形態のネットワーク(グラフネットワーク)を用いた顧客行動分析が注目されている。例えば、特許文献1には、複数のエンティティと当該複数エンティティの属性を含むデータセットを収集し、当該複数のエンティティ間の関係性を生成し、当該複数のエンティティ、当該属性、および当該関係性を知識グラフに格納し、当該知識グラフに基づいてユーザのためのレコメンデーションを生成することが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
上記文献で開示されている知識グラフでは、ユーザと、商品といったアイテムの両方がエンティティに含まれている。一方で、ユーザとアイテムの関係は、時系列的に変化しうる。例えば、ユーザが半年前に商品Aを購入し、数日前に商品Bを購入した場合、現時点において、ユーザと商品Aとの関係より、ユーザと商品Bとの関係が強いと言うことができる。このような時系列的な関係を知識グラフに反映することにより、よりユーザの行動分析の精度が向上しうる。
【0005】
本発明は上記課題に鑑みてなされたものであり、時系列的な関係を反映した知識グラフを構成するための技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明による情報処理装置の一態様は、複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得手段と、前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得手段と、前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築手段と、前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出手段と、を有する。
【0007】
上記課題を解決するために、本発明による情報処理方法の一態様は、複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得工程と、前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得工程と、前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築工程と、前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出工程と、を含む。
【0008】
上記課題を解決するために、本発明による情報処理プログラムの一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得処理と、前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得処理と、前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築処理と、前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出処理と、を含む処理を実行させるためのものである。
【発明の効果】
【0009】
本発明によれば、時系列的な関係を反映した知識グラフを構成するための技術を提供することが可能となる。
上記した本発明の目的、態様および効果並びに上記されなかった本発明の目的、態様および効果は、当業者であれば添付図面および請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
【図面の簡単な説明】
【0010】
【
図2】
図2は、情報処理装置10の機能構成例を示す。
【
図3】
図3は、知識グラフの作成手順のフローチャートを示す。
【
図5】
図5は、リンク間の関係性の推論処理を説明するための図である。
【
図6A】
図6Aは、ユーザペアの関係の近さに基づくスコア(近さスコア)の概念図を示す。
【
図6B】
図6Bは、スコア予測モデル112の概略アーキテクチャを示す。
【
図7】
図7は、アイテム間関係グラフの概念図を示す。
【
図8A】
図8Aは、ユーザ-アイテム間関係グラフの概念図を示す。
【
図8B】
図8Bは、ユーザ-アイテム間の時系列的な関係の概念図の一例を示す。
【
図8C】
図8Cは、ユーザ-アイテム間の時系列的な関係の概念図の別の例を示す。
【
図8D】
図8Dは、ユーザ-アイテム間の暗示的リンクにおける時系列的な関係の概念図の一例を示す。
【
図8E】
図8Eは、ユーザ-アイテム間の暗示的リンクにおける時系列的な関係の概念図の別の例を示す。
【
図8F】
図8Fは、ユーザ-アイテム間の時系列的な関係の概念図において、ユーザが特定の日で購入した場合の例を示す。
【
図9】
図9は、知識グラフとユーザ表現の概念図を示す。
【
図10】
図10は、見込みユーザ予測処理を説明するための図である。
【
図11】
図11は、情報処理装置10とユーザ装置11のハードウェア構成例を示す。
【
図12】
図12は、情報処理装置10により実行される処理のフローチャートを示す。
【発明を実施するための形態】
【0011】
以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【0012】
[情報処理システムの構成]
図1に、本実施形態による情報処理システムの構成例を示す。本情報処理システムは、その一例として、
図1に示すように、情報処理装置10と、任意の複数のユーザ1~Nにより使用される複数のユーザ装置11-1~11-N(N>1)を含んで構成される。なお、以下の説明において、特に説明がない限り、ユーザ装置11-1~11-Nをユーザ装置11と総称しうる。また、以下の説明において、ユーザ装置とユーザという語は同義に使用されうる。
【0013】
ユーザ装置11は、例えば、スマートフォンやタブレットといったデバイスであり、LTE(Long Term Evolution)等の公衆網や、無線LAN(Local Area Network)等の無線通信網を介して、情報処理装置10と通信可能に構成されている。ユーザ装置11は、液晶ディスプレイ等の表示部(表示面)を有し、各ユーザは、当該液晶ディスプレイに装備されたGUI(Graphic User Interface)により各種操作を行うことができる。当該操作は、指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、画面に表示された画像等のコンテンツに対する各種の操作を含む。
なお、ユーザ装置11は、
図1に示すような形態のデバイスに限らず、デスクトップ型のPC(Personal Computer)や、ノート型のPCといったデバイスであってもよい。その場合、各ユーザによる操作は、マウスやキーボードといった入力装置を用いて行われうる。また、ユーザ装置11は、表示面を別に備えてもよい。
【0014】
ユーザ装置11は、情報処理装置10から、または、不図示の他の装置から情報処理装置10を介して提供されるウェブサービス(インターネット関連サービス)にログインして、サービスを利用することができる。当該ウェブサービスは、インターネットを介して提供される、オンラインモールやネットスーパー、あるいは、通信、金融、不動産、スポーツ、旅行に関するサービスを含むことができる。ユーザ装置11は、このようなウェブサービスを利用することにより、ユーザ装置11のユーザに関する情報を情報処理装置10に伝達することができる。
【0015】
例えば、ユーザ装置11は、ユーザ装置11のIP(Internet Protocol)アドレスや、ユーザの住所やユーザの氏名といった、ユーザ装置やユーザに関する特徴の情報を、情報処理装置10へ伝達することができる。
また、ユーザ装置11は、GPS(Global Positioning System)衛星(不図示)から受信される信号等に基づいて測位計算を行い、当該計算により得られた情報を、ユーザ装置11の位置情報として生成し、情報処理装置10へ伝達することができる。
情報処理装置10は、ユーザ装置11から各種情報を取得し、当該情報に基づいて、知識グラフを作成する。知識グラフは、現実世界での知識(ナレッジ)を、構造化された事実(ファクト)構造で表現した有向グラフである。本実施形態では、当該知識グラフは、ユーザ間関係(インタラクション)グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフから構成される。そして、情報処理装置10は、当該知識グラフから、任意のユーザに対するユーザ表現(知識グラフなどの有向グラフにおけるユーザの特徴ベクトル、埋め込み表現、ベクトル表現)を抽出する。
【0016】
[情報処理装置10の機能構成]
本実施形態による情報処理装置10は、まず、ユーザ装置11-1~11-Nから各種ユーザ特徴を取得し、また、所定のデータベースから、アイテムに関する特徴を取得する。本実施形態において、アイテムとは、様々なサービスに関して提供可能な有形または無形のモノ(Thing)でありうる。例えば、金融(フィンテック)サービスに関しては、銀行口座、株式や投資信託や保険商品といった金融商品、暗号通貨、スマホアプリ決済等のアイテムが存在する。また、デジタルコンテンツサービスに関しては、映画やアニメといった動画コンテンツや、写真やイラストやテキストといった静止画コンテンツ等のアイテムが存在する。また、Eコマースサービスに関しては、ネットショッピングで扱う無形または有形の商品等のアイテムが存在する。また、トラベルサービスに関しては、ホテルやパックツアーや交通機関に関する情報や予約等のアイテムが存在する。また、モバイルサービスに関しては、モバイル機器、公衆網/インターネット接続、通信利用料金等のアイテムが存在する。また、広告およびメディアサービスに関しては、オフラインやオフラインの広告商品、ダイレクトメール、放送やインターネットを介した広告等のアイテムが存在する。また、カードサービスに関しては、クレジットカード決済やポイント取引等のアイテムが存在する。また、スポーツおよび文化サービスに関しては、スポーツイベントやコンサートといったイベントやイベントで販売される商品等のアイテムが存在する。
【0017】
情報処理装置10は、取得したユーザ特徴とアイテム特徴から知識グラフを作成し、当該知識グラフから、任意のユーザに対するユーザ表現を抽出する。当該知識グラフは、後述するように、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフから構成される。さらに、情報処理装置10は、当該ユーザ表現を用いて、ユーザの行動分析に関する所定のタスクを行う。例えば、情報処理装置10は、ユーザセグメンテーション(類似したユーザ特徴のユーザ群の抽出)、アイテム購入確率の予測、アイテムを介した類似ユーザの予測等のタスクを行う。本実施形態では、情報処理装置10が、所定の(所与の)シードユーザ(対象ユーザ)と同様のユーザ特徴を有する(例えば、当該シードユーザと所定のアイテムを購入する可能性の高い)見込みユーザを予測する例を説明する。
【0018】
図2は、本実施形態による情報処理装置10の機能構成の一例を示す。
図2に示す情報処理装置10は、ユーザ特徴取得部101、アイテム特徴取得部102、グラフ構築部103、表現抽出部104、見込みユーザ予測部105、学習部106、出力部107、学習モデル記憶部110、および特徴記憶部120を備える。学習モデル記憶部110は、見込みユーザ予測モデル111およびスコア予測モデル112を記憶している。当該各種学習モデルについては後述する。また、特徴記憶部120は、ユーザ特徴121およびアイテム特徴122を記憶するように構成される。
【0019】
ユーザ特徴取得部101は、ユーザ装置11-1~11-Nのそれぞれから、当該ユーザ装置やユーザについての事実特徴(事実情報)(以下、ユーザ特徴)を取得する。ユーザ特徴は、当該ユーザ装置やユーザから実際に、または、客観的に得られる、事実に基づく特徴(情報)である。ユーザ特徴取得部101は例えば、ユーザ装置11から直接ユーザ特徴を取得することができる。また、ユーザ特徴取得部101は、ユーザ装置11のユーザにより所定のウェブサービスに登録された情報として、ユーザ特徴を取得することができる。
【0020】
ユーザ特徴は、ユーザ装置のIPアドレス、ユーザの住所やユーザの氏名、ユーザが保持するクレジットカードの番号、ユーザのデモグラフィック情報(性別、年齢、居住地域、職業、家族構成等の人口統計学的なユーザ属性)等を含む。また、ユーザ特徴は、所定のウェブサービス利用時における登録番号や登録名を含んでもよい。また、ユーザ特徴は、通話履歴、所定のウェブサービス利用時における商品のユーザの住所以外の配送先住所、所定のウェブサービス利用時の利用状況、利用履歴(購入履歴や販売履歴も含む)、検索履歴、閲覧履歴(クリック履歴を含む)、サービスの利用により貯めることが可能なポイントに関する情報を含んでもよい。このように、ユーザ特徴は、ユーザ装置またはユーザ自身に関連する情報や、通信を介した所定のサービス利用に関する情報を含む、あらゆる情報を含むことができる。
ユーザ特徴取得部101は、取得したユーザ特徴を、ユーザ特徴121として特徴記憶部120に記憶させる。
【0021】
アイテム特徴取得部102は、所定のデータベース(不図示)から、様々なウェブサービスにおける登録情報や取引履歴に基づく、アイテムの特徴(属性)を取得する。当該アイテムの特徴には、アイテムを識別する情報(以下、アイテムID)、当該アイテムのジャンル(上位分類)を識別する情報(以下、ジャンルID)、当該アイテムが販売されているショップを識別する情報(以下、ショップID)等が含まれる。アイテム特徴は、取引履歴に応じて、アイテムIDとジャンルID間、アイテムIDとショップID間の取引情報(取引回数等)も含むことができる。アイテム特徴取得部102は、取得したアイテムの特徴を、アイテム特徴122として特徴記憶部120に記憶させる。
【0022】
グラフ構築部103は、ユーザ特徴取得部101とアイテム特徴取得部102から取得した各種特徴に基づいて、知識グラフを構築する。当該知識グラフについては後述する。
【0023】
表現抽出部104は、グラフ構築部103により構築された知識グラフから、任意のユーザに対するユーザ表現を抽出する。また、表現抽出部104は、当該知識グラフから、任意のアイテムに対するアイテム表現を抽出してもよい。ユーザ表現(またはアイテム表現)の抽出処理については後述する。また、表現抽出部104は、構築された知識グラフにおける任意のノードにかかる埋め込み表現(ベクトル表現)を、例としてショップ表現やジャンル表現として、抽出してよい。
【0024】
見込みユーザ予測部105は、所定のシードユーザと同様のユーザ特徴を有し、ウェブサービスを通じて当該シードユーザと同様の(類似した)行動を行うと予測されるユーザを、見込みユーザ(類似ユーザ)として予測する。当該シードユーザは、ウェブサービスを通じて所与の商品やサービスを購入および/または利用、および/または、当該ウェブサービスを通じて当該商品やサービスをポジティブに評価した1以上のユーザである。当該シードユーザは、ユーザ装置11-1~11-Nから選択および設定された1以上のユーザである。当該シードユーザは、操作者が入力部(
図12の入力部205)による入力操作により設定されてもよいし、予めシステムにおいて設定されていてもよいし、記憶部(
図11のROM202やRAM203)に格納されている任意のプログラムによって設定されてもよい。本実施形態では、学習部106により学習済みの見込みユーザ予測モデル111を用いて、当該見込みユーザを予測する。当該見込みユーザの予測処理については後述する。
【0025】
学習部106は、見込みユーザ予測モデル111とスコア予測モデル112を学習(トレーニング)させ、学習済みの見込みユーザ予測モデル111とスコア予測モデル112を、学習モデル記憶部110に格納する。各学習モデルの学習処理については後述する。
【0026】
出力部107は、表現抽出部104により抽出されたユーザ表現や、見込みユーザ予測部105により予測された見込みユーザの情報を出力する。当該出力は、あらゆる出力処理であってよいし、通信I/F(
図11の通信I/F207)を介した外部装置への出力であってもよいし、表示部(
図11の表示部206)への表示であってもよい。
【0027】
[知識グラフの構築手順]
次に、本実施形態による知識グラフの作成手順について説明する。当該知識グラフは、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフから構成される。
図3に、本実施形態によるグラフ構築部103により実行される知識グラフの構築手順のフローチャートを示す。以下、まず、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフそれぞれの作成手順(
図3のS30の処理に対応)を説明する。
【0028】
(1)ユーザ間関係グラフの作成手順
ユーザ間関係グラフの作成手順について説明する。なお、以下の説明においてユーザA~Eは、説明のために参照するユーザであり、ユーザ装置11のユーザでありうる。また、ユーザ間関係グラフは、
図4Aと
図4Bにおいて丸で囲まれた各ユーザノード(ユーザの識別情報を有するノード)の接続で構成され、以下の説明では、当該ユーザノードを単にユーザと称する。以下、ユーザ間関係グラフについての、
図3のS30の処理の各工程について説明する。
【0029】
<S31:リンクの作成>
S31では、グラフ構築部103は、複数のユーザ間のリンクを予測して作成する。
リンクの作成処理について、
図4Aと
図4Bを参照して説明する。
図4Aは、明示的リンクを説明するための図であり、
図4Bは、暗示的リンクを説明するための図である。明示的リンクとは、2ユーザ間(ユーザペア)の明示的な共通の特徴により作成されるリンクである。暗示的リンクとは、ユーザペアの明示的な共通の特徴の存在は不明確であるものの、すでに作成されている明示的リンクを利用して、間接的な関係として作成されるリンクである。このように、ユーザ間のリンクは、明示的リンクと暗示的リンクで識別される。
【0030】
図4Aに、ユーザのユーザ装置のIPアドレスを共通な特徴として用いて明示的リンクを作成する例を示す。
図4Aは、ユーザA~Cが利用可能なウェブサービスとして、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43、およびカード管理システム44が存在する例を示す。
図4Aでは、これら4つのウェブサービスが示されているが、ウェブサービスの数は特定の数に限定されない。
【0031】
オンラインモール41は、オンラインで(インターネットを使用して)利用可能なショッピングモールである。オンラインモール41は、例えば、ファッション、書籍、食品、コンサートチケット、不動産といった多種多様な商品やサービスを提供することができる。
ゴルフ場予約サービス42は、オンラインでゴルフ場に関するサービスを提供するウェブサイトで運営され、例えばゴルフ場の検索および予約やレッスン情報を提供することができる。
旅行関連予約サービス43は、オンラインで利用可能な各種旅行サービスを提供するウェブサイトで運営される。旅行関連予約サービス43は、例えば、ホテルやトラベルツアーの予約、航空券やレンタカーの予約、観光情報、ホテル、ホテル周辺の情報を提供することができる。
カード管理システム44は、所定のカード管理会社により発行および管理されるクレジットカードに関するサービスを提供するウェブサイトで運営される。カード管理システム44は、オンラインモール41、ゴルフ場予約サービス42、および旅行関連予約サービス43の少なくともいずれかと関連して、サービスを提供してもよい。
【0032】
図4Aの例では、ユーザA~Cはそれぞれ、同じIPアドレス(=198.45.66.xx)を用いて、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43を利用している。IPアドレスの情報は、ユーザ特徴取得部101により取得されうる。
このような場合、グラフ構築部103は、ユーザA~Cは、リンク状態45に示すように、同じIPアドレスの特徴で、明示的リンク(例えば、ユーザAとユーザCの間のリンクL1)を相互に作成する。明示的リンクは実線で表されている。
【0033】
図4Aのほか、共通の特徴として、ユーザの住所の特徴や、ユーザが使用するクレジットカード番号の特徴等を共通な特徴として用いて、明示的リンクを作成することができる。
【0034】
図4Bに、ユーザ間に暗示的リンクを作成する例を示す。
図4Bの例では、ユーザAに対して、ユーザC、ユーザD、ユーザEが明示的リンクで接続され、ユーザBに対して、ユーザC、ユーザD、ユーザEが明示的リンクで接続されている。このようなリンク特徴(リンク間の関係を示す特徴)を、共通の特徴空間へ埋め込み、各ユーザ(各ノード)間で暗黙的に関係性が構築されるとして推論されたリンクが、暗示的リンクとして作成(確立)される。
図4Bの例では、ユーザAとユーザBは、明示的リンクで接続されていないが、共通の特徴空間で関係性を有すると推論された結果、破線で示す暗示的リンクL2が作成されている。なお、グラフ構築部103は、明示的リンクで接続されたノード(ユーザ)で構成されるユーザ間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、ユーザ間の暗示的リンクを予測し作成する。このとき、グラフ構築部103は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
【0035】
<S32:リンク間の関係性の推論>
S32では、グラフ構築部103は、S31で予測および作成されたリンク間の関係性を推論する。リンク間の関係性の推論処理について、
図5を参照して説明する。
図5は、リンク間の関係性の推論処理を説明するための図であり、明示的リンクで接続されたユーザAとユーザB間のリンクの関係性を推論する例を示す。
【0036】
グラフ構築部103は、S31で作成されたリンクで接続されたユーザのペアをデータポイントとして扱い、ユーザ特徴取得部101により取得された各種情報を用いて、当該ペア(データポイント)を、共通のタイプを表すクラスタにグループ化する。当該各種情報は、IPアドレス、住所、クレジットカード、年齢、性別、友人といった情報でありうる。また、各クラスタは、配偶者、親子、近所の人、同じ世帯、同僚、友達、同性別きょうだい、異性別きょうだい等の関係を持つクラスタでありうる。
図5の例では、ユーザのペアをバツ印で示し、当該ペアがグループ化されうるクラスタとして、親子クラスタ51、配偶者クラスタ52、同性別きょうだいクラスタ53、友人クラスタ54、同僚クラスタを示す。なお、
図5では5つのクラスタを示すが、クラスタの数は特定の数に限定されない。
【0037】
例えば、グラフ構築部103は、ユーザAとユーザBが、同じ名字、年齢差が10歳未満、逆の性別、同じ住所、という特徴50を有する(共有する)場合、グラフ構築部103は、ユーザAとユーザBのペアを、夫と妻(配偶者)の関係を表すクラスタ(配偶者クラスタ52)にグループ化することができる。
【0038】
<S33:関係の近さに基づくスコア割り当て>
S33では、グラフ構築部103は、S32で推論されたペアに対する関係の近さに基づくスコアを予測し、当該スコアを当該ペアに割り当てる。本実施形態において、スコアは、0~1の間の数値であるが、スコアが取りうる数値に特定の限定はない。
図6Aに、ユーザペアの関係の近さに基づくスコア(以下、近さスコア)の概念図を示す。
【0039】
図6Aの例では、明示的リンクで接続されたユーザAとユーザBが有する(共有する)特徴によって、当該ユーザペア間の関係の近さが変化する。
図6Aの上部では、ユーザAからユーザBの関係が、同性別きょうだい、同じ住所、1200回の通話履歴、50回のギフトのやり取り、という特徴60を有する場合、当該ユーザペア間の関係の近さ(すなわち、近さスコア)は高くなる。一方、
図6Aの下部では、ユーザAからユーザBの関係が、同性別きょうだい、異なる住所、30回の通話履歴、2回のギフトのやり取り、という特徴61を有する場合、当該ユーザペア間の関係の近さ(すなわち、近さスコア)は低くなる。このように、
図6Aの例のように、同性別きょうだいであるユーザAとユーザBであっても、当該ユーザのペアで共有される他の特徴により、当該ペアの関係の近さは異なるものとなる。関係の近さの高いペアは、互いの社会的距離が近く、高い影響を有することが観察される。一方、関係の近さの低いペアは、互いの社会的距離が遠く、近しい関係にないことが観察される。
【0040】
本実施形態では、ユーザペアに対する近さスコアを、スコア予測モデル112を用いて予測する。
図6Bに、スコア予測モデル112の概略アーキテクチャを示す。スコア予測モデル112は、ユーザペアの特徴63を入力として、当該特徴63に対する近さスコア64を予測する学習モデルである。
【0041】
スコア予測モデル112は例えば、弱教師付き学習(Weak Supervised Learning)を行う学習モデルであり、例えば、畳み込みニューラルネットワーク(CNN)による学習モデルである。本実施形態では、スコア予測モデル112は、
図6Aに示したような、ユーザペアに対する複数の特徴に対して付された近さスコア(0~1)を教師データとして学習された学習モデルとする。例えば、学習段階では、教師データとしては、
図6Aの特徴60に設定された1に近い近さスコアと、特徴61に設定された0に近い近さスコアといった組み合わせデータが使用される。当該学習処理は学習部106により実施される。
【0042】
なお、本実施形態では、ユーザペアに対する近さスコアを、スコア予測モデル112を用いて予測したが、グラフ構築部103は、他の手法により、当該スコアを予測するように構成されてもよい。
【0043】
以上の処理により、複数のユーザ間で明示的リンクまたは暗示的リンクが形成され、各リンク間では近さスコアが割り当てられ、ユーザ間関係グラフが作成される。ユーザ間関係グラフの概念図を
図6Cに示す。各ユーザのペアに対しては上記のように予測された近さスコアが割り当てられる。なお、なお、本開示において、リンク(明示的リンクまたは暗示的リンク)に割り当てられる近さスコアは、当該リンクへの重みづけと同義で理解される。例えば、高い近さスコアは、高い重みづけに対応し、低い近さスコアは、低い重みづけに対応する。
【0044】
(2)アイテム間関係グラフの作成手順
次に、アイテム間関係グラフの作成手順について説明する。ユーザ間関係グラフの作成手順と同様に、グラフ構築部103は、
図3におけるS30の関係グラフの作成処理のフローチャートに従って、アイテム間関係グラフを作成する。なお、アイテム間関係グラフの作成では、S32の工程は行われない。
【0045】
<S31:リンクの作成>
S31では、グラフ構築部103は、特徴記憶部120に記憶されているアイテム特徴122に基づいて、複数のアイテム間のリンクを作成する。前述したように、本実施形態による当該アイテム特徴は、アイテムID、ジャンルID、およびショップIDを含む。すなわち、1つのアイテムIDに、少なくとも1つのジャンルIDおよび/またはショップIDが関連付けられている。なお、ジャンルIDやショップIDはそれぞれ、階層的に構成されてもよい。例えば、ジャンルが階層的に構成され、それぞれがジャンルIDを有してもよい。また、アイテム特徴は、アイテムID、ジャンルID、およびショップIDに限らず、アイテムのブランド、色、プロパティ、価格に関する情報といった他の情報(属性)を含んでもよい。
【0046】
グラフ構築部103は、任意のアイテムIDに関連付けられるジャンルIDやショップIDを、当該アイテムIDとリンクさせる。
図7に、アイテム間関係グラフの概念図を示す。アイテム間関係グラフは、
図7において丸で囲まれたアイテムID、ジャンルID、またはショップIDを示す各ノードの接続で構成され、以下の説明では、当該ノードを単にアイテム、ジャンル、またはショップと称する。
【0047】
図7において、アイテム特徴から接続されるリンクは明示的リンクであり、実線で示される(例えば、アイテムAとショップAとの間のリンクL1)。また、アイテム間の色やプロパティが類似している場合(類似度が所定の閾値より高い場合)、アイテム間を明示的リンクで接続することができる(例えば、アイテムAとアイテムBとの間のリンク)。一方、例えば、同じショップにおいて異なるアイテムが販売されている場合もある。
図7において、アイテムAとアイテムCは、いずれもショップAで販売されていることから、ショップAにリンクされている。このことから、グラフ構築部103は、アイテムAとアイテムCを、破線で示す暗示的リンクで接続することができる(
図7の例では、アイテムAとアイテムCの間のリンクL2)。なお、グラフ構築部103は、明示的リンクで接続されたノード(ユーザ)で構成されるアイテム間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、アイテム間の暗示的リンクを予測し作成する。このとき、グラフ構築部103は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
【0048】
<S33:関係の近さに基づくスコア割り当て>
S33では、グラフ構築部103は、S31で作成されたリンクにおける各ペアに対する関係の近さに基づくスコア(近さスコア)を予測し、当該スコアを当該ペアに割り当てる。
図7において、例えば、ジャンルAのうち、アイテムBよりアイテムAがよく売れる(よく取引される)場合、アイテムAとジャンルAのペアに高いスコアが割り当てられる。また、アイテムAについて、ジャンルAに属する確率が高いと判定される場合、アイテムAとジャンルAのペアに当該確率に基づくスコアが高く割り当てられる。また、任意のアイテム間の類似度がより高い場合、当該アイテムのペアに高いスコアが割り当てられる。
【0049】
グラフ構築部103は、各ペアに対する近さスコアを、前述のスコア予測モデル112を用いて予測してもよい。スコア予測モデル112を用いる場合、アイテム、ジャンル、ショップのうちの任意のペアに対する取引回数や、アイテム間の類似度の特徴に対して付された近さスコア(0~1)を教師データとして学習される(
図6B参照)。例えば、学習段階では、教師データとしては、取引回数が多い、または、類似度が高いという特徴に設定された1に近い近さスコアと、取引回数が少ない、または、類似度が低いという特徴に設定された0に近い近さスコアといった組み合わせデータが使用される。当該学習処理は学習部106により実施される。スコア割り当てにより、
図6Cに示すユーザ間関係グラフと同様に、各ペア間に対する数値としてスコアを表すことができる。
【0050】
(2)ユーザ-アイテム間関係グラフの作成手順
次に、ユーザ-アイテム間関係グラフの作成手順について説明する。ユーザ間関係グラフの作成手順と同様に、グラフ構築部103は、
図3におけるS30関係グラフの作成処理のフローチャートに従って、ユーザ-アイテム間関係グラフを作成する。なお、ユーザ-アイテム間関係グラフの作成では、S32の工程は行われない。
【0051】
<S31:リンクの作成>
S31では、グラフ構築部103は、特徴記憶部120に記憶されているユーザ特徴121とアイテム特徴122に基づいて、任意のユーザと1以上のアイテム間のリンクを作成する。まず、グラフ構築部103は、特徴記憶部120に記憶されているユーザ特徴121から、各ユーザの購入履歴、検索履歴、または閲覧履歴(クリック履歴を含む)といった、各ユーザに対するアイテムに関連するユーザ特徴を取得する。グラフ構築部103は、各ユーザに対する当該アイテムに関連するユーザ特徴を用いて、各ユーザについての、ユーザ-アイテム間関係グラフを作成する。
【0052】
図8Aに、ユーザ-アイテム間関係グラフの概念図を示す。ユーザ-アイテム間関係グラフは、
図8Aにおいて丸で囲まれたユーザノードとアイテムIDを示すノードの接続で構成され、以下の説明では、当該ユーザノードとアイテムIDを示すノードを単にユーザとアイテムと称する。また、「購入」、「クリック」、「販売」といったユーザによるアイテムへのアクションを、ユーザとアイテムとの相互作用とも称する。
【0053】
図8Aにおいて、ユーザAによるアイテムAのクリック履歴から、ユーザAとアイテムAがリンクされる。当該アイテムAのクリック履歴は、ユーザ装置11の表示部における、アイテムAに関する所定の画面領域(例えば、ボタン、写真、アイコン等)をクリックしたことを含む。また、ユーザAによるアイテムBの購入履歴から、ユーザAとアイテムBがリンクされる。また、ユーザAによるアイテムCの販売履歴から、ユーザAとアイテムCがリンクされる。なお、
図8Aでは、ユーザAと各アイテム間は明示的リンクで接続されているが、ユーザAによる任意のアイテムへの間接的な接続を、暗示的リンクで表してもよい。また、ユーザへのアイテムに関する広告配信履歴から、ユーザとアイテムがリンクされてよい。なお、グラフ構築部103は、明示的リンクで接続されたノード(ユーザ)で構成されるユーザ-アイテム間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、ユーザ-アイテム間の暗示的リンクを予測し作成する。このとき、グラフ構築部103は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
【0054】
<S33:関係の近さに基づくスコア割り当て>
S33では、グラフ構築部103は、S31で作成されたリンクにおける各ペアに対する関係の近さに基づくスコア(近さスコア)を当該ペアに割り当てる。
本実施形態では、グラフ構築部103は、時系列的な関係の変化を考慮しない近さスコア、および、ユーザとアイテム間の時系列的な関係の変化を考慮した近さスコアを、ユーザとアイテムのペアに割り当てることができる。なお、グラフ構築部103は、時系列的な関係の変化を考慮した近さスコアのみを、ユーザとアイテムのペアに割り当ててもよい。以下の説明では、ユーザとアイテム間の時系列的な関係の変化を考慮しない近さスコアを、「非時系列関係ベース近さスコア」と称し、ユーザとアイテム間の時系列的な関係の変化を考慮する近さスコアを、「時系列関係ベース近さスコア」と称する。
【0055】
(非時系列関係ベース近さスコア)
グラフ構築部103は、上述のクリック履歴、購入履歴、販売履歴および広告配信履歴などのアイテムの取引に関連する履歴に基づき、ユーザとアイテムのペアに関する近さスコアを予測し、当該ペアに割り当てることができる。例えば、ユーザが任意のアイテムをクリックしたのみの場合より、当該アイテムを実際に購入した場合に、ユーザとアイテムの距離がより近いといえる。よって、
図8Aの例では、ユーザAとアイテムAのペアより、ユーザAとアイテムBのペアに高いスコアが割り当てられる。また、ユーザがアイテムを販売することは、クリック動作よりも関係が近いと考えられ、
図8Aの例では、ユーザAとアイテムAのペアより、ユーザAとアイテムCのペアに高いスコアが割り当てられる(ユーザAとアイテムCとのリンクに高く重みづけされる)。また、例えば、ユーザにアイテムに関する広告が複数に亘って配信されたにも関わらず、アイテムに関するクリックや購入がなされなかった場合に、ユーザとアイテムのペアに低いスコアが割り当てられてよい。
【0056】
グラフ構築部103は、各ペアに対する近さスコアを、前述のスコア予測モデル112を用いて予測してもよい。スコア予測モデル112を用いる場合、ユーザとアイテムのペアに対する特徴に対して付された近さスコア(0~1)を教師データとして学習される(
図6B参照)。例えば、学習段階では、教師データとしては、購入という特徴に設定された1に近い近さスコアと、クリックという特徴に設定された0に近い近さスコアといった組み合わせデータが使用される。当該学習処理は学習部106により実施される。スコア割り当てにより、
図6Cに示すユーザ間関係グラフと同様に、各ペア間に対する数値としてスコアを表すことができる。
【0057】
なお、
図8Aでは、ユーザとアイテムのペアとしてユーザ-アイテム間関係グラフを定義したが、ユーザが特定のアイテムに対して、クリック、購入、または販売の履歴がある場合は、ユーザとジャンル(ジャンルID)のペアがリンクされる。そして、当該ペアで共有される特徴に対して近さスコアが割り当てられる。
【0058】
(時系列関係ベース近さスコア)
次に、時系列関係ベース近さスコアについて説明する。
図8Bに、ユーザ-アイテム間の時系列的な関係の概念図の一例を示す。
図8Bの例では、ユーザAが、アイテムAを時刻t1で購入し、アイテムBを時刻t2で購入し、アイテムCを時刻t3で購入した場合を示している。なお、時刻t1、t2、およびt3は、ユーザAが各アイテムの購入アクションを行った日時を含む表現であり、時系列にt3>t2>t1(すなわち、t1からt3になるに従い、現在に近づく)である。よって、ユーザAが、アイテムAからCのうち、アイテムAを最近購入している。
【0059】
ユーザAがアイテムCを購入した時刻t3を基準時刻(基準日時)とすると、ユーザAは、時刻t3から相対的時間T1(=t3-t1)前にアイテムAを購入し、時刻t3から相対的時間T2(=t3-t2)前にアイテムBを購入し、相対的時間T3にアイテムCを購入したことになる。相対的時間が長いアイテムは、ユーザAがより過去に購入したアイテムであり、時刻t3を基準にすると、ユーザAとの関係性がより低いアイテムとみなすことができる。よって、本実施形態では、グラフ構築部103は、相対的時間を算出し、ユーザとアイテムのペアに関して、相対的時間が長いほど、より低い近さスコアを割り当てる。
図8Bの例では、近さスコアは、ユーザAとアイテムCのペアに対して一番高く(ユーザAとアイテムCとのリンクに一番高く重みづけされる)、ユーザAとアイテムBのペア、ユーザAとアイテムAのペアの順に低くなる(ユーザとアイテムとのリンクに順に低く重みづけされる)ように構成される。例えば、ユーザAとアイテムCのペアに対する近さスコアを1とすると、グラフ構築部103は、相対的時間の逆数を、ユーザAとアイテムBのペアおよびユーザAとアイテムAのペアに対する近さスコアに割り当てる(それぞれ、1/T2、1/T1)。
【0060】
図8Cに、ユーザ-アイテム間の時系列的な関係の概念図の別の例を示す。
図8Cの例では、ユーザAがアイテムAを時刻t1で購入し、ユーザBがアイテムAを時刻t2で購入し、ユーザCがアイテムAを時刻t3で購入した場合を示している。なお、時刻t1、t2、およびt3は、ユーザA、ユーザB、ユーザCのそれぞれがアイテムAの購入アクションを行った日時を含む表現であり、時系列にt3>t2>t1(すわち、t1からt3になるに従い、現在に近づく)である。よって、ユーザAからCのうち、ユーザCがアイテムAを最近購入している。
【0061】
ユーザCがアイテムAを購入した時刻t3を基準時刻(基準日時)とすると、ユーザAは、時刻t3から相対的時間T1(=t3-t1)前にアイテムAを購入し、ユーザBは、時刻t3から相対的時間T2(=t3-t2)前にアイテムAを購入し、ユーザCは、相対的時間T3にアイテムAを購入したことになる。相対的時間が長いユーザは、アイテムAをより過去に購入したユーザであり、時刻t3を基準にすると、アイテムAとの関係性がより低いユーザとみなすことができる。よって、本実施形態では、グラフ構築部103は、相対的時間を算出し、ユーザとアイテムのペアに関して、相対的時間が長いほど、より低い近さスコアを割り当てる。
図8Cの例では、近さスコアは、ユーザCとアイテムAのペアに対して一番高く(ユーザCとアイテムAとのリンクに一番高く重みづけされる)、ユーザBとアイテムAのペア、ユーザAとアイテムAのペアの順に低くなる(ユーザとアイテムとのリンクに順に低く重みづけされる)ように構成される。例えば、ユーザCとアイテムAのペアに対する近さスコアを1とすると、グラフ構築部103は、相対的時間の逆数を、ユーザBとアイテムAのペアおよびユーザAとアイテムAのペアに対する近さスコアに割り当てる(それぞれ、1/T2、1/T1)。
【0062】
なお、ユーザとアイテムの関係性が存在しうる、基準時刻から過去の区間(関係性を考慮可能な区間)をあらかじめ設定してもよい。例えば、
図8Bを参照すると、ユーザAがアイテムD(不図示)を購入した時刻が、基準時刻t3から10年前である場合には、ユーザAとアイテムDとの関係性(特に、購入についての関係性)は低いとみなすことができる。よって、例えば、基準時刻から所定期間(例えば、1年)までの区間を、ユーザとアイテムの関係性を考慮可能な区間として設定してもよい。
【0063】
また、
図8Bと
図8Cでは、ユーザとアイテムとの相互作用は「購入」とし、時刻t1、t2、およびt3は、当該「購入」が生じた日時としているが、当該相互作用は、
図8Aのように、「クリック」や「販売」等を含んでもよい。さらに、
図8Bと
図8Cにおいて、ユーザとアイテムとの相互作用が、「購入」、「クリック」、「販売」のいずれかであってもよい。ここで、「クリック」とは、例として、アイテムを商取引可能な所定のプラットフォーム上での、アイテムのウェブページへのアクセスに相当する。また、当該相互作用は、アイテムのウェブページへアクセスするためのリンクの生成や、アイテムのウェブページをSNS(ソーシャルネットワークサービス)等の外部プラットフォームへ投稿するような「紹介」であってもよい。また、当該相互作用は、アイテムのウェブページをお気に入り登録するような「登録」であってもよい。なお、当該相互作用の種別に基づいて、ユーザとアイテムとのペアの近さスコアが高くなるようリンクに重みづけを決定してもよい。例として、当該相互作用が「購入」または「販売」である場合、ユーザとアイテムとのペアの近さスコアが「クリック」より高くなるように、リンクに重みづけを決定してよい。
【0064】
図8Bと
図8Cでは、
図8Aに示すような、ユーザが明示的にアイテムの「購入」、「クリック」、または「販売」を行ったことによる、ユーザとアイテム間の明示的リンクにおける近さスコアについて説明した。これに加えて、グラフ構築部103は、ユーザとアイテム間の暗示的リンクを生成し、当該暗示的リンクにおける近さスコアを予測してもよい。例えば、ユーザ同士が類似する場合に、当該類似するユーザとアイテムを暗示的リンクでリンクしてもよい。同様に、アイテム同士が類似する場合に、当該類似するアイテムとユーザを暗示的リンクでリンクしてもよい。なお、「ユーザ同士が類似する」または「アイテム同士が類似する」とは、グラフ上のユーザ間またアイテム間(ノード間)の近さに基づくノード間の類似度が所定の条件を満たすことを指す。このとき、ノード間の近さは、グラフが構築される特徴空間におけるノード間のユークリッド距離またはコサイン類似度に基づく。
【0065】
図8Dに、ユーザ-アイテム間の暗示的リンクにおける時系列的な関係の概念図の一例を示す。グラフ構築部103は、ユーザAと類似するユーザ(例えば、ユーザAと類似するユーザ特徴を有するユーザ)と、アイテムA、B、およびCとを暗示的リンクでリンクすることができる。例えば、ユーザBとユーザCが、ユーザAと同じ性別かつ、類似した職業と家族構成を有する場合、グラフ構築部103は、ユーザBとユーザCそれぞれを、アイテムA、B、およびCと暗示的リンクでリンクしうる。このとき、グラフ構築部103は、ユーザBとユーザCそれぞれと、アイテムA、B、およびCとの近さスコアを、ユーザAと、アイテムA、B、およびCとの近さスコアより低い値で割り当てうる。
【0066】
図8Eに、ユーザ-アイテム間の暗示的リンクにおける時系列的な関係の概念図の別の例を示す。グラフ構築部103は、アイテムAと類似するアイテム(例えば、アイテムAと類似するアイテム特徴を有するアイテム)と、ユーザA、B、およびCとを暗示的リンクでリンクすることができる。例えば、アイテムBとアイテムCが、アイテムAと同じブランドと色かつ、類似した価格を有する場合、グラフ構築部103は、アイテムBとアイテムCそれぞれを、ユーザA、B、およびCと暗示的リンクでリンクしうる。このとき、グラフ構築部103は、アイテムBとアイテムCそれぞれと、ユーザA、B、およびCとの近さスコアを、アイテムAと、ユーザA、B、およびCとの近さスコアより低い値で割り当てうる。
【0067】
さらに、ユーザ-アイテム間の暗示的リンクを、あらゆるウェブサービスにおける売れ筋ランキングの上位の1以上のアイテムを利用して生成してもよい。売れ筋ランキングの上位のアイテムは、時系列的に変化する。例えば、
図8Bを参照すると、所定のウェブサービスにおいて、時刻t1、t2、t3における売れ筋ランキングの上位の1以上のアイテムを、ユーザAに暗示的リンクでリンクしてもよい。これにより、各時刻(日時)における時系列的な流行アイテムの情報が、ユーザとアイテムのペアに反映される。
【0068】
また、ユーザがアイテムを購入するモチベーションは、当該ユーザにとって特定の日に高まりうる。特定の日は、ウェブサービスにおいて購入により付与されるポイントが通常より多いキャンペーン期間に含まれる日でありうる。あるいは、特定の日は、セールが行われている期間に含まれる日でありうる。あるいは、特定の日は、ユーザもしくは当該ユーザと社会的距離が近いユーザの誕生日、母の日、および、季節のイベントデー(クリスマス等)でありうる。ユーザがこのような特定の日でアイテムを購入した場合に、ユーザとアイテム間の近さスコアを高く設定してよい。
【0069】
図8Fに、
図8Bに示すユーザ-アイテム間の時系列的な関係の概念図において、ユーザが特定の日で購入した場合の例を示す。
図8Fは、時刻t2を含む日が特定の日であり、当該特定の日が、付与されるポイントが5倍となるキャンペーン期間に含まれる日であることを示している。ユーザAは、あえて、ポイント5倍の日時(時刻t2)に合わせて、アイテムBを買った可能性がある。例えば、アイテムBが高価であり、ユーザAが、ポイントが多く付与される時刻t2を、アイテムBの購入日時に選んだ可能性がある。このことから、グラフ構築部103は、
図8BにおけるユーザAとアイテムBのペアに対する近さスコアよりも、
図8FにおけるユーザAとアイテムBのペアに対する近さスコアに高い値が割り当てることができる。さらに、グラフ構築部103は、ユーザAのユーザ特徴に、ポイント5倍日における購入履歴を示す特徴を加えてもよい。
【0070】
前述のように、本実施形態では、グラフ構築部103は、非時系列関係ベース近さスコア、および、時系列関係ベース近さスコアを、ユーザとアイテムのペアに割り当てることができる。非時系列関係ベース近さスコア、および、時系列関係ベース近さスコアを割り当てる場合、グラフ構築部103は、非時系列関係ベース近さスコアに時系列関係ベース近さスコアを加算したスコアを割り当てうる。あるいは、グラフ構築部103は、非時系列関係ベース近さスコアと時系列関係ベース近さスコアを乗算したスコアを割り当てうる。
【0071】
このように、本実施形態では、グラフ構築部103は、ユーザとアイテムとの時系列的な関係を反映した知識グラフを構築する。具体的には、上述のように算出した相対的時間(T1、T2、およびT3)や、各時刻(t1、t2、およびt3)の相対的関係といった時系列情報に基づいて、ユーザとアイテム間の近さスコアを割り当てる(ユーザとアイテム間のリンクの重みづけを変える)。これにより、時系列的に変化する、ユーザによるアイテムに対する興味や意識を反映した知識グラフが生成される。なお、本実施形態では
図8Bと
図8Cを参照して、ユーザとアイテムとの3つの相互作用(すなわち、購入)について相対的時間または相対的関係を得たが、2つ以上(ユーザと2以上のアイテム、または2以上のユーザとアイテム)の相互作用であればよい。また、相対的時間または相対的関係を得るための基準時刻(基準日時)は、任意に設定されてよい。
【0072】
(4)全体の知識グラフの構築手順
上記の(1)~(3)の手順により、ユーザ間関係グラフ、ユーザ-アイテム間関係グラフ、および、アイテム間関係グラフが作成された後、
図3のS34において、グラフ構築部103は、これらのグラフを連結して、全体の知識グラフを構築(作成)する。
図9の上部に、知識グラフの概念図(知識グラフ90)を示す。グラフ構築部103は、作成したユーザ間関係グラフ、ユーザ-アイテム間関係グラフ、および、アイテム間関係グラフにおいて、共通するノードを接続点として用いて、全グラフを接続する。続いて、グラフ構築部103は、重複するリンク等を削除するなどして整理し、知識グラフを構築する。
図9には示されていないが、各ノード(ユーザ、アイテム、ジャンル等)間に、ノード間の近さを示す近さスコアが表されている。なお、当該近さスコアは、矢印の長さで表してもよい。また、
図9には示されていないが、各ユーザは、ユーザ特徴を含む、または、ユーザ特徴がノードとして接続されている。なお、ユーザ、アイテム、ジャンルなどのノードは知識グラフにおけるエンティティ(ヘッドエンティティまたはテイルエンティティ)に相当し、ペアおよびリンクはリレーションに相当する。
【0073】
グラフ構築部103は、明示的リンクで接続されたノードと明示的リンクとからなるファクトベースのユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフを連結して全体の知識グラフを構築してよい。また、グラフ構築部103は、明示的リンクで接続されたノードと明示的リンクとからなるファクトベースのユーザ関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフのうち一部の関係グラフと、明示的リンクで接続されたノードと明示的リンクと暗示的リンクで接続されたノードと暗示的リンクとからなるユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフのうち残りの関係グラフと、を連結して全体の知識グラフを構築してよい。つまり、全体の知識グラフは、ユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフの少なくとも1つの暗示的リンクを含まなくてもよい。また、グラフ構築部103は、作成した知識グラフの特徴空間(ベクトル空間)への埋め込むことで、ノード間の暗示的リンクを予測し作成してもよい。すなわち、グラフ構築部103は、明示的リンクのみから構成された知識グラフから、暗示的リンクを予測し、作成してもよい。なお、ユーザ表現などのエンティティの埋め込み表現(ベクトル表現)の抽出(取得)は、ユーザ間関係グラフ、アイテム間関係グラフおよびユーザ-アイテム間関係グラフの少なくとも1つの暗示的リンクを含まない全体の知識グラフに基づき行われてもよい。
【0074】
[ユーザ表現の抽出手順]
次に、本実施形態によるユーザ表現の抽出手順について説明する。表現抽出部104は、グラフ構築部103により構築された知識グラフから、任意のユーザについてのユーザ表現を抽出する。具体的には、表現抽出部104は、当該知識グラフを特徴空間(ベクトル空間)に埋め込み、当該特徴空間における各ノード(エンティティ)および各リンク(リレーション)の埋め込み表現(ベクトル表現)を学習する。表現抽出部104は、知識グラフの学習(表現学習、関係学習、埋込学習)を行い、任意のユーザの埋め込み表現(低次元のベクトル表現)を、ユーザ表現(ユーザの特徴ベクトル)として抽出する(取得する)。
【0075】
表現抽出部104は、知識グラフの学習(埋め込み)に用いられる埋め込みモデルとして、TransE、TransD、RotatEなどのエンティティのベクトル表現間の距離に基づき学習を行うTranslation-basedモデルを採用してよい。また、表現抽出部104は、TransH、TransR、STransEなどのエンティティのベクトル表現を、リレーション毎に異なるベクトル空間へ写像し学習を行うEmbedding-projectionモデルを採用してよい。また、表現抽出部104は、ComplExなどのベクトル表現の複素数空間への変換を利用して学習を行うモデルを採用してよい。また、表現抽出部104は、ConvE、ConvR、R-GCNなどの畳み込みニューラルネットワーク(NN)を含むNNを利用して学習を行うモデルを採用してよい。また、表現抽出部104は、Knowledge Graph Attention Network(KGAT)などのアテンション機構を利用するモデルを採用してよく、TorusEなど、既知のモデルまたはその拡張を適宜、採用してよい。なお、表現抽出部104は、知識グラフの学習に際して適宜、正則化(L1正則化やL2正則化等)を用いてよい。
【0076】
当該ユーザ表現には、各ノードの特徴およびノード間(ペア、リンク)に割り当てられた近さスコアが反映されうる。このとき、表現抽出部104は、ノード間の近さスコアに基づきノード間のリンク(リレーション)にかかるベクトル表現に重み付けをしながら、各ノードおよび各リンクのベクトル表現の学習(知識グラフの埋め込み)を行ってよい。また、表現抽出部104は、近さスコアが所定の閾値を超える、または、下回るリンクおよび当該リンクを介して接続されるノードのそれぞれのベクトル表現を、重点的または限定的に学習し、任意のユーザなどのエンティティのベクトル表現を抽出してよい。このとき、ノードは、少なくとも任意のユーザなどのエンティティと対応するノードを含む。また、表現抽出部104は、任意のユーザなどのエンティティと対応するノードのN次近傍(N>1)における各ノードおよび各リンクのベクトル表現を、重点的または限定的に学習し、任意のユーザなどのエンティティのベクトル表現を抽出してよい。このように、学習を行う対象を、近さスコアに応じてスクリーニングすることにより、計算負荷を低減すること可能となる。
【0077】
図9の下部に、ユーザAについて抽出されたユーザ表現(ノード表現)の概念図(ユーザ表現91)を示す。ユーザ表現91において、ユーザAに暗示的または明示的リンクで接続される、1つ以上のユーザ、アイテム、ジャンル、ショップ等にかかる情報が、1つのユーザ表現に反映される。当該ユーザ表現にはまた、ユーザAに対する各ノード(アイテム、ジャンル等)の近さスコアも表現されうる。すなわち、ユーザAのユーザ表現は、ユーザAと各ノードとの関係性の近さが反映された隣接表現に相当しうる。
【0078】
表現抽出部104は、グラフ構築部103により構築された知識グラフから、任意のアイテムについてのアイテム表現(ノード表現)を抽出してもよい。
【0079】
[ユーザ表現の変形例]
表現抽出部104は、前述したユーザとアイテム間の時系列的な関係を用いて、ユーザ表現やアイテム特徴を抽出(生成)してもよい。以下、
図8Bと
図8Cを参照して、ユーザAとアイテムAについて説明するが、他のユーザとアイテムについても同様の処理を適用可能である。
【0080】
図8Bを参照して、ユーザAのユーザ特徴について説明する。表現抽出部104は、
図8Bにおける相対的時間T1、T2、およびT3を用いて、アイテムA、B、およびCのそれぞれのアイテム特徴を符号化(重みづけ)する。ここで、表現抽出部104は、
図8Bにおける時間軸上の時刻t1、t2、およびt2の相対的位置に応じて、アイテムA、B、およびCのそれぞれのアイテム特徴を符号化してもよい。
続いて、表現抽出部104は、符号化されたアイテムA、B、およびCのアイテム特徴を集約し、当該集約したアイテム特徴を、ユーザAのユーザ特徴に連結する。
【0081】
図8Cを参照して、アイテムAのアイテム特徴について説明する。表現抽出部104は、
図8Cにおける相対的時間T1、T2、およびT3を用いて、ユーザA、B、およびCのそれぞれのユーザ特徴を符号化(重みづけ)する。ここで、表現抽出部104は、
図8Cにおける時間軸上の時刻t1、t2、およびt2の相対的位置に応じて、ユーザA、B、およびCのそれぞれのユーザ特徴を符号化してもよい。
続いて、表現抽出部104は、符号化されたユーザA、B、およびCのユーザ特徴を集約し、当該集約したユーザ特徴を、アイテムAのアイテム特徴に連結する。
【0082】
上記の処理により、情報処理装置10は、ユーザ表現やアイテム表現を抽出(生成)する。当該ユーザ表現や当該アイテム表現は、情報処理装置10に行わせる所定の予測処理の入力データとして使用される。すなわち、情報処理装置10は、知識モデルから、任意のユーザまたは任意のアイテムについての、複数のユーザおよび複数のアイテムとの関係性を表す表現であって、情報処理装置10に行わせる所定の予測処理の入力データとして使用される当該表現を抽出可能に、当該知識モデルを構築する。なお、当該所定の予測処理は、情報処理装置10以外の情報処理装置によって行われてもよい。以下、当該所定の予測処理の一例として、見込みユーザ予測処理について説明する。
【0083】
[見込みユーザの予測処理]
次に、本実施形態による見込みユーザの予測処理について説明する。見込みユーザ予測モデル111は、シードユーザと同様の特徴を有するユーザを、見込みユーザとして予測する学習モデルである。シードユーザは、ウェブサービスを通じて所与の商品やサービスを購入および/または利用、および/または、当該ウェブサービスを通じて当該商品やサービスをポジティブに評価したユーザである。
【0084】
見込みユーザ予測モデル111は、例えば、XGBoostをベースにした学習モデルである。学習段階では、学習部106は、シードユーザ(ポジティブユーザ)のユーザ特徴と、当該シードユーザ以外のユーザ(ネガティブユーザ)のユーザ特徴、およびこれらのユーザのユーザ表現を用いて、見込みユーザ予測モデル111を学習させる。ユーザ特徴は、ベースとなるユーザ特徴であり、当該ウェブサービスでの購買履歴(商品のジャンルやタイプの情報等)を含む。当該デモグラフィック情報と当該購買履歴はそれぞれ、複数の細分化された特徴を含みうる。なお、当該ユーザ特徴は、デモグラフィック情報や購買履歴に限らず、ポイント状況(利用可能なポイント等)、ポイント特徴(オンラインまたはオフラインショップから獲得した/使用したポイントといったポイント取引に関する情報等)等、他の特徴を含んでもよい。
【0085】
学習部106は、グリッドサーチおよびクロスバリデーションにより、ハイパーパラメータ(見込みユーザ予測モデル111の挙動を制御するパラメータ)の検証およびチューニング(調整)を行う。見込みユーザ予測モデル111は、XGBoostはツリー(決定木)ベースのモデルであるため、入力データ(ユーザ特徴)がモデルの出力にどのように影響するかを示す結果を生成することができる。これにより、例えば、シードユーザは、どのユーザ特徴(細分化された特徴の組み合わせ)等に、より影響しているのかを検証することが可能となる。
【0086】
学習された見込みユーザ予測モデル111は、任意のユーザに対して、シードユーザと類似したユーザ特徴を有する可能性(見込みユーザの可能性)を出力するように構成される。当該可能性は、例えば、最大可能性を1として、0~1の数値で表される。ここで、例えば閾値を0.5と設定すると、見込みユーザ予測部105は、0.5より大きい可能性を有するユーザを、見込みユーザ(すなわち、シードユーザと同様の特徴を有する潜在的ユーザ)と予測(決定)することができる。なお、シードユーザは複数であってもよく、その場合、見込みユーザ予測部105は当該複数のシードユーザ(シードユーザ群)に含まれるユーザと類似したユーザ特徴を有するユーザを、見込みユーザとして予測することができる。
【0087】
本実施形態では、見込みユーザ予測部105は、任意のユーザについて、表現抽出部104により抽出されたユーザ表現と、ベースとなるユーザ特徴とを、見込みユーザ予測モデル111に入力して、当該任意のユーザが見込みユーザか否かを予測する。
図10に、本実施形態による、見込みユーザ予測処理を説明するための図を示す。ユーザAを任意のユーザ(対象のユーザ)として設定されると、見込みユーザ予測部105は、ユーザAのベースとなるユーザ特徴1001と、表現抽出部104により抽出されたユーザ表現91を、見込みユーザ予測モデル111に入力して、ユーザAが見込みユーザか否かを予測する。具体的には、見込みユーザ予測部105は、ユーザAのユーザ特徴1001とユーザ表現91から、ユーザAがシードユーザと同様のユーザ特徴を有する可能性(見込みユーザの可能性1002)を予測して出力する。
【0088】
[情報処理装置10のハードウェア構成]
図11は、本実施形態による情報処理装置10のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置10は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図11を参照して、情報処理装置10は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置10は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。
【0089】
図11に示すように、情報処理装置10は、CPU201と、ROM202と、RAM203と、HDD204と、入力部205と、表示部206と、通信I/F207と、システムバス208とを備えてよい。情報処理装置10はまた、外部メモリを備えてよい。
CPU(Central Processing Unit)201は、情報処理装置10における動作を統括的に制御するものであり、データ伝送路であるシステムバス208を介して、各構成部(202~207)を制御する。
【0090】
ROM(Read Only Memory)202は、CPU201が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、HDD(Hard Disk Drive)204、SSD(Solid State Drive)等の不揮発性メモリや着脱可能な記憶媒体(不図示)等の外部メモリに記憶されていてもよい。
RAM(Random Access Memory)203は、揮発性メモリであり、CPU201の主メモリ、ワークエリア等として機能する。すなわち、CPU201は、処理の実行に際してROM202から必要なプログラム等をRAM203にロードし、当該プログラム等を実行することで各種の機能動作を実現する。
図2に示す学習モデル記憶部110と特徴記憶部120は、RAM203で構成されうる。
【0091】
HDD204は、例えば、CPU201がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、HDD204には、例えば、CPU201がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部205は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部206は、液晶ディスプレイ(LCD)等のモニターにより構成される。表示部86は、入力部205と組み合わせて構成されることにより、GUI(Graphical User Interface)として機能してもよい。
【0092】
通信I/F207は、情報処理装置10と外部装置との通信を制御するインタフェースである。
通信I/F207は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信I/F207を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信I/F207は、イーサネット(登録商標)等の通信規格に準拠する有線LAN(Local Area Network)や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wide Band)等の無線PAN(Personal Area Network)を含む。また、Wi-Fi(Wireless Fidelity)(登録商標)等の無線LAN(Local Area Network)や、WiMAX(登録商標)等の無線MAN(Metropolitan Area Network)を含む。さらに、LTE/3G、4G、5G等の無線WAN(Wide Area Network)を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
【0093】
図2に示す情報処理装置10の各要素のうち少なくとも一部の機能は、CPU201がプログラムを実行することで実現することができる。ただし、
図2に示す情報処理装置10の各要素のうち少なくとも一部の機能が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、CPU201の制御に基づいて動作する。
【0094】
[ユーザ装置11のハードウェア構成]
図1に示すユーザ装置11のハードウェア構成は、
図11と同様でありうる。すなわち、ユーザ装置11は、CPU201と、ROM202と、RAM203と、HDD204と、入力部205と、表示部206と、通信I/F207と、システムバス208とを備えうる。ユーザ装置11は、情報処理装置10により提供された各種情報を、表示部206に表示し、GUI(入力部205と表示部206による構成)を介してユーザから受け付ける入力操作に対応する処理を行うことができる。
【0095】
[処理の流れ]
図12に、本実施形態による情報処理装置10により実行される処理のフローチャートを示す。
図12に示す処理は、情報処理装置10のCPU201がROM202等に格納されたプログラムをRAM203にロードして実行することによって実現されうる。
図12の説明のために、
図1に示した情報処理システムを参照する。学習部106により学習済みの、見込みユーザ予測モデル111およびスコア予測モデル112は、学習モデル記憶部110に格納されているものとする。
【0096】
S1201において、ユーザ特徴取得部101は、ユーザ装置11-1~11-Nから、各ユーザのユーザ特徴を取得し、ユーザ特徴121として特徴記憶部120に格納する。また、アイテム特徴取得部102は、所定のデータベースから、様々なウェブサービスにおける登録情報や取引履歴に基づく、アイテムの特徴(属性)を取得し、アイテム特徴122として特徴記憶部120に格納する。S1201の処理は、過去の一定の期間におけるユーザ特徴やアイテム特徴の取得(収集)処理であってもよい。
【0097】
S1202において、グラフ構築部103は、知識ブラフを構築する。当該知識グラフの作成手順は、
図3を参照して上述した通りである。
【0098】
S1203において、表現抽出部104は、S1202で作成された知識グラフから、任意のユーザに対するユーザ表現を抽出する。当該ユーザ表現の抽出手順は、
図9を参照して上述した通りである。
【0099】
S1204において、見込みユーザ予測部105は、任意のユーザが、所定のシードユーザと同様の特徴を有する見込みユーザの可能性を予測する。本実施形態では、
図10に示したように、当該任意のユーザについて、当該ユーザのベースとなるユーザ特徴と、当該ユーザのユーザ表現を、見込みユーザ予測モデル111へ入力して、当該ユーザがシードユーザと同様の特徴を有する(見込みユーザの可能性)を予測して出力する。
【0100】
見込みユーザ予測部105は、複数のユーザから、当該所定のシードユーザと同様の特徴を有する見込みユーザを見込みユーザ群(類似ユーザ群)として予測することができる。この場合、見込みユーザ予測部105は、各ユーザについて、当該ユーザのベースとなるユーザ特徴と、当該ユーザのユーザ表現を、見込みユーザ予測モデル111へ入力して、見込みユーザ群を予測する。また、シードユーザが複数である場合(シードユーザ群)、見込みユーザ予測部105は、複数のユーザから、当該シードユーザ群に含まれるユーザと類似したユーザ特徴を有するユーザを、見込みユーザ群として予測することができる。
【0101】
S1205において、出力部107は、S1204で予測された見込みユーザの可能性についての結果を出力する。例えば、複数のユーザに対して、S1203とS1204の処理が行われる場合、出力部107は、当該複数のユーザから予測された見込みユーザ群の情報に関する情報を生成して、外部装置(不図示)へ出力することができる。
【0102】
このように、本実施形態による情報処理装置は、複数のユーザのユーザ特徴と、複数のアイテムの特徴とから、ユーザ間関係グラフ、アイテム間関係グラフ、および、ユーザ-アイテム間関係グラフを作成する。さらに、情報処理装置は、ユーザとアイテムとの時系列的な相互作用(例えば、ユーザによるアイテムの購入)を示す時系列情報を取得する。情報処理装置は、当該各関係グラフと当該時系列情報を用いて、知識グラフを構築(作成)する。当該知識グラフは、任意のユーザについて、当該ユーザに関係する全ての他のユーザとアイテム(ジャンルやショップ等を含む)がリンクされており、かつ、当該時系列情報にもとづいてリンクが重みづけされている。このような知識グラフは、ユーザの行動分析に関するあらゆる予測処理に活用することが可能である。
【0103】
また、本実施形態による情報処理装置は、当該知識グラフから、任意のユーザについて、当該ユーザに関係する全ての他のユーザとアイテムを表現したユーザ表現を作成する。当該ユーザ表現は、あらゆる他のユーザおよびアイテムの特徴(属性)を、1ユーザに対して紐づけた表現である。すなわち、当該ユーザ表現は、任意のユーザについて、他のユーザやアイテム毎の個別の表現ではなく、他のユーザおよびアイテムとの複合的な関係を包含して構成された表現である。また、当該ユーザ表現に、ユーザとアイテムとの時系列的な相互作用を反映することができる。これにより、任意のユーザの、他のユーザおよびアイテムとの繋がりを、1つの表現として扱うことができ、当該ユーザ表現を任意の予測処理に用いる場合に、演算処理量が減るという有利な効果が得られる。
【0104】
なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置および方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換および変更をなすこともできる。かかる省略、置換および変更をなした形態は、請求の範囲に記載されたものおよびこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。
【0105】
本実施形態の開示は以下の構成を含む。
[1]複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得手段と、前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得手段と、 前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築手段と、前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出手段と、を有する。
【0106】
[2]前記構築手段は、前記時系列情報に基づいて、前記リンクの重みづけを行う、[1]に記載の情報処理装置。
【0107】
[3]前記時系列情報は、前記複数のユーザのうちいずれかのユーザによる、前記複数のアイテムのうち2つ以上のアイテムそれぞれとの相互作用が生じた日時の情報を含む、[1]または[2]に記載の情報処理装置。
【0108】
[4]前記構築手段は、前記ユーザを表すユーザノードと、前記2以上のアイテムのうち相互作用が生じた日時がより現在に近いアイテムを表すアイテムノードの関係を示すリンクに、より高く重みづけを行う、[3]に記載の情報処理装置。
【0109】
[5]前記時系列情報は、前記複数のユーザのうち2以上のユーザによる、前記複数のアイテムのうちいずれかのアイテムとの相互作用が生じた日時の情報を含む、[1]から[4]のいずれかに記載の情報処理装置。
【0110】
[6]前記構築手段は、前記アイテムを表すアイテムノードと、前記2以上のユーザのうち相互作用が生じた日時がより現在に近いユーザを表すユーザの関係を示すリンクに、より高く重みづけを行う、[5]に記載の情報処理装置。
【0111】
[7]前記複数のユーザと前記複数のアイテムとの時系列的な相互作用は、前記複数のユーザのいずれかによる前記複数のアイテムのいずれかの購入を含む、[1]から[6]のいずれかに記載の情報処理装置。
【0112】
[8]前記複数のユーザと前記複数のアイテムとの時系列的な相互作用は、所定の基準日時から、過去の所定期間までに生じた相互作用である、[1]から[7]のいずれかに記載の情報処理装置。
【0113】
[9]前記ユーザ特徴は、前記複数のユーザそれぞれのユーザについての事実特徴である、[1]から[8]のいずれかに記載の情報処理装置。
【0114】
[10]複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得工程と、前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得工程と、 前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築工程と、前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出工程と、を含む。
【0115】
[11]情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得処理と、 前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得処理と、前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築処理と、前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出処理と、を含む処理を実行させるためのものである。
【符号の説明】
【0116】
1~N:ユーザ、10:情報処理装置、11-1~11-N:ユーザ装置、101:ユーザ特徴取得部、102:アイテム特徴取得部、103:グラフ構築部、104:表現抽出部、105:見込みユーザ予測部、106:学習部、107:出力部、110:学習モデル記憶部、111:見込みユーザ予測モデル、112:スコア予測モデル、120:特徴記憶部、121:ユーザ特徴、122:アイテム特徴
【手続補正書】
【提出日】2023-11-15
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得手段と、
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得手段と、
前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築手段と、
前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出手段と、
を有することを特徴とする情報処理装置。
【請求項2】
前記構築手段は、前記時系列情報に基づいて、前記リンクの重みづけを行うことを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記時系列情報は、前記複数のユーザのうちいずれかのユーザによる、前記複数のアイテムのうち2つ以上のアイテムそれぞれとの相互作用が生じた日時の情報を含む、ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記構築手段は、前記ユーザを表すユーザノードと、前記2以上のアイテムのうち相互作用が生じた日時がより現在に近いアイテムを表すアイテムノードの関係を示すリンクに、より高く重みづけを行う、ことを特徴とする請求項3に記載の情報処理装置。
【請求項5】
前記時系列情報は、前記複数のユーザのうち2以上のユーザによる、前記複数のアイテムのうちいずれかのアイテムとの相互作用が生じた日時の情報を含む、ことを特徴とする請求項1または2に記載の情報処理装置。
【請求項6】
前記構築手段は、前記アイテムを表すアイテムノードと、前記2以上のユーザのうち相互作用が生じた日時がより現在に近いユーザを表すユーザの関係を示すリンクに、より高く重みづけを行う、ことを特徴とする請求項5に記載の情報処理装置。
【請求項7】
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用は、前記複数のユーザのいずれかによる前記複数のアイテムのいずれかの購入を含む、ことを特徴とする請求項1に記載の情報処理装置。
【請求項8】
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用は、所定の基準日時から、過去の所定期間までに生じた相互作用である、ことを特徴とする請求項1に記載の情報処理装置。
【請求項9】
前記ユーザ特徴は、前記複数のユーザそれぞれのユーザについての事実特徴である、ことを特徴とする請求項1に記載の情報処理装置。
【請求項10】
情報処理装置によって実行される情報処理方法であって、
複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得工程と、
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得工程と、
前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築工程と、
前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出工程と、
を含むことを特徴とする情報処理方法。
【請求項11】
情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
複数のユーザそれぞれについて特徴を示すユーザ特徴と、複数のアイテムそれぞれについて特徴を示すアイテム特徴を取得する特徴取得処理と、
前記複数のユーザと前記複数のアイテムとの時系列的な相互作用を示す時系列情報を取得する時系列情報取得処理と、
前記ユーザ特徴、前記アイテム特徴、および前記時系列情報に基づいて、前記複数のユーザを表す複数のユーザノードと前記複数のアイテムを表す複数のアイテムノードと、前記複数のユーザノードと前記複数のアイテムノードにおける相互の関係を示すリンクとを含むグラフを構築する構築処理と、
前記グラフから、前記複数のユーザノードと前記複数のアイテムノードのうち任意のノードについての前記グラフにおけるノード表現を抽出する抽出処理と、を含む処理を実行させるためのものである、
情報処理プログラム。