IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 楽天株式会社の特許一覧

特許7557496情報処理装置、情報処理方法、およびプログラム
<>
  • 特許-情報処理装置、情報処理方法、およびプログラム 図1
  • 特許-情報処理装置、情報処理方法、およびプログラム 図2
  • 特許-情報処理装置、情報処理方法、およびプログラム 図3
  • 特許-情報処理装置、情報処理方法、およびプログラム 図4A
  • 特許-情報処理装置、情報処理方法、およびプログラム 図4B
  • 特許-情報処理装置、情報処理方法、およびプログラム 図4C
  • 特許-情報処理装置、情報処理方法、およびプログラム 図4D
  • 特許-情報処理装置、情報処理方法、およびプログラム 図5A
  • 特許-情報処理装置、情報処理方法、およびプログラム 図5B
  • 特許-情報処理装置、情報処理方法、およびプログラム 図6A
  • 特許-情報処理装置、情報処理方法、およびプログラム 図6B
  • 特許-情報処理装置、情報処理方法、およびプログラム 図7
  • 特許-情報処理装置、情報処理方法、およびプログラム 図8
  • 特許-情報処理装置、情報処理方法、およびプログラム 図9
  • 特許-情報処理装置、情報処理方法、およびプログラム 図10
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-18
(45)【発行日】2024-09-27
(54)【発明の名称】情報処理装置、情報処理方法、およびプログラム
(51)【国際特許分類】
   G06Q 50/10 20120101AFI20240919BHJP
   G06F 16/9035 20190101ALI20240919BHJP
【FI】
G06Q50/10
G06F16/9035
【請求項の数】 8
(21)【出願番号】P 2022053169
(22)【出願日】2022-03-29
(65)【公開番号】P2023146140
(43)【公開日】2023-10-12
【審査請求日】2023-09-13
(73)【特許権者】
【識別番号】399037405
【氏名又は名称】楽天グループ株式会社
(74)【代理人】
【識別番号】100109380
【弁理士】
【氏名又は名称】小西 恵
(74)【代理人】
【識別番号】100109036
【弁理士】
【氏名又は名称】永岡 重幸
(72)【発明者】
【氏名】平手 勇宇
(72)【発明者】
【氏名】ラーマン エムディ モスタフィズ
(72)【発明者】
【氏名】蛭子 ▲たく▼磨
(72)【発明者】
【氏名】コンダパカ マノゥチ
(72)【発明者】
【氏名】菊田 大輔
(72)【発明者】
【氏名】アブロール サティアン
(72)【発明者】
【氏名】シン アトゥル
【審査官】日比野 可奈子
(56)【参考文献】
【文献】特開2014-153934(JP,A)
【文献】特開2016-006563(JP,A)
【文献】特開2018-194897(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06Q10/00-99/00
G06F16/9035
(57)【特許請求の範囲】
【請求項1】
複数のユーザそれぞれのユーザについての事実特徴をユーザ特徴として取得する取得手段と、
前記複数のユーザのうち、対象ユーザを設定する対象ユーザ設定手段と、
前記複数のユーザ間の社会的関係性を示す関係性グラフに基づいて、前記複数のユーザのうち、前記対象ユーザと関連する1以上のユーザを関連ユーザとして設定する関連ユーザ設定手段と、
前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴に基づいて、前記対象ユーザの属性を推定する推定手段と、
を有し、
前記関連ユーザ設定手段は、前記関係性グラフにおけるユーザのペアで共有される1つ以上の事実特徴を入力して、当該ユーザのペアの親密度を出力するように構成された第1の機械学習モデルを用いて、前記関係グラフにおけるユーザのペアの親密度を予測し、前記予測された親密度の高さに応じた1以上のユーザを前記関連ユーザとして設定することを特徴とする情報処理装置。
【請求項2】
前記関連ユーザ設定手段は、前記予測された親密度が所定の閾値より高い1以上のユーザを前記関連ユーザとして設定することを特徴とする請求項1に記載の情報処理装置。
【請求項3】
前記推定手段は、前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴を入力し、前記対象ユーザの属性を出力するように構成された第2の機械学習モデルを用いて、前記対象ユーザの属性を推定することを特徴とする請求項1または2に記載の情報処理装置。
【請求項4】
前記関係性グラフにおいて、各ユーザは各ユーザノードで表され、前記各ユーザノードは、前記事実特徴に基づいてリンクで接続されることを特徴とする請求項1から3のいずれか1項に記載の情報処理装置。
【請求項5】
前記関係性グラフにおいて、同じ事実特徴を有するユーザノードのペアが明示的なリンクで接続され、当該明示的なリンクで接続された複数のユーザノードのペアに基づいて、前記明示的なリンクで接続されていないユーザノードのペアが暗示的なリンクで接続されることを特徴とする請求項4に記載の情報処理装置。
【請求項6】
前記ユーザ特徴は、ユーザのデモグラフィック情報と、ユーザのウェブサービスの利用に関する情報を含むことを特徴とする請求項1から5のいずれか1項に記載の情報処理装置。
【請求項7】
情報処理装置により実行される情報処理方法であって、
複数のユーザそれぞれのユーザについての事実特徴をユーザ特徴として取得する取得工程と、
前記複数のユーザのうち、対象ユーザを設定する対象ユーザ設定工程と、
前記複数のユーザ間の社会的関係性を示す関係性グラフに基づいて、前記複数のユーザのうち、前記対象ユーザと関連する1以上のユーザを関連ユーザとして設定する関連ユーザ設定工程と、
前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴に基づいて、前記対象ユーザの属性を推定する推定工程と、
を有し、
前記関連ユーザ設定工程では、前記関係性グラフにおけるユーザのペアで共有される1つ以上の事実特徴を入力して、当該ユーザのペアの親密度を出力するように構成された機械学習モデルを用いて、前記関係グラフにおけるユーザのペアの親密度を予測し、前記予測された親密度の高さに応じた1以上のユーザを前記関連ユーザとして設定することを特徴とする情報処理方法。
【請求項8】
情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、
複数のユーザそれぞれのユーザについての事実特徴をユーザ特徴として取得する取得処理と、
前記複数のユーザのうち、対象ユーザを設定する対象ユーザ設定処理と、
前記複数のユーザ間の社会的関係性を示す関係性グラフに基づいて、前記複数のユーザのうち、前記対象ユーザと関連する1以上のユーザを関連ユーザとして設定する関連ユーザ設定処理と、
前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴に基づいて、前記対象ユーザの属性を推定する推定処理と、を含む処理を実行させるためのものであり、
前記関連ユーザ設定処理では、前記関係性グラフにおけるユーザのペアで共有される1つ以上の事実特徴を入力して、当該ユーザのペアの親密度を出力するように構成された機械学習モデルを用いて、前記関係グラフにおけるユーザのペアの親密度を予測し、前記予測された親密度の高さに応じた1以上のユーザを前記関連ユーザとして設定する、
情報処理プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置、情報処理方法、およびプログラムに関し、特に、ユーザの属性を予測する技術に関する。
【背景技術】
【0002】
ユーザに対する適切なサービスのレコメンドや、ユーザに関連したビジネスの展開のために、ユーザの属性(特徴)を推定することが有効である。特許文献1には、他の携帯端末(近接端末)のユーザの属性情報に含まれる当該近接端末のユーザと携帯端末のユーザとの関係性情報に基づいて、当該携帯端末のユーザの属性を推定する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【文献】特開2016-162399号公報
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示の技術では、ユーザのペアにおける関係性情報に基づいて、当該ペアの一方のユーザの属性を推定しているが、当該ペアにおける関係性情報は、局所的な情報に過ぎず、ユーザの属性の推定の精度を十分に高めることができなかった。
【0005】
本発明は上記課題に鑑みてなされたものであり、ユーザと他の複数のユーザとの網羅的な関係性に基づいて、ユーザの属性を推定するための技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明による情報処理装置の一態様は、複数のユーザそれぞれのユーザについての事実特徴をユーザ特徴として取得する取得手段と、記複数のユーザのうち、対象ユーザを設定する対象ユーザ設定手段と、前記複数のユーザ間の社会的関係性を示す関係性グラフに基づいて、前記複数のユーザのうち、前記対象ユーザと関連する1以上のユーザを関連ユーザとして設定する関連ユーザ設定手段と、前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴に基づいて、前記対象ユーザの属性を推定する推定手段と、を有する。
【0007】
前記推定手段は、前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴を入力し、前記対象ユーザの属性を出力するように構成された機械学習モデルを用いて、前記対象ユーザの属性を推定しうる。
【0008】
前記関係性グラフにおいて、各ユーザは各ユーザノードで表され、前記各ユーザノードは、前記事実特徴に基づいてンクで接続されうる。
【0009】
前記関係性グラフにおいて、同じ事実特徴を有するユーザノードのペア明示的なリンクで接続され、当該明示的なリンクで接続された複数のユーザノードのペアに基づいて、前記明示的なリンクで接続されていないユーザノードのペア暗示的なリンクで接続されうる。
【0010】
前記関係性グラフは、前記接続されたユーザノードのペア共有される1つ以上の事実特徴に基づいて当該ペアに割り当てられた親密度を有しうる。
【0011】
前記関連ユーザ設定手段は、前記関係性グラフにおいて、前記対象ユーザに対応するユーザノードとの前記親密度が所定の閾値より高い1以上のユーザノードに対応する1以上のユーザを、前記関連ユーザとして設定しうる。
【0012】
前記ユーザ特徴は、ユーザのデモグラフィック情報と、ユーザのウェブサービスの利用に関する情報を含みうる。
【0013】
上記課題を解決するために、本発明による情報処理方法の一態様は、複数のユーザそれぞれのユーザについての事実特徴をユーザ特徴として取得する取得工程と、記複数のユーザのうち、対象ユーザを設定する対象ユーザ設定工程と、前記複数のユーザ間の社会的関係性を示す関係性グラフに基づいて、前記複数のユーザのうち、前記対象ユーザと関連する1以上のユーザを関連ユーザとして設定する関連ユーザ設定工程と、前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴に基づいて、前記対象ユーザの属性を推定する推定工程と、を有する。
【0014】
上記課題を解決するために、本発明によるプログラムの一態様は、情報処理をコンピュータに実行させるための情報処理プログラムであって、該プログラムは、前記コンピュータに、複数のユーザそれぞれのユーザについての事実特徴をユーザ特徴として取得する取得処理と、記複数のユーザのうち、対象ユーザを設定する対象ユーザ設定処理と、前記複数のユーザ間の社会的関係性を示す関係性グラフに基づいて、前記複数のユーザのうち、前記対象ユーザと関連する1以上のユーザを関連ユーザとして設定する関連ユーザ設定処理と、前記対象ユーザのユーザ特徴と前記関連ユーザのユーザ特徴に基づいて、前記対象ユーザの属性を推定する推定処理と、を含む処理を実行させるためのものである。
【発明の効果】
【0015】
本発明によれば、ユーザの属性を精度よく推定することが可能となる。
上記した本発明の目的、態様及び効果並びに上記されなかった本発明の目的、態様及び効果は、当業者であれば添付図面及び請求の範囲の記載を参照することにより下記の発明を実施するための形態から理解できるであろう。
【図面の簡単な説明】
【0016】
図1図1は、情報処理システムの構成例を示す。
図2図2は、実施形態による情報処理装置10の機能構成例を示す。
図3図3は、関係性グラフの作成処理のフローチャートを示す。
図4A図4Aは、明示的リンクを説明するための図である。
図4B図4Bは、明示的リンクを説明するための図である。
図4C図4Cは、明示的リンクを説明するための図である。
図4D図4Dは、暗示的リンクを説明するための図である。
図5A図5Aは、リンク間の関係性の推論処理を説明するための図である。
図5B図5Bは、ペアをクラスタへグループ化する処理の一例のフローチャートを示す。
図6A図6Aは、ユーザペアに対する関係性の親密度に基づくスコア(親密度スコア)の概念図を示す。
図6B図6Bは、スコア予測モデル112の概略アーキテクチャを示す。
図7図7は、関係性グラフの概念図を示す。
図8図8は、属性予測モデル111の概略アーキテクチャを示す。
図9図9は、情報処理装置10とユーザ装置11のハードウェア構成例を示す。
図10図10は、情報処理装置10により実行される処理のフローチャートを示す。
【発明を実施するための形態】
【0017】
以下、添付図面を参照して、本発明を実施するための実施形態について詳細に説明する。以下に開示される構成要素のうち、同一機能を有するものには同一の符号を付し、その説明を省略する。なお、以下に開示される実施形態は、本発明の実現手段としての一例であり、本発明が適用される装置の構成や各種条件によって適宜修正または変更されるべきものであり、本発明は以下の実施形態に限定されるものではない。また、本実施形態で説明されている特徴の組み合わせの全てが本発明の解決手段に必須のものとは限らない。
【0018】
[情報処理装置の機能構成]
図1に、本実施形態による情報処理システムの構成例を示す。本情報処理システムは、その一例として、図1に示すように、情報処理装置10と、任意の複数のユーザ1~Nにより使用される複数のユーザ装置11-1~11-N(N>1)を含んで構成される。なお、以下の説明において、特に説明がない限り、ユーザ装置11-1~11-Nをユーザ装置11と総称しうる。また、以下の説明において、ユーザ装置とユーザという語は同義に使用されうる。
【0019】
ユーザ装置11は、例えば、スマートフォンやタブレットといったデバイスであり、LTE(Long Term Evolution)等の公衆網や、無線LAN(Local Area Network)等の無線通信網を介して、情報処理装置10と通信可能に構成されている。ユーザ装置11は、液晶ディスプレイ等の表示部(表示面)を有し、各ユーザは、当該液晶ディスプレイに装備されたGUI(Graphic User Interface)により各種操作を行うことができる。当該操作は、指やスタイラス等によりタップ操作、スライド操作、スクロール操作等、画面に表示された画像等のコンテンツに対する各種の操作を含む。
なお、ユーザ装置11は、図1に示すような形態のデバイスに限らず、デスクトップ型のPC(Personal Computer)や、ノート型のPCといったデバイスであってもよい。その場合、各ユーザによる操作は、マウスやキーボードといった入力装置を用いて行われうる。また、ユーザ装置11は、表示面を別に備えてもよい。
【0020】
ユーザ装置11は、情報処理装置10から、または、不図示の他の装置から情報処理装置10を介して提供されるウェブサービス(インターネット関連サービス)にログインして、サービスを利用することができる。当該ウェブサービスは、インターネットを介して提供される、オンラインモールやネットスーパー、あるいは、通信、金融、不動産、スポーツ、旅行に関するサービスを含むことができる。ユーザ装置11は、このようなウェブサービスを利用することにより、ユーザ装置11のユーザに関する情報を情報処理装置10に伝達することができる。
【0021】
例えば、ユーザ装置11は、ユーザ装置11のIP(Internet Protocol)アドレスや、ユーザの住所やユーザの氏名といった、ユーザ装置やユーザに関する情報を、情報処理装置10へ伝達することができる。
また、ユーザ装置11は、GPS(Global Positioning System)衛星(不図示)から受信される信号等に基づいて測位計算を行い、当該計算により得られた情報を、ユーザ装置11の位置情報として生成し、情報処理装置10へ伝達することができる。
情報処理装置10は、ユーザ装置11から各種情報を取得し、当該情報に基づいて、ユーザ間の社会的関係性を示す関係性グラフネットワーク(以下、関係性グラフ)を作成する。そして情報処理装置10は、対象のユーザの属性を、当該作成した関係性グラフを用いて推定する。
【0022】
[情報処理装置10の機能構成]
本実施形態による情報処理装置10は、まず、ユーザ装置11-1~11-Nから各種情報を取得し、ユーザ1~N間の社会的関係性を示す関係性グラフを作成する。そして、情報処理装置10は、ユーザ1~Nのうちの対象のユーザを特定し、当該対象のユーザに関する情報および当該対象のユーザに関係するユーザの情報を、作成した関係性グラフに基づいて取得する。情報処理装置10は、取得した情報を、学習済みの機械学習モデルに適用することにより、当該対象のユーザの属性を推定する。
【0023】
図2は、本実施形態による情報処理装置10の機能構成の一例を示す。
図2に示す情報処理装置10は、ユーザ特徴取得部101、グラフ作成部102、対象ユーザ特徴設定部103、関連ユーザ特徴設定部104、属性推定部105、学習部106、出力部107、学習モデル記憶部110、およびユーザ特徴記憶部120を備える。学習モデル記憶部110は、属性予測モデル111およびスコア予測モデル112を記憶している。当該各種学習モデルについては後述する。また、ユーザ特徴記憶部120はユーザ特徴121を記憶している。
【0024】
ユーザ特徴取得部101は、ユーザ装置11-1~11-Nのそれぞれから、当該ユーザ装置やユーザについての事実特徴(事実情報)(以下、ユーザ特徴)を取得する。ユーザ特徴は、当該ユーザ装置やユーザから実際に、または、客観的に得られる、事実に基づく特徴(情報)である。ユーザ特徴取得部101は例えば、ユーザ装置11から直接ユーザ特徴を取得することができる。また、ユーザ特徴取得部101は、ユーザ装置11のユーザにより所定のウェブサービスに登録された情報として、ユーザ特徴を取得することができる。
【0025】
ユーザ特徴は、ユーザ装置のIPアドレス、ユーザの住所やユーザの氏名、ユーザが保持するクレジットカードの番号、ユーザのデモグラフィック情報(性別、年齢、居住地域、職業、家族構成等の人口統計学的なユーザ属性)、ユーザ装置の位置情報等を含む。また、ユーザ特徴は、所定のウェブサービス利用時における登録番号や登録名を含んでもよい。また、ユーザ特徴は、通話履歴、所定のウェブサービス利用時における商品のユーザの住所以外の配送先住所、所定のウェブサービス利用時の利用状況、利用履歴、検索履歴、サービスの利用により貯めることが可能なポイントに関する情報を含んでもよい。このように、ユーザ特徴は、ユーザ装置またはユーザ自身に関連する情報や、通信を介した所定のサービス利用に関する情報を含む、あらゆる情報を含むことができる。
ユーザ特徴取得部101は、取得したユーザ特徴を、ユーザ特徴121としてユーザ特徴120に記憶させる。
【0026】
グラフ作成部102は、ユーザ特徴取得部101により取得された各種ユーザ特徴を用いて、関係性グラフを作成する。関係性グラフについては後述する。
【0027】
対象ユーザ特徴設定部103は、属性推定の対象となるユーザ(以下、対象ユーザ)の設定を行う。対象ユーザは、操作者が入力部(図9の入力部95)による入力操作により設定されてもよいし、予めシステムにおいて設定されていてもよいし、記憶部(図9のROM92やRAM93)に格納されている任意のプログラムによって設定されてもよい。さらに、対象ユーザ特徴設定部103は、当該対象ユーザのユーザ特徴を、ユーザ特徴121から取得して属性推定部105に設定する。
【0028】
関連ユーザ特徴設定部104は、対象ユーザ特徴設定部103により設定された対象ユーザに関連付けられる1以上の他のユーザを、関連ユーザとして、グラフ作成部102により作成された関係性グラフに基づいて決定する。本実施形態では、関連ユーザ特徴設定部104は、当該対象ユーザと親密度スコア(後述)の高い(例えば、所定の閾値より高い)他の1以上のユーザを、関連ユーザとして決定する。さらに、関連ユーザ特徴設定部104は、当該関連ユーザのユーザ特徴を、ユーザ特徴121から取得して属性推定部105に設定する。
【0029】
属性推定部105は、対象ユーザ特徴設定部10により設定された対象ユーザのユーザ特徴、および、関連ユーザ特徴設定部104により設定された関連ユーザのユーザ特徴から、当該対象ユーザの属性を推定(予測)する。本実施形態では、学習部106により学習済みの属性予測モデル111を用いて、当該対象ユーザの属性を推定する。対象ユーザの属性の推定処理については後述する。
【0030】
学習部106は、属性予測モデル111とスコア予測モデル112を学習(トレーニング)させ、学習済みの属性予測モデル111とスコア予測モデル112を、学習モデル記憶部110に格納する。各学習モデルの学習処理については後述する。
【0031】
出力部107は、属性推定部105により推定された対象ユーザの属性の結果(推定結果)を出力する。出力部107は、推定された対象ユーザの属性に関する情報を生成して出力してもよい。当該出力は、あらゆる出力処理であり得、通信I/F(図9の通信I/F97)を介した外部装置への出力であってもよいし、表示部(図9の表示部96)への表示であってもよい。
【0032】
[関係性グラフの作成手順]
次に、本実施形態による関係性グラフの作成手順について説明する。なお、以下の説明においてユーザA~Eは、説明のために参照するユーザであり、ユーザ装置11のユーザでありうる。また、関係性グラフは、図4A図4Dにおいて丸で囲まれた各ユーザノードの接続で構成され、以下の説明では、当該ユーザノードを単にユーザと称する。図3に、本実施形態によるグラフ作成部102により実行される関係性グラフの作成処理のフローチャートを示す。以下、図3の処理の各工程について説明する。
【0033】
<S31:リンクの作成>
S31では、グラフ作成部102は、複数のユーザ間のリンクを予測して作成する。
リンクの作成処理について、図4A図4Dを参照して説明する。図4A図4Cは、明示的リンクを説明するための図であり、図4Dは、暗示的リンクを説明するための図である。明示的リンクとは、2ユーザ間(ユーザペア)の明示的な共通の特徴により作成されるリンクである。暗示的リンクとは、ユーザペアの明示的な共通の特徴の存在は不明確であるものの、すでに作成されている明示的リンクを利用して、間接的な関係として作成されるリンクである。このように、ユーザ間のリンクは、明示的リンクと暗示的リンクで識別される。
【0034】
図4Aに、ユーザのユーザ装置のIPアドレスを共通な特徴として用いて明示的リンクを作成する例を示す。図4Aは、ユーザA~Cが利用可能なウェブサービスとして、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43、およびカード管理システム44が存在する例を示す。図4A図4Cでは、これら4つのウェブサービスが示されているが、ウェブサービスの数は特定の数に限定されない。
【0035】
オンラインモール41は、オンラインで(インターネットを使用して)利用可能なショッピングモールである。オンラインモール41は、例えば、ファッション、書籍、食品、コンサートチケット、不動産といった多種多様な商品やサービスを提供することができる。
ゴルフ場予約サービス42は、オンラインでゴルフ場に関するサービスを提供するウェブサイトで運営され、例えばゴルフ場の検索および予約やレッスン情報を提供することができる。
旅行関連予約サービス43は、オンラインで利用可能な各種旅行サービスを提供するウェブサイトで運営される。旅行関連予約サービス43は、例えば、ホテルやトラベルツアーの予約、航空券やレンタカーの予約、観光情報、ホテル、ホテル周辺の情報を提供することができる。
カード管理システム44は、所定のカード管理会社により発行および管理されるクレジットカードに関するサービスを提供するウェブサイトで運営される。カード管理システム44は、オンラインモール41、ゴルフ場予約サービス42、および旅行関連予約サービス43の少なくともいずれかと関連して、サービスを提供してもよい。
【0036】
図4Aの例では、ユーザA~Cはそれぞれ、同じIPアドレス(=198.45.66.xx)を用いて、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43を利用している。IPアドレスの情報は、ユーザ特徴取得部101により取得されうる。
このような場合、グラフ作成部102は、ユーザA~Cは、リンク状態45に示すように、同じIPアドレスの特徴で、明示的リンク(例えば、ユーザAとユーザCのリンクL1)を相互に作成する。
【0037】
図4Bに、ユーザの住所の特徴を共通な特徴として用いて明示的リンクを作成する例を示す。図4Bは、図4Aと同様に、ユーザA~Cが利用可能なウェブサービスとして、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43、およびカード管理システム44が存在する例を示す。ここで、ユーザA~ユーザCはそれぞれ、同じの住所(配送先住所)を登録して、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43を利用している。住所の情報は、ユーザ特徴取得部101により取得されうる。
このような場合、グラフ作成部102は、ユーザA~Cは、リンク状態46に示すように、同じ住所の特徴で、明示的リンク(例えば、ユーザAとユーザCのリンクL1)を相互に作成する。
【0038】
図4Cに、ユーザが使用するクレジットカード番号の特徴を共通な特徴として用いて明示的リンクを作成する例を示す。図4Bは、図4Aと同様に、ユーザA~Cが利用可能なウェブサービスとして、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43、およびカード管理システム44が存在する例を示す。ここで、ユーザA~ユーザCはそれぞれ、同じのクレジットカードを登録して、オンラインモール41、ゴルフ場予約サービス42、旅行関連予約サービス43を利用している。クレジットカードの番号を含む情報は、ユーザ特徴取得部101により取得されうる。
このような場合、グラフ作成部102は、ユーザA~Cは、リンク状態47に示すように、同じカードの特徴で、明示的リンク(例えば、ユーザAとユーザCのリンクL1)を相互に作成する。
【0039】
図4Dに、ユーザ間に暗示的リンクを作成する例を示す。図4Dの例では、ユーザAに対して、ユーザC、ユーザD、ユーザEが明示的リンクで接続され、ユーザBに対して、ユーザC、ユーザD、ユーザEが明示的リンクで接続されている。このようなリンク特徴(リンク間の関係を示す特徴)を、共通の特徴空間へ埋め込み、各ユーザ(各ノード)間で暗黙的に関係性が構築されるとして推論されたリンクが、暗示的リンクとして作成(確立)される。図4Dの例では、ユーザAとユーザBは、明示的リンクで接続されていないが、共通の特徴空間で関係性を有すると推論された結果、暗示的リンクL2が作成されている。なお、グラフ作成部102は、明示的リンクで接続されたノード(ユーザ)で構成されるユーザ間関係グラフの学習(表現学習、関係学習、埋込学習、知識グラフ埋め込み)を行うことで、ユーザ間の暗示的リンクを予測し作成する。このとき、グラフ作成部102は、既知の埋め込みモデルまたはその拡張に適宜、基づき、当該学習を行ってよい。
【0040】
<S32:リンク間の関係性の推論>
S32では、グラフ作成部102は、S31で予測および作成されたリンク間の関係性を推論する。リンク間の関係性の推論処理について、図5A図5Bを参照して説明する。図5Aは、リンク間の関係性の推論処理を説明するための図であり、明示的リンクで接続されたユーザAとユーザB間のリンクの関係性を推論する例を示す。
【0041】
グラフ作成部102は、S31で作成されたリンクで接続されたユーザのペアをデータポイントとして扱い、ユーザ特徴取得部101により取得された各種情報を用いて、当該ペア(データポイント)を、共通のタイプを表すクラスタにグループ化する。当該各種情報は、IPアドレス、住所、クレジットカード、年齢、性別、友人といった情報でありうる。また、各クラスタは、配偶者、親子、近所の人、同じ世帯、同僚、友達、同性別きょうだい、異性別きょうだい等の関係を持つクラスタでありうる。図5Aの例では、ユーザのペアをバツ印で示し、当該ペアがグループ化されうるクラスタとして、親子クラスタ51、配偶者クラスタ52、同性別きょうだいクラスタ53、友人クラスタ54、同僚クラスタを示す。なお、図5Aでは5つのクラスタを示すが、クラスタの数は特定の数に限定されない。
【0042】
例えば、グラフ作成部102は、ユーザAとユーザBが、同じ名字、年齢差が10歳未満、逆の性別、同じ住所、という特徴50を有する(共有する)場合、グラフ作成部102は、ユーザAとユーザBのペアを、夫と妻(配偶者)の関係を表すクラスタにグループ化することができる。
【0043】
図5Bに、グラフ作成部102により実行される、ペアをクラスタへグループ化する処理の一例のフローチャートを示す。
S51の開始時点で、グループ化の対象のペアについて、同じ住所と同じ名字の特徴を有するものとする。S52では、グラフ作成部102は、当該対象のペアについて、同じ性別の特徴を有するか否かを判定する。当該対象のペアが同じ性別の特徴を有する場合(S52でYes)、S53においてグラフ作成部102は、当該対象のペアについて、年齢の差が所定の閾値(=X値)以下か否かを判定する。当該対象のペアの年齢の差がX値より大きい場合(S53でNo)、グラフ作成部102は、当該対象のペアを親子クラスタ51へグループ化する。年齢の差がX値以下の場合(S53でYes)、グラフ作成部102は、当該対象のペアを同性別きょうだいクラスタ53へグループ化する。また、当該対象のペアが同じ性別の特徴を有さない場合(S52でNo)、S54においてグラフ作成部102は、当該対象のペアの年齢の差が所定の閾値(=Y値)以下か否かを判定する。年齢の差がY値より大きい場合(S54でNo)、グラフ作成部102は、当該対象のペアを親子クラスタ51へグループ化する。年齢の差がY値以下の場合(S54でYes)、グラフ作成部102は、当該対象のペアを配偶者クラスタ52へグループ化する。
【0044】
<S33:関係性の親密度に基づくスコア割り当て>
S33では、グラフ作成部102は、S32で推論されたペアに対する関係性の親密度に基づくスコアを推定し、当該スコアを当該ペアに割り当てる。本実施形態において、スコアは、0~1の間の数値であるが、スコアが取りうる数値に特定の限定はない。図6Aに、ユーザペアに対する関係性の親密度に基づくスコア(以下、親密度スコア)の概念図を示す。
【0045】
図6Aの例では、明示的リンクで接続されたユーザAとユーザBが有する(共有する)特徴によって、当該ユーザペア間の関係性の親密度が変化する。図6Aの上部では、ユーザAとユーザBが、同性別きょうだい、同じ住所、1200回の通話履歴、50回のギフトのやり取り、という特徴60を有する場合、当該ユーザペア間の関係性の親密度(すなわち、親密度スコア)は高くなる。一方、図6Aの下部では、ユーザAとユーザBが、同性別きょうだい、異なる住所、30回の通話履歴、2回のギフトのやり取り、というという特徴61を有する場合、当該ユーザペア間の関係性の親密度(すなわち、親密度スコア)は低くなる。このように、図6Aの例のように、同性別きょうだいであるユーザAとユーザBであっても、当該ユーザのペアで共有される他の特徴により、当該ペアの関係性の親密度は異なるものとなる。関係性の親密度の高いペアは、互いの社会的距離が近く、高い影響を有することが観察される。一方、関係性の親密度の低いペアは、互いの社会的距離が遠く、近しい関係にないことが観察される。
【0046】
本実施形態では、ユーザペアに対する親密度スコアを、スコア予測モデル112を用いて予測する。図6Bに、スコア予測モデル112の概略アーキテクチャを示す。スコア予測モデル112は、ユーザペアの特徴63を入力として、当該特徴63に対する親密度スコア64を予測する学習モデルである。
【0047】
スコア予測モデル112は例えば、弱教師付き学習(Weak Supervised Learning)を行う学習モデルであり、例えば、畳み込みニューラルネットワーク(CNN)による学習モデルである。本実施形態では、スコア予測モデル112は、図6Aに示したような、ユーザペアに対する複数の特徴に対して付された親密度スコア(0~1)を教師データとして学習された学習モデルとする。例えば、学習段階では、教師データとしては、図6Aの特徴60に設定された1に近い親密度スコアと、特徴61に設定された0に近い親密度スコアといった組み合わせデータが使用される。当該学習処理は学習部108により実施される。なお、スコア予測モデル112は、ユーザペアの関係性の種別毎に異なってよく、一の関係性の種別に応じてトレーニングされた学習モデルであってよい。
【0048】
なお、本実施形態では、ユーザペアに対する親密度スコアを、スコア予測モデル112を用いて予測したが、グラフ作成部102は、他の手法により、当該スコアを予測するように構成されてもよい。
【0049】
以上の処理により、複数のユーザ間で明示的リンクまたは暗示的リンクが形成され、各リンク間では親密度スコアが割り当てられ、関係性グラフが作成される。関係性グラフの概念図を図7に示す。各ユーザ71~73それぞれは複数の特徴を有し、ユーザのペアに対しては上記のように予測された親密度スコアが割り当てられる。
【0050】
[ユーザ属性の推定処理]
次に、本実施形態によるユーザ属性の推定処理について説明する。本実施形態では、属性推定部105が、学習済みの属性予測モデル111を用いて、対象のユーザのユーザ属性を推定する。図8に、属性予測モデル111の概略アーキテクチャを示す。属性予測モデル111は、例えば、畳み込みニューラルネットワーク(CNN)による学習モデルであってよく、例えば、Variational Autoencoder(VAE)による学習モデルであってよい。属性予測モデル111は、対象ユーザのユーザ特徴と、作成された関係性グラフに基づいて識別された、当該対象ユーザと親密度スコアの高い他の1以上のユーザ(関連ユーザ)のユーザ特徴とを入力として、当該対象ユーザの属性を推定する。例えば、親密度スコアが所定の閾値より高い他の1以上のユーザのユーザ特徴が入力される。上述のように、当該対象ユーザのユーザ特徴は、対象ユーザ特徴設定部103により属性推定部105に設定され、関連ユーザのユーザ特徴は、関連ユーザ特徴設定部104により設定される。
【0051】
学習段階では、学習部106は、ユーザ特徴と、当該ユーザ特徴に紐づけられた、または過去に推定されたユーザ属性(正解データ(ラベル))との組み合わせを教師データとして用いて、属性予測モデル111を学習させる。ここで、組み合わせに含まれるユーザ特徴には、関係性の種別が付加されてもよい。
本実施形態では、推定されるユーザ属性は、例えば、消費行動に関する属性を表し、当該ユーザのある1日における行動パターンや、趣味や嗜好、頻繁に利用するサービスや購入する所品のタイプ、ライフスタイル、家族の中の役割等を表す。また、推定されるユーザ属性は、例えば、ユーザの金融資産や経済状況に関する属性を表してよい。また、推定されるユーザ属性は、デモグラフィック属性であってよく、サイコグラフィック属性であってよく、ジオグラフィック属性であってよく、ビヘイビオラル属性であってよい。なお、ここでのデモグラフィック属性は、デモグラフィック情報に含まれない情報を指す。
【0052】
推定段階では、属性推定部105は、対象ユーザのユーザ特徴と、作成された関係性グラフに基づいて識別された当該対象ユーザと関連ユーザのユーザ特徴を、属性予測モデル111に入力し、当該対象ユーザの属性を推定する。本実施形態では、図8に示すように、対象ユーザのユーザ特徴82と、当該対象ユーザの配偶者のユーザ特徴83、および当該対象ユーザの親のユーザ特徴84が、属性予測モデル111に入力され、当該対象ユーザの属性85が推定される。ここで、属性推定部105は、関連ユーザのユーザ特徴と、対象ユーザと関連ユーザの関係性の種別と、を属性予測モデル111に入力してもよい。
【0053】
図8では、対象ユーザの属性を推定するために、各ユーザについて、デモグラフィック情報(性別、年齢、居住地域、職業、家族構成等の人口統計学的なユーザ属性)、所定のウェブサービスでの購入履歴、所定のウェブサービスのサービス利用状況が用いられている。なお、属性予測モデル111への入力データは図8に示したデータ(デモグラフィック情報、購入履歴、サービス利用状況)に限定されず、各ユーザが有しうる全ての特徴のデータが属性予測モデル111に入力されてもよい。また、対象ユーザ特徴設定部103および関連ユーザ特徴設定部104は、推定すべきユーザ属性に応じて、属性予測モデル111へ入力するユーザ特徴を決定し、属性推定部105に設定してもよい。
【0054】
また、関連ユーザのユーザ特徴については、重みづけして用いてもよい。例えば、親密度スコアが高いユーザのユーザ特徴については高い重みづけを付与し、親密度スコアが低いユーザのユーザ特徴については低い重みづけを付与して、属性予測モデル111に入力してもよい。
【0055】
[情報処理装置10のハードウェア構成]
図9は、本実施形態による情報処理装置10のハードウェア構成の一例を示すブロック図である。
本実施形態による情報処理装置10は、単一または複数の、あらゆるコンピュータ、モバイルデバイス、または他のいかなる処理プラットフォーム上にも実装することができる。
図9を参照して、情報処理装置10は、単一のコンピュータに実装される例が示されているが、本実施形態による情報処理装置10は、複数のコンピュータを含むコンピュータシステムに実装されてよい。複数のコンピュータは、有線または無線のネットワークにより相互通信可能に接続されてよい。
【0056】
図9に示すように、情報処理装置10は、CPU91と、ROM92と、RAM93と、HDD94と、入力部95と、表示部96と、通信I/F97と、システムバス98とを備えてよい。情報処理装置10はまた、外部メモリを備えてよい。
CPU(Central Processing Unit)91は、情報処理装置10における動作を統括的に制御するものであり、データ伝送路であるシステムバス98を介して、各構成部(92~97)を制御する。
【0057】
ROM(Read Only Memory)92は、CPU91が処理を実行するために必要な制御プログラム等を記憶する不揮発性メモリである。なお、当該プログラムは、HDD(Hard Disk Drive)94、SSD(Solid State Drive)等の不揮発性メモリや着脱可能な記憶媒体(不図示)等の外部メモリに記憶されていてもよい。
RAM(Random Access Memory)93は、揮発性メモリであり、CPU91の主メモリ、ワークエリア等として機能する。すなわち、CPU91は、処理の実行に際してROM92から必要なプログラム等をRAM93にロードし、当該プログラム等を実行することで各種の機能動作を実現する。図2に示す学習モデル記憶部110とユーザ特徴記憶部120は、RAM93で構成されうる。
【0058】
HDD94は、例えば、CPU91がプログラムを用いた処理を行う際に必要な各種データや各種情報等を記憶している。また、HDD94には、例えば、CPU91がプログラム等を用いた処理を行うことにより得られた各種データや各種情報等が記憶される。
入力部95は、キーボードやマウス等のポインティングデバイスにより構成される。
表示部96は、液晶ディスプレイ(LCD)等のモニターにより構成される。表示部86は、入力部95と組み合わせて構成されることにより、GUI(Graphical User Interface)として機能してもよい。
【0059】
通信I/F97は、情報処理装置10と外部装置との通信を制御するインタフェースである。
通信I/F97は、ネットワークとのインタフェースを提供し、ネットワークを介して、外部装置との通信を実行する。通信I/F97を介して、外部装置との間で各種データや各種パラメータ等が送受信される。本実施形態では、通信I/F87は、イーサネット(登録商標)等の通信規格に準拠する有線LAN(Local Area Network)や専用線を介した通信を実行してよい。ただし、本実施形態で利用可能なネットワークはこれに限定されず、無線ネットワークで構成されてもよい。この無線ネットワークは、Bluetooth(登録商標)、ZigBee(登録商標)、UWB(Ultra Wide Band)等の無線PAN(Personal Area Network)を含む。また、Wi-Fi(Wireless Fidelity)(登録商標)等の無線LAN(Local Area Network)や、WiMAX(登録商標)等の無線MAN(Metropolitan Area Network)を含む。さらに、LTE/3G、4G、5G等の無線WAN(Wide Area Network)を含む。なお、ネットワークは、各機器を相互に通信可能に接続し、通信が可能であればよく、通信の規格、規模、構成は上記に限定されない。
【0060】
図2に示す情報処理装置10の各要素のうち少なくとも一部の機能は、CPU91がプログラムを実行することで実現することができる。ただし、図2に示す情報処理装置10の各要素のうち少なくとも一部の機能が専用のハードウェアとして動作するようにしてもよい。この場合、専用のハードウェアは、CPU91の制御に基づいて動作する。
【0061】
[ユーザ装置11のハードウェア構成]
図1に示すユーザ装置11のハードウェア構成は、図9と同様でありうる。すなわち、ユーザ装置10は、CPU91と、ROM92と、RAM93と、HDD94と、入力部95と、表示部96と、通信I/F97と、システムバス98とを備えうる。ユーザ装置11は、情報処理装置10により提供された各種情報を、表示部96に表示し、GUI(入力部95と表示部96による構成)を介してユーザから受け付ける入力操作に対応する処理を行うことができる。
【0062】
<処理の流れ>
図10に、本実施形態による情報処理装置10により実行される処理のフローチャートを示す。図9に示す処理は、情報処理装置10のCPU91がROM92等に格納されたプログラムをRAM93にロードして実行することによって実現されうる。図10の説明のために、図1に示した情報処理システムを参照する。学習部106により学習済みの、属性予測モデル111およびスコア予測モデル112は、学習モデル記憶部110に格納されているものとする。
【0063】
S101において、ユーザ特徴取得部101は、ユーザ装置11-1~11-Nから、各ユーザのユーザ特徴を取得し、ユーザ特徴121としてユーザ特徴記憶部120に格納する。S101の処理は、過去の一定の期間におけるユーザ特徴の取得(収集)処理であってもよい。
【0064】
S102において、グラフ作成部102は、ユーザ特徴取得部101により取得された各種ユーザ特徴を用いて、ユーザ1~Nについての関係性グラフを作成する。関係性グラフの作成手順は、上述の通りである。
【0065】
S103において、対象ユーザ特徴設定部103は、ユーザ1~Nの中から、属性推定の対象となるユーザ(対象ユーザ)の設定を行う。前述のように、当該対象ユーザは、操作者が入力部95による入力操作により設定されてもよいし、予めシステムにおいて設定されていてもよいし、ROM92やRAM93に格納されている任意のプログラムによって設定されてもよい。さらに、S103において、対象ユーザ特徴設定部103は、当該対象ユーザのユーザ特徴を、ユーザ特徴121から取得して属性推定部105に設定する。
【0066】
S104において、関連ユーザ特徴設定部104は、グラフ作成部102により作成された関係性グラフに基づいて、当該対象ユーザと親密度スコア(後述)の高い他の1以上のユーザを、関連ユーザとして決定する。さらに、関連ユーザ特徴設定部104は、当該関連ユーザのユーザ特徴を、ユーザ特徴121から取得して属性推定部105に設定する。
【0067】
S105において、属性推定部105は、S103とS104で設定された、当該対象ユーザのユーザ特徴と当該関連ユーザのユーザ特徴を、属性予測モデル111に入力し、当該対象ユーザの属性を推定する。
【0068】
S106において、出力部107は、S105で推定された対象ユーザの属性の結果(推定結果)を出力する。出力部107は、推定された対象ユーザの属性に関する情報を生成して、外部装置(不図示)へ出力してもよい。
【0069】
このように、情報処理装置10は、複数のユーザのユーザ特徴から、ユーザ間の社会的関係性を示す関係性グラフネットワーク(関係性グラフ)を作成し、当該関係性グラフに基づいて、対象ユーザの属性を推定する。これにより、例えば、ユーザ属性を利用したマーケティングを展開することが可能となる。
【0070】
例えば、関係性グラフに基づいて決定された関連ユーザが、ペットフードの購買履歴により、ペットを飼っているという属性と関連付けられていた場合、当該関連ユーザと配偶者として関連付けられた対象ユーザは、同様に、ペットを飼っているという属性が推定される。このような場合、対象ユーザに対して、ペットに関するあらゆる広告を提示することにより、広告効果が向上しうる。
【0071】
なお、上記において特定の実施形態が説明されているが、当該実施形態は単なる例示であり、本発明の範囲を限定する意図はない。本明細書に記載された装置及び方法は上記した以外の形態において具現化することができる。また、本発明の範囲から離れることなく、上記した実施形態に対して適宜、省略、置換及び変更をなすこともできる。かかる省略、置換及び変更をなした形態は、請求の範囲に記載されたもの及びこれらの均等物の範疇に含まれ、本発明の技術的範囲に属する。
【符号の説明】
【0072】
1~N:ユーザ、10:情報処理装置、11-1~11-N:ユーザ装置、101:ユーザ特徴取得部、102:グラフ作成部、103:対象ユーザ特徴設定部、104:関連ユーザ特徴設定部、105:属性推定部、106:学習部、107:出力部、110:学習モデル記憶部、111:属性予測モデル、112:スコア予測モデル、120:ユーザ特徴記憶部、121:ユーザ特徴
図1
図2
図3
図4A
図4B
図4C
図4D
図5A
図5B
図6A
図6B
図7
図8
図9
図10