特許7567942 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7567942情報処理装置、制御方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-07

(45)【発行日】2024-10-16

(54)【発明の名称】情報処理装置、制御方法及びプログラム

(51)【国際特許分類】

G06F 16/906 20190101AFI20241008BHJP

【ＦＩ】

G06F16/906

【請求項の数】 10

(21)【出願番号】P 2022576934

(86)(22)【出願日】2021-01-25

(86)【国際出願番号】 JP2021002432

(87)【国際公開番号】W WO2022157969

(87)【国際公開日】2022-07-28

【審査請求日】2023-07-21

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100107331

【弁理士】

【氏名又は名称】中村聡延

(74)【代理人】

【識別番号】100104765

【弁理士】

【氏名又は名称】江上達夫

(74)【代理人】

【識別番号】100131015

【弁理士】

【氏名又は名称】三輪浩誉

(72)【発明者】

【氏名】草野元紀

(72)【発明者】

【氏名】小山田昌史

(72)【発明者】

【氏名】董于洋

(72)【発明者】

【氏名】野澤拓磨

【審査官】甲斐哲雄

(56)【参考文献】

【文献】特開２０１０－１９１５６４（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１３／０３２８８８０（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｆ１６／００－１６／９５８

(57)【特許請求の範囲】

【請求項1】

第１データセットに特化したユーザの特徴量である第１データセット特化特徴量と、第２データセットに特化したユーザの特徴量である第２データセット特化特徴量とを取得する特徴量取得手段と、
前記第１データセット特化特徴量及び前記第２データセット特化特徴量を、夫々、前記第１データセット及び前記第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換する普遍特徴量変換手段と、
前記第１データセットに対する前記普遍特徴量と前記第２データセットに対する前記普遍特徴量とに基づいて、前記第１データセットと前記第２データセットとで関連するユーザを特定する関連ユーザ特定手段と、
を備える情報処理装置。

【請求項2】

前記普遍特徴量変換手段は、前記第１データセット及び前記第２データセット間において普遍の前記ユーザのパラメータである第１ユーザパラメータを表す行列と、前記第１データセット又は前記第２データセットに特化した前記ユーザのパラメータである第２ユーザパラメータを表す行列とを含む形式に前記第１データセット特化特徴量の行列及び前記第２データセット特化特徴量の行列を夫々行列分解することで得られる前記第１ユーザパラメータを、前記普遍特徴量として算出する、請求項１に記載の情報処理装置。

【請求項3】

前記普遍特徴量変換手段は、前記第１ユーザパラメータ及び前記第２ユーザパラメータを含む目的関数の最適化により得られる前記第１ユーザパラメータを、前記普遍特徴量として算出する、請求項２に記載の情報処理装置。

【請求項4】

前記普遍特徴量変換手段は、
前記第１データセットの前記第１ユーザパラメータをＰ^ｓ _１、前記第１データセットの前記第２ユーザパラメータをＰ^ｓ _２、前記第２データセットの前記第１ユーザパラメータをＰ^ｔ _１、前記第２データセットの前記第２ユーザパラメータをＰ^ｔ _２とした場合、
前記第１データセット特化特徴量の行列Ｘ^ｓと、前記第２データセット特化特徴量の行列Ｘ^ｔとを夫々行列分解した以下の式が成立する場合に最小となる前記目的関数を最小化する前記最適化を実行する、請求項３に記載の情報処理装置。

【請求項5】

前記普遍特徴量変換手段は、前記第１データセット特化特徴量と、前記第２データセット特化特徴量とを、同一の特徴空間に変換した前記普遍特徴量を夫々算出する、請求項１～４のいずれか一項に記載の情報処理装置。

【請求項6】

前記第１データセットと、前記第２データセットとには、前記ユーザの共通する属性の情報が含まれていない、請求項１～５のいずれか一項に記載の情報処理装置。

【請求項7】

前記普遍特徴量に基づき、前記第１データセットのユーザと前記第２データセットに対するユーザとの間の類似度を算出する類似度算出手段をさらに有し、
前記関連ユーザ特定手段は、前記類似度に基づき、前記第１データセットと前記第２データセットとで関連するユーザを特定する、請求項１～６のいずれか一項に記載の情報処理装置。

【請求項8】

前記関連ユーザ特定手段は、前記第１データセットのユーザと前記第２データセットのユーザとを、前記第１データセットのユーザと前記第２データセットのユーザとの間の前記類似度に応じた確率により、関連するユーザとして特定する、請求項７に記載の情報処理装置。

【請求項9】

コンピュータが、
第１データセットに特化したユーザの特徴量である第１データセット特化特徴量と、第２データセットに特化したユーザの特徴量である第２データセット特化特徴量を取得し、
前記第１データセット特化特徴量及び前記第２データセット特化特徴量を、夫々、前記第１データセット及び前記第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換し、
前記第１データセットに対する前記普遍特徴量と前記第２データセットに対する前記普遍特徴量とに基づいて、前記第１データセットと前記第２データセットとで関連するユーザを特定する、
制御方法。

【請求項10】

第１データセットに特化したユーザの特徴量である第１データセット特化特徴量と、第２データセットに特化したユーザの特徴量である第２データセット特化特徴量を取得し、
前記第１データセット特化特徴量及び前記第２データセット特化特徴量を、夫々、前記第１データセット及び前記第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換し、
前記第１データセットに対する前記普遍特徴量と前記第２データセットに対する前記普遍特徴量とに基づいて、前記第１データセットと前記第２データセットとで関連するユーザを特定する処理をコンピュータに実行させるプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、データの処理に関する情報処理装置、制御方法及び記憶媒体の技術分野に関する。

【背景技術】

【0002】

複数のユーザに関するデータから関連するユーザのデータを特定する方法の一例が特許文献１に開示されている。特許文献１には、複数の評価対象についての評価データを、ネットワークを介して受信し、複数のユーザの中の第１ユーザと、この第１ユーザの評価データと類似する評価傾向を有する第２ユーザとを関連付けて管理する方法が開示されている。また、非特許文献１には、行列分解を最適化により実行する手法が開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２０－０３８７２７号公報

【非特許文献】

【0004】

【文献】Li, B.; Yang, Q.; and Xue, X. 2009a. Can movies and books collaborate? cross-domain collaborative filtering for sparsity reduction. In IJCAI, 2052‐2057.

【発明の概要】

【発明が解決しようとする課題】

【0005】

個人情報保護の観点から、氏名などの個人情報やＣｏｏｋｉｅを用いた従来のユーザ連携手法が利用できない場合がある。一方、特許文献１では、人手でのルールベースで趣味嗜好等に関するユーザ属性を抽出している。しかし、データが大量である場合には人手の作業が膨大となり作業コストが過多となるという問題があった。

【0006】

本開示の目的は、上述した課題を鑑み、異なるデータセット間において関連するユーザを好適に特定することが可能な情報処理装置、制御方法及び記憶媒体を提供することである。

【課題を解決するための手段】

【0007】

情報処理装置の一の態様は、
第１データセットに特化したユーザの特徴量である第１データセット特化特徴量と、第２データセットに特化したユーザの特徴量である第２データセット特化特徴量とを取得する特徴量取得手段と、
前記第１データセット特化特徴量及び前記第２データセット特化特徴量を、夫々、前記第１データセット及び前記第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換する普遍特徴量変換手段と、
前記第１データセットに対する前記普遍特徴量と前記第２データセットに対する前記普遍特徴量とに基づいて、前記第１データセットと前記第２データセットとで関連するユーザを特定する関連ユーザ特定手段と、
を備える情報処理装置である。

【0008】

制御方法の一の態様は、
コンピュータが、
第１データセットに特化したユーザの特徴量である第１データセット特化特徴量と、第２データセットに特化したユーザの特徴量である第２データセット特化特徴量を取得し、
前記第１データセット特化特徴量及び前記第２データセット特化特徴量を、夫々、前記第１データセット及び前記第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換し、
前記第１データセットに対する前記普遍特徴量と前記第２データセットに対する前記普遍特徴量とに基づいて、前記第１データセットと前記第２データセットとで関連するユーザを特定する、
制御方法である。

【0009】

プログラムの一の態様は、
第１データセットに特化したユーザの特徴量である第１データセット特化特徴量と、第２データセットに特化したユーザの特徴量である第２データセット特化特徴量を取得し、
前記第１データセット特化特徴量及び前記第２データセット特化特徴量を、夫々、前記第１データセット及び前記第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換し、
前記第１データセットに対する前記普遍特徴量と前記第２データセットに対する前記普遍特徴量とに基づいて、前記第１データセットと前記第２データセットとで関連するユーザを特定する処理をコンピュータに実行させるプログラムである。

【発明の効果】

【0010】

異なるデータセット間において関連するユーザを好適に特定することができる。

【図面の簡単な説明】

【0011】

【図1】第１実施形態におけるユーザ連携システムの概略構成を示す。

【図2】情報処理装置のハードウェア構成の一例を示す。

【図3】第１実施形態における情報処理装置に関する機能ブロック図の一例である。

【図4】写像ｈ^ｓの概要を表す図である。

【図5】写像φ^ｓ及び写像φ^ｔの概要を表す図である。

【図6】写像ｓｉｍ及び写像Ｓｙｎｃの概要を表す図である。

【図7】（Ａ）スーパーマーケットでの購入履歴を表す第１データセットのデータ構造の一例である。（Ｂ）インターネットでの閲覧履歴を表す第２データセットのデータ構造の一例である。（Ｃ）サイト毎に紐付けられたタグを表すテーブル情報の一例である。

【図8】（Ａ）図７（Ａ）に示す第１データセットから算出したデータセット特化特徴量の一例を示す。（Ｂ）図７（Ｂ）に示す第２データセット及び図７（Ｃ）に示すテーブル情報から算出したデータセット特化特徴量の一例を示す。

【図9】図８（Ａ）に示されるデータセット特化特徴量と図８（Ｂ）に示されるデータセット特化特徴量とを普遍特徴量に変換する処理の概要を表す図である。

【図10】（Ａ）関連付けられるユーザの購入履歴データを示す。（Ｂ）関連付けられるユーザの閲覧履歴データを示す。

【図11】ユーザ連携処理の手順を示すフローチャートの一例である。

【図12】第２実施形態における情報処理装置のブロック構成図である。

【図13】第２実施形態におけるフローチャートの一例である。

【発明を実施するための形態】

【0012】

以下、図面を参照しながら、情報処理装置、制御方法及び記憶媒体の実施形態について説明する。

【0013】

＜第１実施形態＞
（１）全体構成
図１は、第１実施形態におけるユーザ連携システム１００の概略構成を示す。ユーザ連携システム１００は、複数のデータセットにおいて関連するユーザの連携（関連するユーザの特定及び関連付け）を行う。ユーザ連携システム１００は、情報処理装置１と、記憶装置２と、を備える。

【0014】

情報処理装置１は、記憶装置２に記憶された第１データセット「Ｄｓ」と第２データセット「Ｄｔ」とにおいて関連するユーザ（「関連ユーザ」とも呼ぶ。）の特定を行い、特定した関連ユーザに関する情報を関連ユーザ情報「Ｉｕ」として記憶装置２に記憶する。なお、情報処理装置１は、複数の装置から構成されてもよい。この場合、複数の装置は、クラウドコンピューティング技術などを用いて、割り当てられた処理を実行し、割り当てられた処理に必要な情報の授受を行ってもよい。

【0015】

記憶装置２は、情報処理装置１が実行する処理に必要な各種情報を記憶するメモリである。記憶装置２は、情報処理装置１に接続又は内蔵されたハードディスクなどの外部記憶装置であってもよく、フラッシュメモリなどの記憶媒体であってもよい。また、記憶装置２は、情報処理装置１とデータ通信を行う１又は複数のサーバ装置であってもよい。記憶装置２は、第１データセットＤｓと、第２データセットＤｔと、関連ユーザ情報Ｉｕとを記憶する。記憶装置２は、複数の装置から構成される場合、これらの情報を分散して記憶してもよい。

【0016】

第１データセットＤｓ及び第２データセットＤｔは、ユーザ毎のデータの集合であり、データセット間においてユーザが関連付けられていないデータとなる。例えば、第１データセットＤｓ及び第２データセットＤｔには、夫々のデータセット内においてのみユーザを一意に識別可能なユーザＩＤが含まれている。第１データセットＤｓ及び第２データセットＤｔは、例えば、ユーザ毎の行動履歴（例えば、購入履歴、ウェブ検索履歴等）のデータベースであってもよく、ユーザ毎のアンケート結果、ＳＮＳ（ＳｏｃｉａｌＮｅｔｗｏｒｋｉｎｇＳｅｒｖｉｃｅ）において公開されているユーザ毎のコメント（文章）情報、画像データ等であってもよい。また、第１データセットＤｓ及び第２データセットＤｔは、異なる主体（会社、個人、自治体等）が生成したデータであってもよく、同一の主体であって異なる部門（例えば営業部門とマーケティング部門等）が夫々生成したデータであってもよい。

【0017】

また、第１データセットＤｓと第２データセットＤｔには、データセット間で共通するユーザの属性（即ちデータセット間のユーザを結び付ける属性）の情報が含まれていない。上記の属性は、例えば、性別、年齢、居住地域、所得、職業、家族構成などの人口統計学的な属性（デモグラフィック属性）及びその他の個人情報などが該当する。この場合であっても、情報処理装置１は、後述する方法により、第１データセットＤｓと第２データセットＤｔとで関連するユーザを好適に特定する。

【0018】

関連ユーザ情報Ｉｕは、第１データセットＤｓと第２データセットＤｔとで関連するユーザを関連付けた情報である。関連ユーザ情報Ｉｕは、例えば、関連ユーザとして特定された第１データセットＤｓのユーザＩＤと第２データセットＤｔのユーザＩＤとを対応付けたテーブル情報である。関連ユーザ情報Ｉｕは、後述するユーザ連携処理を情報処理装置１が実行することで生成される。なお、関連ユーザとして関連付けられるユーザは、夫々のデータセットにおいて異なるユーザＩＤで登録された同一人物に限らず、属性が類似する別人物であってもよい。

【0019】

（２）ハードウェア構成
図２は、情報処理装置１のハードウェア構成の一例を示す。情報処理装置１は、ハードウェアとして、プロセッサ１１と、メモリ１２と、インターフェース１３とを含む。プロセッサ１１、メモリ１２及びインターフェース１３は、データバス１０を介して接続されている。

【0020】

プロセッサ１１は、メモリ１２に記憶されているプログラム等を実行することにより、所定の処理を実行する。プロセッサ１１は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＧＰＵ（ＧｒａｐｈｉｃｓＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、ＴＰＵ（ＴｅｎｓｏｒＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）などのプロセッサである。プロセッサ１１は、複数のプロセッサから構成されてもよい。プロセッサ１１は、コンピュータの一例である。

【0021】

メモリ１２は、ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）などの、作業メモリとして使用される各種の揮発性メモリ及び情報処理装置１の処理に必要な情報を記憶する不揮発性メモリにより構成される。なお、メモリ１２は、情報処理装置１に接続又は内蔵されたハードディスクなどの外部記憶装置を含んでもよく、着脱自在なフラッシュメモリなどの記憶媒体を含んでもよい。メモリ１２には、情報処理装置１が本実施形態における各処理を実行するためのプログラムが記憶される。なお、メモリ１２は、記憶装置２又は記憶装置２の一部として機能し、第１データセットＤｓ、第２データセットＤｔ、関連ユーザ情報Ｉｕの少なくともいずれかを記憶してもよい。

【0022】

インターフェース１３は、情報処理装置１と他の装置とを電気的に接続するためのインターフェースである。これらのインターフェースは、他の装置とデータの送受信を無線により行うためのネットワークアダプタなどのワイアレスインタフェースであってもよく、他の装置とケーブル等により接続するためのハードウェアインターフェースであってもよい。

【0023】

なお、情報処理装置１のハードウェア構成は、図２に示す構成に限定されない。例えば、情報処理装置１は、ユーザ入力を受け付けるための入力部、ディスプレイやスピーカなどの出力部などをさらに備えてもよい。

【0024】

（３）ユーザ連携処理
情報処理装置１が実行するユーザ連携処理について説明する。概略的には、情報処理装置１は、第１データセットＤｓと第２データセットＤｔとに夫々特化したユーザの特徴量を共通の特徴空間の特徴量に変換し、変換後の特徴量の類似度に基づいてユーザ連携を行う。これにより、情報処理装置１は、異なるデータセット間のユーザ連携を好適に実行する。

【0025】

（３－１）機能ブロック
図３は、第１実施形態におけるユーザ連携処理に関する情報処理装置１の機能ブロック図の一例である。図３に示すように、情報処理装置１のプロセッサ１１は、機能的には、特徴量算出部１５と、普遍特徴量変換部１６と、類似度算出部１７と、関連ユーザ特定部１８とを有する。なお、図３では、データの授受が行われるブロック同士を実線により結んでいるが、データの授受が行われるブロックの組合せは図３に限定されない。後述する他の機能ブロックの図においても同様である。

【0026】

特徴量算出部１５は、各データセットから、各データセットにおいてユーザを表現した数値ベクトルである特徴量を算出する。この特徴量の算出方法は任意であり、具体例については後述する。特徴量算出部１５が算出する特徴量は、データセットごとに特化した特徴量であり、以後では「データセット特化特徴量」とも呼ぶ。特徴量算出部１５は、第１データセットＤｓに対するデータセット特化特徴量と、第２データセットＤｔに対するデータセット特化特徴量とを夫々算出し、算出結果を普遍特徴量変換部１６に供給する。

【0027】

普遍特徴量変換部１６は、特徴量算出部１５が算出した第１データセットＤｓのデータセット特化特徴量と、第２データセットＤｔのデータセット特化特徴量とを、共通の特徴空間において普遍的に表現した特徴量（「普遍特徴量」とも呼ぶ。）に変換する。普遍特徴量変換部１６によるデータセット特化特徴量から普遍特徴量への変換処理は任意であり、普遍特徴量変換部１６の処理の具体例については後述する。

【0028】

類似度算出部１７は、普遍特徴量変換部１６が出力した第１データセットＤｓの普遍特徴量と第２データセットＤｔの普遍特徴量との類似度を、第１データセットＤｓのユーザと第２データセットＤｔのユーザとの間の全ての組み合わせにおいて算出する。この類似度の算出方法は任意であり、具体例については後述する。

【0029】

関連ユーザ特定部１８は、類似度算出部１７が算出した第１データセットＤｓのユーザと第２データセットＤｔのユーザとの類似度に基づき関連ユーザを特定し、特定結果に基づき関連ユーザ情報Ｉｕを生成する。上述の類似度から関連ユーザを特定する方法は任意であり、具体例については後述する。

【0030】

ここで、特徴量算出部１５、普遍特徴量変換部１６、類似度算出部１７及び関連ユーザ特定部１８の各構成要素は、例えば、プロセッサ１１がプログラムを実行することによって実現できる。また、必要なプログラムを任意の不揮発性記憶媒体に記録しておき、必要に応じてインストールすることで、各構成要素を実現するようにしてもよい。なお、これらの各構成要素の少なくとも一部は、プログラムによるソフトウェアで実現することに限ることなく、ハードウェア、ファームウェア、及びソフトウェアのうちのいずれかの組合せ等により実現してもよい。また、これらの各構成要素の少なくとも一部は、例えばＦＰＧＡ（Field-Programmable Gate Array）又はマイクロコントローラ等の、ユーザがプログラミング可能な集積回路を用いて実現してもよい。この場合、この集積回路を用いて、上記の各構成要素から構成されるプログラムを実現してもよい。また、各構成要素の少なくとも一部は、ＡＳＳＰ（Application Specific Standard Produce）、ＡＳＩＣ（Application Specific Integrated Circuit）又は量子プロセッサ（量子コンピュータ制御チップ）により構成されてもよい。このように、各構成要素は、種々のハードウェアにより実現されてもよい。以上のことは、後述する他の実施の形態においても同様である。さらに、これらの各構成要素は、例えば、クラウドコンピューティング技術などを用いて、複数のコンピュータの協働によって実現されてもよい。

【0031】

（３－２）特徴量算出部の処理
特徴量算出部１５によるデータセット特化特徴量の具体的な算出方法について説明する。特徴量算出部１５は、例えば、第１データセットＤｓに対し、次の式（１）に示す写像「ｈ^ｓ」を実現する処理を行う。

【数1】

ここで、「Ｄ^ｓ」は、第１データセットＤｓの（即ち生データの）空間を表し、「ｄ^ｓ _ｉ」は、ユーザｉ（ｉ∈Ｕ^ｓ、Ｕ^ｓは第１データセットＤｓに登録されたユーザ集合）に関するデータを表す。また、「ｘ^ｓ _ｉ」は、データｄ^ｓ _ｉから算出される、第１データセットＤｓに特化したデータセット特化特徴量、「Ｍ_ｓ」は、第１データセットＤｓに特化したデータセット特化特徴量の特徴空間の次元を夫々表す。この場合、第１データセットＤｓに特化したデータセット特化特徴量の集合である「Ｘ^ｓ」は、以下の式（２）のように表される。

【0032】

【数2】

第１データセットＤｓのデータセット特化特徴量Ｘ^ｓは、「第１データセット特化特徴量」の一例である。

【0033】

図４は、写像ｈ^ｓの概要を表す図である。図４では、生データである第１データセットＤｓ（＝｛ｄ^ｓ _１，ｄ^ｓ _２，…，ｄ^ｓ _ｍ｝）が、特徴量算出部１５により、データセット特化特徴量（Ｘ^ｓ＝｛ｘ^ｓ _１，ｘ^ｓ _２，…，ｘ^ｓ _ｍ｝）に変換されている。

【0034】

また、特徴量算出部１５は、第２データセットＤｔについても同様に、次の式（３）に示す写像「ｈ^ｔ」を実現する処理を行う。

【0035】

【数3】

ここで、「Ｄ^ｔ」は、第２データセットＤｔの空間を表し、「ｄ^ｔ _ｊ」は、ユーザｊ（ｊ∈Ｕ^ｔ、Ｕ^ｔは第２データセットＤｔに登録されたユーザ集合）に関するデータを表す。また、「ｘ^ｔ _ｊ」は、データｄ^ｔ _ｊから算出される、第２データセットＤｔに特化したデータセット特化特徴量を表し、「Ｍ_ｔ」は、第２データセットＤｔに特化したデータセット特化特徴量の特徴空間の次元を夫々表す。この場合、第２データセットＤｔに特化したデータセット特化特徴量の集合である「Ｘ^ｔ」は、以下の式（４）のように表される。

【0036】

【数4】

第２データセットＤｔのデータセット特化特徴量Ｘ^ｔは、「第２データセット特化特徴量」の一例である。

【0037】

次に、データセット特化特徴量の算出方法の具体例について説明する。

【0038】

例えば、特徴量算出部１５は、データセット特化特徴量の算出対象となるデータセットが商品の購入、サイトの閲覧、音楽の視聴などの行動履歴（即ち、ユーザがアクションしたアイテムの系列）である場合、ＢｏＷ（ＢａｇｏｆＷｏｒｄｓ）、ＴＦ－ＩＤＦ、ＯｋａｐｉＢＭ２５などを適用することで、データセット特化特徴量を算出する。他の例では、特徴量算出部１５は、データセット特化特徴量の算出対象となるデータセットが文章（コメント）の集合である場合、Ｄｏｃ２Ｖｅｃ、ＳＣＤＶ（ＳｐａｒｓｅＣｏｍｐｏｓｉｔｅＤｏｃｕｍｅｎｔＶｅｃｔｏｒｓ）、ＢｏＷ、ＴＦ－ＩＤＦ、ＯｋａｐｉＢＭ２５などを適用することで、データセット特化特徴量を算出する。

【0039】

また、特徴量算出部１５は、データセット特化特徴量の算出対象となるデータセットが画像を含む場合には、深層学習などにより学習済みの特徴抽出器に上述の画像を入力することで得られる特徴抽出結果を、データセット特化特徴量として取得してもよい。また、特徴量算出部１５は、ＳＮＳにおける投稿（文章・画像）をデータセットとする場合、投稿と一緒に付けられたタグに対し、上述のＢｏＷ、ＴＦ－ＩＤＦ、ＯｋａｐｉＢＭ２５などを適用することで、データセット特化特徴量を算出してもよい。このように、特徴量算出部１５は、アイテムそのものに限らず、アイテムに付随する属性を用いてデータセット特化特徴量を算出してもよい。この具体例については、「（４）具体例」のセクションにおいて説明する。

【0040】

なお、特徴量算出部１５は、データセットが選択式アンケート結果などの数値データである場合、当該数値データをデータセット特化特徴量として扱ってもよい。この場合、特徴量算出部１５は、データセットに対して恒等写像を行ったデータセット特化特徴量を取得している。

【0041】

（３－３）普遍特徴量変換部の処理
次に、第１データセットＤｓ及び第２データセットＤｔの各データセット特化特徴量を普遍特徴量に変換する普遍特徴量変換部１６の処理について説明する。普遍特徴量変換部１６は、特徴量算出部１５が算出した第１データセットＤｓのデータセット特化特徴量Ｘ^ｓに対し、以下の式（５）に示される写像「φ^ｓ」を実現する処理を行う。

【0042】

【数5】

ここで、「ｐ^ｓ _ｉ」は、第１データセットＤｓのユーザｉのデータセット特化特徴量ｘ^ｓ _ｉから算出される普遍特徴量を表し、「Ｍ」は、普遍特徴量の特徴空間の次元を表す。

【0043】

同様に、普遍特徴量変換部１６は、特徴量算出部１５が算出した第２データセットＤｔのデータセット特化特徴量Ｘ^ｔに対し、以下の式（６）に示される写像「φ^ｔ」を実現する処理を行う。

【0044】

【数6】

ここで、「ｐ^ｔ _ｊ」は、第２データセットＤｔのユーザｊのデータセット特化特徴量ｘ^ｔ _ｊから算出される普遍特徴量を表す。

【0045】

図５は、写像φ^ｓ及び写像φ^ｔの概要を表す図である。図５では、第１データセットＤｓの特徴空間で表されたデータセット特化特徴量（Ｘ^ｓ＝｛ｘ^ｓ _１，ｘ^ｓ _２，…，ｘ^ｓ _ｍ｝）が写像φ^ｓにより普遍特徴量｛ｐ^ｓ _１，ｐ^ｓ _２，ｐ^ｓ _３，…｝に変換され、第２データセットＤｔの特徴空間で表されたデータセット特化特徴量（Ｘ^ｔ＝｛ｘ^ｔ _１，ｘ^ｔ _２，…，ｘ^ｔ _ｎ｝）が写像φ^ｓにより普遍特徴量｛ｐ^ｔ _１，ｐ^ｔ _２，…｝に変換されている。ここで、第１データセットＤｓの普遍特徴量｛ｐ^ｓ _１，ｐ^ｓ _２，ｐ^ｓ _３，…｝及び第２データセットＤｔの普遍特徴量｛ｐ^ｔ _１，ｐ^ｔ _２，…｝は、いずれも共通する特徴空間（即ちデータセットに普遍な特徴空間）において表されている。

【0046】

次に、普遍特徴量の具体的な算出方法について説明する。以下の具体例では、データセットに普遍のユーザのパラメータ（「第１ユーザパラメータ」とも呼ぶ。）とデータセットに特化したユーザのパラメータ（「第２ユーザパラメータ」とも呼ぶ。）とを含む目的関数の最適化を行うことで求めた第１ユーザパラメータを、普遍特徴量として求める。この第１ユーザパラメータは、第１データセットＤｓの普遍特徴量を表す行列と第２データセットＤｔの普遍特徴量を表す行列とを、第１ユーザパラメータのブロック及び第２ユーザパラメータのブロックを有する区分行列を含む形式に行列分解した場合の第１ユーザパラメータの近似解に相当する。

【0047】

普遍特徴量変換部１６は、データセット特化特徴量を表す行列を、ユーザの特徴量行列「Ｐ」とアイテムの特徴量行列「Ｑ」と次元を揃える行列「Σ」を用いて「ＰΣＱ^Ｔ」の形式に行列分解する。具体的には、普遍特徴量変換部１６は、データセット特化特徴量Ｘ^ｓ及びデータセット特化特徴量Ｘ^ｔについて、以下の式（７）及び式（８）に示す行列分解を行う。

【0048】

【数7】

【0049】

ここで、ユーザの特徴量行列Ｐは、式（７）では、「Ｐ^ｓ _１」、「Ｐ^ｓ _２」をブロック（小行列）とする区分行列として表され、式（８）では、「Ｐ^ｔ _１」、「Ｐ^ｔ _２」をブロックとする区分行列として表される。また、行列Σは、式（７）では、「Σ_１１」、「Σ^ｓ _１２」、「Σ^ｓ _２１」、「Σ^ｓ _２２」をブロック（小行列）とする区分行列として表され、式（８）では、「Σ_１１」、「Σ^ｔ _１２」、「Σ^ｔ _２１」、「Σ^ｔ _２２」をブロックとする区分行列として表されている。また、アイテムの特徴量行列Ｑは、式（７）では、「Ｑ^ｓ _１」、「Ｑ^ｓ _２」をブロック（小行列）とする区分行列として表され、式（８）では、「Ｑ^ｔ _１」、「Ｑ^ｔ _２」をブロックとする区分行列として表される。

【0050】

この場合、式（７）及び式（８）において、ユーザの特徴量行列の小行列Ｐ^ｓ _１及びＰ^ｔ _１は、共通する行列Σの小行列Σ_１１の演算対象となっており、データセットに普遍な第１ユーザパラメータを要素とする行列となる。なお、小行列Σ_１１のサイズ（行数及び列数）は、例えば、メモリ１２等に予め記憶された適合値に設定される。一方、ユーザの特徴量行列の小行列Ｐ^ｓ _２及びＰ^ｔ _２は、データセットごとに固有の行列Σの小行列（Σ^ｓ _２１、Σ^ｓ _２２、Σ^ｔ _２１、Σ^ｔ _２２）の演算対象となっており、データセットに特化した第２ユーザパラメータを要素とする行列となる。

【0051】

従って、この場合、写像φ^ｓは、以下の式（９）に示すように、第１データセットＤｓのユーザｉのデータセット特化特徴量ｘ^ｓ _ｉを第１ユーザパラメータＰ^ｓ _１に変換する写像として表される。同様に、写像φ^ｔは、以下の式（１０）に示すように、第２データセットＤｔのユーザｊのデータセット特化特徴量ｘ^ｔ _ｊを第１ユーザパラメータＰ^ｔ _１に変換する写像として表される。

【0052】

【数8】

【0053】

従って、普遍特徴量変換部１６は、式（７）、式（８）に示す形式に第１データセットＤｓのデータセット特化特徴量Ｘ^ｓ及び第２データセットＤｔのデータセット特化特徴量Ｘ^ｔを行列分解することで得られる第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１を、普遍特徴量として算出する。ここでは、一例として、普遍特徴量変換部１６は、式（７）及び式（８）が成立する場合に最小となる目的関数を設定し、当該目的関数を最小化する最適化問題を解く。具体的には、普遍特徴量変換部１６は、以下の式（１１）の最適化問題を解く。

【0054】

【数9】

【0055】

式（１１）では、普遍特徴量変換部１６は、式（７）の右辺と左辺の差のノルムと、式（８）の右辺と左辺の差のノルムとの和を目的関数として、当該目的関数を最小化するような第２ユーザパラメータ（即ちＰ^ｓ _１及びＰ^ｔ _１）を算出している。これにより、普遍特徴量変換部１６は、第１データセットＤｓ及び第２データセットＤｔに対する普遍特徴量を好適に算出することができる。

【0056】

なお、普遍特徴量変換部１６は、式（１１）に示される最適化により、式（７）及び式（８）の第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１を求めたが、第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１の算出方法はこれに限定されない。これに代えて、普遍特徴量変換部１６は、勾配法などの任意の近似解法を用いて式（７）及び式（８）の行列分解の近似解を求めることで、第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１を求めてもよい。この場合であっても、普遍特徴量変換部１６は、普遍特徴量となる第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１を好適に求めることができる。また、一般的に、任意の形式の行列分解の最適化問題をニューラルネットワークとみなし、行列分解の最適値をＰｙＴｏｒｃｈなどの任意の深層学習ライブラリにより解くことが可能である。よって、普遍特徴量変換部１６は、任意の深層学習ライブラリにより、式（７）、式（８）に示す行列分解の解を求めることで、普遍特徴量となる第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１を取得してもよい。

【0057】

次に、関連ユーザとなる第１データセットＤｓのユーザと第２データセットＤｔのユーザの組み合わせの一部が既に事前知識により判明している場合について説明する。この場合、普遍特徴量変換部１６は、式（１１）に示す目的関数において、事前知識により関連ユーザであると判明しているユーザ同士の第１ユーザパラメータ（即ち普遍特徴量）が一致する場合に最小値０となる項を設ける。具体的には、関連ユーザであると判明している一方の第１データセットＤｓのユーザの第１ユーザパラメータを表す行列を「Ｐ^ｓ _１［ｔｒ］」とし、他方の第２データセットＤｔのユーザの普遍特徴量を表す行列を「Ｐ^ｔ _１［ｔｒ］」とすると、普遍特徴量変換部１６は、以下の式（１２）の最適化問題を解く。

【0058】

【数10】

ここで、「λ」は正則化パラメータであり「λ＞０」に設定される。式（１２）に示すように目的関数を設定することで、既に判明している関連ユーザの組に関する事前知識を好適に活用し、第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１を的確に算出することができる。

【0059】

また、普遍特徴量変換部１６は、上記目的関数において、事前知識により関連ユーザであると判明しているユーザu（∈Ｕ^ｔｒ）と、第１データセットＤｓにおいてユーザuと類似している第１データセットＤｓのユーザｕ’（∈Ｕ^ｓ）に対し、類似ユーザへの疑似的な連携を許容した第１ユーザパラメータ（即ち普遍特徴量）を求める項を設けてもよい。具体的には、第１データセットＤｓ内でのユーザｕとユーザｕ’の類似度を「Ｓ^ｓ _ｕｕ’」とし、関連ユーザであると判明している一方の第１データセットＤｓのユーザｕと第１データセットＤｓ内で類似度がＳ^ｓ _ｕｕ’となるユーザｕ’の第１ユーザパラメータを「Ｐ^ｓ _１[ｕ’]」とし、他方の第２データセットＤｔのユーザｕの普遍特徴量を「Ｐ^ｔ _１［ｕ］」とすると、普遍特徴量変換部１６は、以下の式（１３）の最適化問題を解く。

【0060】

【数11】

ここで、「λ」は正則化パラメータであり「λ＞０」に設定される。「Ｓ^ｓ _ｕｕ’」は第１データセットＤｓ内でのユーザｕとｕ’の類似度であり、同一データセット内における類似度計算は容易に可能である。式（１３）に示すように目的関数を設定することで、既に判明している関連ユーザとそのユーザと類似するユーザの組に関する事前知識を好適に活用し、第１ユーザパラメータＰ^ｓ _１及びＰ^ｔ _１を的確に算出することができる。

【0061】

（３－４）類似度算出部の処理
類似度算出部１７は、第１データセットＤｓのユーザと第２データセットＤｔのユーザとの全ての組み合わせに対する普遍特徴量の組（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）の類似度を算出する。この場合、類似度算出部１７は、以下の写像「ｓｉｍ」を実現する処理を行う。

【0062】

【数12】

例えば、類似度算出部１７は、コサイン類似度（＜ｐ^ｓ _ｉ，ｐ^ｔ _ｊ＞／｜ｐ^ｓ _ｉ｜｜ｐ^ｔ _ｊ｜）により、普遍特徴量の組（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）に対する類似度を算出する。他の例では、類似度算出部１７は、ガウス類似度（ｅｘｐ（－α｜ｐ^ｓ _ｉ－ｐ^ｔ _ｊ｜^２）（α＞０））により、普遍特徴量の組（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）に対する類似度を算出する。さらに別の例では、類似度算出部１７は、以下に例示されるように、普遍特徴量の組（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）間の距離「ｄ（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）」から定まる類似度により、普遍特徴量の組（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）に対する類似度を算出する。
ｓｉｍ（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）＝１－ｄ（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）
ｓｉｍ（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）＝｛１＋ｄ（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）｝^－１

【0063】

なお、距離ｄ（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ）は、Ｌ^２距離であってもよく、ジェンセン・シャノン情報量であってもよい。また、類似度算出部１７は、相加平均、幾何平均、調和平均、複比ユニノルムなどの集約関数を用いて、上述した任意の方法で算出する複数の類似度の算出結果を集約した１つの類似度を算出してもよい。

【0064】

（３－５）関連ユーザ特定部の処理
次に、関連ユーザ特定部１８による関連ユーザの特定及び関連付けについて説明する。関連ユーザ特定部１８は、以下の写像「Ｓｙｎｃ」を実現する処理を行う。

【0065】

【数13】

【0066】

図６は、写像ｓｉｍ及び写像Ｓｙｎｃの概要を表す図である。図６では、まず、第１データセットＤｓの各データ｛ｄ^ｓ _１，ｄ^ｓ _２，…，ｄ^ｓ _ｍ｝と第２データセットＤｔの各データ｛ｄ^ｔ _１，…，ｄ^ｔ _ｎ｝との全ての組み合わせに対する普遍特徴量の類似度「Ｓ_ｉｊ」（＝ｓｉｍ（ｐ^ｓ _ｉ，ｐ^ｔ _ｊ））が算出される。そして、関連ユーザ特定部１８は、第１データセットＤｓの各データ｛ｄ^ｓ _１，ｄ^ｓ _２，…，ｄ^ｓ _ｍ｝と第２データセットＤｔの各データ｛ｄ^ｔ _１，…，ｄ^ｔ _ｎ｝との全ての組み合わせに対する類似度Ｓ_ｉｊに基づき、第１データセットＤｓのユーザｉに関連するユーザ｛ｊ_１，…，ｊ_ｋ｝を特定する。図６の右図では、関連ユーザとして特定されたユーザの組に対応するデータ同士を線により結んでいる。ここで、第１データセットＤｓのユーザと第２データセットＤｔのユーザとの対応関係は、１対１に限られず、複数対１、又は、１対複数であってもよい。また、いずれのユーザとも対応付けられないユーザが存在してもよい。

【0067】

次に、関連ユーザの特定方法の具体例について説明する。例えば、関連ユーザ特定部１８は、第１データセットＤｓのユーザｉ（∈Ｕ^ｓ）に対し、類似度が一番大きい第２データセットＤｔのユーザが関連ユーザであると判定する。この場合、第１データセットＤｓの各ユーザに対して１人の第２データセットＤｔのユーザが関連ユーザとして特定される。他の例では、関連ユーザ特定部１８は、第１データセットＤｓのユーザｉ（∈Ｕ^ｓ）に対し、予め定めた閾値以上の類似度となる第２データセットＤｔのユーザが関連ユーザであると判定する。この場合、第１データセットＤｓの各ユーザに対して誰も関連ユーザが特定されない場合や複数人が関連ユーザとして特定される場合がある。さらに別の例では、関連ユーザ特定部１８は、第１データセットＤｓの各ユーザに対し、類似度が高い上位所定人数（１人以上）の第２データセットＤｔのユーザを、関連ユーザとして特定する。さらに別の例では、関連ユーザ特定部１８は、Ｇａｌｅ－Ｓｈａｐｌｅｙアルゴリズムなどの二部グラフに対するマッチングアルゴリズムに基づき、第１データセットＤｓのユーザに関連する第２データセットＤｔのユーザを特定してもよい。

【0068】

また、関連ユーザ特定部１８は、確率的手法に基づき、上述の類似度から関連ユーザの特定を行ってもよい。この場合、関連ユーザとして特定される第２データセットＤｔのユーザの分布を「μ_ｕ」とすると、写像Ｓｙｎｃは、以下の式により表される。

【0069】

【数14】

ここで、分布μ_ｕは、一様分布であってもよく、類似度に応じた分布であってもよい。例えば、ｓｏｆｔ－ｍａｘ関数を用いた場合、類似度に応じた分布μ_ｕは、以下の式により表される。

【0070】

【数15】

この場合、例えば、関連ユーザ特定部１８は、第１データセットＤｓのユーザＡに対し、上述の式に基づき「０．９」となる第２データセットＤｔのユーザＢが存在する場合、９０％の確率でユーザＡとユーザＢとを関連ユーザとして特定する。一方、関連ユーザ特定部１８は、第１データセットＤｓのユーザＡに対し、上述の式に基づき「０．１」となる第２データセットＤｔのユーザＣが存在する場合、１０％の確率でユーザＡとユーザＣとを関連ユーザとして特定する。このように、関連ユーザ特定部１８は、第１データセットＤｓのユーザと第２データセットＤｔのユーザとを、これらのユーザ間の類似度に応じた確率により、関連ユーザとして特定してもよい。

【0071】

以上の例によれば、関連ユーザ特定部１８は、類似度算出部１７が算出した類似度に基づき、関連ユーザを好適に特定し、これらのユーザを関連付けた関連ユーザ情報Ｉｕを好適に生成することができる。

【0072】

（４）具体例
次に、上述したユーザ連携処理の具体例について図面を参照して説明する。

【0073】

図７（Ａ）は、あるスーパーマーケットでの購入履歴を表す第１データセットＤｓのデータ構造の一例であり、図７（Ｂ）は、インターネットでの閲覧履歴を表す第２データセットＤｔのデータ構造の一例である。図７（Ｃ）は、サイト（Ｗｅｂサイト、広告を含む）毎に紐付けられたタグを表すテーブル情報の一例である。

【0074】

以後では、「ｄ^ｓ _ｉ＝（ａ^ｓ _１，…，ａ^ｓ _ｍ）∈Ｄ^ｓ」は、ユーザｉの購入履歴データを表し、「ａ^ｓ _ｌ」はスーパーマーケットで売られている商品を表す。また、「ｄ^ｔ _ｉ＝（ａ^ｔ _１，…，ａ^ｔ _ｍ）∈Ｄ^ｔ」は、ユーザｊの閲覧履歴データを表し、「ａ^ｔ _ｌ」はインターネットで閲覧できるサイトを表す。図７（Ｃ）に示すように、各サイトには、タグが紐付けられている。

【0075】

図８（Ａ）は、図７（Ａ）に示す第１データセットＤｓから算出したデータセット特化特徴量の一例を示し、図８（Ｂ）は、図７（Ｂ）に示す第２データセットＤｔ及び図７（Ｃ）に示すテーブル情報から算出したデータセット特化特徴量の一例を示す。

【0076】

図８（Ａ）の例では、特徴量算出部１５は、図７（Ａ）に示す第１データセットＤｓの各ユーザｉの購入履歴データｄ^ｓ _ｉに対し、式（１）に示される写像ｈ^ｓの一例としてＴＦ－ＩＤＦを適用することで、各ユーザｉに対するデータセット特化特徴量ｘ^ｓ _ｉ（∈Ｒ^Ｍｓ）を算出している。そして、図８（Ａ）に示すテーブル全体は、データセット特化特徴量Ｘ^ｓ（式（２）参照）に相当する。

【0077】

また、図８（Ｂ）の例では、特徴量算出部１５は、図７（Ｂ）に示す第２データセットＤｔの各ユーザｊの閲覧履歴データｄ^ｔ _ｊに対応するタグの集合に対し、式（３）に示される写像ｈ^ｔの一例であるＴＦ－ＩＤＦを適用することで、各ユーザｊに対するデータセット特化特徴量ｘ^ｔ _ｊ（∈Ｒ^Ｍｔ）を算出している。そして、図８（Ｂ）に示すテーブル全体は、データセット特化特徴量行列Ｘ^ｔ（式（４）参照）に相当する。

【0078】

図９は、図８（Ａ）に示すテーブルに相当するデータセット特化特徴量Ｘ^ｓと図８（Ｂ）に示すテーブルに相当するデータセット特化特徴量Ｘ^ｔとを普遍特徴量に変換する処理の概要を表す図である。図９では、普遍特徴量変換部１６は、図８（Ａ）に示すテーブルに相当するデータセット特化特徴量Ｘ^ｓを、式（５）に示される写像φ^ｓを用い、普遍特徴量ｐ^ｓ _ｉ（ｐ^ｓ _１、ｐ^ｓ _２、ｐ^ｓ _３、…）に変換している。また、普遍特徴量変換部１６は、図８（Ｂ）に示すテーブルに相当するデータセット特化特徴量Ｘ^ｔを、式（６）に示される写像φ^ｔを用い、普遍特徴量ｐ^ｔ _ｉ（ｐ^ｔ _１、ｐ^ｔ _２、ｐ^ｔ _３、…）に変換している。この場合、普遍特徴量変換部１６は、例えば、図８（Ａ）に示すテーブルに相当するデータセット特化特徴量Ｘ^ｓと図８（Ｂ）に示すテーブルに相当するデータセット特化特徴量Ｘ^ｔとを夫々行列とみなし、これらの行列を行列分解するための式（１１）に示される最適化問題を解くことで、上述の普遍特徴量ｐ^ｓ _ｉ、ｐ^ｔ _ｉを算出する。

【0079】

その後、類似度算出部１７は、例えば、コサイン類似度等を用いて第１データセットＤｓのユーザｉと第２データセットＤｔのユーザｊとの全ての組み合わせに対する類似度を算出し、関連ユーザ特定部１８は、当該類似度が閾値（例えば０．９５）以上となるユーザの組み合わせを関連ユーザとして特定する。

【0080】

図１０（Ａ）及び図１０（Ｂ）は、関連ユーザ特定部１８が関連するユーザとして特定したユーザのデータの組み合わせを示す。図１０（Ａ）は、ユーザＩＤ「ｓ０１」の購入履歴データを示し、図１０（Ｂ）は、ユーザＩＤ「ｔ０８」、「ｔ１２」、「ｔ３３」の閲覧履歴データを示す。ここでは、関連ユーザ特定部１８は、ユーザＩＤ「ｓ０１」の普遍特徴量と閾値（ここでは０．９５）以上の類似度となる普遍特徴量を有する第２データセットＤｔのユーザＩＤ「ｔ０８」、「ｔ１２」、「ｔ３３」を関連ユーザとして特定している。よって、この場合、関連ユーザ特定部１８は、ユーザＩＤ「ｓ０１」と、ユーザＩＤ「ｔ０８」、「ｔ１２」、「ｔ３３」とを関連付けた関連ユーザ情報Ｉｕを生成する。

【0081】

このように、本具体例では、情報処理装置１は、スーパーマーケットのデータセットとインターネットの閲覧履歴のデータセットとの間において関連するユーザを的確に特定し、関連ユーザ情報Ｉｕを生成することができる。そして、購入履歴とウェブ閲覧履歴とのユーザ連携を行うことで、推薦精度向上やマーケティング施策などに役立てることができる。

【0082】

なお、ユーザ連携を行うデータセットの組み合わせはこの具体例に限定されない。例えば、自社と競合他社との同種のデータセットを対象とした場合には、競合分析などに好適に役立てることができる。また、広告配信側のデータセットと広告提供側のデータセットを対象とした場合には、広告の測定効果に好適に役立てることができる。

【0083】

（５）処理フロー
図１１は、情報処理装置１が実行するユーザ連携処理の手順を示すフローチャートの一例である。

【0084】

まず、情報処理装置１の特徴量算出部１５は、インターフェース１３を介し、記憶装置２から第１データセットＤｓ及び第２データセットＤｔを取得する（ステップＳ１１）。そして、特徴量算出部１５は、第１データセットＤｓに特化したデータセット特化特徴量、及び、第２データセットＤｔに特化したデータセット特化特徴量を夫々算出する（ステップＳ１２）。この場合、特徴量算出部１５は、第１データセットＤｓに対して式（１）に示す写像ｈ^ｓを実現する処理を行い、第２データセットＤｔに対して式（３）に示す写像ｈ^ｔを実現する処理を行う。

【0085】

次に、普遍特徴量変換部１６は、第１データセットＤｓに特化したデータセット特化特徴量及び第２データセットＤｔに特化したデータセット特化特徴量を、夫々、普遍特徴量に変換する（ステップＳ１３）。この場合、普遍特徴量変換部１６は、第１データセットＤｓのデータセット特化特徴量に対して式（５）に示す写像φ^ｓを実現する処理を行い、第２データセットＤｔのデータセット特化特徴量に対して式（６）に示す写像φ^ｔを実現する処理を行う。

【0086】

次に、類似度算出部１７は、第１データセットＤｓのユーザと第２データセットＤｔのユーザとの間の類似度を算出する（ステップＳ１４）。この場合、類似度算出部１７は、第１データセットＤｓのユーザと第２データセットＤｔのユーザとの全ての組み合わせに対し、対応する普遍特徴量に基づく類似度を算出する。

【0087】

そして、関連ユーザ特定部１８は、ステップＳ１４で算出された類似度に基づき、関連ユーザ情報Ｉｕを生成する（ステップＳ１５）。この場合、関連ユーザ特定部１８は、ステップＳ１４で算出された類似度に基づき、第１データセットＤｓのユーザと関連する第２データセットＤｔのユーザを特定し、その特定結果を表す関連ユーザ情報Ｉｕを生成する。

【0088】

以上説明したように、本実施形態によれば、情報処理装置１は、ユーザＩＤの管理が異なるデータセット間のユーザ連携を好適に実行することができる。この場合、情報処理装置１は、データが大量かつ煩雑で人手では対応できないデータセットのユーザ連携についても自動で実行することができる。また、情報処理装置１は、ユーザの氏名やデモグラフィック属性などの個人情報及びＣｏｏｋｉｅなどが諸々の規制で入手できない場合であっても、これらの情報を必要とすることなく、データセット間のユーザ連携を好適に実行することができる。

【0089】

＜第２実施形態＞
図１２は、第２実施形態における情報処理装置１Ｘのブロック構成図である。図１２に示すように、情報処理装置１Ｘは、主に、特徴量取得手段１５Ｘと、普遍特徴量変換手段１６Ｘと、関連ユーザ特定手段１８Ｘとを有する。情報処理装置１Ｘは、複数の装置から構成されてもよい。

【0090】

特徴量取得手段１５Ｘは、第１データセットに特化したユーザの特徴量である第１データセット特化特徴量と、第２データセットに特化したユーザの特徴量である第２データセット特化特徴量を取得する。この場合、特徴量取得手段１５Ｘは、第１及び第２データセットから夫々第１及び第２データセット特化特徴量を算出してもよく、データセット毎に予め算出された第１及び第２データセット特化特徴量をメモリ又は外部装置から取得（受信）してもよい。前者の特徴量取得手段１５Ｘは、例えば、第１実施形態における特徴量算出部１５とすることができる。

【0091】

普遍特徴量変換手段１６Ｘは、第１データセット特化特徴量及び第２データセット特化特徴量を、夫々、第１データセット及び第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換する。普遍特徴量変換手段１６Ｘは、例えば、第１実施形態における普遍特徴量変換部１６とすることができる。

【0092】

関連ユーザ特定手段１８Ｘは、第１データセットに対する普遍特徴量と第２データセットに対する普遍特徴量とに基づいて、第１データセットと第２データセットとで関連するユーザを特定する。関連ユーザ特定手段１８Ｘは、例えば、類似度算出部１７及び関連ユーザ特定部１８とすることができる。

【0093】

なお、関連ユーザ特定手段１８Ｘは、例えば、第１データセットのユーザ毎の普遍特徴量と、第２データセットのユーザ毎の普遍特徴量とが入力された場合に、データセット間で関連すると推定されるユーザの組み合わせを出力する推論器を用いて、第１データセットと第２データセットとで関連するユーザを特定してもよい。この場合、関連ユーザ特定手段１８Ｘは、機械学習等に基づき予め学習された上述の推論器のパラメータが記憶されたメモリ等を参照して上述の推論器を構成することで、上述のユーザの特定を行う。

【0094】

図１３は、第２実施形態において情報処理装置１Ｘが実行するフローチャートの一例である。まず、特徴量取得手段１５Ｘは、第１データセット及び第２データセットの各々に特化したユーザの特徴量であるデータセット特化特徴量を取得する（ステップＳ２１）。普遍特徴量変換手段１６Ｘは、データセット特化特徴量を、第１データセット及び第２データセット間において普遍な特徴空間における特徴量である普遍特徴量に変換する（ステップＳ２２）。関連ユーザ特定手段１８Ｘは、第１データセットに対する普遍特徴量と第２データセットに対する普遍特徴量とに基づいて、第１データセットと第２データセットとで関連するユーザを特定する（ステップＳ２３）。

【0095】

第２実施形態によれば、情報処理装置１Ｘは、異なるデータセット間で関連するユーザを個人情報等を必要とすることなく好適に特定することができる。

【0096】

以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。すなわち、本願発明は、請求の範囲を含む全開示、技術的思想にしたがって当業者であればなし得るであろう各種変形、修正を含むことは勿論である。また、引用した上記の特許文献等の各開示は、本書に引用をもって繰り込むものとする。

【符号の説明】

【0097】

１、１Ｘ情報処理装置
２記憶装置
１１プロセッサ
１２メモリ
１３インターフェース
１００ユーザ連携システム

【図1】