(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-11-05
(45)【発行日】2024-11-13
(54)【発明の名称】情報処理装置及び情報処理方法
(51)【国際特許分類】
G06Q 30/02 20230101AFI20241106BHJP
【FI】
G06Q30/02
(21)【出願番号】P 2024033800
(22)【出願日】2024-03-06
【審査請求日】2024-03-06
【早期審査対象出願】
(73)【特許権者】
【識別番号】000208891
【氏名又は名称】KDDI株式会社
(74)【代理人】
【識別番号】110004222
【氏名又は名称】弁理士法人創光国際特許事務所
(72)【発明者】
【氏名】山崎 悠大
(72)【発明者】
【氏名】黒川 茂莉
(72)【発明者】
【氏名】山口 求
(72)【発明者】
【氏名】浅川 善則
【審査官】深津 始
(56)【参考文献】
【文献】特開2006-018340(JP,A)
【文献】竹之内 隆夫,川村 隆浩,大須賀 昭彦,クラウド上での事業者間データ連携のための分散型パーソナル情報保護エージェント,情報処理学会論文誌 論文誌ジャーナル,日本,一般社団法人情報処理学会,2012年11月15日,第53巻,第11号,第2432-2444ページ,ISSN:1882-7837
(58)【調査した分野】(Int.Cl.,DB名)
G06Q 10/00 -G06Q 99/00
(57)【特許請求の範囲】
【請求項1】
第1事業者が収集した、ユーザの属性を示す属性情報である第1属性情報を含む第1情報群と、前記第1事業者とは異なる第2事業者が収集した、ユーザの属性を示す属性情報である第2属性情報を含む第2情報群とを取得する第1取得部と、
前記第1情報群に含まれる第1属性情報に基づいて属性情報のクラスタリングを行い、前記第1情報群に対応するクラスタである第1クラスタを複数生成するとともに、前記第2情報群に含まれる前記第2属性情報に基づいて属性情報のクラスタリングを行い、前記第2情報群に対応するクラスタである第2クラスタを複数生成する生成部と、
属性情報の入力に対して複数のクラスタを結合するためのパラメータ
であって、前記属性情報を有する人物の特性を示す一以上の前記パラメータを出力する機械学習モデルに、複数の前記第1クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第1クラスタそれぞれの前記パラメータである第1パラメータを取得するとともに、前記機械学習モデルに、複数の前記第2クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第2クラスタそれぞれに対応する前記パラメータである第2パラメータを取得する第2取得部と、
複数の前記第1クラスタそれぞれの前記第1パラメータと、複数の前記第2クラスタそれぞれの前記第2パラメータとに基づいて、複数の前記第1クラスタの少なくともいずれかに、一以上の前記第2クラスタを結合する結合部と、
を有する情報処理装置。
【請求項2】
前記生成部は、クラスタリングによりまとめられた属性の値の範囲を示す範囲情報が関連付けられた前記第1クラスタ及び前記第2クラスタを生成し、
前記第2取得部は、前記属性と前記属性に対応する前記範囲情報との入力に対して複数のクラスタを結合するためのパラメータを出力する前記機械学習モデルに対し、複数の前記第1クラスタそれぞれに対応する前記属性と、当該属性に対応する前記範囲情報とを入力することにより、前記機械学習モデルから前記第1パラメータを取得するとともに、前記機械学習モデルに対し、複数の前記第2クラスタそれぞれに対応する前記属性と、当該属性に対応する前記範囲情報とを入力することにより、前記機械学習モデルから前記第2パラメータを取得する、
請求項1に記載の情報処理装置。
【請求項3】
前記第1クラスタが示す属性情報を有するユーザの端末に対し、前記第1クラスタと結合された前記第2クラスタが示す属性情報に対応する情報を配信する配信部をさらに有する、
請求項1に記載の情報処理装置。
【請求項4】
前記生成部は、生成した前記第1クラスタが示す属性情報と、前記第1情報群に含まれる複数のレコードそれぞれの属性情報との合致度に基づいて複数のレコードそれぞれに対応するユーザが前記第1クラスタに属する度合いを示す第1クラスタ帰属度を算出し、
前記配信部は、前記第1クラスタに対する前記第1クラスタ帰属度が相対的に高いユーザの端末に対し、優先的に前記第1クラスタと結合された前記第2クラスタが示す属性情報に対応する情報を配信する、
請求項
3に記載の情報処理装置。
【請求項5】
前記第1取得部は、前記第1事業者が使用する第1装置から前記第1情報群を取得するとともに、前記第2事業者が使用する第2装置から第2情報群を取得し、
前記結合部により結合された前記第1クラスタと前記第2クラスタとの組合せを示す情報を前記第1装置及び前記第2装置の少なくともいずれかに送信する送信部をさらに有する、
請求項1に記載の情報処理装置。
【請求項6】
コンピュータが実行する、
第1事業者が収集した、ユーザの属性を示す属性情報である第1属性情報を含む第1情報群と、前記第1事業者とは異なる第2事業者が収集した、ユーザの属性を示す属性情報である第2属性情報を含む第2情報群とを取得するステップと、
前記第1情報群に含まれる第1属性情報に基づいて属性情報のクラスタリングを行い、前記第1情報群に対応するクラスタである第1クラスタを複数生成するとともに、前記第2情報群に含まれる前記第2属性情報に基づいて属性情報のクラスタリングを行い、前記第2情報群に対応するクラスタである第2クラスタを複数生成するステップと、
属性情報の入力に対して複数のクラスタを結合するためのパラメータ
であって、前記属性情報を有する人物の特性を示す一以上の前記パラメータを出力する機械学習モデルに、複数の前記第1クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第1クラスタそれぞれの前記パラメータである第1パラメータを取得するとともに、前記機械学習モデルに、複数の前記第2クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第2クラスタそれぞれに対応する前記パラメータである第2パラメータを取得するステップと、
複数の前記第1クラスタそれぞれの前記第1パラメータと、複数の前記第2クラスタそれぞれの前記第2パラメータとに基づいて、複数の前記第1クラスタの少なくともいずれかに、一以上の前記第2クラスタを結合するステップと、
を有する情報処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、情報処理装置及び情報処理方法に関する。
【背景技術】
【0002】
従来、複数の事業者からユーザに関する情報であるユーザ情報を収集し、収集した情報を結合してデータ分析を行うことが実施されている。例えば、特許文献1には、複数のユーザ情報を結合するための結合キーに基づいて、複数の事業者それぞれに対応するユーザの個人情報に関するデータを結合するシステムが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ユーザの個人情報を保護するために、ユーザ情報を匿名化することが行われている。複数の事業者それぞれがユーザ情報を匿名化していると、これらのユーザ情報を結合することができず、データ分析を行うことができないという問題が発生する。
【0005】
そこで、本発明はこれらの点に鑑みてなされたものであり、匿名化されている複数のユーザ情報を結合できるようにすることを目的とする。
【課題を解決するための手段】
【0006】
本発明の第1の態様に係る情報処理装置は、第1事業者が収集した、ユーザの属性を示す属性情報である第1属性情報を含む第1情報群と、前記第1事業者とは異なる第2事業者が収集した、ユーザの属性を示す属性情報である第2属性情報を含む第2情報群とを取得する第1取得部と、前記第1情報群に含まれる第1属性情報に基づいて属性情報のクラスタリングを行い、前記第1情報群に対応するクラスタである第1クラスタを複数生成するとともに、前記第2情報群に含まれる前記第2属性情報に基づいて属性情報のクラスタリングを行い、前記第2情報群に対応するクラスタである第2クラスタを複数生成する生成部と、属性情報の入力に対して複数のクラスタを結合するためのパラメータを出力する機械学習モデルに、複数の前記第1クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第1クラスタそれぞれの前記パラメータである第1パラメータを取得するとともに、前記機械学習モデルに、複数の前記第2クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第2クラスタそれぞれに対応する前記パラメータである第2パラメータを取得する第2取得部と、複数の前記第1クラスタそれぞれの前記第1パラメータと、複数の前記第2クラスタそれぞれの前記第2パラメータとに基づいて、複数の前記第1クラスタの少なくともいずれかに、一以上の前記第2クラスタを結合する結合部と、を有する。
【0007】
前記第2取得部は、前記属性情報の入力に対して、前記属性情報を有する人物の特性を示す一以上の前記パラメータを出力する前記機械学習モデルを用いて、複数の前記第1クラスタそれぞれに対応する一以上の前記第1パラメータを取得するとともに、複数の前記第2クラスタそれぞれに対応する一以上の前記第2パラメータを取得してもよい。
【0008】
前記生成部は、クラスタリングによりまとめられた属性の値の範囲を示す範囲情報が関連付けられた前記第1クラスタ及び前記第2クラスタを生成し、前記第2取得部は、前記属性と前記属性に対応する前記範囲情報との入力に対して複数のクラスタを結合するためのパラメータを出力する前記機械学習モデルに対し、複数の前記第1クラスタそれぞれに対応する前記属性と、当該属性に対応する前記範囲情報とを入力することにより、前記機械学習モデルから前記第1パラメータを取得するとともに、前記機械学習モデルに対し、複数の前記第2クラスタそれぞれに対応する前記属性と、当該属性に対応する前記範囲情報とを入力することにより、前記機械学習モデルから前記第2パラメータを取得してもよい。
【0009】
前記情報処理装置は、前記第1クラスタが示す属性情報を有するユーザの端末に対し、前記第1クラスタと結合された前記第2クラスタが示す属性情報に対応する情報を配信する配信部をさらに有してもよい。
【0010】
前記生成部は、生成した前記第1クラスタが示す属性情報と、前記第1情報群に含まれる複数のレコードそれぞれの属性情報との合致度に基づいて複数のレコードそれぞれに対応するユーザが前記第1クラスタに属する度合いを示す第1クラスタ帰属度を算出し、前記配信部は、前記第1クラスタに対する前記第1クラスタ帰属度が相対的に高いユーザの端末に対し、優先的に前記第1クラスタと結合された前記第2クラスタが示す属性情報に対応する情報を配信してもよい。
【0011】
前記第1取得部は、前記第1事業者が使用する第1装置から前記第1情報群を取得するとともに、前記第2事業者が使用する第2装置から第2情報群を取得し、前記情報処理装置は、前記結合部により結合された前記第1クラスタと前記第2クラスタとの組合せを示す情報を前記第1装置及び前記第2装置の少なくともいずれかに送信する送信部をさらに有してもよい。
【0012】
本発明の第2の態様に係る情報処理方法は、コンピュータが実行する、第1事業者が収集した、ユーザの属性を示す属性情報である第1属性情報を含む第1情報群と、前記第1事業者とは異なる第2事業者が収集した、ユーザの属性を示す属性情報である第2属性情報を含む第2情報群とを取得するステップと、前記第1情報群に含まれる第1属性情報に基づいて属性情報のクラスタリングを行い、前記第1情報群に対応するクラスタである第1クラスタを複数生成するとともに、前記第2情報群に含まれる前記第2属性情報に基づいて属性情報のクラスタリングを行い、前記第2情報群に対応するクラスタである第2クラスタを複数生成するステップと、属性情報の入力に対して複数のクラスタを結合するためのパラメータを出力する機械学習モデルに、複数の前記第1クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第1クラスタそれぞれの前記パラメータである第1パラメータを取得するとともに、前記機械学習モデルに、複数の前記第2クラスタそれぞれに対応する前記属性情報を入力し、前記機械学習モデルから前記複数の前記第2クラスタそれぞれに対応する前記パラメータである第2パラメータを取得するステップと、複数の前記第1クラスタそれぞれの前記第1パラメータと、複数の前記第2クラスタそれぞれの前記第2パラメータとに基づいて、複数の前記第1クラスタの少なくともいずれかに、一以上の前記第2クラスタを結合するステップと、を有する。
【発明の効果】
【0013】
本発明によれば、匿名化されている複数のユーザ情報を結合することができるという効果を奏する。
【図面の簡単な説明】
【0014】
【
図1】情報処理システムの概要を説明する図である。
【
図3】第1情報群及び第2情報群の一例を示す図である。
【
図4】
図3に示す第1情報群から生成された第1クラスタの例を示す図である。
【
図5】
図3に示す第2情報群から生成された第2クラスタの例を示す図である。
【
図7】第1クラスタに対応する属性情報を含む指示情報の一例を示す図である。
【
図8】
図7に対応する指示情報に対して大規模言語モデルから取得したテキスト情報の一例を示す図である。
【
図9】第1パラメータ及び第2パラメータの一例を示す図である。
【
図11】情報処理装置における処理の流れを示すフローチャートである。
【
図12】第1装置及び第2装置がクラスタを生成する場合の情報処理システムの概要を説明する図である。
【発明を実施するための形態】
【0015】
[情報処理システムSの概要]
図1は、情報処理システムSの概要を説明する図である。情報処理システムSは、情報処理装置1と、第1装置2と、第2装置3とを有しており、複数の事業者それぞれのユーザに関する情報であるユーザ情報を結合するシステムである。
【0016】
情報処理装置1は、例えばデータを集約し、集約後のデータを提供するサービスを提供する集約事業者により使用されているコンピュータである。情報処理装置1は、第1事業者が使用する第1装置2と、第1事業者とは異なる第2事業者が使用する第2装置3とにインターネットや携帯電話回線等の通信ネットワーク(不図示)を介して通信可能に接続されている。
【0017】
情報処理装置1は、第1装置2から、第1事業者が収集した、ユーザの属性を示す属性情報である第1属性情報を含む第1情報群を取得するとともに、第2装置3から、第2事業者が収集した、ユーザの属性を示す属性情報である第2属性情報を含む第2情報群を取得する(
図1における(1)、(2))。
【0018】
情報処理装置1は、第1情報群に含まれる第1属性情報に基づいて属性情報のクラスタリングを行い、第1情報群に対応するクラスタである第1クラスタを複数生成する。同様に、情報処理装置1は、第2情報群に含まれる第2属性情報に基づいて属性情報のクラスタリングを行い、第2情報群に対応するクラスタである第2クラスタを複数生成する(
図1における(3))。
【0019】
情報処理装置1は、属性情報の入力に対して複数のクラスタを結合するためのパラメータを出力する機械学習モデルに対し、各クラスタに対応する属性情報を入力し(
図1における(4))、機械学習モデルから、各クラスタに対応するパラメータを取得する(
図1における(5))。具体的には、情報処理装置1は、機械学習モデルに複数の第1クラスタそれぞれに対応する属性情報を入力し、機械学習モデルから、複数の第1クラスタそれぞれのパラメータである第1パラメータを取得する。同様に、情報処理装置1は、機械学習モデルに、複数の第2クラスタそれぞれに対応する属性情報を入力し、機械学習モデルから複数の第2クラスタそれぞれに対応するパラメータである第2パラメータを取得する。
【0020】
情報処理装置1は、複数の第1クラスタそれぞれの第1パラメータと、複数の第2クラスタそれぞれの第2パラメータとに基づいて、複数の第1クラスタの少なくともいずれかに、一以上の第2クラスタを結合する(
図1における(6))。このようにすることで、情報処理装置1は、匿名化されている複数のユーザ情報を結合することができる。
【0021】
[情報処理装置1の機能構成]
続いて、情報処理装置1の機能構成について説明する。
図2は、情報処理装置1の機能構成を示す図である。
【0022】
図2に示すように、情報処理装置1は、通信部11と、記憶部12と、制御部13とを有する。
通信部11は、第1装置2及び第2装置3等と通信ネットワークを介してデータを送受信するための通信インターフェースである。
【0023】
記憶部12は、各種のデータを記憶する記憶媒体であり、ROM(Read Only Memory)、RAM(Random Access Memory)、ハードディスク、SSD(Solid State Drive)、及びフラッシュメモリ等を有する。記憶部12は、制御部13が実行するプログラムを記憶する。記憶部12は、制御部13を、第1取得部131、生成部132、第2取得部133、結合部134及び送信部135として機能させるプログラムを記憶する。
【0024】
制御部13は、例えばCPU(Central Processing Unit)である。制御部13は、記憶部12に記憶されたプログラムを実行することにより、第1取得部131、生成部132、第2取得部133、結合部134及び送信部135として機能する。
【0025】
第1取得部131は、第1事業者が収集した、ユーザの属性を示す属性情報である第1属性情報を含む第1情報群と、第1事業者とは異なる第2事業者が収集した、ユーザの属性を示す属性情報である第2属性情報を含む第2情報群とを取得する。例えば、第1取得部131は、第1事業者が使用する第1装置2から第1情報群を取得するとともに、第2事業者が使用する第2装置3から第2情報群を取得する。
【0026】
図3は、第1情報群及び第2情報群の一例を示す図である。
図3(a)は、第1情報群を示し、
図3(b)は、第2情報群を示している。
図3(a)に示すように、第1情報群には、ユーザを識別するためのユーザ識別情報としてのユーザIDが匿名化された状態で含まれており、当該ユーザIDに対して、第1属性情報に含まれる属性として、静的な属性である「ユーザの年代」と、時間の経過に応じて変容しうる動的な属性である、ユーザが使用するスマートフォンの利用機種を示す「利用機種」とが関連付けられている。また、
図3(b)に示すように、第2情報群には、ユーザを識別するためのユーザIDが匿名化された状態で含まれている。また、第2情報群には、当該ユーザIDに対して、第2属性情報に含まれる属性として、動的な属性である、ユーザの購入した商品のカテゴリである「購入商品カテゴリ」と、同じく動的な属性である、ユーザが買物においてどの程度の量のポイントを利用したかを示す「ポイント利用」とが関連付けられている。
【0027】
なお、第1情報群及び第2情報群のそれぞれには、ユーザIDが匿名化された状態で含まれているものとしたがこれに限らない。例えば、第1情報群及び第2情報群には、ユーザIDが含まれていなかったり、関連付けを行うことができない異なる形式のユーザIDが含まれていたりしてもよい。
【0028】
生成部132は、第1情報群に含まれる第1属性情報に基づいて属性情報のクラスタリングを行い、第1情報群に対応するクラスタである第1クラスタを一以上生成するとともに、第2情報群に含まれる第2属性情報に基づいて属性情報のクラスタリングを行い、第2情報群に対応するクラスタである第2クラスタを一以上生成する。生成部132は、クラスタリングによりまとめられた属性が示す値の範囲を示す範囲情報が関連付けられた第1クラスタ及び第2クラスタを複数生成する。
【0029】
例えば、生成部132は、k-means法や、LDA(Latent Dirichlet Allocation)等のクラスタリング手法を用いて、第1情報群に対応するクラスタである第1クラスタを複数生成するとともに、第2情報群に対応するクラスタである第2クラスタを複数生成する。
【0030】
図4は、
図3に示す第1情報群から生成された第1クラスタの例を示す図である。
図4(a)は、第1情報群に含まれる各レコードそれぞれに対し、第1クラスタを識別するための第1クラスタIDが付与された例を示している。
図4(b)は、第1クラスタの内容を示す第1クラスタ情報である。第1クラスタ情報は、例えば、複数の第1クラスタの第1クラスタIDと、第1クラスタに対応する複数の属性それぞれに対応する属性の値の範囲を示す範囲情報とを関連付けた情報である。例えば、第1クラスタIDが「1」のレコードがクラスタリングされた結果、第1属性情報に含まれる属性「年代」に対応する範囲情報として「若年」が特定され、属性「利用機種」に対応する範囲情報として「最新機種」が特定されていることが確認できる。
【0031】
なお、生成部132は、第1クラスタを生成した後、生成された第1クラスタが示す属性情報と、第1情報群に含まれる複数のレコードそれぞれの属性情報と合致度を算出してもよい。そして、生成部132は、算出した合致度に基づいて、複数のレコードそれぞれに対応するユーザが第1クラスタに属する度合いを示す第1クラスタ帰属度を算出してもよい。この算出には、周知のLDA(Latent Dirichlet Allocation)などのクラスタリング手法を用いることができる。
【0032】
図5は、
図3に示す第2情報群から生成された第2クラスタの例を示す図である。
図5(a)は、第2情報群に含まれる各レコードそれぞれに対し、第2クラスタを識別するための第2クラスタIDが付与された例を示している。
図4(b)は、第2クラスタの内容を示す第2クラスタ情報である。第2クラスタ情報は、例えば、複数の第2クラスタの第2クラスタIDと、複数の属性それぞれに対応する属性の値の範囲を示す範囲情報とを関連付けた情報である。例えば、第2クラスタIDが「1」のレコードがクラスタリングされた結果、第2属性情報に含まれる属性「購入商品カテゴリ」に対応する範囲情報として「健康・アウトドア」が特定され、属性「ポイント利用」の範囲情報として「少」が特定されていることが確認できる。
【0033】
なお、生成部132は、クラスタを生成する際に、クラスタを構成するデータの数、すなわち、クラスタを構成するユーザがk人以上となるk-匿名化を満たすようにクラスタを生成するようにしてもよい。このようにすることで、情報処理装置1は、ユーザの匿名性を確保してクラスタリングを行うことができる。
【0034】
第2取得部133は、属性情報の入力に対して複数のクラスタを結合するためのパラメータである結合用パラメータを出力する機械学習モデルに、複数の第1クラスタそれぞれに対応する属性情報を入力し、当該機械学習モデルから複数の第1クラスタそれぞれの結合用パラメータである第1パラメータを取得する。また、第2取得部133は、当該機械学習モデルに、複数の第2クラスタそれぞれに対応する属性情報を入力し、機械学習モデルから複数の第2クラスタそれぞれに対応する結合用パラメータである第2パラメータを取得する。
【0035】
ここで、機械学習モデルは、例えば、属性情報の入力に対して複数のクラスタを結合するためのパラメータを含むテキスト情報等を出力する大規模言語モデル(LLM:Large language Models)等の生成AI(Artificial Intelligence)である。大規模言語モデルは、属性情報としての属性及び当該属性に対応する範囲情報の入力に対し、当該属性情報を有する人物の特性を示す一以上の結合用パラメータを出力可能である。
【0036】
まず、第2取得部133は、属性情報を含む指示情報を生成する。例えば、指示情報のひな形が記憶部12に記憶されている。
図6は、指示情報のひな形の一例を示す図である。
図6に示す例では、ユーザ情報として、属性を指定するためのパラメータとして「@propaerty1」、「@propaerty2」が示されており、属性に対応する範囲情報を指定するためのパラメータとして「@values1」、「@values2」が示されており、そのうち「@value1」、「@value2」をとることが示されている。
【0037】
第2取得部133は、記憶部12に記憶されている指示情報のひな形に対し、クラスタに対応する属性及び属性に対応する範囲情報を反映させることにより、大規模言語モデルに入力する指示情報を生成する。
図7は、第1クラスタに対応する属性情報を含む指示情報の一例を示す図である。
図7に示す例から、
図6に示す指示情報のひな形に示されるパラメータに対し、第1クラスタIDが「1」の第1クラスタの属性である「年代」、「利用機種」が反映されているとともに、当該属性に対応する範囲情報である「若年」「中・高年」のうち「若年」、「最新機種」「旧機種」のうち「最新機種」が反映されていることが確認できる。
【0038】
続いて、第2取得部133は、大規模言語モデルに対し、複数の第1クラスタそれぞれに対応する属性と、当該属性に対応する範囲情報とを含む指示情報を入力する。そして、第2取得部133は、大規模言語モデルから、複数の第1クラスタそれぞれに対応する一以上の第1パラメータを含むテキスト情報を取得する。
【0039】
同様に、第2取得部133は、大規模言語モデルに対し、複数の第2クラスタそれぞれに対応する属性と、当該属性に対応する範囲情報とを含む指示情報を入力し、大規模言語モデルから、複数の第2クラスタそれぞれに対応する一以上の第2パラメータを含むテキスト情報を取得する。
【0040】
図8は、
図7に対応する指示情報に対して大規模言語モデルから取得したテキスト情報の一例を示す図である。
図8には、第1クラスタに対応する人物の特性を示す項目「態度」、「主観的規範」、「行動統制可能性」のそれぞれに対応する値「3」、「2」、「4」が含まれていることが確認できる。これらの値が第1パラメータとして用いられる。
【0041】
第1パラメータの各項目について
図7に示すように「7段階で」といったように、パラメータが取り得る値の範囲を指定することが望ましい。さらに具体的に、「7段階(1:全く当てはまらない、2:やや当てはまらない、3:どちらというと当てはまらない、4:どちらでもない、5:どちらかというと当てはまる、6:やや当てはまる、7:とても当てはまる)」と指定することも望ましい。
【0042】
続いて、第2取得部133は、第1クラスタに対応する指示情報に対応して大規模言語モデルから取得したテキスト情報を解析し、当該テキスト情報に含まれる、第1クラスタに対応する人物の特性を示す項目「態度」、「主観的規範」、「行動統制可能性」それぞれに対応する数値を第1パラメータとして抽出することにより、第1パラメータを取得する。同様に、第2取得部133は、第2クラスタに対応する指示情報に対応して大規模言語モデルから取得したテキスト情報を解析し、当該テキスト情報に含まれる、第2クラスタに対応する人物の特性であって、第1パラメータと同じ指標の項目「態度」、「主観的規範」、「行動統制可能性」それぞれに対応する数値を第2パラメータとして抽出することにより、第2パラメータを取得する。
【0043】
図9は、第1パラメータ及び第2パラメータの一例を示す図である。
図9(a)は、
図4に示す第1クラスタに対して取得された第1パラメータを示しており、
図9(b)は、
図5に示す第2クラスタに対して取得された第2パラメータを示している。
図9(a)及び
図9(b)に示されるように、人物の特性を示す項目「態度」、「主観的規範」、「行動統制可能性」それぞれに対応する値が、第1パラメータ及び第2パラメータとして取得されていることが確認できる。なお、人物の特性を示す項目は、「態度」、「主観的規範」、「行動統制可能性」であることとしたが、これに限らず、人物の特性を示す他の項目であってもよい。
【0044】
なお、第2取得部133は、複数の第1クラスタそれぞれについて複数の第1パラメータを生成してもよい。第2取得部133は、大規模言語モデルの温度パラメータを変化させることにより、同じ入力に対して複数のパラメータを出力させることによって複数の第1パラメータを生成してもよい。また、第1クラスタに複数の属性情報の組み合わせが対応する場合は、第2取得部133は、各組み合わせに基づいて、大規模言語モデルに複数の第1パラメータを生成させることによって複数の第1パラメータを生成してもよい。例えば、第1クラスタが若年のクラスタであり最新機種、旧機種の両方を含んでいた場合、第2取得部133は、「若年」「最新機種」、「若年」「旧機種」の両方を大規模言語モデルに入力し、それぞれの組み合わせに対応する第1パラメータを生成する。このようなパラメータの生成手法は第2クラスタそれぞれの第2パラメータについても適用することができる。
【0045】
結合部134は、第2取得部133が取得した複数の第1クラスタそれぞれの第1パラメータと、複数の第2クラスタそれぞれの第2パラメータとに基づいて、複数の第1クラスタの少なくともいずれかに、一以上の第2クラスタを結合する。例えば、結合部134は、複数の第1クラスタそれぞれの複数の第1パラメータと、複数の第2クラスタそれぞれの複数の第2パラメータとのコサイン類似度等のパラメータの類似度を算出する。
【0046】
そして、結合部134は、算出した類似度が所定の閾値を超える第1クラスタと、第2クラスタとを結合する。例えば、結合部134は、算出した類似度が所定の閾値を超える第1クラスタと、第2クラスタとを結合した結合クラスタ情報を生成する。ここで、結合部134は、一つの第1クラスタに、当該第1クラスタの第1パラメータとの類似度が所定の閾値を超える第2パラメータを有する複数の第2クラスタを結合してもよい。
【0047】
なお、結合部134は、コサイン類似度等のパラメータの類似度に基づいて第1クラスタと第2クラスタとを結合したが、これに限らない。例えば、第1クラスタから第2クラスタとの距離を輸送コストとみなし、シンクホーンアルゴリズムを用いて、一以上の第1クラスタから一以上の第2クラスタへの輸送コストが最小となるような第1クラスタと第2クラスタとの組み合わせを、結合する第1クラスタと第2クラスタとしてもよい。
【0048】
図10は、結合クラスタ情報の一例を示す図である。
図10から、第1クラスタIDが「1」の第1クラスタと第2クラスタIDが「2」の第2クラスタとが結合されているとともに、第1クラスタIDが「2」の第1クラスタと第2クラスタIDが「1」の第2クラスタとが結合されていることが確認できる。
【0049】
送信部135は、結合部134により結合された第1クラスタと第2クラスタとの組合せを示す情報を第1装置2及び第2装置3の少なくともいずれかに送信する。例えば、送信部135は、結合部134により結合された第1クラスタと第2クラスタとの組合せを示す情報として、
図10に示す結合クラスタ情報を第1装置2及び第2装置3の少なくともいずれかに配信する。
【0050】
なお、送信部135は、配信部として機能し、第1クラスタが示す属性情報を有するユーザの端末に対し、第1クラスタと結合された第2クラスタが示す属性情報に対応する情報を配信してもよい。この場合、例えば、送信部135は、第1クラスタIDのユーザに対し、第1クラスタIDと関連付けられた第2属性情報の値に対応する情報を選択する。例えば、
図10に示す例において、第1クラスタIDが「2」のユーザに対して配信する広告情報として、当該第1クラスタIDに関連付けられている第2クラスタID「1」に対応する属性情報である「健康・アウトドア」に対応する広告情報を選択する。
【0051】
そして、送信部135は、当該第1クラスタIDが関連付けられているユーザIDと、選択した広告情報とを関連付けて第1装置2に送信することにより、第1装置2に、当該ユーザIDのユーザが使用する端末に対し、当該広告情報を配信させる。例えば、送信部135は、第1クラスタIDが「2」のユーザに対して配信する広告情報として「健康・アウトドア」に対応する広告情報を選択した場合、
図4(a)に示される第1クラスタID「2」に関連付けられているユーザIDのユーザの端末に対し、当該広告情報を配信することを指示する指示情報を第1装置2に送信する。このようにすることで、情報処理装置1は、ユーザに対して効果的な情報を配信することができる。
【0052】
また、送信部135は、第1クラスタが示す属性情報を有するユーザの端末に対し、第1クラスタと結合された第2クラスタが示す属性情報に対応する情報を配信したが、これに限らない。例えば、送信部135は、第1クラスタが示す属性情報を有していないユーザの端末に対し、第1クラスタと結合された第2クラスタが示す属性情報に対応する情報を配信してもよい。
【0053】
例えば、生成部132が第1情報群それぞれに対応するユーザに対して第1クラスタ帰属度を算出した場合、送信部135は、第1クラスタが示す属性情報を有していないユーザのうち、第1クラスタに対する第1クラスタ帰属度が相対的に高いユーザを特定する。そして、送信部135は、特定した第1クラスタ帰属度が相対的に高いユーザの端末に対し、優先的に第1クラスタと結合された第2クラスタが示す属性情報に対応する情報を配信してもよい。
【0054】
例えば、送信部135は、第1情報群に含まれている、特定した第1クラスタ帰属度が相対的に高いユーザのユーザIDと、選択した広告情報とを関連付けて第1装置2に送信することにより、第1装置2に、当該ユーザIDのユーザが使用する端末に対し、当該広告情報を配信させるようにしてもよい。情報の配信に関する予算の上限が定められている場合、送信部135は、予算の上限内で第1クラスタ帰属度の高いユーザを優先して特定してもよい。
【0055】
[動作フロー]
続いて、情報処理装置1に係る処理の流れについて説明する。
図11は、情報処理装置1における処理の流れを示すフローチャートである。
まず、第1取得部131は、第1装置2から第1情報群を取得するとともに、第2装置3から第2情報群を取得する(S1)。
【0056】
続いて、生成部132は、取得した第1情報群に含まれる第1属性情報に基づいて属性情報のクラスタリングを行い、第1クラスタを複数生成するとともに、第2情報群に含まれる第2属性情報に基づいて属性情報のクラスタリングを行い、第2クラスタを複数生成する(S2)。
【0057】
続いて、第2取得部133は、機械学習モデルに、複数の第1クラスタそれぞれに対応する属性情報を入力し、複数の第1クラスタそれぞれの結合用パラメータである第1パラメータを含むテキスト情報を取得する。そして、第2取得部133は、取得したテキスト情報に含まれている第1パラメータを取得する(S3)。
【0058】
続いて、第2取得部133は、機械学習モデルに、複数の第2クラスタそれぞれに対応する属性情報を入力し、複数の第2クラスタそれぞれの結合用パラメータである第2パラメータを含むテキスト情報を取得する。そして、第2取得部133は、取得したテキスト情報に含まれている第2パラメータを取得する(S4)。
【0059】
続いて、結合部134は、第2取得部133が取得した複数の第1クラスタそれぞれの第1パラメータと、複数の第2クラスタそれぞれの第2パラメータとに基づいて、複数の第1クラスタの少なくともいずれかに、一以上の第2クラスタを結合した、結合クラスタ情報を生成する(S5)。続いて、送信部135は、S7において生成された結合クラスタ情報を第1装置2及び第2装置3の少なくともいずれかに送信する(S6)。
【0060】
[変形例1]
上述の実施の形態では、情報処理装置1が、第1クラスタ及び第2クラスタを生成したが、これに限らない。第1クラスタ、第2クラスタを生成する装置は、それぞれ第1装置2、第2装置3であっても構わない。
図12は、第1装置2及び第2装置3がクラスタを生成する場合の情報処理システムSの概要を説明する図である。
【0061】
図12に示す例では、第1装置2が、第1情報群に基づいて第1クラスタを生成し(
図12における(1))、第1クラスタの属性情報を情報処理装置1に送信する(
図12における(2))。また、第2装置3が、第2情報群に基づいて第2クラスタを生成し(
図12における(3))、第2クラスタの属性情報を情報処理装置1に送信する(
図12における(4))。
【0062】
情報処理装置1は、機械学習モデルに対し、第1装置2及び第2装置3から取得した各クラスタに対応する属性情報を入力し(
図12における(5))、機械学習モデルから、各クラスタに対応するパラメータを取得する(
図12における(6))。
【0063】
情報処理装置1は、複数の第1クラスタそれぞれの第1パラメータと、複数の第2クラスタそれぞれの第2パラメータとに基づいて、複数の第1クラスタの少なくともいずれかに、一以上の第2クラスタを結合する(
図12における(7))。
【0064】
この場合、第1装置2が、第1クラスタIDとユーザIDとの関連付け情報を保有し、第2装置3が、第2クラスタIDとユーザIDとの関連付け情報を保有しても構わない。そして、情報処理装置1の送信部135が、第2クラスタと結合された第1クラスタに対応して選択した広告情報を、当該第1クラスタの第1クラスタIDに対応付けて第1装置2に送信し、第1装置2が、当該第1クラスタIDと関連付けられているユーザIDのユーザが使用する端末に対し当該広告情報を配信してもよい。同様に、情報処理装置1の送信部135が、第1クラスタと結合された第2クラスタに対応して選択した広告情報を、当該第2クラスタの第2クラスタIDに対応付けて第2装置3に送信し、第2装置3が、当該第2クラスタIDと関連付けられているユーザIDのユーザが使用する端末に対し、当該広告情報を配信してもよい。
【0065】
また、情報処理装置1が、第1クラスタ及び第2クラスタを生成する場合に、第1クラスタ、第2クラスタを生成するための専用の区画を設け、互いに入力データや処理過程を確認できないようにしてもよい。この場合、送信部135は、第1クラスタに対応する区画において、当該第1クラスタのクラスタIDとユーザIDを関連付け、当該第1クラスタに対応して選択した広告情報を、当該ユーザIDのユーザが使用する端末に対し当該広告情報を配信させるようにしてもよい。このようにすることで、第1情報群及び第2情報群を取り扱う際に、セキュリティや匿名性を担保することができる。
【0066】
[変形例2]
また、上述の実施の形態では、情報処理装置1は、テキスト情報を大規模言語モデルに入力することによって、各パラメータを取得しているが、機械学習モデルへ入力する情報はテキスト情報に限らず、画像や動画処理、テキスト分析、音声認識を行う大規模言語モデル以外のものも利用可能である。例えば、ユーザが設定する壁紙等から趣味嗜好を読み取り、パラメータに反映してもよい。また、ユーザの音声情報を利用して行動を予測するなど、今では広く一般的である、メディア画像の解析を行えば、ユーザの同意が必要とはなるが、パラメータの取得のために種々のデータが利用可能である。
【0067】
[情報処理装置1による効果]
以上説明したように、本実施の形態に係る情報処理装置1は、第1事業者が収集したユーザの属性を示す第1属性情報を含む第1情報群と、第2事業者が収集したユーザの属性を示す第2属性情報を含む第2情報群とを取得し、第1情報群に対応するクラスタである第1クラスタを複数生成するとともに、第2情報群に対応するクラスタである第2クラスタを複数生成する。そして、情報処理装置1は、機械学習モデルに、複数の第1クラスタそれぞれに対応する属性情報を入力し、機械学習モデルから複数の第1クラスタそれぞれの第1パラメータを取得するとともに、機械学習モデルに、複数の第2クラスタそれぞれに対応する属性情報を入力し、機械学習モデルから複数の第2クラスタそれぞれに対応する第2パラメータを取得し、複数の第1クラスタそれぞれの第1パラメータと、複数の第2クラスタそれぞれの第2パラメータとに基づいて、複数の第1クラスタの少なくともいずれかに、一以上の第2クラスタを結合する。このようにすることで、情報処理装置1は、匿名化されている複数のユーザ情報を結合することができる。
【0068】
なお、本発明により、国連が主導する持続可能な開発目標(SDGs)の目標9「産業と技術革新の基盤をつくろう」に貢献することが可能となる。
【0069】
以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。
【符号の説明】
【0070】
1 情報処理装置
2 第1装置
3 第2装置
11 通信部
12 記憶部
13 制御部
131 第1取得部
132 生成部
133 第2取得部
134 結合部
135 送信部
【要約】
【課題】匿名化されている複数のユーザ情報を結合できるようにする。
【解決手段】情報処理装置1は、第1事業者が収集したユーザの属性を示す第1属性情報を含む第1情報群に対応するクラスタである第1クラスタを複数生成するとともに、第2事業者が収集したユーザの属性を示す第2属性情報を含む第2情報群に対応するクラスタである第2クラスタを複数生成する生成部132と、機械学習モデルに、複数の第1クラスタそれぞれに対応する属性情報を入力し、第1パラメータを取得するとともに、機械学習モデルに、複数の第2クラスタそれぞれに対応する属性情報を入力し、第2パラメータを取得する第2取得部133と、複数の第1クラスタそれぞれの第1パラメータと、複数の第2クラスタそれぞれの第2パラメータとに基づいて、複数の第1クラスタの少なくともいずれかに、一以上の第2クラスタを結合する結合部134と、を有する。
【選択図】
図2