特許7481566 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＫＤＤＩ株式会社の特許一覧

特許7481566情報処理装置、情報処理方法及び情報処理システム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-04-30

(45)【発行日】2024-05-10

(54)【発明の名称】情報処理装置、情報処理方法及び情報処理システム

(51)【国際特許分類】

G06Q 10/06 20230101AFI20240501BHJP

【ＦＩ】

G06Q10/06

【請求項の数】 11

(21)【出願番号】P 2023208371

(22)【出願日】2023-12-11

【審査請求日】2023-12-11

【早期審査対象出願】

(73)【特許権者】

【識別番号】000208891

【氏名又は名称】ＫＤＤＩ株式会社

(74)【代理人】

【識別番号】110004222

【氏名又は名称】弁理士法人創光国際特許事務所

(72)【発明者】

【氏名】黒川茂莉

(72)【発明者】

【氏名】山口求

(72)【発明者】

【氏名】披田野清良

【審査官】牧裕子

(56)【参考文献】

【文献】特開２０２０－１９１０１７（ＪＰ，Ａ）

【文献】特開２０２１－０１２６０３（ＪＰ，Ａ）

【文献】特開２０２２－１７８６４３（ＪＰ，Ａ）

【文献】特開２０２３－０８４８０５（ＪＰ，Ａ）

【文献】特開２０２１－１１１２１９（ＪＰ，Ａ）

【文献】特開２０２１－０３３５３１（ＪＰ，Ａ）

【文献】特開２０２０－１１５３１１（ＪＰ，Ａ）

【文献】特開２０２２－１７８６５０（ＪＰ，Ａ）

【文献】特開２０２０－０３５０６８（ＪＰ，Ａ）

【文献】特開２０２２－０５１３６７（ＪＰ，Ａ）

【文献】米国特許第０８１７５９０８（ＵＳ，Ｂ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｑ１０／００－９９／００

(57)【特許請求の範囲】

【請求項1】

第１事業者が使用する第１装置から、前記第１事業者に対応する第１データと第２事業者に対応する第２データとを識別するためのデータ識別情報であって、前記第１データと前記第２データとを関連付けるためのデータ識別情報と、前記第１データとを受信するとともに、前記第２事業者が使用する第２装置から、前記データ識別情報と前記第２データとを受信する受信部と、
前記受信部が受信した前記データ識別情報に基づいて、前記受信部が受信した前記第１データと前記第２データとを関連付けたデータである統合データを生成し、生成した前記統合データの入力に対して、当該統合データが出力するように設定された損失関数によりパラメータが設定されたデータ生成モデルであって、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有し、前記第１データ、又は前記第２データのいずれか一方の入力を受け付けた場合に、前記第１データ又は前記第２データのうち、入力されなかったデータである未入力データに対応する前記潜在変数が取り得る値を生成することにより、入力された前記第１データ又は前記第２データと、前記未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力する前記データ生成モデルを生成する生成部と、
前記生成部が生成した前記データ生成モデルを、前記第１事業者が使用する第１装置及び前記第２事業者が使用する第２装置の少なくともいずれかに送信する送信部と、
を有し、
前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、前記疑似統合データを受信し、
前記受信部が受信した前記疑似統合データの入力に対して、前記疑似統合データが出力されるように前記パラメータを更新することにより、前記データ生成モデルを更新する更新部をさらに有し、
前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信する、
情報処理装置。

【請求項2】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、所定の確率でノイズが付与された前記第１データ又は前記第２データを受信する、
請求項１に記載の情報処理装置。

【請求項3】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、前記損失関数により前記パラメータが更新されたデータ生成モデルである更新後モデルを受信し、
前記更新部は、前記更新後モデルに含まれる前記パラメータに基づいて、前記生成部により生成されたデータ生成モデルに設けられている前記パラメータを更新することにより、前記データ生成モデルを更新し、
前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信する、
請求項１に記載の情報処理装置。

【請求項4】

前記パラメータには、前記第２データに基づいて更新されず、前記第１データに基づいて更新される第１固有パラメータと、前記第１データに基づいて更新されず、前記第２データに基づいて更新される第２固有パラメータとが含まれており、
前記生成部は、前記第１データが入力された場合には、前記第１固有パラメータを更新可能であるとともに、前記第２データが入力された場合には、前記第２固有パラメータを更新可能な前記データ生成モデルを生成する、
請求項１に記載の情報処理装置。

【請求項5】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、所定の確率でノイズが付与された前記疑似統合データを受信する、
請求項１に記載の情報処理装置。

【請求項6】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、前記疑似統合データを生成する過程で前記データ生成モデルが生成する、前記パラメータを更新するための中間データを受信し、
前記更新部は、前記受信部が受信した前記中間データに基づいて、前記パラメータを更新し、
前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信する、
請求項１に記載の情報処理装置。

【請求項7】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、所定の確率でノイズが付与された前記中間データを受信する、
請求項６に記載の情報処理装置。

【請求項8】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、第１の疑似統合データと、前記第１の疑似統合データを出力する過程で得られる前記潜在変数とを受信し、
前記送信部は、前記受信部が受信した前記潜在変数を前記第１装置及び前記第２装置のうち、前記潜在変数の受信元とは異なる他方の装置に送信し、
前記受信部は、前記他方の装置から、前記送信部が送信した前記潜在変数を用いて前記データ生成モデルから出力された第２の疑似統合データを受信し、
前記更新部は、前記受信部が受信した前記第１の疑似統合データと前記第２の疑似統合データとの比較結果に基づいて、前記生成部が生成した前記データ生成モデルから前記第１の疑似統合データが出力されるように当該データ生成モデルの前記パラメータを更新することにより、当該データ生成モデルを更新し、
前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信する、
請求項１に記載の情報処理装置。

【請求項9】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、前記データ生成モデルの利用状況を示す利用状況情報を受信し、
前記受信部が受信した前記利用状況情報に基づいて、前記データ生成モデルを利用した事業者に対して課金を行う課金部を有する、
請求項１に記載の情報処理装置。

【請求項10】

コンピュータが実行する、
第１事業者が使用する第１装置から、前記第１事業者に対応する第１データと第２事業者に対応する第２データとを識別するためのデータ識別情報であって、前記第１データと前記第２データとを関連付けるためのデータ識別情報と、前記第１データとを受信するとともに、前記第２事業者が使用する第２装置から、前記データ識別情報と前記第２データとを受信するステップと、
受信した前記データ識別情報に基づいて、受信した前記第１データと前記第２データとを関連付けたデータである統合データを生成するステップと、
生成した前記統合データの入力に対して、当該統合データが出力されるように設定された損失関数によりパラメータが設定されたデータ生成モデルであって、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有し、前記第１データ、又は前記第２データのいずれか一方の入力を受け付けた場合に、前記第１データ又は前記第２データのうち、入力されなかったデータである未入力データに対応する前記潜在変数が取り得る値を生成することにより、入力された前記第１データ又は前記第２データと、前記未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力する前記データ生成モデルを生成するステップと、
生成した前記データ生成モデルを、前記第１事業者が使用する第１装置及び前記第２事業者が使用する第２装置の少なくともいずれかに送信するステップと、
前記第１装置及び前記第２装置の少なくともいずれかから、前記疑似統合データを受信するステップと、
受信した前記疑似統合データの入力に対して、前記疑似統合データが出力されるように前記パラメータを更新することにより、前記データ生成モデルを更新するステップと、
更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信するステップと、
を有する情報処理方法。

【請求項11】

第１事業者が使用する第１装置と、第２事業者が使用する第２装置と、前記第１装置及び第２装置と通信可能に接続された情報処理装置とを有する情報処理システムであって、
前記情報処理装置は、
前記第１装置から、前記第１事業者に対応する第１データと前記第２事業者に対応する第２データとを識別するためのデータ識別情報であって、前記第１データと前記第２データとを関連付けるためのデータ識別情報と、前記第１データとを受信するとともに、前記第２装置から、前記データ識別情報と前記第２データとを受信する第１受信部と、
前記第１受信部が受信した前記データ識別情報に基づいて、前記第１受信部が受信した前記第１データと前記第２データとを関連付けたデータである統合データを生成し、生成した前記統合データの入力に対して、当該統合データが出力するように設定された損失関数によりパラメータが設定されたデータ生成モデルであって、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有し、前記第１データ、又は前記第２データのいずれか一方の入力を受け付けた場合に、前記第１データ又は前記第２データのうち、入力されなかったデータである未入力データに対応する前記潜在変数が取り得る値を生成することにより、入力された前記第１データ又は前記第２データと、前記未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力する前記データ生成モデルを生成する生成部と、
前記生成部が生成した前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信する第１送信部と、
を有し、
前記第１装置及び前記第２装置の少なくともいずれかは、
前記データ生成モデルを受信する第２受信部と、
前記データ生成モデルに前記統合データとして前記第１データ及び前記第２データの少なくともいずれかを入力し、前記データ生成モデルから出力される前記疑似統合データを取得する取得部と、
前記取得部が取得した前記疑似統合データを前記情報処理装置に送信する第２送信部と、
を有し、
前記第１受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、前記疑似統合データを受信し、
前記情報処理装置は、前記第１受信部が受信した前記疑似統合データの入力に対して、前記疑似統合データが出力されるように前記パラメータを更新することにより、前記データ生成モデルを更新する更新部をさらに有し、
前記第１送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信する、
情報処理システム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、情報処理装置、情報処理方法及び情報処理システムに関する。

【背景技術】

【0002】

従来、複数の事業者からユーザに関する情報であるユーザ情報を収集し、データ分析を行うことが実施されている。例えば、特許文献１には、複数のユーザ情報を結合するための結合キーに基づいて、複数の事業者それぞれに対応するユーザの個人情報に関するデータを結合するシステムが開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２１－１１７６７９号公報

【発明の概要】

【発明が解決しようとする課題】

【0004】

事業者がデータの結合用としてシステムに提供可能なデータは、事業者が有しているデータのうち一部のレコードであることがある。この場合、事業者は、システム側に提供したデータに対応する結合後のデータをシステムから提供を受けることができる。これに対し、事業者側において、システム側に提供しなかった個人情報に関するデータに対し、どのような内容のデータが結合されるのかを予測したい場合がある。

【0005】

そこで、本発明はこれらの点に鑑みてなされたものであり、データの結合用として提供しなかったデータに対し、どのような内容のデータが結合されるのかを予測可能とすることを目的とする。

【課題を解決するための手段】

【0006】

本発明の第１の態様に係る情報処理装置は、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有するデータ生成モデルであって、第１事業者から取得した第１データ、又は第２事業者から取得した第２データのいずれか一方の入力を受け付けた場合に、前記第１データ又は前記第２データのうち、入力されなかったデータである未入力データに対応する前記潜在変数が取り得る値を生成することにより、入力された前記第１データ又は前記第２データと、前記未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力するデータ生成モデルを生成する生成部と、前記生成部が生成した前記データ生成モデルを、前記第１事業者が使用する第１装置及び前記第２事業者が使用する第２装置の少なくともいずれかに送信する送信部と、を有する。

【0007】

前記生成部は、前記第１データと前記第２データとを関連付けたデータである統合データの入力に対し、前記統合データを出力するように設定された前記データ生成モデルであって、前記統合データとして前記第１データ及び前記第２データの少なくともいずれかが入力されたことに応じて、当該入力された統合データが出力されるように設定された損失関数によりパラメータを更新可能な前記データ生成モデルを生成してもよい。

【0008】

前記情報処理装置は、前記第１事業者から、前記第１データ及び前記第２データを識別するためのデータ識別情報であって、前記第１データと前記第２データとを関連付けるためのデータ識別情報と、前記第１データとを受信するとともに、前記第２事業者から、前記データ識別情報と前記第２データとを受信する受信部を有し、前記生成部は、前記データ識別情報に基づいて前記第１データと前記第２データとを関連付けたデータである統合データを生成し、生成した前記統合データの入力に対して、当該統合データが出力するように設定された前記損失関数により前記パラメータが設定される前記データ生成モデルを生成してもよい。

【0009】

前記受信部は、前記第１事業者が使用する第１装置及び前記第２事業者が使用する第２装置の少なくともいずれかから、所定の確率でノイズが付与された前記第１データ又は前記第２データを受信してもよい。

【0010】

前記情報処理装置は、前記第１装置及び前記第２装置の少なくともいずれかから、前記損失関数により前記パラメータが更新されたデータ生成モデルである更新後モデルを受信する受信部と、前記更新後モデルに含まれる前記パラメータに基づいて、前記生成部により生成されたデータ生成モデルに設けられている前記パラメータを更新することにより、前記データ生成モデルを更新する更新部と、を有し、前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信してもよい。

【0011】

前記パラメータには、前記第２データに基づいて更新されず、前記第１データに基づいて更新される第１固有パラメータと、前記第１データに基づいて更新されず、前記第２データに基づいて更新される第２固有パラメータとが含まれており、前記情報処理装置は、前記第１データが入力された場合には、前記第１固有パラメータを更新可能であるとともに、前記第２データが入力された場合には、前記第２固有パラメータを更新可能なデータ生成モデルを生成する生成部を有してもよい。

【0012】

前記情報処理装置は、前記第１装置及び前記第２装置の少なくともいずれかから、前記疑似統合データを受信する受信部と、前記受信部が受信した前記疑似統合データの入力に対して、前記疑似統合データが出力されるように前記パラメータを更新することにより、前記データ生成モデルを更新する更新部と、を有し、前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信してもよい。
前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、所定の確率でノイズが付与された前記疑似統合データを受信してもよい。

【0013】

前記情報処理装置は、前記第１装置及び前記第２装置の少なくともいずれかから、前記疑似統合データを生成する過程で前記データ生成モデルが生成する、前記パラメータを更新するための中間データを受信する受信部と、前記受信部が受信した前記中間データに基づいて、前記パラメータを更新する更新部と、を有し、前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信してもよい。
前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、所定の確率でノイズが付与された前記中間データを受信してもよい。

【0014】

前記受信部は、前記第１装置及び前記第２装置の少なくともいずれかから、第１の疑似統合データと、前記第１の疑似統合データを出力する過程で得られる前記潜在変数とを受信する受信部と、前記受信部が受信した前記潜在変数を前記第１装置及び前記第２装置のうち、前記潜在変数の受信元とは異なる他方の装置に送信する送信部と、を有し、前記受信部は、前記他方の装置から、前記送信部が送信した前記潜在変数を用いて前記データ生成モデルから出力された第２の疑似統合データを受信し、前記情報処理装置は、前記受信部が受信した前記第１の疑似統合データと前記第２の疑似統合データとの比較結果に基づいて、前記生成部が生成した前記データ生成モデルから前記第１の疑似統合データが出力されるように当該データ生成モデルの前記パラメータを更新することにより、当該データ生成モデルを更新する更新部を有し、前記送信部は、前記更新部により更新された前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信してもよい。

【0015】

前記情報処理装置は、前記第１装置及び前記第２装置の少なくともいずれかから、前記データ生成モデルの利用状況を示す利用状況情報を受信する受信部と、前記受信部が受信した前記利用状況情報に基づいて、前記データ生成モデルを利用した事業者に対して課金を行う課金部と、を有してもよい。

【0016】

本発明の第２の態様に係る情報処理方法は、コンピュータが実行する、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有するデータ生成モデルであって、第１事業者から取得した第１データ、又は第２事業者から取得した第２データのいずれか一方の入力を受け付けた場合に、前記第１データ又は前記第２データのうち、入力されなかったデータである未入力データに対応する前記潜在変数が取り得る値を生成することにより、入力された前記第１データ又は前記第２データと、前記未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力するデータ生成モデルを生成するステップと、生成した前記データ生成モデルを、前記第１事業者が使用する第１装置及び前記第２事業者が使用する第２装置の少なくともいずれかに送信するステップと、を有する。

【0017】

本発明の第３の態様に係る情報処理システムは、第１事業者が使用する第１装置と、第２事業者が使用する第２装置と、前記第１装置及び第２装置と通信可能に接続された情報処理装置とを有する情報処理システムであって、前記情報処理装置は、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有するデータ生成モデルであって、前記第１装置から取得した第１データ、又は第２装置から取得した第２データのいずれか一方の入力を受け付けた場合に、前記第１データ又は前記第２データのうち、入力されなかったデータである未入力データに対応する前記潜在変数が取り得る値を生成することにより、入力された前記第１データ又は前記第２データと、前記未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力するデータ生成モデルを生成する生成部と、前記生成部が生成した前記データ生成モデルを、前記第１装置及び前記第２装置の少なくともいずれかに送信する送信部と、を有し、前記第１装置及び前記第２装置の少なくともいずれかは、前記データ生成モデルを受信する受信部と、前記データ生成モデルに前記統合データとして前記第１データ及び前記第２データの少なくともいずれかを入力し、前記データ生成モデルから出力される前記疑似統合データを取得する取得部と、を有する。

【発明の効果】

【0018】

本発明によれば、データの結合用として提供しなかったデータに対し、どのような内容のデータが結合されるのかを予測可能とすることができるという効果を奏する。

【図面の簡単な説明】

【0019】

【図1】情報処理システムの概要を説明する図である。

【図2】情報処理装置の機能構成を示す図である。

【図3】データ生成モデルを説明するための図である。

【図4】情報処理装置がデータ生成モデルを生成し、更新するまでの処理の流れを示すシーケンス図である。

【発明を実施するための形態】

【0020】

［情報処理システムＳの概要］
図１は、情報処理システムＳの概要を説明する図である。情報処理システムＳは、情報処理装置１と、第１データを管理する第１装置２と、第２データを管理する第２装置３とを有し、第１データ及び第２データを統合した統合データを出力するデータ生成モデルを生成するシステムである。

【0021】

情報処理装置１は、例えばデータを集約し、集約後のデータを提供するサービスを提供する集約事業者により使用されているコンピュータである。情報処理装置１は、第１装置２及び第２装置３等の外部装置と、インターネットや携帯電話回線等の通信ネットワーク（不図示）を介して通信可能に接続されている。

【0022】

第１装置２は、例えば第１の事業者が使用するコンピュータである。第１装置２は、データを識別するためのデータ識別情報としてのデータＩＤ（Identification）と、第１データとを関連付けた複数の第１レコードを管理している。第１データは、例えば、第１の事業者が提供するサービスを利用するユーザから第１の事業者が収集したユーザに関する情報である。

【0023】

第２装置３は、例えば第２の事業者が使用するコンピュータである。第２装置３は、第１データに関連付けられているデータＩＤと共通のデータＩＤと、第２データとを関連付けた複数の第２レコードを管理している。第２データは、例えば、第２の事業者が提供するサービスを利用するユーザから第２の事業者が収集したユーザに関する情報である。

【0024】

情報処理装置１は、第１装置２から、複数の第１レコードを取得するとともに、第２装置３から、複数の第２レコードを取得する。情報処理装置１は、データＩＤに基づいて、取得した第１レコードに含まれる第１データと、第２レコードに含まれる第２データとを統合した統合データを生成する。情報処理装置１は、統合データの入力に対し、統合データを出力するデータ生成モデルを生成する。データ生成モデルは、例えば、統合データとして第１データ及び第２データの少なくともいずれかが入力されたことに応じて、当該入力された統合データが出力されるように設定された損失関数によりパラメータを更新可能なモデルである。

【0025】

また、データ生成モデルは、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有するデータ生成モデルであって、統合データを構成する第１データと第２データとのうち、いずれかのデータの入力を受け付けた場合に、第１データと第２データとのうち入力されなかったデータである未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力可能なモデルである。

【0026】

情報処理装置１は、生成したデータ生成モデルを、第１装置２及び第２装置３に送信する。これにより、第１装置２及び第２装置３において、第１データと第２データとのうちいずれかのデータのみをデータ生成モデルに入力して、データ生成モデルから、未入力データが補完された疑似統合データを取得することができる。これにより、第１装置２及び第２装置３において、データの結合用として提供しなかったデータに対し、どのような内容のデータが結合されるのかを予測することができる。

【0027】

［情報処理装置１の機能構成］
続いて、情報処理装置１の機能構成について説明する。図２は、情報処理装置１の機能構成を示す図である。

【0028】

図２に示すように、情報処理装置１は、通信部１１と、記憶部１２と、制御部１３とを有する。
通信部１１は、第１装置２及び第２装置３等と通信ネットワークを介してデータを送受信するための通信インターフェースである。

【0029】

記憶部１２は、各種のデータを記憶する記憶媒体であり、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）、ハードディスク、ＳＳＤ（Solid State Drive）、及びフラッシュメモリ等を有する。記憶部１２は、制御部１３が実行するプログラムを記憶する。記憶部１２は、制御部１３を、受信部１３１、生成部１３２、送信部１３３、更新部１３４及び課金部１３５として機能させるプログラムを記憶する。

【0030】

制御部１３は、例えばＣＰＵ（Central Processing Unit）である。制御部１３は、記憶部１２に記憶されたプログラムを実行することにより、受信部１３１、生成部１３２、送信部１３３、更新部１３４及び課金部１３５として機能する。

【0031】

［データ生成モデルの説明］
以下、制御部１３が有する機能について説明するにあたり、情報処理装置１が生成するデータ生成モデルについて説明する。図３は、データ生成モデルを説明するための図である。

【0032】

データ生成モデルは、入力層、複数層からなる中間層、出力層を有し、統合データの入力に対し、入力された統合データが出力されるように設定されたニューラルネットワークを実装したアプリケーションプログラムである。データ生成モデルは、層を構成し、入力されたデータに基づいて潜在変数の値を算出し、算出した潜在変数の値を出力する複数のノードを有している。複数のノードそれぞれは、一以上の他のノードに接続される。データ生成モデルには、ノードと、他のノードとの接続関係の強さ（重み）を示すパラメータが設けられている。

【0033】

データ生成モデルは、図３の（Ａ）～（Ｃ）に示すように、入力データとして、第１データ及び第２データの少なくともいずれかが入力されたことに応じて、当該入力データと同じデータが出力データとして出力されるように設定される。

【0034】

また、データ生成モデルは、統合データとして第１データ及び第２データの少なくともいずれかが入力されたことに応じて、当該入力された統合データが出力されるように設定された損失関数により、パラメータを更新することができる。例えば、データ生成モデルは、入力データに対する出力データの差を示す損失関数の値が０になるように、パラメータを更新することができる。

【0035】

データ生成モデルにおけるパラメータには、第２データに基づいて更新されず、第１データに基づいて更新される第１固有パラメータと、第１データに基づいて更新されず、第２データに基づいて更新される第２固有パラメータと、第１データ及び第２データに基づいて更新される共通パラメータとが含まれている。

【0036】

例えば、データ生成モデルに第１データが入力され、第２データが入力されなかった場合には、共通パラメータと第１固有パラメータとが更新される。また、データ生成モデルに第２データが入力され、第１データが入力されなかった場合には、共通パラメータと第２固有パラメータとが更新される。また、データ生成モデルに、第１データと第２データ、すなわち統合データが入力された場合には、共通パラメータと、第１固有パラメータと、第２固有パラメータとが更新される。

【0037】

また、データ生成モデルは、上述したように、複数の潜在変数を有している。潜在変数は、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる内部変数である。データ生成モデルは、図３（Ｄ）、（Ｅ）に示すように、第１データ又は第２データのいずれか一方が入力された場合に、第１データ又は第２データのうち、入力されなかったデータである未入力データに対応する潜在変数の値を自動的に生成することができる。例えば、データ生成モデルは、潜在変数が取り得る値を予め特定しておき、当該取り得る値に基づいて、未入力データに対応する潜在変数の値を生成する。これにより、データ生成モデルは、入力された第１データ又は第２データと、未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力することができる。

【0038】

例えば、データ生成モデルは、疑似統合データを出力させるか否かを示す設定用パラメータの入力を受け付け、入力された設定用パラメータの値が疑似統合データを出力させることを示す場合には、第１データ又は第２データのいずれか一方が入力された場合に、入力されなかったデータを補完して疑似統合データを出力する。第１事業者及び第２事業者においては、情報処理装置１に提供しない第１データ又は第２データが存在する場合において、これらの第１データ又は第２データに対し、どのような第２データ又は第１データが関連づけられるのかを確認したいケースがある。これに対し、第１事業者及び第２事業者は、データ生成モデルに、第１データ又は第２データを入力し、疑似統合データをデータ生成モデルから取得することにより、自身が有する第１データ又は第２データを用いるだけで、当該第１データ又は第２データに関連付けられる第２データ又は第１データを確認することができる。

【0039】

［データ生成モデルの生成及び更新］
続いて、制御部１３が有する、データ生成モデルの生成及び更新に係る機能について説明する。
受信部１３１は、第１事業者から、第１データ及び第２データを識別するためのデータＩＤであって、第１データと第２データとを関連付けるためのデータＩＤと、第１データとを取得するとともに、第２事業者から、データＩＤと第２データとを受信する。例えば、受信部１３１は、第１装置２から、データＩＤと第１データとを関連付けた複数の第１レコードを受信するとともに、第２装置３から、データＩＤと第２データとを関連付けた複数の第２レコードを受信する。

【0040】

受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、所定の確率でノイズが付与された第１データ又は第２データを受信する。ここで、所定の確率は、第１データと第２データとを統合して統合データを生成した場合に、ε－局所型差分プライバシーを満たされるように統合データにノイズが付与されているときの、第１データ及び第２データにおけるノイズの付与率である。また、ノイズは、例えば、実際のデータに対し、実際のデータが取り得る他のデータが置換されることを示している。第１データ及び第２データにノイズが付与されていることにより、第１データ及び第２データそれぞれに含まれるユーザの情報の一部が秘匿化され、ユーザのプライバシーを高めることができる。

【0041】

生成部１３２は、第１事業者から取得した第１データと、第２事業者から取得した第２データとを関連付けたデータである統合データの入力に対し、統合データを出力するように設定されたデータ生成モデルであって、統合データとして第１データ及び第２データの少なくともいずれかが入力されたことに応じて、当該入力された統合データが出力されるように設定された損失関数によりパラメータを更新可能なデータ生成モデルを生成する。

【0042】

具体的にはまず、生成部１３２は、第１データ及び第２データとともに受信部１３１が受信したデータＩＤに基づいて、第１事業者が使用する第１装置２から取得した第１データと、第２事業者が使用する第２装置３から取得した第２データとを関連付けたデータである統合データを生成する。

【0043】

そして、生成部１３２は、当該統合データの入力に対して、当該統合データが出力するように設定された損失関数により、パラメータが設定されたデータ生成モデルを生成する。例えば、生成部１３２は、生成した統合データを入力データ及び出力データとした教師データとする。そして、生成部１３２は、当該教師データを用いて、データ生成モデルへの入力データと、データ生成モデルから出力される出力データとの差を示す損失関数の値が０になるように、層を構成するノードと、当該ノードと接続される他のノードとの接続関係の強さを示すパラメータの学習を行う。これにより、統合データの入力に対し、統合データを出力するようにパラメータが設定されたデータ生成モデルが生成される。

【0044】

送信部１３３は、生成部１３２が生成したデータ生成モデルを、第１装置２及び第２装置３の少なくともいずれかに送信する。なお、送信部１３３が送信する前のデータ生成モデルを、送信前モデルともいう。

【0045】

第１装置２及び第２装置３は、受信部を有しており、情報処理装置１が送信したデータ生成モデルを受信する。また、第１装置２及び第２装置３は、更新部を有しており、データ生成モデルに、統合データとして第１データ及び第２データの少なくともいずれかを入力し、データ生成モデルが有するパラメータを更新する。

【0046】

例えば、第１装置２及び第２装置３は、データ生成モデルが有する設定用パラメータの値を、疑似統合データを出力させる値に設定する。第１装置２及び第２装置３は、第１データ又は第２データのいずれか一方をデータ生成モデルに入力し、データ生成モデルから出力された疑似統合データを取得することができる。これにより、第１事業者及び第２事業者は、自身が保有する第１データ又は第２データをデータ生成モデルに入力することで、自身が保有していないデータを補完した疑似統合データを取得することができるので、当該自身が保有していないデータに基づいて分析を行うことができる。

【0047】

また、データ生成モデルは、第１データが入力された場合には、損失関数により、共通パラメータと、第１固有パラメータとが更新され、第２データが入力された場合には、損失関数により、共通パラメータと、第２固有パラメータとが更新される。ここで、更新の回数は1回に限らない。また、過学習を防ぐために、共通パラメータの値を更新する際に、当該共通パラメータが変化する度合いを制限する正則化を行ってもよい。第１事業者又は第２事業者側においてパラメータが更新されたデータ生成モデルを、更新後モデルともいう。第１装置２及び第２装置３は、例えば所定時間おきに更新後モデルを情報処理装置１に送信する。

【0048】

受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、損失関数によりパラメータが更新されたデータ生成モデルである更新後モデルを受信する。
更新部１３４は、受信部１３１が受信した更新後モデルに含まれるパラメータに基づいて、生成部１３２により生成された送信前モデルに設けられているパラメータを更新することにより、送信前モデルを更新する。

【0049】

更新部１３４は、更新後モデルと、送信前モデルとに含まれているパラメータを比較し、更新されているパラメータを特定する。更新部１３４は、送信前モデルに含まれているパラメータのうち、更新されているパラメータを、更新後モデルに含まれている更新後のパラメータに更新する。

【0050】

例えば、更新部１３４は、更新後モデルにおいて、共通パラメータと、第１固有パラメータとが更新されている場合には、送信前モデルに含まれている当該共通パラメータ及び第１固有パラメータの値を、更新後モデルに含まれている共通パラメータ及び第１固有パラメータの値に更新する。また、更新部１３４は、更新後モデルにおいて、共通パラメータと、第２固有パラメータとが更新されている場合には、送信前モデルに含まれている当該共通パラメータ及び第２固有パラメータの値を、更新後モデルに含まれている共通パラメータ及び第２固有パラメータの値に更新する。

【0051】

ここで、第１装置２及び第２装置３から更新後モデルを受信した場合には、受信した２つの更新後モデルの双方において、共通パラメータの値が更新されていることとなる。この場合、更新部１３４は、送信前モデルに含まれている共通パラメータの値を、第１装置２から受信した更新後モデルに含まれている共通パラメータの値と、第２装置３から受信した更新後モデルに含まれている共通パラメータの値とに基づいて更新する。更新部１３４は、例えば、送信前モデルに含まれている共通パラメータの値を、第１装置２から受信した更新後モデルに含まれている共通パラメータの値と、第２装置３から受信した更新後モデルに含まれている共通パラメータの値との平均値に更新する。

【0052】

ここで、更新部１３４は、送信前モデルに含まれている共通パラメータの値を、第１装置２から受信した更新後モデルに含まれている共通パラメータの値と、第２装置３から受信した更新後モデルに含まれている共通パラメータの値との中央値などの統計値に更新してもよい。また、更新部１３４は、過学習を防ぐために、送信前モデルに含まれている共通パラメータの値を更新する際に、当該共通パラメータが変化する度合いを制限する正則化を行ってもよいし、複数の学習環境を用意し、複数の学習環境それぞれにおいて、送信前モデルに含まれている共通パラメータの値を更新し、更新した共通パラメータの値を集約してもよい。このようにすることで、情報処理装置１は、第１装置２及び第２装置３において行われたデータ生成モデルの学習結果を送信前モデルに反映させることができる。

【0053】

なお、受信部１３１は、第１装置２と、第２装置３とのそれぞれから、データ生成モデルの利用状況を示す情報として、利用回数を示す情報を取得してもよい。そして、更新部１３４は、第１装置２と、第２装置３とのそれぞれにおけるデータ生成モデルの利用状況と、第１装置２から受信した更新後モデルに含まれている共通パラメータの値と、第２装置３から受信した更新後モデルに含まれている共通パラメータの値とに基づいて、送信前モデルに含まれている共通パラメータの値を更新してもよい。第１装置２と、第２装置３とのそれぞれにおけるデータ生成モデルの利用回数に基づいて、第１装置２から受信した更新後モデルに含まれている共通パラメータの値と、第２装置３から受信した更新後モデルに含まれている共通パラメータの値とのそれぞれの重み付けを行い、重み付けが行われた２つの共通パラメータの平均値を、送信前モデルに含まれている共通パラメータの値としてもよい。

【0054】

また、更新部１３４は、第１装置２及び第２装置３の少なくともいずれかから受信した更新後モデルに含まれるパラメータに基づいて、送信前モデルのパラメータを更新したが、これに限らない。例えば、更新部１３４は、疑似統合データに基づいて送信前モデルのパラメータを更新してもよい。

【0055】

この場合、受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、疑似統合データを受信する。ここで、受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、所定の確率でノイズが付与された疑似統合データを受信してもよい。このようにすることで、情報処理装置１は、匿名化処理が行われた疑似統合データを収集することができ、収集する過程において匿名化処理が行われていないユーザ情報が流出することを抑制することができる。

【0056】

更新部１３４は、受信部１３１が受信した疑似統合データを用いてデータ生成モデル（送信前モデル）の学習を行い、疑似統合データの入力に対して、当該疑似統合データが出力されるようにパラメータを更新することにより、データ生成モデルを更新する。

【0057】

また、更新部１３４は、疑似統合データを生成する過程でデータ生成モデルが生成する、パラメータを更新するための中間データ、例えば、パラメータの勾配を示す勾配情報に基づいて、送信前モデルのパラメータを更新してもよい。この場合、受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、疑似統合データを生成する過程でデータ生成モデルが生成する、パラメータを更新するための中間データを受信する。中間データは、例えば、データ生成モデルの中間層に含まれる所定の層において出力され、当該所定の層の次の層に入力されるデータ集合である。ここで、受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、所定の確率でノイズが付与された中間データを受信してもよい。この場合、中間データに含まれる複数のデータそれぞれが取り得る値が予め特定されており、中間データに含まれる複数のデータが、他の取り得るデータに所定の確率で置換されているものとする。

【0058】

更新部１３４は、受信部１３１が受信した中間データを、中間層を構成する複数の層のうち、当該中間データが入力される層に入力することにより、データ生成モデル（送信前モデル）の学習を行う。これにより、更新部１３４は、中間データに基づいて、中間データに対応する統合データが出力されるように、パラメータを更新することにより、データ生成モデルを更新する。

【0059】

また、受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、第１の疑似統合データと、当該第１の疑似統合データを出力する過程で得られる潜在変数とを受信してもよい。そして、送信部１３３は、受信部１３１が受信した潜在変数を第１装置２及び第２装置３のうち、潜在変数の受信元とは異なる他方の装置に送信してもよい。この場合、他方の装置は、自身が予め受信しているデータ生成モデルに対し、当該潜在変数を用いて第２の疑似統合データを出力させ、当該第２の疑似統合データを情報処理装置１に送信する。ここで、他方の装置におけるパラメータの学習に正則化を加えておいてもよい。情報処理装置１の受信部１３１は、当該他方の装置から第２の疑似統合データを受信する。

【0060】

更新部１３４は、受信部１３１が受信した第１の疑似統合データと第２の疑似統合データとの比較結果に基づいて、送信前モデルから第１の疑似統合データが出力されるようにパラメータを更新することにより、当該送信前モデルを更新する。例えば、更新部１３４は、受信部１３１が受信した第１の疑似統合データと第２の疑似統合データとを比較し、一致度が所定の閾値を超えることを条件として、生成部１３２が生成したデータ生成モデル、すなわち、送信前モデルから第１の疑似統合データが出力されるようにパラメータを更新することにより、当該送信前モデルを更新する。

【0061】

第１の疑似統合データと第２の疑似統合データとの一致度が所定の閾値を超えている場合、第１の疑似統合データを出力した事業者側に配布されたデータ生成モデルのパラメータが更新されている確率が高い。これに対し、情報処理装置１は、事業者側に配布されたデータ生成モデルのパラメータの変化が大きい確率が高い場合に、当該パラメータを送信前モデルのパラメータに反映させることができる。なお、更新部１３４は、一致度が所定の閾値を超えることを条件として、送信前モデルから第１の疑似統合データが出力されるようにパラメータを更新したが、これに限らない。更新部１３４は、受信部１３１が第１の疑似統合データを受信したことに応じて、無条件で、送信前モデルから第１の疑似統合データが出力されるようにパラメータを更新してもよい。

【0062】

送信部１３３は、更新部１３４により更新されたデータ生成モデルを、第１装置２及び第２装置３の少なくともいずれかに送信する。これにより、第１事業者は、第２事業者において、第２データに基づいて更新されたパラメータが反映されたデータ生成モデルを用いて、精度が向上した疑似統合データを取得することができる。同様に、第２事業者は、第１事業者において、第１データに基づいて更新されたパラメータが反映されたデータ生成モデルを用いて、精度が向上した疑似統合データを取得することができる。

【0063】

［データ生成モデルの使用に伴う課金］
続いて、データ生成モデルの使用に伴う課金について説明する。
受信部１３１は、第１装置２及び第２装置３の少なくともいずれかから、データ生成モデルの利用状況を示す利用状況情報を受信する。例えば、利用状況情報は、利用した事業者を示す事業者識別情報と、データ生成モデルを利用した回数とを関連付けた情報である。また、データモデルを利用した回数は、入力データとして統合データの一部である第１データ又は第２データを入力し、データ生成モデルから疑似統合データを取得した回数である。なお、データ生成モデルの学習フェーズと、データ生成モデルを利用して疑似統合データを取得する予測フェーズとがあるところ、データモデルを利用した回数は、予測フェーズにおいて疑似統合データを取得した回数であってもよい。

【0064】

課金部１３５は、受信部１３１が受信した利用状況情報に基づいて、データ生成モデルを利用した事業者に対して課金を行う。例えば、課金部１３５は、利用状況情報が示す事業者識別情報が示す事業者に対し、当該利用状況情報が示すデータ生成モデルを利用した回数が多ければ多いほど課金額が高くなるように課金を行う。このようにすることで、情報処理装置１を運用する集約事業者は、事業者によるデータ生成モデルの利用に対する対価を得ることができる。

【0065】

［動作シーケンス］
続いて、情報処理装置１に係る処理の流れについて説明する。図４は、情報処理装置１がデータ生成モデルを生成し、更新するまでの処理の流れを示すシーケンス図である。

【0066】

まず、受信部１３１は、第１装置２からデータＩＤと第１データとを関連付けた複数の第１レコードを受信するとともに（Ｓ１）、第２装置３からデータＩＤと第２データとを関連付けた複数の第２レコードを受信する（Ｓ２）。

【0067】

続いて、生成部１３２は、受信した第１レコード及び第２レコードに含まれるデータＩＤとをキーとして第１レコードと第２レコードとを連結することにより、統合データを生成する（Ｓ３）。続いて、生成部１３２は、生成した統合データを教師データとしてデータ生成モデルの学習を行うことにより、データ生成モデルを生成する（Ｓ４）。
続いて、送信部１３３は、生成部１３２が生成したデータ生成モデルを第１装置２及び第２装置３に送信する（Ｓ５、Ｓ６）。

【0068】

第１装置２は、情報処理装置１から受信したデータ生成モデルに対し、入力データとして第１データを入力し、データ生成モデルから疑似統合データを出力させることにより、疑似統合データを取得する（Ｓ７）。データ生成モデルは、入力データとして第１データが入力されると、共通パラメータ及び第１固有パラメータを更新する。第１装置２は、共通パラメータ及び第１固有パラメータが更新されたデータ生成モデル、すなわち更新後モデルを情報処理装置１に送信する（Ｓ８）。

【0069】

同様に、第２装置３は、情報処理装置１から受信したデータ生成モデルに対し、入力データとして第２データを入力し、データ生成モデルから疑似統合データを出力させることにより、疑似統合データを取得する（Ｓ９）。データ生成モデルは、入力データとして第２データが入力されると、共通パラメータ及び第２固有パラメータを更新する。第２装置３は、共通パラメータ及び第２固有パラメータが更新されたデータ生成モデル、すなわち更新後モデルを情報処理装置１に送信する（Ｓ１０）。情報処理装置１の受信部１３１は、第１装置２及び第２装置３から更新後モデルを受信する。

【0070】

更新部１３４は、第１装置２及び第２装置３から受信した更新後モデルに含まれているパラメータに基づいて、Ｓ４において生成したデータ生成モデルのパラメータを更新する（Ｓ１１）。これにより、情報処理装置１は、入力データとして第１データと第２データとのうち一方のデータしか入力されなかった場合における、当該入力されたデータに基づく学習結果を、Ｓ４において生成したデータ生成モデルに反映することができる。

【0071】

続いて、送信部１３３は、更新部１３４により更新されたデータ生成モデルを第１装置２及び第２装置３に送信する（Ｓ１２、Ｓ１３）。その後、第１装置２及び第２装置３において、データ生成モデルを用いた疑似統合データの取得が行われる。

【0072】

［情報処理装置１による効果］
以上説明したように、本実施の形態に係る情報処理装置１は、入力されたデータに基づいて決定され、出力されるデータの決定に用いられる複数の潜在変数を有するデータ生成モデルであって、第１事業者から取得した第１データ、又は第２事業者から取得した第２データのいずれか一方の入力を受け付けた場合に、第１データ又は第２データのうち、入力されなかったデータである未入力データに対応する潜在変数が取り得る値を生成することにより、入力された第１データ又は第２データと、前記未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力するデータ生成モデルを生成する。そして、情報処理装置１は、生成したデータ生成モデルを、第１事業者が使用する第１装置２及び第２事業者が使用する第２装置３の少なくともいずれかに送信する。このようにすることで、第１装置２及び第２装置３において、当該データ生成モデルを用いて、データの結合用として事業者に提供しなかったデータに対し、どのような内容のデータが結合されるのかを予測することができる。

【0073】

なお、本発明により、国連が主導する持続可能な開発目標（ＳＤＧｓ）の目標９「産業と技術革新の基盤をつくろう」に貢献することが可能となる。

【0074】

以上、本発明を実施の形態を用いて説明したが、本発明の技術的範囲は上記実施の形態に記載の範囲には限定されず、その要旨の範囲内で種々の変形及び変更が可能である。例えば、装置の全部又は一部は、任意の単位で機能的又は物理的に分散・統合して構成することができる。また、複数の実施の形態の任意の組み合わせによって生じる新たな実施の形態も、本発明の実施の形態に含まれる。組み合わせによって生じる新たな実施の形態の効果は、もとの実施の形態の効果を併せ持つ。

【符号の説明】

【0075】

１情報処理装置
２第１装置
３第２装置
１１通信部
１２記憶部
１３制御部
１３１受信部
１３２生成部
１３３送信部
１３４更新部
１３５課金部
Ｓ情報処理システム

【要約】

【課題】データの結合用として提供しなかったデータに対し、どのような内容のデータが結合されるのかを予測可能とする。
【解決手段】情報処理装置１は、複数の潜在変数を有するデータ生成モデルであって、第１事業者から取得した第１データ、又は第２事業者から取得した第２データのいずれか一方の入力を受け付けた場合に、入力されなかったデータである未入力データに対応する潜在変数が取り得る値を生成することにより、入力された第１データ又は第２データと、未入力データに対応する疑似データとを関連付けた統合データである疑似統合データを出力するデータ生成モデルを生成する生成部１３２と、生成部１３２が生成したデータ生成モデルを、第１事業者が使用する第１装置２及び第２事業者が使用する第２装置３の少なくともいずれかに送信する送信部１３３と、を有する。
【選択図】図２

【図1】

【図2】

【図3】

【図4】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版