IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 筑波大学の特許一覧 ▶ 株式会社エヌ・ティ・ティ・データの特許一覧

特開2023-108797端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法
<>
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図1
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図2
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図3
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図4
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図5
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図6
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図7
  • 特開-端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023108797
(43)【公開日】2023-08-07
(54)【発明の名称】端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20230731BHJP
【FI】
G06N20/00 130
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022010035
(22)【出願日】2022-01-26
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人新エネルギー・産業技術総合開発機構次世代人工知能・ロボット中核技術開発/次世代人工知能技術の日米共同研究開発委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】504171134
【氏名又は名称】国立大学法人 筑波大学
(71)【出願人】
【識別番号】000102728
【氏名又は名称】株式会社エヌ・ティ・ティ・データ
(74)【代理人】
【識別番号】100165179
【弁理士】
【氏名又は名称】田▲崎▼ 聡
(74)【代理人】
【識別番号】100188558
【弁理士】
【氏名又は名称】飯田 雅人
(74)【代理人】
【識別番号】100175824
【弁理士】
【氏名又は名称】小林 淳一
(74)【代理人】
【識別番号】100152272
【弁理士】
【氏名又は名称】川越 雄一郎
(74)【代理人】
【識別番号】100181722
【弁理士】
【氏名又は名称】春田 洋孝
(72)【発明者】
【氏名】今倉 暁
(72)【発明者】
【氏名】櫻井 鉄也
(72)【発明者】
【氏名】岡田 幸彦
(72)【発明者】
【氏名】藤井 智也
(72)【発明者】
【氏名】坂元 哲平
(57)【要約】
【課題】機関等により保有されているデータと、当該データに抽象化処理を施したデータとを照合し得なくすること。
【解決手段】端末は、抽象化関数により抽象化部分データ、第一抽象化アンカーデータ及び第二抽象化アンカーデータを生成し、抽象化関数を破棄し、これら三つのデータ及びラベルデータをデータ処理装置に送信する。データ処理装置は、複数の抽象化部分データを統合して統合データを生成し、複数の第二抽象化アンカーデータを統合して統合第二アンカーデータを生成し、統合データに含まれる要素が示す内容に対応するラベルを示すラベルデータを統合データに基づいて出力する統合解析モデルを生成し、統合第二アンカーデータ及び統合解析モデルを使用して第二ラベルデータを生成して端末に送信する。端末は、第二アンカーデータと第二ラベルデータとを使用して、これら二つのデータ各々により示される内容同士の関係を示す統合解析モデルを生成する。
【選択図】図1
【特許請求の範囲】
【請求項1】
部分データ、第一アンカーデータ及び第二アンカーデータに抽象化処理を施すために使用される抽象化関数を生成する抽象化関数生成部と、
前記部分データに前記抽象化関数を適用して抽象化部分データを生成し、前記第一アンカーデータに前記抽象化関数を適用して第一抽象化アンカーデータを生成し、前記第二アンカーデータに前記抽象化関数を適用して第二抽象化アンカーデータを生成する抽象化実行部と、
前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが生成された後に、前記抽象化関数を破棄する抽象化関数破棄部と、
前記抽象化部分データ、前記第一抽象化アンカーデータ、前記第二抽象化アンカーデータ及びラベルデータをデータ処理装置に送信するデータ送信部と、
複数の前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより生成された統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを前記データ処理装置から受信するデータ受信部と、
前記第二アンカーデータと、前記第二ラベルデータとを使用して前記第二アンカーデータにより示される内容と、前記第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成するモデル生成部と、
を備える端末。
【請求項2】
前記抽象化関数破棄部は、前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが前記データ処理装置に送信される前に、前記抽象化関数を破棄する、
請求項1に記載の端末。
【請求項3】
前記抽象化関数生成部は、前記部分データの一部を無作為に抽出する処理及び前記抽象化関数に無作為な要素を付与する処理の少なくとも一方により前記抽象化関数を生成する、
請求項1又は請求項2に記載の端末。
【請求項4】
前記抽象化実行部は、前記抽象化部分データ及び前記ラベルデータの行を等しく無作為に入れ替える、
請求項1から請求項3のいずれか一つに記載の端末。
【請求項5】
抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを端末ごとに受信するデータ受信部と、
前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記抽象化部分データを統合することにより統合データを生成し、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより統合第二アンカーデータを生成し、前記統合データに含まれる要素が示す内容に対応するラベルを示すラベルデータを前記統合データに基づいて出力する統合解析モデルを生成し、前記統合第二アンカーデータ及び前記統合解析モデルを使用して前記統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを生成するラベルデータ生成部と、
前記第二ラベルデータを前記端末に送信するデータ送信部と、
を備えるデータ処理装置。
【請求項6】
部分データ、第一アンカーデータ及び第二アンカーデータに抽象化処理を施すために使用される抽象化関数を生成する抽象化関数生成機能と、
前記部分データに前記抽象化関数を適用して抽象化部分データを生成し、前記第一アンカーデータに前記抽象化関数を適用して第一抽象化アンカーデータを生成し、前記第二アンカーデータに前記抽象化関数を適用して第二抽象化アンカーデータを生成する抽象化実行機能と、
前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが生成された後に、前記抽象化関数を破棄する抽象化関数破棄機能と、
前記抽象化部分データ、前記第一抽象化アンカーデータ、前記第二抽象化アンカーデータ及びラベルデータをデータ処理装置に送信するデータ送信機能と、
複数の前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより生成された統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを前記データ処理装置から受信するデータ受信機能と、
前記第二アンカーデータと、前記第二ラベルデータとを使用して前記第二アンカーデータにより示される内容と、前記第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成するモデル生成機能と、
を端末に実行させる端末制御プログラム。
【請求項7】
抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを端末ごとに受信するデータ受信機能と、
前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記抽象化部分データを統合することにより統合データを生成し、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより統合第二アンカーデータを生成し、前記統合データに含まれる要素が示す内容に対応するラベルを示すラベルデータを前記統合データに基づいて出力する統合解析モデルを生成し、前記統合第二アンカーデータ及び前記統合解析モデルを使用して前記統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを生成するラベルデータ生成機能と、
前記第二ラベルデータを前記端末に送信するデータ送信機能と、
をデータ処理装置に実行させるデータ処理プログラム。
【請求項8】
抽象化関数生成部又は抽象化関数生成機能により、部分データ、第一アンカーデータ及び第二アンカーデータに抽象化処理を施すために使用される抽象化関数を生成し、
抽象化実行部又は抽象化実行機能により、前記部分データに前記抽象化関数を適用して抽象化部分データを生成し、前記第一アンカーデータに前記抽象化関数を適用して第一抽象化アンカーデータを生成し、前記第二アンカーデータに前記抽象化関数を適用して第二抽象化アンカーデータを生成し、
抽象化関数破棄部又は抽象化関数破棄機能により、前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが生成された後に、前記抽象化関数を破棄し、
データ送信部又はデータ送信機能により、前記抽象化部分データ、前記第一抽象化アンカーデータ、前記第二抽象化アンカーデータ及びラベルデータをデータ処理装置に送信し、
データ受信部又はデータ受信機により、複数の前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより生成された統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを前記データ処理装置から受信し、
モデル生成部又はモデル生成機能により、前記第二アンカーデータと、前記第二ラベルデータとを使用して前記第二アンカーデータにより示される内容と、前記第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成する、
端末制御方法。
【請求項9】
データ受信部又はデータ受信機能により、抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを端末ごとに受信し、
ラベルデータ生成部又はラベルデータ生成機能により、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記抽象化部分データを統合することにより統合データを生成し、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより統合第二アンカーデータを生成し、前記統合データに含まれる要素が示す内容に対応するラベルを示すラベルデータを前記統合データに基づいて出力する統合解析モデルを生成し、前記統合第二アンカーデータ及び前記統合解析モデルを使用して前記統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを生成し、
データ送信部又はデータ送信機能により、前記第二ラベルデータを前記端末に送信する、
データ処理方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法
【背景技術】
【0002】
近年、社会のネットワーク化が急速に進展しており、社会の様々な分野でデータを収集する環境が整備されている。例えば、医療機関、金融機関等の様々な機関は、独自に多量のデータを収集して保有している。このような背景の下、個人情報、営業秘密等を保護しつつ、これらのデータを統合し、ビッグデータとして解析する技術により生産性の向上を図ることが期待されている。例えば、このような技術として、特許文献1に開示されている分散データ統合装置が挙げられる。
【0003】
この分散データ統合装置は、取得部と、アンカーデータ変換部と、算出部と、解析対象データ変換部とを備える。取得部は、分散している複数の解析対象データの統合において共通に用いられるデータであるアンカーデータが第1関数によって変換されて得られる中間表現であるアンカーデータ中間表現、及び解析対象データが第1関数によって変換されて得られる中間表現である解析対象中間表現を、解析対象データ毎に取得するアンカーデータ変換部は、取得部によって取得された複数のアンカーデータ中間表現を第2関数によって解析対象データ毎に変換する。算出部は、アンカーデータ変換によって変換されたアンカーデータ中間表現相互間の差を最小にする解析対象データ毎の第2関数を算出する。解析対象データ変換部は、取得部によって取得された解析対象中間表現を、算出部によって算出された第2関数によって解析対象データ毎に変換する。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】国際公開第2020/137728号
【0005】
しかし、上述した分散データ統合装置は、元データと、解析対象中間表現とを照合することが可能であるため、元データにより示されている内容が当該元データを保有している機関以外の者に知られてしまう可能性を排除しきれない。
【発明の概要】
【発明が解決しようとする課題】
【0006】
本発明は、このような事情に鑑みてなされたものであり、機関等により保有されているデータと、当該データに抽象化処理を施したデータとを照合することを不可能にすることができる端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法を提供することを課題とする。
【課題を解決するための手段】
【0007】
本発明の一態様は、部分データ、第一アンカーデータ及び第二アンカーデータに抽象化処理を施すために使用される抽象化関数を生成する抽象化関数生成部と、前記部分データに前記抽象化関数を適用して抽象化部分データを生成し、前記第一アンカーデータに前記抽象化関数を適用して第一抽象化アンカーデータを生成し、前記第二アンカーデータに前記抽象化関数を適用して第二抽象化アンカーデータを生成する抽象化実行部と、前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが生成された後に、前記抽象化関数を破棄する抽象化関数破棄部と、前記抽象化部分データ、前記第一抽象化アンカーデータ、前記第二抽象化アンカーデータ及びラベルデータをデータ処理装置に送信するデータ送信部と、複数の前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより生成された統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを前記データ処理装置から受信するデータ受信部と、前記第二アンカーデータと、前記第二ラベルデータとを使用して前記第二アンカーデータにより示される内容と、前記第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成するモデル生成部と、を備える端末である。
【0008】
また、上述した端末において、前記抽象化関数破棄部は、前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが前記データ処理装置に送信される前に、前記抽象化関数を破棄する。
【0009】
また、上述した端末において、前記抽象化関数生成部は、前記部分データの一部を無作為に抽出する処理及び前記抽象化関数に無作為な要素を付与する処理の少なくとも一方により前記抽象化関数を生成する。
【0010】
また、上述した端末において、前記抽象化実行部は、前記抽象化部分データ及び前記ラベルデータの行を等しく無作為に入れ替える。
【0011】
本発明の一態様は、抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを端末ごとに受信するデータ受信部と、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記抽象化部分データを統合することにより統合データを生成し、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより統合第二アンカーデータを生成し、前記統合データに含まれる要素が示す内容に対応するラベルを示すラベルデータを前記統合データに基づいて出力する統合解析モデルを生成し、前記統合第二アンカーデータ及び前記統合解析モデルを使用して前記統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを生成するラベルデータ生成部と、前記第二ラベルデータを前記端末に送信するデータ送信部と、を備えるデータ処理装置である。
【0012】
本発明の一態様は、部分データ、第一アンカーデータ及び第二アンカーデータに抽象化処理を施すために使用される抽象化関数を生成する抽象化関数生成機能と、前記部分データに前記抽象化関数を適用して抽象化部分データを生成し、前記第一アンカーデータに前記抽象化関数を適用して第一抽象化アンカーデータを生成し、前記第二アンカーデータに前記抽象化関数を適用して第二抽象化アンカーデータを生成する抽象化実行機能と、前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが生成された後に、前記抽象化関数を破棄する抽象化関数破棄機能と、前記抽象化部分データ、前記第一抽象化アンカーデータ、前記第二抽象化アンカーデータ及びラベルデータをデータ処理装置に送信するデータ送信機能と、複数の前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより生成された統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを前記データ処理装置から受信するデータ受信機能と、前記第二アンカーデータと、前記第二ラベルデータとを使用して前記第二アンカーデータにより示される内容と、前記第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成するモデル生成機能と、を端末に実行させる端末制御プログラムである。
【0013】
本発明の一態様は、抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを端末ごとに受信するデータ受信機能と、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記抽象化部分データを統合することにより統合データを生成し、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより統合第二アンカーデータを生成し、前記統合データに含まれる要素が示す内容に対応するラベルを示すラベルデータを前記統合データに基づいて出力する統合解析モデルを生成し、前記統合第二アンカーデータ及び前記統合解析モデルを使用して前記統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを生成するラベルデータ生成機能と、前記第二ラベルデータを前記端末に送信するデータ送信機能と、をデータ処理装置に実行させるデータ処理プログラムである。
【0014】
本発明の一態様は、抽象化関数生成部又は抽象化関数生成機能により、部分データ、第一アンカーデータ及び第二アンカーデータに抽象化処理を施すために使用される抽象化関数を生成し、抽象化実行部又は抽象化実行機能により、前記部分データに前記抽象化関数を適用して抽象化部分データを生成し、前記第一アンカーデータに前記抽象化関数を適用して第一抽象化アンカーデータを生成し、前記第二アンカーデータに前記抽象化関数を適用して第二抽象化アンカーデータを生成し、抽象化関数破棄部又は抽象化関数破棄機能により、前記抽象化部分データ、前記第一抽象化アンカーデータ及び前記第二抽象化アンカーデータが生成された後に、前記抽象化関数を破棄し、データ送信部又はデータ送信機能により、前記抽象化部分データ、前記第一抽象化アンカーデータ、前記第二抽象化アンカーデータ及びラベルデータをデータ処理装置に送信し、データ受信部又はデータ受信機により、複数の前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより生成された統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを前記データ処理装置から受信し、モデル生成部又はモデル生成機能により、前記第二アンカーデータと、前記第二ラベルデータとを使用して前記第二アンカーデータにより示される内容と、前記第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成する、端末制御方法である。
【0015】
本発明の一態様は、データ受信部又はデータ受信機能により、抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを端末ごとに受信し、ラベルデータ生成部又はラベルデータ生成機能により、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記抽象化部分データを統合することにより統合データを生成し、前記端末ごとに受信された前記第一抽象化アンカーデータを使用して複数の前記第二抽象化アンカーデータを統合することにより統合第二アンカーデータを生成し、前記統合データに含まれる要素が示す内容に対応するラベルを示すラベルデータを前記統合データに基づいて出力する統合解析モデルを生成し、前記統合第二アンカーデータ及び前記統合解析モデルを使用して前記統合第二アンカーデータに含まれる要素が示す内容に対応するラベルを示す第二ラベルデータを生成し、データ送信部又はデータ送信機能により、前記第二ラベルデータを前記端末に送信する、データ処理方法である。
【発明の効果】
【0016】
本発明によれば、機関等により保有されているデータと、当該データに抽象化処理を施したデータとを照合することを不可能にすることができる端末、データ処理装置、端末制御プログラム、データ処理プログラム、端末制御方法及びデータ処理方法を提供することができる。
【図面の簡単な説明】
【0017】
図1】本発明の実施形態に係る統合解析モデル生成システムの一例を示す図である。
図2】本発明の実施形態に係る全体データの一例を示す図である。
図3】本発明の実施形態に係る部分データの一例を示す図である。
図4】本発明の実施形態に係る端末の機能的な構成の一例を示す図である。
図5】本発明の実施形態に係るデータ処理装置の機能的な構成の一例を示す図である。
図6】本発明の実施形態に係る端末及びデータ処理装置が実行する処理の一例を示すシーケンス図である。
図7】本発明の実施形態に係る端末により生成された統合解析モデルを使用して企業の格付を示す抽象化部分データを統合して解析した場合における機関の数と正解率との関係等の一例を示す図である。
図8】本発明の実施形態に係る端末により生成された統合解析モデルを使用して手書きの数字を示す抽象化部分データを統合して解析した場合における機関の数と正解率との関係等の一例を示す図である。
【発明を実施するための形態】
【0018】
[実施形態]
まず、図1から図3を参照しながら、実施形態に係る統合解析モデル生成システムの概要について説明する。図1は、本発明の実施形態に係る統合解析モデル生成システムの一例を示す図である。図1に示すように、統合解析モデル生成システム1は、端末10-1と、…、端末10-c(c:2以上の自然数)と、データ処理装置20とを備える。
【0019】
端末10-1、…、端末10-c及びデータ処理装置20は、いずれも図1に示したネットワークNWに接続されており、互いに通信を実行することが可能である。ネットワークNWは、例えば、インターネット、WAN(Wide Area Network)、イントラネット、LAN(Local Area Network)である。
【0020】
端末10-1、…及び端末10-cは、互いに異なる組織、機関等により管理されているコンピュータであり、例えば、サーバである。ここで言う機関は、例えば、企業の格付け機関、医療機関である。データ処理装置20は、端末10-1、…及び端末10-c各々から部分データを収集して解析するコンピュータであり、例えば、サーバである。
【0021】
端末10-1、…及び端末10-cは、それぞれ全体データの一部である部分データX、…及び部分データXを保有している。部分データX、…及び部分データXは、いずれも端末10-1、…又は端末10-cを管理している機関が秘匿する必要がある情報を示している。
【0022】
図2は、本発明の実施形態に係る全体データの一例を示す図である。全体データは、例えば、図2に示すように、サンプルごとに複数の特徴量が定義された構造を有しており、行列で表される。これらの特徴量は、例えば、全体データが企業の財務面に関するデータである場合、企業の格付けに関する特徴を表す指標である。或いは、これらの特徴量は、全体データが手書きの数字を描出している手書き数字画像に関するデータである場合、手書き数字画像に含まれている各画素に割り当てられている色に関するパラメータを表す指標である。
【0023】
図3は、本発明の実施形態に係る部分データの一例を示す図である。部分データは、例えば、図3に示すように、全体データに含まれるサンプルの一部について定義されている全ての特徴量を示すデータであり、行列で表される。図2に示した全体データは、例えば、図3に示した部分データX、…及び部分データXに分けられる。
【0024】
また、端末10-1、…及び端末10-cは、いずれも第一アンカーデータを保有している。第一アンカーデータは、端末10-1、…及び端末10-cに共通して配布されているデータであり、端末10-1、…又は端末10-cを管理している各機関が秘匿する必要がある情報を示していないデータである。
【0025】
また、第一アンカーデータは、部分データX、…及び部分データXに近いデータであることが好ましい。第一アンカーデータが部分データX、…及び部分データXに近いデータであるとは、第一アンカーデータに含まれる数値がとり得る範囲が部分データX、…及び部分データXに含まれる数値がとり得る範囲に近いことを意味する。或いは、第一アンカーデータが部分データX、…及び部分データXに近いデータであるとは、第一アンカーデータに含まれる属性が部分データX、…及び部分データXに含まれる属性に近いことを意味する。
【0026】
ただし、第一アンカーデータは、無作為に生成されたデータであってもよい。例えば、第一アンカーデータは、部分データX、…及び部分データXの少なくとも一つの中での特徴量の最小値から最大値までの範囲の乱数を示すデータであってもよい。或いは、第一アンカーデータは、部分データX、…又は部分データXに低ランク近似を適用した後に摂動を加えることにより生成されたデータであってもよい。また、第一アンカーデータは、端末10-1、…及び端末10-c各々により生成され、端末10-1、…及び端末10-cの間で相互に交換されたデータであってもよい。
【0027】
また、端末10-1、…及び端末10-cは、いずれも第二アンカーデータを保有している。第二アンカーデータは、端末10-1、…及び端末10-cに共通して配布されているデータであり、端末10-1、…又は端末10-cを管理している各機関が秘匿する必要がある情報を示していないデータである。
【0028】
また、第二アンカーデータは、部分データX、…及び部分データXに近いデータであることが好ましい。第二アンカーデータが部分データX、…及び部分データXに近いデータであるとは、第二アンカーデータに含まれる数値がとり得る範囲が部分データX、…及び部分データXに含まれる数値がとり得る範囲に近いことを意味する。或いは、第二アンカーデータが部分データX、…及び部分データXに近いデータであるとは、第二アンカーデータに含まれる属性が部分データX、…及び部分データXに含まれる属性に近いことを意味する。
【0029】
ただし、第二アンカーデータは、無作為に生成されたデータであってもよい。例えば、第二アンカーデータは、部分データX、…及び部分データXの少なくとも一つの中での特徴量の最小値から最大値までの範囲の乱数を示すデータであってもよい。或いは、第二アンカーデータは、部分データX、…又は部分データXに低ランク近似を適用した後に摂動を加えることにより生成されたデータであってもよい。また、第二アンカーデータは、端末10-1、…及び端末10-c各々により生成され、端末10-1、…及び端末10-cの間で相互に交換されたデータであってもよい。
【0030】
なお、第一アンカーデータと、第二アンカーデータとは、全く同じデータであってもよいし、異なるデータであってもよい。また、端末10-1は、例えば、自身がアクセス可能な記憶媒体に部分データX、第一アンカーデータ及び第二アンカーデータを保有している。この記憶媒体は、端末10-1からアクセス可能であればよく、端末10-1に含まれていてもよいし、端末10-1に含まれていなくてもよい。端末10-2、…、端末10-cは、同様の態様により、それぞれ記憶媒体に部分データX、第一アンカーデータ及び第二アンカーデータ、…、部分データX、第一アンカーデータ及び第二アンカーデータを保有している。
【0031】
次に、図4及び図5を参照しながら、実施形態に係る統合解析モデル生成システムの機能的な構成の一例について説明する。
【0032】
図4は、本発明の実施形態に係る端末の機能的な構成の一例を示す図である。図4に示すように、端末10-1は、抽象化関数生成部11-1、抽象化実行部12-1、抽象化関数破棄部13-1、データ送信部14-1、データ受信部15-1及びモデル生成部16-1を備える。
【0033】
同様に、端末10-2と、…、端末10-cとは、それぞれ抽象化関数生成部11-2、抽象化実行部12-2、抽象化関数破棄部13-2、データ送信部14-2、データ受信部15-2及びモデル生成部16-2と、…、抽象化関数生成部11-c、抽象化実行部12-c、抽象化関数破棄部13-c、データ送信部14-c、データ受信部15-c及びモデル生成部16-cとを備える。
【0034】
図5は、本発明の実施形態に係るデータ処理装置の機能的な構成の一例を示す図である。図5に示すように、データ処理装置20は、データ受信部21、ラベルデータ生成部22及びデータ送信部23を備える。
【0035】
抽象化関数生成部11-1は、部分データX、第一アンカーデータ及び第二アンカーデータに抽象化処理を施すために使用される抽象化関数fを生成する。同様に、抽象化関数生成部11-2.…及び抽象化関数生成部11-cは、それぞれ抽象化関数f、…及び抽象化関数fを生成する。
【0036】
また、抽象化関数生成部11-1、…及び抽象化関数生成部11-cの少なくとも一つは、部分データの一部を無作為に抽出する処理及び抽象化関数に無作為な要素を付与する処理の少なくとも一方により抽象化関数を生成してもよい。部分データの一部を無作為に抽出する処理は、例えば、ダウンサンプリングである。抽象化関数に無作為な要素を付与する処理は、例えば、抽象化関数にランダム摂動を付与する処理である。
【0037】
さらに、抽象化関数生成部11-1、…及び抽象化関数生成部11-cの少なくとも一つは、例えば、抽象化関数を生成する処理を開始した時刻に基づく所定の手法で決定された規則に従って部分データの一部を無作為に抽出してもよい。また、抽象化関数生成部11-1、…及び抽象化関数生成部11-cの少なくとも一つは、例えば、抽象化関数を生成する処理を開始した時刻に基づく所定の手法で決定されたランダム摂動を抽象化関数に付与してもよい。
【0038】
なお、これらの時刻は、例えば、マイクロ秒単位等の細かい単位で計測されている時刻であることが好ましい。なぜなら、細かい単位で計測されている時刻が使用されている場合、端末10-1、…又は端末10-cを管理している者にも時刻と無作為性との関係が分かり難くなることにより同じ抽象化関数を生成することが困難になり、部分データにより示されている情報を後述する抽象化部分データから割り出すことが困難になるからである。
【0039】
抽象化実行部12-1は、部分データXに抽象化関数fを適用して抽象化部分データWを生成する。同様に、抽象化実行部12-2、…及び抽象化実行部12-cは、それぞれ部分データX、…及び部分データXに抽象化関数f、…及び抽象化関数fを適用して抽象化部分データW、…及び抽象化部分データWを生成する。
【0040】
抽象化部分データWは、抽象化関数fで表される独自の抽象化処理により部分データXに含まれている特徴量を抽象化することで得られる数値データである。同様に、抽象化部分データWは、抽象化関数fで表される独自の抽象化処理により部分データXに含まれている特徴量を抽象化することで得られる数値データである。また、抽象化部分データWは、抽象化関数fで表される独自の抽象化処理により部分データXに含まれている特徴量を抽象化することで得られる数値データである。
【0041】
なお、抽象化実行部12-1は、抽象化部分データW及びラベルデータYの行を等しく無作為に入れ替えてもよい。同様に、抽象化実行部12-2、…及び抽象化実行部12-cは、それぞれ抽象化部分データW及びラベルデータY、…及び抽象化部分データW及びラベルデータYの行を等しく入れ替えてもよい。
【0042】
また、抽象化実行部12-1は、第一アンカーデータに抽象化関数fを適用して抽象化第一アンカーデータを生成する。同様に、抽象化実行部12-2、…及び抽象化実行部12-cは、それぞれ第一アンカーデータ、…及び第一アンカーデータに抽象化関数f、…及び抽象化関数fを適用して抽象化第一アンカーデータ、…及び抽象化第一アンカーデータを生成する。
【0043】
端末10-1により生成された第一抽象化アンカーデータWanc1 は、抽象化関数fで表される独自の抽象化処理により第一アンカーデータに含まれている特徴量の線形結合を示すデータである。同様に、端末10-2により生成された第一抽象化アンカーデータWanc1 は、抽象化関数fで表される独自の抽象化処理により第一アンカーデータに含まれている特徴量の線形結合を示すデータである。また、端末10-cにより生成された第一抽象化アンカーデータWanc1 は、抽象化関数fで表される独自の抽象化処理により第一アンカーデータに含まれている特徴量の線形結合を示すデータである。
【0044】
また、抽象化実行部12-1は、第二アンカーデータに抽象化関数fを適用して抽象化第二アンカーデータを生成する。同様に、抽象化実行部12-2、…及び抽象化実行部12-cは、それぞれ第二アンカーデータ、…及び第二アンカーデータに抽象化関数f、…及び抽象化関数fを適用して抽象化第二アンカーデータ、…及び抽象化第二アンカーデータを生成する。
【0045】
端末10-1により生成された第二抽象化アンカーデータWanc2 は、抽象化関数fで表される独自の抽象化処理により第二アンカーデータに含まれている特徴量の線形結合を示すデータである。同様に、端末10-2により生成された第二抽象化アンカーデータWanc2 は、抽象化関数fで表される独自の抽象化処理により第二アンカーデータに含まれている特徴量の線形結合を示すデータである。また、端末10-cにより生成された第二抽象化アンカーデータWanc2 は、抽象化関数fで表される独自の抽象化処理により第二アンカーデータに含まれている特徴量の線形結合を示すデータである。
【0046】
上述した抽象化処理は、目的関数を使用する線形もしくは非線形の次元削減法を使用する。次元削減法は、教師あり次元削減法と教師なし次元削減法とに大別される。教師あり次元削減法の例としては、線形判別分析(Linear Discriminant Analysis)、局所フィッシャー判別分析(Local Fisher Discriminant Analysis)が挙げられる。教師なし次元削減法の例としては、t分布型確率的近傍埋め込み法(t‐SNE:t-distributed Stochastic Neighbor Embedding)、主成分分析(Principal Component Analysis)、局所線形埋め込み(Local Linear Embedding)、局所接線空間アラインメント(Local Tangent Space Alignment)、局所性保存射影(Locality Preserving Projections)が挙げられる。或いは、上述した抽象化処理は、ディープラーニングの部分構造を使用する。
【0047】
抽象化関数破棄部13-1は、抽象化部分データW、第一抽象化アンカーデータWanc1 及び第二抽象化アンカーデータWanc2 が生成された後に、抽象化関数fを破棄する。同様に、抽象化関数破棄部13-2、…及び抽象化関数破棄部13-cは、それぞれ抽象化部分データW、第一抽象化アンカーデータWanc1 及び第二抽象化アンカーデータWanc2 、…、抽象化部分データW、第一抽象化アンカーデータWanc1 及び第二抽象化アンカーデータWanc2 が生成された後に、抽象化関数f、…及び抽象化関数fを破棄する。
【0048】
また、抽象化関数破棄部13-1は、抽象化部分データW、第一抽象化アンカーデータWanc1 及び第二抽象化アンカーデータWanc2 がデータ処理装置20に送信される前に、抽象化関数fを破棄することが好ましい。同様に、抽象化関数破棄部13-2、…及び抽象化関数破棄部13-cは、それぞれ抽象化部分データW、第一抽象化アンカーデータWanc1 及び第二抽象化アンカーデータWanc2 、…、抽象化部分データW、第一抽象化アンカーデータWanc1 及び第二抽象化アンカーデータWanc2 がデータ処理装置20に送信される前に、抽象化関数f、…及び抽象化関数fを破棄することが好ましい。
【0049】
データ送信部14-1は、抽象化部分データW、第一抽象化アンカーデータWanc1 、第二抽象化アンカーデータWanc2 及びラベルデータYをデータ処理装置20に送信する。同様に、データ送信部14-2、…及びデータ送信部14-cは、それぞれ抽象化部分データW、第一抽象化アンカーデータWanc1 、第二抽象化アンカーデータWanc2 及びラベルデータY、…、抽象化部分データW、第一抽象化アンカーデータWanc1 、第二抽象化アンカーデータWanc2 及びラベルデータYをデータ処理装置20に送信する。
【0050】
データ受信部21は、抽象化部分データW、第一抽象化アンカーデータWanc1 、第二抽象化アンカーデータWanc2 及びラベルデータYを端末10-1から受信する。同様に、データ受信部21は、抽象化部分データW、第一抽象化アンカーデータWanc1 、第二抽象化アンカーデータWanc2 及びラベルデータY…、抽象化部分データW、第一抽象化アンカーデータWanc1 、第二抽象化アンカーデータWanc2 及びラベルデータYをそれぞれ端末10-2、…及び端末10-cから受信する。
【0051】
ラベルデータ生成部22は、端末10-1から受信された第一抽象化アンカーデータWanc1 、…及び端末10-cから受信された第一抽象化アンカーデータWanc1 を使用して抽象化部分データW、…及び抽象化部分データWを統合することにより統合データZを生成する。また、ラベルデータ生成部22は、第一抽象化アンカーデータWanc1 …及び第一抽象化アンカーデータWanc1 を使用して第二抽象化アンカーデータWanc2 、…及び第二抽象化アンカーデータWanc2 を統合することにより統合第二アンカーデータZanc2を生成する。
【0052】
次に、ラベルデータ生成部22は、統合データZに含まれる要素Z、…及び要素Z各々が示す内容に対応するラベルを示すラベルデータY、…及びラベルデータYを統合データZに基づいて出力する統合解析モデルhを生成する。
【0053】
次に、ラベルデータ生成部22は、統合第二アンカーデータZanc2及び統合解析モデルhから統合第二アンカーデータZanc2に含まれる要素Zanc2 、…及び要素Zanc2 各々が示す内容に対応するラベルを示す第二ラベルデータYanc2 、…及び第二ラベルデータYanc2 を生成する。第二ラベルデータYanc2 、…及び第二ラベルデータYanc2 は、いずれも統合第二アンカーデータZanc2に含まれる要素が示す内容に対応するラベルを示す。
【0054】
具体的には、ラベルデータ生成部22は、端末10-1から受信した第一抽象化アンカーデータWanc1 を仮統合用関数eを使用して仮統合用データに変換する。同様に、ラベルデータ生成部22は、端末10-2から受信した第一抽象化アンカーデータWanc1 を仮統合用関数eを使用して仮統合用データに変換する。また、同様に、ラベルデータ生成部22は、端末10-cから受信した第一抽象化アンカーデータWanc1 を仮統合用関数eを使用して仮統合用データに変換する。仮統合用関数e、…、仮統合用関数eは、線形又は非線形の関数である。
【0055】
次に、ラベルデータ生成部22は、これらc個の仮統合用データ相互の差が小さくなる仮統合用関数e、…、仮統合用関数eを統合用関数g、…、統合用関数gcとして算出する。また、生成部220は、これらc個の仮統合用データ相互の差が出来る限り小さくなる仮統合用関数e、…、仮統合用関数eを統合用関数g、…、統合用関数gとして算出することが好ましい。
【0056】
統合用関数g、…、統合用関数gを算出する問題は、例えば、最小化問題に帰着する。特に、仮統合用関数が線形の関数である場合、この問題は、一般化された総最小二乗法(TLS:Total Least Squares)問題に帰着する。ラベルデータ生成部22は、統合用関数g、…、統合用関数gに基づいて統合解析モデルhを生成する。ラベルデータY、…及びラベルデータYを合わせたデータYと、統合データZと、統合解析モデルhとは、Y≒h(Z)で表される関係を有する。そして、ラベルデータ生成部22は、統合第二アンカーデータZanc2及び統合解析モデルhを使用して第二ラベルデータYanc2 、…及び第二ラベルデータYanc2 を生成する。
【0057】
データ送信部23は、第二ラベルデータYanc2 を端末10-1に送信する。同様に、データ送信部23は、第二ラベルデータYanc2 、…及び第二ラベルデータYanc2 をそれぞれ端末10-2、…及び端末10-cに送信する。
【0058】
データ受信部15-1は、第二ラベルデータYanc2 をデータ処理装置20から受信する。同様に、データ受信部15-2、…及びデータ受信部15-cは、それぞれ第二ラベルデータYanc2 、…及び第二ラベルデータYanc2 をデータ処理装置20から受信する。
【0059】
モデル生成部16-1は、第二アンカーデータと、第二ラベルデータYanc2 とを使用して第二アンカーデータにより示される内容と、第二ラベルデータYanc2 により示される内容との関係を示す統合解析モデルtを生成する。同様に、モデル生成部16-2、…及びモデル生成部16-cは、それぞれ統合解析モデルt、…及び統合解析モデルtを生成する。統合解析モデルtは、端末10-1により新たに受信された部分データに対して使用されるモデルである。同様に、統合解析モデルt、…及び統合解析モデルtは、それぞれ端末10-2により新たに受信された部分データ、…及び端末10-cにより新たに受信された部分データに対して使用されるモデルである。
【0060】
次に、図6を参照しながら、端末10-1、…及び端末10-cと、データ処理装置20とが実行する処理の一例を説明する。図6は、本発明の実施形態に係る端末及びデータ処理装置が実行する処理の一例を示すシーケンス図である。図6を使用した説明では、端末10-1を例に挙げるが、端末10-2、…、端末10-cについても同様である。
【0061】
ステップS10において、抽象化関数生成部11-1は、抽象化関数を生成する。
【0062】
ステップS20において、抽象化実行部12-1は、抽象化部分データ、第一抽象化アンカーデータ及び第二抽象化アンカーデータを生成する。
【0063】
ステップS30において、抽象化関数破棄部13-1は、抽象化関数を破棄する。
【0064】
ステップS40において、データ送信部14-1は、抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを送信する。
【0065】
ステップS50において、データ受信部21は、抽象化部分データ、第一抽象化アンカーデータ、第二抽象化アンカーデータ及びラベルデータを受信する。
【0066】
ステップS60において、ラベルデータ生成部22は、統合データを生成し、統合解析モデルを生成する。
【0067】
ステップS70において、ラベルデータ生成部22は、統合第二アンカーデータを生成し、統合第二アンカーデータ及び統合解析モデルを使用して第二ラベルデータを生成する。
【0068】
ステップS80において、データ送信部23は、第二ラベルデータを送信する。
【0069】
ステップS90において、データ受信部15-1は、第二ラベルデータを受信する。
【0070】
ステップS100において、モデル生成部16-1は、第二アンカーデータにより示される内容と、第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成する。
【0071】
以上、実施形態に係る統合解析モデル生成システム1について説明した。統合解析モデル生成システム1は、端末10-1等と、データ処理装置20とを備える。端末10-1等は、抽象化関数を生成し、抽象化関数により抽象化部分データ、第一抽象化アンカーデータ及び第二抽象化アンカーデータを生成し、抽象化関数を破棄し、これら三つのデータ及びラベルデータをデータ処理装置20に送信する。データ処理装置20は、第一抽象化アンカーデータを使用して複数の抽象化部分データを統合して統合データZを生成し、統合データZに含まれる要素が示す内容に対応するラベルを示すラベルデータを統合データZに基づいて出力する統合解析モデルhを生成し、複数の第二抽象化アンカーデータを統合して統合第二アンカーデータを生成し、統合第二アンカーデータ及び統合解析モデルhを使用して第二ラベルデータを生成して端末10-1等に送信する。端末10-1等は、第二アンカーデータと、第二ラベルデータとを使用して第二アンカーデータにより示される内容と、第二ラベルデータにより示される内容との関係を示す統合解析モデルを生成する。
【0072】
これにより、統合解析モデル生成システム1は、抽象化関数を使用した後、当該抽象化関数を破棄するため、部分データと、抽象化部分データとを照合することを不可能にすることができる。
【0073】
また、端末10-1等は、抽象化部分データ、第一抽象化アンカーデータ及び第二抽象化アンカーデータがデータ処理装置に送信される前に、抽象化関数を破棄する。これにより、統合解析モデル生成システム1は、抽象化関数を使用した後、当該抽象化関数が端末10-1等を管理している者以外の者に漏洩し、部分データと、抽象化部分データとが照合されてしまう事態を更に確実に回避することができる。
【0074】
また、端末10-1等は、部分データの一部を無作為に抽出する処理及び抽象化関数に無作為な要素を付与する処理の少なくとも一方により抽象化関数を生成する。これにより、統合解析モデル生成システム1は、当該抽象化関数と同じ抽象化関数を生成することを不可能にし、部分データと、抽象化部分データとが照合されてしまう事態を更に確実に回避することができる。
【0075】
また、端末10-1等は、抽象化部分データとラベルデータの行を等しく無作為に入れ替える。これにより、統合解析モデル生成システム1は、部分データと、抽象化部分データとを照合する処理を困難にし、部分データと、抽象化部分データとが照合されてしまう事態を更に確実に回避することができる。
【0076】
次に、図7及び図8を参照しながら、実施形態に係る統合解析モデル生成システムを具体的な事例に適用した結果について説明する。
【0077】
図7は、本発明の実施形態に係る端末により生成された統合解析モデルを使用して企業の格付を示す抽象化部分データを統合して解析した場合における機関の数と正解率との関係等の一例を示す図である。図7に示した場合における全体データは、運転資本/総資産、内部留保/総資産、税引前利払前利益/総資産、株式時価総額/全債務の簿価、売上高/総資産及び業種の特徴量を有する3932個のデータであり、各データに対してAAAからCCCまでの七つのラベルが設定されている。
【0078】
図7に示した場合における第一アンカーデータは、各特徴量の最小値から最大値までの範囲の一様乱数を示すデータである。また、この場合における第二アンカーデータは、各機関により保有されている部分データに特異値分解による低ランク近似を施し、ノイズを加えて線形結合させることにより生成されたデータである。
【0079】
図7に示した場合における抽象化関数は、機関ごとに乱数摂動を加えたデータに主成分分析を適用して生成された抽象化関数である。なお、主成分分析は、部分データに依存した次元削減法であるため、機関ごとに抽象化法が相違することとなる。また、図7に示した場合における抽象化部分データは、行が無作為に入れ替えられている。
【0080】
図7に示した場合における統合用関数は、一般化された総最小二乗法問題を解くことにより生成されている。また、図7に示した場合における統合データは、ガウスカーネルを使用したカーネル版リッジ回帰を使用して解析されている。さらに、図7に示した場合において、端末により生成される統合解析モデルは、ガウスカーネルを使用したカーネル版リッジ回帰を使用して生成されている。
【0081】
図7の横軸は、機関の数を表している。図7の縦軸は、解析した結果の正解率を表している。図7に示した実線は、実施形態に係る端末により生成された統合解析モデルを使用して企業の格付を示す抽象化部分データを統合して解析した場合における機関の数と正解率との関係を表している。図7に示した破線は、企業の格付を示す部分データと、抽象化部分データとの照合を不可能にするための処理を実行せずに解析した場合における機関の数と正解率との関係を表している。図7に示した一点鎖線は、抽象化部分データではなく、企業の格付を示す部分データを統合して解析した場合における機関の数と正解率との関係を表している。図7に示した二点鎖線は、一つの部分データを当該部分データを保有している機関のみで解析した場合における機関の数と正解率との関係を表している。
【0082】
図7に示した実線と、図7に示した破線とを比較すると、実施形態に係る端末により生成された統合解析モデルを使用して企業の格付を示す抽象化部分データを統合して解析した場合における正解率は、抽象化部分データとの照合を不可能にするための処理を実行せずに解析した場合における正解率を下回っているものの、比較的高い正解率を示していることが分かる。
【0083】
また、図7に示した実線と、図7に示した一点鎖線とを比較すると、実施形態に係る端末により生成された統合解析モデルを使用して企業の格付を示す抽象化部分データを統合して解析した場合における正解率は、部分データを統合して解析した場合における正解率を上回っていることが分かる。
【0084】
また、図7に示した実線と、図7に示した二点鎖線とを比較すると、実施形態に係る端末により生成された統合解析モデルを使用して企業の格付を示す抽象化部分データを統合して解析した場合における正解率は、一つの部分データを当該部分データを保有している機関のみで解析した場合における正解率を上回っていることが分かる。
【0085】
図8は、本発明の実施形態に係る端末により生成された統合解析モデルを使用して手書きの数字を示す抽象化部分データを統合して解析した場合における機関の数と正解率との関係等の一例を示す図である。図8の横軸は、機関の数を表している。
【0086】
図8に示した場合における全体データは、縦及び横の画素の数がいずれも28個であるグレースケール画像として表示されている「0」から「9」の手書きの数字を示すデータである。図8に示した場合における他の条件、手順等は、図7に示した場合における条件、手順等と同様である。
【0087】
図8の縦軸は、解析した結果の正解率を表している。図8に示した実線は、実施形態に係る端末により生成された統合解析モデルを使用して手書きの数字を示す抽象化部分データを統合して解析した場合における機関の数と正解率との関係を表している。図8に示した破線は、手書きの数字を示す部分データと、抽象化部分データとの照合を不可能にするための処理を実行せずに解析した場合における機関の数と正解率との関係を表している。図8に示した一点鎖線は、抽象化部分データではなく、手書きの数字を示す部分データを統合して解析した場合における機関の数と正解率との関係を表している。図8に示した二点鎖線は、一つの部分データを当該部分データを保有している機関のみで解析した場合における機関の数と正解率との関係を表している。
【0088】
図8に示した実線と、図8に示した破線とを比較すると、実施形態に係る端末により生成された統合解析モデルを使用して手書きの数字を示す抽象化部分データを統合して解析した場合における正解率は、抽象化部分データとの照合を不可能にするための処理を実行せずに解析した場合における正解率を上回っていることが分かる。
【0089】
また、図8に示した実線と、図8に示した一点鎖線とを比較すると、実施形態に係る端末により生成された統合解析モデルを使用して手書きの数字を示す抽象化部分データを統合して解析した場合における正解率は、部分データを統合して解析した場合における正解率を若干下回っていることが分かる。
【0090】
また、図8に示した実線と、図8に示した二点鎖線とを比較すると、実施形態に係る端末により生成された統合解析モデルを使用して手書きの数字を示す抽象化部分データを統合して解析した場合における正解率は、一つの部分データを当該部分データを保有している機関のみで解析した場合における正解率を上回っていることが分かる。
【0091】
なお、端末10-1、…、端末10-c、データ処理装置20が有する機能の少なくとも一部は、回路部(circuitry)を含むハードウェアがプログラムを実行することにより実現されてもよい。ここで言うハードウェアは、例えば、CPU(Central Processing Unit)、LSI(Large Scale Integration)、ASIC(Application Specific Integrated Circuit)、FPGA(Field-Programmable Gate Array)、GPU(Graphics Processing Unit)である。また、上述したプログラムは、記憶媒体を備える記憶装置に格納されている。ここで言う記憶媒体は、例えば、HDD(Hard Disk Drive)、フラッシュメモリ、ROM(Read Only Memory)、DVD(Digital Versatile Disc)である。さらに、上述したプログラムは、端末10-1、…、端末10-c、データ処理装置20が有する機能の一部を実現する差分プログラムであってもよい。
【0092】
また、上述した統合解析モデル生成システム1は、企業の財務面に関するデータ及び手書き数字画像に関するデータ以外のデータにも適用可能である。例えば、上述した統合解析モデル生成システム1は、農業に関するデータ、スマートシティに関するデータ、製造業に属する企業が有する開発に関するデータ等にも適用可能である。
【0093】
以上、本発明の実施形態について図面を参照しながら説明した。ただし、統合解析モデル生成システム1は、上述した実施形態に限られるものではなく、本発明の要旨を逸脱しない範囲内において種々の変形、置換、組み合わせ又は設計変更が加えられ得る。
【符号の説明】
【0094】
1…統合解析モデル生成システム、10-1,…,10-c…端末、11-1,…,11-c…抽象化関数生成部、12-1,…,12-c…抽象化実行部、13-1,…,13-c…抽象化関数破棄部、14-1,…,14-c…データ送信部、15-1,…,15-c…データ受信部、16-1,…,16-c…モデル生成部、20…データ処理装置、21…データ受信部、22…ラベルデータ生成部、23…データ送信部
図1
図2
図3
図4
図5
図6
図7
図8