特許7571932 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

青山学院大学 (神奈川県相模原市中央区淵野辺)

▶ バイドゥ　オンライン　ネットワーク　テクノロジー（ペキン）　カンパニー　リミテッドの特許一覧

特許7571932相関係数取得方法、装置、電子機器および記憶媒体

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-15

(45)【発行日】2024-10-23

(54)【発明の名称】相関係数取得方法、装置、電子機器および記憶媒体

(51)【国際特許分類】

H04L 9/30 20060101AFI20241016BHJP

G09C 1/00 20060101ALI20241016BHJP

【ＦＩ】

H04L9/30 Z

G09C1/00 650Z

【請求項の数】 17

(21)【出願番号】P 2023015662

(22)【出願日】2023-02-03

(65)【公開番号】P2023114996

(43)【公開日】2023-08-18

【審査請求日】2023-02-03

(31)【優先権主張番号】202210116753.3

(32)【優先日】2022-02-07

(33)【優先権主張国・地域又は機関】CN

(73)【特許権者】

【識別番号】512015127

【氏名又は名称】バイドゥオンラインネットワークテクノロジー（ペキン）カンパニーリミテッド

(74)【代理人】

【識別番号】100107766

【弁理士】

【氏名又は名称】伊東忠重

(74)【代理人】

【識別番号】100070150

【弁理士】

【氏名又は名称】伊東忠彦

(74)【代理人】

【識別番号】100135079

【弁理士】

【氏名又は名称】宮崎修

(72)【発明者】

【氏名】彭勝波

(72)【発明者】

【氏名】周吉文

【審査官】中里裕正

(56)【参考文献】

【文献】特開２０１３－２０５７９６（ＪＰ，Ａ）

【文献】安田雅哉他，複数企業が持つ購買履歴データクラウド秘匿集計，2012年暗号と情報セキュリティシンポジウム予稿集，2012年，pp.1-8

【文献】YASUDA, M., et al.，Secure Statistical Analysis Using RLWE-Based Homomorphic Encryption，Lecture Notes in Computer Science， Vol.9144，2015年， pp.471-487

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｈ０４Ｌ９／３０

Ｇ０９Ｃ１／００

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

ＩＥＥＥＸｐｌｏｒｅ

(57)【特許請求の範囲】

【請求項1】

第１参加ノードに適用される相関係数取得方法であって、
第１元データを取得し、前記第１参加ノードと第２参加ノードで互いに決めた関連鍵を用いて前記第１元データを準同型暗号化し、第１伝送データを確定することと、
補助ノードが前記第１伝送データを受信し、前記第１伝送データおよび第２伝送データを準同型演算して前記第１元データと第２元データとの間の相関係数を取得するように、前記第１伝送データを補助ノードに送信し、前記第２伝送データが、前記第２参加ノードによって前記関連鍵を用いて前記第２元データを準同型暗号化することで確定されることと、
前記補助ノードからフィードバックされる前記相関係数を受信することとを含み、
関連鍵を用いて前記第１元データを準同型暗号化し、第１伝送データを確定することは、
関連鍵を用いて前記第１元データを準同型暗号化し、準同型暗号化された第１元データを取得することと、
前記第１元データおよび前記相関係数の計算式に基づいて第１中間データを計算することと、
前記関連鍵を用いて前記第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得することと、
前記準同型暗号化された第１元データおよび前記準同型暗号化された第１中間データを第１伝送データとして確定することと、を含む、
相関係数取得方法。

【請求項2】

関連鍵を用いて前記第１元データを準同型暗号化することは、
関連鍵に基づいて第１乱数を計算することと、
前記第１乱数に基づいて前記第１元データを準同型暗号化することと、を含む、
請求項１に記載の方法。

【請求項3】

関連鍵を用いて前記第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得することは、
前記関連鍵に基づいて第２乱数を計算することと、
前記第２乱数に基づいて前記第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得することと、を含む、
請求項１に記載の方法。

【請求項4】

前記第１中間データは、前記第１元データの期待および／または分散を含む、
請求項１に記載の方法。

【請求項5】

前記準同型暗号化された第１元データおよび前記準同型暗号化された第１中間データを第１伝送データとして確定することは、
前記補助ノードから送信される公開鍵を取得することと、
前記公開鍵に基づいて前記準同型暗号化された第１中間データを暗号化し、前記準同型暗号化された第１元データおよび公開鍵暗号化された第１中間データを第１伝送データとして確定し、前記補助ノードに前記公開鍵暗号化された第１中間データを秘密鍵で復号させ、前記準同型暗号化された第１中間データを取得することと、を含む、
請求項３に記載の方法。

【請求項6】

サンプルデータセットにおいて、前記第１元データと前記第２元データとの間の相関係数に基づいて前記第１元データを選別し、前記サンプルデータセットに前記第１元データが含まれ、前記サンプルデータセットが連合モデルをトレーニングすることに用いられることを更に含む、
請求項１に記載の方法。

【請求項7】

補助ノードに適用される相関係数取得方法であって、
第１参加ノードから送信される第１伝送データ、および第２参加ノードから送信される第２伝送データを受信することと、
前記第１伝送データおよび前記第２伝送データを準同型演算し、第１元データと第２元データとの間の相関係数を取得し、前記第１伝送データが、前記第１参加ノードよって関連鍵を用いて前記第１元データを準同型暗号化することで確定され、前記第２伝送データが、前記第２参加ノードよって前記関連鍵を用いて前記第２元データを準同型暗号化することで確定され、前記関連鍵が、前記第１参加ノードと第２参加ノードで互いに決められることと、
前記相関係数を前記第１参加ノードおよび前記第２参加ノードに送信することとを含み、
前記第１伝送データおよび前記第２伝送データを準同型演算することは、
鍵ペアを取得することと、
前記鍵ペア内の秘密鍵に基づき、前記第１伝送データ内の公開鍵暗号化された第１中間データを復号し、準同型暗号化された第１中間データを取得することと、
前記鍵ペア内の秘密鍵に基づき、前記第２伝送データ内の公開鍵暗号化された第２中間データを復号し、準同型暗号化された第２中間データを取得することと、
前記準同型暗号化された第１中間データ、前記第１伝送データに含まれる準同型暗号化された第１元データ、前記準同型暗号化された第２中間データ、および前記第２伝送データに含まれる準同型暗号化された第２元データを準同型演算することとを含み、
前記鍵ペア内の公開鍵が、前記第１参加ノードおよび前記第２参加ノードに送信されてデータ暗号化を行うことに用いられる、
相関係数取得方法。

【請求項8】

第１参加ノードに配置される相関係数取得装置であって、
第１元データを取得し、前記第１参加ノードと第２参加ノードで互いに決めた関連鍵を用いて前記第１元データを準同型暗号化し、第１伝送データを確定するための第１元データ準同型暗号化モジュールと、
補助ノードが前記第１伝送データを受信し、前記第１伝送データおよび第２伝送データを準同型演算して前記第１元データと第２元データとの間の相関係数を取得するように、前記第１伝送データを補助ノードに送信するための第１伝送データ送信モジュールであって、前記第２伝送データが、前記第２参加ノードによって前記関連鍵を用いて前記第２元データを準同型暗号化することで確定される第１伝送データ送信モジュールと、
前記補助ノードからフィードバックされる前記相関係数を受信するための相関係数取得モジュールとを備え、
前記第１元データ準同型暗号化モジュールは、
関連鍵を用いて前記第１元データを準同型暗号化し、準同型暗号化された第１元データを取得するためのデータ準同型暗号化ユニットと、
前記第１元データおよび前記相関係数の計算式に基づいて第１中間データを計算するための第１中間データ計算ユニットと、
前記関連鍵を用いて前記第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得するための第１中間データ準同型暗号化ユニットと、
前記準同型暗号化された第１元データおよび前記第１中間データを第１伝送データとして確定するための第１伝送データ確定ユニットとを備える、
相関係数取得装置。

【請求項9】

前記第１元データ準同型暗号化モジュールは、
関連鍵に基づいて第１乱数を計算するための第１乱数計算ユニットと、
前記第１乱数に基づいて前記第１元データを準同型暗号化するための第１乱数暗号化ユニットと、を備える、
請求項８に記載の装置。

【請求項10】

前記第１中間データ準同型暗号化ユニットは、
前記関連鍵に基づいて第２乱数を計算するための第２乱数計算サブユニットと、
前記第２乱数に基づいて前記第１中間データを準同型暗号化するための第２乱数準同型暗号化サブユニットと、を備える、
請求項８に記載の装置。

【請求項11】

前記第１中間データは、前記第１元データの期待および／または分散を含む、
請求項８に記載の装置。

【請求項12】

第１中間データ追加サブユニットは、
前記補助ノードから送信される公開鍵を取得し、
前記公開鍵に基づいて前記準同型暗号化された第１中間データを暗号化し、前記準同型暗号化された第１元データおよび公開鍵暗号化された第１中間データを第１伝送データとして確定し、前記補助ノードに前記公開鍵暗号化された第１中間データを秘密鍵で復号させ、前記準同型暗号化された第１中間データを取得することに用いられる、
請求項１０に記載の装置。

【請求項13】

サンプルデータセットにおいて、前記第１元データと前記第２元データとの間の相関係数に基づいて前記第１元データを選別するためのサンプルデータ選別モジュールであって、前記サンプルデータセットに前記第１元データが含まれ、サンプルデータセットが連合モデルをトレーニングすることに用いられるサンプルデータ選別モジュールを更に備える、
請求項８に記載の装置。

【請求項14】

補助ノードに配置される相関係数取得装置であって、
第１参加ノードから送信される第１伝送データ、および第２参加ノードから送信される第２伝送データを受信するための伝送データ取得モジュールと、
前記第１伝送データおよび前記第２伝送データを準同型演算し、第１元データと第２元データとの間の相関係数を取得するための伝送データ準同型演算モジュールであって、前記第１伝送データが、前記第１参加ノードよって関連鍵を用いて前記第１元データを準同型暗号化することで確定され、前記第２伝送データが、前記第２参加ノードよって前記関連鍵を用いて前記第２元データを準同型暗号化することで確定され、前記関連鍵が、前記第１参加ノードと第２参加ノードで互いに決められる伝送データ準同型演算モジュールと、
前記相関係数を前記第１参加ノードおよび前記第２参加ノードに送信するための相関係数送信モジュールとを備え、
前記伝送データ準同型演算モジュールは、
鍵ペアを取得するための鍵ペア取得ユニットと、
前記鍵ペア内の秘密鍵に基づき、前記第１伝送データ内の公開鍵暗号化された第１中間データを復号し、準同型暗号化された第１中間データを取得するための第１中間データ復号ユニットと、
前記鍵ペア内の秘密鍵に基づき、前記第２伝送データ内の公開鍵暗号化された第２中間データを復号し、準同型暗号化された第２中間データを取得するための第２中間データ復号ユニットと、
前記準同型暗号化された第１中間データ、前記第１伝送データに含まれる準同型暗号化された第１元データ、前記準同型暗号化された第２中間データ、および前記第２伝送データに含まれる準同型暗号化された第２元データを準同型演算するための準同型演算ユニットと、
を備え、
前記鍵ペア内の公開鍵は、前記第１参加ノードおよび前記第２参加ノードに送信されてデータ暗号化を行うことに用いられる、
相関係数取得装置。

【請求項15】

少なくとも１つのプロセッサと、
前記少なくとも１つのプロセッサに通信接続されたメモリとを備える電子機器であって、
前記メモリに、前記少なくとも１つのプロセッサによって実行可能な命令が記憶され、
前記命令は、前記少なくとも１つのプロセッサが請求項１から７のいずれか１項に記載の相関係数取得方法を実行可能であるように、前記少なくとも１つのプロセッサにより実行される、
電子機器。

【請求項16】

コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体であって、
前記コンピュータ命令は、請求項１から７のいずれか１項に記載の相関係数取得方法をコンピュータに実行させることに用いられる、
非一時的なコンピュータ可読記憶媒体。

【請求項17】

プロセッサにより実行されると、請求項１から７のいずれか１項に記載の相関係数取得方法を実現する、
コンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、データ処理の分野に関し、具体的には、ビッグデータ、深層学習および人工知能の技術分野に関し、特に、相関係数取得方法、装置、電子機器および記憶媒体に関する。

【背景技術】

【0002】

現在、データ間の相関分析は、人々の決定に大きく影響を与える。特に、インターネットにおける大量のデータに対し、データ間の相関分析に基づいてデータを選別することができ、ユーザによるデータ処理を支援することができる。

【0003】

例えば、連合学習モデルのトレーニング過程において、複数の参加者が提供するサンプルデータを集束する必要がある。サンプルデータ間の相関分析を用いて連合学習モデルに入力されたサンプルデータを選別することができる。

【発明の概要】

【発明が解決しようとする課題】

【0004】

本開示は、相関係数取得方法、装置、電子機器および記憶媒体を提供する。

【課題を解決するための手段】

【0005】

本開示の一態様によれば、
第１参加ノードに適用される相関係数取得方法であって、
第１元データを取得し、第１参加ノードと第２参加ノードで互いに決めた関連鍵を用いて第１元データを準同型暗号化し、第１伝送データを確定することと、
補助ノードが第１伝送データを受信し、第１伝送データおよび第２伝送データを準同型演算して第１元データと第２元データとの間の相関係数を取得するように、第１伝送データを補助ノードに送信し、第２伝送データが、第２参加ノードによって関連鍵を用いて第２元データを準同型暗号化することで確定されることと、
補助ノードからフィードバックされる相関係数を受信することとを含む、
相関係数取得方法を提供する。

【0006】

本開示の別の態様によれば、
補助ノードに適用される相関係数取得方法であって、
第１参加ノードから送信される第１伝送データ、および第２参加ノードから送信される第２伝送データを受信することと、
第１伝送データおよび第２伝送データを準同型演算し、第１元データと第２元データとの間の相関係数を取得し、第１伝送データが、第１参加ノードによって関連鍵を用いて第１元データを準同型暗号化することで確定され、第２伝送データが、第２参加ノードよって関連鍵を用いて第２元データを準同型暗号化することで確定され、関連鍵が、第１参加ノードと第２参加ノードで互いに決められることと、
相関係数を第１参加ノードおよび第２参加ノードに送信することとを含む、
相関係数取得方法を提供する。

【0007】

本開示の一態様によれば、
第１参加ノードに配置される相関係数取得装置であって、
第１元データを取得し、第１参加ノードと第２参加ノードで互いに決めた関連鍵を用いて第１元データを準同型暗号化し、第１伝送データを確定するための第１元データ準同型暗号化モジュールと、
補助ノードが第１伝送データを受信し、第１伝送データおよび第２伝送データを準同型演算して第１元データと第２元データとの間の相関係数を取得するように、第１伝送データを補助ノードに送信するための第１伝送データ送信モジュールであって、第２伝送データが、第２参加ノードによって関連鍵を用いて第２元データを準同型暗号化することで確定される第１伝送データ送信モジュールと、
補助ノードからフィードバックされる相関係数を受信するための相関係数取得モジュールとを備える、
相関係数取得装置を提供する。

【0008】

本開示の別の態様によれば、
補助ノードに配置される相関係数取得装置であって、
第１参加ノードから送信される第１伝送データ、および第２参加ノードから送信される第２伝送データを受信するための伝送データ取得モジュールと、
第１伝送データおよび第２伝送データを準同型演算し、第１元データと第２元データとの間の相関係数を取得するための伝送データ準同型演算モジュールであって、第１伝送データが、第１参加ノードよって関連鍵を用いて第１元データを準同型暗号化することで確定され、第２伝送データが、第２参加ノードよって関連鍵を用いて第２元データを準同型暗号化することで確定され、関連鍵が、第１参加ノードと第２参加ノードで互いに決められる伝送データ準同型演算モジュールと、
相関係数を第１参加ノードおよび第２参加ノードに送信するための相関係数送信モジュールとを備える、
相関係数取得装置を提供する。

【0009】

本開示の別の態様によれば、
少なくとも１つのプロセッサと、
少なくとも１つのプロセッサに通信接続されたメモリとを備える電子機器であって、
メモリに、少なくとも１つのプロセッサによって実行可能な命令が記憶され、
命令は、少なくとも１つのプロセッサが本開示のいずれかの実施例の相関係数取得方法を実行可能であるように、少なくとも１つのプロセッサにより実行される、
電子機器を提供する。

【0010】

本開示の別の態様によれば、
コンピュータ命令が記憶された非一時的なコンピュータ可読記憶媒体であって、
コンピュータ命令は、本開示のいずれかの実施例の相関係数取得方法をコンピュータに実行させることに用いられる、
非一時的なコンピュータ可読記憶媒体を提供する。

【0011】

本開示の別の態様によれば、
プロセッサにより実行されると、本開示のいずれかの実施例の相関係数取得方法を実現する、
コンピュータプログラムを提供する。

【発明の効果】

【0012】

本開示の実施例は、相関係数計算データの安全性を向上させることができる。

【0013】

本開示に記載された内容は、本開示の実施例のキーとなるまたは重要な特徴を標識するためのものではなく、本開示の範囲を限定するものでもないことが理解されるべきである。本開示の他の特徴は、以下の明細書により容易に理解することができる。

【図面の簡単な説明】

【0014】

図面は本形態をより良く理解するためのものであり、本開示を限定するものではない。

【0015】

【図1】本開示の実施例に係る相関係数取得方法の模式図である。

【図2】本開示の実施例に係る相関係数取得方法の模式図である。

【図3】本開示の実施例に係る相関係数取得方法の模式図である。

【図4】本開示の実施例に係る相関係数取得方法の模式図である。

【図5】本開示の実施例に係る相関係数取得方法のシーン図である。

【図6】本開示の実施例に係る相関係数取得装置の模式図である。

【図7】本開示の実施例に係る相関係数取得装置の模式図である。

【図8】本開示の実施例の相関係数取得方法を実現するための電子機器のブロック図である。

【発明を実施するための形態】

【0016】

以下、図面を参照しながら本開示の例示的な実施例について説明し、ここで、理解の便宜上、本開示の実施例に係る様々な細かい内容まで含まれているが、例示的なものに過ぎないと理解すべきである。同様に、以下の説明において、公知されている機能および構造の説明は、明確且つ簡潔にするために省略している。

【0017】

図１は、本開示の実施例による相関係数取得方法のフローチャートであり、本実施例は、２つの参加ノードの元データ間の相関性を計算する場合に適用される。本実施例の方法は、相関係数取得装置で実行することができ、該装置は、ソフトウェアおよび／またはハードウェアの方式で実現でき、具体的には、一定のデータ演算能力を持つ電子機器に構成され、該電子機器は第１参加ノードであり、該電子機器は、クライアント機器またはサーバ機器であってもよく、クライアント機器は、例えば、携帯電話機、タブレットコンピュータ、車載端末およびデスクトップコンピュータ等である。

【0018】

Ｓ１０１において、第１元データを取得し、第１参加ノードと第２参加ノードで互いに決めた関連鍵を用いて第１元データを準同型暗号化し、第１伝送データを確定する。

【0019】

第１元データは、相関係数を計算することに用いられる。第１元データの内容は任意に設定することができ、例えば、連合学習モデルのトレーニングサンプルデータであってもよいし、ユーザ行動データ、車両走行軌跡データまたは顔画像データ等であってもよいし、広告配信、金融信用またはナレッジグラフ等の大量のデータであってもよい。関連鍵は、第１元データを準同型暗号化することに用いられる。関連鍵が第１参加ノードと第２参加ノードで互いに決められることは、第１参加ノードおよび第２参加ノードのみが該関連鍵を取得することができ、他の機器が取得も復号もできないことを意味する。例示的には、第１参加ノードおよび第２参加ノードは、鍵共有プロトコル（ＤｉｆｆｉｅＨｅｌｌｍａｎ、ＤＨ）により関連鍵を約定して確定することができる。第１参加ノードと第２参加ノードとは異なるノードである。第１参加ノードのデータおよび第２参加ノードのデータに対して相関性計算を行う必要がある。第１伝送データは、第２参加ノードから送信される第２伝送データと準同型演算を行うことに用いられる。第１伝送データは、第１参加ノードが提供する相関係数を計算待ちデータを指してもよく、第１伝送データは、少なくとも準同型暗号化された第１元データを含む。

【0020】

ここで、準同型暗号化は、準同型暗号化されたデータを処理して得られた１つの出力を意味し、この出力を復号した結果は、同じ方法で暗号化されていない元データを処理して得られた出力結果と同じであり、具体的には、データを復号しない場合に暗号文を加算および／または乗算した結果は、対応する平文に対して同じ演算を行って得られた計算結果と同じである。

【0021】

Ｓ１０２において、補助ノードが第１伝送データを受信し、第１伝送データおよび第２伝送データを準同型演算して第１元データと第２元データとの間の相関係数を取得するように、第１伝送データを補助ノードに送信し、第２伝送データが、第２参加ノードによって関連鍵を用いて第２元データを準同型暗号化することで確定される。

【0022】

補助ノードは、第１参加ノードから送信される第１伝送データを受信し、第２参加ノードから送信される第２伝送データを受信し、且つ、第１伝送データおよび第２伝送データを準同型演算することに用いられる。第２伝送データは、第１伝送データと準同型演算を行って相関係数を計算することに用いられる。第２伝送データは、第２参加ノードが提供する相関係数を計算待ちデータを指してもよく、第２伝送データは、準同型暗号化された第２元データを少なくとも含む。第１伝送データは、第１元データに基づいて準同型暗号化を経て得られ、第２伝送データは、第２元データに基づいて準同型暗号化を経て得られ、これにより、第１伝送データおよび第２伝送データを準同型演算することは、第１元データおよび第２元データを準同型演算することに相当し、即ち、両者を準同型演算して得られた相関係数の出力結果は同じである。ここで、第１元データおよび第２元データが同じ関連鍵を用いて準同型暗号化されることで、準同型暗号化された第１元データ、および準同型暗号化された第２元データの暗号化方式を一致させ、第１元データおよび第２元データが一致しない暗号化方式を採用して暗号化結果が準同型演算を実現できないことを回避し、第１伝送データと第２伝送データとの間の準同型演算を正確に実現することができる。

【0023】

Ｓ１０３において、補助ノードからフィードバックされる相関係数を受信する。

【0024】

補助ノードは、第１伝送データと第２伝送データとの間の相関係数、即ち、第１元データと第２元データとの間の相関係数を計算し、相関係数を第１参加ノードおよび第２参加ノードにフィードバックする。補助ノードが計算したのが暗号化された第１元データおよび暗号化された第２元データであるため、補助ノードは、真の元データを取得することができず、補助ノードが参加ノードの元データを取得して漏洩することを回避し、元データの安全を保護する。

【0025】

従来技術において、相関係数を計算するために両方のデータが必要となり、データ共有は、データ内の保護されるプライバシー情報の漏洩を招く。

【0026】

本開示の技術案によれば、相関係数の計算に参加する第１参加ノードが第１元データを準同型暗号化することにより、第１伝送データを確定し、第１伝送データを第３者の補助ノードに送信し、補助ノードにより第１伝送データおよび第２伝送データを準同型演算することは、準同型暗号化された第１元データ、および準同型暗号化された第２元データを準同型演算し、準同型暗号化された第１元データと準同型暗号化された第２元データとの間の相関係数を計算することにより、第１元データと第２元データとの間の相関係数を確定することに相当し、補助ノードが伝送データを復号できない場合に元データ間の相関係数を正確に計算することを実現し、元データの安全を向上させ、プライバシー情報を保護し、データ伝送の安全性および計算の安全性を高めるとともに、相関係数の計算正確性を向上させる。

【0027】

図２は、本開示の実施例による別の相関係数取得方法のフローチャートであり、上記技術案に基づいて更に最適化して拡張し、且つ、上記各好ましい実施形態と組み合わせることができる。関連鍵を用いて第１元データを準同型暗号化することは、具体的に、関連鍵に基づいて第１乱数を計算し、第１乱数に基づいて第１元データを準同型暗号化することである。

【0028】

Ｓ２０１において、第１元データを取得し、関連鍵に基づいて第１乱数を計算し、関連鍵が、第１参加ノードと第２参加ノードで互いに決められる。

【0029】

第１乱数は、元データを準同型暗号化することに用いられる。第１乱数は、関連鍵に基づいて生成される乱数である。ここで、第１参加ノードは、関連鍵に基づいて第１乱数を生成し、同様に、第２参加ノードは、関連鍵に基づいて同じ方式で第１乱数を生成する。元データは、少なくとも１つのデータを含んでもよい。それに対応し、第１乱数の数は元データに含まれるデータの数と同じである。

【0030】

Ｓ２０２において、第１乱数に基づいて第１元データを準同型暗号化し、第１伝送データを確定する。

【0031】

第１元データはデータ系列であり、第１乱数はデータ系列であり、系列内のデータの順序に従い、ある順序の第１乱数に基づいて同じ順序の第１元データを準同型暗号化することができる。例示的には、第１元データはＮ個のサンプルＸ_ｉを含み、ただし、ｉ＝１、２、３……Ｎであり、それに対応し、関連鍵に基づいてＮ個の乱数Ｒ＝｛ｒ_ｉ|ｒ_ｉ∈Ｚ｝を生成することができる。ただし、ｒ_ｉは、Ｘ_ｉを暗号化することに用いられる。例示的には、準同型暗号化された第１元データはｒ_ｉ＊Ｘ_ｉである。

【0032】

また、第２参加ノードでは、同様に、関連鍵に基づき、同じ乱数生成方式で第１乱数を生成する。これにより、同じ第１乱数を用いて第１元データおよび第２元データの準同型暗号化を実現し、乱数が異なることにより準同型演算を実現できない状況を回避する。

【0033】

なお、２つの参加ノードが同じ第１乱数を生成し、第１乱数を用いて元データを準同型暗号化することは、同じ暗号化方式を用いて暗号化をそれぞれ行うことではない。例示的には、相関係数の計算過程において、第１元データと第２元データとを乗算する必要があり、第１元データの暗号化方式は、第１乱数と第１元データとを乗算することであってもよく、第２元データの暗号化方式は、第２元データと第１乱数の逆数とを乗算することであってもよく、これにより、相関係数の計算過程において、第１乱数と第１乱数の逆数との積が１であるため、第１元データと第２元データとの積が、暗号化された第１元データと暗号化された第２元データとの積と同じであり、準同型演算を実現する。

【0034】

Ｓ２０３において、補助ノードが第１伝送データを受信し、第１伝送データおよび第２伝送データを準同型演算して第１元データと第２元データとの間の相関係数を取得するように、第１伝送データを補助ノードに送信し、第２伝送データが、第２参加ノードによって関連鍵を用いて第２元データを準同型暗号化することで確定される。

【0035】

Ｓ２０４において、補助ノードからフィードバックされる相関係数を受信する。

【0036】

好ましくは、相関係数取得方法は、サンプルデータセットにおいて、第１元データと第２元データとの間の相関係数に基づいて第１元データを選別することを更に含み、サンプルデータセット内に第１元データが含まれ、サンプルデータセットは、連合モデルをトレーニングすることに用いられる。

【0037】

サンプルデータセット内に第１元データが含まれる。サンプルデータセットは、連合モデルのトレーニングサンプルのデータセットである。連合モデルとは、少なくとも２つの参加者のサンプルデータを集約して確立した最適なモデルを意味し、且つ、モデルのトレーニング時に、参加者のデータが自分のデータを与える必要がないため、ローカルデータを漏洩することはない。連合モデルは、横方向連合モデル、縦方向連合モデル、および連合遷移モデル等を含んでもよい。例示的には、第１元データの選別は、サンプルデータセットにおいて相関性の低い元データを選択して除外してもよいし、相関性の高い元データを選択して除外してもよい。選別方式は、具体的に、トレーニングされる連合モデルの性能ニーズ情報に応じて確定することができる。

【0038】

連合モデルをトレーニングする適用シーンにおいて、２つの参加者のサンプル間の相関性に基づいてサンプルを選別することができ、サンプルの代表性を向上させ、連合モデルの検出精度を高めることができるとともに、サンプルを選別することでサンプルのデータ量を簡素化させ、連合モデルのトレーニング効率を向上させることができ、且つ、相関性を計算する時、元データを暗号化することで、参加者データの安全を向上させ、連合モデルのデータ安全を更に強化することができる。

【0039】

本開示の技術案によれば、関連鍵により第１乱数を更に生成し、第１乱数に基づいて第１元データを準同型暗号化し、暗号化されたデータのランダム性を増加し、データ暗号化の解読の困難度を高め、暗号化の複雑度を更に向上させ、元データの安全を向上させる。

【0040】

図３は、本開示の実施例による別の相関係数取得方法のフローチャートであり、上記技術案に基づいて更に最適化して拡張し、且つ、上記各好ましい実施形態と組み合わせることができる。関連鍵を用いて第１元データを準同型暗号化し、第１伝送データを確定することは、具体的には、関連鍵を用いて第１元データを準同型暗号化し、準同型暗号化された第１元データを取得し、第１元データおよび相関係数の計算式に基づいて第１中間データを計算し、関連鍵を用いて第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得し、準同型暗号化された第１元データ、および準同型暗号化された第１中間データを第１伝送データとして確定することである。

【0041】

Ｓ３０１において、第１元データを取得し、関連鍵を用いて第１元データを準同型暗号化し、準同型暗号化された第１元データを取得し、関連鍵が、第１参加ノードと第２参加ノードで互いに決められる。

【0042】

Ｓ３０２において、第１元データおよび相関係数の計算式に基づいて第１中間データを計算する。

【0043】

ここで、相関係数の計算式で、第１元データを多層演算することができ、一部の演算の結果を中間データとして確定することができる。第１中間データは、相関係数を直接計算することに用いられる。第１中間データとは、相関係数の計算式のうちの元データに関する計算式に基づき、元データを計算して得た計算結果を意味する。例えば、第１元データは複数のサンプルを含み、サンプルを多層演算して第１元データの分散または期待等を取得し、第１中間データとして確定することができる。第１元データ内の複数のデータ間の暗号化に使用される数値がそれぞれ異なるため、元データに基づいて計算された期待および分散等の結果は、暗号化された第１元データに基づいて計算された期待および分散等の結果と異なり、準同型演算を実現することができない。これにより、元データに基づいて中間データを計算する必要があり、相関係数を計算するための中間データの正確性を確保し、相関係数の準同型演算および相関係数の正確性に影響を及ぼすことを回避する。

【0044】

好ましくは、第１中間データは、第１元データの期待および／または分散を含む。

【0045】

通常の期待および／または分散は、相関係数を計算することに用いられ、相関係数の計算式における直接計算するデータとし、および第１元データで相関係数を計算する中間結果とする。

【0046】

例示的には、ピアソン相関係数Ｐｅａｒｓｏｎまたはスピアマン相関係数Ｓｐｅａｒｍａｎの計算式は、以下のとおりである。

【数1】

（ただし、Ｘは第１元データであり、Ｙは第２元データであり、Ｅ（Ｘ）は第１元データの期待であり、Ｅ（Ｙ）は第２元データの期待であり、σ_Ｘは第１元データの分散であり、σ_Ｙは第２元データの分散である。Ｅ（ＸＹ）は第１元データと第２元データとの積の期待である。）

【0047】

前例のように、第１参加ノードの第１元データはＸ_ｉであり、第２参加ノードの第２元データはＹ_ｉであり、関連鍵に基づいて第１乱数ｒ_ｉを生成する。第１乱数を用いて第１元データおよび第２元データを準同型暗号化する。第１元データのそれぞれに第１乱数を乗算し、準同型暗号化された第１元データＸ_ｉ＊ｒ_ｉを取得し、第２元データのそれぞれに第１乱数の逆数を乗算し、準同型暗号化された第２元データＹ_ｉ／ｒ_ｉを取得する。

【0048】

それに対応し、

【数2】

である。即ち、準同型暗号化された第１元データと準同型暗号化された第２元データとの積の期待は、第１元データと第２元データとの積の期待に等しい。

【0049】

第１参加ノードの第１中間データを第２乱数で準同型暗号化し、第２参加ノードの第２中間データを第２乱数で準同型暗号化する。ここで、中間データは期待および分散を含み、第２乱数は、期待に対応するｒ_ｅおよび分散に対応するｒ_σを含む。第１中間データに含まれる第１期待と期待に対応する第２乱数とを乗算し、準同型暗号化された第１期待Ｅ（Ｘ）＊ｒ_ｅを取得する。第２中間データに含まれる第２期待と期待に対応する第２乱数の逆数とを乗算し、準同型暗号化された第２期待Ｅ（Ｙ）／ｒ_σを取得する。第１中間データに含まれる第１分散と期待に対応する第２乱数とを乗算し、準同型暗号化された第１分散σ（Ｘ）＊ｒ_σを取得する。第２中間データに含まれる第２期待と期待に対応する第２乱数の逆数とを乗算し、準同型暗号化された第２分散σ（Ｙ）／ｒ_σを取得する。

【0050】

それに対応し、

【数3】

である。即ち、準同型暗号化された第１期待Ｅ２（Ｘ）と準同型暗号化された第２期待Ｅ２（Ｙ）との積は、第１期待と第２期待との積に等しい。

【0051】

【数4】

である。即ち、準同型暗号化された第１分散σ２（Ｘ）と準同型暗号化された第２分散σ２（Ｙ）との積は、第１分散と第２分散との積に等しい。

【0052】

これにより、準同型暗号化の前後で、相関係数の結果は変わらない。

【0053】

第１中間データを第１元データの期待および分散に設定することにより、ＰｅａｒｓｏｎおよびＳｐｅａｒｍａｎ等の相関係数の適用シーンに適応し、同じ計算方式の相関係数を計算し、相関係数の適用シーンを増加し、相関係数の計算に必要なデータの安全を向上させることができる。

【0054】

Ｓ３０３において、関連鍵を用いて第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得する。

【0055】

同様に、関連鍵を用いて第１中間データを準同型暗号化する。第１元データに基づいて計算された第１中間データは、依然として暗号化する必要があり、元データのプライバシー情報の漏洩を回避する。

【0056】

好ましくは、関連鍵を用いて第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得することは、関連鍵に基づいて第２乱数を計算することと、第２乱数に基づいて第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得することとを含む。

【0057】

関連鍵に基づいて第２乱数を計算する。ここで、第１乱数と第２乱数とは異なる。第２乱数は、第１中間データを準同型暗号化することに用いられる。第１中間データはデータ系列であり、第２乱数はデータ系列であり、系列内のデータの順序に従い、ある順序の第２乱数に基づいて同じ順序の第１中間データを準同型暗号化する。実際には、第１中間データは複数タイプのデータを含んでもよく、異なるタイプのデータに対応する第２乱数は異なる。

【0058】

関連鍵に基づいて第２乱数を更に生成し、第２乱数に基づいて第１中間データを準同型暗号化し、暗号化されたデータのランダム性を増加し、データ暗号化の解読の困難度を高め、暗号化の複雑度を更に向上させ、中間データの安全を向上させる。

【0059】

Ｓ３０４において、準同型暗号化された第１元データ、および準同型暗号化された第１中間データを第１伝送データとして確定する。

【0060】

第１伝送データの安全性を向上させるために、準同型暗号化された第１元データ、および準同型暗号化された第１中間データを更に暗号化し、第１伝送データを取得することができる。例示的には、ＲＳＡ非対称暗号化アルゴリズムにより公開鍵（ｎ、ｅ）および秘密鍵（ｎ、ｄ）で形成される鍵ペアを生成することができる。

【0061】

好ましくは、準同型暗号化された第１元データ、および準同型暗号化された第１中間データを第１伝送データとして確定することは、補助ノードから送信される公開鍵を取得することと、公開鍵に基づいて準同型暗号化された第１中間データを暗号化し、準同型暗号化された第１元データおよび公開鍵暗号化された第１中間データを第１伝送データとして確定し、補助ノードに公開鍵暗号化された第１中間データを秘密鍵で復号させ、準同型暗号化された第１中間データを取得することとを含む。

【0062】

公開鍵と秘密鍵とで鍵ペアを構成し、鍵ペアは非対称暗号化により生成される鍵である。公開鍵は公開され、秘密鍵は秘密である。補助ノードは鍵ペアを生成し、公開鍵を各参加ノードに送信し、秘密鍵をローカルに保留する。参加ノードは、公開鍵を用いてデータを暗号化し、補助ノードは、秘密鍵を用いて復号し、該データを取得することができる。

【0063】

第１参加ノードは、公開鍵を用いて準同型暗号化された第１中間データを暗号化することで、中間データの安全性を更に向上させることができる。通常、第１中間データは第１元データの計算結果であり、第１中間データに含まれるデータの数は、第１元データに含まれるデータの数よりも小さく、第１中間データの準同型暗号化結果は、第１元データの準同型暗号化結果よりも解読しやすく、これにより、第１中間データを優先的に暗号化して第１中間データの安全性を向上させることができるとともに、第１中間データを暗号化するが、第１元データを暗号化しないことで、暗号化されるデータ量を減少し、暗号化コストを低減し、暗号化効率を向上させることができる。

【0064】

例示的には、第１中間データは第１元データの期待であり、第１元データの準同型暗号化方式は、第１乱数を用いて第１元データに含まれるデータを暗号化することである。ここで、第１元データに含まれる各データの暗号化オフセット量が異なることで、準同型暗号化された第１元データの解読の困難度はより高く、より安全である。一方、第１中間データは１つのデータだけであり、第２乱数を用いて暗号化すると、１つの暗号化されたデータだけを取得し、解読しやすい。これにより、第１中間データを再び暗号化し、第１中間データの安全性を更に向上させることができる。

【0065】

１つの具体的な例において、公開鍵（ｎ、ｅ）を用いて期待Ｅ（Ｘ）を暗号化し、暗号化された期待は（Ｅ（Ｘ））^ｅ％ｎである。

【0066】

第１中間データに対して公開鍵暗号化を行うことにより、補助ノード以外の機器に対して復号の困難度を増加し、第１中間データの安全性を向上させるとともに、暗号化されるデータ量を減少し、暗号化コストを低減し、暗号化効率を向上させることができる。

【0067】

Ｓ３０５において、補助ノードが第１伝送データを受信し、第１伝送データおよび第２伝送データを準同型演算して第１元データと第２元データとの間の相関係数を取得するように、第１伝送データを補助ノードに送信し、第２伝送データが、第２参加ノードによって関連鍵を用いて第２元データを準同型暗号化することで確定される。

【0068】

Ｓ３０６において、補助ノードからフィードバックされる相関係数を受信する。

【0069】

本開示の技術案によれば、相関係数の計算式により、第１元データに基づいて相関係数の計算に関連する第１中間データを計算し、第１中間データを準同型暗号化することにより、相関係数の演算が準同型演算であることを確保し、相関係数の準同型演算を実現し、相関係数の計算正確性を向上させ、且つ、準同型暗号化は、第１中間データの安全性を向上させ、第１伝送データの安全性を向上させる。

【0070】

図４は、本開示の実施例による相関係数取得方法のフローチャートであり、本実施例は、２つの参加ノードの元データ間の相関性を計算する場合に適用される。本実施例の方法は、相関係数取得装置で実行することができ、該装置は、ソフトウェアおよび／またはハードウェアの方式で実現でき、具体的には、一定のデータ演算能力を持つ電子機器に構成され、該電子機器は補助ノードであり、該電子機器は、クライアント機器またはサーバ機器であってもよく、クライアント機器は、例えば、携帯電話機、タブレットコンピュータ、車載端末およびデスクトップコンピュータ等である。

【0071】

Ｓ４０１において、第１参加ノードから送信される第１伝送データ、および第２参加ノードから送信される第２伝送データを受信する。

【0072】

補助ノードは、複数の参加ノードのうちの２つずつのノード間の伝送データを準同型演算し、伝送データに対応する元データの相関係数を計算し、対応する参加ノードにフィードバックすることに用いられる。相関係数の計算システムにおいて、少なくとも２つの参加ノードおよび補助ノードを備える。補助ノードは、相関係数を計算することに用いられ、参加ノードは、相関係数を計算する準同型暗号化されたデータを提供することに用いられる。第１伝送データおよび第２伝送データが準同型暗号化されたデータであるため、補助ノードは、元データを取得することができず、元データの安全を確保する。

【0073】

Ｓ４０２において、第１伝送データおよび第２伝送データを準同型演算し、第１元データと第２元データとの間の相関係数を取得し、第１伝送データが、第１参加ノードよって関連鍵を用いて第１元データを準同型暗号化することで確定され、第２伝送データが、第２参加ノードよって関連鍵を用いて第２元データを準同型暗号化することで確定され、関連鍵が、第１参加ノードと第２参加ノードで互いに決められる。

【0074】

Ｓ４０３において、相関係数を第１参加ノードおよび第２参加ノードに送信する。

【0075】

ここで、相関係数の伝送安全のために、相関係数を暗号化して伝送することもできる。

【0076】

好ましくは、第１伝送データおよび第２伝送データを準同型演算することは、鍵ペアを取得することと、鍵ペア内の秘密鍵に基づき、第１伝送データ内の公開鍵暗号化された第１中間データを復号し、準同型暗号化された第１中間データを取得することと、鍵ペア内の秘密鍵に基づき、第２伝送データ内の公開鍵暗号化された第２中間データを復号し、準同型暗号化された第２中間データを取得することと、準同型暗号化された第１中間データ、第１伝送データに含まれる準同型暗号化された第１元データ、準同型暗号化された第２中間データ、および第２伝送データに含まれる準同型暗号化された第２元データを準同型演算することとを含み、鍵ペア内の公開鍵は、第１参加ノードおよび第２参加ノードに送信されてデータ暗号化を行うことに用いられる。

【0077】

中間データは、２回の暗号化を経て、まず、関連鍵による準同型暗号化であり、次に、公開鍵暗号化である。公開鍵暗号化された中間データは、秘密鍵で復号されると、関連鍵で準同型暗号化された中間データを取得することができる。準同型暗号化された第１中間データ、準同型暗号化された第１元データ、準同型暗号化された第２中間データおよび準同型暗号化された第２元データは、準同型計算で第１元データと第２元データとの間の相関係数を取得することに用いられる。

【0078】

例示的には、ＲＳＡアルゴリズムにより、公開鍵（ｎ、ｅ）および秘密鍵（ｎ、ｄ）を含む鍵ペアを生成することができる。秘密鍵（ｎ、ｄ）を用いて暗号化された期待（Ｅ（Ｘ））^ｅ％ｎを復号することは、（（Ｅ（Ｘ））^ｅ％ｎ）^ｄ％ｎ＝Ｅ（Ｘ）であってもよい。

【0079】

【0080】

本開示の技術案によれば、補助ノードが準同型暗号化された第１伝送データおよび第２伝送データを準同型演算し、準同型暗号化前の第１元データと第２元データとの間の相関係数を取得することにより、補助ノードが伝送データを復号できない場合に元データ間の相関係数を正確に計算することを実現し、元データの安全を向上させ、プライバシー情報を保護し、データ伝送の安全性および計算の安全性を高めるとともに、相関係数の計算正確性を向上させる。

【0081】

図５は、本開示の実施例による相関係数取得方法のシーン図である。

【0082】

ここで、参加者は、元データを処理するためのｋ個のｗｏｒｋｅｒ作業プロセスを含む。補助ノードはＡｒｂｉｔｅｒノードである。連合学習フレームワークには、参加ノード（Ｈｏｓｔ）、補助ノード（Ａｒｂｉｔｅｒ）および応用ノード（Ｇｕｅｓｔ）という３種のノードが存在する。参加ノードはデータを提供することに用いられ、補助ノードは、多方の共同モデリングを補助することに用いられ、応用ノードは、モデリング動作を開始することに用いられる。

【0083】

相関係数取得方法は、参加ノードおよび補助ノードに関し、具体的には、相関係数取得方法のフローは以下のとおりである。

【0084】

Ｓ５０１において、参加ノードおよび他の参加ノードは、ＤＨプロトコルにより関連鍵ｓをネゴシエーションし、乱数の種とする。

【0085】

具体的には、参加者Ｐａおよび参加者Ｐｂは、ＤＨプロトコルによりネゴシエーション鍵ｓを生成する。ここで、ａ、ｂ＝１、２、３……ｄであり、ａ≠ｂであり、ｄは参加ノードの総数である。

【0086】

Ｓ５０２において、補助ノードは、公開鍵（ｎ、ｅ）および秘密鍵（ｎ、ｄ）を生成する。

【0087】

ＲＳＡアルゴリズムに基づいて鍵ペアを生成することができる。

【0088】

Ｓ５０３において、補助ノードは、公開鍵（ｎ、ｅ）を各参加ノードに送信する。

【0089】

Ｓ５０４において、参加ノードは、作業プロセスの数ｋに応じてソースデータを列ごとに分割して第１元データＸ_ｊｆを取得する。

【0090】

ここで、ソースデータは少なくとも１つの元データを含み、１つの元データは少なくとも１つのデータ系列を含む。ここで、参加者は、含まれる作業プロセスの数ｋに応じてソースデータを均等に分割し、Ｘ_ｊｆｇを取得し、ただし、ｊ＝１、２、３……ｋであり、ｆ＝１、２、３……ｍであり、ｍは相関係数を計算する列データで、即ち、元データの数と同じであり、実際には、１列のデータは１つの元データであり、ｇ＝１、２、３……Ｎで、Ｎは１つの元データに含まれるサンプルの総数である。Ｎ個のＸ_ｊｆｇで１つの元データＸ_ｊｆを構成する。ここで、１つの作業プロセスは少なくとも１つの元データを処理することができる。

【0091】

Ｓ５０５において、参加ノードのｊ個目の作業プロセスは、第１元データＸ_ｊｆを読み取り、関連鍵ｓに基づいて第１乱数集合Ｒを生成し、準同型暗号化された第１元データＸ_ｊｆ＊Ｒを計算する。

【0092】

参加ノードのｊ個目の作業プロセスは、関連鍵ｓを乱数の種としてＮ個の乱数Ｒ＝｛ｒ_ｉ｜ｒ_ｉ∈Ｚ｝を生成し、Ｘ_ｊｆｇ＊ｒ_ｉを計算する。ここで、乱数の数は、元データに含まれるサンプルの総数と同じで、いずれもＮである。

【0093】

Ｓ５０６において、参加ノードのｊ個目の作業プロセスは、関連鍵ｓに基づいて第２乱数ｒ_ｅおよびｒ_σを生成し、期待および分散を準同型暗号化し、更に公開鍵（ｎ、ｅ）を用いて暗号化し続ける。

【0094】

参加ノードのｊ個目の作業プロセスは、１つの元データに含まれるＸ_ｊｆｇに基づき、期待Ｅ（Ｘ_ｊｆ）および分散σ（Ｘ_ｊｆ）を計算する。関連鍵ｓに基づいて第２乱数ｒ_ｅおよびｒ_σを生成し、第２乱数ｒ_ｅを用いて期待Ｅ（Ｘ_ｊｆ）を準同型暗号化し、Ｅ（Ｘ_ｊｆ）＊ｒ_ｅを取得する。第２乱数ｒ_σを用いて分散σ（Ｘ_ｊｆ）を準同型暗号化し、σ（Ｘ_ｊｆ）＊ｒ_σを取得する。ここで、２つの第２乱数ｒ_ｅとｒ_σとは異なる。公開鍵を用いて準同型暗号化されたＥ（Ｘ_ｊｆ）を暗号化し、（Ｅ（Ｘ_ｊｆ）＊ｒ_ｅ）^ｅ％ｎを取得する。公開鍵（ｎ、ｅ）を用いて準同型暗号化されたσ（Ｘ_ｊｆ）を暗号化し、（σ（Ｘ_ｊｆ）＊ｒ_σ）^ｅ％ｎを取得する。

【0095】

Ｓ５０７において、参加ノードは、補助ノードに準同型暗号化された第１元データ、公開鍵暗号化された期待および公開鍵暗号化された分散を送信する。

【0096】

Ｓ５０８において、補助ノードは期待および分散を復号し、相関係数を準同型計算する。

【0097】

補助ノードは、秘密鍵を用いて公開鍵暗号化された期待および公開鍵暗号化された分散を復号し、準同型暗号化された期待および準同型暗号化された分散を取得する。準同型暗号化された元データ、準同型暗号化された期待および準同型暗号化された分散と、他の参加ノードから送信された準同型暗号化された元データ、準同型暗号化された期待および準同型暗号化された分散に基づき、２つの参加ノードの元データ間の相関係数を計算する。

【0098】

補助ノードは、第１参加ノードａの第１伝送データを受信し、Ｘ_ｊｆｇ＊ｒ_ｉ、（Ｅ（Ｘ_ｊｆ）＊ｒ_ｅ）^ｅ％ｎおよび（σ（Ｘ_ｊｆ）＊ｒ_σ）^ｅ％ｎを含む。第２参加ノードｂの第２伝送データを受信し、Ｙ_ｈｐｑ／ｒ_ｉ、（Ｅ（Ｙ_ｈｐ）／ｒ_σ）^ｅ％ｎおよび（σ（Ｙ_ｈｐ）／ｒ_σ）^ｅ％ｎを含む。ここで、ｈ＝１、２、３……ｔであり、ｐ＝１、２、３……ｕであり、ｔは第２参加ノードに含まれる作業プロセスの数であり、ｕは相関係数を計算する列データで、即ち、元データの数と同じであり、実際には、１列のデータは１つの元データであり、ｑ＝１、２、３……Ｎで、Ｎは１つの元データに含まれるサンプルの総数である。Ｎ個のＹ_ｈｐｑで１つの元データＹ_ｈｐを構成する。ここで、１つの作業プロセスは少なくとも１つの元データを処理することができる。

【0099】

ここで、相関係数は、主に３つの部分で計算され、ここで、３つの部分は、それぞれＥ（ＸＹ）、Ｅ（Ｘ）＊Ｅ（Ｙ）およびσ（Ｘ）＊σ（Ｙ）である。

【0100】

ここで、まず、秘密鍵（ｎ、ｄ）を用いて期待および分散を復号する。

【数5】

【数6】

【数7】

【数8】

準同型演算において、

【数9】

【数10】

【数11】

【0101】

上記暗号文の計算結果は、平文の計算結果と同じである。以下の式に代入して計算する。

【0102】

【数12】

【0103】

これにより、第１元データＸ_ｊｆと第２元データＹ_ｈｐとの間の相関係数を正確に計算する。

【0104】

Ｓ５０９において、補助ノードは相関係数を統合し、グローバル相関係数を取得する。

【0105】

この時の相関係数は、１つの元データと別の元データとの間の相関係数である。しかし、実際には、ソースデータに複数の元データが含まれる。複数の元データのそれぞれと対応する元データ間の相関係数とを組み合わせてデータセットを形成し、グローバル相関係数として確定することができる。

【0106】

Ｓ５１０において、補助ノードは、参加ノードにグローバル相関係数を送信する。

【0107】

参加ノードは、グローバル相関係数に基づき、ソースデータを選別し、選別されたソースデータを連合学習モデルのトレーニングに適用する。

【0108】

連合学習アルゴリズムは、一般的に、暗号学技術によりデータの安全を確保し、余計な暗号学演算は、アルゴリズムの効率を大きく低減する。また、連合学習過程は、参加者間で頻繁な通信を行う必要があり、学習の効率を更に低減する。ビジネスデータ量が大きい場合、連合アルゴリズムの効率をどのように向上させるかは、特に重要である。

【0109】

本開示の実施例は、同じ参加者のサーバで複数の計算タスク（作業プロセス）を起動し、参加者のトレーニングに参加するデータにより、データ分割、パラメータ配布および自分の結果の集約を行い、Ｗｏｒｋｅｒ作業プロセスにより、データの読み取り、期待および分散の計算等を行う。このようなタスク並列メカニズムは、連合学習の効率を大きく向上させる。複数のＷｏｒｋｅｒタスクの並列は、サーバのＣＰＵ（中央プロセッサ）および帯域幅等のリソースを十分に利用することができる。また、ＪＶＭおよびストレージシステムのメモリ割り当てメカニズムにより、複数のＷｏｒｋｅｒタスクは、サーバのメモリリソースを十分に利用することもできる。

【0110】

本開示の実施例のアルゴリズムは、並列連合相関係数アルゴリズム（ＰａｒａｌｌｅｌＦｅｄｅｒａｌＣｏｒｒｅｌａｔｉｏｎＣｏｅｆｆｉｃｉｅｎｔａｌｇｏｒｉｔｈｍ、ＰＦＣＣ）と呼ばれてもよく、ＤＨおよびＲＳＡプロトコルにより、ノイズを混入して元データを暗号化することで参加者データの安全な集約を確保する。ここで、暗号化・復号の過程は簡単で、時空間複雑度が小さい。

【0111】

本開示の実施例によれば、図６は、本開示の実施例における相関係数取得装置の構造図であり、本開示の実施例は、２つの参加ノードの元データ間の相関性を計算する場合に適用される。該装置は、ソフトウェアおよび／またはハードウェアで実現され、具体的には、一定のデータ演算能力を持つ電子機器に構成され、電子機器は、具体的に、参加ノードである。

【0112】

図６に示す相関係数取得装置６００は、第１元データ準同型暗号化モジュール６０１、第１伝送データ送信モジュール６０２、および相関係数取得モジュール６０３を備え、
第１元データ準同型暗号化モジュール６０１は、第１元データを取得し、第１参加ノードと第２参加ノードで互いに決められる関連鍵を用いて第１元データを準同型暗号化し、第１伝送データを確定することに用いられ、
第１伝送データ送信モジュール６０２は、補助ノードが第１伝送データを受信し、第１伝送データおよび第２伝送データを準同型演算して第１元データと第２元データとの間の相関係数を取得するように、第１伝送データを補助ノードに送信することに用いられ、第２伝送データが、第２参加ノードによって関連鍵を用いて第２元データを準同型暗号化することで確定され、
相関係数取得モジュール６０３は、補助ノードからフィードバックされる相関係数を受信することに用いられる。

【0113】

【0114】

更に、第１元データ準同型暗号化モジュール６０１は、関連鍵に基づいて第１乱数を計算するための第１乱数計算ユニットと、第１乱数に基づいて第１元データを準同型暗号化するための第１乱数暗号化ユニットとを備える。

【0115】

更に、第１元データ準同型暗号化モジュール６０１は、関連鍵を用いて第１元データを準同型暗号化し、準同型暗号化された第１元データを取得するためのデータ準同型暗号化ユニットと、第１元データおよび相関係数の計算式に基づいて第１中間データを計算するための第１中間データ計算ユニットと、関連鍵を用いて第１中間データを準同型暗号化し、準同型暗号化された第１中間データを取得するための第１中間データ準同型暗号化ユニットと、準同型暗号化された第１元データおよび第１中間データを第１伝送データとして確定するための第１伝送データ確定ユニットとを備える。

【0116】

更に、第１中間データ準同型暗号化ユニットは、関連鍵に基づいて第２乱数を計算するための第２乱数計算サブユニットと、第２乱数に基づいて第１中間データを準同型暗号化するための第２乱数準同型暗号化サブユニットとを備える。

【0117】

更に、第１中間データは、第１元データの期待および／または分散を含む。

【0118】

更に、第１中間データ追加サブユニットは、具体的には、補助ノードから送信される公開鍵を取得し、公開鍵に基づいて準同型暗号化された第１中間データを暗号化し、準同型暗号化された第１元データおよび公開鍵暗号化された第１中間データを第１伝送データとして確定し、補助ノードに公開鍵暗号化された第１中間データを秘密鍵で復号させ、準同型暗号化された第１中間データを取得することに用いられる。

【0119】

更に、相関係数取得装置は、サンプルデータセットにおいて、第１元データと第２元データとの間の相関係数に基づいて第１元データを選別するためのサンプルデータ選別モジュールであって、サンプルデータセットに第１元データが含まれ、サンプルデータセットが連合モデルをトレーニングすることに用いられるサンプルデータ選別モジュールを更に備える。

【0120】

上記相関係数取得装置は、本開示のいずれかの実施例に係る相関係数取得方法を実行することができ、相関係数取得方法の実行に対応する機能モジュールおよび有益な効果を備える。

【0121】

本開示の実施例によれば、図７は、本開示の実施例における相関係数取得装置の構造図であり、本開示の実施例は、２つの参加ノードの元データ間の相関性を計算する場合に適用される。該装置は、ソフトウェアおよび／またはハードウェアで実現され、具体的には、一定のデータ演算能力を持つ電子機器に構成され、電子機器は、具体的に、参加ノードである。

【0122】

図７に示す相関係数取得装置７００は、伝送データ取得モジュール７０１、伝送データ準同型演算モジュール７０２、および相関係数送信モジュール７０３を備え、
伝送データ取得モジュール７０１は、第１参加ノードから送信される第１伝送データ、および第２参加ノードから送信される第２伝送データを受信することに用いられ、
伝送データ準同型演算モジュール７０２は、第１伝送データおよび第２伝送データを準同型演算し、第１元データと第２元データとの間の相関係数を取得することに用いられ、第１伝送データが、第１参加ノードよって関連鍵を用いて第１元データを準同型暗号化することで確定され、第２伝送データが、第２参加ノードよって関連鍵を用いて第２元データを準同型暗号化することで確定され、関連鍵が、第１参加ノードと第２参加ノードで互いに決められ、
相関係数送信モジュール７０３は、相関係数を第１参加ノードおよび第２参加ノードに送信することに用いられる。

【0123】

【0124】

更に、伝送データ準同型演算モジュール７０２は、鍵ペアを取得するための鍵ペア取得ユニットと、鍵ペア内の秘密鍵に基づき、第１伝送データ内の公開鍵暗号化された第１中間データを復号し、準同型暗号化された第１中間データを取得するための第１中間データ復号ユニットと、鍵ペア内の秘密鍵に基づき、第２伝送データ内の公開鍵暗号化された第２中間データを復号し、準同型暗号化された第２中間データを取得するための第２中間データ復号ユニットと、準同型暗号化された第１中間データ、第１伝送データに含まれる準同型暗号化された第１元データ、準同型暗号化された第２中間データ、および第２伝送データに含まれる準同型暗号化された第２元データを準同型演算するための準同型演算ユニットとを備え、鍵ペア内の公開鍵が、第１参加ノードおよび第２参加ノードに送信されてデータ暗号化を行うことに用いられる。

【0125】

【0126】

本開示の技術案に係るユーザの個人情報の収集、記憶、使用、加工、伝達、提供、および公開等の処理は、いずれも関連法律法規の規定に該当し、公序良俗に反していない。

【0127】

本開示の実施例によれば、本開示は、電子機器、可読記憶媒体、およびコンピュータプログラムを更に提供する。

【0128】

図８は、本開示の実施例を実施するために使用可能な例示的な機器８００の模式的な領域図を示す。電子機器は、ラップトップ型コンピュータ、デスクトップ型コンピュータ、ワークステーション、パーソナルデジタルアシスタント、サーバ、ブレードサーバ、メインフレーム、および他の適切なコンピュータのような様々な形式のデジタルコンピュータを表すことを目的とする。電子機器は、携帯端末、携帯電話、スマートフォン、ウェアラブル機器および他の類似する計算装置のような様々な形式の移動装置を表すこともできる。本開示に示されたコンポーネント、それらの接続、関係、およびそれらの機能は例示的なものに過ぎず、本開示に記載および／または要求される本開示の実現を限定するものではない。

【0129】

図８に示すように、機器８００は、計算ユニット８０１を備え、読み出し専用メモリ（ＲＯＭ）８０２に記憶されたコンピュータプログラム、または記憶ユニット８０８からランダムアクセスメモリ（ＲＡＭ）８０３にロードされたコンピュータプログラムに基づき、様々な適当な動作および処理を実行することができる。ＲＡＭ８０３には、機器８００の操作に必要な様々なプログラムおよびデータが記憶されてもよい。計算ユニット８０１、ＲＯＭ８０２およびＲＡＭ８０３は、バス８０４を介して互いに接続されている。入力／出力（Ｉ／Ｏ）インタフェース８０５もバス８０４に接続されている。

【0130】

機器８００における複数のコンポーネントはＩ／Ｏインタフェース８０５に接続され、キーボード、マウス等のような入力ユニット８０６と、各種のディスプレイ、スピーカ等のような出力ユニット８０７と、磁気ディスク、光ディスク等のような記憶ユニット８０８と、ネットワークカード、モデム、無線通信送受信機等のような通信ユニット８０９とを備える。通信ユニット８０９は、機器８００がインターネットのようなコンピュータネットワークおよび／または様々な電気通信ネットワークを介して他のデバイスと情報／データを交換することを許容する。

【0131】

計算ユニット８０１は、処理および計算能力を有する汎用および／または専用の処理アセンブリであってもよい。計算ユニット８０１のいくつかの例は、中央処理ユニット（ＣＰＵ）、グラフィックス処理ユニット（ＧＰＵ）、各種の専用の人工知能（ＡＩ）コンピューティングチップ、各種の機械学習モデルアルゴリズムを実行する計算ユニット、デジタルシグナルプロセッサ（ＤＳＰ）、および任意の適当なプロセッサ、コントローラ、マイクロコントローラ等を含んでもよいが、これらに限定されない。計算ユニット８０１は、上記各方法および処理、例えば、相関係数取得方法を実行する。例えば、いくつかの実施例において、相関係数取得方法は、コンピュータソフトウェアプログラムとして実現でき、有形的に記憶ユニット８０８のような機器可読媒体に含まれている。いくつかの実施例において、コンピュータプログラムの一部または全ては、ＲＯＭ８０２および／または通信ユニット８０９を介して機器８００にロードおよび／またはインストールされ得る。コンピュータプログラムがＲＡＭ８０３にロードされて計算ユニット８０１により実行されると、上記相関係数取得方法の１つまたは複数のステップを実行することができる。あるいは、他の実施例において、計算ユニット８０１は、他の任意の適当な方式（例えば、ファームウェアを介して）により、相関係数取得方法を実行するように構成され得る。

【0132】

本開示に記載されたシステムおよび技術の様々な実施形態は、デジタル電子回路システム、集積回路システム、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）、特定用途向け集積回路（ＡＳＩＣ）、特定用途向け標準パーツ（ＡＳＳＰ）、システムオンチップのシステム（ＳＯＣ）、複合プログラマブルロジックデバイス（ＣＰＬＤ）、コンピュータハードウェア、ファームウェア、ソフトウェア、および／またはそれらの組み合わせで実現できる。これらの様々な実施形態は以下を含んでもよい。１つまたは複数のコンピュータプログラムに実施され、該１つまたは複数のコンピュータプログラムは、少なくとも１つのプログラマブルプロセッサを含むプログラマブルシステムで実行および／または解釈することができ、該プログラマブルプロセッサは、ストレージシステム、少なくとも１つの入力装置、および少なくとも１つの出力装置からデータおよび命令を受信し、且つデータおよび命令を、該ストレージシステム、該少なくとも１つの入力装置、および該少なくとも１つの出力装置に伝送することができる専用または汎用のプログラマブルプロセッサであってもよい。

【0133】

本開示の方法を実施するためのプログラムコードは、１つまたは複数のプログラミング言語の任意の組み合わせでコードできる。これらのプログラムコードは、汎用コンピュータ、専用コンピュータ、または他のプログラマブルデータ処理装置のプロセッサまたはコントローラに提供でき、これにより、プログラムコードがプロセッサまたはコントローラにより実行されると、フローチャートおよび／またはブロック図で規定された機能／操作が実施される。プログラムコードは、完全に機器で実行されてもよいし、一部が機器で実行されてもよいし、独立したソフトウェアパッケージとして一部が機器で実行されて一部がリモート機器で実行されてもよいし、完全にリモート機器またはサーバで実行されてもよい。

【0134】

本開示の明細書において、機器可読媒体は、命令実行システム、装置またはデバイスに使用される、または命令実行システム、装置またはデバイスと合わせて使用されるプログラムを含有または記憶できる有形的な媒体であってもよい。機器可読媒体は、機器可読信号媒体または機器可読記憶媒体であってもよい。機器可読媒体は、電子の、磁気の、光の、電磁気の、赤外線の、または半導体のシステム、装置またはデバイス、または上記内容の任意の適当な組み合わせを含んでもよいが、これらに限定されない。機器可読記憶媒体の更なる具体的な例は、１つまたは複数の線による電気的接続、ポータブルコンピュータディスク、ハードディスク、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能なプログラマブル読み出し専用メモリ（ＥＰＲＯＭまたはフラッシュメモリ）、光ファイバ、ポータブルコンパクトディスク読み出し専用ディスク（ＣＤ－ＲＯＭ）、光記憶デバイス、磁気記憶デバイス、または上記内容の任意の適当な組み合わせを含む。

【0135】

ユーザとのインタラクションを提供するために、ここで説明するシステムおよび技術をコンピュータで実施することができ、該コンピュータは、ユーザに情報を表示するための表示装置（例えば、ＣＲＴ（陰極線管）またはＬＣＤ（液晶ディスプレイ）モニタ）と、ユーザがそれにより入力をコンピュータに提供することができるキーボードおよび指向装置（例えば、マウスまたはトラックボール）とを有する。他の種類の装置は、更にユーザとのインタラクションを提供するために使用できる。例えば、ユーザに提供されるフィードバックは、任意の形式のセンシングフィードバック（例えば、視覚フィードバック、聴覚フィードバック、または触覚フィードバック）であってもよく、且つ、任意の形式（音入力、音声入力または、触覚入力を含む）でユーザからの入力を受信することができる。

【0136】

ここで説明するシステムおよび技術を、バックグラウンドコンポーネントを含むコンピューティングシステム（例えば、データサーバとする）、または中間コンポーネントを含むコンピューティングシステム（例えば、アプリケーションサーバ）、またはフロントエンドコンポーネントを含むコンピューティングシステム（例えば、ユーザがそれによりここで説明するシステムおよび技術の実施形態とインタラクションできるグラフィカルユーザインタフェースまたはネットワークブラウザを有するユーザコンピュータ）、またはこのようなバックグラウンドコンポーネント、中間コンポーネント、またはフロントエンドコンポーネントの任意の組み合わせを含むコンピューティングシステムに実施することができる。任意の形式または媒体のデジタルデータ通信（例えば、通信ネットワーク）により、システムのコンポーネントを互に接続することができる。通信ネットワークの例は、ローカルエリアネットワーク（ＬＡＮ）、ワイドエリアネットワーク（ＷＡＮ）、およびインターネットを含む。

【0137】

コンピューティングシステムはクライアントおよびサーバを含んでもよい。クライアントとサーバとは、一般的に互いに離れ、且つ、通常、通信ネットワークを介してインタラクションを行う。対応するコンピュータで実行されて互いにクライアント－サーバ関係を持つコンピュータプログラムにより、クライアントとサーバとの関係を生成する。サーバは、クラウドサーバであってもよいし、分散型システムのサーバであってもよいし、ブロックチェーンを組み合わせたサーバであってもよい。

【0138】

上記に示す様々な形式のフローを用い、ステップを並べ替え、追加または削除することができることを理解すべきである。例えば、本開示に記載された各ステップは、並列に実行されてもよいし、順に実行されてもよいし、異なる順序で実行されてもよく、本開示に係る技術案の所望する結果を達成できる限り、本開示はここで限定しない。

【0139】

上記具体的な実施形態は、本開示の保護範囲を限定するものではない。当業者は、設計要求および他の要因に基づき、様々な修正、組み合わせ、サブ組み合わせおよび代替が可能であることを理解すべできる。本開示の精神および原則内で行われる任意の修正、均等置換および改良等は、いずれも本開示の保護範囲内に含まれているべきである。

【図1】