特許7548432 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7548432学習方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-09-02

(45)【発行日】2024-09-10

(54)【発明の名称】学習方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20240903BHJP

G06N 3/098 20230101ALI20240903BHJP

【ＦＩ】

G06N20/00

G06N3/098

【請求項の数】 10

(21)【出願番号】P 2023526772

(86)(22)【出願日】2021-06-10

(86)【国際出願番号】 JP2021022174

(87)【国際公開番号】W WO2022259481

(87)【国際公開日】2022-12-15

【審査請求日】2023-11-24

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100124811

【弁理士】

【氏名又は名称】馬場資博

(74)【代理人】

【識別番号】100088959

【弁理士】

【氏名又は名称】境廣巳

(74)【代理人】

【識別番号】100097157

【弁理士】

【氏名又は名称】桂木雄二

(74)【代理人】

【識別番号】100187724

【弁理士】

【氏名又は名称】唐鎌睦

(72)【発明者】

【氏名】籾山悟至

【審査官】山本俊介

(56)【参考文献】

【文献】米国特許出願公開第２０２１／００９７４３９（ＵＳ，Ａ１）

【文献】国際公開第２０２０／１４８９９２（ＷＯ，Ａ１）

【文献】ZHU, Hangyu et al.，"From federated learning to federated neural architecture search: a survey"，Complex & Intelligent Systems，[online], Springer，2021年01月04日，Vol.7，Pages 639-657，[retrieved on 2021.07.28], Retrieved from the Internet: <URL: https://doi.org/10.1007/s40747-020-00247-z>，<DOI: 10.1007/s40747-020-00247-z>

【文献】CHEN, Cheng et al.，"CERTIFIABLY-ROBUST FEDERATED ADVERSARIAL LEARNING VIA RANDOMIZED SMOOTHING"，arXiv:2103.16031v1，version v1，[online], arXiv (Cornell University)，2021年03月30日，Pages 1-9，[retrieved on 2021.07.27], Retrieved from the Internet: <URL: https://arxiv.org/abs/2103.16031v1>.

【文献】CRESWELL, Antonia et al.，"Generative Adversarial Networks : An overview"，IEEE Signal Processing Magazine，2018年01月10日，Vol.35, No.1，Pages 53-65，ISSN: 1053-5888, <DOI: 10.1109/MSP.2017.2765202>.

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

(57)【特許請求の範囲】

【請求項1】

情報処理装置が複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を用いた学習方法であって、
前記情報処理装置が、
複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当て、
複数の前記クライアント装置により学習後に生成されたモデルを集計する、
学習方法。

【請求項2】

請求項１に記載の学習方法であって、
少なくとも１つの所定のクライアント装置に第一の学習を実行させると共に、少なくとも１つの他の前記クライアント装置に前記第一の学習とは学習方法が異なり学習データの生成処理を伴う第二の学習を実行させるよう割り当てる、
学習方法。

【請求項3】

請求項２に記載の学習方法であって、
前記所定のクライアント装置に前記第一の学習として通常学習を実行させると共に、前記他のクライアント装置に前記第二の学習として敵対的サンプルを生成して当該敵対的サンプルの学習処理を伴う敵対的学習を実行させるよう割り当てる、
学習方法。

【請求項4】

請求項１乃至３のいずれかに記載の学習方法であって、
複数の前記クライアント装置による学習の実行後に生成されたモデルを集計して新たなモデルを生成し、
さらに、前記新たなモデルに対して、複数の前記クライアント装置に、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当てる、
学習方法。

【請求項5】

請求項１乃至４のいずれかに記載の学習方法であって、
予め設定された少なくとも２つの学習方法の割当比率に応じて、複数の前記クライアント装置にいずれかの学習を実行させるよう割り当てる、
学習方法。

【請求項6】

請求項５に記載の学習方法であって、
複数の前記クライアント装置による学習の実行後に生成されたモデルを集計した後に、前記割当比率を変更し、
さらに、変更された前記割当比率に応じて、複数の前記クライアント装置にいずれかの学習を実行させるよう割り当てる、
学習方法。

【請求項7】

請求項６に記載の学習方法であって、
複数の前記クライアント装置に実行させた学習の進行度に基づいて、前記割当比率を変更する、
学習方法。

【請求項8】

請求項６又は７に記載の学習方法であって、
複数の前記クライアント装置から集計したモデルに基づいて、前記割当比率を変更する、
学習方法。

【請求項9】

複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を用いた学習装置であって、
複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当てる割当部と、
複数の前記クライアント装置により学習後に生成されたモデルを集計する集計部と、
を備えた学習装置。

【請求項10】

情報処理装置に、
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を行う際に、複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当て、
複数の前記クライアント装置により学習後に生成されたモデルを集計する、
処理を実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、連合学習を用いた学習方法に関する。

【背景技術】

【0002】

機械学習・深層学習におけるモデルの学習方法のうち、複数のクライアントマシンが分散環境で学習に参加する手法の一つに連合学習がある。

【0003】

連合学習の学習形式として、例えば図１に示すような形式が挙げられる。連合学習は、学習を管理する中央サーバ５０と、学習そのものを行う情報処理装置であるクライアント６０－１～６０－Ｋと、によって実施される。中央サーバ５０は、学習を行う機械学習・深層学習モデルのパラメータのクライアントへの送信を行うクライアント通信装置５１と、クライアントから送信される学習済みモデルの集約及びモデルパラメータの更新を行うモデル集計装置５２と、を備えている。クライアント６０－１～６０－Ｋは、各クライアントが保存している独自のデータセットを用いて個別に学習を行う。このような連合学習の一例が、非特許文献１、特許文献１、及び特許文献２に記載されている。

【0004】

ここで、非特許文献１に記載の連合学習システムは、例えば図２のフローチャートに示すように動作する。上記のように、連合学習システムによる連合学習は、中央サーバ５０と学習に参加する全クライアント６０－１～６０－Ｋとによって実施される。

【0005】

まず、中央サーバ５０は、学習の開始に際して、必要に応じてパラメータの入力を行う（ステップＳ５１）。そして、連合学習システムは、連合学習として、以下にラウンドと定義する一連の手続きを、決められた回数、もしくは決められた評価指標に達するまで繰り返す。１回のラウンドの動作は以下の通りである。

【0006】

ラウンドの開始時に、中央サーバ５０は、全クライアント（Ｎ個とする）の中からそのラウンドで学習に参加するＫ個のクライアント６０－１～６０－Ｋを抽選して決定する（ステップＳ５２）。この時、選ばれるクライアント数Ｋは、１以上Ｎ以下である。なお、図１には、予めＮ個全てのクライアントではなく、各ラウンドで学習に参加するＫ個のクライアント６０－１～６０－Ｋのみを図示している。例えば、Ｎの数が数個から１００個程度の研究機関などが保有するサーバーマシンを利用した計算能力の高い環境での連合学習の場合、Ｋの数としてＮの数の８０％程度を設定した学習が考えられる。一方で、Ｎの数が数万程度かそれ以上となるような一般ユーザが所有するような携帯端末などを用いた連合学習の場合は、Ｋの数としてＮの数の１０％程度を設定した学習が考えられる。

【0007】

次に、中央サーバ５０は、抽選されたＫ個のクライアント６０－１～６０－Ｋ全てに、学習させる機械学習・深層学習モデル（グローバルモデル）を送信する（ステップＳ５３）。抽選されたＫ個のクライアント６０－１～６０－Ｋは、グローバルモデルを受信した後、各クライアントが記憶しているデータを用いて個別に学習を行う（ステップＳ５４）。抽選されたＫ個のクライアント６０－１～６０－Ｋは、学習が終了し次第、学習済みのモデル（ローカルモデル）を中央サーバ５０に送信する（ステップＳ５５）。中央サーバ５０は、各クライアント６０－１～６０－Ｋから送信されるローカルモデルを、あらかじめ決められた方法で集約演算し、その演算結果を使ってグローバルモデルの更新を行う（ステップＳ５６）。以上が連合学習の１ラウンドの動作であり、前回のラウンドのグローバルモデルの更新結果が、次回のラウンドでクライアントに送信されるグローバルモデルとして利用されることで、学習が進む。既定のラウンド数の学習が進行する、もしくは決められた評価指標に達した段階で、全ての学習プロセスを終了する（ステップＳ５７でＹｅｓ）。

【0008】

ここで、上述の連合学習では、学習の各時点で中央サーバ５０がグローバルモデルをクライアントデバイス６０－１～６０－Ｋに一斉送信する。そのため、悪意のある攻撃者がクライアントとして学習に参加していた場合、攻撃者はモデル情報を自動的に入手することができ、モデル情報を持たないときよりも精緻な攻撃を実現できる、という問題がある。例えば、攻撃者は下記に説明するような敵対的サンプル（ａｄｖｅｒｓａｒｉａｌｅｘａｍｐｌｅｓ）を用いた攻撃を行うことで、モデルの正常な学習を阻害、あるいは学習完了後のモデルが誤動作するように誘導したり、モデル情報から学習データを復元するなどのプライバシーを侵害するような情報の窃取を行ったりすることが生じうる。

【0009】

また、機械学習・深層学習モデルへの攻撃として、敵対的サンプルによる攻撃を挙げることができる。敵対的サンプルは、機械学習・深層学習モデルが誤作動するように計算された摂動が意図的に加えられたデータである。敵対的サンプルは、任意の機械学習・深層学習モデルで生じうる問題であり、セキュリティ上の重大な課題である。現在までのところ、敵対的サンプルの影響を受けない機械学習・深層学習モデルは提案されておらず、セキュリティ上の堅牢性を向上するためには何らかの付加的な防御手段を付与する必要がある。このうち、現在までに知られている防御手法の中で最も有用な手法の一つが、敵対的学習である。このような敵対的学習の一例が非特許文献２に記載されている。

【0010】

敵対的学習は、例えば図３のフローチャートに示すように動作する。ここで、下記の敵対的学習は１台のマシン上で行われるものを念頭に置いており、かかる１台のマシン上の敵対的学習は、連合学習との組み合わせを考える場合には、連合学習を行う複数台のクライアントのうち、１台のクライアント上での学習に相当する。敵対的学習は、以下の処理を決められた回数、もしくはモデル性能が決められた評価指標に達するまで繰り返される。

【0011】

具体的に、敵対的学習では、まず、学習を行うクライアントが、データセットからモデルの更新に利用するデータを選択する（ステップＳ６１）。次に、クライアントは、選ばれたデータを用いて現在の学習進行度のモデルに対する敵対的サンプルを生成する（ステップＳ６２）。この際、敵対的サンプルの生成には、生成方法による差はあるものの、一般的に１０回程度の反復計算が必要である（ステップＳ６３）。その後、クライアントは、生成された敵対的サンプルを用いてモデルパラメータの更新を行う（ステップＳ６４）。そして、既定のデータ量かその繰り返し、もしくは決められた評価指標に達した段階で、全ての学習プロセスを終了する（ステップＳ６５）。

【先行技術文献】

【特許文献】

【0012】

【文献】特表2020-528588号公報 (WO2019/032157)

【文献】特表2020-528589号公報 (WO2019/032156)

【非特許文献】

【0013】

【文献】Peter Kairouz他著、”Advances and Open Problems in Federated Learning”、2016 arXiv

【文献】Aleksandar Madry他著、“Towards deep learning models resistant to adversarial attacks”、ICLR、2018

【発明の概要】

【発明が解決しようとする課題】

【0014】

ここで、上記のように敵対的学習では、データの選択によるモデルの更新という通常の学習方法でも含まれていた反復計算の内部で、敵対的サンプルを生成する、という別の反復計算が都度行われることとなる。そのため、計算時間が長大化するという問題が生じる。特に、上述したような連合学習の枠組みで敵対的学習を行う場合、敵対的学習のアルゴリズムはクライアントで処理されることとなるが、連合学習におけるクライアントマシンは様々な種類が考えられ、必ずしも強力なＣＰＵやＧＰＵ、あるいは潤沢なメモリを備えた計算機に限らない。例えば、連合学習におけるクライアントマシンは、用途によってはスマートフォンなどの計算資源の乏しいデバイスがクライアントとなる場合も想定される。このような場合、上記の敵対的学習のアルゴリズムの面からの計算時間の長大化に加え、クライアントの計算能力の乏しさによる計算時間の長大化も生じることとなる。

【0015】

このため、本発明の目的は、上述した課題である、連合学習における計算時間の長大化、ということを解決することができる学習方法を提供することにある。

【課題を解決するための手段】

【0016】

本発明の一形態である学習方法は、
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を用いた学習方法であって、
複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当て、
複数の前記クライアント装置により学習後に生成されたモデルを集計する、
という構成をとる。

【0017】

また、本発明の一形態である学習装置は、
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を用いた学習装置であって、
複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当てる割当部と、
複数の前記クライアント装置により学習後に生成されたモデルを集計する集計部と、
を備えた、
という構成をとる。

【0018】

また、本発明の一形態であるプログラムは、
情報処理装置に、
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を行う際に、複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当て、
複数の前記クライアント装置により学習後に生成されたモデルを集計する、
処理を実行させる、
という構成をとる。

【発明の効果】

【0019】

本発明は、以上のように構成されることにより、連合学習における計算時間の長大化を抑制することができる学習方法を提供することができる。
にある。

【図面の簡単な説明】

【0020】

【図1】連合学習システムの構成例を示すブロック図である。

【図2】連合学習システムの動作例を示すフローチャートである。

【図3】敵対的学習の動作例を示すフローチャートである。

【図4】本発明の第１の実施形態における連合学習システムの構成を示すブロック図である。

【図5】図４に開示した連合学習システムの動作を示すフローチャートである。

【図6】図４に開示した連合学習システムの動作を示すシーケンス図である。

【図7】本発明の第２の実施形態の連合学習システムの構成を示すブロック図である。

【図8】図７に開示した連合学習システムの動作を示すフローチャートである。

【図9】本発明における学習方法と他の学習方法との効果の比較を示す表である。

【図10】本発明の第３の実施形態における学習装置のハードウェア構成を示すブロック図である。

【図11】本発明の第３の実施形態における学習装置の構成を示すブロック図である。

【図12】本発明の第３の実施形態における学習装置の動作を示すフローチャートである。

【発明を実施するための形態】

【0021】

＜第１の実施形態＞
本発明の第１の実施形態について、図４乃至図６を参照して説明する。図４は、連合学習システムの構成を説明するための図であり、図５乃至図６は、連合学習システムの動作を説明するための図である。

【0022】

本発明における連合学習システムは、特に、敵対的学習を適用可能なタスクに対して応用することができる。例として、本発明の連合学習システムは、画像や音声を分類したり認証するためのモデルを生成することに利用することができる。但し、本発明の連合学習システムは、いかなる分野で利用されてもよい。

【0023】

［構成］
図１に示すように、第１の実施形態における連合学習システムは、複数（任意の個数Ｎ個）のクライアント学習装置（以下、「クライアント」とも称する。）と、中央サーバ１０と、を備える。ここで、図１には、後述するように各ラウンドで抽選された学習に参加するＫ個のクライアント学習装置２０－１～２０－Ｋのみを図示している。個々のクライアント学習装置２０－１～２０－Ｋと中央サーバ１０とは、通信可能に接続されている。

【0024】

中央サーバ１０は、その内部にクライアント通信装置１１とモデル集計装置１２とクライアント割り当て装置１３とを備える。クライアント通信装置１１とモデル集計装置１２、クライアント通信装置１１とクライアント割り当て装置１３は、中央サーバ１０の中部でそれぞれ接続されている。

【0025】

なお、本発明は、コンピュータつまり中央サーバ１０を連合学習システムとして機能させる連合学習プログラムとしても実現することができる。コンピュータである中央サーバ１０は、連合学習プログラムが読み込まれ実行される中央処理装置（ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ））、クライアントにおいて個別にデータを保存したり中央サーバ１０においてグローバルモデルの保存を行ったりする記憶装置（ハードディスク等）、キーボードやマウスなどの入力手段である入力装置１５、ディスプレイなどの表示手段である表示装置、を備える。

【0026】

本発明の第１の実施の形態では、中央サーバ１０のＣＰＵに読み込まれた連合学習プログラムは、当該ＣＰＵに、上述したクライアント通信装置１１、モデル集計装置１２、クライアント割り当て装置１３、を構築する。以下、各構成について説明する。

【0027】

クライアント割り当て装置１３（割当部）は、各ラウンドにおいて学習に参加するクライアント２０－１～２０－Ｋが通常の学習と敵対的学習とのどちらを行うかを指定する。この学習方法の指定は、クライアント通信装置１１を通じて各ラウンドで学習に参加する全てのクライアント２０－１～２０－Ｋに送信される。なお、学習の開始時に、クライアント割り当て装置１３は、各ラウンドでクライアント２０－１～２０－Ｋに通常学習と敵対的学習とを割り振る比率を入力として受け取る。この２つの学習方法の割り当て比率は、学習の開始時点で外部より入力されても良いし、学習するモデルのタスクやモデル構造、データに関する情報などから自動的に計算されてもよい。学習方法の割り当ては、例えば、各クライアントに完全にランダムに割り当てても良いし、各クライアントの計算資源や処理速度、保有するデータに関する情報に応じて割り当ててもよい。一例として、学習に参加する全クライアント数は、データセンターや企業などの比較的大きなデータを保有し、かつ計算能力に優れたマシンを用いた学習の場合には、数個から１００個程度とする。また、別の例として、学習に参加する全クライアント数は、スマートフォンなどの計算資源の乏しいクライアントを用いた学習の場合には、数百万以上とする。そして、これらのクライアントに対して、例えば、通常学習と敵対的学習を「５：５」や「３：７」といった比率で割り当てる。但し、クライアントの総数や各学習への割り当て比率は、上述した値に限定されない。

【0028】

なお、本実施形態におけるクライアント割り当て装置１３は、選択されたクライアント２０－１～２０－Ｋのうち、少なくとも１つのクライアントに通常学習を割り当て、少なくとも１つのクライアントに敵対的学習を割り当てることとしている。但し、クライアント割り当て装置１３は、状況によっては、いずれかの学習方法を選択された全てのクライアントにも割り当ててもよい。例えば、クライアント割り当て装置１３は、通常学習と敵対的学習を「１０：０」や「０：１０」といった比率で割り当ててもよい。一例として、クライアント割り当て装置１３は、後述するように、ラウンドと呼ばれる１回の学習が複数回繰り返されるような場合には、全ラウンドのうち一部のラウンドでは、通常学習と敵対的学習を「１０：０」や「０：１０」の比率としてもよい。

【0029】

また、クライアント割り当て装置１３がクライアントに割り当てる学習方法は、必ずしも通常学習と敵対的学習であることに限定されない。例えば、クライアント割り当て装置１３は、クライアントに対して、所定の第一の学習と、当該第一の学習とは学習方法が異なる第二の学習と、を割り当ててもよい。このとき、第一の学習と第二の学習とは、同一のモデルに対して学習と行うものである。また、クライアント割り当て装置１３は、クライアントに対して、必ずしも２つの異なる学習を割り当てることに限定されず、３つ以上の異なる学習を割り当ててもよい。

【0030】

クライアント通信装置１１（割当部、集計部）は、各ラウンドで学習に参加するクライアント２０－１～２０－Ｋに対してのグローバルモデルを送信し、クライアント割り当て装置１３によって決定された学習方法を各クライアントに送信する機能を有する。また、クライアント通信装置１１は、学習が完了したクライアント２０－１～２０－Ｋからのローカルモデルの受信を行う。つまり、各クライアントは、後述するように独自に保有するデータを用いて学習を行い、学習結果の学習済みモデルであるローカルモデルを中央サーバ１０に送信するため、かかるローカルモデルをクライアント通信装置１１が受信する。

【0031】

ここで、後述するように各クライアント２０－１～２０－Ｋは、学習方法の割り当てに応じて、「通常学習」、もしくは、学習の各ステップで学習データから敵対的サンプルを生成し、その敵対的サンプルを学習データとする「敵対的学習」のどちらかを行う。このとき各クライアント２０－１～２０－Ｋで実行される学習プログラム、および敵対的学習を行う際の敵対的サンプルの生成サブルーチン用プログラムなどは、例えば、クライアント通信装置１１が各クライアント２０－１～２０－Ｋに送信する。これにより、クライアント２０－１～２０－Ｋは、上述したようなプログラムを連合学習が始まる時点で取得したり、あるいは、学習の各ラウンドでクライアントが学習に参加することが決定した時点で取得する。なお、クライアント２０－１～２０－Ｋで実行される学習に利用するプログラムは、必ずしもクライアント通信装置１１が提供することに限定されず、クライアント２０－１～２０－Ｋは他の方法で取得してもよい。

【0032】

モデル集計装置１２は、予め決められた連合学習のアルゴリズムに従って、クライアント通信装置１１が受信した複数のクライアント２０－１～２０－Ｋからの複数のローカルモデルを演算処理によって集約し、その結果を利用してグローバルモデルを更新する。具体的に、各ラウンドで学習に参加するクライアントに送信されたグローバルモデルは、各クライアント２０－１～２０－Ｋが持つ固有のデータを用いて独自に学習が行われ、その学習結果であるローカルモデルが各クライアント２０－１～２０－Ｋから個別にクライアント通信装置１１に送信される。そして、モデル集計装置１２は、例えば、各ローカルモデルの重みパラメータの算術平均や、外れ値を除いたり中央値付近のみを用いたりした平均値などの平均化アルゴリズムによって、新しいグローバルモデルの重みパラメータを計算する。この新しく更新されたグローバルモデルは、上述したようにクライアント通信装置１１によって次のラウンドでクライアント２０－１～２０－Ｋに送信される。

【0033】

クライアント学習装置２０－１～２０－Ｋは、中央サーバ１０から送信されたグローバルモデルを受信し、当該グローバルモデルに対して、各クライアント２０－１～２０－Ｋ上の個別の学習用データを用いた学習を行う。このとき、クライアント２０－１～２０－Ｋは、上述したようにクライアント割り当て装置１３にて割り当てられた学習方法による学習を行う。例えば、クライアント２０－１～２０－Ｋは、正常系のデータをそのまま使った学習である通常学習を行うか、もしくは、敵対的学習を行う。学習データとしては、例えば、スマートフォンなどで撮影した写真に含まれる顔画像データのような、プライバシーの観点から取り扱いに留意が必要なデータを用いることができる。

【0034】

クライアント２０－１～２０－Ｋは、敵対的学習を行う場合には、以下のラウンドと呼ばれる一連の処理を、予め決められた回数、もしくはモデル性能が決められた評価指標に達するまで繰り返す。まず、通常学習と同じように、学習の各ステップでクライアント２０－１～２０－Ｋは保有しているデータの中から学習に用いるデータを選択する。次に、クライアント２０－１～２０－Ｋは、選ばれたデータを用いて現在の学習進行度のモデルに対する敵対的サンプルを生成する。このように、敵対的学習では、上述した通常学習とは異なり、敵対的サンプルを生成する処理が追加される。その後、生成された敵対的サンプルを用いてグローバルモデルに対する敵対的学習を行い、モデルパラメータの更新を行う。

【0035】

なお、クライアント２０－１～２０－Ｋが実行する学習方法は、上述したように、クライアント割り当て装置１３によって決定され、クライアント通信装置１１を介してクライアントに通知される。例えば、図１の例では、符号２０－１～２０－ＭまでのＭ個のクライアントが通常学習を行い、符号２０－（Ｍ＋１）～２０－Ｋまでの（Ｋ－Ｍ）個のクライアントが敵対的学習を行う場合が図示されている。そして、各クライアント２０－１～２０－Ｋは、指定された方法での学習が完了し次第、中央サーバ１０のクライアント通信装置１１に学習済みのローカルモデルを送信する。

【0036】

［動作］
次に、上述した連合学習システムの動作を、図５のフローチャート及び図６のシーケンス図を参照して説明する。

【0037】

まず、中央サーバ１０は、入力装置１５から各ラウンドで学習に参加するクライアント２０－１～２０－Ｋに通常学習と敵対的学習を割り振る比率の入力を受ける（図５のステップＳ１、図６のステップＳ１１）。その後、連合学習システムは、予め決められた回数、もしくは決められた評価指標に達するまで、以下の学習プロセスを繰り返す。なお、この繰り返しプロセスをラウンドと呼ぶ。

【0038】

そして、新しいラウンドの開始時に、中央サーバ１０は、学習に参加する全クライアントの中から、そのラウンドの学習に参加するクライアント２０－１～２０－Ｋを抽選する（図５のステップＳ２、図６のステップＳ１２）。中央サーバ１０は、これらの抽選されたクライアント２０－１～２０－Ｋにグローバルモデルを送信する（図５のステップＳ３、図６のステップＳ１３）。次に、中央サーバ１０は、抽選されたクライアント２０－１～２０－Ｋが、そのラウンドにおいて通常学習と敵対的学習のどちらを行うかを、入力された学習の割り当て比率に従って割り当てて、割り当てた学習方法で学習するようクライアント２０－１～２０－Ｋに通知する（図５のステップＳ４、図６のステップＳ１４）。例えば、図１に示すように、符号２０－１～２０－ＭまでのＭ個のクライアントに通常学習が割り当てられ、符号２０－（Ｍ＋１）～２０－Ｋまでの（Ｋ－Ｍ）個のクライアントに敵対的学習が割り当てられる。

【0039】

そして、学習方法の割り当ての指示を受けたクライアント２０－１～２０－Ｋは、自身が割り当てられた学習方法で個別に有するデータセットを用いて学習を行う（図５のステップＳ５）。このとき、通常学習が割り当てられたクライアント２０－１～２０－Ｍは、保有しているデータをそのまま使った学習であるグローバルモデルに対する通常学習を行い、モデルパラメータを更新したローカルモデルを生成する（図６のステップＳ１５）。一方、敵対的学習が割り当てられたクライアント２０－（Ｍ＋１）～２０－Ｋは、敵対的学習を行うにあたり、まず、保有しているデータから敵対的サンプルを生成する。そして、クライアント２０－（Ｍ＋１）～２０－Ｋは、生成された敵対的サンプルを用いてグローバルモデルに対する敵対的学習を行い、モデルパラメータを更新したローカルモデルを生成する（図６のステップＳ１６）。

【0040】

その後、学習が終了したクライアント２０－１～２０－Ｋは、個別にローカルモデルを中央サーバ１０へ送信する（図５のステップＳ６、図６のステップＳ１７，Ｓ１８）。中央サーバ１０は、受信した複数のクライアント２０－１～２０－Ｋからのローカルモデルを、あらかじめ決められた連合学習のアルゴリズムによって集約し、グローバルモデルの更新を行い、ラウンドを終了する（図５のステップＳ７、図６のステップＳ１９，Ｓ２０）。更新されたグローバルモデルは、中央サーバ１０が次回ラウンドでクライアント２０－１～２０－Ｍに送信されることとなる（図５のステップＳ８でＮｏ，Ｓ２，Ｓ３）。そして、中央サーバ１０は、既定のラウンド数の学習が進行するか、もしくは決められた評価指標に達するまで、上述したラウンドと呼ばれる学習プロセスを繰り返し実行する（図５のステップＳ８でＮｏ）。一方で、中央サーバ１０は、学習の終了要件を満たした場合には（図５のステップＳ８でＹｅｓ）、全ての学習プロセスを終了し、図示しない出力装置に学習済みのグローバルモデルを出力する。

【0041】

［効果］
以上のように、第１の実施形態における連合学習システムは、各ラウンドにおいて、通常の連合学習のようにすべてのクライアントが正常系のデータを用いて通常学習を行うわけではなく、また、全てのクライアントが敵対的学習を行うわけでもなく、ある一定の比率で一部のクライアントが通常学習を、残りのクライアントが敵対的学習を行っている。このため、正常系のデータを用いた学習により敵対的学習よりも計算資源を削減できると共に、敵対的サンプルに対する堅牢性と正常データに対する精度を担保しながら、全体として計算量を削減することができる。

【0042】

＜第２の実施形態＞
次に、本発明の第２の実施形態を、図７乃至図８を参照して説明する。図７は、連合学習システムの構成を説明するための図であり、図８は連合学習システムの処理動作を説明するための図である。

【0043】

［構成］
図７に示すように、本実施径形態における連合学習システムは、第１の実施形態で説明した中央サーバ１０の構成に加えて、当該中央サーバ１０がさらにクライアント比率調整装置１４（変更部）を備えている。このクライアント比率調整装置１４は、中央サーバ１０が備えるＣＰＵに連合学習プログラムが読み込まれることにより、当該ＣＰＵに構築される。なお、中央サーバ１０が備えるその他の構成要素については、第１の実施形態と同様であり、図１と同一の符号を付し、詳細な説明を省略する。

【0044】

上記クライアント比率調整装置１４は、各ラウンドで学習に参加するクライアント２０－１～２０－Ｋの学習方法の割り当て比率を、予め設定された基準に基づいて変更して更新する機能を有する。かかる構成が、主に第１の実施形態との相違点であり、以下、主に相違点について詳述する。

【0045】

クライアント比率調整装置１４は、クライアント割り当て装置１３と中央サーバ１０の中部で接続されている。そして、クライアント比率調整装置１４は、上述したようにラウンドと呼ぶ学習の各段階で、学習方法の割り当て比率を更新し、クライアント割り当て装置１３に送信する。クライアント割り当て装置１３は、クライアント比率調整装置１４から送信された比率に応じて、各ラウンドで学習に参加するクライアント２０－１～２０－Ｋが行う学習方法を、クライアントごとに割り振る。なお、クライアントの学習方法の割り当て比率は、学習の開始時に学習の進行度とその時点で対応する割り当て比率との組の形でクライアント比率調整装置１４が入力として受け取ってもよい。また、学習の開始時点の割り当て比率のみを入力として受け取り、クライアント比率調整装置１４が学習の各時点で、グローバルモデル、あるいは複数のローカルモデルの性能や統計量を利用して、適応的に割り当て比率を調整してもよい。

【0046】

割当比率の調整の方法の例としては、例えば、予めラウンドの進行度に対して学習の割り当て比率を決めておき、実際のラウンドの進行度に従ってクライアント比率調整装置１４が比率変更を行う。一例として、全部で１００ラウンドの学習を行う場合に、最初から５０ラウンドまでは通常学習を行うクライアントと敵対的学習を行うクライアントとの比率を８：２、その後の５１ラウンドから１００ラウンドまでは、通常学習を行うクライアントと敵対的学習を行うクライアントとの比率を２：５、などとしてもよく、ラウンドが進むごとに段階的に比率を変えてもよい。

【0047】

なお、クライアント比率調整装置１４は、割当比率を以下のように変更してもよい。例えば、１００ラウンドの学習を行う場合に、最初から５０ラウンドまでは通常学習を行うクライアントと敵対的学習を行うクライアントとの比率を１０：０、すなわち学習に参加する全てのクライアントが通常学習を行うようにし、それ以降は比率が０：１０、すなわち学習に参加する全てのクライアントが敵対的学習を行う、という割当比率としてもよい。このように、クライアント比率調整装置１４は、ラウンドや時間に応じて、クライアントに対する学習方法の割当を変更してもよい。

【0048】

また、別の例としては、学習開始前に決めておいた特定の指標に従って、クライアント比率調整装置１４が学習比率を変化させてよい。例えば、グローバルモデルや各クライアントの学習結果のローカルモデルの性能を各ラウンド終了時に計算し、これらが一定の閾値を超えた場合に割当比率を変更する。この場合、モデル性能の評価指数として、例えば分類問題に関しては通常データに対する分類正答率や、敵対的サンプルに対する分類の失敗率などを挙げることができる。また、これらの性能の評価指数が各学習済みローカルモデルの間でどの程度ばらついているか、もしくは収束しているかといった、学習の進行に関する統計量に応じて、学習比率を調整する方法も考えられる。

【0049】

［動作］
次に、上述した連合学習システムの動作を、図８のフローチャートを参照して説明する。なお、第１の実施形態と同様の動作については、図５と同一の符号を付し、詳細な説明を省略する。

【0050】

本実施形態における連合学習システムは、以下の点で第１の実施形態と動作が異なる。中央サーバ１０のクライアント比率調整装置１４は、学習の各ラウンドにおいて、ステップＳ７でグローバルモデルを更新した後、予め入力された割当比率の推移に従って、もしくは適応的な調整によって、次回ラウンドで使用する通常学習と敵対的学習のクライアントへの割り当て比率を更新する（図８のステップＳ７’）。例えば、クライアント比率調整装置１４は、ラウンドの進行度に応じて割当比率を変更したり、生成されたローカルモデルや更新されたグローバルモデルの評価結果に応じて割当比率を変更する。そして、中央サーバ１０は、学習の終了要件を満たしていない場合には（図８のステップＳ８でＮｏ）、クライアント割り当て装置１３が、変更した割当比率でクライアントの学習方法を割り当て、クライアントに学習させることとなる。

【0051】

［効果］
以上のおように、本実施形態においては、各ラウンドで通常学習と敵対的学習を行うクライアントの比率を変化させている。例えば、学習の初期段階においては多くのクライアントが通常学習を行い、学習が進行するにつれて敵対的学習の比率を高めることで、敵対的学習を多く行うことによる計算時間を削減しつつ、敵対的学習による頑強性を担保することができる。

【0052】

ここで、上述した本発明の学習方法を用いて実際に学習を行い、生成したモデルの精度と学習時間を評価した結果を図９に示す。ここでは、公開データを用いた１０クラスの画像分類問題を取り扱うこととしている。まず、「学習方法１」は、連合学習に敵対的学習を組み込み、学習の全ての時点でクライアント全てが敵対的学習を行った場合である。「学習方法２」は、予め決められた学習の総ラウンド数の３０％に到達するまでは、各ラウンドで全てのクライアントは正常系のデータを用いた学習を行い、その後は各ラウンドで全てのクライアントが敵対的学習を行うという学習を行った場合である。「学習方法３」は、学習の総ラウンドの２５％が経過するごとに、各ラウンドで学習に参加するクライアントのうち敵対的学習を行うクライアント数の比率が０％から７０％まで段階的に増加していく学習を行った場合である。これら３つの方法で学習されたモデルの評価指標として、正常系のデータに対する分類精度、敵対的サンプルに対する分類精度、「学習方法１」を基準とした各モデルの学習が完了するまでに必要な反復計算の回数の比率、を算出した。図９に示されているように、「学習方法２」及び「学習方法３」は、「学習方法１」と同程度の正常系データ・敵対的サンプルに対する分類精度を確保しつつ、計算回数を削減することに成功している。

【0053】

＜実施形態３＞
次に、本発明の第３の実施形態を、図１０乃至図１２を参照して説明する。図１０乃至図１１は、実施形態３における学習装置の構成を示すブロック図であり、図１２は、学習装置の動作を示すフローチャートである。なお、本実施形態では、上述した実施形態で説明した学習装置及び学習方法の構成の概略を示している。

【0054】

まず、図１０を参照して、本実施形態における学習装置１００のハードウェア構成を説明する。学習装置１００は、一般的な情報処理装置にて構成されており、一例として、以下のようなハードウェア構成を装備している。
・ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０１（演算装置）
・ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１０２（記憶装置）
・ＲＡＭ（ＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１０３（記憶装置）
・ＲＡＭ１０３にロードされるプログラム群１０４
・プログラム群１０４を格納する記憶装置１０５
・情報処理装置外部の記憶媒体１１０の読み書きを行うドライブ装置１０６
・情報処理装置外部の通信ネットワーク１１１と接続する通信インタフェース１０７
・データの入出力を行う入出力インタフェース１０８
・各構成要素を接続するバス１０９

【0055】

そして、学習装置１００は、プログラム群１０４をＣＰＵ１０１が取得して当該ＣＰＵ１０１が実行することで、図１１に示す割当部１２１と集計部１２２とを構築して装備することができる。なお、プログラム群１０４は、例えば、予め記憶装置１０５やＲＯＭ１０２に格納されており、必要に応じてＣＰＵ１０１がＲＡＭ１０３にロードして実行する。また、プログラム群１０４は、通信ネットワーク１１１を介してＣＰＵ１０１に供給されてもよいし、予め記憶媒体１１０に格納されており、ドライブ装置１０６が該プログラムを読み出してＣＰＵ１０１に供給してもよい。但し、上述した割当部１２１と集計部１２２とは、かかる手段を実現させるための専用の電子回路で構築されるものであってもよい。

【0056】

なお、図１０は、学習装置１００である情報処理装置のハードウェア構成の一例を示しており、情報処理装置のハードウェア構成は上述した場合に限定されない。例えば、情報処理装置は、ドライブ装置１０６を有さないなど、上述した構成の一部から構成されてもよい。

【0057】

そして、学習装置１００は、上述したようにプログラムによって構築された割当部１２１と集計部１２２との機能により、図１２のフローチャートに示す学習方法を実行する。

【0058】

図１２に示すように、学習装置１００は、
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を実行する際に、
複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当て（ステップＳ１０１）、
複数の前記クライアント装置により学習後に生成されたモデルを集計する（ステップＳ１０２）、
という処理を実行する。

【0059】

本発明は、以上のように構成されることにより、複数のクライアント装置にそれぞれ異なる学習方法による学習を実行させる連合学習を行い、学習後のモデルを集計している。これにより、異なる学習方法による特性をモデルに反映でき、高品質なモデルを生成できると共に、連合学習による計算時間の長大化を抑制することができる。

【0060】

なお、上述したプログラムは、様々なタイプの非一時的なコンピュータ可読媒体（non-transitory computer readable medium）を用いて格納され、コンピュータに供給することができる。非一時的なコンピュータ可読媒体は、様々なタイプの実体のある記録媒体（tangible storage medium）を含む。非一時的なコンピュータ可読媒体の例は、磁気記録媒体（例えばフレキシブルディスク、磁気テープ、ハードディスクドライブ）、光磁気記録媒体（例えば光磁気ディスク）、ＣＤ－ＲＯＭ（Read Only Memory）、ＣＤ－Ｒ、ＣＤ－Ｒ／Ｗ、半導体メモリ（例えば、マスクＲＯＭ、ＰＲＯＭ（Programmable ROM）、ＥＰＲＯＭ（Erasable PROM）、フラッシュＲＯＭ、ＲＡＭ（Random Access Memory））を含む。また、プログラムは、様々なタイプの一時的なコンピュータ可読媒体（transitory computer readable medium）によってコンピュータに供給されてもよい。一時的なコンピュータ可読媒体の例は、電気信号、光信号、及び電磁波を含む。一時的なコンピュータ可読媒体は、電線及び光ファイバ等の有線通信路、又は無線通信路を介して、プログラムをコンピュータに供給できる。

【0061】

以上、上記実施形態等を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。また、上述した割当部１２１と集計部１２２との機能のうちの少なくとも一以上の機能は、ネットワーク上のいかなる場所に設置され接続された情報処理装置で実行されてもよく、つまり、いわゆるクラウドコンピューティングで実行されてもよい。

【0062】

＜付記＞
上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における学習方法、学習装置、プログラムの構成の概略を説明する。但し、本発明は、以下の構成に限定されない。
（付記１）
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を用いた学習方法であって、
複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当て、
複数の前記クライアント装置により学習後に生成されたモデルを集計する、
学習方法。
（付記２）
付記１に記載の学習方法であって、
少なくとも１つの所定のクライアント装置に第一の学習を実行させると共に、少なくとも１つの他の前記クライアント装置に前記第一の学習とは学習方法が異なり学習データの生成処理を伴う第二の学習を実行させるよう割り当てる、
学習方法。
（付記３）
付記２に記載の学習方法であって、
前記所定のクライアント装置に前記第一の学習として通常学習を実行させると共に、前記他のクライアント装置に前記第二の学習として敵対的サンプルを生成して当該敵対的サンプルの学習処理を伴う敵対的学習を実行させるよう割り当てる、
学習方法。
（付記４）
付記１乃至３のいずれかに記載の学習方法であって、
複数の前記クライアント装置による学習の実行後に生成されたモデルを集計して新たなモデルを生成し、
さらに、前記新たなモデルに対して、複数の前記クライアント装置に、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当てる、
学習方法。
（付記５）
付記１乃至４のいずれかに記載の学習方法であって、
予め設定された少なくとも２つの学習方法の割当比率に応じて、複数の前記クライアント装置にいずれかの学習を実行させるよう割り当てる、
学習方法。
（付記６）
付記５に記載の学習方法であって、
複数の前記クライアント装置による学習の実行後に生成されたモデルを集計した後に、前記割当比率を変更し、
さらに、変更された前記割当比率に応じて、複数の前記クライアント装置にいずれかの学習を実行させるよう割り当てる、
学習方法。
（付記７）
付記６に記載の学習方法であって、
複数の前記クライアント装置に実行させた学習の進行度に基づいて、前記割当比率を変更する、
学習方法。
（付記８）
付記６又は７に記載の学習方法であって、
複数の前記クライアント装置から集計したモデルに基づいて、前記割当比率を変更する、
学習方法。
（付記９）
付記８に記載の学習方法であって、
複数の前記クライアント装置から集計したモデルの性能を評価した結果に基づいて、前記割当比率を変更する、
学習方法。
（付記１０）
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を用いた学習装置であって、
複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当てる割当部と、
複数の前記クライアント装置により学習後に生成されたモデルを集計する集計部と、
を備えた学習装置。
（付記１１）
付記１０に記載の学習装置であって、
前記割当部は、少なくとも１つの所定のクライアント装置に第一の学習を実行させると共に、少なくとも１つの他の前記クライアント装置に前記第一の学習とは学習方法が異なり学習データの生成処理を伴う第二の学習を実行させるよう割り当てる、
学習装置。
（付記１２）
付記１１に記載の学習装置であって、
前記割当部は、前記所定のクライアント装置に前記第一の学習として通常学習を実行させると共に、前記他のクライアント装置に前記第二の学習として敵対的サンプルを生成して当該敵対的サンプルの学習処理を伴う敵対的学習を実行させるよう割り当てる、
学習装置。
（付記１３）
付記１０乃至１２のいずれかに記載の学習装置であって、
前記集計部は、複数の前記クライアント装置による学習の実行後に生成されたモデルを集計して新たなモデルを生成し、
前記割当部は、さらに、前記新たなモデルに対して、複数の前記クライアント装置に、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当てる、
学習装置。
（付記１４）
付記１０乃至１３のいずれかに記載の学習装置であって、
前記割当部は、予め設定された少なくとも２つの学習方法の割当比率に応じて、複数の前記クライアント装置にいずれかの学習を実行させるよう割り当てる、
学習装置。
（付記１５）
付記１４に記載の学習装置であって、
複数の前記クライアント装置による学習の実行後に生成されたモデルを集計した後に、前記割当比率を変更する変更部を備え、
前記割当部は、さらに、変更された前記割当比率に応じて、複数の前記クライアント装置にいずれかの学習を実行させるよう割り当てる、
学習装置。
（付記１６）
付記１５に記載の学習装置であって、
前記変更部は、複数の前記クライアント装置に実行させた学習の進行度に基づいて、前記割当比率を変更する、
学習装置。
（付記１７）
付記１５又は１６に記載の学習装置であって、
前記変更部は、複数の前記クライアント装置から集計したモデルに基づいて、前記割当比率を変更する、
学習装置。
（付記１８）
付記１７に記載の学習装置であって、
前記変更部は、複数の前記クライアント装置から集計したモデルの性能を評価した結果に基づいて、前記割当比率を変更する、
学習装置。
（付記１９）
情報処理装置に、
複数のクライアント装置に同一のモデルに対する学習を実行させる連合学習を行う際に、複数の前記クライアント装置のそれぞれに対して、予め設定された少なくとも２つ以上の異なる学習方法による学習のうち、いずれかの学習を実行させるよう割り当て、
複数の前記クライアント装置により学習後に生成されたモデルを集計する、
処理を実行させるためのプログラムを記憶したコンピュータにて読み取り可能な記憶媒体。

【符号の説明】

【0063】

１０中央サーバ
１１クライアント通信装置
１２モデル集計装置
１３クライアント割り当て装置
１４クライアント比率調整装置
１５入力装置
２０－１～２０－Ｋクライアント
５０中央サーバ
５１クライアント通信装置
５２モデル集計装置
６０－１～６０－Ｋクライアント
１００学習装置
１０１ＣＰＵ
１０２ＲＯＭ
１０３ＲＡＭ
１０４プログラム群
１０５記憶装置
１０６ドライブ装置
１０７通信インタフェース
１０８入出力インタフェース
１０９バス
１１０記憶媒体
１１１通信ネットワーク
１２１割当部
１２２集計部
２００クライアント装置

【図1】