特許7561005 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ＪＳＯＬの特許一覧

特許7561005モデル学習方法、モデル学習システム、及びコンピュータプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-09-25

(45)【発行日】2024-10-03

(54)【発明の名称】モデル学習方法、モデル学習システム、及びコンピュータプログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20240926BHJP

G06N 3/10 20060101ALI20240926BHJP

G06N 3/098 20230101ALI20240926BHJP

【ＦＩ】

G06N20/00

G06N3/10

G06N3/098

【請求項の数】 11

(21)【出願番号】P 2020186618

(22)【出願日】2020-11-09

(65)【公開番号】P2022076275

(43)【公開日】2022-05-19

【審査請求日】2023-05-29

(73)【特許権者】

【識別番号】507228172

【氏名又は名称】株式会社ＪＳＯＬ

(74)【代理人】

【識別番号】100114557

【弁理士】

【氏名又は名称】河野英仁

(74)【代理人】

【識別番号】100078868

【弁理士】

【氏名又は名称】河野登夫

(72)【発明者】

【氏名】松崎健一

(72)【発明者】

【氏名】石川淳也

(72)【発明者】

【氏名】鈴木悠哉

【審査官】福西章人

(56)【参考文献】

【文献】特表２０１９－５２６８５１（ＪＰ，Ａ）

【文献】特開２０２０－１６６６８１（ＪＰ，Ａ）

【文献】特開２０１７－０５８８４８（ＪＰ，Ａ）

【文献】JADHAV, Ashwin R et al.，Federated-Learning-PyTorch / src / federated_main.py，GitHub [online]，2020年07月25日，[検索日 2024.05.16]、インターネット:<URL:https://github.com/AshwinRJ/Federated-Learning-PyTorch/blob/master/src/federated_main.py>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０６Ｆ１８／００－１８／４０

(57)【特許請求の範囲】

【請求項1】

サーバに記憶するグローバルモデルのデータを複数のノードに対して配布し、
前記複数のノードで処理するローカルデータによって前記グローバルモデルを基に学習したローカルモデルのデータを取得し、
前記複数のノード夫々から取得した学習後のローカルモデルのデータに基づいて前記グローバルモデルのデータを更新し、
更新後のグローバルモデルのデータを更新回数に対応する更新情報と対応付けて記憶し、
前記グローバルモデルの性能評価値を算出し、
前記グローバルモデルのデータの配布、ローカルモデルのデータの取得、及びグローバルモデルのデータの更新を複数ラウンド繰り返し、
前記グローバルモデルのデータの更新の都度、前記グローバルモデルのデータ及び性能評価値を更新情報と対応付けて記憶し、
前記グローバルモデルの更新情報の指定と共に前記グローバルモデルの参照リクエストを受け付け、
前記参照リクエストに対し、算出された前記性能評価値に基づく前記グローバルモデルの性能の更新毎の推移を示す画面を表示するための画面データを作成し、
前記画面を前記参照リクエストのリクエスト元に出力させる
処理を含むモデル学習方法。

【請求項2】

前記サーバは、前記グローバルモデルの性能の推移を示す画面上で、前記グローバルモデルのデータの更新回数の指定、前記グローバルモデルのデータの更新停止の指示を受け付ける
請求項１に記載のモデル学習方法。

【請求項3】

前記サーバは、
前記複数のノード夫々に、ローカルデータに基づいて算出させた前記グローバルモデルの精度の評価値を取得し、
前記評価値に基づいて前記グローバルモデルの総合の性能評価値を算出し、
前記グローバルモデルの前記更新情報と対応付けて前記複数のノード夫々で算出された評価値と、前記総合の評価値とを示す性能画面を、前記参照リクエストのリクエスト元に出力させる
請求項１に記載のモデル学習方法。

【請求項4】

前記性能画面は、前記複数のノード夫々で算出された評価値を、前記グローバルモデルに対応するグラフィックに、エッジを介して接続する前記複数のノード夫々に対応するグラフィックを接続させて視覚化した画面を含む
請求項３に記載のモデル学習方法。

【請求項5】

前記サーバは、前記グローバルモデルの更新のために使用するローカルモデルの選択を受け付ける編集画面をノードに出力させる
請求項３に記載のモデル学習方法。

【請求項6】

前記サーバは、
前記グローバルモデルの更新のために使用する複数のローカルモデルそれぞれに対する重みの設定を受け付ける編集画面をノードに出力させ、
設定された重みづけを用いて、前記複数のローカルモデルのデータで前記グローバルモデルのデータを更新する
請求項３に記載のモデル学習方法。

【請求項7】

前記サーバは、
再分配するグローバルモデルの選択を前記画面上で受け付け、
学習の進行に関わらず、選択されたグローバルモデルのデータを前記複数のノードへ再分配する
請求項１から請求項６のいずれか１項に記載のモデル学習方法。

【請求項8】

前記サーバは、
前記複数のノードに、更新の都度、ローカルモデルの評価値を算出させ、
前記複数のノードに、前記ローカルモデルの学習に用いたローカルデータのデータ量、又は前記ローカルデータの特性を、前記ローカルモデルのデータと共に前記ローカルモデルの更新情報と対応付けて記憶させ、
前記複数のノードから、ローカルモデルのデータと対応付けてデータ量又はデータの特性を取得し、
前記ローカルモデルの更新情報と対応付けられた評価値を、ノードに出力させる
請求項１から請求項６のいずれか１項に記載のモデル学習方法。

【請求項9】

ローカルデータを各々処理する複数のノードと、該複数のノードから通信接続されるサーバとを含み、
前記サーバは、前記複数のノードへグローバルモデルのデータを配布し、
前記複数のノードは夫々、処理対象のローカルデータによって前記グローバルモデルからローカルモデルの学習を各々進め、
前記サーバが備える処理部は、
学習後の前記ローカルモデルのデータを前記複数のノードから取得し、
前記複数のノード夫々から取得した学習後のローカルモデルのデータに基づいてグローバルモデルのデータを更新し、
更新後のグローバルモデルのデータを更新回数に対応する更新情報と対応付けて記憶し、
前記グローバルモデルの性能評価値を算出し、
前記グローバルモデルのデータの配布、ローカルモデルのデータの取得、及びグローバルモデルのデータの更新を複数ラウンド繰り返し、
前記グローバルモデルのデータの更新の都度、前記グローバルモデルのデータ及び性能評価値を更新情報と対応付けて記憶し、
前記グローバルモデルの参照リクエストをノードから受け付け、
前記参照リクエストに対し、算出された前記性能評価値に基づく前記グローバルモデルの性能の更新毎の推移を示す画面を表示するための画面データを作成し、
前記画面を前記参照リクエストのリクエスト元から出力させる
モデル学習システム。

【請求項10】

複数のノードに通信接続が可能なコンピュータに、
記憶するグローバルモデルのデータを前記複数のノードに対して配布し、
前記複数のノード夫々で学習されたローカルモデルのデータを取得し、
前記複数のノード夫々から取得した学習後のローカルモデルのデータに基づいてグローバルモデルのデータを更新し、
更新後のグローバルモデルのデータを更新回数に対応する更新情報と対応付けて記憶し、
前記グローバルモデルの性能評価値を算出し、
前記グローバルモデルのデータの配布、ローカルモデルのデータの取得、及びグローバルモデルのデータの更新を複数ラウンド繰り返し、
前記グローバルモデルのデータの更新の都度、前記グローバルモデルのデータ及び性能評価値を更新情報と対応付けて記憶し、
前記グローバルモデルの参照リクエストを受け付け、
前記参照リクエストに対し、算出された前記性能評価値に基づく前記グローバルモデルの性能の更新毎の推移を示す画面を表示するための画面データを作成し、
前記画面を前記参照リクエストのリクエスト元から出力させる
処理を実行させるコンピュータプログラム。

【請求項11】

サーバと通信接続されるコンピュータに、
前記サーバから配布されるグローバルモデルを基にして処理対象のローカルデータを用いたローカルモデルを学習し、
学習後のローカルモデルのデータを前記サーバへ送信し、
異なる更新情報が対応付けられた更新後のグローバルモデルの一覧を含む画面データを前記サーバから受信し、
受信した画面データに基づいて前記コンピュータに備えられる表示部に、前記一覧を表示し、
前記一覧の内のいずれかの更新情報の指定を受け付け、
指定された更新情報に対応するグローバルモデルの性能評価値に基づく前記グローバルモデルの性能の更新毎の推移を示す画面の画面データを前記サーバから取得し、
取得した画面データに基づき、前記画面を表示する
処理を実行させるコンピュータプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、分散学習の実用化のためのモデル学習方法、モデル学習システム、及びコンピュータプログラムに関する。

【背景技術】

【0002】

深層学習に基づく学習モデルを用いた判定、認識等が実用化されている。学習モデルは多様な技術分野で活用できることが確認されている。学習モデルの精度を各種分野で実用化できる程度に向上するために膨大なトレーニングデータを用いたとしてもパラメータの収束に長時間を要し、精度が良くなるとも限らない。

【0003】

特許文献１には、学習対象の学習モデルのレプリカを複数用意し、それらの複数のモデルレプリカが、非同期で独自に学習する方法が開示されている。特許文献１では、パラメータサーバが複数に断片化されており、学習モデルの複数のレプリカが夫々、非同期で、断片化されたパラメータサーバからパラメータを取得して学習し、パラメータを各パラメータサーバへ返すことを繰り返す。このような分散処理により、学習モデルのパラメータが早期に収束するとされている。

【先行技術文献】

【特許文献】

【0004】

【文献】米国特許第８７６８８７０号明細書

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１に開示されているような分散処理による深層学習の方法であっても、トレーニングデータは集約している。しかしながら、医療、金融、認証といった分野のデータは個人データであって機密性が高い。モデルの精度を高めるためにトレーニングデータとしてデータを集約するためには、データの提供に各個人の同意が必要である上、同意が得られたとしてもデータ管理の安全性に対するリスクが常につきまとう。

【0006】

本発明は、斯かる事情に鑑みてなされたものであり、分散学習に基づく学習モデルの実用化を促進するモデル学習方法、モデル学習システム、及びコンピュータプログラムを提供することを目的とする。

【課題を解決するための手段】

【0007】

本開示の一実施形態のモデル学習方法は、サーバに記憶するグローバルモデルのデータを複数のノードに対して配布し、前記複数のノードで処理するローカルデータによって前記グローバルモデルを基に学習したローカルモデルのデータを取得し、前記複数のノード夫々から取得した学習後のローカルモデルのデータに基づいてグローバルモデルのデータを更新し、更新後のグローバルモデルのデータを更新回数に対応する更新情報と対応付けて記憶し、前記グローバルモデルの性能評価値を算出し、算出された性能評価値を、前記グローバルモデルの更新情報と対応付けて記憶し、前記グローバルモデルの更新情報の指定と共に前記グローバルモデルの参照リクエストを受け付け、指定された更新情報が対応付けられている前記グローバルモデルのデータ及び性能評価値を出力する処理を含む。

【0008】

本開示の一実施形態のモデル学習システムは、ローカルデータを各々処理する複数のノードと、該複数のノードから通信接続されるサーバとを含み、前記サーバは、前記複数のノードへグローバルモデルのデータを配布し、前記複数のノードは夫々、処理対象のローカルデータによって前記グローバルモデルからローカルモデルの学習を各々進め、前記サーバが備える処理部は、学習後の前記ローカルモデルのデータを前記複数のノードから取得し、前記複数のノード夫々から取得した学習後のローカルモデルのデータに基づいてグローバルモデルのデータを更新し、更新後のグローバルモデルのデータを更新回数に対応する更新情報と対応付けて記憶し、前記グローバルモデルの性能評価値を算出し、算出された性能評価値を、前記グローバルモデルの更新情報と対応付けて記憶し、前記グローバルモデルの更新情報の指定と共に前記グローバルモデルの参照リクエストを受け付け、指定された更新情報が対応付けられている前記グローバルモデルのデータ及び性能評価値を出力する。

【0009】

本開示の一実施形態のコンピュータプログラムは、複数のノードに通信接続が可能なコンピュータに、記憶するグローバルモデルのデータを前記複数のノードに対して配布し、前記複数のノード夫々で学習されたローカルモデルのデータを取得し、前記複数のノード夫々から取得した学習後のローカルモデルのデータに基づいてグローバルモデルのデータを更新し、更新後のグローバルモデルのデータを更新回数に対応する更新情報と対応付けて記憶し、前記グローバルモデルの性能評価値を算出し、算出された性能評価値を、前記グローバルモデルの更新情報と対応付けて記憶し、前記グローバルモデルの更新情報の指定と共に前記グローバルモデルの参照リクエストを受け付け、指定された更新情報が対応付けられている前記グローバルモデルのデータ及び性能評価値を出力する処理を実行させる。

【0010】

本開示の一実施形態のコンピュータプログラムは、サーバと通信接続されるコンピュータに、前記サーバから配布されるグローバルモデルを基にして処理対象のローカルデータを用いたローカルモデルを学習し、学習後のローカルモデルのデータを前記サーバへ送信し、異なる更新情報が対応付けられた更新後のグローバルモデルの一覧を含む画面データを前記サーバから受信し、受信した画面データに基づいて前記コンピュータに備えられる表示部に、前記一覧を表示し、前記一覧の内のいずれかの更新情報の指定を受け付け、指定された更新情報に対応するグローバルモデルの性能評価値を前記サーバから取得して表示する処理を実行させる。

【0011】

本開示のモデル学習方法、モデル学習システム、及びコンピュータプログラムでは、グローバルモデルが更新されると、更新回数に対応する更新情報と対応付けてモデルのデータと、各段階における性能評価値が履歴として記憶される。グローバルモデルのデータが性能評価値と共に、ノード又は他の情報処理装置から取得され、一覧の表示が可能となる。

【0012】

本開示の一実施形態のモデル学習方法は、前記サーバは、グローバルモデルのデータの配布、ローカルモデルのデータの取得、及びグローバルモデルのデータの更新を複数ラウンド繰り返し、前記グローバルモデルのデータの更新の都度、前記グローバルモデルのデータ及び性能評価値を更新情報と対応付けて記憶する。

【0013】

グローバルモデルのデータの配布、グローバルモデルのデータの配布、ローカルモデルのデータの取得、及びグローバルモデルのデータの更新を複数ラウンド繰り返す更新の途上で、異なる更新情報を対応付けてグローバルモデルのデータ及び性能評価値が記憶される。したがって、更新履歴における過去のモデルに遡り、過去のモデルとの性能の比較を視覚化することが可能になる。

【0014】

本開示の一実施形態のモデル学習方法は、前記サーバは、前記参照リクエストに対し、前記性能評価値に基づく前記グローバルモデルの性能を示す画面データを作成し、出力する。

【0015】

グローバルモデルの性能評価が画面データとして視覚化される。オペレータが、更新の過程を確認できるので、モデルの選択、更新方法の変更、更新停止等を決定することが可能である。

【0016】

本開示の一実施形態のモデル学習方法は、前記サーバは、前記グローバルモデルのデータの更新回数の指定、前記グローバルモデルのデータの更新停止の指示を受け付ける。

【0017】

更新中のモデルの性能評価値が出力可能であり、各段階のグローバルモデルのデータが記憶され、ノード又は他の情報処理装置から取得可能である。性能評価値を参照した上での更新回数の指定や、更新の停止の指示が受け付けられる。性能評価値の変化に応じて、適切に分散学習を進めることができる。

【0018】

本開示の一実施形態のモデル学習方法は、前記サーバは、前記複数のノード夫々に、ローカルデータに基づいて算出させた前記グローバルモデルの精度の評価値を取得し、前記評価値に基づいて前記グローバルモデルの性能評価値を算出する。

【0019】

性能評価値は、各ノードでのローカルデータを用いた精度に基づいて算出されてよい。グローバルモデルの性能評価値は、各ノードで算出され精度の平均でもよいし、ローカルデータのデータ量に基づく加重平均であってもよい。各ノードでの精度が実用に耐えうる程度となるまで、グローバルモデルのデータの配布、ローカルモデルの学習、学習されたローカルモデルに基づくグローバルモデルのデータの更新が繰り返されてもよい。

【0020】

本開示の一実施形態のモデル学習方法は、再分配するグローバルモデルの選択を受け付け、学習の進行に関わらず、選択されたグローバルモデルのデータを前記複数のノードへ再分配する。

【0021】

更新履歴のモデルの中から、いずれか選択が可能である。オペレータによって、性能評価値を比較した上で、再分配、即ち、学習を進めるモデルを選択することが可能になる。

【0022】

本開示の一実施形態のモデル学習方法は、前記複数のノードは、前記ローカルモデルのデータを更新情報と対応付けて記憶し、前記ローカルモデルの評価値を算出し、算出された評価値を、前記ローカルモデルの更新情報と対応付けて記憶する。

【0023】

各ノードで学習したローカルモデル自体の性能履歴についても、サーバで集約しておく。サーバにて各ノードから集約したローカルモデルの性能及びその履歴を閲覧可能とすることにより、オペレータにて、分散学習に参加させるノードの選択が可能になる。

【0024】

本開示の一実施形態のモデル学習方法は、前記複数のノードに、前記ローカルモデルの学習に用いたローカルデータのデータ量、又は前記ローカルデータの特性を、前記ローカルモデルの更新情報と対応付けて記憶させ、前記サーバは、前記複数のノードから、ローカルモデルのデータと対応付けてデータ量又はデータの特性を取得する。

【0025】

グローバルモデルの更新に利用されるローカルモデルのデータ量、学習量又は学習に用いられるデータの特性が、サーバに集約される。グローバルモデルのデータの更新に、いずれのローカルモデルを使用するかの選択が、ローカルモデルの特徴に応じて可能になる。

【発明の効果】

【0026】

本開示のモデル学習方法、モデル学習システム、及びコンピュータプログラムによれば、モデルの性能評価値が可視化され、オペレータによって確認可能になる。更新途上のモデルと性能を比較し、より性能が高まると推測できるモデルを選択して学習を進めることもできる。

【図面の簡単な説明】

【0027】

【図1】第１の実施形態のモデル学習システムの概要図である。

【図2】ノードの構成を示すブロック図である。

【図3】サーバの構成を示すブロック図である。

【図4】モニタの構成を示すブロック図である。

【図5】モデル学習システムにおける学習処理手順の一例を示すフローチャートである。

【図6】配布されたグローバルモデルに基づくローカルモデルの学習処理手順の一例を示すフローチャートである。

【図7】サーバにおけるグローバルモデルの更新処理の一例を示すフローチャートである。

【図8】学習過程の参照処理手順の一例を示すフローチャートである。

【図9】グローバルモデルの更新履歴画面の一例を示す。

【図10】グローバルモデルの個別性能を視覚化した個別性能画面の一例を示す。

【図11】第２の実施形態のモデル学習システムにおける学習処理手順の一例を示すフローチャートである。

【図12】第２の実施形態のモデル学習システムにおける学習処理手順の一例を示すフローチャートである。

【図13】グローバルモデルの個別性能を視覚化した個別性能画面の他の一例を示す。

【図14】評価値の詳細画面の一例を示す。

【図15】学習条件の編集画面の例を示す。

【図16】第２の実施形態のモデル学習の概要図である。

【図17】第３の実施形態におけるノードのローカルモデルの学習処理手順の一例を示すフローチャートである。

【図18】第３の実施形態におけるグローバルモデルの更新処理の一例を示すフローチャートである。

【図19】ローカルモデルの性能履歴画面を示す。

【図20】第４の実施形態のローカルモデルの学習処理手順の一例を示すフローチャートである。

【図21】第４の実施形態のグローバルモデルの更新処理の一例を示すフローチャートである。

【図22】各ノードの重みの編集画面を示す。

【図23】第４の実施形態におけるグローバルモデルの個別性能を視覚化した個別性能画面の一例を示す。

【図24】第５の実施形態のモデル学習システムの概要図である。

【図25】第５の実施形態のモデル学習システムにおける学習処理手順の一例を示すフローチャートである。

【図26】第５の実施形態におけるローカルモデルの学習処理手順の一例を示すフローチャートである。

【図27】第５の実施形態のグローバルモデルの更新処理の一例を示すフローチャートである。

【図28】第５の実施形態における重みの編集画面を示す。

【発明を実施するための形態】

【0028】

本開示をその実施の形態を示す図面を参照して具体的に説明する。

【0029】

（第１の実施形態）
図１は、第１の実施形態のモデル学習システム１００の概要図である。モデル学習システム１００は、データを記憶する記憶装置２に対して１又は複数設けられたノード１と、サーバ３と、ノード１及びサーバ３間を通信接続する通信網Ｎとを含む。

【0030】

記憶装置２は、物理量を測定するセンサ、画像を撮影するカメラ等、学習対象のデータを入出力する機器との間でデータの入出力が可能であり、それらのデータを蓄積する。記憶装置２は、操作によって入力されるデータに応じて出力する特定用途の計算機に接続されてもよい。記憶装置２は、ユーザが用いる情報端末の記憶装置であってもよい。記憶装置２は、クライアント装置からデータを収集するサーバ装置に使用される記憶装置であってもよい。

【0031】

ノード１は、記憶装置２が記憶しているデータと同種のデータが入力された場合に、データに基づいて認識結果、判定結果、又は新たなデータを出力するように、モデルの深層学習を実行する。サーバ３は、ノード１に対してモデルを提供するコンピュータであると共に、ノード１と協働してモデルを学習するモデル学習システム１００を実現する。記憶装置２が記憶しているデータ（以下、ローカルデータという）をトレーニングデータとしてモデルの学習を実行するには、これらにアクセスできる必要がある。本実施の形態のモデル学習システム１００は、サーバ３からのローカルデータへのアクセスを不可とした状態で、学習を進行させることができる。

【0032】

サーバ３は、初期的に、第０次グローバルモデル５１を得る。サーバ３は、第０次グローバルモデル５１を、通信網Ｎを介してノード１へ配布する。サーバ３からノード１へ配布されるグローバルモデルモデル５１の実体（データ）は、学習済みのパラメータのみ、又は、学習済みのパラメータとプログラムとの両方である。グローバルモデル５１は、モデルの構成を定義する定義データ（ネットワーク定義、損失や予め設定されるハイパーパラメータを含む）と、学習対象の重み係数等のパラメータとであってもよい。

【0033】

学習対象のモデルは、深層学習と呼ばれる学習の対象であればアーキテクチャは問わない。深層学習のモデルの種類は、入力データ及び出力データの内容に応じて適切に選択されるべきである。以下説明する学習対象のモデルは、畳み込み層を含むＣＮＮ（Convolutional Neural Network）を用いた分類系、検出系、又は生成系等のいずれでもよいし、時系列要素を加味して学習するＲＮＮ（Recurrent Neural Network）であってもよい。

【0034】

通信網Ｎは、所謂インターネットである公衆通信網、キャリアネットワークを含む。通信網Ｎは、モデル学習システム１００用の専用回線であってもよい。

【0035】

ノード１は、記憶装置２との間のローカルネットワークＬＮに基づいて、記憶装置２に蓄積されたローカルデータにアクセス可能である。ノード１は、アクセス可能なローカルデータを用いて深層学習を実行する。ローカルデータに対しては既に、ノード１が設置されている場所のオペレータによってアノテーションが実施済であるとよい。ノード１は、サーバ３から配布される第０次グローバルモデル５１を取得する。ノード１は、第０次グローバルモデル５１を基に、ローカルデータをトレーニングデータとして学習を進行し、第１次ローカルモデル５２を得る。

【0036】

ノード１は、第１次ローカルモデル５２を、サーバ３へ送信する。ローカルデータはサーバ３へ送信されないから、ローカルデータの抽象化、匿名化等の処理は不要である。

【0037】

サーバ３は、複数のノード１夫々から第１次ローカルモデル５２を複数受信し、受信した複数の第１次ローカルモデル５２に対して統計処理を実行して第１次グローバルモデル５１を作成する。サーバ３は、第１次グローバルモデル５１を、複数のノード１へ再配布する。再配布されるグローバルモデル５１は、重み係数のみであってもよい。再配布される重み係数は学習対象であってもよいし、全体であってもよい。再配布されるグローバルモデル５１は、前回の更新からの差分に対応するものであってもよい。

【0038】

モデル学習システム１００は、サーバ３からノード１への第ｎ次グローバルモデル５１の配布、第ｎ次グローバルモデル５１のノード１におけるローカルデータを用いた学習、学習によって得られる第（ｎ＋１）次ローカルモデル５２のサーバ３への送信、サーバ３での第（ｎ＋１）次ローカルモデル５２の収集及び第（ｎ＋１）次グローバルモデル５１の作成（更新）を繰り返す。

【0039】

これにより、サーバ３からローカルデータへのアクセスを許可することなく、分散学習が可能になる。モデル学習システム１００では、グローバルモデル５１の配布と、ローカルモデル５２の学習とを繰り返していく学習過程を、モニタ４から確認できるようにする。モニタ４のみならず、ノード１のオペレータからも確認できるとよい。モデル学習システム１００では、モニタ４から、学習の中断や、適切なグローバルモデル５１の選択をオペレータができるようにする。

【0040】

サーバ３は、モニタ４に対し、同一のローカルなネットワーク内からのみ通信接続を受け付けてもよいし（オンプレミス型）、図１で示したように、公衆通信網である通信網Ｎ経由でモニタ４からの通信接続を受け付けてもよい（クラウド型）。

【0041】

分散学習によってノード１以外の装置へも配布可能な精度までに学習されたグローバルモデル５１は、各ノード１に加え、ローカルモデル５２の作成に参加しないシステム外の情報処理装置６へも配布され、使用される。

【0042】

このような学習方法を実現するモデル学習システム１００の構成について詳細に説明する。

【0043】

図２は、ノード１の構成を示すブロック図である。ノード１は、パーソナルコンピュータ又はサーバコンピュータである。ノード１は、処理部１０、記憶部１１、通信部１２、表示部１３及び操作部１４を備える。

【0044】

処理部１０は、ＣＰＵ（Central Processing Unit ）及び／又はＧＰＵ（Graphics Processing Unit）を用いたプロセッサである。処理部１０は、記憶部１１に記憶されているノードプログラム１Ｐに基づき、記憶装置２からのデータの読み出し、サーバ３との間でのモデルの送受信、及びモデル学習を含む処理を実行する。

【0045】

記憶部１１は、例えばハードディスク、フラッシュメモリ、ＳＳＤ（Solid State Drive）等の不揮発性メモリを用いる。記憶部１１は、処理部１０が参照するデータを記憶する。記憶部１１は、ノードプログラム１Ｐを記憶する。記憶部１１は、深層学習用のライブラリ１Ｌを記憶する。ノードプログラム１Ｐ及び／又は深層学習用のライブラリ１Ｌは、記録媒体８に記憶してあるノードプログラム８Ｐ及び／又は深層学習用のライブラリ８Ｌを処理部１０が読み出して記憶部１１に複製したものであってもよい。記憶部１１は、サーバ３から取得するグローバルモデル５１、及び、ローカルデータによって学習されるローカルモデル５２夫々を記憶する。

【0046】

通信部１２は、通信網Ｎを介したデータ通信、及び、ローカルネットワークＬＮを介した記憶装置２との通信を各々実現する。通信部１２は具体的には、例えばネットワークカードである。処理部１０は、通信部１２によって記憶装置２からデータを読み出し、サーバ３との間でデータを送受信する。

【0047】

表示部１３は、液晶ディスプレイ、有機ＥＬ（Electro Luminescence）ディスプレイ等のディスプレイである。表示部１３は、記憶部１１に記憶されているデータに基づく情報、又はサーバ３から提供されるデータを含む画面を表示する。表示部１３は、タッチパネル内蔵型ディスプレイであってもよい。

【0048】

操作部１４は、処理部１０との間で入出力が可能なキーボード及びポインティングデバイス等のユーザインタフェースである。操作部１４は、音声入力部であってもよい。操作部１４は、表示部１３のタッチパネルであってもよい。操作部１４は、物理ボタンであってもよい。操作部１４は、ノード１のオペレータによる操作データを処理部１０へ通知する。

【0049】

図３は、サーバ３の構成を示すブロック図である。サーバ３は、サーバコンピュータである。サーバ３は、処理部３０、記憶部３１及び通信部３２を備える。サーバ３は、以下の説明においては１台のサーバコンピュータによって構成されるものとして説明するが、複数台のサーバコンピュータをネットワークで通信接続して分散処理させる態様であってもよい。サーバ３は、通信網Ｎを介して各ノード１から通信接続が可能なクラウド型であってもよいし、仮想的なプライベートネットワークを介して各ノード１と通信接続するオンプレミス型であってもよい。

【0050】

処理部３０は、ＣＰＵ及び／又はＧＰＵを用いたプロセッサである。処理部３０は、記憶部３１に記憶されているサーバプログラム３Ｐに基づき、グローバルモデル５１の学習処理を実行する。

【0051】

記憶部３１は、例えばハードディスク、ＳＳＤ等の不揮発性メモリを用いる。記憶部３１は、処理部３０が参照するデータを記憶する。記憶部３１は、サーバプログラム３Ｐを記憶する。サーバプログラム３Ｐは、Ｗｅｂサーバプログラムを含む。記憶部３１は、グローバルモデル５１、複数のノード１から送信されるローカルモデル５２を記憶する。サーバプログラム３Ｐは、記録媒体９に記憶してあるサーバプログラム９Ｐを処理部３０が読み出して記憶部３１に複製したものであってもよい。

【0052】

通信部３２は、通信網Ｎを介したデータ通信を実現する。通信部３２は具体的には、例えばネットワークカードである。処理部３０は、通信部３２によって複数のノード１との間でデータを送受信する。

【0053】

図４は、モニタ４の構成を示すブロック図である。モニタ４は、パーソナルコンピュータである。モニタ４は、タブレット端末又はスマートフォンであってもよい。モニタ４は、処理部４０、記憶部４１、通信部４２、表示部４３及び操作部４４を備える。

【0054】

処理部４０は、ＣＰＵ及び／又はＧＰＵを用いたプロセッサである。処理部４０は、記憶部４１に記憶されているＷｅｂブラウザプログラムに基づき、サーバ３から提供される情報を表示部４３で表示する処理を実行する。

【0055】

記憶部４１は、例えばハードディスク、フラッシュメモリ、ＳＳＤ（Solid State Drive）等の不揮発性メモリを用いる。記憶部４１は、処理部４０が参照するデータを記憶する。記憶部４１は、Ｗｅｂブラウザプログラムを含む各種プログラムを記憶する。

【0056】

通信部４２は、通信網Ｎを介した通信を実現する。通信部４２は具体的には、例えばネットワークカードである。処理部４０は、通信部４２によってし、サーバ３との間でデータを送受信する。

【0057】

表示部４３は、液晶ディスプレイ、有機ＥＬディスプレイ等のディスプレイである。表示部４３は、サーバ３から提供されるデータを含む画面を表示する。表示部４３は、タッチパネル内蔵型ディスプレイであってもよい。

【0058】

操作部４４は、処理部４０との間で入出力が可能なキーボード及びポインティングデバイス等のユーザインタフェースである。操作部４４は、音声入力部であってもよい。操作部４４は、表示部４３のタッチパネルであってもよい。操作部４４は、物理ボタンであってもよい。操作部４４は、ノード１のオペレータによる操作データを処理部４０へ通知する。

【0059】

このように構成されるモデル学習システム１００における学習処理手順について説明する。図５は、モデル学習システム１００における学習処理手順の一例を示すフローチャートである。

【0060】

サーバ３は、予め用意された初期的な（第０次）グローバルモデル５１を取得する（ステップＳ１）。初期的なグローバルモデル５１は、特定のノード１で第０次モデルとして作成されたモデルであってもよいし、ノード１ではなく特定の場所で学習されたモデルであってもよく、予め記憶部３１に記憶してあるとよい。ステップＳ１の取得は、予め記憶部３１に記憶されているグローバルモデル５１の読み出しを含む。

【0061】

サーバ３は、取得した第０次グローバルモデル５１をノード１へ配布する（ステップＳ２）。

【0062】

サーバ３は、ノード１へ配布したグローバルモデル５１を基に、ノード１で学習されるローカルモデル５２を取得する（ステップＳ３）。

【0063】

サーバ３は、取得したローカルモデル５２に対して統計処理を実行し、次世代のグローバルモデル５１に更新する（ステップＳ４）。ステップＳ４においてサーバ３は、更新（ラウンド）回数を、加算して記憶してもよい。

【0064】

サーバ３は、更新したグローバルモデル５１に対する性能評価値を算出する（ステップＳ５）。サーバ３はステップＳ５において、特定のノード１又は情報処理装置６に対し、入力データを更新後のグローバルモデル５１に入力した場合に、対応する出力データを出力する精度を評価値として算出してもよい。性能評価値は、後述するように各ノード１からの評価値を用いて算出してもよい。

【0065】

サーバ３は、算出した性能評価値を、更新（ラウンド）回数に対応するラウンド情報と対応付けて、記憶部３１に記憶する（ステップＳ６）。ラウンド情報は、更新回数のみならず、日時等であってもよい。サーバ３は、第０次から最初の数ラウンドにおいては、ステップＳ５，６の処理を省略してもよい。

【0066】

サーバ３は、更新したグローバルモデル５１が学習完了条件を満たすか否か判断する（ステップＳ７）。

【0067】

ステップＳ７についてサーバ３は例えば、更新回数が所定回数に到達したか否かで判断する。サーバ３は、ステップＳ５で算出した性能評価値が、予め記憶してある基準値を満たした場合に、学習完了条件を満たすと判断してもよい。サーバ３はステップＳ７において、更新前と比較して性能評価値が向上していないと判断される場合に学習完了条件を満たすと判断してもよい。

【0068】

学習完了条件を満たさないと判断された場合（Ｓ７：ＮＯ）、サーバ３は、更新後のグローバルモデル５１を複数のノード１へ再分配し（ステップＳ８）、処理をステップＳ３へ戻す。

【0069】

ステップＳ８においてサーバ３は、グローバルモデル５１をそのまま再配布するのではなく、重み係数等のパラメータのみを再配布してもよい。

【0070】

ステップＳ８においてサーバ３は、何回目の更新後のグローバルモデル５１であるのか、即ち第ｎ次グローバルモデル５１の「ｎ」を示すデータを共に送信するとよい。ステップＳ８においてサーバ３は、ステップＳ６で記憶したラウンド情報を、グローバルモデル５１に対応付けて送信するとよい。ラウンド情報は、上述したように、ステップＳ７で学習完了条件を満たすと判断されるまでに、ノード１への分配及び統計処理を実行した回数を示す情報である。サーバ３は、グローバルモデル５１の種類、例えばどのようなアーキテクチャの深層学習がされたのか、を示すデータを共に送信してもよい。

【0071】

学習完了条件を満たすと判断された場合（Ｓ７：ＹＥＳ）、サーバ３は、更新後のグローバルモデル５１を、ノード１以外の装置へも配布可能なグローバルモデル５１としてバージョン情報と対応付けて記憶する（ステップＳ９）。バージョン情報は、ステップＳ７にて学習完了条件を満たすと判断されるまでローカルモデル５２の学習及びグローバルモデル５１の更新を実行した回数に対応する。バージョン情報は、ラウンド情報をマイナーな情報として含んでもよい。

【0072】

サーバ３は、記憶したグローバルモデル５１を複数のノード１又は他の情報処理装置６へ送信し（ステップＳ１０）、処理を終了する。他の情報処理装置６とは、ノード１同様に、学習対象と同種のデータを用いるが、ローカルデータをトレーニング用に提供しない装置である（図１参照）。

【0073】

サーバ３は、図５のフローチャートに示した処理手順を、複数、例えば月に一度といった周期で実行する。その都度、グローバルモデルのバージョンが上昇し、より実用的なモデルとなる。

【0074】

図６は、配布されたグローバルモデル５１に基づくローカルモデル５２の学習処理手順の一例を示すフローチャートである。図６のフローチャートに示す処理は、サーバ３がステップＳ２又はステップＳ８でグローバルモデル５１を配布した場合に、複数のノード１夫々で実行する処理である。

【0075】

ノード１の処理部１０は、配布されたグローバルモデル５１を受信し、記憶部１１に記憶する（ステップＳ３０１）。

【0076】

ノード１の処理部１０は、記憶したグローバルモデル５１をインスタンスとしてロードする（ステップＳ３０２）。処理部１０は、記憶装置２に記憶してあるローカルデータをトレーニングデータとして取得し（ステップＳ３０３）、これをグローバルモデル５１に与えて学習を実行する（ステップＳ３０４）。

【0077】

ステップＳ３０４において処理部１０は、ロードしたグローバルモデル５１に対してローカルデータの入力データを入力する。処理部１０は、出力されたデータと、ローカルデータに含まれる前記入力データに対応する結果データとに対する損失を算出する。処理部１０は、算出した損失に基づいて配布されたグローバルモデル５１における重み係数を含むパラメータを学習する。

【0078】

ノード１の処理部１０は、学習完了条件を満たすか否かを判断する（ステップＳ３０５）。ステップＳ３０５において処理部１０は、学習（更新）回数が所定回数（１回以上）を満たすことを学習完了条件とする。処理部１０は、学習後のグローバルモデル５１の出力精度が記憶してある所定値以上である場合に、学習完了条件を満たすと判断してもよい。処理部１０は、出力精度の変化が所定範囲内に収まり、収束していると判断できる場合に学習完了条件を満たすと判断してもよい。

【0079】

学習完了条件を満たさないと判断された場合（Ｓ３０５：ＮＯ）、処理部１０は処理をステップＳ３０４へ戻す。これにより、学習が続行される。

【0080】

学習完了条件を満たすと判断された場合（Ｓ３０５：ＹＥＳ）、処理部１０は学習を終了し、パラメータが更新されたグローバルモデル５１を、ローカルモデル５２として記憶する（ステップＳ３０６）。

【0081】

ノード１の処理部１０は、記憶したローカルモデル５２を、サーバ３へ送信し（ステップＳ３０７）、処理を終了する。これにより、サーバ３は、複数のノード１夫々から、ローカルデータで学習されたローカルモデル５２を取得することができる。

【0082】

ステップＳ３０７において処理部１０は、第ｎ次のローカルモデル５２なのか、又は元となるグローバルモデル５１が第ｎ次なのかの「ｎ」を示すデータを共に送信するとよい。ステップＳ３０７においてノード１は、後述するように１回の学習完了までの更新回数に対応するラウンド情報を得られる場合にはそのラウンド情報を、ローカルモデル５２に対応付けて送信してもよい。

【0083】

図６のフローチャートに示した処理によってノード１からは、ローカルデータがサーバ３へ送信されることがない点が、着目されるべきである。ローカルデータの匿名化も実行されない。ノード１から送信されるデータは、モデルそのものである。ローカルデータの特性は反映されているが、データの送信はされない。

【0084】

図７は、サーバ３におけるグローバルモデル５１の更新処理の一例を示すフローチャートである。図７のフローチャートに示す処理手順は、図５のフローチャートに示す処理手順の内のステップＳ４の詳細に対応する。

【0085】

サーバ３の処理部３０は、ノード１から送信されるローカルモデル５２を取得し（ステップＳ４０１）、ノード１の識別データと対応付けてローカルモデル５２を記憶する（ステップＳ４０２）。ステップＳ４０１においてサーバ３の処理部３０は、非同期に各ノード１から送信されるローカルモデル５２を取得する。

【0086】

処理部３０は、取得したローカルモデル５２でグローバルモデル５１を更新すべきか否かを判断する（ステップＳ４０３）。ステップＳ４０３において処理部３０は、グローバルモデル５１を配布した配布先のノード１全てからローカルモデル５２を取得できた場合に更新すべきであると判断してもよい。ステップＳ４０３において処理部３０は、予め決定しておいた代表的の複数のノード１からローカルモデル５２を取得できた場合に更新すべきであると判断してもよい。

【0087】

更新すべきでないと判断された場合（Ｓ４０３：ＮＯ）、サーバ３の処理部３０は処理をステップＳ４０１へ戻す。更新すべきであると判断されるまで、各ノード１から送信されるローカルモデル５２を取得し、集約する。

【0088】

更新すべきであると判断された場合（Ｓ４０３：ＹＥＳ）、サーバ３の処理部３０は、複数のノード１からのローカルモデル５２の平均を求める（ステップＳ４０４）。処理部３０は、平均を新たなグローバルモデル５１として更新する（ステップＳ４０５）。

【0089】

処理部３０は、更新後のグローバルモデル５１を、ラウンド情報、例えば更新回数（第ｎ次）を示すデータ「ｎ」と対応付けて記憶し（ステップＳ４０６）、グローバルモデル５１の更新処理を終了する。これにより、第ｎ－１次グローバルモデル５１は、第ｎ次グローバルモデル５１に更新される。

【0090】

上述したように第１の実施形態のモデル学習システム１００では、ローカルデータはサーバ３へ送信されることなしに、各所に記憶されているローカルデータを用いた学習結果に基づいてグローバルモデル５１が実用化される。各所のローカルデータのみでは、データ量が不足するような場合であっても、１箇所に集約させた大量のデータによる学習よりも精度よく、且つ早期に実用可能なモデルを提供することが可能になる。

【0091】

第１の実施形態では、サーバ３がグローバルモデル５１の学習（更新）及び改訂（バージョンアップ）の過程でラウンド情報、及びバージョン情報と対応付けて、グローバルモデル５１を記憶している。したがって、サーバ３にて、更新の過程に関する情報を、バージョン別、ラウンド毎に、モニタ４又はノード１に向けて提供することが可能である。

【0092】

図８は、学習過程の参照処理手順の一例を示すフローチャートである。サーバ３は、サーバプログラム３Ｐに含まれるＷｅｂサーバプログラムに基づいて、以下に示す処理手順により、モニタ４又はノード１からの参照リクエストに応じて学習過程に関する情報を提供する。

【0093】

モニタ４又はノード１のオペレータは、記憶してあるＷｅｂブラウザプログラムに基づいて、サーバ３から提供されるＷｅｂページへのアクセスを試みる。

【0094】

サーバ３の処理部３０は、Ｗｅｂサーバとしての機能により、接続リクエストを受信し（ステップＳ６０１）、リクエストに含まれるアカウント情報に応じて、メイン（ポータル）となるＷｅｂページを記憶部３１から読み出してリクエスト元へ送信する（ステップＳ６０２）。

【0095】

モニタ４の管理者及びノード１の管理者毎に、サーバ３へのアクセス用のアカウントが発行されている。アカウントは、アカウントＩＤ、認証情報、権限のデータを含む。サーバ３は、記憶部３１にアカウントデータを記憶している。モニタ４の管理者向けのアカウントには、学習回数の指定、学習の中断などが可能な権限が対応付けられている。ノード１の管理者向けのアカウントには、学習過程での性能評価値の閲覧等、グローバルモデル５１の内容に影響しない程度の権限が対応付けられている。

【0096】

処理部３０は、モニタ４又はノード１から送信されるグローバルモデル５１の指定を受信し（ステップＳ６０３）、指定されたグローバルモデル５１の更新履歴の一覧を含むＷｅｂページを送信する（ステップＳ６０４）。図５のフローチャートに示したように、グローバルモデル５１が更新される都度に、グローバルモデル５１及び性能評価値が、ラウンド情報及びバージョン情報と対応付けて記憶されている。したがって、処理部３０は記憶されているデータに基づいて更新履歴の一覧を作成できる。

【0097】

処理部３０は、更新履歴の一覧に含まれるバージョン情報の指定を含む性能参照リクエストを受信すると（ステップＳ６０５）、指定されたバージョン情報に対応付けられて記憶してあった更新過程におけるグローバルモデル５１の性能を示すイメージを含むＷｅｂページを作成する（ステップＳ６０６）。性能を示すイメージは、例えば性能の推移を示すグラフ、学習に使用したデータ件数等が含まれてよい。

【0098】

処理部３０は、作成した画面データをリクエスト元のモニタ４又はノード１へ向けて出力し（ステップＳ６０７）、処理を終了する。

【0099】

図９及び図１０は、モニタ４又はノード１で表示される画面例を示す。図９は、グローバルモデル５１の更新履歴画面４３０の一例を示す。図９の更新履歴画面４３０は、モニタ４の表示部４３に表示される。更新履歴画面４３０は、グローバルモデル５１のバージョン情報に対応するバージョン名に対応付けて、性能評価値、更新日時を表形式で示す一覧４３２を含む。一覧４３２にてバージョン名を示すテキストは、個別ページへのリンクを含んで選択可能にしてある。バージョン名を示すテキストが選択されると、ノード１の処理部１０によって、バージョン情報の指定が受け付けられる。最新バージョンのグローバルモデル５１が更新（ラウンド）中である場合、その更新中であることを示すアイコンが、バージョン名の横に表示されている。

【0100】

図１０は、グローバルモデル５１の個別性能を視覚化した個別性能画面４３１の一例を示す。図１０の個別性能画面４３１は、グローバルモデル５１の更新履歴画面４３０の一覧４３２からいずれかのバージョン名のテキストが選択された場合に表示される。図１０は、図９で「ver4.0」のバージョンを選択した場合の個別性能画面４３１の例を示す。個別性能画面４３１は、指定されたバージョン情報のグローバルモデル５１の、更新ラウンド毎に算出された性能評価値の推移を示すグラフ４３４が含まれる。個別性能画面４３１は、選択されたバージョンのグローバルモデル５１の学習に使用されたローカルモデル５２、即ち学習に参加したノード１の数等の情報を示す詳細画面４３５を含む。モニタ４のオペレータは、詳細画面４３５の内容、性能の推移が視覚化されたイメージ４３４によってグローバルモデル５１の学習（更新）過程を確認することができる。

【0101】

モニタ４の管理者で、学習の中断、終了の権限が与えられたアカウントからの参照リクエストに対しては、図１０に示すように、個別性能画面４３１に、更新を中断することを指示するためのインタフェース４３３が表示される。インタフェース４３３が選択された場合、図５のフローチャートに示した処理手順のうち、学習完了条件を満たすまでのラウンドが中断される。更新中断のログが記録されるとよい。これにより、モニタ４の管理者は、各ラウンドの精度の状況を確認し、これ以上、更新を継続してもモデルの性能向上が見込めない場合に、学習を中断することができる。

【0102】

モニタ４の管理者で、グローバルモデルの選択の権限が与えられたアカウントからの参照リクエスト対しては、個別性能画面４３１に、再分配するグローバルモデルの選択を受け付けるインタフェースが表示されてもよい。このインタフェースが選択された場合、処理部３０は、図５のフローチャートに示した処理手順を中断し、選択されたグローバルモデル５１を、ステップＳ８で再分配し、処理をステップＳ２へ戻し、更新の処理を継続する。

【0103】

このように第１の実施形態では、ローカルデータに基づいてローカルモデル５２の学習をし、且つ、図９－図１０に示したように、オペレータがモニタ４又はノード１から、グローバルモデル５１の学習過程を視覚的に確認できる。図９及び図１０に示したように、モニタ４の管理者の権限を有している場合、学習、すなわちグローバルモデルの更新を、管理者によって停止させることも可能である。

【0104】

（第２の実施形態）
第２の実施形態におけるモデル学習システム１００は、学習完了条件を満たすための判断処理が、第１の実施形態と異なる。第２の実施形態におけるモデル学習システム１００の構成は、上述の判断処理の詳細を除いて第１の実施形態のモデル学習システム１００と同様の構成であるから、共通する構成については同一の符号を付して詳細な説明を省略する。

【0105】

図１１及び図１２は、第２の実施形態のモデル学習システム１００における学習処理手順の一例を示すフローチャートである。図１１及び図１２のフローチャートに示す処理手順の内、図５のフローチャートに示した処理手順と共通する手順については同一のステップ番号を付して詳細な説明を省略する。

【0106】

ステップＳ４でグローバルモデル５１を更新すると（Ｓ４）、サーバ３の処理部３０は、更新後のグローバルモデル５１を、複数のノード１へ送信する（ステップＳ５０１）。

【0107】

更新後のグローバルモデル５１を受信した複数のノード１は夫々、送信されたグローバルモデル５１を用いて、記憶装置２からローカルデータを読み出し、入力データに対する精度評価を実行する。ノード１の処理部１０は、ローカルデータの入力データを入力した場合の精度を算出し、サーバ３へ送信する。処理部１０は、精度として、ローカルデータにおける入力データに対応する出力データとの合致率を算出してもよいし、ノード１のオペレータから表示部１３及び操作部１４を介して精度評価を受け付けてもよい。

【0108】

サーバ３の処理部３０は、各ノード１から送信される評価値を取得し（ステップＳ５０２）、複数のノード１から取得した評価値から総評価値を算出する（ステップＳ５０３）。ステップＳ５０３において処理部３０は、精度の平均値を算出してもよいし、合致率の平均でもよいし、オペレータから受けた評価の平均を求めてもよい。

【0109】

処理部３０は、更新したグローバルモデル５１に対してステップＳ５０２で各ノードから得た評価値、及びステップＳ５０３で算出した総評価値を、グローバルモデル５１のラウンド情報と対応付けて記憶する（ステップＳ５０４）。

【0110】

処理部３０は、ラウンド情報毎に記憶されたこれまでのグローバルモデル５１に対する評価値、総評価値を含む更新履歴を含むＷｅｂページをモニタ４へ送信し、出力させる（ステップＳ５０５）。

【0111】

処理部３０は、更新履歴に基づいて再分配するグローバルモデル５１の選択を受け付け（ステップＳ５０６）、学習停止の選択を受け付けたか否かを判断する（ステップＳ５０７）。

【0112】

ステップＳ５０７において処理部３０は、ステップＳ５０５に送信したＷｅｂページに、学習を終了させるインタフェースを含ませておき、学習を終了させるインタフェースで終了が選択された場合に、学習停止の選択を受け付けたと判断する。処理部３０は、同Ｗｅｂページに、学習続行のインタフェースを含ませておき、学習続行が選択された場合に、学習続行を受け付けたと判断してもよい。

【0113】

ステップＳ５０７で学習停止の選択を受け付けないと判断された場合（Ｓ５０７：ＮＯ）、学習条件の変更があるか否かを判断する（ステップＳ５０８）。

【0114】

ステップＳ５０８において処理部３０は、ステップＳ５０５に送信したＷｅｂページに、学習条件の変更を受け付けるインタフェースを含ませておき、学習条件の変更のインタフェースが選択された場合、学習条件の変更があると判断する。

【0115】

学習条件の変更があると判断された場合（Ｓ５０８：ＹＥＳ）、処理部３０は、条件の変更を受け付ける（ステップＳ５０９）。ステップＳ５０９において処理部３０は、後述するＷｅｂページにて、ローカルモデル５２の学習に参加するノードの変更を受け付けてもよいし、ローカルモデル５２の更新回数の変更を受け付けてもよい。他の条件の変更を受け付けてもよい。ステップＳ５０９及びＳ５０８の処理手順の順序は前後してもよいし、処理部３０は、変更を受け付けた場合に学習条件の変更があると判断してもよい。

【0116】

処理部３０は、受け付けた変更後の学習条件に基づいて、複数のノード１へ、ステップＳ５０６で選択されたラウンド情報に対応するグローバルモデル５１を再分配し（ステップＳ５１０）、処理をステップＳ３へ戻す。

【0117】

ステップＳ５０８で学習条件の変更がないと判断された場合（Ｓ５０８：ＮＯ）、処理部３０は、ステップＳ５０６で選択されたラウンド情報に対応するグローバルモデル５１を、これまでに送信対象としてきたノード１へ再分配し（Ｓ５１０）、処理をステップＳ３へ戻す。

【0118】

ステップＳ５０７で学習停止の選択を受け付けたと判断された場合（Ｓ５０７：ＹＥＳ）、処理部３０は、ステップＳ５０６で選択されたグローバルモデル５１を、他の装置へも配布可能なグローバルモデル５１として、バージョン情報と対応付けて記憶する（ステップＳ５１１）。

【0119】

処理部３０は、記憶したグローバルモデル５１を複数のノード又は他の情報処理装置６へ送信し（Ｓ１０）、処理を終了する。

【0120】

図１３から図１５は、モニタ４の表示部４３に表示される画面例を示す図である。図１３は、グローバルモデル５１の個別性能を視覚化した個別性能画面４３１の他の一例を示す。図１３の個別性能画面４３１は、図９に示した更新履歴画面４３０から、更新中のグローバルモデル５１のバージョン情報のテキストが選択された場合に表示される。

【0121】

図１３に示すように、第２の実施形態における個別性能画面４３１は、性能評価値の推移を示すグラフ上に、第１の実施形態で示した図１０同様に、指定されたバージョン情報のグローバルモデル５１の、更新ラウンド毎に算出された総評価値の推移を示すグラフ４３４が含まれる。

【0122】

グラフ４３４は、ラウンド数を選択するためのマーク４３６を含む。個別性能画面４３１の詳細画面４３５は、マーク４３６が付されているラウンド数のグローバルモデル５１の評価等を示す。

【0123】

個別性能画面４３１は、以後に学習を続行するためのインタフェース４３７を含む。インタフェース４３７は、図１３に示すように例えばボタンのアイコンである。モニタ４のオペレータは、個別性能画面４３１に対し、マーク４３６で選択中のラウンドグローバルモデル５１に対し、学習続行のインタフェース４３７を選択する。サーバ３の処理部３０はこの操作を受けて、学習条件の変更がないとして（Ｓ５０８：ＮＯ）、選択されたグローバルモデル５１をノードへ配布し（Ｓ５１０）、処理を続行する。

【0124】

個別性能画面４３１は、マーク４３６ではなく、詳細画面４３５中でラウンド数を選択してもよい。

【0125】

個別性能画面４３１は、更新を停止し、学習を終了させるためのインタフェース４３８を含む。インタフェース４３８は、図１３に示すように、例えばボタンのアイコンである。インタフェース４３８は、リンクが張られたテキストであってもよい。モニタ４のオペレータは、個別性能画面４３１に対し、総評価値を基に、マーク４３６で選択中のグローバルモデル５１で、学習を終了させるインタフェース４３８を選択する。サーバ３の処理部３０はこの操作を受けて、選択されたグローバルモデル５１を配布可能なグローバルモデル５１として記憶する（Ｓ５１１）。

【0126】

個別性能画面４３１は、選択中のバージョン情報の各ラウンドの評価値の詳細を表示するためのインタフェース４３９を含む。モニタ４のオペレータがインタフェース４３９を選択すると、総評価値及び各ノード１からの評価値の具体的数値が出力される。図１４は、評価値の詳細画面４４０の一例を示す。図１４の詳細画面４４０には、更新（ラウンド）の都度に算出される総評価値及び各ノードからの評価値（Ｓ５０４）を、各ラウンドのラウンド情報と対応付けて表す一覧４４１を含む。一覧４４１には、更新日時が対応付けられていてもよい。

【0127】

図１３の個別性能画面４３１に戻って説明を続ける。個別性能画面４３１は、学習を中断するためのインタフェース４４２を含む。インタフェース４４２は、図１３に示すように、ボタンのアイコンである。モニタ４のオペレータは、個別性能画面４３１に対し、これ以上学習を進めても、精度に対応する総評価値が配布可能な条件を満たさない様子であることを確認すると、学習を中断するためのインタフェース４４２を選択する。サーバ３の処理部３０はこの操作を受けて、図１１及び図１２のフローチャートに示した処理手順を中断する。

【0128】

第２の実施形態の個別性能画面４３１は、そのバージョンのグローバルモデル５１に対する各ノードにおける評価値を、視覚化したノード画面４４３を含む。ノード画面４４３には、グローバルモデル５１に対応し、マーク４３６で選択されているラウンド情報を示すテキストを含んだ角丸矩形のグラフィックが含まれている。グローバルモデル５１に対応するグラフィックには、そのラウンド数における総評価値を示すテキストが添えられるようにして表示されている。ノード画面４４３は、グローバルモデル５１に対応するグラフィックにエッジを介して接続するように、各ノード１を識別するテキスト（Ａ，Ｂ，Ｃ，…）を含む角丸矩形のグラフィックを含む。各ノード１に対応するグラフィックには、各ノード１におけるそのラウンド数のグローバルモデル５１に対する評価値を示すテキストが添えられるようにして表示されている。各ノード１に対応するグラフィックには、各ノード１におけるローカルモデル５２の性能履歴に対するリンクが対応付けられている。

【0129】

このように、各ノード１の評価値が視覚化され、オペレータはモデル学習システム１００における全体の学習状況を把握することができる。

【0130】

図１５は、学習条件の編集画面の例を示す。図１５は、図１４の個別性能画面４３１のノード画面４４３上でいずれかのノード１が選択された場合に表示される編集画面４４４の例を示す。編集画面４４４は、学習条件の変更を受け付けるインタフェースに対応する。図１５において編集画面４４４は、ノード１を選択した場合に、メニュー画面のように表示され、選択中のノード１を、グローバルモデル５１の更新のために使用するローカルモデル５２を学習するノード１から除外するか否かが選択できる。編集画面４４４は、図１５の例ではメニュー画面の態様で表示されているが、これに限られない。

【0131】

モニタ４のオペレータは、ノード画面４４３に対する操作で表示される編集画面４４４で、学習条件を変更し、変更後の学習条件、例えば「ノードＤ」のノード１によるローカルモデル５２を、除外するという条件で、個別性能画面４３１のインタフェース４３７にて学習を続行することができる。

【0132】

学習条件の編集画面４４４は、図１５に示すように、ローカルモデル５２を学習していく上での学習回数等の学習を終了する条件の設定を受け付けるメニューを含んでもよい。

【0133】

図１６は、第２の実施形態のモデル学習の概要図である。図１６の概要図では、更新後の第ｎ＋１次グローバルモデル５１の更新時に、各回の更新（ラウンド）後の第ｎ次グローバルモデル５１が、モニタ４を介してオペレータによって選択された場合の更新の履歴を示している。図１のモデル学習システムの概要図と比較して、グローバルモデル５１は常に、更新されるものが連綿と採用されるのではないことが示されている。これにより、精度が良くなるように分散学習を進めることが可能になる。

【0134】

（第３の実施形態）
第３の実施形態では、ノード１においてローカルモデル５２の学習中に性能評価を算出してサーバ３へ送信し、サーバ３を介してモニタ４から各ノード１におけるローカルモデル５２の精度を閲覧できるようにする。

【0135】

第３の実施形態におけるモデル学習システム１００の構成は、第１及び第２の実施形態における構成と同様であるから、第１及び第２の実施形態におけるモデル学習システム１００と共通する構成については同一の符号を付して詳細な説明を省略する。

【0136】

第３の実施形態では、ノード１はそれぞれ、学習過程及びローカルモデル５２の履歴を記憶する。図１７は、第３の実施形態におけるノードのローカルモデル５２の学習処理手順の一例を示すフローチャートである。図１７のフローチャートに示す処理手順の内、第１の実施形態の図６のフローチャートに示した処理手順と共通する手順については、同一のステップ番号を付して詳細な説明を省略する。

【0137】

ノード１の処理部１０は、配布されたグローバルモデル５１に基づく学習を実行し（Ｓ３０１－Ｓ３０４）、Ｓ３０５でＹＥＳと判断されるまで、あるいはステップＳ３０１－Ｓ３０４の繰り返し回数が所定回数となる都度に、学習の結果得られる性能評価を、ローカルモデル５２の学習の進行具合を示すデータと対応付けて記憶する（ステップＳ３１１）。ステップＳ３１１で処理部１０は、ローカルデータを入力した場合の出力データがトレーニングデータと合致する精度を、性能評価として算出してよい。ステップＳ３１１において処理部１０は、配布されたグローバルモデル５１のラウンド情報に対するステップＳ３０１－Ｓ３０４の繰り返し回数、又は精度を学習の進行具合を示すデータ（マイナーアップデート）として記憶してもよい。

【0138】

処理部１０は、ステップＳ３０５で学習完了条件を満たすと判断された場合（Ｓ３０５：ＹＥＳ）、学習後のローカルモデル５２を、配布されたグローバルモデル５１のラウンド情報と対応付けて記憶する（ステップＳ３１２）。

【0139】

処理部１０は、記憶したローカルモデル５２及びステップＳ３１１で記憶した性能評価を、ラウンド情報と対応付けてサーバ３へ送信し（ステップＳ３１３）、処理を終了する。これにより、サーバ３は、複数のノード１夫々から、ローカルデータで学習された各ラウンドにおけるローカルモデル５２、及びその個々の性能評価を取得することができる。

【0140】

ステップＳ３１１の性能評価の算出及び記憶は、ステップＳ３０４の学習の都度ではなく、学習が学習完了条件を満たすと判断されて終了した後に（Ｓ３０５：ＹＥＳ）、実行されてもよい。

【0141】

サーバ３では、ノード１からローカルモデル５２と共に送信されるラウンド情報及び性能評価等の情報を記憶する。図１８は、第３の実施形態におけるグローバルモデル５１の更新処理の一例を示すフローチャートである。第３の実施形態のサーバ３は、第２の実施形態同様に、図１１及び図１２のフローチャートに示した処理手順を実行する。この中で、第３の実施形態におけるサーバは、ステップＳ４で以下に示す処理手順を実行する。図１８のフローチャートに示す処理手順のうち、第１の実施形態の図７のフローチャートに示した処理手順と共通する手順については同一のステップ番号を付して詳細な説明を省略する。

【0142】

サーバ３の処理部３０は、ノード１から送信されるローカルモデル５２、及び性能評価をラウンド情報と対応付けて取得する（ステップＳ４１１）。処理部３０は、取得したローカルモデル５２及び性能評価を、ラウンド情報と対応付けて記憶する（ステップＳ４１２）。処理部３０は、ローカルモデル５２及びノード１の識別データと共に対応付けて記憶してもよい。処理部３０は、ステップＳ４０３の処理を実行する。

【0143】

このようにサーバ３の処理部３０は、ローカルモデル５２をノード１から取得する際に、性能評価を取得し、バージョン別、ラウンド毎に記憶することができる。

【0144】

これらのノード１から集約したローカルモデル５２における学習の精度の推移を含むデータは、サーバ３は、図１１及び図１２のフローチャートにおけるステップ５０５の処理にてモニタ４へ出力する、更新したグローバルモデル５１の更新履歴の中で出力される。

【0145】

図１９は、ローカルモデル５２の性能履歴画面４４５を示す。図１９は、図１３に示したグローバルモデル５１の個別性能画面４３１において、ノード画面４４３に含まれる複数のノード１のグラフィックのいずれかが選択された場合に表示される。図１９は、「ノードＡ」のノード１に対応するグラフィックが選択された場合に表示される例を示す。

【0146】

ローカルモデル５２の性能履歴画面４４５は、異なるバージョンのグローバルモデル５１に対して算出された性能評価の値の一覧を含む。性能履歴画面４４５は、選択されたノード１における各バージョンのローカルモデル５２に対する精度（性能）の推移を示すグラフを出力する。性能履歴画面４４５は、更新中のグローバルモデル５１に対応するローカルモデル５２については、最新のラウンドに対する評価値が出力されている。図１９の例では、「ノードＡ」のノード１では、ローカルモデル５２の評価値が、バージョン１．０からバージョン４．０へ進むにつれ、「０．２９」から順次「０．８０」へ順調に増加していることが示されている。性能履歴画面４４５は、図１４に示したような表形式で、バージョン別に、各ノード１におけるローカルモデル５２に対するラウンド毎の性能評価値を出力するようにしてもよい。

【0147】

これにより、オペレータが、各ノード１における評価値を参照し、より精度が良くなるように分散学習を進めることが可能になる。

【0148】

（第４の実施形態）
第４の実施形態では、各ノード１で学習されたローカルモデル５２に基づくグローバルモデル５１の更新方法が第１～第３の実施形態で説明した方法と異なる。第４の実施形態におけるモデル学習システム１００の構成は、グローバルモデル５１の更新処理の詳細を除いて第１の実施形態のモデル学習システム１００と同様の構成であるから、共通する構成については同一の符号を付して詳細な説明を省略する。

【0149】

第４の実施形態のモデル学習システム１００では、サーバ３は第１の実施形態の図５のフローチャートに示した処理手順、第２の実施形態の図１１及び図１２のフローチャートに示した処理手順、の内のいずれかの学習処理手順を実行する。第４の実施形態では、それらの処理手順の内、ステップＳ４の更新処理が異なる。また、更新処理が異なることに対応して、ノード１から送信されるデータ内容も第１の実施形態での説明と異なる。

【0150】

図２０は、第４の実施形態のローカルモデル５２の学習処理手順の一例を示すフローチャートである。図２０のフローチャートに示す処理手順の内、第１の実施形態における図６のフローチャートに示した処理手順と共通する手順については同一のステップ番号を付して詳細な説明を省略する。

【0151】

ノード１の処理部１０は、記憶装置２からその時点で記憶されているローカルデータを取得し（Ｓ３０３）、ローカルデータのデータ量（データ件数）を算出し（ステップＳ３２３）、処理をステップＳ３０４へ進める。

【0152】

ノード１の処理部１０は、学習を実行する都度（Ｓ３０４）、学習量を算出し（ステップＳ３２４）、学習完了条件を満たすか否かを判断する（ステップＳ３０５）。ステップＳ３２４において処理部１０は、学習の繰り返し回数を学習量として算出してもよいし、前回のバージョンにおけるローカルモデル５２からの精度の向上度合いを学習量として算出してもよいし、ローカルモデル５２の変化量を学習量として算出してもよい。

【0153】

ステップＳ３０５において処理部１０は、学習の結果、ローカルデータに対するニューラルネットワークからの出力データの精度が所定の条件を満たす、例えば精度が所定値以上である場合に、学習完了条件を満たすと判断してもよい。処理部１０は、学習量（学習回数）が所定量（所定回数）以上である場合に学習完了条件を満たすと判断してもよい。

【0154】

ノード１の処理部１０は、学習後のローカルモデル５２と共に、ステップＳ３２３で算出したデータ量、又は、カウントされている学習量をサーバ３へ送信し（ステップＳ３２７）、処理を終了する。これにより、サーバ３は、複数のノード１夫々から、ローカルデータで学習されたローカルモデル５２と共に、元となるローカルデータのデータ量、又は、学習量を取得することができる。

【0155】

第４の実施形態においても、ノード１からは、ローカルデータのデータ量は送信されても、データ自体がサーバ３へ送信されることがない。

【0156】

第４の実施形態では、各ノード１におけるローカルモデル５２の学習量、学習のために使用されたデータのデータ量等を加味した重み付けが、オペレータから可能である。図２１は、第４の実施形態のグローバルモデル５１の更新処理の一例を示すフローチャートである。図２１のフローチャートに示す処理手順の内、第１の実施形態の図７のフローチャートに示した処理手順と共通する手順については同一のステップ番号を付して詳細な説明を省略する。

【0157】

サーバ３の処理部３０は、各ノード１から送信されるローカルモデル５２、及び、データ量又は学習量を取得し（ステップＳ４２１）、ノード１の識別データと対応付けてローカルモデル５２、及び、データ量又は学習量を記憶する（ステップＳ４２２）。ステップＳ４１１においてサーバ３の処理部３０は、非同期に、各ノード１から送信されるローカルモデル５２を取得する。

【0158】

処理部３０は、更新タイミングであると判断された場合（Ｓ４０３：ＹＥＳ）、サーバ３の処理部３０は、複数のノード１からのローカルモデル５２に対する、データ量又は学習量に基づく重みを初期的に算出する（ステップＳ４２３）。

【0159】

サーバ３の処理部３０は、各ノード１におけるデータ量及び／又は学習量、並びに初期的に算出した重みを出力し（ステップＳ４２４）、重みの設定（編集）を受け付ける（ステップＳ４２５）。

【0160】

処理部３０は、初期的に算出した重み、又はステップＳ４２５で受け付けた重みを用い、各ノード１で学習されたローカルモデル５２の加重平均を求める（ステップＳ４２６）。処理部３０は、ローカルモデル５２の加重平均を、新たなグローバルモデル５１として更新する（ステップＳ４２７）。

【0161】

処理部３０は、更新後のグローバルモデル５１を、バージョン情報を示すデータと対応付けて記憶し（Ｓ４０６）、グローバルモデル５１の更新処理を終了する。

【0162】

サーバ３は、更新が所定回数に到達するまで、又は、更新後のグローバルモデル５１の精度が所定の基準を満たすまで、図２１のフローチャートに示した更新処理を継続する。繰り返し更新処理を実行するに際し、ステップＳ４２５の受付処理は、１度実行された後はスキップされてもよい。

【0163】

図２２は、各ノードの重みの編集画面４４６を示す。編集画面４４６は、図２１のフローチャートに示したグローバルモデル５１の更新中に、サーバ３のステップＳ４２４の処理によってモニタ４の表示部４３に表示される。重みの編集画面４４６は、各ノード１におけるローカルデータのデータ量（データ件数）を含む。重みの編集画面４４６は、ノード１毎に初期的に、データ量を基に算出された重みを、編集可能に含んでいる。図２２の例では、モニタ４を操作するオペレータは、各ノード１におけるローカルデータを参照しながら、加重平均を算出するための重みの調整が可能である。このとき、重みを０（ゼロ）に設定することで特定のノード１を除外して、サーバ３に加重平均を算出させることも可能である。

【0164】

第４の実施形態では、グローバルモデル５１の更新（ラウンド）の都度、重み係数を出力し、変更を受け付け可能としたが、１つのバージョン中は１回だけ、編集画面４４６を表示させるようにしてもよい。同一のバージョンの中で、重み係数を変更しなくてもよい。

【0165】

第４の実施形態における更新方法によって、データ量が異なるローカルデータによって学習されたモデルを、データ量に応じて扱い、適切に評価することが可能になる。実施の形態４の更新方法は、第２又は第３の実施形態にも適用できる。

【0166】

第４の実施形態では、各ノード１からローカルモデル５２の学習の都度に、サーバ３が、その時点でのローカルデータのデータ量、又は、学習量を取得することができるから、グローバルモデル５１の性能を出力する際に、それらのデータを出力することが可能である。図２３は、第４の実施形態におけるグローバルモデル５１の個別性能を視覚化した個別性能画面４３１の一例を示す。図２３に示す個別性能画面４３１では、図１３に示した画面と異なり、選択されたバージョンのグローバルモデル５１の性能を示す詳細画面４３５に、学習に使用されたデータ件数の情報が含まれる。

【0167】

このように、サーバ３が各ノード１からデータ量等の情報をも取得することにより、データ量が少ない環境においても、オペレータの知見に基づき、ローカルモデル５２の学習情報を用いてグローバルモデル５１を最適化することが期待できる。

【0168】

（第５の実施形態）
モデル学習システム１００は、ニューラルネットワークを始めとする深層学習のモデルに適用できる。例えば、入力データは画像データであり、出力データは画像データの画像に写っている被写体の検出結果、又は被写体に対する判定結果である。他の例では、入力データは、入出金データであり、出力データは評価等の判定結果、あるいは企業業況変化（成長または劣化）に関する予測値や経済予測に関する予測値である。他の例では、入力データは、工場、生産設備に設けられた各種センサからの測定データであり、出力データは異常／正常を含む生産管理に関するデータである。他の例では、入力データはテキストデータであり、出力データは判定結果、または予測データである。

【0169】

第５の実施形態では、モデル学習システム１００を、医療施設にて患者に関して得られる医療データから、患者に特定の病気の症状が発生しているか否かの診断を支援するデータを出力するモデルの学習に適用させた例を挙げて説明する。以下の説明では、医療データは、例えば検査で撮影された眼底写真の画像データである。

【0170】

図２４は、第５の実施形態のモデル学習システム１００の概要図である。第５の実施形態におけるモデル学習システム１００の構成は基本的に、第１の実施形態のモデル学習システム１００と同様である。第５の実施形態のモデル学習システム１００の内、第１の実施形態のモデル学習システム１００と共通する構成については同一の符号を付して詳細な説明を省略する。

【0171】

第５の実施形態においてノード１及び情報処理装置は、医療施設に設けられている。ノード１及び情報処理装置は、患者の眼底写真を撮影する撮影装置７から得られる画像データを取得できる。ノード１が設けられている医療施設では、撮影装置７は記憶装置２に対して画像データを出力する。撮影装置は、異なる種類の装置を含む。

【0172】

第５の実施形態においてグローバルモデル５１、ローカルモデル５２及び配布可能として記憶されたモデルは、画像データが入力された場合に、緑内障の診断を支援するデータ及び精度を出力するように学習されるモデルである。トレーニングデータとして用いられるローカルデータは、入力データとして画像データと、出力データとして眼底写真におけるDisc部分とCup部分とをセグメンテーションした結果の画像データである。出力データはその他、症状がみられるか否かを医師又は技師が判定した判定結果を含むデータセットであってもよい。ローカルデータの入力データである画像データは、撮影装置の種類を示す装置データと対応付けられている。装置データは型番でもよいし、装置メーカを識別するデータであってもよい。

【0173】

第５の実施形態においてモデル学習システム１００では、サーバ３が予め特定の医療施設で複数の異なるアーキテクチャで作成された初期的なグローバルモデル（第０次グローバルモデル）５１を取得する。サーバ３は、異なるアーキテクチャの第０次グローバルモデル５１を、トレーニングに協力する医療施設のノード１へ各配布する。

【0174】

各ノード１は、配布された複数の第０次グローバルモデル５１を受信し、異なる第０次グローバルモデル５１に基づいてそれぞれ、ローカルデータをトレーニングデータとして学習を進行し、複数の第１次ローカルモデル５２を得る。ノード１は、異なるアーキテクチャで学習された第１次ローカルモデル５２をサーバ３へ送信する。

【0175】

サーバ３は、各ノード１から取得したローカルモデル５２を、異なるアーキテクチャ毎に、加重平均して第１次グローバルモデル５１を作成する。作成された第１次グローバルモデル５１を、サーバ３は、複数のノード１へ再配布する。

【0176】

サーバ３は、配布した第ｎ次グローバルモデル５１から作成される第（ｎ＋１）次ローカルモデル５２の取得、第（ｎ＋１）次ローカルモデル５２からの第（ｎ＋１）次グローバルモデル５１の更新を、異なるアーキテクチャ毎に繰り返す。

【0177】

サーバ３は、異なるアーキテクチャ毎に繰り返して得られたグローバルモデル５１を、相互に比較し、精度がより高いアーキテクチャのグローバルモデル５１を選択し、配布可能なモデルとしてノード１及び情報処理装置へ提供する。

【0178】

これにより、個人情報そのものである検査結果の画像データが、サーバ３へ集約されることなく、且つ、異なる医療施設に亘って多くのデータを用いて学習することが可能になる。

【0179】

図２５は、第５の実施形態のモデル学習システム１００における学習処理手順の一例を示すフローチャートである。

【0180】

サーバ３は、特定の医療施設にて、異なるアーキテクチャで作成された初期的な（第０次）グローバルモデル５１を取得する（ステップＳ２０１）。ステップＳ２０１の取得は、予め記憶部３１に記憶されているグローバルモデル５１の読み出しを含む。

【0181】

サーバ３は、取得した複数の第０次グローバルモデル５１を各ノード１へ配布する（ステップＳ２０２）。

【0182】

サーバ３は、ノード１へ配布したグローバルモデル５１を基に、異なるアーキテクチャ毎に、ノード１で学習されるローカルモデル５２を取得する（ステップＳ２０３）。

【0183】

サーバ３は、取得したローカルモデル５２に対し、異なるアーキテクチャ毎に、統計処理を実行し、次世代のグローバルモデル５１に更新する（ステップＳ２０４）。ステップＳ２０４においてサーバ３は、更新の回数を加算するとよい。

【0184】

サーバ３は、更新したグローバルモデル５１に対する性能評価値を、異なるアーキテクチャ毎に、算出する（ステップＳ２０５）。サーバ３は、ステップＳ２０５において、特定のノード１におけるローカルデータの入力データを異なるアーキテクチャのグローバルモデル５１に入力した場合に、対応する出力データに対する精度を評価値として算出してもよい。ステップＳ２０５においてサーバ３は、第２の実施形態に示したように、各ノード１に更新後のグローバルモデル５１を送信し、各ノード１から評価値を取得し、総評価値を算出してもよい。

【0185】

サーバ３は、算出した性能評価値を、更新回数に対応するラウンド情報、及びアーキテクチャを識別するデータと対応付けて記憶部３１に記憶する（ステップＳ２０６）。バージョン情報は、更新回数のみならず、日時等であってもよい。サーバ３は、第０次から最初の数ラウンドにおいては、ステップＳ２０５、Ｓ２０６の処理を省略してもよい。

【0186】

サーバ３は、学習完了条件を満たすか否かを判断する（ステップＳ２０７）。

【0187】

ステップＳ２０７についてサーバ３は例えば、更新回数（ラウンド数）が所定回数に到達したか否かで判断する。サーバ３は、特定のノード１におけるローカルデータの入力データを異なるアーキテクチャのグローバルモデル５１に入力した場合に、いずれか複数のグローバルモデル５１において、対応する出力データを出力する精度が所定の条件を満たすか否かで判断してもよい。学習の終了条件は、第２の実施形態で示したように、各ノード１へ送信したグローバルモデル５１に対する評価値から総評価値を算出し、総評価値が所定の基準を満たすことであってもよい。

【0188】

学習完了条件を満たさないと判断された場合（Ｓ２０７：ＮＯ）、サーバ３は、更新後の各アーキテクチャのグローバルモデル５１を複数のノード１へ再分配し（ステップＳ２０８）、処理をステップＳ２０３へ戻す。

【0189】

学習完了条件を満たすと判断された場合（Ｓ２０７：ＹＥＳ）、サーバ３は、更新後の各アーキテクチャのグローバルモデル５１から、１又は複数、配布可能なグローバルモデル５１として選択する（ステップＳ２０９）。ステップＳ２０９においてサーバ３は、精度が比較的高い１又は複数のグローバルモデル５１を選択する。

【0190】

サーバ３は、選択したグローバルモデル５１を複数のノード１又は他の情報処理装置へ送信し（ステップＳ２１０）、処理を終了する。

【0191】

これにより、各医療施設の画像データに対しての精度が高く、実用性が高いアーキテクチャのモデルを、各医療施設で使用することができる。

【0192】

図２６は、第５の実施形態におけるローカルモデル５２の学習処理手順の一例を示すフローチャートである。図２６のフローチャートに示す処理は、サーバ３がステップＳ２０２又はステップＳ２０６でグローバルモデル５１を配布した場合に、複数のノード１夫々で実行する処理である。図２６のフローチャートに示す処理手順の内、第１の実施形態の図６のフローチャートに示した処理手順と共通する手順については同一の符号を付して詳細な説明を省略する。

【0193】

ノード１の処理部１０は、配布されたグローバルモデル５１を受信及び記憶すると（Ｓ３０１）、アーキテクチャ毎に、Ｓ３０２からＳ３０５の処理を実行する。処理部１０は、学習後のグローバルモデル５１を、ローカルモデル５２として、アーキテクチャを識別するデータと対応付けて記憶する（ステップＳ３３６）。

【0194】

処理部１０は、全てのアーキテクチャについて学習を完了したか否か判断する（ステップＳ３３７）。

【0195】

学習が完了していないと判断された場合（Ｓ３３７：ＮＯ）、処理部１０は処理をステップＳ３０２へ戻し、次のアーキテクチャについてステップＳ３０２からＳ３３６の処理を実行する。

【0196】

全てのアーキテクチャについて学習が完了したと判断された場合（Ｓ３３７：ＹＥＳ）、ノード１の処理部１０は、記憶したローカルモデル５２を、ローカルデータの特性である装置データと対応付けてサーバ３へ送信する（ステップＳ３３８）。そして処理部１０はノード１における第ｎ次の学習処理を終了する。

【0197】

これにより、サーバ３は、複数のノード１夫々から、ローカルデータで学習されたローカルモデル５２を取得することができる。ローカルデータそのものはサーバ３へ送信されないが、ローカルデータの品質が、サーバ３で区別できるようになる。

【0198】

図２７は、第５の実施形態のグローバルモデル５１の更新処理の一例を示すフローチャートである。図２７のフローチャートに示す処理手順は、図２５のフローチャートに示した処理手順の内のステップＳ２０４の詳細に対応する。

【0199】

サーバ３の処理部３０は、ノード１から送信されるアーキテクチャ毎のローカルモデル５２、及び装置データを取得する（ステップＳ４３１）。処理部３０は、取得したアーキテクチャ毎のローカルモデル５２及び装置データを対応付けて記憶する（ステップＳ４３２）。ステップＳ４３２において処理部３０は、ノード１の識別コード別にローカルモデル５２を記憶してもよい。

【0200】

処理部３０は、更新すべきであるか否かを判断する（ステップＳ４３３）。ステップＳ４３３において処理部３０は、グローバルモデル５１を配布した配布先のノード１全てからローカルモデル５２を取得できた場合に更新すべきであると判断してもよい。ステップＳ４３３において処理部３０は、予め決定しておいた代表的の複数のノード１からローカルモデル５２を取得できた場合に更新すべきであると判断してもよい。

【0201】

更新すべきであると判断された場合（Ｓ４３３：ＹＥＳ）、サーバ３の処理部３０は、複数のノード１におけるデータの特性として、データ量及び装置データを出力し（ステップＳ４３４）、重みの設定（編集）を受け付ける（ステップＳ４３５）。

【0202】

処理部３０は、ステップＳ４２５で受け付けた重みを用い、各ノード１で学習されたローカルモデル５２の加重平均を、アーキテクチャ毎に求める（ステップＳ４３６）。処理部３０は、ローカルモデル５２の加重平均を、アーキテクチャ毎に、新たなグローバルモデル５１として更新する（ステップＳ４３７）。

【0203】

処理部３０は、更新後のグローバルモデル５１を、アーキテクチャ毎に、ラウンド情報を示すデータと対応付けて記憶し（ステップＳ４３８）、グローバルモデル５１の更新処理を終了する。

【0204】

図２８は、第５の実施形態における重みの編集画面４４６を示す。編集画面４４６は、図２７のフローチャートで示したグローバルモデル５１の更新中に、サーバ３のステップＳ４３４の処理によってモニタ４の表示部４３に表示される。重みの編集画面４４６は、各ノード１におけるローカルデータのデータ量（データ件数）、及びローカルデータを出力する装置の型番の名前を含む。図２８の例では、モニタ４を操作するオペレータは、各ノード１におけるローカルデータのデータ量、学習に用いられたローカルデータを出力する撮影装置７の型番を参照しながら、加重平均を算出するための重みの調整が可能である。このとき、重みを０（ゼロ）に設定することで特定のノード１を除外して、サーバ３に加重平均を算出させることも可能である。

【0205】

第５の実施形態では、グローバルモデル５１の更新（ラウンド）の都度、重み係数を出力し、変更を受け付け可能としたが、１つのバージョン中は１回だけ、編集画面４４６を表示させるようにしてもよい。同一のバージョンの中で、重み係数を変更しなくてもよい。

【0206】

第５の実施形態における更新方法によって、データの特性が異なるローカルデータによって学習されたモデルを、データの特性に応じて適切に評価することが可能になる。また、異なるデータ特性のローカルモデル５２を単純平均するよりも、グローバルモデル５１の性能の向上が期待できる。実施の形態５の更新方法は、第２～第４の実施形態と組み合わせることも可能である。

【0207】

データの特性はその他、ローカルデータに対するアノテーションの正確性についての評価を、各ノード１で記憶しておき、サーバ３は、その評価の高低に応じた重みによって加重平均を算出してもよい。アノテーションの正確性についての評価は、モニタ４の管理者によって実行されてもよい。

【0208】

第５の実施形態では、ローカルデータは医療データであるから、ステップＳ４２４の加重平均で用いられる重みは、医療データの属性に応じて付与されてもよい。例えば、患者の男女比、年齢分布、又は地域性等に応じた重みが付与されてもよい。これらの抽象化されたデータについてはローカルモデル５２に反映されてもよい。

【0209】

また、第５の実施形態における更新方法によって、異なるアーキテクチャのＣＮＮのいずれを用いたグローバルモデル５１が最も適切であるかが評価されて実用可能となる。

【0210】

上述のように開示された実施の形態は全ての点で例示であって、制限的なものではない。本発明の範囲は、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内での全ての変更が含まれる。

【符号の説明】

【0211】

１ノード
１０処理部
１３表示部
１４操作部
２記憶装置
３サーバ
３０処理部
３１記憶部
３Ｐサーバプログラム
４モニタ
４０処理部
４３表示部
４４操作部
５１グローバルモデル
５２ローカルモデル

【図1】