IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人 東京大学の特許一覧 ▶ トヨタ自動車株式会社の特許一覧

<>
  • 特開-学習システム 図1
  • 特開-学習システム 図2
  • 特開-学習システム 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024076190
(43)【公開日】2024-06-05
(54)【発明の名称】学習システム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240529BHJP
   G06F 18/213 20230101ALI20240529BHJP
【FI】
G06N20/00
G06F18/213
【審査請求】未請求
【請求項の数】1
【出願形態】OL
(21)【出願番号】P 2022187629
(22)【出願日】2022-11-24
(71)【出願人】
【識別番号】504137912
【氏名又は名称】国立大学法人 東京大学
(71)【出願人】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】中山 英樹
(72)【発明者】
【氏名】岸田 一輝
(72)【発明者】
【氏名】安間 絢子
(57)【要約】
【課題】画像送信によるコストの増大や、画像の流出リスクを低減できる学習システムを実現する。
【解決手段】本開示の一形態に係る学習システム1は、複数のクライアント端末11とサーバ12を備える。各クライアント端末11は、特徴量抽出器によってクライアント画像から抽出される第1の特徴量の分布と、クライアント画像に所定の処理を行った第1のプロキシ画像から抽出される第2の特徴量の分布とを識別する第1の識別器を学習してサーバ12に送信する。サーバ12は、サーバ画像から特徴量抽出器によって抽出される第3の特徴量の分布が第1の特徴量の分布に近づくように、第1の識別器に基づいて特徴量抽出器を学習し、かつ、第3の特徴量を用いた機械学習により第1の分類器を学習する。
【選択図】図2
【特許請求の範囲】
【請求項1】
複数のクライアント端末とサーバを備えた学習システムであって、
各クライアント端末は、特徴量抽出器によってクライアント画像から抽出される第1の特徴量の分布と、前記クライアント画像に所定の処理を行った第1のプロキシ画像から抽出される第2の特徴量の分布とを識別する第1の識別器を学習し、前記第1の識別器をサーバに送信し、
前記サーバは、サーバ画像から前記特徴量抽出器によって抽出される第3の特徴量の分布が前記第1の特徴量の分布に近づくように、前記第1の識別器に基づいて前記特徴量抽出器を学習し、かつ、前記第3の特徴量を用いた機械学習により第1の分類器を学習する
学習システム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習システムに関する。
【背景技術】
【0002】
特許文献1は、複数のクライアント端末のそれぞれが学習を開始する前に、各クライアント端末側の学習モデルと統合サーバのマスターモデルとを同期させる技術を開示している。各クライアント端末は医療機関に保存されているデータを用いて学習モデルの機械学習を実行し、学習結果を統合サーバに送信する。統合サーバは複数のクライアント端末を複数のクライアントクラスタに分けてクライアントクラスタごとに学習結果を統合してマスターモデル候補を作成する。統合サーバは各マスターモデル候補の推論精度を評価し、精度悪化要因となっているクライアント端末を抽出する。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】国際公開第2021/059607号
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1では、医療機関に保存されているデータをクライアント端末に送信したり、保存したりするコストを要する。また、画像流出のおそれがあるという問題がある。
【0005】
本開示は、このような問題点に鑑みてなされたものであり、画像送信によるコストの増大や、画像の流出リスクを低減できる学習システムを実現する。
【課題を解決するための手段】
【0006】
本開示の一態様の学習システムは、複数のクライアント端末とサーバを備えた学習システムであって、各クライアント端末は、特徴量抽出器によってクライアント画像から抽出される第1の特徴量の分布と、前記クライアント画像に所定の処理を行った第1のプロキシ画像から抽出される第2の特徴量の分布とを識別する第1の識別器を学習し、前記第1の識別器をサーバに送信し、前記サーバは、サーバ画像から前記特徴量抽出器によって抽出される第3の特徴量の分布が前記第1の特徴量の分布に近づくように、前記第1の識別器に基づいて前記特徴量抽出器を学習し、かつ、前記第3の特徴量を用いた機械学習により第1の分類器を学習する。
【発明の効果】
【0007】
本開示によれば、画像送信によるコストの増大や、画像の流出リスクを低減できる学習システムを実現できる。
【図面の簡単な説明】
【0008】
図1】ドメイン適応を行う学習システムを説明する図である。
図2】実施形態1にかかる学習システムの構成を説明する図である。
図3】実施形態1にかかる特徴量抽出器の学習方法を説明する図である。
【発明を実施するための形態】
【0009】
以下、本開示を適用した具体的な実施の形態について、図面を参照しながら詳細に説明する。但し、本開示が以下の実施の形態に限定される訳ではない。また、説明を明確にするため、以下の記載及び図面は、適宜、簡略化されている。
【0010】
本開示に至る経緯
まず、一般的な連合学習方法について説明する。連合学習では、サーバが、Webから収集した画像や3次元モデル(シミュレータとも言う)から生成した画像を用いて機械学習モデル(例えば、物体認識用のモデル)を学習し、機械学習モデルの重み係数の初期値を複数のクライアント端末に配布する。学習用画像(サーバ画像と言う)は、ソース画像とも言う。
【0011】
各クライアント端末は家屋内等でクライアント画像(ターゲット画像とも言う)を収集し、クライアント画像で機械学習モデルの重み係数を更新し、機械学習モデルの重み係数をサーバに送信する。次に、サーバは、複数のクライアント端末から受け取った重み係数を統合(更新)し、更新した機械学習モデルの重み係数を複数のクライアント端末に配布する。
【0012】
一般的な連合学習では、サーバ画像のドメインとクライアント画像のドメインが異なっており、機械学習モデルの精度が低下するという問題があった。従ってドメイン適応を行う必要があるが、クライアント画像をサーバに送信することはプライバシーの観点から問題があるので、サーバ画像をクライアント端末に送信する必要がある。
【0013】
図1は、ドメイン適応を行う学習システム2を説明する図である。クライアント端末11は、クライアント画像x とサーバ画像xから特徴量抽出器Fで特徴量を抽出し、クライアント画像x を識別する識別器Dを学習し、識別器Dをサーバ12に送信する。nは1~Nまでの整数のいずれかであり、Nはクライアント端末11の数を表す。サーバ12は、サーバ画像xの特徴量の分布がクライアント画像x(n=1~N)の特徴量の分布に近づくように特徴量抽出器Fを学習するとともに分類器C(クラス分類器とも言われ、上記機械学習モデルに対応する)を学習し、特徴量抽出器Fおよび分類器Cをクライアント端末11に送信する。
【0014】
学習システム2では、サーバ画像xの特徴量の分布がクライアント画像x の特徴量の分布に近づくように特徴量抽出器Fを学習することでドメイン適応を行っている。このため、サーバ画像xをクライアント端末11に送信し、識別器Dを学習する必要がある。この場合、サーバ画像xを全てのクライアント端末11に送信する必要があるが、ライセンスやデータ管理の観点で問題があった。本願の発明者は、以上の経緯から実施形態1にかかる学習システムに想到した。
【0015】
実施形態1
以下、図面を参照して実施形態1にかかる学習システムについて説明する。図2は、実施形態1にかかる学習システム1の構成を説明する図である。学習システム1は、サーバ画像xの代わりとなるプロキシ画像を用いてドメイン適応を行う。
【0016】
クライアント端末11は、クライアント画像x に所定の処理を行ったプロキシ画像Tps(x )(第1のプロキシ画像とも言う)を生成する。Tpsは所定の処理を表している。所定の処理の内容は任意であり、例えば、ランダムなノイズ画像を生成する処理、アドバーサリアルノイズを付加する処理、RGB画像をBGR画像に変換する処理、ドロップアウトと言われる処理、フラクタル化する処理、グレー画像に変換する処理、回転処理、ガウスノイズを付加する処理、パッチに分割して入れ替える処理、他の画像と重ね合わせる処理(ミックスアップと言う)とすることができる。
【0017】
クライアント端末11は、特徴量抽出器Fによってクライアント画像x から特徴量(第1の特徴量と言う)を抽出し、プロキシ画像Tps(x )から特徴量(第2の特徴量と言う)を抽出する。nは1からNまでのいずれかの整数であり、Nはクライアント端末11の数を表す。クライアント画像x に関する処理を実線で表し、プロキシ画像Tps(x )に関する処理を点線で表している。クライアント端末11は、式(1)に従って第1の特徴量の分布と第2の特徴量の分布を識別する識別器D (第1の識別器とも言う)を学習し、識別器D をサーバ12に送信する。識別器D の数は複数であってよい。また、以下で説明する知識の蒸留に用いるため、識別器D を他のクライアント端末11に送信してもよい。
【数1】
【0018】
また、クライアント端末11は、後述する分類器C(第1の分類器とも言う)を用いた知識の蒸留により、教師なし学習で分類器C(第2の分類器とも言う)を学習する。クライアント端末11は、具体的には式(2)に従って分類器Cを学習する。Dは後述する識別器D(第2の識別器とも言う)を表す。pはハイパーパラメータである。KLはカルバックライブラー情報量を表す。Vは特徴量抽出器Fで抽出した特徴量を表す。mは1~Nのうちn以外の整数を表す。Kは識別器D の数を表している。上述の通り、識別器D の数は複数であってよい。
【数2】
【0019】
分類器Cは、識別器Dおよび識別器D により特徴量分布の近さを考慮しつつ、他の分類器CおよびCと分類結果が近くなるように学習される。分類器Cはクライアント端末11毎に最適化した分類器であるが、分類器Cを学習せず、図1に示した関連技術のように分類器Cを用いてもよい。分類器Cは、他のクライアント端末11に送信される。
【0020】
サーバ12は、サーバ画像xから特徴量抽出器Fによって特徴量(第3の特徴量と言う)を抽出する。サーバ12は、第3の特徴量の分布が第1の特徴量の分布に近づくように、識別器D に基づいて特徴量抽出器Fを学習し、かつ、第3の特徴量を用いた機械学習により分類器Cを学習する。サーバ12は、特徴量抽出器Fおよび分類器Cをクライアント端末11に送信する。
【0021】
サーバ12は、具体的には式(3)に従って特徴量抽出器Fおよび分類器Cを学習する。Lceはクロスエントロピーを用いた損失関数を表しており、yはサーバ画像xに付与されるラベルを表している。λはハイパーパラメータである。式(3)の第1項は通常の教師あり学習を表しており、第2項は特徴量分布(空間)のアライメントを表している。
【数3】
【0022】
図3は、サーバ12が特徴量抽出器Fを学習する方法を説明する図である。実線で囲まれた分布C1は、クライアント画像x から抽出される特徴量(第1の特徴量)の分布を表す。点線で囲まれた分布C2は、プロキシ画像Tps(x )から抽出される特徴量(第2の特徴量)の分布を表す。符号Lは分布C1と分布C2を分類する分類線を表し、識別器D に対応している。一点鎖線で囲まれた分布Sは、サーバ画像xから抽出される特徴量(第3の特徴量)の分布を表す。特徴量抽出器Fは、分布Sが分布C1に近づくように学習を行う。関連技術を示す図1では分布C1と分布Sを分類する分類線(識別器)を学習し、分布Sを分布C1に近づけるように特徴量抽出器Fを学習したが、実施形態1では分布C1と分布C2を分類する分類線を学習し、分布Sを分布C1に近づけるように特徴量抽出器Fを学習する。したがって、実施形態1では、クライアント端末11にサーバ画像xを送信する必要がない。
【0023】
図2に戻り、サーバ12は、また、サーバ画像xに上記所定の処理を行ったプロキシ画像Tps(x)(第2のプロキシ画像と言う)を生成する。サーバ画像xに関する処理は実線で表され、プロキシ画像Tps(x)に関する処理は点線で表されている。サーバ12は、プロキシ画像Tps(x)から特徴量(第4の特徴量と言う)を抽出する。サーバ12は、式(4)に従って第3の特徴量の分布と第4の特徴量の分布とを識別する識別器Dを学習し、クライアント端末11に送信する。識別器Dは、上述した知識の蒸留で用いられる。
【数4】
【0024】
式(1)で表される処理、式(2)で表される処理、式(3)で表される処理、および式(4)を繰り返すことで、分類器Cや分類器Cの性能を向上できる。
【0025】
従来技術では、クライアント端末11がサーバ画像xを受信してドメイン適応を行う必要があった。一方、実施形態1では、サーバ画像xの代わりにプロキシ画像Tps(x )を用いるため、サーバ画像xをクライアント端末11に送信する必要がない。したがって、サーバ画像xの流出を防ぎつつ、ドメインの違いによる分類器Cの性能の劣化を低減できる。また、サーバ画像xを送信および保存するコストを削減し、サーバ画像xをユーザが流出させるリスクを低減できる。
【0026】
上述したプログラムは、コンピュータに読み込まれた場合に、1又はそれ以上の機能をコンピュータに行わせるための命令群(又はソフトウェアコード)を含む。プログラムは、非一時的なコンピュータ可読媒体又は実体のある記憶媒体に格納されてもよい。限定ではなく例として、コンピュータ可読媒体又は実体のある記憶媒体は、random-access memory(RAM)、read-only memory(ROM)、フラッシュメモリ、solid-state drive(SSD)又はその他のメモリ技術、CD-ROM、digital versatile disc(DVD)、Blu-ray(登録商標)ディスク又はその他の光ディスクストレージ、磁気カセット、磁気テープ、磁気ディスクストレージ又はその他の磁気ストレージデバイスを含む。プログラムは、一時的なコンピュータ可読媒体又は通信媒体上で送信されてもよい。限定ではなく例として、一時的なコンピュータ可読媒体又は通信媒体は、電気的、光学的、音響的、またはその他の形式の伝搬信号を含む。
【0027】
なお、本開示は上記実施の形態に限られたものではなく、趣旨を逸脱しない範囲で適宜変更することが可能である。
【符号の説明】
【0028】
1、2 学習システム、11 クライアント端末、12 サーバ、x クライアント画像、x サーバ画像、Tps(x )、Tps(x) プロキシ画像、F 特徴量抽出器、D 、D 識別器、C、C 分類器
図1
図2
図3