特許7630407 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＫＤＤＩ株式会社の特許一覧

特許7630407学習装置、データ生成装置、学習方法及び学習プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-02-06

(45)【発行日】2025-02-17

(54)【発明の名称】学習装置、データ生成装置、学習方法及び学習プログラム

(51)【国際特許分類】

G06N 3/08 20230101AFI20250207BHJP

G06N 3/045 20230101ALI20250207BHJP

【ＦＩ】

G06N3/08

G06N3/045

【請求項の数】 6

(21)【出願番号】P 2021172325

(22)【出願日】2021-10-21

(65)【公開番号】P2023062385

(43)【公開日】2023-05-08

【審査請求日】2024-02-09

(73)【特許権者】

【識別番号】000208891

【氏名又は名称】ＫＤＤＩ株式会社

(74)【代理人】

【識別番号】100106002

【弁理士】

【氏名又は名称】正林真之

(74)【代理人】

【識別番号】100120891

【弁理士】

【氏名又は名称】林一好

(72)【発明者】

【氏名】披田野清良

(72)【発明者】

【氏名】清本晋作

(72)【発明者】

【氏名】福島和英

【審査官】佐藤直樹

(56)【参考文献】

【文献】国際公開第２０２１／０１４５５１（ＷＯ，Ａ１）

【文献】特開２０２１－１４４７０３（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／０８

Ｇ０６Ｎ３／０４５

(57)【特許請求の範囲】

【請求項1】

ノイズに基づいて真のデータと類似した加工データを生成する生成器と、
前記加工データの信頼性に関する複数の要件のそれぞれを満たすため、前記生成器と競い合わせる複数の識別器と、を含む敵対的生成ネットワークが構成され、
訓練データ及び前記加工データを用いて、前記識別器の識別精度に基づく損失関数を最大化するように各識別器を学習し、かつ、当該損失関数を最小化するように前記生成器を学習する学習部を備え、
前記損失関数は、前記複数の要件それぞれの重要度を示す重み係数を含み、
前記生成器は、前記ノイズ及び前記重み係数を入力とし、
前記学習部は、所定の分布に従って前記重み係数を選択しつつ、前記識別器及び前記生成器の学習を繰り返す学習装置。

【請求項2】

前記複数の識別器のうちの一つは、前記加工データの精度に関する要件を満たすためのものである請求項１に記載の学習装置。

【請求項3】

前記所定の分布は、予め定義された前記重み係数それぞれの分析範囲にピークを有する請求項１又は請求項２に記載の学習装置。

【請求項4】

請求項１から請求項３のいずれかに記載の学習装置により学習された前記生成器に対して、ノイズ、及び指定された重み係数を入力し、前記加工データを出力するデータ生成装置。

【請求項5】

ノイズに基づいて真のデータと類似した加工データを生成する生成器と、
前記加工データの信頼性に関する複数の要件のそれぞれを満たすため、前記生成器と競い合わせる複数の識別器と、を含む敵対的生成ネットワークを構成したコンピュータが、
訓練データ及び前記加工データを用いて、前記識別器の識別精度に基づく損失関数を最大化するように各識別器を学習し、かつ、当該損失関数を最小化するように前記生成器を学習する学習ステップを実行し、
前記損失関数は、前記複数の要件それぞれの重要度を示す重み係数を含み、
前記生成器は、前記ノイズ及び前記重み係数を入力とし、
前記学習ステップにおいて、所定の分布に従って前記重み係数を選択しつつ、前記識別器及び前記生成器の学習を繰り返す学習方法。

【請求項6】

請求項１から請求項４のいずれかに記載の学習装置としてコンピュータを機能させるための学習プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、敵対的生成ネットワークを利用した加工データの生成手法に関する。

【背景技術】

【0002】

従来、敵対的生成ネットワークを利用して訓練デ―タの分布を学習することで、真のデータと類似した加工データを生成するための生成器を構築できることが知られている（例えば、非特許文献１参照）。敵対的生成ネットワークは、ノイズから加工データを生成する生成器、及び真のデータと加工データとを識別するための識別器を含んで構成される。生成器及び識別器は、それぞれニューラルネットワークで構成され、真のデータを用いて生成器と識別器とを競い合わせながら訓練することで、生成器が真のデータと類似した加工データを生成できるようになる。

【0003】

また、近年、機械学習の信頼性についての関心が高まっている。このため、敵対的生成ネットワークもまた、公平性やプライバシ等の信頼性に関する要件に配慮して構築することが必要である。
公平性に配慮した敵対的生成ネットワークとしては、ＦａｉｒＧＡＮと呼ばれる手法がある（例えば、非特許文献２参照）。ＦａｉｒＧＡＮでは、センシティブな属性と非センシティブな属性とで加工データの分布が類似するように生成器が訓練される。

【0004】

プライバシに配慮した敵対的生成ネットワークとしては、ｐｒｉｖＧＡＮがある（例えば、非特許文献３参照）。敵対的生成ネットワークを用いた場合、訓練した生成器が生成する加工データは、テストデータよりも訓練データと類似する可能性が高いため、その性質を利用することで訓練データを推測するメンバシップ推測攻撃が可能である。ｐｒｉｖＧＡＮでは、加工データが一つの訓練データ集合だけでなく、複数の訓練データ集合に対して汎化するように生成器を訓練することで、メンバシップ推測攻撃が抑制される。

【0005】

ＦａｉｒＧＡＮ及びｐｒｉｖＧＡＮのいずれの手法においても、生成器と前述の識別器（識別器Ａ）以外に、信頼性に関する各要件に配慮するための二つ目の識別器（識別器Ｂ）を利用し、通常の敵対的生成ネットワークと同様に、生成器と識別器Ａ及び識別器Ｂとを競い合わせながら、生成器、識別器Ａ及び識別器Ｂが訓練される。ただし、識別器Ａと識別器Ｂの優先度を決めるためのパラメータが識別器Ｂの重み係数として付与される。

【先行技術文献】

【非特許文献】

【0006】

【文献】I. J. Goodfellow et al., "Generative Adversarial Networks," NIPS 2014.

【文献】X. Depeng et al., "FairGAN: Fairness-aware Generative Adversarial Networks," IEEE BigData 2018.

【文献】S. Mukherjee et al., "privGAN: Protecting GANs from membership inference attacks at low cost to utility," PETS 2021.

【文献】H. Chang and R. Shokri, "On the Privacy Risks of Algorithmic Fairness," CoRR abs/2011.03731, 2020.

【発明の概要】

【発明が解決しようとする課題】

【0007】

しかしながら、これまで、機械学習の信頼性に関する複数の要件を同時に配慮可能な敵対的生成ネットワークに関する議論はされてこなかった。また、これらの要件間にはトレードオフとなる項目があることも知られている。
例えば、公平性に配慮して構築されたモデルは、メンバシップ推測攻撃に対して脆弱となることが知られている（例えば、非特許文献４参照）。このため、複数の要件を同時に配慮する際は、それぞれの要件に配慮した方式を単純に組み合わせるだけでなく、要件間のトレードオフにも配慮しなければならない。

【0008】

この問題を解決する方法としては、各要件の重要度を設定するためのパラメータを導入した上で各手法を組み合わせることが考えられる。しかしながら、単純にパラメータを重み係数として与えるだけでは、このパラメータの値を変更する度に生成器を訓練し直す必要がある。この場合、敵対的生成ネットワークの訓練は計算コストが高いため、トレードオフ分析を容易に行うことができない。

【0009】

本発明は、敵対的生成ネットワークを用いて学習された生成器の信頼性に関する要件間のトレードオフ分析を効率的に行うことができる学習装置、データ生成装置、学習方法及び学習プログラムを提供することを目的とする。

【課題を解決するための手段】

【0010】

本発明に係る学習装置は、ノイズに基づいて真のデータと類似した加工データを生成する生成器と、前記加工データの信頼性に関する複数の要件のそれぞれを満たすため、前記生成器と競い合わせる複数の識別器と、を含む敵対的生成ネットワークが構成され、訓練データ及び前記加工データを用いて、前記識別器の識別精度に基づく損失関数を最大化するように各識別器を学習し、かつ、当該損失関数を最小化するように前記生成器を学習する学習部を備え、前記損失関数は、前記複数の要件それぞれの重要度を示す重み係数を含み、前記生成器は、前記ノイズ及び前記重み係数を入力とし、前記学習部は、所定の分布に従って前記重み係数を選択しつつ、前記識別器及び前記生成器の学習を繰り返す。

【0011】

前記複数の識別器のうちの一つは、前記加工データの精度に関する要件を満たすためのものであってもよい。

【0012】

前記所定の分布は、予め定義された前記重み係数それぞれの分析範囲にピークを有するものであってもよい。

【0013】

本発明に係るデータ生成装置は、前記学習装置により学習された前記生成器に対して、ノイズ、及び指定された重み係数を入力し、前記加工データを出力する。

【0014】

本発明に係る学習方法は、ノイズに基づいて真のデータと類似した加工データを生成する生成器と、前記加工データの信頼性に関する複数の要件のそれぞれを満たすため、前記生成器と競い合わせる複数の識別器と、を含む敵対的生成ネットワークを構成したコンピュータが、訓練データ及び前記加工データを用いて、前記識別器の識別精度に基づく損失関数を最大化するように各識別器を学習し、かつ、当該損失関数を最小化するように前記生成器を学習する学習ステップを実行し、前記損失関数は、前記複数の要件それぞれの重要度を示す重み係数を含み、前記生成器は、前記ノイズ及び前記重み係数を入力とし、前記学習ステップにおいて、所定の分布に従って前記重み係数を選択しつつ、前記識別器及び前記生成器の学習を繰り返す。

【0015】

本発明に係る学習プログラムは、前記学習装置としてコンピュータを機能させるためのものである。

【発明の効果】

【0016】

本発明によれば、敵対的生成ネットワークを用いて学習された生成器の信頼性に関する要件間のトレードオフ分析を効率的に行うことができる。

【図面の簡単な説明】

【0017】

【図1】実施形態におけるデータ生成装置の機能構成を示す図である。

【図2】実施形態におけるデータ生成装置の学習フェーズにおける処理アルゴリズムを示すフローチャートである。

【発明を実施するための形態】

【0018】

以下、本発明の実施形態の一例について説明する。
本実施形態のデータ生成装置は、敵対的生成ネットワークにより訓練した生成器の信頼性に関する複数要件を、各要件の重要度を表す重み係数を用いた損失関数により制御する。そして、この重み係数が生成器の入力となるように敵対的生成ネットワークを構成することにより、訓練後の生成器を用いて、重み係数を指定した加工データを生成することができる。

【0019】

図１は、本実施形態におけるデータ生成装置１（学習装置）の機能構成を示す図である。
データ生成装置１は、制御部１０及び記憶部２０の他、各種の入出力インタフェース等を備えた情報処理装置（コンピュータ）である。

【0020】

制御部１０は、データ生成装置１の全体を制御する部分であり、記憶部２０に記憶された各種プログラムを適宜読み出して実行することにより、本実施形態における各機能を実現する。制御部１０は、ＣＰＵであってよい。

【0021】

記憶部２０は、ハードウェア群をデータ生成装置１として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ＲＯＭ、ＲＡＭ、フラッシュメモリ又はハードディスクドライブ（ＨＤＤ）等であってよい。
具体的には、記憶部２０は、本実施形態の各機能を制御部１０に実行させるためのプログラム（データ生成プログラム）の他、敵対的生成ネットワークを構成する学習モデルのパラメータ、学習データ等を記憶する。

【0022】

制御部１０は、記憶部２０に記憶された各種パラメータに基づく学習モデルとして、生成器Ｇと、識別器Ｄ_ｉ（１≦ｉ≦ｎ）と、これらの学習モデルを学習するための学習部１１と、ノイズに基づく加工データを出力する出力部１２とを備える。データ生成装置１は、これらの機能部を動作させることにより、真のデータに類似し、かつ、複数の信頼性の要件を満たした加工データを出力する。

【0023】

学習部１１は、訓練データ及び加工データを用いて、識別器Ｄ_ｉの識別精度に基づく損失関数を最大化するように各識別器Ｄ_ｉを学習し、かつ、この損失関数を最小化するように生成器Ｇを学習する。
すなわち、データ生成装置１は、ノイズに基づいて真のデータと類似した加工データを生成する生成器Ｇと、加工データの信頼性に関する複数の要件のそれぞれを満たすため、生成器Ｇと競い合わせる複数の識別器Ｄ_ｉと、を含む敵対的生成ネットワークを構成し、学習部１１を用いた学習フェーズにおいて、生成器Ｇを学習する。

【0024】

機械学習における損失関数を構成する複数の要件それぞれの重要度を示す重み係数は、ノイズと共に生成器Ｇの入力とし、学習部１１は、所定の分布に従って重み係数を選択しつつ、識別器Ｄ_ｉ及び生成器Ｇの学習を繰り返す。

【0025】

出力部１２は、学習部１１により学習された生成器Ｇに対して、ノイズ、及びユーザから指定された重み係数を入力し、加工データを出力する。
すなわち、データ生成装置１は、出力部１２を用いた生成フェーズにおいて、ユーザから指定された重み係数に応じた加工データを、訓練済みの生成器Ｇにより生成して出力する。

【0026】

ここで、データ生成装置１により構成される敵対的生成ネットワークの詳細を、従来と比較して説明する。
まず、従来の敵対的生成ネットワークは、次のように構成される。

【0027】

ｘを分布Ｐ_ｄａｔａに従う真のデータとし、ｚを分布Ｐ_ｚに従うノイズとする。Ｇは加工データｘ’を生成するための生成器であり、Ｄは真のデータと加工データとを区別するための識別器である。生成器Ｇ及び識別器Ｄは、ニューラルネットワークを用いて構築される。

【0028】

次の最適化問題を満たすように生成器Ｇを訓練することで、生成器Ｇは、真のデータと類似した加工データを生成できるようになる。

【数1】

【0029】

ここで、生成器Ｇを用いて生成された加工データと真のデータとが類似すればするほど、加工データは真のデータと同様に利用でき、精度が高い（利便性が高い）と言える。このため、識別器Ｄは、精度に関する信頼性の要件を満たすための識別器となる。

【0030】

本実施形態のデータ生成装置１は、従来の敵対的生成ネットワークを拡張し、さらに、機械学習の信頼性に関するｎ個の要件（例えば、公平性やプライバシ等）に配慮して加工データを生成する。

【0031】

Ｖ_１，…，Ｖ_ｎを、各要件を実現するための制約として、それぞれ生成器Ｇ、及び識別器Ｄ_１，…，Ｄ_ｎのいずれかを引数に取る評価関数とする。ただし、Ｖ_１及びＤ_１は、加工データの精度に関する評価関数及び識別器とする。
また、ｒ_２，…，ｒ_ｎを、精度以外の各要件の重要度を表す、評価関数Ｖ_２，…，Ｖ_ｎそれぞれの重み係数とする。ただし、ｒ_２，…，ｒ_ｎは、それぞれ分布Ｐ_ｒ２，…，Ｐ_ｒｎに従うものとする。

【0032】

なお、重み係数の分布Ｐ_ｒ２，…，Ｐ_ｒｎは、予め定義された重み係数それぞれの範囲、すなわち各要件に対する重要度のトレードオフ分析を行う範囲にピークを有する確率分布であることが好ましい。

【0033】

生成器Ｇは、分布Ｐ_ｚに従うノイズｚに加えて、ｒ_２，…，ｒ_ｎを入力とするニューラルネットワークである。データ生成装置１は、学習フェーズにおいて、次の損失関数に基づく最適化問題の条件を満たすように生成器Ｇを訓練することで、生成器Ｇは、各要件の重要度に配慮して加工データを生成できるようになる。

【数2】

【0034】

すなわち、訓練済みの生成器Ｇに対して、損失関数の重み係数ｒ_２，…，ｒ_ｎの値を指定することで、それぞれの要件の重要度に応じた加工データの生成が可能となる。各要件の重要度を変更する場合は、生成器Ｇに与える重み係数ｒ_２，…，ｒ_ｎの値を変更するだけでよく、生成器Ｇを新たな重み係数を用いて再訓練することなく、異なる重要度に対する加工データを生成できる。

【0035】

図２は、本実施形態におけるデータ生成装置１の学習フェーズにおける処理アルゴリズムを示すフローチャートである。
Ｘを訓練データの集合とし、データ生成装置１は、このアルゴリズムにより、式（１）を満たすように生成器Ｇを訓練する。

【0036】

ステップＳ１において、学習部１１は、生成器Ｇ及び識別器Ｄ_１，…，Ｄ_ｎを初期化する。

【0037】

ステップＳ２において、学習部１１は、変数ｉを１に初期化し、重み係数ｒ_２，…，ｒ_ｎのそれぞれを、分布Ｐ_ｒ２，…，Ｐ_ｒｎに従って選択する。

【0038】

ステップＳ３において、学習部１１は、訓練データの集合Ｘから複数の訓練データを選択する。さらに、学習部１１は、複数のノイズｚを分布Ｐ_ｚに従って選択し、それぞれに対応する加工データを生成器Ｇから得る。
そして、学習部１１は、得られた訓練データ及び加工データを用いて、識別器Ｄ_１及び生成器Ｇを更新する。

【0039】

ステップＳ４において、学習部１１は、変数ｉに１を加算すると、複数のノイズｚを分布Ｐ_ｚに従って選択し、それぞれに対応した、Ｄ_ｉ（ｉ＞１）の更新に必要な加工データを生成器Ｇから得る。
学習部１１は、得られた加工データを用いて、識別器Ｄ_ｉ及び生成器Ｇを更新する。

【0040】

ステップＳ５において、学習部１１は、ｉ＝ｎか否か、すなわち全てのＤ_ｉに対してステップＳ４の処理を行ったか否かを判定する。この判定がＹＥＳの場合、処理はステップＳ６に移り、判定がＮＯの場合、処理はステップＳ４に戻る。

【0041】

ステップＳ６において、学習部１１は、ステップＳ２からステップＳ５までの処理を一定回数繰り返したか否かを判定する。この判定がＹＥＳの場合、処理は終了し、判定がＮＯの場合、処理はステップＳ２に戻る。

【0042】

以上のように、本実施形態によれば、データ生成装置１（学習装置）は、加工データを生成するための生成器Ｇと信頼性に関する要件を満たすためのｎ個の識別器Ｄを用いて敵対的生成ネットワークを構成し、真のデータを用いて生成器Ｇとｎ個の識別器Ｄを競い合わせながら生成器Ｇ及びｎ個の識別器Ｄを訓練する。
このとき、データ生成装置１は、機械学習における損失関数に対して、各要件の重要度を指定するためのパラメータを重み係数として付与する。これにより、各要件の重要度に応じた加工データの生成が可能となった。

【0043】

さらに、生成器Ｇは、重み係数を入力として取るように構成され、データ生成装置１は、所定の分布に従って重み係数を選択しつつ、損失関数の期待値を最大化するように各識別器Ｄを学習し、かつ、損失関数の期待値を最小化するように生成器Ｇを学習する。
これにより、データ生成装置１は、重み係数の変更に伴って生成器Ｇを再訓練することなく、訓練済みの生成器Ｇを再利用して、異なる重要度に応じた加工データの生成が可能となる。この結果、敵対的生成ネットワークを用いて学習された生成器Ｇの信頼性に関する要件間のトレードオフ分析を効率的に行うことができる。

【0044】

敵対的生成ネットワークにおいて、ｎ個の識別器のうち一つ（Ｄ_１）は加工データの精度に関するものとし、それ以外のｎ－１個の識別器Ｄ_ｉは、公平性やプライバシ等、精度以外の要件に関するものとした。
これにより、データ生成装置１は、信頼性に関する各種の要件を同時に考慮しつつ、真のデータに類似した高精度の加工データを生成できる。

【0045】

データ生成装置１は、損失関数における重み係数の確率分布について、予め想定されるトレードオフ分析を行う値の範囲にピークを有する連続的な分布を採用することにより、重み係数を入力とする生成器Ｇを適切に訓練できる。

【0046】

なお、これにより、例えば機械学習の信頼性を向上できることから、国連が主導する持続可能な開発目標（ＳＤＧｓ）の目標９「レジリエントなインフラを整備し、持続可能な産業化を推進するとともに、イノベーションの拡大を図る」に貢献することが可能となる。

【0047】

以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、前述した実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載されたものに限定されるものではない。

【0048】

データ生成装置１による学習方法及びデータ生成方法は、ソフトウェアにより実現される。ソフトウェアによって実現される場合には、このソフトウェアを構成するプログラムが、情報処理装置（コンピュータ）にインストールされる。また、これらのプログラムは、ＣＤ－ＲＯＭのようなリムーバブルメディアに記録されてユーザに配布されてもよいし、ネットワークを介してユーザのコンピュータにダウンロードされることにより配布されてもよい。さらに、これらのプログラムは、ダウンロードされることなくネットワークを介したＷｅｂサービスとしてユーザのコンピュータに提供されてもよい。

【符号の説明】

【0049】

Ｄ識別器
Ｇ生成器
１データ生成装置（学習装置）
１０制御部
１１学習部
１２出力部
２０記憶部

【図1】

【図2】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版