特許7029385 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ＫＤＤＩ株式会社の特許一覧

特許7029385学習装置、学習方法及び学習プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2022-02-22

(45)【発行日】2022-03-03

(54)【発明の名称】学習装置、学習方法及び学習プログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20220224BHJP

【ＦＩ】

G06N20/00 130

【請求項の数】 5

(21)【出願番号】P 2018237211

(22)【出願日】2018-12-19

(65)【公開番号】P2020098531

(43)【公開日】2020-06-25

【審査請求日】2020-12-21

(73)【特許権者】

【識別番号】000208891

【氏名又は名称】ＫＤＤＩ株式会社

(74)【代理人】

【識別番号】100106002

【弁理士】

【氏名又は名称】正林真之

(74)【代理人】

【識別番号】100120891

【弁理士】

【氏名又は名称】林一好

(72)【発明者】

【氏名】披田野清良

(72)【発明者】

【氏名】清本晋作

【審査官】多賀実

(56)【参考文献】

【文献】特開２００８－０５９０８０（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１８／０００５１３６（ＵＳ，Ａ１）

【文献】松井孝太外２名，「ストリーム学習のための効率的なデータフィルタリング法」，電子情報通信学会技術研究報告，一般社団法人電子情報通信学会，2015年02月26日，第114巻, 第502号，pp.65-71

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

Ｇ０６Ｆ２１／００－２１／８８

Ｇ０６Ｔ７／００

(57)【特許請求の範囲】

【請求項1】

教師あり学習により関数のパラメータ値を決定する学習装置であって、
訓練データの集合からランダムに一つを抽出する抽出部と、
前記抽出部により抽出された訓練データに対して、現在のパラメータ値による損失関数の勾配を計算し、前記訓練データそれぞれに対応する勾配を格納した勾配記録データを更新する計算部と、
前記勾配記録データのうち、小さい方から所定数の勾配を抽出し、当該所定数の勾配の平均値に基づいて前記パラメータ値を更新する更新部と、を備え、
前記抽出部、前記計算部及び前記更新部による処理を、前記パラメータ値が収束するまで繰り返し実行する学習装置。

【請求項2】

前記更新部は、前記繰り返しが所定回数に満たない場合、非ゼロの勾配のうち小さい方から、前記繰り返しの回数に応じた所定割合の数の勾配を抽出する請求項１に記載の学習装置。

【請求項3】

前記更新部は、抽出した前記非ゼロの勾配が所定数に満たない場合、不足する数の勾配をゼロとして前記平均値を算出する請求項２に記載の学習装置。

【請求項4】

教師あり学習により関数のパラメータ値を決定する学習方法であって、
訓練データの集合からランダムに一つを抽出する抽出ステップと、
前記抽出ステップにおいて抽出された訓練データに対して、現在のパラメータ値による損失関数の勾配を計算し、前記訓練データそれぞれに対応する勾配を格納した勾配記録データを更新する計算ステップと、
前記勾配記録データのうち、小さい方から所定数の勾配を抽出し、当該所定数の勾配の平均値に基づいて前記パラメータ値を更新する更新ステップと、
を前記パラメータ値が収束するまでコンピュータが繰り返し実行する学習方法。

【請求項5】

教師あり学習により関数のパラメータ値を決定するための学習プログラムであって、
訓練データの集合からランダムに一つを抽出する抽出ステップと、
前記抽出ステップにおいて抽出された訓練データに対して、現在のパラメータ値による損失関数の勾配を計算し、前記訓練データそれぞれに対応する勾配を格納した勾配記録データを更新する計算ステップと、
前記勾配記録データのうち、小さい方から所定数の勾配を抽出し、当該所定数の勾配の平均値に基づいて前記パラメータ値を更新する更新ステップと、
を前記パラメータ値が収束するまでコンピュータに繰り返し実行させるための学習プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データポイゾニングに耐性のある学習装置、学習方法及び学習プログラムに関する。

【背景技術】

【0002】

教師あり学習に対する脅威の一つとして、訓練データに悪性データを混入するデータポイゾニング攻撃がある。本攻撃への対策としては、ＴＲＩＭと呼ばれる学習アルゴリズムがある（例えば、非特許文献１参照）。
一般的な教師あり学習では、訓練データから入力と出力との対応関係を表すモデルを学習する際に、最適化問題を解くことで損失関数を最小化するモデルのパラメータを決定する。一方、ＴＲＩＭでは、データポイゾニングの影響を最小限に抑えるために、悪性データが混入したＮ個の訓練データのうち正常な訓練データの数をｎ（＜Ｎ）として最適化問題を解くことで、モデルのパラメータを決定する。具体的には、ＴＲＩＭでは、交互最小化法により、訓練データとモデルのパラメータとを交互に最適化することで、Ｎ個の訓練データから損失関数を最小化するｎ個の訓練データを抽出しつつ、同時に損失関数を最小化するモデルのパラメータを決定する。

【先行技術文献】

【非特許文献】

【0003】

【文献】Ｍ．Ｊａｇｉｅｌｓｋｉｅｔａｌ．， “ＭａｎｉｐｕｌａｔｉｎｇＭａｃｈｉｎｅＬｅａｒｎｉｎｇ：ＰｏｉｓｏｎｉｎｇＡｔｔａｃｋｓａｎｄＣｏｕｎｔｅｒｍｅａｓｕｒｅｓｆｏｒＲｅｇｒｅｓｓｉｏｎＬｅａｒｎｉｎｇ，” ＩＥＥＥＳ＆Ｐ２０１８．

【発明の概要】

【発明が解決しようとする課題】

【0004】

損失関数は、一般的に、訓練データそれぞれに対する損失度の平均で表される。このため、ＴＲＩＭにおいて、現在のモデルのパラメータを用いて損失関数を最小化するｎ個の訓練データを選ぶ際は、Ｎ個の訓練データに対して損失度を計算し、損失度が小さい方からｎ個の訓練データを選択する。したがって、少なくともオーダＮの計算が必要となる。
また、現在のｎ個の訓練データを用いて損失関数を最小化するモデルのパラメータを選択する際も、ｎ個の訓練データに対して損失度を計算する必要がある。このため、オーダｎの計算が必要となる。
したがって、Ｎ及びｎが大きい場合、ＴＲＩＭの計算コストは膨大となっていた。

【0005】

本発明は、教師あり学習において、データポイゾニングの影響を最小限に抑えつつ、大規模な訓練データであっても高速に学習できる学習装置、学習方法及び学習プログラムを提供することを目的とする。

【課題を解決するための手段】

【0006】

本発明に係る学習装置は、教師あり学習により関数のパラメータ値を決定する学習装置であって、訓練データの集合からランダムに一つを抽出する抽出部と、前記抽出部により抽出された訓練データに対して、現在のパラメータ値による損失関数の勾配を計算し、前記訓練データそれぞれに対応する勾配を格納した勾配記録データを更新する計算部と、前記勾配記録データのうち、小さい方から所定数の勾配を抽出し、当該所定数の勾配の平均値に基づいて前記パラメータ値を更新する更新部と、を備え、前記抽出部、前記計算部及び前記更新部による処理を、前記パラメータ値が収束するまで繰り返し実行する。

【0007】

前記更新部は、前記繰り返しが所定回数に満たない場合、非ゼロの勾配のうち小さい方から、前記繰り返しの回数に応じた所定割合の数の勾配を抽出してもよい。

【0008】

前記更新部は、抽出した前記非ゼロの勾配が所定数に満たない場合、不足する数の勾配をゼロとして前記平均値を算出してもよい。

【0009】

本発明に係る学習方法は、教師あり学習により関数のパラメータ値を決定する学習方法であって、訓練データの集合からランダムに一つを抽出する抽出ステップと、前記抽出ステップにおいて抽出された訓練データに対して、現在のパラメータ値による損失関数の勾配を計算し、前記訓練データそれぞれに対応する勾配を格納した勾配記録データを更新する計算ステップと、前記勾配記録データのうち、小さい方から所定数の勾配を抽出し、当該所定数の勾配の平均値に基づいて前記パラメータ値を更新する更新ステップと、を前記パラメータ値が収束するまでコンピュータが繰り返し実行する。

【0010】

本発明に係る学習プログラムは、教師あり学習により関数のパラメータ値を決定するための学習プログラムであって、訓練データの集合からランダムに一つを抽出する抽出ステップと、前記抽出ステップにおいて抽出された訓練データに対して、現在のパラメータ値による損失関数の勾配を計算し、前記訓練データそれぞれに対応する勾配を格納した勾配記録データを更新する計算ステップと、前記勾配記録データのうち、小さい方から所定数の勾配を抽出し、当該所定数の勾配の平均値に基づいて前記パラメータ値を更新する更新ステップと、を前記パラメータ値が収束するまでコンピュータに繰り返し実行させるためのものである。

【発明の効果】

【0011】

本発明によれば、教師あり学習において、データポイゾニングの影響を最小限に抑えつつ、大規模な訓練データであっても高速に学習できる。

【図面の簡単な説明】

【0012】

【図1】実施形態に係る学習装置の機能構成を示すブロック図である。

【図2】実施形態に係る学習装置の処理を示すフローチャートである。

【発明を実施するための形態】

【0013】

以下、本発明の実施形態の一例について説明する。
本実施形態に係る学習方法では、悪性データが混入された訓練データを用いた教師あり学習において、悪性データの影響を抑制する。
なお、悪性データは、例えば全体の２０％等、所定の割合で混入されているものと仮定して、この所定の割合の訓練データが全体から除去される。

【0014】

教師あり学習では、訓練データの集合から、入力ｘと出力ｙとの対応関係を示す関数ｆ_ｗのパラメータｗが導出される。
ここで、Ｄ１を、ｎ個のデータからなる訓練データの集合とする。また、ｌ_ｉ（ｗ）を、ｗを入力としてｉ番目の訓練データについての損失度を出力する関数とする。教師あり学習では、次の最適化問題を解くことで、損失関数Ｌを最小化する関数ｆ_ｗのパラメータｗが導出される。
ｍｉｎ_ｗＬ（Ｄ１，ｗ）＝ｍｉｎ_ｗ（１／ｎ）・Σ_{ｉ∈［ｎ］}ｌ_ｉ（ｗ）

【0015】

データポイゾニング攻撃では、攻撃者は、悪性データの集合を訓練データの集合に混入することで、関数ｆ_ｗを意図的に操作する。
ここで、Ｄ２を訓練データの集合Ｄ１と悪性データの集合Ｄ１’との和集合とし、Ｄ２はＮ個の要素からなるものとする。また、Ｒを効用関数とする。効用関数Ｒは、パラメータｗ及び攻撃者が用意したテストデータの集合Ｄ３を入力として攻撃の効用度を出力する。攻撃者は、例えば次の最適化問題を解くことで、効用関数Ｒを最大化する悪性データの集合Ｄ１’を導出する。
ｍａｘ_Ｄ１’ Ｒ（Ｄ３，ｗ’）
ｓ．ｔ．ｗ’∈ａｒｇｍｉｎ_ｗＬ（Ｄ２，ｗ）

【0016】

本実施形態の学習方法では、Ｄ１”をｎ（＜Ｎ）個の要素からなるＤ２の部分集合とし、次の最適化問題を解くことで、悪性データの集合の影響を最小限にするパラメータｗを導出する。
ｍｉｎ_{ｗ，Ｄ１”} Ｌ（Ｄ１”，ｗ）

【0017】

図１は、本実施形態に係る学習装置１の機能構成を示すブロック図である。
学習装置１は、サーバ装置又はパーソナルコンピュータ等の情報処理装置（コンピュータ）であり、制御部１０及び記憶部２０の他、各種データの入出力デバイス及び通信デバイス等を備える。

【0018】

制御部１０は、学習装置１の全体を制御する部分であり、記憶部２０に記憶された各種プログラムを適宜読み出して実行することにより、本実施形態における各機能を実現する。制御部１０は、ＣＰＵであってよい。

【0019】

記憶部２０は、ハードウェア群を学習装置１として機能させるための各種プログラム、及び各種データ等の記憶領域であり、ＲＯＭ、ＲＡＭ、フラッシュメモリ又はハードディスク（ＨＤＤ）等であってよい。具体的には、記憶部２０は、本実施形態の各機能を制御部１０に実行させるためのプログラム（学習プログラム）、学習モデルである関数のパラメータ群、及び後述の勾配記録データ等のデータを記憶する。

【0020】

制御部１０は、抽出部１１と、計算部１２と、更新部１３とを備える。制御部１０は、これらの機能部を繰り返し動作させることにより、教師あり学習により関数のパラメータ値を決定する。

【0021】

抽出部１１は、教師あり学習に用いる訓練データの集合から、ランダムに一つの訓練データを抽出する。

【0022】

計算部１２は、抽出部１１により抽出された訓練データに対して、現在のパラメータ値による損失関数の勾配を計算し、勾配記録データを更新する。
勾配記録データは、訓練データそれぞれに対応する損失関数の勾配を格納したベクトルデータである。抽出部１１により同一の訓練データが抽出された場合には、勾配記録データにおける同一のインデックスの値が上書き更新される。

【0023】

更新部１３は、勾配記録データのうち、小さい方から所定数の勾配を抽出し、これら所定数の勾配の平均値に基づいてパラメータ値を更新する。
更新部１３は、学習の繰り返し回数が訓練データの数に満たないような初期の段階では、非ゼロの勾配のうち小さい方から、学習の繰り返し回数に応じた所定割合の数の勾配を抽出する。そして、更新部１３は、非ゼロの勾配が所定数に満たない場合、不足する数の勾配をゼロとして平均値を算出する。

【0024】

制御部１０は、抽出部１１、計算部１２及び更新部１３による処理を、パラメータ値が収束するまで繰り返す。

【0025】

図２は、本実施形態に係る学習装置１の処理を示すフローチャートである。
学習装置１は、確率的勾配降下法を応用して前述の最適化問題を解くことで、悪性データを除去しながら関数ｆ_ｗのパラメータｗを学習する。

【0026】

ステップＳ１において、制御部１０は、後続の繰り返し処理における勾配を記録するためのＮ次元のベクトル（勾配記録データ）Ｚ^（０）＝（ｚ_１ ^（０），…，ｚ_Ｎ ^（０））を用意する。ただし、全てのｉについてｚ_ｉ ^（０）＝０とする。
また、制御部１０は、パラメータｗの学習前の初期値ｗ^（０）、及び学習の繰り返し回数ｔの初期値０を設定する。

【0027】

ステップＳ２において、制御部１０（抽出部１１）は、学習の繰り返し回数ｔをカウントアップし、ｔ回目の学習のために、正常データと悪性データとが混在したＮ個の訓練データの集合Ｄ２から１個の訓練データ（ｘ_ｃ，ｙ_ｃ）をランダムに抽出する。

【0028】

ステップＳ３において、制御部１０（計算部１２）は、ステップＳ２で抽出された訓練データ（ｘ_ｃ，ｙ_ｃ）に対応する損失関数ｌ_ｃ（ｗ^{（ｔ－１）}）の勾配∇ｌ_ｃ（ｗ^{（ｔ－１）}）を計算し、ベクトルＺのｃ番目の要素のみを次のように上書き更新する。
ｚ_ｃ（ｔ）←∇ｌ_ｃ（ｗ^{（ｔ－１）}）

【0029】

ステップＳ４において、制御部１０（更新部１３）は、学習の繰り返し回数ｔがＮ未満か否かを判定する。この判定がＹＥＳ（ｔ＜Ｎ）の場合、処理はステップＳ５に移り、判定がＮＯ（ｔ≧Ｎ）の場合、処理はステップＳ６に移る。

【0030】

ステップＳ５において、制御部１０（更新部１３）は、ベクトルＺの非ゼロの要素のうち値が小さい要素からｎｔ／Ｎ個を抽出し、これらの要素のインデックス集合Ｉ（ｔ）を作成する。

【0031】

ステップＳ６において、制御部１０（更新部１３）は、ベクトルＺの中で値が小さい要素からｎ個を抽出し、これらの要素のインデックス集合Ｉ（ｔ）を作成する。

【0032】

ステップＳ７において、制御部１０（更新部１３）は、次の更新式を用いて、パラメータｗを更新する。ここで、λは、ステップサイズである。
ｗ^（ｔ）←ｗ^{（ｔ－１）}－（λ／ｎ）・Σ_ｉ∈Ｉｚ_ｉ ^（ｔ）

【0033】

ステップＳ８において、制御部１０は、パラメータｗの値が収束したか否かを判定する。この判定がＹＥＳの場合、処理は終了し、判定がＮＯの場合、処理はステップＳ２に戻り、制御部１０は、ステップＳ２からステップＳ７までの処理をパラメータｗの値が収束するまで繰り返す。
パラメータｗの値が収束すると、インデックス集合Ｉも特定の集合に収束する。この特定の集合は、悪性データと推定される所定の割合の集合が除外された良性の訓練データとなる。

【0034】

以上のように、本実施形態によれば、学習装置１は、毎回の繰り返し処理おいて、一つの訓練データをランダムに抽出してモデル（関数ｆ_ｗ）のパラメータｗに対する損失関数の勾配を計算し、過去の勾配の平均を用いてパラメータｗを更新する。これにより、繰り返し処理におけるパラメータｗの更新に関わる計算がＴＲＩＭの場合のオーダｎからオーダ１まで減少する。
また、学習装置１は、過去の勾配の平均を算出する際に、全ての勾配の平均ではなく、値の小さい一部（ｎ個）の勾配を選択して平均値を算出する。これにより、勾配が大きくなる外れ値、すなわち悪性データの可能性が高い訓練データが除外されるので、訓練データの最適化が同時に実現される。この場合、訓練データの最適化に関する計算量がＴＲＩＭの場合のオーダＮからオーダ１に減少する。
このように、学習装置１は、教師あり学習において、データポイゾニングの影響を最小限に抑えつつ、大規模な訓練データであっても高速に学習できる。

【0035】

学習装置１は、繰り返しの回数が所定回数、例えば訓練データの数に満たない場合、記録された非ゼロの勾配のうち小さい方から、繰り返しの回数に応じた所定割合（ｎｔ／Ｎ）の勾配を抽出する。これにより、学習装置１は、学習の初期の段階においても、適切に悪性データを除外しつつ、パラメータｗを学習できる。

【0036】

学習装置１は、抽出した非ゼロの勾配が所定数ｎに満たない場合、不足する数の勾配をゼロとして平均値を算出する。これにより、学習装置１は、学習の初期の段階においても、各訓練データによる学習への影響度を均一にできる。

【0037】

以上、本発明の実施形態について説明したが、本発明は前述した実施形態に限るものではない。また、前述した実施形態に記載された効果は、本発明から生じる最も好適な効果を列挙したに過ぎず、本発明による効果は、実施形態に記載されたものに限定されるものではない。

【0038】

前述の実施形態では、学習装置１は、パラメータｗを更新する際に用いる非ゼロの勾配の数がｎに満たない場合、不足する数の勾配をゼロとするため固定値のｎで除して平均値を算出したが、これには限られない。例えば、ｎに代えて、抽出された勾配の数ｎｔ／Ｎが用いられてもよい。

【0039】

前述の実施形態では、学習装置１は、繰り返しの回数ｔが訓練データの数Ｎに満たない学習の初期において、繰り返しの回数ｔに応じて、勾配記録データからｎｔ／Ｎ個の要素を抽出したが、これには限られない。例えば、勾配記録データに存在する非ゼロの要素の個数に対して所定割合（ｎ／Ｎ）を乗じた数が抽出されてもよい。

【0040】

前述の実施形態において、訓練データはランダムに選択されることとしたが、これには限られない。例えば、インデックスの順番等、全ての訓練データが均一に選択されてもよい。

【0041】

学習装置１による学習方法は、ソフトウェアにより実現される。ソフトウェアによって実現される場合には、このソフトウェアを構成するプログラムが、情報処理装置（コンピュータ）にインストールされる。また、これらのプログラムは、ＣＤ－ＲＯＭのようなリムーバブルメディアに記録されてユーザに配布されてもよいし、ネットワークを介してユーザのコンピュータにダウンロードされることにより配布されてもよい。さらに、これらのプログラムは、ダウンロードされることなくネットワークを介したＷｅｂサービスとしてユーザのコンピュータに提供されてもよい。

【符号の説明】

【0042】

１学習装置
１０制御部
１１抽出部
１２計算部
１３更新部
２０記憶部

【図1】

【図2】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版