特許7631815 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ＪＶＣケンウッドの特許一覧

特許7631815機械学習装置、機械学習方法、および機械学習プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2025-02-10

(45)【発行日】2025-02-19

(54)【発明の名称】機械学習装置、機械学習方法、および機械学習プログラム

(51)【国際特許分類】

G06N 20/00 20190101AFI20250212BHJP

G06N 3/08 20230101ALI20250212BHJP

【ＦＩ】

G06N20/00

G06N3/08

【請求項の数】 4

(21)【出願番号】P 2021003240

(22)【出願日】2021-01-13

(65)【公開番号】P2022108331

(43)【公開日】2022-07-26

【審査請求日】2023-12-28

(73)【特許権者】

【識別番号】308036402

【氏名又は名称】株式会社ＪＶＣケンウッド

(74)【代理人】

【識別番号】100105924

【弁理士】

【氏名又は名称】森下賢樹

(72)【発明者】

【氏名】楊尹誠

(72)【発明者】

【氏名】竹原英樹

(72)【発明者】

【氏名】木田晋吾

【審査官】北川純次

(56)【参考文献】

【文献】特開２０１８－０５５２５９（ＪＰ，Ａ）

【文献】MALLYA, Arun, et al.，PackNet: Adding Multiple Tasks to a Single Network by Iterative Pruning，arXiv.org [online]，2018年05月13日，[検索日 2022.02.21], インターネット：<URL:https://arxiv.org/pdf/1711.05769.pdf>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００－２０／２０

Ｇ０６Ｎ３／０２－３／０８

Ｇ０６Ｔ７／００

(57)【特許請求の範囲】

【請求項1】

タスクの特徴検出に用いられる複数のフィルタの重みを記憶する重み記憶部と、
入力されるタスクに対して前記複数のフィルタの重みを継続学習する継続学習部と、
１つのタスクを学習後の複数のフィルタの内、所定の割合のフィルタを別のタスクの学習で用いないように重みをロックし、それ以外のフィルタを別のタスクの学習で用いるために重みを初期化するフィルタ処理部と、
２つ以上のタスクを学習後の複数のフィルタの重みを比較し、重みの類似度が所定の閾値以上である重複するフィルタは一つの共用フィルタを残してそれ以外を別のタスクの学習で用いるために重みを初期化する比較部とを含むことを特徴とする機械学習装置。

【請求項2】

前記継続学習部は、別のタスクに対して前記共用フィルタ以外のフィルタの初期化された重みを継続学習する請求項１に記載の機械学習装置。

【請求項3】

入力されるタスクに対して、タスクの特徴検出に用いられる複数のフィルタの重みを継続学習する学習ステップと、
１つのタスクを学習後の複数のフィルタの内、所定の割合のフィルタを別のタスクの学習で用いないように重みをロックし、それ以外のフィルタを別のタスクの学習で用いるために重みを初期化するフィルタ処理ステップと、
２つ以上のタスクを学習後の複数のフィルタの重みを比較し、重みの類似度が所定の閾値以上である重複するフィルタは一つの共用フィルタを残してそれ以外を別のタスクの学習で用いるために重みを初期化する比較ステップとを含むことを特徴とする機械学習方法。

【請求項4】

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、機械学習技術に関する。

【背景技術】

【0002】

人間は長期にわたる経験を通して新しい知識を学習することができ、昔の知識を忘れないように維持することができる。一方、畳み込みニューラルネットワーク（Convolutional Neural Network(CNN)）の知識は学習に使用したデータセットに依存しており、データ分布の変化に適応するためにはデータセット全体に対してＣＮＮのパラメータの再学習が必要となる。ＣＮＮでは、新しいタスクについて学習していくにつれて、昔のタスクに対する推定精度は低下していく。このようにＣＮＮでは連続学習を行うと新しいタスクの学習中に昔のタスクの学習結果を忘れてしまう致命的忘却(catastrophic forgetting)が避けられない。

【0003】

致命的忘却を回避する手法として、継続学習（incremental learningまたはcontinual learning）が提案されている。継続学習の一つの手法としてＰａｃｋＮｅｔがある。

【0004】

特許文献１には、複数の学習モジュールが更新したモデルパラメータを２以上の学習モジュールに共有させる学習装置が開示されている。

【先行技術文献】

【特許文献】

【0005】

【文献】特開２０１０－２０４４６号公報

【発明の概要】

【発明が解決しようとする課題】

【0006】

継続学習の一つの手法であるＰａｃｋＮｅｔは、致命的忘却問題を回避することができる。しかし、ＰａｃｋＮｅｔでは、モデルのフィルタ数に限りがあり、新しいタスクを学習していくと、フィルタが飽和するため、学習可能なタスク数に制限があるという問題があった。

【0007】

本発明はこうした状況に鑑みてなされたものであり、その目的は、フィルタの飽和を緩和することができる機械学習技術を提供することにある。

【課題を解決するための手段】

【0008】

上記課題を解決するために、本発明のある態様の機械学習装置は、タスクの特徴検出に用いられる複数のフィルタの重みを記憶する重み記憶部と、入力されるタスクに対して前記複数のフィルタの重みを継続学習する継続学習部と、１つのタスクを学習後の複数のフィルタの内、所定の割合のフィルタを別のタスクの学習で用いないように重みをロックし、それ以外のフィルタを別のタスクの学習で用いるために重みを初期化するフィルタ処理部と、２つ以上のタスクを学習後の複数のフィルタの重みを比較し、重みの類似度が所定の閾値以上である重複フィルタをタスク間の共用フィルタとして抽出する比較部とを含む。

【0009】

本発明の別の態様は、機械学習方法である。この方法は、入力されるタスクに対して、タスクの特徴検出に用いられる複数のフィルタの重みを継続学習する学習ステップと、１つのタスクを学習後の複数のフィルタの内、所定の割合のフィルタを別のタスクの学習で用いないように重みをロックし、それ以外のフィルタを別のタスクの学習で用いるために重みを初期化するフィルタ処理ステップと、２つ以上のタスクを学習後の複数のフィルタの重みを比較し、重みの類似度が所定の閾値以上である重複するフィルタは一つを残してそれ以外を別のタスクの学習で用いるために重みを初期化する比較ステップとを含む。

【0010】

なお、以上の構成要素の任意の組合せ、本発明の表現を方法、装置、システム、記録媒体、コンピュータプログラムなどの間で変換したものもまた、本発明の態様として有効である。

【発明の効果】

【0011】

本発明によれば、フィルタの飽和を緩和することができる機械学習技術を提供することができる。

【図面の簡単な説明】

【0012】

【図1】図１（ａ）～図１（ｅ）は、前提技術となる継続学習を説明する図である。

【図2】実施の形態に係る機械学習装置の構成図である。

【図3】図３（ａ）～図３（ｅ）は、図２の機械学習装置による継続学習を説明する図である。

【図4】図２の機械学習装置の比較部の動作を説明する図である。

【図5】図２の機械学習装置による継続学習手順を説明するフローチャートである。

【発明を実施するための形態】

【0013】

図１（ａ）～図１（ｅ）は、前提技術となるＰａｃｋＮｅｔによる継続学習を説明する図である。ＰａｃｋＮｅｔでは与えられたタスクに対してモデルの複数のフィルタの重みが学習される。ここでは、畳み込みニューラルネットワークの各層の複数のフィルタを格子状に並べて図示する。

【0014】

ＰａｃｋＮｅｔの学習プロセスは下記の（Ａ）～（Ｅ）のステップで進められる。

【0015】

（Ａ）モデルがタスク１を学習する。図１（ａ）は、タスク１の学習後のフィルタの初期状態を示す。すべてのフィルタはタスク１を学習済みで、色が黒で示される。

【0016】

（Ｂ）各フィルタの重みの値の大きい順にフィルタを並べ、重みの値が小さいフィルタから順に全体の６０％のフィルタの値を初期化する。図１（ｂ）は、タスク１の学習後のフィルタの最終状態を示す。初期化されたフィルタは色が白で示される。

【0017】

（Ｃ）次に、タスク２を学習する。このステップにおいて、図１（ｂ）の黒色のフィルタの重みの値がロックされ、重みの値を変更できるのは白色のフィルタだけである。図１（ｃ）は、タスク２の学習後のフィルタの初期状態を示す。図１（ｂ）の白で示されたフィルタのすべてはタスク２を学習済みで、図１（ｃ）において斜線で示される。

【0018】

（Ｄ）ステップ（Ｂ）と同様に、タスク２を学習した斜線のフィルタの重みの値の大きい順にフィルタを並べ、重みの値が小さいフィルタから順に全体の６０％のフィルタの値を初期化する。図１（ｄ）は、タスク２の学習後のフィルタの最終状態を示す。初期化されたフィルタは色が白で示される。

【0019】

（Ｅ）さらに、タスク３を学習する。このステップにおいて、図１（ｄ）の黒色と斜線のフィルタの重みの値がロックされ、重みの値を変更できるのは白色のフィルタだけである。図１（ｅ）は、タスク３の学習後のフィルタの初期状態を示す。図１（ｄ）の白で示されたフィルタのすべてはタスク３を学習済みで、図１（ｅ）において横縞で示される。

【0020】

このようにＰａｃｋＮｅｔの学習プロセスによると、このままタスクＮまで学習していくと、初期化された白のフィルタの数がどんどん少なくなり、飽和する。フィルタが飽和すると、新しいタスクを学習できなくなる。

【0021】

ＰａｃｋＮｅｔのフィルタがいつか飽和することは回避することができない。しかし、フィルタが飽和するスピードを緩めることはできる。そこで、本実施の形態では、新しいタスクを学習する度に、重みの類似度が高い重複フィルタをタスク間の共用フィルタとして抽出し、重複フィルタの内、一つのフィルタを共用フィルタとして残し、共用フィルタ以外のフィルタの重みを０に初期化する。これにより、新しいタスクで学習できるフィルタを増やし、フィルタの飽和速度を緩和し、学習できるタスクの数を増やすことができる。

【0022】

図２は、実施の形態に係る機械学習装置１００の構成図である。機械学習装置１００は、入力部１０、継続学習部２０、フィルタ処理部３０、比較部４０、重み記憶部５０、推論部６０、および出力部７０を含む。

【0023】

入力部１０は、教師付きのタスクを継続学習部２０に供給し、未知タスクを推論部６０に供給する。ここでは、一例としてタスクは画像認識である。たとえば、タスク１は猫の認識、タスク２は犬の認識といった画像における特定の物体の認識である。

【0024】

重み記憶部５０は、タスクの特徴検出に用いられる複数のフィルタの重みを記憶する。画像をいくつものフィルタに通すことで、その画像の特徴を捉えることができる。

【0025】

継続学習部２０は、入力される教師付きタスクに対して重み記憶部５０の複数のフィルタの重みを継続学習し、更新されたフィルタの重みを重み記憶部５０に保存する。

【0026】

フィルタ処理部３０は、１つのタスクを学習後の複数のフィルタの内、所定の割合のフィルタを別のタスクの学習で用いないように重みをロックし、それ以外のフィルタを別のタスクの学習で用いるために重みを初期化する。たとえば、フィルタの重みの大きい順にフィルタを並べ、重みの大きい方から４０％のフィルタの重みをロックし、残りの６０％のフィルタを別のタスクの学習で用いるために重みを初期化する。

【0027】

フィルタ処理部３０による初期化が済んだ後、比較部４０は、２つ以上のタスクを学習後の複数のフィルタの重みを比較し、重みの類似度が所定の閾値以上である重複フィルタをタスク間の共用フィルタとして抽出する。モデルは多層の畳み込みニューラルネットワークであるため、各層において複数のフィルタの重みの類似度を算出する。比較部４０は、重複フィルタの内、一つのフィルタを共用フィルタとして残し、共用フィルタ以外のフィルタの重みを初期化し、重み記憶部５０に保存する。

【0028】

継続学習部２０は、新しいタスクに対して共用フィルタ以外のフィルタの初期化された重みを継続学習する。

【0029】

推論部６０は、重み記憶部５０に保存されたフィルタの重みを用いて、入力された未知タスクに対して推論する。出力部７０は、推論部６０による推論結果を出力する。

【0030】

図３（ａ）～図３（ｅ）は、図２の機械学習装置１００による継続学習を説明する図である。畳み込みニューラルネットワークの各層の複数のフィルタを格子状に並べて図示しており、（ｉ，ｊ）は、第ｉ行、第ｊ列のフィルタを指す。

【0031】

機械学習装置１００の学習プロセスは下記の（Ａ）～（Ｅ）のステップで進められる。

【0032】

（Ａ）モデルがタスク１を学習する。図３（ａ）は、タスク１の学習後のフィルタの初期状態を示す。すべてのフィルタはタスク１を学習済みで、色が黒で示される。

【0033】

（Ｂ）各フィルタの重みの値の大きい順にフィルタを並べ、重みの値が小さいフィルタから順に全体の６０％のフィルタの値を初期化する。図３（ｂ）は、タスク１の学習後のフィルタの最終状態を示す。初期化されたフィルタは色が白で示される。

【0034】

（Ｃ）次に、タスク２を学習する。このステップにおいて、図３（ｂ）の黒色のフィルタの重みの値がロックされ、重みの値を変更できるのは白色のフィルタだけである。図３（ｃ）は、タスク２の学習後のフィルタの初期状態を示す。図３（ｂ）の白で示されたフィルタのすべてはタスク２を学習済みで、図３（ｃ）において斜線で示される。

【0035】

（Ｄ）ステップ（Ｂ）と同様に、タスク２を学習した斜線のフィルタの重みの値の大きい順にフィルタを並べ、重みの値が小さいフィルタから順に全体の６０％のフィルタの値を初期化する。図３（ｄ）は、タスク２の学習後のフィルタの中間状態を示す。初期化されたフィルタは色が白で示される。

【0036】

（Ｅ）タスク１を学習した黒色のフィルタとタスク２を学習した斜線のフィルタの間で重みを比較し、類似度が所定の閾値を超えるフィルタを重複フィルタとして抽出する。たとえば、図３（ｄ）において、斜線フィルタ（１，３）は黒色フィルタ（１，２）と類似するため、これらは重複フィルタであると判定される。同様に、斜線フィルタ（３，１）と黒色フィルタ（３，２）は類似する重複フィルタであり、斜線フィルタ（３，５）と黒色フィルタ（４，５）は類似する重複フィルタである。

【0037】

図３（ｅ）に示すように、斜線フィルタ（１，３）は類似する黒色フィルタ（１，２）で代用することができるため、斜線フィルタ（１，３）の重みは初期化され、白色のフィルタになり、黒色フィルタ（１，２）はタスク１とタスク２の共用フィルタとなる。同様に、斜線フィルタ（３，１）は類似する黒色フィルタ（３，２）で代用され、斜線フィルタ（３，１）の重みは初期化され、白色のフィルタになり、黒色フィルタ（３，２）はタスク１とタスク２の共用フィルタとなる。また、斜線フィルタ（３，５）は類似する黒色フィルタ（４，５）で代用され、斜線フィルタ（３，５）の重みは初期化され、白色のフィルタになり、黒色フィルタ（４，５）はタスク１とタスク２の共用フィルタとなる。

【0038】

図３（ｅ）は、タスク２の学習後のフィルタの最終状態を示し、初期化された白色のフィルタはタスク３の学習で用いられ、重みが変更される。以降、同様に、タスク３の学習後のフィルタの初期状態に対して、重みの値の小さいフィルタを初期化し、タスク３を学習したフィルタと、タスク１を学習したフィルタおよびタスク２を学習したフィルタとの間で重みを比較し、類似する重複フィルタがある場合、タスク３のフィルタを初期化する。これをタスクＮまで繰り返す。

【0039】

図４は、図２の機械学習装置１００の比較部４０の動作を説明する図である。

【0040】

図３（ｄ）に示すタスク２の学習後のフィルタの中間状態に対して、タスク１を学習したフィルタの重みとタスク２を学習したフィルタの重みを比較して、重みの類似度が高いフィルタを抽出し、初期化の対象とする。

【0041】

モデルには複数のレイヤがあるため、比較は各レイヤ内で行う。例えば、一つのレイヤにフィルタが１２８個ある。この中に、タスク１を学習したフィルタが５１個、タスク２を学習したフィルタが３０個、残りのフィルタは初期化されている場合、タスク１の５１個のフィルタとタスク２の３０個のフィルタの類似度を算出する。

【0042】

類似度は、フィルタの重みの値の絶対値を比較することによって算出する。たとえば、３×３のフィルタの場合、９個の重みの絶対値を比較する。ここで、閾値を設定する。類似度が閾値を上回ると、二つのフィルタは重複していると判定され、タスク２のフィルタの重みを０に初期化する。

【0043】

フィルタＡの各要素をａ_ｉｊ、フィルタＢの各要素をｂ_ｉｊとした場合、二つのフィルタＡ、Ｂ間で同じ位置にある値の絶対値の差を、たとえば次式のｄ_１（Ａ，Ｂ）、ｄ_２（Ａ，Ｂ）、ｄ_∞（Ａ，Ｂ）、ｄ_ｍ（Ａ，Ｂ）のように計算する。

【数1】

【0044】

上記の説明では、フィルタの類似度は、二つのフィルタ間で同じ位置にある値の絶対値の差を計算することによって算出したが、これ以外の方法で類似度を算出してもよい。たとえば、各フィルタについて、フィルタ絶対差分和ＳＡＤを水平方向絶対差分和ＳＡＤ＿Ｈと垂直方向絶対差分和ＳＡＤ＿Ｖの和として、ＳＡＤ＝ＳＡＤ＿Ｈ＋ＳＡＤ＿Ｖにより求める。フィルタＡのフィルタ絶対差分和ＳＡＤ＿ＡとフィルタＢのフィルタ絶対差分和ＳＡＤ＿Ｂの差が閾値より小さいなら、フィルタＡとフィルタＢは重複していると判定してもよい。ここで、３×３のフィルタの第１行の要素をａ１、ａ２、ａ３、第２行の要素をａ４、ａ５、ａ６、第３行の要素をａ７、ａ８、ａ９とした場合、水平方向絶対差分和ＳＡＤ＿Ｈと垂直方向絶対差分和ＳＡＤ＿Ｖは次式で与えられる。
ＳＡＤ＿Ｈ＝｜ａ１－ａ２｜＋｜ａ２－ａ３｜＋｜ａ４－ａ５｜＋｜ａ５－ａ６｜＋｜ａ７－ａ８｜＋｜ａ８－ａ９｜
ＳＡＤ＿Ｖ＝｜ａ１－ａ４｜＋｜ａ２－ａ５｜＋｜ａ３－ａ６｜＋｜ａ４－ａ７｜＋｜ａ５－ａ８｜＋｜ａ６－ａ９｜
また、別の類似度の算出方法として、ユークリッド距離やコサイン距離の比較を用いてもよい。

【0045】

フィルタの重みの類似度が高ければ、そのフィルタはタスク間において特徴が同じか差がないということになり、重複フィルタを保持する必要はない。そこで片方のフィルタについては初期化して、別のタスクの学習に用いる。なお、ここでは、重みをフィルタの中にある１要素、図４の３×３のフィルタの場合、マトリクスのうちの１つのセルであるとして説明したが、フィルタ単位、つまりマトリクスの単位で重みを捉えてもよい。

【0046】

より一般的には、タスクＮの性能を最大限に維持するため、タスクＮとタスクＮ＋１の間に重複したフィルタがある場合、タスクＮ＋１のフィルタの重みを０に初期化する。これにより、限られたフィルタを最大限に利用することができる。

【0047】

図５は、図２の機械学習装置１００による継続学習手順を説明するフローチャートである。

【0048】

入力部１０は、現在の教師付きタスクを継続学習部２０に入力する（Ｓ１０）。

【0049】

継続学習部２０は、現在のタスクに対して複数のフィルタの重みを継続学習する（Ｓ２０）。

【0050】

フィルタ処理部３０は、現在のタスクを学習した複数のフィルタの重みの小さいものから順に所定の割合のフィルタを初期化する（Ｓ３０）。

【0051】

比較部４０は、現在のタスクを学習したフィルタと過去のタスクを学習したフィルタを比較し、重みの類似度を算出する（Ｓ４０）。

【0052】

比較部４０は、過去のタスクのフィルタと類似度が高い現在のタスクのフィルタを初期化する（Ｓ５０）。

【0053】

まだタスクがある場合、ステップＳ１０に戻り、次のタスクを入力する（Ｓ６０のＮ）。タスクが終了の場合、継続学習を終了する（Ｓ６０のＹ）。

【0054】

以上説明した機械学習装置１００の各種の処理は、ＣＰＵやメモリ等のハードウェアを用いた装置として実現することができるのは勿論のこと、ＲＯＭ（リード・オンリ・メモリ）やフラッシュメモリ等に記憶されているファームウェアや、コンピュータ等のソフトウェアによっても実現することができる。そのファームウェアプログラム、ソフトウェアプログラムをコンピュータ等で読み取り可能な記録媒体に記録して提供することも、有線あるいは無線のネットワークを通してサーバと送受信することも、地上波あるいは衛星ディジタル放送のデータ放送として送受信することも可能である。

【0055】

以上述べたように、本実施の形態の機械学習装置１００によれば、継続学習モデルのフィルタの飽和速度を緩和し、フィルタを効率的に利用してより多くのタスクを学習することができる。

【0056】

以上、本発明を実施の形態をもとに説明した。実施の形態は例示であり、それらの各構成要素や各処理プロセスの組合せにいろいろな変形例が可能なこと、またそうした変形例も本発明の範囲にあることは当業者に理解されるところである。

【符号の説明】

【0057】

１０入力部、２０継続学習部、３０フィルタ処理部、４０比較部、５０重み記憶部、６０推論部、７０出力部、１００機械学習装置。

【図1】