IP Force 特許公報掲載プロジェクト 2022.1.31 β版

ホーム > 特許ランキング > 株式会社日立製作所

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社日立製作所の特許一覧

特開2023-37054機械学習装置および機械学習方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023037054

(43)【公開日】2023-03-15

(54)【発明の名称】機械学習装置および機械学習方法

(51)【国際特許分類】

G06N 3/084 20230101AFI20230308BHJP

【ＦＩ】

G06N3/08 140

【審査請求】未請求

【請求項の数】7

【出願形態】ＯＬ

(21)【出願番号】P 2021143583

(22)【出願日】2021-09-03

(71)【出願人】

【識別番号】000005108

【氏名又は名称】株式会社日立製作所

(74)【代理人】

【識別番号】110000350

【氏名又は名称】ポレール弁理士法人

(72)【発明者】

【氏名】大久保教夫

(72)【発明者】

【氏名】松村忠幸

(57)【要約】

【課題】
新しいクラスを追加する継続学習を繰り返すと推論精度が下がっていくという課題がある。
【解決手段】
ニューラルネットワークを備える機械学習装置であって、前記ニューラルネットワークの出力層から出力される信号の値に基づいて、教師データを自動生成する教師データ生成部と、前記教師データに基づいて、前記ニューラルネットワークの結合重みのバイアス値を変更する結合バイアス変更部と、を備える。
【選択図】図１

【特許請求の範囲】

【請求項1】

ニューラルネットワークを備える機械学習装置であって、
前記ニューラルネットワークの出力層から出力される信号の値に基づいて、教師データを自動生成する教師データ生成部と、
前記教師データに基づいて、前記ニューラルネットワークの結合重みのバイアス値を変更する結合バイアス変更部と、を備える、
ことを特徴とする機械学習装置。

【請求項2】

請求項1記載の機械学習装置であって、
前記教師データ生成部は、
前記出力層から出力される信号の値が、最も大きな値に、事前に設定された値をかけた値以上のものを正解とし、それ以外を不正解として、前記教師データを生成する
ことを特徴とする機械学習装置。

【請求項3】

請求項１記載の機械学習装置であって、
前記結合バイアス変更部は、
前記教師データ生成部において、正解とした前記出力層から出力される信号を生成する結合バイアスに事前に設定された値を減算する、あるいは、
前記教師データ生成部において、不正解とした前記出力層から出力される信号を生成する結合バイアスに事前に設定された値を加算する、あるいは、その両方の演算を行う、
ことを特徴とする機械学習装置。

【請求項4】

請求項1記載の機械学習装置であって、
前記教師データ生成部は、
前記出力層からの出力は、分類すべきラベル毎に分割され、入力データに該当するラベルに分割された出力の中から、最も大きな値に、事前に設定された値をかけた値以上のものを正解とし、それ以外を不正解として、前記教師データを生成する、
ことを特徴とする機械学習装置。

【請求項5】

ニューラルネットワークによる機械学習方法であって、
前記ニューラルネットワークの出力層から出力される信号の値に基づいて、教師データを自動生成する教師データ生成処理と、
前記教師データに基づいて、前記ニューラルネットワークの結合重みのバイアス値を変更する結合バイアス変更処理と、
がある、
ことを特徴とする機械学習方法。

【請求項6】

請求項５記載の機械学習方法であって、
前記教師データ生成処理では、
前記出力層から出力される信号の値が、最も大きな値に、事前に設定された値をかけた値以上のものを正解とし、それ以外を不正解として、前記教師データを生成する
ことを特徴とする機械学習方法。

【請求項7】

請求項５記載の機械学習方法であって、
前記結合バイアス変更処理では、
前記教師データ生成処理において、正解とした前記出力層から出力される信号を生成する結合バイアスに事前に設定された値を減算する、あるいは、
前記教師データ生成処理において、不正解とした前記出力層から出力される信号を生成する結合バイアスに事前に設定された値を加算する、あるいは、その両方の演算を行う、
ことを特徴とする機械学習方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明はニューラルネットワークを用いた機械学習装置および機械学習方法に関する。

【背景技術】

【0002】

過去に学習した内容を忘れずに、新しい学習を行う継続学習という手法が知られている。この継続学習の例が、特許文献１に記載されている。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】WO2020/194500

【発明の概要】

【発明が解決しようとする課題】

【0004】

特許文献１に記載のような従来の継続学習においては、新しいクラスを追加する継続学習を繰り返すと推論精度が下がっていくという課題がある。

【0005】

本発明の目的は、上記の課題を解決し、継続学習を繰り返し行っても推論精度が下がることを抑えることが可能な機械学習装置および機械学習方法を提供することにある。

【課題を解決するための手段】

【0006】

上記の課題を解決するため、本発明においては、ニューラルネットワークを備える機械学習装置であって、ニューラルネットワークの出力層から出力される信号の値に基づいて、教師データを自動生成する教師データ生成部と、教師データに基づいて、ニューラルネットワークの結合重みのバイアス値を変更する結合バイアス変更部と、を備える機械学習装置を提供する。

【0007】

また、上記の課題を解決するため、本発明においては、ニューラルネットワークによる機械学習方法であって、ニューラルネットワークの出力層から出力される信号の値に基づいて、教師データを自動生成する教師データ生成処理と、教師データに基づいて、ニューラルネットワークの結合重みのバイアス値を変更する結合バイアス変更処理と、からなる機械学習方法を提供する。

【発明の効果】

【0008】

本発明によれば、新しいクラスを追加する継続学習を繰り返し行っても推論精度が下がることを抑えることが可能となる。

【0009】

上記した以外の課題、構成及び効果は、以下の実施例の説明により明らかにされる。

【図面の簡単な説明】

【0010】

【図1】第1実施例の機械学習装置の説明図である。

【図2】第２実施例の機械学習装置の機能構成を示すブロック図である。

【図3】第３実施例の機械学習装置の学習処理のフローチャートである。

【図4】第３実施例の機械学習装置の訓練データについて学習処理のフローチャートである。

【図5】第３実施例の機械学習装置の教師データ作成処理のフローチャートである。

【図6】第３実施例の機械学習装置の結合バイアスの変更処理のフローチャートである。

【図7】継続学習を繰り返した時の推論精度を示すグラフである。

【図8】第４実施例の機械学習装置の説明図である。

【発明を実施するための形態】

【0011】

以下、図面を参照して本発明を実施するための好適な形態について説明する。

【実施例0012】

実施例１は、ニューラルネットワークを備える機械学習装置であって、ニューラルネットワークの出力層から出力される信号の値に基づいて、教師データを自動生成する教師データ生成部と、教師データに基づいて、ニューラルネットワークの結合重みのバイアス値を変更する結合バイアス変更部と、を備える機械学習装置、及び機械学習方法の実施例である。

【0013】

図1は、実施例１の機械学習装置の説明図である。同図において、ニューラルネットワーク１００は、入力層１０１と出力層１０２から構成される。入力層１０１はニューロン１１１、１１２、１１３から構成され、出力層１０２はニューロン１２１、１２２、１２３により構成される。入力層１０１と出力層１０２は全結合される。

【0014】

出力層１０２の出力は処理(以下、S)１５１により、上位の条件を満たしていれば正解に、それ以外は不正解として、教師データを生成する。生成された教師データはS１５２とS１５３に渡される。

【0015】

S１５２では、正解としたニューロンの結合重みのバイアスを、予め決めておいた値で減算する。S１５３では、誤差逆伝播により入力層１０１と出力層１０２の結合重みを更新する。

【0016】

本実施例によれば、ニューラルネットワークの学習において出力信号が大きいものを正解とすることで、外部から教師データを与えることなく結合重みにデータを記憶することができる。また、本実施例によれば、一度正解となったニューロンは、出力信号が大きくなりやすい傾向が現れるが、バイアスを減算することで誤学習を防ぐことができる。

【0017】

以上の学習方法により、新しいクラスを追加する継続学習を繰り返し行っても推論精度が下がることを抑えることが可能となる。また、結合重みにデータが記憶されるため、何を覚えているかが結合重みから分かり、それにより分類の理由が分かり易いという効果もある。

【0018】

なお、入力層１０１は入力層に限定されるものではなく、中間層としてその前に入力層を持つ構成としてもよい。また、出力層１０２は出力層に限定されるものではなく、中間層としてその後に出力層を持つ構成としてもよい。

【実施例0019】

実施例２は、推論時のラベル判定方法まで含めた実施例を示す。図２は、実施例２の機械学習装置の機能構成を示すブロック図である。ニューラルネットワーク部２０１は、入力層部２０３、全結合部２０４、出力層部２０５、結合重み２０７、結合バイアス２０８から構成される。

【0020】

まず学習について説明する。
データ２０２は、ニューラルネットワーク部２０１に入力し、伝播制御部２０９によりニューラルネットワーク部２０１内を順伝播して、出力は教師データ生成部２１０に入力される。

【0021】

教師データ生成部２１０では、ニューラルネットワーク部２０１の出力に基づき教師データを生成する。生成された教師データは、ニューラルネットワーク部２０１、ラベル判定部２０６、伝播制御部２０９、結合バイアス変更部２１１に入力される。

【0022】

結合バイアス変更部２１１では、教師データ生成部２１０により生成された教師データに基づきニューラルネットワーク部２０１の結合バイアス２０８を変更する。

【0023】

また、教師データ生成部２１０により生成された教師データは、伝播制御部２０９によりニューラルネットワーク部２０１内を逆伝播するとともに、結合更新部２１２によりニューラルネットワーク部２０１の結合重み２０７と結合バイアス２０８を更新することで学習が進行する。

【0024】

次に推論について説明する。
データ２０２は、ニューラルネットワーク部２０１に入力し、伝播制御部２０９によりニューラルネットワーク部２０１内を順伝播して、出力はラベル判定部２０６に入力される。ラベル判定部２０６により、ラベルが判定され推論される。

【0025】

ここで、ラベル判定の方法としては、例えば、学習時に教師データが正解とした出力を、データに対応するラベル毎に集計して、最も多いラベルを該当する出力の割り当てラベルとし、推論時にニューラルネットワーク部２０１の出力が最も大きな出力の割り当てラベルを判定結果とする。

【0026】

以上、本実施例の学習方法と推論方法により、新しいクラスを追加する継続学習を繰り返し行っても推論精度が下がることを抑えることが可能となる。

【実施例0027】

実施例３は、学習の詳細を説明した実施例を示す。

【0028】

図３は、実施例３の機械学習装置の学習処理のフローチャートである。

【0029】

S３０１は、訓練データについて学習を行う。詳細は図４を用いて後述する。

【0030】

S３０２は、全ての訓練データを学習したか、の判定を行い、全ての訓練データを学習していなければS３０１に戻り、全ての訓練データを学習したらS３０３に進む。

【0031】

S３０３は、出力層のニューロンにラベルの割当を行う。ここで、ラベルの割当方法としては、例えば、複数のデータとそれに対応するラベルを用意してニューラルネットワークによる順伝播を行い、最も高い出力をしたニューロンに該当するラベルを割り当てる。

【0032】

この方法によれば、ラベル付きの訓練データは少なくてもよく、訓練データの用意が簡単にできるという効果もある。

【0033】

S３０４は、推論精度を求める。ここで、推論精度の求め方としては、例えば、複数のデータとそれに対応するラベルを用意してニューラルネットワークによる順伝播を行い、最も高い出力をしたニューロンの割当ラベルが該当するラベルと一致しているかを判定することで求める。

【0034】

S３０５は、終了条件を満たしているか、の判定を行い、終了条件を満たしていなければ、S３０１に戻り、終了条件を満たしていれば、終了となる。ここで、終了条件とは、例えば、S３０４で求めた推論精度の上昇が収まったことを条件とする。また、例えば、指定回数だけ実行したことを条件としてもよい。

【0035】

次に、S３０１の訓練データについて学習について詳細に説明する。

【0036】

図４は、第３実施例の機械学習装置の訓練データについて学習処理のフローチャートである。

【0037】

S４０１は、順伝播処理である。ニューラルネットワークによる順伝播を行い、出力を得る。

【0038】

S４０２は、教師データ作成である。S４０１による出力値に基づいて、教師データを作成する。詳細は図５を用いて後述する。

【0039】

S４０３は、結合バイアスの変更である。S４０２により作成された教師データに基づいて、結合バイアスを変更する。詳細は図６を用いて後述する。

【0040】

S４０４は、逆伝播処理である。ニューラルネットワークによる逆伝播を行い、S４０５で行う結合重みの更新に使用する係数を求める。

【0041】

S４０５は、結合重みの更新である。ニューラルネットワークの結合重みを更新することで学習を進める。

【0042】

次に、S４０２の教師データ作成について詳細に説明する。

【0043】

図５は、第３実施例の機械学習装置の教師データ作成処理のフローチャートである。

【0044】

S５０１は、ニューロンの出力が上位の条件を満たしているかの判定を行い、条件を満たしていればS５０２に、条件を満たしていなければS５０３に進む。ここで、上位の条件とは、例えば、ニューロンの出力の中で最も大きな値に、予め決めておいた０より大きく１以下の値をかけた値の以上を上位とする。

【0045】

S５０２は、該当するニューロンの出力を正解データとする処理である。ここで、正解データとは、例えば、教師データとしては１に設定する。

【0046】

S５０３は、該当するニューロンの出力を不正解データとする処理である。ここで、不正解データとは、例えば、教師データとしては０に設定する。

【0047】

S５０４は、全てのニューロンを確認したかの判定処理であり、全てのニューロンを確認してなければS５０１に戻り、全てのニューロンを確認したならばS５０５に進む。

【0048】

S５０５は、教師データの生成処理であり、S５０２とS５０３で設定した値から教師データを生成する。

【0049】

以上により、ニューラルネットワークの出力に基づき教師データを作成する。

【0050】

次に、S４０３の結合バイアスの変更について詳細に説明する。

【0051】

図６は、第３実施例の機械学習装置の結合バイアスの変更処理のフローチャートである。

【0052】

S６０１は、ニューロンの出力を正解データとしたかの判定を行う。これは、S５０１により正解データとしたかの判定を行う。正解データであればS６０２に進み、正解データでなければS６０３に進む。

【0053】

S６０２は、結合バイアスを減算処理であり、正解データとした該当ニューロンの結合バイアスを予め決めておいた数値で減算する。

【0054】

S６０３は、全てのニューロンを確認したかの判定処理であり、全てのニューロンを確認してなければS６０１に戻り、全てのニューロンを確認したならば終了である。

【0055】

以上により、教師データに基づきニューラルネットワークの結合バイアスを変更する。

【0056】

なお、図６では正解データとした該当ニューロンの結合バイアスを予め決めておいた数値で減算する方法について説明したが、不正解データとした該当ニューロンの結合バイアスを予め決めておいた数値で加算する方法でもよい。あるいは、その両方の演算を実行する方法でもよい。

【0057】

以上の学習方法により、新しいクラスを追加する継続学習を繰り返し行っても推論精度が下がることを抑えることが可能となる。
図７は、継続学習を繰り返した時の推論精度を示すグラフである。これは、文字“０”から文字“９”までの手書き文字を識別する問題を実行した結果によるものである。なお、本発明の応用としては、手書き文字の識別に限定されるものではない。

【0058】

ここで、縦軸は推論精度であり、横軸は新しいクラスを追加する継続学習を行った回数である。

【0059】

継続学習が０とは、文字“０”のみの学習を行い、文字“０”の推論を行った結果である。また、継続学習が１とは、続けて文字“１”のみの学習を行い、文字“０”と文字“１”の推論を行った結果である。また、継続学習が２とは、続けて文字“２”のみの学習を行い、文字“０”と文字“１”と文字“２”の推論を行った結果である。以下、継続学習が９まで同様である。

【0060】

同図において、本発明とは、実施例３の機械学習方法によるものであり、従来手法とは、入力層、中間層１層、出力層からなるニューラルネットワークによる教師あり学習方法によるものである。

【0061】

グラフより、本発明の学習方法は、新しいクラスを追加する継続学習を繰り返し行っても推論精度が下がることを抑えることが可能であることが明らかである。

【0062】

新しいクラスを追加する継続学習は、例えば、自律的に学習を行う汎用人工知能に応用することが可能である。

【0063】

また継続学習により、新しい学習をするために過去に学習したデータも併せて学習し直す必要がなく、学習効率を向上させることが可能である。