(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2024-10-03
(45)【発行日】2024-10-11
(54)【発明の名称】転移学習装置、転移学習方法、および転移学習プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20241004BHJP
G06N 3/096 20230101ALI20241004BHJP
【FI】
G06N20/00 130
G06N3/096
(21)【出願番号】P 2024546376
(86)(22)【出願日】2022-12-22
(86)【国際出願番号】 JP2022047265
【審査請求日】2024-08-06
【早期審査対象出願】
(73)【特許権者】
【識別番号】000006013
【氏名又は名称】三菱電機株式会社
(74)【代理人】
【識別番号】110003166
【氏名又は名称】弁理士法人山王内外特許事務所
(72)【発明者】
【氏名】藤野 友也
【審査官】山本 俊介
(56)【参考文献】
【文献】特開2020-160804(JP,A)
【文献】特開2022-128256(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
(57)【特許請求の範囲】
【請求項1】
第1の種類のデータに関する学習済みモデルに基づいて、前記第1の種類と異なる第2の種類のデータに関する学習データを用いて知識転移学習を行って、前記学習済みモデルから中間モデルを生成する知識転移学習部と、
その生成された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、前記基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定する知識転移進行度判定部と、
を備える転移学習装置。
【請求項2】
前記基準尤度が前記複数の学習データの尤度よりも大きいと判定されない場合に、前記基準尤度が前記複数の学習データの尤度よりも大きいと判定されないことに寄与している学習データを選定する学習データ選定部、
を更に備える請求項1に記載された転移学習装置。
【請求項3】
前記基準尤度が前記複数の学習データの尤度よりも大きいと判定された場合に、前記知識転移学習を終了すると判定する知識転移反復判定部、
を更に備える請求項1または2に記載された転移学習装置。
【請求項4】
知識転移学習部および知識転移進行度判定部を備える転移学習装置が行う転移学習方法であって、
前記知識転移学習部が、第1の種類のデータに関する学習済みモデルに基づいて、前記第1の種類と異なる第2の種類のデータに関する学習データを用いて知識転移学習を行って、前記学習済みモデルから中間モデルを生成する知識転移学習を行うステップと、
知識転移進行度判定部が、その生成された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、前記基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定する知識転移進行度を判定するステップと、
を備える転移学習方法。
【請求項5】
第1の種類のデータに関する学習済みモデルに基づいて、前記第1の種類と異なる第2の種類のデータに関する学習データを用いて知識転移学習を行って、前記学習済みモデルから中間モデルを生成する知識転移学習を行う機能と、
その生成された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、前記基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定する知識転移進行度を判定する機能と、
をコンピュータに実行させる転移学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、転移学習技術に関する。
【背景技術】
【0002】
あるモダリティ(データの種類)のデータを新規に扱うことになった際、そのモダリティと異なるモダリティについて機械学習により既に十分学習済みのモデル資産が存する場合、このモデル資産に関する知識を転移して活用したいことがある。特許文献1には、このような知識転移に関する技術が開示されている。より具体的には、特許文献1には、ラベルが付された学習データを学習し、損失関数として平均二乗平方根誤差(RMSE)を用い、終了条件として5エポック続けて損失が減らなかった場合には最大エポック数50を待たずに学習を終了するとの条件を設定し、知識転移先のモダリティの精度を評価する評価指標として平均絶対誤差(MAE)および決定係数(R2)を用いる手法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
特許文献1に開示された手法によれば、知識転移先のモダリティの精度を評価する評価指標が用いられるので、評価指標に関する適当なしきい値を設定することにより知識転移の質を確保することができる。
【0005】
しかしながら、特許文献1等に記載された損失関数を用いて最小損失を探索する従来手法によれば、学習データは学習が十分になされたデータか否かに関わらず等価的に学習されるので、長い学習時間を要するという課題がある。
【0006】
本開示は、このような課題を解決するためになされたものであり、転移学習による学習時間を短縮可能な転移学習技術を提供することを目的とする。
【課題を解決するための手段】
【0007】
本開示の実施形態による転移学習装置の一側面は、第1の種類のデータに関する学習済みモデルに基づいて、前記第1の種類と異なる第2の種類のデータに関する学習データを用いて知識転移学習を行って、前記学習済みモデルから中間モデルを生成する知識転移学習部と、その生成された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、前記基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定する知識転移進行度判定部と、を備える。
【発明の効果】
【0008】
本開示の実施形態による転移学習装置によれば、転移学習による学習時間が短縮可能となる。
【図面の簡単な説明】
【0009】
【
図1】実施の形態1による転移学習装置の構成例を示す図である。
【
図2A】転移学習装置のハードウェアの構成例を示す図である。
【
図2B】転移学習装置のハードウェアの構成例を示す図である。
【
図4A】転移学習により生成される中間モデルによる、可視画像についての尤度の推移を示す尤度推移グラフである。
【
図4B】転移学習により生成される中間モデルによる、深度画像についての尤度の推移を示す尤度推移グラフである。
【
図5A】可視画像について作成するp値表の対象範囲を示す図である。
【
図5B】深度画像について作成するp値表の対象範囲を示す図である。
【
図6A】可視画像および深度画像についてのS1におけるp値表である。
【
図6B】可視画像および深度画像についてのS2におけるp値表である。
【
図6C】可視画像および深度画像についてのS3におけるp値表である。
【
図7】実施の形態1による転移学習方法を示すフローチャートである。
【
図8】実施の形態2による転移学習装置の構成例を示す図である。
【
図10】実施の形態2による転移学習方法を示すフローチャートである。
【発明を実施するための形態】
【0010】
以下、添付の図面を参照して、本開示における種々の実施形態について詳細に説明する。なお、図面において同一または類似の符号を付された構成要素は、同一または類似の構成または機能を有するものであり、そのような構成要素についての重複する説明は省略する。
【0011】
実施の形態1.
<構成>
図1から
図6Cを参照して、本開示の実施の形態1による転移学習装置1について説明をする。
図1は、実施の形態1による転移学習装置1の構成を示す図である。転移学習装置1は、転移元(ソース)に係る知識を転移先(ターゲット)に転移する転移学習を行う装置である。
【0012】
図3を参照して説明すると、転移学習装置1は、例えば、可視画像に撮像されている対象が何であるかについて十分な学習がなされた可視画像のドメインに関するモデル1の知識を転移して、深度画像に撮像されている対象が何であるかを判定可能なモデル1’を生成する。換言すると、転移学習装置1は、特徴空間が異なりタスクが同一のヘテロジニアスな転移学習を行う装置である。
【0013】
図3に示された「知識転移前」のフェーズにおいて、モデル1は、可視画像について十分な学習がなされた学習済みモデルであるので、ある対象が撮像された可視画像VIについては、その対象が何であるかを適切に判定できる。
図3において、可視画像の正解ラベルの尤度は、灰色により示されている。可視画像の正解ラベルの尤度は、最大であるので、適切な判定がなされている(図中、「〇」で表示)。しかしながら、モデル1は、ある対象が撮像された深度画像DIについては、その対象が何であるかを適切に判定できない。
図3では、深度画像の正解ラベルの尤度は、ハッチングにより示されている。ハッチングで示された正解ラベルの尤度は、最大でないので、適切な判定がなされていない(図中、「×」で表示)。
【0014】
図3に示された「知識転移後」のフェーズにおいて、モデル1’は、モデル1をベースとして、深度画像を用いて転移学習により生成された学習済みモデルである。したがって、モデル1’は、ある対象が撮像された深度画像DIについて、その対象が何であるかを適切に判定できる。ハッチングで示された正解ラベルの尤度は、最大であるので、適切な判定がなされている(図中、「〇」で表示)。他方、モデル1’は、深度画像向けにトレーニングされたことにより、
図3に示されているように、ある対象が撮像された可視画像VIについて、その対象が何であるかを適切に判定できなくなっている。可視画像の正解ラベルの尤度は、最大でないので、適切な判定がなされていない(図中、「×」で表示)。なお、知識転移元のドメインと知識転移先のドメインの類似性の程度により、モデル1’による知識転移元のドメインについての判定性能の程度は変わってくる。
【0015】
図3において、知識転移前と知識転移後の間の「知識転移中」のフェーズは、知識転移中の中間モデルによる判定結果が変化していく様子を示している。
【0016】
転移学習装置1は、知識転移元のドメインに関する複数のモデル1~3に基づいて、単一のモデル、例えばモデル1’を生成してもよい。
【0017】
以上のような転移学習を行うために、転移学習装置1は、
図1に示されているように、知識転移学習部11、知識転移進行度判定部12、知識転移反復判定部13、および知識転移結果出力部14を備える。転移学習装置1は、知識転移元の知識に係るデータを記憶する記憶装置2、知識転移先の知識に係るデータを記憶する記憶装置3、および知識転移後の知識転移先の知識に係るデータを記憶する記憶装置4と接続されて転移学習システムを構成する。
【0018】
記憶装置2に記憶されるデータは、既に十分に学習がなされた学習済みモデルのデータである。例えば、可視画像に映っている対象が人なのか、車なのか等を判定するように十分に学習がなされた、ラベル付けされた可視画像ついての学習済みモデルのデータが記憶される。このような学習済みモデルの例には、ImageNetが含まれる。学習済みモデルの対象は、可視画像以外の画像であってもよい。例えば、赤外線画像または熱画像であってもよい。また、学習済みモデルの対象は、画像に限られない。例えば、学習済みモデルの対象は、不図示のセンサを用いて計測される反射率、反射強度、または周波数等の2次元的に表された計測値または周波数分布であってもよい。
【0019】
記憶装置3に記憶されるデータは、知識転移先の学習用のデータである。例えば、人、車、建物等の深度画像についての学習用のデータが記憶される。各深度画像には、映っている対象が何であるかを示すラベルが付されている。深度画像とは、距離画像とも称され、画素値として距離値を有する画像である。記憶される学習データは、記憶装置2に記憶されるデータのモダリティと異なるものであれば、深度画像以外の画像であってもよいし、画像以外の2次元的に表された計測値または周波数分布であってもよい。
【0020】
記憶装置4に記憶されるデータは、知識転移後のモデルのデータを記憶する。例えば、記憶装置2に記憶される可視画像についての学習済みモデルの知識を記憶装置3に記憶される深度画像についての学習データを用いて新たなモデルを形成する場合、知識転移後のモデルは深度画像についての学習済みモデルである。
【0021】
(知識転移学習部)
以下、転移学習装置1の構成について、より詳細に説明をする。以下の説明は、記憶装置2に記憶されるデータは可視画像についての学習済みモデルデータであり、記憶装置3に記憶されるデータは深度画像についての学習データである場合に即して行う。
【0022】
知識転移学習部11は、第1の種類のデータに関する学習済みモデルに基づいて、第1の種類と異なる第2の種類のデータに関する学習データを用いて知識転移学習を行って、学習済みモデルから中間モデルを生成する機能部である。知識転移学習部11は、このような学習を、学習済みモデルおよび学習データを初めて取得した場合、および知識転移反復判定部13から知識転移学習を反復する旨の出力を受け付けた場合に行う。より具体的には、知識転移学習部11は、記憶装置2から、知識転移元のモダリティ(データの種類)に係るデータとして、可視画像に関する学習済みモデルのニューラルネットワークの構造およびノードの重み係数データ等のデータを取得する。また、知識転移学習部11は、記憶装置3から、知識転移先のモダリティに係るデータとして、深度画像に関する学習データを取得する。取得したこれらのデータを用いて、知識転移学習部11は、可視画像に関する学習済みモデルに基づいて、深度画像に関する学習データを用いて、知識転移学習を行う。知識転移学習は、特許文献1等に記載された公知の技術を用いて行う。知識転移学習部11は、知識転移学習を行うことにより、知識転移の途中の中間モデルを生成し、生成した中間モデルを出力する。出力された中間モデルは、不図示の記憶装置に一時的に保管されてもよい。
【0023】
転移学習により、生成される中間モデルは次第に知識転移先のモダリティに適合して行く。
図4Aおよび
図4Bは、この変容の様子を示す図である。
図4Aは、転移学習により生成される中間モデルによる、可視画像についての尤度の推移を示す尤度推移グラフである。
図4Bは、転移学習により生成される中間モデルによる、深度画像についての尤度の推移を示す尤度推移グラフである。正解ラベルは、知識転移元および知識転移先のいずれのいずれにおいてもlabel1であると想定する。
【0024】
図4Aにおいて、ベースとするモデルは可視画像についての学習済みモデルであるので、転移学習が開始された直後のフェーズ、例えばエポック数1~10の段階では、生成された中間モデルは、入力された可視画像がlabel1の画像であると高い尤度を以て判定している。しかしながら、転移学習が進むにつれて中間モデルは深度画像向けのモデルへと変容していくので、転移学習が開始されて暫く経ったフェーズ、例えばエポック数41~50の段階では、生成された中間モデルは、入力された可視画像がlabel1の画像であると高い尤度を以て判定できなくなっている。
【0025】
このことの裏返しとして、
図4Bに示されているように、中間モデルは、転移学習が開始された直後のフェーズでは、入力された深度画像がlabel1の画像であると高い尤度を以て判定できていないが、転移学習が開始されて暫く経ったフェーズでは、入力された深度画像がlabel1の画像であると高い尤度を以て判定できている。
【0026】
図4Aおよび
図4Bでは、ベースとするモデルは可視画像についての単一の学習済みモデルを想定しているが、ベースとするモデルとして可視画像についての複数の学習済みモデルを用いてもよい。ベースとする複数のモデルは、同じラベルが付されている可視画像であっても異なるデータセットにより学習されていることが一般的であるので、複数のモデルの知識を統合して転移することにより、生成される学習モデルの判定精度を高めることが可能となる。ベースとするモデルとして、モデル1、モデル2、およびモデル3があるとする。この場合、
図4Aおよび
図4Bにおいて、エポック数1、4、7、10、・・・をモデル1のエポックに割り当て、エポック数2、5、8、11、・・・をモデル2のエポックに割り当て、エポック数3、6、9、12、・・・をモデル3のエポックに割り当てて、連続する3エポック(エポック数1~3、4~6、7~9、10~12、・・・)を一単位として処理することにより、複数の学習済みモデルから知識を統合的に転移することが可能となる。
【0027】
(知識転移進行度判定部)
知識転移進行度判定部12は、知識転移学習の進行度を判定する機能部である。より具体的には、知識転移進行度判定部12は、知識転移学習部11により生成された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定することにより、知識転移学習の進行度を判定する。尤度にどの程度の差があれば大小関係があると判断してよいかが不明確であるので、多重比較検定により、信頼率または信頼区間という共通的指標に基づき判定する。
【0028】
多重比較検定とは、3群以上の複数の群について計測値が計測される場合において、どの群間に差があるのかを検定する手法である。多重比較検定を行う手法としては、例えば、次の非特許文献1に記載された、ダネットの多重比較検定を用いることができる。なお、多重比較検定の方式はダネット法に限られず、例えばウィリアムズ検定、テューキー(Tukey)検定のような他の方式であってもよい。
非特許文献1:白石高章、杉浦洋著「多重比較法の理論と数値計算」共立出版株式会社、pp.76-81(2018)。
【0029】
ダネットの多重比較検定では、計測値群の平均値に関する比較を行う際に、複数の試行の計測値群から「許容量」と呼ばれる値を信頼率pに応じて算出する。基準とする標本の平均値と、各標本の平均値に、この許容量を超えて大小関係がある場合に、信頼率pで大小関係が成立していると判断する。大小関係が成立するか、そうでないかの境界となるpの値をp値と呼ぶ。
【0030】
知識転移進行度判定部12は、知識転移学習部11により出力された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定するために、中間モデルに対して入力される画像データの尤度から、p値を算出する。エポック単位ではばらつきが生じるので、p値は複数のエポックにおける画像データの尤度から算出する。
【0031】
図6A~
図6Cは、算出されるp値の例を示す表である。
図6Aは、可視画像の尤度遷移を示す
図5AにおけるセクションS1のp値表、および深度画像の尤度遷移を示す
図5BにおけるセクションS1のp値表を示す。また、
図6Bは、可視画像の尤度遷移を示す
図5BにおけるセクションS2のp値表、および深度画像の尤度遷移を示す
図5BにおけるセクションS2のp値表を示す。また、
図6Cは、可視画像の尤度遷移を示す
図5CにおけるセクションS3のp値表、および深度画像の尤度遷移を示す
図5BにおけるセクションS3のp値表を示す。なお、
図5Aの尤度遷移は
図4Aのそれと同一であり、
図5Bの尤度遷移は
図4Bのそれと同一である。また、セクションS1はエポック数1~10のセクションであり、セクションS2はエポック数21~30のセクションであり、セクションS3はエポック数41~50のセクションである。1回の多重比較検定により、あるラベル(例えば、label1)を基準とした他の複数のラベル(例えば、label2~label6)との間での大小関係を評価でき、p値表の1つのコラム(例えば、label1のコラム)の各セルのp値が算出される。基準とするラベルを別のラベル(例えば、label2)として多重比較検定を行うことにより、その別のラベル(例えば、label2)を基準とした他の複数のラベル(例えば、label1、およびlabel3~label6)との間での大小関係を評価でき、p値表の1つのコラム(例えば、label2のコラム)の各セルのp値が算出される。
【0032】
多重比較検定によれば、p値表において、基準ラベル番号のコラムと基準ラベル以外の非基準ラベルの行が交差するセルのp値が0.05以下であれば、95%の信頼率で、基準ラベルよりも非基準ラベルのスコア値が小さいと結論付けられる。また、基準ラベル番号のコラムのすべてのセルのp値が0.05以下であれば、基準ラベルが最大と言える。
【0033】
このような多重比較検定の手法を用いて、基準ラベルとして正解ラベルを設定することにより、知識転移進行度判定部12は、知識転移学習部11により出力された中間モデルにおいて、基準ラベル(即ち、正解ラベル)が付された学習データの基準尤度が、基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを判定し、判定の結果を出力する。なお、基準ラベルがlabel1の場合、非基準ラベルにはlabel2~label6が該当する。
【0034】
(知識転移反復判定部)
知識転移反復判定部13は、知識転移進行度判定部12から出力された判定結果に基づいて、知識転移学習を反復するかどうかを判定する。より具体的には、知識転移反復判定部13は、基準ラベルの基準尤度が基準ラベル以外のすべての非基準ラベルの尤度よりも大きいことが示される場合には知識転移学習を反復しないと判定し、そうでない場合(大きいことが示されない場合)には知識転移学習を反復すると判定する。知識転移反復判定部13は、知識転移学習を反復するかどうかの判定の結果を出力する。
【0035】
(知識転移結果出力部)
知識転移結果出力部14は、知識転移反復判定部13により知識転移学習を反復しない旨の判定の結果を受け付けた場合、中間モデルを知識転移が完了した知識転移後の学習済みモデルとみなして、知識転移の結果である知識転移後の学習済みモデルのデータを記憶装置4へ出力する。
【0036】
次に、
図2Aおよび
図2Bを参照して、転移学習装置1のハードウェアの構成例について説明する。転移学習装置1の機能部は、処理回路(processing circuitry)により実現される。すなわち、転移学習装置1は、知識転移学習、知識転移進行度判定、知識転移反復判定、および知識転移結果出力等の種々の演算を行うための処理回路を備える。処理回路(processing circuitry)は、
図2Aに示されているような専用の処理回路(processing circuit)100aであっても、
図2Bに示されているようなメモリ100cに記憶されるプログラムを実行するプロセッサ100bを備えたコンピュータであってもよい。
【0037】
処理回路(processing circuitry)が専用の処理回路100aである場合、専用の処理回路100aは、例えば、単一回路、複合回路、プログラム化したプロセッサ、並列プログラム化したプロセッサ、ASIC(application specific integrated circuit)、FPGA(field-programmable gate array)、またはこれらを組み合わせたものが該当する。知識転移学習部11、知識転移進行度判定部12、知識転移反復判定部13、および知識転移結果出力部14の各部の機能を別個の複数の処理回路(processing circuits)で実現してもよいし、各部の機能をまとめて単一の処理回路(processing circuit)で実現してもよい。
【0038】
処理回路(processing circuitry)がプロセッサ100bの場合、知識転移学習部11、知識転移進行度判定部12、知識転移反復判定部13、および知識転移結果出力部14の各機能は、ソフトウェア、ファームウェア、またはソフトウェアとファームウェアとの組み合わせにより実現される。ソフトウェアおよびファームウェアはプログラムとして記述され、メモリ100cに記憶される。プロセッサ100bは、メモリに記憶されたプログラムを読み出して実行することにより、各部の機能を実現する。すなわち、知識転移学習を行うステップ、知識転移進行度判定を行うステップ、知識転移反復判定を行うステップ、知識転移結果出力を行うステップ等のステップが、結果的に実行されることになるプログラム(転移学習プログラム)を記憶するためのメモリ100cを備える。ここで、メモリ100cの例には、RAM(random access memory)、ROM(read-only memory)、フラッシュメモリ、EPROM(erasable programmable read only memory)、EEPROM(electrically erasable programmable read-only memory)等の、不揮発性または揮発性の半導体メモリや、磁気ディスク、フレキシブルディスク、光ディスク、コンパクトディスク、ミニディスク、DVDが含まれる。
【0039】
なお、知識転移学習部11、知識転移進行度判定部12、知識転移反復判定部13、および知識転移結果出力部14の各機能について、一部を専用のハードウェアで実現し、一部をソフトウェアまたはファームウェアで実現するようにしてもよい。このように、処理回路は、ハードウェア、ソフトウェア、ファームウェア、またはこれらの組み合わせによって、上述の各機能を実現することができる。
【0040】
<動作>
次に、
図7を参照して、転移学習装置1の動作について説明する。ステップS1において、知識転移学習部11は、第1の種類のデータに関する学習済みモデルに基づいて、第1の種類と異なる第2の種類のデータに関する学習データを用いて知識転移学習を行って、学習済みモデルから中間モデルを生成する。
【0041】
ステップS2において、知識転移進行度判定部12は、知識転移学習部11により生成された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定する。知識転移進行度判定部12は、判定の結果を出力する。
【0042】
ステップS3において、知識転移反復判定部13は、知識転移進行度判定部12から出力された判定結果に基づいて、知識転移学習を反復するかどうかを判定する。より具体的には、知識転移反復判定部13は、基準ラベルの基準尤度が基準ラベル以外のすべての非基準ラベルの尤度よりも大きいことが示される場合には知識転移学習を反復しないと判定し、そうでない場合(大きいことが示されない場合)には知識転移学習を反復すると判定する。反復する旨の判定がなされた場合には処理はステップS1へ戻り、反復しない旨の判定がなされた場合には処理はステップS4へ進む。
【0043】
ステップS4において、知識転移結果出力部14は、知識転移反復判定部13によりなされた反復しない旨の判定の結果を受け付けた場合、中間モデルを知識転移が完了した知識転移後の学習済みモデルとみなして、知識転移の結果である知識転移後の学習済みモデルのデータを出力する。
【0044】
以上で説明した転移学習装置1によれば、基準ラベルが付された学習データに対する複数の非基準ラベルが付された学習データの学習の進行の程度を、各非基準ラベルについて評価できる。したがって、転移学習の進行が遅れている学習データを同定することができ、転移学習の進行が遅れている学習データを重点的に学習するための基盤が提供される。したがって、転移学習による学習時間が短縮可能となる。
【0045】
実施の形態2.
<構成>
次に、
図8~
図9Cを参照して、本開示の実施の形態2による転移学習装置1’について説明する。実施の形態2による転移学習装置1’は、実施の形態1による転移学習装置1に対して学習データ選定部15が追加された点で相違する。学習データ選定部15が追加されたことに応じて、転移学習装置1’が備える知識転移進行度判定部12’の機能が転移学習装置1の知識転移進行度判定部12のそれと若干異なる。
【0046】
実施の形態2による転移学習装置1’においては、知識転移進行度判定部12’は、知識転移の進行が遅れている学習データが存在するかどうかを判定することにより知識転移学習の進行度を判定する。そのような学習データが存在するかに関する判定は、多重比較検定の結果から、p値が予め定められた値よりも小さい非基準ラベルを特定することにより行う。このようにして、知識転移進行度判定部12’は、基準尤度が、非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいと判定されない場合に、多重比較検定の結果から、p値が予め定められた値よりも小さい非基準ラベルを特定する。
【0047】
学習データ選定部15は、基準尤度が非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいと判定されない場合に、基準尤度が複数の学習データの尤度よりも大きいと判定されないことに寄与している学習データを選定する機能部である。より具体的には、学習データ選定部15は、記憶装置3から知識転移進行度判定部12’により特定されたラベルが付された学習データを選定し(即ち、取得し)、選定した学習データを知識転移学習部11へ供給する。知識転移学習部11は、学習データ選定部15により選定された学習データを用いて転移学習を行う。
【0048】
例えば、
図9Aを参照して説明すると、知識転移進行度判定部12’は、エポック数26~35における深度画像の尤度から算出された
図9Aのp値表において、基準ラベル番号が1のコラムC1からlabel6を特定する。label6の特定は、p値の値が予め定められた値、例えば0.05以下であるか否かにより行う。学習データ選定部15は、記憶装置3からlabel6が付された学習データを選定し、選定した学習データを知識転移学習部11へ供給する。
【0049】
図9Aにおいて、label1~label5のp値が予め定められた値以下であるということは、label1~label5についての学習が十分進行したことを示している。他方、label6のp値が予め定められた値よりも大きいということは、label6についての学習が十分には進行していないことを示す。そこで、他のラベルよりも学習の進行の程度が遅れているlabel6について重点的に学習する。
【0050】
label6の深度画像について重点的に学習することにより、
図9Bおよび
図9Cに示されているように、label6のp値が劇的に低減する。
図9Bはエポック数27~36における深度画像の尤度から算出されたp値表であり、
図9Cはエポック数28~37における深度画像の尤度から算出されたp値表である。label6の深度画像について重点的に学習することにより、label6のp値は、
図9BのコラムC2では0.33に、
図9CのコラムC3では0.00に低減している。
【0051】
このように、学習の進行の程度が遅れているデータについて重点的に学習することにより、学習の進行の程度が遅れているデータについての学習回数を低減することが可能となるので、転移学習の全体に要する学習時間を短縮することが可能となる。
【0052】
転移学習装置1’のハードウェアは、実施の形態1による転移学習装置1のハードウェアの構成例と同様、
図2Aまたは
図2Bの構成例により実現することができる。
【0053】
<動作>
次に、
図10を参照して、転移学習装置1の動作について説明する。ステップS1、S3およびS4は、
図7におけるそれらと同様であるので、重複する説明を省略する。
【0054】
ステップS2’において、知識転移進行度判定部12は、知識転移の進行が遅れている学習データが存在するかどうかを判定する。遅れている学習データが存在する場合、処理はステップS5へ進み、遅れている学習データが存在しない場合、処理はステップS3へ進む。
【0055】
ステップS5において、学習データ選定部15は、知識転移進行度判定部12により知識転移の進行が遅れていると判定された学習データを記憶装置3から選定し、選定した学習データを知識転移学習部11へ供給する。その後、処理はステップS1へ戻る。
【0056】
なお、実施形態を組み合わせたり、各実施形態を適宜、変形、省略したりすることが可能である。
【産業上の利用可能性】
【0057】
本開示の転移学習装置は、機械学習により既に十分学習済みのモデル資産に関する知識を転移して活用するための装置として用いることができ、例えば映像分析等の技術分野において利用することができる。
【符号の説明】
【0058】
1(1') 転移学習装置、2 記憶装置、3 記憶装置、4 記憶装置、11 知識転移学習部、12(12') 知識転移進行度判定部、13 知識転移反復判定部、14 知識転移結果出力部、15 学習データ選定部、100a 処理回路、100b プロセッサ、100c メモリ。
【要約】
転移学習装置は、第1の種類のデータに関する学習済みモデルに基づいて、前記第1の種類と異なる第2の種類のデータに関する学習データを用いて知識転移学習を行って、前記学習済みモデルから中間モデルを生成する知識転移学習部(11)と、その生成された中間モデルにおいて、基準ラベルが付された学習データの基準尤度が、前記基準ラベル以外の非基準ラベルがそれぞれに付された複数の学習データの尤度よりも大きいかを多重比較検定により判定する知識転移進行度判定部(12;12’)と、を備える。