特許7282212 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ストラッドビジョンの特許一覧

特許7282212ＡＩによるディープラーニングネットワークを学習させる方法及びこれを利用した学習装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

<図1>

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2023-05-18

(45)【発行日】2023-05-26

(54)【発明の名称】ＡＩによるディープラーニングネットワークを学習させる方法及びこれを利用した学習装置

(51)【国際特許分類】

G06N 20/00 20190101AFI20230519BHJP

G06F 18/2113 20230101ALI20230519BHJP

【ＦＩ】

G06N20/00 160

G06F18/2113

【請求項の数】 18

(21)【出願番号】P 2021570479

(86)(22)【出願日】2020-12-17

(65)【公表番号】

(43)【公表日】2022-07-07

(86)【国際出願番号】 KR2020018593

(87)【国際公開番号】W WO2021194056

(87)【国際公開日】2021-09-30

【審査請求日】2021-11-30

(31)【優先権主張番号】63/000,202

(32)【優先日】2020-03-26

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】17/111,539

(32)【優先日】2020-12-04

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】517038176

【氏名又は名称】株式会社ストラドビジョン

【氏名又は名称原語表記】ＳＴＲＡＤＶＩＳＩＯＮ，ＩＮＣ．

【住所又は居所原語表記】Ｓｕｉｔｅ３０４－３０８，５ｔｈＶｅｎｔｕｒｅ－ｄｏｎｇ，３９４，Ｊｉｇｏｋ－ｒｏ，Ｎａｍ－ｇｕ，Ｐｏｈａｎｇ－ｓｉ，Ｇｙｅｏｎｇｓａｎｇｂｕｋ－ｄｏ３７６６８ＲｅｐｕｂｌｉｃｏｆＫｏｒｅａ

(74)【代理人】

【識別番号】100120628

【弁理士】

【氏名又は名称】岩田慎一

(72)【発明者】

【氏名】金桂賢

(72)【発明者】

【氏名】諸泓模

(72)【発明者】

【氏名】康鳳男

(72)【発明者】

【氏名】柳宇宙

【審査官】北川純次

(56)【参考文献】

【文献】特表２０１９－５１４１０７（ＪＰ，Ａ）

【文献】特表２０１９－５２８５１１（ＪＰ，Ａ）

【文献】米国特許出願公開第２００８／０１０３９９６（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ２０／００

Ｇ０６Ｎ３／０２－３／１０

Ｇ０６Ｆ１８／２１

(57)【特許請求の範囲】

【請求項1】

ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）によるディープラーニングネットワークを学習させる方法において、
（ａ）学習装置が、ラベルなしのデータをアクティブラーニングネットワークに入力して、前記アクティブラーニングネットワークをもって前記ラベルなしのデータのうち、既存ラベル付きのデータを利用して学習された状態である既存ラーニングネットワークの学習に有用なハードイグザンプル（ｈａｒｄｅｘａｍｐｌｅ）として判断されるサブラベルなしのデータを抽出するようにし、前記サブラベルなしのデータをオートラベリングネットワークに入力して前記オートラベリングネットワークをもって前記サブラベルなしのデータの各々をラベリングして新規ラベル付きのデータを生成させる段階；
（ｂ）前記学習装置が、コンティニュアルラーニングネットワークをもって前記新規ラベル付きのデータと前記既存ラベル付きのデータをサンプリングし、サンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとを含むミニバッチを生成するようにし、前記ミニバッチを利用して前記既存ラーニングネットワークを学習させ、前記サンプリングされた新規ラベル付きのデータは学習に全て反映し、前記サンプリングされた既存ラベル付きのデータは、前記既存ラーニングネットワークの性能が低くなる場合にのみ学習に反映して前記既存ラーニングネットワークを学習させ、学習されたラーニングネットワークを生成させる段階；及び
（ｃ）前記学習装置が、エクスプレイナブル分析ネットワークをもって前記学習されたラーニングネットワークを介して検証データに対するインサイトフル（ｉｎｓｉｇｈｔｆｕｌ）結果を生成するようにし、前記インサイトフル結果を少なくとも一つのヒューマンエンジニアに伝送して、前記ヒューマンエンジニアをもって前記インサイトフル結果を参照して前記学習されたラーニングネットワークの性能を分析した分析結果を伝送するようにし、前記分析結果を参照して前記アクティブラーニングネットワーク及び前記コンティニュアルラーニングネットワークのうち、少なくとも一つを修正及び改善する段階；
を含む方法。

【請求項2】

前記（ａ）段階において、
前記学習装置は、前記オートラベリングネットワークをもって前記サブラベルなしのデータの各々をラベリングして中間ラベル付きのデータを生成するようにし、前記中間ラベル付きのデータに対するアンサーティンティ（ｕｎｃｅｒｔａｉｎｔｙ）を評価して予測されたロスを生成するようにし、予測されたロスがロス臨界値以上の第１の中間ラベル付きのデータを少なくとも一つのヒューマンラベラーに伝送して、前記ヒューマンラベラーをもって前記第１の中間ラベル付きのデータを検証して検証されたラベル付きのデータを生成するようにし、前記検証されたラベル付きのデータと前記予測されたロスが前記ロス臨界値未満の第２の中間ラベル付きのデータとを前記新規ラベル付きのデータで生成する、請求項１に記載の方法。

【請求項3】

前記学習装置は、学習用データを前記オートラベリングネットワークに入力して、前記オートラベリングネットワークをもって前記学習用データをラベリングして学習用ラベル付きのデータを生成するようにし、前記学習用データに対する学習用アンサーティンティを評価して学習用予測されたロスを生成するようにし、前記学習用ラベル付きのデータとこれに対応する原本正解とを参照した学習用ラベリングロスと、前記学習用ラベリングロスと前記学習用予測されたロスとの差によるロス予測エラーとをバックプロパゲーションして前記オートラベリングネットワークを学習させた状態である、請求項２に記載の方法。

【請求項4】

前記学習装置は、前記検証されたラベル付きのデータと前記第１の中間ラベル付きのデータとを参照した正確度ロスを利用して前記オートラベリングネットワークをコンティニュアル学習させる、請求項２に記載の方法。

【請求項5】

前記（ｂ）段階において、
前記既存ラベル付きのデータに対する前記既存ラーニングネットワークの既存出力情報に対する既存ロスを平均した平均ロスをベースロスとして獲得した状態で、
前記学習装置は、前記コンティニュアルラーニングネットワークをもって前記サンプリングされた新規ラベル付きのデータと前記サンプリングされた既存ラベル付きのデータとが１：１の割合になるように前記ミニバッチを生成し、前記サンプリングされた新規ラベル付きのデータに対する前記既存ラーニングネットワークのサンプリングされた新規出力情報を参照した新規ロスの全てを利用して前記既存ラーニングネットワークを学習させるようにし、前記サンプリングされた既存ラベル付きのデータに対する前記既存ラーニングネットワークのサンプリングされた既存出力情報を参照した既存ロスのうち、前記ベースロス以上の特定既存ロスのみを利用して前記既存ラーニングネットワークを学習させる、請求項１に記載の方法。

【請求項6】

前記（ｃ）段階において、
前記学習装置は、前記エクスプレイナブル分析ネットワークをもって検証データに対する前記学習されたラーニングネットワークの検証出力情報の適合性を評価してピクセルワイズ説明を生成するようにし、前記ピクセルワイズ説明を前記インサイトフルの結果として獲得する、請求項１に記載の方法。

【請求項7】

前記（ａ）段階において、
前記学習装置は、前記アクティブラーニングネットワークをもって前記ラベルなしのデータに対する前記オートラベリングネットワークの第１のラベリング出力情報と前記既存ラーニングネットワークの第２のラベリング出力情報とを比べて、第１のラベリング出力情報と第２のラベリング出力情報との差のうち、差閾以上の特定差に対応される特定ラベルなしのデータを前記サブラベルなしのデータとして抽出する、請求項１に記載の方法。

【請求項8】

前記（ａ）段階において、
前記学習装置は、前記ラベルなしのデータを第１の変換方法ないし第ｎの変換方法によって第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータに変換し、前記第１の変換されたラベルなしのデータないし前記第ｎの変換されたラベルなしのデータを前記アクティブラーニングネットワークに入力して、前記アクティブラーニングネットワークをもって前記第１の変換されたラベルなしのデータないし前記第ｎの変換されたラベルなしのデータの各々に対する前記既存ラーニングネットワークの第１の変換された出力情報ないし第ｎの変換された出力情報の分散を評価するようにし、前記分散のうち、分散臨界値以上の特定分散に対応される特定ラベルなしのデータを前記サブラベルなしのデータとして抽出させる、請求項１に記載の方法。

【請求項9】

前記（ａ）段階において、
前記学習装置は、前記アクティブラーニングネットワークをもって前記既存ラーニングネットワークを介して前記ラベルなしのデータに対するコンフィデンスを測定するようにし、コンフィデンスが最も低い順に既設定された個数になる特定ラベルなしのデータを前記サブラベルなしのデータとして抽出させる、請求項１に記載の方法。

【請求項10】

ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）によるディープラーニングネットワークを学習させる学習装置において、
ＡＩによるディープラーニングネットワークを学習させるためのインストラクションが格納されたメモリ；及び
前記メモリに格納されたインストラクションによって前記ＡＩによる前記ディープラーニングネットワークを学習させるための動作を遂行するプロセッサ；
を含み、
前記プロセッサは、（Ｉ）ラベルなしのデータをアクティブラーニングネットワークに入力して、前記アクティブラーニングネットワークをもって前記ラベルなしのデータのうち、既存ラベル付きのデータを利用して学習された状態である既存ラーニングネットワークの学習に有用なハードイグザンプル（ｈａｒｄｅｘａｍｐｌｅ）として判断されるサブラベルなしのデータを抽出するようにし、前記サブラベルなしのデータをオートラベリングネットワークに入力して前記オートラベリングネットワークをもって前記サブラベルなしのデータの各々をラベリングして新規ラベル付きのデータを生成させるプロセス、（ＩＩ）コンティニュアルラーニングネットワークをもって前記新規ラベル付きのデータと前記既存ラベル付きのデータとをサンプリングして、サンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとを含むミニバッチを生成するようにし、前記ミニバッチを利用して前記既存ラーニングネットワークを学習させ、前記サンプリングされた新規ラベル付きのデータは学習に全て反映し、前記サンプリングされた既存ラベル付きのデータは前記既存ラーニングネットワークの性能が低くなる場合にのみ学習に反映して前記既存ラーニングネットワークを学習させ、学習されたラーニングネットワークを生成させるプロセス、及び（ＩＩＩ）エクスプレイナブル分析ネットワークをもって前記学習されたラーニングネットワークを介して検証データに対するインサイトフル（ｉｎｓｉｇｈｔｆｕｌ）結果を生成するようにし、前記インサイトフル結果を少なくとも一つのヒューマンエンジニアに伝送して前記ヒューマンエンジニアをもって前記インサイトフル結果を参照して前記学習されたラーニングネットワークの性能を分析した分析結果を伝送するようにし、前記分析結果を参照して前記アクティブラーニングネットワーク及び前記コンティニュアルラーニングネットワークのうち、少なくとも一つを修正及び改善するプロセスを遂行する学習装置。

【請求項11】

前記プロセッサは、前記（Ｉ）プロセスにおいて、前記オートラベリングネットワークをもって前記サブラベルなしのデータの各々をラベリングして中間ラベル付きのデータを生成するようにし、前記中間ラベル付きのデータに対するアンサーティンティ（ｕｎｃｅｒｔａｉｎｔｙ）を評価して予測されたロスを生成するようにし、予測されたロスがロス臨界値以上の第１の中間ラベル付きのデータを少なくとも一つのヒューマンラベラーに伝送して、前記ヒューマンラベラーをもって前記第１の中間ラベル付きのデータを検証して検証されたラベル付きのデータを生成するようにし、前記検証されたラベル付きのデータと前記予測されたロスが前記ロス臨界値未満の第２の中間ラベル付きのデータとを前記新規ラベル付きのデータで生成する、請求項１０に記載の学習装置。

【請求項12】

前記プロセッサは、学習用データを前記オートラベリングネットワークに入力し、前記オートラベリングネットワークをもって前記学習用データをラベリングして学習用ラベル付きのデータを生成するようにし、前記学習用データに対する学習用アンサーティンティを評価して学習用予測されたロスを生成するようにし、前記学習用ラベル付きのデータとこれに対応される原本正解とを参照した学習用ラベリングロスと、前記学習用ラベリングロスと前記学習用予測されたロスとの差によるロス予測エラーとをバックプロパゲーションして前記オートラベリングネットワークを学習させた状態である、請求項１１に記載の学習装置。

【請求項13】

前記プロセッサは、前記検証されたラベル付きのデータと前記第１の中間ラベル付きのデータとを参照した正確度ロスを利用して前記オートラベリングネットワークをコンティニュアル学習させる、請求項１１に記載の学習装置。

【請求項14】

前記プロセッサは、前記（ＩＩ）プロセスにおいて、前記既存ラベル付きのデータに対する前記既存ラーニングネットワークの既存出力情報に対する既存ロスを平均した平均ロスをベースロスとして獲得した状態で、前記コンティニュアルラーニングネットワークをもって前記サンプリングされた新規ラベル付きのデータと前記サンプリングされた既存ラベル付きのデータとが１：１の割合になるように前記ミニバッチを生成し、前記サンプリングされた新規ラベル付きのデータに対する前記既存ラーニングネットワークのサンプリングされた新規出力情報を参照した新規ロスの全てを利用して前記既存ラーニングネットワークを学習させるようにし、前記サンプリングされた既存ラベル付きのデータに対する前記既存ラーニングネットワークのサンプリングされた既存出力情報を参照した既存ロスのうち、前記ベースロス以上の特定既存ロスのみを利用して前記既存ラーニングネットワークを学習させる、請求項１０に記載の学習装置。

【請求項15】

前記プロセッサは、前記（ＩＩＩ）プロセスにおいて、前記エクスプレイナブル分析ネットワークをもって検証データに対する前記学習されたラーニングネットワークの検証出力情報を適合性評価してピクセルワイズ説明を生成するようにし、前記ピクセルワイズ説明を前記インサイトフル結果として獲得する、請求項１０に記載の学習装置。

【請求項16】

前記プロセッサは、前記（Ｉ）プロセスにおいて、前記アクティブラーニングネットワークをもって前記ラベルなしのデータに対する前記オートラベリングネットワークの第１のラベリング出力情報と前記既存ラーニングネットワークの第２のラベリング出力情報とを比べて、第１のラベリング出力情報と第２のラベリング出力情報との差の中で差閾以上の特定差に対応される特定ラベルなしのデータを前記サブラベルなしのデータとして抽出する、請求項１０に記載の学習装置。

【請求項17】

前記プロセッサは、前記（Ｉ）プロセスにおいて、前記ラベルなしのデータを第１の変換方法ないし第ｎの変換方法によって第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータに変換し、前記第１の変換されたラベルなしのデータないし前記第ｎの変換されたラベルなしのデータを前記アクティブラーニングネットワークに入力して、前記アクティブラーニングネットワークをもって前記第１の変換されたラベルなしのデータないし前記第ｎの変換されたラベルなしのデータの各々に対する前記既存ラーニングネットワークの第１の変換された出力情報ないし第ｎの変換された出力情報の分散を評価するようにし、前記分散の中で分散臨界値以上の特定分散に対応される特定ラベルなしのデータを前記サブラベルなしのデータとして抽出する、請求項１０に記載の学習装置。

【請求項18】

前記プロセッサは、前記（Ｉ）プロセスにおいて、前記アクティブラーニングネットワークをもって前記既存ラーニングネットワークを介して前記ラベルなしのデータに対するコンフィデンスを測定するようにし、コンフィデンスが最も低い順に既設定された個数になる特定ラベルなしのデータを前記サブラベルなしのデータとして抽出する、請求項１０に記載の学習装置。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ディープラーニングネットワークを学習させる方法及びこれを利用した学習装置に係り、より詳しくは、ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）によるディープラーニングネットワークを学習させる方法及びこれを利用した学習装置に関する。

【背景技術】

【0002】

最近、機械学習（ｍａｃｈｉｎｅｌｅａｒｎｉｎｇ）を利用して物体の識別などを遂行する方法に対する研究が行われている。

【0003】

このような機械学習の一つとして入力層（ｉｎｐｕｔｌａｙｅｒ）と出力層（ｏｕｔｐｕｔｌａｙｅｒ）との間にいくつかの隠れ層（ｈｉｄｄｅｎｌａｙｅｒ）を持つ神経網を利用した機械学習であるディープラーニング（ｄｅｅｐｌｅａｒｎｉｎｇ）は高い識別性能を持っている。

【0004】

そして、ディープラーニングを利用するニューラルネットワーク（ｎｅｕｒａｌｎｅｔｗｏｒｋ）は、一般的にロス（ｌｏｓｓ）を利用したバックプロパゲーション（ｂａｃｋｐｒｏｐａｇａｔｉｏｎ）を通じて学習する。

【0005】

このようなディープラーニングネットワークの学習のために、従来はデータ収集政策にしたがって生（ｒａｗ）データを収集し、ヒューマンラベラーが収集された生データにアノテーション（ａｎｎｏｔａｔｉｏｎ）して新しいトレーニングデータを生成する。以後、新しいトレーニングデータと既存トレーニングデータとを利用してディープラーニングネットワークを学習させた後、ヒューマンエンジニアが性能を分析した結果を参照してディープラーニングネットワークの学習のための学習アルゴリズムを修正及び改善する。また、分析した結果を参照してデータ収集政策を変更し、誤ったアノテーションがあるか否かを再検収して修正する。

【0006】

しかし、このような従来の方法では、ディープラーニングネットワークの性能がよくなるほど、学習に有用なハードイグザンプル（ｈａｒｄｅｘａｍｐｌｅ）は稀になるので、新しいトレーニングデータによるディープラーニングネットワークの性能向上効果が減少するようになり、ヒューマンラベラーによるデータアノテーションの投資収益が減少するようになる。

【0007】

また、従来の方法では、ヒューマンラベラーによってアノテーションされた新規トレーニングデータと既存トレーニングデータとを設定の割合で反映する場合、既存トレーニングデータは段々多くなり、それによって新規トレーニングデータによるディープラーニングネットワークの学習効果が段々減少するようになる。

【0008】

また、従来の方法では、ヒューマンエンジニアによる性能分析結果のみでは学習アルゴリズム、データ収集政策、トレーニングデータなどの学習モデルのいかなる部分が原因であり、改善すべきであるか分からない。すなわち、とても小さい要素一つを変更してみて、性能を比べる非効率的なトライ・アンド・エラーをするか、またはもっと詳細な原因を捜すために学習されたディープラーニングネットワークの結果値を一々直接検討しながら原因を推測しなければならないので、ヒューマンエンジニアの経験と判断に依存しなければならない。

【発明の概要】

【発明が解決しようとする課題】

【0009】

本発明は、上述した問題点を全て解決することをその目的とする。

【0010】

本発明は、データアノテーションの投資収益を増加させることを他の目的とする。

【0011】

本発明は、新規トレーニングデータによるディープラーニングネットワークの学習効果を向上させることをまた他の目的とする。

【0012】

本発明は、学習されたディープラーニングネットワークの出力値から性能を分析するためのインサイトフル（ｉｎｓｉｇｈｔｆｕｌ）情報を提供することをまた他の目的とする。

【0013】

本発明は、ディープラーニングネットワークの学習のためのヒューマンの干渉を最小化することをまた他の目的とする。

【課題を解決するための手段】

【0014】

本発明の一実施例によれば、ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）によるディープラーニングネットワークを学習させる方法において、（ａ）学習装置が、ラベルなしのデータをアクティブラーニングネットワークに入力して、前記アクティブラーニングネットワークをもって前記ラベルなしのデータのうち、既存ラーニングネットワーク（前記既存ラーニングネットワークは既存ラベル付きのデータを利用して学習された状態である）の学習に有用なハードイグザンプル（ｈａｒｄｅｘａｍｐｌｅ）で判断されるサブラベルなしのデータを抽出するようにし、前記サブラベルなしのデータをオートラベリングネットワークに入力して前記オートラベリングネットワークをもって前記サブラベルなしのデータの各々をラベリングして新規ラベル付きのデータを生成させる段階；（ｂ）前記学習装置が、コンティニュアルラーニングネットワークをもって前記新規ラベル付きのデータと前記既存ラベル付きのデータをサンプリングし、サンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとを含むミニバッチを生成するようにし、前記ミニバッチを利用して前記既存ラーニングネットワークを学習させ、前記サンプリングされた新規ラベル付きのデータは学習に全て反映し、前記サンプリングされた既存ラベル付きのデータは、前記既存ラーニングネットワークの性能が低くなる場合にのみ学習に反映して前記既存ラーニングネットワークを学習させ、学習されたラーニングネットワークを生成させる段階；及び（ｃ）前記学習装置が、エクスプレイナブル分析ネットワークをもって前記学習されたラーニングネットワークを介して検証データに対するインサイトフル（ｉｎｓｉｇｈｔｆｕｌ）結果を生成するようにし、前記インサイトフル結果を少なくとも一つのヒューマンエンジニアに伝送して、前記ヒューマンエンジニアをもって前記インサイトフル結果を参照して前記学習されたラーニングネットワークの性能を分析した分析結果を伝送するようにし、前記分析結果を参照して前記アクティブラーニングネットワーク及び前記コンティニュアルラーニングネットワークのうち、少なくとも一つを修正及び改善する段階；を含む方法が提供される。

【0015】

前記学習装置は、前記オートラベリングネットワークをもって前記サブラベルなしのデータの各々をラベリングして中間ラベル付きのデータを生成するようにし、前記中間ラベル付きのデータに対するアンサーティンティ（ｕｎｃｅｒｔａｉｎｔｙ）を評価して予測されたロスを生成するようにし、予測されたロスがロス臨界値以上の第１の中間ラベル付きのデータを少なくとも一つのヒューマンラベラーに伝送して、前記ヒューマンラベラーをもって前記第１の中間ラベル付きのデータを検証して検証されたラベル付きのデータを生成するようにし、前記検証されたラベル付きのデータと前記予測されたロスが前記ロス臨界値未満の第２の中間ラベル付きのデータとを前記新規ラベル付きのデータで生成することができる。

【0016】

【0017】

前記学習装置は、前記検証されたラベル付きのデータと前記第１の中間ラベル付きのデータとを参照した正確度ロスを利用して前記オートラベリングネットワークをコンティニュアル学習させることができる。

【0018】

前記（ｂ）段階において、前記既存ラベル付きのデータに対する前記既存ラーニングネットワークの既存出力情報に対する既存ロスを平均した平均ロスをベースロスとして獲得した状態で、前記学習装置は前記コンティニュアルラーニングネットワークをもって前記サンプリングされた新規ラベル付きのデータと前記サンプリングされた既存ラベル付きのデータとが１：１の割合になるように前記ミニバッチを生成し、前記サンプリングされた新規ラベル付きのデータに対する前記既存ラーニングネットワークのサンプリングされた新規出力情報を参照した新規ロスの全てを利用して前記既存ラーニングネットワークを学習させるようにし、前記サンプリングされた既存ラベル付きのデータに対する前記既存ラーニングネットワークのサンプリングされた既存出力情報を参照した既存ロスのうち、前記ベースロス以上の特定既存ロスのみを利用して前記既存ラーニングネットワークを学習させることができる。

【0019】

前記（ｃ）段階において、前記学習装置は、前記エクスプレイナブル分析ネットワークをもって検証データに対する前記学習されたラーニングネットワークの検証出力情報の適合性を評価してピクセルワイズ説明を生成するようにし、前記ピクセルワイズ説明を前記インサイトフルの結果として獲得することができる。

【0020】

前記（ａ）段階において、前記学習装置は、前記アクティブラーニングネットワークをもって前記ラベルなしのデータに対する前記オートラベリングネットワークの第１のラベリング出力情報と前記既存ラーニングネットワークの第２のラベリング出力情報とを比べて、第１のラベリング出力情報と第２のラベリング出力情報との差のうち、差閾以上の特定差に対応される特定ラベルなしのデータを前記サブラベルなしのデータとして抽出することができる。

【0021】

前記（ａ）段階において、前記学習装置は、前記ラベルなしのデータを第１の変換方法ないし第ｎの変換方法によって第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータに変換し、前記第１の変換されたラベルなしのデータないし前記第ｎの変換されたラベルなしのデータを前記アクティブラーニングネットワークに入力して、前記アクティブラーニングネットワークをもって前記第１の変換されたラベルなしのデータないし前記第ｎの変換されたラベルなしのデータの各々に対する前記既存ラーニングネットワークの第１の変換された出力情報ないし第ｎの変換された出力情報の分散を評価するようにし、前記分散のうち、分散臨界値以上の特定分散に対応される特定ラベルなしのデータを前記サブラベルなしのデータとして抽出させることができる。

【0022】

前記（ａ）段階において、前記学習装置は、前記アクティブラーニングネットワークをもって前記既存ラーニングネットワークを介して前記ラベルなしのデータに対するコンフィデンスを測定するようにし、コンフィデンスが最も低い順に既設定された個数になる特定ラベルなしのデータを前記サブラベルなしのデータとして抽出させることができる。

【0023】

また、本発明の一実施例によれば、ＡＩ（ＡｒｔｉｆｉｃｉａｌＩｎｔｅｌｌｉｇｅｎｃｅ）によるディープラーニングネットワークを学習させる学習装置において、ＡＩによるディープラーニングネットワークを学習させるためのインストラクションが格納されたメモリ；及び前記メモリに格納されたインストラクションによって前記ＡＩによる前記ディープラーニングネットワークを学習させるための動作を遂行するプロセッサ；を含み、前記プロセッサは、（Ｉ）ラベルなしのデータをアクティブラーニングネットワークに入力して、前記アクティブラーニングネットワークをもって前記ラベルなしのデータのうち、既存ラーニングネットワーク（前記既存ラーニングネットワークは既存ラベル付きのデータを利用して学習された状態である）の学習に有用なハードイグザンプル（ｈａｒｄｅｘａｍｐｌｅ）で判断されるサブラベルなしのデータを抽出するようにし、前記サブラベルなしのデータをオートラベリングネットワークに入力して前記オートラベリングネットワークをもって前記サブラベルなしのデータの各々をラベリングして新規ラベル付きのデータを生成させるプロセス、（ＩＩ）コンティニュアルラーニングネットワークをもって前記新規ラベル付きのデータと前記既存ラベル付きのデータとをサンプリングして、サンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとを含むミニバッチを生成するようにし、前記ミニバッチを利用して前記既存ラーニングネットワークを学習させ、前記サンプリングされた新規ラベル付きのデータは学習に全て反映し、前記サンプリングされた既存ラベル付きのデータは前記既存ラーニングネットワークの性能が低くなる場合にのみ学習に反映して前記既存ラーニングネットワークを学習させ、学習されたラーニングネットワークを生成させるプロセス、及び（ＩＩＩ）エクスプレイナブル分析ネットワークをもって前記学習されたラーニングネットワークを介して検証データに対するインサイトフル（ｉｎｓｉｇｈｔｆｕｌ）結果を生成するようにし、前記インサイトフル結果を少なくとも一つのヒューマンエンジニアに伝送して前記ヒューマンエンジニアをもって前記インサイトフル結果を参照して前記学習されたラーニングネットワークの性能を分析した分析結果を伝送するようにし、前記分析結果を参照して前記アクティブラーニングネットワーク及び前記コンティニュアルラーニングネットワークのうち、少なくとも一つを修正及び改善するプロセスを遂行する学習装置が提供される。

【0024】

【0025】

【0026】

前記プロセッサは、前記検証されたラベル付きのデータと前記第１の中間ラベル付きのデータとを参照した正確度ロスを利用して前記オートラベリングネットワークをコンティニュアル学習させることができる。

【0027】

【0028】

前記プロセッサは、前記（ＩＩＩ）プロセスにおいて、前記エクスプレイナブル分析ネットワークをもって検証データに対する前記学習されたラーニングネットワークの検証出力情報を適合性評価してピクセルワイズ説明を生成するようにし、前記ピクセルワイズ説明を前記インサイトフル結果として獲得することができる。

【0029】

【0030】

【0031】

【0032】

これ以外にも、本発明の方法を実行するためのコンピュータープログラムを記録するためのコンピューター読み取りができる記録媒体がさらに提供される。

【発明の効果】

【0033】

本発明は、収集された生データのうち、ディープラーニングネットワークの性能を向上させることができるハードイグザンプルを抽出し、データアノテーションを遂行させることでデータアノテーションの投資収益を向上することができるようになる。

【0034】

また、本発明は、新規トレーニングデータと既存トレーニングデータとの最適反映の割合を自動に調整することで、ディープラーニングネットワークの学習効果を極大化することができるようになる。

【0035】

また、本発明は、学習されたディープラーニングネットワークの出力値より性能を分析するためのインサイトフル情報を提供することでヒューマンエンジニアによる性能分析の正確性を向上させることができるし、性能分析に要される時間を最小化することができるようになる。

【0036】

また、本発明は、ディープラーニングネットワークの学習のためのヒューマンの干渉を最小化することによって、ディープラーニングネットワークの学習のための費用及び時間を節減することができるようになる。

【図面の簡単な説明】

【0037】

本発明の実施例の説明に利用されるために添付された以下の図面は、本発明の実施例のうち単に一部であるに過ぎず、本発明の属する技術分野において通常の知識を有する者（以下「通常の技術者」）にとっては、発明的作業が行われずにこれらの図面に基づいて他の各図面が得られ得る。

【0038】

【図1】図１は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる学習装置を概略的に図示したものである。

【図2】図２は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる方法を概略的に図示したものである。

【図3】図３は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる方法において、アクティブラーニングネットワークの動作過程を概略的に図示したものである。

【図4】図４は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる方法において、アクティブラーニングネットワークの他の動作過程を概略的に図示したものである。

【図5】図５は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる方法において、オートラベリングネットワークの動作過程を概略的に図示したものである。

【図6】図６は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる方法において、オートラベリングネットワークを学習させる過程を概略的に図示したものである。

【図7】図７は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる方法において、コンティニュアル（ｃｏｎｔｉｎｕａｌ）ラーニングネットワークの動作過程を概略的に図示したものである。

【図8】図８は、本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる方法において、エクスプレイナブル（ｅｘｐｌａｉｎａｂｌｅ）分析ネットワークの動作過程を概略的に図示したものである。

【発明を実施するための形態】

【0039】

後述する本発明に対する詳細な説明は、本発明の目的、技術的解法及び長所を明確にするために、本発明が実施されることができる特定実施例を例示として図示する添付図面を参照する。これらの実施例は通常の技術者が本発明を実施することができるよう、十分且つ詳しく説明される。

【0040】

また、本発明の詳細な説明及び請求項にわたって「含む」という単語及びその変形は、他の技術的特徴、付加物、構成要素または段階を取り除くことで意図されたものではない。通常の技術者に本発明の他の目的、長所及び特性が、一部は本マニュアルから、そして一部は本発明の実施より表れる。以下の例示及び図面は実の例として提供され、本発明を限定するものとして意図されたものではない。

【0041】

さらに、本発明は本明細書に表示された実施例の全ての可能な組み合わせを網羅する。本発明の多様な実施例は相違するが、相互排他的である必要はないものとして理解しなければならない。例えば、ここに記載されている特定形状、構造及び特性は、一実施例に係わって本発明の精神及び範囲を脱することなく他の実施例に具現されることができる。また、各々の開示された実施例内の個別構成要素の位置または配置は、本発明の精神及び範囲を脱することなく変更されることができることを理解しなければならない。したがって、後述する詳細な説明は限定的な意味として取るものではなく、本発明の範囲は、適切に説明されれば、それらの請求項が主張することと均等な全ての範囲と共に添付された請求項のみによって限定される。図面で類似な参照符号は幾つかの側面にわたって同一または類似な機能を指す。

【0042】

以下、本発明が属する技術分野における通常の知識を有する者が本発明を容易に実施できるようにするために、本発明の好ましい実施例に関して添付の図面を参照して詳しく説明する。

【0043】

図１は本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる学習装置を概略的に図示したものであって、図１を参照すれば、学習装置１０００はＡＩ基盤のディープラーニングネットワークを学習させるためのインストラクションが格納されたメモリ１００１と、メモリ１００１に格納されたインストラクションにしたがってＡＩによるディープラーニングネットワークを学習させるための動作を遂行するプロセッサ１００２とを含むことができる。

【0044】

具体的に、学習装置１０００は典型的にコンピューティング装置（例えば、コンピュータープロセッサ、メモリ、ストレージ、入力装置及び出力装置、その他既存コンピューティング装置の構成要素を含むことができる装置；ルーター、スイッチなどのような電子通信装置；ネットワーク付きストレージ（ＮＡＳ）及びストレージ領域ネットワーク（ＳＡＮ）のような電子情報ストレージシステム）とコンピューターソフトウェア（すなわち、コンピューティング装置をもって特定方式で機能させるインストラクション）の組み合わせを利用して所望のシステム性能を達成することであってもよい。

【0045】

また、コンピューティング装置のプロセッサは、ＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）またはＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、キャッシュメモリ（ＣａｃｈｅＭｅｍｏｒｙ）、データバス（ＤａｔａＢｕｓ）などのハードウェア構成を含むことができる。また、コンピューティング装置は、運営体制、特定目的を遂行するアプリケーションのソフトウェア構成をさらに含むこともできる。

【0046】

しかし、コンピューティング装置が本発明を実施するためのミディアム、プロセッサ及びメモリが統合された形態のインテグレイティド（ｉｎｔｅｇｒａｔｅｄ）プロセッサを含む場合を排除するものではない。

【0047】

このように構成された本発明の一実施例に係わるＡＩによるディープラーニングネットワークを学習させる学習装置１０００を利用してＡＩによるディープラーニングネットワークを学習させる方法について図２を参照して説明すれば次のとおりである。

【0048】

先ず、学習に利用するための生データであるラベルなし（ｕｎｌａｂｅｌｅｄ）のデータが収集されれば、学習装置１０００はラベルなしのデータをアクティブラーニングネットワーク１００に入力して、アクティブラーニングネットワーク１００をもってラベルなしのデータのうち、既存（ｅｘｉｓｔｉｎｇ）ラーニングネットワークの学習に有用なハードイグザンプル（ｈａｒｄｅｘａｍｐｌｅ）データで判断されるサブ（ｓｕｂ）ラベルなしのデータを抽出させることができる。前記既存ラーニングネットワークは既存ラベル付き（ｌａｂｅｌｅｄ）のデータを利用して学習された状態であってもよい。

【0049】

この時、既存ラーニングネットワークの学習に有用なハードイグザンプルは、既存収集されてディープラーニングネットワークの学習に利用されたトレーニングデータとは差があるデータであってもよい。

【0050】

そして、アクティブラーニングネットワーク１００はアンサーティンティ（ｕｎｃｅｒｔａｉｎｔｙ）サンプリング（ｓａｍｐｌｉｎｇ）、Ｑｕｅｒｙ‐ｂｙ‐Ｃｏｍｍｉｔｔｅｅ、Ｅｘｐｅｃｔｅｄ‐Ｍｏｄｅ‐Ｃｈａｎｇｅなどの多様な技法を利用してラベルなしのデータからハードイグザンプルのサブラベルなしのデータを抽出することができる。

【0051】

一例として、図３を参照してアクティブラーニングネットワーク１００がラベルなしのデータからサブラベルなしのデータを抽出する過程を説明すれば次のとおりである。

【0052】

学習装置１０００は、ラベルなしのデータをアクティブラーニングネットワーク１００に入力して、アクティブラーニングネットワーク１００をもってラベルなしのデータに対するオートラベリングネットワーク２００の第１のラベリング出力情報と既存ラーニングネットワーク４００の第２のラベリング出力情報とを比べて、第１のラベリング出力情報と第２のラベリング出力情報との差（ｄｉｆｆｅｒｅｎｃｅ）のうち、差閾以上の特定差に対応される特定ラベルなしのデータをサブラベルなしのデータとして抽出することができる。

【0053】

すなわち、学習装置１０００は収集されたラベルなしのデータをアクティブラーニングネットワーク１００に入力することができる。

【0054】

それなら、アクティブラーニングネットワーク１００はラベルなしのデータをオートラベリングネットワーク２００と既存ラーニングネットワーク４００にそれぞれ入力することができる。

【0055】

これによって、オートラベリングネットワーク２００はラベルなしのデータの各々に対してラベリングを遂行し、ラベルなしのデータの各々に対する第１のラベリング情報を出力することができる。この時、第１のラベリング情報はラベルなしのデータに対する原本正解（ｇｒｏｕｎｄｔｒｕｔｈ）であり、原本正解はオブジェクトに対する領域情報、オブジェクトのクラス情報、ピクセルのクラス情報、オブジェクトの位置情報、ポイントの位置情報など多様な情報を含むことができる。

【0056】

そして、既存ラーニングネットワーク４００はラベルなしのデータの各々に対してラーニング演算を遂行し、ラベルなしのデータの各々に対する第２のラベリング情報を出力することができる。この時、第２のラベリング情報はラベルなしのデータに対する認識結果であり、既存ラーニングネットワーク４００が遂行しようとするタスク（ｔａｓｋ）によるオブジェクトに対する領域情報、オトゼックトのクラス情報、ピクセルのクラス情報、オブジェクトの位置情報、ポイントの位置情報など多様な情報を含むことができる。

【0057】

以後、アクティブラーニングネットワーク１００は、第１のラベリング情報と第２のラベリング情報とを比べて第１のラベリング情報と第２のラベリング情報との差（ｄｉｆｆｅｒｅｎｃｅ）を確認し、第１のラベリング情報と第２のラベリング情報の差が差閾未満、すなわち、第１のラベリング情報と第２のラベリング情報とが同一または類似なものと確認されれば、これに対応されるラベルなしのデータを学習用データから取り除く、第１のラベリング情報と第２のラベリング情報との差が差閾以上、すなわち、第１のラベリング情報と第２のラベリング情報との差が大きければ、これに対応されるラベルなしのデータをハードイグザンプルとして判断してサブラベルなしのデータとして抽出することができる。

【0058】

他の実施例として、図４を参照してアクティブラーニングネットワーク１００がラベルなしのデータからサブラベルなしのデータを抽出する他の過程を説明すれば次のとおりである。

【0059】

学習装置１０００は、ラベルなしのデータを第１の変換（ｍｏｄｉｆｙ）方法ないし第ｎの変換方法によって第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータに変換し、第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータをアクティブラーニングネットワーク１００に入力し、アクティブラーニングネットワーク１００をもって第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータの各々に対する既存ラーニングネットワーク４００の第１の変換された出力情報ないし第ｎの変換された出力情報の分散を測定／評価するようにし、分散の中で分散臨界値以上の特定分散に対応される特定ラベルなしのデータをサブラベルなしのデータとして抽出させることができる。

【0060】

すなわち、学習装置１０００はラベルなしのデータを第１の変換方法ないし第ｎの変換方法によって変換して第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータを生成することができる。

【0061】

この時、変換方法はラベルなしのデータのサイズをリサイズしたり、ラベルなしのデータのアスペクト比（ａｓｐｅｃｔｒａｔｉｏ）を変更したり、ラベルなしのデータのカラートーン（ｃｏｌｏｒｔｏｎｅ）を変更するなど、多様な方法で遂行することができる。

【0062】

そして、学習装置１０００は第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータを既存ラーニングネットワーク４００に入力することができる。

【0063】

それなら、既存ラーニングネットワーク４００は第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータに対してラーニング演算を遂行して、第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータに対する第１の変換された出力情報ないし第ｎの変換された出力情報を出力することができる。

【0064】

この時、第１の変換された出力情報ないし第ｎの変換された出力情報は、第１の変換されたラベルなしのデータないし第ｎの変換されたラベルなしのデータに対する認識結果であり、既存ラーニングネットワーク４００が遂行しようとするタスクによるオブジェクトに対する領域情報、オトゼックトのクラス情報、ピクセルのクラス情報、オブジェクトの位置情報、ポイントの位置情報など多様な情報を含むことができる。

【0065】

以後、アクティブラーニングネットワーク１００は第１の変換された出力情報ないし第ｎの変換された出力情報の分散を演算し、ラベルなしのデータの各々に対する分散が分散臨界値以上であるか否かを確認し、分散臨界値以上の分散に対応される特定ラベルなしのデータをサブラベルなしのデータとして抽出することができるし、分散臨界値未満の分散に対応されるラベルなしのデータは学習用データから除くことができる。

【0066】

また、学習装置１０００は図３と図４による方法以外にも、コンフィデンス（ｃｏｎｆｉｄｅｎｃｅ）サンプリングを通じてラベルなしのデータからサブラベルなしのデータを抽出することができる。一例として、学習装置１０００は、アクティブラーニングネットワーク１００をもって既存ラーニングネットワーク４００を介してラベルなしのデータに対するコンフィデンスを測定するようにし、コンフィデンスが最も低い順に既設定された個数になる特定ラベルなしのデータをサブラベルなしのデータとして抽出させることもできる。

【0067】

次に、学習装置１０００はサブラベルなしのデータをオートラベリングネットワーク２００に入力して、オートラベリングネットワーク２００をもってサブラベルなしのデータの各々をラベリング、すなわち、アノテーションを遂行して新規ラベル付きのデータを生成させることができる。

【0068】

すなわち、図５を参照すれば、学習装置１０００によってサブラベルなしのデータが入力されれば、オートラベリングネットワーク２００はサブラベルなしのデータの各々に対するアノテーション、すなわち、原本正解の生成のためのラベリングを遂行して中間（ｉｎｔｅｒｍｅｄｉａｔｅ）ラベル付きのデータを生成することができる。

【0069】

そして、オートラベリングネットワーク２００は中間ラベル付きのデータに対するアンサーティンティ（ｕｎｃｅｒｔａｉｎｔｙ）を評価して予測された（ｐｒｅｄｉｃｔｅｄ）ロスを生成することができる。

【0070】

すなわち、オートラベリングネットワーク２００は中間ラベル付きのデータに対するラベリング情報を生成し、ラベリング情報に対するアンサーティンティを利用して予測されたロスを生成することができる。

【0071】

以後、オートラベリングネットワーク２００は予測されたロスの各々をロス臨界値と比べて、予測されたロスがロス臨界値以上の第１の中間ラベル付きのデータを少なくとも一つのヒューマンラベラー（ｌａｂｅｌｅｒ）に伝送して、ヒューマンラベラーをもって第１の中間ラベル付きのデータを検証して検証された（ｖｅｒｉｆｉｅｄ）ラベル付きのデータを生成させることができる。そして、オートラベリングネットワーク２００はヒューマンラベラーの検証によってラベリング情報が修正された検証済みのラベル付きのデータと、予測ロスがロス臨界値未満である第２の中間ラベル付きのデータを新規ラベル付きのデータとして生成することができる。一方、予測されたロスを利用して第１の中間ラベル付きのデータをヒューマンラベラーに伝送し、検証されたラベル付きのデータと第２の中間ラベル付きのデータとを新規ラベル付きのデータとして生成する動作を学習装置１０００が遂行することもできる。

【0072】

この時、オートラベリングネットワーク２００はラベルなしのデータをオートラベリングするように予め学習された状態であってもよい。

【0073】

一例として、図６を参照すれば、原本正解を含む学習用データが獲得されれば、学習装置２０００が学習用データをオートラベリングネットワーク２００に入力し、オートラベリングネットワーク２００をもって学習用データをラベリングして学習用ラベル付きのデータを生成するようにし、学習用データに対する学習用アンサーティンティを評価して学習用予測ロスを生成させることができる。この時、学習装置２０００はＡＩによるディープラーニングネットワークを学習させるための学習装置１０００と同一であるか、またはオートラベリングネットワーク２００のみを学習させるための別途学習装置であってもよい。

【0074】

そして、学習装置２０００はオートラベリングネットワーク２００が生成した学習用ラベル付きのデータにおけるラベリング情報と、これに対応される原本正解とを参照して学習用ラベリングロスを演算し、学習用予測ロスと学習用ラベリングロスとを参照してロス予測エラーを演算する。以後、学習装置２０００は学習用ラベリングロスとロス予測エラーとを利用したバックプロパゲーション（ｂａｃｋｐｒｏｐａｇａｔｉｏｎ）を介してオートラベリングネットワーク２００を学習させることができる。

【0075】

一方、学習装置１０００は検証されたラベル付きのデータと第１の中間ラベル付きのデータとを参照した正確度（ａｃｃｕｒａｃｙ）ロスを利用してオートラベリングネットワーク２００をコンティニュアルラーニングさせることができる。これを通じて、オートラベリングネットワーク２００の性能を継続的に向上させることができる。

【0076】

次に、学習装置１０００はコンティニュアルラーニングネットワーク３００をもって新規ラベル付きのデータと既存ラベル付きのデータとをサンプリングし、サンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとを含むミニバッチ（ｍｉｎｉｂａｔｃｈ）を生成するようにし、ミニバッチを利用して既存ラーニングネットワーク４００を学習させ、サンプリングされた新規ラベル付きのデータは学習に全て反映し、サンプリングされた既存ラベル付きのデータは既存ラーニングネットワーク４００の性能が低くなる場合にのみ学習に反映して既存ラーニングネットワーク４００を学習させ、学習されたラーニングネットワーク４００ａを生成させることができる。

【0077】

すなわち、学習装置１０００はミニバッチを利用して既存ラーニングネットワーク４００を学習させて学習されたラーニングネットワーク４００ａを生成し、学習されたラーニングネットワーク４００ａが既存ラベル付きのデータに対しては既存ラーニングネットワーク４００とほぼ同一な性能を持つようにし、新規ラベル付きのデータに対しては既存ラーニングネットワーク４００より優れる性能を持つようにすることができる。この時、既存ラーニングネットワーク４００は既存学習されたラーニングネットワークではなく、新しいディープラーニングモデルを生成するための新規ラーニングネットワークであってもよい。

【0078】

一例として、図７を参照すれば、コンティニュアルラーニングネットワーク３００は既存トレーニングデータベースに登録された既存ラベル付きのデータを既存ラーニングネットワーク４００に入力して、既存ラーニングネットワーク４００をもって既存ラベル付きのデータをラーニング演算して既存出力情報を出力するようにし、既存出力情報を平均した平均ロスをベースロスとして獲得することができる。

【0079】

以後、コンティニュアルラーニングネットワーク３００は既存ラーニングネットワーク４００を学習させるための毎イテレーション（ｉｔｅｒａｔｉｏｎ）ごとに新規トレーニングデータベースに登録された新規ラベル付きのデータと既存トレーニングデータベースに登録された既存ラベル付きのデータとをサンプリングして、サンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとを含むミニバッチを生成することができる。この時、コンティニュアルラーニングネットワーク３００はミニバッチに含まれたサンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとの割合が１：１になるようにサンプリングすることができる。

【0080】

そして、コンティニュアルラーニングネットワーク３００はサンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとを既存ラーニングネットワーク４００に入力して、既存ラーニングネットワーク４００をもってサンプリングされた新規ラベル付きのデータとサンプリングされた既存ラベル付きのデータとをラーニング演算して、サンプリングされた新規ラベル付きのデータに対応されるサンプリングされた新規出力情報とサンプリングされた既存ラベル付きのデータに対応されるサンプリングされた既存出力情報とを出力させることができる。この時、既存ラーニングネットワーク４００は既存学習されたラーニングネットワークではなく、新しいディープラーニングモデルを生成するための新規ラーニングネットワークであってもよい。

【0081】

そして、コンティニュアルラーニングネットワーク３００はサンプリングされた新規出力情報と、これに対応される原本正解とを参照して新規ロスを生成し、サンプリングされた既存出力情報とこれに対応される原本正解とを参照して既存ロスを生成することができる。

【0082】

以後、コンティニュアルラーニングネットワーク３００は新規ロスと既存ロスとを利用したバックプロパゲーションを通じて既存ラーニングネットワーク４００を学習させるが、新規ロスに対してはバックプロパゲーションを遂行しても、既存ロスに対してはベースロスに比べてベースロス以上の特定既存ロスに対してのみバックプロパゲーションを遂行し、ベースロス未満の他の既存ロスに対してはバックプロパゲーションを遂行しないようにすることができる。すなわち、新規ラベル付きのデータは全て学習に反映し、既存ラベル付きのデータに対しては性能が落ちる場合にのみ学習に反映することで、学習されたラーニングネットワーク４００ａが既存ラベル付きのデータに対しては既存ラーニングネットワーク４００とほぼ同一な性能を持ち、新規ラベル付きのデータに対しては既存ラーニングネットワーク４００より優れる性能を持つように学習させることができる。

【0083】

次に、学習装置１０００はエクスプレイナブル分析ネットワーク５００をもって学習されたラーニングネットワーク４００ａを通じて検証データに対するインサイトフル（ｉｎｓｉｇｈｔｆｕｌ）結果を生成するようにし、インサイトフル結果を少なくとも一つのヒューマンエンジニアに伝送してヒューマンエンジニアをもってインサイトフル結果を参照して学習されたラーニングネットワーク４００ａの性能を分析した分析結果を伝送するようにし、分析結果を参照してアクティブラーニングネットワーク１００及びコンティニュアルラーニングネットワーク３００のうち、少なくとも一つを修正及び改善することができる。

【0084】

すなわち、学習装置１０００は検証データを学習されたラーニングネットワーク４００ａに入力して、学習されたラーニングネットワーク４００ａをもって検証データをラーニング演算した検証出力情報を出力するようにし、検証データに対応される検証出力情報をエクスプレイナブル分析ネットワーク５００に入力して、エクスプレイナブル分析ネットワーク５００をもって検証出力情報を参照して学習されたラーニングネットワーク４００ａの性能分析のためのインサイトフル結果を出力させる。この時、学習装置１０００が検証出力情報をエクスプレイナブル分析ネットワーク５００に入力したが、これと違って、エクスプレイナブル分析ネットワーク５００が検証データを学習されたラーニングネットワーク４００ａに入力して、学習されたラーニングネットワーク４００ａをもって検証データをラーニング演算した検証出力情報を出力させることで検証出力情報を獲得することもできる。

【0085】

この時、エクスプレイナブル分析ネットワーク５００が生成したインサイトフル結果は、学習されたラーニングネットワーク４００ａの性能がよくないイグザンプル、一例として、誤検出または未検出イグザンプル、該当イグザンプルが誤検出または未検出された原因、一例として、入力データで出力に大きい影響を与えた領域、中間層の中で出力に大きい影響を与えたフィーチャーを表示したものであってもよい。

【0086】

一例として、図８を参照すれば、（ａ）のように検証データを学習されたラーニングネットワーク４００ａに入力し、学習されたラーニングネットワーク４００ａをもって検証データをクラシフィケーション（ｃｌａｓｓｉｆｉｃａｔｉｏｎ）させた後、（ｂ）のように学習されたラーニングネットワーク４００ａの検証出力情報をエクスプレイナブル分析ネットワーク５００に入力して、エクスプレイナブル分析ネットワーク５００をもって学習されたラーニングネットワーク４００ａの検証出力情報に対して適合性評価するようにして、ピクセルワイズ（ｐｉｘｅｌ‐ｗｉｓｅ）説明を出力させる。すなわち、検証データが検証イメージである場合、各々のイメージピクセルに対して、ｉ番目のフィーチャー（ｆｅａｔｕｒｅ）が１増加する際、クラシフィケーション結果である「猫」のスコア変化量のフィーチャー適合性の変化量をイメージ上の（ｘ、ｙ）番目の入力ピクセルが１増加する際の「猫」のスコア変化量のピクセルワイズ説明として生成することで、インサイトフル結果を出力させることができる。一方、エクスプレイナブル分析ネットワーク５００は、前記適合性評価以外にも多様な方法によって学習されたラーニングネットワーク４００ａの出力値に対するインサイトフル結果を生成することができる。

【0087】

次に、学習装置１０００はエクスプレイナブル分析ネットワーク５００によって生成されたインサイトフル結果をヒューマンエンジニアに伝えて、ヒューマンエンジニアがインサイトフル結果を参照して容易に学習されたラーニングネットワーク４００ａの性能を分析することができるようにする。

【0088】

そして、学習装置１０００はヒューマンエンジニアによって生成された性能分析結果を参照してアクティブラーニングネットワーク１００を修正及び改善し、コンティニュアルラーニングネットワーク３００の学習モデルを修正及び改善することができる。

【0089】

また、以上で説明された本発明による実施例は、多様なコンピューター構成要素を通じて遂行できるプログラム命令語の形態で具現され、コンピューターの読み取り可能な記録媒体に記録されることができる。前記コンピューターの読み取り可能な記録媒体は、プログラム命令語、データファイル、データ構造などを単独でまたは組み合わせて含むことができる。前記コンピューターの読み取り可能な記録媒体に記録されるプログラム命令語は、本発明のために特別設計されて構成されたものであるか、またはコンピューターソフトウェア分野の当業者に公知されて使用可能なものであってもよい。コンピューターの読み取り可能な記録媒体の例には、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、ＣＤ‐ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカルディスク（ｆｌｏｐｔｉｃａｌｄｉｓｋ）のような磁気‐光媒体（ｍａｇｎｅｔｏ‐ｏｐｔｉｃａｌｍｅｄｉａ）、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作われるもののような機械語コードのみならず、インタプリタなどを使用してコンピューターによって実行されることができる高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を行うために一つ以上のソフトウェアモジュールとして作動するように構成されることができるし、その逆も同様である。

【0090】

以上、本発明が具体的な構成要素などのような特定事項と、限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解を助けるために提供されたものに過ぎず、本発明が前記実施例に限定されるものではなく、本発明が属する技術分野における通常の知識を有する者であれば、このような記載から多様な修正及び変形を図ることができる。

【0091】

したがって、本発明の思想は前記説明された実施例に限って決まってはならず、後述する特許請求の範囲だけでなく、この特許請求の範囲と均等に、または等価的に変形された全てのものなどは本発明の思想の範疇に属するものとする。

【符号の説明】

【0092】

１０００：学習装置
１００１：メモリ
１００２：プロセッサ

【図1】