特表2023-514294 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ストラッドビジョンの特許一覧

特表2023-514294オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法及びそれを利用したアクティブラーニングデバイス

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2023-04-05

(54)【発明の名称】オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法及びそれを利用したアクティブラーニングデバイス

(51)【国際特許分類】

G06T 7/00 20170101AFI20230329BHJP

G06N 7/01 20230101ALI20230329BHJP

G06N 20/00 20190101ALI20230329BHJP

【ＦＩ】

G06T7/00 350B

G06N7/01

G06N20/00

【審査請求】有

【予備審査請求】未請求

(21)【出願番号】P 2022549370

(86)(22)【出願日】2021-03-29

(85)【翻訳文提出日】2022-08-16

(86)【国際出願番号】 KR2021003824

(87)【国際公開番号】W WO2021225279

(87)【国際公開日】2021-11-11

(31)【優先権主張番号】63/021,809

(32)【優先日】2020-05-08

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】17/135,033

(32)【優先日】2020-12-28

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】517038176

【氏名又は名称】株式会社ストラドビジョン

【氏名又は名称原語表記】ＳＴＲＡＤＶＩＳＩＯＮ，ＩＮＣ．

【住所又は居所原語表記】Ｓｕｉｔｅ３０４－３０８，５ｔｈＶｅｎｔｕｒｅ－ｄｏｎｇ，３９４，Ｊｉｇｏｋ－ｒｏ，Ｎａｍ－ｇｕ，Ｐｏｈａｎｇ－ｓｉ，Ｇｙｅｏｎｇｓａｎｇｂｕｋ－ｄｏ３７６６８ＲｅｐｕｂｌｉｃｏｆＫｏｒｅａ

(74)【代理人】

【識別番号】100121728

【弁理士】

【氏名又は名称】井関勝守

(74)【代理人】

【識別番号】100165803

【弁理士】

【氏名又は名称】金子修平

(74)【代理人】

【識別番号】100170900

【弁理士】

【氏名又は名称】大西渉

(72)【発明者】

【氏名】金桂賢

(72)【発明者】

【氏名】權成顔

(72)【発明者】

【氏名】金鎔重

(72)【発明者】

【氏名】康鳳男

【テーマコード（参考）】

5L096

【Ｆターム（参考）】

5L096DA02

5L096HA09

5L096KA04

5L096KA15

(57)【要約】

オブジェクトディテクタ（ＯＤ）用ベイジアンデュアルエンコーダを利用したエクスプレイナブルアクティブラーニング方法は、（ａ）テストイメージをＯＤに入力してクロップされたイメージを生成し、テストイメージと該イメージとをリサイズ後データエンコーダに入力してデータコードを出力し（ｂ）（ｂ１）テストイメージをＯＤに入力してベイジアン出力エンベディングを適用し、アクティベーションエントロピーマップ（ＡＥＭ）とクロップされたＡＥＭとをリサイズするか、リサイズされたオブジェクトイメージを入力してベイジアン出力エンベディングを適用し、（ｂ２）リサイズされたＡＥＭをモデルエンコーダに入力してモデルコードを出力し（ｃ）リファレンスデータコードを確認しレアサンプルに特定のテストイメージを選択してデータコードブックをアップデートし、リファレンスモデルコードを確認しハードサンプルに特定のテストイメージを選択する。
【選択図】図９

【特許請求の範囲】

【請求項1】

オブジェクトディテクタのためのベイジアンデュアルエンコーダ（Ｂａｙｅｓｉａｎｄｕａｌｅｎｃｏｄｅｒ）を利用したエクスプレイナブル（ｅｘｐｌａｉｎａｂｌｅ）アクティブラーニング方法において、
（ａ）テストイメージが獲得されると、アクティブラーニングデバイスが、前記テストイメージをオブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれにおけるテスト用オブジェクトを検出して前記テスト用オブジェクトに対応するテスト用バウンディングボックスを出力させ、前記テストイメージのそれぞれから前記テスト用バウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたイメージ乃至テスト用第ｎ（前記ｎは１以上の整数である）クロップされたイメージを生成し、前記テストイメージ及び前記テストイメージのそれぞれに対応する前記テスト用第１クロップされたイメージ乃至前記テスト用第ｎクロップされたイメージを同一のサイズにリサイズしてテスト用第１リサイズされたイメージ乃至テスト用第ｎ＋１リサイズされたイメージを生成し、前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをデータエンコーダに入力することで、前記データエンコーダをもって前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをエンコーディングして前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージに対応するテスト用第１データコード乃至テスト用第ｎ＋１データコードを出力させる段階；
（ｂ）前記アクティブラーニングデバイスが、（ｉ）前記テストイメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれをｍ（前記ｍは２以上の整数である）回モンテカルロドロップアウトを遂行して前記テストイメージのそれぞれに対応するテスト用第１フィーチャーマップ乃至テスト用第ｍフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングしてテスト用アクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップのそれぞれから前記テスト用バウンディングボックスのうちオブジェクトとして判別されたテスト用特定のバウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたアクティベーションエントロピーマップ乃至テスト用第ｏ（前記ｏはｎ以下の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップ及び前記テスト用アクティベーションエントロピーマップに対応する前記テスト用第１クロップされたアクティベーションエントロピーマップ乃至前記テスト用第ｏクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズしてテスト用第１リサイズされたアクティベーションエントロピーマップ乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージのうちオブジェクトとして判別されたテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングして前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをモデルエンコーダに入力することで、前記モデルエンコーダをもって前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップに対応するテスト用第１モデルコード乃至テスト用第ｏ＋１モデルコードを出力させる段階；及び
（ｃ）前記アクティブラーニングデバイスが、（ｉ）前記オブジェクトディテクタの以前の学習に使用された以前の学習イメージによって生成されたデータコードブック（前記データコードブックは、前記以前の学習用イメージにおけるデータコード別リサイズされたイメージの個数を整理したものである）を参照することで、カウンタスレッショルド以下であるリサイズされたイメージの個数に対応するリファレンスデータコードを確認し、前記第１データコード乃至前記第ｎ＋１データコードのうち前記リファレンスデータコードにマッチングする第１特定のデータコードを抽出し、前記第１特定のデータコードに対応する第１特定のテストイメージを前記オブジェクトディテクタの再学習のためのレアサンプルに選定し、前記レアサンプルに対応する第２特定のデータコードを参照することで前記データコードブックをアップデートし、（ｉｉ）前記オブジェクトディテクタの再学習の以前に検証イメージによって生成されたモデルコードブック（前記モデルコードブックは、前記検証イメージにおけるモデルコード別リサイズされたアクティベーションエントロピーマップのアベレージエントロピー値を整理したものである）を参照することで、エントロピースレッショルド以上であるアベレージエントロピー値に対応するリファレンスモデルコードを確認し、前記第１モデルコード乃至前記第ｏ＋１モデルコードのうち前記リファレンスモデルコードにマッチングする特定のモデルコードを抽出し、前記特定のモデルコードに対応する第２特定のテストイメージを前記オブジェクトディテクタの再学習のためのハードサンプルに選定する段階；
を含む方法。

【請求項2】

（ｄ）前記アクティブラーニングデバイスは、前記以前の学習用イメージ、前記レアサンプル、及び前記ハードサンプルを利用して前記オブジェクトディテクタを再学習させる段階；
をさらに含む、請求項１に記載の方法。

【請求項3】

前記（ｂ）段階で、
前記アクティブラーニングデバイスは、（ｉ）前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをバイナリ変換してテスト用第１バイナリフィーチャーマップ乃至テスト用第ｍバイナリフィーチャーマップを生成し、前記テスト用第１バイナリフィーチャーマップ乃至前記テスト用第ｍバイナリフィーチャーマップをコンカチネートしてテスト用アクティベーションプロバビリティマップを生成し、前記テスト用アクティベーションプロバビリティマップを参照することで前記テスト用アクティベーションエントロピーマップを生成するか、（ｉｉ）前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップをバイナリ変換して前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１バイナリオブジェクトフィーチャーマップ乃至テスト用第ｍバイナリオブジェクトフィーチャーマップを生成し、前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記テスト用第１バイナリオブジェクトフィーチャーマップ乃至前記テスト用第ｍバイナリオブジェクトフィーチャーマップをコンカチネートして前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを生成し、テスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを参照することで前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成する、請求項１に記載の方法。

【請求項4】

前記（ａ）段階で、
前記アクティブラーニングデバイスは、前記テスト用バウンディングボックスのうち誤検出されたテスト用バウンディングボックスは、バックグラウンドデータコードにマッピングする、請求項１に記載の方法。

【請求項5】

前記（ｃ）段階で、
前記カウンタスレッショルドは、予め設定されたリサイズされたイメージの個数であるか、前記データコードブックでリサイズされたイメージの個数が高い順からｑ（前記ｑは１以上の整数である）番目に該当するスレッショルドデータコードに対応するリサイズされたイメージの個数であり、
前記エントロピースレッショルドは、予め設定されたアベレージエントロピー値であるか、前記モデルコードブックでアベレージエントロピー値が高い順からｓ（前記ｓは１以上の整数である）番目に該当するスレッショルドモデルコードに対応するアベレージエントロピー値である、請求項１に記載の方法。

【請求項6】

前記（ａ）段階以前に、
（ａ１）前記アクティブラーニングデバイスが、前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージのそれぞれからオブジェクト領域をクロップして学習用第１クロップされたオブジェクトイメージ乃至学習用第ｔ（前記ｔは１以上の整数である）クロップされたオブジェクトイメージを生成し、前記学習イメージのそれぞれからバックグラウンド領域をクロップして学習用第１クロップされたバックグラウンドイメージ乃至学習用第ｕ（前記ｕは１以上の整数である）クロップされたバックグラウンドイメージを生成し、前記学習イメージ及び前記学習イメージのそれぞれに対応する前記学習用第１クロップされたオブジェクトイメージ乃至前記学習用第ｔクロップされたオブジェクトイメージ、及び前記学習イメージのそれぞれに対応する前記学習用第１クロップされたバックグラウンドイメージ乃至前記学習用第ｕクロップされたバックグラウンドイメージを同一のサイズにリサイズして学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｔ＋１リサイズされたオブジェクトイメージ、及び学習用第１リサイズされたバックグラウンドイメージ乃至学習用第ｕリサイズされたバックグラウンドイメージを生成し、前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージをデータオートエンコーダの前記データエンコーダに入力することで、前記データエンコーダをもって前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージをエンコーディングして前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージに対応する学習用第１オブジェクトデータコード乃至学習用第ｔ＋１オブジェクトデータコード及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージに対応する学習用第１バックグラウンドデータコード乃至学習用第ｕバックグラウンドデータコードを出力させ、前記学習用第１オブジェクトデータコード乃至前記学習用第ｔ＋１オブジェクトデータコードを前記データオートエンコーダのデータデコーダに入力することで、前記データデコーダをもって前記学習用第１オブジェクトデータコード乃至前記学習用第ｔ＋１オブジェクトデータコードをデコーディングして学習用第１リコンストラクト済みイメージ乃至第ｔ＋１リコンストラクト済みイメージを出力させ、前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リコンストラクト済みイメージ乃至前記学習用第ｔ＋１リコンストラクト済みイメージを参照した第１オブジェクトロス乃至第ｔ＋１オブジェクトロスを利用して前記データデコーダと前記データエンコーダとを学習させ、前記学習用第１バックグラウンドデータコード乃至前記学習用第ｕバックグラウンドデータコードを参照したバックグラウンドロスを利用して前記データエンコーダを学習させる段階；
をさらに含む、請求項１に記載の方法。

【請求項7】

（ａ２）前記アクティブラーニングデバイスが、前記学習イメージデータベースからサンプリングした検証イメージのそれぞれからオブジェクト領域をクロップして検証用第１クロップされたオブジェクトイメージ乃至検証用第ｖ（前記ｖは１以上の整数である）クロップされたオブジェクトイメージを生成し、前記検証イメージ及び前記検証イメージのそれぞれに対応する前記検証用第１クロップされたオブジェクトイメージ乃至前記検証用第ｖクロップされたオブジェクトイメージを同一のサイズにリサイズして検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｖ＋１リサイズされたオブジェクトイメージを生成し、前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｖ＋１リサイズされたオブジェクトイメージを前記データエンコーダに入力することで、前記データエンコーダをもって前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｖ＋１リサイズされたオブジェクトイメージをエンコーディングして前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｖ＋１リサイズされたオブジェクトイメージに対応する検証用第１オブジェクトデータコード乃至検証用第ｖ＋１オブジェクトデータコードを出力させ、前記検証用第１オブジェクトデータコード乃至前記検証用第ｖ＋１オブジェクトデータコードをデータコード別に分類し、それぞれのデータコードに対応するリサイズされたイメージの個数をカウンティングして前記データコードブックを生成する段階；
をさらに含む、請求項６に記載の方法。

【請求項8】

前記（ａ）段階以前に、
（ａ３）前記アクティブラーニングデバイスが、（ｉ）前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記学習イメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記学習イメージのそれぞれに対応する学習用第１フィーチャーマップ乃至学習用第ｍフィーチャーマップを生成させ、前記学習用第１フィーチャーマップ乃至前記学習用第ｍフィーチャーマップをベイジアン出力エンベディングして学習用アクティベーションエントロピーマップを生成し、前記学習用アクティベーションエントロピーマップのそれぞれからオブジェクトに対応する領域をクロップした学習用第１クロップされたアクティベーションエントロピーマップ乃至学習用第ｘ（前記ｘは１以上の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記学習用アクティベーションエントロピーマップ及び前記学習用アクティベーションエントロピーマップに対応する前記学習用第１クロップされたアクティベーションエントロピーマップ乃至前記学習用第ｘクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズして学習用第１リサイズされたアクティベーションエントロピーマップ乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記学習イメージ及び前記学習イメージからオブジェクト領域をクロップしたオブジェクトイメージを同一のサイズにリサイズした学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する学習用第１オブジェクトフィーチャーマップ乃至学習用第ｍオブジェクトフィーチャーマップを生成させ、前記学習用第１オブジェクトフィーチャーマップ乃至前記学習用第ｍオブジェクトフィーチャーマップをベイジアン出力エンベディングして前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップをモデルオートエンコーダの前記モデルエンコーダに入力することで、前記モデルエンコーダをもって前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップに対応する学習用第１モデルコード乃至学習用第ｘ＋１モデルコードを出力させ、前記学習用第１モデルコード乃至前記学習用第ｘ＋１モデルコードを前記モデルオートエンコーダのモデルデコーダに入力することで、前記モデルデコーダをもって前記学習用第１モデルコード乃至前記学習用第ｘ＋１モデルコードをデコーディングして学習用第１リコンストラクト済みエントロピーマップ乃至学習用第ｘ＋１リコンストラクト済みエントロピーマップを出力させ、前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ及び前記学習用第１リコンストラクト済みエントロピーマップ乃至前記学習用第ｘ＋１リコンストラクト済みエントロピーマップを参照した第１エントロピーロス乃至第ｘ＋１エントロピーロスを利用して前記モデルデコーダと前記モデルエンコーダとを学習させる段階；
をさらに含む、請求項１に記載の方法。

【請求項9】

（ａ４）前記アクティブラーニングデバイスが、（ｉ）前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした検証イメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記検証イメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記検証イメージのそれぞれに対応する検証用第１フィーチャーマップ乃至検証用第ｍフィーチャーマップを生成させ、前記検証用第１フィーチャーマップ乃至前記検証用第ｍフィーチャーマップをベイジアン出力エンベディングして検証用アクティベーションエントロピーマップを生成し、前記検証用アクティベーションエントロピーマップのそれぞれからオブジェクトに対応する領域をクロップした検証用第１クロップされたアクティベーションエントロピーマップ乃至検証用第ｙ（前記ｙは１以上の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記検証用アクティベーションエントロピーマップ及び前記検証用アクティベーションエントロピーマップに対応する前記検証用第１クロップされたアクティベーションエントロピーマップ乃至前記検証用第ｙクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズして検証用第１リサイズされたアクティベーションエントロピーマップ乃至検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記検証イメージ及び前記検証イメージからオブジェクト領域をクロップしたオブジェクトイメージを同一のサイズにリサイズした検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれに対応する検証用第１オブジェクトフィーチャーマップ乃至検証用第ｍオブジェクトフィーチャーマップを生成させ、前記検証用第１オブジェクトフィーチャーマップ乃至前記検証用第ｍオブジェクトフィーチャーマップをベイジアン出力エンベディングして前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップをモデルオートエンコーダの前記モデルエンコーダに入力することで、前記モデルエンコーダをもって前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップに対応する検証用第１モデルコード乃至検証用第ｙ＋１モデルコードを出力させ、前記検証用第１モデルコード乃至前記検証用第ｙ＋１モデルコードをモデルコード別に分類し、それぞれのモデルコードに対応するリサイズされたアクティベーションエントロピーマップのアベレージエントロピー値を参照することで前記モデルコードブックを生成する段階；
をさらに含む、請求項８に記載の方法。

【請求項10】

前記アクティブラーニングデバイスは、前記オブジェクトディテクタの学習及び再学習が行われる度に、前記モデルエンコーダを学習させ、前記モデルコードブックを生成する、請求項９に記載の方法。

【請求項11】

オブジェクトディテクタのためのベイジアンデュアルエンコーダ（Ｂａｙｅｓｉａｎｄｕａｌｅｎｃｏｄｅｒ）を利用したエクスプレイナブル（ｅｘｐｌａｉｎａｂｌｅ）アクティブラーニングを遂行するアクティブラーニングデバイスにおいて、
オブジェクトディテクタのためのベイジアンデュアルエンコーダを利用したエクスプレイナブルアクティブラーニングを遂行するためのインストラクションが格納されたメモリ；及び
前記メモリに格納されたインストラクションによってオブジェクトディテクタのためのベイジアンデュアルエンコーダを利用したエクスプレイナブルアクティブラーニングを遂行するプロセッサ；
を含み、
前記プロセッサは、（Ｉ）テストイメージが獲得されると、前記テストイメージをオブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれにおけるテスト用オブジェクトを検出して前記テスト用オブジェクトに対応するテスト用バウンディングボックスを出力させ、前記テストイメージのそれぞれから前記テスト用バウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたイメージ乃至テスト用第ｎ（前記ｎは１以上の整数である）クロップされたイメージを生成し、前記テストイメージ及び前記テストイメージのそれぞれに対応する前記テスト用第１クロップされたイメージ乃至前記テスト用第ｎクロップされたイメージを同一のサイズにリサイズしてテスト用第１リサイズされたイメージ乃至テスト用第ｎ＋１リサイズされたイメージを生成し、前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをデータエンコーダに入力することで、前記データエンコーダをもって前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをエンコーディングして前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージに対応するテスト用第１データコード乃至テスト用第ｎ＋１データコードを出力させるプロセス、（ＩＩ）（ｉ）前記テストイメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれをｍ（前記ｍは２以上の整数である）回モンテカルロドロップアウトを遂行して前記テストイメージのそれぞれに対応するテスト用第１フィーチャーマップ乃至テスト用第ｍフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングしてテスト用アクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップのそれぞれから前記テスト用バウンディングボックスのうちオブジェクトとして判別されたテスト用特定のバウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたアクティベーションエントロピーマップ乃至テスト用第ｏ（前記ｏはｎ以下の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップ及び前記テスト用アクティベーションエントロピーマップに対応する前記テスト用第１クロップされたアクティベーションエントロピーマップ乃至前記テスト用第ｏクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズしてテスト用第１リサイズされたアクティベーションエントロピーマップ乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージのうちオブジェクトとして判別されたテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングして前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをモデルエンコーダに入力することで、前記モデルエンコーダをもって前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップに対応するテスト用第１モデルコード乃至テスト用第ｏ＋１モデルコードを出力させるプロセス、及び（ＩＩＩ）（ｉ）前記オブジェクトディテクタの以前の学習に使用された以前の学習イメージによって生成されたデータコードブック（前記データコードブックは、前記以前の学習用イメージにおけるデータコード別リサイズされたイメージの個数を整理したものである）を参照することで、カウンタスレッショルド以下であるリサイズされたイメージの個数に対応するリファレンスデータコードを確認し、前記第１データコード乃至前記第ｎ＋１データコードのうち前記リファレンスデータコードにマッチングする第１特定のデータコードを抽出し、前記第１特定のデータコードに対応する第１特定のテストイメージを前記オブジェクトディテクタの再学習のためのレアサンプルに選定し、前記レアサンプルに対応する第２特定のデータコードを参照することで前記データコードブックをアップデートし、（ｉｉ）前記オブジェクトディテクタの再学習の以前に検証イメージによって生成されたモデルコードブック（前記モデルコードブックは、前記検証イメージにおけるモデルコード別リサイズされたアクティベーションエントロピーマップのアベレージエントロピー値を整理したものである）を参照することで、エントロピースレッショルド以上であるアベレージエントロピー値に対応するリファレンスモデルコードを確認し、前記第１モデルコード乃至前記第ｏ＋１モデルコードのうち前記リファレンスモデルコードにマッチングする特定のモデルコードを抽出し、前記特定のモデルコードに対応する第２特定のテストイメージを前記オブジェクトディテクタの再学習のためのハードサンプルに選定するプロセスを遂行する、アクティブラーニングデバイス。

【請求項12】

前記プロセッサは、（ＩＶ）以前の学習用イメージ、前記レアサンプル、及び前記ハードサンプルを利用して前記オブジェクトディテクタを再学習させるプロセスをさらに遂行する、請求項１１に記載のアクティブラーニングデバイス。

【請求項13】

前記プロセッサは、前記（ＩＩ）プロセスで、（ｉ）前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをバイナリ変換してテスト用第１バイナリフィーチャーマップ乃至テスト用第ｍバイナリフィーチャーマップを生成し、前記テスト用第１バイナリフィーチャーマップ乃至前記テスト用第ｍバイナリフィーチャーマップをコンカチネートしてテスト用アクティベーションプロバビリティマップを生成し、前記テスト用アクティベーションプロバビリティマップを参照することで前記テスト用アクティベーションエントロピーマップを生成するか、（ｉｉ）前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップをバイナリ変換して前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１バイナリオブジェクトフィーチャーマップ乃至テスト用第ｍバイナリオブジェクトフィーチャーマップを生成し、前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記テスト用第１バイナリオブジェクトフィーチャーマップ乃至前記テスト用第ｍバイナリオブジェクトフィーチャーマップをコンカチネートして前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを生成し、テスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを参照することで前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成する、請求項１１に記載のアクティブラーニングデバイス。

【請求項14】

前記プロセッサは、前記（Ｉ）プロセスで、前記テスト用バウンディングボックスのうち誤検出されたテスト用バウンディングボックスは、バックグラウンドデータコードにマッピングする、請求項１１に記載のアクティブラーニングデバイス。

【請求項15】

前記カウンタスレッショルドは、予め設定されたリサイズされたイメージの個数であるか、前記データコードブックでリサイズされたイメージの個数が高い順からｑ（前記ｑは１以上の整数である）番目に該当するスレッショルドデータコードに対応するリサイズされたイメージの個数であり、
前記エントロピースレッショルドは、予め設定されたアベレージエントロピー値であるか、前記モデルコードブックでアベレージエントロピー値が高い順からｓ（前記ｓは１以上の整数である）番目に該当するスレッショルドモデルコードに対応するアベレージエントロピー値である、請求項１に記載のアクティブラーニングデバイス。

【請求項16】

前記プロセッサは、前記（Ｉ）プロセス以前に、（Ｉ０１）前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージのそれぞれからオブジェクト領域をクロップして学習用第１クロップされたオブジェクトイメージ乃至学習用第ｔ（前記ｔは１以上の整数である）クロップされたオブジェクトイメージを生成し、前記学習イメージのそれぞれからバックグラウンド領域をクロップして学習用第１クロップされたバックグラウンドイメージ乃至学習用第ｕ（前記ｕは１以上の整数である）クロップされたバックグラウンドイメージを生成し、前記学習イメージ及び前記学習イメージのそれぞれに対応する前記学習用第１クロップされたオブジェクトイメージ乃至前記学習用第ｔクロップされたオブジェクトイメージ、及び前記学習イメージのそれぞれに対応する前記学習用第１クロップされたバックグラウンドイメージ乃至前記学習用第ｕクロップされたバックグラウンドイメージを同一のサイズにリサイズして学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｔ＋１リサイズされたオブジェクトイメージ、及び学習用第１リサイズされたバックグラウンドイメージ乃至学習用第ｕリサイズされたバックグラウンドイメージを生成し、前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージをデータオートエンコーダの前記データエンコーダに入力することで、前記データエンコーダをもって前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージをエンコーディングして前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージに対応する学習用第１オブジェクトデータコード乃至学習用第ｔ＋１オブジェクトデータコード及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージに対応する学習用第１バックグラウンドデータコード乃至学習用第ｕバックグラウンドデータコードを出力させ、前記学習用第１オブジェクトデータコード乃至前記学習用第ｔ＋１オブジェクトデータコードを前記データオートエンコーダのデータデコーダに入力することで、前記データデコーダをもって前記学習用第１オブジェクトデータコード乃至前記学習用第ｔ＋１オブジェクトデータコードをデコーディングして学習用第１リコンストラクト済みイメージ乃至第ｔ＋１リコンストラクト済みイメージを出力させ、前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リコンストラクト済みイメージ乃至前記学習用第ｔ＋１リコンストラクト済みイメージを参照した第１オブジェクトロス乃至第ｔ＋１オブジェクトロスを利用して前記データデコーダと前記データエンコーダとを学習させ、前記学習用第１バックグラウンドデータコード乃至前記学習用第ｕバックグラウンドデータコードを参照したバックグラウンドロスを利用して前記データエンコーダを学習させるプロセスをさらに遂行する、請求項１１に記載のアクティブラーニングデバイス。

【請求項17】

前記プロセッサは、（Ｉ０２）前記学習イメージデータベースからサンプリングした検証イメージのそれぞれからオブジェクト領域をクロップして検証用第１クロップされたオブジェクトイメージ乃至検証用第ｖ（前記ｖは１以上の整数である）クロップされたオブジェクトイメージを生成し、前記検証イメージ及び前記検証イメージのそれぞれに対応する前記検証用第１クロップされたオブジェクトイメージ乃至前記検証用第ｖクロップされたオブジェクトイメージを同一のサイズにリサイズして検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｖ＋１リサイズされたオブジェクトイメージを生成し、前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｖ＋１リサイズされたオブジェクトイメージを前記データエンコーダに入力することで、前記データエンコーダをもって前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｖ＋１リサイズされたオブジェクトイメージをエンコーディングして前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｖ＋１リサイズされたオブジェクトイメージに対応する検証用第１オブジェクトデータコード乃至検証用第ｖ＋１オブジェクトデータコードを出力させ、前記検証用第１オブジェクトデータコード乃至前記検証用第ｖ＋１オブジェクトデータコードをデータコード別に分類し、それぞれのデータコードに対応するリサイズされたイメージの個数をカウンティングして前記データコードブックを生成するプロセスをさらに遂行する、請求項１６に記載のアクティブラーニングデバイス。

【請求項18】

前記プロセッサは、前記（Ｉ）プロセス以前に、（Ｉ０３）（ｉ）前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記学習イメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記学習イメージのそれぞれに対応する学習用第１フィーチャーマップ乃至学習用第ｍフィーチャーマップを生成させ、前記学習用第１フィーチャーマップ乃至前記学習用第ｍフィーチャーマップをベイジアン出力エンベディングして学習用アクティベーションエントロピーマップを生成し、前記学習用アクティベーションエントロピーマップのそれぞれからオブジェクトに対応する領域をクロップした学習用第１クロップされたアクティベーションエントロピーマップ乃至学習用第ｘ（前記ｘは１以上の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記学習用アクティベーションエントロピーマップ及び前記学習用アクティベーションエントロピーマップに対応する前記学習用第１クロップされたアクティベーションエントロピーマップ乃至前記学習用第ｘクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズして学習用第１リサイズされたアクティベーションエントロピーマップ乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記学習イメージ及び前記学習イメージからオブジェクト領域をクロップしたオブジェクトイメージを同一のサイズにリサイズした学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する学習用第１オブジェクトフィーチャーマップ乃至学習用第ｍオブジェクトフィーチャーマップを生成させ、前記学習用第１オブジェクトフィーチャーマップ乃至前記学習用第ｍオブジェクトフィーチャーマップをベイジアン出力エンベディングして前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップをモデルオートエンコーダの前記モデルエンコーダに入力することで、前記モデルエンコーダをもって前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップに対応する学習用第１モデルコード乃至学習用第ｘ＋１モデルコードを出力させ、前記学習用第１モデルコード乃至前記学習用第ｘ＋１モデルコードを前記モデルオートエンコーダのモデルデコーダに入力することで、前記モデルデコーダをもって前記学習用第１モデルコード乃至前記学習用第ｘ＋１モデルコードをデコーディングして学習用第１リコンストラクト済みエントロピーマップ乃至学習用第ｘ＋１リコンストラクト済みエントロピーマップを出力させ、前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ及び前記学習用第１リコンストラクト済みエントロピーマップ乃至前記学習用第ｘ＋１リコンストラクト済みエントロピーマップを参照した第１エントロピーロス乃至第ｘ＋１エントロピーロスを利用して前記モデルデコーダと前記モデルエンコーダとを学習させるプロセスをさらに遂行する、請求項１１に記載のアクティブラーニングデバイス。

【請求項19】

前記プロセスは、（Ｉ０４）（ｉ）前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした検証イメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記検証イメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記検証イメージのそれぞれに対応する検証用第１フィーチャーマップ乃至検証用第ｍフィーチャーマップを生成させ、前記検証用第１フィーチャーマップ乃至前記検証用第ｍフィーチャーマップをベイジアン出力エンベディングして検証用アクティベーションエントロピーマップを生成し、前記検証用アクティベーションエントロピーマップのそれぞれからオブジェクトに対応する領域をクロップした検証用第１クロップされたアクティベーションエントロピーマップ乃至検証用第ｙ（前記ｙは１以上の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記検証用アクティベーションエントロピーマップ及び前記検証用アクティベーションエントロピーマップに対応する前記検証用第１クロップされたアクティベーションエントロピーマップ乃至前記検証用第ｙクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズして検証用第１リサイズされたアクティベーションエントロピーマップ乃至検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記検証イメージ及び前記検証イメージからオブジェクト領域をクロップしたオブジェクトイメージを同一のサイズにリサイズした検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれに対応する検証用第１オブジェクトフィーチャーマップ乃至検証用第ｍオブジェクトフィーチャーマップを生成させ、前記検証用第１オブジェクトフィーチャーマップ乃至前記検証用第ｍオブジェクトフィーチャーマップをベイジアン出力エンベディングして前記検証用第１リサイズされたオブジェクトイメージ乃至前記検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップをモデルオートエンコーダの前記モデルエンコーダに入力することで、前記モデルエンコーダをもって前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記検証用第１リサイズされたアクティベーションエントロピーマップ乃至前記検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップに対応する検証用第１モデルコード乃至検証用第ｙ＋１モデルコードを出力させ、前記検証用第１モデルコード乃至前記検証用第ｙ＋１モデルコードをモデルコード別に分類し、それぞれのモデルコードに対応するリサイズされたアクティベーションエントロピーマップのアベレージエントロピー値を参照することで前記モデルコードブックを生成するプロセスをさらに遂行する、請求項１８に記載のアクティブラーニングデバイス。

【請求項20】

前記プロセッサは、前記オブジェクトディテクタの学習及び再学習が行われる度に、前記モデルエンコーダを学習させ、前記モデルコードブックを生成する、請求項１９に記載のアクティブラーニングデバイス。

【発明の詳細な説明】

【技術分野】

【0001】

本出願は、２０２０年５月８日に米国特許庁に出願された米国特許出願第６３／０２１，８０９号及び２０２０年１２月２８日に米国特許庁に出願された米国特許出願第１７／１３５，０３３号に基づいて出願され、これに対して優先権を主張し、その全体内容が参照として本明細書に含まれる。

【0002】

本発明は、オブジェクトディテクションのためのアクティブラーニング（ａｃｔｉｖｅｌｅａｎｉｎｇ）方法及びそれを利用したアクティブラーニング装置に関し、より詳細には、イメージ上に特定の類型のオブジェクトが登場するか否か及びイメージのシーン（ｓｃｅｎｅ）特性を反映し、アクティブラーニングによってイメージを選択した理由を知ることができるようにし、これによって特定の類型のイメージをサンプリングすることができるようにするオブジェクトディテクタのためのベイシアンデュアルオートエンコーダ（Ｂａｙｅｓｉａｎｄｕａｌａｕｔｏｅｎｃｏｄｅｒ）を利用したエクスプレイナブル（ｅｘｐｌａｉｎａｂｌｅ）アクティブラーニング方法及びそれを利用したアクティブラーニングデバイスに関する。

【背景技術】

【0003】

最近、マシンラーニング（ｍａｃｈｉｎｅｌｅａｒｎｉｎｇ）を利用して物体の識別などを遂行する方法に対する研究が行われている。

【0004】

このようなマシンラーニングのうちの一つとして、インプットレイヤ（ｉｎｐｕｔｌａｙｅｒ）とアウトプットレイヤ（ｏｕｔｐｕｔｌａｙｅｒ）との間に複数のヒドゥンレイヤ（ｈｉｄｄｅｎｌａｙｅｒ）を有する神経網を利用したマシンラーニング（ｍａｃｈｉｎｅｌｅａｒｎｉｎｇ）であるディープラーニング（ｄｅｅｐｌｅａｒｎｉｎｇ）は、高い識別性能を有している。

【0005】

そして、ディープラーニングを利用するニューラルネットワーク（ｎｅｕｒａｌｎｅｔｗｏｒｋ）は、一般的にロス（ｌｏｓｓ）を利用したバックプロパゲーション（ｂａｃｋｐｒｏｐａｇａｔｉｏｎ）を通じて学習をする。

【0006】

このようなディープラーニングネットワークの学習のために、従来は、データ収集政策に従ってロー（ｒａｗ）データを収集し、ヒューマンラベラーが収集されたローデータをアノテーション（ａｎｎｏｔａｔｉｏｎ）することで新しいトレーニングデータを生成する。以後、新しいトレーニングデータと既存のトレーニングデータとを利用してディープラーニングネットワークを学習させた後、ヒューマンエンジニアが性能を分析した結果を参照することで、ディープラーニングネットワークの学習のための学習アルゴリズムを修正及び改善する。また、分析した結果を参照することで、データ収集政策を変更し、誤ったアノテーションがあるか否かを再検査し、修正する。

【0007】

しかし、ディープラーニングネットワークの性能が良くなる程、学習に有用なハードエグザンプル（ｈａｒｄｅｘａｍｐｌｅ）は希少となるため、新しいトレーニングデータによるディープラーニングネットワークの性能向上効果が減少するだけでなく、ラベルされたイメージに対するデータベースが大きくなる程、ディープラーニングネットワークの性能向上効果が減少し、それに応じて、ヒューマンラベラーによるデータアノテーションの投資収益が減少する。

【0008】

一方、このような問題点を解決するために、従来は、収集されたすべてのアンラベルされた（ｕｎｌａｂｅｌｅｄ）イメージをラベリングする代わりに、ラベルされたイメージを格納するデータベースのサイズ及び学習させようとするモデル性能などの、現在の状況で効果が大きいと予想されるアンラベルされたイメージのみを選び、ラベリングするアクティブラーニング技術が利用されている。

【0009】

このような従来のアクティブラーニング技術においては、データ分布の観点からまれに獲得可能なデータを重要に取り扱っており、このために様々なサブスペース（ｓｕｂｓｐａｃｅｓ）またはパーティション（ｐａｒｔｉｔｉｏｎｓ）からのクエリング（ｑｕｅｒｙｉｎｇ）、探索（ｅｘｐｌｏｒａｔｉｏｎ）と利用（ｅｘｐｌｏｉｔａｔｉｏｎ）との間のバランス（ｂａｌａｎｃｅ）などが利用されている。

【0010】

様々なサブスペースまたはパーティションからのクエリングでは、オリジナルフィーチャー（ｆｅａｔｕｒｅ）スペースのオーバーラッピングされないか、最小限にオーバーラッピングされるパーティションからアンラベルされたデータを選択する。そして、探索と利用との間のバランスでは、エグザンプルの選択は、データスペースの表現（ｒｅｐｒｅｓｅｎｔ）に対する探索と利用との間のジレンマと見なされる。各ラウンド（ｒｏｕｎｄ）で、この接近方式はプール（ｐｏｏｌ）にサンプリング分布を割り当て、この分布から一地点をサンプリングする。

【0011】

また、従来のアクティブラーニング技術においては、イメージを認識するためのニューラルネットワークモデルの観点から難しいデータ、即ち、データの種類がレア（ｒａｒｅ）であるため、ニューラルネットワークモデルにおける学習が不十分だったデータであるか、本来からニューラルネットワークモデルで認識し難いデータを重要に取り扱っており、このためにコミッティ（ｃｏｍｍｉｔｔｅｅ）によるクエリ、アンサーティンティ（ｕｎｃｅｒｔａｉｎｔｙ）サンプリングなどが利用されている。

【0012】

コミッティによるクエリでは、様々なモデル（コミッティ）が出力に対して投票し、最も同意しないアンラベルされたデータを選択する。

【0013】

そして、アンサーティンティサンプリングでは、正しい出力が何であるかに対して現在モデルが一例として、クラシフィケーションのためのソフトマックス（ｓｏｆｔｍａｘ）出力スコアの側面で、最も確実でないアンラベルされたデータを選択する。

【0014】

しかし、従来のアクティブラーニング技術は、クラシフィケーションの問題に限定されている。

【0015】

即ち、従来のアクティブラーニング技術は、クラシフィケーションの問題では、与えられたＨ×Ｗの大きさのイメージ全体をフィーチャースペースにマッピングすることで、全体的に類似したシーン同士が同一のサブスペースに属するようにしている。

【0016】

しかし、従来のアクティブラーニング技術は、オブジェクトディテクションの問題では、レアイメージを判別することが困難である。

【0017】

一例として、類似した距離シーンで、歩行者の有無によって互いに異なるサブスペースにマッピングしなければならないが、従来のアクティブラーニング技術は、同一のサブスペースに分類するという問題点がある。

【0018】

また、従来のアクティブラーニング技術は、ストップサイン（ｓｔｏｐｓｉｇｎ）が登場するイメージの場合、全体のイメージ内で極めて小さい領域のみで他のサブスペースにマッピングすることができないという短所がある。

【0019】

即ち、１９２０×１０８０の大きさのイメージ内でストップサインが存在する領域は、５０×５０の大きさ、１００×１００の大きさなど、極めて小さい領域に属し、仮りに、ストップサインが登場するイメージを選ぶとすると、該当領域を除いた他の部分は全て無視しなければならないが、従来のアクティブラーニング技術ではこれを具現することができないという短所がある。

【0020】

特に、従来のアクティブラーニングは、データ分布の観点から、まれだといって必らず性能が悪いものではなく、小さいオブジェクト、暗い環境などのように頻繁に登場するが難しい場合もあり得る。また、ハードサブスペースである場合、イージー（ｅａｓｙ）サブスペースよりも多く選択しなければならないが、どのくらい多く選択するかに対する最適なバランスを見つけることが容易ではない。

【0021】

そして、アンサーティンティサンプリングにおいて、主にモデルがオーバーフィッティング（ｏｖｅｒｆｉｔｔｉｎｇ）された場合、１００％に近い確信を持って誤答を下す場合も多いが、このようなハードエグザンプルは全く選び出せないという問題点がある。

【0022】

一方、コミッティによるクエリでは、特定のサブスペースで複数のモデルが全部オーバーフィッティングまたはアンダーフィッティング（ｕｎｄｅｒｆｉｔｔｉｎｇ）された可能性は低いため、ハードエグザンプルをもう少しよく見つけ出せるという長所があるが、我々が学習しようとするニューラルネットワークモデルは通常１個であるのに対し、コミッティによるクエリは、複数のモデルの間の出力ミスマッチ（ｍｉｓｍａｔｃｈ）を通じて一般的なハードエグザンプルを見つけるため、ターゲットモデル固有の現在の弱点、一例として、オーバーフィッティングまたはアンダーフィッティングサブスペースを見つけることができないという問題点がある。

【発明の概要】

【発明が解決しようとする課題】

【0023】

本発明は、上述した問題点を全て解決することをその目的とする。

【0024】

本発明は、アクティブラーニングにおいて、オブジェクトの類型によるレアサンプルを容易に獲得することを他の目的とする。

【0025】

本発明は、アクティブラーニングにおいて、特定の類型のオブジェクトが登場するか否か及び全体のシーンの特性を反映したレアサンプルを獲得することをさらに他の目的とする。

【0026】

本発明は、アクティブラーニングにおいて、レアサンプルを選択した理由を容易に確認可能にすることをさらに他の目的とする。

【0027】

本発明は、アクティブラーニングにおいて、獲得されたレアサンプルから特定の類型のアンラベルされたイメージのみを容易に選択することをさらに他の目的とする。

【0028】

本発明は、アクティブラーニングにおいて、データ分布の観点からのレアサンプルとモデルの観点からのハードサンプルとを容易に獲得することをさらに他の目的とする。

【課題を解決するための手段】

【0029】

本発明の一実施例によると、オブジェクトディテクタのためのベイジアンデュアルエンコーダ（Ｂａｙｅｓｉａｎｄｕａｌｅｎｃｏｄｅｒ）を利用したエクスプレイナブル（ｅｘｐｌａｉｎａｂｌｅ）アクティブラーニング方法において、（ａ）テストイメージが獲得されると、アクティブラーニングデバイスが、前記テストイメージをオブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれにおけるテスト用オブジェクトを検出して前記テスト用オブジェクトに対応するテスト用バウンディングボックスを出力させ、前記テストイメージのそれぞれから前記テスト用バウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたイメージ乃至テスト用第ｎ（前記ｎは１以上の整数である）クロップされたイメージを生成し、前記テストイメージ及び前記テストイメージのそれぞれに対応する前記テスト用第１クロップされたイメージ乃至前記テスト用第ｎクロップされたイメージを同一のサイズにリサイズしてテスト用第１リサイズされたイメージ乃至テスト用第ｎ＋１リサイズされたイメージを生成し、前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをデータエンコーダに入力することで、前記データエンコーダをもって前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをエンコーディングして前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージに対応するテスト用第１データコード乃至テスト用第ｎ＋１データコードを出力させる段階；（ｂ）前記アクティブラーニングデバイスが、（ｉ）前記テストイメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれをｍ（前記ｍは２以上の整数である）回モンテカルロドロップアウトを遂行して前記テストイメージのそれぞれに対応するテスト用第１フィーチャーマップ乃至テスト用第ｍフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングしてテスト用アクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップのそれぞれから前記テスト用バウンディングボックスのうちオブジェクトとして判別されたテスト用特定のバウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたアクティベーションエントロピーマップ乃至テスト用第ｏ（前記ｏはｎ以下の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップ及び前記テスト用アクティベーションエントロピーマップに対応する前記テスト用第１クロップされたアクティベーションエントロピーマップ乃至前記テスト用第ｏクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズしてテスト用第１リサイズされたアクティベーションエントロピーマップ乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージのうちオブジェクトとして判別されたテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングして前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをモデルエンコーダに入力することで、前記モデルエンコーダをもって前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップに対応するテスト用第１モデルコード乃至テスト用第ｏ＋１モデルコードを出力させる段階；及び（ｃ）前記アクティブラーニングデバイスが、（ｉ）前記オブジェクトディテクタの以前の学習に使用された以前の学習イメージによって生成されたデータコードブック（前記データコードブックは、前記以前の学習用イメージにおけるデータコード別リサイズされたイメージの個数を整理したものである）を参照することで、カウンタスレッショルド以下であるリサイズされたイメージの個数に対応するリファレンスデータコードを確認し、前記第１データコード乃至前記第ｎ＋１データコードのうち前記リファレンスデータコードにマッチングする第１特定のデータコードを抽出し、前記第１特定のデータコードに対応する第１特定のテストイメージを前記オブジェクトディテクタの再学習のためのレアサンプルに選定し、前記レアサンプルに対応する第２特定のデータコードを参照することで前記データコードブックをアップデートし、（ｉｉ）前記オブジェクトディテクタの再学習の以前に検証イメージによって生成されたモデルコードブック（前記モデルコードブックは、前記検証イメージにおけるモデルコード別リサイズされたアクティベーションエントロピーマップのアベレージエントロピー値を整理したものである）を参照することで、エントロピースレッショルド以上であるアベレージエントロピー値に対応するリファレンスモデルコードを確認し、前記第１モデルコード乃至前記第ｏ＋１モデルコードのうち前記リファレンスモデルコードにマッチングする特定のモデルコードを抽出し、前記特定のモデルコードに対応する第２特定のテストイメージを前記オブジェクトディテクタの再学習のためのハードサンプルに選定する段階；を含む方法が提供される。

【0030】

（ｄ）前記アクティブラーニングデバイスは、前記以前の学習用イメージ、前記レアサンプル、及び前記ハードサンプルを利用して前記オブジェクトディテクタを再学習させる段階；をさらに含む。

【0031】

前記（ｂ）段階で、前記アクティブラーニングデバイスは、（ｉ）前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをバイナリ変換してテスト用第１バイナリフィーチャーマップ乃至テスト用第ｍバイナリフィーチャーマップを生成し、前記テスト用第１バイナリフィーチャーマップ乃至前記テスト用第ｍバイナリフィーチャーマップをコンカチネートしてテスト用アクティベーションプロバビリティマップを生成し、前記テスト用アクティベーションプロバビリティマップを参照することで前記テスト用アクティベーションエントロピーマップを生成するか、（ｉｉ）前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップをバイナリ変換して前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１バイナリオブジェクトフィーチャーマップ乃至テスト用第ｍバイナリオブジェクトフィーチャーマップを生成し、前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記テスト用第１バイナリオブジェクトフィーチャーマップ乃至前記テスト用第ｍバイナリオブジェクトフィーチャーマップをコンカチネートして前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを生成し、テスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを参照することで前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成する。

【0032】

前記（ａ）段階で、前記アクティブラーニングデバイスは、前記テスト用バウンディングボックスのうち誤検出されたテスト用バウンディングボックスは、バックグラウンドデータコードにマッピングする。

【0033】

前記（ｃ）段階で、前記カウンタスレッショルドは、予め設定されたリサイズされたイメージの個数であるか、前記データコードブックでリサイズされたイメージの個数が高い順からｑ（前記ｑは１以上の整数である）番目に該当するスレッショルドデータコードに対応するリサイズされたイメージの個数であり、前記エントロピースレッショルドは、予め設定されたアベレージエントロピー値であるか、前記モデルコードブックでアベレージエントロピー値が高い順からｓ（前記ｓは１以上の整数である）番目に該当するスレッショルドモデルコードに対応するアベレージエントロピー値である。

【0034】

前記（ａ）段階以前に、（ａ１）前記アクティブラーニングデバイスが、前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージのそれぞれからオブジェクト領域をクロップして学習用第１クロップされたオブジェクトイメージ乃至学習用第ｔ（前記ｔは１以上の整数である）クロップされたオブジェクトイメージを生成し、前記学習イメージのそれぞれからバックグラウンド領域をクロップして学習用第１クロップされたバックグラウンドイメージ乃至学習用第ｕ（前記ｕは１以上の整数である）クロップされたバックグラウンドイメージを生成し、前記学習イメージ及び前記学習イメージのそれぞれに対応する前記学習用第１クロップされたオブジェクトイメージ乃至前記学習用第ｔクロップされたオブジェクトイメージ、及び前記学習イメージのそれぞれに対応する前記学習用第１クロップされたバックグラウンドイメージ乃至前記学習用第ｕクロップされたバックグラウンドイメージを同一のサイズにリサイズして学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｔ＋１リサイズされたオブジェクトイメージ、及び学習用第１リサイズされたバックグラウンドイメージ乃至学習用第ｕリサイズされたバックグラウンドイメージを生成し、前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージをデータオートエンコーダの前記データエンコーダに入力することで、前記データエンコーダをもって前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージをエンコーディングして前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージに対応する学習用第１オブジェクトデータコード乃至学習用第ｔ＋１オブジェクトデータコード及び前記学習用第１リサイズされたバックグラウンドイメージ乃至前記学習用第ｕリサイズされたバックグラウンドイメージに対応する学習用第１バックグラウンドデータコード乃至学習用第ｕバックグラウンドデータコードを出力させ、前記学習用第１オブジェクトデータコード乃至前記学習用第ｔ＋１オブジェクトデータコードを前記データオートエンコーダのデータデコーダに入力することで、前記データデコーダをもって前記学習用第１オブジェクトデータコード乃至前記学習用第ｔ＋１オブジェクトデータコードをデコーディングして学習用第１リコンストラクト済みイメージ乃至第ｔ＋１リコンストラクト済みイメージを出力させ、前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｔ＋１リサイズされたオブジェクトイメージ及び前記学習用第１リコンストラクト済みイメージ乃至前記学習用第ｔ＋１リコンストラクト済みイメージを参照した第１オブジェクトロス乃至第ｔ＋１オブジェクトロスを利用して前記データデコーダと前記データエンコーダとを学習させ、前記学習用第１バックグラウンドデータコード乃至前記学習用第ｕバックグラウンドデータコードを参照したバックグラウンドロスを利用して前記データエンコーダを学習させる段階；をさらに含む。

【0035】

【0036】

前記（ａ）段階以前に、（ａ３）前記アクティブラーニングデバイスが、（ｉ）前記オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記学習イメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記学習イメージのそれぞれに対応する学習用第１フィーチャーマップ乃至学習用第ｍフィーチャーマップを生成させ、前記学習用第１フィーチャーマップ乃至前記学習用第ｍフィーチャーマップをベイジアン出力エンベディングして学習用アクティベーションエントロピーマップを生成し、前記学習用アクティベーションエントロピーマップのそれぞれからオブジェクトに対応する領域をクロップした学習用第１クロップされたアクティベーションエントロピーマップ乃至学習用第ｘ（前記ｘは１以上の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記学習用アクティベーションエントロピーマップ及び前記学習用アクティベーションエントロピーマップに対応する前記学習用第１クロップされたアクティベーションエントロピーマップ乃至前記学習用第ｘクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズして学習用第１リサイズされたアクティベーションエントロピーマップ乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記学習イメージ及び前記学習イメージからオブジェクト領域をクロップしたオブジェクトイメージを同一のサイズにリサイズした学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する学習用第１オブジェクトフィーチャーマップ乃至学習用第ｍオブジェクトフィーチャーマップを生成させ、前記学習用第１オブジェクトフィーチャーマップ乃至前記学習用第ｍオブジェクトフィーチャーマップをベイジアン出力エンベディングして前記学習用第１リサイズされたオブジェクトイメージ乃至前記学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップをモデルオートエンコーダの前記モデルエンコーダに入力することで、前記モデルエンコーダをもって前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップに対応する学習用第１モデルコード乃至学習用第ｘ＋１モデルコードを出力させ、前記学習用第１モデルコード乃至前記学習用第ｘ＋１モデルコードを前記モデルオートエンコーダのモデルデコーダに入力することで、前記モデルデコーダをもって前記学習用第１モデルコード乃至前記学習用第ｘ＋１モデルコードをデコーディングして学習用第１リコンストラクト済みエントロピーマップ乃至学習用第ｘ＋１リコンストラクト済みエントロピーマップを出力させ、前記学習用第１リサイズされたアクティベーションエントロピーマップ乃至前記学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ及び前記学習用第１リコンストラクト済みエントロピーマップ乃至前記学習用第ｘ＋１リコンストラクト済みエントロピーマップを参照した第１エントロピーロス乃至第ｘ＋１エントロピーロスを利用して前記モデルデコーダと前記モデルエンコーダとを学習させる段階；をさらに含む。

【0037】

【0038】

前記アクティブラーニングデバイスは、前記オブジェクトディテクタの学習及び再学習が行われる度に、前記モデルエンコーダを学習させ、前記モデルコードブックを生成する。

【0039】

また、本発明の他の実施例によると、オブジェクトディテクタのためのベイジアンデュアルエンコーダ（Ｂａｙｅｓｉａｎｄｕａｌｅｎｃｏｄｅｒ）を利用したエクスプレイナブル（ｅｘｐｌａｉｎａｂｌｅ）アクティブラーニングを遂行するアクティブラーニングデバイスにおいて、オブジェクトディテクタのためのベイジアンデュアルエンコーダを利用したエクスプレイナブルアクティブラーニングを遂行するためのインストラクションが格納されたメモリ；及び前記メモリに格納されたインストラクションによってオブジェクトディテクタのためのベイジアンデュアルエンコーダを利用したエクスプレイナブルアクティブラーニングを遂行するプロセッサ；を含み、前記プロセッサは、（Ｉ）テストイメージが獲得されると、前記テストイメージをオブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれにおけるテスト用オブジェクトを検出して前記テスト用オブジェクトに対応するテスト用バウンディングボックスを出力させ、前記テストイメージのそれぞれから前記テスト用バウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたイメージ乃至テスト用第ｎ（前記ｎは１以上の整数である）クロップされたイメージを生成し、前記テストイメージ及び前記テストイメージのそれぞれに対応する前記テスト用第１クロップされたイメージ乃至前記テスト用第ｎクロップされたイメージを同一のサイズにリサイズしてテスト用第１リサイズされたイメージ乃至テスト用第ｎ＋１リサイズされたイメージを生成し、前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをデータエンコーダに入力することで、前記データエンコーダをもって前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージをエンコーディングして前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージに対応するテスト用第１データコード乃至テスト用第ｎ＋１データコードを出力させるプロセス、（ＩＩ）（ｉ）前記テストイメージを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テストイメージのそれぞれをｍ（前記ｍは２以上の整数である）回モンテカルロドロップアウトを遂行して前記テストイメージのそれぞれに対応するテスト用第１フィーチャーマップ乃至テスト用第ｍフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングしてテスト用アクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップのそれぞれから前記テスト用バウンディングボックスのうちオブジェクトとして判別されたテスト用特定のバウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたアクティベーションエントロピーマップ乃至テスト用第ｏ（前記ｏはｎ以下の整数である）クロップされたアクティベーションエントロピーマップを生成し、前記テスト用アクティベーションエントロピーマップ及び前記テスト用アクティベーションエントロピーマップに対応する前記テスト用第１クロップされたアクティベーションエントロピーマップ乃至前記テスト用第ｏクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズしてテスト用第１リサイズされたアクティベーションエントロピーマップ乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成するか、（ｉｉ）前記テスト用第１リサイズされたイメージ乃至前記テスト用第ｎ＋１リサイズされたイメージのうちオブジェクトとして判別されたテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれを前記オブジェクトディテクタに入力することで、前記オブジェクトディテクタをもって前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップを生成させ、前記テスト用第１フィーチャーマップ乃至前記テスト用第ｍフィーチャーマップをベイジアン出力エンベディングして前記テスト用第１リサイズされたオブジェクトイメージ乃至前記テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応する前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成し、前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをモデルエンコーダに入力することで、前記モデルエンコーダをもって前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップをエンコーディングして前記テスト用第１リサイズされたアクティベーションエントロピーマップ乃至前記テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップに対応するテスト用第１モデルコード乃至テスト用第ｏ＋１モデルコードを出力させるプロセス、及び（ＩＩＩ）（ｉ）前記オブジェクトディテクタの以前の学習に使用された以前の学習イメージによって生成されたデータコードブック（前記データコードブックは、前記以前の学習用イメージにおけるデータコード別リサイズされたイメージの個数を整理したものである）を参照することで、カウンタスレッショルド以下であるリサイズされたイメージの個数に対応するリファレンスデータコードを確認し、前記第１データコード乃至前記第ｎ＋１データコードのうち前記リファレンスデータコードにマッチングする第１特定のデータコードを抽出し、前記第１特定のデータコードに対応する第１特定のテストイメージを前記オブジェクトディテクタの再学習のためのレアサンプルに選定し、前記レアサンプルに対応する第２特定のデータコードを参照することで前記データコードブックをアップデートし、（ｉｉ）前記オブジェクトディテクタの再学習の以前に検証イメージによって生成されたモデルコードブック（前記モデルコードブックは、前記検証イメージにおけるモデルコード別リサイズされたアクティベーションエントロピーマップのアベレージエントロピー値を整理したものである）を参照することで、エントロピースレッショルド以上であるアベレージエントロピー値に対応するリファレンスモデルコードを確認し、前記第１モデルコード乃至前記第ｏ＋１モデルコードのうち前記リファレンスモデルコードにマッチングする特定のモデルコードを抽出し、前記特定のモデルコードに対応する第２特定のテストイメージを前記オブジェクトディテクタの再学習のためのハードサンプルに選定するプロセスを遂行する、アクティブラーニングデバイスが提供される。

【0040】

前記プロセッサは、（ＩＶ）以前の学習用イメージ、前記レアサンプル、及び前記ハードサンプルを利用して前記オブジェクトディテクタを再学習させるプロセスをさらに遂行する。

【0041】

【0042】

前記プロセッサは、前記（Ｉ）プロセスで、前記テスト用バウンディングボックスのうち誤検出されたテスト用バウンディングボックスは、バックグラウンドデータコードにマッピングする。

【0043】

前記カウンタスレッショルドは、予め設定されたリサイズされたイメージの個数であるか、前記データコードブックでリサイズされたイメージの個数が高い順からｑ（前記ｑは１以上の整数である）番目に該当するスレッショルドデータコードに対応するリサイズされたイメージの個数であり、前記エントロピースレッショルドは、予め設定されたアベレージエントロピー値であるか、前記モデルコードブックでアベレージエントロピー値が高い順からｓ（前記ｓは１以上の整数である）番目に該当するスレッショルドモデルコードに対応するアベレージエントロピー値である。

【0044】

【0045】

【0046】

【0047】

【0048】

前記プロセッサは、前記オブジェクトディテクタの学習及び再学習が行われる度に、前記モデルエンコーダを学習させ、前記モデルコードブックを生成する。

【発明の効果】

【0049】

本発明は、アクティブラーニングにおいて、オブジェクトディテクタとベイジアンデュアルオートエンコーダとを共に利用してフィーチャースペースをマッピングすることでオブジェクトの類型によるレアサンプルを容易に獲得することができる。

【0050】

本発明は、アクティブラーニングにおいて、オブジェクトディテクタとベイジアンデュアルオートエンコーダとを共に利用してフィーチャースペースをマッピングすることで特定の類型のオブジェクトが登場するか否か及び全体のシーンの特性を反映したレアサンプルを獲得することができる。

【0051】

本発明は、アクティブラーニングにおいて、オブジェクトディテクタとベイジアンデュアルオートエンコーダとを共に利用してフィーチャースペースをマッピングし、コード化することによってレアサンプルを選択した理由を容易に確認可能になる。

【0052】

本発明は、アクティブラーニングにおいて、オブジェクトディテクタとベイジアンデュアルオートエンコーダとを共に利用してフィーチャースペースをマッピングし、コード化することによって特定の類型のイメージサンプルのみを容易に選択することができる。

【0053】

本発明は、アクティブラーニングにおいて、データ分布の観点からのレアサンプルとモデルの観点からのハードサンプルとを容易に獲得することができる。

【図面の簡単な説明】

【0054】

本発明の実施例の説明に利用されるために添付された以下の各図面は、本発明の実施例のうち単に一部であるに過ぎず、本発明の属する技術分野において通常の知識を有する者（以下「通常の技術者」）にとっては、発明的作業が行われずにこれらの図面に基づいて他の各図面が得られ得る。

【0055】

【図1】図１は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニングを遂行するアクティブラーニングデバイスを簡略に示した図面である。

【図2】図２は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法を簡略に示した図面である。

【図3】図３は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法でアクティベーションエントロピーマップ（ａｃｔｉｖａｔｉｏｎｅｎｔｒｏｐｙｍａｐ）を生成する過程を簡略に示した図面である。

【図4】図４は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法でコードブック（ｃｏｄｅｂｏｏｋ）を利用してオブジェクトディテクタの学習のためのサンプルイメージを選定する過程を簡略に示した図面である。

【図5】図５は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法でコードブックに応じた学習イメージの選択理由を説明する状態を簡略に示した図面である。

【図6】図６は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法でデータエンコーダを学習する過程を簡略に示した図面である。

【図7】図７は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法でデータコードブックを生成する過程を簡略に示した図面である。

【図8】図８は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法でモデルエンコーダを学習する過程を簡略に示した図面である。

【図9】図９は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法でモデルコードブックを生成する過程を簡略に示した図面である。

【発明を実施するための形態】

【0056】

後述する本発明に関する詳細な説明は、本発明の各目的、各技術的解法、及び各長所を明らかにするために本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、通常の技術者が本発明を実施することができるように十分詳細に説明される。

【0057】

また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴若しくは各付加物、構成要素又は段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本明細書から、また一部は、本発明の実施から明らかになるであろう。以下の例示及び図面は実例として提供され、本発明を限定することを意図したものではない。

【0058】

さらに、本発明は、本明細書に示された実施例のすべての可能な組合せを網羅する。本発明の多様な実施例は互いに異なるが、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の形状、構造及び特性は、一実施例に関連して本発明の精神及び範囲を逸脱せず、かつ他の実施例で具現され得る。また、それぞれの開示された実施例内の個別の構成要素の位置又は配置は、本発明の精神及び範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述の詳細な説明は、限定的な意味として受け取られるものではなく、本発明の範囲は適切に説明されるのであれば、その請求項が主張することと均等な全ての範囲とともに添付された請求項によってのみ限定される。図面において類似の参照符号は、様々な態様にわたって同一であるか、又は類似の機能を指す。

【0059】

以下、本発明の属する技術分野において通常の知識を有する者が本発明を容易に実施し得るようにするために、本発明の好ましい実施例について、添付された図面を参照して詳細に説明することにする。

【0060】

図１は、本発明の一実施例において、オブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニングを遂行するアクティブラーニングデバイスを簡略に示した図面であり、図１を参照すると、アクティブラーニングデバイス１０００は、オブジェクトディテクタの学習に使用するための学習イメージをサンプリングするためにベイジアンデュアルオートエンコーダを利用してエクスプレイナブルアクティブラーニングを遂行するためのインストラクションが格納されたメモリ１００１と、メモリ１００１に格納されたインストラクションによってオブジェクトディテクタの学習に使用するための学習イメージをサンプリングするためにベイジアンデュアルオートエンコーダを利用してエクスプレイナブルアクティブラーニングを遂行するプロセッサ１００２とを含むことができる。

【0061】

具体的に、アクティブラーニングデバイス１０００は、コンピューティング装置（例えば、コンピュータプロセッサ、メモリ、ストレージ、入力装置及び出力装置、その他既存のコンピューティング装置の構成要素を含むことができる装置；ルータ、スイッチなどのような電子通信装置；ネットワーク接続ストレージ（ＮＡＳ）及びストレージ領域ネットワーク（ＳＡＮ）のような電子情報ストレージシステム）及びコンピュータソフトウェア（即ち、コンピューティング装置をもって特定の方式で機能させる各インストラクション）の組合せを利用して所望のシステム性能を達成するものであり得る。

【0062】

また、コンピューティング装置のプロセッサはＭＰＵ（ＭｉｃｒｏＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）またはＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）、キャッシュメモリ（ＣａｃｈｅＭｅｍｏｒｙ）、データバス（ＤａｔａＢｕｓ）などのハードウェア構成を含むことができる。また、コンピューティング装置はオペレーティングシステム、特定の目的を遂行するアプリケーションのソフトウェア構成をさらに含むことができる。

【0063】

しかし、コンピューティング装置が本発明を実施するためのミディアム、プロセッサ及びメモリが統合された形態である統合プロセッサを含む場合を排除するわけではない。

【0064】

このように構成されたアクティブラーニングデバイス１０００を利用してオブジェクトディテクタのためのベイジアンデュアルオートエンコーダを利用したエクスプレイナブルアクティブラーニング方法について図２を参照して説明すると以下の通りである。

【0065】

まず、テストイメージが獲得されると、アクティブラーニングデバイス１０００が、前記テストイメージをオブジェクトディテクタ２００に入力することで、前記オブジェクトディテクタ２００をもって前記テストイメージのそれぞれにおけるテスト用オブジェクトを検出して前記テスト用オブジェクトに対応するテスト用バウンディングボックスを出力させることができる。また、オブジェクトディテクタ２００は、テスト用オブジェクトに対応するテスト用クラス情報及びテスト用オブジェクトに関する様々なディテクション情報を出力することができる。

【0066】

この際、オブジェクトディテクタ２００は、ディテクションスレッショルド（ｔｈｒｅｓｈｏｌｄ）を低く設定することで、テストイメージにおけるフォアグラウンド（ｆｏｒｅｇｒｏｕｎｄ）クラススコアが低いバウンディングボックスも含めてできるだけ多くのテスト用バウンディングボックスを検出することができるようにする。これにより、実際には登場するオブジェクトを登場しないものと誤って判断する場合をできるだけ防止することができ、特に、検出し難い類型のオブジェクトを検出することができるようになる。

【0067】

そして、オブジェクトディテクタ２００は、入力されるイメージ上に位置するオブジェクトを検出するように予め学習された状態であり得る。

【0068】

また、テストイメージは、オブジェクトディテクタ２００がインストールされた装置と連係したイメージキャプチャ（ｃａｐｔｕｒｅ）装置から獲得されたイメージであるか、オブジェクトディテクタ２００が遂行しようとするタスク（ｔａｓｋ）に関して収集されたイメージであり得、学習イメージに利用するためのラベリングが遂行されていないアンラベルされたイメージであり得る。

【0069】

一例として、テストイメージは、自動車の走行中のカメラ、ライダ、レーダなどを通じて獲得された走行イメージであり得る。

【0070】

次に、アクティブラーニングデバイス１０００は、テストイメージのそれぞれからテスト用バウンディングボックスに対応する領域をクロップ（ｃｒｏｐ）したテスト用第１クロップされたイメージ乃至テスト用第ｎクロップされたイメージを生成し、テストイメージ及びテストイメージのそれぞれに対応するテスト用第１クロップされたイメージ乃至テスト用第ｎクロップされたイメージを同一のサイズにリサイズ（ｒｅｓｉｚｅ）してテスト用第１リサイズされた（ｒｅｓｉｚｅｄ）イメージ２１０＿１乃至テスト用第ｎ＋１リサイズされたイメージ２１０＿（ｎ＋１）を生成することができる。前記ｎは１以上の整数であり得る。

【0071】

次に、アクティブラーニングデバイス１０００は、テスト用第１リサイズされたイメージ２１０＿１乃至テスト用第ｎ＋１リサイズされたイメージ２１０＿（ｎ＋１）をデータエンコーダ３１０に入力することで、データエンコーダ３１０をもってテスト用第１リサイズされたイメージ２１０＿１乃至テスト用第ｎ＋１リサイズされたイメージ２１０＿（ｎ＋１）をエンコーディングしてテスト用第１リサイズされたイメージ２１０＿１乃至テスト用第ｎ＋１リサイズされたイメージ２１０＿（ｎ＋１）に対応するテスト用第１データコード乃至テスト用第ｎ＋１データコードを出力させることができる。

【0072】

この際、アクティブラーニングデバイス１０００は、データエンコーダ３１０の出力にシグモイド（ｓｉｇｍｏｉｄ）などのようなアクティベーション関数（ａｃｔｉｖａｔｉｏｎｆｕｎｃｔｉｏｎ）を適用してテスト用第１データコード乃至テスト用第ｎ＋１データコードを獲得することもできる。

【0073】

そして、データコードはｄ－ディメンションの［０，１］レンジ（ｒａｎｇｅ）で表現され得、それぞれのリサイズされたイメージに対するサブスペースとなり得る。そして、バックグラウンド（ｂａｃｋｇｒｏｕｎｄ）領域に対応するデータコードはａｌｌｚｅｒｏ（オールゼロ）で表現され得る。また、誤検出されたテスト用バウンディングボックスに対応するリサイズされたイメージに対するデータコードは、バックグラウンドコード、即ち、ａｌｌｚｅｒｏにマッピングされ得る。

【0074】

次に、アクティブラーニングデバイス１０００は、テストイメージをオブジェクトディテクタ２００に入力することで、オブジェクトディテクタ２００をもってテストイメージのそれぞれについてｍ回モンテカルロドロップアウト（ＭｏｎｔｅＣａｒｌｏｄｒｏｐｏｕｔ）を遂行してテストイメージのそれぞれに対応するテスト用第１フィーチャーマップ乃至テスト用第ｍフィーチャーマップを生成させ、テスト用第１フィーチャーマップ乃至テスト用第ｍフィーチャーマップをベイジアンアウトプットエンベディング（ｅｍｂｅｄｄｉｎｇ）してテスト用アクティベーションエントロピーマップを生成することができる。前記ｍは２以上の整数であり得る。

【0075】

即ち、図３を参照すると、アクティブラーニングデバイス１０００は、テストイメージをオブジェクトディテクタ２００に入力することで、オブジェクトディテクタ２００がテストイメージに対するインファレンス（ｉｎｆｅｒｅｎｃｅ）を遂行するようにし、オブジェクトディテクタ２００における特定のレイヤ（ｌａｙｅｒ）に対してドロップアウトを遂行することができる。より好ましくは、オブジェクトディテクタ２００のコンボリューションブロックにおける特定のレイヤに対してドロップアウトを遂行することができる。

【0076】

この際、それぞれの特定のレイヤにおけるドロップアウトは、一例として、モンテカルロドロップアウトを利用することができ、次の数式のように示され得る。

【数1】

【0077】

前記数式でｉは、テストイメージの高さ（ｈｅｉｇｈｔ）方向のピクセル位置を示し、ｊは、テストイメージの幅（ｗｉｄｔｈ）方向のピクセル位置を示し、ｋは、テストイメージのチャンネルを示すものであり得る。

【0078】

一方、オブジェクトディテクタ２００がドロップアウトを含めて学習されていない場合には、ドロップアウト確率を十分に低く、一例として、０．０１乃至０．１に設定することができる。

【0079】

従って、アクティブラーニングデバイス１０００は、オブジェクトディテクタ２００にｍ回のドロップアウトを遂行してテストイメージのそれぞれに対応するテスト用第１フィーチャーマップＦ_１乃至テスト用第ｍフィーチャーマップＦｍを出力させた後、テスト用第１フィーチャーマップＦ_１乃至テスト用第ｍフィーチャーマップＦｍに対応するテスト用アクティベーションプロバビリティ（ｐｒｏｂａｂｉｌｉｔｙ）マップを生成し、テスト用アクティベーションプロバビリティマップにおけるエントロピーを計算することによってテスト用アクティベーションエントロピーマップを生成することができる。

【0080】

即ち、アクティブラーニングデバイス１０００は、テスト用第１フィーチャーマップＦ_１乃至テスト用第ｍフィーチャーマップＦｍをバイナリ（ｂｉｎａｒｙ）変換してテスト用第１バイナリフィーチャーマップＢ１乃至テスト用第ｍバイナリフィーチャーマップＢｍを生成し、テスト用第１バイナリフィーチャーマップＢ１乃至テスト用第ｍバイナリフィーチャーマップＢｍをコンカチネート（ｃｏｎｃａｔｅｎａｔｅ）してテスト用アクティベーションプロバビリティマップを生成し、テスト用アクティベーションプロバビリティマップを参照してテスト用アクティベーションエントロピーマップを生成することができる。

【0081】

これをさらに詳細に説明すると、アクティブラーニングデバイス１０００は、テスト用第１フィーチャーマップＦ_１乃至テスト用第ｍフィーチャーマップＦｍのそれぞれに次の数式のようなバイナリ関数を適用することで、テスト用第１バイナリフィーチャーマップＢ１乃至テスト用第ｍバイナリフィーチャーマップＢｍを生成する。

【数2】

【0082】

そして、アクティブラーニングデバイス１０００は、テスト用第１バイナリフィーチャーマップＢ１乃至テスト用第ｍバイナリフィーチャーマップＢｍのプロバビリティを参照することで、次の数式によりテストイメージに対応するテスト用アクティベーションプロバビリティマップを生成する。

【数3】

【0083】

以後、アクティブラーニングデバイス１０００は、テスト用アクティベーションプロバビリティマップにおいて次の数式によるエントロピーを演算することで、テスト用アクティベーションエントロピーマップを生成することができる。

【数4】

【0084】

即ち、アクティブラーニングデバイス１０００は、テストイメージに対してドロップアウトをｍ回遂行した後、フィーチャーマップのエントロピーを計算することができる。

【0085】

この際、エントロピーは、フィーチャーがアクティベーションされているか否かを２クラスに計算することができる。これは、一般的にアクティベーション値の大きさの違いよりは、アクティベーションがされているか否かがオブジェクトディテクタ２００の最終出力により大きい影響を与えるためである。

【0086】

そして、オブジェクトディテクタ２００自体にパータベーション（ｐｅｒｔｕｒｂａｔｉｏｎ）を適用することで、ターゲットモデルのアンステーブル（ｕｎｓｔａｂｌｅ）なサブスペースを効果的に感知することができるようになる。この際、オブジェクトディテクタ２００自体にパータベーションを適用することによって、オブジェクトディテクタ２００から一部の出力への連結を強制的に切断する効果があり得る。

【0087】

即ち、一般的にサブスペースがステーブルに学習された場合には、若干のコネクション（ｃｏｎｎｅｃｔｉｏｎ）切断ではフィーチャーに有意味な影響を与えない。

【0088】

しかし、サブスペースがアンステーブルな状況、一例として、オーバーフィッティングまたはアンダーフィッティングな場合には、若干のパータベーションもフィーチャーに大きい影響を与え得る。

【0089】

従って、インプットを多様に変換する（ｔｒａｎｓｆｏｒｍ）する方法、一例として、データオーグメンテーション（ａｕｇｍｅｎｔａｔｉｏｎ）を使用する場合、サブスペース自体が変わり得るため、本発明では、オブジェクトディテクタ２００にパータベーションを与えるベイジアン方法（Ｂａｙｅｓｉａｎｍｅｔｈｏｄ）を使用してサブスペース自体が変わることを防止することができるようになる。

【0090】

再び図２を参照すると、アクティブラーニングデバイス１０００は、テスト用アクティベーションエントロピーマップのそれぞれからテスト用バウンディングボックスのうちオブジェクトとして判別されたテスト用特定のバウンディングボックスに対応する領域をクロップしたテスト用第１クロップされたアクティベーションエントロピーマップ乃至テスト用第ｏクロップされたアクティベーションエントロピーマップを生成し、テスト用アクティベーションエントロピーマップ及びテスト用アクティベーションエントロピーマップに対応するテスト用第１クロップされたアクティベーションエントロピーマップ乃至テスト用第ｏクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズしてテスト用第１リサイズされたアクティベーションエントロピーマップ２２０＿１乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップ２２０＿（ｏ＋１）を生成することができる。前記ｏはｎ以下の整数であり得る。

【0091】

この際、アクティベーションエントロピーマップは、テストイメージよりも大きさが小さいため、リサイズされたアクティベーションエントロピーマップの大きさをリサイズされたイメージよりも大きくすることができる。

【0092】

一方、前記では、テスト用アクティベーションエントロピーマップを生成した後にオブジェクト領域をクロップしたが、これとは異なり、オブジェクト領域をクロップした後にクロップされたイメージをアクティベーションエントロピーマップとして生成することもできる。

【0093】

即ち、アクティブラーニングデバイス１０００は、テスト用第１リサイズされたイメージ乃至テスト用第ｎ＋１リサイズされたイメージのうちオブジェクトとして判別されたテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれをオブジェクトディテクタ２００に入力することで、オブジェクトディテクタ２００をもってテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれについてｍ回モンテカルロドロップアウトを遂行してテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップを生成させることができる。そして、アクティブラーニングデバイス１０００は、テスト用第１フィーチャーマップ乃至テスト用第ｍフィーチャーマップをベイジアン出力エンベディングしてテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１リサイズされたアクティベーションエントロピーマップ２２０＿１乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップ２２０＿（ｏ＋１）を生成することができる。

【0094】

これをさらに詳細に説明すると、アクティブラーニングデバイス１０００は、テスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトフィーチャーマップ乃至テスト用第ｍオブジェクトフィーチャーマップをバイナリ変換してテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１バイナリオブジェクトフィーチャーマップ乃至テスト用第ｍバイナリオブジェクトフィーチャーマップを生成することができる。そして、アクティブラーニングデバイス１０００は、テスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１バイナリオブジェクトフィーチャーマップ乃至テスト用第ｍバイナリオブジェクトフィーチャーマップをコンカチネートしてテスト用第１リサイズされたオブジェクトイメージ乃至テスト用第ｏ＋１リサイズされたオブジェクトイメージのそれぞれに対応するテスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを生成し、テスト用第１オブジェクトアクティベーションプロバビリティマップ乃至テスト用第ｏ＋１オブジェクトアクティベーションプロバビリティマップを参照することで、テスト用第１リサイズされたアクティベーションエントロピーマップ乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップを生成することができる。

【0095】

次に、アクティブラーニングデバイス１０００は、テスト用第１リサイズされたアクティベーションエントロピーマップ２２０＿１乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップ２２０＿（ｏ＋１）をモデルエンコーダ４１０に入力することで、モデルエンコーダ４１０をもってテスト用第１リサイズされたアクティベーションエントロピーマップ２１０＿１乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップ２１０＿（ｏ＋１）をエンコーディングしてテスト用第１リサイズされたアクティベーションエントロピーマップ２１０＿１乃至テスト用第ｏ＋１リサイズされたアクティベーションエントロピーマップ２１０＿（ｏ＋１）に対応するテスト用第１モデルコード乃至テスト用第ｏ＋１モデルコードを出力させることができる。

【0096】

この際、モデルコードは、ｄ－ディメンションの［０，１］レンジで表現され得、それぞれのモデルコードは、オブジェクトディテクタ２００のスタビリティ（ｓｔａｂｉｌｉｔｙ）の類型を示すものであり得る。

【0097】

次に、図４を参照すると、アクティブラーニングデバイス１０００は、オブジェクトディテクタ２００の以前の学習に使用された以前の学習用イメージによって生成されたデータコードブック５１０を参照することで、カウンタスレッショルド以下であるリサイズされたイメージの個数に対応するリファレンス（ｒｅｆｅｒｅｎｃｅ）データコードを確認し、第１データコード乃至第ｎ＋１データコードのうちリファレンスデータコードにマッチングする第１特定のデータコードを抽出し、第１特定のデータコードに対応する第１特定のテストイメージをオブジェクトディテクタ２００の再学習のためのレアサンプルに選定し、レアサンプルに対応する第２特定のデータコードを参照することで、データコードブック５１０をアップデートすることができる。前記データコードブック５１０を生成する過程については、以下に説明する。

【0098】

この際、カウンタスレッショルドは、予め設定されたリサイズされたイメージの個数であるか、データコードブック５１０においてリサイズされたイメージの個数が高い順からｑ番目に該当するスレッショルドデータコードに対応するリサイズされたイメージの個数であり得る。前記ｑは１以上の整数であり得る。

【0099】

即ち、データコードであるサブスペースに対応するイメージ数の個数が少ないほど、オブジェクトディテクタ２００の以前の学習で十分に学習されていないレアサブスペースと判断することができ、それによってデータコードブックを利用してオブジェクトディテクタ２００の以前の学習で十分に学習されていない第１特定のデータコードに対応するテストイメージをレアサンプル、即ち、レアイメージにサンプリングすることができ、サンプリングされた特定のテストイメージに対応する第２特定のデータコードを利用してデータコードブック５１０をアップデートすることによって、オブジェクトディテクタ２００の再学習以後、新しいテストイメージから新しいレアイメージをサンプリングするための基準として使用することができる。

【0100】

そして、データコードブック５１０は、オブジェクトディテクタ２００の再学習が行われる度にアップデートし続けることができる。

【0101】

また、アクティブラーニングデバイス１０００は、オブジェクトディテクタ２００の再学習の以前に検証（ｅｖａｌｕａｔｉｏｎ）イメージによって生成されたモデルコードブック５２０を参照することで、エントロピースレッショルド以上であるアベレージ（ａｖｅｒａｇｅ）エントロピー値に対応するリファレンスモデルコードを確認し、第１モデルコード乃至第ｏ＋１モデルコードのうちリファレンスモデルコードにマッチングする特定のモデルコードを抽出し、特定のモデルコードに対応する第２特定のテストイメージをオブジェクトディテクタの再学習のためのハードサンプルに選定することができる。前記モデルコードブック５２０を生成する過程については、以下に説明する。

【0102】

この際、エントロピースレッショルドは、予め設定されたアベレージエントロピー値であるか、モデルコードブック５２０においてアベレージエントロピー値が高い順からｓ番目に該当するスレッショルドモデルコードに対応するアベレージエントロピー値であり得る。前記ｓは１以上の整数であり得る。

【0103】

即ち、モデルコードであるスタビリティの類型に対応するアベレージエントロピーが大きいほど、現在の学習された状態のオブジェクトディテクタ２００にとって難しい類型であるため、それによってモデルコードブック５２０を利用してオブジェクトディテクタ２００にとって難しい類型に対応するモデルコードを含むテストイメージをハードサンプルと判断することができる。

【0104】

一方、オブジェクトディテクタ２００の再学習によってアップデートされるデータコードブック５１０とは異なり、モデルコードブック５２０は、オブジェクトディテクタ２００の再学習を遂行する以前に新たに生成することができる。

【0105】

即ち、オブジェクトディテクタ２００が再学習されると、以前には難しかった類型に対して性能が良くなるか、類型自体が異なって分類され得る。即ち、容易な類型はより大きいカテゴリーにまとめられ、難しい類型はさらに細分化され得る。従って、オブジェクトディテクタ２００の再学習以後、モデルコードブック５２０を新たに生成することによって、現在の学習されたオブジェクトディテクタ２００の状態を反映することができる。

【0106】

次に、図５を参照すると、前記のような方法によって生成されたデータコードブックを通じて特定のテストイメージがレアサンプルに選択された理由を確認することができる。

【0107】

即ち、データコードブックを通じてテストイメージをシーンレベルとオブジェクトレベルとに説明することができ、シーンレベルとオブジェクトレベルとを通じてレアサンプルに選択された理由を確認することができる。

【0108】

一例として、自動車がｄａｙｒｏａｄ（日中の道路）を走行する状態、即ち、テストイメージのシーンがｄａｙｒｏａｄである状態でストップサインはレアに現れることが分かる。

【0109】

また、ｈｅａｖｙｒａｉｎ（大雨）であるシーンから検出される自動車は、同一の自動車でも雨の影響で染みや滲みが激しい形態であるため、ｄａｙｈｉｇｈｗａｙ（日中の高速道路）であるシーンから検出される自動車よりもオブジェクトレベルにおいてレアであることが分かる。

【0110】

次に、アクティブラーニングデバイスは、以前の学習用イメージ、レアサンプル、及びハードサンプルを利用してオブジェクトディテクタ２００を再学習させることができる。

【0111】

一方、データエンコーダとモデルエンコーダとを学習させる方法、及びデータコードブックとモデルコードブックとを生成する過程を説明すると以下の通りである。

【0112】

まず、図６を参照してデータエンコーダ３１０を学習させる方法を説明すると以下の通りである。

【0113】

アクティブラーニングデバイス１０００は、ターゲットモデル、即ち、オブジェクトディテクタの学習のための学習イメージを格納している学習イメージデータベースからデータエンコーダ３１０の学習に利用するための学習イメージをサンプリングすることができる。

【0114】

そして、アクティブラーニングデバイス１０００は、オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージのそれぞれからオブジェクト領域をクロップして学習用第１クロップされたオブジェクトイメージ乃至学習用第ｔクロップされたオブジェクトイメージを生成し、学習イメージのそれぞれからバックグラウンド領域をクロップして学習用第１クロップされたバックグラウンドイメージ乃至学習用第ｕクロップされたバックグラウンドイメージを生成することができる。前記ｔとｕとは１以上の整数であり得る。

【0115】

この際、クロップされたバックグラウンドイメージの個数がクロップされたオブジェクトイメージの個数に比べて１倍乃至３倍となるようにバックグラウンド領域をランダムクロップすることができる。

【0116】

以後、アクティブラーニングデバイス１０００は、学習イメージ及び学習イメージのそれぞれに対応する学習用第１クロップされたオブジェクトイメージ乃至学習用第ｔクロップされたオブジェクトイメージ及び学習イメージのそれぞれに対応する学習用第１クロップされたバックグラウンドイメージ乃至学習用第ｕクロップされたバックグラウンドイメージを同一のサイズにリサイズして学習用第１リサイズされたオブジェクトイメージ２０＿１乃至学習用第ｔ＋１リサイズされたオブジェクトイメージ２０＿（ｔ＋１）、及び学習用第１リサイズされたバックグラウンドイメージ３０＿１乃至学習用第ｕリサイズされたバックグラウンドイメージ３０＿ｕを生成することができる。

【0117】

そして、アクティブラーニングデバイス１０００は、学習用第１リサイズされたオブジェクトイメージ２０＿１乃至学習用第ｔ＋１リサイズされたオブジェクトイメージ２０＿（ｔ＋１）及び学習用第１リサイズされたバックグラウンドイメージ３０＿１乃至学習用第ｕリサイズされたバックグラウンドイメージ３０＿ｕをデータオートエンコーダのデータエンコーダ３１０に入力することで、データエンコーダ３１０をもって学習用第１リサイズされたオブジェクトイメージ２０＿１乃至学習用第ｔ＋１リサイズされたオブジェクトイメージ２０＿（ｔ＋１）及び学習用第１リサイズされたバックグラウンドイメージ３０＿１乃至学習用第ｕリサイズされたバックグラウンドイメージ３０＿ｕをエンコーディングして学習用第１リサイズされたオブジェクトイメージ２０＿１乃至学習用第ｔ＋１リサイズされたオブジェクトイメージ３０＿（ｔ＋１）に対応する学習用第１オブジェクトデータコード乃至学習用第ｔ＋１オブジェクトデータコード及び学習用第１リサイズされたバックグラウンドイメージ３０＿１乃至学習用第ｕリサイズされたバックグラウンドイメージ３０＿ｕに対応する学習用第１バックグラウンドデータコード乃至学習用第ｕバックグラウンドデータコードを出力させることができる。

【0118】

以後、アクティブラーニングデバイス１０００は、学習用第１オブジェクトデータコード乃至学習用第ｔ＋１オブジェクトデータコードを前記データオートエンコーダのデータデコーダ３２０に入力することで、データデコーダ３２０をもって学習用第１オブジェクトデータコード乃至学習用第ｔ＋１オブジェクトデータコードをデコーディングして学習用第１リコンストラクト済み（ｒｅｃｏｎｓｔｒｕｃｔｅｄ）イメージ乃至第ｔ＋１リコンストラクト済みイメージを出力させることができる。

【0119】

そして、アクティブラーニングデバイス１０００は、学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｔ＋１リサイズされたオブジェクトイメージと学習用第１リコンストラクト済みイメージ乃至学習用第ｔ＋１リコンストラクト済みイメージとを参照した第１オブジェクトロス乃至第ｔ＋１オブジェクトロスを利用してデータデコーダ３２０とデータエンコーダ３１０とを学習させ、学習用第１バックグラウンドデータコード乃至学習用第ｕバックグラウンドデータコードを参照したバックグラウンドロスを利用してデータエンコーダ３１０を学習させることができる。

【0120】

この際、オブジェクトロス（ｏｂｊｅｃｔｌｏｓｓ）は、次の通り示され得る。

【数5】

【0121】

また、バックグラウンドロス（ｂａｃｋｇｒｏｕｎｄｌｏｓｓ）は、次の通り示され得る。

【数6】

【0122】

即ち、アクティブラーニングデバイス１０００は、全体のイメージ１０とオブジェクトとはリコンストラクトション（ｒｅｃｏｎｓｔｒｕｃｔｉｏｎ）ロスに反映してデータデコーダ３２０とデータエンコーダ３１０との学習に利用し、バックグラウンドはリコンストラクトションロスには反映せず、データコードがａｌｌｚｅｒｏとなるようにデータコードにのみロスを反映してデータエンコーダ３１０の学習に利用することができる。

【0123】

一方、前記では、アクティブラーニングデバイス１０００がデータエンコーダ３１０を学習させたが、これとは異なり、別途の学習装置を通じてデータエンコーダ３１０を学習させることもできる。

【0124】

次に、図７を参照してデータコードブックを生成する方法を説明すると以下の通りである。

【0125】

アクティブラーニングデバイス１０００は、ターゲットモデル、即ち、オブジェクトディテクタの学習のための学習イメージを格納している学習イメージデータベースからデータコードブックの生成に利用するための検証（ｅｖａｌｕａｔｉｏｎ）イメージをサンプリングすることができる。

【0126】

この際、アクティブラーニングデバイス１０００は、学習イメージデータベースから学習イメージをサンプリングし、サンプリングされた学習イメージをデータエンコーダ３１０の学習に利用するための学習イメージとデータコードブックの生成のための検証イメージとに分割することができる。そして、学習イメージと検証イメージとの分割は、ユニフォーム（ｕｎｉｆｏｒｍ）ランダムサンプリングを利用して遂行することができ、これを通じて学習イメージと検証イメージとの分布特性、即ち、サブスペースのレアネス（ｒａｒｅｎｅｓｓ）が互いに異ならないようにすることができる。

【0127】

そして、アクティブラーニングデバイス１０００は、学習イメージデータベースからサンプリングした検証イメージのそれぞれからオブジェクト領域をクロップして検証用第１クロップされたオブジェクトイメージ乃至検証用第ｖクロップされたオブジェクトイメージを生成し、検証イメージ及び検証イメージのそれぞれに対応する検証用第１クロップされたオブジェクトイメージ乃至検証用第ｖクロップされたオブジェクトイメージを同一のサイズにリサイズして検証用第１リサイズされたオブジェクトイメージ４０＿１乃至検証用第ｖ＋１リサイズされたオブジェクトイメージ４０＿（ｖ＋１）を生成することができる。

【0128】

以後、アクティブラーニングデバイス１０００は、検証用第１リサイズされたオブジェクトイメージ４０＿１乃至検証用第ｖ＋１リサイズされたオブジェクトイメージ４０＿（ｖ＋１）をデータエンコーダ３１０に入力することで、データエンコーダ３１０をもって検証用第１リサイズされたオブジェクトイメージ４０＿１乃至検証用第ｖ＋１リサイズされたオブジェクトイメージ４０＿（ｖ＋１）をエンコーディングして検証用第１リサイズされたオブジェクトイメージ４０＿１乃至検証用第ｖ＋１リサイズされたオブジェクトイメージ４０＿（ｖ＋１）に対応する検証用第１オブジェクトデータコード乃至検証用第ｖ＋１オブジェクトデータコードを出力させることができる。

【0129】

そして、アクティブラーニングデバイス１０００は、検証用第１オブジェクトデータコード乃至検証用第ｖ＋１オブジェクトデータコードをデータコード別に分類（ｓｏｒｔ）し、それぞれのデータコードに対応するリサイズされたイメージの個数をカウンティングしてデータコードブック５１０を生成することができる。即ち、データコード別リサイズされたイメージの個数をそれぞれのデータコードにマッピングしてデータコードブック５１０を生成することができる。この際、データコードブック５１０には、イメージＩＤが追加的にマッピングされ得る。

【0130】

一方、前記ではアクティブラーニングデバイス１０００がデータコードブック５１０を生成したが、これとは異なり、別途の学習装置やデータコードブックの生成装置を通じてデータコードブック５１０を生成することもできる。

【0131】

次に、図８を参照してモデルエンコーダ４１０を学習させる方法を説明すると以下の通りである。

【0132】

【0133】

そして、アクティブラーニングデバイス１０００は、オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした学習イメージをオブジェクトディテクタに入力することで、オブジェクトディテクタをもって学習用イメージのそれぞれについいてｍ回モンテカルロドロップアウトを遂行して学習用イメージのそれぞれに対応する学習用第１フィーチャーマップ乃至学習用第ｍフィーチャーマップを生成させ、学習用第１フィーチャーマップ乃至学習用第ｍフィーチャーマップをベイジアン出力エンベディングして学習用アクティベーションエントロピーマップを生成することができる。

【0134】

この際、モデルエンコーダ４１０の学習では、データエンコーダ３１０の学習とは異なり、バックグラウンド領域は使用しない。これは、バックグラウンド領域はアクティベーションエントロピーを通じて判別するよりは、データエンコーダでイメージ基盤に判別した方がより正確であるためであり得る。

【0135】

以後、アクティブラーニングデバイス１０００は、学習用アクティベーションエントロピーマップのそれぞれからオブジェクトに対応する領域をクロップした学習用第１クロップされたアクティベーションエントロピーマップ乃至学習用第ｘクロップされたアクティベーションエントロピーマップを生成し、学習用アクティベーションエントロピーマップ及び学習用アクティベーションエントロピーマップに対応する学習用第１クロップされたアクティベーションエントロピーマップ乃至学習用第ｘクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズして学習用第１リサイズされたアクティベーションエントロピーマップ５０＿１乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ５０＿（ｘ＋１）を生成することができる。前記ｘは１以上の整数であり得る。

【0136】

一方、前記では、学習用アクティベーションエントロピーマップを生成した後にオブジェクト領域をクロップしたが、これとは異なり、オブジェクト領域をクロップした後にクロップされたイメージをアクティベーションエントロピーマップとして生成することもできる。

【0137】

即ち、アクティブラーニングデバイス１０００は、学習用イメージ及び学習用イメージからオブジェクト領域をクロップしたオブジェクトイメージを同一のサイズにリサイズした学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれをオブジェクトディテクタに入力することで、オブジェクトディテクタをもって学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する学習用第１オブジェクトフィーチャーマップ乃至学習用第ｍオブジェクトフィーチャーマップを生成させることができる。そして、アクティブラーニングデバイス１０００は、学習用第１オブジェクトフィーチャーマップ乃至学習用第ｍオブジェクトフィーチャーマップをベイジアン出力エンベディングして学習用第１リサイズされたオブジェクトイメージ乃至学習用第ｘ＋１リサイズされたオブジェクトイメージのそれぞれに対応する学習用第１リサイズされたアクティベーションエントロピーマップ５０＿１乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ５０＿（ｘ＋１）を生成することができる。

【0138】

そして、アクティブラーニングデバイス１０００は、学習用第１リサイズされたアクティベーションエントロピーマップ５０＿１乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ５０＿（ｘ＋１）をモデルオートエンコーダのモデルエンコーダ４１０に入力することで、モデルエンコーダ４１０をもって学習用第１リサイズされたアクティベーションエントロピーマップ５０＿１乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ５０＿（ｘ＋１）をエンコーディングして学習用第１リサイズされたアクティベーションエントロピーマップ５０＿１乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップ５０＿（ｘ＋１）に対応する学習用第１モデルコード乃至学習用第ｘ＋１モデルコードを出力させることができる。

【0139】

以後、アクティブラーニングデバイス１０００は、学習用第１モデルコード乃至学習用第ｘ＋１モデルコードをモデルオートエンコーダのモデルデコーダ４２０に入力することで、モデルデコーダ４２０をもって学習用第１モデルコード乃至学習用第ｘ＋１モデルコードをデコーディングして学習用第１リコンストラクト済みエントロピーマップ乃至学習用第ｘ＋１リコンストラクト済みエントロピーマップを出力させることができる。

【0140】

以後、アクティブラーニングデバイス１０００は、学習用第１リサイズされたアクティベーションエントロピーマップ乃至学習用第ｘ＋１リサイズされたアクティベーションエントロピーマップと学習用第１リコンストラクト済みエントロピーマップ乃至学習用第ｘ＋１リコンストラクト済みエントロピーマップとを参照した第１エントロピーロス乃至第ｘ＋１エントロピーロスを利用してモデルデコーダ４２０とモデルエンコーダ４１０とを学習させることができる。

【0141】

この際、エントロピーロス（ｅｎｔｒｏｐｙｌｏｓｓ）は次の通り示され得る。

【数7】

【0142】

一方、アクティベーションエントロピーマップは、学習イメージよりも大きさが小さいため、全体のイメージ及びクロップされたイメージを同一のサイズとなるようにリサイズする場合、データエンコーダ３１０の学習でより大きいサイズを有するようにリサイズすることができる。

【0143】

この際、モデルエンコーダ４１０の学習は、オブジェクトディテクタの学習及び再学習が行われる度に遂行され得る。

【0144】

また、アクティブラーニングデバイス１０００がモデルエンコーダ４１０を学習させるものとして説明したが、これとは異なり、別途の学習装置を通じてモデルエンコーダ４１０を学習させることもできる。

【0145】

次に、図９を参照してモデルコードブックを生成する方法を説明すると以下の通りである。

【0146】

アクティブラーニングデバイス１０００は、ターゲットモデル、即ち、オブジェクトディテクタの学習のための学習イメージを格納している学習イメージデータベースからモデルコードブックの生成に利用するための検証イメージをサンプリングすることができる。

【0147】

この際、アクティブラーニングデバイス１０００は、学習用イメージデータベースから学習イメージをサンプリングし、サンプリングされた学習イメージを、モデルエンコーダ４１０の学習に利用するための学習イメージとモデルコードブックの生成のための検証イメージとに分割することができる。そして、学習イメージと検証イメージとの分割は、ユニフォームランダムサンプリングを利用して遂行することができる。

【0148】

そして、アクティブラーニングデバイス１０００は、オブジェクトディテクタの学習のための学習イメージデータベースからサンプリングした検証イメージをオブジェクトディテクタに入力することで、オブジェクトディテクタをもって検証イメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して検証イメージのそれぞれに対応する検証用第１フィーチャーマップ乃至検証用第ｍフィーチャーマップを生成させ、検証用第１フィーチャーマップ乃至検証用第ｍフィーチャーマップをベイジアン出力エンベディングして検証用アクティベーションエントロピーマップを生成することができる。

【0149】

以後、アクティブラーニングデバイス１０００は、検証用アクティベーションエントロピーマップのそれぞれからオブジェクトに対応する領域をクロップした検証用第１クロップされたアクティベーションエントロピーマップ乃至検証用第ｙクロップされたアクティベーションエントロピーマップを生成し、検証用アクティベーションエントロピーマップ及び検証用アクティベーションエントロピーマップに対応する検証用第１クロップされたアクティベーションエントロピーマップ乃至検証用第ｙクロップされたアクティベーションエントロピーマップを同一のサイズにリサイズして検証用第１リサイズされたアクティベーションエントロピーマップ６０＿１乃至検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップ６０＿（ｙ＋１）を生成することができる。前記ｙは１以上の整数であり得る。

【0150】

一方、前記では、検証用アクティベーションエントロピーマップを生成した後にオブジェクト領域をクロップしたが、これとは異なり、オブジェクト領域をクロップした後にクロップされたイメージに対応するアクティベーションエントロピーマップを生成することもできる。

【0151】

即ち、アクティブラーニングデバイス１０００は、検証イメージ及び検証イメージからオブジェクト領域をクロップしたオブジェクトイメージを同一のサイズにリサイズした検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれをオブジェクトディテクタに入力することで、オブジェクトディテクタをもって検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれをｍ回モンテカルロドロップアウトを遂行して検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれに対応する検証用第１オブジェクトフィーチャーマップ乃至検証用第ｍオブジェクトフィーチャーマップを生成させることができる。そして、アクティブラーニングデバイス１０００は、検証用第１オブジェクトフィーチャーマップ乃至検証用第ｍオブジェクトフィーチャーマップをベイジアン出力エンベディングして検証用第１リサイズされたオブジェクトイメージ乃至検証用第ｙ＋１リサイズされたオブジェクトイメージのそれぞれに対応する検証用第１リサイズされたアクティベーションエントロピーマップ６０＿１乃至検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップ６０＿（ｙ＋１）を生成することができる。

【0152】

そして、アクティブラーニングデバイス１０００は、検証用第１リサイズされたアクティベーションエントロピーマップ６０＿１乃至検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップ６０＿（ｙ＋１）をモデルオートエンコーダのモデルエンコーダ４１０に入力することで、モデルエンコーダ４１０をもって検証用第１リサイズされたアクティベーションエントロピーマップ６０＿１乃至検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップ６０＿（ｙ＋１）をエンコーディングして検証用第１リサイズされたアクティベーションエントロピーマップ６０＿１乃至検証用第ｙ＋１リサイズされたアクティベーションエントロピーマップ６０＿（ｙ＋１）に対応する検証用第１モデルコード乃至検証用第ｙ＋１モデルコードを出力させることができる。

【0153】

以後、アクティブラーニングデバイス１０００は、検証用第１モデルコード乃至検証用第ｙ＋１モデルコードをモデルコード別に分類し、それぞれのモデルコードに対応するリサイズされたアクティベーションエントロピーマップのアベレージエントロピー値を参照することで、モデルコードブック５２０を生成することができる。

【0154】

即ち、アクティブラーニングデバイス１０００は、それぞれのモデルコードに対応するリサイズされたアクティベーションエントロピーマップのエントロピー値を平均してアベレージエントロピー値を生成し、アベレージエントロピー値をコード別にマッチングしてモデルコードブック５２０を生成することができる。この際、モデルコードブック５２０にはイメージＩＤが追加的にマッピングされ得る。

【0155】

そして、前記ではアクティブラーニングデバイス１０００がモデルコードブック５２０を生成したが、これとは異なり、別途の学習装置やモデルコードブックの生成装置を通じてモデルコードブック５２０を生成することもできる。

【0156】

また、以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を通じて遂行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フレキシブルディスク及び磁気テープのような磁気媒体、ＣＤ－ＲＯＭ、ＤＶＤのような光記録媒体、フロプティカル・ディスク（ＦｌｏｐｔｉｃａｌＤｉｓｋ）のような磁気－光メディア（Ｍａｇｎｅｔｏ－ＯｐｔｉｃａｌＭｅｄｉａ）、及びＲＯＭ、ＲＡＭ、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行される高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。

【0157】

以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは、本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、かかる記載から多様な修正及び変形が行われ得る。

【0158】

従って、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。

【図1】