特許第6857368号(P6857368)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ストラッドビジョンの特許一覧

特許6857368CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置
<>
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000024
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000025
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000026
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000027
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000028
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000029
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000030
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000031
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000032
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000033
  • 特許6857368-CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置 図000034
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6857368
(24)【登録日】2021年3月24日
(45)【発行日】2021年4月14日
(54)【発明の名称】CNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置
(51)【国際特許分類】
   G06T 7/00 20170101AFI20210405BHJP
   G06T 7/11 20170101ALI20210405BHJP
   G06N 3/04 20060101ALI20210405BHJP
【FI】
   G06T7/00 350C
   G06T7/11
   G06N3/04
【請求項の数】24
【全頁数】37
(21)【出願番号】特願2020-1957(P2020-1957)
(22)【出願日】2020年1月9日
(65)【公開番号】特開2020-119534(P2020-119534A)
(43)【公開日】2020年8月6日
【審査請求日】2020年1月9日
(31)【優先権主張番号】16/255,044
(32)【優先日】2019年1月23日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】517038176
【氏名又は名称】株式会社ストラドビジョン
(74)【代理人】
【識別番号】110000855
【氏名又は名称】特許業務法人浅村特許事務所
(72)【発明者】
【氏名】キム、ケイ − ヒョン
(72)【発明者】
【氏名】キム、ヨンジュン
(72)【発明者】
【氏名】キム、インスー
(72)【発明者】
【氏名】キム、ハク − キョン
(72)【発明者】
【氏名】ナム、ウヒョン
(72)【発明者】
【氏名】ブー、ソッフン
(72)【発明者】
【氏名】ソン、ミュンチュル
(72)【発明者】
【氏名】ヨー、ドンフン
(72)【発明者】
【氏名】リュー、ウジュ
(72)【発明者】
【氏名】チャン、テウン
(72)【発明者】
【氏名】ジョン、キュンチョン
(72)【発明者】
【氏名】チェ、ホンモ
(72)【発明者】
【氏名】チョウ、ホジン
【審査官】 岡本 俊威
(56)【参考文献】
【文献】 特表2018−503152(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06T 7/00− 7/90
G06N 3/04
(57)【特許請求の範囲】
【請求項1】
イメージ認識のためのCNNのパラメータを学習する方法において、
(a)少なくとも一つのトレーニングイメージが入力されると、学習装置が、(i)少なくとも一つのコンボリューションレイヤをもって、前記トレーニングイメージ上でROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの物体に対応する少なくとも一つの前記ROIごとにROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記ROIごとにプーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記ROIごとにコンカチネート(Concatenating)させて統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を適用させて前記ROIごとの前記プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記ROIごとにコンカチネートさせて前記統合特徴マップを生成させる段階;
(b)前記学習装置が、(b1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された第1調整特徴マップ(Adjusted Feature Map)を生成させ、(b2)(i)第2リシェイプレイヤをもって、前記第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された第2調整特徴マップを生成させる段階;及び
(c)前記学習装置が、(c1)(i)第2トランスポーズレイヤをもって、前記第2調整特徴マップを前記ピクセルごとに分離して前記ROIごとにピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに関する物体情報を生成させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとに前記ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する前記物体情報を生成させた後、(c2)ロスレイヤをもって、前記物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習する段階;
を含むことを特徴とする学習方法。
【請求項2】
前記(b)段階で、
前記統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記学習装置は、前記第1リシェイプレイヤをもって、前記統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、
前記(b)段階で、
前記第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記学習装置は、前記第2リシェイプレイヤをもって、前記第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項1に記載の学習方法。
【請求項3】
前記ROIの個数をNとし、前記ROIごとの前記プーリング済み特徴マップの幅をM1、高さをM2とし、前記ROIごとの前記プーリング済み特徴マップのチャンネル個数をJとする場合、
前記(a)段階で、
前記学習装置は、(i)前記第1トランスポーズレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを、幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを、幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにすることを特徴とする請求項1に記載の学習方法。
【請求項4】
前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、
前記(b)段階で、
前記学習装置は、前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記第1調整特徴マップを生成させ、
前記第2リシェイプレイヤをもって、幅N、高さH2、チャンネル
である前記第2リシェイプ済み特徴マップを生成させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する前記第2調整特徴マップを生成させることを特徴とする請求項3に記載の学習方法。
【請求項5】
前記(c)段階で、
前記学習装置は、(i)前記第2トランスポーズレイヤをもって、前記第2調整特徴マップを、N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを、前記N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させることを特徴とする請求項4に記載の学習方法。
【請求項6】
前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする請求項1に記載の学習方法。
【請求項7】
イメージ認識のためのCNNをテストする方法において、
(a)学習装置は、(1)(i)少なくとも一つのコンボリューションレイヤをもって、少なくとも一つのトレーニングイメージ上で学習用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成された学習用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの学習用物体に対応する少なくとも一つの前記学習用ROIごとに学習用ROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記学習用ROIごとに学習用プーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記学習用ROIごとにコンカチネート(Concatenating)させて学習用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を適用させて前記学習用ROIごとの前記学習用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記学習用ROIごとにコンカチネートさせて前記学習用統合特徴マップを生成させ、(2)(2−1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記学習用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記学習用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(2−2)(i)第2リシェイプレイヤをもって、前記学習用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記学習用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された学習用第2調整特徴マップを生成させ、(3)(3−1)(i)第2トランスポーズレイヤをもって、前記学習用第2調整特徴マップを前記ピクセル別に分離して前記学習用ROIごとに学習用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに関する学習用物体情報を生成させるか、(ii)前記分類レイヤをもって、前記学習用第2調整特徴マップを前記ピクセル別に分離して前記学習用ROIごとに前記学習用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに対する前記学習用物体情報を生成させた後、(3−2)ロスレイヤをもって、前記学習用物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習した状態で、少なくとも一つのテストイメージが取得されると、テスト装置が、(i)前記コンボリューションレイヤをもって、前記テストイメージ上でテスト用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたテスト用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つのテスト用物体に対応する少なくとも一つの前記テスト用ROIごとにテスト用ROI特徴マップを生成させ、(ii)(ii−1)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記テスト用ROIごとにテスト用プーリング済み特徴マップを生成させ、前記第1トランスポーズレイヤ(Transposing Layer)をもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記テスト用ROIごとにコンカチネート(Concatenating)させてテスト用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を適用させて前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記テスト用ROIごとにコンカチネートさせて前記テスト用統合特徴マップを生成させる段階;
(b)前記テスト装置が、(b1)(i)前記第1リシェイプレイヤ(Reshaping Layer)をもって、前記テスト用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)前記1xH1コンボリューションレイヤをもって、前記テスト用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整されたテスト用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(b2)(i)前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第2リシェイプ済み特徴マップを生成させ、(ii)前記1xH2コンボリューションレイヤをもって、前記テスト用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整されたテスト用第2調整特徴マップを生成させる段階;及び
(c)前記テスト装置が、(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとにテスト用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに関するテスト用物体情報を生成させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとに前記テスト用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに対する前記テスト用物体情報を生成させる段階;
を含むことを特徴とするテスト方法。
【請求項8】
前記(b)段階で、
前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記テスト装置は、前記第1リシェイプレイヤをもって、前記テスト用統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記テスト用統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、
前記(b)段階で、
前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記テスト装置は、前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記テスト用第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項7に記載のテスト方法。
【請求項9】
前記テスト用ROIの個数をNとし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップの幅をM1、高さをM2とし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップのチャンネル個数をJとする場合、
前記(a)段階で、
前記テスト装置は、(i)前記第1トランスポーズレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにすることを特徴とする請求項7に記載のテスト方法。
【請求項10】
前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、
前記(b)段階で、
前記テスト装置は、
前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記テスト用第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記テスト用第1調整特徴マップを生成させ、
前記第2リシェイプレイヤをもって、幅N、高さH2のサイズと
のチャンネル個数を有する前記テスト用第2リシェイプ済み特徴マップを生成させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネル個数LであるNx1xLのボリュームを有する前記テスト用第2調整特徴マップを生成させることを特徴とする請求項9に記載のテスト方法。
【請求項11】
前記(c)段階で、
前記テスト装置は、(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを、N個の前記テスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを、前記N個のテスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させることを特徴とする請求項10に記載のテスト方法。
【請求項12】
前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする請求項7に記載のテスト方法。
【請求項13】
イメージ認識のためのCNNを学習する学習装置において、
インストラクションを格納する少なくとも一つのメモリと、
(I)(i)少なくとも一つのコンボリューションレイヤをもって、少なくとも一つのトレーニングイメージ上でROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの物体に対応する少なくとも一つの前記ROIごとにROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記ROIごとにプーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記ROIごとにコンカチネート(Concatenating)させて統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を適用させて前記ROIごとの前記プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記ROIごとにコンカチネートさせて前記統合特徴マップを生成させるプロセス、(II)(II−1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された第1調整特徴マップ(Adjusted Feature Map)を生成させ、(II−2)(i)第2リシェイプレイヤをもって、前記第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された第2調整特徴マップを生成させるプロセス、及び(III)(III−1)(i)第2トランスポーズレイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとにピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する物体情報を生成させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとに前記ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する前記物体情報を生成させた後、(III−2)ロスレイヤをもって、前記物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、
を含むことを特徴とする学習装置。
【請求項14】
前記(II)プロセスで、
前記統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記プロセッサは、前記第1リシェイプレイヤをもって、前記統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、
前記(II)プロセスで、
前記第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記プロセッサは、前記第2リシェイプレイヤをもって、前記第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項13に記載の学習装置。
【請求項15】
前記ROIの個数をNとし、前記ROIごとの前記プーリング済み特徴マップの幅をM1、高さをM2とし、前記ROIごとの前記プーリング済み特徴マップのチャンネル個数をJとする場合、
前記(I)プロセスで、
前記プロセッサは(i)前記第1トランスポーズレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにすることを特徴とする請求項13に記載の学習装置。
【請求項16】
前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、
前記(II)プロセスで、
前記プロセッサは、前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記第1調整特徴マップを生成させ、
前記プロセッサは、前記第2リシェイプレイヤをもって、幅N、高さH2、チャンネル
である前記第2リシェイプ済み特徴マップを出力させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する前記第2調整特徴マップを生成させることを特徴とする請求項15に記載の学習装置。
【請求項17】
前記(III)プロセスで、
前記プロセッサは、(i)前記第2トランスポーズレイヤをもって、前記第2調整特徴マップを、N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを、N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させることを特徴とする請求項16に記載の学習装置。
【請求項18】
前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする請求項13に記載の学習装置。
【請求項19】
イメージ認識のためのCNNをテストするテスト装置において、
インストラクションを格納する少なくとも一つのメモリと、
学習装置は、(1)(i)少なくとも一つのコンボリューションレイヤをもって、少なくとも一つのトレーニングイメージ上で学習用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成された学習用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの学習用物体に対応する少なくとも一つの前記学習用ROIごとに学習用ROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記学習用ROIごとに学習用プーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記学習用ROIごとにコンカチネート(Concatenating)させて学習用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を適用させて前記学習用ROIごとの前記学習用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記学習用ROIごとにコンカチネートさせて前記学習用統合特徴マップを生成させ、(2)(2−1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記学習用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記学習用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(2−2)(i)第2リシェイプレイヤをもって、前記学習用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記学習用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された学習用第2調整特徴マップを生成させ、(3)(3−1)(i)第2トランスポーズレイヤをもって、前記学習用第2調整特徴マップを前記ピクセルごとに分離して前記学習用ROIごとの学習用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに関する学習用物体クラス情報を生成させるか、(ii)前記分類レイヤをもって、前記学習用第2調整特徴マップを前記ピクセルごとに分離して前記学習用ROIごとに前記学習用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに関する前記学習用物体クラス情報を生成させた後、(3−2)ロスレイヤをもって、前記学習用物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習した状態で、(I)(i)前記コンボリューションレイヤをもって、少なくとも一つのテストイメージ上でテスト用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたテスト用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つのテスト用物体に対応する少なくとも一つの前記テスト用ROIごとにテスト用ROI特徴マップを生成させ、(ii)(ii−1)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記テスト用ROIごとにテスト用プーリング済み特徴マップを生成させ、前記第1トランスポーズレイヤ(Transposing Layer)をもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記テスト用ROIごとにコンカチネート(Concatenating)させてテスト用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を適用させて前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記テスト用ROIごとにコンカチネートさせて前記テスト用統合特徴マップを生成させるプロセス、(II)(II−1)(i)前記第1リシェイプレイヤ(Reshaping Layer)をもって、前記テスト用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)前記1xH1コンボリューションレイヤをもって、前記テスト用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整されたテスト用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(II−2)(i)前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第2リシェイプ済み特徴マップを生成させ、(ii)前記1xH2コンボリューションレイヤをもって、前記テスト用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整されたテスト用第2調整特徴マップを生成させるプロセス、及び(III)(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとにテスト用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに関するテスト用物体情報を生成させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに対する前記テスト用物体情報を生成させるプロセスを遂行するための前記インストラクションを実行するように構成された少なくともひとつのプロセッサと、
を含むことを特徴とするテスト装置。
【請求項20】
前記(II)プロセスで、
前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記プロセッサは、前記第1リシェイプレイヤをもって、前記テスト用統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記テスト用統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、
前記(II)プロセスで、
前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記プロセッサは、前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記テスト用第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする請求項19に記載のテスト装置。
【請求項21】
前記テスト用ROIの個数をNとし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップの幅をM1、高さをM2とし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップのチャンネル個数をJとする場合、
前記(I)プロセスで、
前記プロセッサは、(i)前記第1トランスポーズレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにすることを特徴とする請求項19に記載のテスト装置。
【請求項22】
前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、
前記(II)プロセスで、
前記プロセッサは、前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記テスト用第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記テスト用第1調整特徴マップを生成させ、
前記プロセッサは、前記第2リシェイプレイヤをもって、幅N、高さH2、チャンネル
である前記テスト用第2リシェイプ済み特徴マップを生成させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する前記テスト用第2調整特徴マップを生成させることを特徴とする請求項21に記載のテスト装置。
【請求項23】
前記(III)プロセスで、
前記プロセッサは、(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを、N個のテスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを、前記N個のテスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させることを特徴とする請求項22に記載のテスト装置。
【請求項24】
前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする請求項19に記載のテスト装置。
【発明の詳細な説明】
【技術分野】
【0001】
ハードウェア最適化に使用されるイメージ認識のための1xHコンボリューションを利用したCNN学習方法及び学習装置、これを利用したテスト方法及びテスト装置{LEARNING METHOD AND LEARNING DEVICE FOR CONVOLUTIONAL NEURAL NETWORK USING 1xH CONVOLUTION FOR IMAGE RECOGNITION TO BE USED FOR HARDWARE OPTIMIZATION, AND TESTING METHOD AND TESTING DEVICE USING THE SAME}を提供する。
【0002】
本発明はハードウェア最適化に使用されるイメージ認識のためのCNNを学習する方法に関し、より詳細には、イメージ認識のための前記CNNのパラメータを学習する方法において、(a)少なくとも一つのトレーニングイメージが入力されると、学習装置が、(i)少なくとも一つのコンボリューションレイヤをもって、前記トレーニングイメージ上でROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの物体に対応する少なくとも一つの前記ROIごとにROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記ROIごとにプーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記ROIごとにコンカチネート(Concatenating)させて統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を適用させて前記ROIごとの前記プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記ROIごとにコンカチネートさせて前記統合特徴マップを生成させる段階:(b)前記学習装置が、(b1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された第1調整特徴マップ(Adjusted Feature Map)を生成させ、(b2)(i)第2リシェイプレイヤをもって、前記第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された第2調整特徴マップを生成させる段階;及び(c)前記学習装置が、(c1)(i)第2トランスポーズレイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとにピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する物体情報を生成させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとに前記ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する前記物体情報を生成させた後、(c2)ロスレイヤをもって、前記物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習する段階;を含むことを特徴とする学習方法、学習装置及びこれを利用したテスト方法、テスト装置に関する。
【背景技術】
【0003】
ディープコンボリューションニューラルネットワーク(Deep ConvolutioNNeural Networks;Deep CNN)は、ディープラーニング分野で起きた驚くべき発展の核心である。CNNは、文字の認識問題を解決するために90年代にすでに使用されていたが、現在のように広く使用されるようになったのは最近の研究結果の賜物である。このようなディープCNNは、2012年ImageNetイメージ分類コンテストで他の競争相手に勝って優勝を収めた。そして、コンボリューションニューラルネットワークは機械学習(Machine Learning)分野で非常に有用なツールとなった。
【0004】
そして、CNNはイメージから特徴を抽出する特徴抽出器(Feature Extractor)及びイメージ内の物体を検出するか、特徴抽出器が抽出した特徴を参照してイメージを認識する特徴分類機(Feature Classifier)を含む。
【0005】
そして、CNNの特徴抽出器はコンボリューションレイヤから構成され、特徴分類器は特徴抽出器が抽出した特徴に対してFC演算(Fully Connected Operation)を適用することができるFCレイヤから構成される。
【0006】
しかしながら、このようなFCレイヤは入力された全ての特徴に対して重み付け値を生成しなければならない不便さがあり、入力されたすべての特徴に対してFC演算を遂行しなければならないため、コンピューティング演算量が多くなる短所がある。
【0007】
また、FCレイヤではFCレイヤに入力されるイメージのサイズがFCレイヤモデルの所定サイズと一致しなければならない。そのため、このようなFCレイヤを含むCNNに予め設定されたサイズと異なるトレーニングイメージまたはテストイメージが入力される場合、コンボリューションレイヤがトレーニングイメージやテストイメージに対して当該演算を適用することができるが、FCレイヤでは前記所定サイズと異なるサイズの入力イメージが入力されるため、トレーニングイメージやテストイメージに該当演算を適用することができない。
【0008】
したがって、本発明者は、前記のようなFCレイヤの問題点を克服することができるようにするイメージ認識のためのCNNを提案することにする。
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明は、前述した問題点を全て解決することをその目的とする。
【0010】
本発明は、入力イメージのサイズに関係なしに、少なくとも一つの入力イメージ内に位置する少なくとも一つの物体を認識することができるようにするイメージ認識のためのCNNを提供することを他の目的とする。
【0011】
本発明は、特徴分類に使用される重み付け値の個数を最小化し得るようにするイメージ認識のためのCNNを提供することをまた他の目的とする。
【0012】
本発明は、特徴分類のためのコンピューティング演算量を減少させ得るようにするイメージ認識のためのCNNを提供することをまた他の目的とする。
【課題を解決するための手段】
【0013】
前記のような本発明の目的を達成し、後述する本発明の特徴的な効果を実現するための本発明の特徴的な構成は以下の通りである。
【0014】
本発明の一態様によると、イメージ認識のためのCNNのパラメータを学習する方法において、(a)少なくとも一つのトレーニングイメージが入力されると、学習装置が、(i)少なくとも一つのコンボリューションレイヤをもって、前記トレーニングイメージ上でROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの物体に対応する少なくとも一つの前記ROIごとにROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記ROIごとにプーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記ROIごとにコンカチネート(Concatenating)させて統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を適用させて前記ROIごとの前記プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記ROIごとにコンカチネートさせて前記統合特徴マップを生成させる段階;(b)前記学習装置が、(b1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された第1調整特徴マップ(Adjusted Feature Map)を生成させ、(b2)(i)第2リシェイプレイヤをもって、前記第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された第2調整特徴マップを生成させる段階;及び(c)前記学習装置が、(c1)(i)第2トランスポーズレイヤをもって、前記第2調整特徴マップを前記ピクセルごとに分離して前記ROIごとにピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに関する物体情報を生成させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとに前記ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する前記物体情報を生成させた後、(c2)ロスレイヤをもって、前記物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習する段階;を含むことを特徴とする。
【0015】
一実施例において、前記(b)段階で、前記統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記学習装置は、前記第1リシェイプレイヤをもって、前記統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、前記(b)段階で、前記第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記学習装置は、前記第2リシェイプレイヤをもって、前記第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
【0016】
一実施例において、前記ROIの個数をNとし、前記ROIごとの前記プーリング済み特徴マップの幅をM1、高さをM2とし、前記ROIごとの前記プーリング済み特徴マップのチャンネル個数をJとする場合、前記(a)段階で、前記学習装置は、(i)前記第1トランスポーズレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを、幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを、幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにすることを特徴とする。
【0017】
一実施例において、前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、前記(b)段階で、前記学習装置は、前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記第1調整特徴マップを生成させ、前記第2リシェイプレイヤをもって、幅N、高さH2、チャンネル
である前記第2リシェイプ済み特徴マップを生成させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する前記第2調整特徴マップを生成させることを特徴とする。
【0018】
一実施例において、前記(c)段階で、前記学習装置は(i)前記第2トランスポーズレイヤをもって、前記第2調整特徴マップを、N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを、前記N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させることを特徴とする。
【0019】
一実施例において、前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする。
【0020】
本発明の他の態様によると、イメージ認識のためのCNNをテストする方法において、(a)学習装置は、(1)(i)少なくとも一つのコンボリューションレイヤをもって、少なくとも一つのトレーニングイメージ上で学習用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成された学習用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの学習用物体に対応する少なくとも一つの前記学習用ROIごとに学習用ROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記学習用ROIごとに学習用プーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記学習用ROIごとにコンカチネート(Concatenating)させて学習用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を適用させて前記学習用ROIごとの前記学習用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記学習用ROIごとにコンカチネートさせて前記学習用統合特徴マップを生成させ、(2)(2−1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記学習用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記学習用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(2−2)(i)第2リシェイプレイヤをもって、前記学習用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記学習用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された学習用第2調整特徴マップを生成させ、(3)(3−1)(i)第2トランスポーズレイヤをもって、前記学習用第2調整特徴マップを前記ピクセル別に分離して前記学習用ROIごとに学習用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに関する学習用物体情報を生成させるか、(ii)前記分類レイヤをもって、前記学習用第2調整特徴マップを前記ピクセル別に分離して前記学習用ROIごとに前記学習用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに対する前記学習用物体情報を生成させた後、(3−2)ロスレイヤをもって、前記学習用物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習した状態で、少なくとも一つのテストイメージが取得されると、テスト装置が、(i)前記コンボリューションレイヤをもって、前記テストイメージ上でテスト用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたテスト用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つのテスト用物体に対応する少なくとも一つの前記テスト用ROIごとにテスト用ROI特徴マップを生成させ、(ii)(ii−1)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記テスト用ROIごとにテスト用プーリング済み特徴マップを生成させ、前記第1トランスポーズレイヤ(Transposing Layer)をもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記テスト用ROIごとにコンカチネート(Concatenating)させてテスト用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を適用させて前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記テスト用ROIごとにコンカチネートさせて前記テスト用統合特徴マップを生成させる段階;(b)前記テスト装置が、(b1)(i)前記第1リシェイプレイヤ(Reshaping Layer)をもって、前記テスト用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)前記1xH1コンボリューションレイヤをもって、前記テスト用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整されたテスト用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(b2)(i)前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第2リシェイプ済み特徴マップを生成させ、(ii)前記1xH2コンボリューションレイヤをもって、前記テスト用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整されたテスト用第2調整特徴マップを生成させる段階;及び(c)前記テスト装置が、(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとにテスト用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに関するテスト用物体情報を生成させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとに前記テスト用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに対する前記テスト用物体情報を生成させる段階;を含むことを特徴とする。
【0021】
一実施例において、前記(b)段階で、前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記テスト装置は、前記第1リシェイプレイヤをもって、前記テスト用統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記テスト用統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、前記(b)段階で、前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記テスト装置は、前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記テスト用第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
【0022】
一実施例において、前記テスト用ROIの個数をNとし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップの幅をM1、高さをM2とし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップのチャンネル個数をJとする場合、前記(a)段階で、前記テスト装置は、(i)前記第1トランスポーズレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにすることを特徴とする。
【0023】
一実施例において、前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、前記(b)段階で、前記テスト装置は、前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記テスト用第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記テスト用第1調整特徴マップを生成させ、前記第2リシェイプレイヤをもって、幅N、高さH2のサイズと
のチャンネル個数を有する前記テスト用第2リシェイプ済み特徴マップを生成させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネル個数LであるNx1xLのボリュームを有する前記テスト用第2調整特徴マップを生成させることを特徴とする。
【0024】
一実施例において、前記(c)段階で、前記テスト装置は、(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを、N個のテスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを、前記N個のテスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させることを特徴とする。
【0025】
一実施例において、前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする。
【0026】
本発明のまた他の態様によると、イメージ認識のためのCNNを学習する学習装置において、インストラクションを格納する少なくとも一つのメモリと、(I)(i)少なくとも一つのコンボリューションレイヤをもって、少なくとも一つのトレーニングイメージ上でROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの物体に対応する少なくとも一つの前記ROIごとにROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記ROIごとにプーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記ROIごとにコンカチネート(Concatenating)させて統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記ROI特徴マップに対してプーリング演算を適用させて前記ROIごとの前記プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記ROIごとにコンカチネートさせて前記統合特徴マップを生成させるプロセス、(II)(II−1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された第1調整特徴マップ(Adjusted Feature Map)を生成させ、(II−2)(i)第2リシェイプレイヤをもって、前記第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された第2調整特徴マップを生成させるプロセス、及び(III)(III−1)(i)第2トランスポーズレイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとにピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する物体情報を生成させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを前記ピクセル別に分離して前記ROIごとに前記ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記ROIごとの前記ピクセル別特徴マップを利用して前記ROIそれぞれに対する前記物体情報を生成させた後、(III−2)ロスレイヤをもって、前記物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習するプロセスを遂行するための前記インストラクションを実行するように構成された少なくとも一つのプロセッサと、を含むことを特徴とする。
【0027】
一実施例において、前記(II)プロセスで、前記統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記プロセッサは、前記第1リシェイプレイヤをもって、前記統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、前記(II)プロセスで、前記第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記プロセッサは、前記第2リシェイプレイヤをもって、前記第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
【0028】
一実施例において、前記ROIの個数をNとし、前記ROIごとの前記プーリング済み特徴マップの幅をM1、高さをM2とし、前記ROIごとの前記プーリング済み特徴マップのチャンネル個数をJとする場合、前記(I)プロセスで、前記プロセッサは(i)前記第1トランスポーズレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記ROIごとの前記プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記統合特徴マップに変換させるようにすることを特徴とする。
【0029】
一実施例において、前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、前記(II)プロセスで、前記プロセッサは、前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記第1調整特徴マップを生成させ、前記プロセッサは、前記第2リシェイプレイヤをもって、幅N、高さH2、チャンネル
である前記第2リシェイプ済み特徴マップを出力させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する前記第2調整特徴マップを生成させることを特徴とする。
【0030】
一実施例において、前記(III)プロセスで、前記プロセッサは、(i)前記第2トランスポーズレイヤをもって、前記第2調整特徴マップを、N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記第2調整特徴マップを、前記N個のROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記ROIごとの前記ピクセル別特徴マップに変換させることを特徴とする。
【0031】
一実施例において、前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする。
【0032】
本発明のまた他の態様によると、イメージ認識のためのCNNをテストするテスト装置において、インストラクションを格納する少なくとも一つのメモリと、学習装置は、(1)(i)少なくとも一つのコンボリューションレイヤをもって、少なくとも一つのトレーニングイメージ上で学習用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成された学習用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つの学習用物体に対応する少なくとも一つの前記学習用ROIごとに学習用ROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記学習用ROIごとに学習用プーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記学習用ROIごとにコンカチネート(Concatenating)させて学習用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記学習用ROI特徴マップに対してプーリング演算を適用させて前記学習用ROIごとの前記学習用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記学習用ROIごとの前記学習用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記学習用ROIごとにコンカチネートさせて前記学習用統合特徴マップを生成させ、(2)(2−1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、前記学習用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、前記学習用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(2−2)(i)第2リシェイプレイヤをもって、前記学習用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、前記学習用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された学習用第2調整特徴マップを生成させ、(3)(3−1)(i)第2トランスポーズレイヤをもって、前記学習用第2調整特徴マップを前記ピクセルごとに分離して前記学習用ROIごとの学習用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに関する学習用物体クラス情報を生成させるか、(ii)前記分類レイヤをもって、前記学習用第2調整特徴マップを前記ピクセルごとに分離して前記学習用ROIごとに前記学習用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記学習用ROIごとの前記学習用ピクセル別特徴マップを利用して前記学習用ROIそれぞれに関する前記学習用物体クラス情報を生成させた後、(3−2)ロスレイヤをもって、前記学習用物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、前記物体ロスをバックプロパゲーションして前記1xH2コンボリューションレイヤ、前記1xH1コンボリューションレイヤ、及び前記コンボリューションレイヤのうち少なくとも一部のパラメータを学習した状態で、(I)(i)前記コンボリューションレイヤをもって、少なくとも一つのテストイメージ上でテスト用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたテスト用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つのテスト用物体に対応する少なくとも一つの前記テスト用ROIごとにテスト用ROI特徴マップを生成させ、(ii)(ii−1)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を少なくとも一回適用させて前記テスト用ROIごとにテスト用プーリング済み特徴マップを生成させ、前記第1トランスポーズレイヤ(Transposing Layer)をもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを前記テスト用ROIごとにコンカチネート(Concatenating)させてテスト用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)前記プーリングレイヤをもって、前記テスト用ROI特徴マップに対してプーリング演算を適用させて前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを生成させ、前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップ上の対応する同一の各位置の前記ピクセルそれぞれを前記テスト用ROIごとにコンカチネートさせて前記テスト用統合特徴マップを生成させるプロセス、(II)(II−1)(i)前記第1リシェイプレイヤ(Reshaping Layer)をもって、前記テスト用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)前記1xH1コンボリューションレイヤをもって、前記テスト用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整されたテスト用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(II−2)(i)前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第2リシェイプ済み特徴マップを生成させ、(ii)前記1xH2コンボリューションレイヤをもって、前記テスト用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整されたテスト用第2調整特徴マップを生成させるプロセス、及び(III)(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとにテスト用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに関するテスト用物体情報を生成させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを前記ピクセル別に分離して前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを生成させ、前記分類レイヤをもって、前記テスト用ROIごとの前記テスト用ピクセル別特徴マップを利用して前記テスト用ROIそれぞれに対する前記テスト用物体情報を生成させるプロセスを遂行するための前記インストラクションを実行するように構成された少なくともひとつのプロセッサと、を含むことを特徴とする。
【0033】
一実施例において、前記(II)プロセスで、前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数でない場合、前記プロセッサは、前記第1リシェイプレイヤをもって、前記テスト用統合特徴マップに少なくとも一つの第1ダミーチャンネル(Dummy Channel)を追加させて少なくとも一つの前記第1ダミーチャンネルを含む前記テスト用統合特徴マップのチャンネル個数が前記H1の倍数になるようにした後、前記テスト用統合特徴マップの前記すべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせ、前記(II)プロセスで、前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数でない場合、前記プロセッサは、前記第2リシェイプレイヤをもって、前記テスト用第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの前記第2ダミーチャンネルを含む前記テスト用第1調整特徴マップのチャンネル個数が前記H2の倍数になるようにした後、前記テスト用第1調整特徴マップの前記すべてのチャンネルのうちでそれぞれの対応する前記H2個の前記チャンネルから構成されたそれぞれの前記グループ内の前記特徴それぞれをコンカチネートさせることを特徴とする。
【0034】
一実施例において、前記テスト用ROIの個数をNとし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップの幅をM1、高さをM2とし、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップのチャンネル個数をJとする場合、前記(I)プロセスで、前記プロセッサは、(i)前記第1トランスポーズレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにするか、(ii)前記プーリングレイヤをもって、前記テスト用ROIごとの前記テスト用プーリング済み特徴マップを幅N、高さ1、チャンネルM1xM2xJである前記テスト用統合特徴マップに変換させるようにすることを特徴とする。
【0035】
一実施例において、前記1xH1コンボリューションレイヤのフィルタの個数をKとし、前記1xH2コンボリューションレイヤのフィルタの個数をLとする場合、前記(II)プロセスで、前記プロセッサは、前記第1リシェイプレイヤをもって、N×H1のサイズと
のチャンネル個数を有する前記テスト用第1リシェイプ済み特徴マップを生成させ、前記1xH1コンボリューションレイヤをもって、幅N、高さ1、チャンネルKであるNx1xKのボリュームを有する前記テスト用第1調整特徴マップを生成させ、前記プロセッサは、前記第2リシェイプレイヤをもって、幅N、高さH2、チャンネル
である前記テスト用第2リシェイプ済み特徴マップを生成させ、前記1xH2コンボリューションレイヤをもって、幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する前記テスト用第2調整特徴マップを生成させることを特徴とする。
【0036】
一実施例において、前記(III)プロセスで、前記プロセッサは、(i)前記第2トランスポーズレイヤをもって、前記テスト用第2調整特徴マップを、N個のテスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させるか、(ii)前記分類レイヤをもって、前記テスト用第2調整特徴マップを、前記N個のテスト用ROIそれぞれに対応する幅1、高さ1、チャンネルLである1x1xLのボリュームを有する前記テスト用ROIごとの前記テスト用ピクセル別特徴マップに変換させることを特徴とする。
【0037】
一実施例において、前記分類レイヤは、少なくとも一つのソフトマックス(Softmax)アルゴリズムを使用することを特徴とする。
【0038】
その他にも、本発明の方法を実行するためのコンピュータプログラムを格納するためのコンピュータ読取り可能な記録媒体がさらに提供される。
【発明の効果】
【0039】
本発明は、コンボリューションレイヤのみでイメージ認識のためのCNNを具現することにより、入力イメージのサイズに関係なしに入力イメージ内に位置する物体を認識することができる効果がある。
【0040】
また、本発明は、コンボリューションレイヤのみでイメージ認識のためのCNNを具現することにより、従来のFCレイヤを利用する場合に比べて特徴分類のために使用される重み付け値の個数を最小化することができる他の効果がある。
【0041】
また、本発明は、コンボリューションレイヤのみでイメージ認識のためのCNNを具現することにより、従来のFCレイヤを利用する場合に比べて特徴分類のためのコンピューティング演算量を減少させることができるまた他の効果がある。
【0042】
本発明の実施例の説明に利用されるために添付された以下の図面は、本発明の実施例のうち単に一部であるに過ぎず、本発明の属する技術分野において通常の知識を有する者(以下「通常の技術者」)にとっては、発明的作業が行われずにこれらの図面に基づいて他の各図面が得られ得る。
【図面の簡単な説明】
【0043】
図1】本発明の一実施例によるイメージ認識のためのCNNを学習する学習装置を簡略に示したものである。
図2】本発明の一実施例によるイメージ認識のためのCNNを学習する方法を簡略に示したものである。
図3】本発明の一実施例によるイメージ認識のためのCNNを学習するのに使用され、プーリングレイヤによって生成されたROIごとのプーリング済み特徴マップを簡略に示したものである。
図4】本発明の一実施例によるイメージ認識のためのCNNを学習するのに使用され、ROIごとのプーリング済み特徴マップを利用して生成された統合特徴マップを簡略に示したものである。
図5a】本発明の一実施例による(i)統合特徴マップをリシェイプして生成された第1リシェイプ済み特徴マップと、(ii)第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用して生成された第1調整特徴マップを簡略に示したものである。
図5b】本発明の一実施例による(i)統合特徴マップをリシェイプして生成された第1リシェイプ済み特徴マップと、(ii)第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用して生成された第1調整特徴マップを簡略に示したものである。
図6a】本発明の一実施例による(i)第1調整特徴マップをリシェイプして生成された第2リシェイプ済み特徴マップと、(ii)第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用して生成された第2調整特徴マップを簡略に示したものである。
図6b】本発明の一実施例による(i)第1調整特徴マップをリシェイプして生成された第2リシェイプ済み特徴マップと、(ii)第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用して生成された第2調整特徴マップを簡略に示したものである。
図7】本発明の一実施例によるイメージ認識のためのCNNを学習するのに使用され、第2調整特徴マップを利用して生成されたROIごとのピクセル別特徴マップを簡略に示したものである。
図8】本発明の一実施例によるイメージ認識のためのCNNをテストするテスト装置を簡略に示したものである。
図9】本発明の一実施例によるイメージ認識のためのCNNをテストする方法を簡略に示したものである。
【発明を実施するための形態】
【0044】
後述する本発明に関する詳細な説明は、本発明の各目的、各技術的解法、及び各長所を明らかにするために本発明が実施され得る特定の実施例を例示として示す添付図面を参照する。これらの実施例は、当業者が本発明を実施することができるように十分詳細に説明される。
【0045】
また、本発明の詳細な説明及び各請求項にわたって、「含む」という単語及びそれらの変形は、他の技術的各特徴各付加物、構成要素又は段階を除外することを意図したものではない。通常の技術者にとって本発明の他の各目的、長所及び各特性が、一部は本説明書から、また一部は本発明の実施から明らかになるであろう。以下の例示及び図面は実例として提供され、本発明を限定することを意図したものではない。
【0046】
さらに、本発明は、本明細書に示された実施例のすべての可能な組合せを網羅する。本発明の多様な実施例は互いに異なるが、相互に排他的である必要はないことが理解されるべきである。例えば、ここに記載されている特定の形状、構造及び特性は、一実施例に関連して本発明の精神及び範囲を逸脱せず、かつ他の実施例で具現され得る。また、それぞれの開示された実施例内の個別の構成要素の位置又は配置は、本発明の精神及び範囲を逸脱せず、かつ変更され得ることが理解されるべきである。したがって、後述の詳細な説明は、限定的な意味として受け取ろうとするものではなく、本発明の範囲は適切に説明されるのであれば、その請求項が主張することと均等な全ての範囲とともに添付された請求項によってのみ限定される。図面において類似の参照符号は、様々な側面にわたって同一であるか、又は類似の機能を指す。
【0047】
本発明で言及している各種イメージは、舗装または非舗装道路関連のイメージを含み得、この場合、道路環境で登場し得る物体(例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物)を想定し得るが、必ずしもこれに限定されるものではなく、本発明で言及している各種イメージは、道路と関係のないイメージ(例えば、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内と関連したイメージ)でもあり得、この場合、非舗装道路、路地、空き地、海、湖、川、山、森、砂漠、空、室内環境で登場し得る物体(例えば、自動車、人、動物、植物、物、建物、飛行機やドローンのような飛行体、その他の障害物)を想定し得るが、必ずしもこれに限定されるものではない。
【0048】
以下、本発明の属する技術分野において通常の知識を有する者が本発明を容易に実施し得るようにするために、本発明の好ましい実施例について、添付された図面を参照して詳細に説明することにする。
【0049】
図1は、本発明の一実施例によるイメージ認識のためのCNNの学習装置100を簡略に示したものであり、図1を参照すると、学習装置100は通信部110とプロセッサ120とを含むことができる。
【0050】
先ず、通信部110は、少なくとも一つのトレーニングイメージを受信することができる。
【0051】
この際、トレーニングイメージはデータベース300に格納されていてもよく、データベース300にはトレーニングイメージに対応して少なくとも一つの物体に対するクラス情報の少なくとも一つの原本正解(Ground Truth)及びそれぞれの物体に対する位置情報の少なくとも一つの原本正解が格納されていてもよい。
【0052】
また、学習装置は、次のプロセスを遂行するためのコンピュータ読取り可能なインストラクション(Instruction)を格納することができるメモリ115をさらに含むことができる。一実施例によると、プロセッサ、メモリ、媒体等は統合プロセッサ(Integrated Processor)として統合され得る。
【0053】
次に、プロセッサ120は、(i)少なくとも一つのコンボリューションレイヤをもって、トレーニングイメージ上でROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて物体に対応する少なくとも一つのROIごとにROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、ROI特徴マップに対してプーリング演算を少なくとも一回適用させてROIごとにプーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、ROIごとのプーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれをROIごとにコンカチネート(Concatenating)させて統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)プーリングレイヤをもって、ROI特徴マップに対してプーリング演算を適用させてROIごとのプーリング済み特徴マップを生成させ、プーリングレイヤをもって、ROIごとのプーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれをROIごとにコンカチネートさせて統合特徴マップを生成させるプロセスを遂行することができる。そして、プロセッサ120は、(i)第1リシェイプレイヤ(Reshaping Layer)をもって、統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された第1調整特徴マップ(Adjusted Feature Map)を生成させ、(iii)第2リシェイプレイヤをもって、第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて第2リシェイプ済み特徴マップを生成させ、(iv)1xH2コンボリューションレイヤをもって、第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された第2調整特徴マップを生成させるプロセスを遂行することができる。以後、プロセッサ120は、(i)第2トランスポーズレイヤをもって、第2調整特徴マップを前記ピクセル別に分離してROIごとにピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、ROIごとのピクセル別特徴マップを利用してROIそれぞれに対する物体情報を生成させるか、(ii)分類レイヤをもって、第2調整特徴マップをピクセル別に分離してROIごとにピクセル別特徴マップを生成させ、分類レイヤをもって、ROIごとのピクセル別特徴マップを利用してROIそれぞれに対する物体情報を生成させるプロセスを遂行することができる。そして、プロセッサ120は、ロスレイヤをもって、物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、物体ロスをバックプロパゲーションして1xH2コンボリューションレイヤ、1xH1コンボリューションレイヤ、及びコンボリューションレイヤのうち少なくとも一部のパラメータを学習するプロセスを遂行することができる。
【0054】
この際、本発明の一実施例による学習装置100は、コンピューティング装置であって、プロセッサを搭載して演算能力を備えた装置であればいくらでも本発明による学習装置100として採択され得る。また、図1では一つの学習装置100のみを示したが、これに限定されず、学習装置は複数個に分けて役割を遂行することもできる。
【0055】
このように構成された本発明の一実施例による学習装置100を利用してイメージ認識のためのCNNを学習する方法を、図2を参照して説明すると以下のとおりである。
【0056】
まず、トレーニングイメージが入力されると、学習装置100が、コンボリューションレイヤ121をもって、トレーニングイメージ上で物体に対応するROIの領域をクロップし、リサイズして生成されたROIイメージそれぞれに対してコンボリューション演算を適用して、少なくとも一つの物体に対応する少なくとも一つのROIごとにROI特徴マップを生成させることができる。この際、コンボリューションレイヤ121は、ROIイメージ上に順次にコンボリューション演算を適用するために単一のコンボリューションレイヤ又は複数個のコンボリューションレイヤであり得る。
【0057】
次に、学習装置100はプーリングレイヤ122をもって、ROIごとにROI特徴マップに対してプーリング演算を適用させてROIごとのプーリング済み特徴マップP1、P2、…、PNを生成させることができる。
【0058】
一例として、図3を参照すると、ROIの個数をNとし、ROIごとのプーリング済み特徴マップP1、P2、…、PNの幅をM1、ROIごとのプーリング済み特徴マップP1、P2、…、PNの高さをM2とし、ROIごとのプーリング済み特徴マップP1、P2、…、PNのチャンネル個数をJとする場合、ROIごとのプーリング済み特徴マップP1、P2、…、PNはそれぞれM1xM2xJのボリュームを有することができる。
【0059】
次に、学習装置100は、第1トランスポーズレイヤ123をもって、プーリングレイヤ122から出力されたROIごとのプーリング済み特徴マップP1、P2、…、PN上の対応する同一の各位置のそれぞれのピクセルをROIごとにコンカチネートさせて統合特徴マップ400を生成させることができる。
【0060】
一例として、図3図4を参照すると、図3におけるROIごとのそれぞれのプーリング済み特徴マップP1、P2、…、PN上における最も左側上端のピクセルをそれぞれR1F1、R2F1、…、RNF1とする場合、ROIごとのプーリング済み特徴マップP1、P2、…、PNそれぞれにおける最も左側上端のピクセルであるR1F1、R2F1、…、RNF1をコンカチネートして、図4においてすべてのチャンネルのうち最初のチャンネルに対応する最も前面にあるラインのように幅N、高さ1である統合特徴マップ400の第1部分が生成されるようにし、この過程をROIごとのプーリング済み特徴マップP1、P2、…、PNそれぞれのピクセルの残りの部分にも繰り返し実行する。そして、ROIごとのプーリング済み特徴マップP1、P2、…、PNそれぞれにおけるピクセル個数と同一にチャンネル個数がM1xM2xJである統合特徴マップ400を生成することができる。
【0061】
一方、前記では、学習装置100が第1トランスポーズレイヤ123をもって、プーリングレイヤ122から出力されたROIごとのプーリング済み特徴マップP1、P2、…、PNを利用して統合特徴マップ400を生成させた。その他の例として、第1トランスポーズレイヤ123を使用せずにプーリングレイヤ122をもって統合特徴マップ400を生成させることができる。すなわち、その他の例として、学習装置100はプーリングレイヤ122をもって、ROIごとのROI特徴マップ上でROIそれぞれに対応する領域それぞれに対してプーリング演算を適用させてROIごとのプーリング済み特徴マップP1、P2、…、PNを生成させ、ROIごとのプーリング済み特徴マップP1、P2、…、PN上の対応する同一の各位置のそれぞれのピクセルをROIごとにコンカチネートさせて統合特徴マップ400を生成させることができる。
【0062】
次に、学習装置100は第1リシェイプレイヤ124をもって、統合特徴マップ400のすべてのチャンネルのうち、それぞれの対応するH1個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートさせて第1リシェイプ済み特徴マップ500Aを生成させることができる。
【0063】
一例として、図4図5aを参照すると、学習装置100は、第1リシェイプレイヤ124をもって、統合特徴マップ400の第1チャンネルそれぞれの特徴R1CH1、R2CH1、…、RNCH1ないし第H1チャンネルのそれぞれの特徴R1CH(H1)、R2CH(H1)、…、RNCH(H1)をコンカチネートさせ、統合特徴マップ400の第H1+1チャンネルのそれぞれの特徴R1CH(H1+1)、R2CH(H1+1)、…、RNCH(H1+1)ないし第2xH1チャンネルのそれぞれの特徴R1CH(2xH1)、R2CH(2xH1)、…、RNCH(2xH1)をコンカチネートさせることができる。つまり、学習装置100は、この過程を繰り返すことにより、幅N、高さH1、チャンネル
である第1リシェイプ済み特徴マップ500Aを生成させることができる。
【0064】
この際、統合特徴マップ400のチャンネル個数がH1の倍数でない場合、学習装置100は第1リシェイプレイヤ124をもって、統合特徴マップ400に少なくとも一つの第1ダミーチャンネルを追加させ、少なくとも一つの第1ダミーチャンネルを含む統合特徴マップ400のチャンネル個数がH1の倍数になるようにした後、統合特徴マップ400のすべてのチャンネルのうちそれぞれの対応するH1個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートさせることができる。つまり、統合特徴マップ400のチャンネル個数がH1の倍数にならないことにより、
番目のチャンネルをコンカチネートして生成された統合特徴マップ400のサイズが幅N、高さH1にならない場合、統合特徴マップ400の幅はN、高さはH1になるように少なくとも一つのゼロパディング領域を追加することができる。
【0065】
次に、学習装置100は1xH1コンボリューションレイヤ125をもって、第1リシェイプ済み特徴マップ500Aに対して1xH1コンボリューション演算を適用させてボリュームが調整された第1調整特徴マップ500Bを生成させることができる。
【0066】
一例として、図5aと図5bを参照すると、1xH1コンボリューションレイヤ125のフィルタの個数をKとする場合、学習装置100は1xH1コンボリューションレイヤ125をもって、図5aの第1リシェイプ済み特徴マップ500Aに対して1xH1コンボリューション演算を適用させて幅N、高さ1、チャンネルKのNx1xKのボリュームを有する第1調整特徴マップ500Bを生成させることができる。これを通じてコンピューティング演算量を1/H1に減少させることができるようになり、それに伴ってコンピューティング演算速度及び演算能力を増大させることができるようになる。
【0067】
この際、第1調整特徴マップ500B上の特徴R1’CH1、R2’CH1、…、RN’CH1は、それぞれ第1リシェイプ済み特徴マップ500A上の特徴R1CH1、R1CH2、…、R1CH(H1)を局地的に統合(Locally Connecting)し、第1リシェイプ済み特徴マップ500A上の特徴R2CH1、R2CH2、…、R2CH(H1)を局地的に統合し、第1リシェイプ済み特徴マップ500A上の特徴RNCH1、RNCH2、…、RNCH(H1)を局地的に統合した結果であり得る。参考までに、前記局地的統合(Locally Connecting)は、1×H1コンボリューション演算を適用することを意味する。
【0068】
次に、学習装置100は、第2リシェイプレイヤ126をもって、第1調整特徴マップ500Bのすべてのチャンネルのうちそれぞれの対応するH2個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートして第2リシェイプ済み特徴マップ600Aを生成させることができる。
【0069】
一例として、図5bと図6aを参照すると、学習装置100は、第2リシェイプレイヤ126をもって、第1調整特徴マップ500Bで第1チャンネルのそれぞれの特徴R1’CH1、R2’CH1、…、RN’CH1ないし第H1チャンネル内のそれぞれの特徴R1’CH(H1)、R2’CH(H1),…、RN’CH(H1)をコンカチネートさせ、第1調整特徴マップ500Bの第H1+1チャンネルのそれぞれの特徴R1’CH(H1+1)、R2’CH(H1+1)、…、RN’CH(H1+1)ないし第2xH1チャンネルのそれぞれの特徴R1’CH(2xH1)、R2’CH(2xH1),…、RN’CH(2xH1)をコンカチネートさせることができる。つまり、学習装置100は、このコンカチネートの過程を繰り返すことにより、幅N、高さH2、チャンネル
である第2リシェイプ済み特徴マップ600Aを生成させることができる。
【0070】
この際、第1調整特徴マップ500Bのチャンネル個数がH2の倍数でない場合、学習装置100は第2リシェイプレイヤ126をもって、第1調整特徴マップ500Bに少なくとも一つの第2ダミーチャンネルを追加させ、少なくとも一つの第2ダミーチャンネルを含む第1調整特徴マップ500Bのチャンネル個数がH2の倍数になるようにした後、第1調整特徴マップ500Bのすべてのチャンネルのうちそれぞれの対応するH2個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートさせることができる。すなわち、第1調整特徴マップ500Bのチャンネル個数がH2の倍数にならないことにより、
番目のチャンネルをコンカチネートして生成された第1調整特徴マップ500Bのサイズが幅はN、高さはH2にならない場合、第1調整特徴マップ500Bの幅はN、高さはH2になるように少なくとも一つのゼロパディング領域を追加することができる。
【0071】
次に、学習装置100は、1xH2コンボリューションレイヤ127をもって、第2リシェイプ済み特徴マップ600Aに対して1xH2コンボリューション演算を適用させてボリュームが調整された第2調整特徴マップ600Bを生成させることができる。
【0072】
一例として、図6aと図6bを参照すると、1xH2コンボリューションレイヤ127のフィルタの個数をLとする場合、学習装置100は1xH2コンボリューションレイヤ127をもって、図6aの第2リシェイプ済み特徴マップ600Aに対して1xH2コンボリューション演算を適用させて幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する第2調整特徴マップ600Bを生成させることができる。これを通じて、コンピューティング演算量を1/H2に減少させることができるようになり、それに伴ってコンピューティング演算速度及び演算能力を増大させることができるようになる。この場合、第2調整特徴マップ600B上の特徴R1”CH1、R2”CH1、…、RN”CH1はそれぞれ第2リシェイプ済み特徴マップ600A上の特徴R1’CH1、R1’CH2、…、R1’CH(H2)を局地的に統合(Locally Connecting)し、第2リシェイプ済み特徴マップ600A上の特徴R2’CH1、R2’CH2、…、R2’CH(H2)を局地的に統合し、第2リシェイプ済み特徴マップ600A上の特徴RN’CH1、RN’CH2、…、RN’CH(H2)を局地的に統合した結果であり得る。参考までに、前記局地的統合(Locally Connecting)は、1×H2コンボリューション演算を適用することを意味する。
【0073】
次に、学習装置100は、第2トランスポーズレイヤ128をもって、第2調整特徴マップ600Bをピクセル別に分離してROIごとのピクセル別特徴マップPW1、PW2、…、PWNを生成させることができる。
【0074】
一例として、図7を参照すると、学習装置100は第2トランスポーズレイヤ128をもって、図6bの幅N、高さ1、チャンネルLであるNx1xLのボリュームを有する第2調整特徴マップ600Bをピクセル別に分離して幅1、高さ1、チャンネルLであるROIごとのピクセル別特徴マップPW1、PW2、…、PWNを生成させる。
【0075】
次に、学習装置100は、分類レイヤ129をもって、ROIごとのピクセル別特徴マップPW1、PW2、…PWNを利用してROIそれぞれに対する物体情報を生成させることができる。この際、分類レイヤ129はソフトマックス(Softmax)アルゴリズムを使用することができ、それぞれのROI内の物体それぞれがどのような種類の物体であるのか認知された結果を生成し、認知された結果が正答である可能性に関する確率情報を生成させることができる。これに加えて、物体情報はトレーニングイメージ内のそれぞれの物体位置情報を含むこともできる。
【0076】
一方、前記では、第2トランスポーズレイヤ128が第2調整特徴マップ600Bを利用してROIごとのピクセル別特徴マップPW1、PW2、…、PWNを生成することができる。その他の例として、分類レイヤ129は、第2トランスポーズレイヤ128を使用せずに第2調整特徴マップ600Bを利用してROIごとのピクセル別特徴マップPW1、PW2、…、PWNを生成させることができる。つまり、学習装置100は分類レイヤ129をもって、第2調整特徴マップ600Bをピクセル別に分離してROIごとのピクセル別特徴マップPW1、PW2、…、PWNを生成させ、分類レイヤ129をもって、ROIごとのピクセル別特徴マップを利用してROIそれぞれに対する物体情報を生成させることができる。
【0077】
次に、学習装置100は、ロスレイヤ130をもって、物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、物体ロスを利用したバックプロパゲーションを通じて1xH2コンボリューションレイヤ127、1xH1コンボリューションレイヤ125、及びコンボリューションレイヤ121のうち少なくとも一部のパラメータを学習することができる。
【0078】
前記のように、本発明の一実施例によるイメージ認識のためのCNNは、コンボリューションレイヤのみで構成されることにより、入力イメージのサイズに関係なしに正常に入力イメージ内の物体を認識することができる。また、本発明の一実施例によるイメージ認識のためのCNNは、1xHコンボリューションの局地的統合の演算を適用することにより、従来のFCレイヤのFC(Fully Connected)演算に比べてコンピューティング演算量を減少させることができるようになる。
【0079】
図8は、本発明の一実施例によるイメージ認識のためのCNNのテスト装置200を簡略に示したものであり、図8を参照すると、テスト装置200は通信部210とプロセッサ220とを含むことができる。
【0080】
また、テスト装置200は、次のプロセスを遂行するためのコンピュータ読取り可能なインストラクション(Instruction)を格納することができるメモリ215をさらに含むことができる。一実施例によると、プロセッサ、メモリ、媒体等は統合プロセッサ(Integrated Processor)として統合され得る。
【0081】
先ず、通信部210は、少なくとも一つのテストイメージを取得するか、他の装置をもって取得するように支援することができる。
【0082】
この際、本発明の一実施例によるイメージ認識のためのCNNは、図1ないし図7を参照して説明した学習方法によって学習された状態であり得る。
【0083】
参考までに、以下の説明で混同を避けるために「学習用」という文句は、先に説明した学習プロセスに関する用語について追加され、「テスト用」という文句はテストプロセスに関する用語について追加される。
【0084】
つまり、少なくとも一つのトレーニングイメージが取得されると、学習装置は、(a)(i)コンボリューションレイヤをもって、トレーニングイメージ上で学習用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成された学習用ROIイメージそれぞれに対してコンボリューション演算を適用させて少なくとも一つの学習用物体に対応する少なくとも一つの学習用ROIごとの学習用ROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、学習用ROI特徴マップに対してプーリング演算を適用させて学習用ROIごとの学習用プーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、学習用ROIごとの学習用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを学習用ROIごとにコンカチネート(Concatenating)させて学習用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)プーリングレイヤをもって、学習用ROI特徴マップに対してプーリング演算を適用させて学習用ROIごとの学習用プーリング済み特徴マップを生成させ、プーリングレイヤをもって、学習用ROIごとの学習用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれを学習用ROIごとにコンカチネートさせて学習用統合特徴マップを生成させ、(b)(b1)(i)第1リシェイプレイヤ(Reshaping Layer)をもって、学習用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、学習用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整された学習用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(b2)(i)第2リシェイプレイヤをもって、学習用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせて学習用第2リシェイプ済み特徴マップを生成させ、(ii)1xH2コンボリューションレイヤをもって、学習用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整された学習用第2調整特徴マップを生成させ、(c)(c1)(i)第2トランスポーズレイヤをもって、学習用第2調整特徴マップをピクセル別に分離して学習用ROIごとの学習用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、学習用ROIごとの学習用ピクセル別特徴マップを利用して学習用ROIそれぞれに対する学習用物体情報を生成させるか、(ii)分類レイヤをもって、学習用第2調整特徴マップをピクセル別に分離して学習用ROIごとに学習用ピクセル別特徴マップを生成させ、分類レイヤをもって、学習用ROIごとの学習用ピクセル別特徴マップを利用して学習用ROIそれぞれに対する学習用物体情報を生成させた後、(c2)ロスレイヤをもって、学習用物体情報とこれに対応する原本正解とを参照して少なくとも一つの物体ロスを算出させることにより、物体ロスをバックプロパゲーションして1xH2コンボリューションレイヤ、1xH1コンボリューションレイヤ、及びコンボリューションレイヤのうち少なくとも一部のパラメータを学習するプロセスを遂行した状態であり得る。次に、プロセッサ220は、(i)コンボリューションレイヤをもって、テストイメージ上でテスト用ROIの領域をクロップ(Crop)し、リサイズ(Resize)して生成されたテスト用ROIイメージそれぞれに対してコンボリューション演算を少なくとも一回適用させて少なくとも一つのテスト用物体に対応する少なくとも一つのテスト用ROIごとにテスト用ROI特徴マップを生成させ、(ii)(ii−1)プーリングレイヤをもって、テスト用ROI特徴マップに対してプーリング演算を少なくとも一回適用させてテスト用ROIごとにテスト用プーリング済み特徴マップを生成させ、第1トランスポーズレイヤ(Transposing Layer)をもって、テスト用ROIごとのテスト用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれをテスト用ROIごとにコンカチネート(Concatenating)させてテスト用統合特徴マップ(Integrated Feature Map)を生成させるか、(ii−2)プーリングレイヤをもって、テスト用ROI特徴マップに対してプーリング演算を適用させてテスト用ROIごとのテスト用プーリング済み特徴マップを生成させ、プーリングレイヤをもって、テスト用ROIごとのテスト用プーリング済み特徴マップ上の対応する同一の各位置のピクセルそれぞれをテスト用ROIごとにコンカチネートさせてテスト用統合特徴マップを生成させるプロセスを遂行することができる。そして、プロセッサ(220)は、(i)第1リシェイプレイヤ(Reshaping Layer)をもって、テスト用統合特徴マップのすべてのチャンネルのうちでそれぞれに対応するH1個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第1リシェイプ済み特徴マップ(Reshaped Feature Map)を生成させ、(ii)1xH1コンボリューションレイヤをもって、テスト用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリューム(Volume)が調整されたテスト用第1調整特徴マップ(Adjusted Feature Map)を生成させ、(iii)第2リシェイプレイヤをもって、テスト用第1調整特徴マップのすべてのチャンネルのうちでそれぞれに対応するH2個のチャンネルから構成されたそれぞれのグループ内の特徴それぞれをコンカチネートさせてテスト用第2リシェイプ済み特徴マップを生成させ、(vi)1xH2コンボリューションレイヤをもって、テスト用第2リシェイプ済み特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整されたテスト用第2調整特徴マップを生成させるプロセスを遂行することができる。以後、プロセッサ220は、(i)第2トランスポーズレイヤをもって、テスト用第2調整特徴マップを前記ピクセル別に分離してテスト用ROIごとにテスト用ピクセル別特徴マップ(Pixel−Wise Feature Map)を生成させ、分類レイヤをもって、テスト用ROIごとのテスト用ピクセル別特徴マップを利用してテスト用ROIそれぞれに関するテスト用物体情報を生成させるか、(ii)分類レイヤをもって、テスト用第2調整特徴マップをピクセル別に分離してテスト用ROIごとにテスト用ピクセル別特徴マップを生成させ、分類レイヤをもって、テスト用ROIごとのテスト用ピクセル別特徴マップを利用してテスト用ROIそれぞれに関するテスト用物体情報を生成するようにプロセスを遂行することができる。
【0085】
この際、本発明の一実施例によるテスト装置200は、コンピューティング装置であって、プロセッサを搭載して演算能力を備えた装置であればいくらでも本発明によるテスト装置200として採択され得る。また、図8では一つのテスト装置200のみを示したが、これに限定されず、テスト装置は複数個に分けて役割を遂行することもできる。
【0086】
このように構成された本発明の一実施例によるテスト装置200を利用してイメージ認識のためのCNNをテストする方法を、図9を参照して説明すると次のとおりである。以下の説明で、図1ないし図7を参照して説明した学習方法から容易に理解可能な部分については詳細な説明を省略することとする。
【0087】
まず、図1ないし図7を参照して説明した学習方法によってコンボリューションレイヤ221、1xH1コンボリューションレイヤ225、及び1xH2コンボリューションレイヤ227が学習された状態でテストイメージが入力されると、テスト装置200がコンボリューションレイヤ221をもって、テストイメージ上でテスト用物体に対応するテスト用ROIの領域をクロップしてリサイズしたテスト用ROIイメージそれぞれに対してコンボリューション演算を適用してテスト用ROIごとのテスト用ピクセル別特徴マップを生成させる。この際、コンボリューションレイヤ221は、テスト用ROIイメージに対して順次にコンボリューション演算のための単一コンボリューションレイヤ又は複数個のコンボリューションレイヤであり得る。
【0088】
次に、テスト装置200は、プーリングレイヤ222をもって、テスト用ROIごとのテスト用ピクセル別特徴マップに対してプーリング演算を適用してテスト用ROIごとのテスト用プーリング済み特徴マップを生成させることができる。
【0089】
次に、テスト装置200は、第1トランスポーズレイヤ223をもって、プーリングレイヤ222から出力されたテスト用ROIごとのテスト用プーリング済み特徴マップ上の対応する同一の各位置のそれぞれのピクセルをテスト用ROIごとにコンカチネートさせてテスト用統合特徴マップを生成させることができる。
【0090】
一方、前記では、テスト装置200が第1トランスポーズレイヤ223をもって、プーリングレイヤ222から出力されたテスト用ROIごとのテスト用プーリング済み特徴マップを利用してテスト用統合特徴マップを生成させることができる。その他の例として、テスト装置200は、第1トランスポーズレイヤ223を使用せずに、プーリングレイヤ222をもってテスト用統合特徴マップを生成させることができる。つまり、テスト装置200は、プーリングレイヤ222をもって、テスト用ROIごとのテスト用ROI特徴マップに対してプーリング演算を適用させてテスト用ROIごとのテスト用プーリング済み特徴マップを生成させ、テスト用ROIごとのテスト用プーリング済み特徴マップ上の対応する同一の各位置のそれぞれのピクセルをテスト用ROIごとにコンカチネートしてテスト用統合特徴マップを生成させることができる。
【0091】
次に、テスト装置200は、第1リシェイプレイヤ224をもって、テスト用統合特徴マップのすべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートさせてテスト用第1リシェイプ済み特徴マップを生成させることができる。
【0092】
この際、テスト用統合特徴マップのチャンネル個数がH1の倍数でない場合、テスト装置200は第1リシェイプレイヤ224をもって、テスト用統合特徴マップに少なくとも一つの第1ダミーチャンネルを追加して少なくとも一つの第1ダミーチャンネルを含むテスト用統合特徴マップのチャンネル個数がH1の倍数になるようにした後、テスト用統合特徴マップのすべてのチャンネルのうちでそれぞれの対応するH1個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートさせることができる。つまり、テスト用統合特徴マップのチャンネル個数がH1の倍数にならないことにより、
番目のチャンネルをコンカチネートして生成されたテスト用統合特徴マップのサイズが幅N、高さH1にならない場合、テスト用統合特徴マップの幅がN、高さがH1になるように少なくとも一つのゼロパディング領域を追加することができる。
【0093】
次に、テスト装置200は、1xH1コンボリューションレイヤ225をもって、テスト用第1リシェイプ済み特徴マップに対して1xH1コンボリューション演算を適用させてボリュームが調整されたテスト用第1調整特徴マップを生成させることができる。
【0094】
次に、テスト装置200は第2リシェイプレイヤ226をもって、テスト用第1調整特徴マップのすべてのチャンネルのうちでそれぞれの対応するH2個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートさせてテスト用第2リシェイプ済み特徴マップを生成させることができる。
【0095】
この際、テスト用第1調整特徴マップのチャンネル個数がH2の倍数でない場合、テスト装置200は第2リシェイプレイヤ226をもって、テスト用第1調整特徴マップに少なくとも一つの第2ダミーチャンネルを追加させて少なくとも一つの第2ダミーチャンネルを含むテスト用第1調整特徴マップのチャンネル個数がH2の倍数になるようにした後、テスト用第1調整特徴マップのすべてのチャンネルのうちでそれぞれの対応するH2個のチャンネルから構成されたそれぞれのグループ内のそれぞれの特徴をコンカチネートさせることができる。つまり、テスト用第1調整特徴マップのチャンネル個数がH2の倍数にならないことにより、
番目のチャンネルをコンカチネートして生成されたテスト用第1調整特徴マップのサイズが幅N、高さH2にならない場合、テスト用第1調整特徴マップの幅がN、高さがH2になるように少なくとも一つのゼロパディング領域を追加することができる。
【0096】
次に、テスト装置200は、1xH2コンボリューションレイヤ227をもって、テスト用第2リシェイプ特徴マップに対して1xH2コンボリューション演算を適用させてボリュームが調整されたテスト用第2調整特徴マップを生成させることができる。
【0097】
次に、テスト装置200は第2トランスポーズレイヤ228をもって、テスト用第2調整特徴マップをピクセル別に分離させてテスト用ROIごとのテスト用ピクセル別特徴マップを生成させることができる。
【0098】
次に、テスト装置200は分類レイヤ229をもって、テスト用ROIごとのテスト用ピクセル別特徴マップを利用してテスト用ROIに関するテスト用物体情報を生成させることができる。この際、分類レイヤ229は、ソフトマックスアルゴリズムを使用することができ、それぞれのテスト用ROI内のテスト用物体がどのような種類の物体であるのか認知した結果を生成することができ、認知した結果が正答である可能性に関する確率情報を生成させることができる。これに加えて、テスト用物体情報は、テストイメージ内にテスト用物体それぞれの位置情報を含むこともできる。
【0099】
一方、前記では、第2トランスポーズレイヤ228は、テスト用第2調整特徴マップを利用してテスト用ROIごとのテスト用ピクセル別特徴マップを生成させることができる。その他の例として、分類レイヤ229は、第2トランスポーズレイヤ228を使用せずに、テスト用第2調整特徴マップを利用してテスト用ROIごとのテスト用ピクセル別特徴マップを生成させることができる。つまり、テスト装置200は分類レイヤ229をもって、テスト用第2調整特徴マップをピクセル別に分離させてテスト用ROIごとのテスト用ピクセル別特徴マップを生成し、分類レイヤ229をもって、テスト用ROIごとのテスト用ピクセル別特徴マップを利用してテスト用ROIそれぞれに関するテスト用物体情報を生成させることができる。
【0100】
前記学習方法とテスト方法は、KPI(Key Performance Index、重要業績評価指標)を満たすハードウェアの最適化に使用されるために提供され得る。
【0101】
また、以上にて説明された本発明による実施例は、多様なコンピュータの構成要素を通じて遂行することができるプログラム命令語の形態で具現されて、コンピュータ読取り可能な記録媒体に格納され得る。前記コンピュータ読取り可能な記録媒体はプログラム命令語、データファイル、データ構造などを単独で又は組み合わせて含むことができる。前記コンピュータ読取り可能な記録媒体に格納されるプログラム命令語は、本発明のために特別に設計され、構成されたものであるか、コンピュータソフトウェア分野の当業者に公知にされて使用可能なものであり得る。コンピュータ読取り可能な記録媒体の例には、ハードディスク、フロッピーディスク及び磁気テープのような磁気媒体、CD−ROM、DVDのような光記録媒体、フロプティカル・ディスク(Floptical Disk)のような磁気−光メディア(Magneto−Optical Media)、及びROM、RAM、フラッシュメモリなどのようなプログラム命令語を格納して遂行するように特別に構成されたハードウェア装置が含まれる。プログラム命令語の例には、コンパイラによって作られるもののような機械語コードだけでなく、インタープリターなどを使用してコンピュータによって実行される高級言語コードも含まれる。前記ハードウェア装置は、本発明による処理を実行するために一つ以上のソフトウェアモジュールとして作動するように構成され得、その反対も同様である。
【0102】
以上にて本発明が具体的な構成要素などのような特定事項と限定された実施例及び図面によって説明されたが、これは本発明のより全般的な理解の一助とするために提供されたものであるに過ぎず、本発明が前記実施例に限られるものではなく、本発明が属する技術分野において通常の知識を有する者であれば、かかる記載から多様な修正及び変形が行われ得る。
【0103】
従って、本発明の思想は、前記説明された実施例に局限されて定められてはならず、後述する特許請求の範囲だけでなく、本特許請求の範囲と均等または等価的に変形されたものすべては、本発明の思想の範囲に属するといえる。
【符号の説明】
【0104】
100:学習装置
200:テスト装置
110、210:通信部
120、220:プロセッサ
300:データベース
図1
図2
図3
図4
図5a
図5b
図6a
図6b
図7
図8
図9