特許7552880 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 日本電気株式会社の特許一覧

特許7552880ニューラルネットワーク構造探索装置およびニューラルネットワーク構造探索方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-09-09

(45)【発行日】2024-09-18

(54)【発明の名称】ニューラルネットワーク構造探索装置およびニューラルネットワーク構造探索方法

(51)【国際特許分類】

G06N 3/082 20230101AFI20240910BHJP

G06N 3/0464 20230101ALI20240910BHJP

【ＦＩ】

G06N3/082

G06N3/0464

【請求項の数】 9

(21)【出願番号】P 2023515912

(86)(22)【出願日】2021-04-20

(86)【国際出願番号】 JP2021015964

(87)【国際公開番号】W WO2022224330

(87)【国際公開日】2022-10-27

【審査請求日】2023-09-06

(73)【特許権者】

【識別番号】000004237

【氏名又は名称】日本電気株式会社

(74)【代理人】

【識別番号】100103090

【弁理士】

【氏名又は名称】岩壁冬樹

(74)【代理人】

【識別番号】100124501

【弁理士】

【氏名又は名称】塩川誠人

(72)【発明者】

【氏名】小林悠記

【審査官】桜井茂行

(56)【参考文献】

【文献】米国特許出願公開第２０１６／０３５８０７０（ＵＳ，Ａ１）

【文献】特開２０２０－１９０９９６（ＪＰ，Ａ）

【文献】米国特許出願公開第２０２０／０３７２３２５（ＵＳ，Ａ１）

【文献】中国特許出願公開第１１０７６６１４５（ＣＮ，Ａ）

【文献】米国特許出願公開第２０２１／０１８２６８２（ＵＳ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／００－９９／００

(57)【特許請求の範囲】

【請求項1】

第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行う訓練手段と、
前記訓練により前記ニューラルネットワークモデルから生成された訓練済モデルを前記訓練用のデータセットを用いて解析することによって、前記第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成する第１生成手段と、
生成された解析情報を用いて前記第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定する特定手段と、
特定された要素を前記第１のニューラルネットワーク構造から削除することによって、前記第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成する第２生成手段とを備え、
前記各要素には、前記第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれ、
前記第２生成手段は、特定された重みが所定の割合以上含まれるカーネルを削除する
ことを特徴とするニューラルネットワーク構造探索装置。

【請求項2】

各要素には、第１のニューラルネットワーク構造を構成する層が含まれる
請求項１記載のニューラルネットワーク構造探索装置。

【請求項3】

第２生成手段は、層における演算器の処理時間を用いて特定された要素のうち削除する要素を決定する
請求項２記載のニューラルネットワーク構造探索装置。

【請求項4】

第２生成手段は、層における演算器の実行効率を用いて特定された要素のうち削除する要素を決定する
請求項２または請求項３記載のニューラルネットワーク構造探索装置。

【請求項5】

第１生成手段は、訓練用のデータセット中のデータを訓練済モデルに入力することによって得られる活性化率を基に重要度を算出する
請求項１から請求項４のうちのいずれか１項に記載のニューラルネットワーク構造探索装置。

【請求項6】

第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行い、
前記訓練により前記ニューラルネットワークモデルから生成された訓練済モデルを前記訓練用のデータセットを用いて解析することによって、前記第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成し、
生成された解析情報を用いて前記第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定し、
特定された要素を前記第１のニューラルネットワーク構造から削除することによって、前記第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成し、
前記各要素には、前記第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれ、
特定された要素を前記第１のニューラルネットワーク構造から削除するときに、特定された重みが所定の割合以上含まれるカーネルを削除する
ことを特徴とするニューラルネットワーク構造探索方法。

【請求項7】

各要素には、第１のニューラルネットワーク構造を構成する層が含まれる
請求項６記載のニューラルネットワーク構造探索方法。

【請求項8】

コンピュータに、
第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行う訓練処理、
前記訓練により前記ニューラルネットワークモデルから生成された訓練済モデルを前記訓練用のデータセットを用いて解析することによって、前記第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成する第１生成処理、
生成された解析情報を用いて前記第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定する特定処理、および
特定された要素を前記第１のニューラルネットワーク構造から削除することによって、前記第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成する第２生成処理を実行させ、
前記各要素には、前記第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれ、
前記コンピュータに、前記第２生成処理で、特定された重みが所定の割合以上含まれるカーネルを削除させる
ためのニューラルネットワーク構造探索プログラム。

【請求項9】

各要素には、第１のニューラルネットワーク構造を構成する層が含まれる
請求項８記載のニューラルネットワーク構造探索プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、ニューラルネットワーク構造探索装置、ニューラルネットワーク構造探索方法およびニューラルネットワーク構造探索プログラムに関する。特に、本発明は、探索に求められる訓練回数を削減することによって短時間で最適なニューラルネットワーク構造を導出するニューラルネットワーク構造探索装置、ニューラルネットワーク構造探索方法およびニューラルネットワーク構造探索プログラムに関する。

【背景技術】

【0002】

ニューラルネットワーク構造は、深層学習の分野で使用される代表的な数理的モデルの構造である。ニューラルネットワーク構造には、層数、各層のチャネル数、カーネルサイズ等が含まれる。

【0003】

また、最適なニューラルネットワーク構造を求めるためには、高い認識精度が保たれたまま、認識処理が高速に実行されるニューラルネットワークの構造を探索する作業が必要である。この作業は、例えば、ＡＩ（Artificial Intelligence ）に精通した研究者や技術者により、各自の経験を基に属人的に行われることが多かった。

【0004】

上記の手動でのニューラルネットワーク構造探索作業に対して、ニューラルネットワーク構造探索を自動的に行う手法であるＮＡＳ（Neural Architecture Search）が、いくつか提案されている。

【0005】

例えば、非特許文献１には、強化学習により、人間が設計したニューラルネットワーク構造よりも高い認識精度を有するニューラルネットワーク構造を求める技術が記載されている。

【0006】

また、非特許文献２には、探索問題を連続的に緩和して微分可能とすることによって、強化学習によらない探索を実行できる技術が記載されている。

【0007】

また、非特許文献３には、認識処理の効率が比較的良いニューラルネットワーク構造の部品をボトムアップ的に積み上げて組み合わせていくことによって、認識処理が高速で実行され、かつ認識精度が高いニューラルネットワーク構造を導出する技術が記載されている。

【0008】

また、非特許文献４には、ニューラルネットワーク構造の一例であるM2Det が記載されている。

【先行技術文献】

【非特許文献】

【0009】

【文献】Barret Zoph and Quoc V. Le, ”Neural Architecture Search with Reinforcement Learning,” Under review as a conference paper at ICLR 2017.

【文献】Hanxiao Liu, Karen Simonyan, and Yiming Yang, ”DARTS: Differentiable Architecture Search,” Published as a conference paper at ICLR 2019.

【文献】X. Zhang, et al., “SkyNet: A hardware-efficient method for object detection and tracking on embedded systems,” in Proc. Conf. Mach. Learn. Syst., 2020, pp. 216-229.

【文献】Q. Zhao, et al., “M2Det: A Single-Shot Object Detector Based on Multi-Level Feature Pyramid Network,” pp. 9259-9266, Vol. 33 No. 01: AAAI-19.

【発明の概要】

【発明が解決しようとする課題】

【0010】

ニューラルネットワーク構造探索において、探索対象のニューラルネットワーク構造は膨大に存在する。かつ、ニューラルネットワーク構造の精度評価のためには、探索中に時間を要する「訓練（Training、学習（Learning）と同義）」を繰り返し実行することが求められる。

【0011】

その理由は、ニューラルネットワーク構造だけ考案されても、考案されたニューラルネットワーク構造の認識精度は不明であるためである。認識精度を確認するためには、訓練用のデータセットを用いて考案されたニューラルネットワーク構造の重みを決定することが求められるからである。

【0012】

また、ニューラルネットワーク構造の認識精度は、一般的に、層数やチャネル数が増やされたとして必ずしも向上するわけではなく、層数やチャネル数が減らされたとして必ずしも低下するわけでもない。どのような構造であれば認識精度が高くなるかは、順伝搬と逆伝搬を繰り返しながら重みを漸次更新する訓練が実行されないと判明しない。

【0013】

例えば、１回の訓練が完了するまでには、数時間から数日が求められる。また、探索中には訓練が何十回も繰り返し実行されることが求められる。すなわち、ニューラルネットワーク構造探索では、豊富な計算機資源が求められる点や、探索期間が長期化する点が課題である。

【0014】

非特許文献１に記載されている技術においても、８００台のＧＰＵ（Graphics Processing Unit）を長期間稼働させることが求められる等、探索に要する計算コストが膨大になることが課題である。

【0015】

また、非特許文献２～３に記載されている技術も、数回以上の訓練が繰り返し実行されることが求められるため、短時間で探索を完了させることが困難である。

【0016】

さらに、非特許文献４に記載されているニューラルネットワーク構造等、公開されている高精度なニューラルネットワーク構造に対するニューラルネットワーク構造探索の手法は、開示されていない。

【0017】

すなわち、ニューラルネットワーク構造を用いるアプリケーションが求める認識精度を保ちつつ、ニューラルネットワーク構造を最適化して認識処理の実行速度が速くなるニューラルネットワーク構造を効率的に導出する手法は、開示されていない。

【0018】

そこで、本発明は、ニューラルネットワーク構造の探索に要する訓練の回数を削減できるニューラルネットワーク構造探索装置、ニューラルネットワーク構造探索方法およびニューラルネットワーク構造探索プログラムを提供することを目的とする。

【課題を解決するための手段】

【0019】

本発明によるニューラルネットワーク構造探索装置は、第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行う訓練手段と、訓練によりニューラルネットワークモデルから生成された訓練済モデルを訓練用のデータセットを用いて解析することによって、第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成する第１生成手段と、生成された解析情報を用いて第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定する特定手段と、特定された要素を第１のニューラルネットワーク構造から削除することによって、第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成する第２生成手段とを備え、各要素には、第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれ、第２生成手段は、特定された重みが所定の割合以上含まれるカーネルを削除することを特徴とする。

【0020】

本発明によるニューラルネットワーク構造探索方法は、第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行い、訓練によりニューラルネットワークモデルから生成された訓練済モデルを訓練用のデータセットを用いて解析することによって、第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成し、生成された解析情報を用いて第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定し、特定された要素を第１のニューラルネットワーク構造から削除することによって、第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成し、各要素には、第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれ、特定された要素を第１のニューラルネットワーク構造から削除するときに、特定された重みが所定の割合以上含まれるカーネルを削除することを特徴とする。

【0021】

本発明によるニューラルネットワーク構造探索プログラムは、コンピュータに、第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行う訓練処理、訓練によりニューラルネットワークモデルから生成された訓練済モデルを訓練用のデータセットを用いて解析することによって、第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成する第１生成処理、生成された解析情報を用いて第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定する特定処理、および特定された要素を第１のニューラルネットワーク構造から削除することによって、第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成する第２生成処理を実行させ、各要素には、第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれ、コンピュータに、第２生成処理で、特定された重みが所定の割合以上含まれるカーネルを削除させることを特徴とする。

【発明の効果】

【0022】

本発明によれば、ニューラルネットワーク構造の探索に要する訓練の回数を削減できる。

【図面の簡単な説明】

【0023】

【図1】本発明の実施形態のニューラルネットワーク構造探索装置の構成例を示すブロック図である。

【図2】畳み込みニューラルネットワークの例を示す説明図である。

【図3】CNN における畳み込みの計算の例を示す説明図である。

【図4】モデル解析情報の例を示す説明図である。

【図5】モデル解析情報の他の例を示す説明図である。

【図6】本実施形態のニューラルネットワーク構造探索装置１００によるニューラルネットワーク構造探索処理の動作を示すフローチャートである。

【図7】本実施形態のニューラルネットワーク構造探索装置１００による他のニューラルネットワーク構造探索処理の動作を示すフローチャートである。

【図8】本発明によるニューラルネットワーク構造探索装置のハードウェア構成例を示す説明図である。

【図9】本発明によるニューラルネットワーク構造探索装置の概要を示すブロック図である。

【発明を実施するための形態】

【0024】

以下、本発明の実施形態を図面を参照して説明する。本発明に係るニューラルネットワーク構造探索装置は、ニューラルネットワーク構造の探索に多くの回数の訓練が求められるという課題を解決できる装置である。

【0025】

具体的には、本発明に係るニューラルネットワーク構造探索装置は、与えられた訓練データセットに基づいて、最初にニューラルネットワーク構造を有するニューラルネットワークモデル全体に対する訓練を行う。なお、訓練データセットは、訓練に使用される訓練用のデータセットである。訓練データセットには、予め正解を示すラベルが付されている。

【0026】

訓練されたニューラルネットワークモデルである訓練済モデルからは、訓練結果であるニューラルネットワーク構造の重み等の情報が得られる。次いで、ニューラルネットワーク構造探索装置は、訓練結果を解析した上で、認識精度が維持されつつも規模が小さくなるように、新たなニューラルネットワーク構造を決定する。

【0027】

［構成の説明］
図１は、本発明の実施形態のニューラルネットワーク構造探索装置の構成例を示すブロック図である。

【0028】

図１に示すように、本実施形態のニューラルネットワーク構造探索装置１００は、訓練手段１１０と、訓練済モデル解析手段１２０と、最適ニューラルネットワーク構造決定手段１３０とを含む。各手段は、それぞれ以下のように動作する。

【0029】

訓練手段１１０は、入力として第１のニューラルネットワーク構造と、訓練データセットとを受け取る。次いで、訓練手段１１０は、第１のニューラルネットワーク構造を有するニューラルネットワークモデルを生成する。訓練手段１１０は、生成されたニューラルネットワークモデルに対して訓練データセットを用いて、深層学習における訓練を行う。訓練手段１１０は、訓練結果である訓練済モデルを訓練済モデル解析手段１２０に入力する。

【0030】

訓練手段１１０に入力される第１のニューラルネットワーク構造は、例えば既に公開されている、高い認識精度を有するニューラルネットワーク構造である。

【0031】

本実施形態で想定されている第１のニューラルネットワーク構造は、例えば畳み込みニューラルネットワーク（Convolutional Neural Network; CNN ）の構造である。畳み込みニューラルネットワークは、畳み込み層とプーリング層の２種類の層が交互に積み重ねられた構造を持つフィードフォーワード型のニューラルネットワークである。以下、畳み込みニューラルネットワークを単にCNN とも呼ぶ。

【0032】

図２は、畳み込みニューラルネットワークの例を示す説明図である。図２に示すCNN では、第１畳み込み層、第１プーリング層、第２畳み込み層、第２プーリング層が交互に積み重ねられている。

【0033】

また、図２に示すC₁、C₂はそれぞれ、畳み込みの計算を表す。例えば、第１畳み込み層に入力される入力画像に対して、畳み込みの計算C₁が実行される。

【0034】

なお、画像は、入力されるデータの一例である。CNN に入力されるデータは、画像以外のデータであってもよい。

【0035】

また、図２に示すP₁、P₂はそれぞれ、プーリングの計算を表す。例えば、第１プーリング層に入力される畳み込みの計算結果に対して、プーリングの計算P₁が実行される。

【0036】

また、図２に示すF は、全結合ネットワークを表す。全結合ネットワークF は、第２プーリング層のノードと出力層のノードを全て結合する全結合層の機能を有する。最終的に、出力層からCNN の出力が得られる。

【0037】

以下、CNN における畳み込みの計算を具体的に説明する。図３は、CNN における畳み込みの計算の例を示す説明図である。なお、図３に示す畳み込みの計算の例は、図２に示す畳み込みの計算C₁に相当する。

【0038】

図３に示す入力画像は、CNN に入力される画像である。図３に示す入力画像は、第１チャネル～第C_in チャネル（C_inは２以上の整数）が順に並べられて構成されている。すなわち、C_inは、入力チャネル数を意味する。また、図３に示すように、入力画像を構成する画像の縦のサイズはH 、横のサイズはW である。

【0039】

説明を簡便にするため、畳み込みの計算の対象である入力X として、図３に示す格子模様が記された縦のサイズが１、横のサイズが１、チャネル数がC_inの画像を考える。図３の下段には、高さ方向から見た場合の入力X が記載されている。また、図３に示す入力X の左の符号は、チャネルの識別番号である。

【0040】

図３に示す畳み込みの計算では、縦のサイズがC_out、横のサイズがC_inの１×１カーネルW と、入力X とが掛け合わされる。掛け合わされた結果、チャネル数がC_outの画像である出力Y が得られる。すなわち、C_outは、出力チャネル数を意味する。なお、図３に示す例において、C_in=3 、C_out=128である。

【0041】

また、図３に示す畳み込みの計算は、行列同士の乗算に相当する。すなわち、図３に示す畳み込みの計算では、カーネルW 、入力X 、出力Yはそれぞれ、行列として扱われる。

【0042】

CNN の構造以外にも、本実施形態では、層数が大きく、認識精度が高いと考えられるニューラルネットワーク構造が第１のニューラルネットワーク構造として訓練手段１１０に入力されることが想定される。しかし、本実施形態の訓練手段１１０には、上記以外のニューラルネットワーク構造が第１のニューラルネットワーク構造として入力されてもよい。

【0043】

以上のように、訓練手段１１０は、第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行う。

【0044】

訓練済モデル解析手段１２０は、訓練手段１１０から入力される訓練済モデルを、訓練データセットを用いて解析する。解析することによって、訓練済モデル解析手段１２０は、第１のニューラルネットワーク構造中の冗長な部分を示すモデル解析情報を最適ニューラルネットワーク構造決定手段１３０に入力する。

【0045】

訓練済モデル解析手段１２０が使用する解析手法は、いくつか考えられる。１つ目は、訓練済モデルに対して訓練データセット中のデータ（画像等）を順次入力し、第１のニューラルネットワーク構造中の各部分（各層の各チャネル等）の活性化率を観測する手法である。

【0046】

１つ目の解析手法を用いると、訓練済モデル解析手段１２０は、第１のニューラルネットワーク構造において、他の部分に比べて活性化していない部分を特定できる。なお、訓練済モデル解析手段１２０は、活性化率を活性化マップ（Activation Map）の値の平均等の統計的指標を用いて求めることができる。

【0047】

２つ目は、第１のニューラルネットワーク構造がCNN の構造である場合に訓練済モデルを分析することによって、ゼロ付近の重みを多く含むカーネルを特定する手法である。ゼロ付近の重みを多く含むカーネルは、削除されても第１のニューラルネットワーク構造による処理結果に大きな影響を及ぼさないと考えられる。

【0048】

上記の解析手法等を用いて解析することによって、訓練済モデル解析手段１２０は、第１のニューラルネットワーク構造において最終結果への貢献度が相対的に低い部分、すなわち冗長な部分を特定できる。

【0049】

図４は、モデル解析情報の例を示す説明図である。図４に示すモデル解析情報は、層番号と、スコアとで構成されている。すなわち、図４は、層ごとのスコアを示す。

【0050】

図５は、モデル解析情報の他の例を示す説明図である。図５に示すモデル解析情報は、層番号と、カーネル番号と、スコアとで構成されている。すなわち、図５は、カーネルの重みごとのスコアを示す。なお、図４～５に示す例では、全部で１００層からなるCNN の構造が、第１のニューラルネットワーク構造として想定されている。

【0051】

図５に示す例では、層番号L1の層が、３個の入力チャネルと１２８個の出力チャネルとに対応することが想定されている。すなわち、図５に示す例は、図３に示す例に対応している。図３に示すカーネル番号は、図５に示すカーネル番号に対応している。

【0052】

図３、５に示すように、層番号L1の層で使用されるカーネルは、3x128=384 個の重みで構成されている。また、図５に示すモデル解析情報では、カーネルの各重みに対してスコアがそれぞれ与えられている。

【0053】

本実施形態のスコアは、層またはカーネルの重みの重要度を表す値である。スコア「１００」が最も重要度が高いことを表し、スコア「０」が最も重要度が低いことを表す。

【0054】

図４に示す例では、例えば層番号L3の層のスコアは「２４」であり、他の層のスコアよりも相対的に低い。また、層番号L99 の層のスコアも「４３」と他の層のスコアよりも相対的に低い。

【0055】

また、図５に示す例では、例えば層番号L2の層における、カーネル番号K1_512のカーネルの重みのスコアは「３１」であり、他のカーネルの重みのスコアよりも相対的に低い。

【0056】

例えば、スコアを決定する際に畳み込み層の出力結果である活性化マップの値の平均値が用いられる場合、訓練済モデル解析手段１２０が任意の畳み込み層から得られた全てのチャネルの活性化マップに対して、チャネル間で正規化してから平均値を評価することが考えられる。

【0057】

また、訓練済モデル解析手段１２０は、平均値の代わりに活性化マップ中の最大値を用いてスコアを決めてもよいし、閾値を設けて最大値が閾値以上か否かを判定してからスコアを決めてもよい。

【0058】

なお、スコアを決定する手法は、上述した手法に限られない。訓練済モデル解析手段１２０は、一般的な統計的解析手法を用いてスコアを決定してもよい。

【0059】

すなわち、訓練済モデル解析手段１２０は、訓練手段１１０の訓練によりニューラルネットワークモデルから生成された訓練済モデルを訓練用のデータセットを用いて解析する。解析することによって、訓練済モデル解析手段１２０は、第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成する。

【0060】

また、上述したように、各要素には、第１のニューラルネットワーク構造を構成する層が含まれる場合がある。

【0061】

また、各要素には、第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれる場合がある。

【0062】

また、上述したように、訓練済モデル解析手段１２０は、例えば、訓練用のデータセット中のデータを訓練済モデルに入力することによって得られる活性化率を基に重要度を算出する。

【0063】

最適ニューラルネットワーク構造決定手段１３０は、訓練済モデル解析手段１２０が出力するモデル解析情報を基に、最適なニューラルネットワーク構造を決定して出力する。

【0064】

例えば、最適ニューラルネットワーク構造決定手段１３０は、図４に示すモデル解析情報を基に、第１のニューラルネットワーク構造から、スコアが小さい層番号L3の層や、層番号L99 の層を削除する。最適ニューラルネットワーク構造決定手段１３０は、層が削除された第１のニューラルネットワーク構造を第２のニューラルネットワーク構造として出力する。

【0065】

なお、層が削除されすぎることを防ぐために、削除対象の層の比率や個数に上限である閾値が設けられてもよい。例えば、最適ニューラルネットワーク構造決定手段１３０は、削除対象の層の閾値として、全体の層数の５０％のように割合を用いてもよいし、１０個のように個数を用いてもよい。また、削除対象の層の閾値は、外部から最適ニューラルネットワーク構造決定手段１３０に入力として与えられてもよい。

【0066】

また、第１のニューラルネットワーク構造の各層における処理時間が入力として与えられる場合、最適ニューラルネットワーク構造決定手段１３０は、処理時間が長く、スコアが小さい層を優先して削除してもよい。

【0067】

また、第１のニューラルネットワーク構造の各層における演算器の実行効率が入力として与えられる場合、最適ニューラルネットワーク構造決定手段１３０は、実行効率が低く、スコアが小さい層を優先して削除してもよい。

【0068】

一般的に、ハードウェアでは高い性能が得られるように、多くの演算器が並べて配列されることによって並列度が高められることが多い。例えば、256 個の演算器が並べて配列されており、かつ、それらの演算器でチャネル数方向の並列性しか活用されないハードウェアの場合、チャネル数が最大で32である層に対しては、最大でも32個の演算器しか稼働しない。

【0069】

よって、チャネル数が最大で32である層における演算器の実行効率は、32/256=1/8=12.5%になる。最適ニューラルネットワーク構造決定手段１３０は、上記のように算出された実行効率が低い層を優先して削除してもよい。

【0070】

また、目標となる精度が入力として与えられた場合、最適ニューラルネットワーク構造決定手段１３０は、例えば与えられた目標精度に定数を乗ずることによってスコアの閾値を決定してもよい。最適ニューラルネットワーク構造決定手段１３０は、決定されたスコアの閾値よりもスコアが低い層を削除する。

【0071】

また、層を削除する際と同様に、最適ニューラルネットワーク構造決定手段１３０は、カーネルを削除する際もスコアを基に削除するカーネルを決定できる。

【0072】

最適ニューラルネットワーク構造決定手段１３０は、例えば、決定されたスコアの閾値よりもスコアが低い重みが所定の割合以上含まれるカーネルを削除する。なお、カーネルが削除されると、該当のカーネルが使用されて実行されていた畳み込みの計算が実行されなくなる。

【0073】

なお、最適ニューラルネットワーク構造決定手段１３０は、層とカーネルの両方を削除してもよいし、層だけ削除してもよいし、カーネルだけ削除してもよい。

【0074】

すなわち、最適ニューラルネットワーク構造決定手段１３０は、訓練済モデル解析手段１２０により生成された解析情報を用いて第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定する。

【0075】

次いで、最適ニューラルネットワーク構造決定手段１３０は、特定された要素を第１のニューラルネットワーク構造から削除することによって、第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成する。

【0076】

また、最適ニューラルネットワーク構造決定手段１３０は、層における演算器の処理時間を用いて特定された要素のうち削除する要素を決定してもよい。また、最適ニューラルネットワーク構造決定手段１３０は、層における演算器の実行効率を用いて特定された要素のうち削除する要素を決定してもよい。

【0077】

また、各要素にカーネル内の重みが含まれる場合、最適ニューラルネットワーク構造決定手段１３０は、特定された重みが所定の割合以上含まれるカーネルを削除してもよい。

【0078】

以上のように、本実施形態のニューラルネットワーク構造探索装置１００は、公開されている高精度なニューラルネットワーク構造に対して、適用対象のアプリケーションに求められる認識精度を保ちつつ構造を最適化することによって、認識処理が高速で実行されるニューラルネットワーク構造を効率的に決定する。

【0079】

なお、本実施形態のニューラルネットワーク構造探索装置１００は、非特許文献１に記載されている技術のように精度の高いニューラルネットワーク構造を求めるわけではなく、公開されているモデルと同等程度に精度を維持する。ニューラルネットワーク構造探索装置１００は、精度を維持しつつ、認識処理の実行速度が速くなるように、規模が縮小されたニューラルネットワーク構造を決定する。

【0080】

［動作の説明］
以下、本実施形態のニューラルネットワーク構造探索装置１００の動作を図６～７を参照して説明する。図６は、本実施形態のニューラルネットワーク構造探索装置１００によるニューラルネットワーク構造探索処理の動作を示すフローチャートである。

【0081】

最初に、ニューラルネットワーク構造探索装置１００に、第１のニューラルネットワーク構造と訓練データセットとが入力される。

【0082】

訓練手段１１０は、入力された第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して、入力された訓練データセットを用いて訓練を行い、訓練結果である訓練済モデルを出力する（ステップS110）。訓練手段１１０は、訓練済モデルを訓練済モデル解析手段１２０に入力する。

【0083】

次いで、訓練済モデル解析手段１２０は、訓練手段１１０から入力された訓練済モデルを解析し、モデル解析情報を生成する（ステップS120）。訓練済モデル解析手段１２０は、生成されたモデル解析情報を最適ニューラルネットワーク構造決定手段１３０に入力する。

【0084】

次いで、最適ニューラルネットワーク構造決定手段１３０は、入力されたモデル解析情報を基に、第１のニューラルネットワーク構造における冗長な構造を特定する。次いで、最適ニューラルネットワーク構造決定手段１３０は、特定された冗長な構造を第１のニューラルネットワーク構造から削除することによって、最適なニューラルネットワーク構造を生成する。

【0085】

次いで、最適ニューラルネットワーク構造決定手段１３０は、生成された最適なニューラルネットワーク構造を第２のニューラルネットワーク構造として出力する（ステップS130）。第２のニューラルネットワーク構造を出力した後、ニューラルネットワーク構造探索装置１００は、ニューラルネットワーク構造探索処理を終了する。

【0086】

図７は、本実施形態のニューラルネットワーク構造探索装置１００による他のニューラルネットワーク構造探索処理の動作を示すフローチャートである。図７は、ニューラルネットワーク構造探索装置１００が探索処理を繰り返し実行する場合の例を示す。

【0087】

最初に、ニューラルネットワーク構造探索装置１００に、第１のニューラルネットワーク構造と訓練データセットとが入力される。すなわち、探索ループに入る（ステップS210）。

【0088】

ステップS220～S230の各処理は、図６に示すステップS110～S120の各処理とそれぞれ同様である。

【0089】

次いで、訓練済モデル解析手段１２０は、ステップS230で生成されたモデル解析情報が示すスコアが所定の条件を満たすか否かを判定する（ステップS240）。所定の条件は、例えば全てのスコアが指定する閾値を上回ることである。

【0090】

スコアが所定の条件を満たす場合（ステップS240におけるYes ）、訓練済モデル解析手段１２０は、第１のニューラルネットワーク構造を出力する（ステップS270）。第１のニューラルネットワーク構造を出力した後、ニューラルネットワーク構造探索装置１００は、ニューラルネットワーク構造探索処理を終了する。

【0091】

スコアが所定の条件を満たさない場合（ステップS240におけるNo）、最適ニューラルネットワーク構造決定手段１３０は、ステップS130と同様の処理を行う（ステップS250）。

【0092】

次いで、ステップS220～S240の処理が繰り返し実行される。なお、２回目以降の処理で、訓練手段１１０は、ステップS250で生成された第２のニューラルネットワーク構造を第１のニューラルネットワーク構造として受け取る。

【0093】

また、スコアが所定の条件を満たさない場合であっても、例えばステップS220～S250の処理が所定回数繰り返し実行されたとき、ニューラルネットワーク構造探索装置１００は、探索ループを抜ける（ステップS260）。探索ループを抜けた後、ニューラルネットワーク構造探索装置１００は、ニューラルネットワーク構造探索処理を終了する。

【0094】

［効果の説明］
本実施形態のニューラルネットワーク構造探索装置１００では、訓練手段１１０が与えられた訓練データセットを基に、ニューラルネットワーク構造を有するニューラルネットワークモデル全体に対して訓練を行う。次いで、訓練済モデル解析手段１２０が、訓練手段１１０による訓練結果を解析する。次いで、最適ニューラルネットワーク構造決定手段１３０が、認識精度が維持されつつ規模が小さくなるようなニューラルネットワーク構造を決定する。

【0095】

本実施形態のニューラルネットワーク構造探索装置１００は、ニューラルネットワーク構造探索に要する訓練の回数を削減できる。その理由は、最初に訓練手段１１０がニューラルネットワーク構造全体に対する訓練を実行した後、訓練済モデル解析手段１２０が訓練結果である訓練済モデルを解析し、最適ニューラルネットワーク構造決定手段１３０がニューラルネットワークの最適構造を決定するためである。

【0096】

非特許文献１～３に記載されている技術には、ニューラルネットワーク構造の探索に、多くの回数の訓練が求められるという問題点がある。その理由は、上述したように認識精度を評価するためには訓練が求められるためである。

【0097】

本実施形態のニューラルネットワーク構造探索装置１００は、訓練を何度も繰り返すことなく、与えられた訓練データセットを基に最適なニューラルネットワーク構造を決定できる。具体的には、ニューラルネットワーク構造探索装置１００は、原則として高い精度が期待されるニューラルネットワーク構造を有するニューラルネットワークモデルに対して最初に１回のみ訓練を行う。

【0098】

次いで、ニューラルネットワーク構造探索装置１００は、訓練で得られたモデルを訓練データセットを用いて解析することによって、第１のニューラルネットワーク構造の冗長な部分を的確に特定する。よって、ニューラルネットワーク構造探索装置１００は、効率的に最適なニューラルネットワーク構造を決定できる。

【0099】

以下、本実施形態のニューラルネットワーク構造探索装置１００のハードウェア構成の具体例を説明する。図８は、本発明によるニューラルネットワーク構造探索装置のハードウェア構成例を示す説明図である。

【0100】

図８に示すニューラルネットワーク構造探索装置１００は、ＣＰＵ（Central Processing Unit ）１１と、主記憶部１２と、通信部１３と、補助記憶部１４とを備える。また、ユーザが操作するための入力部１５や、ユーザに処理結果または処理内容の経過を提示するための出力部１６を備える。

【0101】

ニューラルネットワーク構造探索装置１００は、図８に示すＣＰＵ１１が各構成要素が有する機能を提供するプログラムを実行することによって、ソフトウェアにより実現される。

【0102】

すなわち、ＣＰＵ１１が補助記憶部１４に格納されているプログラムを、主記憶部１２にロードして実行し、ニューラルネットワーク構造探索装置１００の動作を制御することによって、各機能がソフトウェアにより実現される。

【0103】

なお、図８に示すニューラルネットワーク構造探索装置１００は、ＣＰＵ１１の代わりにＤＳＰ（Digital Signal Processor）を備えてもよい。または、図８に示すニューラルネットワーク構造探索装置１００は、ＣＰＵ１１とＤＳＰとを併せて備えてもよい。

【0104】

主記憶部１２は、データの作業領域やデータの一時退避領域として用いられる。主記憶部１２は、例えばＲＡＭ（Random Access Memory）である。

【0105】

通信部１３は、有線のネットワークまたは無線のネットワーク（情報通信ネットワーク）を介して、周辺機器との間でデータを入力および出力する機能を有する。

【0106】

補助記憶部１４は、一時的でない有形の記憶媒体である。一時的でない有形の記憶媒体として、例えば磁気ディスク、光磁気ディスク、ＣＤ－ＲＯＭ（Compact Disk Read Only Memory ）、ＤＶＤ－ＲＯＭ（Digital Versatile Disk Read Only Memory ）、半導体メモリが挙げられる。

【0107】

入力部１５は、データや処理命令を入力する機能を有する。入力部１５は、例えばキーボードやマウス等の入力デバイスである。

【0108】

出力部１６は、データを出力する機能を有する。出力部１６は、例えば液晶ディスプレイ装置等の表示装置、またはプリンタ等の印刷装置である。

【0109】

また、図８に示すように、ニューラルネットワーク構造探索装置１００において、各構成要素は、システムバス１７に接続されている。

【0110】

ニューラルネットワーク構造探索装置１００において、補助記憶部１４は、訓練手段１１０、訓練済モデル解析手段１２０、および最適ニューラルネットワーク構造決定手段１３０を実現するためのプログラムを記憶している。

【0111】

なお、ニューラルネットワーク構造探索装置１００は、例えば内部に図１に示すような機能を実現するＬＳＩ（Large Scale Integration ）等のハードウェア部品が含まれる回路が実装されてもよい。

【0112】

また、ニューラルネットワーク構造探索装置１００は、ＣＰＵ等の素子を用いるコンピュータ機能を含まないハードウェアにより実現されてもよい。例えば、各構成要素の一部または全部は、汎用の回路（circuitry ）または専用の回路、プロセッサ等やこれらの組み合わせによって実現されてもよい。これらは、単一のチップ（例えば、上記のＬＳＩ）によって構成されてもよいし、バスを介して接続される複数のチップによって構成されてもよい。各構成要素の一部または全部は、上述した回路等とプログラムとの組み合わせによって実現されてもよい。

【0113】

また、ニューラルネットワーク構造探索装置１００の各構成要素の一部または全部は、演算部と記憶部とを備えた１つまたは複数の情報処理装置で構成されていてもよい。

【0114】

各構成要素の一部または全部が複数の情報処理装置や回路等により実現される場合には、複数の情報処理装置や回路等は集中配置されてもよいし、分散配置されてもよい。例えば、情報処理装置や回路等は、クライアントアンドサーバシステム、クラウドコンピューティングシステム等、各々が通信ネットワークを介して接続される形態として実現されてもよい。

【0115】

次に、本発明の概要を説明する。図９は、本発明によるニューラルネットワーク構造探索装置の概要を示すブロック図である。本発明によるニューラルネットワーク構造探索装置２０は、第１のニューラルネットワーク構造を有するニューラルネットワークモデルに対して訓練用のデータセットを用いて訓練を行う訓練手段２１（例えば、訓練手段１１０）と、訓練によりニューラルネットワークモデルから生成された訓練済モデルを訓練用のデータセットを用いて解析することによって、第１のニューラルネットワーク構造を構成する各要素の重要度それぞれを示す解析情報を生成する第１生成手段２２（例えば、訓練済モデル解析手段１２０）と、生成された解析情報を用いて第１のニューラルネットワーク構造中の重要度が所定値よりも低い要素を特定する特定手段２３（例えば、最適ニューラルネットワーク構造決定手段１３０）と、特定された要素を第１のニューラルネットワーク構造から削除することによって、第１のニューラルネットワーク構造を基に第２のニューラルネットワーク構造を生成する第２生成手段２４（例えば、最適ニューラルネットワーク構造決定手段１３０）とを備える。

【0116】

そのような構成により、ニューラルネットワーク構造探索装置は、ニューラルネットワーク構造の探索に要する訓練の回数を削減できる。

【0117】

また、各要素には、第１のニューラルネットワーク構造を構成する層が含まれてもよい。また、第２生成手段２４は、層における演算器の処理時間を用いて特定された要素のうち削除する要素を決定してもよい。また、第２生成手段２４は、層における演算器の実行効率を用いて特定された要素のうち削除する要素を決定してもよい。

【0118】

そのような構成により、ニューラルネットワーク構造探索装置は、第１のニューラルネットワーク構造を構成する層における処理内容を基に第２のニューラルネットワーク構造を生成できる。

【0119】

また、各要素には、第１のニューラルネットワーク構造を構成する畳み込み層で使用されるカーネル内の重みが含まれ、第２生成手段２４は、特定された重みが所定の割合以上含まれるカーネルを削除してもよい。

【0120】

そのような構成により、ニューラルネットワーク構造探索装置は、CNN に対応できる。

【0121】

また、第１生成手段２２は、訓練用のデータセット中のデータを訓練済モデルに入力することによって得られる活性化率を基に重要度を算出してもよい。

【0122】

そのような構成により、ニューラルネットワーク構造探索装置は、活性化マップを用いてニューラルネットワーク構造の探索に要する訓練の回数を削減できる。

【0123】

以上、実施形態および実施例を参照して本願発明を説明したが、本願発明は上記実施形態および実施例に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。