特許7542199 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ パナソニックＩＰマネジメント株式会社の特許一覧

特許7542199ニューラルネットワーク、演算方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4A
4B
4C
5
6
7
8
9A
9B
10
11
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-08-22

(45)【発行日】2024-08-30

(54)【発明の名称】ニューラルネットワーク、演算方法及びプログラム

(51)【国際特許分類】

G06N 3/04 20230101AFI20240823BHJP

【ＦＩ】

G06N3/04

【請求項の数】 6

(21)【出願番号】P 2021553678

(86)(22)【出願日】2020-10-29

(86)【国際出願番号】 JP2020040591

(87)【国際公開番号】W WO2021085523

(87)【国際公開日】2021-05-06

【審査請求日】2023-08-16

(31)【優先権主張番号】62/928,760

(32)【優先日】2019-10-31

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】314012076

【氏名又は名称】パナソニックＩＰマネジメント株式会社

(74)【代理人】

【識別番号】100109210

【弁理士】

【氏名又は名称】新居広守

(74)【代理人】

【識別番号】100137235

【弁理士】

【氏名又は名称】寺谷英作

(74)【代理人】

【識別番号】100131417

【弁理士】

【氏名又は名称】道坂伸一

(72)【発明者】

【氏名】ムルガンプシュパラヤ

(72)【発明者】

【氏名】ルージン

(72)【発明者】

【氏名】スブラマニアンカルティック

(72)【発明者】

【氏名】リムスギリプラナ

(72)【発明者】

【氏名】上田功

【審査官】千葉久博

(56)【参考文献】

【文献】特開２０１９－１０５８９９（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１９／０３１１２４９（ＵＳ，Ａ１）

【文献】長瀬准平, 外1名，“スキップ接続によるプーリング層の構成および表現力に基づくそれらのモデルの解析”，２０１９年度人工知能学会全国大会（第３３回）人工知能学会全国大会論文集，2019年06月07日，p.1-4

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／０４

(57)【特許請求の範囲】

【請求項1】

入力情報が入力される入力層と、
前記入力情報の特徴量を抽出するための複数のブロックと、
抽出された特徴量を出力する出力層とを備え、
前記複数のブロックのそれぞれは、
１以上の第１の畳み込み層と、前記１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される残差ブロックと、
第２の畳み込み層を少なくとも有する接続ブロックであって、前記１以上の第１の畳み込み層の出力と前記スキップ接続の出力とを平均化する接続ブロックとを含み、
コンピュータを、
前記残差ブロックに、第１情報を入力するステップと、
前記１以上の第１の畳み込み層により抽出された前記第１情報の特徴量と、前記スキップ接続により出力された前記第１情報とを、前記接続ブロックに入力して、前記第１情報の特徴量と前記第１情報とを平均化させるステップとを、
実行するよう、機能させる
ニューラルネットワーク。

【請求項2】

前記接続ブロックは、
前記１以上の第１の畳み込み層の出力と前記スキップ接続の出力とが入力される第２の畳み込み層と、
前記第２の畳み込み層の出力が入力される第１出力層と、
前記第１出力層の出力に、予め記憶されていた重みを付与する重み付け層と、
前記重み付け層の出力が入力される第３の畳み込み層とを備える、
請求項１に記載のニューラルネットワーク。

【請求項3】

前記複数のブロックのそれぞれは、さらに、
前記接続ブロックの出力に加えて、前記スキップ接続の出力を出力し、
前記接続ブロックは、
前記１以上の第１の畳み込み層の出力と前記スキップ接続の出力とが入力される第２の畳み込み層と、
前記第２の畳み込み層の出力が入力される第１出力層と、
前記第１出力層の出力に、予め記憶されていた重みを付与する重み付け層と、
前記第１出力層及び前記重み付け層をショートカットするショートカット接続と、
前記重み付け層の出力と前記ショートカット接続の出力とが入力される第３の畳み込み層とを備える、
請求項１に記載のニューラルネットワーク。

【請求項4】

前記第１出力層は、入力された前記第２の畳み込み層の出力に対してソフトマックス関数を用いて得た値を出力する、
請求項２または３に記載のニューラルネットワーク。

【請求項5】

入力情報が入力される入力層と、前記入力情報の特徴量を抽出するための複数のブロックと、抽出された特徴量を出力する出力層を備えるニューラルネットワークにおける前記複数のブロックの演算方法であって、
前記ブロックを構成する残差ブロックであって１以上の第１の畳み込み層と、前記１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される残差ブロックに、第１情報を入力するステップと、
前記１以上の第１の畳み込み層により抽出された前記第１情報の特徴量と、前記スキップ接続により出力された前記第１情報とを、前記ブロックを構成する接続ブロックであって第２の畳み込み層を少なくとも有する接続ブロックに入力して、前記第１情報の特徴量と前記第１情報とを平均化させるステップとを含む、
演算方法。

【請求項6】

入力情報が入力される入力層と、前記入力情報の特徴量を抽出するための複数のブロックと、抽出された特徴量を出力する出力層を備えるニューラルネットワークにおける前記複数のブロックの演算方法を実行するためのプログラムであって、
前記ブロックを構成する残差ブロックであって１以上の第１の畳み込み層と、前記１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される残差ブロックに、第１情報を入力するステップと、
前記１以上の第１の畳み込み層により抽出された前記第１情報の特徴量と、前記スキップ接続により出力された前記第１情報とを、前記ブロックを構成する接続ブロックであって第２の畳み込み層を少なくとも有する接続ブロックに入力して、前記第１情報の特徴量と前記第１情報とを平均化させるステップとを、
コンピュータに実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、ニューラルネットワーク、演算方法及びプログラムに関する。

【背景技術】

【0002】

近年、畳み込みネットワーク（CNN: Convolutional Neural Network）を用いたDL（Deep Learning）モデルは、画像分類、物体検出、物体認識など多くの視覚課題に対して優れた性能を発揮している。

【0003】

一方で、DLモデルの階層を深くすることで性能を高めることができることも知られている。しかしながら、単純に階層を深くしたDLモデルでは、勾配消失(vanishing)または勾配発散(exploding)が発生するという問題がある。

【0004】

この問題に対して、例えば残差学習(Residual Learning)を組み込んだResNet（Residual Network）というCNNモデルが提案されている（例えば非特許文献１参照）。ResNetでは、出力H(x)から入力xを引いた残差F(x)=H(x)－xを学習することで、上記の問題を解決し、１５２層の深さのネットワーク構造を実現している。また、非特許文献１に開示されるResNetでは、ある層への入力をバイパスし当該層をまたいだ奥の層へと入力させるスキップ接続と畳み込み層との組み合わせにより構成される残差ブロックを積層させてネットワーク構造を有している。なお、ResNetで用いられるスキップ接続は、ローカル残差スキップ接続(local residual skip connection)と称される場合もある。

【先行技術文献】

【非特許文献】

【0005】

【文献】He, K., Zhang, X., Ren, S. and Sun, J., 2016. Deep residual learning for image recognition. In Proceedings of the IEEE conference on computer vision and pattern recognition (pp. 770-778).

【発明の概要】

【発明が解決しようとする課題】

【0006】

しかしながら、非特許文献１に開示されるResNetのネットワーク構造を有するモデル（ネットワークモデル）は、深い層で構成され、膨大なパラメータと演算量（FLOPs）とを必要とする。また、スマートフォンもしくはタブレットなどのモバイル端末、テレビなどの家電製品、または、産業機器といったハードウェアプラットフォームは、リソースが限られており、実装可能な演算量及びモデルサイズには制限がある。つまり、非特許文献１に開示されるResNetを、モバイル端末などのリソースの限られたハードウェアプラットフォームに実装させて利用することは難しい。

【0007】

本開示は、上述の事情を鑑みてなされたもので、精度を維持しつつ、モデルサイズと演算量とをより軽減できるニューラルネットワーク、演算方法及びプログラムを提供することを目的とする。

【課題を解決するための手段】

【0008】

上記課題を解決するために、本開示の一態様に係るニューラルネットワークは、入力情報が入力される入力層と、前記入力情報の特徴量を抽出するための複数のブロックと、抽出された特徴量を出力する出力層とを備え、前記複数のブロックのそれぞれは、１以上の第１の畳み込み層と、前記１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される残差ブロックと、第２の畳み込み層を少なくとも有する接続ブロックであって、前記１以上の第１の畳み込み層の出力と前記スキップ接続の出力とを平均化する接続ブロックとを含む。

【0009】

なお、これらの全般的または具体的な態様は、システム、方法、集積回路、コンピュータプログラムまたはコンピュータで読み取り可能なＣＤ－ＲＯＭなどの記録媒体で実現されてもよく、システム、方法、集積回路、コンピュータプログラムおよび記録媒体の任意な組み合わせで実現されてもよい。

【発明の効果】

【0010】

本開示によれば、精度を維持しつつ、モデルサイズと演算量とをより軽減できるニューラルネットワーク等を実現できる。

【図面の簡単な説明】

【0011】

【図1】図１は、実施の形態に係る演算装置の構成の一例を示すブロック図である。

【図2】図２は、実施の形態に係る演算装置の機能をソフトウェアにより実現するコンピュータのハードウェア構成の一例を示す図である。

【図3】図３は、実施の形態に係るニューラルネットワークの構成を示す図である。

【図4A】図４Ａは、図３に示すブロックのネットワーク構造を説明するための概念図である。

【図4B】図４Ｂは、図４Ａに示す畳み込み層で行われる演算を概念的に示す図である。

【図4C】図４Ｃは、図４Ａに示す接続ブロックの具体的構成を概念的に示す図である。

【図5】図５は、図４Ａに示すブロックのネットワーク構造の一具体的態様を示す図である。

【図6】図６は、図４Ａに示すブロックのネットワーク構造の別の具体的態様を示す図である。

【図7】図７は、ResNet10相当のネットワーク構造の実装例を概念的に示す図である。

【図8】図８は、実施の形態に係るニューラルネットワークの実装例を概念的に示す図である。

【図9A】図９Ａは、ResNet34のネットワーク構造の実装例を概念的に示す図である。

【図9B】図９Ｂは、ResNet18相当のネットワーク構造の実装例を概念的に示す図である。

【図10】図１０は、実施の形態に係る演算装置の動作概要を示すフローチャートである。

【図11】図１１は、実施例に係るデータベースの概要を示す図である。

【図12】図１２は、実施例に係る実験結果を示す図である。

【発明を実施するための形態】

【0012】

本開示の一形態に係るニューラルネットワークは、入力情報が入力される入力層と、前記入力情報の特徴量を抽出するための複数のブロックと、抽出された特徴量を出力する出力層とを備え、前記複数のブロックのそれぞれは、１以上の第１の畳み込み層と、前記１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される残差ブロックと、第２の畳み込み層を少なくとも有する接続ブロックであって、前記１以上の第１の畳み込み層の出力と前記スキップ接続の出力とを平均化する接続ブロックとを含む。

【0013】

この構成によれば、精度を維持しつつ、モデルサイズと演算量とをより軽減できるニューラルネットワークを実現できる。

【0014】

ここで、例えば、前記接続ブロックは、前記１以上の第１の畳み込み層の出力と前記スキップ接続の出力とが入力される第２の畳み込み層と、前記第２の畳み込み層の出力が入力される第１出力層と、前記第１出力層の出力に、予め記憶されていた重みを付与する重み付け層と、前記重み付け層の出力が入力される第３の畳み込み層とを備えてもよい。

【0015】

この構成により、精度を維持するために必要なブロックの数を軽減することができるので、モデルサイズと演算量とを軽減できる。

【0016】

また、例えば、前記複数のブロックのそれぞれは、さらに、前記接続ブロックの出力に加えて、前記スキップ接続の出力を出力し、前記接続ブロックは、前記１以上の第１の畳み込み層の出力と前記スキップ接続の出力とが入力される第２の畳み込み層と、前記第２の畳み込み層の出力が入力される第１出力層と、前記第１出力層の出力に、予め記憶されていた重みを付与する重み付け層と、前記第１出力層及び前記重み付け層をショートカットするショートカット接続と、前記重み付け層の出力と前記ショートカット接続の出力とが入力される第３の畳み込み層とを備えてもよい。

【0017】

この構成により、精度を維持するために必要なブロックの数を軽減することができるだけでなく、ショートカット接続により接続ブロックの出力が勾配爆発または勾配発散することを回避できるので、精度を維持しつつ、モデルサイズと演算量とをより軽減できる。

【0018】

ここで、例えば、前記第１出力層は、入力された前記第２の畳み込み層の出力に対してソフトマックス関数を用いて得た値を出力する。

【0019】

また、本開示の一形態に係る演算方法は、入力情報が入力される入力層と、前記入力情報の特徴量を抽出するための複数のブロックと、抽出された特徴量を出力する出力層を備えるニューラルネットワークにおける前記複数のブロックの演算方法であって、前記ブロックを構成する残差ブロックであって１以上の第１の畳み込み層と、前記１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される残差ブロックに、第１情報を入力するステップと、前記１以上の第１の畳み込み層により抽出された前記第１情報の特徴量と、前記スキップ接続により出力された前記第１情報とを、前記ブロックを構成する接続ブロックであって第２の畳み込み層を少なくとも有する接続ブロックに入力して、前記第１情報の特徴量と前記第１情報とを平均化させるステップとを含む。

【0020】

以下で説明する実施の形態は、いずれも本開示の一具体例を示すものである。従って、以下の実施の形態で示される数値、形状、材料、構成要素、構成要素の配置および接続形態等は、一例であって本開示を限定する主旨ではない。また、以下の実施の形態における構成要素のうち、本開示の一形態に係る実現形態を示す独立請求項に記載されていない構成要素については、任意の構成要素として説明される。本開示の実現形態は、現行の独立請求項に限定されるものではなく、他の独立請求項によっても表現され得る。

【0021】

（実施の形態）
以下では、図面を参照しながら、実施の形態について説明する。

【0022】

［１．演算装置１］
図１は、本実施の形態に係る演算装置１の構成の一例を示すブロック図である。

【0023】

演算装置１は、学習済のＮＮ（Neural Networks）を用いたコンピュータ等で実現され、図１に示すように入力部２と処理部３と出力部４とで構成されている。演算装置１は、入力情報が入力されると、入力情報から抽出した特徴量を、演算結果として出力する。なお、入力情報は、例えば画像または映像など視覚課題に用いられる情報である。

【0024】

入力部２は、入力情報を取得し、取得した入力情報を、処理部３に入力する。本実施の形態では、入力部２は、取得した入力情報を、処理部３に入力する。

【0025】

処理部３は、本実施の形態に係るニューラルネットワークを用いて、入力情報から特徴量を抽出する。本実施の形態では、処理部３は、学習済のニューラルネットワーク３ａを用いて、入力情報から特徴量を抽出する。学習済のニューラルネットワーク３ａは、処理部３が有する記憶部（不図示）に記憶されている。なお、学習済のニューラルネットワーク３ａは、クラウド上に記憶されていてもよく、インターネットなどの通信ネットワークを介して処理部３により用いられてもよい。ニューラルネットワーク３ａの構成については後述する。

【0026】

出力部４は、処理部３において抽出された特徴量を、演算結果として出力する。

【0027】

［１－１．ハードウェア構成］
図２は、本実施の形態に係る演算装置１の機能をソフトウェアにより実現するコンピュータ１０００のハードウェア構成の一例を示す図である。

【0028】

コンピュータ１０００は、図２に示すように、入力装置１００１、出力装置１００２、ＣＰＵ１００３、内蔵ストレージ１００４、ＲＡＭ１００５、読取装置１００７、送受信装置１００８及びバス１００９を備えるコンピュータである。入力装置１００１、出力装置１００２、ＣＰＵ１００３、内蔵ストレージ１００４、ＲＡＭ１００５、読取装置１００７及び送受信装置１００８は、バス１００９により接続される。

【0029】

入力装置１００１は入力ボタン、タッチパッド、タッチパネルディスプレイなどといったユーザインタフェースとなる装置であり、ユーザの操作を受け付ける。なお、入力装置１００１は、ユーザの接触操作を受け付ける他、音声での操作、リモコン等での遠隔操作を受け付ける構成であってもよい。

【0030】

内蔵ストレージ１００４は、フラッシュメモリなどである。また、内蔵ストレージ１００４は、演算装置１の機能を実現するためのプログラム、及び、演算装置１の機能構成を利用したアプリケーションの少なくとも一方が、予め記憶されていてもよい。また、内蔵ストレージ１００４は、学習済のニューラルネットワーク３ａが記憶されるとしてもよい。

【0031】

ＲＡＭ１００５は、ランダムアクセスメモリ（Random Access Memory）であり、プログラム又はアプリケーションの実行に際してデータ等の記憶に利用される。

【0032】

読取装置１００７は、ＵＳＢ（Universal Serial Bus）メモリなどの記録媒体から情報を読み取る。読取装置１００７は、上記のようなプログラムやアプリケーションが記録された記録媒体からそのプログラム、ニューラルネットワーク３ａやアプリケーションを読み取り、内蔵ストレージ１００４に記憶させる。

【0033】

送受信装置１００８は、無線又は有線で通信を行うための通信回路である。送受信装置１００８は、例えばネットワークに接続されたサーバ装置と通信を行い、サーバ装置から上記のようなプログラム、ニューラルネットワーク３ａやアプリケーションをダウンロードして内蔵ストレージ１００４に記憶させてもよい。

【0034】

ＣＰＵ１００３は、中央演算処理装置（Central Processing Unit）であり、内蔵ストレージ１００４に記憶されたプログラム、アプリケーションをＲＡＭ１００５にコピーし、そのプログラムやアプリケーションに含まれる命令をＲＡＭ１００５から順次読み出して実行する。

【0035】

［１－２．ニューラルネットワーク３ａ］
図３は、本実施の形態に係るニューラルネットワーク３ａの構成を示す図である。

【0036】

本実施の形態に係るニューラルネットワーク３ａは、図３に示すように、入力情報が入力される入力層１０と、入力情報の特徴量を抽出するための複数のブロック１１１からなる中間層１１と、抽出された特徴量を出力する出力層１２とを備える。なお、以下では、本実施の形態に係るニューラルネットワーク３ａを、LVNetと称する場合もある。以下、ブロック１１１のネットワーク構造を有するモデルについて説明する。

【0037】

［１－２－１．ブロック１１１］
図４Ａは、図３に示すブロック１１１のネットワーク構造を説明するための概念図である。

【0038】

ブロック１１１は、積層されてニューラルネットワーク３ａを構成する。ブロック１１１は、図４Ａに示すように、接続ブロック１１２と、H^i-1で示される基本単位層（fundamental unit）と、スキップ接続とで構成される。なお、ブロック１１１は、ResNetではビルディングブロック（building block）とも称される。

【0039】

基本単位層は、１以上の第１の畳み込み層で構成される。図４Ａで示される例では、H^i-1で示される基本単位層は、Conv_(i-1)で示される畳み込み層１１１１と、Conv_iで示される畳み込み層１１１２とで構成される。畳み込み層１１１１及び畳み込み層１１１２は、実装される際には、図４Ａに示されるように、Batch Normalization（図でBN）を行う層と、reluなどの活性化関数（図でACT）と、畳み込み層（図でWeight）とで構成される。なお、演算順序は図４Ａに示される順に限定されない。

【0040】

スキップ接続は、H^i-1で示される基本単位層をバイパスさせて、H⁰で示される入力を接続ブロック１１２に入力する。

【0041】

接続ブロック１１２は、図４Ａでは、CB^i-1（connection block）と示され、H^i-1で示される基本単位層の出力とスキップ接続の出力とを平均化する。

【0042】

なお、H^i-1で示される基本単位層とスキップ接続とは、残差ブロックを構成する。

【0043】

図４Ｂは、図４Ａに示す畳み込み層で行われる演算を概念的に示す図である。図４Ｂには、一例としてH^i-1で示される基本単位層のConv_(i-1)において行われる演算が模式的に示されている。

【0044】

図４Ｂに示すように、Conv_(i-1)に入力される入力特徴は、

【数1】

で示されるテンソルである。入力特徴の次元は、

【数2】

で示されている。畳み込みを行うカーネルのカーネルサイズは、

【数3】

で示されている。カーネルを用いた畳み込み演算によって得られる特徴マップは、

【数4】

で示されている。この特徴マップは、Conv_(i)の入力特徴になり、その次元は、

【数5】

で示されている。

【0045】

図４Ｃは、図４Ａに示す接続ブロック１１２の構成の一例を概念的に示す図である。

【0046】

接続ブロック１１２は、図４Ｃに示されるように、Conv_(i-1) ^（CB）、ソフトマックス関数、Weights W_n ^CB、及びConv_(i) ^（CB）などにより構成される。

【0047】

［１－２－２．ブロック１１１のネットワーク構造の具体的態様］
以下、図５を用いて、図４Ａに示すブロック１１１のネットワーク構造の具体的態様について説明する。

【0048】

図５は、図４Ａに示すブロック１１１のネットワーク構造の一具体的態様を示す図である。

【0049】

図５に示すブロック１１１は、残差ブロックと、接続ブロック１１２Ａと、加算部１１３とを備える。なお、ブロック１１１は加算部１１３を備えなくてもよい。

【0050】

残差ブロックは、１以上の第１の畳み込み層と、１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される。図５に示す例では、残差ブロックは、畳み込み層１１１１と畳み込み層１１１２と、畳み込み層１１１１及び畳み込み層１１１２をまたぐ接続であるスキップ接続との組み合わせにより構成されている。なお、畳み込み層１１１１及び畳み込み層１１１２は、図４Ａ及び図４Ｃで説明した基本単位層を構成する。

【0051】

接続ブロック１１２Ａは、第２の畳み込み層を少なくとも有する接続ブロックであって、１以上の第１の畳み込み層の出力とスキップ接続の出力とを平均化する。図５に示す例では、接続ブロック１１２Ａは、畳み込み層１１２１と、出力層１１２２と、重み１１２３と、重み付け層１１２４と、加算部１１２５と、畳み込み層１１２１とで構成される。なお、図５に示す例では、加算部１１２５は機能させないため、接続ブロック１１２Ａは、加算部１１２５を備えなくてもよい。

【0052】

畳み込み層１１２１は、第２の畳み込み層の一例であり、１以上の第１の畳み込み層の出力とスキップ接続の出力とが入力される。畳み込み層１１２１は、入力された１以上の第１の畳み込み層の出力とスキップ接続の出力とを畳み込んで出力する。本実施の形態では、畳み込み層１１２１は、例えば図５では、Conv_(CB)と表現されており_、畳み込み層１１１２の出力とスキップ接続の出力とが入力される。畳み込み層１１２１は、入力された畳み込み層１１１２の出力とスキップ接続の出力とを畳み込んで得た特徴マップを出力層１１２２に出力する。なお、畳み込み層１１２１は、例えば図４Ｃでは、Conv_(i-1) ^（CB）と表現されており_、H^i-1で示される基本単位層の出力と、スキップ接続の出力としてH⁰で示される入力とがスタックされて入力される。

【0053】

出力層１１２２は、第１出力層の一例であり、第２の畳み込み層の出力が入力される。より具体的には、出力層１１２２は、入力された第２の畳み込み層の出力に対してソフトマックス関数を用いて得た値を出力する。本実施の形態では、出力層１１２２は、例えばソフトマックス関数を用いて、畳み込み層１１１２から出力された特徴マップから、出力の発生確率を求めて、重み付け層１１２４に出力する。出力層１１２２は、例えば図５ではＳｏｆｔｍａｘと表現されており、例えば図４Ｃではソフトマックス関数を用いて得た発生確率のグラフで表現されている。

【0054】

重み１１２３は、重み（重みの集合）を予め記憶している。重み１１２３に記憶されている重みは、学習データを用いて接続ブロック１１２Ａを学習させることで得ることができる。重み１１２３は、例えば図５ではWeights_（CB）と表現されており、例えば図４ＣではWeights W_n ^CBと表現されている。

【0055】

重み付け層１１２４は、出力層１１２２の出力に、予め記憶されていた重みを付与する。本実施の形態では、重み付け層１１２４は、重み１１２３に予め記憶されている重みを、出力層１１２２の出力に乗算することで、重みを付与する。これにより、残差ブロックの出力に分散した重み付けを行うことができるので、残差ブロックの入力と出力との非線形性を向上させることができる。

【0056】

畳み込み層１１２６は、第３の畳み込み層の一例であり、重み付け層１１２４の出力が入力される。本実施の形態では、畳み込み層１１２６は、重み付け層１１２４の出力を畳み込んで得た特徴マップを出力する。畳み込み層１１２６は、重み付け層１１２４の出力を畳み込むことで、重み付け層１１２４の出力をダウンサンプリングすることができる。なお、畳み込み層１１２６は、例えば図４Ｃでは、Conv_i ^（CB）と表現されている。

【0057】

図６は、図４Ａに示すブロック１１１のネットワーク構造の別の具体的態様を示す図である。図４Ａ、図４Ｃ及び図５等と同様の要素には同一の符号を付しており、詳細な説明は省略する。

【0058】

図６に示すブロック１１１Ｂは、図５に示すブロック１１１に対して、接続ブロック１１２Ｂの構成と、スキップ接続の接続先が増えている点とが異なる。以下、異なるところを中心に説明する。

【0059】

ブロック１１１Ｂは、さらに、接続ブロック１１２Ｂの出力に加えて、スキップ接続の出力を出力する。より具体的には、ブロック１１１Ｂでは、スキップ接続は、畳み込み層１１１１及び畳み込み層１１１２をまたいで接続ブロック１１２の畳み込み層１１２１と接続されるだけでなく、接続ブロック１１２Ｂをまたいで、接続ブロック１１２Ｂの出力先の加算部１１３に接続される。これにより、スキップ接続への入力は、接続ブロック１１２の畳み込み層１１２１に加えて、ブロック１１１Ｂの次のブロック１１１Ｂに出力されることになる。よって、ブロック１１１Ｂも、残差ブロックの機能を有することになり、ブロック１１１の入力と出力との非線形性を向上させ、勾配損失を回避できるので精度をより向上させることができる。

【0060】

接続ブロック１１２Ｂは、図５に示す接続ブロック１１２Ａと比較して、ショートカット接続をさらに備える。接続ブロック１１２Ｂは、接続ブロック１１２Ａと同様に、第２の畳み込み層を少なくとも有する接続ブロックであって、１以上の第１の畳み込み層の出力とスキップ接続の出力とを平均化する。

【0061】

ショートカット接続は、第１出力層及び重み付け層をショートカットする。本実施の形態では、ショートカット接続は、畳み込み層１１２１の出力と出力層１１２２と重み付け層１１２４とをショートカットし、畳み込み層１１２１の出力と加算部１１２５とを接続する。

【0062】

加算部１１２５は、ショートカット接続を介して出力された畳み込み層１１２１の出力と、重み付け層１１２４の出力とを加算する。これにより、畳み込み層１１２１の出力が、重み付け層１１２４により無理に非線形されてしまい、そのまま畳み込み層１１２６に出力すると不安定のため勾配爆発または発散の発生が生じてしまう場合でも、勾配爆発または発散を回避することができる。

【0063】

畳み込み層１１２６は、第３の畳み込み層の一例であり、重み付け層１１２４の出力とショートカット接続の出力とが入力される。本実施の形態では、畳み込み層１１２６は、加算部１１２５の出力を畳み込んで得た特徴マップを出力する。畳み込み層１１２６は、加算部１１２５の出力を畳み込むことで、加算部１１２５の出力をダウンサンプリングすることができる。

【0064】

［１－３．ニューラルネットワーク３ａの実装例］
続いて、ニューラルネットワーク３ａの実装例について説明する。

【0065】

ニューラルネットワーク３ａは、上述したように、積層されるブロック１１１それぞれに残差ブロックを含む。このため、ニューラルネットワーク３ａは、残差ブロックを有するResNetのネットワーク構造を利用することで実装できる。また、ニューラルネットワーク３ａは、積層されるブロック１１１それぞれに接続ブロック１１２Ａまたは１１２Ｂを含むため、ResNetをより浅い層で構成させたネットワーク構造を利用して実装したとしても、ResNetと同等の精度を維持できる。

【0066】

図７は、ResNet10相当のネットワーク構造の実装例を概念的に示す図である。図７に示すように、ResNet10相当は、Building Block1～Building Block4で示される４つのBuilding Blockが積層される。また、Building Blockのそれぞれは、２つの畳み込み層とスキップ接続との組み合わせにより構成されている。よって、ResNet10相当は、上記の非特許文献１に開示されているResNetをより浅い層で構成させたネットワーク構造であり、１０層の畳み込み層を用いて構成されるネットワーク構造を有する。

【0067】

図８は、本実施の形態に係るニューラルネットワーク３ａの実装例を概念的に示す図である。なお、図８に示されるニューラルネットワーク３ａは、上記でLVNetと称したもののネットワーク構造の一例である。

【0068】

より具体的には、図８に示すニューラルネットワーク３ａは、図７に示すResNet10相当におけるBuilding Block1～Building Block4のそれぞれに、上述した接続ブロック１１２Ｂを追加したネットワーク構造を有している。

【0069】

なお、本実施の形態に係るニューラルネットワーク３ａの実装例は、図８に示すような場合に限らない。ResNet34のBuilding Blockのそれぞれに、または、ResNet18相当のBuilding Blockのそれぞれに、上述した接続ブロック１１２Ｂを追加したネットワーク構造を有するとしてもよい。

【0070】

ここで、ResNet34及びResNet18相当のネットワーク構造について説明する。

【0071】

図９Ａは、ResNet34のネットワーク構造の実装例を概念的に示す図である。図９Ａに示すように、ResNet34は、Building Block1～Building Block4で示される４つのBuilding Blockが積層される。また、Building Blockのそれぞれは、複数の畳み込み層と複数のスキップ接続との組み合わせにより構成されている。Building Block1では６層、Building Block２では８層、Building Block3では１２層、Building Block4では６層の畳み込み層が構成されている。スキップ接続は、２層の畳み込み層をまたぐように構成されている。よって、ResNet34は、３４層の畳み込み層を用いて構成されるネットワーク構造を有する。

【0072】

また、図９Ｂは、ResNet18相当のネットワーク構造の実装例を概念的に示す図である。図９Ｂに示すように、ResNet18相当は、Building Block1～Building Block4で示される４つのBuilding Blockが積層される。また、Building Blockのそれぞれは、４つの畳み込み層と、２層の畳み込み層をまたぐスキップ接続との組み合わせにより構成されている。つまり、ResNet18相当は、上記の非特許文献１に開示されているResNetをより浅い層で構成させたネットワーク構造であり、１８層の畳み込み層を用いて構成されるネットワーク構造を有する。

【0073】

［２．演算装置１の動作］
以上のように構成された演算装置１の動作の一例について以下説明する。

【0074】

図１０は、本実施の形態における演算装置１の動作概要を示すフローチャートである。図１０には、ニューラルネットワーク３ａを構成する複数のブロック１１１の１つのブロック１１１に行わせる演算処理が示されている。

【0075】

まず、演算装置１は、ニューラルネットワーク３ａのブロック１１１を構成する残差ブロックに、入力情報として第１情報を入力する（Ｓ１０）。より具体的には、演算装置１は、１以上の第１の畳み込み層と、１以上の第１の畳み込み層をまたぐ接続であるスキップ接続との組み合わせにより構成される残差ブロックに、第１情報を入力する。なお、第１情報は、ブロック１１１がBuilding Block1に該当する場合には、入力情報である。ブロック１１１がBuilding Block1に該当しない場合には、ブロック１１１を含むBuilding Blockの１つ前のBuilding Blockの出力である。

【0076】

次に、演算装置１は、残差ブロックの１以上の第１の畳み込み層により抽出された第１情報の特徴量と、残差ブロックのスキップ接続により出力された第１情報とを、接続ブロックに入力して、第１情報の特徴量と第１情報とを平均化させる（Ｓ１１）。

【0077】

［３．効果等］
本実施の形態によれば、ResNetなどで知られる残差ブロックに接続ブロックを追加することで、残差ブロックの出力に分散した重み付けを行うなどにより残差ブロックの出力を平均化させることができ、残差ブロックの入力と出力との非線形性を向上させることができる。よって、精度を維持するために必要なブロックの数を軽減することができるので、精度を維持しつつ、モデルサイズと演算量とをより軽減できるニューラルネットワークを実現できる。

【0078】

また、本実施の形態によれば、接続ブロックがさらにショートカット接続を備えることで、ブロックの入力と出力との非線形性を向上させ、勾配損失を回避できる。よって、精度を維持するために必要なブロックの数を軽減することができるだけでなく、ショートカット接続により接続ブロックの出力が勾配爆発または発散することを回避できるので、精度を維持しつつ、モデルサイズと演算量とをより軽減できる。

【0079】

また、精度を維持しつつ、モデルサイズと演算量とをより軽減できることにより、集積回路に実装し機器本体に設ける形態、いわゆるエッジＡＩでの利用を容易にする効果がある。

【0080】

例えば、テレビなどの放送波を受信し受信した放送波を処理する場合は、画像認識などの演算量の多い処理を行う必要がある。そのため、ResNetなどの従来のニューラルネットワークを用いる場合、従来のニューラルネットワークはクラウド上に実装され（いわゆるクラウドＡＩ）、インターネットなどのネットワークを介して通信する必要が発生する。そして、従来のニューラルネットワークをクラウド上で実装した場合、その通信量または通信による放送の遅延が生じる。一方、LVNetなどの本実施の形態に係るニューラルネットワークを用いる場合、本実施の形態に係るニューラルネットワークは、精度を維持しつつ、モデルサイズと演算量とをより軽減することができることから、集積回路での実装に適しており、テレビなどの機器本体に設けることができる。そのため、本実施の形態に係るニューラルネットワークは、例えインターネットなどのネットワークを介して通信する必要が発生した場合でも、通信量を削減できるので、、通信量または通信による遅延を抑制できる。

【0081】

（実施例）
演算装置１に用いられる本実施の形態に係るニューラルネットワーク３ａの有効性について検証したので、その実験結果を実施例として説明する。

【0082】

本実施例では、収集した２つの実験データであるテストＡ及びテストＢを用いて演算装置１に用いられるニューラルネットワーク３ａの性能を評価した。

【0083】

＜実験データ＞
図１１は、本実施例に係るデータベースの概要を示す図である。

【0084】

本実施例に係るデータベースには、図１１に示すアニメ、スポーツ、音楽、その他といった４つのカテゴリーについて収集された画像を格納した。なお、その他のカテゴリーには、天気、風景、トークといったカテゴリーが含まれる。

【0085】

データベースに格納された画像は、例えばYouTube（登録商標）、Google（登録商標）など、さまざまなリソースを用いて収集された１００万以上の高解像度の画像から生成した。また、データベースに格納された画像は、訓練データ（Training）としての９６Ｋ画像と、評価データ（Validation）としての７Ｋ画像に分けられている。

【0086】

また、テストＡは、クラス内の分散が少ない画像群から構成し、テストＢは、クラス間の分散が小さい画像群から構成した。

【0087】

＜実験条件＞
本実験では、対象のニューラルネットワークの学習をGPU（Graphics Processing Unit）を用いて８時間行った。本実験での学習は、次のパラメータにて行った。すなわち、学習率（Learning rate）を０．０２５に設定し１０エポックごとに半分になるように設定した。また、本実験での学習は、モーメンタムの最適化アルゴリズム(Optimizer)を使用したバッチ勾配降下法（Batch gradient descent）で０．９に設定して行った。

【0088】

＜実験結果＞
図１２は、実施例に係る実験結果を示す図である。より具体的には、図１２は本実施例に係るテストＡ及びテストＢを用いて本実施の形態に係るニューラルネットワーク３ａの精度と比較例のニューラルネットワークの精度とを評価した実験結果を示す図である。図１２では、本実施の形態及び比較例のニューラルネットワークのモデルサイズ、演算量（モデルの複雑さ）、パラメータ及びメモリアクセスも併せて示されている。なお、比較例のニューラルネットワークは、ResNet34とResNet18とである。当該ResNet34は図９Ａで示したResNet34に該当し、当該ResNet18は図９Ｂで示したResNet18相当に該当する。本実施の形態に係るニューラルネットワーク３ａは、LR10_CB128とLR10_CB128_SHとして示されている。LR10_CB128_SHは、LVNetすなわち図８で示したネットワーク構造を有するモデルに該当する。LR10_CB128は、図８で示したLVNetの接続ブロック１１２Ｂを図５に示す接続ブロック１１２Ａに変更したネットワーク構造を有するモデルに該当する。

【0089】

図１２に示すように、比較例に係るニューラルネットワークのResNet34及びResNet18と、本実施の形態に係るニューラルネットワーク３ａのLR10_CB128及びLR10_CB128_SHとで精度が同等であるのがわかる。

【0090】

また、図１２に示すように、本実施の形態に係るニューラルネットワーク３ａのメモリサイズと演算量（計算の複雑さ）は、比較例に係るニューラルネットワークのメモリサイズと演算量（計算の複雑さ）よりも大幅に削減されているのがわかる。さらに、LR10_CB128_SHすなわち図８で示したネットワーク構造を有するモデルであるLVNetは、他のすべてのニューラルネットワークと比較して、相対的に最高の性能を発揮していることもわかる。例えば、LR10_CB128_SHのモデルサイズと演算量（FLOPs）とは、ResNet18のモデルサイズの８．２％と演算量の６．３％とである。つまり、LR10_CB128_SHは、ResNet18と比較して、モデルサイズが９１．８％削減され、演算量（FLOPs）が９２．２％削減されていることがわかる。

【0091】

以上のように、本実施の形態によれば、ResNetと同等の精度を維持しつつ、モデルサイズと演算量とをより軽減できるニューラルネットワーク３ａを実現できる。

【0092】

（他の実施態様の可能性）
以上、本開示の一態様に係るニューラルネットワーク、演算装置及び演算方法について、実施の形態に基づいて説明したが、本開示は、これらの実施の形態に限定されるものではない。本開示の趣旨を逸脱しない限り、当業者が思いつく各種変形を本実施の形態に施したもの、あるいは異なる実施の形態における構成要素を組み合わせて構築される形態も、本開示の範囲内に含まれる。例えば、以下のような場合も本開示に含まれる。

【0093】

（１）上記の演算装置を構成する構成要素の一部または全部は、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭ、ハードディスクユニット、ディスプレイユニット、キーボード、マウスなどから構成されるコンピュータシステムでもよい。前記ＲＡＭまたはハードディスクユニットには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、各装置は、その機能を達成する。ここでコンピュータプログラムは、所定の機能を達成するために、コンピュータに対する指令を示す命令コードが複数個組み合わされて構成されたものである。

【0094】

（２）上記の演算装置を構成する構成要素の一部または全部は、１個のシステムＬＳＩ（Large Scale Integration：大規模集積回路）から構成されているとしてもよい。システムＬＳＩは、複数の構成部を１個のチップ上に集積して製造された超多機能ＬＳＩであり、具体的には、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどを含んで構成されるコンピュータシステムである。前記ＲＡＭには、コンピュータプログラムが記憶されている。前記マイクロプロセッサが、前記コンピュータプログラムにしたがって動作することにより、システムＬＳＩは、その機能を達成する。

【0095】

（３）上記の演算装置を構成する構成要素の一部または全部は、各装置に脱着可能なＩＣカードまたは単体のモジュールから構成されているとしてもよい。前記ＩＣカードまたは前記モジュールは、マイクロプロセッサ、ＲＯＭ、ＲＡＭなどから構成されるコンピュータシステムである。前記ＩＣカードまたは前記モジュールは、上記の超多機能ＬＳＩを含むとしてもよい。マイクロプロセッサが、コンピュータプログラムにしたがって動作することにより、前記ＩＣカードまたは前記モジュールは、その機能を達成する。このＩＣカードまたはこのモジュールは、耐タンパ性を有するとしてもよい。

【産業上の利用可能性】

【0096】

本開示は、ニューラルネットワーク、演算方法及びプログラムに利用でき、特に、リソースの限られたハードウェアプラットフォームに実装されても視覚課題に対して優れた性能を発揮することができるニューラルネットワーク、演算方法及びプログラムに利用できる。

【符号の説明】

【0097】

１演算装置
２入力部
３処理部
３ａニューラルネットワーク
４出力部
１０入力層
１１中間層
１２、１１２２出力層
１１１、１１１Ｂブロック
１１２、１１２Ａ、１１２Ｂ接続ブロック
１１３、１１２５加算部
１１１１、１１１２、１１２１、１１２６畳み込み層
１１２３重み
１１２４重み付け層

【図1】