特開2025-144065 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ キヤノン株式会社の特許一覧

特開2025-144065情報処理装置、情報処理方法及びプログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2025144065

(43)【公開日】2025-10-02

(54)【発明の名称】情報処理装置、情報処理方法及びプログラム

(51)【国際特許分類】

G06N 3/0464 20230101AFI20250925BHJP

【ＦＩ】

G06N3/0464

【審査請求】未請求

【請求項の数】15

【出願形態】ＯＬ

(21)【出願番号】P 2024043653

(22)【出願日】2024-03-19

(71)【出願人】

【識別番号】000001007

【氏名又は名称】キヤノン株式会社

(74)【代理人】

【識別番号】110001243

【氏名又は名称】弁理士法人谷・阿部特許事務所

(72)【発明者】

【氏名】近藤和史

(72)【発明者】

【氏名】中村隆

(72)【発明者】

【氏名】溝口慶範

(72)【発明者】

【氏名】山田貴之

(72)【発明者】

【氏名】山田顕季

(72)【発明者】

【氏名】石川尚

(57)【要約】

【課題】低コストでスキップ結合を実現することを可能とする。
【解決手段】複数の畳み込み層を有し、前記複数の畳み込み層のそれぞれが、前段側から入力された入力データから抽出した特徴量ベクトルに基づく出力データを後段側へ伝播させる畳み込み階層と、前記複数の畳み込み層のそれぞれで前記出力データを順に伝播させる順伝播経路と、前記順伝播経路の一部を迂回して前記出力データを伝播させる迂回経路と、を結合させる結合手段と、前記複数の畳み込み層のそれぞれで、前記入力データから前記特徴量ベクトルを抽出する処理を行う処理手段と、を備え、前記処理手段は、前記迂回経路における前記特徴量ベクトルを抽出する処理として、前記特徴量ベクトルの属性情報の一部を抽出する部分抽出処理を行い、前記結合手段は、前記迂回経路が利用される場合、前記順伝播経路からの出力結果と前記部分抽出処理の結果とを結合させる。
【選択図】図１９

【特許請求の範囲】

【請求項1】

複数の畳み込み層を有し、前記複数の畳み込み層のそれぞれが、前段側から入力された入力データから抽出した特徴量ベクトルに基づく出力データを後段側へ伝播させる畳み込み階層と、
前記複数の畳み込み層のそれぞれで前記出力データを順に伝播させる順伝播経路と、前記順伝播経路の一部を迂回して前記出力データを伝播させる迂回経路と、を結合させる結合手段と、
前記複数の畳み込み層のそれぞれで、前記入力データから前記特徴量ベクトルを抽出する処理を行う処理手段と、
を備え、
前記処理手段は、前記迂回経路における前記特徴量ベクトルを抽出する処理として、前記特徴量ベクトルの属性情報の一部を抽出する部分抽出処理を行い、
前記結合手段は、前記迂回経路が利用される場合、前記順伝播経路からの出力結果と前記部分抽出処理の結果とを結合させることを特徴とする情報処理装置。

【請求項2】

前記処理手段は、前記部分抽出処理として、前記特徴量ベクトルの次元、前記特徴量ベクトルのデータ長、前記特徴量ベクトルに含まれる画素のうち、少なくとも１つに基づいて特定される情報を抽出することを特徴とする請求項１に記載の情報処理装置。

【請求項3】

前記入力データは、複数の画素から構成され、
前記複数の畳み込み層のそれぞれは、複数の畳み込み係数が特定されたフィルタを有し、
前記処理手段は、前記複数の畳み込み層のそれぞれで、前記複数の画素と、前記複数の畳み込み係数とに基づく畳み込み処理を行うことで、前記特徴量ベクトルを抽出することを特徴とする請求項２に記載の情報処理装置。

【請求項4】

前記畳み込み階層は、複数のプーリング層を有し、
前記複数のプーリング層のそれぞれは、前記複数の畳み込み層のそれぞれの後段側に配置され、前記特徴量ベクトルを前記出力データとしての代表値に集約することを特徴とする請求項３に記載の情報処理装置。

【請求項5】

前記畳み込み階層の後段側に配置され、前記出力データを伸張するアップサンプリング層をさらに備え、
前記処理手段は、前記アップサンプリング層で、前記出力データを伸張することで、前記代表値のサイズを前記入力データまで大きくし、後段データとして出力することを特徴とする請求項４に記載の情報処理装置。

【請求項6】

前記アップサンプリング層の後段側に配置され、前記後段データがマッピングされた後段画像データを再構成する活性化層をさらに備え、
前記処理手段は、前記活性化層により再構成された前記後段画像データに基づいて、前記複数の画素から構成される画像データに写る被写体を分類することを特徴とする請求項５に記載の情報処理装置。

【請求項7】

前記畳み込み階層の後段側に配置され、前記代表値がマッピングされた後段画像データを再構成する活性化層をさらに備え、
前記処理手段は、前記活性化層により再構成された前記後段画像データに基づいて、前記複数の画素から構成される画像データに写る被写体を分類することを特徴とする請求項４に記載の情報処理装置。

【請求項8】

前記複数の畳み込み層のそれぞれは、複数の人工ニューロンを有し、
前記複数の人工ニューロンのそれぞれは、
前記畳み込み係数を用いて前記畳み込み処理を行う畳み込み部と、
前記畳み込み部から出力される前記畳み込み処理の結果に基づき、前記特徴量ベクトルの構成要素である特徴量を算出する活性化関数部と、
を有し、
前記処理手段は、前記畳み込み係数を、前記活性化層により再構成された前記後段画像データと、前記入力データと、に基づいて求めることを特徴とする請求項６に記載の情報処理装置。

【請求項9】

前記処理手段は、前記入力データに対し、一定のストライドで前記フィルタをシフトさせながら積和を行うことで、前記フィルタのシフトごとに前記入力データの局所的な特徴を表す特徴量を求め、求めた特徴量の集合を前記特徴量ベクトルとして抽出することを特徴とする請求項３に記載の情報処理装置。

【請求項10】

メインメモリとして機能する第１の記憶装置と、
キャッシュメモリとして機能する第２の記憶装置と、
をさらに備え、
前記第１の記憶装置は、前記入力データを記憶し、
前記第２の記憶装置は、前記複数の畳み込み層のそれぞれにおいて抽出された前記特徴量ベクトルを記憶することを特徴とする請求項１乃至９のいずれか１項に記載の情報処理装置。

【請求項11】

前記処理手段は、前記部分抽出処理を行う場合、前記第１の記憶装置から前記入力データを取得することを特徴とする請求項１０に記載の情報処理装置。

【請求項12】

前記第１の記憶装置は、ＤＲＡＭから構成され、
前記第２の記憶装置は、ＳＲＡＭから構成されることを特徴とする請求項１０に記載の情報処理装置。

【請求項13】

前記畳み込み階層は、前記入力データから構成される画像データを一定の空間領域ごとに分割された分割データが前記畳み込み階層に入力されることを特徴とする請求項３に記載の情報処理装置。

【請求項14】

複数の畳み込み層を有する情報処理装置の情報処理方法であって、
前記複数の畳み込み層のそれぞれが、前段側から入力された入力データから抽出した特徴量ベクトルに基づく出力データを後段側へ伝播させるステップと、
前記複数の畳み込み層のそれぞれで前記出力データを順に伝播させる順伝播経路と、前記順伝播経路の一部を迂回して前記出力データを伝播させる迂回経路と、を結合させるステップと、
前記複数の畳み込み層のそれぞれで、前記入力データから前記特徴量ベクトルを抽出する処理を行うステップと、
を含み、
前記処理を行うステップは、前記迂回経路における前記特徴量ベクトルを抽出する処理として、前記特徴量ベクトルの属性情報の一部を抽出する部分抽出処理を行い、
前記結合させるステップは、前記迂回経路が利用される場合、前記順伝播経路からの出力結果と前記部分抽出処理の結果とを結合させることを特徴とする情報処理方法。

【請求項15】

コンピュータに、請求項１４に記載の情報処理方法の各ステップを実行させるためのプログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本開示は、情報処理装置、情報処理方法及びプログラムに関する。

【背景技術】

【0002】

従来、ニューラルネットワークの学習においてスキップ結合が行われている。スキップ結合は、ディープニューラルネットワークにおいて、途中の複数層をスキップして先の層へつなげる迂回経路により、離れた層の間で順伝播あるいは逆伝搬を行えるようにする構成である。スキップ結合は、勾配消失問題を改善する側面がある一方、ニューラルネットワークの汎化性能が低下する側面もある。そこで、無効化対象とするスキップ結合を選択し、選択したスキップ結合に対してだけ誤差の伝播を遮断する技術が特許文献１に開示されている。特許文献１に開示された技術では、ニューラルネットワークの学習の都度、無効化対象とするスキップ結合を選択する処理が行われる。よって、各層の結合の仕方が異なるニューラルネットを用いた学習を繰り返し行うことが可能となる。したがって、特許文献１に開示された技術では、アンサンブル学習を実現することが可能となるため、全体として、ニューラルネットワークの汎化性能が向上する。

【先行技術文献】

【特許文献】

【0003】

【特許文献1】国際公開第２０１９／１６７６６５号

【発明の概要】

【発明が解決しようとする課題】

【0004】

上記スキップ結合は、それまでの処理結果を保持し続けることが要求される側面もある。一般的に、処理結果を保持し続けるほど、記憶領域として使用される回路面積は増大する。よって、特許文献１に開示された技術は、全体として、ニューラルネットワークの汎化性能を向上させる側面がある一方、記憶領域として使用される回路面積の増大に伴うコストが増加する側面もある。例えば、処理結果の保持に用いられるキャッシュメモリはＳＲＡＭから構成されることが多いが、一般的に、ＳＲＡＭ（ＳｔａｔｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）は高価なメモリである。よって、ＳＲＡＭの記憶領域として使用される回路面積は増大させないことが望ましい。しかし、ＳＲＡＭの記憶領域として使用される回路面積を増大させない場合には、処理結果を保持し続けるためのメモリの記憶領域が不足し、上記スキップ結合を実現できなくなる可能性がある。

【0005】

本開示は、上記課題に鑑みてなされたものであり、低コストでスキップ結合を実現することを可能とすることを目的とする。

【課題を解決するための手段】

【0006】

本開示の一態様に係る情報処理装置は、複数の畳み込み層を有し、前記複数の畳み込み層のそれぞれが、前段側から入力された入力データから抽出した特徴量ベクトルに基づく出力データを後段側へ伝播させる畳み込み階層と、前記複数の畳み込み層のそれぞれで前記出力データを順に伝播させる順伝播経路と、前記順伝播経路の一部を迂回して前記出力データを伝播させる迂回経路と、を結合させる結合手段と、前記複数の畳み込み層のそれぞれで、前記入力データから前記特徴量ベクトルを抽出する処理を行う処理手段と、を備え、前記処理手段は、前記迂回経路における前記特徴量ベクトルを抽出する処理として、前記特徴量ベクトルの属性情報の一部を抽出する部分抽出処理を行い、前記結合手段は、前記迂回経路が利用される場合、前記順伝播経路からの出力結果と前記部分抽出処理の結果とを結合させることを特徴とする。

【発明の効果】

【0007】

本開示によれば、低コストでスキップ結合を可能とする。

【図面の簡単な説明】

【0008】

【図1】推論実施装置の構成を示すブロック図である。

【図2】推論部の構成例を示す概念図である。

【図3】スキップ結合の構成を示す模式図である。

【図4】推論部を構成するフィルタの回路概念図である。

【図5】ＣＮＮの入力部近傍を示す模式図である。

【図6】畳み込み層で実施される処理の概要を説明するフローチャートである。

【図7】ＣＮＮを構成するニューロンの詳細を示す模式図である。

【図8】畳み込み処理を説明するフローチャートである。

【図9】ＣＮＮの出力部近傍を示す模式図である。

【図10】推論部を構成するフィルタの回路概念図である。

【図11】学習に用いる画像を示す概念図である。

【図12】推論部を構成するフィルタの回路概念図である。

【図13】学習を説明するフロー図である。

【図14】再抽出の動作を示すフローチャートである。

【図15】５層目の特徴量ベクトルがスキップ結合される例を示す図である。

【図16】推論部を構成するフィルタの回路概念図である。

【図17】ＣＮＮ処理の概略図である。

【図18】推論部を構成するフィルタの回路概念図である。

【図19】次元圧縮した特徴量ベクトルを用いたスキップ結合を説明する模式図である。

【図20】スキップ結合を行うモデルの模式図である。

【図21】スキップ結合の詳細を説明する模式図である。

【図22】ＣＮＮモデルを学習する際の設定画面を示す図である。

【図23】ＣＮＮモデルを学習する際の詳細設定画面の一例を示す図である。

【図24】ＣＮＮモデルを学習する際の詳細設定画面の他の一例を示す図である。

【図25】自動ＣＮＮモデル設計を示すフローチャートである。

【発明を実施するための形態】

【0009】

以下、添付図面を参照して本開示の好適な実施の形態を詳しく説明する。尚、以下の実施の形態は本開示事項を限定するものでなく、また以下の実施の形態で説明されている特徴の組み合わせが本開示の解決手段に必須のものとは限らない。尚、同一の構成要素には同一の参照符号を付す。

【0010】

＜＜第１実施形態＞＞
［概要］
ニューラルネットワークの学習を繰り返すにつれ、誤差逆伝搬において求めていた勾配が小さくなっていき、最終的には消失するという勾配消失問題が一般的に知られている。そこで、勾配消失問題を解消するためにスキップ結合が行われている。スキップ結合は、ディープニューラルネットワークにおいて、途中の複数層をスキップして先の層へつなげる迂回経路により、離れた層の間で順伝播あるいは逆伝搬を行えるようにする構成である。スキップ結合では、ニューラルネットワークを構成する複数の層のうち、いくつかの層をスキップする迂回経路を設けることにより、迂回経路と、順伝播経路とが並列して設けられる。このような経路構成により、複数の層のうち、いくつかの層をスキップして特徴を別の経路で遠くの層へ伝播可能となる。よって、複数の層の前段側の層で実施される畳み込み処理等により消失していく特徴を、複数の層の後段側へ伝播させていくことが可能となる。しかし、スキップ結合を実現するためには、各層で抽出した特徴量ベクトルを保持し続けることが必要となる。よって、スキップ結合をしない場合と比べ、スキップ結合をする場合には、メモリの記憶領域がより多く必要となる。さらに、スキップ結合において各層の特徴量ベクトルを保持し、必要に応じて処理に用いる場合には、メインメモリよりもキャッシュメモリに保持しておくことで処理効率を確保している。このため、より多くのキャッシュメモリが必要となる。キャッシュメモリには、一般的に、ＳＲＡＭが使用されるが、ＳＲＡＭは高価である。そこで、本実施形態では、低コストでスキップ結合を実現するために各層で抽出した特徴量ベクトルを保持し続ける代わりに、以下の動作が行われる。すなわち、迂回経路における特徴量ベクトルを抽出する処理として、特徴量ベクトルの属性情報の一部を抽出する部分抽出処理が行われる。さらに、迂回経路が利用される場合、順伝播経路からの出力結果と部分抽出処理の結果とが結合される。このような動作によれば、高価なＳＲＡＭの記憶領域として使用される回路面積を増大させることなく、スキップ結合を実現することが可能となる。なお、ニューラルネットワークのモデル構成は特に限定するものではない。例えば、エンコーダデコーダのモデルを構成する畳み込みニューラルネットワークであってもよい。あるいは、ＲｅｓＮｅｔに代表されるモデルに存在するＩｎｖｅｒｔｅｄＲｅｓｉｄｕａｌであってもよい。

【0011】

本明細書で使用する主な用語について、予め以下のように定義する。
＜用語定義＞
人工ニューロン：
フィルタと活性化関数部とから構成される処理単位である。当該フィルタの畳み込み係数を、「重み」とも称する。また、当該フィルタの畳み込み係数を適宜「人工ニューロンの重み」とも称する。人工ニューロンは、当該フィルタの入力データを受け取る。人工ニューロンは、例えば、３×３フィルタであれば、５×５の入力データを受け取り、畳み込み後の値を活性化関数部へ転送し、活性化関数部により算出された特徴量を出力する。
活性化関数部：
非線形な応答特性を持つ関数である。ソフトマックス関数が使用されるが、ＲｅＬＵ（ＲｅｃｔｉｆｉｅｄＬｉｎｅａｒＵｎｉｔ）関数であってもよい。非線形な応答特性を持つ関数を使用すれば、入力と出力の関係が非線形な応答特性を持つが、特にこれに限定されない。例えば、活性化関数部は、線形な応答特性を持つ関数であってもよい。あるいは、活性化関数部は、恒等関数であってもよい。例えば、スキップ結合により遠くの層へ特徴量ベクトルを送る場合、活性化関数部は、恒等関数で実現されてもよい。
層：
複数の人工ニューロンからなる処理単位である。各々の人工ニューロンは原則として共通のデータが入力される。ただし各々の人工ニューロンの畳み込み係数（重み）は、取得したい特徴に応じて異なる重みを設定できる。複数の人工ニューロンから構成される理由は、入力データを多面的に分析するためである。
特徴量：
１つの人工ニューロンからの出力を特徴量と呼ぶ。異なる人工ニューロンは異なる特徴量出力する。なお、特徴量は、強度のような一定の指標として人工ニューロンから出力されてもよい。
特徴量ベクトル：
１つの層から出力される複数の特徴量からなるベクトルである。このベクトルの次数を、以下では「チャネル」と称する。

【0012】

［前提技術］
以下、図面を参照して発明の実施形態について説明する。本実施形態で説明する実施形態では、ＥｄｇｅＡＩ端末で推論を実施するにあたり、必要とする学習結果はあらかじめ外部で学習済みである場合を想定する。ここで、ＥｄｇｅＡＩ端末とは、製品単体が人工知能の結果を享受できる製品である。ＥｄｇｅＡＩ端末は、ＣＮＮ（ＣｏｎｖｏｌｕｔｉｏｎａｌＮｅｕｒａｌＮｅｔｗｏｒｋ）で必要とされる「学習」及び「推論」の両方を備えなくてもよい。事前に用意された学習の結果となるパラメータを保持することで、製品は「推論」を実現可能である。ＣＮＮは、機械学習を用いたパターン認識の一つである。また、ＣＮＮは、製造業者が製品の差別化のための高機能化を実現する処理手法の一つである。ＣＮＮがパターン認識を実現する動作概要について説明する。

【0013】

［ＣＮＮの動作概要］
まず、予め用意された特徴量抽出方法に則り、入力データの特徴を抽出する。ここで、特徴量抽出方法について説明する。特徴量の抽出は、多段フィルタを用いた膨大な畳み込み処理によって実現可能である。この多段フィルタは、複数のフィルタと、複数の活性化関数部とから構成される。複数のフィルタのそれぞれの後段側には、複数の活性化関数部のそれぞれが配置される。１つのフィルタと１つの活性化関数部との組は、上記で定義した「人工ニューロン」に相当する。活性化関数部は、例えば、入力に対する応答が非線形な関数である。各フィルタは、畳み込み係数を有する。ここで、畳み込み係数の決定方法について説明する。畳み込み係数は、パターンの類型を定めることを目的として、予め膨大なデータを用いることで決定可能である。具体的には、畳み込み係数は、膨大な正解データを用意し、未知のデータが正解になる率が高くなるまで、畳み込み係数を最適化していくことにより決定可能である。このような決定方法を、以下、「学習」と称する。学習の結果として得られた畳み込み係数を用いて膨大な畳み込み処理が行われることで、入力データの特徴量は抽出される。このようにして得られる入力データの特徴量は、各人工ニューロンで得られるため、１種類とは限らない。入力データの複数の特徴量のうちの少なくともいくつかの特徴量は、上記で定義した「特徴量ベクトル」に相当する。ＣＮＮは、このようにして、入力データから特徴量ベクトルを抽出する。

【0014】

次に、ＣＮＮは、特徴量ベクトルが、予め定められた類型としてのパターンのどれと一致するのかを、ＣＮＮの最終層の出力から同定する。このようにして、入力データは、既知のパターンで分類される。これにより、パターン認識は実現される。このようなパターン認識が、上記「推論」に該当する。

【0015】

なお、ＣＮＮは、エンコード層と、デコード層とから構成されるエンコーダデコーダのモデルによって実現されてもよい。エンコーダデコーダのモデルにより画素単位で画素の属性が判断されてもよい。エンコーダデコーダのモデルは、画像中の全ての画素について属性を判断する。つまり、エンコーダデコーダのモデルにより画素単位で属性を判断することも可能である。このような処理は、以下、「領域分割」と称する。あるいは、このような処理は、「セグメンテーション」と称されてもよい。なお、ここでいう「セグメンテーション」は、いわゆるセマンティックセグメンテーションに相当する。画素ごとの画素の属性の判断結果の集積により、連続する画素が同一の対象であるかが識別可能である。具体的には、エンコード層は、入力データからダウンサンプリングを実施することにより広域を対象とした特徴量を抽出する。一方、デコード層は、抽出された特徴量の入力データと同解像度にアップサンプリングしながら最終的な判断結果を導出する。このエンコーダデコーダのモデルとして構成されるＣＮＮには、例えば、以下の特性がある。１つは、入力データが非常に多くの層を経て最終的な判断結果に至る特性がある。この結果、処理の中間層において、解像度が変化することも特性である。

【0016】

また、次で説明する特性もある。ＣＮＮで用いられる人工ニューロンは、上記フィルタを備える。上記フィルタは入力データに畳み込み処理を実施する。このフィルタは、上記で説明したように、畳み込み係数を有する。畳み込み係数は、いわゆる「重み」である。ＣＮＮでは、モデルを通して得られた特徴量を、真の値と比較する。具体的には、ＣＮＮでは、計算された特徴量と、真の値との差をとる。この差を「誤差」と称する。この誤差が小さくなるように「重み」を求めていく方法が、誤差逆伝搬法と称される。また、誤差逆伝搬法を繰り返し用いて畳み込み係数を最適化していくことは、上記「学習」の具体例である。このように、学習を通じて畳み込み係数を決定することも、ＣＮＮの特性である。

【0017】

［スキップ結合］
これらの特性は、次のような現象を引き起こす可能性がある。例えば、学習時に誤差逆伝播が正しく進行しない現象が引き起こされ得る。その理由は、層が深くなるにつれ、誤差逆伝搬法による処理結果が小さくなり、学習が進まないからである。以下、このような現象は、「勾配消失」と称される。あるいは、各層を通過するごとに解像度が変化していくことで、エンコード時には保持していた入力データの局所的な特徴を示す情報が失われる現象が引き起こされ得る。これらの現象は、学習時の精度劣化になり得る。このような学習時の精度劣化の対策として、従来から「スキップ結合」が使用されてきた。スキップ結合とは、エンコードデコードのモデルであれば、エンコード層のデータをデコード層の畳み込み処理に再度使用することで実現し得る。このような動作は、エンコード時に喪失した情報を用いてデコード時の情報の質を向上させる。同時に、このような動作は、学習時、スキップ結合によって生じる帰還成分も含めた好適な誤差逆伝播を実現させる。よって、エンコード時に喪失された局所エッジを回復させるような学習が可能となる。また、画像の領域境界部を正確に判断可能である。しかし、スキップ結合を実施する場合には、例えば、エンコード層における処理結果をデコード層に引き渡す必要がある。よって、エンコード時に用いる層が進行するほど、各人工ニューロンにおける処理結果がＳＲＡＭ内に保持されていく。その理由は、デコード時にエンコード時の結果を用いるには、ＳＲＡＭ内に全て記憶しておく必要があるからである。

【0018】

また、ＣＮＮは、画像の認識に使用可能である。ＣＮＮを画像の認識に使用するには、画像全体に畳み込み処理が行われればよい。ここで、畳み込み処理で用いられるフィルタについてより具体的な一例を説明する。例えば、画像に対し、３×３のフィルタを１つだけ適用することを想定する。畳み込み処理は、畳み込み係数と画像に含まれる画素との積の総和を、中心画素の値とする処理である。したがって、３×３の画像に対し、３×３のフィルタを適用する場合、中心画素の１画素しか値が定まらない。もし、３×３の画像の周囲に隣接する画素にも、３×３のフィルタを適用しようとすると、５×５の画像が必要である。このように、必要とする画像領域に応じて畳み込む際の処理で必要となる周辺画素を、以下、「のりしろ」と称する。各フィルタのサイズが大きくなり、ＣＮＮ全体として、何層にもわたって２次元的なフィルタの段数の積み重ねも増えれば、さらにのりしろを多くとる必要がある。したがって、必要なのりしろの量は、３次元的に増大する。このようにのりしろが増大すると、それに応じてメモリの記憶領域の使用量も増大させる必要がある。例えば、畳み込み処理では、メインメモリから取得したデータがキャッシュメモリに展開される。キャッシュメモリは、一般的にはＳＲＡＭが用いられる。よって、のりしろが増大する状況では、ＳＲＡＭの記憶領域の使用量が増大する。特に、１つあるいは２つのフィルタに比べて、大規模なフィルタを何段も重ねた場合、ＳＲＡＭの記憶領域の使用量が３次元的に増大する。

【0019】

以上のことから、何層にもわたって、フィルタを用いた畳み込み処理を行うには、膨大なＳＲＡＭの記憶領域が必要となる。さらに、スキップ結合を行うにも、膨大なＳＲＡＭの記憶領域が必要となる。例えば、エンコーダデコーダのモデルであれば、スキップ結合が行われることで、デコード時のデータの信頼性を向上させることができるが、必要なＳＲＡＭの記憶領域は指数関数的に増加する。ＳＲＡＭは高価であるため、ＳＲＡＭの記憶領域を大幅に増加させれば、高コストになる。一方、ＳＲＡＭの記憶領域を増加させなければ、スキップ結合に要するキャッシュメモリが不足する。なお、エンコーダデコーダのモデルにおけるスキップ結合の一例を説明したが、他のモデルであっても、スキップ結合には通常多くのキャッシュメモリが必要となるので、低コストでスキップ結合を行うことができない状況であった。そこで、本実施形態では、低コストでスキップ結合を行うことが可能となる構成及び動作について、以降で順に説明する。

【0020】

［推論実施装置全体］
図１は、推論実施装置の構成を示すブロック図である。推論実施装置１００は、製品本体に実装される情報処理装置である。本実施形態において、製品本体はプリンタを想定する。ただし、推論実施装置の実施される製品本体はプリンタに限らず、パーソナルコンピュータや、スマートフォン等の製品内に、ＣＰＵあるいはそれに類するＡＳＩＣ、ＦＰＧＡといった処理回路を内在したものも、本実施形態の構成をとることができる。推論実施装置１００は、データ転送Ｉ／Ｆ１０１、データバス１０２、ＤＲＡＭ（ＤｙｎａｍｉｃＲａｎｄｏｍＡｃｃｅｓｓＭｅｍｏｒｙ）１０３を備える。また、推論実施装置１００は、ＣＰＵ（ＣｅｎｔｒａｌＰｒｏｃｅｓｓｉｎｇＵｎｉｔ）１０４、推論部１０５、ＲＯＭ（ＲｅａｄＯｎｌｙＭｅｍｏｒｙ）１０６を備える。データ転送Ｉ／Ｆ１０１は、不図示の製品外部機器からのデータ入出力を行うインタフェイスである。外部機器として例えばパーソナルコンピュータあるいは携帯電話といったように、入力データを生成あるいは保持することができ、且つ製品本体に入力データを転送できる機器が挙げられる。データバス１０２は、データ転送Ｉ／Ｆ１０１から受け取った各種データを、後述する機能ブロックに転送するためのデータバスである。ＤＲＡＭ１０３は、データ転送Ｉ／Ｆ１０１から受け取った各種データを一時的に記憶する領域である。ＣＰＵ１０４は、ＤＲＡＭ１０３に記憶された入力データを、データバス１０２を通して授受し、必要な処理を行う。推論部１０５は、画像ブロックに分割されたデータを受け取り、内部で推論を実施する機能ブロックである。推論部１０５は、ＳＲＡＭを有する。ＲＯＭ１０６は、推論部１０５に供する各種データを保持する領域である。例えば、ＲＯＭ１０６は、予め学習した結果により定まる畳み込み係数を記憶することができる。また、後述するようにＤＲＡＭ１０３から推論部１０５に渡す画像ブロックのサイズもここに記憶されている。これらの構成は例であり、例えばＲＯＭ１０６の代わりに任意の記憶媒体を用いてもよい。任意の記憶媒体とは、例えばＨＤＤあるいはＵＳＢインタフェイスを介した外部メモリなどでもよい。また、本実施形態では推論部１０５において推論が実施される。しかしながら同等の機構を実現するためのファームウェアを記憶媒体に記憶させ、ＣＰＵ１０４に処理させてもよい。また、機能拡張の一環として、データ転送Ｉ／Ｆ１０１を介してＤＲＡＭ１０３から推論部１０５に渡す画像ブロックのサイズをパラメータとして授受してもよい。

【0021】

［推論部］
図２は、推論部１０５の構成例を示す概念図である。図２の推論部１０５は、エンコーダデコーダのモデルに従って動作することを想定する。エンコーダデコーダのモデルとしては、例えば、ＳｅｇＮｅｔ、Ｕ－Ｎｅｔ等が挙げられる。推論部１０５は、ＣＰＵ１０４が各種プログラムを実行することで推論実施部２００として各機能構成を実現する。推論実施部２００は、エンコード層２０１と、デコード層２０２とを含む。エンコード層２０１は、入力層２０３と、処理層２０４とを含む。エンコード層２０１は、入力データの特徴をエンコードする。デコード層２０２は、エンコード層２０１で得られた処理結果をデコードし、特徴量ベクトルを抽出する。入力層２０３には、入力データが入力される。ここで、層とは、ＣＮＮのモデルにおいて多数のフィルタを連続的に用いて何らかの処理を実現する１つの作用体のことである。必ずしも物理構成として複数のフィルタが必要なわけではない。また、畳み込み係数を漸次更新し、処理結果を次のフィルタの処理に供すれば連続した２つのフィルタ処理をしたことになる。ここでは、そのような層の一例として、入力層２０３を図示している。処理層２０４は、入力層２０３から供される入力データを受けて、その後の処理を実現するための層である。このような処理を通して、前半部において、エンコードを実現する。これらの後続の層も、入力層に等しく複数のフィルタを用いて構成されている。デコード側も、エンコーダ側と同様に複数のフィルタを用いた処理層を持つ構成となる。図２の一例では、各層が矩形形状の面を有する立方体で示されているが、その大きさにより解像度が示される。つまり、エンコード側では層の処理が進むにつれ、解像度が下がり、デコード側では層の処理が進むにつれ、解像度が上がることが示される。以下の説明では連続して多数のフィルタを使用することを説明する。また、デコード側からの最終的な出力は、最終層における活性化関数部の処理によって一意に決まる。活性化関数部の処理結果により、画素の属性の確率が定まる。なお、図２の一例では、エンコーダデコーダのモデルを想定しているため、ＣＮＮのデコード層についての説明は省略する。図２の一例では、ＣＮＮは、二次元フィルタを複数組み合わせていくつかの層を構成する。構成された層を組み合わせてエンコードとデコードを行う。これらの処理を通して特徴量ベクトルを得る。なお、図２の推論部１０５は、エンコーダデコーダのモデルを想定するが、モデルは特にこれに限定されない。例えば、ＲｅｓＮｅｔのモデルを想定してもよい。ＲｅｓＮｅｔのモデルであれば、入力層の後段側に、畳み込み層及びプーリング層が複数段設けられた後、全結合層、出力層が設けられた構成となる。

【0022】

［スキップ結合の概要］
次に、スキップ結合について説明する。図３は、スキップ結合の構成を示す模式図である。本実施形態において、エンコード層２０１は、図の上では７つの矩形で表されている。７つの矩形のそれぞれは、層を示す。各層は、複数の人工ニューロンを有する。また、各矩形の長さは、入力データの解像度を示す。つまり、矩形の長さが短くなるにつれ、入力データの解像度は下がる。一方、矩形の長さが長くなるにつれ、入力データの解像度は上がる。よって、図３のエンコード層２０１では、７つの層からなる場合が例示されている。なお、層の構成はこれに限定されない。各層は、所望の特徴量を抽出できるように人工ニューロンが組み合わされて構成されればよい。畳み込み層では積和処理による畳み込み処理が実施され、プーリング層では畳み込み処理結果からの代表値の集約が実施される。この結果、入力データの特徴量が抽出されつつ、入力データは間引かれることになり、結果として、入力データの圧縮処理（以下、ダウンサンプリングとも称する）が行われる。すなわち、ダウンサンプリングとは、畳み込み処理で得られた複数の値の中から特定のアルゴリズムで代表値として集約することで行われるプーリングである。そのプーリングを行うための特定のアルゴリズムとしては、例えば、畳み込み処理で得られた複数の値の平均値を求める処理である。これにより、畳み込み処理で得られた複数の値は１つの代表値に集約される。あるいは、畳み込み処理で得られた複数の値の中の最大値を求める処理である。これにより、畳み込み演算で得られた複数の値は１つの代表値に集約される。このように、プーリングを実施することで、画像内の座標の位置が変化したときの性能劣化を抑えることができる。なお、プーリング層を用いない場合には、畳み込み時に走査するフィルタの移動幅（ストライド）を増やし、結果として縮小変倍後の画像の特徴量を取得することによってダウンサンプリングする場合もある。どのような手法であったとしても、エンコード時の任意の層から出力値となる特徴量ベクトルを得ることができる。デコード側の処理層についても同様である。ただし、デコード層では特徴量の解像度を伸長する処理として、アップサンプリング層が使用される。通常の処理は、入力層２０３にデータが入力され、入力層の後段側へ処理が進んでいく。この処理方向は、順伝播方向である。出力層３０１は、この層の時点での特徴量ベクトルを出力する層である。次元追加層３０２は、出力層３０１から出力された特徴量ベクトルを用いて、次元が追加される層である。ここで、次元の追加について述べる。一般にｎ次のベクトルとｎ次のベクトルの加算の結果得られる和の次元はｎ次である。ｎ次のベクトルと、ｍ次のベクトルとに、数学的な加算は定義されていない。次元の追加はベクトル加法という意味ではなく、異なる次元のベクトルを単に並べて（ｎ＋ｍ）次のベクトルを生成することを意味すると約束する。このような処理を、以下では「次元結合」と記す。このように、エンコード側の任意の層の出力を、デコード側の任意の層の入力時に次元を追加するように並べられるような処理方法を、スキップ結合と呼ぶ。つまり、スキップ結合とは、ベクトルの成分を増やす動作になる。なお、アップサンプリング層において、補間によりデータを伸長する処理が行われてもよい。あるいは、転置畳み込み処理や上昇畳み込み処理によりデータを伸長する処理が行われてもよい。

【0023】

以上のことから、本実施形態における情報処理装置は、モデルにかかわらず、以下の構成を備える。すなわち、情報処理装置は、畳み込み階層と、結合手段と、処理手段とを備える。畳み込み階層は、複数の畳み込み層を有する。畳み込み階層は、複数の畳み込み層のそれぞれが、前段側から入力された入力データから抽出した特徴量ベクトルに基づく出力データを後段側へ伝播させる。ここで、前段側とは、各畳み込み層の直前の前段という意味である。また、後段側とは、各畳み込み層の直後の後段という意味である。結合手段は、図１のＣＰＵ１０４で実現される。結合手段は、順伝播経路と、迂回経路とを結合させる。順伝播経路は、複数の畳み込み層のうちの一部の畳み込み層から他の一部の畳み込み層までの間にある各畳み込み層に出力データを順に伝播させる。迂回経路は、順伝播経路を迂回して一部の畳み込み層から他の一部の畳み込み層へ出力データを伝播させる。処理手段は、図１のＣＰＵ１０４で実現される。図１のＣＰＵ１０４は、複数の畳み込み層のそれぞれで、入力データから特徴量ベクトルを抽出する。図１のＣＰＵ１０４は、複数の畳み込み層のうち、迂回経路による迂回が開始される畳み込み層までに含まれる特徴量ベクトルを再度抽出する処理を再抽出処理として行う。結合手段は、処理手段により再抽出処理が行われた場合、順伝播経路からの出力結果と処理手段により再抽出処理が行われた結果とを結合させる。このような構成によれば、順伝播経路においてキャッシュメモリに各層の特徴量ベクトルを保持させなくても、各層の特徴量ベクトルを再度抽出するため、スキップ結合を実現可能である。したがって、低コストでスキップ結合を可能とする。なお、入力データは、複数の要素から構成される。複数の要素は、例えば、複数の画素である。よって、入力データは、例えば、複数の画素から構成される。また、複数の畳み込み層のそれぞれは、複数の畳み込み係数が特定されたフィルタを有する。このフィルタについては図４、１０、１２、１６、１８を用いて後述する。図１のＣＰＵ１０４は、複数の畳み込み層のそれぞれで、複数の画素と、複数の畳み込み係数とに基づく畳み込み処理を行うことで、特徴量ベクトルを抽出する。このような動作によれば、フィルタを用いて特徴量ベクトルを抽出可能である。具体的には、図１のＣＰＵ１０４は、入力データに対し、一定のストライドでフィルタをシフトさせながら積和処理を行うことで、フィルタのシフトごとに入力データの局所的な特徴を表す特徴量を求め、求めた特徴量の集合を特徴量ベクトルとして抽出する。このような動作によれば、フィルタを用いて入力データから特徴量ベクトルを抽出可能である。なお、ここで、フィルタのシフトとは、記憶領域に展開される入力データの画素のうち、フィルタが有する畳み込み係数で処理する領域を一定のストライドでシフトするという意味である。よって、フィルタを物理的に移動するという意味ではない。

【0024】

［フィルタの回路構成］
図４は、推論部１０５を構成するフィルタ４００の回路概念図である。フィルタ４００は、ＳＲＡＭ４０１と、レジスタ４０２とを有する。図４の一例では、ＳＲＡＭ４０１の記憶領域には、データ４０３と、畳み込み係数のデータセット４０４とが展開されている。データ４０３は、メインメモリとして機能するＤＲＡＭ１０３から取得され、ＳＲＡＭ４０１の記憶領域のうち所定の記憶領域に展開されている。データ４０３は、画素ｄ１乃至ｄ９から構成されている。畳み込み係数のデータセット４０４は、ｃ１乃至ｃ９から構成され、３×３で配置される。また、レジスタ４０２には、畳み込み係数のデータセット４０４と同様の配置構成として３×３でｒ１乃至ｒ９のデータセット４０５が配置される。ｒ１乃至ｒ９のデータセット４０５は、畳み込み処理の際、３×３の位置関係（座標）を保持するために利用される。

【0025】

［畳み込み係数の生成方法］
次に、畳み込み係数の生成方法を述べる。
［生成環境］
図５は、ＣＮＮの入力部近傍を示す模式図である。本実施形態では、不図示のパーソナルコンピュータを学習実施装置として用いて生成してもよい。学習実施装置は、パーソナルコンピュータに限らず、プリンタ、スマートフォン等の製品内に、ＣＰＵ、それに類するＡＳＩＣあるいはＦＰＧＡのような処理回路を内在したものであってもよい。あるいは、推論実施装置１００が学習により畳み込み係数を生成してもよい。

【0026】

データ５０１は入力データである。例えば入力データが画像データである場合、データ５０１は図のように３×３の画素が、座標ごとにＲ、Ｇ、Ｂの３チャネル分用意される。人工ニューロン５０２乃至５０７は、データ５０１を処理する要素である。人工ニューロン５０２乃至５０７は、この例では、データ５０１を畳み込むための畳み込み係数を保持している。保持されている畳み込係数は、Ｒ、Ｇ、Ｂの３チャネル分ある。後述するように、現段階ではこの値は生成対象としての変数である。例えば人工ニューロン５０２には、データ５０１を畳み込むための３×３の畳み込み係数がＲ、Ｇ、Ｂの３チャネル分保持されている。人工ニューロン５０２乃至５０７は、異なる特性の畳み込み係数を保持できる。これは、１つの畳み込み処理は１つの特徴量を抽出できるためである。複数の異なる特徴量を抽出するためには、複数の畳み込み処理を行えばよい。本実施形態では、畳み込み層として、６つの人工ニューロン５０２乃至５０７を有する１段目の処理層と、４つの人工ニューロン５１０乃至５１３を有する２段目の処理層と、を設ける一例を説明する。人工ニューロン５０２乃至５０７を有する第１段の処理層は、人工ニューロン５０２乃至５０７のそれぞれで畳み込み処理を終えると、６つの特徴量を後段側へ抽出可能である。また、人工ニューロン５１０乃至５１３を有する第２段の処理層は、人工ニューロン５１０乃至５１３のそれぞれで畳み込み処理を終えると、４つの特徴量を後段側へ抽出可能である。つまり、人工ニューロン５１０乃至５１３は、人工ニューロン５０２乃至５０７のそれぞれで抽出された特徴量を前段側から受け取り、同様に畳み込み処理を行うことで、４つの特徴量を後段側へ抽出する。

【0027】

［学習の概要］
図６は、畳み込み層で実施される処理の概要を説明するフローチャートである。図６に示す処理は、ＣＰＵ１０４によって実現されてもよい。以下の説明では、ＣＰＵ１０４が処理を実行する一例を説明する。なお、図６におけるステップのうちの一部または全部の機能をＡＳＩＣまたは電子回路等のハードウェアで実現してもよい。各処理の説明における記号「Ｓ」は、当該フローチャート図におけるステップであることを意味する。

【0028】

図６に示す処理は、畳み込み層で学習の処理が実行されることより開始される。Ｓ６０１において、ＣＰＵ１０４は、ＤＲＡＭ１０３から入力データを読み出す。Ｓ６０２において、ＣＰＵ１０４は、読み出した入力データをＳＲＡＭ４０１の記憶領域に展開する。ＣＰＵ１０４は、ＲＯＭ１０６に予め用意されたプログラムに基づき、畳み込み係数を読み出し、ＳＲＡＭ４０１の記憶領域に展開する。なお、入力データ及び畳み込み係数のそれぞれは、ＳＲＡＭ４０１の記憶領域のうち、異なる記憶領域に展開されるのが好ましい。Ｓ６０３において、ＣＰＵ１０４は、ＳＲＡＭ４０１の記憶領域に展開された畳み込み係数を、レジスタ４０２上の記憶領域に設定する。Ｓ６０４において、ＣＰＵ１０４は、入力データに含まれる複数の画素と、畳み込み係数とに基づく畳み込み処理を行う。Ｓ６０４の処理の詳細は後述する。Ｓ６０５において、ＣＰＵ１０４は、畳み込み処理の結果をＳＲＡＭ４０１の記憶領域に記録する。Ｓ６０６において、ＣＰＵ１０４は、畳み込み層で処理すべき入力データが残っているかを全画素について処理済みかで判断する。全画素について処理済みでない場合、ＣＰＵ１０４は、Ｓ６０６の処理をＳ６０４の処理に戻す。全画素について処理済みである場合、ＣＰＵ１０４は、Ｓ６０６の処理をＳ６０７の処理へ進ませる。Ｓ６０７において、ＣＰＵ１０４は、次処理として、次のフィルタが必要かを判断する。次のフィルタが必要な場合、ＣＰＵ１０４は、Ｓ６０７の処理をＳ６０３の処理へ戻し、２段目の畳み込み層のファイルのための畳み込み係数をレジスタ４０２に設定する。この後、Ｓ６０６において、ＣＰＵ１０４は、１段目の畳み込み層の結果を２段目の畳み込み層のフィルタの畳み込み係数を用いて畳み込み処理を行う。このようにして、全てのフィルタの処理が終わると、ＣＰＵ１０４は、Ｓ６０７の処理を終了することで、Ｓ６０１乃至Ｓ６０７の処理を終了する。

【0029】

［人工ニューロンの概要］
図７は、ＣＮＮを構成する人工ニューロン７００の詳細を示す模式図である。人工ニューロン７００は、畳み込み部７０１と、活性化関数部７０２とを有する。人工ニューロン７００は、畳み込み層に含まれる。人工ニューロン７００は、畳み込み層の前段側から入力を受けて畳み込み層の後段側へ出力する１つの処理機構である。畳み込み部７０１は、畳み込み係数を用いて畳み込み処理を行う。活性化関数部７０２は、非線形な特性を持つ関数を有する。具体的には、活性化関数部７０２は、ソフトマックス関数あるいはＲｅＬＵ関数を有する。活性化関数部７０２は、畳み込み部７０１の結果を入力とする関数処理の結果を出力する。畳み込み部７０１の結果によっては活性化関数部７０２からの出力が微弱になることもある。つまり、畳み込み部７０１で用いられる畳み込み係数に依存して、活性化関数部７０２から次の層に情報を伝達するかどうかが定まる。このような処理を次の段へと繰り返し実施し、モデルの最終段（不図示）まで実施することによって特徴量を抽出する。換言すれば、活性化関数部７０２は、畳み込み部７０１から出力される畳み込み処理の結果に基づき、特徴量ベクトルの構成要素である特徴量を算出する。なお、上記で説明したように、複数の畳み込み層を有する階層を、畳み込み階層と称する。畳み込み階層は、複数のプーリング層を有してもよい。複数のプーリング層のそれぞれは、複数の畳み込み層のそれぞれの後段側に配置され、特徴量ベクトルを出力データとしての代表値に集約してもよい。集約は、特定の範囲に含まれる複数の特徴量の中から１つを抽出する動作である。例えば、特定の範囲に含まれる複数の特徴量のうち最大値が抽出されてもよい。あるいは、特定の範囲に含まれる複数の特徴量の平均値が抽出されてもよい。また、アップサンプリング層は、畳み込み階層の後段側に配置されてもよい。ＣＰＵ１０４は、アップサンプリング層で、出力データを伸張することで、代表値のサイズを入力データまで大きくし、後段データとして出力してもよい。例えば、アップサンプリング層は、出力データのＸＹ方向を伸張することで、代表値のサイズを入力データまで大きくする。

【0030】

［畳み込み処理］
図８は、畳み込み処理を説明するフローチャートである。図８に示す処理は、ＣＰＵ１０４によって実現されてもよい。以下の説明では、ＣＰＵ１０４が処理を実行する一例を説明する。なお、図８におけるステップのうちの一部または全部の機能をＡＳＩＣまたは電子回路等のハードウェアで実現してもよい。各処理の説明における記号「Ｓ」は、当該フローチャート図におけるステップであることを意味する。

【0031】

図８に示す処理は、畳み込み処理が呼び出されることより開始される。Ｓ８０１において、ＣＰＵ１０４は、畳み込み係数をレジスタ４０２に設定する。Ｓ８０２において、ＣＰＵ１０４は、ＳＲＡＭ４０１上の記憶領域に展開される複数の画素のうちの１つの画素と、レジスタ４０２に設定した畳み込み係数とを乗算する。ＣＰＵ１０４は、１つのフィルタ４００に含まれる要素数の乗算結果を集めて、加算する。ここで、フィルタ４００に含まれる要素とは、畳み込み係数のことである。その要素数とは、畳み込み係数の数である。畳み込み処理のより具体的な説明については図１０を用いて行う。

【0032】

［誤差の取得］
図９は、ＣＮＮの出力部近傍を示す模式図である。図９の一例では、活性化層９０１が示される。活性化層９０１は、活性化関数部７０２を有する。図７の人工ニューロン７００を含む層が最終段に到達すると、活性化関数部７０２を通して出力される。このような動作によれば、入力データとして入力された画像の特徴が得られる。よって、ＣＮＮのモデルは、膨大なフィルタ計算と活性化関数とを用いて、入力データから特徴量を得る。なお、フィルタと活性化関数とを含む処理部から構成されるモデル全体の構成は、用いるモデルの基本設計に依存する。公知のモデルを使用する場合にはそのモデルの構成に依存する。またモデル構造そのものから構築する場合には、モデル構築時にどのようなサイズのフィルタを有する人工ニューロン７００をいくつ用いるのか、またそれらからなる複数の層を幾つ設けるのかをどのように決定するかによって定まる。入力データとしての画像データに写る被写体の特徴を示す真の特徴量は、別の方法で用意することができる。例えば、目視による人の判断で値を決めることができる。以下、この値を「正解」と記す。この時、ＣＮＮのモデルから得られた値と正解の差をとると、誤差を得ることができる。なお、活性化層９０１の前段側には、アップサンプリング層が配置されてもよい。すなわち、活性化層９０１は、アップサンプリング層の後段側に配置されてもよい。活性化層９０１は、前段側から取得したデータがマッピングされた後段画像データを再構成してもよい。前段側にアップサンプリング層が配置されている場合には、活性化層９０１は、代表値のサイズを入力データまで大きくした後段データを取得してもよい。前段側にアップサンプリング層が配置されず、畳み込み階層が配置されている場合、活性化層９０１は、特徴量ベクトルを集約した代表値を取得してもよい。ＣＰＵ１０４は、活性化層９０１により再構成された後段画像データに基づいて、複数の画素から構成される画像データに写る被写体を分類してもよい。ＣＰＵ１０４は、畳み込み係数を、活性化層９０１により再構成された後段画像データと、入力データと、に基づいて求めてもよい。

【0033】

［畳み込み処理の詳細例］
図１０は、推論部１０５を構成するフィルタの回路概念図である。図１０に示すように、画素ｄ１、ｄ２、ｄ３、ｄ４、ｄ７の周囲にのりしろのデータセット１００１が確保されている。のりしろのデータセット１００１は、ｏ１乃至ｏ７を含む。のりしろのデータセット１００１は、レジスタ４０２におけるｒ１を決定するためにＳＲＡＭ４０１の記憶領域に展開されている。ｒ１は、対応する畳み込み処理の座標のインデックスである。ｒ２以降についても、それぞれ対応する畳み込み処理の座標のインデックスである。のりしろのデータセット１００１を用いて畳み込み処理が行われてｒ１を決定後、次は、ｒ２を決定するために、ｏ１、ｏ５、ｏ６の値を捨て、ｏ４、ｄ３、ｄ６を用いて畳み込み処理が行われる。以後、同様に畳み込み処理が行われ、レジスタ４０２に畳み込み処理の結果が転送される。その転送の際、画素のない部分の値としては、パディングと呼ばれる「０」で埋める処理が行われる。このようなのりしろにより、畳み込み処理により失う予定だった位置情報の一部を確保できるので、特徴量ベクトルの確度を向上させることが可能となる。

【0034】

＜のりしろの変形例１＞
図１２は、推論部１０５を構成するフィルタの回路概念図である。図１２に示す例では、図１０に示す例と比べ、使用するのりしろ量が削減されている。図１２の一例では、のりしろのデータセット１２０１は、ｄ１、ｄ４、ｄ７の左隣に配置されている。図１２の一例によれば、のりしろのデータセット１２０によりＳＲＡＭ４０１の記憶領域の左右方向にデータ配置の空間的局所性があるため、データ進行が左右方向の場合に好適である。また、このようなのりしろであっても、畳み込み処理により失う予定だった位置情報の一部を確保できるので、特徴量ベクトルの確度を向上させることが可能となる。

【0035】

＜のりしろの変形例２＞
図１６は、推論部１０５を構成するフィルタの回路概念図である。図１６に示す例では、図１０に示す例と比べ、使用するのりしろ量が削減されている。図１６の一例では、のりしろのデータセット１６０１は、ｄ１、ｄ２、ｄ３の上隣に配置されている。図１６の一例によれば、のりしろのデータセット１６０１によりＳＲＡＭ４０１の記録領域の縦方向にデータ配置の空間的局所性があるため、データ進行が縦方向の場合に好適である。また、このようなのりしろであっても、畳み込み処理により失う予定だった位置情報の一部を確保できるので、特徴量ベクトルの確度を向上させることが可能となる。

【0036】

＜のりしろの変形例３＞
図１８は、推論部１０５を構成するフィルタの回路概念図である。図１８に示す例では、図１０に示す例と比べ、使用するのりしろ量が削減されている。図１８の一例では、のりしろのデータセット１８０１が有するｏ１、ｏ２、ｏ３、ｏ４のそれぞれの間は、互いに画素１つ離して配置されている。また、図１８の一例では、のりしろのデータセット１８０１が有するｏ１、ｏ５、ｏ６、ｏ７のそれぞれの間は、互いに画素１つ離して配置されている。図１８の一例によれば、のりしろのデータセット１８０１によりＳＲＡＭ４０１上の記録領域が等間隔にデータ配置の空間的局所性があるため、データ進行が一定ペースの場合に好適である。また、このようなのりしろであっても、畳み込み処理により失う予定だった位置情報の一部を確保できるので、特徴量ベクトルの確度を向上させることが可能となる。

【0037】

［学習と処理単位］
図１１は、学習に用いる画像を示す概念図である。画像の分割と水増しとについて述べる。元画像１１０１は、学習に用いる画像の元になる任意の画像である。ここでは、元画像１１０１がいくつかの領域に分割される。分割画像１１０２は、元画像１１０１が分割されて得られた画像である。水増し画像群１１０３は、分割画像１１０２を加工して生成した複数の画像群である。例えば鏡像反転したり、写真や文字、グラフィクスといった任意の画像要素の画素を部分的に上書きしたりするなどの処理を通して生成する。水増し方法の詳細は省略する。

【0038】

［学習］
図１３は、学習を説明するフローチャートである。図１３に示す処理は、ＣＰＵ１０４によって実現されてもよい。以下の説明では、ＣＰＵ１０４が処理を実行する一例を説明する。なお、図１３におけるステップのうちの一部または全部の機能をＡＳＩＣまたは電子回路等のハードウェアで実現してもよい。各処理の説明における記号「Ｓ」は、当該フローチャート図におけるステップであることを意味する。

【0039】

図１３に示す処理は、ユーザー入力により開始される。なお、ユーザー入力の具体的な実施形態は、第三の実施形態で説明する。本実施形態では、ユーザー入力に基づいて学習が行われると想定する。しかし、学習実施装置と推論実施装置とが同じ情報処理装置で構成されている場合、推論実施装置のフィードバックに基づいて処理が開始されてもよい。

【0040】

Ｓ１３０１において、ＣＰＵ１０４は、学習に供せられる任意の画像１枚から、任意の枚数に分割し、図１１の分割画像１１０２を得る。Ｓ１３０２において、ＣＰＵ１０４は、分割された画像を水増し、図１１の水増し画像群１１０３を得る。Ｓ１３０３において、ＣＰＵ１０４は、水増し画像群１１０３から得られた任意の１枚をＣＮＮのモデルで処理する。Ｓ１３０３の処理により、水増し画像群１１０３から特徴量が抽出される。Ｓ１３０３の処理の詳細については図１７を用いて説明する。図１７は、ＣＮＮ処理の概略図である。図１７では、水増し拡大表示画像１７０１にフィルタ１７０２が適用され、太枠領域１７０３内に各画素の計算結果が得られる一例が示される。

【0041】

Ｓ１３０４において、ＣＰＵ１０４は、抽出された特徴量を保持する。例えば、抽出された特徴量はＳＲＡＭ４０１に保持される。Ｓ１３０５において、ＣＰＵ１０４は、全ての水増し画像について処理を終えたかを判断する。全ての水増し画像について処理を終えた場合、ＣＰＵ１０４は、Ｓ１３０５の処理をＳ１３０６の処理へ進ませる。全ての水増し画像について処理を終えていない場合、ＣＰＵ１０４は、Ｓ１３０５の処理をＳ１３０３の処理へ戻す。Ｓ１３０６において、ＣＰＵ１０４は、保持した情報量を全て足す。具体的には、Ｓ１３０４の処理で保持した特徴量を全て加算する。このように全ての特徴量が加算された特徴量は、以下では、「合計特徴量」と称する。Ｓ１３０７において、ＣＰＵ１０４は、水増し処理回数と同じ回数加算された正解の特徴量と、合計特徴量と差を誤差として求める。Ｓ１３０８において、ＣＰＵ１０４は、誤差逆伝搬法を用いて誤差を順伝播方向とは逆方向へ伝播させ、各畳み込み層が有するフィルタで特定された畳み込み係数を更新する。なお、誤差逆伝搬法は周知技術であるので、その説明については省略する。Ｓ１３０９において、ＣＰＵ１０４は、全ての分割画像１１０２について誤差伝播を終えたかを判断する。終えていない場合、ＣＰＵ１０４は、Ｓ１３１０の処理をＳ１３０２へ戻し、次の分割画像について水増しから始める。なお、次の処理は直前の処理において実行された誤差逆伝播の結果を反映した畳み込み係数及び転置畳み込み係数が用いられる。このような誤差逆伝搬の処理を繰り返すことで、畳み込み係数及び転置畳み込み係数が逐次最適化される。終えていた場合、ＣＰＵ１０４は、Ｓ１３０９の処理をＳ１３１０の処理へ進ませる。Ｓ１３１０において、ＣＰＵ１０４は、全画像について処理を終えたかを判断する。終えていない場合、ＣＰＵ１０４は、Ｓ１３１０の処理をＳ１３０１の処理へ戻し、別の元画像の分割を行う。終えていた場合、ＣＰＵ１０４は、Ｓ１３１０乃至Ｓ１３１０の処理を終了する。このように、既知の正解と、モデルから得られる特徴量ベクトルとの誤差を順伝播方向と逆方向に伝播させていくことで、モデルで用いる畳み込み係数及び転置畳み込み係数を求めることを学習と呼ぶ。このように得られた畳み込み係数及び転置畳み込み係数をパラメータとして予め製品本体のＲＯＭ１０６に記憶することで、製品本体で推論を実施可能である。なお、本実施形態では、画像の分割の後に画像の水増しを実施しているが、特にこれに限定されない。すなわち、元画像の水増しを先に行い、その後、画像の分割を行ってもよい。

【0042】

［推論の実施］
こうして得られたパラメータは、入力データがどのような画像であるかの認識結果の確率として出力される。このようにして、類型パターンとの一致度を確率として評価することによって、パターンを同定することができる。なお、本実施形態では２次元画像データと２次元フィルタとによる畳み込みを例にとって説明した。しかしながら用途はそこに限定されない。すなわち、例えば音声のような１次元時系列データからのパターン認識に対して１次元フィルタを用いる際に同様の構成であってもよい。あるいは、ボクセルを利用した３次元データからのパターン認識に対して３次元フィルタを用いる際に同様の構成であってもよい。また、一般に特徴量の次元に合わせた好適な構成を組めば、同様に本願効果を得ることができる。

【0043】

「スキップ結合の詳細］
次に、スキップ結合の詳細について図１４、図１５、図１９、図２０を用いて説明する。まず、スキップ結合の構成について、図１９、２０、１５を用いて説明し、スキップ結合の動作例について、図１４を用いて説明する。図１９は、次元圧縮した特徴量ベクトルを用いたスキップ結合を説明する模式図である。図１９には、エンコード層２０１には、出力層２００２と、次層２００３とが含まれている一例が示される。また、図１９には、デコード層２０２には、中間層２００４、ポストアップサンプリング層２００５と、次層２００６とが含まれている一例が示される。ポストアップサンプリング層２００５は、上記で説明したアップサンプリング層と同様の機能を有する。中間層２００４は、スキップ結合のスキップ対象の最終層であり、畳み込み層を含む。つまり、不図示の入力層から始まり、出力層２００２から中間層２００４までの間が迂回される迂回経路と、不図示の入力層から中間層２００４までの順伝播経路とが形成される。ここで、迂回経路に含まれる畳み込み層は、出力層２００２までに含まれる畳み込み層となる。出力層２００２の前段側には、図示は省略するが、畳み込み層が配置される。例えば、モデルがＳｅｇＮｅｔあるいはＵ－Ｎｅｔであれば、出力層２００２の前段側に、複数の畳み込み層及びプーリング層が配置されている。なお、例えば、モデルがＵ－Ｎｅｔであれば、スキップ結合時に渡す情報が特徴量全体であるが、モデルがＳｅｇＮｅｔであれば、スキップ結合時に渡す情報はプーリング座標のインデックスである。プーリング座標のインデックスとは、どの位置でプーリングしたかを示す情報である。なお、図１９では、複数の人工ニューロン２００１が出力層２００２に含まれる一例が示されるが、次層２００３、中間層２００４、ポストアップサンプリング層２００５、次層２００６のそれぞれにも同様に人工ニューロンは含まれている。ここで、１つの人工ニューロン２００１に着目すると、人工ニューロン２００１は、前段側に配置された不図示の層から特徴量ベクトルを受け取り、特徴量を算出する。この特徴量を１チャネルとする。例えば出力層２００２は、８チャネルの特徴量ベクトルを出力する。入力データの解析は順伝播方向に処理される。そのため、この８チャネルの特徴量は次層２００３に入力される。他方、デコード側では、中間層２００４からポストアップサンプリング層２００５へ特徴量ベクトルを入力する。この際、出力層２００２からの特徴量ベクトルと中間層２００４からの特徴量ベクトルとを次元結合する。ここで、スキップ結合に供される出力層２００２からの特徴量ベクトルについて述べる。本実施形態では、この特徴量ベクトルのチャネル数を間引く。例えば、ＲＧＢ３チャネルのうちＲチャネルだけ捨て、ＧＢ２チャネルだけ次元結合する。つまり、スキップ結合に供する特徴量ベクトルの次元を、１チャネル以上７チャネル以下に制限する。チャネルの数が多いほどスキップ結合の効果を得やすい。一方、チャネル数が少ないほど使用するＳＲＡＭの記憶領域は抑制できる。その理由は、スキップ結合を実施するためには、１つフィルタのＳＲＡＭの記憶領域に保持された畳み込み係数を次々に書き換えながら処理結果も保持する処理が含まれるからである。また、チャネルを間引いてスキップ結合するということは、この保持される処理結果を削減する効果がある。このようにして次元結合された特徴量ベクトルが、ポストアップサンプリング層２００５に入力される。その処理結果はデコード層２０２における次層２００６に入力される。このようにして、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減が可能となる。チャネル数を間引く際、間引くチャネルを選択することができる。例えば、連続するチャネルをまとめて間引く方法やチャネルを離散的に間引く方法を選択することができる。ここでは８チャネルを例に説明したが、そのチャネル数は任意である。また、接続する層と層は任意に選択できる。また、本実施形態ではスキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減のために特徴量ベクトルのチャネル数を間引く例を示した。しかし、スキップ結合に伴うＳＲＡＭの記憶領域の使用量を削減できるならば、間引く対象はチャネル数だけに依存しない。例えば特徴量ベクトルのデータ長を間引いてもよい。例えば、ＲＧＢ８ビットのうち４ビットだけ選択し、残りの４ビットは捨てる。このように、特徴量ベクトルのデータ長を元の特徴量ベクトルのデータ長未満に制限することで、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減する効果がある。また、図１７の太枠領域１７０３内の画素に対する計算結果９０３の特徴量の数を間引く方法でも、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減する効果がある。

【0044】

換言すれば、迂回経路における特徴量ベクトルを抽出する演算として、特徴量ベクトルの属性情報の一部を抽出する部分抽出処理が行われる。さらに、迂回経路が利用される場合、順伝播経路からの出力結果と部分抽出処理の結果とが結合される。このような構成によれば、畳み込みニューラルネットワークの構造上、ＳＲＡＭの記憶領域に記憶されるデータが減るため、ＳＲＡＭの記憶領域の使用量を常に低減させることが可能となる。したがって、低コストでスキップ結合を実現することが可能である。また、部分抽出処理として、特徴量ベクトルの次元、特徴量ベクトルのデータ長、特徴量ベクトルに含まれる画素のうち、少なくとも１つに基づいて特定される情報が抽出されてもよい。このような構成によっても、畳み込み処理が行われるときに変更可能なパラメータを利用できる。また、次元等のパラメータをモデルの学習中に変更することも可能である。

【0045】

なお、誤差の伝播はポストアップサンプリング層２００５から中間層２００４へ順伝播方向と逆方向に行われるが、その際の勾配消失を低減しつつ、誤差が小さくなるような重みになるまで畳み込み係数が更新される。この点について、さらに説明する。出力層２００２は、本来８チャネルの特徴量ベクトルを出力する。しかし、機械学習を用いたＣＮＮのモデルの構築では、どのチャネルがデータ解析のために好適なチャネルなのかが判断できない。そこで、学習により、好適なチャネルには強い重みをかける処理が行われる。従って、間引かれずに残ったチャネルの重みを最適化できれば、結果として有意なチャネルのみを使用したスキップ結合を実現したことになる。あるいは、一次元データをフーリエ級数展開すると、各振動数の強度（振幅）が求まる。このとき、いわゆるローパスフィルタであれば、高周波成分をカットすればよいが、機械学習の場合にはそうではない。入力に応じて有意な周波数帯の重み（係数）が強くなるような学習がなされる。この結果、スキップ結合における特徴量ベクトルを有意なチャネルに限定して次元圧縮が可能である。つまり、ＳＲＡＭの記憶領域の使用量を削減しながら性能劣化を軽減することができる。なお、このような誤差逆伝播法を用いて畳み込み係数を最適化させる場合の初期の畳み込み係数は任意の値から始めてもよい。

【0046】

ところで、スキップ結合を実施するためには、各層のニューロンの出力をＳＲＡＭの記憶領域に一時的に保持する必要があった。繰り返しになるが、もしスキップ結合をしないのであれば、ＳＲＡＭの記憶領域のうちこの一時的な記憶領域は不要である。そこで、処理がスキップ結合の必要な層に達した際、必要となるエンコード層の出力を再抽出（再生成とも適宜称する）することもできる。つまり、処理が中間層２００４に達した際、ＣＰＵ１０４はその結果だけをＳＲＡＭ４０１の記憶領域に保持する。また、ＣＰＵ１０４は、ＤＲＡＭ１０３から再度入力データを取得し、入力層２０３から順伝播方向に処理を進める。ＣＰＵ１０４は、出力層２００２に達したところで、保持していた中間層２００４との結果を次元結合してポストアップサンプリング層２００５へ入力する。推論を実施する際、このような動作をすることにより、ＣＰＵ１０４はＣＮＮによるＳＲＡＭの記憶領域の使用量を削減することもできる。なお、ＳＲＡＭの記憶領域の使用量を削減するために、次元結合に必要となるエンコード層２０１の出力を再抽出するために入力層２０３から順伝播方向に処理を進める方法を説明した。しかし、再抽出を行う際必ずしも入力層２０３から順伝播方向に処理を進める必要はない。例えば、エンコード層２０１の中の出力層２００２から出力された特徴量ベクトルをＳＲＡＭの記憶領域に保持しておくことで、その特徴量ベクトルから処理を開始してもよい。この一例については、図１５を用いて説明する。

【0047】

［スキップ結合の変形例］
図１５は、５層目の特徴量ベクトルがスキップ結合される例を示す図である。図１５では、エンコード層に複数の層が配置される一例が示される。各層は、順伝播方向に処理が進む。また、順伝播方向に処理が進むにつれ、次元数（チャネル数）が増加する。ここで、次元数が２４の層の特徴量を保持することも可能である。このような動作により、次元数が２４の層から計算をやり直せばよくなるため、計算効率を上げることが可能となる。なお、図１５の一例では、エンコード層を含むモデルが示されているが、エンコード層の後段側は特に限定されない。例えば、エンコード層の後段側には、デコード層が配置されるモデルであってもよい。あるいは、エンコード層だけまたは、デコード層だけで構成されるモデルであってもよい。

【0048】

本実施例ではここまで、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減方法として、特徴量を間引くことによってＳＲＡＭの記憶領域に保持される特徴量を削減する方法を説明した。また、スキップ結合に必要な特徴量をＳＲＡＭに保持せず、必要な層に達した際に特徴量を再抽出する方法について説明した。どちらの方法でＳＲＡＭの記憶領域の使用量を削減するかどうかは、各層において選択することができる。スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減効果としては、必要な層に達した際に特徴量を再抽出する方法の方が効果は高い。その理由は、ＳＲＡＭの記憶領域にスキップ結合のための特徴量を保持し続けることなく、スキップ結合を行うことができるからである。そのためＳＲＡＭの記憶領域の使用量の削減効果の観点では、特徴量を再抽出する方法を用いる方がよい。一方、この方法は処理量が増加する。その理由は、特徴量を再抽出するためには、一度行った処理をもう一度行う必要があるからである。各層においてどちらの方法を選択するかどうかは、ＳＲＡＭの記憶領域の使用量と処理速度とのトレードオフになる。その理由は、処理量が大きくなると並列性が内在される処理は同時に実行でき、その結果全体として処理速度が大きくなるためである。

【0049】

図２０は、スキップ結合を行うモデルの模式図である。次元結合のために特徴量を再抽出する際、再抽出のための処理量は、エンコード層における層が順伝播方向に進むごとに増加する。図２０では、出力層２１０１、２１０３、２１０５が配置されているが、いずれの前段側にも畳み込み層が少なくとも１つは配置されることを想定する。また、出力層２１０１はスキップ結合により次元結合層２１０２に接続される。出力層２１０３はスキップ結合により次元結合層２１０４に接続される。出力層２１０５はスキップ結合により次元結合層２１０６に接続される。ここで、出力層２１０１、出力層２１０３、出力層２１０５のそれぞれの出力を再抽出することについて以下で説明する。出力層２１０１でスキップ結合する経路が最も少ない処理量で計算することができる経路となる。また、出力層２１０５でスキップ結合する経路が最も処理量が多くなる経路となる。本実施形態では、次元結合層２１０２において、出力層２１０１から出力された特徴量ベクトルを再抽出する方法を用いて次元結合を行う。その理由は、出力層２１０１は、出力層２１０３，２１０５と比べ、前段側に配置される畳み込み層が少ないため、再抽出に必要な処理量を抑えながらスキップ結合に伴うＳＲＡＭの記憶領域の使用量を大きく減らす効果が得られるためである。また、次元結合層２１０４及び次元結合層２１０６では、出力層２１０３及び出力層２１０５から出力された特徴量ベクトルを間引いてＳＲＡＭに保持する方法を用いて次元結合が行われる。次元結合層２１０６の例を用いて理由を説明する。次元結合層２１０６では、出力層２１０５の出力を再抽出する必要がある。しかし、出力層２１０５の再抽出は多くの処理が必要となる。その理由は、再抽出するための処理量は、エンコード層における層が順伝播方向に進むごとに増加するためである。そのため、出力層２１０３及び出力層２１０５では、間引いた特徴量をＳＲＡＭに保持する方法を選択している。本実施形態では、入力に最も近い出力層２１０１では特徴量を再抽出する方法を選択し、それ以外の出力層２１０３，２１０５では間引いた特徴量をＳＲＡＭに保持する方法を選択している。しかし、選択方法はその限りではない。ＳＲＡＭの記憶領域の削減量と処理効率とを鑑みて、各層においてどちらの方法がよいかを選択することができる。いずれにしても、スキップ結合を行う際に特徴量ベクトルを再抽出することにより、特徴量ベクトルを保持する必要がなく、ＳＲＡＭの記憶領域の使用量を削減することができる。また学習を行う際は、通常のスキップ結合と同等の特徴量ベクトルを学習し、畳み込み係数を最適化するため同等の精度で推論することができ、本願効果を得ることができる。

【0050】

［スキップ結合の動作］
図１４は、再抽出の動作を示すフローチャートである。図１４に示す処理は、ＣＰＵ１０４によって実現されてもよい。以下の説明では、ＣＰＵ１０４が処理を実行する一例を説明する。なお、図１４におけるステップのうちの一部または全部の機能をＡＳＩＣまたは電子回路等のハードウェアで実現してもよい。各処理の説明における記号「Ｓ」は、当該フローチャート図におけるステップであることを意味する。

【0051】

図１４に示す処理は、ＣＰＵ１０４がスキップ結合の管理を始めることにより開始される。ＣＰＵ１０４は、処理が中間層２００４に達したかを判定する。処理が中間層２００４に達した場合、ＣＰＵ１０４はＳ１４０１の処理をＳ１４０２の処理へ進ませる。処理が中間層２００４に達していない場合、ＣＰＵ１０４は、Ｓ１４０１の処理を継続する。Ｓ１４０２において、ＣＰＵ１０４は、中間層２００４に達した際の結果のみをＳＲＡＭ４０１に保持させる。つまり、中間層２００４の前段側の畳み込み層で抽出された特徴量ベクトルは保持されない。Ｓ１４０３において、ＣＰＵ１０４は、ＤＲＡＭ１０３からデータを再度取得する。ここで、ＣＰＵ１０４がＤＲＡＭ１０３から再度取得するデータは入力データである。Ｓ１４０４において、ＣＰＵ１０４は、入力層から順次処理を進める。つまり、ＣＰＵ１０４は入力層から出力層２００２に至るまでの各畳み込み層が抽出する特徴量ベクトルを再度求める。Ｓ１４０５において、ＣＰＵ１０４は、出力層２００２に達したかを判断する。出力層２００２に達した場合、ＣＰＵ１０４は、Ｓ１４０５の処理をＳ１４０６の処理へ進ませる。出力層２００２に達していない場合、ＣＰＵ１０４は、Ｓ１４０５の処理をＳ１４０４の処理へ戻し、出力層２００２に達するまで、各層の特徴量ベクトルを抽出する処理を進める。Ｓ１４０６において、ＣＰＵ１０４は、中間層２００４に達した際の結果と、出力層２００２に達した際の結果と、を次元結合する。つまり、出力層２００２に達するまでに再抽出した特徴量ベクトルと、中間層２００４に達した際の特徴量ベクトルとを次元結合する。ここで、再抽出の間、中間層２００４とポストアップサンプリング層２００５との間に配置された結合素子は、再抽出結果の入力を待たされる。例えば、中間層２００４と結合素子との間に、再抽出に要する分のバッファ（遅延素子）が配置されてもよい。Ｓ１４０７において、ＣＰＵ１０４は、次元結合した結果をポストアップサンプリング層２００５に入力し、Ｓ１４０１乃至Ｓ１４０７の処理を終了する。なお、Ｓ１４０１乃至Ｓ１４０７において、畳み込み層の後段側にプーリング層が配置されている場合には、特徴量ベクトルを出力データとしての代表値に集約すればよい。

【0052】

＜＜第２実施形態＞＞
上述した第一の実施形態では、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減方法として、特徴量を間引く方法と、特徴量をＳＲＡＭ内に保持せず再抽出する方法とが選択可能である。どちらの方法を選択したとしてもＳＲＡＭの記憶領域の使用量を削減する効果は得られる。ところで、エンコード層で次の層に渡す特徴量ベクトル及び特徴量ベクトルが間引かれたものと、次元結合で用いられる特徴量ベクトルは共通である。そのため判定精度が低下するという課題がある。本実施形態では、ＳＲＡＭの記憶領域の使用量を削減しつつ判定精度を向上させることが可能な手段を説明する。図２１はスキップ結合の詳細を説明する模式図である。本実施形態では、エンコード層２２０２が新たに配置されている。エンコード層２２０２は、任意の出力層２２０３を有する。出力層２２０３には、複数の人工ニューロン２２０１が含まれる。本実施形態におけるＣＮＮモデルの学習について説明する。ＣＮＮモデルに画像が入力されるとエンコード層２０１とエンコード層２２０２とでは、それぞれ順伝播方向に処理が実行される。例えば、出力層２００２は８チャネルの特徴量ベクトルを出力する。出力層２００２から出力される特徴量ベクトルは、出力層２００２の後段側に配置された次層２００３に入力される。一方、デコード層２０２では、中間層２００４からポストアップサンプリング層２００５へ特徴量ベクトルが入力される。この際、エンコード層２２０２内の出力層２２０３から出力された特徴量ベクトルと中間層２００４から出力された特徴量ベクトルとを次元結合する。第１実施形態では、出力層２００２から出力された特徴量ベクトルに対し、特徴量を間引く方法や次元結合の際に出力層２００２からの特徴量ベクトルを再抽出して、ＳＲＡＭの記憶領域の使用量の削減を行った。本実施形態では、次元結合に用いる出力層２２０３から出力された特徴量ベクトルは、チャネル数、データ長、画素数の大きさを第一の実施形態で間引きあるいは再抽出を行った特徴量ベクトルの大きさ以下に設計することが出来る。その理由は、エンコード層２２０２はモデル構造を自由に変更することが出来るからである。例えば、出力層２２０３から出力された特徴量ベクトルを第１実施形態で次元結合のために間引きあるいは再抽出を行った特徴量ベクトルの大きさと同じ大きさにした場合について説明する。具体例として、第１実施形態において、中間層２００４から出力された特徴量ベクトルと次元結合するために、出力層２００２から出力された特徴量ベクトルを８チャネルから４チャネルに間引く場合と比較する。第１実施形態では、出力層２００２から出力された特徴量ベクトル８チャネルのうち４チャネルが、次層２００３への入力と次元結合のための特徴量ベクトルとのどちらにも用いられる。そのため、モデルの学習において、それぞれで用いられる場合に最適化することはできず、どちらに用いられる場合も有効な特徴量ベクトルになるように、フィルタ係数を決定する必要がある。一方、本実施形態では、出力層２００２から出力された特徴量ベクトルは、次層２００３への入力だけに用いられる。また、中間層２００４から出力された特徴量ベクトルと次元結合をする際は、出力層２２０３から出力された特徴量ベクトルが用いられる。これら２つの特徴量ベクトルをそれぞれ学習の中で最適化することが出来るため、ＳＲＡＭ４０１の記憶領域の使用量を抑制しながら、精度を向上させることが出来る。本実施形態では、出力層２２０３から出力された特徴量ベクトルと、第１実施形態で間引きあるいは再抽出を行った特徴量ベクトルの大きさとが同じに大きさになる場合を説明した。しかし、これは必ずしも一致させる必要はない。いずれにしても、スキップ結合を行う際に特徴量ベクトルを再抽出することにより、特徴量ベクトルを保持する必要がなく、ＳＲＡＭの記憶領域の使用量を削減することができる。また学習を行う際は、特徴量抽出のためのエンコード層とスキップ結合のためのエンコード層をそれぞれ別に学習し、精度に寄与するようにフィルタ係数を最適化するため、同等以上の精度で推論することができ、本願効果を得ることができる。

【0053】

＜＜第３実施形態＞＞
上述した第１実施形態では、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減方法として、各層に対して特徴量を間引く方法と、特徴量をＳＲＡＭに保持せず再抽出する方法とが示される。ここで、特徴量を間引く方法を選択された場合、特徴量ベクトルのチャネル数、データ長、画素数から、どの要素をどの程度間引くかを選択する必要がある。第２実施形態では、上述した選択に加え、次元結合の際に用いる特徴量ベクトルを出力するＣＮＮモデルの構造も選択する必要がある。どちらの実施形態においてもＳＲＡＭの記憶領域の使用量を削減する効果は得られる。しかし、ユーザーは、間引く対象あるいは間引く程度、再抽出をするかを選択する必要があった。本実施形態では、ＳＲＡＭ使用量を削減しながら、ＳＲＡＭ使用量の削減に伴う選択を自動で行う手法について説明する。図２２は、ＣＮＮモデルを学習する際に、スキップ結合の設定画面２３０１の一例を示す図である。図２２には、設定画面２３０１が示される。設定画面２３０１は、ユーザーの操作を受け付けるユーザインターフェースとして機能する。よって、ユーザーは、設定画面１３０１を介して、ＳＲＡＭの記憶領域の使用量の削減に伴う選択を行うことが可能である。設定画面２３０１の右側上方領域には、モデル設計自動／手動切り替えボタン２３０２、学習開始ボタン２３０７が配置される。設定画面２３０１の右側下方領域には、選択ボタン２３０６、間引き選択ボタン２３０４、再生成選択ボタン２３０５が配置される。設定画面２３０１の左側領域には、ＣＮＮモデル構造表示画面２３０３が配置される。モデル設計自動／手動切り替えボタン２３０２は、ＳＲＡＭの記憶領域の使用量の削減に伴う選択を自動で行うか、手動で行うかの選択を受け付ける。また、本実施形態では自動で行うか、手動で行うかの２種類の選択を受け付けるが、これに限らない。例えば、モデルの設計事項の一部分は手動で設定し、そのほかの部分は自動で設定するなど、より細かい選択を受け付けることができてもよい。次に、モデル設計自動／手動切り替えボタン２３０２が押下され、ＣＮＮモデルのＳＲＡＭの記憶領域の使用量の削減に伴う選択を自動で行う場合について説明する。モデル設計自動／手動切り替えボタン２３０２が押下されると、何に基づいてＳＲＡＭの記憶領域の使用量の削減に伴う選択を自動で行うかを設定する詳細設定画面に遷移する。図２３は、ＣＮＮモデルを学習する際の詳細設定画面の一例を示す図である。詳細設定画面２４０１では、主にスキップ結合に伴うＳＲＡＭの記憶領域の使用量をどの程度削減するかを設定可能である。詳細設定画面２４０１には設定バー２４０２が配置される。設定バー２４０２は、０％乃至１００％の間で、その位置をユーザーにより変更可能である。設定バー２４０２がユーザーに操作されることにより、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減割合を受けつけ、ＣＰＵ１０４は、それに基づいたＣＮＮモデルの設計事項の設定を行う。また、本実施形態では、ＳＲＡＭの記憶領域の使用量削減割合を受け付けるが、これに限らない。例えば、ＣＮＮモデル全体での積和処理回数、処理速度、ＳＲＡＭの記憶領域の使用量を受けつけ、ＣＰＵ１０４は、それに基づいたＣＮＮモデルのＳＲＡＭの記憶領域の使用量の削減に伴う選択を行ってもよい。

【0054】

次に、モデル設計自動／手動切り替えボタン１３０２が押下され、ＣＮＮモデルのＳＲＡＭの記憶領域の使用量の削減に伴う選択を手動で行う場合について説明する。ＣＮＮモデル構造表示画面１３０３には、ＣＮＮモデルの模式図が表示される。ＣＮＮモデルのＳＲＡＭの記憶領域の使用量の削減に伴う選択を手動で行う場合には、スキップ結合を行う各層に対して、スキップ結合に基づくＳＲＡＭの記憶領域の使用量の削減方法について設定可能である。間引き選択ボタン２３０４及び再生成選択ボタン２３０５は、第１実施形態で述べたＳＲＡＭの記憶領域の使用量の削減方法の選択肢を示す。つまり、ＣＰＵ１０４は、ユーザーが、特徴量ベクトルを間引く方法と、特徴量ベクトルを再生成する方法とのどちらを選択するかを受け付ける。本実施形態では、第１実施形態で述べたＳＲＡＭの記憶領域の使用量の削減方法の２種類の選択を受け付けるが、これに限らない。例えば、第２実施形態で説明したように、エンコード時と次元結合時に用いる係数フィルタが異なるようなＳＲＡＭの記憶領域の使用量の削減方法の選択を受け付けてもよい。スキップ結合を行う各層において、間引き選択ボタン２３０４と、再生成選択ボタン２３０５のどちらかを選択し、選択ボタン２３０６を押下することで、各層におけるＳＲＡＭの記憶領域の使用量の削減方法を設定することができる。スキップ結合を行う各層において、間引き選択ボタン２３０４が選択され、選択ボタン２３０６が押下されると、どの要素をどの程度間引くかを設定する詳細設定画面に遷移する。図２４は、ＣＮＮモデルを学習する際の詳細設定画面２５０１の他の一例を示す図である。詳細設定画面２５０１は、間引き選択ボタン２３０４が選択され、選択ボタン２３０６が押下された際に遷移する画面である。詳細設定画面２５０１の右側上部領域には、決定ボタン２５０６が配置される。詳細設定画面２５０１の左側上方領域には、チャネル選択ボタン２５０２、データ長選択ボタン２５０３、画素選択ボタン２５０４が配置される。詳細設定画面２５０１の左側下方領域には、チャネル選択ボタン２５０２、データ長選択ボタン２５０３、画素選択ボタン２５０４のそれぞれは、どの要素を間引いてＳＲＡＭの記憶領域の使用量を削減するかの選択を受け付ける。設定バー２５０５は、詳細設定画面２５０１の左側下方領域に配置された各ボタンに対応して動作する。すなわち、チャネル選択ボタン２５０２が選択されたときには、チャネルという要素を間引く割合を受け付ける。データ長選択ボタン２５０３が選択されたときには、データ長という要素を間引く割合を受け付ける。画素選択ボタン２５０４が選択されたときには、画素という要素を間引く割合を受け付ける。それらが選択され、設定バー２５０５が操作された後、決定ボタン２５０６が押下されると、スキップ結合を行う層に選択したＳＲＡＭの記憶領域の使用量の削減設定を設定することができる。図２２に戻る。ＳＲＡＭの記憶領域の使用量の削減を行うＣＮＮモデルを学習する際、設定が入力され、学習開始ボタン２３０７が押下されるとＣＮＮモデルの学習が開始される。本実施形態では、スキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減を行うＣＮＮモデルを学習する際の、設定画面２３０１の一例を示した。しかし、設定できる項目はこの限りではない。例えば学習を行う際の学習条件を入力する手段や、学習を途中で中断する手段、推論を実行する手段などを持ち合わせていてもよい。また、画面の形態はこの形態に限られず、配置や入力手段が本実施形態と異なっていてもよい。

【0055】

次に、自動的にＣＮＮモデルのＳＲＡＭの記憶領域の使用量の削減に伴う選択を行う方法の一例について説明する。一般に、精度の高いＣＮＮモデルを探索する手法としてＮＡＳ（ＮｅｕｒａｌＡｒｃｈｉｔｅｃｔｕｒｅＳｅａｒｃｈ）と呼ばれる手法がある。この手法では、精度の高いモデルの構造や、ＳＲＡＭの記憶領域の使用量の削減に伴う選択の探索を行うことができる。その理由は、学習を行う際、モデルの構造あるいは設計事項の設定値の良し悪しを誤差に反映させることができるからである。図２５は、自動ＣＮＮモデル設計を示すフローチャートである。図２５に示す処理は、ＣＰＵ１０４によって実現されてもよい。以下の説明では、ＣＰＵ１０４が処理を実行する一例を説明する。なお、図２５におけるステップのうちの一部または全部の機能をＡＳＩＣまたは電子回路等のハードウェアで実現してもよい。各処理の説明における記号「Ｓ」は、当該フローチャート図におけるステップであることを意味する。

【0056】

図２５に示す処理は、ユーザーによる学習開始ボタン１３０７からの入力に基づいて開始される。図２５に示す処理において、図１３に示す処理と同一の処理については同一のステップとし、その説明は省略する。Ｓ２５０１において、ＣＰＵ１０４は、モデルの設計事項を確率分布に基づき設定する。モデルの設計事項は、例えば、モデルの構造、ＳＲＡＭの記憶領域の使用量の削減に伴う選択等の事項である。モデルの構造とは、モデルのアーキテクチャのことであり、例えば、ＳｅｇＮｅｔ、Ｕ－Ｎｅｔ、ＲｅｓＮｅｔ等で特定される構造である。この確率分布は、学習の初期はランダムな分布であってもよい。この確率分布は、学習が進むにつれて、Ｓ１３０７で算出される正解との誤差を小さくする設定値が選ばれやすくなるように変化するものである。Ｓ２５０２において、ＣＰＵ１０４は、ユーザーが設定画面１３０１を介して設定した図２５のユーザー設定値が入力される。ＣＰＵ１０４は、設定したＣＮＮモデルが図２５のユーザー設定値を満たすかの判断を行う。ここで、ペナルティという言葉を定義する。ペナルティは、Ｓ２５０１で設定されたＣＮＮモデルが図２５のユーザー設定値を満たしているかを反映した評価指標である。本実施形態では、ＣＮＮモデルが図２５のユーザー設定値を満たしている場合、ペナルティの値は０とする。一方、ＣＮＮモデルが図２５のユーザー設定値を満たしていない場合、ペナルティの値は図２５のユーザー設定値との乖離の大きさに応じて大きくなるものである。例えば、ユーザーがスキップ結合に伴うＳＲＡＭの記憶領域の使用量の削減割合を５０％と設定した場合、その設定値が図２５のユーザー設定値としてＳ２５０２に入力される。Ｓ２５０１では、ＣＰＵ１０４がスキップ結合を行う各層において、ＳＲＡＭの記憶領域の使用量の削減方法を設定している。そのため、ＳＲＡＭの記憶領域の使用量を削減しなかった場合と比較して、どの程度削減することができるかを算出することができる。ＣＰＵ１０４は、その値と図２５のユーザー設定値とを比較し、図２５のユーザー設定値を満たしていれば、Ｓ１３０７の出力をそのままＳ１３０８に使用する。一方、図２５のユーザー設定値を満たしていなかった場合、ＣＰＵ１０４は、Ｓ１３０７の出力にペナルティの値を反映させて、Ｓ１３０８で使用する。その理由は、Ｓ２５０１において選ばれた設定値の組み合わせが選ばれにくくなるようにする必要があるからである。例えば、ＳＲＡＭの記憶領域の使用量の削減割合が５０％以上の場合、ペナルティを与えず、５０％未満であれば、不足した削減比率に応じたペナルティを加算する方法がある。本実施形態では、Ｓ１３０７における出力にペナルティを加算した。しかし、ペナルティの与え方は、これに限定しない。例えば、不足した削減比率に応じてＳ１３０７における出力に乗算をしてもよい。この動作によれば、Ｓ１３０８において使用される値はＣＮＮモデルの判定性能に加え、Ｓ２５０１において設定されたＳＲＡＭの記憶領域の使用量の削減に伴う選択の良し悪しを反映した値となる。Ｓ１３０８で行われる誤差逆伝播では、ＣＮＮモデルの畳み込み係数、及びＳ２５０１において設定されたＳＲＡＭの記憶領域の使用量の削減に伴う選択を最適化することができる。また、本実施形態ではＳ２５０２の処理がＳ１３０７とＳ１３０８との間で実行されるが、特にこれに限定されない。Ｓ２５０２における評価は、Ｓ１３０１乃至Ｓ１３０８の間であれば、どこで実施されてもよい。あるいは、Ｓ１３０１乃至Ｓ１３１０の間の処理を繰り返す中で、繰り返しごとにＳ２５０２を行わなくてもよい。いずれにしても、スキップ結合を行う際に特徴量ベクトルを再抽出することにより、特徴量ベクトルを保持する必要がなく、ＳＲＡＭの使用量を削減することができる。また、学習を行う際は、ＳＲＡＭの記憶領域の使用量の削減に伴う選択を自動で学習し、精度に寄与するように畳み込み係数、モデル構造、設定値を最適化するため精度の低下を抑制することができ、効果を得ることができる。

【0057】

以上、本開示の様々な例と実施形態を示して説明したが、本開示の趣旨と範囲は、本明細書内の特定の説明に限定されるものではない。

【0058】

例えば、上述した実施形態では、エンコード層とデコード層とを含むＣＮＮモデルの一例を説明した。また、次元結合に伴うＳＲＡＭの記憶領域の使用量の削減方法について、エンコード層内の出力層の出力とデコード層内の中間層の出力との次元結合の例を挙げた。しかし、必ずしもエンコード層とデコード層とを含むＣＮＮモデルである必要はない。例えば、エンコード層を含むが、デコード層を含まないようなＣＮＮモデルにおいても、次元結合を行うことは可能である。あるいは、エンコード層内の２つ以上の出力層からの出力を次元結合し、次層への入力とすることがある。このようなＣＮＮモデルにおいても、次元結合に伴うＳＲＡＭの記憶領域の使用量の削減方法として、上述した実施形態で用いた方法によってＳＲＡＭの記憶領域の使用量の削減の効果を得ることができる。

【0059】

本発明は、上述の実施形態の１以上の機能を実現するプログラムを、ネットワーク又は記憶媒体を介してシステム又は装置に供給し、そのシステム又は装置のコンピュータにおける１つ以上のプロセッサがプログラムを読出し実行する処理でも実現可能である。また、１以上の機能を実現する回路（例えば、ＡＳＩＣ）によっても実現可能である。

【0060】

本実施形態の開示は、以下の情報処理装置、情報処理方法、およびプログラムに代表される構成を含むものである。

【0061】

＜構成１＞
複数の畳み込み層を有し、前記複数の畳み込み層のそれぞれが、前段側から入力された入力データから抽出した特徴量ベクトルに基づく出力データを後段側へ伝播させる畳み込み階層と、
前記複数の畳み込み層のそれぞれで前記出力データを順に伝播させる順伝播経路と、前記順伝播経路の一部を迂回して前記出力データを伝播させる迂回経路と、を結合させる結合手段と、
前記複数の畳み込み層のそれぞれで、前記入力データから前記特徴量ベクトルを抽出する処理を行う処理手段と、
を備え、
前記処理手段は、前記迂回経路における前記特徴量ベクトルを抽出する処理として、前記特徴量ベクトルの属性情報の一部を抽出する部分抽出処理を行い、
前記結合手段は、前記迂回経路が利用される場合、前記順伝播経路からの出力結果と前記部分抽出処理の結果とを結合させることを特徴とする情報処理装置。

【0062】

＜構成２＞
前記処理手段は、前記部分抽出処理として、前記特徴量ベクトルの次元、前記特徴量ベクトルのデータ長、前記特徴量ベクトルに含まれる画素のうち、少なくとも１つに基づいて特定される情報を抽出することを特徴とする請求項１に記載の情報処理装置。

【0063】

＜構成３＞
前記入力データは、複数の画素から構成され、
前記複数の畳み込み層のそれぞれは、複数の畳み込み係数が特定されたフィルタを有し、
前記処理手段は、前記複数の畳み込み層のそれぞれで、前記複数の画素と、前記複数の畳み込み係数とに基づく畳み込み処理を行うことで、前記特徴量ベクトルを抽出することを特徴とする構成２に記載の情報処理装置。

【0064】

＜構成４＞
前記畳み込み階層は、複数のプーリング層を有し、
前記複数のプーリング層のそれぞれは、前記複数の畳み込み層のそれぞれの後段側に配置され、前記特徴量ベクトルを前記出力データとしての代表値に集約することを特徴とする構成３に記載の情報処理装置。

【0065】

＜構成５＞
前記畳み込み階層の後段側に配置され、前記出力データを伸張するアップサンプリング層をさらに備え、
前記演算手段は、前記アップサンプリング層で、前記出力データを伸張することで、前記代表値のサイズを前記入力データまで大きくし、後段データとして出力することを特徴とする構成４に記載の情報処理装置。

【0066】

＜構成６＞
前記アップサンプリング層の後段側に配置され、前記後段データがマッピングされた後段画像データを再構成する活性化層をさらに備え、
前記処理手段は、前記活性化層により再構成された前記後段画像データに基づいて、前記複数の画素から構成される画像データに写る被写体を分類することを特徴とする構成５に記載の情報処理装置。

【0067】

＜構成７＞
前記畳み込み階層の後段側に配置され、前記代表値がマッピングされた後段画像データを再構成する活性化層をさらに備え、
前記処理手段は、前記活性化層により再構成された前記後段画像データに基づいて、前記複数の画素から構成される画像データに写る被写体を分類することを特徴とする構成４に記載の情報処理装置。

【0068】

＜構成８＞
前記複数の畳み込み層のそれぞれは、複数の人工ニューロンを有し、
前記複数の人工ニューロンのそれぞれは、
前記畳み込み係数を用いて前記畳み込み処理を行う畳み込み部と、
前記畳み込み部から出力される前記畳み込み処理の結果に基づき、前記特徴量ベクトルの構成要素である特徴量を算出する活性化関数部と、
を有し、
前記処理手段は、前記畳み込み係数を、前記活性化層により再構成された前記後段画像データと、前記入力データと、に基づいて求めることを特徴とする構成６又は７に記載の情報処理装置。

【0069】

＜構成９＞
前記処理手段は、前記入力データに対し、一定のストライドで前記フィルタをシフトさせながら積和を行うことで、前記フィルタのシフトごとに前記入力データの局所的な特徴を表す特徴量を求め、求めた特徴量の集合を前記特徴量ベクトルとして抽出することを特徴とする構成３に記載の情報処理装置。

【0070】

＜構成１０＞
メインメモリとして機能する第１の記憶装置と、
キャッシュメモリとして機能する第２の記憶装置と、
をさらに備え、
前記第１の記憶装置は、前記入力データを記憶し、
前記第２の記憶装置は、前記複数の畳み込み層のそれぞれにおいて抽出された前記特徴量ベクトルを記憶することを特徴とする構成１乃至９のいずれか１項に記載の情報処理装置。

【0071】

＜構成１１＞
前記処理手段は、前記部分抽出処理を行う場合、前記第１の記憶装置から前記入力データを取得することを特徴とする構成１０に記載の情報処理装置。

【0072】

＜構成１２＞
前記第１の記憶装置は、ＤＲＡＭから構成され、
前記第２の記憶装置は、ＳＲＡＭから構成されることを特徴とする構成１０又は１１に記載の情報処理装置。

【0073】

＜構成１３＞
前記畳み込み階層は、前記入力データから構成される画像データを一定の空間領域ごとに分割された分割データが前記畳み込み階層に入力されることを特徴とする構成３に記載の情報処理装置。

【0074】

＜構成１４＞
複数の畳み込み層を有する情報処理装置の情報処理方法であって、
前記複数の畳み込み層のそれぞれが、前段側から入力された入力データから抽出した特徴量ベクトルに基づく出力データを後段側へ伝播させるステップと、
前記複数の畳み込み層のそれぞれで前記出力データを順に伝播させる順伝播経路と、前記順伝播経路の一部を迂回して前記出力データを伝播させる迂回経路と、を結合させるステップと、
前記複数の畳み込み層のそれぞれで、前記入力データから前記特徴量ベクトルを抽出する処理を行うステップと、
を含み、
前記処理を行うステップは、前記迂回経路における前記特徴量ベクトルを抽出する処理として、前記特徴量ベクトルの属性情報の一部を抽出する部分抽出処理を行い、
前記結合させるステップは、前記迂回経路が利用される場合、前記順伝播経路からの出力結果と前記部分抽出処理の結果とを結合させることを特徴とする情報処理方法。

【0075】

＜構成１５＞
コンピュータに、構成１４に記載の情報処理方法の各ステップを実行させるためのプログラム。

【符号の説明】

【0076】

１００推論実施装置
１０１データ転送インタフェイス
１０２データバス
１０３ＤＲＡＭ
１０４ＣＰＵ
１０５推論部
１０６ＲＯＭ

【図1】