特許7433307 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブの特許一覧

特許7433307パルスニューラルネットワークにおける誤差のパルス形式での逆伝播

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
5a
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-02-08

(45)【発行日】2024-02-19

(54)【発明の名称】パルスニューラルネットワークにおける誤差のパルス形式での逆伝播

(51)【国際特許分類】

G06N 3/084 20230101AFI20240209BHJP

G06N 3/063 20230101ALI20240209BHJP

G06N 3/0464 20230101ALI20240209BHJP

G06N 3/0495 20230101ALI20240209BHJP

【ＦＩ】

G06N3/084

G06N3/063

G06N3/0464

G06N3/0495

【請求項の数】 23

(21)【出願番号】P 2021520563

(86)(22)【出願日】2019-10-22

(65)【公表番号】

(43)【公表日】2022-01-13

(86)【国際出願番号】 EP2019078669

(87)【国際公開番号】W WO2020083880

(87)【国際公開日】2020-04-30

【審査請求日】2022-10-13

(31)【優先権主張番号】1859760

(32)【優先日】2018-10-23

(33)【優先権主張国・地域又は機関】FR

(73)【特許権者】

【識別番号】311015001

【氏名又は名称】コミサリヤ・ア・レネルジ・アトミク・エ・オ・エネルジ・アルテルナテイブ

(74)【代理人】

【識別番号】110001173

【氏名又は名称】弁理士法人川口國際特許事務所

(72)【発明者】

【氏名】ティエレ，ジョハネス

(72)【発明者】

【氏名】ビヒラー，オリビエ

【審査官】北川純次

(56)【参考文献】

【文献】米国特許出願公開第２０１７／０２２８６４６（ＵＳ，Ａ１）

【文献】特表２０１７－５１５２０５（ＪＰ，Ａ）

【文献】O'CONNOR, Peter et al.，DEEP SPIKING NETWORKS，arXiv.org [online]，2016年11月07日，pp. 1-16，[検索日 2023.09.19], インターネット：<URL:https://arxiv.org/pdf/1602.08323v2.pdf>，<DOI: 10.48550/arXiv.1602.08323>

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｎ３／０２－３／１０

(57)【特許請求の範囲】

【請求項1】

計算素子に実装されたスパイキング人工ニューロン（Ｎ_ｉ，ｌ）であって、前記ニューロンが複数の連続する層（Ｃ_ｌ－１、Ｃ_ｌ、Ｃ_ｌ＋１）を含むニューラルネットワーク内に組み込まれることを意図されており、各層が複数のニューロンで形成され、前記ニューラルネットワークが、入力層から出力層にデータを伝播する第１のフェーズ及び出力層から入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成されていて、前記スパイキング人工ニューロン（Ｎ_ｉ，ｌ）が、前記第２の逆伝播フェーズを実行すべく、
－シナプス係数により重み付けされた二進又は三進誤差信号を受信可能な第１の入出力インターフェース（Ｅ／Ｓ_１）と、
－前記受信した誤差信号に応答して前記ニューロンが生成した二進又は三進中間信号（ｚ_ｉ，ｌ）から、及び前記第１のデータ伝播フェーズの実行中に前記ニューロン（Ｎ_ｉ，ｌ）に実装された等価活性化関数（ＦＡＥ）の微分係数の推定値（ａ’_ｉ，ｌ）から二進又は三進局所誤差信号（δ_ｉ，ｌ）を計算すべく構成された誤差計算モジュール（ＥＲ＿ＬＯＣ）と、
－前記二進又は三進局所誤差信号（δ_ｉ，ｌ）を複数のシナプスにスパイクの形式で伝播可能な第２の入出力インターフェース（Ｅ／Ｓ_２）と
を含むスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項2】

前記第１の入出力インターフェース（Ｅ／Ｓ_１）が、第１のデータ伝播フェーズの実行中に複数のシナプスに二進又は三進信号をスパイクの形式で送信可能であり、前記第２の入出力インターフェース（Ｅ／Ｓ_２）が、第１のデータ伝播フェーズの実行中にシナプス係数により重み付けされた二進又は三進信号を受信可能である、請求項１に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項3】

－累積誤差（Ｕ_ｉ，ｌ）を計算すべく前記誤差信号を積分する積分モジュール（ＩＮＴ＿ＥＲ）と、
－前記累積誤差（Ｕ_ｉ，ｌ）を正の活性化閾値及び負の活性化閾値のうち少なくとも一方の活性化閾値と比較する少なくとも１個のコンパレータ（ＣＯＭＰ＿ＥＲ）と、
－前記少なくとも１個のコンパレータからの結果に基づいて二進又は三進中間信号（Ｚ_ｉ，ｌ）を生成すべく構成された活性化モジュール（ＡＣＴ＿ＥＲ）
とを含む、請求項１又は２に記載のスパイキング人工ニューロン。

【請求項4】

計算素子に実装されたスパイキング人工ニューロン（Ｎ_ｉ，ｌ）であって、前記ニューロンが複数の連続する層（Ｃ_ｌ－１、Ｃ_ｌ、Ｃ_ｌ＋１）を含むニューラルネットワーク内に組み込まれることを意図されており、各層が複数のニューロンで形成され、前記ニューラルネットワークが、入力層から出力層にデータを伝播する第１のフェーズ及び出力層から入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成されていて、前記スパイキング人工ニューロン（Ｎ_ｉ，ｌ）が、前記第２の逆伝播フェーズを実行すべく、
－二進又は三進誤差信号を受信可能な第１の入出力インターフェース（Ｅ／Ｓ_１）と、
－受信した誤差信号に応答して前記ニューロンが生成した二進又は三進中間信号（ｚ_ｉ，ｌ）から、及び前記第１のデータ伝播フェーズの実行中に前記ニューロン（Ｎ_ｉ，ｌ）に実装された等価活性化関数（ＦＡＥ）の微分係数の推定値（ａ’_ｉ，ｌ）から二進又は三進局所誤差信号（δ_ｉ，ｌ）を計算すべく構成された誤差計算モジュール（ＥＲ＿ＬＯＣ）と、
－前記二進又は三進局所誤差信号（δ_ｉ，ｌ）を第２の逆伝播フェーズにおける次の層（Ｃ_ｌ－１）のニューロンに伝播可能な第２の入出力インターフェース（Ｅ／Ｓ_２）と
を含むスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項5】

前記第１の入出力インターフェース（Ｅ／Ｓ_１）が前記第１のデータ伝播フェーズの実行中に次の層（Ｃ_ｌ＋１）のニューロンに二進又は三進信号を送信可能であり、前記第２の入出力インターフェース（Ｅ／Ｓ_２）が前記第１のデータ伝播フェーズの実行中に二進又は三進信号を受信可能である、請求項４に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項6】

－シナプス係数により重み付けされた累積誤差（Ｕ_ｉ，ｌ）を計算すべく前記二進又は三進誤差信号を積分する積分モジュール（ＩＮＴ＿ＥＲ）と、
－前記累積誤差（Ｕ_ｉ，ｌ）を正の活性化閾値及び負の活性化閾値のうち少なくとも一方の活性化閾値と比較する少なくとも１個のコンパレータ（ＣＯＭＰ＿ＥＲ）と、
－前記少なくとも１個のコンパレータからの結果に基づいて前記二進又は三進中間信号（Ｚ_ｉ，ｌ）を生成すべく構成された活性化モジュール（ＡＣＴ＿ＥＲ）と
を含む、請求項４又は５に記載のスパイキング人工ニューロン。

【請求項7】

前記活性化モジュール（ＡＣＴ＿ＥＲ）が、前記累積誤差が前記正の活性化閾値よりも大きい場合は正の中間信号を生成し、前記累積誤差が前記負の活性化閾値よりも小さい場合は負の中間信号を生成すべく構成されている、請求項３又は６に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項8】

正の中間信号が生成された場合は前記累積誤差（Ｕ_ｉ，ｌ）からの前記正の活性化閾値の値を減算し、負の中間信号が生成された場合は前記累積誤差（Ｕ_ｉ，ｌ）から前記負の活性化閾値の値を減算する減算器を更に含んでいる、請求項７に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項9】

前記局所誤差（δ_ｉ，ｌ）及び前記等価活性化関数（ＦＡＥ）の結果（ｘ_{ｊ，ｌ－１}）からシナプス係数の更新値を計算するモジュール（ＭＡＪ）を更に含んでいる、請求項１～８のいずれか１項に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項10】

前記等価活性化関数（ＦＡＥ）の前記結果（ｘ_{ｊ，ｌ－１}）がニューロンの前記データ伝播フェーズの実行中に計算される、請求項９に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項11】

シナプス係数の更新値を計算する前記モジュール（ＭＡＪ）が前記局所誤差の伝播後に活性化される、請求項９又は１０に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項12】

局所誤差信号を計算する前記モジュール（ＥＲ＿ＬＯＣ）が、前記中間信号（ｚ_ｉ，ｌ）と、前記等価活性化関数（ＦＡＥ）の微分係数の前記推定値（ａ’_ｉ，ｌ）の積を計算すべく構成されている、請求項１～１１のいずれか１項に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項13】

前記等価活性化関数（ＦＡＥ）が、前記ニューロンが生成したスパイク（ｓ_ｉ，ｌ）を積分する関数であって、前記ニューラルネットワークの学習率パラメータ（η_ｌ）により重み付けされている、請求項１～１２のいずれか１項に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項14】

前記第１のデータ伝播フェーズの実行中に前記ニューロン（Ｎ_ｉ，ｌ）に実装された等価活性化関数（ＦＡＥ）の結果（ｘ_ｉ，ｌ）から、及び前記第１のデータ伝播フェーズの実行中の前記ニューロンの積分変数（Ｖ_ｉ，ｌ）から前記等価活性化関数（ＦＡＥ）の微分係数の前記推定値（ａ’_ｉ，ｌ）を計算すべく構成された微分係数計算モジュール（ＤＥＲ）を含んでいる、請求項１～１３のいずれか１項に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項15】

前記等価活性化関数（ＦＡＥ）の微分係数の前記推定値（ａ’_ｉ，ｌ）が、前記関数の前記結果（ｘ_ｉ，ｌ）が厳密に正であるか又は前記積分変数（Ｖ_ｉ，ｌ）が厳密に正ならば１に等しく、さもなければ０に等しい、請求項１４に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項16】

前記微分係数計算モジュール（ＤＥＲ）が前記ニューロンの前記データ伝播フェーズの実行中に又は前記ニューロンの前記誤差逆伝播フェーズの実行中に活性化される、請求項１４または１５のいずれか１項に記載のスパイキング人工ニューロン（Ｎ_ｉ，ｌ）。

【請求項17】

入力層から出力層にデータを伝播する第１のフェーズ及び前記出力層から前記入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成されたスパイキング人工ニューラルネットワークであって、前記ニューラルネットワークが請求項１～１６のいずれか１項に記載のスパイキング人工ニューロンの複数の層を含み、各ニューロンがシナプスを介して少なくとも次層のニューロン又は前層のニューロンに接続されているスパイキング人工ニューラルネットワーク。

【請求項18】

前記ネットワークが入力層及び出力層を含み、前記入力層のニューロンが二進又は三進形式で伝播されるデータを受信すべく構成され、前記出力層のニューロンが、前記第１のデータ伝播フェーズの実行中に伝播されたデータから得られた結果と目標結果との誤差を計算すべく構成されている、請求項１７に記載のスパイキング人工ニューラルネットワーク。

【請求項19】

前記出力層の各ニューロンが、前記誤差を少なくとも１個の二進又は三進信号の組に符号化すべく構成されたエンコーダ（ＣＯＤ）を含んでいる、請求項１８に記載のスパイキング人工ニューラルネットワーク。

【請求項20】

前記エンコーダ（ＣＯＤ）が、二進又は三進信号を生成すべく前記誤差を２又は３段階の量子化レベルに量子化すべく構成されている、請求項１９に記載のスパイキング人工ニューラルネットワーク。

【請求項21】

前記エンコーダ（ＣＯＤ）が、連続する二進信号のグループ又は連続する三進信号のグループを介して前記誤差を符号化すべく構成されている、請求項１９に記載のスパイキング人工ニューラルネットワーク。

【請求項22】

入力層から出力層にデータを伝播する第１のフェーズ及び前記出力層から前記入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成されたスパイキング人工ニューラルネットワークであって、前記ニューラルネットワークが、請求項４～６のいずれか１項に記載のスパイキング人工ニューロンの複数の層を含み、各ニューロンがシナプス重みを有するシナプスを介して少なくとも次層のニューロン又は前層のニューロンに接続されていて、前記シナプス（Ｗ_１，ｌ，．．．Ｗ_{Ｋ，ｌ＋１}）がデジタルメモリ、メモリスティブ素子又はアナログ回路の形式で実装されているスパイキング人工ニューラルネットワーク。

【請求項23】

各シナプスが、次層（Ｃ_ｌ）のニューロンから受信した二進又は三進誤差信号（δ_ｉ，ｌ）及び前層（Ｃ_ｌ－１）のニューロンから受信した等価活性化関数（ＦＡＥ）の結果（ｘ_{ｊ，ｌ－１}）を表す信号に応答して自身のシナプス重みを更新すべく構成されている、請求項２２に記載のスパイキング人工ニューラルネットワーク。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、人工ニューラルネットワークの分野に関し、より正確にはスパイキングニューラルネットワークの分野に関する。

【背景技術】

【0002】

人工ニューラルネットワークは本質的に、シナプスにより相互に接続されたニューロンから構成され、これらのニューロンは従来デジタルメモリに実装されていたが、端子に印加された電圧に基づいてコンダクタンスが変化する抵抗成分にも実装できる。

【0003】

スパイキングニューラルネットワークは一般に、教師有り又は教師無し学習方法を実装することにより最適化される。

【0004】

これらの方法は、ニューラルネットワークの入力端で生成されたデータをニューラルネットワークの出力層に伝播する第１のフェーズ、次いで出力層から入力層に誤差を逆伝播する第２のフェーズを含んでいる。第２の逆伝播フェーズにおいて、シナプスは、ニューラルネットワークの前層から逆伝播された誤差に基づいて各ニューロンにより局所的に計算された誤差に基づいて更新される。

【0005】

本発明は、符号有り又は符号無しスパイク或いは二進若しくは三進データの形式で誤差を逆伝播するアルゴリズムを実装すべく設計されているスパイキングニューロン及びスパイキングニューラルネットワークに関する。

【0006】

スパイキングニューラルネットワークは、訓練伝播フェーズの実行中に、又は分類フェーズの実行中に実装された処理動作は浮動小数点乗算を一切必要としないため、リソースが限られたコンピュータへの実装が可能になるという利点がある。具体的には、スパイキングニューラルネットワーク内でデータが（符号有り又は符号無し）スパイクの形式で符号化され、各ニューロンが実行する処理動作は従ってアキュムレータ及びコンパレータだけを用いて実装することができる。従って浮動小数点乗算演算子の利用が避けられるため、リソースが限られた装置にデジタル又はアナログ実装することに一定の利点がある。

【発明の概要】

【発明が解決しようとする課題】

【0007】

しかし、訓練フェーズの実行中にシナプスの値の更新に用いられる逆伝播アルゴリズム自体が、各ニューロンに局所的な誤差を計算するために浮動小数点乗算の使用を必要とする。更に、ニューラルネットワークのニューロンの各層間でこれらの誤差を浮動小数点の形式で同期伝播することも必要である。しかし、スパイキングニューラルネットワークは、スパイクの形式での非同期データの伝播論理に基づいている。

【0008】

従って逆伝播アルゴリズムは一般に、このようなネットワークのハードウェア制約を考慮してスパイキングニューラルネットワークには実装されない。

【0009】

スパイキングニューラルネットワークに逆伝播アルゴリズムを実装する際の非互換性に起因して、そのようなネットワーク内での訓練は一般に「スパイクタイミング依存可塑性」すなわちＳＴＤＰ生体ルールに触発されたアルゴリズムを用いて実行される。しかし、この種の訓練ルールは逆伝播アルゴリズムに基づく訓練よりも非効率である。

【0010】

科学論文［１］はスパイキングニューラルネットワークの逆伝播アルゴリズムの可能な一実装を記述している。しかし、これは浮動小数点乗算を必要とするため高価な実装であり、低電力且つリソースが限られた装置には適していない。

【0011】

科学論文［２］は逆伝播アルゴリズムにより逆伝播された誤差を３値に量子化する可能性を記述している。しかし、当該文献はスパイキングニューラルネットワークではなく公式のニューラルネットワークに関するものである。当該文献はこれらのネットワークの非同期処理制約を考慮していない。

【課題を解決するための手段】

【0012】

本発明は、スパイキングニューラルネットワークを実装している装置のハードウェア制約に適した誤差逆伝播アルゴリズムの新たな実装を提案する。

【0013】

本発明は特に、実装をネットワークの制約に適合させるべく、且つ浮動小数点乗算演算子を使用する必要をなくすべく逆伝播フェーズで計算された誤差の二進又は三進符号化を用いる。

【0014】

より一般的には、本発明はスパイキングニューラルネットワークの特定の制約に逆伝播アルゴリズムを大域的に適合させることを提案する。特に、本発明は、同一伝播基盤を用いて訓練フェーズにおけるデータの伝播及び誤差の逆伝播を可能にする。

【0015】

本発明は、任意の種類のスパイキングニューラルネットワーク、特に畳み込みネットワークの実装に適したスパイキングニューロンの一般的な実装を提案する。

【0016】

第１の実施形態において、本発明の一主題は複数のニューロンの中間層に属するスパイキング人工ニューロンであり、中間層は複数の連続する層を含むニューラルネットワークに属し、ニューラルネットワークは、入力層から出力層にデータを伝播する第１のフェーズ及び出力層から入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成されていて、スパイキング人工ニューロンは、第２の逆伝播フェーズを実行すべく、
－シナプス係数により重み付けされた二進又は三進誤差信号を受信可能な第１の入出力インターフェースと、
－受信した誤差信号に応答してニューロンが生成した二進又は三進中間信号から、及び第１のデータ伝播フェーズの実行中にニューロンにより実装された等価活性化関数の微分係数の推定値から二進又は三進局所誤差信号を計算すべく構成された誤差計算モジュールと、
－二進又は三進局所誤差信号を複数のシナプスにスパイクの形式で伝播可能な第２の入出力インターフェースとを含んでいる。

【0017】

本発明の第１の実施形態の特定の一態様によれば、第１の入出力インターフェースは、第１のデータ伝播フェーズの実行中に複数のシナプスに二進又は三進信号をスパイクの形式で送信可能であり、第２の入出力インターフェースは、第１のデータ伝播フェーズの実行中にシナプス係数により重み付けされた二進又は三進信号を受信可能である。

【0018】

本発明の第１の実施形態の特定の一変型例によれば、スパイキング人工ニューロンは、
－累積誤差を計算すべく前記誤差信号を積分する積分モジュールと、
－累積誤差を正の活性化閾値及び負の活性化閾値のうち少なくとも一方の活性化閾値と比較する少なくとも１個のコンパレータと、
－少なくとも１個のコンパレータからの結果に基づいて二進又は三進中間信号を生成すべく構成された活性化モジュールとを含んでいる。

【0019】

第２の実施形態において、本発明の別の主題は、複数のニューロンの中間層に属するスパイキング人工ニューロンであり、中間層は複数の連続する層を含むニューラルネットワークに属し、ニューラルネットワークは、入力層から出力層にデータを伝播する第１のフェーズ及び出力層から入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成されていて、スパイキング人工ニューロンは第２の逆伝播フェーズを実行すべく、
－二進又は三進誤差信号を受信可能な第１の入出力インターフェースと、
－受信した誤差信号に応答してニューロンが生成した二進又は三進中間信号から、及び第１のデータ伝播フェーズの実行中にニューロンにより実装された等価活性化関数の微分係数の推定値から二進又は三進局所誤差信号を計算すべく構成された誤差計算モジュールと、
－二進又は三進局所誤差信号を次層のニューロンに伝播可能な第２の入出力インターフェースとを含んでいる。

【0020】

本発明の第２の実施形態の特定の一態様によれば、第１の入出力インターフェースは、第１のデータ伝播フェーズの実行中に二進又は三進信号を次層のニューロンに送信可能であり、第２の入出力インターフェースは、第１のデータ伝播フェーズの実行中に二進又は三進信号を受信可能である。

【0021】

本発明の第２の実施形態の特定の一変型例によれば、スパイキング人工ニューロンは、
－シナプス係数により重み付けされた累積誤差を計算すべく前記二進又は三進誤差信号を積分する積分モジュールと、
－累積誤差を正の活性化閾値及び負の活性化閾値のうち少なくとも一方の活性化閾値と比較する少なくとも１個のコンパレータと、
－少なくとも１個のコンパレータからの結果に基づいて二進又は三進中間信号を生成すべく構成された活性化モジュールとを含んでいる。

【0022】

特定の本発明の一態様によれば、活性化モジュールは、累積誤差が正の活性化閾値よりも大きい場合は正の中間信号を生成し、累積誤差が負の活性化閾値よりも小さい場合は負の中間信号を生成すべく構成されている。

【0023】

特定の一変型例によれば、本発明の実施形態の任意の一つによるスパイキング人工ニューロンは更に、正の中間信号が生成された場合は累積誤差からの正の活性化閾値の値を減算し、負の中間信号が生成された場合は累積誤差から負の活性化閾値の値を減算する減算器を含んでいる。

【0024】

特定の一変型例によれば、本発明の実施形態の任意の一つによるスパイキング人工ニューロンは更に、局所誤差及び等価活性化関数の結果からシナプス係数の更新値を計算するモジュールを含んでいる。

【0025】

本発明の特定の一態様によれば、等価活性化関数の結果はニューロンのデータ伝播フェーズの実行中に計算される。

【0026】

本発明の特定の一態様によれば、シナプス係数の更新値を計算するモジュールは局所誤差の伝播後に活性化される。

【0027】

本発明の特定の一態様によれば、局所誤差信号を計算するモジュールは、中間信号と、等価活性化関数の微分係数の推定値の積を計算すべく構成されている。

【0028】

本発明の特定の一態様によれば、等価活性化関数はニューロンが生成したスパイクを積分する関数であり、ニューラルネットワークの学習率パラメータにより重み付けされている。

【0029】

特定の一変型例によれば、本発明の実施形態の任意の一つによるスパイキング人工ニューロンは、第１のデータ伝播フェーズの実行中にニューロンにより実装された等価活性化関数の結果から、及び第１のデータ伝播フェーズの実行中のニューロンの積分変数から等価活性化関数の微分係数の推定値を計算すべく構成された微分係数計算モジュールを含んでいる。

【0030】

本発明の特定の一態様によれば、等価活性化関数の微分係数の推定値は、前記関数の結果が厳密に正であるか又は積分変数が厳密に正ならば１に等しく、さもなければ０に等しい。

【0031】

本発明の特定の一態様によれば、微分係数計算モジュールは、ニューロンのデータ伝播フェーズの実行中に又はニューロンの誤差逆伝播フェーズの実行中に活性化される。

【0032】

本発明の更なる主題は、入力層から出力層にデータを伝播する第１のフェーズ及び出力層からの入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成されたスパイキング人工ニューラルネットワークであり、ニューラルネットワークは本発明の実施形態の任意の一つによるスパイキング人工ニューロンの複数の層を含み、各ニューロンはシナプスを介して少なくとも次層のニューロン又は前層のニューロンに接続されている。

【0033】

本発明の特定の一態様によれば、ネットワークは入力層及び出力層を含み、入力層のニューロンは二進又は三進形式で伝播されるデータを受信すべく構成され、出力層のニューロンは、第１のデータ伝播フェーズの実行中に伝播されたデータから得られた結果と目標結果との誤差を計算すべく構成されている。

【0034】

本発明の特定の一態様によれば、誤差を出力層の各ニューロンは、少なくとも１個の二進又は三進信号の組に符号化すべく構成されたエンコーダを含んでいる。

【0035】

本発明の特定の一態様によれば、エンコーダは、二進又は三進信号を生成すべく２又は３段階の量子化レベルに誤差を量子化すべく構成されている。

【0036】

本発明の特定の一態様によれば、エンコーダは、連続する二進信号のグループ又は連続する三進信号のグループを介して誤差を符号化すべく構成されている。

【0037】

本発明の更なる主題は、入力層から出力層にデータを伝播する第１のフェーズ及び出力層から入力層に誤差を逆伝播する第２のフェーズを含む訓練機構を実行すべく構成された人工ニューラルネットワークであり、ニューラルネットワークは、本発明の第２の実施形態によるスパイキング人工ニューロンの複数の層を含み、各ニューロンはシナプス重みを有するシナプスを介して少なくとも次層のニューロンに又は前層のニューロンに接続されていて、シナプスはデジタルメモリ、メモリスティブ素子又はアナログ回路の形式で実装されている。

【0038】

本発明の特定の一態様によれば、各シナプスは、次層のニューロンから受信した二進又は三進誤差信号及び前層のニューロンから受信した等価活性化関数の結果を表す信号に応答して自身のシナプス重みを更新すべく構成されている。

【0039】

本発明の他の特徴及び利点は、添付の図面を参照しながら以下の記述を精査することでより明らかになろう。

【図面の簡単な説明】

【0040】

【図1】スパイキング人工ニューラルネットワークの概要図を示す。

【図2】訓練機構の第１のデータ伝播フェーズを実行する、本発明の第１の実施形態によるスパイキング人工ニューロンの図を示す。

【図3】訓練機構の第１のデータ伝播フェーズを実行する、本発明の第２の実施形態によるスパイキング人工ニューロンの図を示す。

【図4】ニューラルネットワークの出力層のスパイキング人工ニューロンの図を示す。

【図5】訓練機構の第２の誤差逆伝播フェーズを実行する、本発明の第１の実施形態によるスパイキング人工ニューロンの図を示す。

【図5a】第１の実施形態の一変型例の図を示す。

【図6】訓練機構の第２の誤差逆伝播フェーズを実行する、本発明の第２の実施形態によるスパイキング人工ニューロンの図を示す。

【発明を実施するための形態】

【0041】

図１に、スパイキング人工ニューラルネットワークの概要図を示す。ニューラルネットワークは従来、相互接続されたスパイキングニューロンの複数の層Ｃ_ｅ、Ｃ_ｌ、Ｃ_ｌ＋１、Ｃ_ｓから構成される。ネットワークは少なくとも１個の入力層Ｃ_ｅ、出力層Ｃ_ｓ及び少なくとも１個の中間層Ｃ_ｌ、Ｃ_ｌ＋１を含んでいる。入力層Ｃ_ｅのニューロンＮ_ｉ，ｅは各々入力端で入力データ１０１を受信する。入力データは、目標とするアプリケーションに応じて異なる種類であってよい。例えば、画像のピクセル又は音声或いはテキストデータ、若しくはより一般的にスパイクの形式で符号化可能な任意の種類のデータであってよい。ニューラルネットワークの適用は特に、自動運転乗り物に埋め込まれた装置又はビデオ監視カメラに関連付けられたビデオ監視装置向けに、画像又はビデオ内の対象を分類及び検出することを含んでいる。ニューラルネットワークは例えば、画像分類又は画像認識の分野、或いはより一般的に視覚、音声又は同時に両方であり得る特徴の認識に用いられる。層の各ニューロンは、自身の入力及び／又出力端を介して先行又は次層のニューロンの全てに接続される。より一般的には、ニューロンは、特に畳み込みネットワークの場合、別の層の一部のニューロンだけに接続されている場合がある。２個のニューロンＮ_ｉ，ｅ及びＮ_ｉ，ｌの間の接続１０２、１０３、１０４は人工シナプスＳ_１、Ｓ_２、Ｓ_３により行われ、特にデジタルメモリ又はメモリスティブ素子により形成することができる。シナプスの係数は、ニューラルネットワークを訓練する訓練機構を通じて最適化することができる。当該機構は、２個の別々なフェーズ、すなわち入力層から出力層にデータを伝播する第１のフェーズ、及び出力層から入力層に誤差を逆伝播する第２のフェーズを含み、シナプスの重みは各層毎に更新されている

【0042】

第１のデータ伝播フェーズにおいて、訓練データ、例えば画像又は画像のシーケンスが入力層のニューロンへの入力として提供されてネットワークで伝播される。スパイキングニューラルネットワークの場合、データは非同期スパイクの形式で符号化される。スパイクは二進又は三進信号に対応する。換言すれば、これらは符号有り又は符号無しスパイクであってよい。

【0043】

各ニューロンは、当該第１のフェーズの実行中に、前層（又は入力層のニューロンへの入力データから符号化されたスパイク）のニューロンから、受信するスパイクを積分する関数を実装する。積分関数は本質的に、人工シナプスの重みにより重み付けされたスパイクを累積するものである。各ニューロンはまた、積分変数と１又は２個の活性化閾値との比較に基づいて、スパイクを生成して次層のニューロンに伝播するものである活性化関数を実装する。選択されたニューロンモデルに応じて、積分関数及び活性化関数は異なっていてよい。特に、ニューロンがスパイクを全く受信しなかった場合に時間経過に伴い積分変数を減衰させるべく、ニューロンにより漏出流を実装することができる。出力層Ｃ_ｓのニューロンＮ_ｉ，ｓが追加的な処理を行うことにより、ニューロンＮ_ｉ，ｓが受信したスパイクの積分結果と、出力層のニューロンの最終状態に対応し、且つ訓練入力データとの関連で取得することが望まれる期待値又は目標値との誤差を計算する。

【0044】

第２の誤差逆伝播フェーズにおいて、出力層Ｃ_ｓのニューロンは計算された誤差を前層Ｃ_ｌ＋１のニューロンに送信し、当該ニューロンは前層から逆伝播した誤差から局所誤差を計算し、次いで当該局所誤差を前層Ｃ_ｌに送信する。並行して、各ニューロンは自身が接続されているシナプスの重みの更新値を局所誤差から計算してシナプスを更新する。当該処理は、入力層Ｃ_ｅに接続するシナプスの重みを更新する役割を果たす最後から２番目の層までニューロンの各層にわたり継続する。

【0045】

本発明の目的の一つは、実装の制約又はスパイキングニューロンのハードウェア制約に適した誤差逆伝播フェーズの特定の実装を提案することである。

【0046】

図２に、本発明の第１の実施形態によるスパイキングニューロンの一例及びデータ伝播フェーズにおけるその動作を示す。

【0047】

図２は、中間層Ｃ_ｌに属するニューロンＮ_ｉ，ｌを示す。ニューロンＮ_ｉ，ｌはニューロンにシナプスＷ_{１，ｌ＋１}，Ｗ_{２，ｌ＋１}，…，Ｗ_{Ｋ，ｌ＋１}を介して次層Ｃ_ｌ＋１の下流に接続されている。本発明の第１の実施形態によれば、シナプスは、メモリスティブ素子すなわちメモリスタ又は任意の等価アナログの回路により形成されている。同様に、ニューロンＮ_ｉ，ｌは、ニューロンにシナプスＷ_１，ｌ，Ｗ_２，ｌ．．．，Ｗ_Ｋ，ｌを介して前層Ｃ_ｌ－１の上流に接続されている。

【0048】

データ伝播フェーズにおいて、ニューロンＮ_ｉ，ｌは第１の入出力インターフェースＥ／Ｓ_２を介して、前層のニューロンにより送信されてシナプスＷ_１，ｌ，Ｗ_２，ｌ．．．，Ｗ_Ｋ，ｌの重みにより重み付けされたスパイクを受信する。メモリスティブ素子により形成されたシナプスは、ニューロンにより送信された一定振幅の符号有り又は符号無しスパイクを受信し、自身の出力端で、シナプスの重みを表す値により増幅されたスパイクを送信する。ニューロンＮ_ｉ，ｌが受信した信号は、シナプスの重みにより重み付けされた二進又は三進信号に対応する。受信した信号は、ニューロンの性質に依存する積分関数を実行する積分モジュールＩＮＴにより積分される。例示的な一実施形態によれば、積分関数は受信した信号を時間経過に伴い加算又は積分するものである。別の例示的な実施形態において、積分関数は、ニューロンが信号を受信していない場合に積分変数を時間経過に伴い減衰させる減衰又は漏出関数を含んでいる。積分モジュールＩＮＴの出力端で得られた積分変数Ｖ_ｉ，ｌは次いでコンパレータＣＯＭＰを介して１個以上の活性化閾値と比較される。第１の例示的な実施形態によれば、単一の正の活性化閾値θ_ｆｆを用いる。積分変数Ｖ_ｉ，ｌが正の活性化閾値θ_ｆｆを上回る場合、活性化モジュールＡＣＴが正のスパイクを生成して積分変数Ｖ_ｉ，ｌが正の閾値θ_ｆｆの値だけ減らされる。第２の例示的な実施形態によれば、正の閾値θ_ｆｆに加えて負の閾値－θ_ｆｆが用いられる。積分変数Ｖ_ｉ，ｌが負の活性化閾値－θ_ｆｆを下回る場合、活性化モジュールＡＣＴが負のスパイクを生成して、積分変数Ｖ_ｉ，ｌは閾値－θ_ｆｆの値だけ減らされる（又は値θ_ｆｆだけ増やされる）。２個の閾値の絶対値は等しくても異なっていてもよい。活性化モジュールＡＣＴにより生成されたスパイクは、ニューロンＮ_ｉ，ｌと次層Ｃ_ｌ＋１のニューロンの間に接続されたシナプスＷ_{１，ｌ＋１}，Ｗ_{２，ｌ＋１}，．．．，Ｗ_{Ｋ，ｌ＋１}に伝播されるべく入出力インターフェースＥ／Ｓ_１に送信される。

【0049】

時間経過に伴い積分モジュールＩＮＴにより計算された積分変数Ｖ_ｉ，ｌは以下の関係で表すことができる。
Ｖ_ｉ，ｌ（ｔ）＝Ｖ_ｉ，ｌ（ｔ－Δｔ）－θ_ｆｆ・ｓ_ｉ，ｌ（ｔ－Δｔ）＋Σ_ｊω_{ｉ，ｊ，ｌ}・ｓ_{ｊ，ｌ－１}（ｔ）（１）

【0050】

ｓ_ｉ，ｌ（ｔ）は、三進信号の場合に値が以下の関係で与えられるニューロンが生成したスパイクを表す。

【数1】

二進信号の場合、関係（２）は次式で置き替えられる。

【数2】

【0051】

積分変数Ｖ_ｉ，ｌはデータ伝播フェーズの開始時点で０以外の値に初期化されてよい。

【0052】

上で述べた、ニューロンＮ_ｉ，ｌが実施する処理動作は、累積又は比較だけに基づいており、浮動小数点乗算を一切必要としない。

【0053】

ニューロンＮ_ｉ，ｌはまた、誤差逆伝播フェーズの実行中に用いる変数を計算すべく２個の追加的な計算関数を実行する。

【0054】

第２の積分モジュールＦＡＥを用いて、時間経過に伴いニューロンが生成したスパイクｓ_ｉ，ｌを累積するし、累積はニューラルネットワークのパラメータである学習率η_ｌにより重み付けされている。この学習率η_ｌはネットワークの各層毎に異なっていてよい。

【0055】

上述の第２の積分モジュールの出力端で得られた変数ｘ_ｉ，ｌは以下の関係で表される。
ｘ_ｉ，ｌ（ｔ）＝η_ｌ・ｓ_ｉ，ｌ（ｔ）＋ｘ_ｉ，ｌ（ｔ－Δｔ）（３）

【0056】

この変数は以下の関係でも表すことができ、ａ_ｉ，ｌはニューロンが生成したスパイクの時間経過に伴う累積に対応し、ニューロンの等価活性化関数と呼ばれる。変数ｘ_ｉ，ｌ（ｔ）は、学習率パラメータη_ｌにより重み付けされた等価活性化関数に対応する。
ｘ_ｉ，ｌ（ｔ）＝η_ｌ・ａ_ｉ，ｌ（ｔ）
ａ_ｉ，ｌ（ｔ）＝ｓ_ｉ，ｌ（ｔ）＋ａ_ｉ，ｌ（ｔ－Δｔ）

【0057】

スパイクｓ_ｉ，ｌが値１、０又は－１をとるため、変数ｘ_ｉ，ｌの計算も乗算を一切必要としない。変数ｘ_ｉ，ｌの計算とは値η_ｌを累積することである。

【0058】

微分モジュールＤＥＲもまた、ニューロンの等価活性化関数ａ_ｉ，ｌの推定値ａ’_ｉ，ｌを計算に用いられる。この推定値を誤差逆伝播フェーズで用いる。

【0059】

積分変数Ｖ_ｉ，ｌが０よりも大きいか又は変数ｘ_ｉ，ｌが０よりも大きい場合、推定値ａ’_ｉ，ｌは１に等しく、さもなければ値０をとる。

【数3】

【0060】

本発明の範囲から逸脱することなく、二進変数｛０；１｝又は三進の変数｛－１；０；１｝を生成すべく等価活性化関数の他の推定値ａ’_ｉ，ｌを決定することができる。本発明の特徴の一つは、浮動小数点乗算を含む計算を回避するべく推定値ａ’_ｉ，ｌが二進又は三進変数であることである。

【0061】

ａ’_ｉ，ｌの計算に用いるＶ_ｉ，ｌ（ｔ）及びｘ_ｉ，ｌ（ｔ）の値は、ニューラルネットワークの入力端で提示された訓練シーケンスのデータ伝播フェーズにおいてニューロンにより計算された最後の最新値である。

【0062】

ニューロンの等価活性化関数ａ_ｉ，ｌの推定値ａ’_ｉ，ｌは、データ伝播フェーズの実行中に計算することができ、その場合ａ’_ｉ，ｌの値は誤差逆伝播フェーズで用いるべくメモリに保存される。推定値ａ’_ｉ，ｌはまた、誤差逆伝播フェーズの実行中にニューロンにより保存されたＶ_ｉ，ｌ（ｔ）及びｘ_ｉ，ｌ（ｔ）の最後の値から計算することもできる。

【0063】

一変型実施形態において、ニューロンにより実装される活性化関数は次式のように変更することができる。

【数4】

【0064】

この変型例によれば、変数ａ_ｉ，ｌ（ｔ）で表される、ニューロンが生成したスパイクの和は常に０よりも大きい。

【0065】

図３に、本発明のスパイキングニューロンの第２の実施形態を示す。第２の実施形態において、ニューロンはデジタル素子に実装されている。二進又は三進スパイク信号は二進又は三進デジタル信号により符号化され、デジタル通信基盤を介してニューロン間を送信される。シナプスはもはや２個のニューロン間の接続部に配置された能動素子により形成されていない。このデジタル実装によれば、シナプスの重みはデジタルメモリＭＥＭ＿Ｗに保存される。入力インターフェースＥ／Ｓ_２が受信した信号は（選択されたニューロンモデルに応じて）二進又は三進信号である。積分モジュールＩＮＴは、メモリＭＥＭ＿Ｗから読み出されたシナプスの重みにより重み付けされた受信信号の和を計算すべく変更されている。換言すれば、シナプスの重みによる信号の重み付けは第１の実施形態のようにシナプスによってではなく、ニューロンにより実行される。

【0066】

ニューラルネットワークの入力端で、換言すればネットワークの入力層Ｃ_ｅの入力端で生成されたデータがネットワークの出力層Ｃ_ｓに伝播されたならばデータ伝播フェーズが完了する。出力層の各ニューロンは、変数及び当該変数の所望の目標値を計算すべく構成されている。選択された出力ニューロンモデルに応じて、用いた変数は、積分モジュールＩＮＴが計算した積分変数Ｖ_ｉ，ｓ、又は活性化モジュールＡＣＴが生成したスパイクｓ_ｉ，ｓ、或いは等価活性化関数ａ_ｉ，ｓの結果、若しくはこれらの変数又は出力ニューロンが計算した他の変数の１個以上の任意の組み合わせであってよい。目標値は、用途に応じて選択される。例えば、ニューラルネットワークを対象分類の文脈で用いる場合、目標値は各出力ニューロンが検出する筈の対象に対応する。

【0067】

換言すれば、各出力ニューロンは、１個以上の計算された変数又はこれら１個以上の変数及び目標値又は所望値の組み合わせに依存するコスト関数を計算することができる。出力ニューロンにより計算される誤差は従って使用する各変数に関するコスト関数の微分係数に等しい。例えば、使用するコスト関数は等価活性化関数ａ_ｉ，ｓ（ｔ）だけに依存してよく、計算された誤差は当該等価活性化関数の微分係数に依存するであろう。δ_ｉ，Ｓは出力ニューロンＮ_ｉ，Ｓにより計算される誤差を表す。この誤差が次いで、出力ニューロンに含まれるエンコーダを用いてスパイク又はデジタルデータの形式で符号化される。異なる種類の符号化が可能である。スパイクは、三進信号の形式で３レベルに符号化されてよい。第１の変型例によれば、誤差δ_ｉ，Ｓは浮動小数点数であり、－１、０、１の３レベルに量子化されて、デジタル信号又は三進スパイクを介して前層のニューロンに送信される。第２の変型例によれば、誤差δ_ｉ，Ｓは値－１、０及び１の和に分解されて、デジタルデータ又は三進スパイクの組により符号化される。例えば、値５．３は５個の連続する正のスパイクにより符号化され、値－３．２は３個の連続する負のスパイクにより符号化されてよい。スパイクはまた、上に示す２個の符号化変型例に従い二進信号の形式で２レベルに符号化されてもよい。

【0068】

図４に、出力ニューロンＮ_ｉ，Ｓの例示的な一実装を示す。これは主に入出力インターフェースＥ／Ｓ_２、積分モジュールＩＮＴ、誤差計算モジュールＣＡＬＣ＿ＥＲ、及び計算された誤差をスパイクに符号化してから入出力インターフェースＥ／Ｓ_２を介して前層に逆伝播するエンコーダＣＯＤを含んでいる。出力ニューロンＮ_ｉ，Ｓはまた、誤差の計算に用いる変数の計算に必要ならばコンパレータＣＯＭＰ及び活性化モジュールＡＣＴを含んでいてよい。

【0069】

本発明の第１の実施形態によれば、図５に、出力層のニューロンが計算した誤差を逆伝播フェーズの実行中に中間層Ｃ_ｌのスパイキングニューロンＮ_ｉ，ｌの動作を示す。

【0070】

上述の第１の実施形態において、図２に関する段落で説明したように、シナプスはメモリスティブ素子、メモリスタ又は任意の等価なアナログ回路により形成される。図５に、逆伝播フェーズの実行中に関与する計算モジュール及びニューロンの演算子だけを示す。ニューロンの実際の実装では、これは逆伝播フェーズの実行中に活性化された図５に示すモジュール及び演算子と、データ逆伝播フェーズの実行中に活性化された図２に示すモジュール及び演算子との両方を含んでいる。

【0071】

シナプスＷ_{１，ｌ＋１}，Ｗ_{２，ｌ＋１}，．．．，Ｗ_{Ｋ，ｌ＋１}は、二進又は三進スパイクの形式で前層Ｃ_ｌ＋１のニューロンにより（逆伝播の向きに）計算された誤差を受信する。各シナプスはこれに応答して、シナプスの重みにより重み付けされた受信スパイクに対応する信号を送信する。これらの重み付け誤差信号は入出力インターフェースＥ／Ｓ_１により受信され、次いで受信した信号を累積する積分モジュールＩＮＴ＿ＥＲにより処理される。逆伝播フェーズの実行中に活性化された積分モジュールＩＮＴ＿ＥＲがデータ伝播フェーズの実行中に活性化された積分モジュールＩＮＴと同一の関数を実行する。これらは２個の別々のモジュールにより、又は同一モジュールにより形成することができる。積分モジュールＩＮＴ＿ＥＲの出力端で得られた積分変数Ｕ_ｉ，ｌは次いで１個又は２個の活性化閾値と比較される。例えば、受信した信号が三進信号である場合、図２に示すコンパレータＣＯＭＰと同じ要素により形成できるコンパレータＣＯＭＰ＿ＥＲを介して、正の活性化閾値θ_ｂｐ及び負の活性化閾値－θ_ｂｐが用いられる。積分変数Ｕ_ｉ，ｌが正の活性化閾値θ_ｂｐを上回った場合、活性化モジュールＡＣＴ＿ＥＲが正のスパイクを生成し、積分変数Ｕ_ｉ，ｌは閾値θ_ｂｐの値だけ減少する。積分変数Ｕ_ｉ，ｌが負の活性化閾値－θ_ｂｐを下回った場合、活性化モジュールＡＣＴ＿ＥＲが負のスパイクを生成し、積分変数Ｕ_ｉ，ｌが閾値－θ_ｂｐの値だけ減少する。活性化モジュールＡＣＴ＿ＥＲは、図２に示す活性化モジュールＡＣＴと同じ要素により形成することができる。

【0072】

誤差逆伝播フェーズの実行中のニューロンの積分変数は以下の関係で与えられる。
Ｕ_ｉ，ｌ（ｔ）＝Ｕ_ｉ，ｌ（ｔ－Δｔ）－θ_ｂｐ・ｚ_ｉ，ｌ（ｔ－Δｔ）＋Σ_ｋω_{ｉ，ｋ，ｌ＋１}・δ_{ｋ，ｌ＋１}（ｔ）

【0073】

活性化モジュールＡＣＴ＿ＥＲにより生成された信号は中間のスパイク信号ｚ_ｉ，ｌである。これは以下の関係で表すことができる。

【数5】

【0074】

一変型実施形態において、正の活性化閾値をＴ＋θ_ｂｐで代替し、負の活性化閾値をＴ－θ_ｂｐで代替することができ、ここにＴは正、負又はゼロの定数である。

【0075】

別の変型実施形態において、中間スパイク信号ｚ_ｉ，ｌは以下の関係で表すことができる。

【数6】

【0076】

上述の変型例において、２個の閾値の代わりに単一の閾値θ_ｂｐを用いる。この場合、積分変数Ｕ_ｉ，ｌは、閾値θ_ｂｐに等しくてよい所定の値又は閾値θ_ｂｐとは異なる値だけ減らされる。

【0077】

別の変型実施形態によれば、受信した信号が二進信号である場合、単一の活性化閾値θ_ｂｐを用いる。

【0078】

上述の変型実施形態によれば、中間スパイク信号ｚ_ｉ，ｌを以下の関係で表すことができる。

【数7】

【0079】

ここにθ_ｂｐは値が正又は負であり得る活性化閾値である。この場合、積分変数Ｕ_ｉ，ｌは閾値θ_ｂｐに等しくてもよい所定の値又は閾値θ_ｂｐとは異なる値だけ減らされる。

【0080】

更に別の変型実施形態において、受信した信号が二進信号である場合、ニューラルネットワークが実行する逆伝播アルゴリズムは２個の連続するフェーズで実行される。

【0081】

第１のフェーズにおいて、逆伝播アルゴリズムは、以下の関係で表される二進中間スパイク信号ｚ_ｉ，ｌを考慮しながらニューラルネットワークにより実行され、ここにθ_ｂｐは正の活性化閾値である。

【数8】

【0082】

積分変数Ｕ_ｉ，ｌが活性化閾値θ_ｂｐを上回る場合、活性化モジュールＡＣＴ＿ＥＲは正のスパイクを生成し、積分変数Ｕ_ｉ，ｌは閾値θ_ｂｐの値だけ減らされる。

【0083】

第２のフェーズにおいて、逆伝播アルゴリズムは、以下の関係で表される二進中間スパイク信号ｚ_ｉ，ｌを考慮しながらニューラルネットワークにより実行され、ここに－θ_ｂｐは負の活性化閾値である。

【数9】

【0084】

積分変数Ｕ_ｉ，ｌが活性化閾値－θ_ｂｐを下回る場合、活性化モジュールＡＣＴ＿ＥＲは負のスパイクを生成し、積分変数Ｕ_ｉ，ｌは閾値－θ_ｂｐの値だけ減らされる（又はθ_ｂｐの値だけ増やされる）。

【0085】

上述の信号を用いて、引き続き局所誤差を同じスパイク形式で生成する。局所誤差は中間信号ｚ_ｉ，ｌ、及びニューロンの等価活性化関数の微分係数の推定値ａ’_ｉ，ｌから計算モジュールＥＲ＿ＬＯＣにより計算される。推定値ａ’_ｉ，ｌは、データ伝播フェーズ（図２参照）実行中にニューロンにより計算されたか又は誤差逆伝播フェーズの実行中にデータ伝播フェーズの終了時点で保存された変数ｘ_ｉ，ｌ及びＶ_ｉ，ｌの最後の値から計算された。

【0086】

局所誤差は、中間信号ｚ_ｉ，ｌと推定値ａ’_ｉ，ｌの積を求めることにより計算され、推定値ａ’_ｉ，ｌの選択されたモデルに応じて二進又は三進変数である。
δ_ｉ，ｌ（ｔ）＝ｚ_ｉ，ｌ（ｔ）・ａ’_ｉ，ｌ（ｔ）

【0087】

一変型実施形態において、ａ’_ｉ，ｌ（ｔ）＝０の場合に上述の計算を実行しないよう、コンパレータが追加される。

【0088】

局所誤差の計算は従って浮動小数点乗算を必要とせず、当該計算の結果は（値１、０又は－１をとる）三進変数又は二進変数である。

【0089】

局所誤差δ_ｉ，ｌ（ｔ）は次いでインターフェースＥ／Ｓ_２を介して次層Ｃ_ｌ－１のシナプスに伝播される。

【0090】

ニューロンはまた、シナプスの重みの更新値を計算するモジュールＭＡＪも含んでいる。この更新値は、局所誤差から、及びニューロンＮ_ｉ，ｌが接続されている層Ｃ_ｌ－１の各ニューロンにより送信される変数ｘ_{ｊ，ｌ－１}から計算される。変数ｘ_{ｊ，ｌ－１}はデータ伝播フェーズの実行中に予め計算されている。

【0091】

シナプスＷ_ｊ，ｌの重みの更新値は以下の関係で与えられる。
Δω_{ｉ，ｊ，ｌ}（ｔ）＝－δ_ｉ，ｌ（ｔ）・ｘ_{ｊ，ｌ－１}（ｔ）

【0092】

これらの値がシナプスＷ_１，ｌ，Ｗ_２，ｌ，．．．Ｗ_Ｋ，ｌに伝播されることにより、以下のルールを介して自身の重みを更新する。
ω_{ｉ，ｊ，ｌ}（ｔ）＝Δω_{ｉ，ｊ，ｌ}（ｔ）＋ω_{ｉ，ｊ，ｌ}（ｔ－Δ（ｔ））

【0093】

シナプスの重みは好適には誤差が次層に伝播された後で更新されるが、これら二つの動作の順序を入れ替えることも可能である。

【0094】

一変型実施形態において、変数ｘ_{ｊ，ｌ－１}は、図５に示すように二つの連続する層のニューロンにアクセス可能なメモリＭＥＭ＿Ｘに保存される。

【0095】

図５ａに示す別の変型実施形態ではシナプスの重みの更新値を計算するモジュールＭＡＪが除去されており、シナプスの重みは当該シナプスを形成するメモリスティブ素子により直接更新される。本変型例において、誤差信号δ_ｉ，ｌ（ｔ）が層Ｃ_ｌのニューロンからシナプスＷ_１，ｌ，Ｗ_２，ｌ，．．．Ｗ_Ｋ，ｌに伝播され、変数ｘ_{ｊ，ｌ－１}が層Ｃ_ｌ－１のニューロンからシナプスＷ_１，ｌ，Ｗ_２，ｌ，．．．Ｗ_Ｋ，ｌに信号の形式で伝播される。各シナプスは次いで、項Δω_{ｉ，ｊ，ｌ}（ｔ）を表す値により自身の重みを更新すべく２個の信号の電位差を解析することにより２個の信号δ_ｉ，ｌ（ｔ）及びｘ_{ｊ，ｌ－１}（ｔ）の相互作用に直接基づいて自身のシナプス重みを更新する。

【0096】

図６に、図３に示す本発明の第２の実施形態による逆伝播フェーズの実行中の中間層Ｃ_ｌのスパイキングニューロンＮ_ｉ，ｌの動作を示す。

【0097】

上述の第２の実施形態によれば、ニューロンはデジタル素子に実装される。二進又は三進誤差信号は二進又は三進デジタル信号により符号化されて、データ伝播フェーズの実行中に伝達された信号と同じ通信基盤を介してニューロン間を送信される。シナプスの重みは、デジタルメモリＭＥＭ＿Ｗ_ｌ＋１、ＭＥＭ＿Ｗ_ｌに保存される。積分モジュールＩＮＴ＿ＥＲは、層Ｃ_ｌ＋１のシナプスの重みを保存しているメモリＭＥＭ＿Ｗ_ｌ＋１から読み出されたシナプスの重みにより重み付けされた受信信号の和を計算すべく変更される。換言すれば、シナプスの重みによる信号の重み付けは、第１の実施形態のようにシナプスによってではなく、ニューロンにより実行される。層Ｃ_ｌのメモリＭＥＭ＿Ｗ_ｌは、シナプスの重みの更新値を計算するモジュールＭＡＪにより直接更新される。シナプスの重みをメモリに保存する各種のアーキテクチャが可能である。図６に、ニューロンの各層Ｃ_ｌ＋１、Ｃ_ｌに関連付けられたメモリＭＥＭ＿Ｗ_ｌ＋１、ＭＥＭ＿Ｗ_ｌを示す。しかし、ニューロンの少なくとも二つの連続する層、又はニューラルネットワーク全体に対して単一の共有メモリを有することも可能である。一方、各ニューロンに局所的なメモリもまた考えられる。積分モジュールＩＮＴ＿ＥＲは、読出しモードにおいて前層Ｃ_ｌ＋１のシナプスの重みが保存されているメモリにアクセスすべく構成されている。

【0098】

図６に示すようなデジタル素子による実装の場合、ニューロン間で交換される信号は２個の別々のバスにより実行することができる。第１のデータバスを用いて、生成されたスパイクを、二進信号の場合は値１を介して、又は三進信号の場合は値１又は－１を介して送信する。第２の非同期シグナリングバスを用いて、データの受信（又は送信）をニューロンに通知する。換言すれば、第２の非同期バスを用いて、データバスに０以外の値が存在する旨の情報を送信する。第２の非同期バスは例えば、ＡＥＲ「アドレスイベント表現（ＡｄｄｒｅｓｓＥｖｅｎｔＲｅｐｒｅｓｅｎｔａｔｉｏｎ）」バスであってよい。本実装の利点の一つは、「０」状態に対応する受信値に対してニューロンが処理動作を実行するのを防止することである。データバス及び非同期バスが形成するアセンブリは、二進デジタル信号又は三進デジタル信号を送信可能である。二進信号の場合、リーダーは値「１」がデータバスにより指示され、値「０」が非同期バスにより指示されていることが分かるであろう。三進信号の場合、値「１」及び「－１」はデータバスにより指示され、値「０」は非同期バスにより指示されている。

【0099】

本発明には、誤差逆伝播フェーズで計算された局所誤差の二進又は三進表現を用いるため誤差計算の実行に浮動小数点乗算を一切必要としないという利点がある。更に、２種類の信号が同様に符号化されているため、同じ通信基盤をデータの伝播と誤差の逆伝播の両方に用いることができる。いくつかの計算モジュール及び演算子をデータ伝播フェーズ及び誤差逆伝播フェーズに合同で用いることができる。例えば、積分モジュールＩＮＴ、ＩＮＴ＿ＥＲ、コンパレータＣＯＭＰ、ＣＯＭＰ＿ＥＲ、及び活性化モジュールＡＣＴ、ＡＣＴ＿ＥＲを単一の要素で構成することができる。一般に、本発明では、二つのフェーズで伝播される信号は類似の性質を有し、これらの信号に対する処理動作は二つのフェーズの累積及び比較に限られるため、データ伝播フェーズ及び誤差逆伝播フェーズの実行に同じ種類の素子又は回路を用いることが可能になる。

【0100】

一般に、本発明はハードウェア及び／又はソフトウェア要素を用いて実装されてよい。ソフトウェア要素はコンピュータ可読媒体上のコンピュータプログラム製品の形式であってよく、当該媒体は電子、磁気、光又は電磁気媒体であってよい。ハードウェア要素は、全部又は一部が、例えば専用集積回路（ＡＳＩＣ）及び／又は設定可能集積回路（ＦＰＧＡ）の形式及び／又は本発明によるニューラル回路の形式又はデジタル信号プロセッサＤＳＰの形式及び／又はグラフィックプロセッサＧＰＵの形式及び／又はマイクロコントローラの形式及び／又は汎用プロセッサの形式であってよい。

【0101】

より正確には、本発明によるニューラルネットワークは、少なくとも１個のデジタルメモリを含む一つ以上のデジタル素子及びニューロン間で二進又は三進信号を伝播させる通信基盤に実装されていてよい。

【0102】

本発明によるニューラルネットワークはまた、少なくとも１個のメモリスティブ素子を含む１個以上のアナログ素子及び符号有り又は符号無しスパイクの形式でアナログ信号を伝播可能な通信基盤にも実装されていてよい。

【0103】

シナプスは、メモリスティブ素子すなわちメモリスタ、例えばＰＣＭ（相変化メモリ（Ｐｈａｓｅ－ＣｈａｎｇｅＭｅｍｏｒｙ））素子、又はＲＡＭ又はＯＸＲＡＭメモリ或いは他の任意の素子若しくは同等のアナログ回路の形式で生成されていてよい。シナプスは特に、少なくとも１個のキャパシタンス又は少なくとも１個のコンデンサに基づいていて、キャパシタンス又はコンデンサに充電することでシナプス重みの値を保存可能にするアナログ回路に実装されていてよい。

【0104】

参照文献
［１］“Ａｌｇｏｒｉｔｈｍａｎｄｈａｒｄｗａｒｅｄｅｓｉｇｎｏｆｄｉｓｃｒｅｔｅ－ｔｉｍｅｓｐｉｋｉｎｇｎｅｕｒａｌｎｅｔｗｏｒｋｓｂａｓｅｄｏｎｂａｃｋｐｒｏｐａｇａｔｉｏｎｗｉｔｈｂｉｎａｒｙａｃｔｉｖａｔｉｏｎｓ”，Ｓ．Ｙｉｎｅｔａｌ，２０１７ＩＥＥＥＢｉｏｍｅｄｉｃａｌＣｉｒｃｕｉｔｓａｎｄＳｙｓｔｅｍｓ
［２］“Ｈａｒｄｗａｒｅｅｆｆｉｃｉｅｎｔｏｎｌｉｎｅｌｅａｒｎｉｎｇｔｈｒｏｕｇｈｐｉｐｅｌｉｎｅｄｔｒｕｎｃａｔｅｄｅｒｒｏｒｂａｃｋ－ｐｒｏｐａｇａｔｉｏｎｉｎｂｉｎａｒｙｓｔａｔｅｎｅｔｗｏｒｋｓ”，Ｈ．Ｍｏｓｔａｆａｅｔａｌ，ＦｒｏｎｔｉｅｒｓｉｎＮｅｕｒｏｓｃｉｅｎｃｅ，２０１７

【図1】

【図2】

【図3】

【図4】

【図5】

【図5a】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版