(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-05-28
(54)【発明の名称】深層学習人工ニューラルネットワークにおけるアナログニューラルメモリ用の出力回路
(51)【国際特許分類】
G06F 3/05 20060101AFI20240521BHJP
G06G 7/60 20060101ALI20240521BHJP
G06N 3/063 20230101ALI20240521BHJP
【FI】
G06F3/05 301A
G06G7/60
G06N3/063
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023564551
(86)(22)【出願日】2021-09-03
(85)【翻訳文提出日】2023-12-19
(86)【国際出願番号】 US2021049075
(87)【国際公開番号】W WO2022245384
(87)【国際公開日】2022-11-24
(32)【優先日】2021-05-19
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-08-31
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500147506
【氏名又は名称】シリコン ストーリッジ テクノロージー インコーポレイテッド
【氏名又は名称原語表記】SILICON STORAGE TECHNOLOGY, INC.
(74)【代理人】
【識別番号】110000626
【氏名又は名称】弁理士法人英知国際特許商標事務所
(72)【発明者】
【氏名】トラン、ヒュー バン
(72)【発明者】
【氏名】ブー、サン
(72)【発明者】
【氏名】レイテン、マーク
(57)【要約】
深層学習人工ニューラルネットワークにおけるアナログニューラルメモリ用の出力回路のための多数の実施形態が開示される。いくつかの実施形態では、出力ブロックは、W+ビット線からの電流と、関連付けられたW-ビット線からの電流を受け取り、出力ブロックは、ある実施形態では差動信号であり、他の実施形態ではシングルエンド信号である出力信号を生成する。
【選択図】
図35A
【特許請求の範囲】
【請求項1】
不揮発性メモリセルの1つ以上のアレイから出力を生成するための出力回路であって、
複数の電流-電圧変換器であって、前記複数の電流-電圧変換器のそれぞれは、W+値を記憶する前記1つ以上のアレイの1つ以上の不揮発性メモリセルに結合されたそれぞれのビット線から、及びW-値を記憶する前記1つ以上のアレイの1つ以上の不揮発性メモリセルに結合されたそれぞれのビット線から電流を受け取る、複数の電流-電圧変換器と、
前記複数の電流-電圧変換器からそれぞれの電圧出力を受け取るためのマルチプレクサと、
複数のサンプルホールド回路であって、それぞれのサンプルホールド回路は、保持された電圧出力を生成するために、前記マルチプレクサによって前記複数の電流-電圧変換器のうちの1つに選択的に結合されている、複数のサンプルホールド回路と、
前記複数のサンプルホールド回路から保持された電圧出力を受け取るチャネルマルチプレクサと、
前記チャネルマルチプレクサから前記保持された電圧出力を選択的に受け取り、前記保持された電圧出力をデジタル出力に変換するアナログ-デジタル変換器と、を備える、出力回路。
【請求項2】
W+値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線と、W-値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線とは、前記1つ以上のアレイのうちの同じアレイ内に位置する、請求項1に記載の出力回路。
【請求項3】
W+値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線と、W-値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線とは、前記1つ以上のアレイのうちの異なるアレイ内に位置する、請求項1に記載の出力回路。
【請求項4】
前記不揮発性メモリセルの1つ以上のアレイのそれぞれは、ニューラルネットワークメモリアレイである、請求項1に記載の出力回路。
【請求項5】
前記1つ以上のアレイ内のそれぞれの不揮発性メモリセルは、3つ以上の可能な値のうちの1つを記憶し得る、請求項1に記載の出力回路。
【請求項6】
前記1つ以上のアレイ内の前記不揮発性メモリセルのそれぞれは、スプリットゲートフラッシュメモリセルである、請求項1に記載の出力回路。
【請求項7】
不揮発性メモリセルの1つ以上のアレイから出力を生成するための出力回路であって、前記出力回路は、
複数の電流-電圧変換器であって、前記複数の電流-電圧変換器のそれぞれは、W+値を記憶する前記不揮発性メモリセルの1つ以上のアレイの1つ以上の不揮発性メモリセルに結合されたそれぞれのビット線から、及びW-値を記憶する前記不揮発性メモリセルの1つ以上のアレイの1つ以上の不揮発性メモリセルに結合されたそれぞれのビット線から電流を受け取り、前記受け取った電流を差動電圧出力に変換する、複数の電流-電圧変換器と、
前記差動電圧出力を受け取り、前記差動電圧出力をデジタル出力に変換するアナログーデジタル変換器と、を備える、出力回路。
【請求項8】
前記複数の電流-電圧変換器から前記差動電圧出力を受け取るマルチプレクサであって、前記アナログ-デジタル変換器は、前記マルチプレクサから前記差動電圧出力を選択的に受け取る、マルチプレクサを更に備える、請求項7に記載の出力回路。
【請求項9】
複数のサンプルホールド回路であって、それぞれのサンプルホールド回路は、前記マルチプレクサによって前記複数の電流-電圧変換器のうちの1つに選択的に結合されている、複数のサンプルホールド回路を更に備える、請求項8に記載の出力回路。
【請求項10】
前記複数のサンプルホールド回路から電圧出力を受け取るチャネルマルチプレクサを更に備える、請求項9に記載の出力回路。
【請求項11】
W+値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線と、W-値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線とは、前記不揮発性メモリセルの1つ以上のアレイのうちの同じアレイ内に位置する、請求項7に記載の出力回路。
【請求項12】
W+値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線と、W-値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線とは、前記不揮発性メモリセルの1つ以上のアレイのうちの異なるアレイ内に位置する、請求項7に記載の出力回路。
【請求項13】
前記不揮発性メモリセルの1つ以上のアレイのそれぞれは、ニューラルネットワークメモリアレイである、請求項7に記載の出力回路。
【請求項14】
前記1つ以上のアレイ内のそれぞれの不揮発性メモリセルは、3つ以上の可能な値のうちの1つを記憶し得る、請求項7に記載の出力回路。
【請求項15】
1つ以上のアレイ内の前記不揮発性メモリセルのそれぞれは、スプリットゲートフラッシュメモリセルである、請求項7に記載の出力回路。
【請求項16】
不揮発性メモリセルの1つ以上のアレイから出力を生成するための出力回路であって、前記出力回路は、
複数の加算回路であって、前記複数の加算回路のそれぞれは、W+値を記憶する前記不揮発性メモリセルの1つ以上のアレイの1つ以上の不揮発性メモリセルに結合されたそれぞれのビット線から、及びW-値を記憶する前記不揮発性メモリセルの1つ以上のアレイの1つ以上の不揮発性メモリセルに結合されたそれぞれのビット線から電流を受け取り、前記複数の加算回路のそれぞれは、それぞれの加算電流を生成する、複数の加算回路と、
複数の電流-電圧変換器であって、前記電流-電圧変換器のそれぞれは、前記複数の加算回路のうちの1つからそれぞれの加算電流を受け取り、それぞれの加算電圧を生成する、複数の電流-電圧変換器と、
前記複数の電流-電圧変換器からそれぞれの加算電圧を受け取るマルチプレクサと、
複数のサンプルホールド回路であって、それぞれのサンプルホールド回路は、それぞれの保持された電圧を生成するために、前記マルチプレクサによって前記複数の電流-電圧変換器のうちの1つに選択的に結合されている、複数のサンプルホールド回路と、
前記複数のサンプルホールド回路から前記それぞれの保持された電圧を受け取り、チャネル出力を生成するチャネルマルチプレクサと、
前記チャネルマルチプレクサから受け取った前記チャネル出力をデジタル出力に変換するアナログーデジタル変換器と、を備える、出力回路。
【請求項17】
W+値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線と、W-値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線とは、前記不揮発性メモリセルの1つ以上のアレイのうちの同じアレイ内に位置する、請求項16に記載の出力回路。
【請求項18】
W+値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線と、W-値を記憶する前記1つ以上の不揮発性メモリセルに結合された前記ビット線とは、前記不揮発性メモリセルの1つ以上のアレイのうちの異なるアレイ内に位置する、請求項16に記載の出力回路。
【請求項19】
前記不揮発性メモリセルの1つ以上のアレイのそれぞれは、ニューラルネットワークメモリアレイである、請求項16に記載の出力回路。
【請求項20】
前記1つ以上のアレイ内のそれぞれの不揮発性メモリセルは、3つ以上の可能な値のうちの1つを記憶し得る、請求項16に記載の出力回路。
【請求項21】
前記1つ以上のアレイ内の前記不揮発性メモリセルのそれぞれは、スプリットゲートフラッシュメモリセルである、請求項16に記載の出力回路。
【請求項22】
不揮発性メモリセルのアレイから出力を生成するための出力回路であって、
ビット線からの電流をnビット出力のビットの一部分に変換するための第1のアナログ-デジタル変換器と、
前記ビット線からの前記電流を前記nビット出力中のビットの残余に変換するための第2のアナログ-デジタル変換器と、を備える、出力回路。
【請求項23】
前記第2のアナログ-デジタル変換器は、前記第1のアナログ-デジタル変換器からビットの前記一部分を受け取り、ビットの前記一部分及びビットの前記残余を直列方式で配列する直列出力回路を含む、請求項22に記載の出力回路。
【請求項24】
前記第1のアナログ-デジタル変換器及び前記第2のアナログ-デジタル変換器はそれぞれ、逐次近似レジスタアナログ-デジタル変換器を含む、請求項22に記載の出力回路。
【請求項25】
前記逐次近似レジスタアナログ-デジタル変換器のそれぞれは、1つ以上の可変コンデンサを含む、請求項24に記載の出力回路。
【請求項26】
前記第1のアナログ-デジタル変換器及び前記第2のアナログ-デジタル変換器はそれぞれ、アルゴリズム型アナログ-デジタル変換器を含む、請求項22に記載の出力回路。
【請求項27】
前記不揮発性メモリセルのアレイは、ニューラルネットワークメモリアレイである、請求項22に記載の出力回路。
【請求項28】
前記不揮発性メモリセルのアレイ内のそれぞれの不揮発性メモリセルは、3つ以上の可能な値のうちの1つを記憶し得る、請求項27に記載の出力回路。
【請求項29】
前記アレイ内の前記不揮発性メモリセルのそれぞれは、スプリットゲートフラッシュメモリセルである、請求項22に記載の出力回路。
【請求項30】
前記第1のアナログ-デジタル変換器及び前記第2のアナログ-デジタル変換器のうちの1つ以上は、不揮発性メモリセルの前記アレイと、不揮発性メモリセルの1つ以上の他のアレイとの間で共有される、請求項22に記載の出力回路。
【請求項31】
不揮発性メモリセルのアレイから出力を生成するための出力回路であって、
可変抵抗器に応答して基準電圧を生成するためのトラッキング電圧基準回路と、
前記アレイからの電流を電圧に変換するための電流-電圧変換器であって、前記電流-電圧変換器は、前記基準電圧を利用する、電流-電圧変換器と、を備える、出力回路。
【請求項32】
アナログ信号をデジタル出力に変換するためのアナログーデジタル変換器であって、前記アナログーデジタル変換器は、前記基準電圧を利用する、アナログーデジタル変換器を更に備える、請求項31に記載の出力回路。
【請求項33】
前記不揮発性メモリセルは、スプリットゲートメモリセルである、請求項31に記載の出力回路。
【請求項34】
前記アレイは、ニューラルネットワークの一部である、請求項31に記載の出力回路。
【発明の詳細な説明】
【技術分野】
【0001】
(優先権の主張)
本出願は、参照により本明細書に組み込まれる、2021年5月19日に出願された「Hybrid Output Architecture for Analog Neural Memory in a Deep Learning Artificial Neural Network」と題する米国特許仮出願第63/190,240号、及び2021年8月31日に出願された「Output Circuit for Analog Neural Memory in a Deep Learning Artificial Neural Network」と題する米国特許出願第17/463,063号の優先権を主張する。
【0002】
(発明の分野)
深層学習人工ニューラルネットワークにおけるアナログニューラルメモリ用のハイブリッド出力アーキテクチャについて多数の実施形態が開示される。
【背景技術】
【0003】
人工ニューラルネットワークは、生物学的ニューラルネットワーク(動物の中枢神経系、特に脳)を模倣しており、多数の入力に依存し得、かつ、一般的に未知である関数を推定する又は近似するために使用される。人工ニューラルネットワークは、概して、お互いの間でメッセージを交換する相互接続した「ニューロン」の層を含む。
【0004】
図1は人工ニューラルネットワークを示しており、図中、円は、入力又はニューロンの層を表す。接続(シナプスと呼ばれる)は、矢印によって表され、経験に基づいてチューニングされ得る数値の重みを有する。これにより、ニューラルネットワークは入力に適応し、学習可能になる。典型的には、ニューラルネットワークは、複数の入力の層を含む。典型的には、1つ以上のニューロンの中間層、及びニューラルネットワークの出力を提供するニューロンの1つの出力層が存在する。各レベルでニューロンは、シナプスから受信したデータに基づいて個々に又は集合的に決定を行う。
【0005】
高性能情報処理用の人工ニューラルネットワークの開発における主要な課題のうちの1つは、適切なハードウェア技術の欠如である。実際には、実用ニューラルネットワークは、非常に多数のシナプスに依拠しており、これによりニューロン間の高い接続性、すなわち、非常に高度な計算処理の並列化が可能となる。原理的には、このような複雑性は、デジタルスーパーコンピュータ又は専用グラフィックプロセッシングユニットクラスタによって実現が可能である。しかしながら、高コストに加え、これらのアプローチはまた、生物学的ネットワークが主として低精度のアナログ計算を実施するのではるかに少ないエネルギーしか消費しないのと比較して、エネルギー効率が劣っていることに悩まされている。人工ニューラルネットワークにはCMOSアナログ回路が使用されてきたが、ほとんどのCMOS実装シナプスは、多数のニューロン及びシナプスを前提とすると、嵩高過ぎていた。
【0006】
出願人は以前に、参照により組み込まれる米国特許出願第15/594,439号において、シナプスとして1つ以上の不揮発性メモリアレイを利用する人工(アナログ)ニューラルネットワークを開示した。不揮発性メモリアレイは、アナログニューラルメモリとして動作する。ニューラルネットワークデバイスは、第1の複数の入力を受け取って、それから第1の複数の出力を生成するように構成されている第1の複数のシナプス、及び第1の複数の出力を受け取るように構成された第1の複数のニューロンを含む。第1の複数のシナプスは複数のメモリセルを含み、メモリセルの各々は、半導体基板内に形成された、間にチャネル領域が延在する離間したソース領域及びドレイン領域と、チャネル領域の第1の部分の上方に絶縁されて配設される浮遊ゲートと、チャネル領域の第2の部分の上方に絶縁されて配設される非浮遊ゲートと、を含む。複数のメモリセルの各々は、浮遊ゲートの多くの電子に対応する重み値を記憶するように構成されている。複数のメモリセルは、第1の複数の入力に、記憶された重み値を乗算して第1の複数の出力を生成するように構成される。
【0007】
不揮発性メモリセル
不揮発性メモリは、周知である。例えば、参照により本明細書に組み込まれる、米国特許第5,029,130号(「’130号特許」)は、フラッシュメモリセルの一種である、スプリットゲート不揮発性メモリセルのアレイを開示する。このようなメモリセル210を
図2に示す。各メモリセル210は、半導体基板12内に形成されたソース領域14及びドレイン領域16を含み、ソース領域14とドレイン領域16との間にはチャネル領域18がある。浮遊ゲート20は、チャネル領域18の第1の部分の上方に絶縁されて形成され(並びに、チャネル領域18の第1の部分の導電性を制御して)、ソース領域14の一部分の上方にかけて形成される。ワード線端子22(典型的には、ワード線に結合される)は、チャネル領域18の第2の部分の上方に絶縁されて配設される、(並びに、チャネル領域18の第2の部分の導電性を制御する)第1の部分と、浮遊ゲート20の上方で上に延在する第2の部分と、を有する。浮遊ゲート20及びワード線端子22は、ゲート酸化物によって基板12から絶縁される。ビット線24はドレイン領域16に結合される。
【0008】
ワード線端子22に高圧正電圧を加えることによって、メモリセル210に対して消去が行われ(電子が浮遊ゲートから除去される)、これによって、浮遊ゲート20の電子は、浮遊ゲート20からワード線端子22までそれらの間にある絶縁体の中をファウラーノルドハイム(Fowler-Nordheim、FN)トンネリングを介して通過する。
【0009】
メモリセル210は、ワード線端子22に正電圧、及びソース領域14に正電圧を加えることによって、ホットエレクトロンのソースサイド注入(source side injection、SSI)によって、プログラムされる(電子が浮遊ゲートに加えられる)。電子流は、ドレイン領域16からソース領域14に向かって流れる。電子は加速し、ワード線端子22と浮遊ゲート20との間の間隙に達すると、発熱する。熱せられた電子の一部は、浮遊ゲート20からの静電引力に起因して、浮遊ゲート20にゲート酸化物を介して注入される。
【0010】
メモリセル210は、ドレイン領域16及びワード線端子22に正の読み出し電圧を加える(ワード線端子の下方のチャネル領域18の部分をオンにする)ことによって、読み出される。浮遊ゲート20が正に帯電する(すなわち、電子を消去する)と、浮遊ゲート20の下方のチャネル領域18の部分も同様にオンになり、電流はチャネル領域18を流れ、これは、消去された状態つまり「1」の状態として検知される。浮遊ゲート20が負に帯電する(すなわち、電子でプログラムされる)と、浮遊ゲート20の下方のチャネル領域の部分はほとんど又は完全にオフになり、電流はチャネル領域18を流れず(又はほとんど流れず)、これは、プログラムされた状態つまり「0」の状態として検知される。
【0011】
表1は、読み出し動作、消去動作、及びプログラム動作を実行するためにメモリセル110の端子に印加され得る典型的な電圧/電流範囲を示す。
表1:
図3のフラッシュメモリセル210の動作
【表1】
【0012】
他の種類のフラッシュメモリセルとして、他のスプリットゲート型メモリセル構成も知られている。例えば、
図3は、ソース領域14と、ドレイン領域16と、チャネル領域18の第1の部分の上方にある浮遊ゲート20と、チャネル領域18の第2の部分の上方にある選択ゲート22(典型的には、ワード線、WL、に結合される)と、浮遊ゲート20の上方にある制御ゲート28と、ソース領域14の上方にある消去ゲート30と、を含む4ゲートメモリセル310を示す。この構成は、あらゆる目的のため参照により本明細書に組み込まれる、米国特許第6,747,310号に記載されている。ここで、全てのゲートは、浮遊ゲート20を除いて、非浮遊ゲートであり、つまり、それらは電圧源に電気的に接続される又は接続可能である。プログラミングは、熱せられた電子がチャネル領域18から浮遊ゲート20にその電子自体を注入することによって実行される。消去は、電子が浮遊ゲート20から消去ゲート30へトンネリングすることによって実行される。
【0013】
表2は、読み出し、消去、及びプログラム動作を実行するためにメモリセル310の端子に印加することができる典型的な電圧/電流範囲を示す。
表2:
図3のフラッシュメモリセル310の動作
【表2】
【0014】
図4は、別の種類のフラッシュメモリセルである、3ゲートメモリセル410を示す。メモリセル410は、メモリセル410が別個の制御ゲートを有しないことを除いて、
図3のメモリセル310と同一である。(消去ゲートの使用を通じて消去が起こる)消去動作及び読み出し動作は、制御ゲートバイアスが印加されないことを除いて、
図3のものと同様である。プログラミング動作もまた、制御ゲートバイアスなしで行われるため、結果として、プログラム動作中は、制御ゲートバイアスの不足を補償するため、より高い電圧がソース線に印加されなければならない。
【0015】
表3は、読み出し動作、消去動作、及びプログラム動作を実行するためにメモリセル410の端子に印加され得る典型的な電圧/電流範囲を示す。
表3:
図4のフラッシュメモリセル410の動作
【表3】
【0016】
図5は、別の種類のフラッシュメモリセルである、積層ゲートメモリセル510を示す。メモリセル510は、浮遊ゲート20がチャネル領域18全体の上方に延在し、制御ゲート22(ここでワード線に結合される)が絶縁層(図示せず)によって分離されて浮遊ゲート20の上方に延在することを除いて、
図2のメモリセル210と同様である。消去は、FGから基板への電子のFNトンネリングによって行われ、プログラミングは、チャネル18とドレイン領域16との間の領域でのチャネルホットエレクトロン(channel hot electron、CHE)注入によって、ソース領域14からドレイン領域16に向かって流れる電子によって、及びより高い制御ゲート電圧を有するメモリセル210の読み出し動作と同様である読み出し動作によって行われる。
【0017】
表4は、読み出し動作、消去動作、及びプログラム動作を実行するためのメモリセル510及び基板12の端子に印加され得る典型的な電圧範囲を示す。
表4:
図5のフラッシュメモリセル510の動作
【表4】
【0018】
本明細書に記載される方法及び手段は、限定されないが、FINFETスプリットゲートフラッシュ又はスタックゲートフラッシュメモリ、NANDフラッシュ、SONOS(ケイ素-酸化物-窒化物-酸化物-ケイ素、窒化物中の電荷トラップ)、MONOS(金属-酸化物-窒化物-酸化物-ケイ素、窒化物中の金属電荷トラップ)、ReRAM(抵抗変化型メモリ)、PCM(相変化メモリ)、MRAM(磁気抵抗メモリ)、FeRAM(強誘電体メモリ)、CT(電荷トラップ)メモリ、CN(カーボンチューブ)メモリ、OTP(バイレベル又はマルチレベルの1回のみのプログラムが可能)及びCeRAM(強相関電子メモリ)などの他の不揮発性メモリ技術に適用され得る。
【0019】
上記の人工ニューラルネットワークにおける不揮発性メモリセルの種類のうちの1つを含むメモリアレイを利用するために、2つの修正が行われる。第一に、以下に更に説明されるように、アレイ内の他のメモリセルのメモリ状態に悪影響を与えずに各メモリセルを個々にプログラム、消去、及び読み出しできるように線を構成する。第二に、メモリセルの連続(アナログ)プログラミングを提供する。
【0020】
具体的には、アレイ内の各メモリセルのメモリ状態(すなわち、浮遊ゲートの電荷)を、完全に消去された状態から完全にプログラムされた状態へ、独立して、かつ他のメモリセルの乱れが最小で、連続的に変えることができる。別の実施形態では、アレイ内の各メモリセルのメモリ状態(すなわち、浮遊ゲートの電荷)を、完全にプログラムされた状態から完全に消去された状態へ、及び逆もまた同様に、独立して、かつ他のメモリセルの乱れが最小で、連続的に変えることができる。これはつまり、セル記憶がアナログであるか、又は多数の不連続値(例えば16個又は64個の異なる値)のうちの1つを最低限記憶することができることを意味し、これにより、メモリアレイ内の全てのセルが非常に精密に、かつ個々にチューニング可能となり、また、メモリアレイが、記憶、及びニューラルネットワークのシナプシスの重みへの微細チューニング調整に対して、理想的なものになる。
【0021】
不揮発性メモリセルアレイを使用するニューラルネットワーク
図6は、本実施形態の不揮発性メモリアレイを利用するニューラルネットワークの非限定例を概念的に例解する。この例は、顔認識アプリケーション用に不揮発性メモリアレイニューラルネットワークを使用するが、不揮発性メモリアレイベースのニューラルネットワークを使用して他の適切なアプリケーションを実装することも可能である。
【0022】
S0は入力層であり、この例では、5ビット精度の32×32ピクセルRGB画像である(すなわち、各色R、G、及びBにつき1つずつで3つの32×32ピクセルアレイであり、各ピクセルは5ビット精度である)。入力層S0から層C1に行くシナプスCB1は、一部のインスタンスには異なる重みのセットを適用し、他のインスタンスには共有の重みを適用し、入力画像を3×3ピクセルの重なり合うフィルタ(カーネル)でスキャンし、1ピクセル(又はモデルによっては2ピクセル以上)ずつフィルタをシフトする。具体的には、画像の3×3部分における9ピクセルの値(すなわち、フィルタ又はカーネルと称される)は、シナプスCB1に提供され、そこで、これらの9個の入力値に適切な重みを乗算し、その乗算の出力を合計後、単一の出力値が決定され、層C1の特徴マップのうちの1つのピクセルを生成するためにCB1の第1のシナプスによって与えられる。3×3フィルタは次に、入力層S0内で右側に1ピクセルだけシフトされ(すなわち、3ピクセルの列を右側に追加し、左側で3ピクセルの列をドロップする)、これにより、この新しく位置づけられたフィルタの9ピクセル値はシナプスCB1に提供され、そこでそれらに上記と同じ重みを乗算し、関連するシナプスによって第2の単一の出力値を決定する。このプロセスを、3×3フィルタが入力層S0の32×32ピクセル画像全体にわたって3色全て及び全てのビット(精度値)についてスキャンするまで続ける。プロセスは次に、層C1の特徴マップ全てが計算されるまで、異なる重みのセットを使用して繰り返されて、層C1の異なる特徴マップを生成する。
【0023】
本例では、層C1において、各々30×30ピクセルを有する16個の特徴マップが存在する。各ピクセルは、入力とカーネルとの乗算から抽出された新しい特徴ピクセルであり、したがって、各特徴マップは、二次元アレイであり、したがってこの例では、層C1は、二次元アレイの16層を構成する(本明細書で言及される層及びアレイは、必ずしも物理的関係ではなく論理的な関係であり、すなわち、アレイは必ずしも物理的な二次元アレイに配向されないことに留意されたい)。層C1内の16個の特徴マップの各々は、フィルタスキャンに適用される異なるシナプス重みのセット16個のうちの1つによって生成される。C1特徴マップは全て、境界同定など、同じ画像特徴の異なる態様を対象とすることができる。例えば、第1のマップ(この第1のマップを生成するために使用される全てのスキャンに共有される第1の重みセットを使用して生成される)は、円形エッジを識別することができ、第2のマップ(第1の重みセットと異なる第2の重みセットを使用して生成される)は、長方形エッジ又はある特定の特徴のアスペクト比などを識別することができる。
【0024】
層C1から層S1へ行く前には、各特徴マップ内の重なり合わずに連続する2×2領域からの値をプールする活性化関数P1(プーリング)が適用される。プーリング関数P1の目的は、近隣の位置を平均すること(又はmax関数を使用することも可能である)、例えばエッジ位置の依存を低減すること、及び次の段階に行く前にデータサイズを低減することである。層S1において、16個の15×15特徴マップ(すなわち、各々15×15ピクセルの異なるアレイ16個)が存在する。層S1から層C2に行くシナプスCB2は、層S1内のマップを4×4フィルタにより1ピクセルのフィルタシフトでスキャンする。層C2において、22個の12×12特徴マップが存在する。層C2から層S2へ行く前には、各特徴マップ内の重なり合わずに連続する2×2領域からの値をプールする活性化関数P2(プーリング)が適用される。層S2において、22個の6×6特徴マップが存在する。層S2から層C3へ行くシナプスCB3では活性化関数(プーリング)が適用され、ここで層C3内の全てのニューロンは、CB3のそれぞれのシナプスを介して層S2内の全てのマップに接続する。層C3において、64個のニューロンが存在する。層C3から出力層S3へと行くシナプスCB4は、C3をS3に完全に接続する、すなわち、層C3内の全てのニューロンは、層S3内の全てのニューロンに接続される。S3における出力は、10個のニューロンを含み、ここで出力が最も高いニューロンが、クラスを決定する。この出力は、例えば、元の画像の内容の同定又は分類(クラス)を示すことができる。
【0025】
シナプスの各層は、不揮発性メモリセルのアレイ又はアレイの一部を使用して実装される。
【0026】
図7は、その目的のために使用可能なアレイのブロック図である。ベクトルマトリックス乗算(VMM)アレイ32は、不揮発性メモリセルを含み、ある層と次の層との間のシナプス(
図6のCB1、CB2、CB3、及びCB4など)として利用される。具体的には、VMMアレイ32は、不揮発性メモリセルのアレイ33、消去ゲート及びワード線ゲートデコーダ34、制御ゲートデコーダ35、ビット線デコーダ36、並びにソース線デコーダ37を含み、それらのデコーダは不揮発性メモリセルアレイ33に対するそれぞれの入力をデコードする。VMMアレイ32への入力は、消去ゲート及びワード線ゲートデコーダ34から、又は制御ゲートデコーダ35から行うことができる。この例におけるソース線デコーダ37はまた、不揮発性メモリセルアレイ33の出力をデコードする。代替的に、ビット線デコーダ36が、不揮発性メモリセルアレイ33の出力をデコードすることもできる。
【0027】
不揮発性メモリセルアレイ33は、2つの目的を果たす。第一に、不揮発性メモリアレイ33は、VMMアレイ32によって使用される重みを記憶する。第二に、不揮発性メモリセルアレイ33は、不揮発性メモリセルアレイ33に格納された重みを、入力に有効に乗算して、それらを出力線(ソース線又はビット線)ごとに加算して、出力を生成し、この出力は次の層への入力又は最後の層への入力になる。不揮発性メモリセルアレイ33が乗算及び加算の関数を実行することで、別個の乗算及び加算の論理回路の必要性はなくなり、また、メモリ内の計算により電力効率も良い。
【0028】
不揮発性メモリセルアレイ33の出力は、不揮発性メモリセルアレイ33の出力を合計してその畳み込み用の単一の値を作成する、差動合計器(合計オペアンプ又は合計カレントミラーなど)38に供給される。差動合計器38は、正の重み及び負の重みの総和を実行するように配置される。
【0029】
差動加算器38の合計された出力値は、次に出力を整流する活性化関数ブロック39に供給される。活性化関数ブロック39は、シグモイド、tanh、又はReLU関数を提供し得る。活性化関数ブロック39の整流された出力値は、次の層(例えば
図6のC1)として特徴マップの要素になり、次いで、次のシナプスに適用されて次の特徴マップ層又は最後の層を生成する。したがって、この例では、不揮発性メモリセルアレイ33は、複数のシナプスを構成し(ニューロンの前の層から、又は画像データベースなどの入力層から、入力を受け取る)、合計オペアンプ38及び活性化関数ブロック39は、複数のニューロンを構成する。
【0030】
図7のVMMアレイ32への入力(WLx、EGx、CGx、及び任意選択的にBLx及びSLx)は、アナログレベル、バイナリレベル、又はデジタルビット(この場合、DACは、デジタルビットを適切な入力アナログレベルに変換するために提供される)であり得、出力は、アナログレベル、バイナリレベル、又はデジタルビットであり得る(この場合、出力ADCは出力アナログレベルをデジタルビットに変換するために提供される)。
【0031】
図8は、図中でVMMアレイ32a、32b、32c、32d及び32eとして標示されたVMMアレイ32の多数の層の使用を示すブロック図である。
図8に示されるように、入力(Inputxで示される)は、デジタル-アナログ変換器31によってデジタルからアナログに変換され、入力VMMアレイ32aに提供される。変換されたアナログ入力は、電圧又は電流であり得る。第1の層の入力D/A変換は、入力VMMアレイ32aのマトリックス乗算器の適切なアナログレベルに入力Inputxをマッピングする関数又はLUT(ルックアップテーブル)を使用することによって行うことができる。入力変換はまた、外部アナログ入力を入力VMMアレイ32aへのマッピングされたアナログ入力に変換するために、アナログ-アナログ(analog to analog、A/A)変換器によって行うこともできる。
【0032】
入力VMMアレイ32aによって生成された出力は、次に、次のVMMアレイ(隠しレベル1)32bへの入力として提供され、次に入力VMMアレイ(隠しレベル2)32cへの入力として提供される出力を生成する、などとなる。VMMアレイ32の様々な層は、畳み込みニューラルネットワーク(convolutional neural network、CNN)のシナプス及びニューロンの各層として機能する。VMMアレイ32a、32b、32c、32d及び32eはそれぞれスタンドアローンの物理的不揮発性メモリアレイとすることができ、又は複数のVMMアレイは、同じ物理的不揮発性メモリアレイの異なる部分を利用することができ、又は複数のVMMアレイは、同じ物理的不揮発性メモリアレイの重なり合う部分を利用することができる。
図8に示される例は、5つの層(32a、32b、32c、32d、32e)、すなわち、1つの入力層(32a)、2つの隠れ層(32b、32c)、及び2つの全接続層(32d、32e)を含む。当業者であれば、これは単なる例示であり、代わりにシステムが2つを超える隠れ層及び2つを超える全接続層を含み得ることを理解するであろう。
【0033】
ベクトルマトリックス乗算(VMM)アレイ
図9は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ900を示す。VMMアレイ900は、不揮発性メモリセルのメモリアレイ901と、不揮発性基準メモリセルの基準アレイ902(アレイの頂部に位置する)と、を含む。代替的に、別の基準アレイが底部に位置することもできる。
【0034】
VMMアレイ900では、制御ゲート線903などの制御ゲート線が垂直方向に延びており(したがって、行方向の基準アレイ902が、制御ゲート線903に直交する)、消去ゲート線904などの消去ゲート線が水平方向に延びている。ここで、VMMアレイ900への入力は、制御ゲート線(CG0、CG1、CG2、CG3)に提供され、VMMアレイ900の出力は、ソース線(SL0、SL1)に現れる。一実施形態では偶数行のみが使用され、別の実施形態では奇数行のみが使用される。各ソース線(それぞれSL0、SL1)の電流は、その特定のソース線に接続されたメモリセルからの全ての電流の合計関数を実行する。
【0035】
ニューラルネットワークについて本明細書に記載されているように、VMMアレイ900の不揮発性メモリセル、すなわちVMMアレイ900のメモリセル310は、サブスレッショルド領域で動作するように構成されることが好ましい。
【0036】
本明細書に記載される不揮発性基準メモリセル及び不揮発性メモリセルは、以下のように弱反転(サブスレッショルド領域)でバイアスされる:
Ids=Io*e(Vg-Vth)/nVt=w*Io*e(Vg)/nVt
式中、w=e(-Vth)/nVtであり、
式中、Idsはドレイン-ソース間電流であり、Vgはメモリセルのゲート電圧であり、Vthはメモリセルのスレッショルド電圧であり、Vtは熱電圧=k*T/qであり、kはボルツマン定数、Tはケルビン温度、qは電子電荷であり、nは、傾斜係数=1+(Cdep/Cox)であり、Cdep=空乏層の容量、そして、Coxはゲート酸化物層の容量であり、Ioはスレッショルド電圧に等しいゲート電圧におけるメモリセル電流であり、Ioは、(Wt/L)*u*Cox*(n-1)*Vt2に比例し、式中、uはキャリア移動度であり、Wt及びLはそれぞれ、メモリセルの幅及び長さである。
【0037】
メモリセル(基準メモリセル又は周辺メモリセルなど)又はトランジスタを使用して入力電流を入力電圧に変換するI-Vログ変換器を使用した場合:
Vg=n*Vt*log[Ids/wp*Io]
式中、wpは、基準又は周辺メモリセルのwである。
【0038】
電流入力を伴うベクトルマトリックス乗算器VMMアレイとして使用されるメモリアレイについて、出力電流は以下である:
Iout=wa
*Io
*e
(Vg)/nVt、すなわち
Iout=(wa/wp)
*Iin=W
*Iin
W=e
(Vthp-Vtha)/nVt
式中、wa=メモリアレイの各メモリセルのwである。
Vthpは周辺メモリセルの有効スレッショルド電圧であり、Vthaはメイン(データ)メモリセルの有効スレッショルド電圧である。トランジスタのスレッショルド電圧は基板本体バイアス電圧の関数であり、Vsbと表される基板本体バイアス電圧は、そのような温度で様々な条件を補償するように変調され得ることに留意されたい。スレッショルド電圧Vthは、次のように表すことができる。
【数1】
式中、Vth0は、ゼロ基板バイアスを有するスレッショルド電圧であり、
【数2】
は表面電位であり、γは本体効果パラメータである。
【0039】
ワード線又は制御ゲートは、入力電圧のためのメモリセルの入力として使用することができる。
【0040】
代替的に、本明細書に記載されたVMMアレイのフラッシュメモリセルは、線形領域で動作するように構成することもできる。
Ids=β*(Vgs-Vth)*Vds; β=u*Cox*Wt/L
W=α(Vgs-Vth)
すなわち、直線領域における重みWは、(Vgs-Vth)に比例する。
【0041】
ワード線又は制御ゲート又はビット線又はソース線は、線形領域内で動作するメモリセルの入力として使用することができる。ビット線又はソース線は、メモリセルの出力として使用することができる。
【0042】
I-V線形変換器用に、線形領域で動作するメモリセル(基準メモリセル又は周辺メモリセルなど)又はトランジスタを使用して、入出力電流を入出力電圧に線形変換することができる。
【0043】
代替的に、本明細書に記載されたVMMアレイのメモリセルは、飽和領域で動作するように構成することもできる。
Ids=1/2*β*(Vgs-Vth)2; β=u*Cox*Wt/L
W ∝ (Vgs-Vth)2、すなわち、重みWは(Vgs-Vth)2に比例する。
【0044】
ワード線、制御ゲート、又は消去ゲートは、飽和領域内で動作するメモリセルの入力として使用することができる。ビット線又はソース線は、出力ニューロンの出力として使用することができる。
【0045】
代替的に、本明細書に記載されるVMMアレイのメモリセルは、ニューラルネットワークの各層又は多層に対して全ての領域又はそれらの組み合わせ(サブスレッショルド、線形、又は飽和)で使用され得る。
【0046】
図7のVMMアレイ32のための他の実施形態は、参照により本明細書に組み込まれる米国特許第10,748,630号に記載されている。上記出願に記載されているように、ソース線又はビット線は、ニューロン出力(電流和出力)として使用することができる。
【0047】
図10は、
図2に示されるメモリセル210に特に適しており、かつ入力層と次の層との間のシナプスとして利用される、ニューロンVMMアレイ1000を示す。VMMアレイ1000は、不揮発性メモリセルのメモリアレイ1003と、第1の不揮発性基準メモリセルの基準アレイ1001と、第2の不揮発性基準メモリセルの基準アレイ1002と、を含む。アレイの列方向に配置された基準アレイ1001及び1002は、端子BLR0、BLR1、BLR2、及びBLR3に流入する電流入力を電圧入力WL0、WL1、WL2、及びWL3に変換するように機能する。実際には、第1及び第2の不揮発性基準メモリセルは、電流入力が流入する状態で、マルチプレクサ1014(一部のみ示す)を通してダイオード接続される。基準セルは、目標基準レベルにチューニング(例えば、プログラム)される。目標基準レベルは、基準ミニアレイマトリックス(図示せず)によって提供される。
【0048】
メモリアレイ1003は、2つの目的を果たす。第一に、メモリアレイ1003は、VMMアレイ1000により使用される重みを、それぞれのメモリセルに記憶する。第二に、メモリアレイ1003は、メモリアレイ1003に記憶された重みを、入力(すなわち、端子BLR0、BLR1、BLR2、及びBLR3に提供された電流入力であり、基準アレイ1001及び1002がこれらの電流入力を入力電圧に変換して、ワード線WL0、WL1、WL2、及びWL3に供給する)に有効に乗算し、次いで、全ての結果(メモリセル電流)を加算してそれぞれのビット線(BL0~BLN)に出力を生成し、この出力は次の層への入力又は最後の層への入力となる。乗算及び加算の関数を実行することで、メモリアレイ1003は、別個の乗算及び加算の論理回路の必要性をなくし、また、電力効率も良い。ここで、電圧入力はワード線WL0、WL1、WL2、及びWL3に提供され、出力は、読み出し(推論)動作中にそれぞれのビット線BL0~BLNに現れる。ビット線BL0~BLNの各々の電流は、その特定のビット線に接続された全ての不揮発性メモリセルからの電流の合計関数を実行する。
【0049】
表5は、VMMアレイ1000の動作電圧及び電流を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示す。行は、読み出し、消去、及びプログラムの動作を示す。
表5:
図10のVMMアレイ1000の動作
【表5】
【0050】
図11は、
図2に示されるメモリセル210に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1100を示す。VMMアレイ1100は、不揮発性メモリセルのメモリアレイ1103と、第1の不揮発性基準メモリセルの基準アレイ1101と、第2の不揮発性基準メモリセルの基準アレイ1102と、を含む。基準アレイ1101及び1102は、VMMアレイ1100の行方向に延びる。VMMアレイは、VMMアレイ1100においてワード線が垂直方向に延びることを除いて、VMM1000と同様である。ここで、入力はワード線(WLA0、WLB0、WLA1、WLB2、WLA2、WLB2、WLA3、WLB3)に提供され、出力は、読み出し動作中にソース線(SL0、SL1)に現れる。各ソース線の電流は、その特定のソース線に接続されたメモリセルからの全ての電流の合計関数を実行する。
【0051】
表6は、VMMアレイ1100の動作電圧及び電流を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示す。行は、読み出し、消去、及びプログラムの動作を示す。
表6:
図11のVMMアレイ1100の動作
【表6】
【0052】
図12は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1200を示す。VMMアレイ1200は、不揮発性メモリセルのメモリアレイ1203と、第1の不揮発性基準メモリセルの基準アレイ1201と、第2の不揮発性基準メモリセルの基準アレイ1202と、を含む。基準アレイ1201及び1202は、端子BLR0、BLR1、BLR2、及びBLR3に流入する電流入力を電圧入力CG0、CG1、CG2、及びCG3に変換するように機能する。実際には、第1及び第2の不揮発性基準メモリセルは、電流入力がBLR0、BLR1、BLR2、及びBLR3を通って流入する状態で、マルチプレクサ1212(一部のみ示す)を通してダイオード接続される。マルチプレクサ1212は、読み出し動作中に第1及び第2の不揮発性基準メモリセルのそれぞれのビット線(BLR0など)の一定電圧を確実にするために、対応のマルチプレクサ1205及びカスコーディングトランジスタ1204をそれぞれ含む。基準セルは、目標基準レベルにチューニングされる。
【0053】
メモリアレイ1203は、2つの目的を果たす。第一に、メモリアレイ1203は、VMMアレイ1200によって使用される重みを記憶する。第二に、メモリアレイ1203は、メモリアレイに記憶された重みを、入力(端子BLR0、BLR1、BLR2、及びBLR3に提供された電流入力であり、基準アレイ1201及び1202がこれらの電流入力を入力電圧に変換して、制御ゲート(CG0、CG1、CG2、及びCG3)に供給する)に有効に乗算して、次いで、全ての結果(セル電流)を加算して出力を生成し、この出力はBL0~BLNに現れ、次の層への入力又は最後の層への入力となる。メモリアレイが乗算及び加算の関数を実行することで、別個の乗算及び加算の論理回路の必要性がなくなり、また、電力効率も良い。ここで、入力は制御ゲート線(CG0、CG1、CG2、及びCG3)に提供され、出力は、読み出し動作中にビット線(BL0~BLN)に現れる。各ビット線の電流は、その特定のビット線に接続されたメモリセルからの全ての電流の合計関数を実行する。
【0054】
VMMアレイ1200は、メモリアレイ1203内の不揮発性メモリセルの一方向チューニングを実装する。すなわち、各不揮発性メモリセルは消去され、次いで、浮遊ゲートの所望の電荷に達するまで部分的にプログラムされる。過度に多くの電荷が浮遊ゲートに加えられる場合(誤った値がセルに記憶されるなど)、セルは消去され、一連の部分的なプログラミング動作が最初からやり直される。示されるように、同じ消去ゲート(EG0又はEG1など)を共有する2つの行は、一緒に消去され(ページ消去として知られる)、その後、各セルは、浮遊ゲートの所望の電荷に達するまで部分的にプログラムされる。
【0055】
表7は、VMMアレイ1200の動作電圧及び電流を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルの制御ゲート、選択セルと同じセクタ内の非選択セルの制御ゲート、選択セルとは異なるセクタ内の非選択セルの制御ゲート、選択セルの消去ゲート、非選択セルの消去ゲート、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示す。行は、読み出し、消去、及びプログラムの動作を示す。
表7:
図12のVMMアレイ1200の動作
【表7】
【0056】
図13は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1300を示す。VMMアレイ1300は、不揮発性メモリセルのメモリアレイ1303と、基準アレイ1301又は第1の不揮発性基準メモリセルと、第2の不揮発性基準メモリセルの基準アレイ1302と、を備える。EG線EGR0、EG0、EG1、及びEGR1は垂直に延び、CG線CG0、CG1、CG2、及びCG3並びにSL線WL0、WL1、WL2、及びWL3は水平に延びる。VMMアレイ1300は、VMMアレイ1300が双方向チューニングを実装することを除いてVMMアレイ1400と同様であり、それぞれ個々のセルは、個別のEG線の使用により、浮遊ゲートの所望の電荷量に達するために、必要に応じて完全に消去され、部分的にプログラムされ、部分的に消去され得る。示されるように、基準アレイ1301及び1302は、端子BLR0、BLR1、BLR2及びBLR3における入力電流を制御ゲート電圧CG0、CG1、CG2及びCG3に変換し(マルチプレクサ1314を介したダイオード接続された基準セルの作用を通じて)、これらの電圧は行方向でメモリセルに印加される。電流出力(ニューロン)は、ビット線BL0~BLN中にあり、各ビット線は、その特定のビット線に接続された不揮発性メモリセルからの全ての電流を合計する。
【0057】
表8は、VMMアレイ1300の動作電圧及び電流を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルの制御ゲート、選択セルと同じセクタ内の非選択セルの制御ゲート、選択セルとは異なるセクタ内の非選択セルの制御ゲート、選択セルの消去ゲート、非選択セルの消去ゲート、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示す。行は、読み出し、消去、及びプログラムの動作を示す。
表8:
図13のVMMアレイ1300の動作
【表8】
【0058】
図22は、
図2に示されるメモリセル210に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2200を示す。VMMアレイ2200では、入力INPUT
0....、INPUT
Nは、ビット線BL
0、...、BL
Nでそれぞれ受信され、出力OUTPUT
1、OUTPUT
2、OUTPUT
3、及びOUTPUT
4は、ソース線SL
0、SL
1、SL
2、及びSL
3にそれぞれ生成される。
【0059】
図23は、
図2に示されるメモリセル210に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2300を示す。この例では、入力INPUT
0、INPUT
1、INPUT
2、及びINPUT
3は、ソース線SL
0、SL
1、SL
2、及びSL
3でそれぞれ受信され、出力OUTPUT
0、...、OUTPUT
Nは、ビット線BL
0、...、BL
Nに生成される。
【0060】
図24は、
図2に示されるメモリセル210に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2400を示す。この例では、入力INPUT
0、...、INPUT
Mは、ワード線WL
0、...、WL
Mでそれぞれ受信され、出力OUTPUT
0、...、OUTPUT
Nは、ビット線BL
0、...、BL
Nに生成される。
【0061】
図25は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2500を示す。この例では、入力INPUT
0、...、INPUT
Mは、ワード線WL
0、...、WL
Mでそれぞれ受信され、出力OUTPUT
0、...、OUTPUT
Nは、ビット線BL
0、...、BL
Nに生成される。
【0062】
図26は、
図4に示されるメモリセル410に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2600を示す。この例では、入力INPUT
0、...、INPUT
nがそれぞれ垂直制御ゲート線CG
0、...、CG
Nで受信され、出力OUTPUT
1及びOUTPUT
2がソース線SL
0及びSL
1に生成される。
【0063】
図27は、
図4に示されるメモリセル410に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2700を示す。この例では、入力INPUT
0、...、INPUT
Nは、ビット線BL
0、...、BL
Nにそれぞれ結合されているビット線制御ゲート2701-1、2701-2、...、2701-(N-1)及び2701-Nのゲートでそれぞれ受信される。例示的な出力OUTPUT
1及びOUTPUT
2が、ソース線SL
0及びSL
1に生成される。
【0064】
図28は、
図3に示されるメモリセル310、
図5に示されるメモリセル510、及び
図7に示されるメモリセル710に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2800を示す。この例では、入力INPUT
0、...、INPUT
Mは、ワード線WL
0、...、WL
Mで受信され、出力OUTPUT
0、...、OUTPUT
Nは、ビット線BL
0、...、BL
Nにそれぞれ生成される。
【0065】
図29は、
図3に示されるメモリセル310、
図5に示されるメモリセル510、及び
図7に示されるメモリセル710に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ2900を示す。この例では、入力INPUT
0、...、INPUT
Mは、制御ゲート線CG
0、...、CG
Mで受信される。出力OUTPUT
0、...、OUTPUT
Nは、垂直ソース線SL
0、...、SL
Nにそれぞれ生成され、各ソース線SL
iは、列i内の全てのメモリセルのソース線に結合されている。
【0066】
図30は、
図3に示されるメモリセル310、
図5に示されるメモリセル510、及び
図7に示されるメモリセル710に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ3000を示す。この例では、入力INPUT
0、...、INPUT
Mは、制御ゲート線CG
0、...、CG
Mで受信される。出力OUTPUT
0、...、OUTPUT
Nは、垂直ビット線BL
0、...、BL
Nにそれぞれ生成され、各ビット線BL
iは、列i内の全てのメモリセルのビット線に結合されている。
【0067】
長・短期メモリ
先行技術は、長・短期メモリ(long short-term memory、LSTM)として知られる概念を含む。LSTMユニットは、しばしば、ニューラルネットワーク内で使用される。LSTMによって、ニューラルネットワークは所定の任意の期間にわたって情報を記憶し、後続の動作においてその情報を使用することができる。従来のLSTMユニットは、セル、入力ゲート、出力ゲート、及び忘却ゲートを含む。3つのゲートは、セル内及びセル外への情報の流れ、及び情報がLSTM内で記憶される期間を調節する。VMMは、LSTMユニットにおいて特に有用である。
【0068】
図14は、例示的なLSTM1400を示す。この例におけるLSTM1400は、セル1401、1402、1403及び1404を含む。セル1401は、入力ベクトルx
0を受け取り、出力ベクトルh
0及びセル状態ベクトルc
0を生成する。セル1402は、入力ベクトルx
1と、セル1401からの出力ベクトル(隠れ状態)h
0と、セル1401からのセル状態c
0と、を受け取り、出力ベクトルh
1と、セル状態ベクトルc
1と、を生成する。セル1403は、入力ベクトルx
2と、セル1402からの出力ベクトル(隠れ状態)h
1と、セル1402からのセル状態c
1と、を受け取り、出力ベクトルh
2と、セル状態ベクトルc
2と、を生成する。セル1404は、入力ベクトルx
3と、セル1403からの出力ベクトル(隠れ状態)h
2と、セル1403からのセル状態c
2と、を受け取り、出力ベクトルh
3を生成する。追加のセルも使用可能であり、4つのセルを有するLSTMは、単なる例である。
【0069】
図15は、
図14のセル1401、1402、1403、及び1404に使用可能なLSTMセル1500の例示的な実装を示す。LSTMセル1500は、入力ベクトルx(t)と、先行するセルからのセル状態ベクトルc(t-1)と、先行するセルからの出力ベクトルh(t-1)と、を受け取り、セル状態ベクトルc(t)及び出力ベクトルh(t)を生成する。
【0070】
LSTMセル1500は、シグモイド関数デバイス1501、1502、及び1503を含み、それぞれが0~1の数を適用して、入力ベクトルのそれぞれの成分が出力ベクトルに寄与する程度を制御する。LSTMセル1500はまた、入力ベクトルに双曲線正接関数を適用するためのtanhデバイス1504及び1505と、2つのベクトルを乗算するための乗算器デバイス1506、1507、及び1508と、2つのベクトルを加算するための加算器デバイス1509と、を含む。出力ベクトルh(t)は、システム内の次のLSTMセルに提供することができるか、又は他の目的でアクセスすることができる。
【0071】
図16は、LSTMセル1500の一実装の一例であるLSTMセル1600を示す。読者の便宜のために、LSTMセル1500からの同じ採番方法が、LSTMセル1600で使用される。シグモイド関数デバイス1501、1502、及び1503、並びにtanhデバイス1504はそれぞれ、複数のVMMアレイ1601及び活性化関数ブロック1602を含む。したがって、VMMアレイは、特定のニューラルネットワークシステムで使用されるLSTMセルにおいて特に有用であることが分かる。乗算器デバイス1506、1507、及び1508、並びに加算器デバイス1509は、デジタル方式又はアナログ方式で実装される。活性化関数ブロック1602は、デジタル方式、又はアナログ方式で実装され得る。
【0072】
LSTMセル1600の代替例(及びLSTMセル1500の一実装の別の例)を
図17に示す。
図17では、シグモイド関数デバイス1501、1502及び1503、並びにtanhデバイス1504は、同じ物理ハードウェア(VMMアレイ1701及び活性化関数ブロック1702)を、時分割多重化された方式で共有する。LSTMセル1700はまた、2つのベクトルを乗算するための乗算器デバイス1703と、2つのベクトルを加算するための加算器デバイス1708と、(活性化関数ブロック1702を含む)tanhデバイス1505と、値i(t)を、i(t)がシグモイド関数ブロック1702から出力されるときに記憶するためのレジスタ1707と、値f(t)
*c(t-1)を、その値がマルチプレクサ1710を介して乗算器デバイス1703から出力されるときに記憶するためのレジスタ1704と、値i(t)
*u(t)を、その値がマルチプレクサ1710を介して乗算器デバイス1703から出力されるときに記憶するためのレジスタ1705と、値o(t)
*c~(t)を、その値がマルチプレクサ1710を介して乗算器デバイス1703から出力されるときに記憶するためのレジスタ1706と、マルチプレクサ1709と、を含む。
【0073】
LSTMセル1600がVMMアレイ1601とそれぞれの活性化関数ブロック1602との複数のセットを含むのに対し、LSTMセル1700は、LSTMセル1700の実施形態において複数の層を表すために使用される、VMMアレイ1701及び活性化関数ブロック1702の1つのセットのみを含む。LSTMセル1700は、LSTMセル1600と比較して、VMM及び活性化関数ブロックのために必要とするスペースは1/4で済むので、LSTMセル1700は、LSTM1600より必要とするスペースが少ない。
【0074】
LSTMユニットは典型的には複数のVMMアレイを含み、これらはそれぞれ、加算器及び活性化関数ブロック及び高電圧生成ブロックなどの、VMMアレイの外側の特定の回路ブロックによって提供される機能を必要とすることを更に理解することができる。各VMMアレイのための別個の回路ブロックを提供することは、半導体デバイス内にかなりの量のスペースを必要とし、幾分非効率的であろう。したがって、以下に記載される実施形態は、VMMアレイ自体の外側に必要とされる回路を削減する。
【0075】
ゲート付き回帰型ユニット
アナログVMM実装は、ゲート付き回帰型ユニット(gated recurrent unit、GRU)システムに利用することができる。GRUは、反復ニューラルネットワーク内のゲート機構である。GRUは、GRUセルが一般にLSTMセルよりも少ない構成要素を含むことを除いて、LSTMに類似している。
【0076】
図18は、例示的なGRU1800を示す。この例におけるGRU1800は、セル1801、1802、1803及び1804を含む。セル1801は、入力ベクトルx
0を受け取り、出力ベクトルh
0を生成する。セル1802は、入力ベクトルx
1と、セル1801からの出力ベクトルh
0と、を受け取り、出力ベクトルh
1を生成する。セル1803は、入力ベクトルx
2と、セル1802からの出力ベクトル(隠れ状態)h
1と、を受け取り、出力ベクトルh
2を生成する。セル1804は、入力ベクトルx
3と、セル1803からの出力ベクトル(隠れ状態)h
2と、を受け取り、出力ベクトルh
3を生成する。追加のセルも使用可能であり、4つのセルを有するGRUは、単なる例である。
【0077】
図19は、
図18のセル1801、1802、1803、及び1804に使用され得るGRUセル1900の例示的な実装を示す。GRUセル1900は、入力ベクトルx(t)と、先行するGRUセルからの出力ベクトルh(t-1)と、を受け取り、出力ベクトルh(t)を生成する。GRUセル1900は、シグモイド関数デバイス1901及び1902を含み、それらのそれぞれが、出力ベクトルh(t-1)及び入力ベクトルx(t)からの成分に0~1の数を適用する。GRUセル1900はまた、入力ベクトルに双曲線正接関数を適用するためのtanhデバイス1903と、2つのベクトルを乗算するための複数の乗算器デバイス1904、1905、及び1906と、2つのベクトルを加算するための加算器デバイス1907と、1から入力を減算して出力を生成するための相補デバイス1908と、を含む。
【0078】
図20は、GRUセル1900の一実装の一例であるGRUセル2000を示す。読者の便宜のために、GRUセル1900からの同じ採番方法が、GRUセル2000で使用される。
図20から分かるように、シグモイド関数デバイス1901及び1902、並びにtanhデバイス1903はそれぞれ、複数のVMMアレイ2001及び活性化関数ブロック2002を含む。したがって、VMMアレイは、特定のニューラルネットワークシステムで使用されるGRUセルにおいて特に使用されることが分かる。乗算器デバイス1904、1905、1906、加算器デバイス1907、及び相補デバイス1908は、デジタル方式又はアナログ方式で実装される。活性化関数ブロック2002は、デジタル方式、又はアナログ方式で実装され得る。
【0079】
GRUセル2000の代替例(且つGRUセル1900の一実装の別の例)を
図21に示す。
図21において、GRUセル2100は、VMMアレイ2101及び活性化関数ブロック2102を利用しており、シグモイド関数として構成された場合には、0~1の数を適用して、入力ベクトルのそれぞれの成分が出力ベクトルに寄与する程度を制御する。
図21では、シグモイド関数デバイス1901及び1902、並びにtanhデバイス1903は、同じ物理ハードウェア(VMMアレイ2101及び活性化関数ブロック2102)を、時分割多重化された方式で共有する。GRUセル2100はまた、2つのベクトルを乗算するための乗算器デバイス2103と、2つのベクトルを加算するための加算器デバイス2105と、1から入力を減算して出力を生成するための相補デバイス2109と、マルチプレクサ2104と、値h(t-1)
*r(t)を、その値がマルチプレクサ2104を介して乗算器デバイス2103から出力されるときに保持するためのレジスタ2106と、値h(t-1)
*z(t)を、その値がマルチプレクサ2104を介して乗算器デバイス2103から出力されるときに保持するためのレジスタ2107と、値h^(t)
*(1-z((t))を、その値がマルチプレクサ2104を介して乗算器デバイス2103から出力されるときに保持するためのレジスタ2108と、を含む。
【0080】
GRUセル2000がVMMアレイ2001及び活性化関数ブロック2002の複数のセットを含むのに対し、GRUセル2100は、GRUセル2100の実施形態において複数の層を表すために使用される、VMMアレイ2101及び活性化関数ブロック2102の1つのセットのみを含む。GRUセル2100は、GRUセル2000と比較して、VMM及び活性化関数ブロックのために必要とするスペースは1/3で済むので、GRUセル2100は、GRUセル2000よりも必要とするスペースが少ない。
【0081】
GRUシステムは典型的には複数のVMMアレイを含み、これらはそれぞれ、加算器及び活性化関数ブロック及び高電圧生成ブロックなどの、VMMアレイの外側の特定の回路ブロックによって提供される機能を必要とすることが更に理解することができる。各VMMアレイのための別個の回路ブロックを提供することは、半導体デバイス内にかなりの量のスペースを必要とし、幾分非効率的であろう。したがって、以下に記載される実施形態は、VMMアレイ自体の外側に必要とされる回路を削減する。
【0082】
VMMアレイへの入力は、アナログレベル、バイナリレベル、パルス、時間変調パルス、又はデジタルビット(この場合、デジタルビットを適切な入力アナログレベルに変換するためにDACが必要とされる)であり、出力は、アナログレベル、バイナリレベル、タイミングパルス、パルス、又はデジタルビット(この場合、出力アナログレベルをデジタルビットに変換するために出力ADCが必要とされる)であり得る。
【0083】
VMMアレイ内の各メモリセルに関して、各重みWは、単一のメモリセルによって、又は差動セルによって、又は2つのブレンドメモリセル(2つのセルの平均)によって実装することができる。差動セルの場合では、重みWを差動重み(W=W+-W-)として実装するために、2つのメモリセルが必要とされる。2つのブレンドメモリセルの場合は、2つのセルの平均として重みWを実装するために2つのメモリセルが必要とされる。
【0084】
図31は、VMMシステム3100を示す。いくつかの実施形態では、VMMアレイに記憶された重みWは、差動対、W+(正の重み)及びW-(負の重み)、として記憶され、ここでW=(W+)-(W-)となる。VMMシステム3100において、ビット線の半分はW+線として指定され、すなわち、正の重みW+を記憶するメモリセルに接続するビット線であり、複数のビット線の他の半分はW-線として指定され、すなわち、負の重みW-を実装するメモリセルに接続するビット線である。W-線は、W+線の間に交互に散在される。減算演算は、加算回路3101及び3102のような、W+線及びW-線から電流を受け取る加算回路によって実行される。W+線の出力及びW-線の出力を一緒に組み合わせて、(W+、W-)線の全ての対の(W+、W-)セルの各対に対して効果的にW=W+-W-を与える。これまでW+線間に交互に散在するW-線に関して説明してきたが、他の実施形態では、W+線及びW-線は、アレイ内のどこにでも任意に配置され得る。
【0085】
図32は、別の実施形態を示す。VMMシステム3210において、正の重みW+は第1のアレイ3211に実装され、負の重みW-は第2のアレイ3212内に実装され、第2のアレイ3212は第1のアレイとは別個であり、結果として生じる重みは、加算回路3213によって適切に一緒に組み合わされる。
【0086】
図33は、VMMシステム3300を示す。VMMアレイに記憶された重みWは、差動対、W+(正の重み)及びW-(負の重み)として記憶され、ここでW=(W+)-(W-)となる。VMMシステム3300は、アレイ3301及びアレイ3302を備える。アレイ3301及び3302のそれぞれにおける複数のビット線の半分は、W+線として指定され、すなわち、正の重みW+を記憶するメモリセルに接続するビット線であり、アレイ3301及び3302のそれぞれにおける複数のビット線の他の半分はW-線として指定され、すなわち、負の重みW-を実装するメモリセルに接続するビット線である。W-線は、W+線の間に交互に散在される。減算演算は、加算回路3303、3304、3305及び3306のような、W+線及びW-線から電流を受け取る加算回路によって実行される。それぞれのアレイ3301、3302からのW+線の出力及びW-線の出力をそれぞれ一緒に組み合わせて、(W+、W-)線の全ての対の(W+、W-)セルのそれぞれの対に対して効果的にW=W+-W-を与える。更に、それぞれのアレイ3301及び3302からのW値は、それぞれのW値がアレイ3301からのW値からアレイ3302からのW値を引いた結果であり、加算回路3307及び3308からの最終結果が2つの差分値のうちの1つの差分値であることを意味するように、加算回路3307及び3308を介して更に組み合わされ得る。
【0087】
アナログニューラルメモリシステムに使用されるそれぞれの不揮発性メモリセルは、消去・プログラムに対応して、浮遊ゲート内に電荷、すなわち電子の数、を非常に具体的かつ精確な量で保持する。例えば、各浮遊ゲートはN個の異なる値のうちの1つを保持しなければならず、ここで、Nは、各セルによって示され得る異なる重みの数である。Nの例としては、16、32、64、128及び256が挙げられる。
【0088】
同様に、読み出し動作は、N個の異なるレベル間を正確に識別できなければならない。
【0089】
VMMシステムにおいて、アレイからの出力を迅速かつ正確に受け取り、それらの出力によって表される値を識別することができる改善された出力ブロックが必要とされている。
【発明の概要】
【0090】
深層学習人工ニューラルネットワークにおけるアナログニューラルメモリ用の出力回路のための多数の実施形態が開示される。
【0091】
【0092】
【0093】
【0094】
【0095】
【0096】
【0097】
【0098】
【0099】
【0100】
【0101】
【0102】
【0103】
【0104】
【0105】
【0106】
【0107】
【0108】
【0109】
【0110】
【0111】
【0112】
【0113】
【0114】
【0115】
【0116】
【0117】
【0118】
【0119】
【0120】
【0121】
【0122】
【0123】
【0124】
【0125】
【0126】
【0127】
【0128】
【0129】
【0130】
【0131】
【0132】
【0133】
【0134】
【0135】
【0136】
【0137】
【0138】
【0139】
【0140】
【0141】
【図面の簡単な説明】
【0142】
【
図1】人工ニューラルネットワークを例解する図である。
【
図2】先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図3】別の先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図4】別の先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図5】別の先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図6】1つ以上の不揮発性メモリアレイを利用する例示的な人工ニューラルネットワークの様々なレベルを例解する図である。
【
図7】ベクトルマトリックス乗算システムを例解するブロック図である。
【
図8】1つ以上のベクトルマトリックス乗算システムを利用する例示的な人工ニューラルネットワークを例解するブロック図である。
【
図9】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図10】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図11】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図12】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図13】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図14】先行技術の長・短期メモリシステムを示す。
【
図15】長・短期メモリシステムで使用する例示的なセルを示す。
【
図18】先行技術のゲート付き回帰型ユニットシステムを示す。
【
図19】ゲート付き回帰型ユニットシステムでの使用のための例示的なセルを示す。
【
図22】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図23】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図24】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図25】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図26】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図27】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図28】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図29】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図30】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図31】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図32】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図33】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図34】ベクトルマトリックス乗算システムの別の実施形態を示す。
【
図41】シリアルアナログ-デジタル変換器回路を示す。
【
図42】逐次近似レジスタアナログ-デジタル変換器回路を示す。
【
図43】パイプライン型逐次近似レジスタアナログ-デジタル変換器回路を示す。
【
図44A】ハイブリッド逐次近似レジスタ及びシリアルアナログ-デジタル変換器回路を示す。
【
図44B】ハイブリッド逐次近似レジスタ及びシリアルアナログ-デジタル変換器回路を示す。
【
図45】アルゴリズム型アナログ-デジタル変換器ブロックを示す。
【
図46】出力ブロックで使用されるトラッキング基準発生器を示す。
【発明を実施するための形態】
【0143】
本発明の人工ニューラルネットワークは、CMOS技術及び不揮発性メモリアレイの組み合わせを利用する。
【0144】
VMMシステムの概要
図34は、VMMシステム3400のブロック図を示す。VMMシステム3400は、VMMアレイ3401、行デコーダ3402、高電圧デコーダ3403、列デコーダ3404、ビット線ドライバ3405、入力回路3406、出力回路3407、制御論理3408、及びバイアス生成器3409を備える。VMMシステム3400は、チャージポンプ3411、チャージポンプレギュレータ3412、及び高電圧アナログ精度レベル生成器3413を含む、高電圧生成ブロック3410を更に備える。VMMシステム3400は、(プログラム/消去、又は重み調整)アルゴリズムコントローラ3414、アナログ回路3415、制御エンジン3416(限定するものではないが、算術機能、起動機能、埋め込みマイクロコントローラ論理などの特殊機能を含み得る)、及びテスト制御論理3417を更に備える。以下に記載されるシステム及び方法は、VMMシステム3400に実装され得る。
【0145】
入力回路3406は、DAC(デジタル-アナログ変換器)、DPC(デジタル-パルス変換器、デジタル-時間変調パルス変換器)、AAC(電流-電圧変換器、対数変換器などのアナログ-アナログ変換器)、PAC(パルス-アナログレベル変換器)、又は任意の他の種類の変換器などの回路を含み得る。入力回路3406は、正規化、線形若しくは非線形アップ/ダウンスケーリング関数、又は算術関数を実装し得る。入力回路3406は、入力レベルのための温度補償関数を実装し得る。入力回路3406は、ReLU又はシグモイドなどの活性化関数を実装し得る。出力回路3407は、ADC(ニューロンアナログ出力をデジタルビットに変換するための、アナログ-デジタル変換器)、AAC(電流-電圧変換器などのアナログ-アナログ変換器、対数変換器)、APC(アナログ-パルス変換器、アナログ-時間変調パルス変換器)、又は任意の他の種類の変換器などの回路を含み得る。
【0146】
出力回路3407は、整流化線形活性関数(rectified linear activation function、ReLU)又はシグモイドなどの活性化関数を実装し得る。出力回路3407は、ニューロン出力の統計的正規化、正則化、アップ/ダウンスケーリング/ゲイン関数、統計的丸め、又は算術関数(例えば、加算、減算、除算、乗算、シフト、ログ)を実装し得る。出力回路3407は、アレイの電力消費をほぼ一定に保つために、又はIVの傾斜をほぼ同じに保つことになどによってアレイ(ニューロン)出力の精度を高めるために、ニューロン出力又はアレイ出力(ビット線出力など)のための温度補償関数を実装し得る。
【0147】
図35Aは、出力ブロック3500を示す。出力ブロックは、電流-電圧変換器(ITV)3501-1~3501-i(iは、出力ブロック3500が受け取るビット線W+及びW-の対の数である)と、マルチプレクサ3502と、サンプルホールド回路3503-1~3503-iと、チャネルマルチプレクサ3504と、アナログーデジタル変換器(ADC)3505と、を含む。出力ブロック3500は、アレイ内のビット線対から差動重み出力W+及びW-を受け取り、最終的に、ADC3505からのビット線対(例えば、W+線及びW-線)のうちの1つの出力を表すデジタル出力、DOUTxを生成する。
【0148】
電流-電圧変換器3501-1~3501-iのそれぞれは、アナログビット線電流信号BLw+及びBLw-(それぞれ、入力並びに記憶されたW+重み及びW-重みに応答して生成されるビット線出力である)を受け取り、それらを差動電圧ITVO+及びITVO-に変換する。
【0149】
次いで、ITVO+及びITVO-はマルチプレクサ3502によって受け取られ、マルチプレクサ3502は、電流-電圧変換器3501-1~3501-Iからの出力をS/H回路3503-1~3503kに時分割多重化し、ここでkはiと同じであるか又は異なり得る。
【0150】
S/H回路3503-1~3503-kはそれぞれ、その受け取った差動電圧をサンプリングし、それらを差動出力として保持する。
【0151】
次いで、チャネルマルチプレクサ3504は、制御信号を受信して、ビット線W+チャネル及びW-チャネルのうちの1つ、すなわち、ビット線対のうちの1つを選択し、それぞれのサンプルホールド回路3503によって保持された差動電圧をADC3505に出力し、ADC3505は、それぞれのサンプルホールド回路3503によって出力されたアナログ差動電圧を1組のデジタルビット、DOUTxに変換する。示されるように、S/H3503は、複数のITV回路3501にわたって共有され得、ADC3505は、時分割多重化方式で複数のITV回路で動作し得る。それぞれのS/H3503は、単なるコンデンサであるか又はバッファ(例えば、演算増幅器)が後続するコンデンサであり得る。
【0152】
ADC3505は、ハイブリッドADCアーキテクチャとすることができ、これは、変換を実行するために2つ以上のADCアーキテクチャを有することを意味する。例えば、DOUTxが8ビット出力である場合、ADC3505は、ビットB7~B4を生成するためのADCサブアーキテクチャと、差動入力ITVSH+及びITVSH-からビットB3~B0を生成するための別のADCサブアーキテクチャと、を含み得る。すなわち、ADC回路3505は、複数のADCサブ0アーキテクチャを含み得る。
【0153】
任意選択で、あるADCサブアーキテクチャは、全てのチャネル間では共有され得るが、別のADCサブアーキテクチャは、全てのチャネル間で共有されない。
【0154】
別の実施形態では、チャネルmux3504及びADC3505は除去され得、代わりに、出力は、演算増幅器によってバッファリングされ得る、S/H3503からのアナログ差動電圧であり得る。例えば、アナログ電圧の使用は、全アナログニューラルネットワーク(すなわち、ニューラルメモリアレイのためにデジタル出力又はデジタル入力が必要とされないもの)において実装され得る。
【0155】
図35Bは、出力ブロック3550を示す。出力ブロックは、電流-電圧変換器(ITV)3551-1~3551-i(iは、出力ブロック3550が受け取るビット線W+及びW-の対の数である)と、マルチプレクサ3552と、差動-シングルエンド変換器Diff-to-S変換器3553と、サンプルホールド回路3554-1~3554-k(kはiと同じか又は異なる)と、チャネルマルチプレクサ3554と、アナログ-デジタル変換器(ADC)3555と、を含む。Diff-to-S変換器3553は、mux3552によって提供されるITV3551信号からの差動出力をシングルエンド出力に変換するために使用される。シングルエンド出力は、次いで、S/H3554、mux3555、及びADC3556に入力される。
【0156】
図36は、出力ブロック3600を示す。出力ブロックは、加算回路3601-1~3601-i(カレントミラー回路など。iは、出力ブロック3600が受け取るビット線BLw+及びBLw-の対の数である)と、電流-電圧変換器回路(ITV)3602-1~3602-iと、マルチプレクサ3603と、サンプルホールド回路3604-1~3604-kと(kはiと同じであるか又は異なる)、チャネルマルチプレクサ3605と、ADC3606と、を含む。出力ブロック3600は、アレイ内のビット線対から差動重み出力BLw+及びBLw-を受け取り、最終的に、一度にビット線対のうちの1つの出力を表す、ADC3606からのデジタル出力、DOUTxを生成する。
【0157】
電流加算回路3601-1~3601-iは、それぞれ、ビット線対から電流を受け取り、BLw-からBLw-値を減算し、その結果を加算電流として出力する。
【0158】
電流-電圧変換器3602-1~3602-iは、出力加算電流を受け取り、それぞれの加算電流を差動電圧ITVO+及びITVO-に変換し、次いで、差動電圧は、マルチプレクサ3603によって受け取られ、サンプルホールド回路3604-1~3604-kに選択的に提供される。
【0159】
それぞれのサンプルホールド回路3604は、差動電圧ITVOMX+及びITVOMX-を受け取り、受け取った差動電圧をサンプリングし、それらを差動電圧出力OSH+及びPSH-として保持する。
【0160】
チャネルマルチプレクサ3605は、ビット線対のうちの1つ、すなわち、チャネルBLw+及びBLw-を選択するための制御信号を受信し、それぞれのサンプルホールド回路3604によって保持された電圧をADC3606に出力し、ADC3606は、電圧をDOUTxとして1組のデジタルビットに変換する。
【0161】
図37Aは、電流-電圧変換器3700を示す。電流-電圧変換器3700は、示されるように構成された演算増幅器3701及び3702と、可変抵抗器3703、3704、及び3705と、を含む。電流-電圧変換器3700は、可変電流源として示される差動出力電流、W+ビット線からのBLw+及びW-ビット線からのBLw-を受け取り、シングルエンド出力Voutを生成する。出力電圧Voutは、= (BLw+ - Blw-)
* Rであり、抵抗器3703、3704、及び3705はそれぞれ、Rに等しい値を有する。
図37Aの可変抵抗器は、出力をスケーリングするために使用され得る。
【0162】
図37Bは、電流-電圧変換器3710を示す。電流-電圧変換器3710は、示されるように構成された演算増幅器3711、3712、及び3713と、可変抵抗器3714、3715、3716、及び3717と、を含む。電流-電圧変換器3710は、可変電流源として示されるW+ビット線からの出力電流BLw+を受け取り、その線の出力Vout+を生成し、可変電流源として示されるW-ビット線からの出力電流Blw-を受け取り、その線の出力Vout-を生成する。したがって、出力ブロック3700とは異なり、出力ブロック3710は、シングルエンド出力ではなく、それぞれ差分値BLw+及びBLw-を表す差動電圧を生成する。出力電圧はVout+ = Iw+
*R及びVout- = -Rw-
*Rであり、抵抗器3714、3715、3716、及び3717はそれぞれRに等しい値を有する。
図37Bの可変抵抗器は、出力をスケーリングするために使用され得る。
【0163】
任意選択で、差動出力電圧Vout+及びVout-は、ADC3718に入力され得、ADC3718は、それらを1組のデジタル出力ビット、Doutxに変換する。
【0164】
図38Aは、電流-電圧変換器3800を示す。電流-電圧変換器3800は、示されるように構成された、演算増幅器3801及び3802と、可変コンデンサ3803、3805、及び3806と、被制御スイッチ3804及び3807と、を含む。電流-電圧変換器3800は、可変電流源として示されるW+ビット線からの差動出力電流BLw+を受け取り、可変電流源として示されるW-ビット線からのBLw-を受け取り、シングルエンド出力Voutを生成する。出力電圧Voutは、= (Iw+ - Iw-)
* t_integration/Cであり、コンデンサ3803、3805、及び3806はそれぞれ、Cに等しい静電容量値を有する。制御回路(図示せず)は、スイッチ3804、3807の開閉を制御して、積分時間t_integrationを提供する。
【0165】
図38Bは、電流-電圧変換器3810を示す。電流-電圧変換器3810は、演算増幅器3811、3812、及び3813と、可変コンデンサ3815、3816、3817、及び3819と、スイッチ3814、3818、及び3820と、を含む。電流-電圧変換器3810は、可変電流源として示されるW+ビット線からの出力電流BLw+を受け取り、その線の出力Vout+を生成し、可変電流源として示されるW-ビット線からの出力電流BLw-を受け取り、その線のVout-を生成する。したがって、出力ブロック3800とは異なり、出力ブロック3810は、それぞれの差分値BLw+及びBLw-を表す2つの電圧を生成する。出力電圧はVout+ = BLw+
* t_integration/C及びVout- = BLw-
* t_integration/Cであり、コンデンサ3815、3816、3817、及び3819はそれぞれ、Cに等しい静電容量値を有する。制御回路(図示せず)は、スイッチ3814、3818、及び3820の開閉を制御して、積分時間t_integrationを提供する。
【0166】
任意選択で、差動出力電圧Vout+及びVout-は、ADC3821に入力され得、ADC3821は、それらを1組のデジタル出力ビット、Doutxに変換する。
【0167】
図39Aは、電流-電圧変換器3900を示す。電流-電圧変換器3900は、示されるように構成された演算増幅器3901と、可変積分抵抗器3902及び3903と、被制御スイッチ3904、3905、3906、及び3907と、サンプルホールドコンデンサ3908及び3909と、を含む。電流-電圧変換器3900は、W+ビット線からの差動電流BLw+及びW-ビット線からのBLw-を受け取り、電圧Vout+及びVout-をそれぞれ出力する。出力電圧はVout+ = (Blw+)
* R及びVout- = (BLw-)
* Rであり、抵抗器3902及び3903はそれぞれRに等しい値を有する。コンデンサ3908及び3909はそれぞれ、抵抗器3902及び3903並びに入力電流が遮断されると出力電圧を保持するための保持S/Hコンデンサとして機能する。制御回路(図示せず)は、スイッチ3904、3905、3906、及び3907の開閉を制御して、積分時間を提供する。
【0168】
任意選択で、差動出力電圧Vout+及びVout-は、ADC3910に入力され得、ADC3910は、それらを1組のデジタル出力ビット、Doutxに変換する。
【0169】
図39Bは、差動電圧-シングルエンド電圧変換器(Diff-to-S)3950を示す。Diff-to-S変換器3950は、演算増幅器3951と、可変積分抵抗器3952及び3953と、を含む。出力電圧Vout-(Vin1-Vin2)
*(R_3852/R_3953)。これは、例えば、
図35Bのブロック3553として使用される。
【0170】
図40Aは、ハイブリッド出力変換ブロックである出力ブロック4000を示す。出力ブロック400は、示されるように、SAR及びシリアルADCサブアーキテクチャなどの複数のサブアーキテクチャを含む。出力ブロック4000は、差動信号Iw+及びIw-を受信する。逐次近似レジスタアナログ-デジタル変換器SAR4001は、差動信号Iw+及びIw-を上位デジタルビットに変換し、次いで、シリアルブロックADC4002は、上位ビット変換後に残る信号を下位ビットに変換し、全ての出力デジタルビットをまとめて出力する。一例では、8ビットADC変換のために、SAR ADC4001は、受け取った差動電圧の一部をMSBビットB7~B4に変換し、シリアルADC4002は、受け取った差動電圧の一部をLSBビットB3~B0に変換する。
【0171】
図40Bは、出力ブロック4010を示す。出力ブロック4010は、示されるように、アルゴリズム型ADC及びシリアルADCサブアーキテクチャなどの複数のサブアーキテクチャを含む。出力ブロック4010は、差動信号Iw+及びIw-を受信する。アルゴリズム型アナログ-デジタル変換器4003は、差動信号Iw+及びIw-を上位デジタルビットに変換し、次いで、シリアルADCブロック4004は、上位ビット変換後に残る信号を下位ビットに変換し、全ての出力デジタルビットをまとめて出力する。一例では、8ビットADC変換のために、アルゴリズム型ADC4003は、受け取った差動電圧の一部をMSBビットB7~B4に変換し、シリアルADC4004は、受け取った差動電圧の一部をLSBビットB3~B0に変換する。
【0172】
図40Cは、出力ブロック4020を示す。出力ブロック4020は、差動信号Iw+及びIw-を受信する。出力ブロック4020は、異なる変換方式(
図40A及び
図40Bに示されるものなど)を1つのブロックに組み合わせることによって、差動信号Iw+及びIw-をデジタルビットに変換する、ハイブリッドアナログ-デジタル変換器を含む。
【0173】
図41は、構成可能なシリアルアナログ-デジタル変換器4100を示す。シリアルアナログ-デジタル変換器4100は、可変電流源として示されるニューロン出力電流I
NEUを積分コンデンサ4102(Cint)に積分する積分器4170を含む。積分器4170は、差動増幅器4101と、被制御スイッチ4108及び4110と、積分時間を提供するためにスイッチ4108及び4110の開閉を制御する制御回路(図示せず)と、を含む。
【0174】
一実施形態では、VRAMP4150が、コンパレータ4104の反転入力に提供される。デジタル出力(カウント値)4121は、EC4105として示されるコンパレータ4104の出力が極性を切り替えるまでVRAMP4150をランプすることによって生成され、カウンタ4120は、VRAMP4150のランプの開始からクロックパルスをカウントし、クロック4141の通過がパルス系列4142としてカウンタ4120に到達するのを阻止するANDゲート4140に応答して、コンパレータ4104の出力が極性を切り替えたときに停止する。
【0175】
別の実施形態では、VREF4155が、コンパレータ4104の反転入力に提供される。VC4110は、VOUT4103がVREF4155に到達するまでランプ電流4151(IREF)によってランプダウンされ、その時点で、コンパレータ4104の出力EC4105は、極性を切り替えてカウンタ4120のカウントを無効にする。したがって、カウンタ4120は、スイッチS2の閉鎖とともに有効になる(それは、S2の開放の後であり、コンパレータ4104の出力、EC4105が極性を切り替えるときに無効になる)。S3は、動作の開始時に初期化(等化)するために使用される。(nビット)ADC4100は、目標アプリケーションに応じて、より低い精度(nビットよりも少ない)又はより高い精度(nビットよりも多い)を有するように構成可能である。精度のコンフィギュアビリティは、限定することなく、コンデンサ4102の静電容量、電流4151(IREF)、VRAMP4150のランピング速度、又はクロック4141のクロック周波数を構成することによって行われる。
【0176】
別の実施形態では、VMMアレイのADC回路は、nビットよりも低い精度を有するように構成され、別のVMMアレイのADC回路は、ビットよりも高い精度を有するように構成される。
【0177】
別の実施形態では、1つのニューロン(アレイ出力)回路のシリアルADC回路4100の1つのインスタンスは、隣接するニューロン回路のシリアルADC回路4100の別のインスタンスと組み合わせて、シリアルADC回路4100の2つのインスタンスの積分コンデンサ4102を組み合わせることによってなど、nビットよりも高い精度を有するADC回路を生成するように構成されている。
【0178】
図42は、ニューロン出力回路(アレイ出力回路)に使用される構成可能なSAR(逐次近似レジスタ)アナログ-デジタル変換器4200を示す。この回路は、バイナリコンデンサを使用した電荷再分散に基づく、逐次近似変換器である。逐次近似変換器は、バイナリCDAC(コンデンサデジタル-アナログ変換器)4201、コンパレータ4202、並びにSAR論理及びレジスタ4203を含む。示されるように、GndV4204は、低電圧基準レベル、例えば、接地レベルである。SARロジック及びレジスタ4203は、デジタル出力4206を提供する。他の非バイナリコンデンサ構造は、重み付けされた基準電圧又は出力による補正を用いて実装され得る。
【0179】
図43は、次のSAR ADCと組み合わせてパイプライン方式でビット数を増加させるために使用され得るパイプライン型SAR ADC回路4300を示す。SAR ADC回路4300は、バイナリCDAC4301、コンパレータ4302(オペアンプ又はコンパレータとして動作する)、オペアンプ/コンパレータ4303、SAR論理及びレジスタ4304を含む。示されるように、GndV3104は、低電圧基準レベル、例えば、接地レベルである。SAR論理及びレジスタ4304は、デジタル出力4306を提供する。Vinは入力電圧にあり、VREFは基準電圧であり、GndVは接地電圧などの低電圧である。V残余は、コンデンサ4305によって生成され、SAR ADC変換シーケンスの次のステージへの入力として提供される。
【0180】
図44Aは、ハイブリッド方式でビット数を増加させるために使用され得るハイブリッドSAR+シリアルADC回路4400を示す。SAR ADC回路4400は、バイナリCDAC4401と、コンパレータ4402sと、SAR論理及びレジスタ4403と、を含む。示されるように、GndVは、低電圧基準レベル、例えば、SAR ADC動作中の接地レベルである。SAR論理及びレジスタ4403は、デジタル出力を提供する。Vinは入力電圧である。VREFRAMPは、適切な制御回路及び信号多重化(図示せず)を用いたシリアルADC動作中に、基準ランプ電圧として使用される。
【0181】
使用され得る他のハイブリッドADCアーキテクチャは、SAR ADC+シグマデルタADC、フラッシュADC+シリアルADC、パイプライン型ADC+シリアルADC、シリアルADC+SAR ADC、及び他のアーキテクチャを含む。
【0182】
図44Bは、ハイブリッド方式でビット数を増加させるために使用され得るハイブリッド差動SAR+シリアルADC回路4400を示す。
【0183】
図45は、アルゴリズム型ADC出力ブロック4500を示す。出力ブロック4500は、示されるように構成された、サンプルホールド回路4501と、1ビットアナログ-デジタル変換器4502と、1ビットデジタル-アナログ変換器4503と、加算器4504と、演算増幅器4505と、被制御スイッチ4506及び4507と、を含む。2の利得を提供するように構成された演算増幅器4505が示されている。
【0184】
【0185】
トラッキング電圧基準発生器4600は、バイアス電流4601及び可変抵抗器4602を含み、出力VREFx4603=i*Rを生成し、ここで、iはバイアス電流4601からの電流であり、Rは可変抵抗器4602の抵抗である。
【0186】
本明細書で使用される場合、「の上方に(over)」及び「に(on)」という用語は両方とも、「に直接」(中間材料、要素、又は間隙がそれらの間に配設されていない)、及び「に間接的に」(中間材料、要素、又は間隙がそれらの間に配設されている)を包括的に含むことに留意されるべきである。同様に、「隣接した」という用語は、「直接隣接した」(中間材料、要素、又は間隙がそれらの間に配設されていない)、及び「間接的に隣接した」(中間材料、要素、又は間隙がそれらの間に配設されている)を含み、「に取り付けられた」は、「に直接取り付けられた」(中間材料、要素、又は間隙がそれらの間に配設されていない)、及び「に間接的に取り付けられた」(中間材料、要素、又は間隙がそれらの間に配設されている)を含み、「電気的に結合された」は、「に直接電気的に結合された」(要素を一緒に電気的に接続する中間材料又は要素がそれらの間にない)、及び「に間接的に電気的に結合された」(要素を一緒に電気的に接続する中間材料又は要素がそれらの間にある)を含む。例えば、要素を「基板の上方に」形成することは、その要素を基板に直接、中間材料/要素をそれらの間に伴わずに形成すること、及びその要素を基板に間接的に1つ以上の中間材料/要素をそれらの間に伴って形成することを含み得る。
【手続補正書】
【提出日】2023-12-19
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】0050
【補正方法】変更
【補正の内容】
【0050】
図11は、
図2に示されるメモリセル210に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1100を示す。VMMアレイ1100は、不揮発性メモリセルのメモリアレイ1103と、第1の不揮発性基準メモリセルの基準アレイ1101と、第2の不揮発性基準メモリセルの基準アレイ1102と、を含む。基準アレイ1101及び1102は、VMMアレイ1100の行方向に延びる。VMMアレイは、VMMアレイ1100においてワード線が垂直方向に延びることを除いて、VMM1000と同様である。ここで、入力はワード線(WLA0、WLB0、WLA1、WLB
1、WLA2、WLB2、WLA3、WLB3)に提供され、出力は、読み出し動作中にソース線(SL0、SL1)に現れる。各ソース線の電流は、その特定のソース線に接続されたメモリセルからの全ての電流の合計関数を実行する。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0056
【補正方法】変更
【補正の内容】
【0056】
図13は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1300を示す。VMMアレイ1300は、不揮発性メモリセルのメモリアレイ1303と
、第1の不揮発性基準メモリセル
の基準アレイ1301と、第2の不揮発性基準メモリセルの基準アレイ1302と、を備える。EG線EGR0、EG0、EG1、及びEGR1は垂直に延び、CG線CG0、CG1、CG2、及びCG3並びにSL線WL0、WL1、WL2、及びWL3は水平に延びる。VMMアレイ1300は、VMMアレイ1300が双方向チューニングを実装することを除いてVMMアレイ1400と同様であり、それぞれ個々のセルは、個別のEG線の使用により、浮遊ゲートの所望の電荷量に達するために、必要に応じて完全に消去され、部分的にプログラムされ、部分的に消去され得る。示されるように、基準アレイ1301及び1302は、端子BLR0、BLR1、BLR2及びBLR3における入力電流を制御ゲート電圧CG0、CG1、CG2及びCG3に変換し(マルチプレクサ1314を介したダイオード接続された基準セルの作用を通じて)、これらの電圧は行方向でメモリセルに印加される。電流出力(ニューロン)は、ビット線BL0~BLN中にあり、各ビット線は、その特定のビット線に接続された不揮発性メモリセルからの全ての電流を合計する。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0152
【補正方法】変更
【補正の内容】
【0152】
ADC3505は、ハイブリッドADCアーキテクチャとすることができ、これは、変換を実行するために2つ以上のADCアーキテクチャを有することを意味する。例えば、DOUTxが8ビット出力である場合、ADC3505は、ビットB7~B4を生成するためのADCサブアーキテクチャと、差動入力ITVSH+及びITVSH-からビットB3~B0を生成するための別のADCサブアーキテクチャと、を含み得る。すなわち、ADC回路3505は、複数のADCサブアーキテクチャを含み得る。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0155
【補正方法】変更
【補正の内容】
【0155】
図35Bは、出力ブロック3550を示す。出力ブロックは、電流-電圧変換器(ITV)3551-1~3551-i(iは、出力ブロック3550が受け取るビット線W+及びW-の対の数である)と、マルチプレクサ3552と、差動-シングルエンド変換器Diff-to-S変換器3553と、サンプルホールド回路3554-1~3554-k(kはiと同じか又は異なる)と、チャネルマルチプレクサ355
5と、アナログ-デジタル変換器(ADC)355
6と、を含む。Diff-to-S変換器3553は、mux3552によって提供されるITV3551信号からの差動出力をシングルエンド出力に変換するために使用される。シングルエンド出力は、次いで、S/H3554、mux3555、及びADC3556に入力される。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0180
【補正方法】変更
【補正の内容】
【0180】
図44Aは、ハイブリッド方式でビット数を増加させるために使用され得るハイブリッドSAR+シリアルADC回路4400を示す。SAR ADC回路4400は、バイナリCDAC4401と、コンパレータ440
2と、SAR論理及びレジスタ4403と、を含む。示されるように、GndVは、低電圧基準レベル、例えば、SAR ADC動作中の接地レベルである。SAR論理及びレジスタ4403は、デジタル出力を提供する。Vinは入力電圧である。VREFRAMPは、適切な制御回路及び信号多重化(図示せず)を用いたシリアルADC動作中に、基準ランプ電圧として使用される。
【国際調査報告】