(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-07-18
(45)【発行日】2024-07-26
(54)【発明の名称】アナログニューラルメモリにおける書き込みと検証との同時動作
(51)【国際特許分類】
G11C 16/34 20060101AFI20240719BHJP
G06F 12/06 20060101ALI20240719BHJP
【FI】
G11C16/34 140
G06F12/06 525B
(21)【出願番号】P 2023512707
(86)(22)【出願日】2021-03-04
(86)【国際出願番号】 US2021020963
(87)【国際公開番号】W WO2022046171
(87)【国際公開日】2022-03-03
【審査請求日】2023-04-17
(32)【優先日】2020-08-25
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-03-02
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】500147506
【氏名又は名称】シリコン ストーリッジ テクノロージー インコーポレイテッド
【氏名又は名称原語表記】SILICON STORAGE TECHNOLOGY, INC.
(74)【代理人】
【識別番号】110000626
【氏名又は名称】弁理士法人英知国際特許商標事務所
(72)【発明者】
【氏名】トラン、ヒュー バン
【審査官】後藤 彰
(56)【参考文献】
【文献】特開2010-113742(JP,A)
【文献】特開2002-133899(JP,A)
【文献】特表2019-517138(JP,A)
【文献】特開2012-128918(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G11C 16/34
G06F 12/06
(57)【特許請求の範囲】
【請求項1】
アナログニューラルメモリシステムであって、
不揮発性メモリセルの第1のアレイを備える、第1のバンクと、
不揮発性メモリセルの第2のアレイを備える、第2のバンクと、
前記第1のバンク及び前記第2のバンクによって共有される、書き込み回路と、
前記第1のバンク及び前記第2のバンクによって共有される、検知回路と、
前記第1のバンク及び前記第2のバンクのうちの一方に対して前記書き込み回路を使用する書き込み動作、並びに前記第1のバンク及び前記第2のバンクのうちの他方に対して前記検知回路を使用する検証動作を同時に実行するための制御回路と、を備え
、
前記第1のバンクは、第1の書き込みマルチプレクサを介して前記書き込み回路に結合され、かつ第1の読み出しマルチプレクサを介して前記検知回路に結合され、
前記第2のバンクは、第2の書き込みマルチプレクサを介して前記書き込み回路に結合され、かつ第2の読み出しマルチプレクサを介して前記検知回路に結合される、アナログニューラルメモリシステム。
【請求項2】
前記第1のバンク内の前記不揮発性メモリセル及び前記第2のバンク内の前記不揮発性メモリセルは、共有ゲート不揮発性メモリセルである、請求項1に記載のシステム。
【請求項3】
前記第1のバンク内の前記不揮発性メモリセル及び前記第2のバンク内の前記不揮発性メモリセルは、スプリットゲート不揮発性メモリセルである、請求項1に記載のシステム。
【請求項4】
前記第1のバンクは、列マルチプレクサを介して前記第2のバンクに結合される、請求項
1に記載のシステム。
【請求項5】
不揮発性メモリセルの第1のアレイを備える第1のバンクと、不揮発性メモリセルの第2のアレイを備える第2のバンクと、を備える、アナログニューラルメモリにおいて、書き込みと検証との同時動作を実行する方法であって、前記方法は、
前記第1のバンク及び前記第2のバンクのうちの一方に対する
前記第1のバンク及び前記第2のバンクによって共有される書き込み回路を使用する書き込み動作、並びに前記第1のバンク及び前記第2のバンクのうちの他方に対する
前記第1のバンク及び前記第2のバンクによって共有される検知回路を使用する検証動作を同時に実行するステップを含
み、
前記第1のバンクは、第1の書き込みマルチプレクサを介して前記書き込み回路に結合され、かつ第1の読み出しマルチプレクサを介して前記検知回路に結合され、
前記第2のバンクは、第2の書き込みマルチプレクサを介して前記書き込み回路に結合され、かつ第2の読み出しマルチプレクサを介して前記検知回路に結合される、方法。
【請求項6】
前記第1のバンク内の前記不揮発性メモリセル及び前記第2のバンク内の前記不揮発性メモリセルは、共有ゲート不揮発性メモリセルである、請求項
5に記載の方法。
【請求項7】
前記第1のバンク内の前記不揮発性メモリセル及び前記第2のバンク内の前記不揮発性メモリセルは、スプリットゲート不揮発性メモリセルである、請求項
5に記載の方法
。
【発明の詳細な説明】
【技術分野】
【0001】
(優先権の主張)
本出願は、2020年8月25日出願の「Concurrent Write And Verify Operations In An Analog Neural Memory」と題された米国仮特許出願第63/070,051号、及び2021年3月2日出願の「Concurrent Write And Verify Operations In An Analog Neural Memory」と題された米国特許出願第17/190,376号に対する優先権を主張する。
【0002】
(発明の分野)
書き込みと検証との同時動作を可能にするアナログニューラルメモリアレイ及び関連する回路の多数の実施形態が開示される。
【背景技術】
【0003】
人工ニューラルネットワークは、生物学的ニューラルネットワーク(動物の中枢神経系、特に脳)を模倣しており、多数の入力に依存し得、かつ、一般的に未知である関数を推定する又は近似するために使用される。人工ニューラルネットワークは、概して、メッセージを交換する相互接続した「ニューロン」の層を含む。
【0004】
図1は人工ニューラルネットワークを示しており、図中、円は、入力又はニューロンの層を表す。接続(シナプスと呼ばれる)は、矢印によって表され、経験に基づいてチューニングされ得る数値の重みを有する。これにより、人工ニューラルネットワークは入力に適応し、学習可能になる。典型的には、人工ニューラルネットワークは、複数の入力の層を含む。典型的には、1つ以上のニューロンの中間層、及びニューラルネットワークの出力を提供するニューロンの出力層が存在する。各レベルでニューロンは、シナプスから受信したデータに基づいて個々に又は集合的に決定を行う。
【0005】
高性能情報処理用の人工ニューラルネットワークの開発における主要な課題の1つは、適切なハードウェア技術の欠如である。実際には、実用人工ニューラルネットワークは、非常に多数のシナプスに依拠しており、これによりニューロン間の高い接続性、すなわち、非常に高度な計算処理の並列化が可能となる。原理的には、このような複雑性は、デジタルスーパーコンピュータ又は専用グラフィックプロセッシングユニットクラスタによって実現が可能である。しかしながら、高コストに加え、これらのアプローチはまた、生物学的ネットワークが主として低精度のアナログ計算を実施するのではるかに少ないエネルギーしか消費しないのと比較して、エネルギー効率が劣っていることに悩まされている。人工ニューラルネットワークにはCMOSアナログ回路が使用されてきたが、ほとんどのCMOS実装シナプスは、多数のニューロン及びシナプスを前提とすると、嵩高過ぎていた。
【0006】
出願人は以前に、参照により組み込まれる米国特許公開第2017/0337466号として公開された米国特許出願第15/594,439号において、シナプスとして1つ以上の不揮発性メモリアレイを利用する人工(アナログ)ニューラルネットワークを開示した。不揮発性メモリアレイは、アナログニューロモーフィックメモリとして動作する。本明細書で使用される場合、ニューロモーフィックという用語は、神経システムのモデルを実装する回路を意味する。アナログニューロモーフィックメモリは、第1の複数の入力を受信して、それから第1の複数の出力を生成するように構成されている第1の複数のシナプス、及び第1の複数の出力を受信するように構成された第1の複数のニューロンを含む。第1の複数のシナプスは複数のメモリセルを含み、各メモリセルは、半導体基板内に形成された、間にチャネル領域が延在する離間したソース領域及びドレイン領域と、チャネル領域の第1の部分の上方に絶縁されて配設される浮遊ゲートと、チャネル領域の第2の部分の上方に絶縁されて配設される非浮遊ゲートと、を含む。複数のメモリセルの各々は、浮遊ゲートの多くの電子に対応する重み値を記憶するように構成されている。複数のメモリセルは、第1の複数の入力に、記憶された重み値を乗算して第1の複数の出力を生成するように構成される。この様式で配置されるメモリセルのアレイは、ベクトルマトリックス乗算(vector by matrix multiplication、VMM)アレイと称され得る。任意選択で、メモリセルは、不揮発性メモリセルである。
【0007】
ここで、VMMで使用され得る異なる不揮発性メモリセルの例について論じる。
<<不揮発性メモリセル>>
【0008】
様々なタイプの既知の不揮発性メモリセルは、VMMアレイで使用され得る。例えば、参照により本明細書に組み込まれる米国特許第5,029,130号(「’130号特許」)は、フラッシュメモリセルの一種であるスプリットゲート不揮発性メモリセルのアレイを開示する。このようなメモリセル210を
図2に示す。各メモリセル210は、半導体基板12内に形成されたソース領域14及びドレイン領域16を含み、ソース領域14とドレイン領域16との間にはチャネル領域18がある。浮遊ゲート20は、チャネル領域18の第1の部分の上方に絶縁されて形成され(並びに、チャネル領域18の第1の部分の導電性を制御して)、ソース領域14の一部分の上方にかけて形成される。ワード線端子22(典型的には、ワード線に結合される)は、チャネル領域18の第2の部分の上方に絶縁されて配設される、(並びに、チャネル領域18の第2の部分の導電性を制御する)第1の部分と、浮遊ゲート20の上方で上に延在する第2の部分と、を有する。浮遊ゲート20及びワード線端子22は、ゲート酸化物によって基板12から絶縁される。ビット線端子24はドレイン領域16に結合される。
【0009】
ワード線端子22に高圧正電圧を加えることによって、メモリセル210に対して消去が行われ(電子が浮遊ゲートから除去される)、これによって、浮遊ゲート20の電子は、浮遊ゲート20からワード線端子22までそれらの間にある絶縁体の中をファウラーノルドハイム(Fowler-Nordheim)トンネリングを介して通過する。
【0010】
メモリセル210は、ワード線端子22に正電圧、及びソース領域14に正電圧を加えることによってプログラムされる(電子が浮遊ゲートに印加される)。電子電流は、ドレイン領域16からソース領域14(ソース線端子)に向かって流れる。電子は加速し、ワード線端子22と浮遊ゲート20との間の間隙に達すると、励起される(発熱する)。熱せられた電子の一部は、浮遊ゲート20からの静電引力に起因して、浮遊ゲート20にゲート酸化物を介して注入される。
【0011】
メモリセル210は、ドレイン領域16及びワード線端子22に正の読み出し電圧を加える(ワード線端子の下方のチャネル領域18の部分をオンにする)ことによって、読み出される。浮遊ゲート20が正に帯電する(すなわち、電子を消去する)と、浮遊ゲート20の下方のチャネル領域18の部分も同様にオンになり、電流はチャネル領域18を流れ、これは、消去された状態つまり「1」の状態として検知される。浮遊ゲート20が負に帯電する(すなわち、電子でプログラムされる)と、浮遊ゲート20の下方のチャネル領域の部分はほとんど又は完全にオフになり、電流はチャネル領域18を流れず(又はほとんど流れず)、これは、プログラムされた状態つまり「0」の状態として検知される。
【0012】
表1は、読み出し、消去、及びプログラム動作を実行するためのメモリセル110の端子に印加され得る典型的な電圧範囲を示す。
表1:
図2のフラッシュメモリセル210の動作
【表1】
「読み出し1」は、セル電流がビット線に出力される読み出しモードである。「読み出し2」は、セル電流がソース線端子に出力される読み出しモードである。
【0013】
図3は、制御ゲート(control gate、CG)端子28を追加した、
図2のメモリセル210と同様のメモリセル310を示す。制御ゲート端子28は、プログラミング中に高電圧(例えば、10V)、消去中に低又は負電圧(例えば、0v/-8V)、読み出し中に低又は中程度電圧(例えば、0v/2.5V)でバイアスされる。他の端子は、
図2の端子と同様にバイアスされる。
【0014】
図4は、ソース領域14と、ドレイン領域16と、チャネル領域18の第1の部分の上方にある浮遊ゲート20と、チャネル領域18の第2の部分の上方にある選択ゲート22(典型的には、ワード線、WL、に結合される)と、浮遊ゲート20の上方にある制御ゲート28と、ソース領域14の上方にある消去ゲート30と、を備える、4ゲートメモリセル410を示す。この構成は、あらゆる目的のため参照により本明細書に組み込まれる、米国特許第6,747,310号に記載されている。ここで、全てのゲートは、浮遊ゲート20を除いて、非浮遊ゲートであり、つまり、それらは電圧源に電気的に接続される又は接続可能である。プログラミングは、熱せられた電子がチャネル領域18から浮遊ゲート20にその電子自体を注入することによって実行される。消去は、電子が浮遊ゲート20から消去ゲート30へトンネリングすることによって実行される。
【0015】
表2は、読み出し、消去、及びプログラム動作を実行するためのメモリセル410の端子に印加され得る典型的な電圧範囲を示す。
表2:
図4のフラッシュメモリセル410の動作
【表2】
「読み出し1」は、セル電流がビット線に出力される読み出しモードである。「読み出し2」は、セル電流がソース線端子に出力される読み出しモードである。
【0016】
図5は、メモリセル510が消去ゲートEG端子を含まないことを除いて、
図4のメモリセル410と同様のメモリセル510を示す。消去は、基板18を高電圧にバイアスし、制御ゲートCG端子28を低電圧又は負電圧にバイアスすることによって実行される。代替的に、ワード線端子22を正電圧にバイアスし、制御ゲート端子28を負電圧にバイアスすることによって、消去が実行される。プログラミング及び読み出しは、
図4のものと同様である。
【0017】
図6は、別の種類のフラッシュメモリセルである、3ゲートメモリセル610を示す。メモリセル610は、メモリセル610が別個の制御ゲート端子を有しないことを除いて、
図4のメモリセル410と同一である。(消去ゲート端子の使用を通じて消去が起こる)消去動作及び読み出し動作は、制御ゲートバイアスが印加されないことを除いて、
図4のものと同様である。プログラミング動作もまた、制御ゲートバイアスなしで行われるため、結果として、プログラム動作中は、制御ゲートバイアスの不足を補償するため、より高い電圧がソース線端子に印加されなければならない。
【0018】
表3は、読み出し、消去、及びプログラム動作を実行するためのメモリセル610の端子に印加され得る典型的な電圧範囲を示す。
表3:
図6のフラッシュメモリセル610の動作
【表3】
「読み出し1」は、セル電流がビット線に出力される読み出しモードである。「読み出し2」は、セル電流がソース線端子に出力される読み出しモードである。
【0019】
図7は、別の種類のフラッシュメモリセルである、積層ゲートメモリセル710を示す。メモリセル710は、浮遊ゲート20がチャネル領域18全体の上方にわたって延在し、制御ゲート端子22(ワード線に結合される)が絶縁層(図示せず)によって分離されて浮遊ゲート20の上方に延在することを除いて、
図2のメモリセル210と同様である。プログラミングは、チャネル18から、ドレイン領域16の隣のチャネル領域内の浮遊ゲート20へのホット電子注入を使用して実行され、消去は、浮遊ゲート20から基板12へのファウラーノルドハイム電子トンネリングを使用して実行される。読み出し動作は、メモリセル210について前述したものと同様の方法で動作する。
【0020】
表4は、読み出し、消去、及びプログラム動作を実行するためのメモリセル710及び基板12の端子に印加され得る典型的な電圧範囲を示す。
表4:
図7のフラッシュメモリセル710の動作
【表4】
【0021】
「読み出し1」は、セル電流がビット線に出力される読み出しモードである。「読み出し2」は、セル電流がソース線端子に出力される読み出しモードである。任意選択的に、メモリセル210、310、410、510、610、又は710の行及び列を含むアレイでは、ソース線は、メモリセルの1行又はメモリセルの隣接する2行に結合され得る。すなわち、ソース線端子は、メモリセルの隣接する行によって共有され得る。
【0022】
図8は、ツインスプリットゲートメモリセル810を示す。ツインスプリットゲートメモリセル810は、基板12の上方に絶縁されて配設される浮遊ゲート20(floating gate、FG)と、浮遊ゲート20の上方に絶縁されて配設される制御ゲート28(control gate、CG)と、浮遊ゲート20及び制御ゲート28に隣接して絶縁されて配設され、かつ基板12の上方に絶縁されて配設される消去ゲート30(erase gate、EG)であって、消去ゲート30は、
浮遊ゲート20の上隅部がT字形の消去ゲート30の内側隅部に面して消去効率を向上させるように、T字形で作成される、消去ゲート30(EG)と、(ビット線コンタクト24(bit line、BL)は、ドレイン拡散領域16(drain diffusion region、DR)に接続されている)浮遊ゲート20に隣接した基板12内のドレイン領域16(drain region、DR)と、を含む。メモリセルは、メモリセル対(左側のA及び右側のB)として形成され、共通消去ゲート30を共有する。このセル設計は、少なくとも、消去ゲート30の下のソース領域を欠き、選択ゲート(ワード線とも呼ばれる)を欠き、各メモリセルのチャネル領域を欠く点で、
図2~
図7を参照して上述されるメモリセルとは異なる。代わりに、単一の連続チャネル領域18が両メモリセルの下に延在する(すなわち、一方のメモリセルのドレイン領域16から他方のメモリセルのドレイン領域16まで延在する)。一方のメモリセルの読み出し又はプログラムを行うためには、他方のメモリセルの制御ゲート28を十分な電圧まで上昇させて、それらの間にある浮遊ゲート20への電圧結合によって、下にあるチャネル領域部分を起動させる(例えば、セルAの読み出し又はプログラムを行うには、CGBからの電圧結合によってFGB上の電圧を上昇させて、FGB下のチャネル領域を起動させる)。消去は、浮遊ゲート20から消去ゲート30へのファウラーノルドハイム(Fowler Nordheim)電子トンネリングを使用して実行される。プログラミングは、チャネル領域18から浮遊ゲート20へのホット電子注入を使用して実行され、これは、表5にプログラム1として示されている。代替的に、プログラミングは、消去ゲート30から浮遊ゲート20へのファウラーノルドハイム電子トンネリングを使用して実行され、これは、表5にプログラム2として示されている。代替的に、プログラミングは、チャネル領域18から浮遊ゲート20へのファウラーノルドハイム電子トンネリングを使用して実行され、この場合、条件は、消去ゲート30が低い正電圧でバイアスされている間に、基板12は低電圧又は負電圧でバイアスされることを除いて、プログラム2と同様である。
【0023】
表5は、読み出し、消去、及びプログラム動作を実行するためのツインスプリットゲートメモリセル810の端子に印加され得る典型的な電圧範囲を示す。
表5:
図8のフラッシュメモリセル810の動作
【表5】
【0024】
上記の人工ニューラルネットワークにおける不揮発性メモリセルの種類のうちの1つを含むメモリアレイを利用するために、2つの修正が行われる。第一に、以下に更に説明されるように、アレイ内の他のメモリセルのメモリ状態に悪影響を与えずに各メモリセルを個々にプログラム、消去、及び読み出しできるように線を構成する。第二に、メモリセルの連続(アナログ)プログラミングを提供する。
【0025】
具体的には、アレイ内の各メモリセルのメモリ状態(すなわち、浮遊ゲートの電荷)を、完全に消去された状態から完全にプログラムされた状態へ、独立して、かつ他のメモリセルの異常が最小で、連続的に変えることができる。別の実施形態では、アレイ内の各メモリセルのメモリ状態(すなわち、浮遊ゲートの電荷)を、完全にプログラムされた状態から完全に消去された状態へ、及び逆もまた同様に、独立して、かつ他のメモリセルの異常が最小で、連続的に変えることができる。これはつまり、セル記憶がアナログであるか、又は多数の不連続値(16個又は64個の異なる値など)のうちの1つを最低限記憶することができることを意味し、これにより、メモリアレイ内の全てのセルが非常に正確に、かつ個々にチューニング可能となり、また、メモリアレイが、記憶、及びニューラルネットワークのシナプシスの重みへの微細チューニング調整に対して、理想的なものになる。
【0026】
本明細書に記載される方法及び手段は、限定することなく、FINFETスプリットゲートフラッシュ又はスタックゲートフラッシュメモリ、NANDフラッシュ、SONOS(ケイ素-酸化物-窒化物-酸化物-ケイ素、窒化物中の電荷トラップ)、MONOS(金属-酸化物-窒化物-酸化物-ケイ素、窒化物中の金属電荷トラップ)、ReRAM(抵抗変化型メモリ)、PCM(相変化メモリ)、MRAM(磁気抵抗メモリ)、FeRAM(強誘電体メモリ)、OTP(バイレベル又はマルチレベルの1回のみのプログラムが可能)及びCeRAM(強相関電子メモリ)などの他の不揮発性メモリ技術に適用され得る。本明細書に記載される方法及び手段は、限定することなく、SRAM、DRAM、及び他の揮発性シナプスセルなどのニューラルネットワークに使用される揮発性メモリ技術に適用することができる。
<<不揮発性メモリセルアレイを使用するニューラルネットワーク>>
【0027】
図9は、本実施形態の不揮発性メモリアレイを利用するニューラルネットワークの非限定例を概念的に示す。この例は、顔認識アプリケーション用に不揮発性メモリアレイニューラルネットワークを使用するが、不揮発性メモリアレイベースのニューラルネットワークを使用して他の適切なアプリケーションを実装することも可能である。
【0028】
S0は入力層であり、この例では、5ビット精度の32×32ピクセルRGB画像である(すなわち、各色R、G、及びBにつき1つずつで3つの32×32ピクセルアレイであり、各ピクセルは5ビット精度である)。入力層S0から層C1に行くシナプスCB1は、一部のインスタンスには異なる重みのセットを適用し、他のインスタンスには共有の重みを適用し、入力画像を3×3ピクセルの重なり合うフィルタ(カーネル)でスキャンし、1ピクセル(又はモデルによっては2ピクセル以上)ずつフィルタをシフトする。具体的には、画像の3×3部分における9ピクセルの値(すなわち、フィルタ又はカーネルと称される)は、シナプスCB1に提供され、そこで、これらの9個の入力値に適切な重みを乗算し、その乗算の出力を合計後、単一の出力値が決定され、層C1の特徴マップのうちの1つのピクセルを生成するためにCB1の第1のシナプスによって与えられる。3×3フィルタは次に、入力層S0内で右側に1ピクセルだけシフトされ(すなわち、3ピクセルの列を右側に追加し、左側で3ピクセルの列をドロップする)、これにより、この新しく位置づけられたフィルタの9ピクセル値はシナプスCB1に提供され、そこでそれらに上記と同じ重みを乗算し、関連するシナプスによって第2の単一の出力値を決定する。このプロセスを、3×3フィルタが入力層S0の32×32ピクセル画像全体にわたって3色全て及び全てのビット(精度値)についてスキャンするまで続ける。プロセスは次に、層C1の特徴マップ全てが計算されるまで、異なる重みのセットを使用して繰り返されて、層C1の異なる特徴マップを生成する。
【0029】
本例では、層C1において、各々30×30ピクセルを有する16個の特徴マップが存在する。各ピクセルは、入力とカーネルとの乗算から抽出された新しい特徴ピクセルであり、したがって、各特徴マップは、二次元アレイであり、したがってこの例では、層C1は、二次元アレイの16層を構成する(本明細書で言及される層及びアレイは、必ずしも物理的関係ではなく論理的な関係であり、すなわち、アレイは必ずしも物理的な二次元アレイに配向されないことに留意されたい)。層C1内の16個の特徴マップの各々は、フィルタスキャンに適用される異なるシナプス重みのセット16個のうちの1つによって生成される。C1特徴マップは全て、境界同定など、同じ画像特徴の異なる態様を対象とすることができる。例えば、第1のマップ(この第1のマップを生成するために使用される全てのスキャンに共有される第1の重みセットを使用して生成される)は、円形エッジを識別することができ、第2のマップ(第1の重みセットと異なる第2の重みセットを使用して生成される)は、長方形エッジ又はある特定の特徴のアスペクト比などを識別することができる。
【0030】
層C1から層S1へ行く前には、各特徴マップ内の重なり合わずに連続する2×2領域からの値をプールする活性化関数P1(プーリング)が適用される。プーリング関数P1の目的は、近隣の位置を平均すること(又はmax関数を使用することも可能である)、例えばエッジ位置の依存を低減すること、及び次の段階に行く前にデータサイズを低減することである。層S1において、16個の15×15特徴マップ(すなわち、各々15×15ピクセルの異なるアレイ16個)が存在する。層S1から層C2に行くシナプスCB2は、層S1内のマップを4×4フィルタにより1ピクセルのフィルタシフトでスキャンする。層C2において、22個の12×12特徴マップが存在する。層C2から層S2へ行く前には、各特徴マップ内の重なり合わずに連続する2×2領域からの値をプールする活性化関数P2(プーリング)が適用される。層S2において、22個の6×6特徴マップが存在する。層S2から層C3へ行くシナプスCB3では活性化関数(プーリング)が適用され、ここで層C3内の全てのニューロンは、CB3のそれぞれのシナプスを介して層S2内の全てのマップに接続する。層C3において、64個のニューロンが存在する。層C3から出力層S3へと行くシナプスCB4は、C3をS3に完全に接続する、すなわち、層C3内の全てのニューロンは、層S3内の全てのニューロンに接続される。S3における出力は、10個のニューロンを含み、ここで出力が最も高いニューロンが、クラス(分類)を決定する。この出力は、例えば、元の画像の内容の同定又は分類を示すことができる。
【0031】
シナプスの各層は、不揮発性メモリセルのアレイ又はアレイの一部を使用して実装される。
【0032】
図10は、その目的のために使用可能なシステムのブロック図である。VMMシステム32は、不揮発性メモリセルを含み、ある層と次の層との間のシナプス(図
9のCB1、CB2、CB3、及びCB4など)として利用される。具体的には、VMMシステム32は、行及び列に配置された不揮発性メモリセルを備えるVMMアレイ33、消去ゲート及びワード線ゲートデコーダ34、制御ゲートデコーダ35、ビット線デコーダ36、並びにソース線デコーダ37を備え、それらのデコーダは、不揮発性メモリセルアレイ33に対するそれぞれの入力をデコードする。VMMアレイ33への入力は、消去ゲート及びワード線ゲートデコーダ34から、又は制御ゲートデコーダ35から行うことができる。この例におけるソース線デコーダ37はまた、VMMアレイ33の出力をデコードする。代替的に、ビット線デコーダ36が、VMMアレイ33の出力をデコードすることができる。
【0033】
VMMアレイ33は、2つの目的を果たす。第一に、VMMアレイ33は、VMMシステム32によって使用される重みを記憶する。第二に、VMMアレイ33は、効果的に、入力に、VMMアレイ33に記憶された重みを乗算し、それらを出力線(ソース線又はビット線)ごとに合計して出力を生成し、これは、次の層への入力又は最後の層への入力になる。乗算及び加算の関数を実行することによって、VMMアレイ33は、別個の乗算及び加算の論理回路の必要性をなくし、また、その場でのメモリ計算により電力効率も良い。
【0034】
VMMアレイ33の出力は、VMMアレイ33の出力を合計してその畳み込み用の単一の値を作成する、差動加算器(加算オペアンプ又は加算電流ミラーなど)38に供給される。差動加算器38は、正の重み入力及び負の重み入力両方の総和を実行して単一の値を出力するように配置される。
【0035】
差動加算器38の合計された出力値は、次に出力を整流する活性化関数回路39に供給される。活性化関数回路39は、シグモイド関数、tanh関数、ReLU関数、又は任意の他の非線形関数を提供し得る。活性化関数回路39の整流された出力値は、次の層(例えば
図9のC1)の特徴マップの要素になり、次いで、次のシナプスに適用されて次の特徴マップ層又は最後の層を生成する。したがって、この例では、VMMアレイ33は、複数のシナプス(それは、ニューロンの前の層から、又は画像データベースなどの入力層から、入力を受信する)を構成し、加算器38及び活性化関数回路39は、複数のニューロンを構成する。
【0036】
図10のVMMシステム32への入力(WLx、EGx、CGx、及び任意選択的にBLx及びSLx)は、アナログレベル、バイナリレベル、デジタルパルス(この場合、パルスを適切な入力アナログレベルに変換するためにパルス-アナログ変換器PACが必要とされ得る)又はデジタルビット(この場合、デジタルビットを適切な入力アナログレベルに変換するためにDACが提供される)であり得、出力は、アナログレベル(例えば、電流、電圧、又は電荷)、バイナリレベル、デジタルパルス、又はデジタルビットであり得る(この場合、出力アナログレベルをデジタルビットに変換するために出力ADCが提供される)。
【0037】
図11は、図中でVMMシステム32a、32b、32c、32d及び32eとして標示されたVMMシステム32の多数の層の使用を示すブロック図である。
図11に示されるように、入力(Inputxで示される)は、デジタル-アナログ変換器31によってデジタルからアナログに変換され、入力VMMシステム32aに提供される。変換されたアナログ入力は、電圧又は電流であり得る。第1の層の入力D/A変換は、入力VMMシステム32aのマトリックス乗算器の適切なアナログレベルに入力Inputxをマッピングする関数又はLUT(ルックアップテーブル)を使用することによって行うことができる。入力変換はまた、外部アナログ入力を入力VMMシステム32aへのマッピングされたアナログ入力に変換するように、アナログ-アナログ(analog to analog、A/A)変換器によって行うこともできる。入力変換はまた、外部デジタル入力を入力VMMシステム32aへのマッピングされたデジタルパルスに変換するように、デジタル-デジタルパルス(digital-to-digital pules、D/P)変換器によって行うこともできる。
【0038】
入力VMMシステム32aによって生成された出力は、次に、次のVMMシステム(隠しレベル1)32bへの入力として提供され、次に、次のVMMシステム32bが、さらにその次の入力VMMシステム(隠しレベル2)32cへの入力として提供される出力を生成する、などとなる。VMMシステム32の様々な層は、畳み込みニューラルネットワーク(convolutional neural network、CNN)のシナプス及びニューロンの各層として機能する。各VMMシステム32a、32b、32c、32d及び32eは、対応の不揮発性メモリアレイを備える、スタンドアローンの物理的システムとすることができるか、又は複数のVMMシステムは、同じ物理的不揮発性メモリアレイの異なる部分を利用することができるか、又は複数のVMMシステムは、同じ物理的不揮発性メモリアレイの重なり合う部分を利用することができる。各VMMシステム32a、32b、32c、32d、及び32eはまた、そのアレイ又はニューロンの様々な部分に対して時間多重化され得る。
図11に示される例は、5つの層(32a、32b、32c、32d、32e)、すなわち、1つの入力層(32a)、2つの隠れ層(32b、32c)、及び2つの全接続層(32d、32e)を含む。当業者であれば、これは単なる例示であり、代わりにシステムが2つを超える隠れ層及び2つを超える完全接続層を含み得ることを理解するであろう。
<<VMMアレイ>>
【0039】
図12は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1200を示す。VMMアレイ1200は、不揮発性メモリセルのメモリアレイ1201と、不揮発性基準メモリセルの基準アレイ1202(アレイの頂部に位置する)と、を含む。代替的に、別の基準アレイが底部に位置することができる。
【0040】
VMMアレイ1200では、制御ゲート線1203などの制御ゲート線が垂直方向に延びており(したがって、行方向の基準アレイ1202が、制御ゲート線1203に直交する)、消去ゲート線1204などの消去ゲート線が水平方向に延びている。ここで、VMMアレイ1200への入力は、制御ゲート線(CG0、CG1、CG2、CG3)に提供され、VMMアレイ1200の出力は、ソース線(SL0、SL1)に現れる。一実施形態では、偶数行のみが使用され、別の実施形態では、奇数行のみが使用される。各ソース線(それぞれSL0、SL1)の電流は、その特定のソース線に接続されたメモリセルからの全ての電流の合計関数を実行する。
【0041】
ニューラルネットワークについて本明細書に記載されているように、VMMアレイ1200の不揮発性メモリセル、すなわちVMMアレイ1200のメモリセル310は、サブスレッショルド領域で動作するように構成されることが好ましい。
【0042】
本明細書に記載される不揮発性基準メモリセル及び不揮発性メモリセルは、以下のように弱い反転でバイアスされる:
Ids=Io*e(Vg-Vth)/nVt=w*Io*e(Vg)/nVt
式中、w=e(-Vth)/nVtであり、
式中、Idsはドレイン-ソース間電流であり、Vgはメモリセルのゲート電圧であり、Vthはメモリセルのスレッショルド電圧であり、Vtは熱電圧=k*T/qであり、kはボルツマン定数、Tはケルビン温度、qは電子電荷であり、nは傾斜係数=1+(Cdep/Cox)であり、Cdep=空乏層の容量、及びCoxはゲート酸化物層の容量であり、Ioは、スレッショルド電圧に等しいゲート電圧におけるメモリセル電流であり、Ioは、(Wt/L)*u*Cox*(n-1)*Vt2に比例し、式中、uはキャリア移動度であり、Wt及びLはそれぞれ、メモリセルの幅及び長さである。
【0043】
メモリセル(基準メモリセル又は周辺メモリセルなど)又はトランジスタを使用して入力電流Idsを入力電圧Vgに変換するI-Vログ変換器を使用した場合、Vgは以下のとおりである:
Vg=n*Vt*log[Ids/wp*Io]
式中、wpは、基準又は周辺メモリセルのwである。
【0044】
ベクトルマトリックス乗算器VMMアレイとして使用されるメモリアレイについて、出力電流は以下である:
Iout=wa*Io*e(Vg)/nVt、すなわち
Iout=(wa/wp)*Iin=W*Iin
W=e(Vthp-Vtha)/nVt
Iin=wp*Io*e(Vg)/nVt
式中、waは、メモリアレイの各メモリセルのwである。
【0045】
ワード線又は制御ゲートは、入力電圧のためのメモリセルの入力として使用することができる。
【0046】
代替的に、本明細書に記載されたVMMアレイの不揮発性メモリセルは、線形領域で動作するように構成することができる。
Ids=ベータ*(Vgs-Vth)*Vds; ベータ=u*Cox*Wt/L
W α (Vgs-Vth)
すなわち、直線領域における重みWは(Vgs-Vth)に比例する。
【0047】
ワード線又は制御ゲート又はビット線又はソース線は、線形領域内で動作するメモリセルの入力として使用することができる。ビット線又はソース線は、メモリセルの出力として使用することができる。
【0048】
I-V線形変換器用に、線形領域で動作するメモリセル(基準メモリセル又は周辺メモリセルなど)若しくはトランジスタ、又は抵抗器を使用して、入出力電流を入出力電圧に線形変換することができる。
【0049】
代替的に、本明細書に記載されたVMMアレイのメモリセルは、飽和領域で動作するように構成することができる。
Ids=(1/2)*ベータ*(Vgs-Vth)2; ベータ=u*Cox*Wt/L
W α (Vgs-Vth)2、すなわち重みWは(Vgs-Vth)2に比例する。
【0050】
ワード線、制御ゲート、又は消去ゲートは、飽和領域内で動作するメモリセルの入力として使用することができる。ビット線又はソース線は、出力ニューロンの出力として使用することができる。
【0051】
代替的に、本明細書に記載されるVMMアレイのメモリセルは、ニューラルネットワークの各層又は多層に対して全ての領域又はそれらの組み合わせ(サブスレッショルド、線形、又は飽和)で使用され得る。
【0052】
図13は、
図2に示されるメモリセル210に特に適したニューロンVMMアレイ1300を示し、入力層と次の層との間のシナプスとして利用される。VMMアレイ1300は、不揮発性メモリセルのメモリアレイ1303と、第1の不揮発性基準メモリセルの基準アレイ1301と、第2の不揮発性基準メモリセルの基準アレイ1302と、を含む。アレイの列方向に配置された基準アレイ1301及び1302は、端子BLR0、BLR1、BLR2、及びBLR3に流入する電流入力を電圧入力WL0、WL1、WL2、及びWL3に変換するように機能する。実際には、第1及び第2の不揮発性基準メモリセルは、電流入力が流入する状態で、マルチプレクサ1314(一部のみ示す)を通してダイオード接続される。基準セルは、目標基準レベルにチューニング(例えば、プログラム)される。目標基準レベルは、基準ミニアレイマトリックス(図示せず)によって提供される。
【0053】
メモリアレイ1303は、2つの目的を果たす。第一に、メモリアレイ1303は、VMMアレイ1300により使用される重みを、それぞれのメモリセルに記憶する。第二に、メモリアレイ1303は、メモリアレイ1303に記憶された重みによって、入力(すなわち、端子BLR0、BLR1、BLR2、及びBLR3に提供された電流入力であり、これを基準アレイ1301及び1302が入力電圧に変換して、ワード線WL0、WL1、WL2、及びWL3に供給する)を有効に乗算して、次いで、全ての結果(メモリセル電流)を加算して、それぞれのビット線(BL0~BLN)の出力を生成し、この出力は次の層への入力又は最後の層への入力となる。メモリアレイ1303が乗算及び加算の関数を実行することで、別個の乗算及び加算の論理回路の必要性はなくなり、また、電力効率も良い。ここで、電圧入力はワード線WL0、WL1、WL2、及びWL3に提供され、出力は、読み出し(推論)動作中にそれぞれのビット線BL0~BLNに現れる。各々のビット線BL0~BLNの電流は、その特定のビット線に接続された全ての不揮発性メモリセルからの電流の合計関数を実行する。
【0054】
表6は、VMMアレイ1300の動作電圧を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示し、FLTは、浮遊、すなわち電圧が印加されないことを示す。行は、読み出し、消去、及びプログラムの動作を示す。
表6:
図13のVMMアレイ1300の動作
【表6】
【0055】
図14は、
図2に示されるメモリセル210に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1400を示す。VMMアレイ1400は、不揮発性メモリセルのメモリアレイ1403と、第1の不揮発性基準メモリセルの基準アレイ1401と、第2の不揮発性基準メモリセルの基準アレイ1402と、を含む。基準アレイ1401及び1402は、VMMアレイ1400の行方向に延びる。VMMアレイは、VMMアレイ1400においてワード線が垂直方向に延びることを除いて、VMM1300と同様である。ここで、入力はワード線(WLA0、WLB0、WLA1、WLB2、WLA2、WLB2、WLA3、WLB3)に提供され、出力は、読み出し動作中にソース線(SL0、SL1)に現れる。各ソース線の電流は、その特定のソース線に接続されたメモリセルからの全ての電流の合計関数を実行する。
【0056】
表7は、VMMアレイ1400の動作電圧を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示す。行は、読み出し、消去、及びプログラムの動作を示す。
表7:
図14のVMMアレイ1400の動作
【表7】
【0057】
図15は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1500を示す。VMMアレイ1500は、不揮発性メモリセルのメモリアレイ1503と、第1の不揮発性基準メモリセルの基準アレイ1501と、第2の不揮発性基準メモリセルの基準アレイ1502と、を含む。基準アレイ1501及び1502は、端子BLR0、BLR1、BLR2、及びBLR3に流入する電流入力を電圧入力CG0、CG1、CG2、及びCG3に変換するように機能する。実際には、第1及び第2の不揮発性基準メモリセルは、電流入力がBLR0、BLR1、BLR2、及びBLR3を通って流入する状態で、マルチプレクサ1512(一部のみ示す)を通してダイオード接続される。マルチプレクサ1512は、読み出し動作中に第1及び第2の不揮発性基準メモリセルの各々のビット線(BLR0など)の一定電圧を確実にするために、対応のマルチプレクサ1505及びカスコーディングトランジスタ1504をそれぞれ含む。基準セルは、目標基準レベルにチューニングされる。
【0058】
メモリアレイ1503は、2つの目的を果たす。第一に、メモリアレイ1503は、VMMアレイ1500によって使用される重みを記憶する。第二に、メモリアレイ1503は、入力(端子BLR0、BLR1、BLR2、及びBLR3に提供された電流入力であり、基準アレイ1501及び1502がこれらの電流入力を入力電圧に変換して、制御ゲート(CG0、CG1、CG2、及びCG3)に供給する)に、メモリセルアレイに記憶された重みを掛けて、次いで、全ての結果(セル電流)を加算して出力を生成し、この出力はBL0~BLNに現れ、次の層への入力又は最後の層への入力となる。メモリアレイが乗算及び加算の関数を実行することで、別個の乗算及び加算の論理回路の必要性がなくなり、また、電力効率も良い。ここで、入力は制御ゲート線(CG0、CG1、CG2、及びCG3)に提供され、出力は、読み出し動作中にビット線(BL0~BLN)に現れる。各ビット線の電流は、その特定のビット線に接続されたメモリセルからの全ての電流の合計関数を実行する。
【0059】
VMMアレイ1500は、メモリアレイ1503内の不揮発性メモリセルの一方向チューニングを実装する。すなわち、各不揮発性メモリセルは消去され、次いで、浮遊ゲートの所望の電荷に達するまで部分的にプログラムされる。過度に多くの電荷が浮遊ゲートに加えられる場合(その場合は誤った値がセルに記憶される)、セルは消去され、一連の部分的なプログラミング動作が最初からやり直される。示されるように、同じ消去ゲート(EG0又はEG1など)を共有する2つの行は、一緒に消去され(ページ消去として知られる)、その後、各セルは、浮遊ゲートの所望の電荷に達するまで部分的にプログラムされる。
【0060】
表8は、VMMアレイ1500の動作電圧を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルの制御ゲート、選択セルと同じセクタ内の非選択セルの制御ゲート、選択セルとは異なるセクタ内の非選択セルの制御ゲート、選択セルの消去ゲート、非選択セルの消去ゲート、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示す。行は、読み出し、消去、及びプログラムの動作を示す。
表8:
図15のVMMアレイ1500の動作
【表8】
【0061】
図16は、
図3に示されるメモリセル310に特に適しており、かつ入力層と次の層との間でシナプス及びニューロンの一部として利用される、ニューロンVMMアレイ1600を示す。VMMアレイ1600は、不揮発性メモリセルのメモリアレイ1603と
、第1の不揮発性基準メモリセル
の基準アレイ1601と、第2の不揮発性基準メモリセルの基準アレイ1602と、を備える。EG線EGR0、EG0、EG1、及びEGR1は垂直に延び、CG線CG0、CG1、CG2、及びCG3並びにSL線WL0、WL1、WL2、及びWL3は水平に延びる。VMMアレイ1600は、VMMアレイ1600が双方向チューニングを実装することを除いてVMMアレイ1600と同様であり、各個々のセルは、個別のEG線の使用により、浮遊ゲートの所望の電荷量に達するために、完全に消去され、部分的にプログラムされ、必要に応じて部分的に消去することができる。示されるように、基準アレイ1601及び1602は、端子BLR0、BLR1、BLR2及びBLR3内の入力電流を制御ゲート電圧CG0、CG1、CG2及びCG3に変換し(マルチプレクサ1614を介したダイオード接続された基準セルの作用を通じて)、これらの電圧は行方向でメモリセルに印加される。電流出力(ニューロン)は、ビット線BL0~BLN中にあり、各ビット線は、その特定のビット線に接続された不揮発性メモリセルからの全ての電流を合計する。
【0062】
表9は、VMMアレイ1600の動作電圧を示す。表中の列は、選択セルのワード線、非選択セルのワード線、選択セルのビット線、非選択セルのビット線、選択セルの制御ゲート、選択セルと同じセクタ内の非選択セルの制御ゲート、選択セルとは異なるセクタ内の非選択セルの制御ゲート、選択セルの消去ゲート、非選択セルの消去ゲート、選択セルのソース線、及び非選択セルのソース線に加えられる電圧を示す。行は、読み出し、消去、及びプログラムの動作を示す。
表9:
図16のVMMアレイ1600の動作
【表9】
【0063】
VMMアレイへの入力は、アナログレベル、バイナリレベル、タイミングパルス、又はデジタルビットであり得、出力は、アナログレベル、バイナリレベル、タイミングパルス、又はデジタルビット(この場合、出力アナログレベルの電流又は電圧をデジタルビットに変換するために出力ADCが必要とされる)であり得る。
【0064】
VMMアレイ内の各々のメモリセルに関して、各々の重みWは、単一のメモリセルによって、又は差分セルによって、又は2つのブレンドメモリセル(2つ以上のセルの平均)によって実装され得る。差分セルの場合では、重みWを差分重み(W=W+-W-)として実装するために、2つのメモリセルが必要とされる。2つのブレンドメモリセルの場合は、2つのセルの平均として重みWを実装するために2つのメモリセルが必要とされる。
【0065】
従来技術のVMMシステムに関する1つの課題は、2つの可能な値(すなわち、1及び0)のみを記憶することができる従来のメモリアレイよりはるかに高い精度が必要とされるので、所望のアナログ値をセル(書き込み動作及び検証動作の1つ以上のシーケンスを含む)に記憶するのに比較的長い時間がかかる可能性があることである。ここで、書き込み動作は、消去動作、プログラム動作、又は消去動作とプログラム動作の両方を含み、検証動作は、書き込み動作が正しく実行されたことを確認するための読み出し動作である。
【0066】
所望のアナログ値を選択された不揮発性メモリセルに記憶するためのタイミングオーバーヘッドが低減された、改善されたVMMシステムが必要とされている。更に、VMMアレイ内の他のメモリセルを同時に読み出しながら(例えば、重み調整動作中に検証動作を実行するため、又はニューラルネットワークの推論を実行するため)、VMMアレイ内のメモリセルに書き込むことができる(例えば、ニューラルネットワーク内の重み更新を実行するため)VMMシステムを有することが望ましい。
【発明の概要】
【0067】
書き込みと検証又は読み出しとの同時動作を可能にするVMMシステム回路の多数の実施形態が開示される。「書き込み」は、セルをプログラムすること及び/又はセルを消去することなどによって、メモリセルに記憶された重みを変える動作を指す。「検証」とは、メモリセルの出力(セル電流など)を検知し、目標に達したことを確認する動作を指す。「読み出し」は、メモリセルの出力を検知する動作を指す。一部の実施形態では、書き込みと検証又は読み出しとの同時動作は、メモリの異なるバンク間で行われる。他の実施形態では、書き込みと検証又は読み出しとの同時動作は、メモリの異なるブロック間で行われ、各ブロックは、メモリの2つ以上のバンクを備える。実施形態は、VMMアレイにおける重み書き込み及び検証又は読み出し動作のためのタイミングオーバーヘッドを実質的に低減する。一実施形態では、アナログニューラルメモリシステムは、不揮発性メモリセルの第1のアレイを備える第1のバンクと、不揮発性メモリセルの第2のアレイを備える第2のバンクと、第1のバンク及び第2のバンクによって共有される書き込み回路と、第1のバンク及び第2のバンクによって共有される検知回路と、第1のバンク及び第2のバンクのうちの一方に対して書き込み回路を使用する書き込み動作、並びに第1のバンク及び第2のバンクのうちの他方に対して検知回路を使用する検証動作を同時に実行するための制御回路と、を備える。
【0068】
別の実施形態では、不揮発性メモリセルの第1のアレイを備える第1のバンクと、不揮発性メモリセルの第2のアレイを備える第2のバンクと、を備える、アナログニューラルメモリにおいて、書き込みと検証との同時動作を実行する方法が開示され、方法は、第1のバンク及び第2のバンクのうちの一方に対する書き込み動作、並びに第1のバンク及び第2のバンクのうちの他方に対する検証動作を同時に実行するステップを含む。
【0069】
別の実施形態では、アナログニューラルメモリシステムは、不揮発性メモリセルの2つ以上のバンクを備える第1のブロックであって、各バンクは不揮発性メモリセルのアレイを備える、第1のブロックと、不揮発性メモリセルの2つ以上のバンクを備える、第2のブロックであって、各バンクが不揮発性メモリセルのアレイを備える、第2のブロックと、第1のブロック及び第2のブロックのうちの一方に対する書き込み動作、並びに第1のバンク及び第2のバンクのうちの他方に対する検証動作を同時に実行するための制御回路と、を備える。
【0070】
別の実施形態では、不揮発性メモリセルの2つ以上のバンクを備える第1のブロックと、不揮発性メモリセルの2つ以上のバンクを備える第2のブロックと、を備える、アナログニューラルメモリにおいて、書き込みと検証との同時動作を実行する方法が開示され、方法は、第1のブロック及び第2のブロックのうちの一方に対する書き込み動作、並びに第1のブロック及び第2のブロックのうちの他方に対する読み出し動作を同時に実行するステップを含む。
【0071】
別の実施形態では、メモリセルの複数のベクトルマトリックス乗算(vector multiplication by matrix、VMM)アレイを備えるニューラルネットワークにおいて、書き込みと検証又は読み出しとの同時動作を実行する方法が開示され、方法は、異なるVMMアレイに書き込み動作及び検証又は読み出し動作を同時に実行するステップを含む。
【0072】
【0073】
【0074】
【0075】
【0076】
【0077】
【0078】
【0079】
【0080】
【0081】
【0082】
【0083】
【0084】
【0085】
【0086】
【0087】
【0088】
【0089】
【0090】
【0091】
【0092】
【0093】
【0094】
【0095】
【0096】
【図面の簡単な説明】
【0097】
【
図1】先行技術の人工ニューラルネットワークを示す。
【
図2】先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図3】別の先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図4】別の先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図5】別の先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図6】別の先行技術のスプリットゲートフラッシュメモリセルを示す。
【
図7】先行技術の積層ゲートフラッシュメモリセルを示す。
【
図9】1つ以上のVMMアレイを利用する例示的な人工ニューラルネットワークの様々なレベルを示す。
【
図10】VMMアレイ及び他の回路を備えるVMMシステムを示す。
【
図11】1つ以上のVMMシステムを利用する例示的な人工ニューラルネットワークを示す。
【
図17A】2つのバンクを備えるVMMシステムを示す。
【
図17B】第1のバンクが検証されており、かつ第2のバンクが書き込まれている、
図17AのVMMシステムを示す。
【
図17C】第1のバンクが書き込まれており、かつ第2のバンクが検証されている、
図17AのVMMシステムを示す。
【
図18A】2つのブロックに編成された4つのバンクを備える、VMMシステムを示す。
【
図18B】1つのブロックに編成された4つのバンクを備える、VMMシステムを示す。
【
図19】バンクごとの書き込みと検証との同時動作のための制御信号及び回路を示す。
【
図20】ブロックごとの書き込みと検証との同時動作のための制御信号及び回路を示す。
【
図21】ブロックごとの書き込みと検証との同時動作のために構成されたVMMシステムを示す。
【
図22】バンクごとの書き込みと検証との同時動作のために構成されたVMMシステムを示す。
【
図23】バンクごとの書き込みと検証との同時動作のために構成された別のVMMシステムを示す。
【発明を実施するための形態】
【0098】
本発明のアナログニューラルネットワークのVMMシステムは、CMOS技術及び不揮発性メモリアレイの組み合わせを利用する。
<<改善されたVMMシステムの実施形態>>
【0099】
図17Aは、VMMシステム1700のブロック図を示す。VMMシステム1700は、バンク1731及びバンク1732を備える。バンク1731は、VMMアレイ1701と、DAC(デジタル-アナログ変換器)及び行デコーダ(行入力回路)1702と、高電圧デコーダ1703と、列デコーダ1704とを備える。バンク1732は、VMMアレイ1705と、DAC及び行デコーダ1706と、高電圧デコーダ1707と、列デコーダ1708とを備える。DAC及び行デコーダ1702のDACは、行入力デジタルビットを、ニューラル読み出し(ニューラルネットワークの推論動作)中などにVMMアレイ1701の行入力に適用されるアナログバイアス/タイミングに変換するために使用される。
【0100】
VMMシステム1700は、チャージポンプ1711、チャージポンプレギュレータ1712、及び高電圧レベル生成器1713を含む、高電圧HV生成ブロック1710を更に備える。VMMシステム1700は、低電圧LV生成ブロック1718、アルゴリズムコントローラ1714、アナログ回路1715、制御論理1716、及び試験制御論理1717を更に備える。
【0101】
VMMシステム1700は、検知回路(ビット線/列出力回路)1721及び(列)書き込み回路1722を更に備え、これらの両方は、VMM1701及びVMM1705によって共有される。検知回路1721は、検証及び神経読み出しのための回路(推論のため、アナログ-デジタルADC回路などを含む)を含む。書き込み回路1722は、ビット線バイアス電圧又はプログラム電流レベルを制御するなど、メモリセルのプログラミング/消去を重みターゲット(セル電流ターゲット)に制御する。したがって、
図17Bでは、検知回路1721は、VMMアレイ1701の検証又は読み出し動作中にVMMアレイ1701に結合され、書き込み回路1722は、VMMアレイ1705の書き込み動作(プログラム又は消去)中にVMMアレイ1705に結合される。同様に、
図17Cでは、検知回路1721は、VMMアレイ1705の検証又は読み出し動作中にVMMアレイ1705に結合され、書き込み回路1722は、VMMアレイ1701の書き込み動作中にVMMアレイ1701に結合される。
【0102】
再び
図17Aを参照すると、ブロック1741は、バンク1731と、バンク1732と、検知回路1721と、書き込み回路1722と、を備える、論理ユニットである。
【0103】
図18Aは、
図17のVMMシステム1700の変形である、VMMシステム1800を示す。VMMシステム1800は、2倍の数のVMMアレイ及び関連する回路を有する、VMMシステム1700と同じ構成要素を備える。VMMシステム1800は、2倍の数のVMMアレイを有するように示されているが、これは決して限定することを意味するものではなく、範囲を超えることなく任意の数のVMMアレイが設けられてもよい。したがって、VMMシステム1800は、バンク1831及びバンク1832を更に備える。バンク1831は、VMMアレイ1801と、DAC及び行デコーダ(行入力回路)1802と、高電圧デコーダ1803と、列デコーダ1804とを備える。バンク1832は、VMMアレイ1805と、DAC及び行デコーダ1806と、高電圧デコーダ1807と、列デコーダ1808とを備える。VMMシステム1800は、検知回路1821及び書き込み回路1822を更に備え、これらは両方ともVMM1801及びVMM1805によって共有される。
【0104】
高電圧発生ブロック1710、低電圧発生ブロック1718、アルゴリズムコントローラ1714、アナログ回路1715、制御ロジック1716、及びテスト制御ロジック1717は、VMMアレイ1701、1705、1801、及び1805によって共有される。
【0105】
ブロック1841は、バンク1831と、バンク1832と、検知回路1821と、書き込み回路1822と、を備える、論理ユニットである。
【0106】
図18Bは、VMMシステム1800を再び示す。ここで、ブロック1851は、バンク1731、1732、1831及び1832と、検知回路1721及び1821と、書き込み回路1722及び1822と、を備える、論理ユニットである。したがって、本明細書で使用される場合、「ブロック」は、2つのバンク又は3つ以上のバンクからなることができる。
【0107】
図19は、アナログニューラルメモリシステムにおいて使用され得る、
図17~
図18に示されるもの等の複数のバンクにわたって検証と書き込みとの同時動作を実行するための制御信号1900を示す。制御信号1900は、制御ロジック1716、アルゴリズムコントローラ1714、高電圧発生ブロック1710、及び低電圧発生ブロック1718の組み合わせによって生成され、これらは一緒に又は部分的に制御回路1903と呼ぶことができる。この例では、バンクは、セット1901(第1のバンク及び場合によっては他のバンクを含む)及びセット1902(第2のバンク及び場合によっては他のバンクを含む)である、セットに分割される。制御信号1900に応答して、バンクのセット1901が書き込み回路(書き込み回路1722又は1822など、図示せず)を使用して書き込まれている(wrtと示される)ときに、バンクのセット1902は、検知回路(検知回路1721又は1821など、図示せず)を使用して検証(読み出し)されている(vfyと示される)。制御信号1900に応答して、バンクのセット1901が検証されている(又は読み出されている)ときに、バンクのセット1902は、書き込まれている(プログラム又は消去されている)。バンクを順次ではなく同時に動作させることによって、プログラム及び検証プロセスのための時間の総量は、最大で半分に短縮される。
【0108】
図20は、複数のバンクにわたって検証と書き込みとの同時動作を実行するための制御信号2000を示す。制御信号2010及び2020を含む制御信号2000は、制御ロジック1716、アルゴリズムコントローラ1714、高電圧発生ブロック1710、及び低電圧発生ブロック1718の組み合わせによって生成され、これらは、ここでも、一緒に又は部分的に制御回路1903と呼ぶことができる。この例では、バンクは、セット2001(例えば、第1のバンク及び場合によっては他のバンクを含むことができる)、セット2002(例えば、第2のバンク及び場合によっては他のバンクを含むことができる)、セット2003(例えば、第3のバンク及び場合によっては他のバンクを含むことができる)、及びセット2004(例えば、第4のバンク及び場合によっては他のバンクを含むことができる)である、セットに分割される。制御信号2010に応答して、バンクのセット2001が書き込み回路(書き込み回路1722又は1822など、図示せず)を使用して書き込まれていると示される)ときに、バンクのセット2002は、検知回路(検知回路1721又は1821など、図示せず)を使用して検証(又は読み出し)されている。制御信号2010に応答して、バンクのセット2001が検証されている(又は読み出されている)ときに、バンクのセット2002が書き込まれており、バンクのセット2001が書き込まれているときに、バンクのセット2002が検証されている(又は読み出されている)。制御信号2020に応答して、バンクのセット2003が書き込まれ、かつ検証されている(又は読み出されている)ときに、バンクのセット2004は、推論ニューラルネットワーク動作(又は検証)などのために読み出されており、バンクのセット2003が書き込まれているときに、バンクのセット2004は、検証されている(又は読み出されている)。ブロックを順次ではなく同時に動作させることによって、プログラム及び検証プロセスのための時間の総量は、最大で半分に短縮される。ブロックに同時に動作することによって、ニューラルネットワークのいくつかの部分は、他の部分が重み更新などのための書き込み動作を実行している間に、(推論のための)ニューラル読み出しを実行することができる。
【0109】
図20の実装の一例を
図21に示す。VMMシステム2100は、ブロックのアレイを備え、ブロックのアレイの最初の行は、ブロック2101
0,0、...、2101
0,mを含み、ブロックのアレイの最後の行は、ブロック2101
n,0、...、2101
n,mを含み、mは、VMMシステム2100におけるブロックの列の整数であり、nは、VMMシステム2100におけるブロックの行の整数である。この例では、
図20を参照すると、ブロック2101
0,0、2101
n,0、2101
n,m(並びに図示されていないアレイ内のいくつかの他のブロック)は、ブロックのセット2001内にあり、ブロック2101
0,m(並びに図示されていないアレイ内のいくつかの他のブロック)は、ブロックのセット2002内にある。
図21に取り込まれた特定の時点において、セット2001内のブロック(例えば、不揮発性メモリセルの2つ以上のバンクを含む第1のブロックを含むことができ、各バンクは不揮発性メモリセルのアレイを含む)が書き込まれており、セット2002内のブロック(例えば、不揮発性メモリセルの2つ以上のバンクを含む第2のブロックを含むことができ、各バンクは不揮発性メモリセルのアレイを含む)が検証(読み出し)されている。
【0110】
図17Aの実装の一例を
図22に示す。VMMシステム2200は、VMMアレイ1701及び1705と、検知回路1721と、書き込み回路1722と、第1及び第2の書き込みマルチプレクサ2201及び2202と、第1及び第2の読み出し(検証)マルチプレクサ2203及び2204と、を備える。第1の書き込みマルチプレクサ2201は、有効化されると、VMMアレイ1701を書き込み回路1722に結合する。第2の書き込みマルチプレクサ2202は、有効化されると、VMMアレイ1705を書き込み回路1722に結合する。第1の読み出しマルチプレクサ2203は、有効化されると、VMMアレイ1701を検知回路1721に結合する。第2の読み出しマルチプレクサ2204は、有効化されると、VMMアレイ1705を検知回路1721に結合する。上記では、2つの書き込みマルチプレクサ及び2つの読み出しマルチプレクサを用いて説明したが、これは限定を意味するものではないことを理解されたい。範囲を逸脱することなく、2つの別個のマルチプレクサの代わりに単一のマルチプレクサを使用することができる。
【0111】
図17Aの実装の別の例を
図23に示す。VMMシステム2300は、VMMアレイ1701及び1705と、検知回路1721と、書き込み回路1722と、第1及び第2の書き込みマルチプレクサ2301及び2302と、第1及び第2の読み出し(検証)マルチプレクサ2303及び2304と、列マルチプレクサ2305と、を備える。第1の書き込みマルチプレクサ2301は、有効化されると、VMMアレイ1701を書き込み回路1722に結合する。第2の書き込みマルチプレクサ2302は、有効化されると、VMMアレイ1705を書き込み回路1722に結合する。第1の読み出しマルチプレクサ2303は、有効化されると、VMMアレイ1701を検知回路1721に結合する。第2の読み出しマルチプレクサ2304は、有効化されると、VMMアレイ1705を検知回路1721に結合する。列マルチプレクサ2305は、有効化されると、VMMアレイ1701内のビット線をVMMアレイ1705内のビット線に接続し、その結果、VMMアレイ1701及び1705の両方が、同じビット線に結合され、かつ単一のアレイとして制御され得る。上記では、2つの書き込みマルチプレクサ及び2つの読み出しマルチプレクサを用いて説明したが、これは限定を意味するものではないことを理解されたい。範囲を逸脱することなく、2つの別個のマルチプレクサの代わりに単一のマルチプレクサを使用することができる。
【0112】
本明細書で使用される場合、「の上方に(over)」及び「に(on)」という用語は両方とも、「に直接」(中間材料、要素、又は間隙がそれらの間に配設されていない)、及び「に間接的に」(中間材料、要素、又は間隙がそれらの間に配設されている)を包括的に含むことに留意されるべきである。同様に、「隣接した」という用語は、「直接隣接した」(中間材料、要素、又は間隙がそれらの間に配設されていない)、及び「間接的に隣接した」(中間材料、要素、又は間隙がそれらの間に配設されている)を含み、「に取り付けられた」は、「に直接取り付けられた」(中間材料、要素、又は間隙がそれらの間に配設されていない)、及び「に間接的に取り付けられた」(中間材料、要素、又は間隙がそれらの間に配設されている)を含み、「電気的に結合された」は、「に直接電気的に結合された」(要素を一緒に電気的に接続する中間材料又は要素がそれらの間にない)、及び「に間接的に電気的に結合された」(要素を一緒に電気的に接続する中間材料又は要素がそれらの間にある)を含む。例えば、要素を「基板の上方に」形成することは、その要素を基板に直接、中間材料/要素をそれらの間に伴わずに形成すること、及びその要素を基板に間接的に1つ以上の中間材料/要素をそれらの間に伴って形成することを含み得る。