IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ クゥアルコム・インコーポレイテッドの特許一覧

<>
  • 特許-コンピュートインメモリビットセル 図1
  • 特許-コンピュートインメモリビットセル 図2
  • 特許-コンピュートインメモリビットセル 図3
  • 特許-コンピュートインメモリビットセル 図4
  • 特許-コンピュートインメモリビットセル 図5
  • 特許-コンピュートインメモリビットセル 図6
  • 特許-コンピュートインメモリビットセル 図7
  • 特許-コンピュートインメモリビットセル 図8
  • 特許-コンピュートインメモリビットセル 図9
  • 特許-コンピュートインメモリビットセル 図10
  • 特許-コンピュートインメモリビットセル 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-08-15
(45)【発行日】2024-08-23
(54)【発明の名称】コンピュートインメモリビットセル
(51)【国際特許分類】
   G11C 11/412 20060101AFI20240816BHJP
   G11C 11/54 20060101ALI20240816BHJP
【FI】
G11C11/412
G11C11/54
【請求項の数】 15
(21)【出願番号】P 2021576474
(86)(22)【出願日】2020-06-01
(65)【公表番号】
(43)【公表日】2022-09-08
(86)【国際出願番号】 US2020035590
(87)【国際公開番号】W WO2021002990
(87)【国際公開日】2021-01-07
【審査請求日】2023-05-10
(31)【優先権主張番号】62/870,650
(32)【優先日】2019-07-03
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】16/706,429
(32)【優先日】2019-12-06
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】595020643
【氏名又は名称】クゥアルコム・インコーポレイテッド
【氏名又は名称原語表記】QUALCOMM INCORPORATED
(74)【代理人】
【識別番号】110003708
【氏名又は名称】弁理士法人鈴榮特許綜合事務所
(74)【代理人】
【識別番号】100108855
【弁理士】
【氏名又は名称】蔵田 昌俊
(74)【代理人】
【識別番号】100158805
【弁理士】
【氏名又は名称】井関 守三
(74)【代理人】
【識別番号】100112807
【弁理士】
【氏名又は名称】岡田 貴志
(72)【発明者】
【氏名】ワン、ジョンゾー
(72)【発明者】
【氏名】リ、シャー
(72)【発明者】
【氏名】ル、イエ
(72)【発明者】
【氏名】ガオ、イエンドン
【審査官】後藤 彰
(56)【参考文献】
【文献】特表2021-527886(JP,A)
【文献】米国特許出願公開第2019/0087719(US,A1)
【文献】米国特許出願公開第2018/0315473(US,A1)
【文献】米国特許出願公開第2019/0042199(US,A1)
【文献】米国特許出願公開第2019/0088309(US,A1)
【文献】特表2016-505192(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G11C 11/412
G11C 11/54
(57)【特許請求の範囲】
【請求項1】
ビットセル回路であって、
システム電圧とグランドとに結合されたビットセルと、
前記ビットセルに結合された第1の信号線と、
前記ビットセルに結合された第2の信号線と、
前記ビットセルに結合された第3の信号線と、
前記ビットセルに結合された第4の信号線と、
第1の読取り信号線と、前記ビットセルの出力と、第1の読取りビット線とに結合された読取りトランジスタと、
前記ビットセル出力と前記グランドとに結合されたキャパシタと
を備え、
前記ビットセルは、前記第1の信号線に結合された第1のトランジスタと、前記第2の信号線に結合された第2のトランジスタと、前記第3の信号線に結合された第3のトランジスタと、前記第4の信号線に結合された第4のトランジスタとを備え、
前記ビットセルは、データビット(data bit)に対してラッチ機能を実行するために第1のインバータおよび第2のインバータとして構成された4つのトランジスタを備え、
前記第1のトランジスタは、P型トランジスタであり、前記第2のトランジスタは、P型トランジスタであり、前記第3のトランジスタは、N型トランジスタであり、第4のトランジスタは、N型トランジスタである、ビットセル回路。
【請求項2】
前記ビットセル回路は、前記第1の信号線と、前記第2の信号線と、前記第3の信号線と、前記第4の信号線とに対してXNOR演算を実行するように構成された、請求項1に記載のビットセル回路。
【請求項3】
前記ビットセル回路は、ニューラルネットワークのメモリアレイ中での計算における電荷共有スタティックランダムアクセスメモリである、請求項1に記載のビットセル回路。
【請求項4】
前記キャパシタは、前記出力がフロート(float)するのを防ぐためにグランドへの経路(path)を与える、請求項1に記載のビットセル回路。
【請求項5】
前記ビットセル回路は、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、通信デバイス、モバイルデバイス、モバイルフォン、スマートフォン、携帯情報端末、固定ロケーション端末、タブレットコンピュータ、コンピュータ、ウェアラブルデバイス、ラップトップコンピュータ、サーバ、および自動車両中のデバイスからなるグループから選択されたデバイスに組み込まれる、請求項1に記載のビットセル回路。
【請求項6】
ビットセル回路であって、
システム電圧とグランドとに結合されたビットセルと、
前記ビットセルに結合された第1の信号線と、
前記ビットセルに結合された第2の信号線と、
前記ビットセルに結合された第3の信号線と、
前記ビットセルに結合された第4の信号線と、
第1の読取り信号線と、前記ビットセルの出力と、前記グランドとに結合された読取りトランジスタと、
前記ビットセル出力と読取りビット線とに結合されたキャパシタと
を備え、
前記ビットセルは、前記第1の信号線に結合された第1のトランジスタと、前記第2の信号線に結合された第2のトランジスタと、前記第3の信号線に結合された第3のトランジスタと、前記第4の信号線に結合された第4のトランジスタとを備え、
前記ビットセルは、データビットに対してラッチ機能を実行するために第1のインバータおよび第2のインバータとして構成された4つのトランジスタを備え、
前記第1のトランジスタは、P型トランジスタであり、前記第2のトランジスタは、P型トランジスタであり、前記第3のトランジスタは、N型トランジスタであり、第4のトランジスタは、N型トランジスタである、ビットセル回路。
【請求項7】
ビットセル回路であって、
システム電圧とグランドとに結合されたビットセルと、
前記ビットセルに結合された第1の信号線と、
前記ビットセルに結合された第2の信号線と、
前記ビットセルに結合された第3の信号線と、
前記ビットセルに結合された第4の信号線と、
第1の読取り信号線と、前記ビットセルの出力と、書込みビット線バーとに結合された読取りトランジスタと、
第3の信号線と前記第4の信号線とに結合された書込みビット線と、
前記ビットセル出力と読取りビット線とに結合されたキャパシタと
を備え、
前記ビットセルは、前記第1の信号線に結合された第1のトランジスタと、前記第2の信号線に結合された第2のトランジスタと、前記第3の信号線に結合された第3のトランジスタと、前記第4の信号線に結合された第4のトランジスタとを備え、
前記ビットセルは、データビットに対してラッチ機能を実行するために第1のインバータおよび第2のインバータとして構成された4つのトランジスタを備え、
前記第1のトランジスタは、P型トランジスタであり、前記第2のトランジスタは、P型トランジスタであり、前記第3のトランジスタは、N型トランジスタであり、第4のトランジスタは、N型トランジスタである、ビットセル回路。
【請求項8】
前記読取りトランジスタはN型トランジスタである、請求項6または7に記載のビットセル回路。
【請求項9】
前記ビットセル回路は、前記第1の信号線と、前記第2の信号線と、前記第3の信号線と、前記第4の信号線とに対してXNOR演算を実行するように構成された、請求項6または7に記載のビットセル回路。
【請求項10】
前記ビットセル回路は、ニューラルネットワークのメモリアレイ中での計算における電荷共有スタティックランダムアクセスメモリである、請求項6または7に記載のビットセル回路。
【請求項11】
前記キャパシタは、前記出力がフロートするのを防ぐためにグランドへの経路を与える、請求項6または7に記載のビットセル回路。
【請求項12】
前記ビットセル回路は、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、通信デバイス、モバイルデバイス、モバイルフォン、スマートフォン、携帯情報端末、固定ロケーション端末、タブレットコンピュータ、コンピュータ、ウェアラブルデバイス、ラップトップコンピュータ、サーバ、および自動車両中のデバイスからなるグループから選択されたデバイスに組み込まれる、請求項6または7に記載のビットセル回路。
【請求項13】
ビットセル回路を動作させるための方法であって、
前記ビットセル回路を初期状態にリセットすることと、
第1の信号線に第1の電圧信号を印加することと、
第2の信号線に第2の電圧信号を印加することと、
前記ビットセル回路の出力に第1の読取りビット線を結合することと、
前記第1の読取りビット線の電圧レベルをサンプリングすることと
を備え、
前記ビットセルは、前記第1の信号線に結合された第1のトランジスタと、前記第2の信号線に結合された第2のトランジスタと、第3の信号線に結合された第3のトランジスタと、第4の信号線に結合された第4のトランジスタとを備え、
前記ビットセルは、データビット(data bit)に対してラッチ機能を実行するために第1のインバータおよび第2のインバータとして構成された4つのトランジスタを備え、
前記第1のトランジスタは、P型トランジスタであり、前記第2のトランジスタは、P型トランジスタであり、前記第3のトランジスタは、N型トランジスタであり、第4のトランジスタは、N型トランジスタである、方法。
【請求項14】
前記ビットセル回路を前記初期状態に前記リセットすることは、グランドに前記第1の読取りビット線を結合することと、システム電圧に第1の読取り信号線を結合することとを備える、請求項13に記載の方法。
【請求項15】
前記第1の電圧信号と前記第2の電圧信号とは、積和(MAC:multiply and accumulate)演算のための所望の入力状態(desired input state)に対応する、請求項14に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
[0001] 本特許出願は、その両方が本出願の譲受人に譲渡され、その全体が参照により本明細書に明確に組み込まれる、2019年7月3日に出願された「COMPUTE-IN-MEMORY BIT CELL」と題する仮出願番号第62/870,650号、および2019年12月6日に出願された「COMPUTE-IN-MEMORY BIT CELL」と題する非仮出願第16/706,429号の利益を主張する。
【0002】
[0002] 本開示は、一般に、ビットセル(bit cell)に関し、より詳細には、限定はしないが、電荷共有(charge sharing)コンピュートインメモリ(CIM:Compute In Memory)ビットセルに関する。
【背景技術】
【0003】
[0003] コンピューティングシステムがより複雑になるにつれて、コンピューティングシステムは、動作中により大きい量のデータを処理する。これは、ストレージデバイス中のデータの検索およびストレージに関わる課題をもたらす。たとえば、コンピューティングシステムは、複数のレイヤの計算ノードを使用し、ここで、より深いレイヤは、上位レイヤによって実行された計算(compute)の結果に基づいて計算を実行する。これらの計算は、時々、一般に、パラメータ、入力データ、および重みに対して実行される積和(MAC:multiply and accumulate)演算を用いて計算されるベクトルのドット積および絶対差の計算に依拠し得る。これらの複雑なコンピューティングシステム動作が多くのそのようなデータ要素を含み得るので、これらのデータ要素は、一般に、MAC演算を実行する処理要素とは別個のメモリ中に記憶される。
【0004】
[0004] プロセッサ内での演算の計算は、一般に、プロセッサとデータを記憶するために使用されるメモリリソースとの間でのデータの転送よりも数桁速い。キャッシュ中でプロセッサのより近くにすべてのデータを配置することは、極近傍キャッシュ(close proximity caches)の大きいデータ容量の必要のために大多数の実践システムについて極めて費用がかかる。したがって、データが処理要素とは別個のメモリ中に記憶されるときのデータの転送は、コンピューティングシステムの計算のための主要なボトルネックになる。データセットはサイズが増加するので、別々に位置するメモリと処理要素との間でデータを移動するためにコンピューティングシステムが使用する時間および電力/エネルギーは、計算を実際に実行するために使用される時間および電力の倍数になり得る。したがって、コンピューティング動作において使用するためのデータを転送することを低減または回避するコンピューティングシステムの必要が存在する。
【0005】
[0005] したがって、本明細書によって提供される方法、システムおよび装置を含む従来の手法の欠陥を克服するシステム、装置、および方法が必要である。
【発明の概要】
【0006】
[0006] 以下は、本明細書で開示される装置および方法に関連付けられる1つまたは複数の態様および/または例に関する簡略化された概要を提示する。したがって、以下の概要は、すべての企図される態様および/または例に関連する広範な概要と見なされるべきではなく、また、以下の要約は、すべての企図される態様および/または例に関連する主要または重要な要素を特定するための、または任意の特定の態様および/または例に関連付けられる範囲を描くものと見なされるべきではない。したがって、以下の概要は、本明細書で開示される装置および方法に関連する1つまたは複数の態様および/あるいは例に関連する特定の概念を、以下に提示される詳細な説明に先立って簡略化した形で提示するための唯一の目的を有する。
【0007】
[0007] 一態様では、ビットセル回路(bit cell circuit)は、システム電圧(system voltage)とグランド(ground)とに結合されたビットセルと、ビットセルに結合された第1の信号線(first signal line)と、ビットセルに結合された第2の信号線(second signal line)と、ビットセルに結合された第3の信号線(third signal line)と、ビットセルに結合された第4の信号線(fourth signal line)と、第1の読取り信号線(first read signal line)と、ビットセルの出力(output)と、第1の読取りビット線(first read bit line)とに結合された読取りトランジスタ(read transistor)と、ビットセル出力とシステム電圧とに結合されたキャパシタとを備える。
【0008】
[0008] 別の態様では、ビットセル回路は、システム電圧とグランドとに結合されたビットセルと、ビットセルに結合された第1の信号線と、ビットセルに結合された第2の信号線と、ビットセルに結合された第3の信号線と、ビットセルに結合された第4の信号線と、第1の読取り信号線と、ビットセルの出力と、グランドとに結合された読取りトランジスタと、ビットセル出力と読取りビット線とに結合されたキャパシタとを備える。
【0009】
[0009] さらに別の一態様では、ビットセル回路は、システム電圧とグランドとに結合されたビットセルと、ビットセルに結合された第1の信号線と、ビットセルに結合された第2の信号線と、ビットセルに結合された第3の信号線と、ビットセルに結合された第4の信号線と、第1の読取り信号線と、ビットセルの出力と、書込みビット線バー(write bit line bar)とに結合された読取りトランジスタと、第3の信号線と第4の信号線とに結合された書込みビット線(write bit line)と、ビットセル出力と読取りビット線とに結合されたキャパシタとを備える。
【0010】
[0010] さらに別の態様では、ビットセル回路を動作させるための方法は、ビットセル回路を初期状態(initial state)にリセットすることと、第1の信号線に第1の電圧信号(first voltage signal)を印加することと、第2の信号線に第2の電圧信号(second voltage signal)を印加することと、ビットセル回路の出力に第1の読取りビット線を結合することと、第1の読取りビット線の電圧レベル(voltage level)をサンプリングすることとを備える。
【0011】
[0011] 本明細書で開示される装置および方法に関連付けられる他の特徴および利点は、添付の図面および詳細な説明に基づいて当業者には明らかであろう。
【0012】
[0012] 本開示の態様とその付随する利点の多くのより完全な評価は、本開示を限定するためではなく単に例示するために提示される添付の図面に関連して考察されるときに、以下の詳細な説明を参照することでよりよく理解されれば、容易に得られるであろう。
【図面の簡単な説明】
【0013】
図1】[0013] 本開示のいくつかの例による、例示的なCIMビットセルアレイ(bit cell array)を示す図。
図2】[0014] 本開示のいくつかの例による、例示的なCIMメモリタイプ(memory type)を示す図。
図3】[0015] 本開示のいくつかの例による、例示的なSRAM CIMメモリタイプを示す図。
図4】[0016] 本開示のいくつかの例による、ビットセルとシステム電圧との間に内部キャパシタ(internal capacitor)をもつ例示的なXNOR CIMビットセルを示す図。
図5】[0017] 本開示のいくつかの例による、ビットセルと読取りビット線との間に内部キャパシタをもつ例示的なXNOR CIMビットセルを示す図。
図6】[0018] 本開示のいくつかの例による、ビットセルと読取りビット線と別個の書込みビット線(separate write bit line)との間に内部キャパシタをもつ例示的なXNOR CIMビットセルを示す図。
図7】[0019] 本開示のいくつかの例による、ビットセルとシステム電圧との間に内部キャパシタをもつ例示的な電荷共有CIMビットセルアレイを示す図。
図8】[0020] 本開示のいくつかの例による、ビットセルと読取りビット線との間に内部キャパシタをもつ例示的な電荷共有CIMビットセルアレイを示す図。
図9】[0021] 本開示のいくつかの例による、ビットセル回路を動作させるための例示的な部分的な方法を示す図。
図10】[0022] 本開示のいくつかの例による、例示的なモバイルデバイスを示す図。
図11】[0023] 本開示のいくつかの例による、上述の集積デバイス、半導体デバイス、集積回路、ダイ(die)、インターポーザ(interposer)、パッケージまたはパッケージオンパッケージ(PoP:package-on-package)のいずれかに統合され得る様々な電子デバイスを示す図。
【発明を実施するための形態】
【0014】
[0024] 一般的な慣習に従って、図面によって示された特徴は、縮尺に合わせて描かれていない場合がある。したがって、示された特徴の寸法は、明瞭さのために任意に拡張または縮小され得る。一般的な慣習に従って、図面の一部は明瞭さのために簡素化されている。したがって、図面は、特定の装置または方法のすべての構成要素を示しているとは限らない場合がある。さらに、同様の参照番号は、明細書および図の全体にわたって同様の特徴を示している。
【0015】
[0025] 本明細書で開示する例示的な方法、装置、およびシステムは、従来の方法、装置、およびシステムならびに他の前に識別されていない要求の短所を緩和する。たとえば、(インメモリコンピュートまたはプロセスインメモリとしても知られる)電荷共有コンピュートインメモリ(CIM)は、排他的OR(XNOR)出力ノードとシステム電圧との間に内部キャパシタをもつXNOR CIMビットセルの補足(complement)を備え得る。別の例では、(スイッチ静電容量ベースのまたはより一般的に電荷ベースのCIMとしても知られる)電荷共有CIMは、XNOR出力ノードと読取りビット線との間に内部キャパシタをもつXNORビットセルを備え得る。そのような例では、CIM回路は、XNORビットセルのための専用の書込みポートの必要を除去し、フローティングノード(floating node)を回避する内部キャパシタにおいて一定の電圧を生成するためにXNOR CIMビットセルのために送信ゲートを使用し得、4つの信号線垂直ピンと2つの水平(読取りビット線(RBL:read bit line)および読取りワード線(RWL:read word line))ピンのみを使用する従来のXNORビットセルよりも小さいセルである。さらに別の例では、電荷共有CIMは、XNORと別個の書込みビット線をもつ読取りビット線と書込みビット線バーとの間に内部キャパシタをもつXNOR CIMビットセルを備え得る。この例では、CIM回路は、SRAM書込みポートBLおよびBLBを除去し、6T SRAMを使用せず、フローティングノードを回避する内部キャパシタにおいて一定の電圧を生成するために別個の書込みビット線(WBL:write bit line)および書込みビット線バー、(WBLB-書込みビット線の補足)および書込みワード線(WWL:write word line)を使用し得、5つの信号線ピンと、1つの(WBL)水平ピンと、2つの(RBLおよびWBLB)垂直ピンとのみを使用する従来のXNOR CIMビットセルよりも小さいセルである。
【0016】
[0026] 本明細書で説明される例示的なCIM回路は、データ移動のためのエネルギーを低減することと、コンピューティングシステム中で消費されるデータのための有効なメモリ帯域幅を増加させることとの両方を行う。例示的なCIM回路は、ホストプロセッサにデータを送る必要なしにメモリセル(たとえば、ビットセル)のアレイ内に局所的に記憶されたベクトルのドット積および絶対差などの演算を実行することができる。例示的なCIM回路は、ホストプロセッサによる計算における入力のためにメモリからデータを断続的に移動することと比較してより高いパフォーマンスとより低いエネルギーとを依然として与えながらドット積演算または重み行列のためにより高いスループットを使用可能にするためにCIM回路内でMAC演算を実行し得る。例示的なCIM回路は、単に未加工のまたは未処理のデータを戻す代わりに計算結果を戻す処理を実行するためにローカルメモリプロセッサを含み得る。いくつかの例では、CIM回路中のプロセッサは、メモリアレイ(memory array)の列の選択されたビットセルからの電荷または電流に基づいてMAC値を計算し、メモリアレイもCIM回路中に含まれる。略称「MAC」は、一般に、2つの値の乗算と一連の乗算の累算とを含む演算を指す乗累算、乗算/累算、または乗算器累算器を指すことができることに留意されたい。
【0017】
[0027] いくつかの例によれば、CIM回路の使用は、システムメモリとコンピュートリソースとの間で一般に転送されるデータの量を低減する。データ移動の低減は、CIM回路の使用のためでない場合に制限されるメモリ帯域幅であり得るアルゴリズムの実行を加速する。データ移動の低減はまた、コンピューティングデバイス内でのデータ移動に関連する全体的なエネルギー消費量を低減する。いくつかの例では、CIM回路の処理要素は、CIM回路中に含まれるアレイのビットセルの1つまたは複数の列に対する電流加算の使用を介してMAC値を計算し得る。これらの例では、電流加算は、1)複数のビットセルパスゲート(PG:pass gate)が、アクセスされたビットセルを有する列のプリチャージされたビット線を同時にプルダウンすることと、2)最後のビット線電圧をアナログ出力値として解釈することとを行うことを含み得る。
【0018】
[0028] 限定はしないが、ディープラーニング技法などの機械学習を使用するコンピュータ人工知能(AI)を含むCIMビットセルアレイのための多くの有用な適用例がある。ディープラーニングでは、ニューラルネットワーク(neural network)として編成されるコンピューティングシステムは、前の計算されたデータとの入力データの一致の統計的な可能性を計算する。ニューラルネットワークは、入力を「トレーニングされた」データと比較するためにデータの分析を可能にする複数の相互接続された処理ノードを指す。トレーニングされたデータは、入力データを比較するために使用すべきモデルを生じるための知られているデータのプロパティの計算分析を指す。AIおよびデータトレーニングの適用例の一例は、物体認識に発見され、ここで、システムは、人の顔などの入力物体を識別するために統計分析を実行するために使用され得るパターンを決定するために多くの(たとえば、数千以上の)画像のプロパティを分析する。そのようなニューラルネットワークは、入力データおよび重みに対して実行されるMAC演算に依拠する複数のレイヤの計算ノードを用いて新しいデータ(入力データ「ワード」)に対して計算を実行するために「重み」を計算し得る。たとえば、CIMビットセルアレイは、ニューラルネットワーク(たとえば、ニューラルプロセッシングユニット(NPU:neural processing unit))のためのハードウェアアクセラレータとして使用され得る。
【0019】
[0029] 「接続された(connected)」、「結合された(coupled)」、またはその変形の用語は、要素間における、直接的または間接的のいずれかの任意の接続または結合を意味するものであり、中間要素を介して「接続された」または「結合された」2つの要素の間において中間要素の存在を包含する場合があることに注意するべきである。また、本明細書で使用する「結合された」または「接続された」は、別段に記載されていない限り電気的に結合されたまたは電気的に接続されたことを意味することを理解されたい
[0030] 「システム電圧(system voltage)」および「グランド(ground)」という用語が回路の電圧状態を指すことに留意されたい。5ボルトの動作電源に結合された回路では、たとえば、システム電圧(3.5ボルトから5ボルト)は、「高い(high)」論理状態を示し、一方、グランド(0ボルトから1.5ボルト)は、「低い(low)」論理状態を示す。システム電圧に関して、本明細書で使用されるシステム電圧は、ビットセルまたはメモリアレイの動作電圧を指す(時々、デバイスまたはシステムが動作するように設計された公称電圧を指した)ことを理解されたい。たとえば、メモリビットセルは、プロセッサをもつシステム中に常駐し得、ここにおいて、メモリビットセルは、1.5ボルトのシステム電圧(動作電圧)を有し、一方、プロセッサは、3.3ボルトのシステム電圧(動作電圧)を有する。この例では、プロセッサ信号は、メモリビットセルに印加されるときに3.3ボルトのシステム電圧から1.5ボルトのシステム電圧に低減された電圧であることが当技術分野ではよく理解される。したがって、本明細書で使用されるシステム電圧は、別段に明記されていない限りメモリアレイまたはビットセルのシステムまたは動作電圧に印加される。
【0020】
[0031] 図1は、例示的なCIMビットセルアレイを示す。図1に示されているように、CIMビットセルアレイ100は、アレイに構成される複数のビットセルW11~Wnmと、第1のアクティベーション入力(activation input)X1と、第2のアクティベーション入力X2と、n番目のアクティベーション入力Xnと、第1の出力Y1と、第2の出力Y2と、m番目の出力Ymとを含み得る。第1のアクティベーション入力X1は、第1の信号線(ワード線(word line)-WL1)に結合され、第2のアクティベーション入力X2は、第2の信号線(ワード線-WL2)に結合され、n番目のアクティベーション入力Xnは、n番目の信号線(ワード線-WLn)に結合される。第1の出力Y1は、第1のビット線(BL1)とアナログデジタル変換器(ADC)とに結合され、第2の出力Y2は、第2のビット線(BL2)とADCとに結合され、m番目の出力Ymは、m番目のビット線(BLm)とADCとに結合される。
【0021】
[0032] ビットセルW11~Wnmの各々は、重みに対応する値を記憶する。アクティベーション信号(アクティベーション(X))は、それぞれのワード線(WLn)上の電圧パルスによって駆動され、乗算は、各ビットセル(W11~Wnm)において起こり、結果は、ビット線(BLm)に出力される。各ビット線(BL1、BL2、BLm)は、各ビットセルの出力を合計し(各ビットセルの出力は、それぞれのビット線に電圧を追加し)、それぞれのADCに結果をパスし、ADCは、y=Σwijに従って各BL結果をデジタル値に変換する。乗算は、ベクトル行列演算の結果として行われる。たとえば、最上位ビット(MSB)が最上位の第1の信号線(WL1)であり、最下位ビット(LSB)が最下位のn番目の信号線(WLn)であり、一方、最右列が最上位の列であり、最左列が最下位の列であるように、データは、列メジャー形式でセルアレイ100中に記憶され得る。人工ニューラルネットワークでは、たとえば、行列要素W11~Wnmは、ニューロン間の重みまたはシナプスに対応する。各ビットセルW11~Wnmは、特定の信号線(WL1~Wln)のためのデータワードに対応する値(1または0)を記憶し得る。信号線の特定の組合せをアクティブ化することによって、ベクトル行列乗算演算が実行され得る。論理「1」を記憶するそれぞれのアクティブ化されたビットセルW11~Wnmは、アクティブ化されたビットセルのそれぞれのビット線(BL1~BLm)に対して何らかの電圧レベルを与えることになる(たとえば、ビットセル電圧が1ボルトである場合、ビットセルは、10または20ミリボルトなどの1ボルト未満を与え得る)。論理「0」を記憶するそれぞれのアクティブ化されたビットセルW11~Wnmは、アクティブ化されたビットセルのそれぞれのビット線(BL1~BLm)に対していかなる電位も与えないことになる。各ビット線(BL1~BLm)のためのADCは、ベクトル行列乗算演算の出力としてビット線上のアナログ電圧レベルをデジタル値に変換することになる。
【0022】
[0033] 図2は、例示的なCIMメモリタイプを示す。図2に示されているように、多くの様々なタイプのメモリがCIMビットセルアレイのための候補である。図2は、フラッシュメモリ、相変化メモリ(PCM:phase change memory)、抵抗性ランダムアクセスメモリ(RRAM(登録商標):resistive random access memory)、および電荷共有スタティックランダムアクセスメモリ(CS-SRAM:charge sharing static random access memory)の4つの主要なタイプのビットセルの利益と欠点とを示す。図示のように、フローティングゲート中に記憶される電荷(フラッシュ)、GST(GeSbTe-ゲルマニウム、アンチモン、テルル)相変化(PCM)、TMO(遷移金属酸化物-RRAM)の抵抗スイッチ、およびCMOSラッチ(latch)の各タイプのメモリのためのストレージ機構が示される。「累算(Accumulation)」行に示されているように、最初の3つのメモリタイプが、電流累算(current accumulation)として示されており、4番目が、電荷累算(charge accumulation)として示されている。しかしながら、CS-SRAMが電荷または電流累算器(charge or current accumulator)として構成され得ることを理解されたい(たとえば、図3を参照)。「プロセス制限(Process limitation)」行に示されているように、CS-SRAMは、ノードサイズに対してプロセス制限を有さず、他のカテゴリにおける良好なパラメータとともに極めて高いMACエネルギー効率を有する。さらに、図3に示されているように、電荷累算器として構成されたCS-SRAMは、各ノードのサイズに対するプロセス制限の欠如に加えてノードの数に関して良好にスケーリングすることになる。したがって、ノードのサイズに対するプロセス制限の欠如ならびにMACエネルギー効率と、マルチレベルレイアウトの必要なしのマルチビットサポートとを用いて、CS-SRAMは、様々な図示されたメモリタイプのうちでより良いパフォーマンスを提供する。
【0023】
[0034] 図3は、例示的なSRAM CIMメモリタイプを示す。図2に示されているように、CS-SRAMメモリタイプは、CIMアレイにおいて使用するために他の可能なメモリタイプを上回る利益を提供する。図3に示されているように、SRAMは、ビット線上での電流累算またはビット線上での電荷累算をもつCIMビットセルアレイとして構成され得る。電流累算構成では、論理「1」をもつビットセルは、それぞれのビットラインに電流を与え、この電流は、アレイのそのビット線のための出力として読み取られる。プロセス、電圧、および温度(PVT:process, voltage and temperature)の変動に対する感度の行に示されているように、電流累算構成は、異なる条件の下で信号タイミングの遅延を生じ得るPVT変動により敏感である。電流累算構成では、これらの変動ソースは、PVT、しきい値電圧ミスマッチ(VtMM:Threshold Voltage Mismatch)、ADCオフセットおよび雑音を含む。対照的に、電荷累算構成は、ビットセルと、ADCオフセットと、雑音変動ソースとの間の容量ミスマッチのみの対象となる。エネルギー効率および線形性の行に示されているように、電荷累算構成は、電流累算構成よりも良いパフォーマンスを示す。さらに、ノードの数またはアレイのサイズは、プロセスノードのスケーラビリティ行に示されているように電流累算構成についてではなく電荷累算構成について良好にスケーリングする。さらに、電流累算構成は、累積電流を小さく保つような追加の課題と重要なタイミング問題とを有し、一方、電荷累算構成は、データ保持に関する課題のみを有し得る。したがって、図3で見られるように、電荷蓄積を使用するように構成されたSRAMは、様々なカテゴリにわたってより良いパフォーマンスを与え(すなわち、CS-SRAM)、CS-SRAMをCIMビットセルアレイのための良好な候補とする。
【0024】
[0035] 図4は、本開示のいくつかの例による、ビットセルとシステム電圧との間に内部キャパシタをもつ例示的なXNORビットセルを示す。図4に示されているように、ビットセル回路200は、システム電圧204(たとえば、3.5ボルトから5ボルトの論理「1」)とグランド206(たとえば、0ボルトから1.5ボルトの論理「0」)とに結合されたビットセル202を含み得る。ビットセル回路200はまた、ビットセル202に結合された第1の信号線208(プリチャージワード線1P、PCWL1P)と、ビットセル202に結合された第2の信号線210(プリチャージワード線2P、PCWL2P)と、ビットセル202に結合された第3の信号線212(プリチャージワード線1N、PCWL1N)と、ビットセル202に結合された第4の信号線214(プリチャージワード線2N、PCWL2N)と、第1の読取りワード線218に結合された読取りトランジスタ216と、ビットセル202の出力220と、第1の読取りビット線222と、ビットセル出力220およびシステム電圧204に結合されたキャパシタ224とを含み得る。
【0025】
[0036] 図4に示されているように、ビットセル202は、第1の信号線208に結合された第1のトランジスタ(first transistor)226と、第2の信号線210に結合された第2のトランジスタ(second transistor)228と、第3の信号線212に結合された第3のトランジスタ(third transistor)230と、第4の信号線214に結合された第4のトランジスタ(fourth transistor)232とを含み得る。これらの4つのトランジスタ(four transistors)は、ビットセル202のための送信パスゲート(transmission pass gate)として動作するように構成される。当技術分野においてよく理解されるように、送信パスゲートは、両方向に導通することまたは制御信号によってブロックすることができるリレーと同様のアナログゲートである。図4に示されているように、第1のトランジスタ226と第2のトランジスタ228とは、弱「0」ではなく強「1」をパスし、第3のトランジスタ230と第4のトランジスタ232とは、弱「1」ではなく強「0」をパスする。図4に示されているように、第1のトランジスタ226は、P型トランジスタ(P type transistor)であり、第2のトランジスタ228は、P型トランジスタであり、第3のトランジスタ230は、N型トランジスタ(N type transistor)であり、第4のトランジスタ232は、N型トランジスタである。
【0026】
[0037] 図4に示されているように、ビットセル202は、第5のトランジスタ240(P型)と、第6のトランジスタ242(P型)と、第7のトランジスタ244(N型)と、第8のトランジスタ246(N型)とを含み得る。ビットセル回路200は、第1の内部ノード(N1)236と第2の内部ノード(N2)238とをもつ真理値表234をもつXNOR論理デバイスとして構成される。ビットセル202は、SRAMメモリセルであり得る。代替的に、トランジスタ240~246は、2つの交差結合インバータとして図示され得る(たとえば、図6を参照)。この単純なループは、当技術分野でよく知られているように時間とともに変化しない安定状態(論理「1」または論理「0」)をもつ双安定回路を作成する。
【0027】
[0038] ビットセル202のコンテンツを読み取るために、トランジスタ226~232は、オンに/使用可能にされなければならず、トランジスタ226~232がそれらのそれぞれの信号線(すなわち、第1の信号線208、第2の信号線210、第3の信号線212、および第4の信号線214)からそれらのゲートに電圧を受けるとき、トランジスタ226~232は、導通状態になり、したがって、記憶された値が、読取りビット線222に送信される。ビットセル202が論理「1」を記憶する場合、ビットセル出力220は、読取りビット線222に電圧レベルを与えることになる。ビットセル202が論理「0」を記憶する場合、ビットセル出力220は、読取りビット線222に電圧レベルを与えないことになる。複数のビットセル202がアレイに構成されるとき(たとえば、図7を参照)、読取りビット線222は、論理「1」を記憶した各ビットセル202から電圧寄与を蓄積し、アレイの出力としてその累積電圧レベルを読み取ることになる。
【0028】
[0039] 図5は、本開示のいくつかの例による、ビットセルと読取りビット線との間に内部キャパシタをもつ例示的なXNORビットセルを示す。図5に示されているように、ビットセル回路300は、キャパシタ324が、ビットセル出力320と第1の読取りビット線322との間に結合され、読取りトランジスタ316が、ビットセル302に結合され、第1の読取りワード線318を除いて、ビットセル回路200と同様の要素を含む。。CIMビットセルアレイ内のこの構成では、選択された列上の第1の読取りワード線318は、内部キャパシタ324上に残っているあらゆる電圧を放電するためにオンにされ、左側のPチャネル送信ゲート326または右側のPチャネル送信ゲート328は、データ1または0に応じてオンにされ、所望のデータ状態がビットセル302に書き込まれる。いくつかの例では、セルサイズを最小化するために書込み支援が使用され得る。これは、第1の読取りワード線318のオーバードライブ、より低いシステム電圧304、nch PCWL1または2のオーバードライビングを含み得る。さらに、キャパシタ324は、書込み動作を助けるために第1の読取りビット線322のパルスを用いた第1の読取りビット線322による書込み支援のために使用され得る。
【0029】
[0040] 図6は、本開示のいくつかの例による、ビットセルと読取りビット線と別個の書込みビット線との間に内部キャパシタをもつ例示的なXNOR CIMビットセルを示す。図6に示されているように、ビットセル回路400は、システム電圧404とグランド406とに結合されたビットセル402を含み得る。ビットセル回路400はまた、ビットセル402に結合された第1の信号線408と、ビットセル402に結合された第2の信号線410と、ビットセル402に結合された第1の書込み信号線412と、ビットセル402に結合された第4の書込み信号線414と、第1の読取り信号線418に結合された読取りトランジスタ416と、ビットセル402の出力420と、第1の読取りビット線422と、ビットセル出力420および第1の読取りビット線422に結合されたキャパシタ424とを含み得る。ビットセル回路400はまた、書込みビット線470と書込みビット線バー472とを含み得る。図6に示されているように、ビットセル402は、第2のインバータ(second inverter)448に交差結合された第1のインバータ(first inverter)446と、第1の信号線408に結合された第1のトランジスタ426と、第2の信号線410に結合された第2のトランジスタ428と、第3の信号線412に結合された第3のトランジスタ430と、第4の信号線414に結合された第4のトランジスタ432とを含み得る。図6に示されているように、第1のトランジスタ426は、P型トランジスタであり、第2のトランジスタ428は、P型トランジスタであり、第3のトランジスタ430は、N型トランジスタであり、第4のトランジスタ432は、N型トランジスタである。
【0030】
[0041] 図7は、本開示のいくつかの例による、ビットセルとシステム電圧との間に内部キャパシタをもつ例示的な電荷共有CIMビットセルアレイを示す。図7に示されているように、ビットセル回路500は、アレイに構成された第1のビットセル502(たとえば、ビットセル202)と、第2のビットセル504(たとえば、ビットセル202)と、第3のビットセル506(たとえば、ビットセル202)とを含み得る。各ビットセル502~506からの出力は、第1の読取りビット線508上で読み取られ、次いで、第1のADC510によってデジタル信号に加算され変換され得る。図示のように、ポップカウント累算(popcount accumulation)は、第1の読取りビット線508にわたる電荷共有と第1の読取りビット線508の電圧レベルの第1のADC510の読出しを含み得る。さらに、各ビットセルの両方の送信ゲートは、待機モードでの漏れを低減するためにオフにされ得る。CIMビットセルアレイ内のこの構成では、CIMビットセル行は、(典型的なSRAMにおける一度に1行ずつの代わりに)同時に読み取られ、一度に1行ずつ書き込まれ得る。たとえば、1行はPCWL1PからPCWL1Nによって定義され、第2の行は、PCWL2PからPCWL2Nによって定義されるなどである。
【0031】
[0042] 図8は、本開示のいくつかの例による、ビットセルと読取りビット線との間に内部キャパシタをもつ例示的な電荷共有CIMビットセルアレイを示す。図8に示されているように、ビットセル回路600は、アレイに構成された第1のビットセル602(たとえば、ビットセル302)と、第2のビットセル604(たとえば、ビットセル302)と、第3のビットセル606(たとえば、ビットセル302)とを含み得る。各ビットセル602~606からの出力は、第1の読取りビット線608上で読み取られ、次いで、第1のADC610によってデジタル信号に加算され変換され得る。さらに、グランド614に結合されたリセットスイッチ612は、ビットセル回路600をリセットするために含まれ得る。図示のように、MAC演算を実装する別の方法は、送信ゲートがオフのままである間に第1の読取りビット線608と各セルノードとをグランドにリセットすることを含み得る。アクティベーション入力は、XNOR演算中のそれぞれPCWL N/Pを駆動し、ビットセル出力は、その結果システム電圧またはグランドのいずれかになり、一方、第1の読取りビット線608の電圧は、第1のADC610による読出しになることになる。
【0032】
[0043] 図8に示されているように、タイミング図670は、ビットセル回路600のCIMサイクル672を示す。最初のリセット位相674では、リセットスイッチ612は、図示のように、読取りワード線680が論理高に遷移し(すなわち、アクティブ化しまたはオンになり)、読取りビット線682が論理低に遷移した(すなわち、グランドに結合された)状態で、読取りビット線682を最初の状態(たとえば、グランド)にリセットするためにアクティブ化される。これの後に、MAC演算位相676が続く。例示的なタイミングダイアグラフ670に示されているように、第1の信号線686(すなわち、PCWL1P)は、論理低状態に遷移するためにオンにされ、第2の信号線684(すなわち、PCWL1N)は、論理高状態に遷移するためにオンにされる。第1の信号線686と第2の信号線684とがオンにされた後、ビットセル602の出力688は、読取りビット線682の電圧レベルを増加するために(論理「1」として示される)読取りビット線682に結合される。第1のADC610は、次いで、MAC演算の値を読み取るためにサンプリングされ得る。この例における第1の信号線686および第2の信号線684などの信号線に印加される電圧信号は、望まれるMAC演算によるビットセル出力を生成するためにその信号線の入力状態(input state)に対応するように構成され得る。たとえば、論理「1」または「0」の電圧信号の組合せがビットセルのXNOR出力を生じる図4の真理値表を参照されたい。
【0033】
[0044] ADCにおいて電圧をサンプリングすることに関して、これは、ADCにおける瞬時電圧読取りまたは信号値を指す。ADCは、連続時間および連続振幅アナログ信号を離散時間および離散振幅デジタル信号に変換する。変換は、入力の量子化に関与し、したがって、それは、少量のエラーまたは雑音を必ず導入する。さらに、変換を連続的に実行する代わりに、ADCは、周期的に変換を行い、入力をサンプリングし、入力信号の許容可能な帯域幅を制限する。ADCのパフォーマンスは、主に、それの帯域幅と信号対雑音比(SNR)とによって特徴づけられる。ADCの帯域幅は、それのサンプリングレートによって主に特徴づけられる。ADCのSNRは、解像度、線形性および精度(量子化レベルが真のアナログ信号にどれくらい良好に一致するのか)、エイリアシングおよびジッタを含む多くのファクタによって影響を及ぼされる。ADCは、デジタル化される信号の帯域幅および必要とされるSNRに一致するように選定される。ADCが、信号の帯域幅より2倍よりも大きいサンプリングレートで動作する場合、ナイキストシャノン標本化定理に従って、完全な再構成が可能である。量子化誤差の存在が、理想的なADCのSNRさえも制限する。しかしながら、ADCのSNRが入力信号のSNRを超える場合、それの効果は、無視され、アナログ入力信号の本質的に完全なデジタル表現を生じ得る。
【0034】
[0045] アナログ信号は時間的に連続しており、それは、これをデジタル値の流れに変換する必要がある。したがって、新しいデジタル値がアナログ信号からサンプリングされるレートを定義する必要がある。新しい値のレートは、変換器のサンプリングレートまたはサンプリング周波数と呼ばれる。連続的に変動する帯域制限された信号がサンプリングされ得(言い換えれば、時間T、サンプリング時間、の間隔での瞬時信号値が測定され、潜在的に記憶され)、次いで、元の信号が、補間公式によって離散時間値から再生される。この手順の精度は、サンプリングと量子化との組み合わされた効果によって規定される。高いADC量子化器の解像度の限界では、シャノンナイキスト標本化定理は、サンプリングレートが信号の最高周波数の2倍よりも高い場合にのみ元の信号の忠実な再生が可能であることを暗示する。有限の量子化器の解像度の場合、最高周波数の2倍よりも低いサンプリングレートは、通常、最適なデジタル表現をもたらす。実際的なADCは瞬時変換を行うことができないので、入力値は、(変換時間と呼ばれる)変換器が変換を実行する時間中必ず一定に保持されなければならない。サンプルアンドホールドと呼ばれる入力回路は、たいていの場合、入力時のアナログ電圧を記憶するためにキャパシタを使用することと、入力からキャパシタを切断するために電子スイッチまたはゲートを使用することとによってこのタスクを実行する。多くのADC集積回路は、サンプルアンドホールドサブシステムを内部的に含む。
【0035】
[0046] 図9は、本開示のいくつかの例による、ビットセル回路を動作させるための例示的な部分的な方法を示す。図9に示されているように、部分的な方法900は、ブロック902においてビットセル回路を初期状態にリセットすることで始まる。部分的な方法900は、ブロック904において、第1の信号線に第1の電圧信号を印加することで続ける。部分的な方法900は、ブロック906において、第2の信号線に第2の電圧信号を印加することで続ける。部分的な方法900は、ブロック908において、ビットセル回路の出力に第1の読取りビット線を結合することで続ける。部分的な方法900は、ブロック910において、第1の読取りビット線の電圧レベルをサンプリングすることで終わる。
【0036】
[0047] 図10は、本開示のいくつかの例による、例示的なモバイルデバイスを示す。次に図10を参照すると、例示的な態様に従って構成されたモバイルデバイスのブロック図が示されており、全体的に1000と称される。いくつかの態様では、モバイルデバイス1000は、ワイヤレス通信デバイスとして構成され得る。図示のように、モバイルデバイス1000は、いくつかの態様では本明細書で説明される方法を実装するように構成され得るプロセッサ1001を含む。プロセッサ1001は、当技術分野でよく知られているように命令パイプライン(instruction pipeline)1012と、バッファ処理ユニット(BPU:buffer processing unit)1008と、ブランチ命令キュー(BIQ:branch instruction queue)1011と、スロットラ(throttler)1010とを備えるよう示される。これらのブロックの他のよく知られている詳細(たとえば、カウンタ、エントリ、信頼性フィールド、加重和、コンパレータなど)は、明快のためにプロセッサ1001のこのビューから省略されている。
【0037】
[0048] プロセッサ1001は、ダイ間またはチップ間リンクであり得るリンクを介してメモリ1032に通信可能に結合され得る。モバイルデバイス1000はまた、ディスプレイコントローラ1026がプロセッサ1001とディスプレイ1028とに結合された状態で、ディスプレイ1028とディスプレイコントローラ1026とを含む。
【0038】
[0049] いくつかの態様では、図10は、プロセッサ1001に結合されたコーダ/デコーダ(CODEC)1034(たとえば、オーディオおよび/または音声CODEC)と、CODEC1034に結合されたスピーカ1036およびマイクロフォン1038と、ワイヤレスアンテナ1042およびプロセッサ1001に結合された(モデムを含み得る)ワイヤレスコントローラ1040とを含み得る。
【0039】
[0050] 上記のブロックのうちの1つまたは複数が存在する特定の態様では、プロセッサ1001と、ディスプレイコントローラ1026と、メモリ1032と、CODEC1034と、ワイヤレスコントローラ1040とがシステムインパッケージまたはシステムオンチップデバイス1022中に含まれ得る。入力デバイス1030(たとえば、物理または仮想キーボード)と、電源1044(たとえば、バッテリ)と、ディスプレイ1028と、入力デバイス1030と、スピーカ1036と、マイクロフォン1038と、ワイヤレスアンテナ1042と、電源1044とは、システムオンチップデバイス1022の外部にあり得、インターフェースまたはコントローラなどのシステムオンチップデバイス1022の構成要素に結合され得る。
【0040】
[0051] 図10がモバイルデバイスを示すが、プロセッサ1001およびメモリ1032はまた、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、携帯情報端末(PDA)、固定ロケーションデータユニット、コンピュータ、ラップトップ、タブレット、通信デバイス、モバイルフォン、または他の同様のデバイスに統合され得ることに留意されたい。
【0041】
[0052] 図11は、本開示のいくつかの例による、上述の集積デバイス、半導体デバイス、集積回路、ダイ、インターポーザ、パッケージまたはパッケージオンパッケージ(PoP)のいずれかに統合され得る様々な電子デバイスを示す。たとえば、モバイルフォンデバイス1102と、ラップトップコンピュータデバイス1104と、固定ロケーション端末デバイス1106とは、本明細書で説明されるように集積デバイス1100を含み得る。集積デバイス1100は、たとえば、本明細書で説明される集積回路、ダイ、集積デバイス、集積デバイスパッケージ、集積回路デバイス、デバイスパッケージ、集積回路(IC)パッケージ、パッケージオンパッケージデバイスのいずれかであり得る。図11に示されるデバイス1102、1104、1106は、例にすぎない。他の電子デバイスはまた、限定はしないが、モバイルデバイス、ハンドヘルドパーソナル通信システム(PCS)ユニット、携帯情報端末などのポータブルデータユニット、全地球測位システム(GPS)対応装置、ナビゲーションデバイス、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、メータ読取り機器などの固定ロケーションデータユニット、通信デバイス、スマートフォン、タブレットコンピュータ、コンピュータ、ウェアラブルデバイス、サーバ、ルータ、自動車両(たとえば、自律車両)中に実装される電子デバイス、またはデータもしくはコンピュータ命令を記憶または取り出す任意の他のデバイス、またはそれらの任意の組合せを含むデバイス(たとえば、電子デバイス)のグループを含む集積デバイス1100を特徴づけ得る。
【0042】
[0053] 本明細書で開示する様々な態様は、当業者によって記述および/または認識される構造、材料および/またはデバイスに対する機能的等価物として説明され得ることを諒解されよう。さらに、本明細書または特許請求の範囲に開示された方法、システム、および装置は、この方法のそれぞれの動作を実行するための手段を備えるデバイスによって実施され得る点に留意されたい。たとえば、一態様では、装置は、半導体手段(たとえば、図6の624を参照)と、半導体手段の周りに配設されるカプセル化するための手段、またはカプセル材手段(たとえば、図6の620を参照)とを備え得、ここにおいて、半導体手段の裏面が露出される。そのような装置は、半導体手段に結合された導電するための手段(たとえば、導電層626)をさらに含み得、導電するための手段は、複数の導電性ピラーバンプ(conductive pillar bump)を備え、ここにおいて、複数の導電性ピラーバンプのバンプ密度は5%よりも大きい。カプセル化するための手段またはカプセル材手段は、MUFプロセスを使用して複数の導電性バンプの間にさらに配設され得る。上述の態様は、単に例として与えられており、主張される様々な態様は、例として引用された特定の参照および/または例示に限定されないことを諒解されよう。
【0043】
[0054] 図1図11に示されている構成要素、プロセス、特徴、および/または機能のうちの1つまたは複数は、単一の構成要素、プロセス、特徴または機能に再構成されるおよび/または組み合わされるか、あるいはいくつかの構成要素、プロセス、または機能に組み込まれ得る。また、本開示から逸脱することなく、追加の要素、構成要素、プロセス、および/または機能が追加され得る。また、本開示の図1図11およびそれの対応する説明は、ダイおよび/またはICに限定されないことに留意されたい。いくつかの実装形態では、図1図11およびそれの対応する説明は、集積デバイスを製造、作成、提供、および/または生成するために使用され得る。いくつかの実装形態では、デバイスは、ダイ、集積デバイス、ダイパッケージ、集積回路(IC)、デバイスパッケージ、集積回路(IC)パッケージ、ウエハ、半導体デバイス、パッケージオンパッケージ(PoP)デバイス、および/またはインターポーザを含み得る。
【0044】
[0055] 「例示的」という語は、「例、事例、または例示の働きをすること」を意味するために本明細書で使用される。本明細書において「例示的」と記載されているあらゆる詳細は、他の例よりも有利であると解釈されるべきではない。同様に、「例(example)」という用語は、すべての例が論議された特徴、利点、または動作モードを含むことを意味しない。さらに、特定の特徴および/または構造は、1つまたは複数の他の特徴および/または構造と組み合わせられ得る。さらに、本明細書に記述された装置の少なくとも一部は、本明細書に記述された方法の少なくとも一部を実行するように構成され得る。
【0045】
[0056] 本明細書で使用される用語は、特定の例を説明するためのものであり、本開示の例を限定するよう意図されていない。本明細書で使用される単数形「a」、「an」および「the」は、文脈が別段に明確に示さない限り、複数形をも含むよう意図されている。さらに、本明細書で使用される「備える(comprise)」、「備える(comprising)」、「含む(include)」、および/または「含む(including)」という用語は、述べられた特徴、整数、行為、動作、要素、および/または構成要素の存在を明示するが、1つまたは複数の他の特徴、整数、行為、動作、要素、構成要素、および/またはそれらのグループの存在または追加を排除しないことを理解されよう。
【0046】
[0057] 本明細書において「第1の(first)」、「第2の(second)」などの指示を使用する要素への言及は、それらの要素の数および/または順序を制限するものではない。むしろ、これらの指示は、2つ以上の要素および/または要素のインスタンスを区別する便利な方法として使用される。また、そうでないことが明記されていない限り、要素の組は、1つまたは複数の要素を備えることができる。
【0047】
[0058] 情報および信号は、多種多様な技術および技法のいずれかを使用して表され得ることを、当業者は諒解されよう。たとえば、上記の説明全体にわたって言及され得るデータ、命令、コマンド、情報、信号、ビット、シンボル、およびチップは、電圧、電流、電磁波、磁界または磁性粒子、光場または光学粒子、あるいはそれらの任意の組合せによって表され得る。
【0048】
[0059] 本出願に記載または図示されているものはいずれも、構成要素、動作、機能、利益、利点、または同等物が特許請求の範囲に記載されているかどうかにかかわらず、いかなる構成要素、動作、機能、利益、利点、または同等物も一般に公開することが意図されるものではない。
【0049】
[0060] 本明細書に開示された例に関連して説明された方法、シーケンスおよび/またはアルゴリズムは、ハードウェア、プロセッサによって実行されるソフトウェアモジュール、またはその2つの組合せに直接組み込まれ得る。ソフトウェアモジュールは、RAMメモリ、フラッシュメモリ、ROMメモリ、EPROMメモリ、EEPROM(登録商標)メモリ、レジスタ、ハードディスク、リムーバブルディスク、CD-ROM、または非一時的タイプのメモリもしくは記憶媒体を含む当技術分野で知られている任意の他の形態の記憶媒体中に常駐し得る。例示的な記憶媒体は、プロセッサが記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことができるように、プロセッサに結合される。代替として、記憶媒体はプロセッサに一体化され得る。
【0050】
[0061] いくつかの態様は、デバイスに関連して説明されているが、これらの態様はまた対応する方法の記述を構成することは言うまでもないので、デバイスのブロックまたは構成要素も、対応する方法動作として、または方法動作の特徴として理解されるべきである。それに類似して、方法動作に関連して、または方法動作として記載される態様はまた、対応するデバイスの対応するブロックまたは詳細または特徴の記述を構成する。方法動作の一部または全部は、たとえば、マイクロプロセッサ、プログラマブルコンピュータまたは電子回路などのハードウェア装置によって(またはハードウェア装置を使用して)実行され得る。いくつかの例では、最も重要な方法動作のいくつかまたは複数は、そのような装置によって実行され得る。
【0051】
[0062] 上記の詳細な説明では、異なる特徴が例にまとめられていることがわかる。この開示の方法は、請求される例がそれぞれの請求項において明示的に言及されているよりも多くの特徴を有するという意図として理解されるべきではない。むしろ、本開示は、開示される個々の例のすべての特徴よりも少数を含み得る。したがって、以下の特許請求の範囲は、本明細書に組み込まれると見なされるべきであり、各請求項はそれ自体が別個の例として存在することができる。各請求項はそれ自体が別個の例として存在することができるが、従属請求項は請求項において1つまたは複数の請求項との特定の組合せを指すことができるが、他の例もまた、前記従属請求項と任意の別の従属請求項の主題との組合せ、または任意の特徴と他の従属請求項および独立請求項との組合せを包含する、または含むことができる点に留意されたい。特定の組合せが意図されていないことが明示的に表現されていない限り、そのような組合せが本明細書において提案される。さらに、たとえ前記請求項が独立請求項に直接依存していないとしても、請求項の特徴は別の任意の独立請求項に含まれ得ることもまた意図される。
【0052】
[0063] さらに、いくつかの例では、個々の動作は、複数のサブ動作に細分されてもよく、複数のサブ動作を含み得る。そのようなサブ動作は、個々の動作の開示に含まれ得、個々の動作の開示の一部であり得る。
【0053】
[0064] 前述の開示は本開示の例示的な例を示すが、添付の特許請求の範囲によって定義される本開示の範囲から逸脱することなしに、本明細書において様々な変更および修正が行われ得る点に留意されたい。本明細書に記載された開示の例による方法クレームの機能および/または動作は、任意の特定の順序で実行される必要はない。さらに、よく知られている要素は、本明細書に開示された態様および例の関連する詳細を不明瞭にしないために詳細に説明されず、または省略され得る。さらに、本開示の要素は、単数形で説明または請求されていることがあるが、単数形への限定が明示的に述べられていない限り、複数形が企図される。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
[C1] ビットセル回路であって、
システム電圧とグランドとに結合されたビットセルと、
前記ビットセルに結合された第1の信号線と、
前記ビットセルに結合された第2の信号線と、
前記ビットセルに結合された第3の信号線と、
前記ビットセルに結合された第4の信号線と、
第1の読取り信号線と、前記ビットセルの出力と、第1の読取りビット線とに結合された読取りトランジスタと、
前記ビットセル出力と前記システム電圧とに結合されたキャパシタと
を備えるビットセル回路。
[C2] 前記ビットセルは、前記第1の信号線に結合された第1のトランジスタと、前記第2の信号線に結合された第2のトランジスタと、前記第3の信号線に結合された第3のトランジスタと、前記第4の信号線に結合された第4のトランジスタとを備える、[C1]に記載のビットセル回路。
[C3] 前記ビットセルは、データビット(data bit)に対してラッチ機能を実行するために第1のインバータおよび第2のインバータとして構成された4つのトランジスタを備える、[C2]に記載のビットセル回路。
[C4] 前記第1のトランジスタは、P型トランジスタであり、前記第2のトランジスタは、P型トランジスタであり、前記第3のトランジスタは、N型トランジスタであり、第4のトランジスタは、N型トランジスタである、[C2]に記載のビットセル回路。
[C5] 前記読取りトランジスタはN型トランジスタである、[C1]に記載のビットセル回路。
[C6] 前記ビットセル回路は、前記第1の信号線と、前記第2の信号線と、前記第3の信号線と、前記第4の信号線とに対してXNOR演算を実行するように構成された、[C1]に記載のビットセル回路。
[C7] 前記ビットセル回路は、ニューラルネットワークのメモリアレイ中での計算における電荷共有スタティックランダムアクセスメモリである、[C1]に記載のビットセル回路。
[C8] 前記キャパシタは、前記出力がフロート(float)するのを防ぐためにグランドへの経路(path)を与える、[C1]に記載のビットセル回路。
[C9] 前記ビットセル回路は、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、通信デバイス、モバイルデバイス、モバイルフォン、スマートフォン、携帯情報端末、固定ロケーション端末、タブレットコンピュータ、コンピュータ、ウェアラブルデバイス、ラップトップコンピュータ、サーバ、および自動車両中のデバイスからなるグループから選択されたデバイスに組み込まれる、[C1]に記載のビットセル回路。
[C10] ビットセル回路であって、
システム電圧とグランドとに結合されたビットセルと、
前記ビットセルに結合された第1の信号線と、
前記ビットセルに結合された第2の信号線と、
前記ビットセルに結合された第3の信号線と、
前記ビットセルに結合された第4の信号線と、
第1の読取り信号線と、前記ビットセルの出力と、前記グランドとに結合された読取りトランジスタと、
前記ビットセル出力と前記読取りビット線とに結合されたキャパシタと
を備えるビットセル回路。
[C11] 前記ビットセルは、前記第1の信号線に結合された第1のトランジスタと、前記第2の信号線に結合された第2のトランジスタと、前記第3の信号線に結合された第3のトランジスタと、前記第4の信号線に結合された第4のトランジスタとを備える、[C10]に記載のビットセル回路。
[C12] 前記ビットセルは、データビットに対してラッチ機能を実行するために第1のインバータおよび第2のインバータとして構成された4つのトランジスタを備える、[C11]に記載のビットセル回路。
[C13] 前記第1のトランジスタは、P型トランジスタであり、前記第2のトランジスタは、P型トランジスタであり、前記第3のトランジスタは、N型トランジスタであり、第4のトランジスタは、N型トランジスタである、[C11]に記載のビットセル回路。
[C14] 前記読取りトランジスタはN型トランジスタである、[C10]に記載のビットセル回路。
[C15] 前記ビットセル回路は、前記第1の信号線と、前記第2の信号線と、前記第3の信号線と、前記第4の信号線とに対してXNOR演算を実行するように構成された、[C10]に記載のビットセル回路。
[C16] 前記ビットセル回路は、ニューラルネットワークのメモリアレイ中での計算における電荷共有スタティックランダムアクセスメモリである、[C10]に記載のビットセル回路。
[C17] 前記キャパシタは、前記出力がフロートするのを防ぐためにグランドへの経路を与える、[C10]に記載のビットセル回路。
[C18] 前記ビットセル回路は、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、通信デバイス、モバイルデバイス、モバイルフォン、スマートフォン、携帯情報端末、固定ロケーション端末、タブレットコンピュータ、コンピュータ、ウェアラブルデバイス、ラップトップコンピュータ、サーバ、および自動車両中のデバイスからなるグループから選択されたデバイスに組み込まれる、[C10]に記載のビットセル回路。
[C19] ビットセル回路であって、
システム電圧とグランドとに結合されたビットセルと、
前記ビットセルに結合された第1の信号線と、
前記ビットセルに結合された第2の信号線と、
前記ビットセルに結合された第3の信号線と、
前記ビットセルに結合された第4の信号線と、
第1の読取り信号線と、前記ビットセルの出力と、書込みビット線バーとに結合された読取りトランジスタと、
第3の信号線と前記第4の信号線とに結合された書込みビット線と、
前記ビットセル出力と前記読取りビット線とに結合されたキャパシタと
を備えるビットセル回路。
[C20] 前記ビットセルは、前記第1の信号線に結合された第1のトランジスタと、前記第2の信号線に結合された第2のトランジスタと、前記第3の信号線に結合された第3のトランジスタと、前記第4の信号線に結合された第4のトランジスタとを備える、[C19]に記載のビットセル回路。
[C21] 前記ビットセルは、データビットに対してラッチ機能を実行するために第1のインバータおよび第2のインバータとして構成された4つのトランジスタを備える、[C20]に記載のビットセル回路。
[C22] 前記第1のトランジスタは、P型トランジスタであり、前記第2のトランジスタは、P型トランジスタであり、前記第3のトランジスタは、N型トランジスタであり、第4のトランジスタは、N型トランジスタである、[C20]に記載のビットセル回路。
[C23] 前記読取りトランジスタはN型トランジスタである、[C19]に記載のビットセル回路。
[C24] 前記ビットセル回路は、前記第1の信号線と、前記第2の信号線と、前記第3の信号線と、前記第4の信号線とに対してXNOR演算を実行するように構成された、[C19]に記載のビットセル回路。
[C25] 前記ビットセル回路は、ニューラルネットワークのメモリアレイ中での計算における電荷共有スタティックランダムアクセスメモリである、[C19]に記載のビットセル回路。
[C26] 前記キャパシタは、前記出力がフロートするのを防ぐためにグランドへの経路を与える、[C19]に記載のビットセル回路。
[C27] 前記ビットセル回路は、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、ナビゲーションデバイス、通信デバイス、モバイルデバイス、モバイルフォン、スマートフォン、携帯情報端末、固定ロケーション端末、タブレットコンピュータ、コンピュータ、ウェアラブルデバイス、ラップトップコンピュータ、サーバ、および自動車両中のデバイスからなるグループから選択されたデバイスに組み込まれる、[C19]に記載のビットセル回路。
[C28] ビットセル回路を動作させるための方法であって、
前記ビットセル回路を初期状態にリセットすることと、
第1の信号線に第1の電圧信号を印加することと、
第2の信号線に第2の電圧信号を印加することと、
前記ビットセル回路の出力に第1の読取りビット線を結合することと、
前記第1の読取りビット線の電圧レベルをサンプリングすることと
を備える方法。
[C29] 前記ビット回路(bit circuit)を前記初期状態に前記リセットすることは、グランドに前記第1の読取りビット線を結合することと、システム電圧に第1の読取り信号線を結合することとを備える、[C28]に記載の方法。
[C30] 前記第1の電圧信号と前記第2の電圧信号とは、MAC演算のための所望の入力状態(desired input state)に対応する、[C29]に記載の方法。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11