(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023164436
(43)【公開日】2023-11-10
(54)【発明の名称】3次元のスタックメモリを含む人工知能プロセッサ
(51)【国際特許分類】
H01L 25/07 20060101AFI20231102BHJP
H01L 23/29 20060101ALI20231102BHJP
G11C 5/04 20060101ALI20231102BHJP
【FI】
H01L25/08 Z
H01L25/08 C
H01L23/36 A
G11C5/04 200
【審査請求】有
【請求項の数】25
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023133135
(22)【出願日】2023-08-17
(62)【分割の表示】P 2021546863の分割
【原出願日】2020-02-19
(31)【優先権主張番号】16/357,265
(32)【優先日】2019-03-18
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】521353344
【氏名又は名称】ケプラー コンピューティング インコーポレイテッド
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(74)【代理人】
【識別番号】100135079
【弁理士】
【氏名又は名称】宮崎 修
(72)【発明者】
【氏名】マニパトルニ,サシカンス
(72)【発明者】
【氏名】ドカニア,ラジーヴ クマール
(72)【発明者】
【氏名】マツリヤ,アムリタ
(72)【発明者】
【氏名】ラメッシュ,ラマムーアシー
(57)【要約】
【課題】 3次元のスタックメモリを含む人工知能プロセッサを提供する。
【解決手段】AI処理システムの性能を向上させるためのパッケージング技術について説明する。ICパッケージは、基板と、基板上の第1のダイと、第1のダイの上に積み重ねられた第2のダイを含む。第1のダイはメモリを含み、第2のダイは計算ロジックを含む。第1のダイは、ビットセルを有する強誘電体RAM(FeRAM)、SRAM、又はDRAM等のRAMを含む。各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含む。アクセストランジスタは強誘電体材料に結合される。第1のダイのメモリは、入力データ及び重み係数を格納し得る。第2のダイの計算ロジックは、第1のダイのメモリに結合される。第2のダイは、トレーニングしたモデルの固定重みを入力データに適用して出力を生成する推論ダイである。一例では、第2のダイは、重みの学習を可能にするトレーニングダイである。
【選択図】
図3A
【特許請求の範囲】
【請求項1】
プロセッサシステムであって、当該プロセッサシステムは、
上面を有する基板と、
該基板上のダイのスタックと、を含み、
該ダイのスタックは、
処理コア及び第1のメモリを含む第1のダイと、
該第1のダイと垂直に積層された第2のダイと、を含み、
前記第1のメモリには第1のメモリタイプが含まれ、
前記第2のダイは第2のメモリを含み、該第2のメモリには第2のメモリタイプが含まれ、前記第1のダイ及び前記第2のダイは、はんだバンプではないダイ間(inter-die)銅ピラーを介して接続されており、前記第1のダイの前記第1のメモリは、前記ダイ間銅ピラーに結合された又は前記ダイ間銅ピラーの一部であるシリコン貫通ビアを含む、
プロセッサシステム。
【請求項2】
前記第2のダイに隣接しているが、該第2のダイと垂直に積層されていない第1のシリコン構造と、
前記第2のダイに隣接しているが、該第2のダイと垂直に積層されていない第2のシリコン構造と、をさらに含み、
前記第1のシリコン構造及び前記第2のシリコン構造は前記第2のダイの両側にある、請求項1に記載のプロセッサシステム。
【請求項3】
前記第1のダイは第1の表面を有しており、前記第2のダイは第2の表面を有しており、前記第1の表面が前記第2の表面と完全に重なる又は前記第2の表面が前記第1の表面と完全に重なるように、前記第1の表面は前記第2の表面に対向しており、前記第1の表面は第1の面積を有しており、前記第2の表面は第2の面積を有しており、前記第1の面積は前記第2の面積に実質的に等しい、請求項1に記載のプロセッサシステム。
【請求項4】
前記第1のダイは前記第2のダイ上にある、又は前記第2のダイは前記第1のダイ上にある、請求項1に記載のプロセッサシステム。
【請求項5】
第1のシリコン構造は第1の能動デバイス及び/又は受動デバイスを含み、第2のシリコン構造は第2の能動デバイス及び/又は受動デバイスを含む、請求項1に記載のプロセッサシステム。
【請求項6】
前記第1のメモリタイプは前記第2のメモリタイプと同じであるか、又は前記第1のメモリタイプは前記第2のメモリタイプと異なる、請求項1に記載のプロセッサシステム。
【請求項7】
前記第1のメモリタイプ及び前記第2のメモリタイプには、強誘電体材料が含まれる、請求項1に記載のプロセッサシステム。
【請求項8】
前記第1のダイは強誘電体ロジックを含む、請求項1に記載のプロセッサシステム。
【請求項9】
前記第1のダイは、強誘電体ロジック及び強誘電体メモリを含む、請求項1に記載のプロセッサシステム。
【請求項10】
前記第2のメモリは強誘電体材料を含み、前記第1のメモリはSRAMを含む、請求項1に記載のプロセッサシステム。
【請求項11】
前記第1のメモリはSRAMを含み、前記第2のメモリはSRAMを含む、請求項1に記載のプロセッサシステム。
【請求項12】
前記ダイのスタックの上にヒートスプレッダを含む、請求項1に記載のプロセッサシステム。
【請求項13】
プロセッサシステムを形成する方法であって、当該方法は、
上面を有する基板を形成するステップと、
該基板上にダイのスタックを形成するステップと、を含み、
該ダイのスタックを形成するステップは、
処理コア及び第1のメモリを含む第1のダイを形成するステップであって、前記第1のメモリには第1のメモリタイプが含まれる、ステップと、
前記第1のダイと垂直に積層された第2のダイを形成するステップであって、前記第2のダイは第2のメモリを含み、該第2のメモリには第2のメモリタイプが含まれる、ステップと、
はんだバンプではないダイ間銅ピラーを介して前記第1のダイ及び前記第2のダイを接続するステップであって、前記第1のダイの前記第1のメモリは、ダイ間銅ピラーに結合された又はダイ間銅ピラーの一部であるシリコン貫通ビアを含む、ステップと、を含む、
方法。
【請求項14】
第1のシリコン構造を、前記第2のダイに隣接するが、該第2のダイと垂直に積層せずに配置するステップと、
第2のシリコン構造を、前記第2のダイに隣接するが、該第2のダイと垂直に積層せずに配置するステップと、を含み、前記第1のシリコン構造及び前記第2のシリコン構造は前記第2のダイの両側にある、請求項13に記載の方法。
【請求項15】
前記第1のダイは第1の表面を有しており、前記第2のダイは第2の表面を有しており、前記第1の表面が前記第2の表面と完全に重なる又は前記第2の表面が前記第1の表面と完全に重なるように、前記第1の表面は前記第2の表面に対向しており、前記第1の表面は第1の面積を有しており、前記第2の表面は第2の面積を有しており、前記第1の面積は前記第2の面積に実質的に等しい、請求項13に記載の方法。
【請求項16】
第1のシリコン構造は第1の能動デバイス及び/又は受動デバイスを含み、第2のシリコン構造は第2の能動デバイス及び/又は受動デバイスを含む、請求項13に記載の方法。
【請求項17】
前記第1のダイは前記第2のダイ上にある、又は前記第2のダイは前記第1のダイ上にある、又は前記第1のメモリタイプは前記第2のメモリタイプと同じである、請求項13に記載の方法。
【請求項18】
前記第1のメモリタイプは、前記第2のメモリタイプとは異なる、請求項13に記載の方法。
【請求項19】
前記第1のメモリタイプ及び前記第2のメモリタイプには、強誘電体材料が含まれる、請求項13に記載の方法。
【請求項20】
前記第1のダイは強誘電体ロジックを含む、請求項13に記載の方法。
【請求項21】
前記第1のダイは、強誘電体ロジック及び強誘電体メモリを含む、請求項13に記載の方法。
【請求項22】
前記第2のメモリは強誘電体材料を含み、前記第1のメモリはSRAMを含む、請求項13に記載の方法。
【請求項23】
前記第1のメモリはSRAMを含み、前記第2のメモリはSRAMを含む、請求項13に記載の方法。
【請求項24】
プロセッサシステムの方法であって、当該方法は、
上面を有する基板を形成するステップと、
該基板上にダイのスタックを形成するステップと、を含み、
該ダイのスタックを形成するステップは、
処理コア及び第1のメモリを含む第1のダイを形成するステップであって、前記第1のメモリには第1のメモリタイプが含まれる、ステップと、
前記第1のダイと垂直に積層された第2のダイを形成するステップであって、該第2のダイは第2のメモリを含み、該第2のメモリには第2のメモリタイプが含まれる、ステップと、
はんだバンプではないダイ間銅ピラーを介して前記第1のダイ及び前記第2のダイを接続するステップであって、前記第1のダイは第1のシリコン貫通ビアを含み、前記第2のダイは第2のシリコン貫通ビアを含み、前記第1のシリコン貫通ビア及び前記第2のシリコン貫通ビアは、前記ダイ間銅ピラーに結合される、又はダイ間銅ピラーの一部である、ステップと、を含む、
方法。
【請求項25】
第1のシリコン構造を、前記第2のダイに隣接するが、該第2のダイと垂直に積層せずに配置するステップと、
第2のシリコン構造を、前記第2のダイに隣接するが、該第2のダイと垂直に積層せずに配置するステップと、を含み、前記第1のシリコン構造及び前記第2のシリコン構造は前記第2のダイの両側にある、請求項24に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
優先権の主張
この出願は、2019年3月18日に出願された、“Artificial Intelligence Processor with Three-Dimensional Stacked Memory”という表題の米国特許出願第16/357,265号の優先権を主張するものであり、この文献は、その全体があらゆる目的のために参照により組み込まれる。
【0002】
本願は、3次元のスタックメモリを含む人工知能プロセッサに関する。
【背景技術】
【0003】
人工知能(AI)は、データを解析し、分類し、次にデータに関して決定を行う、ハードウェア及びソフトウェアの計算の広い領域である。例えば、特定の1つ又は複数のプロパティのデータの分類を記述するモデルは、大量のデータを用いて時間の経過とともにトレーニングされる。モデルをトレーニングするプロセスでは、大量のデータと、データを解析するための処理能力とが必要である。モデルがトレーニングされると、モデルの出力に基づいて重み又は重み係数が変更される。データを繰り返し解析し、期待される結果を得るために重みを変更することにより、モデルの重みが高い信頼水準(95%以上等)になるように計算されると、モデルは「トレーニング済み」と見なされる。次に、重みを固定したこのトレーニング済みモデルを使用して、新しいデータに関する決定を行う。モデルをトレーニングしてから、トレーニングしたモデルを新しいデータに適用することは、ハードウェアを集中的に使用する活動である。トレーニングモデルの計算及びトレーニングモデルの使用の待ち時間を短縮し、そのようなAIプロセッサシステムの消費電力を削減したいという要望がある。
【0004】
本明細書で提供する背景技術の説明は、本開示の文脈を一般的に提示することを目的としている。本明細書に別段の記載がない限り、この段落に記載されている資料は、本願の特許請求の範囲に対する先行技術ではなく、この段落に含めることによって先行技術であると認めることはではない。
【図面の簡単な説明】
【0005】
本開示の実施形態は、以下に与える詳細な説明及び本開示の様々な実施形態の添付の図面からより完全に理解されるが、これらは、本開示を特定の実施形態に限定するものと解釈すべきではないが、説明及び理解のためだけにある。
【
図1】いくつかの実施形態による、メモリダイの上部に位置付けされた計算ダイを含む人工知能(AI)マシンの高レベルアーキテクチャを示す。
【
図2】いくつかの実施形態による、メモリダイの上部に位置付けされた計算ダイを含む計算ブロックのアーキテクチャを示す。
【
図3A】いくつかの実施形態による計算ブロックを含むパッケージの断面を示しており、計算ブロックは、メモリダイの上に計算ダイ(例えば、推論論理ダイ)を含む。
【
図3B】いくつかの実施形態による計算ブロックを含むパッケージの断面を示しており、計算ブロックは、メモリダイ及びコントローラ論理ダイのスタックの上の計算ダイ(例えば、推論論理ダイ)を含む。
【
図3C】いくつかの実施形態による計算ブロックを含むパッケージの断面を示しており、計算ブロックは、インターポーザとしても機能するメモリの上の計算ダイを含む。
【
図3D】いくつかの実施形態による計算ブロックを含むパッケージの断面を示しており、計算ブロックは、パッケージの平面に沿った水平スタックにおけるメモリダイ同士の間に計算ダイを含む。
【
図3E】いくつかの実施形態による計算ブロックを含むパッケージの断面を示しており、計算ブロックは、パッケージの平面に沿った計算ダイ及び2つ以上のメモリを含む。
【
図3F】いくつかの実施形態による、インターポーザの上の計算ダイを含む計算ブロックを含むパッケージの断面を示しており、インターポーザは、その中に埋め込まれたメモリダイを含む。
【
図3G】いくつかの実施形態による、パッケージの平面に沿った計算ダイ及び2つ以上のメモリを含む計算ブロックと、インターポーザとしても機能するメモリとを含むパッケージの断面を示す。
【
図3H】いくつかの実施形態による計算ブロックを含むパッケージの断面を示しており、計算ブロックは、インターポーザとしても機能する3D強誘電体メモリの上の計算ダイを含む。
【
図4A】いくつかの実施形態による、計算ブロックを有するシステムオンチップ(SOC)を含む、AIマシンを含むパッケージの断面を示しており、計算ブロックは、メモリの上の計算ダイを含む。
【
図4B】いくつかの実施形態による、計算ブロックを有するSOCを含む、AIマシンを含むパッケージの断面を示しており、計算ブロックは、メモリの上の計算ダイ、プロセッサ、及びソリッドステートメモリを含む。
【
図5】いくつかの実施形態による回路基板上の複数のパッケージの断面を示しており、パッケージのうちの1つはメモリダイの上の計算ダイを含み、パッケージのうちの別のものはグラフィック処理装置を含む。
【
図6】いくつかの実施形態による、水平面に沿ってメモリと接続するために側部にマイクロハンプを備えた計算ダイの上面図の断面を示す。
【
図7】いくつかの実施形態による、パッケージの垂直面に沿ってメモリダイと接続するために、計算ダイの上部及び下部にマイクロバンプを備えた計算ダイの上面図の断面を示す。
【
図8A】いくつかの実施形態による、計算ダイの下にあるメモリダイの断面を示す。
【
図8B】いくつかの実施形態による、メモリダイの上にある計算ダイの断面を示す。
【
図9A】いくつかの実施形態による、計算ダイの下にある、2×2タイルを含むメモリダイの断面を示す。
【
図9B】いくつかの実施形態による、メモリダイの上にある、2×2タイルを含む計算ダイの断面を示す。
【発明を実施するための形態】
【0006】
いくつかの実施形態は、AI処理システムの性能を向上させるためのパッケージング技術を説明する。いくつかの実施形態では、集積回路パッケージが提供され、この集積回路パッケージは、基板、基板上の第1のダイ、及び第1のダイの上に積み重ねられた第2のダイを含み、第1のダイはメモリを含み、第2のダイは計算ロジックを含む。いくつかの実施形態では、第1のダイは、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)を含み、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは、強誘電体材料に結合される。FeRAMは、FeDRAM(強誘電体動的ランダムアクセスメモリ)又はFeSRAM(強誘電体静的ランダムアクセスメモリ)であってもよい。第1のダイのメモリは、入力データ及び重み係数を格納し得る。第2のダイの計算ロジックは、第1のダイのメモリに結合される。第2のダイは、トレーニングしたモデルの固定重みを入力データに適用して出力を生成する推論ダイにすることができる。いくつかの実施形態では、第2のダイは、マトリックス乗算器、加算器、バッファ等を有する処理コア(又は処理エンティティ(PE))を含む。いくつかの実施形態では、第1のダイは、高帯域幅メモリ(HBM)を含む。HBMには、コントローラ及びメモリアレイが含まれ得る。
【0007】
いくつかの実施形態では、第2のダイは、重みを変更することによってモデルをトレーニングし、固定した重みを用いて新しいデータに対してモデルを使用することもできる特定用途向け集積回路(ASIC)を含む。いくつかの実施形態では、メモリは、SRAM(静的ランダムアクセスメモリ)を含む。いくつかの実施形態では、第1のダイのメモリは、MRAM(磁気ランダムアクセスメモリ)を含む。いくつかの実施形態では、第1のダイのメモリは、Re-RAM(抵抗変化型メモリ)を含む。いくつかの実施形態では、基板は活性(active)インターポーザであり、第1のダイは活性インターポーザに埋め込まれる。いくつかの実施形態では、第1のダイ自体は、活性インターポーザである。
【0008】
いくつかの実施形態では、集積回路パッケージは、システムオンチップ(SOC)のためのパッケージである。SOCは、メモリダイ(HBM)の上部の計算ダイと、その計算ダイに隣接する(例えば、プロセッサダイの上部又は側面)メモリダイに結合されたプロセッサダイとを含み得る。いくつかの実施形態では、SOCは、ソリッドステートメモリダイを含む。
【0009】
様々な実施形態のパッケージング技術には多くの技術的効果がある。例えば、メモリダイを計算ダイの下に配置するか、或いは1つ又は複数のメモリダイを計算ダイの側部に配置することで、AIシステムの性能が向上する。いくつかの実施形態では、メモリにFe-RAMを使用することにより、計算ダイによるマトリックス乗算プロセスは、従来のマトリックス乗算よりも15~20倍高速になる。さらに、Fe-RAMを使用すると、SRAMベースのメモリと比較してAIシステムの消費電力が桁違いに削減される。Fe-RAMを使用すると、相互接続エネルギーが低下し、外部メモリの帯域幅要件が低下し、回路の複雑さが軽減され、計算システムのコストが削減される。他の技術的効果は、様々な実施形態及び図から明らかになろう。
【0010】
以下の説明では、本開示の実施形態のより完全な説明を与えるために、多くの詳細について議論する。しかしながら、当業者には、本開示の実施形態がこれらの特定の詳細なしで実施し得ることが明らかであろう。他の例では、本開示の実施形態を不明瞭にすることを避けるために、周知の構造及び装置は、詳細ではなく、ブロック図の形式で示される。
【0011】
実施形態の対応する図面では、信号は線で表されていることに留意されたい。いくつかの線は、より多くの構成信号経路を示すために太く、及び/又は一次情報の流れの方向を示すために1つ又は複数の端部に矢印を含む場合がある。このような指標は、限定することを意図したものではない。むしろ、線は、回路又は論理ユニットのより容易な理解を促すために、1つ又は複数の例示的な実施形態に関連して使用される。設計の必要性又は好みによって決定されるような、表現された信号は、実際には、いずれかの方向に移動し得、任意の適切なタイプの信号スキームで実装され得る1つ又は複数の信号を含み得る。
【0012】
「装置」という用語は、一般に、その用語の使用の文脈による機器を指し得る。例えば、装置は、層又は構造のスタック、単一の構造又は層、能動及び/又は受動要素を有する様々な構造の接続等を指し得る。一般に、装置は、xyzデカルト座標系のxy方向に沿った平面と、z方向に沿った高さとを含む3次元構造である。装置の平面は、装置を含む機器の平面でもあり得る。
【0013】
本明細書全体及び特許請求の範囲において、「接続された」という用語は、中間装置を伴わない、接続されたものの間の電気的、機械的、又は磁気的接続等の直接接続を意味する。
【0014】
「結合された」という用語は、接続されたものの間の直接的な電気的、機械的、又は磁気的接続、或いは1つ又は複数の受動的又は能動的な中間装置を介した間接接続等の、直接接続又は間接接続を意味する。
【0015】
本明細書における「隣接する」という用語は、一般に、あるものが別のものの隣にある(例えば、直ぐ隣にある又はそれらの間に1つ又は複数のものを含んで近くにある)又は別のものに隣接する(例えば、別のものに当接する)位置を指す。
【0016】
「回路」又は「モジュール」という用語は、所望の機能を提供するために互いに協働するように配置された1つ又は複数の受動的及び/又は能動的な構成要素を指し得る。
【0017】
「信号」という用語は、少なくとも1つの電流信号、電圧信号、磁気信号、又はデータ/クロック信号を指し得る。「1つの(a, an)」、及び「その(the)」の意味には、複数形の参照が含まれる。「~内に(in)」の意味には、「~内に(in)」と「~上に(on)」が含まれる。
【0018】
「スケーリング」という用語は、一般に、設計(概略及びレイアウト)をあるプロセス技術から別のプロセス技術に変換し、その後、レイアウト領域を縮小することを指す。「スケーリング」という用語は、一般に、同じ技術ノード内のレイアウト及び装置のダウンサイジングも指す。「スケーリング」という用語は、別のパラメータ、例えば、電源レベルに関連する信号周波数の調整(例えば、減速又は加速-すなわち、それぞれ、スケールダウン又はスケールアップ)を指す場合もある。
【0019】
「実質的に」、「近い(close)」、「略」、「近い(near)」、及び「約、およそ(about)」という用語は、一般に、目標値の+/-10%以内であることを指す。例えば、それらの使用の明示的な文脈で特に指定されない限り、「実質的に等しい」、「およそ等しい」、及び「略等しい」という用語は、そのように記述されたものの間での偶発的な変動に過ぎないことを意味する。当技術分野では、そのような変動は、典型的に、所定の目標値の+/-10%以下である。
【0020】
共通の対象を説明するための序数形容詞「第1」、「第2」、及び「第3」等の使用は、別段の指定がない限り、同様の対象の異なるインスタンスが参照されていることを単に示し、そのように記述した対象が、時間的、空間的、ランク付け、又は他の方法で、特定の順序である必要があることを意味することを意図していない。
【0021】
本開示の目的のために、「A及び/又はB」及び「A又はB」という句は、(A)、(B)、又は(A及びB)を意味する。本開示の目的のために、「A、B、及び/又はC」という句は、(A)、(B)、(C)、(A及びB)、(A及びC)、(B及びC)、又は(A、B、及びC)を意味する。
【0022】
詳細な説明及び特許請求の範囲において、「左」、「右」、「前」、「後」、「上」、「下」、「~の上」、「~の下」等の用語(もしあれば)は、説明の目的で使用され、必ずしも永続的な相対位置を説明するために使用されるわけではない。例えば、本明細書で使用される「~の上」、「~の下」、「前側」、「後側」、「上」、「下」、「~の上」、「~の下」、及び「~上」という用語は、装置内のある構成要素、構造、又は材料の、他の参照される構成要素、構造、又は材料に対する相対的な位置を指す。このような物理的な関係は注目に値する。これらの用語は、本明細書で説明の目的でのみ使用され、主に装置のz軸の文脈で使用されるため、装置の向きに関連している場合がある。このため、本明細書で提供される図の文脈における第2の材料「の上」の第1の材料は、装置が、提供される図の文脈に対して逆さまに向き合わせされている場合に、第2の材料「の下」にもなり得る。材料の文脈では、別の材料の上又は下に配置された1つの材料は、直接接触している場合もあれば、1つ又は複数の材料が介在している場合もある。さらに、2つの材料の間に配置された1つの材料は、2つの層と直接接触していてもよく、或いは1つ又は複数の間に介在する層を有していてもよい。対照的に、第2の材料「上」の第1の材料は、その第2の材料と直接接触している。構成要素アセンブリの文脈でも、同様の区別が行われ得る。
【0023】
「~の間」という用語は、装置のz軸、x軸、又はy軸の文脈で使用され得る。他の2つの材料の間にある材料は、それらの材料の一方又は両方と接触している場合もあれば、1つ又は複数の介在材料によって他の2つの材料の両方から分離される場合もある。従って、他の2つの材料「の間」にある材料は、他の2つの材料のいずれかと接触している場合もあれば、介在する材料を介して他の2つの材料に結合される場合もある。他の2つの装置の間にある装置は、それらの装置の一方又は両方に直接接続することも、1つ又は複数の介在装置によって他の2つの装置の両方から分離することもできる。
【0024】
ここで、「バックエンド」という用語は、一般に、「フロントエンド」の反対側であり、IC(集積回路)パッケージがICダイバンプに結合するダイのセクションを指す。例えば、高レベルの金属層(例えば、10個の金属スタックダイの6以上の金属層)及びダイパッケージに近い対応するビアは、ダイのバックエンドの一部と見なされる。逆に、「フロントエンド」という用語は、一般に、活性領域(例えば、トランジスタが製造される場所)及び低レベルの金属層及び活性領域に近い対応するビア(例えば、10個の金属スタックダイの例の5以下の金属層)を含むダイのセクションを指す。
【0025】
他の図の要素と同じ参照符号(又は名前)を有する図のそれらの要素は、説明したものと同様の方法で動作又は機能することができるが、それに限定されないことが指摘される。
【0026】
図1は、いくつかの実施形態による、メモリダイの上部に位置付けされた計算ダイを含む人工知能(AI)マシン100の高レベルアーキテクチャを示している。AIマシン100は、ランダムアクセスメモリ(RAM)102及び計算ロジック103を有する計算ブロック101又はプロセッサ、静的ランダムアクセスメモリ(SRAM)104、メインプロセッサ105、動的ランダムアクセスメモリ(DRAM)106、及びソリッドステートメモリ又はドライブ(SSD)107を含む。いくつかの実施形態では、AIマシンの一部又は全ての構成要素は、単一のパッケージにパッケージ化され、システムオンチップ(SOC)を形成する。いくつかの実施形態では、計算ブロック101は、単一のパッケージにパッケージ化され、次に、プリント回路基板(PCB)上のプロセッサ105及びメモリ104、106、及び107に結合される。様々な実施形態において、計算ブロック101は、専用計算ダイ103又はマイクロプロセッサを含む。いくつかの実施形態では、RAM102は、専用計算ダイ103のための特別なメモリ/キャッシュを形成する強誘電体RAM(Fe-RAM)である。いくつかの実施形態では、計算ダイ103は、人工知能、グラフ処理、及びデータ処理のアルゴリズム等のアプリケーションに特化している。いくつかの実施形態では、計算ダイ103は、例えば乗算器及びバッファのための論理計算ブロック、Fe-RAMを含む特別なデータメモリブロック(例えば、バッファ)をさらに有する。いくつかの実施形態では、FE-RAM102は、計算効率を向上させるために、重み及び入力が順番に格納されている。プロセッサ105又は専用プロセッサ105、FE-SRAM104、及び計算ダイ103の間の相互接続は、高帯域幅及び低遅延のために最適化される。
図1のアーキテクチャにより、効率的なパッケージングが可能になり、エネルギー/電力/コストを削減できる。
【0027】
いくつかの実施形態では、RAM102は、入力データ(又は処理すべきデータ)102a及び重み係数102bを格納するようにパーティション分割されたSRAMを含む。いくつかの実施形態では、RAM102は、Fe-RAMを含む。例えば、RAM102は、FE-DRAM又はFE-SRAMを含む。いくつかの実施形態では、入力データ103aは、別個のメモリ(例えば、別個のメモリダイ)に格納され、重み係数102bは、別個のメモリ(例えば、別個のメモリダイ)に格納される。
【0028】
いくつかの実施形態では、計算ロジック103は、マトリックス乗算器、加算器、連結ロジック、バッファ、及び組合せロジックを含む。様々な実施形態において、計算ロジック103は、入力102a及び重み102bに対して乗算演算を行う。いくつかの実施形態では、重み102bは固定重みである。例えば、プロセッサ105(例えば、グラフィック処理装置(GPU)、AIプロセッサ、中央処理装置(CPU)、又は他の任意の高性能プロセッサ)は、トレーニングモデルの重みを計算する。重みが計算されると、それら重みはメモリ102bに格納される。様々な実施形態において、トレーニングしたモデルを使用して解析される入力データは、計算ブロック101によって計算した重み102bを用いて処理され、出力(例えば、分類結果)を生成する。
【0029】
いくつかの実施形態では、SRAM104は、強誘電体ベースのSRAMである。例えば、強誘電体トランジスタを有する6トランジスタ(6T)SRAMビットセルが、不揮発性Fe-SRAMを実装するために使用される。いくつかの実施形態では、SSD107は、NANDフラッシュセルを含む。いくつかの実施形態では、SSD107は、NORフラッシュセルを含む。いくつかの実施形態では、SSD107は、マルチ閾値NANDフラッシュセルを含む。
【0030】
様々な実施形態において、不揮発性のFe-RAMは、アーキテクチャ100のセキュリティ、機能安全、及びより速い再起動時間等の新機能を導入するために使用される。不揮発性Fe-RAMは、データへの高速アクセス及び重みを提供する低電力RAMである。Fe-RAM104は、推論ダイ101(又はアクセラレータ)の高速ストレージとしても機能し、推論ダイ101(又はアクセラレータ)は、典型的に、容量が少なく、アクセス要件が高速である。
【0031】
様々な実施形態において、Fe-RAM(Fe-DRAM又はFe-SRAM)は、強誘電体材料を含む。強誘電性(FE)材料は、トランジスタのゲートスタック又はメモリのコンデンサにあり得る。強誘電体材料は、FE材料がその状態を低電圧(例えば、100mV)によって切り替えるのを可能にする任意の適切な低電圧FE材料であり得る。いくつかの実施形態では、FE材料は、タイプABO3のペロブスカイトを含み、「A」及び「B」は、異なるサイズの2つのカチオンであり、「O」は、両方のカチオンに結合するアニオンである酸素である。一般に、Aの原子のサイズはBの原子のサイズよりも大きい。いくつかの実施形態では、ペロブスカイトを(例えば、La又はランタニドによって)ドープすることができる。様々な実施形態において、FE材料がペロブスカイトである場合に、導電性酸化物は、タイプAA’BB’O3である。A’は、原子サイトAのドーパントであり、ランタニド系列の元素であり得る。B’は、原子サイトBのドーパントであり、遷移金属元素、特にSc、Ti、V、Cr、Mn、Fe、Co、Ni、Cu、Znの元素であり得る。A’はサイトAと同じ原子価を有し、強誘電分極率が異なる場合がある。
【0032】
いくつかの実施形態では、FE材料は、タイプh-RMnO3の六角形の強誘電体を含み、Rは、希土類元素、つまり、セリウム(Ce)、ジスプロシウム(Dy)、エルビウム(Er)、ユーロピウム(Eu)、ガドリニウム(Gd)、ホルミウム(Ho)、ランタン(La)、ルテチウム(Lu)、ネオジム(Nd)、プラセオジミウム(Pr)、プロメチウム(Pm)、サマリウム(Sm)、スカンジウム(Sc)、テルビウム(Tb)、ツリウム(Tm)、イッテルビウム(Yb)、及びイットリウム(Y)である。強誘電相は、Yイオンの変位を伴う、層状のMnO5多面体の座屈を特徴とし、その変位は、正味の電気分極を引き起こす。いくつかの実施形態では、六角形のFEは、YMnO3又はLuFeO3のうちの1つを含む。様々な実施形態において、FE材料が六角形の強誘電体を含む場合に、導電性酸化物は、A2O3(例えば、In2O3、Fe2O3)及びABO3タイプであり、「A」は希土類元素であり、BはMnである。
【0033】
いくつかの実施形態では、FE材料は、不適切なFE材料を含む。不適切な強誘電体とは、一次秩序パラメータ(primary order parameter)が原子秩序のひずみ又は座屈等の秩序メカニズムである強誘電体である。不適切なFE材料の例としては、LuFeO3クラスの材料、又は強誘電体材料及び常誘電体材料(それぞれPbTiO3(PTO)とSnTiO3(STO)、及びそれぞれLaAlO3(LAO)とSTO)の超格子である。例えば、[PTO/STO]n又は[LAO/STO]nの超格子であり、「n」は1~100の間である。ここでの様々な実施形態は、電荷状態を記憶するための強誘電体材料に関して説明しているが、実施形態は、常誘電体材料にも適用可能である。
【0034】
図2は、いくつかの実施形態による、メモリダイの上部に位置付けされた計算ダイを含む計算ブロック200(例えば、101)のアーキテクチャを示している。
図2のアーキテクチャは、入力及び重みのためのRAMメモリバッファがダイ1で分割され、論理及びオプションのメモリバッファがダイ2で分割される、専用計算ダイのアーキテクチャを示している。
【0035】
いくつかの実施形態では、メモリダイ(例えば、ダイ1)は、ヒートシンク又は熱ソリューション(thermal solution:熱的解決策)が計算ダイに隣接するように、計算ダイ(例えば、ダイ2)の下に位置付けされる。いくつかの実施形態では、メモリダイはインターポーザに埋め込まれる。いくつかの実施形態では、メモリダイは、その基本的なメモリ機能に加えて、インターポーザとして動作する。いくつかの実施形態では、メモリダイは、スタック内のメモリの複数のダイと、メモリダイのスタックへの読取り及び書込み機能を制御するためのコントローラとを含む高帯域幅メモリ(HBM)である。いくつかの実施形態では、メモリダイは、入力データを格納するための第1のダイ201と、重み係数を格納するための第2のダイ202とを含む。いくつかの実施形態では、メモリダイは、メモリダイの第1のパーティション201が入力データを格納するために使用され、メモリダイの第2のパーティション202が重みを格納するために使用されるようにパーティション分割される単一のダイである。いくつかの実施形態では、メモリダイはFE-DRAMを含む。いくつかの実施形態では、メモリダイはFE-SRAMを含む。いくつかの実施形態では、メモリダイはMRAMを含む。いくつかの実施形態では、メモリダイはSRAMを含む。例えば、メモリパーティション201及び202、又はメモリダイ201及び202は、FE-SRAM、FE-DRAM、SRAM、及び/又はMRAMのうちの1つ又は複数を含む。いくつかの実施形態では、メモリパーティション又はダイ201に格納される入力データは、トレーニングしたモデルによって、メモリパーティション又はダイ202に格納された固定重みを用いて解析されるデータである。
【0036】
いくつかの実施形態では、計算ダイは、マトリックス乗算器203、ロジック(logic:論理)204、及び一時バッファ205を含む。マトリックス乗算器203は、入力データ「X」及び重み「W」に対して乗算演算を行って、出力「Y」を生成する。この出力は、ロジック204によってさらに処理され得る。いくつかの実施形態では、ロジック204は、閾値演算、プーリング及びドロップアウト演算、及び/又は連結演算を行って、AI論理原始関数を完了する。いくつかの実施形態では、ロジック204の出力(例えば、処理した出力「Y」)は、バッファ205に一時的に格納される。いくつかの実施形態では、バッファ205は、Fe-SRAM、Fe-DRAM、MRAM、抵抗変化型RAM(Re-RAM)、及び/又はSRAMのうちの1つ又は複数等のメモリである。いくつかの実施形態では、バッファ205は、メモリダイ(例えば、ダイ1)の一部である。いくつかの実施形態では、バッファ205は、リタイマーの機能を実行する。いくつかの実施形態では、バッファ205の出力(例えば、処理した出力「Y」)は、メモリパーティション又はダイ202内の重みを変更するために使用される。そのような一実施形態では、計算ブロック200は、推論回路としてだけでなく、モデルをトレーニングするためのトレーニング回路としても動作する。いくつかの実施形態では、マトリックス乗算器203は、乗算器セルのアレイを含み、FeRAM201及び202はそれぞれ、メモリビットセルのアレイを含み、各乗算器セルは、FE-RAM201及びFE-RAM202の対応するメモリビットセルに結合される。いくつかの実施形態では、計算ブロック200は、各乗算器セルが相互接続ファイバに結合されるように、乗算器セルのアレイに結合された相互接続ファイバを含む。
【0037】
アーキテクチャ200は、重み、入力、及び出力のためのデータ局所性を提供することによって、計算ダイ(例えば、ダイ2)のための低減したメモリアクセスを提供する。一例では、AI計算ブロック(例えば、マトリックス乗算器203)との間のデータは、同じパッケージングユニット内でローカルに処理される。アーキテクチャ200はまた、メモリ及び論理演算をそれぞれメモリダイ(例えば、ダイ1)及び論理ダイ(例えば、ダイ2)に分離し、最適化したAI処理を可能にする。分離した(Desegregated)ダイにより、ダイの歩留まりが向上する。ダイ1の大容量メモリプロセスにより、メモリへの外部相互接続の電力を削減し、統合のコストを削減し、設置面積を小さくすることもできる。
【0038】
図3Aは、いくつかの実施形態による計算ブロックを含むパッケージ300の断面を示しており、計算ブロックは、メモリダイの上の計算ダイ(例えば、推論論理ダイ)を含む。
【0039】
いくつかの実施形態では、集積回路(IC)パッケージアセンブリは、回路基板301に結合される。いくつかの実施形態では、回路基板301は、エポキシラミネート等の電気絶縁材料から構成されるプリント回路基板(PCB)であり得る。例えば、回路基板301は、フェノール綿紙材料(例えば、FR-1)、綿紙及びエポキシ材料(例えば、FR-3)、エポキシ樹脂(FR-4)を使用して一緒に積層される織ガラス材料、エポキシ樹脂を含むガラス/紙(例えば、CEM-1)、エポキシ樹脂を含むガラス複合材、ポリテトラフルオロエチレンを含むガラス織物(例えば、PTFE CCL)、又は他のポリテトラフルオロエチレンベースのプリプレグ材料等の材料から構成される電気絶縁層を含み得る。いくつかの実施形態では、層301は、パッケージ基板であり、且つICパッケージアセンブリの一部である。
【0040】
ICパッケージアセンブリは、基板302、メモリダイ303(例えば、
図2のダイ1)、計算ダイ304(例えば、
図2のダイ2)を含み得る。様々な実施形態において、メモリダイ303は、計算ダイ304の下にある。この特定のトポロジーは、AIシステムの全体的な性能を向上させる。様々な実施形態において、計算ダイ304は、推論ダイの論理部分を含む。推論ダイ又はチップは、トレーニングしたモデルに関連付けられた固定重み及び入力を適用して出力を生成するために使用される。推論ダイ304に関連するメモリ3003を分離することにより、AI性能が向上する。さらに、そのようなトポロジーは、電力消費源、推論ダイ304から熱を放散させるヒートシンク315等の熱ソリューションのより良い使用を可能にする。様々な実施形態において、メモリ303は、FE-SRAM、FE-DRAM、SRAM、MRAM、抵抗RAM(Re-RAM)の1つ又は複数、又はそれらの組合せであり得る。FE-SRAM、MRAM、又はRe-RAMを使用すると、低電力で高速のメモリ動作が可能になる。これにより、メモリダイ303を計算ダイ304の下に配置して、計算ダイ304に対して熱ソリューションをより効率的に使用することができる。いくつかの実施形態では、メモリダイ303は高帯域幅メモリ(HBM)である。
【0041】
いくつかの実施形態では、計算ダイ304は、特定用途向け回路(ASIC)、プロセッサ、又はそのような機能のいくつかの組合せである。いくつかの実施形態では、メモリダイ303及び計算ダイ304の一方又は両方は、封止材料318に埋め込まれ得る。いくつかの実施形態では、封止材料318は、エポキシベースのビルドアップ基板、他の誘電体材料/有機材料、樹脂、エポキシ、ポリマー接着剤、シリコーン、アクリル、ポリイミド、シアネートエステル、熱可塑性樹脂、及び/又は熱硬化性樹脂等の任意の適切な材料であり得る。
【0042】
いくつかの実施形態では、メモリダイ303は、第1の側S1と、第1の側S1の反対側の第2の側S2とを有し得る。いくつかの実施形態では、第1の側S1は、一般にダイの「不活性」又は「後」側と呼ばれるダイの側であり得る。いくつかの実施形態では、メモリダイ303の後側は、能動的又は受動的装置、信号及び電力経路指定等を含み得る。いくつかの実施形態では、第2の側S2は、1つ又は複数のトランジスタ(例えば、アクセストランジスタ)を含み得、一般に、ダイの「活性」又は「前」側と呼ばれるダイの側である。いくつかの実施形態のメモリ回路は、ダイの前側にも能動的及び受動的装置を有することができる。いくつかの実施形態では、メモリダイ303の第2の側S2は、1つ又は複数の電気経路指定特徴310を含み得る。いくつかの実施形態では、計算ダイ304は、1つ又は複数の電気経路指定特徴312を備えた「活性」又は「前」側を含み得る。いくつかの実施形態では、電気経路指定特徴312は、ボンドパッド、マイクロバンプ、はんだボール、又は任意の他の適切な結合技術であり得る。
【0043】
いくつかの実施形態では、メモリダイ302は、基板302を電気経路指定特徴312を介して計算ダイ304に結合する1つ又は複数のシリコン貫通ビア(TSV)を含み得る。例えば、計算ダイ304は、ダイ相互接続によってメモリダイ303に結合される。いくつかの実施形態では、ダイ間(inter-die)相互接続は、はんだバンプ、銅ピラー、又は他の導電性特徴であり得る。いくつかの実施形態では、インターフェイス層(界面層)(図示せず)が、メモリダイ303と計算ダイ304との間に設けられ得る。メモリダイ303は、TSVを使用して計算ダイ304に結合され得る。いくつかの実施形態では、対応するはんだボールを備えた相互接続ピラーを使用して、メモリダイ303を計算ダイ304に接続する。いくつかの実施形態では、インターフェイス層(図示せず)は、アンダーフィル、接着剤、誘電体、又は他の材料の層であり得るか、又はそれを含み得る。いくつかの実施形態では、インターフェイス層は、機械的強度、伝導性、熱放散、又は接着を提供する等、様々な機能を果たし得る。
【0044】
いくつかの実施形態では、パッケージ基板303は、コアレス基板であり得る。例えば、パッケージ基板302は、複数の「バンプレス」ビルドアップ層を含む「バンプレス」ビルドアップ層(BBUL)アセンブリであり得る。ここで、「バンプレスビルドアップ層」という用語は、「バンプ」と見なされ得るはんだ又は他の取付け手段を使用せずに、一般に、基板及びその中に埋め込まれた構成要素の層を指す。しかしながら、様々な実施形態は、ダイと基板との間のBBULタイプの接続に限定されず、任意の適切なフリップチップ基板に使用することができる。いくつかの実施形態では、1つ又は複数のビルドアップ層は、信頼性、反り低減等のために変更及び/又は最適化され得る材料特性を有し得る。いくつかの実施形態では、パッケージ基板504は、ポリマー、セラミック、ガラス、又は半導体材料から構成され得る。いくつかの実施形態では、パッケージ基板302は、従来のコア基板及び/又はインターポーザであり得る。いくつかの実施形態では、パッケージ基板302は、その中に埋め込まれた能動的及び/又は受動的装置を含む。
【0045】
いくつかの実施形態では、パッケージ基板302の上側は、メモリダイ303の第2の表面S2及び/又は電気経路指定特徴310に結合される。いくつかの実施形態では、パッケージ基板302の反対側の下側は、パッケージ相互接続317によって回路基板301に結合される。いくつかの実施形態では、パッケージ相互接続316は、パッケージ基板504の第2の側に配置された電気経路指定特徴317を、回路基板301上の対応する電気経路指定特徴315に結合することができる。
【0046】
いくつかの実施形態では、パッケージ基板504は、メモリダイ303(及び/又は計算ダイ304)と、回路基板301及び/又はICパッケージアセンブリの外部の他の電気部品との間で電気信号を経路指定するために、その中に形成された電気経路指定特徴を有し得る。いくつかの実施形態では、パッケージ相互接続316及びダイ相互接続310は、例えば、金属、合金、はんだ付け可能材料、又はそれらの組合せを使用して形成されたバンプ、ピラー又はボールを含む、多種多様な適切な構造及び/又は材料のいずれかを含む。いくつかの実施形態では、電気経路指定特徴315は、ボールグリッドアレイ(BGA)又は他の構成で配置され得る。
【0047】
いくつかの実施形態では、計算ダイ304は、前面から後面への(front-to-back)構成でメモリダイ303に結合される(例えば、計算ダイ303の「前」又は「活性」側は、メモリダイ303の「後」又は「不活性」側S1に結合される)。いくつかの実施形態では、ダイは、前面から前面(front-to-front)、後面から後面(back-to-back)、又は左右(side-to-side)の配置で互いに結合され得る。いくつかの実施形態では、1つ又は複数の追加のダイを、メモリダイ303、計算ダイ304、及び/又はパッケージ基板302と結合してもよい。いくつかの実施形態では、ICパッケージアセンブリは、例えば、フリップチップ及びワイヤボンディング技術の組合せ、インターポーザ、電気信号を経路指定するためのシステムオンチップ(SOC)及び/又はパッケージオンパッケージ(PoP)構成を含むマルチチップパッケージ構成を含み得る。
【0048】
いくつかの実施形態では、メモリダイ303及び計算ダイ304は、単一のダイであり得る。いくつかの実施形態では、メモリダイ303は、2つ以上のダイを含むHBMであり、2つ以上のダイは、コントローラダイ及びメモリダイを含む。いくつかの実施形態では、計算ダイはさらに2つのダイを含み得る。例えば、バッファ205は、メモリダイ303の表面S1の近くに結合された別個のメモリダイであり得、マトリックス乗算及び他の計算ユニットは、別個のダイ内にあり得る。一例では、メモリダイ303及び/又は計算ダイ304は、その上に形成された2つ以上のダイを有するウェーハ(又はウェーハの一部)であり得る。いくつかの実施形態では、メモリダイ303及び/又は計算ダイ304は、封止材料318に埋め込まれた2つ以上のダイを含む。いくつかの実施形態では、2つ以上のダイは、並べて配置されるか、垂直方向に積み重ねられるか、又は他の任意の適切な配置で位置付けされる。
【0049】
様々な実施形態において、ヒートシンク315及び関連するフィンが、計算ダイ304に結合される。ヒートシンク315が熱ソリューションとして示されているが、他の熱ソリューションも使用され得る。例えば、ヒートシンク315に加えて、又はヒートシンク315の代わりに、ファン、液体冷却等を使用してもよい。
【0050】
図3Bは、いくつかの実施形態による計算ブロックを含むパッケージ320の断面を示しており、計算ブロックは、メモリダイ及びコントローラ論理ダイのスタックの上の計算ダイ(例えば、推論論理ダイ)を含む。パッケージ320の実施形態を不明瞭にしないために、パッケージ300と320との間の違いを議論する。ここで、メモリダイ303は、コントローラダイ323及びメモリダイ(RAM)324b及び324bのスタックに置き換えられる。いくつかの実施形態では、コントローラダイ323は、読取りロジック、書込みロジック、列及び行マルチプレクサ、エラー訂正ロジック、RAM324a/bとのインターフェイス、計算ダイ304とのインターフェイス、及び基板302とのインターフェイスを含むメモリコントローラである。様々な実施形態において、メモリダイ324a/bは、コントローラダイ323の上に配置又は積み重ねられる。いくつかの実施形態では、RAM324a/bは、FE-SRAM、FE-DRAM、SRAM、MRAM、Re-RAMの1つ又は複数、又はそれらの組合せである。いくつかの実施形態では、RAMダイ324aは入力を格納するために使用される一方、RAMダイ324bは重みを格納するために使用される。いくつかの実施形態では、RAMダイ324a/bのいずれも、バッファ205のためのメモリを含むことができる。
図3Bの実施形態は、2つのRAMダイを示しているが、任意の数のRAMダイをコントローラダイ323の上に積み重ねることができる。
【0051】
図3Cは、いくつかの実施形態による計算ブロックを含むパッケージ330の断面を示しており、計算ブロックは、インターポーザとしても機能するメモリの上の計算ダイ304を含む。パッケージ300と比較して、ここでは、メモリダイ303が、取り外され、インターポーザ332に統合されており、メモリが、記憶機能だけでなくインターポーザの機能も提供するようになっている。この構成により、パッケージのコストを削減できる。ここで、相互接続310は、計算ダイ304をメモリ332に電気的に結合する。メモリ332は、FE-SRAM、FE-DRAM、SRAM、MRAM、Re-RAM、又はそれらの組合せを含み得る。
【0052】
図3Dは、いくつかの実施形態による計算ブロックを含むパッケージ340の断面を示しており、計算ブロックは、パッケージの平面に沿った水平スタックにおけるメモリダイ同士の間に計算ダイを含む。パッケージ300と比較して、ここで、計算ダイ304は、メモリ343と345との間に位置付けされ、RAMダイ343が相互接続310を介して基板302に結合される。様々な実施形態において、計算ダイ304は、相互接続311a及び311bそれぞれを介してその前側と後側との両方を通ってRAMダイ343及び345と通信する。この実施形態は、計算ダイ304が、能動的装置をそのフロントエンド及びバックエンドに適用することによって、その面積(real-estate)を効率的に使用するのを可能にする。RAMダイ343/345は、FE-SRAM、FE-DRAM、SRAM、MRAM、Re-RAM、又はそれらの組合せを含み得る。いくつかの実施形態では、RAMダイ343は入力を格納するために使用される一方、RAMダイ345は重みを格納するために使用される。いくつかの実施形態では、RAMダイ343又は345のいずれも、バッファ205のためのメモリを含むことができる。
図3Dの実施形態は2つのRAMダイを示しているが、任意の数のRAMダイを、計算ダイ304の上及び下に積み重ねることができる。
【0053】
図3Eは、いくつかの実施形態による計算ブロックを含むパッケージ350の断面を示しており、計算ブロックは、パッケージの平面に沿った計算ダイ及び2つ以上のメモリを含む。パッケージ300と比較して、ここでは、計算ダイ304は中央にあり、メモリダイ354及び355は計算ダイ304の両側にある。いくつかの実施形態では、メモリダイは計算ダイ304を取り囲む。AI処理はメモリ集約的である。そのような実施形態は、計算ダイ304がその4つの側面からメモリにアクセスするのを可能にする。この場合のヒートシンク315は、メモリダイ354及び355、及び計算ダイ304に結合される。RAMダイ354及び355は、FE-SRAM、FE-DRAM、SRAM、MRAM、Re-RAM、又はそれらの組合せを含み得る。RAMダイ354及び355はHBMを含み得る。各HBMは、2つ以上のメモリダイ、及び1つのコントローラを含む。いくつかの実施形態では、RAMダイ354は入力を格納するために使用される一方、RAMダイ355は重みを格納するために使用される。いくつかの実施形態では、RAMダイ354又は355のいずれも、バッファ205のためのメモリを含むことができる。
図3Eの実施形態は2つのRAMダイを示しているが、任意の数のRAMダイを、計算ダイ304の側面に沿って位置付けすることができる。
【0054】
図3Fは、いくつかの実施形態による、インターポーザの上の計算ダイを含む計算ブロックを含むパッケージ360の断面を示しており、インターポーザは、その中に埋め込まれたメモリダイを含む。パッケージ300と比較して、ここでは、メモリダイ363は、基板又はインターポーザ302に埋め込まれる。この実施形態は、パッケージのz高さを低減することを可能にし、また、計算ダイ304から基板301に結合する他の装置との間の待ち時間を低減する。RAMダイ363は、FE-SRAM、FE-DMAM、SRAM、MRAM、Re-RAM、又はそれらの組合せを含み得る。RAMダイ363はHBMを含み得る。各HBMは、2つ以上のメモリダイ、及び1つのコントローラを含む。
図3Fの実施形態は1つのRAMダイ363を示しているが、任意の数のRAMダイを、インターポーザ302に埋め込むことができる。
【0055】
図3Gは、いくつかの実施形態による、パッケージの平面に沿った計算ダイ及び2つ以上のメモリを含む計算ブロックと、インターポーザとしても機能するメモリとを含むパッケージ370の断面を示している。パッケージ350と比較すると、ここでは、計算ダイの側面にあるメモリ374及び375は、RAM(例えば、SRAM、Fe-RAM、MRAM、又はRe-RAM)である。様々な実施形態において、インターポーザ302は、インターポーザとして動作するメモリで置き換えられる。メモリは、FE-RAM、MRAM、Re-RAM、又はSRAMのいずれかとすることができる。いくつかの実施形態では、インターポーザ内のメモリは、インターポーザとしても機能する3次元(3D)Fe-RAMスタックである。いくつかの実施形態では、3Dメモリスタックは、MRAM、Re-RAM、又はSRAMのスタックである。
【0056】
図3Hは、いくつかの実施形態による計算ブロックを含むパッケージ380の断面を示しており、計算ブロックは、インターポーザとしても機能する3D強誘電体メモリの上の計算ダイを含む。パッケージ330と比較して、様々な実施形態において、メモリインターポーザ332は、インターポーザとしても機能する3次元(3D)Fe-RAMスタックに置き換えられる。いくつかの実施形態では、3Dメモリスタックは、MRAM、Re-RAM、又はSRAMのスタックである。
【0057】
図4Aは、いくつかの実施形態による、計算ブロックを有するシステムオンチップ(SOC)を含む、AIマシンを含むパッケージ400の断面を示しており、計算ブロックは、メモリの上の計算ダイを含む。パッケージ400は、基板又はインターポーザ302に結合されたプロセッサダイ406を含む。2つ以上のメモリダイ407(例えば、メモリ104)及び408(例えば、メモリ106)が、プロセッサダイ406上に積み重ねられる。プロセッサダイ406(例えば、105)は、中央処理装置(CPU)、グラフィック処理装置(GPU)、特定用途向け集積回路(ASIC)のいずれかとすることができる。メモリ(RAM)ダイ407及び408は、FE-SRAM、FE-DRAM、SRAM、MRAM、Re-RAM、又はそれらの組合せを含み得る。いくつかの実施形態では、RAMダイ407及び408は、HBMを含み得る。いくつかの実施形態では、メモリ104及び106のうちの一方は、ダイ405内のHBMとして実装される。HBMダイ405内のメモリは、FE-SRAM、FE-DRAM、SRAM、MRAM、Re-RAMの任意の1つ又は複数、又はそれらの組合せを含む。ヒートシンク315は、封止材料318内の様々なダイに熱管理ソリューションを提供する。いくつかの実施形態では、ソリッドステートドライブ(SSD)409が、ヒートシンク315を含む第1のパッケージアセンブリの外側に位置付けされる。いくつかの実施形態では、SSD409は、NANDフラッシュメモリ、NORフラッシュメモリ、又はMRAM、FE-DRAM、FE-SRAM、Re-RAM等の任意の他のタイプの不揮発性メモリのうちの1つを含む。
【0058】
図4Bは、いくつかの実施形態による、計算ブロックを有するSOCを含む、AIマシンを含むパッケージ420の断面を示しており、計算ブロックは、メモリの上の計算ダイ、プロセッサ、及びソリッドステートメモリを含む。パッケージ420は、パッケージ400に似ているが、共通のヒートシンク315の下でSSD409を単一のパッケージ内に組み込むためのものである。この場合に、単一のパッケージ化されたSOCは、トレーニングモデルを生成してトレーニングモデルを異なるデータに使用して出力を生成する機能を含むAIマシンを提供する。
【0059】
図5は、いくつかの実施形態による回路基板上の複数のパッケージの断面500を示しており、パッケージのうちの1つは、メモリダイの上の計算ダイを含み、パッケージのうちの別のものは、グラフィック処理装置を含む。この例では、CPU505等のAIプロセッサは、基板201(例えば、PCB)に結合される。ここでは、2つのパッケージ(一方がヒートシンク506を備え、他方がヒートシンク507を備える)が示されている。ヒートシンク506はGPUチップ505専用の熱ソリューションである一方、ヒートシンク507はHBM305を含む計算ブロック(ダイ303及び304)のための熱ソリューションを提供する。
【0060】
図6は、いくつかの実施形態による、水平面に沿ってメモリと接続するために側部にマイクロハンプを備えた計算ダイ304の上面
図600の断面を示している。計算ダイ304のいずれかの側の影付き領域601及び602は、計算ダイ304のいずれかの側のメモリに接続するために使用されるマイクロバンプ603(例えば、310)を含む。例えば、
図3Eに示されるように、HBM354及び355は、マイクロバンプ603を介して計算ダイ304に結合される。マイクロバンプ604は、基板302又はインターポーザ302に接続するために使用され得る。
【0061】
図7は、いくつかの実施形態による、パッケージの垂直面に沿ってメモリダイと接続するために、計算ダイの上部及び下部にマイクロバンプを有する計算ダイ304の上面
図700の断面を示している。計算ダイ304の上側及び下側セクション上の影付き領域701及び702は、それぞれ上部及び下部メモリ345及び343に接続するために使用されるマイクロバンプ703(例えば、311a及び311b)を含む。例えば、
図3Eに示されるように、FE-RAM343及び345は、それぞれマイクロバンプ311a及び311bを介して計算ダイ304に結合される。マイクロバンプ704は、基板302又はインターポーザ302に接続するために使用され得る。
【0062】
図8Aは、いくつかの実施形態による、計算ダイ304の下にあるメモリダイ(例えば、303又は333)の断面800を示している。メモリダイ303のピッチはL×Wである。断面800は、計算ダイ304に接続するために使用されるTSVのストリップを示している。影付きのストリップ801は信号を伝える一方、ストリップ802及び803は電力線及び接地線を延ばす。ストリップ804は、電力信号及び接地信号805及び806を行内のメモリセルに提供する。TSV808は、信号(例えば、ワードライン)をメモリビットセルに接続する。
【0063】
図8Bは、いくつかの実施形態による、メモリダイ(例えば、303)の上にある計算ダイ(例えば、304)の断面820を示している。TSV828はTSV808に結合でき、ストリップ824はストリップ804の上にある。TSV825及び826はそれぞれTSV805及び806に結合する。
【0064】
図9Aは、いくつかの実施形態による、計算ダイの下にある、2×2タイルを含むメモリダイ303の断面900を示している。
図8Aのメモリダイ202は単一のタイルを示しているが、ここでは2×2タイルがメモリを構成するために使用される。これにより、データ及び重みを格納するためにメモリをきれいにパーティション分割できる。ここで、タイルはタイル901によって示される。実施形態は、2×2タイル及びM×Nタイルの構成に限定されない(ここで、M及びNは、等しくても、異なってもよい整数である)。
【0065】
図9Bは、いくつかの実施形態による、メモリダイの上にある2×2タイルを含む計算ダイの断面920を示している。メモリ303と同様に、計算ダイ304もタイルにパーティション分割することができる。各タイル921は、いくつかの実施形態によれば、
図8Bの計算ダイ304のようなものである。計算ダイ304のそのような構成は、異なる入力データ及び重みを用いて異なるトレーニングモデルを同時に又は並行して実行することを可能にする。
【0066】
図10は、いくつかの実施形態による、メモリダイの上に計算ダイ(例えば、推論論理ダイ)を含む計算ブロックのパッケージを形成する方法のフローチャート1000を示している。フローチャート1000のブロックは、特定の順序で示されている。しかしながら、様々な処理ステップの順序は、実施形態の本質を変えることなく変更することができる。例えば、一部の処理ブロックは同時に処理され得るが、他のブロックは順不同で実行され得る。
【0067】
ブロック1001において、基板(例えば、302)が形成される。いくつかの実施形態では、基板302はパッケージ基板である。いくつかの実施形態では、基板302は、インターポーザ(例えば、能動的又は受動的なインターポーザ)である。ブロック1002において、第1のダイ(例えば、303)が基板上に形成される。いくつかの実施形態では、第1のダイを形成することには、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)が含まれ、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは強誘電体材料に結合される。ブロック1003において、第2のダイ(例えば、計算ダイ304)が、形成され、第1のダイの上に積み重ねられ、第2のダイを形成することは、第1のダイのメモリに結合された計算ロジックを形成することを含む。いくつかの実施形態では、計算ロジックを形成することは、乗算器セルのアレイを形成することを含み、ここで、FeRAMは、メモリビットセルのアレイを含む。
【0068】
ブロック1004において、相互接続ファイバが形成される。ブロック1005において、相互接続ファイバは、各乗算器セルが相互接続ファイバに結合されるように、乗算器セルのアレイに結合される。いくつかの実施形態では、FeRAMは、バッファとして動作可能な第1のパーティションと、重み係数を格納するための第2のパーティションとにパーティション分割される。
【0069】
いくつかの実施形態では、フローチャート1000の方法は、計算ロジックが、第1のパーティション及び第2のパーティションからデータを受信すること、及び計算ロジックの出力を論理回路に提供することを含む。いくつかの実施形態では、計算ロジックを形成することは、強誘電体ロジックを形成することを含む。いくつかの実施形態では、計算ロジックは、少なくとも2つのマトリックスを乗算するように動作可能である。いくつかの実施形態では、基板を形成する方法は、能動的又は受動的装置を形成することを含む。いくつかの実施形態では、この方法は、基板上に第3のダイ(例えば、論理ダイ又はメモリ)を形成することを含む。いくつかの実施形態では、この方法は、第3のダイを基板上に結合することを含む。いくつかの実施形態では、この方法には、動的ランダムアクセスメモリ(DRAM)を含む第4のダイが含まれ、この方法は、第4のダイを第3のダイの上に積み重ねることを含む。いくつかの実施形態では、この方法は、ヒートシンクを第2のダイに結合することを含む。
【0070】
本明細書における「実施形態」、「一実施形態」、「いくつかの実施形態」、又は「他の実施形態」への言及は、実施形態に関連して説明する特定の特徴、構造、又は特性が少なくともいくつかの実施形態に含まれるが、必ずしも全ての実施形態である必要はないことを意味する。「実施形態」、「一実施形態」、又は「いくつかの実施形態」の様々な出現は、必ずしも全てが同じ実施形態を指すとは限らない。明細書に、構成要素、特徴、構造、又は特性が「含まれる可能性がある」、「含んでもよい」、又は「含むことができる」と記載されている場合に、その特定の構成要素、特徴、構造、又は特性を含める必要はない。明細書又はクレームが「1つの(a, an)」要素に言及している場合に、それは要素が1つしかないことを意味するものではない。明細書又は特許請求の範囲が「追加の」要素に言及している場合に、それは、複数の追加の要素が存在することを排除するものではない。
【0071】
さらに、特定の特徴、構造、機能、又は特性は、1つ又は複数の実施形態において任意の適切な方法で組み合わせることができる。例えば、第1の実施形態は、2つの実施形態に関連する特定の特徴、構造、機能、又は特性が互いに排他的でない場合はいつでも、第2の実施形態と組み合わせることができる。
【0072】
本開示について、その特定の実施形態と併せて説明してきたが、そのような実施形態の多くの代替、修正、及び変形は、前述の説明に照らして当業者には明らかであろう。本開示の実施形態は、添付の特許請求の範囲内に入るような全てのそのような代替、修正、及び変形を包含することを意図している。
【0073】
さらに、集積回路(IC)チップ及び他の構成要素への周知の電源/接地接続は、例示及び説明を簡素化するために、そして本開示を不明瞭にしないために、提示した図内に示される又は示されない場合がある。さらに、配置は、本開示を不明瞭にすることを避けるために、また、そのようなブロック図配置の実施に関する詳細が、本開示が実施されるプラットフォームに大きく依存するという事実を考慮して、ブロック図形式で示され得る(すなわち、そのような詳細は、当業者の範囲内に十分にあるべきである)。本開示の例示的な実施形態を説明するために特定の詳細(例えば、回路)が示される場合に、これらの特定の詳細なしで、又はこれらの特定の詳細を変更して、本開示を実施できることは当業者には明らかであるはずである。こうして、説明は、限定するのではなく、例示と見なすべきである。
【0074】
様々な実施形態を説明する以下の例を提供する。これらの例は、他の例と組み合わせることができる。そのため、本発明の範囲を変更することなく、様々な実施形態を他の実施形態と組み合わせることができる。
【0075】
例1:機器であって、この機器は、基板と;基板上の第1のダイであって、第1のダイは、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)を含み、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは強誘電体材料に結合される、第1のダイと;第1のダイの上に積み重ねられた第2のダイであって、第1のダイのメモリに結合された計算ロジックを含む第2のダイと;を含む。
【0076】
例2:計算ロジックは乗算器セルのアレイを含み、FeRAMはメモリビットセルのアレイを含む、例1に記載の機器。
【0077】
例3:乗算器セルのアレイに結合された相互接続ファイバを含み、各乗算器セルが相互接続ファイバに結合される、例2に記載の機器。
【0078】
例4:メモリが、バッファとして動作可能な第1のパーティションと、重み係数を格納するための第2のパーティションとにパーティション分割される、例1に記載の機器。
【0079】
例5:計算ロジックは、第1のパーティション及び第2のパーティションからデータを受信することができ、計算ロジックの出力が論理回路によって受信される、例4に記載の機器。
【0080】
例6:計算ロジックは強誘電体ロジックを含む、例4に記載の機器。
【0081】
例7:計算ロジックは、少なくとも2つのマトリックスを乗算するように動作可能である、例4に記載の機器。
【0082】
例8:基板は能動的又は受動的装置を含む、例1に記載の機器。
【0083】
例9:第3のダイが基板上に結合され、動的ランダムアクセスメモリ(DRAM)を含む第4のダイが、第3のダイの上に積み重ねられる、例1に記載の機器。
【0084】
例10:ヒートシンクが第2のダイに結合される、例1に記載の機器。
【0085】
例11:方法であって、この方法は、基板を形成するステップと;第1のダイを基板上に形成するステップであって、第1のダイを形成するステップには、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)が含まれ、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは、強誘電体材料に結合される、形成するステップと;第1のダイの上に積み重ねられた第2のダイを形成するステップであって、第2のダイを形成するステップには、第1のダイのメモリに結合された計算ロジックを形成するステップが含まれる、形成するステップと;を含む。
【0086】
例12:計算ロジックを形成するステップは、乗算器セルのアレイを形成するステップを含み、FeRAMは、メモリビットセルのアレイを含む、例11に記載の方法。
【0087】
例13:相互接続ファイバを形成するステップと;各乗算器セルが相互接続ファイバに結合されるように、相互接続ファイバを乗算器セルのアレイに結合するステップと;を含む、例12に記載の方法。
【0088】
例14:FeRAMは、バッファとして動作可能な第1のパーティションと、重み係数を格納するための第2のパーティションとにパーティション分割される、例11に記載の方法。
【0089】
例15:計算ロジックが、第1のパーティション及び第2のパーティションからデータを受信するステップと;計算ロジックの出力を論理回路に提供するステップと;を含む、例14に記載の方法。
【0090】
例16:計算ロジックを形成するステップは、強誘電体ロジックを形成するステップを含み、計算ロジックは、少なくとも2つのマトリックスを乗算するように動作可能である、例14に記載の方法。
【0091】
例17:基板を形成するステップは、能動的又は受動的装置を形成するステップを含む、例11に記載の方法。
【0092】
例18:第3のダイを形成するステップと;第3のダイを基板上に結合するステップと;動的ランダムアクセスメモリ(DRAM)を含む第4のダイを形成するステップと;第4のダイを第3のダイの上に積み重ねるステップと;を含む、例11に記載の方法。
【0093】
例19:ヒートシンクを第2のダイに結合するステップを含む、例11に記載の方法。
【0094】
例20:システムであって、このシステムは、不揮発性メモリセルを含む第1のメモリと;動的ランダムアクセスメモリ(DRAM)を含む第2のメモリであって、第1のメモリが第2のメモリに結合される、第2のメモリと;強誘電体ランダムアクセスメモリ(FeRAM)を含む第3のメモリであって、第1のメモリに結合される第3のメモリと;第2のメモリに結合された第1のプロセッサと;第3のメモリ及び第1のプロセッサに結合された第2のプロセッサと;を含み、第2のプロセッサは、基板と;基板上の第1のダイであって、第1のダイは、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)を含み、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは強誘電体材料に結合される、第1のダイと;第1のダイの上に積み重ねられた第2のダイであって、第1のダイのメモリに結合された乗算器を含む第2のダイと;を含む。
【0095】
例21:乗算器は乗算器セルのアレイを含み、FeRAMはメモリビットセルのアレイを含み、各乗算器セルは対応するメモリビットセルに結合される、例20に記載のシステム。
【0096】
例22:第2のプロセッサは、乗算器セルのアレイに結合された相互接続ファイバを含み、各乗算器セルが相互接続ファイバに結合される、例21に記載のシステム。
【0097】
例23:機器であって、この機器は、インターポーザと;インターポーザ上の第1のダイであって、ビットセルを有するランダムアクセスメモリ(RAM)を含む第1のダイと;第1のダイの上に積み重ねられた第2のダイであって、第1のダイのメモリに結合されたマトリックス乗算器を含む第2のダイと;を含む。
【0098】
例24:マトリックス乗算器は乗算器セルのアレイを含み、RAMはメモリビットセルのアレイを含み、各乗算器セルは、対応するメモリビットセルに結合される、例23に記載の機器。
【0099】
例25:第2のダイは、マトリックス乗算器に結合された論理回路を含む、例23に記載の機器。
【0100】
例26:第2のダイは、論理回路に結合されたバッファを含み、バッファはメモリに結合される、例25に記載の機器。
【0101】
例27:メモリは、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)を含み、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは強誘電体材料に結合される、例23に記載の機器。
【0102】
例28:メモリは、ビットセルを有する静的ランダムアクセスメモリ(SRAM)を含む、例23に記載の機器。
【0103】
例29:ヒートシンクが第2のダイに結合される、例23に記載の機器。
【0104】
例30:インターポーザは、第2のダイに結合されたメモリを含む、例23に記載の機器。
【0105】
例31:機器であって、この機器は、インターポーザと;インターポーザ上の第1のダイであって、強誘電体材料を含むビットセルを有するランダムアクセスメモリ(RAM)を含む第1のダイと;第1のダイの隣にあり且つインターポーザ上にある第2のダイであって、第1のダイのメモリに電気的に結合された計算ロジックを含む第2のダイと;インターポーザ上の第3のダイであって、第3のダイはビットセルを有するRAMを含み、第3のダイは第2のダイの隣にある、第3のダイと;を含む。
【0106】
例32:インターポーザは、第2のダイに電気的に結合されたRAMを含む、例31に記載の機器。
【0107】
例33:第3のダイのRAMは強誘電体材料を含む、例31に記載の機器。
【0108】
例34:計算ロジックは、乗算器セルのアレイを含むマトリックス乗算器を含む、例31に記載の機器。
【0109】
例35:第2のダイは、マトリックス乗算器に結合された論理回路を含む、例31に記載の機器。
【0110】
例36:第2のダイは、論理回路に結合されたバッファを含み、バッファは、第1又は第2のダイに結合される、例35に記載の機器。
【0111】
例37:第1のダイの少なくとも1つのビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは強誘電体材料に結合される、例31に記載の機器。
【0112】
例38:第3のダイのRAMは、ビットセルを有する静的ランダムアクセスメモリ(SRAM)を含む、例31に記載の機器。
【0113】
例39:第1、第2、及び第3のダイに結合されたヒートシンクを含む、例31に記載の機器。
【0114】
例40:方法であって、この方法は、インターポーザを形成するステップと;インターポーザ上に第1のダイを形成するステップであって、第1のダイを形成するステップには、強誘電体材料を含むビットセルを有するランダムアクセスメモリ(RAM)を形成するステップが含まれる、形成するステップと;第1のダイの隣にあり且つインターポーザ上に第2のダイを形成するステップであって、第2のダイを形成するステップには、計算ロジックを形成するステップと、第1のダイのメモリと計算ロジックとを電気的に結合するステップとが含まれる、形成するステップと;インターポーザ上に第3のダイを形成するステップであって、第3のダイを形成するステップには、ビットセルを有するRAMを形成するステップが含まれる、形成するステップと;第3のダイを第2のダイの隣に位置付けするステップと;を含む。
【0115】
例41:インターポーザを形成するステップは、インターポーザ内にRAMを形成するステップを含み、この方法は、RAMを第2のダイに電気的に結合するステップを含む、例40に記載の方法。
【0116】
例42:第3のダイのRAMは強誘電体材料を含む、例40に記載の方法。
【0117】
例43:計算ロジックを形成するステップは、乗算器セルのアレイを含むマトリックス乗算器を形成するステップを含む、例40に記載の方法。
【0118】
例44:第2のダイを形成するステップは、論理回路を形成するステップを含み、この方法は、論理回路をマトリックス乗算器に結合するステップを含む、例43に記載の方法。
【0119】
例45:第2のダイを形成するステップは、バッファを形成するステップと;バッファを論理回路に結合するステップと;を含み、この方法は、バッファを第1又は第2のダイに結合するステップを含む、例44に記載の方法。
【0120】
例46:第1のダイの少なくとも1つのビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、アクセストランジスタは強誘電体材料に結合される、例40に記載の方法。
【0121】
例47:第3のダイのRAMを形成するステップは、ビットセルを有する静的ランダムアクセスメモリ(SRAM)を形成するステップを含む、例40に記載の方法。
【0122】
例48:ヒートシンクを第1、第2、及び第3のダイに結合するステップを含む、例40に記載の方法。
【0123】
例49:システムであって、このシステムは、不揮発性メモリセルを含む第1のメモリと;動的ランダムアクセスメモリ(DRAM)を含む第2のメモリであって、第1のメモリが第2のメモリに結合される、第2のメモリと;強誘電体ランダムアクセスメモリ(FeRAM)を含む第3のメモリであって、第1のメモリに結合される第3のメモリと;第2のメモリに結合された第1のプロセッサと;第3のメモリ及び第1のプロセッサに結合された第2のプロセッサと;を含み、第2のプロセッサは、インターポーザと;インターポーザ上の第1のダイであって、強誘電体材料を含むビットセルを有するランダムアクセスメモリ(RAM)を含む第1のダイと;第1のダイの隣にあり且つインターポーザ上にある第2のダイであって、第1のダイのメモリに電気的に結合された計算ロジックを含む第2のダイと;インターポーザ上の第3のダイであって、第3のダイはビットセルを有するRAMを含み、第3のダイは第2のダイの隣にある、第3のダイと;を含む。
【0124】
例50:インターポーザは、第2のダイに電気的に結合されたRAMを含み、第3のダイのRAMは強誘電体材料を含む、例49に記載のシステム。
【0125】
読者が技術的開示の特質及び要点を確認することを可能にする要約が提供される。要約は、特許請求の範囲又は意味を制限するために使用されないことを理解した上で提出される。以下の特許請求の範囲は、詳細な説明に組み込まれ、各請求項は、別個の実施形態としてそれ自体で成り立っている。
【0126】
以下に、出願当初の特許請求の範囲の内容を、実施例として記載しておく。
[実施例1]
機器であって、当該機器は、
基板と、
該基板上の第1のダイであって、該第1のダイは、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)を含み、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、前記アクセストランジスタは前記強誘電体材料に結合される、第1のダイと、
該第1のダイの上に積み重ねられた第2のダイであって、前記第1のダイの前記メモリに結合された計算ロジックを含む第2のダイと、を含む、
機器。
[実施例2]
前記計算ロジックは、乗算器セルのアレイを含み、前記FeRAMは、メモリビットセルのアレイを含む、実施例1に記載の機器。
[実施例3]
前記乗算器セルのアレイに結合された相互接続ファイバを含み、各乗算器セルが前記相互接続ファイバに結合される、実施例2に記載の機器。
[実施例4]
前記メモリは、バッファとして動作可能な第1のパーティションと、重み係数を格納するための第2のパーティションとにパーティション分割される、実施例1に記載の機器。
[実施例5]
前記計算ロジックは、前記第1のパーティション及び前記第2のパーティションからデータを受信することができ、前記計算ロジックの出力は、論理回路によって受信される、実施例4に記載の機器。
[実施例6]
前記計算ロジックは、強誘電体ロジックを含む、実施例4に記載の機器。
[実施例7]
前記計算ロジックは、少なくとも2つのマトリックスを乗算するように動作可能である、実施例4に記載の機器。
[実施例8]
前記基板は能動的又は受動的装置を含む、実施例1に記載の機器。
[実施例9]
第3のダイが前記基板上に結合され、動的ランダムアクセスメモリ(DRAM)を含む第4のダイが前記第3のダイの上に積み重ねられる、実施例1乃至8のいずれか一項に記載の機器。
[実施例10]
ヒートシンクが前記第2のダイに結合される、実施例1に記載の機器。
[実施例11]
方法であって、当該方法は、
基板を形成するステップと、
第1のダイを前記基板上に形成するステップであって、前記第1のダイを形成するステップには、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)が含まれ、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、前記アクセストランジスタは前記強誘電体材料に結合される、形成するステップと、
前記第1のダイの上に積み重ねられた第2のダイを形成するステップであって、該第2のダイを形成するステップには、前記第1のダイの前記メモリに結合された計算ロジックを形成するステップが含まれる、形成するステップと、を含む、
方法。
[実施例12]
前記計算ロジックを形成するステップは、乗算器セルのアレイを形成するステップを含み、前記FeRAMは、メモリビットセルのアレイを含む、実施例11に記載の方法。
[実施例13]
相互接続ファイバを形成するステップと、
各乗算器セルが前記相互接続ファイバに結合されるように、前記相互接続ファイバを前記乗算器セルのアレイに結合するステップと、を含む、実施例12に記載の方法。
[実施例14]
前記FeRAMは、バッファとして動作可能な第1のパーティションと、重み係数を格納するための第2のパーティションとにパーティション分割される、実施例11に記載の方法。
[実施例15]
前記計算ロジックが、前記第1のパーティション及び前記第2のパーティションからデータを受信するステップと、
前記計算ロジックの出力を論理回路に提供するステップと、を含む、実施例14に記載の方法。
[実施例16]
前記計算ロジックを形成するステップは、強誘電体ロジックを形成するステップを含み、前記計算ロジックは、少なくとも2つのマトリックスを乗算するように動作可能である、実施例14に記載の方法。
[実施例17]
前記基板を形成するステップは、能動的又は受動的装置を形成するステップを含む、実施例11に記載の方法。
[実施例18]
第3のダイを形成するステップと、
該第3のダイを前記基板上に結合するステップと、
動的ランダムアクセスメモリ(DRAM)を含む第4のダイを形成するステップと、
前記第4のダイを前記第3のダイの上に積み重ねるステップと、
ヒートシンクを前記第2のダイに結合するステップと、を含む、実施例11に記載の方法。
[実施例19]
システムであって、当該システムは、
不揮発性メモリセルを含む第1のメモリと、
動的ランダムアクセスメモリ(DRAM)を含む第2のメモリであって、前記第1のメモリが前記第2のメモリに結合される、第2のメモリと、
強誘電体ランダムアクセスメモリ(FeRAM)を含む第3のメモリであって、前記第1のメモリに結合される第3のメモリと、
前記第2のメモリに結合された第1のプロセッサと、
前記第3のメモリ及び前記第1のプロセッサに結合された第2のプロセッサと、を含み、
前記第2のプロセッサは、
基板と、
該基板上の第1のダイであって、該第1のダイは、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)を含み、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、前記アクセストランジスタは前記強誘電体材料に結合される、第1のダイと、
前記第1のダイの上に積み重ねられた第2のダイであって、前記第1のダイの前記メモリに結合された乗算器を含む第2のダイと、を含む、
システム。
[実施例20]
前記乗算器は、乗算器セルのアレイを含み、前記FeRAMは、メモリビットセルのアレイを含み、
各乗算器セルは、対応するメモリビットセルに結合され、
前記第2のプロセッサは、前記乗算器セルのアレイに結合された相互接続ファイバを含み、各乗算器セルが前記相互接続ファイバに結合される、実施例19に記載のシステム。
[実施例21]
機器であって、当該機器は、
インターポーザと、
該インターポーザ上の第1のダイであって、ビットセルを有するランダムアクセスメモリ(RAM)を含む第1のダイと、
該第1のダイの上に積み重ねられた第2のダイであって、前記第1のダイの前記メモリに結合されたマトリックス乗算器を含む第2のダイと、を含む、
機器。
[実施例22]
前記マトリックス乗算器は、乗算器セルのアレイを含み、前記RAMは、メモリビットセルのアレイを含み、各乗算器セルは、対応するメモリビットセルに結合される、実施例21に記載の機器。
[実施例23]
前記第2のダイは、前記マトリックス乗算器に結合された論理回路を含む、実施例21に記載の機器。
[実施例24]
前記第2のダイは、前記論理回路に結合されたバッファを含み、該バッファは、前記メモリに結合される、実施例23に記載の機器。
[実施例25]
前記メモリは、ビットセルを有する強誘電体ランダムアクセスメモリ(FeRAM)を含み、各ビットセルは、アクセストランジスタと、強誘電体材料を含むコンデンサとを含み、前記アクセストランジスタは、前記強誘電体材料に結合される、又は
前記メモリは、ビットセルを有する静的ランダムアクセスメモリ(SRAM)を含む、実施例21に記載の機器。
[実施例26]
ヒートシンクが前記第2のダイに結合され、前記インターポーザは、前記第2のダイに結合されたメモリを含む、実施例21に記載の機器。
[実施例27]
機器であって、当該機器は、
インターポーザと、
該インターポーザ上の第1のダイであって、強誘電体材料を含むビットセルを有するランダムアクセスメモリ(RAM)を含む第1のダイと、
該第1のダイの隣にあり且つ前記インターポーザ上にある第2のダイであって、前記第1のダイの前記メモリに電気的に結合された計算ロジックを含む第2のダイと、
前記インターポーザ上の第3のダイであって、該第3のダイは、ビットセルを有するRAMを含み、前記第3のダイは前記第2のダイの隣にある、第3のダイと、を含む、
機器。
[実施例28]
前記インターポーザは、前記第2のダイに電気的に結合されたRAMを含む、実施例27に記載の機器。
[実施例29]
前記第3のダイの前記RAMは強誘電体材料を含むか、又は前記第3のダイの前記RAMは、ビットセルを有する静的ランダムアクセスメモリ(SRAM)を含む、実施例27に記載の機器。
[実施例30]
前記計算ロジックは、乗算器セルのアレイを含むマトリックス乗算器を含み、
前記第2のダイは、前記マトリックス乗算器に結合された論理回路を含み、
第2のダイは、前記論理回路に結合されたバッファを含み、該バッファは、前記第1又は第2のダイに結合される。実施例27に記載の機器。
[実施例31]
前記第1のダイの少なくとも1つの前記ビットセルは、アクセストランジスタと、前記強誘電体材料を含むコンデンサとを含み、前記アクセストランジスタは、前記強誘電体材料に結合される、実施例27に記載の機器。
[実施例32]
前記第1、第2、及び第3のダイに結合されたヒートシンクを含む、実施例27乃至32のいずれか一項に記載の機器。
[実施例33]
システムであって、当該システムは、
不揮発性メモリセルを含む第1のメモリと、
動的ランダムアクセスメモリ(DRAM)を含む第2のメモリであって、前記第1のメモリが前記第2のメモリに結合される、第2のメモリと、
強誘電体ランダムアクセスメモリ(FeRAM)を含む第3のメモリであって、前記第1のメモリに結合される第3のメモリと、
前記第2のメモリに結合された第1のプロセッサと、
前記第3のメモリ及び前記第1のプロセッサに結合された第2のプロセッサと、を含み、
該第2のプロセッサは、
インターポーザと、
該インターポーザ上の第1のダイであって、強誘電体材料を含むビットセルを有するランダムアクセスメモリ(RAM)を含む第1のダイと、
前記第1のダイの隣にあり且つ前記インターポーザ上にある第2のダイであって、前記第1のダイの前記メモリに電気的に結合された計算ロジックを含む第2のダイと、
前記インターポーザ上の第3のダイであって、該第3のダイは、ビットセルを有するRAMを含み、前記第3のダイは前記第2のダイの隣にある、第3のダイと、を含む、
システム。
[実施例34]
前記インターポーザは、前記第2のダイに電気的に結合されたRAMを含み、前記第3のダイの前記RAMは、強誘電体材料を含む、実施例33に記載のシステム。
【外国語明細書】