(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-04-16
(54)【発明の名称】再構成可能なインメモリーコンピューティング用のフィールドプログラム可能な強誘電体ダイオード
(51)【国際特許分類】
H10B 53/00 20230101AFI20240409BHJP
G06G 7/60 20060101ALI20240409BHJP
G06N 3/063 20230101ALI20240409BHJP
【FI】
H10B53/00
G06G7/60
G06N3/063
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023559982
(86)(22)【出願日】2022-03-30
(85)【翻訳文提出日】2023-11-28
(86)【国際出願番号】 US2022071440
(87)【国際公開番号】W WO2022213087
(87)【国際公開日】2022-10-06
(32)【優先日】2021-03-30
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500429103
【氏名又は名称】ザ トラスティーズ オブ ザ ユニバーシティ オブ ペンシルバニア
(74)【代理人】
【識別番号】100104411
【氏名又は名称】矢口 太郎
(72)【発明者】
【氏名】ジャリワラ、ディープ
(72)【発明者】
【氏名】オルソン サード、ロイ エイチ.
(72)【発明者】
【氏名】シュタッハ、エリック アンドリュー
(72)【発明者】
【氏名】リュウ、シェイウェン
(72)【発明者】
【氏名】ウォン、ディション
(72)【発明者】
【氏名】ジェン、ジェフリー
(72)【発明者】
【氏名】フィアグベヌ、メリリン マーシー アゾ
【テーマコード(参考)】
5F083
【Fターム(参考)】
5F083FR01
5F083FZ10
5F083JA36
5F083JA38
5F083JA60
5F083PR22
(57)【要約】
【要約】 窒化アルミニウムスカンジウム(AiScN)や酸化ハフニウムジルコニウム(HfZrO2)などの材料からなる強誘電体ダイオードは、COMOSウェハなどの半導体構造の上に形成され、ストレージメモリーセル、検索3値コンテンツ・アドレサブル・メモリー(TCAM)セル、および/または神経回路を作成することができる。前記ダイオードは不揮発性で、パルス数に依存したアナログ状態へのパルス化によりフィールドプログラム可能であり、高いオン/オフ比と自己整流比を持つ。セルは、例えば、逆極性の2つのダイオードで形成することができ、トランジスタなしで、例えば、0T-2R構造を形成することができる。
【選択図】
図4
【特許請求の範囲】
【請求項1】
強誘電体ダイオードのアレイを有するメモリーセルであって、
前記強誘電体ダイオードはドープされた窒化アルミニウム(AIN)を有し、前記強誘電体ダイオードは不揮発性であり、パルス数に依存するアナログ状態へのパルス化を介してフィールドプログラム可能である、メモリーセル。
【請求項2】
請求項1記載のメモリーセルにおいて、前記強誘電体ダイオードは、スカンジウムをドープした窒化アルミニウム(AlScN)、イットリウムをドープした窒化アルミニウム(AlYN)、マグネシウムとハフニウムをドープした窒化アルミニウム(AlMgHfN)、マグネシウムとジルコニウムをドープした窒化アルミニウム(AlMgZrN)、マグネシウムとチタンをドープした窒化アルミニウム(AlMgTiN)、ホウ素をドープした窒化アルミニウム(AlBN)、またはイッテルビウムをドープした窒化アルミニウム(AlYbN)を有する、メモリーセル。
【請求項3】
請求項1もしくは請求項2のいずれかに記載のメモリーセルにおいて、前記強誘電体ダイオードが、2、5、10、25、50、75、100、500、1,000、5,000、または10,000より大きいオン/オフ比を有する、メモリーセル。
【請求項4】
請求項1もしくは請求項2のいずれかに記載のメモリーセルにおいて、前記強誘電体ダイオードが、25、50、75、100、200、500、1,000、10,000、50,000、または100,000より大きい自己整流比を有する、メモリーセル。
【請求項5】
請求項1もしくは請求項2のいずれかに記載のメモリーセルにおいて、前記セルはCMOSバック・エンド・オブ・ライン(BEOL)処理と互換性がある、メモリーセル。
【請求項6】
請求項2に記載のメモリーセルにおいて、前記ドープされた窒化アルミニウムの析出温度は摂氏400度未満である、メモリーセル。
【請求項7】
請求項1もしくは請求項2のいずれかに記載のメモリーセルにおいて、前記強誘電体ダイオードは、双極パルスプログラム可能である、メモリーセル。
【請求項8】
請求項6に記載のメモリーセルにおいて、前記強誘電体ダイオードは、4ビットの状態分解能でパルスプログラム可能である、メモリーセル。
【請求項9】
請求項1もしくは請求項2のいずれかに記載のメモリーセルにおいて、前記前記強誘電体ダイオードは、約100nm未満、約75nm未満、約50nm未満、または約25nm未満の厚さを有する前記ドープされた窒化アルミニウム層を有する、メモリーセル。
【請求項10】
請求項1~9のいずれか1つに記載の前記メモリーセルの複数のインスタンスを有するメモリーセルのアレイであって、当該アレイは、前記強誘電体ダイオードを読み出し、プログラムするために使用されるV/2方式用に配置されている、メモリーセルのアレイ。
【請求項11】
請求項1~9のいずれか1つに記載のメモリーセルを有する、3値コンテンツ・アドレッサブル・メモリー(TCAM)である。
【請求項12】
請求項11記載のTCAMにおいて、当該TCAMのサーチ遅延は約1μs以下、約500ns以下、あるいは約100ns、50ns、10ns、1ns、100ps以下である、TCAM。
【請求項13】
請求項11~12記載のいずれか1つに記載のTCAMにおいて、各メモリーセルは、逆極性の2つのダイオードを有する、TCAM。
【請求項14】
強誘電体ダイオードのアレイを有する3値コンテンツ・アドレッサブル・メモリー(TCAM)であって、前記強誘電体ダイオードは、酸化ハフニウムジルコニウム(HfZrO2)を有し、前記強誘電体ダイオードは、パルス数に依存するアナログ状態へのパルス化を介して不揮発性かつフィールドプログラム可能である、3値コンテンツ・アドレッサブル・メモリー(TCAM)。
【請求項15】
請求項14記載のTCAMにおいて、当該TCAMのサーチ遅延は約1μs以下、約500ns以下、あるいは約100ns、50ns、10ns、1ns、100ps以下である、TCAM。
【請求項16】
請求項14~15のうちのいずれか1つに記載のTCAMにおいて、各メモリーセルは、逆極性の2つのダイオード有する、TCAM。
【請求項17】
マルチビットダイオードシンナプスのアレイを有するニューラルネットワークであって、各ダイオードシンナプスは、ドープされた窒化アルミニウム(AIN)を有する強誘電体ダイオードを有し、各強誘電体ダイオードは、パルス数に依存するアナログ状態へのパルス化を介して不揮発性かつフィールドプログラム可能である、ニューラルネットワーク。
【請求項18】
請求項17記載のニューラルネットワークにおいて、各強誘電体ダイオードは、スカンジウムをドープした窒化アルミニウム(AIN)(AlScN)、イットリウムをドープした窒化アルミニウム(AlYN)、マグネシウムとハフニウムをドープした窒化アルミニウム(AlMgHfN)、マグネシウムとジルコニウムをドープした窒化アルミニウム(AlMgZrN)、マグネシウムとチタンをドープした窒化アルミニウム(AlMgTIN)、ホウ素をドープした窒化アルミニウム(AlBN)、またはイッテルビウムをドープした窒化アルミニウム(AlYbN)を有する、ニューラルネットワーク。
【請求項19】
請求項17または18のいずれかに記載のニューラルネットワークにおいて、前記マルチビットダイオードシナプスは、PyTorchフレームワークのLeNet-5アーキテクチャに配置されている、ニューラルネットワーク。
【請求項20】
請求項17~19のいずれかに記載のニューラルネットワークにおいて、当該ニューラルネットワークは、MNISTデータセット上で少なくとも約90%、少なくとも約95%、少なくとも約97%の推論精度を示すものである、ニューラルネットワーク。
【請求項21】
半導体ウェハの上面に強誘電体ダイオードのアレイと前記ウェハの前記上面に回路接触部のアレイを形成する方法であって、
下部導体層を前記ウェハの上部に堆積させる工程と、
前記下部金属層の上に、強誘電体材料層を堆積させる工程と、
前記強誘電体材料層と前記下部金属層の余分な部分を除去する工程と、
強磁性材料層の上に酸化物を形成する工程であって、前記余分な部分は前記回路接触部と重ならない、形成する工程と、
前記ウェハの上部に上部導体層を堆積させる工程と、
前記上部導体層をパターニングする工程と
を有する、方法。
【請求項22】
請求項21記載の方法において、前記強誘電体材料層は、スカンジウム(AlScN)、イットリウム(AlYN)、マグネシウムとハフニウム(AlMgHfN)、マグネシウムとジルコニウム(AlMgZrN)、マグネシウムとチタン(AlMgTIN)、ホウ素(AlBN)、またはイッテルビウム(AlYbN)がドープされた窒化アルミニウム(AIN)を有する、方法。
【請求項23】
請求項21~22のいずれか1つに記載の方法において、さらに、
強磁性体を空気にさらすことによって酸化物を形成する工程を有するものである、方法。
【請求項24】
半導体ウェハの上面に強誘電体ダイオードのアレイと前記ウェハの前記上面に回路接触部のアレイを形成する方法であって、
前記ウェハ上面に、下部導体層を堆積させる工程と、
前記下部導体層の上に、酸化物層を形成する工程と、
前記酸化物層の上に、強誘電体材料層を堆積させる工程と、
前記回路接触部から離して、前記強誘電体材料層と前記下部金属層の余分な部分を除去する工程と、
前記ウェハの上部に、上部導体層を堆積させる工程と、
前記上部導体層をパターニングする工程と
を有する、方法。
【請求項25】
請求項24記載の方法において、前記強誘電体材料層は、スカンジウム(AlScN)、イットリウム(AlYN)、マグネシウムとハフニウム(AlMgHfN)、マグネシウムとジルコニウム(AlMgZrN)、マグネシウムとチタン(AlMgTIN)、ホウ素(AlBN)、またはイッテルビウム(AlYbN)がドープされた窒化アルミニウム(AIN)を有する、方法。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2021年3月30日に出願された米国仮特許出願第63/167,765号「Field-programmable ferro-diodes for reconfigurable in-memory-computing」の利益を主張するものであり、その内容は参照により本明細書に組み込まれる。
【0002】
この発明は、米国国防総省から授与されたHR0011-20-9-0046の政府支援を受けて行われたものである。政府は本発明に対して一定の権利を有する。
【背景技術】
【0003】
本出願は、記録装置や検索、計算システムにおける強誘電体ダイオードの応用に関するものである。
【発明の概要】
【0004】
強誘電体材料窒化アルミニウムスカンジウム(Aluminum Scandium Nitride:AlScN)から構成されるフィールドプログラム可能な強誘電体ダイオード(フェロダイオード:ferro-diode)のユニークな特性を活用することにより、ストレージ、検索、ニューラルネットワークなどの複数のデータ集約型アプリケーションを可能にするゼロトランジスタ(0T)を含む再構成可能なアーキテクチャを実証する。具体的には、不揮発性で104以上の高いオン/オフ比と104以上の高い自己整流比を持ち、CMOSバックエンド・オブ・ライン(BEOL)処理に適合する強誘電体ダイオード(フェロダイオード)を実証する。これらのユニークな特性に基づき、0トランジスタ/2抵抗記憶(0T-2R)セルを使用した新しい不揮発性3値コンテンツ・アドレサブル・メモリー(Ternary Content Addressable Memory:TCAM)について説明する。トランジスタが存在しないため、0T-2R TCAMは最もコンパクトな設計であり、SPICEシミュレーションに基づくサーチ遅延は100ps以下である。
【0005】
スカンジウムに加えて、他のドーパントも窒化アルミニウムフェロダイオードの形成に使用することができる。このようなフェロダイオードは、様々な回路やシステムで使用することができる。
【0006】
また、高い線形性と対称的な相乗作用/減衰特性を持つ4ビットフェロダイオードシナプスを実験的に実証し、高精度かつ低遅延なニューラルネットワーク推論への応用を可能にする。我々のアーキテクチャ設計は、実験的なフェロダイオードデータとPyTorchフレームワークのLeNet-5アーキテクチャによってベンチマークされた。その結果、MNISTデータセットにおいて97.5%の推論精度を示し、理想的なソフトウェアレベルの推論に近づいた。
【0007】
一態様において、本開示は、強誘電体ダイオードのアレイを有するメモリーセルを提供し、前記強誘電体ダイオードは、任意選択で、窒化スカンジウムアルミニウム(AlScN)または酸化ハフニウムジルコニウム(HfZrO2)を有し、前記強誘電体ダイオードは、パルス数に依存するアナログ状態へのパルス化を介して、不揮発性かつフィールドプログラム可能であることを特徴とする。
【0008】
また、本開示のメモリーセルの複数のインスタンス(例えば、側面1~8のいずれかによる)を有するメモリーセルのアレイが提供され、前記アレイは、前記強誘電体ダイオードを読み出し、プログラムするために使用されるV/2方式用に配置される。
【0009】
さらに提供されるのは、本開示による(例えば、側面1~8のいずれか1つによる)メモリーセルを有する、TCAM(Ternary Content Addressable Memory)である。
【0010】
さらに開示されるのは、マルチビットダイオードシナプスのアレイを有するニューラルネットワークであって、各ダイオードシナプスは、例えば、窒化アルミニウムスカンジウム(AiScN)を有する強誘電体ダイオードを任意選択で有し、各ダイオードは、パルス数に依存するアナログ状態へのパルス化を介して不揮発性かつフィールドプログラム可能である。
【0011】
本概要は、以下の「詳細な説明」でさらに説明される概念の一部を簡略化して紹介するために提供される。本概要は、特許請求される主題の主要な特徴または本質的な特徴を特定することを意図したものではなく、特許請求される主題の範囲を限定するために使用することを意図したものでもない。さらに、特許請求される主題は、本要約のいずれかの部分に記載された欠点のいずれかまたはすべてを解決する限定に限定されるものではない。
【図面の簡単な説明】
【0012】
より詳細な理解は、添付の図面と共に例示として与えられる以下の説明から得ることができる。図面は必ずしも縮尺通りではない。
【
図1】
図1は、メモリー、メモリー内検索、およびニューラルネットワークのためのフェロダイオードアレイの様々な潜在的用途を示す。
【
図2A】
図2Aは、例示的なフェロダイオードの垂直断面の図である。
【
図2B】
図2Bは、例示的なフェロダイオードの垂直断面のTEM画像である。
【
図3】
図3Aおよび
図3Bは、それぞれ、正の順方向偏光状態および負の順方向偏光状態における例示的なフェロダイオードのI-V曲線である。
【
図4】
図4は、蓄積モードの実装を示す。高いオン/オフ比および自己整流比によって、V/2スキームを0-T RAMの読み出しおよびプログラミングに適用することができる。
【
図5】
図5は、異なる偏光状態におけるフェロダイオードの2つのI-V曲線を示す。
【
図6】
図6A~6Dは、シングルセルTCAM実装の電気回路図である。
【
図7】
図7は、記憶された状態、サーチ電圧、およびサーチ結果の様々な値に対する電圧モードおよび符号化のチャートである。
【
図8】
図8A~8Dは、サーチモードに対するフェロダイオードアレイの使用を示す。前記サーチモードの実装は、高いオン/オフ比と自己整流によって達成され得るマッチライン抵抗の高いセンスマージンを含んでもよい。
【
図9】
図9は、フェロダイオード0T-2R TCAMセルのサーチライン電圧とマッチライン電圧の経時的な電圧の2つのグラフを示す。この波形は、状態「0」が記憶され、2つのセンス電圧によってサーチされるという条件についてSPICEで生成された。Y.LeCun et al.,Proceedings of the IEEE, Volume 86, Issue 11, Nov, 1998.を参照。
【
図10A】
図10AはLeNet-5の概略図である。Y.LeCun et al.を参照。
【
図10B】
図10Bは、事前に訓練されたCNNアーキテクチャを直接マッピングするためのフェロダイオード0T-1Rクロスバーアレイを示す。
【
図11A】
図11Aは、順次印加される正および負のパルス列の数に対するコンダクタンスのグラフである。前記フェロダイオードは、双極でパルス数に依存したアナログ状態変調が可能である。
【
図11B】
図11Bは、LeNet-5のベンチマークされた推論精度を重みあたりのビット数に対してグラフ化したものである。これは、現在の装置のMNISTデータセットで約97.5%の推論精度を示しており、理想的なソフトウェアレベルの推論に近づいている。
【
図12A】
図12Aは、フィールドプログラム可能な強誘電体ダイオードの再構成可能CIMを示す。
【
図12B】
図12Bは、AlScN/MoS2 FE-FETの室温電気特性を示す。
【
図13】
図13は、サーチ動作用の2-FeD TCAMセルを示す。
【
図14】
図14は、FeDに基づくニューラルネットワークを示す。
【
図15】
図15は、ポテンシャル障壁を介した電子輸送の3つの方法を示す。
【
図16】
図16は、任意の強誘電体に対する強誘電体ダイオードのWKB近似と新しい電圧シフトモデルを用いたIV曲線の比較を示す。
【
図17】
図17は、プリコーディングされた酸化膜電気容量画像の変化に伴うHRS I-V曲線のシフトを示す。
【
図18】
図18は残留分極画像の変化に伴うHRS I-V曲線のシフトを示す。
【
図19】
図19は、保磁力線画像の結果の変化に伴うI-V曲線のシフトを示す。
【
図20】
図20は、直流電圧掃引を16の異なる状態に適用して測定された電流IのLog(I)vs Vを示す。
【
図22】
図22は、MNISTデータセットから入力された数字「5」の画像と、マッピング後のプロットを示す。
【
図23】
図23は、元の入力に応答している強誘電体ダイオード装置に符号化された電圧を印加したときの、出力における電流の測定値を示す。
【
図26】
図26は、45nm AlScNにおけるダイナミック電流応答を示す。
【
図28】
図28は、金属/酸化物/A10.64Sc0.36N/金属メモリースタ装置を示す。
【
図29】
図29は、強誘電体メモリースタの電流-電圧特性を示す。
【
図31】
図31は、手動DCスイッチングサイクルと、低電流および高電流/抵抗状態の保持にわたるサイクルI-V曲線を示す。
【
図33】
図33は、強誘電体(FE)AlScN金属-絶縁体-金属装置を示す。
【
図34】
図34は、in-situ蒸着MIM Al(30nm)/A10.68 Sc0.32N(45nm)/Al(85nm)フェロダイオード装置のI-V特性を示す。
【
図35】
図35は、3つの円形Pt/ネイティブ酸化物/A10.64Sc0.36N/Pt MIM装置の電流密度対電圧のオン状態スイープを示す。
【発明を実施するための形態】
【0013】
より高速でエネルギー効率の高い情報処理を可能にする新技術や計算パラダイムへの関心が高まっている。その背景には、ムーアの法則によるスケーリングが困難になり、それに伴う性能の低下がある。ビッグデータ、モノのインターネット、人工知能(AI)などのアプリケーションに牽引され、不揮発性メモリーに基づいたインメモリーコンピューティング(IMC)技術が急速に発展している。これらのアプリケーションでは、コンピューティングとデータ間の「距離」を縮める必要がある。Ielminiet al.,Nature Electron.1p.333(2018)を参照。
【0014】
しかし、ビッグデータを活用するAIの計算タスクは、一般的に、情報を逐次処理するために、同一チップ上に複数のIMCアーキテクチャ、すなわちオンチップストレージ、コンテンツ検索、行列乗算エンジンを必要とする。これはこれまで困難なことであった。この論文では、強誘電体材料(AlScN)から作られた強誘電体ダイオードのユニークな特性を活用し、複数のデータ集約型アプリケーション向けに面密度と速度の両方を大幅に向上させた再構成可能な回路とアーキテクチャを構築するための戦略を示す。Wang et al,.IEEE EDL,41,pp1747(2020)を参照。ストレージ用の0T-1R、検索用の0T-2R、そしてニューラルネットワーク用のクロスバーである(
図1)。
【0015】
フィールドプログラム可能なフェロダイオード
前記フェロダイオードの模式図と断面TEM画像を
図2に示す。Pt電極の上に20nmのAlScNフィルムを摂氏350度で共スパッタし、続いてPt(100nm)金属上部電極をスパッタした。
図3は、前記正の順方向ダイオードと負の順方向ダイオードのI-V曲線を示しており、2つの分極状態が逆になっている。ストレージ
図5は、フィールドプログラム可能なフェロダイオードの典型的なI-V特性を示す。この装置は104以上の自己整流比を持ち、アクセストランジスタやセレクタを追加することなく漏洩電流を抑制する。Ielminiet al.,Nature Electron.1p.333(2018)を参照。このダイオードでは、読み出しバイアス電圧~2Vで104を超える大きなオン/オフ比が得られ、これは、ハフニアに基づくメモリーセルで以前に報告された前記オン/オフ比を少なくとも2桁上回るものである。K.Ota,et al.,in IEDM Tech.Dig.,pp.6.2.1-6.2.4(2019)を参照。さらに、Berdan,R ai.,Nature Electron.3,p.259(2020)を参照。
【0016】
高いオン/オフ比と自己修正比に基づき、よく知られたV/2スキームを0-T抵抗クロスバーの読み出しとプログラミングに適用することができる。さらに、Serb,et ai,IEEE Trans. Circuits Syst.I 63,pp.827-835(2016)を参照。
【0017】
検索
TCAMの前記セル構造は、並列に接続された2つのフェロダイオード(
図6)を使用することで大幅に簡略化できるが、正反対に偏光する。基本原理は以下の通りである。MLの放電は、前記フェロダイオードが正の順方向にプログラムされ、前記読み出し電圧がターンオン電圧より高い場合にのみ起こる。OT-1RフェロダイオードTCAMセルの動作を
図7に要約する。前記セル動作中、まず前記2つのフェロダイオードに相補状態がプログラムされる。前記検索データが前記記憶された情報と一致すれば前記MLはハイのままであり、そうでなければ前記MLは放電する。SPICEシミュレーションの例(
図9)では、アップ/ダウンのフェロダイオードをそれぞれ正の順方向/負の順方向状態に設定することにより、前記TCAMセルに論理「0」状態を書き込む。次に、前記アップ/ダウンフェロダイオードに低/高パルス振幅を印加して論理0を探索する。
図8に示すように、「Match」の場合、前記ML抵抗はR1/R2となり、「Mismatch」の場合、前記ML抵抗はR1/R3=R3となる。つまり、前記センスマージンは近似的に(R1/R2)/R3で表される。つまり、OT-2R TCAMの設計には、高いオン/オフ比と高い自己訂正比を同時に達成することが不可欠である。トランジスタが存在しないため、前記SPICEシミュレーションにより、前記提案したTCAMは、トランジスタに基づく先行アーキテクチャと比較して非常にコンパクトな設計であり、4x8TCAMアレイのサーチ遅延が100ps以下であることが検証された。Li,J.et al.,IEEE J.Solid-State Circuits 49,pp.896-907(2014)を参照。さらに、K.Pagiamtzis et al,IEEE Journal of Solid-State Circuits 41,pp.712(2016)を参照。
【0018】
ニューラルネットワーク
報告されたフェロダイオードの高度に直線的で対称的なニューロモルフィックシナプス動作は、ディープ・ニューラルネットワークのアクセラレーションへの応用も後押しする。Qlangfel Xia et al.,Nature Materials.18,pp.309,(2019)を参照。パルス応答の例が
図11に示されており、交互極性パルス列が順番に印加され、前記フェロダイオードが双極でパルス数に依存したアナログ状態変調が可能であることを示している。また、高線形で対称的な増強/減衰特性を持つ4ビットフェロダイオードシンナプスを実験的に観測し、高精度で低遅延なニューラルネットワーク推論への応用を可能にした。我々は、この高線形かつ対称的な重みは、均一な高さと幅を持つパルス列を用いるだけでプログラム可能であり、これは、このメモ抵抗クロスバーのプログラミングを大幅に簡素化することに注目している。この設計は、実験的なフェロダイオードデータと前記PyTorchフレームワークのLeNet-5アーキテクチャによってベンチマークされ、
図11Bに示すように、理想的なソフトウェアレベルの推論に近づく、MNSTデータセットの推論精度~97.5%を示している。
【0019】
側面
以下の側面は例示であり、本開示の範囲または添付の特許請求の範囲を限定するものではない。
【0020】
側面1。強誘電体ダイオードのアレイを含むメモリーセルであって、前記強誘電体ダイオードは、任意選択で、窒化スカンジウムアルミニウム(AlScN)または酸化ジルコニウムハフニウム(HfZrO2)を有し、前記強誘電体ダイオードは、不揮発性であり、パルス数に依存するアナログ状態へのパルス化を介してフィールドプログラム可能であることを特徴とする。
【0021】
側面2。側面1の前記メモリーセルにおいて、前記ダイオードは、2、5、10、25、50、75、100、500、1,000、5,000、または10,000より大きいオン/オフ比を有する、
【0022】
側面3。側面1の前記メモリーセルにおいて、前記ダイオードは、25、50、75、100、200、500、1,000、10,000、50,000、または100,000より大きい自己整流比を有する、
【0023】
局面4。側面1の前記メモリーセルにおいて、前記セルはCMOSバック・エンド・オブ・ライン(BEOL)処理と互換性がある。
【0024】
局面5。側面1の前記メモリーセルにおいて、さらに、窒化スカンジウムアルミニウム(AlScN)または酸化ハフニウムジルコニウム(HfZrO2)を有する強誘電体材料であって、摂氏400度未満の蒸着温度を有する強誘電体材料を有する。
【0025】
側面6。局面1のメモリーセルにおいて、前記強誘電体ダイオードは、双極パルスプログラム可能である。
【0026】
側面7。局面6のメモリーセルにおいて、前記強誘電体ダイオードは、4ビットの状態分解能でパルスプログラム可能である。
【0027】
側面8。局面1のメモリーセルにおいて、前記ダイオードは、約100nm未満、約75nm未満、約50nm未満、または約25nm未満の厚さを有するAlScNまたはHfZrO2を有する。
【0028】
側面9。局面1~8のいずれか1つの前記メモリーセルの複数のインスタンスを有するメモリーセルのアレイであって、当該アレイは、前記強誘電体ダイオードを読み出し、プログラムするために使用されるV/2方式用に配置されている。
【0029】
局面10。局面1~8のいずれか1つのメモリーセルを有する、3値コンテンツ・アドレッサブル・メモリー(TCAM)である。
【0030】
局面11。局面10のTCAMにおいて、当該TCAMのサーチ遅延は約1μs以下、約500ns以下、あるいは約100ns、50ns、10ns、1ns、100ps以下である。
【0031】
局面12。局面9~11のTCAMにおいて、各メモリーセルは、逆極性の2つのダイオード有する。
【0032】
局面13。マルチビットダイオードシンナプスのアレイを有するニューラルネットワークであって、各ダイオードシンナプスは、任意選択で、窒化スカンジウム・アルミニウム(AlScN)または酸化ジルコニウム・ハフニウム(HfZrO2)を有する強誘電体ダイオードを有し、各ダイオードは、不揮発性であり、パルス数に依存するアナログ状態へのパルス化を介してフィールドプログラム可能である。
【0033】
局面14。局面13のニューラルネットワークにおいて、マルチビットダイオードシナプスは、PyTorchフレームワークのLeNet-5アーキテクチャに配置されている。
【0034】
局面15。局面13もしく14のいずれかのニューラルネットワークにおいて、当該ニューラルネットワークは、MNISTデータセット上で少なくとも約90%、少なくとも約95%、少なくとも約97%の推論精度を示す。
【0035】
実施例:フィールドプログラム可能な強誘電体ダイオード上の再構成可能なコンピュート・イン・メモリー
センサやデータ生成装置の氾濫により、現代のコンピューティングは、演算ロジック中心からデータ中心処理へとパラダイムシフトしている。ハードウェアレベルでは、高密度、高性能、低消費電力のメモリーユニットをSIロジック・プロセッサユニットに統合することが急務となっている。しかし、検索やパターンマッチングのようなデータを多用する問題では、コンピュート・イン・メモリー(CIM)演算を実現するために、回路やアーキテクチャレベルでパラダイムを変える技術革新も必要となる。データストレージを兼ね備え、同時に低遅延で小さな設置面積を実現するCIMアーキテクチャは非常に求められているが、実現には至っていない。ここでは、窒化アルミニウムスカンジウム(AlScN)強誘電体ダイオード(FeD)メモリースタ装置を紹介する。我々の装置は、スケーラブルなバックエンド・オブ・ライン・プロセスで、SIプロセッサの上に直接集積することができる。FeDのフィールドプログラム可能性、不揮発性、非直線性を活用し、検索遅延時間<0.1ns、セル設置面積<0.12μm2で、in-situメモリーでの検索演算をサポートする回路ブロックを実証した。さらに、前記FeDの4ビット動作による行列乗算演算も実証した。この結果は、FeDが高速で効率的な多機能CIMプラットフォームの有望な候補であることを強調している。
【0036】
ビッグデータと人工知能(AI)の融合により、さまざまなコンピューティング・アプリケーションに複数の新技術が登場している。センサやエッジ/IoT装置のユビキタス化が進むにつれ、データの洪水が発生し、モバイル装置やエッジ装置からデータセンターやクラウドコンピューティングハードウェアに至るまで、コンピュータハードウェアの効率格差が大きく露呈している。加えて、シリコンベースの相補型MOS(CMOS)装置の微細化の鈍化は、さらに、従来のフォン・ノイマン型コンピュータ・ハードウェア・アーキテクチャ、具体的には中央演算処理装置(CPU)、グラフィックスプロセッシングユニット(GPU)、フィールドプログラマブル・アレイ(FPGA)に基づくリソース要件とのギャップを際立たせている。さらに、このようなフォン・ノイマン・アーキテクチャにおける多くのデータ中心タスクでは、エネルギーと時間の大半が、実際の計算ではなく、メモリーアクセスとデータ移動に消費されることはよく知られている。このボトルネックを緩和し克服するために、いくつかの解決策が提案されており、中でも顕著なものは、メモリーとロジックユニットを物理的に近接して配置することである。材料と装置の両レベルにおいて、この路線で大きな進展があったが、革新的なアプローチは、in-situメモリーを使用して計算機能を実行することである。これは一般に、コンピュート・イン・メモリー(CIM:Compute-in-Memory)として知られている。CIMの包括的な目標は、メモリー帯域幅、新しい不揮発性メモリー(NVM)技術、データ並列性などの個々の最適化によって従来のフォン・ノイマン・アーキテクチャを再設計するのではなく、データが保存されているその場で計算を完了させることによって、コンピュータアーキテクチャを根本的に変革することである。NVMを使用したCIMアーキテクチャのデモンストレーションはいくつか行われているが、その努力の大部分は、単一のタイプの計算タスクに限定されている。例えば、行列乗算アクセラレータは、典型的にはメモリースティブクロスバーアレイを使用して実現されている。しかし、「ビッグデータ」を利用するAIの計算タスクは、同じチップ上で複数のデータ集約的な計算処理を必要とし、できれば同じアーキテクチャを使用してパイプラインで情報を処理する必要がある。最も重要な機能や演算は3つあり、1)オンチップ・ストレージ、2)並列検索、3)行列乗算である。CIMアーキテクチャの構築における重要な課題は、これら3つの機能を実現するために必要な性能と柔軟性の間の相反するトレードオフである。その結果、CIMアクセラレータは行列乗算アクセラレーションで高い性能を達成できることが実証されているが、並列検索などの他のビッグデータ演算には基本的に適していない。したがって、オンチップ・メモリー、並列検索、行列乗算アクセラレーションといった必要不可欠なデータ演算を同時にサポートするために、CIMのための再構成可能で動作上柔軟なハードウェアを概念化し、開発することが重要である。
【0037】
この研究では、窒化アルミニウムスカンジウム(AlScN)強誘電体ダイオード(FeD)装置のユニークな特性、特にそのフィールドプログラム可能性、不揮発性、および非線形性を活用し、トランジスタフリー設計で複数の必須基本データ操作in-situメモリーをサポートするFeD素子に基づく回路ブロックを実証する(
図12A)。具体的には、まず、CMOSバックエンド・オブ・ライン(BEOL)処理に適合する不揮発性で、106を超える非線形性、102を超える高いオン/オフ比、104サイクルを超える耐久性、500nsを超えるフィールドプログラミング速度を持つ自己修正動作を示すFeD素子を実証する。次に、これらのユニークな特性を利用し、0-トランジスタ/2-FeDセルを用いた不揮発性3値コンテンツ・アドレサブル・メモリー(TCAM)を実証する。これらは、ビッグデータアプリケーションにおける並列検索処理のためのインメモリー・コンピューティングのハードウェア実装において、重要なビルディングブロックとして機能する。このトランジスタフリーのアプローチは、我々の装置とメモリーセル設計の重要なメリットである。その結果、前記2-FeD TCAMは最もコンパクトな設計(45nmノードで0.12μm
2/セル)となり、2トランジスタ/2抵抗(2T-2R)に基づくTCAMセルと比較して検索遅延が大幅に短縮された(45nmノードで0.1ns未満)。最後に、前記FeD素子は、電気パルス化によって、優れた直線性と対称性を持つ4ビットの異なる導電状態にプログラムできることも示す。前記フェロダイオードのこのプログラム可能な多ビットの特性を利用して、ニューラルネットワーク計算の重要なカーネルであるアナログ電圧振幅行列乗算の形で、ニューラルネットワーク計算のハードウェア実装を実証する。理想的なソフトウェアに基づくニューラルネットワークに迫る精度を実証している。前記行列乗算演算は、推論と前記in situ学習タスクの両方で、畳み込みニューラルネットワークアーキテクチャにおける実験的FeDコンダクタンス状態にニューラルネットワークの重みをマッピングすることによってベンチマークされ、我々の精度が前記MNISTデータセットにおける理想的なソフトウェアレベルのシミュレーションに近づくことを示している。この結果は、AlSCNに基づくフィールドプログラム可能な不揮発性FeDが、性能と柔軟性のバランスに優れた再構成可能なCIMアーキテクチャを構築するユニークな機会を提供することを示している。
【0038】
メモリー用フィールドプログラム可能なAlScN FeD
我々のFeD素子は、スパッタ蒸着した厚さ45nmの強誘電体AlScN層を上下のアルミニウム電極で挟んだものである。これは、
図12Baの左パネルに示すように、金属・絶縁体・金属(MIM)構造を形成している。AlScNは最近発見された強誘電体であり、ほぼ理想的な強誘電ヒステリシスループ、記録的な残留分極値、組成調整可能な保磁場を持つ。さらに、8インチウェハー上のCMOS BEOL互換プロセス技術に直接集積することができる。また、AlScN膜は高性能強誘電体メモリー装置の最も有望な候補の1つであり、膜厚10nm未満まで拡張可能であることも示されている。前記AlScN膜は電気的に特性評価され、2-4.5MV/cmの大きな保磁場(EC)を示した。これは、より薄い強誘電体層へのスケーリングにとって重要であり、同時に、大きなメモリーウィンドウ、高いオン/オフ比、および良好な保持を維持する。測定された高い残留分極(Prは80~150μC/cm
2)と組み合わせると、強いトンネル障壁変調に基づく顕著なトンネル電気抵抗効果につながり、高いオン/オフ比が得られる。膜蒸着、特性評価、および装置作製の詳細については、方法と補足情報を参照されたい。
図12B(a)は、Al/AlScN/Si基板上に蒸着したAlScN膜とAl上部電極からなるMlM FeD素子の代表的な断面透過電子顕微鏡(TEM)像である。前記AlScN膜の原子分解能TEM像を
図12B(b1)に示す。
図12B(b2)は、AlScN/下部Al界面の厚さ~2nmの界面層を示す。
【0039】
図12Aは、フィールドプログラム可能な強誘電体ダイオードの再構成可能なCIMを示している。a)強誘電体AlScNを上下分極したクロスバー構造のFeD素子の模式図。これらの装置の電界プログラム可能性、不揮発性、非線形性は、b-dに示すように、追加のトランジスタを必要とせずに、ストレージ、検索、ニューラルネットワークなどの複数の原始的なデータ操作に活用できる。b)2端子FeD素子は、102を超えるオン/オフ比と104サイクルを超える耐久性と同時に、106を超える非直線性を持つダイオードのような自己整流動作を示し、FeD素子をストレージ用のメモリー階層にうまく配置している。さらに、高い非直線性により、アクセストランジスタやセレクタを追加することなく、スニーク電流を抑制することができる。c)これは、ビッグデータアプリケーションにおける並列検索のためのインメモリー・コンピューティングのハードウェア実装におけるビルディングブロックとして機能する。d)ニューラルネットワーク場合、FeD素子は、電気パルスの数に関して高い直線性を持つ複数の導電状態を区別するプログラム可能性を提供できる。これにより、ニューラルネットワーク計算の重要なカーネルである行列乗算演算を、入力ベクトルをアナログ電圧振幅に、行列要素をFeD素子のアレイのコンダクタンスに符号化することにより、FeD素子の各ビットラインにおける累積電流の読み取りにマッピングすることができる。
【0040】
45nmのAlScN薄膜の強誘電応答は、半径25μmの円形の金属/強誘電体/金属コンデンサー上で、2μsの遅延と400nsのパルス幅の矩形波を用いたポジティブ・アップ、ネガティブ・ダウン(PUND)測定によって特徴づけられた(
図25参照)。45nmのAlScNのP-Eループは分極に依存したリークを示し、材料を金属極状態に切り替える正電界印加時の分極飽和の観測を妨げるため、PUND試験は分極-電界ヒステリシスループ(前記P-Eループ)測定よりも好ましい。前記PUNDの結果は、
図12Bcに示すように残留分極~150μC/cm
2を示しており、事前の観測結果と一致している。前記強誘電体スイッチングをさらに検証するために、ダイナミック電流応答を行ったところ、強誘電体スイッチングに対応するピークが観察された。
図26参照。前記メモリー効果と信頼性をさらに評価するため、
図12Bdに示すように、正極性状態と負極性状態の間で耐久試験を実施した。
図12Bdは、20,000PUNDサイクルから抽出した残留正負分極を示している。同じAlScN FeD素子の繰り返しセット/リセット動作から、正極性および負極性の分極状態はいずれも安定であり、かなりのサイクル数にわたって書き換え可能であることがわかる。
図12Beに示すように、前記下部電極を接地した状態で前記上部電極に負/正電圧を印加することにより、前記FeD素子を低抵抗状態(LRS)と高抵抗状態(HRS)の間でセット/リセットを繰り返し、擬似DC電圧掃引を用いて100サイクル行った。前記FeD素子は、超低動作電流を示し、9Vから0Vの間で非直線性が106を超える自己整流動作を示すため、アクセストランジスタやセレクタを追加することなく、漏洩電流を抑制することができる。LRSとHRSの抵抗値の分布を
図12Bfにまとめたが、前記LRSとHRSの比のサイクル間変動に厳密な分布が見られる。
【0041】
図12B.室温におけるAlScN/MoS2 FE-FTの電気的特性。a)AlScN FeD素子の3次元概略図とAlScN FeDの断面TEM像(強誘電体スイッチング層として45nmのAlScNを示す)。b)(a)の(1)と(2)の領域から得られた前記高分解能位相コントラストTEM像。c)パルス幅400ns、パルス間遅延2μsの45nmAlScN薄膜のPUND結果。前記PUND試験では、飽和残留分極は150μC/cm
2。d)パルス幅1.5μs、振幅26Vを用いたAlScN膜の耐久試験におけるPUND測定から抽出された残留分極。e)45nmのAlScNに基づくFeDで100サイクルのプログラムと消去を測定。f)プログラム時と消去時のHRSとeにおけるLRSの抵抗分布。
【0042】
検索用2-FeD TCAMセル
次に、不揮発性メモリーとして機能する上記のFeDを有するCIM回路アーキテクチャとコンピュータアプリケーションに焦点を当てる。まず、我々のFeDを用いたTCAMの実装を実証する。TCAMは、ビッグデータアプリケーションにおける高速かつエネルギー効率に優れた並列検索を実現するCIMのハードウェア実装における重要な構成要素である。TCAMは、前記入力データと前記メモリーアレイに前記格納されたデータを並列に比較し、一致が検出された場合にデータアドレスを返すことで検索機能を実行する。このような並列検索により、TCAMは1クロックサイクルでルックアップテーブル機能を実行できる。「0」か「1」のいずれかのビット値を格納するバイナリコンテンツアドレス可能メモリーセルとは異なり、TCAMセルはさらに「X」(「don't care」)ビットを格納することができ、これは入力検索データに関係なく一致状態となり、検索アプリケーションにおいてTCAMをより強力にする。しかし、従来のSi CMOSアーキテクチャでは、スタティックRAM(SRAM)で1つのTCAMセルを構成するために、複数のトランジスタ(~16個)が必要である(
図13a)。この構成では、設置面積が大きくなり、前記トランジスタの充放電や配線の寄生容量による消費電力が大きくなる。このため、高速、大規模、電力制約のあるシステムでは、この構成の使用が制限される。不揮発性メモリー(NVM)は、面積効率とエネルギー効率が高いため、TCAMを実装するための有望な選択肢である。これは、よりコンパクトなアーキテクチャで単一のTCAMセルを形成し、電力が供給されなくても保存された情報を保持するためである。抵抗RAM(PRAM)、磁気トンネル接合(MTJ)RAM、フローティングゲートトランジスタメモリー(FLASH)、相変化メモリー(PCM)に基づくTCAMはすでに実証されている。しかし、これらのアーキテクチャはいずれもフロントエンド・オブ・ライン・トランジスタの上に構築されており、完全なBEOL互換性を持つものはない。
【0043】
本研究では、前記FeDの非線形性が大きいためトランジスタを組み込む必要がなく、FeDを2つだけ使用することで、TCAMの前記セル構造を大幅に簡略化することができる(
図13a)。前記シングルFeD TCAMセルの動作を
図13bに示す。このセル構造から、補足
図17に示すように、陽極と陰極に接続する信号線がビットサーチで並列になっているFeDクロスバーメモリーアレイをTCAMのデモンストレーションに利用するのが自然である。まず、前記FeDに基づくTCAMがどのように「0」か「1」ビットを記憶・検索するかを説明する(
図13b)。前記セル動作中、まず相補的な状態が前記2つのFeDに書き込まれ、検索線(SLとSL)に偏った前記検索データが記憶された情報と一致すれば、一致線(ML)は高いままであり、そうでなければ前記MLはプルダウンされる。先に示したように、前記FeD素子は自己整流性が高く、高いオン/オフ比を維持する。したがって、前記MLへの放電は、前記FeDが低抵抗状態にプログラムされ、読み出し電圧が前記FeDのターンオン電圧より高い場合にのみ起こり得る。
【0044】
図13bに示すように、左/右のFeDをそれぞれ低抵抗/高抵抗状態に設定することにより、前記FeD TCAMセルに論理「1」状態を書き込む。前記サーチ動作中、前記マッチラインは前記FeDのターンオン電圧よりも高い読み出し電圧VSによってバイアスされる。次に、前記左/右のFeDにそれぞれ前記高/低電圧を印加して論理「1」をサーチし、前記左/右のFeDにそれぞれ前記高/低を印加して論理「0」を検索する。この文脈で「高電圧」とは、前記FeDの前記ターンオン電圧より高く、前記書き込み電圧より低い前記読み出し電圧VSを指す。逆に「低電圧」とは、読み出し電圧がゼロに近く、前記FeDの前記ターンオン電圧よりもはるかに低いことを指す。前記左のFeDは前記右のFeDと並列であるため、セル内の両方の前記FeDがカットオフされた場合にのみ、一致状態が観察される(
図13b、左パネル)。これらの書き込み・検索方式に基づき、記憶データと検索データが一致した場合(
図13bの左図に示すように、記憶ビットが論理「1」、検索ビットが論理「1」)、前記低抵抗状態の前記FeDは、その陽極と陰極間の電圧降下がゼロに近く、ターンオン電圧よりも低いため、ターンオフされる。さらに、前記高抵抗状態の前記FeD通過する際の電流は自然に小さくなるため、前記高抵抗状態の前記FeDもカットオフされる。そのため、前記2つのチャンネルの前記放電電流はともに最小となり、前記MLは高水準に保たれる。しかし、検索データが前記蓄積データと一致しない場合、前記高抵抗状態の前記右のFeDはカットオフされたままでも、前記左のFeDはカットオフされない。前記低抵抗状態の前記左のFeDは、陽極と陰極間の前記電圧降下がVSであり、ターンオン電圧よりも高いため、ターンオンする。そのため、前記放電電流は大きく、前記MLの揮発量は低い(
図13b、中央パネル)。また、前記2つのFeDに基づくTCAMにおいて、3元的な「don't care」状態も示している。
図13bの右パネルに示すように、前記左右のFeD共に高抵抗状態にすることで、論理「don't care」状態を前記FeD TCAMセルに書き込む。上記の書き込み方式と論理「1」および論理「0」と同じ検索方式により、前記2つのFeDにどのような信号が到着しても、両前記FeDは前記高抵抗状態であるため、常に切断される。
図13cは、FeDに7Vの適度なサーチ電圧を印加し、前記サーチデータと記憶データビット「1」が一致した状態と不一致の状態の両方について、前記2つのFeDに基づくTCAMセルの前記抵抗値を繰り返し擬似DC読み出ししたものである。
図13dは、クエリ・ビット「1」と「0」の両方を使用した、前記蓄積データビット「don't care」に対する前記2つのFeD TCAMセルの前記抵抗の擬似DC読み取りの繰り返しである。これは、どちらのクエリに対しても、前記2つのFeDに基づくTCAMの前記ML抵抗は高いままであり、したがって前記2つのFeDのいずれかを介して放電が発生しないことを示している。したがって、前記2つのFeDを持つTCAMセルは、3つの状態すべてで完全に機能する。前記2つのFeDに基づくTCAMセルの完全なルックアップテーブルを補足情報の表1にまとめた。
【0045】
従来の2端子NVM(メモリースタ)は、TCAMセルを構成するために常にフロントエンド・トランジスタとペアになっている。これは、トランジスタが前記2端子NVMと直列に接続されているため、チャネルを遮断するためにトランジスタが必要となるためである。前記FeDに基づく設計は、いかなるトランジスタをも必要とせずに前記チャネルを遮断する高い自己整流比の恩恵を受けている。言い換えれば、前記FeDは前記トランジスタの機能をその自己整流動作に概念化している。トランジスタがないことで、設置面積と面積効率が小さくなり、前記FeDに基づくTCAMの検索速度が向上する。SPICEシミュレーションを用いて、前記FeDに基づくTCAMの検索遅延が、2トランジスタ-2抵抗(2T-2R)に基づく先行するTCAMアーキテクチャと比較して短縮されることを検証した。様々なTCAMセルの横方向の設置面積と検索遅延のベンチマーク比較チャートを
図13eに示す。我々の2つのFeDに基づくTCAMがCMOS SRAMや他のトランジスタ+NVM素子に基づくアーキテクチャよりも優れた性能を持つことは明らかである。
【0046】
我々のFeDに基づくTCAMの検出マージンは、前記自己整流比とオン/オフコンダクタンス(または電流)比の両方の関数である。我々の詳細なコンパクトモデル(補足注1参照)により、前記FeDのオン/オフ比は、前記強誘電体層の上に非強誘電体絶縁体を統合し、強誘電体層と非強誘電体絶縁体層の厚さ比と前記強誘電体層の前記保磁場の両方を設計することにより、さらに改善することができる。今後の研究では、これらの変数を設計することにより、前記検知マージンをさらに改善することに焦点を当てる。
【0047】
図13検索動作用の2-FeD TCAMセル、a)マッチライン(ML)、サーチライン(SL)、サーチライン(SLバー)の電極を持つTCAMセルのボックス回路図(左)。CMOS電圧スタティックRAM(SRAM)技術に基づく単一16トランジスタ(16T)TCAMセルと、PCMやRRAMなどの抵抗記憶素子に基づく2トランジスタ2抵抗(2T2R)TCAMの回路図。(中央)。本研究で提案された前記2つのフェロダイオードを用いた前記TCAMセル(右)は、並列であるが分極は反対に接続された2つのFeDを使用することで前記TCAMの設計を大幅に簡素化する。b)2つのFeDからなるTCAMセルの動作は「Match」、「Mismatch」、「Don't care」状態を有する。c)前記2個のFeD TCAMセルの前記抵抗を、前記検索データと前記保存データのビット「1」が一致した場合と不一致の場合の両方で、擬似DC読み出しを繰り返した結果、ML比100倍以上の差を示した。d)クエリビット「1」と「0」両方を使用して、保存データビット「Don't care」に対する前記2つのフェロダイオードTCAMセルの抵抗の擬似DC読み取りを繰り返した結果、2つのクエリともに前記ML抵抗2つのFeD TCAMが高く、したがって前記2つのFeDのいずれかを介して放電しないことが判明した。e)様々なメモリー技術におけるTCAMセルの横方向の設置面積と検索遅延のベンチマーク比較チャート。この見積では、0.0081μm
2の単一FeD面積を想定している。
【0048】
ニューラルネットワーク
次に、我々のFeD素子アレイを、行列の乗算/積算(MMAC)演算を繰り返す、ディープ・ニューラル・ネットワーク(DNN)推論に応用することに焦点を当てる。MMAC演算とDNNは通常、ソフトウェアレベルで実装される。しかし、ソフトウェアで実装するため、電力やリソースに制約のある装置や環境での導入は特に困難である。これもまた、前記従来のフォン・ノイマン・コンピュータ・ハードウェア・アプローチによるところが大きく、メモリー・アクセスが集中し、並列化が困難なためである。前記アナログ領域でMMAC演算を行うことは、有望な代替手段を提供する。アナログコンデンサーを備えたメモリースタは、MMAC演算を行うための優れたハードウェア媒体であることが示されている。キルヒホッフ電流則(KCL)の高い並列性を活用することで、前記MMAC演算を大幅に削減し、メモリースタの各ビット線における累積電流を1クロックで読み出すことができる。これは、入力ベクトルをアナログ電圧振幅に、行列要素をメムリスタアレイのコンダクタンスに符号化することで実現される。
【0049】
MMACに適した理想的なメムリスティブ素子は、電気的プログラミングに渡ってコンダクタンス値が線形に配置され、電流の駆動電圧に対する依存性が線形であり、電流量を抑制する抵抗が高いものでなければならない。この領域における先行研究は、主にPRAMやPCMのような、優れたオーム挙動と多数のコンダクタンス状態を示すメムリスティブ素子に焦点を当ててきた。DNNの推論精度の文脈では、入力データの歪みを最小化するために電流と電圧の間に線形関係が必要であり、多数のコンダクタンスが重み行列の精度損失を最小化し、これらは高精度の推論タスクを実行するために不可欠である。しかし、電力効率と面積効率の観点からは、優れたオーム挙動と多数のコンダクタンス状態は、電力効率と計算ごとの低レイテンシを実現するアーキテクチャの指標を損なうことになる。これにはいくつかの理由がある。第一に、優れたオーム挙動をするメムリスティブ素子は、素子のコンダクタンスが高いという代償を伴う。第2に、多数のコンダクタンスが相応に必要となるため、高精度のアナログ/デジタル変換器(ADC)が必要となる。メムリスタアレイシステムでは、回路レベルで電力と面積のコストが前記ADCによって支配されることは、先行研究からすでに知られている。そのため、DNN推論エンジンでは、コンダクタンス状態が多いほど、アーキテクチャレベルでの電力オーバーヘッドが大きくなる。したがって、前記DNNの推論精度と前記電力効率および面積効率との間には、明らかなトレードオフが存在する。ここでは、FeDメムリスタを用いることで、これらの指標間の最適なトレードオフを実現できることを示す。まず、前記素子のコンダクタンスに関するトレードオフを実現するためには、線形挙動を維持しながら、メモリースタ素子の動作コンダクタンスを低下させることが重要である。前者の条件は、前記FeD固有の特性である自己整流性の高いデバイスでは容易に満たされる。後者の条件は、前記入力電圧振幅にエンコーダを適用して電流-電圧関係を線形化することで満たすことができる(補足注2参照)。第二に、前記コンダクタンス状態の数の前記トレードオフを緩和するために、少数ではあるが、まばらに線形に配置されたコンダクタンス状態が必要である。このアプローチは、多数のコンダクタンス状態を実装するアプローチと比較して、同等の推論精度を達成することができる。
【0050】
図14Aは、段階的電圧パルス変調によるFeDの逐次スイッチングを示している。前記FeDセルは、段階的電圧パルスを用いて16種類の異なるコンダクタンス状態に逐次にプログラムされる。これらのコンダクタンス状態は、後述するようにプログラミングパルス数に対して高い直線性を示す。前記図(左)は、前記段階的電圧パルス(16Vから19Vの範囲)が前記FeDの上部電極に印加され、そのたびに消去動作が行われるプログラミング動作の系列を示している。コールアウト窓(右)は、代表的なサイクルの前記コンダクタンス対パルス数を示している。
図4dは、前記FeD素子が電圧パルスによるアナログ双極スイッチングが可能であることを示している(116Vから19Vの範囲、左)。前記コールアウト窓(右)は、逐次プログラミングと逐次消去の1サイクルを示している。前記FeD素子は、16の異なるコンダクタンス状態に対して、双方向変調よりも優れた直線性(直線フィットのR2スコア0.9997)を示した。16の異なるコンダクタンス状態に対するコンダクタンス保持を
図14cに示すが、明らかな劣化は見られない。
図4dは、16個のプログラムパルス(パルス幅2μs)をインターリーブ読み出し(8V)する同一の系列を受けた5個の別々のFeD素子のコンダクタンス状態分布を示す。この結果は、これらのFeD素子間で素子間のばらつきが無視できることを示している。これらの状態をプログラムするために使用されるFeD素子のコンダクタンスの範囲(~25~250nS)は、TCAM動作に使用されるコンダクタンスの範囲(~2~250nS)に比べてはるかに小さいことに注意されたい。これは主に、より小さなコンダクタンス範囲で動作の直線性がよりよく達成されるためである。さらに、前記DNN推論アプリケーションは、必ずしも高い範囲のコンダクタンス変調を必要としない。このようなFeD素子で構成されるアレイの性能を、学習済みの畳み込みニューラルネットワーク(CNN)をコンピュータビジョンに使用する実用的なアプリケーションでシミュレーションした。CNN(2つの畳み込み層と1つの完全接続層を含む)は、MNISTデータセット(MNIST、修正された国立標準技術研究所のデータベース)で訓練され、それに続いて、前記事前に訓練された重みを前記FeDコンダクタンス範囲に転送する。ネットワークの図を
図14eに示す。非直線性の指標である変動係数Aを加えて、低精度コンダクタンス値への重み移動による精度劣化を解析した。前記A因子と前記非線形性の関係については、補足注3で詳述した。したがって、前記全精密に学習されたネットワークの重みは、コンダクタンス状態の数(1~9ビットまでさまざま)に量子化される。次に、前記MNIST試験データセットにおけるネットワークの精度を再評価する。
図14fに見られるように、畳み込みニューラルネットワークは、非線形性が低い(A>0.5)低精度重み移動に対して頑健であり、ここでは、低精度重み移動の変動に対して、単精度浮動小数点フォーマット(FP32)での97.5%全精度試験精度が、わずか3ビットの重み精度で回復する。高い非直線性(A>0.35)の場合、FP32上で全精度試験精度を回復するためには1または2ビットの重み精度が必要であり、これは、線形性に優れたコンダクタンス状態をまばらに、しかし線形に配置することで、大量のコンダクタンス状態を置き換えて同等の推論精度を実行できることを示している。さらに、同じ畳み込みニューラルネットワークを学習させ、各逆伝搬後の前記FeDの現実的なコンダクタンス状態に直接重み更新がマッピングされる、FeDアレイ上のin-situトレーニングのインメモリー実装をシミュレートした。
図14gに示すように、
図14aで実証された前記FeD素子16の個別のコンダクタンス状態の場合、前記in-situ学習の精度はFP32で学習した精度に比べて~2%低下する。しかし、より高度な低精度トレーニング技術とソフトウェア上のモデル圧縮技術を用いれば、この数値は大幅に低減でき、前記トレーニング段階でFeD素子に低精度重み移動を実行しても、精度劣化をほとんど生じさせないと考えられる。
【0051】
したがって、AlScNに基づくフェロダイオード素子は、トランジスタフリーアーキテクチャにおける多機能CIMのBEOL互換プラットフォームである。検索機能の実験的実証は、横方向のセル設置面積と検索遅延を持つTCAM回路によって実現され、既存および実験的なNVM技術を凌駕する。最後に、ソフトウエアに匹敵する推論精度を持つ畳み込みニューラルネットワークのハードウエア実装と組み合わせた、フェロダイオード素子による安定したパルスプログラム可能4ビットメモリーを実証する。したがって、我々の研究は、新しい強誘電体材料とそれを用いたダイオード素子を用いたアーキテクチャを可能にすることにより、CIMプラットフォームの新たな可能性を開くものである。
【0052】
図14 FeDに基づくニューラルネットワーク。a)段階的電圧変調パルスによるフェロダイオード(FeD)の逐次スイッチング。前記FeDセルは、段階的電圧パルスを用いて、様々なコンダクタンス状態に逐次的にプログラムされる。左のパネルは、前記段階的電圧パルスが前記FeDの上部電極にバイアスされ、そのたびに消去動作が行われるプログラミング動作の系列を示している。コールアウト窓(右パネル)は、代表的なサイクルのコンダクタンス対パルス数を示している。b)前記FeDは電圧パルスによるアナログ双極スイッチングが可能であることが実証されている(左)。コールアウト窓(右)は、逐次プログラミングと逐次消去の1サイクルを示している。前記FeD素子は、16の異なる状態にわたって優れた直線性を示している。c)16種類の抵抗状態に対する抵抗保持率。d)16のプログラムパルス(パルス幅2μs)をインターリーブ読み出し(8V)で配列した5個の別々のFeDの抵抗状態分布。e)前記MNISTデータセットに対して学習されたCNNの図。行列の乗算にフェロダイオードアレイを使用するニューラルネットワークのハードウェア実装は、周辺のアナログ・デジタル変換器なしで完全なアナログモードで動作することができる。f)e)におけるネットワークの推論効果のシミュレーション結果。このシミュレーションは、アナログ重み層を実装したFeD素子で構成され、FP32計算を使用してMNISTで学習した前記ネットワークの不正確な重みマッピングを伴う。f)における前記シミュレーションは、A<0.5の場合、重み精度が3ビットと低くても、ネットワークの推論精度の劣化は1%未満であることを示している。g)e)における前記ネットワークを、アナログ重み層を実装した前記FeD素子でin-situトレーニングしたシミュレーション。前記FeDの逐次プログラミングにおける前記優れた線形性を活用し、16の抵抗状態を持つ前記アナログ重み層は、前記FP32計算ベースラインと同等の推論精度で動作することがシミュレーションされた。
【0053】
素子の作製
FeDは、Si/Al0.8Sc0.2N(85nm)基板の上に、Al(80nm)/Al0.68Sc0.32(45nm)N/Al(30nm)の積層膜で構成されている。この積層を作製するには、まず6インチSi<100>ウェーハの上部に、厚さ85nmのAl0.80Sc0.20Nテンプレート層をスパッタ体積する。前記Al0.8Sc0.2Nは、単一合金Al0.8Sc0.2NターゲットのパルスDC反応性スパッタ堆積を用い、ターゲットパワー5kw、圧力7.47x10-3mbar、析出温度摂氏3756度、N2雰囲気で成膜した。85nmのAl0.8Sc0.2Nの第1の層は、それに続く厚さ80nmのAl層を{111}方位に配向させる役割を果たす。このAl(厚さ80nm)層は、この素子で使用されている前記強誘電体層であるAl0.68Sc0.32N(厚さ45nm)の第2の層の下部電極として機能する。前記厚さ45nmの強誘電体Al0.68Sc0.32N膜は、Ecatec CLUSTERLINE(登録商標)200 2パルスDC物理体積システムで、別々の4インチAlターゲットとScターゲットから共スパッタされた。前記AlターゲットとScターゲットは、それぞれ1250Wと695Wで、チャック温度摂氏350度、Arガスフロー10SccmとN2ガスフロー25sccmで運転した。チャンバー圧力は~1.45x10-3mbarに保たれた。このスパッタ条件では、体積速度は0.3nm/secであった。高配向の{111}Al層は、その[0001]軸方向が前記基板に垂直なAlScNの成長を促進し、その結果、高テクスチャーのFE膜が得られた。次に、真空を破ることなく、30nmのAl層を上部電極として、また強誘電体Al0.68Sc0.32Nの酸化を防ぐためのキャッピング層としてスパッタした。
【0054】
素子特性評価
電流-電圧測定は、Keithley 4200A半導体特性評価システムを使用して、大気中、周囲温度で実施した。強誘電体AlScNのP-EヒステリシスループとPUND測定は、Keithley 4200A半導体特性評価システムとRadiant Precision Premier2テストプラットフォームを使用して実施した。TEM断面試料は、FEI Helios Nanolab 6000集束イオンビーム(FIB)システムでin-situリフトアウト法を用いて作製した。試料は、Sharpie(登録商標)マーカーで前記表面に線を書くことにより、薄い炭素質保護層でコーティングした。その後の電子ビームとイオンビームによる白金保護層の堆積は、FIBミリング中の帯電と加熱の影響を防ぐために行われた。最終洗浄段階では、低エネルギーのGa+イオンビーム(5keV)を使用して、FIBによる損傷を低減した。TEMによる特性評価と画像取得は、加速電圧200kVで動作するJEOL F200を用いて行った。前記試料は、[001]ゾーンの軸に配向させて撮影した。前記撮影したTEM画像はすべて、Digital Micrographソフトウェアを使用して収集した。
【0055】
強誘電体ダイオードのオン/オフ比評価用コンパクトモデル
一般的なオン/オフ比評価方法
前記強誘電体ダイオード(FeD)のオン/オフ比を評価し、前記4特性を把握するためには、前記強誘電体ダイオード内の電子輸送を解明する必要がある。前記強誘電体内の電子輸送には、直接トンネル、ファウラー・ノルドハイムトンネリング、熱電子放出の3つの主な方法があり、それぞれの効果を示すバンド図を
図15に示す。ウェンツェル・クラマーズ・ブリルアン(WKB)近似を用いれば、3つの方法すべてを1つの式で包含することができる。この近似式では、トンネル確率は次式で与えられる。
【0056】
【0057】
ここで、m*は電子の有効質量、Ecは強誘電体の保磁場、V(x)は強誘電体を横切る電圧、Eは印加磁場である。状態密度の積分は次のようになる。
【0058】
【0059】
ここで、KBTはボルツマン定数に温度を掛けたもの、Ef,1とEf,2は強誘電体の左右のフェルミ準位である。これらの式を用いて、電流密度Jを次のように定義できる。
【0060】
【0061】
この電流密度に前記強誘電体膜の面積を掛けたものが、前記素子を流れる前記トンネル電流となる。このモデルは、強誘電体ダイオードの前記I-V特性を効果的に捉えているが、効率には欠ける。
【0062】
図15は、ポテンシャル障壁を介した電子輸送の3つの方法を示している。(a)直接トンネリング(b)ファウラー・ノルトハイム・トンネリング(c)熱電子放出。
【0063】
電圧シフトモデルとその検証
電圧シフトモデル
解析では、前記FeDの前記I-V特性を記述する新しいコンパクトシフトモデルを提案した。前記FeDでは、低抵抗状態(LRS)から高抵抗状態(HRS)への前記ダイオードの前記I-V曲線の変化を、LRSからHRSへの変換に伴い、前記I-V曲線がΔVの分だけ左から右にシフトするものとして扱うことができる。言い換えれば、LRSでの前記電流と同じ電流を生成するために、HRSでのΔVの電圧を相殺するために、より多くの電圧が必要となる。前記シフトされた電圧ΔVは次のように導出できる。
【0064】
【0065】
ここで、tは前記強誘電体層の厚さ、Edpは前記強誘電体の脱分極磁場であり、脱分極磁場を次のように表すことができることがわかった。
【0066】
【0067】
ここで、ECは前記強誘電体層の保磁場、Prは残留分極、εは強誘電体の誘電率、βは酸化物キャパシタンスCoxと前記強誘電体キャパシタンスCfeに関係するパラメータである。
【0068】
【0069】
電圧シフトモデルとWKB近似の比較
電圧シフトモデルは、
図16に示すWKB近似でモデル化した前記強誘電体ダイオードの前記I-V特性と比較的一致した結果を示すことを検証した。さらに、前記電圧シフトモデルは、前記WKB近似のような数値積分ではなく、解析方程式を利用するため、より効率的である。さらに、新しいモデルの双曲線関数は、脱分極電界E
dpが前記モデル内の前記保磁電界E
Cを超えないため、前記I-V曲線の読み出し電圧領域に焦点を当てるのに役立つ。
【0070】
図16。任意の強誘電体について、前記WKB近似(緑)と強誘電体ダイオードの新しい電圧シフトモデル(青)を用いた前記4曲線の比較。紫色の曲線は、前記WKB近似でモデル化した高抵抗状態での前記ベース曲線を示す。
【0071】
前記電圧シフトモデルに関連するI-V曲線とオン/オフ比
このコンパクトなモデルの検証後、このモデルを用いて前記強誘電体ダイオードの前記オン/オフ比と酸化キャパシタンス、残留分極、保磁場などのパラメータとの関係の全体的な傾向を求めた。
【0072】
酸化膜容量によるI-V曲線とオン/オフ比の変化
まず、異なる絶縁体キャパシタンス下での前記FeDシフトのI-V曲線をプロットした。βは0から1の間で変化する。残留分極と保磁力の適切な値を選択することで、HRSシフトの前記シミュレーションI-V曲線を
図17(a))に示す。また、βを変化させたときのオン/オフ比を
図17(b)に示す。
【0073】
図17は、プリコード酸化膜容量βの変化に対するHRSのI-V曲線シフトのプロットを(a)に示したもので、前記I-V曲線シフトの傾向をより良く見るために、βを0.01から0.54まで指数関数的に変化させた。(b)はオン/オフ比対βで、オン/オフ比は(a)の7Vの電圧におけるLRSと対応するシフト曲線間の電流比である。
【0074】
残留分極によって変化するI-V曲線とオン/オフ比
次に、適切な絶縁体キャパシタンスC
oxと保磁場E
Cを用いて、前記残留分極P
rを1~135μC/cm
2の範囲で変化させ、前記得られたI-V特性を
図18(a)に示す。
図18(b)に、異なる残留分極下でのオン/オフ比を示す。
【0075】
図18は、前記残留分極Prの変化によるHRSのI-V曲線のシフトをプロットしたもので、前記I-V曲線のシフト傾向をよりよく見るために、P
rを1~135μC/cm
2まで指数関数的に変化させている。(b)は前記オン/オフ比対P
rであり、前記オン/オフ比は電流である。
【0076】
保磁場によるI-V曲線とオン/オフ比の変化
最後に、0.12~3.12MV/cmの保磁線E
Cに対する前記I-V曲線シフトプロットを
図19(a)に示す。
図19(b)に、異なる保磁場下での前記FeDの前記オン/オフ比の対応プロットを示す。
【0077】
図19。前記保磁場E
Cの変化によるHRSのI-V曲線シフトのプロットを(a)に示す。前記I-V曲線のシフト傾向を得るために、E
Cを0.12~3.12MV/cmで直線的に変化させた。(b)は前記オン/オフ比対ECであり、前記オン/オフ比は(a)の7Vの電圧におけるLRSと対応するシフトした曲線との電流比である。
【0078】
図17~19における前記I-V曲線は、符号化絶縁体キャパンシタンスβ、残留分極Pr、または保磁場ECが大きくなると、前記HRS曲線がさらにシフトすることを示している。そして、式5と
図17~19の両方から、式5の双曲線関数が、前記残留分極Prと前記酸化キャパシタンスによる前記I-V曲線のシフトへの影響を制限していることがわかる。一方、前記保磁場ECが大きくなると前記オン/オフ比が急激に大きくなり、前記双曲線関数では制限されないことがわかる。
【0079】
強誘電体ダイオードの電流電圧関係の線形化
図20に示すデバイスの前記logI-V特性では、前記logIは前記印加電圧に対して優れた直線性を持ち、前記素子の16種類の状態における前記プロットの傾きはフィッティングにおいて一貫している。
【0080】
図20。Log(I)対V.直流電圧を16種類の状態に掃引印加して測定した電流I。
【0081】
強誘電体ダイオードの前記I-V特性を線形化するには、次のようになる。
【0082】
【0083】
ここで、Giはダイオードの前記コンダクタンスに関係するパラメータである。
【0084】
一定の傾きαは、前記強誘電体ダイオード素子の16種類の異なるlogI-V特性に対する線形回帰法によって推定することができる。
【0085】
図21。16種類の状態における電流I対exp(αV)。
図21から、16種類の状態における強誘電体ダイオードのI-exp(αV)特性は、優れた直線性を示し、原点で交差していることがわかるが、これはオーミック抵抗のI-V特性と同じである。全16種類の状態の異なる傾きは、前記16状態のコンダクタンスに比例し、これも直線的に振る舞う。
【0086】
電流Iと前記電圧の関数f(V)=exp(αV)の間の線形特性により、入力をf(V)に線形に対応付けることができる。例えば、0~1までの入力があるとすると、前記入力1を最大(exp(αV))に、入力0を最小(exp(αV)に対応付けることができるとして、0と1の間の入力をmin(exp(αV))とmax(exp(αV))の間に均等に配分する。したがって、各入力を対応するf(V)に対応付け、f(V)を復号して対応する電圧Vを求めるには、次のようにすればよい。
【0087】
【0088】
図22。(a)MNISTデータセットから入力された数字「5」の画像。(b)入力信号を現実的な電圧Vにマッピングして符号化した後のプロット。前記入力信号を前記素子に印加される前記電圧に変換した後に前記機能が残る。
【0089】
図22(b)は、
図22(a)に示した前記MNISTから与えられた入力を、強度を入力信号として、前記素子に印加された電圧振幅を符号化したものに変換したものである。この方法により、前記入力Vを関数f(V)に単純に符号化することによって、ニューラルネットワーク計算において前記AlScN強誘電体ダイオードを単純な抵抗器として使用することができ、次に示すように、出力として測定された電流Iを得ることができる。
【0090】
【0091】
現実的な素子で前記符号化方式を検証するために、[0,1]の範囲の一連の入力を読み取り電圧範囲[4V,8V]に符号化する。次に、前記符号化された電圧を前記強誘電体ダイオード素子に直接印加し、元の入力に応答する電流を出力として測定する。
【0092】
図23。前記元の入力に応答している前記強誘電体ダイオード素子に前記符号化された電圧を印加したときの前記出力電流の測定値である。
【0093】
図23に示すように、前記出力電流は、前記入力に対して優れた線形性を示し、線形フィットのR2スコアは0.9998であった。これは、この線形化符号化法を用いるだけで、前記AlScN強誘電体ダイオードをニューラルネットワーク計算の単純な抵抗器として使用できることを検証している。
【0094】
強誘電体ダイオードの非線形重み更新
事前に訓練した重みをメモリースタにマッピングする際、一般的に線形量子化系列を使用するため、理想的には、重みの増加量と減少量は書き込みパルス数に線形に比例するはずである。しかし、文献で報告されている現実的な素子は、このような理想的な軌跡をたどらず、コンダクタンスは通常、初期に急激に変化し、その後徐々に飽和する。これは、高精度のハードウェア行列乗算を阻害する主な理由の一つである。現実的な素子のこのような非線形重み更新は、係数Aで評価することができる。
【0095】
【0096】
ここで、GminとGmaxは素子で測定されたコンダクタンスの最小値と最大値、Nは適用したパルス数、N0は適用する最大数である。上記の等式から、Aが小さくなるにつれて、前記素子は非線形重み更新をより悪化させると結論づけることができる。
【0097】
図24。(a)係数Aを変えた非線形重み更新による正規化コンダクタンス。(b)前記現実的なFeD素子で測定された前記正規化コンダクタンス。
【0098】
図24(b)に示すように、我々の実証したFeD素子で測定された前記正規化コンダクタンスは、理想的な値に対して10以上のAと0.9997のR2スコアを示し、ほぼ理想的な重み更新を示している。
【0099】
付録の表1は、前記実証されたTCAMのさまざまな値の記憶状態、検索電圧、検索結果に対する電圧モードと符号化テーブルを示している。
【0100】
図25。a)前記分極への前記強誘電体と非強誘電体の寄与を区別するための前記PUND測定の信号系列の概略図。b)電圧スイッチングパルス開始から400ns以内に強誘電体のスイッチングを示すPUND電流密度。
【0101】
図26。45nmのAlScNにおけるダイナミック電流応答。a)前記強誘電体スイッチング誘起電流応答を観察するためのダイナミック電流応答測定用信号系列の概略図。b)a)に示した信号系列に対応する厚さ45nmのAlScNの電流-電圧ヒステリシスループ。上記のプロットは、+4.62MV/cmの正の保磁力場と-3.79MV/cmの負の保磁力場を示している。前記強誘電体膜のリーク最適化は現在進行中の課題である。
【0102】
図27。TCAMのセル構造は、陽極と陰極に接続する信号線が並列である前記FeDクロスバーメモリーアレイを、前記TCAMデモのビットサーチに利用するのが自然である。
【0103】
実施例:CMOS互換アルミニウム・スカンジウム・ナイトライドに基づく強誘電体ダイオードメモリー素子
CMOSバック・エンド・オブ・ライン(BEOL)、相補型金属酸化膜半導体(CMOS:Complementary-Metal-Oxide-Semiconductor)互換のAl0.64Sc0.36Nに基づく強誘電体ダイオードは、そのリーク電流に分極依存性のヒステリシスを示す。我々の素子は、4インチシリコンウェハー上に成長したBEOL温度(摂氏350度以下)に適合する金属/絶縁体/強誘電体/金属構造(白金/ネイティブ酸化物/Al0.64Sc0.36N/白金)で構成されている。この素子は、整流比105以上のダイオードとして自己選択的な振る舞いを示す(5Vの場合)。アクセストランジスタやセレクタを追加することなく、漏洩電流を抑制することができる。さらに、前記分極に依存する漏洩電流を考慮すると、前記ダイオードの電流-電圧掃引は、低抵抗状態と高抵抗状態の間のオン/オフ比が~50,000のメモリースタに類似している。我々の素子はまた、DCサイクル中に安定したプログラム抵抗状態を示し、300Kで1,000秒より長い保持時間を持つ。これらの結果は、このシステムが将来の高性能ポストCMOS互換不揮発性メモリー技術として大きな可能性を秘めていることを示している。
【0104】
モノのインターネット(IoT)装置、非ボンノイマンコンピューティングアーキテクチャ、人工知能(AI)計算アルゴリズムなどの新しい素子アプリケーションは、低消費電力で高密度の不揮発性メモリー(NVM)ソリューションに対する強い需要を生み出している。様々な新しいNVM技術の中でも、強誘電体ランダムアクセスメモリー(FeRAM)は、その高速アクセス、高耐久性、極めて低い書き込みエネルギーと電流、良好なリテンションにより魅力的である。しかし、商用スケールの半導体アプリケーションへのFeRAMの組み込みは、130nmノードで停滞している。強誘電体(FE)メモリーの急速な発展を妨げ、古典的な電荷に基づくメモリーや他のNVM技術への挑戦を阻んできた主な課題は3つある。1)従来の1トランジスタ1強誘電体キャパシタ(1T1C)構造は、破壊的読み出しを受け、設置面積が大きい。2)従来の強誘電体は、標準的なBEOL、CMOSプロセスと互換性がない。3)チタン酸ジルコン酸鉛(PZT)やチタン酸バリウム(BTO)のようなペロブスカイトFE材料は、より薄い層に微細化されるにつれて、強誘電特性が劣化する。
【0105】
これらの問題に対処するため、過去10年間に様々な新技術が開発されてきた。前記強誘電体ダイオードや強誘電体トンネル接合(FTJ)のような2端子素子は、分極に依存する漏洩電流またはトンネル電流と整流を利用して抵抗性スイッチングを行うものであり(メモリースタに類似)、1T1Cセルの代替品として有望である。これは、非破壊読み出しを用いるコンパクトな2端子形状の素子であるという利点があるからである。近年、ドープしたHfO2に基づくFTJメモリースタは、コンパクトな不揮発性メモリー用途として大きな注目を集めている。しかし、多くの報告では、ドープHfO2が強誘電性を獲得するのに必要な高いアニール温度(摂氏400度以上)のために、CMOS BEOLプロセスの集積化には不向きである。高いオン/オフ比は、低消費電力のインメモリーコンピューティングを可能にするだけでなく、ニューロモーフィックコンピューティング用のマルチビットメモリー素子のような新しいアプリケーションで使用される場合、ノイズやばらつきに対する強い耐性を維持するためにも不可欠である。
【0106】
最近発見された強誘電体としてのScドープAINは、実用的な2端子強誘電体不揮発性メモリー素子の実現に有望な道を提示している。Scを合金化したAINは、2-4.5MV/cmの大きな保磁場Ecを示し、大きなメモリー窓を維持しながら、より薄い強誘電体層へのスケーリングを可能にする。80-115μC/cm2の高い残留分極Prと組み合わせると、これは強いトンネル障壁変調による大きな抵抗性スイッチングにつながり、したがって高いオン/オフ比を実現する。最近報告された、20nm以下のScドープAINにおける低析出温度(摂氏350度以下)での強誘電体スイッチングにより、これらの素子をCMOS、BEOL互換プロセスに直接集積することが可能になった。
【0107】
ここでは、4インチSiウェハ上の完全BEOL、CMOS互換プロセスで作製されたAl0.64Sc0.36Nに基づく強誘電体ダイオードを実証する。厚さ20nmのAl0.64Sc0.36Nを強誘電体層として用い、薄いネイティブ酸化物バリア層を設けた強誘電体キャパシタは、分極に依存した漏洩電流のヒステリシスを示し、105を超える大きな自己整流比、50,000を超える高いオン/オフ比、DCサイクルで安定したプログラム状態、300Kで1,000秒を超える保持時間を実現した。これらの結果は、将来の高性能CMOS BEOL互換NVMとして有望である。
【0108】
図28(a)は、Pt/ネイティブ酸化物/Al
0.64Sc
0.36N/Pt素子の模式図である。Si基板上にPt(100nm)の下部電極(BE)をスパッタリング成膜した。次に、20nmのAl
0.64Sc
0.36N膜を、Evatec CLUSTERLINE(登録商標)200 2パルスDC物理蒸着システムで、2つの別々の4インチAl(1000W)とSc(655W)ターゲットから共スパッタリングした。上記析出は摂氏350度、N2ガスフロー20sccmで行った。その後、
図28(c)に示すように、標準的なフォトリソグラフィーを用いて上部電極(TE)領域をパターニングし、続いてPt(100nm)金属上部電極の蒸着とリフトオフプロセスを行った。
図28(b)はPtBE上のAl
0.64Sc
0.36N膜の断面透過電子顕微鏡(TEM)である。
図28(b)の挿入図では、赤枠で囲んだ領域の高分解能TEM像度が、Al
0.64Sc
0.36N膜のテクスチャー状エピタキシャル成長と、大気への曝露による強誘電体表面の~4nmのネイティブ酸化膜を示している。前記素子断面のエネルギー分散型X線分光法(EDS)分析マップは、酸化物が窒化物と同様のAlとSc濃度を持つことを示唆している。この素子の最も基本的で特徴的な特性である分極依存性漏洩を実証するためには、酸化物の存在は必要ないことに留意されたい。Al
0.64Sc
0.36NとPtの間のショットキー障壁は、前記素子構造に非対称性をもたらす。強誘電体分極スイッチングによるこのショットキー障壁の変調は、前記素子の整流機能(ダイオードに類似)と組み合わされた掃引間の漏洩電流の大きな差をもたらし、それゆえ強誘電体ダイオードと呼ばれる。他の強誘電体材料に基づく文献には、同じ素子コンセプト、機能を示し、同じ名前で呼ばれている他の例がいくつかある。ここでは、このコンセプトをAlScNに基づく強誘電体材料で実証する。
【0109】
この素子の漏洩は分極に依存し、かつ非対称であるため、一般的な分極-電界(P-E)ループ測定では、スイッチング時の前記強誘電分極が漏洩によって畳み込まれる。この問題を克服するために、漏洩を抑制し、Al
0.64Sc
0.36NのFE特性を明らかにするために、低温(120K)と比較的高い周波数(10kHz)でポジティブアップ、ネガティブダウン(PUND)測定を行った。室温でのP-Eヒステリシス測定の詳細については、我々の過去の研究成果を参照されたい。
図28(c)は、前記PUND測定から抽出したAl
0.64Sc
0.36N素子の典型的なP-Eヒステリシスループを示している。前記PUND測定のパルス回路図は、我々の先行研究と同様、補足情報
図32に記載されている。前記測定結果は、6.5MV/cmの保磁場と25μC/cm
2の残留分極を示している。前記保磁場は、我々のDC測定で観測された値よりもわずかに大きいことが観測された。これは、前記保磁場は温度が下がるにつれて、また測定周波数が高くなるにつれて大幅に増加することが報告されているためであると推測される。残留分極が比較的低いのは、低温での前記PUND測定中に前記部分的な強誘電体スイッチングが起こるためと考えられる。さらに、室温で1MHzで測定した素子のC-V曲線(
図28(d))は、強誘電分極スイッチングを示す、印加電圧の増加とともにキャパシタンスが減少する非線形キャパシタを示唆するバタフライ型のループを示している。同様のC-V曲線は、他のFE材料に基づくFTJまたは強誘電体ダイオード素子について報告されている。加えて、最初のC-V掃引中に明確な強誘電体スイッチング誘起ピークが観測され、これはC-V測定掃引を繰り返すと消失する(補足情報
図33参照)ことから、スイッチングの強誘電体的性質をさらに示唆している。
【0110】
図29に、前記Al
0.64Sc
0.36N強誘電体ダイオードの前記I-V特性を半対数スケールと線形スケールで示す。青色のプロットは、負のプログラム電圧を印加した後に分極がTEを指す非線形ダイオード的なI-V曲線を示し、オレンジ色のプロットは、正のプログラム電圧を印加した後に分極がBEを指すI-V曲線を示す。正電圧でプログラムされた後、前記抵抗値はハイからローに変化し、前記メモリースタの極性は負の順方向ダイオード(青線)から正の順方向ダイオード(オレンジ線)に変化する。同様に、負電圧の掃引では、前記メモリースタの極性が、正の順方向ダイオードから負の順方向ダイオードに変化することが観察できる。前記Al
0.64Sc
0.36Nと前記金属電極(Pt)の間にショットキー障壁が存在するため、前記素子は5Vで205を超える整流比を持つダイオードとして自己選択的な振る舞いを示し、クロスバーアレイで使用する場合、アクセストランジスタやセレクタを追加することなく漏洩電流を抑制できると考えられる。読み出しバイアス電圧~2.5Vにおいて、順方向電圧掃引と逆方向電圧掃引の間で50,000という大きなオン/オフ電流比が得られており、これはハフニアに基づくFTJや強誘電体ダイオードでこれまでに報告されているオン/オフ比を超えるものである。文献から強誘電体メモリースティブ素子の重要な特性の要約を、前記CMOS互換性、オン/オフ比、および強誘電体層の厚さに焦点を当てて、補足情報の表2に示す。我々が報告したAl0.64Sc0.36Nに基づく強誘電体ダイオードは、CMOS BEOLプロセスに適合しながら、同時に高いオン/オフ比を示す2つの実証例のうちの1つであることは注目に値する。大きなオン/オフ電流比を得るためには、表面酸化物の存在が重要かもしれないが、我々の素子で強誘電体効果を示すためには、酸化物層は必要でなく重要でもないことに注意されたい。このことは、Al(30nm)/Al
0.68Sc
0.32N(45nm)/Al(85nm)のin-situ堆積MIMフェロダイオードがオン/オフ比~100で同様の効果を示したことからも明らかである(補足情報S3参照)。
【0111】
さらに、これらのAl
0.64Sc
0.36N FTJのバンド図と電子輸送に対する分極の効果を調べた。我々のAl
0.64Sc
0.36N薄膜はスパッタ蒸着であり、多数の点欠陥と線欠陥を含むことから、バンドギャップ内に複数のトラップ状態を持つことになる。したがって、20nm厚の強誘電体絶縁体を持つMIM強誘電体ダイオード素子を介した電流伝導は、順方向バイアス下での測定で観測されたμAレベルの電流を説明する手段として、何らかのトラップ補助輸送/伝導メカニズムを説明しなければならない。そこで、前記ダイオードを流れる前記順方向電流を、よく知られたトラップ補助伝導・漏洩電流モデル、すなわちPoole-Frenkei(P-F)トンネルモデルで、印加電圧に対してフィッティングした。さらに、変調された三角障壁を通過する電子のファウラー・ノルトハイムまたは直接的な波動メカニズムトンネリングを比較しようとした。前記強誘電体の分極電荷効果は、前記電子バンド図の非対称変調を引き起こす。
図30に示すように、Pが反転すると、Pの方向が印加電界と同一か逆かによって、前記電子バンド図の急峻さが変化する。
図30に示すように、前記TEに正電圧を印加した場合、前記障壁の高さは、平均して、Pが前記TEを指すときの方が、Pが前記BEを指すときよりも高くなる。正バイアスにおける前記強誘電体ダイオードの高抵抗状態(HRS)と低抵抗状態(LRS)の電子バンド図を
図30(a)と(b)に示す。前記強誘電体絶縁体層の厚さが前記~20nmであることから、直接波動メカニズムトンネリングは、トンネル確率が障壁の幅とともに指数関数的に減衰するために、無視できると予想される。したがって、
図30(c)に示すように、電流-電圧データは前記P-Fトンネリングモデルに最もよく適合する。前記P-Fモデルから抽出された前記強誘電体層の誘電率~16は、独立した静電容量の測定値14~15に近い。我々の素子では、前記印加された電界によって前記強誘電体の分極スイッチングが起こり、この分極スイッチングによって前記電界プロファイルが変化し、厚さ20nmの強誘電体層を通る漏洩が変化することに注意されたい。この漏洩メカニズムを説明するために、トラップ補助Poole-Frenkelトンネリングを用いている。同様のメカニズムが、前記強誘電体層の厚さがはるかに小さいFTJ素子を介した伝導を記述するためにも使用されていることも注目に値する。前記LRSの場合、前記印加される電界は、前記強誘電体の分極方向に従う。前記注入された電子は、高占有トラップから空トラップへとホップし、その結果、前記電流は大きくなる。逆に、前記印加電界が前記強誘電分極方向と逆方向の場合、占有電子が少なくなるため、前記電子ホッピング率は著しく低下する。このため、空のトラップが生じ、伝導経路の総数が壊れ、前記ダイオードを流れる電流が小さくなる。この素子の完全でコンパクトなI-Vモデルは重要であり、現在進行中の研究課題であるが、今回の原稿の範囲を超えており、今後の研究で報告する予定である。最後に、MIM素子の面積依存電流密度スケーリングに基づき、導電性ブリッジ形成が当素子の抵抗性スイッチングとして除外できることも指摘しておきたい。MIM素子の面積に対するオン電流の線形スケーリングにより、前記抵抗性スイッチングの前記強誘電体的性質をさらに検証した(補足情報S4参照)。
【0112】
強誘電体ダイオードの予備信頼性試験も実施した。
図31(a)は、10回手動で行ったDCサイクルのデータである。同じ素子からのサイクルI-V曲線は、前記電流-電圧特性が安定で再現性があることを示している。さらに、前記強誘電体の前記2つの異なる分極状態、ひいては前記メモリースタの抵抗(電流)状態は、2つの不揮発性メモリー状態としてプログラムできる。さまざまな遅延時間での読み出しを行い、リテンションを決定した(
図31(b))。前記低および高電流/抵抗状態は、室温で少なくとも1,000秒間、明らかな劣化なしに保持できる。我々の強誘電体ダイオードのスイッチングが純粋に電子的なメカニズムであることを考えると、他のすべての強誘電体メモリー素子と同様に、前記電圧-時間のジレンマにさらされる。しかし、この電圧-時間のジレンマは、強誘電体層を薄くし、AlScN材料が持つ特性である高い保磁場と同時に理想に近い(正方形状の)ヒステリシスループを持つことで最小化することができる。
【0113】
このAl0.64Sc0.36Nに基づく強誘電体ダイオードは、強誘電分極の関数として漏洩電流に大きな差を示し、その結果、メモリースタに類似したヒステリシス電流電圧ループを生じる。我々の素子は、4インチSiウェハー上の完全BEOL、CMOS互換プロセスで製造されている。強誘電体層として厚さ20nmのAl0.64Sc0.36Nを用いた結果、得られた強誘電体ダイオードは、105を超える大きな自己整流比、50,000を超える高いオン/オフ比、DCサイクルでの安定したプログラム状態、300Kで1,000秒を超える保持時間という高性能を示した。これらの結果は、このシステムが、将来の高性能CMOS BEOL互換不揮発性メモリー技術として大きな可能性を持つことを示している。
【0114】
図28。(a)金属/酸化物/Al
0.64Sc
0.36N/金属メモリースター素子の概略図。(b)前記Siウェハー基板上に成長したPt下部電極と前記Al
0.64Sc
0.36N強誘電体を示す前記素子の断面透過電子顕微鏡写真。挿入図は、赤枠で囲んだ領域の高分解能TEM像とEDSによる元素マッピング。(c)120Kで測定したAl
0.64Sc
0.36N PUNDの測定結果。(d)室温、1MHzで測定した素子の代表的なC-V曲線で、典型的なバタフライループを示す。
【0115】
図29。(a)前記強誘電体メモリースタの半対数および線形電流-電圧特性。青色のプロットは、負のプログラム電圧を印加した後の非線形I-V曲線を示し、オレンジ色のプロットは、抵抗状態が正の電圧によってプログラムされたI-Vスイープを示している。
【0116】
図30。(a)MIM素子のHRSとLRSの電子バンド図。線の傾きはE場の指標であり、トラップ準位はミッドギャップにあると仮定されていることに注意。(c)Poole-Frenkelトンネルモデルへの実験電流-電圧データのフィッティング。絶縁体の誘電率~16を抽出し、独立したキャパシタンス測定と一致する良好なフィッティングを示している。
【0117】
図31。(a)FTJの安定性と再現性を示す、手動DCスイッチングサイクルにわたるサイクリック4曲線。(b)5Vでの読み出しによる前記低・高電流/抵抗状態の保持~1,000秒。
【0118】
図32。PUND測定のためのパルス系列の概略図。AlScN薄膜の前記強誘電応答は、2つのパルス間に1msの遅延を設けた5つの単極性三角信号を用いたPUND測定によって特徴付けられた。
【0119】
図33。(a)強誘電体(FE)AlScN金属-絶縁体-金属素子の模式的断面図。容量電圧(C-V)測定の電圧掃引の初期状態と最終状態の分極方向を矢印で示す。前記電圧掃引の番号は矢印で示されている。(b)(a)で示した各スイープ番号のC-Vデータ。最初の掃引は、~7.5Vまでの静電容量の明確な上昇を示し、その後、強誘電体の分極スイッチングに特徴的な急激な下降が続く。残りの掃引は静電容量の上昇を示さないことから、印加する電圧の符号と大きさの範囲が同じであれば、分極は保持され、スイッチングされないことがわかる。
【0120】
図34。本稿に示した厚さ20nmのAl
0.68Sc
0.32N素子と定性的に同様のI-V特性を示すIn-situ成膜したMIM Al(30nm)/Al
0.68Sc
0.32N(45nm)/Al(85nm)フェロダイオード素子のI-V特性。上記の素子は真空を破ることなくin-situで成膜されたため、この素子には酸化膜がなく、オン/オフ比が~100のフェロダイオードのスイッチング動作を示している。
【0121】
図35。上部電極の直径を変えた3つの円形Pt/ネイティブ酸化物/Al
0.64Sc
0.36N/Pt MIM素子の電流密度対電圧のオン状態スイープ。オン状態の電流密度(断面積で規格化した電流)は、3つの素子すべてで重複しており、コンダクタンスまたは電流が断面積に比例して直線的に増加することが示唆される。もしこの素子が導電性ブリッジを形成していれば、電流密度曲線は重ならないはずである。したがって、スイッチングメカニズムとして導電性ブリッジ形成は除外される。
【0122】
補足情報
【0123】
【0124】
【国際調査報告】