(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-19
(45)【発行日】2024-12-27
(54)【発明の名称】半導体素子の特性予測システム
(51)【国際特許分類】
H01L 21/02 20060101AFI20241220BHJP
【FI】
H01L21/02 Z
(21)【出願番号】P 2021555901
(86)(22)【出願日】2020-11-06
(86)【国際出願番号】 IB2020060440
(87)【国際公開番号】W WO2021094881
(87)【国際公開日】2021-05-20
【審査請求日】2023-10-25
(31)【優先権主張番号】P 2019207258
(32)【優先日】2019-11-15
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000153878
【氏名又は名称】株式会社半導体エネルギー研究所
(72)【発明者】
【氏名】細海 俊介
(72)【発明者】
【氏名】鈴木 邦彦
(72)【発明者】
【氏名】安部 寛太
(72)【発明者】
【氏名】岩城 裕司
(72)【発明者】
【氏名】島田 大吾
(72)【発明者】
【氏名】鎌田 悦子
【審査官】安田 雅彦
(56)【参考文献】
【文献】特表2017-536584(JP,A)
【文献】特開2019-159864(JP,A)
【文献】特開平05-190458(JP,A)
【文献】特開2008-021805(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H01L 21/00 -21/479
H01L 21/66
H01L 29/00
G05B 19/418
G06N 3/02 - 3/10
G06N 20/00 -20/20
G16C 10/00 -99/00
(57)【特許請求の範囲】
【請求項1】
学習用データセットに基づいて教師あり学
習を行い、前記学習の結果を基にして、予測用データから半導体素子の特性の推論を行う、半導体素子の特性予測システムであって、
前記半導体素子の特性予測システムは、記憶部と、入力部と、処理部と、演算部と、を有し、
前記処理部は、
前記記憶部に格納された第1のデータから前記学習用データセットを作成する機能と、
前記入力部から供給された第2のデータから前記予測用データを作成する機能と、
定性的データを定量的データに変換する機能と、
前記第1のデータおよび前記第2のデータに対して抽出、または除去を行う機能と、
を有し、
前記第1のデータは、第1の半導体素子乃至第m(mは2以上の整数)の半導体素子の工程リスト、および、前記第1の半導体素子乃至前記第mの半導体素子の特性を含み、
前記第2のデータは、第m+1の半導体素子の工程リストを含み、
前記定性的データは、材料の名称、または組成式であり、
前記定量的データは、元素の特性、および組成であり、
前記演算部は、前記教師あり学習の学習および推論を行う機能を有する、
半導体素子の特性予測システム。
【請求項2】
請求項1において、
前記元素の特性は、原子番号、族、周期、電子配置、原子量、原子半
径、原子体積、電気陰性度、イオン化エネルギー、電子親和力、双極分極率、単体の融点、単体の沸点、単体の格子定数、単体の密度、および単体の熱伝導率のいずれか一または複数である、
半導体素子の特性予測システム。
【請求項3】
請求項2において、
前記原子半径は、共有結合半径、ファンデルワールス半径、イオン半径、または金属結合半径のいずれか一である、
半導体素子の特性予測システム。
【請求項4】
請求項1
乃至請求項
3のいずれか一において、
前記半導体素子の特性は
、+GBTストレス試験、+DBTストレス試験、-GBTストレス試験、+DGBTストレス試験、+BGBTストレス試験、または-BGBTストレス試験
のいずれか一の信頼性試験で得られるΔVshの経時変化である、
半導体素子の特性予測システム。
【請求項5】
請求項1
乃至請求項
3のいずれか一において、
前記半導体素子の特性は、Id-Vg特性、またはId-Vd特性である、
半導体素子の特性予測システム。
【請求項6】
請求項1乃至請求項
5のいずれか一において、
前記処理部は、前記定性的データを、Label Encodingを用いて数値化する機能を有する、
半導体素子の特性予測システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一態様は、半導体素子の特性予測システムに関する。また、本発明の一態様は、半導体素子の特性を予測する方法に関する。
【0002】
なお、本明細書などにおいて、半導体素子は、半導体特性を利用することで機能しうる素子を指す。一例としては、トランジスタ、ダイオード、発光素子、または受光素子などの半導体素子である。また別の一例の半導体素子は、容量、抵抗、インダクタなどの、導電膜、または絶縁膜などによって生成される受動素子である。また別の一例の半導体素子は、半導体素子、または受動素子を有する回路を備える半導体装置である。
【背景技術】
【0003】
近年、人工知能(AI:Artificial Intelligence)を用いた分野、ロボットの分野、またはパワーICなどの高い電力を扱うエネルギー分野では、演算量の増大、または消費電力の増大などの課題を解決するための新しい半導体素子の開発が進められている。市場が求める集積回路または集積回路に用いられる半導体素子は、複雑になる一方で、新たな機能を有する集積回路の早期立ち上げが求められている。ただし、半導体素子の開発におけるプロセス設計、デバイス設計、または回路設計では、熟練した技術者の知識、ノウハウ、または経験などが必要である。
【0004】
近年では、半導体デバイスに関して、製造プロセスを最適化するための方法、デバイス特性を推定する方法などが提案されている。特許文献1では、半導体デバイスの断面形状のパターンのSEM像から画像特徴量を算出し、当該画像特徴量と、デバイス特性との対応関係から、被評価パターンのデバイス特性を推定する方法が開示されている。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
半導体素子の製造プロセスでは、半導体素子が完成するまでの工程数が多く、工程の種類および処理条件も多岐にわたる。長大な工程を経て作製された半導体素子は、電気的特性、信頼性試験の結果などの半導体素子の特性が、測定装置を用いて実測される。半導体素子の製造プロセスと半導体素子の特性の因果関係を、実験により1つ1つ検証することで、半導体素子の特性の改善が行われる。
【0007】
しかしながら、半導体素子の製造プロセスを網羅的に調整し、半導体素子の特性との因果関係を調べるには、費用と時間がかかる。さらに、膨大なデータを人が把握することも難しい。そのため、実験による製造プロセスの最適化には大きな労力を要する。
【0008】
そこで、本発明の一態様は、半導体素子の特性予測システムを提供することを課題の一とする。また、本発明の一態様は、半導体素子の特性を予測する方法を提供することを課題の一とする。また、本発明の一態様は、半導体素子の特性を予測するための学習用データセットを提供することを課題の一とする。
【0009】
なお、これらの課題の記載は、他の課題の存在を妨げるものではない。なお、本発明の一態様は、これらの課題の全てを解決する必要はないものとする。なお、これら以外の課題は、明細書、図面、請求項などの記載から、自ずと明らかとなるものであり、明細書、図面、請求項などの記載から、これら以外の課題を抽出することが可能である。
【課題を解決するための手段】
【0010】
本発明の一態様は、学習用データセットに基づいて教師あり学習の学習を行い、学習の結果を基にして、予測用データから半導体素子の特性の推論を行う、半導体素子の特性予測システムである。半導体素子の特性予測システムは、記憶部と、入力部と、処理部と、演算部と、を有し、処理部は、記憶部に格納された第1のデータから学習用データセットを作成する機能と、入力部から供給された第2のデータから予測用データを作成する機能と、定性的データを定量的データに変換する機能と、第1のデータおよび第2のデータに対して抽出、または除去を行う機能と、を有し、第1のデータは、第1の半導体素子乃至第m(mは2以上の整数)の半導体素子の工程リスト、および、第1の半導体素子乃至第mの半導体素子の特性を含み、第2のデータは、第m+1の半導体素子の工程リストを含み、定性的データは、材料の名称、または組成式であり、定量的データは、元素の特性、および組成であり、演算部は、教師あり学習の学習および推論を行う機能を有する。
【0011】
上記半導体素子の特性予測システムにおいて、元素の特性は、原子番号、族、周期、電子配置、原子量、原子半径(共有結合半径、ファンデルワールス半径、イオン半径、または金属結合半径)、原子体積、電気陰性度、イオン化エネルギー、電子親和力、双極分極率、単体の融点、単体の沸点、単体の格子定数、単体の密度、および単体の熱伝導率のいずれか一または複数であることが好ましい。
【0012】
また、上記半導体素子の特性予測システムにおいて、半導体素子の特性は、信頼性試験(+GBTストレス試験、+DBTストレス試験、-GBTストレス試験、+DGBTストレス試験、+BGBTストレス試験、または-BGBTストレス試験)で得られるΔVshの経時変化であることが好ましい。または、上記半導体素子の特性予測システムにおいて、半導体素子の特性は、Id-Vg特性、またはId-Vd特性であることが好ましい。
【0013】
また、上記半導体素子の特性予測システムにおいて、処理部は、定性的データを、Label Encodingを用いて数値化する機能を有することが好ましい。
【発明の効果】
【0014】
本発明の一態様により、半導体素子の特性予測システムを提供することができる。また、本発明の一態様により、半導体素子の特性を予測する方法を提供することができる。また、本発明の一態様により、半導体素子の特性を予測するための学習用データセットを提供することができる。
【0015】
なお、本発明の一態様の効果は、上記列挙した効果に限定されない。上記列挙した効果は、他の効果の存在を妨げるものではない。なお、他の効果は、以下の記載で述べる、本項目で言及していない効果である。本項目で言及していない効果は、当業者であれば、明細書、図面などの記載から導き出せるものであり、これらの記載から適宜抽出することができる。なお、本発明の一態様は、上記列挙した効果、及び/又は他の効果のうち、少なくとも一つの効果を有するものである。したがって本発明の一態様は、場合によっては、上記列挙した効果を有さない場合もある。
【図面の簡単な説明】
【0016】
図1A、
図1Bは、半導体素子の特性予測システムの一例を示す図である。
図2は、半導体素子の特性を予測する方法の一例を示すフローチャートである。
図3A、
図3Bは、ニューラルネットワークの構成を説明する図である。
図4A、
図4Bは、学習用データセットを説明する図である。
図5Aは、半導体素子の信頼性試験で得られる結果を説明する図である。
図5Bは、半導体素子のId-Vg特性を説明する図である。
図6A乃至
図6Cは、入力データを作成する方法を説明する図である。
図7A、
図7Bは、入力データを作成する方法を説明する図である。
図8は、コンピュータ装置を説明する図である。
【発明を実施するための形態】
【0017】
実施の形態について、図面を用いて詳細に説明する。但し、本発明は以下の説明に限定されず、本発明の趣旨およびその範囲から逸脱することなくその形態及び詳細を様々に変更し得ることは当業者であれば容易に理解される。したがって、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。
【0018】
なお、以下に説明する発明の構成において、同一部分または同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、その繰り返しの説明は省略する。また、同様の機能を指す場合には、ハッチパターンを同じくし、特に符号を付さない場合がある。
【0019】
また、図面において示す各構成の、位置、大きさ、範囲などは、理解の簡単のため、実際の位置、大きさ、範囲などを表していない場合がある。このため、開示する発明は、必ずしも、図面に開示された位置、大きさ、範囲などに限定されない。
【0020】
また、本明細書などで用いる「第1」、「第2」、「第3」という序数詞は、構成要素の混同を避けるために付したものであり、数的に限定するものではないことを付記する。
【0021】
(実施の形態1)
本実施の形態では、本発明の一態様の、半導体素子の特性予測システムおよび半導体素子の特性を予測する方法について、
図1A乃至
図8を用いて説明する。
【0022】
本発明の一態様の半導体素子の特性予測システムは、半導体素子に関する情報から、当該半導体素子の特性を予測することができるシステムである。また、本発明の一態様の半導体素子の特性を予測する方法は、機械学習を用いて、半導体素子の特性を予測する方法である。
【0023】
<半導体素子の特性予測システム>
図1Aは、特性予測システム100の構成を示す図である。つまり、
図1Aは、本発明の一態様である、半導体素子の特性予測システムの構成の一例でもあるといえる。
【0024】
特性予測システム100は、ユーザが利用するパーソナルコンピュータなどの情報処理装置に設けられていてもよい。または、サーバに特性予測システム100の処理部を設け、クライアントPCからネットワーク経由でアクセスして利用する構成としてもよい。
【0025】
図1Aに示すように、特性予測システム100は、入力部101、処理部102、演算部103、出力部104、および記憶部105を備える。入力部101、処理部102、演算部103、出力部104、および記憶部105のそれぞれは、伝送路を介して接続されていてもよい。
【0026】
記憶部105は、複数の半導体素子のそれぞれに関する情報のデータを格納する。半導体素子に関する情報として、例えば、半導体素子の工程リスト、半導体素子の特性、半導体素子の形状に関する情報などがある。以降では、半導体素子の工程リストのデータを、単に、半導体素子の工程リストと表記する場合がある。また、半導体素子の特性のデータを、単に、半導体素子の特性と表記する場合がある。また、半導体素子の形状に関する情報のデータを、単に、半導体素子の形状に関する情報と表記する場合がある。
【0027】
半導体素子の工程リストでは、複数の工程が半導体素子の作製工程順に設定され、各工程に対して処理条件が指定される。
【0028】
半導体素子の特性は、測定装置を用いて実測することで得られる、半導体素子の電気的特性、信頼性試験の結果などである。半導体素子の特性のデータは、例えば、半導体素子の電気的特性の測定データ、信頼性試験を実施することで得られるデータなどである。
【0029】
半導体素子の形状に関する情報は、半導体素子の構成要素の位置、大きさ、範囲などである。半導体素子の形状に関する情報のデータは、例えば、半導体素子の構成要素の位置、大きさ、範囲などを表す数値データ、半導体素子およびその周辺の画像データなどである。具体的には、チャネル長およびチャネル幅などの測長データ、走査型電子顕微鏡(SEM:Scanning Electron Microscope)による観察像、透過型電子顕微鏡(TEM:Transmission Electron Microscope)による観察像などである。
【0030】
記憶部105は、少なくとも、複数の半導体素子のそれぞれの、工程リストおよび特性を格納する。なお、記憶部105に格納される半導体素子の工程リストには、それぞれIDが割り振られることが好ましい。ここで、半導体素子の工程リストに割り振られたIDを、工程リストIDと表記する。また、記憶部105に格納される半導体素子の特性は、工程リストIDと関連付けられている。つまり、半導体素子の特性の読み込み、書き出しなどは、工程リストIDを基に行われる場合がある。
【0031】
記憶部105は、上記複数の半導体素子それぞれの形状に関する情報が格納されてもよい。このとき、記憶部105に格納される半導体素子の形状に関する情報は、工程リストIDと関連付けられることが好ましい。このとき、半導体素子の形状に関する情報の読み込み、書き出しなどは、工程リストIDを基に行われる場合がある。
【0032】
複数の半導体素子の工程リスト、および複数の半導体素子の特性は、入力部101、記憶媒体、通信などを介して、記憶部105に格納される。また、複数の半導体素子の形状に関する情報も、入力部101、記憶媒体、通信などを介して、記憶部105に格納されるとよい。
【0033】
複数の半導体素子の工程リスト、および複数の半導体素子の特性は、テキストデータとして記憶部105に格納されることが好ましい。特に、複数の半導体素子の特性は、数値データまたは2変数データとして記憶部105に格納されることが好ましい。本明細書などでは、2変数データとは、2つの変数に関するデータの集まりを指す。なお、2変数データは、3以上の多変数データから2つの変数に関するデータを抽出して得られるデータの集まりであってもよい。
【0034】
なお、複数の半導体素子の工程リストおよび複数の半導体素子の特性が画像データである場合、画像データとして記憶部105に格納されてもよいが、画像データをテキストデータに変換した後に記憶部105に格納されることが好ましい。テキストデータのデータサイズは、画像データのデータサイズよりも小さいため、画像データをテキストデータに変換した後に記憶部105に格納することで、記憶部105への負荷を小さくすることができる。
【0035】
特性予測システム100は、光学文字認識(OCR)機能を有していてもよい。これにより、画像データに含まれる文字を認識し、テキストデータを作成することができる。例えば、処理部102が当該機能を有していてもよい。または、特性予測システム100が、さらに、当該機能を有する文字認識部を有していてもよい。
【0036】
記憶部105は、学習済みモデル(推論モデルともいう)を格納する機能を有してもよい。
【0037】
入力部101は、ユーザがデータIN2を入力するための機能を有する。データIN2は、テキストデータ、または画像データである。入力部101として、キーボード、マウス、タッチセンサ、スキャナ、カメラなどの入力デバイスがある。なお、データIN2は、記憶部105に格納されてもよい。
【0038】
なお、データIN2が画像データである場合、特性予測システム100が上記OCR機能を有することで、画像データに含まれる文字を認識し、テキストデータを作成することができる。例えば、当該OCR機能が処理部102に備えられる場合、データIN2は画像データのままでもよい。または、当該OCR機能が特性予測システム100の処理部102以外に備えられる場合、画像データから変換されたテキストデータをデータIN2としてもよい。
【0039】
処理部102は、記憶部105から供給されるデータIN1から、学習用データセットDSを生成する機能を有する。学習用データセットDSは、教師あり学習の学習用データセットである。また、処理部102は、入力部101から供給されるデータIN2から、予測用データDIを生成する機能を有する。予測用データDIは、半導体素子の特性を予測するためのデータである。
【0040】
データIN1は、学習用データセットDSを作成する際に用いられるデータ群である。当該データ群には、記憶部105に格納されている複数の半導体素子のそれぞれに関する情報の一部または全てが含まれる。
【0041】
ここで、複数の半導体素子の一部または全てを、半導体素子30_1乃至半導体素子30_m(mは2以上の整数である)と表記する。このとき、半導体素子30_1乃至半導体素子30_mの工程リストを、それぞれ工程リスト10_1乃至工程リスト10_mとする。また、測定装置を用いて実測される半導体素子30_1乃至半導体素子30_mの特性を、それぞれ特性20_1乃至特性20_mとする。つまり、特性20_1乃至特性20_mは、それぞれ、工程リスト10_1乃至工程リスト10_mにしたがって作製された半導体素子に対して測定装置を用いて実測される特性である。
【0042】
以降では、工程リスト10_1乃至工程リスト10_mをまとめて、複数の工程リスト10と表記する場合がある。また、特性20_1乃至特性20_mをまとめて、複数の特性20と表記する場合がある。また、半導体素子30_1乃至半導体素子30_mをまとめて、複数の半導体素子30と表記する場合がある。
【0043】
データIN1には、例えば、工程リスト10_1乃至工程リスト10_mのデータ、ならびに、特性20_1乃至特性20_mのデータが含まれる。また、データIN1には、工程リスト10_1乃至工程リスト10_mのそれぞれの工程リストIDと関連付けられている半導体素子の形状に関する情報のデータが含まれてもよい。以降では、工程リスト10_1乃至工程リスト10_mのデータを、単に、工程リスト10_1乃至工程リスト10_mと表記する場合がある。また、特性20_1乃至特性20_mのデータを、単に、特性20_1乃至特性20_mと表記する場合がある。
【0044】
データIN2は、ユーザが半導体素子の特性の予測用に指定する、半導体素子に関する情報である。データIN2には、例えば、半導体素子の特性の予測用に指定する工程リストが含まれる。半導体素子の特性の予測用に指定する工程リストを、工程リスト11とする。また、データIN2には、工程リスト11の工程リストIDと関連付けられている半導体素子の形状に関する情報が含まれてもよい。
【0045】
また、処理部102は、定性的データ(質的データ、カテゴリーデータ、カテゴリカルデータなどともいう)を数値化する機能を有する。別言すると、処理部102は、定性的データを定量的データ(量的データ、数量データなどともいう)に変換する機能を有する。例えば、処理部102には、Label Encoding、One-hot Encoding、Target Encodingなどが実装されることが好ましい。
【0046】
定性的データは、データIN1およびデータIN2に含まれる。当該定性的データとして、例えば、装置に関するデータ、材料に関するデータなどがある。装置に関する定性的データ、および材料に関する定性的データの数値化については後述する。
【0047】
演算部103は、機械学習を行う機能を有する。例えば、演算部103は、学習用データセットDSに基づいて、教師あり学習の学習を行う機能を有する。また、演算部103は、当該教師あり学習の学習結果を基にして、予測用データDIから、半導体素子の特性の推論を行う機能を有する。機械学習として教師あり学習の学習を行うことで、半導体素子の特性の推論の精度を高めることができる。なお、当該教師あり学習の学習を行うことで、学習済みモデルを生成してもよい。
【0048】
上記教師あり学習には、ニューラルネットワーク(特に、ディープラーニング)を用いることが好ましい。ディープラーニングとして、例えば、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)、再帰型ニューラルネットワーク(RNN:Recurrent Neural Network)、オートエンコーダ(AE:Autoencoder)、変分オートエンコーダ(VAE:Variational Autoencoder)、ランダムフォレスト(Random Forest)、サポートベクターマシン(Support Vector Machine)、勾配ブースティング(Gradient Boosting)、敵対的生成ネットワーク(GAN:Generative Adversarial Networks)などを用いることが好ましい。
【0049】
演算部103の出力を、半導体素子の特性とする。つまり、ニューラルネットワークの出力を、半導体素子の特性とする。ニューラルネットワークの出力として実測値を用いることで、機械学習モデルの学習を行った後、任意の半導体素子の工程リストをニューラルネットワークに入力することで、半導体素子の特性を予測することができる。
【0050】
なお、ニューラルネットワークにおいては、積和演算が行われる。当該積和演算をハードウェアによって行う場合、演算部103は、積和演算回路を有することが好ましい。当該積和演算回路としては、デジタル回路を用いてもよいし、アナログ回路を用いてもよい。なお、当該積和演算は、プログラムを用いてソフトウェア上で行ってもよい。
【0051】
演算部103は、機械学習として、半教師あり学習を行う機能を有してもよい。学習用データには、教師データ(教師信号、正解ラベルなどともいう)として半導体素子の特性が与えられるが、教師データを用意するには、実際に半導体素子を作製し、半導体素子の特性を測定する必要がある。教師あり学習と比べて、半教師あり学習は、学習用データセットに含まれる学習用データの数が少なくてもよいため、学習用データの作成に費やす時間を短縮しつつ、推論を行うことができる。
【0052】
出力部104は、情報を供給する機能を有する。当該情報とは、演算部103で算出された半導体素子の特性の予測結果または当該予測結果に関する情報である。当該情報は、例えば、文字列、数値、グラフなどの視覚情報などとして供給される。出力部104として、ディスプレイなどの出力デバイスがある。なお、特性予測システム100は、出力部104を備えなくてもよい。
【0053】
以上により、半導体素子の特性予測システムが構成される。
【0054】
なお、特性予測システム100は、上記の構成に限られない。例えば、
図1Bに示すように、特性予測システム100は、入力部101、処理部102、演算部103、出力部104、および記憶部105に加えて、格納部106を有してもよい。
【0055】
格納部106は、演算部103が生成した学習済みモデルを格納する機能を有する。特性予測システム100が格納部106を有することで、当該学習済みモデルを基にして、半導体素子の特性の予測を行うことができる。よって、当該学習済みモデルを予め生成しておくことで、半導体素子の特性を予測する際に、教師あり学習の学習を実施する必要がなくなる。したがって、半導体素子の特性を予測するのに要する時間を短縮することができる。
【0056】
格納部106は、伝送路を介して、演算部103と接続されている。なお、格納部106は、伝送路を介して、入力部101、処理部102、出力部104、および記憶部105のそれぞれと接続されていてもよい。
【0057】
なお、格納部106は、記憶部105内に設けられてもよい。また、記憶部105が、格納部106を兼ねてもよい。
【0058】
以上が、特性予測システム100の構成についての説明である。本発明の一態様である、半導体素子の特性予測システムを用いることで、半導体素子に関する情報から半導体素子の特性を予測することができる。例えば、半導体素子の工程リストから半導体素子の特性を予測することができる。また、例えば、半導体素子の工程リストの中から、半導体素子の特性への寄与が大きい工程を抽出することができる。
【0059】
<半導体素子の特性を予測する方法>
図2は、特性予測システム100が実行する処理の流れを説明するフローチャートである。つまり、
図2は、本発明の一態様である、半導体素子の特性を予測する方法の一例を示すフローチャートでもあるといえる。
【0060】
半導体素子の特性を予測する方法は、ステップS001乃至ステップS007を有する。ステップS001乃至ステップ003は、教師あり学習の学習に関する工程であり、ステップS004乃至ステップS007は、教師あり学習の推論に関する工程である。
【0061】
ステップS001は、第1のデータを処理部102に入力する工程である。当該第1のデータは、上述したデータIN1に対応する。つまり、当該第1のデータには、半導体素子30_1乃至半導体素子30_mに関する情報が含まれる。具体的には、当該第1のデータには、工程リスト10_1乃至工程リスト10_m、ならびに、特性20_1乃至特性20_mが含まれる。なお、当該第1のデータには、工程リスト10_1乃至工程リスト10_mそれぞれの工程リストIDと関連付けられている半導体素子の形状に関する情報が含まれてもよい。
【0062】
ステップS002は、上記第1のデータから、学習用データセットを作成する工程である。ステップS002は、
図1Aおよび
図1Bに示す処理部102にて行われる。当該学習用データセットは、上述した学習用データセットDSに対応する。
【0063】
また、ステップS002は、上記第1のデータに含まれる定性的データを数値化する工程を含む。当該定性的データは、例えば、装置に関する定性的データ、材料に関する定性的データなどである。数値化することで得られるデータは、上記学習用データセットに含まれる。
【0064】
ステップS003は、上記学習用データセットに基づいて、教師あり学習の学習を行う工程である。ステップS003は、
図1Aおよび
図1Bに示す演算部103にて行われる。当該教師あり学習のアルゴリズム(学習方法ともいう)に、ニューラルネットワーク(特に、ディープラーニング)を用いることが好ましい。なお、当該教師あり学習の学習により、半導体素子の特性を予測するための学習済みモデルを生成してもよい。
【0065】
ステップS004は、第2のデータを処理部102に入力する工程である。当該第2のデータは、上述したデータIN2に対応する。つまり、当該第2のデータには、ユーザが半導体素子の特性の予測用に指定する、半導体素子に関する情報が含まれる。具体的には、当該第2のデータには、工程リスト11が含まれる。
【0066】
半導体素子が工程リスト11にしたがって作成されている場合、当該第2のデータには、当該半導体素子の形状に関する情報、当該半導体素子の特性などが含まれる場合がある。
【0067】
なお、ステップS004は、ステップS003まで実施された後に実施されることが好ましいが、ステップS001と同時に実施してもよいし、ステップS001乃至ステップS003の実施中に実施してもよい。
【0068】
ステップS005は、上記第2のデータから、半導体素子の特性の予測用データを作成する工程である。ステップS005は、
図1Aおよび
図1Bに示す処理部102にて行われる。つまり、当該半導体素子の特性の予測用データは、上述した予測用データDIに対応する。
【0069】
また、ステップS005は、上記第2のデータに含まれる定性的データを数値化する工程を含む。当該定性的データは、例えば、装置に関する定性的データ、材料に関する定性的データなどである。数値化することで得られるデータは、上記半導体素子の特性の予測用データに含まれる。
【0070】
なお、ステップS005は、ステップS003まで実施された後に実施されることが好ましいが、ステップS001と同時に実施してもよいし、ステップS001乃至ステップS003の実施中に実施してもよい。
【0071】
ステップS006は、ステップS003で行われた教師あり学習の学習結果を基にして、上記半導体素子の特性の予測用データから、半導体素子の特性の推論を行う工程である。別言すると、ステップS006は、上記学習済みモデルを用いて、上記半導体素子の特性の予測用データから、半導体素子の特性の推論を行う工程である。ステップS006は、
図1Aおよび
図1Bに示す演算部103にて行われる。
【0072】
ステップS007は、第3のデータを出力する工程である。ステップS007は、
図1Aおよび
図1Bに示す出力部104にて行われる。当該第3のデータには、上記推論の結果または上記推論の結果に関する情報が含まれる。
【0073】
以上により、半導体素子の特性を予測することができる。なお、ステップS007の代わりに、上記推論の結果または上記推論の結果に関する情報を、
図1Aなどに示す記憶部105に格納する工程を実施してもよい。または、ステップS007は実施されなくてもよい。
【0074】
なお、教師あり学習の学習に関する工程(ステップS001乃至ステップS003)は、半導体素子に関する情報が記憶部105に格納される度に実施されてもよいし、あらかじめ定められたタイミングで定期的に(例えば一日に一度、または一週間に一度の頻度など)実施されてもよい。
【0075】
半導体素子の特性を予測する方法は、上記の方法に限られない。例えば、半導体素子の特性を予測する方法は、ステップS003の後に、ステップS003で生成された学習済みモデルを記憶する工程を有してもよい。当該学習済みモデルは、
図1Bに示す格納部106に格納される。学習済みモデルを予め生成しておくことで、半導体素子の特性を予測する際、ステップS001乃至ステップS003を省略することができる。よって、半導体素子の特性を予測するのに要する時間を短縮することができる。
【0076】
<<ニューラルネットワーク>>
ここで、教師あり学習に用いることができるニューラルネットワークについて説明する。
【0077】
図3Aに示すように、ニューラルネットワークNNは、入力層IL、出力層OL、および隠れ層HLによって構成することができる。入力層IL、出力層OL、および隠れ層HLはそれぞれ、1または複数のニューロン(ユニット)を有する。なお、隠れ層HLは、1層であってもよいし2層以上であってもよい。2層以上の隠れ層HLを有するニューラルネットワークはディープニューラルネットワーク(DNN)と呼ぶこともできる。また、ディープニューラルネットワークを用いた学習は深層学習(ディープラーニング)と呼ぶこともできる。
【0078】
入力層ILの各ニューロンには、入力データが入力される。隠れ層HLの各ニューロンには、前層または後層のニューロンの出力信号が入力される。出力層OLの各ニューロンには、前層のニューロンの出力信号が入力される。なお、各ニューロンは、前後の層の全てのニューロンと結合されていてもよいし(全結合)、一部のニューロンと結合されていてもよい。
【0079】
図3Bに、ニューロンによる演算の例を示す。ここでは、ニューロンNと、ニューロンNに信号を出力する前層の2つのニューロンを示している。ニューロンNには、前層の一方のニューロンの出力x
1と、前層の他方のニューロンの出力x
2が入力される。そして、ニューロンNにおいて、出力x
1と重みw
1の乗算結果(x
1w
1)と、出力x
2と重みw
2の乗算結果(x
2w
2)の総和x
1w
1+x
2w
2が計算された後、必要に応じてバイアスbが加算され、値a=x
1w
1+x
2w
2+bが得られる。そして、値aは活性化関数hによって変換され、ニューロンNから出力信号y=ahが出力される。活性化関数hとして、例えば、シグモイド関数、tanh関数、softmax関数、ReLU関数、しきい値関数などを用いることができる。
【0080】
このように、ニューロンによる演算には、前層のニューロンの出力と重みの積を足し合わせる演算、すなわち積和演算が含まれる(上記のx1w1+x2w2)。この積和演算は、プログラムを用いてソフトウェア上で行ってもよいし、ハードウェアによって行われてもよい。積和演算をハードウェアによって行う場合は、積和演算回路を用いることができる。この積和演算回路としては、デジタル回路を用いてもよいし、アナログ回路を用いてもよい。積和演算回路にアナログ回路を用いる場合、積和演算回路の回路規模の縮小、または、メモリへのアクセス回数の減少による処理速度の向上および消費電力の低減を図ることができる。
【0081】
積和演算回路は、チャネル形成領域にシリコン(単結晶シリコンなど)を含むトランジスタ(以下、Siトランジスタともいう)によって構成してもよいし、チャネル形成領域に酸化物半導体を含むトランジスタ(以下、OSトランジスタともいう)によって構成してもよい。特に、OSトランジスタはオフ電流が極めて小さいため、積和演算回路のアナログメモリを構成するトランジスタとして好適である。なお、SiトランジスタとOSトランジスタの両方を用いて積和演算回路を構成してもよい。
【0082】
積和演算をハードウェアによって行う場合、積和演算回路は、特性予測システム100が有する演算部103に含まれるとよい。
【0083】
以上が、ニューラルネットワークについての説明である。なお、本発明の一態様においては、ディープラーニングを用いることが好ましい。つまり、2層以上の隠れ層HLを有するニューラルネットワークを用いることが好ましい。
【0084】
以上が、半導体素子の特性を予測する方法の一例についての説明である。
【0085】
<半導体素子の特性を予測する方法の詳細>
以下では、半導体素子の特性を予測する方法の詳細について、
図4A乃至
図7Bを用いて説明する。
【0086】
<<半導体素子の構造>>
はじめに、半導体素子の構造について説明する。ここでは、半導体素子の例として、トランジスタについて説明する。
【0087】
トランジスタは、構成要素の位置関係、形状などによって、様々に分類される。例えば、トランジスタ構造は、基板、ゲート、およびチャネル形成領域の位置関係により、ボトムゲート型構造とトップゲート型構造に分類される。ゲートがチャネル形成領域と基板との間に設けられたトランジスタ構造は、ボトムゲート型構造と呼ばれる。一方で、チャネル形成領域がゲートと基板との間に設けられたトランジスタ構造は、トップゲート型構造と呼ばれる。
【0088】
さらに、トランジスタ構造は、ソースおよびドレインと、チャネルを形成する半導体層との接続箇所により、ボトムコンタクト型構造とトップコンタクト型構造に分類される。ソースおよびドレインと、チャネルを形成する半導体層とが、基板側で接続するトランジスタ構造は、ボトムコンタクト型構造と呼ばれる。ソースおよびドレインと、チャネルを形成する半導体層とが、基板とは反対側で接続するトランジスタ構造は、トップコンタクト型構造と呼ばれる。
【0089】
すなわち、トランジスタ構造は、BGBC(ボトムゲートボトムコンタクト)型構造、BGTC(ボトムゲートトップコンタクト)型構造、TGTC(トップゲートトップコンタクト)型構造、TGBC(トップゲートボトムコンタクト)型構造に分類される。
【0090】
トランジスタ構造は、上記の4つの構造のほかに、半導体層の上方および下方にゲートを配置するデュアルゲート型構造、ゲートのパターンに対してソースおよびドレインをセルフアラインで形成するTGSA(Top-Gate Self-Align)型構造などがある。
【0091】
半導体素子30_1乃至半導体素子30_mにおいて、半導体素子の構造は同一または類似することが好ましい。例えば、半導体素子30_1乃至半導体素子30_mがトランジスタである場合、半導体素子30_1乃至半導体素子30_mの構造は、BGBC型構造、BGTC型構造、TGTC型構造、TGBC型構造、デュアルゲート型構造、またはTGSA型構造であることが好ましい。半導体素子の構造を同一にすることで、半導体素子の特性の予測精度を向上させることができる。
【0092】
なお、半導体素子30_1乃至半導体素子30_mにおいて、半導体素子の構造は異なってもよい。半導体素子30_1乃至半導体素子30_mがトランジスタである場合、例えば、半導体素子30_1乃至半導体素子30_mの構造の一部はTGTC型構造であり、それ以外はTGSA型構造であってもよい。複数の構造を組み合わせることで、汎用性の高い、半導体素子の特性の予測が可能となる。
【0093】
以上が、半導体素子の構造についての説明である。
【0094】
<<半導体素子の特性>>
次に、半導体素子の特性について説明する。
【0095】
本明細書などにおいて、半導体素子の特性は、半導体素子の電気的特性を指す。半導体素子の特性として、例えば、ドレイン電流(Id)-ゲート電圧(Vg)特性、ドレイン電流(Id)-ドレイン電圧(Vd)特性、容量(C)-ゲート電圧(V)特性などがある。
【0096】
また、半導体素子の特性は、信頼性試験で得られる結果であってもよい。信頼性試験で得られる結果として、例えば、オン電流(Ion)の経時変化(Ionのストレス時間依存性ともいう)、ΔVshの経時変化(ΔVshのストレス時間依存性ともいう)などがある。
【0097】
ΔVshは、シフト電圧(Vsh)の変化量である。ここで、シフト電圧(Vsh)は、トランジスタのドレイン電流(Id)-ゲート電圧(Vg)カーブにおいて、カーブ上の傾きが最大である点における接線が、Id=1pAの直線と交差するVgと定義される。
【0098】
信頼性試験には、+GBT(Gate Bias Temperature)ストレス試験、+DBT(Drain Bias Temperature)ストレス試験、-GBTストレス試験、+DGBT(Drain Gate Bias Temperature)ストレス試験、+BGBT(Back Gate Bias Temperature)ストレス試験、-BGBTストレス試験などがある。
【0099】
信頼性試験は長時間測定を行う場合があるため、信頼性試験の結果が得られるまでに時間を要する。さらに、測定期間中、測定装置が占有される。そこで、本発明の一態様の半導体素子の特性予測システムを用いることで、信頼性試験の結果を予測することができる。したがって、信頼性試験を実施するか否かを、予測結果をもとに判断することで、信頼性試験の一部を省略することができる。または、信頼性試験の優先順位を決定することができる。これにより、測定装置を有効活用することができる。
【0100】
本明細書などでは、半導体素子の特性には、半導体素子の電気的特性の測定結果から算出される特性値も含まれる。当該特性値として、例えば、しきい値電圧(Vth)、Vsh、サブスレッショルドスイング値(S値)、Ion、電界効果移動度(μFE)などがある。ここで、サブスレッショルドスイング値(S値)とは、ドレイン電圧一定にてドレイン電流を1桁変化させるサブスレッショルド領域でのゲート電圧の変化量をいう。以降では、半導体素子の電気特性の測定結果から算出された特性値を、半導体素子の特性値、または、単に、特性値と呼ぶ場合がある。
【0101】
また、半導体素子の特性には、温度特性も含まれる。当該温度特性として、例えば、しきい値電圧の温度特性、容量特性の温度依存性などがある。温度特性は、異なる複数の温度で測定する必要があるため、温度特性を評価するには時間を要する。本発明の一態様の半導体素子の特性予測システムを用いることで、半導体素子の作製および温度特性を評価するための測定を行わなくても、温度特性を予測することができる。
【0102】
半導体素子の特性が特性値である場合、当該半導体素子の特性は、数値データとして記憶部105に格納される。また、半導体素子の特性が電気的特性または温度特性である場合、当該半導体素子の特性は、2変数データとして記憶部105に格納される。つまり、記憶部105に格納されている半導体素子の特性は、数値化されている。
【0103】
例えば、半導体素子の特性が信頼性試験で得られるΔVshの経時変化である場合、時間およびΔVshに関するデータの集まりが記憶部105に格納される。また、例えば、半導体素子の特性がId-Vg特性である場合、VgおよびIdに関するデータの集まりが記憶部105に格納される。
【0104】
以上が、半導体素子の特性についての説明である。
【0105】
<<学習用データセット>>
ここでは、教師あり学習の学習用データセットについて説明する。
【0106】
図4A、および
図4Bは、学習用データセット50の構成を示す図である。学習用データセット50は、処理部102が生成する学習用データセットDSに対応する。学習用データセット50は、学習用データ51_1乃至学習用データ51_mを有する。学習用データ51_i(iは1以上m以下の整数である)は、入力データ52_i、および教師データ53_iを有する。なお、学習用データ51_iには、半導体素子30_iに関する情報が含まれる。
【0107】
学習用データセット50は、
図1A、および
図1Bに示す処理部102に入力されるデータIN1から生成される。したがって、学習用データセット50は、データIN1に含まれるデータに対して抽出、加工、変換、選択、除去などを行うことで生成される。
【0108】
本実施の形態において、教師データは、半導体素子に関する情報のうち、半導体素子の特性である。つまり、本実施の形態で予測する対象は、半導体素子の特性である。
【0109】
また、本実施の形態において、入力データは、半導体装置に関する情報のうち、半導体素子の工程リストから作成されることが好ましい。つまり、入力データは、半導体装置に関する情報のうち、半導体素子の工程リストの一部を含むことが好ましい。予測する対象である半導体素子の特性は、チャネルが形成される層に用いる半導体材料の種類、ゲート電極として機能する層に用いる導電性材料の種類、ゲート絶縁膜として機能する層に用いる絶縁性材料の種類、これらの層それぞれの膜厚、これらの層それぞれの成膜条件などに影響される。なお、層に用いる材料の種類、層の膜厚、層の成膜条件などは、半導体素子の工程リストに含まれる。したがって、入力データは、半導体素子の工程リストから作成されることが好ましい。
【0110】
教師あり学習の学習用データセットに含まれるデータは、定量的データであることが好ましい。別言すると、当該データは、数値化されていることが好ましい。学習用データセットが数値以外のデータ(定性的データ)を含む場合と比べて、学習用データセットに含まれるデータが数値化されていることで、機械学習モデルが複雑になることを防ぐことができる。
【0111】
図4Aに示す学習用データセット50においては、入力データ52_1乃至入力データ52_mはそれぞれ、工程リスト10_1乃至工程リスト10_mから作成される。また、教師データ53_1乃至教師データ53_mはそれぞれ、特性20_1乃至特性20_mから作成される。
【0112】
なお、
図4Bに示すように、入力データ52_1乃至入力データ52_mはそれぞれ、工程リスト10_1乃至工程リスト10_mと、半導体素子30_1乃至半導体素子30_mの形状に関する情報と、から作成されてもよい。入力データ52_1乃至入力データ52_mに、それぞれ半導体素子30_1乃至半導体素子30_mの形状に関する情報を加えることで、半導体素子の特性の予測精度を向上させることができる。
【0113】
なお、工程リスト10_1乃至工程リスト10_mのそれぞれの工程数は、同じであることが好ましい。これにより、学習用データセットまたは予測用データの作成を容易にすることができる。なお、学習用データセットまたは予測用データを作成する際、工程リストを取捨選択する。例えば、工程リストの一部を抽出する、または、工程リストの他の一部を取り除く。よって、工程リスト10_1乃至工程リスト10_mのそれぞれの工程数は、異なってもよい。
【0114】
上述したように、特性20_1乃至特性20_mは、数値化されたデータであるため、特に変換することなく、それぞれ教師データ53_1乃至教師データ53_mに含めることができる。
【0115】
なお、特性20_1乃至特性20_mが2変数データである場合、当該2変数データから特徴的な点の一または複数を抽出して、それぞれ教師データ53_1乃至教師データ53_mに含めてもよい。また、2変数のうちの一方の変数の値が等間隔となるように、当該2変数データから複数の点を抽出して、それぞれ教師データ53_1乃至教師データ53_mに含めてもよい。
【0116】
図5Aは、半導体素子の信頼性試験で得られる結果を説明する図である。
図5Aでは、横軸は測定開始からの経過時間(ストレス時間ともいう)[h]であり、縦軸はΔVsh[mV]である。例えば、時間A1乃至時間A10、ならびに、時間A1乃至時間A10におけるΔVshの値を抽出して、教師データとして用いるとよい。
【0117】
なお、時間A1乃至時間A10の一部または全ては、ΔVshの値が特徴的であってもよい。または、時間A1乃至時間A10は、等間隔であってもよい。または、時間A1乃至時間A10の一部は、第1の間隔であって、それ以外の時間A1乃至時間A10は、第1の間隔とは異なる第2の間隔であってもよい。
【0118】
また、抽出される時間および当該時間におけるΔVshの値の組の数は、10個に限られず、1個以上9個以下または11個以上であってもよい。
【0119】
図5Bは、半導体素子のId-Vg特性を説明する図である。Id-Vgカーブにおいて、ゲート電圧が0Vにおけるドレイン電流の値は、特徴的な点の一つである。例えば、当該ゲート電圧を電圧B4とする。電圧B4よりも低い電圧として、電圧B1乃至電圧B3を指定する。また、電圧B4よりも高い電圧として、電圧B5乃至電圧B10を指定する。例えば、電圧B1乃至電圧B10、ならびに、電圧B1乃至電圧B10におけるドレイン電流の値を抽出して、教師データとして用いるとよい。または、電圧B4を除く電圧B1乃至電圧B10のうちの一を、0Vとしてもよい。
【0120】
また、抽出される電圧および当該電圧におけるドレイン電流の値の組の数は、10個に限られず、1個以上9個以下または11個以上であってもよい。
【0121】
<<入力データの作成方法>>
ここで、
図4Aに示す入力データ52_1乃至入力データ52_mの作成方法について説明する。
【0122】
はじめに、入力データ52_1の作成方法について説明する。ここでは、入力データ52_1が工程リスト10_1から作成される例について、
図6A乃至
図6Cを用いて説明する。
【0123】
工程リストには、複数の工程が、半導体素子の作製工程順に設定される。半導体素子を作製する際の工程として、例えば、成膜、洗浄、レジスト塗布、露光、現像、加工、加熱処理、検査、基板移載などの工程がある。
【0124】
また、工程リストに設定される複数の工程のそれぞれに対して、処理条件が指定される。例えば、成膜工程の処理条件として、装置、材料、膜厚、温度、圧力、電力、流量などがある。なお、成膜工程の処理条件は、半導体素子の特性に影響を与える場合がある。また、成膜以外の工程においても、処理条件、工程の有無、工程順序などによって、半導体素子の特性に影響を与える場合がある。
【0125】
処理条件は、定性的データと定量的データが混在しており、様々な尺度で値をとる。各々の工程における特徴量の類似性を表現するために、例えば、材料に関する定性的データは、材料毎に物性などの定量的データに変換し、そのセットで特徴量とするとよい。
【0126】
ここでは、工程リスト10_1が、n個(nは2以上の整数である)の工程を有するとする。例えば、
図6Aに示す工程リスト10_1では、1番目の工程は基板移載工程であり、j番目(jは2以上(n-4)以下の整数である)の工程は成膜工程であり、(j+1)番目の工程は加工工程であり、(j+2)番目の工程は成膜工程であり、(j+3)番目の工程は加熱処理工程であり、n番目の工程は基板移載工程であるとする。なお、
図6A、および
図6Bに示すNo.は、工程番号である。
【0127】
j番目の工程(成膜工程)で指定される処理条件を、条件1乃至条件p(pは2以上の整数である)とする。また、(j+1)番目の工程(加工工程)で指定される処理条件を、条件1乃至条件q(qは1以上の整数である)とする。また、(j+2)番目の工程(成膜工程)で指定される処理条件を、条件1乃至条件r(rは2以上の整数である)とする。また、(j+3)番目の工程(加熱処理工程)で指定される処理条件を、条件1乃至条件s(sは1以上の整数である)とする。
【0128】
はじめに、工程リスト10_1に含まれるn個の工程から、一部の工程を抽出する。抽出される工程は、例えば、半導体素子の特性の寄与が大きいと推定される工程である。また、例えば、条件の変更が多い工程である。工程リスト10_1に含まれる工程の一部を抽出することで、機械学習における媒介変数の数を減らすことができる。別言すると、ニューラルネットワークを用いた教師あり学習における、入力層に含まれるニューロンの数を減らすことができる。これにより、隠れ層の層数および隠れ層のニューロンの数が最適化され、学習または推論の計算量または計算時間を減らすことができる。また、過学習を防ぐことができる場合がある。
【0129】
例えば、j番目の工程(成膜工程)で指定される処理条件が、工程リスト10_1乃至工程リスト10_mの間で変更されることが多い場合、j番目の工程(成膜工程)を、工程リスト10_1から抽出するとよい。また、例えば、(j+3)番目の工程(加熱処理工程)が、半導体素子の特性の寄与が大きいと推定される場合、(j+3)番目の工程(加熱処理工程)を、工程リスト10_1から抽出するとよい。
【0130】
または、工程リスト10_1に含まれるn個の工程から、上記とは異なる一部の工程を取り除いてもよい。取り除かれる工程は、例えば、半導体の特性の寄与が小さいと推定される工程である。また、例えば、処理条件が変更されていない工程である。上記とは異なる一部の工程を取り除くことで、機械学習における媒介変数の数を減らすことができる。別言すると、ニューラルネットワークを用いた教師あり学習における、入力層に含まれるニューロンの数を減らすことができる。これにより、隠れ層の層数および隠れ層のニューロンの数が最適化され、学習または推論の計算量または計算時間を減らすことができる。また、過学習を防ぐことができる場合がある。
【0131】
例えば、基板移載工程(1番目の工程、およびn番目の工程)は、半導体素子の特性に影響を与えないと推定される。よって、基板移載工程(1番目の工程、およびn番目の工程)を、工程リスト10_1から取り除くとよい。また、例えば、(j+1)番目の工程(加工工程)で指定される処理条件、および(j+2)番目の工程(成膜工程)で指定される処理条件のそれぞれが、工程リスト10_1乃至工程リスト10_mの間で同じである場合、(j+1)番目の工程(加工工程)、および(j+2)番目の工程(成膜工程)を、工程リスト10_1から取り除くとよい。
【0132】
以上より、工程リスト10_1から一部の工程が抽出される。または、工程リスト10_1から、上記とは異なる一部の工程が取り除かれる。
図6Bでは、j番目の工程、(j+3)番目の工程などが抽出された例が示されている。なお、
図6Bに示す例は、1番目の工程、(j+1)番目の工程、(j+2)番目の工程、n番目の工程などが取り除かれた場合でもある。
【0133】
次に、一部の工程が抽出された工程リスト10_1、または、当該一部の工程とは異なる一部の工程が取り除かれた工程リスト10_1に含まれる処理条件のデータを数値化する。
【0134】
上述したように、例えば、成膜工程の処理条件には、装置、材料、膜厚、温度、圧力、電力、流量などがある。膜厚、温度、圧力、電力、流量などは、値として設定されるため、これらの処理条件は、数値化されたデータである。よって、これらの処理条件は、特に変換することなく、入力データ52_1に含めることができる。
【0135】
各処理条件の設定値は、それぞれ単位が統一されていることが好ましい。単位を統一することで、学習用データセット50に含まれるデータ量を削減することができる。よって、データの送受信、学習、推論などに費やす時間を低減することができる。
【0136】
装置に関するデータは、定性的データとして工程リストに含まれる場合がある。装置に関する定性的データは、例えば、装置名(略称、呼称なども含む)、装置に用いられている手法などである。
【0137】
また、材料に関するデータは、定性的データとして工程リストに含まれる場合がある。材料に関する定性的データは、例えば、材料の名称(略称、呼称なども含む)、組成式などである。
【0138】
上述したように、教師あり学習に用いる学習用データセットに含まれるデータは、数値化されていることが好ましい。そこで、工程リストに含まれる定性的データを数値化することが好ましい。
【0139】
[装置に関する定性的データの数値化]
ここでは、装置に関する定性的データの数値化について説明する。なお、成膜工程の条件1に、装置に関する定性的データとして装置名が入力される例を用いて説明する。
【0140】
成膜装置には、化学気相成長(CVD:Chemical Vapor Deposition)法を用いて成膜することが可能な装置(CVD装置と呼ぶ場合がある)、スパッタリング法を用いて成膜することが可能な装置(スパッタリング装置と呼ぶ場合がある)、原子層堆積(ALD:Atomic Layer Deposition)法を用いて成膜することが可能な装置(ALD装置と呼ぶ場合がある)などがある。
【0141】
なお、CVD法は、プラズマを利用するプラズマCVD(PECVD:Plasma Enhanced CVD)法、熱を利用する熱CVD(TCVD:Thermal CVD)法、光を利用する光CVD(Photo CVD)法などに分類できる。よって、CVD法では、手法によってCVD装置が異なる場合がある。つまり、複数のCVD装置が用意されている場合がある。スパッタリング装置、ALD装置などについても同様である。
【0142】
処理条件として入力される装置に関するデータ(ここでは、装置名)は、定性的データである。そこで、装置に関する定性的データの数値化には、Label Encodingを用いることが好ましい。例えば、装置名をIDで管理するとよい。装置名にはそれぞれ、工程リストIDとは異なる、IDが割り振られるとよい。ここで、装置名に割り振られたIDを、装置IDと表記する。
【0143】
図7Aでは、装置名と装置IDとの対応表を例示している。例えば、装置名がCVD1である場合、装置IDを1とする。装置名がCVD2である場合、装置IDを2とする。装置名がSP1である場合、装置IDを3とする。装置名を装置IDに変換することで、装置名を数値データとして扱うことができる。
【0144】
上記対応表は、記憶部105に格納されるとよい。また、使用可能な装置が増えるたびに、新規の装置名と、当該新規の装置名に関連付けられた装置IDとを、入力部101、記憶媒体、通信などを介して上記対応表に追加するとよい。
【0145】
なお、Label Encodingを用いて装置に関する定性的データを数値化する方法について説明したが、装置に関する定性的データを数値化する方法はこれに限られない。装置に関する定性的データの数値化には、One-hot Encoding(1 of K Encodingともいう)を用いてもよい。
【0146】
例えば、成膜工程に用いられうる装置の数がt(tは1以上の整数である)個である場合、装置名を、t次元のOne-hotベクトルで表現するとよい。各工程のそれぞれに用いられうる装置の数が多くなければ、低次元のベクトルで表現することができる。よって、学習または推論の計算量または計算時間を減らすことができる。
【0147】
また、装置に関する定性的データを数値化する方法として、上記以外にも、例えば、Target Encodingなどを用いてもよい。
【0148】
以上が、装置に関する定性的データの数値化についての説明である。
【0149】
[材料に関する定性的データの数値化]
ここでは、材料に関する定性的データの数値化について説明する。なお、成膜工程の条件2に、材料に関する定性的データとして材料の名称(略称、呼称なども含む)が入力される例を用いて説明する。また、当該材料は、無機材料とする。
【0150】
半導体素子に用いられる材料の結晶構造、膜質などは、処理条件によって変化する。さらには、被形成膜として用いられる材料、被形成面のラフネスなどによっても変化する。そのため、データベースなどを用いて、定性的データである材料の名称から定量的データである材料の物性(結晶構造、密度、誘電率など)に変換する場合、半導体素子の特性の予測精度が低下する恐れがある。そこで、本実施の形態では、材料に関する定性的データ(ここでは、材料の名称)を構成元素および組成に変換する。
【0151】
はじめに、材料の名称を、組成式に変換する。例えば、成膜工程の条件2として「酸化シリコン」が入力されている場合、「SiO2」に変換するとよい。なお、材料の名称から組成式への変換は、概念辞書またはデータベースを用いてもよいし、予め作成した材料の名称と組成式との対応表を用いてもよい。
【0152】
次に、組成式を、構成元素および組成に変換する。例えば、材料が、元素M1、元素M2、元素M3、および元素M4で構成され、かつ、M1:M2:M3:M4=w:x:y:zの組成である場合、組成式を「M1、M2、M3、M4、w:x:y:z」または「M1、w、M2、x、M3、y、M4、z」に変換する。
【0153】
なお、組成は規格化されることが好ましい。例えば、w+x+y+z=1を満たすように、組成を規格化するとよい。これにより、構成元素の組み合わせが同一で、組成が異なる材料同士を区別することができる。
【0154】
なお、材料が1種類の元素で構成される場合、M2、M3、M4、x、y、zにはゼロと記述するとよい。同様に、材料が2種類の元素で構成される場合、M3、M4、y、zにはゼロと記述するとよい。また、材料が3種類の元素で構成される場合、M4、zにはゼロと記述するとよい。
【0155】
具体的には、組成式が「SiO2」である場合、「Si、O、0、0、0.333:0.667:0:0」または「Si、0.333、O、0.667、0、0、0、0」に変換する。
【0156】
上記では、構成元素が4種類以下である材料に適用できるように、元素の数と組成を記述しているが、これに限られない。例えば、構成元素が5種類以上である材料にも適用できるように、元素の数と組成を記述してもよい。または、例えば、半導体素子に用いられる材料の構成元素が3種類以下である場合、組成式を「M1、M2、M3、w:x:y」または「M1、w、M2、x、M3、y」に変換してもよい。これにより、機械学習における媒介変数の数を減らすことができる。これにより、隠れ層の層数および隠れ層のニューロンの数が最適化され、学習または推論の計算量または計算時間を減らすことができる。
【0157】
次に、元素を、元素の特性に変換する。元素の特性として、原子番号、族、周期、電子配置、原子量、原子半径、原子体積、電気陰性度、イオン化エネルギー、電子親和力、双極分極率、単体の融点、単体の沸点、単体の格子定数、単体の密度、単体の熱伝導率などがある。また、原子半径は、共有結合半径、ファンデルワールス半径、イオン半径、および金属結合半径から選ばれた一または複数とするとよい。
【0158】
特に、変換する元素の特性として、原子番号または電子配置と、電気陰性度とを選択することが好ましい。材料が単一の元素で構成される場合、材料の特徴は、原子番号および電気陰性度に現れやすい。また、材料が2以上の元素で構成される場合、電気陰性度は、異なる元素間での結合様式に現れやすい。例えば、電気陰性度が類似した元素間では、共有結合性または金属結合性が支配的となる。一方、電気陰性度が大きく異なる元素間では、イオン結合性が支配的となる。
【0159】
図7Bでは、元素と元素の特性との対応表を例示している。
図7Bでは、元素の特性として、原子番号、電子配置、電気陰性度、単体の融点(K)などが含まれる。なお、元素から元素の特性への変換は、データベースなどを用いてもよいし、予め作成した元素と元素の特性との対応表を用いてもよい。
【0160】
具体的には、元素の特性として、原子番号、および電気陰性度を選択する場合、「Si」は「14、1.90」に変換される。また、「O」は「8、3.44」に変換される。
【0161】
以上により、成膜工程の条件2として入力される「酸化シリコン」を、「14、1.90、8、3.44、0、0、0、0、0.333:0.667:0:0」または「14、1.90、0.333、8、3.44、0.667、0、0、0、0、0、0」に変換することができる。したがって、材料に関する定性的データを数値化することができる。
【0162】
以上より、半導体素子の特性を第一原理的に予測することができる。また、用いたことがない材料を半導体素子に用いる場合でも、精度を落とすことなく、半導体素子の特性を予測することができる。さらに、データベースなどに記載されていない材料が半導体素子に用いられる場合でも、精度を落とすことなく、半導体素子の特性を予測することができる。
【0163】
なお、材料の名称から構成元素および組成への変換は、組成式を介さず直接行ってもよい。
【0164】
以上が、材料に関する定性的データの数値化についての説明である。
【0165】
以上より、
図6Cに示すような、数値化されたデータで構成される入力データ52_1を作成することができる。具体的には、入力データ52_1は、
図6Cに示す処理条件のデータを含む。なお、入力データ52_1は、工程番号を含んでもよい。
【0166】
なお、工程リストの取捨選択(抽出、または除去)を行う工程と、定性的データを定量的データに変換する工程の順序は上記に限られない。例えば、定性的データを定量的データに変換した後、工程リストの取捨選択(抽出、または除去)を行うことで、工程リスト10_1から入力データ52_1を作成してもよい。
【0167】
以上により、数値化されたデータを含む学習用データ51_1を生成することができる。なお、学習用データ51_2乃至学習用データ51_mは、学習用データ51_1と同様の構成を有する。つまり、上記方法により、学習用データ51_2乃至学習用データ51_mを生成することができる。
【0168】
図4Aでは、入力データ52_1乃至入力データ52_mがそれぞれ、工程リスト10_1乃至工程リスト10_mから作成される場合を示しているが、これに限られない。例えば、
図4Bに示すように、入力データ52_1乃至入力データ52_mはそれぞれ、工程リスト10_1乃至工程リスト10_mと、半導体素子30_1乃至半導体素子30_mの形状に関する情報と、から作成されてもよい。
【0169】
また、入力データ52_1乃至入力データ52_mはそれぞれ、工程リスト10_1乃至工程リスト10_mと、半導体素子30_1乃至半導体素子30_mの第1の特性と、から作成され、教師データ53_1乃至教師データ53_mはそれぞれ、半導体素子30_1乃至半導体素子30_mの第2の特性から作成されてもよい。
【0170】
上記において、第1の特性と、第2の特性とは、異ならせる。例えば、第1の特性を、半導体素子の特性値とし、第2の特性を、半導体素子の信頼性試験の結果とするとよい。半導体素子の信頼性に影響する要因は多く、各要因は複雑に絡んでいるため、経験による予測が難しい。よって、半導体素子の信頼性は、推測する対象として好適である。また、半導体素子の特性値には、半導体素子の製造プロセスなどの情報が間接的に含まれる。よって、入力データに半導体素子の特性値を追加することで、教師あり学習に当該情報が与えられ、半導体素子の特性の予測の精度を向上させることができる。
【0171】
なお、学習用データセット50は、構造が同一または類似する半導体素子のデータのみで構成されてもよい。別言すると、学習用データセット50は、半導体素子の構造別に作成されてもよい。これにより、半導体素子の特性の予測の精度を向上させることができる。また、学習用データセット50は、構造に関わらず半導体素子のデータで構成されてもよい。これにより、汎用性の高い、半導体素子の特性の予測が可能となる。
【0172】
以上が、学習用データセットについての説明である。入力データと教師データとを用いて機械学習モデルを訓練することで、半導体素子の特性を予測することができる。
【0173】
<<半導体素子の特性の予測用データ>>
ここでは、半導体素子の特性の予測用データについて説明する。
【0174】
半導体素子の特性の予測用データは、
図1Aおよび
図1Bに示す処理部102に入力されるデータIN2から生成される。したがって、半導体素子の特性の予測用データは、データIN2に含まれるデータに対して抽出、加工、変換、選択、除去などを行うことで生成される。
【0175】
データIN2には、少なくとも半導体素子に関する情報が含まれる。なお、データIN2には、半導体素子の特性などが含まれる場合がある。
【0176】
なお、半導体素子の特性の予測用データは、上述した学習用データの入力データと同様の構成を有するとよい。例えば、入力データ52_1乃至入力データ52_mがそれぞれ、工程リスト10_1乃至工程リスト10_mから作成される場合、半導体素子の特性の予測用データは、工程リスト11から作成されるとよい。また、例えば、入力データ52_1乃至入力データ52_mがそれぞれ、工程リスト10_1乃至工程リスト10_mと、半導体素子30_1乃至半導体素子30_mの特性と、から作成される場合、半導体素子の特性の予測用データには、工程リスト11と、工程リスト11の工程リストIDと関連付けられている半導体素子の特性とから作成されるとよい。
【0177】
以上が、半導体素子の特性の予測用データについての説明である。
【0178】
本発明の一態様により、半導体素子に含まれる材料の物性などを用いずに、半導体素子の特性を予測することができる。また、過去の実験データを用いることで、半導体素子の構造の最適化を仮想スクリーニングによって高速化することができる。これは人がデータを閲覧し内挿的でなかったとしても、機械学習モデルの非線形もしくは高次な表現によって内挿的であるとみなすことができる場合がある。また、機械学習モデルが得た表現を断片的に切り出し、調べることで従来では気付かなかった法則性を知ることができる。
【0179】
<コンピュータ装置>
本項では、本発明の一態様である、半導体素子の特性予測システムを有するコンピュータ装置を、
図8を用いて説明する。
【0180】
図8は、半導体素子の特性予測システムを有するコンピュータ装置を説明する図である。コンピュータ装置1000は、演算装置1001、メモリ1002、入出力インターフェース1003、通信デバイス1004、およびストレージ1005を有する。コンピュータ装置1000は、入出力インターフェース1003を介して、表示装置1006a、およびキーボード1006bと電気的に接続される。
【0181】
コンピュータ装置1000は、ユーザが利用するパーソナルコンピュータなどの情報処理装置であってもよい。このとき、演算装置1001は、
図1Aおよび
図1Bに示す処理部102および演算部103を含む。また、ストレージ1005は、
図1Aおよび
図1Bに示す記憶部105および/または格納部106を含む。また、表示装置1006aは、
図1Aおよび
図1Bに示す出力部104に相当する。また、キーボード1006bは、
図1Aおよび
図1Bに示す入力部101に相当する。
【0182】
学習済みモデルは、メモリ1002に格納されてもよいし、ストレージ1005に格納されてもよい。
【0183】
また、コンピュータ装置1000は、ネットワーク(Network)を介して、データベース1011、リモートコンピュータ1012、およびリモートコンピュータ1013と接続されてもよい。コンピュータ装置1000は、通信デバイス1004を介して、ネットワークインターフェース1007と電気的に接続される。また、ネットワークインターフェース1007は、ネットワーク(Network)を介して、データベース1011、リモートコンピュータ1012、およびリモートコンピュータ1013と電気的に接続される。
【0184】
ここで、上記ネットワークには、ローカルエリアネットワーク(LAN)、およびインターネットが含まれる。また、上記ネットワークは、有線、および無線のいずれか一方、または両方による通信を用いることができる。また、上記ネットワークにおいて無線通信を用いる場合、Wi-Fi(登録商標)、Bluetooth(登録商標)などの近距離通信手段の他に、第3世代移動通信システム(3G)に準拠した通信手段、LTE(3.9Gと呼ぶ場合もある)に準拠した通信手段、第4世代移動通信システム(4G)に準拠した通信手段、または第5世代移動通信システム(5G)に準拠した通信手段などの様々な通信手段を用いることができる。
【0185】
上述したように、半導体素子の特性予測システムの処理部をサーバに設け、クライアントPCからネットワーク経由でアクセスして利用する構成としてもよい。例えば、コンピュータ装置1000を当該クライアントPCとみなし、リモートコンピュータ1012および/またはリモートコンピュータ1013を当該サーバとみなすとよい。
【0186】
このとき、リモートコンピュータ1012および/またはリモートコンピュータ1013に、
図1Aおよび
図1Bに示す処理部102および演算部103が設けられる。つまり、リモートコンピュータ1012および/またはリモートコンピュータ1013が有する演算装置は、処理部102および演算部103を含む。また、データベース1011は、
図1Aおよび
図1Bに示す記憶部105および/または格納部106を含む。
【0187】
以上より、本発明の一態様は、半導体素子の特性予測システムを提供することができる。また、本発明の一態様は、半導体素子の特性を予測する方法を提供することができる。また、本発明の一態様は、半導体素子の特性を予測するための学習用データセットを提供することができる。
【0188】
本実施の形態は、その一部を適宜組み合わせて実施することができる。
【符号の説明】
【0189】
IN1:データ、IN2:データ、10:複数の工程リスト、10_m:工程リスト、10_1:工程リスト、11:工程リスト、20:複数の特性、20_m:特性、20_1:特性、30:複数の半導体素子、30_i:半導体素子、30_m:半導体素子、30_1:半導体素子、50:学習用データセット、51_i:学習用データ、51_m:学習用データ、51_1:学習用データ、51_2:学習用データ、52_i:入力データ、52_m:入力データ、52_1:入力データ、53_i:教師データ、53_m:教師データ、53_1:教師データ、100:特性予測システム、101:入力部、102:処理部、103:演算部、104:出力部、105:記憶部、106:格納部、1000:コンピュータ装置、1001:演算装置、1002:メモリ、1003:入出力インターフェース、1004:通信デバイス、1005:ストレージ、1006a:表示装置、1006b:キーボード、1007:ネットワークインターフェース、1011:データベース、1012:リモートコンピュータ、1013:リモートコンピュータ