(58)【調査した分野】(Int.Cl.,DB名)
上記第1および第2の測定プロトコルは,チャネル数,照明角度,ターゲットおよび同じターゲットから取得される信号のいずれかが異なるものである,請求項1に記載の方法。
上記第1および第2の測定プロトコルが,チャネル数,照明角度,ターゲットおよび同一ターゲットから取得される信号のいずれかにおいて異なっている,請求項9に記載のシステム。
上記予測値に基づいて半導体製造ツールに入力を提供して,上記製造半導体ウェーハの製造中に上記半導体製造ツールの動作を制御するように構成される処理制御ユニットをさらに備えている,請求項15に記載のシステム。
【発明の概要】
【0004】
この発明は,その実施形態において,教師あり学習に基づく機械学習(ML)方法を提示する。詳細には,各測定サンプルi(たとえば一連の半導体ウェーハ上の各ダイについてのもの)の光信号Siのデータセットと,パラメータPiの参照値が与えられた場合,MLは,まだ測定されていない信号S <new>のP <predicted>を予測するためのモデルを確立する。モデル複雑性はさまざまであり,モデルの選択は,モデルのトレーニングに使用されるデータセットのタイプおよびサイズ,SからPへの固有感度,およびPに関連する参照計測におけるノイズのタイプおよび振幅によって異なるものとなる。
【0005】
この発明の第1の観点において半導体計測方法が提供され,この方法は,スペクトル取得ツールを使用しかつ第1の測定プロトコルにしたがって,第1セットの半導体ウェーハ・ターゲット上のスペクトルのベースライン・セット(a baseline set of spectra on a first set of semiconductor wafer targets)を収集し,光学計測ツールを使用しかつ第2の測定プロトコルにしたがって,スペクトル変動性の一または複数の所定ソースのそれぞれについて(for each of one or more predetermined sources of spectra variability),上記第1セットの半導体ウェーハ・ターゲットの所定パラメータの値を収集し,上記スペクトル取得ツールおよび上記第1の測定プロトコルにしたがって,上記第1セットの半導体ウェーハ・ターゲットに対応する第2セットの半導体ウェーハ・ターゲット上のスペクトルの変動セット(a variability set of spectra)を収集し,ここで上記スペクトルの変動セットは上記スペクトル変動性を具体化するものであり(the variability set of spectra embodies the spectra variability),上記収集されたスペクトルのセットおよびパラメータ値を使用して,機械学習を用いて予測モデルをトレーニングしかつ上記予測モデルに関連する損失関数を最小化し,ここで上記予測モデルは第3セットの半導体ウェーハ・ターゲットの製造スペクトル(production spectra)を使用して上記所定パラメータのいずれかの値を予測するために使用されるように構成され,上記製造スペクトルは上記スペクトル取得ツールを使用しかつ上記第1の測定プロトコルにしたがって収集され,上記損失関数は,上記スペクトル変動性の一または複数の所定ソースのそれぞれについて,上記スペクトル変動性を表す項を組み込む(incorporating, for each of the one or more predetermined sources of spectral variability, a term representing the spectral variability)ことによって最小化される。
【0006】
この発明の他の観点では,上記スペクトル変動性の所定ソースはツール変動性(tool variability)を含む。
【0007】
この発明の他の観点では,上記変動スペクトルの収集は,上記スペクトル取得ツールと同一のものを複数使用して,上記半導体ウェーハ・ターゲットの選択された一つから変動スペクトルを収集することを含む。
【0008】
この発明の他の観点では,上記スペクトル変動性の所定ソースは測定反復性(measurement repeatability)を含む。
【0009】
この発明の他の観点では,上記変動スペクトルの収集は,複数の異なる時点において上記スペクトル取得ツールを用いて上記半導体ウェーハ・ターゲットの選択された一つから上記変動スペクトルを収集することを含む。
【0010】
この発明の他の観点では,上記第1および第2の測定プロトコルは,チャネル数,照明角度,ターゲット,および同一ターゲットから取得される信号のいずれかが異なる。
【0011】
この発明の他の観点では,上記方法は,製造半導体ウェーハ(a production semiconductor wafer)の製造中に製造散乱測定スペクトル(production scatterometric spectra)を収集し,予測モデルを用いて上記製造散乱測定スペクトルに基づいて上記所定パラメータのいずれかの予測値を生成することをさらに含む。
【0012】
この発明の他の観点は,上記製造半導体ウェーハの製造中に半導体製造ツールの動作を制御するために半導体製造ツールに入力を提供することをさらに含む。
【0013】
この発明の他の観点では半導体計測システムが提供され,上記半導体計測システムは,第1の測定プロトコルにしたがって第1セットの半導体ウェーハ・ターゲット上の散乱スペクトルのベースライン・セットを収集し,スペクトル変動性の一または複数の所定ソースのそれぞれについて,上記第1の測定プロトコルにしたがって,上記第1セットの半導体ウェーハ・ターゲットに対応する第2セットの半導体ウェーハ・ターゲット上の,上記スペクトル変動性を具体化する散乱測定スペクトルの変動セットを収集するように構成されるスペクトル取得ツールと,第2の測定プロトコルにしたがって上記第1セットの半導体ウェーハ・ターゲットの所定パラメータの値を収集するように構成される光学計測ツールと,収集されたスペクトルのセットおよびパラメータ値を使用して,機械学習を用いて予測モデルをトレーニングし,かつ上記予測モデルと関連する損失関数を最小化するように構成されるトレーニング・ツールと,を備え,上記予測モデルが第3セットの半導体ウェーハ・ターゲットの製造スペクトルを用いて上記所定パラメータのいずれかの値を予測するために使用されるように構成され,上記製造スペクトルが上記スペクトル取得ツールを使用して上記第1の測定プロトコルにしたがって収集され,上記損失関数がスペクトル変動性の一または複数の所定ソースのそれぞれについて,上記スペクトル変動性を表す項を組み込むことによって最小化される。
【0014】
この発明の他の実施態様では,スペクトル変動性の上記所定ソースはツール変動性を含む。
【0015】
この発明の他の実施態様では,上記スペクトル取得ツールが,上記スペクトル取得ツールと同一のものを複数使用して上記半導体ウェーハ・ターゲットの選択された一つから上記変動スペクトルを収集するように構成されている。
【0016】
この発明の他の実施態様では,上記スペクトル変動性の所定ソースが測定再現性を含む。
【0017】
この発明の他の実施態様では,上記スペクトル取得ツールが,複数の異なる時点において上記スペクトル取得ツールを用いて上記半導体ウェーハ・ターゲットの選択された一つから上記変動スペクトルを収集するように構成されている。
【0018】
この発明の他の実施態様では,上記第1および第2の測定プロトコルが,チャネル数,照明角度,ターゲットおよび同一ターゲットから取得される信号のいずれかにおいて異なっている。
【0019】
この発明の他の実施態様では,上記スペクトル取得ツールが製造半導体ウェーハの製造中に製造散乱計測スペクトルを収集するように構成されており,上記予測モデルを使用して,上記製造散乱計測スペクトルに基づいて上記所定パラメータのいずれかの予測値を生成するように構成される予測ユニットをさらに備えている。
【0020】
この発明の他の実施態様では,上記システムがさらに,上記予測値に基づいて半導体製造ツールに入力を提供して,上記製造半導体ウェーハの製造中に上記半導体製造ツールの動作を制御するように構成される処理制御ユニットを備えている。
【0021】
この発明の態様は,以下の添付図面を参照する詳細な説明からより完全に理解および評価されるであろう。
【発明を実施するための形態】
【0023】
図1Aおよび
図1Bを参照して,これらはいずれも,この発明の一実施態様によって構築されかつ動作する,半導体計測システムの簡略化された概念図である。
図1Aにおいて,スペクトル取得ツール100は,従来技術にしたがって一または複数の参照(基準)半導体ウェーハ106上の複数のターゲット(たとえば構造(structures),ダイ(dies))104の散乱測定スペクトル(scatterometric spectra)102を収集するために使用される。スペクトル取得ツール100は,所与のエッチング・ステップの完了直後など,参照半導体ウェーハ106の製造中の選択された処理ステップの近くで(proximate)第1の所定測定プロトコル(a first predetermined measurement protocol)にしたがって,ここではベースライン・スペクトル102と呼ぶ散乱測定スペクトル102を収集する。スペクトル取得ツール100は半導体ウェーハ・ターゲットの散乱測定スペクトルを収集することができる既知の任意のタイプのツールとすることができ,スペクトル・エリプソメータ(Spectral Ellipsometer)(SE),スペクトル反射率計(Spectral Reflectometer)(SR),偏光スペクトル反射率計(Polarized Spectral Reflectometer),または他の任意の光学臨界寸法(Optical Critical Dimension)(OCD)計測ツールなどである。スペクトル取得ツール100によって用いられる上記第1の所定測定プロトコルは,好ましくは2つ以上の情報チャネルからの散乱測定計測値を取り入れる。
【0024】
参照(基準)計測ツール108,たとえば臨界寸法走査型電子顕微鏡(Critical Dimension Scanning Electron Microscope)(CD―SEM),原子間力顕微鏡(Atomic Force Microscope)(AFM),断面トンネリング電子顕微鏡(cross-section Tunneling Electron Microscope)(TEM),電気計測ツール(electric metrology tool),臨界寸法原子間力顕微鏡(Critical Dimension Atomic Force Microscope)(CD―AFM),X−RAY計測ツール(X-RAY metrology tool),または光学計測ツール(optical metrology tool)などが使用されて,従来技術にしたがって,スペクトル取得ツール100がベースライン・スペクトル102を収集した参照半導体ウェーハ106の製造中の同一の選択された処理ステップの近くで第2の所定測定プロトコルにしたがって(in accordance with a second predetermined measurement protocol proximate to the same selected processing step during fabrication of reference semiconductor wafers 106 at which spectrum acquisition tool 100 collected baseline spectra 102),参照半導体ウェーハ106上のターゲット104の所定パラメータの測定値110が収集される。所定パラメータは半導体ウェーハの任意のタイプの既知のパラメータとすることができ,半導体ウェーハ構造の物理的および化学的特性,材料特性,電気的特性,および幾何学的特性に関連するものなどである。
【0025】
スペクトル取得ツール100によって使用される第1の測定プロトコルおよび参照計測ツール108によって使用される第2の測定プロトコルは,好ましくは,以下の観点のうちの1つまたは複数において互いに異なるものである。
【0026】
・情報チャネルの相違。たとえば,一方のプロトコルが様々な照明角度による複数の照明チャネルからの複数の信号を使用するのに対し,他方のプロトコルが所与のサンプルを通常に照明している間に取得された信号のみを使用する場合などである。
【0027】
・同一サンプル中の位置の相違。たとえば,一方のプロトコルが所与のサンプルの領域A内のスポットターゲット位置(spot target positions)から取得した信号を使用するのに対し,他方のプロトコルが同一サンプルのエリアB内のスポットターゲット位置から取得した信号を使用する場合などである。
【0028】
・信号の組み合わせの相違。たとえば,一方のプロトコルが複数のスポットターゲット位置から同一照明チャネルを介して取得された複数のオーバーラップ信号を使用するのに対し,他方のプロトコルが単一のスポットターゲット位置から取得された単一の信号を使用する場合などである。
【0029】
ベースライン・スペクトル102に加えて,スペクトル取得ツール100は,第1の所定測定プロトコルにしたがって,スペクトル取得ツール100がベースライン・スペクトル102を収集した参照半導体ウェーハ106の製造中の同じ選択された処理ステップの近くで,一または複数の参照半導体ウェーハ106 '(参照半導体ウェーハ106であってもまたは異なる半導体ウェーハであってもよい)上において,ここでは変動スペクトル(variability spectra)112と呼ぶ一または複数セットの散乱測定スペクトル112を収集する。スペクトル取得ツール100はスペクトル変動性の所定ソース(スペクトル変動の所定の原因)(a predetermined source of spectra variability)に関連する変動スペクトル112の各セットを収集し,これによってスペクトル変動112のセットがスペクトル変動を具体化(具現化)する(the set of spectra variability 112 embodies the spectra variability)。たとえばスペクトル変動性の所定ソースがツール変動性(tool variability)に関連する場合,スペクトル取得ツール100は,同じ測定プロトコルを使用する複数の同一ツール(すなわち同じメーカーの同じモデル)を用いて,所定サンプルを測定することによって(たとえば,特定ウェーハ上の特定ダイ内の構造のスペクトルを収集する)変動スペクトル112のセットを収集する。同様に,スペクトル変動性の所定ソースが測定再現性(measurement repeatability)に関連する場合,スペクトル取得ツール100は,異なる時点で所定サンプルを測定することによって(たとえば特定ウェーハ上の特定ダイ内の構造のスペクトルを収集する),変動スペクトル112のセットを収集する。スペクトル取得ツール100は任意の数のスペクトル変動性の所定ソースに関連して任意の数の変動スペクトルのセット112を収集する。
【0030】
トレーニング・ユニット114は,機械学習(machine learning)(ML)を実行することによって予測モデル116をトレーニングすることで,上記モデルに関連する損失関数を最小化しながら(while minimizing a loss function associated with the model),スペクトル取得ツール100によって収集された散乱測定スペクトルすなわちベースライン・スペクトル102および様々なセットの変動スペクトル112と,参照半導体ウェーハ106上のターゲット104の所定パラメータの測定値110との間の対応を識別するように構成される。予測モデル116は第1の測定プロトコルにしたがってスペクトル取得ツールを使用することでスペクトルが収集される大量生産(high-volume manufacturing)(HVM)処理中に半導体ウェーハ・ターゲットの散乱測定スペクトルを使用するなどして,所定パラメータのいずれかの値を予測するために使用されるように構成される。例示的な損失関数は次のように表される。
【0032】
・Loss accuracy はベースライン・スペクトル102および測定値110を考慮した損失項である。
【0033】
・Xは上記スペクトル取得ツールによって収集されるスペクトルである。
【0034】
・yは参照計測ツールを使用した計測の結果である所定パラメータの値である。
【0035】
・y^(X)(y^はアルファベットyの上方に^が位置する記号,以下同様)は,スペクトルXを使用してyの予測(prediction)を提供する予測モデルである。
【0036】
・全合計は,固有の物理サンプル(たとえばウェーハ上の様々なダイ)の合計を指す。
【0037】
・Variance(y^)across somethingは,サンプル上で実行される一連の測定全体でサンプルごと(たとえばウェーハ上の特定ダイ)について算出された予測y^(X)の分散(variance)を指し,特定の変動原因(a specific source of variability)を反映する。たとえば,Variance (y^)across repetitionsは,変動原因が測定再現性である場合について,同じダイ上で実行された10回の繰り返し測定にわたる予測y^(X)の分散を表す。
【0038】
上記の損失関数の例において,Loss accuracyの2乗を任意の正の累乗に置き換えることができ,および/または|y−y^(X)|
2 に代えて任意の単調増加関数を使用することができる。Loss variability のタイプに関しては,特定変動を表す任意のメトリックを使用することができ,必ずしも分散でなくとも,変動性を説明するより高い任意の統計モーメント(any higher statistical moment which describes the variability)などであってもよい。すなわち,たとえばyの分散(これは<(y^−<y^>)
2>に等しい)を使用する代わりに,<(y^−<y^>)
p>(ここで任意のp>0)を使用することができ,またはy^と<y^>の差の単調増加関数の他の任意のモーメントを使用することができる。
【0039】
上記パラメータΛは,予測モデル116のハイパーパラメータ(hyperparameters)を表し,変動項全体の変動を抑制することの相対的な重要性と精度項の重要性(the relative importance of suppressing the variability across the variability terms versus the importance of the accuracy term)を決定する。これらは,好ましくは,精度,再現性,ツール・マッチング,およびユーザにとって重要なその他の機能の観点における,
図1Aおよび
図1Bのシステムのユーザの仕様のような所定仕様を反映するユーザ定義レシピ・ランキング(user-defined recipe ranking)を最適化する検証および相互検証の方法によってMLモデル・トレーニング中に修正される。
【0040】
予測モデル116は,好ましくは半導体ウェーハ上の半導体デバイスの製造を制御するように構成された処理制御装置とともに使用するために提供され,
図1Bを参照して以下に説明する。
【0041】
図1Bにおいて,スペクトル取得ツール100または他の類似または同一のスペクトル取得ツールであるスペクトル取得ツール100'が,半導体ウェーハ上の半導体デバイスを製造する大量生産(HVM)処理中などの製造処理中に使用され,製造半導体ウェーハ(半導体ウェーハ製品)(a production semiconductor wafer)106'の散乱測定スペクトルが収集される。スペクトル取得ツール100’は,第1の所定測定プロトコルにしたがって,スペクトル取得ツール100がベースライン・スペクトル102を収集した参照半導体ウェーハ106の製造中の同一の選択された処理ステップ近くで(proximate to the same selected processing step during fabrication of reference semiconductor wafers 196 at which spectrum acquisition tool 100 collected baseline spectra)散乱測定スペクトルを収集する。予測ユニット118は,製造半導体ウェーハ106'から収集されたスペクトルに予測モデル116を適用し,その処理ステップで製造半導体ウェーハ106'の任意のターゲットの
図1を参照して上述した任意の所定パラメータに関連する予測値を生成する。処理制御ユニット120は,半導体ウェーハ上に半導体デバイスを製造する処理を制御するための任意の既知の処理制御ハードウェアおよび/またはソフトウェアとすることができ,製造半導体ウェーハ106'の製造中にツールの動作を制御する任意の既知の半導体製造(製作)ツール122(たとえばリソグラフィツール,エッチングツール,堆積ツールなど)に入力を提供することによって,従来の技術にしたがって,製造半導体ウェーハ106'またはその後の製造半導体ウェーハの製造を制御するように構成され,上記入力が上記予測値を使用する所定プロトコルにしたがって決定される。
【0042】
このように
図1Aおよび
図1Bのシステムは,同じ物理的ダイおよびウェーハの測定値であって,複数のツールからの(マッチングの最適化のため),および/または複数の時点での(再現性の最適化のため)測定値を表す予測モデル116のMLトレーニング中に追加データを追加することによって,ツールの安定性およびツールの再現性などのメトリックを改善するために使用される。これらのデータはパラメータの参照値を必要としないので比較的安価に(inexpensive)取得することができる。これらのデータが取得されると,予測モデル116は参照値を予測するために使用することができ,同時に仕様内のマッチングおよび再現性を有することができるように最適化される。これは,α・Lrepeatability +β
T2Tなどの追加のメトリックを反映する損失項(loss terms)によって,これらの項のハイパーパラメータの事前係数αおよびβを使用して精度と生産性のバランスを取る参照(Loss = Loss reference)との一致を最小限にすることを通常の目的とする予測モデル116の標準損失関数を補足することによって達成される。以下の表1は,精度が合理的に損なわれないものとしつつ,異なる「レイヤ」(すなわち異なるタイプの半導体製造ステップにおける異なる物理的パラメータの異なる測定シナリオ)にわたる再現性の改善を示すこの発明の実験結果を示している。
【0044】
再現性,T2T,ウェーハの滑らかさなどの自己整合性メリット(self-consistency merit)は,すべて,モデルが正則化されるほど強く改善されることを理解されたい。この効果は,精度とこれらの他のパフォーマンス・メトリックのバランスをとる正則化スキームの最適ポイントを見つけるために使用することができる。追加のメトリックの改善を決定するハイパーパラメータは,同じ精度を維持しつつ,任意の適切な手法を用いることを自動的に選択することができる。
【0045】
図2を参照して,
図2はこの発明の一実施例にしたがって動作する,
図1Aおよび
図1Bのシステムの例示的な動作方法の簡略化されたフローチャートである。
図2の方法において,複数の参照(基準)半導体ウェーハ・ターゲットのベースライン・スペクトルが,第1の所定の測定プロトコルにしたがって収集される(ステップ200)。上記参照半導体ウェーハ・ターゲットの所定パラメータの測定値が第2の所定の測定プロトコルにしたがって収集される(ステップ202)。一または複数の変動スペクトルのセットが第1の所定の測定プロトコルにしたがって複数の参照半導体ウェーハ・ターゲット上で収集され,上記変動セットが上記スペクトル変動性を具体的に表す(具体化する)(ステップ204)。予測モデルが機械学習(ML)を実行することによってトレーニングされ,上記モデルに関連付けられた損失関数を最小限にしつつ,上記収集されたスペクトルと上記所定パラメータの測定値との間の対応を識別する(ステップ206)。製造半導体ウェーハ・ターゲットの製造散乱測定スペクトルが上記第1の所定の測定プロトコルにしたがって収集される(ステップ208)。上記予測モデルが上記製造スペクトルに適用され,上記製造半導体ウェーハ・ターゲットの任意の所定パラメータに関連する予測値が生成される(ステップ210)。製造半導体ウェーハまたはその後の製造半導体ウェーハの製造が入力を半導体製造ツールに提供することによって制御され,上記入力は上記予測値を使用する所定プロトコルにしたがって決定される(ステップ212)。
【0046】
サンプリング強化(Sampling Enhancement)
この発明の一実施形態では,信号Sをウェーハあたり10〜15個のダイといった比較的少数の半導体ウェーハ・ダイ上で測定される信号セットに設定し,予測モデル116をトレーニングして完全なウェーハ・マップといったより多くのダイのパラメータPを予測することによって,サンプリング強化が達成される。処理制御ユニット122によって使用されるパラメータは,たとえば,ウェーハ平均(the wafer mean)またはウェーハ・マップの半径方向の記述における多項式パラメータ(the polynomial parameters in a radial description of the wafer map)などのウェーハ・モデル・パラメータとすることができる。以下の表2は,この発明の実験結果を表すもので,BEOLアプリケーションにおけるCMP厚さパラメータのウェーハ平均の精度(the accuracy of the wafer mean of a CMP thickness parameter in a BEOL application)を示している。上記測定についての正解(ground truth)は,イスラエルのレホヴォトのノバ メジャリング インスツルメント リミテッドから市販されているNOVA600(登録商標)Advanced Optical CD MetrologyツールのRCWAインタープリテーションとし,65個のダイの完全なウェーハ・マップを測定したものとした。表に示すように,13個のダイのスペクトルをMLと一緒に使用して65個のダイの完全なウェーハ・マップの平均を予測したところ,〜2.0A−2.6Aの適度なエラーとなり,これは,上記スペクトルを収集するために用いたものと同一ダイ上において算出されたウェーハ平均において得られた誤差として選択されるベンチマーク・エラーと非常に近いものであった。
【0048】
現在のレイヤと前のレイヤで実行された測定に基づいてサンプリング戦略をバイアスすることによって,より良好なサンプリングおよびサンプリングの精度向上も達成することができ,これにより前のレイヤの測定が使用される場合に,異なるレイヤでのスパース・サンプリング(sparse sampling)が現在のレイヤの完全なウェーハ・マップ予測を改善するために最適化される。このような方法は,上述したようにパラメータを予測するために,またはオートエンコーダの変形および他の深層学習アップサンプリング方法を使用して,測定されていないダイの生スペクトル自体(raw spectra itself)を予測するために使用することができる。この発明のこの実施形態によれば,全ウェーハ情報はウェーハ上のダイの小さなセットを測定することによって提供される。
【0049】
測定されるチャネル数を減らすことによるスループットの最適化
この発明の一実施態様では,計測スループット(metrology throughput)(TPT)は,多くの測定チャネルを含む計測レシピから開始し,通常の物理モデリングを使用して参照値を取得し,TPTが優れている少数のチャネル(たとえば2つの通常チャネルのみ)であって,そのうちの一つが精度とスループットのバランスが取れたソリューションを「転送」できるものを検索することによって最適化することができる。この効果が
図3Aおよび
図3Bに示されており,
図3Aおよび
図3Bは7つのレイヤ(層)にわたる22個の制御要素およびレイヤごとの複数のパラメータの調査を示す,この発明の実験結果を表している。
図3Aおよび
図3Bにおいて,参照値はCDSEMやTEMといった,物理モデリングまたは外部参照ツールのいずれかで提供されたものである。
図3Aおよび
図3Bに示すように,精度(
図3A)および再現性(
図3B)に重大なペナルティをもたらすことなく,多くのチャネルを単一のチャネルに転送(transfer)することができる。これによりTPTを3倍から4倍に増やすことができる。
【0050】
この発明のこの実施形態によれば,トレーニング・ユニット114が,ユーザ定義されたまたは他の方法で所定所望のスループットを有するように制約された最適チャネルを自動的に選択する。
【0051】
限られた量の参照データを処理する方法(Methods of handling a limited amount of reference data)
直接処理制御
この発明の一実施態様では,半導体製造において使用されるアドバンスト・プロセス・コントロール(Advanced Process Control)(APC)システムにおいて使用されるようなツール・ノブ制御ソリューション(tool knob control solutions)が,2つのレベルの変動ソース,すなわち処理ウェーハ内(バッチ)およびウェーハ間変動(バッチ間)に提供される。処理ツール(たとえばCMP時間またはエッチング温度を制御するノブ上のDOE)のレシピ・パラメータの範囲において測定される信号Sのセットを最初に取得することによって処理パラメータを直接制御するためにMLを使用することができる。次に予測モデル116は,ツール・ノブへのOCD信号を学習および較正するようにトレーニングされる。次に,予測モデル116を使用してツール・ノブへのフィードバックとして使用できる有効なノブ設定を予測することができる。
【0052】
2つの異なるDOEレベルを有する2つのグループの信号が与えられると,DOEレベルを基準として,トレーニング・ユニット114は,MLを使用してノブの変化に対するスペクトル応答,すなわちノブに対するスペクトル感度を抽出する。トレーニング・ユニット114はグループ間のスペクトル差を追跡し,グループのノミナル(公称値,nominal)は,好ましくは,ノブ効果が支配的なものになるように可能な限り近いものである。次に,学習した関係にしたがって将来の処理が調整され,パラメータの所望の目標結果を達成したり,処理およびツールのドリフトを調整して潜在的な障害を防止したりすることができる。この効果が
図4Aおよび
図4Bに示されており,これらは研磨時間(
図4A)および意図された残りの厚さ(
図4B)においてDOEがIMスペクトルを使用する予測モデル116によってどのように学習されたかを示すこの発明の実験結果を表している。
図4Aおよび
図4Bは,上記DOEのウェーハ・レベルの均一性にかかわらず,「有効ノブ」がWIW変動をキャプチャする(すなわち,上記モデルが各ウェーハの有効ノブ設定の範囲を予測する)ことを示している。この効果的なノブ技術が有用であることを確認するために,イスラエル国,レホヴォトのノバ メジャリング インスツルメント リミテッドからから市販されているNOVA T600(登録商標)MMSR Advanced Optical CD Metrologyツールを使用した物理アルゴリズムによって測定されたターゲットの残りの厚さの外部正解(external ground truth)に対して提示されている。このようなモデルは,WIWノブを備えた処理ツールへのフィードバックに使用することができる。
図4Aに示すように,予測された有効研磨時間(「有効ノブ」)は、正解の研磨層厚と高い相関関係があり,他方で
図2Bは基準(参照)に対する予測研磨厚効果を示している。
【0053】
データ拡張(Data augmentation)
シンプルなMLアルゴリズムには,説明しようとしている基礎となる物理学に関する事前知識が含まれていない。これは,それらの成功がデータの可用性(availability),より具体的には参照データの可用性に基づいていることを意味する。この発明の一実施形態では,予測モデル116をトレーニングするために使用されるトレーニング・データ・セットのサイズは,データの非常に複雑な確率分布を記述する能力を有するML方法のクラスである生成モデルによって(by means of generative models, which are a class of ML methods that have the ability of describing a highly complex probability distribution of data)増加する。単純な物理的アナロジーは統計物理学におけるボルツマン重み(Boltzmann weight)またはユークリッド量子論の経路積分形式(path integral formalism for Euclidean quantum theories)である。いずれの場合も,システムの自由度の振る舞い(たとえば統計物理学におけるスピンや量子電気力学における電子)を表す確率関数が定義される。これらの確率関数は明示的な形式を有しており,包含される物理学の実現を生成するために(to generate realizations of the physics involved)使用することができる。事実として,物理学の多くの分野では,このような形式は,物質の物理的特性を計算するための大規模なマルコフ連鎖モンテカルロ・シミュレーション(large scale Markov chain Monte-Carlo simulations)において使用される。データ・サイエンスの生成モデルは明示的または暗黙的であることがあり,明示的モデルでは確率関数が明示的に記述され(ボルツマン重みと同じ),暗黙的モデルではアルゴリズムが経験的データセットの統計を「学習」し,その後に同じ統計を用いて新しいデータ例を生成することができる。暗黙的方法の例には,変分オートエンコーダ(Variational Auto Encoders)や生成的敵対的ネットワーク(Generative Adversarial Networks)が含まれる。この発明の一実施態様では,これらの方法は,参照データセットを増加および多様化のために使用され,それによってトレーニング・ユニット114の性能が最適化され,基礎となる物理学を予測モデル116に反映する機械学習モデルの様々な特徴間の事前情報および制約の導入が可能になる。
【0054】
処理堅牢性の解決(Solving process robustness)
処理堅牢性を解決するために,この発明の一実施態様では,MLアルゴリズムとビッグデータ・システムの組み合わせが採用され,これは以下のようにレシピを作成し,これを監視かつ制御する。
【0055】
・レシピ・トレーニング:
MLを使用して可能な限り自動的に,数百のスペクトル・タイプ(「測定レシピ」)にわたることがあるビッグ・データ・データベース内において,数か月,場合によっては数年にわたってユーザがトレーニング・データをクエリできるようにする。
【0056】
・レシピの検証:
相互検証とブラインド・テスト方法論を使用して,レシピの品質に関するカスタマー・フィードバックを生成する。
【0057】
・レシピ監視:
トレーニング・データを用いて,監視防御インデックス(monitor defense indices)を,これらのインデックスの仕様とともに生成する。次に,これらのインデックスをインラインで監視し,たとえばSEMI標準SPCルール(SEMI standard SPC rules)を採用等することでレシピの精度が低下した場合にフラグを立てる。
【0058】
・レシピ更新:
監視(モニタ)が修復のために計測レシピにフラグを立てると,自動再トレーニング・シーケンスが開始され,新しいレシピがその検証結果とともに自動的に提案される。
【0059】
図5Aに示すこの実施態様は,外側円が参照ツールを表しており,これはNOVA T600(登録商標)-MMSRのようなハイエンドの,チャネルが豊富な光学計測ツール,またはXPS,SEMまたはTEMなどの非光学参照(non-optical reference)とすることができる。通常,これらのツールのCOOは高く,TPTは低く,破壊性,ツール・マッチング,再現性などの重要な生産性の課題も反映する。精度的には,これらのツールは情報量が多いという特徴がある(たとえば高解像度のイメージング・ツールやマルチチャネルの光学ツール)。内側円は,イスラエル,レホヴォトのノバ メジャリング インスツルメント リミテッドからから市販されているNOVA i550(登録商標)法線入射チャネル統合計測(normal incidence channel integrated metrology)(IM)ツールのような,高速かつコンパクトなOCDツールを表しており,これは,スループットが高く,必要なサンプリングレート(ダイの数)ですべてのウェーハをインラインで測定する機能があり,入力がSinner-circleで,Preferenceについての予測を出力するインラインで実行されるMLアルゴリズムを備えるものである。
【0060】
システム・アーキテクチャ(System architecture)
図5Bは,この明細書に記載のこの発明の一または複数の実施形態を実装するためのアーキテクチャを示しており,コンピュータ・クラスタが,ウェブサーバレイヤ(たとえばNodeJS(商標))およびビッグデータレイヤ(たとえば,メリーランド州,フォレストヒルのアパッチ・ソフトウエア・ファウンデーション(Apache Software Foundation)から市販されているHadoop(商標)クラスタ)を含む。ビッグデータレイヤは,スケーラブルかつ分散された方法においてデータを保存および処理するために用いられる。ウェブサーバレイヤは,ユーザが制御システムにおける処理ジョブを規定し,制御システムのレポートおよび実行ステータスを表示できるようにする。両レイヤはスケーラビリティ,高可用性および負荷分散を実現するためにマイクロサービス・アプローチ(micro-services approach)を使用して設計される。メッセージ・キューが用いられてサービス間の通信が行われ,密結合(tight coupling)が減らされる。ビッグデータレイヤのパフォーマンスを向上させるために,さまざまなデータ前処理パイプラインが採用される。
【0061】
データサイズおよび長期処理の堅牢性(Data size and long-term process robustness)
ビッグデータ・システムを使用すると,予測モデル116のトレーニングに利用可能なトレーニング・データの量を増やすことができ,予測モデル116をリアルタイムで改善および更新でき,これによりデータ管理のオーバーヘッドによる精度制限がなくなり,長期的な処理の堅牢性が確保される。
図6Aおよび
図6Bは,FEOLレイヤに適用された予測モデル116の改善された精度性能の2つの例を示している。ここで参照(基準)は,NOVA T600(登録商標)−MMSRで開発された物理モデルとし,予測モデル116には推論のために2つの通常チャネルを使用した。プロットは,〜2000ダイにわたるブラインド・テスト結果の1σとして定義される予測モデル116の精度が,モデルのトレーニングに使用されるウェーハ(各ウェーハは〜15ダイを持つ)の数にどのように依存するか示している。
図6Aに示すように,トレーニング・サイズ(train size)を5ウェーハから200ウェーハに増やすと精度を45%向上させることができる(13A→6A)。このような大きなサンプルで飽和することは一般的ではなく,DOEが存在する場合,現場では数十倍の良好な結果が得られることがよくある(we often see good results on tens on sites provided a DOE is present)。
図6Bは別の状況を示すもので,ここでは,予測モデル116の精度が,使用されるデータの量だけではなく,これをトレーニングするために使用されるデータに強く依存していることを示している。具体的には,
図6bは,ブラインド・テスト・ウェーハに時間的に最も近い(closest in time)〜20枚のウェーハでトレーニングした場合(曲線600で示す),モデルが,ブラインド・テストから最も遠い100枚のウェーハでトレーニングした場合(曲線602で示す)と同じレベルの精度に収束したことを示している。これらの曲線の間にはベンチマーク曲線(曲線604で示す)があり,これは時間の重要性の記憶を「失う」ためのデータのランダムなシャッフル(a random shuffle of the data so as to ‘lose’ memory of the important of time)を記述する。これは,ウェーハのタイプが重要であり,このアプリケーションが,この実施形態のビッグデータ・システムが可能であるMLレシピの動的更新から利益を得るであろうことを示している。
【0062】
上記のレシピ更新ステップは,再トレーニングの実行に使用されるデータの選択と同様に自動的に実行される。この選択では,利用可能なすべてのデータを使用するようにしてもよく,または各ウェーハの監視フラグの値および/または処理されている他のウェーハへの所与のウェーハの時間的または処理空間的な近接性を考慮する論理に基づくことができる。たとえば,再トレーニングに利用可能なデータにおいてウェーハごとに異なる重みpを設定することができる。上記重みpは,そのウェーハのフラグ値,スペクトル自体,および/またはウェーハやロットIDなどの他のメタデータ特性に依存させてもよい。これが
図7に示されている。
【0063】
この明細書に記載のこの発明の任意の態様は,従来の技術にしたがって,非一時的なコンピュータ読み取り可能な媒体に具現化されるコンピュータ・ハードウェアおよび/またはコンピュータ・ソフトウェア,一または複数のコンピュータ・プロセッサを含むコンピュータ・ハードウェア,コンピュータ・メモリ,I/Oデバイス,および従来の手法にしたがって相互運用するネットワーク・インターフェースに実装することができる。
【0064】
この明細書において使用される「プロセッサ」または「デバイス」という用語は,たとえばCPU(中央処理装置)および/または他の処理回路を含むものなどの任意の処理デバイスを含むことを意図していることを理解されたい。「プロセッサ」または「デバイス」という用語は,複数の処理デバイスを指す場合があり,処理デバイスに関連する様々な要素が他の処理デバイスによって共有される場合があることも理解されたい。
【0065】
この明細書において使用される「メモリ」という用語は,処理装置またはCPUと協調するメモリ,たとえば,RAM,ROM,固定メモリ装置(たとえばハードドライブ),リムーバブル・メモリ装置(たとえばディスク),フラッシュ・メモリ等を含むことを意図する。このようなメモリをコンピュータ読み取り可能な記憶媒体と考えてもよい。
【0066】
さらには,この明細書において使用される「入力/出力装置」または「I/O装置」という用語は,たとえば処理ユニットにデータを入力するための一または複数の入力装置(たとえばキーボード,マウス,スキャナ等),および/または処理ユニットと協調して結果を提示する一または複数の出力装置(たとえばスピーカ,ディスプレイ,プリンタ等)を含むことを意図する。
【0067】
この発明の実施形態は,システム,方法,および/またはコンピュータプログラム製品を含む。コンピュータプログラム製品は,プロセッサにこの発明の態様を実行させるためのコンピュータ読み取り可能なプログラム命令を有するコンピュータ読み取り可能な記憶媒体(または複数の媒体)を含む。
【0068】
コンピュータ読み取り可能な記憶媒体は,命令実行デバイスによって使用される命令を保持および記憶することができる有形デバイスとすることができる。コンピュータ読み取り可能な記憶媒体は,たとえば,これらに限定されないが,電子記憶装置,磁気記憶装置,光記憶装置,電磁記憶装置,半導体記憶装置,またはこれらの任意の適切な組み合わせとすることができる。コンピュータ読み取り可能な記憶媒体のより具体的な例の非網羅的なリストには,可搬のコンピュータディスケット,ハードディスク,ランダムアクセスメモリ(RAM),読み取り専用メモリ(ROM),消去可能なプログラム可能な読み取り専用メモリ(EPROMまたはフラッシュ・メモリ),静的ランダムアクセスメモリ(SRAM)、可搬のコンパクトディスク読み取り専用メモリ(CD−ROM),デジタル多用途ディスク(DVD),メモリスティック,フロッピーディスク,パンチカードまたは指示が記録された溝内隆起構造のような機械的符号化装置,およびこれらの任意の適切な組み合わせを含む。この明細書で使用されるコンピュータ読み取り可能な記憶媒体は,電波または他の自由に伝播する電磁波,導波管または他の伝送媒体を通って伝播する電磁波(たとえば光ファイバケーブルを通過する光パルス)またはワイヤを介して送信される電気信号などの一時的信号自体と解釈されるべきではない。
【0069】
この明細書に記載のコンピュータ読み取り可能なプログラム命令は,コンピュータ読み取り可能な記憶媒体からそれぞれのコンピューティング/処理デバイスに,またはネットワークたとえばインターネット,ローカルエリアネットワーク,ワイドエリアネットワークおよび/またはワイヤレスネットワークを介して外部コンピュータまたは外部記憶デバイスに,ダウンロードすることができる。ネットワークは,銅線伝送ケーブル,光ファイバー,無線伝送,ルーター,ファイアウォール,スイッチ,ゲートウェイコンピューターおよび/またはエッジサーバーを含むことができる。各コンピューティング/処理デバイスのネットワークアダプタカードまたはネットワーク・インターフェースは,ネットワークからコンピュータ読み取り可能なプログラム命令を受信し,それぞれのコンピューティング/処理デバイス内のコンピュータ読み取り可能な記憶媒体に記憶するためにコンピュータ読み取り可能なプログラム命令を転送する。
【0070】
この発明の動作を実行するためのコンピュータ読み取り可能なプログラム命令は,アセンブラ命令,命令セットアーキテクチャ(ISA)命令,機械命令,機械依存命令,マイクロコード,ファームウェア命令,状態設定データ,もしくはソースコード,またはJava,Smalltalk,C ++などのオブジェクト指向プログラミング言語,「C」プログラミング言語または同様のプログラミング言語などの従来の手続き型プログラミング言語を含む,一つ以上のプログラミング言語の任意の組み合わせで記述されるオブジェクトコードのいずれかとすることができる。コンピュータ読み取り可能なプログラム命令は,完全にユーザのコンピュータ上で,一部はユーザのコンピュータ上でスタンドアロンソフトウェアパッケージとして,一部はユーザのコンピュータ上で一部はリモートコンピュータ上で,または完全にリモートコンピュータまたはサーバ上で,実行される。後者のシナリオでは,リモートコンピュータは,ローカルエリアネットワーク(LAN)またはワイドエリアネットワーク(WAN)を含む任意のタイプのネットワークを介してユーザのコンピュータに接続するか,外部コンピュータに接続することができる(たとえばインターネットサービスプロバイダを使用したインターネット経由)。いくつかの実施形態では,たとえばプログラマブルロジック回路,フィールドプログラマブルゲートアレイ(FPGA)またはプログラマブルロジックアレイ(PLA)を含む電子回路が,この発明の態様を実行するために,コンピュータ読み取り可能なプログラム命令の状態情報を利用して電子回路をパーソナライズすることにより,コンピュータ読み取り可能プログラム命令を実行することができる。
【0071】
この発明の態様は,この発明の実施形態による方法,装置(システム)およびコンピュータプログラム製品のフローチャートおよび/またはブロック図を参照してこの明細書に記載される。フローチャートおよび/またはブロック図の各ブロック,およびフローチャートおよび/またはブロック図のブロックの組み合わせはコンピュータ読み取り可能なプログラム命令によって実装できることが理解されよう。
【0072】
これらのコンピュータ読み取り可能なプログラム命令は,汎用コンピュータ,専用コンピュータ,またはその他のプログラム可能なデータ処理装置のプロセッサに提供され,コンピュータのプロセッサまたは他のプログラム可能なデータ処理装置を介して命令を実行する機械が製造され,フローチャートおよび/または一または複数のブロックにおいて特定される機能/作用を実施するための手段を作成することができる。これらのコンピュータ読み取り可能なプログラム命令はまた,コンピュータ読み取り可能な記憶媒体に記憶することができ,コンピュータ,プログラム可能なデータ処理装置および/または他のデバイスに特定の態様において機能するように指示することができる。コンピュータ読み取り可能な記憶媒体はそこに記憶されたフローチャートおよび/または一または複数のブロックにおいて特定される機能/作用の態様を実装する命令を含む製造品を含む。
【0073】
コンピュータ読み取り可能なプログラム命令はまた,コンピュータ,他のプログラム可能なデータ処理装置,または他のデバイスにロードされ,コンピュータ上,他のプログラム可能な装置上または他のデバイス上で一連の操作ステップを実行させ,コンピュータ実装処理を生成することができる。コンピュータ,他のプログラム可能な装置または他のデバイス上で実行される命令は,フローチャートおよび/または一または複数のブロック図において特定される機能/作用を実施する。
【0074】
図面中のフローチャートおよびブロック図は,この発明の様々な実施形態によるシステム,方法,およびコンピュータプログラム製品に実装可能なアーキテクチャ,機能および動作を示している。これに関して,フローチャートまたはブロック図の各ブロックは,コンピュータ命令のモジュール,セグメントまたは部分を表すことができ,これは特定の論理機能を実装するための一または複数の実行可能なコンピュータ命令を含む。いくつかの他の実装形態では,ブロックに示されている機能は,図面中に示されている順序から外れて動作することがある。たとえば,連続して示される2つのブロックは,実際には実質的に同時に実行されたり,または関連する機能に応じてブロックが逆の順序で実行されたりする場合もある。フローチャートおよびブロック図の各ブロックならびにブロックの組み合わせは,特定の機能または動作を実行する専用ハードウェアベースおよび/またはソフトウェアベースのシステムによって実装できることにも留意されたい。
【0075】
この発明の様々な実施形態の説明は,例示目的で提示されており,網羅的であることを意図するものではなく,開示する実施形態に限定されることを意図するものではない。たとえば,本書に記載のシステムおよび方法は,半導体ウェーハ上の任意の構造に適用可能である。説明する実施形態の範囲および精神から逸脱することのない多くの修正および変形が当業者には明らかであろう。