(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-22
(45)【発行日】2024-12-02
(54)【発明の名称】累積予測による機械学習変数選択および根本原因発見
(51)【国際特許分類】
H01L 21/02 20060101AFI20241125BHJP
G06N 20/00 20190101ALI20241125BHJP
【FI】
H01L21/02 Z
G06N20/00
(21)【出願番号】P 2022522021
(86)(22)【出願日】2020-10-16
(86)【国際出願番号】 US2020056053
(87)【国際公開番号】W WO2021076943
(87)【国際公開日】2021-04-22
【審査請求日】2023-10-05
(32)【優先日】2019-10-16
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】520266557
【氏名又は名称】ピーディーエフ ソリューションズ,インコーポレイテッド
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】バーチ,リチャード
(72)【発明者】
【氏名】ズー,クイン
(72)【発明者】
【氏名】ホルト,ジョナサン
(72)【発明者】
【氏名】ホンダ,トモノリ
【審査官】小池 英敏
(56)【参考文献】
【文献】特開2014-222712(JP,A)
【文献】特開2019-102574(JP,A)
【文献】特開2002-368056(JP,A)
【文献】特表2017-536584(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H01L 21/02
G06N 20/00
H01L 21/66
(57)【特許請求の範囲】
【請求項1】
方法であって、
機械学習モデルを、前記機械学習モデルに対する入力として提供された
3つ以上のプロセスパラメータに基づいて標的特徴を予測するように構成することと、
前記プロセスパラメータの
うち第1のものを選択し
、第1の選択されたプロセスパラメータに基づいて前記標的特徴を予測するための第1のr-2乗値を決定することと、
前記プロセスパラメータの
うち第2のものを選択し
、第2の選択されたプロセスパラメータに基づいて前記標的特徴を予測するための第2のr-2乗値を決定することと、
前記第1
のr-2乗値、
前記第2
のr-2乗値、および
前記標的特徴を予測するための対応する追加のr-2乗値の累積が閾値未満だけ増加するまで、前記プロセスパラメータの
うち追加のものを選択し
、追加の選択されたプロセスパラメータに基づいて前
記追加のr-2乗値を決定することと、
前記第1のr-2乗値、前記第2のr-2乗値、および前記追加のr-2乗値に基づいて、前記プロセスパラメータを高
から低
までランク付けすることと、
高ランキングのプロセスパラメータのセットを前記機械学習モデルに対する主要な入力として識別することと
、
を含む、方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、参照により全体として本明細書に組み込まれる、2019年10月16日に出願された「Machine Learning Variable Selection and Root Cause Discovery by Cumulative Prediction」というタイトルの米国仮出願第62/916171号からの優先権を主張する。
【0002】
技術分野
本出願は半導体製造プロセスに関し、より詳細には、機械学習モデルによる累積予測を利用して主要なプロセス変数を識別するための方式に関する。
【背景技術】
【0003】
半導体製造プロセスのための機械学習の利用およびモデリングにおける2つの基本的目標は、正確な収率(または連続的パラメトリック値)予測、および根本原因発見である。根本原因発見は、選択された収率(または連続的パラメトリック値)に対するモデルにおける各変数の重要性の定量化および各変数が各予測された観察に対してどのくらい重要かの定量化を伴う。
【0004】
残念ながら、これらの2つの目標は多くの場合、相互に対立する。線形回帰などの、単純モデルでは、最も重要な変数を全体として、および各観察に対して判断することは比較的容易であるが、これらのモデルは多くの場合、正確でない。複雑な機械学習アプローチでは、予測ははるかに正確であり得るが、各変数の重要性を全体として、および各観察に対し判断することは非常に困難なままである。
【0005】
機械学習モデルの固有の力を利用して特定のプロセス変数の重要性を定量化するのを支援することは望ましいであろう。
【発明の概要】
【発明が解決しようとする課題】
【0006】
特定のプロセス変数の重要性を識別するための方法が提示される。一連のモデルは、標的収率またはパラメトリック応答の予測に対する各変数の重要性を定量化するために、ますます多くの変数に対するr-2乗値を累積する。
【課題を解決するための手段】
【0007】
当初は、機械学習モデルは、機械学習モデルへの入力として提供された複数のプロセスパラメータに基づき標的特徴を予測するように構成される。プロセスパラメータの第1のものが選択されて標的特徴を予測するための第1のr-2乗値を決定するために使用される。次いで、プロセスパラメータの第2のものが選択されて、第2の選択されたプロセスパラメータに基づいて標的特徴を予測するための第2のr-2乗値を決定するために使用される。必要に応じて、第1、第2および追加のr-2乗値の累積が閾値未満だけ増加するまで、プロセスパラメータの追加の1つが選択されて、追加の選択されたプロセスパラメータに基づいて標的特徴を予測するための対応する追加のr-2乗値を決定するために使用される。パラメータは次いで、それらの影響に従ってランク付けされ、機械学習モデルに対する主要な入力として識別できる。
【図面の簡単な説明】
【0008】
【
図1】選択されたプロセスパラメータに起因した収率予測に対する漸増的で累積的な寄与を示すテーブルである。
【
図2】
図1で識別されたプロセスパラメータに基づいて複数のウェハーサンプルに対する予測された収率と実際の収率との間のウェハーレベルの相関関係を示すグラフィカルプロットである。
【
図3】
図2からのウェハーサンプルの2つに対して選択されたプロセスパラメータの収率への相対的な影響を示す棒グラフである。
【
図4】実際の収率と、最も重要な入力変数だけを使用して構築されたモデルから予測された収率との間のウェハーレベルの相関関係を示すグラフィカルプロットである。
【
図5】
図2からのウェハーサンプルの2つに対して選択されたプロセスパラメータの収率への相対的な影響の平均を示す棒グラフである。
【
図6】単一のパラメータに基づく観察後の
図2からのウェハーサンプルの2つに対する予測された空間パターンと実際の空間パターンを示すヒートマップである。
【
図7】2つのパラメータに基づく観察後の
図2からのウェハーサンプルの2つに対する予測された空間パターンと実際の空間パターンを示すヒートマップである。
【
図8】プロセスパラメータの累積的な影響を識別するための方法を示す流れ図である。
【発明を実施するための形態】
【0009】
機械学習(ML)は、半導体プロセスのモデリングにおいて、特に予測および根本原因分析のために、より積極的な役割を果たしている。段階的回帰の原理の一部が、任意の複合MLアプローチ(例えば、ニューラルネットワーク、極端な勾配ブースティングなど)、具体的には、訓練データに関する予測を改善しない変数を除去して、予測に対して重要な変数だけを保持する交差検証されたr-2乗のアプローチに基づくML、に対する入力パラメータを最適化するために使用できる。
【0010】
しかし、その概念は、まず考えられる最善の1変数モデルを構築することによりさらに進めることができる。次に、定義によりその最善の1変数モデルからの変数を含む必要がある、考えられる最善の2変数モデルを構築し、次いで、定義によりその最善の2変数モデルからの変数を含む必要がある、考えられる最善の3変数モデルを構築する。このプロセスは、全ての変数が「最も重要」~「最も重要でない」の観点からランク付けされるまで、または最善のn変数モデルが、段階的変数選択プロセスによって選択された全ての変数に対して所望もしくは容認可能な割合の交差検証されたr-2乗値を予測するまで、反復される。
【0011】
このように、累積的な一連のモデルが、交差検証されたr-2乗値における改善に基づいて、標的収率(または連続的パラメトリック)反応の全体的な予測に対する各変数の重要性を定量化するために使用できる。
【0012】
例えば、
図1は、収率性における累積的改善がどのような結果となるかをr-2乗値を指標として使用することにより実証するために、いくつかのプロセスパラメータがリストアップされたエントリをもつテーブル100を示す。テーブル100では、行111、112、113は、選択されたウェハーパラメータをリストアップしており、ウェハーグループ識別子が列121にリストアップされ、ウェハーパラメータの供給源が列122にリストアップされ、累積的な交差検証されたr-2乗のパーセント値が列123にリストアップされ、そのパラメータの漸増的な交差検証されたr-2乗のパーセント値が列124にリストアップされ、パラメータ番号、例えば、漸増的な影響によるパラメータランキングが列125にリストアップされている。
【0013】
行111にリストアップされている第1のパラメータはPCM-32であり、その供給源(列122)は、ウェハー上の第1の物理的テスト構造の連続的パラメトリック測定であり、識別された分散または逸脱に対するその漸増的な寄与(列124)は統計的分析からのr-2乗値に基づき15.4%である。第2のパラメータPCM-1(行112)を追加すると、同じウェハー上の第2の、異なるテスト構造の連続的パラメトリック測定は、12.4%の漸増的な影響を有し、説明された累積的分散は27.8%まで増加するが、他方、第3のパラメータPE-1(行112)を追加すると、wafer equipment histor(WEH)において識別されたプロセスツールは、9.9%の漸増的な影響で、総累積的分散を37.7%まで高める。この交差検証されたr-2乗の統計的分析に基づいて、これらは、機械学習モデルに含めるために、十分に重要な、例えば、この例における分散への略10%のより漸増的な寄与の、3つだけの変数である。
【0014】
各パラメータが全体的なモデルに対してどのくらい重要かを理解することは有益であるが、各パラメータが特定の観察に対してどのくらい重要かを理解するほど有益ではない可能性がある。例えば、いくつかの低収率ウェハーは接触抵抗変化によって最も良く予測されて、根本原因のより迅速な診断を可能にするユーザー情報を与え得る。これが簡単なデータセット例に対してどのように役立つかを検討する。
【0015】
図2は、
図1で検討されたパラメータ、すなわち、PCM-1、PCM-2およびPE-1に対する実際の収率対予測された収率の機械学習モデルに基づいて予測された数百のウェハーの相関プロット200を示す。異なるロット(Lotl34_W06およびLotl43_W09)からの2つのランダムに選択されたウェハー210、220は両方とも、最終モデルにおいてうまく予測されるが、問題はどのパラメータが各ウェハーに対して重要かということである。
【0016】
第1に、精度の基準が定義される。この特定のモデルはダイおよびウェハー収率の予測にフォーカスしていたので、精度の2つの基準は(i)予測されたウェハー収率と実際のウェハー収率との間の差、ならびに(ii)ウェハーにわたる予測された収率と実際の収率のダイレベル相関におけるr-2乗値である。ダイレベル相関に関して、データは、線230によって表されるように、各ダイを直接取り囲んでいるダイで平均化することにより滑らかにされて、収率および収率予測のより滑らかな表現を得る。ウェハー予測の精度は、
図1で識別される3つの累積予測の各々に対して検討される。
【0017】
各累積モデルに対するウェハーレベル予測誤差が、
図3に棒グラフ300で示されている。ウェハー210(Lotl34_W06)に対する予測誤差が左側の棒グラフ310上に示されており、ウェハー220(Lotl43_W09)に対する予測誤差が右側の棒グラフ320上に示されている。棒グラフ310は、予測が単一のパラメータPCM-2にだけ依存する場合ウェハー210は非常に大きな誤差312を有することを示す。しかし、一旦、パラメータPCM-1が予測に含められると、予測誤差314はずっと良好(すなわち、低い)である。これは、ウェハー210(Lotl34_W06)に対する収率は、他のパラメータが検討される場合、予測誤差は著しく変化しない(316、318)ので、他のパラメータよりもPCM-1によってより動かされることを暗示している。これは、第1の累積モデル対実際の収率のウェハーレベル予測プロットを見ることによって確認できる。
【0018】
同様に、ウェハー220(Lotl43_W09)に対する予測誤差は、他のパラメータ(324、326、328)も検討される場合に予測誤差322があまり変化しないので、PCM-2によって主に動かされる。
【0019】
図4は、PCM-2に対する収率対平均値のウェハーレベルプロット400であり、ウェハー220(Lotl43_W09)に対する収率損失は、PCM-2だけを使用するモデルからは、そのポイントは平均線から大きく外れているので、予測されないことを確認する。しかし、このモデルはウェハー200を予測するのには良い働きをし、なぜなら、そのポイントは、このウェハー収率が主にPCM-2によって動かされることを示す平均線に非常に近接しているためである。これは、PCM-2だけを使用する第1のモデルならびにPCM-2およびPCM-1の両方を使用する第2の累積モデルに対する空間相関を見ることによって更に確認できる。
【0020】
図5は、2つのウェハー例、左側のグラフ510上のウェハー210(Lotl34_W06)および右側のグラフ520上のウェハー220(Lotl43_W06)、に対する累積モデルの各々に対する空間r-2乗値を示す棒グラフ500である。グラフ510から、空間r-2乗のプロットは、一旦、PCM-1がプロット512でモデルに追加されるとずっと良くなるので、これはウェハー収率予測と一致しており、ウェハー収率予測は、ウェハー210(Lotl34_W06)は主にパラメータPCM-1によって予測されたことを示す。グラフ520から、ウェハー収率予測は、第1のプロット521および4つ全ての累積予測に対する非常に類似した空間r-2乗値によって示されるように、ウェハー220(Lotl43_W09)は主にパラメータPCM-2によって予測されたことを示す。
【0021】
図6に示されるように、これらの同じ空間パターン一致は、実際の収率および累積モデル予測のウェハーマップから容易に観察できる。例えば、ウィンドウ600は、単一のパラメータPCM-2に基づく、左側のパネル610内のウェハー210(Lotl34_W06)に対する予測されたマップ空間パターンおよび右側のパネル620内のウェハー220(Lotl43_W09)に対する予測されたマップ空間パターンを示す。ウィンドウ601は、左側のパネル611内のウェハー210(Lotl34_W06)に対する実際のマップ空間パターンおよび右側のパネル621内のウェハー220(Lotl43_W09)に対する実際のマップ空間パターンを示す。
【0022】
ウェハー220(Lotl43_W09)に関して、パネル620内に示されている第1の累積予測モデルは明らかに、パネル621内に示されている実際のマップとかなりうまく一致する。しかし、パネル620内のウェハー210(Lotl34_W06)に対する予測されたパターンは、パネル611内に示されている実際のパターンとうまく一致しない。
【0023】
図7は、前述のr-2乗ベースの観察、すなわち、第2の累積モデルはウェハー220(Lotl43_W09)の予測には著しく影響しないが、ここでパネル710内のウェハー210(Lotl34_W06)に対する予測はパネル711に示されている実際のマップとかなりうまく一致することをさらに確認し、それによりパラメータPCM-1はこのウェハーに対する原因である(そして、パネル720および721内の類似のマップから分かるようにウェハー220に著しい影響を及ぼさない)ことを示す。
【0024】
このアプローチは、本明細書で説明されるように、ダイレベル収率予測に対して、または分離可能で識別可能な根本原因があるという条件で、任意の複雑な多変数機械学習問題に対して、本例で使用できる。
【0025】
主要な変数に関する累積的な判断のための一般的方法を説明するために流れ図が
図8に提示されている。ステップ802で、機械学習モデルは、標的特徴を予測するように構成される。ステップ804で、プロセスパラメータが選択され、ステップ806で、選択されたプロセスパラメータに基づく標的特徴の予測のためのr-2乗値が決定される。r-2乗値は累積され、ステップ808で累計が閾値を超えて増加し続ける場合、ステップ810で別のプロセスパラメータが選択されて、次に選択されたプロセスパラメータに基づく標的特徴の予測のためのr-2乗値が決定される。
【0026】
ステップ808で累計がもう著しく増加していない、すなわち、増加が閾値を下回ると、ステップ812で、プロセスパラメータはr-2乗値によりランク付けされる。最後に、ステップ814で、最高ランキングのプロセスパラメータ、すなわち、交差検証されたr-2乗値アプローチのおかげで標的特徴に実証された影響を及ぼすパラメータが、MLモデルに対する主要な変数として識別される。