特開2023-55660 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ルドルフ・テクノロジーズ，インコーポレーテッドの特許一覧

特開2023-55660ハイミックス半導体製造における深層学習モデル

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023055660

(43)【公開日】2023-04-18

(54)【発明の名称】ハイミックス半導体製造における深層学習モデル

(51)【国際特許分類】

G05B 23/02 20060101AFI20230411BHJP

H01L 21/66 20060101ALI20230411BHJP

G06N 3/08 20230101ALI20230411BHJP

G06N 3/044 20230101ALI20230411BHJP

【ＦＩ】

G05B23/02 R

H01L21/66 Z

G06N3/08

G06N3/044

【審査請求】有

【請求項の数】14

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2022152520

(22)【出願日】2022-09-26

(31)【優先権主張番号】63/247,904

(32)【優先日】2021-09-24

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】516312501

【氏名又は名称】オントゥーイノヴェイションインコーポレイテッド

(74)【代理人】

【識別番号】100094569

【弁理士】

【氏名又は名称】田中伸一郎

(74)【代理人】

【識別番号】100103610

【弁理士】

【氏名又は名称】▲吉▼田和彦

(74)【代理人】

【識別番号】100109070

【弁理士】

【氏名又は名称】須田洋之

(74)【代理人】

【識別番号】100067013

【弁理士】

【氏名又は名称】大塚文昭

(74)【代理人】

【識別番号】100086771

【弁理士】

【氏名又は名称】西島孝喜

(74)【代理人】

【識別番号】100109335

【弁理士】

【氏名又は名称】上杉浩

(74)【代理人】

【識別番号】100120525

【弁理士】

【氏名又は名称】近藤直樹

(74)【代理人】

【識別番号】100139712

【弁理士】

【氏名又は名称】那須威夫

(74)【代理人】

【識別番号】100176418

【弁理士】

【氏名又は名称】工藤嘉晃

(72)【発明者】

【氏名】ユーレイスン

(72)【発明者】

【氏名】シェルビークレイン

(72)【発明者】

【氏名】スティーヴンマクウィリアムズ

(57)【要約】

【課題】半導体製造環境において深層学習モデルを構築及び展開することは、単純で簡単なプロセスではなく、特にハイミックス製造環境では、複雑なステップを伴うため、ＡＩ／ＭＬ技術を半導体製造に採用することは、困難であった。
【解決手段】堆積、化学機械研磨（ＣＭＰ）、エッチング、フォトリソグラフィ、めっきなどのハイミックス半導体製造のための製作戦略にニューラルネットワーク深層学習モデルを適用するための開示された技術。製作戦略の訓練及び通常動作モードが、記載される。
【選択図】図２

【特許請求の範囲】

【請求項1】

半導体デバイスを製造するための少なくとも１つの処理パラメータを設定する方法であって、前記方法が、
前記少なくとも１つの処理パラメータに関するコンテキスト情報を受信することと、
前記コンテキスト情報を機械学習ネットワークに入力することと、
前記機械学習ネットワークから前記少なくとも１つの処理パラメータについての予測値を受信することと、
前記予測値に基づいて、前記少なくとも１つの処理パラメータを設定して、前記半導体デバイスを製造することと、
前記少なくとも１つの処理パラメータと関連付けられた前記半導体デバイスの測定結果を受信することと、
前記測定結果を前記機械学習ネットワークにフィードバックすることと、を含む、方法。

【請求項2】

前記機械学習ネットワークが、リカレントニューラルネットワーク（ＲＮＮ）深層学習モデルを含む、請求項１に記載の方法。

【請求項3】

前記機械学習ネットワークが、
履歴生成と関連付けられたデータを取得することと、
前記少なくとも１つの処理パラメータに関連する複数の特徴に基づいて、前記データのサブセットを選択することであって、前記複数の特徴が独立している、選択することと、
訓練のために前記機械学習ネットワークに前記サブセットを入力することと、を含む訓練プロセスを使用して、前記予測値を生成するように訓練される、請求項１に記載の方法。

【請求項4】

前記訓練プロセスが、
前記データの前記サブセットをフィルタリングして、外れ値を除去することを更に含む、請求項３に記載の方法。

【請求項5】

前記訓練プロセスが、
前記データの前記サブセット内のストリングデータを数値に変換することを更に含む、請求項３に記載の方法。

【請求項6】

前記訓練プロセスが、
前記データの前記サブセットをスケーリングして、正規化されたデータを生成することを更に含む、請求項３に記載の方法。

【請求項7】

前記訓練プロセスが、
前記機械学習ネットワークと関連付けられている少なくとも１つのハイパーパラメータを調整することを更に含む、請求項３に記載の方法。

【請求項8】

制御システムであって、
少なくとも１つのハードウェアプロセッサと、
少なくとも１つのメモリであって、前記少なくとも１つのハードウェアプロセッサによって実行されると、前記少なくとも１つのハードウェアプロセッサに、
少なくとも１つの処理パラメータに関するコンテキスト情報を受信することと、
前記コンテキスト情報を機械学習ネットワークに入力することと、
前記機械学習ネットワークから前記少なくとも１つの処理パラメータについての予測値を受信することと、
前記予測値に基づいて、前記少なくとも１つの処理パラメータを設定して、半導体デバイスを製造することと、
前記少なくとも１つの処理パラメータと関連付けられた前記半導体デバイスの測定結果を受信することと、
前記測定結果を前記機械学習ネットワークにフィードバックすることと、を含む動作を実行させる命令を記憶する、少なくとも１つのメモリと、を備える、制御システム。

【請求項9】

前記機械学習ネットワークが、リカレントニューラルネットワーク（ＲＮＮ）深層学習モデルを含む、請求項８に記載の制御システム。

【請求項10】

【請求項11】

前記訓練プロセスが、
前記データの前記サブセットをフィルタリングして、外れ値を除去することを更に含む、請求項１０に記載の制御システム。

【請求項12】

前記訓練プロセスが、
前記データの前記サブセット内のストリングデータを数値に変換することを更に含む、請求項１０に記載の制御システム。

【請求項13】

前記訓練プロセスが、
前記データの前記サブセットをスケーリングして、正規化されたデータを生成することを更に含む、請求項１０に記載の制御システム。

【請求項14】

前記訓練プロセスが、
前記機械学習ネットワークと関連付けられている少なくとも１つのハイパーパラメータを調整することを更に含む、請求項１０に記載の制御システム。

【発明の詳細な説明】

【技術分野】

【0001】

（関連出願の相互参照）
本出願は、２０２１年９月２４日に出願された米国仮特許出願第６３／２４７，９０４号に対する優先権の利益を主張し、その内容は、参照によりその全体が本明細書に組み込まれる。

【0002】

（発明の分野）
本開示は、概して、堆積、化学機械研磨（chemical-mechanical polishing、ＣＭＰ）、エッチング、フォトリソグラフィ、めっきなどのハイミックス半導体製造のための製作戦略において、リカレントニューラルネットワーク（recurrent neural network、ＲＮＮ）深層学習モデルなどの深層学習ネットワークを適用することに関する。

【背景技術】

【0003】

半導体製造は、典型的には、堆積時間を計算することなどの処理パラメータのための線形プロセスモデルを利用する。例えば、層厚対プロセス時間の線形プロセスモデルを使用して、プロセス時間を計算することができる。しかしながら、線形プロセスモデルは、その応用及び用途の点で限定的である可能性がある。

【発明の概要】

【発明が解決しようとする課題】

【0004】

過去１０年において、主にデータ及び計算能力の利用可能性のとてつもない拡大にけん引されて、人工知能（artificial intelligence、ＡＩ）及び機械学習（machine learning、ＭＬ）技術は、多くの異なる領域にそれらの活路を見出し、我々の生活及び問題を解決する方法を破壊的に変化させた。例えば、これらの技術は、オンライン検索及びショッピングの結果を精密化し、広告をカスタマイズし、ニュースフィードを調整し、また更には車を運転することもできる。最近、データから自律的に学習し、パターン及び関係付けを迅速に見出すＡＩ／ＭＬの能力は、半導体製造産業での計測及び検査にその用途を見出している。しかしながら、半導体製造環境において深層学習モデルを構築及び展開することは、単純で簡単なプロセスではなく、特にハイミックス製造環境では、複雑なステップを伴うため、ＡＩ／ＭＬ技術を半導体製造に採用することは、困難であった。

【課題を解決するための手段】

【0005】

本開示は、堆積、化学機械研磨（ＣＭＰ）、エッチング、フォトリソグラフィ、めっきなどのハイミックス半導体製造のための製作戦略にリカレントニューラルネットワーク（ＲＮＮ）深層学習モデルを適用するための技術を説明する。

【0006】

本開示は、半導体デバイスを製造するための少なくとも１つの処理パラメータを設定する方法を説明する。この方法は、少なくとも１つの処理パラメータに関するコンテキスト情報を受信することと、コンテキスト情報を機械学習ネットワークに入力することと、機械学習ネットワークから少なくとも１つの処理パラメータについての予測値を受信することと、予測値に基づいて、少なくとも１つの処理パラメータを設定して、半導体デバイスを製造することと、少なくとも１つの処理パラメータと関連付けられた半導体デバイスの測定結果を受信することと、測定結果を機械学習ネットワークにフィードバックすることと、を含む。

【0007】

本開示は、少なくとも１つのハードウェアプロセッサを含む制御システムも説明する。制御システムは、少なくとも１つのメモリであって、少なくとも１つのハードウェアプロセッサによって実行されると、少なくとも１つのハードウェアプロセッサに、少なくとも１つの処理パラメータに関するコンテキスト情報を受信することと、コンテキスト情報を機械学習ネットワークに入力することと、機械学習ネットワークから少なくとも１つの処理パラメータについての予測値を受信することと、予測値に基づいて、少なくとも１つの処理パラメータを設定して、半導体デバイスを製造することと、少なくとも１つの処理パラメータと関連付けられた半導体デバイスの測定結果を受信することと、測定結果を機械学習ネットワークにフィードバックすることと、を含む動作を実行させる命令を記憶する、少なくとも１つのメモリ、も含む。

【0008】

本開示は、機械記憶媒体であって、機械によって実行されると、機械に、少なくとも１つの処理パラメータに関するコンテキスト情報を受信することと、コンテキスト情報を機械学習ネットワークに入力することと、機械学習ネットワークから少なくとも１つの処理パラメータについての予測値を受信することと、予測値に基づいて、少なくとも１つの処理パラメータを設定して、半導体デバイスを製造することと、少なくとも１つの処理パラメータと関連付けられた半導体デバイスの測定結果を受信することと、測定結果を機械学習ネットワークにフィードバックすることと、を含む動作を実行させる命令を具現化する、機械記憶媒体を更に説明する。

【0009】

添付の図面の様々な図面は、本開示の例示的な実装形態を単に例解するものであり、その範囲を限定するものとみなされるべきではない。

【図面の簡単な説明】

【0010】

【図1】本開示のいくつかの例による、製作システムの例示的な部分を例解する。

【図2】本開示のいくつかの例による、ＲＮＮ深層学習モデルに基づくランツーラン戦略のフレームワークを示す。

【図3】本開示のいくつかの例による、ＲＮＮモデルを訓練するための方法のフロー図である。

【図4】本開示のいくつかの例による、堆積速度モデルのための選択特徴の例を例解する。

【図5】本開示のいくつかの例による、ストリングデータを変換するワンホットエンコーディングの一例を例解する。

【図6】本開示のいくつかの例による、通常動作モードで半導体デバイスを製造するための方法のフロー図を例解する。

【図7】本開示のいくつかの例による、堆積コントローラのシミュレーション結果を示す。

【図8】本明細書で考察される技術（例えば、方法論）のうちのいずれか１つ以上が実行され得る機械を備える例のブロック図を例解する。

【発明を実施するための形態】

【0011】

リカレントニューラルネットワーク（ＲＮＮ）深層学習モデルは、堆積、化学機械研磨（ＣＭＰ）、エッチング、フォトリソグラフィ、めっきなどのハイミックス半導体製造のための製作戦略に適用され得る。ＲＮＮモデルは、訓練され、次いで、製作戦略にランタイムで使用され得る。製作戦略の訓練及び通常動作モードが、説明される。

【0012】

第１に、ＲＮＮモデルが、訓練モード中にプロセスパラメータを計算するように構成及び訓練される。訓練モードでは、関連する試験データが、収集され得る。収集されたデータは、異なる特徴（又はモデルの入力）を含み得る。いくつかの例では、特徴は、互いに独立的であり得る。収集されたデータは、モデル抽出のための、特徴に基づいた十分な変動性を含み得る。収集されたデータは、前処理され得る。例えば、ストリングデータは、数値データに変換され得る。また、収集されたデータは、特徴が、絶対値ではなく、それらの割合によって評価されるようにスケーリングされ得る。更に、モデルのハイパーパラメータが、調整され得る。

【0013】

第２に、通常動作（ランタイム）モードでは、訓練されたＲＮＮモデルが、製造プロセスに展開されて、処理パラメータを計算及び設定し得る。各実行についての関連データが、収集され得る。データは、処理及びフィルタリングされ、次いで、更新のためにＲＮＮモデルにフィードバックされ得る。次いで、更新されたＲＮＮモデルが、半導体製造プロセスの処理パラメータを改善された精度で予測し得る。例えば、堆積時間、露光用量、オーバーレイ設定などの異なるプロセスのための機械設定が、本明細書に説明されるＲＮＮモデル技術を使用して計算され得る。

【0014】

図１は、本明細書に図示及び説明される１つ以上の技術を実行するために使用され得る製作システム１００の例示的な部分を例解する。製作システム１００は、半導体デバイスなどの基板１０２を製造及び検査するために使用され得る。

【0015】

製作システム１００は、製作のために基板１０２上で処理ステップを実行するために、１つ以上のツール１１０（機械とも称される）を含み得る。いくつかの例では、ツール１１０は、基板１０２上に１つ以上の層を堆積させるための化学蒸着（chemical vapor deposition、ＣＶＤ）機械を含み得る。いくつかの例では、ツール１１０は、ＣＭＰを実行するための研磨ツール、フォトリソグラフィのために基板１０２上に投射する放射線のビーム（例えば、電磁波）を放出するための照明源、基板をめっきするためのめっきツール、及び／又は半導体製作のための他の好適なツールを含み得る。

【0016】

製作システム１００は、基板１０２上の様々な特徴、又は基板１０２の特性を測定するための計測器具１１２（検査器具とも称される）を含み得る。様々な特徴及び特性は、例えば、基板上に形成された特徴の膜厚測定値、臨界寸法（critical-dimension、ＣＤ）測定値（ｘ寸法、ｙ寸法、及び／又はｚ寸法）、基板上に形成されたライン－スペース特徴（line-space features）のピッチ、基板上の１つの層から別の層までのオーバーレイオフセット、又は当業者に既知のいくつかの他の測定値若しくは特性を含み得る。検査器具を使用して、基板上に形成された、又は別様に基板上に見出された特徴のコンプライアンスを確認することができる。例えば、検査は、集積回路ダイが製作された基板、ダイの位置、望ましくない粒子状物質の位置、又は他の望ましくない若しくは意図しない特徴などのものであり得る。

【0017】

ツール１１０及び計測器具１１２は、制御システム１２０に結合され得る。制御システム１２０は、コンピュータ処理ユニット（ＣＰＵ）１２２、グラフィック処理ユニット（computer processing unit、ＧＰＵ）１２４、フィールドプログラマブルゲートアレイ（field programmable gate array、ＦＰＧＡ）１３１（又は他の好適なアクセラレータ、例えば、データ処理ユニット（data processing unit、ＤＰＵ）、ＲＮＮ、人工ニューロンネットワーク（artificial neuron network、ＡＮＮ）など）、メモリ１２６、ディスプレイ１２８、入力デバイス１３０、及び通信インターフェース１３２（例えば、高性能ネットワーク（high performance network、ＨＰＣ））を含み得る。制御システム１２０は、例えば、送信信号チェーン、受信信号チェーン、スイッチ回路構成、デジタル及びアナログ回路構成などのフロントエンド回路構成も含み得る。送信信号チェーンは、ツール１１０の制御信号を提供し得る。受信信号チェーンは、計測器具１１２からプロセスパラメータ測定値を受信し得る。

【0018】

フロントエンド回路構成は、ＣＰＵ１２２、ＧＰＵ１２４、及びＦＰＧＡ１３１などの１つ以上のプロセッサ回路に結合され、かつそれらによって制御され得る。ＣＰＵ１２２は、１つ以上のマルチコアプロセッサとして提供され得る。ＧＰＵ１２４及びＦＰＧＡ１３１は、本明細書に説明されるように、データの処理及び機械学習ネットワークの性能を加速させるために使用され得る。本明細書に図示及び説明される技術は、より速い処理のためにＧＰＵ１２４と共に作動するＣＰＵ１２２によって実行され得る。

【0019】

ＣＰＵ１２２及びＧＰＵ１２４は、例えば、制御システム１２０に、製造制御、処理、又は検査に関連するデータの記憶のうちの１つ以上を実行させるか、又は別様に本明細書に図示及び説明される技術を実行させる命令を実行するために、メモリ１２６に結合され得る。制御システム１２０は、例えば、有線又は無線通信インターフェース１３２を使用して、システム１００の他の部分に通信可能に結合され得る。

【0020】

例えば、本明細書に図示及び説明される１つ以上の技術の実行は、制御システム１２０上で、又は他の処理若しくは記憶施設を使用して、例えば、計算施設１４０（例えば、サーバ、クラウド処理システム、データウェアハウス、ラップトップ、タブレット、スマートフォン、デスクトップコンピュータなどの汎用コンピューティングデバイス）を使用して達成され得る。例えば、制御システム１２０上で実行される場合望ましくなく遅いか、又は制御システム１２０の能力を超えるであろう処理タスクは、例えば、制御システム１２０からの要求に応答して、リモートで（例えば、別個のシステム上で）実行され得る。同様に、検査データ又は中間データの記憶は、制御システム１２０に通信可能に結合されたリモート施設を使用して達成され得る。制御システム１２０はまた、例えば、構成情報又は結果の提示のためのディスプレイ１２８と、オペレータコマンド、構成情報、又はクエリに対する応答を受信するための、例えば、キーボード、トラックボール、ファンクションキー又はソフトキー、マウスインターフェース、タッチスクリーン、スタイラスなどのうちの１つ以上を含む入力デバイス１３０と、を含み得る。

【0021】

制御システム１２０は、ＲＮＮモデルを利用して、ツール１１０によって使用される処理パラメータを予測及び設定し得る。ＲＮＮモデルは、計算施設１４０（例えば、クラウド処理システム）を介して提供され得る。処理結果は、ＲＮＮモデルを更新するために、計測器具１１２によって測定され得る。ＲＮＮモデルは、ランツーラン（Run-to-Run、Ｒ２Ｒ）アルゴリズム及びソフトウェアスクリプトを使用して構築され得る。例えば、ＲＮＮモデルは、Ｐｙｔｈｏｎなどのコンピュータプログラミングスクリプトでオフラインで構築されて、履歴生産データを使用して、製造プロセスで使用される処理パラメータ（例えば、堆積速度）を予測し得る。ランタイム中、堆積制御戦略（又は他の処理戦略）は、ＲＮＮスクリプトを呼び出してモデル予測をトリガし得、次いで、モデル予測が、所望の目標層厚値をもたらすであろう各ロットのプロセス時間設定を計算するために使用される。このロットの実際の層厚は、後に計測機器１１２を使用して測定され、ＲＮＮモデルを更新するために、制御システム１２０にフィードバックされ得る。

【0022】

図２は、ＲＮＮ深層学習モデルに基づくＲ２Ｒ戦略のフレームワーク２００を示す。フレームワーク２００は、ツール１１０と、計測器具１１２と、制御システム１２０と、ＲＮＮモデル２０２と、を含み得る。ランタイム中、ツール１１０は、堆積など、ツール１１０によって実行される処理ステップに関するコンテキスト情報を制御システム１２０に提供し得る。制御システム１２０は、ＲＮＮモデル２０２を利用して、プロセスパラメータ予測（例えば、堆積速度予測）を生成し得、次いで、プロセスパラメータ予測が、ツール１１０を動作させて、処理ステップ（例えば、堆積）を実行するために使用される。計測器具１１２は、処理ステップの結果（例えば、膜厚）を測定し得、次いで、処理ステップの結果が、ＲＮＮモデル２０２を更新するために使用され得る。

【0023】

本明細書に説明されるように、深層学習モデルを構築すること及び展開することは、単純で簡単なプロセスではなく、特にハイミックス製造環境では、複雑なステップを伴う。したがって、主題の専門知識（subject matter expertise、ＳＭＥ）を用いて、本明細書に説明されるＲ２Ｒ制御に使用され得る堅実で効果的な深層学習モデルを構築することができる。これは、ワーキングモデルを構築するためには、データセット内に、抽出され得る相関及び意味、並びにモデルに組み込まれる十分な、好ましくは互いに独立した特徴（又はモデルへの入力）がなければならないからである。特徴の選択は、モデルの出力値（又は標識）に影響を与える可能性がある、製造コンテキスト、機器ハードウェアパラメータ、消耗品使用、及び上流パラメトリックデータなどを含み得る。製造コンテキストは、同じプロセスが、上記の製造コンテキストの異なる組み合わせに応じて、変動性を生成する可能性があるので、ロットを処理するために使用されたツールＩＤ、ロットが現在ある層、及び最終製品ＩＤ（例えば、メモリ、ＣＰＵなど）を含み得る。機器ハードウェアパラメータは、メンテナンス情報（例えば、最後のメンテナンスからの実行数）、電流及び電圧設定などの機械／ツール構成を含み得る。上流パラメトリックデータは、堆積、エッチング、又は研磨ステップ前の厚さなど、上流で処理された後の同じロットからのデータを含み得る。

【0024】

最初に、ＲＮＮモデルは、ランタイム中に使用に展開される前に、構築及び訓練される。図３は、ＲＮＮモデルを訓練するための方法３００のフロー図を例解する。動作３０２において、履歴データが、取得され得る。いくつかの例では、履歴データは、機器自動化プログラムによって提供され得る。いくつかの例では、履歴データは、データベースに記憶され得、Ｒ２Ｒシステムによって、取得に関してクエリされる。データベースは、ランタイム動作に基づいて更新され得、そのため、データは、更新のためのランタイム動作前に取得され得る。

【0025】

しかしながら、適切な特徴を選択することなく、深層学習アルゴリズムにデータを単純に投入することは、概して価値のある結果を生成しない。大きなデータセット自体は、出来の良いＭＬモデルを保証しない。その代わりに、本明細書に説明されるように、モデルが抽出するための十分な変動性を含む関連する特徴のデータを選択することが、より良好な結果を生成する。

【0026】

動作３０４において、履歴データのサブセットが、選択され得る。選択されたデータは、ＲＮＮモデルと関連付けられたプロセスパラメータに関連する特徴選択に基づき得る。主題の専門知識（ＳＭＥ）は、Ｒ２Ｒ制御に使用され得る堅実で効果的な深層学習モデルを構築するために、大きなデータセットを選択データに切り詰めるために使用され得る。信頼できる正確なモデルを構築するために、データセット内の相関及び意味を有する特徴が、抽出され得る。最小数の特徴（例えば、少なくとも２つ）が抽出されて、モデルへの入力として、モデルに組み込まれる。特徴は、互いに独立的であり得る。例えば、経路及び製品は、非独立とみなされ得る。経路は、多くの製品に対して実行されるステップのリストであり、経路は、典型的には、製品ライン専用である。したがって、特徴として経路及び製品を選択することにより、モデルの重複したコンテキスト情報が、提供され得る。

【0027】

特徴選択は、モデルの出力値に影響を与える可能性のある、製造コンテキスト、機器ハードウェアパラメータ、消耗品使用、及び上流パラメトリックデータなどを含み得る。製造コンテキストは、同じプロセスが、上記の製造コンテキストの異なる組み合わせに応じて、変動性を生成する可能性があるので、ロットを処理するために使用されたツールＩＤ、ロットが現在ある層、及び最終製品ＩＤ（例えば、メモリ、ＣＰＵなど）を含み得る。機器ハードウェアパラメータは、メンテナンス情報（例えば、最後のメンテナンスからの実行数）、電流及び電圧設定などの機械／ツール構成を含み得る。上流パラメトリックデータは、堆積、エッチング、又は研磨ステップ前の厚さなど、上流で処理された後の同じロットからのデータを含み得る。

【0028】

特徴選択は、選択のためのデータ分析を使用し得る。例えば、線形又は非線形回帰技術を使用して、ＲＮＮモデルによって予測される、指定された処理パラメータの最も関連する特徴を識別することができる。分散分析（an analysis of varianc、ＡＮＯＶＡ）を実行して、様々な特徴に基づいて、処理パラメータの分散を推定することができる。分散と直接的な関係を有する特徴が、識別及び選択され得る。

【0029】

図４は、堆積速度モデルのための選択特徴の一例を例解する。ここで、特徴４０２は、機械／ツール４０２．１、層４０２．２、及び製品４０２．３を含み得る。また、出力（すなわち、標識４０４）も、含まれ得る。ここで、観察された堆積速度は、モデルを訓練するための選択データの一部として含まれる。観察された堆積速度は、以前の実行において計測ツールによって測定されている場合がある。

【0030】

図３に戻ると、動作３０６において、フィルタリング動作が、データセットに対して実行され得る。フィルタリング動作は、データセット内の外れ値を、それらの外れ値がモデルに悪影響を及ぼさないように、除去し得る。フィルタリング動作は、テューキーフィルタ（テューキー窓とも称される）、グラッブフィルタ（Grubb’s filter）、基本制限フィルタ、及び／又は他の好適なフィルタを含み得る。

【0031】

前処理は、データセッに対して実行され得る。選択されたデータは、ＲＮＮモデルによって使用される前に、前処理され得る。例えば、ハイミックス製造環境（例えば、ファウンドリ）では、同じプロセスが、複数の層を有する異なる製品を構築するために、複数のツール上で実行され得、これらのコンテキスト属性、例えば、機械、製品、層などの各異なる組み合わせが、他と異なる結果を生成するように、同じプロセスを作製し得る。

【0032】

数値データに加えて、ストリングなどのカテゴリデータも、機械学習モデルに供給され得る。しかしながら、ほとんどの機械学習アルゴリズムは、典型的には、データ行列などの数値のみを処理する。動作３０８において、ストリングデータが、数値に変換され得る。いくつかの例では、ワンホットエンコーディングを用いて、カテゴリデータ（例えば、ストリングデータ）を数値データに変換し得る。図５は、ストリングデータのワンホットエンコーディングの一例を例解する。ここで、カテゴリデータを含む選択特徴のテーブル５０２が、数値の行列５０４に変換される。例えば、機械タイプ（ＣＶＤ－０１、ＣＶＤ－０２）が、行列５０４の列０及び１にコード化される。

【0033】

図３に戻ると、動作３１０において、データが、スケーリングされ得る。例えば、値が、絶対値ではなく、割合に基づいて評価されるように、行列内の数値が、スケーリング又は正規化され得る。機械学習モデルのより良好な性能が、スケーリングされたデータで取得され得、その結果、特徴は、それらの絶対値（例えば、サイズ）によってではなく、それらの割合によって評価される。例えば、上流パラメトリックデータは、異なるステップの複数の値（例えば、研磨ステップ前の厚さ）を含み得、これらの数値が、スケーリング又は正規化され得る。スケーリング（又は正規化）は、特徴の数値が、適切に重み付けされ、それらのパーセンテージによって表されることを確実にし得る。いくつかの例では、特徴の最低値及び最高値が、決定され得る。最低値及び最高値に基づいて、その特徴についての数値は、それらが０（最低値）と１（最高値）との間にあるように正規化され得る。

【0034】

動作３１２において、ＲＮＮモデルのハイパーパラメータとして既知の変数のセットが、調整され得る。ハイパーパラメータは、訓練モードで構成され得、それらの値は、学習プロセスを制御するために使用されて、モデル性能に大きく影響を及ぼし得る。ハイパーパラメータは、ニューラルネットワーク内の隠れ層の数、各層におけるニューロンの数、バッチサイズ、エポック、ドロップアウトなどを含み得る。バッチサイズは、一度にモデルに供給される記録のサイズを指す（例えば、一度に１００個の記録）。エポックは、同じデータがモデルに供給される回数を指す。ドロップアウトは、各エポックで除去されるデータのパーセンテージを指す。例えば、第１のエポックで、各１０個の記録の１０個のバッチを使用して、１００個の記録がモデルに供給され、かつドロップアウト率が２０％である場合、第２のエポックでは、１００個の記録のうちの８０個が、各１０個の記録の８個のバッチで、モデルにフィードバックされる。第１のエポックと第２のエポックとの間で除去された２０個の記録は、ランダム選択技術を使用して選択され得る。

【0035】

いくつかの例では、ハイパーパラメータ調整の少なくとも一部は、専門家、例えば、ヒューリスティックを使用するデータサイエンティストによって手動で実行され得る。いくつかの例では、所与の問題に対するハイパーパラメータの最良値は、既知ではない場合があり、したがって、この技術は、経験則を使用し得る、他の問題に対して使用された値をコピーし得る、及び／又は試行錯誤（例えば、反復プロセス）によって最良値を探索し得る。例えば、ＣＶＤプロセスのための堆積速度のＲＮＮモデルを設計する場合、物理蒸着（physical vapor deposition、ＰＶＤ）などの同様のプロセスのために設計された以前のモデルのハイパーパラメータが、使用され得る。ＰＶＤハイパーパラメータは、上記の技術を使用して、更に調整され得る。ハイパーパラメータ調整は、グリッドサーチなどの自動化された技術を使用して、最適値を決定し得る。

【0036】

機械学習ネットワークが訓練プロセスを完了した後、ＲＮＮモデルを通常動作（ランタイム）モードで使用して、製造中にプロセスパラメータを設定することができる。図６は、通常動作モードで半導体デバイスを製造するための方法６００のフロー図を例解する。いくつかの例では、方法６００は、本明細書に説明されるように、訓練されたＲＮＮモデルを有する（例えば、フレームワーク２００及び方法３００を使用する）製作システム１００によって実行され得る。

【0037】

動作６０２において、製造ツール／機械は、製造ツール／機械によって実行される処理ステップに関するコンテキスト情報を制御システムに提供し得る。堆積例では、製造ツールは、ツール識別、製品識別、層番号などに関する情報を提供し得る。動作６０４において、制御システムは、受信されたコンテキスト情報を、訓練されたＲＮＮモデルに入力し得る。動作６０６において、ＲＮＮモデルは、予測されたプロセスパラメータ（例えば、堆積速度予測）を生成し得る。

【0038】

動作６０８において、制御システムは、予測されたプロセスパラメータに基づいて、製造ツールのプロセスパラメータ（例えば、堆積時間）を設定し得る。動作６１０において、製造ツールは、設定されたプロセスパラメータを使用して、処理ステップ（例えば、堆積）を実行し得る。動作６１２において、計測器具は、処理ステップの結果（例えば、膜厚）を測定し得る。次いで、動作６１４において、測定結果が、ＲＮＮモデルにフィードバックされて、モデルを更新し得る。いくつかの例では、測定結果の値は、本明細書に説明されるように（例えば、方法５００）、フィルタリング及び前処理され得る。例えば、フィルタリング動作は、誤った実行によって生成され得る外れ値を除去するために、測定結果に対して実行され得る。いくつかの例では、検出システムを使用して、誤った実行を検出することができ、誤った実行が検出された場合、誤った実行からの結果が、破棄され得、ＲＮＮモデルにフィードバックされ得ない。例えば、故障検出及び分類（fault detection and classification、ＦＤＣ）システムを使用して、誤った実行の指標を検出し得る。例えば、ＦＤＣシステムは、誤った実行の指標であり得る、ツール温度、ガス流などを監視し得る。

【0039】

いくつかの例では、測定結果は、ＲＮＮにバッチでフィードバックされ得る。製品ロットのセットからの測定結果は保存され、次いで、モデルを更新するためのバッチとして、ＲＮＮにフィードバックされ得る。バッチサイズは、ＲＮＮモデルを訓練するために使用されるハイパーパラメータ調整動作で調整された同じバッチサイズであり得る。いくつかの例では、測定結果は、監視され得、予測された処理されたパラメータの品質が劣化し始める場合、ＲＮＮモデルの更新は、停止され得る。次いで、ＲＮＮモデルが、リセットされ得る。

【0040】

図７は、指数加重移動平均（exponentially weighted moving average、ＥＷＭＡ）調整アルゴリズムを有する従来の線形モデルと対比した、ＲＮＮ深層学習モデルを有する堆積コントローラのシミュレーション結果を示す。生産データでのシミュレーション結果は、線形モデル及びＥＷＭＡ調整アルゴリズムを有する従来のＲ２Ｒ戦略（３１％の二乗平均平方根誤差（Root Mean Squared Error、ＲＭＳＥ）低減）と比較して、ＲＮＮ深層学習モデルによって強化された堆積コントローラが、同等に作動すること（３２％のＲＭＳＥ低減）を示す。したがって、機械学習ソリューションは、ハイミックス生産環境で使用されることに加えて、正確な物理的又は統計的モデルがまだ準備できていない複雑な時間に敏感な状況で、補完的な能力を提供し得る。

【0041】

上記の機械学習ネットワークを使用するいくつかの例が、ＣＶＤプロセスの堆積速度を予測するために説明された。明確にするために、機械学習ネットワークを使用する、本明細書に説明される技術は、エッチングプロセスのエッチング速度、ＣＭＰの研磨速度、フォトリソグラフィのオフセット調整、めっきのめっき速度などであるが、これらに限定されない、他の半導体製造プロセスに使用され得る。

【0042】

本文書に図示及び説明される技術は、図１に示されるような製作システム１００の一部分又は全体を使用して、又は別様に図８に関連して以下で考察されるような機械８００を使用して、実行され得る。図８は、本明細書で考察される技術（例えば、方法論）のうちのいずれか１つ以上が実行され得る機械８００を備える一例のブロック図を例解する。様々な例では、機械８００は、スタンドアロンデバイスとして動作し得るか、又は他の機械に接続（例えば、ネットワーク化）され得る。

【0043】

ネットワーク化された展開では、機械８００は、サーバマシン、クライアントマシン、又はサーバクライアントネットワーク環境では両方の容量で動作し得る。一例では、機械８００は、ピアツーピア（peer-to-peer、Ｐ２Ｐ）（又は他の分散型）ネットワーク環境におけるピアマシンとして機能し得る。機械８００は、パーソナルコンピュータ（personal computer、ＰＣ）、タブレットデバイス、セットトップボックス（set-top box、ＳＴＢ）、パーソナルデジタルアシスタント（personal digital assistant、ＰＤＡ）、携帯電話、ウェブアプライアンス、ネットワークルータ、スイッチ若しくはブリッジ、又はその機械によって取られるアクションを指定する命令（順次的な、若しくは別様の）を実行することができる任意の機械であり得る。更に、単一の機械のみが例解されているが、「機械」という用語は、クラウドコンピューティング、サービスとしてのソフトウェア（software as a service、ＳａａＳ）、他のコンピュータクラスタ構成など、本明細書で考察される方法論のうちのいずれか１つ以上を実行するために、命令のセット（又は複数のセット）を個別に又は共同で実行する機械の任意の集合を含むものとする。

【0044】

本明細書に説明される例は、論理若しくは多数の構成要素若しくは機構を含み得るか、又はそれらによって動作し得る。回路構成は、ハードウェア（例えば、単純な回路、ゲート、論理など）を含む有形のエンティティに実装された回路の集合体である。回路構成メンバーシップは、時間及び基礎となるハードウェアの変動性に対してフレキシブルであり得る。回路構成は、単独で又は組み合わせで、動作時に、指定された動作を実行し得る部材を含む。一例では、回路構成のハードウェアは、特定の動作を実施するように不変に設計され（例えば、配線され）得る。一例では、回路構成を備えるハードウェアは、特定の動作の命令を符号化するために、（例えば、物理的状態の変化又は別の物理的特性の変換などを介して磁気的に、電気的になど）物理的に変更されるコンピュータ可読媒体を含む、可変的に接続された物理的構成要素（例えば、実行ユニット、トランジスタ、単純回路など）を含み得る。物理的構成要素を接続する際に、ハードウェア構成要素の基礎となる電気的特性が、例えば、絶縁特性から導電性特性に、又はその逆に変更され得る。命令は、埋め込まれたハードウェア（例えば、実行ユニット又はロード機構）が、動作時に特定の動作の一部分を実施するために、可変接続を介してハードウェア内に回路構成のメンバーを作成することを可能にする。したがって、コンピュータ可読媒体は、デバイスが動作しているときに、回路構成の他の構成要素に通信可能に結合される。一例では、物理的構成要素のうちのいずれかが、２つ以上の回路構成の２つ以上のメンバーで使用され得る。例えば、動作中、実行ユニットは、ある時点で第１の回路構成の第１の回路で使用され、第１の回路構成内の第２の回路によって、又は異なる時間に第２の回路構成内の第３の回路によって、再使用され得る。

【0045】

機械８００（例えば、コンピュータシステム）は、ハードウェアベースのプロセッサ８０１（例えば、中央処理ユニット（ＣＰＵ）、グラフィック処理ユニット（ＧＰＵ）、ハードウェアプロセッサコア、又はそれらの任意の組み合わせ）、メインメモリ８０３、及び静的メモリ８０５を含み得、それらのうちのいくつか又は全てが、インターリンク８３０（例えば、バス）を介して互いに通信し得る。機械８００は、表示デバイス８０９、入力デバイス８１１（例えば、英数字キーボード）、及びユーザインターフェース（user interface、ＵＩ）ナビゲーションデバイス８１３（例えば、マウス）を更に含み得る。一例では、表示デバイス８０９、入力デバイス８１１、及びＵＩナビゲーションデバイス８１３は、タッチスクリーンディスプレイの少なくとも一部分を含み得る。機械８００は、記憶デバイス８２０（例えば、駆動ユニット）、信号生成デバイス８１７（例えば、スピーカ）、ネットワークインターフェースデバイス８５０、及び全地球測位システム（global positioning system、ＧＰＳ）センサ、コンパス、加速度計、又は他のセンサなどの１つ以上のセンサ８１５を付加的に含み得る。機械８００は、シリアルコントローラ若しくはインターフェース（例えば、ユニバーサルシリアルバス（universal serial bus、ＵＳＢ））、並列コントローラ若しくはインターフェース、又は他の有線若しくは無線（例えば、赤外線（infrared、ＩＲ）コントローラ若しくはインターフェース、近距離無線通信（near field communication、ＮＦＣ）など、１つ以上の周辺デバイス（例えば、プリンタ、カードリーダなど）を通信又は制御するように結合された出力コントローラ８１９を含み得る。

【0046】

記憶デバイス８２０は、本明細書に説明される技術又は機能のうちのいずれか１つ以上を具現化するか、又はそれらによって利用されるデータ構造若しくは命令８２４（例えば、ソフトウェア若しくはファームウェア）のうちの１つ以上のセットが記憶される機械可読媒体を含み得る。命令８２４はまた、機械８００によるその実行中に、メインメモリ８０３内、静的メモリ８０５内、大容量記憶デバイス８０７内、又はハードウェアベースのプロセッサ８０１内に、完全に又は少なくとも部分的に存在し得る。一例では、ハードウェアベースのプロセッサ８０１、メインメモリ８０３、静的メモリ８０５、又は記憶デバイス８２０のうちの１つ、又はそれらの任意の組み合わせが、機械可読媒体を構成し得る。

【0047】

機械可読媒体は、単一の媒体とみなされるが、「機械可読媒体」という用語は、１つ以上の命令８２４を記憶するように構成された単一の媒体又は複数の媒体（例えば、集中型若しくは分散型データベース、及び／又は関連付けられたキャッシュ及びサーバ）を含み得る。

【0048】

「機械可読媒体」という用語は、機械８００による実行のための命令を記憶、符号化、若しくは担持することができ、かつ機械８００に、本開示の技術のうちのいずれか１つ以上を実行させるか、又はそのような命令によって使用されるか、若しくはそのような命令に関連付けられたデータ構造を記憶、符号化、若しくは担持することができる任意の媒体を含み得る。非限定的な機械可読媒体の例としては、ソリッドステートメモリ、並びに光学及び磁気媒体が挙げられ得る。したがって、機械可読媒体は、一時的な伝搬信号ではない。大規模な機械可読媒体の具体例としては、半導体メモリデバイス（例えば、電気的にプログラム可能な読み取り専用メモリ（Electrically Programmable Read-Only Memory、ＥＰＲＯＭ）、電気的に消去可能なプログラム可能な読み取り専用メモリ（Electrically Erasable Programmable Read-Only Memory、ＥＥＰＲＯＭ））、及びフラッシュメモリデバイスなどの不揮発性メモリ、磁気又は他の相変化若しくは状態変化メモリ回路、内蔵ハードディスク及びリムーバブルディスクなどの磁気ディスク、磁気光学ディスク、並びにＣＤ－ＲＯＭディスク及びＤＶＤ－ＲＯＭディスクが、挙げられ得る。

【0049】

命令８２４は、いくつかの転送プロトコル（例えば、フレームリレー、インターネットプロトコル（internet protocol、ＩＰ）、伝送制御プロトコル（transmission control protocol、ＴＣＰ）、ユーザデータグラムプロトコル（user datagram protocol、ＵＤＰ）、ハイパーテキスト転送プロトコル（hypertext transfer protocol、ＨＴＴＰ）など）のうちのいずれか１つを利用するネットワークインターフェースデバイス８５０を介して、伝送媒体を使用して、通信ネットワーク８２１を介して更に送信又は受信され得る。例示的な通信ネットワークとしては、特に、ローカルエリアネットワーク（local area network、ＬＡＮ）、ワイドエリアネットワーク（wide area network、ＷＡＮ）、パケットデータネットワーク（例えば、インターネット）、携帯電話ネットワーク（例えば、セルラーネットワーク）、一般電話サービス（Plain Old Telephone、ＰＯＴＳ）ネットワーク、及び無線データネットワーク（例えば、Ｗｉ－Ｆｉ（登録商標）として既知の米国電気電子学会（the Institute of Electrical and Electronics Engineers、ＩＥＥＥ）８０２．２２ファミリの標準、ＷｉＭａｘ（登録商標）として既知のＩＥＥＥ８０２．２６ファミリの標準）、ＩＥＥＥ８０２．２７．４ファミリの標準、ピアツーピア（Ｐ２Ｐ）ネットワークが挙げられ得る。一例では、ネットワークインターフェースデバイス８５０は、通信ネットワーク８２１に接続するための１つ以上の物理的ジャック（例えば、イーサネット、同軸、又は電話ジャック）又は１つ以上のアンテナを含み得る。一例では、ネットワークインターフェースデバイス８５０は、単一入力多重出力（single-input multiple-output、ＳＩＭＯ）、複数入力多重出力（multiple-input multiple-output、ＭＩＭＯ）、又は複数入力単一出力（multiple-input single-output、ＭＩＳＯ）技術のうちの少なくとも１つを使用して無線通信するための複数のアンテナを含み得る。「伝送媒体」という用語は、機械８００による実行のための命令を記憶、符号化、又は担持することができる任意の無形媒体を含むものとし、そのようなソフトウェアの通信を容易にするためにデジタル又はアナログ通信信号若しくは他の無形媒体を含む。

【0050】

様々な注記
上記の非限定的な態様の各々は、それ自体で成立することができるか、又は本文書に説明される他の態様若しくは他の主題のうちの１つ以上との様々な並べ替え若しくは組み合わせにおいて、組み合わせることができる。

【0051】

上記の詳細な説明は、詳細な説明の一部を形成する添付図面への参照を含む。図面は、例解として、本発明が実施され得る特定の実装形態を示す。これらの実装形態は、一般に「例」とも称される。そのような例は、図示又は説明されたものに加えて、要素を含み得る。しかしながら、本発明者らはまた、図示又は説明された要素のみが提供される例を企図する。更に、本発明者らはまた、本明細書に図示若しくは説明される特定の例（又はその１つ以上の態様）に関してか、又は他の例（又はその１つ以上の態様）に関してのいずれかで図示又は説明される要素（又はその１つ以上の態様）の任意の組み合わせ又は並べ替えを使用する例を企図する。

【0052】

この文書と、参照により組み込まれる任意の文書との間に矛盾した使用がある場合、この文書での使用が、優先する。

【0053】

本文書において、「ａ」又は「ａｎ」という用語は、「少なくとも１つの」又は「１つ以上」の任意の他の例又は使用とは独立して、１つ又は２つ以上を含むように、特許文書において一般的であるように使用される。本文書では、「又は」という用語は、非排他的であることを指すのに用いられており、そのため、別段の記載がない限り、「Ａ又はＢ」は、「ＡであるがＢではない」、「ＢであるがＡではない」、及び「Ａ及びＢ」を含む。本文書において、「ｉｎｃｌｕｄｉｎｇ（含む）」及び「ｉｎｗｈｉｃｈ」という用語は、「ｃｏｍｐｒｉｓｉｎｇ（備える／含む）」及び「ｗｈｅｒｅｉｎ」というそれぞれの用語の平易な英語の等価物として使用されている。また、以下の態様では、「ｉｎｃｌｕｄｉｎｇ（含む）」及び「ｃｏｍｐｒｉｓｉｎｇ（備える／含む）」という用語は、オープンエンドであり、すなわち、ある態様におけるそのような用語の後に列挙された要素に加えて、要素を含むシステム、デバイス、物品、組成物、製剤、又はプロセスが、依然としてその態様の範囲に含まれるとみなされる。更に、以下の態様では、「第１」、「第２」、及び「第３」などの用語は、単に標識として使用され、それらの物体に数値要件を課すことを意図するものではない。

【0054】

本明細書に説明される方法の例は、少なくとも部分的に機械実装、又はコンピュータ実装され得る。いくつかの例は、上記の例に説明されるような方法を実行するように電子デバイスを構成するように動作可能な命令で符号化されたコンピュータ可読媒体又は機械可読媒体を含み得る。そのような方法の実装形態は、マイクロコード、アセンブリ言語コード、より高いレベルの言語コードなどのコードを含み得る。そのようなコードは、様々な方法を実行するためのコンピュータ可読命令を含み得る。コードは、コンピュータプログラム製品の部分を形成し得る。更に、一例では、コードは、例えば、実行中又は他の時間に、１つ以上の揮発性、非一時的、又は不揮発性の有形のコンピュータ可読媒体上に有形的に記憶され得る。これらの有形のコンピュータ可読媒体の例としては、ハードディスク、リムーバブル磁気ディスク、リムーバブル光ディスク（例えば、コンパクトディスク及びデジタルビデオディスク）、磁気カセット、メモリカード又はスティック、ランダムアクセスメモリ（random access memory、ＲＡＭ）、読み取り専用メモリ（read only memory、ＲＯＭ）などが挙げられ得るが、これらに限定されない。

【0055】

上記の説明は、例解的であり、限定的ではないことを意図している。例えば、上記の例（又はその１つ以上の態様）は、互いに組み合わせて使用され得る。他の実装形態が、上記の説明を検討する際に、例えば、当業者によって、使用され得る。要約は、読者が、本技術的開示の性質を迅速に確認することを可能にするために提供される。要約は、それが、態様の範囲又は意味を解釈又は限定するために使用されないことを理解して提出される。また、上記の発明を実施するための形態では、本開示を効率化するために、様々な特徴が一緒にグループ化され得る。これは、特許請求されていない開示された特徴が、任意の請求項に必須であることを意図するものと解釈されるべきではない。むしろ、本発明の主題は、特定の開示された実装形態の全ての特徴よりも少ない特徴に存在し得る。したがって、以下の態様は、例又は実装形態として発明を実施するための形態に組み込まれ、各態様は、別個の実装形態としてそれ自体で成立し、そのような実装形態は、様々な組み合わせ又は並び替えで互いに組み合わされ得ることが企図される。

【図1】