(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-11-08
(45)【発行日】2024-11-18
(54)【発明の名称】管理装置、リソグラフィー装置、管理方法および物品製造方法
(51)【国際特許分類】
G05B 13/02 20060101AFI20241111BHJP
G03F 7/20 20060101ALI20241111BHJP
H01L 21/68 20060101ALI20241111BHJP
【FI】
G05B13/02 L
G03F7/20 521
G03F7/20 501
G05B13/02 E
H01L21/68 F
H01L21/68 K
(21)【出願番号】P 2020111910
(22)【出願日】2020-06-29
【審査請求日】2023-06-14
(73)【特許権者】
【識別番号】000001007
【氏名又は名称】キヤノン株式会社
(74)【代理人】
【識別番号】110003281
【氏名又は名称】弁理士法人大塚国際特許事務所
(72)【発明者】
【氏名】伊藤 覚
【審査官】影山 直洋
(56)【参考文献】
【文献】特開2019-071405(JP,A)
【文献】特開2007-271187(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 13/02
G03F 7/20
H01L 21/68
(57)【特許請求の範囲】
【請求項1】
強化学習によってパラメータ値が決定されるニューラルネットワークを使って制御対象
の制御
を行う制御部
を管理する管理装置であって、
前記制御における制御偏差の移動平均に基づいて求められ
た報酬が所定基準を満たさない場合に、
前記制御偏差が閾値以下に収束するまでの時間に基づいて求められる報酬に基づき強化学習によって前記パラメータ値を再決定する学習部を備えることを特徴とする管理装置。
【請求項2】
前記制御対象は、処理対象物を保持する保持部を含み、
前記制御部は、前記処理対象物に対する処理を実行する処理シーケンスにおいて、前記保持部を移動させるように前記保持部を制御し、
前記学習部は、前記処理シーケンスにおける前記制御部による前記保持部の制御
における制御偏差の移動平均に基づいて求められ
た報酬が前記所定基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項1に記載の管理装置。
【請求項3】
前記処理シーケンスは、複数のサブシーケンスを含み、
前記所定基準は、前記複数のサブシーケンスにそれぞれ対する複数の基準を含み、
前記学習部は、前記複数のサブシーケンスの各々における前記制御部による前記保持部の制御
における制御偏差の移動平均に基づいて求められ
た報酬が前記複数の基準のうち対応する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項2に記載の管理装置。
【請求項4】
前記処理シーケンスは、基板に原版のパターンを転写するためのシーケンスであり、
前記複数のサブシーケンスは、前記基板を搬送する搬送シーケンスと、前記基板と前記原版とのアライメント誤差を計測する計測シーケンスと、前記基板に前記原版のパターンを投影し前記基板を露光する露光シーケンスと、を含む、
ことを特徴とする請求項3に記載の管理装置。
【請求項5】
前記複数の基準のうち前記搬送シーケンスに対応する基準は、前記保持部の制御偏差
の移動平均が規定値以下に収束するまでの時間に関する、
ことを特徴とする請求項4に記載の管理装置。
【請求項6】
前記複数の基準のうち前記計測シーケンスに対応する基準は、前記基板と前記原版とのアライメント誤差の計測中における前記保持部の制御偏差に関する、
ことを特徴とする請求項4又は5に記載の管理装置。
【請求項7】
前記学習部は、前記基板の露光中における前記基板と前記原版との同期誤差
が、前記同期誤差に関する基準を満たさない場合にも、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項4乃至6のいずれか1項に記載の管理装置。
【請求項8】
前記学習部は、前記処理シーケンスが終了した後に、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項2乃至7のいずれか1項に記載の管理装置。
【請求項9】
前記制御対象は、処理対象物を保持する保持部を含み、
前記制御部は、処理対象物に対する処理を実行する処理シーケンスを実行していない期間において、前記保持部を移動させるように前記保持部を制御し、
前記学習部は、前記期間における前記制御部による前記保持部の制御
における制御偏差の移動平均に基づいて求められ
た報酬が前記所定基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項1に記載の管理装置。
【請求項10】
前記制御部は、前記制御対象の位置を制御する、
ことを特徴とする請求項1乃至4のいずれか1項に記載の管理装置。
【請求項11】
前記制御部は、制御偏差に基づいて第1指令値を発生する第1補償器と、前記制御偏差に基づいて第2指令値を発生する第2補償器と、前記第1指令値と前記第2指令値に基づいて指令値を生成する加算器とを含み、
前記指令値は、前記制御対象を駆動するドライバに対して供給される、
ことを特徴とする請求項1乃至10のいずれか1項に記載の管理装置。
【請求項12】
強化学習によってパラメータ値が決定されるニューラルネットワークを使って基板を保持する保持部を制御する制御部を管理する管理装置であって、
前記制御部は、前記基板に原版のパターンを転写するための処理シーケンスにおいて、前記保持部を移動させるように前記保持部を制御し、
前記管理装置は、前記処理シーケンスに含まれる前記基板を搬送する搬送シーケンスおける前記保持部の制御偏差から求められた報酬が、前記保持部の制御偏差が規定値以下に収束するまでの時間に関する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する学習部を備える、
ことを特徴とする管理装置。
【請求項13】
強化学習によってパラメータ値が決定されるニューラルネットワークを使って基板を保持する保持部を制御する制御部を管理する管理装置であって、
前記制御部は、前記基板に原版のパターンを転写するための処理シーケンスにおいて、前記保持部を移動させるように前記保持部を制御し、
前記管理装置は、前記処理シーケンスに含まれる前記基板と前記原版とのアライメント誤差を計測する計測シーケンスおける前記保持部の制御偏差から求められた報酬が、前記基板と前記原版とのアライメント誤差の計測中における前記保持部の制御偏差に関する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する学習部を備える、
ことを特徴とする管理装置。
【請求項14】
強化学習によってパラメータ値が決定されるニューラルネットワークを使って、基板に原版のパターンを投影し前記基板を露光する露光シーケンスにおいて、前記基板および前記原版を制御する制御部を管理する管理装置であって、
前記露光シーケンスおける前記基板と前記原版との同期誤差から求められた報酬が、前記露光シーケンスにおける前記基板と前記原版との同期誤差に関する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する学習部を備える、
ことを特徴とする管理装置。
【請求項15】
原版のパターンを基板に転写する処理を行うリソグラフィー装置であって、
前記処理のために動作する動作部と、
強化学習によってパラメータ値が決定されるニューラルネットワークを含み、前記ニューラルネットワークを使って前記動作部
の制御
を行う制御部と、
前記制御における制御偏差の移動平均に基づいて求められ
た報酬が所定基準を満たさない場合に、
前記制御偏差が閾値以下に収束するまでの時間に基づいて求められる報酬に基づき強化学習によって前記パラメータ値を再決定する学習部と、
を備えることを特徴とするリソグラフィー装置。
【請求項16】
前記動作部は、前記基板を保持する保持部を含み、
前記制御部は、前記処理を実行する処理シーケンスにおいて、前記保持部を移動させるように前記保持部を制御し、
前記学習部は、前記処理シーケンスにおける前記制御部による前記保持部の制御
における制御偏差の移動平均に基づいて求められ
た報酬が前記所定基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項1
5に記載のリソグラフィー装置。
【請求項17】
前記処理シーケンスは、複数のサブシーケンスを含み、
前記所定基準は、前記複数のサブシーケンスにそれぞれ対する複数の基準を含み、
前記学習部は、前記複数のサブシーケンスの各々における前記制御部に
よる前記保持部の制御
における制御偏差の移動平均に基づいて求められ
た報酬が前記複数の基準のうち対応する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項1
6に記載のリソグラフィー装置。
【請求項18】
前記複数のサブシーケンスは、前記基板を搬送する搬送シーケンスと、前記基板と前記原版とのアライメント誤差を計測する計測シーケンスと、前記基板に前記原版のパターンを投影し前記基板を露光する露光シーケンスと、を含む、
ことを特徴とする請求項17に記載のリソグラフィー装置。
【請求項19】
前記複数の基準のうち前記搬送シーケンスに対応する基準は、前記保持部の制御偏差
の移動平均が規定値以下に収束するまでの時間に関する、
ことを特徴とする請求項1
8に記載のリソグラフィー装置。
【請求項20】
前記複数の基準のうち前記計測シーケンスに対応する基準は、前記基板と前記原版とのアライメント誤差の計測中における前記保持部の制御偏差に関する、
ことを特徴とする請求項1
8又は19に記載のリソグラフィー装置。
【請求項21】
前記学習部は、前記基板の露光中における前記基板と前記原版との同期誤差
が、前記同期誤差に関する基準を満たさない場合にも、強化学習によって前記パラメータ値を再決定する、
ことを特徴とする請求項
18乃至20のいずれか1項に記載のリソグラフィー装置。
【請求項22】
原版のパターンを基板に転写する処理シーケンスを行うリソグラフィー装置であって、
前記基板を保持する保持部と、
強化学習によってパラメータ値が決定されるニューラルネットワークを含み、前記ニューラルネットワークを使って、前記処理シーケンスにおいて、前記保持部を移動させるように前記保持部の制御を行う制御部と、
前記処理シーケンスに含まれる前記基板を搬送する搬送シーケンスおける前記保持部の制御偏差から求められた報酬が、前記保持部の制御偏差が規定値以下に収束するまでの時間に関する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する学習部と、
を備えることを特徴とするリソグラフィー装置。
【請求項23】
原版のパターンを基板に転写する処理シーケンスを行うリソグラフィー装置であって、
前記基板を保持する保持部と、
強化学習によってパラメータ値が決定されるニューラルネットワークを含み、前記ニューラルネットワークを使って、前記処理シーケンスにおいて、前記保持部を移動させるように前記保持部の制御を行う制御部と、
前記処理シーケンスに含まれる前記基板と前記原版とのアライメント誤差を計測する計測シーケンスおける前記保持部の制御偏差から求められた報酬が、前記基板と前記原版とのアライメント誤差の計測中における前記保持部の制御偏差に関する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する学習部と、
を備えることを特徴とするリソグラフィー装置。
【請求項24】
原版のパターンを基板に投影し前記基板を露光する露光シーケンスを行うリソグラフィー装置であって、
前記基板を保持する保持部と、
強化学習によってパラメータ値が決定されるニューラルネットワークを含み、前記ニューラルネットワークを使って、前記露光シーケンスにおいて、前記基板および前記原版の制御を行う制御部と、
前記露光シーケンスおける前記基板と前記原版との同期誤差から求められた報酬が、前記露光シーケンスにおける前記基板と前記原版との同期誤差に関する基準を満たさない場合に、強化学習によって前記パラメータ値を再決定する学習部と、
を備えることを特徴とするリソグラフィー装置。
【請求項25】
強化学習によってパラメータ値が決定されるニューラルネットワークを使って制御対象
の制御
を行う制御部
を管理する管理方法であって、
前記制御における制御偏差を取得する取得工程と、
前記
制御偏差の移動平均に基づいて求められ
た報酬が所定基準を満たさない場合に、
前記制御偏差が閾値以下に収束するまでの時間に基づいて求められる報酬に基づき強化学習によって前記パラメータ値を再決定する学習工程と、
を含むことを特徴とする管理方法。
【請求項26】
請求項
15乃至24のいずれか1項に記載のリソグラフィー装置によって基板に原版のパターンを転写する転写工程と、
前記転写工程を経た前記基板を処理する処理工程と、を含み、
前記処理工程を経た前記基板から物品を得ることを特徴とする物品製造方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、管理装置、リソグラフィー装置、管理方法および物品製造方法に関する。
【背景技術】
【0002】
特許文献1には、反復学習制御回路を備える位置制御装置が記載されている。該位置制御装置は、制御対象の位置を検出する検出部と、該検出部の出力を目標値から減算した偏差を生成する減算部と、該偏差が入力されるフィルタを含む反復学習制御回路と、該制御対象のパラメータ変動を算出する算出手段とを備える。該フィルタの特性は、該制御対象のパラメータ変動に応じて変更される。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
ニューラルネットワークを用いた制御装置は、強化学習を経てニューラルネットワークのパラメータ値が決定されうる。しかし、制御対象の状態は、経時変化によって変化しうるので、ある時点で最適化されていたニューラルネットワークであっても、その後の制御対象の状態の変化に伴って最適ではなくなりうる。そのため、制御対象の状態の変化に伴って、制御装置の制御精度が低下しうる。
【0005】
本発明は、制御対象の状態の変化による制御精度の低下を抑えるために有利な技術を提供することを目的とする。
【課題を解決するための手段】
【0006】
本発明の1つの側面は、強化学習によってパラメータ値が決定されるニューラルネットワークを使って制御対象の制御を行う制御部を管理する管理装置に係り、前記管理装置は、前記制御における制御偏差の移動平均に基づいて求められた報酬が所定基準を満たさない場合に、前記制御偏差が閾値以下に収束するまでの時間に基づいて求められる報酬に基づき強化学習によって前記パラメータ値を再決定する学習部を備える。
【発明の効果】
【0007】
本発明によれば、制御対象の状態の変化による制御精度の低下を抑えるために有利な技術が提供される。
【図面の簡単な説明】
【0008】
【
図3】
図2に例示された処理装置の構成を例示するブロック線図。
【
図4】学習シーケンスにおける管理装置の動作を例示する図。
【
図5】実シーケンスにおける管理装置の動作を例示する図。
【
図7】実シーケンスにおける走査露光装置の動作を例示する図。
【発明を実施するための形態】
【0009】
以下、添付図面を参照して実施形態を詳しく説明する。尚、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
【0010】
図1には、一実施形態の製造システムMSの構成が示されている。製造システムMSは、例えば、処理装置1と、処理装置1を制御する制御装置2と、処理装置1および制御装置2を管理する管理装置(学習装置)3とを備えうる。処理装置1は、例えば、製造装置、検査装置、監視装置等のように、処理対象物に対する処理を実行する装置である。処理の概念には、処理対象物を加工すること、検査すること、監視すること、観察することなどが含まれうる。
【0011】
処理装置1は、制御対象を含み、強化学習によってパラメータ値が決定されるニューラルネットワークを使って該制御対象を制御しうる。制御装置2は、処理装置1に駆動指令を送り、処理装置1から駆動結果あるいは制御結果を受け取るように構成されうる。管理装置3は、処理装置1のニューラルネットワークの複数のパラメータ値を決定する強化学習を行いうる。具体的には、管理装置3は、処理装置1に駆動指令を送り、処理装置1から駆動結果を受け取る動作を該ニューラルネットワークの該複数のパラメータ値の全部または一部を変更しながら繰り返すことによって該複数のパラメータ値を決定しうる。管理装置3は、学習装置として理解されてもよい。
【0012】
制御装置2の全部または一部の機能は、管理装置3に組み込まれてもよい。制御装置2の全部または一部の機能は、処理装置1に組み込まれてもよい。処理装置1、制御装置2および管理装置3は、物理的に一体化されて構成されてもよいし、物理的に別体をなすように構成されてもよい。処理装置1は、その全体が制御装置2によって制御されてもよいし、制御装置2によって制御される構成要素の他に、制御装置2によって制御されない構成要素を含んでもよい。
【0013】
図2には、処理装置1の構成が例示されている。処理装置1は、制御対象であるステージ(保持部)STを含むステージ機構5と、ステージSTの位置あるいは状態を検出するセンサ6と、ステージ機構5を駆動するドライバ7と、ドライバ7に指令値を与え、センサ6からの出力を受け取る制御部8とを含みうる。ステージSTは、位置決め対象物を保持しうる。ステージSTは、不図示のガイドによってガイドされうる。ステージ機構5は、ステージSTを移動させるアクチュエータACを含みうる。ドライバ7は、アクチュエータACを駆動する。より具体的には、ドライバ7は、例えば、制御部8から与えられる指令値に応じた電流(電気的エネルギー)をアクチュエータACに供給しうる。アクチュエータACは、ドライバ7から供給される電流に応じた力(機械的エネルギー)でステージSTを移動させうる。制御部8は、強化学習によってパラメータ値が決定されるニューラルネットワークを使って制御対象であるステージSTの位置あるいは状態を制御しうる。
【0014】
図3には、
図2に例示された処理装置1の構成を例示するブロック線図が示されている。制御部8は、減算器81と、第1補償器82と、第2補償器(ニューラルネットワーク)83と、加算器84とを含みうる。減算器81は、制御装置2から与えられる駆動指令(例えば、目標位置指令)とセンサ6から出力される検出結果(例えば、ステージSTの位置)との差分である制御偏差を演算しうる。第1補償器82は、減算器81から提供される制御偏差に対して補償演算を行って第1指令値を発生しうる。第2補償器83は、ニューラルネットワークで構成され、減算器81から提供される制御偏差に対して補償演算を行って第2指令値を発生しうる。加算器84は、第1指令値と第2指令値とを加算し指令値を発生しうる。制御部8、ドライバ7、ステージ機構5およびセンサ6は、制御偏差に基づいて制御対象としてのステージSTを制御するフィードバック制御系を構成している。
【0015】
第1補償器82は、例えば、PID補償器でありうるが、他の補償器であってもよい。第2補償器83は、例えば、入力数をL、中間層数をM、出力数をN(L、M、Nはいずれも正の整数)とした時に、L×Mの行列とM×Nの行列との積で定義されるニューラルネットワークでありうる。該ニューラルネットワークの複数のパラメータ値は、管理装置3によって実行される強化学習によって決定あるいは更新されうる。第1補償器82は、必ずしも必要ではなく、第2補償器82のみがドライバ7に与える指令値を発生してもよい。
【0016】
管理装置3は、処理装置1の制御部8によるステージSTの制御結果から求められる報酬が所定基準を満たさない場合に学習シーケンスを実行する学習部あるいは再学習部として機能しうる。学習シーケンスでは、強化学習によって第2補償器(ニューラルネットワーク)83の複数のパラメータ値からなるパラメータ値セットを決定あるいは再決定されうる。
【0017】
図4には、学習シーケンスにおける管理装置3の動作が例示されている。工程S101では、管理装置3は、第2補償器(ニューラルネットワーク)83の複数のパラメータ値(パラメータ値セット)を初期化しうる。工程S102では、管理装置3は、制御対象としてのステージSTを駆動するように処理装置1に指令を送りうる。具体的には、工程S102では、管理装置3は、駆動指令を制御装置2を介して処理装置1の制御部8に送りうる。これに応答して、処理装置1の制御部8は、駆動指令に従ってドライバ7にステージSTを駆動させ、ステージSTの位置を制御しうる。
【0018】
工程S103では、管理装置3は、工程S102における制御対象としてのステージSTの駆動の状態を示す駆動データを制御装置2を介して処理装置1の制御部8から取得しうる。駆動データは、例えば、センサ6の出力および減算器81の出力の少なくとも1つを示すデータを含みうる。工程S104では、管理装置3は、工程S103で取得した駆動データに基づいて報酬を計算しうる。報酬は、予め定義された式に基づいて計算されうる。例えば、制御偏差に基づいて報酬を計算する場合、報酬は、制御偏差の逆数を与える式、制御偏差の対数の逆数を与える式、または、制御偏差の二次関数の逆数を与える式等に従って計算されうるが、他の式に従って計算されてもよい。一例においては、報酬の値が大きいほど、第2補償器(ニューラルネットワーク)83が優秀であることを意味するが、これとは逆に、報酬の値が小さいほど、第2補償器(ニューラルネットワーク)83が優秀であることを意味する場合もある。
【0019】
工程S105では、管理装置3は、第2補償器(ニューラルネットワーク)83の複数のパラメータ値の少なくとも1つを変更して、新たなパラメータ値セットを生成し、新たなパラメータ値を第2補償器(ニューラルネットワーク)83に設定する。工程S106、S107、S108は、工程S102、S103、S104とそれぞれ同じでありうる。工程S106では、管理装置3は、ステージSTを駆動するように処理装置1に指令を送りうる。具体的には、工程S106では、管理装置3は、駆動指令を制御装置2を介して処理装置1の制御部8に送りうる。これに応答して、処理装置1の制御部8は、駆動指令に従ってドライバ7にステージSTを駆動させ、ステージSTの位置を制御しうる。工程S107では、管理装置3は、工程S106におけるステージSTの駆動の状態を示す駆動データを制御装置2を介して処理装置1の制御部8から取得しうる。工程S108では、管理装置3は、工程S107で取得した駆動データに基づいて報酬を計算しうる。
【0020】
工程S109では、管理装置3は、工程S108で計算した報酬が工程S104で計算した報酬より向上しているかどうかを判定する。そして、管理装置3は、工程S108で計算した報酬が工程S104で計算した報酬より向上している場合には、工程S110において、工程S105において変更を実行した後のパラメータ値セットを最新のパラメータ値として採用する。一方、管理装置3は、工程S108で計算した報酬が工程S104で計算した報酬より向上していない場合には、工程S111において、工程S105において変更を実行した後のパラメータ値セットを不採用とし、工程S105に戻る。この場合、工程S105において、第2補償器(ニューラルネットワーク)83に新たなパラメータ値セットを設定される。
【0021】
工程S110が実行された場合には、工程S112において、管理装置3は、直前に実行された工程S108で計算した報酬が所定基準を満たすかどうかを判定し、該報酬が所定基準を満たす場合には、
図4に示される処理を終了する。これは、直前に実行された工程S105で生成されたパラメータ値セットが強化学習後のパラメータ値セットとして決定されることを意味する。強化学習後のパラメータ値セットが設定されたニューラルネットワークは、学習済モデルと呼ばれうる。一方、工程S112において直前に実行された工程S108で計算した報酬が所定基準を満たさない場合、管理装置3は、工程S105からの処理を繰り返す。
【0022】
処理装置1は、処理対象物に対する処理を実行するシーケンス(これを実シーケンスと呼ぶ)において、上記の学習シーケンスで得られた学習済モデル(第2補償器83)を有する装置として動作しうる。一例において、処理装置1は、管理装置3による管理下において実シーケンスを実行しうるが、他の例において、処理装置1は、管理装置3による管理とは独立して実シーケンスを実行しうる。
【0023】
図5には、実シーケンスにおける管理装置3の動作が例示されている。工程S201では、管理装置3は、処理装置1に実シーケンスの実行を開始させうる。実シーケンスにおいて、処理装置1の制御部8は、予め設定された駆動プロファイルに従って駆動指令を発生し、該駆動指令に従ってドライバ7にステージSTを駆動させ、ステージSTの位置を制御しうる。工程S202では、管理装置3は、工程S201におけるステージSTの駆動の状態を示す駆動データを制御装置2を介して処理装置1の制御部8から取得しうる。駆動データは、例えば、駆動指令、および、センサ6の出力および減算器81の出力(制御偏差)の少なくとも1つを示すデータを含みうる。工程S203では、管理装置3は、工程S202で取得した駆動データに基づいて報酬を計算しうる。報酬は、予め定義された式に基づいて計算されうる。この式は、
図4に示される学習シーケンスの工程S104、108における報酬の計算において使用される式と同じであってもよいし、異なってもよい。例えば、学習シーケンスでは、制御偏差が閾値以下に収束するまでの時間に基づいて報酬を計算し、実シーケンスでは、制御偏差の移動平均に基づいて報酬を計算することができる。学習シーケンスでは、変化に敏感な指標を使うことで学習の精度を高め、実シーケンスでは、計算負荷が小さい式に従って報酬を計算することが有用である。
【0024】
工程S204では、管理装置3は、工程S203で計算した報酬が所定基準を満たすかどうかを判断する。そして、管理装置3は、該報酬が該所定基準を満たす場合は、工程S201に戻り、該報酬が該所定基準を満たさない場合には、工程S205に進み、工程S205において、
図4に例示される学習シーケンス(即ち、再学習)を実行する。工程S205において、学習シーケンス(再学習)を実行するタイミングとしては、次のようなタイミングを例示的に挙げることができる。
(1)第1の例では、学習シーケンスは、工程S204において報酬が所定基準を満たさないと判断された直後に実施されうる。
(2)第2の例では、現在実行中の実シーケンスの終了を待ち、次の実シーケンスの開始前(即ち、実シーケンスを実行してない期間)に、学習シーケンスが実行されうる。
(3)第3の例では、報酬が所定基準を満たさなかったことを記憶しておき、次回のメンテナンス工程において学習シーケンスが実行されうる。
【0025】
工程S205における学習シーケンスは、現在の学習済モデルを出発点として実行されうる。あるいは、工程S205における学習シーケンスは、ニューラルネットワークを初期状態または学習過程の任意の状態に戻してから実行されうる。
【0026】
以下、
図6を参照しながら上記の製造システムMSを走査露光装置500に適用した例を説明する。走査露光装置500は、スリット部材によって整形されたスリット光により基板14を走査露光するステップ・アンド・スキャン方式の露光装置である。走査露光装置500は、照明光学系23、原版ステージ機構12、投影光学系13、基板ステージ機構15、第1位置計測部17、第2位置計測部18、基板マーク計測部21、基板搬送部22および制御部25を含みうる。
【0027】
制御部25は、照明光学系23、原版ステージ機構12、投影光学系13、基板ステージ機構15、第1位置計測部17、第2位置計測部18、基板マーク計測部21、基板搬送部22を制御する。制御部25は、原版11のパターンを基板14に転写する処理を制御する。制御部25は、例えば、FPGA(Field Programmable Gate Arrayの略。)などのPLD(Programmable Logic Deviceの略。)、又は、ASIC(Application Specific Integrated Circuitの略。)、又は、プログラムが組み込まれた汎用コンピュータ、又は、これらの全部または一部の組み合わせによって構成されうる。制御部25は、
図2、
図3に記載された処理装置1における制御部8に相当しうる。
【0028】
原版ステージ機構12は、原版11を保持する原版ステージRSTと、原版ステージRSTを駆動する第1アクチュエータRACとを含みうる。基板ステージ機構15は、基板14を保持する基板ステージWSTと、基板ステージWSTを駆動する第2アクチュエータWACとを含みうる。照明光学系23は、原版11を照明する。照明光学系23は、マスクキングブレードなどの遮光部材により、光源(不図示)から射出された光を、例えばX方向に長い帯状または円弧状の形状を有するスリット光に整形し、そのスリット光で原版11の一部を照明する。原版11および基板14は、原版ステージRSTおよび基板ステージWSTによってそれぞれ保持されており、投影光学系13を介して光学的にほぼ共役な位置(投影光学系13の物体面および像面)にそれぞれ配置される。
【0029】
投影光学系13は、所定の投影倍率(例えば、1倍、1/2倍又は1/4倍)を有し、原版11のパターンをスリット光により基板14上に投影する。原版11のパターンが投影された基板14上の領域(スリット光が照射される領域)は、照射領域と呼ばれうる。原版ステージRSTおよび基板ステージWSTは、投影光学系13の光軸方向(Z方向)に直交する方向(Y方向)に移動可能に構成されている。原版ステージRSTおよび基板ステージWSTは、互いに同期しながら、投影光学系13の投影倍率に応じた速度比で相対的に走査される。これにより、照射領域に対して基板14がY方向に走査され、原版11に形成されたパターンが基板14のショット領域に転写される。そして、このような走査露光を、基板ステージWSTを移動させながら、基板14の複数のショット領域の各々について順次に行うことにより、1枚の基板14における露光処理が完了する。
【0030】
第1位置計測部17は、例えばレーザ干渉計を含み、原版ステージRSTの位置を計測する。レーザ干渉計は、例えば、レーザ光を原版ステージRSTに設けられた反射板(不図示)に向けて照射し、反射板で反射されたレーザ光と基準面で反射されたレーザ光との干渉によって原版ステージRSTの変位(基準位置からの変位)を検出する。第1位置計測部17は、当該変位に基づいて原版ステージRSTの現在位置を取得することができる。ここで、第1位置計測部17は、レーザ干渉計以外に位置計測器、例えば、エンコーダによって原版ステージRSTの位置を計測してもよい。基板マーク計測部21は、例えば、光学系および撮像素子を含み、基板14に設けられたマークの位置を検出しうる。
【0031】
第2位置計測部18は、例えばレーザ干渉計を含み、基板ステージWSTの位置を計測する。レーザ干渉計は、例えば、レーザ光を基板ステージWSTに設けられた反射板(不図示)に向けて照射し、反射板で反射されたレーザ光と基準面で反射されたレーザ光との干渉によって基板ステージWSTの変位(基準位置からの変位)を検出する。第2位置計測部18は、当該変位に基づいて基板ステージWSTの現在位置を取得することができる。ここで、第2位置計測部18は、レーザ干渉計以外に位置計測器、例えば、エンコーダによって基板ステージWSTの位置を計測してもよい。
【0032】
走査露光装置500では、原版11のパターンを基板14の目標位置に正確に転写することが求められる。そのためには、走査露光中における基板ステージWST上の基板14に対する原版ステージRST上の原版11の相対位置を正確に制御することが重要である。よって、報酬としては、原版ステージRSTと基板ステージWSTとの相対位置誤差(同期誤差)を評価する値を採用しうる。また、基板14のマークの検出精度を向上させるためには、基板ステージWSTを基板マーク計測部21の下に正確に位置決めすることが重要であるため、報酬としては、マークを撮像している間の基板ステージWSTの制御偏差を評価する値を採用しうる。また、スループットを向上させるために、基板の搬送速度を上げることが重要である。基板のロードおよびアンロードの際には、駆動完了後に基板ステージWSTおよび基板搬送部22の制御偏差が短時間で規定値以下に収束することが重要であるため、報酬としては、基板ステージWSTおよび基板搬送部22の収束時間を評価する値を採用しうる。基板ステージ機構15、原版ステージ機構12、基板搬送部22は、それぞれ原版11のパターンを基板14に転写する処理のための動作をする動作部の一例である。
【0033】
図7には、走査露光装置500の実シーケンスが例示されている。工程S301では、管理装置3は、走査露光装置500の制御部25に実シーケンス、即ち基板を処理する処理シーケンスの実行の開始を指示する。この指示に応答して、走査露光装置500は、該処理シーケンスを開始する。該処理シーケンスは、複数のサブシーケンスとして、例えば、工程S302、S303、S304、S305を含みうる。
【0034】
工程S302では、制御部25は、基板14を基板ステージWSTにロード(搬送)するように基板搬送部22を制御する。具体的には、工程S302では、制御部25は、基板14のマークが基板マーク計測部21の視野に入るように基板ステージ機構15を制御し、基板14のマークの位置が検出されるように基板マーク計測部21を制御しうる。このような動作は、基板14の複数のマークのそれぞれについて実行されうる。工程S304では、制御部25は、基板14の複数のショット領域のそれぞれに対して原版11のパターンが転写されるように基板ステージ機構15、原版ステージ機構12、照明光学系23等を制御する。工程S305では、制御部25は、基板ステージWST上の基板14をアンロード(搬送)するように基板搬送部22を制御する。工程S302、S303、S304、S305では、工程S302、S303、S304、S305における制御に関する報酬を計算するために必要な駆動データが制御部25(制御部8)から制御装置2を介して管理装置3に提供されうる。このような駆動データは、工程S305の終了後に一括して制御部25(制御部8)から制御装置2を介して管理装置3に提供されてもよい。
【0035】
工程S306では、管理装置3は、複数のサブシーケンス、即ち工程S302、S303、S304、S305のそれぞれにおける制御に関する報酬を駆動データに基づいて計算する。例えば、工程S302、S305における制御に関しては、報酬として、基板を保持する基板ステージあるいは保持部の制御偏差が規定値以下に収束するまでに要する時間を評価する値が計算されうる。工程S303における制御に関しては、報酬として、基板と原版とのアライメント誤差の計測中における基板ステージ(保持部)の制御偏差を評価する値が計算されうる。工程S304における制御に関しては、報酬として、基板の露光中における基板と原版との同期誤差を評価する値が計算されうる。
【0036】
工程S307では、管理装置3は、工程S306で計算した報酬が所定基準を満たすかどうかを判断する。そして、管理装置3は、該報酬が該所定基準を満たす場合は、
図7に示される実シーケンスを終了し、該報酬が該所定基準を満たさない場合には、工程S308に進み、工程S308において、
図4に例示される学習シーケンス(再学習)を実行する。ここで、工程S307では、管理装置3は、複数のサブシーケンス、即ち工程S302、S303、S304、S305のそれぞれについて、報酬がそれに対応する基準を満たすかどうかがを判断しうる。そして、管理装置3は、報酬が基準を満たさないサブシーケンスについて、学習シーケンスを実行するように動作しうる。あるいは、管理装置3は、複数のサブシーケンス、即ち工程S302、S303、S304、S305の少なくとも1つについて、報酬がそれに対応する基準を満たさない場合に、全てのサブシーケンスについて学習シーケンスを実行してもよい。
【0037】
計算される報酬が基板を保持する基板ステージあるいは保持部の制御偏差が規定値以下に収束するまでに要する時間を評価する値である場合、それに対応する基準も、制御偏差が規定値以下に収束するまでに要する時間として与えられる。計算される報酬が基板と原版とのアライメント誤差の計測中における基板ステージの制御偏差を評価する値である場合、それに対応する基準も、アライメント誤差の計測中における基板ステージの制御偏差として与えられうる。計算される報酬が基板の露光中における基板と原版との同期誤差を評価する値である場合、それに対応する基準も、基板の露光中における基板と原版との同期誤差で与えられうる。
【0038】
ニューラルネットワークが構成される制御対象としては、例えば、基板ステージ機構15、原版ステージ機構12、基板搬送部22等を挙げることができるが、他の構成要素にもニューラルネットワークが組み込まれてもよい。ここで、例えば、基板ステージ機構15、原版ステージ機構12、基板搬送部22等の複数の構成要素を1つのニューラルネットワークで制御してもよいし、複数の構成要素を別々のニューラルネットワークで制御してもよい。また、学習済モデルとして、搬送シーケンス、計測シーケンス、および露光シーケンスのそれぞれに対して同一の学習済モデルを用いてもよいし、別々の学習済モデルを用いてもよい。報酬の計算においては、搬送シーケンス、計測シーケンス、および露光シーケンスについて同一の計算式を用いてもよいし、別々の計算式を用いてもよい。
【0039】
図8を参照しながら報酬の計算例を説明する。
図8において、横軸は時間(time)であり、縦軸は制御対象の制御偏差(error)である。搬送シーケンスおいては、例えば、制御対象の制御偏差が閾値を下回るまでの期間における制御対象の制御偏差がカーブ50であるとすると、カーブ50が閾値54を下回るまでの期間52を報酬として採用しうる。計測シーケンスにおいては、基板のマークの位置を計測する計測期間が期間53、期間53における基板ステージWSTの制御偏差がカーブ51であるとすると、カーブ51の平均値を報酬として採用しうる。露光シーケンスにおいては、露光期間が期間53、期間53における基板ステージWSTと原版ステージRSTの同期誤差がカーブ51であるとすると、カーブ51の移動平均と移動分散を報酬として採用しうる。
【0040】
工程S308の学習を実行するタイミングは、例えば、シーケンスの実行を終了した直後、又は、ある基板に対する処理と次の基板に対する処理との間、又は、同じ原版を使う基板の処理が終わった後といったことが考えられる。あるいは、工程S308の学習は、例えば、光源の構成要素のメンテナンスと並行して実施されてもよい。
【0041】
以上では、走査露光装置500に製造システムMSを適用した例を説明したが、製造システムMSは、他のタイプの露光装置(例えば、ステッパ)に適用されてもよいし、インプリント装置等の他のタイプのリソグラフィー装置に適用されてもよい。ここで、リソグラフィー装置は、基板にパターンを形成するための装置であり、その概念には、露光装置、インプリント装置、電子線描画装置等が含まれうる。
【0042】
以下、上記のようなリソグラフィー装置を使って物品(例えば、半導体IC素子、液晶表示素子、MEMS等))を製造する物品製造方法を説明する。該物品製造方法は、リソグラフィー装置によって基板に原版のパターンを転写する転写工程と、該転写工程を経た該基板を処理する処理工程と、を含み、該処理工程を経た該基板から物品を得る方法でありうる。
【0043】
リソグラフィー装置が露光装置である場合、物品製造方法は、感光剤が塗布された基板(基板、ガラス基板等)を露光する工程と、その基板(感光剤)を現像する工程と、その現像された基板を他の周知の工程で処理する工程とを含みうる。他の周知の工程には、エッチング、レジスト剥離、ダイシング、ボンディング、パッケージング等が含まれる。本物品製造方法によれば、従来よりも高品位の物品を製造することができる。リソグラフィー装置がインプリント装置である場合、物品製造方法は、基板の上のインプリント材を型を使って成形することによって、インプリント材の硬化物からなるパターンを形成する工程と、該パターンを使って該基板を処理する工程とを含みうる。
【0044】
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。
【符号の説明】
【0045】
1:処理装置、2:制御装置、3:学習装置、5:ステージ装置、6:センサ、7:ドライバ、ST:ステージ、AC:アクチュエータ