(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-10-10
(45)【発行日】2024-10-21
(54)【発明の名称】研磨加工システム、学習装置、学習装置の学習方法
(51)【国際特許分類】
B24B 37/005 20120101AFI20241011BHJP
H01L 21/304 20060101ALI20241011BHJP
【FI】
B24B37/005 Z
H01L21/304 621D
H01L21/304 622R
(21)【出願番号】P 2019027271
(22)【出願日】2019-02-19
【審査請求日】2021-11-15
(73)【特許権者】
【識別番号】314012076
【氏名又は名称】パナソニックIPマネジメント株式会社
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】藤井 慶太郎
(72)【発明者】
【氏名】高橋 正行
【審査官】山内 康明
(56)【参考文献】
【文献】特開2018-058197(JP,A)
【文献】特開2017-030067(JP,A)
【文献】特開2012-056011(JP,A)
【文献】特開2018-200938(JP,A)
【文献】特開2015-077668(JP,A)
【文献】特開2012-074574(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
B24B 37/005
H01L 21/304
(57)【特許請求の範囲】
【請求項1】
定盤の研磨パッド上のワークに研磨ヘッドにより荷重を加え、前記研磨パッドにスラリーを供給し、前記定盤と前記研磨ヘッドをそれぞれ回転させることによって前記ワークの研磨加工を実行する研磨加工装置と、
学習装置と、から構成される研磨加工システムであって、
前記学習装置は、
前記研磨加工装置の研磨ヘッドの回転トルクの変化量データ、前記研磨ヘッドの水平荷重の変化量データ及び前記研磨ヘッドの内周側と外周側との温度差の変化量データと、第1の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第1の行動価値関数を更新し、
前記温度差の変化量データが所定の範囲内に収まると、前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データと、第2の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第2の行動価値関数を更新することで、
研磨加工における研磨条件を決定する、
研磨加工システム。
【請求項2】
前記研磨加工装置は、
前記研磨加工の実行中において研磨ヘッドの回転トルクを測定するトルク測定部を、さらに
含む、
請求項1に記載の研磨加工システム。
【請求項3】
前記研磨加工装置は、
前記研磨加工の実行中において研磨ヘッドの水平荷重を測定する荷重測定部を、さらに
含む、
請求項1または2に記載の研磨加工システム。
【請求項4】
前記研磨加工装置は、
前記研磨加工の実行中において研磨ヘッドの温度を少なくとも2点以上で測定する温度測定部を、さらに
含む、
請求項1から3のいずれか1項に記載の研磨加工システム。
【請求項5】
定盤の研磨パッド上のワークに研磨ヘッドにより荷重を加え、前記研磨パッドにスラリーを供給し、前記定盤と前記研磨ヘッドをそれぞれ回転させることによって前記ワークの研磨加工を実行する研磨加工装置の研磨ヘッドの回転トルクの変化量データ、前記研磨ヘッドの水平荷重の変化量データ及び前記研磨ヘッドの内周側と外周側との温度差の変化量データと、第1の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第1の行動価値関数を更新し、
前記温度差の変化量データが所定の範囲内に収まると、前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データと、第2の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第2の行動価値関数を更新することで、
研磨加工における研磨条件を決定する学習部を備える、
学習装置。
【請求項6】
定盤の研磨パッド上のワークに研磨ヘッドにより荷重を加え、前記研磨パッドにスラリーを供給し、前記定盤と前記研磨ヘッドをそれぞれ回転させることによって前記ワークの研磨加工を実行する研磨加工装置の研磨ヘッドの回転トルクの変化量データ、前記研磨ヘッドの水平荷重の変化量データ及び前記研磨ヘッドの内周側と外周側との温度差の変化量データと、第1の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第1の行動価値関数を更新するステップと、
前記温度差の変化量データが所定の範囲内に収まると、前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データと、第2の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第2の行動価値関数を更新するステップと、
研磨加工における研磨条件を決定するステップと、
をコンピュータが実行する学習方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、研磨加工システム、学習装置、学習方法に関する。
【背景技術】
【0002】
従来、研磨加工、中でもポリシングの一種であるCMP(Chemical Mechanical Polishing)は、一般的に定盤の上に貼り付けられた研磨パッドに対して、ワークを研磨ヘッドにより押し付けながら回転させつつ、研磨パッド上にスラリーを供給して、ワークと研磨パッド間にスラリーを介在させることでワークの研磨加工を行う機械研磨技術が知られており、主に半導体の基板部品の研磨加工工程に利用されている。
【0003】
この研磨加工工程は、スラリーの化学的な作用によりワークを易加工化し、砥粒の作用によりワークの研磨を行う工程であり、現在でも一般的にはプレストンの法則(または、プレストンの式)といった経験則による研磨レートの概算に基づきワークの研磨を行う不安定なプロセスである。
【0004】
また研磨加工工程は、ワークは常に研磨パッドと研磨ヘッドに挟まれている状態であるため、研磨中のプロセスの状態を測定することが難しいことから研磨中のフィードバック調整が困難であるとともに、研磨パッドの表面の状態変化により研磨中のプロセスの状態も変化するため、制御が難しい。
【0005】
例えば、特許文献1には、ニュートラルネットワークに研磨パッドのドレッシング条件、研磨パッドの表面性状の計測データ、研磨結果データを入力し、所定のプログラムに従って各データの相関関係を演算して学習しておく技術が開示されている。この技術によれば研磨パッドの表面をドレッシングする際の推定ドレッシング条件データが割り出され、オペレータは、割り出された推定ドレッシング条件データによりドレッシング部を駆動して研磨パッドのドレッシングを行う。
【先行技術文献】
【特許文献】
【0006】
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1の技術では、ワークの研磨加工工程の実行中に発生するリアルタイムデータに基づいて研磨加工工程の状態を評価し、この評価に基づき研磨加工工程を修正することは困難である。
【0008】
本発明の目的は、ワークの研磨中に発生するリアルタイムデータに基づいて研磨加工工程状態を評価することにより、研磨加工工程を安定化させようとするものである。
【課題を解決するための手段】
【0009】
本発明の研磨加工システムは、定盤の研磨パッド上のワークに研磨ヘッドにより荷重を加え、前記研磨パッドにスラリーを供給し、前記定盤と前記研磨ヘッドをそれぞれ回転させることによって前記ワークの研磨加工を実行する研磨加工装置と、学習装置と、から構成される研磨加工システムであって、前記学習装置は、前記研磨加工装置の研磨ヘッドの回転トルクの変化量データ、前記研磨ヘッドの水平荷重の変化量データ及び前記研磨ヘッドの内周側と外周側との温度差の変化量データと、第1の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第1の行動価値関数を更新し、前記温度差の変化量データが所定の範囲内に収まると、前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データと、第2の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第2の行動価値関数を更新することで、研磨加工における研磨条件を決定する。
【0010】
また、本発明の研磨加工システムは、前記研磨加工装置は、前記研磨加工の実行中において研磨ヘッドの回転トルクを測定するトルク測定部を、さらに含み、前記測定値は、前記研磨加工の実行中における前記研磨ヘッドの回転トルクの変化量データを含む。
【0011】
また、本発明の研磨加工システムは、前記研磨加工装置は、前記研磨加工の実行中において研磨ヘッドの水平荷重を測定する荷重測定部を、さらに含み、前記測定値は、前記研磨加工の実行中における前記研磨ヘッドの水平荷重の変化量データを含む。
【0012】
また、本発明の研磨加工システムは、前記研磨加工装置は、前記研磨加工の実行中において研磨ヘッドの温度を少なくとも2点以上で測定する温度測定部を、さらに含み、前記測定値は、前記研磨加工の実行中における前記研磨ヘッドの内周側と外周側との温度差の変化量データを含む。
【0014】
また、本発明の学習装置は、定盤の研磨パッド上のワークに研磨ヘッドにより荷重を加え、前記研磨パッドにスラリーを供給し、前記定盤と前記研磨ヘッドをそれぞれ回転させることによって前記ワークの研磨加工を実行する研磨加工装置の研磨ヘッドの回転トルクの変化量データ、前記研磨ヘッドの水平荷重の変化量データ及び前記研磨ヘッドの内周側と外周側との温度差の変化量データと、第1の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第1の行動価値関数を更新し、前記温度差の変化量データが所定の範囲内に収まると、前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データと、第2の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第2の行動価値関数を更新することで、研磨加工における研磨条件を決定する学習部を備える。
【0015】
また、本発明の学習装置の学習方法は、定盤の研磨パッド上のワークに研磨ヘッドにより荷重を加え、前記研磨パッドにスラリーを供給し、前記定盤と前記研磨ヘッドをそれぞれ回転させることによって前記ワークの研磨加工を実行する研磨加工装置の研磨ヘッドの回転トルクの変化量データ、前記研磨ヘッドの水平荷重の変化量データ及び前記研磨ヘッドの内周側と外周側との温度差の変化量データと、第1の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第1の行動価値関数を更新するステップと、前記温度差の変化量データが所定の範囲内に収まると、前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データと、第2の行動価値関数に従って前記回転トルクの変化量データ、前記水平荷重の変化量データ及び前記温度差の変化量データから決定された研磨条件とに基づき報酬を決定し、前記報酬に従って前記第2の行動価値関数を更新するステップと、研磨加工における研磨条件を決定するステップと、をコンピュータが実行する。
【発明の効果】
【0016】
本発明によれば、ワークの研磨中に発生するリアルタイムデータに基づいて研磨加工工程状態を評価することができるため、これにより研磨加工工程を安定化させることが可能である。
【図面の簡単な説明】
【0017】
【
図1】本発明の実施形態に係る研磨加工システムの構成を示す図である。
【
図2】本発明の実施形態に係る研磨中における研磨ヘッドの回転トルクと研磨時間との関係を示すグラフである。
【
図3】本発明の実施形態に係る研磨中の研磨ヘッドにかかる水平荷重と研磨時間との関係を示すグラフである。
【
図4】本発明の実施形態に係る研磨中の研磨ヘッドの内周側と外周側との温度差と研磨時間との関係を示すグラフである。
【
図5】本発明の実施形態に係るワークの外周側と中心側との摩擦距離差と、定盤と研磨ヘッドの回転数差との関係を示すグラフである。
【
図6】本発明の実施形態に係る学習処理の概要を示す図である。
【
図7】本発明の実施形態に係る前半学習処理を示すフローチャートである。
【
図8】本発明の実施形態に係る後半学習処理を示すフローチャートである。
【発明を実施するための形態】
【0018】
以下、本発明の実施形態について、図面を参照しながら説明する。
【0019】
(研磨加工システムについて)
図1は、本発明の実施形態に係る研磨加工システムの構成を示す図である。
【0020】
研磨加工システム1は、ワークの研磨加工を実行する研磨加工装置10と、研磨加工装置10からの状態変数により強化学習を実行する学習装置20と、から構成される。
【0021】
なお、
図1および以下の説明において、入出力インタフェース等についての図示、説明は省略する。
【0022】
(研磨加工装置について)
研磨加工装置10は、研磨処理部11、研磨条件設定部12、測定部13、状態演算部14および状態変数記憶部15から構成される。
【0023】
研磨処理部11は、ワーク表面の化学機械研磨(以下、研磨という)を実行するためのものあって、既に公知の技術であるため詳細な説明は省略する。
【0024】
研磨処理部11には、ワーク表面を研磨中の研磨ヘッドの回転トルクを検出するためのトルク検出センサ(図示なし)、ワーク表面を研磨中の研磨ヘッドにかかる水平方向の荷重を検出するための荷重検出センサ(図示なし)、ワーク表面を研磨中の研磨ヘッドの内周側の温度を検出するための第1温度検出センサ(図示なし)、ワーク表面を研磨中の研磨ヘッドの外周側の温度を検出するための第2温度検出センサ(図示なし)、定番の回転数を検出するための第1回転数検出センサ(図示なし)、研磨ヘッドの回転数を検出するための第2回転数検出センサ(図示なし)等が設けられており、これらの各センサにより検出された検出データは測定部13に入力される。
【0025】
また研磨処理部11からは測定部13に対して、研磨開始を示す研磨開始データ、研磨終了を示す研磨終了データ、スラリーの温度データ、研磨パッド等の各種パーツが交換されたことを示すパーツ交換データ、研磨ヘッド研磨処理部11にて発生した各種エラーを示すエラーデータ等の各種データが送信される。
【0026】
研磨条件設定部12は、研磨対象となるワークについての研磨条件データを、研磨処理部11に設定するためのものである。また、研磨処理部11に設定した研磨条件データを状態変数記憶部15に出力する。
【0027】
研磨条件設定部12から研磨処理部11に設定される研磨条件データとしては、例えば、定番回転数、研磨ヘッド回転数、スラリー温度、ドレッシングの有無等がある。なお、ワークの研磨条件データは、オペレータもしくは図示しない研磨加工システム集中管理コンピュータ等により入力されることによって設定される。
【0028】
測定部13は、研磨実行中の研磨処理部11についての各種測定を実行するためのものである。
【0029】
測定部13は上述した各検出センサからの検出データと各種データを受信する。測定部13は、トルク測定部の一例であるトルク検出センサにより検出されたトルクデータを受信することにより、ワーク表面の研磨開始から研磨終了までにおける研磨ヘッドの回転トルクを単位時間毎に測定する。また測定部13は、荷重測定部の一例である荷重検出センサにより検出された荷重データを受信することにより、ワーク表面の研磨開始から研磨終了までにおける研磨ヘッドにかかる水平方向の荷重を単位時間毎に測定する。測定された回転トルクを示す回転トルクデータと水平方向の荷重を示す水平荷重データは状態演算部14に送信される。
【0030】
また測定部13は、温度測定部の一例である第1温度検出センサにより検出された研磨ヘッドの内周側温度データと第2温度検出センサにより検出された研磨ヘッドの外周側温度データとを受信することにより、ワーク表面の研磨開始から研磨終了までにおける経過時間に対する内周側温度と外周側温度とを単位時間毎に測定する。測定された内周側温度を示す内周側温度データと外周側温度を示す外周側温度データは状態演算部14に送信される。
【0031】
また測定部13は、時間測定部の一例である。測定部13は、研磨パッドが交換されたことを示す交換データを受信することより交換前の研磨パッドに対する使用累積時間をリセットし、新たな研磨パッドによる使用累積時間を測定(計時)する。測定された使用累積時間を示す使用累積時間データは状態演算部14に送信される。
【0032】
また測定部13は、第1回転数検出センサにより検出された定番の回転数データと第2回転数検出センサにより検出された研磨ヘッドの回転数データとを受信することにより、研磨中における定番の回転数と研磨ヘッドの回転数とを単位時間毎に測定する。測定された定番の回転数を示す定番回転数データと研磨ヘッドの回転数を示す研磨ヘッド回転数データは状態演算部14に送信される。
【0033】
状態演算部14は、上述した測定部13から各種測定データを受信し、設定時間(例えば、
図6にて後述するサンプル加工時間)内における各種変化量を更新するために演算する。演算された変化量は変化量データとして状態変数記憶部15に出力され、状態変数記憶部15に状態変数として記憶される。
【0034】
状態演算部14は、回転トルクデータを受信すると、設定時間内における研磨ヘッドの回転トルクの変化量を演算する。また、水平荷重データを受信すると、設定時間内における研磨ヘッドの水平荷重の変化量を演算する。また、内周側温度データと外周側温度データとを受信すると、設定時間内における研磨ヘッドの内周側と外周側との温度差の変化量を演算する。演算された各変化量を変化量データとして状態変数記憶部15に出力する。
【0035】
状態変数記憶部15は、上述した状態演算部14から出力された研磨ヘッドの回転トルクの変化量データ、研磨ヘッドの水平荷重の変化量データ、研磨ヘッドの内周側と外周側との温度差の変化量データ等と、上述した研磨条件設定部12から出力された研磨条件データ(定番回転数、研磨ヘッド回転数、研磨荷重、スラリー温度、スラリーpH、スラリー流量、加工時間、研磨パッドの種類、ドレッシングの有無等)を状態変数(状態データ)として記憶する。なお、状態変数記憶部15は新たな状態変数を受信した場合、受信した状態変数を学習装置20に送信する。送信された状態変数は学習装置20の状態変数入力部21により受信される。
【0036】
研磨加工装置10に含まれるそれぞれの構成は、独立して存在していても良く、その場合は無線又は有線によって接続され、データ等のやり取りを行うことが好ましい。例えば、研磨処理部11は一般的な化学機械研磨を行う装置であり、研磨条件設定部12はタッチパネルやキーボード等の入力機能を有する装置であり、状態演算部14や状態変数記憶部15はCPUを有するコンピュータである。
【0037】
(学習装置について)
学習装置20は、状態変数入力部21および学習部22から構成される。
【0038】
状態変数入力部21は、上述した状態変数記憶部15から送信された状態変数を受信し、学習部22に送信する。
【0039】
学習部22は、状態変数履歴記憶部23、学習処理部24および修正研磨条件決定部25から構成される。
【0040】
状態変数履歴記憶部23は、上述した状態変数入力部21から送信された状態変数を、状態変数の履歴データとして記憶する。各状態変数(研磨ヘッドの回転トルクの変化量データ、研磨ヘッドの水平荷重の変化量データ、研磨ヘッドの内周側と外周側との温度差の変化量データ、定番回転数、研磨ヘッド回転数、スラリー温度、ドレッシングの有無等)は受信日時と対応付けられて記憶される。
【0041】
学習処理部24は、上述した状態変数履歴記憶部23に記憶された状態変数の履歴データを適宜用いて、Q学習の手法により行動価値関数を最適化するために更新する。なお、学習処理部23が実行する学習処理についての説明は、
図6、
図7、
図8を用いて後述する。
【0042】
修正研磨条件決定部25は、上述した状態変数入力部21から送信された状態変数と、学習処理部24より最適化された行動価値関数に基づいて、現在の研磨条件を修正するための条件である修正研磨条件を決定する。修正研磨条件決定部25には、修正研磨条件を決定するための条件修正モデルが登録されており、上述した学習処理部24によって最適化された行動価値関数を適用することにより、精度の高い修正研磨条件を決定することができる。決定した修正研磨条件は、上述した研磨加工装置10の研磨処理部11に送信される。
【0043】
ここで、本実施形態に係る研磨加工システムにおいて、上述した状態変数として、研磨ヘッドの回転トルクの変化量、研磨ヘッドの水平荷重の変化量、研磨ヘッドの内周側と外周側との温度差の変化量を扱う根拠を
図2~
図5を用いて説明する。
【0044】
(研磨ヘッドの回転トルクと研磨時間との関係)
図2は、ワーク表面を研磨中の研磨ヘッドの回転トルクと研磨時間との関係を示すグラフである。
【0045】
図2(a)は研磨パッドに目詰まりが生じた場合を示すグラフであり、
図2(b)は研磨パッドに目つぶれが生じた場合を示すグラフである。
【0046】
一般的に、研磨パッドに目詰まりが生じた場合や目つぶれが生じた場合には、研磨パッドとワークとの間の摩擦係数が正常状態と比べて変化するため、これにより研磨ヘッドの回転トルクが変化することが知られている。
【0047】
まず
図2(a)を参照し研磨パッドに目詰まりが生じた場合について説明する。
図2(a)に示すように研磨パッドに目詰まりが生じた場合、研磨ヘッドの回転トルクは(ア)から(イ)の時間経過の範囲では正常回転トルク(正常回転トルク範囲)の値であるが、時間(イ)以降では回転トルクは徐々に増加していく。これは研磨パッドに生じた目詰まりが研磨ヘッドの回転に対して抵抗として作用することにより、ワーク表面と研磨パッドとの間の摩擦係数が増加していくためである。
【0048】
次に
図2(b)を参照し研磨パッドに目つぶれが生じた場合について説明する。
図2(b)に示すように研磨パッドに目つぶれが生じた場合、研磨ヘッドの回転トルクは(ウ)から(エ)の時間経過の範囲では正常回転トルク(正常回転トルク範囲)の値であるが、時間(エ)以降では回転トルクは徐々に減少していく。これは研磨パッドに生じた目つぶれによりワーク表面と研磨パッドとの間の接触面積が減少することにより、ワーク表面と研磨パッドとの間の摩擦係数が減少していくためである。
【0049】
このように、ワーク表面を研磨中の研磨ヘッドの回転トルクに変化があった場合は、研磨パッドに目詰まり或いは目つぶれが発生している可能性が高い。よって、本実施形態においては研磨ヘッドの回転トルクの変化量を評価した評価結果を直ちに研磨加工装置10の研磨処理部11にフィードバック送信するようにしている。なお、研磨パッドに目詰まり或いは目つぶれが発生している場合、これを解決する方法としては研磨パッドのドレッシングを行うことである。
【0050】
(研磨ヘッドにかかる水平荷重と研磨時間との関係)
図3は、ワーク表面を研磨中の研磨ヘッドにかかる水平荷重と研磨時間との関係を示すグラフである。
【0051】
図3(a)は研磨パッドに目詰まりが生じた場合を示すグラフであり、
図3(b)は研磨パッドに目つぶれが生じた場合を示すグラフである。
【0052】
一般的に、研磨パッドに目詰まりが生じた場合や目つぶれが生じた場合には、研磨パッドとワークとの間の摩擦係数が正常状態と比べて変化するため、これにより研磨ヘッドの水平荷重が変化することが知られている。
【0053】
まず
図3(a)を参照し、研磨パッドに目詰まりが生じた場合について説明する。
図3(a)に示すように研磨パッドに目詰まりが生じた場合、研磨ヘッドにかかる水平荷重は正常荷重(正常荷重範囲)の値である(ア)から(イ)以降のように水平荷重は増加していく。これは研磨パッドに生じた目詰まりが研磨ヘッドの回転に対して抵抗として作用することにより、ワーク表面と研磨パッドとの間の摩擦係数が増加していくためである。
【0054】
次に
図3(b)を参照し研磨パッドに目つぶれが生じた場合について説明する。
図3(b)に示すように研磨パッドに目つぶれが生じた場合、研磨ヘッドにかかる水平荷重は正常荷重(正常荷重範囲)の値である(ウ)から(エ)以降のように回転トルクは減少していく。これは研磨パッドに生じた目つぶれによりワーク表面と研磨パッドとの間の接触面積が減少することにより、ワーク表面と研磨パッドとの間の摩擦係数が減少していくためである。
【0055】
このように、ワーク表面を研磨中の研磨ヘッドにかかる水平荷重に変化があった場合は、研磨パッドに目詰まり或いは目つぶれが発生している可能性が高い。よって、本実施形態においては研磨ヘッドにかかる水平荷重の変化量を評価した評価結果を直ちに研磨加工装置10の研磨処理部11にフィードバック送信するようにしている。なお、研磨パッドに目詰まり或いは目つぶれが発生している場合、これを解決する方法としては研磨パッドのドレッシングを行うことである。
【0056】
(研磨ヘッドの内周側と外周側との温度差と研磨時間との関係)
図4は、ワーク表面を研磨中の研磨ヘッドの内周側と外周側との温度差と研磨時間との関係を示すグラフである。
【0057】
元来研磨は、厚みばらつきがあるワークを平坦化することが目的である。通常はワークにかかる圧力は、ワークの厚みが薄い個所よりも厚い箇所のほうがかかる圧力が高くなるため早く研磨される。つまり研磨加工工程は、ワークの厚みばらつきに対応して自動的に平坦化がなされるはずのプロセスである。しかしながら、現実にはそのようにはいかず、研磨加工工程に工夫を凝らして平坦化を実現している。
【0058】
そこで、本実施形態では研磨加工工程を、積極的にワークの厚い箇所を除去する粗加工域(粗加工プロセス)と、ワークの厚みばらつきに起因する圧力分布により平坦化を行う仕上げ加工域(仕上げ加工プロセズ)の2つのプロセスに分割することにより、研磨時間の短縮と高平坦化を実現するようにした。
【0059】
ここで研磨加工工程を、粗加工プロセスと仕上げ加工プロセスの2つのプロセスに分割することを実現するために、研磨レートの圧力分布とワークの厚みばらつきを評価する方法を考える。プレストンの法則より、研磨レートはワークにかかる圧力と、ワークと研磨パッドとの間の相対速度に比例すると考えられている。その中でも研磨中に大きく変化するパラメータは、ワークの厚みばらつきによって変化するワークにかかる圧力である。
【0060】
一方で、研磨中に生じる加工熱は、大きく分けて研磨パッドとワークとの間の摩擦によって生じる熱と、スラリーとワークとの化学反応によって生じる熱の2つ種類があり、中でも摩擦による摩擦熱が多くを占めている。摩擦熱は摩擦係数、圧力、相対速度、摺動時間に比例して高くなるが、これらのパラメータの中で研磨中に大きく変化するパラメータは上述の通り圧力である。
【0061】
よって研磨中に生じる加工熱は、加工熱の伝播先である研磨ヘッドの内周側と外周側との温度差の変化を評価することによって、研磨レートの圧力分布とワークの厚みばらつき変化を評価することができる。
【0062】
図4を参照し、粗加工域における研磨開始から間もない時間である(ア)においては、ワークの厚みばらつきが大きいことに起因する圧力分布の大きさにより、研磨ヘッドの内周側と外周側との間の温度差が大きくなる。研磨加工条件を大きく変更しない限りこの温度差はワークの厚みばらつきの変化に応じて変化していく。ワーク表面が平坦になるにしたがい研磨ヘッドの内周側と外周側との間の温度差は小さくなっていく。よって、温度差の変化が収束した時間である(イ)においては圧力分布の変化が収束していること、すなわちワークがある程度平坦化されたことを示しているため粗加工域が終了したことになる。つまり粗加工域では、研磨ヘッドの内周側と外周側との間の温度差を早く収束させることで研磨時間の短縮化が実現できる。
【0063】
温度差の変化が収束した時間である(イ)以降は仕上げ加工域であり、基本的には温度差が0で一定となる研磨加工を行いワークの厚みばらつきによる自動的な平坦化がなされることが理想である。しかしながら、研磨パッド上に供給されたスラリーはワークの外周側から流入しワークの中心側に向かうため、スラリーによる冷却効果が表面で不均一となりワーク表面にて温度分布が発生する。研磨レートは温度の影響も受け、温度が高いほど研磨レートも増加するため、ワークの外周側と中心側とにおいて研磨レートに分布が生じる。また、一方でワーク表面の加工温度が研磨ヘッドに伝わるまでに研磨パッドを介するため、研磨ヘッドの温度分布を均一にしたとしてもワーク表面の温度分布が均一になるとは限らない。
【0064】
そこで、研磨ヘッドの内周側と外周側との温度差をワークの平坦化に最適となる温度差Tsを設定し、(ウ)以降は研磨ヘッドの温度差をTs付近に維持することによってワークの高平坦化が実現できる。
【0065】
(ワークの外周側と中心側との摩擦距離差と、定盤と研磨ヘッドの回転数差との関係)
図5は、ワークの外周側と中心側との摩擦距離(相対速度の時間積分値)の差と、定盤と研磨ヘッドの回転数の差との関係を示すグラフである。
【0066】
上述した研磨ヘッドの内周側と外周側との温度差を評価することで研磨時間の短縮化とワークの高平坦化を実現するためには、ワーク表面の温度分布を制御する方法が必要であり、以下において説明を行う。
【0067】
ワーク表面の温度分布を制御する方法としては定盤と研磨ヘッドとの回転数に差を設けることが挙げられる。
図5は定盤と研磨ヘッドとの回転数に回転数差を設定することによって、定盤と研磨ヘッドとの相対速度を時間積分した摩擦距離がワーク表面内において分布を持つことを示している。摩擦熱は相対速度と摺動時間に比例するためワーク表面に摩擦距離の分布を持たせることで、ワーク表面に温度分布を生じさせることができる。また、同じ回転数差であっても、定番または研磨ヘッドのいずれかの回転数を変更(ここでは、定盤の回転数を変更)することによって、
図5の実線と点線が示す違いのように摩擦距離差の量が変化する。
【0068】
逆に、ワーク表面の温度分布を均一にしたい場合、定盤と研磨ヘッドの回転数を同一にすることで、摩擦距離分布は均一となり加工熱に起因するワーク表面内の温度分布は均一化される。
【0069】
また、ワーク表面の温度分布は供給するスラリーの温度によっても制御することができる。上述したようにスラリーはワークの外周側から流入し中心付近に向かうため、スラリーの温度を低くすることでワークの外周側の温度を低下させることができ、スラリーの温度を高くすることでワーク外周側の温度低下を抑えることができる。
【0070】
以上のことから、本実施形態の研磨加工システムでは、状態変数として、研磨ヘッドの回転トルクの変化量データ、研磨ヘッドの水平荷重の変化量データ、研磨ヘッドの内周側と外周側との温度差の変化量データを用いることにより、研磨加工工程における研磨時間の短縮化と高平坦化を実現する。その際においては、リアルタイムに状態変数から評価を行って評価結果をフィードバックする必要があるため、条件修正モデルの学習方法は強化学習の手法が望ましい。そこで、学習部22における条件修正モデルの学習処理について説明する。
【0071】
(学習処理の概要)
図6は、学習装置20の学習部22における学習処理の概要を示す図である。
【0072】
学習処理は、上述した学習部22にて実行される。学習部22が実行する学習処理は強化学習の手法を用いており、最適な行動価値関数Q(s,a)を学習する。sは状態を示すパラメータであって上述した状態変数であり、aは行動を示すパラメータであって上述した修正研磨条件決定部25から研磨加工装置10にフィードバック送信される修正研磨条件である。状態変数の各値のふるまいによって望ましい結果が得られた場合には報酬rが与えられる。
【0073】
学習処理は、上述した
図4の粗加工域における前半学習処理と、仕上げ加工域における後半学習処理の2つの学習処理に分かれている。前半学習処理と後半学習処理とでは、それぞれ報酬rの与え方が異なっており、前半学習処理では最適な行動価値関数Q
1(s,a)を求め、後半学習処理では最適な行動価値関数Q
2(s,a)を求める。
【0074】
学習処理においては、サンプリング時間内における研磨ヘッドの内周側と外周側との温度差Tsの変化量が、予め設定された0付近の範囲内に収まった場合、前半学習処理から後半学習処理に切り替わる。なお、ここでのサンプリング時間は、この時間内で研磨加工工程を評価する必要がため十分な時間が必要であり、例えば、総研磨時間の10分の1ほどが望ましい。
【0075】
(前半学習処理)
図7は、上述した学習部22の学習処理部24において実行されるワーク研磨中の前半学習処理のフローチャートである。
【0076】
まずステップS1において学習処理部24は、0以上1以下の値であるεを用いて1-εの確率により行動価値関数に基づいて複数の研磨条件のうち少なくとも1つを選択し、その値の増減または維持する。そして、残りのεの確率でランダムに研磨条件の選定および値の変更を行う。ただし、ここでは研磨条件のうちスラリー温度の変更は不可とする。これは後述するステップS2の処理に用いる研磨ヘッドの内周側と外周側との温度差を、可能な限りワークの厚みのバラつきによるものにするためである。
【0077】
次にステップS2において学習処理部24は、ステップS1の処理を実行してからのサンプリング時間となるまでの間に、状態変数のうち、研磨ヘッドの内周側と外周側との温度差の変化量データの累積値を評価し、温度差の累積減少量が予め設定された基準値よりも増加していると判断した場合、ステップS3に処理を進める一方、温度差の累積減少量が予め設定された基準値よりも増加していないと判断した場合、ステップS8に処理を進める。
【0078】
次にステップS3において学習処理部24は、報酬rを増加させる。
【0079】
次にステップS4において学習処理部24は、ステップS1を実行してからサンプリング時間が経過するまでの間に、状態変数のうち、研磨ヘッドの回転トルクの変化量データの最大値とその平均値を評価し、それぞれの値が予め設定された基準値に対して一定の範囲内にあると判断した場合、ステップS5に処理を進める一方、研磨ヘッドの回転トルクの変化量データの最大値とその平均値が予め設定された基準値に対して一定の範囲内にないと判断した場合、ステップS8に処理を進める。
【0080】
次にステップS5において学習処理部24は、報酬rを増加させる。
【0081】
次にステップS6において学習処理部24は、ステップS1を実行してからサンプリング時間が経過するまでの間に、状態変数のうち、研磨ヘッドの水平荷重の変化量データの最大値とその平均値を評価し、それぞれの値が予め設定された基準値に対して一定の範囲内にあると判断した場合、ステップS7処理を進める一方、研磨ヘッドの水平荷重の変化量データの最大値とその平均値が予め設定された基準値に対して一定の範囲内にないと判断した場合、ステップS8に処理を進める。
【0082】
次にステップS7において学習処理部24は、報酬rを増加させる。
【0083】
次にステップS8において学習処理部24は、報酬rを減少(または維持)させる。
【0084】
次にステップS9において学習処理部24は、Q学習の手法により行動価値関数Q1(s,a)の更新を行う。行動価値関数は行動aの動機となる関数であるため、最適化された行動価値関数によって最適な行動a、すなわち最適な修正研磨条件を得ることができる。Q学習は行動価値関数の最適化方法の1つであり、次の(式1)によって更新される。
【0085】
【0086】
ここで、stは時刻tにおける状態sであり、atは時刻tにおける行動aである。行動atにより次の状態st+1と移り、そこでの報酬rt+1が求められる。αは0以上1以下の学習率と呼ばれるパラメータであり、γは0以上1以下の割引率と呼ばれるパラメータである。maxの付いた項は次の状態における最大となる行動価値関数であり、この項と報酬の項により行動価値関数の最適化が進む。
【0087】
以上の前半学習処理を学習処理部24が繰り返し実行することによって行動価値関数は最適化されていき、報酬rが最大となるように行動aがなされることになる。よって、修正研磨条件決定部25は、状態変数と前半学習処理部より最適化された行動価値関数に基づいて、現在の研磨条件を修正するための条件である修正研磨条件を決定することができる。
【0088】
なお、上述したステップS2、S4、S6の各判定処理は、少なくともいずれかの判定処理のうち1つの判定処理さえ実行すれば、それ以外の判定処理を省略してもよい。また、判定処理を省略する場合、その判定処理の結果による報酬の増加処理や減少処理も省略してもよい。
【0089】
(後半学習処理)
図8は、上述した学習部22の学習処理部24において実行されるワーク研磨中の後半学習処理のフローチャートである。基本的には
図7に示した前半学習処理と同じフローチャートであって、
図7と異なる点はステップS12の処理における判定条件である。なお、以下の説明では
図7と同様の処理を実行する処理ステップについての説明は省略する。
【0090】
まず学習処理部24は、ステップS11の処理を実行する。本処理は、上述したステップS1と同様の処理である。
【0091】
次にステップS12において学習処理部24は、ステップS11の処理を実行してからのサンプリング時間となるまでの間に、状態変数のうち、研磨ヘッドの内周側と外周側との温度差の変化量データの累積値を評価し、その温度差が予め設定された基準範囲内にあると判断した場合、ステップS13に処理を進める一方、その温度差が予め設定された基準範囲にないと判断した場合、ステップS18に処理を進める。
【0092】
次に学習処理部24は、ステップS13の処理を実行する。本処理は、上述したステップS3と同様の処理である。
【0093】
次に学習処理部24は、ステップS14の処理を実行する。本処理は、上述したステップS4と同様の処理である。
【0094】
次に学習処理部24は、ステップS15の処理を実行する。本処理は、上述したステップS5と同様の処理である。
【0095】
次に学習処理部24は、ステップS16の処理を実行する。本処理は、上述したステップS6と同様の処理である。
【0096】
次に学習処理部24は、ステップS17の処理を実行する。本処理は、上述したステップS7と同様の処理である。
【0097】
次に学習処理部24は、ステップS18の処理を実行する。本処理は、上述したステップS8と同様の処理である。
【0098】
次にステップS19において学習処理部24は、Q学習の手法により行動価値関数Q2(s,a)の更新を行う。本処理は、上述したステップS9と同様の処理である。
【0099】
以上の後半学習処理を学習処理部24が繰り返し実行することによって行動価値関数は最適化されていき、報酬rが最大となるように行動aがなされることになる。よって、修正研磨条件決定部25は、状態変数と後半学習処理部より最適化された行動価値関数に基づいて、現在の研磨条件を修正するための条件である修正研磨条件を決定することができる。
【0100】
なお、上述したステップS12、S14およびS16の各判定処理は、少なくともいずれかの判定処理のうち1つの判定処理さえ実行すれば、それ以外の判定処理を省略してもよい。また、判定処理を省略する場合、その判定処理の結果による報酬の増加処理や減少処理も省略してもよい。
【産業上の利用可能性】
【0101】
本発明によれば、研磨加工工程における各測定データと研磨条件とから求められた修正研磨条件をリアルタイムに研磨加工装置にフィードバックすることができる。また、学習部22により研磨条件の修正を行うための行動価値関数の最適化がなされるため、リアルタイムで安定した研磨加工工程を実現できる。
【符号の説明】
【0102】
1 研磨加工システム
10 研磨加工装置
11 研磨処理部
12 研磨条件設定部
13 測定部
14 状態演算部
15 状態変数記憶部
20 学習装置
21 状態変数入力部
22 学習部
23 状態変数履歴記憶部
24 学習処理部
25 修正研磨条件決定部