(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-03-31
(45)【発行日】2023-04-10
(54)【発明の名称】半導体試料の欠陥の分類
(51)【国際特許分類】
H01L 21/66 20060101AFI20230403BHJP
G01N 21/956 20060101ALI20230403BHJP
G06T 7/00 20170101ALI20230403BHJP
G06T 1/00 20060101ALI20230403BHJP
【FI】
H01L21/66 J
G01N21/956 A
G06T7/00 610B
G06T7/00 350B
G06T1/00 305A
(21)【出願番号】P 2021524054
(86)(22)【出願日】2019-11-24
(86)【国際出願番号】 IL2019051284
(87)【国際公開番号】W WO2020129041
(87)【国際公開日】2020-06-25
【審査請求日】2022-08-19
(32)【優先日】2018-12-20
(33)【優先権主張国・地域又は機関】US
【早期審査対象出願】
(73)【特許権者】
【識別番号】504144253
【氏名又は名称】アプライド マテリアルズ イスラエル リミテッド
(74)【代理人】
【識別番号】100094569
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100067013
【氏名又は名称】大塚 文昭
(74)【代理人】
【識別番号】100086771
【氏名又は名称】西島 孝喜
(74)【代理人】
【識別番号】100109335
【氏名又は名称】上杉 浩
(74)【代理人】
【識別番号】100120525
【氏名又は名称】近藤 直樹
(74)【代理人】
【識別番号】100139712
【氏名又は名称】那須 威夫
(74)【代理人】
【識別番号】100176418
【氏名又は名称】工藤 嘉晃
(72)【発明者】
【氏名】アズバッグ アッサフ
(72)【発明者】
【氏名】コーエン ボアズ
(72)【発明者】
【氏名】ガン-オール シラン
【審査官】安田 雅彦
(56)【参考文献】
【文献】米国特許出願公開第2015/0088791(US,A1)
【文献】米国特許出願公開第2016/0328837(US,A1)
【文献】特開2003-331253(JP,A)
【文献】国際公開第2018/134290(WO,A1)
【文献】特開2004-295879(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
H01L 21/66
G01N 21/88-21/958
G06T 7/00
G06T 1/00
(57)【特許請求の範囲】
【請求項1】
半導体試料の欠陥を複数のクラスに分類することができるシステムであって、前記システムが、
第1の分類器によってマジョリティクラスに分類された複数の欠陥を受け取ることであり、前記複数の欠陥からの各欠陥は、複数の属性の
セットにおける各属性の値と関連づけられ、前記複数の欠陥からの1つまたは複数の欠陥が、前記1つまたは複数の欠陥のグランドトゥルースを示すマイノリティクラスに属し、前記複数の欠陥からの前記欠陥の少なくとも一部が、前記欠陥の少なくとも一部のグランドトゥルースを示す前記マジョリティクラスに属する、受け取ることと、
前記複数の属性の
セットからサブセットを選択し、前記サブセットの属性ごとの区別要因を定義することであり、その結果、第2の分類器が、前記サブセットに従って欠陥を分類するように構成され、それぞれの属性ごとの前記区別要因が、前記複数の欠陥からの少なくとも事前定義された一部の欠陥を前記マイノリティクラスおよび前記マジョリティクラスに正しく分類する、定義することと、
一時的訓練セットを生成することであり、前記一時的訓練セットが、前記マジョリティクラスに正しく分類された前記複数の欠陥からの前記欠陥の少なくとも一部、前記マイノリティクラスに属するが、前記マジョリティクラスに誤って分類された前記複数の欠陥からの前記欠陥の少なくとも一部、および前記第2の分類器が追加の欠陥を前記マイノリティクラスに分類するように前記サブセットの属性値を有する前記追加の欠陥を含む、生成することと、
前記サブセットの第1の値によって特徴づけられる欠陥が前記マジョリティクラスに属するという信頼性レベルを取得するように構成されたエンジンを訓練することであり、前記訓練することが、前記一時的訓練セット、前記サブセット、および前記サブセットの属性ごとの前記区別要因を使用して実行される、訓練することと、
前記マジョリティクラスに分類される
複数の潜在的な欠陥からの各所与の潜在的な欠陥に前記エンジンを適用し、前記マジョリティクラスに属する前記所与の潜在的な欠陥の信頼性レベルを取得することと、
前記
複数の潜在的な欠陥から
、所定の閾値よりも低い信頼性レベルをそれぞれ有する1つまたは複数の潜在的な欠陥を出力することであり、前記1つまたは複数の潜在的な欠陥が、前記マジョリティクラスに誤って分類され、かつ前記マイノリティクラスに属する確率がより高いと仮定される、出力することと
を行うように構成されるプロセッシングおよびメモリ回路(PMC)を備える、システム。
【請求項2】
前記PMCが、前記第2の分類器によって前記マイノリティクラスに分類可能な前記追加の欠陥を生成するようにさらに構成される、請求項1に記載のシステム。
【請求項3】
前記追加の欠陥のうちの少なくとも1つが、複数の値に基づいて生成された合成欠陥であり、各値が、前記サブセットの属性ごとの区別要因に従って前記サブセットからの属性に関連づけられる、請求項1に記載のシステム。
【請求項4】
属性に割り当てられた前記複数の値からの値が、前記マイノリティクラスに属する第1の欠陥の前記属性の第2の値と、前記第1の欠陥に隣接し、かつ前記マジョリティクラスに属する第2の欠陥の前記属性の第3の値との間の値として決定される、請求項3に記載のシステム。
【請求項5】
属性に割り当てられた前記複数の値からの値が、前記マイノリティクラスに属する第1の欠陥の前記属性の
値に比較的近いと決定される、請求項3に記載のシステム。
【請求項6】
前記PMCが、
前記出力された潜在的な欠陥の少なくとも一部を前記マイノリティクラスに属するものとして識別することと、
前記複数の欠陥の中からの、前記マイノリティクラスに属する
少なくともいくつかの欠陥、
前記複数の欠陥の中からの、前記マジョリティクラスに属する
少なくともいくつかの欠陥、および前記出力された潜在的な欠陥の一部を含む訓練セットで前記第1の分類器を訓練することによって、前記第1の分類器を更新することと、
前記複数の欠陥に含まれ
ない、前記マジョリティクラスに
属するものとして前記第1の分類器によって分類され、前記エンジンが前記所定の閾値未満の信頼性レベルを取得する追加の欠陥を出力することと
を行うようにさらに構成される、請求項1に記載のシステム。
【請求項7】
前記エンジンが、ツリーアンサンブルを含む、請求項1に記載のシステム。
【請求項8】
前記区別要因が、値の範囲からの
カットオフポイントの値である、請求項1に記載のシステム。
【請求項9】
前記区別要因が、離散値の集合からの1つまたは複数の値を含む、請求項1に記載のシステム。
【請求項10】
半導体資料の欠陥を複数のクラスに分類する方法であって、前記方法が、メモリとプロセッサとを含むコンピューティングプラットフォームによって実行され、前記方法が、
第1の分類器によってマジョリティクラスに分類された複数の欠陥を受け取ることであり、前記複数の欠陥からの各欠陥は、複数の属性の
セットにおける各属性の値と関連づけられ、前記複数の欠陥からの1つまたは複数の欠陥が、前記1つまたは複数の欠陥のグランドトゥルースを示すマイノリティクラスに属し、前記複数の潜在的な欠陥からの前記欠陥の少なくとも一部が、前記欠陥の少なくとも一部のグランドトゥルースを示す前記マジョリティクラスに属する、受け取ることと、
前記複数の属性の
セットからサブセットを
選択し、前記サブセットの属性ごとの区別要因を定義することであり、その結果、第2の分類器が、前記サブセットに従って欠陥を分類するように構成され、それぞれの属性ごとの前記区別要因が、前記複数の欠陥からの少なくとも事前定義された一部の欠陥を前記マイノリティクラスおよび前記マジョリティクラスに正しく分類する、定義することと、
一時的訓練セットを
生成することであり、前記一時的訓練セットが、前記マジョリティクラスに正しく分類された前記複数の欠陥からの前記欠陥の少なくとも一部、前記マイノリティクラスに属するが、前記マジョリティクラスに誤って分類された前記複数の欠陥からの前記欠陥の少なくとも一部、および前記第2の分類器が追加の欠陥を前記マイノリティクラスに分類するように前記サブセットの属性値を有する前記追加の欠陥を含む、生成することと、
前記サブセットの第1の値によって特徴づけられる欠陥が前記マジョリティクラスに属するという信頼性レベルを取得するように構成されたエンジンを
訓練することであり、前記訓練することが、前記一時的訓練セット、前記サブセット、および前記サブセットの属性ごとの前記区別要因を使用して実行される、訓練することと、
前記マジョリティクラスに分類される
複数の潜在的な欠陥からの各所与の潜在的な欠陥に前記エンジンを適用し、前記マジョリティクラスに属する前記所与の潜在的な欠陥の信頼性レベルを取得することと、
前記
複数の潜在的な欠陥から
、所定の閾値よりも低い信頼性レベルをそれぞれ有する1つまたは複数の潜在的な欠陥を出力することであり、前記1つまたは複数の潜在的な欠陥が、前記マジョリティクラスに誤って分類され、かつ前記マイノリティクラスに属する確率がより高いと仮定される、出力することと
を含む、方法。
【請求項11】
前記第2の分類器によって前記マイノリティクラスに分類可能な前記追加の欠陥を生成することをさらに含む、請求項10に記載の方法。
【請求項12】
前記追加の欠陥のうちの少なくとも1つが、複数の値に基づいて生成された合成欠陥であり、各値が、前記サブセットの属性ごとの区別要因に従って前記サブセットからの属性に関連づけられる、請求項11に記載の方法。
【請求項13】
属性に割り当てられた前記複数の値からの値が、前記マイノリティクラスに属する第1の欠陥の前記属性の第2の値と、前記第1の欠陥に隣接し、かつ前記マジョリティクラスに属する第2の欠陥の前記属性の第3の値との間の値として決定される、請求項12に記載の方法。
【請求項14】
属性に割り当てられた前記複数の値からの値が、前記マイノリティクラスに属する第1の欠陥の前記属性の
値に比較的近いと決定される、請求項12に記載の方法。
【請求項15】
前記出力された潜在的な欠陥の少なくとも一部を前記マイノリティクラスに属するものとして識別することと、
前記複数の欠陥の中からの、前記マイノリティクラスに属する
少なくともいくつかの欠陥、
前記複数の欠陥の中からの、前記マジョリティクラスに属する
少なくともいくつかの欠陥、および前記出力された潜在的な欠陥の一部を含む訓練セットで前記第1の分類器を訓練することによって、前記第1の分類器を更新することと、
前記複数の欠陥に含まれ
ない、前記マジョリティクラスに
属するものとして前記第1の分類器によって分類され、前記エンジンが前記所定の閾値未満の信頼性レベルを取得する追加の欠陥を出力することと
をさらに含む、請求項10に記載の方法。
【請求項16】
前記エンジンが、ランダムフォレスト分類器で構成される、請求項10に記載の方法。
【請求項17】
前記区別要因が、値の範囲からの
カットオフポイントの値である、請求項10に記載の方法。
【請求項18】
前記区別要因が、離散値の集合からの1つまたは複数の値を含む、請求項10に記載の方法。
【請求項19】
命令を含む非一時的コンピュータ可読媒体であって、前記命令は、コンピュータによって実行されると、前記コンピュータに、半導体試料の欠陥を複数のクラスに自動的に分類する方法を実行させ、前記方法が、
第1の分類器によってマジョリティクラスに分類された複数の欠陥を受け取ることであり、前記複数の欠陥からの各欠陥は、複数の属性の
セットにおける各属性の値と関連づけられ、前記複数の欠陥からの1つまたは複数の欠陥が、前記1つまたは複数の欠陥のグランドトゥルースを示すマイノリティクラスに属し、前記複数の潜在的な欠陥からの前記欠陥の少なくとも一部が、前記欠陥の少なくとも一部のグランドトゥルースを示す前記マジョリティクラスに属する、受け取ることと、
前記複数の属性の
セットからサブセットを選択し、前記サブセットの属性ごとの区別要因を定義することであり、その結果、第2の分類器が、前記サブセットに従って欠陥を分類するように構成され、それぞれの属性ごとの前記区別要因が、前記複数の欠陥からの少なくとも事前定義された一部の欠陥を前記マイノリティクラスおよび前記マジョリティクラスに正しく分類する、定義することと、
一時的訓練セットを
生成することであり、前記一時的訓練セットが、前記マジョリティクラスに正しく分類された前記複数の欠陥からの前記欠陥の少なくとも一部、前記マイノリティクラスに属するが、前記マジョリティクラスに誤って分類された前記複数の欠陥からの前記欠陥の少なくとも一部、および前記第2の分類器が追加の欠陥を前記マイノリティクラスに分類するように前記サブセットの属性値を有する前記追加の欠陥を含む、生成することと、
前記サブセットの第1の値によって特徴づけられる欠陥が前記マジョリティクラスに属するという信頼性レベルを取得するように構成されたエンジンを
訓練することであり、前記訓練することが、前記一時的訓練セット、前記サブセット、および前記サブセットの属性ごとの前記区別要因を使用して実行される、訓練することと、
前記マジョリティクラスに分類される
複数の潜在的な欠陥からの各所与の潜在的な欠陥に前記エンジンを適用し、前記マジョリティクラスに属する前記所与の欠陥の信頼性レベルを取得することと、
前記
複数の潜在的な欠陥
の中から
、所定の閾値よりも低い信頼性レベルをそれぞれ有する1つまたは複数の潜在的な欠陥を出力することであり、前記1つまたは複数の潜在的な欠陥が、前記マジョリティクラスに誤って分類され、かつ前記マイノリティクラスに属する確率がより高いと仮定される、出力することと
を含む、非一時的コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
本開示の主題は、一般に、試料の試験の分野に関し、より具体的には、欠陥の勧告クラスに分類されるべき欠陥を自動検出することができる方法およびシステムに関する。
【背景技術】
【0002】
製造されたデバイスの超大規模集積に関連する高密度および性能への現在の要求は、サブミクロン機能、トランジスタおよび回路速度の向上、ならびに信頼性の改善を必要とする。そのような要求は、高い精度および均一性をもつデバイス機能の形成を必要とし、その結果として、それは、デバイスがまだ半導体試料の形態である間のデバイスの頻繁かつ詳細な試験を含む、製造プロセスの注意深いモニタを必要とする。
【0003】
本明細書で使用される「試料」という用語は、半導体集積回路、磁気ヘッド、フラットパネルディスプレイ、および他の半導体製造品を生産するために使用されるあらゆる種類のウエハ、マスク、および他の構造、これらの組合せおよび/または一部を包含するように広く解釈されるべきである。
【0004】
本明細書で使用される「欠陥」という用語は、試料上または試料内に形成されたあらゆる種類の異常または望ましくない特徴を包含するように広く解釈されるべきである。
【0005】
試料の複雑な生産プロセスは、エラーがないわけではなく、そのようなエラーは、生産されたデバイスに障害をもたらす可能性がある。そのような障害は、デバイスの動作を損なうことがある欠陥と、欠陥である可能性があるが、生産されたデバイスの損害または機能不全を引き起こさない有害物を含むことがある。非限定の例として、欠陥は、原材料の欠陥、機械的、電気的、または光学的エラー、人的エラーなどに起因して生産プロセス中に生じる可能性がある。さらに、欠陥は、試験プロセス中に1つまたは複数の生産段階の後で生じるウエハの温度変化などの時空の要因によって生じることがあり、それは、ウエハの若干の変形を引き起こすことがある。試験プロセスはまた、例えば、試験機器またはプロセスにおける光学的、機械的、または電気的問題に起因して、さらなる疑わしいエラーを導入する可能性があり、したがって、それにより、不完全な捕捉が行われる。そのようなエラーは、欠陥を含んでいるように見えることがある誤検出の結果をもたらす可能性があるが、実際の欠陥はその区域に存在しない。
【0006】
多くの用途において、欠陥のタイプまたはクラスが重要である。例えば、欠陥は、粒子、スクラッチ、プロセスなどのようないくつかのクラスのうちの1つに分類することができる。
【0007】
本明細書で使用される「マジョリティクラス」という用語は、頻繁に生じる欠陥の種類またはクラスを包含するように広く解釈されるべきである。例えば、クラスは、試料を試験するとき、そのクラスの少なくとも所定の数の欠陥が生じており、試料を試験するときに検出された欠陥の少なくとも所定部分がそのクラスに属しており、そのクラスに属する発生した欠陥の数が、欠陥をそのクラスまたは他の基準に属するものとして認識するように分類器を訓練するのに十分である場合、マジョリティクラスと考えることができる。
【0008】
本明細書で使用される「マイノリティクラス」という用語は、頻繁には生じない欠陥の種類またはクラスを包含するように広く解釈されるべきであり、したがって、欠陥をこのクラスに分類するように分類器を訓練することによって信頼できる分類モデルを生成するには利用できる統計量が不十分である。例えば、クラスは、試料を試験するとき、そのクラスの所定の数より少ない欠陥が生じており、試料を試験するときに検出される欠陥の所定の部分より少ない部分がそのクラスに属しており、そのクラスに属する発生した欠陥の数が、欠陥をそのクラスなどに属するものとして認識するように分類器を訓練するには不十分である場合、マイノリティクラスと考えることができる。
【0009】
特に具体的に述べられない限り、本明細書で使用される「試験」という用語は、対象物の欠陥のあらゆる種類の検出および/または分類を包含するように広く解釈されるべきである。試験は、試験されるべき対象物の生産中にまたは生産後に、非破壊試験ツールを使用することによって行われる。非限定の例として、試験プロセスは、1つまたは複数の試験ツールを使用する走査(単一走査でまたは多走査での)、サンプリング、レビュー、測定、分類、および/または対象物またはその一部に関して行われる他の操作を含むことができる。同様に、試験は、試験されるべき対象物の生産の前に行うことができ、例えば、試験方策を生成することを含むことができる。特に具体的に述べられない限り、本明細書で使用される「試験」という用語またはその派生語は、検査される区域のサイズ、走査の速度もしくは解像度、または試験ツールのタイプに関して限定されないことに留意されたい。様々な非破壊試験ツールには、非限定の例として、光学ツール、走査型電子顕微鏡、原子間力顕微鏡などが含まれる。
【0010】
試験プロセスは、複数の試験ステップを含むことができる。生産プロセス中に、試験ステップは、例えば特定の層の生産または処理などの後に、多数回実行されてもよい。追加としてまたは代替として、各試験ステップは、例えば、異なる試料位置に対して、または異なる試験設定で同じ試料位置に対して、多数回繰り返されてもよい。
【0011】
非限定の例として、実行時試験は、ツーステップ手順、例えば、試料の検査と、それに続くサンプリングされた欠陥のレビューとを使用することができる。検査ステップの間、試料またはその一部(例えば、注目する区域、ホットスポットなど)の表面は、一般に、比較的高速および/または低解像度で走査される。捕捉された検査画像を分析して、欠陥を検出し、その位置および他の検査属性を取得する。レビューステップでは、検査フェーズ中に検出された欠陥のうちの少なくとも一部の画像が、一般に、比較的低速および/または高解像度で捕捉され、それによって、欠陥の少なくとも一部の分類と、任意で、他の分析とが可能になる。ある場合には、両方のフェーズは、同じ検査ツールで実施することができ、他の場合には、これらの2つのフェーズは、異なる検査ツールで実施される。
【発明の概要】
【0012】
本開示の主題の特定の態様によれば、試料の欠陥を複数のクラスに分類するためのシステムが提供される。システムは、第1の分類器によってマジョリティクラスに分類された複数の欠陥を受け取ることであり、複数の欠陥からの1つまたは複数の欠陥が、1つまたは複数のマイノリティクラスに属し、複数の欠陥からの欠陥の少なくとも一部が、マジョリティクラスに属し、複数の欠陥からの各欠陥が、各々がそれぞれの値を有する複数の属性によって特徴づけられる、受け取ることと、複数の属性のサブセットを選択し、サブセットの属性ごとの区別要因(differentiator)を定義することであり、その結果、第2の分類器が、サブセットに従って欠陥を分類するように構成され、それぞれの属性ごとの区別要因が、複数の欠陥からの少なくとも事前定義されたシェアの欠陥を1つまたは複数のマイノリティクラスおよびマジョリティクラスに正しく分類する、定義することと、一時的訓練セットを生成することであり、一時的訓練セットが、マジョリティクラスに属する複数の欠陥からの欠陥の少なくとも一部、マイノリティクラスに属する複数の欠陥からの欠陥の少なくとも一部、および第2の分類器が追加の欠陥をマイノリティクラスに分類するように属性のサブセットの値を有する追加の欠陥を含む、生成することと、属性のサブセットの第1の値によって特徴づけられる欠陥がマジョリティクラスに属するという信頼性レベルを取得するように構成されたエンジンを訓練することであり、訓練することが、一時的訓練セット、属性のサブセット、およびサブセットの属性ごとの区別要因に基づいて実行される、訓練することと、所与の欠陥をマジョリティクラスに分類する信頼性レベルを取得するために、マジョリティクラスに分類される第2の複数の欠陥からの各所与の欠陥にエンジンを適用することと、所定の閾値よりも低い信頼性レベルを有する第2の複数の欠陥からの欠陥であり、それによって、欠陥が、1つまたは複数のマイノリティクラスにおそらく属する、欠陥を出力することとを行うように構成されたプロセッサおよびメモリ回路(PMC)を含む。
【0013】
本開示の主題のさらなる態様によれば、PMCは、第2の分類器によって1つまたは複数のマイノリティクラスに分類可能な追加の欠陥を生成し、追加の欠陥を一時的訓練セットに含めるようにさらに構成することができる。追加の欠陥のうちの少なくとも1つは、複数の第1の値として生成された合成欠陥とすることができ、各第1の値は、サブセットの属性ごとの区別要因に従ってサブセットからの属性に関連づけられる。非限定の例として、所与の属性に関連づけられた第1の値は、1つまたは複数のマイノリティクラスに属する第1の欠陥の所与の属性の値と、第1の欠陥に隣接し、かつマジョリティクラスに属する第2の欠陥の所与の属性の値との間の値として、1つまたは複数のマイノリティクラスに属する欠陥の所与の属性の値として、などとして決定することができる。
【0014】
本開示の主題のさらなる態様によれば、PMCは、出力欠陥の少なくとも一部を1つまたは複数のマイノリティクラスに属するものとして識別することと、1つまたは複数のマイノリティクラスに属する複数の欠陥からの少なくともいくつかの欠陥、マジョリティクラスに属する複数の欠陥からの少なくともいくつかの欠陥、および1つまたは複数のマイノリティクラスに属するものとして識別された出力欠陥を含む訓練セットで第1の分類器を訓練することによって、第1の分類器を更新することと、第1の分類器によってマジョリティクラスに分類された複数の欠陥を更新し、更新の際に現れ、エンジンが閾値未満の信頼性レベルを取得する欠陥を出力することとを行うようにさらに構成される。
【0015】
本開示の主題の他の態様によれば、欠陥を分類する方法が提供され、この方法は、プロセッサおよびメモリ回路(PMC)を含むコンピューティングプラットフォームによって実行される。この方法は、第1の分類器によってマジョリティクラスに分類された複数の欠陥をPMCによって受け取ることであり、複数の欠陥からの1つまたは複数の欠陥が、1つまたは複数のマイノリティクラスに属し、複数の欠陥からの欠陥の少なくとも一部が、マジョリティクラスに属し、複数の欠陥からの各欠陥が、各々がそれぞれの値を有する複数の属性によって特徴づけられる、受け取ることと、複数の属性のサブセットをPMCによって選択し、サブセットの属性ごとの区別要因を定義することであり、その結果、第2の分類器がサブセットに従って欠陥を分類するように構成され、それぞれの属性ごとの区別要因が、複数の欠陥からの少なくとも事前定義されたシェアの欠陥を1つまたは複数のマイノリティクラスおよびマジョリティクラスに正しく分類する、定義することと、一時的訓練セットをPMCによって生成することであり、一時的訓練セットが、マジョリティクラスに属する複数の欠陥からの欠陥の少なくとも一部、マイノリティクラスに属する複数の欠陥からの欠陥の少なくとも一部、および第2の分類器が追加の欠陥をマイノリティクラスに分類するように属性のサブセットの値を有する追加の欠陥を含む、生成することと、属性のサブセットの第1の値によって特徴づけられる欠陥がマジョリティクラスに属するという信頼性レベルを取得するように構成されたエンジンをPMCによって訓練することであり、訓練することが、一時的訓練セット、属性のサブセット、およびサブセットの属性ごとの区別要因に基づいて実行される、訓練することと、所与の欠陥をマジョリティクラスに分類する信頼性レベルを取得するために、マジョリティクラスに分類される第2の複数の欠陥からの各所与の欠陥にエンジンをPMCによって適用することと、所定の閾値よりも低い信頼性レベルを有する第2の複数の欠陥からの欠陥であり、それによって、欠陥が、1つまたは複数のマイノリティクラスにおそらく属する、欠陥をPMCによって出力することとを含む。
【0016】
本開示の主題のさらなる態様によれば、この方法は、第2の分類器によって1つまたは複数のマイノリティクラスに分類可能な追加の欠陥を生成し、追加の欠陥を一時的訓練セットに含めることをさらに含むことができる。追加の欠陥のうちの少なくとも1つは、複数の第1の値として生成された合成欠陥とすることができ、各第1の値は、サブセットの属性ごとの区別要因に従ってサブセットからの属性に関連づけられる。
【0017】
本開示の主題のさらなる態様によれば、この方法は、出力欠陥の少なくとも一部を1つまたは複数のマイノリティクラスに属するものとして識別することと、1つまたは複数のマイノリティクラスに属する複数の欠陥からの少なくともいくつかの欠陥、マジョリティクラスに属する複数の欠陥からの少なくともいくつかの欠陥、および1つまたは複数のマイノリティクラスに属するものとして識別された出力欠陥を含む訓練セットで第1の分類器を訓練することによって、第1の分類器を更新することと、第1の分類器によってマジョリティクラスに分類された複数の欠陥を更新し、更新の際に現れ、エンジンが閾値未満の信頼性レベルを取得する欠陥を出力することとをさらに含むことができる。
【0018】
本開示の主題の特定の実施形態の利点の中に、ユーザによって設定された成功基準または目安のモニタを強化することがあり、成功基準は自動化された欠陥分類に関連づけられる。成功基準のいくつかの非限定の例には、1つまたは複数のクラスの分類純度、1つまたは複数のクラスの分類精度、および抽出が含まれる。
【0019】
さらなる利点の中に、ユーザ要件に従って、不均衡な訓練セットの影響を修正することによって、1つまたは複数のマイノリティクラスのさらなる欠陥を識別し、本開示を利用する前には分類できなかった欠陥を正しく分類することによって分類結果を最適化することがある。
【0020】
本発明を理解し、それが実際にどのように実行され得るかを知るために、次に、実施形態が、単なる非限定の例として、添付の図面を参照して説明される。
【図面の簡単な説明】
【0021】
【
図1】本開示の主題の特定の実施形態による試験システムの一般化されたブロック図である。
【
図2】本開示の主題の特定の実施形態による、マイノリティクラスに属し得る欠陥を識別する方法の一般化された流れ図である。
【
図3】本開示の主題の特定の実施形態による、欠陥分類の混同行列を示す図である。
【
図4】本開示の主題の特定の実施形態による、追加の欠陥を生成することができる例示的な2次元欠陥を示す図である。
【
図5】本開示の主題の特定の実施形態による試料をレビューする方法の一般化された流れ図である。
【発明を実施するための形態】
【0022】
以下の詳細な説明において、本発明の完全な理解を提供するために、多数の特定の詳細が記載される。しかしながら、本開示の主題はこれらの特定の詳細なしに実践され得ることを当業者なら理解されるであろう。他の例では、よく知られた方法、手順、構成要素、および回路は、本開示の主題を曖昧にしないように、詳細には記載されていない。
【0023】
特に具体的に述べられない限り、以下の議論から明らかなように、本明細書の全体にわたって、「処理する」、「計算する」、「表す」、「算出する」、「生成する」、「割り当てる」、「選択する」、「決定する」、「受け取る」、「訓練する」、「適用する」、「出力する」などのような用語を利用する議論は、データを操作し、および/またはデータを他のデータに変換するコンピュータの動作および/またはプロセスを指し、前記データは、電子的などの物理的な量として表され、および/または前記データは、物理的対象を表すことを理解されたい。「コンピュータ」という用語は、非限定の例として、本出願で開示される分類器およびその中のPMCを含むデータ処理能力をもつあらゆる種類のハードウェアベースの電子デバイスを包含するように広く解釈されるべきである。
【0024】
本明細書に使用される「非一時的メモリ」および「非一時的記憶媒体」という用語は、本開示の主題に適するあらゆる揮発性または不揮発性のコンピュータメモリを包含するように広く解釈されるべきである。
【0025】
特に具体的に述べられない限り、別個の実施形態の文脈に記載されている本開示の主題の特定の特徴は、単一の実施形態で組み合せて提供することもできることを理解されたい。逆に、単一の実施形態の文脈に記載されている本開示の主題の様々な特徴は、別々にまたは任意の適切な副組合せで提供することもできる。以下の詳細な説明において、方法および装置の完全な理解を提供するために、多数の特定の詳細が記載される。
【0026】
本明細書で使用される試料の「欠陥」という用語は、試料上または試料内に形成されたあらゆる種類の異常または望ましくない特徴を包含するように広く解釈されるべきである。
【0027】
本明細書で使用される「クラスに属することが知られている」という用語は、グラウンドトゥルースと考えられるクラスへの欠陥の分類、例えば、人間のユーザによって行われる分類、信頼できる分類器などによって行われる分類などを包含するように広く解釈されるべきである。
【0028】
本明細書で使用される「分類」という用語は、複数の所定のクラスのうちの1つへの欠陥の割り当てを包含するように広く解釈されるべきである。一般に、分類器は、必要とされるクラスの各々に属することが分かっている欠陥に基づいて訓練される。訓練が行われた後、分類器は、欠陥がどのクラスに属するかが分かっているか否かにかかわらず、欠陥をクラスのいずれかに分類するために使用することができる。
【0029】
所与の欠陥は、マジョリティクラスまたはマイノリティクラスに属することができる。分類器を欠陥のセットに適用すると、欠陥の大部分は、分類器によってマジョリティクラスに自動的に分類されることになる。しかしながら、マイノリティクラスに属することが分かっている訓練欠陥の数が不十分であることに起因して、多くのマイノリティ欠陥も、マジョリティクラスに誤って分類されることになる。検査中に検出された欠陥の一部のみがレビュー中にさらに試験されるので、マジョリティクラスに分類されたマイノリティ欠陥がレビューされる確率は低い。
【0030】
したがって、分類器を訓練するときに特定の母集団の、例えばマイノリティクラスの欠陥を過小表示することは、いくつかの理由で、製造および試験プロセスにおいて深刻な問題である。
【0031】
第1に、誤った分類は、試験プロセスの品質の不正確な評価をもたらす可能性がある。マイノリティ欠陥の表示が少ないために、プロセス評価へのマイノリティ欠陥の影響が低く、それゆえに、プロセス全体の品質が不正確に評価される可能性がある。
【0032】
第2に、試験プロセスの安定性が低い可能性があり、欠陥が誤って分類されると、母集団が小さいほど変化に対して脆弱になるので、小数の欠陥、またはさらに単一の欠陥は、プロセス評価の標準偏差に著しく影響を与える可能性がある。したがって、試験プロセスを安定して評価することが困難である。
【0033】
第3に、単なる分類エラーは、非常に深刻で扱えなくなる可能性がある欠陥をもたらす。その上、非常に深刻な欠陥を排除するためにかなり大きい努力が払われ、それにより、これらのタイプの残っている欠陥が少なくなる。したがって、そのような欠陥が訓練プロセスにおいて過小表示される場合、さらなる欠陥はそれのクラスに分類されないことになり、そのため、試料の深刻な問題が気付かれないままになる可能性がある。
【0034】
第4に、特定のタイプの欠陥は、同じクラスに属すると呼ばれるが、異なる特性を有することがある。例えば、「粒子」というタイプの欠陥は、金属とシリコーンでは著しく異なる可能性がある。特定のマイノリティクラスを識別および訓練しないことによって、特定の欠陥に関連する重要な情報が失われる可能性がある。
【0035】
これを念頭に置いて、本開示の主題の特定の実施形態による試験システムの一般化されたブロック図を示す
図1に注目する。
図1に示された試験システム100は、試料製造の一部として試料(例えば、ウエハおよび/またはその一部の)を試験するために使用することができる。試験は対象物製造の一部とすることができ、対象物の生産中にまたはその後で実行することができる。試験システムは、様々な試験ツール、例えば、検査画像を捕捉する(一般に、比較的高速および/または低解像度で)ように構成された1つまたは複数の検査試験ツール101と、検査ツール101によって検出された欠陥の少なくとも一部のレビュー画像を捕捉する(一般に、比較的低速および/または高解像度で)ように構成された1つまたは複数のレビュー試験ツール102とを含むことができる。図示の試験システム100は、欠陥タイプに従って欠陥を複数のクラスに自動的に分類することができるコンピュータベースの自動欠陥分類ツール(以下、分類器とも呼ぶ)103をさらに含む。非限定の例として、分類には様々な目的があってもよく、分類結果は、分類目的に従って、統計的プロセス制御(SPC)および/または他の方法でエクスカーションを識別するために、特定の対象の欠陥(DoI)を識別し、疑似欠陥を真の欠陥からフィルタ処理し、パレートを確立するために使用することができる。
【0036】
ユーザは、GUI108の助けを借りて分類エンジン121を訓練するために、クラスおよび各クラスに割り当てる欠陥を定義することができる。さらに、GUI108は、ユーザ(および/または管理システム)が、純度、精度、注出、または他のパラメータなどの自動欠陥分類に関連する成功基準または目安をクラスごとに別々に設定およびモニタし、ユーザ要件に従って分類結果を最適化することができるように構成することができる。
【0037】
分類器103は、1つまたは複数の検査ツール101および/または1つまたは複数のレビューツール102に動作可能に接続することができる。分類器103は、1つまたは複数の検査ツール101または1つまたは複数のレビューツール102と完全にまたは部分的に統合できてもよい。分類器103は、設計サーバ110およびデータレポジトリ109にさらに動作可能に接続することができる。
【0038】
試料は、検査ツール101(例えば、光学検査システム、低解像度SEMなど)で試験することができる。結果として得られる画像および/または派生物を処理して(例えば、設計データおよび/または欠陥分類データのような他のデータと一緒でもよい)、レビューのために欠陥を選択することができる。
【0039】
レビューのために選択された潜在的な欠陥位置のサブセットは、レビューツール102(例えば、走査型電子顕微鏡(SEM)または原子間力顕微鏡(AFM)など)でレビューすることができる。レビュー画像および/またはその派生物およびそれぞれの関連するメタデータの情報を提供するデータ(以下、レビューデータ122と呼ぶ)は、直接または1つまたは複数の中間システムを介して、分類器103に送信することができる。レビューデータは、1つまたは複数の中間システムによって生成されたデータをレビュー画像の派生物として含むことができることに留意されたい。
【0040】
分類器103は、ハードウェアベース入力インターフェース105およびハードウェアベース出力インターフェース106に動作可能に接続されたプロセッサおよびメモリ回路(PMC)104を含む。PMC104は、
図2を参照してさらに詳述するように、分類器を動作させるのに必要な処理を行うように構成され、プロセッサおよびメモリ(PMC104内に別々に示されない)を含む。分類器103およびPMC104の動作は、
図2~
図4を参照してさらに詳述する。
【0041】
出力インターフェース106によって出力された分類器103の処理結果は、それぞれ、検査命令関連データ123またはレビュー命令関連データ124として検査試験ツール101またはレビュー試験ツール102に供給され、それらの動作を、例えば動作パラメータの値を変更することによって変更することができる。
【0042】
本開示の主題の教示は
図1に示されたシステムによって拘束されず、均等な機能および/または変更された機能は、別の方法で統合または分割することができ、ソフトウェアとファームウェアおよびハードウェアとの任意の適切な組合せで実施することができることを当業者は容易に理解するであろう。
【0043】
図1に示された試験システムは、分散コンピューティング環境で実施することができ、
図1に示される前記の機能モジュールは、いくつかのローカルおよび/またはリモートデバイスにわたって分散させることができ、通信ネットワークを通してリンクさせることができることに留意されたい。他の実施形態では、試験ツール101および/または102、データレポジトリ109、ストレージシステム107、設計サーバ110、および/またはGUI108の少なくとも一部は、試験システム100の外部にあり、入力インターフェース105および出力インターフェース106を介して分類器103とデータ通信して動作することができることにさらに留意されたい。分類器103は、1つまたは複数の試験ツールとともに使用することができるスタンドアロンコンピュータとして実施することができる。分類器103は、データレポジトリ109および/またはストレージシステム107に格納された事前取得レビューデータに基づいて動作することができてもよい。代替としてまたは追加として、分類器103のそれぞれの機能は、1つまたは複数の試験ツール、プロセス制御ツール、方策生成ツール、自動欠陥レビューおよび/または分類のためのシステム、および/または試験に関連する他のシステムと少なくとも部分的に統合することができる。
【0044】
PMC104は、マイノリティ欠陥識別エンジン117、訓練エンジン120、および1つまたは複数の分類エンジン121を含むことができる。マイノリティ欠陥識別エンジン117は、マイノリティ欠陥を識別するために使用することができ、マイノリティ欠陥は、訓練エンジン120によって使用されて1つまたは複数の分類エンジン121を訓練することができる。
【0045】
マイノリティ欠陥識別エンジン117は、グラウンドトゥルースが存在し、分類エンジン121によってマジョリティクラスに誤って分類されたマイノリティ欠陥を識別するための初期マイノリティ欠陥取得エンジン118を含むことができる。マイノリティ欠陥識別エンジン117は、マイノリティ欠陥である可能性があるが、グラウンドトゥルースが存在しない欠陥を識別するように構成された追加マイノリティ欠陥取得エンジン119をさらに含むことができる。次いで、ユーザは、これらの欠陥をレビューし、欠陥のうちの1つまたは複数が実際にマイノリティ欠陥であるかどうかを決定することができる。ひとたび十分な数のマイノリティクラスの欠陥が入手可能になると、訓練エンジン120を使用して、分類器121とも呼ばれる分類エンジンを訓練することができる。
【0046】
PMC104は、各々が対応する分類を有する多数の欠陥を受け取り、欠陥を受け取り、欠陥が分類されるクラスを提供するように構成された分類器に出力するように構成された訓練エンジン120を含むことができる。
【0047】
PMC104は、分類器とも呼ばれる1つまたは複数の分類エンジン120を含むことができ、それは、訓練エンジン118または別の訓練エンジンで訓練するかまたは外部ソースから受け取ることができる。以下で詳述するように、1つのそのようなエンジンは、不十分な数のマイノリティ欠陥により訓練された初期エンジンとすることができ、別のエンジンは、さらなる欠陥により訓練することができる。
【0048】
図2を参照すると、本開示の主題の特定の実施形態によるマイノリティ欠陥識別エンジン117を動作させる一般化された流れ図が示される。PMC104は、非一時的コンピュータ可読記憶媒体に実装されたコンピュータ可読命令に従って以下で詳述するそれぞれの動作を実行するように構成される。
【0049】
次に、
図3を参照すると、マジョリティクラスおよびマイノリティクラス、ならびにそれらへの分類が、「混同行列」の形態で示される。「混同行列」という用語は、グラウンドトゥルース分類対自動分類結果の視覚化を可能にする任意の表レイアウトを包含するように広く解釈されるべきである。
【0050】
したがって、
図3の表300は、例えば例示的な試料の検査中に検出された合計250個の欠陥の人間対機械分類を示し、各欠陥は、クラスA、B、C、またはDのうちの1つに属する。表300は、行304、308、312、および316を含み、各々は、ユーザによって分類された各クラスの欠陥に関連し、それゆえに、クラスへのこの割り当ては「グラウンドトゥルース」と呼ばれる。ユーザによって分類された欠陥の数は、「合計」列332に示される通りであり、クラスAの60個、クラスBの44個、クラスCの119個、およびクラスDの27個である。
【0051】
デフォルトまたは他の初期分類器も使用され、それは、表300の列320、324、および328に示されるように欠陥を分類し、例えば、クラスAの52個の欠陥が実際にクラスAに分類されている、クラスBの2個の欠陥がクラスCとして分類されている、などである。
【0052】
表400の主要対角線の最初の3つのエントリに示されるように、クラスA、B、およびCの大部分の欠陥は、正しく分類されており、クラスAでは60個のうちから52個、クラスBでは44個のうちから38個、およびクラスCでは119個のうちの110個である。したがって、クラスA、B、およびCはマジョリティクラスと考えられる。しかしながら、どのクラスの欠陥もクラスDに分類されていない。これは、分類器が訓練されたときにクラスDの十分な欠陥が存在せず、したがって、分類器がこのクラスに欠陥を分類することができなかったためと考えられる。したがって、クラスDはマイノリティクラスと呼ばれ、このクラスの欠陥はマジョリティクラスに分類されている。それゆえに、それに応じて分類器を訓練するために、より多くのクラスDの欠陥を見つけることが必要とされる。
【0053】
次に、
図2に戻って参照すると、PMC104は、第1の分類器によって第1のマジョリティクラスに分類された複数の欠陥を受け取る(200)。受け取った欠陥は、事前定義されたクラスに事前分類されており(例えば、人間の専門家および/または別の分類器および/または以前の分類器のバージョンなどによって)、その結果、この事前分類はグラウンドトゥルースと考えられる。したがって、PMC104は、同じマジョリティクラスまたはマイノリティクラスに属する欠陥を受け取る。
【0054】
例えば、PMC104は、第1の分類器によって1つのクラス、例えば、列320に示されたクラスAに割り当てられており、クラスAまたはクラスDに属することが分かっている欠陥を受け取る可能性がある。クラスAに分類される欠陥であるが、他のマジョリティクラスに属する欠陥、例えば、クラスBに属する4つの欠陥、およびクラスCに属する3つの欠陥は無視される。それゆえに、クラスAに正しく分類されたクラスAの52個の欠陥と、クラスAに誤って分類されたクラスDの3個の欠陥を区別することが必要とされる。
【0055】
各欠陥は、様々な属性に割り当てられた値の集合、例えば、ベクトルとして記述することができる。一般に、各欠陥は、例えば、タイプ、色、サイズ、位置、原因などに関連する数百以上の属性に割り当てられた値として記述することができる。
【0056】
次いで、PMC104は、マジョリティクラスに属する欠陥とマイノリティクラスに属する欠陥とを正しく区別するために、属性のサブセットを選択し、サブセットの属性ごとに区別要因を定義する(204)ことができる。属性サブセット選択は次元削減と呼ばれることもある。欠陥よりも多い次元(すなわち、属性)がある場合、そのような区別を行うことが数学的に可能である。しかしながら、次元の数を減少させることが、一般化、例えば、区別安定性を強化するのに有用である可能性があり、その結果、追加の欠陥を同様にいずれのクラスに分類することができる。
【0057】
区別は、選択された属性サブセットにのみ基づく、欠陥をマジョリティクラスとマイノリティクラスに分類する一時的分類器として説明することができる。マジョリティクラスに割り当てられた欠陥とマイノリティクラスに割り当てられた欠陥とを正しく区別することは、マジョリティクラスの欠陥の少なくとも所定の部分がマジョリティクラスに分類されることと、マイノリティクラスの欠陥の少なくとも(多分異なる)所定の部分がマイノリティクラスに分類されることとに関連し得ることが理解されよう。所定の部分は、それぞれの欠陥の所定のパーセンテージ、それぞれの欠陥の少なくとも所定の数などに関連することができる。
【0058】
属性が、一連の値、例えば、不連続な範囲または連続な範囲を受け取ることができる場合、区別要因は、カットオフポイントとなることができ、その結果、閾値を超える値を有する欠陥はあるクラスに関連づけられ、一方、閾値を下回る値を有する欠陥は他のクラスに関連づけられる。属性が2つの可能な値、例えば、0または1の一方を受け取ることができる場合、区別要因は、属性の第1の値を有する欠陥を一方のクラスに関連づけ、一方、属性の第2の値を有する欠陥を他方のクラスに関連づけるように定義することができる。
【0059】
属性サブセットを選択するのに、ランダムフォレスト法を使用することができ、ランダムフォレスト法は、複数のデシジョンツリーを構築し、各々のそのようなデシジョンツリーから分類結果を受け取り、大多数のツリーによって行われた決定に応じて決定を行うことによって機能する。第1の段階において、第1のツリーが構築される。第1の属性はジニ不純度指数に従って選択することができ、ジニ不純度指数は、セットからランダムに選ばれた要素が、サブセットにおけるラベルの分布に従ってランダムにラベル付けされた場合、どれくらいの頻度で不正確にラベル付けされるかの尺度と見なすことができる。例えば、各々が2つのクラス、すなわち、「X」および「0」のうちの1つに属する9つの欠陥が提供されると仮定する。9つの欠陥は、以下の属性の値、すなわち、[1,1.5,2,3,4,5.5,6,8,10]を有する。欠陥をこの属性の値の昇順で配列すると、欠陥ベクトルは、[X X 0 X X 0 0 X 0]であり、これが意味するところは、第1、第2、第4、第5、および第8の欠陥はクラス「X」であり、他のものはクラス「0」である。Piが正しく分類された「X」の確率であるとして、このベクトルに対するPi*(1-Pi)として定義されたクラス「X」のジニ不純度指数は、
【0060】
【数1】
である。ジニ不純度指数の最適値は0であり、それは、属性による完全な区別を示す(ここで、Piは0または1のいずれかである)ことが理解されよう。ベクトルを区別する属性の区別要因値が1.5と2との間にあるように選択される場合、ベクトルは、次のように、[X X|0 X X 0 0 X 0]になり、これが意味するところは、「|」記号の左側の欠陥は「0」として分類され、「|」記号の右側の欠陥は「X」として分類され、そのとき、クラス「X」のジニ不純度指数は、
【0061】
【数2】
である。同様に、クラス「0」のジニ不純度指数は0であり、したがって、加重平均は、
【数3】
であり、これが意味するところは、ジニ指数が減少しており、すなわち、純度が向上している。
【0062】
最良の加重平均を提供する属性および区別要因の選択は、デシジョンツリーの第1のレベルとして選択することができる。次のレベルでは、異なる属性、または異なる区別値をもつ同じ属性を選択することができる。
【0063】
いくつかの実施形態では、マジョリティクラスに分類された欠陥のすべてではなく一部のみが、ランダムフォレストを造るために選択される場合がある。しかしながら、ランダムフォレストを構築するために選択される可能性があるマジョリティクラスに誤って分類された欠陥の割合が、マジョリティクラスに分類された欠陥の割合よりも高くなる可能性がある。例えば、100個の欠陥がマジョリティクラスに分類され、その中から、2つがマイノリティクラスに属し、98個がマジョリティクラスに属する場合、20個の欠陥がランダムフォレストのために選択され、それが、マイノリティクラスに属する2つの欠陥と、マジョリティクラスに属する18個の欠陥とを含む可能性がある。
【0064】
多数のそのようなツリーを構築することができ、各々は、欠陥の異なるセットならびに属性および区別要因の異なる選択に基づく。
【0065】
ひとたび所定の数のデシジョンツリーが構築されると、属性サブセットを選択することができる。属性サブセットは、ツリーへの各属性の参加に基づいて選択することができ、参加しているツリーが多い属性またはツリーの1つまたは複数においてより高い属性は、参加しているツリーが少ない属性またはツリーの1つまたは複数において階層において低い属性よりも高いグレードを割り当てることができる。
【0066】
ランダムフォレスト法は、利用可能な訓練セットに属性セットを過剰適合させることを排除することができ、過剰適合は、属性サブセットが、訓練セットを十分に区別するように設計されているが、そのため、他の欠陥集合にはそれほど有効でない状況に関連する。
【0067】
次いで、PMC104は、一時的訓練セットを生成することができ(212)、一時的訓練セットは、正しく分類されたマジョリティクラスの複数の欠陥と、不正確にマジョリティクラスに分類されたマイノリティクラスの複数の欠陥とを含む。いくつかの実施形態では、マジョリティクラスに分類されたすべての欠陥が選択されているとは限らない。その上、不正確にマジョリティクラスに分類されたマイノリティクラスの欠陥の割合が、マジョリティ欠陥として分類されたすべての欠陥のそれぞれの部分よりも高いことがある。一時的訓練セットは、追加の欠陥をさらに含むことができる。
【0068】
追加の欠陥は、PMC104で生成することができる。追加の欠陥は、上述のランダムフォレスト分類器などの属性サブセットに基づく分類器がマイノリティクラスに分類することになる欠陥である。追加の欠陥の生成は、オーバーサンプリングと呼ぶこともできる。欠陥の生成は、属性サブセットの属性に値を割り当てることによって実行することができることが理解されよう。
【0069】
次に、
図4を参照すると、2次元で構成されている属性サブセットのオーバーサンプリングの例示的な実施形態が示される。
【0070】
マジョリティクラスおよびマイノリティクラスの多数の欠陥が与えられると、オーバーサンプリングは、1つまたは複数の合成欠陥、すなわち、各々が既存のマイノリティ欠陥に比較的近い値の1つまたは複数の集合を生成することに関連し得る。
図4は、「O」で示された3つのマイノリティ欠陥400、404、および412と、「X」で示された408または416などのいくつかのマジョリティ欠陥とを示す。2つのクラスの欠陥を十分に区別する分類器を作り出すために、マジョリティクラスの隣接を有するマイノリティ欠陥のより近くにあるより多くの合成欠陥を生成することができる。したがって、合成欠陥は、欠陥404および412の近くで生成することができるが、クラス「X」の隣接が近くにない欠陥400の近くでは生成することができない。
【0071】
合成欠陥の生成は、マイノリティ欠陥ごとに最も近いマジョリティ欠陥までの距離を計算することができる合成マイノリティオーバーサンプリング技法(SMOTE)を使用して実行することができる。距離の計算は、選択された属性サブセットの二乗和(可能性のある加重の)などの必要とされるメトリックを使用して実行することができる。マジョリティクラスの最も近い隣接までの距離が最も小さい所定の数のマイノリティ欠陥を選択することができる。いくつかの実施形態では、同じマイノリティ欠陥が、多数回選択されることがある。このようにして、マイノリティ欠陥404および412を選択することができる。そのような選択された欠陥ごとに、マイノリティ欠陥の属性値と、最も近いマジョリティ欠陥の属性値との間の範囲の属性の値を有する合成欠陥を作り出すことができる。
図4の例では、合成欠陥は、マイノリティ欠陥404とマジョリティ欠陥408を接続するラインに沿って作り出すことができる。いくつかの実施形態では、合成欠陥はマイノリティ欠陥のより近くに生成することができ、例えば、各属性の値は、0.8*マイノリティ欠陥の属性の値+0.2*マジョリティ欠陥の属性の値、またはそれらの任意の他の加重組合せとして計算することができる。第2の合成欠陥は、マイノリティ欠陥412とマジョリティ欠陥416を接続するラインに沿って生成することができる。
【0072】
次いで、PMC104は、一時的訓練セット、属性サブセット、およびサブセットの属性ごとの区別要因に基づいて信頼性レベルエンジンを訓練することができる(216)。信頼性レベルエンジンは、欠陥と、欠陥が分類されるクラスとを受け取り、欠陥が確かにそのクラスに属するという信頼性レベルを出力するように構成することができる。
【0073】
信頼性レベルエンジンはまた、ツリーアンサンブルとして実施することができ、ツリーアンサンブルのツリーは、勾配ブースティングを使用して生成することができる。デシジョンツリーの生成は、デフォルト分類ツリーで開始し、選択された属性サブセットに従って動作し、欠陥をマジョリティクラスとマイノリティクラスとに分類することができる。強化されたジニ不純度指数は、各クラスに割り当てられた重みを考慮に入れることができ、WA*PA*(1-WAPA)であり、ここで、WAは、クラスAに割り当てられた重みであり、PAは、欠陥がクラスAに正しく分類される確率である。信頼性レベルエンジンを訓練してマイノリティクラスの欠陥をより良好に分類するために、マイノリティクラスの重みは、マジョリティクラスに分類されたすべての欠陥内のマイノリティ欠陥の割合よりも高くすることができる。次いで、さらなるツリーを生成することができ、以前に生成されたツリーによって不正確に分類されたマイノリティ欠陥に対して、例えば、以下のように、より高い重みが割り当てられる。
【0074】
【数4】
他の欠陥と比較してある欠陥により高い重みを与えることは、異なる区別要因値を選ぶことによって実行することができ、その結果、分類に関して結果として得られる強化されたジニ不純度指数がより高くなる。
【0075】
したがって、信頼性レベルエンジン生成の出力は、各ツリーがクラスと重みとに関連づけられているツリーの集合である。重みは、各ツリーに関連するエラー率に基づいて取得することができる。エラー率は、ツリーがグラウンドトゥルースと異なる結果を出力する欠陥の重みの合計として定義することができる。
【0076】
ひとたび信頼性レベルエンジンが利用可能になると、PMC104は、マジョリティクラスに分類されたさらなる欠陥に信頼性レベルエンジンを適用することができ(220)、グラウンドトゥルースはこれらの欠陥には利用可能ではない。したがって、マジョリティクラスに分類されたそのような欠陥の各々は、信頼性レベルエンジンに供給され、信頼性レベルが取得される。信頼性レベルは、欠陥が確かにマジョリティクラスのものであり、誤ってマジョリティクラスに分類されなかったという信頼度を示す。信頼性レベルの取得は、ステップ216において生成されたツリーアンサンブルのすべてのツリーにより欠陥を分類し、欠陥をマジョリティクラスに分類するすべてのツリーの重みを合計し、それにより、0と1との間の信頼性レベルを取得することによって実行することができる。
【0077】
次いで、PMC104は、信頼性レベルが低い、例えば、所定の閾値未満である、マジョリティクラスに分類された欠陥を出力することができる(224)。代替として、マジョリティクラスに分類されたすべての欠陥のうちの、信頼性レベルが最も低い所定の数の欠陥または所定のパーセンテージを出力することができる。低い信頼性レベルは、欠陥がマジョリティ欠陥ではなく、マイノリティ欠陥である確率が高いことを示し得る。
【0078】
次に、
図5を参照すると、本開示の主題の特定の実施形態による試料をレビューする方法の一般化された流れ図が示される。
【0079】
PMC104は、非一時的コンピュータ可読記憶媒体に実装されたコンピュータ可読の命令に従って以下で詳述するそれぞれの動作を実行するように構成することができる。
【0080】
分類器は、ユーザによって分類された訓練欠陥を含む利用可能な訓練データに基づいて訓練される(500)。
【0081】
次いで、分類が分かっていないさらなる欠陥に対して、分類(504)が実行される。
【0082】
分類結果は、上述の
図2に関連して説明したようにモニタおよび拒絶することができる(508)。モニタは、例えば、
図2のステップ200、204、212、216、および220において詳述したように、マジョリティ欠陥の信頼性レベルを取得することに関連し、拒絶は、分類信頼性レベルが低い欠陥を出力する(224)ことに関連することができる。
【0083】
出力欠陥は、例えばユーザによってレビューされてもよく、グラウンドトゥルース分類がこれらの欠陥に対して受け取られてもよい(512)。
【0084】
ユーザによってマイノリティ欠陥として示された欠陥は、収集され(516)、「コンテナ」と呼ばれるストレージデバイスまたはデータ構造に保存され得る。訓練するのに十分なマイノリティ欠陥の数、例えば、30個、40個、100個などの少なくとも所定の数がコンテナに蓄積されると、新しい分類器を訓練することができ、新しい分類器では、このクラスもマジョリティクラスであり、それにより、マイノリティ欠陥も正しく分類することができる。したがって、この分類器は第1の分類器に取って代わることができる。
【0085】
次いで、訓練(500)は繰り返すことができ、これは、利用可能なグラウンドトゥルース分類を用いた分類器の再訓練または更新とも呼ばれ得る。
【0086】
図5の反復は、拒絶率が第1の所定の閾値未満に低下するまで、拒絶の数が第2の所定の閾値未満に低下するまで、または別の停止基準が満たされるまで、所定の回数、所定期間の間、継続することができる。
【0087】
本開示の主題の教示は
図2および
図5に示された方法によって拘束されないことを当業者は容易に理解するであろう。他の適切なアルゴリズムおよびその組合せが、マイノリティ欠陥を取得し、それに応じて分類器を訓練するために実装されてもよい。
【0088】
本発明は、本明細書に含まれるまたは図面に示される説明に記載された詳細に限定されない。本発明は、他の実施形態が可能であり、様々な方法で実践および実行することができる。したがって、本明細書で使用された語法および用語は、説明のためものであり、限定と見なされるべきでないことを理解されたい。そのため、本開示が基礎を置く概念は、本開示の主題のいくつかの目的を実行するために他の構造、方法、およびシステムを設計するための基礎として容易に利用できることを当業者は理解するであろう。
【0089】
本発明によるシステムが、適切にプログラムされたコンピュータで少なくとも部分的に実施され得ることも理解されるであろう。同様に、本発明は、本発明の方法を実行するためのコンピュータによって読取り可能なコンピュータプログラムを意図している。本発明は、本発明の方法を実行するためにコンピュータによって実行可能な命令のプログラムを明確に具現化する非一時的コンピュータ可読メモリをさらに意図している。
【0090】
様々な変形および変更が、添付の特許請求の範囲におよびそれによって定義された本発明の範囲から逸脱することなく、上記で記載された本発明の実施形態に適用されてもよいことを当業者は容易に理解するであろう。