特許6871807 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社ＳＣＲＥＥＮホールディングスの特許一覧

特許6871807分類器構築方法、分類器および分類器構築装置

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6871807

(24)【登録日】2021年4月20日

(45)【発行日】2021年5月12日

(54)【発明の名称】分類器構築方法、分類器および分類器構築装置

(51)【国際特許分類】

G06F 16/55 20190101AFI20210426BHJP

【ＦＩ】

G06F16/55

【請求項の数】8

【全頁数】20

(21)【出願番号】特願2017-107464(P2017-107464)

(22)【出願日】2017年5月31日

(65)【公開番号】特開2018-205860(P2018-205860A)

(43)【公開日】2018年12月27日

【審査請求日】2019年12月23日

(73)【特許権者】

【識別番号】000207551

【氏名又は名称】株式会社ＳＣＲＥＥＮホールディングス

(74)【代理人】

【識別番号】100088672

【弁理士】

【氏名又は名称】吉竹英俊

(74)【代理人】

【識別番号】100088845

【弁理士】

【氏名又は名称】有田貴弘

(72)【発明者】

【氏名】松村明

【審査官】鹿野博嗣

(56)【参考文献】

【文献】特開２０１７−０５４３３１（ＪＰ，Ａ）

【文献】特開２０１３−１１７７９３（ＪＰ，Ａ）

【文献】特開２０１２−１０８６８９（ＪＰ，Ａ）

【文献】奥村学、外2名，決定木学習を用いたテキスト自動要約手法に関するいくつかの考察，第５９回（平成１１年後期）全国大会講演論文集（２）人工知能と認知科学，日本，情報処理学会，１９９９年９月２８日，pp.393-394

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｇ０６Ｆ１６／５５

(57)【特許請求の範囲】

【請求項1】

データをその特徴量に基づいて複数のカテゴリに分類する分類器を構築する分類器構築方法であって、
（ａ）特別カテゴリであると教示されたＭ個（Ｍは２以上の自然数）の特別教師データと、前記特別カテゴリとは異なる一般カテゴリに属するＮ個（ＮはＭよりも大きい自然数）の一般教師データとを準備する工程と、
（ｂ）前記Ｎ個の前記一般教師データの中からｎ個（ｎはＭと同じかそれよりも小さい任意の自然数）を選択する工程と、
（ｃ）前記Ｍ個の特別教師データと前記（ｂ）工程にて選択された前記ｎ個の前記一般教師データとを用いた教師つき学習を行うことにより、前記特別教師データと前記一般教師データとを分類するコア分類器の候補を生成する工程と、
（ｄ）前記（ｃ）工程にて生成された前記候補について、前記Ｍ個の特別教師データのうち少なくとも一部を用いた再代入法により評価を行う工程と、
（ｅ）前記（ｄ）工程において、前記特別教師データを所定の再現率で前記特別カテゴリに正しく分類する前記候補を、前記コア分類器として採用する工程と、
（ｆ）前記（ｂ）工程から前記（ｅ）工程を繰り返すことによって、分類特性が異なる複数の前記コア分類器を備える分類器を構築する工程と、
を含む、分類器構築方法。

【請求項2】

請求項１の分類器構築方法であって、
前記（ｅ）工程において、前記所定の再現率が１００％である、分類器構築方法。

【請求項3】

請求項１または請求項２に記載の分類器構築方法であって、
前記（ｆ）工程は、
（ｆ−１）前記複数のコア分類器を備える前記分類器に、前記特別教師データおよび前記一般教師データを分類させたときに、前記特別カテゴリに正しく分類された教師データの適合率が所定値以上となるか否かを判定する工程、
を含み、
前記（ｆ−１）工程における、前記適合率が所定の基準値を超えるまで、前記（ｂ）工程から前記（ｅ）工程を繰り返して前記コア分類器を生成する、分類器構築方法。

【請求項4】

請求項１から請求項３のいずれか１項の分類器構築方法であって、
前記（ｆ）工程において生成される前記分類器は、分類対象のデータについて、前記複数のコア分類器の全てが前記特別カテゴリに属すると判定した場合に、当該データを前記特別カテゴリに分類する分類器である、分類器構築方法。

【請求項5】

請求項１から請求項４のいずれか１項の分類器構築方法であって、
前記データが画像データである、分類器構築方法。

【請求項6】

請求項５の分類器構築方法であって、
前記画像データが、パターンの欠陥を示す欠陥画像を示すデータである、分類器構築方法。

【請求項7】

データを複数のカテゴリに分類する分類器であって、
特性が異なっており、各々が前記データを特別カテゴリと一般カテゴリとに分類する複数のコア分類器と、
前記複数のコア分類器による前記データの分類結果を集計して、前記データの分類先のカテゴリを決定するカテゴリ決定部と、
を備え、
前記特別カテゴリであると教示されたＭ個（Ｍは２以上の自然数）の特別教師データと、前記特別カテゴリとは異なる一般カテゴリに属するＮ個（ＮはＭよりも大きい自然数）の一般教師データとを記憶する記憶部からｎ個（ｎはＭと同じかそれよりも小さい任意の自然数）の前記一般教師データを選択する教師データ選択部と、
前記Ｍ個の特別教師データと前記教師データ選択部により選択された前記ｎ個の前記一般教師データとを用いた教師つき学習に基づき、前記コア分類器の候補を生成するコア分類器生成部と、
前記コア分類器生成部により生成された前記候補について、前記Ｍ個の特別教師データのうち少なくとも一部を用いた再代入法により評価を行うコア分類器評価部と、
前記コア分類器評価部により、前記特別教師データを所定の再現率で前記特別カテゴリに正しく分類できたと評価された前記候補を、前記コア分類器として採用するコア分類器採用部と、
を有する、分類器構築部によって構築される、分類器。

【請求項8】

データを複数のカテゴリに分類する分類器を生成する分類器構築装置であって、
特別カテゴリであると教示されたＭ個（Ｍは２以上の自然数）の特別教師データと、前記特別カテゴリとは異なる一般カテゴリに属するＮ個（ＮはＭよりも大きい自然数）の一般教師データとを記憶する記憶部からｎ個（ｎはＭと同じかそれよりも小さい任意の自然数）の前記一般教師データを選択する教師データ選択部と、
前記Ｍ個の特別教師データと前記教師データ選択部により選択された前記ｎ個の前記一般教師データとを用いた教師つき学習に基づき、前記特別教師データと前記一般教師データとを分類するコア分類器の候補を生成するコア分類器生成部と、
前記コア分類器生成部により生成された前記候補について、前記Ｍ個の特別教師データのうち少なくとも一部を用いた再代入法により評価を行うコア分類器評価部と、
前記コア分類器評価部により、前記特別教師データを所定の再現率で前記特別カテゴリに正しく分類できたと評価された前記候補を、前記コア分類器として採用するコア分類器採用部と、
を備える、分類器構築装置。

【発明の詳細な説明】

【技術分野】

【0001】

この発明は、データを分類する分類器を構築する技術に関する。

【背景技術】

【0002】

半導体基板、ガラス基板、プリント配線基板等の製造では、異物や傷、エッチング不良等の欠陥を検査するために光学顕微鏡や走査電子顕微鏡等を用いて外観検査が行われる。また、このような検査工程において検出された欠陥に対して、詳細な解析を行うことによりその欠陥の発生原因を特定し、欠陥に対する対策が施される。

【0003】

近年では、基板上のパターンの複雑化および微細化に伴い、検出される欠陥の種類および数量が増加する傾向にあり、検査工程で検出された欠陥を自動的に分類する自動欠陥分類（Automatic Defect Classification：ＡＤＣ）も用いられる場合がある。自動欠陥分類によると、欠陥の解析を迅速かつ効率的に行うことが可能となっている。

【0004】

自動欠陥分類においては、ニューラルネットワークや決定木、判別分析等を利用した分類器が用いられる。分類器に自動分類を行わせるには、欠陥画像およびそのカテゴリ（すなわち、欠陥画像の種類）を示す信号を含む教師データを用意して分類器を学習させる必要がある。典型的には、各欠陥画像の欠陥の種別に対応したカテゴリを操作者が決定することにより、教師データが作成される。この教師データを用いた教師つき学習をコンピュータにおいて実行することにより、分類器が生成される。

【0005】

自動欠陥分類における分類器の分類性能は、分類器を学習させる教師データの質に大きく依存すると考えられている。質が高い教師データを用意するためには、操作者による大量かつ正確な教示作業が求められるため、操作者に多大な労力がかかるおそれがある。そこで、特許文献１のように、教示作業を迅速且つ正確に行うために、操作者を支援できるようにした教示用データの作成方法等が提案されている。

【0006】

また、例えば半導体分野におけるキラー欠陥は、素子の寿命・性能に致命的な悪影響を与えるものであるから、必ず除去したいという要請がある（例えば、特許文献２）。そこで、このような欠陥（以下、「特別欠陥」とも称する。）を自動欠陥分類により確実に分類したいという要求がある。

【先行技術文献】

【特許文献】

【0007】

【特許文献1】特開２０１６−４０６５０号公報

【特許文献2】特開２００９−２８３５８４号公報

【発明の概要】

【発明が解決しようとする課題】

【0008】

しかしながら、このような特別欠陥は、例えば出現率がデータ全体の１％にも満たないような場合も多く、教師データとして事例を蓄積することが容易ではないことも多い。また、特別欠陥（ただし、単一種）の事例数がある程度の数量（例えば数十個）蓄積できたときに、それまでに得られたその他の一般欠陥の事例は、数千〜数万個に達することもある。この全データをそのまま教師画像データとして、統計的手法に基づく機械学習により「特別欠陥」と「一般欠陥」とに２分する分類器を構築した場合、特別欠陥の再現率（Recall：特定のカテゴリであると教示された全教師データのうち、分類器によって正しくその特定のカテゴリに分類された教師データの割合）が、一般欠陥の再現率に比べて低くなる状況が起こり得る。

【0009】

【表1】

【0010】

表１は、稀に発生する特別欠陥を含む教師データを使い、多項式カーネルＳＶＭ（Support Vector Machine）で構築された分類器の分類性能を再代入法で評価した結果の一例である。表１は、分類器による分類結果を示す混同行列（分類表や混同対照表とも呼ばれる。）である。この表１では、事前に教示したカテゴリ（「特別欠陥」「一般欠陥」）を行見出しに記し、分類器により分類されたカテゴリを列見出しに記している。表１では、例えば、特別欠陥として教示された教師データのうち、特別欠陥に分類された教師データが７３個、一般欠陥に分類された教師データが２０３個であることを示している。

【0011】

また表１において、見出しに「Sum」と記す行は、分類器により各カテゴリに分類された教師データの総数を示す。見出しに「Sum」と記す列においても、これと同様である。見出しに「Precision」と記す行は、分類器によってある特定のカテゴリに分類された教師データのうち、正しく分類された教師データの割合（適合率）を示す。見出しに「Recall」と記す列は、特定のカテゴリであると予め教示された全教師データのうち、分類器によって正しくその特定のカテゴリに分類された教師データの割合（再現率）を示す。「Precision」の行と「Recall」の列とが交差するセルは、分類器により分類された教師データの総数のうち、分類器により分類されたカテゴリと教示されたカテゴリとが一致した教師データの総数の比率（正答率：Accuracy）である。

【0012】

表１の分類器を、総正答率に基づいて評価した場合、一般欠陥の正答数（４３８９０個）が総正答数（７３個＋４３８９０個）において支配的となる。このため、見かけ上の正答率は９９．５１％と極めて高い。しかしながら、特別欠陥についてのRecall（再現率）は２６．４５％と低くなっている。

【0013】

このような現象は、２つの欠陥カテゴリ各々の教師データ数の極端な不均衡が原因で発生する。すなわち、特徴空間内において、教師データが少数の特別欠陥については比較的集中した分布となり、教師データが多数の一般欠陥については比較的拡散した分布となる。しかも、これら２つの分布は、もともと欠陥という点で共通することから、比較的近接していたり、あるいは、特別欠陥の分布が一般欠陥の分布に内包されたりすることも想定され得る。このため、前記教示支援技術を用いて教示の信頼性を高めたとしても、そのまま単純に統計的手法に基づく学習をしただけでは、一般欠陥の分類性能を犠牲にするように調整したところで、特別欠陥についての分類性能を最低限許容できるレベル（例えば９９％）にまで高めることは困難である。

【0014】

一般論としては、分類器の構築に損失行列を導入することにより特別欠陥と一般欠陥に重み付けをして、分類器がより「特別欠陥」と分類する傾向を強める方法や、しきい値を導入して分類器の出した推定確信度がそれを下回ると欠陥種別の決定を避ける（棄却オプションと呼ばれる）方法、あるいは、教師データの間引きにより極端な不均衡を解消する方法などで対応することも考えられる。しかしながら、どの方法でも、「特別欠陥」に分類されたデータの中に大量の一般欠陥のデータが混入する虞がある。すると、最終的には人間が大量のデータを目視確認する必要があり、自動欠陥分類を利用する価値が大きく損なわれる。

【0015】

また、大量の正常な多次元データから異常（データを次元毎で見ると正常範囲内であるが全次元で見ると正常ではない状態）を示すデータを検出する技術として「外れ値検出」が知られている。これを利用した分類器は、データの生成される確率モデルを少ない頻度で更新するだけで済むようになるまでは、人間が分類結果を常時監視する必要があり、やはり自動欠陥分類を利用する価値が大きく損なわれる。

【0016】

そこで、本発明は、複数のカテゴリのうち特定カテゴリについて十分な数の教師データがない場合においても、その特定カテゴリについての再現率が高い分類器を提供することを目的とする。

【課題を解決するための手段】

【0017】

第１態様は、データをその特徴量に基づいて複数のカテゴリに分類する分類器を構築する分類器構築方法であって、（ａ）特別カテゴリであると教示されたＭ個（Ｍは２以上の自然数）の特別教師データと、前記特別カテゴリとは異なる一般カテゴリに属するＮ個（ＮはＭよりも大きい自然数）の一般教師データとを準備する工程と、（ｂ）前記Ｎ個の前記一般教師データの中からｎ個（ｎはＭと同じかそれよりも小さい任意の自然数）を選択する工程と、（ｃ）前記Ｍ個の特別教師データと前記（ｂ）工程にて選択された前記ｎ個の前記一般教師データとを用いた教師つき学習を行うことにより、前記特別教師データと前記一般教師データとを分類するコア分類器の候補を生成する工程と、（ｄ）前記（ｃ）工程にて生成された前記候補について、前記Ｍ個の特別教師データのうち少なくとも一部を用いた再代入法により評価を行う工程と、（ｅ）前記（ｄ）工程において、前記特別教師データを所定の再現率で前記特別カテゴリに正しく分類する前記候補を、前記コア分類器として採用する工程と、（ｆ）前記（ｂ）工程から前記（ｅ）工程を繰り返すことによって、分類特性が異なる複数の前記コア分類器を備える分類器を構築する工程とを含む。

【0018】

第２態様は、第１態様の分類器構築方法であって、前記（ｅ）工程において、前記所定の再現率が１００％である。

【0019】

第３態様は、第１態様または第２に記載態様の分類器構築方法であって、前記（ｆ）工程は、（ｆ−１）前記複数のコア分類器を備える前記分類器に、前記特別教師データおよび前記一般教師データを分類させたときに、前記特別カテゴリに分類された教師データの適合率が所定値以上となるか否かを判定する工程、を含み、前記（ｆ−１）工程における、前記適合率が所定の基準値を超えるまで、前記（ｂ）工程から前記（ｅ）工程を繰り返して前記コア分類器を生成する。

【0020】

第４態様は、第１態様から第３態様のいずれか１つの分類器構築方法であって、前記（ｆ）工程において生成される前記分類器は、分類対象のデータについて、前記複数のコア分類器の全てが前記特別カテゴリに属すると判定した場合に、当該データを前記特別カテゴリに分類する分類器である。

【0021】

第５態様は、第１態様から第４態様のいずれか１つの分類器構築方法であって、前記データが画像データである。

【0022】

第６態様は、第５態様の分類器構築方法であって、前記画像データが、パターンの欠陥を示す欠陥画像を示すデータである。

【0023】

第７態様は、データを複数のカテゴリに分類する分類器であって、特性が異なっており、各々が前記データを特別カテゴリと一般カテゴリとに分類する複数のコア分類器と、前記複数のコア分類器による前記データの分類結果を集計して、前記データの分類先のカテゴリを決定するカテゴリ決定部と、を備え、前記特別カテゴリであると教示されたＭ個（Ｍは２以上の自然数）の特別教師データと、前記特別カテゴリとは異なる一般カテゴリに属するＮ個（ＮはＭよりも大きい自然数）の一般教師データとを記憶する記憶部からｎ個（ｎはＭと同じかそれよりも小さい任意の自然数）の前記一般教師データを選択する教師データ選択部と、前記Ｍ個の特別教師データと前記教師データ選択部により選択された前記ｎ個の前記一般教師データとを用いた教師つき学習に基づき、前記コア分類器の候補を生成するコア分類器生成部と、前記コア分類器生成部により生成された前記候補について、前記Ｍ個の特別教師データのうち少なくとも一部を用いた再代入法により評価を行うコア分類器評価部と、前記コア分類器評価部により、前記特別教師データを所定の再現率で前記特別カテゴリに正しく分類できたと評価された前記候補を、前記コア分類器として採用するコア分類器採用部とを有する、分類器構築部によって構築される。

【0024】

第８態様は、データを複数のカテゴリに分類する分類器を生成する分類器構築装置であって、特別カテゴリであると教示されたＭ個（Ｍは２以上の自然数）の特別教師データと、前記特別カテゴリとは異なる一般カテゴリに属するＮ個（ＮはＭよりも大きい自然数）の一般教師データとを記憶する記憶部からｎ個（ｎはＭと同じかそれよりも小さい任意の自然数）の前記一般教師データを選択する教師データ選択部と、前記Ｍ個の特別教師データと前記教師データ選択部により選択された前記ｎ個の前記一般教師データとを用いた教師つき学習に基づき、前記特別教師データと前記一般教師データとを分類するコア分類器の候補を生成するコア分類器生成部と、前記コア分類器生成部により生成された前記候補について、前記Ｍ個の特別教師データのうち少なくとも一部を用いた再代入法により評価を行うコア分類器評価部と、前記コア分類器評価部により、前記特別教師データを所定の再現率で前記特別カテゴリに正しく分類できたと評価された前記候補を、前記コア分類器として採用するコア分類器採用部とを備える。

【発明の効果】

【0025】

第１実施形態の分類器構築方法によると、教師つき学習に使用される一般教師データの数を特別教師データの数と同じかそれよりも少なくすることによって、特別カテゴリについての再現率（Recall）が高いコア分類器を容易に生成し得る。また、母集団から選択される一般教師データを変更することによって、特別カテゴリについての再現率が高く、かつ、分類特性が異なる複数のコア分類器を獲得できる。このようなコア分類器を複数備えた分類器を構築することにより、特別カテゴリに分類されるべきデータを、一般カテゴリに誤分類する割合が極めて小さい分類器を構築し得る。また、複数のコア分類器を備えることによって、分類器の特別カテゴリについての適合率（Precision）を高めることができる。すなわち、一般カテゴリに分類されるべきデータのうち、特別カテゴリに誤分類されるデータの割合を軽減し得る。

【0026】

第２態様の分類器構築方法によると、コア分類器各々の特別欠陥の再現率を１００％とすることによって、特別カテゴリに分類すべきデータを、極めて高精度に正しく分類可能な分類器を得ることができる。

【0027】

第３態様の分類器構築方法によると、分類器において、特別カテゴリに分類される教師データの適合率を所定値以上に上げることによって、一般カテゴリに分類されるべきデータが特別カテゴリに誤分類される可能性が小さい分類器を構築し得る。

【0028】

第４態様の分類器構築方法によると、特別カテゴリについての分類精度が高い分類器を構築し得る。

【0029】

第５態様の分類器構築方法によると、画像データを分類する分類器を構築できる。

【0030】

第６態様の分類器構築方法によると、欠陥画像を分類する分類器を構築できる。

【0031】

第７実施形態の分類器によると、教師つき学習に使用される一般教師データの数を特別教師データの数と同じかそれよりも少なくすることによって、特別カテゴリについての再現率（Recall）が高いコア分類器を容易に生成し得る。また、母集団から選択される一般教師データを変更することによって、特別カテゴリについての再現率が高く、かつ、分類特性が異なる複数のコア分類器を獲得できる。このようなコア分類器を複数備えた分類器を構築することにより、特別カテゴリに分類されるべきデータを、一般カテゴリに誤分類する割合が極めて小さい分類器を構築し得る。また、複数のコア分類器を備えることによって、分類器の特別カテゴリについての適合率（Precision）を高めることができる。すなわち、一般カテゴリに分類されるべきデータのうち、特別カテゴリに誤分類されるデータの割合を軽減し得る。

【0032】

第８実施形態の分類器構築装置によると、教師つき学習に使用される一般教師データの数を特別教師データの数と同じかそれよりも少なくすることによって、特別カテゴリについての再現率（Recall）が高いコア分類器を容易に生成し得る。また、母集団から選択される一般教師データを変更することによって、特別カテゴリについての再現率が高く、かつ、分類特性が異なる複数のコア分類器を獲得できる。このようなコア分類器を複数備えた分類器を構築することにより、特別カテゴリに分類されるべきデータを、一般カテゴリに誤分類する割合が極めて小さい分類器を構築し得る。また、複数のコア分類器を備えることによって、分類器の特別カテゴリについての適合率（Precision）を高めることができる。すなわち、一般カテゴリに分類されるべきデータのうち、特別カテゴリに誤分類されるデータの割合を軽減し得る。

【図面の簡単な説明】

【0033】

【図1】実施形態の画像分類装置１の概略構成を示す図である。

【図2】実施形態の画像分類装置１による欠陥画像の分類の流れを示す図である。

【図3】ホストコンピュータ５の構成を示すブロック図である。

【図4】検査・分類装置４の分類器４２２を構築するためのホストコンピュータ５の機能構成を示すブロック図である。

【図5】実施形態の分類器６１１の構成を示すブロック図である。

【図6】実施形態に係る分類器構築部６１の学習部６１０の構成を示すブロック図である。

【図7】実施形態に係る学習部６１０による分類器６１１（特に、特別欠陥分類器７１）の構築の流れを示す図である。

【図8】特徴量空間における欠陥画像の分布の一例を示す図である。

【図9】特徴量空間に分布する教師データを分類する境界線Ｌ１を示す図である。

【図10】特徴量空間に分布する教師データを分類する境界線Ｌ２を示す図である。

【図11】特徴量空間に分布する教師データを分類する複数の境界線Ｌ１〜Ｌ７を示す図である。

【図12】少数の特別欠陥教師データ６３１と多数の一般欠陥教師データ６３３を用いて求められた境界線Ｌ１１を示す図である。

【図13】コア分類器７１１と適合率（Precision）の関係を示すグラフＧ１を示す図である。

【発明を実施するための形態】

【0034】

以下、添付の図面を参照しながら、本発明の実施形態について説明する。なお、この実施形態に記載されている構成要素はあくまでも例示であり、本発明の範囲をそれらのみに限定する趣旨のものではない。図面においては、理解容易のため、必要に応じて各部の寸法や数が誇張または簡略化して図示されている場合がある。

【0035】

＜１．実施形態＞
図１は、実施形態の画像分類装置１の概略構成を示す図である。画像分類装置１では、半導体基板９上のパターン欠陥を示す欠陥画像が取得され、その欠陥画像の分類が行われる。画像分類装置１は、撮像装置２、検査・分類装置４およびホストコンピュータ５を備えている。

【0036】

撮像装置２は、半導体基板９上の検査対象領域を撮像する。検査・分類装置４は、撮像装置２によって取得された画像データに基づく欠陥検査を行う。検査・分類装置４は、欠陥が検出された場合に、その欠陥を欠陥の種別（カテゴリ）毎に分類する。半導体基板９上に存在するパターンの欠陥のカテゴリは、欠損、突起、断線、ショート、異物などを含み得る。ホストコンピュータ５は、画像分類装置１の全体動作を制御するとともに、検査・分類装置４における欠陥の分類に利用される分類器４２２を生成する。

【0037】

撮像装置２は、半導体基板９の製造ラインに組み込まれ、画像分類装置１はいわゆるインライン型のシステムとされ得る。画像分類装置１は、欠陥検査装置に自動欠陥分類の機能を付加した装置である。

【0038】

撮像装置２は、撮像部２１、ステージ２２、ステージ駆動部２３を備えている。撮像部２１は、半導体基板９の検査領域を撮像する。ステージ２２は、半導体基板９を保持する。ステージ駆動部２３は、撮像部２１に対してステージ２２を半導体基板９の表面に平行な方向に相対移動させる。

【0039】

撮像部２１は、照明部２１１、光学系２１２および撮像デバイス２１３を備えている。光学系２１２は、半導体基板９に照明光を導く。半導体基板９にて反射した光は、再び光学系２１２に入射する。撮像デバイス２１３は、光学系２１２により結像された半導体基板９の像を電気信号に変換する。

【0040】

ステージ駆動部２３は、ボールネジ、ガイドレール、モータ等により構成されている。ホストコンピュータ５がステージ駆動部２３および撮像部２１を制御することにより、半導体基板９上の検査対象領域が撮像される。

【0041】

検査・分類装置４は、欠陥検出部４１および分類制御部４２を有する。欠陥検出部４１は、検査対象領域の画像データを処理しつつ欠陥を検出する。詳細には、欠陥検出部４１は、検査対象領域の画像データを高速に処理する専用の電気的回路を有し、撮像により得られた画像と参照画像（欠陥が存在しない画像）との比較や画像処理により検査対象領域の欠陥検査を行う。分類制御部４２は、欠陥検出部４１が検出した欠陥画像を分類する。詳細には、各種演算処理を行うＣＰＵや各種情報を記憶するメモリ等により構成され、特徴量算出部４２１および分類器４２２を有する。分類器４２２は、ニューラルネットワーク、決定木、判別分析等を利用して欠陥の分類、すなわち、欠陥画像の分類を実行する。

【0042】

図２は、実施形態の画像分類装置１による欠陥画像の分類の流れを示す図である。まず、図１に示す撮像装置２が半導体基板９を撮像することにより、検査・分類装置４の欠陥検出部４１が画像データを取得する（ステップＳ１１）。

【0043】

続いて、欠陥検出部４１が、検査対象領域の欠陥検査を行うことにより、欠陥の検出を行う（ステップＳ１２）。ステップＳ１２において欠陥が検出された場合（ステップＳ１２においてＹＥＳ）、欠陥部分の画像（すなわち、欠陥画像）のデータが分類制御部４２へと送信される。欠陥が検出されない場合は（ステップＳ１２においてＮＯ）、ステップＳ１１の画像データの取得が行われる。

【0044】

分類制御部４２は、欠陥画像を受け取ると、その欠陥画像の複数種類の特徴量の配列である特徴量ベクトルを算出する（ステップＳ１３）。その算出された特徴量ベクトルは分類器４２２に入力され、分類器４２２により分類が行われる（ステップＳ１４）。すなわち、分類器４２２により欠陥画像が複数のカテゴリのいずれかに分類される。画像分類装置１では、欠陥検出部４１にて欠陥が検出される毎に、特徴量ベクトルの算出がリアルタイムに行われ、多数の欠陥画像の自動分類が高速に行われる。

【0045】

次に、ホストコンピュータ５による分類器４２２の学習について説明する。図３は、ホストコンピュータ５の構成を示すブロック図である。

【0046】

ホストコンピュータ５は、ＣＰＵ５１、ＲＯＭ５２およびＲＡＭ５３を有する。ＣＰＵ５１は各種演算処理を行う演算回路を含む。ＲＯＭ５２は基本プログラムを記憶している。ＲＡＭ５３は各種情報を記憶する揮発性の主記憶装置である。ホストコンピュータ５は、ＣＰＵ５１，ＲＯＭ５２およびＲＡＭ５３をバスライン５０１で接続した一般的なコンピュータシステムの構成を備えている。

【0047】

ホストコンピュータ５は、固定ディスク５４、ディスプレイ５５、入力部５６、読取装置５７および通信部５８を備えている。これらの要素は、適宜インターフェース（Ｉ／Ｆ）を介してバスライン５０１に接続されている。

【0048】

固定ディスク５４は、情報記憶を行う補助記憶装置である。ディスプレイ５５は、画像などの各種情報を表示する表示部である。入力部５６は、キーボード５６ａおよびマウス５６ｂ等を含む入力用デバイスである。読取装置５７は、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読取可能な記録媒体８から情報の読み取りを行う。通信部５８は、画像分類装置１の他の要素との間で信号を送受信する。

【0049】

ホストコンピュータ５は、読取装置５７を介して記録媒体８からプログラム８０を読み取り、固定ディスク５４に記録される。当該プログラム８０は、ＲＡＭ５３にコピーされる。ＣＰＵ５１は、ＲＡＭ５３内に格納されたプログラム８０に従って、演算処理を実行する。

【0050】

図４は、検査・分類装置４の分類器４２２を構築するためのホストコンピュータ５の機能構成を示すブロック図である。ホストコンピュータ５は、分類器構築部６１、記憶部６３を備える。分類器構築部６１は、ホストコンピュータ５のＣＰＵ５１がプログラム８０に従って動作することにより、分類器構築部６１は、学習部６１０、分類器６１１および分類器評価部６１３の機能を構成する。学習部６１０は、分類器６１１を学習させることにより分類器４２２を構築する。分類器６１１は、正確にはＲＡＭ５３などの記憶部において予め定められた記憶領域に分類を行うために必要な情報を格納することによって実現される機能構成である。検査・分類装置４の分類器４２２も同様である。

【0051】

ホストコンピュータ５の記憶部６３は、固定ディスク５４またはＲＡＭ５３により構成される。記憶部６３は、各欠陥画像のデータである欠陥画像データ８０１および特徴量ベクトル８０２を記憶する。各欠陥画像に対応する欠陥画像データ８０１と特徴量ベクトル８０２とは関連付けされている。特徴量ベクトル８０２は、既述のように、各欠陥画像から得られる複数種類の特徴量の配列である。特徴量ベクトル８０２に含まれる特徴量の項目としては、例えば、欠陥部分の面積、明度平均、周囲長、平坦度または欠陥部分を楕円形に近似した場合のその長軸の傾き等が採用され得る。

【0052】

記憶部６３は、各欠陥画像データ８０１に関連付けられた教示欠陥カテゴリ８１１を記憶する。教示欠陥カテゴリ８１１は、ユーザにより各欠陥画像に付与された欠陥カテゴリである。すなわち、教示欠陥カテゴリ８１１は、異物の種類、傷の種類、パターン不良の種類等を欠陥画像各々に関連付ける教示作業の結果を示す情報である。

【0053】

ホストコンピュータ５にて学習により分類器６１１が構築されると、学習後の分類器６１１（正確には、分類器６１１の構造や変数の値を示す情報）が検査・分類装置４へと転送され、分類器４２２として利用される。もちろん、ホストコンピュータ５の機能は、検査・分類装置４に含めることも可能である。

【0054】

図５は、実施形態の分類器６１１の構成を示すブロック図である。分類器６１１は、特別欠陥分類器７１および一般欠陥分類器７３を含む。

【0055】

特別欠陥分類器７１は、欠陥検出部４１により欠陥が検出された欠陥画像を、特別な欠陥カテゴリ（以下、「特別欠陥」という。）と、特別欠陥ではない一般の欠陥カテゴリ（以下、「一般欠陥」という。）に分類する。特別欠陥は、例えば、半導体基板９において発生し得る欠陥のうち、高い精度（ここでは、ほぼ１００％の精度）で分類すべき欠陥カテゴリである。具体的に、半導体基板９を製造するための装置（スパッタリング装置等）自体に由来する金属（クロム、ニッケルなど）の異物が付着した場合、ロット単位で半導体基板９を廃棄する事態が招来するおそれがある。このため、このような欠陥を有する半導体基板９については、確実に分離することが望ましい。特別欠陥分類器７１は、このような特別欠陥を持つ欠陥画像を「特別欠陥」に分類する。

【0056】

一般欠陥分類器７３は、特別欠陥カテゴリに分類されなかった画像（すなわち、「一般欠陥」に分類された欠陥画像）を、さらに複数のサブ欠陥カテゴリに分類する。

【0057】

特別欠陥分類器７１は、複数のコア分類器７１１とカテゴリ決定部７１３とを含む。複数のコア分類器７１１は、互いに異なる特性を有しており、各々が、欠陥画像を特徴量ベクトルに基づいて「特別欠陥カテゴリ」および「一般欠陥カテゴリ」のいずれかに分類する。コア分類器７１１の生成方法については、後述する。

【0058】

カテゴリ決定部７１３は、全てのコア分類器７１１の分類結果を集計し、分類対象である欠陥画像の分類先カテゴリを決定する。本実施形態では、全てのコア分類器７１１が「特別欠陥」に分類した場合に、カテゴリ決定部７１３は分類対象の欠陥画像の分類先を「特別欠陥」とする。つまり、少なくとも１つ以上のコア分類器７１１が欠陥画像を「一般欠陥」に分類した場合には、カテゴリ決定部７１３はその欠陥画像の分類先を「一般欠陥」とする。

【0059】

一般欠陥分類器７３は、特別欠陥分類器７１によって一般欠陥カテゴリに分類された欠陥画像を、その特徴量ベクトルに応じて、一般欠陥カテゴリよりも下位のサブである、サブ欠陥カテゴリ（例えば、「欠損」「突起」「断線」「ショート」および「異物」等）に分類する。一般欠陥分類器７３は、サブ欠陥毎に教示された教師データを用いた教師つき学習により構築され得る。

【0060】

次に、分類器構築部６１による特別欠陥分類器７１の構築方法について説明する。図６は、実施形態に係る分類器構築部６１の学習部６１０の構成を示すブロック図である。また、図７は、実施形態に係る学習部６１０による分類器６１１（特に、特別欠陥分類器７１）の構築の流れを示す図である。

【0061】

図６に示すように、分類器構築部６１は、教師データ選択部１０１、コア分類器生成部１０３、コア分類器評価部１０５およびコア分類器採用部１０７を備える。特別欠陥教師データ６３１および一般欠陥教師データ６３３が準備される（図７：ステップＳ２０）。これらのデータは、記憶部６３に予め用意されるデータであって、欠陥画像を示すデータ（欠陥画像データ８０１）に、その欠陥画像が持つ特徴量の値を示すデータ（特徴量ベクトル８０２）、および、その欠陥画像が持つ欠陥のカテゴリ（欠陥の種類、ここでは、「特別欠陥」と「一般欠陥」）を示すデータ（教示欠陥カテゴリ８１１）が関連付けされて構成されるデータである。

【0062】

特別欠陥教師データ６３１および一般欠陥教師データ６３３は、コア分類器７１１の作成に供される教師データである。特別欠陥教師データ６３１は、予め用意された複数の欠陥画像データ８０１のうち、オペレータによって「特別欠陥」であると教示されたデータである。一般欠陥教師データ６３３は、「特別欠陥」とは異なるカテゴリである「一般欠陥」に分類されるべき欠陥画像を示す教師データであって、オペレータによって「特別欠陥」とは教示されなかったデータである。なお、「特別欠陥」であると教示されていないことは、すなわち間接的に「一般欠陥」であると教示されているとも捉えることができる。一般欠陥教師データ６３３は、「一般欠陥」よりさらに下位の細かなサブカテゴリが教示されていてもよい。ただし、コア分類器７１１を作成する上ではこれは必須ではない。特別欠陥教師データ６３１の数量（Ｍ個、Ｍは２以上の自然数）は、一般欠陥教師データ６３３の数量（Ｎ個、Ｎは２以上の自然数）に比べて小さいものとする（すなわち、Ｎ＞Ｍ）。

【0063】

教師データ選択部１０１は、複数（Ｎ個）の一般欠陥教師データ６３３の中から、一部（ｎ個）を選択する（図７：ステップＳ２１）（すなわち、ｎ＜Ｎ）。ここでは、教師データ選択部１０１は、全ての一般欠陥教師データ６３３からランダムに選択する。ただし、教師データ選択部１０１は、ランダムではなく所定の条件に従って一般欠陥教師データ６３３を選択してもよい。選択される一般欠陥教師データ６３３の数量（ｎ個）は、予め用意された特別欠陥教師データ６３１の数量（Ｍ個）と同じか、それよりも小さい数量とされる（すなわち、ｎ≦Ｍ）。

【0064】

特別欠陥教師データ６３１の数（Ｍ個）と選択される一般欠陥教師データ６３３の数（ｎ個）との比（＝ｎ：Ｍ）は、例えば、元の母集団における、一般欠陥教師データ６３３の数（Ｎ個）と特別欠陥教師データ６３１の数（Ｍ個）との比（＝Ｎ：Ｍ）の逆比（＝Ｍ：Ｎ）に近くなるようにするとよい（すなわち、ｎ：Ｍ≒Ｍ：Ｎ）。

【0065】

続いて、コア分類器生成部１０３は、コア分類器７１１の候補を生成する（図７：ステップＳ２２）。より詳細には、コア分類器生成部１０３は、予め用意された全て（Ｍ個）の特別欠陥教師データ６３１と、教師データ選択部１０１によって選択された複数（ｎ個）の一般欠陥教師データ６３３とを用いた教師つき学習を行うことによって、コア分類器７１１の候補を生成する。コア分類器生成部１０３が実施する教師つき学習は、一般的な統計学的手法（例えば、ニューラルネットワーク、ＲＢＦ（radial basis function）カーネルまたは多項式カーネルのＳＶＭ）である。

【0066】

コア分類器評価部１０５は、コア分類器生成部１０３によって生成されたコア分類器７１１の候補を再代入法により評価する（ステップＳ２３）。詳細には、コア分類器評価部１０５は、コア分類器７１１の候補の生成に使用された複数の特別欠陥教師データ６３１をコア分類器７１１の候補に再代入することにより、その分類精度が求められる。コア分類器７１１の候補の評価には、そのコア分類器７１１の生成に使用された特別欠陥教師データ６３１のうち全てが使用されてもよいし、そのうちの一部が使用されてもよい。

【0067】

コア分類器採用部１０７は、コア分類器評価部１０５により、特別欠陥についての再現率（Recall）が１００％であるコア分類器７１１の候補（すなわち、特別欠陥教師データ６３１の全てを正しく特別欠陥に分類できたコア分類器の候補）を、コア分類器７１１に採用する（図７：ステップＳ２４）。コア分類器７１１の候補が採用されるとは、具体的には、当該コア分類器７１１が特別欠陥分類器７１に組み込まれることをいう。一方、コア分類器採用部１０７は、再現率が１００％でないコア分類器７１１の候補については、廃棄する。

【0068】

続いて、分類器構築部６１は、コア分類器７１１の生成を終了するか否かを判定する（図７：ステップＳ２５）。分類器構築部６１は、コア分類器７１１の生成を継続する場合（ステップＳ２５においてＮｏ）、ステップＳ２１に戻って、新たなコア分類器７１１の生成を再び行う。

【0069】

ここで、ステップＳ２５の判定は、例えば、複数のコア分類器７１１が組み込まれた特別欠陥分類器７１の分類精度が、所定の基準を満たすかどうかに基づいて行われるとよい。このような特別欠陥分類器７１の分類精度は、分類器評価部６１３（図４参照）によって評価され得る。

【0070】

より具体的には、分類器評価部６１３は、記憶部６３に保存されているＭ個の特別欠陥教師データ６３１およびＮ個の一般欠陥教師データ６３３について、特別欠陥分類器７１に分類させる再代入法が行われる。そして、特別欠陥についての適合率（Precision）、すなわち、コア分類器７１１により特別欠陥に分類された教師データの中で、正しく分類された教師データ（特別欠陥教師データ６３１）の割合が求められる。この適合率が所定基準値を超える場合には、コア分類器７１１の生成が終了され、適合率が所定基準値を超えない場合には、再びコア分類器７１１の生成が行われるとよい。このようにして、特別欠陥についての適合率が所定基準を超えるまで、コア分類器７１１が追加されることとなる。

【0071】

なお、ステップＳ２５の判定基準として、単に、特別欠陥分類器７１に採用されたコア分類器７１１の数が、既定数に到達したか否かに基づいて行われてもよい。この場合、分類器構築部６１が、予め設定された数のコア分類器７１１が生成された否かを判断するとよい。分類器構築部６１は、コア分類器７１１が既定数に達している場合（ステップＳ２５においてＹＥＳ）、分類器構築部６１は特別欠陥分類器７１の構築処理を終了する。そして、コア分類器７１１が設定数に達していない場合（ステップＳ２５においてＮｏ）、分類器構築部６１はステップＳ２１に戻って、新たなコア分類器７１１を再度生成する。このように、特別欠陥分類器７１として採用されるコア分類器７１１が既定数に到達するまで、ステップＳ２１〜ステップＳ２４が繰り返し実行されるとよい。

【0072】

図８〜図１１は、特徴量空間における欠陥画像の分布の一例を示す図である。欠陥画像の分類に用いられる特徴量ベクトルとして、一般には多種類の特徴量が用いられる。このため、自動欠陥分類において、一般的な特徴量空間は、使用される複数種の特徴量のそれぞれを一の座標軸とするために多次元空間となり得る。しかしながら、ここでは、理解容易のため、２種類の特徴量Ｘ１，Ｘ２からなる２次元の特徴量空間を想定する。図８における各点は、欠陥画像を特徴量で表したときそれらの値を特徴量空間における座標値として持つ点を表しており、それぞれの点が１つの欠陥画像に対応する。収集された欠陥画像（特別欠陥教師データ６３１および一般欠陥教師データ６３３）をその特徴量ベクトルに応じて特徴量空間にプロットすると、図８に示すように、類似した特徴を有する欠陥画像がある程度まとまって２つのクラスターＣ１，Ｃ２を形成する。クラスターＣ１は特別欠陥教師データ６３１に対応する欠陥画像の群であり、クラスターＣ２は一般欠陥教師データ６３３に対応する欠陥画像の群を表すものとする。一般欠陥は多様な欠陥を含むため、そのカテゴリに含まれる欠陥画像は、特別欠陥の欠陥画像に比べて、数量が大きく、かつ、分布が比較的広範囲にわたる。

【0073】

図７において説明したコア分類器７１１の生成は、このようなクラスターＣ１，Ｃ２を分類するための境界線（特徴量空間が多次元の場合は分離超平面とも呼ばれる。）を生成することと等価である。ここで、図７において説明したコア分類器７１１の生成過程を、この特徴量空間に着目して説明する。

【0074】

図９は、特徴量空間に分布する教師データを分類する境界線Ｌ１を示す図である。境界線Ｌ１は、分類器構築部６１にコア分類器７１１の１つに対応する。図６，７において説明したように、コア分類器７１１を生成するため、まず、教師データ選択部１０１がクラスターＣ２に含まれる多数の一般欠陥教師データの中から一部の教師データを選択する（図７：ステップＳ２１）。このとき、選択されるデータ数は、クラスターＣ１に含まれる比較的少数の特別欠陥教師データの数量と同じか、それよりも小さい数とされる。図９では、全ての一般欠陥教師データのうち、選択されたデータを黒塗りの丸点で示しており、選択されなかったデータを白抜きの丸点で示している。

【0075】

続いて、コア分類器生成部１０３が、予め準備された全ての特別欠陥教師データ６３１と選択された一般欠陥教師データ６３３とを使った教師つき学習により、コア分類器７１１（候補）が生成される。すなわち、この教師つき学習により境界線Ｌ１が求められる。図９に示す境界線Ｌ１の下側（特徴量Ｘ２軸の負側）は特別欠陥に対応し、上側（特徴量Ｘ２軸の正側）は一般欠陥に対応する。

【0076】

ステップＳ２３，Ｓ２４では、コア分類器７１１（候補）の分類精度に基づき、その採否が決定される。具体的には、特別欠陥についての再現率（Recall）が１００％であるか評価される。図９に示す境界線Ｌ１の場合、予め準備された全ての特別欠陥教師データ６３１が境界線Ｌ１の下側にある。すなわち、特別欠陥についての再現率が１００％となっている。このため、この境界線Ｌ１に対応するコア分類器７１１（候補）は、採用されて、特別欠陥分類器７１に組み込まれることとなる。

【0077】

図１０は、特徴量空間に分布する教師データを分類する境界線Ｌ２を示す図である。境界線Ｌ２の場合、左側（特徴量Ｘ１軸の正側）が特別欠陥に対応し、右側（特徴量Ｘ１軸の負側）が一般欠陥に対応する。境界線Ｌ２の場合、予め用意された特別欠陥教師データ６３１が、全て境界線Ｌ２の左側にある。すなわち、特別欠陥についての再現率が１００％となっている。このため、この境界線Ｌ２に対応するコア分類器７１１（候補）も採用されて、特別欠陥分類器７１に組み込まれることとなる。

【0078】

境界線Ｌ１，Ｌ２各々に対応するコア分類器７１１，７１１を生成する際、図９および図１０に示すように、選択される一般欠陥教師データ６３３の組合せが異なっている。このため、コア分類器７１１，７１１の分類特性（すなわち、境界線Ｌ１，Ｌ２の傾きおよび切片の数値）が異なったものとなる。

【0079】

図１１は、特徴量空間に分布する教師データを分類する複数の境界線Ｌ１〜Ｌ７を示す図である。コア分類器７１１の生成、評価および採否決定（図７に示すステップＳ２０〜ステップＳ２４）が繰り返し行われると、図１１に示すように、各コア分類器７１１に対応する境界線Ｌ１〜Ｌ７が生成されることとなる。境界線Ｌ１〜Ｌ７は、いずれも、特別欠陥ついての再現率（Recall）が１００％となっている。すなわち、特別欠陥教師データ６３１の全てを正しく特別欠陥に分類可能となっている。したがって、境界線Ｌ１〜Ｌ７によって囲まれる領域内に、予め用意された特別欠陥教師データ６３１のクラスターＣ１が納まることとなる。

【0080】

図１２は、少数の特別欠陥教師データ６３１と多数の一般欠陥教師データ６３３を用いて求められた境界線Ｌ１１を示す図である。図１２は、一般欠陥教師データ６３３を選択せずに分類器の一例に対応する。この場合、一般欠陥教師データ６３３の数・分布が支配的となるため（つまり、影響が強くなるため）、図１２に示すように、特別欠陥教師データ６３１のクラスターＣ１を分割する境界線Ｌ１１が得られる傾向がある。このため、分類器における特別欠陥の再現率が低下、すなわち、一般欠陥に誤分類される特別欠陥の画像が増大するため、特別欠陥を正しく分類する分類器を得ることができない。これに対して、図９、図１０において説明したように、一般欠陥教師データ６３３を選択して教師つき学習を行うことによって、特別欠陥の再現率が１００％の分類器（コア分類器７１１）を容易に獲得し得る。

【0081】

【表2】

【0082】

表２は、図７に示すステップＳ２３に関して、生成された１つのコア分類器７１１の分類性能についての評価結果の一例である。このコア分類器７１１は、２７６個の特別欠陥教師データ６３１と、２３個の一般欠陥教師データ６３３とを使用した教師つき学習を行って生成されたものである。そして、このコア分類器７１１の生成に使用した教師データを使って、当該コア分類器７１１を評価したものである。このコア分類器７１１では、特別欠陥についての再現率（Recall）が１００％である。また、特別欠陥についての適合率（Precision）も１００％となっている。

【0083】

【表3】

【0084】

表３は、表２に示す分類性能を持つコア分類器７１１による、教師データの分類結果を示している。具体的に、表３は、２７６個の特別欠陥教師データ６３１と、４３９０５個の一般欠陥教師データを、コア分類器７１１によって分類した結果を示している。このコア分類器７１１の分類結果によると、特別欠陥についての再現率（Recall）は１００％となっている。すなわち、このコア分類器７１１は、特別欠陥の教師データについては、１００％の精度で特別欠陥に分類可能となっている。一方、このコア分類器７１１の特別欠陥についての適合率（Precision）は１．５１％と極めて低い値となっている。これはつまり、特別欠陥に１００個の教師データが分類されたとすると、そのうちの１．５１個しか正しく分類されていないことを意味する。

【0085】

【表4】

【0086】

表４は、３２個のコア分類器７１１とカテゴリ決定部７１３とを含む特別欠陥分類器７１による分類結果を示している。表４では、表３と同様に、２７６個の特別欠陥教師データ６３１と、４３９０５個の一般欠陥教師データが使われている。上述したように、特別欠陥分類器７１においては、分類対象のデータについて、全てのコア分類器７１１が特別欠陥に分類した場合に、カテゴリ決定部７１３がそのデータを特別欠陥に分類する。

【0087】

表４に示す例では、特別欠陥についての再現率（Recall）は１００％となっている。すなわち、３２個のコア分類器７１１を備える特別欠陥分類器７１よっても、特別欠陥教師データ６３１については、１００％の精度で特別欠陥に分類可能となっている。また、特別欠陥についての適合率（Precision）は、１４．１１％と低いものの、表３に示す単一のコア分類器７１１の適合率（１．５１％）に比べて大きく改善されている。

【0088】

図１３は、コア分類器７１１と適合率（Precision）の関係を示すグラフＧ１を示す図である。図１３において、横軸はコア分類器７１１の個数を示しており、縦軸は適合率（Precision）を示している。図１３に示すように、並列動作するコア分類器７１１の数に応じて、特別欠陥についての適合率の数値は向上し得る。原理的には、コア分類器７１１の数を増やすほど、一般欠陥である欠陥画像を特別欠陥に分類してしまう誤分類を減少させることができる。しかしながら、コア分類器７１１の数を増大させた場合、特別欠陥分類器７１の構築に長時間を要する他、構築された特別欠陥分類器７１による分類にかかる時間が大きく延びる虞がある。一方で、適合率をあげることによって、特別欠陥に分類される欠陥画像の数量を、オペレータが全数チェックすることも許容されるレベルにまで軽減し得る。そこで、実運用上は、特別欠陥の適合率が許容範囲に達する程度の数量のコア分類器７１１を備えた特別欠陥分類器７１を構築するとよい。

【0089】

＜効果＞
本実施形態の検査・分類装置４によると、図６，図７において説明したように、教師つき学習において、比較的少ない特別欠陥教師データ６３１の数と同一もしくは少なくなるように、比較的多い一般欠陥教師データ６３３の中から一部を選択して、教師付学習を行うことにより、特別欠陥の再現率（Recall）が１００％のコア分類器７１１を容易に生成できる。

【0090】

また、選択される一般欠陥教師データ６３３を変更することによって、分類特性の異なるコア分類器７１１を備えた特別欠陥分類器７１を構築できる。これにより、特別カテゴリに分類されるべきデータを一般カテゴリに誤分類する可能性が低い特別欠陥分類器７１を構築できる。さらに、特別欠陥分類器７１の特別欠陥についての適合率（Precision）を高めることができる。このように、カテゴリ間での教師データの数量が不均衡な場合であっても、本発明の手法を取り入れることにより、分類成績の優れた分類器を獲得できる。

【0091】

＜２．変形例＞
以上、実施形態について説明してきたが、本発明は上記のようなものに限定されるものではなく、様々な変形が可能である。

【0092】

上記実施形態では、コア分類器７１１の候補を特別欠陥分類器７１に採用する条件として、そのコア分類器の特別欠陥についての再現率の基準値を１００％としている。しかしながら、再現率の基準値を１００％とすることは必須ではなく、例えば、１００％未満の値としてもよい。ただし、再現率を１００％とすることによって、特別欠陥を含む画像を、高精度に特別欠陥に分類する特別欠陥分類器７１を構築し得る。

【0093】

本発明は、半導体基板の画像分類だけでなく、例えば、表示装置（液晶表示装置、プラズマディスプレイまたは有機ＥＬ等）用、フォトマスク用等のガラス基板、磁気・光ディスク用のガラスまたはセラミック基板、太陽電池用のガラスまたはシリコン基板、その他フレキシブル基板の画像分類にも適用可能である。また、本発明は、生体組織、生体組織から単離した細胞または培養細胞などを撮像して得られる画像の分類にも適用可能である。さらに、本発明は、可視光により撮像される画像以外に、電子線やＸ線等により撮像される画像の分類にも適用可能である。また、本発明は、画像データ以外の特徴量ベクトルが定義可能な各種データ（測定データ等）の分類にも適用し得る。

【0094】

この発明は詳細に説明されたが、上記の説明は、すべての局面において、例示であって、この発明がそれに限定されるものではない。例示されていない無数の変形例が、この発明の範囲から外れることなく想定され得るものと解される。上記各実施形態および各変形例で説明した各構成は、相互に矛盾しない限り適宜組み合わせたり、省略したりすることができる。

【符号の説明】

【0095】

１画像分類装置
２撮像装置
４検査・分類装置
５ホストコンピュータ
２１撮像部
４１欠陥検出部
４２分類制御部
４２１特徴量算出部
４２２分類器
５１ＣＰＵ
６１分類器構築部
６１０学習部
６１１分類器
６１３分類器評価部
６３記憶部
６３１特別欠陥教師データ
６３３一般欠陥教師データ
７１特別欠陥分類器
７１１コア分類器
７１３カテゴリ決定部
１０１教師データ選択部
１０３コア分類器生成部
１０５コア分類器評価部
１０７コア分類器採用部
９半導体基板
Ｌ１〜Ｌ７，Ｌ１１境界線

【図1】