特許第5873764号(P5873764)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社SCREENホールディングスの特許一覧

<>
  • 特許5873764-欠陥画像の提示方法 図000002
  • 特許5873764-欠陥画像の提示方法 図000003
  • 特許5873764-欠陥画像の提示方法 図000004
  • 特許5873764-欠陥画像の提示方法 図000005
  • 特許5873764-欠陥画像の提示方法 図000006
  • 特許5873764-欠陥画像の提示方法 図000007
  • 特許5873764-欠陥画像の提示方法 図000008
  • 特許5873764-欠陥画像の提示方法 図000009
  • 特許5873764-欠陥画像の提示方法 図000010
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5873764
(24)【登録日】2016年1月22日
(45)【発行日】2016年3月1日
(54)【発明の名称】欠陥画像の提示方法
(51)【国際特許分類】
   G06F 17/30 20060101AFI20160216BHJP
【FI】
   G06F17/30 210D
   G06F17/30 170B
   G06F17/30 210A
【請求項の数】7
【全頁数】17
(21)【出願番号】特願2012-128518(P2012-128518)
(22)【出願日】2012年6月6日
(65)【公開番号】特開2013-254286(P2013-254286A)
(43)【公開日】2013年12月19日
【審査請求日】2014年8月25日
(73)【特許権者】
【識別番号】000207551
【氏名又は名称】株式会社SCREENホールディングス
(74)【代理人】
【識別番号】100105935
【弁理士】
【氏名又は名称】振角 正一
(74)【代理人】
【識別番号】100105980
【弁理士】
【氏名又は名称】梁瀬 右司
(74)【代理人】
【識別番号】100136836
【弁理士】
【氏名又は名称】大西 一正
(72)【発明者】
【氏名】松村 明
【審査官】 野崎 大進
(56)【参考文献】
【文献】 特開2001−256480(JP,A)
【文献】 国際公開第2009/031297(WO,A1)
【文献】 特開2010−091401(JP,A)
【文献】 特開2003−233801(JP,A)
【文献】 特開2001−273302(JP,A)
【文献】 特開平08−194821(JP,A)
【文献】 特開2011−048668(JP,A)
【文献】 米国特許出願公開第2010/0174707(US,A1)
【文献】 米国特許出願公開第2003/0152276(US,A1)
【文献】 武者 義則 他,類似画像検索における特徴量空間の可視化インタフェース,電子情報通信学会論文誌,日本,社団法人電子情報通信学会,1999年10月25日,Vol.J82-D-II,No.10,pp.1628-1633.
(58)【調査した分野】(Int.Cl.,DB名)
G06F 17/30
(57)【特許請求の範囲】
【請求項1】
欠陥を撮像した複数の欠陥画像の中から欠陥の典型例を含む典型画像の候補をコンピュータが選出しユーザに提示することで、前記典型画像を見つけ出すユーザ作業を支援する欠陥画像の提示方法であって、
前記コンピュータが、
前記欠陥画像のそれぞれについて、複数の特徴量を算出する特徴量算出工程と、
前記複数の特徴量をそれぞれ一の座標軸とする多次元の特徴量空間内において互いに近接した2つの前記欠陥画像同士を互いに同一のグループとすることで、前記複数の欠陥画像をグループ化するグループ化工程と、
前記グループの少なくとも1つについて、当該グループに属する前記欠陥画像の少なくとも1つを表示部に表示することで、前記典型画像の候補としてユーザに提示する提示工程と
を含む処理を実行することを特徴とする、欠陥画像の提示方法。
【請求項2】
前記グループ化工程では、前記複数の欠陥画像から選択した基準画像について当該基準画像に近接する前記欠陥画像を探索する探索処理を行うことで前記欠陥画像のグループ化を行い、
前記探索処理では、
前記特徴量空間内において前記基準画像が位置する点を基準座標点として設定し、
一の前記座標軸について、当該座標軸に対応する特徴量の値が当該座標軸における前記基準座標点の値から予め定められた近傍範囲内にある前記欠陥画像を候補画像として選び出す抽出処理を、複数の前記座標軸を対象として実行し、
前記抽出処理の対象とした複数の前記座標軸の全てにおいて前記候補画像として選ばれた前記欠陥画像を、前記基準画像に近接する近傍画像として前記基準画像と同一のグループとする請求項1に記載の欠陥画像の提示方法。
【請求項3】
一の前記座標軸について、前記複数の欠陥画像における当該座標軸に対応する特徴量の値の分布態様に応じて前記近傍範囲を設定する請求項2に記載の欠陥画像の提示方法。
【請求項4】
一の前記座標軸に対応する特徴量の、前記複数の欠陥画像間での最大値と最小値とを含む数値範囲を所定の分割数で複数に均等分割した区間の数値範囲を、前記近傍範囲とする請求項3に記載の欠陥画像の提示方法。
【請求項5】
前記複数の特徴量のうち、前記複数の欠陥画像間での最大値と最小値との差が、当該特徴量に対して予め設定された閾値よりも大きいものについて、当該特徴量に対応する座標軸を前記抽出処理の対象とする請求項2ないし4のいずれかに記載の欠陥画像の提示方法。
【請求項6】
前記グループ化工程では、
前記複数の欠陥画像を、複数の前記特徴量ごとに、当該特徴量の値とその値を有する前記欠陥画像とを関連付けたテーブルを作成し、
前記複数の欠陥画像の中で前記基準画像を順次変更しながらその都度前記探索処理を行って、当該基準画像に対する前記近傍画像を探索する請求項2ないし5のいずれかに記載の欠陥画像の提示方法。
【請求項7】
前記提示工程では、属する前記欠陥画像が最も多いグループを含む少なくとも1つのグループについて、当該グループに属する前記欠陥画像の少なくとも1つを前記典型画像の候補として提示する請求項1ないし6のいずれかに記載の欠陥画像の提示方法。
【発明の詳細な説明】
【技術分野】
【0001】
この発明は、欠陥を撮像した欠陥画像をユーザに提示する方法に関し、特に、多数の欠陥画像から欠陥の典型例を含む典型画像を見つけ出す作業を支援するための欠陥画像の提示方法に関するものである。
【背景技術】
【0002】
例えば半導体やプリント基板等の製造技術分野では、製品に含まれる欠陥を検出しこれを分析・評価するために、評価対象物を顕微鏡等を介して撮像し、得られた画像について複数種の特徴量を算出して自動分類を行うことが研究されている。この種の技術においては、典型的な欠陥を含む画像として予め与えられた教師画像に基づく学習アルゴリズムを利用した分類技術が多数提案されている。
【0003】
例えば特許文献1に記載の技術では、ユーザにより欠陥カテゴリが指定された教師画像の特徴量を求め、その値を用いて遺伝的アルゴリズムにより学習を行うことで判別木を生成して未知の欠陥画像の分類を行えるようにしている。この場合、ユーザから与えられる情報の確度が学習結果の精度に大きく影響し、ユーザが与えた情報の確度が低い場合には却って分類精度が低下する可能性がある。一方、このような問題に対応するため、特許文献2に記載された技術においては、欠陥種別に対応する分類カテゴリの1つ1つに対して複数の典型画像をユーザに指定させ、これらに基づく学習を行うことで、学習結果に基づく分類精度の向上が図られている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2003−317083号公報
【特許文献2】特開2010−071826号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
上記した従来技術のいずれも、典型画像(もしくは教師画像)の選定がユーザの作業に委ねられている点では変わりない。すなわちユーザは、欠陥を含む多数の欠陥画像を個々に目視確認してそれらの中から典型画像を選び出すという作業を行う必要があり、この作業に対して上記従来技術は何らの支援を提供することができない。このため、上記従来技術では、分類精度に関わる典型画像の選定が依然としてユーザの判断のみによって行われており、結果のばらつきやユーザに過大な負担を強いるという問題が残されていた。
【0006】
この発明は上記課題に鑑みなされたものであり、複数の欠陥画像から典型画像を選び出すためのユーザ作業を効果的に支援することのできる技術を提供することを目的とするものである。
【課題を解決するための手段】
【0007】
この発明にかかる欠陥画像の提示方法は、欠陥を撮像した複数の欠陥画像の中から欠陥の典型例を含む典型画像の候補をコンピュータが選出しユーザに提示することで、前記典型画像を見つけ出すユーザ作業を支援する欠陥画像の提示方法であって、上記目的を達成するため、前記コンピュータが、前記欠陥画像のそれぞれについて、複数の特徴量を算出する特徴量算出工程と、前記複数の特徴量をそれぞれ一の座標軸とする多次元の特徴量空間内において互いに近接した2つの前記欠陥画像同士を互いに同一のグループとすることで、前記複数の欠陥画像をグループ化するグループ化工程と、前記グループの少なくとも1つについて、当該グループに属する前記欠陥画像の少なくとも1つを表示部に表示することで、前記典型画像の候補としてユーザに提示する提示工程とを含む処理を実行することを特徴としている。
【0008】
このように構成された発明では、複数の欠陥画像をそれぞれ複数の特徴量によって表すとともに、それらの特徴量を座標軸とする特徴量空間内での位置関係に基づいてグループ化する。より具体的には、特徴量空間内で近接した位置にある、つまり画像の特徴が類似した欠陥画像同士が1つのグループとなるように欠陥画像をグループ化する。このように、類似した特徴を有する欠陥画像が予めグループ化され、その結果に基づく典型画像の候補が提示されることで、複数の欠陥画像から典型画像の選出をしようとするユーザの作業負荷は大幅に軽減される。というのは、多数の欠陥画像が予めいくつかのグループに仕分けられていることで、欠陥画像の全てを同様の重みをもって逐一確認する必要がなくなるからである。
【0009】
また、従来技術におけるユーザの目視判断による典型画像の選定作業では、特徴量により定量的かつ客観的に表される画像の特徴とは矛盾した指定がなされることがあり得る。例えば、それぞれの特徴量を比較する限りでは類似しているとみなせる2つの欠陥画像に対して異なる欠陥種別が指定されたり、その逆に特徴量では大きく相違する2つの欠陥画像に対して同一の欠陥種別が指定されることがある。このように、ユーザの主観に基づく判断と定量的な分析結果とが矛盾する場合があり、このことが学習の精度を低下させてしまう。これに対し本発明では、特徴量に基づく類似の有無を予め判断し提示することができるため、このような矛盾した指定がなされることを未然に回避し、学習およびそれに基づく分類の精度を高めることが可能である。
【0010】
また、1つのグループに属する欠陥画像の数が多ければ当該グループに共通する特徴が出現頻度の高い「典型的な」欠陥に起因するものであると言える一方、属する欠陥画像の数が少ないグループはより出現頻度の低い特異な欠陥を示していると言える。このように、グループの大きさ、つまりグループに属する欠陥画像の多寡が欠陥の出現頻度を指標する情報となり、このような情報を予め把握しておくことで、ユーザは出現頻度の高い欠陥に対応する典型画像をより容易に見出すことが可能となる。
【0011】
このように、本発明によれば、複数の欠陥画像から典型画像を選定するユーザの作業を効果的に支援して、ユーザの負荷を軽減するとともに、選定された典型画像を用いた学習やその結果に基づく分類を高精度に行うことが可能となる。なお、典型画像の候補に関するユーザへの提示については、例えばあるグループに属する欠陥画像の全てまたは代表的な一部を表示するものであってもよく、また例えば多数の欠陥画像から典型画像の候補をユーザが容易に抽出することのできるインデックス情報を提示するものであってもよい。
【0012】
ここで、本発明のグループ化工程では、例えば、複数の欠陥画像から選択した基準画像について当該基準画像に近接する欠陥画像を探索する探索処理を行うことで欠陥画像のグループ化を行うようにしてもよい。この探索処理では、例えば、特徴量空間内において基準画像が位置する点を基準座標点として設定し、一の座標軸について、当該座標軸に対応する特徴量の値が当該座標軸における基準座標点の値から予め定められた近傍範囲内にある欠陥画像を候補画像として選び出す抽出処理を、複数の座標軸を対象として実行し、抽出処理の対象とした複数の座標軸の全てにおいて候補画像として選ばれた欠陥画像を、基準画像に近接する近傍画像として基準画像と同一のグループとすることができる。
【0013】
複数の画像間での類似度合いを判断する方法として、特徴量空間内における各画像に対応する点間の距離を求める方法がこれまで一般的に行われており、例えばユークリッド距離、マンハッタン距離およびマハラノビス距離などがこの目的のために使用される。しかしながら、欠陥画像の特徴を表すための特徴量としては種々のものがあり、特徴量空間の次元が100を超えるような場合もある。このように特徴量空間の次元が多くなると、複数の画像間で相互に上記距離を求めるための演算量は膨大なものとなり、例えば浮動小数点処理など高度な演算能力を有するプロセッサが必須となる。
【0014】
一方、上記した本発明の探索処理では、一の特徴量における値同士の比較を特徴量の種類数だけ行うことにより、2つの欠陥画像間の類似度合いが判断される。このため、従来の方法に比べて演算量が大幅に削減され、また高度な演算能力も必要とされない。
【0015】
この場合、例えば、一の座標軸について、複数の欠陥画像における当該座標軸に対応する特徴量の値の分布態様に応じて近傍範囲を設定するようにしてもよい。複数の欠陥画像において、ある1つの特徴量の値がどのような分布を示すかは、収集される画像の内容に依存し、予め予想することは困難である。また、実際の分布の態様を反映せずに設定された近傍範囲が用いられることで、欠陥画像間の類似度合いが不適切に判断されてしまうおそれがある。収集された欠陥画像における特徴量の値の分布態様に応じて近傍範囲を設定し探索処理を行うことで、このような問題を未然に回避することができる。
【0016】
より具体的には、例えば、一の座標軸に対応する特徴量の、複数の欠陥画像間での最大値と最小値とを含む数値範囲を所定の分割数で複数に均等分割した区間の数値範囲を近傍範囲とすることができる。このようにすると、特徴量の最大値から最小値までの分布範囲が複数の区間に均等に分割され、特徴量の値がどの区間にあるかの判断のみで、当該欠陥画像が候補画像とすべきものであるか否かを判定することができる。これにより処理はさらに簡略化される。
【0017】
また例えば、複数の特徴量のうち、複数の欠陥画像間での最大値と最小値との差が当該特徴量に対して予め設定された閾値より大きいものについて、当該特徴量に対応する座標軸を抽出処理の対象とするようにしてもよい。複数の欠陥画像間である特徴量の最大値と最小値との差が小さいとき、その特徴量が表す特徴に関しては各画像間で大きな差異がないということができる。したがって、その特徴量については抽出処理の対象から除外しても結果にはほとんど影響せず、またそうすることで必要な処理量をさらに低減することができる。
【0018】
また例えば、グループ化工程では、複数の特徴量ごとに、当該特徴量の値と、その値を有する欠陥画像とを関連付けたテーブルを作成し、複数の欠陥画像の中で基準画像を順次変更しながらその都度探索処理を行って、当該基準画像に対する近傍画像を探索するようにしてもよい。このように、それぞれの特徴量ごとにその値と欠陥画像とを関連付けたテーブルは、複数の欠陥画像のうちいずれが基準画像に選ばれた場合でも、当該基準画像の近傍画像を探索する上で有用なものとなる。というのは、当該基準画像における特徴量の値に近い値を有する他の欠陥画像を、テーブルを参照することで直ちに導出することができるからである。特に基準画像を順次変更しながら繰り返し探索処理を行う場合、全ての基準画像について同一のテーブルを参照することができるので、その効果は特に顕著となる。
【0019】
また、本発明における提示工程は、例えば、属する欠陥画像が最も多いグループを含む少なくとも1つのグループについて、当該グループに属する欠陥画像の少なくとも1つを典型画像の候補として提示するように構成されてもよい。1つのグループに含まれる欠陥画像の数が多いほど、当該グループに共通する特徴が、高い頻度で出現する典型的なものであることを意味している。したがって、当該グループに属する欠陥画像の各々、あるいはそれらの全体が、典型画像とされるべき蓋然性が高い画像であると言える。このため、このような大きなグループに属する画像を提示することは、多くの欠陥画像の中から典型画像とされるべき蓋然性の高い画像を選び出す作業をユーザに代わって行うことと同様の意義を有する。これにより、ユーザの作業が大幅に軽減される。
【発明の効果】
【0020】
この発明によれば、欠陥画像をその特徴に応じて予めグループ分けして提示することで、多くの欠陥画像から典型画像を選び出すユーザの作業を効果的に支援することが可能となる。
【図面の簡単な説明】
【0021】
図1】本実施形態の処理対象である欠陥画像の概念を示す図である。
図2】この実施形態における処理の流れの概略を示すフローチャートである。
図3】特徴量空間における画像の分布の例を示す図である。
図4】この実施形態における近傍の範囲を示す図である。
図5】近傍画像を探索するための前処理を示すフローチャートである。
図6】特徴量の値の正規化・量子化の概念を示す図である。
図7】量子化された特徴量と画像番号とを関連付けたテーブルの例を示す図である。
図8】欠陥画像のグループ化処理を示すフローチャートである。
図9】この発明を好適に適用可能な検査システムの概略構成を示す図である。
【発明を実施するための形態】
【0022】
以下、この発明の一実施形態である欠陥画像の提示方法について説明する。この実施形態は、複数の欠陥画像を自動学習アルゴリズムによりいくつかの欠陥カテゴリに分類する自動欠陥分類を行うに当たり、その前段階の処理として実行されるものである。より詳しくは、基板等の検査対象物を撮像して収集された複数の欠陥画像の中から典型的な欠陥を含み自動学習における教師画像となりうる典型画像を見つけ出すユーザの作業を支援するための処理である。説明に先立って、本実施形態および以下の説明の前提となっている概念について説明しておく。
【0023】
図1は本実施形態の処理対象である欠陥画像の概念を示す図である。図1(a)に示すように、予め収集された欠陥画像群IGに属する各欠陥画像(以下、単に「画像」と称する場合がある)に対しては、各画像を個々に区別するための識別符号として連番かつ一意の画像番号(1,2,…)が付される。以下の説明では、欠陥画像群IGの画像総数をP(Pは2以上の自然数)とし、そのうちの任意の1つの画像を画像番号p(pは自然数、1≦p≦P)として表すものとする。
【0024】
各画像に含まれる欠陥の特徴は、複数の特徴量により表現される。図1(b)に示すように、本実施形態ではN種類(Nは2以上の自然数)の特徴量により欠陥の特徴が表され、これら各種の特徴量のそれぞれに大文字Xを用いた符号X1,X2,…,XNが付される。そのうちの任意の1つの特徴量は、符号Xn(nは自然数、1≦n≦N)により表されるものとする。
【0025】
画像番号pの欠陥画像に対応する特徴量の値は小文字xを用いて符号xpnにより表される。したがって、例えば画像番号1の欠陥画像に対応するN種類の特徴量の値は、それぞれ符号x11,x12,…,x1Nにより表される。また、画像番号1,2,…,Nに対応する特徴量X1の値は、それぞれx11,x21,…,xP1により表される。また、一の特徴量Xnに着目したとき、各欠陥画像に対応する当該特徴量の値x1n,x2n,…,xPnのうちの最大値が符号Mn、最小値が符号mnにより表される。
【0026】
図2はこの実施形態における処理の流れの概略を示すフローチャートである。最初に、互いに異なる複数の欠陥画像が取得され(ステップS101)、それらの欠陥画像により欠陥画像群IGが構成される。各欠陥画像は、検査対象である例えば半導体基板の外観に現れたピンホールや異物等の欠陥を含むものであり、同一基板の異なる位置で撮像された複数の画像や、互いに異なる基板において撮像された複数の画像などを多数収集して欠陥画像群IGを構成することができる。
【0027】
こうして取得された複数の欠陥画像の各々について、複数の特徴量X1,…,XNが算出される(ステップS102)。これにより、各々の欠陥画像に含まれる欠陥の特徴がN種類の特徴量により定量的に表される。複数の特徴量を座標軸とする多次元の特徴量空間を想定したとき、各欠陥画像をその特徴量の値を座標値とする座標点として特徴量空間内にプロットすることができる。欠陥画像に含まれる欠陥の特徴が類似した画像は、特徴量空間内で互いに近接した位置に位置づけられる。言い換えれば、特徴量空間内で互いに近接した位置にある複数の画像の欠陥の特徴(例えば形状、大きさ等)は類似しており、それらは同じタイプの起源に基づく欠陥である可能性が高いと推定することができる。
【0028】
学習アルゴリズムを用いた自動欠陥分類を精度よく行うためには、収集された複数の欠陥画像の中から教師画像となる典型的な欠陥を含む画像(典型画像)を見つけ出す必要がある。同一の欠陥であってもその発現態様は微妙に異なっており、コンピュータによる画像処理等で自動的に典型画像を求める技術は確立されていない。そのため、典型画像の選定は熟練したユーザの経験に基づく判断に委ねられているのが現状である。このとき、ユーザは事前に何らの手がかりもなく多数の画像を隈なく精査して典型画像を選び出す必要があり、その作業負荷は非常に大きい。収集された画像から自動的に把握できる欠陥の傾向や相関性に関する情報がユーザに対して提供されると便宜である。
【0029】
そこで、この実施形態では、特徴量空間内で互いに近接した位置にある画像同士が同一のグループとなるように各欠陥画像がグループ化される(ステップS103)。これにより、類似した特徴を有する画像が互いに関連付けられる。そして、こうして形成されたグループごとに、当該グループに属する画像からいくつかが典型画像の候補としてユーザに提示される。このとき、形成されたいくつかのグループの中では、大きなグループ、つまりそのグループに属する画像の数が多いものから優先的に順に提示される(ステップS104)。
【0030】
提示される画像の数は任意であり、同一グループに属する画像全てであってもよく、またその一部でもよい。提示の態様としては、提示の対象とされた画像を例えばディスプレイ等の表示手段に表示する方法であってもよく、また例えば同一グループに属する欠陥画像の画像番号のリストを出力する方法であってもよい。また、グループの大きさを把握し得るような情報、例えばそのグループに属する欠陥画像の数に関する情報をさらに付加してもよい。
【0031】
属する画像の数が大きいグループを優先的に提示する理由は以下の通りである。類似した特徴を有する画像を集めたグループが大きいほど、その特徴を有する欠陥が発生頻度の高い「典型的な」ものであることを意味している。したがって、教師画像に基づく学習アルゴリズムに際しては、当該グループに対応する典型画像が教師画像に含まれていることが望ましい。このため、大きなグループから優先的に画像の提示を行うようにしている。
【0032】
このような提示がなされることにより、相互の関連付けが全くなされていない未整理の多数の欠陥画像の中から、互いに類似する特徴を有する画像のみが絞り込まれて提示されることになる。そのため、ユーザは提示されたそれらの画像の中からいくつかの典型画像を選ぶだけで済むこととなり、典型画像の指定におけるユーザの作業負荷は大幅に軽減される。すなわち、未整理の画像群から最終的に典型画像を選出するための作業の多くが自動的に、かつ客観的に行われる。なお、1つのグループに属する画像から選出される典型画像の数は任意であり、例えば同一グループ内の画像全て、あるいはそのうち明らかに起源の異なると見られるもののみを除外した全てを典型画像としてもよい。
【0033】
また、ユーザは、互いに類似する欠陥画像についてはその全てをチェックする必要はなく、提示されたいくつかの画像から把握される特徴的な部分を見てその欠陥が典型的なものか否かを判断すればよい。一方で、類似する特徴を持つ画像の少ない特殊な欠陥を含む画像であっても小さいながらも1つのグループとして提示されることで、そのような特殊な欠陥についても見落とすことなく、典型画像とするか否かをユーザに判断させることができる。
【0034】
また、ユーザの目視のみで典型画像を選出する場合、特徴量に基づき定量的に判断される画像の特徴と矛盾する指定がなされ、これに基づく学習が却って分類結果に混乱をもたらす可能性があり得る。しかしながら、この実施形態では類似する画像とそうでない画像とが予め仕分けられており、その情報を把握した上でユーザが典型画像を指定することができるため、このように定量的な判断と矛盾する指定がなされる可能性は極めて低くなっている。
【0035】
次に、収集された多数の欠陥画像から互いに類似した特徴を有する画像のグループを見つけ出す方法について説明する。前述したように、一般的には、特徴量空間内において近接した位置にある複数の画像は互いに類似しているということができる。したがって、複数の画像について特徴量空間内における相互の距離を算出することで、画像間の類似度合いを推定することが可能である。このような類似度合いを表すパラメータとして、ユークリッド距離、マンハッタン距離、マハラノビス距離などが知られているが、高次元空間において多数の画像間で互いにこれらの距離を求めるための演算量は膨大である。また、高次元の特徴量空間では欠陥画像間の距離の比較がほとんど意味をなさない場合があることが「次元の呪い」として知られている。この実施形態では、多次元空間内での距離計算を伴わないためこのような問題が生じず、かつより簡便な方法で画像間の類似度合いを推定しており、その方法について次に説明する。
【0036】
図3は特徴量空間における画像の分布の例を示す図である。ここでは、2種類の特徴量X1、X2による二次元の特徴量空間を例として説明するが、より高い次元の特徴量空間においても以下の考え方を拡張して適用することが可能である。一例として、特徴量X1、X2をそれぞれ座標軸とする二次元特徴量空間に、20枚の欠陥画像(P=20)をその特徴量の値に応じてプロットした場合を考える。図3において、内部に数字を付した丸印は特徴量空間における各欠陥画像の位置を示し、数字はそれぞれの欠陥画像の画像番号を表している。
【0037】
画像番号1〜20の20枚の画像は、特徴量X1、X2の値に応じて座標空間内の各位置に配置される。ここで、図3に破線で示したように、互いに近接位置にある画像同士をまとめてゆくことで、画像全体をいくつかのグループに分けることができる。例えば画像番号1,4,7,13,17,20で表される一群の画像は互いに近接しており、全体として1つの塊(クラスタ)を構成している。1つの欠陥画像を基準画像として、その近傍にある他の欠陥画像を基準画像と同じグループに含ませるとともに、該他の欠陥画像に対し近傍位置にあるさらに別の欠陥画像についても、基準画像と同じグループとする。なお、他の画像からの距離が遠い孤立した画像(例えば画像番号8)については、当該孤立画像を唯一の構成要素とする1つのグループとみなせばよい。
【0038】
図4はこの実施形態における近傍の範囲を示す図である。この実施形態の考え方では、1つの欠陥画像を基準画像Isとしたとき、特徴量空間における当該基準画像の位置を中心として、特徴量X1に対応する座標軸において適宜に定めた近傍範囲R1、特徴量X2に対応する座標軸において適宜に定めた近傍範囲R2の範囲内にある画像を探索し、そのような画像があればそれを当該基準画像に近接する近傍画像と判定する。
【0039】
この例では、基準画像Isに対し特徴量X1に対応する座標軸において近傍範囲R1内にある画像としてはそれぞれ符号I1、I2で示される画像があるが、このうち特徴量X2に対応する座標軸においても近傍範囲R2内にある画像I1が基準画像の近傍画像とされる。画像I2は特徴量X2に対応する座標軸において範囲外であるため、近傍とはみなされない。一方、画像I3は特徴量X2に対応する座標軸においては近傍範囲R2内にあるが、特徴量X1に対応する座標軸において範囲外であるため、やはり近傍とはみなされない。両座標軸のいずれにおいても範囲外である画像I4は当然に近傍ではないとされる。
【0040】
このような基準に基づく判定は、上記したユークリッド距離等に基づく判定ほど厳密なものではないとも言えるが、各座標軸ごとの独立した演算の繰り返しにより判定を行うことができ、次元数が増加したときに指数関数的に演算量が増大する上記の距離計算に比べ、演算量がさほど大きくならないという利点がある。また、ここでの判定の目的は、一応関連があるとみられる画像をグループ化して提示することでユーザの判断を支援するというものであり、そのための近傍画像の探索という目的においては上記判定方法は必要十分な精度を得ることができるものである。すなわち、ここでは処理量の少なさの利点が演算の正確さよりも優先される。
【0041】
図5は近傍画像を探索するための前処理を示すフローチャートである。この処理は、多数の欠陥画像間で相互の近傍関係をスムーズに探索するために、各欠陥画像の特徴量の値の関係を特徴量の種類ごとに予め整理しておく処理である。この処理は、図2に示した処理のうちステップS101およびS102と、ステップS103の一部とに相当する。複数の欠陥画像が取得されると(ステップS201)、各欠陥画像を識別するための符号として連番の画像番号が付与される(ステップS202)。そして、各欠陥画像について、N種類の特徴量がそれぞれ算出される(ステップS203)。
【0042】
次いで、N種類から1つの特徴量Xnが選択され、当該特徴量の値x1n,x2n,…,xPnの大小関係に基づき各欠陥画像が配列される。ここでは例えば昇順に配列されるものとする(ステップS205)。画像の配列において、実際の欠陥画像を並べる必要はなく、特徴量の値の順に配列された画像番号の列が得られればよい。
【0043】
そして、これらの特徴量の最大値Mnと最小値mnとの差分が求められる(ステップS206)。この差分が所定の閾値aと比較され(ステップS207)、閾値aを超えていれば次のステップS208〜S211が実行される一方、閾値以下ならこれらの各ステップはスキップされる。
【0044】
ステップS208〜S211では、各欠陥画像間での特徴量の値の比較を容易にするために、特徴量の値を正規化・量子化するとともに、その値と画像番号とを関連付けたテーブルを作成する。ただし、特徴量の最大値Mnと最小値mnとの差分が閾値以下であるとき、当該特徴量については各画像間で有意な差がないとみなし、そのような作業を省略する。閾値aとしては、例えば倍精度浮動小数点型で表現し得る最小正数の1000倍の値とすることができる。最大値Mnと最小値mnとの差がこのように定められた閾値a以下であるとき、各欠陥画像間での値の差はさらに微小なものとなり、当該特徴量に対応する座標軸に関しては各画像間で比較するまでもなくそれらが極めて近接しているとみなせるからである。このように結果にほとんど影響のない特徴量を除外することで、実質的な次元数が元のN次元よりも小さくなり、演算量をさらに低減することができる。
【0045】
ステップS208では、特徴量の値の昇順配列において隣接する画像間相互での特徴量の値の差δを求め、それらの値δを累積加算してデータ数で割ることにより、差分の平均値Δnを算出する。これにより特徴量の値の広がりの範囲を求める。このとき、値δが所定の閾値bnよりも小さいときは、隣接する画像間での特徴量の差が実質的にゼロであるとして累積加算から除外し、データ数からも除外する。閾値bnについては、例えば(Mn−mn)/1000とすることができる。このようにすることで、次に行う特徴量の量子化において、画像間での特徴量の値のばらつきの態様に応じて、不必要に細かいステップとならない適切な量子化ステップを適用することが可能となる。
【0046】
ステップS209では、当該特徴量Xnに対応する座標軸における量子化分割数Knを求める。量子化分割数Knについては次式:
Mn≦Kn・Δn
の関係を満たすような最小の整数とすることができる。さらに、ステップS210において、こうして定められた量子化分割数に基づき、個々の欠陥画像における特徴量Xnの値xpnが次式:
ypn=Int{(xpn−mn)/Δn+0.5}
により正規化・量子化される。ここで、Int{x}は、変数xの整数部分を値として返す関数である。また、0.5を加えて整数化するのは、小数点以下を四捨五入するためである。
【0047】
これにより、当該特徴量Xnに対応する座標軸において最小値mnから最大値Mnまでの範囲に分布する各欠陥画像の特徴量の値xpnは、1〜Knまでの離散的な値を取る正規化・量子化された値ypnに変換される。これにより、画像間における特徴量の値の微小な差異に関する情報は失われることになるが、この情報は本実施形態のような用途においては必要のないものであり、結果にはほとんど影響しない。そして、こうして量子化された特徴量の値ypnとその値を取る欠陥画像の画像番号とを関連付けたテーブルを作成する(ステップS211)。
【0048】
このような処理を、特徴量の全種について行う(ステップS212)。すなわち、選択する特徴量を順次変更しながら、上記した特徴量の値の正規化・量子化およびこれに基づくテーブルの作成を行う。なお、ステップS207において一部の特徴量が除外される可能性があるため、テーブルはN種の特徴量の全てについて作成されるとは限らない。以下ではテーブルが作成された特徴量の数をN’(≦N)によって表す。
【0049】
図6は特徴量の値の正規化・量子化の概念を示す図である。また、図7は量子化された特徴量と画像番号とを関連付けたテーブルの例を示す図である。これらの図およびその説明における欠陥画像群としては、図3に示したものと同じものを用いる。二次元の特徴量空間において特徴量の値を量子化するとは、特徴量空間において各画像を表す座標点の位置を、図6に破線で示すように等間隔に設けた格子点のうち最も近いものの位置に移動させることに相当する。また、特徴量の値を正規化するとは、1つの座標軸において、量子化された特徴量の最小値が1、最大値がKnとなるように座標軸をスケーリングすることに相当している。なお、図6の例では、特徴量X1(n=1)に対応する横軸において量子化分割数Kn(すなわちK1)が9、特徴量X2(n=2)に対応する縦軸において量子化分割数Kn(すなわちK2)を10となっているが、これらは一例を示したものにずぎず、量子化分割数は、上記した通り各座標軸における特徴量の値の分布に応じて定まるものである。
【0050】
画像番号1〜20の各欠陥画像が、上記のような正規化・量子化の結果、特徴量空間のどこに位置づけられたかを各特徴量ごとに示すのが、図7に例示するテーブルである。図7(a)は特徴量X1についてのテーブル、図7(b)は特徴量X2についてのテーブルである。図において「区画番号」は正規化・量子化された特徴量の値と同義であり、「区画に該当する画像番号」は正規化・量子化の結果として特徴量の値が区画番号と同じになる欠陥画像の画像番号を意味している。例えば図7(a)を見ると、特徴量X1に対応する座標軸において正規化・量子化された特徴量の値が1となるのは、画像番号4,7,10の3つであることが示されている。
【0051】
このように、それぞれの特徴量について、特徴量の値と画像番号とを関連付けたテーブルを作成しておけば、基準画像として1つの画像番号が指定されたとき、当該基準画像と特徴量の値が近い他の欠陥画像の画像番号を直ちにテーブルから読み出すことが可能である。
【0052】
具体的には、このテーブルを次のように利用する。例えば画像番号1で表される欠陥画像を基準画像として、特徴量空間においてその近傍にある近傍画像を探索する場合を考える。基準画像に対応する画像番号として例えば画像番号1が指定されると、特徴量の値が基準画像の値に対して近傍範囲にあるものが候補画像として各テーブルから特定される。ここでは、基準画像と同一区画およびそれに隣接する区画までを近傍範囲とする。そうすると、特徴量X1については、図7(a)から明らかなように、画像番号1と同一区画(区画番号2)に属しているのは、画像番号1,11,13,18,20の5つ、隣接する区画(区画番号1および3)に属しているのは4,7,10,14,17の計5つである。すなわち、特徴量X1についての候補画像は、画像番号1,4,7,10,13,14,17,18,20でそれぞれ特定される画像である。
【0053】
一方、特徴量X2については、図7(b)からわかるように、基準画像と同じ区画番号2に属するのは画像番号1,7,16であり、隣接する区画番号1および3に属するのは区画番号4,13,17,20である。したがって、特徴量X2についての候補画像は、画像番号1,4,7,13,16,17,20でそれぞれ特定される画像である。
【0054】
特徴量空間内で近傍にある画像とは、全ての座標軸(特徴量)において基準画像の近傍範囲にある画像である。したがって、特徴量X1、X2それぞれでの候補画像の積集合を取り、そこから基準画像自体を除外した画像番号4,7,13,17,20で表される画像が、基準画像(画像番号1)に対応する近傍画像であると言うことができる。なお、この場合の特徴量空間は、元のN次元空間から最大値Mnと最小値mnとの差が小さいと判断された(図5のステップS207)座標軸を除いたN’次元空間である。この原理を用いて、この実施形態では以下のようにして欠陥画像のグループ化を行う。
【0055】
図8は欠陥画像のグループ化処理を示すフローチャートである。この処理は、図2のステップS103に相当するものである。最初に、収集されている複数の欠陥画像の中からまだグループ化されていない欠陥画像を選び出し、これを基準画像に指定する(ステップS301)。この基準画像に対して、グループを識別するための適宜のグループラベルを付与する(ステップS302)。異なるグループに同一のラベルを与えることのないよう、このときのグループラベルは既存のグループに割り当てられていない新たなものとする。
【0056】
次に、基準画像に対する近傍画像の探索を行う。すなわち、上記原理に基づき、先に作成されたN’面のテーブルを参照して、各特徴量においてその値が基準画像の値に対して近傍範囲にあるものを候補画像として抽出する(ステップS303)。そして、N’面の全てのテーブルにおいて候補画像として抽出されたものを特定し(ステップS304)、それらから基準画像自体を除外したものを、当該基準画像に対応する近傍画像として特定する(ステップS305)。こうして特定された近傍画像の各々のうちグループラベルが未付与のものに対し、基準画像と同一のグループラベルを付与する(ステップS306)。これにより、基準画像とその近傍画像とが同一のグループとして関連付けられる。
【0057】
本実施形態の趣旨によれば、近傍画像の近傍にある画像に対しても、たとえその画像が基準画像から近傍範囲を超えて離れたものであっても、基準画像と同一のグループラベルが与えられる必要がある。そこで、基準画像の近傍画像に対する近傍画像の探索とラベル付与とを引き続いて行う。具体的には、上記で得られた基準画像に対する近傍画像の画像番号をスタックに追加し(ステップS307)、それらの画像を順次新たな基準画像に指定しながら(ステップS309)、当該画像に対する近傍画像の探索および見つかった近傍画像へのグループラベル付与を行う(ステップS303〜S306)。新たな近傍画像が見つかれば演算プロセッサのスタックに追加する(ステップS307)。これをスタックが空になるまで繰り返すことで(ステップS308)、最初の基準画像を起点として互いの近傍画像を介した画像間の関連付けが次々と周囲に広がり、それらに同じグループラベルが割り当てられてゆく。
【0058】
スタックが空になると、当該グループの近傍にはもはや他の画像は残っていないことになる。つまり当該グループの広がりは収束する。そこでステップS301に戻り(ステップS310)、まだグループ化されていない画像を新たな基準画像として上記処理を繰り返す。このとき、先のグループラベルとは異なるラベルが付与される。全ての欠陥画像にいずれかのグループラベルが与えられるまで、上記処理を繰り返して実行する。こうして全ての画像がグループ化される。グループ化の結果をユーザに提示する方法については先に説明した通りである。
【0059】
上記の例では、正規化および量子化された特徴量の値において基準画像と同一区画またはこれに隣接する区画までを「近傍範囲」として説明した。この近傍範囲の設定の仕方により、グループ化の結果は当然に異なる。すなわち、近傍範囲を広くすると、比較的差異の大きな画像まで同じグループにグループ分けされることになる。逆に近傍範囲を狭くすると、僅かな特徴の差異であっても別のグループとして扱われることとなる。特に高次元の特徴量空間では、外観上の小さな差異が特徴量空間では大きな距離となって各画像が孤立してしまう傾向がある。欠陥画像の数や特徴量の分布によって様々ではあるが、本願発明者の知見によれば、Kn=100程度の欠陥画像群においては、基準画像と同一区画を基準として±10〜±50区画程度を近傍範囲に含めたとき好結果が得られている。
【0060】
図9はこの発明を好適に適用可能な検査システムの概略構成を示す図である。この検査システム1は、検査対象である半導体基板Sの外観に現れたピンホールや異物等の欠陥検査を行い、検出された欠陥の自動分類を行う検査システムである。検査システム1は、基板S上の検査対象領域を撮像する撮像装置2と、撮像装置2からの画像データに基づいて欠陥検査を行うとともに欠陥が検出された場合に欠陥が属すべきカテゴリへと欠陥を自動分類(ADC;automatic defect classification)する検査・分類機能および検査システム1の全体動作を制御する機能を有する制御部としてのホストコンピュータ5を有する。撮像装置2は基板Sの製造ラインに組み込まれ、検査システム1はいわゆるインライン型のシステムとなっている。
【0061】
撮像装置2は、基板S上の検査対象領域を撮像することにより画像データを取得する撮像部21、基板Sを保持するステージ22、および、撮像部21に対してステージ22を相対的に移動させるステージ駆動部23を有し、撮像部21は、照明光を出射する照明部211、基板Sに照明光を導くとともに基板Sからの光が入射する光学系212、および、光学系212により結像された基板Sの像を電気信号に変換する撮像デバイス213を有する。ステージ駆動部23はボールねじ、ガイドレールおよびモータにより構成され、ホストコンピュータ5に設けられた装置制御部501がステージ駆動部23および撮像部21を制御することにより、基板S上の検査対象領域が撮像される。
【0062】
ホストコンピュータ5は、予め読み込まれた制御プログラムを実行することにより、図1に示す各機能ブロックをソフトウェアにより実現する。ホストコンピュータ5は、上記の装置制御部501のほか、欠陥検出部502、欠陥分類部(ADC)503、特徴量算出部504、教示部505、判定部506、演算部507などの各機能ブロックを備えている。さらに、ホストコンピュータ5は、各種データを記憶するための記憶部510、ユーザからの操作入力を受け付けるキーボードおよびマウスなどの入力受付部511および操作手順や処理結果等のユーザ向け視覚情報を表示する表示部512などを備えている。また、図示を省略しているが、光ディスク、磁気ディスク、光磁気ディスク等のコンピュータ読み取り可能な記録媒体から情報の読み取りを行う読取装置を有し、検査システム1の他の構成との間で信号を送受信する通信部が、適宜、インターフェイス(I/F)を介する等して接続される。
【0063】
欠陥検出部502は、検査対象領域の画像データを処理しつつ、検査対象領域中の特異な領域を見出すことで欠陥検出を行う。欠陥検出部502が検査対象領域から欠陥を検出すると、欠陥の画像データや検査に利用された各種データが記憶装置510に一時的に保存される。
【0064】
一方、欠陥分類部503は、検出された欠陥をSVM(サポート・ベクタ・マシン;Support Vector Machine)、ニューラルネットワーク、決定木、判別分析等の学習アルゴリズムを利用して分類する処理をソフトウェア的に実行する。特徴量算出部504は、検出された欠陥の画像データに基づいて、当該欠陥を特徴付ける特徴量を算出する。教示部505は欠陥分類部503に上記アルゴリズムを機械学習させるための教示データを与える。
【0065】
判定部506および演算部507はそれぞれ、欠陥分類部503によって分類された分類結果の妥当性を示す確度を算出するための処理を行う。具体的には、判定部506は欠陥画像の各特徴量の値が各分類カテゴリに適合するものであるか否かの判定を行う。また演算部507は判定部506の判定結果に基づき確度を算出する。
【0066】
このように構成された検査システムに対し、本発明を好適に適用することが可能である。すなわち、撮像装置2により撮像された多数の欠陥画像のうちいくつかを典型画像として欠陥分類部503が機械学習を行う際、ユーザが欠陥画像の中から典型画像を見つけ出す作業を支援するのに本発明を用いることができる。グループ化により得られた典型画像の候補については、ホストコンピュータ5の表示部512への表示によってユーザに提示することができる。ユーザにより典型画像が指定されると、その情報に基づき教示部505が教示データを作成し欠陥分類部503に与えることになる。
【0067】
以上のように、この実施形態においては、図2のステップS102が本発明の「特徴量算出工程」に相当する一方、ステップS103および図5および図8に示す処理が、本発明の「グループ化工程」に相当している。また、図2のステップS104が、本発明の「提示工程」に相当している。また、図8のステップS303が本発明の「探索処理」に相当している。また、上記実施形態においては、基準画像として選ばれた欠陥画像が特徴量空間において占める点が、本発明における「基準座標点」に相当している。
【0068】
なお、本発明は上記した実施形態に限定されるものではなく、その趣旨を逸脱しない限りにおいて上述したもの以外に種々の変更を行うことが可能である。例えば、上記実施形態では欠陥画像の各特徴量の値を正規化・量子化した上で基準画像に対する近傍画像の探索を行っているが、これらは演算上の便宜のためであって、特徴量の値を正規化または量子化することは本発明において必須の要件ではない。またこれらの処理のうち一方のみが実行されてもよい。
【0069】
したがって例えば、各特徴量について、複数の欠陥画像の間での当該特徴量の値の最小値から最大値までを含む範囲を均等に複数の区間に分割し、各画像の特徴量の値がそれらのうちのどの区間に該当するかという観点で図7のようなテーブルを作成しても、同様の効果が得られる。
【0070】
また、上記実施形態は半導体基板の欠陥を検査・分類する画像分類装置であるが、本発明の適用対象たる画像分類装置は、半導体基板を検査する装置だけでなく、他の対象物、例えばプリント基板やガラス基板等を検査する装置や、各種材料の表面状態を検査する表面検査装置であってもよい。
【産業上の利用可能性】
【0071】
本発明は、欠陥画像に対し自動分類を行う技術に好適であり、特に、多数の欠陥画像から欠陥の典型例を含む典型画像を見つけ出すユーザの作業を支援するという目的のために好適に適用することができる。
【符号の説明】
【0072】
1 検査システム
2 撮像装置
503 欠陥分類部
504 特徴量算出部
505 教示部
506 判定部
507 演算部
512 表示部
S102 特徴量算出工程
S103 グループ化工程
S104 提示工程
S303 探索処理
図1
図2
図3
図4
図5
図6
図7
図8
図9