IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社半導体エネルギー研究所の特許一覧

特開2024-133117学習データ生成装置及び不良識別システム
<>
  • 特開-学習データ生成装置及び不良識別システム 図1
  • 特開-学習データ生成装置及び不良識別システム 図2
  • 特開-学習データ生成装置及び不良識別システム 図3
  • 特開-学習データ生成装置及び不良識別システム 図4
  • 特開-学習データ生成装置及び不良識別システム 図5
  • 特開-学習データ生成装置及び不良識別システム 図6
  • 特開-学習データ生成装置及び不良識別システム 図7
  • 特開-学習データ生成装置及び不良識別システム 図8
  • 特開-学習データ生成装置及び不良識別システム 図9
  • 特開-学習データ生成装置及び不良識別システム 図10
  • 特開-学習データ生成装置及び不良識別システム 図11
  • 特開-学習データ生成装置及び不良識別システム 図12
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024133117
(43)【公開日】2024-10-01
(54)【発明の名称】学習データ生成装置及び不良識別システム
(51)【国際特許分類】
   G06V 10/72 20220101AFI20240920BHJP
   G06T 7/00 20170101ALI20240920BHJP
   G06T 7/60 20170101ALI20240920BHJP
【FI】
G06V10/72
G06T7/00 610C
G06T7/60 110
【審査請求】有
【請求項の数】11
【出願形態】OL
(21)【出願番号】P 2024110156
(22)【出願日】2024-07-09
(62)【分割の表示】P 2021573621の分割
【原出願日】2021-01-18
(31)【優先権主張番号】P 2020015382
(32)【優先日】2020-01-31
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000153878
【氏名又は名称】株式会社半導体エネルギー研究所
(72)【発明者】
【氏名】岡野 達也
(72)【発明者】
【氏名】中里 諒
(72)【発明者】
【氏名】鴇巣 敦哉
(57)【要約】
【課題】識別モデルの学習に好適な学習データを生成することが可能な学習データ生成装置を提供する。
【解決手段】学習データ生成装置は、第1の画像データの一部を第2の画像データとして切り出す機能と、第2の画像データの面積に対応した、疑似不良を表す二次元図形を生成する機能と、第2の画像データおよび二次元図形を合成して第3の画像データを生成する機能と、第3の画像データに二次元図形に対応するラベルを付与する機能と、を有する。第3の画像データを識別モデルの学習に用いることで、精度の高い識別モデルを生成することができる。
【選択図】図1
【特許請求の範囲】
【請求項1】
パターンが正常である領域のみが撮影された第1の画像データの一部を第2の画像データとして切り出す機能と、
前記第2の画像データの面積に対応した、疑似不良を表す二次元図形を生成する機能と、
前記第2の画像データと前記二次元図形とを合成して第3の画像データを生成する機能と、
前記第3の画像データに、前記二次元図形に対応するラベルを付与する機能と、
を有する、
学習データ生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明の一態様は、学習データを生成する方法に関する。また、本発明の一態様は、学習データ生成装置に関する。また、本発明の一態様は、不良識別システムに関する。
【背景技術】
【0002】
半導体製造工程の不良検出手段として、外観検査が挙げられる。外観検査を自動で行うための装置(外観検査装置)として、例えば、パターン検査装置が挙げられる。外観検査装置を利用して取得された画像データに対して、不良の検出および識別が行われる。不良の検出および識別が目視で行われる場合、検出および識別の精度に個人差が生じる場合がある。また、画像データの数が多いと、不良の検出および識別に膨大な時間がかかる。
【0003】
近年、ニューラルネットワークを利用して、不良の検出および識別を行う技術が報告されている。例えば、特許文献1では、学習済みの第1のニューラルネットワークに基づいて、検査対象信号を正常と正常以外とに分類し、検査対象信号が正常以外であると判定した場合に、学習済みの第2のニューラルネットワークに基づいて、欠陥の種類を分類する検査装置が開示されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2012-026982号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
学習済みのニューラルネットワークに基づいて行われる、判定、分類などの精度を高めるには、適切な学習用データセットを用いてニューラルネットワークに学習させる必要がある。当該精度を高める方法の一つとして、学習用データセットに含まれる学習データの件数を増やすことが挙げられる。しかしながら、不良の件数は、一般的には、正常の件数と比べて非常に少ない。さらに、不良を識別するためには、不良の種類ごとに学習データを用意する必要がある。そのため、学習データの件数を増やすには、膨大な時間とコストがかかってしまう。
【0006】
学習用データセットに含まれる学習データの件数を増やす方法として、データ拡張(データ水増しと呼ばれる場合がある。)が挙げられる。データ拡張は、既に用意されている学習データを元に、変種の学習データを生成することで、学習データの件数を増やす(学習データの量を拡張する)技法である。具体的には、既に用意されている学習データに対して、水平方向および/または垂直方向にシフト、水平方向および/または垂直方向に反転、回転、ズームインまたはズームアウトなどの操作を一つまたは複数実行することで、変種の学習データを生成する。しかしながら、不良の識別を行う機械学習においては、当該操作のみでは、不良の識別の精度向上が不十分となる場合がある。
【0007】
そこで、本発明の一態様は、学習データを生成する方法を提供することを課題の一とする。また、本発明の一態様は、学習データ生成装置を提供することを課題の一とする。また、本発明の一態様は、不良識別システムを提供することを課題の一とする。
【0008】
なお、これらの課題の記載は、他の課題の存在を妨げるものではない。なお、本発明の一態様は、これらの課題の全てを解決する必要はないものとする。なお、これら以外の課題は、明細書、図面、請求項などの記載から、自ずと明らかとなるものであり、明細書、図面、請求項などの記載から、これら以外の課題を抽出することが可能である。
【課題を解決するための手段】
【0009】
本発明の一態様は、パターンが正常である領域のみが撮影された第1の画像データの一部を第2の画像データとして切り出す機能と、第2の画像データの面積に対応した、疑似不良を表す二次元図形を生成する機能と、第2の画像データと二次元図形とを合成して第3の画像データを生成する機能と、第3の画像データに、二次元図形に対応するラベルを付与する機能と、を有する、学習データ生成装置である。
【0010】
また、本発明の一態様は、不良を含まない領域を合成することで作成された第1の画像データの一部を第2の画像データとして切り出す機能と、第2の画像データの面積に対応した、疑似不良を表す二次元図形を生成する機能と、第2の画像データと二次元図形とを合成して第3の画像データを生成する機能と、第3の画像データに、二次元図形に対応するラベルを付与する機能と、を有する、学習データ生成装置である。
【0011】
上記学習データ生成装置において、二次元図形は、第1の二次元図形、または第2の二次元図形であり、第1の二次元図形は、形状および色を指定することで生成され、第2の二次元図形は、第2の画像データを切り出すことで生成される、ことが好ましい。
【0012】
また、上記学習データ生成装置において、第1の二次元図形は、第1の多角形、楕円、または二重楕円であり、第2の画像データと、第1の多角形または楕円と、を合成することで生成される第3の画像データには、第1のラベルが付与され、第2の画像データと、二重楕円と、を合成することで生成される第3の画像データには、第2のラベルが付与される、ことが好ましい。
【0013】
また、上記学習データ生成装置において、第1の多角形は、第1の頂点乃至第n(nは3以上8以下の整数)の頂点を有し、第1の多角形内の点と、第1の頂点乃至第nの頂点のそれぞれとを結ぶ線分の長さは、正規分布に従う長さであり、正規分布は、平均が第2の画像データの長辺の、0.05倍以上0.25倍以下の長さであり、標準偏差が平均の0.2倍であり、第1の多角形の色は、RGBのそれぞれが、256階調の表現において、0以上20以下(十進数で表記)であり、第1の多角形の色の透過率は、0%以上10%以下である、ことが好ましい。
【0014】
また、上記学習データ生成装置において、楕円の長径は、第2の画像データの長辺の、0.05倍以上0.25倍以下の長さであり、楕円の短径は、長径の、0.6倍以上1.0倍以下の長さであり、楕円の色は、RGBのそれぞれが、256階調の表現において、0以上10以下(十進数で表記)であり、楕円の色の透過率は、0%以上10%以下である、ことが好ましい。
【0015】
また、上記学習データ生成装置において、二重楕円の長径は、第2の画像データの長辺の、0.05倍以上0.25倍以下の長さであり、二重楕円の短径は、長径の0.6倍以上1.0倍以下の長さであり、二重楕円の外径と、内径と、の差は、5ピクセル以上15ピクセル以下であり、二重楕円の色は、256階調の表現において、Rが150以上170以下(十進数で表記)であり、Gが60以上80以下(十進数で表記)であり、Bが20以上40以下(十進数で表記)であり、二重楕円の色の透過率は、50%以上75%以下である、ことが好ましい。
【0016】
上記学習データ生成装置において、第2の二次元図形は、第2の多角形であり、第2の画像データと、第2の多角形と、を合成することで生成される第3の画像データには、第3のラベルが付与される、ことが好ましい。
【0017】
また、上記学習データ生成装置において、第2の多角形は、第2の画像データ内に位置する点を中心に、30°以上150°以下の角度で回転させた第2の画像データから切り出された四角形であり、四角形は、重心が点であり、長辺および短辺のそれぞれが、第2の画像データの長辺の、0.1倍以上0.25倍以下の長さである、ことが好ましい。
【0018】
また、上記学習データ生成装置において、学習データ生成装置は、第3の画像データに対して、ガンマ変換を行う機能と、第3の画像データに対して、ノイズ付加、またはぼかし加工を行う機能と、を有する、ことが好ましい。
【0019】
本発明の他の一態様は、不良を識別する不良識別システムであって、不良識別システムは、上記学習データ生成装置と、データベースと、識別装置と、を有し、データベースには、第1の画像データと、ラベルが付与された第4の画像データと、ラベルが付与されていない第5の画像データと、が格納され、識別装置は、学習済みモデルに基づいて、第5の画像データに含まれる不良を識別する機能を有する。
【0020】
上記不良識別システムにおいて、第3の画像データと、第4の画像データと、で構成された学習用データセットを基に、学習済みモデルが生成される、ことが好ましい。
【発明の効果】
【0021】
本発明の一態様により、学習データを生成する方法を提供することができる。また、本発明の一態様により、学習データ生成装置を提供することができる。また、本発明の一態様により、不良識別システムを提供することができる。
【0022】
なお、本発明の一態様の効果は、上記列挙した効果に限定されない。上記列挙した効果は、他の効果の存在を妨げるものではない。なお、他の効果は、以下の記載で述べる、本項目で言及していない効果である。本項目で言及していない効果は、当業者であれば、明細書、図面などの記載から導き出せるものであり、これらの記載から適宜抽出することができる。なお、本発明の一態様は、上記列挙した効果、及び/又は他の効果のうち、少なくとも一つの効果を有するものである。したがって本発明の一態様は、場合によっては、上記列挙した効果を有さない場合もある。
【図面の簡単な説明】
【0023】
図1図1は、画像データを生成する方法の一例を示すフローチャートである。
図2図2は、画像データを切り出す方法を説明する図である。
図3図3A乃至図3Eは、二次元図形を説明する図である。
図4図4A乃至図4Dは、画像データを説明する図である。
図5図5は、画像データを生成する方法の一例を示すフローチャートである。
図6図6は、学習済みの識別モデルを生成する方法の一例を示すフローチャートである。
図7図7は、不良を識別する方法の一例を示すフローチャートである。
図8図8A、および図8Bは、不良識別システムの一例を示すブロック図である。
図9図9A、および図9Bは、不良識別システムの一例を示すブロック図である。
図10図10は、不良識別システムの一例を示すブロック図である。
図11図11A乃至図11Iは、画像データの一例を説明する図である。
図12図12は、識別モデルごとの正解率の推移を示す図である。
【発明を実施するための形態】
【0024】
実施の形態について、図面を用いて詳細に説明する。但し、本発明は以下の説明に限定されず、本発明の趣旨およびその範囲から逸脱することなくその形態及び詳細を様々に変更し得ることは当業者であれば容易に理解される。したがって、本発明は以下に示す実施の形態の記載内容に限定して解釈されるものではない。
【0025】
なお、以下に説明する発明の構成において、同一部分または同様な機能を有する部分には同一の符号を異なる図面間で共通して用い、その繰り返しの説明は省略する。
【0026】
また、図面において示す各構成の、位置、大きさ、範囲などは、理解の簡単のため、実際の位置、大きさ、範囲などを表していない場合がある。このため、開示する発明は、必ずしも、図面に開示された位置、大きさ、範囲などに限定されない。
【0027】
また、本明細書にて用いる「第1」、「第2」、「第3」という序数詞は、構成要素の混同を避けるために付したものであり、数的に限定するものではないことを付記する。
【0028】
また、本明細書において、上限と下限の数値が規定されている場合は、自由に組み合わせる構成も開示されているものとする。
【0029】
本明細書では、機械学習モデルの学習および評価に用いるデータセットを、学習用データセットと表記する。機械学習モデルの学習および評価を行う際、学習用データセットは、学習データ(訓練データともいう)と、テストデータ(評価データともいう)と、に分割される。さらに、学習データは、学習データと、検証データと、に分割されることがある。なお、テストデータは、学習用データセットから予め分割されていてもよい。
【0030】
学習データとは、機械学習モデルの学習に使用するデータである。検証データとは、機械学習モデルの学習結果の評価に使用するデータである。テストデータとは、機械学習モデルの評価に使用するデータである。機械学習が教師あり学習である場合、学習データ、検証データ、およびテストデータには、ラベルが付与されている。
【0031】
(実施の形態1)
本実施の形態では、学習データを生成する方法、学習済みの識別モデルを生成する方法、および不良を識別する方法について、図1乃至図7を用いて説明する。
【0032】
<学習データを生成する方法>
本発明の一態様である、学習データを生成する方法について説明する。
【0033】
図1は、学習データを生成する方法の一例を示すフローチャートである。図1は、学習データ生成装置が実行する処理の流れを説明するフローチャートでもある。
【0034】
本項では、p(pは2以上の整数)個の学習データを生成する方法について説明する。なお、pは、予め設定しておいてもよいし、ユーザが学習データを生成する前に指定してもよい。
【0035】
なお、生成した学習データは、後述する識別モデルの学習に使用される。識別モデルは、教師あり学習のモデルの一つである。また、識別モデルに入力されるデータは、画像データである。よって、上記方法で生成される学習データは、ラベルが付与された画像データである。ここで、p個の学習データを、p個の画像データ12(画像データ12_1乃至画像データ12_p)と表記する。つまり、画像データ12_1乃至画像データ12_pのそれぞれには、不良に対応するラベルが付与される。
【0036】
学習データ(画像データ12_1乃至画像データ12_p)を生成する方法は、図1に示すように、ステップS011乃至ステップS014を有する。なお、ステップS011乃至ステップS014をまとめて、ステップS002と表記する場合がある。
【0037】
ステップS011を行う前に、画像データ10を取得しておく。画像データ10は、不良を含まない領域のみが撮影された画像データである。当該画像データを、不良を含まない画像データと呼ぶ場合がある。または、画像データ10は、不良を含まない領域を複数合成することで作成された画像データである。
【0038】
画像データ12_1乃至画像データ12_pは、画像データ12_1から順に生成されるとよい。なお、ステップS011乃至ステップS013では、画像データ12_i(iは1以上p以下の整数)の生成方法について説明する。
【0039】
[ステップS011]
ステップS011は、画像データ10から、画像データ11_iを切り出す工程である。つまり、画像データ11_iは、画像データ10の一部である。なお、画像データ10から画像データ11_iを切り出す工程の詳細は、後述する。
【0040】
[ステップS012]
ステップS012は、不良の特徴(形状、色など)を疑似的に表現した図形(疑似不良と呼ぶ場合がある)を生成する工程である。本実施の形態では、疑似不良を、二次元図形で表現する。当該二次元図形の詳細は、後述する。なお、ステップS012で生成された疑似不良を、二次元図形31_iと表記する。
【0041】
[ステップS013]
ステップS013は、画像データ11_iおよび二次元図形31_iを合成して、画像データ12_iを生成する工程である。画像データ11_iおよび二次元図形31_iを合成する操作とは、画像データ11_i上に二次元図形31_iを重ね合わせる操作である。
【0042】
なお、二次元図形31_iは、不良の特徴を考慮して生成される。よって、画像データ12_iに、二次元図形31_iを生成する際に考慮した不良に対応するラベルを付与することができる。
【0043】
[ステップS014]
ステップS014は、p個の画像データ12が生成されているかを判断する工程である。生成された画像データ12の数がp個である場合(YES)、画像データ12の生成を終了する。一方、生成された画像データ12の数がp個未満である場合(NO)、ステップS011に進む。
【0044】
なお、ステップS011に進む場合、画像データ10から切り出される画像データ11_i+1は、画像データ11_iと位置が異なることが好ましい。不良が発生する箇所は、同一であるとは限らない。そこで、切り出される領域が異なる画像データ11を用意することで、不良の識別精度を高めることができる。なお、画像データ11_i+1は、画像データ11_i以外の画像データ11の位置と一致する場合がある。
【0045】
以上より、画像データ12_1乃至画像データ12_pを生成することができる。画像データ12_1乃至画像データ12_pのそれぞれには、不良に対応するラベルが付与されているため、画像データ12_1乃至画像データ12_pを、学習データとして利用することができる。
【0046】
<学習データを生成する方法の詳細>
本項では、上述した学習データを生成する方法の詳細について説明する。なお、本項で説明する学習データは、例えば、半導体製造工程で検出された不良を識別するための識別モデルの学習に用いられる。
【0047】
画像データ10は、製造工程の途中である半導体素子、または製造工程が終了した半導体素子において、半導体膜、絶縁膜、または配線のパターン(以下、単にパターンと呼ぶ)が正常である領域のみが撮影された画像データである。当該画像データを、正常なパターンの画像データと呼ぶ場合がある。または、画像データ10は、パターンが正常である領域を複数合成することで作成された画像データである。
【0048】
画像データ10から、画像データ11_iを切り出す方法を、図2を用いて説明する。
【0049】
図2は、画像データ10から画像データ11_iを切り出す方法を説明する図である。なお、図2では、画像データ11_iを画像データ11と表記する。また、図2に示す画像データ10に含まれるパターンは模式的なパターンであって、撮影された半導体素子のパターンが、図2のように設計されていることを示すわけではない。
【0050】
図2に示すように、画像データ11の形状は、長方形であるとよい。当該長方形は、長辺の長さがa1であり、短辺の長さがa2である。長さa1、および長さa2は、画像データ11が画像データ10に収まるように指定する。よって、少なくとも、長さa1は、画像データ10の長辺の長さ以下とし、長さa2は、画像データ10の短辺の長さ以下とする。また、長さa1、および長さa2は、画像データ11内に不良が収まるように指定する。
【0051】
長さa1と長さa2の比は、画像データ10の長辺の長さと画像データ10の短辺の長さの比に等しいことが好ましい。画像データ10の長辺の長さと画像データ10の短辺の長さの比が4:3である場合、例えば、長さa1を640ピクセルとし、長さa2を480ピクセルとするとよい。
【0052】
なお、長さa1と長さa2の比は、画像データ10の長辺の長さと画像データ10の短辺の長さの比と必ずしも一致しなくてもよい。例えば、上記長方形は、長さa1と長さa2の比が、画像データ10の長辺の長さと画像データ10の短辺の長さの比と異なってもよい。または、画像データ11の形状は、正方形であってもよい。
【0053】
または、上記長方形は、当該長方形の長辺と、画像データ10の短辺とが平行であり、当該長方形の短辺と、画像データ10の長辺とが平行であってもよい。または、上記長方形は、当該長方形の長辺と、画像データ10の長辺とが平行または垂直でなくてもよい。
【0054】
画像データ11の位置は、画像データ11が画像データ10に収まるように決定する。なお、画像データ11の位置は、画像データ11の重心を基準として決定してもよいし、画像データ11の頂点の1つを基準として決定してもよい。例えば、画像データ11の重心を、図2に点線で示す範囲10s内での一様乱数で決定する。ここで、範囲10sは、範囲10sの長辺が、画像データ10の長辺からa2/2だけ内側に位置し、範囲10sの短辺が、画像データ10の短辺からa1/2だけ内側に位置する範囲である。また、一様乱数とは、指定した区間内または範囲内で全ての実数が同じ確率で現れるような連続一様分布に従う乱数である。
【0055】
上記では、長さa1および長さa2を指定した後に、画像データ11の位置を決定する工程を説明したが、当該工程はこれに限られない。画像データ11の位置を指定した後に、画像データ11が画像データ10に収まるように、長さa1および長さa2を決定してもよい。または、画像データ11が画像データ10に収まるように、画像データ11の位置、ならびに長さa1および長さa2を同時に決定してもよい。
【0056】
なお、画像データ11_iの長辺の長さおよび短辺の長さは、他の画像データ11(画像データ11_1乃至画像データ11_p、ただし、画像データ11_iを除く。)の長辺の長さおよび短辺の長さとそれぞれ等しいことが好ましい。また、画像データ11_iの位置は、他の画像データ11(画像データ11_1乃至画像データ11_p、ただし、画像データ11_iを除く。)の少なくとも一部と異ならせることが好ましい。これにより、上述したように、不良の識別精度を高めることができる。
【0057】
次に、二次元図形31_iの詳細について説明する。
【0058】
半導体製造工程で検出される不良として、例えば、異物の混入、膜抜け、パターン不良、膜残り、膜浮き、断線などがある。これらの不良は、形状、色などの特徴が異なる。よって、上記二次元図形の、形状および色の特徴は、不良毎に異ならせる必要がある。
【0059】
本実施の形態では、不良として代表的な、異物の混入、膜抜け、およびパターン不良を識別する例を説明する。なお、異物の混入とは、半導体製造工程における、作業者、材料、製造装置、作業環境などを発生源とする異物が、基板(シリコンウェハなどの半導体基板、ガラス基板、プラスチック基板、金属基板、SOI基板など)上に付着することで生じる不良を指す。また、膜抜けとは、正常なパターンが剥がれてしまったことで生じる不良を指す。また、パターン不良とは、パターンが設計通りに形成されなかったことで生じる不良を指す。
【0060】
上述の通り、パターン不良は、パターンが設計通りに形成されなかった不良である。よって、パターン不良を表現する二次元図形は、画像データ10を切り出すことで生成されるとよい。一方、異物は意図せず混入する不良である。また、膜抜けは、正常なパターンが剥がれてしまった不良である。そのため、異物および膜抜けは、パターンとは無関係の形状および色を有する。よって、異物および膜抜けを表現する二次元図形は、形状と色を指定することで生成されるとよい。
【0061】
そこで、異物、膜抜け、およびパターン不良それぞれの、形状、色などの特徴を鑑み、異物を表現する二次元図形を、楕円または第1の多角形とする。また、膜抜けを表現する二次元図形を、二重楕円とする。また、パターン不良を表現する二次元図形を、第2の多角形とする。
【0062】
以下では、ステップS012で生成する二次元図形31_i(楕円、第1の多角形、二重楕円、または第2の多角形)の詳細について、図3A乃至図3Eを用いて説明する。
【0063】
<<楕円>>
異物を表現する楕円の、形状、色、および配置の一例について、図3Aを用いて説明する。
【0064】
異物を表現する楕円31A1を図3Aに示す。楕円31A1は、長軸の長さ(長径)がb1であり、短軸の長さ(短径)がb2である。
【0065】
楕円31A1の長径b1は、画像データ11の長辺の長さa1の、0.025倍以上0.4倍以下、好ましくは0.05倍以上0.25倍以下である。具体的には、長径b1は、0.05a1以上0.25a1以下の区間内での一様乱数で決定された値とするとよい。
【0066】
楕円31A1の短径b2は、楕円31A1の長径b1の、0.5倍以上1.0倍以下、好ましくは0.6倍以上1.0倍以下である。具体的には、短径b2は、0.6b1以上1.0b1以下の区間内での一様乱数で決定された値とするとよい。
【0067】
なお、長径b1と短径b2とが等しい場合、楕円31A1は円(正円)となる。よって、楕円31A1の形状として、円(正円)も含まれる。
【0068】
画像データ11の長辺に平行な線と、楕円31A1の長軸とのなす角の角度を、楕円31A1の回転角c1とする。回転角c1は、例えば、0°以上360°未満の区間内での一様乱数で決定された値とするとよい。
【0069】
楕円31A1の色は、検出される異物の色に近いことが好ましい。例えば、楕円31A1の色は、黒または黒に近い色であることが好ましい。具体的には、色を、256階調(8ビット)で表現される、R(赤)、G(緑)、およびB(青)の混色によって表現する場合、楕円31A1の色は、R、G、Bのそれぞれが、0以上40以下(十進数で表記)、好ましくは0以上20以下(十進数で表記)である。
【0070】
検出される異物は、透光性が低いことが多い。そこで、楕円31A1の色の透過率は、低いことが好ましい。例えば、楕円31A1の色の透過率は、0%以上20%以下、好ましくは0%以上10%以下である。
【0071】
上記を満たすように、楕円31A1を生成するとよい。
【0072】
なお、楕円31A1は上記形状に限られず、卵形、または長円形などでもよい。楕円31A1の形状が、卵形、または長円形などである場合、上述の形状に類似した形状を有するとよい。
【0073】
楕円31A1の配置は、楕円31A1の全体が画像データ11の範囲に収まるように、一様乱数で決定されるとよい。
【0074】
<<第1の多角形>>
異物を表現する第1の多角形の、形状、色、および配置の一例について、図3Bを用いて説明する。
【0075】
異物を表現する第1の多角形31A2を図3Bに示す。
【0076】
第1の多角形31A2の辺の数は、3以上8以下の整数からランダムに決定される。ここでは、第1の多角形31A2の辺の数を、n(nは3以上8以下の整数)とする。なお、本明細書においては、第1の多角形31A2の辺の数は、第1の多角形31A2の頂点の数に等しいものとする。つまり、第1の多角形31A2は、n個の頂点を有する多角形であり、n角形である。なお、図3Bでは、第1の多角形31A2を、5角形として図示している。
【0077】
第1の多角形31A2の頂点を、第1の頂点乃至第nの頂点と表記する。また、第1の多角形31A2内の点と、第k(kは1以上n以下の整数)の頂点とを結ぶ線を第kの線分と表記する。ここで、隣り合う線分同士のなす角(第kの線分と第(k+1)の線分とのなす角、ただし、kがnの場合は、第nの線分と第1の線分とのなす角。)の角度は、360/n[°]とする。なお、隣り合う線分同士のなす角の角度はこれに限られない。例えば、正規乱数によって決定してもよい。当該正規乱数が従う正規分布の平均は、例えば、360/n[°]とする。また、当該正規乱数が従う正規分布の標準偏差は、例えば、当該平均の0.1倍以上0.3倍以下、好ましくは当該平均の0.2倍である。
【0078】
また、第kの線分の長さをd_kとする。長さd_1乃至長さd_nのそれぞれは、正規分布に従う乱数(正規乱数ともいう)によって決定される。当該正規分布の平均は、例えば、画像データ11の長辺の長さa1の、0.025倍以上0.4倍以下、好ましくは0.05倍以上0.25倍以下である。具体的には、当該平均は、0.05a1以上0.25a1以下の区間内での一様乱数で決定された値とする。また、当該正規分布の標準偏差は、例えば、当該平均の0.1倍以上0.3倍以下、好ましくは当該平均の0.2倍である。
【0079】
画像データ11の長辺に平行な線と、上記点および第1の頂点を結ぶ線分(第1の線分)と、のなす角の角度を、第1の多角形31A2の回転角c2とする。なお、回転角c2は、画像データ11の長辺に平行な線と、上記点および第2の頂点乃至第nの頂点のいずれか一つを結ぶ線分(第2の線分乃至第nの線分のいずれか一つ)と、のなす角の角度としてもよい。回転角c2は、例えば、0°以上360°未満の区間内での一様乱数で決定された値とする。
【0080】
第1の多角形31A2の色は、検出される異物の色に近いことが好ましい。例えば、第1の多角形31A2の色は、黒または黒に近い色であることが好ましい。具体的には、色を、256階調で表現される、R、G、およびBの混色によって表現する場合、第1の多角形31A2の色は、R、G、Bのそれぞれが、0以上40以下(十進数で表記)、好ましくは0以上20以下(十進数で表記)であるとよい。
【0081】
検出される異物は、透光性が低いことが多い。そこで、第1の多角形31A2の色の透過率は、低いことが好ましい。例えば、第1の多角形31A2の色の透過率は、0%以上20%以下、好ましくは0%以上10%以下である。
【0082】
上記を満たすように、第1の多角形31A2を生成するとよい。
【0083】
第1の多角形31A2の配置は、第1の多角形31A2の全体が画像データ11の範囲に収まるように、一様乱数で決定されるとよい。
【0084】
<<二重楕円>>
膜抜けを表現する二重楕円の、形状、色、および配置の一例について、図3Cを用いて説明する。
【0085】
膜抜けを表現する二重楕円31Bを図3Cに示す。図3Cに点線で示す楕円は、二重楕円31Bの外側の楕円までの距離と、二重楕円31Bの内側の楕円までとの距離とが等しい点を結んで描かれる曲線である。図3Cに点線で示す楕円は、長径がb3であり、短径がb4である。ここで、二重楕円31Bの長径をb3で表し、短径をb4で表し、二重楕円31Bの幅(外側の楕円と内側の楕円との間隔)をe1で表す。
【0086】
二重楕円31Bの長径b3は、画像データ11の長辺の長さa1の、0.025倍以上0.4倍以下、好ましくは0.05倍以上0.25倍以下である。具体的には、長径b3は、0.05a1以上0.25a1以下の区間内での一様乱数で決定された値とする。
【0087】
二重楕円31Bの短径b4は、二重楕円31Bの長径b3の、0.5倍以上1.0倍以下、好ましくは0.6倍以上1.0倍以下である。具体的には、二重楕円31Bの短径b4は、0.6b3以上1.0b3以下の区間内での一様乱数で決定された値とする。
【0088】
なお、長径b3と短径b4とが等しい場合、二重楕円31Bは二重円(二重正円)となる。よって、二重楕円31Bの形状として、二重円(二重正円)も含まれる。
【0089】
画像データ11の長辺に平行な線と、二重楕円31Bの長軸とのなす角の角度を、二重楕円31Bの回転角c3とする。回転角c3は、例えば、0°以上360°未満の区間内での一様乱数で決定された値とするとよい。
【0090】
二重楕円31Bの幅e1は、3ピクセル以上25ピクセル以下、好ましくは5ピクセル以上15ピクセル以下である。
【0091】
二重楕円31Bの色は、検出される膜抜けの色に近いことが好ましい。具体的には、色を、256階調で表現される、R、G、およびBの混色によって表現する場合、二重楕円31Bの色は、Rが140以上180以下(十進数で表記)、好ましくは150以上170以下(十進数で表記)である。また、Gが50以上90以下(十進数で表記)、好ましくは60以上80以下(十進数で表記)である。また、Bが10以上30以下(十進数で表記)、好ましくは20以上40以下(十進数で表記)である。
【0092】
検出される膜抜けは、透光性を有することが多い。そこで、二重楕円31Bの色の透過率は、中程度であることが好ましい。例えば、二重楕円31Bの色の透過率は、40%以上85%以下、好ましくは50%以上75%以下である。
【0093】
上記を満たすように、二重楕円31Bを生成するとよい。
【0094】
なお、二重楕円31Bは上記形状に限られず、2つの卵形で囲まれた領域でもよいし、2つの長円形で囲まれた領域でもよい。または、形状が異なる2つの図形に囲まれた領域でもよい。例えば、楕円、卵型、または長円形などから選ばれた2つの図形で囲まれた領域でもよい。二重楕円31Bの形状が当該領域である場合、上述の形状に類似した形状を有するとよい。
【0095】
二重楕円31Bの配置は、二重楕円31Bの全体が画像データ11の範囲に収まるように、一様乱数で決定されるとよい。
【0096】
<<第2の多角形>>
パターン不良を表現する第2の多角形の生成方法および配置の一例について、図3Dおよび図3Eを用いて説明する。
【0097】
まず、パターン不良を表現する第2の多角形31Cの生成方法について説明する。
【0098】
はじめに、座標Pを決定する。座標Pは、図3Dに示す範囲11s内での一様乱数で決定される。ここで、範囲11sは、端部から一定の幅を除く、画像データ11の範囲である。ここで、一定の幅をe2とすると、e2は、8ピクセル以上12ピクセル以下であることが好ましく、10ピクセルがより好ましい。
【0099】
図3Dでは、画像データ11の短辺の一方から座標Pまでの最短の長さをf1とし、画像データ11の長辺の一方から座標Pまでの最短の長さをf2とする。
【0100】
次に、画像データ11を、座標Pを中心に角度gだけ回転させる。角度gの基準は、画像データ11の長辺に平行な線とするとよい。角度gは、30°以上150°以下の範囲内での一様乱数で決定される。なお、図3Dでは、角度gを反時計回りに図示しているが、時計回りでもよい。角度gだけ回転させた画像データ11を画像データ11tとする。
【0101】
画像データ11tから、重心の位置が座標Pである四角形を切り出す。切り出された当該四角形を、第2の多角形31Cとする(図3E参照)。第2の多角形31Cは、長辺の長さがh1であり、短辺の長さがh2である。
【0102】
第2の多角形31Cの長辺の長さh1は、画像データ11の長辺の長さa1の、0.025倍以上0.4倍以下、好ましくは0.1倍以上0.25倍以下である。具体的には、長さh1は、0.1a1以上0.25a1以下の区間内での一様乱数で決定された値とする。
【0103】
第2の多角形31Cの短辺の長さh2は、画像データ11の長辺の長さa1の、0.025倍以上0.4倍以下、好ましくは0.1倍以上0.25倍以下である。具体的には、長さh2は、0.1a1以上0.25a1以下の区間内での一様乱数で決定された値とする。
【0104】
検出されるパターン不良は、検出される異物よりも大きい傾向がある。そこで、長さh1および長さh2を上記のように指定することで、検出されるパターン不良に近い第2の多角形31Cを生成することができる。
【0105】
長さf1、長さf2、長さh1、および長さh2は、第2の多角形31Cが画像データ11tからはみ出さないように決定されるとよい。よって、決定された長さf1、長さf2、長さh1、および長さh2において、第2の多角形31Cが画像データ11tからはみ出す場合、長さf1、長さf2、長さh1、および長さh2の、一様乱数による決定を、第2の多角形31Cが画像データ11tからはみ出さなくなるまで繰り返し実施するとよい。
【0106】
以上より、第2の多角形31Cを生成することができる。
【0107】
上記では、第2の多角形31Cの長辺と画像データ11の長辺とが平行となるように上記四角形を切り出しているが、これに限られない。第2の多角形31Cの長辺と画像データ11の長辺とが平行でなくてもよい。
【0108】
また、上記では、第2の多角形31Cの例として四角形について説明したが、これに限られない。例えば、三角形、五角形以上の多角形、または楕円でもよい。第2の多角形31Cの形状が、三角形、五角形以上の多角形、または楕円である場合、上述の形状に類似した形状を有するとよい。
【0109】
第2の多角形31Cは、第2の多角形31Cの重心と座標Pとが一致するように配置する。ただし、第2の多角形31Cの配置はこれに限られず、第2の多角形31Cの全体が画像データ11の範囲に収まるように、一様乱数で決定されてもよい。
【0110】
以上により、二次元図形31_iを生成することができる。二次元図形31_iは、不良の特徴を鑑みて生成されるため、二次元図形31_iを用いることで、好適なデータ拡張を行うことができる。
【0111】
上述したように、二次元図形31_iの大きさ(面積)に関連するパラメータ(楕円31A1の長径b1、第1の多角形31A2の第kの線分の長さd_k、二重楕円31Bの長径b3、第2の多角形31Cの長辺の長さh1など)は、画像データ11の長辺の長さおよび/または画像データ11の短辺の長さを基準に決定される。つまり、二次元図形31_iの大きさ(面積)は、画像データ11の大きさ(面積)に対応する。
【0112】
なお、半導体製造工程で検出される不良は、上記不良(異物の混入、膜抜け、およびパターン不良)以外にも、膜残り、膜浮き、断線などの不良がある。これらの不良を識別の対象とする場合、それらに適した二次元図形を生成するとよい。
【0113】
次に、画像データ12(画像データ12_1乃至画像データ12_pのいずれか)について説明する。
【0114】
図4A乃至図4Dは、画像データ12を説明する図である。図4Aは、画像データ11および楕円31A1を合成して生成される画像データ12A1である。図4Bは、画像データ11および第1の多角形31A2を合成して生成される画像データ12A2である。図4Cは、画像データ11および二重楕円31Bを合成して生成される画像データ12Bである。図4Dは、画像データ11および第2の多角形31Cを合成して生成される画像データ12Cである。
【0115】
上述したように、画像データ12_iには、二次元図形31_iに対応するラベルが付与されている。例えば、二次元図形31_iが楕円31A1または第1の多角形31A2である場合、画像データ12_iには、異物に対応するラベルが付与される。または、二次元図形31_iが二重楕円31Bである場合、画像データ12_iには、膜抜けに対応するラベルが付与される。または、二次元図形31_iが第2の多角形31Cである場合、画像データ12_iには、パターン不良に対応するラベルが付与される。
【0116】
具体的には、図4Aに示す画像データ12A1、および図4Bに示す画像データ12A2には、異物に対応するラベルが付与される。また、図4Cに示す画像データ12Bには、膜抜けに対応するラベルが付与される。また、図4Dに示す画像データ12Cには、パターン不良に対応するラベルが付与される。
【0117】
以上が、学習データを生成する方法の詳細な説明である。
【0118】
<学習データを生成する方法の他の一例>
学習データを生成する方法は、上述した方法に限られない。例えば、学習データを生成する方法は、図5に示すように、図1に示すステップS013とステップS014との間に、ステップS015およびステップS016を有してもよい。
【0119】
[ステップS015]
ステップS015は、画像データ12_iに対して、ガンマ変換を行うか否かを判断する工程である。ガンマ変換とは、画像の明るさを調整する操作であり、画像データの各画素の輝度値を指数関数で変換する操作である。
【0120】
ガンマ変換を行うと判断された場合(ステップS015:YES)、画像データ12_iに対して、ガンマ変換を行う。一方、ガンマ変換を行わないと判断された場合(ステップS015:NO)、画像データ12_iに対して、ガンマ変換を行わない。
【0121】
なお、ガンマ変換の代わりに、コントラスト調整を行ってもよい。または、画像データ12_1乃至画像データ12_pのそれぞれで、ガンマ変換、およびコントラスト調整をランダムに選択してもよい。
【0122】
[ステップS016]
ステップS016は、画像データ12_iに対して、ノイズ付加、またはぼかし加工を行うか否かを判断する工程である。
【0123】
ノイズ付加とは、ランダムに出現する変動成分(ノイズ)を画像データに付加する操作である。付加するノイズとして、例えば、ガウス分布に基づくノイズ(ガウシアンノイズともいう)、位置に依存せず、ある頻度を有してランダムに現れるノイズ(インパルスノイズともいう)などがある。
【0124】
ぼかし加工とは、フィルタリング処理を行い、輪郭または色の境界をぼかす操作である。ぼかし加工に使用されるフィルタとして、例えば、平均化フィルタ、ガウシアンフィルタなどがある。ぼかし加工を行う範囲は、画像データ12_iの全体でもよいし、画像データ12_iの一部でもよい。
【0125】
ノイズ付加を行うと判断された場合、画像データ12_iに対して、ノイズ付加を行う。または、ぼかし加工を行うと判断された場合、画像データ12_iに対して、ぼかし加工を行う。または、ノイズ付加およびぼかし加工のいずれも行わないと判断された場合(ステップS016:NO)、画像データ12_iに対して、ノイズ付加およびぼかし加工を行わない。
【0126】
以上が、学習データを生成する方法の説明である。これにより、不良の特徴を鑑みた、データ拡張を行うことができる。識別モデルを学習させるための、学習用データセットに、当該方法で生成した学習データを追加する。これにより、不良の識別精度が高い識別モデルを提供することができる。
【0127】
<学習済みの識別モデルを生成する方法>
本発明の一態様に係る、学習済みの識別モデルを生成する方法について説明する。
【0128】
図6は、学習済みの識別モデルを生成する方法の一例を示すフローチャートである。図6は、学習データ生成装置が実行する処理の流れを説明するフロー図でもある。なお、図6に示すフローチャートには、上述した学習データを生成する方法が含まれる。
【0129】
学習済みの識別モデルを生成する方法は、図6に示すように、ステップS001乃至ステップS006を有する。
【0130】
[ステップS001]
ステップS001は、画像データ10および複数の画像データ20を取得する工程である。
【0131】
上述したように、画像データ10は、不良を含まない画像データ、または、不良を含まない領域を複数合成することで作成された画像データである。また、画像データ10は、正常なパターンの画像データ、または、パターンが正常である領域を複数合成することで作成された画像データである。
【0132】
複数の画像データ20(画像データ20_1乃至画像データ20_q(qは2以上の整数))はそれぞれ、不良を含む画像データである。なお、画像データ20_j(jは1以上q以下の整数)には、画像データ20_jに含まれる不良に対応するラベルが付与されている。つまり、複数の画像データ20は、学習データ、検証データ、またはテストデータとして用いることができる画像データである。
【0133】
[ステップS002]
ステップS002は、p個の画像データ12(画像データ12_1乃至画像データ12_p)を生成する工程である。ステップS002は、図1に示すステップS011乃至ステップS014を有する。ステップS011乃至ステップS014については、<学習データを生成する方法>で説明した内容を参酌することができる。
【0134】
なお、不良毎に作成される画像データ12の数は、ほぼ等しいであることが好ましい。例えば、異物に対応するラベルが付与された画像データ12の数、膜抜けに対応するラベルが付与された画像データ12の数、および、パターン不良に対応するラベルが付与された画像データ12の数が、ほぼ等しいことが好ましい。これにより、特定の不良に対する過剰適合(過学習)を抑制することができる。
【0135】
具体的には、二次元図形31_1乃至二次元図形31_pのそれぞれは、一様乱数によって、楕円31A1、第1の多角形31A2、二重楕円31B、および第2の多角形31Cのいずれかに決定されるとよい。
【0136】
または、二次元図形31_1乃至二次元図形31_pは、楕円31A1の生成数と第1の多角形31A2の生成数との和、二重楕円31Bの生成数、および第2の多角形31Cの生成数が均等となるように、生成されてもよい。
【0137】
[ステップS003]
ステップS003は、学習用データセットを生成する工程である。
【0138】
学習用データセットの入力データは、複数の画像データ20、および、ステップS002で生成したp個の画像データ12である。つまり、当該入力データは、画像データ20_1乃至画像データ20_q、ならびに、画像データ12_1乃至画像データ12_pである。
【0139】
学習用データセットの正解ラベルは、画像データ20_1乃至画像データ20_qのそれぞれに付与されたラベル、ならびに、画像データ12_1乃至画像データ12_pのそれぞれに付与されたラベルである。
【0140】
以上より、学習用データセットは、(q+p)個の画像データで構成される。
【0141】
[ステップS004]
ステップS004は、ステップS003で生成した学習用データセットを用いて、識別モデルを学習させる工程である。
【0142】
識別モデルは、畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いることが好ましい。CNNとして、例えば、VGG16、GoogLeNet、ResNetなどが挙げられる。
【0143】
上記識別モデルを学習させる際、上記学習用データセットを、学習データと、検証データと、テストデータとに分割するとよい。例えば、当該学習データを用いて当該識別モデルを学習させ、当該検証データを用いて学習の結果を評価し、当該テストデータを用いて、学習させた識別モデルを評価する。これにより、学習させた識別モデルの精度を確かめることができる。以降では、テストデータの数に対する、識別結果が正解であった数の比を、正解率と呼ぶ場合がある。
【0144】
なお、テストデータは、画像データ20_1乃至画像データ20_qの一部で構成される。また、検証データは、テストデータに用いられない画像データ20の一部で構成される。また、学習データは、画像データ12_1乃至画像データ12_p、および、テストデータおよび検証データに用いられない画像データ20で構成される。テストデータを、不良を含む画像データのみで構成することで、ラベルが付与されていない画像データに含まれる不良の識別精度を評価することができる。
【0145】
学習用データセットを、学習データと、検証データと、テストデータとに分割する方法として、例えば、ホールドアウト法、クロスバリデーション法、リーブワンアウト法などがある。
【0146】
[ステップS005]
ステップS005は、識別モデルの学習を終了するかを判断する工程である。
【0147】
当該学習は、所定の試行回数に達した時点で終了してもよい。または、当該学習は、正解率が所定のしきい値を超えた時点で終了してもよい。または、当該学習は、正解率がある程度飽和した時点で終了してもよい。なお、当該試行回数、または、当該しきい値に対して、予め定数を用意しておくとよい。または、当該学習を試行中に、ユーザが終了するタイミングを指定してもよい。
【0148】
学習を終了すると判断された場合(YES)、ステップS006へ進む。
【0149】
学習を終了しないと判断された場合(NO)、ステップS002へ進む。つまり、学習用データセットに含まれる画像データ12_1乃至画像データ12_pは学習ごとに生成される。これにより、学習にかかる時間の短縮、正解率の向上などを図ることができる。
【0150】
上記学習により、学習済みの識別モデルが生成される。
【0151】
[ステップS006]
ステップS006は、ステップS004で生成された学習済みの識別モデルを出力する工程である。
【0152】
以上が、学習済みの識別モデルを生成する方法の一例である。本発明の一態様の、学習データを生成する方法を用いて、学習データを生成し、当該学習データを含む学習用データセットを生成する。当該学習用データセットに基づいて、識別モデルを学習させることで、不良の識別精度の高い識別モデルを生成することができる。
【0153】
<不良を識別する方法>
本発明の一態様に係る、不良を識別する方法について説明する。
【0154】
図7は、画像データに含まれる不良を識別する方法の一例を示すフローチャートである。図7は、識別装置が実行する処理の流れを説明するフローチャートでもある。
【0155】
画像データに含まれる不良を識別する方法は、図7に示すように、ステップS021およびステップS022を有する。
【0156】
[ステップS021]
ステップS021は、画像データ21を取得する工程である。なお、画像データ21の数は1つに限られず、複数であってもよい。
【0157】
画像データ21は、不良を含む画像データである。なお、画像データ21に含まれる不良は識別されていない。つまり、画像データ21にはラベルが付与されていない。よって、画像データ21は、識別の対象となる画像データである。
【0158】
[ステップS022]
ステップS022は、画像データ21を評価する工程である。つまり、ステップS022は、画像データ21に含まれる不良の識別を行う工程である。当該識別には、ステップS006で出力された学習済みの識別モデルを使用するとよい。
【0159】
なお、画像データ21が上記識別モデルに入力されると、出力値が得られる。当該出力値は、事後確率であり、不良の識別に用いられる。当該出力値を基に、不良の識別が行われる。
【0160】
以上が、画像データに含まれる不良を識別する方法の一例である。ステップS006で生成された、学習済みの識別モデルを用いることで、不良の識別を精度高く行うことができる。
【0161】
本発明の一態様により、学習データを生成する方法を提供することができる。また、本発明の一態様により、学習済みの識別モデルを生成する方法を提供することができる。また、本発明の一態様により、不良を識別する方法を提供することができる。
【0162】
本実施の形態は、他の実施の形態、実施例などと適宜組み合わせることができる。また、本明細書において、1つの実施の形態の中に、複数の構成例が示される場合は、構成例を適宜組み合わせることが可能である。
【0163】
(実施の形態2)
本実施の形態では、本発明の一態様の不良識別システムについて、図8A図8B図9A図9B、および図10を用いて説明する。
【0164】
本実施の形態の不良識別システムは、実施の形態1で説明した、学習データを生成する方法を用いて、好適な学習データを生成することができる。また、本実施の形態の不良識別システムは、実施の形態1で説明した、学習済みの識別モデルを生成する方法を用いて、学習済みの識別モデルを生成することができる。また、本実施の形態の不良識別システムは、実施の形態1で説明した、不良を識別する方法を用いて、不良を識別することができる。
【0165】
<不良識別システム>
本発明の一態様である、不良識別システムについて説明する。
【0166】
不良識別システムは、ユーザが利用するパーソナルコンピュータなどの情報処理装置に設けることができる。または、当該不良識別システムをサーバに設け、クライアントPCからネットワークを介して利用することができる。
【0167】
本発明の一態様である不良識別システムの一例を、図8Aに示す。図8Aは、不良識別システム100の構成を示す図である。不良識別システム100は、図8Aに示すように、学習データ生成装置101、および識別装置102を備える。
【0168】
学習データ生成装置101は、学習データを生成する機能を有する。なお、学習データを生成する方法については、<学習データを生成する方法>などで説明した内容を参酌することができる。
【0169】
また、学習データ生成装置101は、学習済みの識別モデルを生成する機能を有する。なお、学習済みの識別モデルを生成する方法については、<学習済みの識別モデルを生成する方法>などで説明した内容を参酌することができる。
【0170】
学習データ生成装置101は、記憶部(図8Aには図示せず)を有する。当該記憶部には、画像データ10、および複数の画像データ20が格納される。なお、当該記憶部に、学習データ生成装置101にて生成された学習データが格納されてもよい。
【0171】
学習データ生成装置101は、処理部(図8Aには図示せず)を有する。当該処理部にて、学習データが生成される。また、学習済みの識別モデルが生成される。
【0172】
学習データ生成装置101は、入力部(図8Aには図示せず)を有してもよい。画像データ10、および複数の画像データ20は、当該入力部を介して、上記記憶部に格納される。なお、画像データ10、および複数の画像データ20は、記憶媒体、通信などを介して、上記記憶部に格納されてもよい。
【0173】
学習データ生成装置101は、出力部(図8Aには図示せず)を有してもよい。当該出力部にて、学習済みの識別モデルが識別装置102に供給される。なお、学習済みの識別モデルは、記憶媒体、通信などを介して、識別装置102に供給されてもよい。
【0174】
識別装置102は、不良を識別する機能を有する。なお、当該不良を識別する方法については、<不良を識別する方法>などで説明した内容を参酌することができる。なお、識別装置102は、不良の位置を評価する機能を有してもよい。
【0175】
識別装置102は、記憶部(図8Aには図示せず)を有する。当該記憶部には、1つ以上の画像データ21、および学習済みの識別モデルが格納される。
【0176】
識別装置102は、処理部(図8Aには図示せず)を有する。当該処理部にて、画像データに含まれる不良が識別される。また、画像データに含まれる不良の位置が評価される。
【0177】
識別装置102は、入力部(図8Aには図示せず)を有してもよい。1つ以上の画像データ21、および学習済みの識別モデルは、当該入力部を介して、上記記憶部に格納される。または、1つ以上の画像データ21、および学習済みの識別モデルは、記憶媒体、通信などを介して、上記記憶部に格納されてもよい。
【0178】
識別装置102は、出力部(図8Aには図示せず)を有してもよい。当該出力部は、情報を供給する機能を有する。当該情報とは、上記処理部にて得られた結果である。例えば、当該情報は、不良に対応する出力値(事後確率など)、識別された不良の名称、位置などである。当該情報は、例えば、文字列、数値、グラフなどの視覚情報、音声情報などとして供給される。
【0179】
識別装置102は、表示部(図8Aには図示せず)を有してもよい。当該表示部は、上記情報を供給する機能を有する。当該表示部として、ディスプレイ、プリンタなどの出力デバイスがある。
【0180】
不良識別システム100は、例えば、学習データ生成装置101がサーバに備えられ、識別装置102が端末に備えられてもよい。または、学習データ生成装置101、および識別装置102が、単一の、端末またはサーバに備えられてもよい。
【0181】
学習データ生成装置101がサーバに備えられ、識別装置102が端末に備えられた不良識別システム100を、図8Bを用いて説明する。
【0182】
図8Bは、不良識別システム100のブロック図である。なお、本明細書に添付した図面では、構成要素を機能ごとに分類し、互いに独立したブロックとしてブロック図を示しているが、実際の構成要素は機能ごとに完全に切り分けることが難しく、一つの構成要素が複数の機能に係わることもあり得る。また、一つの機能が複数の構成要素に係わることもあり得、例えば、処理部202で行われる処理は、処理によって異なるサーバで実行されることがある。
【0183】
不良識別システム100は、サーバ220と、端末230と、を有する。端末230として、例えば、パーソナルコンピュータなどである。
【0184】
サーバ220は、処理部202、伝送路212、記憶部213、及び通信部217aを有する。図8Bでは図示しないが、サーバ220は、さらに、入力部、出力部などを有していてもよい。
【0185】
端末230は、入力部201、記憶部203、表示部205、伝送路216、通信部217b、及び処理部218を有する。図8Bでは図示しないが、端末230は、さらに、出力部、データベースなどを有していてもよい。
【0186】
通信部217aが受信した画像データは、伝送路212を介して、記憶部213に保存される。または、当該画像データは、通信部217aから、直接、処理部202に供給されてもよい。
【0187】
先の実施の形態などで説明した、学習データの生成、および学習済みの識別モデルの生成は、高い処理能力が求められる。サーバ220が有する処理部202は、端末230が有する処理部218に比べて処理能力が高い。したがって、学習データの生成、および学習済みの識別モデルの生成は、処理部202で行われることが好ましい。
【0188】
そして、処理部202により学習済みの識別モデルが生成される。学習済みの識別モデルは、処理部202から、伝送路212を介して、または直接、通信部217aに供給される。学習済みの識別モデルは、サーバ220の通信部217aから端末230の通信部217bに送信され、記憶部203に保存される。または、学習済みの識別モデルは、伝送路212を介して、記憶部213に保存されてもよい。
【0189】
[伝送路212及び伝送路216]
伝送路212及び伝送路216は、データを伝達する機能を有する。処理部202、記憶部213、及び通信部217aの間のデータの送受信は、伝送路212を介して行うことができる。入力部201、記憶部203、表示部205、通信部217b、及び処理部218の間のデータの送受信は、伝送路216を介して行うことができる。
【0190】
[処理部202及び処理部218]
処理部202は、記憶部213及び通信部217aなどから供給されたデータを用いて、処理を行う機能を有する。処理部218は、入力部201、記憶部203、及び通信部217bなどから供給されたデータを用いて、処理を行う機能を有する。処理部202は、処理部218に比べて処理能力が高いことが好ましい。
【0191】
処理部202及び処理部218には、チャネル形成領域に金属酸化物を有するトランジスタを用いてもよい。当該トランジスタはオフ電流が極めて小さいため、当該トランジスタを記憶素子として機能する容量素子に流入した電荷(データ)を保持するためのスイッチとして用いることで、データの保持期間を長期にわたり確保することができる。この特性を、処理部202及び処理部218が有するレジスタ及びキャッシュメモリのうち少なくとも一方に用いることで、必要なときだけ処理部202及び処理部218を動作させ、他の場合には直前の処理の情報を当該記憶素子に待避させることにより処理部202及び処理部218をオフ状態にすることができる。すなわち、ノーマリーオフコンピューティングが可能となり、不良識別システム100の低消費電力化を図ることができる。
【0192】
なお、本明細書等において、チャネル形成領域に酸化物半導体を用いたトランジスタをOxide Semiconductorトランジスタ(OSトランジスタ)と呼ぶ。OSトランジスタのチャネル形成領域は、金属酸化物を有することが好ましい。
【0193】
チャネル形成領域が有する金属酸化物はインジウム(In)を含むことが好ましい。チャネル形成領域が有する金属酸化物がインジウムを含む金属酸化物の場合、OSトランジスタのキャリア移動度(電子移動度)が高くなる。また、チャネル形成領域が有する金属酸化物は、元素Mを含むことが好ましい。元素Mは、アルミニウム(Al)、ガリウム(Ga)、またはスズ(Sn)であることが好ましい。元素Mに適用可能な他の元素としては、ホウ素(B)、チタン(Ti)、鉄(Fe)、ニッケル(Ni)、ゲルマニウム(Ge)、イットリウム(Y)、ジルコニウム(Zr)、モリブデン(Mo)、ランタン(La)、セリウム(Ce)、ネオジム(Nd)、ハフニウム(Hf)、タンタル(Ta)、タングステン(W)などがある。ただし、元素Mとして、前述の元素を複数組み合わせても構わない場合がある。元素Mは、例えば、酸素との結合エネルギーが高い元素である。例えば、元素Mは、酸素との結合エネルギーがインジウムよりも高い元素である。また、チャネル形成領域が有する金属酸化物は、亜鉛(Zn)を含むことが好ましい。亜鉛を含む金属酸化物は結晶化しやすくなる場合がある。
【0194】
チャネル形成領域が有する金属酸化物は、インジウムを含む金属酸化物に限定されない。チャネル形成領域が有する金属酸化物は、例えば、亜鉛スズ酸化物、ガリウムスズ酸化物などの、インジウムを含まず、亜鉛を含む金属酸化物、ガリウムを含む金属酸化物、スズを含む金属酸化物などであっても構わない。
【0195】
また、処理部202及び処理部218には、チャネル形成領域にシリコンを含むトランジスタ(Siトランジスタ)を用いてもよい。また、チャネル形成領域に、グラフェン、シリセン、カルコゲン化物(遷移金属カルコゲナイト)などのバンドギャップを有する半導体材料を含むトランジスタを用いてもよい。
【0196】
また、処理部202及び処理部218には、チャネル形成領域に酸化物半導体を含むトランジスタと、チャネル形成領域にシリコンを含むトランジスタと、を組み合わせて用いてもよい。
【0197】
処理部202及び処理部218は、例えば、演算回路または中央演算装置(CPU:Central Processing Unit)等を有する。
【0198】
処理部202及び処理部218は、DSP(Digital Signal Processor)、GPU(Graphics Processing Unit)等のマイクロプロセッサを有していてもよい。マイクロプロセッサは、FPGA(Field Programmable Gate Array)、FPAA(Field Programmable Analog Array)等のPLD(Programmable Logic Device)によって実現された構成であってもよい。処理部202及び処理部218は、プロセッサにより種々のプログラムからの命令を解釈し実行することで、各種のデータ処理及びプログラム制御を行うことができる。プロセッサにより実行しうるプログラムは、プロセッサが有するメモリ領域及び記憶部203のうち少なくとも一方に格納される。
【0199】
処理部202及び処理部218はメインメモリを有していてもよい。メインメモリは、RAM等の揮発性メモリ、及びROM等の不揮発性メモリのうち少なくとも一方を有する。
【0200】
RAMとしては、例えばDRAM(Dynamic Random Access Memory)、SRAM(Static Random Access Memory)等が用いられ、処理部202及び処理部218の作業空間として仮想的にメモリ空間が割り当てられ利用される。記憶部203に格納されたオペレーティングシステム、アプリケーションプログラム、プログラムモジュール、プログラムデータ、及びルックアップテーブル等は、実行のためにRAMにロードされる。RAMにロードされたこれらのデータ、プログラム、及びプログラムモジュールは、それぞれ、処理部202及び処理部218に直接アクセスされ、操作される。
【0201】
ROMには、書き換えを必要としない、BIOS(Basic Input/Output System)及びファームウェア等を格納することができる。ROMとしては、マスクROM、OTPROM(One Time Programmable Read Only Memory)、EPROM(Erasable Programmable Read Only Memory)等が挙げられる。EPROMとしては、紫外線照射により記憶データの消去を可能とするUV-EPROM(Ultra-Violet Erasable Programmable Read Only Memory)、EEPROM(Electrically Erasable Programmable Read Only Memory)、フラッシュメモリ等が挙げられる。
【0202】
なお、ニューラルネットワークにおいては、積和演算が行われる。当該積和演算をハードウェアによって行う場合、処理部202及び処理部218は、積和演算回路を有することが好ましい。当該積和演算回路としては、デジタル回路を用いてもよいし、アナログ回路を用いてもよい。積和演算回路にアナログ回路を用いる場合、積和演算回路の回路規模の縮小、または、メモリへのアクセス回数の減少による処理速度の向上および消費電力の低減を図ることができる。なお、当該積和演算は、プログラムを用いてソフトウェア上で行ってもよい。
【0203】
積和演算回路は、Siトランジスタによって構成してもよいし、OSトランジスタによって構成してもよい。特に、OSトランジスタはオフ電流が極めて小さいため、積和演算回路のアナログメモリを構成するトランジスタとして好適である。なお、SiトランジスタとOSトランジスタの両方を用いて積和演算回路を構成してもよい。
【0204】
[記憶部203]
記憶部203は、処理部218が実行するプログラムを記憶する機能を有する。また、記憶部203は、処理部202が生成した学習済みの識別モデル、処理部218が生成した演算結果、通信部217bに入力されたデータ、及び入力部201に入力されたデータなどを記憶する機能を有する。
【0205】
記憶部203は、揮発性メモリ及び不揮発性メモリのうち少なくとも一方を有する。記憶部203は、例えば、DRAM、SRAMなどの揮発性メモリを有していてもよい。記憶部203は、例えば、ReRAM(Resistive Random Access Memory、抵抗変化型メモリともいう)、PRAM(Phase change Random Access Memory)、FeRAM(Ferroelectric Random Access Memory)、MRAM(Magnetoresistive Random Access Memory、磁気抵抗型メモリともいう)、またはフラッシュメモリなどの不揮発性メモリを有していてもよい。また、記憶部203は、ハードディスクドライブ(Hard Disc Drive:HDD)及びソリッドステートドライブ(Solid State Drive:SSD)等の記録メディアドライブを有していてもよい。
【0206】
[記憶部213]
記憶部213は、処理部202が実行するプログラムを記憶する機能を有する。また、記憶部213は、識別モデル、通信部217aに入力されたデータなどを記憶する機能を有する。記憶部213は、記憶部203の説明を参照できる。
【0207】
[通信部217a及び通信部217b]
通信部217a及び通信部217bを用いて、サーバ220と端末230との間で、データの送受信を行うことができる。通信部217a及び通信部217bとしては、ハブ、ルータ、モデムなどを用いることができる。データの送受信には、有線を用いても無線(例えば、電波、赤外線など)を用いてもよい。
【0208】
なお、サーバ220と端末230との通信は、World Wide Web(WWW)の基盤であるインターネット、イントラネット、エクストラネット、PAN(Personal Area Network)、LAN(Local Area Network)、CAN(Campus Area Network)、MAN(Metropolitan Area Network)、WAN(Wide Area Network)、GAN(Global Area Network)等のコンピュータネットワークに接続することで行ってもよい。
【0209】
なお、不良識別システム100の構成は上記に限られない。サーバ220が識別装置102の機能の一部を備え、端末230が学習データ生成装置101の機能の一部を備えてもよい。例えば、識別装置102が有する、不良を識別する機能を、サーバ220が備えてもよい。
【0210】
以上が、不良識別システム100についての説明である。なお、図8Aでは、不良識別システム100は、学習データ生成装置101、および識別装置102を有する構成を示しているが、これに限られない。不良識別システム100の変形例を以下に示す。以下で説明する不良識別システムの変形例は、本明細書などに示す他の不良識別システムと適宜組み合わせることができる。
【0211】
図8Aに示す不良識別システム100の変形例である不良識別システム100Aを、図9Aに示す。図9Aに示すように、不良識別システム100Aは、学習データ生成装置101、および識別装置102に加えて、データベース103を有してもよい。
【0212】
データベース103は、伝送路を介して、学習データ生成装置101、および識別装置102と接続されている。
【0213】
上記伝送路には、ローカルエリアネットワーク(LAN)、および、インターネットなどのネットワークが含まれる。また、当該ネットワークは、有線、および無線のいずれか一方、または両方による通信を用いることができる。
【0214】
データベース103は、画像データを格納する。当該画像データは、学習データとして用いられる画像データ(例えば、先の実施の形態で説明した画像データ20)、識別の対象となる画像データ(例えば、先の実施の形態で説明した画像データ21)、学習データを生成する際に利用される画像データ(例えば、先の実施の形態で説明した画像データ10)などである。当該画像データは、学習データ生成装置101が有する入力部、識別装置102が有する入力部、記憶媒体、通信などを介して、データベース103に格納される。このとき、当該画像データは、学習データ生成装置101が有する記憶部、または、識別装置102が有する記憶部に格納されなくてもよい。
【0215】
不良識別システム100Aは、例えば、学習データ生成装置101およびデータベース103がサーバに備えられ、識別装置102が端末に備えられてもよい。または、学習データ生成装置101、識別装置102、およびデータベース103が、単一の、端末またはサーバに備えられてもよい。または、データベース103は、学習データ生成装置101が備えられる端末またはサーバ、および、識別装置102が備えられる端末またはサーバとは異なる端末またはサーバに備えられてもよい。
【0216】
学習データ生成装置101、識別装置102、およびデータベース103が、単一の、端末またはサーバに備えられた不良識別システム100Aを、図9Bを用いて説明する。
【0217】
図9Bは、不良識別システム100Aのブロック図である。
【0218】
図9Bに示す不良識別システム100Aは、入力部201、処理部202、記憶部203、データベース204、表示部205、および伝送路206を有する。
【0219】
[入力部201]
入力部201には、不良識別システム100Aの外部から画像データが供給される。当該画像データは、ラベルが付与された画像データ、ラベルが付与されていない画像データ、学習データを生成する際に利用される画像データなどである。つまり、当該画像データは、学習データとして用いられる画像データ(例えば、先の実施の形態で説明した画像データ20)、識別の対象となる画像データ(例えば、先の実施の形態で説明した画像データ21)、学習データを生成する際に利用される画像データ(例えば、先の実施の形態で説明した画像データ10)などである。入力部201に供給された画像データは、それぞれ、伝送路206を介して、処理部202、記憶部203、またはデータベース204に供給される。
【0220】
[処理部202]
処理部202は、入力部201、記憶部203、データベース204などから供給されたデータを用いて、処理を行う機能を有する。処理部202は、処理結果を、記憶部203、データベース204、表示部205などに供給することができる。
【0221】
処理部202は、学習データを生成する機能、学習済みの識別モデルを生成する機能、および不良を識別する機能を有する。
【0222】
[記憶部203]
記憶部203は、処理部202が実行するプログラムを記憶する機能を有する。また、記憶部203は、例えば、学習済みの識別モデル、処理部202が生成した処理結果、入力部201に入力されたデータなどを記憶する機能を有していてもよい。具体的には、記憶部203は、処理部202で生成した、学習データ、学習用データセット、および学習済みの識別モデル、ならびに、不良の識別結果などを記憶する機能を有することが好ましい。
【0223】
[データベース204]
不良識別システム100Aは、データベース204を有する。例えば、データベース204は、上記画像データを記憶する機能を有する。なお、処理部202で生成した、学習データ、学習用データセット、および学習済みの識別モデル、ならびに、不良の識別結果などを記憶してもよい。このとき、これらのデータは、記憶部203に記憶されなくてもよい。
【0224】
なお、記憶部203及びデータベース204は互いに分離されていなくてもよい。例えば、不良識別システム100Aは、記憶部203及びデータベース204の双方の機能を有する記憶ユニットを有していてもよい。
【0225】
なお、処理部202、記憶部203、及びデータベース204が有するメモリは、それぞれ、非一時的コンピュータ可読記憶媒体の一例ということができる。
【0226】
[表示部205]
表示部205は、処理部202における処理結果を表示する機能を有する。また、表示部205は、不良の識別結果を表示する機能を有する。
【0227】
[伝送路206]
伝送路206は、各種データを伝達する機能を有する。入力部201、処理部202、記憶部203、データベース204、及び表示部205の間のデータの送受信は、伝送路206を介して行うことができる。例えば、画像データ、学習済みの識別モデルなどのデータが、伝送路206を介して、送受信される。
【0228】
なお、不良識別システム100Aは、出力部を有していてもよい。出力部は、外部にデータを供給する機能を有する。
【0229】
以上が、不良識別システム100Aについての説明である。
【0230】
また、図8Aに示す不良識別システム100の変形例である不良識別システム100Bを、図10に示す。図10に示すように、不良識別システム100Bは、学習データ生成装置101、および識別装置102に加えて、撮像装置104、および検査装置105を有してもよい。
【0231】
撮像装置104は、製造工程の途中である半導体素子、または製造工程が終了した半導体素子を撮像する機能を有する。撮像装置104として、例えば、カメラがある。当該半導体素子を撮像することで、不良の有無が判断されていない画像データが取得される。つまり、当該画像データは、識別の対象となりうる画像データである。または、当該画像データは、学習データを生成する際に利用されうる画像データである。
【0232】
検査装置105は、撮像装置104を用いて取得された画像データに、不良が含まれるか否かを判断する機能を有する。これにより、当該画像データに不良が含まれるか否かを判断することができる。
【0233】
不良が含まれるか否かの判断は、当該判断の対象となる画像データと、1つ前に取得された画像データとを比較することで行われる。例えば、はじめに、当該判断の対象となる画像データと、1つ前に取得された画像データとの差分を取得する。そして、当該差分を基に、不良が含まれるか否かの判断を行ってもよい。
【0234】
なお、不良が含まれるか否かの判断には、機械学習を用いてもよい。不良が含まれるか否かの判断を行う画像データの数は膨大となりやすい。そこで、機械学習を用いることで、当該判断に要する時間を低減することができる。
【0235】
不良が含まれるか否かの判断には、例えば、異常箇所の検知と類似の方法を用いることができる。異常箇所の検知には、教師なし学習を用いられることがある。そこで、当該判断には、教師なし学習を用いることが好ましい。教師なし学習を用いることで、不良が含まれる画像データの数が少なくても、不良が含まれるか否かの判断を精度良く行うことができる。
【0236】
なお、異常箇所の検知には、教師あり学習を用いられることがある。そこで、当該判断には、教師あり学習を用いてもよい。教師あり学習を用いることで、不良が含まれるか否かの判断を精度良く行うことができる。
【0237】
上記機械学習には、ニューラルネットワーク(特に、ディープラーニング)を用いることが好ましい。
【0238】
不良が含まれると判断された画像データは、識別の対象となる。つまり、当該画像データは、実施の形態1で説明した画像データ21に相当する。よって、当該画像データは、識別装置102に供給される。
【0239】
不良が含まれないと判断された画像データは、学習データを生成する際に利用してもよい。つまり、当該画像データは、実施の形態1で説明した画像データ10として利用することができる。また、不良が含まれるか否かを判断する機能として、ニューラルネットワークが用いられる場合、当該画像データは、当該ニューラルネットワークの学習データとして利用してもよい。
【0240】
不良識別システム100Bは、撮像装置104、および検査装置105を有することで、学習データの生成、学習済みの識別モデルの生成、および不良の識別に加えて、画像データの取得、および不良の有無の判定も行うことができる。
【0241】
以上が、不良識別システム100の構成についての説明である。本発明の一態様である不良識別システムを用いることで、不良を精度高く識別することができる。
【0242】
本発明の一態様により、学習データ生成装置を提供することができる。また、本発明の一態様により、不良識別システムを提供することができる。
【0243】
本実施の形態は、他の実施の形態、実施例などと適宜組み合わせることができる。また、本明細書において、1つの実施の形態の中に、複数の構成例が示される場合は、構成例を適宜組み合わせることが可能である。
【実施例0244】
本実施例では、識別モデルを用いて得られた不良識別の結果について、図11および図12を用いて説明する。具体的には、学習用データセットを用意し、当該学習用データセットを基に学習済みの識別モデルを生成し、当該識別モデルを用いて不良の識別を行うことで、不良識別の正解率を算出した。
【0245】
はじめに、3つの学習用データセット(学習用データセット1A、学習用データセット2A、および学習用データセット3A)を作成した。
【0246】
学習用データセット1Aは、不良を含む画像データのみで構成されている。つまり、学習用データセット1Aは、複数の画像データ20のみで構成されている。
【0247】
図11A乃至図11Cに、複数の画像データ20の一例を示す。図11Aは、異物41A_1の混入が確認された画像データ20_1である。図11Bは、膜抜け41B_1が確認された画像データ20_2である。図11Cは、パターン不良41C_1が確認された画像データ20_3である。
【0248】
画像データ20_1には、異物に対応するラベルが付与されている。画像データ20_2には、膜抜けに対応するラベルが付与されている。画像データ20_3には、パターン不良に対応するラベルが付与されている。
【0249】
学習用データセット1Aには、600個の画像データ20を用意した。なお、学習用データセット1Aを、300個の学習データと、300個の検証データとに分割した。
【0250】
学習用データセット2Aは、不良を含む画像データと、本発明の一態様の、学習データを生成する方法を用いて生成された、疑似不良を含む画像データと、で構成されている。つまり、学習用データセット2Aは、複数の画像データ20と、複数の画像データ12と、で構成されている。
【0251】
図11D乃至図11Fに、複数の画像データ12の一例を示す。図11Dは、疑似不良である楕円31A1_1が合成された画像データ12_1である。図11Eは、疑似不良である二重楕円31B_1が合成された画像データ12_2である。図11Fは、疑似不良である第2の多角形31C_1が合成された画像データ12_3である。
【0252】
画像データ12_1には、異物に対応するラベルが付与されている。画像データ12_2には、膜抜けに対応するラベルが付与されている。画像データ12_3には、パターン不良に対応するラベルが付与されている。
【0253】
学習用データセット2Aには、600個の画像データ20と、10000個の画像データ12と、を用意した。なお、学習用データセット2Aを、学習データと、検証データとに分割した。当該学習データは、300個の画像データ20と、10000個の画像データ12とで構成される。当該検証データは、当該学習データとして使用されなかった、300個の画像データ20で構成される。
【0254】
比較例である、学習用データセット3Aは、不良を含む画像データと、本発明の一態様の、学習データを生成する方法を用いずに作成した、疑似不良を含む画像データと、で構成されている。つまり、学習用データセット3Aは、複数の画像データ20と、複数の画像データ13と、で構成されている。
【0255】
画像データ13は、二次元図形42を含む画像データである。なお、二次元図形42は、本発明の一態様の、学習データを生成する方法を用いずに生成した二次元図形である。つまり、二次元図形42は、本発明の一態様の、学習データを生成する方法では生成し得ない二次元図形である。別言すると、二次元図形42の形状および/または色は、本発明の一態様の、学習データを生成する方法を用いて生成しうる二次元図形(先の実施の形態で説明したステップS012で生成しうる二次元図形)の形状および/または色と異なる。
【0256】
図11G乃至図11Iに、複数の画像データ13の一例を示す。図11Gは、疑似不良である二次元図形42_1が合成された画像データ13_1である。図11Hは、疑似不良である二次元図形42_2が合成された画像データ13_2である。図11Iは、疑似不良である二次元図形42_3が合成された画像データ13_3である。
【0257】
画像データ13_1には、異物に対応するラベルが付与されている。画像データ13_2には、膜抜けに対応するラベルが付与されている。画像データ13_3には、パターン不良に対応するラベルが付与されている。
【0258】
二次元図形42_1は、本発明の一態様の、学習データを生成する方法で生成しうる、異物を表現する二次元図形とは異なる。例えば、二次元図形42_1の色は、第1の多角形31A2が有しうる色と異なる。具体的には、二次元図形42_1の階調値は、Rが255であり、G、およびBが0である。
【0259】
二次元図形42_2は、本発明の一態様の、学習データを生成する方法で生成しうる、膜抜けを表現する二次元図形とは異なる。例えば、二次元図形42_2の形状および色は、二重楕円31Bが有しうる形状および色と異なる。具体的には、二次元図形42_2の形状は、四角形である。また、二次元図形42_2の階調値は、R、およびGが0であり、Bが255である。
【0260】
二次元図形42_3は、本発明の一態様の、学習データを生成する方法で生成しうる、パターン不良を表現する二次元図形とは異なる。例えば、二次元図形42_3の形状および色は、第2の多角形31Cが有しうる形状および色と異なる。具体的には、二次元図形42_3の形状は、楕円である。また、二次元図形42_3の階調値は、R、G、およびBのそれぞれが、0である。
【0261】
学習用データセット3Aには、600個の画像データ20と、10000個の画像データ13と、を用意した。なお、学習用データセット3Aを、学習データと、検証データとに分割した。当該学習データは、300個の画像データ20と、10000個の画像データ12とで構成される。当該検証データは、当該学習データとして使用されなかった、300個の画像データ20で構成される。
【0262】
学習用データセット1Aに基づいて、識別モデルを学習させた。当該識別モデルを識別モデル1Bとする。また、学習用データセット2Aに基づいて、識別モデルを学習させた。当該識別モデルを識別モデル2Bとする。また、学習用データセット3Aに基づいて、識別モデルを学習させた。当該識別モデルを識別モデル3Bとする。
【0263】
次に、識別モデル1B、識別モデル2B、識別モデル3Bを用いて、テストデータを用いて、不良識別を行った。なお、当該テストデータとして、300個の画像データ20を用意した。
【0264】
図12は、不良識別の正解率の推移を示す図である。図12に示す点線は、識別モデル1Bを用いた場合の、学習回数に対する不良識別の正解率である。図12に示す実線は、識別モデル2Bを用いた場合の、学習回数に対する不良識別の正解率である。図12に示す破線は、識別モデル3Bを用いた場合の、学習回数に対する不良識別の正解率である。
【0265】
図12より、正解率がある程度飽和した学習回数(具体的には100回目以降)において、識別モデル2Bの正解率は、識別モデル1Bの正解率よりも高い結果が得られた。よって、識別モデル2Bを学習させるのに用いた学習用データセット2Aは、適切なデータ拡張が行われた学習用データセットであることが分かる。以上より、学習用データセット2Aに含まれる画像データ12を利用することで、不良の識別を精度高く行うことができる。
【0266】
図12より、正解率がある程度飽和した学習回数(具体的には200回目以降)において、識別モデル3Bの正解率は、識別モデル1Bの正解率とほぼ同じであった。よって、識別モデル3Bを学習させるのに用いた学習用データセット3Aは、適切なデータ拡張が行われていない学習用データセットであることが分かる。
【0267】
以上より、本発明の一態様の、学習データを生成する方法を用いて生成された学習データを用いることで、不良の識別を精度高く行うことができる。
【0268】
本実施例は、他の実施の形態などに記載した構成と適宜組み合わせて実施することが可能である。
【符号の説明】
【0269】
10:画像データ、10s:範囲、11:画像データ、11_i:画像データ、11_p:画像データ、11_1:画像データ、11s:範囲、11t:画像データ、12:画像データ、12_i:画像データ、12_p:画像データ、12_1:画像データ、12_2:画像データ、12_3:画像データ、12A1:画像データ、12A2:画像データ、12B:画像データ、12C:画像データ、13:画像データ、13_1:画像データ、13_2:画像データ、13_3:画像データ、20:画像データ、20_j:画像データ、20_q:画像データ、20_1:画像データ、20_2:画像データ、20_3:画像データ、21:画像データ、31_i:二次元図形、31_p:二次元図形、31_1:二次元図形、31A1_1:楕円、31A1:楕円、31A2:第1の多角形、31B:二重楕円、31B_1:二重楕円、31C:第2の多角形、31C_1:第2の多角形、41A_1:異物、41B_1:膜抜け、41C_1:パターン不良、42:二次元図形、42_1:二次元図形、42_2:二次元図形、42_3:二次元図形、100:不良識別システム、100A:不良識別システム、100B:不良識別システム、101:学習データ生成装置、102:識別装置、103:データベース、104:撮像装置、105:検査装置、201:入力部、202:処理部、203:記憶部、204:データベース、205:表示部、206:伝送路、212:伝送路、213:記憶部、216:伝送路、217a:通信部、217b:通信部、218:処理部、220:サーバ、230:端末
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
【手続補正書】
【提出日】2024-07-29
【手続補正2】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
処理部を有する学習データ生成装置であって、
前記処理部は、チャネル形成領域に酸化物半導体を用いたトランジスタを有し、
前記酸化物半導体は、インジウムを有し、
パターンが正常である領域のみが撮影された第1の画像データの一部を第2の画像データとして切り出す機能と、
前記第2の画像データの面積に対応した、疑似不良を表す二次元図形を生成する機能と、
前記第2の画像データと前記二次元図形とを合成して第3の画像データを生成する機能と、
前記第3の画像データに、前記二次元図形に対応するラベルを付与する機能と、
を有し、
前記二次元図形は、第1の二次元図形、または第2の二次元図形であり、
前記第1の二次元図形は、形状および色を指定することで生成され、
前記第2の二次元図形は、前記第2の画像データを切り出すことで生成され、
前記第2の二次元図形は、第2の多角形であり、
前記第2の画像データと、前記第2の多角形と、を合成することで生成される前記第3の画像データには、第3のラベルが付与される、
学習データ生成装置。
【請求項2】
処理部を有する学習データ生成装置であって、
前記処理部は、チャネル形成領域に酸化物半導体を用いたトランジスタを有し、
パターンが正常である領域のみが撮影された第1の画像データの一部を第2の画像データとして切り出す機能と、
前記第2の画像データの面積に対応した、疑似不良を表す二次元図形を生成する機能と、
前記第2の画像データと前記二次元図形とを合成して第3の画像データを生成する機能と、
前記第3の画像データに、前記二次元図形に対応するラベルを付与する機能と、
を有し、
前記二次元図形は、第1の二次元図形、または第2の二次元図形であり、
前記第1の二次元図形は、形状および色を指定することで生成され、
前記第2の二次元図形は、前記第2の画像データを切り出すことで生成され、
前記第2の二次元図形は、第2の多角形であり、
前記第2の画像データと、前記第2の多角形と、を合成することで生成される前記第3の画像データには、第3のラベルが付与される、
学習データ生成装置。
【請求項3】
請求項1又は請求項2において、
前記第1の二次元図形は、第1の多角形、楕円、または二重楕円であり、
前記第2の画像データと、前記第1の多角形または前記楕円と、を合成することで生成される前記第3の画像データには、第1のラベルが付与され、
前記第2の画像データと、前記二重楕円と、を合成することで生成される前記第3の画像データには、第2のラベルが付与される、
学習データ生成装置。
【請求項4】
請求項3において、
前記第1の多角形は、第1の頂点乃至第n(nは3以上8以下の整数)の頂点を有し、
前記第1の多角形内の点と、前記第1の頂点乃至前記第nの頂点のそれぞれとを結ぶ線分の長さは、正規分布に従う長さであり、
前記正規分布は、平均が前記第2の画像データの長辺の、0.05倍以上0.25倍以下の長さであり、標準偏差が前記平均の0.2倍であり、
前記第1の多角形の色は、RGBのそれぞれが、256階調の表現において、0以上20以下(十進数で表記)であり、
前記第1の多角形の色の透過率は、0%以上10%以下である、
学習データ生成装置。
【請求項5】
請求項3又は請求項4において、
前記楕円の長径は、前記第2の画像データの長辺の、0.05倍以上0.25倍以下の長さであり、
前記楕円の短径は、前記楕円の長径の、0.6倍以上1.0倍以下の長さであり、
前記楕円の色は、RGBのそれぞれが、256階調の表現において、0以上10以下(十進数で表記)であり、
前記楕円の色の透過率は、0%以上10%以下である、
学習データ生成装置。
【請求項6】
請求項3乃至請求項5のいずれか一において、
前記二重楕円の長径は、前記第2の画像データの長辺の、0.05倍以上0.25倍以下の長さであり、
前記二重楕円の短径は、前記二重楕円の長径の0.6倍以上1.0倍以下の長さであり、
前記二重楕円の外径と、内径と、の差は、5ピクセル以上15ピクセル以下であり、
前記二重楕円の色は、256階調の表現において、Rが150以上170以下(十進数で表記)であり、Gが60以上80以下(十進数で表記)であり、Bが20以上40以下(十進数で表記)であり、
前記二重楕円の色の透過率は、50%以上75%以下である、
学習データ生成装置。
【請求項7】
請求項1乃至請求項6のいずれか一において、
前記第2の多角形は、前記第2の画像データ内に位置する点を中心に、30°以上150°以下の角度で回転させた前記第2の画像データから切り出された四角形であり、
前記四角形は、重心が前記第2の画像データ内に位置する前記点であり、長辺および短辺のそれぞれが、前記第2の画像データの長辺の、0.1倍以上0.25倍以下の長さである、
学習データ生成装置。
【請求項8】
請求項1乃至請求項7のいずれか一において、
前記学習データ生成装置は、
前記第3の画像データに対して、ガンマ変換を行う機能と、
前記第3の画像データに対して、ノイズ付加、またはぼかし加工を行う機能と、
を有する、
学習データ生成装置。
【請求項9】
請求項1乃至請求項8のいずれか一において、
前記酸化物半導体は、亜鉛を有する、
学習データ生成装置。
【請求項10】
不良を識別する不良識別システムであって、
前記不良識別システムは、請求項1乃至請求項9のいずれか一に記載の学習データ生成装置と、データベースと、識別装置と、を有し、
前記データベースには、前記第1の画像データと、ラベルが付与された第4の画像データと、ラベルが付与されていない第5の画像データと、が格納され、
前記識別装置は、学習済みモデルに基づいて、前記第5の画像データに含まれる不良を識別する機能を有する、
不良識別システム。
【請求項11】
請求項10において、
前記第3の画像データと、前記第4の画像データと、で構成された学習用データセットを基に、前記学習済みモデルが生成される、
不良識別システム。