IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社SCREENホールディングスの特許一覧

特開2024-47424学習装置、学習方法および学習プログラムに関する。
<>
  • 特開-学習装置、学習方法および学習プログラムに関する。 図1
  • 特開-学習装置、学習方法および学習プログラムに関する。 図2
  • 特開-学習装置、学習方法および学習プログラムに関する。 図3
  • 特開-学習装置、学習方法および学習プログラムに関する。 図4
  • 特開-学習装置、学習方法および学習プログラムに関する。 図5
  • 特開-学習装置、学習方法および学習プログラムに関する。 図6
  • 特開-学習装置、学習方法および学習プログラムに関する。 図7
  • 特開-学習装置、学習方法および学習プログラムに関する。 図8
  • 特開-学習装置、学習方法および学習プログラムに関する。 図9
  • 特開-学習装置、学習方法および学習プログラムに関する。 図10
  • 特開-学習装置、学習方法および学習プログラムに関する。 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024047424
(43)【公開日】2024-04-05
(54)【発明の名称】学習装置、学習方法および学習プログラムに関する。
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240329BHJP
   G06N 3/08 20230101ALI20240329BHJP
【FI】
G06N20/00
G06N3/08
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2022153036
(22)【出願日】2022-09-26
(71)【出願人】
【識別番号】000207551
【氏名又は名称】株式会社SCREENホールディングス
(74)【代理人】
【識別番号】100108523
【弁理士】
【氏名又は名称】中川 雅博
(74)【代理人】
【識別番号】100125704
【弁理士】
【氏名又は名称】坂根 剛
(74)【代理人】
【識別番号】100187931
【弁理士】
【氏名又は名称】澤村 英幸
(72)【発明者】
【氏名】宮脇 美和
(72)【発明者】
【氏名】岡山 敏之
(72)【発明者】
【氏名】野口 威
(72)【発明者】
【氏名】島田 佳典
(57)【要約】
【課題】
過学習させることなく、複数種類の画像から選択された特定の種類の画像に対する推論の精度を他の種類の画像よりも向上させた学習モデルを生成することを可能にする。
【解決手段】
学習装置200は、第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得部と、第1画像と、第2画像と、を同じ条件で学習させるエポックを複数回繰り返す第1学習部205と、第1学習部205により生成される学習済の学習モデルに、第1画像と第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習部211と、を備える。
【選択図】図3
【特許請求の範囲】
【請求項1】
第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得部と、
前記第1画像と、前記第2画像と、を同じ条件で学習させるエポックを複数回繰り返す第1学習部と、
前記第1学習部により生成される学習済の学習モデルに、前記第1画像と前記第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習部と、を備えた学習装置。
【請求項2】
前記第1学習部は、前記第1画像と前記第2画像とを、逆伝搬させる誤差の割合を同じにして学習させる、請求項1に記載の学習装置。
【請求項3】
前記学習用データは、前記第1画像として検査対象物を撮像して得られる検査画像と、検査装置が前記検査画像をそれぞれ検査した第1検査結果と、前記検査対象物を前記検査装置とは別の検査方法で検査した第2検査結果との組の複数を含み、
前記第1画像は、前記第1検査結果が欠陥ありを示しかつ前記第2検査結果が欠陥ありを示す前記検査画像であり、
前記第2画像は、前記第1検査結果が欠陥ありを示しかつ前記第2検査結果が欠陥なしを示す前記検査画像である、請求項1または2に記載学習装置。
【請求項4】
前記第2学習部は、前記虚報画像に対する逆伝播させる誤差の割合として前記欠陥画像に対する逆伝播させる誤差の割合よりも小さな値を設定する、請求項2に記載の学習装置。
【請求項5】
前記学習用データを前記第1学習部で学習途中の学習モデルに入力して得られる評価結果と、複数の検査対象物をそれぞれ撮像して得られる複数のテスト画像を前記第1学習部で学習途中の学習モデルに入力して得られる評価結果との差分である乖離度を表示する表示部を、さらに備えた、請求項1または2に記載の学習装置。
【請求項6】
複数の検査対象物をそれぞれ撮像して得られる複数のテスト画像を前記第1学習部で学習途中の学習モデルに入力して得られる評価結果に基づいて、前記第1学習部による学習の繰り返し回数を決定する回数決定部を、さらに備えた、請求項1または2に記載の学習装置。
【請求項7】
前記第1学習部は、前記繰り返し回数に対する評価結果の変化量を所定の値と比較する、請求項6に記載の学習装置。
【請求項8】
第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得ステップと、
前記第1画像と前記第2画像とを同じ条件で学習させるエポックを複数回繰り返す第1学習ステップと、
前記第1学習ステップにおいて生成される学習済の学習モデルに、前記第1画像と前記第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習ステップと、を含む学習方法。
【請求項9】
第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得ステップと、
前記第1画像と前記第2画像とを同じ条件で学習させるエポックを複数回繰り返す第1学習ステップと、
前記第1学習ステップにおいて生成される学習済の学習モデルに、前記第1画像と前記第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習ステップと、をコンピューターに実行させる学習プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習方法および学習プログラムに関する。
【背景技術】
【0002】
半導体デバイス、液晶ディスプレイ等の製造工程では、例えば半導体ウェハ、ガラス基板等の基板に対して各種処理が行われる。また、各種処理が行われた基板を検査するために検査装置が用いられる。検査装置は、例えば基板に処理を行う複数の処理ユニットとともに基板処理装置に設けられる。
【0003】
検査装置の一例として、特許文献1には、設計データを画像化した設計データ画像を教師とし、それに対応する検査対象画像を用いて、検査対象画像から設計データ画像を生成するためのモデルを作成し、作成したモデルを用いて検査対象画像から設計データ画像を予測し、検査対象画像に対応する設計データを画像化した設計データ予測画像と、検査対象画像から予測された設計データ画像とを比較することにより、欠陥を検出する画像評価装置が記載されている。
【先行技術文献】
【特許文献】
【0004】
【特許文献1】特開2019-129169号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
検査装置により欠陥として検出された基板を、検査者が検査することにより欠陥と判断される場合と、欠陥でないと判断される場合がある。検査装置による虚報を低減させることにより、検査者の負担を低減できる。
【0006】
このためには、欠陥を有する基板が検査者により欠陥ありと判断される前に、検査装置により欠陥でないと判断される確率を極力低減させる必要がある。この確率を低減するためには、画像評価装置において学習回数を増加することが考えられるが、過学習により推論の精度が低下するといった問題がある。
【0007】
本発明の目的は、過学習を防止しつつ、複数種類の画像から選択された特定の種類の画像に対する推論の精度を他の種類の画像よりも向上させた学習モデルを生成することが可能な学習装置、学習方法および学習プログラムを提供することである。
【課題を解決するための手段】
【0008】
(1)本発明の一局面に従う学習装置は、第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得部と、第1画像と、第2画像と、を同じ条件で学習させるエポックを複数回繰り返す第1学習部と、第1学習部により生成される学習済の学習モデルに、第1画像と第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習部と、を備える。
【0009】
(2)本発明の他の局面に従う学習方法は、第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得ステップと、第1画像と第2画像とを同じ条件で学習させるエポックを複数回繰り返す第1学習ステップと、第1学習ステップにおいて生成される学習済の学習モデルに、第1画像と第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習ステップと、を含む。
【0010】
(3)本発明のさらに他の局面に従う学習プログラムは、第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得ステップと、第1画像と第2画像とを同じ条件で学習させるエポックを複数回繰り返す第1学習ステップと、第1学習ステップにおいて生成される学習済の学習モデルに、第1画像と第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習ステップと、をコンピューターに実行させる。
【発明の効果】
【0011】
過学習を防止しつつ、複数種類の画像から選択された特定の種類の画像に対する推論の精度を他の種類の画像よりも向上させた学習モデルを生成することが可能になる。
【図面の簡単な説明】
【0012】
図1】本発明の一実施の形態に係る基板処理システムの構成を示すブロック図である。
図2】学習装置の構成の一例を示す図である。
図3】本発明の本実施の形態の1つにおける学習装置の機能的な構成の一例を示す図である。
図4】学習モデルの一例を説明する図である。
図5】第1学習済みモデルの評価結果の一例を示す図である。
図6】エポックの学習回数ごとの学習精度を示すグラフの一例を示す図である。
図7】第2学習済モデルの評価結果の一例を示す図である。
図8】学習処理の流れの一例を示すフローチャートである。
図9】第1学習動作処理の流れの一例を示す第1のフローチャートである。
図10】第1学習動作処理の流れの一例を示す第2のフローチャートである。
図11】第2学習動作処理の流れの一例を示すフローチャートである。
【発明を実施するための形態】
【0013】
以下、本発明の一実施の形態に係る学習装置、学習方法および学習プログラムについて図面を用いて説明する。以下の説明において、基板とは、半導体基板、液晶表示装置もしくは有機EL(Electro Luminescence)表示装置等のFPD(Flat Panel Display)用基板、光ディスク用基板、磁気ディスク用基板、光磁気ディスク用基板、フォトマスク用基板、セラミック基板または太陽電池用基板等をいう。
【0014】
1.基板処理システムの構成
図1は、本発明の一実施の形態に係る基板処理システムの構成を示すブロック図である。図1に示すように、基板処理システム500は、基板処理装置100、学習装置200および管理装置300を含む。基板処理装置100、学習装置200および管理装置300は、互いに通信可能にネットワーク510に接続されている。なお、本実施の形態においては、基板処理装置100および管理装置300はそれぞれ1つであるが、複数であってもよい。
【0015】
基板処理装置100は、制御装置101、1または複数の処理ユニット102、1または複数の搬送装置(搬送ロボット)103および1または複数の検査ユニット104を含む。なお、図1では、基板処理装置100の構成として、1つの処理ユニット102、1つの搬送装置103および1つの検査ユニット104が示される。本実施の形態に係る基板処理装置100は、当該基板処理装置100に対応する露光装置900とともに用いられる。
【0016】
1または複数の処理ユニット102は、基板に対して、処理液の塗布処理、温度調整処理または現像処理等の所定の処理を行う。より具体的には、本実施の形態に係る1または複数の処理ユニット102は、塗布処理ユニット、温度調整ユニットおよび塗布処理ユニットを含む。塗布処理ユニットは、基板の一面にレジスト膜を形成するユニットである。本実施の形態においては、基板の一面とは、基板の主面(回路形成面)を意味する。温度調整ユニットは、基板を加熱または冷却することにより基板の温度を調整するユニットである。現像処理ユニットは、レジスト膜が形成されかつ当該レジスト膜に対する露光処理後の基板に現像処理を行うユニットである。
【0017】
この場合、基板処理装置100においては、例えば、塗布処理ユニットにより、搬入された未処理の基板にレジスト膜が形成される。レジスト膜が形成された基板は、図1に白抜きの矢印a1で示すように、露光装置900に渡される。露光装置900では、基板に露光処理が行われる。露光処理後の基板は、図1に白抜きの矢印a2で示すように、露光装置900から基板処理装置100に戻される。基板処理装置100に戻された基板には、現像処理ユニットにより現像処理が行われる。
【0018】
搬送装置103は、1または複数の処理ユニット102と、1または複数の検査ユニット104と、基板処理装置100の外部装置(露光装置900等)との間で基板を搬送する。
【0019】
検査ユニット104は、基板の検査条件を示す検査レシピに基づいて、1または複数の処理ユニット102による処理後(本例では現像処理後)の基板の外観検査を行う。検査ユニット104は、図示しない撮像装置を含む。基板の外観検査では、基板を撮像することにより得られる基板画像を用いて基板の外観上の欠陥の有無が判定される。以下、検査ユニット104により基板外観上に欠陥があると判定された基板画像をNG画像と呼ぶ。NG画像は、学習装置200に送信される。
【0020】
制御装置101は、例えばCPU(中央演算処理装置)およびメモリ、またはマイクロコンピュータを含み、当該制御装置101を含む基板処理装置100の各構成要素(102~104)の動作を制御する。
【0021】
管理装置300は、例えばパーソナルコンピュータであり、CPUおよびメモリを含むとともに表示部310および操作部320を備える。管理装置300は、使用者による操作部320の操作に基づいて、互いに対応する基板処理装置100および露光装置900の各々に、例えば基板処理の開始を指令する。
【0022】
2.学習装置の構成
学習装置200は、検査ユニット104により欠陥ありと判定された基板を撮像して得られるNG画像を学習することにより検査ユニット104による検査結果の真偽を判定するための学習モデルを生成する。
【0023】
図2は、学習装置の構成の一例を示す図である。図2を参照して、学習装置200は、CPU251、RAM(Random Access Memory)252、ROM(Read Only Memory)253、記憶装置254、操作部255、表示装置256および入出力I/F257により構成される。CPU251、RAM252、ROM253、記憶装置254、操作部255、表示装置256および入出力I/F257はバス258に接続される。
【0024】
RAM252は、CPU251の作業領域として用いられる。ROM253にはシステムプログラムが記憶される。記憶装置254は、ハードディスクまたは半導体メモリ等の記憶媒体を含み、種々のプログラムを記憶する。種々のプログラムは、ROM253または他の外部記憶装置に記憶されてもよい。記憶装置254には、CD-ROM(Compact Disc-ROM)259が着脱可能である。操作部255は、キーボード、マウスまたはタッチパネル等の入力デバイスである。入出力I/F257は、ネットワークに接続される。表示装置256は、種々の画像を表示させる。
【0025】
一般的に、検査ユニット104により欠陥ありと判定された基板に対しては、検査者がNG画像を目視することにより欠陥があるか否かを判定する。この場合、検査ユニット104により欠陥ありと判断された結果と異なる場合がある。換言すれば、検査者は、検査ユニット104により欠陥ありと判断された基板について、検査ユニット104による判断結果が正しいか否かを検査する。以下、検査者により欠陥ありと判断された基板に対するNG画像を欠陥画像と呼び、検査者により欠陥でないと判断された基板に対するNG画像を虚報画像と呼ぶ。このように、検査者による基板の検査結果によって、NG画像は欠陥画像と虚報画像とのいずれかに分別される。この分別作業は、検査者にとって負担が大きい。
【0026】
この検査者の負担を軽減するために、検査ユニット104の精度を高めることなく、検査者が検査する前に、検査ユニット104により欠陥ありと判断されたNG画像のうちで虚報画像の数を低減することが望まれる。
【0027】
図3は、本発明の本実施の形態の1つにおける学習装置の機能的な構成の一例を示す図である。図3に示される機能は、学習装置200が備えるCPU251が、ROM253またはCD-ROM259に記憶された学習プログラムを実行することにより実現される。学習装置200は、NG画像取得部201、学習用データ取得部202、テスト用データ取得部203、正解データ取得部204、第1学習部205、評価部206、学習精度決定部207、記憶制御部208、表示制御部209、操作制御部210および第2学習部211を備える。
【0028】
NG画像取得部201は、入出力I/F257を制御して、検査ユニット104から送信されたNG画像を取得する。上述したように、NG画像は、検査ユニット104により欠陥ありと判断された基板を撮像して得られる画像である。NG画像は、基板を識別するための基板識別情報が関連付けられている。また、検査ユニット104によりNG画像がCD-ROM259に記憶される場合、NG画像取得部201は、記憶装置254を制御して、記憶装置254に装着されたCD-ROM259からNG画像を読み出す。
【0029】
正解データ取得部204は、NG画像取得部201により取得されたNG画像それぞれに対して検査者による判定結果を取得する。検査者による判定結果は、検査の対象となった基板を識別するための基板識別情報と関連付けられている。正解データ取得部204は、検査者による判定結果が記憶されたCD-ROM259が記憶装置254に装着される場合、正解データ取得部204は、記憶装置254を制御して、CD-ROM259から検査者による判定結果を読み出す。また、正解データ取得部204は、入出力I/F257を制御して、検査者が操作するパーソナルコンピュータから検査者による判定結果を受信してもよい。本実施の形態において、学習装置200が処理対象とするNG画像は、1000枚としている。
【0030】
学習用データ取得部202は、NG画像取得部201により取得されたNG画像の少なくとも一部を取得する。学習用データ取得部202は、正解データ取得部204により取得された判定結果に基づいて、取得されたNG画像に欠陥なしまたは欠陥ありのいずれかをラベリングした学習用データを生成する。学習用データ取得部202により生成される学習用データは、NG画像に欠陥なしがラベル付された虚報画像と、NG画像に欠陥ありがラベル付された欠陥画像とを含む。本実施の形態においては、学習用データに含まれる虚報画像の数と、欠陥画像の数とは同じである。本実施の形態において、学習用データは800枚のNG画像を含み、800枚のNG画像は、400枚の欠陥画像と400枚の虚報画像とを含む。なお、学習用データに含まれる虚報画像の数と欠陥画像の数とは異なってもよい。
【0031】
テスト用データ取得部203は、NG画像取得部201により取得されたNG画像のうち、学習用データ取得部202が取得したNG画像とは別のNG画像をテスト用データとして取得する。テスト用データ取得部203は、正解データ取得部204により取得された判定結果に基づいて、NG画像に欠陥ありまたは欠陥なしのいずれかをラベリングしたテスト用データを生成する。テスト用データ取得部203により生成されるテスト用データは、NG画像に欠陥なしがラベル付された虚報画像と、NG画像に欠陥ありがラベル付された欠陥画像とを含む。本実施の形態においては、テスト用データに含まれる虚報画像の数と、欠陥画像の数とは同じである。本実施の形態において、テスト用データは200枚のNG画像を含み、200枚のNG画像は、100枚の欠陥画像と100枚の虚報画像とを含む。なお、テスト用データに含まれる虚報画像の数と欠陥画像の数とは異なってもよい。
【0032】
第1学習部205は、学習用データ取得部202により取得された学習用データを用いて例えば畳み込みニューラルネットワーク等の第1学習モデルを機械学習(教師あり学習)する。
【0033】
図4は、学習モデルの一例を説明する図である。図4を参照して、学習モデルは、入力層、中間層および出力層を含み、各層に〇で示される複数のノードが含まれる。なお、図では、中間層を1つ示しているが、中間層の数はこれより多くてもよい。また、入力層に5つのノード、中間層に4つ、出力層に3つのノードが示されるが、ノードの数は、これに限定されるものではない。上位のノードの出力は下位のノードの入力に接続される。パラメータは、上位のノードの出力に対して重み付けする係数を含む。
【0034】
学習済の学習モデルに、検査画像データを入力すると、推論結果が出力される。学習段階において、学習用データが虚報画像の場合、学習用データに含まれるNG画像と学習用データに含まれる欠陥なしを示す教師データとが学習モデルに与えられる。また、学習段階において、学習用データが欠陥画像の場合、学習用データに含まれるNG画像と学習用データに含まれる欠陥ありを示す教師データとが学習モデルに与えられる。学習モデルが複数の学習用データを順に学習することにより、複数のノードそれぞれのパラメータが最適化される。学習モデルに複数の学習用データを順に学習用データの数だけ学習させる学習動作をエポックという。エポックを複数回繰り返すことにより学習モデルの学習精度が向上する。以下、エポックの繰り返し回数を、エポックの学習回数という。
【0035】
より具体的には、エポックにおける学習において、複数の学習用データ、ここでは800個の学習用データそれぞれが学習モデルに与えられる。学習用データから学習モデルによる推論された推論結果と教師データとの差分が誤差として算出される。そして、誤差逆伝播法を用いて、この誤差が少なくなるように複数のノードそれぞれのパラメータが更新される。
【0036】
学習モデルが有する複数のノードそれぞれに定められるパラメータは、誤差が小さくなるように調整される。具体的には、損失関数の勾配を求め、より誤差が小さくなる方向にパラメータが更新される。この更新の度合いを示す値が誤差を逆伝播させる割合である。誤差を逆伝播させる割合が小さいほど、誤差が重みパラメータを更新する値が小さい。
【0037】
誤差を逆伝播する割合は、パラメータが更新される度合いを示す。誤差を逆伝播する割合が大きいほどパラメータが更新される度合いが大きく、誤差を逆伝播する割合が小さいほどパラメータが更新される度合いが小さい。
【0038】
図3に戻って、第1学習部205が学習モデルを学習させる際に、欠陥画像と虚報画像とで誤差を逆伝播させる割合が同じ値に設定される。以下、第1学習部205によりエポックの学習回数だけ学習が終了した第1学習モデルを第1学習済モデルと呼ぶ。
【0039】
評価部206は、第1学習部205によるエポックの学習後に第1学習部205により生成された第1学習済モデルを、テスト用データ取得部203により取得されたテスト用データを用いて評価する。具体的には、評価部206は、テスト用データを第1学習済モデルに入力し、第1学習済モデルにより推論される推論結果を集計した評価結果を算出する。評価結果は、虚報画像について欠陥ありと推論される推論結果の割合、虚報画像について欠陥なしと推論される推論結果の割合、欠陥画像について欠陥ありと推論される推論結果の割合、欠陥画像について欠陥なしと推論される推論結果割合、を含む。
【0040】
図5は、第1学習済みモデルの評価結果の一例を示す図である。図5の第1学習済みモデルの評価結果においては、欠陥画像に対して欠陥ありと推論された推論結果の割合(85%)が左上に示され、欠陥画像に対して欠陥なしと推論された推論結果の割合(15%)が右上に示される。なお、欠陥画像に対して欠陥ありと推論された推論結果の割合と欠陥画像に対して欠陥なしと推論された推論結果の割合との和は、100%である。また、虚報画像に対して欠陥ありと推論された推論結果の割合(13%)が左下に示され、虚報画像に対して欠陥なしと推論された推論結果の割合(87%)が右下に示される。なお、虚報画像に対して欠陥ありと推論された推論結果の割合と虚報画像に対して欠陥なしと推論された推論結果の割合との和は、100%である。
【0041】
欠陥画像に対して欠陥ありと推論された推論結果の割合(85%)、および、虚報画像に対して欠陥なしと推論された推論結果の割合(87%)を高くするほど、学習モデルの学習が進んでいると言える。
【0042】
図3に戻って、評価部206は、テスト用データを用いた評価と同様に、第1学習部205によるエポックの学習後に第1学習部205により生成された第1学習済モデルを、学習用データ取得部202により取得された学習用データを用いて評価する。具体的には、評価部206は、学習用データを第1学習済モデルに入力し、第1学習済モデルにより推論される推論結果を集計した評価結果を取得する。
【0043】
学習精度決定部207は、第1学習部205によるエポックの学習回数だけ学習が終了するごとに第1学習済モデルに対して、評価部206により算出された評価結果に基づいて学習精度を決定する。本実施の形態においては、学習精度決定部207は、欠陥画像に対して欠陥ありと推論された推論結果の割合を学習精度に決定する。学習精度決定部207は、虚報画像に対して欠陥なしと推論された推論結果の割合を学習精度に決定してもよく、欠陥画像に対して欠陥ありと推論された推論結果の割合と虚報画像に対して欠陥なしと推論された推論結果の割合との平均値を学習精度として算出してもよい。
【0044】
記憶制御部208は、第1学習部205によるエポックの学習回数だけ学習が終了するごとに、エポックの学習回数と、第1学習済モデルと学習用データに対する学習精度とテスト用データに対する学習精度との組を記憶装置254に記憶する。第1学習部205は、エポックの学習回数が予め定められた回数になるまで学習を繰り返す。本実施の形態では、予め定められた回数は120回である。
【0045】
表示制御部209は、記憶制御部208にエポックの学習回数ごとに記憶された学習用データに対する学習精度とテスト用データに対する学習精度との組に基づいて、学習精度の変化を示すグラフを、表示装置256に表示する。
【0046】
図6は、エポックの学習回数ごとの学習精度を示すグラフの一例を示す図である。図6のグラフの縦軸には、学習精度が示され、グラフの横軸には、エポックの学習回数が示される。また、図6のグラフにおいては、学習用データに対する第1学習済モデルの学習精度の変化が点線で示され、テスト用データに対する第1学習済モデルの学習精度の変化が実線で示される。
【0047】
図6に示すように、エポックの学習回数が比較的少ない領域TZ(例えば、総学習回数の半分より短い期間)においては、エポックの学習回数の増加に伴って、学習精度の値が増加する傾向が読み取れる。これは、第1学習済モデルが学習不足であることを意味する。一方、領域TZよりエポックの学習回数が多い領域においては、エポックの学習回数の増加に伴って、学習精度の値は所定の範囲内で推移している。領域TZよりエポックの学習回数が多い領域において、学習精度が所定の値に収束するエポックの学習回数の第1学習済モデルが適切に学習を終了していると言える。
【0048】
また、図6においては、エポックの学習回数に対する第1学習済モデルの学習精度とテスト用データに対する第1学習済モデルの学習精度との差を示す乖離度DVが示される。乖離度DVが大きい場合、第1学習済モデルが学習不足であることを意味する。一方、乖離度DVが小さい場合、第1学習済モデルが適正に学習されたことを意味する。なお、図6には、示されていないが、エポックの学習回数がさらに増加した場合、テスト用データの学習精度の値と学習用データの学習精度の値とが乖離する。これは、第1学習済モデルが過学習であることを意味する。したがって、領域TZ以降で乖離度DVが小さいエポック数が適切なエポックの学習回数と言える。
【0049】
図6に示した学習精度の変化を示すグラフを見るユーザーは、操作部255を操作して、エポックの学習回数にそれぞれ対応する複数の第1学習済モデルのうち、適切な第1学習済みモデルを選択する。具体的には、操作部255に、最適と思われる第1学習済モデルに対応するエポックの学習回数SPを入力する。
【0050】
図3に戻って、操作制御部210は、ユーザーにより入力されたエポックの学習回数を、第2学習部211に出力する。なお、ここでは、最適な第1学習済モデルをユーザーが選択する例を示したが、エポックの学習回数に対する学習精度の変化量、または変化量の変化に基づいて適切なエポック数SPが決定されてもよい。
【0051】
操作制御部210は、ユーザーにより選択されたエポックの学習回数SPを第2学習部211に出力する。第2学習部211は、操作制御部210からエポックの学習回数SPが入力されることに応じて、第1学習部205からエポックの学習回数SPに対応する第1学習済モデルを第2学習モデルとして取得する。第2学習部211は、第2学習モデルを用いて機械学習する。
【0052】
具体的には、第2学習部211は、第1学習部205から取得した第1学習済モデルを、複数の学習用データ、ここでは800個の学習用データを学習させるエポックを繰り返す。以下、第2学習部211によりエポックの学習回数だけ学習が終了した第2学習モデルを第2学習済モデルと呼ぶ。
【0053】
第2学習部211は、第2学習モデルに複数の学習用データを学習させる際に、欠陥画像と虚報画像とで誤差を逆伝播させる割合が異なるように設定する。具体的には、虚報画像に対して誤差を逆伝搬させる割合を、欠陥画像に対して誤差を逆伝搬させる割合よりも小さくする。虚報画像に対する誤差を逆伝播させる割合に、1より小さい係数αを乗じ、欠陥画像に対する誤差を逆伝播させる割合に係数αを乗じない。
【0054】
前述したように、誤差が同じでも誤差を逆伝播させる割合が小さいほど、パラメータを更新する度合いが小さい。そのため、欠陥画像を学習することによりパラメータが更新される度合いが、虚報画像を学習することによりパラメータが更新される度合いよりも大きくなる。このため、虚報画像を学習することによる過学習を抑制しつつ、欠陥画像を学習することによる学習精度を向上させることができる。
【0055】
評価部206は、エポックの学習が終了するごとに第2学習部211により生成された第2学習済モデルを、テスト用データ取得部203により取得されたテスト用データを用いて評価する。具体的には、評価部206は、テスト用データを第2学習済モデルに入力し、第2学習済モデルにより推論される推論結果を集計した評価結果を算出する。なお、評価結果は、虚報画像について欠陥ありと推論される推論結果の割合、虚報画像について欠陥なしと推論される推論結果の割合、欠陥画像について欠陥ありと推論される推論結果の割合、欠陥画像について欠陥なしと推論される推論結果割合、を含む。
【0056】
第2学習部211は、エポックの学習回数が予め定められた回数になるまで学習を繰り返す。本実施の形態では、予め定められた回数は120回である。
【0057】
図7は、第2学習済モデルの評価結果の一例を示す図である。図7に示す評価結果は、エポックの学習回数が予め定められた回数に到達するまでエポックを繰り返した第2学習モデルの評価結果が示される。図7に示すように、欠陥画像に対して欠陥なしと推論される確率が小さくなっていることがわかる。
【0058】
表示制御部209は、図7に示す第2学習済モデルの評価結果を表示装置256に表示させる。この場合、ユーザーは、表示装置256に表示された評価部206の評価結果を検討することができる。
【0059】
図8は、学習処理の流れの一例を示すフローチャートである。学習処理は、学習装置200が備えるCPU251がRAM252に格納された予測器生成プログラムを実行することにより、CPU251により実行される処理である。予測器生成プログラムは、学習プログラムの一部である。
【0060】
図8を参照して、CPU251は、入出力I/F257を制御して、検査ユニット104から送信されたNG画像を取得する(ステップS01)。次のステップS02においては、第1学習動作処理が実行され、処理は、ステップS03に進む。第1学習動作処理の詳細は後述するが、第1学習モデルに対するエポックを所定数繰り返す処理である。
【0061】
ステップS03においては、表示装置256に学習精度が表示される。学習精度は、ステップS02で実行される第1学習動作処理において、エポックの繰り返し回数Kごとに算出された学習用データに対する学習精度およびテスト用データに対する学習精度を含む。例えば、図6に示したグラフが表示装置256に表示される。
【0062】
CPU251は、操作部255にエポックの学習回数SPが入力されたか否かを判定する(ステップS04)。ユーザーがエポックの学習回数を入力する操作を操作部255が受け付けたか否かが判断される。エポックの学習回数SPが入力されていない場合(ステップS04でNO)、待機状態となり、エポックの学習回数SPが入力された場合(ステップS04でYES)、処理はステップS05に進む。
【0063】
ステップS05においては、エポックの学習回数SPが取得される(ステップS05)。ここでは、ユーザーが操作部255に入力するエポックの学習回数SPが取得される。この段階で、第1学習モデルがエポックの学習回数SPだけ学習した第1学習済モデルが第2学習モデルとして決定される。
【0064】
次のステップS06においては、第2学習動作処理が実行され、処理はステップS07に進む。第2学習動作の詳細は後述するが、第2学習モデルに学習用データを学習させるエポックを所定回数繰り返す処理である。ステップS07においては、表示装置256に、第2学習動作処理で学習された第2学習済みモデルの評価結果が表示される。例えば、図7に示した評価結果が表示される。
【0065】
図9および図10は、第1学習動作処理の流れの一例を示すフローチャートである。第1学習動作処理は、図8に示した学習処理のステップS02において実行される処理である。図9および図10を参照して、CPU251は、学習用データを取得する(ステップS11)。次のステップS02においては、繰り返し回数Kが設定される(ステップS12)。繰り返し回数Kは、エポックを繰り返す回数として予め定められた値である。なお、繰り返し回数は、ユーザーが操作部255に入力することにより設定されてもよい。次のステップS13においては、変数nに1が設定される。
【0066】
次のステップS14において、CPU251は、ステップS11において取得された学習用データを第1学習モデルで機械学習する。ステップS14における機械学習においては、800個の学習用データが第1学習モデルにより学習される。それにより、エポックをn回繰り返して第1学習モデルを学習させた第1学習済モデルが生成される。
【0067】
次のステップS15においては、第1学習済モデルがテスト用データで評価され、処理はステップS16に進む。第1学習済モデルに200個のテスト用データをそれぞれ推論させ、200個の推論結果を集計した評価結果が算出される。ステップS16においては、テスト用データに対する評価結果に基づいてテスト用データの学習精度が決定される。
【0068】
次のステップS17においては、第1学習済モデルが学習用データで評価され、処理はステップS18に進む。ここでは、第1学習済モデルに800個の学習用データをそれぞれ推論させ、800個の推論結果を集計した評価結果が算出される。ステップS18においては、学習用データに対する評価結果に基づいて学習用データの学習精度が決定される。
【0069】
ステップS19においては、エポックの学習回数(n)、ステップS16において決定されたテスト用データに対する学習精度およびステップS19において決定された学習用データに対する学習精度が記憶装置254に記憶され、処理はステップS20に進む。
【0070】
ステップS20においては、変数nに1が加算され、処理はステップS21に進む。ステップS21においては、変数nが繰り返し回数Kより大きいか否かが判断される。変数nが繰り返し回数K以下である場合(ステップS21でNO)、処理はステップS14に戻るが、変数nが繰り返し回数Kより大きい場合(ステップS21でYES)、処理は学習処理に戻る。したがって、第1学習動作処理においては、ステップS14~ステップS19の処理が、繰り返し回数Kだけ繰り返される。
【0071】
図11は、第2学習動作処理の流れの一例を示すフローチャートである。第2学習動作処理は、図8に示した学習処理のステップS06において実行される処理である。第2学習動作処理が実行される前の段階で、エポック数SPが決定されている。
【0072】
図11を参照して、エポックの学習回数SPに対応する第1学習済みモデルが第2学習モデルに設定され(ステップS31)、処理はステップS32に進む。ステップS32においては、学習の対象となる学習用データが選択され、処理はステップS33に進む。学習用データは、ここでは800個である。800個の学習用データのうちから学習の対象となる1つの学習用データが順に選択される。
【0073】
ステップS34においては、選択された学習用データに含まれるNG画像が欠陥なしのラベルが付された虚報画像か否かが判断される。虚報画像ならば処理はステップS35に進むが、そうでなければ処理はステップS35をスキップして、ステップS36に進む。ステップS35においては、逆伝播する誤差の割合が、当該逆伝播する誤差の割合に係数α(1より小さい係数)が乗算された値に変更され、処理はステップS36に進む。したがって、虚報画像を学習する場合に逆伝播される誤差の割合が、欠陥画像を学習する場合に逆伝播される誤差の割合よりも小さな値に設定される。
【0074】
ステップS36において、CPU251は、ステップS33において選択された学習用データで第2学習モデルを機械学習し、処理をステップS37に進める。ステップS37においては、次に処理対象に選択される学習用データが存在するか否かが判断される。未選択の学習用データが存在するならば処理はステップS33に戻るが、そうでなければ処理はステップS38に進む。これにより、ステップS33~ステップS36の処理が、800個の学習用データのすべてについて繰り返される。800個の学習用データを学習した第2学習モデルが第2学習済モデルである。
【0075】
ステップS38においては、第2学習済モデルがテスト用データで評価され、処理はステップS39に進む。第2学習モデルに200個のテスト用データをそれぞれ推論させ、200個の推論結果を集計した評価結果が算出される。ステップS39においては、上述したステップS32~ステップS38の処理を行った処理回数が、予め定められた繰り返し回数Lに到達したか否かが判定される。
【0076】
ステップS32~ステップS38の処理を行った処理回数が、繰り返し回数Lに到達すると、処理は学習処理に戻るが、そうでなければ処理はステップS32に戻る。処理が学習処理に戻る場合、エポックの学習回数が繰り返し回数Lに到達するまでエポックを繰り返した第2学習済モデルが生成されている。
【0077】
2.実施の形態における効果
上記実施の形態においては、第1学習部205により欠陥画像と虚報画像とを同じ条件で学習させた第1学習済モデルが生成され、第2学習部211により当該欠陥画像と当該虚報画像とで逆伝播させる誤差の割合を異ならせて当該欠陥画像と当該虚報画像と第1学習済モデルに学習させる。このため、第1学習部205により生成される第1学習済モデルは、欠陥画像と虚報画像とにより同じ影響を受けて学習した学習モデルとなる。そして、第2学習部211により生成される第2学習済モデルは、欠陥画像および虚報画像のいずれか一方が他方よりも大きな影響を受けて学習した学習モデルとなる。このため、過学習させることなく、欠陥画像に対する推論の精度を虚報画像よりも向上させた学習モデルを生成することが可能になる。
【0078】
また、第1学習部205は、欠陥画像と虚報画像とを、逆伝搬させる誤差の割合を同じにして学習させた第1学習済モデルを生成するので、欠陥画像と虚報画像とで推論の精度が同じにした第1学習済モデルを生成することができる。
【0079】
さらに、第2学習部211は、虚報画像に対する逆伝搬させる誤差の割合を欠陥画像に対する逆伝搬させる誤差の割合よりも小さくして第2学習モデルを学習させるので、欠陥画像を虚報画像よりも学習の度合いを大きくすることができる。このため、欠陥画像を欠陥なしと推論する確率を低くした第2学習済モデルを生成することができる。
【0080】
また、第1学習部205によりエポックが繰り返し回数Kまで繰り返された後、表示装置256に図6に示した第1学習済みモデルの学習精度のグラフが表示されるので、適切なエポックの学習回数SPの第1学習済モデルを選択するために参考となる情報をユーザーに視認させることが可能になる。
【0081】
3.他の実施の形態
(1)上記実施の形態において、正解データ取得部204は、NG画像取得部201により取得されたNG画像それぞれに対して検査者による判定結果を取得するが本発明はこれに限定されない。正解データ取得部204は、NG画像取得部201により取得されたNG画像それぞれに対して他の検査装置等による判定結果を取得してもよい。
【0082】
(2)上記実施の形態において、第1学習動作においては、誤差逆伝播法により行われるが、第1学習動作は、他の学習方法により行われてもよい。
【0083】
(3)上記実施の形態において、第2学習部211が取得する第1学習済みモデルは、表示された学習精度のグラフに基づいてユーザーが最適と思われる第1学習済モデルに対応するエポック数SPを入力することにより決定されるが本発明はこれに限定されない。第2学習部211が取得する第1学習済みモデルは、学習装置200により自動的に決定されてもよい。例えば、学習装置200は、一のエポックの学習回数の学習精度と一のエポックの学習回数の次のエポックの学習回数の学習精度との変化量が予め定められた変化量より小さくなった時点をエポック数SPに自動的に決定してもよい。また、学習装置200は、エポックの学習回数に対する第1学習済みモデルの学習精度とテスト用データに対する第1学習済みモデルの学習精度との差を示す乖離度DVが予め定められた乖離度より小さくなった時点をエポックの学習回数SPに自動的に決定してもよい。さらに、学習装置200は、一のエポックの学習回数の学習精度と一のエポックの学習回数の次のエポックの学習回数の学習精度との変化量が予め定められた変化量より小さくなり、かつ乖離度DVが予め定められた乖離度より小さくなった時点をエポック数SPに自動的に決定してもよい。
【0084】
(4)上記実施の形態において、第2学習部211は、エポックの学習回数が予め定められた回数になるまで学習を繰り返すが本発明はこれに限定されない。第2学習済みモデルを生成するためのエポックの繰り返し回数は、ユーザーにより設定されてもよい。さらに、適切な第2学習済みモデルをユーザーが指定するようにしてもよい。この場合、例えば、図6と同様のエポックの学習回数ごとの学習精度を示すグラフと、図7に示した評価結果と、を表示装置に表示させて、ユーザーがエポックの繰り返し回数を決定してもよい。
【0085】
さらに、第2学習部211は、評価部206による評価結果に基づいて、学習を終了させてもよい。具体的には、第2学習部211は、評価結果のうち欠陥画像に対して欠陥なしと推論される推論結果の割合をしきい値と比較する。例えば、第2学習部211は、欠陥画像に対して欠陥なしと推論される推論結果の割合がしきい値以下となる場合に、学習を終了させてもよい。
【0086】
(5)上記実施の形態において、第1学習部205は、エポックを予め定められた繰り返し回数Kだけ繰り返す例が示されているが、本発明はこれに限定されない。例えば、第1学習部205がエポックを繰り返す回数は、自動的に決定されてもよい。例えば、第1学習部205は、評価部206が算出した評価結果に基づいて、第1学習部205がエポックを繰り返す回数決定してもよい。この場合、例えば欠陥画像に対して欠陥ありと推論された推論結果の割合と第1学習部205がエポックを繰り返す回数とを紐づけたテーブルを予め準備しておき、そのテーブルを用いて欠陥画像に対して欠陥ありと推論された推論結果の割合に基づいて第1学習部205がエポックを繰り返す回数が決定されてもよい。
【0087】
4.請求項の各構成要素と実施の形態の各部との対応関係
以下、請求項の各構成要素と実施の形態の各要素との対応の例について説明する。上記実施の形態では、第1画像が欠陥画像の例であり、第2画像が虚報画像の例であり、欠陥ありが第1検査結果の例であり、欠陥なしが第2検査結果の例である。また、表示装置256が表示部の例であり、第1学習部205が回数決定部の例である。
【0088】
5.実施の形態の総括
(第1項)本発明の一態様に係る学習装置は、
第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得部と、
前記第1画像と、前記第2画像と、を同じ条件で学習させるエポックを複数回繰り返す第1学習部と、
前記第1学習部により生成される学習済の学習モデルに、前記第1画像と前記第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習部と、を備える。
【0089】
第1項に記載の学習装置によれば、第1画像と第2画像とを同じ条件で学習させた学習済の学習モデルに、前記第1画像と前記第2画像とを逆伝播させる誤差の割合を異ならせて学習させる。このため、第1学習部により生成される学習済の学習モデルは、第1画像と第2画像とにより同じ影響を受けて学習した学習モデルとなる。そして、第2学習部により生成される学習済の学習モデルは、第1画像および第2画像のいずれか一方が他方よりも大きな影響を受けて学習した学習モデルとなる。このため、過学習させることなく、複数種類の画像から選択された特定の種類の画像に対する推論の精度を他の種類の画像よりも向上させた学習モデルを生成することが可能な学習装置を提供することができる。
【0090】
(第2項)第1項に記載の学習装置において、
前記第1学習部は、前記第1画像と前記第2画像とを、逆伝搬させる誤差の割合を同じにして学習させてもよい。
【0091】
第2項に記載の学習装置によれば、前記第1画像と前記第2画像とを、逆伝搬させる誤差の割合を同じにして学習させるので、第1画像と第2画像とで推論の精度が同じにした学習モデルを生成することができる。
【0092】
(第3項)第1項または第2項に記載の学習装置において、
前記学習用データは、前記第1画像として検査対象物を撮像して得られる検査画像と、検査装置が前記検査画像をそれぞれ検査した第1検査結果と、前記検査対象物を前記検査装置とは別の検査方法で検査した第2検査結果との組の複数を含み、
前記第1画像は、前記第1検査結果が欠陥ありを示しかつ前記第2検査結果が欠陥ありを示す前記検査画像であり、
前記第2画像は、前記第1検査結果が欠陥ありを示しかつ前記第2検査結果が欠陥なしを示す前記検査画像であってもよい。
【0093】
第3項記載の学習装置によれば、欠陥画像と虚報画像とのいずれか一方を他方よりも学習の度合いを大きくした学習モデルを生成することができる。
【0094】
(第4項)第2項に記載の学習装置において、
前記第2学習部は、前記虚報画像に対する逆伝播させる誤差の割合として前記欠陥画像に対する逆伝播させる誤差の割合よりも小さな値を設定してもよい。
【0095】
第4項に記載の学習装置に従えば、欠陥画像を虚報画像よりも学習の度合いを大きくした学習モデルが生成される。このため、欠陥画像を欠陥なしと推論する確率を低くした学習モデルを生成することができる。
【0096】
(第5項)第1項または第2項に記載の学習装置において、
前記学習用データを前記第1学習部で学習途中の学習モデルに入力して得られる評価結果と、複数の検査対象物をそれぞれ撮像して得られる複数のテスト画像を前記第1学習部で学習途中の学習モデルに入力して得られる評価結果との差分である乖離度を表示する表示部を、さらに備える。
【0097】
第5項に記載の学習装置によれば、乖離度が表示されるので、第1学習部による推論の精度を判断するための情報をユーザーに提示することができる。
【0098】
(第6項)第1項または第2項に記載の学習装置において、
複数の検査対象物をそれぞれ撮像して得られる複数のテスト画像を前記第1学習部で学習途中の学習モデルに入力して得られる評価結果に基づいて、前記第1学習部による学習の繰り返し回数を決定する回数決定部を、さらに備えてもよい。
【0099】
第6項に記載の学習装置に従えば、第1学習部による学習回数を自動的に決定することができる。
【0100】
(第7項)第6項に記載の学習装置において、
前記第1学習部は、前記繰り返し回数に対する評価結果の変化量を所定の値と比較してもよい。
【0101】
第7項に記載の学習装置は、第1学習部による適切な学習回数を決定することができる。
【0102】
(第8項)本発明の他の態様に係る学習方法は、
第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得ステップと、
前記第1画像と前記第2画像とを同じ条件で学習させるエポックを複数回繰り返す第1学習ステップと、
前記第1学習ステップにおいて生成される学習済の学習モデルに、前記第1画像と前記第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習ステップと、を含む。
【0103】
第8項に記載の学習方法によれば、過学習させることなく、複数種類の画像から選択された特定の種類の画像に対する推論の精度を他の種類の画像よりも向上させた学習モデルを生成することが可能な学習モデルを生成することが可能となる。
【0104】
(第9項) 本発明の他の態様に係る学習プログラムは、
第1の種類の第1画像と、第1の種類とは異なる第2の種類の第2画像とを含む学習用データを取得するデータ取得ステップと、
前記第1画像と前記第2画像とを同じ条件で学習させるエポックを複数回繰り返す第1学習ステップと、
前記第1学習ステップにおいて生成される学習済の学習モデルに、前記第1画像と前記第2画像とを逆伝播させる誤差の割合を異ならせて学習させるエポックを複数回繰り返す第2学習ステップと、をコンピューターに実行させる。
【0105】
第9項に記載の学習プログラムによれば、過学習させることなく、複数種類の画像から選択された特定の種類の画像に対する推論の精度を他の種類の画像よりも向上させた学習モデルを生成することが可能な学習モデルを生成することが可能となる。
【符号の説明】
【0106】
100…基板処理装置,101…制御装置,102…処理ユニット,103…搬送装置,104…検査ユニット,200…学習装置,201…NG画像取得部,202…学習用データ取得部,203…テスト用データ取得部,204…正解データ取得部,205…第1学習部,206…評価部,207…学習精度決定部,208…記憶制御部,209…表示制御部,210…操作制御部,211…第2学習部,251…CPU,252…RAM,253…ROM,254…記憶装置,255…操作部,256…表示装置,257…入出力I/F,258…バス,259…CD-ROM,300…管理装置,310…表示部,320…操作部,500…基板処理システム,510…ネットワーク,900…露光装置,DV…乖離度,K…学習回数,SP…エポックの学習回数,T…しきい値,TZ…領域,n…変数,α…係数
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11