(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024010338
(43)【公開日】2024-01-24
(54)【発明の名称】教師データ作成方法及び作成装置
(51)【国際特許分類】
G06T 7/00 20170101AFI20240117BHJP
G06V 10/82 20220101ALI20240117BHJP
G06N 20/00 20190101ALI20240117BHJP
G06N 3/08 20230101ALI20240117BHJP
【FI】
G06T7/00 350C
G06V10/82
G06T7/00 610Z
G06N20/00
G06N3/08
【審査請求】有
【請求項の数】4
【出願形態】OL
(21)【出願番号】P 2022111624
(22)【出願日】2022-07-12
(71)【出願人】
【識別番号】000005326
【氏名又は名称】本田技研工業株式会社
(74)【代理人】
【識別番号】100095566
【弁理士】
【氏名又は名称】高橋 友雄
(74)【代理人】
【識別番号】100114775
【弁理士】
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【弁理士】
【氏名又は名称】小田 直
(72)【発明者】
【氏名】軽部 俊和
(72)【発明者】
【氏名】城島 昂佑
(72)【発明者】
【氏名】吉田 裕
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096BA03
5L096DA01
5L096GA30
5L096HA11
5L096JA11
5L096KA04
5L096KA13
5L096MA03
(57)【要約】
【課題】多数の良品画像と少数の不良品画像に基づき、十分な量と品質の教師データを作成することができる教師データの作成方法を提供する。
【解決手段】本発明に係る教師データ作成方法は、欠陥のない製品又は部品の画像である良品画像と、欠陥を有する製品又は部品の画像である不良品画像と、を用いて学習を行う欠陥分類モデルにおいて、良品教師データと不良品教師データとを作成する教師データ作成方法であって、多数の良品画像から、所定の第1の次元数の特徴量を抽出して得られた多数の良品特徴量データを良品教師データとして取得する工程と、良品画像の数よりも少ない数の不良品画像から、第1の次元数の特徴量を抽出して得られた少数の不良品特徴量データを用いて学習した生成モデルを用い、第1の次元数の特徴量を生成して得られた多数の生成不良品特徴量データを不良品教師データとして取得する工程と、を有することを特徴とする。
【選択図】
図2
【特許請求の範囲】
【請求項1】
欠陥のない製品又は部品の画像である良品画像と、欠陥を有する製品又は部品の画像である不良品画像と、を用いて学習を行う欠陥分類モデルにおいて、良品教師データと不良品教師データとを作成する教師データ作成方法であって、
多数の前記良品画像から、所定の第1の次元数の特徴量を抽出して得られた多数の良品特徴量データを前記良品教師データとして取得する良品教師データ取得工程と、
前記良品画像の数よりも少ない数の前記不良品画像から、前記第1の次元数の特徴量を抽出して得られた不良品特徴量データを用いて学習した生成モデルを用い、前記第1の次元数の特徴量を生成して得られた多数の生成不良品特徴量データを前記不良品教師データとして取得する不良品教師データ取得工程と、
を有することを特徴とする、教師データ作成方法。
【請求項2】
前記不良品教師データ取得工程は、
前記不良品画像が元画像として入力されると、前記元画像から抽出した特徴量の次元を削減して所定の第2の次元数の潜在変数とその確率分布を算出するエンコーダと、前記潜在変数と前記確率分布から前記元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、前記元画像と前記再構成画像の間の再構成誤差を最小化するように前記エンコーダ及び前記デコーダの重み付けを学習する第1学習工程と、
前記不良品画像から前記第1の次元数の特徴量を抽出し、第2学習用正解データとして取得する正解データ取得工程と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布から、前記不良品画像に対応する前記第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得工程と、
前記取得した前記第2の次元数の前記特徴量ベクトルが入力されると、前記第1の次元数の前記生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、前記生成不良品特徴量データと前記第2学習用正解データの間の損失を最小化するように前記多層パーセプトロンデコーダの重み付けを学習する第2学習工程と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布からランダムサンプリングにより取得した多数の前記第2の次元数の特徴量ベクトルを学習済みの前記多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成工程と、
を含むことを特徴とする、請求項1に記載の教師データ作成方法。
【請求項3】
欠陥のない製品又は部品の画像である良品画像と、欠陥を有する製品又は部品の画像である不良品画像と、を用いて学習を行う欠陥分類モデルにおいて、良品教師データと不良品教師データとを作成する教師データ作成装置であって、
多数の前記良品画像から、所定の第1の次元数の特徴量を抽出して得られた多数の良品特徴量データを前記良品教師データとして取得する良品教師データ取得部と、
前記良品画像の数よりも少ない数の前記不良品画像から、前記第1の次元数の特徴量を抽出して得られた不良品特徴量データを用いて学習した生成モデルを用い、前記第1の次元数の特徴量を生成して得られた多数の生成不良品特徴量データを前記不良品教師データとして取得する不良品教師データ取得部と、
を備えることを特徴とする、教師データ作成装置。
【請求項4】
前記不良品教師データ取得部は、
前記不良品画像が元画像として入力されると、前記元画像から抽出した特徴量の次元を削減して所定の第2の次元数の潜在変数とその確率分布を算出するエンコーダと、前記潜在変数と前記確率分布から前記元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、前記元画像と前記再構成画像の間の再構成誤差を最小化するように前記エンコーダ及び前記デコーダの重み付けを学習する第1学習部と、
前記不良品画像から前記第1の次元数の特徴量を抽出し、第2学習用正解データとして取得する正解データ取得部と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布から、前記不良品画像に対応する前記第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得部と、
前記取得した前記第2の次元数の前記特徴量ベクトルが入力されると、前記第1の次元数の前記生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、前記生成不良品特徴量データと前記第2学習用正解データの間の損失を最小化するように前記多層パーセプトロンデコーダの重み付けを学習する第2学習部と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布からランダムサンプリングにより取得した多数の前記第2の次元数の特徴量ベクトルを学習済みの前記多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成部と、
を備えることを特徴とする、請求項3に記載の教師データ作成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ニューラルネットワークを用いた機械学習機能を有する検査装置などに適用され、検査対象物の良否を判定するための分類モデルにおける教師データの作成方法及び作成装置に関する。
【背景技術】
【0002】
近年、ニューラルネットワークを用いた分類モデルを有する検査装置により、各種の工業製品や部品などの検査対象物について、正常品(良品)であるか、異常品(不良品)であるかを判定する検品作業の自動化技術の開発が進んでいる。こうした検査装置に用いられる分類モデルにおいては、一般に、良品と不良品に分類された検査対象物の外観の画像データを教師データとして多数読み込ませることにより、学習が行われる。そして、分類基準を学習した分類モデルにより、カメラで撮影した新規の検査対象物を、良品と不良品に分類することが可能になる。
【0003】
一般に、こうした検査装置の分類モデルの判定精度は、学習させるデータの質と量に依存する。従来、例えば特許文献1のように、良品の画像データのみを教師データとして分類モデルの学習を行う技術が提案されている。良品の画像データは入手しやすく、多数の画像を用意することが容易であるが、一方で、良品の画像データのみを学習に用いた場合、良品画像と不良品画像との差異を学習させることができないため、不良品の見逃し率を下げるために、良品を不良品と判定してしまう過検出が多くなるという問題がある。
【0004】
こうした問題を回避するためには、分類モデルの学習において、良品と不良品のいずれについても多数の教師データを用意し、それらを用いて学習を行うことが望ましい。ところが、工業製品などの製造現場では一般に、できるだけ不良品を出さないように製造が行われるため、良品の数に対して不良品の数は非常に少ないのが通常である。そのため、比較的容易に収集可能な良品の画像データに比べて、不良品の画像データの収集には困難が伴う。
【0005】
こうした問題に対し、不良品画像を用いて学習させた生成モデルを用いて疑似不良品画像を多数生成し、それを分類モデル学習用の教師データとして用いる技術が提案されている。例えば特許文献2では、不良品画像と、当該不良品画像のうち欠陥に対応した欠陥領域をマスクして作成した不良品マスク画像と、を用いて学習した復元器により、疑似不良品画像を量産し、それを分類モデルの学習に用いる技術が開示されている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特開2021-144314号公報
【特許文献2】特開2021-043816号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
特許文献2のように、生成モデルにより疑似不良品画像を生成する場合、質の良い疑似不良品画像を生成するためには、生成モデルの学習を十分に行う必要があり、そのためには、通常、訓練データとなる不良品の画像データを多数用意する必要がある。しかしながら、上述のとおり、そもそも不良品の画像データを大量に収集することは困難である。そして、少量の不良品画像データのみで学習した分類モデルにより生成される疑似不良品画像では、分類モデルの学習用教師データとしての品質が不十分な場合がある。
【0008】
本発明は、このような課題を解決するためになされたものであり、多数の良品画像と少数の不良品画像に基づき、十分な量と品質の教師データを作成することができる教師データの作成方法を提供することを目的とする。
【課題を解決するための手段】
【0009】
この目的を達成するために、本発明の請求項1に係る発明は、欠陥のない製品又は部品の画像である良品画像と、欠陥を有する製品又は部品の画像である不良品画像と、を用いて学習を行う欠陥分類モデルにおいて、良品教師データと不良品教師データとを作成する教師データ作成方法であって、多数の良品画像から、所定の第1の次元数(実施形態における(以下、本項において同じ)p次元)の特徴量を抽出して得られた多数の良品特徴量データを良品教師データとして取得する良品教師データ取得工程(
図3のステップ302)と、良品画像の数よりも少ない数の不良品画像から、第1の次元数の特徴量を抽出して得られた不良品特徴量データを用いて学習した生成モデル(VAE、MLPデコーダ)を用い、第1の次元数の特徴量を生成して得られた多数の生成不良品特徴量データを不良品教師データとして取得する不良品教師データ取得工程(
図3のステップ303)と、を有することを特徴とする。
【0010】
この教師データ作成方法では、多数の良品画像から抽出した多数の所定次元数の良品特徴量データを直接、良品教師データとして取得する一方で、少数の不良品画像から抽出した少数の所定次元数の不良品特徴量データは、生成モデルの学習に用い、学習済みの生成モデルにより多数の所定次元数の生成不良品特徴量データを生成し、それを不良品教師データとして取得する。
【0011】
このように、本発明は、少数の不良品画像に基づき多数の疑似不良品画像を生成するのではなく、少数の不良品画像に基づき多数の所定次元数の生成不良品特徴量データを生成し、それを不良品教師データとすることを特徴としている。生成モデルは、疑似画像ではなく、教師データとして求められる所定次元数の特徴量データのみを生成すればよいので、疑似不良品画像を生成する場合と比較して、生成モデルが処理すべきパラメータ数を大幅に減少させることができる。これにより、生成モデルの学習に必要な不良品画像の数を大幅に減少させることができ、少数の不良品画像に基づき十分な品質の生成不良品特徴量データを生成することができる。したがって、本発明によれば、多数の良品画像と少数の不良品画像に基づき、十分な量と品質の教師データを作成することができる教師データの作成方法を提供することができる。
【0012】
本発明の請求項2に係る発明は、請求項1に記載の教師データ作成方法において、不良品教師データ取得工程は、不良品画像が元画像として入力されると、元画像から抽出した特徴量の次元を削減して所定の第2の次元数(k次元)の潜在変数とその確率分布を算出するエンコーダと、潜在変数と確率分布から元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、元画像と再構成画像の間の再構成誤差を最小化するようにエンコーダ及びデコーダの重み付けを学習する第1学習工程(
図4のステップ401、
図5のステップ501~503)と、不良品画像から第1の次元数の特徴量を抽出し、第2学習用正解データとして取得する正解データ取得工程(
図6のステップ601、
図7)と、学習済みの変分オートエンコーダの潜在変数の確率分布から第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得工程(
図6のステップ602)と、取得した第2の次元数の特徴量ベクトルが入力されると、第1の次元数の生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、生成不良品特徴量データと第2学習用正解データの間の損失を最小化するように多層パーセプトロンデコーダの重み付けを学習する第2学習工程(
図4のステップ402、
図6のステップ603~605、
図8)と、学習済みの変分オートエンコーダの潜在変数の確率分布からランダムサンプリングにより取得した多数の第2の次元数の特徴量ベクトルを学習済みの多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成工程(
図4のステップ403、
図9のステップ901~903)と、を含むことを特徴とする。
【0013】
この構成によれば、第1学習工程において、元の不良品画像から再構成画像を精度よく出力できるように変分オートエンコーダ(以下、VAEという。)を学習させる。また、正解データ取得工程において、不良品画像から所定次元数の特徴量を抽出し第2学習用正解データとして取得し、特徴量ベクトル取得工程において、学習済みVAEの潜在変数の確率分布から、不良品画像に対応する特徴量ベクトルを取得する。その後、第2学習工程において、取得した特徴量ベクトルから生成した生成不良品特徴量データが、第2学習用正解データに近いものとなるように多層パーセプトロンデコーダ(以下、MLPデコーダという。)を学習させる。このようにして事前学習を終了させたVAEとMLPデコーダからなる生成モデルを用い、不良品特徴量データ生成工程において、学習済みのVAEの潜在変数の確率分布から、ランダムサンプリングにより多数の特徴量ベクトルを取得し、それを学習済みのMLPデコーダに入力することで、多数の生成不良品特徴量データを生成する。
【0014】
例えば、生成モデルとしてVAEを用い、不良品画像を入力として疑似不良品画像を生成するように学習を行う場合を考える。この場合、エンコーダにおいて、例えば256×256=65536ピクセルの不良品画像を、より低次元、例えば500次元の潜在変数に圧縮したとすると、デコーダにおいては、500次元の潜在変数から再び65536ピクセルの画像にデコードする必要があり、これを処理するデコーダが扱うパラメータ数は膨大なものとなる。これに対し、本構成においては、疑似不良品画像を生成する必要はなく、教師データとして求められる所定次元数の特徴量データのみを生成すればよいので、例えば求められる特徴量の次元数が1000次元の場合は、500次元の潜在変数から1000次元の特徴量データをデコードすれば足りることになる。
【0015】
これにより、生成モデルが処理すべきパラメータ数を大幅に減少させることができるので、生成モデルの学習に必要な不良品画像の数を大幅に減少させることができる。したがって、少数の不良品画像に基づき十分な品質の生成不良品特徴量データを生成することができる。このようにして、本構成によれば、多数の良品画像と少数の不良品画像に基づき、十分な量と品質の教師データを作成することができる教師データの作成方法を提供することができる。
【0016】
本発明の請求項3に係る発明は、欠陥のない製品又は部品の画像である良品画像と、欠陥を有する製品又は部品の画像である不良品画像と、を用いて学習を行う欠陥分類モデルにおいて、良品教師データと不良品教師データとを作成する教師データ作成装置11であって、多数(M個)の良品画像から、所定の第1の次元数の特徴量を抽出して得られた多数の良品特徴量データを良品教師データとして取得する良品教師データ取得部12と、良品画像の数よりも少ない数(N個)の不良品画像から、第1の次元数の特徴量を抽出して得られた不良品特徴量データを用いて学習した生成モデルを用い、第1の次元数の特徴量を生成して得られた多数の生成不良品特徴量データを不良品教師データとして取得する不良品教師データ取得部13と、を備えることを特徴とする。
【0017】
この教師データ作成装置では、多数の良品画像から抽出した多数の所定次元数の良品特徴量データを直接、良品教師データとして取得する一方で、少数の不良品画像から抽出した少数の所定次元数の不良品特徴量データは、生成モデルの学習に用い、学習済みの生成モデルにより多数の所定次元数の生成不良品特徴量データを生成し、それを不良品教師データとして取得する。このように、本発明は、少数の不良品画像に基づき多数の疑似不良品画像を生成するのではなく、少数の不良品画像に基づき多数の所定次元数の生成不良品特徴量データを生成し、それを不良品教師データとすることを特徴としているので、疑似不良品画像を生成する場合と比較して、生成モデルが処理すべきパラメータ数を大幅に減少させることができる。これにより、生成モデルの学習に必要な不良品画像の数を大幅に減少させることができ、少数の不良品画像に基づき十分な品質の生成不良品特徴量データを生成することができるので、多数の良品画像と少数の不良品画像に基づき、十分な量と品質の教師データを作成することができる教師データの作成装置を提供することができる。
【0018】
本発明の請求項4に係る発明は、請求項3に記載の教師データ作成装置において、不良品教師データ取得部13は、不良品画像が元画像として入力されると、元画像から抽出した特徴量の次元を削減して所定の第2の次元数の潜在変数とその確率分布を算出するエンコーダと、潜在変数と確率分布から元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、元画像と再構成画像の間の再構成誤差を最小化するようにエンコーダ及びデコーダの重み付けを学習する第1学習部(VAE事前学習部14)と、不良品画像から第1の次元数の特徴量を抽出し、第2学習用正解データとして取得する正解データ取得部15と、学習済みの変分オートエンコーダの潜在変数の確率分布から、不良品画像に対応する第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得部16と、取得した第2の次元数の特徴量ベクトルが入力されると、第1の次元数の生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、生成不良品特徴量データと第2学習用正解データの間の損失を最小化するように前記多層パーセプトロンデコーダの重み付けを学習する第2学習部(MLP事前学習部17)と、学習済みの変分オートエンコーダの潜在変数の確率分布からランダムサンプリングにより取得した多数の第2の次元数の特徴量ベクトルを学習済みの多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成部18と、を備えることを特徴とする。
【0019】
この構成によれば、不良品画像を用いて事前学習を行ったVAEとMLPデコーダからなる生成モデルを用い、不良品特徴量データ生成部において、学習済みのVAEの潜在変数の確率分布から、ランダムサンプリングにより多数の特徴量ベクトルを取得し、それを学習済みのMLPデコーダに入力することで、多数の生成不良品特徴量データを生成する。本構成においては、VAEとMLPデコーダからなる生成モデルは、疑似不良品画像を生成する必要はなく、教師データとして求められる所定次元数の特徴量データのみを生成すればよいので、生成モデルが処理すべきパラメータ数を大幅に減少させることができる。これにより、生成モデルの学習に必要な不良品画像の数を大幅に減少させることができるので、少数の不良品画像に基づき十分な品質の生成不良品特徴量データを生成することができる。このようにして、本構成によれば、多数の良品画像と少数の不良品画像に基づき、十分な量と品質の教師データを作成することができる教師データの作成装置を提供することができる。
【図面の簡単な説明】
【0020】
【
図1】本発明の一実施形態による教師データ作成装置によって作成された教師データが学習に利用される検査システムの概要を説明するための図である。
【
図2】本発明の一実施形態による教師データ作成装置を示すブロック図である。
【
図3】教師データ作成装置による教師データ作成処理を示すフローチャートである。
【
図4】教師データ作成装置による不良品教師データ取得処理を示すフローチャートである。
【
図5】教師データ作成装置によるVAE学習処理を示すフローチャートである。
【
図6】教師データ作成装置によるMLP学習処理を示すフローチャートである。
【
図7】教師データ作成装置による正解データ取得処理を示す模式図である。
【
図8】教師データ作成装置によるMLP学習処理を示す模式図である。
【
図9】教師データ作成装置による不良品特徴量データ生成処理を示すフローチャートである。
【発明を実施するための形態】
【0021】
以下、図面を参照しながら、本発明の好ましい実施形態を詳細に説明する。
図1は、後述する教師データ作成装置11によって作成された多数の良品教師データ及び多数の不良品教師データを用いて学習を行った分類モデルを備えた検査システムを示している。この検査システム1は、例えば車両部品の製造工場などに設置され、製造された車両部品(例えばシリンダブロック)が正常品(良品)であるか、異常品(不良品)であるかを、車両部品の外観を検査することによって自動で判別するものである。以下、検査すべき車両部品を、「検査対象物」というものとする。
【0022】
図1に示すように、検査システム1は、検査対象物Gを所定方向に所定速度で搬送する搬送機2と、検査対象物Gが所定の検査位置に到達したときに、その検査対象物Gの良否を判定する検査装置3とを備えている。なお、図示は省略するが、検査装置3によって不良品であると判定された検査対象物Gは、搬送機2から取り除かれたり、不良品専用の格納場所に搬送されたりするようになっている。
【0023】
検査装置3は、主にコンピュータからなる情報処理装置で構成されており、制御部4、画像取得部5、記憶部6、学習部7、入力部8、出力部9及びカメラ10を備えている。
【0024】
制御部4は、CPUを備えており、検査装置3の上記各部5~9及びカメラ10などを制御する。画像取得部5は、カメラ10で撮影された検査対象物Gの外観画像をデジタルデータとして取得するとともに、取得した画像から検査対象物Gの良否の判定に用いる所定の特徴量データを抽出する。記憶部6は、ROM及びRAMを有しており、検査装置3の制御で使用される各種のプログラムが記憶されているとともに、各種データが記憶される。学習部7は、検査対象物Gの良否を判別するための基準が学習された分類モデルを有している。入力部8は、作業者によって操作されるキーボードやマウスを有するとともに、外部からデータや信号が入力可能に構成されている。出力部9は、検査対象物Gの判定結果が表示されるディスプレイなどの表示器を有している。
【0025】
図2は、本発明の一実施形態による教師データ作成装置11を示している。この教師データ作成装置11は、検査対象物Gの検品作業を行う作業者によって操作されることにより、検査装置3の学習部7における分類モデルの学習に用いられる良品の教師データ(良品教師データ)及び不良品の教師データ(不良品教師データ)を作成するためのものである。教師データ作成装置11は、前述した検査装置3と同様に、コンピュータからなる情報処理装置で構成されており、良品教師データ取得部12及び不良品教師データ取得部13を備えている。また、不良品教師データ取得部13は、VAE事前学習部14、正解データ取得部15、特徴量ベクトル取得部16、MLP事前学習部17、不良品特徴量データ生成部18を備えている。教師データ作成装置11は、不図示のネットワークにより検査装置3と接続されている。
【0026】
良品教師データ取得部12は、不図示の外部の記憶装置等から、前述した検査装置3のカメラ10と同様のカメラによって撮影された検査対象物Gの外観画像の中で、作業者によって良品であると判定されたものを、良品画像データとして取得する。
【0027】
良品教師データ取得部12は、取得した多数(M個)の良品画像データの各々に対し、例えばSIFT(Scale-Invariant Feature Transform)やHOG(Histograms of Oriented Gradients)、CNN(Convolutional Neural Network)などの、画像から特徴量を抽出する公知のアルゴリズムを用い、任意のp次元の良品特徴量データを抽出し、良品教師データとして検査装置3に送信する。
【0028】
不良品教師データ取得部13は、不図示の外部の記憶装置等から、前述した検査装置3のカメラ10と同様のカメラによって撮影された検査対象物Gの外観画像の中で、作業者によって不良品であると判定されたものを、不良品画像データとして取得する。なお、取得される不良品画像は、例えば熟練の作業者によって選定されること等により、発生し得る種々の欠陥形状のパターンを網羅的に含んだ画像データであることが望ましい。また、取得される不良品画像は、作業者によって選定された実際の不良品画像のほか、例えばVAE(Variational Auto Encoder:変分オートエンコーダ)やGAN(Generative Adversarial Network:敵対的生成ネットワーク)などの生成モデルを用いて生成された疑似不良品画像データを含んでいてもよい。
【0029】
不良品教師データ取得部13は、後述するように、取得した少数(N個)の不良品画像データに対し、上記各部14~18による処理を実行することにより、上述した良品特徴量データと同じp次元の不良品特徴量データを多数(M個)、生成し、不良品教師データとして検査装置3に送信する。検査装置3は、受け取った良品教師データ及び不良品教師データを教師データとして、分類モデルの学習を行う。
【0030】
なお、良品特徴量データ及び不良品特徴量データの次元数pは、学習を行った分類モデルが高い分類性能を発揮することが可能となる任意の次元数とすることが可能であり、分類モデルの設計等に応じて任意に設定することができる。
【0031】
VAE事前学習部14は、生成モデルとしてのVAEを有し、取得された不良品画像データを訓練データとして用いたVAEの事前学習を行う。本実施形態のVAEとしては、入力された少数の不良品画像データから、欠陥の特徴を捉えた任意のk次元の潜在変数とその確率分布(潜在確率分布)を算出することが可能な畳み込み混合正規分布VAEが用いられる。このVAEにより、入力データxに対し、ニューラルネットワークで圧縮されたk次元の特徴量ベクトルVkを、事後確率分布p(vk|x)を取る確率変数のベクトルとして求めることができる。
【0032】
VAEの事前学習では、取得された不良品画像データを元画像として入力し、VAEのエンコーダにより、元画像から抽出した特徴量の次元を削減してk次元の潜在変数と潜在確率分布を作成した後、VAEのデコーダにより、k次元の潜在変数と潜在確率分布から元画像を再構成した再構成画像を出力する。そして、元画像と再構成画像の間の誤差(再構成誤差)を最小化するように、エンコーダ及びデコーダにおける各パラメータの重み付けを学習する(第1学習工程)。この事前学習が完了すると、VAEは、入力された不良品画像に近似した再構成画像を出力できるようになると同時に、これに最適化された潜在変数及び潜在確率分布が得られる。
【0033】
正解データ取得部15は、取得された不良品画像データの各々に対し、例えばSIFT(Scale-Invariant Feature Transform)やHOG(Histograms of Oriented Gradients)、CNN(Convolutional Neural Network)などの、画像から特徴量を抽出する公知のアルゴリズムを用い、p次元の特徴量を抽出し、後述するMLP事前学習において用いられるp次元の学習用正解データ(第2学習用正解データ)として取得する(正解データ取得工程)。
【0034】
特徴量ベクトル取得部16は、事前学習が完了したVAEにおいて作成されたk次元の潜在変数及び潜在確率分布から、入力された不良品画像のそれぞれに対応するk次元の特徴量ベクトルVk(v0,v1,v2,…vk-1)を取得する(特徴量ベクトル取得工程)。
【0035】
MLP事前学習部17は、多層パーセプトロンデコーダ(以下、MLPデコーダという。)を有し、正解データ取得部15が取得したp次元の学習用正解データを教師データとして用いたMLPデコーダの事前学習を行う。このMLPデコーダは、特徴量ベクトル取得部16により取得されたk次元特徴量ベクトルVkが入力されると、それに対応するp次元の特徴量データ(生成不良品特徴量データ)を出力するように構成される。MLPデコーダの事前学習では、出力されたp次元の生成不良品特徴量データを、あらかじめ取得したp次元の学習用正解データと比較し、両者の間の損失を最小化するようにMLPデコーダの各パラメータの重み付けを学習する(第2学習工程)。この事前学習が完了すると、MLPデコーダは、k次元特徴量ベクトルVkの入力に対し、p次元の学習用正解データに近似したp次元生成不良品特徴量データを出力できるようになる。
【0036】
不良品特徴量データ生成部18は、学習済みのVAEの潜在変数及び潜在確率分布から、ランダムサンプリングによりk次元特徴量ベクトルVkを取得し、それを学習済みのMLPデコーダに入力する。この入力に対し、MLPデコーダは、k次元特徴量ベクトルVkの各々に対応するp次元生成不良品特徴量データを出力する(不良品特徴量データ生成工程)。このようにして得られたp次元生成不良品特徴量データは、不良品教師データとして検査装置3に送信され、分類モデルの学習に用いられる。
【0037】
図3は、上述した教師データ作成装置11による良品教師データ及び不良品教師データの作成処理を示している。本処理では、はじめにステップ301(「S301」と図示。以下同じ)において、教師データ作成装置11とネットワークにより接続された外部の記憶装置等(不図示)から、M個の良品画像データと、N個の良品画像データを取得する。ここで、Mは、上述した検査装置3の学習部7における分類モデルが十分な学習を行うために必要とされる良品教師データ又は不良品教師データの数に対応した数であり、例えば、2000程度とすることができる。一般に、製造ラインにおいて製造される検査対象物Gの大多数が良品であるため、M個の良品画像データは容易に取得可能であると想定される。また、Nは、上記Mよりも大幅に小さな数である。また、Nは、取得した不良品画像データから抽出した特徴量を正規分布に近似させる処理を行うのに十分な数であればよく、例えば200程度とすることができる。
【0038】
次に、ステップ302において、SIFTやHOG、CNNなどの公知の手法により、取得したM個の良品画像データの各々から任意のp次元の特徴量データ(良品特徴量データ)を抽出し、M個の良品教師データとして取得する。なお、上述のとおり、次元数pは、教師データを用いて学習を行う分類モデルの学習に適した任意の次元数とすることが可能である。本実施形態では、次元数pは、例えば1000とすることができるが、これに限定されることはない。
【0039】
続いて、ステップ303において、取得したN個の不良品画像データの各々から抽出したN個のp次元の特徴量データ(不良品特徴量データ)を用いて学習した生成モデルを用い、M個のp次元の生成不良品特徴量データを生成し、これを不良品教師データとして取得する。この不良品教師データ取得処理について、以下に詳述する。
【0040】
図4は、上述の不良品教師データ取得処理の詳細を示す。はじめに、ステップ401において、本実施形態における生成モデルの一部となるVAEの事前学習を行う。
【0041】
図5は、VAE学習処理の詳細を示す。まず、ステップ501において、取得済みのN個の不良品画像データをVAEに入力すると、VAEのエンコーダが、不良品画像から抽出した特徴量を圧縮し、k次元の潜在変数と潜在確率分布を作成する。なお、次元数kは、不良品画像の特徴を適切に捉えるために必要な任意の次元数に設定することが可能である。本実施形態において、次元数kは、例えば500に設定される。
【0042】
次に、ステップ502において、VAEのデコーダが、作成されたk次元の潜在変数及び潜在確率分布から、入力された不良品画像を再構成した再構成画像を出力する。そして、続くステップ503において、入力した不良品画像と、出力された再構成画像の間の再構成誤差を最小化するように、エンコーダ及びデコーダにおける各パラメータの重み付けを学習し、本処理を終了する。
【0043】
図4に戻り、VAEの事前学習を終えた後はステップ402に進む。ステップ402では、本実施形態における生成モデルの一部となるMLPデコーダの事前学習を行う。
【0044】
図6は、MLPデコーダ学習処理の詳細を示す。まず、ステップ601において、取得済みのN個の不良品画像データから、本学習処理において用いられる学習用正解データを取得する。
【0045】
図7は、ステップ601における学習用正解データ取得処理を説明した模式図である。この処理では、N個の不良品画像データの各々(入力画像1~入力画像N)に対し、SIFTやHOG、CNNなどの画像から特徴量を抽出するアルゴリズムを実行し、これにより、学習用正解データとして、N個の不良品画像データの各々に対応するN個のp次元の特徴量正解データ(入力画像特徴量1~入力画像特徴量N)を取得する。
【0046】
続くステップ602では、学習済みのVAEにおいて作成されたk次元の潜在変数及び潜在確率分布から、取得済みのN個の不良品画像データのそれぞれに対応するN個のk次元の特徴量ベクトルVk(v0,v1,v2,…vk-1)を取得する。
【0047】
続いて、以降のステップ603~605において、ステップ601~602で取得したp次元の学習用正解データ及びk次元の特徴量ベクトルVkを用いて、MLPデコーダの学習を行う。
図8は、ステップ603~605におけるMLPデコーダの学習処理を説明した模式図である。
【0048】
まず、ステップ603において、ステップ602で取得されたN個のk次元の特徴量ベクトルVkをMLPデコーダに入力すると、続くステップ604において、MLPデコーダは、N個のk次元の特徴量ベクトルVkの各々から、p次元の特徴量をデコードしてN個のp次元生成不良品特徴量データを出力する。そして次のステップ605において、出力されたN個のp次元生成不良品特徴量データを、ステップ601で取得されたN個のp次元の特徴量正解データ(学習用正解データ)と比較し、両データ間の損失が最小となるようにMLPデコーダの各パラメータの重み付けを学習し、本処理を終了する。
【0049】
再び
図4に戻り、MLPデコーダの事前学習を終えた後は、ステップ403に進む。ステップ403では、学習済みのVAE及びMLPデコーダを生成モデルとして用いることにより、多数の生成不良品特徴量データを生成する。
【0050】
図9は、不良品特徴量データ生成処理の詳細を示す。まず、ステップ901において、学習済みのVAEのk次元の潜在変数及び潜在確率分布から、ランダムサンプリングにより、M個のk次元の特徴量ベクトルVkを生成して取得する。次いで、ステップ902において、取得したM個のk次元の特徴量ベクトルVkを、学習済みのMLPデコーダに入力する。これにより、ステップ903において、MLPデコーダが、M個のk次元の特徴量ベクトルVkの各々に対応するM個のp次元の生成不良品特徴量データを出力し、本処理を終了する。
【0051】
このようにして生成されたM個のp次元の生成不良品特徴量データを、不良品教師データとして取得し、
図4の不良品教師データ取得処理を終了する。また、こうして十分な数の良品教師データと不良品教師データを取得したことにより、
図1の教師データ作成処理を終了する。
【0052】
なお、取得したM個の良品教師データ(p次元の良品特徴量データ)とM個の不良品教師データ(p次元の不良品特徴量データ)は、検査装置3へと送信され、検査装置3における分類モデルの学習用教師データとして用いられる。そして、学習が完了した分類モデルを備えた検査装置3により、検査対象物Gの良否の判定が行われる。
【0053】
以上のように、本実施形態によれば、取得した多数(M個)の良品画像データについては、所定の公知のアルゴリズムによりp次元の良品特徴量データを抽出することにより、多数(M個)の良品教師データを取得する。一方、取得した少数(N個)の不良品画像データについては、所定の公知のアルゴリズムによりp次元の不良品特徴量データを抽出した後、これを用いて生成モデルの学習を行い、学習済みの生成モデルにより多数(M個)のp次元の生成不良品特徴量データを生成することにより、多数(M個)の不良品教師データを取得する。これにより、生成モデルにより疑似不良品画像を生成する場合と比較して、生成モデルが処理すべきパラメータ数を大幅に減少させることができるので、生成モデルの学習に必要な不良品画像の数を減らすことができる。したがって、多数の良品画像と少数の不良品画像に基づき、十分な量と品質の教師データを作成することができる教師データの作成方法を提供することができる。
【0054】
より具体的には、本実施形態の生成モデルにおいて、MLPデコーダは、k次元(例えば500次元)の特徴量ベクトルから、p次元(例えば1000次元)の生成不良品特徴量データをデコードすればよいので、デコーダにおけるパラメータ数は、疑似不良品画像を生成する生成モデルのデコーダと比較して大幅に少なくなる。したがって、少数の不良品画像に基づき十分な品質の生成不良品特徴量データを生成することができる。
【0055】
なお、本発明は、説明した上記実施形態に限定されることなく、種々の態様で実施することができる。例えば、上述の実施形態では、便宜的に良品教師データの数と不良品教師データの数を共にM個としたが、良品教師データと不良品教師データは必ずしも同数である必要はなく、検査装置における分類モデルの学習に支障が生じない範囲で異なる数とすることが可能である。
【0056】
また、実施形態では、VAEの潜在変数をk次元(例えば500次元)、良品特徴量データ及び不良品特徴量データをp次元(例えば1000次元)としたが、必ずしも「k<p」である必要はなく、教師データ作成装置や検査装置の分類モデル等の設計に応じて、「k=p」又は「k>p」となるように設定してもよい。また、実施形態で示した教師データ作成装置11の細部の構成などは、あくまで例示であり、本発明の趣旨の範囲内で適宜、変更することができる。
【符号の説明】
【0057】
1 検査システム
2 搬送機
3 検査装置
4 制御部
5 画像取得部
6 記憶部
7 学習部
8 入力部
9 出力部
10 カメラ
11 教師データ作成装置
12 良品教師データ取得部
13 不良品教師データ取得部
14 VAE事前学習部
15 正解データ取得部
16 特徴量ベクトル取得部
17 MLP事前学習部
18 不良品特徴量データ生成部
G 検査対象物
【手続補正書】
【提出日】2023-09-11
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
欠陥のない製品又は部品の画像である良品画像と、欠陥を有する製品又は部品の画像である不良品画像と、を用いて学習を行う欠陥分類モデルにおいて、良品教師データと不良品教師データとを作成する教師データ作成方法であって、
多数の前記良品画像から、所定の第1の次元数の特徴量を抽出して得られた多数の良品特徴量データを前記良品教師データとして取得する良品教師データ取得工程と、
前記良品画像の数よりも少ない数の前記不良品画像から、前記第1の次元数の特徴量を抽出して得られた不良品特徴量データを用いて学習した生成モデルを用い、前記第1の次元数の特徴量を生成して得られた多数の生成不良品特徴量データを前記不良品教師データとして取得する不良品教師データ取得工程と、
を有することを特徴とする、教師データ作成方法。
【請求項2】
前記不良品教師データ取得工程は、
前記不良品画像が元画像として入力されると、前記元画像から抽出した特徴量の次元を削減して所定の第2の次元数の潜在変数とその確率分布を算出するエンコーダと、前記潜在変数と前記確率分布から前記元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、前記元画像と前記再構成画像の間の再構成誤差を最小化するように前記エンコーダ及び前記デコーダの重み付けを学習する第1学習工程と、
前記不良品画像から前記第1の次元数の特徴量を抽出し、学習用正解データとして取得する正解データ取得工程と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布から、前記不良品画像に対応する前記第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得工程と、
前記取得した前記第2の次元数の前記特徴量ベクトルが入力されると、前記第1の次元数の前記生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、前記生成不良品特徴量データと前記学習用正解データの間の損失を最小化するように前記多層パーセプトロンデコーダの重み付けを学習する第2学習工程と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布からランダムサンプリングにより取得した多数の前記第2の次元数の特徴量ベクトルを学習済みの前記多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成工程と、
を含むことを特徴とする、請求項1に記載の教師データ作成方法。
【請求項3】
欠陥のない製品又は部品の画像である良品画像と、欠陥を有する製品又は部品の画像である不良品画像と、を用いて学習を行う欠陥分類モデルにおいて、良品教師データと不良品教師データとを作成する教師データ作成装置であって、
多数の前記良品画像から、所定の第1の次元数の特徴量を抽出して得られた多数の良品特徴量データを前記良品教師データとして取得する良品教師データ取得部と、
前記良品画像の数よりも少ない数の前記不良品画像から、前記第1の次元数の特徴量を抽出して得られた不良品特徴量データを用いて学習した生成モデルを用い、前記第1の次元数の特徴量を生成して得られた多数の生成不良品特徴量データを前記不良品教師データとして取得する不良品教師データ取得部と、
を備えることを特徴とする、教師データ作成装置。
【請求項4】
前記不良品教師データ取得部は、
前記不良品画像が元画像として入力されると、前記元画像から抽出した特徴量の次元を削減して所定の第2の次元数の潜在変数とその確率分布を算出するエンコーダと、前記潜在変数と前記確率分布から前記元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、前記元画像と前記再構成画像の間の再構成誤差を最小化するように前記エンコーダ及び前記デコーダの重み付けを学習する第1学習部と、
前記不良品画像から前記第1の次元数の特徴量を抽出し、学習用正解データとして取得する正解データ取得部と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布から、前記不良品画像に対応する前記第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得部と、
前記取得した前記第2の次元数の前記特徴量ベクトルが入力されると、前記第1の次元数の前記生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、前記生成不良品特徴量データと前記学習用正解データの間の損失を最小化するように前記多層パーセプトロンデコーダの重み付けを学習する第2学習部と、
学習済みの前記変分オートエンコーダの前記潜在変数の前記確率分布からランダムサンプリングにより取得した多数の前記第2の次元数の特徴量ベクトルを学習済みの前記多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成部と、
を備えることを特徴とする、請求項3に記載の教師データ作成装置。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0012
【補正方法】変更
【補正の内容】
【0012】
本発明の請求項2に係る発明は、請求項1に記載の教師データ作成方法において、不良品教師データ取得工程は、不良品画像が元画像として入力されると、元画像から抽出した特徴量の次元を削減して所定の第2の次元数(k次元)の潜在変数とその確率分布を算出するエンコーダと、潜在変数と確率分布から元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、元画像と再構成画像の間の再構成誤差を最小化するようにエンコーダ及びデコーダの重み付けを学習する第1学習工程(
図4のステップ401、
図5のステップ501~503)と、不良品画像から第1の次元数の特徴量を抽出し、
学習用正解データとして取得する正解データ取得工程(
図6のステップ601、
図7)と、学習済みの変分オートエンコーダの潜在変数の確率分布から第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得工程(
図6のステップ602)と、取得した第2の次元数の特徴量ベクトルが入力されると、第1の次元数の生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、生成不良品特徴量データと
学習用正解データの間の損失を最小化するように多層パーセプトロンデコーダの重み付けを学習する第2学習工程(
図4のステップ402、
図6のステップ603~605、
図8)と、学習済みの変分オートエンコーダの潜在変数の確率分布からランダムサンプリングにより取得した多数の第2の次元数の特徴量ベクトルを学習済みの多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成工程(
図4のステップ403、
図9のステップ901~903)と、を含むことを特徴とする。
【手続補正3】
【補正対象書類名】明細書
【補正対象項目名】0013
【補正方法】変更
【補正の内容】
【0013】
この構成によれば、第1学習工程において、元の不良品画像から再構成画像を精度よく出力できるように変分オートエンコーダ(以下、VAEという。)を学習させる。また、正解データ取得工程において、不良品画像から所定次元数の特徴量を抽出し学習用正解データとして取得し、特徴量ベクトル取得工程において、学習済みVAEの潜在変数の確率分布から、不良品画像に対応する特徴量ベクトルを取得する。その後、第2学習工程において、取得した特徴量ベクトルから生成した生成不良品特徴量データが、学習用正解データに近いものとなるように多層パーセプトロンデコーダ(以下、MLPデコーダという。)を学習させる。このようにして事前学習を終了させたVAEとMLPデコーダからなる生成モデルを用い、不良品特徴量データ生成工程において、学習済みのVAEの潜在変数の確率分布から、ランダムサンプリングにより多数の特徴量ベクトルを取得し、それを学習済みのMLPデコーダに入力することで、多数の生成不良品特徴量データを生成する。
【手続補正4】
【補正対象書類名】明細書
【補正対象項目名】0018
【補正方法】変更
【補正の内容】
【0018】
本発明の請求項4に係る発明は、請求項3に記載の教師データ作成装置において、不良品教師データ取得部13は、不良品画像が元画像として入力されると、元画像から抽出した特徴量の次元を削減して所定の第2の次元数の潜在変数とその確率分布を算出するエンコーダと、潜在変数と確率分布から元画像を再構成して再構成画像を出力するデコーダと、を備える変分オートエンコーダ(VAE)において、元画像と再構成画像の間の再構成誤差を最小化するようにエンコーダ及びデコーダの重み付けを学習する第1学習部(VAE事前学習部14)と、不良品画像から第1の次元数の特徴量を抽出し、学習用正解データとして取得する正解データ取得部15と、学習済みの変分オートエンコーダの潜在変数の確率分布から、不良品画像に対応する第2の次元数の特徴量ベクトルを取得する特徴量ベクトル取得部16と、取得した第2の次元数の特徴量ベクトルが入力されると、第1の次元数の生成不良品特徴量データを生成して出力するように構成された多層パーセプトロン(MLP)デコーダにおいて、生成不良品特徴量データと学習用正解データの間の損失を最小化するように前記多層パーセプトロンデコーダの重み付けを学習する第2学習部(MLP事前学習部17)と、学習済みの変分オートエンコーダの潜在変数の確率分布からランダムサンプリングにより取得した多数の第2の次元数の特徴量ベクトルを学習済みの多層パーセプトロンデコーダに入力し、多数の生成不良品特徴量データを生成する不良品特徴量データ生成部18と、を備えることを特徴とする。
【手続補正5】
【補正対象書類名】明細書
【補正対象項目名】0033
【補正方法】変更
【補正の内容】
【0033】
正解データ取得部15は、取得された不良品画像データの各々に対し、例えばSIFT(Scale-Invariant Feature Transform)やHOG(Histograms of Oriented Gradients)、CNN(Convolutional Neural Network)などの、画像から特徴量を抽出する公知のアルゴリズムを用い、p次元の特徴量を抽出し、後述するMLP事前学習において用いられるp次元の学習用正解データ(学習用正解データ)として取得する(正解データ取得工程)。