【新規性喪失の例外の表示】特許法第30条第2項適用申請有り (1)刊行物名:令和元年度卒業研究発表会概要集、発行者名:国立大学法人豊橋技術科学大学、発行年月日:令和1年12月19日
【解決手段】不良品画像生成プログラムは、コンピュータに、工業製品の良品画像と、不良箇所を含む部分画像を良品画像に合成した合成画像と、を取得する第1の取得処理と、入力画像と良品画像と合成画像とに基づき、画像更新モデルを繰り返し実行して不良品画像を生成する第1の画像生成処理と、を実行させる。画像更新モデルは、入力画像(ただし、初回は合成画像、2回目以降は画像更新モデルから前回出力された出力画像)と、良品画像と、を事前学習済みの畳み込みニューラルネットワークに入力し、入力画像と、合成画像と、をエッジ抽出用フィルタに入力し、畳み込みニューラルネットワークにより得られる第1の損失関数と、エッジ抽出用フィルタにより得られる第2の損失関数と、を合算した合算損失が最小になるように入力画像を更新して出力するモデルである。
【発明を実施するための形態】
【0018】
A.実施形態:
A−1.良品検査システム10の構成:
図1は、本実施形態における良品検査システム10の概略構成を示す説明図である。良品検査システム10は、例えば製造ラインにおける品質検査工程において、順次作製される工業製品(工業部品でもよい)について外観検査を行うことにより、工業製品が良品であるか不良品であるかを判定するためのシステムである。以下の説明では、工業製品は、例えば差動歯車装置に用いられるベベルギヤWであるとする。また、ベベルギヤWの良品とは、ベベルギヤWのうち、ベベルギヤWの機能に影響する特定領域に不良箇所が存在しないものをいい、ベベルギヤWの不良品とは、ベベルギヤWのうち、該特定領域に不良箇所が存在するものをいう。特定領域は、例えば、歯のエッジ部(特に歯先稜線および歯形稜線)やその周辺部(歯先面および歯面))である。不良箇所とは、工業製品における損傷や打痕である。以下、「打痕」を例に挙げて説明する。
【0019】
図1に示すように、良品検査システム10は、撮像部12(例えばデジタルカメラ)と、回転ステージ14と、搬送ロボット16と、画像処理装置100と、良否判定装置200と、を備える。
【0020】
回転ステージ14は、ベベルギヤWが載置されるテーブルが回転可能に支持された構成を備える。撮像部12は、回転ステージ14のテーブル上に載置されたベベルギヤWを例えば側方から撮像可能な位置に配置されている。搬送ロボット16は、製造ラインで順次製造されるベベルギヤWを1つずつ把持して回転ステージ14のテーブル上に載置し、例えば良品と判定されたベベルギヤWと、不良品と判定されたベベルギヤWとを別々の場所に搬送する。なお、撮像部12と回転ステージ14と搬送ロボット16とは、次述する良否判定装置200の制御部210にインターフェース部250を介して通信可能に接続されており、撮像部12と回転ステージ14と搬送ロボット16とのそれぞれの動作は制御部210により制御される。また、画像処理装置100と良否判定装置200とは、互いに通信可能に接続されている。なお、画像処理装置100と良否判定装置200とは、撮像部12と回転ステージ14と搬送ロボット16と同一の製造ラインに設けられる必要はなく、所定のネットワーク(例えばインターネット等の公衆回線や専用回線等)を介して通信可能なクラウド環境下に設けられていてもよい。
【0021】
A−1−1.画像処理装置100の構成
画像処理装置100は、制御部110と、記憶部120と、表示部130と、操作入力部140と、インターフェース部150と、を備える。これらの各部は、バス190を介して互いに通信可能に接続されている。
【0022】
表示部130は、例えば液晶ディスプレイ等により構成され、各種の画像や情報を表示する。操作入力部140は、例えばキーボードやマウス、ボタン、マイク等により構成され、人の操作や指示を受け付ける。なお、本実施形態では、表示部130がタッチパネルを備えることにより、操作入力部140として機能する。また、インターフェース部150は、例えばLANインターフェースやUSBインターフェース等により構成され、有線または無線により他の装置との通信を行う。
【0023】
記憶部120は、例えばROMやRAM、ハードディスクドライブ(HDD)等により構成され、各種のデータ、プログラムやモデルを記憶したり、各種のプログラムやモデルを実行する際の作業領域やデータの一時的な記憶領域として利用されたりする。
【0024】
具体的には、記憶部120には、打痕画像DB121と、良品画像DB122と、不良品画像DB123と、ベースライン画像DB124と、が格納されている。打痕画像DB121には、複数パターンの打痕画像K(
図4参照)が記憶されている。打痕画像Kは、実際のベベルギヤWの不良品の撮像画像のうち、打痕を含む部分画像である。本実施形態では、不良品の撮像画像のうち、ベベルギヤWの特定領域を抽出した分割画像である。本実施形態では、複数のベベルギヤWの不良品の撮像画像に基づき、複数パターン(例えば約30個)の打痕画像Kが取得されている。なお、本実施形態では、打痕画像Kは、グレイスケール画像であるものとする。良品画像DB122には、予め撮像されたベベルギヤWの複数パターンの良品の撮像画像(以下、「良品画像GY」という)が記憶されている。不良品画像DB123には、予め撮像されたベベルギヤWの複数パターンの不良品の撮像画像や次述する不良品画像生成PGM131の実行により生成されるベベルギヤWの不良品の画像(以下、「不良品画像GX」という)が順次記憶される。打痕画像Kは、特許請求の範囲における部分画像の一例である。ベースライン画像DB124には、不良品画像生成PGM131の実行過程で生成されるベースライン画像GBが順次記憶される。
【0025】
また、記憶部120には、不良品画像生成PGM131が格納されている。不良品画像生成PGM131は、不良品画像GXを生成するための処理を実行するためのコンピュータプログラムである。不良品画像生成PGM131は、ベースライン画像生成PGM133と、画像最適化PGM134とを含む。ベースライン画像生成PGM133は、後述のベースライン画像生成処理(
図2参照)を実行するためのコンピュータプログラムであり、画像最適化PGM134は、後述の画像最適化処理(
図6参照)を実行するためのコンピュータプログラムである。これらのプログラムは、例えば、CD−ROMやDVD−ROM、USBメモリ等のコンピュータによって読み取り可能な記録媒体(不図示)に格納された状態で提供され、画像処理装置100にインストールすることにより記憶部120に格納される。また、記憶部120には、後述の画像更新モデル141も格納されている。
【0026】
制御部110は、例えばCPU等により構成され、記憶部120から読み出したコンピュータプログラムを実行することにより、画像処理装置100の動作を制御する。例えば、制御部110は、記憶部120から不良品画像生成PGM131を読み出して実行することにより、後述の不良品画像GXを生成するための処理(ベースライン画像生成処理、画像最適化処理)を実行する。制御部110は、ベースライン画像生成処理を実行する際、第2の取得部113と指定部114と第2の画像生成部115として機能し、画像最適化処理を実行する際、第1の取得部111と第1の画像生成部112として機能する。これら各部の機能については、後述の各種の処理の説明に合わせて説明する。
【0027】
A−1−2.良否判定装置200の構成
良否判定装置200は、制御部210と、記憶部220と、表示部230と、操作入力部240と、インターフェース部250と、を備える。これらの各部は、バス290を介して互いに通信可能に接続されている。
【0028】
表示部230は、例えば液晶ディスプレイ等により構成され、各種の画像や情報を表示する。操作入力部240は、例えばキーボードやマウス、ボタン、マイク等により構成され、人の操作や指示を受け付ける。なお、本実施形態では、表示部230がタッチパネルを備えることにより、操作入力部240として機能する。また、インターフェース部250は、例えばLANインターフェースやUSBインターフェース等により構成され、有線または無線により他の装置との通信を行う。
【0029】
記憶部220は、例えばROMやRAM、ハードディスクドライブ(HDD)等により構成され、各種のデータ、プログラムやモデルを記憶したり、各種のプログラムやモデルを実行する際の作業領域やデータの一時的な記憶領域として利用されたりする。
【0030】
具体的には、記憶部220には、良否判定PGM232が格納されている。良否判定PGM232は、ベベルギヤWの撮像画像における不良箇所の有無に基づきベベルギヤWの良否を判定するためのプログラムである。このプログラムは、例えば、CD−ROMやDVD−ROM、USBメモリ等のコンピュータによって読み取り可能な記録媒体(不図示)に格納された状態で提供され、良否判定装置200にインストールすることにより記憶部220に格納される。また、記憶部220には、後述の画像認識モデル242も格納されている。
【0031】
制御部210は、例えばCPU等により構成され、記憶部220から読み出したコンピュータプログラムを実行することにより、良否判定装置200の動作を制御する。例えば、制御部210は、記憶部220から良否判定PGM232を読み出して実行することにより、後述の良否判定処理を実行する。このとき、制御部210は、学習部226と判定部227として機能する。これら各部の機能については、後述の処理の説明に合わせて説明する。
【0032】
A−2.不良品画像GXを生成するための処理:
次に、本実施形態の画像処理装置100により実行される不良品画像GXを生成するための各種の処理について説明する。
【0033】
A−2−1.ベースライン画像生成処理
図2は、ベースライン画像生成処理の内容を示すフローチャートであり、
図3は、マスク画像生成処理の内容を示すフローチャートであり、
図4は、ベースライン画像生成処理におけるベベルギヤWの画像の変化を示す説明図である。
図5は、彩度調整処理の内容を示すフローチャートである。ベースライン画像生成処理は、良品画像DB122に記憶された良品画像GYに、打痕画像DB121に記憶された打痕画像Kを合成してベースライン画像GBを生成する処理である。
【0034】
ベースライン画像生成処理が開始されると、
図2に示すように、第2の取得部113は、良品画像DB122に記憶された複数の良品画像GYの中から、一様乱数によりランダムに1枚の良品画像GY(
図4(a)参照)を選択して取得する(S110)。S110の処理は、特許請求の範囲における第2の取得処理の一例である。なお、次のS112以降の処理を、良品画像GYに対して行ってもよいし、良品画像GYのうち、一部をトリミングした加工後の良品画像GYに対して行ってもよい。本実施形態では、
図4(a)に示すように、良品画像GYのうち、打痕が存在し得ない周縁部分をトリミングした画像に対してS112以降の処理が行われる。以下、説明の簡略のため、トリミング後の良品画像GYも、単に良品画像GYと呼ぶ。また、良品画像GYは、RGB空間の画像データであるものとする。
【0035】
次に、指定部114は、取得された良品画像GYに対してマスク画像生成処理を行う(S112)。マスク画像生成処理は、ベースライン画像GBを生成する際、良品画像GYのうち、実際に打痕が生じ得ない画像領域(以下、「マスク画像領域」という)への打痕画像Kの配置を回避し、実際に打痕が生じ得る特定画像領域R1に打痕が配置されるようにするための処理である。具体的には、マスク画像生成処理は、良品画像GYのうち、特定画像領域R1を指定するための処理である。S112の処理は、特許請求の範囲における指定処理の一例であり、特定画像領域R1は、上述の特定領域に対応する領域であり、特許請求の範囲における第1の画像領域の一例である。
【0036】
マスク画像生成処理が開始されると、
図3に示すように、指定部114は、良品画像GYに対してグレイスケール変換を適用して、グレイスケール画像GY1(
図4(b)参照)を生成する(S210)。次に、指定部114は、グレイスケール画像GY1に対して微分フィルタ(例えば一次微分フィルタ)を適用して、ベベルギヤWのエッジ部分(輪郭)が抽出されたエッジ画像GY2(
図4(c)参照)を生成する(S212)。次に、指定部114は、エッジ画像GY2に対してメディアンフィルタ(例えばウインドウ5×5)を適用して、ノイズを低減したエッジ画像GY3(
図4(d)参照)を生成し(S214)、そのエッジ画像GY3に対して二値化処理(例えば大津の二値化処理)を適用して、二値化画像GY4(
図4(e)参照)を生成する(S216)。二値化画像GY4では、主として、ベベルギヤWにおけるエッジ部とその周辺部が白色領域となっており、また、歯底の一部も白色領域になっている。
【0037】
本実施形態では、さらに、指定部114は、二値化画像GY4に対して、S214の処理時よりも小さいウインドウ(例えば3×3)の収縮処理および平滑化フィルタ(例えばメディアンフィルタ)を、1または複数回適用して、マスク画像GM(
図4(g)参照)を生成する(S218)。メディアンフィルタの適用により、二値化画像GY4が平滑化されノイズが除去される。収縮処理の適用により、二値化画像GY4において、エッジ部から離れた孤立領域(例えばベベルギヤWの歯底)におけるノイズが除去される。なお、
図4では、二値化画像GY4に対して収縮処理およびメディアンフィルタを1回適用して二値化画像GY5(
図4(f)参照)を生成し、さらに、その二値化画像GY5に対して収縮処理およびメディアンフィルタを1回適用してマスク画像GM(
図4(g)参照)を得る例が示されている。このように、二値化画像GY4に対して収縮処理およびメディアンフィルタを複数回適用することにより、ノイズをより効果的に除去することができる。ここでいう「ノイズ」とは、特に、ベベルギヤWの歯底に残存する白色領域である。
図4(e)〜(g)に示すように、収縮処理およびメディアンフィルタの適用回数に応じて、ベベルギヤWの歯底に残存する白色領域が低減していることが分かる。なお、後述するように、白色領域は、良品画像GYにおける上記特定画像領域R1を指定するための領域である。
【0038】
マスク画像生成処理を終了すると、第2の画像生成部115は、良品画像GYのうち、特定画像領域R1を対象とし、特定画像領域R1中の任意の位置に、打痕画像Kを合成してベースライン画像GBを生成する。この処理は、特許請求の範囲における第2の画像生成処理の一例であり、ベースライン画像GBは、特許請求の範囲における合成画像の一例である。
【0039】
具体的には、
図2に示すように、第2の取得部113は、打痕画像DB121に記憶された複数パターンの打痕画像K(
図4(l)参照)の中から、一様乱数によりランダムに1または複数のパターンの打痕画像Kを選択して取得する(S114)。次に、第2の画像生成部115は、良品画像GYの特定画像領域R1(マスク画像GMの白色領域に対応する領域)に、一様乱数によりランダムに選択した位置に打痕画像Kを上書きして打痕付画像GD(
図4(h)参照)を生成する(S116)。
【0040】
次に、第2の画像生成部115は、打痕付画像GDに対して彩度調整処理を実行する(S118)。彩度調整処理は、打痕付画像GDにおける打痕画像Kに対して、良品画像GYの彩度を反映させるための処理である。彩度調整処理が開始されると、
図5に示すように、第2の画像生成部115は、打痕付画像GDと、打痕画像Kが合成される前の良品画像GYとのそれぞれを、RGB空間の画像から、彩度を調整可能な色空間(例えばHSV空間、HLS空間、L*a*b空間、YCbCr空間、YUV空間など)の画像に変換する(S310)。次に、第2の画像生成部115は、色変換後の打痕付画像GDの彩度を、色変換後の良品画像GYの彩度に基づき補正し(S320)、彩度補正後の打痕付画像GDを、RGB空間の画像に変換し、ベースライン画像GBを生成し(S330)、記憶部120のベースライン画像DB124に記憶し、本ベースライン画像生成処理を終了する。これにより、打痕付画像GDのうち、打痕画像Kの合成部分に対しても、良品画像GYの彩度が反映されたベースライン画像GB(
図4(i)参照)が生成される。
【0041】
A−2−2.画像最適化処理
図6は、画像最適化処理の内容を示すフローチャートであり、
図7は、画像更新モデル141の概要を示す説明図である。画像最適化処理は、ベースライン画像生成処理で生成されたベースライン画像GBを、より本物に近い(より自然な)不良品画像に近づけるための処理である。
【0042】
画像最適化処理が開始されると、
図6に示すように、第1の取得部111は、ベースライン画像GBとそのベースライン画像GBの元になった良品画像GYとを記憶部120から取得する(S410)。S410の処理は、特許請求の範囲における第1の取得処理の一例である。次に、第1の画像生成部112は、入力画像GSとベースライン画像GBと良品画像GYとに基づき、画像更新モデル141を繰り返し実行して不良品画像GXを生成する(S420)。S420の処理は、特許請求の範囲における第1の画像生成処理の一例である。
【0043】
具体的には、
図7に示すように、画像更新モデル141では、入力画像GS(ただし、初回はベースライン画像GB、2回目以降は画像更新モデル141から前回出力された出力画像)と、良品画像GYと、を事前学習済みの畳み込みニューラルネットワークM11に入力し、コンテンツ損失L1を得る(S510)。畳み込みニューラルネットワークM11は、画像の特徴量に基づき画像を分類する学習モデルであり、例えばVGG19モデルである。なお、畳み込みニューラルネットワークM11は、これに限らず、ImageNetで訓練された学習モデルであればよく、例えば、VGG16モデル、AlexNet、ResNet34、ResNet50、InceptionV3等であってもよい。
コンテンツ損失L1は、画像更新モデル141から出力される入力画像GSと良品画像GYとの特徴量の二乗誤差を損失関数としたものであり、例えば、次の式1で示される。
<式1>
コンテンツ損失L1=(1/2)(F
i(GY)−F
i(GS))
2
F
i:ImageNetであり、VGG19モデルのi番目のConvLayerの出力である。
コンテンツ損失L1では、良品画像GYを真値としている。このため、コンテンツ損失L1を最小化することは、良品画像GYの特徴に近づくように入力画像GSが更新されることを意味する。なお、「入力画像GSが更新される」とは、入力画像GSの画素値が更新されることを意味する(以下、同じ)。コンテンツ損失L1は、特許請求の範囲における第1の損失関数の一例である。
【0044】
また、画像更新モデルでは、入力画像GSとベースライン画像GBとをラプラシアンフィルタM12に入力し、ラプラシアン損失L2を得る(S520)。ラプラシアン損失L2は、ラプラシアンフィルタM12から出力される入力画像GSとベースライン画像GBとの二乗誤差を損失関数としたものであり、例えば、次の式2で示される。
<式2>
ラプラシアン損失L2=(1/2)(L(GB)−L(GS))
2
L:ラプラシアンフィルタM12の出力である。
ラプラシアンフィルタM12は、画像のエッジを抽出するフィルタであり、ラプラシアン損失L2では、ベースライン画像GBを真値としている。このため、ラプラシアン損失L2を最小化することは、ベースライン画像GBの特徴(特に打痕画像Kの輪郭)に近づくように入力画像GSが更新されることを意味する。ラプラシアン損失L2は、特許請求の範囲における第2の損失関数の一例である。
【0045】
さらに、画像更新モデル141では、入力画像GSを、打痕分類モデルM13に入力し、打痕判定損失L3を得る(S530)。打痕分類モデルM13は、事前学習済みの畳み込みニューラルネットワークを分類器として利用するものであり、上述したベベルギヤWの複数の分割画像に対して転移学習を行うことより、画像中の打痕の有無を判別するモデルであり、例えばResNet50である。なお、打痕分類モデルM13は、これに限らず、ImageNetで訓練された学習モデルであればよく、例えば、VGG16モデル、VGG19モデル、AlexNet、ResNet34、InceptionV3等であってもよい。打痕判定損失L3は、次の式3で示される。
<式3>
打痕判定損失L3=(1/2)(1−cnn(GS))
2
cnn:打痕の有無を判定する打痕分類モデルであり、打痕無しの画像に対して「0」を出力し、打痕有りの画像に対して「1」を出力する。
打痕判定損失L3では、「1」を真値としている。このため、打痕判定損失L3を最小化することは、打痕分類モデルが打痕有りと判定する方向に入力画像GSが更新されることを意味する。打痕分類モデルM13は、特許請求の範囲における不良判定モデルの一例であり、打痕判定損失L3は、特許請求の範囲における第3の損失関数の一例である。
【0046】
次に、画像更新モデル141では、得られたコンテンツ損失L1とラプラシアン損失L2と打痕判定損失L3とを合算した合算損失(=α・L1+β・L2+γ・L3)を算出し(S540)、合算損失が最小になるように入力画像GSを更新して出力画像を出力する(S550)。なお、合算損失の定数項(α,β,γ)は、適宜変更可能である。
【0047】
次に、第1の画像生成部112は、出力画像が所定の最適条件を満たすか否かを判断する(S430)。最適条件は、例えば、エポック数が所定値(例えば20)に達したことである。なお、最適条件は、これに限らず、例えば、上記合算損失が所定値以下になったことであってもよい。第1の画像生成部112は、出力画像が最適条件を満たさないと判断した場合(S430:NO)、その出力画像を入力画像GSとして設定し(S440)、S420に戻って再び画像更新モデル141の実行を繰り返す。一方、第1の画像生成部112は、出力画像が最適条件を満たすと判断した場合(S430:YES)、精度の高い不良品画像GXが生成されたとして、直近の出力画像を不良品画像GXとして記憶部120の不良品画像DB123に記憶し(S450)、本画像最適化処理を終了する。
【0048】
A−2−3.評価結果
本実施形態では、ベースライン画像GBと不良品画像GXとのそれぞれについて、FID(Frechet Inception Distance)スコアを用いて、本物の打痕画像(例えば1000枚)との比較による評価を行った。FIDスコアは、2つの画像データセットに対して、ImageNet学習済みのInceptionV3モデルに画像を入力して得られる特徴表現の平均と分散の距離を評価する尺度である。FIDスコアは、以下に式4により定義される。
<式4>
d
2=|m
1−m
2|
2+Tr(C
1+C
2−2(C
1C
2)
1/2)
m
1:画像データセット1をInceptionV3モデルに入力したときのモデルの最後の平均プーリング層の出力である。
m
2:画像データセット2をInceptionV3モデルに入力したときのモデルの最後の平均プーリング層の出力である。
Tr:行列のトレースである。
C
1:画像データセット1を入力としたInceptionV3モデルの出力2048次元ベクトルに対する共分散行列である。
C
2:画像データセット2を入力としたInceptionV3モデルの出力2048次元ベクトルに対する共分散行列である。
【0049】
図8は、FIDスコアによる各画像の評価結果を示す説明図である。
図8中の不良品画像GX(打痕判定モデル無し)は、上記画像最適化処理(
図6)のS420において、合算損失に打痕判定損失L3を合算せず、コンテンツ損失L1とラプラシアン損失L2とのみを合算して生成された不良品画像GXを意味し、不良品画像GX(打痕判定モデル有り)は、合算損失にコンテンツ損失L1とラプラシアン損失L2と打痕判定損失L3とを合算して生成された不良品画像GXを意味する。
図8に示すように、不良品画像GX(打痕判定モデル無し)では、ベースライン画像GBに比べて、本物の打痕画像に近い評価結果となっており、不良品画像GX(打痕判定モデル有り)では、不良品画像GX(打痕判定モデル無し)に比べて、本物の打痕画像にさらに近い評価結果となった。
【0050】
A−3.ベベルギヤWの良否を判定するための処理:
次に、本実施形態の良否判定装置200により実行されるベベルギヤWの良否を判定するための処理について説明する。この処理は、機械学習により画像を認識する画像認識モデル242を用いて、ベベルギヤWの撮像画像における不良箇所の有無に基づきベベルギヤWの良否を判定するための処理である。
【0051】
上述した不良品画像GXを生成するための処理により、機械学習に十分な量の不良品画像GXが記憶部120の不良品画像DB123に記憶されると、良否判定装置200の学習部226は、画像処理装置100の良品画像DB122に記憶された複数パターンの良品画像GYと、不良品画像DB123に記憶された複数パターンの不良品画像GXとを、教師データとして用いて、ベベルギヤWの良否を判定するための機械学習を行って画像認識モデル242を生成または更新する。画像認識モデル242は、予め用意したモデル式の重み係数等を制御することにより生成できるが、画像認識モデル242を生成するのに用いる具体的なモデル式については限定されず、任意のモデル式を適用可能である。
【0052】
良否判定処理が開始されると、判定部227は、回転ステージ14のテーブルを回転させつつ、撮像部12にテーブル上に載置されたベベルギヤWの全周を撮像させる。これにより、1つのベベルギヤWの互いに異なる角度が撮像された複数の撮像画像が生成される。具体的には、1つのベベルギヤWについて例えば36枚の撮像画像を生成し、各撮像画像を例えば8分割して、計36×8=288個の判定対象データを生成する。次に、判定部227は、判定対象データごとに、画像認識モデル242を用いて良否(不良箇所の有無)を判定する。すなわち、1つのベベルギヤWについて、288種類の判定対象データに対する良否判定を行うことになる。なお、1つのベベルギヤW当たりの判定対象データの数は任意である。
【0053】
A−4.本実施形態の効果:
以上説明したように、本実施形態の不良品画像生成PGM131では、画像最適化処理において、画像更新モデル141が用いられる(
図6のS420)。画像更新モデル141は、コンテンツ損失L1とラプラシアン損失L2とを合算した合算損失が最小になるように入力画像GSを更新して出力するモデルである(
図7参照)。ここで、コンテンツ損失L1は、畳み込みニューラルネットワークM11により得られる入力画像GSと良品画像GYとの誤差であり、コンテンツ損失L1が最小になるように入力画像GSを更新することは、良品画像GYの特徴に近づくように入力画像GSが更新されることを意味する。ラプラシアン損失L2は、エッジ抽出用フィルタ(ラプラシアンフィルタM12)により得られる入力画像GSとベースライン画像GBとの誤差であり、ラプラシアン損失L2が最小になるように入力画像GSを更新することは、ベースライン画像GBの特徴(不良箇所)に近づくように入力画像GSが更新されることを意味する。したがって、合算損失が最小になるように入力画像GSを更新することは、ベースライン画像GBの不良箇所の特徴を保ちつつ、良品画像GYの特徴に近づくように入力画像GSが更新されることを意味する。これにより、本実施形態によれば、良品画像GYと打痕画像Kとから、より本物に近い不良品画像GXを生成することができる。
【0054】
本実施形態では、画像最適化処理において、入力画像GSが打痕分類モデルM13に入力され、合算損失が最小になり、かつ、打痕分類モデルM13にて不良箇所有りと判定されるように入力画像GSが更新される(
図7参照)。これにより、本実施形態によれば、打痕分類モデルM13を用いない場合に比べて、より本物に近い不良品画像GXを生成することができる。
【0055】
本実施形態では、ベースライン画像生成処理において、良品画像GYのうち、予め指定された特定画像領域R1を対象に打痕画像Kが合成される(
図2のS116)。これにより、不良箇所が不自然な位置に配置されたベースライン画像GBの生成が抑制され、より本物に近い不良品画像GXを生成することができる。ここで、NST(Neural Style Transfer)技術を用いて、良品画像をコンテンツ画像とし、不良箇所を含む画像をスタイル画像として画風変換を行って不良品画像を生成する方法が考えられる。しかし、このNST技術を用いる方法では、不良箇所の位置が全体としての画風に応じて変換されるため、不良品画像における不良箇所の位置を制御することができない。その結果、例えば不良箇所が存在し得ない位置に配置されるなど、不自然な不良品画像が生成される可能性が高い。これに対して、本実施形態では、予め特定画像領域R1を指定することにより、不良品画像GXにおける不良箇所の位置を制御することができる。このため、より本物に近い不良品画像GXを生成することができる。
【0056】
また、本実施形態では、特にエッジ部とその周辺部(以下、「エッジ部等」という)に不良箇所が存在するベースライン画像GBが生成される。エッジ部等に存在する不良箇所は、特に、互いに噛み合う他の歯車との接触により異音を発する等、歯車の機能に影響しやすい。そこで、本実施形態では、特定画像領域R1を歯のエッジ部等とすることにより、より有用な不良品画像GXを精度良く生成することができる。
【0057】
また、本実施形態では、不良箇所が歯底だけに存在するベースライン画像GBが生成されにくい。歯車における歯底は、互いに噛み合う他の歯車と接触せず、仮に歯底に不良箇所が存在しても歯車の機能に影響しない可能性が高い。そこで、本実施形態では、特定画像領域R1を歯車の歯底とは異なる領域とすることにより、より有用な不良品画像GXを精度良く生成することができる。
【0058】
本実施形態では、マスク画像生成処理(
図2および
図3参照)において、良品画像GYに対するエッジ抽出処理(
図3のS212)により抽出されたエッジ部の位置に基づき特定画像領域R1が指定される。これにより、良品画像GYから抽出されるエッジ部の位置に基づき特定画像領域R1を自動で指定することができる。
【0059】
本実施形態では、彩度調整処理(
図5参照)において、良品画像GYに打痕画像Kを合成した画像の彩度を、打痕画像Kを合成する前の良品画像GYの彩度に基づき補正してベースライン画像GBが生成される。これにより、打痕画像Kに対しても、良品画像GYの彩度が反映されたベースライン画像GBが生成されるため、より本物に近い不良品画像GXを生成することができる。
【0060】
本実施形態の良否判定装置200では、上述した不良品画像GXを教師データとして用いて学習させた画像認識モデル242に、判定対象製品(ベベルギヤW)の撮像画像を入力して良否が判定される。これにより、より本物に近い不良品画像GXに基づき学習した画像認識モデル242を用いることにより、判定対象製品が不良品であるか否かを精度よく判定することができる。
【0061】
B.変形例:
本発明は、上述の実施形態に限られるものではなく、その要旨を逸脱しない範囲において種々の形態に変形することができ、例えば次のような変形も可能である。
【0062】
上記実施形態における良品検査システム10の構成は、あくまで一例であり、種々変形可能である。例えば画像処理装置100の記憶部120の少なくとも一部および良否判定装置200の記憶部220の少なくとも一部は、外部装置(例えばクラウドサーバ等)に記憶された構成であってもよい。また、撮像部12と回転ステージ14と搬送ロボット16とのそれぞれの動作を、良否判定装置200ではなく、専用の制御装置(プログラマブルロジックコントローラ等)により制御するとしてもよい。
【0063】
上記実施形態では、工業製品として、ベベルギヤWを例示したが、他の歯車(例えばヘルカルギヤ等)でもよく、また、歯車以外の工業製品(シャフトやねじ等)でもよい。工業製品は、例えば、金型で金属材料等をプレスした鍛造物や金型に金属材料等を流し込んで成形した鋳造物等であり、形状やサイズ、材料なども任意であり、金属だけでなく、樹脂等で形成されたものでもよい。
【0064】
上記実施形態における各種の処理の内容は、あくまで一例であり、種々変形可能である。例えば、ベースライン画像生成処理において、打痕画像DB121に記憶された打痕画像Kは、良品画像GYと同じ色空間(RGB色空間)の画像データであってもよい。また、良品画像GYは、RGB空間以外の色空間の画像データであってもよい。また、ベースライン画像生成処理のS110において、予め定められた順番で選択された良品画像GYが取得されるとしてもよいし、一の良品画像GYを常に取得するとしてもよい。また、S114において、予め定められた順番で選択された打痕画像Kが取得されるとしてもよいし、一の打痕画像Kを常に取得するとしてもよい。
【0065】
ベースライン画像生成処理において、マスク画像生成処理(S112)と彩度調整処理(S118)の少なくとも1つを実行しないとしてもよいし、外部装置に実行させて結果を画像処理装置100が受信するとしてもよい。ベースライン画像生成処理において、特定画像領域R1を人の入力操作により指定するとしてもよい。マスク画像生成処理において、S214からS218の処理の少なくとも1つを実行しないとしてもよい。
【0066】
画像最適化処理において、画像更新モデル141による実行処理の少なくとも一部を外部装置に実行させて結果を良否判定装置200が受信するとしてもよい。
【0067】
ベベルギヤWの良否を判定するための処理において、画像認識モデル242を生成または更新する処理の少なくとも一部を外部装置に実行させて結果を良否判定装置200が受信するとしてもよい。
【0068】
上記実施形態において、ハードウェアによって実現されている構成の一部をソフトウェアに置き換えるようにしてもよく、反対に、ソフトウェアによって実現されている構成の一部をハードウェアに置き換えるようにしてもよい。