特許7520439 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ コアテック株式会社の特許一覧

特許7520439差分検出システム及び差分検出方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2024-07-12

(45)【発行日】2024-07-23

(54)【発明の名称】差分検出システム及び差分検出方法

(51)【国際特許分類】

G06T 7/00 20170101AFI20240716BHJP

G06N 3/08 20230101ALI20240716BHJP

G06N 20/20 20190101ALI20240716BHJP

【ＦＩ】

G06T7/00

G06N3/08

G06N20/20

【請求項の数】 4

(21)【出願番号】P 2024061538

(22)【出願日】2024-04-05

【審査請求日】2024-04-05

【早期審査対象出願】

(73)【特許権者】

【識別番号】593118128

【氏名又は名称】コアテック株式会社

(74)【代理人】

【識別番号】110003085

【氏名又は名称】弁理士法人森特許事務所

(72)【発明者】

【氏名】原知安紀

(72)【発明者】

【氏名】水津知也

【審査官】淀川滉也

(56)【参考文献】

【文献】特開２０２０－０８６６９８（ＪＰ，Ａ）

【文献】koshian2，ニューラルネットワークを使ったEnd-to-Endなアンサンブル学習，Qiita（オンライン），2018年11月24日，https://qiita.com/koshian2/items/d569cd71b0e082111962

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００

Ｇ０６Ｎ３／０８

Ｇ０６Ｎ２０／２０

(57)【特許請求の範囲】

【請求項1】

オートエンコーダを用い、入力画像と出力画像の差分を検出する差分検出システムであって、
前記オートエンコーダは、画像入力から画像出力までのプロセスを実行し、かつ一対のエンコーダとデコーダとを含むニューラルネットワークを備えており、
前記ニューラルネットワークの１つ分を１ヘッドとすると、
前記オートエンコーダは、複数ヘッドが並列に配置されたマルチヘッドオートエンコーダであり、
前記マルチヘッドオートエンコーダは、前記複数ヘッドのそれぞれから生成された画像を足し合わせる画像足し合わせニューラルネットワークを備えており、
前記画像入力から前記画像出力までの前記プロセスを実行し、前記画像足し合わせニューラルネットワークを備えた構成をＡＩモデルというとすると、
学習時には、前記入力画像と前記画像足し合わせニューラルネットワークを経た出力画像から計算した損失値に対して誤差逆伝播を行い、前記ＡＩモデルのパラメータを変異させ、
推論時には、前記ＡＩモデルで推論を実行し、前記画像足し合わせニューラルネットワークを経た前記出力画像と前記入力画像との差分画像が生成されることを特徴とする差分検出システム。

【請求項2】

前記複数ヘッドのそれぞれに入力される入力画像は同一である請求項１に記載の差分検出システム。

【請求項3】

オートエンコーダを用い、入力画像と出力画像の差分を検出する差分検出方法であって、
前記オートエンコーダは、画像入力から画像出力までのプロセスを実行し、かつ一対のエンコーダとデコーダとを含むニューラルネットワークを備えており、
前記ニューラルネットワークの１つ分を１ヘッドとすると、
前記オートエンコーダは、複数ヘッドが並列に配置されたマルチヘッドオートエンコーダであり、
前記マルチヘッドオートエンコーダは、前記複数ヘッドのそれぞれから生成された画像を足し合わせる画像足し合わせニューラルネットワークを備えており、
前記画像入力から前記画像出力までの前記プロセスを実行し、前記画像足し合わせニューラルネットワークを備えた構成をＡＩモデルというとすると、
学習時には、前記入力画像と前記画像足し合わせニューラルネットワークを経た出力画像から計算した損失値に対して誤差逆伝播を行い、前記ＡＩモデルのパラメータを変異させ、
推論時には、前記ＡＩモデルで推論を実行し、前記画像足し合わせニューラルネットワークを経た前記出力画像と前記入力画像との差分画像が生成されることを特徴とする差分検出方法。

【請求項4】

前記複数ヘッドのそれぞれに入力される入力画像は同一である請求項３に記載の差分検出方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、立体物検査に適した技術であり、ディープラーニング（深層学習）の一種であるオートエンコーダ（自己符号化器）を用い、入力画像と出力画像の差分を検出する差分検出システム及び差分検出方法に関する。

【背景技術】

【0002】

従来より、立体物検査の手法として、レーザー光等を用いた縞投影や光切断法が知られていた。例えば特許文献１に開示された立体物検査は、レーザー光源からのスリット光を照射して取得した被検査物の三次元形状の点群データに基いて被検査物を表示する。そして、この表示した被検査物に切断線を設定する。その後、設定した切断線に対応した点群データにより、切断線における被検査物の断面形状を算出する。しかし、レーザー光等を用いた立体物検査用の装置は高額で、導入の敷居が高く、操作も困難であった。

【0003】

一方、人工知能技術を利用すれば、低コストで操作が簡単な立体物検査が可能になる。具体的には、ディープラーニングの一種であるオートエンコーダは、入力画像を復元する機能を持っている。良品画像のみで学習させれば、不良品画像も良品画像に復元されることになる。これを利用して入力画像と出力画像の差分を取ることで、不良箇所を浮かび上がらせることができる。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０１２－３７４８７号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

本願発明者らは、より利便性の高いオートエンコーダの開発に取り組んだ結果、従来のオートエンコーダに、次のような課題が見い出された。すなわち、オートエンコーダの再現性を向上させたり、立体物を様々なアングルから検査可能とするには、パラメータが大規模化かつ複雑化してしまう。この場合、学習データをパラメータに見合った量だけ準備しないと、過学習を引き起こしたり、エポック数を増やす必要があるという問題が生じる。また、学習データやエポック数を増やすと、より高性能なＧＰＵ（Graphics Processing Unit）が必要となるという問題があった。

【0006】

本発明は、低コストで操作が簡単なオートエンコーダの利点は維持しながら、パラメータを大規模化したり複雑化させることなく、再現性が高く立体物の検査の精度が高い差分検出システム及び差分検出方法を提供することを目的とする。

【課題を解決するための手段】

【0007】

前記目的を達成するために、本発明の差分検出システムは、オートエンコーダを用い、入力画像と出力画像の差分を検出する差分検出システムであって、前記オートエンコーダは、画像入力から画像出力までのプロセスを実行し、かつ一対のエンコーダとデコーダとを含むニューラルネットワークを備えており、前記ニューラルネットワークの１つ分を１ヘッドとすると、前記オートエンコーダは、複数ヘッドが並列に配置されたマルチヘッドオートエンコーダであることを特徴とする。

【0008】

本発明の差分検出方法は、オートエンコーダを用い、入力画像と出力画像の差分を検出する差分検出方法であって、前記オートエンコーダは、画像入力から画像出力までのプロセスを実行し、かつ一対のエンコーダとデコーダとを含むニューラルネットワークを備えており、前記ニューラルネットワークの１つ分を１ヘッドとすると、前記オートエンコーダは、複数ヘッドが並列に配置されたマルチヘッドオートエンコーダであることを特徴とする。

【0009】

前記本発明の差分検出システム又は差分検出方法においては、前記複数ヘッドのそれぞれに入力される入力画像は同一であることが好ましい。

【発明の効果】

【0010】

本発明によれば、低コストで操作が簡単なオートエンコーダの利点は維持しながら、パラメータを大規模化したり複雑化させることなく、再現性が高く立体物の検査の精度が高い差分検出システム及び差分検出方法を実現することができる。

【図面の簡単な説明】

【0011】

【図1】オートエンコーダの構成の一例を示す模式図。

【図2】図１に示したオートエンコーダをより具体的に示したブロック図。

【図3】本発明の一実施形態に係るマルチヘッドオートエンコーダの構成を示す模式図。

【図4】学習用画像の一例を示した図。

【図5】本発明の一実施形態において、ＡＩモデルの学習時における学習データの処理を説明するための模式図。

【図6】本発明の一実施形態において、ＡＩモデルの学習時における学習データの処理の流れを示すフローチャート。

【図7】比較例１について、入力画像（（ａ）図）、出力画像（（ｂ）図）の一例を示した図。

【図8】実施例１について、入力画像（（ａ）図）、出力画像（（ｂ）図）の一例を示した図。

【図9】比較例１及び実施例１について、損失値を比較した図。

【図10】本発明の一実施形態において、推論時における画像データの処理の流れを示すフローチャート。

【図11】本発明の一実施形態において、入力画像、出力画像及び差分画像の一例を示す図。

【図12】比較例２についての、入力画像、出力画像及び差分画像を示す図。

【図13】実施例２についての、入力画像、出力画像及び差分画像を示す図。

【図14】比較例２についての、入力画像、出力画像及び差分画像を示す図。

【図15】実施例２についての、入力画像、出力画像及び差分画像を示す図。

【発明を実施するための形態】

【0012】

本発明に係る差分検出システム及び差分検出方法は、ＡＩ（人口知能：Artificial Intelligence）に関する技術であり、立体物検査に適しており、入力画像と出力画像の差分を検出するものである。より具体的には、ニューラルネットワークを用いたディープラーニング（深層学習）の一種であるオートエンコーダ（自己符号化器）を活用したものである。

【0013】

本発明の実施には、パソコンやスマートフォン等の端末に、差分検出に係るプログラムをインストールしたものを活用してもいが、同プログラムはクラウド上に用意したものでもよい。

【0014】

最初に、図１、図２を参照しながら、本発明の基礎となるオートエンコーダの概要について説明する。後述する本発明に係るマルチヘッドオートエンコーダは、図１、図２に示したオートエンコーダ１００を基礎に導き出した新たなオートエンコーダである。

【0015】

図１はオートエンコーダ１００の構成を示す模式図であり、図２は、図１に示したオートエンコーダ１００をより具体的に示したブロック図である。図１において、入力画像１０がニューラルネットワーク１０１に入力される。ニューラルネットワーク１０１は、入力層を含むエンコーダ１０２、潜在ベクトル層１０３及び出力層を含むデコーダ１０４で構成されている。

【0016】

図２に示したように、エンコーダ１０２は中間層１０５～１０８を備えており、デコーダ１０４は中間層１０９～１１２を備えている。図２では、中間層１０５～１０８、中間層１０９～１１２はそれぞれ、図示の便宜のため４層としているが、４層に限らない。

【0017】

エンコーダ１０２が備える中間層１０５～１０８において、入力画像１０は段階的に次元削減を行いながら、潜在ベクトル層１０３を経て特徴が抽出される。以後、デコーダ１０４が備える中間層１０９～１１２において、段階的に次元を増やしていき、最終的には入力画像１０と同じ次元の出力画像１２が得られる。図１において、オートエンコーダ１００によれば、入力画像１０と出力画像１２の差分画像１３により、不良箇所を浮かび上がらせることができる。

【0018】

前記のとおり、図１に示したオートエンコーダ１００は、一対のエンコーダ１０２及びデコーダ１０４を有するニューラルネットワーク１０１を１つ用いるものであった。これに対して、本発明に係る差分検出に用いるオートエンコーダは、図１に示したニューラルネットワーク１０１に相当するニューラルネットワークを複数並列に配置したものである。以下、ニューラルネットワークの１つ分を１ヘッドとし、ヘッド数が複数の本発明に係るオートエンコーダを、オートエンコーダ１００と区別するためにマルチヘッドオートエンコーダという。

【0019】

以下、本発明の一実施形態について、図面を参照しながら説明する。図３は、本発明の一実施形態に係るマルチヘッドオートエンコーダ１の構成を示す模式図である。図３の例では、マルチヘッドオートエンコーダ１は、一対のエンコーダ４及びデコーダ６を有するニューラルネットワーク３を並列に３つ備えた３ヘッド型である。１つ分のニューラルネットワーク３の構成は、図１及び図２に示したニューラルネットワーク１０１と同様の構成であり、エンコーダ４、潜在ベクトル層５及びデコーダ６を備えている。マルチヘッドオートエンコーダ１は、一対のエンコーダ４及びデコーダ６を有するニューラルネットワーク３を並列に複数備えている点、ニューラルネットワーク３の後段に画像足し合わせニューラルネットワーク１１を備えている点が、図１に示したオートエンコーダ１００と異なっている。

【0020】

複数のニューラルネットワーク３は、それぞれ異なる構造でもよいが、同一構造であってもよい。本実施形態では同一構造として説明する。また、本実施形態では、複数のニューラルネットワーク３と画像足し合わせニューラルネットワーク１１で構成される部分、すなわち画像入力から画像出力までのプロセスを実行する構成を総称してＡＩモデル２という。

【0021】

図３において、３つのニューラルネットワーク３のそれぞれには、同一画像が入力される。画像が入力されると、３つのニューラルネットワーク３により、３つの画像が生成される。このため、生成された３つの画像を足し合わせる必要がある。足し合わせは、単純に画素単位で平均を取る等の方法でもよいが、本実施形態では、画像足し合わせニューラルネットワーク１１により画像の足し合わを行う。画像足し合わせニューラルネットワーク１１は、入力層、中間層及び出力層を備えたニューラルネットワークである。すなわち、図３の構成では、画像を足し合わせる処理そのものについても、ニューラルネットワークを用いている。

【0022】

本発明に係る立体物検査を実施するには、まず学習を行う。そのために学習用画像（良品画像）を用意する。図４は学習用画像の一例を示している。図４に示した学習用画像は、角度を変えながら撮影した部品（良品）の動画を、静止画像に分割したものを４枚示している。立体物の検査用のＡＩモデル２を構築するには、様々な角度で撮影した画像を用意することが重要になる。図１に示した４枚は一例であり、以下に説明する比較例１及び実施例１では、約８００枚の良品画像を用いて学習を行った。

【0023】

図５は、ＡＩモデル２の学習時における学習データの処理を説明するための模式図であり、図６は、処理の流れを示すフローチャートである。学習を開始すると、ＡＩモデル構造設定データを読み込む（図６のステップ２００）。ＡＩモデル構造設定データは、マルチヘッドオートエンコーダ１の内部構造や、マルチヘッドのヘッド数を指定する設定データである。以下の表１に設定項目の一覧を示し、あわせて比較例１及び実施例１の設定値を示している。

【表1】

【0024】

表１において、比較例１はヘッド数が１であり、図１に示したオートエンコーダ１００に相当する。以下、便宜のため、比較例１のように、ヘッド数が１のオートエンコーダをシングルヘッドオートエンコーダという。以下、単にオートエンコーダというときは、シングルヘッドオートエンコーダとマルチヘッドオートエンコーダの総称である。

【0025】

実施例１はヘッド数が１２であり、図３に示したマルチヘッドオートエンコーダ１において、３つのニューラルネットワーク３の数を１２にしたものに相当する。マルチヘッドオートエンコーダ１は、図３に示した画像足し合わせニューラルネットワーク１１を備えているが、シングルヘッドオートエンコーダはこれを備えていない。表１において、実施例１のＡＩモデルの学習パラメータサイズは、画像足し合わせニューラルネットワーク１１も含めた値である（表２の実施例2も同じ）。

【0026】

以下、表１に示した各設定項目について説明する。レイヤーサイズは、オートエンコーダの深度である。表１のように、レイヤーサイズが６のときは、図２の例では、エンコーダ１０２の中間層が６層、デコーダ１０４の中間層が６層となる。ＶＡＥ（Variational Auto Encoder）潜在ベクトルの次元は、オートエンコーダの最終形のベクトルの次元である。ヘッド数は、前記のとおりである。マルチヘッドオートエンコーダのヘッド数は、２以上であれば特に限定はないが、本願発明者らの検証によれば、ヘッド数を増やすことで、より再現性の高いＡＩモデル２が構築可能となる。ただし、大き過ぎると過学習を引き起こすので、検査したい対象によって調整が必要となる。このため、マルチヘッドオートエンコーダのヘッド数は、例えば１０～１６の範囲内が好ましい。

【0027】

学習時画像サイズは、ＡＩモデル２へ入力する際の画像のサイズである。サンプル画像サイズは、学習用画像を切り出す際のサイズである。学習用画像を切り出さない場合は、用意した学習時画像サイズのサイズを指定する。バッチサイズは、全ての学習データを１度に使わずに、複数のグループに分けて使うときに、１つのグループに含まれるデータ件数のことである。ＧＰＵ（Graphics Processing Unit）のメモリが十分に大きい場合は、大きな値を設定することで、学習時間を短縮できる。エポック数は、１件の学習データを繰り返し学習させる回数のことである。

【0028】

ＡＩモデル構造設定データの読み込み（図６のステップ２００）が完了すると、学習用画像データ群を読み込む（図６のステップ２０１）。以下、実施例１について説明するが、比較例１についても同様である。実施例１のように、ヘッド数が１２の場合は、１２個のニューラルネットワーク３のそれぞれに同一画像を読み込ませる。学習用画像データ群は、図４に示したような撮影済の学習用画像について、加工によるデータ拡張を行ったものである。データ拡張を行う際に、まず画像の大きさを一定サイズに変換する。その後は、画像のコントラストをランダムに変異させ、画像の明度をランダムに変異させ、画像にガウスぼかしをランダムに施し、画像を左右上下反転を行う。これらのデータ拡張の各プロセスを経ることにより、画像のバリエーションが増加する。

【0029】

学習用画像データ群の読み込み（図６のステップ２０１）が完了すると、ＡＩ学習スケジュール設定データを読み込む（図６のステップ２０２）。ＡＩ学習スケジュール設定データは、学習用画像データ群（図６のステップ２０１）の整理、エポック数、学習用上位パラメータの設定のためのデータである。学習用画像データ群の整理により、学習用画像データ群は、学習用画像データと確認用画像データに分類される。確認用画像データは学習には利用せず、ＡＩモデル２の性能を測るために取り置かれる。

【0030】

エポック数は、学習画像データ全てを入力して１回と数え、何回それを繰り返すかを示す。学習用上位パラメータは、学習率(learning rate)、学習率の変動率、ドロップアウト率(dropout rate)である。学習率は、誤差逆伝播（Backpropagation）の移動量を表し、学習率の変動率は、得られたＡＩモデル２の損失値が改善しなかった場合に、有意に学習率を落とす率を示す。ドロップアウト率は、ＡＩモデル２の学習時に、不活性化するパラメータをランダムに選出する際の選出率を示す。

【0031】

ＡＩ学習スケジュール設定データの読み込み（図６のステップ２０２）が完了すると、学習用画像データ群を入力して、ＡＩモデル２のパラメータを最適化する（図６のステップ２０３）。この最適化の処理について、図５を参照しながら説明する。最適化の処理は、バッチサイズの１回分が終了する毎に行う。例えば学習画像データ枚数を１００とし、バッチサイズを１０とした場合、１エポック当たりの計算ステップ数は１０となる。この場合、１００枚分について１０回の最適化の処理が行われる。エポック数が１０であれば、最適化のための処理回数は、１００回となる。計算ステップ数は整数であり、表１の例では、計算ステップ数は２（８００枚／５１２）となる。

【0032】

図５において、ＡＩモデル２への入力画像１０として、図６のステップ２０１における学習用画像データ群に含まれる画像データを用いる。ＡＩモデル２を経た出力画像１２は保存し、入力画像１０と出力画像１２との差分を取って損失値を計算する。差分は、画素ごとに差分を２乗し、画像全体で総和したものである。損失値は、ＭＳＥ（Mean Squared Error）損失値のことであり、０に近いほど入力画像に対する出力画像の再現性が高い。差分値に対して誤差逆伝播（Backpropagation）を行い、ＡＩモデル２のパラメータを変異させる。以後は前記の処理を繰り返す。

【0033】

ＡＩモデル２のパラメータを最適化（図６のステップ２０３）が完了すると、学習が終了したＡＩモデル２のデータを書き出し、ＡＩモデルデータを生成する（図６のステップ２０４）。

【0034】

図７は、表１の比較例１について、入力画像１０（（ａ）図）、出力画像１２（（ｂ）図）の一例を示しており、図８は、表１の実施例１について、入力画像１０（（ａ）図）、出力画像１２（（ｂ）図）の一例を示している。図７と図８の比較から、実施例１は比較例１よりも、より正しく画像を復元できていることが分る。

【0035】

図９は、比較例１及び実施例１について、損失値を比較した図である。横軸は、前記の最適化のための処理回数であり、縦軸は前記の損失値である。図９では、最適化の処理回数は、最終的には１０００回（計算ステップ数２×エポック数５００）である。線２０が比較例１であり、線２１が実施例１である。前記のとおり、損失値が０に近いほど入力画像に対する出力画像の再現性が高い。図９において、比較例１（線２０）は、最終損失値が０．０４であり、実施例１（線２１）は、最終損失値が０．００９であり、実施例１は比較例１に比べ、再現性が大幅に向上していることが分る。

【0036】

表１のとおり、比較例１及び実施例１は、ヘッド数は異なるが、エポック数、バッチサイズ等の前提条件は統一している。しかも実施例１は、学習パラメータサイズを比較例１よりも小さくしている。それにもかかわらず、実施例１は比較例１に比べ、再現性が大幅に向上していることになる。

【0037】

図９において、比較例１（線２０）の最適化のための処理回数を１０００回からさらに増やし行けば、損失値が低下していくとしても、実施例１の損失値に到達するには、最適化のための処理回数が４０００～５０００回程度になることが推測される。この推測通りであれば、比較例１は、エポック数を４～５倍にすると、実施例１と同じ損失値が得られことになる。

【0038】

しかし、エポック数を無制限に増やすと、計算時間が増加するだけでなく、過学習の懸念が生じる。画像データが多いと、計算時間は日単位レベルとなる。この場合は、ユーザが現地で立体物検査を行う際に、学習から実施する場合は、実質的に実施不可能となる。これに対し、実施例１は計算時間の増加や過学習の懸念を抑えつつ、再現性を大幅に向上させることができ、実施にも適している。

【0039】

以下、図３及び図１０を参照しながら、推論時の処理について説明する。以下、実施例１について説明するが、比較例１についても同様である。前記のとおり、図３は、本発明の一実施形態に係るマルチヘッドオートエンコーダ１の構成を示す模式図であるが、推論時における画像データの処理の流れを示す模式図でもある。図１０は、推論時における画像データの処理の流れを示すフローチャートである。

【0040】

推論時には、まずＡＩモデルデータを読み込む（図１０のステップ３００）。ＡＩモデルデータは、図６のステップ２０４で生成されたＡＩモデルデータとＡＩモデル構造設定データ（図６のステップ２００）の総称である。ＡＩモデル構造設定データは文字情報として保存され、ＡＩモデルデータのパラメータ群は浮動小数点値として保存される。ＡＩモデル構造設定データについて、同データを解釈可能なプログラムに読み込ませることで、ＡＩモデル２の構造を構築する。さらにＡＩモデルデータのパラメータ群を読み込ませることで、ＡＩモデル２を画像変換が可能な状態にする。

【0041】

ＡＩモデルデータの読み込み（図１０のステップ３００）が完了すると、入力画像１０（推論用画像）を読み込む（図１０のステップ３０１）。入力画像データは、推論の対象物を動画又は連続写真で撮影し、加工を行った画像群である。ここでの加工は、画像の大きさを一定サイズに変換する加工である。

【0042】

入力画像１０の読み込み（図１０のステップ３０１）が完了すると、図３において、入力画像１０をＡＩモデル２に入力して、ＡＩモデル２で推論を実行し、生成された出力画像１２（推論実行後画像）を書き出す（図１０のステップ３０２）。その後は、入力画像１０と出力画像１２を画素単位で差分を取り（画素ごとに差分絶対値を計算）、差分画像１３を生成し書き出す（図１０のステップ３０３）。

【0043】

図１１は、入力画像１０、出力画像１２及び差分画像１３の一例を示す図である。入力画像１０に不良箇所があっても、出力画像１２には再現されず、差分画像１３に出力される。すなわち、差分画像１３に不良箇所が浮かび上がることにより、立体物検査が可能になる。図１１の例は、学習用画像が少ないため、差分画像１３に良品箇所が浮かび上がっているが、実際の検査時には学習用画像を多くするので、良品箇所が浮かび上がることは防止できる。

【0044】

以下、比較例２及び実施例２を説明しながら、検証結果をより具体的に説明する。以下の表２に比較例２及び実施例２の設定項目及び設定値を示している。設定項目は、表１と同じである。表２において、比較例２はヘッド数が１のシングルヘッドオートエンコーダであり、実施例２はヘッド数が１２のマルチヘッドオートエンコーダである。

【表2】

【0045】

比較例２及び実施例２の検査対象物は同じであり、比較例１及び実施例１の検査対象物よりも複雑な立体物を用いた。図１２は、比較例２についての、入力画像１０、出力画像１２及び差分画像１３を示す図である。図１３は、実施例２についての、入力画像１０、出力画像１２及び差分画像１３を示す図である。図１２及び図１３における入力画像１０は、良品の画像である。実施例２を示す図１３の出力画像１２は、比較例２を示す図１２の出力画像１２に比べ、再現性が高くより精緻であった。また、比較例２を示す図１２においては、入力画像１０が良品であるにもかかわらず、差分画像１３に差分が浮かび上がっていた。実施例２を示す図１３においては、差分画像１３に差分は、ほとんど浮かび上がらなかった。

【0046】

図１４及び図１５は、入力画像１０として、模擬的に不良箇所を作ったときの画像を用いたときの検査結果を示している。図１４及び図１５における入力画像１０は同じであり、立体物にねじａ～ｆを追加して模擬的に不良箇所を作った立体物の画像である。図１４は、比較例２についての、入力画像１０、出力画像１２及び差分画像１３を示す図である。図１５は、実施例２についての、入力画像１０、出力画像１２及び差分画像１３を示す図である。

【0047】

比較例２を示す図１４の差分画像１３には、入力画像１０の不良箇所（ａ～ｆ）相当する箇所だけでなく、良品箇所に相当する箇所も浮かび上がっていた。実施例２を示す図１５においては、差分画像１３には、不良箇所（ａ～ｆ）以外の差分は、ほとんど浮かび上がらなかった。

【0048】

図１２～１５に示した結果から、実施例２は比較例２に比べ、出力画像の再現性が高く、このことにより、差分画像において、不良箇所が浮かび上がるとともに、良品箇所はほとんど浮かび上がらないことが確認できた。表２のとおり、比較例２及び実施例２は、ヘッド数は異なるが、エポック数、バッチサイズ等の前提条件は統一している。しかも実施例２は、学習パラメータサイズを比較例２よりも小さくしている。それにもかかわらず、実施例２は比較例２に比べ、再現性が高く立体物の検査の精度が高いことが確認できた。

【0049】

本発明に係るマルチヘッドオートエンコーダ１が前記のような効果が得られるのは、次のように推測される。マルチヘッドオートエンコーダ１は、ニューラルネットワーク３を複数備えているので、それぞれのニューラルネットワーク３は、同一の入力画像に対して異なる解釈を行い得る。このため、出力画像は様々な解釈を反映したものとなり、解釈の偏りが是正され、このことが精度向上に繋がるものと推測される。

【0050】

以上、本発明の一実施形態及び一実施例について説明したが、これらは一例であり、適宜変更したものであってもよい。例えば、差分画像１３は、次のように処理してもよい。差分画像１３を青から赤で色分布を行いヒートマップを保存する。このことにより、入力画像１０と出力画像１２がどれだけ異なるかを視覚的に表現することができる。また、差分画像の差分値を画像全体にわたり最大値、平均値を算出し保存する。このことにより、入力画像１０と出力画像１２がどれだけ異なるかを数値的に表現することができる。

【符号の説明】

【0051】

１マルチヘッドオートエンコーダ
２ＡＩモデル
３ニューラルネットワーク
４エンコーダ
６デコーダ
１０入力画像
１１画像足し合わせニューラルネットワーク
１２出力画像
１３差分画像

【要約】

【課題】低コストで操作が簡単なオートエンコーダの利点は維持しながら、パラメータを大規模化したり複雑化させることなく、再現性が高く立体物の検査の精度が高い差分検出システム及び差分検出方法を提供する。
【解決手段】オートエンコーダを用い、入力画像１０と出力画像１２の差分１３を検出する差分検出システムであって、オートエンコーダは、画像入力から画像出力までのプロセスを実行し、かつ一対のエンコーダ４とデコーダ６とを含むニューラルネットワーク３を備えており、ニューラルネットワーク３の１つ分を１ヘッドとすると、オートエンコーダは、複数ヘッドが並列に配置されたマルチヘッドオートエンコーダ１である。
【選択図】図３