IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ コニカミノルタ株式会社の特許一覧

特開2023-172508学習装置、学習システム、学習方法、及び、プログラム
<>
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図1
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図2
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図3
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図4A
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図4B
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図5
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図6
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図7
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図8
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図9A
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図9B
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図9C
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図10
  • 特開-学習装置、学習システム、学習方法、及び、プログラム 図11
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023172508
(43)【公開日】2023-12-06
(54)【発明の名称】学習装置、学習システム、学習方法、及び、プログラム
(51)【国際特許分類】
   G06V 10/774 20220101AFI20231129BHJP
   G06T 7/00 20170101ALI20231129BHJP
   G06N 20/00 20190101ALI20231129BHJP
【FI】
G06V10/774
G06T7/00 350C
G06N20/00 130
【審査請求】未請求
【請求項の数】14
【出願形態】OL
(21)【出願番号】P 2022084361
(22)【出願日】2022-05-24
(71)【出願人】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】110001807
【氏名又は名称】弁理士法人磯野国際特許商標事務所
(72)【発明者】
【氏名】舘 高基
【テーマコード(参考)】
5L096
【Fターム(参考)】
5L096AA06
5L096BA03
5L096DA02
5L096FA05
5L096FA64
5L096HA09
5L096HA11
5L096KA04
5L096KA15
(57)【要約】
【課題】検知対象の形状分布に対してロバストな検知を可能とするように学習する。
【解決手段】サーバ20(学習装置)は、所定形状情報(矩形情報56)に対応付けられたアノテーションデータを含む教師データ43の形状分布を取得する分布取得部(矩形形状分布取得部32)と、形状分布に基づいて、所定形状情報の教師データから学習に用いるパラメータ候補を選択する選択部33と、を備える。選択部は、アノテーションデータに対応付けられた所定形状のサイズが偏らないように教師データから学習に用いるパラメータ候補を選択する。
【選択図】図2
【特許請求の範囲】
【請求項1】
所定形状情報に対応付けられたアノテーションデータを含む教師データの形状分布を取得する分布取得部と、
前記形状分布に基づいて、前記所定形状情報の前記教師データから学習に用いるパラメータ候補を選択する選択部と、を備える、
学習装置。
【請求項2】
前記選択部は、アノテーションデータに対応付けられた所定形状のサイズが偏らないように教師データから学習に用いるパラメータ候補を選択する、
請求項1に記載の学習装置。
【請求項3】
所定形状情報に対応付けられたアノテーションデータを含む教師データから、学習に用いるパラメータ候補一覧を、前記所定形状のサイズが偏らないように生成する生成部を備える、
請求項2に記載の学習装置。
【請求項4】
前記生成部は、入力画像のサイズを利用して、前記所定形状のサイズが偏らないように前記教師データから、学習に用いるパラメータ候補一覧を生成する、
請求項3に記載の学習装置。
【請求項5】
前記選択部は、アノテーションデータに対応付けられた形状が偏らないように選択する、
請求項1に記載の学習装置。
【請求項6】
アノテーションデータに対応付けられた外観形状が偏らないように前記教師データから、学習に用いるパラメータ候補一覧を生成する生成部を備える、
請求項4に記載の学習装置。
【請求項7】
前記生成部は、入力画像のサイズを利用して、アノテーションデータに対応付けられた形状が偏らないように前記教師データから、学習に用いるパラメータ候補一覧を生成する、
請求項6に記載の学習装置。
【請求項8】
画像を用いた外観検査に用いられる、
請求項1に記載の学習装置。
【請求項9】
前記所定形状情報は、矩形情報である、
請求項1に記載の学習装置。
【請求項10】
前記選択部が選択した教師データを学習した学習済みモデルを用いて検出対象を推論する推論部をさらに備える、
請求項1に記載の学習装置。
【請求項11】
それぞれで解像度が異なるように層出力を複数に分岐するネットワーク部をさらに備え、
前記選択部は、それぞれの層出力に対応して、重複しないように前記所定形状情報の教師データから、学習に用いるパラメータ候補を選択し、
前記ネットワーク部は、前記選択部で選択された前記パラメータ候補を用いて前記学習済みモデルを生成する、
請求項10に記載の学習装置。
【請求項12】
請求項1乃至請求項11のいずれか一項に記載の学習装置と、
検査対象の外観画像を取得する外観検査システムと、を備える、
学習システム。
【請求項13】
所定形状情報に対応付けられたアノテーションデータを含む教師データの所定形状分布を取得する分布取得工程と、
前記所定形状分布に基づいて、前記所定形状情報の前記教師データから学習に用いるパラメータ候補を選択する選択工程と、を含む、
学習方法。
【請求項14】
コンピュータを、
所定形状情報に対応付けられたアノテーションデータを含む教師データの所定形状分布を取得する手順と、
前記所定形状分布に基づいて、前記所定形状情報の前記教師データから学習に用いるパラメータ候補を選択する手順と、
を実行させるためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習装置、学習システム、学習方法、及び、プログラムに関する。
【背景技術】
【0002】
従来、検査者の目視に頼ってきた検査対象の外観検査分野において、人工知能(AI:artificial intelligence)を活用して検査を自動化することが行われつつある。その外観検査において、学習時に、検査対象の良品画像と不良品画像と検査対象の欠陥部分を囲む矩形情報に対応付けられたアノテーションデータ(以下、「矩形アノテーションデータ」と称する)とをコンピュータに入力して、人工知能(AI)を活用して欠陥検出エンジンを学習させる。そして、検査時(推論時)に、学習した欠陥検出エンジンに基づいて入力画像に映る検査対象の外観の良否を検査(推論)する。なお、アノテーションとは、あるデータに対して関連する情報(メタデータ)を注釈として付与することである。また、欠陥検出エンジンとしては、例えば、YOLOv3アルゴリズム(非特許文献1参照)をベースとした教師あり欠陥検出エンジンを活用することが提案されている。YOLOv3アルゴリズムとは、教師データとして、欠陥部分等の物体を囲った矩形の座標及びサイズを利用するものである。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】“YOLOv3: An Incremental Improvement”、[online]、Cornell University、[令和4年4月26日検索]、インターネット<URL:https://arxiv.org/abs/1804.02767>
【発明の概要】
【発明が解決しようとする課題】
【0004】
提案された外観検査では、学習時に、教師データにおける欠陥部分の分布からK-means法等のクラスタリング手法により、prior矩形を定める。そして、検査時には、このprior矩形を利用して、入力画像の欠陥を検出する。しかしながら、検査対象に欠陥部分が発生することが稀な製品では、検査対象の不良品画像を取得すること自体が困難であり、取得される欠陥データの少なさから、十分な量の教師データを用いてクラスタリングすることができない。そのため、prior矩形のサイズが特定のサイズに偏ってしまい、入力画像の欠陥部分の検出性能を低下させてしまう可能性がある。
【0005】
本発明は上記従来技術の有する問題点に鑑みてなされたものであり、本発明の目的は、検知対象の形状分布に対してロバストな検知を可能とするように学習する学習装置、学習システム、学習方法、及び、プログラムを提供することにある。
【課題を解決するための手段】
【0006】
本発明の上記課題は、下記の手段により解決される。
【0007】
(1)学習装置であって、所定形状情報に対応付けられたアノテーションデータを含む教師データの形状分布を取得する分布取得部と、前記形状分布に基づいて、前記所定形状情報の前記教師データから学習に用いるパラメータ候補を選択する選択部と、を備える、学習装置。
【0008】
(2)前記選択部は、アノテーションデータに対応付けられた所定形状のサイズが偏らないように教師データから学習に用いるパラメータ候補を選択する、上記(1)に記載の学習装置。
【0009】
(3)所定形状情報に対応付けられたアノテーションデータを含む教師データから、学習に用いるパラメータ候補一覧を、前記所定形状のサイズが偏らないように生成する生成部を備える、上記(2)に記載の学習装置。
【0010】
(4)前記生成部は、入力画像のサイズを利用して、前記所定形状のサイズが偏らないように前記教師データから、学習に用いるパラメータ候補一覧を生成する、上記(3)に記載の学習装置。
【0011】
(5)前記選択部は、アノテーションデータに対応付けられた形状が偏らないように選択する、上記(1)に記載の学習装置。
【0012】
(6)アノテーションデータに対応付けられた外観形状が偏らないように前記教師データから、学習に用いるパラメータ候補一覧を生成する生成部を備える、上記(4)に記載の学習装置。
【0013】
(7)前記生成部は、入力画像のサイズを利用して、アノテーションデータに対応付けられた形状が偏らないように前記教師データから、学習に用いるパラメータ候補一覧を生成する、上記(6)に記載の学習装置。
【0014】
(8)画像を用いた外観検査に用いられる、上記(1)に記載の学習装置。
【0015】
(9)前記所定形状情報は、矩形情報である、上記(1)に記載の学習装置。
【0016】
(10)前記選択部が選択した教師データを学習した学習済みモデルを用いて検出対象を推論する推論部をさらに備える、上記(1)に記載の学習装置。
【0017】
(11)それぞれで解像度が異なるように層出力を複数に分岐するネットワーク部をさらに備え、前記選択部は、それぞれの層出力に対応して、重複しないように前記所定形状情報の教師データから、学習に用いるパラメータ候補を選択し、前記ネットワーク部は、前記選択部で選択された前記パラメータ候補を用いて前記学習済みモデルを生成する、上記(10)に記載の学習装置。
【0018】
(12)学習システムであって、上記(1)乃至上記(11)のいずれか一項に記載の学習装置と、検査対象の外観画像を取得する外観検査システムと、を備える、学習システム。
【0019】
(13)学習方法であって、所定形状情報に対応付けられたアノテーションデータを含む教師データの所定形状分布を取得する分布取得工程と、前記所定形状分布に基づいて、前記所定形状情報の前記教師データから学習に用いるパラメータ候補を選択する選択工程と、を含む、学習方法。
【0020】
(14)プログラムであって、コンピュータを、所定形状情報に対応付けられたアノテーションデータを含む教師データの所定形状分布を取得する手順と、前記所定形状分布に基づいて、前記所定形状情報の前記教師データから学習に用いるパラメータ候補を選択する手順と、を実行させるためのプログラム。
【発明の効果】
【0021】
本発明によれば、検知対象の形状分布に対してロバストな検知を可能とするように学習することができる。
【図面の簡単な説明】
【0022】
図1】実施形態に係る学習装置を含む学習システムの構成図である。
図2】実施形態に係る学習装置として機能するサーバのブロック図である。
図3】YOLOv3アルゴリズムの説明図である。
図4A】学習装置の学習部の動作説明図である。
図4B】学習装置の推論部の動作説明図である。
図5】スコアの説明図である。
図6】スコアの説明図である。
図7】学習部の内部構成図である。
図8】ディープラーニングネットワーク部の説明図である。
図9A】矩形情報の説明図(1)である。
図9B】矩形情報の説明図(2)である。
図9C】矩形情報の説明図(3)である。
図10】学習装置の動作を示すフローチャートである。
図11】学習装置の動作を示すフローチャートである。
【発明を実施するための形態】
【0023】
以下、図面を参照して、本発明の実施の形態について詳細に説明する。なお、各図は、本発明を十分に理解できる程度に、概略的に示しているに過ぎない。よって、本発明は、図示例のみに限定されるものではない。また、各図において、共通する構成要素や同様な構成要素については、同一の符号を付し、それらの重複する説明を省略する。
【0024】
<学習装置を含む学習システムの構成>
以下、図1及び図2を参照して、本発明の実施形態に係る学習装置を含む学習システムの構成について説明する。図1は、本実施形態に係る学習装置として機能するサーバ20を含む学習システム100の構成図である。図2は、学習システム100の構成図である。本実施形態では、学習システム100が検査対象の外観検査分野に用いられるものとして説明する。
【0025】
図1に示すように、学習システム100は、検査対象の外観画像を取得する外観検査システム10と、サーバ20と、を備える。サーバ20は、検査対象の外観の良否を学習する学習装置として機能するとともに、検査対象の外観の良否を検査(推論)する検査装置として機能する。
【0026】
外観検査システム10は、検査対象物200の画像を撮影して取得するカメラ11と、検査対象物200に光を照射する照明12と、を有している。なお、サーバ20の構成については、図2を用いて後記する。
【0027】
サーバ20は、学習時に、外観検査システム10から検査対象物200の良品画像データと不良品画像データとを取得して教師データ43を作成し、人工知能(AI)を活用して検査対象物200の外観の良否を判定する欠陥検出エンジンを学習させる。サーバ20は、検査時(推論時)に、学習済みの欠陥検出エンジンに基づいて入力画像に映る検査対象の外観の良否を検査(推論)する。本実施形態では、サーバ20は、学習時に、検査対象物200の欠陥部分を囲む、所定形状の情報(以下、「所定形状情報」と称する)に対応付けられたアノテーションデータを含む教師データ43から、学習に用いるパラメータ候補を選択し、選択した複数個のパラメータ候補を用いて学習する。なお、本実施形態では、所定形状情報の形状が矩形を呈しているものとして説明する。以下、「所定形状情報」を「矩形情報」と称する場合がある。ただし、所定形状情報の形状は、例えば、円形、楕円形、菱形、三角形等であってもよい。
【0028】
このような学習システム100は、検査作業を自動化することができる。
例えば、検査者の目視に頼ってきた検査対象の外観検査を、人工知能(AI)を活用して自動化することができる。また少量のデータで学習可能な人工知能(AI)の活用により、大量の不良品画像データの収集は不要になり、素早い導入が可能になる。
【0029】
また、このような学習システム100は、作業者の判断に依存しない検査を行うことができるため、検査精度を向上させることができる。
例えば、簡単な設定だけで人工知能(AI)による良否判断ができるため、作業者の判断に依存しなくなる。また新しい不良が発生した場合にも柔軟な対応が可能になる。
【0030】
また、このような学習システム100は、汎用性の高い検査システムで多品種少量生産にも適用することができる。
例えば、多品種少量生産が多い中小製造業において、複数製品への適用が可能である。そのため、検査にかかりきりだった検査員を他の業務に充てることが可能になる。
【0031】
<学習装置の構成>
図2に示すように、サーバ20は、制御部21と、記憶部22と、を有している。制御部21は、CPU(Central Processing Unit)とRAM(Random Access Memory)とで構成され、記憶部22に格納された制御プログラム49をCPUに実行させることで、学習部30と検査部36として機能する。記憶部22は、半導体メモリ、HDD(Hard Disk Drive)、SSD(Solid State Drive)等で構成される。
【0032】
図2に示す例では、学習部30は、生成部31と、矩形形状分布取得部32と、選択部33と、ディープラーニングネットワーク部34と、を含む構成になっている。また、検査部36は、推論部37を含む構成になっている。
【0033】
生成部31は、アノテーションデータに対応付けられた所定形状のサイズが偏らないように、教師データを生成する。また生成部31は、この所定形状の外観の形状が偏らないように教師データを生成する。具体的にいうと、生成部31は、検査対象物200の不良品画像42の鏡像反転、拡大、縮小、アフィン変換などにより、所定形状のサイズ及び/又は形状が偏らないように教師データを生成する。
矩形形状分布取得部32は、教師データ43の形状分布を取得する。
選択部33は、形状分布に基づいて所定形状情報(本実施形態では矩形情報56(図5参照))を含む教師データから、学習に用いるパラメータ候補を複数個選択する。具体的にいうと、選択部33は、所定形状のサイズの分布に基づいて、これらサイズの分布が偏らないように所定形状情報(本実施形態では矩形情報56(図5参照))の教師データから学習に用いるパラメータ候補を複数個選択する。
【0034】
ディープラーニングネットワーク部34は、それぞれで解像度が異なるように層出力を複数に分岐して学習する構成要素である。ディープラーニングネットワーク部34は、選択部33で選択されたパラメータ候補を用いて学習済みモデル44を生成する。
推論部37は、学習済みモデル44を用いて、検査対象物200の画像から、この検査対象物200の欠陥を推論(検出)する。
【0035】
また、図2に示す例では、記憶部22は、外部(例えば外観検査システム10(図1参照))から取得される検査対象物200の良品画像41、不良品画像42、及び教師データ43、学習部30で作成される学習済みモデル44及び欠陥検出エンジン45(欠陥検出アルゴリズム)、制御プログラム49を記憶する。
【0036】
<YOLOv3アルゴリズムの概要>
以下、図3を参照して、YOLOv3アルゴリズムの概要について説明する。図3は、YOLOv3アルゴリズムの説明図である。YOLOv3アルゴリズムは、一般的な物体検出のアルゴリズムであり、教師データとして、物体を囲った矩形形状の枠体の座標及びサイズを利用する。図3に示す例では、入力画像51に映る物体を矩形形状の枠体(輪郭線54)で囲った状態を示している。
【0037】
<YOLOv3アルゴリズムを用いた教師あり欠陥検出エンジンの概要>
以下、図4A及び図4Bを参照して、YOLOv3アルゴリズムを用いた教師あり欠陥検出エンジンの概要について説明する。図4A及び図4Bは、図4Aは、サーバ20の学習部30の動作説明図である。図4Bは、サーバ20の推論部37の動作説明図である。本実施形態では、サーバ20は、YOLOv3をベースとした欠陥検出アルゴリズムを用いるものとして説明する。
【0038】
図4Aに示すように、学習時に、サーバ20には、矩形アノテーションデータ43aを含む教師データ43が入力される。この教師データ43は、良品画像41と、不良品画像42を含んでいる。不良品画像42には、欠陥部分52を囲う矩形情報56に対応付けされる矩形アノテーションデータ43aが付加されている。矩形アノテーションデータ43aは、矩形情報56で囲われた欠陥部分52の属性、例えば不良の種類などを示すタグ情報である。サーバ20の学習部30は、教師データ43を取得して欠陥検出エンジン45に引き渡す。欠陥検出エンジン45は、不良品画像42の矩形情報56から欠陥部分52を学習する。そして、サーバ20の欠陥検出エンジン45は、教師データ43に基づいて検査対象物200の欠陥部分52を学習した学習済みモデル44を作成して記憶部22に記憶する。
【0039】
また、図4Bに示すように、推論時(検出時)に、サーバ20には、検査対象物200の外観を撮影した入力画像51が入力される。サーバ20の推論部37は、入力画像51の中に検査対象物200の欠陥部分52を撮影した不良品画像42が含まれている場合に、記憶部22に記憶された学習済みモデル44、及び、学習済みの欠陥検出エンジン45(教師あり)を用いて、不良品画像42から欠陥部分52を検出し、欠陥部分52に対して矩形情報56を設定する。そしてサーバ20の推論部37は、矩形情報56の一覧と各矩形情報56のスコア(欠陥らしさを数値化したもの)を取得する。
【0040】
このようなサーバ20は、学習時に、良品画像41と矩形アノテーションデータ43a(図4A参照)を含む不良品画像42とを含む教師データ43を入力して、検査対象物200の外観の良否を学習する。そして、サーバ20は、推論時に、入力画像51が入力されると、矩形情報56の一覧と各矩形情報56のスコア(欠陥らしさを数値化したもの)を推論する。このようなサーバ20は、セグメンテーション(ネットワークをサブネットワークへ分割したもの)系の欠陥検出によりアノテーションの負担を小さくすることができる。
【0041】
<矩形情報のスコアの概要>
以下、図5及び図6を参照して、矩形情報56のスコアの概要について説明する。図5及び図6は、スコアの説明図である。なお、スコアの最大値は「1」となっている。
【0042】
図5及び図6の左画像と右画像は、同じ検査対象物200の異なる部位の画像を表しており、左画像の解像度が右画像の解像度よりも粗くなっており、欠陥部分52を矩形情報56で囲んで示している。
【0043】
外観検査(ただし、外観検査以外の処理を行う場合もある)において、検査対象の不良品画像を取得すること自体が困難であり、取得される欠陥データの少なさから、十分な量の教師データを用いてクラスタリングすることができない場合がある。従来であれば、このような場合に、入力画像の欠陥部分52に設定するprior矩形のサイズが特定のサイズに不当に偏ってしまい、欠陥部分の検出性能に影響が出て、欠陥部分の検出性能を低下させてしまう可能性がある。つまり、従来技術では、少数の学習データから事前情報としての矩形情報56を設定すると、矩形情報56が偏ってしまい、欠陥部分の検出性能を低下させてしまう可能性がある。
【0044】
図5は、このような場合のスコアの一例を示している。図5では、右画像の比較的小さい欠陥部分52のスコアが「0.601016」になっている。これに対して、左画像の比較的大きい欠陥部分52のスコアが「0.00552358」となっている。このような図5の例では、左画像において、prior矩形のサイズが比較的小さいサイズに偏っている。そのため、欠陥部分52を囲う矩形情報56のサイズが大きい左画像において、外れ値のように比較的大きいサイズの欠陥部分52に対する検出性能が低下してしまう。
【0045】
また、図6に示す例では、左画像の比較的大きい欠陥部分52のスコアが図5の左画像の欠陥部分52のスコアと同じ「0.00552358」となっている。これに対して、右画像の比較的小さい欠陥部分52のスコアが「0.930741」になっている。図6に示す例では、右画像において、比較的小さい欠陥部分52に対して比較的大きなスコアを得ているが、左画像において、比較的大きい欠陥部分52に対するスコアが比較的小さい。これは、教師データにおいて、比較的大きい欠陥部分52のバリエーションが不足しているためである。
【0046】
<学習部の概要>
本実施形態では、prior矩形のサイズが特定のサイズに偏らないように調整される。以下、図7から図9Cを参照して、この仕組みを実現するサーバ20の学習部30の概要について説明する、図7は、学習部30の内部構成図である。図8は、学習部30のディープラーニングネットワーク部34の説明図である。図9A図9B、及び図9Cは、それぞれ、矩形情報56の説明図である。
【0047】
前記した通り、従来技術では、少数の学習データから事前情報としての矩形情報56を設定すると、矩形情報56が偏ってしまい、欠陥部分の検出性能に影響が出て、欠陥部分の検出性能を低下させてしまう可能性がある。そこで、本実施形態では、事前情報としての矩形情報56のサイズ及び/又は形状が重複しないように散らばせる設定を行い、学習データが不足しがちな領域に欠陥検出アルゴリズムを適用する場合であっても、欠陥部分を性能良く検出できるようにする。
【0048】
図7に示すように、学習部30では、学習済みモデル44を作成する際に、生成部31が入力画像のサイズ等に応じて、矩形情報に対応付けられたアノテーションデータを含む教師データを、矩形形状のサイズ及び/形状が偏らないように生成する。そして、矩形形状分布取得部32が教師データ43の矩形形状分布を取得する。選択部33が、矩形形状分布に基づいて、矩形情報56の教師データから、学習に用いるパラメータ候補を選択する。選択部33は、選択した複数個のパラメータをディープラーニングネットワーク部34に入力する。ディープラーニングネットワーク部34は、パラメータ候補を用いて検査対象物200の外観の良否を学習し、学習済みモデル44を作成する。
【0049】
なお、図8に示すように、本実施形態では、ディープラーニングネットワーク部34は、入力画像51に対して畳み込み処理を行う畳み込みネットワーク60を備えている。ディープラーニングネットワーク部34は、畳み込みネットワーク60からの層出力がそれぞれで解像度が異なるように、複数に分岐する構成になっている。図示例では、ディープラーニングネットワーク部34は、畳み込みネットワーク60からの層出力が第1畳み込み層出力61と第2畳み込み層出力62と第3畳み込み層出力63との3つに分岐する構成になっている。これにより、学習部30は、様々なサイズの欠陥部分に対してロバスト(頑強)に検出を行うことができる。なお、畳み込みネットワーク60からの層出力の分岐数は、3つ以外の数(つまり、2つ又は4つ以上)であってもよい。
【0050】
図9Aは、第1畳み込み層出力61から出力された出力画像58aの一例を示している。図9Bは、第2畳み込み層出力62から出力された出力画像58bの一例を示している。図9Cは、第3畳み込み層出力63から出力された出力画像58cの一例を示している。図9Aから図9Cに示す3つの出力画像58a,58b,58cの中で、図9Aの出力画像58aは、検出対象が最も小さい画像(つまり、畳み込み処理が一番目に進んでいる画像)になっており、縦13画素×横13画像で構成されている。この出力画像58には、複数のprior矩形である矩形情報56が示されている。なお、輪郭線54は、検出対象を囲うものである。矩形情報56のサイズと検出対象のサイズが近似しているため、好適に検出対象を検出可能である。
【0051】
また、図9Bの出力画像58bは、検出対象が二番目に小さい画像(つまり、畳み込み処理が二番目に進んでいる画像)になっており、縦26画素×横26画像で構成されている。この出力画像58には、複数のprior矩形である矩形情報56が示されている。なお、輪郭線54は、検出対象を囲うものである。矩形情報56のサイズと検出対象のサイズがやや乖離しているため、図9Aの場合と比べて検出対象の検出能力が低下する。
【0052】
また、図9Cの出力画像58cは、検出対象が最も大きい画像(つまり、畳み込み処理が一番進んでいない画像)になっており、縦52画素×横52画像で構成されている。この出力画像58には、複数のprior矩形である矩形情報56が示されている。なお、輪郭線54は、検出対象を囲うものである。矩形情報56のサイズと検出対象のサイズが乖離しているため、図9A図9Bの場合と比べて、検出対象の検出能力が低下する。
【0053】
このような学習部30は、生成部31と、矩形形状分布取得部32と、選択部33と、を備える点を特徴にしている。そして、学習部30は、学習データからクラスタリングしたものを直接に教師データとして使わずに、入力画像のサイズ等に応じて生成部31で生成された任意のサイズ及び/又は形状の矩形形状パターン群の中から選択部33で選択された複数個の矩形情報56の教師データから、学習に用いるパラメータ候補を選択して使う学習する構成になっている。
【0054】
<学習装置の動作>
以下、図10及び図11を参照して、学習装置としてのサーバ20の動作について説明する。図10及び図11は、それぞれ、学習装置としてのサーバ20の動作を示すフローチャートである。ここでは、検査対象物200の外観検査を行う場合を想定して説明する。
【0055】
図10に示すように、サーバ20は、学習時に、生成部31により、入力画像のサイズを利用して、矩形形状のサイズ及び/又は形状が偏らないように、矩形情報56に対応付けられたアノテーションデータ(矩形アノテーションデータ43a)を含む教師データから、学習に用いるパラメータ候補一覧を生成する(ステップS110)。生成部31は、入力画像のサイズを利用することで、欠陥部分を囲う矩形形状のサイズ及び/又は形状を適切に選択して生成できる。
【0056】
次に、サーバ20は、矩形形状分布取得部32により、教師データ43の矩形形状分布を取得する(ステップS120)。次に、サーバ20は、ステップS110で生成されたパラメータ候補一覧の中から、ステップS120で取得された矩形形状分布に基づいて、選択部33によりパラメータ候補を選択する(ステップS130)。次に、サーバ20は、選択したパラメータ候補を用いてディープラーニングネットワーク部34に学習させて(ステップS140)、図10の処理を終了する。これにより、サーバ20の推論部37は、このディープラーニングネットワーク部34が出力した学習済みモデル44を用いて、欠陥部分52の形状分布に対してロバストな検知が可能となる。
【0057】
なお、サーバ20は、図10に示すフローチャートの処理の代わりに、図11に示すフローチャートの処理を実行する構成にすることができる。図11に示すように、サーバ20は、学習時に、生成部31により、入力画像のサイズを利用して、矩形情報56に対応付けられたアノテーションデータ(矩形アノテーションデータ43a)を含む教師データから、学習に用いるパラメータ候補一覧を生成する(ステップS210)。生成部31は、入力画像のサイズを利用することで、欠陥部分を囲う矩形形状のサイズ及び/又は形状を適切に選択して生成できる。次に、サーバ20は、矩形形状分布取得部32により、教師データ43の矩形形状分布を取得する(ステップS220)。次に、サーバ20は、選択部33により、ステップS210で生成されたパラメータ候補一覧の中から、ステップS220で取得された矩形形状分布に基づいて、矩形形状のサイズ及び/又は形状が偏らないようにパラメータ候補一覧から、学習に用いるパラメータ候補を選択する(ステップS230)。このとき、サーバ20は、図10に示すフローチャートの処理と異なり、矩形形状のサイズ及び/又は形状が偏らないようにパラメータ候補一覧からパラメータ候補を選択する。次に、サーバ20は、選択したパラメータ候補を用いて、ディープラーニングネットワーク部34に学習させると(ステップS240)、図11の処理を終了する。これにより、サーバ20の推論部37は、このディープラーニングネットワーク部34が出力した学習済みモデル44を用いて、欠陥部分52の形状分布に対してロバストな検知が可能となる。
【0058】
<学習装置の主な特徴>
本実施形態に係る学習装置(サーバ20)は、主に以下のような特徴を有する。
(1)図2に示すように、学習装置(サーバ20)は、所定形状情報(矩形情報56)に対応付けられたアノテーションデータを含む教師データ43から、学習に用いるパラメータ候補を選択し、選択した複数個のパラメータ候補を用いて学習する装置である。学習装置は、教師データ43の形状分布を取得する分布取得部(矩形形状分布取得部32)と、この形状分布に基づいて、所定形状情報の教師データから学習に用いるパラメータ候補を選択する選択部33と、を備える。
【0059】
なお、図10に示すフローチャートの動作と図11に示すフローチャートの動作では、学習装置(サーバ20)は、事前に生成部31に教師データから学習に用いるパラメータ候補一覧を生成させ、その後に選択部33にパラメータ候補一覧からパラメータ候補を選択させる。その際に、図10に示すフローチャートの動作では、矩形形状のサイズが偏らないように生成部31が入力画像のサイズを利用して教師データ43からパラメータ候補一覧を生成し、選択部33がパラメータ候補一覧からパラメータ候補を選択することで、学習装置(サーバ20)は、実質的に選択部33に教師データ43から学習に用いるパラメータ候補を選択させる。また、図11に示すフローチャートの動作では、生成部31が入力画像のサイズを利用して教師データ43からパラメータ候補一覧を生成し、矩形形状のサイズが偏らないように選択部33がパラメータ候補一覧からパラメータ候補を選択することで、学習装置(サーバ20)は、実質的に選択部33に教師データ43から学習に用いるパラメータ候補を選択させる。
【0060】
このような本実施形態に係る学習装置(サーバ20)は、矩形情報等の所定形状情報が特定サイズ及び/又は形状に偏らないようにすることができる。これにより、学習装置(サーバ20)は、検知対象の形状分布に対してロバストな検知を可能とするように学習できる。
【0061】
(2)選択部33は、アノテーションデータに対応付けられた所定形状のサイズが偏らないように教師データから学習に用いるパラメータ候補を選択する。これにより、学習装置(サーバ20)は、検知対象の形状のサイズ分布に対してロバストな検知を可能とするように学習できる。
【0062】
(3)生成部31は、所定形状情報に対応付けられたアノテーションデータを含む教師データから、学習に用いるパラメータ候補一覧を、所定形状のサイズが偏らないように生成する。これにより、学習装置(サーバ20)は、検知対象の形状のサイズ分布に対してロバストな検知を可能とするように学習できる。
【0063】
(4)生成部31は、入力画像のサイズを利用して、所定形状のサイズが偏らないように教師データから、学習に用いるパラメータ候補一覧を生成する。これにより、学習装置(サーバ20)は、検知対象の形状のサイズ分布に対してロバストな検知を可能とするように学習できる。
【0064】
(5)選択部33は、アノテーションデータに対応付けられた形状が偏らないように選択する。これにより、学習装置(サーバ20)は、検知対象の形状の分布に対してロバストな検知を可能とするように学習できる。
【0065】
(6)生成部31は、アノテーションデータに対応付けられた外観形状が偏らないように教師データから、学習に用いるパラメータ候補一覧を生成する。これにより、学習装置(サーバ20)は、検知対象の形状の分布に対してロバストな検知を可能とするように学習できる。
【0066】
(7)生成部31は、入力画像のサイズを利用して、アノテーションデータに対応付けられた形状が偏らないように教師データから、学習に用いるパラメータ候補一覧を生成する。これにより、学習装置(サーバ20)は、検知対象の形状の分布に対してロバストな検知を可能とするように学習できる。
【0067】
(8)図1に示すように、本実施形態に係る学習装置(サーバ20)は、画像を用いた外観検査に用いられる。
【0068】
このような本実施形態に係る学習装置(サーバ20)は、外観検査分野において検査作業を自動化することができる。また、作業者の判断に依存しない検査を行うことができるため、検査精度を向上させることができる。また、汎用性の高い検査システムで多品種少量生産にも適用することができる。
【0069】
(9)図7並びに図9Aから図9Cに示すように、本実施形態に係る学習装置(サーバ20)において、所定形状情報は、矩形情報である。
【0070】
このような本実施形態に係る学習装置(サーバ20)は、デジタル画像処理にて容易に実現可能な矩形情報で検知対象を囲い、アノテーションを対応付けることができる。
【0071】
(10)図2に示すように、本実施形態に係る学習装置(サーバ20)は、推論部37をさらに備える。推論部37は、選択部が選択した教師データを学習した学習済みモデルを用いて、検知対象を推論する。
【0072】
このような本実施形態に係る学習装置(サーバ20)は、検知対象の形状分布に対してロバストな検知を可能とする。
【0073】
(11)図7に示すように、本実施形態に係る学習装置(サーバ20)は、ディープラーニングを用いたアルゴリズムで学習する学習装置であって、それぞれで解像度が異なるように層出力を複数に分岐するネットワーク部(ディープラーニングネットワーク部34)をさらに備える。選択部33は、それぞれの層出力に対応して、重複しないように所定形状情報の教師データから、学習に用いるパラメータ候補を選択する。ネットワーク部(ディープラーニングネットワーク部34)は、選択部33で選択されたパラメータ候補を用いて学習済みモデル44(図5参照)を生成する。
【0074】
このような本実施形態に係る学習装置(サーバ20)は、検知対象の形状分布に対してロバストな検知を可能とする。
【0075】
(12)図1に示すように、本実施形態に係る学習システム100は、学習装置(サーバ20)と、検査対象の外観画像を取得する外観検査システム10と、を備える。
【0076】
このような本実施形態に係る学習システム100は、外観検査分野において検査作業を自動化することができる。また、作業者の判断に依存しない検査を行うことができるため、検査精度を向上させることができる。また、汎用性の高い検査システムで多品種少量生産にも適用することができる。
【0077】
(13)図10に示すように、本実施形態に係る学習方法は、所定形状情報に対応付けられたアノテーションデータを含む教師データ43から、学習に用いるパラメータ候補を選択し、選択した複数個のパラメータ候補を用いて学習する学習方法であって、教師データ43の所定形状分布を取得する分布取得工程と、所定形状分布に基づいて所定形状情報の教師データから学習に用いるパラメータ候補を選択する選択工程と、を含む。
【0078】
このような本実施形態に係る学習装置(サーバ20)は、矩形情報等の所定形状情報が特定サイズ及び形状に偏らないようにすることができる。これにより、学習装置(サーバ20)は、欠陥部分の検出性能に影響が出ることを低減して、欠陥部分の検出性能を向上させることができる。
【0079】
(14)図2及び図10に示すように、本実施形態に係るプログラムは、コンピュータを、所定形状情報に対応付けられたアノテーションデータを含む教師データ43から、学習に用いるパラメータ候補を選択し、選択した複数個のパラメータ候補を用いて学習する学習装置(サーバ20)として機能させるためのプログラムであって、コンピュータを、教師データ43の所定形状分布を取得する手順と、所定形状分布に基づいて、所定形状情報の教師データから学習に用いるパラメータ候補を選択する手順と、を実行させるためのものである。
【0080】
このような本実施形態に係る学習装置(サーバ20)は、矩形情報等の所定形状情報が特定サイズ及び形状に偏らないようにすることができる。これにより、学習装置(サーバ20)は、欠陥部分の検出性能に影響が出ることを低減して、欠陥部分の検出性能を向上させることができる。
【0081】
以上の通り、本実施形態に係る学習装置によれば、検知対象の形状分布に対してロバストな検知を可能とするように学習することができる。
【0082】
なお、本発明は、前記した実施形態に限定されるものではなく、本発明の要旨を逸脱しない範囲で種々の変更や変形を行うことができる。
【0083】
例えば、前記した実施形態は、本発明の要旨を分かり易く説明するために詳細に説明したものである。そのため、本発明は、必ずしも説明した全ての構成要素を備えるものに限定されるものではない。また、本発明は、ある構成要素に他の構成要素を追加したり、一部の構成要素を他の構成要素に変更したりすることができる。また、本発明は、一部の構成要素を削除することもできる。
【符号の説明】
【0084】
10 外観検査システム
11 カメラ
12 照明
20 サーバ(学習装置、検査装置)
21 制御部
22 記憶部
30 学習部
31 生成部
32 矩形形状分布取得部(分布取得部)
33 選択部
34 ディープラーニングネットワーク部(ネットワーク部)
36 検査部
37 推論部
41 良品画像
42 不良品画像
43 教師データ
43a 矩形アノテーションデータ
44 学習済みモデル
45 欠陥検出エンジン(欠陥検出アルゴリズム)
49 制御プログラム
51 入力画像
52 欠陥部分
54 輪郭線
56 矩形情報(所定形状情報)
58a,58b,58c 出力画像
60 畳み込みネットワーク
61 第1畳み込み層出力(層出力)
62 第2畳み込み層出力(層出力)
63 第3畳み込み層出力(層出力)
100 学習システム
200 検査対象物
図1
図2
図3
図4A
図4B
図5
図6
図7
図8
図9A
図9B
図9C
図10
図11