IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立化成株式会社の特許一覧

特許7563387機械学習装置、方法、プログラム、およびシステム
<>
  • 特許-機械学習装置、方法、プログラム、およびシステム 図1
  • 特許-機械学習装置、方法、プログラム、およびシステム 図2
  • 特許-機械学習装置、方法、プログラム、およびシステム 図3
  • 特許-機械学習装置、方法、プログラム、およびシステム 図4
  • 特許-機械学習装置、方法、プログラム、およびシステム 図5
  • 特許-機械学習装置、方法、プログラム、およびシステム 図6
  • 特許-機械学習装置、方法、プログラム、およびシステム 図7
  • 特許-機械学習装置、方法、プログラム、およびシステム 図8
  • 特許-機械学習装置、方法、プログラム、およびシステム 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-30
(45)【発行日】2024-10-08
(54)【発明の名称】機械学習装置、方法、プログラム、およびシステム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20241001BHJP
   G06V 10/778 20220101ALI20241001BHJP
   G06V 20/69 20220101ALI20241001BHJP
【FI】
G06N20/00 130
G06V10/778
G06V20/69
【請求項の数】 8
(21)【出願番号】P 2021558339
(86)(22)【出願日】2020-11-12
(86)【国際出願番号】 JP2020042269
(87)【国際公開番号】W WO2021100606
(87)【国際公開日】2021-05-27
【審査請求日】2023-10-02
(31)【優先権主張番号】P 2019208576
(32)【優先日】2019-11-19
(33)【優先権主張国・地域又は機関】JP
(73)【特許権者】
【識別番号】000004455
【氏名又は名称】株式会社レゾナック
(74)【代理人】
【識別番号】100107766
【弁理士】
【氏名又は名称】伊東 忠重
(74)【代理人】
【識別番号】100108187
【弁理士】
【氏名又は名称】横山 淳一
(74)【代理人】
【識別番号】100070150
【弁理士】
【氏名又は名称】伊東 忠彦
(72)【発明者】
【氏名】奥野 好成
(72)【発明者】
【氏名】武田 領子
(72)【発明者】
【氏名】渋谷 純一
(72)【発明者】
【氏名】中尾 悠基
(72)【発明者】
【氏名】小川 兼司
【審査官】真木 健彦
(56)【参考文献】
【文献】国際公開第2018/153469(WO,A1)
【文献】特表2019-529882(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
G06T 7/00
G06V 10/778
G06V 20/69
(57)【特許請求の範囲】
【請求項1】
第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類する第一分類部と、
前記分類可能データに注釈を付与する第一付与部と、
第二学習モデルに基づいて、前記分類不明データを分類する第二分類部と、
前記分類不明データに付与すべき注釈を取得する注釈取得部と、
前記分類不明データに注釈を付与する第二付与部と、
前記第二分類部が分類した結果および前記注釈取得部が取得した注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新する第二学習モデル更新部と
前記第二分類部が分類した結果に少なくとも基づいて前記注釈を付与された前記分類不明データに基づいて、前記第一学習モデルを更新する第一学習モデル更新部と
を備えた、機械学習装置。
【請求項2】
前記注釈は、前記データを2つにクラス分類するための注釈である、請求項に記載の機械学習装置。
【請求項3】
前記データは、粒子画像であり、
前記注釈は、前記粒子画像に含まれる粒子の形状が所定の基準を満たしている粒子であることを示す注釈、または、前記粒子画像に含まれる粒子の形状が所定の基準を満たしていない粒子であることを示す注釈である、請求項1または2に記載の機械学習装置。
【請求項4】
前記注釈取得部は、前記第二分類部が分類したOK粒子画像である確度が所定の値未満であり、かつ、NG粒子画像である確度が所定の値未満である分類不明データに付与すべき注釈のみを取得する、請求項1からのいずれか一項に記載の機械学習装置。
【請求項5】
前記データは、対象物の画像の全粒子画像であり、
前記第一付与部は、前記全粒子画像に対するOK粒子画像の割合と、前記全粒子画像に対するNG粒子画像の割合と、前記全粒子画像に対する前記分類不明データの割合と、を通知する、請求項1からのいずれか一項に記載の機械学習装置。
【請求項6】
第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類するステップと、
前記分類可能データに注釈を付与するステップと、
第二学習モデルに基づいて、前記分類不明データを分類するステップと、
前記分類不明データに付与すべき注釈を取得するステップと、
前記分類不明データに注釈を付与するステップと、
前記分類不明データの分類の結果および前記分類不明データに付与すべき注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新するステップと
前記第二学習モデルに基づいて分類した結果に少なくとも基づいて前記注釈を付与された前記分類不明データに基づいて、前記第一学習モデルを更新するステップと
を含む方法。
【請求項7】
コンピュータを
第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類する第一分類部、
前記分類可能データに注釈を付与する第一付与部、
第二学習モデルに基づいて、前記分類不明データを分類する第二分類部、
前記分類不明データに付与すべき注釈を取得する注釈取得部、
前記分類不明データに注釈を付与する第二付与部、
前記第二分類部が分類した結果および前記注釈取得部が取得した注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新する第二学習モデル更新部
前記第二分類部が分類した結果に少なくとも基づいて前記注釈を付与された前記分類不明データに基づいて、前記第一学習モデルを更新する第一学習モデル更新部
として機能させるためのプログラム。
【請求項8】
機械学習装置とユーザ端末とを含むシステムであって、
第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類する第一分類部と、
前記分類可能データに注釈を付与する第一付与部と、
第二学習モデルに基づいて、前記分類不明データを分類する第二分類部と、
前記分類不明データに付与すべき注釈を取得する注釈取得部と、
前記分類不明データに注釈を付与する第二付与部と、
前記第二分類部が分類した結果および前記注釈取得部が取得した注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新する第二学習モデル更新部と
前記第二分類部が分類した結果に少なくとも基づいて前記注釈を付与された前記分類不明データに基づいて、前記第一学習モデルを更新する第一学習モデル更新部と
を備えた、システム。
【発明の詳細な説明】
【技術分野】
【0001】
本願は、日本特許庁に2019年11月19日に出願された基礎出願2019-208576号の優先権を主張するものであり、その全内容を参照によりここに援用する。
【0002】
本発明は、機械学習装置、方法、プログラム、およびシステムに関する。
【背景技術】
【0003】
従来、機械学習の教師あり学習では、大量の教師データが用いられている。例えば、データサイエンティストとも呼ばれる者が、データに注釈(ラベルともいう)を付与すること(アノテーションともいう)によって教師データを作成し、それらの教師データを用いて機械学習が行われ、学習モデルが生成される。教師データが不適切であると学習モデルの精度が低くなるため、適切な教師データを作成することが望まれている。
【0004】
機械学習の手法の一つであるクラス分類では、入力データを2つに分類(二項分類、二値分類、2クラス分類ともいう)、あるいは、3つ以上に分類(多クラス分類ともいう)する。このようなクラス分類の教師データを作成するためのデータには、どの注釈が付与されるべきかを高い確度で判断できるデータと、どの注釈が付与されるべきかを低い確度でしか判断できないデータと、がある。
【0005】
例えば、特許文献1では、教師データ作成装置が、正評価、負評価及び無視評価の何れか1つをラベルの評価としてラベルごとに取得して、教師データを作成している。そして、学習装置が、正評価又は負評価のラベルの認識スコアと正評価又は負評価の正解スコアとが近づくように中間層の重み係数を調整し、かつ、無視評価のラベルの認識スコアが中間層の重み係数の調整に影響を与えないようにしている(特許文献1の段落[0010])。
【先行技術文献】
【特許文献】
【0006】
【文献】特開2018-18537号公報
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、特許文献1では、人であるアノテータが、全てのラベルに評価を指定する操作をしなければならず、大量の教師データを作成するためには多くの人手を要する。そのため、機械学習の精度を向上することが困難であった。
【0008】
そこで、本発明の一実施形態では、機械学習の精度を向上することを目的とする。
【課題を解決するための手段】
【0009】
本発明は、以下の示す構成を備える。
[1]第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類する第一分類部と、
前記分類可能データに注釈を付与する第一付与部と、
第二学習モデルに基づいて、前記分類不明データを分類する第二分類部と、
前記分類不明データに付与すべき注釈を取得する注釈取得部と、
前記分類不明データに注釈を付与する第二付与部と、
前記第二分類部が分類した結果および前記注釈取得部が取得した注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新する第二学習モデル更新部と
を備えた、機械学習装置。
[2]前記第二分類部が分類した結果に少なくとも基づいて前記注釈を付与された前記分類不明データに基づいて、前記第一学習モデルを更新する第一学習モデル更新部、をさらに備えた[1]に記載の機械学習装置。
[3]前記注釈は、前記データを2つにクラス分類するための注釈である、[1]または[2]に記載の機械学習装置。
[4]前記データは、粒子画像であり、
前記注釈は、前記粒子画像に含まれる粒子の形状が所定の基準を満たしている粒子であることを示す注釈、または、前記粒子画像に含まれる粒子の形状が所定の基準を満たしていない粒子であることを示す注釈である、[1]から[3]のいずれかに記載の機械学習装置。
[5]前記注釈取得部は、前記第二分類部が分類したOK粒子画像である確度が所定の値未満であり、かつ、NG粒子画像である確度が所定の値未満である分類不明データに付与すべき注釈のみを取得する、[1]から[4]のいずれかに記載の機械学習装置。
[6]前記データは、対象物の画像の全粒子画像であり、
前記第一付与部は、前記全粒子画像に対するOK粒子画像の割合と、前記全粒子画像に対するNG粒子画像の割合と、前記全粒子画像に対する前記分類不明データの割合と、を通知する、[1]から[5]のいずれかに記載の機械学習装置。
[7]第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類するステップと、
前記分類可能データに注釈を付与するステップと、
第二学習モデルに基づいて、前記分類不明データを分類するステップと、
前記分類不明データに付与すべき注釈を取得するステップと、
前記分類不明データに注釈を付与するステップと、
前記分類不明データの分類の結果および前記分類不明データに付与すべき注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新するステップと
を含む方法。
[8]コンピュータを
第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類する第一分類部、
前記分類可能データに注釈を付与する第一付与部、
第二学習モデルに基づいて、前記分類不明データを分類する第二分類部、
前記分類不明データに付与すべき注釈を取得する注釈取得部、
前記分類不明データに注釈を付与する第二付与部、
前記第二分類部が分類した結果および前記注釈取得部が取得した注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新する第二学習モデル更新部
として機能させるためのプログラム。
[9]機械学習装置とユーザ端末とを含むシステムであって、
第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類する第一分類部と、
前記分類可能データに注釈を付与する第一付与部と、
第二学習モデルに基づいて、前記分類不明データを分類する第二分類部と、
前記分類不明データに付与すべき注釈を取得する注釈取得部と、
前記分類不明データに注釈を付与する第二付与部と、
前記第二分類部が分類した結果および前記注釈取得部が取得した注釈に基づいて前記注釈を付与された前記分類不明データに基づいて、前記第二学習モデルを更新する第二学習モデル更新部と
を備えた、システム。
【発明の効果】
【0010】
本発明の一実施形態では、機械学習の精度を向上することができる。
【図面の簡単な説明】
【0011】
図1】本発明の一実施形態に係る機械学習装置を含む全体のシステム構成を示す図である。
図2】本発明の一実施形態に係る機械学習装置のハードウェア構成を示す図である。
図3】本発明の一実施形態に係る機械学習装置の機能ブロックを示す図である。
図4】本発明の一実施形態に係る対象物画像格納部に格納されている対象物の画像の一例である。
図5】本発明の一実施形態に係る粒子画像格納部に格納されている粒子画像の一例である。
図6】本発明の一実施形態に係るデータの流れを示すデータフロー図である。
図7】本発明の一実施形態に係る教師データ作成処理の流れを示すフローチャートである。
図8】本発明の一実施形態に係る第一学習モデルの更新処理の流れを示すフローチャートである。
図9】本発明の一実施形態に係るデータの分類結果の推論処理の流れを示すフローチャートである。
【発明を実施するための形態】
【0012】
以下、各実施形態について添付の図面を参照しながら説明する。なお、本明細書および図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複した説明を省略する。
【0013】
なお、本明細書では、教師データとして画像データを用いる場合を説明するが、本発明は、テキストデータ、音声データ等の任意のデータを用いる場合に適用することができる。
【0014】
また、本明細書では、教師データとして、酸化アルミニウム粉末等に含まれる酸化アルミニウム粒子の粒子画像を用いる場合を説明するが、本発明は、任意の物質の粒子の粒子画像を用いる場合に適用することができる。また、本明細書では、データ(粒子画像)を2つに分類する場合(二項分類、二値分類、2クラス分類ともいう)を説明するが、本発明は、データ(粒子画像)を3つ以上に分類する場合(多クラス分類ともいう)にも適用することができる。また、本明細書では、教師データとして、光学顕微鏡により得られた画像を用いる場合を説明するが、本発明は、光学顕微鏡のほか走査型電子顕微鏡(SEM)等の任意の機器により得られた画像を用いる場合に適用することができる。
【0015】
以下、教師データを作成する実施形態(下記の<実施形態1><実施形態2>)と、入力データの分類結果を推論する実施形態(下記の<実施形態3>)と、に分けて説明する。
【0016】
<実施形態1>
<システム構成>
図1は、本発明の一実施形態に係る機械学習装置102を含む全体のシステム構成を示す図である。機械学習装置102は、品質検査を行うためのシステム(品質検査システム100)にて用いられうる。品質検査システム100は、光学顕微鏡101、機械学習装置102、ユーザ端末103を含むことができる。機械学習装置102は、機械学習装置102に接続された光学顕微鏡101から、光学顕微鏡が撮影した画像を取得する。また、機械学習装置102は、任意のネットワーク104を介してユーザ端末103とデータを送受信する。なお、機械学習装置102と光学顕微鏡101またはユーザ端末103とのデータの送受信は、後述する半導体メモリ等の記憶媒体を介して行われてもよい。以下、それぞれについて説明する。
【0017】
光学顕微鏡101は、対象物(例えば、酸化アルミニウム粉末等に含まれる酸化アルミニウム粒子)を撮影する。光学顕微鏡101は、デジタルカメラ等の撮影装置および対象物を撮影した画像を保存する記憶装置を備えることができる。また、光学顕微鏡101は、撮影して得た対象物の画像を、光学顕微鏡101に接続された機械学習装置102へ送ることができる。光学顕微鏡101が有する顕微鏡は、反射型顕微鏡や透過型顕微鏡であってもよい。また、光学顕微鏡101は、超高圧水銀灯、キセノンランプ、三原色を含む各色LED、紫外線LED、レーザー光等の光源を備えてもよく、また、画像の観察方法としては、明視野観察法、暗視野観察法、位相差観察法、微分干渉観察法、偏光観察法、蛍光観察法等の観察方法を用いることができる。
【0018】
機械学習装置102は、データに注釈(ラベルともいう)を付与すること(アノテーションともいう)によって教師データを作成するための装置である。具体的には、機械学習装置102は、第一学習モデルに基づいて、データを分類可能データと分類不明データとに分類する。また、機械学習装置102は、第二学習モデルに基づいて、分類不明データを分類する。また、機械学習装置102は、ユーザ端末103からの修正を反映して、第二学習モデルを更新する。機械学習装置102は、例えば、1または複数のコンピュータからなる。後段で、図3を参照しながら、機械学習装置102について詳細に説明する。
【0019】
ユーザ端末103は、機械学習装置102の第二学習モデルに基づく分類を修正する者が利用する端末である。具体的には、ユーザ端末103は、機械学習装置102から、分類不明データを受信して、ユーザ端末103上またはユーザ端末103に接続された表示装置(図示せず)上に表示する。また、ユーザ端末103は、機械学習装置102へ、ユーザ端末103に入力された注釈のデータを送信する。ユーザ端末103は、例えば、パーソナルコンピュータなどのコンピュータである。
【0020】
なお、本明細書では、機械学習装置102とユーザ端末103とを別々のコンピュータとして説明するが、機械学習装置102とユーザ端末103とを1つのコンピュータで実装するようにしてもよい。また、機械学習装置102がユーザ端末103の一部の機能を有するようにしてもよいし、ユーザ端末103が機械学習装置102の一部の機能を有するようにしてもよい。
【0021】
<機械学習装置102のハードウェア構成>
図2は、本発明の一実施形態に係る機械学習装置102のハードウェア構成の例を示す図である。機械学習装置102は、CPU(Central Processing Unit)1、ROM(Read Only Memory)2、RAM(Random Access Memory)3を有する。CPU1、ROM2、RAM3は、いわゆるコンピュータを形成する。
【0022】
また、機械学習装置102は、さらに、GPU(Graphics Processing Unit)4、補助記憶装置5、I/F(Interface)装置6、ドライブ装置7を有することができる。なお、機械学習装置102の各ハードウェアは、バス8を介して相互に接続されている。
【0023】
CPU1は、補助記憶装置5にインストールされている各種プログラムを実行する演算デバイスである。
【0024】
ROM2は、不揮発性メモリである。ROM2は、補助記憶装置5にインストールされている各種プログラムをCPU1が実行するために必要な各種プログラム、データ等を格納する主記憶デバイスとして機能する。具体的には、ROM2はBIOS(Basic Input/Output System)やEFI(Extensible Firmware Interface)等のブートプログラム等を格納する、主記憶デバイスとして機能する。
【0025】
RAM3は、DRAM(Dynamic Random Access Memory)やSRAM(Static Random Access Memory)等の揮発性メモリである。RAM3は、補助記憶装置5にインストールされている各種プログラムがCPU1によって実行される際に展開される作業領域を提供する、主記憶デバイスとして機能する。
【0026】
GPU4は、画像処理に特化した演算デバイスである。
【0027】
補助記憶装置5は、各種プログラムや、各種プログラムが実行される際に用いられる情報を格納する補助記憶デバイスである。
【0028】
I/F装置6は、光学顕微鏡101、ユーザ端末103と通信を行うための通信デバイスである。
【0029】
ドライブ装置7は記憶媒体9をセットするためのデバイスである。ここでいう記憶媒体9には、CD-ROM、フレキシブルディスク、光磁気ディスク等のように情報を光学的、電気的あるいは磁気的に記録する媒体が含まれる。また、記憶媒体9には、ROM、フラッシュメモリ等のように情報を電気的に記録する半導体メモリ等が含まれていてもよい。
【0030】
なお、補助記憶装置5にインストールされる各種プログラムは、例えば、配布された記憶媒体9がドライブ装置7にセットされ、該記憶媒体9に記録された各種プログラムがドライブ装置7により読み出されることでインストールされる。あるいは、補助記憶装置5にインストールされる各種プログラムは、I/F装置6を介して、ネットワークよりダウンロードされることでインストールされてもよい。
【0031】
<機械学習装置102の機能ブロック>
図3は、本発明の一実施形態に係る機械学習装置102の機能ブロックを示す図である。機械学習装置102は、対象物画像取得部301、対象物画像格納部302、粒子画像抽出部303、粒子画像格納部304、第一分類部305、第一付与部306、第一学習モデル格納部308、第二分類部309、第二付与部310、第二学習モデル更新部311、第二学習モデル格納部312、注釈取得部313、分類不明データ格納部314を含む。機械学習装置102は、さらに第一学習モデル更新部307、を含むことができる。また、機械学習装置102は、プログラムを実行することで、対象物画像取得部301、粒子画像抽出部303、第一分類部305、第一付与部306、第二分類部309、第二付与部310、第二学習モデル更新部311、注釈取得部313として機能する。機械学習装置102は、プログラムを実行することで、さらに第一学習モデル更新部307として機能することができる。以下、それぞれについて説明する。
【0032】
対象物画像取得部301は、光学顕微鏡101等が撮影した対象物の画像を取得する。また、対象物画像取得部301は、取得した対象物の画像を対象物画像格納部302に記憶する。
【0033】
対象物画像格納部302には、対象物画像取得部301が取得した対象物の画像が格納されている。以下、図4を参照しながら、対象物画像格納部302に格納されている対象物の画像について説明する。
【0034】
図4は、本発明の一実施形態に係る対象物画像格納部302に格納されている対象物の画像400の一例である。例えば、対象物の画像400は、酸化アルミニウム粉末等に含まれる酸化アルミニウム粒子が撮影された画像である。図4に示されるように、対象物の画像400には、複数の粒子の画像が含まれている。
【0035】
図3の説明に戻る。粒子画像抽出部303は、対象物画像格納部302内の対象物の画像から、粒子の画像を抽出する。また、粒子画像抽出部303は、抽出した粒子の画像を粒子画像格納部304に記憶する。
【0036】
例えば、粒子画像抽出部303は、対象物の画像を2値化して、マスク画像を生成する。また、粒子画像抽出部303は、マスク画像に基づいて、対象物の画像から周囲に他の粒子がない粒子の画像を抽出(クロップ、切り抜きともいう)する。
【0037】
なお、以下で説明するように、本発明の一実施形態では、対象物の画像に含まれる粒子の画像(以下、粒子画像ともいう)が、教師データを作成するためのデータとして用いられる。つまり、粒子画像に注釈が付与されることによって、教師データが作成される。また、以下では、データ(粒子画像)をOK粒子画像とNG粒子画像との2つに分類する場合(二項分類、二値分類、2クラス分類ともいう)を説明するが、本発明は、データ(粒子画像)を3つ以上に分類する場合(多クラス分類ともいう)にも適用することができる。
【0038】
粒子画像格納部304には、粒子画像抽出部303が抽出した粒子画像が格納されている。以下、図5を参照しながら、粒子画像格納部304に格納されている粒子画像について説明する。
【0039】
図5は、本発明の一実施形態に係る粒子画像格納部304に格納されている粒子画像500の一例である。後段で詳細に説明するように、粒子画像500には、第一付与部306が注釈を付与することができる分類可能データ(OK粒子画像501、NG粒子画像503)と、第一付与部306が注釈を付与することができない分類不明データ502と、が含まれている。
【0040】
ここで、OK粒子画像およびNG粒子画像について説明する。本明細書において、粒子画像に含まれる粒子の形状が所定の基準を満たしている粒子(以下、OK粒子ともいう)の粒子画像を、OK粒子画像と呼ぶ。また、粒子画像に含まれる粒子の形状が所定の基準を満たしていない粒子(以下、NG粒子ともいう)の粒子画像を、NG粒子画像と呼ぶ。
【0041】
例えば、OK粒子画像は、粒子の真円度が閾値以上である粒子が含まれる画像である。ここで真円度とは、JIS B0621-1984「幾何偏差の定義および表示」において定義されているとおり、「円形形体の幾何学的に正しい円からの狂いの大きさ」をいう。例えば、NG粒子画像は、粒子の真円度が閾値よりも低い粒子が含まれる画像である。なお、粒子の形状が満たすべき基準は真円度に限らず、粒子の形状が楕円等である場合も含んでよく、粒子の面積、粒子の長径、短径、円相当径、フェレ径等の長さ、または粒子の周囲長などの特徴量で構成した基準を用いてもよい。
【0042】
図3の説明に戻る。第一分類部305は、データ(例えば、粒子画像)を分類可能データ(例えば、OK粒子画像、NG粒子画像)と分類不明データとに分類する。具体的には、第一分類部305は、第一学習モデル格納部308に格納されている第一学習モデルを用いて、粒子画像がOK粒子画像である確度(確信度、信頼度、確率ともいう)と、NG粒子画像である確度と、を出力する。また、第一分類部305は、粒子画像がOK粒子画像である確度が所定の値以上であると、その粒子画像をOK粒子画像に分類する。また、第一分類部305は、粒子画像がNG粒子画像である確度が所定の値以上であると、その粒子画像をNG粒子画像に分類する。また、第一分類部305は、OK粒子画像にもNG粒子画像にも該当しない粒子画像(つまり、OK粒子画像である確度が所定の値未満であり、かつ、NG粒子画像である確度が所定の値未満である)を、分類不明データに分類する。
【0043】
第一学習モデル格納部308には、第一学習モデルが格納されている。第一学習モデルは、機械学習により生成されたクラス分類のためのモデルである。例えば、第一学習モデルは、粒子画像が入力されると、その粒子画像がOK粒子画像である確度と、NG粒子画像である確度と、を出力するためのモデルである。
【0044】
第一付与部306は、第一分類部305が分類した分類可能データ(例えば、OK粒子画像、NG粒子画像)に注釈を付与して、教師データを作成する。具体的には、第一付与部306は、第一分類部305が分類したOK粒子画像と、注釈(つまり、粒子画像に含まれる粒子はOK粒子であるという注釈)と、を紐付けて、粒子画像格納部304に記憶する。また、第一付与部306は、第一分類部305が分類したNG粒子画像と、注釈(つまり、粒子画像に含まれる粒子はNG粒子であるという注釈)と、を紐付けて、粒子画像格納部304に記憶する。
【0045】
なお、第一付与部306は、対象物画像格納部302内の各対象物の画像に、その対象物の画像の全粒子画像に対するOK粒子画像の割合と、全粒子画像に対するNG粒子画像の割合と、全粒子画像に対する分類不明データの割合と、を紐付けて記憶する構成とすることもできる。また、第一付与部306は、ユーザ端末103等の任意の端末に対して、各対象物の画像の、その対象物の画像の全粒子画像に対するOK粒子画像の割合と、全粒子画像に対するNG粒子画像の割合と、全粒子画像に対する分類不明データの割合と、を通知する構成とすることもできる。
【0046】
第一学習モデル更新部307については<実施形態2>にて説明する。
【0047】
第二分類部309は、第一分類部305が分類した分類不明データを分類する。
【0048】
第二学習モデル格納部312には、第二学習モデルが格納されている。第二学習モデルは、機械学習により生成されたクラス分類のためのモデルである。
【0049】
以下、分類不明データを<<OK粒子画像とNG粒子画像とに分類>>する場合と、<<OK粒子画像とNG粒子画像と分類不明データとに分類>>する場合とに分けて説明する。
【0050】
<<OK粒子画像とNG粒子画像とに分類>>
第二分類部309は、第二学習モデル格納部312に格納されている第二学習モデルを用いて、分類不明データをOK粒子画像とNG粒子画像とに分類する。
【0051】
<<OK粒子画像とNG粒子画像とに分類>>する場合、第二学習モデルは、分類不明データが入力されると、その分類不明データがOK粒子画像であるかまたはNG粒子画像であるかを出力するためのモデルである。
【0052】
<<OK粒子画像とNG粒子画像と分類不明データとに分類>>
第二分類部309は、第二学習モデル格納部312に格納されている第二学習モデルを用いて、分類不明データをOK粒子画像とNG粒子画像と分類不明データとに分類する。具体的には、第二分類部309は、第二学習モデルを用いて、分類不明データがOK粒子画像である確度(確信度、信頼度、確率ともいう)と、NG粒子画像である確度と、を出力する。また、第二分類部309は、分類不明データがOK粒子画像である確度が所定の値以上であると、その分類不明データをOK粒子画像に分類する。また、第二分類部309は、分類不明データがNG粒子画像である確度が所定の値以上であると、その分類不明データをNG粒子画像に分類する。また、第二分類部309は、OK粒子画像にもNG粒子画像にも該当しない分類不明データ(つまり、OK粒子画像である確度が所定の値未満であり、かつ、NG粒子画像である確度が所定の値未満である)を、分類不明データに分類する。
【0053】
<<OK粒子画像とNG粒子画像と分類不明データとに分類>>する場合、第二学習モデルは、分類不明データが入力されると、その分類不明データがOK粒子画像である確度と、NG粒子画像である確度と、を出力するためのモデルである。
【0054】
注釈取得部313は、分類不明データに付与すべき注釈のデータを取得する。具体的には、注釈取得部313は、ユーザ端末103へ、分類不明データ(例えば、粒子画像)を送信する。なお、注釈取得部313は、ユーザ端末103へ、分類不明データ(例えば、粒子画像)とともに、第二分類部309が分類した分類結果の情報(例えば、OK粒子画像であるかまたはNG粒子画像であるか、確度など)を送信する構成とすることもできる。また、注釈取得部313は、ユーザ端末103から、ユーザ端末103に入力された注釈のデータを受信する。ユーザ端末103を操作する者は、分類不明データ(例えば、粒子画像)を目視して、分類不明データに付与すべき注釈を判断する。
【0055】
なお、上記の分類不明データを<<OK粒子画像とNG粒子画像と分類不明データとに分類>>する場合、注釈取得部313は、OK粒子画像である確度が所定の値未満であり、かつ、NG粒子画像である確度が所定の値未満である分類不明データ、に付与すべき注釈のデータのみを取得する構成とすることもできる。
【0056】
第二付与部310は、第二分類部309が分類した分類結果(例えば、OK粒子画像であるかまたはNG粒子画像であるか)および注釈取得部313が取得した注釈に基づいて、分類不明データに注釈を付与する。具体的には、第二付与部310は、第二分類部309が分類した分類結果と注釈取得部313が取得した注釈とが同一の場合には、その注釈を分類不明データに付与する。また、第二付与部310は、第二分類部309が分類した分類結果と注釈取得部313が取得した注釈とが異なる場合には、注釈取得部313が取得した注釈を分類不明データに付与する。また、第二付与部310は、分類不明データと、付与した注釈と、を紐付けて、分類不明データ格納部314に記憶する。
【0057】
分類不明データ格納部314には、分類不明データと、第二付与部310が付与した注釈と、が紐付けられて格納されている。
【0058】
第二学習モデル更新部311は、第二付与部310が注釈を付与した分類不明データに基づいて、第二学習モデル格納部312内の第二学習モデルを更新する。具体的には、第二学習モデル更新部311は、第二付与部310が注釈を付与した分類不明データを教師データとして機械学習することによって、第二学習モデルを更新する。
【0059】
このように、<実施形態1>では、分類不明データを分類するための第二学習モデルが更新されるので、分類不明データをより正確に分類できるようになる。また、上記の分類不明データを<<OK粒子画像とNG粒子画像と分類不明データとに分類>>する場合、注釈取得部313が、OK粒子画像である確度が所定の値未満であり、かつ、NG粒子画像である確度が所定の値未満である分類不明データ、に付与すべき注釈のデータのみを取得する構成とすることによって、第二学習モデルが更新されるにつれて第二学習モデルの学習精度が向上して分類不可能データが減るので、人が目視して付与すべき注釈を判断しなければならないデータを減らすことができる。
【0060】
<実施形態2>
以下、<実施形態2>について説明する。なお、<実施形態1>と異なる点を主に説明する。
【0061】
<実施形態2>では、機械学習装置102は、図3の第一学習モデル更新部307を備える。以下、第一学習モデル更新部307について説明する。
【0062】
第一学習モデル更新部307は、第二付与部310が注釈を付与した分類不明データに基づいて、第一学習モデル格納部308内の第一学習モデルを更新する。なお、第一学習モデル更新部307は、ユーザ端末103等の任意の端末から第一学習モデルを更新するよう指示されると、第一学習モデルを更新する構成とすることもできる。
【0063】
具体的には、第一学習モデル更新部307は、第二付与部310が注釈を付与した分類不明データを取得して、粒子画像格納部304に追加する。また、第一学習モデル更新部307は、粒子画像格納部304内の、第一付与部306が注釈を付与したデータ(例えば、OK粒子画像およびNG粒子画像)および第二付与部310が注釈を付与した分類不明データを教師データとして機械学習することによって、第一学習モデルを更新する。
【0064】
<<第一学習モデルの更新の自動化>>
第一学習モデル更新部307は、人の手を介さずに、第一学習モデルを更新する構成とすることもできる。具体的には、第二付与部310が、第二分類部309がOK粒子画像である確度が所定の値以上であると判断した分類不明データ、および、第二分類部309がNG粒子画像である確度が所定の値以上であると判断した分類不明データ(つまり、分類不可能データ以外のデータ)のみに基づいて、分類不明データに注釈を付与する(つまり、注釈取得部313が取得する注釈は用いられない)。第一学習モデル更新部307は、粒子画像格納部304内の、第一付与部306が注釈を付与したデータ(例えば、OK粒子画像およびNG粒子画像)と、第二付与部310が注釈を付与した、分類不可能データ以外のデータと、を教師データとして機械学習することによって、第一学習モデルを更新する。
【0065】
<<分類不明データの割合の表示>>
<実施形態1>で説明したように、第一付与部306は、対象物画像格納部302内の各対象物の画像に、その対象物の画像の全粒子画像に対するOK粒子画像の割合と、全粒子画像に対するNG粒子画像の割合と、全粒子画像に対する分類不明データの割合と、を紐付けて記憶する構成とすることもできる。また、第一付与部306は、ユーザ端末103等の任意の端末に対して、各対象物の画像の、その対象物の画像の全粒子画像に対するOK粒子画像の割合と、全粒子画像に対するNG粒子画像の割合と、全粒子画像に対する分類不明データの割合と、を通知する構成とすることもできる。そのため、第一学習モデルが更新されるにつれて分類不明データが減少することが、ユーザ端末103等の任意の端末に提示される。
【0066】
このように、<実施形態2>では、データ(例えば、粒子画像)を分類するための第一学習モデルが更新されるので、データ(例えば、粒子画像)をより正確に分類できるようになる。また、第一学習モデルが更新されるにつれて分類不明データが減るので、人が目視して付与すべき注釈を判断しなければならないデータを減らすことができる。
【0067】
<実施形態3>
以下、<実施形態3>について説明する。なお、<実施形態1><実施形態2>と異なる点を主に説明する。
【0068】
<実施形態3>では、機械学習装置102は、入力データの分類結果を推論する。以下、第一学習モデルのみによる分類と、第一学習モデルと第二学習モデルとの二段階での分類と、に分けて説明する。
【0069】
<<第一学習モデルのみによる分類>>
第一分類部305は、入力データ(例えば、粒子画像)を取得して、第一学習モデル格納部308内の第一学習モデルを用いて、分類可能データ(例えば、OK粒子画像、NG粒子画像)と、分類不明データと、に分類する。第一分類部305は、ユーザ端末103等の任意の端末に対して、分類結果を通知する。
【0070】
<<第一学習モデルと第二学習モデルとの二段階での分類>>
第一分類部305は、入力データ(例えば、粒子画像)を取得して、第一学習モデル格納部308内の第一学習モデルを用いて、分類可能データ(例えば、OK粒子画像、NG粒子画像)と、分類不明データと、に分類する。第二分類部309は、分類不明データを、(例えば、OK粒子画像とNG粒子画像とに)分類する。第二分類部309は、ユーザ端末103等の任意の端末に対して、分類結果を通知する。通知される分類結果は、二段階で分類した結果のみでもよく、第一分類部305と第二分類部309の分類の結果がそれぞれ示されてもよい。
【0071】
<データフロー>
図6は、本発明の一実施形態に係るデータの流れを示すデータフロー図である。図6に示されるように、データ(例えば、粒子画像)が、第一学習モデルによって、分類可能データ(例えば、OK粒子画像、NG粒子画像)と、分類不明データと、に分類される。その後、分類不明データが、第二学習モデルによって、(例えば、OK粒子画像とNG粒子画像とに)分類される。そして、第二学習モデルによる分類結果が人によって修正される。
【0072】
<処理方法>
以下、図7~9を参照しながら、各処理について説明する。
【0073】
図7は、本発明の一実施形態に係る教師データ作成処理の流れを示すフローチャートである。
【0074】
ステップ11(S11)において、対象物画像取得部301は、光学顕微鏡101等が撮影した対象物の画像を取得する。
【0075】
ステップ12(S12)において、粒子画像抽出部303は、S11で取得された対象物の画像から、粒子画像を抽出する。
【0076】
ステップ13(S13)において、第一分類部305は、データ(例えば、S12で抽出された粒子画像)を分類可能データ(例えば、OK粒子画像、NG粒子画像)と分類不明データとに分類する。
【0077】
ステップ14(S14)において、第一付与部306は、S13で分類された分類可能データ(例えば、OK粒子画像、NG粒子画像)に注釈を付与して、教師データを作成する。
【0078】
ステップ15(S15)において、第二分類部309は、S13で分類された分類不明データを分類する。
【0079】
ステップ16(S16)において、第二付与部310は、S15で分類された分類結果(例えば、OK粒子画像であるかまたはNG粒子画像であるか)および注釈取得部313が取得した注釈に基づいて、分類不明データに注釈を付与する。
【0080】
ステップ17(S17)において、第二学習モデル更新部311は、S16で注釈が付与された分類不明データに基づいて、第二学習モデル格納部312内の第二学習モデルを更新する。
【0081】
図8は、本発明の一実施形態に係る第一学習モデルの更新処理の流れを示すフローチャートである。
【0082】
ステップ21(S21)において、第一学習モデル更新部307は、第二付与部310が注釈を付与した分類不明データを取得する。
【0083】
ステップ22(S22)において、第一学習モデル更新部307は、S21で取得した分類不明データを、粒子画像格納部304に追加する。
【0084】
ステップ23(S23)において、第一学習モデル更新部307は、粒子画像格納部304内の、第一付与部306が注釈を付与したデータ(例えば、OK粒子画像およびNG粒子画像)およびS22で追加した分類不明データを教師データとして機械学習することによって、第一学習モデルを更新する。
【0085】
図9は、本発明の一実施形態に係るデータの分類結果の推論処理の流れを示すフローチャートである。
【0086】
ステップ31(S31)において、第一分類部305は、入力データ(例えば、粒子画像)を取得する。
【0087】
ステップ32(S32)において、第一分類部305は、S31で取得したデータを、第一学習モデル格納部308内の第一学習モデルを用いて、分類可能データ(例えば、OK粒子画像、NG粒子画像)と、分類不明データと、に分類する。
【0088】
ステップ33(S33)において、第一分類部305は、S32で推論した分類結果を、ユーザ端末103等の任意の端末に通知する。
【0089】
なお、上記で説明したように、第一学習モデルと第二学習モデルとの二段階で分類する構成とすることもできる。
【0090】
<効果>
本発明の一実施形態では、機械学習装置102が、データを"分類可能データ"と"分類不明データ"とに分類し、その後、"分類不明データ"を分類する。そして、"分類不明データ"の分類結果が人によって修正される。このように、本発明の一実施形態では、第一学習モデルと第二学習モデルとの二段階で分類し、第二学習モデルによる分類では"分類不明データ"のみに特化して分類しているので、どの注釈が付与されるべきかを低い確度でしか判断できないデータの分類の精度を上げることができる。
【0091】
なお、上記実施形態に挙げた構成等に、その他の要素との組み合わせ等、ここで示した構成に本発明が限定されるものではない。これらの点に関しては、本発明の趣旨を逸脱しない範囲で変更することが可能であり、その応用形態に応じて適切に定めることができる。
【符号の説明】
【0092】
100 品質検査システム
101 光学顕微鏡
102 機械学習装置
103 ユーザ端末
104 ネットワーク
301 対象物画像取得部
302 対象物画像格納部
303 粒子画像抽出部
304 粒子画像格納部
305 第一分類部
306 第一付与部
307 第一学習モデル更新部
308 第一学習モデル格納部
309 第二分類部
310 第二付与部
311 第二学習モデル更新部
312 第二学習モデル格納部
313 注釈取得部
314 分類不明データ格納部
図1
図2
図3
図4
図5
図6
図7
図8
図9