(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024154616
(43)【公開日】2024-10-31
(54)【発明の名称】モデル更新方法、学習システム、モデル更新装置、および学習装置
(51)【国際特許分類】
G06N 20/00 20190101AFI20241024BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】9
【出願形態】OL
(21)【出願番号】P 2023068539
(22)【出願日】2023-04-19
(71)【出願人】
【識別番号】000001270
【氏名又は名称】コニカミノルタ株式会社
(74)【代理人】
【識別番号】110002952
【氏名又は名称】弁理士法人鷲田国際特許事務所
(72)【発明者】
【氏名】岡▲崎▼ 智也
(57)【要約】
【課題】検査における基準がそれぞれ異なる複数の学習モデルに基づいて、より高品質の新たな学習モデルを構築することができる学習モデルの構築方法、および構築システムを提供する。
【解決手段】本開示に係るモデル更新方法は、複数の学習装置を有する学習システムに含まれるコンピューターが実行する方法であって、前記複数の学習装置がそれぞれ有する学習済みモデルに関するモデル情報を取得するモデル取得工程と、前記複数の学習装置のうち第1学習装置が有する第1学習済みモデルに関する第1モデル情報を、前記複数の学習装置のそれぞれが、固有の評価用データセットを用いて評価した結果である評価結果を取得する評価取得工程と、前記評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成工程と、を備える。
【選択図】
図6
【特許請求の範囲】
【請求項1】
製造工程検査用の複数の学習装置を有する学習システムに含まれるコンピューターが実行する方法であって、
前記複数の学習装置がそれぞれ有する学習済みモデルに関するモデル情報を取得するモデル取得工程と、
前記複数の学習装置のうち第1学習装置が有する第1学習済みモデルに関する第1モデル情報を、前記複数の学習装置のそれぞれが、固有の評価用データセットを用いて評価した結果である評価結果を取得する評価取得工程と、
前記評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成工程と、
を備える、モデル更新方法。
【請求項2】
前記複数の学習装置のそれぞれは、複数の製造工程のそれぞれにおける品質検査に用いられる前記学習済みモデルを有する、
請求項1に記載のモデル更新方法。
【請求項3】
前記複数の製造工程は、それぞれ品質基準が異なる、
請求項2に記載のモデル更新方法。
【請求項4】
前記生成工程は、前記評価結果に基づいて、複数の前記モデル情報のそれぞれに重み付けを行って前記更新用モデル情報を生成する工程を含む、
請求項1に記載のモデル更新方法。
【請求項5】
前記生成工程は、前記評価結果に基づいて、複数の前記モデル情報のうち、前記更新用モデル情報の生成に使用するモデル情報を決定する工程を含む、
請求項1に記載のモデル更新方法。
【請求項6】
前記生成工程は、前記評価結果に基づいて前記複数の学習装置をグルーピングし、同じグループに含まれる前記学習装置が有する前記学習済みモデルに関する前記モデル情報を用いて前記更新用モデル情報を生成する、
請求項1に記載のモデル更新方法。
【請求項7】
製造工程検査用の複数の学習装置を有する学習システムであって、
前記複数の学習装置がそれぞれ有する学習済みモデルに関するモデル情報を取得するモデル情報取得部と、
前記複数の学習装置のうち第1学習装置が有する第1学習済みモデルに関する第1モデル情報を、前記複数の学習装置のそれぞれが、固有の評価用データセットを用いて評価した結果である評価結果を取得する評価結果取得部と、
前記評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成部と、
を備える、学習システム。
【請求項8】
製造工程検査用の複数の学習装置と通信可能に接続されたモデル更新装置であって、
前記複数の学習装置がそれぞれ有する学習済みモデルに関するモデル情報を取得するモデル情報取得部と、
前記複数の学習装置のうち第1学習装置が有する第1学習済みモデルに関する第1モデル情報を、前記複数の学習装置のそれぞれが、固有の評価用データセットを用いて評価した結果である評価結果を取得する評価結果取得部と、
前記評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成部と、
を備える、モデル更新装置。
【請求項9】
第1学習済みモデルおよび固有の第1評価用データセットを有する、製造工程検査用の学習装置であって、
他の学習装置によって生成された、前記他の学習装置が有する他の学習済みモデルに関する他のモデル情報を取得するモデル情報取得部と、
前記他のモデル情報を、前記第1評価用データセットを用いて評価した第1評価結果を生成する評価部と、
前記第1学習済みモデルに関する第1モデル情報を、前記他の学習装置が固有の評価用データセットを用いて評価した他の評価結果を取得する評価結果取得部と、
前記第1評価結果および前記他の評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成部と、
を備える、学習装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、モデル更新方法、学習システム、モデル更新装置、および学習装置に関する。
【背景技術】
【0002】
各種の製品を製造する製造工程において、製造中または完成後の製品の品質検査が一般的に行われている。製造工程における品質検査を、学習済みの機械学習モデルを用いて行う技術が開発されている。例えば特許文献1には、製品製造の多数の現場から集結させた学習データを用いて、製造現場における検査用の学習済み学習モデルを構築する技術が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
異なる製造工程において、検査における品質の判断基準がそれぞれ異なることがある。特許文献1に開示された技術では、判断基準がそれぞれ異なる複数の製造現場から学習データを集結させて新たな学習済み学習モデルを構築した場合、新たな学習モデルがそれぞれの製造現場において高精度の検査を行うことができるとは限らない。場合によっては、ある製造現場において集結させる前に使用されていた学習モデルよりも、新たな学習モデルの方が検査精度が低下してしまう事態が生じうる。
【0005】
本開示は、検査における基準がそれぞれ異なる複数の学習モデルに基づいて、より高品質の新たな学習モデルを構築することができる学習モデルの構築方法、および構築システムを提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の一態様に係るモデル更新方法は、製造工程検査用の複数の学習装置を有する学習システムに含まれるコンピューターが実行する方法であって、前記複数の学習装置がそれぞれ有する学習済みモデルに関するモデル情報を取得するモデル取得工程と、前記複数の学習装置のうち第1学習装置が有する第1学習済みモデルに関する第1モデル情報を、前記複数の学習装置のそれぞれが、固有の評価用データセットを用いて評価した結果である評価結果を取得する評価取得工程と、前記評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成工程と、を備える。
【0007】
本開示の一態様に係る学習システムは、製造工程検査用の複数の学習装置を有する学習システムであって、前記複数の学習装置がそれぞれ有する学習済みモデルに関するモデル情報を取得するモデル情報取得部と、前記複数の学習装置のうち第1学習装置が有する第1学習済みモデルに関する第1モデル情報を、前記複数の学習装置のそれぞれが、固有の評価用データセットを用いて評価した結果である評価結果を取得する評価結果取得部と、前記評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成部と、を備える。
【0008】
本開示の一態様に係るモデル更新装置は、製造工程検査用の複数の学習装置と通信可能に接続されたモデル更新装置であって、前記複数の学習装置がそれぞれ有する学習済みモデルに関するモデル情報を取得するモデル情報取得部と、前記複数の学習装置のうち第1学習装置が有する第1学習済みモデルに関する第1モデル情報を、前記複数の学習装置のそれぞれが、固有の評価用データセットを用いて評価した結果である評価結果を取得する評価結果取得部と、前記評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成部と、を備える。
【0009】
本開示の一態様に係る学習装置は、第1学習済みモデルおよび固有の第1評価用データセットを有する、製造工程検査用の学習装置であって、他の学習装置によって生成された、前記他の学習装置が有する他の学習済みモデルに関する他のモデル情報を取得するモデル情報取得部と、前記他のモデル情報を、前記第1評価用データセットを用いて評価した第1評価結果を生成する評価部と、前記第1学習済みモデルに関する第1モデル情報を、前記他の学習装置が固有の評価用データセットを用いて評価した他の評価結果を取得する評価結果取得部と、前記第1評価結果および前記他の評価結果に基づいて、前記第1学習済みモデルを更新するための更新用モデル情報を生成する生成部と、を備える。
【発明の効果】
【0010】
本開示によれば、検査における基準がそれぞれ異なる複数の学習モデルに基づいて、より高品質の新たな学習モデルを構築することができる。
【図面の簡単な説明】
【0011】
【
図1】本開示の第1の実施の形態に係る学習システムの全体構成の一例を示す図
【
図2】学習装置のハードウェア構成の一例を説明するための図
【
図3】モデル更新装置のハードウェア構成の一例を説明するための図
【
図4】第1の実施の形態に係る学習システムの機能構成の一例を示すブロック図
【
図5】生成部による更新用モデル情報の生成方法のうち第2方法について説明するための図
【
図6】第1の実施の形態に係る学習システムの動作例を説明するためのフローチャート
【
図7】本開示の第2の実施の形態に係る学習システムの全体構成の一例を示す図
【
図8】第2の実施の形態に係る学習システムの機能構成を説明するための図
【
図9】第2の実施の形態に係る学習システムの動作例を説明するためのフローチャート
【発明を実施するための形態】
【0012】
以下、本開示の実施の形態について、図面を参照して説明する。ただし、本開示は実施の形態にて説明した例に限定されない。なお、以下の説明において、同一の機能および構成を有するものについては、同一の符号を付し、その説明を省略する。
【0013】
[第1の実施の形態]
<全体構成>
図1は、本開示の第1の実施の形態に係る学習システム100の全体構成の一例を示す図である。学習システム100は、複数の学習装置10と、モデル更新装置20と、を備える。複数の学習装置10のそれぞれと、モデル更新装置20とは、通信可能に接続されている。なお、
図1に示す例では、複数の学習装置10のそれぞれと、モデル更新装置20とが直接接続されているが、これらは例えばインターネットやイントラネットなどの公衆ネットワークを介して接続されていてもよい。
【0014】
学習装置10は、各種製品の製造工程において、学習済みの機械学習モデル(以下、学習済みモデル)を用いて検査を行う装置である。学習装置10は、複数の製造工程、例えば工場などに設置されている。
図1に示す例では、学習装置10は、第1製造工程に設置された第1学習装置101と、第2製造工程に設置された第2学習装置102と、第3製造工程に設置された第3学習装置103と、を含んでいる。なお、
図1に示す例では、学習装置10は3つの製造工程に設置された3つの学習装置を含んでいるが、本開示はこれに限定されず、4つ以上、または2つの製造工程のそれぞれに学習装置が設置されていてもよい。
【0015】
学習装置10は、それぞれ設置された製造工程において製品の品質検査を行うための学習済みモデルを有している。
図1に示す例では、第1学習装置101は、第1製造工程において検査を行うための第1学習済みモデルを有している。第2学習装置102は、第2製造工程において検査を行うための第2学習済みモデルを有している。第3学習装置103は、第3製造工程において検査を行うための第3学習済みモデルを有している。
【0016】
第1学習済みモデルは、第1製造工程において製造された複数の製品に関する検査用データが入力された場合に、それぞれの製品を第1製造工程の品質基準に基づいて判定した結果(良品または不良品)を示す検査結果データを出力する学習済みモデルである。同様に、第2学習済みモデルは、第2製造工程において製造された複数の製品に関する検査用データが入力された場合に、それぞれの製品を第2製造工程の品質基準に基づいて判定した結果を示す検査結果データを出力する学習済みモデルである。同様に、第3学習済みモデルは、第3製造工程において製造された複数の製品に関する検査用データが入力された場合に、それぞれの製品を第3製造工程の品質基準に基づいて判定した結果を示す検査結果データを出力する学習済みモデルである。
【0017】
本開示では、複数の学習装置10がそれぞれ有する学習済みモデルは、同じ学習方法で学習処理が施されている。これにより、複数の学習装置10がそれぞれ有する学習済みモデルは、それぞれ異なるパラメータを有するが、学習済みモデルの構造は同じである。
【0018】
検査用データは、例えば製品の画像データ、または超音波や電波などを製品に反射させて得られた波形データ、音声データなどである。検査用データは、例えば、それぞれの製造工程に設置された画像生成装置や超音波生成装置などにより、製造工程毎に取得される。
【0019】
検査結果データは、検査用データのそれぞれの製品ごとに、検査結果を示すフラグを含むフラグデータ、または検査結果を示す文字列や音声を含むデータなどである。検査結果データは、例えば製造工程毎に予め設定されている検査基準に基づいて判断された、製品毎に良品であること、または不良品であることを示すデータである。
【0020】
各学習済みモデルは、例えば、それぞれの製造工程において予め生成された検査用データおよび検査結果データを含む学習用データセットを用いた教師あり学習が実施されることにより構築された学習済みモデルである。第1学習装置101は、第1製造工程において製造された製品の検査用データおよび検査結果データを学習用データセットとして用いて第1学習済みモデルの学習処理を行う。第2学習装置102は、第2製造工程において製造された製品の検査用データおよび検査結果データを学習用データセットとして用いて第2学習済みモデルの学習処理を行う。第3学習装置103は、第3製造工程において製造された製品の検査用データおよび検査結果データを学習用データセットとして用いて第3学習済みモデルの学習処理を行う。
【0021】
なお、各学習済みモデルの学習処理は、各学習装置によって行われなくてもよく、例えば他の学習装置により、各学習装置が設置された製造工程に対応する学習処理が施されてもよい。学習済みモデルは、例えばニューラルネットワークにより構成されればよい。
【0022】
また、学習装置10は、それぞれ固有の評価用データセットを有する。評価用データセットとは、学習済みモデルの評価を行うためのデータセットである。具体的には、評価用データセットは、学習装置10が設置されている製造工程における、過去の検査用データと検査結果データとのセットである。学習装置10は、評価用データセットを用いることにより、他の学習装置で学習された学習済みモデルの評価を好適に行うことができる。学習装置10は、生成した評価結果をモデル更新装置20に送信する。学習装置10による、他の学習装置で学習された学習済みモデルの評価についての説明は、後述する。
【0023】
モデル更新装置20は、各学習装置10から、各学習済みモデルに関するモデル情報と、評価結果と、を受信する。モデル更新装置20は、受信したモデル情報および評価結果に基づいて、各学習装置10の学習済みモデルを更新するための更新用モデル情報を生成する。モデル更新装置20の動作の詳細については、後述する。
【0024】
<学習装置10のハードウェア構成の例>
図2は、学習装置10のハードウェア構成の一例を説明するための図である。
図2に示すように、学習装置10は、制御部11と、記憶装置12と、ネットワークインターフェース(I/F)13と、を備える。これらの構成部品は信号をやり取りするためのバス等の信号線を介して相互に接続されている。
図2に示すように、学習装置10は、1種のコンピューターである。
【0025】
制御部11は、CPU(Central Processing Unit)、GPU(Graphics Processing Unit)、RAM(Random Access Memory)、ROM(Read Only Memory)などを含む。制御部11は、記憶装置12に記憶されたプログラムを読み出し実行することで、各製造工程における品質検査に関する機械学習を行う。
【0026】
記憶装置12は、予め各種プログラムや各種データを格納する記憶装置である。上述した学習済みモデルは、記憶装置12に記憶されている。
【0027】
ネットワークI/F13は、モデル更新装置20との間で各種のデータの送受信を行うインターフェースである。
【0028】
<モデル更新装置20のハードウェア構成の例>
図3は、モデル更新装置20のハードウェア構成の一例を説明するための図である。
図3に示すように、モデル更新装置20は、制御部21と、記憶装置22と、ネットワークI/F23と、を備える。これらの構成部品は信号をやり取りするためのバス等の信号線を介して相互に接続されている。
図3に示すように、モデル更新装置20は、1種のコンピューターである。
【0029】
制御部21は、CPU、GPU、RAM、ROMなどを含む。制御部21は、記憶装置22に記憶されたプログラムを読み出し実行することで、複数の学習装置10から取得した各種データに基づいてそれぞれの検査装置用の新たな学習済みモデルを生成する。制御部21で行われる新たな学習済みモデルの生成処理については後述する。
【0030】
記憶装置22は、予め各種プログラムや各種データを格納する記憶装置である。記憶装置22は、例えば複数の学習装置10が有する各学習済みモデルに関連するモデル情報、および、各学習済みモデルを各学習装置10が評価した結果である評価結果などを記憶する。モデル情報は、例えば、各学習済みモデルがそれぞれの能力(具体的には、検査結果データの出力)を発揮するために設定される演算パラメータを含む。言い換えると、各学習済みモデルのそれぞれにおける学習処理の結果は、演算パラメータに反映される。学習済みモデルがニューラルネットワークにより構成される場合、演算パラメータは、例えば各ニューロン間の結合の重み、各ニューロンの閾値などである。
【0031】
ネットワークI/F23は、複数の学習装置10の少なくともいずれかとの間で各種のデータの送受信を行うインターフェースである。
【0032】
<学習システム100の機能構成の例>
上述した学習装置10およびモデル更新装置20のハードウェア構成によって実現される、学習システム100の機能構成について説明する。
図4は、第1の実施の形態に係る学習システム100の機能構成の一例を示すブロック図である。
図4に示す例では、学習装置10が1つのみ示されているが、実際には
図1に示すように、複数の学習装置10がモデル更新装置20に接続されている。
【0033】
図4に示すように、第1の実施の形態に係る学習システム100において、学習装置10は、送受信部14と、学習処理部15と、モデル情報取得部16と、評価部17と、記憶部18と、を備える。
【0034】
送受信部14は、モデル更新装置20との間で各種情報の送受信を行う。
【0035】
学習処理部15は、学習装置10に対応する製造工程において製造された製品の品質検査用データ(画像データや波形データなど)、および検査結果データ(製品が良品であるか否かを示すデータ)を学習用データセットとして用いて、検査用データの入力に対し適切な検査結果データを出力できるように機械学習モデルに学習処理を施し、品質検査用の学習済みモデルを生成する。
【0036】
また、学習処理部15は、送受信部24を介してモデル更新装置20から更新用モデル情報が受信された場合、更新用モデル情報を用いて、学習済みモデルのモデル情報(内部パラメータ)を更新する。これにより、学習装置10の学習済みモデルは、より精度のよい品質検査を行うことができるように更新される。
【0037】
モデル情報取得部16は、モデル更新装置20から、他の学習装置のモデル情報を取得する。学習装置10は、他の学習装置からモデル情報を取得することにより、他の学習装置の学習済みモデルを再現することができる。例えば
図1に示す例では、第1学習装置101は、第2学習装置102からモデル情報を取得した場合、第2学習装置102が有する学習済みモデルを第1学習装置101の内部で再現可能である。これは、上述したように、本開示では複数の学習装置10が有する学習済みモデルは、同じ学習方法で学習されて同じ構造を有しており、内部パラメータ(モデル情報)のみが異なるため、内部パラメータを入れ替えることで他の学習装置の学習済みモデルと同等のモデルを再現できるからである。
【0038】
評価部17は、他の学習装置から取得したモデル情報を用いて再現した、他の学習装置が有する学習済みモデル(以下、再現モデル)の評価を行い、評価結果を生成する。評価部17は、再現モデルの評価を、学習装置10に固有の評価用データセットを用いて行う。具体的には、評価部17は、評価用データセットに含まれる検査用データを再現モデルに入力し、再現モデルが出力した結果データが、評価用データセットに含まれる検査結果データ(評価部17が属する学習装置10が生成した検査結果データ)と一致する度合いを示す正解率を生成し、評価結果として出力する。
【0039】
他の学習装置が複数ある場合、評価部17は、他の学習装置の数、評価結果を生成する。例えば
図1に示す例では、第1学習装置101は、第2学習装置102および第3学習装置103からモデル情報を取得した場合、第2学習済みモデルの評価結果と、第3学習済みモデルの評価結果と、を生成する。なお、本開示では、各学習装置が他の学習装置全ての学習済みモデルの評価結果を生成せず、一部の他の学習装置の学習済みモデルの評価結果のみを生成してもよい。
【0040】
記憶部18は、学習装置10で用いられる種々の情報を格納する。記憶部18には、少なくとも、製造工程における品質検査に用いられる学習済みモデルと、学習モデルを評価するための評価用データセットと、が格納される。記憶部18には、さらに機械学習モデルに学習処理を施す際に用いる学習用データなどが格納されていてもよい。
【0041】
図4に示すように、第1の実施の形態に係るモデル更新装置20は、送受信部24と、モデル情報取得部25と、評価結果取得部26と、生成部27と、記憶部28と、を備える。
【0042】
送受信部24は、各学習装置10との間で各種情報の送受信を行う。
【0043】
モデル情報取得部25は、複数の学習装置10から、各学習装置10が有する学習済みモデルのモデル情報を取得する。モデル更新装置20は、モデル情報取得部25により複数の学習装置10から取得した全てのモデル情報を、送受信部24を介して、全ての学習装置10に対して送信する。
【0044】
評価結果取得部26は、複数の学習装置10から、評価結果を取得する。評価結果は、上述したように、各学習装置10において、他の学習装置の学習済みモデルを再現し、学習装置10に固有の評価用データセットを用いて再現した学習済みモデルを評価することで生成される。評価結果取得部26は、各学習装置10から、他の学習装置の数、評価結果を取得する。
【0045】
生成部27は、各学習装置10から取得した評価結果に基づいて、各学習装置10の学習済みモデルを更新するための更新用モデル情報を生成する。生成部27による更新用モデル情報を生成方法については、後述する。
【0046】
生成部27が生成した更新用モデル情報は、送受信部24を介して、対応する学習装置10に送信される。
【0047】
記憶部28は、モデル更新装置20で用いられる種々の情報を格納する。記憶部28には、少なくとも、複数の学習装置10から取得したモデル情報と、評価結果と、が格納される。記憶部28には、さらに、生成部27が生成した更新用モデル情報などが格納されてもよい。
【0048】
<更新用モデル情報の生成方法>
生成部27による、更新用モデル情報を生成方法について説明する。生成部27は、例えば第1方法と第2方法の2つの生成方法のいずれかを用いて更新用モデル情報を生成すればよい。
【0049】
(第1方法)
第1方法では、生成部27は、複数の学習装置10から取得したモデル情報、すなわち各学習装置10が有する学習済みモデルの内部パラメータに対し、各学習装置10から取得した評価結果に基づいて重み付けを行う。そして、生成部27は、重み付けに従って内部パラメータを合成して更新用モデル情報を生成する。
【0050】
例えば
図1に示す例において、第1学習装置101が有する第1学習済みモデルの更新用モデル情報を生成する場合について考える。評価結果取得部26は、第1学習装置101から、第1学習済みモデルの評価結果として値V1を取得したとする。また、評価結果取得部26は、第2学習装置102から、第1学習済みモデルの評価結果として値V2を取得したとする。また、評価結果取得部26は、第3学習装置103から、第1学習済みモデルの評価結果として値V3を取得したとする。
【0051】
この場合、生成部27は、第1学習装置101から取得したモデル情報に対し、V1/(V1+V2+V3)の重みを付ける。また、生成部27は、第2学習装置102から取得したモデル情報に対し、V2/(V1+V2+V3)の重みを付ける。また、生成部27は、第3学習装置103から取得したモデル情報に対し、V3/(V1+V2+V3)の重みを付ける。
【0052】
なお、上述した重みの付け方は一例であり、本開示はこれに限定されるものではない。例えば、生成部27は、比較的値が大きい評価結果を送信した学習装置10に対応するモデル情報に対してはより大きな重みを付け、比較的値が小さい評価結果を送信した学習装置10に対応するモデル情報に対してはより小さな重みを付けるようにしてもよい。または、生成部27は、所定の閾値以上の評価結果を送信した学習装置10に対応するモデル情報のみを更新用モデル情報の生成に用い、所定の閾値未満の評価結果を送信した学習装置10に対応するモデル情報は更新用モデル情報の生成に用いないようにしてもよい。言い換えると、生成部27は、閾値以上の評価結果を送信した学習装置に対応するモデル情報のみを更新用モデル情報の生成に用いてもよい。
【0053】
生成部27は、このように種々の方法で算出した重み付け値を用いて、複数の学習装置10から取得したモデル情報を合成することにより、更新用モデル情報を生成することができる。
【0054】
(第2方法)
第2方法では、生成部27は、各学習装置10から取得した評価結果に基づいて、複数の学習装置10をグルーピングし、同一グループ内の学習装置10が有する学習済みモデルのモデル情報のみを用いて、更新用モデル情報を生成する。
【0055】
具体例を挙げて説明する。
図5は、生成部27による更新用モデル情報の生成方法のうち第2方法について説明するための図である。
図5では、第1学習装置101から、第1学習モデルのモデル情報に対する評価結果として値「0.85」、第2学習モデルのモデル情報に対する評価結果として値「0.60」、第3学習モデルのモデル情報に対する評価結果として値「0.55」を取得した例が示されている。
【0056】
また、
図5では、第2学習装置102から、第1学習モデルのモデル情報に対する評価結果として値「0.67」、第2学習モデルのモデル情報に対する評価結果として値「0.88」、第3学習モデルのモデル情報に対する評価結果として値「0.82」を取得した例が示されている。
【0057】
また、
図5では、第3学習装置103から、第1学習モデルのモデル情報に対する評価結果として値「0.52」、第2学習モデルのモデル情報に対する評価結果として値「0.83」、第3学習モデルのモデル情報に対する評価結果として値「0.91」を取得した例が示されている。
【0058】
第1学習装置101,第2学習装置102,および第3学習装置103から取得したそれぞれの評価結果の値を参照すると、いずれの学習装置10からの評価結果においても、第2学習モデルのモデル情報に対する評価結果と第3学習モデルのモデル情報に対する評価結果とが比較的近い値となっており、第1学習モデルのモデル情報に対する評価結果はこれらから比較的離れた値となっている。
【0059】
このような場合、生成部27は、第1学習装置101と、第2学習装置102および第3学習装置103と、をそれぞれ別のグループにグルーピングする。
【0060】
そして、生成部27は、第1学習装置101が有する第1学習モデルを更新するための更新用モデル情報を、第1学習モデルにのみ基づいて生成する。ここで、生成部27は、第1学習モデルのモデル情報に所定の処理を行うことで第1学習モデル用の更新用モデル情報を生成してもよいし、第1学習モデルのモデル情報をそのまま第1学習モデル用の更新用モデル情報としてもよい。
【0061】
また、生成部27は、第2学習装置102が有する第2学習モデルを更新するための更新用モデル情報と、第3学習装置103が有する第3学習モデルを更新するための更新用モデル情報とを、第2学習装置102から取得したモデル情報および第3学習装置103から取得したモデル情報を用いて生成する。生成部27は、例えば第1方法において説明した重み付けを用いて、第2学習装置102から取得したモデル情報および第3学習装置103から取得したモデル情報を合成することで、第2学習モデルを更新するための更新用モデル情報と、第3学習モデルを更新するための更新用モデル情報とを生成すればよい。
【0062】
より多くの学習装置10からモデル情報および評価結果を取得する場合、例えばクラスター分析(クラスタリング)などのデータ解析手法を用いて学習装置10のグルーピングを行ってもよい。クラスター分析の手法の例としては、コサイン類似度を算出してクラスタリングを行う手法などが挙げられる。
【0063】
<動作例>
以上説明した構成を有する学習システム100の動作例について説明する。
図6は、第1の実施の形態に係る学習システム100の動作例を説明するためのフローチャートである。
【0064】
ステップS1において、モデル更新装置20が、各学習装置10からモデル情報を取得する。
【0065】
ステップS2において、モデル更新装置20が、各学習装置10に対し、ステップS1で取得した全てのモデル情報を送信する。これにより、各学習装置10は、他の学習装置が有する学習済みモデルのモデル情報を取得することができる。
【0066】
ステップS3において、各学習装置10が、取得したモデル情報に基づいて、他の学習装置が有する学習済みモデルを再現し、再現した学習済みモデルのそれぞれに対し、学習装置10に固有の評価用データセットを用いて評価を行う。各学習装置10は、生成した評価結果をモデル更新装置20に送信する。
【0067】
ステップS4において、モデル更新装置20が、各学習装置10から評価結果を取得する。
【0068】
ステップS5において、モデル更新装置20が、各学習装置10から取得した評価結果に基づいて、学習装置10毎に、更新用モデルを生成する。モデル更新装置20は、生成した更新用モデル情報を、対応する学習装置10に対して送信する。
【0069】
ステップS6において、各学習装置10は、受信した更新用モデル情報に基づいて、自らが有する学習済みモデルを更新する。
【0070】
以上説明したように、本開示の第1の実施の形態に係る学習システム100によれば、複数の学習装置10のうち、第1学習装置が有する第1学習済みモデルを更新するための更新用モデル情報を生成するために、他の学習装置が第1学習済みモデルに対して固有の評価用データセットを用いて行った評価結果を用いる。従って、複数の製造工程において用いられている複数の学習装置10によって学習された学習済みモデルを用いて、特定の第1学習済みモデルのモデル情報(内部パラメータ)を好適に更新することができる。
【0071】
また、本開示の第1の実施の形態に係る学習システム100によれば、複数の品質基準に対応した学習済みモデルのモデル情報を用いて更新用モデル情報を生成するので、更新後の学習済みモデルは、複数の品質基準に対応した学習済みモデルを統合したモデルであると言うことができる。すなわち、学習装置10はモデルの更新後、新たな品質基準に適用した学習済みモデルを用いて検査を行うことができる。このため、本開示の第1の実施の形態に係る学習システム100によれば、各製造工程において用いられる学習装置10の学習モデルを、複数の品質基準に基づいて、製造工程毎により適切な新たな品質基準で検査を行うことができる学習済みモデルに更新することができる。
【0072】
これにより、本開示の第1の実施の形態に係る学習システム100では、実質的に、品質基準がそれぞれ異なる製造工程において品質検査に用いられる学習用データセットを用いて、第1学習済みモデルを学習させることができる。なお、更新用モデル情報は、評価結果を用いた重み付け、または評価結果に基づくクラスター分析などによって生成されるので、更新用モデル情報により更新された学習済みモデルは、第1学習装置が用いられる製造工程の品質基準に適合するモデルとなっていることが期待される。このため、品質基準がそれぞれ異なる製造工程において用いられている複数の学習装置10によって学習された学習済みモデルを統合した場合に生じうる、学習済みモデルの品質検査性能の劣化を生じにくくすることできる。
【0073】
なお、本開示の第1の実施の形態に係る学習システム100では、各学習装置10が固有の評価用データセットを用いて他の学習装置の学習済みモデルを評価し、評価結果のみをモデル更新装置20に送信している。すなわち、学習装置10に固有の評価用データセットは、当該学習装置10の外部には送信されないようになっている。
【0074】
例えば複数の学習装置10が、複数の企業の工場に設置された学習装置である場合、評価用データは企業秘密であり、他社の工場に送信することはできない。このような場合でも、開示の第1の実施の形態に係る学習システム100においては、他の学習済みモデルの評価は各学習装置10の内部で行われ、評価用データセットは外部に送信されないので、企業秘密が他社に漏れる恐れがなく、他社の学習済みモデルの内部パラメータを反映して検査精度が高い学習済みモデルに更新することができる。
【0075】
[第2の実施の形態]
以下では、本開示の第2の実施の形態に係る学習システム300について説明する。以下の第2の実施の形態の説明において、上述した第1の実施の形態と同様の構成については、同じ符号を付し、説明を省略する。
図7は、本開示の第2の実施の形態に係る学習システム300の全体構成の一例を示す図である。
【0076】
図7に示すように、第2の実施の形態に係る学習システム300は、モデル更新装置20を有していない点で第1の実施の形態に係る学習システム100と異なっている。第2の実施の形態に係る学習システム300は、複数の学習装置30により構成される。
図7に示す例では、学習装置30は、第1製造工程に設置された第1学習装置301と、第2製造工程に設置された第2学習装置302と、第3製造工程に設置された第3学習装置303と、を含んでいる。なお、
図7は一例であり、学習装置30は、2つの学習装置、又は4つ以上の学習装置を含んでいてもよい。各学習装置30のハードウェア構成については、
図2に示す学習装置10のハードウェア構成と同様であるため、説明を省略する。
【0077】
図8は、第2の実施の形態に係る学習システム300の機能構成を説明するための図である。
図8に示すように、第2の実施の形態において、学習システム300を構成する学習装置30は、送受信部31と、学習処理部15と、モデル情報取得部16と、評価部17と、記憶部18と、評価結果取得部32と、生成部33と、を備える。第2の実施の形態に係る学習装置30は、送受信部31の動作と、評価結果取得部32および生成部33を備える点とにおいて、第1の実施の形態に係る学習装置10と異なっている。
【0078】
送受信部31は、他の学習装置との間で各種情報の送受信を行う。
【0079】
評価結果取得部32は、他の学習装置が生成した、自装置が有する学習済みモデルに対する評価結果を取得する。第2の実施の形態に係る評価結果取得部32と、第1の実施の形態でモデル更新装置20が有している評価結果取得部26との相違点は、評価結果取得部26が全ての学習装置10がそれぞれ有する学習済みモデルに対する全ての評価結果を取得するのに対し、評価結果取得部32は、自装置が有する学習済みモデルに対する評価結果のみを取得する点にある。
【0080】
生成部33は、取得した評価結果を用いて、自装置が有する学習済みモデルを更新するための更新用モデル情報を生成する。第2の実施の形態に係る生成部33と、第1の実施の形態でモデル更新装置20が有している生成部27との相違点は、生成部27が全学習装置10に対して更新用モデル情報を生成するのに対し、生成部33は、自装置が有する学習済みモデルを更新するための更新用モデル情報のみを生成する点にある。
【0081】
生成部33による更新用モデル情報の生成方法は、第1の実施の形態に係る生成部27による生成方法とほぼ同じである。
【0082】
図9は、第2の実施の形態に係る学習システム300の動作例を説明するためのフローチャートである。
【0083】
ステップS11において、学習装置30が、他の学習装置からモデル情報を取得する。
【0084】
ステップS12において、各学習装置30が、取得したモデル情報に基づいて、他の学習装置が有する学習済みモデルを再現し、再現した学習済みモデルのそれぞれに対し、学習装置30に固有の評価用データセットを用いて評価を行う。
【0085】
ステップS13において、各学習装置30が、他の学習装置30から取得した、自装置が有する学習済みモデルの評価結果に基づいて、当該学習済みモデルのための更新用モデルを生成する。
【0086】
ステップS14において、各学習装置30は、受信した更新用モデル情報に基づいて、自らが有する学習済みモデルを更新する。
【0087】
このように、学習システム300がモデル更新装置を有しておらず、学習装置30がそれぞれ個別に自装置の学習済みモデルを更新するための更新用モデル情報を生成する場合でも、複数の製造工程において用いられている複数の学習装置30によって学習された学習済みモデルを用いて、特定の第1学習済みモデルのモデル情報(内部パラメータ)を好適に更新することができる。
【0088】
<適用例>
本開示に係る学習システムは、例えば以下のようなケースで有用である。
【0089】
第1のケースは、複数の工場にそれぞれ学習装置が設置されており、同種の製品を製造しているが、工場毎に品質基準に違いがあるケースである。このような場合、例えば工場Aの学習装置が有する学習済みモデルが良品であると判断する製品(例えば、ベアリング)が、工場Bの学習装置が有する学習済みモデルは不良品であると判断することがある。このような場合、工場Aの学習装置が有する学習済みモデルに、工場Bの学習装置が有する学習済みモデルを単に統合しただけでは、統合前の学習済みモデルが良品であると判断していた製品に対し、統合後の学習図もモデルが不良品であると判断することが想定される。すなわち、統合後の学習済みモデルの検査結果が統合前よりも劣化することがある。
【0090】
本開示に係る学習システムを、このような第1のケースに適用した場合、工場Aの学習装置が有する学習済みモデルを更新する更新用モデル情報を生成する際に、工場Bの学習装置が有する学習済みモデルの重みを小さくする、または工場Bの学習装置が有する学習済みモデルのモデル情報を更新用モデルの生成に用いない。これにより、工場Aにおける更新後の学習済みモデルにおいて、工場Bの学習装置が有する学習済みモデルを統合したことによる性能劣化を抑えることができる。
【0091】
第2のケースは、複数の工場にそれぞれ学習装置が設置されており、それぞれ異なる種類の製品を製造しているが、同種の品質検査が実施されているケースである。具体的には、例えば工場Aでは乗用車を、工場Bではトラックを製造しており、工場Aでも工場Bでも板金の表面検査を行うケースが第2のケースに相当する。
【0092】
第2のケースにおいても、第1のケースと同様に、工場によって品質検査の基準が異なることがある。例えば乗用車の製造に使用される板金に求められる品質基準は、トラックの製造に使用される板金に求められる品質基準より厳しいことが想定される。
【0093】
このような第2のケースに対しても、本開示に係る学習システムを適用した場合、第1のケースと同様に、工場Aにおける更新後の学習済みモデルにおいて、工場Bの学習装置が有する学習済みモデルを統合したことによる性能劣化を抑えることができる。
【0094】
第3のケースは、複数の工場にそれぞれ学習装置が設置されており、同種の製品を製造しており、検査条件が異なるケースである。具体的には、製品の画像データを用いて検査を行う場合、製品を撮影する環境(カメラの設定、位置、照明、搬送中の製品が撮影される場合の搬送速度など)が工場によって異なるケースが第3のケースに相当する。
【0095】
第3のケースでは、工場毎に検査条件が異なるため、必然的に品質基準も異なる。このような第3のケースに対しても、本開示に係る学習システムを適用した場合、第1および第2のケースと同様に、工場Aにおける更新後の学習済みモデルにおいて、工場Bの学習装置が有する学習済みモデルを統合したことによる性能劣化を抑えることができる。
【0096】
上述した第1から第3のケースは、本開示に係る学習システムが適用されるケースの例示にすぎず、本開示に係る学習システムは、これらのケース以外にも当然に適用が可能である。
【産業上の利用可能性】
【0097】
本開示は、複数の製造工程における製品の品質検査に用いられる学習システムのモデル更新方法として有用である。
【符号の説明】
【0098】
100,300 学習システム
10,30 学習装置
11 制御部
12 記憶装置
13 ネットワークI/F
14 送受信部
15 学習処理部
16 モデル情報取得部
17 評価部
18 記憶部
31 送受信部
32 評価結果取得部
33 生成部
20 モデル更新装置
21 制御部
22 記憶装置
23 ネットワークI/F
24 送受信部
25 モデル情報取得部
26 評価結果取得部
27 生成部
28 記憶部