特許7576462 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社フジクラの特許一覧

特許7576462機械学習装置、機械学習方法、機械学習プログラム、評価装置、評価方法、及び評価プログラム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-10-23

(45)【発行日】2024-10-31

(54)【発明の名称】機械学習装置、機械学習方法、機械学習プログラム、評価装置、評価方法、及び評価プログラム

(51)【国際特許分類】

G06T 7/00 20170101AFI20241024BHJP

G01N 21/88 20060101ALI20241024BHJP

【ＦＩ】

G06T7/00 350C

G06T7/00 610B

G01N21/88 Z

【請求項の数】 10

(21)【出願番号】P 2020219579

(22)【出願日】2020-12-28

(65)【公開番号】P2022104392

(43)【公開日】2022-07-08

【審査請求日】2023-06-28

(73)【特許権者】

【識別番号】000005186

【氏名又は名称】株式会社フジクラ

(74)【代理人】

【識別番号】110000338

【氏名又は名称】弁理士法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】黒澤公紀

(72)【発明者】

【氏名】大▲高▼ 巌

(72)【発明者】

【氏名】劉青

【審査官】山田辰美

(56)【参考文献】

【文献】特開２０２０－１４９２０９（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１９／０１０２６７５（ＵＳ，Ａ１）

【文献】特開２０１２－１４１８６２（ＪＰ，Ａ）

【文献】特表２００７－５３６６４４（ＪＰ，Ａ）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ０６Ｔ７／００－７／９０

Ｇ０１Ｎ２１／８８

(57)【特許請求の範囲】

【請求項1】

少なくとも１つのプロセッサを備え、
前記プロセッサは、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、学習用データセットを作成するセット作成処理と、前記セット作成処理にて作成された学習用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルを構築するモデル構築処理と、を実行し、
前記セット作成処理において、前記プロセッサは、前記学習用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、各グループの要素数を均等化すること、及び、グループ毎に各サブグループの要素数を均等化することを目標として、前記データセットから前記学習用データセットの要素を選択するために、前記データセットをクラスに応じてグループに分け、各グループをタイプに応じてサブグループに分け、各グループについて閾値を設定し、該グループの各サブグループについて、（１）該サブグループの要素数が前記閾値以下であれば、該サブグループの全ての要素を前記学習用データセットの要素として選択し、（２）該サブグループの要素数が前記閾値よりも大きければ、該サブグループから前記閾値の値と同数の要素を前記学習用データセットの要素として選択する、
ことを特徴とする機械学習装置。

【請求項2】

前記モデル構築処理は、パラメータ設定用データセットを用いて、前記モデルのネットワーク構造を規定するハイパーパラメータを設定するパラメータ設定処理を含み、
前記プロセッサは、前記パラメータ設定用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、各グループの要素数を均等化すること、及び、グループ毎に各サブグループの要素数を均等化することを目標として、前記学習用データセットから前記パラメータ設定用データセットを選択するために、前記学習用データセットをクラスに応じてグループに分け、各グループをタイプに応じてサブグループに分け、各グループについて第２の閾値を設定し、該グループの各サブグループについて、（１）該サブグループの要素数が前記第２の閾値以下であれば、該サブグループの全ての要素を前記パラメータ設定用データセットの要素として選択し、（２）該サブグループの要素数が前記第２の閾値よりも大きければ、該サブグループから前記第２の閾値の値と同数の要素を前記パラメータ設定用データセットの要素として選択する、
ことを特徴とする請求項１に記載の機械学習装置。

【請求項3】

前記プロセッサは、評価用データセットを用いて、前記モデルの性能を評価するモデル評価処理を更に実行し、
前記セット作成処理において、前記プロセッサは、前記データセットに属する画像データのうち、前記学習用データセットの要素として選択されなかった画像データを、前記評価用データセットの要素として選択する、
ことを特徴とする請求項１又は２に記載の機械学習装置。

【請求項4】

前記モデル評価処理は、タイプ別評価用データセットを用いて、前記モデルの性能をタイプ別に評価するタイプ別評価処理を含み、
前記プロセッサは、前記タイプ別評価用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、グループ毎に各サブグループの要素数を均等化することを目標として、前記評価用データセットから前記タイプ別評価用データセットの要素を選択するために、前記評価用データセットをクラスに応じてグループに分け、各グループをタイプに応じてサブグループに分け、第３の閾値を設定し、各サブグループについて、（１）該サブグループの要素数が前記第３の閾値以下であれば、該サブグループの全ての要素を前記タイプ別評価用データセットの要素として選択し、（２）該サブグループの要素数が前記第３の閾値よりも大きければ、該サブグループから前記第３の閾値の値と同数の要素を前記タイプ別評価用データセットの要素として選択する、
ことを特徴とする請求項３に記載の機械学習装置。

【請求項5】

前記モデルの入力は、特定の物品を被写体として含む画像データであり、前記モデルの出力は、その物品の特定の部位の良否を示すクラスであり、
前記タイプは、背景、前記物品、及び前記部位の一部又は全部の属性に注目して定義されたタイプである、
ことを特徴とする請求項１～４の何れか一項に記載の機械学習装置。

【請求項6】

少なくとも１つのプロセッサが、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、学習用データセットを作成するセット作成処理と、
前記プロセッサが、前記セット作成処理にて作成された学習用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルを構築するモデル構築処理と、を含み、
前記セット作成処理において、前記プロセッサは、前記学習用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、各グループの要素数を均等化すること、及び、グループ毎に各サブグループの要素数を均等化することを目標として、前記データセットから前記学習用データセットの要素を選択するために、前記データセットをクラスに応じてグループに分け、各グループをタイプに応じてサブグループに分け、各グループについて閾値を設定し、該グループの各サブグループについて、（１）該サブグループの要素数が前記閾値以下であれば、該サブグループの全ての要素を前記学習用データセットの要素として選択し、（２）該サブグループの要素数が前記閾値よりも大きければ、該サブグループから前記閾値の値と同数の要素を前記学習用データセットの要素として選択する、
ことを特徴とする機械学習方法。

【請求項7】

コンピュータを請求項１～５の何れか一項に記載の機械学習装置として動作させるための機械学習プログラムであって、前記コンピュータが備えるプロセッサに前記各処理を実行させる機械学習プログラム。

【請求項8】

少なくとも１つのプロセッサを備え、
前記プロセッサは、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、評価用データセットを作成するセット作成処理と、前記セット作成処理にて作成された評価用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルの性能を評価するモデル評価処理と、を実行し、
前記モデル評価処理は、タイプ別評価用データセットを用いて、前記モデルの性能をタイプ別に評価するタイプ別評価処理と、包括的評価用データセットを用いて、前記モデルの性能を包括的に評価する包括的評価処理と、を含み、
前記プロセッサは、前記タイプ別評価用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、グループ毎に各サブグループの要素数を均等化することを目標として、前記評価用データセットから前記タイプ別評価用データセットの要素を選択するために、前記評価用データセットをクラスに応じてグループに分け、各グループをタイプに応じてサブグループに分け、閾値を設定し、各サブグループについて、（１）該サブグループの要素数が前記閾値以下であれば、該サブグループの全ての要素を前記タイプ別評価用データセットの要素として選択し、（２）該サブグループの要素数が前記閾値よりも大きければ、該サブグループから前記閾値と同数の要素を前記タイプ別評価用データセットの要素として選択する、
ことを特徴とする評価装置。

【請求項9】

少なくとも１つのプロセッサが、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、評価用データセットを作成するセット作成処理と、
前記プロセッサが、前記セット作成処理にて作成された評価用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルの性能を評価するモデル評価処理と、を含み、
前記モデル評価処理は、タイプ別評価用データセットを用いて、前記モデルの性能をタイプ別に評価するタイプ別評価処理と、包括的評価用データセットを用いて、前記モデルの性能を包括的に評価する包括的評価処理と、を含み、
前記プロセッサは、前記タイプ別評価用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、グループ毎に各サブグループの要素数を均等化することを目標として、前記評価用データセットから前記タイプ別評価用データセットの要素を選択するために、前記評価用データセットをクラスに応じてグループに分け、各グループをタイプに応じてサブグループに分け、閾値を設定し、各サブグループについて、（１）該サブグループの要素数が前記閾値以下であれば、該サブグループの全ての要素を前記タイプ別評価用データセットの要素として選択し、（２）該サブグループの要素数が前記閾値よりも大きければ、該サブグループから前記閾値と同数の要素を前記タイプ別評価用データセットの要素として選択する、
ことを特徴とする評価方法。

【請求項10】

コンピュータを請求項８に記載の評価装置として動作させるための評価プログラムであって、前記コンピュータが備えるプロセッサに前記各処理を実行させる評価プログラム。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、画像データを入力とし、予め定められた複数のクラスの何れかを出力とするモデルを構築する機械学習装置、機械学習方法、及び機械学習プログラムに関する。また、そのようなモデルを評価する評価装置、評価方法、及び評価プログラムに関する。

【背景技術】

【0002】

機械学習により構築されたモデル（学習済モデル）を用いて、物品の検査を行う方法が知られている。例えば、特許文献１には、物品を被写体として含む画像データを入力とし、その物品のクラスを出力とするモデルを用いて、物品の検査を行う検査装置が開示されている。

【先行技術文献】

【特許文献】

【0003】

【文献】特開２０２０－０４２７５４

【発明の概要】

【発明が解決しようとする課題】

【0004】

機械学習に用いられる学習用データセットには、様々なタイプの画像データが含まれている。しかも、それぞれのタイプの画像データが均等に含まれていることは稀であり、特定のタイプの画像データが突出して多く含まれていることもある。このように、学習用データセットに含まれている画像データのタイプに偏りがあると、機械学習により構築されるモデルの性能（例えば汎化能力）が低下することがある。例えば、突出して多く含まれる特定のタイプの画像データにより、そのタイプに対する過学習が生じると、他のタイプの画像データに対する精度が低下する。

【0005】

本発明の一態様は、上記の問題に鑑みてなされたものであり、その目的は、学習用データセットに含まれている画像データのタイプの偏りに起因するモデルの性能低下が生じ難い機械学習技術を実現することにある。

【課題を解決するための手段】

【0006】

本発明の態様１に係る機械学習装置は、少なくとも１つのプロセッサを備え、前記プロセッサは、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、学習用データセットを作成するセット作成処理と、前記セット作成処理にて作成された学習用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルを構築するモデル構築処理と、を実行し、前記セット作成処理において、前記プロセッサは、前記学習用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、各グループの要素数を均等化すること、及び、グループ毎に各サブグループの要素数を均等化することを目標として、前記データセットから前記学習用データセットの要素を選択する、という特徴を有している。

【0007】

上記の構成によれば、学習用データセットに含まれている画像データのタイプに偏りが生じ難くなる。したがって、画像データのタイプの偏りに起因するモデルの性能低下が生じ難くなる。

【0008】

本発明の態様２に係る機械学習装置においては、態様１に係る機械学習装置の構成に加えて、前記モデル構築処理は、パラメータ設定用データセットを用いて、前記モデルのネットワーク構造を規定するハイパーパラメータを設定するパラメータ設定処理を含み、前記プロセッサは、パラメータ設定用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、各グループの要素数を均等化すること、及び、グループ毎に各サブグループの要素数を均等化することを目標として、前記学習用データセットから前記パラメータ設定用データセットを選択する、という構成が採用されている。

【0009】

上記の構成によれば、パラメータ設定用データセットに含まれている画像データのタイプに偏りが生じ難くなる。したがって、ハイパーパラメータが特定のタイプの画像データに特化されてしまうことによるモデルの性能低下が生じ難くなる。

【0010】

本発明の態様３に係る機械学習装置においては、本発明の態様１又は２に係る機械学習装置の加えて、前記プロセッサは、評価用データセットを用いて、前記モデルの性能を評価するモデル評価処理を更に実行し、前記セット作成処理において、前記プロセッサは、前記データセットに属する画像データのうち、前記学習用データセットの要素として選択されなかった画像データを、前記評価用データセットの要素として選択する、という構成が採用されている。

【0011】

上記の構成によれば、データセットに含まれる画像データを有効に活用して、モデルの性能を評価することができる。

【0012】

本発明の態様４に係る機械学習装置においては、態様３に係る機械学習装置の構成に加えて、前記モデル評価処理は、タイプ別評価用データセットを用いて、前記モデルの性能をタイプ別に評価するタイプ別評価処理を含み、前記プロセッサは、タイプ別評価用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、グループ毎に各サブグループの要素数を均等化することを目標として、前記評価用データセットから前記タイプ別評価用データセットの要素を選択する、という構成が採用されている。

【0013】

上記の構成によれば、データセットに含まれる画像データを有効に活用して、モデルの性能を画像データのタイプ別に評価することができる。

【0014】

本発明の態様５に係る機械学習装置においては、態様１～４の何れかに係る機械学習装置の構成に加えて、前記モデルの入力は、特定の物品を被写体として含む画像データであり、前記モデルの出力は、その物品の特定の部位の良否を示すクラスであり、前記タイプは、背景、前記物品、及び前記部位の一部又は全部の属性に注目して定義されたタイプである、という構成が採用されている。

【0015】

上記の構成によれば、特定の物品を被写体として含む画像データを入力とし、その物品の特定の部位の良否を示すクラスを出力とするモデルに関して、画像データのタイプの偏りに起因するモデルの性能低下が生じ難くなる。

【0016】

本発明の態様６に係る機械学習方法は、少なくとも１つのプロセッサが、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、学習用データセットを作成するセット作成処理と、前記プロセッサが、前記セット作成処理にて作成された学習用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルを構築するモデル構築処理と、を含み、前記セット作成処理において、前記プロセッサは、前記学習用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、各グループの要素数を均等化すること、及び、グループ毎に各サブグループの要素数を均等化することを目標として、前記データセットから前記学習用データセットの要素を選択する、という特徴を有している。

【0017】

【0018】

本発明の態様７に係る機械学習プログラムは、コンピュータを態様１～５の何れかに係る機械学習装置として動作させるためのプログラムであって、前記コンピュータが備えるプロセッサに前記各処理を実行させるプログラムである。

【0019】

上記の構成によれば、コンピュータを用いて上記の機械学習装置を実現することができる。

【0020】

本発明の態様８に係る評価装置は、少なくとも１つのプロセッサを備え、前記プロセッサは、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、評価用データセットを作成するセット作成処理と、前記セット作成処理にて作成された評価用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルの性能を評価するモデル評価処理と、を実行し、前記モデル評価処理は、タイプ別評価用データセットを用いて、前記モデルの性能をタイプ別に評価するタイプ別評価処理と、包括的評価用データセットを用いて、前記モデルの性能を包括的に評価する包括的評価処理と、を含み、前記プロセッサは、タイプ別評価用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、グループ毎に各サブグループの要素数を均等化することを目標として、前記評価用データセットから前記タイプ別評価用データセットの要素を選択する、という特徴を有している。

【0021】

上記の構成によれば、データセットに含まれる画像データを有効に活用して、モデルの性能を画像データのタイプ別に評価すること、及び、モデルの性能を包括的に評価することができる。

【0022】

本発明の態様９に係る評価方法は、少なくとも１つのプロセッサが、予め定められた複数のクラスの何れか、及び、予め定められた複数のタイプの何れかを示すラベルが付与された画像データからなるデータセットから、評価用データセットを作成するセット作成処理と、前記プロセッサが、前記セット作成処理にて作成された評価用データセットを用いて、画像データを入力とし、前記複数のクラスの何れかを出力とするモデルの性能を評価するモデル評価処理と、を含み、前記モデル評価処理は、タイプ別評価用データセットを用いて、前記モデルの性能をタイプ別に評価するタイプ別評価処理と、包括的評価用データセットを用いて、前記モデルの性能を包括的に評価する包括的評価処理と、を含み、前記プロセッサは、タイプ別評価用データセットをクラスに応じてグループに分け、更に、各グループをタイプに応じてサブグループに分けたときに、グループ毎に各サブグループの要素数を均等化することを目標として、前記評価用データセットから前記タイプ別評価用データセットの要素を選択する、という特徴を有している。

【0023】

【0024】

本発明の態様１０に係る評価プログラムは、コンピュータを態様８に係る評価装置として動作させるためのプログラムであって、前記コンピュータが備えるプロセッサに前記各処理を実行させるプログラムである。

【0025】

上記の構成によれば、コンピュータを用いて上記の評価装置を実現することができる。

【発明の効果】

【0026】

本発明の一態様によれば、学習用データセットに含まれている画像データのタイプの偏りに起因するモデルの性能低下が生じ難い機械学習技術を実現することができる。

【図面の簡単な説明】

【0027】

【図1】本発明の一実施形態に係る機械学習装置の構成を示すブロック図である。

【図2】図１の機械学習装置が実施する機械学習方法の流れを示すフロー図である。

【図3】背景、物品、及び部位の属性に注目して定義したタイプについて、各タイプに分類される画像データの表す画像を例示した図である。

【図4】本発明の一実施例を示す図である。（ａ）は、クラスＣ１（正常）を示すラベルが付与された画像データが表す画像の一例である。（ｂ）は、クラスＣ１（正常）を示すラベルが付与された別の画像データが表す画像の一例である。（ｃ）は、クラスＣ２（異常）を示すラベルが付与された画像データが表す画像の一例である。

【図5】本発明の一実施例を示す図である。クラスがＣ１（正常）である画像データについて、各タイプに分類される画像データの個数を示すヒストグラムである。

【図6】本発明の一実施例を示す図である。クラスがＣ２（異常）である画像データについて、各タイプに分類される画像データの個数を示すヒストグラムである。

【発明を実施するための形態】

【0028】

（機械学習装置の構成）
本発明の一実施形態に係る機械学習装置１の構成について、図１を参照して説明する。図１は、機械学習装置１の構成を示すブロック図である。

【0029】

機械学習装置１は、データセットＤを用いてモデルＭを構築及び評価する機械学習方法Ｓを実施するための装置である。機械学習装置１は、図１に示すように、メモリ１１と、プロセッサ１２と、ストレージ１３と、バス１４と、を備えている。メモリ１１、プロセッサ１２、及びストレージ１３は、バス１４を介して互いに接続されている。

【0030】

メモリ１１は、機械学習方法Ｓを実施するための機械学習プログラムＰ、及び、機械学習方法Ｓにおいて構築及び評価されるモデルＭを記録するための構成である。なお、メモリ１１としては、例えば、半導体ＲＡＭ（Random Access Memory）等を用いることができる。

【0031】

プロセッサ１２は、メモリ１１に記憶された機械学習プログラムＰに従って、機械学習方法Ｓを実行するための構成である。プロセッサ１２としては、例えば、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphic Processing Unit）、マイクロプロセッサ、デジタルシグナルプロセッサ、マイクロコントローラ、ＴＰＵ（Tensor Processing Unit）等のＡＳＩＣ（Application Specific Integrated Circuit）又は、これらの組み合わせ等を用いることができる。

【0032】

ストレージ１３は、機械学習方法Ｓにおいて参照されるデータセットＤを格納するための構成である。ストレージ１３としては、例えば、フラッシュメモリ、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、又は、これらの組み合わせ等を用いることができる。

【0033】

なお、ここでは、機械学習方法Ｓを単一のコンピュータに設けられた単一のプロセッサ１２が実行する構成について説明したが、これに限定されない。すなわち、機械学習方法Ｓを単一のコンピュータに設けられた、或いは、複数のコンピュータに分散して設けられた複数のプロセッサが共同して実行する構成を採用することも可能である。

【0034】

また、ここでは、データセットＤを単一のコンピュータに設けられた単一のストレージ１３に格納する構成について説明したが、これに限定されない。すなわち、データセットＤを単一のコンピュータに設けられた、或いは、複数のコンピュータに分散して設けられた複数のストレージに分散して格納する構成を採用することも可能である。

【0035】

なお、プロセッサ１２に機械学習方法Ｓを実行させるための機械学習プログラムＰは、コンピュータ読み取り可能な一時的でない有形の記録媒体に記録され得る。この記録媒体は、メモリ１１であってもよいし、ストレージ１３であってもよいし、その他の記録媒体であってもよい。例えば、テープ、ディスク、カード、半導体メモリ、プログラマブル論理回路が、その他の記録媒体として利用可能である。

【0036】

（機械学習方法の流れ）
機械学習装置１が実施する機械学習方法Ｓの流れについて、図２を参照して説明する。図２は、機械学習方法Ｓの流れを示すフロー図である。

【0037】

機械学習方法Ｓは、上述したように、データセットＤを用いてモデルＭを構築及び評価する方法である。機械学習方法Ｓは、図２に示すように、セット作成処理Ｓ１と、モデル構築処理Ｓ２と、モデル評価処理Ｓ３と、を含んでいる。

【0038】

データセットＤは、予め定められたｎ個のクラスＣ１，Ｃ２，…，Ｃｎの何れか、及び、予め定められたｍ個のタイプＴ１,Ｔ２，…，Ｔｍの何れかを示すラベルが付与された画像データの集合である。モデルＭは、画像データを入力とし、ｎ個のクラスＣ１，Ｃ２，…，Ｃｎの何れかを出力とするアルゴリズムである。なお、本実施形態においては、ＣＮＮ（Convolutional Neural Network）をモデルＭとして用いるが、ＣＮＮ以外のニューラルネットワーク、ロジスティック回帰モデル、サポートベクトルマシン、ランダムフォレストなどをモデルＭとして用いてもよい。

【0039】

セット作成処理Ｓ１は、データセットＤから、モデル構築処理Ｓ２において参照される学習用データセットＤＬと、モデル評価処理Ｓ３において参照される評価用データセットＤＴと、を作成する処理である。セット作成処理Ｓ１は、プロセッサ１２により実行され、作成された学習用データセットＤＬ及び評価データセットＴは、メモリ１１に記憶される。

【0040】

学習用データセットＤＬは、データセットＤの部分集合、すなわち、データセットＤから選択された画像データの集合である。学習用データセットＤＬの要素の選択は、学習用データセットＤＬをクラスに応じてグループＤＬ１，ＤＬ２，…，ＤＬｎに分け、更に、各グループＤＬｉ（ｉ＝１，２，…，ｎ）をタイプに応じてサブグループＤＬｉ１，ＤＬｉ２，…，ＤＬｉｍに分けたときに、（ａ）各グループＤＬｉの要素数を均等化すること、及び、（ｂ）グループ毎に各サブグループＤＬｉｊ（ｊ＝１，２，…，ｍ）の要素数を均等化することを目標として行われる。一方、評価用データセットＤＴは、データセットＤにおける学習用データセットＤＬの補集合、すなわち、データセットＤに属する画像データのうち、学習用データセットＤＬの要素として選択されなかった画像データの集合である。

【0041】

データセットＤから学習用データセットＤＬの要素を選択するアルゴリズムの一例を挙げれば、以下のとおりである。まず、データセットＤをクラスに応じてグループＤ１，Ｄ２，…，Ｄｎに分ける。次に、各グループＤｉをタイプに応じてサブグループＤｉ１，Ｄｉ２，…，Ｄｉｍに分ける。次に、各グループＤｉについて、閾値αｉを設定し、そのグループＤｉの各サブグループＤｉｊについて、（１）そのサブグループＤｉｊの要素数が閾値αｉ以下であれば、そのサブグループＤｉｊの全ての要素を選択し、（２）そのサブグループＤｉｊの要素数が閾値αｉよりも大きければ、そのサブグループＤｉｊからαｉ個の要素をランダムに選択する。ここで、閾値α１，α２，…，αｎは、学習用データセットＤＬの要素として各グループＤｉから選択される画像データの個数の分散が十分に小さくなるように（理想的には最小化するように）設定する。

【0042】

モデル構築処理Ｓ２は、セット作成処理Ｓ１にて作成された学習用データセットＤＬを用いてモデルＭを構築する処理である。モデル構築処理Ｓ２は、プロセッサ１２により実行され、構築されたモデルＭは、メモリ１１に記憶される。

【0043】

本実施形態に係るモデル構築処理Ｓ２は、係数設定処理と、パラメータ設定処理と、を含んでいる。係数設定処理は、係数設定用データセットＤＬａを用いて、モデルＭのノード間結合を規定する重み係数を設定する処理である。パラメータ設定処理は、パラメータ設定用データセットＤＬｂを用いて、モデルＭのネットワーク構造を規定するハイパーパラメータを設定する処理である。

【0044】

パラメータ設定用データセットＤＬｂは、学習用データセットＤＬの部分集合、すなわち、学習用データセットＤＬから選択された画像データの集合である。パラメータ設定用データセットＤＬｂの要素の選択は、パラメータ設定用データセットＤＬｂをクラスに応じてグループＤＬｂ１，ＤＬｂ２，…，ＤＬｂｎに分け、更に、各グループＤＬｂｉをタイプに応じてサブグループＤＬｂｉ１，ＤＬｂｉ２，…，ＤＬｂｉｍに分けたときに、（ａ）各グループＤＬｂｉの要素数を均等化すること、及び、グループ毎に各サブグループＤＬｂｉｊの要素数を均等化することを目標として行われる。一方、係数設定用データセットＤＬａは、学習用データセットＤＬにおけるパラメータ設定用データセットＤＬｂの補集合、すなわち、学習用データセットＤＬに属する画像データのうち、パラメータ設定用データセットＤＬｂの要素として選択されなかった画像データの集合である。

【0045】

学習用データセットＤＬからパラメータ設定用データセットＤＬｂの要素を選択するアルゴリズムの一例を挙げれば、以下のとおりである。まず、学習用データセットＤＬをクラスに応じてグループＤＬ１，ＤＬ２，…，ＤＬｎに分ける。次に、各グループＤＬｉをタイプに応じてサブグループＤＬｉ１，ＤＬｉ２，…，ＤＬｉｍに分ける。そして、各グループＤＬｉについて、閾値βｉ＝ｃαｉを設定し、そのグループＤＬｉの各サブグループＤＬｉｊについて、（１）そのサブグループＤＬｉｊの要素数が閾値βｉ以下であれば、そのサブグループＤＬｉｊの全ての要素を選択し、（２）そのサブグループＤＬｉｊの要素数が閾値βｉよりも大きければ、そのサブグループＤＬｉｊからβｉ個の要素をランダムに選択する。ここで、ｃは、１未満の実数であり、例えば、０．２である。

【0046】

モデル評価処理Ｓ３は、セット作成処理Ｓ１にて作成された評価用データセットＤＴを用いて、モデル構築処理Ｓ２にて構築されたモデルＭの性能を評価する処理である。モデル構築処理Ｓ２は、プロセッサ１２により実行され、評価結果は、メモリ１１に記憶される。

【0047】

本実施形態に係るモデル評価処理Ｓ３は、タイプ別評価処理と、包括的評価処理と、を含んでいる。タイプ別評価処理は、タイプ別評価用データセットＤＴａを用いて、モデルＭの性能を、画像データのタイプ別に評価する処理である。包括的評処理は、包括的評価用データセットＤＴｂを用いて、モデルＭの性能を、画像データのタイプに依らず包括的に評価する処理である。

【0048】

タイプ別評価用データセットＤＴａは、評価用データセットＤＴの部分集合、すなわち、評価用データセットＤＴから選択された画像データの集合である。タイプ別評価用データセットＤＴａの要素の選択は、タイプ別評価用データセットＤＴａをクラスに応じてグループＤＴａ１，ＤＴａ２，…，ＤＴａｎに分け、更に、各グループＤＴａｉをタイプに応じてサブグループＤＴａｉ１，ＤＴａｉ２，…，ＤＴａｉｍに分けたときに、グループ毎に各サブグループＤＴａｉｊの要素数を均等化することを目標として行われる。一方、包括的評価用データセットＤＴｂは、評価用データセットＤＴにおけるタイプ別評価用データセットＤＴａの補集合、すなわち、評価用データセットＤＴに属する画像データのうち、タイプ別評価用データセットＤＴａの要素として選択されなかった画像データの集合である。

【0049】

評価用データセットＤＴからタイプ別評価用データセットＤＴａの要素を選択するアルゴリズムの一例を挙げれば、以下のとおりである。まず、評価用データセットＤＴをクラスに応じてグループＤＴ１，ＤＴ２，…，ＤＴｎに分ける。次に、各グループＤＴｉをタイプに応じてサブグループＤＴｉ１，ＤＴｉ２，…，ＤＴｉｍに分ける。そして、閾値γを設定し、各サブグループＤＴｉｊについて、（１）そのサブグループＤＴｉｊの要素数が閾値γ以下であれば、そのサブグループＤＴｉｊの全ての要素を選択し、（２）そのサブグループＤＴｉｊの要素数が閾値γよりも大きければ、そのサブグループＤＴｉｊからγ個の要素をランダムに選択する。

【0050】

（タイプの具体例）
モデルＭの入力が、特定の物品を被写体として含む画像を表す画像データであり、モデルＭの出力が、その物品の特定の部位の良否を示すクラスＣ１，Ｃ２，…，Ｃｎである場合、タイプＴ１，Ｔ２，…，Ｔｍは、例えば、背景、物品、及び部位の属性に注目して定義することができる。例えば、表１に示す属性及び属性値に注目した場合、図３に示すように、２×２×２＝８個のタイプＴ１，Ｔ２，…，Ｔ８が定義される。

【表1】

【0051】

なお、タイプＴ１，Ｔ２，…，Ｔｍを定義するために注目する属性は、背景、物品、及び部位の全部の属性であってもよいし、背景、物品、及び部位の一部の属性であってもよい。背景、物品、及び部位の全部又は一部の属性に代えて、又は、背景、物品、及び部位の全部又は一部の属性に加えて、カメラ、製造者、製造時期、製造環境（例えば温度）、画像の品質（例えば解像度）、製品、及び光源の全部又は一部の属性に注目してタイプＴ１，Ｔ２，…，Ｔｍを定義してもよい。

【0052】

（適用例）
データセットＤとして、線状部品を被写体として含む画像データの集合を用意した。データセットＤに属する各画像データには、クラス及びタイプを示すラベルを付与した。クラスは、線状部品に印刷された、数値を表現する記号が正常であることを示すクラスＣ１、及び、同記号が異常であることを示すクラスＣ２の何れかである。タイプは、表２に示す属性及び属性値に注目して定義された３×２×２×３×９×２＝６４８個のタイプＴ１，Ｔ２，…，Ｔ６４８の何れかである。

【表2】

【0053】

図４の（ａ）は、クラスＣ１（正常）を示すラベルが付与された画像データが表す画像の一例である。この画像データは、背景の黒ずみ＝無、被写体の色＝白、白飛びの有無＝無、線ブレ＝なし、記号の表示数値＝３、記号の個数＝６に対応するタイプに分類される。図４の（ｂ）は、クラスＣ１（正常）を示すラベルが付与された画像データが表す画像の一例である。この画像データは、背景の黒ずみ＝全体、被写体の色＝白、白飛びの有無＝無、線ブレ＝なし、記号の表示数値＝３、記号の個数＝６に対応するタイプに分類される。図４の（ｃ）は、クラスＣ２（異常）を示すラベルが付与された画像データが表す画像の一例である。この画像データは、背景の黒ずみ＝無、被写体の色＝白、白飛びの有無＝有、線ブレ＝なし、記号の表示数値＝３、記号の個数＝１に対応するタイプに分類される。

【0054】

上述したアルゴリズムに従って、データセットＤから、係数設定用データセットＤＬａ、パラメータ設定用データセットＤＬｂ、タイプ別評価用データセットＤＴａ、及び包括的評価用データセットＤＴｂを作成した。なお、学習用データセットＤＬを作成する際に利用する閾値α１，α２は、α１＝１０，α２＝５０とした。また、パラメータ設定用データセットＤＬｂを作成する際に利用する閾値β１，β２は、β１＝２、β２＝１０とした。また、タイプ別評価用データセットＤＴａを作成する際に利用する閾値γは、γ＝２とした。得られた係数設定用データセットＤＬａ、パラメータ設定用データセットＤＬｂ、タイプ別評価用データセットＤＴａ、及び包括的評価用データセットＤＴｂの要素数をクラス毎に示せば、表３のとおりである。

【表3】

【0055】

図５は、クラスがＣ１（正常）である画像データについて、各タイプの画像データの個数を示すヒストグラムである。図６は、クラスがＣ２（異常）である画像データについて、各タイプの画像データの個数を示すヒストグラムである。図５及び図６においては、実際にデータセットＤＳに含まれていた１２１個のタイプについて、各タイプに属する画像データの個数を用途別に示している。図５及び図６によれば、学習用データセットＤＬ（係数設定用データセットＤＬａ及びパラメータ設定用データセットＤＬｂ）をクラスに応じてグループＬ１，Ｌ２に分け、更に、各グループＬｉをタイプに応じてサブグループＬｉ１，Ｌｉ２，…，Ｌｉ６４８に分けたときに、（ａ）各グループＬｉの要素数が概ね均等化されており、（ｂ）グループ毎に各サブグループＬｉｊの要素数が概ね均等化されていることが分かる。また、パラメータ設定用データセットＤＬｂをクラスに応じてグループＤＬｂ１，ＤＬｂ２に分け、更に、各グループＤＬｂｉをタイプに応じてサブグループＤＬｂｉ１，ＤＬｂｉ２，…，ＤＬｂｉ６４８に分けたときに、（ａ）各グループＤＬｂｉの要素数が概ね均等化されており、（ｂ）グループ毎に各サブグループＤＬｂｉｊの要素数が概ね均等化されていることが分かる。また、タイプ別評価用データセットＤＴａをクラスに応じてグループＤＴａ１，ＤＴａ２に分け、更に、各グループＤＴａｉをタイプに応じてサブグループＤＴａｉ１，ＤＴａｉ２，…，ＤＴａｉ６４８に分けたときに、グループ毎に各サブグループＤＴａｉｊの要素数が概ね均等化されていることが分かる。

【0056】

タイプ別評価及び包括的評価の結果を表４に示す。表４によれば、タイプ別にみても包括的にみても実際（ラベルが示すクラス）と予測（モデルＭが出力したクラス）とが完全に一致しており、正解率１００％が実現されていることが分かる。

【表4】

【0057】

なお、学習用データセットの選択に際して、各グループＬｉの要素数を均等化することのみを目的として、グループ毎に各サブグループＬｉｊの要素数を均等化することを目標としなかった場合、タイプ別評価及び包括的評価の結果は、表５のようになる。表５によれば、タイプ別に見ても包括的に見ても実際と予測とが一致しておらず、正解率１００％が実現されていないことが分かる。

【表5】

【0058】

（付記事項）
本発明は上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能である。異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても、本発明の技術的範囲に含まれる。

【符号の説明】

【0059】

１機械学習装置
１１メモリ
１２プロセッサ
１３ストレージ
１４バス
Ｓ機械学習方法
Ｓ１セット作成処理
Ｓ２モデル構築処理
Ｓ３モデル評価処理
Ｄデータセット
ＤＬ学習用データセット
ＤＬａ係数設定用データセット
ＤＬｂパラメータ設定用データセット
ＤＴ評価用データセット
ＤＴａタイプ別評価用データセット
ＤＴｂ包括的評価用データセット

【図1】

【図2】

【図3】

【図4】

【図5】

【図6】

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版