(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2022-01-14
(45)【発行日】2022-01-26
(54)【発明の名称】学習データ生成方法、学習データ生成プログラム、学習データ生成装置、および機械学習モデル生成方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20220118BHJP
【FI】
G06N20/00 130
(21)【出願番号】P 2021561926
(86)(22)【出願日】2021-01-29
(86)【国際出願番号】 JP2021003292
【審査請求日】2021-10-18
【早期審査対象出願】
(73)【特許権者】
【識別番号】594124993
【氏名又は名称】東京貿易テクノシステム株式会社
(74)【代理人】
【識別番号】100148301
【氏名又は名称】竹原 尚彦
(74)【代理人】
【識別番号】100176991
【氏名又は名称】中島 由布子
(74)【代理人】
【識別番号】100217696
【氏名又は名称】川口 英行
(72)【発明者】
【氏名】川本 貴志
(72)【発明者】
【氏名】倉持 幸正
【審査官】多胡 滋
(56)【参考文献】
【文献】特開2018-205163(JP,A)
【文献】特開2020-001127(JP,A)
【文献】特開2017-092622(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
学習対象の正規データから、学習用の疑似データを生成する疑似データ生成ステップと、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成ステップと、を有
し、
前記疑似データで規定される前記学習対象の形状は、前記学習対象の測定形状と、前記正規データで規定される正規形状との差異を反映した形状である、学習データ生成方法。
【請求項2】
請求項1において、
前記疑似学習データで規定される前記学習対象の形状は、前記学習対象の測定形状が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している、学習データ生成方法。
【請求項3】
学習対象の正規データから、学習用の疑似データを生成する疑似データ生成ステップと、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成ステップと、を有し、
前記疑似データで規定される前記学習対象の検査パラメータは、前記学習対象の検査波形と、前記正規データで規定される正規波形との差異を反映したものである、学習データ生成方法。
【請求項4】
請求項3において、
前記疑似学習データで規定される前記学習対象の検査パラメータは、前記学習対象の検査波形が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している、学習データ生成方法。
【請求項5】
請求項1から請求項4の何れか一項において、
前記疑似データは、前記正規データに対する乱数を用いた処理により生成される、学習データ生成方法。
【請求項6】
請求項1から請求項5の何れか一項において、
前記疑似データ生成ステップでは、前記差異が異なる疑似データを複数生成する、学習データ生成方法。
【請求項7】
請求項1から請求項6の何れか一項において、
前記疑似学習データは、前記疑似データに対する乱数を用いた処理により生成される、学習データ生成方法。
【請求項8】
請求項1から請求項7の何れか一項において、
前記疑似学習データ生成ステップでは、異なるエラーを含む疑似学習データが複数生成され、
前記学習データは、前記疑似学習データと同数生成される、学習データ生成方法。
【請求項9】
学習対象の形状の正規データから、学習用の疑似データを生成する疑似データ生成ステップと、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成ステップと、
前記学習データが複数入力されると共に、入力された複数の学習データに基づいて、機械学習モデルを作成する機械学習モデル生成ステップと、を有し、
前記疑似データで規定される前記学習対象の形状は、前記学習対象の測定形状と、前記正規データで規定される正規形状との差異を反映した形状である、機械学習モデル生成方法。
【請求項10】
請求項9において、
前記疑似データは、前記正規データに対する乱数を用いた処理により生成される、機械学習モデル生成方法。
【請求項11】
請求項9または請求項10において、
前記疑似学習データは、前記疑似データに対する乱数を用いた処理により生成される、機械学習モデル生成方法。
【請求項12】
機械学習用の学習データ生成プログラムであって、
コンピュータを、
学習対象の正規データから、学習用の疑似データを生成する疑似データ生成手段、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成手段、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成手段と、して機能させ、
前記疑似データで規定される前記学習対象の形状は、前記学習対象の測定形状と、前記正規データで規定される正規形状との差異を反映した形状である、学習データ生成プログラム。
【請求項13】
請求項12において、
前記疑似学習データで規定される前記学習対象の形状は、前記学習対象の測定形状が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している、学習データ生成プログラム。
【請求項14】
機械学習用の学習データ生成プログラムであって、
コンピュータを、
学習対象の正規データから、学習用の疑似データを生成する疑似データ生成手段、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成手段、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成手段と、して機能させ、
前記疑似データで規定される前記学習対象の検査パラメータは、前記学習対象の検査波形と、前記正規データで規定される正規波形との差異を反映したものである、学習データ生成プログラム。
【請求項15】
請求項14において、
前記疑似学習データで規定される前記学習対象の検査パラメータは、前記学習対象の検査波形が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している、学習データ生成プログラム。
【請求項16】
請求項12から請求項15の何れか一項において、
前記疑似データ生成手段は、前記疑似データを、前記正規データに対する乱数を用いた処理により生成する、学習データ生成プログラム。
【請求項17】
請求項12から請求項16の何れか一項において、
前記疑似データ生成手段は、前記差異が異なる疑似データを複数生成する、学習データ生成プログラム。
【請求項18】
請求項12から請求項17の何れか一項において、
疑似学習データ生成手段は、前記疑似学習データを、前記疑似データに対する乱数を用いた処理により生成する、学習データ生成プログラム。
【請求項19】
請求項12から請求項18の何れか一項において、
前記疑似学習データ生成手段は、異なるエラーを含む疑似学習データを複数生成し、
前記学習データ生成手段は、前記学習データを、前記疑似学習データと同数生成する、学習データ生成プログラム。
【請求項20】
学習対象の正規データから、学習用の疑似データを生成する疑似データ生成部と、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成部と、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成部と、を有し、
前記疑似データで規定される前記学習対象の形状は、前記学習対象の測定形状と、前記正規データで規定される正規形状との差異を反映した形状である、学習データ生成装置。
【請求項21】
請求項20において、
前記疑似学習データで規定される前記学習対象の形状は、前記学習対象の測定形状が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している、学習データ生成装置。
【請求項22】
学習対象の正規データから、学習用の疑似データを生成する疑似データ生成部と、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成部と、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成部と、を有し、
前記疑似データで規定される前記学習対象の検査パラメータは、前記学習対象の検査波形と、前記正規データで規定される正規波形との差異を反映したものである、学習データ生成装置。
【請求項23】
請求項22において、
前記疑似学習データで規定される前記学習対象の検査パラメータは、前記学習対象の検査波形が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している、学習データ生成装置。
【請求項24】
請求項20から請求項23の何れか一項において、
前記疑似データ生成部は、前記疑似データを、前記正規データに対する乱数を用いた処理により生成する、学習データ生成装置。
【請求項25】
請求項20から請求項24の何れか一項において、
前記疑似データ生成部は、前記差異が異なる疑似データを複数生成する、学習データ生成装置。
【請求項26】
請求項20から請求項25の何れか一項において、
疑似学習データ生成部は、前記疑似学習データを、前記疑似データに対する乱数を用いた処理により生成する、学習データ生成装置。
【請求項27】
請求項20から請求項26の何れか一項において、
前記疑似学習データ生成部は、異なるエラーを含む疑似学習データを複数生成し、
前記学習データ生成部は、前記学習データを、前記疑似学習データと同数生成する、学習データ生成装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習データ生成方法、学習データ生成プログラム、学習データ生成装置、および機械学習モデル生成方法に関する。
【背景技術】
【0002】
特許文献1には、深層学習を用いた画像認識方法が開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
深層学習は、機械学習の手法の1つであり、機械学習モデルの作成に用いられる。機械学習モデルを作成するためには、膨大な量の学習データが必要である。
さらに、教師あり学習により機械学習モデルを作成するためには、用意した学習データの各々を、正解ラベルをつけて学習する必要がある。そのため、機械学習モデルの作成を、より簡便に行えるようにすることが求められている。
【課題を解決するための手段】
【0005】
本発明の一態様は、
学習対象の正規データから、学習用の疑似データを生成する疑似データ生成ステップと、
前記疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと、
前記疑似データをラベルとし、当該ラベルと前記疑似学習データとの組み合わせを学習データとする学習データ生成ステップと、を有する、学習データ生成方法である。
【発明の効果】
【0006】
本発明の一態様によれば、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【図面の簡単な説明】
【0007】
【
図1】機械学習モデル生成装置の概略構成図である。
【
図3】正規データより生成された基準データで規定される断面形状を説明する図である。
【
図4】疑似データで規定される断面形状を説明する図である。
【
図5】基準データに対する乱数処理で得られる疑似学習データを説明する図である。
【
図6】機械学習モデル生成装置における学習データの生成過程を説明するフローチャートである。
【
図7】学習データの生成過程で生成されるデータを説明する図である。
【
図8】機械学習モデル生成装置における機械学習モデルの生成過程を説明するフローチャートである。
【
図9】測定データから、対象物の学習データを生成する過程を説明する図である。
【
図10】機械学習モデル生成装置における学習データの生成過程の他の態様を説明するフローチャートである。
【発明を実施するための形態】
【0008】
以下、本発明の実施形態を、学習対象がプレス成形品である場合を例に挙げて説明する。
図1は、機械学習モデル生成装置1の概略図である。
機械学習モデル生成装置1は、処理部11と、記憶部12と、入出力ポート(I/O)13と、を備えており、これらは、バス14を介して、互いに接続されている。
機械学習モデル生成装置1の入出力ポート13には、入力装置21と出力装置22が接続されている。
【0009】
入力装置21は、機械学習モデル生成装置1に対して指示を入力するためのインタフェースである。入力装置21として、キーボードやマウスなどが例示される。
出力装置22は、文字や画像などの情報を出力するためのインタフェースである。出力装置22として、モニタやプリンタなどが例示される。
なお、ネットワークNTを介して、機械学習モデル生成装置1に接続された携帯端末MTを、入力装置21や出力装置22として採用しても良い。
【0010】
機械学習モデル生成装置1の入出力ポート13には、3Dスキャナ30が接続されている。3Dスキャナ30は、プレス成形品(学習対象)の表面を走査して、プレス成形品の形状を特定するための測定データを生成する。生成された測定データは、3Dスキャナ30による走査の間、機械学習モデル生成装置1に連続的に入力される。
ここで、測定データは、プレス成形品の表面の三次元空間における座標を特定化可能なデータである。三次元空間における座標を特定化可能な点群データ、ポリゴンデータなどが例示される。
【0011】
処理部11は、CPUやGPUなどのプロセッサであり、記憶部12に記憶されたプログラムに基づいて、プログラムで規定された処理を実行する。
記憶部12は、例えばHDDやSSD、そしてメモリなどの情報の保持と書き換えが可能な記録媒体であり、処理部11で実施される各処理の制御プログラムなどを記憶する。さらに、記憶部12は、処理の過程で生成される情報を一時的に記憶する。
【0012】
さらに、入出力ポート13には、ネットワークNTを介して、データサーバ23が接続されている。
データサーバ23には、学習対象の正規データが記憶されている。
学習対象とは、機械学習モデルを作成する対象を意味する。本実施形態では、プレス成形品の形状を規定する3次元または2次元の形状データが、学習対象の正規データに相当する。
【0013】
例えば、プレス成形品の全体形状を規定する三次元形状データ(3Dデータ)や、プレス成形品の断面形状を規定する二次元形状データ(2Dデータ)が、本実施形態における学習対象の正規データに相当する。なお、正規データは、プレス成形品の設計データともいえる。
【0014】
なお、学習対象の正規データは、必ずしも、データサーバ23に記憶されている必要は無い。例えば、機械学習モデル生成装置1の記憶部12や、入出力ポート13に着脱可能な外部記憶媒体、例えばフラッシュメモリに記憶されていても良い。
【0015】
処理部11は、記憶部12に記憶されているプログラムに基づいて、学習対象(プレス成形品)の正規データから機械学習用の学習データを生成する。さらに、処理部11は、生成した学習データから機械学習モデルを作成する。
【0016】
図9は、3Dスキャナ30の測定データから、プレス成形品の学習データを生成する過程を説明する図である。
3Dスキャナ30の測定データから、学習対象であるプレス成形品の学習データを作成する場合、以下の手順で学習データが生成される。
(a)3Dスキャナ30によるプレス成形品の走査により、プレス成形品の3次元形状データを生成するための測定データを取得する。3次元形状データは、プレス成形品の形状を規定するデータである。
(b)取得した測定データから、プレス成形品のある断面の形状を規定する2次元形状データ(形状データ)を生成する。
(c)生成された2次元形状データには、後記するノイズや欠損が含まれているので、ノイズや欠損を修正した2次元形状データとするためのラベルを生成する。
(d)(b)で生成した2次元形状データと、(c)で生成したラベルとの組み合わせを学習データとする。
(e)(a)~(d)を所定回数繰り返して、ある断面に対する学習データを複数作成する。
(f)他の断面についても、(a)から(d)を所定回数繰り返して、プレス成形品の全体に対して学習データを複数作成する。
(g)作成した複数の学習データを用いて、プレス成形品に関する機械学習モデルを生成する。
【0017】
ここで、3Dスキャナ30でプレス成形品を走査するときの環境等は、取得される3次元形状データの質に影響を及ぼす。また、3Dスキャナ30を使用する作業者の走査方法もまた、取得される3次元形状データの質に影響を及ぼす。
3次元形状データに及んだ影響は、生成される2次元形状データにおけるノイズや欠損の原因となる。
【0018】
そのため、測定データから生成した2次元形状データは、ノイズや欠損を含んでいる。
例えば、
図9の(a)に示す断面形状は、ノイズや欠損を含む2次元形状データに対応するものであるが、断面形状に、存在しない筈の断面部分と欠損部分を含んでいる。
図9の(b)は、
図9の(a)に示す断面形状のうち、ノイズ成分を太線で判りやすく示した図である。
図9の(c)は、
図9の(a)に示す断面形状のうち、欠損成分を白抜きで判りやすく示した図である。
図9の(b)の断面形状と、
図9の(c)の断面形状を重畳表示したものが、
図9の(a)に示すノイズと欠損を含む断面形状である。
【0019】
図9の(a)に示す断面形状を規定する2次元形状データ(形状データ)が得られた場合、ノイズ成分を除去すると共に欠損成分を補完して、
図9の(e)に示す正解の形状を規定する2次元形状データにするためのラベルを生成する必要がある。
そのためには、
図9の(b)、(c)におけるノイズ成分の位置および範囲の認定と、欠損成分の位置および範囲の認定を行う必要があり、従来では、この認定作業に人が介在していた。
【0020】
ここで、ノイズや欠損を含む2次元形状データにおいて、ノイズや欠損を修正して、正解形状を規定する2次元形状データとするためのラベルを生成する際には、ラベルは、生成された二次元形状データの各々について、1つずつ作成する必要がある。
ノイズや欠損の位置および範囲は、2次元形状データ毎に異なる。そのため、ラベルの作成のためには、2次元形状データ毎にノイズや欠損の位置および範囲を特定する必要があり、ラベルの作成に時間がかかる。
とくに、機械学習モデルの作成には、同一の断面であっても、複数の学習データが必要となるので、学習データの作成に、いっそうの時間と手間がかかる。
【0021】
そのため、本実施形態では、学習データをより簡便に作成できるようにするために、以下のようにしている。
(a)処理部11が、プレス成形品の形状を規定する正規データから、プレス成形品のある断面について、疑似データ(疑似形状データ)を生成する。
(b)生成した疑似データから、疑似ノイズと疑似欠損を含んだ疑似学習データを生成する。
(c)処理部11が、疑似データをラベルとし、疑似データと、この疑似データから生成した疑似学習データとの組み合わせを、プレス成形品の学習データとして決定する。
(d)(a)~(c)を所定回数繰り返して、ある断面に対する学習データを複数作成する。
(e)他の断面についても、(a)から(d)を所定回数繰り返して、プレス成形品の全体に対して学習データを複数作成する。
(d)作成した複数の学習データを用いて、プレス成形品に関する機械学習モデルを作成する。
【0022】
すなわち、学習データの生成にあたり、測定データに代えて正規データを用いており、正規データから、疑似データを生成し、生成した疑似データから、疑似ノイズと疑似欠損を含んだ疑似学習データを生成している。
疑似データは、疑似学習データから疑似データを復元(推論)するためのラベルに相当するので、ラベルの作成における人の介在を無くすことができる。
さらに、人の介在を必要とするプレス成形品の測定も行う必要が無い。
これにより、機械学習モデルの作成に必要な学習データを、人の介在を必要とせずに簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0023】
以下、疑似学習データを用いた学習データの生成を具体的に説明する。
図2は、処理部11の機能ブロック図である。
処理部11は、正規データ取得部110と、基準データ生成部111と、乱数発生部112と、疑似データ生成部113と、疑似学習データ生成部114と、学習データ生成部115と、機械学習モデル生成部116と、を有する。
【0024】
ある学習対象の機械学習モデルの生成が指示されると、正規データ取得部110は、データサーバ23(
図1参照)から、学習対象の正規データを取得する。
ここで、学習対象がプレス成形品である場合、プレス成形品の形状を規定する3次元形状データ(設計データ)が、正規データに相当する。学習対象とは、機械学習モデルの作成の対象を意味する。
また、学習対象が、複数のプレス成形品の組み合わせ部品である場合には、組み合わせ部品の形状を規定する3次元形状データが正規データに相当する。
ここで、3次元形状データは、3次元空間内におけるプレス成形品の表面の位置を特定するための点群データ、ポリゴンデータなどである。
【0025】
基準データ生成部111は、プレス成形品の3次元形状データから、プレス成形品における指定された部位の基準データを生成する。本実施形態では、プレス成形品における指定された部位の断面形状データ(2次元形状データ)が、基準データに相当する。
なお、基準データを生成する部位の指定は、入力装置21や携帯端末MTを介して行われる。基準データを生成する部位は、記憶部12に記憶されたプログラムであらかじめ指定された部位であっても良い。
【0026】
図3は、基準データにより規定される断面形状であって、基準データが正規データから生成されたものである場合を説明する図である。
図4は、基準データに対する乱数処理で得られる疑似データを説明する図である。
【0027】
例えば、基準データ生成部111は、
図3に示す断面形状を規定する基準データを、プレス成形品の3次元形状データから生成する。
図3では、2つのプレス成形品50a、50bを組み合わせた部品Pにおけるある断面の一方の面(表側の面)と他方の面(裏側の面)の形状が実線で示されている。
図3では、部品Pの一方の面と他方の面との間領域の部分に、仮想線のハッチングが付されている。一方の面と他方の面との間領域の位置を判り易くするためである。
【0028】
乱数発生部112は、疑似データを生成するための乱数と、疑似学習データを生成するための乱数を、それぞれ生成する。
疑似データ生成部113は、乱数発生部112で生成した乱数を用いて、基準データ生成部111から入力された基準データに対して乱数処理を実施する。
【0029】
ここで、本実施形態では、基準データは、プレス成形品の設計上の断面形状を規定するデータである。しかし、設計データに基づいて実際に作成されるプレス成形品の形状は、設計上の形状とは完全に一致しない。
そのため、本実施形態では、基準データに乱数処理を施して、プレス成形品の実際の形状を模した形状を規定する疑似データを生成する。
【0030】
例えば、
図4において左側に示す断面形状を規定する基準データに対して乱数処理を行うと、
図4の右側に示す断面形状を規定する疑似データが生成される。
図4の右側では、基準データで規定される断面形状が細線で示されており、疑似データで規定される断面形状が太線で示されている。
【0031】
基準データに乱数処理を施すことで、基準データで規定される断面形状とは完全に一致しない断面形状を規定する疑似データが生成される。
本実施形態では、正規データ(設計データ)から生成された基準データに対して乱数処理を施すことで、実際に作成されるプレス成形品が取り得る形状を擬似的に表現するための疑似データを生成している。
【0032】
ここで、異なる乱数の値を用いて乱数処理を行うと、異なる形状を規定する疑似データが生成される。実際に作成されるプレス成形品の形状は、プレス成形品ごとに僅かな形状的な差異を有している。異なる乱数の値を用いて乱数処理を行うことで、実際に作成されるプレス成形品の形状の差異を反映して、複数種類の疑似データを生成できる。
【0033】
なお、乱数処理には、乱数とアルゴリズムが用いられる。乱数の値の設定と、アルゴリズムの選択を適宜行うことで、様々な外乱を想定した疑似データと疑似学習データを生成できる。
例えば、外乱が、プレス成型品のひずみである場合、プレス成形品の基準形状にひずみを加えるアルゴリズムを構築する。そして、アルゴリズム内の変数を、指定範囲内の乱数で与えることで、プレス成形品において実際に生じうる多様なひずみを疑似的に再現できる。
【0034】
なお、乱数処理を行うときの乱数の値は、1種類のみに限定されない。プレス成形品のひずみを表現するための乱数と、プレス成形品の設計形状との誤差を表現するための乱数を別々に用意し、これら異なる種類の乱数の値を複数用いて、疑似データを生成しても良い。
【0035】
この場合において、ひずみを表現するための乱数と、設計形状との誤差を表現するための乱数を、複数ずつ用意してもよい。例えば、プレス成形品の屈曲部におけるひずみを表現するための乱数や、プレス成形品の平坦部におけるひずみ(反り)を表現するための乱数を用意し、それぞれ異なる乱数の値を設定してもよい。
また、乱数の値は、必ずしも1つの数値である必要は無い。例えば、乱数の値として選択可能な範囲をあらかじめ設定しておき、ひずみを表現するための乱数と、設計形状との誤差を表現するための乱数が、それぞれ決められた範囲内に収まる任意の値となるようにしても良い。
【0036】
なお、学習対象が、複数のプレス成形品の組み付けにより形成される部品(組付部品)である場合、疑似データが規定する形状には、各プレス成形品の公差が積み上がった結果として生じるエラーが少なくとも含まれる。例えば、組み付け部品同士の位置関係のばらつき、一部の組み付け部品に生じ得る成形不良などの誤差に起因するエラーが少なくとも含まれる。
【0037】
疑似学習データ生成部114は、乱数発生部112で生成した乱数を用いて、疑似データに対する乱数処理を実施する。
【0038】
例えば、
図5の(a)の左側に示す断面形状を規定する疑似データに対して乱数処理を行うと、
図5(a)の右側に示す断面形状を規定する疑似学習データが生成される。
【0039】
本実施形態では、疑似データに乱数処理を施して、疑似ノイズや疑似欠損を含む疑似学習データを生成している。疑似ノイズや疑似欠損を含む疑似学習データにより規定される断面形状は、
図5の(b)に示すように、本来存在しない部位(図中、疑似ノイズN)や、存在すべき部位に抜け(図中、疑似欠損L)を含むものとなる。
【0040】
学習データ生成部115は、疑似学習データから疑似データを推論するためのラベルと、疑似学習データとの組み合わせを、学習データとして機械学習モデル生成部116に出力する。
前記したように疑似学習データは、疑似データに乱数処理を施して生成したものであり、疑似ノイズや疑似欠損を含んでいる。ラベルとは、疑似ノイズや疑似欠損を含む疑似学習データから、疑似ノイズを取り除くと共に疑似欠損を補完して、疑似データを推論するための情報である。
【0041】
本実施形態では、疑似データ生成部113が生成した疑似データを、疑似学習データから疑似データを推論するためのラベルとしている。
ここで、ラベルと、ラベルに対応する疑似学習データとの組み合わせが、教師あり学習により機械学習モデルを作成する際の学習データに相当する。そして、ラベルが、教師あり学習における正解ラベルに相当する。
【0042】
ここで、疑似学習データの生成に用いられた疑似データは、前記した基準データ生成部111が、プレス成形品における指定された部位に対して生成した基準データ(断面形状データ)から生成したものである。
本実施形態では、指定された部位に対して、複数の学習データが生成される。
学習データ生成部115は、あらかじめ決められた数の学習データが作成された時点で、複数の学習データを、プレス成形品における指定された部位の機械学習用のデータ(学習データ群)として、機械学習モデル生成部116に出力する。
【0043】
機械学習モデル生成部116は、複数の学習データに基づいて機械学習を行って、学習モデルを生成する。
一例として、機械学習モデル生成部116は、教師あり学習用のアルゴリズムを利用して、入力された学習データ群の特徴量を抽出する。そして、機械学習モデル生成部116は、特徴量エンジニアリング(抽出した特徴量の取捨選択と最適化など)を行って、機械学習モデルを生成する。さらに、機械学習モデル生成部116は、生成した機械学習モデルの検証および評価、パラメータの調整などを行って、機械学習モデルを生成する。
【0044】
例えば、本実施形態で生成される機械学習モデルが、測定データから生成された2次元形状データにおけるノイズや欠損を修正することを目的としたものである場合、以下のことがいえる。
例えば、3Dスキャナ30の測定データから最終的に生成された2次元形状データが、
図9の(a)に示す断面形状を規定する形状データ(実測)である場合、本実施形態で示した手順で生成した機械学習モデルを用いると、
図9の(a)に示す断面形状を規定する形状データ(実測)から、
図9の(e)に示す正解形状を規定する形状データ(正解)を、適切に生成できる。
【0045】
以下、機械学習モデル生成装置1における学習データの生成過程を具体的に説明する。
図6は、機械学習モデル生成装置1における学習データの生成過程を説明するフローチャートである。
図7は、学習データの生成過程を、学習対象がプレス成形品50a、50bの場合を例に挙げて説明する図である。
【0046】
機械学習モデル生成装置1の処理部11は、プレス成形品50a、50bの正規データ(設計データ)を用いて、機械学習用の学習データを生成する。
ステップS101において、処理部11の正規データ取得部110は、プレス成形品50a、50bの正規データ(3次元形状データ)を、データサーバ23から取得する。
【0047】
ステップS102において基準データ生成部111は、取得した正規データ(3次元形状データ)から、プレス成形品50a、50bにおける指定された部位の基準データ(2次元形状データ)を生成する(
図7参照)。基準データは、プレス成形品50a、50bにおける指定された部位の断面形状を規定するデータである。
なお、基準データを生成する部位の指定は、入力装置21や携帯端末MTを介して行われる。生成された基準データは、疑似データ生成部113に出力される。
【0048】
基準データが生成されると、ステップS103において乱数発生部112は、疑似データを生成するための乱数を発生させる。発生した乱数は、疑似データ生成部113に出力される。
【0049】
ステップS104において、疑似データ生成部113は、基準データに対する乱数処理を実施して、疑似データを生成する。ここで、疑似データは、実際に作成されるプレス成形品が取り得る形状を、疑似データで規定される形状において再現するために生成される。プレス成形品が取り得る形状とは、実際に作成されるプレス成形品が持つ歪みや、設計データで規定される形状との差異(成形誤差)を意味する。
【0050】
なお、本実施形態では、基準データが規定する断面形状に、歪みや成形誤差などを生じさせるためのパラメータとして、乱数を使用しているが、基準データに歪みや成形誤差などを生じさせることができるパラメータであれば、他のパラメータを用いても良い。
【0051】
疑似データが生成されると、ステップS105において乱数発生部112は、疑似学習データを生成するための乱数を発生させる。発生した乱数は、疑似学習データ生成部114に出力される。
なお、疑似学習データを生成するための乱数は、疑似データで規定される断面形状に疑似ノイズや疑似欠損を生じさせるためのパラメータとして生成される。本実施形態では、疑似データに疑似ノイズや疑似欠損を生じさせることができるパラメータであれば、乱数に代えて、他のパラメータを用いても良い。
【0052】
ステップS106において、疑似学習データ生成部114は、疑似データに対する乱数処理を実施して、疑似ノイズや疑似欠損を持つ疑似学習データを生成する。
【0053】
疑似データに対して乱数処理を行うと、乱数処理により得られた疑似学習データで規定される断面形状に、疑似ノイズNや疑似欠損Lが生成される(
図5参照)。本実施形態では、この疑似ノイズNや疑似欠損Lを持つ断面形状を規定する形状データを、疑似学習データとしている。
よって、「疑似ノイズや疑似欠損を持つ疑似学習データ」とは、当該疑似学習データにより規定される形状が、疑似ノイズに相当する部位や、疑似欠損に相当する部位を持つことを意味する。
【0054】
ステップS107において、疑似学習データ生成部114は、生成された疑似学習データの総数が、目標数に達したか否かを確認する。
目標数は、入力装置21などを介して設定される。なお、目標数は、疑似学習データを生成するためのプログラムにおいて、あらかじめ設定されていた値であっても良い。
【0055】
生成された疑似学習データの総数が目標数に達していない場合(ステップS107、No)、ステップS103からステップS106の処理が、生成された疑似学習データの総数が目標数に達するまで繰り返し実施される(
図6参照)。
生成された疑似学習データの総数が目標数に達している場合(ステップS107、Yes)、ステップS108において学習データ生成部115は、学習データを生成する。
具体的には、学習データ生成部115が、疑似データ生成部113が生成した疑似データをラベルとし、この疑似データと、この疑似データから生成された疑似学習データとの組み合わせを、学習データとして決定する。
【0056】
図7に示すように、本実施形態では、ひとつの基準データ(正規データ)に対して、複数の疑似データが生成される。そして、疑似データの各々について、疑似学習データが複数ずつ生成される。
疑似学習データは、疑似データに対する乱数処理により生成されるものであり、疑似学習データは、疑似ノイズNや疑似欠損Lを持つ断面形状を規定する。
本実施形態では、乱数処理毎に異なる値の乱数が決定されるので、
図7に示すように、得られた疑似学習データにより規定される断面形状では、異なる位置に疑似ノイズNや疑似欠損が含まれている。
【0057】
本実施形態では、乱数処理前の疑似データをラベルとし、疑似学習データとの組み合わせを、学習データとして生成する(
図7参照)。
本実施形態では、生成された疑似学習データと同数の学習データが生成される。
【0058】
次に、機械学習モデル生成装置1における機械学習モデルの生成過程を説明する。
図8は、機械学習モデル生成装置1における機械学習モデルの生成過程を説明するフローチャートである。
【0059】
前記したように本実施形態では、対象物における指定された部位に対して、複数の学習データが生成される。
学習データ生成部115は、あらかじめ決められた数(目標数)の学習データが作成された時点で、複数の学習データを、対象物における指定された部位の機械学習用のデータ(学習データ群)として、機械学習モデル生成部116に出力する。
【0060】
機械学習モデル生成部116に学習データ群が入力されると(ステップS201、Yes)、機械学習モデル生成部116は、教師あり学習用のアルゴリズムを利用して、入力された学習データ群の特徴量を抽出する(ステップS202)。
そして、機械学習モデル生成部116は、特徴量エンジニアリング(抽出した特徴量の取捨選択と最適化など)を行って(ステップS203)、機械学習モデルを生成する(ステップS204)。
【0061】
さらに、機械学習モデル生成部116は、生成した機械学習モデルの検証および評価を行って(ステップS205)、評価基準を満たした場合に(ステップS206、Yes)、ステップS204で生成した機械学習モデルを出力する。
出力された機械学習モデルは、一例として、データサーバ23に記憶される。
一方、評価基準を満たさない場合に(ステップS206、No)、ステップS203からステップS206までの処理を繰り返すことになる。
【0062】
なお、ステップS205の検証は、例えば、ノイズや欠損を含む2次元形状データ(測定データから得られた2次元形状データ)を用意する。用意した2次元形状データに、ステップS204で生成した機械学習モデルを適用して、ノイズの除去と欠損の補完を行った2次元形状データ(補正後の2次元形状データ)を生成する。補正後の2次元形状データと、正解の2次元形状データ(正規化データ)との合致率を算出し、合致率と閾値との比較により、評価基準を満たすか否かを判定できる。
【0063】
このように、測定データから生成した2次元形状データに代えて、正規データから生成した疑似学習データを用いて、学習データを生成する。学習データに含まれるラベルは、人を介在させることなく容易に生成できる。
測定データから生成した2次元形状データを用いて学習データを生成する場合、ラベルの作成に人の介在が必要であるので、疑似学習データを用いる場合よりも、学習データの生成に要する時間が長くなる。
よって、正規データから生成した疑似学習データを用いて学習データを生成することで、機械学習モデルの生成に必要な学習データを、測定データを用いる場合よりも、より短時間、かつ簡便に生成できる。
【0064】
ここで、機械学習モデル生成装置1において、
図2の機能ブロックに示した処理部11から、機械学習モデル生成部116を除いた部分が、発明にかかる学習データ生成装置に相当する。
【0065】
以上の通り、本実施形態にかかる学習データ生成方法は、以下の構成を有する。
(1)学習データ生成方法は、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成ステップ(
図6、ステップS104)と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップ(
図6、ステップS106)と、
疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成ステップ(
図6、ステップS108)と、を有する
【0066】
このように構成すると、学習対象であるプレス成形品の形状測定を行うことなく、学習データの生成に用いられる疑似学習データとラベルの組み合わせを生成できる。
これにより、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0067】
本実施形態にかかる学習データ生成方法は、以下の構成を有する。
(2)疑似データは、正規データに対する乱数を用いた処理(乱数処理)により生成される。
【0068】
例えば、別途用意した設定テーブルに設定されたパラメータ値を用いて、正規データから、疑似データを生成するようにしてもよいが、乱数を用いることで、歪みや成形誤差などを持つ断面形状を規定する疑似データを、偏りなく生成できる。
【0069】
本実施形態にかかる学習データ生成方法は、以下の構成を有する。
(3)疑似データで規定されるプレス成形品の形状は、プレス成形品の測定形状と、プレス成形品の正規データ(設計データ)で規定される正規形状との差異を反映した形状である。
【0070】
プレス成形品の測定形状と、プレス成形品の正規データで規定される正規形状(正解形状)との差異は、疑似データで規定されるプレス成形品の形状において、プレス成形品が持つ歪みや成形誤差などを反映したものである。
これにより、疑似データで規定される形状(断面形状)は、実際に作成されるプレス成形品の形状(断面形状)を模したものとなるので、測定データに代えて正規データ(設計データ)を用いた場合であっても、学習データを適切に生成できる。
【0071】
本実施形態にかかる学習データ生成方法は、以下の構成を有する。
(4)疑似データ生成ステップでは、差異が異なる疑似データを複数生成する。
【0072】
乱数処理で用いる乱数の値を異ならせることで、歪みや成形誤差の程度が異なるプレス成形品の形状を規定する疑似データを複数作成できる。
プレス成形品の測定データから学習データを生成する場合には、歪みや成形誤差の程度が異なるプレス成形品を複数用意し、プレス成形品の各々について測定データを取得する必要がある。
基準データに対する乱数処理を行うと、歪みや成形誤差などが異なるプレス成形品の形状を規定する疑似データを、より簡単に複数生成できるので、測定データを用いる場合よりもより簡便かつ短時間で、学習データを複数生成できる。
【0073】
本実施形態にかかる学習データ生成方法は、以下の構成を有する。
(5)エラーを含む疑似学習データは、疑似データに対する乱数を用いた処理(乱数処理)により生成される。
【0074】
例えば、別途用意した設定テーブルに設定されたパラメータ値を用いて、疑似データから、エラーを含む疑似学習データを生成するようにしても良いが、乱数を用いることで、含まれるエラーに偏りのない疑似学習データを生成できる。
パラメータ値を人為的に決めると、パラメータの値に意図しない傾向が含まれることがある。この場合、生成される疑似学習データに含まれるエラーに偏りが生じる可能性がある。エラーに偏りのあるパラメータ値を含む疑似学習データから、機械学習モデルを作成すると、生成される機械学習モデルが意図しない偏りを含むものとなる可能性がある。
上記の通り、乱数を用いることで、含まれるエラーに偏りのない疑似学習データを生成できるので、機械学習モデルを適切に生成できる。
【0075】
本実施形態にかかる学習データ生成方法は、以下の構成を有する。
(6)疑似学習データで規定されるプレス成形品の形状は、プレス成形品の測定形状が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している。
プレス成形品の測定形状は、3Dスキャナ30などを用いたプレス成形品の形状測定により得られた測定データで規定される形状である。疑似学習データにおけるノイズや欠損が、疑似学習データが含むエラーに相当する。
【0076】
このように構成すると、対象物の測定データで規定される測定形状が持つノイズや欠損を、疑似学習データが規定する断面形状において再現できる。
これにより、測定データを用いて最終的に生成される機械学習モデルと略同等の機械学習モデルを、疑似学習データを用いて生成できる。
正規データである設計データを用いて学習データを複数用意するのに要する時間は、測定データを用いて学習データを複数用意するのに要する時間よりも十分に短い。また、測定データの入手には、手間と時間がかかる。
よって、機械学習モデルの作成に必要な学習データを、より短時間、かつ簡便に用意できる。
【0077】
本実施形態にかかる学習データ生成方法は、以下の構成を有する。
(7)疑似学習データ生成ステップでは、異なるエラーを含む疑似学習データが複数生成される。
疑似学習データは、異なる乱数の値を用いて複数生成される。
学習データは、疑似学習データと同数生成される。
【0078】
このように構成すると、機械学習モデルの作成に必要な学習データを、より短時間、かつ簡便に用意できる。
【0079】
以上の通り、本実施形態にかかる機械学習モデル生成方法は、以下の構成を有する。
(8)機械学習モデル生成方法は、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成ステップ(
図6、ステップS104)と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップ(
図6、ステップS106)と、
疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成ステップ(
図6、ステップ
S108)と、
学習データが複数入力されると共に、入力された複数の学習データに基づいて、機械学習モデルを作成する機械学習モデル生成ステップ(
図7、ステップS201~S206)と、を有する。
【0080】
このように構成すると、プレス成形品の形状測定を行うことなく、学習データの生成に用いられる疑似学習データとラベルの組み合わせを生成できる。
これにより、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0081】
本実施形態にかかる機械学習モデル生成方法は、以下の構成を有する。
(9)疑似データは、正規データに対する乱数を用いた処理(乱数処理)により生成される。
【0082】
このように構成すると、乱数を用いることで、歪みや成形誤差などを持つ断面形状を規定する疑似データを、偏りなく生成できる。
【0083】
本実施形態にかかる機械学習モデル生成方法は、以下の構成を有する。
(10)エラーを含む疑似学習データは、疑似データに対する乱数を用いた処理(乱数処理)により生成される。
【0084】
このように構成すると、乱数を用いることで、含まれるエラーに偏りのない疑似学習データを生成できるので、機械学習モデルを適切に生成できる。
【0085】
本実施形態にかかる機械学習モデル生成方法は、以下の構成を有する。
(11)疑似学習データで規定されるプレス成形品の形状は、プレス成形品の測定形状が持つノイズや欠損に相当する疑似ノイズや疑似欠損を有している。
プレス成形品の測定形状は、3Dスキャナ30などを用いたプレス成形品の形状測定により得られた測定データで規定される形状である。
疑似学習データとラベルとの組み合わせを、学習データとして生成する学習データ生成ステップ(
図6、ステップS108)を、さらに有する。
疑似学習データは、異なる乱数の値を用いて複数生成される。
学習データは、疑似学習データと同数生成される。
【0086】
このように構成すると、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0087】
本件発明は、機械学習用の学習データ生成プログラムとしても捉えることができる。
(12)機械学習用の学習データ生成プログラムは、
コンピュータを、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成手段(
図6、ステップS104)、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成手段(
図6、ステップS106)、
疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成手段(
図6、ステップS108)、として機能させる、学習データ生成プログラムである。
【0088】
このように構成すると、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0089】
さらに、機械学習用の学習データ生成プログラムでは、
(13)疑似学習データは、異なる乱数の値を用いて複数生成される。
学習データは、疑似学習データと同数生成される。
【0090】
このように構成すると、機械学習モデルの作成に必要な学習データを、より短時間、かつ簡便に用意できる。
【0091】
本件発明は、機械学習モデル生成プログラムとしても捉えることができる。
(14)機械学習モデル生成プログラムは、
コンピュータを、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成手段(
図6、ステップS104)、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成手段(
図6、ステップS106)、
疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成手段(
図6、ステップS108)、
学習データが複数入力されると共に、入力された複数の学習データに基づいて、機械学習モデルを作成する機械学習モデル生成手段(
図7、ステップS201~S206)、として機能させるプログラムである。
【0092】
このように構成すると、プレス成形品の形状測定を行うことなく、学習データを生成できる。
これにより、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0093】
本件発明は、機械学習モデル生成プログラムを記憶した記憶媒体としてもとらえることができる。
(15)記憶媒体(記憶部12)は、機械学習モデル生成プログラムを記憶している。
機械学習モデル生成プログラムは、
コンピュータを、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成手段(
図6、ステップS104)、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成手段(
図6、ステップS106)、
疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成手段(
図6、ステップS108)、
学習データが複数入力されると共に、入力された複数の学習データに基づいて、機械学習モデルを作成する機械学習モデル生成手段(
図7、ステップS201~S206)、として機能させる。
【0094】
このように構成することによっても、プレス成形品の形状測定を行うことなく、学習データを生成できる。機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0095】
なお、本実施形態では、機械学習モデル生成装置1が備える記憶部12(記憶媒体)にプログラムが記憶されている場合を例示した。記憶媒体は、HDDやSSD、そしてメモリなどの情報の保持と書き換えが可能な記録媒体であればよい。また、ネットワークNTを介して接続されるデータサーバ23側の記録媒体であっても良い。
【0096】
本件発明は、学習データ生成装置としても捉えることができる。
(16)学習データ生成装置は、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成部113と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成部114と、
疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成部115と、を有する。
【0097】
このように構成すると、プレス成形品の形状測定を行うことなく、学習データの生成に用いられる学習データを生成できる。
これにより、学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0098】
(17)学習データ生成装置では、
疑似学習データ生成部114は、異なるエラーを含む複数の疑似学習データを生成する。
学習データ生成部115は、学習データを、疑似学習データと同数生成する。
【0099】
このように構成すると、機械学習モデルの作成に必要な学習データを、より短時間、かつ簡便に用意できる。
【0100】
本件発明は、機械学習モデル生成装置1としても捉えることができる。
(18)機械学習モデル生成装置1は、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成部113と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成部114と、
疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成部115と、
学習データが複数入力されると共に、入力された複数の学習データに基づいて、機械学習モデルを作成する機械学習モデル生成部116と、を有する。
【0101】
このように構成すると、プレス成形品の形状測定を行うことなく、学習データの生成に用いられる疑似学習データとラベルの組み合わせを生成できる。
これにより、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0102】
(19)疑似学習データ生成部114は、疑似データに対する乱数を用いた処理(乱数処理)により、エラーを含む疑似学習データを生成する。
【0103】
このように構成すると、乱数を用いることで、含まれるエラーに偏りのない疑似学習データを生成できるので、機械学習モデルを適切に生成できる。
【0104】
前記した実施形態では、生成された疑似学習データの総数が、目標数に達した時点で、生成された疑似学習データの各々に対してラベルを生成する場合を例示した。
疑似学習データが生成される度に、対応するラベルを生成するようにしても良い。
【0105】
前記した実施形態では、設計データ(正規データ)が3次元形状データである場合を例示したが、2次元形状データであっても良い。
この場合には、データサーバ23から取得した2次元形状データが、発明にかかる正規データに相当する。そして、取得した2次元形状データを基準データとして、乱数処理を直接行うことで、疑似学習データを生成できる。この場合には、2次元形状データが、ラベルに相当する。
【0106】
前記した実施形態では、以下の手順にて学習データを生成する場合を例示した。(a)3次元形状を規定する設計データ(正規データ)から、2次元形状を規定する基準データを生成する。(b)生成した基準データに対する乱数処理により、学習対象の擬似的な形状を規定する疑似データを生成する。(c)疑似データに対する乱数処理により、エラーを含む形状を規定する疑似学習データを生成する。(d)疑似学習データの生成に用いた疑似データをラベルとし、このラベルと疑似学習データとの組み合わせを、学習データとする。
【0107】
例えば、(a)3次元形状を規定する設計データ(正規データ)から、学習データを直接生成しても良い。
この場合、3次元形状を規定する設計データ(正規データ)を、前記した基準データと見なすことができるので、前記した
図6のフローチャートにおいてステップS102を省略できる。
具体的には、以下の手順にて学習データが生成されることになる。(a)3次元形状を規定する設計データ(正規データ)に対する乱数処理により、学習対象の擬似的な3次元形状を規定する疑似データを生成する(
図6のステップS103、104に相当)。(b)疑似データに対する乱数処理により、エラーを含む3次元形状を規定する疑似学習データを生成する(
図6のステップS105、106に相当)。(c)疑似学習データの生成に用いた疑似データをラベルとし、このラベルと疑似学習データとの組み合わせを、学習データとする(
図6のステップS108に相当)。
【0108】
このようにすることによっても、学習対象であるプレス成形品の形状測定を行うことなく、学習データの生成に用いられる疑似学習データとラベルの組み合わせを生成できる。
これにより、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0109】
ここで、対象物が透明な部位を含む場合、測定データの処理が難しくなる。
例えば、車両における前照灯周りの形状を測定する場合、前照灯を覆う透明なカバーの部分(透明体:透明な部位)が、測定データの処理を難しくする。
これは、透明体の測定データでは、透明体の表面と,透明体の背後に存在する別表面(透明体に向こうに透けて見える別の部品の表面)とが混在する。そのため、測定データで規定される形状において、どの部分が透明体で、その部分が透明体に関係の無い部分であるのかを特定する作業が、いっそう煩雑となる。
【0110】
そのため、対象物が透明部位を含むものである場合には、疑似学習データにおいて、ノイズや欠損が顕著になるように乱数処理を行う。具体的には、透明な部位の測定データを想定して、ノイズや欠損が顕著になるアルゴリズムを用意し、乱数の値として選択される範囲を、ノイズや欠損が顕著になる範囲にする。
このようにして、透明な部位のように、透明でない部位よりもノイズや欠損の増加が見込まれる場合には、乱数処理に用いるアルゴリズムと乱数の値の範囲を、透明な部位を考慮して設定する。すなわち、対象物を想定して乱数の範囲やアルゴリズムを調整する。
【0111】
これにより、対象物が透明体を含むものに対応する疑似学習データを生成できる。対象物が透明な部位を含む場合や、対象物自体が透明な場合であっても、機械学習モデルをより適切に生成できる。
【0112】
前記した実施形態では、学習対象がプレス成形品である場合を例示したが、学習対象はこれに限定されない。設計データ(正規データ)が存在するものであれば、車両部品や建物なども本発明における学習対象として利用可能である。
【0113】
前記した実施形態では、学習対象がプレス成形品であり、正規データが、プレス成形品の設計データである場合を例示した。以下、学習対象となりうるものを列挙して簡単に説明する。
【0114】
(a)鋳造物
例えば、学習対象が鋳造物であり、機械学習モデルが、鋳造物の完成検査の検査データへの適用を意図して作成される場合、以下のようにすることが考えられる。
鋳造物の完成検査では、鋳造物内部の空洞(鋳巣)の有無が検査される。例えば、鋳巣の有無は、鋳造物に対する放射線の放射や、超音波の入射などの非破壊検査により行われる。
そこで、鋳巣のない鋳造物に対する非破壊検査を行って、得られた検査パラメータの値(検査波形値など)を正規データとする。
そして、正規データから、鋳造品が取り得る形状を規定する疑似データを生成し、この疑似データと、疑似データの乱数処理で得られた疑似学習データとの組み合わせを学習データとし、複数の学習データから機械学習モデルを生成する。
【0115】
図10は、機械学習モデル生成装置1における学習データの生成過程の他の例を説明するフローチャートである。
図10に示すフローチャートでは、鋳巣のない鋳造物に対する非破壊検査を行って得られた検査パラメータを、正規データとして用いて、学習データを生成する過程が示されている。ここで、検査パラメータとして、鋳巣のない鋳造物の完成検査により得られる検査波形が例示される。
【0116】
機械学習モデル生成装置1の処理部11は、鋳巣のない鋳造物の正規データ(検査パラメータ)を用いて、機械学習用の学習データを生成する。
ステップS301において、処理部11の正規データ取得部110は、鋳巣のない鋳造物の正規データ(検査パラメータ)を、データサーバ23から取得する。
【0117】
ステップS302において乱数発生部112は、疑似データを生成するための乱数を発生させる。発生した乱数は、疑似データ生成部113に出力される。
ステップS303において、疑似データ生成部113は、ステップS301で取得した正規データに対する乱数処理を実施して、疑似データを生成する。
【0118】
ここで、疑似データの生成に用いられる乱数の値は、次の条件を満たすことが可能な範囲内の値に設定される。
(a)乱数処理で生成された疑似データが規定する検査パラメータ(検査波形)が、実際に作成される可能性があると想定される鋳造物の検査パラメータが取り得る範囲内に収まる。
ここで、疑似データが規定する検査パラメータには、鋳造品に実際に生じ得る鋳造上のばらつき、誤差、鋳造不良に起因するエラーなどの内乱に相当する値(パラメータ値)が少なくとも含まれる。
なお、この検査パラメータには、鋳巣に相当するパラメータ値が含まれていても良い。
【0119】
ステップS304において、乱数発生部112は、疑似学習データを生成するための乱数を発生させる。発生した乱数は、疑似学習データ生成部114に出力される。
なお、疑似学習データを生成するための乱数は、疑似データで規定される検査波形に、疑似ノイズや疑似欠損を生じさせるためのパラメータとして生成される。
ここで、疑似データに疑似ノイズや疑似欠損を生じさせる乱数は、疑似データを生成するための乱数の値とは異なる値となる。
【0120】
ステップS305において、疑似学習データ生成部114は、疑似データに対する乱数処理を実施して、疑似ノイズや疑似欠損を持つ疑似学習データ(エラーを含む疑似学習データ)を生成する。
【0121】
このようにして生成された疑似学習データが規定する検査波形は、疑似ノイズや疑似欠損を含むものになる。これら疑似ノイズや疑似欠損は、鋳造物の完成検査の作業の中で生じるエラーに起因するノイズや欠損を、擬似的に再現したものに相当する。
ここで、完成検査の作業の中で生じるエラーには、検査環境(温度、湿度など)に起因して生じるエラー、検査機器の操作、検査機器の個体差、検査機器の測定結果のエラーなどに起因する外乱がある。
【0122】
そして、ステップS302からステップS305の処理を繰り返して、正規データから、異なる乱数の値(S302、S304)を用いて疑似学習データが複数生成される。
【0123】
生成された疑似学習データの総数が目標数に達した時点で(ステップS306、Yes)、ステップS307において学習データ生成部115が、学習データを生成する。
学習データ生成部115は、あらかじめ決められた数の学習データが作成された時点で、複数の学習データを、鋳造品の機械学習用のデータ(学習データ群)として、機械学習モデル生成部116に出力する。
【0124】
これにより、機械学習モデル生成部116は、教師あり学習用のアルゴリズムを利用して、鋳造品に対する機械学習モデルを生成する(
図8、ステップS201~S206)。
【0125】
このように、鋳造物の完成検査のひとつの適切な検査データ(正規データ)から、乱数を使って疑似データを生成すると、生成された疑似データは、実際に作成される可能性があると想定される鋳造物の検査データに相当するものとなる。
よって、乱数の値を変更することで、実際に作成される可能性があると想定される鋳造物の検査データを、擬似的に複数生成できる。
【0126】
そして、生成された疑似データから、乱数を使って疑似学習データを生成すると、生成された疑似学習データは、鋳造物の完成検査で生成される検査波形であって、完成検査の作業の中で生じるエラーに起因するノイズや欠損に相当する疑似ノイズや疑似欠損を含んだ検査波形を規定するものとなる。
【0127】
ここで、疑似データは、疑似学習データで規定される検査波形から、疑似ノイズや疑似欠損に相当する部分を除いたもの、すなわち、正解ラベルに相当する。
よって、疑似データをラベルとし、このラベルと疑似学習データとの組み合わせを、機械学習モデルの生成に用いられる学習データとしている。
よって、鋳造物の完成検査のひとつの適切な検査データ(正規データ)から、機械学習モデルの生成に用いられる学習データを複数用意できるので、機械学習モデルの生成をより簡便におこなうことができる。
【0128】
このように、
(20)学習対象が鋳造物である場合の学習データの生成方法は、
鋳造物の検査パラメータを規定する正規データから、学習用の疑似データを生成する疑似データ生成ステップ(
図10:ステップS302、S303)と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと(
図10:ステップS304、S305)、
疑似データをラベルとし、当該ラベルと疑似学習データとの組み合わせを学習データとする学習データ生成ステップ(
図10:ステップS307)と、を有する。
【0129】
このように構成すると、鋳造物を複数用意し、用意した鋳造物の各々について、非破壊検査の検査データを集めて機械学習モデル用の学習データを作成する場合よりも、より簡便かつ短時間で学習データを作成できる。
【0130】
(b)表面処理
例えば、学習対象が、表面処理が行われる物体であり、機械学習モデルが、表面処理後の物体の完成検査で得られる検査データへの適用を意図して作成される場合、以下のようにすることが考えられる。
表面処理が行われた物体は、表面粗さが異なるものとなる。表面処理の検査では、例えば、表面処理の適否は、表面粗さ測定装置を利用して行われる。
そこで、表面処理が適切に行われた物体の表面粗さを、表面粗さ測定装置を利用して測定し、得られた測定値を正規データとする。
そして、正規データから、作成され得る表面処理状態を規定する疑似データを生成し、この疑似データと、疑似データの乱数処理で得られた疑似学習データとの組み合わせを学習データとし、複数の学習データから機械学習モデルを生成する。
【0131】
前記した
図10のフローチャートに当てはめると、以下のようになる。
機械学習モデル生成装置1の処理部11は、基準となる表面状態を持つ物体の正規データ(検査パラメータ)を用いて、機械学習用の学習データを生成する。
【0132】
処理部11の正規データ取得部110は、基準となる表面状態を持つ物体の正規データ(検査パラメータ)を、データサーバ23から取得する(ステップS301)。
乱数発生部112は、疑似データを生成するための乱数を発生させる(ステップS302)。疑似データ生成部113は、ステップS301で取得した正規データに対する乱数処理を実施して、疑似データを生成する(ステップS303)。
【0133】
ここで、疑似データの生成に用いられる乱数の値は、次の条件を満たすことが可能な範囲内の値に設定される。
(a)乱数処理で生成された疑似データが規定する検査パラメータ(検査波形)が、実際に作成される可能性があると想定される表面処理後の物体の検査パラメータが取り得る範囲内に収まる。
ここで、疑似データが規定する検査パラメータには、表面処理前の物体の個体差、表面処理後の物体に実際に生じ得る表面状態のばらつきや、表面処理上の誤差、表面処理の不具合に起因するエラーなどの内乱に相当する値(パラメータ値)が少なくとも含まれる。
【0134】
乱数発生部112は、疑似学習データを生成するための乱数を発生させる(ステップS304)。
なお、疑似学習データを生成するための乱数は、疑似データで規定される検査波形に疑似ノイズや疑似欠損を生じさせるためのパラメータとして生成される。
ここで、疑似データに疑似ノイズや疑似欠損を生じさせる乱数は、疑似データを生成するための乱数の値とは異なる値となる。
【0135】
疑似学習データ生成部114は、疑似データに対する乱数処理を実施して、疑似ノイズや疑似欠損を持つ疑似学習データ(エラーを含む疑似学習データ)を生成する(ステップS305)。
【0136】
このようにして生成された疑似学習データが規定する検査波形は、疑似ノイズや疑似欠損を含むものになる。これら疑似ノイズや疑似欠損は、表面処理後の物体の完成検査の作業の中で生じるエラーに起因するノイズや欠損を、擬似的に再現したものに相当する。
ここで、完成検査の作業の中で生じるエラーには、検査環境(温度、湿度など)に起因して生じるエラー、検査機器の操作、検査機器の個体差、検査機器の測定結果のエラーなどに起因する外乱がある。
【0137】
そして、ステップS302からステップS305の処理を繰り返して、正規データから、異なる乱数の値(S302、S304)を用いて疑似学習データが複数生成される。
【0138】
学習データ生成部115は、あらかじめ決められた数の学習データが作成された時点で、複数の学習データを、物体の機械学習用のデータ(学習データ群)として、機械学習モデル生成部116に出力する。
【0139】
これにより、機械学習モデル生成部116は、教師あり学習用のアルゴリズムを利用して、表面処理が行われた物体に対する機械学習モデルを生成する(
図8、ステップS201~S206)。
【0140】
このように、基準となる表面状態を持つ物体の正規データ(検査パラメータ)から、乱数を使って疑似データを生成すると、生成された疑似データは、実際に作成される可能性があると想定される表面状態を持つ物体の検査データに相当するものとなる。
よって、乱数の値を変更することで、実際に作成される可能性があると想定される表面状態を持つ物体の検査データを、擬似的に複数生成できる。
【0141】
そして、生成された疑似データから、乱数を使って疑似学習データを生成すると、生成された疑似学習データは、表面処理後の物体の表面状態を確認するための完成検査で生成される検査波形であって、完成検査の作業の中で生じるエラーに起因するノイズや欠損に相当する疑似ノイズや疑似欠損を含んだ検査波形を規定するものとなる。
【0142】
ここで、疑似データは、疑似学習データで規定される検査波形から、疑似ノイズや疑似欠損に相当する部分を除いたもの、すなわち、正解ラベルに相当する。
よって、疑似データをラベルとし、このラベルと疑似学習データとの組み合わせを、機械学習モデルの生成に用いられる学習データとしている。
よって、基準となる表面状態を持つ物体の検査データ(正規データ)から、機械学習モデルの生成に用いられる学習データを複数用意できるので、機械学習モデルの生成をより簡便におこなうことができる。
【0143】
このように、
(21)学習対象が、表面処理が行われる物体である場合の学習データの生成方法は、
基準となる表面状態(表面粗さ)を持つ物体の検査パラメータを規定する正規データから、学習用の疑似データを生成する疑似データ生成ステップ(
図10:ステップS302、S303)と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと(
図10:ステップS304、S305)、
疑似データをラベルとし、当該ラベルと疑似学習データとの組み合わせを学習データとする学習データ生成ステップ(
図10:ステップS307)と、を有する。
【0144】
このように構成すると、表面状態の異なる物体を複数用意し、用意した物体の各々について、表面粗さの検査データを集めて機械学習モデル用の学習データを作成する場合よりも、より簡便かつ短時間で学習データを作成できる。
【0145】
(c)印刷検査
例えば、学習対象が、図柄などが着色印刷された印刷物であり、機械学習モデルが、印刷物の仕上がり検査で得られる検査データへの適用を意図して作成される場合、以下のようにすることが考えられる。
図柄などが着色印刷された印刷物では、仕上がり検査において、印刷状態が確認される。例えば、印刷状態の一例として、印刷物の色相が挙げられる。印刷物の色相は、色差計を利用して行われる。
そこで、適切に印刷が行われた印刷物の色相を、色差計を利用して測定し、得られた測定値を、基準となる印刷物の印刷状態を規定する正規データとする。
すなわち、ここでは、基準となる色相で印刷された印刷物の色差計による測定値が、印刷物の印刷状態を規定する正規データに相当する。
なお、印刷物の印刷データで規定されている色相のデフォルトの値を正規データとしても良い。
そして、正規データから、印刷物が持ち得る印刷状態(色相)を規定する疑似データを生成し、この疑似データと、疑似データの乱数処理で得られた疑似学習データとの組み合わせを学習データとし、複数の学習データから機械学習モデルを生成する。
【0146】
前記した
図10のフローチャートに当てはめると、以下のようになる。
機械学習モデル生成装置1の処理部11は、基準となる印刷状態(色相)を持つ印刷物の正規データ(検査パラメータ)を用いて、機械学習用の学習データを生成する。
【0147】
処理部11の正規データ取得部110は、基準となる印刷状態(色相)を持つ印刷物の正規データ(検査パラメータ)を、データサーバ23から取得する(ステップS301)。
乱数発生部112は、疑似データを生成するための乱数を発生させる(ステップS302)。疑似データ生成部113は、ステップS301で取得した正規データに対する乱数処理を実施して、疑似データを生成する(ステップS303)。
【0148】
ここで、疑似データの生成に用いられる乱数の値は、次の条件を満たすことが可能な範囲内の値に設定される。
(a)乱数処理で生成された疑似データが規定する検査パラメータ(色差計による測定値に相当)が、実際に作成される可能性があると想定される印刷物の検査パラメータが取り得る範囲内に収まる。
ここで、疑似データが規定する検査パラメータには、作成された印刷物に起こり得るエラー、具体的には、擦れ、色むら、印刷ズレなどの内乱に相当する値(パラメータ値)が少なくとも含まれる。
【0149】
乱数発生部112は、疑似学習データを生成するための乱数を発生させる(ステップS304)。
なお、疑似学習データを生成するための乱数は、疑似データで規定される検査値に疑似ノイズや疑似欠損を生じさせるためのパラメータとして生成される。
ここで、疑似データに疑似ノイズや疑似欠損を生じさせる乱数は、疑似データを生成するための乱数の値とは異なる値となる。
【0150】
疑似学習データ生成部114は、疑似データに対する乱数処理を実施して、疑似ノイズや疑似欠損を持つ疑似学習データ(エラーを含む疑似学習データ)を生成する(ステップS305)。
【0151】
このようにして生成された疑似学習データが規定する検査波形は、疑似ノイズや疑似欠損を含むものになる。これら疑似ノイズや疑似欠損は、印刷物の仕上がり検査の作業の中で生じるエラーに起因するノイズや欠損を、擬似的に再現したものに相当する。
ここで、仕上がり検査の作業の中で生じるエラーには、検査環境(温度、湿度など)に起因して生じるエラー、検査機器の操作、検査機器の個体差、検査機器の測定結果のエラーなどに起因する外乱がある。
【0152】
そして、ステップS302からステップS305の処理を繰り返して、正規データから、異なる乱数の値(S302、S304)を用いて疑似学習データが複数生成される。
【0153】
学習データ生成部115は、あらかじめ決められた数の学習データが作成された時点で、複数の学習データを、印刷物の機械学習用のデータ(学習データ群)として、機械学習モデル生成部116に出力する。
【0154】
これにより、機械学習モデル生成部116は、教師あり学習用のアルゴリズムを利用して、印刷物に対する機械学習モデルを生成する(
図8、ステップS201~S206)。
【0155】
このように、基準となる印刷状態を持つ印刷物の正規データ(検査パラメータ)から、乱数を使って疑似データを生成すると、生成された疑似データは、実際に作成される可能性があると想定される印刷状態を持つ印刷物の検査データに相当するものとなる。
よって、乱数の値を変更することで、実際に作成される可能性があると想定される印刷状態を持つ印刷物の検査データを、擬似的に複数生成できる。
【0156】
そして、生成された疑似データから、乱数を使って疑似学習データを生成すると、生成された疑似学習データは、印刷物の印刷状態を確認するための仕上がり検査で生成される検査波形であって、仕上がり検査の作業の中で生じるエラーに起因するノイズや欠損に相当する疑似ノイズや疑似欠損を含んだ検査波形を規定するものとなる。
【0157】
ここで、疑似データは、疑似学習データで規定される検査波形から、疑似ノイズや疑似欠損に相当する部分を除いたもの、すなわち、正解ラベルに相当する。
よって、疑似データをラベルとし、このラベルと疑似学習データとの組み合わせを、機械学習モデルの生成に用いられる学習データとしている。
よって、基準となる印刷状態を持つ印刷物の検査データ(正規データ)から、機械学習モデルの生成に用いられる学習データを複数用意できるので、機械学習モデルの生成をより簡便におこなうことができる。
【0158】
このように、
(22)学習対象が、印刷物である場合の学習データの生成方法は、
基準となる印刷状態を持つ印刷物の正規データから、学習用の疑似データを生成する疑似データ生成ステップ(
図10:ステップS302、S303)と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと(
図10:ステップS304、S305)、
疑似データをラベルとし、当該ラベルと疑似学習データとの組み合わせを学習データとする学習データ生成ステップ(
図10:ステップS307)と、を有する。
【0159】
このように構成すると、印刷状態の異なる印刷物を複数用意し、用意した物体の各々について、色差計による測定値の検査データを集めて機械学習モデル用の学習データを作成する場合よりも、より簡便かつ短時間で学習データを作成できる。
【0160】
(d)音検査
例えば、学習対象が、車両ドアの開閉音であり、機械学習モデルが、開閉音の検査で得られる検査データへの適用を意図して作成される場合、以下のようにすることが考えられる。
車両ドアの開閉音は、部品の組み付け状態の差異などの影響を受けるため、同じ車両ドアであっても、完全に同じには成り難い。そこで、基準となる車両ドアの開閉音を集音マイクで集音し、得られた開閉音の波形を、正規データとする。
そして、正規データから、車両ドアの開閉音の波形であって、開閉音として想定される範囲に含まれる波形を規定する疑似データを生成し、この疑似データと、疑似データの乱数処理で得られた疑似学習データとの組み合わせを学習データとし、複数の学習データから機械学習モデルを生成する。
【0161】
前記した
図10のフローチャートに当てはめると、以下のようになる。
機械学習モデル生成装置1の処理部11は、基準となる開閉音を生じる車両ドアの正規データ(検査パラメータ)を用いて、機械学習用の学習データを生成する。
【0162】
処理部11の正規データ取得部110は、基準となる開閉音を生じる車両ドアの正規データ(検査パラメータ)を、データサーバ23から取得する(ステップS301)。
乱数発生部112は、疑似データを生成するための乱数を発生させる(ステップS302)。疑似データ生成部113は、ステップS301で取得した正規データに対する乱数処理を実施して、疑似データを生成する(ステップS303)。
【0163】
ここで、疑似データの生成に用いられる乱数の値は、次の条件を満たすことが可能な範囲内の値に設定される。
(a)乱数処理で生成された疑似データが規定する検査パラメータ(検査波形)、開閉音として想定される範囲に含まれる検査波形となる。
ここで、疑似データが規定する検査パラメータには、車両ドアにおける部品の組付け不良や、部品毎の個体差に起因する内乱に相当する値(パラメータ値)が少なくとも含まれる。なお、パラメータ値としては、振動音の音量、周波数、減衰率などが例示される。
【0164】
乱数発生部112は、疑似学習データを生成するための乱数を発生させる(ステップS304)。
なお、疑似学習データを生成するための乱数は、疑似データで規定される検査波形に疑似ノイズや疑似欠損を生じさせるためのパラメータとして生成される。
疑似学習データ生成部114は、疑似データに対する乱数処理を実施して、疑似ノイズや疑似欠損を持つ疑似学習データ(エラーを含む疑似学習データ)を生成する(ステップS305)。
【0165】
このようにして生成された疑似学習データが規定する検査波形は、疑似ノイズや疑似欠損を含むものになる。これら疑似ノイズや疑似欠損は、車両ドアの開閉音を集音する作業の中で生じるエラーに起因するノイズ、欠損、ばらつきを、擬似的に再現したものに相当する。
ここで、集音する作業の中で生じるエラーには、検査環境(温度、湿度など)に起因して生じるエラー、検査機器の操作、検査機器(集音マイク、加速度計など)の個体差、検査機器の測定結果のエラー、車両ドアを開閉操作するときの作業者の操作力や操作の仕方などに起因する外乱がある。
そして、ステップS302からステップS305の処理を繰り返して、正規データから、異なる乱数の値(S302、S304)を用いて疑似学習データが複数生成される。
【0166】
学習データ生成部115は、あらかじめ決められた数の学習データが作成された時点で、複数の学習データを、車両ドアの開閉音の機械学習用のデータ(学習データ群)として、機械学習モデル生成部116に出力する。
【0167】
これにより、機械学習モデル生成部116は、教師あり学習用のアルゴリズムを利用して、車両ドアの開閉音に対する機械学習モデルを生成する(
図8、ステップS201~S206)。
このように、基準となる車両ドアの開閉音の正規データ(検査パラメータ)から、乱数を使って疑似データを生成すると、生成された疑似データは、開閉音として想定される範囲に含まれる検査波形となる。
よって、乱数の値を変更することで、開閉音として想定される範囲に含まれる検査波形を規定する検査データを、擬似的に複数生成できる。
【0168】
そして、生成された疑似データから、乱数を使って疑似学習データを生成すると、生成された疑似学習データは、開閉音を集音する検査で生成される検査波形であって、集音作業の中で生じるエラーに起因するノイズや欠損に相当する疑似ノイズや疑似欠損を含んだ検査波形を規定するものとなる。
【0169】
ここで、疑似データは、疑似学習データで規定される検査波形から、疑似ノイズや疑似欠損に相当する部分を除いたもの、すなわち、正解ラベルに相当する。
よって、疑似データをラベルとし、このラベルと疑似学習データとの組み合わせを、機械学習モデルの生成に用いられる学習データとしている。
よって、基準となる車両ドアの開閉音の正規データ(検査パラメータ)から、機械学習モデルの生成に用いられる学習データを複数用意できるので、機械学習モデルの生成をより簡便におこなうことができる。
【0170】
このように、
(23)学習対象が、車両ドアの完成音である場合の学習データの生成方法は、
基準となる車両ドアの開閉音の正規データから、学習用の疑似データを生成する疑似データ生成ステップ(
図10:ステップS302、S303)と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと(
図10:ステップS304、S305)、
疑似データをラベルとし、当該ラベルと疑似学習データとの組み合わせを学習データとする学習データ生成ステップ(
図10:ステップS307)と、を有する。
【0171】
このように構成すると、車両ドアを複数用意し、用意した車両ドアの各々について、開閉音の検査データを集めて機械学習モデル用の学習データを作成する場合よりも、より簡便かつ短時間で学習データを作成できる。
【0172】
なお、ここでは、車両ドアの開閉音の場合を例示した。車両ドアの開閉音に代えて、以下のものを学習対象としても良い。
橋梁などの構造物の打音検査における測定音、締め付け部の反響音、コンクリートの充填不良を検査する反響音、駆動装置が駆動する際に発生させる振動音や駆動音、内燃機関(エンジン)の場合には、内燃機関の駆動時に発生する駆動音(エンジン音)。
これらものを対象とした場合であっても、機械学習モデルの作成に必要な学習データを簡便に作成できるので、機械学習モデルの作成をより簡便に行える。
【0173】
なお、正規データから疑似データを生成し、生成した疑似データから疑似学習データを生成して機械学習用の学習データを生成する手法は、他の機械学習モデルの生成にも利用できる。
【0174】
例えば、測定により得られた検査データの適否を判定する機械学習モデルの生成にも利用できる。
例えば、対象が鋳造物である場合には、実際に作成された鋳造品の完成検査で得られた検査パラメータにおいて、作成された鋳造品における鋳巣の有無を判定するための機械学習モデルを生成することができる。
【0175】
この場合、正規データの乱数処理により疑似データを生成する際に、例えば、以下のようにする。
鋳巣のある鋳造品を規定する疑似データAと、鋳巣のない鋳造品を規定する疑似データBを、それぞれ所定の割合で生成する。
そして、疑似データA(鋳巣あり)、疑似データB(鋳巣なし)のそれぞれについて、乱数処理を行って、疑似ノイズと疑似欠損を持つ疑似学習データA(鋳巣あり)と、疑似ノイズと疑似欠損を持つ疑似学習データB(鋳巣なし)を生成する。
【0176】
続いて、疑似学習データA(鋳巣あり)については、ラベルを「NG(不良)」とし、疑似学習データB(鋳巣なし)については、ラベルを「OK(合格)」とし、これらを組み合わせて学習データを生成する。
【0177】
そして、「NG(不良)」のラベルと疑似学習データとの組み合わせからなる学習データと、「OK(合格)」のラベルと疑似学習データとの組み合わせからなる学習データと、から機械学習モデルを生成する。
【0178】
このようにして生成した機械学習モデルを利用すると、作成された鋳造品の完成検査で得られる検査パラメータから、作成された鋳造品が、鋳巣のある「NG(不良)」であるのか、「OK(合格)」であるのかを判定できるようになる。
【0179】
このように、
(24)学習対象が鋳造物である場合の学習データの生成方法の変形例は、
鋳巣のない鋳造物の検査パラメータを規定する正規データから、学習用の疑似データを生成する疑似データ生成ステップ(
図10:ステップS302、S303)と、
疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと(
図10:ステップS304、S305)、
疑似データと、疑似データが「NG」と「OK」のいずれであるのかを示すラベルとから、学習データを生成する学習データ生成ステップ(
図10:ステップS307)と、を有する。
【0180】
これにより、鋳巣の有無の判定への適用が期待できる機械学習モデルを、より簡便に生成することができる。
【0181】
本願発明は、上記した実施形態の態様にのみ限定されるものではない。発明の技術的な思想の範囲内で、適宜変更、修正などが可能である。
【符号の説明】
【0182】
1 機械学習モデル生成装置
11 処理部
12 記憶部
13 入出力ポート
14 バス
21 入力装置
22 出力装置
23 データサーバ
30 3Dスキャナ
50a プレス成形品
110 正規データ取得部
111 基準データ生成部
112 乱数発生部
113 疑似データ生成部
114 疑似学習データ生成部
115 学習データ生成部
116 機械学習モデル生成部
L 疑似欠損
MT 携帯端末
N 疑似ノイズ
NT ネットワーク
P 部品
【要約】
【課題】機械学習モデルの作成を、より簡便に行えるようにする。
【解決手段】学習データ生成方法は、
学習対象であるプレス成形品の正規データから、学習用の疑似データを生成する疑似データ生成ステップと、疑似データから、エラーを含む疑似学習データを生成する疑似学習データ生成ステップと、疑似データをラベルとし、当該ラベルと、疑似学習データとの組み合わせを学習データとする学習データ生成ステップと、を有する
【選択図】
図6