(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-05-29
(45)【発行日】2023-06-06
(54)【発明の名称】学習プログラム、学習方法および学習装置
(51)【国際特許分類】
G05B 19/418 20060101AFI20230530BHJP
【FI】
G05B19/418 Z
(21)【出願番号】P 2019086665
(22)【出願日】2019-04-26
【審査請求日】2022-01-11
(73)【特許権者】
【識別番号】000005223
【氏名又は名称】富士通株式会社
(74)【代理人】
【識別番号】110002147
【氏名又は名称】弁理士法人酒井国際特許事務所
(72)【発明者】
【氏名】山本 達也
(72)【発明者】
【氏名】橋間 正芳
(72)【発明者】
【氏名】若杉 諒介
(72)【発明者】
【氏名】石脇 健太
【審査官】永井 友子
(56)【参考文献】
【文献】特開2006-258535(JP,A)
【文献】特開2009-244933(JP,A)
【文献】米国特許出願公開第2015/0346709(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G05B 19/418
(57)【特許請求の範囲】
【請求項1】
コンピュータに、
製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第1の異常値割合を算出し、
前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第2の異常値割合を算出し、
前記第1の異常値割合と前記第2の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出し、
前記試験工程で得られる試験データのう
ち学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更
し、
前記割合に基づき前記学習データとして取得された複数の試験データのうち、前記試験工程における製造環境を示す加工データを説明変数、前記試験工程で製造された製造物の品質を示す品質データを目的変数として、前記学習モデルを学習する、
処理を実行させることを特徴とする学習プログラム。
【請求項2】
前記変更する処理は、
各類似度に割合を対応付けたリストを参照して、算出された前記類似度に対応する前記割合を特定し、
前記学習する処理は、
特定された前記割合のデータを前記試験データから抽出し
、
抽出したデータを前記学習データに用いて、前記量産工程における製造物の品質を予測する前記学習モデルを学習する
、ことを特徴とする請求項1に記載の学習プログラム。
【請求項3】
前記量産工程における製造環境を示す加工データを、学習済みの学習モデルに入力し、
前記学習済みの学習モデルの出力結果に基づいて、前記量産工程における製造物の品質を予測する、処理を前記コンピュータに実行させることを特徴とする請求項
1に記載の学習プログラム。
【請求項4】
各類似度に対応付けられる複数の割合それぞれに対応する試験データを学習データに利用して学習された複数の学習モデルを保持し、
前記各類似度に割合を対応付けたリストを参照して、算出された前記類似度に対応する前記割合を特定し、
前記複数の学習モデルのうち、特定された割合に対応付けられる学習モデルを選択し、
選択された学習モデルを用いて、前記量産工程における製造物の品質を予測する、処理を前記コンピュータに実行させることを特徴とする請求項1に記載の学習プログラム。
【請求項5】
前記試験工程と前記量産工程の類似度に基づく割合の試験データを用いて、ランダム性がある機械学習により、複数の学習済みの学習モデルが学習された場合に、前記試験データのうち、前記学習済みの学習モデルに利用された試験データを除く残りの試験データを用いて、前記複数の学習済みの学習モデルの精度を検証し、
検証した結果に基づき、前記複数の学習済みの学習モデルから1つの学習モデルを選択する、処理を前記コンピュータに実行させることを特徴とする請求項1から
4のいずれか一つに記載の学習プログラム。
【請求項6】
コンピュータが、
製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第1の異常値割合を算出し、
前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第2の異常値割合を算出し、
前記第1の異常値割合と前記第2の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出し、
前記試験工程で得られる試験データのう
ち学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更
し、
前記割合に基づき前記学習データとして取得された複数の試験データのうち、前記試験工程における製造環境を示す加工データを説明変数、前記試験工程で製造された製造物の品質を示す品質データを目的変数として、前記学習モデルを学習する、
処理を実行することを特徴とする学習方法。
【請求項7】
製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第1の異常値割合を算出
し、
前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第2の異常値割合を算出
し、
前記第1の異常値割合と前記第2の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出
し、
前記試験工程で得られる試験データのうち、学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更
し、
前記割合に基づき前記学習データとして取得された複数の試験データのうち、前記試験工程における製造環境を示す加工データを説明変数、前記試験工程で製造された製造物の品質を示す品質データを目的変数として、前記学習モデルを学習する、
を有することを特徴とする学習装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習プログラム、学習方法および学習装置に関する。
【背景技術】
【0002】
製造業などでは、経験則に基づく判断が品質を左右する状況がある。このことから、経験則に基づく判断の可視化として、製造装置のIoT(Internet of Things)データを取得し、品質の傾向を機械学習し、品質を判定する品質モデルを生成する取り組みが行われている。
【0003】
例えば、加工装置から得られる加工データと検査装置から得られる品質データの相関を計算することで、加工データから品質を予測する品質予測技術が知られている。この品質予測技術では、加工データから品質を予測する、加工データと品質データとの相関を表す線形モデルなどの学習モデルを量産工程の事前試験で生成する。そして、事前に生成した学習モデルに、加工データを入力して良品と不良品を判定することで、検査工程を削減する。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2017-215832号公報
【文献】特開2018-156415号公報
【文献】特開2017-130100号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、上記技術では、事前の試験工程のデータで学習した学習モデルを量産工程に適用した場合に、品質を正確に予測できないことあり、予測精度がよくない。
【0006】
具体的には、試験工程と量産工程とでは、暖機運転時間や気温などの加工環境が異なるので、試験工程で生成した学習モデルが量産工程では適合しないことがある。また、製造バラつきの存在や、人の判断や操作などの不安定な動作環境で取得されたデータを学習データに用いるので、単純に機械学習でデータを学習するだけでは、高い品質判定の精度が期待できない。
【0007】
例えば、特定の条件だけを反映した学習用のIoTデータを得るために、試験工程の製造ラインを停止させた状態で取得されたデータを用いて、学習モデルが生成される。この場合、量産工程で取得されるデータは、連続動作状態で取得されるデータであり、学習データと予測対象データ(量産データ)との間で取得環境が異なるので、性質が異なる学習データから生成した学習モデルを量産データに適用しても高い精度は得られない。
【0008】
なお、試験工程と量産工程との違いは、暖機の影響などが候補ではあるが、原因を突き詰めて調査を行うには工数がかかりすぎることから現実的ではない。
【0009】
一つの側面では、予測精度の劣化を低減することができる学習プログラム、学習方法および学習装置を提供することを目的とする。
【課題を解決するための手段】
【0010】
第1の案では、学習プログラムは、コンピュータに、製造物の製造を試験する試験工程において異常な製品が製造された割合を示す第1の異常値割合を算出する処理を実行させる。学習プログラムは、コンピュータに、前記製造物を製造する量産工程において製造を開始してから所定時間の間に製造された製造物に基づき、異常な製品が製造された割合を示す第2の異常値割合を算出する処理を実行させる。学習プログラムは、コンピュータに、前記第1の異常値割合と前記第2の異常値割合とに基づき、前記試験工程と前記量産工程の類似度を算出する処理を実行させる。学習プログラムは、コンピュータに、前記試験工程で得られる試験データのうち、学習モデルに学習させる学習データに利用する割合を、前記類似度に基づいて変更する処理を実行させる。
【発明の効果】
【0011】
一つの側面では、予測精度の劣化を低減することができる。
【図面の簡単な説明】
【0012】
【
図1】
図1は、実施例1にかかる品質予測装置を説明する図である。
【
図2】
図2は、実施例1にかかる品質予測装置の機能構成を示す機能ブロック図である。
【
図3】
図3は、試験データDBに記憶される情報の例を示す図である。
【
図4】
図4は、モデルリストDBに記憶される情報の例を示す図である。
【
図5】
図5は、異常値割合の検出手法を説明する図である。
【
図6】
図6は、類似度判定のパターンAを説明する図である。
【
図7】
図7は、類似度判定のパターンBを説明する図である。
【
図8】
図8は、類似度判定のパターンCを説明する図である。
【
図9】
図9は、適用モデルの決定を説明する図である。
【
図11】
図11は、全体的な処理の流れを示すフローチャートである。
【
図12】
図12は、異常割合の算出処理の流れを示すフローチャートである。
【
図13】
図13は、指標算出処理の流れを示すフローチャートである。
【
図14】
図14は、ランダム性がある機械学習を採用したときの例を説明する図である。
【発明を実施するための形態】
【0013】
以下に、本願の開示する学習プログラム、学習方法および学習装置の実施例を図面に基づいて詳細に説明する。なお、この実施例によりこの発明が限定されるものではない。また、各実施例は、矛盾のない範囲内で適宜組み合わせることができる。
【実施例1】
【0014】
[品質予測装置の説明]
図1は、実施例1にかかる品質予測装置10を説明する図である。
図1に示すように、品質予測装置10は、製造業などの工場等で生成される製品の品質を予測する学習モデル(予測モデル)を生成し、学習済みの学習モデルを用いて、品質を予測するコンピュータ装置である。
【0015】
具体的には、品質予測装置10は、製品の製造や品質検査などを事前に行う試験工程で得られる試験データを学習データに用いて、学習モデルを学習する。そして、品質予測装置10は、試験完了後に実際に製品が製造される量産工程において製造された製品に関する量産データを、学習済みの学習モデルに入力して、量産工程で製造される製品の品質を予測する。
【0016】
なお、試験工程を実施するのは、以下のような理由が挙げられる。例えば、研削加工機の振る舞いを確認するためである。同じ型式の加工機でも、それぞれの加工機が製造される際のバラツキに伴う機差があり、それぞれの特性を知るために、試験工程が実施される。また、量産工程では稀なケース(コーナーケース)を敢えて作り出し、その際の振る舞いを確認するためである。また、机上でのシミュレーションだけでは考慮しきれないケースが存在するので、生産性の向上やコスト削減のための研削条件変更の際に、振る舞いを確認するためである。
【0017】
一般的には、製造装置の暖機の有無、室温、気候、製造装置の稼働時間など、試験工程の環境と量産工程の環境とが異なることから、試験工程のデータで学習された学習モデルは、試験工程にオーバーフィッティングする。このため、試験工程のデータにより学習された学習モデルを試験工程に適用したときに、品質の予測精度が劣化することがある。
【0018】
そこで、実施例1にかかる品質予測装置10は、試験工程の試験データと量産工程の量産データの間の類似度を算出し、類似度に合わせた量の試験データを用いて、学習モデルの学習することで、試験工程へのオーバーフィッティングを抑制する。
【0019】
例えば、試験工程では、加工装置により、試験環境に関するデータである加工データが生成され、検査装置により、試験工程で生成された製品における異常な製品の割合などである品質データを生成される。同様に、量産工程では、一定期間、製品の量産を行って、量産環境に関する加工データが生成され、量産工程で生成された製品における異常な製品の割合などである品質データが生成される。
【0020】
そして、品質予測装置10は、試験工程の品質データと量産工程の品質データの類似度を算出する。続いて、品質予測装置10は、試験工程の加工データと品質データとから構成される学習データのうち、類似度に基づく割合の学習データを抽出し、抽出した学習データを用いて学習モデルを学習する。ここで、品質予測装置10は、加工データを説明変数、品質データを目的変数として、学習を実行する。
【0021】
その後、品質予測装置10は、学習データの割合制御が実行された上で学習された学習モデルを量産工程に適用する。すなわち、品質予測装置10は、量産工程の加工装置により製造された製品のデータを、学習済みの学習モデルに入力し、その出力結果に基づいて、量産工程の品質を予測する。この結果、試験工程へのオーバーフィッティングを抑制でき、予測精度の劣化を低減することができる。
【0022】
[機能構成]
図2は、実施例1にかかる品質予測装置10の機能構成を示す機能ブロック図である。なお、各工程の加工装置と検査装置は、一般的に利用される各装置を用いることができるので、詳細な説明は省略する。
図2に示すように、品質予測装置10は、通信部11、記憶部12、制御部20を有する。
【0023】
通信部11は、他の装置の間の通信を制御する処理部であり、例えば通信インタフェースなどである。例えば、通信部11は、試験工程や量産工程の加工装置から加工データを受信し、各工程の検査装置から検査データを受信し、管理者端末に学習済みの学習モデルや予測結果などを送信する。
【0024】
記憶部12は、各種データや制御部20が実行する各種プログラムなどを記憶する記憶装置であり、例えばメモリやハードディスクなどである。この記憶部12は、試験データDB13、量産データDB14、モデルリストDB15、学習結果DB16を記憶する。
【0025】
試験データDB13は、試験工程で生成された加工データおよび品質データを記憶するデータベースである。
図3は、試験データDB13に記憶される情報の例を示す図である。
図3に示すように、試験データDB13は、「製品、加工データ、品質データ」を対応付けて記憶する。
【0026】
ここで記憶される「製品」は、試験工程で製造された製品を特定する情報であり、例えば製品名、製品IDなどである。「加工データ」は、試験工程の環境を示すデータであり、例えば切削速度や温度などである。「品質データ」は、試験工程で生成された製品の品質を示すデータであり、例えば製品の平面度や直角度などである。ここで記憶されるデータは、試験工程の加工装置や検査装置で測定されるデータであり、各装置が生成することもでき、管理者等により生成することもできる。
【0027】
量産データDB14は、量産工程で生成された加工データおよび品質データを記憶するデータベースである。記憶される情報は、
図3と同様なので、詳細な説明は省略する。なお、ここで記憶されるデータは、量産工程の加工装置や検査装置で測定されるデータであり、各装置が生成することもでき、管理者等により生成することもできる。
【0028】
モデルリストDB15は、学習データの利用割合の決定に利用する情報を記憶するデータベースである。具体的には、モデルリストDB15は、試験工程と量産工程との類似度に基づいて、試験工程で生成された試験データのうち、学習データとして利用する割合を特定できるモデルリストを記憶する。
【0029】
図4は、モデルリストDB15に記憶される情報の例を示す図である。
図4に示すように、モデルリストDB15は、「Metrix、類似度ランク、モデル(学習%、テスト%)」を対応付けて記憶する。ここで記憶される「Metrix」は、試験データと量産データとの類似度の指標を示す情報である。「類似度ランク」は、試験データと量産データとの類似度を特定する情報である。「モデル(学習%)」は、全試験データのうち、学習に利用する割合を示す情報であり、「モデル(テスト%)」は、全試験データのうち、学習済みの学習モデルの検証に利用する割合を示す情報である。
【0030】
図4の例では、「Metrix」が「0.4」のとき、類似度ランクが4となり、試験データのうち、60%を学習データとして用い、40%を検証データとして用いることが定義されている。なお、ここで定義される情報は、ユーザ等により事前に定義される。また、
図4の例では、10段階の類似度ランクを定義する例を説明したが、あくまで一例であり、任意に設定変更することができる。また、各割合もあくまで一例であり、任意に設定変更することができる。
【0031】
学習結果DB16は、学習結果を記憶するデータベースである。例えば、学習結果DB16は、後述する学習部24により学習された学習モデルの各種パラメータなどを記憶する。ここで記憶される各種パラメータを用いることで、学習済みの学習モデルを構築することができる。
【0032】
制御部20は、品質予測装置10全体を司る処理部であり、例えばプロセッサなどである。この制御部20は、異常算出部21、指標算出部22、ランク決定部23、学習部24、品質予測部25を有する。なお、異常算出部21、指標算出部22、ランク決定部23、学習部24、品質予測部25は、プロセッサが有する電子回路の一例やプロセッサが実行するプロセスの一例である。
【0033】
異常算出部21は、試験工程と量産工程それぞれについて、製造された製品の異常割合を算出する処理部である。具体的には、異常算出部21は、試験工程で得られた品質データにおける異常値(異常製品)の割合を、品質データのパラメータごとに算出する。同様に、異常算出部21は、量産工程で得られた品質データにおける異常値(異常製品)の割合を、品質データのパラメータごとに算出する。そして、異常算出部21は、算出結果を記憶部12に記憶したり、指標算出部22に出力したりする。
【0034】
例えば、異常算出部21は、ガンマ分布による異常検出や混合正規分布を仮定した異常検出など、一般的に利用されている手法を用いることができるが、ここでは、一例としてパラメータの値を閾値との比較により、異常検出を行う例を説明する。
【0035】
図5を用いて、試験工程における異常検出を説明する。
図5は、異常値割合の検出手法を説明する図である。
図5に示すように、異常算出部21は、試験工程で生成されたM個(Mは1以上の数)の製品に対応する品質データが有する平面度や直角度などの複数のパラメータから、1つのパラメータ(パラメータA)を選択する。そして、異常算出部21は、各製品に対応するパラメータAの値が閾値以上か否かを判定し、閾値以上であって異常と判定されるパラメータAを有する製品の数を計数する。
【0036】
ここで、異常算出部21は、閾値以上である製品の数がMa個と計数された場合、パラメータAの異常値割合を「異常数/全体個数=Ma/M」と算出する。このようにして、異常算出部21は、品質データに含まれる各パラメータについて、上述した処理を実行して、異常値割合を算出する。すなわち、異常算出部21は、品質データ内にP個(Pは1以上の数)のパラメータが存在する場合、P個のパラメータそれぞれについて、異常値割合を算出する。
【0037】
また、異常算出部21は、量産工程で製造された製品の品質データについても同様の処理により、各パラメータの異常値割合を算出する。なお、量産工程では、試験工程との類似度を測定するために、10分などの所定時間分、製造ラインを稼働させて、品質データの収集が実行される。
【0038】
指標算出部22は、試験工程と量産工程との類似度を指標化する処理部である。具体的には、指標算出部22は、異常算出部21により算出された、試験工程における各パラメータの異常値割合および量産工程の各パラメータの異常値割合に基づき、試験工程と量産工程との比較結果(diff)を算出する。
【0039】
例えば、指標算出部22は、式(1)に示す混合正規分布を用いたクラスタリングにより、各パラメータについて「diff」を算出する。その後、指標算出部22は、式(2)を用いて、各パラメータのdiffを加算した合計値を、パラメータの数(N:Nは1以上の数)で除算することで、試験工程と量産工程との類似度を示す指標「Metrix」を算出する。そして、指標算出部22は、算出した指標「Metrix」をランク決定部23に出力する。
【0040】
【0041】
ランク決定部23は、指標算出部22により算出された結果に基づいて、類似度ランクを決定する処理部である。具体的には、ランク決定部23は、モデルリストDB15を参照し、指標算出部22から入力された「Metirx」に対応する類似度ランクを特定する。そして、ランク決定部23は、特定した類似度ランクを、決定したランクとして学習部24に出力する。
【0042】
学習部24は、ランク決定部23により決定された類似度ランクに対応する割合に基づき、機械学習を実行して学習モデルを生成する処理部である。例えば、学習部24は、類似度ランク「6」が通理されると、モデルリストDB15を参照して、「学習%=40」と「テスト%=60%」を特定する。
【0043】
そして、学習部24は、試験データに含まれるデータのうち、「40%」のデータを抽出して、それらを学習データに決定する。その後、学習部24は、読み出した試験データの加工データを「説明変数」、品質データを「目標変数(ラベル)」に用いた機械学習により、学習モデルを学習する。その後、学習部24は、学習結果を学習結果DB16に格納する。なお、抽出方法は、全試験データのうち、最新の40%のデータを抽出したり、ランダムに40%のデータを抽出したりするなど、任意に設定することができる。
【0044】
品質予測部25は、学習済みの学習モデルを用いて、品質予測を実行する処理部である。例えば、品質予測部25は、学習結果DB16に記憶される各種パラメータを読み出して、学習モデルを生成する。そして、品質予測部25は、量産工程の加工データを学習済みの学習モデルに入力し、その出力結果を品質予測結果として取得する。その後、品質予測部25は、品質予測結果をディスプレイ等の表示部に表示したり、管理者端末に送信したりする。例えば、品質予測部25は、品質予測結果として、学習済みの学習モデルから、品質を特定する各パラメータが異常か正常かを示す確率や数値等を取得する。そして、品質予測部25は、異常のパラメータが1つ以上または所定数以上存在する場合に、品質異常と予測する。
【0045】
[具体例]
ここで、
図6から
図10を用いて、異常値割合の算出、試験工程と量産工程との比較結果(diff)の算出、試験工程と量産工程との類似度を示す指標「Metrix」の算出、学習手法の具体例を説明する。
【0046】
(パターンA)
図6は、類似度判定のパターンAを説明する図である。
図6では、品質データのパラメータX0、X1、X2、X3それぞれについて、それぞれの閾値である異常値閾値(2.3)、異常値閾値(2.4)、異常値閾値(0.5)、異常値閾値(-0.8)を用いて、異常値割合を算出した例を示している。
【0047】
具体的には、試験工程においては、パラメータX0の異常値割合が「10%」、パラメータX1の異常値割合が「5%」、パラメータX2の異常値割合が「20%」、パラメータX3の異常値割合が「3%」である。また、量産工程においては、パラメータX0の異常値割合が「10%」、パラメータX1の異常値割合が「6%」、パラメータX2の異常値割合が「15%」、パラメータX3の異常値割合が「2%」である。
【0048】
このような状態において、指標算出部22は、パラメータX0について、試験工程および量産工程の異常値割合のうち最大値が「10」であり、各工程の異常値割合の差分が「10-10=0」であることから、「diff=0/10=0」と算出する。同様に、指標算出部22は、パラメータX1について、試験工程および量産工程の異常値割合のうち最大値が「6」であり、各工程の異常値割合の差分が「6-5=1」であることから、「diff=1/6≒0.17」と算出する。
【0049】
同様に、指標算出部22は、パラメータX2について、試験工程および量産工程の異常値割合のうち最大値が「20」であり、各工程の異常値割合の差分が「20-15=5」であることから、「diff=5/20=0.25」と算出する。また、指標算出部22は、パラメータX3について、試験工程および量産工程の異常値割合のうち最大値が「3」であり、各工程の異常値割合の差分が「3-2=1」であることから、「diff=1/3≒0.3」と算出する。
【0050】
そして、指標算出部22は、パラメータX0、X1、X2、X3それぞれのdiffの合計値をパラメータの数である「4」で除算することで、「Metrix=(0+0.17+0.25+0.3)/4=0.18」と算出する。この結果、ランク決定部23は、モデルリストを参照し、Metrix「0.18」以上のうち最も低いランクである類似度ランク(2)を特定する。すなわち、パターンAの量産工程は、試験工程に近い環境であることが特定され、パターンAでは、試験工程へのフィット率を上げた学習が行われる。
【0051】
(パターンB)
図7は、類似度判定のパターンBを説明する図である。
図6では、
図6と同様に、品質データのパラメータX0、X1、X2、X3それぞれについて、それぞれの閾値である異常値閾値(2.3)、異常値閾値(2.4)、異常値閾値(0.5)、異常値閾値(-0.8)を用いて、異常値割合を算出した例を示している。
【0052】
具体的には、試験工程においては、パラメータX0の異常値割合が「10%」、パラメータX1の異常値割合が「5%」、パラメータX2の異常値割合が「20%」、パラメータX3の異常値割合が「3%」である。また、量産工程においては、パラメータX0の異常値割合が「11%」、パラメータX1の異常値割合が「30%」、パラメータX2の異常値割合が「10%」、パラメータX3の異常値割合が「2%」である。
【0053】
このような状態において、指標算出部22は、パラメータX0について、試験工程および量産工程の異常値割合のうち最大値が「11」であり、各工程の異常値割合の差分が「11-10=1」であることから、「diff=1/11≒0.1」と算出する。同様に、指標算出部22は、パラメータX1について、試験工程および量産工程の異常値割合のうち最大値が「30」であり、各工程の異常値割合の差分が「30-5=25」であることから、「diff=10/30≒0.83」と算出する。
【0054】
同様に、指標算出部22は、パラメータX2について、試験工程および量産工程の異常値割合のうち最大値が「20」であり、各工程の異常値割合の差分が「20-10=10」であることから、「diff=10/20=0.5」と算出する。また、指標算出部22は、パラメータX3について、試験工程および量産工程の異常値割合のうち最大値が「3」であり、各工程の異常値割合の差分が「3-2=1」であることから、「diff=1/3≒0.3」と算出する。
【0055】
そして、指標算出部22は、パラメータX0、X1、X2、X3それぞれのdiffの合計値をパラメータの数である「4」で除算することで、「Metrix=(0.1+0.83+0.5+0.3)/4=0.43」と算出する。この結果、ランク決定部23は、モデルリストを参照し、Metrix「0.43」以上のうち最も低いランクである類似度ランク(5)を特定する。
【0056】
(パターンC)
図8は、類似度判定のパターンCを説明する図である。
図Cでは、
図6と同様に、品質データのパラメータX0、X1、X2、X3それぞれについて、それぞれの閾値である異常値閾値(2.3)、異常値閾値(2.4)、異常値閾値(0.5)、異常値閾値(-0.8)を用いて、異常値割合を算出した例を示している。
【0057】
具体的には、試験工程においては、パラメータX0の異常値割合が「10%」、パラメータX1の異常値割合が「5%」、パラメータX2の異常値割合が「20%」、パラメータX3の異常値割合が「3%」である。また、量産工程においては、パラメータX0の異常値割合が「40%」、パラメータX1の異常値割合が「10%」、パラメータX2の異常値割合が「80%」、パラメータX3の異常値割合が「30%」である。
【0058】
このような状態において、指標算出部22は、パラメータX0について、試験工程および量産工程の異常値割合のうち最大値が「40」であり、各工程の異常値割合の差分が「40-10=30」であることから、「diff=30/40=0.75」と算出する。同様に、指標算出部22は、パラメータX1について、試験工程および量産工程の異常値割合のうち最大値が「10」であり、各工程の異常値割合の差分が「10-5=5」であることから、「diff=5/10=0.5」と算出する。
【0059】
同様に、指標算出部22は、パラメータX2について、試験工程および量産工程の異常値割合のうち最大値が「80」であり、各工程の異常値割合の差分が「80-20=60」であることから、「diff=60/80=0.75」と算出する。また、指標算出部22は、パラメータX3について、試験工程および量産工程の異常値割合のうち最大値が「30」であり、各工程の異常値割合の差分が「30-3=27」であることから、「diff=27/30=0.9」と算出する。
【0060】
そして、指標算出部22は、パラメータX0、X1、X2、X3それぞれのdiffの合計値をパラメータの数である「4」で除算することで、「Metrix=(0.75+0.5+0.75+0.9)/4=0.73」と算出する。この結果、ランク決定部23は、モデルリストを参照し、Metrix「0.73」以上のうち最も低いランクである類似度ランク(8)を特定する。すなわち、パターンCの量産工程は、試験工程とは類似しない環境であり、パターンCでは、試験工程へのフィット率を下げた学習が行われる。
【0061】
(学習処理の説明)
図9は、適用モデルの決定を説明する図である。ここでは、上記パターンA、B、Cのそれぞれに対する適用モデルの決定を説明する。
図9に示すように、学習部24は、パターンAでは類似度ランクとして「2」が決定されたので、試験データの80%を用いて学習を実行する。また、学習部24は、パターンBでは類似度ランクとして「5」が決定されたので、試験データの50%を用いて学習を実行する。同様に、学習部24は、パターンCでは類似度ランクとして「8」が決定されたので、試験データの20%を用いて学習を実行する。このように、各パターンについて、類似度ランクにより試験工程へのフィット率を調整した品質判定モデルの生成が実行される。
【0062】
ここで、学習データの抽出イメージを説明する。
図10は、学習データの抽出を説明する図である。
図10に示すように、実施例1では、試験データと量産データの類似度を推定し、X%の一致度が推定された場合、学習データのうちX%の個数を抽出し、抽出した学習データを用いた学習が実行される。
【0063】
一般的な技術では、試験データを全て使用することで、精度の高い品質予測モデルを作ろうとする。これに対して、実施例1では、類似度に合わせた量の試験データだけを使用する。例えば、類似度が80ならば、試験データの80%をランダムに抽出して使用する。これにより、試験データに対する予測精度が低くなるが、データのバラツキに強い品質予測モデルを作成することができる。
【0064】
[処理の流れ]
図11は、全体的な処理の流れを示すフローチャートである。
図11に示すように、品質予測装置10は、処理開始が指示されると、試験工程の異常値割合を算出し(S101)、量産工程の異常値割合を算出する(S102)。
【0065】
続いて、品質予測装置10は、試験工程の異常値割合と量産工程の異常値割合とを用いて、指標を算出し(S103)、算出された指標に基づき、類似度ランクを決定する(S104)。
【0066】
そして、品質予測装置10は、決定された類似度ランクに基づく学習データの数を利用して、学習モデルを学習し(S105)、学習が完了すると、学習結果と量産工程の加工データとを用いて、量産工程の品質予測を実行する(S106)。
【0067】
[異常割合算出処理]
図12は、異常割合の算出処理の流れを示すフローチャートである。この処理は、
図11のS101とS102で実行される処理である。
【0068】
図12に示すように、異常算出部21は、各工程の品質データに含まれる各パラメータを取得する(S201)。続いて、異常算出部21は、取得したパラメータから1つのパラメータを抽出する(S202)。
【0069】
そして、異常算出部21は、抽出したパラメータの異常値割合を算出し(S203)、算出結果を記憶部12等に格納する(S204)。その後、異常算出部21は、未処理である残りのパラメータが存在する場合(S205:Yes)、未処理のパラメータについて、S202以降を繰り返す。一方、異常算出部21は、残りのパラメータが存在しない場合(S205:No)、処理を終了する。
【0070】
[指標算出処理]
図13は、指標算出処理の流れを示すフローチャートである。この処理は、
図11のS103とS104で実行される処理である。
【0071】
図13に示すように、指標算出部22は、各工程の品質データに含まれる各パラメータから1つのパラメータを選択し(S301)、選択したパラメータについて、試験工程と量産工程の異常値割合を取得する(S302)。続いて、指標算出部22は、選択したパラメータの比較値(diff)を算出して記録する(S303)。
【0072】
そして、指標算出部22は、未算出である残りのパラメータが存在する場合(S304:Yes)、残りのパラメータについて、S301以降を繰り返す。
【0073】
一方、未算出である残りのパラメータが存在しない場合(S304:No)、ランク決定部23は、各パラメータの比較値(diff)を用いて、指標(Metrix)を算出して記憶部12等に記録する(S305)。
【0074】
そして、ランク決定部23は、算出された指標(Metrix)に基づき、類似度ランクを決定する(S306)。その後、学習部24により、類似度ランクに対応する学習データの割合に基づき、学習モデルの学習が実行される。
【0075】
[効果]
上述したように、品質予測装置10は、品質データの類似度に基づき、学習データに利用する試験データの割合を制御して、学習モデルの学習を実行する。このため、品質予測装置10は、試験工程と環境が異なる量産工程に対しては、学習モデルが試験工程へオーバーフィッティングすることを抑制できるので、事前の試験工程のデータで学習した学習モデルを量産工程に適用した場合でも、予測精度の劣化を抑制することができる。また、品質予測装置10は、試験工程と環境が類似する量産工程に対しては、多くの試験工程のデータを用いて学習モデルを生成することで、予測精度の劣化を抑制することができる。
【0076】
したがって、品質予測装置10は、量産工程の環境に応じて、学習に利用する試験データの割合を動的に制御することができるので、1つの試験工程のデータから、複数の量産工程それぞれに適した学習モデルを生成することができる。
【実施例2】
【0077】
さて、これまで本発明の実施例について説明したが、本発明は上述した実施例以外にも、種々の異なる形態にて実施されてよいものである。
【0078】
[学習モデルの選択]
上記実施例では、類似度ランクに対応する割合の試験データを用いて学習する例を説明したが、これに限定されない。例えば、品質予測装置10は、各類似度ランクに対応する割合の試験データを用いた複数の学習モデルを予め学習して用意しておく。そして、品質予測装置10は、対象の量産工程と試験工程との類似度に基づく類似度ランクを特定し、特定した類似度ランクに対応する学習モデルを、予め保持する学習モデルの中から選択することもできる。このようにすることで、品質予測装置10は、学習時間を短縮することができ、量産工程に適した学習モデルを用いた予測を迅速に実行することができる。
【0079】
[ランダム性がある学習]
上記実施例では、ニューラルネットワークや線形モデルなどを利用した学習モデルを例示したが、これに限定されるものではなく、ランダムフォレストのように、ランダム性がある機械学習を用いることもできる。ランダム性がある機械学習では、同じ学習データであっても、テストデータに偏りが大きく、モデル構築毎にテストデータの選定にランダム性が発生し、大きく結果が変わる場合がある。つまり、同じ割合の試験データを学習データに用いても、精度が一律にならない。このため、品質予測装置10は、複数の精度の学習モデルから適した学習モデルを選択することができる。
【0080】
図14は、ランダム性がある機械学習を採用したときの例を説明する図である。
図14に示すように、品質予測装置10は、試験工程の品質データにおける異常値の割合と量産工程の品質データにおける異常値の割合とから、指標(Metrix)として「0.6」を算出したとする。この場合、品質予測装置10は、類似度ランクを「6」と決定し、学習割合を「40%」、検証割合を「60%」と決定する。
【0081】
そして、品質予測装置10は、試験工程の試験データ(加工データおよび品質データ)の40%を用いて、ランダムフォレストにより学習モデルを学習する。このとき、精度の異なるモデル1、モデル2、モデル3が生成されたとする。そして、品質予測装置10は、試験工程の試験データのうち学習に利用されなかった残りの試験データ(残り60%の加工データおよび品質データ)を用いて、モデル1、モデル2、モデル3それぞれの精度検証を実行し、モデル1の精度を90%、モデル2の精度を80%、モデル3の精度を85%と算出する。ここで精度とは、正しく予測(識別)できた割合である。
【0082】
すると、品質予測装置10は、各精度の90%、80%、85%の平均値「85」を算出し、平均値に対応するモデル3を、量産工程用の学習モデルに決定する。このようにすることで、品質予測装置10は、ランダム性がある機械学習であっても、類似度に基づくモデル選定を実行することができる。なお、平均値に限らず、最大値や最小値を採用することもできる。
【0083】
[データや数値等]
上記実施例で用いたデータ例、数値例、表示例等は、あくまで一例であり、任意に変更することができる。また、入力データや学習方法などもあくまで一例であり、任意に変更することができる。なお、異常算出部21は、第1算出部と第2算出部の一例であり、指標算出部22は、第3算出部の一例であり、ランク決定部23は、変更部の一例である。
【0084】
[類似度算出]
類似度の算出には、公知の様々な手法を採用することができ、例えば、主成分分析(PCA)による類似度検出を採用することができる。PCAを行うことで、パラメータを別軸に変換でき、この時のPC1、PC2、PC3の軸に含まれるパラメータの種類の一致度を平均して、類似度とする。なお、完全にデータ発生の性質が同じであれば、PC1軸、PC2軸、PC3軸それぞれに含まれるパラメータは一致する。また、変数の種類のみを対象とし、値は考慮しない。
【0085】
[システム]
上記文書中や図面中で示した処理手順、制御手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。
【0086】
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散や統合の具体的形態は図示のものに限られない。つまり、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。
【0087】
さらに、各装置にて行なわれる各処理機能は、その全部または任意の一部が、CPUおよび当該CPUにて解析実行されるプログラムにて実現され、あるいは、ワイヤードロジックによるハードウェアとして実現され得る。
【0088】
[ハードウェア]
図15は、ハードウェア構成例を説明する図である。
図15に示すように、品質予測装置10は、通信装置10a、HDD(Hard Disk Drive)10b、メモリ10c、プロセッサ10dを有する。また、
図15に示した各部は、バス等で相互に接続される。
【0089】
通信装置10aは、ネットワークインタフェースカードなどであり、他のサーバとの通信を行う。HDD10bは、
図2に示した機能を動作させるプログラムやDBを記憶する。
【0090】
プロセッサ10dは、
図2に示した各処理部と同様の処理を実行するプログラムをHDD10b等から読み出してメモリ10cに展開することで、
図2等で説明した各機能を実行するプロセスを動作させる。例えば、このプロセスは、品質予測装置10が有する各処理部と同様の機能を実行する。具体的には、プロセッサ10dは、異常算出部21、指標算出部22、ランク決定部23、学習部24、品質予測部25等と同様の機能を有するプログラムをHDD10b等から読み出す。そして、プロセッサ10dは、異常算出部21、指標算出部22、ランク決定部23、学習部24、品質予測部25等と同様の処理を実行するプロセスを実行する。
【0091】
このように、品質予測装置10は、プログラムを読み出して実行することで品質予測方法を実行する情報処理装置として動作する。また、品質予測装置10は、媒体読取装置によって記録媒体から上記プログラムを読み出し、読み出された上記プログラムを実行することで上記した実施例と同様の機能を実現することもできる。なお、この他の実施例でいうプログラムは、品質予測装置10によって実行されることに限定されるものではない。例えば、他のコンピュータまたはサーバがプログラムを実行する場合や、これらが協働してプログラムを実行するような場合にも、本発明を同様に適用することができる。
【符号の説明】
【0092】
10 品質予測装置
11 通信部
12 記憶部
13 試験データDB
14 量産データDB
15 モデルリストDB
16 学習結果DB
20 制御部
21 異常算出部
22 指標算出部
23 ランク決定部
24 学習部
25 品質予測部