(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024173318
(43)【公開日】2024-12-12
(54)【発明の名称】品質予測システム及び予測プログラム
(51)【国際特許分類】
G06N 20/00 20190101AFI20241205BHJP
G06N 20/20 20190101ALI20241205BHJP
G06Q 50/04 20120101ALI20241205BHJP
【FI】
G06N20/00 130
G06N20/20
G06Q50/04
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2023091662
(22)【出願日】2023-06-02
(71)【出願人】
【識別番号】000000941
【氏名又は名称】株式会社カネカ
(74)【代理人】
【識別番号】100100480
【弁理士】
【氏名又は名称】藤田 隆
(74)【代理人】
【識別番号】100201455
【弁理士】
【氏名又は名称】横尾 宏治
(72)【発明者】
【氏名】山口 貴史
【テーマコード(参考)】
5L049
5L050
【Fターム(参考)】
5L049CC04
5L050CC04
(57)【要約】
【課題】本発明は、従来に比べて、高精度の学習モデルを生成でき、製造パラメータから品質パラメータを予測できる品質予測システムを提供する。
【解決手段】品質パラメータの中から抽出パラメータ群を抽出するパラメータ抽出部と、抽出パラメータ群から抽出パラメータ群の各品質パラメータの間の関係性を反映した少なくとも第1合成変数と第2合成変数を算出する第1変数変換部と、過去製品の製造パラメータと第1合成変数のデータセットを用いた教師あり学習によって生成される第1学習モデルと、過去製品の製造パラメータと第2合成変数のデータセットを用いた教師あり学習によって生成される第2学習モデルを生成する学習モデル生成部と、予測対象製品の製造パラメータから合成変数群を予測する予測部と、予測部が予測した合成変数群を抽出パラメータ群の各品質パラメータに変換する第2変数変換部を備える構成とする。
【選択図】
図2
【特許請求の範囲】
【請求項1】
予測対象製品の複数種類の製造パラメータを用いて前記予測対象製品の複数種類の品質パラメータを予測する品質予測システムであって、
前記複数種類の品質パラメータの中から少なくとも2種類の品質パラメータを含んだ抽出パラメータ群を抽出するパラメータ抽出部と、
前記抽出パラメータ群の各品質パラメータから前記抽出パラメータ群の各品質パラメータの間の関係性を反映した少なくとも第1合成変数と第2合成変数を含む合成変数群を算出する第1変数変換部と、
過去に製造された過去製品の複数種類の製造パラメータと当該過去製品の第1合成変数のデータセットを用いた教師あり学習によって生成される第1学習モデルと、前記過去製品の複数種類の製造パラメータと前記過去製品の第2合成変数のデータセットを用いた教師あり学習によって生成される第2学習モデルと、を含む学習モデル群を生成する学習モデル生成部と、
前記学習モデル群を用いて前記予測対象製品の複数種類の製造パラメータから合成変数群を予測する予測部と、
前記予測部が予測した前記合成変数群を前記抽出パラメータ群の各品質パラメータに変換する第2変数変換部を備える、品質予測システム。
【請求項2】
前記第1変数変換部は、前記抽出パラメータ群における各品質パラメータを合成関数によって合成変数群を算出するものであり、
前記第2変数変換部は、前記合成関数の逆関数によって、前記第1合成変数及び前記第2合成変数を前記抽出パラメータ群の各品質パラメータに変換する、請求項1に記載の品質予測システム。
【請求項3】
前記第1変数変換部は、前記抽出パラメータ群における各品質パラメータを用いて主成分分析を行うものであり、
前記第1合成変数は、前記主成分分析における第1主成分であり、
前記第2合成変数は、前記主成分分析における第2主成分であり、
前記第2変数変換部は、前記第1変数変換部が行った前記主成分分析における第1主成分係数と第2主成分係数を用いて、前記第1合成変数及び前記第2合成変数を前記抽出パラメータ群の各品質パラメータに変換する、請求項2に記載の品質予測システム。
【請求項4】
前記抽出パラメータ群は、前記パラメータ抽出部によって前記複数種類の品質パラメータの中から無作為に抽出された品質パラメータで構成される、請求項1又は2に記載の品質予測システム。
【請求項5】
前記パラメータ抽出部は、複数種類の抽出パラメータ群を抽出するものであって、かつ前記複数種類の品質パラメータのそれぞれが前記複数種類の抽出パラメータ群のいずれかに属するように抽出するものであり、
前記第1変数変換部は、各抽出パラメータ群に対応する合成変数群をそれぞれ算出し、
前記学習モデル生成部は、過去製品の複数種類の製造パラメータと各合成変数群を用いて、各合成変数群に対応する学習モデル群をそれぞれ生成し、
前記予測部は、各学習モデル群を用いて、前記予測対象製品の複数種類の製造パラメータから各学習モデル群に対応する合成変数群をそれぞれ予測し、
前記第2変数変換部は、前記予測部が予測した各合成変数群を用いて前記予測対象製品の複数種類の品質パラメータのそれぞれに変換する、請求項1又は2に記載の品質予測システム。
【請求項6】
前記過去製品の中から所定の過去製品を抽出する製品抽出部を有し、
前記第1変数変換部は、前記製品抽出部が抽出した過去製品の前記抽出パラメータ群の各品質パラメータから、前記抽出パラメータ群の各品質パラメータの間の関係性を反映した合成変数群を生成する、請求項1又は2に記載の品質予測システム。
【請求項7】
前記第1変数変換部は、前記抽出パラメータ群の各品質パラメータから、前記第1合成変数と前記第2合成変数をそれぞれ個別に算出する、請求項1又は2に記載の品質予測システム。
【請求項8】
コンピュータに、予測対象製品の複数種類の製造パラメータを用いて前記予測対象製品の複数種類の品質パラメータを予測させる予測プログラムであって、
前記複数種類の品質パラメータの中から少なくとも2種類の品質パラメータを含んだ抽出パラメータ群を抽出する機能と、
前記抽出パラメータ群の各品質パラメータから前記抽出パラメータ群の各品質パラメータの間の関係性を反映した少なくとも第1合成変数と第2合成変数を含む合成変数群を算出する機能と、
過去に製造された過去製品の複数種類の製造パラメータと当該過去製品の第1合成変数のデータセットを用いた教師あり学習によって生成される第1学習モデルと、前記過去製品の複数種類の製造パラメータと前記過去製品の第2合成変数のデータセットを用いた教師あり学習によって生成される第2学習モデルと、を含む学習モデル群を生成する機能と、
前記学習モデル群を用いて前記予測対象製品の複数種類の製造パラメータから合成変数群を予測する機能と、
予測した前記合成変数群を前記抽出パラメータ群の各品質パラメータに変換する機能を備える、予測プログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、製造パラメータから品質パラメータを予測する品質予測システム及び予測プログラムに関する。
【背景技術】
【0002】
従来から複数の説明変数から複数の目的変数を予測する手法として、マルチターゲット回帰(Multi-Target Regression)が知られている(例えば、特許文献1、非特許文献1)。
【0003】
例えば、非特許文献1では、既知の複数の説明変数と複数の目的変数のデータセットを用い、複数の目的変数の中からランダムに2種類の目的変数を抽出し、抽出した2種類の目的変数に対してランダム線形ターゲット結合(Random Linear Target Combinations)を行ってランダムに設定された重みによって合成変数を算出する。
これを複数回、繰り返して多様性を持った複数の合成変数を算出し、複数の説明変数と合成変数のデータセットを用いて教師あり学習し、複数の説明変数から合成変数を予測する学習モデルを合成変数ごとに作成する。
【0004】
そして、非特許文献1では、説明変数を複数の学習モデルに入力することで、合成変数の予測値からなる行列を生成し、当該行列に対してランダム線形ターゲット結合で使用した重みで構成される係数行列の逆行列を掛けて複数の目的変数を同時に予測する。
【0005】
非特許文献1によれば、勾配ブースティングを用いて複数の説明変数から複数の目的変数を直接予測する場合に比べて予測精度が向上するとされている。
【先行技術文献】
【特許文献】
【0006】
【特許文献1】特許第7137303号公報
【非特許文献1】Tsoumakas, G., Spyromitros-Xioufis, E., Vrekou, A., Vlahavas, I., 2014.
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかしながら、非特許文献1は、ランダムに設定された重みによって合成変数を算出するため、抽出した目的変数間で特徴が打ち消し合ったり、ノイズが協調されたりする場合があり、学習モデルの最適化の観点から改良の余地があった。
【0008】
そこで、本発明は、従来に比べて、高精度の学習モデルを生成でき、当該学習モデルを用いて複数の製造パラメータから複数の品質パラメータを予測できる品質予測システム及び予測プログラムを提供することを課題とする。
【課題を解決するための手段】
【0009】
上記した課題を解決するための一つの様相は、予測対象製品の複数種類の製造パラメータを用いて前記予測対象製品の複数種類の品質パラメータを予測する品質予測システムであって、前記複数種類の品質パラメータの中から少なくとも2種類の品質パラメータを含んだ抽出パラメータ群を抽出するパラメータ抽出部と、前記抽出パラメータ群の各品質パラメータから前記抽出パラメータ群の各品質パラメータの間の関係性を反映した少なくとも第1合成変数と第2合成変数を含む合成変数群を算出する第1変数変換部と、過去に製造された過去製品の複数種類の製造パラメータと当該過去製品の第1合成変数のデータセットを用いた教師あり学習によって生成される第1学習モデルと、前記過去製品の複数種類の製造パラメータと前記過去製品の第2合成変数のデータセットを用いた教師あり学習によって生成される第2学習モデルと、を含む学習モデル群を生成する学習モデル生成部と、前記学習モデル群を用いて前記予測対象製品の複数種類の製造パラメータから合成変数群を予測する予測部と、前記予測部が予測した前記合成変数群を前記抽出パラメータ群の各品質パラメータに変換する第2変数変換部を備える、品質予測システムである。
【0010】
本様相によれば、1つの抽出パラメータ群から抽出パラメータ群を構成する各種の品質パラメータの間の関係性を反映した複数の合成変数に変換できるので、従来に比べて高精度の学習モデルが生成できる。
本様相によれば、各製造パラメータから各種の品質パラメータの間の関係性を反映した合成変数群を構成する各合成変数をそれぞれ予測し、予測した各合成変数から各品質パラメータを予測するので、既存のマルチターゲット回帰によって製造パラメータから直接品質パラメータを予測する場合に比べて精度良く品質パラメータを予測することができる。
このように、本様相によれば、品質パラメータ間の関係性を加味したより適切な合成変数を生成できることで、同じデータセットを用いた場合でも従来に比べて高精度の学習モデルを生成でき、当該学習モデルを用いて複数の製造パラメータから複数の品質パラメータを予測できる。
【0011】
好ましい様相は、前記第1変数変換部は、前記抽出パラメータ群における各品質パラメータを合成関数によって合成変数群を算出するものであり、前記第2変数変換部は、前記合成関数の逆関数によって、前記第1合成変数及び前記第2合成変数を前記抽出パラメータ群の各品質パラメータに変換する。
【0012】
より好ましい様相は、前記第1変数変換部は、前記抽出パラメータ群における各品質パラメータを用いて主成分分析を行うものであり、前記第1合成変数は、前記主成分分析における第1主成分であり、前記第2合成変数は、前記主成分分析における第2主成分であり、前記第2変数変換部は、前記第1変数変換部が行った前記主成分分析における第1主成分係数と第2主成分係数を用いて、前記第1合成変数及び前記第2合成変数を前記抽出パラメータ群の各品質パラメータに変換する。
【0013】
好ましい様相は、前記抽出パラメータ群は、前記パラメータ抽出部によって前記複数種類の品質パラメータの中から無作為に抽出された品質パラメータで構成される。
【0014】
好ましい様相は、前記パラメータ抽出部は、複数種類の抽出パラメータ群を抽出するものであって、かつ前記複数種類の品質パラメータのそれぞれが前記複数種類の抽出パラメータ群のいずれかに属するように抽出するものであり、前記第1変数変換部は、各抽出パラメータ群に対応する合成変数群をそれぞれ算出し、前記学習モデル生成部は、過去製品の複数種類の製造パラメータと各合成変数群を用いて、各合成変数群に対応する学習モデル群をそれぞれ生成し、前記予測部は、各学習モデル群を用いて、前記予測対象製品の複数種類の製造パラメータから各学習モデル群に対応する合成変数群をそれぞれ予測し、前記第2変数変換部は、前記予測部が予測した各合成変数群を用いて前記予測対象製品の複数種類の品質パラメータのそれぞれに変換する。
【0015】
好ましい様相は、前記過去製品の中から所定の過去製品を抽出する製品抽出部を有し、
前記第1変数変換部は、前記製品抽出部が抽出した過去製品の前記抽出パラメータ群の各品質パラメータから、前記抽出パラメータ群の各品質パラメータの間の関係性を反映した合成変数群を生成する。
【0016】
好ましい様相は、前記第1変数変換部は、前記抽出パラメータ群の各品質パラメータから、前記第1合成変数と前記第2合成変数をそれぞれ個別に算出する。
【0017】
本発明の一つの様相は、コンピュータに、予測対象製品の複数種類の製造パラメータを用いて前記予測対象製品の複数種類の品質パラメータを予測させる予測プログラムであって、前記複数種類の品質パラメータの中から少なくとも2種類の品質パラメータを含んだ抽出パラメータ群を抽出する機能と、前記抽出パラメータ群の各品質パラメータから前記抽出パラメータ群の各品質パラメータの間の関係性を反映した少なくとも第1合成変数と第2合成変数を含む合成変数群を算出する機能と、過去に製造された過去製品の複数種類の製造パラメータと当該過去製品の第1合成変数のデータセットを用いた教師あり学習によって生成される第1学習モデルと、前記過去製品の複数種類の製造パラメータと前記過去製品の第2合成変数のデータセットを用いた教師あり学習によって生成される第2学習モデルと、を含む学習モデル群を生成する機能と、前記学習モデル群を用いて前記予測対象製品の複数種類の製造パラメータから合成変数群を予測する機能と、予測した前記合成変数群を前記抽出パラメータ群の各品質パラメータに変換する機能を備える、予測プログラムである。
【0018】
本様相によれば、従来に比べて、高精度の学習モデルを生成でき、当該学習モデルを用いて複数の製造パラメータから複数の品質パラメータを予測できる。
【発明の効果】
【0019】
本発明の品質予測システム及び予測プログラムによれば、従来に比べて、高精度の学習モデルを生成でき、当該学習モデルを用いて複数の製造パラメータから複数の品質パラメータを予測できる。
【図面の簡単な説明】
【0020】
【
図1】本発明の第1実施形態の品質予測システムを模式的に示したブロック図である。
【
図2】
図1の品質予測システムにおける訓練工程を模式的に示したブロック図である。
【
図3】
図2の合成関数の説明図であり、(a)は主成分分析における各合成変数の説明図であり、(b)は主成分分析に用いる品質パラメータの説明図である。
【
図4】
図1の品質予測システムにおけるテスト工程及び予測工程を模式的に示したブロック図である。
【
図5】実験例1~3に用いた全てのデータセット内の説明変数のすべての組み合わせの相関の分布をまとめたボックスプロットで示したグラフである。
【
図6】各データセットの目的変数間の相関係数の中央値とゲインの関係を表すグラフであり、(a)は、実験例3をベースラインとした実験例1のゲインを表し、(b)は、実験例2をベースラインとした実験例1のゲインを表す。
【発明を実施するための形態】
【0021】
以下、本発明の実施形態について詳細に説明する。
【0022】
本発明の第1実施形態の品質予測システム1は、予測プログラムによって、マルチターゲット回帰(Multi-Target Regression)により、予測対象となる製品(以下、予測対象製品ともいう)に関する複数種類の製造パラメータX1~Xn(説明変数)から、予測対象製品の複数種類の品質パラメータY1~Ym(目的変数)を同時に予測するものである。
【0023】
品質予測システム1は、ハードウェア構成として、各装置を制御する制御装置とデータに対する演算を行う演算装置で構成される中央処理装置と、データを記憶する記憶装置、外部からデータを入力する入力装置、外部にデータを出力する出力装置を備えたコンピュータである。
品質予測システム1は、
図1のように、データ蓄積部2と、パラメータ抽出部3と、製品抽出部5と、第1変数変換部6と、学習モデル生成部7と、予測部8と、第2変数変換部10を備えている。
【0024】
(データ蓄積部2)
データ蓄積部2は、予測プログラムが格納され、過去に製造された製品(以下、単に過去製品ともいう)において製造に使用した各製造パラメータX1~Xnと、当該過去製品の各品質パラメータY1~Ymのデータセットを蓄積する部位である。
また、データ蓄積部2は、予測プログラムによって生成された学習モデルS1~Srや予測結果等のデータを蓄積可能となっている。
データ蓄積部2に蓄積された各製品には、
図3(b)のように、ロット番号が割り当てられており、各製品の製造パラメータX1~Xn及び品質パラメータY1~Ymがロット番号で紐づけられている。
【0025】
(パラメータ抽出部3)
パラメータ抽出部3は、データ蓄積部2に蓄積された製品の品質パラメータY1~Ym中からq種類の品質パラメータを含んだ抽出パラメータ群T1~Tr/kを抽出する部位である。
パラメータ抽出部3による品質パラメータの抽出種類数qは、2以上であり、5以下であることが好ましく、2又は3であることがより好ましい。
本実施形態のパラメータ抽出部3は、過去製品の品質パラメータY1~Ym中から無作為に2種類(q=2)の品質パラメータで構成される抽出パラメータ群T1~Tr/kを抽出可能となっている。
また、kは、第1変数変換部6によって1つの抽出パラメータ群Tiから変換する合成変数の個数であり、本実施形態では2となっている。
【0026】
(製品抽出部5)
製品抽出部5は、過去製品の中から所定数uの過去製品を抽出する部位である。
製品抽出部5が抽出する過去製品数uは、後述する主成分分析において良好に分析する観点から、30個以上であることが好ましく、100個以上であることがより好ましい。
製品抽出部5が抽出する過去製品数uは、全製品の50%以上の個数であることが好ましく、70%以上の個数であることが好ましい。
製品抽出部5が抽出する過去製品数uは、全製品の95%以下の個数であることが好ましく、90%以下の個数であることが好ましい。
【0027】
(第1変数変換部6)
第1変数変換部6は、パラメータ抽出部3が抽出した抽出パラメータ群T1~Tr/kから抽出パラメータ群T1~Tr/kを構成する各種の品質パラメータの間の関係性を反映した複数の合成変数Z1~Zrを含む合成変数群Zを算出する部位である。
本実施形態の第1変数変換部6は、抽出パラメータ群Tiにおける各種の品質パラメータから対応する合成関数によって、抽出パラメータ群Tiを構成する各種の品質パラメータの間の関係性を反映した第1合成変数Z2i-1と第2合成変数Z2iを少なくとも含む合成変数群Zを算出可能となっている(iは、r以下の自然数である)。
【0028】
(学習モデル生成部7)
学習モデル生成部7は、過去製品の製造パラメータX1~Xnと過去製品の第1合成変数Z
2i-1のデータセットを用いた教師あり学習によって生成される第1学習モデルS
2i-1と、過去製品の製造パラメータX1~Xnと過去製品の第2合成変数Z
2iのデータセットを用いた教師あり学習によって生成される第2学習モデルS
2iと、を含む学習モデル群Sを生成する部位である。
学習モデル生成部7は、例えば、
図2のように、第1学習モデルS1を用いて算出した第1合成変数Zs1と抽出パラメータ群T
1の各種の品質パラメータY2,Y4から算出した第1合成変数Z1との誤差関数が0又は0に近づくように第1学習モデルS1を生成する。
また、学習モデル生成部7は、例えば、第2学習モデルS2を用いて算出した第2合成変数Zs2と抽出パラメータ群T
1の各種の品質パラメータY2,Y4から算出した第2合成変数Z2との誤差関数が0又は0に近づくように第2学習モデルS2を生成する。
【0029】
(予測部8)
予測部8は、
図4のように、学習モデル生成部7が生成した学習モデル群Sを用いて予測対象製品の製造パラメータX1~Xnから合成変数群Zsを予測する部位である。
【0030】
(第2変数変換部10)
第2変数変換部10は、予測部8が予測した合成変数群Zsを各種の品質パラメータY1~Ymに変換する部位である。
第2変数変換部10は、第1変数変換部6で用いた合成関数の逆関数によって、合成変数群Zsを予測対象製品の各種の品質パラメータY1~Ymに変換可能となっている。
【0031】
(製造パラメータX1~Xn)
製造パラメータX1~Xnは、製品の製造時に設定されるパラメータであり、原料や材料、仕掛品に関するパラメータである。
製造パラメータX1~Xnは、例えば、製品が弾性シーラント材の場合、各材料ポリマーと、フィラーや安定剤などの副材料の混合比率、材料ポリマー等の反応基の種類、粘度、分子量などが含まれる。
【0032】
(品質パラメータY1~Ym)
品質パラメータY1~Ymは、製品の品質に関するパラメータであり、製品の物性や特性に関するパラメータである。
品質パラメータY1~Ymは、例えば、製品が弾性シーラント材の場合、モジュラス50(M50)やモジュラス100(M100)、引張強度(Tb)、破断伸び(Rb)などが含まれる。
本実施形態の品質パラメータY1~Ymの中には、トレードオフの関係にある品質パラメータが含まれている。
【0033】
本実施形態の品質予測システム1を用いて予測プログラムによって実行される品質予測方法について説明する。
【0034】
品質予測システム1の品質予測方法は、主に学習工程と、予測工程によって構成されている。
【0035】
(学習工程)
学習工程は、準備工程と、訓練工程と、テスト工程から構成されている。
準備工程では、過去製品の各製造パラメータX1~Xnと各品質パラメータY1~Ymのデータセットを少なくとも訓練工程で使用される訓練データセットと、テスト工程で使用されるテストデータセットに分割する。
訓練データセットとテストデータセットの比率は、特に限定されるものではないが、テストデータセットに比べて訓練データセットが多いことが好ましい。
【0036】
訓練工程では、パラメータ抽出部3によって訓練データセットの各種類の品質パラメータY1~Ymからq種類の品質パラメータを(r/k)回無作為に抽出し、(r/k)個の抽出パラメータ群T1~Tr/kに分ける。
第1変数変換部6が各抽出パラメータ群T1~Tr/kの各種の品質パラメータから合成関数によってk個の合成変数Zs1~Zsrを生成し、学習モデル生成部7が訓練データセットの各種の製造パラメータX1~Xnと各合成変数Zs1~Zsrのデータセットを用いて、教師あり学習により、訓練データセットの各種の製造パラメータX1~Xnから各合成変数Zs1~Zsrを予測する学習モデルS1~Srをそれぞれ生成する。
【0037】
ここで、本実施形態の訓練工程では、qが2に設定され、kが2に設定されている。
例えば、
図2の抽出パラメータ群T
1の場合、抽出パラメータ群T
1の各種の品質パラメータY2,Y4から合成関数によって2個の合成変数Z1,Z2を生成し、訓練データセットの各種の製造パラメータX1~Xnと各合成変数Z1,Z2のデータセットを用いて、教師あり学習により、訓練データセットの各種の製造パラメータX1~Xnから各合成変数Zs1,Zs2を予測する学習モデルS1,S2を生成する。
【0038】
パラメータ抽出部3による抽出パラメータ群T1~Tr/kの抽出回数r/kは、全品質パラメータY1~Ymのそれぞれが抽出パラメータ群T1~Tr/kのいずれかに属するのに十分な回数であり、予測対象となる品質パラメータY1~Ymの種類数mにより適宜設定される。
パラメータ抽出部3による抽出パラメータ群T1~Tr/kの抽出回数r/kは、m/2よりも多く、200回以上であることが好ましく、250回以上であることが好ましい。
【0039】
この訓練工程で使用される合成関数は、抽出パラメータ群T
1~T
r/kの各種の品質パラメータから合成変数Z1~Zrを算出でき、かつ合成変数から元の品質パラメータへ戻す逆合成関数をもつものであれば、特に限定されるものではない。合成関数は、主成分分析や、オートエンコーダなどが使用できる。
オートエンコーダとしては、積層オートエンコーダ(Stacked Autoencoder)、変分オートエンコーダ(Variational Autoencoder)、畳み込みオートエンコーダ(Convolutional Autoencoder)などが使用できる。
本実施形態の合成関数は、主成分分析を使用しており、第1主成分を第1合成変数Z
2i-1とし、第2主成分を第2合成変数Z
2iとしている。
すなわち、第1変数変換部6は、抽出パラメータ群T
iにおいて、抽出パラメータ群T
iを構成する各種の品質パラメータYα,Yβを用いて合成関数たる主成分分析を行い、主成分分析における第1主成分である第1合成変数Z
2i-1と、主成分分析における第2主成分である第2合成変数Z
2iをそれぞれ算出する(α、βは、ともに自然数である)。
具体的には、第1変数変換部6は、
図3(a)のように、XY平面上に訓練データセットの品質パラメータYαと品質パラメータYβを平均が0、標準偏差が1になるように正規化して分布し、射影したデータの分散が最大になる第1主成分軸A1と、第1主成分軸A1と直交しかつ射影したデータの分散が最大となる第2主成分軸A2を算出する。そして、第1主成分軸A1に射影した第1主成分軸A1における座標を第1合成変数Z
2i-1とし、第2主成分軸A2に射影した第2主成分軸A2における座標を第2合成変数Z
2iとする。
【0040】
また、本実施形態では、データの多様性の観点から、ブーストトラップサンプリング(bootstrap sampling)によって、合成変数Z
2i-1,Z
2iの生成に使用する抽出パラメータ群T
iの各種の品質パラメータを選別している。
すなわち、本実施形態では、合成変数Z
2i-1,Z
2iの生成に使用する抽出パラメータ群T
iの各種の品質パラメータを、過去製品の抽出パラメータ群T
iを構成する各種の品質パラメータを全て使用するのではなく、製品抽出部5が過去製品の中からp個の過去製品を無作為に抽出し、当該抽出したp個の過去製品の各種の品質パラメータをXY平面上にプロットして合成変数Z
2i-1,Z
2iの生成に使用している。
例えば、
図3(b)の太線のように製品抽出部5が過去製品P1~Ppの中から過去製品P1,P2,P4を抽出したとき、抽出パラメータ群T1の場合、抽出パラメータ群T1各種の品質パラメータY2,Y4として、XY平面上に(B21,B41)、(B22,B42)、(B24,B44)を分布して主成分分析を行うことになる。
そのため、各抽出パラメータ群T
1~T
r/kを構成する品質パラメータの種類の組み合わせが同じものであっても、主成分分析によって求められる合成変数Z
2i-1(Z
2i)の値が異なるものになり、合成変数Z
2i-1(Z
2i)に多様性が得られる。
【0041】
この訓練工程における学習モデルS1~Srは、一又は複数の説明変数から一つの目的変数を算出する単一ターゲット回帰(single-target regression)のアルゴリズムを使用して構築される回帰モデルである。
単一ターゲット回帰(single-target regression)としては、例えば、線形回帰(Linear Regression)、ロジスティック回帰(Logistic Regression)、ランダムフォレスト(Random Forest)、ブースティング(Boosting)、サポートベクターマシン(Support Vector Machine)、ニューラルネットワーク(Neural Network)などが採用できる。
本実施形態では、単一ターゲット回帰として、アンサンブル学習の一つである勾配ブースティング(Gradient Boosting)を使用している。
【0042】
テスト工程では、
図4のように、予測部8が各学習モデルS1~Srを用いてテストデータセットの製造パラメータX1~Xnから合成変数Zs1~Zsrを算出し、合成変数Zs1~Zsrで構成される合成変数ベクトル、すなわち、1行r列の行列を生成する。
別途、各合成変数Zs1~Zsrに対応する各主成分軸の主成分係数w(重み)で構成されるm行r列の係数行列Cを生成する。
係数行列Cは、例えば、第1列では、
図4のように、抽出パラメータ群T1を構成する品質パラメータY2,Y4から合成変数Z1に変換する際に使用した第1主成分軸A1の主成分係数(w
1,2,w
1,4)を2行目と4行目とし、残りを0とする。
また、係数行列Cは、第2列では、抽出パラメータ群T2を構成する品質パラメータY2,Y4から合成変数Z2に変換する際に使用した第2主成分軸A2の主成分係数(w
2,2,w
2,4)を2行目と4行目とし、残りを0とする。
すなわち、係数行列Cは、第(2i-1)列では、抽出パラメータ群T
iを構成する品質パラメータYα,Yβから合成変数Z
2i-1に変換する際に使用した第1主成分軸A1の主成分係数(w
2i-1,α,w
2i-1,β)をα行目とβ行目とし、残りを0とする。
また、係数行列Cは、第(2i)列では、抽出パラメータ群T
iを構成する品質パラメータYα,Yβから合成変数Z
2iに変換する際に使用した第2主成分軸L2の主成分係数(w
2i,α,w
2i-1,β)をα行目とβ行目とし、残りを0とする。
【0043】
第2変数変換部10が各学習モデルS1~Srから算出した合成変数Zs1~Zsrで構成される行列に対して係数行列Cの逆行列を掛けて各種の品質パラメータY1~Ymの予測値を算出する。すなわち、各合成変数Zs1~Zsrに対して対応する合成関数の逆関数を用いて各種の品質パラメータY1~Ymの予測値を算出する。
【0044】
そして、品質パラメータY1~Ymの予測値と品質パラメータY1~Ymの実測値を比較して精度を算出する。
品質パラメータY1~Ymの予測値が所定以上の精度を持つ場合には、学習工程を終了し、予測工程に移行し、所定以上の精度を持たない場合には、再度訓練工程を行う。
【0045】
(予測工程)
予測工程は、テスト工程と同様、予測部8が予測対象製品の各種の製造パラメータX1~Xnから各学習モデルS1~Srを用いて各合成変数Zs1~Zsrを生成する。そして、第2変数変換部10が各合成変数Zs1~Zsrで構成される1行r列の行列(合成変数ベクトル)と、係数行列Cの逆行列との積によって品質パラメータY1~Ymの予測値を同時に算出する。
【0046】
本実施形態の品質予測システム1によれば、1つの抽出パラメータ群Tiから抽出パラメータ群Tiの各種の品質パラメータYα,Yβの間の関係性を反映した複数の合成変数Z2i-1,Z2iに変換できるので、高精度の学習モデルを生成できる。
本実施形態の品質予測システム1によれば、予測対象製品の各種の製造パラメータX1~Xnから合成変数群Zを構成する各合成変数Zs1~Zsrをそれぞれ予測し、予測した各合成変数Zs1~Zsrから予測対象製品の各品質パラメータY1~Ymを予測するので、従来のマルチターゲット回帰によって予測対象製品の各種の製造パラメータX1~Xnから直接予測対象製品の各種の品質パラメータY1~Ymを予測する場合に比べて精度良く品質パラメータY1~Ymを予測することができる。
【0047】
本実施形態の品質予測システム1によれば、第1変数変換部6が抽出パラメータ群Tiにおける各品質パラメータYα,Yβを合成関数によって各合成変数Z2i-1,Z2iを算出し、第2変数変換部10が、合成関数の逆関数によって、各合成変数Z2i-1,Z2iを抽出パラメータ群T1の各品質パラメータYα,Yβに変換する。そのため、各品質パラメータYα,Yβ間の関係性が反映された品質パラメータYα,Yβを予測できる。
【0048】
本実施形態の品質予測システム1によれば、第2変数変換部10が、第1変数変換部6が行った主成分分析における第1主成分係数(w2i-1,α,w2i-1,β)と第2主成分係数(w2i,α,w2i-1,β)を用いて、第1合成変数Z2i-1及び第2合成変数Z2iを抽出パラメータ群Tiの各品質パラメータYα,Yβに変換する。そのため、より各品質パラメータYα,Yβ間の関係性が反映された品質パラメータYα,Yβを予測できる。
【0049】
本実施形態の品質予測システム1によれば、抽出パラメータ群T1~Tr/kは、パラメータ抽出部3によって複数種類の品質パラメータY1~Ymの中から無作為に抽出された品質パラメータで構成される。そのため、学習モデルS1~Srに多様性を持たせることができる。
【0050】
本実施形態の品質予測システム1によれば、パラメータ抽出部3は、複数種類の抽出パラメータ群T1~Tr/kを抽出し、かつ品質パラメータY1~Ymのそれぞれが複数種類の抽出パラメータ群T1~Tr/kのいずれかに属するように抽出する。そのため、予測対象の全品質パラメータY1~Ymが必ず合成変数Z1~Zrのいずれかに変換されるので、品質パラメータY1~Ymの予測精度をより向上できる。
【0051】
本実施形態の品質予測システム1によれば、第1変数変換部6は、製品抽出部5が無作為に抽出した過去製品の抽出パラメータ群T1~Tr/kの各種の品質パラメータから、抽出パラメータ群T1~Tr/kの各種の品質パラメータの間の関係性を反映した合成変数群Zsを生成するので、抽出パラメータ群T1~Tr/k間で品質パラメータの組み合わせが重複しても、異なる合成変数Z2i-1(Z2i)に変換でき、機械学習に多様性を持たせることができる。
【0052】
本実施形態の品質予測システム1によれば、複数の学習モデルS1~Srによって予測された合成変数Zs1~Zsrで構成される合成変数群Zsの行列と、合成変数Zs1~Zsrに対応する各主成分係数で構成される係数行列Cの逆行列との内積により、品質パラメータY1~Ymを予測するので、アンサンブル効果が期待でき、予測精度をより向上できる。
【0053】
上記した実施形態では、第1変数変換部6は、抽出パラメータ群Tiを構成する各種の品質パラメータから、第1合成変数Z2i-1と第2合成変数Z2iをそれぞれ同時に算出したが、本発明はこれに限定されるものではない。第1変数変換部6は、抽出パラメータ群Tiを構成する各種の品質パラメータから、第1合成変数Z2i-1と第2合成変数Z2iをそれぞれ個別に算出してもよい。
【0054】
上記した実施形態では、抽出パラメータ群から変換する合成変数の個数kが2であったが、本発明はこれに限定されるものではない。抽出パラメータ群から変換する合成変数の個数kは3以上であってもよい。抽出パラメータ群から変換する合成変数の個数kはq未満であり、5以下であることが好ましい。
【0055】
上記した実施形態では、パラメータ抽出部3は、過去製品の品質パラメータY1~Ym中から無作為にq種類の品質パラメータを抽出していたが、本発明はこれに限定されるものではない。パラメータ抽出部3は、過去製品の品質パラメータY1~Ym中から作為的にq種類の品質パラメータを抽出してもよい。
【0056】
上記した実施形態では、各抽出パラメータ群T1~Tr/kは、2種類の品質パラメータで構成されていたが、本発明はこれに限定されるものではない。各抽出パラメータ群T1~Tr/kは、3種類以上の品質パラメータで構成されていてもよい。
【0057】
上記した実施形態では、各抽出パラメータ群T1~Tr/kに属する品質パラメータの種類数はいずれも同数であったが、本発明はこれに限定されるものではない。各抽出パラメータ群T1~Tr/kに属する品質パラメータの種類数は異なっていてもよい。
【0058】
上記した実施形態では、各学習モデルS1~Srをいずれも勾配ブースティングによって生成していたが、本発明はこれに限定されるものではない。各学習モデルS1~Srを異なるアルゴリズムによって生成してもよい。例えば、学習モデルS1を勾配ブースティングで生成し、学習モデルS2を他の単一ターゲット回帰によって生成してもよい。
【0059】
上記した実施形態では、合成関数として主成分分析を使用していたが、本発明はこれに限定されるものではない。合成関数としてオートエンコーダを使用してもよい。この場合、合成関数に多様性を持たせるために、ブーストトラップサンプリング以外にもハイパーパラメータを合成変数の生成ごとに変化させてもよい。また、この場合、テスト工程及び予測工程において、合成変数群Zsに訓練工程の順方向のオートエンコーダとは逆方向のオートエンコーダ、すなわち、オートエンコーダの逆関数を掛けることになる。
【0060】
上記した実施形態では、品質予測システム1は、1台のコンピュータによって構成されていたが、本発明はこれに限定されるものではない。複数台のコンピュータで構成されていてもよい。このとき、品質予測システム1を構成するコンピュータ間は、無線又は有線で接続されていてもよいし、インターネットやイントラネット等のネットワークを介して接続されていてもよい。
【0061】
上記した実施形態は、本発明の技術的範囲に含まれる限り、各実施形態間で各構成部材を自由に置換や付加できる。
【実施例0062】
以下、実施例により本発明を具体的に説明する。なお、本発明は、以下の実施例に限定されるものではなく、その要旨を変更しない範囲で適宜変更して実施できる。
【0063】
(データセット)
説明変数と目的変数のデータセットとして、非特許文献1(Tsoumakas, G., Spyromitros-Xioufis, E., Vrekou, A., Vlahavas, I., 2014.)に倣って表1及び
図5のデータセットを使用した。
【0064】
【0065】
(実験例1)
抽出パラメータ群として目的変数の中からランダムに2種類の目的変数を抽出し、データセットの中からブーストトラップサンプリングによって複数のデータセットを無作為に抽出し、抽出したデータセットを用いて2種類の目的変数に対して合成関数たる主成分分析を行い、第1主成分を第1合成変数、第2主成分を第2合成変数として算出した。
これを250回繰り返して500個の合成変数を作成した。
また、別途工程にて、各種の説明変数と500個の合成変数とのデータセットをそれぞれ用いて機械学習を行い、各種の説明変数から合成変数を予測する500個の学習モデルを生成した。
このとき、各学習モデルは、4つのターミナルノード、学習率0.1、及び反復数100回の条件で勾配ブースティングによって行った。なお、ハイパーパラメータ等の設定は、非特許文献1と同様にした。
そして、各種の説明変数から各学習モデルを用いて合成変数をそれぞれ予測して合成変数の行列を作成するとともに、各合成変数に対応する各主成分係数を用いて係数行列を作成し、合成変数の行列と係数行列の逆行列の積によって各種の目的変数を予測する予想モデルを生成し、これを実験例1とした。
【0066】
(実験例2)
非特許文献1に準じて予測モデルを作成した。
具体的には、目的変数の中からランダムに2種類の目的変数を抽出し、抽出した2種類の目的変数に対してランダム線形ターゲット結合(Random Linear Target Combinations)を行ってランダムに設定された重みにより、一つの合成変数を算出した。
これを500回繰り返して500個の合成変数を算出した。
また、各種の説明変数と500個の合成変数とのデータセットをそれぞれ用いて機械学習を行い、各種の説明変数から合成変数を予測する500個の学習モデルを生成した。
そして、各種の説明変数から各学習モデルを用いて合成変数を予測して合成変数の行列を作成するとともに、各合成変数に対応するランダム線形ターゲット結合の際に設定された重みを用いて係数行列を作成し、合成変数の行列と係数行列の逆行列の積によって各種の目的変数を予測する予測モデルを生成し、これを実験例2とした。
【0067】
(実験例3)
各種の説明変数と各種の目的変数のデータセットから直接勾配ブースティングによって予測モデルを生成した。当該予測モデルは、4つのターミナルノード、学習率0.1、及び反復数100回の条件で生成した。これを実験例3とした。
【0068】
(予測精度評価)
下記の数式(1)に示される平均相対二乗平均平方根誤差(aRRMSE)を用いて予測精度を評価した。
すなわち、平均相対二乗平均平方根誤差(aRRMSE)は、各目的変数の相対二乗平均平方根誤差(RRMSE)の値の平均値であり、相対二乗平均平方根誤差(RRMSE)は、訓練データセット内のその目的変数の平均値を、特定の目的変数を予測する二乗平均平方根誤差(RMSE)で割ることで算出する。
【0069】
【0070】
aRRMSEは、ホールドアウト検証又は5分割交差検証を使用して評価した。
表1のExampleの項目においてスラッシュで区切られたデータセット(サンプル10、11)は、ホールドアウト検証によって評価した。
表1のスラッシュの左側が訓練データセットであり、右側がテストデータセットである。
表1のExampleの項目においてスラッシュで区切られていない残りのデータセットは、5分割交差検証によって評価した。
【0071】
改善率を示す評価指数であるゲイン値を以下の数式(2)で算出した。
【0072】
【0073】
数式(2)において、ゲイン値が1より大きい場合、モデルはベースラインモデルよりも改善されており、ゲイン値が高いほど予測精度が優れていることを示している。
【0074】
実験例1~3の評価結果を
図5及び表2,表3に示す。
【0075】
【0076】
なお、表2において、コロンの左側は予測精度が優れた数を表し、コロンの右側は予測精度が劣った数である。
【0077】
【0078】
実験例2は、表2のように、12データセットのうち10データセットで予測精度が実験例3を上回り、2データセットで実験例3を下回ったのに対して、実験例1は、予測精度が12データセット全てで実験例3を上回った。
また、実験例1は、実験例2に比較しても、12データセットのうち10データセットで予測精度が上回った。
【0079】
また、ゲイン(実験例3,実験例1)及びゲイン(実験例2,実験例1)は、表3及び
図5のように相関係数とともに単調に増加した。
実験例1は、
図6(a)のように、相関係数にかかわらず、実験例3よりも優れていた。
実験例1は、
図6(b)のように、相関係数が低いデータセットでは実験例2とほぼ同じように機能し、相関係数が高いデータセットでは実験例2よりも優れていた。
これは、実験例1において主成分分析によって目的変数間の関係が学習モデルに反映されたためと考えられる。
【0080】
実験例1は、実験例3に比べて全てのデータセットでaRRMSEが平均3.16%改善した。
また、実験例1は、実験例2に比べて多くのデータセットでaRRMSEが平均2.0%改善し、最大11.3%改善した。
【0081】
以上のことから、目的変数から合成関数によって合成変数に変換させ、説明変数と合成変数のデータセットを用いて学習モデルを生成することで説明変数と目的変数のデータセットから学習モデルを生成する場合に比べて精度が向上することがわかった。
1つの抽出パラメータ群から抽出パラメータ群の各種の品質パラメータの間の関係性を反映した2つの合成変数に変換することで、学習に必要なデータセット数を半分にできるとともに予測精度を同等かそれ以上にできることがわかった。また、説明変数間で関係性が大きいほど、すなわち、相関係数が大きいほど、予測精度が向上することがわかった。
【0082】
(弾性シーラント材評価)
実験例1~実験例3において、弾性シーラント材を用いて予測精度の評価を行った。
具体的には、説明変数として、各材料ポリマーと、フィラーや安定剤などの副材料の混合比率、材料ポリマー等の反応基の種類、粘度、分子量などを含む534種類の製造パラメータを用い、目的変数として、モジュラス50(M50)やモジュラス100(M100)、引張強度(Tb)、破断伸び(Rb)の4つの品質パラメータを用い、5分割交差検証を用いて評価した。
各品質パラメータの相関係数は、表4の通りであり、予測精度評価の結果を表5、表6に示す。
【0083】
【0084】
【0085】
【0086】
なお、表5において、コロンの左側は予測精度が優れた数を表し、コロンの右側は予測精度が劣った数である。
【0087】
実験例1,2は、表5のように、4つ全ての品質パラメータで実験例3よりも予測精度が優れていた。
実験例1は、実験例2に比べて引張強度(Tb)以外の品質パラメータで予測精度が優れていた。
また、実験例1は、表6のように、実験例3に比べてaRRMSEが平均2.3%高く、実験例2に比べてaRRMSEが平均0.4%高かった。
【0088】
これらのことから、弾性シーラント材などの工業製品においても、同量のデータセットでもより高精度の学習モデルを生成でき、当該学習モデルを用いて複数の製造パラメータから複数の品質パラメータを予測できることがわかった。