IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社島津製作所の特許一覧 ▶ 住友ゴム工業株式会社の特許一覧

特許7419520分析データ管理システムにおける教師用データ生成方法
<>
  • 特許-分析データ管理システムにおける教師用データ生成方法 図1
  • 特許-分析データ管理システムにおける教師用データ生成方法 図2
  • 特許-分析データ管理システムにおける教師用データ生成方法 図3A
  • 特許-分析データ管理システムにおける教師用データ生成方法 図3B
  • 特許-分析データ管理システムにおける教師用データ生成方法 図4A
  • 特許-分析データ管理システムにおける教師用データ生成方法 図4B
  • 特許-分析データ管理システムにおける教師用データ生成方法 図4C
  • 特許-分析データ管理システムにおける教師用データ生成方法 図4D
  • 特許-分析データ管理システムにおける教師用データ生成方法 図5
  • 特許-分析データ管理システムにおける教師用データ生成方法 図6
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-01-12
(45)【発行日】2024-01-22
(54)【発明の名称】分析データ管理システムにおける教師用データ生成方法
(51)【国際特許分類】
   G06N 20/00 20190101AFI20240115BHJP
【FI】
G06N20/00 130
【請求項の数】 7
(21)【出願番号】P 2022524312
(86)(22)【出願日】2021-03-30
(86)【国際出願番号】 JP2021013665
(87)【国際公開番号】W WO2021235111
(87)【国際公開日】2021-11-25
【審査請求日】2022-09-12
(31)【優先権主張番号】P 2020088916
(32)【優先日】2020-05-21
(33)【優先権主張国・地域又は機関】JP
【国等の委託研究の成果に係る記載事項】(出願人による申告)2018年度、国立研究開発法人新エネルギー・産業技術総合開発機構「省エネ製品開発の加速化に向けた複合計測分析技術システム研究開発事業」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(73)【特許権者】
【識別番号】000183233
【氏名又は名称】住友ゴム工業株式会社
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】永井 詩織
(72)【発明者】
【氏名】川瀬 智裕
(72)【発明者】
【氏名】津田 智哉
(72)【発明者】
【氏名】山本 聡
(72)【発明者】
【氏名】山田 宏明
(72)【発明者】
【氏名】岸本 浩通
(72)【発明者】
【氏名】伊藤 和加奈
【審査官】佐藤 実
(56)【参考文献】
【文献】国際公開第2017/203601(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G06N 20/00
(57)【特許請求の範囲】
【請求項1】
1または複数種類のサンプルのそれぞれについて、サンプル識別タグと、後記カテゴリ(1)(2)(3)のうち少なくとも2種類のカテゴリに属するデータとを紐づけて格納したデータベースを構築する工程と、
カテゴリ(1):前記サンプルの作製方法に関する複数種類のデータ
カテゴリ(2):前記サンプルを1または複数種類の分析装置で分析した結果である複数種類の分析データ
カテゴリ(3):前記サンプルの特性を表す情報である複数種類の物性データ
前記データベースから教師あり学習における教師データとして使用するデータを選択する選択工程であって、
前記カテゴリの1から、1または複数のデータの種別を説明変数として選択する工程と、
前記カテゴリの他から、1または複数のデータの種別を目的変数として選択する工程とを備える当該選択工程と、
1または複数種類のサンプルのそれぞれについて、選択された前記説明変数に対応するデータを入力とし、選択された前記目的変数に対応するデータを正解出力とする教師データを生成する工程と、
を備える分析データ管理システムにおける教師用データ生成方法。
【請求項2】
前記カテゴリ(2)は、前記分析データより抽出した1または複数種類の特徴量データを含む請求項1に記載の教師用データ生成方法。
【請求項3】
前記生成された教師データに基づいて所定の機械学習または統計解析を行うことにより前記教師データに対応する学習済みモデルを生成する工程をさらに備える請求項1に記載の教師用データ生成方法。
【請求項4】
前記教師データをCSV(Comma-Separated Values)形式で出力する工程をさらに備える請求項1に記載の教師用データ生成方法。
【請求項5】
前記分析装置は、少なくともガスクロマトグラフ質量分析計、液体クロマトグラフ質量分析計、フーリエ変換赤外分光光度計、引張試験機のうち2種類を含み、
前記特徴量データは、クロマトグラムのピーク面積、スペクトルのピーク面積、ヤング率、引張強度、変形量、歪量、破断時間のうち少なくとも2種類を含む請求項2に記載の教師用データ生成方法。
【請求項6】
前記機械学習のアルゴリズムは、サポートベクタマシン(Support Vector Machine:SVM)である請求項3に記載の教師用データ生成方法。
【請求項7】
入力部と、
1または複数種類のサンプルのそれぞれについて、前記入力部により入力された、サンプル識別タグと、後記カテゴリ(1)(2)(3)のうち少なくとも2種類のカテゴリに属するデータとを紐づけて格納したデータベースを記憶する記憶部と、
カテゴリ(1):前記サンプルの作製方法に関する複数種類のデータ
カテゴリ(2):前記サンプルを1または複数種類の分析装置で分析した結果である複数種類の分析データ
カテゴリ(3):前記サンプルの特性を表す情報である複数種類の物性データ
前記データベースから教師あり学習における教師データとして使用するデータの選択を受け付ける操作部であって、
前記カテゴリの1から、1または複数のデータの種別を説明変数として選択する操作を受け付けるとともに、
前記カテゴリの他から、1または複数のデータの種別を目的変数として選択する操作を受け付ける当該操作部と、
1または複数種類のサンプルのそれぞれについて、選択された前記説明変数に対応するデータを入力とし、選択された前記目的変数に対応するデータを正解出力とする教師データを生成する教師データ生成部と、
を備える教師用データ生成システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、複数サンプルを分析・解析し、その結果を管理するとともに機械学習に使用する教師用データを生成する方法に関する。
【背景技術】
【0002】
ガスクロマトグラフ装置、液体クロマトグラフ装置、引張試験機、圧縮試験機などの分析装置は、専用のデータ解析ソフトウェア(解析ソフト)を備えており、分析結果や試験結果を解析ソフト上で解析することにより、統計解析、機械学習関連の解析に使用する特徴量を得ている。
【0003】
例えば特許文献1は、複数の部材から構成される構造複合体を破壊検査して得たパラメータと、非破壊的測定により得たパラメータとを相互に関連づけて統計的に解析することによって、対象とする構造複合体の複数の性能を推定し、これら複数の性能によって表わされる構造複合体の状態を推定する方法を開示している。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2018-036131号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
複数の分析装置より得た特徴量は、その種類が多岐に渡るため、特徴量をAI解析、統計解析などに利用するには、各分析装置で生成された特徴量のうち、サンプルごとに必要な特徴量を選択してまとめ直す必要があり、手間と時間を要するという問題がある。
【0006】
例えば、複数種類の特徴量についてSVM(Support Vector Machine)などの学習済みモデルを構築する場合、特徴量の種類を適切に選択することが、高精度で収束性の高いモデルを生成する上で重要となるが、分析装置ごとのデータベースから個々にデータを抽出して統計解析などを行う必要があり、多くの手間と労力を要するという問題がある。
【0007】
本発明は、上記の課題を解決するために、複数の分析装置より得たデータを管理するとともに、機械学習の際に使用する教師データの生成に要する時間や手間を短縮することができる分析データ管理システムにおける教師用データ生成方法を提供することを目的とする。
【課題を解決するための手段】
【0008】
本発明の例示的な分析データ管理システムにおける教師用データ生成方法は、まず、1または複数種類のサンプルのそれぞれについて、サンプル識別タグと、後記カテゴリ(1)(2)(3)のうち少なくとも2種類のカテゴリに属するデータとを紐づけて格納したデータベースを構築する。
【0009】
次に、前記データベースから教師あり学習における教師データとして使用するデータを選択する。この時、前記カテゴリの1から、1または複数のデータの種別を説明変数として選択する。さらに、前記カテゴリの他から、1または複数のデータの種別を目的変数として選択する。
【0010】
そして、選択された前記説明変数に対応するデータを入力とし、選択された前記目的変数に対応するデータを正解出力とする教師データを生成する。
【0011】
カテゴリ(1):前記サンプルの作製方法に関する複数種類のデータ
カテゴリ(2):前記サンプルを1または複数種類の分析装置で分析した結果である複数種類の分析データ
カテゴリ(3):前記サンプルの特性を表す情報である複数種類の物性データ
【発明の効果】
【0012】
本発明によれば、複数の分析装置による複数サンプルの分析データを単一のソフトウェア上で横断的に解析して、サンプルごとのデータ(作製方法に関するデータ、分析データ、物性データなど)をまとめて取得し管理するとともに、機械学習の際に必要となるデータだけを選択して教師データを生成できるので、教師データおよび学習済モデルの生成に要する時間や手間を大幅に短縮することができる。
【図面の簡単な説明】
【0013】
図1】教師用データ生成システムの構成の一例を示すブロック図である。
図2】教師用データ生成システムにおけるデータベースの構築手順を示すフローチャートである。
図3A】教師用データ生成システムにおける学習モデルの構築処理の一例を示すフローチャートである。
図3B】教師用データ生成システムにおける学習モデルの構築処理の一例を示すフローチャートである。
図4A】サンプルの作製方法に関する情報が入力された、データベースにおけるサンプルリストLsの構成例を示す図である。
図4B】物性データが入力された、データベースにおけるサンプルリストLsの構成例を示す図である。
図4C】分析データが入力された、データベースにおけるサンプルリストLsの構成例を示す図である。
図4D】特徴量が入力された、データベースにおけるサンプルリストLsの構成例を示す図である。
図5】特徴量選択画面の表示例を示す図である。
図6】教師データテーブルのプレビュー画面表示の例を示す図である。
【発明を実施するための形態】
【0014】
以下、添付図面を参照して、本発明の好適な実施形態について詳細に説明する。図1は、本発明の実施形態に係る教師用データを生成するシステム構成の一例を示すブロック図である。
【0015】
図1に示す教師用データ生成システム1は、分析対象(サンプル)に応じて設置した複数種類の分析装置3a…3nで取得された分析データをもとに生成された特徴量を、所定のデータ処理を実行して取得し、その特徴量に基づく機械学習を行って学習済みモデルを構築するデータ処理装置10を備える。
【0016】
データ処理装置10の制御部15は、装置全体の動作を制御するCPU(Central Processing Unit)からなり、ROM(Read Only Memory)などのメモリ21にあらかじめ記憶した所定のデータ処理プログラムなどを実行する。
≪データベースに情報を格納するための構成≫
データ処理装置10のデータベース11には、ユーザがデータベース操作ソフトウェア(フロントエンド)を介して、サンプルに関する情報を入力する。サンプルに関する情報とは、サンプルを識別するタグ(名前、ID,Lot.など)、およびサンプルの作製方法に関する情報(配合量、配合プロセスなど)である。
【0017】
データベース11には、分析装置3a…3nによって取得された分析データがサンプル識別タグと紐づけて格納される。分析データは、分析装置3a…3nの測定・解析用ソフトウェア(図示しない)を通じて、分析装置からデータベース11に格納されても良いし、ユーザがデータベース操作ソフトウェアを介して手動で入力しても良い。
【0018】
分析装置3a…3nでは、それぞれが専用のデータ解析ソフトウェア(解析ソフト)によって、入力された分析条件に基づきサンプルの分析を実行して、分析データを取得する。
【0019】
分析装置3a…3nとしては、例えば、液体クロマトグラフ装置(LC)、ガスクロマトグラフ装置(GC)、ガスクロマトグラフ質量分析計(GC-MS)、液体クロマトグラフ質量分析計(LC-MS)、熱分解ガスクロマトグラフ質量分析装置(Py―GC/MS)、液体クロマトグラフフォトダイオードアレイ検出器(LC-PDA)、液体クロマトグラフタンデム質量分析装置(LC/MS/MS)、ガスクロマトグラフタンデム質量分析装置(GC/MS/MS)、液体クロマトグラフイオントラップ飛行時間型質量分析計(LC/MS-IT-TOF)、近赤外分光装置、引張試験機、圧縮試験機、透過電子顕微鏡(TEM)、走査電子顕微鏡(SEM)、核磁気共鳴装置(NMR)、発光分光分析装置(AES)、原子吸光分析装置(AAS/FL-AAS)、プラズマ発光分析装置(ICP-AES)、プラズマ質量分析装置(ICP-MS)、蛍光X線分析装置(XRF)、有機元素分析装置、グロー放電質量分析装置(GDMS)、粒子組成分析装置、微量全窒素自動分析装置(TN)、高感度窒素炭素分析装置(NC)、フーリエ変換赤外分光光度計(FT-IR)、熱分析装置などがある。
【0020】
データベース11には、サンプルの物性データがサンプル識別タグと紐づけて格納される。物性データは、制御部15によって物性データ取得装置4a…4nから直接データベース11に格納されても良いし、ユーザがデータベース操作ソフトウェアを介して入力しても良い。
【0021】
サンプルの物性データとして、サンプルがタイヤの場合、例えば、組成(存在比、比重、膨張率)、フィラーの粒子径、フィラーの平均粒子間距離、誘電正接、耐摩耗性、引張強さ(T)、破断伸び(E)、引張応力(M)、スプリング硬さ(H)、損失係数(tanδ)などが挙げられる。特にこれらに限定されず、サンプルを評価する際に使用するものであれば何でもよい。ここで、損失係数とは、エネルギーの散逸の目安になる損失弾性率と系にそのままエネルギーが貯蔵される弾性率成分の比である。
【0022】
上記のようにサンプルがタイヤの場合、物性データ取得装置4a…4nは、引張試験機、圧縮試験機、粘弾性試験機、摩耗試験機などがある。
【0023】
データ処理装置10は、データベース11に格納された分析データに基づき特徴量を生成する特徴量抽出部13を有する。
【0024】
特徴量として、例えば、SEMやTEMによって取得される電子顕微鏡画像、GCMSやLCMSによって取得されるクロマトグラム、MSスペクトル、FT-IRやNMRから取得されるスペクトルなどの分析データやあるいは、それらの分析データや試験データから算出されるサンプルの組成、濃度、分子構造、分子数、分子式、分子量、重合度、粒子径、粒子面積、粒子数、粒子の分散度、ピーク強度、ピーク面積、ピークの傾き、化合物濃度、化合物量、吸光度、反射率、透過率、サンプルの試験強度、ヤング率、引張強度、変形量、歪量、破断時間、平均粒子間距離、誘電正接、伸び、スプリング硬さ、損失係数、ガラス転移温度、熱膨張率などがある。
【0025】
特徴量抽出部13によって生成された特徴量は、サンプル識別タグと紐づけてデータベース11に格納される。
【0026】
以上のように、データベース11内には、各サンプルについて、作製方法に関する情報、複数の異なる分析装置3a…3nによって取得された分析データ、当該分析データから抽出された複数種類の特徴量のデータ、複数種類の物性データが対応付けられて格納される。
≪教師データを生成するための構成≫
表示データ生成部25は、ユーザが操作部17を操作して入力した情報に応じて、サンプル識別タグと関連付けられた特徴量などのデータをデータベース11より選択して、表示部19上に表示可能な所定の表示形式の表示データを生成する。
【0027】
教師データ生成部27は、ユーザが操作部17を操作して入力した情報に応じて、データベース11に格納されたデータから教師データを生成する。
【0028】
例えば、「分析データまたは特徴量」のデータを入力とし、該特徴量と同様のサンプル識別タグに紐づけられた「物性」のデータを出力とする教師データを生成する。同様に、「サンプルの作製方法に関する情報(例えば、配合率)」のデータを入力とし、「物性」あるいは「分析データまたは特徴量」のデータを出力とする教師データを生成してもよい。また、「物性」のデータを入力として、「分析データまたは特徴量」あるいは「サンプルの作製方法に関する情報」のデータを出力としてもよい。さらに、「分析データまたは特徴量」のデータを入力とし、「サンプルの作製方法に関する情報」のデータを出力としてもよい。
【0029】
生成された教師データは、学習処理部29に入力される。教師データは、生成される度にデータベース11に格納されてもよい。これにより、教師データがデータベース11に蓄積される。
【0030】
教師データ生成部27は、教師データをデータベース11に格納する前に、教師データをデータベースに格納するか否かを確認するための確認画面を表示部19に表示する。教師データ生成部27は、ユーザにより教師データを格納する指示がその確認画面に対して行われたことに基づいて、教師データをデータベース11に格納する。そのような指示がない場合は、教師データ生成部27は、教師データを破棄する。
【0031】
これにより、学習処理部29は、複数の特徴量をまとめてAI(人工知能)解析、統計解析などに使用することができる。
【0032】
学習処理部29における機械学習の手法としては、特に限定されず、例えば、ニューラルネットワーク(Neural Network : NN)、サポートベクタマシン(Support Vector Machine: SVM)などの公知の機械学習が使用される。
≪その他の構成≫
操作部17は、例えば、キーボード、マウス、タッチパネルなどにより構成され、ユーザは操作部17を使用して、サンプルに関する情報の入力、データの表示、教師データ生成に用いるデータの選択などの各種操作を行う。表示部19は、例えば、液晶ディスプレイなどから構成されるモニタである。
【0033】
上述した制御部15、データベース11、特徴量抽出部13、表示データ生成部25、教師データ生成部27、学習処理部29などは、データバス8を介して相互に接続されている。
【0034】
なお、操作部17と表示部19に代えて、例えばデスクトップ型のパーソナルコンピュータ(PC)、ノート型PC、携帯端末(タブレット端末、スマートフォン)などの情報端末を制御部15に接続する構成としてもよい。
【0035】
次に、本実施形態に係る教師用データ生成システムにおけるデータベースの構築手順、特徴量の出力処理手順、学習モデルの構築手順などを、分析対象のサンプルとしてタイヤを具体例に説明する。
【0036】
最初に図2に示すフローチャートを参照し、本実施形態に係る教師用データ生成システムにおけるデータベースの構築手順を説明する。
【0037】
図2のステップS1において、ユーザは、図示しないデータベース操作ソフトウェア(フロントエンド)を介して、データベース11におけるサンプルリストLsに、測定対象サンプルであるタイヤCのサンプル名「タイヤC」、タイヤCの作製方法に関する情報(硫黄配合量「0.221」、シリカ配合量「0.589」、撹拌時間「10」)を入力する。
【0038】
ユーザの新規サンプルに関する情報入力に応じて、制御部15はサンプル識別タグであるサンプルID「A03」を付与する。
【0039】
サンプルリストとは、プロジェクトやサンプルの種類に応じて作成されるひとまとまりのデータセットで、その構成などは特に限定されない。上記のようにユーザからサンプルの作製方法に関する情報が入力された、データベース11におけるサンプルリストLsは、例えば、図4Aのように構成される。なお、図4Aは、サンプルID「A01」、「A02」の情報がすでに登録されている例を示している。
【0040】
図2のステップS3において、ユーザは、図示しないデータベース操作ソフトウェア(フロントエンド)を介して、データベース11に、タイヤCの物性データをサンプルID「A03」と紐づけて入力する。ここでは、試験機により測定したデータをもとに、引張強さ(T)「18.5」、破断伸び(E)「502」を入力する。さらに、計算によって求めた高温状態での損失係数(tanδ高温)「0.245」、低温状態での損失係数(tanδ低温)「0.812」を入力する。
【0041】
これらの物性データが入力された、データベース11におけるサンプルリストLsは、図4Bのように構成される。なお、物性データの入力タイミングは、ステップS3のタイミングに限定されず、他のタイミングで入力してもよい。
【0042】
また、ここでは、ユーザがデータベース操作ソフトウェアを介して物性データを入力する例について説明したが、それに限らない。物性データは、制御部15によって物性データ取得装置4a…4nから直接データベース11に格納されても良い。
【0043】
図2のステップS5において、タイヤCについて、例えば、熱分解ガスクロマトグラフ質量分析装置(Py-GC/MS)、核磁気共鳴装置(NMR)、走査電子顕微鏡(SEM)、透過電子顕微鏡(TEM)の4種類の分析装置で解析ソフトによる分析を行い、分析データを取得するため、ユーザは、Py-GC/MS,NMR,SEM,TEMに測定対象サンプルであるタイヤCの切片をセットするとともに、分析を開始する。なお、当該分析に係る条件設定や操作は、分析装置3a…3nの測定・解析用ソフトウェア(図示しない)を介して行われても良いし、制御部15を介して行われても良い。
【0044】
ステップS11において、分析開始の指示を受けた解析ソフトは、入力された分析条件に基づき、タイヤCについてそれぞれPy-GC/MS,NMR,SEM,TEMで分析を行う。Py-GC/MSでは、熱分解装置でタイヤ切片を微小粒子に分解後、ガスクロマトグラフ装置(GC)に備えられたカラムで分離し、分離された成分を質量分析装置(MS)で検出することによりマススペクトル、またはトータルイオンクロマトグラム(TIC)の波形データを取得する。また、NMRでは、サンプルに対して、共鳴周波数と同周波数のラジオ波を照射することで、NMRスペクトルを取得する。
【0045】
SEMは、電子源で発生させ、電子銃で加速された電子線を、集束レンズと対物レンズにより、試料上に電子スポットとして集束し、走査コイルにより、電子スポットを探針(プローブ)として試料上を移動させ電子線走査し、検出器にて試料の電子線照射点から発生した信号電子を検出し、信号電子の量を各点の明るさとして表示し、SEM画像を取得する。
【0046】
さらに、SEMは、電子線を入射することで、サンプルから発せられるX線を検出して、X線のエネルギースペクトルを取得することも可能である。
【0047】
TEMは、サンプルに電子線を照射することで、透過した電子線を検出し、その電子線の強度に基づきサンプル内の電子透過率の空間分布(TEM画像)を取得する。
【0048】
ここで、Py-GC/MSにより取得されるトータルイオンクロマトグラム、NMRにより取得されるNMRスペクトル、SEMにより取得されるエネルギースペクトルは、各波形データ中において最も強度の高い成分をベースピークとし、相対強度を100%となるように規格化してもよい。
【0049】
各分析装置によって取得された分析データファイルは、サンプルIDと紐づけてデータベース11に格納される。分析データが入力された、データベース11におけるサンプルリストLsは、図4Cのように構成される。
【0050】
なお、上記では測定を行う例について説明したが、それに限らない。ステップS11において、すでに測定されたデータをデータベース11あるいは分析装置から取り込んでもよい。
【0051】
ステップS13では、特徴量抽出部13が、データベース11から分析データを呼び出して特徴量を抽出し、データベース11に格納する。
【0052】
例えばタイヤCについて、Py-GC/MSより取得されたトータルイオンクロマトグラムを解析して、特徴量である所定の質量数に対するピークの面積値を算出する。また、NMRにより取得されたNMRスペクトルを解析して、特徴量である天然ゴム(NR)、ブタジエンゴム(SBR+BR)、これらのゴムの幾何異性体(Cis,Trans)の存在比を算出する。
【0053】
なお、図1に示す例では特徴量抽出部13がデータ処理装置10に含まれているが、これに限られない。特徴量抽出部は、各分析装置3a…3nが有していても良い。その場合、例えば、分析装置3a…3nの測定・解析用ソフトウェア(図示しない)が特徴量抽出部として機能する。
【0054】
また、ステップS13では、SEMより取得されたSEM画像を解析して、特徴量である、タイヤ中に存在するフィラー粒子の粒子径、および平均粒子径を算出する。さらに、TEMより取得されたTEM画像を解析して、タイヤ中に存在するフィラー粒子の粒子径を算出する。
【0055】
ここでは、タイヤに含有される各ゴムの存在比は、測定対象である各タイヤをNMRにより分析して得られたNMRスペクトルの波形データと、図示しない記憶部に記憶された、検量線データに基づいて算出される。
【0056】
検量線データは、既知の濃度の対象成分を含む試料をNMRで分析して得られたNMRスペクトルから算出される定量値と、存在比との関係を表す関係式である。
【0057】
本実施形態では、分析開始前に存在比が既知の天然ゴム(NR)、ブタジエンゴム(SBR+BR)、これらのゴムの幾何異性体(Cis,Trans)を含むサンプルを準備し、これらの試料をNMRで分析して得られたスペクトルから算出される定量値(ピークの面積値または強度値)を算出し、各ゴムの存在比と定量値との関係を示す検量線データを生成して、不図示の記憶部に記憶する。
【0058】
このような特徴量が入力された、データベース11におけるサンプルリストLsは、例えば、図4Dのように構成される。
【0059】
ステップS15において、上述したトータルイオンクロマトグラム、NMRスペクトル、SEM画像、TEM画像が取得されたか、そして、特徴量である各ゴムの存在比、各質量数に対するピークの面積値、SEM画像から取得される粒子径、平均粒子間距離、TEM画像から取得される粒子径の算出が終了したか否かを判断する。
【0060】
上記の実施形態では、一つのサンプル(タイヤC)についてデータを格納する例について説明したが、これに限らない。複数のサンプルについて、分析データや物性データを取得しても良い。
【0061】
図3Aおよび図3Bは、本実施形態に係る教師用データ生成システムにおける教師データテーブルTtの作成、および学習モデルの構築処理の一例を示すフローチャートである。
【0062】
図1に示す教師用データ生成システム1の表示部19には、教師データテーブルTtの作成に係るユーザインタフェース(UI)画面、処理結果などが表示される。教師用データ生成システム1のユーザは、教師データテーブルTtの作成開始を指示する場合、図3AのステップS20において操作部17を操作して、表示部19上のUI画面に表示された所望の教師用データ生成アプリケーションの開始指示アイコンを選択(クリック)する。
【0063】
上記の開始指示を受けた制御部15は、図3AのステップS21において、サンプル選択画面を表示する。サンプル選択画面は、ユーザが教師データの作成に使用するサンプルを選択する画面である。
【0064】
サンプル選択画面は、データベース11に格納された全てのサンプルについて、サンプル名と、サンプルの作製方法に関する情報などからなるリストによって構成されてもよい。
【0065】
または、データベース11に格納された複数のサンプルリストの名称をサンプル選択画面に表示してもよい。その場合、1のサンプルリスト(例えばLs)を選択したら、該サンプルリストに含まれるサンプル全て(タイヤA、タイヤB、タイヤC)が選択されるように構成されてもよい。
【0066】
さらにサンプル選択画面には、例えば個々のサンプル、またはサンプルリストに対応した選択用アイコンが表示される。ユーザは、操作部17を介して、その選択用アイコンにチェックを入れることで、任意のサンプルを選択可能となる。
【0067】
制御部15は、ステップS22において、ユーザによるサンプルの選択が完了したか否かを判断する。サンプル選択が完了した場合、制御部15は、ステップS23において、選択された行を抽出して選択サンプル抽出テーブルTsを生成する。選択サンプル抽出テーブルTsは、選択結果の確認のために、表示部19に表示するように構成してもよい。
【0068】
例として、ユーザがサンプルリストLs(すなわち、タイヤA~タイヤC)を選択した場合を説明する。この場合、選択サンプル抽出テーブルTsには、サンプルID「A01」「A02」「A03」が格納される。
【0069】
上記のサンプル選択が終了すると、制御部15は、ステップS24において、説明変数選択画面および目的変数選択画面を表示する。説明変数選択画面および目的変数選択画面は、それぞれ、ユーザが教師データの入力および出力に使用するデータの種別を選択する画面である。
【0070】
なお、教師用データ生成アプリケーションが、教師あり学習の説明変数として使用するカテゴリと目的変数として使用するカテゴリのセットごとに準備されていてもよい。この場合、教師用データ生成アプリケーションを選択する操作のみで、教師データの入力および出力に使用するデータの種別の選択が完了している。
【0071】
ここでは、特徴量のデータ(特許請求の範囲におけるカテゴリ(2))「天然ゴム(NR)の存在比」、「ブタジエンゴム(SBR+BR)の存在比」、「幾何異性体(Cis)の存在比」、「幾何異性体(Trans)の存在比」を入力とし、物性データ(特許請求の範囲におけるカテゴリ(3))「引張強さ(T)」を出力とする教師データ生成用のアプリケーションを選択した例について説明する。
【0072】
まず、説明変数選択画面(図5参照)において、ユーザが操作部17を操作して、表示部19に表示された特徴量リストから複数の特徴量のデータ種別を選択する(ステップS25)。説明変数選択画面には、特徴量リストLcが左の列に表示される。特徴量リストLcは、データベース11に格納された全データのうち、選択サンプル抽出テーブルTsのサンプルのみに絞り込まれたデータから、特徴量の種類の重複を除いて生成する。
【0073】
また、説明変数選択画面には、特徴量の種類に対応した選択用アイコンが表示される。ユーザは、操作部17を介して、その選択用アイコンにチェックを入れることで、特徴量リストLcの任意の特徴量を選択可能となる。
【0074】
本実施形態では、図5に示すように、特徴量リストLcには、特徴量の種類として、特定の質量数に対するピークの面積値、天然ゴム(NR)、ブタジエンゴム(SBR+BR)、これらのゴムの幾何異性体(Cis,Trans)の存在比、SEM画像より取得されたフィラーの粒子径と平均粒子間距離、TEM画像より取得されるフィラーの粒子径が含まれており、これらの特徴量の種類が特徴量選択画面に表示される。
【0075】
図5に示す例では、ユーザが操作部17により、特徴量選択画面で特徴量の種類である「天然ゴム(NR)の存在比」、「ブタジエンゴム(SBR+BR)の存在比」、「幾何異性体(Cis)の存在比」、「幾何異性体(Trans)の存在比」を選択したので、チェック欄にチェックマーク(レ)が入力されている。このようにして、選択された特徴量のデータ種別が、選択説明変数テーブルTcに格納される。
【0076】
続くステップS26においてユーザは、目的変数選択画面(不図示)から1または複数の目的変数(物性)を選択する。目的変数選択画面には、物性データとして、例えば、耐摩耗性、引張強さ(T)、破断伸び(E)、引張応力(M)、スプリング硬さ(H)、損失係数(tanδ)などが表示される。
【0077】
ここでは、物性の種類(物性リスト)に対応した選択用アイコンが目的変数選択画面に表示される。そのため、ユーザは、操作部17を介して、その選択用アイコンにチェックを入れることで、任意の物性を選択可能となる。このようにして、選択された物性データ種別が、選択目的変数テーブルTxに格納される。
【0078】
制御部15は、ステップS27において、ユーザによる説明変数(特徴量のデータ種別)と目的変数(物性のデータ種別)の選択が完了したか否かを判断する。選択が完了した場合、制御部15は、ステップS28において、データベース11から、選択サンプル抽出テーブルTsおよび選択説明変数テーブルTc、選択目的変数テーブルTxに合致するレコードを抽出して、教師データテーブルTtを生成する。そして、ステップS29において教師データテーブルTtをプレビュー画面に表示する。
【0079】
図6に示すようにプレビュー画面では、上記のステップS21、S23などで選択されたサンプル名(タイヤA~タイヤC)が表示部19上において垂直方向(行方向)に表示され、上記のステップS24~S27などで選択された説明変数(特徴量のデータ種別)および目的変数(物性のデータ種別)が画面の上段部に水平方向(列方向)に表示される。
【0080】
制御部15は、プレビュー画面を見たユーザがサンプルやデータ種別の追加あるいは修正が可能となるように、ステップS31において、ユーザによる追加・修正要求の有無を判断する。
【0081】
例えば、図6の例では、タイヤBの引張強さ(T)の情報がデータベース11に格納されていないことがわかる。そこで、ユーザは、タイヤBの引張強さ(T)のデータを入力する、あるいは、タイヤBを選択サンプルテーブルから除外するなどの修正をすることが考えられる。
【0082】
上記のように追加・修正要求があれば、ステップS33において追加・修正のための処理を実行する。制御部15は、修正内容に応じて、選択サンプル抽出テーブルTsまたは選択説明変数テーブルTc、選択目的変数テーブルTxに対して情報追加、削除を実行する。このようにして、ユーザは、後述する機械学習に使用するデータの選別をすることができる。
【0083】
制御部15は、ステップS35において、ユーザからの教師データテーブルTtの作成指示を待つ。例えば、操作部17を介して、UI画面に表示されたテーブル作成指示用のアイコンが選択(クリック)されると、ステップS37の処理に移行する。
【0084】
ステップS37では、再度データベース11から、選択サンプル抽出テーブルTsおよび選択説明変数テーブルTc、選択目的変数テーブルTxに合致するレコードを抽出して教師データテーブルTtを生成する。そして、ステップS39において、表示データ生成部25が、教師データテーブルTtをテーブル表示形式で表示部19上に表示する。
【0085】
制御部15は、図3BのステップS41において、ユーザにより、上述した表示データの出力形式の変更選択があるか否かを判断する。出力形式の変更とは、ステップS39で表示された各サンプルの特徴量を、例えば、CSV(Comma-Separated Values)形式、あるいは他のAIソフト、統計解析ソフトなどの関連ソフトで表示可能な形式に変更することを意味する。
【0086】
具体的には、ユーザが操作部17によって、UI画面に表示された出力形式の変更指示アイコンを選択(クリック)した場合、制御部15は、ステップS43において、出力形式を変更したデータを、データベース11内に格納するか、あるいは、不図示のインタフェース、例えばLAN、WANなどを介して外部装置と外部のソフトウェアに出力する。
【0087】
なお、本実施形態では、NMRから取得されたNMRスペクトルより生成される特徴量である、天然ゴム(NR)、ブタジエンゴム(SBR+BR)、これらのゴムの幾何異性体(Cis,Trans)の存在比を選択して教師データテーブルTtを作成したが、分析データである、NMRスペクトル、トータルイオンクロマトグラフ、SEMより取得されるSEM画像、TEMより取得されるTEM画像を特徴量選択画面に選択対象として表示してもよい。
【0088】
次に、図3BのステップS53において、教師データ生成部27により、表示データ生成部25で生成された教師データテーブルTtに基づき、教師データを生成する。教師データ生成部27は、ユーザにより説明変数として選択された天然ゴム(NR)、ブタジエンゴム(SBR+BR)、これらのゴムの幾何異性体(Cis,Trans)の存在比を入力とし、ユーザにより目的変数として選択された引張強さ(T)を出力とする教師データを生成する。
【0089】
ステップS55において、学習処理部29は、ステップ53で生成された教師データを学習モデルに適用して、機械学習、あるいは統計解析を実行する。以下において、学習手法の一例として、サポートベクターマシーン(SVM)を用いた場合を説明する。
【0090】
続くステップS57において、学習処理部29は、教師データに含まれる、特徴量である天然ゴム(NR)、ブタジエンゴム(SBR+BR)、これらのゴムの幾何異性体(Cis、Trans)の存在比をSVMに入力することで、そのSVMから得られるタイヤの引張強さ(T)と、教師データに含まれる教師データとしての引張強さ(T)とを比較する。
【0091】
そして、学習処理部29は、SVMから出力された引張強さ(T)が教師データとしての引張強さ(T)に近づくように、現在のSVM内の各種パラメータを更新し、学習済みモデルを作成する。
【0092】
なお、学習処理部29は、ユーザにより出力データとして、破断伸び(E)、引張応力(M)、スプリング硬さ(H)、高温状態での損失係数(tanδ高温)、低温状態での損失係数(tanδ低温)などが選択された場合も、上記の引張強さ(T)と同様の処理を行って、それぞれについての学習済みモデルを作成する。
【0093】
ステップS59では、教師データの条件に変更があるか否かを判断する。変更があれば、ステップS55,S57の処理を繰り返す。このように機械学習を繰り返すことで学習の精度が向上する。
【0094】
データベース11は、このような学習モデルを識別するための識別情報と、学習モデルの作成日時情報と、学習モデルの生成元の教師データを識別するための識別情報と、学習モデルによる識別対象を規定する識別対象情報(図示しない)などを含む。
【0095】
なお、上述した特徴量の種類の選択をコンピュータによる自動選択とし、その自動選択を、学習済みモデルの生成工程において、学習の集束度に基づいて動的に変更するようにしてもよい。
【0096】
以上説明したように本実施形態に係る教師用データ生成システム(分析データ管理システム)により、複数の分析装置による複数サンプルの分析データを単一のソフトウェア上で横断的に解析して、サンプルごとの特徴量をまとめて取得し管理することができる。同時に、機械学習に必要となる教師データのみを選択して、機械学習を行うことができるため、機械学習に必要となる時間や手間を大幅に短縮することができ、教師データの条件を変えて、複数の学習器を生成するのに要する時間や手間を大幅に短縮することができる。
【0097】
また、教師用データ生成システムにおいて単一のソフトウェア上で複数の特徴量の種類に対応する特徴量をサンプルごとにまとめることができ、それらの特徴量を教師データとする機械学習、統計解析に要する労力と時間を大幅に軽減することができる。
<変形例>
上記の実施形態に係る教師用データ生成システムにおいて、分析データは、分析装置3a…3nの測定・解析用ソフトウェア(図示しない)を通じて、分析装置からデータベース11に格納される構成としたが、これに限定されない。例えば、測定・解析用ソフトウェア(図示しない)を介さずに、制御部15によって分析装置から直接データベース11に格納されても良い。
【0098】
上記の実施形態に係る教師用データ生成システムにおいて、特徴量は、データ処理装置10における特徴量抽出部13によって、データベース11に格納された分析データに基づき生成される構成としたが、これに限定されない。例えば、データ処理装置10にユーザが入力してもよい。または、別のソフトウェア(分析装置3a…3nの測定・解析用ソフトウェアなど)で生成された特徴量をデータ処理装置10に読み込ませてもよい。
【0099】
上記の実施形態に係る教師用データ生成システムにおいて、ユーザはUI画面を介してサンプルの選択および特徴量の種類の選択ができる構成としたが、これに限定されない。例えば、サンプル、特徴量の種類に加えて、サンプルのデータ解析に関連する複数種類の分析装置を選択可能に構成してもよい。
【0100】
また、図3Aに示す処理において、ユーザがサンプルと説明変数および目的変数のデータ種別を選択する構成としたが、これに限定されない。例えば、ユーザに、データベース11に含まれる全データからなる特徴量リストLcが表示される特徴量選択画面上で特徴量の種類を選択させて、特徴量抽出テーブルに格納し、その特徴量抽出テーブルから、選択サンプル抽出テーブルTs、選択説明変数テーブルTc、選択目的変数テーブルTxに合致するレコードを抽出して、対応するサンプルとともに教師データテーブルTtを生成するようにしてもよい。
【0101】
また、予め、所望のデータの種別の組み合わせセットを作成しておくことも有用である。図3Aに示す処理において、ステップS21~23でサンプル選択を終了した後に、当該セットを選択する画面を表示する。そして、所望のセットに含まれるデータの種別の中から、教師データの入力および出力に使用するデータの種別を選択する。このように構成することで、データの種別が膨大な数存在する場合にも、容易に教師用データを生成することが可能になる。
【0102】
さらに例えば、ユーザにサンプルのみを選択させて、選択されたサンプルとそれに対応する全てのデータを、表形式で表示するようにしてもよい。
【0103】
一方、上記実施形態においてサンプルIDとそれに紐づくデータを2次元の表形式で表示しているが、表示形式はこれに限定されず、3次元表示としてもよい。
【0104】
例えば、ユーザにより選択された複数の特徴量の種類のうちの1つをx軸に、別の種類をy軸に、さらに別の種類をz軸にそれぞれ割り振るとともに、ユーザが選択したサンプルを、x,y,z軸で形成される3次元空間内において、x軸方向、y軸方向、z軸方向それぞれに各特徴量に応じて配置するようにしてもよい。
【0105】
こうすることで、3次元空間内でサンプルごとに一点のプロットができ、複数のサンプル相互における特徴量の種類と特徴量との関係を視覚的に認識しながら、より迅速かつ容易に把握可能となる。
【符号の説明】
【0106】
1 教師用データ生成システム、3a…3n 分析装置、4a…4n 物性データ取得装置、8 データバス、10 データ処理装置、11 データベース、13 特徴量抽出部、15 制御部、17 操作部、19 表示部、21 メモリ、25 表示データ生成部、27 教師データ生成部、29 学習処理部。
図1
図2
図3A
図3B
図4A
図4B
図4C
図4D
図5
図6