(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-12-05
(45)【発行日】2022-12-13
(54)【発明の名称】データ解析システム及びデータ解析方法
(51)【国際特許分類】
G01N 23/20 20180101AFI20221206BHJP
G06N 20/00 20190101ALI20221206BHJP
【FI】
G01N23/20
G06N20/00
(21)【出願番号】P 2019223756
(22)【出願日】2019-12-11
【審査請求日】2021-12-16
(73)【特許権者】
【識別番号】000003207
【氏名又は名称】トヨタ自動車株式会社
(74)【代理人】
【識別番号】100099759
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100092624
【氏名又は名称】鶴田 準一
(74)【代理人】
【識別番号】100147555
【氏名又は名称】伊藤 公一
(74)【代理人】
【識別番号】100123593
【氏名又は名称】関根 宣夫
(74)【代理人】
【識別番号】100133835
【氏名又は名称】河野 努
(74)【代理人】
【識別番号】100167461
【氏名又は名称】上木 亮平
(72)【発明者】
【氏名】矢野 正雄
(72)【発明者】
【氏名】庄司 哲也
【審査官】清水 靖記
(56)【参考文献】
【文献】国際公開第2018/025618(WO,A1)
【文献】国際公開第2018/207524(WO,A1)
【文献】国際公開第2019/060490(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 23/00 - G01N 23/2276
G06N 20/00 - G06N 20/20
G01D 18/00 - G01D 21/02
G08C 13/00 - G08C 25/04
H04Q 9/00 - H04Q 9/16
H03J 9/00 - H03J 9/06
(57)【特許請求の範囲】
【請求項1】
演算装置と、
前記演算装置に接続される記憶装置と、
前記演算装置に接続されて外部の端末と通信可能な通信部と、
を備えるデータ解析システムであって、
前記演算装置は、
前記通信部を介して受信した、材料を分析した計測データを取得する計測データ取得部と、
学習済みの機械学習モデルを用いて前記計測データを処理し、前記計測データの解析結果を出力するデータ解析部と、
前記計測データと、前記計測データ
の解析結果と、を含むデータセットを解析結果データセットとして前記記憶装置の解析結果データベースに格納する格納処理部と、
前記通信部を介して受信した、前記解析結果データセットに基づいて外部で行われた前記計測データの
解析結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得部と、
前記学習用データセットに基づいて、前記機械学習モデルを再学習させる学習部と、
を備えるデータ解析システム。
【請求項2】
前記演算装置は、
前記計測データの解析結果を、前記計測データの送信元となる外部の前記端末に送信する解析結果送信部をさらに備える、
請求項1に記載のデータ解析システム。
【請求項3】
前記データ解析部は、
前記計測データに基づいて、前記計測データの特徴量を抽出して出力するように予め学習された特徴量抽出処理部と、
前記計測データの特徴量に基づいて、特徴量に応じた前記計測データの解析結果を出力するように予め学習された特徴量解析処理部と、
を備える請求項1又は請求項2に記載のデータ解析システム。
【請求項4】
前記データ解析部は
前記計測データ取得部によって取得された前記計測データに対して信号雑音比を高めるための処理を施し、前処理済みの計測データを出力するように予め学習された前処理部をさらに備え、
前記前処理済みの計測データを、入力データとして前記特徴量抽出処理部に入力する、
請求項3に記載のデータ解析システム。
【請求項5】
前記格納処理部は、
前記解析結果データセットとして、前記計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、前記特徴量解析処理部から出力された前記計測データの解析結果と、を前記解析結果データベースに格納し、
前記学習用データセットには、前記特徴量抽出処理部及び前記特徴量解析処理部から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、前記計測データの
解析結果に対する評価結果として含まれており、
前記学習部は、
前記計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、前記特徴量抽出処理部を再学習させ、
前記計測データと、前記特徴量解析処理部から出力された前記計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、前記特徴量解析処理部を再学習させる、
請求項3に記載のデータ解析システム。
【請求項6】
前記格納処理部は、
前記解析結果データセットとして、前記計測データと、前記前処理部から出力された前処理済みの計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、前記特徴量解析処理部から出力された前記計測データの解析結果と、を前記解析結果データベースに格納し、
前記学習用データセットには、前記前処理部、前記特徴量抽出処理部及び前記特徴量解析処理部から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、前記計測データの
解析結果に対する評価結果として含まれており、
前記学習部は、
前記計測データと、前記前処理部から出力された前記前処理済みの計測データと、その前処理済みの計測データに対して付与された評価スコアと、に基づいて、前記前処理を再学習させ、
前記計測データと、前記特徴量抽出処理部から出力された前記計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、前記特徴量抽出処理部を再学習させ、
前記計測データと、前記特徴量解析処理部から出力された前記計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、前記特徴量解析処理部を再学習させる、
請求項4に記載のデータ解析システム。
【請求項7】
請求項1から請求項6までのいずれか1項に記載のデータ解析システムを備える材料情報取得システムであって、
外部の前記端末として、
前記データ解析システムを利用するユーザが前記計測データを前記データ解析システムに入力すると共に、前記計測データの解析結果を出力データとして受け取るための第1端末と、
前記解析結果データベースから前記解析結果データセットを取得すると共に、取得した前記解析結果データセットに基づいて行われた前記計測データの
解析結果に対する評価結果を含む前記学習用データセットを前記データ解析システムに入力するための第2端末と、
を備える材料情報取得システム。
【請求項8】
演算装置と、前記演算装置に接続される記憶装置と、前記演算装置に接続されて外部の端末と通信可能な通信部と、を備えるデータ解析システムによるデータ解析方法であって、
前記通信部を介して受信した、材料を分析した計測データを取得する計測データ取得工程と、
学習済みの機械学習モデルを用いて前記計測データを処理し、前記計測データの解析結果を出力するデータ解析工程と、
前記計測データと、前記計測データの
解析結果と、を含むデータセットを解析結果データセットとして前記記憶装置の解析結果データベースに格納する格納処理工程と、
前記通信部を介して受信した、前記解析結果データセットに基づいて外部で行われた前記計測データの
解析結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得工程と、
前記学習用データセットに基づいて、前記機械学習モデルを再学習させる学習工程と、
を備えるデータ解析方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明はデータ解析システム及びデータ解析方法に関する。
【背景技術】
【0002】
特許文献1には、従来の試料分析方法として、X線回折法での定量分析を行うにあたり、X線源のターゲットと同一材料からなる標準化試料を用いて回折X線の強度を較正するものが開示されている。
【先行技術文献】
【特許文献】
【0003】
【発明の概要】
【発明が解決しようとする課題】
【0004】
しかしながら、前述した従来の試料分析方法では、X線回折装置によって計測された材料(試料)の計測データを解析する段階で、人の解析者による判断が必要な部分があるため、解析結果が解析者の直感や経験等に依存して解析結果がばらつくおそれがあり、また解析者の解析結果に対する評価が行われないために解析精度を確保することができないおそれがある。
【0005】
本発明はこのような問題点に着目してなされたものであり、計測データの解析結果のばらつきを抑制しつつ、解析精度を向上させることを目的とする。
【課題を解決するための手段】
【0006】
上記課題を解決するために、本発明のある態様によるデータ解析システムは、演算装置と、演算装置に接続される記憶装置と、演算装置に接続されて外部の端末と通信可能な通信部と、を備える。演算装置は、通信部を介して受信した、材料を分析した計測データを取得する計測データ取得部と、学習済みの機械学習モデルを用いて計測データを処理し、計測データの解析結果を出力するデータ解析部と、計測データと、計測データを処理した処理結果と、を含むデータセットを解析結果データセットとして記憶装置の解析結果データベースに格納する格納処理部と、通信部を介して受信した、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得部と、学習用データセットに基づいて、機械学習モデルを再学習させる学習部と、を備える。
【0007】
また本発明のある態様によるデータ解析方法は、演算装置と、演算装置に接続される記憶装置と、演算装置に接続されて外部の端末と通信可能な通信部と、を備えるデータ解析システムによるデータ解析方法であって、通信部を介して受信した、材料を分析した計測データを取得する計測データ取得工程と、学習済みの機械学習モデルを用いて計測データを処理し、計測データの解析結果を出力するデータ解析工程と、計測データと、計測データを処理した処理結果と、を含むデータセットを解析結果データセットとして記憶装置の解析結果データベースに格納する格納処理工程と、通信部を介して受信した、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価結果を含む、学習用データセットを取得する学習用データセット取得工程と、学習用データセットに基づいて、機械学習モデルを再学習させる学習工程と、を備える。
【発明の効果】
【0008】
本発明のこれらの態様によれば、学習済みの機械学習モデルを用いて計測データが処理されるため、計測データの解析結果が、計測データを解析する解析者の直感や経験等に依存してばらついてしまうのを抑制できる。また計測データの処理結果に対する評価の結果を含む学習用データセットに基づいて、機械学習モデルの再学習が行われるため、計測データの解析が行われて解析結果データセットが蓄積され、その結果として学習用データセットの点数が増大していくにつれて、機械学習モデルの性能を向上させて、計測データの解析精度を向上させることができる。
【図面の簡単な説明】
【0009】
【
図1】
図1は、本発明の一実施形態によるデータ解析システムを備える材料情報取得システムの概略構成図である。
【
図2】
図2は、材料情報システムの動作シーケンスの一例を示す図である。
【発明を実施するための形態】
【0010】
以下、図面を参照して本発明の実施形態について詳細に説明する。なお、以下の説明では、同様な構成要素には同一の参照番号を付す。
【0011】
図1は、本発明の一実施形態によるデータ解析システム1を備える材料情報取得システム100の概略構成図である。
【0012】
材料情報取得システム100は、データ解析システム1と、データ解析システム1とネットワークを介して接続され、データ解析システム1と互いに通信可能に構成されたユーザ用端末2及び評価者用端末3と、を備える。
【0013】
材料情報取得システム100は、材料情報取得システム100を利用する一又は複数のユーザが、ユーザ用端末2を操作してデータ解析システム1に入力した、材料分析用の計測装置等によって計測された計測データ(入力データ)を、学習済みの機械学習モデルを用いたデータ解析システム1によって解析し、計測データの解析結果である材料の構成成分や、化学状態、化学構造、物性などに関する情報(以下「材料情報」という。)を、計測データを入力したユーザのユーザ用端末2に出力データとして出力することができるように構成される。
【0014】
また材料情報取得システム100は、データ解析システム1によって解析された計測データの解析結果を評価する評価者が、評価者用端末3を操作してデータ解析システム1に入力した後述する学習用データセットに基づいて、データ解析に用いられている機械学習モデルを再学習させることができるように構成される。
【0015】
以下、
図1を参照して、材料情報取得システム100を構成するデータ解析システム1、ユーザ用端末2及び評価者用端末3のハードウェア構成について説明する。
【0016】
ユーザ用端末2は、ネットワークを介して、データ解析システム1と、材料情報取得システム100を利用する一又は複数のユーザと、の間で情報のやり取りを行うための装置である。ユーザ用端末2は、例えば、ユーザ側に設けられた、キーボードやディスプレイなどを備えるコンピュータである。なおユーザ用端末2は、材料情報取得システム100を利用するユーザが複数存在する場合は、ユーザ毎に設けることができる。
【0017】
評価者用端末3は、ネットワークを介して、データ解析システム1と、データ解析システム1によって解析された計測データの解析結果を評価する評価者と、の間で情報のやり取りを行うための装置である。評価者は、例えば計測データの解析を専門とする人間の専門家である。評価者用端末3は、例えば、評価者側に設けられた、キーボードやディスプレイなどを備えるコンピュータである。なお本実施形態では、材料情報取得システム100をユーザに提供するシステム提供者側の人間を評価者としているが、ユーザ側の人間を評価者としてもよい。
【0018】
データ解析システム1は、通信部10と、演算装置20と、記憶装置30と、を備える。
【0019】
通信部10は、データ解析システム1を、ネットワークを介してユーザ用端末2及び評価者用端末3のそれぞれと接続し、データ解析システム1と各端末2、3との間で相互に通信を行うことができるようにするための通信インタフェース回路である。
【0020】
演算装置20は、記憶装置30に格納された各種のプログラムを実行する装置であって、例えばCPU(Central Processing Unit)等である。演算装置20は、プログラムに従って処理を実行することによって、計測データ取得部21、データ解析部22(前処理部23、特徴量抽出処理部24及び特徴量解析処理部25)、解析結果送信部26、解析データ格納処理部27、学習用データセット取得部28、及び学習部29として機能し、所定の機能を実現する機能部(モジュール)として動作する。以下の説明では、各機能部を主語に処理を説明する場合、演算装置20が当該機能部を実現するプログラムを実行していることを示す。各機能部21~29の詳細については後述する。
【0021】
記憶装置30は、演算装置20が実行するプログラム及びプログラムの実行時に使用されるデータを格納する装置であり、例えば、メモリ、HDD(Hard Disk Drive)、SSD(Solid State DRIVE)、RAM(Random Access Memory)及びROM(Read Only Memory)等である。記憶装置30の各データベース、すなわち、特徴量データベース31、解析結果データベース32及び学習用データベース33に格納されるデータの詳細については後述する。
【0022】
続いて、引き続き
図1を参照して、材料情報取得システム100の動作について説明する。
【0023】
ユーザは、ユーザ側において取得した材料の計測データを、ユーザ用端末2を介してデータ解析システム1に入力することで、データ解析システム1によって解析された当該計測データの解析結果、すなわち材料情報を、ユーザ用端末2を介して出力として得ることができる。計測データとしては、材料を分析するための計測によって得られた種々のデータ、例えばX線や中性子線、電子線を材料に照射することにより得られるデータ(具体的には、X線回折(XRD)やX線吸収微細構造解析(XAFS)、X線光電子分光(XPS)、X線吸収分光(XAS)、X線吸収円二色性、小角散乱(SAS)、中性子回折(SANS)、中性子反射率、非弾性散乱、電子線回折などによる計測データ)や、顕微鏡等によって観察された材料の画像データ(具体的には、X線顕微鏡、光学顕微鏡、電子間顕微鏡、原子力間顕微鏡、コンピュータ断層撮影、透過電子線イメージング、走査電子線イメージングなどによる画像データ)などを用いることができる。
【0024】
本実施形態では、計測データとして、X線回折装置によって材料(試料)を分析したときの計測データがユーザによって入力される。
【0025】
データ解析システム1は、ユーザ用端末2を介してユーザによって計測データが入力されると、当該計測データの特徴量を抽出すると共に抽出した特徴量に基づいて材料の解析を行う。本実施形態では、X線回折装置によって分析された材料の計測データの特徴量として、回折ピーク位置や強度、結晶相、相分率、ピーク幅などの回折パターンが抽出され、抽出された回折パターンに基づいて材料の解析(相同定等)が行われる。
【0026】
以下、データ解析システム1において実施される具体的な処理の内容について説明する。すなわち、演算装置20がプログラムに従って処理を実行することによって実現される各機能部21~29の内容について説明する。
【0027】
計測データ取得部21は、ユーザによって入力された計測データを取得し、データ解析部22及び解析データ格納処理部27に出力する。
【0028】
データ解析部22としての前処理部23、特徴量抽出処理部24及び特徴量解析処理部25は、それぞれ学習済みの機械学習モデルを用いて計測データを処理し、解析結果としての材料情報を最終的な出力データとして出力する。データ解析部22において用いられる機械学習モデルは特に限られるものではなく、ニューラルネットワークやサポートベクトルマシン、ランダムフォレストなど、各種の機械学習モデルを使用することができる。
【0029】
前処理部23には、計測データ取得部21によって取得された計測データが入力される。前処理部23は、入力された計測データに対して、例えば平滑化(スムージング)やバックグラウンド除去などの、計測データのノイズを減らすための前処理、すなわち信号雑音比(signal-noise ratio)を高めるための前処理を施し、前処理を施した計測データ(以下「前処理済みの計測データ」という。)を特徴量抽出処理部24及び解析データ格納処理部27に出力する。
【0030】
前処理部23は、入力された計測データに応じて、適切な平滑化やバックグラウンドの除去を行うことができるように予め学習される。例えば前処理部23において、計測データに対してカーネル密度推定法による平滑化を行う場合には、平滑化のための平滑化パラメータ(バンド幅)の値を例えばデータ点数等に応じて適切な値に設定する必要があるため、前処理部23は、入力された計測データに応じて適切な平滑化パラメータの値を設定して計測データの平滑化を行うことができるように予め学習される。
【0031】
特徴量抽出処理部24には、前処理済みの計測データが入力される。特徴量抽出処理部24は、入力された前処理済みの計測データに応じて、計測データの特徴量を抽出することができるように予め学習されており、抽出した特徴量を特徴量解析処理部25及び解析データ格納処理部27に出力する。本実施形態では、前述したように、回折ピーク位置や強度、結晶相、相分率、ピーク幅などの回折パターンが計測データの特徴量として抽出される。なお抽出される特徴量は、これらに限られるものではなく、計測データに応じて、例えば材料の粒子径分布を特徴量として抽出したり、また計測データが画像である場合には、画像の中の幾何学的な特徴を特徴量として抽出したりしてもよい。
【0032】
特徴量解析処理部25には、計測データの特徴量が入力される。特徴量解析処理部25は、入力された計測データの特徴量に基づいて材料の解析を行い、その解析結果を解析結果送信部26及び解析データ格納処理部27に出力する。本実施形態では特徴量解析処理部25は、計測データの特徴量として入力された回折パターンを、特徴量データベース31に格納された既知の材料の特徴量に関するデータ、すなわち既知の材料の回折パターンと照合し、既知の材料の回折パターンの中から類似度の高い回折パターンを選別することができるように予め学習されており、選別された回折パターンから特定された材料情報を、解析結果として解析結果送信部26及び解析データ格納処理部27に出力する。
【0033】
従来、例えば平滑化パラメータの値の設定は、データ点数等に応じて解析者の直感や経験等によって行われており、また計測データの特徴量の抽出や抽出した特徴量に基づく材料の解析等も同様に、解析者の直感や経験等によって行われていた。これに対して本実施形態では、学習済みの機械学習モデルを用いて計測データが処理される。そのため、平滑化パラメータの設定や計測データの特徴量の抽出、特徴量に基づく材料の解析が、従来のように解析者に依存してしまうのを抑制することができる。
【0034】
解析結果送信部26は、入力された解析結果、すなわち材料情報を、ユーザが入力した計測データの解析結果としてユーザ用端末2に送信する。
【0035】
解析データ格納処理部27は、解析データ格納処理部27に入力された各データ、すなわち計測データと、当該計測データに対して前処理を施した前処理済みの計測データと、当該計測データから抽出された特徴量と、当該計測データの解析結果(材料情報)と、を関連付けて、それらを解析結果データセットとして解析結果データベース32に格納する。
【0036】
評価者は、評価者用端末3を操作して解析結果データベース32にアクセスすることで、解析結果データセットを取得し、入力データと出力データとの関係性を分析して入力データから得られた出力データの良し悪しに応じた評価スコアを決定する。そして評価者は、評価者用端末3を操作して、入力データ、出力データ及び評価スコアを関連付けた学習用データセットを、データ解析システム1に入力する。
【0037】
本実施形態では評価者は、計測データと、当該計測データに対して前処理を施した前処理済みの計測データと、を参照し、例えば、平滑化パラメータとして適切な値が設定されているかなど、計測データに対して適切な前処理が行われているかを評価し、評価結果に応じた評価スコアを、前処理済みの計測データに対して付与する。この際、計測データに対して適切な前処理が行われてれば、高い評価スコアが付与される。
【0038】
また評価者は、計測データ(又は前処理済みの計測データ)と、当該計測データから抽出された特徴量と、を参照し、例えば、ノイズをピークとして抽出していないかなど、計測データから適切に特徴量が抽出されているかを評価し、評価結果に応じた評価スコアを、計測データから抽出された特徴量に付与する。この際、計測データから適切に特徴量が抽出されていれば、高い評価スコアが付与される。
【0039】
さらに評価者は、計測データから抽出された特徴量と、当該特徴量に基づく当該計測データの解析結果と、を参照し、例えば、特徴量として入力された回折パターンと回折ピーク位置やその本数などが一致又は類似する類似度の高い回折パターンが特徴量データベース31から適切に選別されているかなど、計測データから抽出された特徴量に基づいて適切に解析が行われているかを評価し、評価結果に応じた評価スコアを、計測データの解析結果に対して付与する。この際、計測データから抽出された特徴量に基づいて適切に解析が行われていれば、高い評価スコアが付与される。
【0040】
そして評価者は、計測データと、当該計測データに対して前処理を施した前処理済みの計測データと、当該計測データから抽出された特徴量と、当該計測データの解析結果と、前処理済みの計測データに対して付与された評価スコアと、特徴量に対して付与された評価スコアと、解析結果に対して付与された評価スコアと、を関連付けて、学習用データセットとしてデータ解析システム1に入力する。
【0041】
このようにしてデータ解析システム1に入力された学習用データセットは、学習用データセット取得部28によって取得され、記憶装置30の学習用データベース33に格納される。すなわち学習用データセット取得部28は、評価者によって入力された学習用データセットを取得し、取得した学習用データセットを学習用データベース33に格納する。
【0042】
学習部29は、学習用データベース33に格納された学習用データセットに基づいて、データ解析部22の機械学習モデルの再学習を行って、機械学習モデルを最適化する。例えば学習部29は、学習用データベース33に新たに格納された学習用データセットのデータ点数が所定数以上となったときに、データ解析部22の機械学習モデルの再学習を行って、機械学習モデルに使用される各関数の係数の値を更新し、機械学習モデルを最適化する。
【0043】
本実施形態では学習部29は、前処理部23を学習するための学習用データセットとして、計測データと、計測データに対して前処理を施した前処理済みの計測データと、前処理済みの計測データに対して付与された評価スコアと、を学習用データベース33から取得し、これらに基づいて、新たな計測データが入力されたときの前処理済みの計測データの評価スコアが最大化されるように、前処理部23において使用される機械学習モデルを最適化する。これにより、例えば本実施形態では、カーネル密度推定の際に使用する平滑化パラメータの値を算出するためのモデルの各種パラメータが最適化されることになる。
【0044】
また学習部29は、特徴量抽出処理部24を学習するための学習用データセットとして、計測データ(又は前処理済みの計測データ)と、計測データから抽出された特徴量と、特徴量に対して付与された評価スコアと、を学習用データベース33から取得し、これらに基づいて、新たな計測データが入力されたときの特徴量の評価スコアが最大化されるように、特徴量抽出処理部24において使用される機械学習モデルを最適化する。
【0045】
また学習部29は、特徴量解析処理部25を学習するための学習用データセットとして、計測データから抽出された特徴量と、特徴量に基づく計測データの解析結果と、解析結果に対して付与された評価スコアと、を学習用データベース33から取得し、これらに基づいて、新たな特徴量が入力されたときのその特徴量に基づく計測データの解析結果の評価スコアが最大化されるように、特徴量解析処理部25において使用される機械学習モデルを最適化する。
【0046】
このように本実施形態では、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25の各機械学習モデルの性能が評価者によって評価され、その評価結果がデータ解析システム1に入力される。そして入力された評価結果を利用して、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25の各機械学習モデルを再学習させることができる。これにより、データ解析システム1による計測データの解析が行われ、その解析結果の評価結果を利用して各機械学習モデルが再学習されるごとに、各機械学習モデルの性能を向上させることができる。
【0047】
図2は、材料情報取得システム100の動作シーケンスの一例を示す図である。
【0048】
ステップS1において、ユーザがユーザ用端末2を操作して計測データを入力すると、計測データがネットワークを介してデータ解析システム1に送信される。
【0049】
ステップS2において、データ解析システム1は、通信部10を介して受信した計測データを取得する。
【0050】
ステップS3において、データ解析システム1は、取得した計測データを解析し、解析結果としての材料情報を出力する。
【0051】
ステップS4において、データ解析システム1は、解析結果としての材料情報を、通信部10を介して計測データを入力したユーザのユーザ用端末2に送信する。
【0052】
ステップS5において、データ解析システム1は、解析結果データセットを解析結果データベース32に格納する。
【0053】
ステップS6において、評価者は、評価者用端末3を操作して、ネットワークを介して解析結果データベース32に格納された解析結果データセットを取得する。
【0054】
ステップS7において、評価者は、解析結果データセットに基づいて、データ解析システム1による計測データの解析結果を評価し、学習用データセットを作成する。
【0055】
ステップS8において、評価者が評価者用端末3を操作して学習用データセットを入力すると、学習用データセットがネットワークを介してデータ解析システム1に送信される。
【0056】
ステップS9において、データ解析システム1は、通信部10を介して受信した学習用データセットを取得し、学習用データベース33に格納する。
【0057】
ステップS10において、データ解析システム1は、学習用データベース33に格納された学習用データセットに基づいて、計測データの解析に用いる機械学習モデルの再学習を行う。
【0058】
以上説明した本実施形態によるデータ解析システム1は、演算装置20と、演算装置20に接続される記憶装置30と、演算装置20に接続されて外部の端末2,3と通信可能な通信部10と、を備える。演算装置20は、通信部10を介して受信した、材料を分析した計測データを取得する計測データ取得部21と、学習済みの機械学習モデルを用いて計測データを処理し、計測データの解析結果を出力するデータ解析部22と、計測データと、計測データを処理した処理結果と、を含むデータセットを解析結果データセットとして記憶装置30に格納する解析データ格納処理部27(格納処理部)と、通信部10を介して受信した、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価結果を含む学習用データセットを取得する学習用データセット取得部28と、学習用データセットに基づいて、機械学習モデルを再学習させる学習部29と、を備える。
【0059】
このように本実施形態によるデータ解析システム1は、学習済みの機械学習モデルを用いて計測データが処理されるため、計測データの解析結果が、計測データを解析する解析者の直感や経験等に依存してばらついてしまうのを抑制することができる。また、解析結果データセットに基づいて外部で行われた計測データの処理結果に対する評価の結果を含む学習用データセットに基づいて、機械学習モデルの再学習が行われるため、計測データの解析が行われて解析結果データセットが蓄積され、その結果として学習用データセットの点数が増大していくにつれて、機械学習モデルの性能を向上させて、計測データの解析精度を向上させることができる。
【0060】
また本実施形態では、演算装置20は、計測データの解析結果を、計測データの送信元となる外部のユーザ用端末2に送信する解析結果送信部26をさらに備える。そのため、ユーザは、計測データを入力するだけで、当該計測データの解析結果を出力データとして取得することができる。
【0061】
また本実施形態によるデータ解析部22は、計測データに基づいて、計測データの特徴量を抽出して出力するように予め学習された特徴量抽出処理部24と、計測データの特徴量に基づいて、特徴量に応じた計測データの解析結果を出力するように予め学習された特徴量解析処理部25と、を備える。そしてデータ解析部22は、計測データ取得部21によって取得された計測データに対して信号雑音比を高めるための処理を施し、前処理済みの計測データを出力するように予め学習された前処理部23をさらに備え、前処理済みの計測データを、入力データとして特徴量抽出処理部24に入力するように構成される。
【0062】
これにより、信号雑音比を高めた計測データ、すなわち計測データからノイズが除去された前処理済みの計測データに基づいて、特徴量の抽出を行うことができるため、計測データの解析精度を一層向上させることができる。
【0063】
また本実施形態では、解析データ格納処理部27は、解析結果データセットとして、計測データと、前処理部23から出力された前処理済みの計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、特徴量解析処理部25から出力された計測データの解析結果と、を記憶装置30に格納するように構成される。そして学習用データセットには、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、計測データの処理結果に対する評価結果として含まれており、学習部29は、計測データと、前処理部23から出力された前処理済みの計測データと、その前処理済みの計測データに対して付与された評価スコアと、に基づいて、前処理部23を再学習させ、計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、特徴量抽出処理部24を再学習させ、計測データと、特徴量解析処理部25から出力された計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、特徴量解析処理部25を再学習させるように構成される。
【0064】
これにより、前処理部23、特徴量抽出処理部24及び特徴量解析処理部25を、それぞれの処理結果に応じて再学習させることができる。そのため、各処理部23~25の機械学習モデルの性能を向上させ、計測データの解析精度を向上させることができる。
【0065】
また本実施形態による材料情報取得システム100は、データ解析システム1を備えると共に、データ解析システム1と通信可能な外部の端末として、データ解析システムを利用するユーザが計測データをデータ解析システム1に入力すると共に、計測データの解析結果を出力データとして受け取るためのユーザ用端末2(第1端末)と、記憶装置30から解析結果データセットを取得すると共に、取得した解析結果データセットに基づいて行われた計測データの処理結果に対する評価結果を含む学習用データセットをデータ解析システム1に入力するための評価者用端末(第2端末)と、を備える。
【0066】
これにより、ユーザは、計測データをユーザ用端末2に入力するだけで、その計測データの解析結果としての材料情報を容易に取得することができる。また必要に応じて評価者が評価者用端末3を操作して解析結果データセットを取得して、その解析結果の評価結果を学習用データセットして入力するだけで、データ解析システム1の解析性能を容易に向上させていくことができる。
【0067】
以上、本発明の実施形態について説明したが、上記実施形態は本発明の適用例の一部を示したに過ぎず、本発明の技術的範囲を上記実施形態の具体的構成に限定する趣旨ではない。
【0068】
例えば上記の実施形態では、データ解析部22は前処理部23を備えていたが、計測データに対して前処理が不要な場合は、前処理部23に関しては省略してもよい。なお、その場合には、解析データ格納処理部27は、解析結果データセットとして、計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、特徴量解析処理部25から出力された計測データの解析結果と、を記憶装置30に格納するように構成される。そして学習用データセットには、特徴量抽出処理部24及び特徴量解析処理部25から出力された各出力データの良し悪しに応じて数値化されて各出力データに付与された評価スコアが、計測データの処理結果に対する評価結果として含まれており、学習部29は、計測データと、特徴量抽出処理部24から出力された計測データの特徴量と、その特徴量に対して付与された評価スコアと、に基づいて、特徴量抽出処理部24を再学習させ、計測データと、特徴量解析処理部25から出力された計測データの解析結果と、その解析結果に対して付与された評価スコアと、に基づいて、特徴量解析処理部25を再学習させるように構成される。
【0069】
また上記の実施形態では、評価者は人間の専門家であったが、評価自体を例えば機械学習モデル等によって機械的に評価して、その評価結果をデータ解析システム1に入力すえることができるようにしてもよい。
【符号の説明】
【0070】
1 データ解析システム
2 ユーザ用端末
3 評価者用端末
10 通信部
20 演算装置
21 計測データ取得部
22 データ解析部
23 前処理部
24 特徴量抽出処理部
25 特徴量解析処理部
26 解析結果送信部
27 解析データ格納処理部(格納処理部)
28 学習用データセット取得部
29 学習部
30 記憶装置
100 材料情報取得システム