(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023008857
(43)【公開日】2023-01-19
(54)【発明の名称】データ処理装置および推論方法
(51)【国際特許分類】
G06N 20/00 20190101AFI20230112BHJP
【FI】
G06N20/00
【審査請求】未請求
【請求項の数】20
【出願形態】OL
(21)【出願番号】P 2022100940
(22)【出願日】2022-06-23
(31)【優先権主張番号】P 2021111527
(32)【優先日】2021-07-05
(33)【優先権主張国・地域又は機関】JP
(71)【出願人】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110001195
【氏名又は名称】弁理士法人深見特許事務所
(72)【発明者】
【氏名】中木村 有里子
(72)【発明者】
【氏名】永井 詩織
(72)【発明者】
【氏名】川瀬 智裕
(72)【発明者】
【氏名】横井 祐介
(72)【発明者】
【氏名】山本 聡
(72)【発明者】
【氏名】足立 健太
(57)【要約】
【課題】複数の説明変数の入力を受けて学習済みモデルから出力される推論結果の有用性を高める。
【解決手段】一態様に係るデータ処理装置は、学習済みモデルを用いて、複数の説明変数から少なくとも1つの目的変数を予測する推論部と、推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備える。推論部は、複数の説明変数の中から選択された第1の説明変数を変動値とする一方で、第1の説明変数以外の第2の説明変数を固定値とする。推論部は、学習済みモデルを用いて、第1の説明変数を予め定められた変動範囲内で連続的に変動させたときの少なくとも1つの目的変数を予測する。表示データ生成部は、第1の説明変数の変動に対する少なくとも1つの目的変数の変動を示すデータを生成する。
【選択図】
図11
【特許請求の範囲】
【請求項1】
学習済みモデルを用いて、複数の説明変数から目的変数を予測する推論部と、
前記推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備え、
前記推論部は、
前記複数の説明変数の中から選択された第1の説明変数を変動値とする一方で、前記第1の説明変数以外の第2の説明変数を固定値とし、かつ、
前記学習済みモデルを用いて、前記第1の説明変数を予め定められた変動範囲内で連続的に変動させたときの前記目的変数を予測し、
前記表示データ生成部は、前記第1の説明変数の変動に対する前記目的変数の変動を示すデータを生成する、データ処理装置。
【請求項2】
前記表示データ生成部は、前記第1の説明変数を第1軸とし、前記目的変数を第2軸とする2次元グラフを生成する、請求項1に記載のデータ処理装置。
【請求項3】
前記推論部は、
前記複数の説明変数の中から2以上の前記第1の説明変数を選択し、かつ、
前記選択された前記2以上の第1の説明変数の各々について、前記学習済みモデルを用いて、前記第1の説明変数を前記変動範囲内で連続的に変化させたときの前記目的変数を予測し、
前記データ処理装置には表示部が接続されており、
前記表示データ生成部は、
前記2以上の第1の説明変数にそれぞれ対応して2以上の前記2次元グラフを生成し、
生成した前記2以上の2次元グラフが互いに重畳するように前記表示部に表示する、請求項2に記載のデータ処理装置。
【請求項4】
前記表示データ生成部は、前記第1の説明変数の選択および前記変動範囲の設定のための第1のユーザインターフェイスを提供するように構成され、
前記第1のユーザインターフェイスは、前記変動範囲の推奨範囲に関する情報を含む、請求項1に記載のデータ処理装置。
【請求項5】
前記学習済みモデルは、前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルであり、
前記推奨範囲は、前記教師データに含まれる前記第1の説明変数の値に基づいて設定される、請求項4に記載のデータ処理装置。
【請求項6】
前記表示データ生成部はさらに、前記第2の説明変数の値を設定するための第2のユーザインターフェイスを提供する、請求項4または5に記載のデータ処理装置。
【請求項7】
前記学習済みモデルは、前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルであり、
前記推論部は、
前記学習済みモデルにおける各説明変数の重要度に基づいて、前記複数の説明変数の中から少なくとも1つの前記第1の説明変数を選択し、かつ、
選択された前記少なくとも1つの第1の説明変数の各々について、前記学習済みモデルを用いて、前記第1の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測する、請求項1に記載のデータ処理装置。
【請求項8】
前記変動範囲は、前記教師データに含まれる前記第1の説明変数の値に基づいて設定される、請求項7に記載のデータ処理装置。
【請求項9】
前記データ処理装置には表示部が接続されており、
前記表示データ生成部は、
前記少なくとも1つの第1の説明変数にそれぞれ対応して少なくとも1つの前記データを生成し、かつ、
生成した前記少なくとも1つのデータを、対応する前記第1の説明変数の前記重要度が高いものから順に前記表示部に表示する、請求項7または8に記載のデータ処理装置。
【請求項10】
前記推論部は、
前記複数の説明変数の主成分分析により求められた特定の主成分に対する各説明変数の主成分負荷量の絶対値に基づいて、前記複数の説明変数の中から少なくとも1つの前記第1の説明変数を選択し、かつ、
選択された前記少なくとも1つの第1の説明変数の各々について、前記学習済みモデルを用いて、前記第1の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測する、請求項1に記載のデータ処理装置。
【請求項11】
前記学習済みモデルは、前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルであり、
前記変動範囲は、前記教師データに含まれる前記第1の説明変数の値に基づいて設定される、請求項10に記載のデータ処理装置。
【請求項12】
前記データ処理装置には表示部が接続されており、
前記表示データ生成部は、
前記少なくとも1つの前記第1の説明変数にそれぞれ対応して少なくとも1つの前記データを生成し、
生成した前記少なくとも1つのデータを、対応する前記第1の説明変数の前記主成分負荷量が高いものから順に前記表示部に表示する、請求項10または11に記載のデータ処理装置。
【請求項13】
前記データ処理装置には表示部が接続されており、
前記推論部は、
前記複数の説明変数の各々を順番に前記第1の説明変数に選択し、かつ、
選択された各説明変数について、前記学習済みモデルを用いて、前記第1の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測し、
前記表示データ生成部は、
前記複数の説明変数にそれぞれ対応して複数の前記データを生成し、かつ、
生成した前記複数のデータを、前記目的変数の変動量が大きいものから順に前記表示部に表示する、請求項1または2に記載のデータ処理装置。
【請求項14】
前記推論部は、
前記複数の説明変数の中から2以上の前記第1の説明変数を選択し、
前記選択された前記2以上の第1の説明変数の各々について、前記学習済みモデルを用いて、前記第1の説明変数を前記変動範囲内で連続的に変化させたときの前記目的変数を予測し、
前記表示データ生成部は、前記2以上の第1の説明変数にそれぞれ対応して2以上の前記データを生成し、
前記2以上の第1の説明変数のうち、前記目的変数に対する影響度が最も大きい前記第1の説明変数の種別を、前記学習済みモデルが適用されるプロジェクトに関する情報と紐付けて記憶するためのデータベースをさらに備える、請求項1または2に記載のデータ処理装置。
【請求項15】
前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを生成する教師データ生成部と、
前記教師データを用いた機械学習によって、前記学習済みモデルを生成する学習部とをさらに備え、
前記教師データ生成部は、前記プロジェクトに関する情報および当該プロジェクトに紐付けられた前記第1の説明変数の種別をユーザに提示する、請求項14に記載のデータ処理装置。
【請求項16】
前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを生成する教師データ生成部と、
前記教師データを用いた機械学習によって、前記学習済みモデルを生成する学習部と、
前記学習済みモデルを、前記教師データと紐付けて記憶するためのデータベースとをさらに備える、請求項1に記載のデータ処理装置。
【請求項17】
前記教師データ生成部は、1つのデータ群から互いに異なる複数のデータ処理条件を用いて抽出された複数の特徴量をそれぞれ含むように、複数の前記教師データを生成し、
前記学習部は、
前記機械学習によって、前記複数の教師データから複数の前記学習済みモデルをそれぞれ生成し、
生成した前記複数の学習済みモデルの各々を、対応するデータ処理条件と紐付けて前記データベースに記憶する、請求項16に記載のデータ処理装置。
【請求項18】
前記推論部は、前記複数の学習済みモデルの各々を用いて、前記第1の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測し、
前記表示データ生成部は、前記複数の学習済みモデルにそれぞれ対応して、前記第1の説明変数の変動に対する前記目的変数の変動を示す複数の前記データを生成する、請求項17に記載のデータ処理装置。
【請求項19】
前記複数のデータの中から1つの前記データがユーザにより選択された場合には、前記表示データ生成部は、選択された前記データに対応する前記学習済みモデルを、適当な学習済みモデルとして前記データベースに記憶し、
前記教師データ生成部は、前記1つのデータ群に類似するデータ群から特徴量が抽出される場合には、前記適当な学習済みモデルに紐付けられた前記データ処理条件をユーザに提示する、請求項18に記載のデータ処理装置。
【請求項20】
学習済みモデルを用いて、複数の説明変数から目的変数を予測する推論方法であって、
前記複数の説明変数の中から選択された第1の説明変数を変動値とする一方で、前記第1の説明変数以外の第2の説明変数を固定値とし、かつ、前記学習済みモデルを用いて、前記第1の説明変数を予め定められた変動範囲内で連続的に変動させたときの前記目的変数を予測するステップと、
前記第1の説明変数の変動に対する前記目的変数の変動を示すデータを生成するステップと、
前記生成するステップにより生成された前記データを表示するステップとを備える、推論方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、データ処理装置および推論方法に関する。
【背景技術】
【0002】
特開2018-036131号公報(特許文献1)には、学習済みのニューラルネットワークを用いて、対象となる構造複合体を測定して得られた複数のパラメータから、当該構造複合体の状態を推定する方法が開示される。
【0003】
特許文献1では、複数のパラメータのデータセットをニューラルネットワークの入力層に入力すると、当該ニューラルネットワークの出力層から、構造複合体の性能の推定値が出力される。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
しかしながら、特許文献1に記載される推定方法では、ニューラルネットワークに入力される複数のパラメータのデータセットに対応して、1つの推定値が取得されるに止まる。そのため、ユーザにとっては、この1つの推定値から、予測された性能に対して複数のパラメータの各々がどのように影響しているのかを知ることは容易ではないと考えられる。例えば、上記複数のパラメータのうちの一部のパラメータの値が変動(増加または減少)した場合に、推定値がどのように変動するのかを予測することは容易ではないと考えられる。
【0006】
なお、推定値に対して個々のパラメータがどのように影響しているのかを知るためには、ニューラルネットワークに入力される複数のパラメータのデータセットを複数種類用意しておき、各データセットに対して推定値を取得するという手順を繰り返すことが必要となるため、ユーザの利便性を低下させるとともに、推論処理の効率を低下させてしまうことが懸念される。このような懸念点は、ニューラルネットワークに入力されるパラメータの数が増えるに従って、より顕著となり得る。
【0007】
本発明はこのような課題を解決するためになされたものであって、その目的は、複数の説明変数の入力を受けて学習済みモデルから出力される推論結果の有用性を高めることである。
【課題を解決するための手段】
【0008】
本発明の第1の態様に係るデータ処理装置は、学習済みモデルを用いて、複数の説明変数から少なくとも1つの目的変数を予測する推論部と、推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備える。推論部は、複数の説明変数の中から選択された第1の説明変数を変動値とする一方で、第1の説明変数以外の第2の説明変数を固定値とする。推論部は、学習済みモデルを用いて、第1の説明変数を予め定められた変動範囲内で連続的に変動させたときの少なくとも1つの目的変数を予測する。表示データ生成部は、第1の説明変数の変動に対する少なくとも1つの目的変数の変動を示すデータを生成する。
【0009】
本発明の第2の態様に係る推論方法は、学習済みモデルを用いて、複数の説明変数から少なくとも1つの目的変数を予測する。推論方法は、複数の説明変数の中から選択された第1の説明変数を変動値とする一方で、第1の説明変数以外の第2の説明変数を固定値とし、かつ、学習済みモデルを用いて、第1の説明変数を予め定められた変動範囲内で連続的に変動させたときの少なくとも1つの目的変数を予測するステップと、第1の説明変数の変動に対する少なくとも1つの目的変数の変動を示すデータを生成するステップと、生成するステップにより生成されたデータを表示するステップとを備える。
【発明の効果】
【0010】
本発明によれば、複数の説明変数の入力を受けて学習済みモデルから出力される推論結果の有用性を高めることができる。
【図面の簡単な説明】
【0011】
【
図1】実施の形態1に係る解析システムの構成例を説明する概略図である。
【
図2】情報処理装置およびデータ処理装置のハードウェア構成例を模式的に示す図である。
【
図3】情報処理装置およびデータ処理装置の機能構成を概略的に示す図である。
【
図4】データ処理装置にて実施される処理の概要を説明するためのフローチャートである。
【
図5】サンプルリストの生成の処理手順を説明するためのフローチャートである。
【
図7】教師データの生成、機械学習および学習済みモデルの記憶の処理手順を説明するためのフローチャートである。
【
図8】教師データテーブルの構成例を示す図である。
【
図9】学習済みモデルリストの構成例を示す図である。
【
図10】実施の形態1に係るデータ処理装置における推論処理の処理手順を説明するためのフローチャートである。
【
図11】表示部における推論結果の第1の表示例を模式的に示す図である。
【
図12】表示部における推論結果の第2の表示例を模式的に示す図である。
【
図13】表示部における推論結果の第3の表示例を模式的に示す図である。
【
図14】実施の形態2に係るデータ処理装置における推論処理の処理手順を説明するためのフローチャートである。
【
図15】実施の形態2に係るデータ処理装置における教師データの生成、機械学習および学習済みモデルの記憶の処理手順を説明するためのフローチャートである。
【
図16】実施の形態3の第1構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。
【
図17】第1構成例における推論結果の表示例を模式的に示す図である。
【
図18】実施の形態3の第2構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。
【
図19】実施の形態3の第3構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。
【
図20】実施の形態4に係るデータ処理装置における教師データの生成、機械学習および学習済みモデルの記憶の処理手順を説明するためのフローチャートである。
【
図22】選択サンプル抽出テーブルの構成例を示す図である。
【
図23】学習済みモデルリストの構成例を示す図である。
【
図24】実施の形態5に係るデータ処理装置における推論処理の処理手順を説明するためのフローチャートである。
【
図25】表示部における複数の推論結果の表示例を模式的に示す図である。
【
図26】実施の形態5に係るデータ処理装置におけるサンプルリストの生成の処理手順を説明するためのフローチャートである。
【発明を実施するための形態】
【0012】
以下、本発明の実施の形態について図面を参照して詳細に説明する。なお、以下では、図中の同一または相当部分について同一符号を付して、その説明は原則的に繰返さないものとする。
【0013】
[実施の形態1]
[解析システムの構成例]
図1は、実施の形態1に係る解析システムの構成例を説明する概略図である。実施の形態1に係る解析システムは、複数の分析装置において取得された分析データを横断的に解析するためのシステムに適用することができる。
【0014】
図1に示すように、実施の形態1に係る解析システム100は、複数の分析装置4と、データ処理装置1とを備える。
【0015】
複数の分析装置4は、サンプルの測定を行う。複数の分析装置4は、例えば、液体クロマトグラフ装置(LC)、ガスクロマトグラフ装置(GC)、液体クロマトグラフ質量分析装置(LC-MS)、ガスクロマトグラフ質量分析装置(GC-MS)、熱分解ガスクロマトグラフ質量分析装置(Py-GC/MS)、走査型電子顕微鏡(SEM)、透過電子顕微鏡(TEM)、エネルギー分散型蛍光X線分析装置(EDX)、波長分散型蛍光X線分析装置(WDX)、核磁気共鳴装置(NMR)、およびフーリエ変換赤外分光光度計(FT-IR)などを含む。複数の分析装置4はさらに、フォトダイオードアレイ検出器(LC-PDA)、液体クロマトグラフタンデム質量分析装置(LC/MS/MS)、ガスクロマトグラフタンデム質量分析装置(GC/MS/MS)、液体クロマトグラフイオントラップ飛行時間型質量分析計(LC/MS-IT-TOF)、近赤外分光装置、引張試験機、圧縮試験機、発光分光分析装置(AES)、原子吸光分析装置(AAS/FL-AAS)、プラズマ質量分析装置(ICP-MS)、有機元素分析装置、グロー放電質量分析装置(GDMS)、粒子組成分析装置、微量全窒素自動分析装置(TN)、高感度窒素炭素分析装置(NC)、および熱分析装置などを含んでもよい。解析システム100は、互いに種類が異なる複数の分析装置4を有することによって、1つのサンプルを複数種類の分析データを用いて多面的に分析することが可能となる。
【0016】
分析装置4は、装置本体5および情報処理装置6を含む。装置本体5は、分析対象となるサンプルを測定する。情報処理装置6には、サンプルの識別情報およびサンプルの測定条件が入力される。
【0017】
情報処理装置6は、入力された測定条件に従って、装置本体5における測定を制御する。これにより、サンプルの測定結果に基づいた分析データが取得される。情報処理装置6は、取得された分析データを、サンプルの識別情報および測定条件とともにデータファイルに格納し、このデータファイルを内蔵するメモリに保存する。
【0018】
情報処理装置6は、データ処理装置1と相互に通信可能に接続される。情報処理装置6およびデータ処理装置1間の接続は有線であっても無線であってもよい。例えば、情報処理装置6とデータ処理装置1とを繋ぐ通信網として、インターネットを利用することができる。これにより、各分析装置4の情報処理装置6は、サンプルごとのデータファイルをデータ処理装置1に送信することができる。
【0019】
データ処理装置1は、主として、複数の分析装置4にて取得される分析データを管理するための装置である。データ処理装置1には、各分析装置4からの分析データを入力される。データ処理装置1にはさらに、サンプルに関する情報(以下、「サンプル情報」とも称する)およびサンプルの物性データを入力することができる。
【0020】
サンプル情報は、サンプルを識別するための識別情報(サンプルID、サンプル名など)と、サンプルの作製に関する情報(以下、「レシピデータ」とも称する)とを含む。サンプルのレシピデータには、サンプルの原材料の配合量および製造プロセスに関する情報を含めることができる。例えば、サンプルが三元触媒である場合、レシピデータには、Pt(白金)の配合量(g)、Pd(パラジウム)の配合量(g)、攪拌時間(min)および焼成温度(℃)などが含まれる。
【0021】
サンプルの物性データとは、分析装置4による分析以外で得られる、サンプルの属性を示すデータである。例えば、サンプルが三元触媒である場合、物性データには、NOx(窒素酸化物)の浄化率(%)、CO(一酸化炭素)の浄化率(%)、HC(炭化水素)の浄化率(%)、および耐熱性能などが含まれる。
【0022】
データ処理装置1は、データベースを内蔵している。データベースは、データ処理装置1と複数の分析装置4との間で遣り取りされるデータ、データ処理装置1の外部から入力されるデータ、およびデータ処理装置1内で生成されるデータを保存するための記憶部である。データ処理装置1は、サンプルごとに、データファイルとサンプル情報およびサンプルの物性データとを紐付けてデータベースに格納する。なお、
図1の例では、データ処理装置1にデータベースを内蔵する構成としたが、データ処理装置1にデータベースが外付けされる構成としてもよい。
【0023】
[解析システムのハードウェア構成例]
図2は、情報処理装置6およびデータ処理装置1のハードウェア構成例を模式的に示す図である。
【0024】
(情報処理装置のハードウェア構成)
図2に示すように、情報処理装置6は、分析装置4全体を制御するためのCPU(Central Processing Unit)60と、プログラムおよびデータを格納する記憶部とを備えており、プログラムに従って動作するように構成される。
【0025】
記憶部は、ROM(Read Only Memory)61と、RAM(Random Access Memory)62と、HDD(Hard Disk Drive)65とを含む。ROM61は、CPU60にて実行されるプログラムを格納する。RAM62は、CPU60におけるプログラムの実行中に利用されるデータを一時的に格納する。RAM62は、作業領域として利用される一時的なデータメモリとして機能する。HDD65は、不揮発性の記憶装置であり、サンプルごとのデータファイルなど情報処理装置6で生成された情報を格納する。HDD65に加えて、あるいは、HDD65に代えて、フラッシュメモリなどの半導体記憶装置を採用してもよい。
【0026】
情報処理装置6は、さらに、通信インターフェイス(I/F)66、操作部63および表示部64を含む。通信I/F66は、情報処理装置6が装置本体5およびデータ処理装置1を含む外部機器と通信するためのインターフェイスである。
【0027】
操作部63は、ユーザ(例えば、分析者)からの情報処理装置6に対する指示を含む入力を受け付ける。操作部63は、キーボード、マウスおよび、表示部64の表示画面と一体的に構成されたタッチパネルなどを含み、サンプルの測定条件および識別情報などを受け付ける。
【0028】
表示部64は、測定条件を設定する際に、例えば測定条件の入力画面およびサンプルの識別情報などを表示することができる。測定中、表示部64は、装置本体5で検出された測定データおよび情報処理装置6によるデータ解析結果を表示することができる。
【0029】
分析装置4における処理は、各ハードウェアおよびCPU60により実行されるソフトウェアによって実現される。このようなソフトウェアはROM61またはHDD65に予め記憶されている場合がある。また、ソフトウェアは、図示しない記憶媒体に格納されて、プログラムプロダクトとして流通している場合もある。そして、ソフトウェアは、CPU60によってHDD65から読み出され、CPU60により実行可能な形式でRAM62に格納される。CPU60は、このプログラムを実行する。
【0030】
(データ処理装置のハードウェア構成)
データ処理装置1は、装置全体を制御するためのCPU10と、プログラムおよびデータを格納する記憶部とを備えており、プログラムに従って動作するように構成される。記憶部は、ROM11、RAM12およびデータベース15を含む。
【0031】
ROM11は、CPU10にて実行されるプログラムを格納する。RAM12は、CPU10におけるプログラムの実行中に利用されるデータを一時的に格納する。RAM12は、作業領域として利用される一時的なデータメモリとして機能する。
【0032】
データベース15は、不揮発性の記憶装置であり、データ処理装置1と複数の分析装置4との間で遣り取りされるデータ、データ処理装置1の外部から入力されるデータ、およびデータ処理装置1内で生成されるデータを格納する。
【0033】
データ処理装置1は、さらに、通信I/F13、入出力インターフェイス(I/O)14を含む。通信I/F13は、データ処理装置1が情報処理装置6を含む外部機器と通信するためのインターフェイスである。
【0034】
I/O14は、データ処理装置1への入力またはデータ処理装置1からの出力のインターフェイスである。I/O14は、表示部2および操作部3に接続される。表示部2は、後述するように、データ処理装置1において学習処理および推論処理が実行される際に、処理に関する情報を表示するとともに、ユーザの操作を受け付けるためのユーザインターフェイス画面を表示することができる。
【0035】
操作部3は、ユーザの指示を含む入力を受け付ける。操作部3は、キーボードおよびマウスなどを含み、サンプル情報およびサンプルの物性データなどを受け付ける。なお、サンプル情報およびサンプルの物性データは、通信I/F13を介して外部機器から受け付けることも可能である。
【0036】
[解析システムの機能構成]
図3は、情報処理装置6およびデータ処理装置1の機能構成を概略的に示す図である。
【0037】
(情報処理装置の機能構成)
図3に示すように、情報処理装置6は、データ取得部67と、情報取得部69とを有する。これらの機能構成は、
図2に示す情報処理装置6において、CPU60が所定のプログラムを実行することで実現される。
【0038】
データ取得部67は、装置本体5から、サンプルの測定結果に基づいた分析データを取得する。例えば、分析装置4がガスクロマトグラフ質量分析装置(GC-MS)である場合、分析データには、クロマトグラムおよびマススペクトルが含まれる。分析装置4が走査型電子顕微鏡(SEM)または透過型電子顕微鏡(TEM)である場合、分析データにはサンプルの顕微鏡像を示す画像データが含まれる。データ取得部67は、取得した測定データを通信I/F66へ転送する。
【0039】
情報取得部69は、操作部63が受け付けた情報を取得する。具体的には、情報取得部69は、サンプル識別情報およびサンプルの測定条件を示す情報を取得する。サンプル識別情報には、例えば、サンプル名、サンプルとなる製品の名称、型番およびシリアル番号などが含まれる。サンプルの測定条件には、使用する分析装置の名称および型番などを含む装置パラメータと、電圧および/または電流の印加条件または温度条件などの測定条件を示す測定パラメータとが含まれる。
【0040】
通信I/F66は、取得した分析データ、測定条件およびサンプル識別情報を、データファイルとしてデータ処理装置1へ送信する。
【0041】
(データ処理装置の機能構成)
データ処理装置1は、分析データ取得部20と、特徴量抽出部22と、物性データ取得部24と、サンプル情報取得部26と、教師データ生成部28と、学習部30と、推論部32と、表示データ生成部34とを備える。これらの機能構成は、
図2に示すデータ処理装置1において、CPU10が所定のプログラムを実行することによって実現される。
【0042】
分析データ取得部20は、通信I/F13を介して、各分析装置4の情報処理装置6から送信されるデータファイルを取得する。データファイルは、サンプルの分析データを含んでいる。
【0043】
特徴量抽出部22は、分析データ取得部20が取得した分析データを専用のデータ解析ソフトウェアを用いて解析することにより、サンプルの特徴量を抽出する。サンプルの特徴量には例えば、サンプルの組成、濃度、分子構造、分子数、分子式、分子量、重合度、粒子径、粒子面積、粒子数、粒子の分散度、ピーク強度、ピーク面積、ピークの傾き、化合物濃度、化合物量、吸光度、反射率、透過率、サンプルの試験強度、ヤング率、引張強度、変形量、歪み量、破断時間、平均粒子間距離、誘電正接、伸び、スプリング硬さ、損失係数、ガラス転移温度、および熱膨張率などが含まれる。
【0044】
物性データ取得部24は、操作部3が受け付けたサンプルの物性データを取得する。サンプルの物性データは、サンプルの属性を示すデータであり、例えば、サンプルの性能を示す値、またはサンプルの劣化度合いを示す値(使用年数など)などが含まれる。
【0045】
サンプル情報取得部26は、操作部3が受け付けたサンプル情報を取得する。サンプル情報は、サンプルの識別情報(サンプルID、サンプル名など)、およびサンプルのレシピデータを含む。サンプルのレシピデータには、サンプルの原材料の配合量および製造プロセスに関する情報などが含まれる。
【0046】
データベース15には、サンプルごとに、分析データ取得部20で取得された分析データ、特徴量抽出部22で抽出された特徴量、および物性データ取得部24で取得された物性データ、およびサンプル情報取得部26で取得されたサンプル情報が紐付けられて格納される。具体的には、データベース15には、これらの情報に基づいて、サンプルリストが作成される。サンプルリストとは、プロジェクトまたはサンプルの種類に応じて作成されるひとかたまりのデータセットであり、その構成などは特に限定されない。
【0047】
教師データ生成部28は、操作部3に対するユーザの入力操作に応じて、データベース15に格納されるデータに基づいて、教師データ(学習用データ)を生成する。教師データとは、入力(説明変数)と出力(目的変数)とがセットとなったデータである。
【0048】
教師データ生成部28は、例えば、1つのサンプルの「分析データまたは特徴量」および/または「レシピデータ」を予測モデルの入力(説明変数)とし、当該サンプルの「物性データ」を予測モデルの出力(目的変数)とする教師データを生成することができる。
【0049】
あるいは、教師データ生成部28は、1つのサンプルの「レシピデータ」を予測モデルの入力(説明変数)とし、当該サンプルの「分析データまたは特徴量」または「物性データ」を予測モデルの出力(目的変数)とする教師データを生成することができる。
【0050】
あるいは、教師データ生成部28は、1つのサンプルの「物性データ」を予測モデルの入力(説明変数)とし、当該サンプルの「分析データまたは特徴量」または「レシピデータ」を予測モデルの出力(目的変数)とする教師データを生成することができる。
【0051】
生成された教師データは、学習部30に与えられる。教師データは、生成される度にデータベース15に格納されてもよい。これにより、データベース15には、教師データが蓄積される。
【0052】
なお、教師データ生成部28は、教師データをデータベース15に格納する前に、表示データ生成部34を用いて、教師データをデータベース15に格納するか否かを確認するための確認画面を表示部2に表示する。当該確認画面において教師データの格納を指示するユーザ操作を受け付けた場合、教師データ生成部28は、教師データをデータベース15に格納する。一方、当該確認画面において上記指示を受け付けない場合には、教師データ生成部28は、教師データを破棄する。
【0053】
学習部30は、教師データ生成部28により生成された教師データを用いて、当該教師データの説明変数を予測モデルの入力とし、当該教師データの目的変数を当該予測モデルの出力の正解データとする教師あり学習を行う。教師あり学習では、与えられた入力がどのような出力になるのかを予測する。学習部30における教師データを用いた機械学習の手法は、特に限定されず、例えば、ニューラルネットワーク(Neural Network;NN)またはサポートベクタマシン(Support Vector Machine;SVM)などの公知の機械学習を用いることができる。
【0054】
学習が終了すると、学習済みモデルが得られる。生成された学習済みモデルは、データベース15に格納される。具体的には、学習済みモデルは、学習済みモデルを識別するための識別情報、学習済みモデルの生成日時、および学習に用いた教師データを識別するための識別情報と紐付けられて、データベース15に格納される。
【0055】
推論部32は、データベース15に記憶された学習済みモデルを用いて、分析データ取得部20および特徴量抽出部22、物性データ取得部24ならびにサンプル情報取得部26のいずれか1つまたは2つから新たに入力される入力データ(説明変数)から、出力(目的変数)を予測する。すなわち、説明変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの1つまたは2つであり、目的変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの他の1つである。あるいは、説明変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの1つであり、目的変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの他の1つまたは2つである。一例として、説明変数は「分析データまたは特徴量」および/または「レシピデータ」であり、目的変数は「物性データ」である。
【0056】
表示データ生成部34は、推論部32による推論結果を取得すると、推論結果を表示部2の表示画面上に表示させるためのデータを生成する。表示データ生成部34は、さらに、学習処理および推論処理が実行される際に、処理に関する情報を表示するとともに、ユーザの操作を受け付けるためのユーザインターフェイス(UI)を提供する。
【0057】
なお、操作部3および表示部2に代えて、例えば、デスクトップ型のパーソナルコンピュータ(PC)、ノート型PC、携帯端末(タブレット端末、スマートフォン)などの情報端末をデータ処理装置1に接続する構成としてもよい。
【0058】
また、
図3の例では、データ処理装置1が特徴量抽出部22を有する構成を示したが、情報処理装置6が特徴量抽出部を有する構成としてもよい。この場合、情報処理装置6は、サンプルの分析データとともに特徴量をデータ処理装置1に送信することになる。
【0059】
[データ処理装置の動作]
次に、データ処理装置1にて実施される処理について説明する。
【0060】
図4は、データ処理装置1にて実施される処理の概要を説明するためのフローチャートである。
図4に示すように、データ処理装置1における処理は、主に、学習フェーズと推論フェーズとに区分することができる。
【0061】
<学習フェーズ>
学習フェーズでは、データベース15に保存されているデータを用いて、教師データが生成される。そして、生成された教師データを用いて教師あり学習が実行されることにより、学習済みモデルが生成される。
【0062】
図4に示すように、最初に、ステップ(以下、単に「S」と表記する)01により、データベース15に格納されるデータに基づいて、サンプルリストが生成される。サンプルリストは、プロジェクトまたはサンプルの種類に応じて作成されるひとかたまりのデータセットである。
【0063】
次に、S02により、操作部3に対するユーザの入力操作に応じて、サンプルリストから教師データが生成される。生成された教師データは、データベース15に蓄積される。
【0064】
次に、S03により、教師データを用いて、当該教師データの説明変数を予測モデルの入力とし、当該教師データの目的変数を予測モデルの出力の正解データとする教師あり学習が行われる。最後に、S04により、教師あり学習によって生成された学習済みモデルが、データベース15に格納される。
【0065】
以下、
図5から
図9を用いて、学習フェーズにおける具体的な処理内容を説明する。
(1)サンプルリストの生成(
図4のS01)
図5は、サンプルリストの生成(
図4のS01)の処理手順を説明するためのフローチャートである。
図5を参照して、S10では、操作部3を介してサンプル情報が取得される。具体的には、ユーザは、図示しないデータベース操作ソフトウェア(フロントエンド)を用いて、サンプル情報を入力することができる。サンプル情報は、サンプルの識別情報(サンプルID、サンプル名など)、およびサンプルのレシピデータを含む。サンプルのレシピデータには、サンプルの原材料の配合量および製造プロセスに関する情報などが含まれる。
【0066】
S11では、操作部3を介してサンプルの物性データが取得される。物性データは、サンプルの属性を示すデータである。
【0067】
S12では、通信I/F13を介して、各分析装置4の情報処理装置6から送信されるデータファイルを取得する。データファイルは、サンプルの分析データを含んでいる。
【0068】
S13では、S12にて取得された分析データを専用のデータ解析ソフトウェアを用いて解析することにより、サンプルの特徴量が抽出される。
【0069】
S14では、取得されたサンプル情報(サンプルの識別情報、レシピデータ)、サンプルの物性データ、ならびにサンプルの分析データおよび特徴量がサンプルリストに入力される。
図6は、サンプルリストの構成例を示す図である。
図6には、サンプルが三元触媒である場合のサンプルリストの構成例が示されている。
【0070】
図6に示すように、サンプルリストには、サンプルIDと紐付けられて、サンプル名、サンプルのレシピデータ、物性データ、分析データおよび特徴量が入力されている。レシピデータは、Ptの配合量(g)、Pdの配合量(g)、攪拌時間(min)および焼成温度(℃)などを含む。物性データは、NOxの浄化率(%)、COの浄化率(%)、HCの浄化率(%)、および耐熱性能などを含む。分析データは、ガスクロマトグラフ質量分析装置(GC-MS)、核磁気共鳴装置(NMR)、走査電子顕微鏡(SEM)および透過電子顕微鏡(TEM)等により取得された分析データを含む。
【0071】
特徴量は、ガスクロマトグラフ質量分析装置(GC-MS)にて取得されたクロマトグラムを解析して得られた所定の質量数に対するピーク面積、核磁気共鳴装置(NMR)にて取得されたNMRスペクトルを解析して得られた所定の物質の存在比、走査電子顕微鏡(SEM)にて取得されたSEM画像を解析して得られた、三元触媒中に存在する粒子の粒子径、平均粒子径、および、透過電子顕微鏡(TEM)にて取得されたTEM画像を解析して得られた、三元触媒中に存在する粒子の粒子径などを含む。
【0072】
サンプルのレシピデータ、物性データ、分析データおよび特徴量が入力されたサンプルリストは、サンプルリストを識別するための情報(サンプルリストの名称など)が付与されてデータベース15に登録される。
【0073】
(2)教師データの生成および学習済みモデルの生成(
図4のS02~S04)
図7は、教師データの生成(
図4のS02)、機械学習(
図4のS03)および学習済みモデルの記憶(
図4のS04)の処理手順を説明するためのフローチャートである。
【0074】
図7を参照して、最初にS20により、教師データの生成に使用するサンプルが選択される。ユーザは、表示部2に表示されるUI画面(サンプル選択画面)を、操作部3を用いて操作することにより、サンプルを選択することができる。
【0075】
このサンプル選択画面は、データベース15に格納されたサンプルリストに基づいて作成することができる。例えば、サンプル選択画面には、データベース15に格納される全てのサンプルについて、サンプル名、レシピデータなどを含んだリストが表示される。この場合、サンプル選択画面には、各サンプルに対応して選択用アイコンが表示される。ユーザは、操作部3を用いて選択用アイコンにチェックを入れることによって、任意のサンプルを選択することができる。
【0076】
または、サンプル選択画面には、データベース15に格納される複数のサンプルリストの名称を表示してもよい。この場合、サンプル選択画面には、各サンプルリストに対応して選択用アイコンが表示される。ユーザが操作部3を用いて選択用アイコンにチェックを入れると、対応するサンプルリストに含まれる全てのサンプルが選択される。
【0077】
サンプルの選択が完了すると、サンプルリストから、選択されたサンプルの行に含まれるデータが抽出されて選択サンプル抽出テーブルが生成される。選択サンプル抽出テーブルは、選択結果の確認のために、表示部2に表示する構成としてもよい。
【0078】
次に、S21およびS22により、教師データの生成に使用する説明変数および目的変数が選択される。表示部2には、UI画面(説明変数選択画面および目的変数選択画面)が表示される。
【0079】
説明変数選択画面は、ユーザが、教師データの入力に使用するデータの種別を選択するためのUI画面である。説明変数選択画面には、選択サンプル抽出テーブルに含まれるサンプルのレシピデータ、分析データおよび特徴量の種別がリスト表示される。例えば、選択されたサンプルが三元触媒である場合には、説明変数選択画面には、「白金(Pt)の配合量」および「パラジウム(Pd)の配合量」などのレシピデータの種別、「GC-MS」および「NMR」などの分析データの種別、ならびに、「ピーク面積」および「粒子径」などの特徴量の種別がリスト表示される。説明変数選択画面には、各種別に対応して選択用アイコンが表示される。ユーザは、操作部3を用いて選択用アイコンにチェックを入れることによって、任意の説明変数を選択することができる。
【0080】
目的変数選択画面は、ユーザが、教師データの出力に使用するデータの種別を選択するためのUI画面である。目的変数選択画面には、選択サンプル抽出テーブルに含まれるサンプルのレシピデータ、分析データおよび特徴量の種別がリスト表示される。目的変数選択画面には、各種別に対応して選択用アイコンが表示される。ユーザは、操作部3を用いて選択用アイコンにチェックを入れることによって、任意の目的変数を選択することができる。
【0081】
ただし、目的変数選択画面では、説明変数に選択されたデータの種別と同じカテゴリに属する種別については、重複した選択を避けるために、選択用アイコンは表示されない。したがって、例えば、説明変数として「レシピデータ」に属する種別が選択された場合には、目的変数には、「物性データ」および「分析データまたは特徴量」のいずれかに属する種別を選択することができる。または、説明変数として「物性データ」に属する種別が選択された場合には、目的変数には、「レシピデータ」および「分析データまたは特徴量」のいずれかに属する種別を選択することができる。あるいは、説明変数として「分析データまたは特徴量」に属する種別が選択された場合には、目的変数には、「レシピデータ」および「物性データ」のいずれかに属する種別を選択することができる。
【0082】
なお、教師データ生成用アプリケーションが、教師あり学習の説明変数として使用するデータおよび目的変数として使用するデータのセットごとに準備されていてもよい。この場合、ユーザは、教師データ生成用アプリケーションを選択する操作を行うのみによって、教師データの入力及び出力に使用するデータの種別を選択することができる。
【0083】
説明変数(入力データの種別)および目的変数(出力データの種別)の選択が完了すると、S23では、選択サンプル抽出テーブルから、説明変数に合致するデータおよび目的変数に合致するデータが抽出されることにより、教師データテーブルが生成される。
図8は、教師データテーブルの構成例を示す図である。
図8には、選択されたサンプルが三元触媒である場合の教師データテーブルの構成例が示されている。
【0084】
図8に示すように、
図7のS20で選択されたサンプルのIDおよびサンプル名が垂直方向に表示される。さらに、
図7のS21で選択された説明変数(入力データの種別)および、S22で選択された目標変数(出力データの種別)が水平方向に表示される。
【0085】
図8の例では、説明変数としてレシピデータが選択されている。具体的には、Ptの配合量(%)、Pdの配合量(%)、攪拌時間(min)および焼成温度(℃)が、説明変数に選択されている。目的変数として物性データが選択されている。具体的には、NOxの浄化率(%)、COの浄化率(%)および耐熱性能が、目的変数に選択されている。
【0086】
教師データテーブルには、サンプルごとに、説明変数に合致するデータ、および目的変数に合致するデータが入力される。教師データテーブルは、表示部2に表示される。ユーザは、表示されている教示データテーブルに対して、サンプルおよびデータの種別の追加または修正を行うことができる。例えば、サンプルが追加された場合には、選択サンプル抽出テーブルに対してサンプルが追加されるとともに、教師データテーブルにおいて、追加されたサンプルのデータが追加される。説明変数または目的変数のデータの種別が追加された場合には、教師データテーブルにおいて、各サンプルに対して、追加された変数のデータが追加される。
【0087】
教師データテーブルの生成が完了すると、生成された教師データテーブルに基づいて、教師データが生成される。
図8の例では、説明変数として選択された、Ptの配合量(g)、Pdの配合量(g)、攪拌時間(min)および焼成温度(℃)を入力とし、かつ、目的変数として選択された、NOxの浄化率(%)、COの浄化率(%)および耐熱性能を出力とする教師データが生成される。
【0088】
次に、S24では、教師データを用いて、当該教師データの説明変数を学習用のモデルの入力とし、当該教師データの目的変数を当該モデルの出力の正解データとする教師あり学習が行われる。以下、機械学習の一例として、サポートベクタマシン(SVM)を用いた場合を説明する。
【0089】
学習部30(
図3)は、Ptの配合量(g)、Pdの配合量(g)、攪拌時間(min)および焼成温度(℃)をSVMに入力し、SVMから出力されるNOxの浄化率(%)、COの浄化率(%)および耐熱性能を取得する。学習部30は、取得されたNOxの浄化率(%)、COの浄化率(%)および耐熱性能と、教師データに含まれるNOxの浄化率(%)、COの浄化率(%)および耐熱性能とをそれぞれ比較する。学習部30は、SVMから出力されるNOxの浄化率(%)、COの浄化率(%)および耐熱性能が、それぞれ、教師データであるNOxの浄化率(%)、COの浄化率(%)および耐熱性能に近づくように、SVM内の各種パラメータを更新することにより、学習済みモデルを生成する。
【0090】
S24での機械学習が終了すると、学習済みモデルが得られる(
図7のS25)。S26では、生成された学習済みモデルがデータベース15に格納される。具体的には、学習済みモデルは、データベース15に格納されている学習済みモデルリストに登録される。
図9は、学習済みモデルリストの構成例を示す図である。
図9の例では、学習済みモデルは、学習済みモデルを識別するための識別情報(学習済みモデルIDなど)、学習済みモデルの生成日時、学習済みモデルに関する情報、および学習に用いた教師データを識別するための識別情報と紐付けられている。
【0091】
学習済みモデルに関する情報には、学習済みモデルが適用されるプロジェクトの名称などを含めることができる。例えば、「三元触媒の浄化性能向上モデル」、「三元触媒の耐熱性改善モデル」などの情報を含めることができる。教師データの識別情報には、教師データの生成に使用したサンプルの情報(サンプルID、サンプル名など)、説明変数に選択されたデータの種別、および目的変数に選択されたデータの種別などを含めることができる。これらの情報は、選択サンプルデータ抽出テーブルおよび教師データテーブルから取得することができる。
【0092】
<推論フェーズ>
推論フェーズでは、生成された学習済みモデルを用いて、与えられる説明変数から目的変数が予測される。推論結果は表示部2に表示される。
図4に戻って、最初にS05により、説明変数が新たに取得される。この説明変数は、「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの1つまたは2つである。
【0093】
S06では、学習済みモデルは、S05で取得された説明変数の入力を受けて、目的変数を予測する。予測したい目的変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの他の1つまたは2つである。
【0094】
S07では、学習済みモデルによる推論結果が表示部2に表示される。これによると、ユーザは、説明変数から予測される目的変数の値を確認することができる。
【0095】
ただし、上記構成では、新たに取得された説明変数に対する1つの推論結果が取得されるに止まるため、ユーザにとって、当該1つの推論結果から、予測された目的変数に対して説明変数がどのように影響しているのかを知ることは容易ではないと考えられる。例えば、取得された1つの推論結果から、1つの説明変数の値を増加(または減少)させた場合において、目的変数の値がどのように変動するのかを予測することは容易ではないと考えられる。
【0096】
そこで、実施の形態1では、推論結果の有用性を高めることを可能とする推論処理について説明する。以下、
図10から
図12を用いて、推論処理の具体的な処理内容を説明する。
【0097】
図10は、実施の形態1に係るデータ処理装置における推論処理(
図4のS05~S07)の処理手順を説明するためのフローチャートである。
【0098】
図10を参照して、S30では、推論処理に使用する学習済みモデルが選択される。表示部2には、UI画面(学習済みモデル選択画面)が表示される。学習済みモデル選択画面は、データベース15に格納される学習済みモデルリスト(
図9)に基づいて生成される。学習済みモデル選択画面には、学習済みモデルリスト(
図9)に含まれる学習済みモデルの識別情報(学習済みモデルIDなど)とともに、学習済みモデルの生成日時、学習済みモデルに関する情報(プロジェクトの名称など)、および学習に用いた教師データを識別するための識別情報などが表示される。
【0099】
学習済みモデル選択画面には、各学習済みモデルに対応して選択用アイコンが表示される。ユーザは、操作部3を用いて選択用アイコンにチェックを入れることによって、任意の学習済みモデルを選択することができる。
【0100】
推論処理に使用する学習済みモデルが選択されることによって、学習済みモデルに入力される説明変数のデータの種別、および、学習済みモデルによって予測される目的変数のデータの種別がそれぞれ決定される。説明変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの1つであり、目的変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの他の1つまたは2つである。あるいは、説明変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの2つであり、目的変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの他の1つである。
【0101】
具体的には、学習済みモデルリスト(
図9)には、各学習済みモデルについて、当該モデルの生成に使用された教師データの識別情報が紐付けられて登録されている。教師データの識別情報には、上述のように、教師データの生成に使用したサンプルの情報(サンプルID、サンプル名など)、説明変数に選択されたデータの種別、および目的変数に選択されたデータの種別が含まれる。したがって、学習済みモデルを選択することによって、学習済みモデルに入力される説明変数のデータの種別、および、学習済みモデルによって予測される目的変数のデータの種別を自動的に決定することができる。
【0102】
次に、S31では、学習済みモデルに入力される説明変数の値が設定される。表示部2には、解析対象となるサンプルを選択するためのUI画面(サンプル選択画面)が表示される。ユーザは、サンプル選択画面を、操作部3を用いて操作することにより、解析対象となるサンプルを選択することができる。
【0103】
このサンプル選択画面は、データベース15に格納されたサンプルリスト(
図6)に基づいて作成することができる。例えば、サンプル選択画面には、データベース15に格納される全てのサンプルについて、サンプル名およびレシピデータなどを含んだリストが表示される。サンプル選択画面にはさらに、各サンプルに対応して選択用アイコンが表示される。ユーザは、操作部3を用いて選択用アイコンにチェックを入れることによって、任意のサンプルを選択することができる。
【0104】
解析対象となるサンプルが選択されると、選択されたサンプルのレシピデータ、物性データ、分析データおよび特徴量に基づいて、学習済みモデルに入力される説明変数の値が設定される。なお、ユーザは、この設定された値を基準値として、操作部3を用いて基準値から増加または減少させる操作を行うことにより、各説明変数を所望の値に調整することができる。
【0105】
次に、S32では、複数の説明変数の中から、「変動値となる説明変数」が選択される。本実施の形態に係る推論処理では、学習済みモデルに入力される複数の説明変数の一部を変動値とし、当該複数の説明変数の残りを固定値とする。なお、当該一部の説明変数の数は、1であっても2以上であってもよい。後述するように、ユーザは、表示部2に表示されるユーザインターフェイス画面を、操作部3を用いて操作することにより、変動値となる説明変数を選択することができる。
【0106】
「変動値となる説明変数」とは、推論処理において、予め定められた変動範囲内で、その値が変動する説明変数である。これに対して、「固定値となる説明変数」とは、推論処理において、その値が固定されている説明変数である。
【0107】
S33では、変動値となる説明変数について、その変動範囲が設定される。後述するように、ユーザは、表示部2に表示されるユーザインターフェイス画面に対して、操作部3を用いて、変動範囲の上限値および下限値を入力することにより、説明変数の変動範囲を設定することができる。なお、説明変数の変動範囲は、データ処理装置1が、データベース15に格納されたサンプルリスト(
図6)に基づいて自動的に設定することもできる。例えば、学習済みモデルの生成に用いた教師データから、変動値となる説明変数に対応するデータを抽出し、抽出したデータのうちの最小値を推奨範囲の下限値に設定し、かつ、最大値を推奨範囲の上限値に設定することができる。
【0108】
S34では、学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。ユーザは、表示部2に表示されるユーザインターフェイス画面(目的変数選択画面)を、操作部3を用いて操作することにより、表示対象となる目的変数を選択することができる。表示対象となる目的変数の数は、1であっても2以上であってもよい。
【0109】
この目的変数選択画面には、S30にて選択された学習済みモデルによって予測される目的変数のデータの種別がリスト表示される。目的変数選択画面にはさらに、各目的変数に対応して選択用アイコンが表示される。ユーザは、操作部3を用いて選択用アイコンにチェックを入れることによって、任意の目的変数を表示対象に選択することができる。
【0110】
次に、S35では、S30にて選択された学習済みモデルに対して、S31~S33にて設定された説明変数を入力することにより、目的変数が予測される。この推論処理では、複数の説明変数のうちの連続的に変動する一部の説明変数の各値に対応して、目的変数が予測される。すなわち、当該一部の説明変数の変動によって、目的変数がどのように変動するのかが予測される。
【0111】
S36では、S35での推論処理により得られた推論結果が表示部2に表示される。表示部2には、S34において表示対象に選択された目的変数について、上記一部の説明変数の変動に対する変動を示すグラフが表示される。
【0112】
次に、
図11および
図12を用いて、表示部2における推論結果の表示例を説明する。
図11は、表示部2における推論結果の第1の表示例を模式的に示す図である。
図11には、学習済みモデルに入力される説明変数として「レシピデータ」が選択され、予測する目的変数として「物性データ」が選択されている場合において、表示部2に表示される推論結果が例示されている。サンプルは三元触媒である。
【0113】
図11の表示例は、推論処理に使用される学習済みモデルの選択、解析対象となるサンプルの選択、および表示対象となる目的変数の選択が実行されることによって生成される。
【0114】
図11に示すように、表示部2には、GUI(Graphical User Interface)70が表示される。GUI70は、学習済みモデルに入力される複数の説明変数のうち、変動値となる説明変数を選択するためのGUIである。具体的には、GUI70は、変動値となる説明変数を選択するためのGUI80、説明変数の変動範囲を設定するためのGUI84、および、当該変動範囲における説明変数の刻み幅を設定するためのGUI86を含む。ユーザは、操作部3を用いてGUI80,84,86を操作することにより、変動値となる説明変数を選択するとともに、当該説明変数の変動範囲および刻み幅を設定することができる。
【0115】
GUI80の右隅には、変動値となる説明変数を選択するためのアイコン82が示されている。ユーザが操作部3を用いてアイコン82をクリックすると、GUI80の下側には、変動値となる説明変数の候補を表示するためのGUI(図示せず)が表示される。当該GUIには、選択された学習済みモデルに紐付けられている複数の説明変数のデータの種別がリスト表示される。ユーザが当該GUIにおいて複数の説明変数の中から変動値となる説明変数を選択すると、GUI80には、選択された説明変数のデータの種別が書き込まれる。
図11の例では、変動値となる説明変数として、「Ptの配合量(g)」が選択されている。
【0116】
GUI84は、変動値となる説明変数について、変動範囲の下限値および上限値を入力可能に構成されている。GUI86は、変動値となる説明変数を連続的に変動させるときの刻み幅を入力可能に構成されている。ユーザは、GUI84において、変動値となる説明変数の変動範囲を設定するとともに、GUI86において、変動値となる説明変数の刻み幅を設定することができる。
図11の例では、「Ptの配合量(g)」の変動範囲の下限値X1_aおよび上限値X1_bと、刻み幅dx1が設定されている。
【0117】
なお、GUI70には、変動値となる説明変数について、変動範囲の推奨範囲を示すためのGUI88を含ませることができる。この推奨範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから、変動値となる説明変数に対応するデータ(例えば、Ptの配合量(g))を抽出し、抽出したデータのうちの最小値X1minを推奨範囲の下限値に設定し、かつ、最大値X1maxを推奨範囲の上限値に設定することができる。これによると、ユーザは、GUI88に示される推奨範囲を参照しながら、GUI84において変動範囲を設定することができる。
【0118】
表示部2にはさらに、学習済みモデルに入力される複数の説明変数のうち、固定値となる説明変数の値を設定するためのGUI74が表示される。GUI74には、固定値となる説明変数のデータの種別および各データの値がテーブル形式で表示される。
図11の例では、GUI74には、学習済みモデルに入力される複数の説明変数のうち、「Ptの配合量(g)」以外の説明変数のデータ(「Pdの配合量(g)」、「攪拌時間(min)」、「焼成温度(℃)」など)の値X2,X3,X4が示されている。値X2,X3,X4は、解析対象となるサンプルのデータに基づいて設定される。
【0119】
上述した手順で複数の説明変数の各々の値が設定された後に、推論の実行を指示するためのGUI72がクリックされると、推論処理が実行される。推論処理では、変動値となる説明変数を所定の刻み幅で連続的に変動させるとともに、学習済みモデルを用いて、当該説明変数の各値に対応する目的変数が予測される。
【0120】
表示部2の表示領域76には、推論結果が表示される。
図11に示すように、表示領域76には、変動値となる説明変数と表示対象となる目的変数との関係を示すグラフ90,92が表示される。なお、
図11の例では、表示対象となる目的変数(物性データ)として、「NOxの浄化率(%)」および「耐熱性能」が選択されている。
【0121】
グラフ90は、変動値となる説明変数(Ptの配合量(g))を横軸とし、表示対象となる目的変数(NOxの浄化率(%))を縦軸とする2次元グラフである。グラフ92は、変動値となる説明変数(Ptの配合量(g))を横軸とし、表示対象となる目的変数(耐熱性能)を縦軸とする2次元グラフである。
【0122】
グラフ90,92の各々は、変動値となる説明変数を、予め定められた変動範囲内で所定の刻み幅で連続的に変動させたときに、目的変数がどのように変動するのかを示している。グラフ90によると、Ptの配合量を増やすに従ってNOxの浄化率が高くなる一方で、Ptの配合量がある値を超えると、Ptの配合量を増やすに従ってNOxの浄化率が低下することが分かる。グラフ92によると、Ptの配合量を増やすに従って耐熱性能が高くなるが、Ptの配合量がある値を超えると耐熱性能が低下することが分かる。さらに、グラフ90,92を比較すると、NOxの浄化率がピークとなるときのPtの配合量と、耐熱性能がピークとなるときのPtの配合量とは異なることが分かる。
【0123】
このように、表示部2に表示された推論結果を参照することにより、ユーザは、1つの説明変数を連続的に変動させた場合に目的変数の値がどのように変動するのかを容易に予測することができる。例えば、グラフ90,92によれば、所望の物性を有する三元触媒の実現に適したPtの配合量を予測することができる。
【0124】
なお、ユーザは、GUI74において固定値となる説明変数の値を変更して、再度推論処理を実行することにより、様々な説明変数に対応したグラフ90,92を取得することができる。また、ユーザは、GUI70において変動値となる説明変数の種別、変動範囲および刻み幅を変更して、再度推論処理を実行することにより、他の説明変数についても、説明変数の連続的な変動に対する目的変数の変動を示すグラフを取得することができる。
【0125】
推論結果を示すデータ(推論処理で得られた生データおよびグラフ90,92のデータ)は、推論処理に使用した学習済みモデルを識別するための識別情報、および学習済みモデルに入力された説明変数に関する情報とともに、データベース15に格納される。さらに、データベース15に格納される推論結果を示すデータは、通信I/F13を経由して、データ処理装置1から外部機器へ出力(エクスポート)することができる。出力形式には、例えば、CSV(Comma-Separated Values)形式、あるいは他のAIソフト、統計解析ソフトなどの関連ソフトで表示可能な形式を用いることができる。
【0126】
図12は、表示部2における推論結果の第2の表示例を模式的に示す図である。
図12には、
図11と同様に、学習済みモデルに入力される説明変数として「レシピデータ」が選択され、予測する目的変数として「物性データ」が選択されている場合に、表示部2に表示される推論結果が例示されている。サンプルは三元触媒である。
図12の表示例は、推論処理に使用される学習済みモデルの選択、解析対象となるサンプルの選択、および表示対象となる目的変数の選択が実行されることによって生成される。
【0127】
図12の表示例では、変動値となる説明変数の数が2つである。表示部2には、変動値となる説明変数を選択するためのGUI70,71が表示される。GUI70,71の構成は、
図11に示すGUI70の構成と同じである。したがって、ユーザは、GUI70,71の各々において、変動値となる説明変数を選択し、選択した説明変数について変動範囲および刻み幅を設定することができる。
【0128】
図12の例では、変動値となる説明変数として、「Ptの配合量(g)」および「攪拌時間(min)」が選択されている。「Ptの配合量(g)」について、変動範囲の下限値X1_aおよび上限値X1_bと、刻み幅dx1とが設定され、「攪拌時間(min)」について、変動範囲の下限値X3_aおよび上限値X3_bと、刻み幅dx3とが設定されている。
【0129】
GUI74には、学習済みモデルに入力される複数の説明変数のうち、「Ptの配合量(g)」および「攪拌時間(min)」以外の説明変数のデータ(「Pdの配合量(g)」、「焼成温度(℃)」など)の値X2,X4が示されている。
【0130】
上述した手順で複数の説明変数の各々の値が設定された後に、推論の実行を指示するためのGUI72がクリックされると、推論処理が実行される。推論処理では、変動値となる2つの説明変数のうちの一方の説明変数を連続的に変動させ、他方の説明変数を固定値(例えば、変動範囲の中央値)とする。そして、学習済みモデルを用いて、一方の説明変数の各値に対応する目的変数が予測される。
図12の例では、複数の説明変数のうちの「Ptの配合量(g)」を可変値とし、残りの説明変数を固定値としたときの推論処理と、複数の説明変数のうちの「攪拌時間(min)」を可変値とし、残りの説明変数を固定値としたときの推論処理とが実行される。
【0131】
表示部2の表示領域76には、推論結果が表示される。表示領域76には、変動値となる説明変数と表示対象となる目的変数との関係を示すグラフ90,94が表示される。なお、
図12の例では、表示対象となる目的変数(物性データ)として、「NOxの浄化率(%)」が選択されている。
【0132】
グラフ90は、変動値となる説明変数(Ptの配合量(g))を横軸とし、表示対象となる目的変数(NOxの浄化率(%))を縦軸とする2次元グラフである。グラフ94は、変動値となる説明変数(攪拌時間(min))を横軸とし、表示対象となる目的変数(NOxの浄化率(%))を縦軸とする2次元グラフである。
【0133】
グラフ90によると、Ptの配合量を増やすに従ってNOxの浄化率が高くなる一方で、Ptの配合量がある値を超えると、Ptの配合量を増やすに従ってNOxの浄化率が低下することが分かる。グラフ94によると、攪拌時間を増やすに従ってNOxの浄化率が高くなるが、攪拌時間がある値を超えるとNOxの浄化率が低下することが分かる。さらに、グラフ90,94を比較することにより、学習済みモデルに入力される複数の説明変数について、1つの目的変数に対する影響度を知ることができる。
【0134】
以上説明したように、実施の形態1に係るデータ処理装置によれば、ユーザは、表示されたデータに基づいて、変動値となる第1の説明変数を連続的に変動させたときに、目的変数がどのように変動するのかを容易に知ることができる。よって、推論結果の有用性を向上させることができる。
【0135】
また、実施の形態1では、第1の説明変数と目的変数との関係を2次元グラフで表現する構成としたことにより、表示された2次元グラフに基づいて、ユーザは、第1の説明変数の変動に対する目的変数の変動を視覚的に容易に予測することが可能となる。
【0136】
なお、
図11および
図12では、1回の推論処理において変動値となる説明変数の数を1とする構成について説明したが、1回の推論処理において変動値となる説明変数の数を2以上とする構成としてもよい。例えば、変動値となる説明変数の数を2とした場合には、当該2つの説明変数の各々を所定の刻み幅で連続的に変動させるとともに、学習済みモデルを用いて、当該2つの説明変数の各値に対応する目的変数が予測される。この場合、推論結果として、上記2つの説明変数のうちの第1の説明変数をX軸とし、第2の説明変数をY軸とし、表示対象となる目的変数をZ軸とする3次元グラフを表示させることができる。
【0137】
また、
図12では、変動値となる説明変数の数が2つである場合に、2つの説明変数にそれぞれ対応して2つのグラフ90,94を表示部2に表示する構成について説明したが、これら2つのグラフを互いに重畳させて表示する構成としてもよい。
図13は、表示部2における推論結果の第3の表示例を模式的に示す図である。
図13の表示例は、
図12の表示例とは、推論結果の表示方法が異なる。
図13の表示例では、表示領域76には、変動値となる2つの説明変数と表示対象となる目的変数との関係を示すグラフ99が表示されている。このグラフ99は、
図12のグラフ90にグラフ94を重畳したものに等しい。このようにすると、ユーザは、単一のグラフ99に基づいて、2つの説明変数が1つの目的変数に与える影響度を相対的に評価することが可能となる。
【0138】
図13では2次元グラフ90,94を重畳する表示例を示しているが、3次元グラフ同士を重畳してもよい。このようにすると、ユーザは、単一のグラフに基づいて、4つの説明変数が1つの目的変数に与える影響度を相対的に評価することが可能となる。
【0139】
[実施の形態2]
図12に示した第2の表示例のように、変動値となる説明変数の数が複数ある場合には、説明変数が目的変数に与える影響度は、説明変数の種別によって異なる。実施の形態2では、変動値となる複数の説明変数の間で目的変数に与える影響度を比較し、影響度の大きい説明変数の種別を保存する構成について説明する。
【0140】
図14は、実施の形態2に係るデータ処理装置における推論処理(
図4のS05~S07)の処理手順を説明するためのフローチャートである。
図14に示すフローチャートは、
図10に示したフローチャートに対して、S37,S38を追加したものである。
【0141】
図14を参照して、
図10と同じS30~S36によって推論処理が実行され、推論処理に得られた推論結果が表示部2に表示されると、S37により、変動値となる複数の説明変数の各々について、説明変数の変動に対する目的変数の変動量が算出される。目的変数の変動量は、説明変数をS32で設定された変動範囲内で連続的に変動させたときの、目的変数の最大値と最小値との差の絶対値に相当する。
【0142】
S38により、S37にて算出された目的変数の変動量に基づいて、目的変数に対する影響度が大きい説明変数が特定される。
【0143】
S38では、ユーザが、表示部2の表示領域76に表示された複数のグラフを比較することによって、目標変数に対する影響度が大きい説明変数を特定する構成としてもよい。あるいは、データ処理装置1が、変動値となる複数の説明変数のうち、目的変数の変動量が最も大きい説明変数を、目的変数に対する影響度が大きい説明変数として特定する構成としてもよい。
【0144】
S38にて特定された、目的変数に対する影響度が大きい説明変数の種別は、対応する目的変数の種別、および、推論処理に使用された学習済みモデルに関する情報と紐付けられてデータベース15に格納される。学習済みモデルに関する情報には、学習済みモデルが適用されるプロジェクトの名称が含まれている。サンプルが三元触媒である場合、プロジェクトの名称は、例えば、「三元触媒の浄化性能向上」、「三元触媒の耐熱性改善」などである。
【0145】
図14のS38にてデータベース15に格納された情報は、学習フェーズで利用することができる。
図15は、実施の形態2に係るデータ処理装置における教師データの生成(
図4のS02)、機械学習(
図4のS03)および学習済みモデルの記憶(
図4のS04)の処理手順を説明するためのフローチャートである。
図15に示すフローチャートは、
図7に示したフローチャートに対して、S200を追加したものである。
【0146】
図15を参照して、
図7と同じS20では、表示部2にUI画面(サンプル選択画面)が表示される。ユーザは、操作部3を用いてサンプル選択画面を操作することにより、教師データの生成に使用するサンプルを選択することができる。サンプルの選択が完了すると、選択サンプル抽出データが生成される。
【0147】
S200により、表示部2には、過去の推論処理において、
図14のS38によりデータベース15に格納された情報が表示される。具体的には、過去の推論処理において使用された学習済みモデルに関する情報(プロジェクトの名称)、ならびに、当該学習済みモデルから予測された目的変数および当該目的変数に対する影響度が大きい説明変数の種別に関する情報が、表示部2に表示される。
【0148】
次に、
図7と同じS21およびS22により、教師データの生成に使用する説明変数および目的変数が選択される。表示部2には、UI画面(説明変数選択画面および目的変数選択画面)が表示される。上述したように、表示部2には、学習済みモデルが適用されるプロジェクトの名称、当該学習済みモデルから予測された目的変数の種別、および当該目的変数に対する影響度が大きい説明変数の種別に関する情報が示されている。したがって、ユーザは、これらの情報を参照しながら、新たに生成する学習済みモデルが適用されるプロジェクトに応じて、教師データを構成する説明変数および目的変数を選択することができる。例えば、ユーザは、プロジェクトが同じである学習済みモデルに紐付けられた目的変数および当該目的変数に対する影響度が大きい説明変数を含むように、目的変数および説明変数を選択することができる。
【0149】
以上説明したように、実施の形態2に係るデータ処理装置によれば、目的変数に対する影響度が大きい説明変数を含んだ教師データを用いて学習済みモデルを生成することができる。これによると、プロジェクトに対する学習済みモデルの有用性を高めることができる。
【0150】
[実施の形態3]
上述した実施の形態1では、推論フェーズにおいて、学習済みモデルに与える複数の説明変数のうちの変動値となる説明変数を、GUI70,71(
図11および
図12参照)に対するユーザ入力に基づいて選択する構成について説明した。
【0151】
上記構成によると、推論結果として、ユーザが選択した説明変数について、説明変数と目的変数との関係を示すグラフを表示部2に表示させることができる。その一方で、複数の説明変数のうちどの説明変数を変動値に選択するかについては、ユーザの経験値やスキルレベルに依存している。そのため、目的変数に与える影響度が大きい説明変数であっても、変動値としてユーザが選択しない限り、当該説明変数と目的変数との関係を示すグラフを表示させることができない。その結果、ユーザが重要な説明変数についての考察を見落としてしまう可能性が懸念される。
【0152】
そこで、実施の形態3では、目的変数に対する影響度の大きい説明変数についての推論結果を表示するための構成について説明する。なお、実施の形態3に係るデータ処理装置の動作は、以下に説明する推論処理を除いて、上述した実施の形態1に係るデータ処理装置の動作と基本的に同じである。
【0153】
(1)第1構成例
図16は、実施の形態3の第1構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。
図16に示すフローチャートは、
図10に示したフローチャートに対して、S32をS320に置き換えるとともに、S350~S352を追加したものである。
【0154】
図16を参照して、
図10と同じS30,S31により、推論処理に使用する学習済みモデルが選択されるとともに、当該学習済みモデルに入力される複数の説明変数の値が設定されると、S320では、複数の説明変数の各々について、その変動範囲が設定される。すなわち、第1構成例は、学習済みモデルに入力する複数の説明変数を全て変動値とする点において、上述した実施の形態とは異なる。
【0155】
各説明変数の変動範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから各説明変数に対応するデータを抽出し、抽出したデータの最小値を変動範囲の下限値に設定し、かつ、当該データの最大値を変動範囲の上限値に設定することができる。
【0156】
図10と同じS34により、学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。ユーザは、表示部2に表示されるユーザインターフェイス画面を、操作部3を用いて操作することにより、表示対象となる目的変数を選択することができる。
【0157】
図10と同じS35では、S30にて選択された学習済みモデルに対して、複数の説明変数が入力されることにより、目的変数が予測される。この推論処理では、複数の説明変数のうちの1つの説明変数を所定の刻み幅で連続的に変動させるとともに、当該説明変数の各値に対応する目的変数が予測される。
【0158】
なお、当該1つの説明変数を変動させるときに、当該説明変数以外の他の説明変数の値は固定値とされる。他の説明変数の値はS31で設定された値に固定される。この値は、解析対象となるサンプルのレシピデータ、物性データ、分析データおよび特徴量に基づいている。
【0159】
1つの説明変数の変動に対する目的変数の変動が予測されると、別の1つの説明変数を変動させて目的変数の変動が予測される。複数の説明変数の全てについて目的変数の変動が予測されると、S35の推論処理は終了する。
【0160】
S35の推論処理が終了すると、複数の説明変数にそれぞれ対応する複数の目的変数の推論結果の中から、推論結果として表示させるグラフが選択される。具体的には、最初に、S350において、複数の説明変数の各々について、説明変数の変動に対する目的変数の変動量が算出される。目的変数の変動量は、説明変数をS320で設定された変動範囲内で連続的に変動させたときの、目的変数の最大値と最小値との差の絶対値に相当する。
【0161】
次に、S351において、S350にて算出された目的変数の変動量に基づいて、表示対象となるグラフが選択される。S351では、複数の推論結果のうち目的変数の変動量が大きいものから順に、説明変数と目的変数との関係を示すグラフが選択される。表示対象に選択するグラフの個数は、ユーザが予め設定しておくことができる。例えば、目的変数の変動量が最も大きいものから数えて所定数のグラフを表示対象とすることができる。あるいは、目的変数の変動量が所定の値以上であるグラフを表示対象とすることができる。
【0162】
S352では、S351にて選択された表示対象となるグラフについて、その表示順序が設定される。具体的には、目的変数の変動量が最も大きいものを1番目とし、目的変数の変動量が大きいものから順に並べるように表示順序が設定される。
【0163】
S36では、S35での推論処理により得られた推論結果が表示部2に表示される。表示部2には、S352にて設定された表示順序に従って、表示対象に選択されたグラフが表示される。
【0164】
図17は、第1構成例における推論結果の表示例を模式的に示す図である。
図17には、
図11に示した表示部2から推論結果を表示する表示領域76が抜き出されて模式的に示されている。
【0165】
図17の例では、表示部2の表示領域76には、変動値となる説明変数と表示対象となる目的変数との関係を示す複数のグラフ94,96,98が表示されている。グラフ94は、説明変数X1を横軸とし、目的変数Y1を縦軸とする2次元グラフである。グラフ96は、説明変数X3を横軸とし、目的変数Y1を縦軸とする2次元グラフである。グラフ98は、説明変数X7を横軸とし、目的変数Y1を縦軸とする2次元グラフである。
【0166】
グラフ94,96,98の各々において、ΔY1は、対応する説明変数を変動範囲内で連続的に変動させたときの目的変数Y1の変動量を示している。グラフ94は変動量ΔY1が最も大きく、グラフ96は変動量ΔY1が2番目に大きい。グラフ98は変動量ΔY1が最も小さい。すなわち、表示領域76には、目的変数Y1の変動量ΔY1の大きいものから順に複数のグラフ94,96,98が並べて表示されている。
【0167】
なお、上述したように、表示領域76に表示させるグラフの個数は、ユーザが予め設定しておくことができる。例えば、表示領域76に表示させるグラフの個数がN個(N≧1)に設定されている場合には、目的変数Y1の変動量ΔY1が大きいものから順に合計N個のグラフが表示領域76に並べて表示される。
【0168】
あるいは、目的変数Y1の変動量ΔY1が所定値以上となるグラフを表示領域76に表示させる構成としてもよい。この場合、目的変数Y1の変動量ΔY1が大きいものから順に、変動量ΔY1が所定値以上となるグラフが表示領域76に並べて表示される。
【0169】
以上説明したように、第1構成例によれば、学習済みモデルに与える複数の説明変数のうち、説明変数の変動に対する目的変数の変動量が大きいものが優先的に選択され、選択された説明変数と目的変数との関係を示すグラフが表示部2に表示される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数が自動的に選択され、当該説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。
【0170】
さらに、表示部2には、説明変数の変動に対する目的変数の変動量が大きいグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。
【0171】
(2)第2構成例
上述した第1構成例では、学習済みモデルに与える複数の説明変数の全てを変動値とするため、説明変数の個数が増えるに従って推論処理にかかる演算量が増大することが懸念される。そこで、第2構成例および後述する第3構成例では、推論処理を実行する前に、変動値となる説明変数をデータ処理装置1が自動的に選択する構成について説明する。
【0172】
図18は、実施の形態3の第2構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。
図18に示すフローチャートは、
図10に示したフローチャートに対して、S32をS321に置き換えるとともに、S353を追加したものである。
【0173】
図18を参照して、
図10と同じS30,S31により、推論処理に使用する学習済みモデルが選択されるとともに、当該学習済みモデルに入力される複数の説明変数の値が設定されると、S321では、データ処理装置1の推論部32は、当該学習済みモデルに入力される各説明変数の重要度(importance)を取得する。
【0174】
各説明変数の重要度は、該当する説明変数がモデルの性能にどれだけ寄与したかを数値化したものである。具体的には、複数の説明変数に決定木アルゴリズムを適用することにより、各説明変数の重要度を算出することができる。なお、決定木アルゴリズムとしては公知の任意のアルゴリズムを採用できるが、例えば、ランダムフォレストなどを用いることができる。
【0175】
推論部32は、各説明変数の重要度に基づいて、変動値となる説明変数を選択する。具体的には、推論部32は、重要度が高い説明変数を、優先的に変動値となる説明変数に選択する。変動値となる説明変数の個数は、ユーザが予め設定しておくことができる。例えば、重要度が最も高いものから数えて所定数の説明変数を変動値とすることができる。あるいは、重要度が所定値以上である説明変数を変動値とすることができる。
【0176】
S321にて変動値となる説明変数が選択されると、S33において、推論部32は、各説明変数の変動範囲を設定する。各説明変数の変動範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから各説明変数に対応するデータを抽出し、抽出したデータの最小値を変動範囲の下限値に設定し、かつ、当該データの最大値を変動範囲の上限値に設定することができる。
【0177】
図10と同じS34により、学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。ユーザは、表示部2に表示されるユーザインターフェイス画面を、操作部3を用いて操作することにより、表示対象となる目的変数を選択することができる。
【0178】
図10と同じS35では、S30にて選択された学習済みモデルに対して、S31およびS321にて設定された説明変数が入力されることにより、目的変数が予測される。この推論処理では、推論部32は、変動値となる説明変数のうちの1つの説明変数を所定の刻み幅で連続的に変動させるとともに、当該説明変数の各値に対応する目的変数を予測する。
【0179】
なお、当該1つの説明変数を変動させるときに、当該説明変数以外の他の説明変数の値は固定値とされる。例えば、他の説明変数の値はS31で設定された値に固定される。この値は、解析対象となるサンプルのレシピデータ、物性データ、分析データおよび特徴量に基づいている。推論部32は、1つの説明変数の変動に対する目的変数の変動が予測されると、別の1つの説明変数を変動させて目的変数の変動を予測する。変動値となる説明変数の全てについて目的変数の変動が予測されると、S35の推論処理は終了する。
【0180】
S35の推論処理が終了すると、S353において、表示データ生成部34は、各説明変数の重要度に基づいて、推論結果として表示させるグラフの表示順序を設定する。具体的には、最も重要度が高い説明変数についての推論結果を示すグラフを1番目とし、説明変数の重要度が高いものから順に並べるようにグラフの表示順序が設定される。
【0181】
S36では、表示データ生成部34は、S35での推論処理により得られた推論結果を表示部2に表示する。表示部2には、S352にて設定された表示順序に従って、表示対象に選択されたグラフが表示される。
【0182】
以上説明したように、第2構成例によれば、学習済みモデルに与える複数の説明変数のうち、学習済みモデルにおける重要度が高い説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが表示部2に表示される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。
【0183】
さらに、表示部2には、目的変数に対する説明変数の影響度が高いグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。
【0184】
(3)第3構成例
図19は、実施の形態3の第3構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。
図19に示すフローチャートは、
図10に示したフローチャートに対して、S32をS322,S323に置き換えるとともに、S354を追加したものである。
【0185】
図19を参照して、
図10と同じS30,S31により、推論処理に使用する学習済みモデルが選択されるとともに、当該学習済みモデルに入力される複数の説明変数の値が設定されると、推論部32は、複数の説明変数の中から変動値となる説明変数を選択する。第3構成例では、複数の説明変数に対して実施された主成分分析を利用して、変動値となる説明変数が選択される。
【0186】
主成分分析は、一般的に、大量のデータに対する前処理として、データの次元数を減らすために実施される。主成分分析を実施することにより、複数の説明変数は、より少数の合成変数(主成分)に集約される。主成分分析の結果は、元の説明変数に対応した変換後の値である主成分得点と、各主成分得点に対する説明変数の重みに相当する主成分負荷量として得られる。
【0187】
S322では、主成分分析により得られた所定数の主成分の中から、1つの主成分が選択される。例えば、推論部32は、ユーザ入力に従って1つの主成分を選択することができる。この場合、ユーザは、各主成分の寄与率に基づいて1つの主成分を選択することができる。なお、主成分の寄与率は、各主成分の固有値をその総和で割ったものであり、各主成分が全体の中でどれだけの変動の割合を占めるかを示している。なお、推論部32は、ユーザ入力に依らず、寄与率が最も高い第1主成分を選択する構成としてもよい。
【0188】
S323では、推論部32は、S322により選択された1つの主成分における各説明変数の重み(主成分負荷量)に基づいて、変動値となる説明変数を選択する。
【0189】
具体的には、第i番目の主成分zは、元のp個の変数X1,X2,・・・Xpに重みw(主成分負荷量)を掛けて合成したものであり、次式で表すことができる。なお、p個のwj(j=1,2,・・・p)の二乗和は1である。
【0190】
z=w1X1+w2X2+・・・+wpXp
上記式において、重みw(主成分負荷量)の絶対値が大きいほど、対応する説明変数Xは主成分zへの貢献度が高い、すなわち、主成分を特徴づける説明変数であると言える。そこで、S323では、推論部32は、重み(主成分負荷量)が大きい説明変数を、優先的に変動値となる説明変数に選択する。
【0191】
なお、変動値となる説明変数の個数は、ユーザが予め設定しておくことができる。例えば、重み(主成分負荷量)が最も高いものから数えて所定数の説明変数を変動値とすることができる。あるいは、重み(主成分負荷量)が所定値以上である説明変数を変動値とすることができる。
【0192】
S323にて変動値となる説明変数が選択されると、S33において、推論部32は、各説明変数の変動範囲を設定する。各説明変数の変動範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから各説明変数に対応するデータを抽出し、抽出したデータの最小値を変動範囲の下限値に設定し、かつ、当該データの最大値を変動範囲の上限値に設定することができる。
【0193】
図10と同じS34により、学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。ユーザは、表示部2に表示されるユーザインターフェイス画面を、操作部3を用いて操作することにより、表示対象となる目的変数を選択することができる。
【0194】
図10と同じS35では、推論部32は、S30にて選択された学習済みモデルに対して、S31およびS321にて設定された説明変数を入力することにより、目的変数を予測する。この推論処理では、変動値となる説明変数のうちの1つの説明変数を所定の刻み幅で連続的に変動させるとともに、当該説明変数の各値に対応する目的変数が予測される。なお、当該1つの説明変数を変動させるときに、当該説明変数以外の他の説明変数の値は固定値とされる。例えば、他の説明変数の値はS31で設定された値に固定される。推論部32は、1つの説明変数の変動に対する目的変数の変動が予測されると、別の1つの説明変数を変動させて目的変数の変動を予測する。変動値となる説明変数の全てについて目的変数の変動が予測されると、S35の推論処理は終了する。
【0195】
S35の推論処理が終了すると、S353により、表示データ生成部34は、各説明変数の重み(主成分負荷量)に基づいて、推論結果として表示させるグラフの表示順序を設定する。具体的には、最も重み(主成分負荷量)が高い説明変数についての推論結果を示すグラフを1番目とし、説明変数の重み(主成分負荷量)が高いものから順に並べるようにグラフの表示順序が設定される。
【0196】
S36では、表示データ生成部34は、S35での推論処理により得られた推論結果を表示部2に表示する。表示部2には、S354にて設定された表示順序に従って、表示対象に選択されたグラフが表示される。
【0197】
以上説明したように、第3構成例によれば、学習済みモデルに与える複数の説明変数のうち、特定の主成分に対する重み(主成分負荷量)が大きい説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが表示部2に表示される。これによると、ユーザの経験値やスキルレベルに依らず、主成分への貢献度が高い説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。
【0198】
さらに、表示部2には、説明変数の主成分負荷量が大きいグラフから順に表示されるため、主成分への貢献度が高い説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。
【0199】
[実施の形態4]
学習フェーズでは、生成された教師データの説明変数を学習モデルの入力とし、教師データの目的変数を当該学習モデルの出力の正解データとする教師あり学習が行われる。実施の形態4では、学習モデルをユーザが選択することができる構成について説明する。なお、実施の形態4に係るデータ処理装置の動作は、以下に説明する学習処理を除いて、上述した実施の形態1に係るデータ処理装置の動作と基本的に同じである。
【0200】
図20は、実施の形態4に係るデータ処理装置における教師データの生成(
図4のS02)、機械学習(
図4のS03)および学習済みモデルの記憶(
図4のS04)の処理手順を説明するためのフローチャートである。
図20に示すフローチャートは、
図7に示したフローチャートに対して、S230を追加したものである。
【0201】
図20を参照して、
図7と同じS20~S23により教師データが生成されると、S230により、機械学習に使用する学習モデルが選択される。表示部2には、UI画面(モデル選択画面)が表示される。モデル選択画面は、ユーザが、学習モデルを選択するためのUI画面である。モデル選択画面には、複数の学習モデルがリスト表示される。複数の学習モデルは、例えば多項式回帰モデルであって、多項式の次数が互いに異なっている。加えて、ユーザは項同士の交互作用項や、対数、指数の項を追加することができる。
【0202】
機械学習では、多項式の次数を大きくしたり、交互作用項、対数、指数を含めることでモデルを複雑にするに従って、学習用データに対する精度が高められる反面、未知のデータに対する精度が下がってしまう「過学習」となる場合がある。
【0203】
実施の形態4では、学習モデルを複雑にすることで、教師データを構成する説明変数と目的変数との複雑な関係を表現することができる。一方、学習モデルを単純にすることで、上述した過学習を回避することができる。
図20のS230では、ユーザは、これらのメリットおよびデメリットを比較考量したうえで学習モデルの次数を選択することができるため、最適な機械学習を実施することが可能となる。
【0204】
[実施の形態5]
上述した実施の形態1では、データベース15に格納されたデータに基づいて、サンプルリスト(
図6)が生成される(
図4のS01および
図5)。このとき、サンプルの分析データを専用のデータ解析ソフトウェアを用いて解析することによって、サンプルの特徴量が抽出される(
図5のS13)。特徴量は、GC-MSにて取得されたクロマトグラムを解析して得られた所定の質量数に対するピーク面積、NMRにて取得されたNMRスペクトルを解析して得られた所定の物質の存在比、SEMにて取得されたSEM画像を解析して得られた、三元触媒中に存在する粒子の粒子径、平均粒子径、および、TEMにて取得されたTEM画像を解析して得られた、三元触媒中に存在する粒子の粒子径などを含む。
【0205】
これらの特徴量を抽出する処理では、分析データを処理する条件を変更することによって、あるいは、特徴量を算出する条件を変更することによって、同じサンプルの分析データであっても、抽出される特徴量が異なる値となる場合がある。この場合、サンプルリストから生成される教師データが、分析データの処理条件・特徴量の算出条件によって異なるものとなるため、教師データから生成される学習済みモデルも、分析データの処理条件・特徴量の算出条件によって異なるものとなる。学習済みモデルが異なれば、推論処理において、学習済みモデルに与えられる説明変数が同じであっても、予測される目的変数が異なるものとなり得る。そのため、推論結果から導かれる、説明変数が目的変数に与える影響度も、学習済みモデルの違いによって異なる結果となり得る。
【0206】
実施の形態5では、説明変数が目的変数に与える影響度を考察するのに適当なデータの処理条件を取得するための構成について説明する。以下では、学習フェーズおよび推論フェーズの各々において実施の形態5に係るデータ処理装置が行う処理を説明する。
【0207】
<学習フェーズ>
図21は、サンプルリストの構成例を示す図である。
図21には、サンプルが三元触媒である場合のサンプルリストの構成例が示されている。
図21に示すサンプルリストは、
図6に示したサンプルリストとは、サンプルの分析データを複数の処理条件で処理することによってそれぞれ抽出された複数の特徴量を含んでいる点が異なる。
【0208】
図21の例では、特徴量は、GC-MSにて取得されたクロマトグラムを解析して得られた、第1の質量数に対するピーク面積1および第2の質量数に対するピーク面積2を含んでいる。
【0209】
ピーク面積1は、データの処理条件(ピーク面積の算出方法)が互いに異なる3つの値Pa,Pb,Pcから構成されている。Paは処理条件Aを用いて算出されたピーク面積1であり、Pbは処理条件Bを用いて算出されたピーク面積1であり、Pcは処理条件Cを用いて算出されたピーク面積1である。ピーク面積2は、データの処理条件(ピーク面積の算出方法)が互いに異なる3つの値Qa,Qb,Qcから構成されている。Qaは処理条件Aを用いて算出されたピーク面積2であり、Qbは処理条件Bを用いて算出されたピーク面積2であり、Qcは処理条件Cを用いて算出されたピーク面積2である。
【0210】
教師データを生成する処理(
図4のS02)では、教師データの生成に使用するサンプルが選択されると(
図7のS20)、
図21に示すサンプルリストから、選択されたサンプルの行に含まれるデータが抽出されて選択サンプル抽出テーブルが生成される。
図22は、選択サンプル抽出テーブルの構成例を示す図である。
図22には、3種類の選択サンプル抽出テーブルが示されている。
【0211】
選択サンプル抽出テーブルAは、処理条件Aを用いて得られた特徴量であるピーク面積1およびピーク面積2を含んで構成されている。選択サンプル抽出テーブルBは、処理条件Bを用いて得られた特徴量であるピーク面積1およびピーク面積2を含んで構成されている。選択サンプル抽出テーブルCは、処理条件Cを用いて得られた特徴量であるピーク面積1およびピーク面積2を含んで構成されている。
【0212】
すなわち、選択サンプル抽出テーブルA~Cは、同じサンプルの分析データから生成されたものであるが、当該分析データから特徴量を抽出するためのデータ処理条件が互いに異なっている。その結果、選択サンプル抽出テーブルA~Cは、データの種別が同じであるが、データの値が互いに異なるものとなっている。
【0213】
教師データの生成に使用する説明変数および目的変数が選択されると(
図7のS21,S22)、選択サンプル抽出テーブルA~Cの各々から、説明変数に合致するデータおよび目的変数に合致するデータが抽出されて、3種類の教師データテーブルが生成される。3種類の教師データテーブルの各々には、サンプルごとに、説明変数に合致するデータ、および目的変数に合致するデータが入力される。そして、この生成された3種類の教師データテーブルに基づいて、教師データA~Cが生成される。
【0214】
教師データA~Cを用いて教師有り学習が行われることにより、3種類の学習済みモデルが生成される。学習済みモデルMODEL1aは、教師データAを用いた機械学習により生成された学習済みモデルである。学習済みモデルMODEL1bは、教師データBを用いた機械学習により生成された学習済みモデルである。学習済みモデルMODEL1cは、教師データCを用いた機械学習により生成された学習済みモデルである。
【0215】
生成された学習済みモデルMODEL1a,MODEL1b,MODEL1cは、データベース15に格納されている学習済みモデルリストに登録される。
図23は、学習済みモデルリストの構成例を示す図である。
図23に示す学習済みモデルリストは、
図9に示した学習済みモデルリストとは、教師データを識別するための識別情報に、分析データから特徴量を抽出するために使用したデータ処理条件が含まれている点が異なる。
【0216】
学習済みモデルMODEL1a,MODEL1b,MODEL1cは、学習済みモデルが適用されるプロジェクトの名称、教師データの生成に使用したサンプル情報、説明変数および目的変数に選択されたデータの種別が互いに共通している。その一方で、当該データを生成するために使用された、分析データの処理条件(例えば、クロマトグラムのピーク面積の算出方法)が互いに異なっている。
【0217】
<推論フェーズ>
図24は、実施の形態5に係るデータ処理装置における推論処理(
図4のS05~S07)の処理手順を説明するためのフローチャートである。
図24に示すフローチャートは、
図10に示したフローチャートにおけるS30をS300に置き換えるとともに、S36をS360~S362に置き換えたものである。
【0218】
図24を参照して、S300では、推論処理に使用する複数の学習済みモデルが選択される。表示部2には、データベース15に格納される学習済みモデルリスト(
図23)に基づいた生成されたUI画面(学習済みモデル選択画面)が表示される。ユーザは、操作部3を用いてUI画面を操作することにより、分析データの処理条件のみが互いにことなる複数の学習済みモデルを選択することができる。以下では、学習済みモデルMODEL1a,MODEL1b,MODEL1cが選択された場合を想定する。
【0219】
図10と同じS31では、各学習済みモデルに入力される説明変数の値が設定される。S32では、複数の説明変数の中から、「変動値となる説明変数」が選択される。S33では、変動値となる説明変数について、その変動範囲が設定される。S34では、各学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。
【0220】
図10と同じS35では、S300にて選択された複数の学習済みモデルの各々に対して、S31~S33にて設定された説明変数を入力することにより、目的変数が予測される。この推論処理では、学習済みモデルごとに、複数の説明変数のうちの連続的に変動する一部の説明変数の各値に対応して、目的変数がどのように変動するのかが予測される。
【0221】
S360では、S35での推論処理により得られた複数の推論結果が表示部2に表示される。表示部2には、複数の学習済みモデルにそれぞれ対応して、表示対象に選択された目的変数について、一部の説明変数の変動に対する変動を示すグラフが表示される。
【0222】
図25は、表示部2における複数の推論結果の表示例を模式的に示す図である。
図25には、表示部2のうち推論結果を表示する表示領域76が抽出して示されている。
【0223】
表示領域76には、学習済みモデルMODEL1aを用いた推論処理の推論結果が表示される表示領域76A、学習済みモデルMODEL1bを用いた推論処理の推論結果が表示される表示領域76B、および学習済みモデルMODEL1cを用いた推論処理の推論結果が表示される表示領域76Cが設けられている。
【0224】
表示領域76A,76B,76Cの各々には、変動値となる説明変数と表示対象となる目的変数との関係を示すグラフ90,92が表示される。
図25の例では、変動値となる説明変数として「ピーク面積1」が選択され、表示対象となる目的変数として「NOxの浄化率(%)」および「耐熱性能」が選択されている。グラフ90,92は、ピーク面積1を予め定められた変動範囲内で連続的に変動させたときに、NOxの浄化率(%)および耐熱性能がどのように変動するのかを示している。
【0225】
表示領域76A,76B,76Cの間でグラフ90を比較すると、学習済みモデルの違いから、解析対象のサンプルが同じであっても、説明変数が目的変数に与える影響度の大きさに違いが生じていることが分かる。グラフ92においても同様のことがいえる。
【0226】
ユーザは、これら3つの表示領域76A,76B,76Cに表示されたグラフ90,92を比較することにより、説明変数と目的変数との関係を考察するうえで適当と思われる学習済みモデルを選択することができる。
【0227】
図25では、3つの表示領域76A,76B,76Cが並んで表示される例を示したが、1つの表示領域のみが表示されてる状態でユーザの操作に応じて表示領域76A,76B,76Cを切り替えて表示する構成としてもよい。
【0228】
図24に戻って、S361では、適当な学習済みモデルがユーザによって選択される。例えば、表示部2には、適当な学習済みモデルを選択するためのUI画面が表示される。ユーザは、操作部3を用いてUI画面を操作することにより、適当な学習済みモデルを選択することができる。S362では、ユーザにより選択された、適当な学習済みモデルに関する情報がデータベース15に保存される。適当な学習済みモデルに関する情報には、当該学習済みモデルが適用されるプロジェクトの名称、教師データの生成に使用したサンプル情報、説明変数および目的変数に選択されたデータの種別、および、当該データを抽出するために使用された、分析データの処理条件が含まれている。
【0229】
このように推論結果に基づいて選択された、適当な学習済みモデルに関する情報をデータベース15に保存しておくことにより、将来、今回の推論処理において解析対象となったサンプルと類似するサンプルを用いて学習済みモデルを生成する場面において、適当な学習済みモデルの生成に使用されたデータ処理条件をデータベース15から読み出して、ユーザに提示することが可能となる。なお、サンプルが類似しているとは、サンプルのレシピデータ、物性データおよび分析データの少なくとも1つが同じまたは近似していることを意味する。
【0230】
図26は、サンプルリストの生成(
図4のS01)の処理手順を説明するためのフローチャートである。
図26に示すフローチャートは、
図5に示したフローチャートにS120,S121を追加したものである。
【0231】
図5と同じS10~S12によりサンプル情報、サンプルの物性データ、およびサンプルの分析データが取得されると、S120では、これらのデータを参照することにより、今回のサンプルと類似するサンプルにおける分析データの処理条件がデータベース15から読み出されて表示部2に表示される。データベース15から読み出された分析データの処理条件は、過去にユーザが、説明変数と目的変数との関係を考察するのに適当と判断した学習済みモデルに関する情報に含まれている。
【0232】
S121では、操作部3を介して、S12で取得された分析データの処理条件が設定される。
図5と同じS13では、S12にて取得された分析データを、S121にて設定された処理条件を用いて処理することにより、サンプルの特徴量が抽出される。S14では、取得されたサンプル情報、サンプルの物性データ、ならびにサンプルの分析データおよび特徴量がサンプルリスト(
図6)に入力される。S15では、サンプルリストは、サンプルリストの識別情報が付与されてデータベース15に登録される。
【0233】
このように学習フェーズでは、説明変数と目的変数との関係を考察するうえで適当と判断されたデータ処理条件を用いて、サンプルの分析データから特徴量が抽出されてサンプルリストが生成される。そして、このサンプルリストに基づいて生成された教師データを使用して学習済みモデルが生成される。このようにすると、推論フェーズにおいて、当該学習済みモデルに与えられる説明変数と、当該学習済みモデルから予測される目的変数との関係は、ユーザが適当と判断したものに従ったものになる。したがって、推論結果の有用性を高めることが可能となる。
【0234】
[その他の構成例]
(1)上述した実施の形態では、推論処理が実行される際にユーザの操作を受け付けるためのUI画面、および推論結果(
図11および
図12参照)をデータ処理装置1に接続される表示部2に表示させる構成例について説明したが、表示部2に代えて、例えば、デスクトップ型のパーソナルコンピュータ(PC)、ノート型PC、および携帯端末(タブレット端末、スマートフォン)などの情報端末をデータ処理装置1に接続し、当該情報端末にUI画面および推論結果を表示させる構成としてもよい。
【0235】
(2)上述した実施の形態では、推論処理に使用する学習済みモデルを選択することによって、学習済みモデルに入力される説明変数のデータの種別、および、学習済みモデルによって予測される目的変数のデータの種別が自動的に決定される構成例について説明したが、学習済みモデルに入力される説明変数のデータの種別、および、予測したい目的変数のデータの種別を選択することによって、推論処理に使用する学習済みモデルが自動的に決定される構成とすることも可能である。この場合、ユーザは、表示部2に表示されるUI画面(目的変数選択画面および説明変数選択画面)上の選択用アイコンに操作部3を用いてチェックを入れることによって、説明変数のデータ種別および目的変数のデータの種別を選択することができる。推論部32は、データベース15に格納される学習済みリスト(
図9)を参照し、選択された説明変数のデータ種別および目的変数のデータの種別を含む教師データに紐付けられた学習済みモデルを、推定処理に使用する学習済みモデルに決定することができる。
【0236】
(3)上述した実施の形態では、データ処理装置1が学習部30および推論部32を備える構成を例示したが(
図3参照)、学習部30および推論部32をそれぞれ別体として設ける構成としてもよい。
【0237】
[態様]
上述した複数の例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。
【0238】
(第1項)一態様に係るデータ処理装置は、学習済みモデルを用いて、複数の説明変数から目的変数を予測する推論部と、推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備える。推論部は、複数の説明変数の中から選択された第1の説明変数を変動値とする一方で、第1の説明変数以外の第2の説明変数を固定値とする。推論部は、学習済みモデルを用いて、第1の説明変数を予め定められた変動範囲内で連続的に変動させたときの目的変数を予測する。表示データ生成部は、第1の説明変数の変動に対する目的変数の変動を示すデータを生成する。
【0239】
第1項に記載のデータ処理装置によれば、ユーザは、表示されたデータに基づいて、変動値となる第1の説明変数を連続的に変動させたときに、目的変数がどのように変動するのかを容易に予測することができる。よって、推論結果の有用性を高めることができる。
【0240】
(第2項)第1項に記載のデータ処理装置において、表示データ生成部は、第1の説明変数を第1軸とし、目的変数を第2軸とする2次元グラフを生成する。
【0241】
第2項に記載のデータ処理装置によれば、ユーザは、表示された2次元グラフに基づいて、第1の説明変数の変動に対する目的変数の変動を視覚的に容易に予測することができる。
【0242】
(第3項)第1項または第2項に記載のデータ処理装置において、推論部は、複数の説明変数の中から2以上の第1の説明変数を選択する。推論部は、選択された2以上の第1の説明変数の各々について、学習済みモデルを用いて、第1の説明変数を変動範囲内で連続的に変化させたときの目的変数を予測する。データ処理装置には表示部が接続されている。表示データ生成部は、2以上の第1の説明変数にそれぞれ対応して2以上の2次元グラフを生成する。表示データ生成部は、生成した2以上の2次元グラフが互いに重畳するように表示部に表示する。
【0243】
第3項に記載のデータ処理装置によれば、表示部に重畳表示された2以上の2次元グラフに基づいて、2以上の第1の説明変数の各々が目的変数に与える影響度を相対的に評価することが可能となる。
【0244】
(第4項)第1項から第3項に記載のデータ処理装置において、表示データ生成部は、第1の説明変数の選択および変動範囲の設定のための第1のユーザインターフェイスを提供するように構成される。第1のユーザインターフェイスは、変動範囲の推奨範囲に関する情報を含む。
【0245】
第4項に記載のデータ処理装置によれば、推論処理におけるユーザの利便性を向上させることができる。
【0246】
(第5項)第4項に記載のデータ処理装置において、学習済みモデルは、複数の説明変数を入力とし、目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルである。推奨範囲は、教師データに含まれる第1の説明変数の値に基づいて設定される。
【0247】
第5項に記載のデータ処理装置によれば、推論結果の精度が保証された推奨範囲をユーザに提供することができる。
【0248】
(第6項)第4項または第5項に記載のデータ処理装置において、表示データ生成部はさらに、第2の説明変数の値を設定するための第2のユーザインターフェイスを提供する。第6項に記載のデータ処理装置によれば、推論処理におけるユーザの利便性を向上させることができる。
【0249】
(第7項)第1項から第6項に記載のデータ処理装置において、学習済みモデルは、複数の説明変数を入力とし、目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルである。推論部は、学習済みモデルにおける各説明変数の重要度に基づいて、複数の説明変数の中から少なくとも1つの第1の説明変数を選択する。推論部は、選択された少なくとも1つの第1の説明変数の各々について、学習済みモデルを用いて、第1の説明変数を変動範囲内で連続的に変動させたときの目的変数を予測する。
【0250】
第7項に記載のデータ処理装置によれば、学習済みモデルに与える複数の説明変数のうち、学習済みモデルにおける重要度が高い説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが生成される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数の変動に対する目的変数の変動の推論結果が得られる。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。
【0251】
(第8項)第7項に記載のデータ処理装置において、変動範囲は、教師データに含まれる第1の説明変数の値に基づいて設定される。第8項に記載のデータ処理装置によれば、推論結果の精度が保証された変動範囲を設定することができる。
【0252】
(第9項)第7項または第8項に記載のデータ処理装置において、データ処理装置には表示部が接続されている。表示データ生成部は、少なくとも1つの第1の説明変数にそれぞれ対応して少なくとも1つのデータを生成する。表示データ生成部は、生成した少なくとも1つのデータを、対応する第1の説明変数の重要度が高いものから順に表示部に表示する。
【0253】
第9項に記載のデータ処理装置によれば、表示部には、目的変数に対する説明変数の影響度が高いグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。
【0254】
(第10項)第1項から第6項に記載のデータ処理装置において、推論部は、複数の説明変数の主成分分析により求められた特定の主成分に対する各説明変数の主成分負荷量の絶対値に基づいて、複数の説明変数の中から少なくとも1つの第1の説明変数を選択する。推論部は、選択された少なくとも1つの第1の説明変数の各々について、学習済みモデルを用いて、第1の説明変数を前記変動範囲内で連続的に変動させたときの目的変数を予測する。
【0255】
第10項に記載のデータ処理装置によれば、学習済みモデルに与える複数の説明変数のうち、特定の主成分に対する重み(主成分負荷量)が大きい説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが生成される。これによると、ユーザの経験値やスキルレベルに依らず、主成分への貢献度が高い説明変数の変動に対する目的変数の変動の推論結果が得られる。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。
【0256】
(第11項)第10項に記載のデータ処理装置において、学習済みモデルは、複数の説明変数を入力とし、目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルである。変動範囲は、教師データに含まれる第1の説明変数の値に基づいて設定される。
【0257】
第11項に記載のデータ処理装置によれば、推論結果の精度が保証された変動範囲を設定することができる。
【0258】
(第12項)第10項または第11項に記載のデータ処理装置において、データ処理装置には表示部が接続されている。表示データ生成部は、少なくとも1つの第1の説明変数にそれぞれ対応して少なくとも1つのデータを生成する。表示データ生成部は、生成した少なくとも1つのデータを、対応する第1の説明変数の主成分負荷量が高いものから順に表示部に表示する。
【0259】
第12項に記載のデータ処理装置によれば、表示部には、説明変数の主成分負荷量が大きいグラフから順に表示されるため、主成分への貢献度が高い説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。
【0260】
(第13項)第1項から第6項に記載のデータ処理装置において、データ処理装置には表示部が接続されている。推論部は、複数の説明変数の各々を順番に第1の説明変数に選択する。推論部は、選択された各説明変数について、学習済みモデルを用いて、第1の説明変数を変動範囲内で連続的に変動させたときの目的変数を予測する。表示データ生成部は、複数の説明変数にそれぞれ対応して複数のデータを生成する。表示データ生成部は、生成した複数のデータを、目的変数の変動量が大きいものから順に表示部に表示する。
【0261】
第13項に記載のデータ処理装置によれば、学習済みモデルに与える複数の説明変数のうち、説明変数の変動に対する目的変数の変動量が大きいものが優先的に選択され、選択された説明変数と目的変数との関係を示すグラフが生成される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数が自動的に選択され、当該説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。さらに、表示部には、説明変数の変動に対する目的変数の変動量が大きいグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。
【0262】
(第14項)第1項から第13項に記載のデータ処理装置において、推論部は、複数の説明変数の中から2以上の第1の説明変数を選択する。推論部は、選択された2以上の第1の説明変数の各々について、学習済みモデルを用いて、第1の説明変数を変動範囲内で連続的に変化させたときの目的変数を予測する。表示データ生成部は、2以上の第1の説明変数にそれぞれ対応して2以上のデータを生成する。データ処理装置は、2以上の第1の説明変数のうち、目的変数に対する影響度が最も大きい第1の説明変数の種別を、学習済みモデルが適用されるプロジェクトに関する情報と紐付けて記憶するためのデータベースをさらに備える。
【0263】
第14項に記載のデータ処理装置によれば、次回、学習モデルを学習させるとき、データベースに記憶された情報を参照しながら、教師データを入力する学習モデルが適用されるプロジェクトに応じて、説明変数および目的変数を選択することができる。
【0264】
(第15項)第14項に記載のデータ処理装置は、複数の説明変数を入力とし、目的変数を正解出力とする教師データを生成する教師データ生成部と、教師データを用いた機械学習によって、学習済みモデルを生成する学習部とをさらに備える。教師データ生成部は、プロジェクトおよび当該プロジェクトに紐付けられた第1の説明変数の種別を、ユーザに提示する。
【0265】
第15項に記載のデータ処理装置によれば、ユーザは、教師データを入力する学習モデルが適用されるプロジェクトに応じて、説明変数および目的変数を選択することができる。例えば、ユーザは、プロジェクトが同じである学習済みモデルの目的変数および当該目的変数に対する影響度が大きい説明変数を、目的変数および説明変数にそれぞれ選択することができる。これによると、目的変数に対する影響度が大きい説明変数を教師データとして学習済みモデルが生成されるため、プロジェクトに対する学習済みモデルの有用性を高めることができる。
【0266】
(第16項)第1項から第13項に記載のデータ処理装置は、複数の説明変数を入力とし、目的変数を正解出力とする教師データを生成する教師データ生成部と、教師データを用いた機械学習によって、学習済みモデルを生成する学習部と、学習済みモデルを、教師データと紐付けて記憶するためのデータベースとをさらに備える。
【0267】
第16項に記載のデータ処理装置によれば、学習モデルの機械学習と、学習済みモデルを用いた推論とを1台の装置で実行することができる。
【0268】
(第17項)第16項に記載のデータ処理装置において、教師データ生成部は、1つのデータ群から互いに異なる複数のデータ処理条件を用いて抽出された複数の特徴量をそれぞれ含むように、複数の教師データを生成する。学習部は、機械学習によって、複数の教師データにそれぞれ対応する複数の学習済みモデルを生成する。学習部は、生成した複数の学習済みモデルの各々を、対応するデータ処理条件と紐付けてデータベースに記憶する。
【0269】
第17項に記載のデータ処理装置によれば、1つのデータ群から、データ処理条件が互いに異なる複数の教師データが生成され、この複数の教師データを使用して複数の学習済みモデルがそれぞれ生成される。この複数の学習済みモデルに共通の説明変数を与えて推論を行うことにより、データ処理条件と、説明変数が目的変数に与える影響度との関係を知ることができる。
【0270】
(第18項)第17項に記載のデータ処理装置において、推論部は、複数の学習済みモデルの各々を用いて、第1の説明変数を変動範囲内で連続的に変動させたときの目的変数を予測する。表示データ生成部は、複数の学習済みモデルにそれぞれ対応して、第1の説明変数の変動に対する目的変数の変動を示す複数のデータを生成する。
【0271】
第18項に記載のデータ処理装置によれば、ユーザは、生成された複数のデータを比較することにより、第1の説明変数と目的変数との関係を考察するうえで適当と思われる学習済みモデル(すなわち、適当なデータ処理条件)を選択することができる。
【0272】
(第19項)第18項に記載のデータ処理装置において、複数のデータの中から1つのデータがユーザにより選択された場合には、表示データ生成部は、選択されたデータに対応する学習済みモデルを、適当な学習済みモデルとしてデータベースに記憶する。教師データ生成部は、上記1つのデータ群に類似するデータ群から特徴量が抽出される場合には、適当な学習済みモデルに紐付けられたデータ処理条件をユーザに提示する。
【0273】
第19項に記載のデータ処理装置によれば、学習フェーズにおいて、第1の説明変数と目的変数との関係を考察するうえで適当と判断されたデータ処理条件を用いて、サンプルの分析データから特徴量が抽出されてサンプルリストを生成することができる。このサンプルリストに基づいて生成された教師データを使用して学習済みモデルが生成されることにより、推論フェーズにおいて、当該学習済みモデルに与えられる第1の説明変数と、当該学習済みモデルから予測される目的変数との関係は、ユーザが適当と判断したものに従ったものになる。したがって、推論結果の有用性を高めることが可能となる。
【0274】
(第20項)一態様に係る推論方法は、学習済みモデルを用いて、複数の説明変数から目的変数を予測する。推論方法は、複数の説明変数の中から選択された第1の説明変数を変動値とする一方で、第1の説明変数以外の第2の説明変数を固定値とし、かつ、学習済みモデルを用いて、第1の説明変数を予め定められた変動範囲内で連続的に変動させたときの目的変数を予測するステップと、第1の説明変数の変動に対する目的変数の変動を示すデータを生成するステップと、生成するステップにより生成されたデータを表示するステップとを備える。
【0275】
第20項に記載の推論方法によれば、ユーザは、表示されたデータに基づいて、変動値となる第1の説明変数を連続的に変動させたときに、目的変数がどのように変動するのかを容易に予測することができる。よって、推論結果の有用性を高めることができる。
【0276】
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
【符号の説明】
【0277】
1 データ処理装置、2,64 表示部、3,63 操作部、4 分析装置、5 装置本体、6 情報処理装置、11,61 ROM、12,62 RAM、13,66 通信I/F、15 データベース、20 分析データ取得部、22 特徴量抽出部、24 物性データ取得部、26 サンプル情報取得部、28 教師データ生成部、30 学習部、32 推論部、34 表示データ静止絵部、67 データ取得部、69 情報取得部、76,76A~76C 表示領域、82 アイコン、90,92,94,96,98,99 グラフ、100 解析システム。