特開2023-8857 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社島津製作所の特許一覧

特開2023-8857データ処理装置および推論方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023008857

(43)【公開日】2023-01-19

(54)【発明の名称】データ処理装置および推論方法

(51)【国際特許分類】

G06N 20/00 20190101AFI20230112BHJP

【ＦＩ】

G06N20/00

【審査請求】未請求

【請求項の数】20

【出願形態】ＯＬ

(21)【出願番号】P 2022100940

(22)【出願日】2022-06-23

(31)【優先権主張番号】P 2021111527

(32)【優先日】2021-07-05

(33)【優先権主張国・地域又は機関】JP

(71)【出願人】

【識別番号】000001993

【氏名又は名称】株式会社島津製作所

(74)【代理人】

【識別番号】110001195

【氏名又は名称】弁理士法人深見特許事務所

(72)【発明者】

【氏名】中木村有里子

(72)【発明者】

【氏名】永井詩織

(72)【発明者】

【氏名】川瀬智裕

(72)【発明者】

【氏名】横井祐介

(72)【発明者】

【氏名】山本聡

(72)【発明者】

【氏名】足立健太

(57)【要約】

【課題】複数の説明変数の入力を受けて学習済みモデルから出力される推論結果の有用性を高める。
【解決手段】一態様に係るデータ処理装置は、学習済みモデルを用いて、複数の説明変数から少なくとも１つの目的変数を予測する推論部と、推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備える。推論部は、複数の説明変数の中から選択された第１の説明変数を変動値とする一方で、第１の説明変数以外の第２の説明変数を固定値とする。推論部は、学習済みモデルを用いて、第１の説明変数を予め定められた変動範囲内で連続的に変動させたときの少なくとも１つの目的変数を予測する。表示データ生成部は、第１の説明変数の変動に対する少なくとも１つの目的変数の変動を示すデータを生成する。
【選択図】図１１

【特許請求の範囲】

【請求項1】

学習済みモデルを用いて、複数の説明変数から目的変数を予測する推論部と、
前記推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備え、
前記推論部は、
前記複数の説明変数の中から選択された第１の説明変数を変動値とする一方で、前記第１の説明変数以外の第２の説明変数を固定値とし、かつ、
前記学習済みモデルを用いて、前記第１の説明変数を予め定められた変動範囲内で連続的に変動させたときの前記目的変数を予測し、
前記表示データ生成部は、前記第１の説明変数の変動に対する前記目的変数の変動を示すデータを生成する、データ処理装置。

【請求項2】

前記表示データ生成部は、前記第１の説明変数を第１軸とし、前記目的変数を第２軸とする２次元グラフを生成する、請求項１に記載のデータ処理装置。

【請求項3】

前記推論部は、
前記複数の説明変数の中から２以上の前記第１の説明変数を選択し、かつ、
前記選択された前記２以上の第１の説明変数の各々について、前記学習済みモデルを用いて、前記第１の説明変数を前記変動範囲内で連続的に変化させたときの前記目的変数を予測し、
前記データ処理装置には表示部が接続されており、
前記表示データ生成部は、
前記２以上の第１の説明変数にそれぞれ対応して２以上の前記２次元グラフを生成し、
生成した前記２以上の２次元グラフが互いに重畳するように前記表示部に表示する、請求項２に記載のデータ処理装置。

【請求項4】

前記表示データ生成部は、前記第１の説明変数の選択および前記変動範囲の設定のための第１のユーザインターフェイスを提供するように構成され、
前記第１のユーザインターフェイスは、前記変動範囲の推奨範囲に関する情報を含む、請求項１に記載のデータ処理装置。

【請求項5】

前記学習済みモデルは、前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルであり、
前記推奨範囲は、前記教師データに含まれる前記第１の説明変数の値に基づいて設定される、請求項４に記載のデータ処理装置。

【請求項6】

前記表示データ生成部はさらに、前記第２の説明変数の値を設定するための第２のユーザインターフェイスを提供する、請求項４または５に記載のデータ処理装置。

【請求項7】

前記学習済みモデルは、前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルであり、
前記推論部は、
前記学習済みモデルにおける各説明変数の重要度に基づいて、前記複数の説明変数の中から少なくとも１つの前記第１の説明変数を選択し、かつ、
選択された前記少なくとも１つの第１の説明変数の各々について、前記学習済みモデルを用いて、前記第１の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測する、請求項１に記載のデータ処理装置。

【請求項8】

前記変動範囲は、前記教師データに含まれる前記第１の説明変数の値に基づいて設定される、請求項７に記載のデータ処理装置。

【請求項9】

前記データ処理装置には表示部が接続されており、
前記表示データ生成部は、
前記少なくとも１つの第１の説明変数にそれぞれ対応して少なくとも１つの前記データを生成し、かつ、
生成した前記少なくとも１つのデータを、対応する前記第１の説明変数の前記重要度が高いものから順に前記表示部に表示する、請求項７または８に記載のデータ処理装置。

【請求項10】

前記推論部は、
前記複数の説明変数の主成分分析により求められた特定の主成分に対する各説明変数の主成分負荷量の絶対値に基づいて、前記複数の説明変数の中から少なくとも１つの前記第１の説明変数を選択し、かつ、
選択された前記少なくとも１つの第１の説明変数の各々について、前記学習済みモデルを用いて、前記第１の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測する、請求項１に記載のデータ処理装置。

【請求項11】

前記学習済みモデルは、前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルであり、
前記変動範囲は、前記教師データに含まれる前記第１の説明変数の値に基づいて設定される、請求項１０に記載のデータ処理装置。

【請求項12】

前記データ処理装置には表示部が接続されており、
前記表示データ生成部は、
前記少なくとも１つの前記第１の説明変数にそれぞれ対応して少なくとも１つの前記データを生成し、
生成した前記少なくとも１つのデータを、対応する前記第１の説明変数の前記主成分負荷量が高いものから順に前記表示部に表示する、請求項１０または１１に記載のデータ処理装置。

【請求項13】

前記データ処理装置には表示部が接続されており、
前記推論部は、
前記複数の説明変数の各々を順番に前記第１の説明変数に選択し、かつ、
選択された各説明変数について、前記学習済みモデルを用いて、前記第１の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測し、
前記表示データ生成部は、
前記複数の説明変数にそれぞれ対応して複数の前記データを生成し、かつ、
生成した前記複数のデータを、前記目的変数の変動量が大きいものから順に前記表示部に表示する、請求項１または２に記載のデータ処理装置。

【請求項14】

前記推論部は、
前記複数の説明変数の中から２以上の前記第１の説明変数を選択し、
前記選択された前記２以上の第１の説明変数の各々について、前記学習済みモデルを用いて、前記第１の説明変数を前記変動範囲内で連続的に変化させたときの前記目的変数を予測し、
前記表示データ生成部は、前記２以上の第１の説明変数にそれぞれ対応して２以上の前記データを生成し、
前記２以上の第１の説明変数のうち、前記目的変数に対する影響度が最も大きい前記第１の説明変数の種別を、前記学習済みモデルが適用されるプロジェクトに関する情報と紐付けて記憶するためのデータベースをさらに備える、請求項１または２に記載のデータ処理装置。

【請求項15】

前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを生成する教師データ生成部と、
前記教師データを用いた機械学習によって、前記学習済みモデルを生成する学習部とをさらに備え、
前記教師データ生成部は、前記プロジェクトに関する情報および当該プロジェクトに紐付けられた前記第１の説明変数の種別をユーザに提示する、請求項１４に記載のデータ処理装置。

【請求項16】

前記複数の説明変数を入力とし、前記目的変数を正解出力とする教師データを生成する教師データ生成部と、
前記教師データを用いた機械学習によって、前記学習済みモデルを生成する学習部と、
前記学習済みモデルを、前記教師データと紐付けて記憶するためのデータベースとをさらに備える、請求項１に記載のデータ処理装置。

【請求項17】

前記教師データ生成部は、１つのデータ群から互いに異なる複数のデータ処理条件を用いて抽出された複数の特徴量をそれぞれ含むように、複数の前記教師データを生成し、
前記学習部は、
前記機械学習によって、前記複数の教師データから複数の前記学習済みモデルをそれぞれ生成し、
生成した前記複数の学習済みモデルの各々を、対応するデータ処理条件と紐付けて前記データベースに記憶する、請求項１６に記載のデータ処理装置。

【請求項18】

前記推論部は、前記複数の学習済みモデルの各々を用いて、前記第１の説明変数を前記変動範囲内で連続的に変動させたときの前記目的変数を予測し、
前記表示データ生成部は、前記複数の学習済みモデルにそれぞれ対応して、前記第１の説明変数の変動に対する前記目的変数の変動を示す複数の前記データを生成する、請求項１７に記載のデータ処理装置。

【請求項19】

前記複数のデータの中から１つの前記データがユーザにより選択された場合には、前記表示データ生成部は、選択された前記データに対応する前記学習済みモデルを、適当な学習済みモデルとして前記データベースに記憶し、
前記教師データ生成部は、前記１つのデータ群に類似するデータ群から特徴量が抽出される場合には、前記適当な学習済みモデルに紐付けられた前記データ処理条件をユーザに提示する、請求項１８に記載のデータ処理装置。

【請求項20】

学習済みモデルを用いて、複数の説明変数から目的変数を予測する推論方法であって、
前記複数の説明変数の中から選択された第１の説明変数を変動値とする一方で、前記第１の説明変数以外の第２の説明変数を固定値とし、かつ、前記学習済みモデルを用いて、前記第１の説明変数を予め定められた変動範囲内で連続的に変動させたときの前記目的変数を予測するステップと、
前記第１の説明変数の変動に対する前記目的変数の変動を示すデータを生成するステップと、
前記生成するステップにより生成された前記データを表示するステップとを備える、推論方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、データ処理装置および推論方法に関する。

【背景技術】

【0002】

特開２０１８－０３６１３１号公報（特許文献１）には、学習済みのニューラルネットワークを用いて、対象となる構造複合体を測定して得られた複数のパラメータから、当該構造複合体の状態を推定する方法が開示される。

【0003】

特許文献１では、複数のパラメータのデータセットをニューラルネットワークの入力層に入力すると、当該ニューラルネットワークの出力層から、構造複合体の性能の推定値が出力される。

【先行技術文献】

【特許文献】

【0004】

【特許文献1】特開２０１８－０３６１３１号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

しかしながら、特許文献１に記載される推定方法では、ニューラルネットワークに入力される複数のパラメータのデータセットに対応して、１つの推定値が取得されるに止まる。そのため、ユーザにとっては、この１つの推定値から、予測された性能に対して複数のパラメータの各々がどのように影響しているのかを知ることは容易ではないと考えられる。例えば、上記複数のパラメータのうちの一部のパラメータの値が変動（増加または減少）した場合に、推定値がどのように変動するのかを予測することは容易ではないと考えられる。

【0006】

なお、推定値に対して個々のパラメータがどのように影響しているのかを知るためには、ニューラルネットワークに入力される複数のパラメータのデータセットを複数種類用意しておき、各データセットに対して推定値を取得するという手順を繰り返すことが必要となるため、ユーザの利便性を低下させるとともに、推論処理の効率を低下させてしまうことが懸念される。このような懸念点は、ニューラルネットワークに入力されるパラメータの数が増えるに従って、より顕著となり得る。

【0007】

本発明はこのような課題を解決するためになされたものであって、その目的は、複数の説明変数の入力を受けて学習済みモデルから出力される推論結果の有用性を高めることである。

【課題を解決するための手段】

【0008】

本発明の第１の態様に係るデータ処理装置は、学習済みモデルを用いて、複数の説明変数から少なくとも１つの目的変数を予測する推論部と、推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備える。推論部は、複数の説明変数の中から選択された第１の説明変数を変動値とする一方で、第１の説明変数以外の第２の説明変数を固定値とする。推論部は、学習済みモデルを用いて、第１の説明変数を予め定められた変動範囲内で連続的に変動させたときの少なくとも１つの目的変数を予測する。表示データ生成部は、第１の説明変数の変動に対する少なくとも１つの目的変数の変動を示すデータを生成する。

【0009】

本発明の第２の態様に係る推論方法は、学習済みモデルを用いて、複数の説明変数から少なくとも１つの目的変数を予測する。推論方法は、複数の説明変数の中から選択された第１の説明変数を変動値とする一方で、第１の説明変数以外の第２の説明変数を固定値とし、かつ、学習済みモデルを用いて、第１の説明変数を予め定められた変動範囲内で連続的に変動させたときの少なくとも１つの目的変数を予測するステップと、第１の説明変数の変動に対する少なくとも１つの目的変数の変動を示すデータを生成するステップと、生成するステップにより生成されたデータを表示するステップとを備える。

【発明の効果】

【0010】

本発明によれば、複数の説明変数の入力を受けて学習済みモデルから出力される推論結果の有用性を高めることができる。

【図面の簡単な説明】

【0011】

【図1】実施の形態１に係る解析システムの構成例を説明する概略図である。

【図2】情報処理装置およびデータ処理装置のハードウェア構成例を模式的に示す図である。

【図3】情報処理装置およびデータ処理装置の機能構成を概略的に示す図である。

【図4】データ処理装置にて実施される処理の概要を説明するためのフローチャートである。

【図5】サンプルリストの生成の処理手順を説明するためのフローチャートである。

【図6】サンプルリストの構成例を示す図である。

【図7】教師データの生成、機械学習および学習済みモデルの記憶の処理手順を説明するためのフローチャートである。

【図8】教師データテーブルの構成例を示す図である。

【図9】学習済みモデルリストの構成例を示す図である。

【図10】実施の形態１に係るデータ処理装置における推論処理の処理手順を説明するためのフローチャートである。

【図11】表示部における推論結果の第１の表示例を模式的に示す図である。

【図12】表示部における推論結果の第２の表示例を模式的に示す図である。

【図13】表示部における推論結果の第３の表示例を模式的に示す図である。

【図14】実施の形態２に係るデータ処理装置における推論処理の処理手順を説明するためのフローチャートである。

【図15】実施の形態２に係るデータ処理装置における教師データの生成、機械学習および学習済みモデルの記憶の処理手順を説明するためのフローチャートである。

【図16】実施の形態３の第１構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。

【図17】第１構成例における推論結果の表示例を模式的に示す図である。

【図18】実施の形態３の第２構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。

【図19】実施の形態３の第３構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。

【図20】実施の形態４に係るデータ処理装置における教師データの生成、機械学習および学習済みモデルの記憶の処理手順を説明するためのフローチャートである。

【図21】サンプルリストの構成例を示す図である。

【図22】選択サンプル抽出テーブルの構成例を示す図である。

【図23】学習済みモデルリストの構成例を示す図である。

【図24】実施の形態５に係るデータ処理装置における推論処理の処理手順を説明するためのフローチャートである。

【図25】表示部における複数の推論結果の表示例を模式的に示す図である。

【図26】実施の形態５に係るデータ処理装置におけるサンプルリストの生成の処理手順を説明するためのフローチャートである。

【発明を実施するための形態】

【0012】

以下、本発明の実施の形態について図面を参照して詳細に説明する。なお、以下では、図中の同一または相当部分について同一符号を付して、その説明は原則的に繰返さないものとする。

【0013】

［実施の形態１］
［解析システムの構成例］
図１は、実施の形態１に係る解析システムの構成例を説明する概略図である。実施の形態１に係る解析システムは、複数の分析装置において取得された分析データを横断的に解析するためのシステムに適用することができる。

【0014】

図１に示すように、実施の形態１に係る解析システム１００は、複数の分析装置４と、データ処理装置１とを備える。

【0015】

複数の分析装置４は、サンプルの測定を行う。複数の分析装置４は、例えば、液体クロマトグラフ装置（ＬＣ）、ガスクロマトグラフ装置（ＧＣ）、液体クロマトグラフ質量分析装置（ＬＣ－ＭＳ）、ガスクロマトグラフ質量分析装置（ＧＣ－ＭＳ）、熱分解ガスクロマトグラフ質量分析装置（Ｐｙ－ＧＣ／ＭＳ）、走査型電子顕微鏡（ＳＥＭ）、透過電子顕微鏡（ＴＥＭ）、エネルギー分散型蛍光Ｘ線分析装置（ＥＤＸ）、波長分散型蛍光Ｘ線分析装置（ＷＤＸ）、核磁気共鳴装置（ＮＭＲ）、およびフーリエ変換赤外分光光度計（ＦＴ－ＩＲ）などを含む。複数の分析装置４はさらに、フォトダイオードアレイ検出器（ＬＣ－ＰＤＡ）、液体クロマトグラフタンデム質量分析装置（ＬＣ／ＭＳ／ＭＳ）、ガスクロマトグラフタンデム質量分析装置（ＧＣ／ＭＳ／ＭＳ）、液体クロマトグラフイオントラップ飛行時間型質量分析計（ＬＣ／ＭＳ－ＩＴ－ＴＯＦ）、近赤外分光装置、引張試験機、圧縮試験機、発光分光分析装置（ＡＥＳ）、原子吸光分析装置（ＡＡＳ／ＦＬ－ＡＡＳ）、プラズマ質量分析装置（ＩＣＰ－ＭＳ）、有機元素分析装置、グロー放電質量分析装置（ＧＤＭＳ）、粒子組成分析装置、微量全窒素自動分析装置（ＴＮ）、高感度窒素炭素分析装置（ＮＣ）、および熱分析装置などを含んでもよい。解析システム１００は、互いに種類が異なる複数の分析装置４を有することによって、１つのサンプルを複数種類の分析データを用いて多面的に分析することが可能となる。

【0016】

分析装置４は、装置本体５および情報処理装置６を含む。装置本体５は、分析対象となるサンプルを測定する。情報処理装置６には、サンプルの識別情報およびサンプルの測定条件が入力される。

【0017】

情報処理装置６は、入力された測定条件に従って、装置本体５における測定を制御する。これにより、サンプルの測定結果に基づいた分析データが取得される。情報処理装置６は、取得された分析データを、サンプルの識別情報および測定条件とともにデータファイルに格納し、このデータファイルを内蔵するメモリに保存する。

【0018】

情報処理装置６は、データ処理装置１と相互に通信可能に接続される。情報処理装置６およびデータ処理装置１間の接続は有線であっても無線であってもよい。例えば、情報処理装置６とデータ処理装置１とを繋ぐ通信網として、インターネットを利用することができる。これにより、各分析装置４の情報処理装置６は、サンプルごとのデータファイルをデータ処理装置１に送信することができる。

【0019】

データ処理装置１は、主として、複数の分析装置４にて取得される分析データを管理するための装置である。データ処理装置１には、各分析装置４からの分析データを入力される。データ処理装置１にはさらに、サンプルに関する情報（以下、「サンプル情報」とも称する）およびサンプルの物性データを入力することができる。

【0020】

サンプル情報は、サンプルを識別するための識別情報（サンプルＩＤ、サンプル名など）と、サンプルの作製に関する情報（以下、「レシピデータ」とも称する）とを含む。サンプルのレシピデータには、サンプルの原材料の配合量および製造プロセスに関する情報を含めることができる。例えば、サンプルが三元触媒である場合、レシピデータには、Ｐｔ（白金）の配合量（ｇ）、Ｐｄ（パラジウム）の配合量（ｇ）、攪拌時間（ｍｉｎ）および焼成温度（℃）などが含まれる。

【0021】

サンプルの物性データとは、分析装置４による分析以外で得られる、サンプルの属性を示すデータである。例えば、サンプルが三元触媒である場合、物性データには、ＮＯｘ（窒素酸化物）の浄化率（％）、ＣＯ（一酸化炭素）の浄化率（％）、ＨＣ（炭化水素）の浄化率（％）、および耐熱性能などが含まれる。

【0022】

データ処理装置１は、データベースを内蔵している。データベースは、データ処理装置１と複数の分析装置４との間で遣り取りされるデータ、データ処理装置１の外部から入力されるデータ、およびデータ処理装置１内で生成されるデータを保存するための記憶部である。データ処理装置１は、サンプルごとに、データファイルとサンプル情報およびサンプルの物性データとを紐付けてデータベースに格納する。なお、図１の例では、データ処理装置１にデータベースを内蔵する構成としたが、データ処理装置１にデータベースが外付けされる構成としてもよい。

【0023】

［解析システムのハードウェア構成例］
図２は、情報処理装置６およびデータ処理装置１のハードウェア構成例を模式的に示す図である。

【0024】

（情報処理装置のハードウェア構成）
図２に示すように、情報処理装置６は、分析装置４全体を制御するためのＣＰＵ（Central Processing Unit）６０と、プログラムおよびデータを格納する記憶部とを備えており、プログラムに従って動作するように構成される。

【0025】

記憶部は、ＲＯＭ（Read Only Memory）６１と、ＲＡＭ（Random Access Memory）６２と、ＨＤＤ（Hard Disk Drive）６５とを含む。ＲＯＭ６１は、ＣＰＵ６０にて実行されるプログラムを格納する。ＲＡＭ６２は、ＣＰＵ６０におけるプログラムの実行中に利用されるデータを一時的に格納する。ＲＡＭ６２は、作業領域として利用される一時的なデータメモリとして機能する。ＨＤＤ６５は、不揮発性の記憶装置であり、サンプルごとのデータファイルなど情報処理装置６で生成された情報を格納する。ＨＤＤ６５に加えて、あるいは、ＨＤＤ６５に代えて、フラッシュメモリなどの半導体記憶装置を採用してもよい。

【0026】

情報処理装置６は、さらに、通信インターフェイス（Ｉ／Ｆ）６６、操作部６３および表示部６４を含む。通信Ｉ／Ｆ６６は、情報処理装置６が装置本体５およびデータ処理装置１を含む外部機器と通信するためのインターフェイスである。

【0027】

操作部６３は、ユーザ（例えば、分析者）からの情報処理装置６に対する指示を含む入力を受け付ける。操作部６３は、キーボード、マウスおよび、表示部６４の表示画面と一体的に構成されたタッチパネルなどを含み、サンプルの測定条件および識別情報などを受け付ける。

【0028】

表示部６４は、測定条件を設定する際に、例えば測定条件の入力画面およびサンプルの識別情報などを表示することができる。測定中、表示部６４は、装置本体５で検出された測定データおよび情報処理装置６によるデータ解析結果を表示することができる。

【0029】

分析装置４における処理は、各ハードウェアおよびＣＰＵ６０により実行されるソフトウェアによって実現される。このようなソフトウェアはＲＯＭ６１またはＨＤＤ６５に予め記憶されている場合がある。また、ソフトウェアは、図示しない記憶媒体に格納されて、プログラムプロダクトとして流通している場合もある。そして、ソフトウェアは、ＣＰＵ６０によってＨＤＤ６５から読み出され、ＣＰＵ６０により実行可能な形式でＲＡＭ６２に格納される。ＣＰＵ６０は、このプログラムを実行する。

【0030】

（データ処理装置のハードウェア構成）
データ処理装置１は、装置全体を制御するためのＣＰＵ１０と、プログラムおよびデータを格納する記憶部とを備えており、プログラムに従って動作するように構成される。記憶部は、ＲＯＭ１１、ＲＡＭ１２およびデータベース１５を含む。

【0031】

ＲＯＭ１１は、ＣＰＵ１０にて実行されるプログラムを格納する。ＲＡＭ１２は、ＣＰＵ１０におけるプログラムの実行中に利用されるデータを一時的に格納する。ＲＡＭ１２は、作業領域として利用される一時的なデータメモリとして機能する。

【0032】

データベース１５は、不揮発性の記憶装置であり、データ処理装置１と複数の分析装置４との間で遣り取りされるデータ、データ処理装置１の外部から入力されるデータ、およびデータ処理装置１内で生成されるデータを格納する。

【0033】

データ処理装置１は、さらに、通信Ｉ／Ｆ１３、入出力インターフェイス（Ｉ／Ｏ）１４を含む。通信Ｉ／Ｆ１３は、データ処理装置１が情報処理装置６を含む外部機器と通信するためのインターフェイスである。

【0034】

Ｉ／Ｏ１４は、データ処理装置１への入力またはデータ処理装置１からの出力のインターフェイスである。Ｉ／Ｏ１４は、表示部２および操作部３に接続される。表示部２は、後述するように、データ処理装置１において学習処理および推論処理が実行される際に、処理に関する情報を表示するとともに、ユーザの操作を受け付けるためのユーザインターフェイス画面を表示することができる。

【0035】

操作部３は、ユーザの指示を含む入力を受け付ける。操作部３は、キーボードおよびマウスなどを含み、サンプル情報およびサンプルの物性データなどを受け付ける。なお、サンプル情報およびサンプルの物性データは、通信Ｉ／Ｆ１３を介して外部機器から受け付けることも可能である。

【0036】

［解析システムの機能構成］
図３は、情報処理装置６およびデータ処理装置１の機能構成を概略的に示す図である。

【0037】

（情報処理装置の機能構成）
図３に示すように、情報処理装置６は、データ取得部６７と、情報取得部６９とを有する。これらの機能構成は、図２に示す情報処理装置６において、ＣＰＵ６０が所定のプログラムを実行することで実現される。

【0038】

データ取得部６７は、装置本体５から、サンプルの測定結果に基づいた分析データを取得する。例えば、分析装置４がガスクロマトグラフ質量分析装置（ＧＣ－ＭＳ）である場合、分析データには、クロマトグラムおよびマススペクトルが含まれる。分析装置４が走査型電子顕微鏡（ＳＥＭ）または透過型電子顕微鏡（ＴＥＭ）である場合、分析データにはサンプルの顕微鏡像を示す画像データが含まれる。データ取得部６７は、取得した測定データを通信Ｉ／Ｆ６６へ転送する。

【0039】

情報取得部６９は、操作部６３が受け付けた情報を取得する。具体的には、情報取得部６９は、サンプル識別情報およびサンプルの測定条件を示す情報を取得する。サンプル識別情報には、例えば、サンプル名、サンプルとなる製品の名称、型番およびシリアル番号などが含まれる。サンプルの測定条件には、使用する分析装置の名称および型番などを含む装置パラメータと、電圧および／または電流の印加条件または温度条件などの測定条件を示す測定パラメータとが含まれる。

【0040】

通信Ｉ／Ｆ６６は、取得した分析データ、測定条件およびサンプル識別情報を、データファイルとしてデータ処理装置１へ送信する。

【0041】

（データ処理装置の機能構成）
データ処理装置１は、分析データ取得部２０と、特徴量抽出部２２と、物性データ取得部２４と、サンプル情報取得部２６と、教師データ生成部２８と、学習部３０と、推論部３２と、表示データ生成部３４とを備える。これらの機能構成は、図２に示すデータ処理装置１において、ＣＰＵ１０が所定のプログラムを実行することによって実現される。

【0042】

分析データ取得部２０は、通信Ｉ／Ｆ１３を介して、各分析装置４の情報処理装置６から送信されるデータファイルを取得する。データファイルは、サンプルの分析データを含んでいる。

【0043】

特徴量抽出部２２は、分析データ取得部２０が取得した分析データを専用のデータ解析ソフトウェアを用いて解析することにより、サンプルの特徴量を抽出する。サンプルの特徴量には例えば、サンプルの組成、濃度、分子構造、分子数、分子式、分子量、重合度、粒子径、粒子面積、粒子数、粒子の分散度、ピーク強度、ピーク面積、ピークの傾き、化合物濃度、化合物量、吸光度、反射率、透過率、サンプルの試験強度、ヤング率、引張強度、変形量、歪み量、破断時間、平均粒子間距離、誘電正接、伸び、スプリング硬さ、損失係数、ガラス転移温度、および熱膨張率などが含まれる。

【0044】

物性データ取得部２４は、操作部３が受け付けたサンプルの物性データを取得する。サンプルの物性データは、サンプルの属性を示すデータであり、例えば、サンプルの性能を示す値、またはサンプルの劣化度合いを示す値（使用年数など）などが含まれる。

【0045】

サンプル情報取得部２６は、操作部３が受け付けたサンプル情報を取得する。サンプル情報は、サンプルの識別情報（サンプルＩＤ、サンプル名など）、およびサンプルのレシピデータを含む。サンプルのレシピデータには、サンプルの原材料の配合量および製造プロセスに関する情報などが含まれる。

【0046】

データベース１５には、サンプルごとに、分析データ取得部２０で取得された分析データ、特徴量抽出部２２で抽出された特徴量、および物性データ取得部２４で取得された物性データ、およびサンプル情報取得部２６で取得されたサンプル情報が紐付けられて格納される。具体的には、データベース１５には、これらの情報に基づいて、サンプルリストが作成される。サンプルリストとは、プロジェクトまたはサンプルの種類に応じて作成されるひとかたまりのデータセットであり、その構成などは特に限定されない。

【0047】

教師データ生成部２８は、操作部３に対するユーザの入力操作に応じて、データベース１５に格納されるデータに基づいて、教師データ（学習用データ）を生成する。教師データとは、入力（説明変数）と出力（目的変数）とがセットとなったデータである。

【0048】

教師データ生成部２８は、例えば、１つのサンプルの「分析データまたは特徴量」および／または「レシピデータ」を予測モデルの入力（説明変数）とし、当該サンプルの「物性データ」を予測モデルの出力（目的変数）とする教師データを生成することができる。

【0049】

あるいは、教師データ生成部２８は、１つのサンプルの「レシピデータ」を予測モデルの入力（説明変数）とし、当該サンプルの「分析データまたは特徴量」または「物性データ」を予測モデルの出力（目的変数）とする教師データを生成することができる。

【0050】

あるいは、教師データ生成部２８は、１つのサンプルの「物性データ」を予測モデルの入力（説明変数）とし、当該サンプルの「分析データまたは特徴量」または「レシピデータ」を予測モデルの出力（目的変数）とする教師データを生成することができる。

【0051】

生成された教師データは、学習部３０に与えられる。教師データは、生成される度にデータベース１５に格納されてもよい。これにより、データベース１５には、教師データが蓄積される。

【0052】

なお、教師データ生成部２８は、教師データをデータベース１５に格納する前に、表示データ生成部３４を用いて、教師データをデータベース１５に格納するか否かを確認するための確認画面を表示部２に表示する。当該確認画面において教師データの格納を指示するユーザ操作を受け付けた場合、教師データ生成部２８は、教師データをデータベース１５に格納する。一方、当該確認画面において上記指示を受け付けない場合には、教師データ生成部２８は、教師データを破棄する。

【0053】

学習部３０は、教師データ生成部２８により生成された教師データを用いて、当該教師データの説明変数を予測モデルの入力とし、当該教師データの目的変数を当該予測モデルの出力の正解データとする教師あり学習を行う。教師あり学習では、与えられた入力がどのような出力になるのかを予測する。学習部３０における教師データを用いた機械学習の手法は、特に限定されず、例えば、ニューラルネットワーク（Neural Network；ＮＮ）またはサポートベクタマシン（Support Vector Machine；ＳＶＭ）などの公知の機械学習を用いることができる。

【0054】

学習が終了すると、学習済みモデルが得られる。生成された学習済みモデルは、データベース１５に格納される。具体的には、学習済みモデルは、学習済みモデルを識別するための識別情報、学習済みモデルの生成日時、および学習に用いた教師データを識別するための識別情報と紐付けられて、データベース１５に格納される。

【0055】

推論部３２は、データベース１５に記憶された学習済みモデルを用いて、分析データ取得部２０および特徴量抽出部２２、物性データ取得部２４ならびにサンプル情報取得部２６のいずれか１つまたは２つから新たに入力される入力データ（説明変数）から、出力（目的変数）を予測する。すなわち、説明変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの１つまたは２つであり、目的変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの他の１つである。あるいは、説明変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの１つであり、目的変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの他の１つまたは２つである。一例として、説明変数は「分析データまたは特徴量」および／または「レシピデータ」であり、目的変数は「物性データ」である。

【0056】

表示データ生成部３４は、推論部３２による推論結果を取得すると、推論結果を表示部２の表示画面上に表示させるためのデータを生成する。表示データ生成部３４は、さらに、学習処理および推論処理が実行される際に、処理に関する情報を表示するとともに、ユーザの操作を受け付けるためのユーザインターフェイス（ＵＩ）を提供する。

【0057】

なお、操作部３および表示部２に代えて、例えば、デスクトップ型のパーソナルコンピュータ（ＰＣ）、ノート型ＰＣ、携帯端末（タブレット端末、スマートフォン）などの情報端末をデータ処理装置１に接続する構成としてもよい。

【0058】

また、図３の例では、データ処理装置１が特徴量抽出部２２を有する構成を示したが、情報処理装置６が特徴量抽出部を有する構成としてもよい。この場合、情報処理装置６は、サンプルの分析データとともに特徴量をデータ処理装置１に送信することになる。

【0059】

［データ処理装置の動作］
次に、データ処理装置１にて実施される処理について説明する。

【0060】

図４は、データ処理装置１にて実施される処理の概要を説明するためのフローチャートである。図４に示すように、データ処理装置１における処理は、主に、学習フェーズと推論フェーズとに区分することができる。

【0061】

＜学習フェーズ＞
学習フェーズでは、データベース１５に保存されているデータを用いて、教師データが生成される。そして、生成された教師データを用いて教師あり学習が実行されることにより、学習済みモデルが生成される。

【0062】

図４に示すように、最初に、ステップ（以下、単に「Ｓ」と表記する）０１により、データベース１５に格納されるデータに基づいて、サンプルリストが生成される。サンプルリストは、プロジェクトまたはサンプルの種類に応じて作成されるひとかたまりのデータセットである。

【0063】

次に、Ｓ０２により、操作部３に対するユーザの入力操作に応じて、サンプルリストから教師データが生成される。生成された教師データは、データベース１５に蓄積される。

【0064】

次に、Ｓ０３により、教師データを用いて、当該教師データの説明変数を予測モデルの入力とし、当該教師データの目的変数を予測モデルの出力の正解データとする教師あり学習が行われる。最後に、Ｓ０４により、教師あり学習によって生成された学習済みモデルが、データベース１５に格納される。

【0065】

以下、図５から図９を用いて、学習フェーズにおける具体的な処理内容を説明する。
（１）サンプルリストの生成（図４のＳ０１）
図５は、サンプルリストの生成（図４のＳ０１）の処理手順を説明するためのフローチャートである。図５を参照して、Ｓ１０では、操作部３を介してサンプル情報が取得される。具体的には、ユーザは、図示しないデータベース操作ソフトウェア（フロントエンド）を用いて、サンプル情報を入力することができる。サンプル情報は、サンプルの識別情報（サンプルＩＤ、サンプル名など）、およびサンプルのレシピデータを含む。サンプルのレシピデータには、サンプルの原材料の配合量および製造プロセスに関する情報などが含まれる。

【0066】

Ｓ１１では、操作部３を介してサンプルの物性データが取得される。物性データは、サンプルの属性を示すデータである。

【0067】

Ｓ１２では、通信Ｉ／Ｆ１３を介して、各分析装置４の情報処理装置６から送信されるデータファイルを取得する。データファイルは、サンプルの分析データを含んでいる。

【0068】

Ｓ１３では、Ｓ１２にて取得された分析データを専用のデータ解析ソフトウェアを用いて解析することにより、サンプルの特徴量が抽出される。

【0069】

Ｓ１４では、取得されたサンプル情報（サンプルの識別情報、レシピデータ）、サンプルの物性データ、ならびにサンプルの分析データおよび特徴量がサンプルリストに入力される。図６は、サンプルリストの構成例を示す図である。図６には、サンプルが三元触媒である場合のサンプルリストの構成例が示されている。

【0070】

図６に示すように、サンプルリストには、サンプルＩＤと紐付けられて、サンプル名、サンプルのレシピデータ、物性データ、分析データおよび特徴量が入力されている。レシピデータは、Ｐｔの配合量（ｇ）、Ｐｄの配合量（ｇ）、攪拌時間（ｍｉｎ）および焼成温度（℃）などを含む。物性データは、ＮＯｘの浄化率（％）、ＣＯの浄化率（％）、ＨＣの浄化率（％）、および耐熱性能などを含む。分析データは、ガスクロマトグラフ質量分析装置（ＧＣ－ＭＳ）、核磁気共鳴装置（ＮＭＲ）、走査電子顕微鏡（ＳＥＭ）および透過電子顕微鏡（ＴＥＭ）等により取得された分析データを含む。

【0071】

特徴量は、ガスクロマトグラフ質量分析装置（ＧＣ－ＭＳ）にて取得されたクロマトグラムを解析して得られた所定の質量数に対するピーク面積、核磁気共鳴装置（ＮＭＲ）にて取得されたＮＭＲスペクトルを解析して得られた所定の物質の存在比、走査電子顕微鏡（ＳＥＭ）にて取得されたＳＥＭ画像を解析して得られた、三元触媒中に存在する粒子の粒子径、平均粒子径、および、透過電子顕微鏡（ＴＥＭ）にて取得されたＴＥＭ画像を解析して得られた、三元触媒中に存在する粒子の粒子径などを含む。

【0072】

サンプルのレシピデータ、物性データ、分析データおよび特徴量が入力されたサンプルリストは、サンプルリストを識別するための情報（サンプルリストの名称など）が付与されてデータベース１５に登録される。

【0073】

（２）教師データの生成および学習済みモデルの生成（図４のＳ０２～Ｓ０４）
図７は、教師データの生成（図４のＳ０２）、機械学習（図４のＳ０３）および学習済みモデルの記憶（図４のＳ０４）の処理手順を説明するためのフローチャートである。

【0074】

図７を参照して、最初にＳ２０により、教師データの生成に使用するサンプルが選択される。ユーザは、表示部２に表示されるＵＩ画面（サンプル選択画面）を、操作部３を用いて操作することにより、サンプルを選択することができる。

【0075】

このサンプル選択画面は、データベース１５に格納されたサンプルリストに基づいて作成することができる。例えば、サンプル選択画面には、データベース１５に格納される全てのサンプルについて、サンプル名、レシピデータなどを含んだリストが表示される。この場合、サンプル選択画面には、各サンプルに対応して選択用アイコンが表示される。ユーザは、操作部３を用いて選択用アイコンにチェックを入れることによって、任意のサンプルを選択することができる。

【0076】

または、サンプル選択画面には、データベース１５に格納される複数のサンプルリストの名称を表示してもよい。この場合、サンプル選択画面には、各サンプルリストに対応して選択用アイコンが表示される。ユーザが操作部３を用いて選択用アイコンにチェックを入れると、対応するサンプルリストに含まれる全てのサンプルが選択される。

【0077】

サンプルの選択が完了すると、サンプルリストから、選択されたサンプルの行に含まれるデータが抽出されて選択サンプル抽出テーブルが生成される。選択サンプル抽出テーブルは、選択結果の確認のために、表示部２に表示する構成としてもよい。

【0078】

次に、Ｓ２１およびＳ２２により、教師データの生成に使用する説明変数および目的変数が選択される。表示部２には、ＵＩ画面（説明変数選択画面および目的変数選択画面）が表示される。

【0079】

説明変数選択画面は、ユーザが、教師データの入力に使用するデータの種別を選択するためのＵＩ画面である。説明変数選択画面には、選択サンプル抽出テーブルに含まれるサンプルのレシピデータ、分析データおよび特徴量の種別がリスト表示される。例えば、選択されたサンプルが三元触媒である場合には、説明変数選択画面には、「白金（Ｐｔ）の配合量」および「パラジウム（Ｐｄ）の配合量」などのレシピデータの種別、「ＧＣ－ＭＳ」および「ＮＭＲ」などの分析データの種別、ならびに、「ピーク面積」および「粒子径」などの特徴量の種別がリスト表示される。説明変数選択画面には、各種別に対応して選択用アイコンが表示される。ユーザは、操作部３を用いて選択用アイコンにチェックを入れることによって、任意の説明変数を選択することができる。

【0080】

目的変数選択画面は、ユーザが、教師データの出力に使用するデータの種別を選択するためのＵＩ画面である。目的変数選択画面には、選択サンプル抽出テーブルに含まれるサンプルのレシピデータ、分析データおよび特徴量の種別がリスト表示される。目的変数選択画面には、各種別に対応して選択用アイコンが表示される。ユーザは、操作部３を用いて選択用アイコンにチェックを入れることによって、任意の目的変数を選択することができる。

【0081】

ただし、目的変数選択画面では、説明変数に選択されたデータの種別と同じカテゴリに属する種別については、重複した選択を避けるために、選択用アイコンは表示されない。したがって、例えば、説明変数として「レシピデータ」に属する種別が選択された場合には、目的変数には、「物性データ」および「分析データまたは特徴量」のいずれかに属する種別を選択することができる。または、説明変数として「物性データ」に属する種別が選択された場合には、目的変数には、「レシピデータ」および「分析データまたは特徴量」のいずれかに属する種別を選択することができる。あるいは、説明変数として「分析データまたは特徴量」に属する種別が選択された場合には、目的変数には、「レシピデータ」および「物性データ」のいずれかに属する種別を選択することができる。

【0082】

なお、教師データ生成用アプリケーションが、教師あり学習の説明変数として使用するデータおよび目的変数として使用するデータのセットごとに準備されていてもよい。この場合、ユーザは、教師データ生成用アプリケーションを選択する操作を行うのみによって、教師データの入力及び出力に使用するデータの種別を選択することができる。

【0083】

説明変数（入力データの種別）および目的変数（出力データの種別）の選択が完了すると、Ｓ２３では、選択サンプル抽出テーブルから、説明変数に合致するデータおよび目的変数に合致するデータが抽出されることにより、教師データテーブルが生成される。図８は、教師データテーブルの構成例を示す図である。図８には、選択されたサンプルが三元触媒である場合の教師データテーブルの構成例が示されている。

【0084】

図８に示すように、図７のＳ２０で選択されたサンプルのＩＤおよびサンプル名が垂直方向に表示される。さらに、図７のＳ２１で選択された説明変数（入力データの種別）および、Ｓ２２で選択された目標変数（出力データの種別）が水平方向に表示される。

【0085】

図８の例では、説明変数としてレシピデータが選択されている。具体的には、Ｐｔの配合量（％）、Ｐｄの配合量（％）、攪拌時間（ｍｉｎ）および焼成温度（℃）が、説明変数に選択されている。目的変数として物性データが選択されている。具体的には、ＮＯｘの浄化率（％）、ＣＯの浄化率（％）および耐熱性能が、目的変数に選択されている。

【0086】

教師データテーブルには、サンプルごとに、説明変数に合致するデータ、および目的変数に合致するデータが入力される。教師データテーブルは、表示部２に表示される。ユーザは、表示されている教示データテーブルに対して、サンプルおよびデータの種別の追加または修正を行うことができる。例えば、サンプルが追加された場合には、選択サンプル抽出テーブルに対してサンプルが追加されるとともに、教師データテーブルにおいて、追加されたサンプルのデータが追加される。説明変数または目的変数のデータの種別が追加された場合には、教師データテーブルにおいて、各サンプルに対して、追加された変数のデータが追加される。

【0087】

教師データテーブルの生成が完了すると、生成された教師データテーブルに基づいて、教師データが生成される。図８の例では、説明変数として選択された、Ｐｔの配合量（ｇ）、Ｐｄの配合量（ｇ）、攪拌時間（ｍｉｎ）および焼成温度（℃）を入力とし、かつ、目的変数として選択された、ＮＯｘの浄化率（％）、ＣＯの浄化率（％）および耐熱性能を出力とする教師データが生成される。

【0088】

次に、Ｓ２４では、教師データを用いて、当該教師データの説明変数を学習用のモデルの入力とし、当該教師データの目的変数を当該モデルの出力の正解データとする教師あり学習が行われる。以下、機械学習の一例として、サポートベクタマシン（ＳＶＭ）を用いた場合を説明する。

【0089】

学習部３０（図３）は、Ｐｔの配合量（ｇ）、Ｐｄの配合量（ｇ）、攪拌時間（ｍｉｎ）および焼成温度（℃）をＳＶＭに入力し、ＳＶＭから出力されるＮＯｘの浄化率（％）、ＣＯの浄化率（％）および耐熱性能を取得する。学習部３０は、取得されたＮＯｘの浄化率（％）、ＣＯの浄化率（％）および耐熱性能と、教師データに含まれるＮＯｘの浄化率（％）、ＣＯの浄化率（％）および耐熱性能とをそれぞれ比較する。学習部３０は、ＳＶＭから出力されるＮＯｘの浄化率（％）、ＣＯの浄化率（％）および耐熱性能が、それぞれ、教師データであるＮＯｘの浄化率（％）、ＣＯの浄化率（％）および耐熱性能に近づくように、ＳＶＭ内の各種パラメータを更新することにより、学習済みモデルを生成する。

【0090】

Ｓ２４での機械学習が終了すると、学習済みモデルが得られる（図７のＳ２５）。Ｓ２６では、生成された学習済みモデルがデータベース１５に格納される。具体的には、学習済みモデルは、データベース１５に格納されている学習済みモデルリストに登録される。図９は、学習済みモデルリストの構成例を示す図である。図９の例では、学習済みモデルは、学習済みモデルを識別するための識別情報（学習済みモデルＩＤなど）、学習済みモデルの生成日時、学習済みモデルに関する情報、および学習に用いた教師データを識別するための識別情報と紐付けられている。

【0091】

学習済みモデルに関する情報には、学習済みモデルが適用されるプロジェクトの名称などを含めることができる。例えば、「三元触媒の浄化性能向上モデル」、「三元触媒の耐熱性改善モデル」などの情報を含めることができる。教師データの識別情報には、教師データの生成に使用したサンプルの情報（サンプルＩＤ、サンプル名など）、説明変数に選択されたデータの種別、および目的変数に選択されたデータの種別などを含めることができる。これらの情報は、選択サンプルデータ抽出テーブルおよび教師データテーブルから取得することができる。

【0092】

＜推論フェーズ＞
推論フェーズでは、生成された学習済みモデルを用いて、与えられる説明変数から目的変数が予測される。推論結果は表示部２に表示される。図４に戻って、最初にＳ０５により、説明変数が新たに取得される。この説明変数は、「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの１つまたは２つである。

【0093】

Ｓ０６では、学習済みモデルは、Ｓ０５で取得された説明変数の入力を受けて、目的変数を予測する。予測したい目的変数は「分析データまたは特徴量」、「物性データ」および「レシピデータ」のうちの他の１つまたは２つである。

【0094】

Ｓ０７では、学習済みモデルによる推論結果が表示部２に表示される。これによると、ユーザは、説明変数から予測される目的変数の値を確認することができる。

【0095】

ただし、上記構成では、新たに取得された説明変数に対する１つの推論結果が取得されるに止まるため、ユーザにとって、当該１つの推論結果から、予測された目的変数に対して説明変数がどのように影響しているのかを知ることは容易ではないと考えられる。例えば、取得された１つの推論結果から、１つの説明変数の値を増加（または減少）させた場合において、目的変数の値がどのように変動するのかを予測することは容易ではないと考えられる。

【0096】

そこで、実施の形態１では、推論結果の有用性を高めることを可能とする推論処理について説明する。以下、図１０から図１２を用いて、推論処理の具体的な処理内容を説明する。

【0097】

図１０は、実施の形態１に係るデータ処理装置における推論処理（図４のＳ０５～Ｓ０７）の処理手順を説明するためのフローチャートである。

【0098】

図１０を参照して、Ｓ３０では、推論処理に使用する学習済みモデルが選択される。表示部２には、ＵＩ画面（学習済みモデル選択画面）が表示される。学習済みモデル選択画面は、データベース１５に格納される学習済みモデルリスト（図９）に基づいて生成される。学習済みモデル選択画面には、学習済みモデルリスト（図９）に含まれる学習済みモデルの識別情報（学習済みモデルＩＤなど）とともに、学習済みモデルの生成日時、学習済みモデルに関する情報（プロジェクトの名称など）、および学習に用いた教師データを識別するための識別情報などが表示される。

【0099】

学習済みモデル選択画面には、各学習済みモデルに対応して選択用アイコンが表示される。ユーザは、操作部３を用いて選択用アイコンにチェックを入れることによって、任意の学習済みモデルを選択することができる。

【0100】

推論処理に使用する学習済みモデルが選択されることによって、学習済みモデルに入力される説明変数のデータの種別、および、学習済みモデルによって予測される目的変数のデータの種別がそれぞれ決定される。説明変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの１つであり、目的変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの他の１つまたは２つである。あるいは、説明変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの２つであり、目的変数のデータは「レシピデータ」、「物性データ」および「分析データまたは特徴量」のうちの他の１つである。

【0101】

具体的には、学習済みモデルリスト（図９）には、各学習済みモデルについて、当該モデルの生成に使用された教師データの識別情報が紐付けられて登録されている。教師データの識別情報には、上述のように、教師データの生成に使用したサンプルの情報（サンプルＩＤ、サンプル名など）、説明変数に選択されたデータの種別、および目的変数に選択されたデータの種別が含まれる。したがって、学習済みモデルを選択することによって、学習済みモデルに入力される説明変数のデータの種別、および、学習済みモデルによって予測される目的変数のデータの種別を自動的に決定することができる。

【0102】

次に、Ｓ３１では、学習済みモデルに入力される説明変数の値が設定される。表示部２には、解析対象となるサンプルを選択するためのＵＩ画面（サンプル選択画面）が表示される。ユーザは、サンプル選択画面を、操作部３を用いて操作することにより、解析対象となるサンプルを選択することができる。

【0103】

このサンプル選択画面は、データベース１５に格納されたサンプルリスト（図６）に基づいて作成することができる。例えば、サンプル選択画面には、データベース１５に格納される全てのサンプルについて、サンプル名およびレシピデータなどを含んだリストが表示される。サンプル選択画面にはさらに、各サンプルに対応して選択用アイコンが表示される。ユーザは、操作部３を用いて選択用アイコンにチェックを入れることによって、任意のサンプルを選択することができる。

【0104】

解析対象となるサンプルが選択されると、選択されたサンプルのレシピデータ、物性データ、分析データおよび特徴量に基づいて、学習済みモデルに入力される説明変数の値が設定される。なお、ユーザは、この設定された値を基準値として、操作部３を用いて基準値から増加または減少させる操作を行うことにより、各説明変数を所望の値に調整することができる。

【0105】

次に、Ｓ３２では、複数の説明変数の中から、「変動値となる説明変数」が選択される。本実施の形態に係る推論処理では、学習済みモデルに入力される複数の説明変数の一部を変動値とし、当該複数の説明変数の残りを固定値とする。なお、当該一部の説明変数の数は、１であっても２以上であってもよい。後述するように、ユーザは、表示部２に表示されるユーザインターフェイス画面を、操作部３を用いて操作することにより、変動値となる説明変数を選択することができる。

【0106】

「変動値となる説明変数」とは、推論処理において、予め定められた変動範囲内で、その値が変動する説明変数である。これに対して、「固定値となる説明変数」とは、推論処理において、その値が固定されている説明変数である。

【0107】

Ｓ３３では、変動値となる説明変数について、その変動範囲が設定される。後述するように、ユーザは、表示部２に表示されるユーザインターフェイス画面に対して、操作部３を用いて、変動範囲の上限値および下限値を入力することにより、説明変数の変動範囲を設定することができる。なお、説明変数の変動範囲は、データ処理装置１が、データベース１５に格納されたサンプルリスト（図６）に基づいて自動的に設定することもできる。例えば、学習済みモデルの生成に用いた教師データから、変動値となる説明変数に対応するデータを抽出し、抽出したデータのうちの最小値を推奨範囲の下限値に設定し、かつ、最大値を推奨範囲の上限値に設定することができる。

【0108】

Ｓ３４では、学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。ユーザは、表示部２に表示されるユーザインターフェイス画面（目的変数選択画面）を、操作部３を用いて操作することにより、表示対象となる目的変数を選択することができる。表示対象となる目的変数の数は、１であっても２以上であってもよい。

【0109】

この目的変数選択画面には、Ｓ３０にて選択された学習済みモデルによって予測される目的変数のデータの種別がリスト表示される。目的変数選択画面にはさらに、各目的変数に対応して選択用アイコンが表示される。ユーザは、操作部３を用いて選択用アイコンにチェックを入れることによって、任意の目的変数を表示対象に選択することができる。

【0110】

次に、Ｓ３５では、Ｓ３０にて選択された学習済みモデルに対して、Ｓ３１～Ｓ３３にて設定された説明変数を入力することにより、目的変数が予測される。この推論処理では、複数の説明変数のうちの連続的に変動する一部の説明変数の各値に対応して、目的変数が予測される。すなわち、当該一部の説明変数の変動によって、目的変数がどのように変動するのかが予測される。

【0111】

Ｓ３６では、Ｓ３５での推論処理により得られた推論結果が表示部２に表示される。表示部２には、Ｓ３４において表示対象に選択された目的変数について、上記一部の説明変数の変動に対する変動を示すグラフが表示される。

【0112】

次に、図１１および図１２を用いて、表示部２における推論結果の表示例を説明する。
図１１は、表示部２における推論結果の第１の表示例を模式的に示す図である。図１１には、学習済みモデルに入力される説明変数として「レシピデータ」が選択され、予測する目的変数として「物性データ」が選択されている場合において、表示部２に表示される推論結果が例示されている。サンプルは三元触媒である。

【0113】

図１１の表示例は、推論処理に使用される学習済みモデルの選択、解析対象となるサンプルの選択、および表示対象となる目的変数の選択が実行されることによって生成される。

【0114】

図１１に示すように、表示部２には、ＧＵＩ（Graphical User Interface）７０が表示される。ＧＵＩ７０は、学習済みモデルに入力される複数の説明変数のうち、変動値となる説明変数を選択するためのＧＵＩである。具体的には、ＧＵＩ７０は、変動値となる説明変数を選択するためのＧＵＩ８０、説明変数の変動範囲を設定するためのＧＵＩ８４、および、当該変動範囲における説明変数の刻み幅を設定するためのＧＵＩ８６を含む。ユーザは、操作部３を用いてＧＵＩ８０，８４，８６を操作することにより、変動値となる説明変数を選択するとともに、当該説明変数の変動範囲および刻み幅を設定することができる。

【0115】

ＧＵＩ８０の右隅には、変動値となる説明変数を選択するためのアイコン８２が示されている。ユーザが操作部３を用いてアイコン８２をクリックすると、ＧＵＩ８０の下側には、変動値となる説明変数の候補を表示するためのＧＵＩ（図示せず）が表示される。当該ＧＵＩには、選択された学習済みモデルに紐付けられている複数の説明変数のデータの種別がリスト表示される。ユーザが当該ＧＵＩにおいて複数の説明変数の中から変動値となる説明変数を選択すると、ＧＵＩ８０には、選択された説明変数のデータの種別が書き込まれる。図１１の例では、変動値となる説明変数として、「Ｐｔの配合量（ｇ）」が選択されている。

【0116】

ＧＵＩ８４は、変動値となる説明変数について、変動範囲の下限値および上限値を入力可能に構成されている。ＧＵＩ８６は、変動値となる説明変数を連続的に変動させるときの刻み幅を入力可能に構成されている。ユーザは、ＧＵＩ８４において、変動値となる説明変数の変動範囲を設定するとともに、ＧＵＩ８６において、変動値となる説明変数の刻み幅を設定することができる。図１１の例では、「Ｐｔの配合量（ｇ）」の変動範囲の下限値Ｘ１＿ａおよび上限値Ｘ１＿ｂと、刻み幅ｄｘ１が設定されている。

【0117】

なお、ＧＵＩ７０には、変動値となる説明変数について、変動範囲の推奨範囲を示すためのＧＵＩ８８を含ませることができる。この推奨範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから、変動値となる説明変数に対応するデータ（例えば、Ｐｔの配合量（ｇ））を抽出し、抽出したデータのうちの最小値Ｘ１ｍｉｎを推奨範囲の下限値に設定し、かつ、最大値Ｘ１ｍａｘを推奨範囲の上限値に設定することができる。これによると、ユーザは、ＧＵＩ８８に示される推奨範囲を参照しながら、ＧＵＩ８４において変動範囲を設定することができる。

【0118】

表示部２にはさらに、学習済みモデルに入力される複数の説明変数のうち、固定値となる説明変数の値を設定するためのＧＵＩ７４が表示される。ＧＵＩ７４には、固定値となる説明変数のデータの種別および各データの値がテーブル形式で表示される。図１１の例では、ＧＵＩ７４には、学習済みモデルに入力される複数の説明変数のうち、「Ｐｔの配合量（ｇ）」以外の説明変数のデータ（「Ｐｄの配合量（ｇ）」、「攪拌時間（ｍｉｎ）」、「焼成温度（℃）」など）の値Ｘ２，Ｘ３，Ｘ４が示されている。値Ｘ２，Ｘ３，Ｘ４は、解析対象となるサンプルのデータに基づいて設定される。

【0119】

上述した手順で複数の説明変数の各々の値が設定された後に、推論の実行を指示するためのＧＵＩ７２がクリックされると、推論処理が実行される。推論処理では、変動値となる説明変数を所定の刻み幅で連続的に変動させるとともに、学習済みモデルを用いて、当該説明変数の各値に対応する目的変数が予測される。

【0120】

表示部２の表示領域７６には、推論結果が表示される。図１１に示すように、表示領域７６には、変動値となる説明変数と表示対象となる目的変数との関係を示すグラフ９０，９２が表示される。なお、図１１の例では、表示対象となる目的変数（物性データ）として、「ＮＯｘの浄化率（％）」および「耐熱性能」が選択されている。

【0121】

グラフ９０は、変動値となる説明変数（Ｐｔの配合量（ｇ））を横軸とし、表示対象となる目的変数（ＮＯｘの浄化率（％））を縦軸とする２次元グラフである。グラフ９２は、変動値となる説明変数（Ｐｔの配合量（ｇ））を横軸とし、表示対象となる目的変数（耐熱性能）を縦軸とする２次元グラフである。

【0122】

グラフ９０，９２の各々は、変動値となる説明変数を、予め定められた変動範囲内で所定の刻み幅で連続的に変動させたときに、目的変数がどのように変動するのかを示している。グラフ９０によると、Ｐｔの配合量を増やすに従ってＮＯｘの浄化率が高くなる一方で、Ｐｔの配合量がある値を超えると、Ｐｔの配合量を増やすに従ってＮＯｘの浄化率が低下することが分かる。グラフ９２によると、Ｐｔの配合量を増やすに従って耐熱性能が高くなるが、Ｐｔの配合量がある値を超えると耐熱性能が低下することが分かる。さらに、グラフ９０，９２を比較すると、ＮＯｘの浄化率がピークとなるときのＰｔの配合量と、耐熱性能がピークとなるときのＰｔの配合量とは異なることが分かる。

【0123】

このように、表示部２に表示された推論結果を参照することにより、ユーザは、１つの説明変数を連続的に変動させた場合に目的変数の値がどのように変動するのかを容易に予測することができる。例えば、グラフ９０，９２によれば、所望の物性を有する三元触媒の実現に適したＰｔの配合量を予測することができる。

【0124】

なお、ユーザは、ＧＵＩ７４において固定値となる説明変数の値を変更して、再度推論処理を実行することにより、様々な説明変数に対応したグラフ９０，９２を取得することができる。また、ユーザは、ＧＵＩ７０において変動値となる説明変数の種別、変動範囲および刻み幅を変更して、再度推論処理を実行することにより、他の説明変数についても、説明変数の連続的な変動に対する目的変数の変動を示すグラフを取得することができる。

【0125】

推論結果を示すデータ（推論処理で得られた生データおよびグラフ９０，９２のデータ）は、推論処理に使用した学習済みモデルを識別するための識別情報、および学習済みモデルに入力された説明変数に関する情報とともに、データベース１５に格納される。さらに、データベース１５に格納される推論結果を示すデータは、通信Ｉ／Ｆ１３を経由して、データ処理装置１から外部機器へ出力（エクスポート）することができる。出力形式には、例えば、ＣＳＶ（Comma-Separated Values）形式、あるいは他のＡＩソフト、統計解析ソフトなどの関連ソフトで表示可能な形式を用いることができる。

【0126】

図１２は、表示部２における推論結果の第２の表示例を模式的に示す図である。図１２には、図１１と同様に、学習済みモデルに入力される説明変数として「レシピデータ」が選択され、予測する目的変数として「物性データ」が選択されている場合に、表示部２に表示される推論結果が例示されている。サンプルは三元触媒である。図１２の表示例は、推論処理に使用される学習済みモデルの選択、解析対象となるサンプルの選択、および表示対象となる目的変数の選択が実行されることによって生成される。

【0127】

図１２の表示例では、変動値となる説明変数の数が２つである。表示部２には、変動値となる説明変数を選択するためのＧＵＩ７０，７１が表示される。ＧＵＩ７０，７１の構成は、図１１に示すＧＵＩ７０の構成と同じである。したがって、ユーザは、ＧＵＩ７０，７１の各々において、変動値となる説明変数を選択し、選択した説明変数について変動範囲および刻み幅を設定することができる。

【0128】

図１２の例では、変動値となる説明変数として、「Ｐｔの配合量（ｇ）」および「攪拌時間（ｍｉｎ）」が選択されている。「Ｐｔの配合量（ｇ）」について、変動範囲の下限値Ｘ１＿ａおよび上限値Ｘ１＿ｂと、刻み幅ｄｘ１とが設定され、「攪拌時間（ｍｉｎ）」について、変動範囲の下限値Ｘ３＿ａおよび上限値Ｘ３＿ｂと、刻み幅ｄｘ３とが設定されている。

【0129】

ＧＵＩ７４には、学習済みモデルに入力される複数の説明変数のうち、「Ｐｔの配合量（ｇ）」および「攪拌時間（ｍｉｎ）」以外の説明変数のデータ（「Ｐｄの配合量（ｇ）」、「焼成温度（℃）」など）の値Ｘ２，Ｘ４が示されている。

【0130】

上述した手順で複数の説明変数の各々の値が設定された後に、推論の実行を指示するためのＧＵＩ７２がクリックされると、推論処理が実行される。推論処理では、変動値となる２つの説明変数のうちの一方の説明変数を連続的に変動させ、他方の説明変数を固定値（例えば、変動範囲の中央値）とする。そして、学習済みモデルを用いて、一方の説明変数の各値に対応する目的変数が予測される。図１２の例では、複数の説明変数のうちの「Ｐｔの配合量（ｇ）」を可変値とし、残りの説明変数を固定値としたときの推論処理と、複数の説明変数のうちの「攪拌時間（ｍｉｎ）」を可変値とし、残りの説明変数を固定値としたときの推論処理とが実行される。

【0131】

表示部２の表示領域７６には、推論結果が表示される。表示領域７６には、変動値となる説明変数と表示対象となる目的変数との関係を示すグラフ９０，９４が表示される。なお、図１２の例では、表示対象となる目的変数（物性データ）として、「ＮＯｘの浄化率（％）」が選択されている。

【0132】

グラフ９０は、変動値となる説明変数（Ｐｔの配合量（ｇ））を横軸とし、表示対象となる目的変数（ＮＯｘの浄化率（％））を縦軸とする２次元グラフである。グラフ９４は、変動値となる説明変数（攪拌時間（ｍｉｎ））を横軸とし、表示対象となる目的変数（ＮＯｘの浄化率（％））を縦軸とする２次元グラフである。

【0133】

グラフ９０によると、Ｐｔの配合量を増やすに従ってＮＯｘの浄化率が高くなる一方で、Ｐｔの配合量がある値を超えると、Ｐｔの配合量を増やすに従ってＮＯｘの浄化率が低下することが分かる。グラフ９４によると、攪拌時間を増やすに従ってＮＯｘの浄化率が高くなるが、攪拌時間がある値を超えるとＮＯｘの浄化率が低下することが分かる。さらに、グラフ９０，９４を比較することにより、学習済みモデルに入力される複数の説明変数について、１つの目的変数に対する影響度を知ることができる。

【0134】

以上説明したように、実施の形態１に係るデータ処理装置によれば、ユーザは、表示されたデータに基づいて、変動値となる第１の説明変数を連続的に変動させたときに、目的変数がどのように変動するのかを容易に知ることができる。よって、推論結果の有用性を向上させることができる。

【0135】

また、実施の形態１では、第１の説明変数と目的変数との関係を２次元グラフで表現する構成としたことにより、表示された２次元グラフに基づいて、ユーザは、第１の説明変数の変動に対する目的変数の変動を視覚的に容易に予測することが可能となる。

【0136】

なお、図１１および図１２では、１回の推論処理において変動値となる説明変数の数を１とする構成について説明したが、１回の推論処理において変動値となる説明変数の数を２以上とする構成としてもよい。例えば、変動値となる説明変数の数を２とした場合には、当該２つの説明変数の各々を所定の刻み幅で連続的に変動させるとともに、学習済みモデルを用いて、当該２つの説明変数の各値に対応する目的変数が予測される。この場合、推論結果として、上記２つの説明変数のうちの第１の説明変数をＸ軸とし、第２の説明変数をＹ軸とし、表示対象となる目的変数をＺ軸とする３次元グラフを表示させることができる。

【0137】

また、図１２では、変動値となる説明変数の数が２つである場合に、２つの説明変数にそれぞれ対応して２つのグラフ９０，９４を表示部２に表示する構成について説明したが、これら２つのグラフを互いに重畳させて表示する構成としてもよい。図１３は、表示部２における推論結果の第３の表示例を模式的に示す図である。図１３の表示例は、図１２の表示例とは、推論結果の表示方法が異なる。図１３の表示例では、表示領域７６には、変動値となる２つの説明変数と表示対象となる目的変数との関係を示すグラフ９９が表示されている。このグラフ９９は、図１２のグラフ９０にグラフ９４を重畳したものに等しい。このようにすると、ユーザは、単一のグラフ９９に基づいて、２つの説明変数が１つの目的変数に与える影響度を相対的に評価することが可能となる。

【0138】

図１３では２次元グラフ９０，９４を重畳する表示例を示しているが、３次元グラフ同士を重畳してもよい。このようにすると、ユーザは、単一のグラフに基づいて、４つの説明変数が１つの目的変数に与える影響度を相対的に評価することが可能となる。

【0139】

［実施の形態２］
図１２に示した第２の表示例のように、変動値となる説明変数の数が複数ある場合には、説明変数が目的変数に与える影響度は、説明変数の種別によって異なる。実施の形態２では、変動値となる複数の説明変数の間で目的変数に与える影響度を比較し、影響度の大きい説明変数の種別を保存する構成について説明する。

【0140】

図１４は、実施の形態２に係るデータ処理装置における推論処理（図４のＳ０５～Ｓ０７）の処理手順を説明するためのフローチャートである。図１４に示すフローチャートは、図１０に示したフローチャートに対して、Ｓ３７，Ｓ３８を追加したものである。

【0141】

図１４を参照して、図１０と同じＳ３０～Ｓ３６によって推論処理が実行され、推論処理に得られた推論結果が表示部２に表示されると、Ｓ３７により、変動値となる複数の説明変数の各々について、説明変数の変動に対する目的変数の変動量が算出される。目的変数の変動量は、説明変数をＳ３２で設定された変動範囲内で連続的に変動させたときの、目的変数の最大値と最小値との差の絶対値に相当する。

【0142】

Ｓ３８により、Ｓ３７にて算出された目的変数の変動量に基づいて、目的変数に対する影響度が大きい説明変数が特定される。

【0143】

Ｓ３８では、ユーザが、表示部２の表示領域７６に表示された複数のグラフを比較することによって、目標変数に対する影響度が大きい説明変数を特定する構成としてもよい。あるいは、データ処理装置１が、変動値となる複数の説明変数のうち、目的変数の変動量が最も大きい説明変数を、目的変数に対する影響度が大きい説明変数として特定する構成としてもよい。

【0144】

Ｓ３８にて特定された、目的変数に対する影響度が大きい説明変数の種別は、対応する目的変数の種別、および、推論処理に使用された学習済みモデルに関する情報と紐付けられてデータベース１５に格納される。学習済みモデルに関する情報には、学習済みモデルが適用されるプロジェクトの名称が含まれている。サンプルが三元触媒である場合、プロジェクトの名称は、例えば、「三元触媒の浄化性能向上」、「三元触媒の耐熱性改善」などである。

【0145】

図１４のＳ３８にてデータベース１５に格納された情報は、学習フェーズで利用することができる。図１５は、実施の形態２に係るデータ処理装置における教師データの生成（図４のＳ０２）、機械学習（図４のＳ０３）および学習済みモデルの記憶（図４のＳ０４）の処理手順を説明するためのフローチャートである。図１５に示すフローチャートは、図７に示したフローチャートに対して、Ｓ２００を追加したものである。

【0146】

図１５を参照して、図７と同じＳ２０では、表示部２にＵＩ画面（サンプル選択画面）が表示される。ユーザは、操作部３を用いてサンプル選択画面を操作することにより、教師データの生成に使用するサンプルを選択することができる。サンプルの選択が完了すると、選択サンプル抽出データが生成される。

【0147】

Ｓ２００により、表示部２には、過去の推論処理において、図１４のＳ３８によりデータベース１５に格納された情報が表示される。具体的には、過去の推論処理において使用された学習済みモデルに関する情報（プロジェクトの名称）、ならびに、当該学習済みモデルから予測された目的変数および当該目的変数に対する影響度が大きい説明変数の種別に関する情報が、表示部２に表示される。

【0148】

次に、図７と同じＳ２１およびＳ２２により、教師データの生成に使用する説明変数および目的変数が選択される。表示部２には、ＵＩ画面（説明変数選択画面および目的変数選択画面）が表示される。上述したように、表示部２には、学習済みモデルが適用されるプロジェクトの名称、当該学習済みモデルから予測された目的変数の種別、および当該目的変数に対する影響度が大きい説明変数の種別に関する情報が示されている。したがって、ユーザは、これらの情報を参照しながら、新たに生成する学習済みモデルが適用されるプロジェクトに応じて、教師データを構成する説明変数および目的変数を選択することができる。例えば、ユーザは、プロジェクトが同じである学習済みモデルに紐付けられた目的変数および当該目的変数に対する影響度が大きい説明変数を含むように、目的変数および説明変数を選択することができる。

【0149】

以上説明したように、実施の形態２に係るデータ処理装置によれば、目的変数に対する影響度が大きい説明変数を含んだ教師データを用いて学習済みモデルを生成することができる。これによると、プロジェクトに対する学習済みモデルの有用性を高めることができる。

【0150】

［実施の形態３］
上述した実施の形態１では、推論フェーズにおいて、学習済みモデルに与える複数の説明変数のうちの変動値となる説明変数を、ＧＵＩ７０，７１（図１１および図１２参照）に対するユーザ入力に基づいて選択する構成について説明した。

【0151】

上記構成によると、推論結果として、ユーザが選択した説明変数について、説明変数と目的変数との関係を示すグラフを表示部２に表示させることができる。その一方で、複数の説明変数のうちどの説明変数を変動値に選択するかについては、ユーザの経験値やスキルレベルに依存している。そのため、目的変数に与える影響度が大きい説明変数であっても、変動値としてユーザが選択しない限り、当該説明変数と目的変数との関係を示すグラフを表示させることができない。その結果、ユーザが重要な説明変数についての考察を見落としてしまう可能性が懸念される。

【0152】

そこで、実施の形態３では、目的変数に対する影響度の大きい説明変数についての推論結果を表示するための構成について説明する。なお、実施の形態３に係るデータ処理装置の動作は、以下に説明する推論処理を除いて、上述した実施の形態１に係るデータ処理装置の動作と基本的に同じである。

【0153】

（１）第１構成例
図１６は、実施の形態３の第１構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。図１６に示すフローチャートは、図１０に示したフローチャートに対して、Ｓ３２をＳ３２０に置き換えるとともに、Ｓ３５０～Ｓ３５２を追加したものである。

【0154】

図１６を参照して、図１０と同じＳ３０，Ｓ３１により、推論処理に使用する学習済みモデルが選択されるとともに、当該学習済みモデルに入力される複数の説明変数の値が設定されると、Ｓ３２０では、複数の説明変数の各々について、その変動範囲が設定される。すなわち、第１構成例は、学習済みモデルに入力する複数の説明変数を全て変動値とする点において、上述した実施の形態とは異なる。

【0155】

各説明変数の変動範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから各説明変数に対応するデータを抽出し、抽出したデータの最小値を変動範囲の下限値に設定し、かつ、当該データの最大値を変動範囲の上限値に設定することができる。

【0156】

図１０と同じＳ３４により、学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。ユーザは、表示部２に表示されるユーザインターフェイス画面を、操作部３を用いて操作することにより、表示対象となる目的変数を選択することができる。

【0157】

図１０と同じＳ３５では、Ｓ３０にて選択された学習済みモデルに対して、複数の説明変数が入力されることにより、目的変数が予測される。この推論処理では、複数の説明変数のうちの１つの説明変数を所定の刻み幅で連続的に変動させるとともに、当該説明変数の各値に対応する目的変数が予測される。

【0158】

なお、当該１つの説明変数を変動させるときに、当該説明変数以外の他の説明変数の値は固定値とされる。他の説明変数の値はＳ３１で設定された値に固定される。この値は、解析対象となるサンプルのレシピデータ、物性データ、分析データおよび特徴量に基づいている。

【0159】

１つの説明変数の変動に対する目的変数の変動が予測されると、別の１つの説明変数を変動させて目的変数の変動が予測される。複数の説明変数の全てについて目的変数の変動が予測されると、Ｓ３５の推論処理は終了する。

【0160】

Ｓ３５の推論処理が終了すると、複数の説明変数にそれぞれ対応する複数の目的変数の推論結果の中から、推論結果として表示させるグラフが選択される。具体的には、最初に、Ｓ３５０において、複数の説明変数の各々について、説明変数の変動に対する目的変数の変動量が算出される。目的変数の変動量は、説明変数をＳ３２０で設定された変動範囲内で連続的に変動させたときの、目的変数の最大値と最小値との差の絶対値に相当する。

【0161】

次に、Ｓ３５１において、Ｓ３５０にて算出された目的変数の変動量に基づいて、表示対象となるグラフが選択される。Ｓ３５１では、複数の推論結果のうち目的変数の変動量が大きいものから順に、説明変数と目的変数との関係を示すグラフが選択される。表示対象に選択するグラフの個数は、ユーザが予め設定しておくことができる。例えば、目的変数の変動量が最も大きいものから数えて所定数のグラフを表示対象とすることができる。あるいは、目的変数の変動量が所定の値以上であるグラフを表示対象とすることができる。

【0162】

Ｓ３５２では、Ｓ３５１にて選択された表示対象となるグラフについて、その表示順序が設定される。具体的には、目的変数の変動量が最も大きいものを１番目とし、目的変数の変動量が大きいものから順に並べるように表示順序が設定される。

【0163】

Ｓ３６では、Ｓ３５での推論処理により得られた推論結果が表示部２に表示される。表示部２には、Ｓ３５２にて設定された表示順序に従って、表示対象に選択されたグラフが表示される。

【0164】

図１７は、第１構成例における推論結果の表示例を模式的に示す図である。図１７には、図１１に示した表示部２から推論結果を表示する表示領域７６が抜き出されて模式的に示されている。

【0165】

図１７の例では、表示部２の表示領域７６には、変動値となる説明変数と表示対象となる目的変数との関係を示す複数のグラフ９４，９６，９８が表示されている。グラフ９４は、説明変数Ｘ１を横軸とし、目的変数Ｙ１を縦軸とする２次元グラフである。グラフ９６は、説明変数Ｘ３を横軸とし、目的変数Ｙ１を縦軸とする２次元グラフである。グラフ９８は、説明変数Ｘ７を横軸とし、目的変数Ｙ１を縦軸とする２次元グラフである。

【0166】

グラフ９４，９６，９８の各々において、ΔＹ１は、対応する説明変数を変動範囲内で連続的に変動させたときの目的変数Ｙ１の変動量を示している。グラフ９４は変動量ΔＹ１が最も大きく、グラフ９６は変動量ΔＹ１が２番目に大きい。グラフ９８は変動量ΔＹ１が最も小さい。すなわち、表示領域７６には、目的変数Ｙ１の変動量ΔＹ１の大きいものから順に複数のグラフ９４，９６，９８が並べて表示されている。

【0167】

なお、上述したように、表示領域７６に表示させるグラフの個数は、ユーザが予め設定しておくことができる。例えば、表示領域７６に表示させるグラフの個数がＮ個（Ｎ≧１）に設定されている場合には、目的変数Ｙ１の変動量ΔＹ１が大きいものから順に合計Ｎ個のグラフが表示領域７６に並べて表示される。

【0168】

あるいは、目的変数Ｙ１の変動量ΔＹ１が所定値以上となるグラフを表示領域７６に表示させる構成としてもよい。この場合、目的変数Ｙ１の変動量ΔＹ１が大きいものから順に、変動量ΔＹ１が所定値以上となるグラフが表示領域７６に並べて表示される。

【0169】

以上説明したように、第１構成例によれば、学習済みモデルに与える複数の説明変数のうち、説明変数の変動に対する目的変数の変動量が大きいものが優先的に選択され、選択された説明変数と目的変数との関係を示すグラフが表示部２に表示される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数が自動的に選択され、当該説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。

【0170】

さらに、表示部２には、説明変数の変動に対する目的変数の変動量が大きいグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。

【0171】

（２）第２構成例
上述した第１構成例では、学習済みモデルに与える複数の説明変数の全てを変動値とするため、説明変数の個数が増えるに従って推論処理にかかる演算量が増大することが懸念される。そこで、第２構成例および後述する第３構成例では、推論処理を実行する前に、変動値となる説明変数をデータ処理装置１が自動的に選択する構成について説明する。

【0172】

図１８は、実施の形態３の第２構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。図１８に示すフローチャートは、図１０に示したフローチャートに対して、Ｓ３２をＳ３２１に置き換えるとともに、Ｓ３５３を追加したものである。

【0173】

図１８を参照して、図１０と同じＳ３０，Ｓ３１により、推論処理に使用する学習済みモデルが選択されるとともに、当該学習済みモデルに入力される複数の説明変数の値が設定されると、Ｓ３２１では、データ処理装置１の推論部３２は、当該学習済みモデルに入力される各説明変数の重要度（importance）を取得する。

【0174】

各説明変数の重要度は、該当する説明変数がモデルの性能にどれだけ寄与したかを数値化したものである。具体的には、複数の説明変数に決定木アルゴリズムを適用することにより、各説明変数の重要度を算出することができる。なお、決定木アルゴリズムとしては公知の任意のアルゴリズムを採用できるが、例えば、ランダムフォレストなどを用いることができる。

【0175】

推論部３２は、各説明変数の重要度に基づいて、変動値となる説明変数を選択する。具体的には、推論部３２は、重要度が高い説明変数を、優先的に変動値となる説明変数に選択する。変動値となる説明変数の個数は、ユーザが予め設定しておくことができる。例えば、重要度が最も高いものから数えて所定数の説明変数を変動値とすることができる。あるいは、重要度が所定値以上である説明変数を変動値とすることができる。

【0176】

Ｓ３２１にて変動値となる説明変数が選択されると、Ｓ３３において、推論部３２は、各説明変数の変動範囲を設定する。各説明変数の変動範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから各説明変数に対応するデータを抽出し、抽出したデータの最小値を変動範囲の下限値に設定し、かつ、当該データの最大値を変動範囲の上限値に設定することができる。

【0177】

【0178】

図１０と同じＳ３５では、Ｓ３０にて選択された学習済みモデルに対して、Ｓ３１およびＳ３２１にて設定された説明変数が入力されることにより、目的変数が予測される。この推論処理では、推論部３２は、変動値となる説明変数のうちの１つの説明変数を所定の刻み幅で連続的に変動させるとともに、当該説明変数の各値に対応する目的変数を予測する。

【0179】

なお、当該１つの説明変数を変動させるときに、当該説明変数以外の他の説明変数の値は固定値とされる。例えば、他の説明変数の値はＳ３１で設定された値に固定される。この値は、解析対象となるサンプルのレシピデータ、物性データ、分析データおよび特徴量に基づいている。推論部３２は、１つの説明変数の変動に対する目的変数の変動が予測されると、別の１つの説明変数を変動させて目的変数の変動を予測する。変動値となる説明変数の全てについて目的変数の変動が予測されると、Ｓ３５の推論処理は終了する。

【0180】

Ｓ３５の推論処理が終了すると、Ｓ３５３において、表示データ生成部３４は、各説明変数の重要度に基づいて、推論結果として表示させるグラフの表示順序を設定する。具体的には、最も重要度が高い説明変数についての推論結果を示すグラフを１番目とし、説明変数の重要度が高いものから順に並べるようにグラフの表示順序が設定される。

【0181】

Ｓ３６では、表示データ生成部３４は、Ｓ３５での推論処理により得られた推論結果を表示部２に表示する。表示部２には、Ｓ３５２にて設定された表示順序に従って、表示対象に選択されたグラフが表示される。

【0182】

以上説明したように、第２構成例によれば、学習済みモデルに与える複数の説明変数のうち、学習済みモデルにおける重要度が高い説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが表示部２に表示される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。

【0183】

さらに、表示部２には、目的変数に対する説明変数の影響度が高いグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。

【0184】

（３）第３構成例
図１９は、実施の形態３の第３構成例に係るデータ処理装置における推論処理を説明するためのフローチャートである。図１９に示すフローチャートは、図１０に示したフローチャートに対して、Ｓ３２をＳ３２２，Ｓ３２３に置き換えるとともに、Ｓ３５４を追加したものである。

【0185】

図１９を参照して、図１０と同じＳ３０，Ｓ３１により、推論処理に使用する学習済みモデルが選択されるとともに、当該学習済みモデルに入力される複数の説明変数の値が設定されると、推論部３２は、複数の説明変数の中から変動値となる説明変数を選択する。第３構成例では、複数の説明変数に対して実施された主成分分析を利用して、変動値となる説明変数が選択される。

【0186】

主成分分析は、一般的に、大量のデータに対する前処理として、データの次元数を減らすために実施される。主成分分析を実施することにより、複数の説明変数は、より少数の合成変数（主成分）に集約される。主成分分析の結果は、元の説明変数に対応した変換後の値である主成分得点と、各主成分得点に対する説明変数の重みに相当する主成分負荷量として得られる。

【0187】

Ｓ３２２では、主成分分析により得られた所定数の主成分の中から、１つの主成分が選択される。例えば、推論部３２は、ユーザ入力に従って１つの主成分を選択することができる。この場合、ユーザは、各主成分の寄与率に基づいて１つの主成分を選択することができる。なお、主成分の寄与率は、各主成分の固有値をその総和で割ったものであり、各主成分が全体の中でどれだけの変動の割合を占めるかを示している。なお、推論部３２は、ユーザ入力に依らず、寄与率が最も高い第１主成分を選択する構成としてもよい。

【0188】

Ｓ３２３では、推論部３２は、Ｓ３２２により選択された１つの主成分における各説明変数の重み（主成分負荷量）に基づいて、変動値となる説明変数を選択する。

【0189】

具体的には、第ｉ番目の主成分ｚは、元のｐ個の変数Ｘ１，Ｘ２，・・・Ｘｐに重みｗ（主成分負荷量）を掛けて合成したものであり、次式で表すことができる。なお、ｐ個のｗｊ（ｊ＝１，２，・・・ｐ）の二乗和は１である。

【0190】

ｚ＝ｗ１Ｘ１＋ｗ２Ｘ２＋・・・＋ｗｐＸｐ
上記式において、重みｗ（主成分負荷量）の絶対値が大きいほど、対応する説明変数Ｘは主成分ｚへの貢献度が高い、すなわち、主成分を特徴づける説明変数であると言える。そこで、Ｓ３２３では、推論部３２は、重み（主成分負荷量）が大きい説明変数を、優先的に変動値となる説明変数に選択する。

【0191】

なお、変動値となる説明変数の個数は、ユーザが予め設定しておくことができる。例えば、重み（主成分負荷量）が最も高いものから数えて所定数の説明変数を変動値とすることができる。あるいは、重み（主成分負荷量）が所定値以上である説明変数を変動値とすることができる。

【0192】

Ｓ３２３にて変動値となる説明変数が選択されると、Ｓ３３において、推論部３２は、各説明変数の変動範囲を設定する。各説明変数の変動範囲は、学習済みモデルの生成に用いた教師データに基づいて設定することができる。例えば、教師データから各説明変数に対応するデータを抽出し、抽出したデータの最小値を変動範囲の下限値に設定し、かつ、当該データの最大値を変動範囲の上限値に設定することができる。

【0193】

【0194】

図１０と同じＳ３５では、推論部３２は、Ｓ３０にて選択された学習済みモデルに対して、Ｓ３１およびＳ３２１にて設定された説明変数を入力することにより、目的変数を予測する。この推論処理では、変動値となる説明変数のうちの１つの説明変数を所定の刻み幅で連続的に変動させるとともに、当該説明変数の各値に対応する目的変数が予測される。なお、当該１つの説明変数を変動させるときに、当該説明変数以外の他の説明変数の値は固定値とされる。例えば、他の説明変数の値はＳ３１で設定された値に固定される。推論部３２は、１つの説明変数の変動に対する目的変数の変動が予測されると、別の１つの説明変数を変動させて目的変数の変動を予測する。変動値となる説明変数の全てについて目的変数の変動が予測されると、Ｓ３５の推論処理は終了する。

【0195】

Ｓ３５の推論処理が終了すると、Ｓ３５３により、表示データ生成部３４は、各説明変数の重み（主成分負荷量）に基づいて、推論結果として表示させるグラフの表示順序を設定する。具体的には、最も重み（主成分負荷量）が高い説明変数についての推論結果を示すグラフを１番目とし、説明変数の重み（主成分負荷量）が高いものから順に並べるようにグラフの表示順序が設定される。

【0196】

Ｓ３６では、表示データ生成部３４は、Ｓ３５での推論処理により得られた推論結果を表示部２に表示する。表示部２には、Ｓ３５４にて設定された表示順序に従って、表示対象に選択されたグラフが表示される。

【0197】

以上説明したように、第３構成例によれば、学習済みモデルに与える複数の説明変数のうち、特定の主成分に対する重み（主成分負荷量）が大きい説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが表示部２に表示される。これによると、ユーザの経験値やスキルレベルに依らず、主成分への貢献度が高い説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。

【0198】

さらに、表示部２には、説明変数の主成分負荷量が大きいグラフから順に表示されるため、主成分への貢献度が高い説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。

【0199】

［実施の形態４］
学習フェーズでは、生成された教師データの説明変数を学習モデルの入力とし、教師データの目的変数を当該学習モデルの出力の正解データとする教師あり学習が行われる。実施の形態４では、学習モデルをユーザが選択することができる構成について説明する。なお、実施の形態４に係るデータ処理装置の動作は、以下に説明する学習処理を除いて、上述した実施の形態１に係るデータ処理装置の動作と基本的に同じである。

【0200】

図２０は、実施の形態４に係るデータ処理装置における教師データの生成（図４のＳ０２）、機械学習（図４のＳ０３）および学習済みモデルの記憶（図４のＳ０４）の処理手順を説明するためのフローチャートである。図２０に示すフローチャートは、図７に示したフローチャートに対して、Ｓ２３０を追加したものである。

【0201】

図２０を参照して、図７と同じＳ２０～Ｓ２３により教師データが生成されると、Ｓ２３０により、機械学習に使用する学習モデルが選択される。表示部２には、ＵＩ画面（モデル選択画面）が表示される。モデル選択画面は、ユーザが、学習モデルを選択するためのＵＩ画面である。モデル選択画面には、複数の学習モデルがリスト表示される。複数の学習モデルは、例えば多項式回帰モデルであって、多項式の次数が互いに異なっている。加えて、ユーザは項同士の交互作用項や、対数、指数の項を追加することができる。

【0202】

機械学習では、多項式の次数を大きくしたり、交互作用項、対数、指数を含めることでモデルを複雑にするに従って、学習用データに対する精度が高められる反面、未知のデータに対する精度が下がってしまう「過学習」となる場合がある。

【0203】

実施の形態４では、学習モデルを複雑にすることで、教師データを構成する説明変数と目的変数との複雑な関係を表現することができる。一方、学習モデルを単純にすることで、上述した過学習を回避することができる。図２０のＳ２３０では、ユーザは、これらのメリットおよびデメリットを比較考量したうえで学習モデルの次数を選択することができるため、最適な機械学習を実施することが可能となる。

【0204】

［実施の形態５］
上述した実施の形態１では、データベース１５に格納されたデータに基づいて、サンプルリスト（図６）が生成される（図４のＳ０１および図５）。このとき、サンプルの分析データを専用のデータ解析ソフトウェアを用いて解析することによって、サンプルの特徴量が抽出される（図５のＳ１３）。特徴量は、ＧＣ－ＭＳにて取得されたクロマトグラムを解析して得られた所定の質量数に対するピーク面積、ＮＭＲにて取得されたＮＭＲスペクトルを解析して得られた所定の物質の存在比、ＳＥＭにて取得されたＳＥＭ画像を解析して得られた、三元触媒中に存在する粒子の粒子径、平均粒子径、および、ＴＥＭにて取得されたＴＥＭ画像を解析して得られた、三元触媒中に存在する粒子の粒子径などを含む。

【0205】

これらの特徴量を抽出する処理では、分析データを処理する条件を変更することによって、あるいは、特徴量を算出する条件を変更することによって、同じサンプルの分析データであっても、抽出される特徴量が異なる値となる場合がある。この場合、サンプルリストから生成される教師データが、分析データの処理条件・特徴量の算出条件によって異なるものとなるため、教師データから生成される学習済みモデルも、分析データの処理条件・特徴量の算出条件によって異なるものとなる。学習済みモデルが異なれば、推論処理において、学習済みモデルに与えられる説明変数が同じであっても、予測される目的変数が異なるものとなり得る。そのため、推論結果から導かれる、説明変数が目的変数に与える影響度も、学習済みモデルの違いによって異なる結果となり得る。

【0206】

実施の形態５では、説明変数が目的変数に与える影響度を考察するのに適当なデータの処理条件を取得するための構成について説明する。以下では、学習フェーズおよび推論フェーズの各々において実施の形態５に係るデータ処理装置が行う処理を説明する。

【0207】

＜学習フェーズ＞
図２１は、サンプルリストの構成例を示す図である。図２１には、サンプルが三元触媒である場合のサンプルリストの構成例が示されている。図２１に示すサンプルリストは、図６に示したサンプルリストとは、サンプルの分析データを複数の処理条件で処理することによってそれぞれ抽出された複数の特徴量を含んでいる点が異なる。

【0208】

図２１の例では、特徴量は、ＧＣ－ＭＳにて取得されたクロマトグラムを解析して得られた、第１の質量数に対するピーク面積１および第２の質量数に対するピーク面積２を含んでいる。

【0209】

ピーク面積１は、データの処理条件（ピーク面積の算出方法）が互いに異なる３つの値Ｐａ，Ｐｂ，Ｐｃから構成されている。Ｐａは処理条件Ａを用いて算出されたピーク面積１であり、Ｐｂは処理条件Ｂを用いて算出されたピーク面積１であり、Ｐｃは処理条件Ｃを用いて算出されたピーク面積１である。ピーク面積２は、データの処理条件（ピーク面積の算出方法）が互いに異なる３つの値Ｑａ，Ｑｂ，Ｑｃから構成されている。Ｑａは処理条件Ａを用いて算出されたピーク面積２であり、Ｑｂは処理条件Ｂを用いて算出されたピーク面積２であり、Ｑｃは処理条件Ｃを用いて算出されたピーク面積２である。

【0210】

教師データを生成する処理（図４のＳ０２）では、教師データの生成に使用するサンプルが選択されると（図７のＳ２０）、図２１に示すサンプルリストから、選択されたサンプルの行に含まれるデータが抽出されて選択サンプル抽出テーブルが生成される。図２２は、選択サンプル抽出テーブルの構成例を示す図である。図２２には、３種類の選択サンプル抽出テーブルが示されている。

【0211】

選択サンプル抽出テーブルＡは、処理条件Ａを用いて得られた特徴量であるピーク面積１およびピーク面積２を含んで構成されている。選択サンプル抽出テーブルＢは、処理条件Ｂを用いて得られた特徴量であるピーク面積１およびピーク面積２を含んで構成されている。選択サンプル抽出テーブルＣは、処理条件Ｃを用いて得られた特徴量であるピーク面積１およびピーク面積２を含んで構成されている。

【0212】

すなわち、選択サンプル抽出テーブルＡ～Ｃは、同じサンプルの分析データから生成されたものであるが、当該分析データから特徴量を抽出するためのデータ処理条件が互いに異なっている。その結果、選択サンプル抽出テーブルＡ～Ｃは、データの種別が同じであるが、データの値が互いに異なるものとなっている。

【0213】

教師データの生成に使用する説明変数および目的変数が選択されると（図７のＳ２１，Ｓ２２）、選択サンプル抽出テーブルＡ～Ｃの各々から、説明変数に合致するデータおよび目的変数に合致するデータが抽出されて、３種類の教師データテーブルが生成される。３種類の教師データテーブルの各々には、サンプルごとに、説明変数に合致するデータ、および目的変数に合致するデータが入力される。そして、この生成された３種類の教師データテーブルに基づいて、教師データＡ～Ｃが生成される。

【0214】

教師データＡ～Ｃを用いて教師有り学習が行われることにより、３種類の学習済みモデルが生成される。学習済みモデルＭＯＤＥＬ１ａは、教師データＡを用いた機械学習により生成された学習済みモデルである。学習済みモデルＭＯＤＥＬ１ｂは、教師データＢを用いた機械学習により生成された学習済みモデルである。学習済みモデルＭＯＤＥＬ１ｃは、教師データＣを用いた機械学習により生成された学習済みモデルである。

【0215】

生成された学習済みモデルＭＯＤＥＬ１ａ，ＭＯＤＥＬ１ｂ，ＭＯＤＥＬ１ｃは、データベース１５に格納されている学習済みモデルリストに登録される。図２３は、学習済みモデルリストの構成例を示す図である。図２３に示す学習済みモデルリストは、図９に示した学習済みモデルリストとは、教師データを識別するための識別情報に、分析データから特徴量を抽出するために使用したデータ処理条件が含まれている点が異なる。

【0216】

学習済みモデルＭＯＤＥＬ１ａ，ＭＯＤＥＬ１ｂ，ＭＯＤＥＬ１ｃは、学習済みモデルが適用されるプロジェクトの名称、教師データの生成に使用したサンプル情報、説明変数および目的変数に選択されたデータの種別が互いに共通している。その一方で、当該データを生成するために使用された、分析データの処理条件（例えば、クロマトグラムのピーク面積の算出方法）が互いに異なっている。

【0217】

＜推論フェーズ＞
図２４は、実施の形態５に係るデータ処理装置における推論処理（図４のＳ０５～Ｓ０７）の処理手順を説明するためのフローチャートである。図２４に示すフローチャートは、図１０に示したフローチャートにおけるＳ３０をＳ３００に置き換えるとともに、Ｓ３６をＳ３６０～Ｓ３６２に置き換えたものである。

【0218】

図２４を参照して、Ｓ３００では、推論処理に使用する複数の学習済みモデルが選択される。表示部２には、データベース１５に格納される学習済みモデルリスト（図２３）に基づいた生成されたＵＩ画面（学習済みモデル選択画面）が表示される。ユーザは、操作部３を用いてＵＩ画面を操作することにより、分析データの処理条件のみが互いにことなる複数の学習済みモデルを選択することができる。以下では、学習済みモデルＭＯＤＥＬ１ａ，ＭＯＤＥＬ１ｂ，ＭＯＤＥＬ１ｃが選択された場合を想定する。

【0219】

図１０と同じＳ３１では、各学習済みモデルに入力される説明変数の値が設定される。Ｓ３２では、複数の説明変数の中から、「変動値となる説明変数」が選択される。Ｓ３３では、変動値となる説明変数について、その変動範囲が設定される。Ｓ３４では、各学習済みモデルから予測される目的変数のうち、表示対象となる目的変数が選択される。

【0220】

図１０と同じＳ３５では、Ｓ３００にて選択された複数の学習済みモデルの各々に対して、Ｓ３１～Ｓ３３にて設定された説明変数を入力することにより、目的変数が予測される。この推論処理では、学習済みモデルごとに、複数の説明変数のうちの連続的に変動する一部の説明変数の各値に対応して、目的変数がどのように変動するのかが予測される。

【0221】

Ｓ３６０では、Ｓ３５での推論処理により得られた複数の推論結果が表示部２に表示される。表示部２には、複数の学習済みモデルにそれぞれ対応して、表示対象に選択された目的変数について、一部の説明変数の変動に対する変動を示すグラフが表示される。

【0222】

図２５は、表示部２における複数の推論結果の表示例を模式的に示す図である。図２５には、表示部２のうち推論結果を表示する表示領域７６が抽出して示されている。

【0223】

表示領域７６には、学習済みモデルＭＯＤＥＬ１ａを用いた推論処理の推論結果が表示される表示領域７６Ａ、学習済みモデルＭＯＤＥＬ１ｂを用いた推論処理の推論結果が表示される表示領域７６Ｂ、および学習済みモデルＭＯＤＥＬ１ｃを用いた推論処理の推論結果が表示される表示領域７６Ｃが設けられている。

【0224】

表示領域７６Ａ，７６Ｂ，７６Ｃの各々には、変動値となる説明変数と表示対象となる目的変数との関係を示すグラフ９０，９２が表示される。図２５の例では、変動値となる説明変数として「ピーク面積１」が選択され、表示対象となる目的変数として「ＮＯｘの浄化率（％）」および「耐熱性能」が選択されている。グラフ９０，９２は、ピーク面積１を予め定められた変動範囲内で連続的に変動させたときに、ＮＯｘの浄化率（％）および耐熱性能がどのように変動するのかを示している。

【0225】

表示領域７６Ａ，７６Ｂ，７６Ｃの間でグラフ９０を比較すると、学習済みモデルの違いから、解析対象のサンプルが同じであっても、説明変数が目的変数に与える影響度の大きさに違いが生じていることが分かる。グラフ９２においても同様のことがいえる。

【0226】

ユーザは、これら３つの表示領域７６Ａ，７６Ｂ，７６Ｃに表示されたグラフ９０，９２を比較することにより、説明変数と目的変数との関係を考察するうえで適当と思われる学習済みモデルを選択することができる。

【0227】

図２５では、３つの表示領域７６Ａ，７６Ｂ，７６Ｃが並んで表示される例を示したが、１つの表示領域のみが表示されてる状態でユーザの操作に応じて表示領域７６Ａ，７６Ｂ，７６Ｃを切り替えて表示する構成としてもよい。

【0228】

図２４に戻って、Ｓ３６１では、適当な学習済みモデルがユーザによって選択される。例えば、表示部２には、適当な学習済みモデルを選択するためのＵＩ画面が表示される。ユーザは、操作部３を用いてＵＩ画面を操作することにより、適当な学習済みモデルを選択することができる。Ｓ３６２では、ユーザにより選択された、適当な学習済みモデルに関する情報がデータベース１５に保存される。適当な学習済みモデルに関する情報には、当該学習済みモデルが適用されるプロジェクトの名称、教師データの生成に使用したサンプル情報、説明変数および目的変数に選択されたデータの種別、および、当該データを抽出するために使用された、分析データの処理条件が含まれている。

【0229】

このように推論結果に基づいて選択された、適当な学習済みモデルに関する情報をデータベース１５に保存しておくことにより、将来、今回の推論処理において解析対象となったサンプルと類似するサンプルを用いて学習済みモデルを生成する場面において、適当な学習済みモデルの生成に使用されたデータ処理条件をデータベース１５から読み出して、ユーザに提示することが可能となる。なお、サンプルが類似しているとは、サンプルのレシピデータ、物性データおよび分析データの少なくとも１つが同じまたは近似していることを意味する。

【0230】

図２６は、サンプルリストの生成（図４のＳ０１）の処理手順を説明するためのフローチャートである。図２６に示すフローチャートは、図５に示したフローチャートにＳ１２０，Ｓ１２１を追加したものである。

【0231】

図５と同じＳ１０～Ｓ１２によりサンプル情報、サンプルの物性データ、およびサンプルの分析データが取得されると、Ｓ１２０では、これらのデータを参照することにより、今回のサンプルと類似するサンプルにおける分析データの処理条件がデータベース１５から読み出されて表示部２に表示される。データベース１５から読み出された分析データの処理条件は、過去にユーザが、説明変数と目的変数との関係を考察するのに適当と判断した学習済みモデルに関する情報に含まれている。

【0232】

Ｓ１２１では、操作部３を介して、Ｓ１２で取得された分析データの処理条件が設定される。図５と同じＳ１３では、Ｓ１２にて取得された分析データを、Ｓ１２１にて設定された処理条件を用いて処理することにより、サンプルの特徴量が抽出される。Ｓ１４では、取得されたサンプル情報、サンプルの物性データ、ならびにサンプルの分析データおよび特徴量がサンプルリスト（図６）に入力される。Ｓ１５では、サンプルリストは、サンプルリストの識別情報が付与されてデータベース１５に登録される。

【0233】

このように学習フェーズでは、説明変数と目的変数との関係を考察するうえで適当と判断されたデータ処理条件を用いて、サンプルの分析データから特徴量が抽出されてサンプルリストが生成される。そして、このサンプルリストに基づいて生成された教師データを使用して学習済みモデルが生成される。このようにすると、推論フェーズにおいて、当該学習済みモデルに与えられる説明変数と、当該学習済みモデルから予測される目的変数との関係は、ユーザが適当と判断したものに従ったものになる。したがって、推論結果の有用性を高めることが可能となる。

【0234】

［その他の構成例］
（１）上述した実施の形態では、推論処理が実行される際にユーザの操作を受け付けるためのＵＩ画面、および推論結果（図１１および図１２参照）をデータ処理装置１に接続される表示部２に表示させる構成例について説明したが、表示部２に代えて、例えば、デスクトップ型のパーソナルコンピュータ（ＰＣ）、ノート型ＰＣ、および携帯端末（タブレット端末、スマートフォン）などの情報端末をデータ処理装置１に接続し、当該情報端末にＵＩ画面および推論結果を表示させる構成としてもよい。

【0235】

（２）上述した実施の形態では、推論処理に使用する学習済みモデルを選択することによって、学習済みモデルに入力される説明変数のデータの種別、および、学習済みモデルによって予測される目的変数のデータの種別が自動的に決定される構成例について説明したが、学習済みモデルに入力される説明変数のデータの種別、および、予測したい目的変数のデータの種別を選択することによって、推論処理に使用する学習済みモデルが自動的に決定される構成とすることも可能である。この場合、ユーザは、表示部２に表示されるＵＩ画面（目的変数選択画面および説明変数選択画面）上の選択用アイコンに操作部３を用いてチェックを入れることによって、説明変数のデータ種別および目的変数のデータの種別を選択することができる。推論部３２は、データベース１５に格納される学習済みリスト（図９）を参照し、選択された説明変数のデータ種別および目的変数のデータの種別を含む教師データに紐付けられた学習済みモデルを、推定処理に使用する学習済みモデルに決定することができる。

【0236】

（３）上述した実施の形態では、データ処理装置１が学習部３０および推論部３２を備える構成を例示したが（図３参照）、学習部３０および推論部３２をそれぞれ別体として設ける構成としてもよい。

【0237】

［態様］
上述した複数の例示的な実施形態は、以下の態様の具体例であることが当業者により理解される。

【0238】

（第１項）一態様に係るデータ処理装置は、学習済みモデルを用いて、複数の説明変数から目的変数を予測する推論部と、推論部による推論結果を表示するためのデータを生成する表示データ生成部とを備える。推論部は、複数の説明変数の中から選択された第１の説明変数を変動値とする一方で、第１の説明変数以外の第２の説明変数を固定値とする。推論部は、学習済みモデルを用いて、第１の説明変数を予め定められた変動範囲内で連続的に変動させたときの目的変数を予測する。表示データ生成部は、第１の説明変数の変動に対する目的変数の変動を示すデータを生成する。

【0239】

第１項に記載のデータ処理装置によれば、ユーザは、表示されたデータに基づいて、変動値となる第１の説明変数を連続的に変動させたときに、目的変数がどのように変動するのかを容易に予測することができる。よって、推論結果の有用性を高めることができる。

【0240】

（第２項）第１項に記載のデータ処理装置において、表示データ生成部は、第１の説明変数を第１軸とし、目的変数を第２軸とする２次元グラフを生成する。

【0241】

第２項に記載のデータ処理装置によれば、ユーザは、表示された２次元グラフに基づいて、第１の説明変数の変動に対する目的変数の変動を視覚的に容易に予測することができる。

【0242】

（第３項）第１項または第２項に記載のデータ処理装置において、推論部は、複数の説明変数の中から２以上の第１の説明変数を選択する。推論部は、選択された２以上の第１の説明変数の各々について、学習済みモデルを用いて、第１の説明変数を変動範囲内で連続的に変化させたときの目的変数を予測する。データ処理装置には表示部が接続されている。表示データ生成部は、２以上の第１の説明変数にそれぞれ対応して２以上の２次元グラフを生成する。表示データ生成部は、生成した２以上の２次元グラフが互いに重畳するように表示部に表示する。

【0243】

第３項に記載のデータ処理装置によれば、表示部に重畳表示された２以上の２次元グラフに基づいて、２以上の第１の説明変数の各々が目的変数に与える影響度を相対的に評価することが可能となる。

【0244】

（第４項）第１項から第３項に記載のデータ処理装置において、表示データ生成部は、第１の説明変数の選択および変動範囲の設定のための第１のユーザインターフェイスを提供するように構成される。第１のユーザインターフェイスは、変動範囲の推奨範囲に関する情報を含む。

【0245】

第４項に記載のデータ処理装置によれば、推論処理におけるユーザの利便性を向上させることができる。

【0246】

（第５項）第４項に記載のデータ処理装置において、学習済みモデルは、複数の説明変数を入力とし、目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルである。推奨範囲は、教師データに含まれる第１の説明変数の値に基づいて設定される。

【0247】

第５項に記載のデータ処理装置によれば、推論結果の精度が保証された推奨範囲をユーザに提供することができる。

【0248】

（第６項）第４項または第５項に記載のデータ処理装置において、表示データ生成部はさらに、第２の説明変数の値を設定するための第２のユーザインターフェイスを提供する。第６項に記載のデータ処理装置によれば、推論処理におけるユーザの利便性を向上させることができる。

【0249】

（第７項）第１項から第６項に記載のデータ処理装置において、学習済みモデルは、複数の説明変数を入力とし、目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルである。推論部は、学習済みモデルにおける各説明変数の重要度に基づいて、複数の説明変数の中から少なくとも１つの第１の説明変数を選択する。推論部は、選択された少なくとも１つの第１の説明変数の各々について、学習済みモデルを用いて、第１の説明変数を変動範囲内で連続的に変動させたときの目的変数を予測する。

【0250】

第７項に記載のデータ処理装置によれば、学習済みモデルに与える複数の説明変数のうち、学習済みモデルにおける重要度が高い説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが生成される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数の変動に対する目的変数の変動の推論結果が得られる。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。

【0251】

（第８項）第７項に記載のデータ処理装置において、変動範囲は、教師データに含まれる第１の説明変数の値に基づいて設定される。第８項に記載のデータ処理装置によれば、推論結果の精度が保証された変動範囲を設定することができる。

【0252】

（第９項）第７項または第８項に記載のデータ処理装置において、データ処理装置には表示部が接続されている。表示データ生成部は、少なくとも１つの第１の説明変数にそれぞれ対応して少なくとも１つのデータを生成する。表示データ生成部は、生成した少なくとも１つのデータを、対応する第１の説明変数の重要度が高いものから順に表示部に表示する。

【0253】

第９項に記載のデータ処理装置によれば、表示部には、目的変数に対する説明変数の影響度が高いグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。

【0254】

（第１０項）第１項から第６項に記載のデータ処理装置において、推論部は、複数の説明変数の主成分分析により求められた特定の主成分に対する各説明変数の主成分負荷量の絶対値に基づいて、複数の説明変数の中から少なくとも１つの第１の説明変数を選択する。推論部は、選択された少なくとも１つの第１の説明変数の各々について、学習済みモデルを用いて、第１の説明変数を前記変動範囲内で連続的に変動させたときの目的変数を予測する。

【0255】

第１０項に記載のデータ処理装置によれば、学習済みモデルに与える複数の説明変数のうち、特定の主成分に対する重み（主成分負荷量）が大きい説明変数が変動値に選択され、選択された説明変数と目的変数との関係を示すグラフが生成される。これによると、ユーザの経験値やスキルレベルに依らず、主成分への貢献度が高い説明変数の変動に対する目的変数の変動の推論結果が得られる。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。

【0256】

（第１１項）第１０項に記載のデータ処理装置において、学習済みモデルは、複数の説明変数を入力とし、目的変数を正解出力とする教師データを用いた機械学習によって生成されたモデルである。変動範囲は、教師データに含まれる第１の説明変数の値に基づいて設定される。

【0257】

第１１項に記載のデータ処理装置によれば、推論結果の精度が保証された変動範囲を設定することができる。

【0258】

（第１２項）第１０項または第１１項に記載のデータ処理装置において、データ処理装置には表示部が接続されている。表示データ生成部は、少なくとも１つの第１の説明変数にそれぞれ対応して少なくとも１つのデータを生成する。表示データ生成部は、生成した少なくとも１つのデータを、対応する第１の説明変数の主成分負荷量が高いものから順に表示部に表示する。

【0259】

第１２項に記載のデータ処理装置によれば、表示部には、説明変数の主成分負荷量が大きいグラフから順に表示されるため、主成分への貢献度が高い説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。

【0260】

（第１３項）第１項から第６項に記載のデータ処理装置において、データ処理装置には表示部が接続されている。推論部は、複数の説明変数の各々を順番に第１の説明変数に選択する。推論部は、選択された各説明変数について、学習済みモデルを用いて、第１の説明変数を変動範囲内で連続的に変動させたときの目的変数を予測する。表示データ生成部は、複数の説明変数にそれぞれ対応して複数のデータを生成する。表示データ生成部は、生成した複数のデータを、目的変数の変動量が大きいものから順に表示部に表示する。

【0261】

第１３項に記載のデータ処理装置によれば、学習済みモデルに与える複数の説明変数のうち、説明変数の変動に対する目的変数の変動量が大きいものが優先的に選択され、選択された説明変数と目的変数との関係を示すグラフが生成される。これによると、ユーザの経験値やスキルレベルに依らず、目的変数に対する影響度が大きい説明変数が自動的に選択され、当該説明変数の変動に対する目的変数の変動の推論結果が表示される。そのため、ユーザが、重要な説明変数について考察を見落とす可能性を低減することができる。さらに、表示部には、説明変数の変動に対する目的変数の変動量が大きいグラフから順に表示されるため、目的変数に対する影響度が大きい説明変数についてのグラフを効果的に表示させることができる。よって、推論結果の有用性を向上させることができる。

【0262】

（第１４項）第１項から第１３項に記載のデータ処理装置において、推論部は、複数の説明変数の中から２以上の第１の説明変数を選択する。推論部は、選択された２以上の第１の説明変数の各々について、学習済みモデルを用いて、第１の説明変数を変動範囲内で連続的に変化させたときの目的変数を予測する。表示データ生成部は、２以上の第１の説明変数にそれぞれ対応して２以上のデータを生成する。データ処理装置は、２以上の第１の説明変数のうち、目的変数に対する影響度が最も大きい第１の説明変数の種別を、学習済みモデルが適用されるプロジェクトに関する情報と紐付けて記憶するためのデータベースをさらに備える。

【0263】

第１４項に記載のデータ処理装置によれば、次回、学習モデルを学習させるとき、データベースに記憶された情報を参照しながら、教師データを入力する学習モデルが適用されるプロジェクトに応じて、説明変数および目的変数を選択することができる。

【0264】

（第１５項）第１４項に記載のデータ処理装置は、複数の説明変数を入力とし、目的変数を正解出力とする教師データを生成する教師データ生成部と、教師データを用いた機械学習によって、学習済みモデルを生成する学習部とをさらに備える。教師データ生成部は、プロジェクトおよび当該プロジェクトに紐付けられた第１の説明変数の種別を、ユーザに提示する。

【0265】

第１５項に記載のデータ処理装置によれば、ユーザは、教師データを入力する学習モデルが適用されるプロジェクトに応じて、説明変数および目的変数を選択することができる。例えば、ユーザは、プロジェクトが同じである学習済みモデルの目的変数および当該目的変数に対する影響度が大きい説明変数を、目的変数および説明変数にそれぞれ選択することができる。これによると、目的変数に対する影響度が大きい説明変数を教師データとして学習済みモデルが生成されるため、プロジェクトに対する学習済みモデルの有用性を高めることができる。

【0266】

（第１６項）第１項から第１３項に記載のデータ処理装置は、複数の説明変数を入力とし、目的変数を正解出力とする教師データを生成する教師データ生成部と、教師データを用いた機械学習によって、学習済みモデルを生成する学習部と、学習済みモデルを、教師データと紐付けて記憶するためのデータベースとをさらに備える。

【0267】

第１６項に記載のデータ処理装置によれば、学習モデルの機械学習と、学習済みモデルを用いた推論とを１台の装置で実行することができる。

【0268】

（第１７項）第１６項に記載のデータ処理装置において、教師データ生成部は、１つのデータ群から互いに異なる複数のデータ処理条件を用いて抽出された複数の特徴量をそれぞれ含むように、複数の教師データを生成する。学習部は、機械学習によって、複数の教師データにそれぞれ対応する複数の学習済みモデルを生成する。学習部は、生成した複数の学習済みモデルの各々を、対応するデータ処理条件と紐付けてデータベースに記憶する。

【0269】

第１７項に記載のデータ処理装置によれば、１つのデータ群から、データ処理条件が互いに異なる複数の教師データが生成され、この複数の教師データを使用して複数の学習済みモデルがそれぞれ生成される。この複数の学習済みモデルに共通の説明変数を与えて推論を行うことにより、データ処理条件と、説明変数が目的変数に与える影響度との関係を知ることができる。

【0270】

（第１８項）第１７項に記載のデータ処理装置において、推論部は、複数の学習済みモデルの各々を用いて、第１の説明変数を変動範囲内で連続的に変動させたときの目的変数を予測する。表示データ生成部は、複数の学習済みモデルにそれぞれ対応して、第１の説明変数の変動に対する目的変数の変動を示す複数のデータを生成する。

【0271】

第１８項に記載のデータ処理装置によれば、ユーザは、生成された複数のデータを比較することにより、第１の説明変数と目的変数との関係を考察するうえで適当と思われる学習済みモデル（すなわち、適当なデータ処理条件）を選択することができる。

【0272】

（第１９項）第１８項に記載のデータ処理装置において、複数のデータの中から１つのデータがユーザにより選択された場合には、表示データ生成部は、選択されたデータに対応する学習済みモデルを、適当な学習済みモデルとしてデータベースに記憶する。教師データ生成部は、上記１つのデータ群に類似するデータ群から特徴量が抽出される場合には、適当な学習済みモデルに紐付けられたデータ処理条件をユーザに提示する。

【0273】

第１９項に記載のデータ処理装置によれば、学習フェーズにおいて、第１の説明変数と目的変数との関係を考察するうえで適当と判断されたデータ処理条件を用いて、サンプルの分析データから特徴量が抽出されてサンプルリストを生成することができる。このサンプルリストに基づいて生成された教師データを使用して学習済みモデルが生成されることにより、推論フェーズにおいて、当該学習済みモデルに与えられる第１の説明変数と、当該学習済みモデルから予測される目的変数との関係は、ユーザが適当と判断したものに従ったものになる。したがって、推論結果の有用性を高めることが可能となる。

【0274】

（第２０項）一態様に係る推論方法は、学習済みモデルを用いて、複数の説明変数から目的変数を予測する。推論方法は、複数の説明変数の中から選択された第１の説明変数を変動値とする一方で、第１の説明変数以外の第２の説明変数を固定値とし、かつ、学習済みモデルを用いて、第１の説明変数を予め定められた変動範囲内で連続的に変動させたときの目的変数を予測するステップと、第１の説明変数の変動に対する目的変数の変動を示すデータを生成するステップと、生成するステップにより生成されたデータを表示するステップとを備える。

【0275】

第２０項に記載の推論方法によれば、ユーザは、表示されたデータに基づいて、変動値となる第１の説明変数を連続的に変動させたときに、目的変数がどのように変動するのかを容易に予測することができる。よって、推論結果の有用性を高めることができる。

【0276】

今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

【符号の説明】

【0277】

１データ処理装置、２，６４表示部、３，６３操作部、４分析装置、５装置本体、６情報処理装置、１１，６１ＲＯＭ、１２，６２ＲＡＭ、１３，６６通信Ｉ／Ｆ、１５データベース、２０分析データ取得部、２２特徴量抽出部、２４物性データ取得部、２６サンプル情報取得部、２８教師データ生成部、３０学習部、３２推論部、３４表示データ静止絵部、６７データ取得部、６９情報取得部、７６，７６Ａ～７６Ｃ表示領域、８２アイコン、９０，９２，９４，９６，９８，９９グラフ、１００解析システム。

【図1】