IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 横浜ゴム株式会社の特許一覧

特許7360016データ処理方法、データ処理装置、及びプログラム
<>
  • 特許-データ処理方法、データ処理装置、及びプログラム 図1
  • 特許-データ処理方法、データ処理装置、及びプログラム 図2
  • 特許-データ処理方法、データ処理装置、及びプログラム 図3
  • 特許-データ処理方法、データ処理装置、及びプログラム 図4
  • 特許-データ処理方法、データ処理装置、及びプログラム 図5
  • 特許-データ処理方法、データ処理装置、及びプログラム 図6
  • 特許-データ処理方法、データ処理装置、及びプログラム 図7
  • 特許-データ処理方法、データ処理装置、及びプログラム 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-03
(45)【発行日】2023-10-12
(54)【発明の名称】データ処理方法、データ処理装置、及びプログラム
(51)【国際特許分類】
   G06N 20/00 20190101AFI20231004BHJP
   B60C 19/00 20060101ALI20231004BHJP
   G06F 30/15 20200101ALI20231004BHJP
   G06F 30/27 20200101ALI20231004BHJP
【FI】
G06N20/00
B60C19/00 Z
G06F30/15
G06F30/27
【請求項の数】 10
(21)【出願番号】P 2019139631
(22)【出願日】2019-07-30
(65)【公開番号】P2021022276
(43)【公開日】2021-02-18
【審査請求日】2022-06-17
(73)【特許権者】
【識別番号】000006714
【氏名又は名称】横浜ゴム株式会社
(74)【代理人】
【識別番号】110000165
【氏名又は名称】弁理士法人グローバル・アイピー東京
(72)【発明者】
【氏名】古渡 直哉
(72)【発明者】
【氏名】小石 正隆
【審査官】山本 俊介
(56)【参考文献】
【文献】特開2018-147280(JP,A)
【文献】特開2012-162226(JP,A)
【文献】特表2016-519807(JP,A)
【文献】大辻 弘貴ほか,機械学習による代替モデル生成のための実行基盤,情報処理学会 研究報告 ハイパフォーマンスコンピューティング(HPC),日本,情報処理学会,2019年02月26日,Vol.2019-HPC-168, No.27
(58)【調査した分野】(Int.Cl.,DB名)
G06N 3/00-99/00
B60C 19/00
G06F 30/15
G06F 30/27
(57)【特許請求の範囲】
【請求項1】
コンピュータが、複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを形成するためのデータ処理方法であって、
複数の説明変数それぞれの値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持するデータであって、前記特徴量の値が、測定対象物の実験値である実験データと、前記特徴量の値が、前記測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値であるシミュレーションデータと、を複数保持するオリジナルデータセットを用いて、コンピュータが、前記シミュレーションデータにおける前記特徴量の値と前記実験データにおける前記特徴量の値との間の対応関係に基づいて、前記シミュレーションデータにおける前記特徴量の値を修正した修正シミュレーションデータで構成される修正シミュレーションデータセットを作成するステップと、
前記コンピュータが、前記修正シミュレーションデータセットと前記実験データで構成される実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離することにより、学習用修正シミュレーションデータセット、学習用実験データセット、検証用修正シミュレーションデータセット、及び検証用実験データセットを生成するステップと、
前記コンピュータが、前記学習用修正シミュレーションデータセット及び前記学習用実験データセット、及び前記学習用修正シミュレーションデータセットと前記学習用実験データセットとを統合した学習用統合データセットのそれぞれを用いて、前記コンピュータが、前記説明変数と前記特量との間の関係を機械学習した複数の予測モジュール候補を作成するステップと、
前記コンピュータが、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用修正シミュレーションデータセットと前記検証用実験データセットとを統合した検証用統合データセットを用いて、機械学習した前記複数の予測モジュール候補それぞれに対して予測精度の評価をするステップと、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定するステップと、を備えることを特徴とするデータ処理方法。
【請求項2】
前記シミュレーションデータは、複数の前記実験データにおける前記特徴量の最大値と最小値のそれぞれを実現する前記説明変数の値を用いて、前記シミュレーションモデルを用いて前記シミュレーションを行うことにより算出されたシミュレーション計算値を含み、
前記特徴量の値の修正では、前記最大値及び前記最小値と、前記最大値及び前記最小値のそれぞれに対応したシミュレーション計算値との間の対応関係と、前記実験データの前記特徴量の値が前記最大値と前記最小値の間に存在し、前記説明変数の値同士が許容範囲内で一致する前記シミュレーション計算値と前記実験データにおける前記特徴量の値との間の対応関係とを利用して、前記学習用修正シミュレーションデータセットの前記特徴量の値を修正する、請求項1に記載のデータ処理方法。
【請求項3】
前記予測精度の評価をするとき、前記学習用統合データセットを用いて機械学習した予測モジュール候補については、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用統合データセットのそれぞれを用いたときの予測精度の評価をする、請求項1又は2に記載のデータ処理方法。
【請求項4】
前記予測精度の評価をするとき、前記学習用統合データセットを用いて機械学習した予測モジュール候補については、
(1)前記検証用実験データセットを用いたときの予測精度と、前記学習用実験データセットを用いて機械学習した予測モジュール候補における、前記検証用実験データセットを用いたときの予測精度とを比較し、
(2)前記検証用修正シミュレーションデータセットを用いたときの予測精度と、前記学習用修正シミュレーションデータセットを用いて機械学習した予測モジュール候補における、前記検証用修正シミュレーションデータセットを用いたときの予測精度とを比較し、
比較結果に基づいて、前記学習用統合データセットを用いて機械学習した予測モジュール候補の評価を行う、請求項1~3のいずれか1項に記載のデータ処理方法。
【請求項5】
前記シミュレーションデータは、前記シミュレーションモデルの構成および前記シミュレーションの方法の少なくともいずれか1つが異なる第1シミュレーションデータ及び第2シミュレーションデータを含み、
前記第1シミュレーションデータ及び前記第2シミュレーションデータのそれぞれを用いて、前記修正シミュレーションデータセットを作成すること、前記学習用修正シミュレーションデータセット、及び前記検証用修正シミュレーションデータセットを生成すること、前記予測モジュール候補を作成すること、前記予測精度の評価をすること、を行う、請求項1~4のいずれか1項に記載のデータ処理方法。
【請求項6】
前記特徴量は、タイヤに作用する物理量であり、
前記説明変数の値は、前記タイヤを規定する値である、請求項1~5のいずれか1項に記載のデータ処理方法。
【請求項7】
さらに、前記特徴量に関する目標値の入力に応じて、前記コンピュータが、前記予測モジュールを用いて前記目標値を再現する前記説明変数に関する最適値を算出するステップを備え、
前記最適値を算出するステップでは、前記予測モジュールに入力される前記説明変数の値に応じて前記予測モジュールが予測する前記特徴量の値に基づいて、前記説明変数に関する前記最適値を算出する、請求項1~6のいずれか1項に記載のデータ処理方法。
【請求項8】
前記説明変数の値と前記特徴量の値の関係を可視化するステップを、さらに備える、請求項1~7のいずれか1項に記載のデータ処理方法
【請求項9】
複数の説明変数の値を入力することにより予め定めた特徴量の値を予測して出力する予測モジュールを形成する、コンピュータで構成されたデータ処理装置であって、
複数の説明変数それぞれの値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持するデータであって、前記特徴量の値が、試験機を用いて得られた測定対象物の実験値である実験データと、前記特徴量の値が、前記測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値であるシミュレーションデータとを複数保持するオリジナルデータセットを用いて、前記シミュレーションデータにおける前記特徴量の値と前記実験データにおける前記特徴量の値との間の対応関係に基づいて、前記シミュレーションデータにおける前記特徴量の値を修正して、修正シミュレーションデータで構成される修正シミュレーションデータセットとするデータ修正部と、
前記修正シミュレーションデータセットと前記実験データで構成される実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離することにより、学習用修正シミュレーションデータセット、学習用実験データセット、検証用修正シミュレーションデータセット、及び検証用実験データセットを生成するデータセット生成部と、
前記学習用修正シミュレーションデータセット及び前記学習用実験データセット、及び前記学習用修正シミュレーションデータセットと前記学習用実験データセットとを統合した学習用統合データセットのそれぞれを用いて、前記コンピュータが、前記説明変数と前記特量との間の関係を機械学習した複数の予測モジュール候補を作成する予測モジュール候補作成部と、
前記コンピュータが、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用修正シミュレーションデータセットと前記検証用実験データセットとを統合した検証用統合データセットを用いて、機械学習した複数の前記予測モジュール候補それぞれに対して予測精度の評価をする予測モジュール候補評価部と、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定する予測モジュール決定部と、を備えることを特徴とするデータ処理装置。
【請求項10】
複数の説明変数の値を入力することにより予め定めた特徴量の値を予測して出力する予測モジュールを形成するためのデータ処理方法を、コンピュータに実行させるプログラムであって、
複数の説明変数それぞれの値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持するデータであって、前記特徴量の値が、試験機を用いて得られた測定対象物の実験値である実験データと、前記特徴量の値が、前記測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値であるシミュレーションデータとを複数保持するオリジナルデータセットを用いて、コンピュータに、前記シミュレーションデータにおける前記特徴量の値と前記実験データにおける前記特徴量の値との間の対応関係に基づいて、前記シミュレーションデータにおける前記特徴量の値を修正させて、修正シミュレーションデータで構成される修正シミュレーションデータセットを生成させる手順と、
前記コンピュータに、前記修正シミュレーションデータセットと前記実験データで構成される実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離させることにより、学習用修正シミュレーションデータセット、学習用実験データセット、検証用修正シミュレーションデータセット、及び検証用実験データセットを生成させる手順と、
前記コンピュータに、前記学習用修正シミュレーションデータセット、前記学習用実験データセット、及び前記学習用修正シミュレーションデータセットと前記学習用実験データセットとを統合した学習用統合データセットのそれぞれを用いて、前記コンピュータが、前記説明変数と前記特量との間の関係を機械学習した複数の予測モジュール候補を作成させる手順と、
前記コンピュータに、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用修正シミュレーションデータセットと前記検証用実験データセットとを統合した検証用統合データセットを用いて、機械学習した複数の前記予測モジュール候補それぞれに対して予測精度の評価をさせる手順と、
前記コンピュータに、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定させる手順と、を備えることを特徴とするプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、コンピュータが、複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを形成するためのデータ処理方法、データ処理装置、及びプログラムに関する。
【背景技術】
【0002】
近年、コンピュータに機械学習をさせて、入力されたデータから種々の予測を行う技術が活発に提案されている。一方、従来より、複数のゴム材料、充填材、及びオイル等を試行錯誤により配合して加硫ゴム組成物を試作して物性データを実験して計測することが行われている。このため、加硫ゴム組成物の配合情報と物性データの値とを紐付けたデータが多数蓄積されている。この蓄積データを学習用データセットとして活用して、コンピュータに機械学習させて、入力されたデータから物性データの値を予測させることができる。
【0003】
例えば、ニューラルネットワークの手法を用いて、設計・配合等の説明変数である要因群と特徴量である特性群との写像関係を学習し、説明変数それぞれの値から特徴量の値を推定するとともに、任意の特徴量の値に対して、それを作り出す説明変数の最適値を効率的にかつ容易に求める方法を提供する技術が知られている(特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2003-58582号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
この技術におけるニューラルネットワークの学習では、用意したオリジナルデータを全て一律に読み取って複数の学習データに用いる。オリジナルデータには、過去の実験やシミュレーションによって得られたデータが含まれている場合が多い。すなわち、オリジナルデータは、特徴量の値が、測定対象物の実験値である実験データと、特徴量の値が、測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値であるシミュレーションデータと、を複数保持する場合が多い。
シミュレーションでは、実験を再現するようにシミュレーションモデルを用いてコンピュータで計算するが、シミュレーションにより得られる結果は、要因(説明変数)を種々変更した時に得られる特徴量の値(シミュレーションで算出された値)の変化は、実験で得られた特徴量の値(実験データ)の変化に対応するが、シミュレーションによって得られた特徴量の値が、実験で得られた特徴量の値に一致しない場合が多く、偏差が存在する場合が多い。
このため、実験データとシミュレーションデータを含んだオリジナルデータを、一まとめにして、説明変数と特徴量の間の関係を機械学習した予測モジュールを作成することは難しい。
【0006】
そこで、本発明は、コンピュータが、複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを定めるとき、実験データとシミュレーションデータを含むオリジナルデータセットを用いて、説明変数と特徴量の間の関係を機械学習した予測精度の高い予測モジュールを効率よく作成することができるデータ処理方法、データ処理装置、及びコンピュータにデータ処理方法を実行させるプログラムを提供することを目的とする。
【課題を解決するための手段】
【0007】
本発明の一態様は、コンピュータが、複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを形成するためのデータ処理方法である。当該データ処理方法は、
複数の説明変数それぞれの値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持するデータであって、前記特徴量の値が、測定対象物の実験値である実験データと、前記特徴量の値が、前記測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値であるシミュレーションデータと、を複数保持するオリジナルデータセットを用いて、コンピュータが、前記シミュレーションデータにおける前記特徴量の値と前記実験データにおける前記特徴量の値との間の対応関係に基づいて、前記シミュレーションデータにおける前記特徴量の値を修正した修正シミュレーションデータで構成される修正シミュレーションデータセットを作成するステップと、
前記コンピュータが、前記修正シミュレーションデータセットと前記実験データで構成される実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離することにより、学習用修正シミュレーションデータセット、学習用実験データセット、検証用修正シミュレーションデータセット、及び検証用実験データセットを生成するステップと、
前記コンピュータが、前記学習用修正シミュレーションデータセット及び前記学習用実験データセット、及び前記学習用修正シミュレーションデータセットと前記学習用実験データセットとを統合した学習用統合データセットのそれぞれを用いて、前記コンピュータが、前記説明変数と前記特徴量との間の関係を機械学習した複数の予測モジュール候補を作成するステップと、
前記コンピュータが、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用修正シミュレーションデータセットと前記検証用実験データセットとを統合した検証用統合データセットを用いて、機械学習した前記複数の予測モジュール候補それぞれに対して予測精度の評価をするステップと、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定するステップと、を備える。
【0008】
前記シミュレーションデータは、複数の前記実験データにおける前記特徴量の最大値と最小値のそれぞれを実現する前記説明変数の値を用いて、前記シミュレーションモデルを用いて前記シミュレーションを行うことにより算出されたシミュレーション計算値を含み、
前記特徴量の値の修正では、前記最大値及び前記最小値と、前記最大値及び前記最小値のそれぞれに対応したシミュレーション計算値との間の対応関係と、前記実験データの前記特徴量の値が前記最大値と前記最小値の間に存在し、前記説明変数の値同士が許容範囲内で一致する前記シミュレーション計算値と前記実験データにおける前記特徴量の値との間の対応関係とを利用して、前記学習用修正シミュレーションデータセットの前記特徴量の値を修正する、ことが好ましい。
【0009】
前記予測精度の評価をするとき、前記学習用統合データセットを用いて機械学習した予測モジュール候補については、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用統合データセットのそれぞれを用いたときの予測精度の評価をする、ことが好ましい。
【0010】
前記予測精度の評価をするとき、前記学習用統合データセットを用いて機械学習した予測モジュール候補については、
(1)前記検証用実験データセットを用いたときの予測精度と、前記学習用実験データセットを用いて機械学習した予測モジュール候補における、前記検証用実験データセットを用いたときの予測精度とを比較し、
(2)前記検証用修正シミュレーションデータセットを用いたときの予測精度と、前記学習用修正シミュレーションデータセットを用いて機械学習した予測モジュール候補における、前記検証用修正シミュレーションデータセットを用いたときの予測精度とを比較し、
比較結果に基づいて、前記学習用統合データセットを用いて機械学習した予測モジュール候補の評価を行う、ことが好ましい。
【0011】
前記シミュレーションデータは、前記シミュレーションモデルの構成および前記シミュレーションの方法の少なくともいずれか1つが異なる第1シミュレーションデータ及び第2シミュレーションデータを含み、
前記第1シミュレーションデータ及び前記第2シミュレーションデータのそれぞれを用いて、前記修正シミュレーションデータセットを作成すること、前記学習用修正シミュレーションデータセット、及び前記検証用修正シミュレーションデータセットを生成すること、前記予測モジュール候補を作成すること、前記予測精度の評価をすること、を行う、ことが好ましい。
【0012】
前記特徴量は、タイヤに作用する物理量であり、
前記説明変数の値は、前記タイヤを規定する値である、ことが好ましい。
【0013】
さらに、前記特徴量に関する目標値の入力に応じて、前記コンピュータが、前記予測モジュールを用いて前記目標値を再現する前記説明変数に関する最適値を算出するステップを備え、
前記最適値を算出するステップでは、前記予測モジュールに入力される前記説明変数の値に応じて前記予測モジュールが予測する前記特徴量の値に基づいて、前記説明変数に関する前記最適値を算出する、ことが好ましい。
【0014】
前記説明変数の値と前記特徴量の値の関係を可視化するステップを、さらに備える、ことが好ましい。
【0015】
本発明の他の一態様は、複数の説明変数の値を入力することにより予め定めた特徴量の値を予測して出力する予測モジュールを形成する、コンピュータで構成されたデータ処理装置である。当該データ処理装置は、
複数の説明変数それぞれの値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持するデータであって、前記特徴量の値が、試験機を用いて得られた測定対象物の実験値である実験データと、前記特徴量の値が、前記測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値であるシミュレーションデータとを複数保持するオリジナルデータセットを用いて、前記シミュレーションデータにおける前記特徴量の値と前記実験データにおける前記特徴量の値との間の対応関係に基づいて、前記シミュレーションデータにおける前記特徴量の値を修正して、修正シミュレーションデータで構成される修正シミュレーションデータセットとするデータ修正部と、
前記修正シミュレーションデータセットと前記実験データで構成される実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離することにより、学習用修正シミュレーションデータセット、学習用実験データセット、検証用修正シミュレーションデータセット、及び検証用実験データセットを生成するデータセット生成部と、
前記学習用修正シミュレーションデータセット及び前記学習用実験データセット、及び前記学習用修正シミュレーションデータセットと前記学習用実験データセットとを統合した学習用統合データセットのそれぞれを用いて、前記コンピュータが、前記説明変数と前記特徴量との間の関係を機械学習した複数の予測モジュール候補を作成する予測モジュール候補作成部と、
前記コンピュータが、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用修正シミュレーションデータセットと前記検証用実験データセットとを統合した検証用統合データセットを用いて、機械学習した複数の前記予測モジュール候補それぞれに対して予測精度の評価をする予測モジュール候補評価部と、
前記コンピュータは、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定する予測モジュール決定部と、を備える。
【0016】
本発明のさらに他の一態様は、複数の説明変数の値を入力することにより予め定めた特徴量の値を予測して出力する予測モジュールを形成するためのデータ処理方法を、コンピュータに実行させるプログラムである。当該プログラムは、
複数の説明変数それぞれの値と、前記説明変数の値と関連付けを行うための特徴量の値とをセットにして保持するデータであって、前記特徴量の値が、試験機を用いて得られた測定対象物の実験値である実験データと、前記特徴量の値が、前記測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値であるシミュレーションデータとを複数保持するオリジナルデータセットを用いて、コンピュータに、前記シミュレーションデータにおける前記特徴量の値と前記実験データにおける前記特徴量の値との間の対応関係に基づいて、前記シミュレーションデータにおける前記特徴量の値を修正させて、修正シミュレーションデータで構成される修正シミュレーションデータセットを生成させる手順と、
前記コンピュータに、前記修正シミュレーションデータセットと前記実験データで構成される実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離させることにより、学習用修正シミュレーションデータセット、学習用実験データセット、検証用修正シミュレーションデータセット、及び検証用実験データセットを生成させる手順と、
前記コンピュータに、前記学習用修正シミュレーションデータセット、前記学習用実験データセット、及び前記学習用修正シミュレーションデータセットと前記学習用実験データセットとを統合した学習用統合データセットのそれぞれを用いて、前記コンピュータが、前記説明変数と前記特徴量との間の関係を機械学習した複数の予測モジュール候補を作成させる手順と、
前記コンピュータに、前記検証用修正シミュレーションデータセット、前記検証用実験データセット、及び前記検証用修正シミュレーションデータセットと前記検証用実験データセットとを統合した検証用統合データセットを用いて、機械学習した複数の前記予測モジュール候補それぞれに対して予測精度の評価をさせる手順と、
前記コンピュータに、前記予測精度の評価結果に基づいて、前記複数の予測モジュール候補から前記予測モジュールを決定させる手順と、を備える。
【発明の効果】
【0017】
上述のデータ処理方法、データ処理装置、及びプログラムによれば、コンピュータが、複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを定めるとき、実験データとシミュレーションデータを含むオリジナルデータセットを用いて、説明変数と特徴量の間の関係を機械学習した予測精度の高い予測モジュールを効率よく作成することができる。
【図面の簡単な説明】
【0018】
図1】一実施形態のデータ処理方法の流れの一例を概略説明する図である。
図2】一実施形態のデータ処理装置の構成の一例を示す図である。
図3】(a)~(c)は、一実施形態のデータ処理方法で行うシミュレーションデータにおける特徴量の値の修正の一例を説明する図である。
図4】一実施形態のデータ処理方法で用いる学習用オリジナルデータセットの一例を簡素化してわかり易く説明する図である。
図5】(a)~(c)は、一実施形態のデータ処理方法において、オリジナルデータセットから作成されるデータセットの例を示す図である。
図6】一実施形態のデータ処理方法において、オリジナルデータセットから作成されるデータセットの例を示す図である。
図7】一実施形態のデータ処理方法における予測モジュール候補の作成と、検証用データセットの利用方法の一例を説明する図である。
図8】一実施形態のデータ処理方法において用いるシミュレーションデータにおける特徴量の値と実験データにおける特徴量の値との対応を説明する図である。
【発明を実施するための形態】
【0019】
以下、一実施形態のデータ処理方法、データ処理装置、およびプログラムを添付の図に基づいて説明する。
図1は、一実施形態のデータ処理方法の流れの一例を概略説明する図である。図2は、一実施形態のデータ処理装置の構成の一例を示す図である。
一実施形態のデータ処理方法は、コンピュータにより実行される方法であり、複数の説明変数の値を入力することにより予め定めた特徴量に関する値を予測して出力する予測モジュールを作成する方法である。
予測モジュールは、オリジナルデータセットから作成される複数の学習用データセットを用いて作成された複数の予測モジュール候補の中から、オリジナルデータセットから別途作成された複数の検証用データセットを用いて評価した評価結果に基づいて定められる。
【0020】
図2に示すデータ処理装置10は、CPU12及びメモリ14を含むコンピュータにより構成される。データ処理装置10には、ディスプレイ30、及び、情報を指示入力するためのマウスやキーボードを含む入力操作デバイス32が接続されている。
入力操作デバイス32は、操作者がデータ処理装置10に所望の指示入力をするために用いられる。例えば、予測モジュール候補を作成するための条件を設定するために入力操作デバイス32から操作者は情報を指示入力する。
ディスプレイ30は、設定された情報を表示するために用いられ、例えば、データ処理方法で用いるオリジナルデータセット、学習用オリジナルデータセット、検証用オリジナルデータセット、及び各種学習用サブデータセット、検証用サブデータセットにおけるデータの数値、説明変数、欠損説明変数、予測モジュール候補を作成するための条件設定画面、及び、予測モジュール候補における予測精度の評価結果等を表示する。
【0021】
メモリ14には、プログラムが記憶されており、CPU12がプログラムを読み出して実行することにより、シミュレーションデータ修正部15、サブデータセット作成部16、予測モジュール候補作成部18、予測モジュール候補評価部20、予測モジュール決定部22、及び予測部24をソフトウェアモジュールとして機能させる。以下、シミュレーションデータ修正部15、サブデータセット作成部16、予測モジュール候補作成部18、予測モジュール候補評価部20、予測モジュール決定部22、及び予測部24の機能を、図1に示す一実施形態のデータ処理方法の流れを説明しながら同時に説明する。
【0022】
コンピュータは、機械学習することにより、予測モジュールとなり得る予測モデルを予め保持する。この予測モデルは、上記オリジナルデータセットから作成される複数の学習用サブデータセットを用いて機械学習することにより、予測モジュール候補となる。この予測モジュール候補の少なくとも1つが、予測モジュールとなる。予測モデルは、周知のディープラーニングに代表されるニューラルネットワークを用いたモデル、複数の決定木を使用して、「分類」または「回帰」をする、周知のランダムフォレスト法を用いたモデル、LASSO回帰を用いたモデルを含む。また、予測モデルとして、多項式あるいはクリギング、RBF(Radial Base Function)を用いた非線形関数を用いることもできる。
【0023】
オリジナルデータセットは、複数の説明変数の値と、これらの説明変数の値と関連付けを行うための特徴量の値とをセットにして複数組み(例えば、数万組)保持したデータの群である。説明変数は、例えば、製品の設計寸法、製品に用いる構成材料の構造や物性値、あるいは、製品を作製するときの作製条件等を含み、特徴量は、例えば製品の特性値、市場における販売量等を含む。例えば、オリジナルデータセットが、説明変数として、構造体の設計寸法、構成材料の構造を含み、特徴量として、構造体の特性値を含む場合、データは、上記設計寸法、上記構造を種々変化させたときの上記設計寸法及び上記構造の情報と特性値とからなるデータをいう。したがって、この場合、オリジナルデータセットは、上記設計寸法、上記構造を種々変化させたときの上記設計寸法及び上記構造の情報と特性値とをセットにしたデータを多数含む。
【0024】
オリジナルデータセットには、過去蓄積された膨大なデータである場合が多い。オリジナルデータセットは、複数の説明変数それぞれの値と、この説明変数の値と関連付けを行うための特徴量の値とをセットにした多数のデータを保持する。多数のデータには、多数の実験データと多数のシミュレーションデータが含まれている。実験データは、特徴量の値が、測定対象物の実験値であるデータである。シミュレーションデータは、特徴量の値が、測定対象物のシミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値である。図1に示すシミュレーションデータには、異なるシミュレーションモデルを用いて、あるいは異なるシミュレーション方法によって計算された特徴量の値であるシミュレーション計算値を持つシミュレーションデータ1とシミュレーションデータ2が含まれている。
【0025】
シミュレーションデータ修正部15は、オリジナルデータセットのうち、シミュレーションデータにおけるシミュレーション計算値(特徴量の値)を、実験データを用いて、修正する(図1 ST10)。これにより、説明変数と特徴量の修正した値をセットとする複数の修正シミュレーションデータで構成された修正シミュレーションデータセットが作成される。実験データで構成されるデータセットを実験データセットという。
【0026】
図3(a)~(c)は、シミュレーションデータにおける特徴量の値の修正の一例を説明する図である。図3(a)は、実験データの説明変数とシミュレーションデータの説明変数が許容範囲内で一致するときの実験データ及びシミュレーションデータの特徴量の値の一例を示す。図3(b)は、図3(a)に示す特徴量の値を、横軸をシミュレーションデータの特徴量とし、縦軸を実験データの特徴量としたグラフにプロットした結果を示す。
図3(b)に示すように、シミュレーションデータと実験データの特徴量の値は、1対1に対応する関係を有するので、この関係を利用して、図3(c)に示すように、シミュレーションデータにおける特徴量の値を、実験データの値に換算した値を修正後のシミュレーションデータの値として定める。
なお、シミュレーションデータが、シミュレーションデータ1及びシミュレーションデータ2を含んでいる場合、シミュレーションデータ1及びシミュレーションデータ2毎に、図3(b)に示すような関係を求めて、シミュレーションデータ1,2における特徴量の値を、実験データの値に換算して修正後のシミュレーションデータの値を求める。
なお、実験データの特徴量の値とシミュレーションデータの特徴量の値を、値の大きさの順番に並べたとき、その順位が、実験データとシミュレーションデータの間で異なるような場合、実験データ及びシミュレーションデータそれぞれの順位が異なる2つの特徴量の値に代えて、この2つの値の平均値を、新たな特徴量の値として用いてもよい。
【0027】
次に、サブデータセット作成部16は、修正シミュレーションデータで構成された修正シミュレーションデータセット1,2と実験用データで構成された実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離することにより、学習用修正シミュレーションデータセット1,2、学習用実験データセット、を学習用サブデータセットとして作成し、検証用修正シミュレーションデータセット1,2、検証用実験データセットを、検証用サブデータセットとして作成し、さらに、学習用修正シミュレーションデータセット1,2と学習用実験データセットとを統合した学習用統合データセットを学習用サブデータセットとして作成し、検証用修正シミュレーションデータセット1,2と検証用実験データセットとを統合した検証用統合データセットを検証用サブデータセットとして作成する(図1 ST12,ST14)。
【0028】
図4は、オリジナルデータセットを学習用オリジナルデータセットと検証用オリジナルデータセットに分離したときの学習用オリジナルデータセットの一例を簡素化してわかり易く説明する図であり、図5(a)~(c)及び図6は、一実施形態のデータ処理方法において、学習用オリジナルデータセットから作成される学習用サブデータセットの例を示す図である。
図4に示す学習用オリジナルデータセットは、説明変数として、説明変数X~X(nは自然数)を含み、説明変数それぞれに対するデータとして、データ1~データ9を含む。図4に示す学習用オリジナルデータセットでは、データ数は9であるが、データ数は、実際、数千~数万である。
図4に示す学習用オリジナルデータセットでは、特徴量は1つであるが複数であってもよい。
ここで、図4中の「・・・」は、実際に数値があることを示している。図中の“シミュレーションindex”については、“0”が、非シミュレーションデータであることを示し、“1”がシミュレーション1により得られたデータであることを示し、“2”がシミュレーションモデルあるいはシミュレーション方法の点でシミュレーション1と異なるシミュレーション2により得られたデータであることを示している。図中の“試験機index”については、非シミュレーションデータの場合における試験機の種類を示している。“1”が試験機1により得られた実験データであることを示し、“0”は試験機を用いた実験データでないことを示している。まお、図4では、データ1~9の特徴量の値がV1~V9であることを示している。
【0029】
図5(a)は、学習用オリジナルデータの“シミュレーションindex”が“0”のデータにより構成された学習用実験データセットを示しており、図5(b)は、学習用オリジナルデータの“シミュレーションindex”が“1”のデータにより構成された学習用修正シミュレーションセット1を示しており、図5(c)は、学習用オリジナルデータの“シミュレーションindex”が“2”のデータにより構成された学習用修正シミュレーションセット2を示している。学習用修正シミュレーションセット1,2における特徴量の値は、修正した値であるので、図5(b),(c)に示す特徴量の値は、V4’~V9’となっている。
図6は、学習用統合データセットを示し、修正シミュレーションデータと実験データで構成されている。
【0030】
オリジナルデータセットでは、X~Xの他に“シミュレーションindex”及び“試験機index”も説明変数であるので、説明変数の数はn+2個であり、学習用実験データセット、学習用修正シミュレーション用データセット1,2、及び学習用統合データセットにおける説明変数の数は、X~Xのn個である。
【0031】
予測モジュール候補作成部18は、学習用オリジナルデータセットと、作成した複数の学習用サブデータセットを用いて予測モデルを機械学習させて、予測モジュール候補1~5を作成する(図1 ST16)。予測モデルの機械学習では、ディープラーニングが用いられ、例えば、入力設定された条件に基づいた層構成の予測モジュール候補、例えば、1~7層の層構成の予測モジュール候補が作成される。
【0032】
図7は、予測モジュール候補の作成と、後述する検証用データセットの利用方法の一例を説明する図である。
予測モジュール候補1~5は、上述した学習用オリジナルデータセット、学習用修正シミュレーションデータセット1,2、学習用実験データセット、及び学習用統合データセットのそれぞれを用いて、予測モデルが説明変数と特徴量の間の関係を機械学習することにより作成されたものである。予測モジュールの機械学習では、転移学習方法を用いることもできる。
【0033】
したがって、学習用オリジナルデータセットから作成された予測モジュール候補1では、X~X、“シミュレーションindex”及び“試験機index”が説明変数として定義される。したがって、この場合の説明変数はn+2個である。学習用修正シミュレーションデータセット1,2、学習用実験データセット、及び学習用統合データセットのそれぞれから作成された予測モジュール候補2~5では、X~Xが説明変数として定義される。したがって、この場合の説明変数はn個である。
【0034】
予測モジュール候補評価部20は、検証用修正シミュレーションデータセット1,2、検証用実験データセット、及び検証用修正シミュレーションデータセット1,2と検証用実験データセットとを統合した検証用統合データセットを用いて、機械学習した予測モジュール候補1~5それぞれに対して予測精度の評価をする(図1 ST 18)。
【0035】
検証用サブデータセットとして用意した検証用修正シミュレーションデータセット1,2、検証用実験データセット、及び検証用統合データセットは、学習用修正シミュレーションデータセット1,2、学習用実験データセット、及び学習用統合データセットと同様に、説明変数としてX~Xを持つので、検証用修正シミュレーションデータセット1,2、検証用実験データセット、及び検証用統合データセットは、予測モジュール2~5のそれぞれの検証用サブデータセットとして用いることができる。例えば、予測モジュール候補2と、検証用修正シミュレーションデータセット1,2、検証用実験データセット、及び検証用統合データセットのそれぞれを用いて特徴量の予測値を算出することができる。したがって、予測モジュール2で算出した特徴量の予測値を、検証用修正シミュレーションデータセット1,2、検証用実験データセット、及び検証用統合データセットの特徴量の値と比較することができる。同様に、予測モジュール候補3~5についても、算出した特徴量の予測値を、検証用修正シミュレーションデータセット1,2、検証用実験データセット、及び検証用統合データセットの特徴量の値を正解値として比較することができる。
【0036】
予測モジュール候補1~5における特徴量の予測精度の評価では、予測モジュール候補1~5それぞれが予測した特徴量の予測値が、正解値にどの程度近似しているかを評価する。評価の仕方は、特に制限されないが、例えば、正解値に対する予測値の比を表した値を評価値とする。特徴量が複数設定されている場合、特徴量毎の上記比の平均値あるいは、上記比が1から最も遠く離れている値を評価値とする。あるいは、実際の特徴量の値と予測モジュール候補による予測値とが多数組あるので、実際の特徴量の値と予測値との間の相関係数Rあるいは決定係数Rを評価値とすることもできる。
【0037】
予測モジュール決定部22は、予測モジュール候補評価部20で求めた予測精度の評価結果(評価値)に基づいて、予測精度が高い予測モジュールを決定する(図1のST20)。決定される予測モジュールは、複数の予測モジュール候補の中から、予測精度が最も高い1つを選んで決定してもよいし、予測精度が閾値を越える複数の予測モジュール候補を予測モジュールとして決定してもよい。予測モジュール候補の中で、説明変数が最も多い予測モジュール候補1が、最も予測精度が高い予測モジュール候補とは限らない。特徴量に寄与しない説明変数もあり、この説明変数がノイズ成分となって予測精度を低下させる場合がある。
予測精度の評価結果の情報は、ディスプレイ30に画面表示されることが好ましい。
【0038】
予測部24は、決定された予測モジュールを設定して、説明変数の値を入力することにより特徴量に関する値を予測する。予測した特徴量に関する値は、ディスプレイ30に出力される。
【0039】
このように、上述のデータ処理方法では、シミュレーションデータと実験データを含んでいる場合において、シミュレーションデータの特徴量の値を修正することにより、修正シミュレーションデータと実験データを同じ学習用データとして同時に用いて、また、修正シミュレーションデータセット1,2のように種類の異なる修正シミュレーションデータ毎の学習用修正シミュレーションデータセットを用いて、予測モデルを機械学習させることができるので予測モジュール候補を複数作成することができる。さらに、検証用サブデータセットとして、検証用修正シミュレーションデータ、検証用実験データセット、及び検証用統合データセットそれぞれを用いて、すなわち、検証用オリジナルデータセットを効率よく用いて、複数の予測モジュール候補の予測精度を評価することができる。したがって、オリジナルデータセットに実験データとシミュレーションデータを含む場合であっても、説明変数と特徴量の間の関係を機械学習した予測精度の高い予測モジュールを効率よく作成することができる。
【0040】
一実施形態によれは、オリジナルデータを学習用データセットと検証用データセットとに分割するとき、検証用データセットをオリジナルデータセットの異なる部分から取り出し、残りの部分を学習用データセットとする分割を複数回行い、分割の度に、学習用データセットを用いて作成した予測モジュール候補の予測精度の評価を行い、複数回行った予測精度の評価結果の平均値に基づいて予測モジュール候補から予測モジュールを決定する、ことが好ましい。これにより、オリジナルデータセットの広い範囲で偏ることなく機械学習のための学習用データセットを作成することができ、また、検証のための検証用データセットを広い範囲で偏ることなく用いることができ、予測精度の評価を精度よく求めることができる。
【0041】
一実施形態によれば、シミュレーションデータは、複数の実験データにおける特徴量の最大値と最小値のそれぞれを実現する説明変数の値を用いて、シミュレーションモデルを用いてシミュレーションを行うことにより算出されたシミュレーション計算値を含み、特徴量の値の修正では、最大値及び最小値と、最大値及び最小値のそれぞれに対応したシミュレーション計算値との間の対応関係と、実験データの特徴量の値が最大値と最小値の間に存在し、説明変数の値同士が許容範囲内で一致するシミュレーション計算値と実験データにおける特徴量の値との間の対応関係を利用して、学習用シミュレーションデータセットの特徴量の値を修正する、ことが好ましい。シミュレーションは、特に限定されないが、例えば、周知の有限要素モデルを用いたシミュレーションが挙げられる。
図8は、シミュレーションデータにおける特徴量の値、すなわちシミュレーション計算値と実験データにおける特徴量の値との対応を説明する図である。実験データにおける特徴量の最大値及び最小値を実現する説明変数の値に対応するシミュレーションデータの特徴量の値、すなわちシミュレーション計算値があれば、最大値と最小値に対応した2つのシミュレーション計算値の間における計算値の修正を、内挿補間を利用して高い精度で行なうことができる。このため、実験データにおける特徴量の最大値及び最小値に対応したシミュレーションデータの特徴量の値が、シミュレーションデータにない場合、シミュレーションモデルを用いてシミュレーションを行うことにより、実験データにおける特徴量の最大値及び最小値に対応したシミュレーション計算値を容易に算出することができる。
【0042】
また、実験データの特徴量の値が最大値と最小値の間に存在し、説明変数の値同士が許容範囲内で一致するシミュレーション計算値と実験データにおける前記特徴量の値との間の対応関係を利用して、学習用シミュレーションデータセットの特徴量の値を内挿補間により高い精度で修正することができる。この場合においても、実験データにおける説明変数と説明変数の値が許容範囲内で一致するシミュレーションデータがない場合、シミュレーションモデルを用いてシミュレーションを行うことにより、実験データにおける特徴量の値に対応したシミュレーション計算値を容易に算出することができる。
このようにして、図8に示すように、シミュレーションデータと実験データの間で、説明変数が許容範囲内で一致するときの特徴量の値の対応付けを行うことができる。このため、内挿補間により、精度の高い値の修正を行うことができる。
【0043】
一実施形態によれば、予測精度を評価するとき、図7に示すように、学習用統合データセットを用いて機械学習した予測モジュール候補については、検証用修正シミュレーションデータセット1,2、検証用実験データセット、及び検証用統合データセットのそれぞれを用いたときの予測精度の評価をすることが好ましい。学習用統合データセットを用いて機械学習した予測モジュール候補は、他のいずれの予測モジュール候補よりも予測精度が高いことが一般的に想定されるが、必ずしも予測精度が高くない場合もある。このため、学習用統合データセットを用いて機械学習した予測モジュール候補については、検証用オリジナルデータセットから作成した種々の検証用サブデータセットを可能な限り利用して、予測精度の評価をすることが好ましい。
【0044】
一実施形態によれば、予測精度の評価をするとき、学習用統合データセットを用いて機械学習した予測モジュール候補については、
(1)検証用実験データセットを用いたときの予測精度と、学習用実験データセットを用いて機械学習した予測モジュール候補における、検証用実験データセットを用いたときの予測精度とを比較し、
(2)検証用修正シミュレーションデータセットを用いたときの予測精度と、学習用修正シミュレーションデータセットを用いて機械学習した予測モジュール候補における、検証用修正シミュレーションセットを用いたときの予測精度とを比較し、
比較結果に基づいて、学習用統合データセットを用いて機械学習した予測モジュール候補の評価を行う、ことが好ましい。学習用統合データセットを用いて機械学習した予測モジュール候補の特徴量の値の予測精度は、学習用実験データセットを用いて機械学習した予測モジュール候補における、検証用実験データセットを用いたときの予測精度に比べて向上していること、及び、学習用修正シミュレーションデータセットを用いて機械学習した予測モジュール候補における、検証用修正シミュレーションセットを用いたときの予測精度に比べて向上していることが一般に想定されるが、必ずしも予測精度が高くない場合もある。このため、学習用統合データセットを用いて機械学習した予測モジュール候補については、実験データセットから作成した予測モジュール候補が実験データセットの実験データを検証用のデータとして用いた場合の予測精度と比べること、及び、修正シミュレーションデータセットから作成した予測モジュール候補が修正シミュレーションデータを検証用のデータとして用いた場合の予測精度と比べること、が特に好ましい。
【0045】
シミュレーションデータは、シミュレーションモデルの構成およびシミュレーションの方法が同じ1種類のシミュレーションデータであってもよいが、図1に示すように、シミュレーションモデルの構成およびシミュレーションの方法の少なくともいずれか1つが異なるシミュレーションデータ1(第1シミュレーションデータ)及びシミュレーションデータ2(第2シミュレーションデータ)を含むことが好ましい。この場合、シミュレーションデータ1及びシミュレーションデータ2のそれぞれを用いて、図1に示すST10~20の処理を行う、ことが好ましい。これにより、シミュレーションの相違による複数の予測モジュール候補の予測精度を評価することができるので、予測精度の高い予測モジュールを決定することができる。
【0046】
一実施形態によれば、特徴量は、タイヤに作用する物理量、例えばタイヤの特性値であり、説明変数の値は、タイヤを規定する値である、ことが好ましい。これにより、タイヤに作用する物理量を、タイヤを規定する値を用いて高い精度で予測することが可能になる。タイヤを規定する値は、例えば、タイヤを装着するリムサイズ、タイヤの偏平率、タイヤ幅、ビードフィラー断面積、第1スチールコードの角度、第1スチールコードの剛性、第2スチールコードの角度、第2スチールコードの剛性、第1カーカスコードの角度、及び第1カーカスコードの剛性、第2カーカスコードの角度、第2カーカスコードの剛性等を含む。
【0047】
一実施形態によれば、予測モジュールは、特徴量に関する目標値の入力に応じて、目標値を再現する説明変数に関する最適値を算出する最適化処理に用いることもできる。すなわち、一実施形態のデータ処理方法では、特徴量に関する目標値の入力に応じて、データ処理装置10が、予測モジュールを用いて目標値を再現する説明変数に関する最適値を算出する最適化処理を含むことが好ましい。この場合、予測モジュールに入力される説明変数の値に応じて予測モジュールが予測する特徴量の値に基づいて、説明変数に関する最適値を算出することが好ましい。最適値を算出する方法は、例えば、進化的アルゴリズムが利用することが好ましい。進化的アルゴリズムは、Genetic Algorithm(遺伝的アルゴリズム)、Differential Evolution、Particle Swarm Optimization、Ant Colony Optimization等を含む。実験計画法やラテンハイパーキューブ法を利用することも好ましい。
【0048】
一実施形態によれば、説明変数の値と特徴量の値の関係を可視化することが好ましい。
説明変数の値と特徴量の値の関係は、ディスプレイ30に表示される。説明変数の値と特徴量の値の関係は、例えば自己組織化マップにより表される。あるいは、自己組織化マップに代えて、散布図を用いて、説明変数と特徴量の値の関係を可視化してもよい。
【0049】
このようなデータ処理方法は、コンピュータに実行させるプログラムをメモリ14から読み出して実行することにより達成することができる。したがって、このプログラムは、
(1)実験データとシミュレーションデータとを複数保持するオリジナルデータセットを用いて、コンピュータに、シミュレーションデータにおける特徴量の値と実験用データにおける特徴量の値との間の対応関係に基づいて、シミュレーションデータにおける特徴量の値を修正させて、修正シミュレーションデータで構成される修正シミュレーションデータセットを生成させる手順と、
(2)コンピュータに、修正シミュレーションデータセットと実験用データで構成される実験データセットのそれぞれを、学習用データセットと、検証用データセットとに分離させることにより、学習用修正シミュレーションデータセット、学習用実験データセット、検証用修正シミュレーションデータセット、及び検証用実験データセットを生成させる手順と、
(3)コンピュータに、学習用修正シミュレーションデータセット、学習用実験データセット、及び学習用統合データセットのそれぞれを用いて、コンピュータが、説明変数と特性量との間の関係を機械学習した複数の予測モジュール候補を作成させる手順と、
(4)コンピュータに、検証用修正シミュレーションデータセット、検証用実験データセット、及び検証用統合データセットを用いて、機械学習した複数の予測モジュール候補それぞれに対して予測精度の評価をさせる手順と、
(5)コンピュータに、予測精度の評価結果に基づいて、複数の予測モジュール候補から予測モジュールを決定させる手順と、を備える。
【0050】
(実施例、比較例)
上述のデータ処理方法の効果を確認するために、10881個の実験データと、3739個のシミュレーションデータを用意した。説明変数は、タイヤ寸法、タイヤの構成材料の寸法、物性値、及びタイヤ構造の形態を情報として含み、特徴量として、転がり抵抗を用いた。
【0051】
実施例では、実験データ及びシミュレーションデータを含むオリジナルデータセットを用意し、このオリジナルデータセットを上述のデータ処理方法により処理して、予測モジュールを決定した。予測モジュール候補は、学習用オリジナルデータセットから作成された予測モジュール候補と、学習用統合データセットから作成された予測モジュール候補と、学習用実験データから作成された予測モジュール候補の3つである。
【0052】
一方、比較例では、実験データを含むがシミュレーションデータを含まないオリジナルデータセットを用いて予測モジュールを決定した。この場合に学習用実験データセットから1つの予測モジュール候補が作成されるだけであり、予測モジュール候補の数は1つであるので、この予測モジュール候補が自動的に比較例における予測モジュールとなる。
【0053】
実施例における予測モジュール候補の評価結果は以下のとおりであった。
予測モジュール候補は、予測モデルをディープラーニング法により機械学習をさせることにより作成した。深層学習における層構成は、3層とした。
学習用オリジナルデータセットから作成された予測モジュール候補における検証用オリジナルデータセットを用いた予測値と、検証用オリジナルデータセットにおける特徴量の値との間の決定係数Rは0.71と低く、
学習用実験データセットから作成された予測モジュール候補における検証用実験データセット、検証用修正シミュレーションデータセット、及び検証用統合データセットを用いた特徴量の予測値と、上記データセット内の対応する特徴量の値との間の決定係数Rは0.77であり、
学習用統合データセットから作成された予測モジュール候補における検証用実験データセット、検証用修正シミュレーションデータセット、及び検証用統合データセットを用いた特徴量の予測値と、上記データセット内の対応する特徴量の値との間の決定係数Rは0.88であった。
【0054】
一方、比較例で作成される予測モジュール候補は、上述の学習用実験データセットから作成された1つの予測モジュール候補だけであるので、その予測モジュール候補の決定係数Rは0.77である。
【0055】
したがって、実施例で決定される予測モジュールの決定係数Rは0.88であり、比較例で決定される予測モジュールの決定係数Rは0.77である。
これより、実施例の予測モジュールの予測精度は高いといえる。
【0056】
以上、本発明のデータ処理方法、データ処理装置、及びプログラムについて詳細に説明したが、本発明は上記実施形態に限定されず、本発明の主旨を逸脱しない範囲において、種々の改良や変更をしてもよいのはもちろんである。
【符号の説明】
【0057】
10 データ処理装置
12 CPU
14 メモリ
15 シミュレーションデータ修正部
16 サブデータセット作成部
18 予測モジュール候補作成部
20 予測モジュール候補作成部
22 予測モジュール決定部
24 予測部
図1
図2
図3
図4
図5
図6
図7
図8