特許7406664 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ 住友化学株式会社の特許一覧

特許7406664学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B1)

(11)【特許番号】

(24)【登録日】2023-12-19

(45)【発行日】2023-12-27

(54)【発明の名称】学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法

(51)【国際特許分類】

G16C 20/70 20190101AFI20231220BHJP

H10K 50/10 20230101ALI20231220BHJP

H10K 59/10 20230101ALI20231220BHJP

H10K 85/00 20230101ALI20231220BHJP

G06N 20/00 20190101ALI20231220BHJP

H10K 71/00 20230101ALI20231220BHJP

G16C 60/00 20190101ALI20231220BHJP

【ＦＩ】

G16C20/70

H10K50/10

H10K59/10

H10K85/00

G06N20/00 130

H10K71/00

G16C60/00

【請求項の数】 7

(21)【出願番号】P 2023058079

(22)【出願日】2023-03-31

【審査請求日】2023-04-28

【早期審査対象出願】

(73)【特許権者】

【識別番号】000002093

【氏名又は名称】住友化学株式会社

(74)【代理人】

【識別番号】100114557

【弁理士】

【氏名又は名称】河野英仁

(74)【代理人】

【識別番号】100078868

【弁理士】

【氏名又は名称】河野登夫

(72)【発明者】

【氏名】西田理彦

(72)【発明者】

【氏名】押木淳

(72)【発明者】

【氏名】栗田靖之

【審査官】藤澤美穂

(56)【参考文献】

【文献】特開２０２１－１７４４０２（ＪＰ，Ａ）

【文献】特開２０２１－１４０７０１（ＪＰ，Ａ）

【文献】特許第４７８０５５４（ＪＰ，Ｂ２）

【文献】国際公開第２０２２／１５３９８４（ＷＯ，Ａ１）

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｇ１６Ｃ１０／００－９９／００

Ｈ１０Ｋ５０／１０

Ｈ１０Ｋ５９／１０

Ｈ１０Ｋ８５／００

Ｇ０６Ｎ２０／００

Ｈ１０Ｋ７１／００

(57)【特許請求の範囲】

【請求項1】

物質の特徴量を説明変数とし、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得する工程と、
取得した前記訓練データに基づいて物質の特徴量を入力した場合に物質の物性を予測する第１学習モデルを学習する工程とを含み、
前記シミュレーション値は、理論計算により導出され、
前記模擬実験値は、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第２学習モデルを用いて生成される
処理をコンピュータが実行する学習モデルの生成方法。

【請求項2】

前記第２学習モデルへ入力されるシミュレーション値は、前記第２学習モデルにより推定される模擬実験値の物性とは異なる物性のシミュレーション値を含む
請求項１に記載の学習モデルの生成方法。

【請求項3】

前記第１学習モデルを用いて予測した物性が所定の要求物性を満たす物質の前記シミュレーション値に基づく前記模擬実験値を含む前記訓練データを取得し、
取得した前記訓練データに基づいて、前記第１学習モデルを再学習する
請求項１又は請求項２に記載の学習モデルの生成方法。

【請求項4】

物質の特徴量を説明変数とし、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて物質の特徴量を入力した場合に物質の物性を予測する第１学習モデルを学習し、
前記シミュレーション値は、理論計算により導出され、
前記模擬実験値は、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第２学習モデルを用いて生成される
処理を実行する制御部を備える
情報処理装置。

【請求項5】

物質の特徴量を説明変数とし、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて物質の特徴量を入力した場合に物質の物性を予測する第１学習モデルを学習し、
前記シミュレーション値は、理論計算により導出され、
前記模擬実験値は、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第２学習モデルを用いて生成される
処理をコンピュータに実行させるためのコンピュータプログラム。

【請求項6】

複数の物質に係る特徴量を取得し、
請求項１に記載の学習モデルの生成方法により生成された第１学習モデルを用いて、取得した各物質の特徴量に応じた物質の物性を取得し、
取得した物性が所定の要求物性を満たす物質を選別する
処理をコンピュータが実行する物質の選別方法。

【請求項7】

選別した前記物質の物性を表すシミュレーション値と、前記物質の構造又は物性を表す情報とを取得し、
シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第２学習モデルに、取得した前記物質のシミュレーション値と、前記物質の構造又は物性を表す情報とを入力して前記物質の模擬実験値を取得し、
取得した前記模擬実験値が所定の要求物性を満たす物質を選別する
請求項６に記載の物質の選別方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法に関する。

【背景技術】

【0002】

新規物質、代替物質の研究、開発などを行う際に、機械学習等の情報処理技術を組み合わせて効率的に物質探索を行うマテリアルズ・インフォマティクスに関する技術が提案されている。

【0003】

例えば特許文献１には、予測対象である化合物と、化合物データベースから選択された化合物の共通構造及び差分構造を化合物性質予測モデルへ入力することによって、予測対象である化合物の性質の予測結果を得る化合物性質予測装置が開示されている。特許文献１の化合物性質予測モデルは、化合物データベースから選択された２つの化合物を選択化合物として、前記選択化合物の共通構造及び差分構造と、選択化合物について実測された性質と、の組み合わせを少なくとも含む教師付訓練データを用いて構築されることが記載されている。

【先行技術文献】

【特許文献】

【0004】

【文献】特開２０２１－０７６８９０号公報

【発明の概要】

【発明が解決しようとする課題】

【0005】

特許文献１に記載の技術は、モデルの構築に用いる訓練データとして化合物の実測データを収集する必要があるという問題がある。推定精度の高いモデルを生成するためには、大量の訓練データが必要である。実験を行って化合物の構造に応じた物性の実測値（実験値）を得ることは、時間とコストを要する。このため、学習モデルを効率よく生成することができる技術が望まれる。

【0006】

本開示の目的は、物質の物性を予測する学習モデルを効率よく生成することができる学習モデルの生成方法等を提供することである。

【課題を解決するための手段】

【0007】

本開示の一態様に係る学習モデルの生成方法は、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第１学習モデルを生成する。

【0008】

本開示の一態様に係る情報処理装置は、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第１学習モデルを生成する処理を実行する制御部を備える。

【0009】

本開示の一態様に係るコンピュータプログラムは、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第１学習モデルを生成する処理をコンピュータに実行させる。

【0010】

本開示の一態様に係る物質の選別方法は、複数の物質に係る特徴量を取得し、請求項１に記載の学習モデルの生成方法により生成された第１学習モデルを用いて、取得した各物質の特徴量に応じた物質の物性を取得し、取得した物性が所定の要求物性を満たす物質を選別する。

【0011】

本開示の一態様に係る模擬実験値の生成方法は、物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報と、前記シミュレーション値が表す物性の実験値とを含む訓練データに基づいて、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を出力するよう学習された学習モデルを用意し、物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報とを取得し、取得した前記シミュレーション値と、物質の構造又は物性を表す情報とを前記学習モデルに入力することにより、模擬実験値を生成する。

【発明の効果】

【0012】

本開示によれば、物質の物性を予測する学習モデルを効率よく生成することができる。

【図面の簡単な説明】

【0013】

【図1】本実施形態の製造システムの構成例を示すブロック図である。

【図2】訓練ＤＢに記憶される情報の内容例を示す図である。

【図3】第１学習モデルの概要を示す説明図である。

【図4】第２学習モデルの概要を示す説明図である。

【図5】第２学習モデルの生成処理手順の一例を示すフローチャートである。

【図6】第１学習モデルの生成処理手順の一例を示すフローチャートである。

【図7】物性の予測及び1次選別に関する処理手順の一例を示すフローチャートである。

【図8】物性の予測及び２次選別に関する処理手順の一例を示すフローチャートである。

【図9】再学習に関する処理手順の一例を示すフローチャートである。

【発明を実施するための形態】

【0014】

本開示をその実施の形態を示す図面を参照して具体的に説明する。

【0015】

（第１実施形態）
図１は、本実施形態の製造システム１００の構成例を示すブロック図である。製造システム１００は、予測装置１と製造装置２とを備える。本実施形態の製造システム１００は、新規物質、代替物質の研究、開発などのために、複数の候補物質の物性を予測し、予測結果に基づき候補物質の中から製造対象として選別された物質を製造する。

【0016】

本実施形態では一例として、物質が有機半導体材料であり、物性として有機半導体中のキャリア移動度を予測する場合について説明する。有機半導体は、例えば有機ＥＬ（Electro Luminescence）ディスプレイ、有機太陽電池、有機トランジスタ等の電子デバイスに広く用いられている。キャリア移動度とは、電荷（電子又は正孔）がどれだけ速く（又は多く）移動し得るかを示す指標となるものである。

【0017】

予測装置１は、種々の情報処理、情報の送受信が可能な情報処理装置であり、例えばパーソナルコンピュータ、サーバコンピュータ、量子コンピュータ等である。予測装置１は、所定の訓練データを用いて、物質の物性を予測する第１学習モデル１２１及び物質の物性を表す模擬実験値を推定する第２学習モデル１２２を生成する。模擬実験値とは、物性を表す実験値を模擬する値を表す。また予測装置１は、生成した第１学習モデル１２１及び第２学習モデル１２２を用いて、複数の候補物質の物性を予測し、予測結果に基づいて、候補物質の中から所望の物性を満たし得る物質を選別する。予測装置１は、情報処理装置に対応する。

【0018】

製造装置２は、選別された有機半導体材料を製造する。製造装置２は、例えば有機半導体材料の原材料を混合する混合部（不図示）を備え、有機半導体材料の原材料を混合して有機半導体材料を製造する。製造装置２はさらに、有機半導体材料を含む有機半導体膜を形成する成膜部を備え、有機半導体膜を製造してもよい。なお、製造装置２は、製造対象となる物質に応じて適宜構成されてよい。

【0019】

図１に示すように、予測装置１は、制御部１１、記憶部１２、通信部１３、入力部１４、及び出力部１５等を備える。予測装置１は、複数台のコンピュータで構成し分散処理する構成でもよく、１台のサーバ内に設けられた複数の仮想マシンによって実現されていてもよく、クラウドサーバを用いて実現されていてもよい。

【0020】

制御部１１は、一又は複数のＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）等を用いたプロセッサを備える。制御部１１は、内蔵するＲＯＭ（Read Only Memory）又はＲＡＭ（Random Access Memory）等のメモリ、クロック、カウンタ等を用い、各構成部を制御して処理を実行する。なお、予測装置１の機能は、ソフトウェア的に実現してもよいし、一部又は全部を、例えばＡＳＩＣ（Application Specific Integrated Circuit）、ＦＰＧＡ（Field Programmable Gate Array）等のハードウェアで実現してもよい

【0021】

記憶部１２は、例えばハードディスク、フラッシュメモリ、ＳＳＤ（Solid State Drive）等の不揮発性メモリを備える。記憶部１２は、予測装置１に接続された外部記憶装置であってもよい。記憶部１２は、制御部１１が参照する各種コンピュータプログラム及びデータを記憶する。

【0022】

本実施形態の記憶部１２には、第１学習モデル１２１及び第２学習モデル１２２の生成に関する処理と、物質の物性の予測に関する処理とをコンピュータに実行させるためのプログラム１Ｐが記憶されている。また記憶部１２には、第１学習モデル１２１、第２学習モデル１２２、及び訓練ＤＢ（Data Base）１２３が記憶されている。

【0023】

第１学習モデル１２１は、物質の特徴量に応じた物性を予測するモデルである。第２学習モデル１２２は、物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報とに応じた模擬実験値を推定するモデルである。第１学習モデル１２１及び第２学習モデル１２２は、機械学習により生成された学習モデルである。第１学習モデル１２１及び第２学習モデル１２２は、人工知能ソフトウェアの一部を構成するプログラムモジュールとしての利用が想定される。訓練ＤＢ１２３は、第１学習モデル１２１及び第２学習モデル１２２の学習に用いる訓練データを格納するデータベースである。

【0024】

プログラム１Ｐを含むコンピュータプログラム（コンピュータプログラム製品）は、当該コンピュータプログラムを読み取り可能に記録した非一時的な記録媒体１Ａにより提供されてもよい。記憶部１２は、不図示の読出装置によって記録媒体１Ａから読み出されたコンピュータプログラムを記憶する。記録媒体１Ａは、例えば磁気ディスク、光ディスク、半導体メモリ等である。また、通信ネットワークに接続されている外部サーバからコンピュータプログラムをダウンロードし、記憶部１２に記憶させてもよい。プログラム１Ｐは、単一のコンピュータプログラムでも複数のコンピュータプログラムにより構成されるものでもよく、また、単一のコンピュータ上で実行されても通信ネットワークによって相互接続された複数のコンピュータ上で実行されてもよい。

【0025】

通信部１３は、不図示のネットワークを介して外部装置と通信するための通信モジュールを備える。制御部１１は、通信部１３を介して外部装置との間でデータを送受信する。通信部１３は省略してもよい。

【0026】

入力部１４は、訓練データに用いる各種データ及び候補物質に対する要求物性等、学習モデルの生成及び物性予測の実施に必要な各種データの入力を受け付ける。入力部１４は、受け付けた入力内容を制御部１１へ送出する。入力部１４は、例えばキーボード、マウス、ディスプレイ内蔵のタッチパネルデバイス、外部からデータを取り込むインタフェース等を備える。

【0027】

出力部１５は、第１学習モデル１２１及び第２学習モデル１２２を用いて予測された物性、候補物質の選別結果等、物性予測の実施に伴う各種データを出力する。出力部１５は、制御部１１からの指示に従って各種の情報を出力する。出力部１５は、例えばディスプレイ装置を備える。

【0028】

予測装置１は、外部に接続されたコンピュータを通じて操作を受付け、通知すべき情報を外部のコンピュータへ出力する構成であってもよい。この場合、予測装置１は、入力部１４及び出力部１５を備えていなくてもよい。

【0029】

本実施形態では、予測装置１が、第１学習モデル１２１を生成する第１学習モデル生成装置、第２学習モデル１２２を生成する第２学習モデル生成装置、及び物性予測を行う予測装置として機能するものとして説明するが、予測装置１の構成は限られない。第１学習モデル生成装置、第２学習モデル生成装置及び予測装置は共通する１台の装置であるものに限らず、別個の装置として設けられてもよい。

【0030】

図２は、訓練ＤＢ１２３に記憶される情報の内容例を示す図である。訓練ＤＢ１２３は、第１テーブル１２３ａ及び第２テーブル１２３ｂを含む。

【0031】

第１テーブル１２３ａは、第１学習モデル１２１の学習に用いるデータを格納する。第１テーブル１２３ａには、例えばデータＩＤをキーに、物質の構造式、物質の特徴量、及び物性等の情報を紐付けたレコードが格納されている。

【0032】

物質の特徴量とは、物質の構造を表す情報であり、例えば物質の化学的構造データ、物理的構造データ等を含む。図２に示す例では、物質の特徴量として、分子記述子が記憶される。分子記述子は、物質の持つ構造的特徴や物理化学的特性等を計算機で扱いやすくするために数値化したものである。分子記述子は、物質の構造式から計算可能であり、公知のソフトウェア、例えばＲＤＫｉｔ、ｍｏｒｄｒｅｄ、ＭＯＥ、ａｌｖａＤｅｓｃ、ＰａＤＥＬ－Ｄｅｓｃｒｉｐｔｏｒ、Ｃｏｄｅｓｓａ等を用いて求めることができる。第１テーブル１２３ａには、複数の記述子項目に係る分子記述子の値が含まれていてもよい。

【0033】

物質の特徴量は、分子記述子に限らず、例えば、化学構造式をグラフ情報に変換したもの、物理的状態（例えば固体状、液体状、気体状、膜状等）等を含んでもよい。

【0034】

物性列には、キャリア移動度の実験値又は模擬実験値が記憶される。実験値は、実際に実験を行うことにより得られた物性値である。模擬実験値は、実験値を模擬する物性値である。模擬実験値は、後述する第２学習モデル１２２を用いて生成される。各キャリア移動度には、当該キャリア移動度が実験値又は模擬実験値のいずれであるかを表すデータ種別が対応付けられている。

【0035】

第２テーブル１２３ｂは、第２学習モデル１２２の学習に用いるデータを格納する。第２テーブル１２３ｂには、例えばデータＩＤをキーに、物質の構造式、物性を表すシミュレーション値、物質の特徴量、及び物性の実験値等の情報を紐付けたレコードが格納されている。

【0036】

シミュレーション値は、所定のアルゴリズムにより求められた物質の物性値である。シミュレーション値は、例えば理論計算により得られる。理論計算としては、例えば、量子化学計算、分子動力学計算、第一原理計算等が挙げられる。このような理論計算は、実験値との誤差の小さい高精度な値が得られることが知られている。各計算手法によるシミュレーション値は、公知の理論計算ソフトウェアを用いて求めることができる。シミュレーション値列には、少なくとも実験値列に記憶される物性項目と同一の物性項目に係るシミュレーション値が格納される。図２に示す例にて、シミュレーション値列及び実験値列には、キャリア移動度が含まれる。

【0037】

シミュレーション値列には、実験値の物性項目を含む複数の物性項目に係るシミュレーション値が含まれてもよい。この場合、各シミュレーション値は、同じ又は異なるシミュレーション手法により算出されてよい。実験値の物性項目以外の物性としては、実験値の物性項目と相関する又は相関が比較的強いと考えられる物性項目（例えば再配向エネルギー、キャリア有効質量等）であることが好ましい。

【0038】

物質の特徴量は、第１テーブル１２３ａと同様に、例えば物質の化学的構造データ、物理的構造データ等を含む。図２に示す例では、物質の特徴量として、分子記述子が記憶される。物性の実験値は、実験を行うことにより得られた実験値としてのキャリア移動度を含む。

【0039】

第１テーブル１２３ａ及び第２テーブル１２３ｂの記憶内容は図２に示す例に限定されない。

【0040】

図３は、第１学習モデル１２１の概要を示す説明図である。第１学習モデル１２１は、物質の特徴量を入力として、当該物質の物性を示す情報を出力する。図３に示す例にて、第１学習モデル１２１は、有機半導体材料の分子記述子を入力として有機半導体材料のキャリア移動度を予測する。

【0041】

第１学習モデル１２１は、例えばニューラルネットワークである。第１学習モデル１２１は、分子記述子が入力される入力層と、物性値を出力する出力層と、特徴量を抽出する中間層（隠れ層）とを備える。中間層は、畳み込み層、プーリング層及び全結合層等を含んでもよい。中間層は、入力データの特徴量を抽出する複数のノードを有し、各種パラメータを用いて抽出された特徴量を出力層に受け渡す。入力層に分子記述子が入力された場合、学習済みパラメータによって中間層で演算が行なわれ、出力層から、物性を示す出力情報が出力される。

【0042】

第１学習モデル１２１の説明変数となる分子記述子には、複数の記述子項目に係る分子記述子の値が含まれてもよい。説明変数に用いる分子記述子の数及び種類は、予測対象の物質や物性に応じて適宜設定されてよい。

【0043】

第１学習モデル１２１における説明変数にはさらに、物質のシミュレーション値、物質におけるプロセス情報、スペクトルデータ、画像データ及びカタログデータ等が含まれてもよい。物質の構造又は物性を表す情報に加えて物質に関する多様な情報を説明変数とすることで、精度向上効果が期待でき、好適である。

【0044】

第１学習モデル１２１の説明変数となるシミュレーション値の物性項目は、目的変数となる物性項目とは異なるものであってよい。すなわち、第１学習モデル１２１は、予測対象となる物性とは異なる物性のシミュレーション値を入力とするものであってよい。
項目とは異なる物性を表す情報であってよい。

【0045】

プロセス情報は、物質におけるプロセスに関する情報を含む。プロセス情報には、例えば、物質を合成する合成工程における合成条件、物質を作製（調製）する作製（調製）工程における作製条件等が含まれる。合成条件としては、例えば、原材料組成、重合度、原材料温度、反応温度、合成に用いる溶媒や媒質の物性等が挙げられる。作製条件としては、例えば作製工程におけるワークや製造装置の制御パラメータが挙げられる。具体的には、作製条件としては、スピンコート法による成膜時のスピンコーターの回転数、真空蒸着法による成膜時の蒸着速度、膜厚、成膜後のアニーリング温度、作製に用いる溶媒や媒質の物性等が挙げられる。

【0046】

スペクトルデータは、物質の発光スペクトルに関する情報である。スペクトルデータとしては、例えば、スペクトル幅、スペクトル強度、第１ピーク及び第２ピークの強度比、スペクトル形状の標準偏差、スペクトル画像等が挙げられる。スペクトル幅は、発光スペクトルの半値幅であってもよい。半値幅は、半値全幅（ＦＷＨＭ：Full Width at Half Maximum）でも半値半幅（ＨＷＨＭ：Half Width at Half Maximum）でもよい。

【0047】

画像データは、物質を表す画像データである。画像データとしては、例えば、走査電子顕微鏡（ＳＥＭ：Scanning Electron Microscope）によって撮影されるＳＥＭ画像、透過型電子顕微鏡（ＴＥＭ：Transmission Electron Microscope）によって撮影されるＴＥＭ画像等が挙げられる。

【0048】

カタログデータは、例えば物質、当該物質の原材料等が掲載されるカタログから抽出された情報を含む。カタログデータは、物質の物性を表す情報を含んでもよい。カタログデータは、例えば製品カタログのテキストマイニングを行い、所定の特徴語（例えば所定の物性）を抽出することにより得られる。

【0049】

説明変数は、画像データから導出されるパーシステントホモロジーデータを含んでもよい。パーシステントホモロジーは、ホモロジーと呼ばれる代数学の応用領域であり、図形の連結部分、「穴」、空洞の構造に着目した数学分野であり、位相的データ解析の一つの手法である。パーシステントホモロジーデータは、例えばパーシステント図、当該パーシステント図から得られる各種特徴量等を含んでよい。

【0050】

第１学習モデル１２１の出力層は１つのノードを有し、当該ノードからキャリア移動度を表す連続値を出力する。なお、予測すべきキャリア移動度に関する情報を得ることができれば、出力層の構成は特に限定されない。第１学習モデル１２１は、複数種類の物性を予測可能に構成されてもよい。第１学習モデル１２１は、例えば、キャリア移動度と、光吸収波長、発光波長、光吸収強度及び発光強度のうちの少なくとも１つとを予測する構成であってもよい。

【0051】

第１学習モデル１２１は、有機半導体材料の分子記述子に対し、既知のキャリア移動度を示すデータがラベリングされた訓練データを用意し、当該訓練データを用いて未学習のニューラルネットワークを機械学習させることにより生成することができる。

【0052】

推定精度の高いモデルを生成するためには、大量の訓練データが必要である一方で、実験を行って物性の実験値を得ることは、時間とコストを要する。本実施形態では、訓練データとして、キャリア移動度の実験値に加えて、キャリア移動度の模擬実験値を用いて第１学習モデル１２１を学習する。これにより、高精度な第１学習モデル１２１を効率よく生成する。模擬実験値は、第２学習モデル１２２を用いて生成される。

【0053】

図４は、第２学習モデル１２２の概要を示す説明図である。第２学習モデル１２２は、物質の所定物性を表すシミュレーション値と、物質の構造又は物性を表す情報とを入力として、当該物質の所定物性を表す模擬実験値を示す情報を出力する。図４に示す例にて、第２学習モデル１２２は、有機半導体材料のキャリア移動度の量子化学計算値及び分子記述子を入力として、当該有機半導体材料のキャリア移動度の模擬実験値を推定する。

【0054】

第２学習モデル１２２は、例えばニューラルネットワークである。第２学習モデル１２２の構成は、第１モデル１２１と同様であるため詳細な説明を省略する。

【0055】

第２学習モデル１２２の説明変数となるシミュレーション値の物性項目は、目的変数となる物性項目と同じである。すなわち、第２学習モデル１２２は、推定対象となる物性と同じ物性のシミュレーション値を入力とする。なお、第２学習モデル１２２の説明変数には、目的変数と同じ物性のシミュレーション値に加えて、目的変数と同じ物性以外の物性のシミュレーション値が含まれてもよい。

【0056】

第２学習モデル１２２の説明変数となる分子記述子には、複数の記述子項目に係る分子記述子の値が含まれてもよい。説明変数に用いる分子記述子の数及び種類は、推定対象となる模擬実験値の物性に応じて適宜設定されてよい。

【0057】

第２学習モデル１２２は、物質の構造を表す特徴量を説明変数とするものに限らず、物質の物性を表す情報を説明変数としてもよい。第２学習モデル１２２は、物質の構造を表す特徴量及び物質の物性を表す情報を説明変数としてもよい。物質の物性を表す情報は、推定対象となる模擬実験値の物性とは異なる物性を表す情報であってよい。

【0058】

第２学習モデル１２２における説明変数にはさらに、物質におけるプロセス情報、スペクトルデータ、画像データ及びカタログデータ等が含まれてもよい。

【0059】

第２学習モデル１２２は、シミュレーション値が表す物性の模擬実験値を出力する。第２学習モデル１２２は、複数種類の模擬実験値を推定可能に構成されてもよい。この場合、第２学習モデル１２２の説明変数には、少なくとも推定対象となる複数の模擬実験値それぞれに対応するシミュレーション値が含まれる。

【0060】

第２学習モデル１２２は、有機半導体材料のシミュレーション値及び分子記述子に対し、既知のキャリア移動度の実験値を示すデータがラベリングされた訓練データを用意し、当該訓練データを用いて未学習のニューラルネットワークを機械学習させることにより生成することができる。

【0061】

訓練データを格納する第２テーブル１２３ｂは、第２学習モデル１２２の生成に際し、予め記憶部１２に記憶される。予測装置１は、例えばユーザからの入力を受け付ける、又は外部サーバにアクセスする等により、有機半導体材料の分子構造を表す構造式と、キャリア移動度の実験値とを対応付けて取得する。予測装置１は、例えば、公知の量子化学計算ソフトウェア（例えばＧａｕｓｓｉａｎ１６（Ｇａｕｓｓｉａｎ社製））を用いて、有機半導体材料の構造式から所定の物性項目に係る量子化学計算値を算出する。また予測装置１は、例えば、公知のソフトウェア（例えばｍｏｒｄｒｅｄ）を用いて、有機半導体材料の構造式から所定の記述子項目に係る分子記述子を算出する。予測装置１は、得られた構造式、量子化学計算値、分子記述子及びキャリア移動度の実験値を対応付けて第２テーブル１２３ｂに格納する。予測装置１は、大量の有機半導体材料に関する構造式及び実験値を収集し、収集した情報に基づく情報群を第２テーブル１２３ｂに蓄積する。

【0062】

第２学習モデル１２２は、物質の構造を表す特徴量及び当該物質の所定物性のシミュレーション値に応じた上記所定物性の模擬実験値を推定する。第２学習モデル１２２は、シミュレーション値を実験値に近づけるよう補正するモデルとしての機能を有する。

【0063】

シミュレーションは、高精度に物性を予測することができ、物性予測方法として有効であると考えられる。しかしながら、量子化学計算のようなシミュレーションにおいては、モデル化された系、すなわち物質が実際に使用される系（現実系）とは差異がある系を扱っている。従って、モデル化された系（例えば、２分子複合体）でのシミュレーション値と、現実系（例えば、固体状態）での実験値との間に誤差が生じる可能性がある。第２学習モデル１２２を用いることで、シミュレーション値を実験値に近づけることができる。

【0064】

第１学習モデル１２１の構成は限定されず、有機半導体材料の特徴量に対し物性を識別可能であればよい。同様に、第２学習モデル１２２の構成は限定されず、シミュレーション値と、物質の構造又は物性を表す情報とに対し物性を表す模擬実験値を識別可能であればよい。第１学習モデル１２１及び第２学習モデル１２２は、例えば、Ｔｒａｎｓｆｏｒｍｅｒ、ＣＮＮ（Convolution Neural Network）、ＲＮＮ（Recurrent Neural Network）、ＧＮＮ（Graph Neural Network）、サポートベクタマシン、ロジスティクス回帰、決定木、ＸＧＢｏｏｓｔ（eXtreme Gradient Boosting ）等、その他の学習アルゴリズムに基づくモデルであってもよい。第２学習モデル１２２は、機械学習モデルに限られず、ルールベースの手法や特定の数式によって模擬実験値を導出するものであってもよい。第２学習モデル１２２は、シミュレーション値と、実験値との関係性に基づいて模擬実験値を生成するものであってもよい。

【0065】

図５は、第２学習モデル１２２の生成処理手順の一例を示すフローチャートである。以下の各フローチャートにおける処理は、予測装置１の記憶部１２に記憶するプログラム１Ｐに従って制御部１１によって実行される。

【0066】

予測装置１の制御部１１は、第２テーブル１２３ｂに記憶された情報に基づき、訓練用の有機半導体材料のシミュレーション値及び分子記述子に対し、当該有機半導体材料のキャリア移動度の実験値が付与された訓練データを取得する（ステップＳ１１）。

【0067】

制御部１１は、取得した訓練データを用いて、有機半導体材料のシミュレーション値及び分子記述子を入力した場合に、当該有機半導体材料のキャリア移動度の模擬実験値を出力する第２学習モデル１２２を生成する（ステップＳ１２）。

【0068】

具体的には、制御部１１は、訓練データに含まれるシミュレーション値及び分子記述子を第２学習モデル１２２の入力層に入力し、中間層での演算処理を経て、出力層から出力されるキャリア移動度を取得する。制御部１１は、出力層から出力されたキャリア移動度と、訓練データに含まれるキャリア移動度とを比較し、出力層から出力されるキャリア移動度が正解値に近づくように、ニューロン間の重み（結合係数）等のパラメータを最適化する。パラメータの最適化の方法は特に限定されないが、例えば予測装置１は誤差逆伝播法を用いて各種パラメータの最適化を行う。学習が開始される前の段階では、第２学習モデル１２２を記述する定義情報には、初期設定値が与えられているものとする。誤差、学習回数等が所定基準を満たすことによって学習が完了すると、最適化されたパラメータが得られる。

【0069】

学習が完了すると、制御部１１は、学習済みの第２学習モデル１２２として、学習済みの第２学習モデル１２２に関する定義情報を記憶部１２に記憶させ、一連の処理を終了する。上述の処理により、シミュレーション値及び分子記述子に対し、キャリア移動度の模擬実験値を適切に推定可能に学習された第２学習モデル１２２が構築（用意）される。

【0070】

図６は、第１学習モデル１２１の生成処理手順の一例を示すフローチャートである。

【0071】

予測装置１の制御部１１は、複数の有機半導体材料（有機半導体分子）を生成する（ステップＳ２１）。ステップＳ２１において、有機半導体材料はコンピュータ上で生成される。

【0072】

制御部１１は、生成した有機半導体材料それぞれについて、シミュレーション値及び分子記述子を導出する（ステップＳ２２）。制御部１１は、例えば、公知の量子化学計算ソフトウェアを用いて、生成した有機半導体材料の分子構造を表す構造式から所定の物性項目に係る量子化学計算値を算出する。制御部１１は、公知のソフトウェアを用いて、有機半導体材料の構造式から所定の記述子項目に係る分子記述子を算出する。

【0073】

制御部１１は、取得したシミュレーション値及び分子記述子を第２学習モデル１２２に入力する（ステップＳ２３）。制御部１１は、第２学習モデル１２２から出力されるキャリア移動度の模擬実験値を取得する（ステップＳ２４）。制御部１１は、生成した各有機半導体材料に対し上述の処理を実行して、模擬実験値をそれぞれ推定する。

【0074】

制御部１１は、生成した有機半導体材料の構造式、分子記述子、及びキャリア移動度の模擬実験値を対応付けて訓練ＤＢ１２３の第１テーブル１２３ａに記憶する（ステップＳ２５）。上述の処理により、複数の情報群が第１テーブル１２３ａに蓄積される。なお制御部１１は、キャリア移動度の実験値が得られている有機半導体材料の情報を第１テーブル１２３ａに追加してもよい。制御部１１は、例えば、第２テーブル１２３ｂに記憶された情報に基づいて、有機半導体材料の分子記述子と、既知のキャリア移動度の実験値とを抽出し、抽出した分子記述子及びキャリア移動度の実験値を、第１テーブル１２３ａに追加する。

【0075】

制御部１１は、第１テーブル１２３ａに記憶された情報に基づき、訓練用の有機半導体材料の分子記述子に対し、当該有機半導体材料のキャリア移動度の模擬実験値又は実験値が付与された訓練データを取得する（ステップＳ２６）。

【0076】

制御部１１は、取得した訓練データを用いて、有機半導体材料の分子記述子を入力した場合に、当該有機半導体材料のキャリア移動度を出力する第１学習モデル１２１を生成する（ステップＳ２７）。

【0077】

具体的には、制御部１１は、訓練データに含まれる分子記述子を第２テーブル１２３ｂの入力層に入力し、中間層での演算処理を経て、出力層から出力されるキャリア移動度を取得する。制御部１１は、出力層から出力されたキャリア移動度と、訓練データに含まれるキャリア移動度とを比較し、出力層から出力されるキャリア移動度が正解値に近づくように、例えば誤差逆伝播法を用いて各種パラメータを最適化する。例えば誤差、学習回数等が所定基準を満たすことによって学習が完了すると、最適化されたパラメータが得られる。

【0078】

学習が完了すると、制御部１１は、学習済みの第１学習モデル１２１として、学習済みの第１学習モデル１２１に関する定義情報を記憶部１２に記憶させ、一連の処理を終了する。上述の処理により、分子記述子に対し、キャリア移動度を適切に予測可能に学習された第２学習モデル１２２が構築される。

【0079】

第１学習モデル１２１及び／又は第２学習モデル１２２は、予測装置１が生成するものに限定されない。予測装置１は、外部サーバにおいて生成された学習済みの第１学習モデル１２１及び／又は第２学習モデル１２２を取得し、記憶部１２に記憶してもよい。第１学習モデル１２１及び／又は第２学習モデル１２２は、外部サーバにおいて生成され、予測装置１において学習されてもよい。第１学習モデル１２１及び／又は第２学習モデル１２２の学習に用いる訓練データは、予測装置１により生成及び記憶されるものに限らず、外部サーバから取得してもよい。

【0080】

予測装置１は、物性の予測を行う運用フェーズの前段階である学習フェーズにおいて、第１学習モデル１２１及び第２学習モデル１２２を生成する。そして、運用フェーズにおいて、第１学習モデル１２１及び第２学習モデル１２２を用いて物性を予測する。

【0081】

図７は、物性の予測及び１次選別に関する処理手順の一例を示すフローチャートである。

【0082】

予測装置１の制御部１１は、製造対象となる有機半導体材料（有機半導体分子）に要求されるキャリア移動度、すなわち要求物性を取得する（ステップＳ３１）。要求物性は、例えばキャリア移動度の下限値である。制御部１１は、例えば、入力部１４を介して、ユーザからの入力を受け付けることで要求物性を取得してもよく、通信接続された外部装置から送信される情報を受信することにより要求物性を取得してもよい。

【0083】

制御部１１は、複数の候補有機半導体材料を生成する（ステップＳ３２）。ステップＳ３２において、候補有機半導体材料はコンピュータ上で生成される。

【0084】

制御部１１は、生成した候補有機半導体材料それぞれについて、分子記述子を導出する（ステップＳ３３）。制御部１１は、例えば、公知のソフトウェアを用いて、生成した候補有機半導体材料の分子構造を表す構造式から所定の記述子項目に係る分子記述子を算出する。

【0085】

制御部１１は、導出した分子記述子を第１学習モデル１２１に入力する（ステップＳ３４）。制御部１１は、第１学習モデル１２１から出力されるキャリア移動度を取得する（ステップＳ３５）。制御部１１は、生成した各候補有機半導体材料に対し上述の処理を実行して、キャリア移動度をそれぞれ予測する。

【0086】

制御部１１は、予測結果に基づいて、生成した候補有機半導体材料の中から要求物性を満たす有機半導体材料を選別し（ステップＳ３６）、要求物性を満たす有機半導体材料を抽出する。ステップＳ３６の選別は１次選別に対応する。ステップＳ３６において、制御部１１は、物性の予測誤差を考慮し、要求物性に対し所定のマージンを加味した物性値を、１次選別処理における閾値としてもよい。

【0087】

上述の処理において、予測装置１は、１次選別結果を出力してもよい。なお予測装置１は、例えば１次選別結果に対するユーザ操作を受け付けることにより、１次選別された有機半導体材料の中からさらに、所望の有機半導体材料のみを抽出してもよい。

【0088】

図８は、物性の予測及び２次選別に関する処理手順の一例を示すフローチャートである。予測装置１は、図７のフローチャートの処理の終了後に、図８の処理を開始してよい。

【0089】

予測装置１の制御部１１は、図７のステップＳ３６にて抽出した複数の候補有機半導体材料について、キャリア移動度のシミュレーション値を算出する（ステップＳ４１）。制御部１１は、例えば、公知の量子化学計算ソフトウェアを用いて、生成した有機半導体材料の分子構造を表す構造式からキャリア移動度の量子化学計算値を算出する。

【0090】

制御部１１は、導出したシミュレーション値、及びステップＳ３３で導出した分子記述子を第２学習モデル１２２に入力する（ステップＳ４２）。制御部１１は、第２学習モデル１２２から出力されるキャリア移動度の模擬実験値を取得する（ステップＳ４３）。制御部１１は、１次選別された各候補有機半導体材料に対し上述の処理を実行して、キャリア移動度の模擬実験値をそれぞれ推定する。

【0091】

制御部１１は、模擬実験値の推定結果に基づいて、１次選別された候補有機半導体材料の中から要求物性を満たす有機半導体材料を選別し（ステップＳ４４）、要求物性を満たす有機半導体材料を抽出する。ステップＳ４４の選別は２次選別に対応する。ステップＳ４４において、制御部１１は、物性の推定誤差を考慮し、要求物性に対し所定のマージンを加味した物性値を、２次選別処理における閾値としてもよい。なお、１次選別及び２次選別に対し、異なる要求物性が設定されてもよい。

【0092】

制御部１１は、出力部１５を通じて選別結果を出力する（ステップＳ４５）。制御部１１は、例えば要求物性を満たす有機半導体材料と、キャリア移動度の予測値とを対応付けて出力する。制御部１１は、各候補有機半導体材料に係る物性の予測結果を出力してもよい。制御部１１は、例えば製造装置２、外部サーバ等、出力部１５以外へ選別結果を出力してもよい。

【0093】

製造装置２では、予測装置１で選別された有機半導体材料の組成に対応する原材料を用意し、用意した原材料を混合して、有機半導体材料を製造する。製造装置２は、公知の合成手法に従い原材料を合成することにより、有機半導体材料を得ることができる。有機半導体材料は、例えば、カップリング反応、アミノ化反応、縮合反応等の反応やハロゲン化反応等の官能基変換反応等を組み合わせることにより得られる。製造装置２はさらに、例えばスピンコート法、真空蒸着法、インクジェット法等により有機半導体材料を成膜し、有機半導体膜を製造してもよい。

【0094】

なお、有機半導体材料は、第１学習モデル１２１を用いた１次選別処理と、第２学習モデル１２２を用いた２次選別処理との２段階で抽出されるものに限らず、１次選別処理又は２次選別処理のいずれか一方のみを経て抽出されてもよい。

【0095】

上述の第１学習モデル１２１及び第２学習モデル１２２により予測する物性項目は単なる例示であり、予測すべき物質に応じた各種物性を予測するものであってよい。同様に、第１学習モデル１２１及び第２学習モデル１２２に入力する特徴量、シミュレーション値等はいずれも単なる例示であり、予測すべき物性に応じて適宜選択されてよい。物性予測の対象となる物質は、例えば有機化合物、無機化合物、又はそれらの混合物であってもよい。物性予測の対象となる物質は、材料物質に限定されず、例えば医薬品、生体物質、食品等であってもよい。

【0096】

第１学習モデル１２１及び第２学習モデル１２２は、候補物質の選別に用いるものに限らず、各種の物性予測に適用することができる。例えば、実際に得られた物質について、実験による物性値の測定に代えて第１学習モデル１２１及び第２学習モデル１２２を用いて物性を予測してもよい。

【0097】

本実施形態によれば、第１学習モデル１２１の生成に用いる訓練データに模擬実験値を使用することで、物質の物性を高精度に予測する第１学習モデル１２１を効率よく生成することができる。模擬実験値を使用することで、実験の手間を大幅に低減することができ、時間とコストの削減につながる。第１学習モデル１２１を用いることで、分子記述子のように比較的容易に求められるデータに基づいて、物性を効率的且つ精度よく予測することができる。分子記述子に加えて、例えば物質のシミュレーション値、プロセス情報等を第１学習モデル１２１への入力要素とすることで、第１学習モデル１２１の精度向上効果が期待できる。例えば、異なる実験系で実験値を取得した場合には、当該実験系に関する情報を入力に加えることで、より適正な物性を予測し得る。

【0098】

模擬実験値は、第２学習モデル１２２を用いて効率的且つ精度よく生成される。模擬実験値の生成により、第１学習モデル１２１の生成に用いる訓練データのデータ量を効率的に増大するとともに、訓練データに用いるデータの品質低下を低減することができる。

【0099】

第２学習モデル１２２を用いることで、シミュレーション値を実験値に近づけることができる。第２学習モデル１２２を用いることで、例えば、分子記述子により現実系で起こる材料と周囲の環境との相互作用を加味することができる。分子記述子に加えて、例えばプロセス情報を第２学習モデル１２２への入力要素とすることで、材料を現実系に適用する際のプロセス変数を加味することができる。シミュレーション値以外の情報を用いてシミュレーション値を補正することで、シミュレーション値を実験値に近づけることができる。

【0100】

本実施形態によれば、第１学習モデル１２１及び第２学習モデル１２２を用いて、所望の特性を満たし得る物質を効率的に抽出し、製造することができる。第２学習モデル１２２を用いて求められた物性値は、第１学習モデル１２１を用いて求められた物性値よりも高い予測精度であることが期待される。比較的容易に求められるデータを説明変数とする第１学習モデル１２１を用いて１次選別を行い、１次選別された物質に対してのみ量子化学計算等のシミュレーションを行うことで、予測装置１の演算負荷を低減することができる。１次選別された物質については、第２学習モデル１２２を用いてシミュレーション値から模擬実験値を推定することで、所望の特性を満たし得る物質を精度よく選別することができる。

【0101】

（第２実施形態）
第２実施形態では、予測装置１は、第１学習モデル１２１及び第２学習モデル１２２の再学習を行う。図９は、再学習に関する処理手順の一例を示すフローチャートである。予測装置１は、例えば製造装置２による有機半導体材料の製造後に、図９の処理を開始する。

【0102】

予測装置１の制御部１１は、製造された新たな有機半導体材料の実験値を取得したか否かを判定する（ステップＳ５１）。例えば、新たな有機半導体材料に対する実験が行われておらず、実験結果を受け付けていないことにより、実験値を取得していないと判定した場合（ステップＳ５１：ＮＯ）、制御部１１は、第１学習モデル１２１の再学習を行う（ステップＳ５２）。制御部１１は、新たな有機半導体材料の分子記述子に対し、図８のステップＳ４３で取得したキャリア移動度の模擬実験値をラベリングした情報を訓練データとして第１学習モデル１２１の再学習を行い、第１学習モデル１２１を更新する。

【0103】

一方、例えば、新たな有機半導体材料に対する実験が行われ、実験結果を受け付けたことにより、実験値を取得したと判定した場合（ステップＳ５１：ＹＥＳ）、制御部１１は、第２学習モデル１２２の再学習を行う（ステップＳ５３）。制御部１１は、新たな有機半導体材料のシミュレーション値及び分子記述子に対し、取得したキャリア移動度の実験値をラベリングした情報を訓練データとして第２学習モデル１２２の再学習を行い、第２学習モデル１２２を更新する。

【0104】

上述の処理において、制御部１１は、新たな有機半導体材料に対する実験値を取得したと判定した場合、第２学習モデル１２２に加えて第１学習モデル１２１の再学習を行ってもよい。この場合、制御部１１は、新たな有機半導体材料の分子記述子に対し、取得したキャリア移動度の実験値をラベリングした情報を訓練データとして第１学習モデル１２１の再学習を行い、第１学習モデル１２１を更新することができる。

【0105】

制御部１１は、更新後の第１学習モデル１２１及び第２学習モデル１２２を用いて、再度図７及び図８で示した選別処理を実行してもよい。

【0106】

制御部１１はまた、更新後の第２学習モデル１２２を用いて、再度図６から図８で示した処理を実行してもよい。すなわち図９の処理の終了後、処理を図６に戻すループ処理を実行してもよい。制御部１１は、図９の処理により第２学習モデル１２２を更新した後、再度図６の処理を実行することにより、更新後の第２学習モデル１２２を用いて訓練データを生成し、さらに新たに第１学習モデル１２１を生成する。制御部１１は、得られた第１学習モデル１２１及び第２学習モデル１２２を用いて、図７及び図８で示した選別処理を実行する。制御部１１は、上述のループ処理を予め設定される所定回数繰り返してもよい。上記構成によれば、要求物性を満たすと判定された有機半導体材料に絞られたシミュレーション値や模擬実験値が訓練データに追加されるため、第１学習モデル１２１の推定精度を一層向上し得る。また、精度が向上された第１学習モデル１２１を使用して選別処理を行うことで、選別精度が向上される。

【0107】

本実施形態によれば、本システムの運用を通じて第１学習モデル１２１及び第２学習モデル１２２の精度を向上させることができる。

【0108】

今回開示した実施の形態は、全ての点で例示であって、制限的なものではないと考えられるべきである。各実施例にて記載されている技術的特徴は互いに組み合わせることができ、本発明の範囲は、特許請求の範囲内での全ての変更及び特許請求の範囲と均等の範囲が含まれることが意図される。
各実施形態に示すシーケンスは限定されるものではなく、矛盾の無い範囲で、各処理手順はその順序を変更して実行されてもよく、また並行して複数の処理が実行されてもよい。各処理の処理主体は限定されるものではなく、矛盾の無い範囲で、各装置の処理を他の装置が実行してもよい。

【0109】

各実施形態に記載した事項は相互に組み合わせることが可能である。また、特許請求の範囲に記載した独立請求項及び従属請求項は、引用形式に関わらず全てのあらゆる組み合わせにおいて、相互に組み合わせることが可能である。さらに、特許請求の範囲には他の２以上のクレームを引用するクレームを記載する形式（マルチクレーム形式）を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム（マルチマルチクレーム）を記載する形式を用いて記載してもよい。

【0110】

以上の実施形態に関し、さらに以下の付記を開示する。
（付記１）
物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて第１学習モデルを生成する
学習モデルの生成方法。
（付記２）
前記訓練データは物質の特徴量を説明変数として含む
付記１に記載の学習モデルの生成方法。
（付記３）
物質の特徴量を入力した場合に物質の物性を予測する前記第１学習モデルを生成する
付記１又は付記２に記載の学習モデルの生成方法。
（付記４）
前記シミュレーション値と前記実験値との関係性に基づいて前記模擬実験値を生成する
付記１から付記３のいずれか１つに記載の学習モデルの生成方法。
（付記５）
シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第２学習モデルを用いて、前記模擬実験値を生成する
付記１から付記４のいずれか１つに記載の学習モデルの生成方法。
（付記６）
物質の特徴量に基づく理論計算により前記シミュレーション値を導出する
付記１から付記５のいずれか１つに記載の学習モデルの生成方法。
（付記７）
第１の前記第１学習モデルを用いて予測した物性が所定の要求物性を満たす物質の前記シミュレーション値に基づく前記模擬実験値を含む前記訓練データを取得し、
取得した前記訓練データに基づいて、第２の前記第１学習モデルを生成する
付記１から付記６のいずれか１つに記載の学習モデルの生成方法。
（付記８）
物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて第１学習モデルを生成する
処理を実行する制御部を備える
情報処理装置。
（付記９）
物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて第１学習モデルを生成する
処理をコンピュータに実行させるためのコンピュータプログラム。
（付記１０）
複数の物質に係る特徴量を取得し、
付記１に記載の学習モデルの生成方法により生成された第１学習モデルを用いて、取得した各物質の特徴量に応じた物質の物性を取得し、
取得した物性が所定の要求物性を満たす物質を選別する
物質の選別方法。
（付記１１）
選別した前記物質の物性を表すシミュレーション値と、前記物質の構造又は物性を表す情報とを取得し、
シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第２学習モデルに、取得した前記物質のシミュレーション値と、前記物質の構造又は物性を表す情報とを入力して前記物質の模擬実験値を取得し、
取得した前記模擬実験値が所定の要求物性を満たす物質を選別する
付記１０に記載の物質の選別方法。
（付記１２）
物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報と、前記シミュレーション値が表す物性の実験値とを含む訓練データに基づいて、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を出力するよう学習された学習モデルを用意し、
物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報とを取得し、
取得した前記シミュレーション値と、物質の構造又は物性を表す情報とを前記学習モデルに入力することにより、模擬実験値を生成する
模擬実験値の生成方法。

【符号の説明】

【0111】

１予測装置
１１制御部
１２記憶部
１３通信部
１４入力部
１５出力部
１Ａ記録媒体
１Ｐプログラム
１２１第１学習モデル
１２２第２学習モデル
１２３訓練ＤＢ
２製造装置

【要約】

【課題】物質の物性を予測する学習モデルを効率よく生成することができる学習モデルの生成方法等を提供する。
【解決手段】学習モデルの生成方法は、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第１学習モデルを生成する。
【選択図】図１