IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 住友化学株式会社の特許一覧

特許7406664学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法
<>
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図1
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図2
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図3
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図4
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図5
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図6
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図7
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図8
  • 特許-学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法 図9
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B1)
(11)【特許番号】
(24)【登録日】2023-12-19
(45)【発行日】2023-12-27
(54)【発明の名称】学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法
(51)【国際特許分類】
   G16C 20/70 20190101AFI20231220BHJP
   H10K 50/10 20230101ALI20231220BHJP
   H10K 59/10 20230101ALI20231220BHJP
   H10K 85/00 20230101ALI20231220BHJP
   G06N 20/00 20190101ALI20231220BHJP
   H10K 71/00 20230101ALI20231220BHJP
   G16C 60/00 20190101ALI20231220BHJP
【FI】
G16C20/70
H10K50/10
H10K59/10
H10K85/00
G06N20/00 130
H10K71/00
G16C60/00
【請求項の数】 7
(21)【出願番号】P 2023058079
(22)【出願日】2023-03-31
【審査請求日】2023-04-28
【早期審査対象出願】
(73)【特許権者】
【識別番号】000002093
【氏名又は名称】住友化学株式会社
(74)【代理人】
【識別番号】100114557
【弁理士】
【氏名又は名称】河野 英仁
(74)【代理人】
【識別番号】100078868
【弁理士】
【氏名又は名称】河野 登夫
(72)【発明者】
【氏名】西田 理彦
(72)【発明者】
【氏名】押木 淳
(72)【発明者】
【氏名】栗田 靖之
【審査官】藤澤 美穂
(56)【参考文献】
【文献】特開2021-174402(JP,A)
【文献】特開2021-140701(JP,A)
【文献】特許第4780554(JP,B2)
【文献】国際公開第2022/153984(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00-99/00
H10K 50/10
H10K 59/10
H10K 85/00
G06N 20/00
H10K 71/00
(57)【特許請求の範囲】
【請求項1】
物質の特徴量を説明変数とし、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得する工程と
取得した前記訓練データに基づいて物質の特徴量を入力した場合に物質の物性を予測する第1学習モデルを学習する工程とを含み、
前記シミュレーション値は、理論計算により導出され、
前記模擬実験値は、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第2学習モデルを用いて生成される
処理をコンピュータが実行する学習モデルの生成方法。
【請求項2】
前記第2学習モデルへ入力されるシミュレーション値は、前記第2学習モデルにより推定される模擬実験値の物性とは異なる物性のシミュレーション値を含む
請求項1に記載の学習モデルの生成方法。
【請求項3】
記第1学習モデルを用いて予測した物性が所定の要求物性を満たす物質の前記シミュレーション値に基づく前記模擬実験値を含む前記訓練データを取得し、
取得した前記訓練データに基づいて、前記第1学習モデルを再学習する
請求項1又は請求項2に記載の学習モデルの生成方法。
【請求項4】
物質の特徴量を説明変数とし、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて物質の特徴量を入力した場合に物質の物性を予測する第1学習モデルを学習し、
前記シミュレーション値は、理論計算により導出され、
前記模擬実験値は、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第2学習モデルを用いて生成される
処理を実行する制御部を備える
情報処理装置。
【請求項5】
物質の特徴量を説明変数とし、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて物質の特徴量を入力した場合に物質の物性を予測する第1学習モデルを学習し、
前記シミュレーション値は、理論計算により導出され、
前記模擬実験値は、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第2学習モデルを用いて生成される
処理をコンピュータに実行させるためのコンピュータプログラム。
【請求項6】
複数の物質に係る特徴量を取得し、
請求項1に記載の学習モデルの生成方法により生成された第1学習モデルを用いて、取得した各物質の特徴量に応じた物質の物性を取得し、
取得した物性が所定の要求物性を満たす物質を選別する
処理をコンピュータが実行する物質の選別方法。
【請求項7】
選別した前記物質の物性を表すシミュレーション値と、前記物質の構造又は物性を表す情報とを取得し、
シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第2学習モデルに、取得した前記物質のシミュレーション値と、前記物質の構造又は物性を表す情報とを入力して前記物質の模擬実験値を取得し、
取得した前記模擬実験値が所定の要求物性を満たす物質を選別する
請求項に記載の物質の選別方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、学習モデルの生成方法、情報処理装置、コンピュータプログラム、物質の選別方法及び模擬実験値の生成方法に関する。
【背景技術】
【0002】
新規物質、代替物質の研究、開発などを行う際に、機械学習等の情報処理技術を組み合わせて効率的に物質探索を行うマテリアルズ・インフォマティクスに関する技術が提案されている。
【0003】
例えば特許文献1には、予測対象である化合物と、化合物データベースから選択された化合物の共通構造及び差分構造を化合物性質予測モデルへ入力することによって、予測対象である化合物の性質の予測結果を得る化合物性質予測装置が開示されている。特許文献1の化合物性質予測モデルは、化合物データベースから選択された2つの化合物を選択化合物として、前記選択化合物の共通構造及び差分構造と、選択化合物について実測された性質と、の組み合わせを少なくとも含む教師付訓練データを用いて構築されることが記載されている。
【先行技術文献】
【特許文献】
【0004】
【文献】特開2021-076890号公報
【発明の概要】
【発明が解決しようとする課題】
【0005】
特許文献1に記載の技術は、モデルの構築に用いる訓練データとして化合物の実測データを収集する必要があるという問題がある。推定精度の高いモデルを生成するためには、大量の訓練データが必要である。実験を行って化合物の構造に応じた物性の実測値(実験値)を得ることは、時間とコストを要する。このため、学習モデルを効率よく生成することができる技術が望まれる。
【0006】
本開示の目的は、物質の物性を予測する学習モデルを効率よく生成することができる学習モデルの生成方法等を提供することである。
【課題を解決するための手段】
【0007】
本開示の一態様に係る学習モデルの生成方法は、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第1学習モデルを生成する。
【0008】
本開示の一態様に係る情報処理装置は、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第1学習モデルを生成する処理を実行する制御部を備える。
【0009】
本開示の一態様に係るコンピュータプログラムは、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第1学習モデルを生成する処理をコンピュータに実行させる。
【0010】
本開示の一態様に係る物質の選別方法は、複数の物質に係る特徴量を取得し、請求項1に記載の学習モデルの生成方法により生成された第1学習モデルを用いて、取得した各物質の特徴量に応じた物質の物性を取得し、取得した物性が所定の要求物性を満たす物質を選別する。
【0011】
本開示の一態様に係る模擬実験値の生成方法は、物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報と、前記シミュレーション値が表す物性の実験値とを含む訓練データに基づいて、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を出力するよう学習された学習モデルを用意し、物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報とを取得し、取得した前記シミュレーション値と、物質の構造又は物性を表す情報とを前記学習モデルに入力することにより、模擬実験値を生成する。
【発明の効果】
【0012】
本開示によれば、物質の物性を予測する学習モデルを効率よく生成することができる。
【図面の簡単な説明】
【0013】
図1】本実施形態の製造システムの構成例を示すブロック図である。
図2】訓練DBに記憶される情報の内容例を示す図である。
図3】第1学習モデルの概要を示す説明図である。
図4】第2学習モデルの概要を示す説明図である。
図5】第2学習モデルの生成処理手順の一例を示すフローチャートである。
図6】第1学習モデルの生成処理手順の一例を示すフローチャートである。
図7】物性の予測及び1次選別に関する処理手順の一例を示すフローチャートである。
図8】物性の予測及び2次選別に関する処理手順の一例を示すフローチャートである。
図9】再学習に関する処理手順の一例を示すフローチャートである。
【発明を実施するための形態】
【0014】
本開示をその実施の形態を示す図面を参照して具体的に説明する。
【0015】
(第1実施形態)
図1は、本実施形態の製造システム100の構成例を示すブロック図である。製造システム100は、予測装置1と製造装置2とを備える。本実施形態の製造システム100は、新規物質、代替物質の研究、開発などのために、複数の候補物質の物性を予測し、予測結果に基づき候補物質の中から製造対象として選別された物質を製造する。
【0016】
本実施形態では一例として、物質が有機半導体材料であり、物性として有機半導体中のキャリア移動度を予測する場合について説明する。有機半導体は、例えば有機EL(Electro Luminescence)ディスプレイ、有機太陽電池、有機トランジスタ等の電子デバイスに広く用いられている。キャリア移動度とは、電荷(電子又は正孔)がどれだけ速く(又は多く)移動し得るかを示す指標となるものである。
【0017】
予測装置1は、種々の情報処理、情報の送受信が可能な情報処理装置であり、例えばパーソナルコンピュータ、サーバコンピュータ、量子コンピュータ等である。予測装置1は、所定の訓練データを用いて、物質の物性を予測する第1学習モデル121及び物質の物性を表す模擬実験値を推定する第2学習モデル122を生成する。模擬実験値とは、物性を表す実験値を模擬する値を表す。また予測装置1は、生成した第1学習モデル121及び第2学習モデル122を用いて、複数の候補物質の物性を予測し、予測結果に基づいて、候補物質の中から所望の物性を満たし得る物質を選別する。予測装置1は、情報処理装置に対応する。
【0018】
製造装置2は、選別された有機半導体材料を製造する。製造装置2は、例えば有機半導体材料の原材料を混合する混合部(不図示)を備え、有機半導体材料の原材料を混合して有機半導体材料を製造する。製造装置2はさらに、有機半導体材料を含む有機半導体膜を形成する成膜部を備え、有機半導体膜を製造してもよい。なお、製造装置2は、製造対象となる物質に応じて適宜構成されてよい。
【0019】
図1に示すように、予測装置1は、制御部11、記憶部12、通信部13、入力部14、及び出力部15等を備える。予測装置1は、複数台のコンピュータで構成し分散処理する構成でもよく、1台のサーバ内に設けられた複数の仮想マシンによって実現されていてもよく、クラウドサーバを用いて実現されていてもよい。
【0020】
制御部11は、一又は複数のCPU(Central Processing Unit)、GPU(Graphics Processing Unit)等を用いたプロセッサを備える。制御部11は、内蔵するROM(Read Only Memory)又はRAM(Random Access Memory)等のメモリ、クロック、カウンタ等を用い、各構成部を制御して処理を実行する。なお、予測装置1の機能は、ソフトウェア的に実現してもよいし、一部又は全部を、例えばASIC(Application Specific Integrated Circuit)、FPGA(Field Programmable Gate Array)等のハードウェアで実現してもよい
【0021】
記憶部12は、例えばハードディスク、フラッシュメモリ、SSD(Solid State Drive)等の不揮発性メモリを備える。記憶部12は、予測装置1に接続された外部記憶装置であってもよい。記憶部12は、制御部11が参照する各種コンピュータプログラム及びデータを記憶する。
【0022】
本実施形態の記憶部12には、第1学習モデル121及び第2学習モデル122の生成に関する処理と、物質の物性の予測に関する処理とをコンピュータに実行させるためのプログラム1Pが記憶されている。また記憶部12には、第1学習モデル121、第2学習モデル122、及び訓練DB(Data Base)123が記憶されている。
【0023】
第1学習モデル121は、物質の特徴量に応じた物性を予測するモデルである。第2学習モデル122は、物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報とに応じた模擬実験値を推定するモデルである。第1学習モデル121及び第2学習モデル122は、機械学習により生成された学習モデルである。第1学習モデル121及び第2学習モデル122は、人工知能ソフトウェアの一部を構成するプログラムモジュールとしての利用が想定される。訓練DB123は、第1学習モデル121及び第2学習モデル122の学習に用いる訓練データを格納するデータベースである。
【0024】
プログラム1Pを含むコンピュータプログラム(コンピュータプログラム製品)は、当該コンピュータプログラムを読み取り可能に記録した非一時的な記録媒体1Aにより提供されてもよい。記憶部12は、不図示の読出装置によって記録媒体1Aから読み出されたコンピュータプログラムを記憶する。記録媒体1Aは、例えば磁気ディスク、光ディスク、半導体メモリ等である。また、通信ネットワークに接続されている外部サーバからコンピュータプログラムをダウンロードし、記憶部12に記憶させてもよい。プログラム1Pは、単一のコンピュータプログラムでも複数のコンピュータプログラムにより構成されるものでもよく、また、単一のコンピュータ上で実行されても通信ネットワークによって相互接続された複数のコンピュータ上で実行されてもよい。
【0025】
通信部13は、不図示のネットワークを介して外部装置と通信するための通信モジュールを備える。制御部11は、通信部13を介して外部装置との間でデータを送受信する。通信部13は省略してもよい。
【0026】
入力部14は、訓練データに用いる各種データ及び候補物質に対する要求物性等、学習モデルの生成及び物性予測の実施に必要な各種データの入力を受け付ける。入力部14は、受け付けた入力内容を制御部11へ送出する。入力部14は、例えばキーボード、マウス、ディスプレイ内蔵のタッチパネルデバイス、外部からデータを取り込むインタフェース等を備える。
【0027】
出力部15は、第1学習モデル121及び第2学習モデル122を用いて予測された物性、候補物質の選別結果等、物性予測の実施に伴う各種データを出力する。出力部15は、制御部11からの指示に従って各種の情報を出力する。出力部15は、例えばディスプレイ装置を備える。
【0028】
予測装置1は、外部に接続されたコンピュータを通じて操作を受付け、通知すべき情報を外部のコンピュータへ出力する構成であってもよい。この場合、予測装置1は、入力部14及び出力部15を備えていなくてもよい。
【0029】
本実施形態では、予測装置1が、第1学習モデル121を生成する第1学習モデル生成装置、第2学習モデル122を生成する第2学習モデル生成装置、及び物性予測を行う予測装置として機能するものとして説明するが、予測装置1の構成は限られない。第1学習モデル生成装置、第2学習モデル生成装置及び予測装置は共通する1台の装置であるものに限らず、別個の装置として設けられてもよい。
【0030】
図2は、訓練DB123に記憶される情報の内容例を示す図である。訓練DB123は、第1テーブル123a及び第2テーブル123bを含む。
【0031】
第1テーブル123aは、第1学習モデル121の学習に用いるデータを格納する。第1テーブル123aには、例えばデータIDをキーに、物質の構造式、物質の特徴量、及び物性等の情報を紐付けたレコードが格納されている。
【0032】
物質の特徴量とは、物質の構造を表す情報であり、例えば物質の化学的構造データ、物理的構造データ等を含む。図2に示す例では、物質の特徴量として、分子記述子が記憶される。分子記述子は、物質の持つ構造的特徴や物理化学的特性等を計算機で扱いやすくするために数値化したものである。分子記述子は、物質の構造式から計算可能であり、公知のソフトウェア、例えばRDKit、mordred、MOE、alvaDesc、PaDEL-Descriptor、Codessa等を用いて求めることができる。第1テーブル123aには、複数の記述子項目に係る分子記述子の値が含まれていてもよい。
【0033】
物質の特徴量は、分子記述子に限らず、例えば、化学構造式をグラフ情報に変換したもの、物理的状態(例えば固体状、液体状、気体状、膜状等)等を含んでもよい。
【0034】
物性列には、キャリア移動度の実験値又は模擬実験値が記憶される。実験値は、実際に実験を行うことにより得られた物性値である。模擬実験値は、実験値を模擬する物性値である。模擬実験値は、後述する第2学習モデル122を用いて生成される。各キャリア移動度には、当該キャリア移動度が実験値又は模擬実験値のいずれであるかを表すデータ種別が対応付けられている。
【0035】
第2テーブル123bは、第2学習モデル122の学習に用いるデータを格納する。第2テーブル123bには、例えばデータIDをキーに、物質の構造式、物性を表すシミュレーション値、物質の特徴量、及び物性の実験値等の情報を紐付けたレコードが格納されている。
【0036】
シミュレーション値は、所定のアルゴリズムにより求められた物質の物性値である。シミュレーション値は、例えば理論計算により得られる。理論計算としては、例えば、量子化学計算、分子動力学計算、第一原理計算等が挙げられる。このような理論計算は、実験値との誤差の小さい高精度な値が得られることが知られている。各計算手法によるシミュレーション値は、公知の理論計算ソフトウェアを用いて求めることができる。シミュレーション値列には、少なくとも実験値列に記憶される物性項目と同一の物性項目に係るシミュレーション値が格納される。図2に示す例にて、シミュレーション値列及び実験値列には、キャリア移動度が含まれる。
【0037】
シミュレーション値列には、実験値の物性項目を含む複数の物性項目に係るシミュレーション値が含まれてもよい。この場合、各シミュレーション値は、同じ又は異なるシミュレーション手法により算出されてよい。実験値の物性項目以外の物性としては、実験値の物性項目と相関する又は相関が比較的強いと考えられる物性項目(例えば再配向エネルギー、キャリア有効質量等)であることが好ましい。
【0038】
物質の特徴量は、第1テーブル123aと同様に、例えば物質の化学的構造データ、物理的構造データ等を含む。図2に示す例では、物質の特徴量として、分子記述子が記憶される。物性の実験値は、実験を行うことにより得られた実験値としてのキャリア移動度を含む。
【0039】
第1テーブル123a及び第2テーブル123bの記憶内容は図2に示す例に限定されない。
【0040】
図3は、第1学習モデル121の概要を示す説明図である。第1学習モデル121は、物質の特徴量を入力として、当該物質の物性を示す情報を出力する。図3に示す例にて、第1学習モデル121は、有機半導体材料の分子記述子を入力として有機半導体材料のキャリア移動度を予測する。
【0041】
第1学習モデル121は、例えばニューラルネットワークである。第1学習モデル121は、分子記述子が入力される入力層と、物性値を出力する出力層と、特徴量を抽出する中間層(隠れ層)とを備える。中間層は、畳み込み層、プーリング層及び全結合層等を含んでもよい。中間層は、入力データの特徴量を抽出する複数のノードを有し、各種パラメータを用いて抽出された特徴量を出力層に受け渡す。入力層に分子記述子が入力された場合、学習済みパラメータによって中間層で演算が行なわれ、出力層から、物性を示す出力情報が出力される。
【0042】
第1学習モデル121の説明変数となる分子記述子には、複数の記述子項目に係る分子記述子の値が含まれてもよい。説明変数に用いる分子記述子の数及び種類は、予測対象の物質や物性に応じて適宜設定されてよい。
【0043】
第1学習モデル121における説明変数にはさらに、物質のシミュレーション値、物質におけるプロセス情報、スペクトルデータ、画像データ及びカタログデータ等が含まれてもよい。物質の構造又は物性を表す情報に加えて物質に関する多様な情報を説明変数とすることで、精度向上効果が期待でき、好適である。
【0044】
第1学習モデル121の説明変数となるシミュレーション値の物性項目は、目的変数となる物性項目とは異なるものであってよい。すなわち、第1学習モデル121は、予測対象となる物性とは異なる物性のシミュレーション値を入力とするものであってよい。
項目とは異なる物性を表す情報であってよい。
【0045】
プロセス情報は、物質におけるプロセスに関する情報を含む。プロセス情報には、例えば、物質を合成する合成工程における合成条件、物質を作製(調製)する作製(調製)工程における作製条件等が含まれる。合成条件としては、例えば、原材料組成、重合度、原材料温度、反応温度、合成に用いる溶媒や媒質の物性等が挙げられる。作製条件としては、例えば作製工程におけるワークや製造装置の制御パラメータが挙げられる。具体的には、作製条件としては、スピンコート法による成膜時のスピンコーターの回転数、真空蒸着法による成膜時の蒸着速度、膜厚、成膜後のアニーリング温度、作製に用いる溶媒や媒質の物性等が挙げられる。
【0046】
スペクトルデータは、物質の発光スペクトルに関する情報である。スペクトルデータとしては、例えば、スペクトル幅、スペクトル強度、第1ピーク及び第2ピークの強度比、スペクトル形状の標準偏差、スペクトル画像等が挙げられる。スペクトル幅は、発光スペクトルの半値幅であってもよい。半値幅は、半値全幅(FWHM:Full Width at Half Maximum)でも半値半幅(HWHM:Half Width at Half Maximum)でもよい。
【0047】
画像データは、物質を表す画像データである。画像データとしては、例えば、走査電子顕微鏡(SEM:Scanning Electron Microscope)によって撮影されるSEM画像、透過型電子顕微鏡(TEM:Transmission Electron Microscope)によって撮影されるTEM画像等が挙げられる。
【0048】
カタログデータは、例えば物質、当該物質の原材料等が掲載されるカタログから抽出された情報を含む。カタログデータは、物質の物性を表す情報を含んでもよい。カタログデータは、例えば製品カタログのテキストマイニングを行い、所定の特徴語(例えば所定の物性)を抽出することにより得られる。
【0049】
説明変数は、画像データから導出されるパーシステントホモロジーデータを含んでもよい。パーシステントホモロジーは、ホモロジーと呼ばれる代数学の応用領域であり、図形の連結部分、「穴」、空洞の構造に着目した数学分野であり、位相的データ解析の一つの手法である。パーシステントホモロジーデータは、例えばパーシステント図、当該パーシステント図から得られる各種特徴量等を含んでよい。
【0050】
第1学習モデル121の出力層は1つのノードを有し、当該ノードからキャリア移動度を表す連続値を出力する。なお、予測すべきキャリア移動度に関する情報を得ることができれば、出力層の構成は特に限定されない。第1学習モデル121は、複数種類の物性を予測可能に構成されてもよい。第1学習モデル121は、例えば、キャリア移動度と、光吸収波長、発光波長、光吸収強度及び発光強度のうちの少なくとも1つとを予測する構成であってもよい。
【0051】
第1学習モデル121は、有機半導体材料の分子記述子に対し、既知のキャリア移動度を示すデータがラベリングされた訓練データを用意し、当該訓練データを用いて未学習のニューラルネットワークを機械学習させることにより生成することができる。
【0052】
推定精度の高いモデルを生成するためには、大量の訓練データが必要である一方で、実験を行って物性の実験値を得ることは、時間とコストを要する。本実施形態では、訓練データとして、キャリア移動度の実験値に加えて、キャリア移動度の模擬実験値を用いて第1学習モデル121を学習する。これにより、高精度な第1学習モデル121を効率よく生成する。模擬実験値は、第2学習モデル122を用いて生成される。
【0053】
図4は、第2学習モデル122の概要を示す説明図である。第2学習モデル122は、物質の所定物性を表すシミュレーション値と、物質の構造又は物性を表す情報とを入力として、当該物質の所定物性を表す模擬実験値を示す情報を出力する。図4に示す例にて、第2学習モデル122は、有機半導体材料のキャリア移動度の量子化学計算値及び分子記述子を入力として、当該有機半導体材料のキャリア移動度の模擬実験値を推定する。
【0054】
第2学習モデル122は、例えばニューラルネットワークである。第2学習モデル122の構成は、第1モデル121と同様であるため詳細な説明を省略する。
【0055】
第2学習モデル122の説明変数となるシミュレーション値の物性項目は、目的変数となる物性項目と同じである。すなわち、第2学習モデル122は、推定対象となる物性と同じ物性のシミュレーション値を入力とする。なお、第2学習モデル122の説明変数には、目的変数と同じ物性のシミュレーション値に加えて、目的変数と同じ物性以外の物性のシミュレーション値が含まれてもよい。
【0056】
第2学習モデル122の説明変数となる分子記述子には、複数の記述子項目に係る分子記述子の値が含まれてもよい。説明変数に用いる分子記述子の数及び種類は、推定対象となる模擬実験値の物性に応じて適宜設定されてよい。
【0057】
第2学習モデル122は、物質の構造を表す特徴量を説明変数とするものに限らず、物質の物性を表す情報を説明変数としてもよい。第2学習モデル122は、物質の構造を表す特徴量及び物質の物性を表す情報を説明変数としてもよい。物質の物性を表す情報は、推定対象となる模擬実験値の物性とは異なる物性を表す情報であってよい。
【0058】
第2学習モデル122における説明変数にはさらに、物質におけるプロセス情報、スペクトルデータ、画像データ及びカタログデータ等が含まれてもよい。
【0059】
第2学習モデル122は、シミュレーション値が表す物性の模擬実験値を出力する。第2学習モデル122は、複数種類の模擬実験値を推定可能に構成されてもよい。この場合、第2学習モデル122の説明変数には、少なくとも推定対象となる複数の模擬実験値それぞれに対応するシミュレーション値が含まれる。
【0060】
第2学習モデル122は、有機半導体材料のシミュレーション値及び分子記述子に対し、既知のキャリア移動度の実験値を示すデータがラベリングされた訓練データを用意し、当該訓練データを用いて未学習のニューラルネットワークを機械学習させることにより生成することができる。
【0061】
訓練データを格納する第2テーブル123bは、第2学習モデル122の生成に際し、予め記憶部12に記憶される。予測装置1は、例えばユーザからの入力を受け付ける、又は外部サーバにアクセスする等により、有機半導体材料の分子構造を表す構造式と、キャリア移動度の実験値とを対応付けて取得する。予測装置1は、例えば、公知の量子化学計算ソフトウェア(例えばGaussian16(Gaussian社製))を用いて、有機半導体材料の構造式から所定の物性項目に係る量子化学計算値を算出する。また予測装置1は、例えば、公知のソフトウェア(例えばmordred)を用いて、有機半導体材料の構造式から所定の記述子項目に係る分子記述子を算出する。予測装置1は、得られた構造式、量子化学計算値、分子記述子及びキャリア移動度の実験値を対応付けて第2テーブル123bに格納する。予測装置1は、大量の有機半導体材料に関する構造式及び実験値を収集し、収集した情報に基づく情報群を第2テーブル123bに蓄積する。
【0062】
第2学習モデル122は、物質の構造を表す特徴量及び当該物質の所定物性のシミュレーション値に応じた上記所定物性の模擬実験値を推定する。第2学習モデル122は、シミュレーション値を実験値に近づけるよう補正するモデルとしての機能を有する。
【0063】
シミュレーションは、高精度に物性を予測することができ、物性予測方法として有効であると考えられる。しかしながら、量子化学計算のようなシミュレーションにおいては、モデル化された系、すなわち物質が実際に使用される系(現実系)とは差異がある系を扱っている。従って、モデル化された系(例えば、2分子複合体)でのシミュレーション値と、現実系(例えば、固体状態)での実験値との間に誤差が生じる可能性がある。第2学習モデル122を用いることで、シミュレーション値を実験値に近づけることができる。
【0064】
第1学習モデル121の構成は限定されず、有機半導体材料の特徴量に対し物性を識別可能であればよい。同様に、第2学習モデル122の構成は限定されず、シミュレーション値と、物質の構造又は物性を表す情報とに対し物性を表す模擬実験値を識別可能であればよい。第1学習モデル121及び第2学習モデル122は、例えば、Transformer、CNN(Convolution Neural Network)、RNN(Recurrent Neural Network)、GNN(Graph Neural Network)、サポートベクタマシン、ロジスティクス回帰、決定木、XGBoost(eXtreme Gradient Boosting )等、その他の学習アルゴリズムに基づくモデルであってもよい。第2学習モデル122は、機械学習モデルに限られず、ルールベースの手法や特定の数式によって模擬実験値を導出するものであってもよい。第2学習モデル122は、シミュレーション値と、実験値との関係性に基づいて模擬実験値を生成するものであってもよい。
【0065】
図5は、第2学習モデル122の生成処理手順の一例を示すフローチャートである。以下の各フローチャートにおける処理は、予測装置1の記憶部12に記憶するプログラム1Pに従って制御部11によって実行される。
【0066】
予測装置1の制御部11は、第2テーブル123bに記憶された情報に基づき、訓練用の有機半導体材料のシミュレーション値及び分子記述子に対し、当該有機半導体材料のキャリア移動度の実験値が付与された訓練データを取得する(ステップS11)。
【0067】
制御部11は、取得した訓練データを用いて、有機半導体材料のシミュレーション値及び分子記述子を入力した場合に、当該有機半導体材料のキャリア移動度の模擬実験値を出力する第2学習モデル122を生成する(ステップS12)。
【0068】
具体的には、制御部11は、訓練データに含まれるシミュレーション値及び分子記述子を第2学習モデル122の入力層に入力し、中間層での演算処理を経て、出力層から出力されるキャリア移動度を取得する。制御部11は、出力層から出力されたキャリア移動度と、訓練データに含まれるキャリア移動度とを比較し、出力層から出力されるキャリア移動度が正解値に近づくように、ニューロン間の重み(結合係数)等のパラメータを最適化する。パラメータの最適化の方法は特に限定されないが、例えば予測装置1は誤差逆伝播法を用いて各種パラメータの最適化を行う。学習が開始される前の段階では、第2学習モデル122を記述する定義情報には、初期設定値が与えられているものとする。誤差、学習回数等が所定基準を満たすことによって学習が完了すると、最適化されたパラメータが得られる。
【0069】
学習が完了すると、制御部11は、学習済みの第2学習モデル122として、学習済みの第2学習モデル122に関する定義情報を記憶部12に記憶させ、一連の処理を終了する。上述の処理により、シミュレーション値及び分子記述子に対し、キャリア移動度の模擬実験値を適切に推定可能に学習された第2学習モデル122が構築(用意)される。
【0070】
図6は、第1学習モデル121の生成処理手順の一例を示すフローチャートである。
【0071】
予測装置1の制御部11は、複数の有機半導体材料(有機半導体分子)を生成する(ステップS21)。ステップS21において、有機半導体材料はコンピュータ上で生成される。
【0072】
制御部11は、生成した有機半導体材料それぞれについて、シミュレーション値及び分子記述子を導出する(ステップS22)。制御部11は、例えば、公知の量子化学計算ソフトウェアを用いて、生成した有機半導体材料の分子構造を表す構造式から所定の物性項目に係る量子化学計算値を算出する。制御部11は、公知のソフトウェアを用いて、有機半導体材料の構造式から所定の記述子項目に係る分子記述子を算出する。
【0073】
制御部11は、取得したシミュレーション値及び分子記述子を第2学習モデル122に入力する(ステップS23)。制御部11は、第2学習モデル122から出力されるキャリア移動度の模擬実験値を取得する(ステップS24)。制御部11は、生成した各有機半導体材料に対し上述の処理を実行して、模擬実験値をそれぞれ推定する。
【0074】
制御部11は、生成した有機半導体材料の構造式、分子記述子、及びキャリア移動度の模擬実験値を対応付けて訓練DB123の第1テーブル123aに記憶する(ステップS25)。上述の処理により、複数の情報群が第1テーブル123aに蓄積される。なお制御部11は、キャリア移動度の実験値が得られている有機半導体材料の情報を第1テーブル123aに追加してもよい。制御部11は、例えば、第2テーブル123bに記憶された情報に基づいて、有機半導体材料の分子記述子と、既知のキャリア移動度の実験値とを抽出し、抽出した分子記述子及びキャリア移動度の実験値を、第1テーブル123aに追加する。
【0075】
制御部11は、第1テーブル123aに記憶された情報に基づき、訓練用の有機半導体材料の分子記述子に対し、当該有機半導体材料のキャリア移動度の模擬実験値又は実験値が付与された訓練データを取得する(ステップS26)。
【0076】
制御部11は、取得した訓練データを用いて、有機半導体材料の分子記述子を入力した場合に、当該有機半導体材料のキャリア移動度を出力する第1学習モデル121を生成する(ステップS27)。
【0077】
具体的には、制御部11は、訓練データに含まれる分子記述子を第2テーブル123bの入力層に入力し、中間層での演算処理を経て、出力層から出力されるキャリア移動度を取得する。制御部11は、出力層から出力されたキャリア移動度と、訓練データに含まれるキャリア移動度とを比較し、出力層から出力されるキャリア移動度が正解値に近づくように、例えば誤差逆伝播法を用いて各種パラメータを最適化する。例えば誤差、学習回数等が所定基準を満たすことによって学習が完了すると、最適化されたパラメータが得られる。
【0078】
学習が完了すると、制御部11は、学習済みの第1学習モデル121として、学習済みの第1学習モデル121に関する定義情報を記憶部12に記憶させ、一連の処理を終了する。上述の処理により、分子記述子に対し、キャリア移動度を適切に予測可能に学習された第2学習モデル122が構築される。
【0079】
第1学習モデル121及び/又は第2学習モデル122は、予測装置1が生成するものに限定されない。予測装置1は、外部サーバにおいて生成された学習済みの第1学習モデル121及び/又は第2学習モデル122を取得し、記憶部12に記憶してもよい。第1学習モデル121及び/又は第2学習モデル122は、外部サーバにおいて生成され、予測装置1において学習されてもよい。第1学習モデル121及び/又は第2学習モデル122の学習に用いる訓練データは、予測装置1により生成及び記憶されるものに限らず、外部サーバから取得してもよい。
【0080】
予測装置1は、物性の予測を行う運用フェーズの前段階である学習フェーズにおいて、第1学習モデル121及び第2学習モデル122を生成する。そして、運用フェーズにおいて、第1学習モデル121及び第2学習モデル122を用いて物性を予測する。
【0081】
図7は、物性の予測及び1次選別に関する処理手順の一例を示すフローチャートである。
【0082】
予測装置1の制御部11は、製造対象となる有機半導体材料(有機半導体分子)に要求されるキャリア移動度、すなわち要求物性を取得する(ステップS31)。要求物性は、例えばキャリア移動度の下限値である。制御部11は、例えば、入力部14を介して、ユーザからの入力を受け付けることで要求物性を取得してもよく、通信接続された外部装置から送信される情報を受信することにより要求物性を取得してもよい。
【0083】
制御部11は、複数の候補有機半導体材料を生成する(ステップS32)。ステップS32において、候補有機半導体材料はコンピュータ上で生成される。
【0084】
制御部11は、生成した候補有機半導体材料それぞれについて、分子記述子を導出する(ステップS33)。制御部11は、例えば、公知のソフトウェアを用いて、生成した候補有機半導体材料の分子構造を表す構造式から所定の記述子項目に係る分子記述子を算出する。
【0085】
制御部11は、導出した分子記述子を第1学習モデル121に入力する(ステップS34)。制御部11は、第1学習モデル121から出力されるキャリア移動度を取得する(ステップS35)。制御部11は、生成した各候補有機半導体材料に対し上述の処理を実行して、キャリア移動度をそれぞれ予測する。
【0086】
制御部11は、予測結果に基づいて、生成した候補有機半導体材料の中から要求物性を満たす有機半導体材料を選別し(ステップS36)、要求物性を満たす有機半導体材料を抽出する。ステップS36の選別は1次選別に対応する。ステップS36において、制御部11は、物性の予測誤差を考慮し、要求物性に対し所定のマージンを加味した物性値を、1次選別処理における閾値としてもよい。
【0087】
上述の処理において、予測装置1は、1次選別結果を出力してもよい。なお予測装置1は、例えば1次選別結果に対するユーザ操作を受け付けることにより、1次選別された有機半導体材料の中からさらに、所望の有機半導体材料のみを抽出してもよい。
【0088】
図8は、物性の予測及び2次選別に関する処理手順の一例を示すフローチャートである。予測装置1は、図7のフローチャートの処理の終了後に、図8の処理を開始してよい。
【0089】
予測装置1の制御部11は、図7のステップS36にて抽出した複数の候補有機半導体材料について、キャリア移動度のシミュレーション値を算出する(ステップS41)。制御部11は、例えば、公知の量子化学計算ソフトウェアを用いて、生成した有機半導体材料の分子構造を表す構造式からキャリア移動度の量子化学計算値を算出する。
【0090】
制御部11は、導出したシミュレーション値、及びステップS33で導出した分子記述子を第2学習モデル122に入力する(ステップS42)。制御部11は、第2学習モデル122から出力されるキャリア移動度の模擬実験値を取得する(ステップS43)。制御部11は、1次選別された各候補有機半導体材料に対し上述の処理を実行して、キャリア移動度の模擬実験値をそれぞれ推定する。
【0091】
制御部11は、模擬実験値の推定結果に基づいて、1次選別された候補有機半導体材料の中から要求物性を満たす有機半導体材料を選別し(ステップS44)、要求物性を満たす有機半導体材料を抽出する。ステップS44の選別は2次選別に対応する。ステップS44において、制御部11は、物性の推定誤差を考慮し、要求物性に対し所定のマージンを加味した物性値を、2次選別処理における閾値としてもよい。なお、1次選別及び2次選別に対し、異なる要求物性が設定されてもよい。
【0092】
制御部11は、出力部15を通じて選別結果を出力する(ステップS45)。制御部11は、例えば要求物性を満たす有機半導体材料と、キャリア移動度の予測値とを対応付けて出力する。制御部11は、各候補有機半導体材料に係る物性の予測結果を出力してもよい。制御部11は、例えば製造装置2、外部サーバ等、出力部15以外へ選別結果を出力してもよい。
【0093】
製造装置2では、予測装置1で選別された有機半導体材料の組成に対応する原材料を用意し、用意した原材料を混合して、有機半導体材料を製造する。製造装置2は、公知の合成手法に従い原材料を合成することにより、有機半導体材料を得ることができる。有機半導体材料は、例えば、カップリング反応、アミノ化反応、縮合反応等の反応やハロゲン化反応等の官能基変換反応等を組み合わせることにより得られる。製造装置2はさらに、例えばスピンコート法、真空蒸着法、インクジェット法等により有機半導体材料を成膜し、有機半導体膜を製造してもよい。
【0094】
なお、有機半導体材料は、第1学習モデル121を用いた1次選別処理と、第2学習モデル122を用いた2次選別処理との2段階で抽出されるものに限らず、1次選別処理又は2次選別処理のいずれか一方のみを経て抽出されてもよい。
【0095】
上述の第1学習モデル121及び第2学習モデル122により予測する物性項目は単なる例示であり、予測すべき物質に応じた各種物性を予測するものであってよい。同様に、第1学習モデル121及び第2学習モデル122に入力する特徴量、シミュレーション値等はいずれも単なる例示であり、予測すべき物性に応じて適宜選択されてよい。物性予測の対象となる物質は、例えば有機化合物、無機化合物、又はそれらの混合物であってもよい。物性予測の対象となる物質は、材料物質に限定されず、例えば医薬品、生体物質、食品等であってもよい。
【0096】
第1学習モデル121及び第2学習モデル122は、候補物質の選別に用いるものに限らず、各種の物性予測に適用することができる。例えば、実際に得られた物質について、実験による物性値の測定に代えて第1学習モデル121及び第2学習モデル122を用いて物性を予測してもよい。
【0097】
本実施形態によれば、第1学習モデル121の生成に用いる訓練データに模擬実験値を使用することで、物質の物性を高精度に予測する第1学習モデル121を効率よく生成することができる。模擬実験値を使用することで、実験の手間を大幅に低減することができ、時間とコストの削減につながる。第1学習モデル121を用いることで、分子記述子のように比較的容易に求められるデータに基づいて、物性を効率的且つ精度よく予測することができる。分子記述子に加えて、例えば物質のシミュレーション値、プロセス情報等を第1学習モデル121への入力要素とすることで、第1学習モデル121の精度向上効果が期待できる。例えば、異なる実験系で実験値を取得した場合には、当該実験系に関する情報を入力に加えることで、より適正な物性を予測し得る。
【0098】
模擬実験値は、第2学習モデル122を用いて効率的且つ精度よく生成される。模擬実験値の生成により、第1学習モデル121の生成に用いる訓練データのデータ量を効率的に増大するとともに、訓練データに用いるデータの品質低下を低減することができる。
【0099】
第2学習モデル122を用いることで、シミュレーション値を実験値に近づけることができる。第2学習モデル122を用いることで、例えば、分子記述子により現実系で起こる材料と周囲の環境との相互作用を加味することができる。分子記述子に加えて、例えばプロセス情報を第2学習モデル122への入力要素とすることで、材料を現実系に適用する際のプロセス変数を加味することができる。シミュレーション値以外の情報を用いてシミュレーション値を補正することで、シミュレーション値を実験値に近づけることができる。
【0100】
本実施形態によれば、第1学習モデル121及び第2学習モデル122を用いて、所望の特性を満たし得る物質を効率的に抽出し、製造することができる。第2学習モデル122を用いて求められた物性値は、第1学習モデル121を用いて求められた物性値よりも高い予測精度であることが期待される。比較的容易に求められるデータを説明変数とする第1学習モデル121を用いて1次選別を行い、1次選別された物質に対してのみ量子化学計算等のシミュレーションを行うことで、予測装置1の演算負荷を低減することができる。1次選別された物質については、第2学習モデル122を用いてシミュレーション値から模擬実験値を推定することで、所望の特性を満たし得る物質を精度よく選別することができる。
【0101】
(第2実施形態)
第2実施形態では、予測装置1は、第1学習モデル121及び第2学習モデル122の再学習を行う。図9は、再学習に関する処理手順の一例を示すフローチャートである。予測装置1は、例えば製造装置2による有機半導体材料の製造後に、図9の処理を開始する。
【0102】
予測装置1の制御部11は、製造された新たな有機半導体材料の実験値を取得したか否かを判定する(ステップS51)。例えば、新たな有機半導体材料に対する実験が行われておらず、実験結果を受け付けていないことにより、実験値を取得していないと判定した場合(ステップS51:NO)、制御部11は、第1学習モデル121の再学習を行う(ステップS52)。制御部11は、新たな有機半導体材料の分子記述子に対し、図8のステップS43で取得したキャリア移動度の模擬実験値をラベリングした情報を訓練データとして第1学習モデル121の再学習を行い、第1学習モデル121を更新する。
【0103】
一方、例えば、新たな有機半導体材料に対する実験が行われ、実験結果を受け付けたことにより、実験値を取得したと判定した場合(ステップS51:YES)、制御部11は、第2学習モデル122の再学習を行う(ステップS53)。制御部11は、新たな有機半導体材料のシミュレーション値及び分子記述子に対し、取得したキャリア移動度の実験値をラベリングした情報を訓練データとして第2学習モデル122の再学習を行い、第2学習モデル122を更新する。
【0104】
上述の処理において、制御部11は、新たな有機半導体材料に対する実験値を取得したと判定した場合、第2学習モデル122に加えて第1学習モデル121の再学習を行ってもよい。この場合、制御部11は、新たな有機半導体材料の分子記述子に対し、取得したキャリア移動度の実験値をラベリングした情報を訓練データとして第1学習モデル121の再学習を行い、第1学習モデル121を更新することができる。
【0105】
制御部11は、更新後の第1学習モデル121及び第2学習モデル122を用いて、再度図7及び図8で示した選別処理を実行してもよい。
【0106】
制御部11はまた、更新後の第2学習モデル122を用いて、再度図6から図8で示した処理を実行してもよい。すなわち図9の処理の終了後、処理を図6に戻すループ処理を実行してもよい。制御部11は、図9の処理により第2学習モデル122を更新した後、再度図6の処理を実行することにより、更新後の第2学習モデル122を用いて訓練データを生成し、さらに新たに第1学習モデル121を生成する。制御部11は、得られた第1学習モデル121及び第2学習モデル122を用いて、図7及び図8で示した選別処理を実行する。制御部11は、上述のループ処理を予め設定される所定回数繰り返してもよい。上記構成によれば、要求物性を満たすと判定された有機半導体材料に絞られたシミュレーション値や模擬実験値が訓練データに追加されるため、第1学習モデル121の推定精度を一層向上し得る。また、精度が向上された第1学習モデル121を使用して選別処理を行うことで、選別精度が向上される。
【0107】
本実施形態によれば、本システムの運用を通じて第1学習モデル121及び第2学習モデル122の精度を向上させることができる。
【0108】
今回開示した実施の形態は、全ての点で例示であって、制限的なものではないと考えられるべきである。各実施例にて記載されている技術的特徴は互いに組み合わせることができ、本発明の範囲は、特許請求の範囲内での全ての変更及び特許請求の範囲と均等の範囲が含まれることが意図される。
各実施形態に示すシーケンスは限定されるものではなく、矛盾の無い範囲で、各処理手順はその順序を変更して実行されてもよく、また並行して複数の処理が実行されてもよい。各処理の処理主体は限定されるものではなく、矛盾の無い範囲で、各装置の処理を他の装置が実行してもよい。
【0109】
各実施形態に記載した事項は相互に組み合わせることが可能である。また、特許請求の範囲に記載した独立請求項及び従属請求項は、引用形式に関わらず全てのあらゆる組み合わせにおいて、相互に組み合わせることが可能である。さらに、特許請求の範囲には他の2以上のクレームを引用するクレームを記載する形式(マルチクレーム形式)を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム(マルチマルチクレーム)を記載する形式を用いて記載してもよい。
【0110】
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて第1学習モデルを生成する
学習モデルの生成方法。
(付記2)
前記訓練データは物質の特徴量を説明変数として含む
付記1に記載の学習モデルの生成方法。
(付記3)
物質の特徴量を入力した場合に物質の物性を予測する前記第1学習モデルを生成する
付記1又は付記2に記載の学習モデルの生成方法。
(付記4)
前記シミュレーション値と前記実験値との関係性に基づいて前記模擬実験値を生成する
付記1から付記3のいずれか1つに記載の学習モデルの生成方法。
(付記5)
シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第2学習モデルを用いて、前記模擬実験値を生成する
付記1から付記4のいずれか1つに記載の学習モデルの生成方法。
(付記6)
物質の特徴量に基づく理論計算により前記シミュレーション値を導出する
付記1から付記5のいずれか1つに記載の学習モデルの生成方法。
(付記7)
第1の前記第1学習モデルを用いて予測した物性が所定の要求物性を満たす物質の前記シミュレーション値に基づく前記模擬実験値を含む前記訓練データを取得し、
取得した前記訓練データに基づいて、第2の前記第1学習モデルを生成する
付記1から付記6のいずれか1つに記載の学習モデルの生成方法。
(付記8)
物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて第1学習モデルを生成する
処理を実行する制御部を備える
情報処理装置。
(付記9)
物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、
取得した前記訓練データに基づいて第1学習モデルを生成する
処理をコンピュータに実行させるためのコンピュータプログラム。
(付記10)
複数の物質に係る特徴量を取得し、
付記1に記載の学習モデルの生成方法により生成された第1学習モデルを用いて、取得した各物質の特徴量に応じた物質の物性を取得し、
取得した物性が所定の要求物性を満たす物質を選別する
物質の選別方法。
(付記11)
選別した前記物質の物性を表すシミュレーション値と、前記物質の構造又は物性を表す情報とを取得し、
シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を推定する第2学習モデルに、取得した前記物質のシミュレーション値と、前記物質の構造又は物性を表す情報とを入力して前記物質の模擬実験値を取得し、
取得した前記模擬実験値が所定の要求物性を満たす物質を選別する
付記10に記載の物質の選別方法。
(付記12)
物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報と、前記シミュレーション値が表す物性の実験値とを含む訓練データに基づいて、シミュレーション値と、物質の構造又は物性を表す情報とを入力した場合に模擬実験値を出力するよう学習された学習モデルを用意し、
物質の物性を表すシミュレーション値と、物質の構造又は物性を表す情報とを取得し、
取得した前記シミュレーション値と、物質の構造又は物性を表す情報とを前記学習モデルに入力することにより、模擬実験値を生成する
模擬実験値の生成方法。
【符号の説明】
【0111】
1 予測装置
11 制御部
12 記憶部
13 通信部
14 入力部
15 出力部
1A 記録媒体
1P プログラム
121 第1学習モデル
122 第2学習モデル
123 訓練DB
2 製造装置
【要約】
【課題】物質の物性を予測する学習モデルを効率よく生成することができる学習モデルの生成方法等を提供する。
【解決手段】学習モデルの生成方法は、物質の物性を表すシミュレーション値に基づき生成された、物質の物性を表す実験値を模擬する模擬実験値を目的変数として含む訓練データを取得し、取得した前記訓練データに基づいて第1学習モデルを生成する。
【選択図】図1
図1
図2
図3
図4
図5
図6
図7
図8
図9