(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024010914
(43)【公開日】2024-01-25
(54)【発明の名称】学習装置、学習方法、学習済みモデル及び予測装置
(51)【国際特許分類】
G16C 20/70 20190101AFI20240118BHJP
G06N 20/00 20190101ALI20240118BHJP
【FI】
G16C20/70
G06N20/00
【審査請求】未請求
【請求項の数】6
【出願形態】OL
(21)【出願番号】P 2022112504
(22)【出願日】2022-07-13
(71)【出願人】
【識別番号】000002130
【氏名又は名称】住友電気工業株式会社
(74)【代理人】
【識別番号】100088155
【弁理士】
【氏名又は名称】長谷川 芳樹
(74)【代理人】
【識別番号】100113435
【弁理士】
【氏名又は名称】黒木 義樹
(74)【代理人】
【識別番号】100136722
【弁理士】
【氏名又は名称】▲高▼木 邦夫
(74)【代理人】
【識別番号】100176658
【弁理士】
【氏名又は名称】和田 謙一郎
(72)【発明者】
【氏名】増田 周弥
(72)【発明者】
【氏名】高桑 達哉
(72)【発明者】
【氏名】大川 建二郎
(72)【発明者】
【氏名】花房 慶
(72)【発明者】
【氏名】前田 修平
(57)【要約】
【課題】錯体物性の予測精度の向上が図れる学習装置、学習方法、学習済みモデル及び予測装置を提供する。
【解決手段】機械学習システム1は、錯体の分子構造記述子、錯体の物性記述子、及び、錯体の物性を示す錯体物性を取得する取得部10と、分子構造記述子、物性記述子及び錯体物性に基づいて、分子構造記述子及び物性記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する第一学習モデルを生成する学習部11と、を備える。
【選択図】
図2
【特許請求の範囲】
【請求項1】
少なくとも一つのプロセッサを備え、学習モデルの機械学習を行う学習装置であって、
錯体の分子構造記述子、前記錯体の物性記述子、及び、前記錯体の物性を示す錯体物性を取得する取得部と、
前記分子構造記述子、前記物性記述子及び前記錯体物性に基づいて、前記分子構造記述子及び前記物性記述子と前記錯体物性との関係を学習し、前記分子構造記述子及び前記物性記述子の入力に応じて前記錯体物性を推定する第一学習モデルを生成する学習部と、を備える、学習装置。
【請求項2】
前記学習部は、前記物性記述子として、前記分子構造記述子に基づいて前記物性記述子を推定する第二学習モデルが推定した前記物性記述子を用いる、請求項1に記載の学習装置。
【請求項3】
前記取得部は、前記錯体の座標データ及び前記物性記述子を含む錯体データを取得し、
前記学習部は、前記錯体データに含まれる前記座標データを前記分子構造記述子に変換すると共に、前記錯体データに含まれる前記物性記述子を取得し、変換した前記分子構造記述子と前記物性記述子とに基づいて、前記分子構造記述子と前記物性記述子との関係を学習し、前記分子構造記述子の入力に応じて前記物性記述子を推定する前記第二学習モデルを生成する、請求項2に記載の学習装置。
【請求項4】
少なくとも一つのプロセッサにおいて実行され、学習モデルの機械学習を行う学習方法であって、
錯体の分子構造記述子、前記錯体の物性記述子、及び、前記錯体の物性を示す錯体物性を取得する取得ステップと、
前記分子構造記述子、前記物性記述子及び前記錯体物性に基づいて、前記分子構造記述子及び前記物性記述子と前記錯体物性との関係を学習し、前記分子構造記述子及び前記物性記述子の入力に応じて前記錯体物性を推定する第一学習モデルを生成する学習ステップと、を含む、学習方法。
【請求項5】
錯体の物性を示す錯体物性を推定する学習済みモデルであって、
前記錯体の分子構造記述子及び前記錯体の物性記述子と前記錯体物性との関係を学習して構築されており、前記分子構造記述子及び前記物性記述子の入力に応じて前記錯体物性を推定する、学習済みモデル。
【請求項6】
少なくとも一つのプロセッサを備え、請求項5に記載の学習済みモデルを用いて錯体の物性を示す錯体物性を予測する予測装置であって、
前記予測装置の前記プロセッサが、
入力データを取得し、
前記入力データを前記学習済みモデルに入力することで、前記錯体物性に係る予測結果を出力する、予測装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、学習装置、学習方法、学習済みモデル及び予測装置に関する。
【背景技術】
【0002】
非特許文献1には、金属錯体の分子構造記述子を用いた機械学習により生成した学習済みモデルによって、金属錯体の酸化還元電位を予測する方法が開示されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Jon Paul Janet and Heather J.Kulik,“Resolving Transition Metal Chemical Space:Feature Selection for Machine Learning and Structure-Property Relationships”,J. Phys. Chem. A,2017,121,46,p.8939-8954
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1に記載の予測方法では、金属錯体の構造及び分子量に依存する分子構造記述子を用いた機械学習により生成された学習済みモデルによって、酸化還元電位(金属錯体の物性を示す錯体物性)を予測している。この方法では、学習モデルの機械学習に用いた学習データ(教師データ)における金属錯体の構造及び分子量に係る分布に似た入力データに対しては、錯体物性を精度良く予測(推定)し得る。しかしながら、従来の予測方法では、学習データの上記分布とは異なる分布の入力データに対しては、錯体物性の予測精度が低下し得る。
【0005】
本開示は、錯体物性の予測精度の向上が図れる学習装置、学習方法、学習済みモデル及び予測装置を提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示の一実施形態に係る学習装置は、少なくとも一つのプロセッサを備え、学習モデルの機械学習を行う学習装置であって、錯体の分子構造記述子、錯体の物性記述子、及び、錯体の物性を示す錯体物性を取得する取得部と、分子構造記述子、物性記述子及び錯体物性に基づいて、分子構造記述子及び物性記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する第一学習モデルを生成する学習部と、を備える。
【発明の効果】
【0007】
本開示によれば、錯体物性の予測精度の向上が図れる。
【図面の簡単な説明】
【0008】
【
図1】
図1は、一実施形態に係る予測システムで用いられるコンピュータのハードウェア構成の一例を示す図である。
【
図2】
図2は、実施形態に係る予測システムの機能構成の一例を示す図である。
【
図3】
図3は、学習方法の一例を処理フローとして示すフローチャートである。
【
図4】
図4は、学習方法の一例を処理フローとして示すフローチャートである。
【
図5】
図5は、予測方法の一例を処理フローとして示すフローチャートである。
【発明を実施するための形態】
【0009】
[本開示の実施形態の説明]
最初に、本開示の実施形態の内容を列記して説明する。以下に記載する実施形態の少なくとも一部を任意に組み合わせてもよい。
【0010】
本開示の一側面に係る学習装置は、少なくとも一つのプロセッサを備え、学習モデルの機械学習を行う学習装置であって、錯体の分子構造記述子、錯体の物性記述子、及び、錯体の物性を示す錯体物性を取得する取得部と、分子構造記述子、物性記述子及び錯体物性に基づいて、分子構造記述子及び物性記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する第一学習モデルを生成する学習部と、を備える。
【0011】
本開示の一側面に係る学習装置では、分子構造記述子及び物性記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する第一学習モデルを生成する。このように、学習装置では、分子構造記述子に加えて、錯体金属の構造に依存し難い物性記述子を用いて第一学習モデルを生成する。これにより、第一学習モデルは、錯体金属の構造に依存することなく、分子構造記述子及び物性記述子の入力に応じて、錯体物性を精度良く推定することができる。したがって、学習装置では、錯体物性の予測精度の向上が図れる。
【0012】
一実施形態においては、学習部は、物性記述子として、分子構造記述子に基づいて物性記述子を推定する第二学習モデルが推定した物性記述子を用いてもよい。この構成では、第二学習モデルが推定した物性記述子を学習に用いることにより、錯体物性を精度良く推定できる第一学習モデルを生成することができる。
【0013】
一実施形態においては、取得部は、錯体の座標データ及び物性記述子を含む錯体データを取得し、学習部は、錯体データに含まれる座標データを分子構造記述子に変換すると共に、錯体データに含まれる物性記述子を取得し、変換した分子構造記述子と物性記述子とに基づいて、分子構造記述子と物性記述子との関係を学習し、分子構造記述子の入力に応じて物性記述子を推定する第二学習モデルを生成してもよい。この構成では、分子構造記述子の入力に応じて物性記述子を推定する第二学習モデルを適切に生成することができる。また、上記のように生成された第二学習モデルは、物性記述子を精度良く推定することができる。
【0014】
本開示の一側面に係る学習方法は、少なくとも一つのプロセッサにおいて実行され、学習モデルの機械学習を行う学習方法であって、錯体の分子構造記述子、錯体の物性記述子、及び、錯体の物性を示す錯体物性を取得する取得ステップと、分子構造記述子、物性記述子及び錯体物性に基づいて、分子構造記述子及び物性記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する第一学習モデルを生成する学習ステップと、を含む。
【0015】
本開示の一側面に係る学習方法では、分子構造記述子及び物性記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する第一学習モデルを生成する。このように、学習方法では、分子構造記述子に加えて、錯体金属の構造に依存し難い物性記述子を用いて第一学習モデルを生成する。これにより、第一学習モデルは、錯体金属の構造に依存することなく、分子構造記述子及び物性記述子の入力に応じて、錯体物性を精度良く推定することができる。したがって、学習方法では、錯体物性の予測精度の向上が図れる。
【0016】
本開示の一側面に係る学習済みモデルは、錯体の物性を示す錯体物性を推定する学習済みモデルであって、錯体の分子構造記述子及び錯体の物性記述子と錯体物性との関係を学習して構築されており、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する。
【0017】
本開示の一側面に係る学習済みモデルでは、錯体の分子構造記述子及び錯体の記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する。このように、学習済みモデルでは、分子構造記述子に加えて、錯体金属の構造に依存し難い物性記述子を用いて学習している。これにより、学習済みモデルは、錯体金属の構造に依存することなく、分子構造記述子及び物性記述子の入力に応じて、錯体物性を精度良く推定することができる。したがって、学習済みモデルでは、錯体物性の予測精度の向上が図れる。
【0018】
本開示の一側面に係る予測装置は、少なくとも一つのプロセッサを備え、上記学習済みモデルを用いて錯体の物性を示す錯体物性を予測する予測装置であって、予測装置のプロセッサが、入力データを取得し、入力データを学習済みモデルに入力することで、錯体物性に係る予測結果を出力する。
【0019】
本開示の一側面に係る予測装置では、上記学習済みモデルを用いて錯体物性を予測する。したがって、予測装置では、錯体物性の予測精度の向上が図れる。
【0020】
[本開示の実施形態の詳細]
本開示の実施形態の具体例を、以下に図面を参照しつつ説明する。本開示はこれらの例示に限定されるものではなく、特許請求の範囲によって示され、特許請求の範囲と均等の意味及び範囲内でのすべての変更が含まれることが意図される。図面の説明においては同一要素には同一符号を付し、重複する説明を省略する。
【0021】
[システムの概要]
本実施形態に係る機械学習システム1は、金属錯体(錯体化合物)の物性(以下、「錯体物性」と称する。)を予測するコンピュータシステムである。金属錯体は、金属イオンに配位子(分子、イオン)が結合したものである。金属錯体は、有機金属錯体及び無機金属錯体を含み得る。錯体物性としては、磁気特性(透磁率、磁束密度等)、熱力学特性(酸化還元電位、溶解度等)、光特性(赤外、紫外、可視光スペクトル等)、導電性(イオン、電気導電率等)等が挙げられる。本実施形態では、機械学習システム1によって予測される結果を「予測結果」という。
【0022】
機械学習システム1は、錯体物性を予測するために機械学習を利用する。機械学習とは、与えられた情報に基づいて反復的に(繰り返し)学習することで法則又はルールを自律的に見つけ出す手法である。機械学習システム1は、機械学習モデルを用いた機械学習を実行する。機械学習システム1は、例えば、勾配ブースティング木(GBDT:Gradient Boosting Decision Tree)を用いた機械学習、重回帰分析を用いた機械学習、畳み込み層及びプーリング層を含んで構成される畳み込みニューラルネットワーク(CNN:Convolutional Neural Network)を用いた機械学習を実行してもよい。畳み込みニューラルネットワークは、多層構造のニューラルネットワークを用いる深層学習の一種である。
【0023】
機械学習システム1は、学習を繰り返すことで機械学習モデルを訓練させ、この機械学習モデルを学習済みモデルとして取得する。これは学習フェーズに相当する。学習フェーズにおいては、機械学習システム1は、学習装置として機能する。学習済みモデルは、錯体物性を予測するために最適であると予測される機械学習モデルである。機械学習システム1は、学習済みモデルを用いて入力データを処理することで、錯体物性の予測結果を出力する、これは運用フェーズ(予測フェーズ)に相当する。運用フェーズにおいては、機械学習システム1は、予測装置として機能する。
【0024】
学習済みモデルは、コンピュータシステム間で移植可能である。したがって、一のコンピュータシステムで生成された学習済みモデルを、他のコンピュータシステムで用いることができる。もちろん、一つのコンピュータシステムが学習済みモデルの生成及び利用の双方を実行してもよい。すなわち、機械学習システム1は、学習フェーズ及び運用フェーズの双方を実行してもよいし、学習フェーズ及び運用フェーズのいずれか一方を実行しなくてもよい。本実施形態では、機械学習システム1は、学習フェーズ及び運用フェーズの双方を実行する。
【0025】
学習フェーズでは、機械学習システム1は、教師データを利用する。教師データは、錯体データである。機械学習システム1は、教師データを用いた機械学習を実行することで学習済みモデルを生成する。運用フェーズでは、機械学習システム1はその学習済みモデルに、入力データを与えることで、予測結果を得る。入力データは、金属錯体の分子構造記述子及び物性記述子に係るデータである。
【0026】
[システム構成]
図1は、機械学習システム1を構成するコンピュータ100の一般的なハードウェア構成の一例を示す図である。例えば、コンピュータ100は、プロセッサ101と、主記憶部102と、補助記憶部103と、通信制御部104と、入力装置105と、出力装置106と、を備える。プロセッサ101は、オペレーティングシステム及びアプリケーション・プログラムを実行する。主記憶部102は、例えば、ROM及びRAMで構成される。補助記憶部103は、例えば、ハードディスク又はフラッシュメモリで構成され、一般に主記憶部102よりも大量のデータを記憶する。通信制御部104は、例えば、ネットワークカード又は無線通信モジュールで構成される。入力装置105は、例えば、キーボード、マウス、タッチパネル等で構成される。出力装置106は、例えば、モニタ及びスピーカで構成される。
【0027】
機械学習システム1の各機能要素は、補助記憶部103に予め記憶される学習プログラム110及び予測プログラム120により実現される。具体的には、各機能要素は、プロセッサ101又は主記憶部102の上に学習プログラム110又は予測プログラム120を読み込ませてその学習プログラム110又は予測プログラム120を実行させることで実現される。プロセッサ101は、その学習プログラム110又は予測プログラム120に従って、通信制御部104、入力装置105、又は出力装置106を動作させ、主記憶部102又は補助記憶部103におけるデータの読み出し及び書き込みを行う。処理に必要なデータ又はデータベースは、主記憶部102又は補助記憶部103内に格納される。
【0028】
学習プログラム110及び予測プログラム120は、例えば、CD-ROM、DVD-ROM、半導体メモリ等の有形の記録媒体に固定的に記録された上で提供されてもよい。あるいは、学習プログラム110及び予測プログラム120は、搬送波に重畳されたデータ信号として通信ネットワークを介して提供されてもよい。
【0029】
機械学習システム1は1台のコンピュータ100で構成されてもよいし、複数台のコンピュータ100で構成されてもよい。複数台のコンピュータ100を用いる場合には、これらのコンピュータ100がインターネットやイントラネット等の通信ネットワークを介して接続されることで、論理的に一つの機械学習システム1が構築される。
【0030】
図2は、機械学習システム1の機能構成の一例を示す図である。
図2に示されるように、機械学習システム1は、取得部10と、学習部11と、記憶部12と、予測部13と、データベース20と、を備えている。
【0031】
取得部10は、データを取得する機能要素である。取得部10は、学習フェーズにおいては、データベース20から、教師データ(学習データ)としての錯体データを取得する。取得部10は、所定のタイミングで一又は複数の錯体データを取得する。取得部10は、運用フェーズにおいては、入力データを取得する。
【0032】
取得部10は、錯体データを記憶するデータベース20にアクセスすることができる。データベース20は、学習モデルを学習させるために用いられ得る。データベース20は、例えば、機械学習システム1の一構成要素であってもよいし、機械学習システム1とは別のコンピュータシステム内に構築されてもよい。機械学習システム1とデータベース20とは通信ネットワークを介して接続されてもよいし、一つのコンピュータ内に機械学習システム1及びデータベース20の双方が構築されてもよい。
【0033】
データベース20に記憶される錯体データの準備方法は限定されない。例えば、錯体データは、作業者による入力作業によってデータベース20に蓄積されてもよし、機械学習システム1又は他のコンピュータシステムによって自動的に収集されてデータベース20に蓄積されてもよい。
【0034】
データベース20に記憶される錯体データは、複数の金属錯体のデータを含む。錯体データでは、各金属錯体に対して、構造最適化された座標データと、複数の物性記述子と、が対応付けられている。物性記述子としては、エネルギー(電子エネルギー、分散エネルギー等)、双極子モーメント・分極率、分子振動、電荷情報、イオン化エネルギー(電子親和力)、HOMO(Highest Occupied Molecular Orbital)/LUMO(Lowest Unoccupied Molecular Orbital)、誘電率等が挙げられる。
【0035】
学習部11は、機械学習を行う機能要素である。学習部11は、学習処理を繰り返し(反復して)行い、学習済みモデルを生成する。学習部11は、学習済みモデルとして、予備学習モデル(第二学習モデル)と、予測学習モデル(第一学習モデル)と、を生成する。
【0036】
(予備学習モデル)
学習部11における予備学習モデルの生成について説明する。学習部11は、取得部10によって取得された錯体データにおいて、座標データを分子構造記述子に変換し、分子構造記述子を取得する。分子構造記述子は、分子の特性等の特徴量を数値に変換したものである。分子構造記述子としては、Finger Print記述子、RACs記述子、CoMFA記述子等が挙げられる。
【0037】
学習部11は、分子構造記述子を説明変数、物性記述子を目的変数として用いて学習処理を行い、予備学習モデルを生成する。すなわち、学習部11は、分子構造記述子と物性記述子との関係を学習して、予備学習モデルを生成する。学習部11は、説明変数として、一又は複数の分子構造記述子を使用し得る。予備学習モデルは、入力された分子構造記述子に対して、物性記述子を出力する。すなわち、予備学習モデルは、分子構造記述子に基づいて、物性記述子を推定する。学習部11は、複数の学習処理を所定回数繰り返し行って取得した予備学習モデルを、記憶部12に記憶させる。
【0038】
(予測学習モデル)
学習部11における予測学習モデルの生成について説明する。学習部11は、分子構造記述子及び物性記述子を説明変数、錯体物性を目的変数として学習処理を行い、予測学習モデルを生成する。すなわち、学習部11は、分子構造記述子と物性記述子と錯体物性との関係を学習して、予測学習モデルを生成(構築)する。学習部11は、説明変数として、一又は複数の分子構造記述子、及び、一又は複数の物性記述子を使用し得る。学習部11は、予備学習モデルから出力された物性記述子を目的変数として用いる。具体的には、学習部11は、分子構造記述子を予備学習モデルに入力し、予備学習モデルから出力された物性記述子を取得する。
【0039】
予測学習モデルは、入力された分子構造記述子及び物性記述子に対して、錯体物性を出力する。すなわち、予測学習モデルは、分子構造記述子と物性記述子とに基づいて、錯体物性を推定する。学習部11は、複数の学習処理を所定回数繰り返し行って取得した予測学習モデルを、記憶部12に記憶させる。
【0040】
予測部13は、学習済みモデルである予測学習モデルを用いて錯体物性を予測する機能要素である。予測部13は、入力データを、学習済みモデルに入力する。予測部13は、学習済みモデルに入力データを入力したことに応じて、学習済みモデルから出力された出力値を含む予測結果を取得する。
【0041】
[予測システムの動作]
(学習フェーズ)
図3を参照して、学習方法(予備学習モデルの生成方法)について説明する。
図3は、学習方法の一例を処理フローS1として示すフローチャートである。処理フローS1は学習フェーズに相当し、本開示に係る学習方法の一例である。
【0042】
ステップS11では、取得部10が、錯体データをデータベース20から取得する。ステップS12では、学習部11が、錯体データに含まれる座標データを分子構造記述子に変換し、分子構造記述子を取得する。
【0043】
ステップS13では、学習部11が、分子構造記述子及び物性記述子を用いて機械学習を実行する。学習部11は、分子構造記述子及び物性記述子を機械学習モデルに入力し、機械学習モデルから出力される予測結果を得る。学習部11は、予測結果と、錯体データで示される金属錯体(すなわち、正解)との誤差に基づいて、機械学習モデル内のパラメータを更新する。パラメータの更新には、例えば、バックプロパゲーション(誤差逆伝播法)等の手法を用いることができる。
【0044】
ステップS14では、学習部11が学習を終了させるか否かを判定する。学習部11は、機械学習の終了条件が満たされた場合には、学習を終了させ、終了条件が満たされない場合には、機械学習を継続する。終了条件は任意に設定される。終了条件は、例えば、誤差に基づいて設定されてもよいし、処理する錯体データの個数、すなわち学習の回数に基づいて設定されてもよい。
【0045】
学習を続ける場合には(ステップS14:NO)、学習部11が次の錯体データをデータベース20から取得し、その錯体データについてステップS13以降の処理を実行する。学習を終了させる場合には(ステップS14:YES)、ステップS15において学習部11が学習済みモデルを取得する。このように、学習フェーズでは、機械学習システム1は、分子構造記述子及び物性記述子を用いて機械学習を実行することで予備学習モデルを生成する。
【0046】
図4を参照して、学習方法(予測学習モデルの生成方法)について説明する。
図4は、学習方法の一例を処理フローS2として示すフローチャートである。処理フローS2は学習フェーズに相当し、本開示に係る学習方法の一例である。
【0047】
ステップS21では、取得部10が、錯体データをデータベース20から取得する(取得ステップ)。ステップS22では、学習部11が、予備学習モデルの出力から、分子構造記述子を取得する。
【0048】
ステップS23では、学習部11が、分子構造記述子、物性記述子及び錯体物性を用いて機械学習を実行する(学習ステップ)。学習部11は、分子構造記述子、物性記述子及び錯体物性を機械学習モデルに入力し、機械学習モデルから出力される予測結果を得る。
【0049】
ステップS24では、学習部11が学習を終了させるか否かを判定する。学習部11は、機械学習の終了条件が満たされた場合には、学習を終了させ、終了条件が満たされない場合には、機械学習を継続する。
【0050】
学習を続ける場合には(ステップS24:NO)、学習部11が次の錯体データをデータベース20から取得し、その錯体データについてステップS23以降の処理を実行する。学習を終了させる場合には(ステップS24:YES)、ステップS25において学習部11が学習済みモデルを取得する。このように、学習フェーズでは、機械学習システム1は、分子構造記述子、物性記述子及び錯体物性を用いて機械学習を実行することで予測学習モデルを生成する。
【0051】
(運用フェーズ)
図5を参照して、予測方法について説明する。
図5は、予測方法の一例を処理フローS3として示すフローチャートである。処理フローS3は運用フェーズに相当し、本開示に係る予測方法の一例である。
【0052】
ステップS31では、取得部10が、入力データを取得する。ステップS32では、予測部13が、入力データを予測学習モデルに入力し、予測学習モデルによって得られる予測結果を出力する。予測部13による予測結果の出力方法は、特に限定されない。例えば、予測部13は、予測結果を出力装置106に出力してもよいし、所定のデータベースに格納してもよいし、他のコンピュータシステムに送信してもよい。
【0053】
[効果]
以上説明したように、本実施形態に係る機械学習システム1では、分子構造記述子及び物性記述子と錯体物性との関係を学習し、分子構造記述子及び物性記述子の入力に応じて錯体物性を推定する予測学習モデルを生成する。このように、機械学習システム1では、分子構造記述子に加えて、錯体金属の構造に依存し難い物性記述子を用いて予測学習モデルを生成する。これにより、予測学習モデルは、錯体金属の構造に依存することなく、分子構造記述子及び物性記述子の入力に応じて、錯体物性を精度良く推定することができる。したがって、機械学習システム1では、錯体物性の予測精度の向上が図れる。例えば、機械学習システム1では、錯体物性の予測に関して、MAE(Mean Absolute Error)0.199Vを実現することが可能である。
【0054】
本実施形態に係る機械学習システム1では、学習部11は、物性記述子として、分子構造記述子に基づいて物性記述子を推定する予備学習モデルが推定した物性記述子を用いるこの構成では、予備学習モデルが推定した物性記述子を学習に用いることにより、錯体物性を精度良く推定できる予測学習モデルを生成することができる。
【0055】
本実施形態に係る機械学習システム1では、取得部10は、錯体の座標データ及び物性記述子を含む錯体データを取得する。学習部11は、錯体データに含まれる座標データを分子構造記述子に変換すると共に、錯体データに含まれる物性記述子を取得する。学習部11は、変換した分子構造記述子と物性記述子とに基づいて、分子構造記述子と物性記述子との関係を学習し、分子構造記述子の入力に応じて物性記述子を推定する予備学習モデルを生成する。この構成では、分子構造記述子の入力に応じて物性記述子を推定する予備学習モデルを適切に生成することができる。また、上記のように生成された予備学習モデルは、物性記述子を精度良く推定することができる。
【0056】
以上、本開示の実施形態について説明してきたが、本開示は必ずしも上述した実施形態に限定されるものではなく、その要旨を逸脱しない範囲で様々な変更が可能である。
【0057】
上記実施形態では、学習部11において、予備学習モデルによって物性記述子を取得する形態を一例に説明した。しかし、物性記述子は、分子構造記述子に基づいて、シミュレーション、計算式(量子計算)等によって取得されてもよい。
【0058】
上記実施形態では、取得部10がデータベース20から錯体データを取得し、学習部11が錯体データに含まれる座標データを分子構造記述子に変換する形態を一例に説明した。しかし、取得部10が分子構造記述子をデータベース20から取得する形態であってもよい。すなわち、データベース20において、錯体データに分子構造記述子が含まれていてもよい。
【符号の説明】
【0059】
1…機械学習システム
10…取得部
11…学習部
12…記憶部
13…予測部
20…データベース
100…コンピュータ
101…プロセッサ
102…主記憶部
103…補助記憶部
104…通信制御部
105…入力装置
106…出力装置
110…学習プログラム
120…予測プログラム
S1…処理フロー
S2…処理フロー
S3…処理フロー
S11…ステップ
S12…ステップ
S13…ステップ
S14…ステップ
S15…ステップ
S21…ステップ
S22…ステップ
S23…ステップ
S24…ステップ
S25…ステップ
S31…ステップ
S32…ステップ