IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 旭硝子株式会社の特許一覧

特開2024-93486物性予測装置、学習済みモデル、物性予測方法、及びプログラム
<>
  • 特開-物性予測装置、学習済みモデル、物性予測方法、及びプログラム 図1
  • 特開-物性予測装置、学習済みモデル、物性予測方法、及びプログラム 図2
  • 特開-物性予測装置、学習済みモデル、物性予測方法、及びプログラム 図3
  • 特開-物性予測装置、学習済みモデル、物性予測方法、及びプログラム 図4
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024093486
(43)【公開日】2024-07-09
(54)【発明の名称】物性予測装置、学習済みモデル、物性予測方法、及びプログラム
(51)【国際特許分類】
   G16C 20/30 20190101AFI20240702BHJP
   G06F 30/27 20200101ALI20240702BHJP
   G01N 33/00 20060101ALI20240702BHJP
   G06F 113/26 20200101ALN20240702BHJP
【FI】
G16C20/30
G06F30/27
G01N33/00 B
G01N33/00 C
G06F113:26
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2022209894
(22)【出願日】2022-12-27
(71)【出願人】
【識別番号】000000044
【氏名又は名称】AGC株式会社
(74)【代理人】
【識別番号】110001634
【氏名又は名称】弁理士法人志賀国際特許事務所
(72)【発明者】
【氏名】吉田 拓未
(72)【発明者】
【氏名】河口 聡史
(72)【発明者】
【氏名】今村 穣
【テーマコード(参考)】
5B146
【Fターム(参考)】
5B146AA10
5B146DC03
5B146DJ01
(57)【要約】
【課題】フッ素原子を含む化合物の物性の予測精度を高めることができる物性予測装置を提供する。
【解決手段】物性予測装置2は、フッ素原子を含む化合物の分子構造から求められる分子記述子E1を、物性の予測対象の化合物である予測対象化合物について取得する分子記述子取得部205と、学習対象の化合物である学習対象化合物について、分子記述子と、化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルC1に基づいて、分子記述子取得部205によって取得された分子記述子E1から予測対象化合物について物性情報F1を予測する予測部206と、を備える。
【選択図】図2
【特許請求の範囲】
【請求項1】
フッ素原子を含む化合物の分子構造から求められる分子記述子を、物性の予測対象の前記化合物である予測対象化合物について取得する分子記述子取得部と、
学習対象の前記化合物である学習対象化合物について、前記分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルに基づいて、前記分子記述子取得部によって取得された前記分子記述子から前記予測対象化合物について前記物性情報を予測する予測部と、
を備える物性予測装置。
【請求項2】
前記化合物が、フッ素原子の数が水素原子の数よりも多い化合物である、
請求項1に記載の物性予測装置。
【請求項3】
前記化合物は、常温でガスまたは液体である化合物である、
請求項1に記載の物性予測装置。
【請求項4】
前記学習済みモデルは、回帰分析、クラス分類、または、回帰分析またはクラス分類を複数組み合わせたアンサンブル学習に基づいて学習された学習済みモデルである、
請求項1に記載の物性予測装置。
【請求項5】
前記学習済みモデルは、ガウス過程回帰に基づいて学習された学習済みモデルである、
請求項1に記載の物性予測装置。
【請求項6】
前記分子記述子には、トポロジカル極性表面積、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上が含まれる、
請求項1に記載の物性予測装置。
【請求項7】
前記分子記述子には、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上と、トポロジカル極性表面積との組み合わせが含まれる、
請求項6に記載の物性予測装置。
【請求項8】
前記分子記述子は、前記分子記述子相互間の相関係数の値に基づいて選択された情報である、
請求項1に記載の物性予測装置。
【請求項9】
前記物性情報には、融点、沸点、引火点、密度、及び屈折率のいずれか1以上が含まれる、
請求項1に記載の物性予測装置。
【請求項10】
フッ素原子を含む化合物の分子構造から求められる分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された、
学習済みモデル。
【請求項11】
フッ素原子を含む化合物の分子構造から求められる分子記述子を、物性の予測対象の前記化合物である予測対象化合物について取得し、
学習対象の前記化合物である学習対象化合物について、前記分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルに基づいて、取得された前記分子記述子から前記予測対象化合物について前記物性情報を予測する、
物性予測方法。
【請求項12】
コンピュータに、
フッ素原子を含む化合物の分子構造から求められる分子記述子を、物性の予測対象の前記化合物である予測対象化合物について取得させ、
学習対象の前記化合物である学習対象化合物について、前記分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルに基づいて、取得された前記分子記述子から前記予測対象化合物について前記物性情報を予測させる、
ためのプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、物性予測装置、学習済みモデル、物性予測方法、及びプログラムに関する。
【背景技術】
【0002】
有機分子の効率的探索のために機械学習を用いた物性予測が行われている(例えば、特許文献1、2を参照)。
【先行技術文献】
【特許文献】
【0003】
【特許文献1】特開2021-117798号公報
【特許文献2】国際公開第2019/048965号
【発明の概要】
【発明が解決しようとする課題】
【0004】
フッ素原子を含む、特にフッ素原子を多く含む分子の物性予測に関しては、一般的な分子によって学習された汎用的な学習済みモデルを使用して予測を行った場合、予測精度が高くないことがあった。フッ素原子を含む化合物の物性の予測精度を高めることが求められている。
【0005】
本発明は上記の点に鑑みてなされたものであり、フッ素原子を含む化合物の物性の予測精度を高めることができる物性予測装置、学習済みモデル、物性予測方法、及びプログラムを提供する。
【課題を解決するための手段】
【0006】
本発明は、上記課題を解決するために、以下の構成を備える。
[1]フッ素原子を含む化合物の分子構造から求められる分子記述子を、物性の予測対象の前記化合物である予測対象化合物について取得する分子記述子取得部と、学習対象の前記化合物である学習対象化合物について、前記分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルに基づいて、前記分子記述子取得部によって取得された前記分子記述子から前記予測対象化合物について前記物性情報を予測する予測部と、を備える物性予測装置。
【0007】
[2]前記化合物が、フッ素原子の数が水素原子の数よりも多い化合物である、[1]に記載の物性予測装置。
【0008】
[3]前記化合物は、常温でガスまたは液体である化合物である、[1]に記載の物性予測装置。
【0009】
[4]前記学習済みモデルは、回帰分析、クラス分類、または、回帰分析またはクラス分類を複数組み合わせたアンサンブル学習に基づいて学習された学習済みモデルである、[1]に記載の物性予測装置。
【0010】
[5]前記学習済みモデルは、ガウス過程回帰に基づいて学習された学習済みモデルである、[1]に記載の物性予測装置。
【0011】
[6]前記分子記述子には、トポロジカル極性表面積、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上が含まれる、[1]に記載の物性予測装置。
【0012】
[7]前記分子記述子には、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上と、トポロジカル極性表面積との組み合わせが含まれる、[6]に記載の物性予測装置。
【0013】
[8]前記分子記述子は、前記分子記述子相互間の相関係数の値に基づいて選択された情報である、請求項1に記載の物性予測装置。
【0014】
[9]前記物性情報には、融点、沸点、引火点、密度、及び屈折率のいずれか1以上が含まれる、[1]に記載の物性予測装置。
【0015】
[10]フッ素原子を含む化合物の分子構造から求められる分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された、学習済みモデル。
【0016】
[11]フッ素原子を含む化合物の分子構造から求められる分子記述子を、物性の予測対象の前記化合物である予測対象化合物について取得し、学習対象の前記化合物である学習対象化合物について、前記分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルに基づいて、取得された前記分子記述子から前記予測対象化合物について前記物性情報を予測する、物性予測方法。
【0017】
[12]コンピュータに、フッ素原子を含む化合物の分子構造から求められる分子記述子を、物性の予測対象の前記化合物である予測対象化合物について取得させ、学習対象の前記化合物である学習対象化合物について、前記分子記述子と、前記化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルに基づいて、取得された前記分子記述子から前記予測対象化合物について前記物性情報を予測させる、ためのプログラム。
【発明の効果】
【0018】
本発明によれば、フッ素原子を含む化合物の物性の予測精度を高めることができる。
【図面の簡単な説明】
【0019】
図1】本発明の実施形態に係る物性予測システムの構成の一例を示す図である。
図2】本発明の実施形態に係る物性予測装置の機能構成の一例を示す図である。
図3】本発明の実施形態に係る学習処理の一例を示す図である。
図4】本発明の実施形態に係る予測処理の一例を示す図である。
【発明を実施するための形態】
【0020】
(実施形態)
以下、図面を参照しながら本発明の実施形態について詳しく説明する。図1は、本実施形態に係る物性予測システム1の構成の一例を示す図である。物性予測システム1は、物性予測装置2と、入力装置3と、表示装置4と、データサーバ5とを備える。
【0021】
物性予測装置2は、フッ素原子を含む化合物について、当該化合物の分子構造から、機械学習に基づいて当該化合物の物性を予測する。物性予測装置2は、一例として、パーソナルコンピュータ(Personal Computer:PC)である。
【0022】
入力装置3は、物性予測装置2に各種のデータを入力する。入力装置3は、例えば、キーボード、マウス、またはタッチパネルなどである。
表示装置4は、物性予測装置2が処理に用いる各種のデータ、及び物性予測装置2による予測結果を表示する。表示装置4は、例えば、ディスプレイである。
【0023】
データサーバ5は、物性予測装置2が情報処理に用いる各種のデータを記憶する。データサーバ5は、物性予測装置2に当該各種のデータを供給する。各種のデータには、分子構造物性情報データA1が含まれる。
【0024】
分子構造物性情報データA1は、フッ素原子を含む化合物の分子構造情報と物性情報とが組にされたデータである。分子構造情報は、分子構造を示す情報である。本実施形態では、一例として、分子構造情報は、SMILES(Simplified Molecular Input Line Entry System)記法の文字列で分子構造が示されている。なお、分子構造情報では、SMILES以外の記法によって分子構造が示されてもよい。物性情報の具体例については、後述する。
【0025】
物性予測装置2とデータサーバ5とは、通信を行う。当該通信は、無線通信、または有線通信のいずれであってもよい。データサーバ5は、一例として、データベースである。
【0026】
本実施形態において化合物とは、フッ素原子を含む化合物である。本実施形態において化合物とは、一例として、フッ素原子を含む化合物のうち、フッ素原子の数が水素原子の数よりも多い化合物である。なお、化合物は、フッ素原子の数が水素原子の数以下である化合物であってもよい。
【0027】
また、本実施形態において化合物とは、一例として、フッ素原子を含む化合物であって、常温でガスまたは液体である化合物である。常温でガスである化合物とは、例えば、冷媒用途に使用される化合物である。常温で液体である化合物とは、例えば、溶媒用途に使用される化合物である。なお、化合物は、常温でガスまたは液体のいずれでもない化合物であってもよい。
以下の説明では、フッ素原子を含む化合物を、単に「化合物」と称する場合がある。
【0028】
[物性予測装置2の機能構成]
図2は、本実施形態に係る物性予測装置2の機能構成の一例を示す図である。物性予測装置2は、制御部20と、記憶部21とを含む。
【0029】
制御部20は、例えばCPU(Central Processing Unit)などを備えており、種々の演算や情報の授受を行う。制御部20は、分子構造物性情報データ取得部200と、教師データ生成部201と、学習部202と、分子構造情報取得部203と、分子記述子生成部204と、分子記述子取得部205と、予測部206と、出力部207とを備える。これらの機能部はそれぞれ、例えばCPUがROM(Read Only Memory)から読み込んだプログラムをRAM(Random Access Memory)に展開して、当該プログラムに従って処理を実行することにより実現される。当該ROM、当該RAMは、記憶部21に含まれる。
【0030】
分子構造物性情報データ取得部200は、分子構造物性情報データA1を取得する。本実施形態では、分子構造物性情報データ取得部200は、データサーバ5から分子構造物性情報データA1を取得する。
【0031】
教師データ生成部201は、分子構造物性情報データA1から教師データB1を生成する。教師データ生成部201は、分子構造物性情報データA1に含まれる分子構造情報から所定の分子記述子を生成する。教師データ生成部201は、生成した分子記述子と、物性情報とを組にしたデータを教師データB1として生成する。教師データB1の数は、分子構造物性情報データA1の数と等しい。ここで、本実施形態では、分子構造物性情報データA1の数は、一例として、数千程度である。本実施形態において、数千程度とは、千以上万以下のいずれかの数である。なお、分子構造物性情報データA1の数は、数千程度以下であってもよいし、数千程度以上であってもよい。
【0032】
教師データB1は、学習対象化合物についての分子構造情報から求められる分子記述子と、当該学習対象化合物についての物性情報とを含む。教師データB1では、当該分子記述子と当該物性情報とが対応づけられている。学習対象化合物とは、学習対象の化合物である。分子記述子とは、分子の特性などの特徴量を数字に変換したものであり、機械学習における説明変数に相当する。物性情報は、機械学習における目的変数に相当する。
【0033】
分子記述子とは、分子の特徴を示す情報である。分子記述子には、例えば、トポロジカル極性表面積(Toplogical Polar Surface Area:TPSA)、フッ素原子の数、フッ素原子の数と水素原子の数との比、分子量、原子の数、重原子の数、ハロゲン原子の数、環の数、二重結合の数、三重結合の数、回転可能結合の数、及び分子サイズのうち1以上が含まれる。
【0034】
物性情報とは、化合物の物性を示す情報である。物性情報には、例えば、融点、沸点、引火点、密度、及び屈折率のいずれか1以上が含まれる。
【0035】
分子記述子は、ユーザによって予め選択される。選択された分子記述子の種類は、例えば、入力装置3から入力される。分子記述子は、例えば、多数の分子記述子のうち物性情報への寄与度が大きい分子記述子が選択されることが好ましい。当該寄与度は、例えば、化合物の物性についての知見に基づいて評価される。分子記述子は、寄与度以外の指標に基づいて選択されてもよい。
【0036】
ここでTPSAは、フッ素原子を含む化合物に限らず一般的に化合物の特性を予測する際に重要な特徴量である。TPSAは分子の極性表面積を表す特徴量で、分子の極性と密接に関連している物性を予測する際に広く使われている。融点、沸点、引火点及び屈折率それぞれの予測においては分子の極性の寄与度が大きいと考えられる。そのため本実施形態では、TPSAを使うことで物性情報として、融点、沸点、引火点及び屈折率を予測する際に予測の精度が向上すると考えられる。
【0037】
フッ素原子を多く含む分子に対しては物性が一般的な分子の物性の傾向から外れることが多い。そのため、フッ素原子を多く含む分子についてはTPSA等の一般的な分子記述子を説明変数として用いた場合、予測精度が低くなりやすい。フッ素原子の数、またはフッ素原子の数と水素原子の数との比を、TPSA等の一般的な分子記述子に加えて説明変数として使用することによって予測の精度を向上させることができる。そこで、分子記述子として、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上と、TPSAとの組み合わせが含まれてもよい。その場合、例えば、フッ素原子の数が所定数以上である化合物については、分子記述子として少なくとも、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上と、TPSAとの組み合わせを用いる。
【0038】
また、分子記述子同士の相関性が高いと学習モデルの生成に悪影響(予測精度の低下、学習時間の増加、解釈性の低下、及び/または過学習の発生など)を及ぼす。そのため、互いに似た分子記述子のうち一方は選択される分子記述子のなかから削除されることが好ましい。当該相関性は、例えば、分子記述子間の相関係数によって評価される。つまり、分子記述子は、分子記述子相互間の相関係数の値に基づいて選択された情報であってもよい。互いに相関の高い分子記述子を削除することによって、学習モデルの生成に悪影響が及ぶことを抑制できる。また、互いに相関の高い分子記述子を削除することによって、学習及び予測に説明変数として用いる分子記述子のデータの数を減らすことができる。
【0039】
学習部202は、教師データB1を用いて機械学習を行うことによって学習済みモデルC1を生成する。ここで学習部202は、教師データB1に含まれる学習対象化合物についての分子記述子を説明変数として用いて、当該学習対象化合物についての物性情報は目的変数として用いて機械学習を行う。学習部202は、生成した学習済みモデルC1を記憶部21に記憶させる。学習済みモデルC1は、学習対象化合物について、分子記述子と、物性情報との関係が学習されたモデルである。学習対象化合物とは、学習対象の化合物である。
【0040】
学習部202が行う機械学習は、例えば、回帰分析、クラス分類、または、アンサンブル学習である。当該アンサンブル学習は、例えば、回帰分析またはクラス分類を複数組み合わせたアンサンブル学習である。それらの場合、学習済みモデルC1は、回帰分析、クラス分類、または、回帰分析またはクラス分類を複数組み合わせたアンサンブル学習に基づいて学習された学習済みモデルである。
【0041】
また、別の一例として、学習部202が行う機械学習は、ガウス過程回帰に基づく機械学習であってもよい。その場合、学習済みモデルC1は、ガウス過程回帰に基づいて学習された学習済みモデルである。
【0042】
なお、学習部202が行う機械学習は、深層学習などのニューラルネットワークを用いた機械学習など他の種類の機械学習であってもよい。ただし、深層学習では、回帰分析、クラス分類、回帰分析またはクラス分類を複数組み合わせたアンサンブル学習、またはガウス過程回帰に基づく機械学習などの機械学習に比べて多くの数の教師データを必要とするため、本実施形態のように数千程度の教師データB1に対しては、上述した機械学習が用いられることが好ましい。
【0043】
分子構造情報取得部203は、予測対象化合物について分子構造情報D1を取得する。予測対象化合物とは、物性の予測対象の化合物である。本実施形態では、分子構造情報取得部203は、入力装置3から分子構造情報D1を取得する。ここで入力装置3から分子構造情報D1を取得するとは、ユーザによって入力装置3から入力される分子構造情報D1を取得することをいう。
【0044】
分子記述子生成部204は、分子記述子E1を生成する。分子記述子生成部204は、分子構造情報D1から所定の分子記述子を生成することによって分子記述子E1を生成する。ここで分子記述子生成部204が生成する所定の分子記述子の種類と、教師データ生成部201が生成する所定の分子記述子の種類とは同じである。
【0045】
分子記述子取得部205は、分子記述子生成部204が生成した分子記述子E1を取得する。つまり、分子記述子取得部205は、予測対象化合物について分子記述子E1を取得する。
【0046】
予測部206は、学習済みモデルC1に基づいて、分子記述子取得部205によって取得された分子記述子E1から予測対象化合物について物性情報F1を予測する。ここで予測部206が予測する物性情報F1の種類と、学習部202が機械学習に用いる教師データB1に含まれる物性情報の種類とは同じである。
【0047】
出力部207は、予測部206によって予測された物性情報F1を出力する。出力部207は、例えば、表示装置4に当該物性情報を表示させる。出力部207は、データサーバ5などの外部サーバ、または記憶部21に当該物性情報を記憶させてもよい。
【0048】
記憶部21は、各種の情報を記憶する。記憶部21は、例えば、学習済みモデルC1を記憶する。なお、記憶部21は、分子構造物性情報データ取得部200によって取得された分子構造物性情報データA1、教師データ生成部201によって生成された教師データB1、分子構造情報取得部203によって生成された分子構造情報D1、及び分子記述子生成部204によって生成された分子記述子E1をそれぞれ記憶する。記憶部21は、磁気ハードディスク装置、または半導体記憶装置等の記憶装置を用いて構成される。
【0049】
物性予測装置2が行う処理には、学習処理と、予測処理とが含まれる。ここで図3、及び図4を参照し、学習処理と、予測処理とについてそれぞれ説明する。
[学習処理]
図3は、本実施形態に係る学習処理の一例を示す図である。学習処理は、学習済みモデルC1を生成するための処理であり、制御部20によって実行される。学習処理は、例えば、予測処理よりも前の時期に実行される。なお、予測処理が行われた予測対象化合物についての分子記述子E1と、物性情報F1とを組みにしたデータを新たな教師データとして用いて学習処理が行われてもよい。換言すれば、学習済みモデルC1は、物性情報F1の予測結果に基づいて更新されてもよい。
【0050】
ステップS10:分子構造物性情報データ取得部200は、分子構造物性情報データA1を取得する。
【0051】
ステップS20:教師データ生成部201は、分子構造物性情報データ取得部200によって取得された分子構造物性情報データA1から教師データB1を生成する。
【0052】
ステップS30:学習部202は、教師データ生成部201によって生成された教師データB1を用いて機械学習を行う。
【0053】
ステップS40:学習部202は、機械学習の結果、学習済みモデルC1を生成する。学習部202は、生成した学習済みモデルC1を記憶部21に記憶させる。
以上で、制御部20は、学習処理を終了する。
【0054】
[予測処理]
図4は、本実施形態に係る予測処理の一例を示す図である。予測処理は、予測対象化合物について物性情報F1を予測するための処理であり、制御部20によって実行される。
【0055】
ステップS110:分子構造情報取得部203は、予測対象化合物について分子構造情報D1を取得する。
【0056】
ステップS120:分子記述子生成部204は、分子構造情報取得部203によって取得された分子構造情報D1から所定の分子記述子を生成することによって分子記述子E1を生成する。
【0057】
ステップS130:分子記述子取得部205は、分子記述子生成部204が生成した分子記述子E1を取得する。
【0058】
ステップS140:予測部206は、学習済みモデルC1に基づいて、分子記述子取得部205によって取得された分子記述子E1から予測対象化合物について物性情報F1を予測する。学習済みモデルC1は、分子記述子E1が入力されると、物性情報F1を出力する。予測部206は、学習済みモデルC1に分子記述子E1を入力して物性情報F1を出力させることによって、物性情報F1を予測する。
【0059】
ステップS150:出力部207は、予測部206によって予測された物性情報F1を出力する。
以上で、制御部20は、予測処理を終了する。
【0060】
なお、本実施形態では、学習処理を行うための機能部が物性予測装置2に備えられる場合の一例について説明したが、これに限られない。学習処理を行うための機能部とは、分子構造物性情報データ取得部200、教師データ生成部201、及び学習部202である。学習処理を行うための機能部は、物性予測装置2の構成から省略されてもよい。その場合、学習済みモデルC1は、物性予測装置2とは別体の情報処理装置である学習モデル生成装置によって予め生成される。当該学習モデル生成装置は、例えば、PC、またはサーバなどである。物性予測装置2は、予め生成された学習済みモデルC1を当該学習モデル生成装置から取得して、予測処理において用いる。
【0061】
また、本実施形態では、物性予測装置2によって分子構造情報D1から分子記述子E1が生成される場合の一例について説明したが、これに限られない。分子記述子E1は、物性予測装置2とは別体の情報処理装置である分子記述子生成装置によって生成されてもよい。当該分子記述子生成装置は、例えば、PC、またはサーバなどである。その場合、物性予測装置2に備えられる分子記述子取得部205は、分子記述子E1を分子記述子生成装置から取得して、予測処理において用いる。また、その場合、物性予測装置2の構成から分子構造情報取得部203、及び分子記述子生成部204は省略されてもよい。
【0062】
また、本実施形態では、分子構造物性情報データA1がデータサーバ5に記憶される場合の一例について説明したが、これに限られない。分子構造物性情報データA1は、物性予測装置2に備えられる記憶部21に記憶されてもよい。その場合、物性予測システム1の構成からデータサーバ5は省略されてもよい。
【0063】
また、本実施形態では、物性予測装置2がPCである場合の一例について説明したが、これに限られない。物性予測装置2は、1以上のサーバから構成されてもよい。当該1以上のサーバは、クラウドサーバとしてインターネット上に構築されてもよい。物性予測装置2は、1以上のサーバから構成される場合、制御部20が備える各機能部、及び記憶部21は、当該1以上のサーバに分散されて備えられる。
【0064】
以上に説明したように、本実施形態に係る物性予測装置2は、分子記述子取得部205と、予測部206と、を備える。
分子記述子取得部205は、フッ素原子を含む化合物の分子構造から求められる分子記述子E1を、物性の予測対象の当該化合物である予測対象化合物について取得する。
予測部206は、学習対象の化合物である学習対象化合物について、分子記述子と、当該化合物の物性を示す情報である物性情報との関係が学習された学習済みモデルC1に基づいて、分子記述子取得部205によって取得された分子記述子E1から予測対象化合物について物性情報F1を予測する。
【0065】
この構成により、本実施形態に係る物性予測装置2は、フッ素原子を含む化合物について、分子記述子E1から物性情報F1を学習済みモデルC1に基づいて予測できるため、フッ素原子を含む化合物の物性の予測精度を高めることができる。
【0066】
また、本実施形態に係る物性予測装置2では、化合物が、フッ素原子の数が水素原子の数よりも多い化合物であってもよい。
この構成により、本実施形態に係る物性予測装置2では、フッ素原子の数が水素原子の数よりも多い化合物であっても、分子記述子E1から物性情報F1を学習済みモデルC1に基づいて予測できるため、フッ素原子の数が水素原子の数よりも多い化合物について物性の予測精度を高めることができる。
【0067】
また、本実施形態に係る物性予測装置2では、化合物は、常温でガスまたは液体である化合物であってもよい。
この構成により、本実施形態に係る物性予測装置2では、常温でガスまたは液体である化合物について分子記述子E1から物性情報F1を学習済みモデルC1に基づいて予測できるため、冷媒用途、または溶媒用途などに使用される化合物について物性の予測精度を高めることができる。
【0068】
また、本実施形態に係る物性予測装置2では、学習済みモデルC1は、回帰分析、クラス分類、または、回帰分析またはクラス分類を複数組み合わせたアンサンブル学習に基づいて学習された学習済みモデルであってもよい。
この構成により、本実施形態に係る物性予測装置2では、回帰分析、クラス分類、または、回帰分析またはクラス分類を複数組み合わせたアンサンブル学習では、深層学習などに比べて少ないデータ数しか必要としないため、深層学習などに比べて少ないデータ数で学習を行ってもフッ素原子を含む化合物の物性の予測精度を高めることができる。
【0069】
また、本実施形態に係る物性予測装置2では、学習済みモデルC1は、ガウス過程回帰に基づいて学習された学習済みモデルであってもよい。
この構成により、本実施形態に係る物性予測装置2では、ガウス過程回帰では深層学習などに比べて少ないデータ数しか必要としないため、深層学習などに比べて少ないデータ数で学習を行ってもフッ素原子を含む化合物の物性の予測精度を高めることができる。
【0070】
また、本実施形態に係る物性予測装置2では、分子記述子E1には、トポロジカル極性表面積、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上が含まれてもよい。
この構成により、本実施形態に係る物性予測装置2では、TPSA、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上を説明変数として用いて物性情報を予測できるため、フッ素原子を含む化合物についてTPSA、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上の寄与度が高い物性の予測精度を高めることができる。特に、融点、沸点、引火点の物性には、分子の極性の寄与度が大きいと考えられている。
【0071】
また、本実施形態に係る物性予測装置2では、分子記述子E1には、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上と、TPSAとの組み合わせが含まれてもよい。
この構成により、本実施形態に係る物性予測装置2では、フッ素原子を含む化合物について、TPSAを含む一般的な分子記述子だけでは十分な予測精度が得られない化合物であっても、フッ素原子の数、及びフッ素原子の数と水素原子の数との比のうち1以上とTPSAとを組み合わせて予測できるため、TPSAを含む一般的な分子記述子だけでは十分な予測精度が得られない化合物であっても物性の予測精度を高めることができる。
特に、フッ素原子を多く含む分子については、TPSAを含む一般的な分子記述子だけでは十分な予測精度が得られない場合がある。本実施形態に係る物性予測装置2では、フッ素原子を含む化合物であっても、物性の予測精度を高めることができる。
【0072】
また、本実施形態に係る物性予測装置2では、分子記述子E1は、分子記述子相互間の相関係数の値に基づいて選択された情報であってもよい。
この構成により、本実施形態に係る物性予測装置2では、多数の分子記述子のなかから分子記述子相互間の相関係数の値に基づいて互いに相関の高い分子記述子を削除することによって選択された分子記述子を説明変数として用いることができるため、学習モデルの生成に悪影響(予測精度の低下、学習時間の増加、解釈性の低下、及び/または過学習の発生など)が及ぶことを抑制できる。また、相関の高い複数の分子記述子が存在した場合、学習及び予測に説明変数として用いる分子記述子のデータの数を減らすことができる。
【0073】
また、本実施形態に係る物性予測装置2では、物性情報には、融点、沸点、引火点、密度、及び屈折率のいずれか1以上が含まれてもよい。
この構成により、本実施形態に係る物性予測装置2では、フッ素原子を含む化合物について、融点、沸点、引火点、密度、及び屈折率のいずれか1以上を学習済みモデルC1に基づいて予測できるため、融点、沸点、引火点、密度、及び屈折率のいずれか1以上の予測精度を高めることができる。
【0074】
なお、上述した実施形態における物性予測装置2の一部、例えば、分子構造物性情報データ取得部200、教師データ生成部201、学習部202、分子構造情報取得部203、分子記述子生成部204と、分子記述子取得部205、予測部206、及び出力部207をコンピュータで実現するようにしてもよい。その場合、この制御機能を実現するためのプログラムをコンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行することによって実現してもよい。なお、ここでいう「コンピュータシステム」とは、物性予測装置2に内蔵されたコンピュータシステムであって、オペレーティングシステム(Operating system:OS)や周辺機器等のハードウェアを含むものとする。また、「コンピュータ読み取り可能な記録媒体」とは、フレキシブルディスク、光磁気ディスク、ROM(Read Only Memory)、CD-ROM(Compact Disc-Read Only Memory)等の可搬媒体、コンピュータシステムに内蔵されるハードディスク等の記憶装置のことをいう。さらに「コンピュータ読み取り可能な記録媒体」とは、インターネット等のネットワークや電話回線等の通信回線を介してプログラムを送信する場合の通信線のように、短時間、動的にプログラムを保持するもの、その場合のサーバやクライアントとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含んでもよい。また上記プログラムは、前述した機能の一部を実現するためのものであってもよく、さらに前述した機能をコンピュータシステムにすでに記録されているプログラムとの組み合わせで実現できるものであってもよい。
また、上述した実施形態における物性予測装置2の一部、または全部を、LSI(Large Scale Integration)等の集積回路として実現してもよい。物性予測装置2の各機能ブロックは個別にプロセッサ化してもよいし、一部、または全部を集積してプロセッサ化してもよい。また、集積回路化の手法はLSIに限らず専用回路、または汎用プロセッサで実現してもよい。また、半導体技術の進歩によりLSIに代替する集積回路化の技術が出現した場合、当該技術による集積回路を用いてもよい。
【0075】
以上、図面を参照してこの発明の一実施形態について詳しく説明してきたが、具体的な構成は上述のものに限られることはなく、この発明の要旨を逸脱しない範囲内において様々な設計変更等をすることが可能である。
【符号の説明】
【0076】
2…物性予測装置、205…分子記述子取得部、206…予測部、E1…分子記述子、C1…学習済みモデル、F1…物性情報
図1
図2
図3
図4