(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】特開2020-95310(P2020-95310A)
(43)【公開日】2020年6月18日
(54)【発明の名称】高分子を探索し製造する方法
(51)【国際特許分類】
G06F 30/10 20200101AFI20200522BHJP
G06F 30/27 20200101ALI20200522BHJP
G06N 20/00 20190101ALI20200522BHJP
G06N 3/04 20060101ALI20200522BHJP
G16B 15/00 20190101ALI20200522BHJP
【FI】
G06F17/50 638
G06F17/50 604D
G06N99/00 150
G06N3/04
G06F19/16
【審査請求】未請求
【請求項の数】24
【出願形態】OL
【全頁数】21
(21)【出願番号】特願2018-230667(P2018-230667)
(22)【出願日】2018年12月10日
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成30年度、国立研究開発法人科学技術振興機構 イノベーションハブ構築支援事業、情報統合型物質・材料開発イニシアティブ、産業技術力強化法第19条の適用を受ける特許出願
(71)【出願人】
【識別番号】301023238
【氏名又は名称】国立研究開発法人物質・材料研究機構
(74)【代理人】
【識別番号】110000855
【氏名又は名称】特許業務法人浅村特許事務所
(72)【発明者】
【氏名】森川 淳子
(72)【発明者】
【氏名】吉田 亮
(72)【発明者】
【氏名】近藤 弓紀子
(72)【発明者】
【氏名】柿本 雅明
(72)【発明者】
【氏名】徐 一斌
(72)【発明者】
【氏名】桑島 功
(72)【発明者】
【氏名】ステファン ウ
【テーマコード(参考)】
5B046
【Fターム(参考)】
5B046DA01
5B046GA01
5B046KA05
5B046KA08
(57)【要約】
【課題】熱伝導率のデータ数が十分でないデータセットから所定の熱伝導率を有する高分子を製造する方法を提供する。
【解決手段】該方法が、データセットの中から熱伝導率と相関のある代理物性を選定するステップと、データセットの複数の分子構造及び複数の分子構造の各々に対する代理物性を使用して、所定の領域内にある代理物性を有する分子構造を予測するためのモデルを構築するステップと、データセットの複数の分子構造及び複数の分子構造の各々に対する代理物性を使用して、分子構造に対する代理物性を出力する訓練済みモデルを構築し、データセットの複数の分子構造及びデータセットの複数の分子構造の各々に対する熱伝導率を使用して、訓練済みモデルを転移して分子構造に対する熱伝導率を出力する再訓練モデルを構築するステップと、再訓練モデルを使用して、任意の分子構造に対する熱伝導率を予測するステップとを含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
所定の熱伝導率を有する高分子を製造する方法であって、
(a)高分子に関連する複数の物性値が記録されているデータセットを準備するステップと、
(b)前記データセットの中から熱伝導率と相関のある代理のターゲットの物性を選定するステップと、
(c)前記データセットに記録された複数の分子構造及び前記データセットに記録された複数の分子構造の各々に対する代理のターゲットの物性を使用して、所定の領域内にある代理のターゲットの物性を有する分子構造を予測するためのモデルを構築するステップと、
(d)前記データセットに記録された複数の分子構造及び前記データセットに記録された複数の分子構造の各々に対する代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性を出力する訓練済みモデルを構築し、前記データセットに記録された複数の分子構造及び前記データセットに記録された複数の分子構造の各々に対する熱伝導率を使用して、前記訓練済みモデルを転移して分子構造に対する熱伝導率を出力する再訓練モデルを構築するステップと、
(e)前記再訓練モデルを使用して、任意の分子構造に対する熱伝導率を予測するステップと
を含む方法。
【請求項2】
前記ステップ(c)は、
前記データセットに記録された複数の分子構造及び前記データセットに記録された複数の分子構造の各々に対する代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性に関する尤度としての順方向予測モデルを訓練するステップと、
前記所定の領域内にある代理のターゲットの物性を有する分子構造を同定するために、ベイズの法則に基づいて、前記順方向予測モデルを反転させた事後確率としての逆方向予測モデルにおいて高確率領域にある分子構造を引き出すステップと
を含む、請求項1に記載の方法。
【請求項3】
前記ステップ(c)は、化学的に好ましくない又は非現実的な分子構造の発生を減少させる事前確率を使用して、前記順方向予測モデルを前記逆方向予測モデルに反転させている、請求項2に記載の方法。
【請求項4】
前記順方向予測モデルは、分子構造がLCP(液晶性ポリマー)様化学構造を含むか否かを判定するLCPライクリネスフィルタを含む、請求項2又は3に記載の方法。
【請求項5】
前記ステップ(d)は、
前記訓練済みモデルを、前記データセットに記録された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、前記データセットに記録された代理のターゲットの物性を出力することができるように訓練するステップと、
前記再訓練モデルを、前記訓練済みモデルを転移して、前記データセットに記録された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、前記データセットに記録された熱伝導率を出力することができるように訓練するステップと
を含む、請求項1〜4の何れか一項に記載の方法。
【請求項6】
前記訓練済みモデル及び前記再訓練モデルは、入力層、少なくとも1つの隠れ層、及び出力層から構成されているニューラルネットワークモデルであって、前記隠れ層の各々は、回帰モデル及び活性化関数によって構成されている、請求項5に記載の方法。
【請求項7】
前記再訓練モデルの前記隠れ層のうちの少なくとも1つの前記回帰モデルは、前記データセットに記録された複数の分子構造及び前記データセットに記録された複数の分子構造の各々に対する熱伝導率を使用して訓練されている、請求項6に記載の方法。
【請求項8】
前記再訓練モデルの最後の隠れ層の前記回帰モデルは、前記データセットに記録された複数の分子構造及び前記データセットに記録された複数の分子構造の各々に対する熱伝導率を使用して訓練されている、請求項6に記載の方法。
【請求項9】
前記ステップ(c)において予測された分子構造に対して、前記ステップ(d)において熱伝導率を予測することによって、前記所定の熱伝導率を有する高分子を設計するための候補となる分子構造を選定するステップを含む、請求項1〜8の何れか一項に記載の方法。
【請求項10】
前記選定された分子構造に対して、LCP様化学構造を含むか否か、及び/又は合成容易であるのか否かによって分子構造を更に選定するステップを含む、請求項9に記載の方法。
【請求項11】
前記更に選定された分子構造に基づいて化学合成を行うステップを含む、請求項10に記載の方法。
【請求項12】
前記化学合成を行った後、アニールを行うステップを含む、請求項11に記載の方法。
【請求項13】
前記代理のターゲットの物性は、ガラス転移温度及び/又は融解温度を含む、請求項1〜12の何れか一項に記載の方法。
【請求項14】
高分子に関連する複数の物性値が記録されているデータセットを使用して、所定の熱伝導率を有する高分子を設計するためのプログラムであって、
(a)前記データセットに記録された複数の分子構造、複数の分子構造の各々に対する熱伝導率、及び複数の分子構造の各々に対する熱伝導率と相関のある代理のターゲットの物性を読み出すステップと、
(b)前記読み出された複数の分子構造及び前記読み出された代理のターゲットの物性を使用して、所定の領域内にある代理のターゲットの物性を有する分子構造を予測するためのモデルを構築させるステップと、
(c)前記読み出された複数の分子構造及び前記読み出された代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性を出力する訓練済みモデルを構築させ、前記読み出された複数の分子構造及び前記読み出された熱伝導率を使用して、前記訓練済みモデルを転移して分子構造に対する熱伝導率を出力する再訓練モデルを構築させるステップと、
(d)前記再訓練モデルを使用して、任意の分子構造に対する熱伝導率を予測させるステップと
を含むプログラム。
【請求項15】
前記ステップ(b)は、
前記読み出された複数の分子構造及び前記読み出された代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性に関する尤度としての順方向予測モデルを訓練させるステップと、
前記所定の領域内にある代理のターゲットの物性を有する分子構造を同定するために、ベイズの法則に基づいて、前記順方向予測モデルを反転させた事後確率としての逆方向予測モデルにおいて高確率領域にある分子構造を引き出させるステップと
を含む、請求項14に記載のプログラム。
【請求項16】
前記ステップ(b)は、化学的に好ましくない又は非現実的な分子構造の発生を減少させる事前確率を使用して、前記順方向予測モデルを前記逆方向予測モデルに反転させている、請求項15に記載のプログラム。
【請求項17】
前記順方向予測モデルは、分子構造がLCP(液晶性ポリマー)様化学構造を含むか否かを判定するLCPライクリネスフィルタを含む、請求項15又は16に記載のプログラム。
【請求項18】
前記ステップ(c)は、
前記訓練済みモデルを、前記読み出された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、前記読み出された代理のターゲットの物性を出力することができるように訓練させるステップと、
前記再訓練モデルを、前記訓練済みモデルを転移して、前記読み出された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、前記読み出された熱伝導率を出力することができるように訓練させるステップと
を含む、請求項14〜17の何れか一項に記載のプログラム。
【請求項19】
前記訓練済みモデル及び前記再訓練モデルは、入力層、少なくとも1つの隠れ層、及び出力層から構成されているニューラルネットワークモデルであって、前記隠れ層の各々は、回帰モデル及び活性化関数によって構成されている、請求項18に記載のプログラム。
【請求項20】
前記再訓練モデルの前記隠れ層のうちの少なくとも1つの前記回帰モデルは、前記読み出された複数の分子構造及び前記読み出された熱伝導率を使用して訓練されている、請求項19に記載のプログラム。
【請求項21】
前記再訓練モデルの最後の隠れ層の前記回帰モデルは、前記読み出された複数の分子構造及び前記読み出された熱伝導率を使用して訓練されている、請求項19に記載のプログラム。
【請求項22】
前記最後の隠れ層以外の隠れ層の前記活性化関数は、正規化線形関数(ReLU)である、請求項21に記載のプログラム。
【請求項23】
前記回帰モデルは、全結合型の線形回帰モデルである、請求項19〜22の何れか一項に記載のプログラム。
【請求項24】
前記ステップ(b)において予測された分子構造に対して、前記ステップ(c)において熱伝導率を予測することによって、前記所定の熱伝導率を有する高分子を設計するための候補となる分子構造を選定させるステップを含む、請求項14〜23の何れか一項に記載のプログラム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、所定の熱伝導率を有する高分子を製造する方法、その高分子を設計する方法、及びその設計する方法を実行するためのプログラムに関するものである。
【背景技術】
【0002】
大量のデータに基づいて訓練された人工知能の能力が、様々な分野において実証されている。このような状況の下、機械学習(Machine Learning:ML)技術を使用して、新しい材料の発見と開発にかかる時間とコストを大幅に節約することに関心が高まっている。そして、分子設計においても、現在知られている有機分子の総数は10
8個以下であると言われている一方で、実際には10
60個もの候補があると言われている巨大な化学空間から、ML技術を使用して、網羅的に様々な種類の所望の物性を有する有望な仮想的な分子を探索し、更にはその探索を加速することが期待されている。非特許文献1には、所与の分子構造の様々な物性を予測するために大量のデータによって訓練された順方向予測モデル、及び訓練された順方向予測モデルをベイズの法則を介して反転させて事後分布を導出した逆方向予測モデルを使用して、所望の物性を有する有望な仮想的な分子構造を同定することが開示されている。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】H. Ikebata, K. Hongo, T. Isomura, R. Maezono, and R. Yoshida. Bayesian molecular design with a chemical language model. J. Comput. Aided Mol. Des., 31(379-391), 2017.
【非特許文献2】S. Otsuka, I. Kuwajima, J. Hosoya, Y. Xu, and M. Yamazaki. Polyinfo: polymer database for polymeric materials design. In 2011 Int. Conf. on Emerg. Intell. Data Web Technol., pages 22-29, Tirana, Albania, 2011. IEEE.
【非特許文献3】L. C. Blum and J.-L. Reymond. 970 million druglike small molecules for virtual screening in the chemical universe database GDB-13. J. Am. Chem. Soc., 131(25):8732-8733, 2009.
【非特許文献4】M. Rupp, A. Tkatchenko, K.-R. Muller, and O. A. von Lilienfeld. Fast and accurate modeling of molecular atomization energies with machine learning. Phys. Rev. Lett., 108(5):058301, 2012.
【非特許文献5】P. Del Moral, A. Doucet, and A. Jasra. Sequential Monte Carlo samplers. J. R. Stat. Soc. B, 68(3): 411-436, 2006.
【非特許文献6】D. Rogers and M. Hahn. Extended-connectivity fingerprints. J. Chem. Inf. Model., 50(5):742-754, 2010. doi: 10.1021/ci100050t. URL https://doi.org/10.1021/ci100050t. PMID: 20426451.
【非特許文献7】D. Weininger. SMILES, a chemical language and information system. 1. introduction to methodology and encoding rules. J. Chem. Inf. Comput. Sci., 28(1):31-36, 1988.
【非特許文献8】P. Ertl and A. Schuffenhauer. Estimation of synthetic accessibility score of drug-like molecules based on molecular complexity and fragment contributions. J. Cheminform., 1(8):8, 2009.
【発明の概要】
【発明が解決しようとする課題】
【0004】
非特許文献1のベイズの法則を使用した分子設計法は、ターゲットとする機能又は物性に関するデータ数が十分でない、或いは高分子材料のように物性がプロセスに大きく依存するために熟練者でなければデータを読み解くことができない場合には適用することができないという問題点がある。また、非特許文献1の分子設計法により所望の物性を有する仮想的な分子構造を導くことができたとしても、これらを実用的な高分子材料の開発に適用する際、化学合成上の困難さやデータの背後に存在する不確実性、熟練者の知見との大きい乖離が存在するという問題点がある。そこで、本発明は、上記問題点を解決して、ターゲットとする機能又は物性に関するデータ数が十分でないような場合であっても、ターゲットとする機能又は物性を有する有望な化学構造を導いて、所定の熱伝導率を有する高分子を製造する方法、その高分子を設計する方法、及びその設計する方法を実行するためのプログラムを提供することを目的とする。
【課題を解決するための手段】
【0005】
本発明の1つの観点によれば、所定の熱伝導率を有する高分子を製造する方法は、高分子に関連する複数の物性値が記録されているデータセットを準備するステップ(a)と、データセットの中から熱伝導率と相関のある代理のターゲットの物性を選定するステップ(b)と、データセットに記録された複数の分子構造及びデータセットに記録された複数の分子構造の各々に対する代理のターゲットの物性を使用して、所定の領域内にある代理のターゲットの物性を有する分子構造を予測するためのモデルを構築するステップ(c)と、データセットに記録された複数の分子構造及びデータセットに記録された複数の分子構造の各々に対する代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性を出力する訓練済みモデルを構築し、データセットに記録された複数の分子構造及びデータセットに記録された複数の分子構造の各々に対する熱伝導率を使用して、訓練済みモデルを転移して分子構造に対する熱伝導率を出力する再訓練モデルを構築するステップ(d)と、再訓練モデルを使用して、任意の分子構造に対する熱伝導率を予測するステップ(e)とを含む。
【0006】
本発明の一具体例によれば、上記方法のステップ(c)は、データセットに記録された複数の分子構造及びデータセットに記録された複数の分子構造の各々に対する代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性に関する尤度としての順方向予測モデルを訓練するステップと、所定の領域内にある代理のターゲットの物性を有する分子構造を同定するために、ベイズの法則に基づいて、順方向予測モデルを反転させた事後確率としての逆方向予測モデルにおいて高確率領域にある分子構造を引き出すステップとを含む。
【0007】
本発明の一具体例によれば、上記方法のステップ(c)は、化学的に好ましくない又は非現実的な分子構造の発生を減少させる事前確率を使用して、順方向予測モデルを逆方向予測モデルに反転させている。
【0008】
本発明の一具体例によれば、上記方法において、順方向予測モデルは、分子構造がLCP(液晶性ポリマー)様化学構造を含むか否かを判定するLCPライクリネスフィルタを含む。
【0009】
本発明の一具体例によれば、上記方法のステップ(d)は、訓練済みモデルを、データセットに記録された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、データセットに記録された代理のターゲットの物性を出力することができるように訓練するステップと、再訓練モデルを、訓練済みモデルを転移して、データセットに記録された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、データセットに記録された熱伝導率を出力することができるように訓練するステップとを含む。
【0010】
本発明の一具体例によれば、上記方法において、訓練済みモデル及び再訓練モデルは、入力層、少なくとも1つの隠れ層、及び出力層から構成されているニューラルネットワークモデルであって、隠れ層の各々は、回帰モデル及び活性化関数によって構成されている。
【0011】
本発明の一具体例によれば、上記方法において、再訓練モデルの隠れ層のうちの少なくとも1つの回帰モデルは、データセットに記録された複数の分子構造及びデータセットに記録された複数の分子構造の各々に対する熱伝導率を使用して訓練されている。
【0012】
本発明の一具体例によれば、上記方法において、再訓練モデルの最後の隠れ層の回帰モデルは、データセットに記録された複数の分子構造及びデータセットに記録された複数の分子構造の各々に対する熱伝導率を使用して訓練されている。
【0013】
本発明の一具体例によれば、上記方法は、ステップ(c)において予測された分子構造に対して、ステップ(d)において熱伝導率を予測することによって、所定の熱伝導率を有する高分子を設計するための候補となる分子構造を選定するステップを含む。
【0014】
本発明の一具体例によれば、上記方法は、上記のように選定された分子構造に対して、LCP様化学構造を含むか否か、及び/又は合成容易であるのか否かによって分子構造を更に選定するステップを含む。
【0015】
本発明の一具体例によれば、上記方法は、上記のように更に選定された分子構造に基づいて化学合成を行うステップを含む。
【0016】
本発明の一具体例によれば、上記方法は、上記のように化学合成を行った後、アニールを行うステップを含む。
【0017】
本発明の一具体例によれば、上記方法において、代理のターゲットの物性は、ガラス転移温度及び/又は融解温度を含む。
【0018】
本発明の1つの観点によれば、高分子に関連する複数の物性値が記録されているデータセットを使用して、所定の熱伝導率を有する高分子を設計するためのプログラムは、データセットに記録された複数の分子構造、複数の分子構造の各々に対する熱伝導率、及び複数の分子構造の各々に対する熱伝導率と相関のある代理のターゲットの物性を読み出すステップ(a)と、読み出された複数の分子構造及び読み出された代理のターゲットの物性を使用して、所定の領域内にある代理のターゲットの物性を有する分子構造を予測するためのモデルを構築させるステップ(b)と、読み出された複数の分子構造及び読み出された代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性を出力する訓練済みモデルを構築させ、読み出された複数の分子構造及び読み出された熱伝導率を使用して、訓練済みモデルを転移して分子構造に対する熱伝導率を出力する再訓練モデルを構築させるステップ(c)、再訓練モデルを使用して、任意の分子構造に対する熱伝導率を予測させるステップ(d)とを含む。
【0019】
本発明の一具体例によれば、上記プログラムのステップ(b)は、読み出された複数の分子構造及び読み出された代理のターゲットの物性を使用して、分子構造に対する代理のターゲットの物性に関する尤度としての順方向予測モデルを訓練させるステップと、所定の領域内にある代理のターゲットの物性を有する分子構造を同定するために、ベイズの法則に基づいて、順方向予測モデルを反転させた事後確率としての逆方向予測モデルにおいて高確率領域にある分子構造を引き出させるステップとを含む。
【0020】
本発明の一具体例によれば、上記プログラムのステップ(b)は、化学的に好ましくない又は非現実的な分子構造の発生を減少させる事前確率を使用して、順方向予測モデルを逆方向予測モデルに反転させている。
【0021】
本発明の一具体例によれば、上記プログラムにおいて、順方向予測モデルは、分子構造がLCP(液晶性ポリマー)様化学構造を含むか否かを判定するLCPライクリネスフィルタを含む。
【0022】
本発明の一具体例によれば、上記プログラムのステップ(c)は、訓練済みモデルを、読み出された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、読み出された代理のターゲットの物性を出力することができるように訓練させるステップと、再訓練モデルを、訓練済みモデルを転移して、読み出された複数の分子構造のうちの何れかの分子構造を入力した場合に、その分子構造に対応する、読み出された熱伝導率を出力することができるように訓練させるステップとを含む。
【0023】
本発明の一具体例によれば、上記プログラムにおいて、訓練済みモデル及び再訓練モデルは、入力層、少なくとも1つの隠れ層、及び出力層から構成されているニューラルネットワークモデルであって、隠れ層の各々は、回帰モデル及び活性化関数によって構成されている。
【0024】
本発明の一具体例によれば、上記プログラムにおいて、再訓練モデルの隠れ層のうちの少なくとも1つの回帰モデルは、読み出された複数の分子構造及び読み出された熱伝導率を使用して訓練されている。
【0025】
本発明の一具体例によれば、上記プログラムにおいて、再訓練モデルの最後の隠れ層の回帰モデルは、読み出された複数の分子構造及び読み出された熱伝導率を使用して訓練されている。
【0026】
本発明の一具体例によれば、上記プログラムにおいて、最後の隠れ層以外の隠れ層の活性化関数は、正規化線形関数(ReLU)である。
【0027】
本発明の一具体例によれば、上記プログラムにおいて、回帰モデルは、全結合型の線形回帰モデルである。
【0028】
本発明の一具体例によれば、上記プログラムは、ステップ(b)において予測された分子構造に対して、ステップ(c)において熱伝導率を予測することによって、所定の熱伝導率を有する高分子を設計するための候補となる分子構造を選定させるステップを含む。
【発明の効果】
【0029】
本発明によれば、データセットにターゲットとする機能又は物性に関する十分なデータ数が記録されていない場合であっても、データセットに十分なデータ数が記憶されている代理のダーゲットの機能又は物性を使用することによって、ターゲットとする機能又は物性を有する有望な化学構造を導くことができる。
【0030】
なお、本発明の他の目的、特徴及び利点は、添付図面に関する以下の本発明の実施例の記載から明らかになるであろう。
【図面の簡単な説明】
【0031】
【
図2A】データセットに記録されたポリマーの各物性値についての、±1σ(σ:標準偏差)のエラーバーを有する、昇順でプロットされた平均物性値を示す。
【
図3】分子構造を記述子としてのフィンガープリントで表した場合の例を示す。
【
図4A】
図1の高分子の設計方法のベイジアン分子設計の順方向予測モデルによって予測されたT
gと、観測されたT
gとの比較を示す。
【
図4B】
図1の高分子の設計方法のベイジアン分子設計の順方向予測モデルによって予測されたT
mと、観測されたT
mとの比較を示す。
【
図6】
図1の高分子の設計方法のベイジアン分子設計によって導き出された分子構造の例を示す。
【
図7A】代理のターゲットの物性としてT
gを選定した場合の、
図1の高分子の設計方法によって予測されたλと、観測されたλとの比較を示す。
【
図7B】代理のターゲットの物性としてT
mを選定した場合の、
図1の高分子の設計方法によって予測されたλと、観測されたλとの比較を示す。
【
図7C】代理のターゲットの物性としてρを選定した場合の、
図1の高分子の設計方法によって予測されたλと、観測されたλとの比較を示す。
【
図8A】
図1の高分子の設計方法によって予測されたλ及びSAスコアの対比を示す。
【
図8B】
図1の高分子の設計方法によって予測されたρ及びC
pの対比を示す。
【
図8C】
図1の高分子の設計方法によって予測されたT
m及びT
gの対比を示す。
【
図9】
図1の高分子の設計方法によって予測された24個の分子構造の候補の物性値を示す。
【
図10A】分子構造4によるポリマーの合成経路を示す。
【
図10B】分子構造13によるポリマーの合成経路を示す。
【
図10C】分子構造19によるポリマーの合成経路を示す。
【
図10D】分子構造19aによるポリマーの合成経路を示す。
【発明を実施するための形態】
【0032】
以下、本発明の実施例について図面を参照して説明するが、本発明はこれらの実施例に限定されるものではない。
【0033】
所定の熱伝導率を有する高分子を探索し製造する方法を以下に詳細に説明する。
図1は、本発明による所定の熱伝導率を有する高分子を設計する方法を示す。なお、この方法はコンピュータに実装されたプログラムの命令によって実行されてもよい。
【0034】
まず、ポリマー(重合体)、ポリマーの繰返し単位であるモノマー(単量体)の物性が記録されているデータセットを準備する。例えば、そのようなデータセットとしてPolyInfoがある(非特許文献2をご参照)。PolyInfoには、構成繰返し単位の分子構造に対する約100もの様々な種類の物性が記録されている。PolyInfoの中から14,798個のホモポリマーに焦点を絞ると、以下の表1に記載されるように、ガラス転移温度(T
g)、融解温度(T
m)、密度(ρ)、定圧比熱(C
p)、熱伝導率(λ)に関する合計39,134個の構造−物性相関を抽出することができる。なお、同じ実験条件下でポリマーについて複数の値が記録されている場合には、それらの平均値を換算してもよい。
【表1】
【0035】
データの量は、物性によって大幅に異なる。例えば、PolyInfoでは、表1のように、5,917個のホモポリマーに対してT
gの複数の値が記録され、3,234個のホモポリマーに対してT
mの複数の値が記録されている。一方、室温(10〜35℃)のC
pについては、129個のホモポリマーのみに対して824個の観測値が記録され、室温(10〜35℃)のλについては、28個のホモポリマーのみに対して322個の観測値が記録されているだけであって、λをターゲットの物性として新規高分子を設計する場合に、参照として使用するλのデータ数があまりにも不足している。更に、
図2Aに示すように、各物性値は、同じポリマーであっても大幅に変動する。このようなデータベースにおける物性値の変動は、様々な研究において変化する処理操作及び他の測定条件から生じると考えられる。このようなターゲットとなる物性のデータ数の不足に対して、そのターゲットの物性の代わりとして、多くのデータ数を有する代理のターゲットの物性を使用する必要がある。なお、このようなデータセットとしてその他に、モノマーに対する定積比熱(C
v)等の値が記録されているQM9がある(非特許文献3及び4を参照)。
【0036】
そこで、λを直接ターゲットとするのではなく、λと相関のある代理のターゲットとなる物性をデータセットの中から選定する。例えば、そのような代理のターゲットとなり得る物性としてT
g、T
mがある。λとT
g及びT
mとの関係は完全には明らかではないが、それを支持する幾つかの証拠がある。まずλと、T
g及びT
mとは経験的に相関があることが知られている。例えば、ガラス相におけるλの最大値は、T
gのレベルに依存することが報告され、理論的には、結晶中の格子熱伝導は、熱伝導率が熱容量、群速度、及びフォノンの平均自由行程によって決定される伝搬フォノンの動力学的な観点から理解することができる。平均自由行程の速度は、調和原子間/分子間力定数(Interatomic/Intermolecular Force Constants:IFC)に関連し、平均自由行程の寿命は非調和IFCに関連している。ポリマーは、フォノンが伝播しないように平均自由行程を減少させる不規則な構造であることが多く、熱伝導率は、調和IFCによって得られる熱容量及びモード拡散率によって表されることができる。しかし、不規則性によって、フォノンの全ての伝播が終わることはなく、アモルファスであっても、フォノンの一部は、周波数に依存して伝播することがある。調和分子間力と非調和分子間力との両方の強さが熱伝導率に影響を及ぼす。このように、転移によって調和力及び非調和力が小さい分子間変位及び大きい分子間変位にそれぞれ対応して結合破壊に至るので、分子間力の強さによって強く影響されるλとT
g及びT
mとの間には、直接的又は間接的な相関があることが予想される。実際に、
図2Bに示すように、λとT
g及びT
mとの間には弱い正の相関がある。また、T
g及びT
mに対してターゲットとする所定の領域Uを選定する。例えば、T
g、T
mに対してターゲットとする所定の領域Uとして、それぞれ200〜500℃、300〜600℃を選定してもよい。なお、これは例であって、T
g、T
m以外の他の物性をλと相関のある代理のターゲットとなる物性としてデータセットの中から選定してもよい。この場合にも同様に、この選定された物性に対して所定の領域Uを選定する。
【0037】
次に、データセットに記録された複数の分子構造Sとその複数の分子構造Sの各々に対する代理のターゲットとなる物性Yとを使用して、所定の領域U内にある代理のターゲットとなる物性Yを有する分子構造Sを予測するためのモデルを構築する。このような予測するためのモデルを、
図1に示すベイジアン分子設計に基づいて構築する。ここでベイズの法則を使用する目的は、ポリマーのn種類の物性Y=(Y
1,...,Y
n)が所定の領域U内にあるポリマーの繰返し単位、すなわちモノマーの分子構造Sをアルゴリズム的に作成することである。ベイジアン分子設計は、式(1)に示すようにベイズの法則に基づき計算が行われる。
【数1】
この法則は、事後確率p(S│Y∈U)が、尤度p(Y∈U│S)と事前確率p(S)との積に比例することを意味する。なお、p(A│B)は、事象Bが発生した下において事象Aが発生する条件付き確率分布であって、Y∈Uは、物性Yが所定の領域U内にあることを意味する。また、この法則は、事後確率の高い領域を探索することにより、所定の領域U内にある有望な仮想的な分子構造Sを同定することを目指している。分子構造Sに対するn個の特性Yに関する尤度としての順方向予測モデルp(Y│S)が、構造‐物性相関データセットを使用して訓練される。ここで、p(Y│S)は、式(2)のように表される。
【数2】
事前確率p(S)は、化学的に好ましくない又は非現実的な構造の発生を減少させる機能を有する。所与のp(S)を使用して、ベイズの法則は、順方向予測モデルp(Y│S)(S→Y)を事後確率としての逆方向予測モデルp(S│Y∈U)(Y→S)に反転させる。所定の領域U内にある有望な仮想的な分子構造Sを同定するために、逆方向予測モデルの高確率領域にある仮想的な分子構造Sをランダムに引き出す。例えば、ランダムに引き出すために、逐次モンテカルロ(SMC)法が使用されてもよい(非特許文献5を参照)。なお、順方向予測モデルの計算と逆方向予測モデルとの計算をパイプライン処理するために、R言語パッケージiqsprが使用されてもよい(非特許文献1を参照)。
【0038】
図1の高分子を設計する方法において、モノマーの分子構造Sは、
図3に示すように、多数の分子のフィンガープリントからなるバイナリーベクターにエンコードされる。エンコードする方法として、例えば、Extended Connectivity Fingerprint(ECFP)を使用してもよい(非特許文献6を参照)。分子構造Sが、定義された構造的特徴を含む場合は1とし、含まないときは0とするように、例えば、ベンゼン環を含む場合には1列目を1とし、含まない場合には0とするように、バイナリ値の記述子として表される。そして、データセットに記録された分子構造Sとその分子構造Sに対する物性Yを使用して、順方向予測モデルが、分子構造Sの記述子の関数としてポリマーの物性を記述する回帰モデルによって訓練される。回帰モデルは、線形回帰モデルであってもよい。
【0039】
図4A及び
図4Bに、T
g及びT
mに対する、訓練された順方向予測モデルによる予測値と、観測値との比較をそれぞれ示す。
図4A及び
図4Bは、データセットを5つに分割して1つをテストデータとし残りを訓練データとする5分割交差検証を使用して、線形回帰モデルによって訓練された順方向予測モデルによる予測値であって、5回の検証の全ての予測値をプロットする。また、T
g並びにT
mの平均絶対誤差(MAE)、二乗平均平方根誤差(RMSE)、及び相関係数(R)はそれぞれ、30.2175、45.9692、及び0.916、並びに49.0634、72.836、0.7895である。
【0040】
高いλは、高いT
g又はT
mを有するポリマー主鎖の剛性だけでなく、超延伸繊維、軸配向薄膜、及び射出成形品で観察される高度に配向した分子鎖によっても生成される。また、高分子材料をフィルム、繊維、等に成形するためには、加工の容易さが不可欠である。そこで、更なる開発及び産業応用の観点から、LCP(Liquid Crystalline Polymer:液晶性ポリマー)ライクリネスフィルタを使用してもよい。一般に、ポリマーは、その半結晶構造及び電気絶縁構造のために、かなり低いλ、典型的には0.1〜0.2W/mKを有する。LCPの側鎖又は主鎖は、高い熱抵抗性及び耐性、高い電気抵抗、並びに高い耐薬品性を示す熱可塑性樹脂の族を構成する。LCPの一方向に沿って配列された積み重ねられた配向は、それらのλを他の方向よりも分子配向の方向に著しく大きくする。このように設計される高分子のλを高めるために、LCPライクリネスがLCPの固有の加工性及び剛性のために設定されてもよい。LCPライクリネスフィルタを設定するためには、
図5に示すように、LCP様化学構造のリストを作成する。なお、
図5は一例であってこれに限定されるものではない。分子構造がこのリストの中の1つ以上のLCP様化学構造を含む場合には、その分子構造にはより高いスコアが与えられる。これは、式(1)の順方向予測モデルが式(3)になることを意味する。
【数3】
ここで、I(・)は、引数が真であれば値1であって、偽であれば0であるインジケータ関数を示す。式(3)においては、分子構造Sの物性Y
iが所定の領域U
iにある確率に加えて、分子構造Sの部分構造Y
f(S)がLCPライクリネスフィルタU
fで列挙された少なくとも1つの化学構造と一致する場合には、追加スコアθ>1が分子構造Sに割り当てられる。例えば、θを10と設定してもよい。なお、物性Y
iをT
g及びT
mとし、T
g及びT
mに対してそれぞれターゲットとする設計範囲U
Tg及びU
Tmを選定すれば、順方向予測モデルは式(4)になる。
【数4】
【0041】
上記のように、逆方向予測モデルp(S│Y)は、順方向予測モデルp(Y│S)と事前確率p(S)とを使用して計算され、事前確率p(S)は、逆方向予測モデルp(S│Y)を使用して設計される分子における化学的に好ましくない又は非現実的な構造の発生を減少させる機能を有する。事前確率p(S)は、確率的言語モデルの形態を取る。分子構造は、Simplified Molecular−Input Line−Entry System(SMILES)化学言語に従ってASCII文字列として表され(非特許文献7を参照)、データセットに記録されたポリマーのSMILES文字列についてモデルが訓練される。訓練された事前確率のモデルは、SMILES文字列の所与のインスタンスを有する既存のポリマーにおいて頻繁に現れる原子配置及び化学結合を暗にエンコードする。
【0042】
分子構造Sの物性Yが設定されたターゲットとする所定の領域Uにある場合の順方向予測モデルp(Y∈U│S)と事前確率p(S)を使用して、式(1)に示すように、所定の領域Uにある物性Yから分子構造Sを導く逆方向予測モデルp(S│Y∈U)を構築する。この逆方向予測モデル(S│Y∈U)を使用すれば、記述子として表された任意の分子構造Sに対する、その物性Yが所定の領域Uにあって、且つ化学的に好ましい構造である確率を導き出すことができる。そして、記述子として表すことができる分子構造Sの数は大量に存在するので、その中からランダムに複数個抽出し、その逆方向予測モデル(S│Y∈U)の確率が高いものを、物性Yが所定の領域Uにあって、且つ化学的に好ましい構造である分子構造Sの候補として引き出すことができる。また、式(3)のようにLCPライクリネスフィルタU
fを使用すれば、物性Yが所定の領域Uにあって、化学的に好ましい構造であって、且つLCP様化学構造を有する分子構造Sの候補として引き出すことができる。例えば、式(4)のように、物性Y
iをT
g及びT
mとし、T
g及びT
mに対してそれぞれターゲットとする設計範囲U
Tg及びU
Tmを選定すれば、T
g及びT
mがそれぞれ所定の領域U
Tg及びU
Tmにあって、化学的に好ましい構造であって、且つLCP様化学構造を有する分子構造Sの候補として引き出すことができる。
図6に、逆方向予測モデル(S│Y∈U)によって導き出された分子構造Sの一例を示す。ベイジアン分子設計の逆方向予測モデル(S│Y∈U)によって導き出される分子構造Sの数は特に限定されるものではないが、例えば1000個導き出してもよい。
【0043】
次に、データセットに記録された複数の分子構造Sとその複数の分子構造Sの各々に対する代理のターゲットの物性Y
tとを使用して、分子構造Sに対する代理のターゲットの物性Y
tを出力する訓練済みモデルを構築し、データセットに記録された複数の分子構造Sとその複数の分子構造Sの各々に対するターゲットとなる物性Y
rtとを使用して、訓練済みモデルを転移して分子構造Sに対するターゲットとなる物性Y
rtを出力する再訓練モデルを構築し、再訓練モデルを使用して、任意の分子構造Sに対するターゲットとなる物性Y
rtを予測する。このような訓練済みモデル、再訓練モデルを、
図1に示すニューラルネットワーク分子設計に基づいて構築する。ここでニューラルネットワークを使用する目的は、データ数の不足しているターゲットとなる物性Y
rtの代わりに、多くのデータ数を有する代理のターゲットの物性Y
tを分子構造Sに対して出力するニューラルネットワークモデルを「転移学習」として適用して、データ数の不足しているターゲットとなる物性Y
rtを分子構造Sに対して予測することである。
【0044】
まずは、ターゲットとなる物性Y
rtである熱伝導率λと相関のある代理のターゲットとなる物性Y
tを選定する。例えば、λと相関のある代理のターゲットとなり得る物性Y
tとして、上記のようにT
g、T
mがある。次に、
図1に示すように、入力層において分子構造Sの記述子としてのフィンガープリントXを入力して、出力層においてターゲットとなる物性Y
rtと相関のある代理のターゲットとなる物性Y
tを出力するための訓練済みモデルとして、ニューラルネットワークモデルを構築する。ニューラルネットワークモデルは、入力層、少なくとも1つの隠れ層(
図1でのn層の隠れ層)、及び出力層から構成され、各隠れ層は、回帰モデル及び活性化関数から構成される。各隠れ層の回帰モデルは、式(5)のような各層のニューロンが直ぐ下の層の全てのニューロンに結合された全結合型の線形回帰モデルであってもよい。
【数5】
y
l,jはニューロン数がN
lである隠れ層lの線形回帰モデルの出力の1つであって、y
lは(y
l,1,...,y
l,Nl)のベクトルとして表される。y’
l−1,iは各層の直ぐ下の層の出力であって、y’
l−1は(y’
l−1,1,...,y’
l−1,Nl−1)のベクトルとして表される。w
l,jiは重みパラメータあって、b
l,jはバイアスパラメータである。隠れ層の数は任意に選択され、例えば3層又は4層であってもよい。また、各層のニューロンの数も任意に選択されてもよい。例えば、各層のニューロンの数を直ぐ下の層のニューロンの数に対して20〜80%の割合で減少させるようにして、ニューラルネットワークモデルを各層のニューロンの数が上層に向かって徐々に減少していくピラミッド型にしてもよく、この場合には、入力層のニューロンの数は、400〜600個であって、最後の隠れ層(入力層から最も離れ、出力層に最も近い隠れ層(
図1での第nの隠れ層))のニューロンの数は、10〜30個であることが好ましい。各隠れ層の活性化関数として、式(6)のような正規化線形関数(Rectified Linear Unit:ReLU)を適用してもよい。
【数6】
また、活性化関数として、式(7)のような線形活性化関数を適用してもよい。
【数7】
例えば、最後の隠れ層の活性化関数のみ、線形活性化関数を適用し、他の隠れ層の活性化関数については正規化線形関数を適用してもよい。このようにして、データセットに記録されている多くのデータ数を有する代理のターゲットの物性Y
tを使用して、そのデータセットにある任意の分子構造SのフィンガープリントXを入力層に代入し、各隠れ層の重みパラメータ、バイアスパラメータを訓練して、その分子構造Sの代理のターゲットとなる物性Y
tを出力するための訓練済みモデルを構築する。例えば、データセットの中から代理のターゲットの物性Y
tとしてT
g、T
m、又はρを選定し、データセットにある任意の分子構造SのフィンガープリントXを入力層に代入し、各隠れ層の重みパラメータ、バイアスパラメータを訓練して、その分子構造SのT
g、T
m、又はρを出力するための訓練済みモデルを構築する。
【0045】
そして、
図1に示すように、「転移学習」を適用して、多くのデータ数を有する代理のターゲットの物性Y
tによって訓練されて構築された訓練済みモデルを、データ数の不足しているターゲットとなる物性Y
rtによって再訓練する。訓練済みモデルにおいては、多くのデータ数を有する代理のターゲットの物性Y
tによって各隠れ層の線形回帰モデルの重みパラメータ、バイアスパラメータが訓練されたが、転移学習を適用して、入力層において分子構造Sの記述子としてのフィンガープリントXを入力し、訓練済みモデルの隠れ層のうちの少なくとも1つの隠れ層の線形回帰モデルの重みパラメータ、バイアスパラメータを、データ数の不足しているターゲットとなる物性Y
rtによって再訓練して、出力層においてターゲットとなる物性Y
rtを出力するための再訓練モデルとして、ニューラルネットワークモデルを構築する。なお、訓練済みモデルの隠れ層のうちの残りの隠れ層の線形回帰モデルの重みパラメータ、バイアスパラメータについては再訓練を行わず、訓練済みモデルの重みパラメータ、バイアスパラメータをそのまま再訓練モデルにおいて使用する。再訓練する隠れ層は、何れの隠れ層であってもよく、最後の隠れ層であってもよい。このように再訓練モデルを構築することによって、任意の分子構造Sのターゲットとなる物性Y
rtを予測することができ、更には、ターゲットとなる物性Y
rtが所定の範囲にある分子構造Sの候補を引き出すことできる。例えば、データセットの中から代理のターゲットの物性Y
tとしてT
g、T
m、又はρを選定し、データセットに記録されている分子構造SのT
g、T
m、又はρ(例えば、PolyInfoに記録されているT
g、T
m、及びρのデータをそれぞれ使用)を使用して訓練済みモデルを構築した後、ターゲットとなる物性Y
rtであるλについて、データセットに記録されているその分子構造Sのλ(例えば、PolyInfoに記録されているλのデータを使用)を使用して訓練済みモデルの最後の隠れ層の線形回帰モデルを再訓練して、その分子構造Sのλを出力するための再訓練モデルを構築してもよい。このようにして再訓練モデルを構築することによって、任意の分子構造Sのλを予測することができる。
図7A〜
図7Cにそれぞれ、代理のターゲットの物性Y
tとしてT
g、T
m、及びρを選定して、ターゲットの物性Y
rtであるλを予測するために構築された再訓練モデルよる予測値と、観測値との比較を示す。
【0046】
上記のようなベイズの法則を使用して、所定の領域U内にある代理のターゲットとなる物性Yを有する分子構造Sを予測し、上記のようなニューラルネットワークを使用して、その予測された分子構造Sに対してターゲットとなる物性Y
rtを予測することによって、所定のターゲットとなる物性Y
rtを有する高分子を設計するための候補となる分子構造Sを選定することができる。このように選定された分子構造Sの候補に対して、更にスクリーニングを課してもよい。例えば、候補の分子構造Sが
図5に示すようなLCP様化学構造を1つ以上含んでいるのか、候補の分子構造Sが合成容易であるのか(例えば、合成容易性(Synthetic Accessibility:SA)スコア(非特許文献8を参照)を使用)、ターゲットとなる物性を含む様々な予測された物性を検証したか、等のスクリーニング項目がある。このようなスクリーニング項目の総合的な判断から、
図6のような24個の分子構造Sの候補が引き出される。
図8A〜
図8Cに、
図1のベイジアン分子設計及びニューラルネットワーク分子設計によって引き出された1000個の候補の分子構造Sに加えて、1000個の候補からこのようなスクリーニング項目による24個の候補の分子構造Sの、
図1に示すベイズの法則及びニューラルネットワークによって予測された物性の対比を示す。
図8Aはλ対SAスコア、
図8Bはρ対C
p、
図8CはT
m対T
gを示す。また、
図9に、スクリーニング項目による24個の候補の分子構造Sの、ベイズの法則及びニューラルネットワークによって予測された物性を示す。このようにして、所定のターゲットとなる物性を有する高分子を設計することができる。
【0047】
そして、
図6の24個の候補の分子構造Sの中から、4、13、及び19の3種類を選択して実際に化学合成を行った。分子構造4、13、及び19によるポリマーはそれぞれ、全芳香族ポリアミド、芳香族ポリヒドラジド、及び脂肪族−芳香族ポリアミドである。分子構造4及び13によるポリマーを、
図10A及び
図10Bにそれぞれ示すように、ジカルボン酸(塩化ジカルボン酸)とジアミンとの間の反応によって合成し、分子構造19によるポリマーを、
図10Cに示すように、自己縮合AB型モノマーから出発して合成した。また、
図10Dに示すように、非対称ジカルボン酸モノマー及びm−フェニレンジアミンから、分子構造19に類似する分子構造19aによるポリマーを合成した。分子構造19aによるポリマーは3つの異なる配列を有する。なお、分子構造19及び19aによるポリマーは新規の合成された物質である。
【0048】
元素分析、核磁気共鳴(
1H−NMR)、及び赤外線(FTIR)スペクトルによって化学分析を行い、オストワルド粘度計、温度波法(TWA)、示差走査熱量計(DSC)、アルキメデス法、及び高速走査熱量計(FSC)によって、固有粘度(η
inh)、熱拡散率(α)、C
p、ρ、T
g、及びT
mの熱物性を測定した。熱重量分析(TGA)及び熱機械分析(TMA)の結果は、分子構造4及び13によるポリマーの重量損失が500℃であっても5%、20%と低く(10%の重量損失の温度はTG
10で表される)、耐熱性が高いことを示す。分子構造4、13、及び19によるポリマーは、X線回折測定によって結晶性を有することが確認された(結晶化度はX
cで表される)。室温付近の熱伝導率について、圧縮設計された分子構造4及び13によるポリマーは、それぞれ0.26W/mK及び0.22W/mKに達した。分子構造19によるポリマーは、有機溶媒に可溶であって、フィルム形成が可能である。分子構造19によるポリマーは、超高速DSCやX線回折測定によってはわずかな結晶性が認められたが、従来のDSCによってはアモルファスポリマーとして分類することができ、0.195W/mKであるその熱伝導率は、アモルファスポリマーとしてはかなり高い。また、化学合成されたポリマーはアニール(熱処理)されてもよい。370℃又は420℃において熱処理された分子構造13及び4によるポリマーは、それぞれ0.39W/mK及び0.41W/mKの熱伝導率に達した。これは、非複合熱可塑性プラスチックの中における最先端のポリマーに匹敵する。分子構造4、13、19、及び19aによるポリマーの特性を表2に示す。なお表2は、
図1の高分子を設計する方法によって予測された値(予測値)、上記方法により観測された値(観測値)、アニール後の観測値(熱処理)を示す。
【表2】
表2は、予測値と観測値とが一致する傾向にあることを示しており、特に、λの予測値と観測値は一致する。
図1の高分子を設計する方法によって、所定の熱伝導率を有する高分子を適切に設計することができることを支持している。
【0049】
上記記載は特定の実施例についてなされたが、本発明はそれに限らず、本発明の原理と添付の特許請求の範囲の範囲内で種々の変更及び修正をすることができることは当業者に明らかである。