IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 太陽ホールディングス株式会社の特許一覧

特許7448353コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造
<>
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図1
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図2
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図3
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図4
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図5
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図6
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図7
  • 特許-コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-04
(45)【発行日】2024-03-12
(54)【発明の名称】コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造
(51)【国際特許分類】
   G16C 20/30 20190101AFI20240305BHJP
   C08G 63/183 20060101ALI20240305BHJP
【FI】
G16C20/30
C08G63/183
【請求項の数】 6
(21)【出願番号】P 2019235059
(22)【出願日】2019-12-25
(65)【公開番号】P2021102732
(43)【公開日】2021-07-15
【審査請求日】2022-09-29
(73)【特許権者】
【識別番号】591021305
【氏名又は名称】太陽ホールディングス株式会社
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100119079
【弁理士】
【氏名又は名称】伊藤 佐保子
(74)【代理人】
【識別番号】100205833
【弁理士】
【氏名又は名称】宮谷 昂佑
(72)【発明者】
【氏名】佐原 豪
【審査官】岡北 有平
(56)【参考文献】
【文献】国際公開第2019/172280(WO,A1)
【文献】後藤俊、荒川正幹、船津公人,ポリマー設計のための物性推算法と逆解析手法の開発,Journal of Computer Aided Chemistry [online],Chemical Society of Japan,2009年,Vol. 10,pp. 30-37,[検索日 2019.05.15], インターネット <URL: https://www.jstage.jst.go.jp/article/jcac/10/0/10_0_30/_article/-char/ja/
【文献】Stephen Wu, et al.,Machine-learning-assisted discovery of polymers with high thermal conductivity using a molecular design algorithm,npi Computational Materials [online],2019年08月13日,Vol.5, No.66,pages 1-11,[検索日 2023.11.16], インターネット<URL:https://doi.org/10.1038.s41524-019-0203-2>
(58)【調査した分野】(Int.Cl.,DB名)
G16C 10/00 - 99/00
C08G 63/183
(57)【特許請求の範囲】
【請求項1】
コンピュータが、
ポリマーの分子構造に関する情報に基づいて当該ポリマーの繰返し単位を決定するステップと、
前記繰返し単位を環化してなる環状構造に対応する分子記述子を生成するステップと、
前記分子記述子と前記ポリマーの特性との組を教師データとして、前記分子構造と前記特性との相関を機械学習するステップと、
を含む、動作方法。
【請求項2】
前記機械学習によって生成された学習モデルを用いて、ポリマーの分子構造に関する情報に基づいて、当該ポリマーの特性を予測するステップをさらに含む、請求項に記載の動作方法。
【請求項3】
コンピュータに、
ポリマーの分子構造に関する情報に基づいて当該ポリマーの繰返し単位を決定するステップと、
前記繰返し単位を環化してなる環状構造に対応する分子記述子を生成するステップと、
前記分子記述子と前記ポリマーの特性との組を教師データとして、前記分子構造と前記特性との相関を機械学習するステップと、
を実行させる、プログラム。
【請求項4】
前記機械学習によって生成された学習モデルを用いて、ポリマーの特性を予測するステップをさらに前記コンピュータに実行させる、請求項に記載のプログラム。
【請求項5】
ポリマーの分子構造に関する情報に基づいて当該ポリマーの繰返し単位を決定し、
前記繰返し単位が環化されてなる環状構造に対応する分子記述子を生成
前記分子記述子と前記ポリマーの特性との組を教師データとして、前記分子構造と前記特性との相関を機械学習する、
情報処理装置。
【請求項6】
前記機械学習によって生成された学習モデルを用いて、ポリマーの分子構造に関する情報に基づいて、当該ポリマーの特性を予測する、請求項に記載の情報処理装置。
【発明の詳細な説明】
【技術分野】
【0001】
本開示は、コンピュータの動作方法、プログラム、情報処理装置、及びデータ構造に関する。
【背景技術】
【0002】
ポリマーの分子構造に関する情報に基づいて、ポリマーの屈折率、弾性率、又はガラス転移温度等の特性をコンピュータ等により予測する際、ポリマーの分子構造は、一般的に、コンピュータ等が識別可能な分子記述子等の記述子に変換される。例えば、非特許文献1には、数密度記述子と機械学習とを用いることによって、ポリマーの屈折率を予測する方法が開示される。
【先行技術文献】
【非特許文献】
【0003】
【文献】Takuya Minami, Yoshishige Okuno, "Number Density Descriptor on Extended-Connectivity Fingerprints Combined with MachineLearning Approaches for Predicting Polymer Properties", MRS Advances, 3(49), 2975-2980, 2018
【発明の概要】
【発明が解決しようとする課題】
【0004】
従来技術においては、ポリマーの特性の予測精度を向上させる点で、改善の余地がある。
【0005】
そこで、本開示は、ポリマーの特性の予測精度を向上させることができるコンピュータの動作方法等を提供することを目的とする。
【課題を解決するための手段】
【0006】
本開示における一態様に係るコンピュータの動作方法は、
コンピュータが、
ポリマーの分子構造に関する情報に基づいて当該ポリマーの繰返し単位を決定するステップと、
前記繰返し単位を環化してなる環状構造に対応する分子記述子を生成するステップと、
を含む。
【0007】
本開示における一態様に係るプログラムは、
コンピュータに、
ポリマーの分子構造に関する情報に基づいて当該ポリマーの繰返し単位を決定するステップと、
前記繰返し単位を環化してなる環状構造に対応する分子記述子を生成するステップと、
を実行させる。
【0008】
本開示における一態様に係る情報処理装置は、
ポリマーの分子構造に関する情報に基づいて当該ポリマーの繰返し単位を決定し、
前記繰返し単位が環化されてなる環状構造に対応する分子記述子を生成する。
【0009】
本開示における一態様に係るデータ構造は、
ポリマーの特性を予測するための学習モデルを情報処理装置が機械学習によって生成するための教師データに供するデータ構造であって、前記ポリマーの繰返し単位が環化されてなる環状構造に対応する分子記述子を含む。
【発明の効果】
【0010】
本開示における実施形態によれば、ポリマーの特性の予測精度を向上させることが可能となる。
【図面の簡単な説明】
【0011】
図1】一実施形態に係る情報処理装置の機能ブロック図である。
図2】情報処理装置による第1の処理例を説明するフローチャートである。
図3】分子構造に関する情報の概略図である。
図4】文字列の概略図である。
図5】環状構造及び対応する文字列の概略図である。
図6】環状構造及び対応する文字列の概略図である。
図7】従来例を説明する概略図である。
図8】情報処理装置による第2の処理例を説明するフローチャートである。
【発明を実施するための形態】
【0012】
以下、実施の形態について、図面を参照しながら説明する。
【0013】
図1に示すように、本実施形態に係る情報処理装置1は、例えば、演算部10と、記憶部20と、入力部30と、出力部40とを備える、1つ以上のコンピュータである。
【0014】
演算部10は、ポリマーの分子記述子の生成、分子記述子を用いた機械学習、及びポリマーの特性の予測等に必要な種々の処理を行う。処理内容の詳細については後述する。演算部10は、例えば、1つ以上のプロセッサを含む。プロセッサは、汎用のプロセッサ、又は特定の処理に特化した専用のプロセッサであるが、これらに限られない。演算部10が行う種々の処理は、処理毎に複数のプロセッサに分散されてもよい。なお、本実施形態において「ポリマー」とは、複数のモノマーが重合してなる化合物である。また、本実施形態において「ポリマーの特性」とは、ポリマーの屈折率、弾性率、又はガラス転移温度等であるが、これらに限られない。
【0015】
記憶部20は、ポリマーの分子構造に関する情報、情報処理装置1を動作させるプログラム等が記憶される。記憶部20は、例えば、1つ以上のメモリを含む。メモリは、例えば半導体メモリ、磁気メモリ、又は光メモリ等であるが、これらに限られない。
【0016】
入力部30は、例えば、ユーザ入力を検出して入力される情報を演算部10に送ることが可能な1つ以上の入力インタフェースを含む。入力インタフェースは、例えば物理キー、静電容量キー、又はタッチスクリーン等であるが、これらに限られない。ユーザは、入力部30を介して、ポリマーの分子構造に関する情報等の入力を行うことができる。
【0017】
出力部40は、例えば、ユーザに対して、ポリマーの分子記述子及び特性等を含む情報を出力することが可能な1つ以上の出力インタフェースを含む。出力インタフェースは、例えばディスプレイ等であるが、これらに限られない。
【0018】
上記構成において、情報処理装置1の動作は、記憶部20に記憶されたプログラムを、演算部10に含まれるプロセッサで実行することにより実現される。情報処理装置10が互いにデータ通信可能に接続された複数のコンピュータにより構成される場合には、複数のコンピュータの演算部10に演算処理を分散してもよいし、複数のコンピュータの記憶部20に各種情報又はプログラムが分散して記憶されてもよい。
【0019】
次に、図2を参照して、情報処理装置1による第1の処理例を説明する。
【0020】
ステップS100において、演算部10は、入力部30を介して、ポリマーの分子構造に関する情報を読み込む。ポリマーの分子構造に関する情報は、例えば、ポリマーの化合物名、分子構造式、CAS番号等を含み、MOLファイル、SDF(Structure Data File)等の形式で、記憶部20に格納される。図3は、ポリエチレンテレフタレートの化学構造式を示す。なお、ステップS100では、ポリマーの分子構造に関する情報は、ポリマーの分子構造がSMILES(Simplified Molecular Input Line Entry System)記法、又はSMARTS(SMILES arbitrary target specification)記法等によって文字列化された形式で、記憶部20に格納されてもよい。
【0021】
ステップS110において、演算部10は、ステップS100において取得したポリマーの分子構造に関する情報に基づいて、ポリマーの分子構造を文字列化する。例えば、演算部10が、記憶部20に予め格納されたRDKit等を用いて、ポリマーの分子構造をSMILES記法又はSMARTS記法により記述された文字列に変換する。図4は、SMILES記法により記述されたポリエチレンテレフタレートの文字列の例である。ただし、本開示における文字列化の手法は、これに限られない。また、ステップS110では、ポリマーの分子構造を文字列化する代わりにグラフ化してもよい。なお、ステップS100において、ポリマーの分子構造がSMILES記法又はSMARTS記法等によって文字列化されている場合には、演算部10は、ステップS110の処理を行わず、ステップS120以降の処理を行う。
【0022】
ステップS120において、演算部10は、ステップS110において文字列化したポリマーの分子構造に基づいて、ポリマーの繰返し単位を決定する。本実施形態において「繰返し単位」とは、ポリマーを構成するモノマー、又は当該モノマーが複数結合したものであって、文字列化したポリマーの分子構造において繰り返される文字列のパターンである。例えば、演算部10が、文字列化したポリマーの分子構造から繰り返される文字列のパターンを検出することによって、ポリマーの繰返し単位が決定される。繰返し単位に含まれるモノマー数は、ポリマーの分子サイズ、計算量、及び計算時間等を考慮して、適宜設定される。モノマー数は、3つ以上5つ以下であることが好ましい。モノマー数が3つ以上であれば、該モノマーから構成されたポリマーの構造と該ポリマーの繰返し単位を環化した環状構造とで原子配列の整合性が向上する。モノマー数が5つ以下であれば、モノマー数が6つ以上の場合と比較して、後述する分子記述子を生成するのにかかる計算量及び計算時間を低減することができる。モノマー数は、4つ以上5つ以下であることがより好ましい。なお、モノマー数は、演算部10が実行するプログラムにおいて予め任意に設定されてもよいし、ユーザが、入力部30を介して、適宜設定可能であってもよい。
【0023】
ステップS130において、演算部10は、ステップS120において決定した繰返し単位を環化することによって、環状構造を生成する。具体的には、演算部10は、繰返し単位の末端部同士を結合した分子構造に対応する文字列を生成する。図5及び図6は、ポリエチレンテレフタレートを構成するモノマー数を1~5つとした場合のそれぞれの環状構造及び文字列を示す。本実施形態において「環化する」とは、化学反応等によって実際に環化されるのではなく、繰返し単位に含まれる末端部をコンピュータのプログラム上で仮想的に結合することを意味する。図5及び図6は、ポリエチレンテレフタラートの繰返し単位が環化されてなる環状構造を示す。図5は、繰返し単位に含まれるモノマー数が1つ~3つである場合の環状構造をそれぞれ示す。図6は、繰返し単位に含まれるモノマー数が4つ~5つである場合の環状構造をそれぞれ示す。なお、図5及び図6において、各文字列は、末端にある原子同士がコンピュータのプログラム上で仮想的に結合されている。以下、ステップS130について詳細に説明する。
【0024】
ポリマーの重合度は、一般に数百~数千と高い。このため、ポリマーの分子構造に関する情報をコンピュータ等で取り扱うと、その分計算量及び計算時間の長大化を招く。そこで、例えば、図7に示すように、ポリマーを構成するモノマーが仮想的に重合してなるオリゴマーに対応する分子記述子を用いることで、計算量及び計算時間を低減することが考えられる。しかしながら、オリゴマーに対応する分子記述子を用いた場合、末端部が不可避的に生成されてしまう。この末端部は、ポリマーの特性の予測精度の低下に繋がる。これに対して、本実施形態では、繰返し単位を環化するので、分子記述子への末端部の影響が排除される結果、ポリマーの特性の予測精度が向上する。
【0025】
ステップS140において、演算部10は、ステップS130における環状構造に対応する分子記述子を生成する。例えば、演算部10が、記憶部20に予め格納されたRDKit等を用いることによって分子記述子が生成される。ステップS140において生成された分子記述子は、記憶部20に格納されてもよく、出力部40を介してユーザ等に提供されてもよい。以下、ステップS130における分子記述子を生成するための手法について詳細に説明する。
【0026】
図5及び図6に示すように、ステップS130における環状構造は、いずれもポリエチレンテレフタラートに対応する環状構造ではあるが、繰返し単位に含まれるモノマー数に依存して、任意性を有する。予測精度をさらに向上させる観点から、この任意性を取り除くことが好ましい。そこで、ステップS140では、MACCSkey又はECFP(Extended Connectivity Fingerprint)及びFCFP(Functional-class extended Connectivity Fingerprint)等を用いることが好ましい。MACCSkeyを用いる場合には、分子記述子は、予め定義された166種類の部分構造がステップS130における環状構造に含まれるか否かに関する情報を含む。ECFP及びFCFPを用いる場合には、ステップS130における環状構造に含まれる各炭素原子に対して、当該炭素原子から通常2つ隣又は3つ隣の非水素原子までが1つの部分構造として取り扱われる。分子記述子は、この部分構造の種類及び数に関する情報を含む。
【0027】
以上、ステップS100~S140を換言すると、本実施形態に係る情報処理装置1は、ポリマーの分子構造に関する情報に基づいて繰返し単位を決定し、当該繰返し単位を環化してなる環状構造に対応する分子記述子を生成する。したがって、本実施形態によれば、ポリマーの繰返し単位が環化されてなる環状構造に対応する分子記述子を含むデータ構造が得られる。このデータ構造は、ポリマーの特性を予測するための学習モデルを情報処理装置1が機械学習によって生成するための教師データに供することができる。なお、本実施形態における「教師データ」とは、ポリマーの分子記述子と特性との組を示し、「学習モデル」とは、ポリマーの分子構造と特性との相関を示す数理モデルを意味する。
【0028】
次に、図8を参照して、情報処理装置1による第2の処理例を説明する。第2の処理例では、第1の処理例と同様にして生成した複数の既知のポリマーに対応する分子記述子が記憶部20に予め格納される。また、複数の既知のポリマーの特性を示す情報が記憶部20に予め格納される。
【0029】
ステップS200において、演算部10は、記憶部20から、分子記述子及び特性を示す情報を取得する。
【0030】
ステップS210において、演算部10は、複数の既知のポリマーについて、分子記述子と特性との組を教師データとして、ポリマーの分子構造と特性との相関を機械学習することによって、学習モデルを生成する。この機械学習には、ニューラルネットワーク、サポートベクター回帰、ランダムフォレスト、LASSO(least absolute shrinkage and selection operator)回帰、Ridge回帰、ガウス過程回帰、又はPLS(Partial Least Squares)回帰等の任意の学習アルゴリズムを用いることができる。
【0031】
ステップS220において、演算部10は、ステップS210で生成した学習モデルを用いて、ポリマーの特性を予測する。具体的には、演算部10は、第1の処理例と同様にして、例えば特性が未知であるポリマーの分子構造に対応する分子記述子を生成する。続いて、演算部10は、生成した分子記述子を学習モデルに入力し、このポリマーの特性を予測する。続いて、演算部10は、予測結果を出力部40に出力する。
【0032】
以上、ステップS200~S220を換言すると、本実施形態に係る情報処理装置1は、分子記述子とポリマーの特性との組を教師データとして、分子構造と特性との相関を機械学習する。また、情報処理装置1は、機械学習によって生成された学習モデルを用いて、ポリマーの特性を予測する。本実施形態によれば、例えば特性が未知であるポリマーについても、その特性の予測精度を向上させることができる。
【0033】
以上、本開示を諸図面及び実施形態に基づき説明したが、当業者であれば本開示に基づき種々の変形又は修正を行うことが容易であることに注意されたい。したがって、これらの変形又は修正は本開示の範囲に含まれることに留意されたい。例えば、各ステップ等に含まれる機能等は論理的に矛盾しないように再配置可能であり、複数のステップ等を1つに組み合わせたり、あるいは分割したりすることが可能である。
【0034】
例えば、汎用のコンピュータを、上述した実施形態に係る情報処理装置1として機能させる構成も可能である。具体的には、上述した実施形態に係る情報処理装置1の各機能を実現する処理内容を記述したプログラムを、汎用のコンピュータのメモリに格納し、汎用のコンピュータのプロセッサによって当該プログラムを読み出して実行させる。したがって、本開示は、プロセッサが実行可能なプログラムとしても実現可能である。
【実施例
【0035】
実施例として、以下に説明する発明例、比較例1、及び比較例2を用意し、ポリマーの特性の予測精度を検証した。
【0036】
発明例として、高分子データベース(PoLyInfo)によって提供されているポリマーの分子構造に関する情報を用いて、上述した第1の処理例と同様にして、5つのモノマーから構成される環状構造(以下、「環状5量体」と称する。)を生成し、MACCSKeyを用いた分子記述子を生成した。
【0037】
比較例1として、発明例と同じポリマーの分子構造に関する情報を用いて、1つのモノマーから構成される直鎖構造(以下、「直鎖単量体」と称する。)を生成し、MACCSKeyを用いた分子記述子を生成した。
【0038】
比較例2として、発明例と同じポリマーの分子構造に関する情報を用いて、5つのモノマーから構成される直鎖構造(以下、「直鎖5量体」と称する。)を生成し、MACCSKeyを用いた分子記述子を生成した。
【0039】
発明例、比較例1、及び比較例2による分子記述子をそれぞれ説明変数とし、高分子データベース(PoLyInfo)によって提供されているポリマーの屈折率を目的変数として、上述した第2の処理例と同様にして、サポートベクター回帰を用いて機械学習を行った。表1に、ハイパーパラメータを最適化した条件での決定係数(500回平均値)を示す。なお、決定係数は、10-foldクロスバリデーション法を用いて算出された、テストデータに対する値であり、1に近づくほど予測精度が向上することを意味する。
【0040】
【表1】
【0041】
表1に示されるとおり、環状構造に対応する分子記述子を用いてポリマーの特性を予測することによって、予測精度が向上した。
【産業上の利用可能性】
【0042】
本開示によれば、ポリマーの特性の予測精度を向上させることができるコンピュータの動作方法等が提供される。
【符号の説明】
【0043】
1 情報処理装置
10 演算部
20 記憶部
30 入力部
40 出力部
図1
図2
図3
図4
図5
図6
図7
図8