(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2025-01-08
(45)【発行日】2025-01-17
(54)【発明の名称】ポリマー物性推定装置および学習方法
(51)【国際特許分類】
G01N 24/08 20060101AFI20250109BHJP
G01N 24/00 20060101ALI20250109BHJP
【FI】
G01N24/08 510P
G01N24/00 530K
(21)【出願番号】P 2020217774
(22)【出願日】2020-12-25
【審査請求日】2023-12-22
(31)【優先権主張番号】P 2019238623
(32)【優先日】2019-12-27
(33)【優先権主張国・地域又は機関】JP
【新規性喪失の例外の表示】特許法第30条第2項適用 ウェブサイトに掲載。掲載日 令和1年8月9日 ウェブサイトのアドレス https://www.sbj.or.jp/2019/abstract/index.html [刊行物等] 集会名 第71回日本生物工学会大会 開催日 令和1年9月17日
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和元年度、戦略的イノベーション創造プログラム(SIP)「スマートバイオ産業・農業基盤技術」委託事業、「革新的バイオ素材・高機能品等の開発を加速するインフォマティクス基盤技術の開発」にかかる委託研究、産業技術力強化法第17条の適用を受ける特許出願
(73)【特許権者】
【識別番号】503359821
【氏名又は名称】国立研究開発法人理化学研究所
(74)【代理人】
【識別番号】110002860
【氏名又は名称】弁理士法人秀和特許事務所
(72)【発明者】
【氏名】坂田 研二
(72)【発明者】
【氏名】黒谷 篤之
(72)【発明者】
【氏名】菊地 淳
(72)【発明者】
【氏名】伊藤 研悟
(72)【発明者】
【氏名】坪井 裕理
(72)【発明者】
【氏名】松本 朋子
(72)【発明者】
【氏名】鄭 章代
【審査官】比嘉 翔一
(56)【参考文献】
【文献】特表2000-503392(JP,A)
【文献】特開2004-138545(JP,A)
【文献】特開平07-055905(JP,A)
【文献】特表2011-508217(JP,A)
【文献】国際公開第2019/048965(WO,A1)
(58)【調査した分野】(Int.Cl.,DB名)
G01N24/00-G01N24/14
G01R33/20-G01R33/64
JSTPlus/JMEDPlus/JST7580(JDream3)
(57)【特許請求の範囲】
【請求項1】
ポリマー試料のNMRスペクトルデータを取得する取得手段と、
前記NMRスペクトルデータに前処理を施す前処理手段と、
物性値が既知のポリマー試料のNMRスペクトルデータに基づくデータと前記物性値とを教師データとした機械学習によりあらかじめ生成された、学習モデルと、
前記学習モデル
に前記前処理後のNMRスペクトルデータを入力して、前記ポリマー試料の物性値を推定する推定手段と、
を備え
、
前記前処理は、前記NMRスペクトルデータから、所定の周波数範囲のデータを抽出する処理を含み、
前記所定の周波数範囲は、前記教師データにおいて、物性値との相関係数が閾値以上の周波数である、
ポリマー物性推定装置。
【請求項2】
前記前処理は、前記NMRスペクトルデータから、教師データのNMRスペクトルデータの平均値を減算する処理を含む、
請求項
1に記載のポリマー物性推定装置。
【請求項3】
前記前処理は、前記NMRスペクトルデータの二次微分を求める処理を含む、
請求項
1または
2に記載のポリマー物性推定装置。
【請求項4】
前記NMRスペクトルデータは、無回転の固体NMR測定により得られる異方性スペクトルデータである、
請求項1から
3のいずれか1項に記載のポリマー物性推定装置。
【請求項5】
前記学習モデルは、前記ポリマー試料の、前記推定手段が推定する物性値とは異なる第2の物性値も教師データとして、機械学習されている、
請求項1から
4のいずれか1項に記載のポリマー物性推定装置。
【請求項6】
ポリマー試料のNMRスペクトルデータと、前記ポリマー試料の物性値とを取得する取得手段と、
前記NMRスペクトルデータに前処理を施す前処理手段と、
前記
前処理後のNMRスペクトルデータと前記物性値とを教師データとして機械学習をして、NMRスペクトルデータから物性値を推定する学習モデルを学習する学習手段と、
を備え
、
前記前処理は、前記NMRスペクトルデータから、所定の周波数範囲のデータを抽出する処理を含み、
前記所定の周波数範囲は、前記教師データにおいて、物性値との相関係数が閾値以上の周波数である、
学習装置。
【請求項7】
前記前処理は、前記NMRスペクトルデータから、前記取得手段によって取得されたNMRスペクトルデータの平均値を減算する処理を含む、
請求項
6に記載の学習装置。
【請求項8】
前記前処理は、前記NMRスペクトルデータの二次微分を求める処理を含む、
請求項
6または
7に記載の学習装置。
【請求項9】
前記NMRスペクトルデータは、無回転の固体NMR測定により得られる異方性スペクトルデータである、
請求項
6から
8のいずれか1項に記載の学習装置。
【請求項10】
前記取得手段は、前記ポリマー試料の、前記学習モデルが推定する物性値とは異なる第2の物性値も取得し、
前記学習手段は、前記
前処理後のNMRスペクトルデータと前記物性値と前記第2の物性値とを教師データとして機械学習をして、前記学習モデルを学習する、
請求項
6から
9のいずれか1項に記載の学習装置。
【請求項11】
コンピュータによって実行されるポリマー物性推定方法であって、
ポリマー試料のNMRスペクトルデータを取得する取得ステップと、
前記NMRスペクトルデータに前処理を施す前処理ステップと、
物性値が既知のポリマー試料のNMRスペクトルデータに基づくデータと前記物性値とを教師データとした機械学習によりあらかじめ生成された、学習モデル
に前記前処理後のNMRスペクトルデータを入力することにより、前記ポリマー試料の物性値を推定する推定ステップと、
を含
み、
前記前処理は、前記NMRスペクトルデータから、所定の周波数範囲のデータを抽出する処理を含み、
前記所定の周波数範囲は、前記教師データにおいて、物性値との相関係数が閾値以上の周波数である、
ポリマー物性推定方法。
【請求項12】
コンピュータによって実行される学習モデルの学習方法であって、
ポリマー試料のNMRスペクトルデータと、前記ポリマー試料の物性値とを取得する取得ステップと、
前記NMRスペクトルデータに前処理を施す前処理ステップと、
前記
前処理後のNMRスペクトルデータと前記物性値とを教師データとして機械学習をして、NMRスペクトルデータから物性値を推定する学習モデルを学習する学習ステップと、
を含
み、
前記前処理は、前記NMRスペクトルデータから、所定の周波数範囲のデータを抽出する処理を含み、
前記所定の周波数範囲は、前記教師データにおいて、物性値との相関係数が閾値以上の周波数である、
学習方法。
【請求項13】
コンピュータによって実行される学習モデルの作成方法であって、
ポリマー試料のNMRスペクトルデータと、前記ポリマー試料の物性値とを取得する取得ステップと、
前記NMRスペクトルデータに前処理を施す前処理ステップと、
前記
前処理後のNMRスペクトルデータと前記物性値とを教師データとして機械学習をして、NMRスペクトルデータから物性値を推定する学習モデルを学習する学習ステップと、
を含
み、
前記前処理は、前記NMRスペクトルデータから、所定の周波数範囲のデータを抽出する処理を含み、
前記所定の周波数範囲は、前記教師データにおいて、物性値との相関係数が閾値以上の周波数である、
学習モデルの作成方法。
【請求項14】
請求項
11から
13のいずれか1項に記載された方法の各ステップをコンピュータに実行させるためのプログラム。
【請求項15】
物性値が既知のポリマー試料のNMRスペクトルデータ
に前処理を施した前処理後のNMRスペクトルデータと物性値とを教師データとして機械学習されたものであり、推定対象のポリマー試料のNMRスペクトルデータを入力データとして、前記推定対象のポリマー試料の物性値を推定するよう、コンピュータを機能させるための学習済みモデル
であって、
前記前処理は、前記NMRスペクトルデータから、所定の周波数範囲のデータを抽出する処理を含み、
前記所定の周波数範囲は、前記教師データにおいて、物性値との相関係数が閾値以上の周波数である、
学習済みモデル。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ポリマー試料の物性を推定する技術に関する。
【背景技術】
【0002】
ポリマー試料の物性を簡単に推定する技術が求められている。
【0003】
従来、化学物性値の予測は、化学構造を表すSMILES記法等からRDKitやMordred等により算出した記述子(例えば、QSARデータ、分子フィンガープリント)を介して実現されている。例えば、SMILES記法を学習させてCCS(衝突断面積)を予測する方法が報告されてい
る(非特許文献1)。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第2018/220368号
【文献】国際公開第2019/048965号
【非特許文献】
【0005】
【文献】Plante, Pier-Luc, et al. "Predicting Ion Mobility Collision Cross-Sections Using a Deep Neural Network: DeepCCS." Analytical chemistry 91.8 (2019): 5191-5199.
【発明の概要】
【発明が解決しようとする課題】
【0006】
しかしながら、SMILES記法等から記述子を求めることは手間がかかる。また、ポリマー開発においては、設計時に添加剤を含めることが通常であるが、上記の方法では入力情報は化学物質そのものだけであり、添加剤を考慮に入れた物性予測は行えない。また、共重合ポリマーのモノマー比率の相違による物性の違いや、ポリマーの経年劣化に伴う物性の違いを予測することは困難である。
【0007】
本発明は、簡易な作業によってポリマー試料の物性を精度良く予測できる技術を提供することを目的とする。
【課題を解決するための手段】
【0008】
上記の課題を解決するために、本発明はポリマー試料のNMRスペクトルデータを用いて、ポリマー試料の物性を予測する。
【0009】
より具体的には、本発明の第一の態様に係るポリマー物性推定装置は、
ポリマー試料のNMRスペクトルデータを取得する取得手段と、
物性値が既知のポリマー試料のNMRスペクトルデータに基づくデータと前記物性値とを教師データとした機械学習によりあらかじめ生成された、学習モデルと、
前記学習モデルを用いて、前記ポリマー試料の物性値を推定する推定手段と、
を備える。
【0010】
また、本発明の他の態様は上述の学習モデルを学習する学習装置であり、
ポリマー試料のNMRスペクトルデータと、前記ポリマー試料の物性値とを取得する取得手段と、
前記NMRスペクトルデータと前記物性値とを教師データとして機械学習をして、NM
Rスペクトルデータから物性値を推定する学習モデルを学習する学習手段と、
を備える。
【0011】
ポリマー試料のNMRスペクトルデータは簡易に取得可能であり、また、NMRスペクトルデータには添加剤の情報も含まれる。したがって、本発明によれば、添加剤を含むポリマー試料の物性を簡易にかつ精度良く推定することができる。
【0012】
本発明において、推定精度を向上させるために、NMRスペクトルデータに前処理を施し、前処理後のデータを学習モデルの入力として用いてもよい。
【0013】
前処理の第1の例は、NMRスペクトルデータから所定の周波数範囲内のデータを所定の周波数間隔で抽出する処理である。
【0014】
前処理の第2の例は、NMRスペクトルデータから、教師データとして使用する平均NMRスペクトルデータを減算する処理である。
【0015】
前処理の第3の例は、NMRスペクトルデータの二次微分を求める処理である。
【0016】
前処理の第4の例は、NMRスペクトルデータから物性値(目的変数)との相関が高い周波数範囲のデータを抽出する処理である。
【0017】
これらの前処理は、1つ以上を適宜組み合わせて使用することができる。また、複数の前処理により得られるデータを組み合わせて説明変数として使用することもできる。
【0018】
このような前処理により、物性値の予測精度向上、およびデータ数の削減に伴う学習速度の向上が図られる。
【0019】
本発明はまた、上記方法をコンピュータに実行させるためのプログラムとして捉えることができる。本発明はまた、上記方法を行うための学習済モデルとして捉えることができる。本発明はまた、当該プログラムまたは学習済モデルを記憶したコンピュータ可読記憶媒体として捉えることもできる。
【発明の効果】
【0020】
本発明によれば、簡易な作業によってポリマー試料の物性を精度良く予測できる。
【図面の簡単な説明】
【0021】
【
図1】本実施形態における学習装置および物性推定装置の機能ブロック図である。
【
図2】教師データである、NMRスペクトルデータ(説明変数)、融点およびガラス転移点(目的変数)の例を示す図である。
【
図7】第1の実施形態による学習モデルの評価結果を示す図である。
【
図8】第2の実施形態による学習モデルの評価結果を示す図である。
【発明を実施するための形態】
【0022】
以下では、図面を参照しながら、この発明を実施するための形態を説明するが、本発明はこれに限定されない。以下で説明する各実施形態の構成要素は、適宜組み合わせることができる。
【0023】
本発明の実施形態は、ポリマー試料の物性を推定するための学習モデルを学習する学習装置、およびこの学習モデルを用いたポリマー物性推定装置である。
【0024】
本実施形態において物性推定の対象とするポリマー試料は、特定のポリマー(高分子)に限られない。ポリマーは、典型的には分子量10000以上(重合度100以上)であるが、本開示においては分子量10000以下(重合度2~100)も含まれ、いわゆるオリゴマーも含まれる。また、本開示において、ポリマーはホモポリマー、コポリマー(共重合体)の別は問わない。ポリマーの一例として、ポリエチレン(PE)、ポリプロピレン(PP)、ポリエチレンテレフタレート(PET)、ポリスチレン(PS)、ABS樹脂、ポリ塩化ビニル(PVC)、ポリメタクリル酸メチル(PMMA)、ポリカーボネート(PC)、ポリアミド(PA)、ポリブチレンテレフタレート(PBT)、ポリアセタール(POM)、ポリフェニレンエーテル(PPE)、ポリ乳酸(PLA)、ポリカプロラクトン(PCL)、ポリビニルアルコール(PVA)、ポリグリコール酸(PGA)、ポリエチレンサクシネート(PES)、ポリブチレンサクシネート(PBS)、ポリブチレンサクシネートアジペート(PBSA)、ポリブチレンアジペートテレフタレート(PBAT)、ポリエチレンテレフタレートサクシネート(PETS)、3-ヒドロキシブチレート・3-ヒドロキシヘキサノエート重合体(PHBH)などの熱可塑性樹脂(プラスチック)、およびフェノール樹脂、ユリア樹脂、メラミン樹脂、ポリイミド(PI)などの熱硬化性樹脂が含まれる。また、物性推定の対象とするポリマー試料は、純物質である必要はなく、任意の添加剤が添加されていてもよく、さらに、作成直後の新しい試料であっても、一定の期間経過後の劣化を伴った試料であってもよい。また、ポリマー試料が共重合ポリマーである場合、モノマー比率は任意であってよい。
【0025】
本実施形態において推定する物性(特性)は、任意の性質であってよく、機械的特性(力学的性質)、熱的特性、光学的特性、物理的特性、化学的特性、成形加工性、耐環境特性、電気的特性、分解特性などが挙げられる。特性の例(分解特性以外)には、融点、沸点、昇華温度、ガラス転移点、結晶化温度、融解熱、結晶熱、熱変形温度、連続耐熱温度、荷重たわみ温度、重量、密度、導電率、露出表面積、結晶化度、吸水率、水蒸気透過度、ガス透過度、線膨張係数、熱伝導率、破断強度、引張強度、引裂強度、硬度、衝撃強度、圧縮強度、曲げ強度、動的粘弾性、質量電荷比、キャリア移動度、屈折率、耐光性、耐酸性、耐アルカリ性、耐有機溶剤性、溶媒溶解性、絶縁破壊電圧が含まれる。なお、分解特性における分解の種類としては、生分解、光分解、熱分解、衝撃分解、加水分解、電気分解などが挙げられ、特に生分解には土壌(自然土、富栄養土、微生物含有土等)分解、コンポストでの分解、水系(海洋、河川、湖沼、池、地下水、土壌水、汚泥水、下水等)分解がある。なお、水系分解評価に使われる水には人工水も含む。分解特性の例としては、試験前後、または、試験前および試験中における崩壊度、重量減少度、露出表面積減少度、化学的酸素消費量の変化量、生物化学的酸素消費量の変化量、溶存有機炭素量の変化量、発生二酸化炭素量の変化量などが含まれ、さらに、上記分解特性以外の物性例で挙げた項目のうち、試験前後、または、試験前および試験中において数値に変化があるものも分解特性の指標例に含まれる。これらの物性や指標の試験法は、原則的には、ISO、ASTM、JISなどの規格に基づく手法を採用するが、一定の基準を明示した上で独自の試験法により数値を示すことも可能である。特に分解性評価についての試験法は、所定時間経過後の1点の数値、または、経時的に複数時における数値を取得する手法が採用される。左記分解法としては、陸圏(例えば、湿地、乾燥地、森林、山岳地、土壌中、空気中など)や水圏(例えば、河川、湖沼、海洋など)などの自然界の環境下、または、実験室内での疑似的・人為的な環境下へ放置・設置の他、マイクロ波、紫外線等の光照射下、酸性またはアルカリ性下、高温下または低温下、高塩下、高圧下、物理的衝撃負荷下、有機溶媒下、コンポスト下、富栄養水または富栄養土下、微生物含有水または微生物含有土下などの人為的な環境下への放置・設置があり、また、これらを組み合わせた環境下への放
置・設置も可能である。なお、上記試験法は、分解態様の違いにより分解種を想定しており、例えば、海洋水を利用した場合などの海洋中での分解を想定した試験が海洋生分解様評価、土壌を利用した場合などの土壌中での分解を想定した試験が土壌生分解様評価、紫外線等を利用した場合などの光照射下での分解を想定した試験が光分解様評価などとなる。また、これらの評価系は開放系、閉鎖系の両者とも想定される。また、分解促進剤等を添加した等の特定の手法により分解速度を調整した試験も想定される。
【0026】
[第1の実施形態]
図1(A)は本実施形態に係る学習装置10の機能構成を示し、
図1(B)は本実施形態に係る物性推定装置20の機能構成を示す。学習装置10および物性推定装置20は、いずれも、演算プロセッサ、記憶装置、入力装置、出力装置、通信装置等を含むコンピュータ(情報処理装置)であり、演算プロセッサがプログラムを実行することによってこれらの機能が実現される。
【0027】
学習装置10の演算プロセッサがプログラムを実行することにより、データ取得部11、前処理部12、学習部13の機能が実現され、学習モデル14の学習が行われる。同様に、物性推定装置20の演算プロセッサがプログラムを実行することにより、データ取得部21、前処理部22、推定部23の機能が実現され、学習装置10によって学習された学習モデル14を用いて物性値の推定を行う。
【0028】
<学習装置>
まず、学習装置10が行う学習モデル14の学習方法について説明する。学習処理では、データ取得部11による教師データの取得処理、前処理部12による教師データの前処理、および、学習部13による学習処理がこの順番で実行される。
【0029】
データ取得部11は、教師データ15として、物性値が既知の複数のポリマー試料のNMRスペクトルデータを取得する。言い換えると、教師データ15は、複数のポリマー試料に関するNMRスペクトルデータと、その物性値データとを含む。なお、物性値が既知であるというのは、学習処理を行うまでに物性値が判明しているという意味であり、NMR測定の段階では物性値が不明であっても、その後に測定等により物性値が判明していればよい。
【0030】
本実施形態においては、NMRスペクトルデータとして、固体NMR測定によりポリマー試料を無回転で測定したデータを採用する。なお、回転系であるMAS(Magic Angle Spinning) NMRで測定したデータを利用してもよい。無回転の固体NMR測定であるので、広
幅の異方性スペクトルデータが得られる。
図2(A)に示されるグラフ201は、73種類のポリマー試料(約100mg)を無回転の固体NMR(500MHz)で測定したスペクトルデータ(化学シフト値)を重ねて表示したグラフである。
【0031】
ここでは、無回転の固体NMR測定により得られるスペクトルデータを扱うが、マジック角回転を行う固体NMR測定あるいは溶液NMR測定により得られるスペクトルデータを採用しても構わない。
【0032】
なお、学習処理のために新しくNMR測定を行ってもよいし、過去に自らあるいは他人が行ったNMR測定によって取得済みのNMRスペクトルデータを教師データとして利用してもよい。
【0033】
物性値データは上述のように特に限定されないが、ここでは融点(Tm)およびガラス転移点(Tg)を例に説明する。
図2(B)のグラフ202および
図2(C)のグラフ203は、上記73種類のポリマー試料の融点およびガラス転移点を示す。物性値データと
して、実験による測定データ(実測値)を用いてもよいし、当該試料の物性値として知られている公知の値を用いてもよい。
【0034】
データ取得部11は、本実施形態では、教師データ15を数値データとして取得してもよいが、その他の形式で教師データ15の入力を受け付けてもよい。例えば、データ取得部11は、ポリマー試料のNMRスペクトルデータをグラフ表示した画像データを取得し、この画像データを解析して各周波数におけるシグナル強度を読み取ってもよい。データ取得部11は、グラフの軸に付されたラベルを文字認識することにより、グラフ内における各位置の周波数(化学シフト値)およびシグナル強度を把握できる。物性値データについても同様に、画像データを元に数値を読み取ってもよい。
【0035】
前処理部12は、教師データ15に対して前処理を施す。前処理には、型変換、欠損値処理(除去、補間)、スケーリングのような機械学習において一般的に行われる処理が含まれる。以下では、本実施形態において特有の前処理を説明する。なお、以下の4つの前処理はいずれか1つのみを行ってもよいし、4つのうちの任意の2つまたは3つを行ってもよいし、4つ全部行ってもよい。なお、これ以降は特に断らない限り、「前処理」とは以下の4つの前処理(第1~第4の前処理)のいずれかを指すものとする。
【0036】
第1の前処理は、NMRスペクトルデータの領域限定および離散化である。
図2(A)に示すように、NMR測定により得られるスペクトルデータは、例えば、200~-200kHzの範囲についての5Hz間隔のデータであるが、前処理部12は、これを125~-125kHzの領域に限定し、かつ0.5kHz間隔に離散化する。ここでは、125~-125kHzの領域に限定しているが、どのような領域に限定するかは適宜決定すればよい。
図3(A)は、1つのサンプルについての第1の前処理後のスペクトルデータを示し、
図3(B)は、第1の前処理後のデータを行列化して表現している。本実施形態では125~-125kHzを0.5kHz間隔で離散化しているので、1つの試料あたり500個のデータポイントに削減される。なお、
図3(B)における「P001」等はポリマー試料のIDを示す。
【0037】
第2の前処理は、取得したNMRスペクトルデータから、教師データのNMRスペクトルの平均値(平均スペクトル)を減算する処理である。
図4のグラフ401は、全てのポリマー試料のNMRスペクトルデータを重畳したグラフである。前処理部12は、全てのNMRスペクトルデータの平均を取った平均スペクトル402を求め、それぞれのポリマー試料のNMRスペクトルデータから平均スペクトルデータを減算した値(差分)を求める。
【0038】
本実施形態では、第2の前処理は第1の前処理と組み合わせて行う。すなわち、前処理部12は、第1の前処理後のデータに対して第2の前処理を施す。しかしながら、第2の前処理を第1の前処理と組み合わせなくてもよい。
【0039】
第3の前処理は、NMRスペクトルデータから二次微分を求める処理である。前処理部12は、
図5に示すNMRスペクトルデータ501の二次微分502を求める。
【0040】
本実施形態では、第3の前処理は第1の前処理と組み合わせて行う。すなわち、前処理部12は、第1の前処理後のデータに対して第3の前処理を施す。しかしながら、第3の前処理を第1の前処理と組み合わせなくてもよいし、また、第2の前処理と組み合わせてもよい。言い換えると、前処理部12は、第1の前処理後のデータ、第1の前処理および第2の前処理後のデータ、前処理なしのデータのいずれに対して第3の前処理を行ってもよい。
【0041】
第4の前処理は、物性値との相関係数が閾値以上の周波数領域を抽出する処理である。前処理部12は、
図6に示すように、NMRスペクトルデータのそれぞれの周波数のデータについて、物性値データ(目的変数)との相関係数を算出する(符号610)。
図6(B)のグラフ620は、算出された相関係数を示す。ここでは、相関係数の閾値として0.6を採用し、前処理部12は、相関係数の絶対値が0.6以上である周波数領域621,622のデータを抽出する。相関係数の閾値は0.6に限られず任意の値であって構わない。第4の前処理は、NMRスペクトルデータから所定の周波数範囲のデータを抽出するという点では第1の前処理と共通するが、抽出対象の周波数範囲の決定が相関係数に基づくという点で異なる。
【0042】
相関係数は、線形的な関係を評価する指標に限定されず、非線形的な関係を評価する指標を用いてもよい。線形的な関係を評価する指標の代表例として、ピアソン積率相関係数が挙げられる。非線形的な関係を評価する指標の代表例として、MIC(Maximal Information Coefficient)が挙げられる。
【0043】
本実施形態では、第4の前処理は第1の前処理と組み合わせて行う。すなわち、前処理部12は、第1の前処理後のデータに対して第4の前処理を施す。しかしながら、第4の前処理は、前処理なしのデータに対して行ってもよく、第1の前処理後のデータに対して行ってもよい。また、第4の前処理は、第2の前処理あるいは第3の前処理後のデータに対して行ってもよい。
【0044】
学習部13は、前処理部12による前処理後の教師データを用いて、学習モデル14の学習処理を行う。学習モデル14は、NMRスペクトルデータから物性値を回帰により推定する推定エンジンである。学習モデル14の学習アルゴリズムとして、ランダムフォレストなどのような決定木分析法、glmbооst(Generalized Linear Model Boosting)のようなブースティングアルゴリズム、XGBооst(Extreme Gradient Boosting)のようなブースティングアルゴリズム(特に勾配ブースティング)に決定木分析などを取り入れたGBDT(Gradient Boosting Decision Tree)、その他、サポート・ベクタ
ー・マシン(SVM)、ニューラルネットワーク、ディープニューラルネットワークなどの回帰分析法が採用可能である。また、これらの学習アルゴリズムの複数を組み合わせて一つの学習モデルを作成するアンサンブル学習も可能である。
【0045】
学習部13は、説明変数として、いずれかの前処理後のNMRスペクトルデータを使用する。ただし、複数の前処理から得られるデータを組み合わせて説明変数として使用してもよい。例えば、第2の前処理後のデータと第3の前処理後のデータを組み合わせて説明変数として使用してもよい。
【0046】
学習部13による学習処理の結果、ポリマー試料のNMRスペクトルデータを入力として受け付け、このポリマー試料の物性値を推定する学習モデル14が生成される。
【0047】
<物性推定装置>
次に、物性推定装置20が行うポリマー試料の物性値の推定処理について説明する。物性値推定処理では、データ取得部21によるポリマー試料のNMRスペクトルデータの取得処理、前処理部22による前処理、および、推定部23による推定処理がこの順番で実行される。
【0048】
データ取得部21は、物性を推定する対象のポリマー試料のNMRスペクトルデータを取得する。取得するNMRスペクトルデータは、教師データにおけるNMRスペクトルデータと同様のNMR測定により得られる測定データである。もっとも、物性推定のために新規にNMR測定を行う必要はなく、過去に自らあるいは他人が行ったNMR測定によっ
て取得済みのNMRスペクトルデータを入力データとして取得してもよい。本実施形態では、NMRスペクトルデータは、無回転の固体NMR測定により得られる異方性スペクトルデータである。
【0049】
データ取得部21は、NMRスペクトルデータを数値データとして取得してもよいし、NMRスペクトルデータをグラフ表示した画像データを取得し、この画像データを解析して各周波数におけるシグナル強度を読み取ってもよい。
【0050】
前処理部22は、データ取得部21が取得したNMRスペクトルデータに対して前処理を施す。前処理部22が行う前処理は、学習装置10の前処理部12が行う処理と同じである。したがって繰り返しの説明は省略する。
【0051】
推定部23は、学習モデル14を用いて、前処理後のNMRスペクトルデータからポリマー試料の物性値を推定する。学習モデル14は、学習装置10によってあらかじめ生成された学習モデルである。推定部23は、前処理後のNMRスペクトルデータを学習モデル14に入力し、その結果として得られる学習モデル14の出力から、ポリマー試料の物性値を推定する。
【0052】
<解析例>
73種類のポリマー試料について、NMRスペクトルデータ(
図2(A))、融点(
図2(B))、ガラス転移点(
図2(C))を取得し、NMRスペクトルデータを説明変数、融点およびガラス転移点を目的変数として、機械学習を行った。この際、学習モデル14の学習アルゴリズムとして、ランダムフォレストを採用した。
【0053】
図7(A)~
図7(E)は、前処理の違いによる学習モデル14の融点Tmの予測精度を示す図である。
図7(A)は前処理なしの場合の精度、
図7(B)~7(E)はそれぞれ第1~第4の前処理を施した場合の精度を示す。
【0054】
図7(A)~
図7(E)に示すように、前処理なしの場合は二乗平均平方根誤差(RMSE)が28.72であるのに対して、第1~第4の前処理を施すことによりRMSEがそれぞれ23.13, 23.31, 22.25, 25.04に改善する。
【0055】
同様に、学習モデル14によるガラス転移点Tg予測のRMSEは、前処理なしで45.29で
あるのに対し、第1~第4の前処理を施すことによりそれぞれ34.55, 34.83, 37.21, 33.78に改善した。
【0056】
<本実施形態の有利な効果>
本実施形態によれば、無回転の固体NMRスペクトルデータからポリマー試料の物性値を推定することができる。このようなNMRスペクトルデータは容易かつ短時間で取得可能であるため、物性推定のために過度な手間がかからない。また、本実施形態によれば、ポリマー試料が添加剤を含んでいてもその物性を推定することができる。さらに、上述の前処理により、物性値の予測精度が向上する。また、前処理により説明変数のデータ数を削減できることから、学習処理を短時間で完了できる。
【0057】
<変形例>
上記の説明では、いずれかの前処理後のデータを用いて学習処理を行っているが、複数の前処理後のデータを組み合わせて使用してもよい。例えば、第2の前処理後のデータ(平均スペクトルとの差分)と第3の前処理後のデータ(二次微分)を組み合わせて説明変数として使用してもよい。
【0058】
また、上記の実施形態では、無回転の固体NMR測定により得られるスペクトルデータを使用しているが、マジック角回転を施した固体NMR測定あるいは溶液NMR測定により得られるNMRスペクトルデータを説明変数として用いてもよい。
【0059】
また、前処理の1つとして、NMRスペクトルデータに対して、波形分離処理(ピークフィッティング処理)を施してもよい。波形分離処理は、NMRスペクトルデータから、誤差が最も小さくなるようにピーク形状を求める処理である。代表的なピーク形状関数として、ガウス関数、ローレンツ関数、ガウス・ローレンツ混合関数が挙げられる。
【0060】
[第2の実施形態]
本実施形態では、ポリマー試料の生分解性特性を推定する。生分解性の例として、崩壊度、重量減少度、露出表面積減少度、化学的酸素消費量(COD)の変化量、生物化学的酸素消費量(BOD)の変化量、溶存有機炭素量の変化量、発生二酸化炭素量の変化量などが含まれる。生分解性に関わるさらなる指標例としては、pH、平均分子量、屈折率、密度、露出表面積、結晶化度、微生物量、代謝物量、濁度などが含まれる。なお、生分解性評価試験の前後において数値に変化があるその他の物性も分解特性の指標例に含まれる。
【0061】
生分解の分解環境は特に限定されず、海水あるいは淡水などの水系環境でもよいし、土壌環境やコンポストでもよい。本実施形態では、ポリマー試料の海水中での生分解特性を予測する。そこで、ポリマー試料を用意して人為的環境に設置し、一定時間(例えば1日、1週間、1ヶ月など)経過後にポリマー試料を取り出して測定を行う。評価試験におけるポリマー試料の形態は特に限定されず、例えば、プレート状、フィルム状、パウダー状の試料を採用できる。測定対象の生分解特性を表すデータは、上述のように任意のものであってよいが、例えば、生物化学的酸素要求量(BOD)、理論的酸素要求量(ThOD)、重量変化率、崩壊率などを含む。本実施形態では、次式で表される生分解度を測定対象とする。
【数1】
【0062】
また、上記の評価試験開始時のNMRスペクトルデータも取得する。NMRスペクトルデータは、無回転固体NMR測定で得られる異方性スペクトルデータを使用してもよいし、第1の実施形態で説明したその他の測定により得られるスペクトルデータを用いてもよい。
【0063】
このようにして測定した測定データを教師データとして、NMRスペクトルデータから所定時間経過後の生分解度を予測するための学習モデル14の学習を行う。学習装置10の構成(
図1A)や学習処理は第1の実施形態と同様である。また、学習の前処理として、第1の実施形態で説明した第1から第4の前処理の一部または全てを採用してもよい。
【0064】
なお、複数の時点で生分解度(あるいはその他の分解特性を表すデータ)を測定して、学習データとして用いてもよい。例えば、1日おきに7日間の生分解度を測定して学習データとして用いれば、NMRスペクトルデータから1日経過ごとの生分解度を予測する学習モデルが得られる。ここでは測定間隔(予測間隔と等しい)を1日おきとしているが、その他の間隔であってよく、また、間隔は等間隔でなくても構わない。複数時点の測定デ
ータを扱う場合は、学習モデル14の学習にRNN(Recurrent Neural Network)として、simple RNN、LTSM(Long-Short Term Memory)、GRU(Gated Recurrent Unit)などのアルゴリズムを用いて学習をしてもよい。
【0065】
物性推定装置20は、このようにして学習された学習モデル14を用いて、生分解性特性を推定する対象のポリマー試料のNMRスペクトルデータから所定期間経過後の生分解性特性(例えば、上述の生分解度)を推定する。物性推定装置20の構成および処理内容は第1の実施形態と同様であるため繰り返しの説明は省略する。
【0066】
図8(A)は、PBS,PBSA,PHBH,PLAの4種類の材料について、上述の学習モデルの生成を行い、試験開始前のNMRスペクトルデータ(異方性スペクトルデータ)から1週間後の生分解度を予測した結果を示す図である。なお、この実験では、前処理として第1から第4の前処理のうち第1の前処理のみ実施している。予測精度は、決定係数(R
2)が0.72であり、2乗平均平方根誤差(RMSE)が0.74であり精度の良い予測が行えていることが分かる。また、
図8(B)はNMRデータの化学シフト値ごとの重要度(Gini係数)を示している。
【0067】
[変型例]
上記の実施形態では、説明変数はNMRスペクトルデータのみであったが、説明変数として目的変数に含まれない種類の物性値(第2の物性値)を採用してもよい。例えば、生分解性特性の推測においては、NMRスペクトルデータの他に、露出表面積や密度のような目的変数としていない生分解性特性の指標値を説明変数として加えて学習すると、予測精度が向上すると考えられる。この場合、物性推定処理においては、推定対象のポリマー試料のNMRスペクトルデータに加えて第2の物性値も取得して、これらのデータを推定部23(学習モデル14)に入力して、ポリマー試料の物性値を推定する。なお、第2の物性値の種類は特に限定されず、生分解特性以外のその他の任意の物性であってよい。
【符号の説明】
【0068】
10:学習装置 11:データ取得部 12:前処理部 13:学習部
14:学習モデル
20:物性推定装置 21:データ取得部 22:前処理部 23:推定部