IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 日立マクセル株式会社の特許一覧

特開2025-21833共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置
<>
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図1
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図2A
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図2B
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図3
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図4
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図5
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図6
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図7
  • 特開-共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2025021833
(43)【公開日】2025-02-14
(54)【発明の名称】共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置
(51)【国際特許分類】
   G01N 30/88 20060101AFI20250206BHJP
   G01N 24/00 20060101ALI20250206BHJP
   G01N 30/86 20060101ALI20250206BHJP
【FI】
G01N30/88 P
G01N24/00 530K
G01N30/86 R
【審査請求】未請求
【請求項の数】10
【出願形態】OL
(21)【出願番号】P 2023125831
(22)【出願日】2023-08-01
(71)【出願人】
【識別番号】000005810
【氏名又は名称】マクセル株式会社
(74)【代理人】
【識別番号】100104444
【弁理士】
【氏名又は名称】上羽 秀敏
(74)【代理人】
【識別番号】100174285
【弁理士】
【氏名又は名称】小宮山 聰
(72)【発明者】
【氏名】篠本 さやか
(72)【発明者】
【氏名】孫 吟
(72)【発明者】
【氏名】岸見 裕子
(57)【要約】
【課題】クロマトグラムから共重合体の所定の配列情報を得ることができる分析方法を提供する。
【解決手段】本発明の一実施形態による共重合体の分析方法は、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析方法であって、クロマトグラムから前記共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから前記分析対象の共重合体の前記共重合性指数を推定する工程を備える。
【選択図】図3
【特許請求の範囲】
【請求項1】
2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析方法であって、
クロマトグラムから前記共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから前記分析対象の共重合体の前記共重合性指数を推定する工程を備える、共重合体の分析方法。
【請求項2】
前記学習済みモデルは、複数の共重合体について、共重合体のクロマトグラフを説明変数、核磁気共鳴のスペクトルから算出された前記共重合性指数を目的変数とする教師データを用いて、機械学習によって生成されたものである、請求項1に記載の共重合体の分析方法。
【請求項3】
前記核磁気共鳴は、H-NMR、13C-NMR、19F-NMR又は31P-NMRである、請求項2に記載の共重合体の分析方法。
【請求項4】
前記共重合体は、第1の繰返し単位と、第2の繰返し単位とを含み、
前記共重合性指数は、下記の式で表される、請求項1に記載の共重合体の分析方法。
共重合性指数=(第1の繰返し単位と第2の繰返し単位との結合の数)/{(第1の繰返し単位と第2の繰返し単位との結合の数)+(第1の繰返し単位と第1の繰返し単位との結合の数)}
【請求項5】
前記共重合体は、ランダム共重合体、交互共重合体、ブロック共重合体又はグラフト共重合体である、請求項1に記載の共重合体の分析方法。
【請求項6】
前記クロマトグラムは、液体クロマトグラフによって測定されたものであり、
前記液体クロマトグラフは、検出器として、UV/VIS検出器、質量分析器、蛍光検出器、示差屈折率検出器、電気伝導度検出器、電気化学検出器、蒸発光散乱検出器及びコロナ荷電粒子検出器からなる群から選択される1種又は2種以上を含む、請求項1に記載の共重合体の分析方法。
【請求項7】
前記クロマトグラムは、ガスクロマトグラフによって測定されたものであり、
前記ガスクロマトグラフは、検出器として、質量分析器、水素炎イオン化検出器、熱伝導度検出器、バリア放電イオン化検出器、電子捕捉検出器、熱イオン化検出器、炎光光度検出器及び化学発光硫黄検出器からなる群から選択される1種又は2種以上を含む、請求項1に記載の共重合体の分析方法。
【請求項8】
2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析プログラムであって、
クロマトグラムから前記共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから前記分析対象の共重合体の前記共重合性指数を推定する工程をコンピュータに実行させる、共重合体の分析プログラム。
【請求項9】
2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析装置であって、
クロマトグラムから前記共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから前記分析対象の共重合体の前記共重合性指数を推定する推定装置を備える、共重合体の分析装置。
【請求項10】
共重合体のクロマトグラムを説明変数、核磁気共鳴のスペクトルから算出された前記共重合性指数を目的変数とする教師データを用いて、前記学習済みモデルを機械学習によって生成するモデル生成装置をさらに備える、請求項9に記載の共重合体の分析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、共重合体の分析方法、共重合体の分析プログラム及び共重合体の分析装置に関する。
【背景技術】
【0002】
特開2022-13303号公報には、高分子原材料の実測された一次元スペクトル情報から、当該高分子原材料の構造及び組成を予測するデータ解析装置及び解析方法が開示されている。同公報には、予測する構造情報の例として、ジエン系ゴムにおけるシス、トランス、ビニル、スチレンの割合、ダイアッド連鎖及びトリアッド連鎖が挙げられている。同公報にはまた、予測する組成情報の例として、ブタジエンの量とスチレンの量、質量平均分子量、粘度、分岐度及び分岐数が挙げられている。
【0003】
特開2022-13310号公報には、高分子原材料の構造情報から、当該高分子原材料の物性情報を予測するデータ解析装置及び解析方法が開示されている。同公報には、予測する物性情報の例として、弾性率、ポアソン比、粘性、ガラス転移温度及び結晶化温度が挙げられている。
【0004】
特開2004-233095号公報には、有機オリゴマーの分析方法が開示されている。この分析方法ではまず、分析値が既知の有機オリゴマーを液体クロマトグラム及び/又は超臨界流体クロマトグラムにより分析し、クロマトグラムの各ピークと既知の分析値に関し重回帰分析を行い、既知の分析値との相関性の高いピークを基に回帰係数を求め、回帰式を決定する。この結果を基に分析値が未知の有機オリゴマーを液体クロマトグラム及び/又は超臨界流体クロマトグラムにより分析し、回帰式から分析値を算出する。同公報には、分析項目の例として、エポキシ樹脂のエポキシ当量、粘度、軟化点、加水分解性塩素含有量、1,2-グリコール含有量及び全塩素含有量が挙げられている。
【0005】
特開2021-107813号公報には、ポリマー物性推定装置が開示されている。このポリマー物性推定装置は、機械学習によって生成された学習モデルを用いて、ポリマー試料のNMRスペクトルデータから物性値を推定する。同公報には、推定する物性値の例として、融点、沸点、昇華温度、ガラス転移点、結晶化温度等が挙げられている。
【0006】
特開2021-149449号公報には、所定の特性を有する物質の探索を行う物質探索装置が開示されている。この装置は、物質の合成条件、当該物質の特性の評価値及びスペクトルデータを含む実測情報に基づいて、より好適な特性を有する物質が示すスペクトル特性の予測範囲を特定し、このスペクトル特性の予測範囲を有する物質を最適化手法によって探索する。
【0007】
特開2021-76602号公報には、情報処理装置が開示されている。この情報処理装置は、被検物質を含む試料のスペクトル情報を学習モデルに入力することにより推定された定量的な情報を取得する情報取得手段と、取得された定量的な情報に関する寄与度を取得する寄与度取得手段とを有する。
【先行技術文献】
【特許文献】
【0008】
【特許文献1】特開2022-13303号公報
【特許文献2】特開2022-13310号公報
【特許文献3】特開2004-233095号公報
【特許文献4】特開2021-107813号公報
【特許文献5】特開2021-149449号公報
【特許文献6】特開2021-76602号公報
【発明の概要】
【発明が解決しようとする課題】
【0009】
本発明者らは、共重合体に含まれる繰返し単位の配列(並び方)に着目して、新規な特性を有する共重合体の開発に取り組んでいる。例えば、繰返し単位Aと繰返し単位Bとを含む共重合体では、繰返し単位Aと繰返し単位Bとの比率が一定であっても、並び方を変えることによって特性が変化する場合がある。具体的には、繰返し単位Aが連続したブロックと繰返し単位Bが連続したブロックとを有する共重合体(ブロック共重合体)と、繰返し単位Aと繰返し単位Bとが不規則に並んだ共重合体(ランダム共重合体)とでは、その特性が異なる場合がある。
【0010】
このような共重合体の配列の分析には一般的に、核磁気共鳴(NMR)が用いられる。液体クロマトグラフ質量分析(LC/MS)等の高速液体クロマトグラフ(HPLC)による分析も理論的には可能であるが、以下に説明する通り、幾つかの観点から現実的ではない。
【0011】
まず、HPLCで共重合体を定量的に分析するためには、各繰返し単位の純品又は構造が既知の共重合体を標準物質(リファレンス)として準備する必要がある。これは、HPLCの検出器の感度が物質によって大きく異なるためである。このようなリファレンスの入手は容易でない場合が多い。これに対しNMRでは、緩和時間等を適切に設定すれば物質によらず感度が一定になるので、リファレンスがなくても定量的な分析が可能である。またHPLCでは、分析対象がポリマーである場合、鎖長の異なる分子がそれぞれ別のピークとなるため、全体に多数のピークが重なり合ってピーク面積の確定が困難になる。これに対しNMRでは、ポリマーの鎖長によらず同じ部分構造のシグナルは1本になるため定量が比較的容易である。
【0012】
一方、NMRの測定装置はHPLCの測定装置に比べて高価である。NMRの測定装置を保有していない場合には外部機関に分析を委託することになるため、頻繁に利用することができない。
【0013】
本発明の課題は、クロマトグラムから共重合体の所定の配列情報を得ることができる分析方法、分析プログラム及び分析装置を提供することである。
【課題を解決するための手段】
【0014】
本発明の一実施形態による共重合体の分析方法は、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析方法であって、クロマトグラムから前記共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから前記分析対象の共重合体の前記共重合性指数を推定する工程を備える。
【0015】
本発明の一実施形態による共重合体の分析プログラムは、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析プログラムであって、クロマトグラムから前記共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから前記分析対象の共重合体の前記共重合性指数を推定する工程をコンピュータに実行させる。
【0016】
本発明の一実施形態による共重合体の分析装置は、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析装置であって、クロマトグラムから前記共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから前記分析対象の共重合体の前記共重合性指数を推定する推定装置を備える。
【発明の効果】
【0017】
本発明によれば、クロマトグラムから共重合体の所定の配列情報を得ることができる。
【図面の簡単な説明】
【0018】
図1図1は、乳酸単位LAとカプロラクトン単位CLとを含む共重合体の構造の一部を示す図である。
図2A図2Aは、乳酸単位LAとカプロラクトン単位CLとの結合の割合が比較的小さい共重合体のH-NMRスペクトルである。
図2B図2Bは、乳酸単位LAとカプロラクトン単位CLとの結合の割合が比較的大きい共重合体のH-NMRスペクトルである。
図3図3は、図2Aの試料のTICクロマトグラムである。
図4図4は、PLS-DAによって得られた共分散を横軸、相関係数を縦軸にプロットした散布図(S-Plot)である。
図5図5は、横軸にFα=Iα/(Iα+Iα)、縦軸にRT:6.58分、m/z:599.268のピークのピーク面積をプロットした散布図である。
図6図6は、非線形写像を模式的に示す図である。
図7図7は、実施例で測定したTICクロマトグラムである。
図8図8は、縦軸にFαの予測値、横軸にFαの真値(NMRスペクトルから算出した値)をプロットした散布図である。
【発明を実施するための形態】
【0019】
本発明者らは、共重合体をクロマトグラフで測定して得られるデータ(クロマトグラム)から、共重合体の所定の配列情報を得る方法を検討した。より具体的には、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率をクロマトグラムから推定する方法を検討した。
【0020】
共重合体の結合に関する情報の取得には、一般的には核磁気共鳴(NMR)が用いられる。図1は、乳酸単位LAとカプロラクトン単位CLとを含む共重合体の構造の一部を示す図である。図2Aは、乳酸単位LAとカプロラクトン単位CLとの結合の割合が比較的小さい共重合体(以下「試料1」という。)のH-NMRスペクトルである。図2Bは、乳酸単位LAとカプロラクトン単位CLとの結合の割合が比較的大きい共重合体(以下「試料2」という。)のH-NMRスペクトルである。このH-NMRスペクトルは、Bruker社製の核磁気共鳴装置(NMR)AVANCE III HD400MHzを用い、共重合体を重水素化クロロホルムに10mg/mlのように溶かして測定したものである。化学シフトの基準はTMS(テトラメチルシラン)を用いた。
【0021】
図1に示すように、カプロラクトン単位CLには、5つのメチレン基が存在する。これらのメチレン基を、エステル結合のカルボニル炭素に直接結合しているものから順にα位、β位、γ位、δ位及びε位のメチレン基と表記する。
【0022】
α位のメチレン基は、エステル結合のカルボニル炭素に結合したメチレン基である。ε位のメチレン基は、エステル結合の酸素に結合したメチレン基である。
【0023】
α位のメチレン基のプロトンに由来するシグナルは、当該メチレン基がエステル結合を介してカプロラクトン単位CLと結合している場合と、乳酸単位LAと結合している場合とで、異なる化学シフトに表れる。ここで、エステル結合のカルボニル炭素に結合したメチレン基であって、当該エステル結合を介して乳酸単位LAと結合しているメチレン基をα位のメチレン基と表記する。なお、当該エステル結合を介してカプロラクトン単位CLと結合しているメチレン基は上述の通りα位のメチレン基と表記する。図2A及び図2Bのα及びαのシグナルはそれぞれ、α位及びα位のメチレン基のプロトンに由来するシグナルである。具体的には、αのシグナルは、約2.30~2.35ppmに表れるのに対し、αのシグナルは、約2.35~2.50ppmに表れる。
【0024】
同様に、ε位のメチレン基のプロトンに由来するシグナルも、当該メチレン基がエステル結合を介してカプロラクトン単位CLと結合している場合と、乳酸単位LAと結合している場合とで、異なる化学シフトに表れる。図1には示していないが、エステル結合の酸素に結合したメチレン基であって、当該エステル結合を介して乳酸単位LAと結合しているメチレン基をε位のメチレン基と表記する。なお、当該エステル結合を介してカプロラクトン単位CLと結合しているメチレン基は上述の通りε位のメチレン基と表記する。図2A及び図2Bのε及びεのシグナルはそれぞれ、ε位及びε位のメチレン基のプロトンに起因するシグナルである。具体的には、εのシグナルは、約4.00~4.10ppmに表れるのに対し、εのシグナルは、約4.10~4.20ppmに表れる。
【0025】
ここで、Iα、Iα、Iε及びIεをそれぞれ、α、α、ε及びεのシグナルの積分強度とする。H-NMRのシグナルの積分強度は、プロトンの個数に比例する。そのため、Iα、Iα、Iε及びIεはそれぞれ、α位、α位、ε位及びε位のメチレン基のプロトンの個数に比例する量である。
【0026】
したがって、Iαは、カプロラクトン単位CLとカプロラクトン単位CLとの結合(以下「CL―CL結合」という。)の数に比例する量であり、Iαは、カプロラクトン単位CLと乳酸単位LAとの結合(以下「CL―LA結合」という。)の数に比例する量である。そのため例えば、Fα=Iα/(Iα+Iα)を、特定の繰返し単位間の結合(この例ではCL-LA結合)の比率の指標とすることができる。Fα=Iα/(Iα+Iα)は、CL―CL結合の数とCL-LA結合の数との和に対するCL-LA結合の数の比である。Fαに代えて、Fε=Iε/(Iε+Iε)を、特定の繰返し単位間の結合の比率の指標としてもよい。
【0027】
以下、この「特定の繰返し単位間の結合の比率の指標」を「共重合性指数」と呼ぶ。図2A及び図2Bに示すように、試料1(図2A)よりも試料2(図2B)の方が、αのシグナルが大きく、試料1よりも試料2の方がCL-LA結合の比率が高いことが分かる。このように、NMRのデータからは、共重合性指数を定量的に分析することができる。
【0028】
次に、同様の分析をクロマトグラムからできないかを検討した。すなわち、共重合性指数をクロマトグラムから算出できないかを検討した。
【0029】
図2A及び図2Bと同じ試料(試料1及び試料2)を液体クロマトグラフ質量分析(LC/MS)によって測定した。測定条件を表1に示す。試料は100倍重量のメタノールを加えて溶解し、0.2μmのフィルターでろ過したものをさらにメタノールで100倍希釈して使用した。
【0030】
【表1】
【0031】
図3は、試料1のトータル・イオン・カレント(TIC)クロマトグラムである。クロマトグラムでは、鎖長の異なる分子がそれぞれ別のピークとなる。また、例えば乳酸単位LAが2つとカプロラクトン単位CLが2つという組合せだけでも4通りの並び方(LA-LA-CL-CL、LA-CL-AL-CL、LA-CL-CL-LA及びCL-LA-LA-CL)があり、これらが別のピークとして表れ、それぞれαとαとの比率が異なる。NMRの場合と同様にFα=Iα/(Iα+Iα)を算出しようとする場合、この計算を全てのピークについてしなければならない。全てのピークを同定して強度の足し合わせをすることは、原理的には可能であるが、現実的には困難である。
【0032】
このように、共重合性指数をクロマトグラムから直接算出することは困難である。
【0033】
次に、試料1及び試料2の各々のTICクロマトグラムから各ピークのピーク面積を算出し、部分的最小二乗判別分析(PLS-DA)を行って、試料1を特徴付けるピーク、及び試料2を特徴付けるピークの探索を行った。図4は、PLS-DAによって得られた共分散を横軸、相関係数を縦軸にプロットした散布図(S-Plot)である。図4の領域A1にあるピーク群が試料1(CL-LA結合が少ない共重合体)と相関の高いピークであり、領域A2にあるピーク群が試料2(CL-LA結合が多い共重合体)と相関の高いピークである。表2に、領域A1及び領域A2に含まれるピーク群を示す。
【0034】
【表2】
【0035】
表2から、領域A1には、単一の繰返し単位からなるオリゴマーや、単一の繰返し単位からなるオリゴマーに一つ又は二つの別の繰返し単位が結合したものに由来するピークが多いことが分かる。一方、領域A2には、乳酸単位LAとカプロラクトン単位CLとが同じような数で結合したオリゴマーに由来するピークが多いことが分かる。このことから、繰返し単位の数の差が2以下である成分が、共重合性指数を特徴付けている可能性が示唆される。
【0036】
次に、条件を変えて製造した複数の共重合体に対してH-NMRスペクトルを測定してFαを求めた。これらの共重合体に対してTICクロマトグラムを測定し、RT:6.58分、m/z:599.268のピークのピーク面積を算出した。図5は、横軸にFα、縦軸に当該ピークのピーク面積をプロットした散布図である。図5に示すように、バラツキはあるもの、当該ピークのピーク面積とFαとにはある程度の相関が見られた。
【0037】
このように、クロマトグラムには、共重合性指数と統計的に相関のある情報が含まれている。本発明者らは、この事実から、クロマトグラムと共重合性指数とを機械学習の手法で関連付けることによって、クロマトグラムから共重合性指数を推定できるという着想を得た。
【0038】
本発明は、以上の知見に基づいて完成された。以下、本発明の実施の形態を詳しく説明する。なお、上述したRT:6.58分、m/z:599.268のピークのピーク面積とFαとの関係は、共重合性指数と相関のある情報がクロマトグラムに含まれていることの一例として示したものである。本発明は、クロマトグラムの特定のピークのピーク面積のみに基づいて共重合性指数を推定しようとするものではない。
【0039】
[共重合体の分析方法]
本発明の一実施形態による共重合体の分析方法は、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する方法である。本実施形態による分析方法は、クロマトグラムから共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから分析対象の共重合体の共重合性指数を推定する工程を備える。
【0040】
本実施形態で分析対象とする共重合体は、2種以上の繰返し単位を含む有機物のポリマー又はオリゴマーである。図1では、乳酸単位LAとカプロラクトン単位CLとを含む共重合体を例示したが、本実施形態で分析対象とする共重合体はこれに限定されない。本実施形態で分析対象とする共重合体は、ランダム共重合体、交互共重合体、ブロック共重合体又はグラフト共重合体であってもよい。
【0041】
本実施形態で分析対象とする共重合体は、好ましくは、数平均分子量Mnが50,000以下である。数平均分子量Mnが大きすぎると、クロマトグラムのピークの重なりが多くなりすぎて、推定の精度が低下する可能性がある。数平均分子量Mnは、より好ましくは30,000以下であり、さらに好ましくは10,000以下であり、さらに好ましくは5,000以下であり、さらに好ましくは1,000以下である。
【0042】
本実施形態による分析方法は、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する方法である。例えば、繰返し単位Aと繰返し単位Bとを含む共重合体には、繰返し単位Aと繰返し単位Aとの結合(A-A)、繰返し単位Aと繰返し単位Bとの結合(A-B)、及び繰返し単位Bと繰返し単位Bとの結合(B-B)の3種類の結合が存在する。このうちの任意の一つを「特定の繰返し単位間の結合」とすることができる。
【0043】
ここで、繰返し単位Aと繰返し単位Bとの結合(A-B)を「特定の繰り返し単位間の結合」とした場合、共重合性指数が大きいことは、共重合体中のA-B結合の割合が高いことを意味する。換言すれば、共重合性指数が大きいほど、繰返し単位Aと繰返し単位Bとの切り替わりが頻繁に起こっており、繰返し単位Aや繰返し単位Bが連続しているブロックの大きさが小さいことを意味する。
【0044】
分析対象の共重合体は、3種以上の繰返し単位を含むものであってもよい。例えば、3種の繰返し単位を含む共重合体には、6種類の結合が存在し得る。この場合も、6種類のなかの任意の一つを「特定の繰返し単位間の結合」とすることができる。
【0045】
共重合性指数は、上記のように選択された「特定の繰返し単位間の結合」の比率の指標である。共重合性指数は、厳密な意味での「比率」である必要はなく、相対的な比較ができるように正規化された「指標」であればよい。共重合性指数は例えば、共重合体が第1の繰返し単位と、第2の繰返し単位とを含む場合において、下記の式で表されるものであってもよい。
共重合性指数=(第1の繰返し単位と第2の繰返し単位との結合の数)/{(第1の繰返し単位と第2の繰返し単位との結合の数)+(第1の繰返し単位と第1の繰返し単位との結合の数)}
【0046】
上記は一例であって、例えば上記の式の分母を(全ての結合の数)にしたり、(第1の繰返し単位と第1の繰返し単位との結合の数)にしたりしてもよい。
【0047】
本実施形態による分析方法では、後述するように、機械学習によって生成した学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから分析対象の共重合体の共重合性指数を推定する。学習済みモデルを生成する段階では、共重合性指数の真の値を教師データとして入力する必要がある。共重合性指数は例えば、NMRのスペクトルから算出することができる。
【0048】
図2A及び図2Bでは、乳酸単位LAとカプロラクトン単位CLとを含む共重合体について、Fα=Iα/(Iα+Iα)を算出する場合を説明したが、他の共重合体についても、同様の手法で共重合性指数を求めることができる。例えば、(特定の繰返し単位間の結合に起因するシグナルの積分強度)/{(別の繰返し単位間の結合に起因するシグナルの積分強度)+(特定の繰返し単位間の結合に起因するシグナルの積分強度)}を共重合性指数とすることができる。図2A及び図2Bでは、H-NMRのスペクトルから共重合性指数を算出する場合を説明したが、核磁気共鳴は、H-NMRのほか、13C-NMR、19F-NMR又は31P-NMRであってもよい。
【0049】
クロマトグラムは例えば、液体クロマトグラフ又はガスクロマトグラフによって測定することができる。
【0050】
液体クロマトグラフは、検出器として、UV/VIS検出器、質量分析器、蛍光検出器、示差屈折率検出器、電気伝導度検出器、電気化学検出器、蒸発光散乱検出器及びコロナ荷電粒子検出器からなる群から選択される1種又は2種以上を含むものが好ましい。検出器は、質量分析器、示差屈折率検出器及びコロナ荷電粒子検出器がより好ましく、質量分析器が特に好ましい。
【0051】
ガスクロマトグラフは、前段として熱分解装置を含むことが好ましい。ガスクロマトグラフは、検出器として、質量分析器、水素炎イオン化検出器、熱伝導度検出器、バリア放電イオン化検出器、電子捕捉検出器、熱イオン化検出器、炎光光度検出器及び化学発光硫黄検出器からなる群から選択される1種又は2種以上を含むものが好ましい。検出器は、質量分析器が特に好ましい。
【0052】
クロマトグラムは、一次元のスペクトルデータである。クロマトグラムに含まれるデータ点数が多いほど、すなわち、時間分解能が高い程、推定精度を高くできる可能性がある。一方、データ点数が多すぎると計算リソースを多量に消費するため、学習及び推定に使用する前に、データを間引いたり、移動平均をとったりする等してデータ点数を削減しておいてもよい。また、クロマトグラムは一定時間で規格化すると推定精度を高くできる可能性がある。
【0053】
[学習済みモデル]
学習済みモデルは、入力データ(説明変数)から出力データ(目的変数)を推定する推定モデルである。学習済みモデルは、予め複数の共重合体(以下「学習用試料」という。)について作成した教師データを用いて機械学習をすることによって得られる。
【0054】
まず、複数の学習用試料の各々について、クロマトグラムの取得と、共重合性指数の算出とを行い、クロマトグラムを入力データ(説明変数)、共重合性指数を出力データ(目的変数)とする教師データを作成する。共重合性指数は上述のとおり、NMRスペクトルから算出することができる。
【0055】
教師データは、分析対象の共重合体と同じ繰返し単位を含み、分子量や共重合性指数が異なる複数の共重合体について作成することが好ましい。学習用試料の数が多い程(すなわち、機械学習に用いる教師データの数が多い程)、精度の高い学習済みモデルが得られる。
【0056】
作成した教師データを用いて、学習済みモデルを機械学習によって生成する。機械学習の具体的な手法は特に限定されず、任意の手法を用いることができる。
【0057】
機械学習は、評価方法とカーネル関数との二つの構成要素を持つ。評価方法には、最小二乗法(正解値からの距離の二乗)を評価基準とし、過学習を防ぐための補正を加えたモデル(最小二乗法、LASSO、Ridge、Elastic net、Huber、PLS等)、二乗値ではなく絶対値を評価基準とするモデル(SVR等)、複数の決定木を用いるモデル(RandomForest等)等がある。これらの中から、使用するデータの本質的なばらつきや実験誤差に適したものを選択し、最もフィッティング精度の高くなるものを選択する。基本的には全モデルで精度を評価し、最も良好なものを選択するのが一般的な手順である。
【0058】
上述のとおり、機械学習の手法は特に限定されないが、本実施形態の用途では、部分的最小二乗回帰(PLS回帰)が比較的好適である。PLS回帰は、変数同士を構成し直すことにより新たな空間座標軸を設定して、そこに投影することで、線形回帰を可能にする方法である。PLS回帰は入力データ(本実施形態ではクロマトグラム)間に多重共線性がある場合(パラメータが独立しておらず、パラメータ同士に強い相関がある場合)に特に適している。
【0059】
RandomForest以外のモデルはいずれも、カーネル関数(フィッティングをするときのベースラインの形状)に例えば以下のような式を指定することができる。これらの中から、分析対象の共重合体に適したものを選択する。
・liner(線形モデル、直線)
・polynomial(多項式モデル)
・RBF(非線形モデル)
【0060】
ただし、機械学習の実行によく用いられるscikit-learnでは、Ridge及びSVR以外は線形モデルのみしか選択できない仕様になっている。この場合でも、非線形データを用いることはできる。また、非線形写像をすることで、線形回帰が可能となる。例えば図6に示すように、2次元像では非線形な線でしか境界をフィッティングできないデータでも、次元を増やして3次元にすることで、「直線/線形」でフィッティングをすることが可能になる。
【0061】
なお、クロマトグラムと共重合性指数との相関関係は、必ずしも上記のいずれか1種のみに該当するとは限らず、分析対象の共重合体によって、相関性(ここでは相関関数の形状を意味する。)が異なる。線形相関であるデータに非線形モデルを適用することも可能ではあるが、測定データに誤差が存在することで過学習になる(例えば、直線でフィッティングすべきところを、測定データの誤差に合わせたうねり曲線でフィッティングしてしまい、予測時に誤った値を返してしまう)リスクがある。そのため、線形相関であると判明している場合には、linearモデルを使用する方が好ましい。ただし、相関性が不明な場合には、非線形モデルを選択しておけば、フィッティングを行うことが可能である。
【0062】
学習済みモデルが得られれば、この学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから分析対象の共重合体の共重合性指数を推定することができる。すなわち、NMRスペクトルを取得することなく、クロマトグラムから分析対象の共重合体の共重合性指数を推定することができる。
【0063】
[本実施形態の効果等]
以上、本発明の一実施形態による共重合体の分析方法を説明した。本実施形態によれば、クロマトグラムから共重合体の所定の配列情報を得ることができる。より具体的には、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定することができる。
【0064】
本実施形態によれば、NMRスペクトルを取得することなく、クロマトグラムから分析対象の共重合体の共重合性指数を推定することができる。また本実施形態によれば、標準物質(リファレンス)の準備も不要である。
【0065】
なお、NMRを用いた場合であっても、不純物のシグナルが重なって正しい積分強度が得られない場合がある。試料が工業製品である場合、意図しない不純物に加えて未開示の成分が無視できない量含まれていることも多い。また、成分数が多いとピークが重なって解析が困難になる場合がある。本実施形態によれば、このようなNMRによる分析が困難な試料の共重合性指数を推定できる場合がある。
【0066】
[共重合体の分析プログラム等]
上述した共重合体の分析方法は、コンピュータプログラムとしても実現可能である。本発明の一実施形態による共重合体の分析プログラムは、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析プログラムであって、クロマトグラムから共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから分析対象の共重合体の共重合性指数を推定する工程をコンピュータに実行させる。このコンピュータプログラムは、コンピュータで読取可能な記録媒体に記録されたものであってもよい。
【0067】
上述した共重合体の分析方法は、コンピュータシステムとしても実現可能である。本発明の一実施形態による共重合体の分析システムは、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析システムであって、メモリとプロセッサとを備え、プロセッサは、メモリのプログラムにしたがって、クロマトグラムから共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから分析対象の共重合体の共重合性指数を推定する工程を実行する。
【0068】
本発明の一実施形態による共重合体の分析装置は、2種以上の繰返し単位を含む共重合体において、特定の繰返し単位間の結合の比率の指標である共重合性指数を推定する、共重合体の分析装置であって、クロマトグラムから共重合性指数を推定する学習済みモデルを用いて、分析対象の共重合体を含む試料のクロマトグラムから分析対象の共重合体の共重合性指数を推定する推定装置を備える。本実施形態による共重合体の分析装置は、共重合体のクロマトグラムを説明変数、核磁気共鳴のスペクトルから算出された共重合性指数を目的変数とする教師データを用いて、学習済みモデルを機械学習によって生成するモデル生成装置をさらに備えていてもよい。
【0069】
本発明は国際連合が制定する持続可能な開発目標(SDGs)の17の目標のうち、目標9(産業と技術革新の基盤をつくろう)及び目標12(つくる責任、つかう責任)の達成に貢献することができる。
【実施例0070】
以下、実施例によって本発明をより具体的に説明する。本発明はこれらの実施例に限定されない。
【0071】
ポリ乳酸とポリカプロラクトンとの共重合体を、次に説明する方法で製造した。
【0072】
複数種類のポリエステル樹脂を水分の存在する環境下で加熱して攪拌すると、エステル結合の分解と生成が同時に起こり、ポリエステル共重合体が得られる。このとき、反応条件(水分量や温度、反応時間、攪拌速度等)を調整することで、共重合性指数を調整することができる。なお本発明者らは、この方法及びこの方法でできた生成物の発明についても特許出願を行っている(PCT/JP2023/002986、特願2023-125568、特願2023-125569)。
【0073】
ポリ乳酸(PLA)とポリカプロラクトン(PCL)とを表3に示す割合(質量比)で投入し、反応条件を変えて共重合体を製造した。製造した共重合体の分子量をGPCで測定した。H-NMRスペクトルから共重合体ができていることを確認し、共重合性指数として、図2A及び図2Bで説明したFαを算出した。結果を表3に示す。
【0074】
【表3】
【0075】
LC/MSでこれらの共重合体のTICクロマトグラムを測定した。測定したTICクロマトグラムを図7に示す。なお、TICクロマトグラムは一つの試料について2回測定を行った。
【0076】
クロマトグラムを入力データ(説明変数)、Fαを出力データ(目的変数)とする推定モデル(学習済みモデル)を機械学習によって生成した。機械学習はオープンソースライブラリであるscikit-learnを使用して行った。学習のアルゴリズムはPLS回帰を用いた。クロマトグラムのデータは、負荷軽減のため、1データセット当たりのデータ点数が300~400点程度になるようにデータを間引いたものを使用した。また、RT範囲の設定、外れ値の除外、規格化等の一般的な前処理を施して使用した。#1、#2、#4、#5及び#6を学習用データ(トレーニングデータ)とし、#3及び#7を検証用データ(バリデーションデータ)とした。
【0077】
図8は、縦軸にFαの予測値、横軸にFαの真値(NMRスペクトルから算出した値)をプロットした散布図である。中実のマークはトレーニングデータであり、白抜きのマークはバリデーションデータである。図8に示すように、バリデーションデータに対してもある程度の精度で予測ができていることを確認した。トレーニングデータの数を増やすことで、予測の精度がさらに向上することが期待できる。
【0078】
以上、本発明についての実施形態を説明したが、本発明は上述の実施形態のみに限定されず、発明の範囲内で種々の変更が可能である。
図1
図2A
図2B
図3
図4
図5
図6
図7
図8