(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-08
(45)【発行日】2022-08-17
(54)【発明の名称】クロマトグラムの類似度の計算方法
(51)【国際特許分類】
G01N 30/86 20060101AFI20220809BHJP
【FI】
G01N30/86 G
G01N30/86 H
(21)【出願番号】P 2018109382
(22)【出願日】2018-06-07
【審査請求日】2021-05-19
(73)【特許権者】
【識別番号】000003300
【氏名又は名称】東ソー株式会社
(72)【発明者】
【氏名】植松 原一
【審査官】高田 亜希
(56)【参考文献】
【文献】特開平09-251016(JP,A)
【文献】特開2003-161725(JP,A)
【文献】国際公開第2011/051964(WO,A2)
【文献】特開平11-051923(JP,A)
【文献】国際公開第2017/094170(WO,A1)
【文献】特開2012-145382(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 30/00-30/96
JSTPlus/JMEDPlus/JST7580(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
サイズ排除クロマトグラフィにより取得されるクロマトグラムに基づく、測定試料と標準試料との類似度の計算方法であって、
前記測定試料のクロマトグラムに対して、
類似度計算を行う
クロマトグラム中の2以上の区間のドリフトを除去する工程と、
基準となる成分ピークの溶出時間が前記標準試料のクロマトグラムと同一になるように時間軸を補正した後、時間間隔
(データ収集サンプリングピッチ)が前記標準試料のクロマトグラムと同一になるように再補正する工程と、を行った後、
類似度計算を行う
クロマトグラム中の2以上の区間のドリフトが除去された前記標準試料のクロマトグラムとの間で類似度の計算を行うことを特徴とする前記方法。
【請求項2】
クロマトグラムを積分曲線に変換してから類似度の計算を行うことを特徴とする請求項1に記載の方法。
【請求項3】
類似度の計算を以下の式で算出することを特徴とする請求項1
又は2に記載の方法。
【数1】
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、サイズ排除クロマトグラフィ(SEC)により取得されるクロマトグラムに基づく、測定試料と標準試料との類似度の計算方法に関するものである。
【背景技術】
【0002】
SECは合成高分子やタンパク質等を分子サイズの違いによって分離・精製するのに使用されるが、試料の分子量分布を測定する方法としても使用されるため、製造における品質管理等にも利用することが可能である。また、分光分析の分野や質量分析の分野では、測定試料の特定/同定を目的として、「類似度」を用いた手法が頻繁に用いられている。これは比較対象となるスペクトルと、未知試料を測定して得られたスペクトルとを比較して、その類似性を数値で評価する手法である。
【0003】
例えば、特許文献1は液体クロマトグラフィによるグリコヘモグロビンの分析に類似度の考えを適用し、クロマトグラムが正常であるか、異常であるかを判別する方法に適用した例である。この場合、x値に相当する値は溶出時間となるが、液体クロマトグラフィの場合は、溶離液、カラムロット、装置の稼働状態、測定環境等様々な要因の組み合わせにより、溶出時間は必ずしも同じとはならない。x値に不確定要素を含んだ場合、類似度計算の信頼性は劣ることとなる。
【先行技術文献】
【特許文献】
【0004】
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明の課題は、機器、環境、溶離液の影響等により不確実性(変動)を軽減した、SECにより取得されるクロマトグラムに基づく、測定試料と標準試料との類似度の計算方法を提供するものである。
【課題を解決するための手段】
【0006】
本発明に係るサイズ排除クロマトグラフィにより取得されるクロマトグラムに基づく、測定試料と標準試料との類似度の計算方法は、前記測定試料のクロマトグラムに対して、類似度計算を行う区間のドリフトを除去する工程と、基準となる成分ピークの溶出時間が前記標準試料のクロマトグラムと同一になるように時間軸を補正した後、時間間隔が前記標準試料のクロマトグラムと同一になるように再補正する工程と、を行った後、類似度計算を行う区間のドリフトが除去された前記標準試料のクロマトグラムとの間で類似度の計算を行うことを特徴とする。
【0007】
また、本発明に係る計算方法の一態様においては、クロマトグラムを積分曲線に変換してから類似度の計算を行う。
【0008】
また、本発明に係る計算方法の一態様においては、類似度の計算を行う区間がクロマトグラム中に2以上ある。
【0009】
また、本発明に係る計算方法の一態様においては、類似度の計算を以下の式で算出する。
【0010】
【発明の効果】
【0011】
本発明によれば、クロマトグラムのドリフト除去と時間軸の補正を行うため、不確実性を軽減して測定試料と標準試料との類似度の計算を行うことが可能となる。
【図面の簡単な説明】
【0012】
【
図1】基準となる成分ピークの溶出時間が標準試料のクロマトグラムと同一になるように時間軸を補正する方法について説明した図である。
【
図2】時間間隔が前記標準試料のクロマトグラムと同一になるように再補正する方法について説明した図である。
【
図3】時間軸の補正、時間間隔の再補正およびドリフト除去を行った前後のクロマトグラムを比較したものである。
【
図4】本発明における、類似度計算の対象区間を例示した図である。図aは高分子成分全て(1区間)、図bは2区間、図cは3区間の場合である。
【
図5】実施例で用いたシステム構成を示した図である
【
図6】実施例1での類似度計算の結果を示した図である。横軸は試料#、縦軸は類似度(最大1000)である。
【
図7】実施例1での類似度計算の結果から上位5番目までの試料のクロマトグラム(時間補正、ドリフト除去処理後)を示した図である。
【
図8】比較のため、実施例1での類似度計算の結果から上位5番目までの試料の未処理クロマトグラムを示した図である。
【
図9】実施例2での類似度計算の結果から上位5番目までを示した図である。
【
図10】実施例3で用いた積分曲線、および、類似度計算の対象区間を示した図である。図bはそれに対応するクロマトグラムを示している。
【
図11】実施例3での類似度計算の結果から上位5番目までを示した図である。
【発明を実施するための形態】
【0013】
本発明の計算方法は、測定試料のクロマトグラムに対して、類似度計算を行う区間のドリフトを除去する工程と、基準となる成分ピークの溶出時間が標準試料のクロマトグラムと同一になるように時間軸を補正した後、時間間隔が前記標準試料のクロマトグラムと同一になるように再補正する工程と、を行った後、類似度計算を行う区間のドリフトが除去された標準試料のクロマトグラムとの間で類似度の計算を行うものである。以下、本発明の一実施形態について説明する。
【0014】
なお、本発明における「クロマトグラム」とは、サイズ排除クロマトグラフィにより取得されるクロマトグラムを指す。
【0015】
類似度計算を行う区間のドリフトを除去する工程の一例としては、類似度計算を行う区間の少なくとも1以上の開始点(x1、y1)及び少なくとも1以上の終了点(x2、y2)[x:時間、y:出力]を決めて、直線式(y=ax+b)を算出し、クロマトグラムの各データ点(時間、出力)から前記直線式のy値を差し引く方法などが挙げられる。しかし、本工程はこの方法に限定されるものではない。開始点および終了点以外のピークが溶出していない複数の点を基に、多項式を算出し、クロマトグラムの各データ点(時間、出力)から前記多項式のy値を差し引く方法なども有用である。
【0016】
前記開始点は、目的成分が溶出し始める時間以前であれば良いが、類似度計算の精度を向上させるには、目的成分以外の領域ができるだけ少ない方が良い。前記終了点は、目的成分が溶出し終わる時間以降で、かつ基準となる成分ピークが溶出する時間の前であれば良いが、類似度計算の精度を向上させるには、目的成分以外の領域ができるだけ少ない方が良い。
【0017】
基準となる成分ピーク(以下、内部標準ピークと言うことがある)の溶出時間が標準試料のクロマトグラムと同一になるように時間軸を補正する方法について説明する。まず、標準試料クロマトグラムの内部標準の溶出時間(Ts)を、測定試料クロマトグラムの内部標準の溶出時間(Tu)で除した値を補正係数(Ft)とし、測定試料クロマトグラムのx値(時間)に補正係数(Ft)を乗じればよい(
図1参照)。
【0018】
時間間隔が前記標準試料のクロマトグラムと同一になるように再補正する方法について説明する。上述したように時間軸を補正するとクロマトグラムの時間間隔(サンプリングピッチ)は標準試料クロマトグラムのものとはずれてしまう。そこで、前後のデータ点を使用して補間処理を実施し、再補正を行う(
図2参照)。
【0019】
なお、内部標準ピークは溶媒由来のピーク、低分子成分等のピークでよく、SECにおいて示差屈折計を検出器として用いる場合は、試料を溶解した溶媒由来のピークが目的成分とは逆の極性(負方向)のピークとして出現することが多く、溶媒ピークを内部標準として使用することが好適である。
【0020】
「類似度計算を行う区間のドリフトを除去する工程」と、「基準となる成分ピークの溶出時間が標準試料のクロマトグラムと同一になるように時間軸を補正した後、時間間隔が前記標準試料のクロマトグラムと同一になるように再補正する工程」とはどちらの工程を先に行っても問題はない。
【0021】
測定試料クロマトグラムについて、上述した全工程が終了したら(
図3参照)、次に、類似度計算を行う区間のドリフトが除去された標準試料クロマトグラムとの間で類似度の計算を行う。なお、標準試料クロマトグラムのドリフトを除去する方法は、測定試料クロマトグラムに用いた方法と同一で問題はなく、本発明の実施に支障がないのであれば、更に標準試料クロマトグラムに対して他の工程処理を施しても問題はない。
【0022】
「類似度」の計算方法は、式1で挙げるような方法が代表的であるが、2つのクロマトグラム間で波形の類似性の指標となれば良く、特に限定するものではない。式1を用いて計算される類似度は、最大で1000であり、1000に近いほど、クロマトグラムの同一性が高いことを示す。
【0023】
また、類似度計算を行う区間については、複数設定し、各区間の類似度の値の平均値を取る、区間ごとに重みづけを行って計算しても問題ない。例えば、
図4bのように複数の分子量分布を有する高分子試料などでは2つの区間に分けて類似度を計算してもよく、
図4cのように1つのピークであるが、高分子試料の高分子側(第1区間)、低分子側(第3区間)、平均的な分子量区間(第2区間)のように3つの区間に分けて計算してもよい。
【0024】
また、クロマトグラムから得られる積分曲線を用いても類似度計算を行うことは可能である。積分曲線は、全体に占めるある分子量の割合を示したもので、高分子成分の特性を示す指標の1つである。積分曲線による類似度計算を実施する場合、上述した全工程が終了したクロマトグラムに対して、指定の計算区間内で時間に対する出力値を積算して積分曲線に変換してから類似度計算を行えばよい。
【0025】
本発明で算出された類似度は、予め設定しておいた基準値に対して、それを上回るか下回るかで品質を判定するといった利用が可能である。また、区間を複数設けている場合は、複数項目で条件を満たすか否かで判定するといった利用も可能である。
【0026】
以下に実施例を示し、本発明の実施の形態についてさらに詳しく説明する。もちろん、本発明は以下の実施例に限定されるものではなく、細部については様々な態様が可能であることはいうまでもない。さらに、本発明は上述した実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、それぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。また、本明細書中に記載された文献の全てが参考として援用される。
【実施例】
【0027】
図5に示すシステムを使用し、実際の測定を行った。システムは、溶離液1、溶媒脱気装置2(SD-8020)、送液ポンプ3,11(DP-8020)、試料注入装置4(AS-8020)、カラムオーブン6(CO-8020)、示差屈折計10(RI-8020)、抵抗管7、廃液部8及びデータ処理装置9(GPC-8020II)で構成した(かっこ付きはいずれも東ソー(株)製)。分析カラム5としては、東ソー(株)製 TSKgel G-Oligo-PW(7.8mmI.D.×30cm×2)を使用し、ポリエチレングリコール(富士フイルム和光純薬(株)製)の分離を行った。その他の条件は下記の通りである。
データ収集サンプリングピッチ:200ms
注入量 :50μL
カラム温度 :40℃
溶離液 :200mM NaNO
3 +20%アセトニトリル
なお、ポリエチレングリコールは表1の比率で2種類を混合して評価試料とした。
ポリエチレングリコール 200(PEG200)17mg/mL
ポリエチレングリコール 300(PEG300)17mg/mL
【0028】
【0029】
流速に関しては、測定結果を意図的に変動させるため、1.000、1.005、1.010mL/minでそれぞれ2回ずつ測定を実施した。
【0030】
【0031】
(実施例1)
本実施例は、類似度の計算区間を1つ、Sample_Dを流速1.000mL/min(#7)で測定して得られたクロマトグラムを標準試料のクロマトグラムとした。「溶媒由来のピーク」を内部標準成分とし、溶出時間(Ts)は20.220分であった。類似度計算を行う区間は13.0~19.6分とし、ドリフトの除去を行った。
【0032】
その他のクロマトグラムについて、13.0~19.6分のドリフトを除去し、内部標準成分の溶出時間(Tu)から補正係数(Ft)を算出し、時間軸の補正を行った後、時間データ間隔が200msになるように補間処理を行った。
【0033】
次に、標準試料のクロマトグラムと各クロマトグラムとの類似度を式1に基づいて算出した。結果を
図6、
図7(図中破線は標準試料クロマトグラム、実線は選択されたクロマトグラムを表す)に示す。流速が僅かに異なっていても、分子量分布が同一であるSample_Dのクロマトグラムは類似度が高く、判別することができた。
【0034】
比較のため、全く補正を行っていない生のクロマトグラムで比較した結果を
図8に示す。#8以外のクロマトグラムでは高分子成分の溶出位置が全く異なり、目視では類似性が高いものと判断することはできない。
【0035】
(実施例2)
本実施例では、複数の計算区間による類似度計算を行った例を示す。類似度計算する工程以外は、全て実施例1と同じである。類似度の計算区間は、下記のように3つの領域に分けて計算を行った。
前半区間:13.00~14.50分
中盤区間:14.50~17.50分
後半区間:17.50~19.57分
分子排除クロマトグラフィでは分子量の高い成分が早く溶出するため、前半区間は分子量が高い画分、後半区間は分子量が低い画分、中盤区間は平均的な分子量の画分ということになる。
図9は、実施例1で求めた全領域での類似度と各計算区間での類似度を示した図である。3区間の平均を取った値は、1つの区間で計算した類似度(実施例1)と同じ順位であることが分かった。
【0036】
(実施例3)
本実施例ではクロマトグラムの積分曲線を基にした類似度計算の実証を行った。なお、実施例1で取得した、時間補正およびドリフト除去後のクロマトグラムを基に積分曲線を取得する操作を実施した。また、試料による積分曲線の違いを目視でも分かり易いように、最大値を100にする規格化を実施した。
【0037】
図10にクロマトグラムとそれに対応する積分曲線の一例および計算区間を示す。本実施例では、高分子成分の高分子領域が溶出する13.0~16.5分、低分子領域が溶出する16.5~19.5分の2区間で計算した。なお、基準となる積分曲線は実施例1と同様に#7とした。
【0038】
2区間で類似度を計算し、その平均値を最終的な類似度とした。結果を
図11に示す。積分曲線を基に類似度計算(2区間)を行っても、1つの区間で計算した類似度(実施例1)と同じ順位であることが分かった。
【符号の説明】
【0039】
1.溶離液
2.脱気装置
3.送液ポンプ(サンプル側)
4.試料注入バルブ
5.分析カラム
6.カラム恒温槽
7.抵抗管
8.廃液
9.システム制御及びデータ処理装置
10.示差屈折計
11.送液ポンプ(リファレンス側)