(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-12-16
(45)【発行日】2024-12-24
(54)【発明の名称】データ処理方法及びデータ処理システム
(51)【国際特許分類】
G01N 30/86 20060101AFI20241217BHJP
【FI】
G01N30/86 B
(21)【出願番号】P 2021156830
(22)【出願日】2021-09-27
【審査請求日】2023-12-19
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110003993
【氏名又は名称】弁理士法人野口新生特許事務所
(74)【代理人】
【識別番号】100205981
【氏名又は名称】野口 大輔
(72)【発明者】
【氏名】藤田 雄一郎
(72)【発明者】
【氏名】西尾 顕
【審査官】大瀧 真理
(56)【参考文献】
【文献】国際公開第2016/035167(WO,A1)
【文献】特開平07-270387(JP,A)
【文献】国際公開第2021/106356(WO,A1)
【文献】国際公開第2021/023865(WO,A1)
【文献】S.Anbumalar et al,Overlapped Chromatograms Separation Using Non-negative Matrix Factorization,International Journal of Computer and Electrical Engineering,2011年,3(5),654-658
(58)【調査した分野】(Int.Cl.,DB名)
G01N 30/86
(57)【特許請求の範囲】
【請求項1】
試料についてのクロマトグラフィ分析により取得されたクロマトグラ
ムを使用し、前記クロマトグラム上で重なっている複数成分のピークを互いに分離するデータ処理方法であって、
前記クロマトグラムの波形を近似するため
のピークモデル関数
を準備する工程と、
前記ピークモデル関数のパラメータを調整し、前記クロマトグラムに当てはめることで複数の調整対象ピークを得る調整対象ピーク取得ステップと、
前記複数の調整対象ピーク
を初期値とし、
行列分解を用いて前記複数の調整対象ピークの形状及び大きさの行列因子パラメータを再調整することで疑似クロマトグラムを取得し、前記疑似クロマトグラムと前記クロマトグラムの類似度が所定の閾値を下回るか又は一定値に収束するまで、前記調整対象ピークの
前記行列因子パラメータの調整を繰り返す、調整対象ピーク調整ステップと、を備えているデータ処理方法。
【請求項2】
前記ピークモデル関数としてガウス関数と指数関数を組み合わせた関数を使用する、請求項1に記載のデータ処理方法。
【請求項3】
前記行列分解は非負値行列因子分解である、請求項
1に記載のデータ処理方法。
【請求項4】
試料についてのクロマトグラフィ分析により取得されたクロマトグラム
、及びピークモデル関数を記憶する記憶部と、
前
記ピークモデル関数を用いて前
記クロマトグラ
ムを処理し、前記クロマトグラム上で重なっている複数成分のピークを互いに分離する処理を行なうように構成されたデータ処理部と、を備え、
前記データ処理部は、
前記記憶部に記憶されている前
記ピークモデル関数
のパラメータを調整し、前記クロマトグラムに当てはめることで複数の調整対象ピークを得る調整対象ピーク取得ステップと、
前記
複数の調整対象ピーク
を初期値とし、
行列分解を用いて前記複数の調整対象ピークの形状及び大きさの行列因子パラメータを再調整することで疑似クロマトグラムを取得し、前記疑似クロマトグラムと前記クロマトグラムの類似度が所定の閾値を下回るか又は一定値に収束するまで、前記調整対象ピークの
前記行列因子パラメータの調整を繰り返す、調整対象ピーク調整ステップと、を実行するように構成されている、データ処理システム。
【請求項5】
前記データ処理部は、ガウス関数と指数関数を組み合わせた関数を前記ピークモデル関数として使用するように構成されている、請求項
4に記載のデータ処理システム。
【請求項6】
前記行列分解は非負値行列因子分解である、請求項
4に記載のデータ処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、3次元クロマトグラムデータを用いたデータ処理方法及びデータ処理システムに関するものである。
【背景技術】
【0002】
フォトダイオードアレイ(PDA)検出器等のマルチチャネル型検出器を用いた液体クロマトグラフ(LC)では、分析カラムから溶出する試料の吸光スペクトルを連続的に取得することによって、時間、波長、及び信号強度(吸光度)の3つの次元を有する3次元クロマトグラムデータを得ることができる。
【0003】
液体クロマトグラフを用いて試料中の目的成分の定量を行なう場合、目的成分の吸光度が最も大きい波長を用いてクロマトグラムを作成し、そのクロマトグラム上で目的成分のピークの面積値を求めて定量を行なうことが一般的である。しかし、試料に目的成分以外の不純物が含まれることがあり、クロマトグラム上でその不純物のピークが目的成分のピークと重なる場合がある。そのような場合、複数のピークが重なったままでは目的成分や不純物のピーク面積値を求めることができず定量結果が得られないため、クロマトグラム上でピークが重なっている複数の成分を互いに分離する必要がある。
【0004】
互いに重なった複数のピークを分離するためのアルゴリズム(ピーク分離アルゴリズムという)としては、EMG(Exponential Modified Gaussian)関数等のピークモデル関数を実際のクロマトグラムの波形に当てはめることによって、互いのピークが重なっている複数成分のそれぞれのクロマトグラムとスペクトルを推定するアルゴリズムが知られている(特許文献1参照)。
【先行技術文献】
【特許文献】
【0005】
【発明の概要】
【発明が解決しようとする課題】
【0006】
ピークモデル関数の当てはめによるピーク分離アルゴリズム(以下、モデル使用型アルゴリズムと称する)には、実際のピーク波形が有するテーリングやリーディングも表現することができる改良型のEMG関数を使用するものがあり、実際のクロマトグラムの波形形状を改良型のEMG関数によって高精度に再現することができ、その結果、各成分の定量を高精度に行なうことができる。しかし、試料中の相対的な濃度比が100:0.05のように極めて大きい複数の成分のピークがクロマトグラム上で互いに重なっている場合、モデル使用型アルゴリズムを適用してそれら複数のピークを分離すると、低濃度の成分のピーク面積値が実際のピーク面積値と大きく異なるという現象が発生することがわかった。
【0007】
本発明は上記問題に鑑みてなされたものであり、試料中の相対的な濃度比が極めて大きい複数の成分のピークがクロマトグラム上で互いに重なっている場合にも、相対的に濃度が低い成分の定量を高精度に行なうことができるようにすることを目的とするものである。
【課題を解決するための手段】
【0008】
モデル使用型アルゴリズムでは、予め準備されたピークモデル関数をそのパラメータ(例えば、高さ、広がり)を調整しながら実際のクロマトグラムの波形に当てはめることで、クロマトグラム上で互いに重なっている複数のピークの形状や大きさをそれぞれ推定する。そのため、推定された各成分のピーク形状はピークモデル関数による制約を受ける。そのため、ピークモデル関数で置き換えられた各ピークの面積値と実際の各ピークの面積値との間には僅かながらズレが生じる。これが、100:0.05のように互いの相対的な濃度比が極めて大きい複数の成分のピークを分離して定量する場合に相対的に濃度の低い成分の定量精度が悪くなる原因であると考えられる。
【0009】
ところで、ピーク分離アルゴリズムには、ピークモデル関数を使用しないアルゴリズム(以下、モデルフリー型アルゴリズムと称する)も存在する。モデルフリー型アルゴリズムの代表的なものとして、NMF(非負値行列因子分解)などの行列分解を利用するものが挙げられる。行列分解を利用したモデルフリー型アルゴリズムは、元の3次元クロマトグラムを数学的手法によって指定された数のピークに分離し、分離後の各ピークを合成して得られる疑似的な3次元クロマトグラムが元の3次元クロマトグラムに近似するように分離後の各ピークを微調整していくアルゴリズムである。このようなモデルフリー型アルゴリズムは、分離後のピーク形状がピークモデル関数の制約を受けないためにピークの分離の自由度が高く、分離後の各ピークを合成して得られる疑似的な3次元クロマトグラムを限りなく元の3次元クロマトグラムに近づけることが可能である。一方で、ピークモデル関数の制約を受けない代わりに分離後のピーク形状についての情報がないため、分離後の各ピークの形状が実際のピーク形状とは全く異なったものとなり得る。そのため、モデルフリー型アルゴリズムによるピークの分離結果は、モデル使用型アルゴリズムによるピークの分離結果よりも再現度が悪くなることが多い。
【0010】
本願発明者らは、モデルフリー型アルゴリズムのピーク分離の自由度の高さに着目し、モデル使用型アルゴリズムをモデルフリー型アルゴリズムで補完するとの発想に至った。そして、本願発明者らは、モデル使用型アルゴリズムを使用して得られたピークの分離結果を初期データとしてモデルフリー型アルゴリズムによる微調整を行なうと、100:0.05のように相対的な濃度比が極めて大きい複数の成分のピークが重なっている場合にも良好な分離精度が得られるとの知見を得た。本発明はこのような知見に基づいてなされたものである。
【0011】
本発明に係るデータ処理方法は、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データを使用し、前記クロマトグラム上で重なっている複数成分のピークを互いに分離するデータ処理方法であって、前記クロマトグラムの波形を近似するために予め準備したピークモデル関数を前記クロマトグラムに当てはめることで複数の調整対象ピークを得る調整対象ピーク取得ステップと、前記調整対象ピーク取得ステップで得た前記複数の調整対象ピークを合成して前記複数成分のそれぞれについてのクロマトグラム及びスペクトルの推測データを作成する推測データ作成ステップと、前記推測データ作成ステップで作成した前記推測データを調整前の初期値とし、調整後の前記調整対象ピークを合成して得られる前記試料についての3次元クロマトグラムの疑似データが前記実データに類似するまで、前記調整対象ピークの調整を繰り返す、調整対象ピーク調整ステップと、を備えている。
【0012】
本発明に係るデータ処理システムは、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び予め準備された複数のピークモデル関数を記憶する記憶部と、前記複数のピークモデル関数を用いて前記3次元クロマトグラムの実データを処理し、前記クロマトグラム上で重なっている複数成分のピークを互いに分離する処理を行なうように構成されたデータ処理部と、を備え、前記データ処理部は、前記記憶部に記憶されている前記複数のピークモデル関数を前記クロマトグラムに当てはめることで複数の調整対象ピークを得る調整対象ピーク取得ステップと、前記調整対象ピーク取得ステップで得た前記調整対象ピークを調整前の初期値とし、調整後の前記調整対象ピークを合成して得られる前記試料についての3次元クロマトグラムの疑似データが前記実データに類似するまで、前記調整対象ピークの調整を繰り返す、調整対象ピーク調整ステップと、を実行するように構成されている。
【0013】
すなわち、本発明に係るデータ処理方法及びデータ処理システムでは、最初に、モデル使用型アルゴリズムを使用してクロマトグラム上で互いに重なっている複数成分のそれぞれのピークとして推定される調整対象ピークを取得する。この調整対象ピークは、ピークモデル関数による制約を受けているため、各成分の実際のピークに完全には一致していないものの、ある程度、実際のピークを近似しているものと言える。そのような一定の近似度をもつ調整対象ピークを取得しておき、その調整対象ピークを調整前の初期データとしてモデルフリー型アルゴリズムによる調整、すなわち、ピークモデル関数の制約を外した調整を行なう。最初からモデルフリー型アルゴリズムを使用して3次元クロマトグラムの実データから複数成分のそれぞれのピークを分離しようとすると、各成分のピーク形状についての情報が一切ない状態でピークの分離を行なうことになるため、的を得た推定結果を得ることは難しい。一方で、ある程度の近似度をもつ調整対象ピークを初期データとしてモデルフリー型アルゴリズムを実施すれば、その調整対象ピークが実際のデータに近づくように微調整がなされ、実データに対する推定データの近似度が向上する。
【発明の効果】
【0014】
本発明に係るデータ処理方法及びデータ処理システムによれば、モデル使用型アルゴリズムを使用してクロマトグラム上で互いに重なっている複数成分のそれぞれの調整対象ピークを取得した後、モデルフリー型アルゴリズムによってモデル使用型アルゴリズムにより取得した調整対象ピークを調整するので、調整対象ピークが実際のデータに近づくように微調整がなされ、実データに対する推定データの近似度が向上する。その結果、試料中の相対的な濃度比が極めて大きい複数の成分のピークがクロマトグラム上で互いに重なっている場合にも、相対的に濃度の低い成分の定量を高精度に行なうことができる。
【図面の簡単な説明】
【0015】
【
図1】データ処理システムの一実施例を概略的に示すブロック図である。
【
図2】同実施例のデータ処理システムにより実施されるデータ処理方法を概略的に示すフローチャートである。
【
図3】同データ処理方法の具体例を示すフローチャートである。
【
図4】ピークモデル使用型アルゴリズムでのピークモデル関数の当てはめの一例を示す図であり、(A)は実データのある波長におけるクロマトグラムを示し、(B)は同クロマトグラムにピークモデル関数が当てはめられている状態を示している。
【
図5】同データ処理方法でのピークの分離工程を示す図であり、(A)は実データのある波長におけるクロマトグラムを示し、(B)はピークモデル使用型アルゴリズムにより分離された各成分のクロマトグラムの推定データを示し、(C)は行列分解により調整された各成分のクロマトグラムの推定データを示している。
【発明を実施するための形態】
【0016】
以下、本発明に係るクロマトグラムのデータ処理方法及びデータ処理システムの実施例について、図面を参照しながら説明する。
【0017】
【0018】
データ処理システム1は、実データ記憶部2、ピークモデル記憶部4、及びデータ処理部6を備えている。データ処理システム1には分析装置100で取得された分析データが取り込まれる。分析装置100は、試料について液体クロマトグラフィ分析を実施して一定時間ごとの吸光度スペクトルを取得するように構成されている。すなわち、分析装置100からデータ処理システム1に取り込まれる分析データは、クロマトグラムとスペクトルからなる3次元クロマトグラムのデータである。以降において、分析装置100から分析システム1に取り込まれる3次元クロマトグラムのデータを「実データ」と称する。
【0019】
実データ記憶部2は、分析装置100から取り込まれた3次元クロマトグラムの実データを記憶しておく記憶領域である。実データ記憶部2は、不揮発性フラッシュメモリ、又はハードディスクドライブなどによって実現することができる。
【0020】
ピークモデル記憶部4は予め準備された複数のピークモデル関数を記憶している。ピークモデル関数としては、例えば、クロマトグラム中に現れる実際のピーク波形のようにテーリングやリーディングを有するピーク波形を再現するために構成されたガウス関数と指数関数の組合せからなる改良型のEMG関数によるモデルが挙げられる。ピークモデル記憶部4は、実データ記憶部2と同様に、不揮発性フラッシュメモリ、又はハードディスクドライブなどによって実現することができるが、ネットワーク上に設けられたデータベースによって実現することもできる。
【0021】
データ処理部6は、実データ記憶部2に記憶されている3次元クロマトグラムの実データの処理を行なう。データ処理部6による実データの処理には、実データのクロマトグラム上のピークの面積値から試料中に含まれる成分の濃度を定量する定量処理のほかに、実データのクロマトグラム上で複数成分のピークが互いに重なっている場合に、それらのピークを互いに分離するピーク分離処理が含まれる。データ処理部6は、CPU(中央演算処理装置)を備えたコンピュータ回路においてプログラムが実行されることによって実現される機能である。
【0022】
データ処理部6によるピーク分離処理は、
図2に示されているように、ピークモデル関数を使用するアルゴリズム(モデル使用型アルゴリズム)を用いて互いのピークが重なっている複数成分のそれぞれのクロマトグラム及びスペクトルの推定データを作成する第1の工程(ステップ101)と、ピークモデル関数を使用しないアルゴリズム(モデル不使用型アルゴリズム)を用いて推定データを調整する第2の工程(ステップ102)と、を備えている。第1の工程で使用するモデル使用型アルゴリズムは既知のものでよく、例えば特許文献1(国際公開第2016/035167号)に開示されているものが挙げられる。第2の工程で使用するピークモデル不使用型アルゴリズムも既知のものでよく、NMF(非負値行列因子分解)などの行列分解を利用したものが挙げられる。
【0023】
【0024】
ピーク分離処理を開始すると、データ処理部6は最初に、ピークモデル関数のパラメータ(高さ、広がり等)を調整しながら実データのクロマトグラムにピークモデル関数を当てはめ、当てはめたピークモデル関数を調整対象ピークとして取得する(ステップ201)。例えば、実データにおけるある波長でのクロマトグラムの波形が
図4(A)に示されるものであった場合、
図4(B)に示されているように、クロマトグラムの波形が、パラメータが調整された3つのピークモデル関数によって近似される。クロマトグラムの波形を近似するために当てはめられた各ピークモデル関数が調整対象ピークである。このステップ201が、モデル使用型アルゴリズムを用いた第1の工程である。
【0025】
データ処理部6は、ステップ201で取得した調整対象ピークを合成して試料についての3次元クロマトグラムの疑似データを作成し(ステップ202)、3次元クロマトグラムの疑似データの実データに対する類似度を計算する(ステップ203)。「類似度」は、疑似データが実データにどれだけ類似しているかを数値で表すものであればよい。そのため、類似度の計算方法は特に限定されないが、例えば3次元クロマトグラムの各点における疑似データの数値と実データの数値との差分の二乗の合計値を類似度とすることができる。
【0026】
データ処理部6は、求めた類似度が良化するように、すなわち、疑似データがより実データに近づくように、行列分解を用いて調整対象ピークのパラメータを調整する(ステップ205)。その後、データ処理部6は、調整後の調整対象ピークを合成して3次元クロマトグラムの疑似データを作成し(ステップ202)、作成した疑似データの実データに対する類似度を評価する(ステップ203、204)。このように、ステップ202~205を繰り返し、実データに対する疑似データの類似度が所定条件を満たしたときに、ピークの分離処理を終了する(ステップ206:Yes)。所定条件としては、類似度が予め設定されたしきい値を下回る(若しくは上回る)こと、又は、調整後の調整対象ピークを合成して得られる疑似データの実データに対する類似度が一定の値に収束すること、が挙げられる。
【0027】
上記のステップ202~205が、モデル不使用型アルゴリズムを用いた第2の工程である。この第2の工程では、第1の工程で分離された各ピークがピークモデル関数による形状の制約を受けずに調整される。その結果、ピークモデル関数の制約により第1の工程では実データを近似しきれなかった部分が調整され、分離後の各成分のピークの大きさ及び形状が実際のものに近づく。
【0028】
図5にピーク分離処理の各工程でのピーク分離状態の一例を示す。
【0029】
図5(A)はピーク分離処理を実行する前の実データのある波長におけるクロマトグラムの波形の一部である。このクロマトグラムをもつ実データに対してモデル使用型アルゴリズムによる第1の工程を実施すると、
図5(B)に示されているように、2つのピークモデル関数が当てはめられて2つの調整対象ピークP4、P5が得られる。そして、得られた調整対象ピークを調整前の初期データとしてモデル不使用型アルゴリズムによる第2の工程を実施すると、
図5(C)のように、調整対象ピークP4、P5の形状及び大きさが調整される。
【0030】
既述のように、モデル使用型アルゴリズムのみを使用して、すなわち、第1の工程のみを実施して成分の相対的な濃度比が100:0.05のように極端に大きい2つの成分のピークの分離を行なった場合、相対的に濃度の低い成分のピーク面積が実際のピーク面積の2倍以上にもなることがあった。これに対し、本発明者らは、第1の工程で得られたピーク分離結果を調整前の初期データとしてモデル不使用型アルゴリズムを用いた第2の工程を実施すると、2つの成分のピークの形状及び大きさがそれぞれ調整され、その結果、相対的に濃度の低い成分のピーク面積が実際のピーク面積に近づくことを確認している。
【0031】
以上において説明した実施例は、本発明に係るデータ処理方法及びデータ処理システムの実施形態を例示したに過ぎない。本発明に係るデータ処理方法及びデータ処理システムの実施形態は以下に示すとおりである。
【0032】
本発明に係るデータ処理方法の一実施形態では、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データを使用し、前記クロマトグラム上で重なっている複数成分のピークを互いに分離するデータ処理方法であって、前記クロマトグラムの波形を近似するために予め準備したピークモデル関数を前記クロマトグラムに当てはめることで複数の調整対象ピークを得る調整対象ピーク取得ステップと、前記調整対象ピーク取得ステップで得た前記複数の調整対象ピークを合成して前記複数成分のそれぞれについてのクロマトグラム及びスペクトルの推測データを作成する推測データ作成ステップと、前記推測データ作成ステップで作成した前記推測データを調整前の初期値とし、調整後の前記調整対象ピークを合成して得られる前記試料についての3次元クロマトグラムの疑似データが前記実データに類似するまで、前記調整対象ピークの調整を繰り返す、調整対象ピーク調整ステップと、を備えている。
【0033】
上記データ処理方法の一実施形態の第1局面では、前記ピークモデル関数としてガウス関数と指数関数を組み合わせた関数を使用する。このような態様により、実際のピークのテーリングやリーディングを考慮したピークモデル関数を使用することができ、分離後のピークの推定形状を現実のものに近づけることができる。
【0034】
上記データ処理方法の一実施形態の第2局面では、前記調整対象ピーク調整ステップにおいて、行列分解を用いて前記調整を行なう。この第2局面は上記第1局面と組み合わせることができる。
【0035】
前記行列分解として、非負値行列因子分解を使用することができる。
【0036】
上記データ処理方法の一実施形態の第3局面では、前記調整対象ピーク調整ステップにおいて、調整後の前記調整対象ピークを合成して得られる前記疑似データと前記実データとの類似度を計算し、前記類似度が予め設定された基準を満たしたとき、又は前記類似度が一定の値で収束したときに、前記疑似データが前記実データに類似したと判断し前記調整を終了する。この第3局面は上記第1局面及び/又は第2局面と組み合わせることができる。
【0037】
本発明に係るデータ処理システムの一実施形態では、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び予め準備された複数のピークモデル関数を記憶する記憶部と、前記複数のピークモデル関数を用いて前記3次元クロマトグラムの実データを処理し、前記クロマトグラム上で重なっている複数成分のピークを互いに分離する処理を行なうように構成されたデータ処理部と、を備え、前記データ処理部は、前記記憶部に記憶されている前記複数のピークモデル関数を前記クロマトグラムに当てはめることで複数の調整対象ピークを得る調整対象ピーク取得ステップと、前記調整対象ピーク取得ステップで得た前記調整対象ピークを調整前の初期値とし、調整後の前記調整対象ピークを合成して得られる前記試料についての3次元クロマトグラムの疑似データが前記実データに類似するまで、前記調整対象ピークの調整を繰り返す、調整対象ピーク調整ステップと、を実行するように構成されている。
【0038】
上記データ処理システムの一実施形態の第1局面では、前記データ処理部は、ガウス関数と指数関数を組み合わせた関数を前記ピークモデル関数として使用するように構成されている。このような態様により、実際のピークのテーリングやリーディングを考慮したピークモデル関数を使用することができ、分離後のピークの推定形状を現実のものに近づけることができる。
【0039】
上記データ処理システムの一実施形態の第2局面では、前記データ処理部は、前記調整対象ピーク調整ステップにおいて、行列分解を用いて前記調整を行なう。この第2局面は上記第1局面と組み合わせることができる。
【0040】
前記行列分解として、非負値行列因子分解を使用することができる。
【0041】
上記データ処理システムの一実施形態の第3局面では、前記データ処理部は、前記調整対象ピーク調整ステップにおいて、調整された後の前記調整対象ピークを合成して得られる前記疑似データと前記実データとの類似度を計算し、前記類似度が予め設定された基準を満たしたとき、又は前記類似度が一定の値で収束したときに、前記調整を終了するように構成されている。この第3局面は上記第1局面及び/又は第2局面と組み合わせることができる。
【符号の説明】
【0042】
1 データ処理システム
2 実データ記憶部
4 ピークモデル記憶部
6 データ処理部
100 分析装置