IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社島津製作所の特許一覧

特開2023-47736データ処理方法及びデータ処理システム
<>
  • 特開-データ処理方法及びデータ処理システム 図1
  • 特開-データ処理方法及びデータ処理システム 図2
  • 特開-データ処理方法及びデータ処理システム 図3
  • 特開-データ処理方法及びデータ処理システム 図4
  • 特開-データ処理方法及びデータ処理システム 図5
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023047736
(43)【公開日】2023-04-06
(54)【発明の名称】データ処理方法及びデータ処理システム
(51)【国際特許分類】
   G01N 30/86 20060101AFI20230330BHJP
   G01N 30/74 20060101ALI20230330BHJP
【FI】
G01N30/86 B
G01N30/74 E
【審査請求】未請求
【請求項の数】8
【出願形態】OL
(21)【出願番号】P 2021156832
(22)【出願日】2021-09-27
(71)【出願人】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】100205981
【弁理士】
【氏名又は名称】野口 大輔
(72)【発明者】
【氏名】藤田 雄一郎
(72)【発明者】
【氏名】西尾 顕
(57)【要約】      (修正有)
【課題】クロマトグラム上で重なった複数成分のピークを行列分解によって分離する。
【解決手段】3次元クロマトグラムの実データ、及び実データのクロマトグラム上で互いのピークが重なっている試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、
データ準備ステップで準備した複数成分のそれぞれのスペクトルデータの互いに対応する波長領域同士の類似度を、波長領域を変化させながら波長領域ごとに計算する類似度計算ステップと、
類似度計算ステップでの計算結果に基づき、類似度が最も低くなる波長領域を対象範囲として設定する対象範囲設定ステップと、
複数成分のそれぞれのスペクトルデータを用いて対象範囲設定ステップで設定した対象範囲において実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えている。
【選択図】図1
【特許請求の範囲】
【請求項1】
複数の成分が含まれる試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、
前記データ準備ステップで準備した前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、
前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えているデータ処理方法。
【請求項2】
前記データ準備ステップでは、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成し、
前記類似度計算ステップ及び前記ピーク分離ステップにおいて使用する前記スペクトルデータは前記データ準備ステップで作成された前記スペクトルの推定データであり、
前記ピーク分離ステップにより作成する前記クロマトグラムデータは、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づくものである、請求項1に記載のデータ処理方法。
【請求項3】
前記行列分解は非負値行列因子分解である、請求項1又は2に記載のデータ処理方法。
【請求項4】
前記類似度計算ステップでは、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算する、請求項1から3のいずれか一項に記載のデータ処理方法。
【請求項5】
試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び、前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを記憶するデータ記憶部と、
前記データ記憶部に記憶されている前記実データと前記スペクトルデータとを用いて前記試料中における前記複数成分のピークの分離処理を行なうように構成されたデータ処理部と、を備え、
前記データ処理部は、
前記データ記憶部に記憶されている前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、
前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を実行するように構成されている、データ処理システム。
【請求項6】
前記データ処理部は、前記類似度計算ステップの前に、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成するデータ準備ステップを実行し、前記類似度計算ステップ及び前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記スペクトルの推定データを前記スペクトルデータとして使用し、前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づいて前記クロマトグラムデータを作成するように構成されている、請求項5に記載のデータ処理システム。
【請求項7】
前記行列分解は非負値行列因子分解である、請求項5又は6に記載のデータ処理システム。
【請求項8】
前記データ処理部は、前記類似度計算ステップにおいて、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算するように構成されている、請求項5から7のいずれか一項に記載のデータ処理システム。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、3次元クロマトグラムのデータ処理方法及びデータ処理システムに関するものである。
【背景技術】
【0002】
フォトダイオードアレイ(PDA)検出器等のマルチチャネル型検出器を用いた液体クロマトグラフ(LC)では、分析カラムから溶出する試料の吸光スペクトルを連続的に取得することによって、時間、波長、及び信号強度(吸光度)の3つの次元を有する3次元クロマトグラムデータを得ることができる。
【0003】
液体クロマトグラフを用いて試料中の目的成分の定量を行なう場合、目的成分の吸光度が最も大きい波長を用いてクロマトグラムを作成し、そのクロマトグラム上で目的成分のピークの面積値を求めて定量を行なうことが一般的である。しかし、試料に目的成分以外の不純物が含まれることがあり、クロマトグラム上でその不純物のピークが目的成分のピークと重なる場合がある。そのような場合、複数のピークが重なったままでは目的成分や不純物のピーク面積値を求めることができず定量結果が得られないため、クロマトグラム上でピークが重なっている複数の成分を互いに分離する必要がある。
【0004】
互いに重なった複数成分のピークを分離するための手法として、EMG(Exponential Modified Gaussian)関数等のモデル関数(ピークモデル)を実際のクロマトグラムの波形に当てはめることによって各成分のそれぞれのクロマトグラムを推定する手法(特許文献1参照)の他に、元の3次元クロマトグラムデータを行列分解することで各成分のクロマトグラムを数学的に推定する手法がある。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】国際公開第2016/035167号
【発明の概要】
【発明が解決しようとする課題】
【0006】
行列分解によるピークの分離は、元の3次元クロマトグラムデータを指定された数に数学的に分離するだけであるため、分離後の各ピークの形状が実際のピーク形状とは全く異なったものとなり得る。一方で、分離後の各成分のクロマトグラムの波形がピークモデルに依存しないため自由度が高く、ピークモデルの当てはめによる手法よりも高い分離精度が得られる可能性もある。
【0007】
本発明は、クロマトグラム上で互いに重なった複数成分のピークを行列分解によって高精度に分離できるようにすることを目的とするものである。
【課題を解決するための手段】
【0008】
本発明者らは、行列分解を用いてクロマトグラム上で重なっている複数成分のピークを分離する前に、それらの複数成分のそれぞれのスペクトルデータを何らかの手法で取得し、それらのスペクトルデータを行列分解の基礎として使用するとの発想に至った。ただし、分離対象の複数成分のスペクトルの全体的な波形が互いに似ている場合、それらのスペクトルデータを単純に行列分解に利用しただけでは、ピークの分離を高精度に行なうことは難しい。ここで、本発明者らは、分離対象の複数成分のスペクトルデータの互いに対応する波長領域同士の類似度を網羅的に評価し、互いの類似度が低い波長領域でスペクトルデータを用いた行列分解を実行することにより、行列分解によるピーク分離の精度を向上させることができるとの知見を得た。本発明はこのような知見に基づいてなされている。
【0009】
本発明に係るデータ処理方法は、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、前記データ準備ステップで準備した前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えている。
【0010】
本発明に係るデータ処理システムは、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び、前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを記憶するデータ記憶部と、前記データ記憶部に記憶されている前記実データと前記スペクトルデータとを用いて前記試料中における前記複数成分のピークの分離処理を行なうように構成されたデータ処理部と、を備えている。そして、前記データ処理部は、前記データ記憶部に記憶されている前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、前記類似度計算ステップでの計算結果に基づき、前記複数成分のそれぞれの前記スペクトルデータ同士の全体の類似度よりも低い前記類似度の波長領域を探索して対象範囲を設定する対象範囲設定ステップと、前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を実行するように構成されている。
【発明の効果】
【0011】
本発明に係るデータ処理方法及びデータ処理システムによれば、試料についての3次元クロマトグラムの実データとともにクロマトグラム上で互いのピークが重なっている複数成分のそれぞれのスペクトルデータを準備し、前記複数成分のスペクトルデータの互いに対応する波長領域同士の類似度を、波長領域を網羅的に変えながら波長領域について計算し、その計算結果に基づいて類似度の低い波長領域を探索し、その探索結果に基づいて対象範囲を設定し、設定した対象範囲内でスペクトルデータを用いた実データの行列分解を実行するので、前記複数成分のピークを高精度に分離することができる。
【図面の簡単な説明】
【0012】
図1】データ処理方法の一実施例を概略的に示すフローチャートである。
図2】同データ処理方法を実行するデータ処理システムの一実施例を概略的に示すブロック図である。
図3】同データ処理システムによるデータ処理の一例を示すフローチャートである。
図4】ピークモデルの当てはめによるピーク分離の一例を示す図であり、(A)は実データのある波長におけるクロマトグラムを示し、(B)は同クロマトグラムにピークモデルが当てはめられている状態を示している。
図5】同データ処理方法における類似度の計算結果のヒートマップの一例を示す図である。
【発明を実施するための形態】
【0013】
以下、本発明に係るクロマトグラムのデータ処理方法及びデータ処理システムの実施例について、図面を参照しながら説明する。
【0014】
図1にデータ処理方法の一実施例を概略的に示す。
【0015】
この実施例のデータ処理方法は、試料をクロマトグラフィ分析することにより取得されたスペクトルとクロマトグラムからなる3次元クロマトグラムデータを用い、クロマトグラム上で互いに重なっている複数成分のピークを分離するための方法である。
【0016】
この方法では、まず、試料についての3次元クロマトグラムの実データを準備するとともに、その実データのクロマトグラム上で互いのピークが重なっている複数成分のそれぞれのスペクトルデータを準備する(ステップ101)。分離対象の前記複数成分のそれぞれのスペクトルデータはどのような手法によって取得されたものであってもよい。前記複数成分が既知である場合には、それらの成分を個別に分析してそれぞれのスペクトルデータを取得することができる。分離対象の前記複数成分が未知である場合は、試料の3次元クロマトグラムの実データに対してピークモデルの当てはめによるピーク分離を実行することでスペクトルの推定データを作成し、その推定データを各成分のスペクトルデータとして用いることができる。ピークモデルの当てはめによるピーク分離のアルゴリズムとしては、例えば特許文献1(国際公開第2016/035167号)に開示されているものが挙げられる。
【0017】
次に、分離対象の前記複数成分のそれぞれのスペクトルデータ間で互いに対応する波長領域同士の類似度を、波長領域を網羅的に変えながら波長領域ごとに計算する(ステップ102)。その後、類似度の計算結果に基づいて、各成分のスペクトルデータ全体としての互いの類似度よりも類似度が低い波長領域(例えば、類似度を計算した波長領域のうちで類似度が最も低くなる波長領域)を探索し、その波長領域を行列分解の対象範囲として設定する(ステップ103)。そして、設定した対象範囲において各成分のスペクトルデータを基礎とした3次元クロマトグラムの行列分解を実行し、各成分のクロマトグラムデータを作成する(ステップ104)。行列分解として、NMF(非負値行列因子分解)などを用いることができる。行列分解は、作成した各成分のクロマトグラムデータの合成結果が実データに対して一定の近似度をもつまで繰り返し実行することができる。
【0018】
上述のデータ処理方法を実行するためのデータ処理システムの一実施例を図2に示す。
【0019】
データ処理システム1は、データ記憶部2、及びデータ処理部4を備えている。データ処理システム1には分析装置100で取得された分析データが取り込まれる。分析装置100は、試料について液体クロマトグラフィ分析を実施して一定時間ごとの吸光度スペクトルを取得するように構成されている。すなわち、分析装置1には、分析装置100からクロマトグラムとスペクトルからなる3次元クロマトグラムデータが取り込まれる。
【0020】
データ記憶部2は、分析装置100から取り込まれた3次元クロマトグラムの実データ、及び分離対象の複数成分のそれぞれのスペクトルデータを記憶しておく記憶領域である。データ記憶部2は、不揮発性メモリ、又はハードディスクドライブなどによって実現することができる。
【0021】
データ処理部4は、ピークモデル当てはめによるピーク分離アルゴリズムを用いて、実データのクロマトグラム上で互いのピークが重なっている複数成分のそれぞれのクロマトグラムの推定データとスペクトルの推定データを作成する第1の機能と、その第1の機能によって作成した各成分のクロマトグラムの推定データ及びスペクトルの推定データを、行列分解アルゴリズムを用いて調整する第2の機能と、を備えている。データ処理部4は、CPU(中央演算処理装置)を備えたコンピュータ回路においてプログラムが実行されることによって実現される機能である。
【0022】
データ記憶部2は、データ処理部4の第1の機能によって作成された各成分のスペクトルの推定データを各成分のそれぞれのスペクトルデータとして記憶することができる。データ処理部4の第2の機能では、データ記憶部2に記憶された各成分のスペクトルの推定データを用いて行列分解の対象範囲を限定し、限定した対象範囲において行列分解を実行することができる。
【0023】
データ処理システム1において実行されるピーク分離処理の一例について図3のフローチャートを用いて説明する。
【0024】
ピーク分離処理が開始されると、データ処理部4は、予め準備されたデータベース上で実データのクロマトグラムの波形を近似するために必要なピークモデルを探索し、該当のクロマトグラムにピークモデルに当てはめる(ステップ201)。そして、クロマトグラムに当てはめたピークモデルに基づいて複数成分のそれぞれのピーク形状を推定することにより、複数成分のピークを互いに分離する(ステップ202)。例えば、実データにおけるある波長でのクロマトグラムの波形が図4(A)に示されるものであった場合、図4(B)に示されているように、この波形を近似するために3つのピークモデルが当てはめられる。その結果、このクロマトグラムの波形が3つのピークP1~P3の重なりによって形成されたものであると推定され、3つのピークP1~P3に分離される。
【0025】
データ処理部4は、ピークモデルの当てはめによるピークの分離結果に基づき、複数成分のそれぞれについてのクロマトグラム及びスペクトルの推定データを作成する(ステップ203)。ここまでのステップ201~203は、データ処理部4の第1の機能によるものである。
【0026】
次に、データ処理部4は、ステップ203で作成した各成分のスペクトルの推定データの互いに対応する波長領域同士の類似度を、波長領域を網羅的に変化させながら波長領域ごとに計算する(ステップ204)。類似度としてはcos類似度を用いることができる。このステップ204において波長領域を網羅的に変化させる方法は特に限定されないが、一例として、波長領域の最小波長と幅(類似度を求める範囲)をそれぞれ変化させていく方法が挙げられる。図5は、波長領域の最小波長と幅をそれぞれ変化させながら類似度を計算することにより作成されたヒートマップの一例である。ヒートマップの横軸は波長領域の最小波長、縦軸は波長領域の幅である。ヒートマップの右上のハッチングされた三角形の領域は、波長領域の幅が実際のデータ領域を超えるために類似度が計算できない領域である。例えば最小波長が250nmで波長領域の幅が70nmの場合、波長領域の最大波長が320nmとなり、300nmを超えるため計算することができない。データ処理部4は、このようなヒートマップを作成してディスプレイ(図示は省略)に表示する機能を備えていてもよい。なお、ヒートマップは必ずしも作成される必要はない。
【0027】
上記ステップ204が終了した後、データ処理部4は、ステップ204での計算結果に基づいて類似度が最も低い波長領域を特定し、その波長領域を行列分解の対象範囲として設定する(ステップ205)。なお、波長領域の幅が極端に狭い場合は類似度を正しく評価することができないため、一定幅(例えば25nm)以上の波長領域を対象範囲として設定することが望ましい。なお、ステップ204において、類似度を計算する波長領域の幅を一定値(例えば25nm)以上に限定してもよい。なお、ここでは、データ処理部4が行列分解の対象範囲を自動的に設定するように説明されているが、本発明はこれに限定されない。データ処理部4は、ステップ204において波長領域ごとの類似度を計算して図5のような計算結果をユーザに対して示し、ユーザに対象範囲を設定させるようにしてもよい。
【0028】
対象範囲を設定した後、データ処理部4は、ステップ203で作成した各成分のクロマトグラム及びスペクトルの推定データを合成して3次元クロマトグラムの疑似データを作成し(ステップ206)、実データに対する疑似データの類似度を計算する(ステップ207)。ここでの「類似度」は、疑似データが実データにどれだけ類似しているかを数値で表すものであればよい。そのため、類似度の計算方法は特に限定されないが、例えば3次元クロマトグラムの各点における疑似データの数値と実データの数値との差分の二乗の合計値を類似度とすることができる。
【0029】
データ処理部4は、ステップ207で求めた類似度が良化するように、すなわち、疑似データがより実データに近づくように、行列分解を用いて各成分の推定データのパラメータを調整する(ステップ209)。その後、データ処理部4は、調整後の推定データに基づいて3次元クロマトグラムの疑似データを作成し(ステップ206)、作成した疑似データの実データに対する類似度を評価する(ステップ207、208)。このように、ステップ206~209を繰り返し、実データに対する疑似データの類似度が所定条件を満たしたときに、推定データの調整を終了する(ステップ208:Yes)。所定条件としては、類似度が予め設定されたしきい値を下回る(若しくは上回る)こと、又は、推定データの調整後の疑似データの実データに対する類似度が一定の値に収束すること、が挙げられる。ステップ204~209が、データ処理部4の第2の機能によるものである。
【0030】
データ処理部4の第2の機能による上記ステップ204~209により、第1の機能によって作成された各成分のクロマトグラム及びスペクトルの推定データが、各スペクトルデータ間の類似度が低い波長領域のデータを用いて、ピークモデルによる形状の制約を受けずに調整される。分離対象の複数成分のそれぞれのスペクトルデータが全体的に見ると互いに似ている場合、それらのスペクトルデータを用いて行列分解を実行しても、各成分のクロマトグラムを正確に推定することは難しい。しかし、複数成分のそれぞれのスペクトルデータのうち互いの類似度がスペクトルデータ全体で評価するよりも低い領域、すなわち、各成分の吸光度特性の違いが現れている領域、に解析対象範囲を絞って行列分解を実行することで、各成分のクロマトグラムの推定精度を向上させることができる。
【0031】
以上において説明した実施例は、本発明に係るデータ処理方法及びデータ処理システムの実施形態を例示したに過ぎない。本発明に係るデータ処理方法及びデータ処理システムの実施形態は以下に示すとおりである。
【0032】
本発明に係るデータ処理方法の一実施形態では、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを準備するデータ準備ステップと、
前記データ準備ステップで準備した前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
前記類似度計算ステップでの計算結果に基づき、前記類似度が最も低くなる波長領域を対象範囲として設定する対象範囲設定ステップと、
前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を備えている。
【0033】
データ処理方法の上記一実施形態の第1局面では、データ準備ステップにおいて、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成する。そして、前記類似度計算ステップ及び前記ピーク分離ステップにおいて使用する前記スペクトルデータは前記データ準備ステップで作成された前記スペクトルの推定データであり、前記ピーク分離ステップにより作成する前記クロマトグラムデータは、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づくものである。このような態様によれば、ピークモデルの当てはめによるピーク分離アルゴリズムを利用して作成した各成分のクロマトグラムとスペクトルの推定データを、ピークモデルの制約を受けない行列分解アルゴリズムを利用して調整することができ、高いピーク分離精度が得られる。
【0034】
データ処理方法の上記一実施形態の第2局面では、前記行列分解として非負値行列因子分解を用いる。この第2局面は上記第1局面と組み合わせることができる。
【0035】
データ処理方法の上記一実施形態の第3局面では、前記類似度計算ステップにおいて、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算する。この第3局面は上記第1局面及び/又は第2局面と組み合わせることができる。
【0036】
本発明に係るデータ処理システムの一実施形態では、試料についてのクロマトグラフィ分析により取得されたクロマトグラムとスペクトルからなる3次元クロマトグラムの実データ、及び、前記実データの前記クロマトグラム上で互いのピークが重なっている前記試料中の複数成分のそれぞれのスペクトルデータを記憶するデータ記憶部(2)と、
前記データ記憶部(2)に記憶されている前記実データと前記スペクトルデータとを用いて前記試料中における前記複数成分のピークの分離処理を行なうように構成されたデータ処理部(4)と、を備え、
前記データ処理部(4)は、
前記データ記憶部(2)に記憶されている前記複数成分のそれぞれの前記スペクトルデータの互いに対応する波長領域同士の類似度を、前記波長領域を網羅的に変化させながら前記波長領域ごとに計算する類似度計算ステップと、
前記類似度計算ステップでの計算結果に基づき、前記類似度が最も低くなる前記波長領域を対象範囲として設定する対象範囲設定ステップと、
前記複数成分のそれぞれの前記スペクトルデータを用いて前記対象範囲設定ステップで設定した前記対象範囲において前記実データの行列分解を実行することにより、前記複数成分のそれぞれのクロマトグラムデータを作成するピーク分離ステップと、を実行するように構成されている。
【0037】
データ処理システムの上記一実施形態の第1局面では、前記データ処理部(4)は、前記類似度計算ステップの前に、予め準備されたピークモデルを当てはめることによって前記実データの前記クロマトグラムの波形を近似し、前記クロマトグラムに当てはめた前記ピークモデルを用いて前記複数成分のそれぞれのスペクトルの推定データとクロマトグラムの推定データを作成するデータ準備ステップを実行し、前記類似度計算ステップ及び前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記スペクトルの推定データを前記スペクトルデータとして使用し、前記ピーク分離ステップにおいて、前記データ準備ステップで作成した前記クロマトグラムの推定データに基づいて前記クロマトグラムデータを作成するように構成されている。このような態様によれば、ピークモデルの当てはめによるピーク分離アルゴリズムを利用して作成した各成分のクロマトグラムとスペクトルの推定データを、ピークモデルの制約を受けない行列分解アルゴリズムを利用して調整することができ、高いピーク分離精度が得られる。
【0038】
データ処理システムの上記一実施形態の第2局面では、前記行列分解として非負値行列因子分解を用いる。この第2局面は上記第1局面と組み合わせることができる。
【0039】
データ処理システムの上記一実施形態の第3局面では、前記データ処理部(4)は、前記類似度計算ステップにおいて、前記波長領域の最小波長と波長幅を変化させながら前記類似度を計算するように構成されている。この第3局面は上記第1局面及び/又は第2局面と組み合わせることができる。
【符号の説明】
【0040】
1 データ処理システム
2 実データ記憶部
4 データ処理部
100 分析装置
図1
図2
図3
図4
図5