【0005】
本願発明の実施形態は、例えば、以下の通りである。
[形態1]
クロマトグラフィー質量分析法システムでのデータ捕捉システムからのデータを処理する方法において、
前記クロマトグラフィー質量分析法システムの質量分析計内に生データを形成する段階と、
前記生データを処理する段階であって、
処理されたデータを生成する段階、及び
前記処理されたデータを分析して、そこからノイズを抽出する段階により前記質量分析計と関係するモジュールを処理することによって、前記生データを処理する段階と、を備えており、前記生データは、少なくとも事前に定義された数のスティックを有する長いクラスタ、及び前記事前に定義された数のスティックより少ない数のスティックを有する短いクラスタを含んでおり、前記処理されたデータを生成する段階は、
前記長いクラスタを前記短いクラスタから分離する段階と、
前記生データをフィルタ処理して当該生データを平滑化し、それにより、前記長いクラスタからフィルタ処理されたクラスタをもたらす段階と、
前記生データの2つの近接するピークの間の谷の最小点を識別することによって、前記フィルタ処理されたクラスタをサブクラスタへ分ける段階と、
クロマトグラフ情報を含んでいないサブクラスタを前記生データから除去する段階と、を備えている方法。
[形態2]
前記分離する段階は、
前記生データをブロックへ分離する段階と、
それぞれのブロックの中心のベースラインの強度を推定する段階と、
それぞれのブロックの等距離四分位点間を線形補間してベースライン推定を出す段階と、
前記ベースラインレベルより上の生データをクリップし、当該ベースラインより下の生データを温存する段階と、
前記クリップされたデータを平滑化して前記ベースラインの改善版を出す段階と、を更に備えている、形態1の方法。
[形態3]
それぞれのブロックの長さは、前記生データの半値全幅(full-width half height)の倍数である、形態2の方法。
[形態4]
それぞれのブロックの長さは、前記生データの半値全幅の5倍と推定されている、形態2の方法。
[形態5]
前記平滑化する段階は、Savitzky−Golay平滑化アルゴリズムの適用を伴っている、形態2の方法。
[形態6]
ブロックの中心のベースラインの前記強度の推定は、前記ブロックの下四分位の前記ベースラインの強度に基づいている、形態2の方法。
[形態7]
前記除去する段階は、
閾値信号対ノイズ比より大きい信号対ノイズ比を有するサブクラスタを選択する段階と、
閾値品質より大きいピーク形状を有するサブクラスタを選択する段階と、
最小クラスタ長さを有するサブクラスタを選択する段階と、のうちの少なくとも1つを備えている、形態1の方法。
[形態8]
前記閾値信号対ノイズ比は10である、形態7の方法。
[形態9]
前記信号対ノイズ比のノイズは、四分の一(1/4)イオン面積の事前に定義されている捕捉ノイズとして測定されている、形態7の方法。
[形態10]
前記ノイズは、前記元のクラスタデータと前記平滑化されたクラスタデータの間の残差の標準偏差である、形態7の方法。
[形態11]
前記閾値信号対ノイズ比より小さい信号対ノイズ比を有するサブクラスタは、それらが同位体又は付加体である場合には、なお因子分析のために使用される、形態7の方法。
[形態12]
サブクラスタの前記ベースラインをピークの左右の側からトリミングする段階、を更に備えている、形態7の方法。
[形態13]
前記トリミングする段階は、
前記サブクラスタ内の生データを両端から中心へ向かって走査する段階と、
各端での前記強度が閾値より上に立ち上がっている場所を新しい端点として識別する段階と、
前記新しい端点の外側の前記生データを捨てる段階と、を更に備えている、形態12の方法。
[形態14]
前記閾値は、前記サブクラスタの標準偏差の4倍である、形態13の方法。
[形態15]
前記閾値品質は、前記サブクラスタと事前に定義されている曲線の間の相関に基づいている、形態7の方法。
[形態16]
前記事前に定義されている曲線は、二重ガウス(bi-Gaussian)曲線である、形態15の方法。
[形態17]
前記閾値相関は0.6である、形態15の方法。
[形態18]
前記閾値相関は0.8である、形態16の方法。
[形態19]
前記フィルタ処理する段階は、無限インパルス応答フィルタを利用している、形態1の方法。
[形態20]
前記フィルタ処理する段階は、
前記生データ内に最も大きいピークを識別する段階と、
前記識別されたピークの前記半値全幅を推定する段階と、
前記推定された半値全幅をルックアップ表と突き合わせて1つ又はそれ以上の最適化されているフィルタ係数を識別する段階と、
前記最適化されているフィルタ係数に基づいて前記生データを平滑化する段階と、
それぞれのクラスタについてノイズ指数を識別する段階と、を備えている、形態1の方法。
[形態21]
前記最適化されているフィルタ係数は、順逆二次無限インパルス応答フィルタ係数を含んでいる、形態20の方法。
[形態22]
前記ノイズ指数は、前記平滑データと前記生データの間の残差の標準偏差である、形態21の方法。
[形態23]
前記ノイズ指数は、或るクラスタから導出されている前記サブクラスタのそれぞれへ割り当てられる、形態22の方法。
[形態24]
前記最適化されている係数は、次の段階、即ち、
ガウスピークをそれぞれの半値全幅で形成する段階と、
前記ガウスピークへノイズを加え、それにより、ノイズのあるガウスピークをもたらす段階と、
前記フィルタ係数を調整するべく、前記ガウスピークを、前記ノイズのあるガウスピークと前記ガウスピークの間の残差を実質的に最小化する方式で最適化する段階と、に従って計算される、形態21の方法。
[形態25]
前記最適化する段階は、非線形Levenburg−Marquardt処理を利用している、形態24の方法。
[形態26]
前記クラスタはピークと谷を有しており、前記分ける段階は、
フィルタ処理されたクラスタ内に、2つのピークの間に位置する谷が前記2つのピークの定義されている強度より小さい最小点を有しているそれぞれのインスタンスを識別する段階と、
仮にあれば、それぞれの識別されたインスタンスに基づいて、前記クラスタをサブクラスタへ分離する段階と、を更に備えている、形態1の方法。
[形態27]
前記定義されている強度は、前記2つのピークの一方又は両方の前記強度の約二分の一である、形態26に記載の方法。
[形態28]
前記分析する段階は、
因子分析にとって有意な因子を求める段階と、
それらの因子の初期シード推定を提供する段階と、を更に備えている、形態1に記載の方法。
[形態29]
下四分位ピークを除外する段階、を更に備えている、形態28に記載の方法。
[形態30]
前記分析する段階は、
前記生データの間でベースピークを選択する段階と、
全ての局所データを評価して、それらを前記ベースピークと相関付ける段階と、
既定の最小相関値を有する局所データを前記ベースピークと組み合わせて因子を作成する段階と、
前記因子についてスペクトルを推定する段階と、を更に備えている、形態1に記載の方法。
[形態31]
前記ベースピークは手動で選択されている、形態30に記載の方法。
[形態32]
前記生データのデータセットの中で最も強度の高いサブクラスタピークが前記ベースピークとして選択されている、形態30に記載の方法。
[形態33]
前記最小相関値は0.6である、形態30に記載の方法。
[形態34]
A)ひとたび前記ベースピークが識別されたら、残っているデータの中で次に最も強度の高いピークを次の因子として選択する段階と、
B)前記(A)段階が完了し次第、残っているデータの中で次に最も強度の高いピークを次の因子として選択する段階と、
C)前記(B)段階を、全てのサブクラスタが因子を割り当てられるまで繰り返す段階と、を更に備えている、形態33に記載の方法。
[形態35]
前記最小相関値と関係している信頼区間を比較して、前記組み合わせる段階で組み合わされた前記局所データで組み合わされるべきではなかった局所データを、別々の因子へ分離する段階を、更に備えている、形態30に記載の方法。
[形態36]
前記比較する段階は、
前記因子の中で最も強度の高いサブクラスタを選択する段階と、
前記ベースサブクラスタと前記因子の中のその他のサブクラスタのうちの少なくとも1つの間の相関を求める段階と、
前記サブクラスタの少なくとも1つについて頂点位置信頼区間を求める段階と、
(i)重なり合うベースピークと、(ii)前記ベースピークへの相関で定義されている相関閾値より大きい相関と、を有するサブクラスタをひとまとめにグループ化する段階と、を更に備えている、形態35に記載の方法。
[形態37]
それぞれの因子についての平均濃度プロファイルを計算する段階を、更に備えている、形態35に記載の方法。
[形態38]
前記計算する段階は、それぞれの因子についての前記平均濃度プロファイルを求めるのに多変量曲線分解法を利用している、形態37に記載の方法。
[形態39]
計算された前記平均濃度プロファイルは、それぞれの因子についての推定されたピーク形状として使用される、形態38に記載に方法。
[形態40]
前記平均濃度プロファイルの前記ピーク品質を測定する段階と、
閾値ピーク品質より小さいピーク品質を有するデータを除去する段階と、を更に備えている、形態37に記載の方法。
[形態41]
前記測定する段階は、それぞれの濃度プロファイルのフィットの残差の偏差を求めることによって計算されている、形態40に記載の方法。
[形態42]
前記偏差は、二重ガウス系での標準偏差である、形態41に記載の方法。
[形態43]
前記閾値ピーク品質は0.5である、形態40に記載の方法。
[形態44]
前記入力相関パラメータは手動入力されている、形態43に記載の方法。
[形態45]
前記推定されたピーク形状を、少なくとも1つの事前に選択されている曲線と比較する段階を、更に備えている、形態39に記載の方法。
[形態46]
前記推定されたピーク形状を、前記比較する段階に先立って正規化して、正規化された推定ピーク形状を定義する段階を、更に備えている、形態45に記載の方法。
[形態47]
前記正規化する段階は、前記推定されたピーク形状を、再サンプリング手続きを通して引き伸ばすか又は縮めるかのうち少なくとも一方を行い、次いで中心合わせして、前記少なくとも1つの事前に選択されている曲線の幅と中心に整合させる段階、を含んでいる、形態46に記載の方法。
[形態48]
前記正規化されたピーク形状と前記少なくとも1つの事前に選択されている曲線の間の相関を計算する段階を、更に備えている、形態46に記載の方法。
[形態49]
前記最適整合についての歪度値及び尖度値が前記最適化のためのシードとして選択されている、形態48に記載の方法。
[形態50]
前記少なくとも1つの事前に選択されている曲線は、ピアソンIV関数から生成されている、形態45に記載の方法。
[形態51]
前記少なくとも1つの事前に選択されている曲線は前記歪度と前記尖度の少なくとも一方の順列であり、一方、残りのパラメータは一定に維持されており、その後、前記ピーク形状が記録され、それぞれの順列について保存される、形態50に記載の方法。
[形態52]
クロマトグラフィー質量分析法システムでのデータ捕捉システムからのデータを処理する方法において、
前記クロマトグラフィー質量分析法システムの質量分析計内に生データを形成する段階と、
前記生データを処理する段階であって、
処理されたデータを生成する段階、及び
前記処理されたデータを分析して、そこからノイズを抽出する段階により前記質量分析計と関係するモジュールを処理することによって、前記生データを処理する段階と、
同位体と付加体の一方又は両方と関連付けられている情報を求めて前記生データを調べ直す段階と、
前記関連付けられているデータを選択する段階と、
前記関連付けられているデータの適性認定を行う段階と、
前記関連付けられているデータが適性を認定された場合、それを因子へ割り当てる段階と、を備えている方法。
[形態53]
前記適性認定を行う段階は、
因子に対して前記データの相関を計算する段階と、
前記相関が前記最小相関より大きい場合は、それを因子へ割り当てる段階と、を備えている、形態52の方法。
[形態54]
前記最小相関は0.9である、形態53の方法。
[形態55]
因子を誤ってグループ化されている同位体/付加体を識別する段階と、
その様な識別された同位体/付加体を正しい因子へ割り当て直す段階と、を
更に備えている、形態35の方法。
[形態56]
前記識別する段階は、
因子の濃度プロファイルを近隣の因子の濃度プロファイルに比較して相関を識別する段階と、
第1の因子の前記濃度プロファイルと近隣の因子のそれとの間の前記相関が閾値相関より大きい場合は、前記第1の因子からの同位体/付加体突き止めに対し前記近隣の因子を調べ直す段階と、
前記調べ直す段階に基づいて、前記同位体/付加体を前記第1の因子へ割り当て直す段階と、を備えている、形態55の方法。
[形態57]
前記閾値相関は0.9である、形態56の方法。
[形態58]
前記相関パラメータは、ユーザーによって定義されている、形態35の方法。
[形態59]
因子分割を防止する段階を、更に備えている形態35の方法であって、
前記防止する段階は、
或る因子内のベース同位体/付加体サブクラスタと前記因子内のその他のサブクラスタの間の平均相関に基づく局所相関閾値を求める段階と、
前記因子と近接の因子の前記濃度プロファイルを相関付ける段階と、
前記相関が局所相関閾値より大きい場合は、前記因子と前記近接の因子を併合する段階と、を更に備えている、形態35の方法。
[形態60]
因子が併合される場合、前記因子と次に近接している因子との前記濃度プロファイルの相関付け段階、を更に備えている、形態59の方法。
[形態61]
前記閾値相関は0.9である、形態59の方法。
[形態62]
前記最小クラスタ長さは5スティックである、形態7の方法。
[形態63]
因子分割を防止する段階を、更に備えている形態35の方法であって、
前記防止する段階が、
第1のピークを第2のピークと、それらの間のもう1つの条件に基づいて、比較する段階と、
前記第1及び前記第2のピークを、前記1つ又はそれ以上の条件に基づいて、関係有り又は関係無しの何れかとして分類する段階と、を備え、前記比較する段階は、(i)前記第1のピークの分散を前記第2のピークの前記分散と比較する段階と(ii)前記第1のピークの平均保持時間を前記第2のピークの前記平均保持時間と比較する段階のうちの一方又は両方を比較する、形態35の方法。
[形態64]
前記比較する段階は、前記第1のピークの前記分散と前記第2のピークの前記分散及び前記第1のピークの前記平均保持時間と前記第2のピークの前記平均保持時間の両方を比較する、形態63に記載の方法。
[形態65]
前記第1のピークの前記分散を前記第2のピークの前記分散と比較する前記段階は、
前記第1のピークと前記第2のピークの間のF統計量を求める段階、
前記F統計量に関係付けられるF統計量信頼区間を割り当てる段階、
前記F統計量信頼区間を既定のt統計量パラメータに対照して比較する段階、
前記F統計量信頼区間を既定のF統計量パラメータに対照して比較する前記段階に基づいて、前記第1のピークと前記第2のピークを関係有り又は関係無しとして特徴付ける段階、という下位段階を備えている、形態64に記載の方法。
[形態66]
前記第1のピークの前記平均保持時間を前記第2のピークの前記平均保持時間と比較する前記段階は、
前記第1のピークと前記第2のピークの間のt統計量を求める段階、
前記F統計量に関係付けられるt統計量信頼区間を割り当てる段階、
前記t統計量信頼区間を既定のF統計量パラメータに対照して比較する段階、
前記t統計量信頼区間を既定のt統計量パラメータに対照して比較する前記段階に基づいて、前記第1のピークと前記第2のピークを関係有り又は関係無しとして特徴付ける段階、という下位段階を備えている、形態64に記載の方法。
[形態67]
前記第1のピークの前記平均保持時間を前記第2のピークの前記平均保持時間と比較する前記段階が、
前記第1のピークと前記第2のピークの間のt統計量を求める段階、
前記F統計量に関係付けられるt統計量信頼区間を割り当てる段階、
前記t統計量信頼区間を既定のF統計量パラメータに対照して比較する段階、という下位段階を備え、
前記第1のピークの前記分散を前記第2のピークの前記分散と比較する前記段階が、
前記第1のピークと前記第2のピークの間のF統計量を求める段階、
前記t統計量に関係付けられるF統計量信頼区間を割り当てる段階、
前記F統計量信頼区間を既定のt統計量パラメータに対照して比較する段階、
(i)前記t統計量信頼区間を既定のt統計量パラメータに対照して比較する前記段階及び(ii)前記F統計量信頼区間を既定のF統計量パラメータに対照して比較する前記段階に基づいて、前記第1のピークと前記第2のピークを関係有り又は関係無しとして特徴付ける段階、という下位段階を備えている、形態64に記載の方法。
[形態68]
前記クロマトグラフィーシステムはF統計量ルックアップ表を有するメモリ含んでおり、F統計量を求める前記段階は、前記ルックアップ表上の前記F統計量をルックアップする段階を含んでいる、形態64に記載の方法。
[形態69]
前記F統計量ルックアップ表は、特異値分解を用いて計算され前記システムのメモリ内に記憶されている既定のF統計量値を含んでいる、形態68に記載の方法。
[形態70]
前記クロマトグラフィーシステムはF統計量ルックアップ表を有するメモリを含んでおり、F統計量を求める前記段階は、前記ルックアップ表上の前記F統計量をルックアップする段階を含んでいる、形態67に記載の方法。
[形態71]
前記F統計量ルックアップ表は、特異値分解を用いて計算され前記システムのメモリ内に記憶されている既定のF統計量値を含んでいる、形態70に記載の方法。
[形態72]
前記因子は1つ又はそれ以上のピークを含んでおり、a1、σ1、a2、及びσ2は概して前記複数のピークのそれぞれについて制約されており、前記方法は、更に、
前記1つ又はそれ以上のクロマトグラフピークを二重指数モデル(bi-exponential model)を使用してモデル化し、当該1つ又はそれ以上のクロマトグラフピークと前記二重指数モデルの間の残差フィッティングを識別する段階と、
前記残差フィッティングが残差フィッティング既定条件を満たさない場合には、反復残差が反復残差フィッティング既定条件を満たすまで前記信号をもう1ピークずつ反復的に増加させる段階と、を備えている、形態34に記載の方法。
[形態73]
反復的に増加させる前記段階は、前記信号を最適化する段階を伴っている、形態72に記載の方法。
[形態74]
前記信号はLevenberg−Marquardt(LM)アルゴリズムを使用することによって最適化される、形態73に記載の方法。
[形態75]
前記LMアルゴリズムは分析式を使用して計算される、形態74に記載の方法。
[形態76]
前記因子は1つ又はそれ以上のピークを含んでおり、a1、σ1、a2、及びσ2は概して前記複数のピークのそれぞれについて制約されており、前記方法は、更に、
前記1つ又はそれ以上のクロマトグラフピークを二重指数モデル(bi-exponential model)を使用してモデル化し、当該1つ又はそれ以上のクロマトグラフピークと前記二重指数モデルの間の残差フィッティングを識別する段階と、
前記残差フィッティングが残差フィッティング既定条件を満たさない場合には、反復残差が反復残差フィッティング既定条件を満たすまで前記信号をもう1ピークずつ反復的に増加させる段階と、を備えている、形態35に記載の方法。
[形態77]
反復的に増加させる前記段階は、前記信号を最適化する段階を伴っている、形態76に記載の方法。
[形態78]
前記信号はLevenberg−Marquardt(LM)アルゴリズムを使用することによって最適化される、形態77に記載の方法。
[形態79]
前記LMアルゴリズムは分析式を使用して計算される、形態78に記載の方法。
[0004]クロマトグラフィーシステムでのデータを処理するためのシステム及び方法が記載されている。或る実施形では、本システム及び方法は、クロマトグラフィーシステムによって生成されたデータを処理して処理されたデータを生成する段階と、処理されたデータを分析する段階と、処理されたデータに基づく結果を用意し提供する段階と、を含んでいる。