IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ セルノ・バイオサイエンス・エルエルシーの特許一覧

<>
  • 特許-確実で自動の質量スペクトル分析 図1
  • 特許-確実で自動の質量スペクトル分析 図2
  • 特許-確実で自動の質量スペクトル分析 図3
  • 特許-確実で自動の質量スペクトル分析 図4
  • 特許-確実で自動の質量スペクトル分析 図5
  • 特許-確実で自動の質量スペクトル分析 図6
  • 特許-確実で自動の質量スペクトル分析 図7
  • 特許-確実で自動の質量スペクトル分析 図8
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-11-01
(45)【発行日】2023-11-10
(54)【発明の名称】確実で自動の質量スペクトル分析
(51)【国際特許分類】
   G01N 27/62 20210101AFI20231102BHJP
   G01N 30/72 20060101ALI20231102BHJP
   G01N 27/447 20060101ALI20231102BHJP
   H01J 49/00 20060101ALI20231102BHJP
【FI】
G01N27/62 D
G01N27/62 C
G01N27/62 X
G01N30/72 C
G01N30/72 A
G01N27/447 331J
G01N27/447 315Z
H01J49/00 310
H01J49/00 360
【請求項の数】 27
(21)【出願番号】P 2020543946
(86)(22)【出願日】2019-02-19
(65)【公表番号】
(43)【公表日】2021-06-03
(86)【国際出願番号】 US2019018568
(87)【国際公開番号】W WO2019161382
(87)【国際公開日】2019-08-22
【審査請求日】2022-02-18
(31)【優先権主張番号】62/632,414
(32)【優先日】2018-02-19
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】505401366
【氏名又は名称】セルノ・バイオサイエンス・エルエルシー
(74)【代理人】
【識別番号】100127926
【弁理士】
【氏名又は名称】結田 純次
(74)【代理人】
【識別番号】100140132
【弁理士】
【氏名又は名称】竹林 則幸
(72)【発明者】
【氏名】ドン・キュール
(72)【発明者】
【氏名】ステーシー・シモノフ
(72)【発明者】
【氏名】ヨンドン・ワン
【審査官】吉田 将志
(56)【参考文献】
【文献】特表2008-536147(JP,A)
【文献】特表2008-519262(JP,A)
【文献】国際公開第2015/025114(WO,A1)
【文献】特表2007-525645(JP,A)
【文献】特開2017-161442(JP,A)
【文献】特開2015-222275(JP,A)
【文献】特表2009-539068(JP,A)
【文献】特開2017-032470(JP,A)
【文献】特開2011-220773(JP,A)
【文献】特開2008-281411(JP,A)
【文献】特開2011-033346(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/60 - G01N 27/70
G01N 27/92
G01N 30/72
G01N 27/447
H01J 49/00 - H01J 49/48
(57)【特許請求の範囲】
【請求項1】
経時的な分離と質量分析計による検出とを組み合わせた関心化合物の分析方法であって、
a.生プロファイルモードの質量スペクトルデータを獲得する工程と;
b.生プロファイルモード質量スペクトルデータを、スペクトル精度に対する既知の1組の標準イオンによって較正する工程と;
c.可能な関心化合物の存在に対して関連する時間窓を選択する工程と;
d.関連する時間窓内で質量スペクトル生プロファイルモードデータの多変量統計分析を実行して、存在する化合物の数を判定する工程と;
e.関連する時間窓内で検出された関心化合物およびそれぞれの時間位置に対する分離時間プロファイルを取得する工程と;
f.それぞれの分離時間プロファイルまたは時間位置に対応するすべての関心化合物に対する純粋質量スペクトルを算出する工程と;
g.スペクトルライブラリを検索し、そして化合物同定のための少なくとも1つのライブラリマッチスコアとスペクトル精度を用いる工程と;
を含む、前記方法。
【請求項2】
分離のための技法は、ガスクロマトグラフィ(GC/MS)、液体クロマトグラフィ(LC/MS)、超臨界流体クロマトグラフィ、イオンクロマトグラフィ(IC/MS)、キャピラリ電気泳動(CE/MS)、ゲル電気泳動、イオン移動度、および熱分解のうちの1つである、請求項1に記載の方法。
【請求項3】
質量分析計は、セクタ質量分析計、四重極質量分析計、飛行時間(TOF)質量分析計、オービトラップ質量分析計、およびフーリエ変換イオンサイクロトロン共鳴(FT ICR)質量分析計のうちの1つである、請求項1に記載の方法。
【請求項4】
関心化合物に対する時間プロファイルは、測定された実際の時間プロファイルである、請求項1に記載の方法。
【請求項5】
可能な関心化合物の存在の検出は、検出されたピークまたは化合物に対する可能性または信頼度を示すt-統計量を有する実際または標的の時間プロファイルのうちの1つを使用した回帰を含む、請求項1に記載の方法。
【請求項6】
関連する時間窓内の質量スペクトル生プロファイルモードデータを主成分分析によって分析して、存在する化合物の統計的に有意な数を判定する、請求項1に記載の方法。
【請求項7】
主成分分析は、特異値分解および非線形反復部分最小二乗(NIPALS)アルゴリズムのうちの1つによって実行することができる、請求項6に記載の方法。
【請求項8】
純粋成分質量スペクトルは、測定された質量スペクトルおよび取得された分離時間プロファイルから算出される、請求項1に記載の方法。
【請求項9】
演算は、測定された質量スペクトルと取得された分離時間プロファイルとの間の回帰分析として実行される、請求項8に記載の方法。
【請求項10】
回帰分析は、マトリックス演算、マトリックス反転、特異値分解、主成分分析、および部分最小二乗のうちの1つの使用による多重線形回帰である、請求項9に記載の方法。
【請求項11】
取得された分離時間プロファイル、算出された純粋成分質量スペクトル、およびそれぞれの尺度または強度に関係する情報のうちの1つの使用によって、定量的分析が実行される、請求項1に記載の方法。
【請求項12】
定量的分析は、既知の濃度を有する標準の使用によって実行される、請求項11に記載の方法。
【請求項13】
定量的分析は、検出された関連する化合物間で、時間プロファイルおよび純粋質量スペクトルのうちの1つの相対強度の使用によって実行される、請求項11に記載の方法。
【請求項14】
既知の化合物スペクトルライブラリに対する算出された純粋成分質量スペクトルの検索、測定された分離時間プロファイル位置とライブラリ内の既知の化合物の分離時間位置との比較、イオン候補に対する質量精度の算出、イオン候補に対するスペクトル精度の算出のうちの1つによって、定性的分析が実行される、請求項1に記載の方法。
【請求項15】
ライブラリ検索スコアが、分離時間プロファイル位置、質量精度、およびスペクトル精度のうちの少なくとも1つからのマッチング品質とともに、全体的なスコアに組み合わされて、正しい同定の可能性を示す、請求項14に記載の方法。
【請求項16】
イオン候補は、獲得された質量スペクトルデータ内で観察された、分子イオンおよびフラグメントイオンのうちの1つであり、ライブラリ内に含まれる化合物に属することが分かっている、請求項14に記載の方法。
【請求項17】
イオン候補は、獲得された質量スペクトルデータ内で観察された分子イオンおよびフラグメントイオンのうちの1つであり、未知の化合物に由来する、請求項14に記載の方法。
【請求項18】
測定された分離時間プロファイル位置、関連する誤差限界、既知の化合物の時間プロファイル位置、および関連する誤差限界を比較することによって、可能な化合物が暫定的に同定される、請求項1に記載の方法。
【請求項19】
暫定的に同定された化合物のライブラリスペクトルと、関連する時間窓内の獲得された質量スペクトルとの間の回帰分析を実行して、それぞれの暫定的に同定された化合物の推定される相対濃度およびそれらの有意性を示す対応する統計的尺度を取得する、請求項18に記載の方法。
【請求項20】
統計的尺度は、推定される相対濃度のt-値である、請求項19に記載の方法。
【請求項21】
獲得された生プロファイルモード質量スペクトルデータは、時間に基づく有効な化合物分離中の質量スペクトルの1つの終了と別の終了の間の有限の走査時間から生じる質量スペクトルスキューに対して補正される、請求項1に記載の方法。
【請求項22】
スキュー補正は、補間によって実現され、各走査の質量スペクトルが、分離プロセス中の同じ時点に対応するように補間される、請求項21に記載の方法。
【請求項23】
分離時間プロファイルは、液体またはガスクロマトグラフ分離からのクロマトグラムであり、分離時間プロファイル位置は、対応する保持時間である、請求項1に記載の方法。
【請求項24】
保持時間は、分離中に化合物が予期される時間位置を示す保持指標に変換される、請求項1に記載の方法。
【請求項25】
算出された純粋質量スペクトルは、定性的同定または定量的分析のためにセントロイドへ処理される、請求項1に記載の方法。
【請求項26】
請求項1~25のいずれか1項に記載の方法のいずれかに応じて動作する質量分析計。
【請求項27】
質量分析計に付随するコンピュータとともに使用するためのコンピュータ可読媒体であって、請求項1~25のいずれか1項に記載の方法に応じて該質量分析計を動作させるように該コンピュータによって可読のコンピュータ可読プログラム命令を有する、前記コンピュータ可読媒体。
【発明の詳細な説明】
【技術分野】
【0001】
関連特許出願/特許の相互参照
米国特許第6,983,213号、第7,493,225号、および第7,577,538号;2004年4月28日出願の国際特許出願PCT/US2004/013096;米国特許第7,348,553号;2005年10月28日出願の国際特許出願PCT/US2005/039186;米国特許第8,010,306号、2006年4月11日出願の国際特許出願PCT/US2006/013723;米国特許第7,781,729号、2007年5月28日出願の国際特許出願PCT/US2007/069832;ならびに2007年6月2日出願の米国特許仮出願第60/941,656号、およびWO2008/151153として公開された国際特許出願PCT/US2008/065568。
【0002】
これらの特許文献の教示全体を、あらゆる目的で全体として参照によって本明細書に組み入れる。
【0003】
本発明は、一般に、質量分析法(MS)の分野に関し、より詳細には、MSデータを獲得、処理、および分析する方法に関する。
【背景技術】
【0004】
質量分析法(MS)は、分子のイオン化、質量によるイオンの分散、および適当な検出器でのイオンの適切な検出に依拠する100年前から続く技術である。これら3つの主要なMSプロセスの各々を実現するには多くの方法があり、異なる特性を有する異なるタイプのMS計器をもたらしている。
【0005】
質量分散の前にMSシステムに入る分子をイオン化して適切に電荷を与えることができるように、多くのイオン化技法が利用可能である。これらのイオン化方式には、エレクトロスプレーイオン化(ESI)、高エネルギー電子の衝撃による電子衝撃イオン化(EI)、反応性化合物の使用による化学イオン化(CI)、およびマトリックス支援レーザ脱離イオン化(MALDI)が含まれる。
【0006】
イオン化によって分子に電荷が与えられた後、各イオンは、対応する質量電荷(m/z)比を有し、これが質量分散の基本になる。使用されている物理的原理に基づいて、質量分散および後のイオン検出を実現するには多くの異なる方法があり、本質的には類似しているが詳細には異なる質量スペクトルデータが得られる。いくつかの一般に見られる構成は:磁気/電気セクタ;四重極;飛行時間(TOF);およびフーリエ変換イオンサイクロトロン共鳴(FT ICR)を含む。
【0007】
セクタMS構成は、最も単刀直入な質量分散技法であり、異なるm/z比を有するイオンが、電界/磁界内で分離して、空間的に分離された位置でこの電界/磁界から退出し、その位置で、検出素子の固定のアレイによって、または用途に応じて異なるイオンを検出するように調整することができる1組の可動の小さい検出器によって検出される。これは、同時構成であり、試料からのすべてのイオンが、時間的に順次分離されるのではなく、空間内で同時に分離される。
【0008】
四重極構成は、おそらく最も一般的なMS構成であり、異なるm/z値のイオンが、1組(通常は4本)の平行な棒から、これらの棒対に適用されるRF/DC比の操作によって濾過される。特定のm/z値のイオンが、所与のRF/DC比でこれらの棒を通過して残り、その結果、イオンの連続分離および検出が生じる。その連続性のため、1つの検出素子のみが検出に必要とされる。イオントラップを使用する別の構成は、概念的に、四重極MSの特別な例と見なすことができる。
【0009】
飛行時間(TOF)構成は、別の連続分散および検出方式であり、検出前にイオンが高真空飛行管を通って入る。異なるm/z値のイオンは、異なる時間に検出器に到達するはずであり、到達時間は、既知の較正標準を使用することによって、m/z値に関係付けることができる。
【0010】
フーリエ変換イオンサイクロトロン共鳴(FT ICR)では、すべてのイオンをイオンサイクロトロンへ導入することができ、異なるm/z比のイオンは、異なる周波数で捕獲されて共鳴するはずである。これらのイオンは、無線周波(RF)信号を加えることによってパルス出力することができ、イオン強度は、検出器上で時間の関数として測定される。測定された時間領域データをフーリエ変換したとき、周波数領域データが回収され、周波数は、既知の較正標準を使用することによって、m/zに再び関係付けることができる。オービトラップMSシステムは、概念的に、特別な場合のFT MSと見なすことができる。
【0011】
相互参照する米国特許第6,983,213号に論じられているように、質量スペクトルデータ追跡は、典型的にピーク分析にかけられて、ピーク(イオン)が同定される。このピーク検出ルーチンは、非常に経験的で複雑なプロセスであり、ピークショルダ(peak shoulder)、データ追跡の雑音、化学的背景または汚染によるベースライン、同位体ピーク干渉などが考慮される。同定されたピークに関しては、MSピークが検出されたときは必ず、典型的に、重心計算(centroiding)と呼ばれるプロセスを適用して、m/z位置および推定ピーク面積(またはピーク高さ)という2つのデータ値のみを報告する。これは、データ記憶に関して非常に効率的であるが、上述した多くの干渉要因ならびに他のピークおよび/またはベースラインの存在下でピーク面積を判定する際の本質的な難しさのため、重心計算品質の客観的尺度なしで同位体を出現または消滅させる可能性のある多くの調整可能なパラメータによって損なわれるプロセスである。残念ながら、多くのMSシステム、特に四重極MSシステムにとって、このMSピーク検出および重心計算は従来、ファームウェアレベルでデータ獲得中に行われるようにMS方法の一部としてデフォルトで設定され、他の共存する化合物または検体からのスペクトル干渉のない純粋成分の質量スペクトルデータの場合でも、MSデータの完全性に修復できない損傷が生じる。米国特許第6,983,213号で指摘されているように、これらの損傷または欠点は、以下を含む:
a.最も一般的に使用される単位質量分解能のMSシステムでは質量精度が不足している。重心計算プロセスでは、質量誤差±1Daの整数m/zまたは少なくとも±0.1Daの他のm/z値の質量値が報告されているのに対して、米国特許第6,983,213号に開示されている方法を使用して適切に較正された生のプロファイルモードMSデータ(重心計算なし)は、±0.005Daまで正確とすることができ、これは約100倍の改善である。
b.ピーク積分誤差が大きい。MSピーク形状較正を含む完全な質量スペクトル較正を伴わない重心計算は、質量スペクトルピーク形状の不確実性、その変動性、同位体ピーク、ベースラインおよび他の背景信号、ランダム雑音を伴い、強いまたは弱い質量スペクトルピークに対して系統誤差とランダム誤差の両方を招く。
c.同位体存在比誤差が大きい。単位質量分解能を有する従来のMSシステムにおいて密接して位置する様々な同位体(たとえば、AおよびA+1)からの寄与を分離すると、隣接する同位体ピークからの寄与を無視し、または過大評価し、その結果、支配的な同位体ピークに対する誤差および弱い同位体ピークに対する大きいバイアスが生じ、またはさらにより弱い同位体が完全に排除される。
d.演算が非線形である。重心計算は典型的に、各段に多くの経験的に調整可能なパラメータを有する多段分離プロセス(multi-stage disjointed process)を使用する。各段で系統誤差(バイアス)が生成され、制御されない予測不能な非線形的な形で後の段へ伝播され、アルゴリズムがデータ処理品質および信頼性の尺度として意味のある統計を報告することが不可能になる。
e.支配的な系統誤差が生じる。産業用プロセス制御および環境監視からタンパク質同定またはバイオマーカ発見に及ぶMS用途のほとんどにおいて、計器の感度または検出限度は常に注目されており、測定誤差または信号内の雑音寄与を最小にするために、多くの計器システムにおいて大きな労力が費やされてきた。残念ながら、現在使用されている典型的な重心計算プロセスは、生データのランダム雑音よりさらに大きい系統誤差の発生源となっており、したがって計器感度の制約要因となっている。
f.数学的および統計的な矛盾を招く。重心計算で現在使用されている多くの経験的手法では、処理全体が数学的または統計的に矛盾している。ピーク処理の結果は、ランダム雑音のないわずかに異なるデータまたはわずかに異なる雑音のある同じ合成データに対して、劇的に変化する可能性がある。言い換えれば、ピーク重心計算の結果は頑強性を欠き、特定の実験またはデータ獲得に応じて不安定になる可能性がある。
g.計器ごとまたは調整ごとの変動性がある。通常、異なるMS計器からの生の質量スペクトルデータを直接比較することは、機械的、電磁的、または環境的公差の変動のために困難である。実際の生のプロファイルモードMSデータに典型的な重心計算が適用された場合、重心計算プロセスおよび重心データの量子化特性のため、異なるMS計器からの結果を定量的に比較する困難さが増すだけでなく、MSデータが重心データに減らされた後、変動性の発生源または潜在的な原因を追跡することが、不可能でない場合でも困難になる。
【0012】
純粋質量スペクトルを有するがスペクトル干渉を含まない十分に分離された検体の場合、MS重心計算は、上記で挙げた理由により、かなり問題となる。複合試料(たとえば、石油製品または精油)内に分解されていないまたは他の形で共溶出した検体または化合物がある場合、大規模なクロマトグラフ分離(たとえば、精油の1時間のGC分離、またはアミド分解などの翻訳後修飾による生体試料のLC分離)後でも、上記の重心処理の問題は、相互質量スペクトル干渉の存在およびMS重心の量子化特性により、さらに悪化するだけであり、質量スペクトルデータは線形加算性を失う。これにより必然的に、混合物のMS重心スペクトルは、各個別の純粋スペクトルから取得されるMS重心の和とは異なり、非線形かつ系統的な重心計算誤差がより悪くなり、さらには処理できなくなる。この理由で、典型的にはMS重心データで動作する、非特許文献1に報告されているAMDIS(自動質量スペクトル逆畳み込みおよび同定システム(Automated Mass Spectral Deconvolution & Identification System))と呼ばれる一般に使用される従来の共溶出逆畳み込み手法(co-elution deconvolution approach)では、確実なライブラリ(たとえば、NIST EI MSライブラリ)検索および化合物同定のために、共溶出化合物の正しい数の判定、個別の化合物もしくは検体の正しい分離時間プロファイル(クロマトグラフ分離の場合、クロマトグラムと呼ばれる)の導出、または正しい純粋成分/検体の質量スペクトルの算出を行うことができないことが多い。
【0013】
迅速な分析または検出の必要のために時間に基づく分離(たとえば、クロマトグラフ)を伴わない複合試料の場合、非特許文献2に報告されているDART(リアルタイム直接分析(Direct Analysis in Real Time))などの新規なイオン化技法を一例として使用すると、質量スペクトルはさらに複雑になり、その結果、検出または重心計算のために視覚的に分離可能な質量スペクトルピークが存在しないことがあり、場合により、従来の質量スペクトルデータの獲得、処理、および分析が一切できなくなる可能性がある。
【先行技術文献】
【非特許文献】
【0014】
【文献】「Optimization and Testing of Mass Spectral Library Search Algorithms for Compound Identification」、Stein、S.E.;Scott、D.R.J.Amer.Soc.Mass Spectrom.1994年、5、859~866
【文献】R.B.Cody;J.A.Laramee;H.D.Durst(2005)、「Versatile New Ion Source for the Analysis of Materials in Open Air under Ambient Conditions」.Anal.Chem.77(8):2297~2302
【発明の概要】
【発明が解決しようとする課題】
【0015】
したがって、従来技術の上述した欠陥および欠点を克服する、MSピーク検出および重心計算をともに回避するための方法を有することが望ましく、非常に有利になるはずである。
【課題を解決するための手段】
【0016】
本出願は、以下の改善点を対象とする:
1.関連する分離時間窓(separation time window)内で獲得された対応するプロファイルモード質量スペクトルデータの主成分分析(PCA)などの多変量統計分析(multivariate statistical analysis)によって、クロマトグラフピーク内に含まれる独立した検体を判定するための正確な手法が得られる。現在使用されている重心データではなく、プロファイルモード質量スペクトルデータを使用することが重要である。
2.1組のクロマトグラフ標準を使用することによって、関係する基本的なクロマトグラフピーク形状関数を完全にモデル化するための正確な手法が得られる。米国特許第6,983,213号および第7,493,225号を参照されたい。
3.クロマトグラフピーク形状が完全に画成された場合、たとえば反復改善および多重線形回帰(MLR)を介した初期ピーク位置のシンプレックス最適化(Simplex optimization)によって、関係する独立した検体のピーク(たとえば、中心)位置のみを判定して、クロマトグラフピーク内に隠された相互に重複する成分を完全に画成および分解する必要がある。
4.各クロマトグラフピークが明確に画成された場合、定性的同定(たとえば、NISTライブラリ検索による)または多重線形回帰による定量的分析のために、各検体に対する純粋質量スペクトルの算出が実行可能である。米国特許第7,577,538号を参照されたい。
5.ライブラリ(たとえば、NISTライブラリ)内の既知の化合物の同定信頼度の増大、またはライブラリ内に含まれていない未知のもしくは新しい化合物の解明の支援のために、正確な質量およびスペクトル精度分析を適用して、分子イオンまたはそのフラグメントイオンを確証する。
6.化合物ライブラリ(たとえば、NISTライブラリ)内にすでに含まれている化合物に利用可能な保持指標を使用することによって、追加の同定信頼度を得ることもできる。
7.試料または製品タイプの分析の目的で、試料を区別するために、所与の分離時間窓で獲得された複数の質量スペクトル走査を組み合わせて、類似のまたは異なる試料を比較する手法が得られる。
【0017】
これらの態様の各々について、その有用性を実証するために、実験結果とともに以下に説明する。
【図面の簡単な説明】
【0018】
図1】本明細書に開示する方法を利用することができる質量分析計システムのブロック図である。
図2図2Aおよび図2Bは、下のグラフが上のグラフの拡大版である、半揮発性有機化合物試料のGC/MS実行からの典型的なTIC(全イオンクロマトグラム)の2つのグラフである。
図3図3A図3B、および図3Cは、上のグラフ(A)が元のTICであり、中間のグラフ(B)が検出されたクロマトグラフピークのt値を示し、下のグラフ(C)が検出された各ピーク下で判定された検体の数を示す、分析結果の3つのグラフである。
図4図4Aおよび図4Bは、平坦なベースラインを有する3成分混合物ピーク下の検体の各々に対する逆畳み込みされたTIC(A)および再現されたTIC(B)の2つのグラフである。
図5図5A図5B、および図5Cは、図4に示す3つの検体に対応する3つの逆畳み込みされた純粋検体質量スペクトルのグラフである。
図6】関心保持時間に及ぶアルカン保持時間標準を含む標準的なGC/MS実行、ならびに米国特許第6,983,213号に参照されている質量精度およびスペクトル精度較正のための実行終了時のPFTBA(パーフルオロトリブチルアミン)MS調整ガスの全イオンクロマトグラム(TIC)である。
図7】本明細書に開示する一実施形態の流れ図である。
図8】本明細書に開示する別の実施形態の流れ図である。
【発明を実施するための形態】
【0019】
2つ以上の図面に共通する構成要素または構成は、図面の各々において同じ参照番号で示す。
【0020】
図1を参照すると、上述したタンパク質または他の分子を分析するために使用することができる、本発明の構成を組み込んだ分析システム10のブロック図が示されている。本発明について、図面に示す単一の実施形態を参照して説明するが、本発明は、実施形態の多くの代替形式で実施することができることを理解されたい。加えて、任意の好適なタイプの構成要素を使用することができる。
【0021】
分析システム10は、試料準備部分12、他の検出器部分23、質量分析計部分14、データ分析システム16、およびコンピュータシステム18を有する。試料準備部分12は、米国マサチューセッツ州ウォルサムのThermo Fisher Scientific Corporation製のLCQ Deca XP Maxなどのシステム10にとって関心のあるタンパク質、ペプチド、または小分子薬物を含む試料を導入するタイプの試料導入ユニット20を含むことができる。試料準備部分12はまた、システム10によって分析予定のタンパク質などの検体の事前分離を実行するために使用される検体分離ユニット22を含むことができる。検体分離ユニット22は、クロマトグラフィカラム、カリフォルニア州ハーキュリーズのBio-Rad Laboratories,Inc.製のゲル分離ユニットなどの電気泳動分離ユニット、または当技術分野ではよく知られているイオン移動度もしくは熱分解などの他の分離装置のいずれか1つとすることができる。分離のための技法は、ガスクロマトグラフィ(GC/MS)、液体クロマトグラフィ(LC/MS)、超臨界流体クロマトグラフィ、イオンクロマトグラフィ(IC/MS)、キャピラリ電気泳動(CE/MS)、ゲル電気泳動、イオン移動度または熱分解がある。電気泳動では、ユニットに電圧を印加し、例えば、毛細管等電点電気泳動点(Hannesh、S.M.、Electrophoresis 21、1202~1209(2000))を通しての泳動速度もしくは質量(1次元分離)による、1つもしくはそれ以上の変数に応じて、または例えば、等電点電気泳動および質量などによる、これらの変数の2つ以上に応じて、タンパク質を分離する。後者の一例は、2次元電気泳動として知られている。
【0022】
質量分析計部分14は、従来の質量分析計とすることができ、利用可能な任意の質量分析計とすることができるが、好ましくは、TOF、四重極MS、イオントラップMS、qTOF、TOF/TOF、またはFTMSのうちの1つである。質量分析計部分14がエレクトロスプレーイオン化(ESI)イオン源を有する場合、そのようなイオン源はまた、質量分析計部分14への試料入力を提供することができる。概して、質量分析計部分14は、イオン源24と、イオン源24によって生成されたイオンを質量電荷比で分離するための質量分析器26と、質量分析器26からイオンを検出するためのイオン検出器部分28と、質量分析計部分14が最も効果的に動作するのに十分な真空を維持するための真空システム30とを含むことができる。質量分析計部分14がイオン移動度分光計である場合、概して真空システムは必要とされず、生成されたデータは典型的に、質量スペクトルではなくプラズマグラムと呼ばれる。
【0023】
質量分析計部分14に並列に、他の検出器部分23を設けることができ、流れの一部分は、分流配置において試料のほぼ並列の検出のためにそらされる。この他の検出器部分23は、単一チャネルUV検出器、多チャネルUV分光計、または反射率(RI)検出器、光散乱検出器、放射能モニタ(RAM)などとすることができる。RAMは、14Cラベルの実験に対する薬物代謝の研究で最も広く使用されており、様々な代謝産物をほぼリアルタイムで追跡し、質量スペクトル走査を相関させることができる。
【0024】
データ分析システム16は、データ獲得部分32を含み、データ獲得部分32は、イオン検出器部分28からの信号をデジタルデータに変換するための1つまたは一連のアナログデジタル変換器(図示せず)を含むことができる。このデジタルデータは、リアルタイムデータ処理部分34へ提供され、リアルタイムデータ処理部分34は、加算および/または平均化などの演算によってデジタルデータを処理する。後処理部分36を使用して、ライブラリ検索、データ記憶、およびデータ報告を含むリアルタイムデータ処理部分34からのデータの追加の処理を行うことができる。
【0025】
コンピュータシステム18は、後述するように、試料準備部分12、質量分析計部分14、他の検出器部分23、およびデータ分析システム16の制御を提供する。コンピュータシステム18は、適当なスクリーンディスプレイ上でのデータの入力および実行された分析の結果の表示を可能にするために、従来のコンピュータモニタまたはディスプレイ40を有することができる。コンピュータシステム18は、たとえばWindows(登録商標)もしくはUNIX(登録商標)オペレーティングシステムまたは任意の他の適当なオペレーティングシステムで動作する任意の適当なパーソナルコンピュータに基づいたものとすることができる。コンピュータシステム18は、典型的に、ハードドライブ42または他のタイプのデータ記憶媒体を有し、この記憶媒体上に、後述するデータ分析を実行するためのオペレーティングシステムおよびプログラムが記憶される。本発明によるプログラムをコンピュータシステム18上へロードするために、CD、フロッピディスク、メモリスティック、または他のデータ記憶媒体を受け入れるための取外し可能なデータ記憶デバイス44が使用される。試料準備部分12および質量分析計部分14を制御するためのプログラムは、典型的に、システム10のこれらの部分に対するファームウェアとしてダウンロードされる。データ分析システム16は、以下に論じる処理工程を実施するために、C++、JAVA、またはVisual Basicなどのいくつかのプログラミング言語のいずれかで書かれたプログラムとすることができる。
【0026】
本発明の好ましい実施形態では、図1に記載するクロマトグラフィ/質量分析システムによって試料が獲得され、質量スペクトルプロファイルモードの生データが、実行全体にわたって連続して獲得され、その結果、図2に示すようなデータ実行が得られ、これはPFTBA調整ガスを含む多くのクロマトグラフピークを含む例示的なGC/MS実行である。PFTBA調整ガスは、米国特許第6,983,213号に記載されている手法を使用して、後の処理および分析の前に生プロファイルモード質量スペクトルデータに対する質量精度およびスペクトル精度較正を実行するために使用することができる。後の処理および分析に伴う詳細な工程について、次に説明する:
a.図2に示すTICから、すべてのクロマトグラフピークを検出する。これは、知られている純粋クロマトグラフピーク形状関数によって分離時間範囲全体にわたって最善に実現することができ、分離時間範囲は、必要とされる保持時間範囲に及ぶように異なる炭素数を有するアルカンなどの1組の知られている標準を使用して、同じクロマトグラフ分離条件下で測定することができる。また、米国特許第6,983,213号で質量スペクトルピーク形状較正が実行される方法と同様に、クロマトグラフピーク形状較正を実行して、実際のピーク形状を標的ピーク形状に変換することもでき、この方法は、2006年4月10日出願の米国特許出願第11/402,238号にさらに開示されている。実際の測定または較正によってクロマトグラフピーク形状が明確に画成された後、米国特許第6,983,213号からのピーク検出および分析方法を利用して、図2Bに示すようにクロマトグラム内のすべてのクロマトグラフピークを検出することができ、そのピーク検出結果が、図3に示されている。
b.図3Bは、検出されたピークの統計的有意性に対する統計的標示であるピーク検出からのt-値を示し、ここでは典型的に、2.0のt-値は約95%の信頼度に対応し、3.0のt-値は99%の信頼度に対応する。検出されたピークのいくつかは純粋であり、したがってライブラリ検索(同定)または定量的分析の準備ができているが、いくつかは純粋ではなく、いずれにも好適でないはずである。これらのクロマトグラフピークを同定して、その純度を評価し、不純物または共溶出検体が存在する相互干渉を理論上分離することが重要である。純度検出ならびに不純物または共溶出の場合の確実な逆畳み込みを実現するためには、クロマトグラフピークまたは分離時間窓内に含まれる独立した検体を判定するための確実な手法を有することが必須である。これは、分離時間窓に対応して、獲得したプロファイルモード質量スペクトル走査データ(生またはPFTBA較正済み)上で多変量統計分析を実行することによって実現される。多変量統計分析は、特異値分解またはNIPALSアルゴリズムに基づいて、主成分分析(PCA)または部分最小二乗など、当技術分野で知られている十分に確立された様々なアルゴリズムを使用することで実現することができる(S.Wold、P.Geladi、K.Esbensen、J.Ohman、J.Chemometrics、1987、1(1)、41)。図3Cは、検出された有意の各クロマトグラフピークに対して判定された独立した成分(検体)の数を示す。
c.成分の正しい数が判定された後、次の工程は、後のより正確な化合物同定のために、獲得された生の形式で、または好ましくはPFTBA較正済み形式で、同じプロファイルモード質量スペクトルデータを使用して、混合物からのこれらの成分(重複成分)の所与の数を逆畳み込みすることである(MS較正フィルタを適用した影響により信号対雑音がより良好になるという利点に加えて)。
d.クロマトグラフピーク形状が完全に画成された場合、たとえばシンプレックス最適化によって、関係する独立した検体または成分のピーク(たとえば、中心)位置のみを判定して、クロマトグラフピーク内に隠された重複成分を完全に画成および分解する必要がある。図4Aに示すRt約2.66分で検出された3成分混合物の場合、シンプレックス検索によって、1組の初期値から開始して、3つの基本的な重複するクロマトグラフピークを判定することができ、1組の初期値は、米国特許第6,983,213号に開示されており、米国特許出願第11/402,238号にさらに開示されている方法を使用して、目的関数として多重線形回帰(MLR)からの適合残差によって反復して精製され、その結果が、平坦なベースラインも含む図4Aに示されている。平坦なベースライン以外の他のタイプのベースラインを含むこともできる。図4Bは、図4Aに示すように判定されたそれぞれの分離時間プロファイルを有するこれらの成分/検体を使用して、実際のTICに対する優れた適合を示す。
e.混合物質量スペクトルデータを各検体に対する各純粋質量スペクトルに逆畳み込みする。図4Aからの逆畳み込みされた純粋クロマトグラムによって、米国特許第7,577,538号および第6,983,213号に参照されている方法論を使用して、多重線形回帰(MLR)によって、図5A図5B、および図5Cに示すように、各個別検体に対する対応する純粋質量スペクトルを算出することが可能である。
f.次いで、逆畳み込みされた純粋質量スペクトルは、スペクトル強度を使用することによって、または一連の濃度標準による較正によって、定性的同定(たとえば、NISTライブラリ検索)または定量的分析に使用される。同様に、イオン移動度またはプラズマグラムを使用した爆発物検出などの関心化合物の定性的分析および同定のために、異なる爆発物化合物が異なる特有のドリフト時間を有することに基づいて、逆畳み込みされた分離時間プロファイルを使用することができる。分離時間プロファイルはまた、プロファイル強度を使用することによって、または一連の濃度標準によって、定量的分析に使用することもできる。GC/MSまたはLC/MSの場合、逆畳み込みされた時間プロファイルおよび純粋質量スペクトルの両方を正規化し、後の定量的分析のために倍率の形式で定量的な情報を残すことができる。
g.試料実行(図2A)中にPFTBA調整ガスが調整される好ましい実施形態では、正確な質量およびスペクトル精度分析を適用して、EI MSからの分子イオンおよびフラグメントイオンの両方を分析するという追加の利点がある。GC/MSは、標的の化合物および未知の化合物(化合物ID)の両方の同定のための強力なツールである。この技法の基本は、電子衝撃(EI)を介して溶出分子がイオン化されたとき、比較的活動的なソースが、分子構造を示す特徴的なパターンを提供するように、分子をフラグメント化することに依拠する。分子のパターン、フラグメント、および相対存在比が、公称質量分解能で獲得された測定スペクトルのライブラリに対して検索され、単純なマッチングアルゴリズムに基づいて分類される。この技法は、1)化合物が純粋であること(背景または共溶出なし)、および2)化合物がライブラリ内にあることを条件として、非常によく機能する。加えて、検索結果は、常に完全に決定的であるとは限らず、分子の同一性を確証するために、追加の直交測定を有することが有用である。CLIPS(Calibrated Line-shape Isotope Profile Search)検索(2005年10月28日出願の国際特許出願PCT/US2005/039186を参照されたい)は、正確な質量およびスペクトル精度を組み合わせて、または利用可能な場合、分子イオン(フラグメント化されていない分子)の追加の情報(式ID)を提供することによって、これらの頑強な低分解能MS計器を、ライブラリ検索結果の認証を支援するための強力なツールに変換する。化合物同定(ID)(分子構造の判定)と式ID(分子式の判定)とを区別することが重要である。通常の手法は、分子イオンを選択し、CLIPS検索を実行して、認証のためにNIST検索と比較することができる式IDを提供することであり、または本当の未知試料がライブラリ内にない場合、式IDを提供して、化合物が何であるかについて最初の洞察を提供することである。しかし、分子イオンならびにすべてのフラグメント上で式IDを行うことも可能である。これは、構造の「推量」を行うのに非常に強力であり、現在は、公称質量値のみを使用して少数の「専門家」(IRスペクトル解釈の専門家のように廃れつつある)によって行われている。これは、一般に生成されるいくつかのフラグメントが、質量差を測定することによって分子イオンから簡単に推定することができることから行うことができる。しかし、これが最善の技術であり、相当な技能を必要とする。イオンフラグメント式IDのすべてを自動的かつ正確に判定し、おそらくいくつかの可能な化合物IDをさらに提案することが可能であることが、非常に望ましく、有用である。これは、すべてのイオンフラグメント上で一連のCLIPS検索を使用し、次いで結果を相互比較することによって行うことができる。どのイオンフラグメントも、分子イオンの部分集合であるはずであり、したがってすべてのフラグメントが関係付けられているはずであり、したがって自動スペクトル解釈を利用するには強力な制約がある。この情報を生成することができる1つの可能な一連の工程について、以下に述べる。
i.クロマトグラフピーク上で、平均的な較正済みプロファイルスペクトルを測定する。
ii.ピーク検出によって、すべてのモノアイソトピックピークを特定する。
iii.報告された正確な質量によって、各イオンフラグメント上でCLIPS検索を実行する。
iv.2005年10月28日出願の国際特許出願PCT/US2005/039186に開示されているように、スペクトル精度(以下、「SA」)を使用して、CLIPS検索ヒットリストを相互比較する。
v.フラグメントのSAが90%を上回り、分子イオンの部分集合である場合、フラグメントの正しい式が同定されている。
vi.フラグメントのSAが90%を上回るが、分子イオンの部分集合ではない場合、これは異なる化合物(混合物)に由来する可能性があり、次の化合物候補のために上記のヒットリストを検索し、そのフラグメントを検査することができる。
vii.フラグメントのSAが90%を下回る場合、フラグメントはスペクトル的に純粋ではなく、したがって異なる化合物のフラグメントイオンからの干渉を受ける可能性が高い。これが当てはまる場合、他のフラグメントを調査し、第2の化合物に関係するかどうかを判定する。最後に、1組またはそれ以上の組のフラグメント化が判定される。MSの「専門家」とは異なり、SAはフラグメントの式IDを正確に確証する。混合物が発見された場合、論理フラグメントが提案され、関連するフラグメントを結びつけるためのCLIPS検索が実行され、SAが90%を上回るとき、正しい答えを提供する。不純フラグメントに伴う1つの一般的な問題は、フラグメントを有するがフラグメント-Hを有する傾向があり、これらのイオンが重複することである。これは、分析のために複数のイオンを含むように拡張することができるCLIPS検索で容易に処理される。
viii.フラグメント式IDおよび混合物逆畳み込みを自動的に提供することが非常に有用である。しかし、数百万の化合物を有し、式IDおよびいくつかのフラグメント化規則を使用する化学化合物の商用データベース(たとえば、ChemSpiderという市販のデータベース)を使用して、最初から構造を実際に提案することが可能である。
ix.分子イオンが存在しない場合(珍しいことではない)、この手順を逆に利用することができる。たとえば、一般的なフラグメントのリストが利用可能であり、構造的な手掛かりになる。簡単な事例(利用可能な純粋分子イオン)から開始し、次いで複雑さを増して、各事例に対する最善の手法を見出すことができる。異なるクロマトグラフ分解能で実行される多くの知られている化合物によって、分解されていない混合物を制御された形で生成および調査することができる。
【0027】
図7は、本明細書に記載する第1の実施形態の流れ図に上記の工程を示し、51で、質量スペクトルデータが生プロファイルモードで獲得される。52で、可能な化合物が見つからない分離時間窓の分析を回避するために、上記の工程(a)から検出されたピークに対応する時間窓が選択される。他方では、計算能力が関心事でないとき、特に現代のコンピュータの場合、分離時間範囲全体に及ぶように実行全体を次々に配置された一連の時間窓に分けること、または分離時間範囲全体を単一の時間窓として算出することを選ぶことができる。53で、所与の時間窓内のMS走査のための多変量統計分析を実行して、存在する検体の数を判定する。54で、検体の分離時間プロファイルおよび時間位置が取得される。55で、発見されたすべての検体に対する純粋質量スペクトルが算出される。
【0028】
上記の好ましい実施形態では、異なる炭素数を有するアルカンなどのクロマトグラフ時間プロファイル較正標準はまた、高いライブラリ検索スコアならびに高い質量精度およびスペクトル精度(SA)に加えて、未知の化合物に対して計算された保持指標がライブラリ化合物のものにもマッチすることを確証することができるため、実際の保持時間を保持指標に変換するための保持時間標準として働くこともでき、それによりライブラリ検索による追加の次元の化合物同定が可能になるはずである。実際には、これらすべてのマッチスコアを組み合わせて、化合物同定に対するマッチ品質の全体的な測定を取得することができる。図6は、クロマトグラムピーク形状(分離時間プロファイル)および保持時間のためのアルカン較正標準とPFTBA MS較正標準との両方を含む包括的な標準実行を示し、すべてが単一の外部実行に含まれる。
【0029】
クロマトグラフ保持指標の検索またはマッチの追加の利点は、使用者が、クロマトグラフピークに対して算出された保持指標およびそれに関連する信頼区間(または誤差限界)に基づいて、既知の化合物ライブラリから1組または範囲内の可能な化合物を判定することである。この1組または範囲内の暫定的に同定された化合物は、ほとんどまたは一切の時間分離なく、互いに完全に重複することがあり、確実な逆畳み込みが統計的に不安定になり、または数学的に不可能になる。この場合、可能性のある量の標示として回帰係数を使用し、可能性のある化合物の存在の標示として適合統計(たとえば、t-値)を使用して、定性的分析(同定)および定量的分析の両方に対して、測定されたプロファイルモード質量スペクトルと、ライブラリから構築されたものとの間で、米国特許第7,577,538号に記載されている回帰分析を実行することができる。
【0030】
四重極MSなどの多くのMS計器において、質量スペクトル走査時間は、化合物(揮発性化合物、タンパク質、またはペプチド)の溶出時間と比較すると、無視できるものではない。したがって、GC/MSに対して報告されている内容(Stein、S.E.ら、J.Am.Soc.Mass Spectrom.5、859(1994))と同様に、1つの質量スペクトル走査内で測定されたイオンがLC溶出中の異なる時点から生じる場合、かなりのスキューが存在するはずである。走査速度または指定の質量範囲を走査するのにかかる実際の時間にかかわらず、同じクロマトグラフ保持時間にすべての質量が「獲得」されることを確実にするために、典型的な低速走査四重極クロマトグラフィ/質量分析システム内に存在するあらゆる時間スキューを補正することが好ましい。これは、MS走査速度、走査方向(低m/zから高m/z、その逆、または組合せ)、および2つの連続する走査間の滞留時間を考慮に入れて、各m/z位置に対する実際の獲得時間を同じ実際の保持時間の格子上へ補間することによって実現することができる。このスキュー補正により、分離時間窓内の質量スペクトル走査または逆畳み込み分析を使用して成分の正しい数を判定するための多重線形回帰(MLR)、主成分分析(PCA)、部分最小二乗(PLS)などの多変量統計分析の性能が改善される。
【0031】
いくつかのMS用途では、試料は、2DのGCまたはLC分離を含む最も綿密な分離方法でも、十分に分離するには複雑すぎる可能性があり、または迅速な現場での分析の必要により、より速い分離もしくは一切分離しないことが求められる。この場合、典型的にはDARTイオン源を用いる場合など、分離なしで試料に対して単一の複雑な質量スペクトルを取得することができ(速いが、イオン抑制を受けるはずである)、またはクロマトグラフ実行中の所与の分離時間窓内でプロファイルモードの質量スペクトル走査を簡単に加算もしくは平均化することができる(分離なしの直接分析ほど速くないが、ある程度の分離により、イオン抑制を受けにくいはずである)。質量スペクトルの複雑さにより、結果として得られた質量スペクトルを分析し、個別の化合物に分類することができない可能性があるが、PCAまたはPLSなどの多変量統計分析の使用によって、既知の試料と未知の試料との間の統計的距離尺度を得て、これらの類似性を示し、または1つの試験/未知の試料が所与の製品もしくは試料群に属するかどうかを決定するため、複雑な質量スペクトルパターンに基づいて、これらのプロファイルモード質量スペクトルおよび対応する試料(たとえば、石油または精油)を分析することが可能である。
【0032】
図8は、上述した工程を含む流れ図を示す。61で、既知および未知の試料に対する生プロファイルモードの質量スペクトルデータが取得される。62で、質量スペクトルデータが分離時間窓内で組み合わされる。63で、組み合わされた質量スペクトルデータに対する多変量統計分析が実行され、既知の試料と未知の試料との間の距離測定が算出される。64で、この距離は、未知の試料が既知の試料または試料群に属する可能性を示すための尺度として使用される。
【0033】
この技法の例示的な用途には、爆発物に対する空港保安検査、粗悪品またはラベル間違いの可能性を検出および/または防止するための精油供給者の品質管理または保証、石油製品の分析および区別が含まれる。これらの場合、典型的には、統計的閾値を確立するために、試料または試料群を2回以上獲得することを必要とするはずであり、この統計的閾値を上回ると、試料間の実際の違いをより確実にすることができ、この統計的閾値を上回って超えると、試料準備もしくは測定プロセスからのランダム統計的変動が生じ、または生産プロセスにおけるバッチごとの変動が予期される。また、1群の既知の試料を生成し、これらを関連する質量スペクトルとともに既知の試料のライブラリ内へ記憶することができ、このライブラリ内へ、将来の試験の目的で、または他の使用者へ販売される商用製品として、既存の試料群または新しい試料群に属する新しい試料を生成および追加して、生きた増大する1群の試料および試料タイプを取得または回収することができる。この場合、米国特許第6,983,213号に記載の方法によって、質量スペクトルプロファイルモードデータを質量およびスペクトル精度の両方に対して較正することが非常に好ましく、その結果、ライブラリに入力されたすべての質量スペクトルデータおよび試料が、使用されたMS計器または動作条件(調整を含む)にかかわらず、正確な質量を含む同じ一貫したMSピーク形状を有し、分析のための時間および労力を節約しながら、最適の分析精度を実現する。
【0034】
上記の説明は多くの詳細を含むが、これらは本発明の範囲を限定すると解釈されるべきではなく、本発明のいくつかの実行可能な実施形態の説明を提供するだけである。
【0035】
したがって、本開示の範囲は、与えられた例ではなく、添付の特許請求の範囲およびその法的均等物によって決定されるべきである。本開示について、記載の実施形態を参照して説明したが、本開示は、実施形態の多くの代替形式で実施することができることを理解されたい。加えて、要素または材料の任意の好適なサイズ、形状、またはタイプを使用することができる。したがって、本説明は、添付の特許請求の範囲の範囲内に入るすべてのそのような代替形態、修正形態、および変形形態を包含することを意図したものである。
【0036】
本開示は、コンピュータシステムによって実行されたとき、本明細書に記載する方法の工程を実施させるコンピュータプログラムの命令を記憶しているコンピュータ可読非一過性記憶媒体において実施することができることが理解されよう。そのような記憶媒体は、上記の説明に記載したもののいずれかを含むことができる。
【0037】
本明細書に記載する技法は例示的であり、本開示に対する特定の限定を示唆すると解釈されるべきではない。様々な代替形態、組合せ、および修正形態を、当業者であれば考案することができることを理解されたい。たとえば、本明細書に記載するプロセスに伴う工程は、工程自体による別段の指定または指示がない限り、任意の順序で実行することができる。本開示は、添付の特許請求の範囲の範囲内に入るすべてのそのような代替形態、修正形態、および変形形態を包含することを意図したものである。
【0038】
「含む(comprises)」または「含む(comprising)」という用語は、記載の構成、整数、工程、または構成要素の存在を指定するが、1つまたはそれ以上の他の構成、整数、工程、もしくは構成要素、またはこれらの群の存在を除外しないと解釈されるべきである。
図1
図2
図3
図4
図5
図6
図7
図8