【課題を解決するための手段】
【0014】
上記課題を解決するために成された第1発明は、同一被検試料に対するMS
pスペクトルデータ(p≧2である整数)とMS
qスペクトルデータ(q>pである任意の一つの整数又は互いに異なる複数の整数)とを利用し、データベース検索により該被検試料中のペプチドを同定する質量分析データ解析方法であって、
a)前記MS
pスペクトルデータから求めたピークリストを用い、データベースに登録されているペプチドに対する理論MS
pフラグメントの質量情報との一致性に基づく指標値を算出し、該指標値に基づいて候補ペプチドを選定する候補選定ステップと、
b)該候補選定ステップにより選定された候補ペプチドについて理論MS
qフラグメントの質量情報を求め、その中で、対応するピークが前記MS
pスペクトルデータ中に存在せず前記MS
qスペクトルデータ中に存在するものを抽出する追加情報抽出ステップと、
c)該追加情報抽出ステップにおいて抽出されたピークを前記MS
pスペクトルデータから求めたピークリストに追加することにより該ピークリストを修正するピークリスト修正ステップと、
d)該ピークリスト修正ステップにおいて前記候補ペプチドに対応して修正されたピークリストに基づいて、該候補ペプチドに対する理論MS
pフラグメントの質量情報との一致性に基づく指標値を再計算する再計算ステップと、
を有し、再計算された指標値に基づいて前記候補ペプチドが正解ペプチドであることの信頼度を判定可能としたことを特徴としている。
【0015】
また上記課題を解決するために成された第2発明は、第1発明に係る質量分析データ解析方法を具現化するための装置であって、同一被検試料に対するMS
pスペクトルデータ(p≧2である整数)とMS
qスペクトルデータ(q>pである任意の一つの整数又は互いに異なる複数の整数)を利用し、データベース検索により該被検試料中のペプチドを同定する質量分析データ解析装置において、
a)前記MS
pスペクトルデータから求めたピークリストを用い、データベースに登録されているペプチドに対する理論MS
pフラグメントの質量情報との一致性に基づく指標値を算出し、該指標値に基づいて候補ペプチドを選定する候補選定手段と、
b)該候補選定手段により選定された候補ペプチドについて理論MS
qフラグメントの質量情報を求め、その中で、対応するピークが前記MS
pスペクトルデータ中に存在せず前記MS
qスペクトルデータ中に存在するものを抽出する追加情報抽出手段と、
c)該追加情報抽出手段により抽出されたピークを前記MS
pスペクトルデータから求めたピークリストに追加することにより該ピークリストを修正するピークリスト修正手段と、
d)該ピークリスト修正手段により前記候補ペプチドに対応して修正されたピークリストに基づいて、該候補ペプチドに対する理論MS
pフラグメントの質量情報との一致性に基づく指標値を再計算する再計算手段と、
を備え、再計算された指標値に基づいて前記候補ペプチドが正解ペプチドであることの信頼度を判定可能としたことを特徴としている。
【0016】
第1及び第2発明において、例えばpは2、qは3とすることができるが、p、qはこれに限らない。また、qは一つのみでなく複数であってもよい。例えば、pが2のとき、qは3及び4としてもよい。即ち、MS
qスペクトルデータは異なる回数の開裂操作(例えばCID)によりそれぞれ取得した質量分析データであってもよい。
【0017】
また第1及び第2発明において、「ペプチドの理論MS
pフラグメントの質量情報」とは、当該ペプチドに対するMS
p段階のフラグメンテーションの態様を理論的に予測することで得られるフラグメント(フラグメントイオンのほかニュートラルロス等の非電荷断片も含む)の質量(質量電荷比)のことである。また「理論MS
qフラグメントの質量情報」とは、同様に、MS
q段階のフラグメンテーションの態様を理論的に予測することで得られるフラグメント(フラグメントイオンのほかニュートラルロス等の非電荷断片も含む)の質量(質量電荷比)のことである。
【0018】
第1発明に係る質量分析データ解析方法において、候補選定ステップでは、例えば被検試料に対するMS
pスペクトルデータに対しピークピッキングを行って少なくともピークリスト(少なくとも各ピークの質量情報を含む)を作成し、これに基づき、例えばMS/MSイオンサーチ等のデータベース検索エンジンソフトウエアを利用してデータベース検索を実行することで、目的とするペプチドである可能性がある候補ペプチドを選定する。通常、質量情報の一致性に基づく指標値が所定の閾値以上である複数の候補ペプチドが選定される。なお、候補選定ステップは、従来の一般的なデータベース検索法でも実施されている処理ステップである。
【0019】
次いで、追加情報抽出ステップでは、選定された一つの候補ペプチドについて実測のMS
qスペクトルと同一のプリカーサイオンに対する理論MS
qフラグメントの質量情報を算出し、その質量の中で、対応するピークが実測のMS
pスペクトルデータ中に存在せず、実測のMS
qスペクトルデータ中に存在するものを抽出する。CID等の開裂操作ではその条件等によってアミノ酸配列の結合の切れる位置が変化するから、MS
q分析段階で存在するアミノ酸残基は、MS
p分析段階で存在するとみなしても何ら問題ない。即ち、理論MS
pフラグメントの質量が実測のMS
pスペクトルデータ中に存在しなくても、理論MS
qフラグメントの質量が実測のMS
qスペクトルデータ中に存在してさえいれば、該質量を持つフラグメントに対応したアミノ酸残基は被検試料中のペプチドの一部であると推測できる。そこで、追加情報抽出ステップにおいて抽出されたピークは候補ペプチドのMS
pスペクトル上に存在しているものとみなし、該ピークをMS
pスペクトルデータから求めたピークリストに追加する。即ち、これは、その候補ペプチドの信頼度を上げるのに寄与する情報を追加したことを意味する。
【0020】
ペプチドのフラグメンテーションの態様は開裂手法によっても相違し、広く用いられているCIDではC末端由来のb系列イオンとN末端由来のy系列イオンとが顕著に観測されるから、データベース検索等においてもこれら系列のイオンピークが用いられる。この場合、MS
qスペクトルでは、MS
q分析の際のプリカーサイオンがb系列イオンであるかy系列イオンであるかによって、MS
pスペクトルと質量電荷比が共通となるイオンの系列が相違する。そのため、例えばMS
2スペクトル上のy系列イオンをプリカーサイオンとしてMS
3分析を行った場合には、MS
2スペクトルとMS
3スペクトルとでy系列イオンの質量電荷比が共通になる一方、b系列イオンの質量電荷比はMS
2のプリカーサイオン(解析対象である特定ペプチドのイオン)の質量電荷比とMS
3プリカーサイオンの質量電荷比との差の分だけ、MS
2スペクトルよりもMS
3スペクトルにおいて小さくなる。一方、MS
2スペクトル上のb系列イオンをプリカーサイオンとしてMS
3分析を行った場合には、MS
2スペクトルとMS
3スペクトルとでb系列イオンの質量電荷比が共通になる一方、y系列イオンの質量電荷比は上記質量電荷比の差の分だけ、MS
2スペクトルよりもMS
3スペクトルにおいて小さくなる。そこで、追加情報抽出ステップでは、MS
3分析のプリカーサイオンがy系列イオン、b系列イオンのいずれであるのかに従って、一方の系列イオンでは単純に理論MS
3フラグメントの質量電荷比に対応したピークをMS
2のピークリストに追加し、他方の系列では理論MS
3フラグメントの質量電荷比に上記質量電荷比の差を加算した質量電荷比に対応したピークをMS
2のピークリストに追加するとよい。
【0021】
上述したようにMS
pのピークリストに追加されたピークはその候補ペプチドの理論MS
pフラグメントの質量と一致するから、これはデータベース検索の過程で求まる該候補ペプチドの指標値を高める筈である。そこで、再計算ステップでは、その候補ペプチドに対応して修正されたピークリストに基づいて該候補ペプチドについての指標値を計算し直す。これにより、実測MS
pスペクトルに基づいて挙げられた候補ペプチドの信頼度を示す指標値を、実測MS
qスペクトルの情報を利用することで、より正確な値に修正することができる。したがって、この再計算された指標値を利用すれば、候補ペプチドが正解ペプチドであるか否かを正確に判断することが可能となる。
【0022】
第1発明に係る質量分析データ解析方法において、好ましくは、前記候補選定ステップでは、指標値が所定閾値以上である候補ペプチドを複数選定し、その複数の候補ペプチドの全てについてそれぞれ、前記追加情報抽出ステップ、前記ピークリスト修正ステップ、及び前記再計算ステップ、による処理を実行し、前記複数の候補ペプチドの再計算された指標値を比較して最も指標値の高い候補ペプチドを正解ペプチドであるとして同定するとよい。
【0023】
この質量分析データ解析方法によれば、実測のMS
qスペクトルの情報を利用した、より正確性の高い指標値に基づいて複数の候補ペプチドの中から最も信頼性の
高いペプチドを選出できるので、ペプチドの同定精度を向上させることができる。また、そのペプチド同定結果と併せて指標値を提供することができる。
【0024】
さらに好ましくは、前記複数の候補ペプチドの再計算された指標値の分布に基づいて、前記正解ペプチドであるとされた指標値に対応した期待値を算出して該期待値をその同定の信頼度情報として提供するとよい。指標値の分布から期待値を算出するアルゴリズム自体は、例えばMS/MSイオンサーチに搭載されている機能をそのまま利用することができる。これによれば、同定結果の信頼度や妥当性を分析者が判断する際により有用な情報を提供することができる。