【課題を解決するための手段】
【0011】
上述したデノボシーケンシングを用い、MS
2スペクトルに基づいてアミノ酸配列の一部分を推定するには、その配列の両端部に対応する始点ピーク及び終点ピークを識別する必要がある。しかしながら、多くの場合、MS
2スペクトルには様々な要因による不要なピークが現れているため、該スペクトルから上記始点ピーク、終点ピークを自動的に識別するのは困難であり、それ故に正確なシーケンシングを行うのは殆ど不可能である。一般に、部分的なアミノ酸配列を正確に推定できるのは、プリカーサイオンの質量電荷比から質量電荷比ゼロまでの間を、アミノ酸配列末端の質量電荷比の補正を加えてプロダクトイオンの不足なしにアミノ酸配列を確定できた場合であり、通常、これはプリカーサイオンの質量電荷比が小さい場合に限られる。なお、ここでいうアミノ酸配列末端の質量電荷比の補正とは、ペプチドのN末端、C末端に付加するH、OH
3の質量電荷比の補正である。ピーク間の質量電荷比の差はアミノ酸残基の質量に相当するが、或るピークと質量電荷比0との間はアミノ酸残基の質量及びH又はOH
3の質量に相当する。同様に、或るピークとプリカーサイオンの質量電荷比との差も、アミノ酸残基の質量及びH又はOH
3の質量に相当する。
【0012】
一方、イオンの選択と解離操作とを繰り返し実行して得られるnが3以上であるMS
nスペクトルは、一般にS/Nが良くプロダクトイオンピークが明瞭に現れる。こうしたMS
n分析の際のプリカーサイオンは元のペプチドのうちの一部のアミノ酸配列に対応するものにすぎないが、該プリカーサイオンを解離させたときに生成されるプロダクトイオンの種類は少ないため、上述したデノボシーケンシングを用いたアミノ酸配列推定の信頼性が高い。特に、プリカーサイオンの質量電荷比が小さければ(一般的には500Da程度未満)、該イオンを構成するアミノ酸残基の数はかなり限られる(2〜4程度)ため、デノボシーケンシングによってアミノ酸配列をかなり高い信頼度で以て推定できる。即ち、低質量であるプリカーサイオンに対するMS
nスペクトルは、ペプチド全長のアミノ酸配列を直接的に求めるには不適であるが、部分的なアミノ酸配列を高い精度で推定するには好適であるといえる。本願発明者はこうした点に着目し、従来はむしろ軽視されていた低質量であるイオンを優先的に解離させ、それによって得られるMS
nスペクトルに対するデノボシーケンシングによってプリカーサイオンのアミノ酸配列を正確に求め、これをシーケンスタグとして利用することに想到した。
【0013】
上記課題を解決するために成された第1発明は、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析方法であって、
a)被検試料に対し
、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMS
nスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定ステップと、
b)MS
2分析のプリカーサイオンの質量電荷比、MS
n分析のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索ステップと、
を有することを特徴としている。
【0014】
通常のタンパク質同定と同様、一般に被検試料は目的とするタンパク質を酵素消化等により断片化して調製したペプチド混合物であるが、消化されないタンパク質(つまりアミノ酸配列が極端に長いもの)が混じっている場合などにおいては、シーケンスタグで示される部分的なアミノ酸配列がアミノ酸全長に比べて短すぎて、第1発明に係る質量分析データ解析方法ではペプチドの絞り込みが十分に行えないことがあり得る。そこで、こうした場合には、複数段の解離操作を行う際の全てのプリカーサイオンの質量電荷比の情報を利用するとよい。
【0015】
即ち、上記課題を解決するために成された第2発明は、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析方法であって、
a)被検試料に対し
、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMS
nスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定ステップと、
b)MS
m分析(mは2以上n以下の全ての整数)のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索ステップと、
を有することを特徴としている。
【0016】
また、上記課題を解決するために成された第3発明は、上記第1発明に係る解析方法を実施するための装置であり、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析装置であって、
a)被検試料に対し
、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMS
nスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
b)被検試料に対しMS
n分析(nは3以上の整数)を実行することで得られたMS
nスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
c)MS
2分析のプリカーサイオンの質量電荷比、MS
n分析のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定手段により求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成手段と、
d)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索手段と、
を備えることを特徴としている。
【0017】
また、上記課題を解決するために成された第4発明は、上記第2発明に係る解析方法を実施するための装置であり、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析装置であって、
a)被検試料に対し
、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMS
nスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
b)MS
m分析(mは2以上n以下の全ての整数)のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定手段により求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成手段と、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索手段と、
を備えることを特徴としている。
【0018】
第1乃至第4発明に係る質量分析データ解析方法及び解析装置では、プロダクトイオンの種類が少なく、その意味では情報量に乏しい、相対的に低い質量電荷比のプリカーサイオンに対するMS
nスペクトルにデノボシーケンシングを適用して部分的なアミノ酸配列情報を取得する。
本願発明者の検討によれば、部分的なアミノ酸配列を正確に推定するために、デノボシーケンシングを適用するMSnスペクトルのプリカーサイオンは、その質量電荷比が4残基以下のアミノ酸配列に相当するものとするとよい。これは、質量電荷比でいうと500Da程度以下である。したがって、このような条件を満たし且つプリカーサイオンとして適当な強度をもつイオンが現れるまでイオンの解離操作を繰り返して適当なMSnスペクトルを取得する。MS
nスペクトルからアミノ酸配列を推定する際には、MS
nスペクトル中のプリカーサイオンの質量電荷比と質量電荷比ゼロとを始点及び終点としたデノボシーケンシングを実行するとよい。即ち、プリカーサイオンから生成される全てのプロダクトイオンをカバーし得るアミノ酸配列を求めるようにするとよい。上記のようなMS
nスペクトルには、プロダクトイオンピークが明瞭に現れ、逆にノイズピークは少なくなることが多い。そのため、デノボシーケンシングによって、高い信頼度で以て部分的なアミノ酸配列を求めることができる。
【0019】
このようにデノボシーケンシングによりアミノ酸配列を求める際の始点及び終点の質量電荷比は判明しており、またMS
2分析のプリカーサイオンの質量電荷比、或いは複数回のイオン解離の際のそれぞれのプリカーサイオンの質量電荷比も分かっているから、それら情報から作成されるシーケンスタグも信頼度の高いものとなる。そして、高信頼度のシーケンスタグを用いたシーケンスタグサーチを実行することで、ペプチドやタンパク質の同定の精度も向上する。
【0020】
なお、MS
nスペクトルに対するデノボシーケンシングにより、全てのプロダクトイオンをカバーし得るアミノ酸配列が一意に決まらない場合であっても、つまり一部のアミノ酸が不確定であったとしても、例えば他のMS
nスペクトルから得られるアミノ酸配列の推定結果を利用して、求めるペプチドのアミノ酸配列を一意に決めることができる場合もある。
【0021】
そこで、第1又は第2発明の好ましい一態様として、前記部分アミノ酸配列推定ステップは、2以上の異なるプリカーサイオンに対して得られた異なるMS
nスペクトルに対し、それぞれデノボシーケンシングを実行して複数の部分的なアミノ酸配列を求め、前記タグ生成ステップは、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列にそれぞれ対応した複数のシーケンスタグを生成し、前記データベース検索ステップは、前記複数のシーケンスタグを用いたデータベース検索によりタンパク質を検索するようにするとよい。