特許第5751126号(P5751126)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 株式会社島津製作所の特許一覧

<>
  • 特許5751126-質量分析データ解析方法及び解析装置 図000002
  • 特許5751126-質量分析データ解析方法及び解析装置 図000003
  • 特許5751126-質量分析データ解析方法及び解析装置 図000004
  • 特許5751126-質量分析データ解析方法及び解析装置 図000005
  • 特許5751126-質量分析データ解析方法及び解析装置 図000006
  • 特許5751126-質量分析データ解析方法及び解析装置 図000007
  • 特許5751126-質量分析データ解析方法及び解析装置 図000008
  • 特許5751126-質量分析データ解析方法及び解析装置 図000009
  • 特許5751126-質量分析データ解析方法及び解析装置 図000010
  • 特許5751126-質量分析データ解析方法及び解析装置 図000011
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5751126
(24)【登録日】2015年5月29日
(45)【発行日】2015年7月22日
(54)【発明の名称】質量分析データ解析方法及び解析装置
(51)【国際特許分類】
   G01N 27/62 20060101AFI20150702BHJP
【FI】
   G01N27/62 V
【請求項の数】8
【全頁数】16
(21)【出願番号】特願2011-231435(P2011-231435)
(22)【出願日】2011年10月21日
(65)【公開番号】特開2013-88377(P2013-88377A)
(43)【公開日】2013年5月13日
【審査請求日】2013年12月19日
(73)【特許権者】
【識別番号】000001993
【氏名又は名称】株式会社島津製作所
(74)【代理人】
【識別番号】110001069
【氏名又は名称】特許業務法人京都国際特許事務所
(72)【発明者】
【氏名】森本 健太郎
【審査官】 伊藤 裕美
(56)【参考文献】
【文献】 特開2007−278712(JP,A)
【文献】 特開2008−145221(JP,A)
【文献】 特開2006−058111(JP,A)
【文献】 マトリックスサイエンス株式会社,蛋白質同定システム MASCOT ServerVersion 2.2 チュートリアル,2009年 3月,第21-22頁,URL: http://www.matrixscience.jp/pdf/jap_2.2_tutorial.pdf
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/60−27/70
G01N 33/48−33/98
(57)【特許請求の範囲】
【請求項1】
被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析方法であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定ステップと、
b)MS2分析のプリカーサイオンの質量電荷比、MSn分析のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索ステップと、
を有することを特徴とする質量分析データ解析方法。
【請求項2】
被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析方法であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定ステップと、
b)MSm分析(mは2以上n以下の全ての整数)のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索ステップと、
を有することを特徴とする質量分析データ解析方法。
【請求項3】
請求項1又は2に記載の質量分析データ解析方法であって、
前記部分アミノ酸配列推定ステップは、MSnスペクトル中のプリカーサイオンの質量電荷比と質量電荷比ゼロとを始点と終点としたデノボシーケンシングを実行することを特徴とする質量分析データ解析方法。
【請求項4】
請求項3に記載の質量分析データ解析方法であって、
前記部分アミノ酸配列推定ステップは、2以上の異なるプリカーサイオンに対して得られた異なるMSnスペクトルに対し、それぞれデノボシーケンシングを実行して複数の部分的なアミノ酸配列を求め、
前記タグ生成ステップは、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列にそれぞれ対応した複数のシーケンスタグを生成し、
前記データベース検索ステップは、前記複数のシーケンスタグを用いたデータベース検索によりタンパク質を検索することを特徴とする質量分析データ解析方法。
【請求項5】
被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析装置であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
b)MS2分析のプリカーサイオンの質量電荷比、MSn分析のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定手段により求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成手段と、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索手段と、
を備えることを特徴とする質量分析データ解析装置。
【請求項6】
被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析装置であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
b)MSm分析(mは2以上n以下の全ての整数)のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定手段により求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成手段と、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索手段と、
を備えることを特徴とする質量分析データ解析装置。
【請求項7】
請求項又はに記載の質量分析データ解析装置であって、
前記部分アミノ酸配列推定手段は、MSnスペクトル中のプリカーサイオンの質量電荷比と質量電荷比ゼロとを始点と終点としたデノボシーケンシングを実行することを特徴とする質量分析データ解析装置。
【請求項8】
請求項に記載の質量分析データ解析装置であって、
前記部分アミノ酸配列推定手段は、2以上の異なるプリカーサイオンに対して得られた異なるMSnスペクトルに対し、それぞれデノボシーケンシングを実行して複数の部分的なアミノ酸配列を求め、
前記タグ生成手段は、前記部分アミノ酸配列推定手段により求まった部分的なアミノ酸配列にそれぞれ対応した複数のシーケンスタグを生成し、
前記データベース検索手段は、前記複数のシーケンスタグを用いたデータベース検索によりタンパク質を検索することを特徴とする質量分析データ解析装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ペプチド等の生体由来の高分子化合物に対してMSn分析を実行して収集されたデータを解析処理し、上記高分子化合物を同定したりその構造を解析したりする質量分析データ解析方法及び解析装置に関する。
【背景技術】
【0002】
近年、ポストゲノム研究としてタンパク質の構造や機能の解析が急速に進められている。このようなタンパク質の構造・機能解析手法(プロテオーム解析)の一つとして、質量分析計を用いたタンパク質の発現解析や一次構造解析が広く行われるようになってきており、四重極型イオントラップなどにおける特定イオンの捕捉と衝突誘起解離(CID)等のイオン解離とを行う、いわゆるMSn分析が威力を発揮している。
【0003】
MSn分析を利用してタンパク質を同定する一般的な手法としては、まず、タンパク質を化学的に又は酵素消化により分解してペプチド断片の混合物とし、このペプチド断片混合物を質量分析に供してマススペクトル(MS1スペクトル)を取得する。続いて、ペプチド断片混合物のマススペクトルデータの中から、単一のペプチドに由来する一組の同位体ピーク群をプリカーサイオンとして選択し、該プリカーサイオンに対しCIDを実施し、解離により生じたフラグメントイオンの質量分析、つまりMS2分析を実行する。CIDにより、特定のペプチドを構成するアミノ酸配列の様々な位置で結合が切れ、異なるアミノ酸残基を持つフラグメント(断片)が生じる。そのため、取得されるMS2スペクトルは、特定のペプチドのアミノ酸配列を反映したものとなる。
【0004】
即ち、MS2スペクトルに現れるピークの間隔はアミノ酸残基の分子量に相当する。このため、各ピークの間隔からアミノ酸配列を決定していくことが可能である。MS2スペクトルからシーケンスタグ(ペプチド又はタンパク質に存在し得る連続のアミノ酸配列を示すタグ)を抽出していくことにより、元のペプチドの部分アミノ酸配列を得ることができる。さらにこの部分アミノ酸配列に対し「BLAST(=Basic Local Alignment Search Tool、登録商標)」などのアミノ酸配列相同性検索を実行することにより、タンパク質を同定することができる。上記のようなペプチドの部分アミノ酸配列を得る手法はデノボシーケンシング(de novo sequencing)と呼ばれ、広く利用されている。
【0005】
一方、MS2スペクトルから、フラグメントイオン(プロダクトイオン)の質量電荷比m/zを利用して直接的にタンパク質を同定する手法がMS/MSイオンサーチである。MS/MSイオンサーチでは、実測により得られたMS2スペクトルと、データベースに登録されている全タンパク質を同じ酵素で消化して得られるペプチド断片に対しコンピュータ内で断片化を計算して得られる仮想CIDスペクトルと、の一致度について統計的に判断し、同時にペプチドの分子量情報も利用して一致度の信頼性を示す期待値を求めることで同定を行う。MS/MSイオンサーチを行うツールとしては、「X!tandem」や英国マトリクスサイエンス社が提供する「Mascot MS/MS ion search」がよく知られている。
【0006】
タンパク質を同定するために、上述した「BLAST」はアミノ酸配列を示す文字列の情報のみ、MS/MSイオンサーチはプロダクトイオンの質量電荷比の情報のみを利用しているが、これらの情報を複合的に利用してタンパク質の同定を行うツールがシーケンスタグサーチ(Sequence Tag search)である。シーケンスタグサーチでは、MS/MSイオンサーチと同様に、データベースに登録されているタンパク質の仮想CIDスペクトルと判明しているアミノ酸配列情報とに基づきペプチド同定を試みてその結果を出力する。シーケンスタグサーチを実行するツールとしては例えば英国マトリクスサイエンス社が提供する「Mascot Sequence Query」がよく知られている(非特許文献1参照)。この「Mascot Sequence Query」におけるデータベース検索設定画面は「Mascot MS/MS ion search」と同様の検索設定画面であるが、MS2スペクトルから収集されるピークリストの代わりにシーケンスタグをデータとして入力する点が相違する(非特許文献2参照)。
【0007】
シーケンスタグサーチに利用されるタグは例えば、M tag(M1,Str,M2)のように表される。ここで、MはMS2分析のプリカーサイオンの質量電荷比、M1はMS2スペクトル中の或るイオンP1の質量、M2はMS2スペクトル中の別の或るイオンP2の質量、Strは2つのイオンP1、P2の差分に対応した部分的なアミノ酸配列、である。即ち、シーケンスタグサーチでは、プリカーサイオンの質量電荷比、部分的なアミノ酸配列、及び、部分的なアミノ酸配列の開始点ピークと終点ピークの質量電荷比、を用いてペプチドを同定する。このシーケンスタグサーチは、MS/MSイオンサーチと比較すると、少ないピークからでも高い信頼度で以てペプチドを同定することができるという特徴がある。また、「BLAST」と比較すると、短いアミノ酸配列からでもタンパク質を同定できる、という特徴がある。
【0008】
上述したようにシーケンスタグサーチはタンパク質同定に有用な手法であるが、その高い同定精度を確保するには高い信頼度のシーケンスタグを与える必要がある。こうした課題に対し、近年、ペプチド同定のためのシーケンスタグを生成する手法がいくつか提案されている。例えば非特許文献3に記載の手法では、3価のペプチドをMS2分析して得られたMS2スペクトルからb+、y+、b++、y++フラグメントに対応するイオン以外のイオンピークを除去する。つまり、1価と2価のペアになるイオン以外のイオンピークを除去する。そして、残ったピークが信頼度の高いピークであるとみなし、それらピークから考えられるシーケンスタグをいくつかリストアップするようにしている。また、これ以外にも、MS2スペクトルに基づいてシーケンスタグを生成するいくつかの手法が提案されている。しかしながら、一般に、MS2スペクトルのS/Nはあまり良好でなく、明瞭なプロダクトイオンピークを観察するのが難しい場合も多い。そのため、信頼度の高いシーケンスタグを確実に取得するのは容易ではない。
【先行技術文献】
【非特許文献】
【0009】
【非特許文献1】「シーケンス・クエリ(Sequence Query)」、[online]、英国マトリックス・サイエンス社(Matrix Science Ltd.)、[平成23年8月30日検索]、インターネット<URL: http://www.matrixscience.com/help/sq_help.html>
【非特許文献2】「蛋白質同定システム MASCOT Server Version 2.2 チュートリアル」、[online]、英国マトリックス・サイエンス社(Matrix Science Ltd.)、[平成23年8月30日検索]、インターネット<URL: http://www.matrixscience.jp/pdf/jap_2.2_tutorial.pdf>
【非特許文献3】シア・チャオ(Xia Cao)、ほか1名、「インプルーブド・シーケンス・タグ・ジェネレイション・メソッド・フォー・ペプチド・アイデンティフィケイション・イン・タンデム・マス・スペクトロメトリ(Improved Sequence Tag Generation Method for Peptide Identification in Tandem Mass Spectrometry)」、ジャーナル・オブ・プロテオーム・リサーチ(J. Proteome Res.)2008年、Vol.7 (10)、pp.4422?4434
【発明の概要】
【発明が解決しようとする課題】
【0010】
本発明は上記課題に鑑みて成されたものであり、その主な目的は、シーケンスタグサーチによりタンパク質を同定するに際しシーケンスタグの信頼度を向上させることにより、高い精度でペプチドやタンパク質を同定することができる質量分析データ解析方法及び解析装置を提供することである。
【課題を解決するための手段】
【0011】
上述したデノボシーケンシングを用い、MS2スペクトルに基づいてアミノ酸配列の一部分を推定するには、その配列の両端部に対応する始点ピーク及び終点ピークを識別する必要がある。しかしながら、多くの場合、MS2スペクトルには様々な要因による不要なピークが現れているため、該スペクトルから上記始点ピーク、終点ピークを自動的に識別するのは困難であり、それ故に正確なシーケンシングを行うのは殆ど不可能である。一般に、部分的なアミノ酸配列を正確に推定できるのは、プリカーサイオンの質量電荷比から質量電荷比ゼロまでの間を、アミノ酸配列末端の質量電荷比の補正を加えてプロダクトイオンの不足なしにアミノ酸配列を確定できた場合であり、通常、これはプリカーサイオンの質量電荷比が小さい場合に限られる。なお、ここでいうアミノ酸配列末端の質量電荷比の補正とは、ペプチドのN末端、C末端に付加するH、OH3の質量電荷比の補正である。ピーク間の質量電荷比の差はアミノ酸残基の質量に相当するが、或るピークと質量電荷比0との間はアミノ酸残基の質量及びH又はOH3の質量に相当する。同様に、或るピークとプリカーサイオンの質量電荷比との差も、アミノ酸残基の質量及びH又はOH3の質量に相当する。
【0012】
一方、イオンの選択と解離操作とを繰り返し実行して得られるnが3以上であるMSnスペクトルは、一般にS/Nが良くプロダクトイオンピークが明瞭に現れる。こうしたMSn分析の際のプリカーサイオンは元のペプチドのうちの一部のアミノ酸配列に対応するものにすぎないが、該プリカーサイオンを解離させたときに生成されるプロダクトイオンの種類は少ないため、上述したデノボシーケンシングを用いたアミノ酸配列推定の信頼性が高い。特に、プリカーサイオンの質量電荷比が小さければ(一般的には500Da程度未満)、該イオンを構成するアミノ酸残基の数はかなり限られる(2〜4程度)ため、デノボシーケンシングによってアミノ酸配列をかなり高い信頼度で以て推定できる。即ち、低質量であるプリカーサイオンに対するMSnスペクトルは、ペプチド全長のアミノ酸配列を直接的に求めるには不適であるが、部分的なアミノ酸配列を高い精度で推定するには好適であるといえる。本願発明者はこうした点に着目し、従来はむしろ軽視されていた低質量であるイオンを優先的に解離させ、それによって得られるMSnスペクトルに対するデノボシーケンシングによってプリカーサイオンのアミノ酸配列を正確に求め、これをシーケンスタグとして利用することに想到した。
【0013】
上記課題を解決するために成された第1発明は、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析方法であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定ステップと、
b)MS2分析のプリカーサイオンの質量電荷比、MSn分析のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索ステップと、
を有することを特徴としている。
【0014】
通常のタンパク質同定と同様、一般に被検試料は目的とするタンパク質を酵素消化等により断片化して調製したペプチド混合物であるが、消化されないタンパク質(つまりアミノ酸配列が極端に長いもの)が混じっている場合などにおいては、シーケンスタグで示される部分的なアミノ酸配列がアミノ酸全長に比べて短すぎて、第1発明に係る質量分析データ解析方法ではペプチドの絞り込みが十分に行えないことがあり得る。そこで、こうした場合には、複数段の解離操作を行う際の全てのプリカーサイオンの質量電荷比の情報を利用するとよい。
【0015】
即ち、上記課題を解決するために成された第2発明は、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析方法であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定ステップと、
b)MSm分析(mは2以上n以下の全ての整数)のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成ステップと、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索ステップと、
を有することを特徴としている。
【0016】
また、上記課題を解決するために成された第3発明は、上記第1発明に係る解析方法を実施するための装置であり、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析装置であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
b)被検試料に対しMSn分析(nは3以上の整数)を実行することで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
c)MS2分析のプリカーサイオンの質量電荷比、MSn分析のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定手段により求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成手段と、
d)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索手段と、
を備えることを特徴としている。
【0017】
また、上記課題を解決するために成された第4発明は、上記第2発明に係る解析方法を実施するための装置であり、被検試料に対して質量分析を実行することで収集されたデータを用い、該被検試料中のタンパク質を同定する質量分析データ解析装置であって、
a)被検試料に対し、そのプリカーサイオンの質量電荷比が4残基以下のアミノ酸配列に相当する値又は500Da以下の値になるまでn(ただしnは3以上の整数)の値を増加させてMSn分析を行うことで得られたMSnスペクトルに対し、デノボシーケンシングを実行して部分的なアミノ酸配列を求める部分アミノ酸配列推定手段と、
b)MSm分析(mは2以上n以下の全ての整数)のプリカーサイオンの質量電荷比、及び、前記部分アミノ酸配列推定手段により求まった部分的なアミノ酸配列を用い、シーケンスタグを生成するタグ生成手段と、
c)タンパク質のアミノ酸配列情報が格納されたデータベースの中で、前記シーケンスタグで示される情報に一致するタンパク質を検索するデータベース検索手段と、
を備えることを特徴としている。
【0018】
第1乃至第4発明に係る質量分析データ解析方法及び解析装置では、プロダクトイオンの種類が少なく、その意味では情報量に乏しい、相対的に低い質量電荷比のプリカーサイオンに対するMSnスペクトルにデノボシーケンシングを適用して部分的なアミノ酸配列情報を取得する。本願発明者の検討によれば、部分的なアミノ酸配列を正確に推定するために、デノボシーケンシングを適用するMSnスペクトルのプリカーサイオンは、その質量電荷比が4残基以下のアミノ酸配列に相当するものとするとよい。これは、質量電荷比でいうと500Da程度以下である。したがって、このような条件を満たし且つプリカーサイオンとして適当な強度をもつイオンが現れるまでイオンの解離操作を繰り返して適当なMSnスペクトルを取得する。MSnスペクトルからアミノ酸配列を推定する際には、MSnスペクトル中のプリカーサイオンの質量電荷比と質量電荷比ゼロとを始点及び終点としたデノボシーケンシングを実行するとよい。即ち、プリカーサイオンから生成される全てのプロダクトイオンをカバーし得るアミノ酸配列を求めるようにするとよい。上記のようなMSnスペクトルには、プロダクトイオンピークが明瞭に現れ、逆にノイズピークは少なくなることが多い。そのため、デノボシーケンシングによって、高い信頼度で以て部分的なアミノ酸配列を求めることができる。
【0019】
このようにデノボシーケンシングによりアミノ酸配列を求める際の始点及び終点の質量電荷比は判明しており、またMS2分析のプリカーサイオンの質量電荷比、或いは複数回のイオン解離の際のそれぞれのプリカーサイオンの質量電荷比も分かっているから、それら情報から作成されるシーケンスタグも信頼度の高いものとなる。そして、高信頼度のシーケンスタグを用いたシーケンスタグサーチを実行することで、ペプチドやタンパク質の同定の精度も向上する。
【0020】
なお、MSnスペクトルに対するデノボシーケンシングにより、全てのプロダクトイオンをカバーし得るアミノ酸配列が一意に決まらない場合であっても、つまり一部のアミノ酸が不確定であったとしても、例えば他のMSnスペクトルから得られるアミノ酸配列の推定結果を利用して、求めるペプチドのアミノ酸配列を一意に決めることができる場合もある。
【0021】
そこで、第1又は第2発明の好ましい一態様として、前記部分アミノ酸配列推定ステップは、2以上の異なるプリカーサイオンに対して得られた異なるMSnスペクトルに対し、それぞれデノボシーケンシングを実行して複数の部分的なアミノ酸配列を求め、前記タグ生成ステップは、前記部分アミノ酸配列推定ステップにより求まった部分的なアミノ酸配列にそれぞれ対応した複数のシーケンスタグを生成し、前記データベース検索ステップは、前記複数のシーケンスタグを用いたデータベース検索によりタンパク質を検索するようにするとよい。
【発明の効果】
【0023】
第1乃至第4発明に係る質量分析データ解析方法及び解析装置によれば、プリカーサイオンの選択及び解離操作を繰り返して得られたMSnスペクトルに基づいてMS2分析のプリカーサイオンの部分的なアミノ酸配列を得ることで、ペプチド全体を推定可能な信頼性の高いシーケンスタグを生成することができる。特に、MSnスペクトルに対しアミノ酸末端の補正を考慮してプリカーサイオンの質量電荷比から質量ゼロまでのアミノ酸配列が確定できた場合には、そのアミノ酸配列の信頼度は非常に高く、それ故にシーケンスタグも正確であると考えてよい。シーケンスタグサーチの特徴は、シーケンスタグが正確であって、検索に利用されるデータベースに目的とするタンパク質が登録されていれば、必ず正しい検索結果を導出できることである。そのため、MS2スペクトルに対するデノボシーケシングやMS/MSイオンサーチによってはペプチドを高い信頼度で以て同定できない場合であっても、上述したように求めた信頼度の高いシーケンスタグをシーケンスタグサーチに与えることで、タンパク質(ペプチド)を正確に同定したり候補ペプチドの絞り込みを正確に行ったりすることができる。特に、自動的にペプチドを1つに絞り込むことができない場合であっても、候補ペプチドには必ず正しいペプチドが含まれる(つまり擬陽性エラーが生じることがない)ので、同定見逃しを回避するのに有効である。
【図面の簡単な説明】
【0024】
図1】本発明に係る質量分析データ解析装置を含むペプチド解析システムの一実施例の全体構成図。
図2】本実施例のペプチド解析システムにおいて実施されるデータ解析処理手順の一例を示すフローチャート。
図3図2中のタグ生成に関する処理の詳細な手順を示すフローチャート。
図4】MS2分析のプリカーサイオンとMSnスペクトルから求まるアミノ酸配列との関係を示す概略図。
図5図6に示したMS4スペクトルから生成したシーケンスタグを用いて「Mascot Sequence Query」により候補ペプチドを絞り込んだ結果の一例を示す図。
図6】オバルブミンから得られるプリカーサイオン(m/z 374)のMS4スペクトルに対するデノボシーケンシングを用いたアミノ酸配列推定の一例を示す図。
図7】ウシ血清アルブミンから得られるプリカーサイオン(m/z 359)のMS3スペクトルに対するデノボシーケンシングを用いたアミノ酸配列推定の一例を示す図。
図8図7に示したMS3スペクトルから生成したシーケンスタグを用いて「Mascot Sequence Query」により候補ペプチドを絞り込んだ結果の一例を示す図。
図9】ウシ血清アルブミンから得られるプリカーサイオン(m/z 569)のMS3スペクトルに対するデノボシーケンシングを用いたアミノ酸配列推定の一例を示す図。
図10図9に示したMS3スペクトルから生成したシーケンスタグを用いて「Mascot Sequence Query」により候補ペプチドを絞り込んだ結果の一例を示す図。
【発明を実施するための形態】
【0025】
以下、本発明に係る質量分析データ解析装置を含むペプチド解析システムの一実施例について、添付図面を参照して説明する。図1は本実施例のペプチド解析システムの全体構成図である。
【0026】
本実施例のペプチド解析システムは、大別して、質量分析部1と、コンピュータを中心に構成される制御・処理部2と、から成る。質量分析部1は四重極イオントラップ飛行時間型質量分析計であり、分析対象である試料中の分子や原子をイオン化するマトリクス支援レーザ脱離イオン化(MALDI)法やエレクトロスプレイイオン化(ESI)法によるイオン化部10と、発生したイオンを一時的に捕捉し、質量電荷比m/zに応じたイオンの選択とCIDによるイオンのフラグメンテーションとを実行可能である3次元四重極型のイオントラップ11と、イオントラップ11から一斉に射出された各種イオンを質量電荷比に応じて分離して検出する飛行時間型質量分析器(TOFMS)12と、を含む。飛行時間型質量分析器12は、リフレクタにより発生する直流電場によりイオンを折返し飛行させるリフレクトロン型の飛行空間13と、該飛行空間13を飛行する間に質量電荷比に応じて時間的に分離されたイオンを順次検出するイオン検出器14と、を含む。
【0027】
制御・処理部2は、質量分析部1の各部を制御する分析制御部27、イオン検出器14から得られる検出信号をデジタル化して収集して格納するデータ収集部21、データからMSnスペクトルを作成するスペクトル解析部22、MSnスペクトルデータに対してデノボシーケンシングを実行するデノボシーケンス実行部23、デノボシーケンシングにより得られた部分的アミノ酸配列やプリカーサイオンの質量電荷比などからシーケンスタグを生成するタグ生成部24、シーケンスタグを用いたデータベース検索により被検試料中のペプチドを同定するシーケンスタグサーチ実行部25、及び、タンパク質(ペプチド)のアミノ酸配列を推定するための同定用情報が予め登録された同定用データベース(DB)26、を備える。さらに制御・処理部2には、ユーザが検索条件を入力設定したりスペクトル解析のために必要な各種操作を行ったりするための入力部3や、検索条件入力設定画面を表示したり同定結果を表示したりするための表示部4が接続されている。シーケンスタグサーチ実行部25の機能は、例えば上述した「Mascot Sequence Query」などの既存の検索エンジンソフトウエアを利用することができる。
【0028】
本実施例のペプチド解析システムにおいてペプチドを同定するためのデータ解析処理について、図2に示すフローチャートを参照しつつ説明する。
【0029】
分析者は、目的とするタンパク質を適宜の酵素(例えばトリプシン酵素)により消化し、ペプチド断片を含む被検試料を調製する(ステップS1)。分析処理が開始されると、分析制御部27はまず解離段数を示す変数nを2に初期設定し、質量分析部1により上記被検試料に対するMSn分析を実行する(ステップS2)。初めてステップS2が実行されるときには、分析制御部27の制御の下に、質量分析部1ではMS2分析が実行されることになる。
【0030】
即ち、まず被検試料に対するMS1分析が実行され、スペクトル解析部22はデータ収集部21により収集されたデータに基づいてMS1スペクトルを作成する。スペクトル解析部22は、このMS1スペクトルから単一のペプチドに由来するイオンピークを抽出し、MS2分析のプリカーサイオンとして選定する。引き続き、分析制御部27の制御の下に質量分析部1は、被検試料に対して上記プリカーサイオンについてのMS2分析を実行する。より詳しく述べると、イオン化部10において被検試料から生成された各種イオンは一旦イオントラップ11に捕捉され、イオントラップ11においてプリカーサイオンの質量電荷比を持つイオンのみが選別された後にCIDによる解離が行われる。この際に、目的の単一ペプチドのアミノ酸配列の結合が様々な部位で切れ、各種アミノ酸残基がプロダクトイオンとしてイオントラップ11に捕捉される。このプロダクトイオンはイオントラップ11から一斉に出射されて飛行時間型質量分析器12により質量分析され、データ収集部21はMS2分析により得られたデータを収集し、スペクトル解析部22は収集されたデータに基づいてMS2スペクトルを作成する。
【0031】
次いで、スペクトル解析部22は、取得したMS2スペクトルにおいて、質量電荷比が500Da以下であって一定以上の強度をもつイオンピークがあるか否かを判定する(ステップS3)。ここで500Daという判定基準は、そのプリカーサイオンが2〜4程度の少数のアミノ酸残基となるものか否かを判別する条件である。アミノ酸残基がこの程度の数であれば、これをプリカーサイオンとして解離させて得られるプロダクトイオンのスペクトルはかなり単純になり、デノボシーケンシングを利用してプリカーサイオンの質量電荷比から質量ゼロ(m/z=0)までのアミノ酸配列の確定がかなり高い確率で行える。500Daとの判定基準は適宜に変更することが可能であるが、大きくすると得られるMSnスペクトルが複雑になってデノボシーケンシングによりアミノ酸配列を確定できない確率が高くなる。逆に小さくしすぎるとアミノ酸残基が少なくなりすぎてシーケンスタグとしては正確であっても、ペプチド候補の絞り込みが難しくなる。したがって、ステップS3のように質量電荷比で判定するとすれば、400〜600Da程度の範囲の値が妥当である。
【0032】
MS2スペクトルの中において質量電荷比が500Da以下で且つ一定以上の強度をもつイオンピークが見つからない場合には、変数nをインクリメントし(ステップS9)、MS2スペクトルの中で強度が高いイオンをプリカーサイオンとして選択して(ステップS10)ステップS2へと戻る。つまり、MS2スペクトルについてステップS3でNoと判定されたときには、MS2スペクトルの中で強度が高いイオンピークをプリカーサイオンとして選択し、該プリカーサイオンを解離させるMS3分析を実行しMS3スペクトルを取得することになる。なお、ステップS10では典型的には強度が最大であるイオンをプリカーサイオンとすればよいが、例えば質量電荷比が既知である夾雑物等の存在が予め判っていればそれを除いて次に強度の高いイオンを選択するようにしてもよい。
【0033】
図2に示したフローチャートでは、質量電荷比が500Da以下であって一定以上の強度をもつイオンピークが見つかるまでステップS2→S3→S9→S10→S2→…を繰り返すが、実際にはプリカーサイオンの質量電荷比が小さくなりすぎるとMSnスペクトルを求める意味がなくなるため、nの数に上限値を設けたり選択可能なプリカーサイオンの質量電荷比に下限値を設けたりして適宜の時点で繰り返しを打ち切り、同定不可と結論付ければよい。
【0034】
ステップS3においてMS2スペクトル又はnが3以上であるMSnスペクトルにおいて、質量電荷比が500Da以下であって一定以上の強度をもつイオンピークが存在すると判定されると、そのイオンピークをプリカーサイオンとして選択し(ステップS4)、変数nをインクリメントする(ステップS5)。そして、分析制御部27の制御の下に質量分析部1は上記プリカーサイオンを解離させるMSn分析を実行し、スペクトル解析部22は得られたデータに基づいてMSnスペクトルを作成する(ステップS6)。例えば、MS2スペクトルに対してステップS3でYesと判定されれば、ステップS6ではMS3分析が実施されるし、MS3スペクトルに対してステップS3でYesと判定されれば、ステップS6ではMS4分析が実施される。
【0035】
次に、デノボシーケンス実行部23及びタグ生成部24はステップS6で得られたMSnスペクトルとMS2分析のプリカーサイオンの質量電荷比とに基づいてシーケンスタグを生成する(ステップS7)。この特徴的なタグ生成処理について、図3のフローチャートを参照して詳しく説明する。
【0036】
まず、デノボシーケンス実行部23はMSnスペクトルに対してデノボシーケンシングを実行し、質量ゼロからプリカーサイオンの質量電荷比までの間に割り当てられるアミノ酸配列を推定する(ステップS71)。一般的に、イオンを繰り返し解離させることで取得するMSnスペクトルにはプロダクトイオンピークが明瞭に現れ、逆にノイズピークは減ってスペクトルのS/Nは向上する。こうしたMSnスペクトルに対してデノボシーケンシングを用いることで、元のペプチドのアミノ酸配列の中の一部分ではあるが、正確なアミノ酸配列を取得することができる。特に、プリカーサイオンの質量電荷比と質量ゼロとの間で、アミノ酸配列末端の質量電荷比を補正した上で不足なく各プロダクトイオンピークの位置からアミノ酸配列を確定できれば、そのアミノ酸配列の信頼度は非常に高い。
【0037】
タグ生成部24は上述のようにデノボシーケンシングにより推測された部分的なアミノ酸配列情報をStr、MS2分析のプリカーサイオンの質量電荷比をMとし(ステップS72)、これら情報に基づいてシーケンスタグを生成する(ステップS73)。具体的には、ステップS71でMS3スペクトルに基づいて部分的なアミノ酸配列Strが推定された場合、MS3分析のプリカーサイオンの質量電荷比がM3であるとすると、タグ生成部24は、M tag(M3,Str,0.0)という1種類のシーケンスタグを生成する。ここで、「0.0」はデノボシーケンシングの終点(始点)が質量ゼロであることを意味する。
【0038】
また、ステップS71でMS4スペクトルに基づいて部分的なアミノ酸配列Strが推定された場合には、MS3分析のプリカーサイオンの質量電荷比がM3、MS4分析のプリカーサイオンの質量電荷比がM4であるとすると、タグ生成部24は、M tag(M4,Str,0.0)というシーケンスタグのほか、M tag(M3,Str,M3−M4+1)、M tag(M−M3+M4,Str,M−M3+1)という2種類のシーケンスタグも併せて生成する。この2種類のシーケンスタグは次のような意味をもつ。即ち、MS3分析においてMS4分析のプリカーサイオンに対応するニュートラルロスの質量はM3−M4+1(この「+1」はプロトン1個分の質量)であるから、MS3スペクトルにおいてこのニュートラルロスがピークとして現れると仮定すれば、MS3分析のプリカーサイオンの質量電荷比M3とこの仮想的なニュートラルロスの質量(M3−M4+1)との間をカバーするアミノ酸配列はStrとなる筈である。このことから、MS4スペクトルから求まるM tag(M4,Str,0.0)というシーケンスタグは、MS3スペクトルにおいてはM tag(M3,Str,M3−M4+1)というシーケンスタグになることが分かる。また同様に、さらに遡ってMS2スペクトルにおけるシーケンスタグに置き換えるとM tag(M−M3+M4,Str,M−M3+1)というシーケンスタグになることが分かる。
【0039】
図4はMS2分析のプリカーサイオン、つまりは同定対象であるペプチドのアミノ酸配列とMS4スペクトルから求まるアミノ酸配列との関係の一例を示す概略図である。これは後述の実験例で用いたオバルブミンの例である。MS2分析のプリカーサイオンXに対応するペプチドのアミノ酸配列は[GGLEPINFQTAADQA]であり、その質量電荷比はMである。このプリカーサイオンを複数回(この例では2回)解離させることで得られたMS4スペクトルには、元のペプチドのC末端のアミノ酸に対応したプロダクトイオンが現れる。したがって、MS4スペクトル上でプリカーサイオンYの質量電荷比M4と質量ゼロとの間に対応したアミノ酸配列を推定すると、アミノ酸配列[QAR]が求まる。このアミノ酸配列は必ず元のペプチドの一部であるから、このアミノ酸配列、MS4分析のプリカーサイオンの質量電荷比M4、及びMS2分析のプリカーサイオンの質量電荷比Mから、元のペプチドを同定可能なシーケンスタグの生成が可能であることは理解できる。また、上述したようにステップS71で推定される部分的なアミノ酸配列の信頼度は非常に高いので、ステップS73で生成されるシーケンスタグの信頼度も非常に高いものとなる。
【0040】
図2に戻り説明すると、ステップS7で得られた1乃至複数のシーケンスタグはシーケンスタグサーチ実行部25に引き渡され、シーケンスタグサーチ実行部25はこのシーケンスタグを用い、該タグで示されている情報と同定用データベース26に登録されているタンパク質のアミノ酸配列や質量などの情報とを照合することによりペプチドを同定する(ステップS8)。例えばシーケンスタグサーチ実行部25として上述した「Mascot Sequence Query」を用いる場合、検索によりヒットしたペプチドにはその検索の信頼度を表すスコアや期待値などが付される。そこで、複数のペプチドがヒットした場合でも或る1つのペプチドの信頼度指標値が他のペプチドの信頼度指標値に比べて有意に高い場合には、そのペプチドのみを同定したペプチドとして挙げればよい。一方、唯一のペプチドを同定できない場合には、可能性のある複数のペプチドを上記信頼度指標値とともに候補として選出すればよい。そうして同定したペプチド又はペプチド候補を表示部4に表示して分析者に知らせる。シーケンスタグサーチでは、同定用データベース26に目的のタンパク質が登録されており、且つ与えられるシーケンスタグが正確であれば、正解であるペプチドが含まれる検索結果が導出される。即ち、正解があるにも拘わらずそれが含まれない検索結果が得られるようなことはない。したがって、上述した手順によって得られるシーケンスタグの信頼度は高いため、ペプチド同定結果も信頼性の高いものとなることが保証される。
【実施例】
【0041】
次に、上述した特徴的なデータ解析方法によるペプチド同定の効果を確認するために行った評価実験について説明する。これは、オバルブミン(Ovalbumin)のMS4スペクトル、及びウシ血清アルブミン(BSA=bovine serum albumin)のMS3スペクトルに基づいて上述した手法によりそれぞれシーケンスタグを生成し、このシーケンスタグを利用したシーケンスタグサーチによってペプチドを同定した例である。シーケンスタグサーチには「Mascot Sequence Query」を用いた。
【0042】
オバルブミンに対する実験では、MS3スペクトルに対するデノボシーケンシングを実行してもアミノ酸配列を決定することができなかった。そこで、さらに1段CIDを加えたMS4スペクトルを用い、デノボシーケンシングによりプリカーサイオンの質量電荷比(m/z 374)から質量ゼロまでの範囲で配列推定を行った。その結果が図6である。図6において、m/z 174.9のピークとm/z 246.0のピークとの間に相当するのは、質量71.0のアミノ酸残基Alanine(A)である。また、m/z 0とm/z 174.9のピークとの間に相当するのは、質量156.1のアミノ酸Arginine(R)にOH3の質量19を加えた質量175である。
【0043】
図6に記したアミノ酸配列以外で、MS4スペクトル上の全てのアミノ酸に対応したプロダクトイオンから一意に決まるようなアミノ酸配列は存在しない。したがって、ここで求まるアミノ酸配列の信頼度は非常に高いといえる。このアミノ酸配列から、M tag(M4, str, 0.0)、M=1684.94、M4=374.22、Str=“[KQ]AR”、であるシーケンスタグが求まる。なお、[KQ]はK又はQのいずれかであることを表す。このシーケンスタグを用いてシーケンスタグサーチを実施した結果が図5である。ここでは、同スコアで複数のペプチドがヒットして候補としてリストアップされているが、その中に、正解のオバルブミンが含まれていることが分かる。即ち、この例では、MS4スペクトルから得られる1種類のシーケンスタグを利用するだけで、正解のペプチドを候補の1つとしてリストアップできることが確認できる。
【0044】
ウシ血清アルブミンに対するMS3スペクトルを用い、デノボシーケンシングによりプリカーサイオンの質量電荷比(m/z 359)から質量ゼロまでの間のアミノ酸配列を推定した結果が図7である。この例でも、図7に記したアミノ酸配列以外で、MS3スペクトル上の全てのアミノ酸に対応したプロダクトイオンから一意に決まるようなアミノ酸配列は存在しない。そのため、ここで求まるアミノ酸配列の信頼度も非常に高いといえる。このアミノ酸配列から、M tag (M3, Str, 0.0)、M=927.5、M3=359、Str=“[AI|IA|SP|PS|AL|LA]R”、であるシーケンスタグが求まる。このシーケンスタグを用いてシーケンスタグサーチを実施した結果が図8である。ここでは、同スコアで複数のペプチドがヒットして候補としてリストアップされているが、その中に、正解のウシ血清アルブミンが含まれていることが分かる。
【0045】
ウシ血清アルブミンのサンプルについては、別のプリカーサイオンの質量電荷比(m/z 569)に対するMS3分析も行ってMS3スペクトルを取得した。このMS3スペクトルを用いデノボシーケシングによりプリカーサイオンの質量電荷比から質量ゼロまでの間のアミノ酸配列を推定した結果が図9(a)、(b)である。この場合、MS3スペクトル上の全てのアミノ酸に対応したプロダクトイオンからはアミノ酸配列が一意には決まらないものの、この2つのアミノ酸配列結果から求まる対称配列はYLYEのみであるため、これによって高い信頼度で以てアミノ酸配列を決定することができる。このアミノ酸配列推定結果から、上記図7の結果から求まるシーケンスタグとは別のシーケンスタグを得ることができる。そこで、図7の結果から求まるシーケンスタグに加えて、図9の結果から求まるシーケンスタグを入力してシーケンスタグサーチを実行した。その結果が図10である。この場合には、2つのシーケンスタグを満たすアミノ酸配列が一意に定まるため、高いスコアでペプチドが同定されていることが分かる。このように、用いるシーケンスタグは1種類でも構わないが、複数種類のシーケンスタグを利用することでペプチド同定精度を向上させることができる。
【0046】
なお、上記実施例は本発明の一例にすぎず、本発明の趣旨の範囲で適宜変形、修正、追加等を行っても本願特許請求の範囲に包含されることは当然である。
【符号の説明】
【0047】
1…質量分析部
10…イオン化部
11…イオントラップ
12…飛行時間型質量分析器
13…飛行空間
14…イオン検出器
2…制御・処理部
21…データ収集部
22…スペクトル解析部
23…デノボシーケンス実行部
24…タグ生成部
25…シーケンスタグサーチ実行部
26…同定用データベース
27…分析制御部
3…入力部
4…表示部
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10