【実施例1】
【0019】
図1は本実施例に係る細胞識別装置を備えた細胞識別システムの全体図であり、
図2は本システムを用いた細胞識別の手順を示すフローチャートである。
【0020】
本実施例の細胞識別装置は、大別して、質量分析部1と細胞識別部2と、から成る。質量分析部1は、マトリックス支援レーザ脱離イオン化法(MALDI)によって試料中の分子や原子をイオン化するイオン化部11と、イオン化部11から出射された各種イオンを質量に応じて分離する飛行時間型質量分離器(TOF)12を備える。
【0021】
TOF12は、イオン化部11からイオンを引き出してTOF12内のイオン飛行空間に導くための引き出し電極13と、イオン飛行空間で質量分離されたイオンを検出する検出器14とを備える。
【0022】
細胞識別部2は、検索用のデータベースを格納した記憶部20と、通信線を介して前記質量分析部1との情報のやり取りを行うインターフェース部30と、質量分析部1の検出器14から出力された検出信号に基づいて前記データベースの検索を行う演算部40と、質量分析部1の動作を制御する分析制御部50とを備えている。
【0023】
記憶部20はハードディスク装置等の大容量記憶装置から成り、上位データベース21と下位データベース22の2種類のデータベースを格納している。これらの上位データベース21及び下位データベース22は、それぞれ本発明における第1データベース及び第2データベースに相当する。
【0024】
上位データベース21には、既知微生物に関する質量リストが多数登録されている。本実施例における質量リストは、ある微生物細胞を質量分析した際に検出されるイオンの質量を列挙したものであり、該イオン質量の情報に加えて、少なくとも、前記微生物細胞が属する分類群(属、種、及び株)の情報(分類情報)を含んでいる。こうした質量リストは、予め各種の微生物細胞を前記質量分析部1によるものと同様のイオン化法及び質量分離法によって実際に質量分析して得られたデータ(実測データ)に基づいて作成することが望ましい。
【0025】
前記実測データから質量リストを作成する際には、まず、前記実測データとして取得された質量スペクトルから所定の質量範囲に現れるピークを抽出する。このとき、前記質量範囲を4,000〜15,000程度とすることにより、主にタンパク質由来のピークを抽出することができる。また、ピークの高さ(相対強度)が所定の閾値以上のものだけを抽出することにより、不所望のピーク(ノイズ)を除外することができる。なお、リボソームタンパク質群は細胞内で大量に発現しているため、前記閾値を適切に設定することにより、質量リストに記載される質量の大部分をリボソームタンパク質由来のものとすることができる。そして、以上により抽出されたピークの質量(m/z)を細胞毎にリスト化し、前記分類情報等を付加した上で上位データベース21に登録する。なお、培養条件による遺伝子発現のばらつきを抑えるため、実測データの採取に用いる各微生物細胞は、予め培養環境を規格化しておくことが望ましい。
【0026】
なお、膨大な既知微生物の全てについて、上記のような実測データを取得するのは困難である。そこで、少なくとも一部の微生物については、上記のような実測データに基づく質量リストの代わりに、計算により求められた分子量(計算分子量)に基づく質量リストを上位データベース21に登録するようにしてもよい。この場合、各質量リストには、それが実測データ及び計算分子量のいずれに基づいて作成されたものであるかを示す情報を付与しておくことが望ましい。
【0027】
前記計算分子量に基づく質量リストは、例えば、以下のようにして作成される。
【0028】
(1)既存のデータベース(例えばDDBJ、EMBL、GenBank等の公共データベース)から既知微生物の遺伝子(例えば、リボソームタンパク質群の遺伝子)のDNA塩基配列を入手し、それをアミノ酸配列に翻訳することによって該微生物の細胞に含まれる各種タンパク質の計算分子量を導出する。このとき、更に、前記計算分子量に、N−末端開始メチオニン残基の切断、翻訳後修飾、又は生物情報工学的な相同性解析に基づいて行われるアミノ酸配列の修正を加味した補正を施し、これを補正前の計算分子量に加えて又は代えて質量リストの作成に使用するようにしてもよい。なお、前記「生物情報工学的な相同性解析に基づいて行われるアミノ酸配列の修正」は次のようなものである。まず、BLAST等の相同性解析を利用して対象微生物の遺伝子配列と相同性の高い遺伝子配列を既存のデータベース等で検索する。次に、それらの中でアノテーションされているものを参照して正しい翻訳領域を推測する。次に、それに基づいてアミノ酸配列を修正し、補正後のアミノ酸配列から計算分子量を算出する。
【0029】
また、上記既存のデータベースに各種微生物細胞に含まれるタンパク質の計算分子量が収録されている場合は、これを入手して質量リストの作成に用いるようにしてもよい。この場合も、必要に応じてN−末端開始メチオニン残基の切断、翻訳後修飾、又は生物情報工学的な相同性解析に基づいて行われるアミノ酸配列の修正を加味した計算分子量の補正を行う。
【0030】
なお、上述のように、実測データに基づいて質量リストを作成した場合も、上記同様の手法により計算分子量を算出し、質量リスト上の各質量を前記計算分子量と比較してその妥当性を検証した上で上位データベースに登録することが望ましい。これにより、上位データベース21中のデータの信頼性を高めることができる。なお、計算分子量との比較の結果、妥当でないと判断された質量リストについては、計算分子量に基づいて質量を修正したり、質量分析をやり直して質量リストを再作成したりすることが望ましい。
【0031】
(2)上記(1)の工程で求められた計算分子量をイオン質量に変換し、該イオン質量をリスト化することで質量リストを作成する。なお、生体試料をMALDI−TOFMSで分析した際には、主に[M+H]
+(Mは分子、Hは水素原子)、[M−H]
−、又は[M+Na]
+(Naはナトリウム原子)等の分子量関連イオンが検出されることが知られている。従って、質量分析条件が明らかであれば、前記計算分子量からイオン質量への変換は容易に行うことができる。例えば、シナピン酸をマトリックス剤として調製された生体試料をMALDI−TOFMSで分析すると、主にプロトン化分子([M+H]
+)のピークが観測される。従って、この場合には上記(1)の工程で求められた計算分子量にプロトンの質量を加算することでイオン質量への変換が可能である。
【0032】
下位データベース22は、微生物の種(species)ごとに分けられた複数のサブデータベース22a、22b、22c…を含んでいる。サブデータベース22a、22b、22c…には、それぞれ1つの種に属する一又は複数の微生物細胞に関する部分質量リストが収録されている。本実施例における部分質量リストとは、ある微生物細胞を質量分析した際に検出されるイオンの質量を列挙したリストから該微生物が属する種において共通に検出される質量を除いたものである。このような部分質量リストは、上述の方法で作成された既知微生物に関する多数の質量リストから、同一種に属する微生物の質量リストを抽出し、これらの質量リストに共通に含まれている質量を各質量リストから削除することにより作成することができる。従って、仮にある1つの種に属する微生物の質量リストが上位データベースに1つしか登録されていない場合は、該微生物について上位データベース21に登録される質量リストと下位データベース22に登録される部分質量リストは同一の内容となる。
【0033】
演算部40は、被検細胞の構成成分を含む試料を質量分析部1で分析した結果に基づいて前記上位データベース21及び下位データベース22を対象とした検索を実行するものであり、被検質量リスト作成部41、上位DB検索部42、分類群決定部43、被検部分質量リスト作成部44、及び下位DB検索部45を機能ブロックとして含んでいる(各部の機能は後述する)。なお、前記上位DB検索部42が本発明における第1検索手段に相当し、下位DB検索部45が本発明における第2検索手段に相当する。本実施例における細胞識別部2の実体はCPUやメモリ等を含んだコンピュータであって、CPUが該コンピュータにインストールされた所定の制御・処理プログラムを実行することにより、前記各機能ブロックの機能がソフトウェア的に達成される。演算部40は、インターフェース部30を介して質量分析部1に接続されており、更に、キーボードやマウスなどのポインティングデバイス等である操作部62と、液晶ディスプレイなどの表示部61とも接続されている。
【0034】
次に、本実施例の細胞識別システムを用いて微生物の種及び株を識別する際の手順について、
図2により説明する。
【0035】
まず、ユーザは被検細胞の構成成分を含む試料を調製し、質量分析部1にセットして質量分析を実行させる。このとき、前記試料としては、細胞抽出物、又は細胞抽出物からリボソームタンパク質等の細胞構成成分を精製したものの他、菌体や細胞懸濁液をそのまま使用することもできるが、上位データベース21中の実測データに基づく質量リストが作成された時の条件と同一とすることが望ましい。
【0036】
被検質量リスト作成部41は、質量分析部1の検出器14から得られる検出信号をインターフェース部30を介して取得する(ステップS11)。そして、該検出信号に基づいて質量スペクトルを作成し、該質量スペクトル中に現れているピークを抽出して各ピークの質量(厳密にはm/z)の情報を含む質量リスト(以下これを「被検質量リスト」と呼ぶ)を作成する(ステップS12)。なお、このときのピーク抽出条件(抽出する質量範囲、及びピーク強度の閾値など)についても、上位データベース21中の実測データに基づく質量リストが作成された時の条件と同一とすることが望ましい。
【0037】
次に、上位DB検索部42が、前記被検質量リストを用いて上位データベース21を検索し、該被検質量リストに類似した質量パターンを有する既知微生物の質量リスト、例えば被検質量リスト中の各質量と所定の誤差範囲で一致する質量が多く含まれている質量リストを抽出する(ステップS13)。
【0038】
続いて、分類群決定部43が、ステップS13で抽出された質量リストに記載された分類群の情報を参照することで該質量リストに対応した既知微生物が属する生物種を特定する。そして、この生物種を前記被検細胞が属する生物種と推定し、これを以降で検索対象とする分類群して決定する(ステップS14)。
【0039】
以上により被検細胞が属する生物種が決定されると、被検部分質量リスト作成部44が、前記生物種において共通して検出される質量(種共通質量)を前記被検質量リストから削除する(ステップS15)。これにより得られる質量リストを「被検部分質量リスト」と呼ぶ。なお、前記種共通質量は、予め生物種毎に導出して記憶部20に記憶させておくことが望ましい。あるいは、被検細胞が属する生物種が決定された時点で、被検部分質量リスト作成部44が該生物種に属する既知微生物の質量リストを上位データベースから取得し、これらを比較することによって種共通質量を決定して前記被検部分質量リストの作成に使用するようにしてもよい。
【0040】
その後、下位DB検索部45が、前記分類群決定部43で決定された生物種に対応したサブデータベース(例えばサブデータベース22a)を検索対象として選択する。そして、該サブデータベース22aを対象に前記被検部分質量リストを用いた検索を実行し(ステップS16)、前記被検部分質量リストとの一致度が高い部分質量リストを該サブデータベースから抽出する。このとき、前記一致度が最も高かったものを1つだけ抽出するようにしてもよいが、一致度が予め定めた閾値を超えるもの、又は、前記一致度が高い順に予め決められた数のものを抽出するようにしてもよい。
【0041】
続いて、下位DB検索部45は、上記検索により抽出された部分質量リストの情報を検索結果として表示部61に表示させる(ステップS17)。ここで表示させる情報には、少なくとも前記部分質量リストに記載された既知微生物の株名及び被検部分質量リストとの一致度とを含む。これにより、ユーザが、被検細胞に類似した質量パターンを生じる既知微生物の株名を知ることができ、被検細胞をその株と同一又は遺伝的に近縁の株と推定することができる。
【0042】
なお、ステップS17で表示する部分質量リストの情報には更に、該部分質量リストが実測データに基づいて作成されたものであるか、計算分子量に基づいて作成されたものであるかを示す情報を含めることが望ましい。一般に、実測データに基づいて作成された質量リストの方がより正確であるため、検索結果として複数の部分質量リストが表示された場合に、ユーザが前記情報を参照することにより、いずれの部分質量リストが検索結果としてより適切であるかを判断することが可能となる。
【実施例2】
【0043】
上記の実施例1では上位データベース21と下位データベース22の2つのデータベースを備えた細胞識別装置を示したが、本発明に係る細胞識別装置は、1つのデータベースのみを備えた構成とすることもできる。以下、このような構成を備えた細胞識別装置の実施例について、
図3、4を参照して説明する。
図3は本実施例に係る細胞識別装置を備えた細胞識別システムの全体図、
図4は本システムを用いた細胞識別の手順を示すフローチャートである。
【0044】
本実施例に係る細胞識別システムは、上位データベース21及び下位データベース22に代わって1つのデータベース23を有している点、並びに上位DB検索部42及び下位DB検索部45に代わって第1検索部46及び第2検索部47を有している点以外は実施例1と同様の構成を有している。
【0045】
本実施例におけるデータベース23は、実施例1における上位データベース21に相当するものであり、前記上位データベース21と同様に既知微生物に関する質量リストが多数収録されている
【0046】
第1検索部46は、実施例1における上位DB検索部42と同様の役割を果たすものであり、被検質量リスト作成部41で作成された被検質量リストを用いてデータベース23を検索する。第2検索部47は被検部分質量リスト作成部44で作成された被検部分質量リストを用いてデータベース23を検索するものであり、このとき、分類群決定部43で決定された分類群に属する微生物に関するものだけを検索対象とする。更に、データベース23内の各質量リストに記載された質量の内、前記分類群において共通するもの以外を被検部分質量リストとの照合に使用する。
【0047】
本実施例の細胞識別システムを用いて微生物の種及び株を識別する際の手順について、
図4により説明する。
【0048】
まず、ユーザが被検細胞の構成成分を含む試料を質量分析部1にセットして質量分析を行った後、被検質量リスト作成部41が該質量分析の結果を取得し(ステップS21)、被検質量リストの作成(ステップS22)を行う。なお、これらの工程は、
図2のステップS11及びS12と同様であるため詳細は省略する。
【0049】
次に、第1検索部46が、前記被検質量リストを用いてデータベース23を検索し、該被検質量リストに類似した質量パターンを有する既知微生物の質量リストを抽出する(ステップS23)。
【0050】
続いて、分類群決定部43が、ステップS23で抽出された質量リストに記載された分類情報を参照することにより該質量リストに対応した既知微生物が属する生物種を特定する。そして、この生物種を前記被検細胞が属する生物種と推定し、これを以降の検索で対象とする分類群として決定する(ステップS24)。
【0051】
以上により被検細胞が属する生物種が決定されると、被検部分質量リスト作成部44が、前記生物種に共通する質量を前記被検質量リストから削除することにより被検部分質量リストを作成する(ステップS25)。この工程は、
図2のステップS15と同様であるため詳細は省略する。
【0052】
その後、第2検索部47が、ステップS25で作成された被検部分質量リストを用いてデータベース23を検索する(ステップS26)。このとき、第2検索部47は、データベース23に収録された多数の質量リストのうち、ステップS24で決定された生物種に属する微生物に関するものを検索対象として選択する。更に、選択した各質量リストに記載された質量のうち、各株に特異的な質量のみを被検部分質量リストとの照合に使用する。具体的には、まず、検索対象として選択した各質量リスト中に共通に含まれる質量(種共通質量)を第2検索部47が特定し、各質量リストから種共通質量を除いたものと、前記被検部分質量リスト中の各質量とを照合して一致度を算出する。その結果、被検部分質量リストとの一致度が高かった質量リストをデータベース23から抽出する。なお、上記のように第2検索部47が種共通質量を特定する代わりに、予め微生物種毎に種共通質量を特定し、記憶部20に記憶しておくようにしてもよい。
【0053】
続いて、第2検索部47が、上記検索により抽出された部分質量リストの情報を検索結果として表示部61に表示させる(ステップS27)。このとき表示させる情報には、少なくとも該質量リストに記載された既知微生物の株名及び該被検部分質量リストとの一致度とを含む。以上により、ユーザが被検細胞に類似した質量パターンを生じる既知微生物の株名を知ることができ、被検細胞を前記の株と同一又は遺伝的に近縁の株と推定することができる。
【実施例3】
【0054】
本発明に係る細胞識別装置の第3の実施例について
図5を用いて説明する。本実施例のシステムは、塩基配列又はアミノ酸配列に起こり得る変異に関する情報(以下、「変異情報」と呼ぶ)を収録した変異データベース24を備え、下位DB検索部45において前記変異を考慮した検索を行う構成となっている。
【0055】
変異データベース24には、上記の変異情報、即ち、変異の名称、変化するアミノ酸又は塩基の種類や変化する部位、該変異によるイオン質量の変化量(m/z)などが予め登録される。
【0056】
本システムにおいて下位データベース22に登録される部分質量リストには、上述の質量情報及び分類情報のほかに、該リスト中の各質量に対応するタンパク質のアミノ酸配列及び/又は前記タンパク質をコードする遺伝子の塩基配列に関する情報(以下、「配列情報」と呼ぶ)が含まれている。
【0057】
本実施例の細胞識別システムを用いた細胞識別の手順は、
図2のフローチャートで示したものとほぼ同様である。但し、ステップS16では、下位DB検索部45において、上記実施例1と同様の検索(変異を考慮しない検索)に加え、更にアミノ酸配列又は塩基配列に起こり得る変異を考慮した検索が実行される。
【0058】
前記変異を考慮した検索では、まず、下位DB検索部45が前記変異データベース24から変異情報を取得する。なお、変異データベース24には様々な変異に関する情報が登録されているが、ここでは、まず1種類の変異に関する情報を取得する。そして、検索対象とするサブデータベース(例えばサブデータベース22a)中の部分質量リストを、前記変異情報に基づいて改変することにより該変異を適用した部分質量リスト(以下、これを「改変質量リスト」と呼ぶ)を作成する。具体的には、各部分質量リスト中の前記配列情報を参照することにより該部分質量リストに列挙された各質量に対応するタンパク質のアミノ酸配列(又は該タンパク質をコードする遺伝子の塩基配列)の中に、前記変異を生じ得る領域が含まれているか否かを判定し、含まれていた場合には、該質量を前記変異が生じた場合の質量に変更する。
【0059】
続いて、以上により得られた改変質量リストを前記被検部分質量リストと照合し、質量パターンの一致度を算出して記憶部20に一旦記憶させる。そして、変異データベース24に登録された全ての変異について、上記のような改変質量リストの作成及び一致度の算出を繰り返す。全ての変異を考慮した検索が終了すると、下位DB検索部45は、全ての検索結果を記憶部20から読み出し、一致度などを参考にした結果の妥当性の評価を行う。例えば一定以上の一致度を有する結果、あるいは、一致度の高い順に所定数の結果を抽出する。そして、抽出した結果を表示部61の画面上に表示する(ステップS17)。
【0060】
このように、変異を考慮した検索を行うことにより、被検細胞が既知の微生物株からの変異によって生じたものであった場合にも精度の高い検索結果を得ることができる。
【0061】
なお、上記実施例では、変異データベース24に登録されている全ての変異を考慮した検索を行うものとしたが、変異データベース24に登録された変異の中には実際には非常に低い確率でしか起こらない変異も数多く含まれる。そこで、起こる可能性の高さに基づく優先度や重要度などを各変異について変異データベース24に登録しておき、例えば、この優先度の高い順に予めユーザが指定した所定の個数の変異を選択して検索に適用するようにしてもよい。あるいは、下位データベース22の検索に先立ち、変異データベース24に登録されている変異の一覧を表示部61に表示して該一覧の中から検索に適用する変異をユーザに選択させるようにしてもよい。また、下位データベース22の検索中に一致度が相当に高いものがヒットしたらその時点で検索を終了するようにしてもよい。この場合、下位DB検索部45は、被検部分質量リストとの一致度が予め定められた閾値以上である部分質量リスト又は改変質量リストが探索された時点でデータベース検索の繰り返しを打ち切るものとする。これにより検索時間の大幅な短縮が見込める。
【0062】
更に、本実施例では、実施例1のような、上位データベース21に対する検索と下位データベース22に対する検索とを行う装置において、変異を考慮した検索を行う場合を説明したが、実施例2の装置のように、1つのデータベース23に対して2段階の検索を行う装置においても記憶部20に上記同様の変異データベースを設けることにより、変異を考慮した検索を行うことが可能となる。この場合、前記データベース23中の質量リストに記載された質量のうち、少なくとも株特異的な質量に関して上記のような配列情報を記載しておく。そして、第2検索部47による検索の実行時に、前記変異データベースに登録された変異を考慮した検索を行うようにする。
【0063】
以上、本発明を実施するための形態について実施例を挙げて説明を行ったが、本発明は上記実施例に限定されるものではなく、本発明の趣旨の範囲で適宜変更が許容される。例えば、上記実施例ではマトリックス支援レーザ脱離イオン化法(MALDI)によるイオン化部と飛行時間型の質量分離器(TOF)とを組合せて成る質量分析部を備えた細胞識別システムを例示したが、質量分析部は、1,000〜25,000程度の質量範囲の分子をイオン化し、検出できるものであれば前記構成に限定されるものではない。例えば、イオン化部として、エレクトロスプレーイオン化法(ESI)、レーザ脱離エレクトロスプレーイオン化(LDESI)、マトリックス支援レーザ脱離エレクトロスプレーイオン化(MALDESI)、短針スプレーイオン化(PSI)、大気圧化学イオン化(APCI)、又は電気衝突イオン化(EI)によるものなどを利用することもできる。
【0064】
また、上記実施例では上位DB検索部42又は第1検索部46による1回目の検索で種レベルの細胞識別を行い、下位DB検索部45又は第2検索部47による2回目の検索で株レベルの細胞識別を行うものとしたが、これに限らず、例えば、1回目の検索で属レベルの細胞識別を行い、2回目の検索で種レベルの識別を行うものとしてもよい。
【0065】
また更に、上記実施例では各データベースに登録する質量リスト又は部分質量リストに細胞構成成分のイオン質量を記載するものとしたが、これに限らず細胞構成成分の分子量を記載するようにしてもよい。この場合には、被検質量リスト作成部41において被検質量リストを作成する際に、質量分析で検出された各イオンの質量を分子量に換算するか、あるいは上位DB検索部42、下位DB検索部45、第1検索部46、及び第2検索部47によるデータベース検索を行う際に、データベース中の各質量リスト(又は部分質量リスト)に記載された分子量をイオン質量に換算した上で被検質量リスト(又は被検部分質量リスト)との照合を行う構成とする。