(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5964983
(24)【登録日】2016年7月8日
(45)【発行日】2016年8月3日
(54)【発明の名称】質量分析法により微生物を特定するための方法
(51)【国際特許分類】
G01N 27/62 20060101AFI20160721BHJP
G01N 27/64 20060101ALI20160721BHJP
【FI】
G01N27/62 V
G01N27/62 D
G01N27/64 B
【請求項の数】7
【全頁数】10
(21)【出願番号】特願2014-544031(P2014-544031)
(86)(22)【出願日】2012年11月30日
(65)【公表番号】特表2015-500466(P2015-500466A)
(43)【公表日】2015年1月5日
(86)【国際出願番号】IB2012056860
(87)【国際公開番号】WO2013080170
(87)【国際公開日】20130606
【審査請求日】2015年6月22日
(31)【優先権主張番号】11306610.4
(32)【優先日】2011年12月2日
(33)【優先権主張国】EP
(31)【優先権主張番号】61/566,025
(32)【優先日】2011年12月2日
(33)【優先権主張国】US
(73)【特許権者】
【識別番号】502073946
【氏名又は名称】ビオメリュー・インコーポレイテッド
(74)【代理人】
【識別番号】100108453
【弁理士】
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100064908
【弁理士】
【氏名又は名称】志賀 正武
(74)【代理人】
【識別番号】100089037
【弁理士】
【氏名又は名称】渡邊 隆
(74)【代理人】
【識別番号】100110364
【弁理士】
【氏名又は名称】実広 信哉
(72)【発明者】
【氏名】グレゴリー・ストリューベル
(72)【発明者】
【氏名】モード・アルサック
(72)【発明者】
【氏名】ドゥニ・デスレ
(72)【発明者】
【氏名】ピエール−ジャン・コト−パタ
【審査官】
藤田 都志行
(56)【参考文献】
【文献】
特表2006−522340(JP,A)
【文献】
特表2010−515915(JP,A)
【文献】
米国特許出願公開第2011/0202282(US,A1)
【文献】
特開2007−316063(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G01N 27/62
G01N 27/64
(57)【特許請求の範囲】
【請求項1】
質量分析法によって微生物を特定するための方法であって、
前記微生物の少なくとも1つの質量スペクトルを取得するステップと、
取得した質量スペクトルごとに、
前記質量スペクトルのピークを所定の質量範囲で検出するステップと、
質量対電荷比の範囲における各所定の再分割区間において高々1つのピークを特定する、ピークのリストを生成するステップであって、前記再分割区間の幅は、関係
【数1】
に従って前記質量対電荷比に沿って増大し、前記再分割区間は、前記範囲における最小の質量対電荷比に対して整数b
minから前記範囲における高質量対電荷比に対して整数b
maxまでの1より大きい整数で参照され、L(b)は整数bで参照される区間の幅であり、m
minは質量対電荷比の前記範囲の下界であり、m
maxは質量対電荷比の前記範囲の上界である、ステップと、
過去に特定した微生物および/または微生物の種類の知識ベースに従って取得したピークのリスト(複数可)を分析するステップと、
を含む、方法。
【請求項2】
質量対電荷比の所定の範囲は3、000トムソンから17、000トムソンの範囲内にある、請求項1に記載の方法。
【請求項3】
900から1500個の区間が存在する、請求項1または2に記載の方法。
【請求項4】
1200から1400個の区間が存在する、請求項3に記載の方法。
【請求項5】
前記再分割区間に保持された前記ピークは最大ピークである、請求項1乃至4の何れか1項に記載の方法。
【請求項6】
前記質量分析法はMALDI−TOF分光分析である、請求項1乃至5の何れか1項に記載の方法。
【請求項7】
特定すべき微生物の質量スペクトルを生成可能な質量分光計と、
請求項1乃至6の何れか1項の方法を実施することによって、前記質量分光計により生成された前記質量スペクトルに関連付けられた前記微生物を特定可能な計算ユニットと、
を備える、質量分析法により微生物を特定するための装置。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は微生物、特にバクテリアを質量分析法により特定することに関する。
【背景技術】
【0002】
質量分析法を用いて微生物、より具体的にはバクテリアを特定することが知られている。微生物のサンプルが用意され、その後、当該サンプルの質量スペクトルを取得し前処理、即ち、スペクトル・デノイズ(ノイズ除去)、(検出器に起因する)バックグラウンド・ノイズのフィルタを行う。次に、前処理されたスペクトルの有意なピークを検出し、このようにして得られたピークのリストを、特定した微生物または1群の微生物の典型的なピークのリストから構築した知識ベースのデータ(種、綱、科など)と「分析」し「比較する」。
【先行技術文献】
【非特許文献】
【0003】
【非特許文献1】Jackson O. Lay’s document, "Maldi-tof spectrometry of bacteria", Mass Spectrometry Reviews, 2001, 20, 172-194
【発明の概要】
【発明が解決しようとする課題】
【0004】
この原理は一見単純に見えるが、その実装は繊細である。実際、先ず、質量スペクトルに含まれる情報の量、特にピークの数は非常に多く、堅牢な知識ベースを生成し分類、比較、決定アルゴリズムを実装するための、非常に強力な計算ツールが必要である。
【0005】
次に、特にスペクトルにおけるピークの位置に関して、高い測定の不確実性がある。実際、同一の分光計での或る測定から他の測定にかけて、ならびに、或る分光計から他の分光計にかけて、所与の分子を表すピークが測定スペクトル内の固定位置を有さないこと、または、少なくとも当該ピークが或る範囲内に含まれないことが観測されることがある。したがって、取得スペクトルおよび所与のタンパク質分子に対応するピークを、分類アルゴリズムによって、当該タンパク質分子に対応するものとして特定することはできない。最後に、当該不確実性は質量対電荷比の範囲にわたって一定ではなく、この比が増大するにつれて増大する。
【課題を解決するための手段】
【0006】
本発明は、分析すべき情報量の減少と質量スペクトル・ピークの位置に関する精度不足の影響の減少とに起因する質量分析法による微生物の堅牢な特定を可能とする方法を提供することを目的とする。
【0007】
この目的のため、本発明の目的は、質量分析法によって微生物を特定するための方法であって、
当該微生物の少なくとも1つの質量スペクトルを取得するステップと、
取得した質量スペクトルごとに、
当該スペクトルのピークを所定の質量範囲で検出するステップと、
質量対電荷比の範囲における各所定の再分割区間において高々1つのピークを特定する、ピークのリストを生成するステップであって、当該再分割区間の幅は、関係
【0008】
【数1】
【0009】
に従って当該質量対電荷比に沿って増大し、当該再分割区間は、当該範囲における最小の質量対電荷比に対して整数b
minから当該範囲における高質量対電荷比に対して整数b
maxまでの1より大きい整数で参照され、L(b)は整数bで参照される当該区間の幅であり、m
minは質量対電荷比の当該範囲の下界であり、m
maxは質量対電荷比の当該範囲の上界である、ステップと、
過去に特定した微生物および/または微生物の種類の知識ベースに従って取得したピークのリスト(複数可)を分析するステップと、
を含む方法を提供することである。
【0010】
換言すれば、質量対電荷比の連続空間、即ちトムソン空間が、対数的に量子化され、幾つかのピークが当該区間に存在する場合に単一のピークが各量子化区間に保持される。これにより、処理すべきデータ量を大幅に減らすことができる。さらに、ピークの正確な位置が、当該ピークが属する区間への参照で置き換えられる。これにより、正確な位置を知識ベースと比較する必要がないので、ピークの位置に関する測定の不確実性が低下する。当該ピークが或る区間に属するかどうかを判定する。最後に、区間幅を対数的に増大させることにより、機器が一定の相対精度を有するという事実、即ち、
p=Δμ/m=定数
に適合させることができる。
【0011】
1実施形態によれば、所定のトムソン範囲は3、000トムソンから17、000トムソンの間である。発明者は実際に、当該範囲が大抵のバクテリアおよびイースト/モールドの特定に十分であることを発見した。特に、3、000トムソンでの局所ピークが多数の微生物に一般的でありしたがって特異的でないことが分かる。
【0012】
1実施形態によれば、900から1、500個の区間、特に、1、200から1、400個の区間が存在する。発明者は、これらの区間が、トムソン空間の量子化により導入される情報の損失と正確なピーク位置を区間で置き換えることで得られる精度との間の最適な妥協点をもたらすことを発見した。
【0013】
1実施形態によれば、再分割区間に保持されたピークは最大強度を有するピークである。しかし、他の選択も可能である。例えば、区間に存在するピークの強度の平均値または中央値を選択することが可能である。1実施形態によれば、当該質量分析法はMALDI−TOF分光分析である。
【0014】
本発明の別の目的は、質量分光分析により微生物を特定する装置であって、特定すべき微生物の質量スペクトルを生成可能な質量分光計と、上記方法を実施することによって、当該分光計により生成された当該質量スペクトルに関連付けられた当該微生物を特定可能な計算ユニットとを備える、質量分析法により微生物を特定するための装置を提供することである。
【0015】
本発明は、例としてのみ与えた以下の説明を添付図面と関連して読むことでより良く理解される。
【図面の簡単な説明】
【0016】
【
図2】本発明に従う量子化の区間数に従って質量スペクトルから排除されたピークの数のプロットを示す図である。
【発明を実施するための形態】
【0017】
図1を参照して、本発明に従う、MALDI−TOF(「matrix−assisted laser desorption/ionization time of flight」の頭字語)タイプの質量分析法を用いたバクテリア特定方法を説明する。
【0018】
当該方法は、ステップ10で、特定すべきバクテリアのサンプルを準備することで開始し、次いでステップ12でMALDI−TOFタイプの質量分析法により準備したサンプルの1つまたは複数の質量スペクトルを取得する。 MALDI−TOF 質量分析法は当業界で公知であり、以降ではさらに詳細に説明することはしない。例えば、非特許文献1を参照されたい。
【0019】
当該方法は続いて、ステップ14で、取得したスペクトルを前処理して、特に当該スペクトルを雑音除去し平滑化する。より具体的には、分光計のバックグラウンド・ノイズを表す当該スペクトルのベース・ラインを除去する。
【0020】
次に、ステップ16で、取得したスペクトルに存在するピークの特定を、例えばピーク検出アルゴリズムにより、例えば極大点の検出に基づいて実施する。このようにして、スペクトルのピークの位置と強度を含むスペクトルごとのピークのリストが生成される。
【0021】
有利なことに、当該ピークは限定されたトムソン・レンジ[m
min;m
max]、好ましくはトムソン・レンジ[m
min;m
max]=[3、000;17、000]で特定される。実際、微生物を特定するのに十分な情報はこの質量対電荷比の範囲に含まれていることが分かっており、したがってより広い範囲を考慮する必要はないことが分かっている。
【0023】
複数のピークを含む区間ごとに、単一のピークが保持され、有利には当該ピークが最大強度を有する。このように、測定したスペクトルごとにベクトルが生成される。当該ベクトルの各成分は、量子化区間に対応し、当該区間に対して保持されたピークの強度を値として有する。値「0」はピークが当該区間で検出されなかったことを意味する。
【0024】
例えば、
図1のステップ18で、特定したピークの3つのリスト、即ち、「リスト1」、「リスト2」、および「リスト3」が示されている。各々、測定した質量スペクトルに対応する。トムソン空間を、「ビン1」から「ビン8」へと、幅が対数的に増大する8個の区間に分割する。最大強度を有するピークのみが各区間に保持される。したがって、1番目のリスト「リスト1」の区間「ビン6」に対して、1つのピークが削除されている。リスト「リスト1」、「リスト2」、および「リスト3」に対しては、例えば次の行列が得られる。各行はリストに対応する。
【0026】
したがって、上述のような量子化により、質量の増大に伴うピーク位置に関する不確実性の増大が考慮されることが分かる。特に、本発明に従うトムソン軸の再分割により
p=Δμ/m (4)
のタイプの不確実性を考慮することができる。ここで、pはピーク位置の精度であり、Δμは分光計ピーク位置の測定の不確実性であり、mはピークの実際の位置である。したがって、当該量子化は、質量分光計の測定誤差を考慮した適合的な量子化である。
【0027】
測定したピーク位置を、当該ピークが属する区間への参照で置き換えることは、当該区間の中央にピーク位置を揃えることと等価である。本発明に従う対数再分割により関係(4)に従う不確実性を低下できることを証明できる。実際、
【0029】
である。ここで、m
bar(b)は、参照bにより参照される区間の中央である。
【0030】
ピークの強度は、或るスペクトルから別のスペクトルおよび/または或る分光計から別の分光計へと非常に可変的である。この可変性のため、生の強度値を考慮することは非常に困難である。有利なことに、任意ではあるが、当該方法は続いて強度離散化ステップを行う。当該ステップが例えば、単純な「二値化」(存在/不存在)を含んでもよい。
【0031】
したがって、行列の各行が「二値化」されて正規化され、当該行列は取得されたスペクトルごとに区間内のピークの存在または不存在を特定する。例えば、上述の行列は行列
【0034】
バクテリアの特定に関連する情報がピークの不存在および/または存在に原則として含まれること、および、強度情報はその高い可変性のためあまり関係がないことに留意されたい。したがって、例えば、ロジスティック回帰、判別分析、分類木、LASSO法、SVM(「Support Vector Machine」の頭字語)タイプのアルゴリズムのような通常の分類ツールによりこの種のリストに基づいてバクテリアを特定することができる。したがって、このように二値化した行列を全ての既知の分類ツールにおいて使用してもよい。
【0035】
当該方法は続いてステップ20で、以前のステップで取得した行列を分析する。より具体的には、分類決定アルゴリズム22が、過去に特定した微生物のピークおよび/または微生物のタイプのリストに従って構築された知識ベース24に従って実装される。1つもしくは複数の候補または微生物のタイプ(科、菌、種、亜種)を、分析サンプル用に特定する。
【0036】
このように、本発明に従う方法により、可変サイズかつ2軸(m/z、強度)に沿った連続値のピークのリストを合理的な固定サイズのベクトルに削減することができる。
【0037】
上述のように生成した、過去に特定した微生物および/または微生物のタイプに関連するピークのリストから知識ベース24が構築される。本発明は、任意の種類の分類アルゴリズムと知識ベースに適用されることが分かる。本発明に従う量子化により特に、データ量を減らすことができ、ピーク位置精度の問題を排除することができ、したがって、より堅牢な知識ベースを単純な方法で構築することができる。実装は(例えば許容距離)の計算よりかなり単純であり、知識ベースをほぼ全自動で構築することができる。
【0038】
有利なことに、微生物を特定するために、区間数が900から1、500の間、好ましくは1、200から1、400の間で選択される。発明者は、これらの区間が、トムソン空間の量子化により導入された情報の損失と正確なピーク位置を区間で置き換えることで得られる精度との間の最適な妥協点をもたらすことを発見した。発明者は、
図2に示すように、試験を行い、区間数に従って量子化により排除されたピークの数をモデル化した。幾つかの区間を超えて、データ量の減少は無視でき、所定数のもとでは、排除されるピークの数は指数関数的に増大することに特に留意されたい。
【0039】
本発明の対数量子化と定数量子化について比較試験を実行した。定数量子化では、全ての区間で幅が同一であり、質量分光計、分類決定アルゴリズム、および知識ベース構築が同一である。これらの試験を以下の表に示す。誤差は微生物特定誤差に対応する。
【0041】
一定幅の1、000個の区間を選択することによって、区間の幅は、17、000トムソンに等しい質量対電荷比に対する試験に使用される質量分光計の解像度に等しくなる。一定幅の4、700個の区間を選択することによって、区間の幅は、3、000トムソンに等しい質量対電荷比に対する質量分光計の解像度に等しくなる。
【0042】
b
min=1として関係(1)乃至(3)に従って1、700個の対数区間を選択することによって、各区間の幅は、当該区間の中央に等しい質量対電荷比に対する分光計の精度に等しくなる。しかし、平均して、1、300個の区間が最低誤差の特定率と最小の占有メモリ空間をもたらすことが分かる。特に、上記表に示されているように、1、700個の区間と比較すると、これは一見して良好に適合されているように見えるが、2の誤差ポイント(−28%の誤差)が得られる一方、占有メモリ空間は減る。したがって、1、300が本発明を実装するのに好適である。
【0043】
また、本発明に従う量子化は、定数量子化と比べて少なくとも1ポイント(−15%の誤差)だけ少ない最大誤差率と、少ないメモリ空間(−25%)をもたらすことに留意されたい。少数の区間に対して、本発明に従う量子化は定数量子化よりも良好な結果をもたらす。したがって、これにより、質量分光計の解像度または保持されるトムソン範囲[m
min;m
max]が増大しても少数の区間を保つことができる。したがって、同じ誤差率、例えば、ほほ6%に対して、本発明に従う量子化では700個の区間しか必要でないが定数量子化では1、700個の区間が必要であることが分かる。
【符号の説明】
【0044】
10 サンプル準備
22 分類検出
24 知識ベース