IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ビオメリュー エスアの特許一覧

特表2024-544402反復リアルタイムシ-ケンシングにより対象生物種の存在を検出する方法
<>
  • 特表-反復リアルタイムシ-ケンシングにより対象生物種の存在を検出する方法 図1
  • 特表-反復リアルタイムシ-ケンシングにより対象生物種の存在を検出する方法 図2
  • 特表-反復リアルタイムシ-ケンシングにより対象生物種の存在を検出する方法 図3
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-11-29
(54)【発明の名称】反復リアルタイムシ-ケンシングにより対象生物種の存在を検出する方法
(51)【国際特許分類】
   C12Q 1/04 20060101AFI20241122BHJP
   C12Q 1/6806 20180101ALI20241122BHJP
   C12Q 1/6809 20180101ALI20241122BHJP
   C12Q 1/6816 20180101ALI20241122BHJP
   C12Q 1/6869 20180101ALI20241122BHJP
   C12Q 3/00 20060101ALI20241122BHJP
   C12M 1/00 20060101ALI20241122BHJP
【FI】
C12Q1/04
C12Q1/6806 Z
C12Q1/6809 Z
C12Q1/6816 Z
C12Q1/6869 Z
C12Q3/00
C12M1/00 A
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024536213
(86)(22)【出願日】2022-12-14
(85)【翻訳文提出日】2024-06-14
(86)【国際出願番号】 EP2022085847
(87)【国際公開番号】W WO2023111015
(87)【国際公開日】2023-06-22
(31)【優先権主張番号】2113604
(32)【優先日】2021-12-15
(33)【優先権主張国・地域又は機関】FR
(81)【指定国・地域】
(71)【出願人】
【識別番号】524227675
【氏名又は名称】ビオメリュー エスア
【氏名又は名称原語表記】BIOMERIEUX SA
(74)【代理人】
【識別番号】100103894
【弁理士】
【氏名又は名称】家入 健
(72)【発明者】
【氏名】ハウザー セバスティアン
【テーマコード(参考)】
4B029
4B063
【Fターム(参考)】
4B029AA07
4B029BB01
4B029FA03
4B029FA04
4B029FA15
4B063QA01
4B063QA13
4B063QA18
4B063QQ05
4B063QQ42
4B063QQ52
4B063QR55
4B063QR62
4B063QS25
4B063QS32
4B063QS34
4B063QS39
4B063QX02
(57)【要約】
本発明は、試料中の目的とする種の存在を検出するための、試料のメタゲノム解析に関する。解析は反復的に行われる。各反復の間に、各目的とする種に対応する配列が同定され、カウントされる。反復は、目的とする種の存在が確認されたとき、または最大数の反復が行われたときに停止する。目的とする種の検出に続いて、その目的とする種のゲノムのより正確な特性解析が行われる。特性解析は、補足的な反復を実行する。
【選択図】図1
【特許請求の範囲】
【請求項1】
分析サンプル中に存在する可能性のある注目生物種(SOI)を検出するための方法であって、注目生物種が既知または部分的に既知のゲノムを有し、サンプルが異なる生物種の混合物を含み、以下のステップを含む方法。
-a)対照種(SPC)をサンプルに添加し、対照種が既知のゲノムを有し、対照種が既知の濃度(CSPC)でサンプルに添加する;
-b)サンプルから核酸を抽出する;
-c)リアルタイムシーケンサーを用いて、所定の期間、または所定の数の配列決定が得られるまで、ステップb)で抽出した核酸配列の一部を配列決定する;
-d)ステップc)に続いて、ステップc)から得られた配列(ni SOI,ni SPC)を目的の種および対照種に割り当てる;
-e)それぞれ目的の種および対照種に関連する配列の量(Ni SOI,Ni SPC)を更新し、対照種および目的の種に関連する配列の量が以下であるようにする;
・ステップe)の最初の反復において、ステップd)で対照種および目的の種に割り当てた配列の量を初期配列の量(N0 SOI,N0 SPC)に追加する;
・工程e)の各反復において、工程d)において対照種および目的種に割り当てられた配列の量(ni SOI,ni SPC)を、対照種および前の反復から得られた目的種に関連する配列の量(Ni-1 SOI,Ni-1 SPC)に追加する;
-f)工程e)で更新された目的種に関連する配列の量(Ni SOI)を、配列数の閾値(SSOI)と比較する
および/または
工程e)で更新された対照種に関連する配列の量(Ni SPC)を、対照閾値(SSPC)と比較する;
-g)工程f)で行われた少なくとも1つの比較に応じて、試料中の目的生物学的種の存在を検出するか、または工程h)に進む;
-h)反復停止基準に達するまで工程c)~g)を繰り返す。
【請求項2】
各反復のステップd)が、所定の期間、または所定の数の配列が配列決定されるまで実行される、請求項1に記載の方法。
【請求項3】
請求項1又は2に記載の方法であって、
-反復のステップf)において、関心のある種(NSOI)に関連する配列の量が、配列数の閾値(SSOI)より大きい場合;
-反復のステップe)において、対照種(NSPC)に関連する配列の量が厳密に0より大きい場合;
ステップg)は、以下に依存して、関心のある種の濃度(CSOI)の推定を含む。
-最後の更新における関心のある種(Ni SOI)に関連する配列の量;
-最終更新時の対照種(Ni SPC)に関連する配列の量;
-対照種の添加濃度(CSPC)。
【請求項4】
請求項1~3のいずれか1項に記載の方法であって、
-反復のステップf)において、目的の種(Ni SOI)に関連する配列の量が配列数(SSOI)の閾値より大きい場合;
-反復のステップe)において、対照種(Ni SPC)に関連する配列の量が0である場合;
工程g)の間に、目的の種の濃度(CSOI)は、対照種の濃度(CSPC)よりも大きいとみなされる、請求項1~3のいずれか1項に記載の方法。
【請求項5】
請求項1~4のいずれか一項に記載の方法であって、
-反復の工程f)において、目的の種(Ni SOI)に関連する配列の量が、配列数の閾値(SSOI)未満である場合;
-前記反復の工程f)において、対照種(Ni SPC)に関連する配列の量が、対照閾値(SSPC)よりも大きい場合;
工程g)において、目的の種(Ni SOI)に関連する配列の量が0である場合、目的の種の濃度は0であると見なされる、方法。
【請求項6】
請求項1~5のいずれか1項に記載の方法であって、
-反復のステップf)において、目的の種に関連する配列の量(Ni SOI)が配列数の閾値(SSOI)未満である場合;
-反復のステップf)において、対照種に関連する配列の量(Ni SPC)が対照閾値(SSPC)より大きい場合;
ステップg)において、目的の種に関連する配列の量(Ni SOI)がゼロでない場合、ステップg)は、以下に依存して、目的の種の濃度(CSOI)の推定を含む:
-目的の種に関連する配列の量(Ni SOI);
-対照種に関連する配列の量(Ni SPC);
-対照種の添加濃度(CSPC)。
【請求項7】
数式(1)の比から目的種の濃度を推定する、請求項3または請求項6に記載の方法であって、
【数1】
ここで、
-LSPCおよびLSOIはそれぞれ対照種および目的種のゲノム長であり、
-Ni SOIおよびNi SPCはそれぞれ、目的種および最後の更新から生じる対照種に関連する配列の量であり、
-CSPCはサンプルに添加された対照種の濃度である。
【請求項8】
反復停止基準に達した後、請求項1~7のいずれか一項に記載の方法であって、反復停止基準に達した後、
-対象種に関連する配列の量(Ni SOI)が配列数の閾値(SSOI)未満である場合、
-または、対照種に関連する配列の量(Ni SPC)が対照閾値(SSPC)未満である場合、
-前記方法は、対象種の存在も非存在も確認できない旨の情報を生成する。
【請求項9】
請求項1~8のいずれか一項に記載の方法であって、前記方法は、判定閾値(SD)を考慮することを含み、前記方法は、対象種の濃度を前記判定閾値と比較することを目的とし、前記方法は、ステップa)において、対照種の濃度が判定閾値の0.01倍~100倍であるような方法である、方法。
【請求項10】
ステップh)において、反復停止基準が、以下の場合に達成される、請求項1~9のいずれか一項に記載の方法:
-目的の種に関連する配列の量(Ni SOI)が配列数の閾値(SSOI)を超える;
-および/または対照種に関連する配列の量(Ni SPC)が対照閾値(SSPC)を超える;
-および/またはステップc)の累積持続時間が所定の最大持続時間に達する;
-および/またはステップc)における配列決定の累積数が所定の最大数に達する;
-反復回数が所定の最大反復回数に達する、および/または反復回数が所定の最大反復回数に達する。
【請求項11】
試料中の目的種の存在を検出した後、以下の工程を含む、請求項1~10のいずれか一項に記載の方法:
-i)リアルタイムシーケンサーを用いて、所定の期間、または所定の数の配列決定が得られるまで、工程b)で抽出したヌクレオチド配列の一部を配列決定する;
-j)工程i)に続いて、工程i)から得られた配列(Ni SOI)を検出された目的種に割り当てる工程;
-k)目的種(Ni SOI)に関連する配列の量を更新する工程において、目的種に関連する配列の量が、
・ステップk)の最初の反復において、ステップj)で検出された目的の種に割り当てられた配列の量は、ステップc)~g)の最後の反復から得られる配列の量(Ni’ SOI)に追加され;
・ステップk)の各反復において、ステップj)で目的の種(ni SOI)に割り当てられた配列の量は、ステップk)の前の反復から得られる配列の量に追加される;
-l)反復停止基準に達するまでステップi)~k)を反復する。
【請求項12】
ステップi)~k)が所定の反復数に達するまで反復される、請求項11に記載の方法。
【請求項13】
ステップi)~k)が所定の反復数に達するまで反復される、請求項12に記載の方法であって、
-工程i)~k)の各反復の間に、工程k)に続いて、当該方法は、目的の生物学的種の配列決定の深さを決定することを含み、該配列決定の深さは、該種に関連する配列の累積長と該種のゲノムの長さとの間の比に対応し;
-工程i)~k)は、所定の配列決定の深さに達するまで反復される。
【請求項14】
工程i)~k)の反復の停止に続いて、該目的の種に対する抗生物質耐性マーカーまたは毒性マーカーを含む該目的の種のゲノムの典型的配列の検出を含む、請求項11~13のいずれか一項に記載の方法。
【請求項15】
前記配列決定装置が、核酸の異なる配列の連続的配列決定を次々に実施するように構成されており、各配列の配列決定は、リアルタイムで実施されているとみなされる、請求項1~14のいずれか一項に記載の方法。
【請求項16】
試料のメタゲノム分析のための装置(1)であって、
-試料を受け取ることを意図した流体チャンバー(2);
-試料のリアルタイム配列決定を行うように構成されたシーケンサー(3);
-シーケンサーから得られる配列を種に割り当てるようにプログラムされたバイオインフォマティクスモジュール(4.1)と、請求項1~15のいずれか一項に記載の方法のステップc)~h)を実施するようにプログラムされた制御モジュール(4.2)とを含む処理ユニット(4)。
【請求項17】
請求項1~15のいずれか一項に記載の方法のステップc)~h)を実施するための命令を含む、コンピューターによって読み取り可能またはダウンロード可能な記録媒体。
【発明の詳細な説明】
【背景技術】
【0001】
本発明の技術分野は、リアルタイム配列決定技術を用いたメタゲノム解析によって目的の生物学的種を同定することである。
【0002】
「リアルタイム」技術と呼ばれる配列決定技術が最近登場した。これらのプラットフォ-ムは、読み取られた配列への即時または短い遅延アクセスを可能にする。さらに、読み取られた配列の量は、支持体上の核酸の移動の必要性によってもはや制限されないため、分析されたサンプルに存在する核酸配列全体へのアクセスを可能にする。技術の一例は、Oxford Nanopore TechnologiesのMinIONおよびGridION配列決定プラットフォ-ムによって実装されるDNAのナノ孔配列決定である。
【0003】
DNAのナノ孔配列決定は、オリゴヌクレオチド鎖を含む分子がチャネルを形成するナノ孔を通過することに基づく。分子がチャネルを通過するとき、鎖を形成する各塩基の性質に依存する電位差をチャネルの両側で測定することができる。電位差により、DNAまたはRNAの5つの標準塩基(G、C、TまたはU)を区別することができる。したがって、ナノ孔を通過する間、オリゴヌクレオチド鎖は電位差の時間的配列を誘発し、これに基づいて鎖を形成する塩基の順序が決定される。
【0004】
WO2021/013900には、試料中の目的の種、より具体的には細菌を検出する方法が記載されている。試料は、予め既知量の対照種と混合されている。配列決定後、対照種に対応する配列の数を使用して、目的の種の濃度を定量するか、または試料中の目的の種の最小検出可能濃度を決定する。対照種を使用することにより、ヌクレオチド配列の抽出および可能な増幅の方法が正確に実行されることが保証される。試料に導入される対照種の量は既知であり、したがって、目的の種の濃度または最小検出可能濃度を定量するために使用することができる。
【発明の概要】
【発明が解決しようとする課題】
【0005】
本発明者は、上記の方法を、試料中のヌクレオチド断片が読み取られるときにデジタルヌクレオチド配列(「読み取り」とも呼ばれ、DNAまたはRNA配列に対応する)を送達するリアルタイムシーケンサーの使用に適合させた。これは、これらの断片が、例えば、数時間または数十分で、より迅速に分析結果を生成するためである。
【課題を解決するための手段】
【0006】
本発明の第1の主題は、試料中に存在する可能性のある対象生物種を検出する方法であり、対象生物種は既知または部分的に既知のゲノムを有し、試料は異なる生物種の混合物を含み、方法は以下の工程を含む。
-a)対照種を試料に添加し、対照種は既知のゲノムを有し、対照種は既知の濃度で試料に添加される;
-b)試料から核酸を抽出する;
-c)リアルタイムシーケンサーを用いて、所定の期間または所定の数の配列決定が得られるまで、工程b)で抽出された核酸配列の一部を配列決定する;
-d)工程c)に続いて、工程c)から得られた配列を目的の種および対照種に割り当てる;
-e)対照種および目的種に関連する配列の量が次のようになるように、目的種および対照種にそれぞれ関連する配列の量を更新する;
・ステップe)の最初の反復において、ステップd)で対照種および目的種に割り当てられた配列の量を初期配列の量に追加する;
・ステップe)の各反復において、ステップd)で対照種および目的種に割り当てられた配列の量(ni SOI,ni SPC)を、前の反復から得られた対照種および目的種に関連する配列の量に追加する;
-f)ステップe)で更新された目的種に関連する配列の量を、配列数の閾値と比較する;
および/または
ステップe)で更新された対照種に関連する配列の量を、対照閾値と比較する;
-g)ステップf)で行われた少なくとも1つの比較に応じて、試料中の関心生物学的種の存在を検出するか、またはステップh)に進む;
-h)反復停止基準に達するまでステップc)~g)を繰り返す。
【0007】
1つの実施形態によれば、各反復のステップd)は、所定の期間、または所定の数の配列が配列決定されるまで実行される。
【0008】
本方法は、以下のようであってもよい:
-反復のステップf)において、目的の種に関連する配列の量が配列数の閾値より大きい場合;
-反復のステップe)において、対照種に関連する配列の量が厳密に0より大きい場合;
ステップg)は、以下に応じて、目的の種の濃度を推定することを含む:
-最後の更新時に目的の種に関連する配列の量(すなわち、最後のステップeで);
-最後の更新時に対照種に関連する配列の量;
-対照種の添加濃度。
【0009】
方法は、以下のようであってもよい:
-反復のステップf)において、目的の種に関連する配列の量が配列数の閾値より大きい場合;
-反復のステップe)において、対照種に関連する配列の量が0である場合;
ステップg)の間、目的の種の濃度は対照種の濃度よりも大きいとみなされる。
【0010】
本方法は、以下のようにすることができる。
-反復のステップf)において、目的の種に関連する配列の量が配列数の閾値よりも小さい場合;
-反復のステップf)において、対照種に関連する配列の量が対照閾値よりも大きい場合;
ステップg)において、目的の種に関連する配列の量が0である場合、目的の種の濃度は0であるとみなす。
【0011】
方法は、以下のようなものであってもよい:
-反復のステップf)において、対象の種に関連する配列の量が配列数の閾値未満である場合;
-反復のステップf)において、対照種に関連する配列の量が対照閾値より大きい場合;
ステップg)の間に、対象の種に関連する配列の量がゼロでない場合、ステップg)は、以下に依存する対象の種の濃度の推定を含む。
-対象の種に関連する配列の量;
-対照種に関連する配列の量;
-対照種の添加濃度に依存する。
目的種の濃度は、以下の比から推定することができる。
【数1】
ここで、
-LSPC及びLSOIとは、それぞれ対照種および目的種のゲノム長である。
-Ni SOI及びNi SPCとは、それぞれ目的種および最後の更新から生じる対照種に関連する配列の量である。
-CSPCは、サンプルに添加された対照種の濃度である。
この方法は、反復停止基準に達した後、
-目的の種に関連する配列の量が配列数の閾値未満である場合;
-および対照種に関連する配列の量が対照閾値未満である場合;
-方法は、目的の種の存在も不在も確認できないという趣旨の情報を生成する。
【0012】
一つの可能性によれば、方法は、決定閾値を考慮することを含み、方法は、目的の種の濃度を決定閾値と比較することを目的とし、方法は、ステップa)において、対照種の濃度が決定閾値の0.01倍から100倍の間であるようなものである。
【0013】
一つの可能性によれば、ステップh)において、反復停止基準は、以下の場合に到達する。
-目的の種に関連する配列の量が配列数の閾値を超える;
-および/または対照種に関連する配列の量が対照閾値を超える;
-および/または工程c)の累積持続時間が所定の最大持続時間に達する;
-および/または工程c)における配列決定の累積数が所定の最大数に達する;
-および/または反復の数が所定の最大反復数に達する。
【0014】
一実施形態によれば、本方法は、試料中の対象種の存在の検出に続いて、以下の工程を含む。
-i)リアルタイムシーケンサーを用いて、所定の期間、または所定の数の配列決定が得られるまで、工程b)で抽出されたヌクレオチド配列の一部の配列決定;
-j)工程i)に続いて、工程i)から得られた配列を検出された目的の種に割り当てる;
-k)目的の種に関連する配列の量を更新し、その結果、目的の種に関連する配列の量は、
・工程k)の最初の反復において、工程j)で検出された目的の種に割り当てられた配列の量は、工程c)~g)の最後の反復から得られた配列の量に追加される;
・工程k)の各反復において、工程j)で目的の種に割り当てられた配列の量は、工程k)の前の反復から得られた配列の量に追加される;
-l)反復停止基準に達するまでステップi)~k)を繰り返す。
ステップi)~k)は、所定の反復回数に達するまで反復することができる。
【0015】
1つの可能性によれば、
-ステップi)~k)の各反復の間に、ステップk)に続いて、本方法は、目的の生物学的種の配列決定の深さを決定することを含み、配列決定の深さは、種に関連する配列の累積長と種のゲノムの長さとの間の比に対応する。
-ステップi)~k)は、所定の配列決定の深さに達するまで反復する。
【0016】
1つの実施形態によれば、ステップi)~k)の反復の停止に続いて、目的の種のゲノムの典型的な配列を検出する。典型的な配列は、目的の種の抗生物質耐性マーカーまたは毒性マーカーを含む。
配列決定装置は、好ましくは、核酸の異なる配列の連続的な配列決定を1つずつ実施するように構成され、各配列の配列決定は、リアルタイムで実施されるとみなされる。
【0017】
本発明の第2の対象は、試料のメタゲノム分析のための装置であって、
- 試料を受け取ることを意図した流体チャンバー;
-試料のリアルタイム配列決定を行うように構成されたシーケンサー;
-シーケンサーから得られた配列を種に割り当てるようにプログラムされたバイオインフォマティクスモジュールと、本発明の第1の主題による方法のステップc)~h)を実施するようにプログラムされた制御モジュールとを含む処理ユニット。
【0018】
本発明の第3の主題は、本発明の第1の主題による方法のステップc)~h)を実施するための指示を含む、コンピューターによって読み取り可能またはダウンロード可能な記録媒体である。
【0019】
本発明は、以下に列挙する図を参照して、説明の残りの部分で提示される例示的な実施形態の開示を読むことによって、よりよく理解されるであろう。
【図面の簡単な説明】
【0020】
図1図1および図2は、本発明による方法の主要なステップを概略的に示す。図1は、対象種の検出のためのフェーズに関する。
図2図2は、検出フェーズにおいて検出された各対象種の特徴付けのためのフェーズに関する。
図3図3は、本発明を実施するために構成された装置を概略的に示す。
【発明を実施するための形態】
【0021】
この方法の目的は、試料中の対象生物種SOIの存在を検出することができるようにすることである。頭字語SOIは、「対象生物種」を意味する。検出の場合、プロセスは、判定閾値SDとの比較を可能にするように、対象生物種SOIの絶対的な定量化を可能にすることができる。
【0022】
生物種とは、微生物、例えば、細菌、ウイルス、真菌、古細菌、アメーバ、原生生物、または微細藻類を意味する。生物種は、配列決定可能な核酸を含む細胞または他の任意の物体または実体であってもよい。
【0023】
試料がヒトまたは動物生物から得られる場合、対象生物種は、病原性種、またはヒトまたは動物の体の健康または機能に影響を及ぼすと同定された種、例えば、腸内細菌種、または抗癌治療の効力に影響を及ぼす細菌であってもよい。サンプルが産業プロセスまたは環境からのサンプリングによって得られる場合、対象生物種は、汚染物質と考えられる種、または産業プロセスまたは環境において重要性を有し、その存在または濃度を監視することが望まれる対象生物種であり得る。
【0024】
対象生物種は、既知または部分的に既知のゲノムを示す。ゲノムまたはその既知の部分は、対象配列と呼ばれる配列から構成される。
【0025】
この方法は、複数の対象生物種を同時に扱うことができる。したがって、用語「対象生物種」は、少なくとも1つの対象生物種を意味するものとして解釈されるべきである。
【0026】
決定閾値SDは、標的用途に応じて、例えば微生物の対象生物種の負荷を特徴付けることを可能にする閾値である。これは、例えば、規制上または衛生上または産業上の制限に照らして設定される。例えば、当該用途が臨床診断の補助に使用され、対象生物種が細菌である場合、決定閾値は、それ未満では細菌の存在が正常な存在、すなわち非病的な発達に対応し、それ以上では細菌の存在が病的であるとみなされ、例えば、感染症に対応する濃度とすることができる。本発明が工業プロセスに適用される場合、決定閾値は通過値に対応し、決定閾値を超えると試料は通過しないとみなされ、検出閾値を下回ると試料は通過するとみなされる。どのような用途であっても、対象生物種の濃度が決定閾値以上である場合、それは重要であると定義される。特定の用途、例えば発酵製品の製造においては、対象となる生物種の濃度が判定閾値よりも低い場合には臨界とみなすことができる。判定閾値は、生物種の最小許容濃度に相当する。
【0027】
試料は、一般に、環境から採取された試料、死亡した生物または生きている生物から採取された試料、あるいは農業食品または製造された製品から採取された試料である。また、試料は、工程管理の目的で工業施設から採取されたものであってもよい。したがって、試料は、同一のゲノムを持たない様々な生物種を含む。特に、試料が生物、例えば、ヒトまたは動物生物の試料採取から得られた場合、試料は、試料が採取された生物に由来する細胞の有意な量または圧倒的な量を含む。ヒトまたは動物生物のゲノムは、原核生物のゲノムよりも1000から100000倍大きいサイズを有する。さらに、試料は、一般に、試料中に天然に存在し、病理または重大な汚染を生じにくい生物種を含む。例えば、試料が気管支肺胞試料である場合、試料は、肺に天然に存在する細菌叢を含む。試料が便試料である場合、試料は、消化管に天然に存在する細菌叢を含む。したがって、対象となる生物種が細菌またはウイルスである場合、対象となる生物種の核酸は、試料中の核酸の少数であってもよい。
【0028】
試料は、「マトリックス」種と呼ばれるものを含み、これは試料に対して内因性であり、対象となる生物学的種に関するメタゲノム情報を覆い隠す傾向がある。例えば、試料がヨーグルト、肉片またはワクチンから採取される場合、これらの媒体を代表するマトリックス種を含む。生物からサンプリングする場合、マトリックスは生物の構成細胞を含む。
【0029】
本発明の重要な態様は、試料中の対象種の存在が、従来技術のリアルタイムシーケンサーを用いて検出されることである。この種のシーケンサーは、従来のシーケンサーよりも迅速に、試料中に存在する配列に関連する利用可能なデータを得ることを可能にする。リアルタイムシーケンサーは、単一の配列中の塩基の連続的な検出を表すシグナルを連続的に収集するように構成される。したがって、リアルタイムシーケンサーは、配列が解読されるときに、リアルタイムで配列を生成するように構成される。試料中に存在する異なる配列の配列決定は連続的に行われ、各配列は次々に配列決定される。これは、並行して同時配列決定を受ける特定の配列の可能性を排除するものではない。例えば、シーケンサーがナノポアシーケンサーである場合、各ナノポアは、多数の異なる配列を並行して「読み取る」。各ナノポアは、多数の異なる配列を連続的に読み取ることができる。
【0030】
このようなシーケンサーの別の利点は、配列のリアルタイム分析を実行する可能性であり、読み取られた配列の量は、配列決定の持続時間に関連する。利用可能な配列決定結果に応じて、配列決定を継続してもよいし、停止してもよく、時間利得および使用の高い柔軟性を提供する。シーケンサーは、先行技術に記載されているようなナノポア型であってもよく、より一般的には、本発明は、リアルタイムで配列を生成するように構成されたシーケンサーの使用に関する。これらの配列は、配列決定後に同定される。したがって、シーケンサーは、同定された配列のリストを順次生成するように構成され、これらの同定された配列は、用語「読み取り」によって示される。読み取りのリストは、規則的な間隔、例えば毎分、例えば10で生成される。各リスト内で読み取られた配列の量をパラメータ化することも可能である。各リスト内の配列(または読み取り)の量は、例えば4000であり得る。
【0031】
特許出願WO2021/013900の状況と同様に、本発明の目的の一つは、メタゲノム解析が利用可能である程度を評価することである。特に、試料の調製(サンプリングは除く)から配列決定データのバイオインフォマティクス解析までの集合的な段階の適合性を評価することが必要である。この目的のために、Sample Processing Controlの頭字語であるSPCと称される対照種を試料に添加する。対照種の1つの機能は、以下に記載される核酸抽出および配列決定のステップの効果的な進行の監視を可能にすることである。対照種SPCは、既知の生物学的種であってもよく、そのゲノムも、好ましくはその全体が既知である。対照種SPCは、天然の生物学的種であってもよい。また、人工種、例えばカプセル化RNA(リボ核酸)であってもよい。好ましくは、対照種SPCは、採取された試料中に最初は存在しないか、存在するとしても無視できる量である。好ましくは、試料中に最初に存在する、すなわち添加前に存在する対照種SPCの含有量は、試料に添加される対照種SPCの濃度CSPCより少なくとも10倍、好ましくは少なくとも100倍または1000倍低いことが好ましい。対照種SPCは、例えば細菌であってもよい。添加される対照種SPCの濃度CSPCが制御されることが重要である。
【0032】
対照種は、以下の観点を考慮して選択することができる。
-対照種は、好ましくは、試料中に自然に存在する生物、または内因性生物、および対象となる探索種とは異なっていなければならない。したがって、バイオインフォマティクスツールは、SPCの配列決定から配列を正確に同定することができる。
-配列決定中に対照種に割り当てられた配列の量は、有用な情報を覆い隠すことなく、対象となる生物種の配列に対応して正確に検出できるように十分でなければならない。言い換えれば、対照種は、試料中で優勢ではないが、ハイスループットシークエンシングによって検出可能であることが好ましい。特に、陽性(判定閾値を超える種の濃度)または陰性(判定閾値を下回る種の濃度)を決定したい場合、対照種は、以下の特徴の少なくとも一つを示すことが好ましい。
・そのゲノムのサイズは、好ましくは、対象となる生物種のゲノムのサイズと同様であるか、少なくとも同等である。より具体的には、対照種のゲノムのサイズは、対象となる生物種のゲノムのサイズの0.1倍から10倍の間である。
・対照種の濃度CSPCは、判定閾値に応じて設定することができる。添加される対照種SPCの濃度CSPCは、例えば、判定閾値の0.001倍から1000倍の間、好ましくは0.01倍から100倍の間である。
・対照種SPCの核酸は、試料を調製する工程、抽出する工程および配列決定する工程において、対象種の核酸と同様の処理を受ける。
・GC(グアニン、シトシン)塩基のパーセンテージは、好ましくは、対象生物種のGC塩基のパーセンテージに近い。近いとは、75%から125%の間、好ましくは80%から120%の間を意味する。
・対照生物種は、対象生物種が細菌である場合、好ましくは無傷の細胞壁または膜を含み、対象生物種がウイルスである場合、好ましくはタンパク質シェルを含む。この条件はまた、対象生物種の核酸を溶解または抽出する工程をモニターすることを可能にする。
-好ましくは、対照種のヌクレオチド配列は、抗生物質に対する感受性の潜在的試験の結果が、目的の生物学的種のゲノム中にそのようなマーカーが存在することによって損なわれないように、例えば抗生物質に対する耐性のマーカー、または毒性マーカーなどのゲノムマーカーを含まない。好ましくは、対照種のヌクレオチド配列は、臨床的または工業的に関心があり、その存在がチェックされやすい他の遺伝子を含まない。
-対照種は、好ましくは、操作が容易であり、特に、
・ヒトまたは環境に無害である;
・および/または凍結乾燥または凍結のような熱処理に耐性があり、それによって保存が容易である。
-対照種は、胞子を形成してはならないか、形成してもわずかである。
-対照種は、目的の生物学的種に近い溶解感受性を有していなければならない。
-対照種は、ボールの形態をとることができ、各ボールは、凍結乾燥形態の対照生物学的種の較正された濃度を含む。
【0033】
単一の対照種SPCを使用してもよいし、様々なタイプの複数の対照種を使用してもよいことに留意されたい。
【0034】
本方法は、まず、図1に関連して以下に記載されるステップで、目的の種を検出する段階を含む。
【0035】
ステップ10:試料を採取する。
この例では、試料は、診断を補助する目的で、生きているヒト生物から採取される。しかしながら、本発明は、生物の領域における適用に限定されない。試料は、判定閾値に関する適合性を検証するために、自然環境、産業環境または病院環境から採取することができる。
【0036】
ステップ20:対照種を添加する。
対照種SPCの添加された濃度CSPCは、好ましくは、正確に、例えば、一つ以上の対象種の定量に望まれるのと同じ精度で知られている。具体的には、特定の条件が満たされるならば、定量されるべき試料中の対象生物種の濃度を可能にし、次いで、対照種がキャリブレーターを形成する。用語「添加された濃度」は、対照種の添加による試料中の対照種の濃度を示す。
【0037】
ステップ30から60の説明では、有利な例として、試料への単一タイプの対照種の添加を基本とする。その後、対照種は、メタゲノム解析のステップにおける品質管理の機能およびキャリブレーターの機能を実行し、対象生物種の濃度の定量を可能にする。
【0038】
ステップ20の終了時に、試料中に対照種の添加濃度CSPCが存在する。対照種の添加濃度CSPCは、好ましくはGEq/mL(1mL当たりのゲノム当量)で表される。
【0039】
なお、細菌学における臨床検出閾値(例えば、それを超えると感染症と診断される閾値)は、一般にCFU/mL(コロニー形成単位)で表されるが、提案された定量法では、ゲノム等価性に関する情報なしに核酸を定量することができる。したがって、SPCについては、ゲル培地などでの培養によるコロニー形成単位数と、定量PCRなどによるゲノム数の等価性との相関を求めることが推奨される。例えば、バイオボール(登録商標)枯草菌株ATCC 19659 BioBall MultiShot 10E8(bioMerieux,カタログ#416721)では、一つのコロニー形成単位が一つのゲノムに相当することが確認されている。
【0040】
添加濃度は、決定閾値SDの関数として定義することができる。対照種の添加濃度CSPCは、好ましくは決定閾値SDに等しいか、または決定閾値SDに近く、例えば約+-50%以内である。したがって、0.1SD≦CSPC≦10SDである。対照種の添加濃度CSPCの効果は、以下に記載される。
【0041】
ステップ30:核酸の溶解および抽出。
この工程では、試料の細胞、特に目的の生物学的種および対照種の細胞を溶解して、それらのDNAを抽出できるようにする。様々な戦略が考えられる。
・溶解は、目的の生物学的種を優先的に標的とするようにパラメータ化することができる。このようなシナリオでは、対照種は、目的の生物学的種と同じ溶解感受性を有するか、同等と考えられる溶解感受性を有する必要がある。
・溶解は、本質的に目的の種以外の細胞を溶解することを意図した第一の溶解を含むことができる。このような第一の溶解は、例えば、目的の生物学的種が、試料を構成するマトリックスの細胞に関して非常に少数である場合に想定することができる。第一の溶解に続いて、放出された核酸が除去され、次いで、目的の生物学的種を標的として第二の溶解が行われる。このようなシナリオにおいて、対照種は、好ましくは、第一の溶解に抵抗性であり、第二の溶解に抵抗性ではない。
【0042】
溶解に続いて、DNAは、例えば、WO2014/114896に記載された抽出方法に従って、試料から抽出される。
【0043】
ステップ40:配列決定
試料から抽出されたDNAは、読み取られた配列へのリアルタイムアクセスを可能にするシーケンサー、例えば、ナノポアシーケンサーによって配列決定される。例えば、Oxford Nanopore Technologies社のMinION(登録商標)シーケンサーであってもよい。シーケンサーは、ナノポアを含む専用の流体チャンバーに接続される。試料は、流体チャンバーに導入される。シーケンサーは、同定された配列を分析するための処理ユニットに接続される。処理ユニットは、分析された配列を同定するために、バイオインフォマティクスソフトウェアからの命令を実行するように構成されたマイクロプロセッサを含む。処理ユニットは、例えば、配列決定専用のコンピューティング環境を含むMinITコンピューターである。
【0044】
本発明は、特に、以下の特徴を有する、いわゆる「リアルタイム」シーケンサーに適用される。
-試料中に存在するすべての配列を読み取る能力。配列を読み取るために配列を支持体上に固定することに基づくシーケンサーとは対照的に、これらのシーケンサーは、したがって、ヌクレオチド配列を固定するための要素の数に対応する所定の最大数の配列を配列決定する。これは、特に、生成される配列の数が配列決定の持続時間に比例することを意味する。
-生データ(例えば、電位のような読み取りまたは生信号)を収集されたのと同じ速度で出力する能力、または所定のサイズの配列のバッチごとに定義された頻度でバッチにより生データを出力する能力、または固定された頻度で定期的に生データを出力する能力(たとえば、毎分または10分ごとに未処理データのバッチ)。
【0045】
リアルタイム配列決定の特定の特徴は、RNAまたはDNA配列の読み取り結果が、シーケンサーからの出力時にリアルタイムで、または準リアルタイムで利用できることである。準リアルタイムとは、読み取り(または電位などの測定された生のシグナル)が、サンプル中に存在する酸の配列決定に必要な総期間よりも非常に短い期間の終わりに、または配列決定に必要な試薬の総消費期間よりも非常に短い期間の終わりに、バッチでシーケンサーから出力されることを意味する。したがって、各バッチは数分または数十分で生成される。リアルタイムシーケンサーは、リアルタイムでシーケンス(読み取り)を生成する能力を備えている。ただし、一般的には、一定の間隔で生成されるファイルで、一定数のシーケンスがデコードされていることが想定される。例として、Oxford Nanpore MinION Sequencerは、既定では準リアルタイムで、ポテンシャル差の4000シーケンスのバッチで".fast5"ファイルを生成する。これは、コンピューターによって、4000回の読み取りのバッチで、準リアルタイムで.fastqファイルに変換できる。fast5拡張子は、生データファイルを表す。fastq拡張子は、シーケンスおよび関連する品質スコアを格納するファイルを表す。これにより、この方法を対話的に実装することができ、得られた結果に応じてシーケンスを停止または続行することができる。
【0046】
シーケンス処理は、特に、反復的に実施することができ、各反復は、所定の数(またはバッチ)のシーケンスに対応するか、または所定の期間にわたって実施されるシーケンス処理に対応する。各反復の間、シーケンス処理に続いて、シーケンスは、潜在的に、対照種SPCまたは関心生物学的種SOIに、または関心生物学的種またはサンプル中に存在する他の種に割り当てられる。
【0047】
各反復は、対応するランクiを有する。iは、1からIまでの整数であり、Iはステップ70に関連して記載された反復の最大数、または取得されたシーケンス(読み取り)の最大数に対応する。各反復の間に、シーケンシングは、対象生物種SOIおよび対照種SPCにそれぞれシーケンス数ni SOI及びni SPCを割り当てる。
【0048】
以下のステップは、対象生物種SOIに関連して記載される。それらは、複数の異なる対象生物種で実施することができる。
【0049】
ステップ50:シーケンス数を更新する。
このステップの間、ステップ40においてそれぞれ対象生物種および対照生物種に割り当てられたシーケンス数Ni-1 SOI,Ni-1 SPCは、それぞれ、前の反復において対象生物種SOIおよび対照生物種SPCにそれぞれ関連したシーケンス数である。このステップは、以下の式に従って、それぞれ対象生物種SOIおよび対照生物種SPCに関連したシーケンス数の更新に対応する。
【数2】
【数3】
【0050】
ここで、ni SOI及びni SPCは、反復iのステップ40においてそれぞれ対象生物種および対照生物種に割り当てられたシーケンス数である。この表記niは、反復iにおいて種に割り当てられたシーケンス数に対応し、一方、この表記Niは、反復までの全反復において種に関連したシーケンスの総数に対応する。
【0051】
最初の反復(i=1)では、所定の初期値N0 SOIおよびN0 SPCを考慮する。これらの初期値は、一般に0である。
【数4】
【0052】
一つの可能性によれば、配列Ni SOIまたはNi SPCの数は、参照量によって正規化することができる。参照量は、例えば、現在の反復までの配列決定中に生成された配列の総量Ni iであってもよい。
【0053】
ステップ60:閾値との比較
このステップの間に、各対象種SOIに関連する配列の数Ni SOIは、配列決定を停止し、サンプル中の対象種の存在に関連する定量的解釈を開始するために必要な、対象種SOIに関連する読み出しの最小数に対応する、配列数SSOIの閾値と比較される。配列数の閾値は、対象種に関連する配列数の閾値、または読み出し数の閾値に対応する。
【0054】
対照種SPCに関連する配列の数Ni SPCは、制御閾値SSPCと比較される。制御閾値SSPCは、各SOIに関連する読み出しの数が配列SSOIの数の閾値に達しない場合に配列決定を停止するための、SPCに関連する読み出しの最小数に対応する。
-Ni SOI<SSOI及びNi SPC<SSPCのときステップ61参照;
-Ni SOI≧SSOI及びNi SPC>0のときステップ62参照;
-Ni SOI≧SSOI及びNi SPC=0のときステップ63参照;
-Ni SOI<SSOI及びNi SPC≧SSPCのときステップ64参照;
シーケンス数の閾値と制御閾値の決定については後述する。
【0055】
ステップ61
このステップの間、サンプル中の対象種SOIの存在に関して結論を導くことはできない。ステップ70に関連して記載されているように、反復停止基準に達しない限り、ステップ40から60の再反復が必要である。
【0056】
ステップ62:
このステップの間、サンプル中の対象種SOIの存在を結論付け、その濃度を、例えば次式によって定量化することが可能である。
【数5】
【0057】
ここで、
-LSPCおよびLSOIはそれぞれ、対照種および対象生物種のゲノム長である。
-αは、対象生物種の濃度が既知であるトレーニングサンプルに基づいて経験的に決定された補正係数である。補正係数αは、対象生物種と対照生物種の配列決定手順の効率の差を考慮したものである。デフォルトとして、α=1とみなすことができる。このユニタリ値は、判定閾値に対するサンプルの陽性または陰性を決定するのに十分な絶対量を生成する。
添加濃度がGEq/mLで表される場合、対象生物種の濃度も同じ単位で表される。
【0058】
ステップ63
このステップ中、対象生物種は、対照生物種の濃度よりも高い濃度でサンプル中に存在すると考えられるが、SOIの絶対濃度を決定することはできない。
【数6】
【0059】
ステップ64
このステップ中、Ni SOI=0であれば、対象生物種SOIがサンプル中に存在しないと結論することが可能である。そうでなければ、ステップ62に記載された式を用いてその濃度を定量することが可能である。
【0060】
ステップ70:
反復停止基準に達するまで、ステップ40から60を繰り返す。優先的に、各反復は、好ましくは各反復iに対して同一である所定のシーケンシング持続時間、または読み取られた所定のシーケンス数(読み取り数)に対応する。
反復停止基準は、ステップ62または63または64に至る条件に達したときに到達したと考えられる。
【0061】
反復停止基準は、反復の最大数Iに等しい反復の数であってもよく、前記数は予め定められている。例えば、反復停止基準は、配列決定期間が予め定められた期間、例えば12時間以上であるとき、又はシーケンサーから得られた配列の総数が予め定められた最大数より大きいときに到達すると考えられる。
【0062】
ステップ80警告。
ステップ80は、NI SOI<SSOI及びNI SPC<SSPCの場合、つまり、ランクIの最後の反復に続いて、対象の種及び対照にそれぞれ関連する配列の数が、それぞれ配列数の閾値及び対照閾値より小さい場合に実行される。その場合、警告信号が発せられ、試料中の対象の種の存在又は不在が確認できないことを示す。
【0063】
ステップ90停止
ステップ70又は可能なステップ80に続いて、方法を停止することができる。
一つの可能性によれば、互いに異なる複数の対象の種を同時に分析する。ステップ62、63及び64に示される条件の一つに遭遇した場合、配列決定を停止することができ、対象の各種をこれらの基準に従って解釈する。
【0064】
任意に、試料中の対象の種の存在が報告された場合、ステップ62、63又は64に続いて、同定された対象の種に関する相補的ゲノム情報を有することができる。問題の情報は、特に、ゲノム中の特定のマーカー、例えば、抗生物質耐性マーカーまたは毒性マーカーの存在であり得る。抗生物質耐性マーカーまたは毒性マーカーは公知である。
【0065】
図2に関連して以下に記載される反復ステップ100から130は、同定された対象種のゲノム中の特定のマーカーの存在を確認するために実施され得る。i’がステップ70の反復停止基準に達した反復のランクを示す場合、ステップ100から130は、i’<i≦Iが最後の反復のランクに対応するように実施される。
【0066】
ステップ100
このステップは、ステップ40と同様である。ステップ40から80の反復の後に検出された対象SOIの各種に対応するシーケンスのみに番号が付けられる。
【0067】
ステップ110
このステップは、対象の各種のシーケンスの数が次式に従って更新されることを除いて、ステップ50と同様である。
【数7】
【0068】
ステップ120:
反復停止基準に達しない限り、ステップ100から110を繰り返す。反復停止基準は、反復の最大数Iの到達であってもよい。注意として、後者は、最大配列決定期間または同定された配列の最大数に対応してもよい。
【0069】
一つの可能性によれば、各反復の間に、関心のある種SOIの配列決定の深さが決定される。配列決定の深さは、関心のある種に関連する配列の累積長と関心のある種のゲノムの長さとの間の比に対応する。配列決定の深さが閾値の深さに達すると、反復停止基準に達する。反復は停止される。
【0070】
ステップ130:特性決定
このステップにおいて、所望のマーカーに対応する配列が識別され、番号付けされる。
配列数S SOI および制御閾値S SPC の閾値の決定
前に記載された方法の実施は、事前の決定を前提とする。
-各ステップ60で目的の種の配列数Ni SOIを比較する配列数SSOIの閾値;
-および各ステップ60で対照配列数Ni SPCを比較する対照閾値SSPC
【0071】
試料中の目的の種SOIの異なる濃度CSOIを考慮しながら、それぞれ1、10,100、1000および10000の目的の種SOIに対応する読み取り数を生成するのに必要な配列決定時間を推定した。
【0072】
配列決定時間TTR(結果が得られるまでの時間)は、以下の式に従って推定される。
【数8】
ここで、
-SSOIは配列数の閾値である。
-CADNtotはサンプル中のDNAの総濃度である。これには、対象種、対照種、および非標的DNA(ヒトDNAおよび共生細菌叢)の濃度が含まれる。
-Rfastqは各反復で得られた読み取りの量、つまり生成された各.fastqファイルで得られた読み取りの量である。たとえば、Rfastq=4000である。
-Tfastqは、Rfastqに等しい読み取りの量で構成されるfastqファイルを取得するための平均シーケンス時間である。
-Nsampleは同時に配列決定されるサンプルの数である。Nsampleは、サンプルに起因する可能性のある配列決定されたDNAの割合に相当する。Nsampleは、異なるサンプルが同時に配列決定される場合は1以外である。この場合、Nsampleは、配列決定されたDNAの総量を当該サンプル中のDNAの総量で割った値を示す。
【0073】
表1に配列決定時間を(hh:mmで)示す。これは、配列数SSOIの閾値と、決定閾値SDの関数として表される対象種SOIの濃度CSOIに応じて計算される。対照種は濃度CSPC=SDで添加され、ヒトDNAと共生細菌叢の合計は100SDに等しいと考えられる。この場合、DNAの総量はCADNtot=101SD+CSOIに等しい。サンプルは、他の3つのサンプル(Nsample=4)と同時に配列決定されると考えられ、各サンプルは、約Tfastq=3分の頻度でRfastq=4000回の読み取りを含む読み取りファイルを生成するシーケンサーを用いて、同量のDNAで配列決定される。
【0074】
【表1】
【0075】
表1では、濃度CSOIが決定閾値SDに等しい場合、30分間のシークエンシングでシークエンス数SSOIの閾値に到達したいならば、シークエンス数SSOIの閾値の値は100を超えてはならないことが観察される。特に、シークエンス数SSOIの閾値が高いほど、分析時間は長くなる。論理的には、シークエンス数SSOIの閾値が高いほど、それに達する時間も長くなる。値SSOI=1は、対象となる種の濃度が低い場合でも、すぐに到達する。しかし、あまりに低い値SSOIを採用すると、偽陽性のリスクが高くなり、定量の精度に悪影響を及ぼす。
【0076】
さらに、あまりに低い値は、より低い濃度に存在する可能性のある他の対象種の検出の可能性を制限する。例えば、100の配列数SSOIの閾値を使用すると、一回の読み取りに基づいて、100倍低い濃度に存在する別の対象種SOI’の検出が可能になる。したがって、100倍を超える濃度で過半数が存在する場合は、配列数SSOIの高い閾値が特に重要になる可能性がある。これにより、SOIより100倍低いが決定閾値SDより高い濃度で、SOI’と呼ばれる他の少数のSOIの検出が可能になる。
【0077】
表1に示した結果に基づいて、配列数SSOIの閾値は5から500の間、又は50から500の間が好ましいという結論が導き出される。短い分析時間が優先される場合は、配列数SSOIの閾値が低すぎると偽陽性につながるという事実を認識して、50に近い、またはさらに低い、比較的低い配列数の閾値が選択される。測定のダイナミクスと、異なる濃度で存在する異なる対象種の同時検出の可能性が優先される場合は、分析時間を犠牲にして、500に近いかそれより高い、配列数SSOIの高い閾値が選択される。
【0078】
この方法の実施に及ぼす対照閾値SSPCの影響を検討した。目的の種が存在しない場合には、試料中に相当量のDNAが存在することがある。臨床試料では、DNAの起源は多様である。例えば、患者の細胞由来のDNAや共生細菌叢由来のDNAなどである。また、DNAは非定型感染から生じることもある。したがって、SOI以外の微生物由来のゲノムDNAの濃度は、決定閾値SDをはるかに超える量に達する可能性がある。表2は、決定閾値SDに対して相対的に表したDNA濃度CADNの違いについて、対照種に対応する配列の数が対照閾値SSPCよりも高くなるような配列決定時間を示している。目的とする種の濃度CSOIが決定閾値SDに対応すると仮定した。目的は、SOIが検出されない試料の配列決定時間に対する対照閾値SSPCの変化の影響を決定することである。
【0079】
【表2】
【0080】
DNA濃度がSD(CADN=SD)に等しい場合、30分未満の配列決定で5から3125の間の対照閾値SSPCに達することが観察される。したがって、これらの試料については、30分未満の配列決定でSOIの欠失を結論づけることができる。
【0081】
DNA濃度がSDを超える場合には、配列決定時間が著しく長くなるため、目的の種SOIの検出について陰性の結果が得られるように、高すぎない対照閾値を選択する必要がある。例えば、病原体濃度が1000SDに等しい非定型感染を有する臨床試料の場合、対照閾値SSPC=125では、少なくとも6時間の配列決定前に目的の種SOIの検出について陰性の結果が得られない。したがって、選択される配列数SSOIの閾値は、SOIの検出を可能にし、目的の種とは異なるが、その濃度がSDよりも高い場合には、その存在が報告すべき関心のある別の種を同定するのに十分な読み取りをシーケンサーが行えるように、低すぎないようにすることが推奨される。この状況は、非定型感染の状況において生じる可能性がある。
【0082】
対照種の添加濃度C SPC の決定
前段落では、対照種SPCは決定閾値SDに等しい濃度CSPCで存在していた。発明者は、対照種の添加濃度C SPC を変化させる効果を評価した。
【0083】
表3は、サンプルに添加されたSPCの種々の濃度(CSPC=0.01SD;CSPC=SDおよびCSPC=100SD)に対して、結果を返すのに必要な期間(hh:mm)、および0.0001SDから10000SDの間のSOIの種々の濃度CSOIに対する検出結果を示す。
【0084】
「結果」列には、次のようにある。
-「結果」列に決定閾値SDに対して相対的に表された濃度が存在することは、SOI(Ni SOI>0)およびSPC(Ni SPC>0)の読み取りが検出されたことによって、この濃度を計算できたことを示す。これは、Ni SOI>0のステップ62またはステップ64に対応する。
-エントリ「NEG」は、SOI(Ni SOI=0)に関連付けられた読み取りはなかったが、SPCに関連付けられた読み取りの数が25に設定された制御閾値を超えたことを示す(Ni SPC>25)。これは、Ni SOI=0のステップ64に対応する。
-エントリ「>SPC」は、SPC(Ni SPC=0)に関連付けられた読み取りはなかったが、SOI(Ni SOI>100)に関連付けられた読み取りの数が100に設定されたシーケンス数SSOIの閾値を超えたことを示す。このような条件下では、目的種の濃度CSOIを計算することはできないが、この濃度は対照種の濃度CSPCよりも高いと考えられる。これはステップ63に相当する。
【0085】
最初に、0.01SDに等しい低濃度CSPCを考慮した。CSOI>0.1SDの場合、得られた持続時間は表1と実質的に同じである。したがって、SPCが追加された量は、配列数SSOIの閾値に達するまでの持続時間に影響しない。しかし、SPCの読み取りがないため、SOIの濃度を計算することはできず、エントリ">SPC"はSDに対するこの濃度の比較には十分ではない。濃度CSOI<0.001SDの場合、結果CSOI<SDを返すためには12時間以上の配列決定が必要である。この文脈では、配列決定の合計時間が12時間に制限されている場合、これらのサンプルについて陰性の結果を返すことはできない。
【0086】
【表3】
【0087】
決定閾値に等しい濃度CSPCは、濃度CSPC<0.01SDに対する検出限界を増加させる。しかし、これにより、関心のある種の濃度をより大きな動態(0.01SDから1000SDの間)に従って定量することができる。
【0088】
次に、決定閾値SDの100倍の高濃度CSPCを考慮した。大量のSPCは、非常に迅速に結果を返すことができる。なぜなら、評価された濃度のSOIの範囲内では、配列決定の開始後わずか3分で結果が返されるからである。しかし、濃度CSPC=SDで実施された試験と比較して、検出限界の少なくとも10倍の増加が観察される。これについて考えられる説明は、高濃度のSPCがそれに応じてSOIに関連する読み取りの数が減少することである。したがって、感度が低下する。
【0089】
また、大量のSPCを添加すると、最低濃度の場合よりも広い範囲にわたって定量的な結果を返すことができる。
【0090】
したがって、以下のような様々な分析パラメータを選択することができる。
-サンプルに添加する対照種の濃度CSPC;
-配列数SSOIの閾値;
-SSPCの制御閾値。
【0091】
パラメタリゼーションにより、上述の方法における性能レベルを、配列決定の迅速性、定量ダイナミクス、および必要な感度に関して適合させることができる。
【0092】
例えば、高い検出感度を有する迅速な検出および臨床決定閾値付近で検出されたSOIの定量における精度を必要とする臨床診断の文脈においては、臨床決定閾値CSPC≒SD(例えば、CSPCが0.1SDから10SDの間、あるいは0.01SDから100SDの間)に近い濃度で、配列数SSOIの閾値を5から500の間、制御閾値SSPCを5から125の間でSPCを添加することが有利である。
【0093】
実施例1
最初の実施例では、枯草菌(Bacillus subtilis)を、ヒト患者に対して実施された気管支肺胞洗浄(BAL)から得られた試料のメタゲノム配列決定のための対照種として使用した。この種の試料は、患者に由来する相当量のヒトDNAを含む傾向があることが知られている。38個の試料を配列決定した。配列決定の最長時間は12時間に設定した。各反復は、4000回の読み取りを含んだ。
【0094】
各サンプルの容量は、600μLであった。対照種は、CFUがコロニー形成単位を意味する1.7E4CFU/mLの濃度で添加した。この閾値は、細菌の正常な存在と感染を代表する細菌の存在とを区別する臨床閾値をわずかに上回ると考えられる。
【0095】
患者からDNAを除去するために、分析プロトコルは、最初の溶解の過程で患者からDNAを除去することを含む。最初の溶解において、試料は、患者の細胞を特異的に標的とする溶解剤で処理された。この種の溶解剤は、例えばWO2014/114896に記載されている。次に、放出されたDNAは、酵素作用および洗浄によって除去された。次に、試料は、細菌DNAを抽出するために、2回目の機械的および化学的溶解を受けた。機械的溶解は、直径1mmのガラスビーズおよび直径0.1mmのZr/Siマイクロビーズを使用して、20分間持続する撹拌によって行われた。DNAは、イージーマグ(Biomerieux)プラットフォームを使用して溶解物から抽出された。溶出から生じた体積は25μLであった。DNA抽出物は-20°Cで保存された。
【0096】
配列ライブラリーの調製とDNA断片のバーコード化は、Rapid PCR Barcoding kit(Oxford Nanopore Technologies)を用いて行った。4つの試料を並行して処理した。配列決定は、MinITコンピューター(Oxford Nanopore Technologies)に接続されたMinIONシーケンサー(Oxford Nanopore Technologies)を用いて行った。配列決定データは、EPI2MEスイート(What is in my Pot?)のWIMPソフトウェアによって処理した。このソフトウェアにより、バーコード(各サンプルに識別可能なラベルを割り当てた分子マーカーによるバーコード)を用いて各試料の配列を分離し、各配列読み取りに対応する細菌種、ウイルス種または真菌種を同定し、同定された各種に関連する読み取り数を数えることができる。
【0097】
ステップ40から70までを、一連の4000回の読み取りで繰り返した。対象種および対照種にそれぞれ関連する検出閾値は、100回の読み取りおよび25回の読み取りであった。20の異なる対象種を考慮に入れた:Escherichiacoli、Klebsiellaoxytoca、Klebsiellapneumoniae、Klebsiellaaerogenes、Enterobactercloacae、Serratiamarcescens、Proteusmirabilis、Proteusvulgaris、Hafniaalvei、Citrobacterfreundii、Citrobacterkoseri、Morganellamorganii、Providenciastuartii、Pseudomonasaeruginosa、Stenotrophomonasmaltophilia、Acinetobacterbaumannii、Legionellapneumophila、Haemophilusinfluenzae、StaphylococcusaureusおよびStreptococcuspneumoniae。
【0098】
各対象種の濃度を定量したとき、濃度を5.53GEq/mLのメタゲノム閾値と比較した。これは、BALによって得られた試料中に対象種が病理学的に存在すると結論付けることができる決定閾値である。
【0099】
38の試料を分析した。目的の少なくとも一つの種SOIが検出された場合、シークエンシング時間の中央値はサンプル当たり28.5分であった。これは、目的の少なくとも一つの種について得られる条件Ni SOI≧100に必要なシークエンシング時間に相当する。
【0100】
目的の少なくとも一つの種が検出されなかった場合(Ni SOI<100およびNi SPC≧25)、シークエンシング時間の中央値は2時間13分であったこの条件Ni SPC>SSPCは、シークエンシングが適切に行われたことを保証することを可能にする。これにより、陰性試料が実際に真の陰性であることを保証することができる。
【0101】
上記の方法によるシークエンシングの結果を、12時間の固定期間にわたって実施された同種のシークエンシングと比較した。表4は、得られた主な結果を要約したものである。各技術の性能レベルを、参照技術である微生物培養によって各試料を分析することによって比較した。
【0102】
【表4】
【0103】
感度、特異度、陽性適中率(通常、PPVと表記)、陰性適中率(通常、NPVと表記)は、真陽性、偽陽性、真陰性、偽陰性の数によって決まる。
【0104】
この方法は、12時間シーケンシングで得られたものと同等またはそれ以上の性能レベルを有することが観察された。この方法は、すべての感染を検出することができ、時間延長の中央値は11時間30分以上であった。さらに、対象となる種全体による感染がない場合、SPCの検出は、2時間13分の中央値でこの方法が適切に作動し、陰性検出結果が得られることを確認する。
【0105】
4つの偽陰性が観察されたが、これらの検出失敗は記載された方法に起因するものではない。偽陰性4例中2例はPCRで検出されなかったことから、これらは偽培養陽性または参照技術による菌種同定の誤りであると考えられた。他の2例の偽陰性はS.marcescensに相当し、読み取り数は100未満であり、臨床決定閾値より低い濃度で定量された。これら2例の方法と参照技術の不一致はPCRによって確認された。配列決定時間を12時間に延長しても、S.marcescensによるこれら2例の感染の検出は改善されず、配列決定に使用したWIMPソフトウェアによる誤りが示唆された。
【0106】
この方法は、偽陽性の数を減少させ、特異性と陽性的中率を向上させながら、試験の性能レベルを向上させることができることがわかった。これは、十分な関連情報が利用可能なとき、すなわち、Ni SOI≧SSOIのとき、またはNi SPC>SSPCのとき、配列決定を適切に停止するためである。これらの閾値の一つを越えるとすぐに、反復は停止し、目的の種の濃度(または最小濃度)を定量することができる。最初に設定された反復の最大数まで反復を続けることは、12時間の総持続時間に相当し、有用ではなく、むしろ望ましくないことがわかった。その理由は、目的の種のあまりにも大きな数の配列を得ると、偽陽性が生じる可能性があるからである。
【0107】
実施例2
第二の実施例では、第一の実施例に関連して説明したのと同じプロトコルを使用した。上記のように調製した11のBAL試料を分析した。11試料は事前に細菌培養によって分析され、少なくとも一つの目的の種に対して陽性であることが証明され、その濃度は1E4CFU/mLを超えていた。11試料は、上記の20の目的の種のうち少なくとも一つを同定するように分析された。反復ステップ40から80を実施した。11試料のうち6試料は、30分未満の配列決定で少なくとも一つの目的の種に対して陽性であると考えられた。
【0108】
しかしながら、検出された各目的の種についての100配列の量は、それらのゲノムの詳細な特徴付けを達成するには少なすぎる。反復ステップ100から120を試料に実施し、ゲノム中の可能性のある抗生物質耐性マーカーの存在を同定した。反復ステップ100から120を、12時間の配列決定の合計時間が得られるまで実施した。
【0109】
表5において:
-最初の列(ref)は、各試料の参照に対応する。
-第二列(SOI)は検出された対象の各種に対応する;
-第三列(technique)は検出技術:培養又は発明の実施に対応する;
-第四列(CSOI)は検出された各細菌種の測定又は推定濃度に対応する;
-第五列(dep)は上述の配列決定の深さに対応する;
-第六列(TTRID)は試料中に目的の種が存在することを確認するための、ステップ40から80の「時間:分」の形式による持続時間に対応する。持続時間は3分(試料C1-026)から8時間37(試料C1-060)の間である。6つの試料は30分未満で陽性と判断された。
【0110】
-以下の欄は、21種類の抗生物質についての抗生物質耐性マーカーの存在に対応する。文字Rは、培養によって観察された、またはマーカーの存在によって予測された抗生物質に対する耐性を示し、文字Sは培養によって観察された感受性を示す。抗生物質に対する耐性マーカーの欠如に基づいて、その抗生物質に対する感受性について意見を述べることはできない。これが、本発明の実施に対応する行に文字Sがない理由である。灰色の文字Rは、配列決定によって明らかにされたが、細菌培養によって確認されなかった抗生物質耐性マーカーの存在を示す(灰色の文字S)。したがって、これは配列決定による偽陽性である。黒地に白の文字Rは、細菌培養によって明らかにされたが、配列決定によって検出されなかった抗生物質耐性マーカーの存在を示す。これは配列決定による偽陰性である。9つの偽陰性を数える。
【0111】
9つの偽陰性(黒い背景上の白い文字R)のうち、8つは配列決定の深さが低い、すなわち30未満のサンプルから生じる。したがって、配列決定の深さの閾値に達するまで配列決定を続けることによって、偽陰性の割合を減少させることができると考えられる。この例では、この閾値は30に等しい。
【0112】
本発明の顕著な利点は、反復が進むにつれて、サンプルの構成に関するますます正確な情報を得る可能性にあることが理解される。手元のタスクが目的の種の存在を決定することである場合、本発明は、目的の生物学的種が十分な信頼性で検出されるとすぐに反復を停止することによって、分析の持続時間を最適化することを可能にする。したがって、分析の持続時間は、感度の低下なしに短縮される。
【0113】
【表5】
【0114】
実施例2に示すように、目的の種の検出に続いて、相補的な反復を実行して、検出された各目的の種のゲノムに関するより正確な情報を得ることができる。
【0115】
MinIONシーケンサー(Oxford Nanopore Technologies)によって実行される配列決定を用いて説明されているにもかかわらず、本発明は、配列決定ライブラリー中に存在する、または試料中に直接存在するDNA断片の読み取りおよびリアルタイム分析を可能にする他のタイプのシーケンサーによって実施することができる。
【0116】
配列決定に続くステップが、シーケンサーに接続された処理ユニット、特に、一つ以上のプロセッサまたはマイクロプロセッサに基づくユニットであって、ステップ40から130のすべてをコンピューターによって実行可能な命令の形で記憶するコンピュータメモリを有するユニットによって実施される方法が記載されており、このメモリは、方法の結果および値、パラメータおよび中間結果を記憶するように構成されている。このユニットは、有利には、ユーザの注意のために本発明による方法の結果を表示するためのスクリーンに接続されている。このスクリーンは、結果を受信および表示するために処理ユニットに接続されたモバイルデバイス(スマートフォンなど)のスクリーンを構成することができる。これらのステップは、例えば、シーケンサーに接続されたリモートサーバー上で、または直接に、または実験室のコンピューティングシステムを介して、リモートで実施することができる。これらのステップは、シーケンサーに接続されたモバイルデバイス(スマートフォン、タブレットなど)、例えば、MinION上で実施することもでき、MinIONおよびモバイルデバイスからなるアセンブリは、容易に移動可能である。これらのステップは、異なる処理ユニットによって実施することもできる。例えば、シーケンサーに接続された1つのユニットが、バイオインフォマティクス段階(シグナルの読み取り、ヌクレオチド塩基への翻訳、アセンブリ、品質管理など。)を実施し、第1のユニットに接続された別の処理ユニットが、本方法の残りの部分を実施する。
図1
図2
図3
【国際調査報告】