IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ カリウス・インコーポレイテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2022120165
(43)【公開日】2022-08-17
(54)【発明の名称】合成核酸スパイクイン
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20220809BHJP
   C12Q 1/6888 20180101ALI20220809BHJP
   C12Q 1/6806 20180101ALI20220809BHJP
   C12N 15/10 20060101ALI20220809BHJP
【FI】
C12Q1/6869 Z
C12Q1/6888 Z
C12Q1/6806 Z
C12N15/10
【審査請求】有
【請求項の数】33
【出願形態】OL
(21)【出願番号】P 2022097298
(22)【出願日】2022-06-16
(62)【分割の表示】P 2020128223の分割
【原出願日】2017-03-24
(31)【優先権主張番号】62/397,873
(32)【優先日】2016-09-21
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/451,363
(32)【優先日】2017-01-27
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/313,668
(32)【優先日】2016-03-25
(33)【優先権主張国・地域又は機関】US
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.ANDROID
(71)【出願人】
【識別番号】518335735
【氏名又は名称】カリウス・インコーポレイテッド
(74)【代理人】
【識別番号】100114188
【弁理士】
【氏名又は名称】小野 誠
(74)【代理人】
【識別番号】100119253
【弁理士】
【氏名又は名称】金山 賢教
(74)【代理人】
【識別番号】100124855
【弁理士】
【氏名又は名称】坪倉 道明
(74)【代理人】
【識別番号】100129713
【弁理士】
【氏名又は名称】重森 一輝
(74)【代理人】
【識別番号】100137213
【弁理士】
【氏名又は名称】安藤 健司
(74)【代理人】
【識別番号】100143823
【弁理士】
【氏名又は名称】市川 英彦
(74)【代理人】
【識別番号】100183519
【弁理士】
【氏名又は名称】櫻田 芳恵
(74)【代理人】
【識別番号】100196483
【弁理士】
【氏名又は名称】川嵜 洋祐
(74)【代理人】
【識別番号】100160749
【弁理士】
【氏名又は名称】飯野 陽一
(74)【代理人】
【識別番号】100160255
【弁理士】
【氏名又は名称】市川 祐輔
(74)【代理人】
【識別番号】100146318
【弁理士】
【氏名又は名称】岩瀬 吉和
(74)【代理人】
【識別番号】100127812
【弁理士】
【氏名又は名称】城山 康文
(72)【発明者】
【氏名】クリスチャンズ,フレッド・シー
(72)【発明者】
【氏名】ヴィルファン,イゴール・ディー
(72)【発明者】
【氏名】ケルテース,マイケル
(72)【発明者】
【氏名】ブラウキャンプ,ティモシー・エー
(72)【発明者】
【氏名】ベンカタサブラーマニヤン,シヴクマール
(72)【発明者】
【氏名】ローゼン,マイケル
(72)【発明者】
【氏名】シット,レネ
(57)【要約】      (修正有)
【課題】宿主からのサンプルにおける1以上の非宿主種の相対的存在量を決定するための方法を提供する。既知濃度の合成核酸をサンプルに添加し、配列決定アッセイを行って、病原体のような非宿主種を特定することを含む方法も提供する。サンプルの追跡、試薬の追跡および配列決定アッセイにおける多様性減少の追跡のための方法も提供する。
【解決手段】スパイクイン合成核酸を使用する、次世代シーケンシングアッセイおよび他のアッセイにおける核酸の、改良された特定または定量のための方法および組成物を提供する。幾つかの場合には、スパイクイン合成核酸は特定の配列、長さ、GC含量、縮重度、多様性の度合および/または既知の出発濃度のような特別な特徴を有する。本発明で提供する方法は、血漿のような臨床サンプルにおける病原体核酸の検出に特に有用である。
【選択図】図5
【特許請求の範囲】
【請求項1】
(a)少なくとも1,000個の合成核酸の出発量をサンプルに加え、ここで、前記の
少なくとも1,000個の合成核酸のそれぞれはユニーク可変領域を含み、
(b)該サンプルにおける標的核酸の一部および前記の少なくとも1,000個の合成
核酸の一部に関して配列決定アッセイを行い、それにより、標的および合成核酸配列リー
ドを得、ここで、該合成核酸配列リードはユニーク可変領域配列を含み、
(c)(i)該合成核酸配列リード内の異なる可変領域配列の数を定量して、ユニーク
配列決定値を得、
(ii)前記の少なくとも1,000個の合成核酸の出発量を前記のユニーク配列
決定値と比較して、前記の少なくとも1,000個の合成核酸の多様性減少を得ることに
より、前記の少なくとも1,000個の合成核酸の多様性減少を検出し、
(d)前記の少なくとも1,000個の合成核酸の多様性減少を用いて、初期サンプル
における標的核酸の存在量を計算することを含む、標的核酸を含む初期サンプルにおける
核酸の存在量を決定するための方法。
【請求項2】
標的核酸が病原体核酸を含む、請求項1記載の方法。
【請求項3】
標的核酸が、少なくとも5つの異なる病原体からの病原体核酸を含む、前記請求項のい
ずれか1項記載の方法。
【請求項4】
前記の少なくとも1,000個の合成核酸がDNAを含む、前記請求項のいずれか1項
記載の方法。
【請求項5】
前記の少なくとも1,000個の合成核酸のそれぞれが500塩基対またはヌクレオチ
ド長未満である、前記請求項のいずれか1項記載の方法。
【請求項6】
前記の少なくとも1,000個の合成核酸のそれぞれが200塩基対またはヌクレオチ
ド長未満である、前記請求項のいずれか1項記載の方法。
【請求項7】
サンプルが血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗浄液、尿、便、唾液また
は鼻サンプルである、前記請求項のいずれか1項記載の方法。
【請求項8】
サンプルが、単離された核酸のサンプルである、前記請求項のいずれか1項記載の方法
【請求項9】
サンプルから配列決定ライブラリーを製造することを更に含み、ここで、配列決定ライ
ブラリーを製造する前に前記の少なくとも1,000個の合成核酸をサンプルに加える、
前記請求項のいずれか1項記載の方法。
【請求項10】
前記の少なくとも1,000個の合成核酸の多様性減少がサンプルのサンプル処理中の
1以上の核酸の減少を示す、前記請求項のいずれか1項記載の方法。
【請求項11】
前記の少なくとも1,000個の合成核酸のそれぞれが識別タグ配列を含む、前記請求
項のいずれか1項記載の方法。
【請求項12】
ユニーク可変領域配列の数の定量が、該タグ配列を含有する配列を検出することを含む
、前記請求項のいずれか1項記載の方法。
【請求項13】
サンプルがヒト対象由来である、前記請求項のいずれか1項記載の方法。
【請求項14】
第1配列リード内の少なくとも1,000個のユニーク配列の定量が第1配列リード内
のユニーク配列のリード数を決定することを含む、前記請求項のいずれか1項記載の方法
【請求項15】
前記の少なくとも1,000個のユニーク合成核酸が少なくとも10個のユニーク合
成核酸を含む、前記請求項のいずれか1項記載の方法。
【請求項16】
少なくとも3つの異なる長さを有する追加的合成核酸を加えることを更に含む、前記請
求項のいずれか1項記載の方法。
【請求項17】
第1の長さを有する第1の追加的合成核酸群、第2の長さを有する第2の追加的合成核
酸群、および第3の長さを有する第3の追加的合成核酸群を加えることを更に含み、ここ
で、第1、第2および第3の追加的合成核酸群のそれぞれは、少なくとも3つの異なるG
C含量を有する合成核酸を含む、前記請求項のいずれか1項記載の方法。
【請求項18】
該追加的合成核酸を使用して、サンプルにおける標的核酸の絶対的存在量を計算するこ
とを更に含む、請求項15または16記載の方法。
【請求項19】
該追加的合成核酸を使用して、該追加的合成核酸の長さ、GC含量、または長さおよび
GC含量の両方に基づいてサンプルにおける標的核酸の存在量を計算することを更に含む
、請求項15または16記載の方法。
【請求項20】
第1サンプル処理工程において、前記の少なくとも1,000個の合成核酸をサンプル
に加える、前記請求項のいずれか1項記載の方法。
【請求項21】
第2サンプル処理工程において、少なくとも1,000個のユニーク合成核酸の追加的
プールをサンプルに加えることを更に含み、ここで、第2サンプル処理工程は第1サンプ
ル処理工程とは異なる、請求項20記載の方法。
【請求項22】
少なくとも1,000個の合成核酸の追加的プールに関する多様性減少を計算すること
を含む、請求項20記載の方法。
【請求項23】
前記の少なくとも1,000個の合成核酸に関する多様性減少を少なくとも1,000
個の合成核酸の追加的プールに関する多様性減少と比較することにより、比較的高い多様
性減少を示すサンプル処理工程を特定することを更に含む、請求項20記載の方法。
【請求項24】
少なくとも1,000個のユニーク合成核酸の追加的プールにおけるユニーク合成核酸
のそれぞれが、少なくとも1,000個の合成核酸の追加的プールのメンバーとして該合
成核酸を特定するドメインを含む、請求項20記載の方法。
【請求項25】
サンプル識別核酸をサンプルに加えることを更に含む、前記請求項のいずれか1項記載
の方法。
【請求項26】
(a)が更に、非ユニーク合成核酸をサンプルに加えることを含む、前記請求項のいず
れか1項記載の方法。
【請求項27】
計算される存在量が相対的存在量である、請求項1記載の方法。
【請求項28】
計算される存在量が絶対的存在量である、請求項1記載の方法。
【請求項29】
(a)病原体に感染している又は感染していると疑われる対象からサンプルを得、ここ
で、サンプルは複数の病原体核酸を含み、
(b)サンプルが既知初期存在量の合成核酸を含むように、複数の合成核酸をサンプル
に加え、ここで、
(i)合成核酸は500塩基対長未満であり、
(ii)合成核酸は、第1の長さを有する合成核酸、第2の長さを有する合成核酸
、および第3の長さを有する合成核酸を含み、ここで、第1、第2および第3の長さは異
なり、
(iii)第1の長さを有する合成核酸は、少なくとも3つの異なるGC含量を有
する合成核酸を含み、
(c)前記の複数の合成核酸を含むサンプルに関して配列決定アッセイを行い、それに
より、合成核酸の最終存在量および前記の複数の病原体核酸の最終存在量を決定し、
(d)合成核酸の最終存在量および既知初期存在量を比較して、合成核酸に関する回収
プロファイルを得、
(e)合成核酸に関する回収プロファイルを使用して、病原体核酸を、最も近いGC含
量および長さを有する合成核酸と比較し、それにより、前記の複数の病原体核酸の相対的
存在量または初期存在量を決定することにより、前記の複数の病原体核酸の最終存在量を
正規化することを含む、サンプルにおける病原体核酸の相対的存在量または初期存在量を
決定する方法。
【請求項30】
前記の少なくとも3つの異なるGC含量が、10%~40%である第1のGC含量、4
0%~60%である第2のGC含量、および60%~90%である第3のGC含量を含む
、前記請求項のいずれか1項記載の方法。
【請求項31】
前記の少なくとも3つの異なるGC含量がそれぞれ10%~50%である、前記請求項
のいずれか1項記載の方法。
【請求項32】
合成核酸が200塩基対またはヌクレオチド長未満である、前記請求項のいずれか1項
記載の方法。
【請求項33】
合成核酸が100塩基対またはヌクレオチド長未満である、前記請求項のいずれか1項
記載の方法。
【請求項34】
合成核酸が二本鎖DNAを含む、前記請求項のいずれか1項記載の方法。
【請求項35】
合成核酸を使用して、病原体核酸の変性をモニターすることを更に含む、前記請求項の
いずれか1項記載の方法。
【請求項36】
重み係数を使用することにより、病原体核酸の相対的存在量または初期存在量を正規化
することを更に含む、前記請求項のいずれか1項記載の方法。
【請求項37】
第1合成核酸の既知濃度および第2合成核酸の既知濃度と比較して、前記の複数の合成
核酸の第1合成核酸の生測定値および前記の複数の合成核酸の第2合成核酸の生測定値を
分析することにより、重み付け係数を得る、請求項36記載の方法。
【請求項38】
(a)第1病原体核酸を含む第1サンプルを得、ここで、第1サンプルは、第1病原体
に感染している第1対象から得られ、
(b)第2対象から第2サンプルを得、
(c)第1病原体核酸にハイブリダイズし得ない異なる合成核酸をそれぞれが含む第1
サンプル識別子および第2サンプル識別子を得、第1サンプル識別子を第1サンプルに割
り当て、第2サンプル識別子を第2サンプルに割り当て、
(d)第1サンプル識別子を第1サンプルに、そして第2サンプル識別子を第2サンプ
ルに加え、
(e)第1サンプル識別子を含む第1サンプルに関して、そして第2サンプル識別子を
含む第2サンプルに関して配列決定アッセイを行い、それにより、第1サンプルおよび第
2サンプルに関する配列結果を得、
(f)第1サンプルに関する配列結果における第1サンプル識別子、第2サンプル識別
子および第1病原体核酸の存在または非存在を検出し、
(g)該配列決定アッセイが、第1サンプルにおいて、
(i)第1サンプル識別子を検出し、
(ii)第1病原体核酸を検出し、および
(iii)第2サンプル識別子を検出しない、または閾値レベル未満の第2サンプ
ル識別子を検出しない場合には、検出された第1病原体核酸が第1サンプルに元々存在す
ると決定することを含む、病原体からの核酸を検出するための方法。
【請求項39】
(a)第1核酸を含む第1核酸サンプルを得、
(b)第1陽性対照核酸を含む第1対照核酸サンプルを得、
(c)第1核酸にハイブリダイズし得ない合成核酸を含む第1サンプル識別子を第1対
照核酸に加え、
(d)第1サンプル識別子を含む第1対照核酸サンプルおよび第1核酸サンプルに関し
て配列決定アッセイを行い、それにより、第1および対照核酸サンプルに関する配列リー
ドを得、
(e)第1核酸サンプルに関する配列リードを参照配列とアライメントさせて、第1核
酸サンプルに関する配列リードにおける第1サンプル識別子の存在または非存在を検出し

(f)該配列リードのアライメントに基づいて、第1陽性対照核酸が第1核酸サンプル
に存在するかどうかを決定することを含む、核酸を検出するための方法。
【請求項40】
第1サンプル識別子の合成核酸が150塩基対またはヌクレオチド長未満である、前記
請求項のいずれか1項記載の方法。
【請求項41】
第1陽性対照核酸が病原体核酸である、前記請求項のいずれか1項記載の方法。
【請求項42】
第1サンプル識別子が修飾核酸を含む、前記請求項のいずれか1項記載の方法。
【請求項43】
第1サンプル識別子がDNAを含む、前記請求項のいずれか1項記載の方法。
【請求項44】
サンプルが無細胞体液を含む、前記請求項のいずれか1項記載の方法。
【請求項45】
サンプルが、病原体に感染している対象からのものである、前記請求項のいずれか1項
記載の方法。
【請求項46】
(a)第1合成核酸を試薬に加え、ここで、第1合成核酸はユニーク配列を含み、
(b)第1合成核酸を含む試薬を核酸サンプルに加え、
(c)配列決定アッセイのための核酸サンプルを調製し、
(d)核酸サンプルに関して配列決定アッセイを行い、それにより、核酸サンプルに関
する配列結果を得、
(e)核酸サンプルに関する配列結果に基づいて、該サンプルにおける第1合成核酸の
存在または非存在を決定することにより、該サンプルにおいて試薬を検出することを含む
、サンプルにおいて試薬を検出するための方法。
【請求項47】
第1合成核酸が150塩基対またはヌクレオチド長未満である、前記請求項のいずれか
1項記載の方法。
【請求項48】
第1合成核酸を第1試薬ロットを加え、更に、第2合成核酸を第2試薬ロットに加える
ことを含む、前記請求項のいずれか1項記載の方法。
【請求項49】
サンプルにおいて試薬を検出することが、試薬の特定のロットを検出することを含む、
前記請求項のいずれか1項記載の方法。
【請求項50】
合成核酸がヌクレアーゼにより分解可能でない、前記請求項のいずれか1項記載の方法
【請求項51】
試薬が水性バッファーを含む、前記請求項のいずれか1項記載の方法。
【請求項52】
試薬が抽出試薬、酵素、リガーゼ、ポリメラーゼまたはdNTPを含む、前記請求項の
いずれか1項記載の方法。
【請求項53】
(a)(i)標的核酸、(ii)配列決定アダプター、および(iii)少なくとも1
つの合成核酸を含むサンプルを得、ここで、前記の少なくとも1つの合成核酸はDNAを
含み、核酸への連結に抵抗し、
(b)配列決定アダプターが前記の少なくとも1つの合成核酸よりも優先的に標的核酸
に連結するように、該サンプルに関して連結反応を行うことを含む、配列決定ライブラリ
ーの製造方法。
【請求項54】
(a)標的核酸と少なくとも1つの合成核酸とを含むサンプルを得、
(b)前記の少なくとも1つの合成核酸を該サンプルから除去し、それにより、標的核
酸を含み前記の少なくとも1つの合成核酸を含まない配列決定サンプルを得、
(c)配列決定アダプターを配列決定サンプルにおける標的核酸に結合させることを含
む、配列決定ライブラリーの製造方法。
【請求項55】
(a)標的核酸と少なくとも1つの合成核酸とを含むサンプルを得、
(b)配列決定アダプターを該サンプルにおける標的核酸に結合させ、それにより、配
列決定サンプルを得、
(c)前記の少なくとも1つの合成核酸を、アフィニティに基づく枯渇、RNA誘導性
DNアーゼ消化またはそれらの組合せにより、該配列決定サンプルから除去する(ここで
、該配列決定サンプルからの前記の少なくとも1つの合成核酸の除去は、該配列決定アダ
プターよりも、および該配列決定アダプターの多量体よりも、前記の少なくとも1つの合
成核酸を優先的に除去することを含む)ことを含む、配列決定ライブラリーの製造方法。
【請求項56】
(a)標的核酸と少なくとも1つの合成核酸とを含むサンプルを得、ここで、前記の少
なくとも1つの合成核酸は、
(i)一本鎖DNA、
(ii)該合成核酸の増幅を抑制するヌクレオチド修飾、
(iii)固定化タグ、
(iv)DNA-RNAハイブリッド、
(v)標的核酸の長さより長い長さを有する核酸、または
(vi)それらの任意の組合せを含み、
(b)配列決定反応のためのサンプルから配列決定ライブラリーを製造すること(ここ
で、前記の少なくとも1つの合成核酸の少なくとも一部は該配列決定反応において配列決
定されない)を含む、配列決定ライブラリーの製造方法。
【請求項57】
(a)(i)標的核酸、(ii)配列決定アダプター、および(iii)少なくとも1
つの合成核酸を含むサンプルを得、ここで、前記の少なくとも1つの合成核酸はDNAを
含み、末端修復に抵抗し、
(b)標的核酸が前記の少なくとも1つの合成核酸よりも優先的に末端修復されるよう
に、該サンプルに関して末端修復反応を行うことを含む、配列決定ライブラリーの製造方
法。
【請求項58】
該方法の結果を患者、介護者または他の者に報告することを含む、前記請求項のいずれ
か1項記載の方法。
【請求項59】
(a)配列決定アダプター、および
(b)少なくとも1つの合成核酸(ここで、前記の少なくとも1つの合成核酸はDNA
を含み、核酸に対する末端修復に抵抗する)
を含む、配列決定ライブラリーを製造するためのキット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は合成核酸スパイクイン(spike-in)に関する。
【0002】
相互参照
本出願は2016年3月25日付け出願の米国仮特許出願第62/313,668号、
2016年9月21日付け出願の米国仮特許出願第62/397,873号および201
7年1月27日付け出願の米国仮特許出願第62/451,363号(それらの全体を参
照により本明細書に組み入れることとする)の利益を主張するものである。
【背景技術】
【0003】
次世代シーケンシングは、サンプルの遺伝的内容に関する大量のデータを収集するため
に用いられうる。それは臨床サンプルのような複雑なサンプルにおける核酸の分析および
全ゲノムの配列決定に特に有用でありうる。しかし、核酸、特に低含量の核酸または患者
のサンプルにおける核酸を検出および定量するための、より効率的かつ高精度の方法が当
技術分野で必要とされている。
【発明の概要】
【0004】
概要
スパイクイン合成核酸を使用する、次世代シーケンシングアッセイおよび他のアッセイ
における核酸の、改良された特定または定量のための方法および組成物を、本発明におい
て提供する。幾つかの場合には、スパイクイン合成核酸は特定の配列、長さ、GC含量、
縮重度、多様性の度合および/または既知の出発濃度のような特別な特徴を有する。本発
明で提供する方法は、血漿のような臨床サンプルにおける病原体核酸の検出に特に有用で
あるが、他のタイプの標的を検出するためにも使用されうる。
【0005】
1つの態様においては、標的核酸を含む初期サンプルにおける核酸の存在量を決定する
ための方法を本発明で提供し、該方法は、(a)少なくとも1,000個の合成核酸の出
発量をサンプルに加え(添加し)、ここで、前記の少なくとも1,000個の合成核酸の
それぞれはユニーク(unique;一意)可変領域を含み、(b)該サンプルにおける
標的核酸の一部および前記の少なくとも1,000個の合成核酸の一部に関して配列決定
アッセイを行い、それにより、標的および合成核酸配列リード(read;読取り)を得
、ここで、該合成核酸配列リードはユニーク可変領域配列を含み、(c)(i)該合成核
酸配列リード内の異なる可変領域配列の数を定量して、ユニーク配列決定値を得、(ii
)前記の少なくとも1,000個の合成核酸の出発量を前記のユニーク配列決定値と比較
して、前記の少なくとも1,000個の合成核酸の多様性減少を得ることにより、前記の
少なくとも1,000個の合成核酸の多様性減少を検出し、(d)前記の少なくとも1,
000個の合成核酸の多様性減少を用いて、初期サンプルにおける標的核酸の存在量を計
算することを含む。幾つかの場合には、比較する出発量は出発濃度である。
【0006】
幾つかの実施形態においては、標的核酸は病原体核酸を含む。幾つかの場合には、標的
核酸は、少なくとも5つの異なる病原体からの病原体核酸を含む。幾つかの場合には、標
的核酸は、少なくとも2つの異なる病原体からの病原体核酸を含む。幾つかの場合には、
標的核酸は、少なくとも10種の異なる病原体からの病原体核酸を含む。
【0007】
幾つかの場合には、前記の少なくとも1,000個の合成核酸はDNAを含む。幾つか
の場合には、前記の少なくとも1,000個の合成核酸はRNA、ssRNA、dsDN
A、ssDNAまたはそれらの幾つかの組合せを含む。幾つかの場合には、前記の少なく
とも1,000個の合成核酸のそれぞれは500塩基対またはヌクレオチド長未満である
。幾つかの場合には、前記の少なくとも1,000個の合成核酸のそれぞれは200塩基
対またはヌクレオチド長未満である。幾つかの場合には、前記の少なくとも1,000個
の合成核酸のそれぞれは100塩基対またはヌクレオチド長未満である。幾つかの場合に
おいて、サンプルは血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗浄液、尿、便、唾
液または鼻サンプルである。幾つかの場合には、サンプルはヒト対象由来である。幾つか
の場合には、サンプルは、単離された核酸のサンプルである。
【0008】
幾つかの場合には、該方法は更に、該サンプルから配列決定ライブラリーを製造(作製
)することを含み、ここで、配列決定ライブラリーを製造する前に前記の少なくとも1,
000個の合成核酸をサンプルに加える。幾つかの場合には、前記の少なくとも1,00
0個の合成核酸の多様性減少はサンプルのサンプル処理中の1以上の核酸の減少を示す。
【0009】
幾つかの場合には、前記の少なくとも1,000個の合成核酸のそれぞれは識別タグ配
列を含む。幾つかの場合には、ユニーク可変領域配列の数の定量は、該タグ配列を含有す
る配列を検出することを含む。幾つかの場合には、第1配列リード内の少なくとも1,0
00個のユニーク配列の定量は、第1配列リード内のユニーク配列のリード数(リードカ
ウント)を決定することを含む。幾つかの場合には、少なくとも1,000個のユニーク
合成核酸は少なくとも10個のユニーク合成核酸を含む。
【0010】
幾つかの場合には、該方法は更に、第1の長さを有する第1の追加的合成核酸群、第2
の長さを有する第2の追加的合成核酸群、および第3の長さを有する第3の追加的合成核
酸群を加えることを含み、ここで、第1、第2および第3の追加的合成核酸群のそれぞれ
は、少なくとも3つの異なるGC含量を有する合成核酸を含む。幾つかの場合には、該方
法は更に、該追加的合成核酸を使用して、サンプルにおける標的核酸の絶対的存在量値を
計算することを含む。幾つかの場合には、該方法は更に、該追加的合成核酸を使用して、
該追加的合成核酸の長さ、GC含量または長さおよびGC含量の両方に基づいてサンプル
における標的核酸の絶対的または相対的存在量を計算することを含む。
【0011】
幾つかの場合には、第1サンプル処理工程において、前記の少なくとも1,000個の
合成核酸をサンプルに加える。幾つかの場合には、該方法は更に、第2サンプル処理工程
において、少なくとも1,000個のユニーク合成核酸の追加的プールをサンプルに加え
ることを含み、ここで、第2サンプル処理工程は第1サンプル処理工程とは異なる。幾つ
かの場合には、該方法は更に、少なくとも1,000個の合成核酸の追加的プールに関す
る多様性減少を計算することを含む。幾つかの場合には、該方法は更に、少なくとも1,
000個の合成核酸に関する多様性減少を少なくとも1,000個の合成核酸の追加的プ
ールに関する多様性減少と比較することにより、比較的高い多様性減少を示すサンプル処
理工程を特定することを含む。
【0012】
幾つかの場合には、少なくとも1,000個のユニーク合成核酸の追加的プールにおけ
るユニーク合成核酸のそれぞれは、少なくとも1,000個の合成核酸の追加的プールの
メンバーとして該合成核酸を特定するドメインを含む。幾つかの場合には、該方法は更に
、サンプル識別核酸をサンプルに加えることを含む。幾つかの場合には、前記の(a)は
更に、非ユニーク合成核酸をサンプルに加えることを含む。
【0013】
幾つかの実施形態においては、計算される存在量は相対的存在量である。幾つかの実施
形態においては、計算される存在量は絶対的存在量である。
【0014】
もう1つの態様においては、サンプルにおける病原体核酸の相対的存在量または初期存
在量を決定する方法を本発明で提供し、該方法は、(a)病原体に感染している又は感染
していると疑われる対象からサンプルを得、ここで、該サンプルは複数の病原体核酸を含
み、(b)該サンプルが既知初期存在量の合成核酸を含むように、複数の合成核酸を該サ
ンプルに加え、ここで、(i)該合成核酸は500塩基対長未満であり、(ii)該合成
核酸は、第1の長さを有する合成核酸、第2の長さを有する合成核酸、および第3の長さ
を有する合成核酸を含み、ここで、第1、第2および第3の長さは異なり、(iii)第
1の長さを有する合成核酸は、少なくとも3つの異なるGC含量を有する合成核酸を含み
、(c)前記の複数の合成核酸を含むサンプルに関して配列決定アッセイを行い、それに
より、該合成核酸の最終存在量および前記の複数の病原体核酸の最終存在量を決定し、(
d)合成核酸の最終存在量および既知初期存在量を比較して、該合成核酸に関する回収プ
ロファイルを得、(e)該合成核酸に関する回収プロファイルを使用して、該病原体核酸
を、最も近いGC含量および長さを有する合成核酸と比較し、それにより、前記の複数の
病原体核酸の相対的存在量または初期存在量を決定することにより、前記の複数の病原体
核酸の最終存在量を正規化することを含む。
【0015】
幾つかの場合には、前記の少なくとも3つの異なるGC含量は、10%~40%である
第1のGC含量、40%~60%である第2のGC含量、および60%~90%である第
3のGC含量を含む。幾つかの場合には、前記の少なくとも3つの異なるGC含量はそれ
ぞれ10%~50%である。幾つかの場合には、前記の少なくとも3つの異なるGC含量
はそれぞれ5%~40%である。幾つかの場合には、該合成核酸は200塩基対またはヌ
クレオチド長未満である。幾つかの場合には、該合成核酸は100塩基対またはヌクレオ
チド長未満である。幾つかの場合には、前記の少なくとも3つの異なるGC含量は、少な
くとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、または少なくとも8つ
の異なるGC含量である。幾つかの場合には、該合成核酸は、少なくとも第4の長さ、少
なくとも第5の長さ、少なくとも第6の長さ、少なくとも第7の長さ、少なくとも第9の
長さ、少なくとも第10の長さ、少なくとも第12の長さ、または少なくとも15番目の
長さを有する。幾つかの実施形態においては、各長さは、少なくとも3、4、5、6、7
、8、9、10個の異なるGC含量、または50個以下の異なるGC含量を有する合成核
酸を含む。
【0016】
幾つかの場合には、該合成核酸は二本鎖DNAを含む。幾つかの場合には、該方法は更
に、該合成核酸を使用して、病原体核酸の変性をモニターすることを含む。幾つかの場合
には、該方法は更に、重み係数を使用することにより、病原体核酸の相対的存在量または
初期存在量を正規化することを含む。幾つかの場合には、第1合成核酸の既知濃度および
第2合成核酸の既知濃度と比較して、前記の複数の合成核酸の第1合成核酸の生測定値お
よび前記の複数の合成核酸の第2合成核酸の生測定値を分析することにより、重み付け係
数を得る。
【0017】
もう1つの態様においては、病原体からの核酸を検出するための方法を本発明で提供し
、該方法は、(a)第1病原体核酸を含む第1サンプルを得、ここで、第1サンプルは、
第1病原体に感染している第1対象から得られ、(b)第2対象から第2サンプルを得、
(c)第1病原体核酸にハイブリダイズし得ない異なる合成核酸をそれぞれが含む第1サ
ンプル識別子および第2サンプル識別子を得、第1サンプル識別子を第1サンプルに割り
当て、第2サンプル識別子を第2サンプルに割り当て、(d)第1サンプル識別子を第1
サンプルに、そして第2サンプル識別子を第2サンプルに加え、(e)第1サンプル識別
子を含む第1サンプルに関して、そして第2サンプル識別子を含む第2サンプルに関して
配列決定アッセイを行い、それにより、第1サンプルおよび第2サンプルに関する配列結
果を得、(f)第1サンプルに関する配列結果における第1サンプル識別子、第2サンプ
ル識別子および第1病原体核酸の存在または非存在を検出し、(g)該配列決定アッセイ
が、第1サンプルにおいて、(i)第1サンプル識別子を検出し、(ii)第1病原体核
酸を検出し、および(iii)第2サンプル識別子を検出せず、または閾値レベル未満の
第2サンプル識別子を検出しない場合には、検出された第1病原体核酸が第1サンプルに
元々存在すると決定することを含む。
【0018】
もう1つの態様においては、核酸を検出するための方法を本発明で提供し、該方法は、
(a)第1核酸を含む第1核酸サンプルを得、(b)第1陽性対照核酸を含む第1対照核
酸サンプルを得、(c)第1核酸にハイブリダイズし得ない合成核酸を含む第1サンプル
識別子を第1対照核酸に加え、(d)第1サンプル識別子を含む第1対照核酸サンプルお
よび第1核酸サンプルに関して配列決定アッセイを行い、それにより、第1および対照核
酸サンプルの配列リードを得、(e)第1核酸サンプルに関する配列リードを参照配列と
アライメント(整列)させて、第1核酸サンプルに関する配列リードにおける第1サンプ
ル識別子の存在または非存在を検出し、(f)該配列リードのアライメントに基づいて、
第1陽性対照核酸が第1核酸サンプルに存在するかどうかを決定することを含む。
【0019】
幾つかの場合には、第1サンプル識別子の合成核酸は150塩基対またはヌクレオチド
長未満である。幾つかの場合には、第1陽性対照核酸は病原体核酸である。幾つかの場合
には、第1サンプル識別子は修飾核酸を含む。幾つかの場合には、第1サンプル識別子は
DNAを含む。幾つかの場合には、サンプルは無細胞体液を含む。幾つかの場合には、サ
ンプルは、病原体に感染している対象からのものである。
【0020】
もう1つの態様においては、サンプルにおいて試薬を検出するための方法を本発明で提
供し、該方法は、(a)第1合成核酸を試薬に加え、ここで、第1合成核酸はユニーク配
列を含み、(b)第1合成核酸を含む試薬を核酸サンプルに加え、(c)配列決定アッセ
イのための核酸サンプルを調製し、(d)核酸サンプルに関して配列決定アッセイを行い
、それにより、核酸サンプルに関する配列結果を得、(e)核酸サンプルに関する配列結
果に基づいて、該サンプルにおける第1合成核酸の存在または非存在を決定することによ
り、該サンプルにおいて試薬を検出することを含む。
【0021】
幾つかの場合には、第1合成核酸は150塩基対またはヌクレオチド長未満である。幾
つかの場合には、第1合成核酸を第1試薬ロットを加え、更に、第2合成核酸を第2試薬
ロットに加えることを含む。幾つかの場合には、サンプルにおいて試薬を検出することは
、試薬の特定のロットを検出することを含む。幾つかの場合には、該合成核酸はヌクレア
ーゼにより分解可能でない。幾つかの場合には、試薬は水性バッファーを含む。幾つかの
場合には、試薬は抽出試薬、酵素、リガーゼ、ポリメラーゼまたはdNTPを含む。
【0022】
もう1つの態様においては、配列決定ライブラリーの製造(作製)方法を本発明で提供
し、該方法は、(a)(i)標的核酸、(ii)配列決定アダプター、および(iii)
少なくとも1つの合成核酸を含むサンプルを得、ここで、前記の少なくとも1つの合成核
酸はDNAを含み、核酸への連結に抵抗し、(b)該配列決定アダプターが前記の少なく
とも1つの合成核酸よりも優先的に標的核酸に連結するように、該サンプルに関して連結
反応を行うことを含む。
【0023】
もう1つの態様においては、配列決定ライブラリーの製造方法を本発明で提供し、該方
法は、(a)標的核酸と少なくとも1つの合成核酸とを含むサンプルを得、(b)前記の
少なくとも1つの合成核酸を該サンプルから除去し、それにより、該標的核酸を含み前記
の少なくとも1つの合成核酸を含まない配列決定サンプルを得、(c)配列決定アダプタ
ーを配列決定サンプルにおける標的核酸に結合させることを含む。
【0024】
もう1つの態様においては、配列決定ライブラリーの製造方法を本発明で提供し、該方
法は、(a)標的核酸と少なくとも1つの合成核酸とを含むサンプルを得、ここで、前記
の少なくとも1つの合成核酸は、(i)一本鎖DNA、(ii)該合成核酸の増幅を抑制
するヌクレオチド修飾、(iii)固定化タグ、(iv)DNA-RNAハイブリッド、
(v)標的核酸の長さより長い長さを有する核酸、または(vi)それらの任意の組合せ
を含み、(b)配列決定反応のためのサンプルから配列決定ライブラリーを製造すること
(ここで、前記の少なくとも1つの合成核酸の少なくとも一部は該配列決定反応において
配列決定されない)を含む。
【0025】
もう1つの態様においては、配列決定ライブラリーの製造方法を本発明で提供し、該方
法は、(a)(i)標的核酸、(ii)配列決定アダプター、および(iii)少なくと
も1つの合成核酸を含むサンプルを得、ここで、前記の少なくとも1つの合成核酸はDN
Aを含み、末端修復に抵抗し、(b)標的核酸が前記の少なくとも1つの合成核酸よりも
優先的に末端修復されるように、該サンプルに関して末端修復反応を行うことを含む。
【0026】
もう1つの態様においては、配列決定ライブラリーを製造するためのキットを本発明で
提供し、該キットは、(a)配列決定アダプター、および(b)少なくとも1つの合成核
酸を含み、ここで、前記の少なくとも1つの合成核酸はDNAを含み、核酸に対する末端
修復に抵抗する。
【0027】
1つの態様においては、標的核酸を含む初期サンプルにおける核酸の絶対的または相対
的存在量を決定するための方法を本発明で提供し、該方法は、(a)少なくとも1,00
0個のユニーク合成核酸の出発量をサンプルに加え、ここで、前記の少なくとも1,00
0個のユニーク合成核酸のそれぞれは、(i)識別タグ、および(ii)可変領域を含み
、(b)該サンプルにおける標的核酸の一部および前記の少なくとも1,000個のユニ
ーク合成核酸の一部に関して配列決定アッセイを行い、それにより、標的および合成核酸
配列リードを得、ここで、該合成核酸配列リードは識別タグ配列および可変領域配列を含
み、(c)(i)該識別タグ配列の少なくとも一部に対応する配列リードを検出して、第
1配列リードのセットを得、(ii)第1配列リード内の異なる可変領域配列の数を定量
して、ユニーク配列決定値を得、(iii)前記の少なくとも1,000個のユニーク合
成核酸の出発量を該ユニーク配列決定値と比較して、前記の少なくとも1,000個のユ
ニーク合成核酸の多様性減少を得ることにより、前記の少なくとも1,000個のユニー
ク合成核酸の多様性減少を検出し、(d)前記の少なくとも1,000個のユニーク合成
核酸の多様性減少を用いて、初期サンプルにおける標的核酸の絶対的または相対的存在量
値を計算することを含む。幾つかの場合には、比較する出発量は出発濃度である。
【0028】
幾つかの場合には、標的核酸は病原体核酸を含む。幾つかの場合には、標的核酸は、少
なくとも5つの異なる病原体からの病原体核酸を含む。幾つかの場合には、前記の少なく
とも1,000個のユニーク合成核酸はDNAを含む。
【0029】
幾つかの場合には、前記の少なくとも1,000個のユニーク合成核酸のそれぞれは5
00塩基対またはヌクレオチド長未満である。幾つかの場合には、前記の少なくとも1,
000個のユニーク合成核酸のそれぞれは200塩基対またはヌクレオチド長未満である
。幾つかの場合には、前記の少なくとも1,000個のユニーク合成核酸のそれぞれは1
00塩基対またはヌクレオチド長未満である。
【0030】
幾つかの場合において、サンプルは血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗
浄液、尿、便、唾液または鼻サンプルである。幾つかの場合には、サンプルは、単離され
た核酸のサンプルである。幾つかの場合には、サンプルはヒト対象由来である。
【0031】
幾つかの場合には、該方法は更に、該サンプルから配列決定ライブラリーを製造するこ
とを含み、ここで、配列決定ライブラリーを製造する前に前記の少なくとも1,000個
のユニーク合成核酸をサンプルに加える。幾つかの場合には、前記の少なくとも1,00
0個のユニーク合成核酸の多様性減少はサンプルのサンプル処理中の1以上の核酸の減少
を示す。幾つかの場合には、該識別タグは共通配列を含む。幾つかの場合には、第1配列
リード内の少なくとも1,000個のユニーク配列の定量は、第1配列リード内のユニー
ク配列のリード数を決定することを含む。
【0032】
幾つかの場合には、前記の少なくとも1,000個のユニーク合成核酸は少なくとも1
個のユニーク合成核酸を含む。幾つかの場合には、前記の少なくとも1,000個の
ユニーク合成核酸は少なくとも10個のユニーク合成核酸を含む。幾つかの場合には、
該方法は更に、少なくとも3つの異なる長さを有する追加的合成核酸を加えることを含む
【0033】
幾つかの場合には、該方法は更に、第1の長さを有する第1の追加的合成核酸群、第2
の長さを有する第2の追加的合成核酸群、および第3の長さを有する第3の追加的合成核
酸群を加えることを含み、ここで、第1、第2および第3の追加的合成核酸群のそれぞれ
は、少なくとも3つの異なるGC含量を有する合成核酸を含む。幾つかの場合には、該方
法は更に、該追加的合成核酸を使用して、サンプルにおける標的核酸の絶対的または相対
的存在量値を計算することを含む。幾つかの場合には、該方法は更に、該追加的合成核酸
を使用して、該追加的合成核酸の長さ、GC含量または長さおよびGC含量の両方に基づ
いてサンプルにおける標的核酸の絶対的または相対的存在量を計算することを含む。
【0034】
幾つかの場合には、第1サンプル処理工程において、前記の少なくとも1,000個の
ユニーク合成核酸をサンプルに加える。幾つかの場合には、該方法は更に、第2サンプル
処理工程において、少なくとも1,000個のユニーク合成核酸の追加的プールをサンプ
ルに加えることを含み、ここで、第2サンプル処理工程は第1サンプル処理工程とは異な
る。幾つかの場合には、該方法は更に、少なくとも1,000個のユニーク合成核酸の追
加的プールに関する多様性減少を計算することを含む。幾つかの場合には、該方法は更に
、前記の少なくとも1,000個のユニーク合成核酸に関する多様性減少を少なくとも1
,000個のユニーク合成核酸の追加的プールに関する多様性減少と比較することにより
、比較的高い多様性減少を示すサンプル処理工程を特定することを含む。
【0035】
幾つかの場合には、少なくとも1,000個のユニーク合成核酸の追加的プールにおけ
るユニーク合成核酸のそれぞれは、少なくとも1,000個の合成核酸の追加的プールの
メンバーとして該合成核酸を特定するドメインを含む。幾つかの場合には、該方法は更に
、サンプル識別核酸をサンプルに加えることを含む。幾つかの場合には、前記の(a)は
更に、非ユニーク合成核酸をサンプルに加えることを含む。幾つかの場合には、参照配列
とアライメント(整列)させることにより、可変配列リードを検出する。幾つかの場合に
は、可変配列リードを互いにアライメントさせ、重複配列リードを除外することにより、
異なる可変配列リードの数を定量する。
【0036】
核酸のサンプルにおける病原体核酸の相対的存在量または濃度を決定する方法を本発明
で提供する。幾つかの場合には、該方法は、病原体に感染している又は感染していると疑
われる対象からサンプルを得(ここで、該サンプルは2以上の病原体核酸を含み、ここで
、前記の2以上の病原体核酸は、異なる長さを有する第1病原体核酸および第2病原体核
酸を含む)、既知濃度の2以上の合成核酸をサンプルに加え(ここで、前記の2以上の合
成核酸は、第1病原体核酸の65%~135%、75%~125%、または85%~11
5%の長さを有する第1合成核酸、および第2病原体核酸の65%~135%、75%~
125%、または85%~115%の長さを有する第2合成核酸を含み、ここで、前記の
2以上の合成核酸は第1または第2病原体核酸にハイブリダイズしない)、サンプルに関
して配列決定アッセイを行い、それにより、前記の2以上の合成核酸、第1病原体核酸お
よび第2病原体核酸に関する生測定値を得、第1合成核酸の生測定値を第1合成核酸の既
知濃度と比較して、第1合成核酸に関する回収プロファイルを得、第1合成核酸に関する
回収プロファイルを使用して、第1病原体核酸に関する生測定値を正規化し、それにより
、第1病原体核酸の相対的存在量または出発濃度を決定することを含みうる。
【0037】
幾つかの場合において、第1病原体核酸および第2の病原体核酸は、同じ病原体に由来
する。幾つかの場合には、第1病原体核酸および第2の病原体核酸は、異なる病原体に由
来する。幾つかの場合には、本明細書に記載されている方法は更に、重み係数を使用する
ことにより、第1病原体核酸の相対的存在量または出発濃度濃度を正規化することを含む
。幾つかの場合には、第1合成核酸の既知濃度および第2合成核酸の既知濃度と比較して
、前記の複数の合成核酸の第1合成核酸の生測定値および前記の複数の合成核酸の第2合
成核酸の生測定値を分析することにより、重み付け係数を得る。
【0038】
核酸のサンプルにおける核酸の相対的存在量または出発濃度を決定する方法を本発明で
提供し、該方法は、(a)対象から核酸サンプルを得(ここで、該核酸サンプルは、異な
る長さを有する第1核酸および第2核酸を含む)、既知濃度の2以上の合成核酸をサンプ
ルに加え(ここで、(i)前記の2以上の合成核酸は、第1核酸の65%~135%、7
5%~125%、または85%~115%の長さを有する第1合成核酸、および第2核酸
の長さの65%~135%、75%~125%、または85%~115%の長さを有する
第2合成核酸を含み、(ii)第1合成核酸は特定の長さのロード(load)ドメイン
と、ロードドメインの特定の長さを識別するようにコードされたユニーク配列を有する識
別ドメインとを含み、(iii)前記の2以上の合成核酸は第1または第2核酸にハイブ
リダイズし得ない)、(b)サンプルに関して配列決定アッセイを行い、それにより、前
記の2以上の合成核酸、第1核酸および第2核酸に関する生測定値を得、(c)第1合成
核酸の生測定値を第1合成核酸の既知濃度と比較して、回収プロファイルを得、(d)該
回収プロファイルを使用して、第1核酸に関する生測定値を正規化し、それにより、第1
核酸の相対的存在量または出発濃度を決定することを含む。
【0039】
幾つかの場合には、第1核酸は病原体核酸である。幾つかの場合には、前記の2以上の
合成核酸の既知濃度は2以上、3以上、5以上、10以上、50以上、100以上、また
は1,000以上の異なる濃度を含む。幾つかの場合には、前記の2以上の合成核酸の既
知濃度は等モル濃度である。幾つかの場合には、前記の2以上の合成核酸はDNAまたは
修飾DNAを含む。幾つかの場合には、前記の2以上の合成核酸はRNAまたは修飾RN
Aを含む。幾つかの場合には、前記の2以上の合成核酸は、2以上、3以上、5以上、8
以上、10以上、50以上、100以上、または1,000以上の異なる長さの核酸を含
む。幾つかの場合には、前記の2以上の合成核酸は、2以上、3以上、5以上、8以上、
10以上、50以上、100以上、または1,000以上の異なる配列の核酸を含む。幾
つかの場合には、前記の2以上の合成核酸は50ヌクレオチド長以下、100ヌクレオチ
ド長以下、200ヌクレオチド長以下、300ヌクレオチド長以下、350ヌクレオチド
長以下、400ヌクレオチド長以下、450ヌクレオチド長以下、500ヌクレオチド長
以下、750ヌクレオチド長以下、または1,000ヌクレオチド長以下である。幾つか
の場合には、前記の2以上の合成核酸は少なくとも10ヌクレオチド長、少なくとも20
ヌクレオチド長、または少なくとも30ヌクレオチド長、少なくとも50ヌクレオチド長
、少なくとも100ヌクレオチド長、または少なくとも150ヌクレオチド長である。幾
つかの場合には、前記の2以上の合成核酸は、前記の2以上の合成核酸を合成物として特
定する核酸配列を含む。幾つかの場合には、前記の2以上の合成核酸を合成物として特定
する核酸配列は10ヌクレオチド長以下、20ヌクレオチド長以下、30ヌクレオチド長
以下、40ヌクレオチド長以下、50ヌクレオチド長以下、100ヌクレオチド長以下、
200ヌクレオチド長以下、または500ヌクレオチド長以下である。幾つかの場合には
、前記の2以上の合成核酸は、該合成核酸の長さを特定する核酸配列を含む。幾つかの場
合には、該合成核酸の長さを特定する核酸配列は10ヌクレオチド長以下、20ヌクレオ
チド長以下、30ヌクレオチド長以下、40ヌクレオチド長以下、50ヌクレオチド長以
下、100ヌクレオチド長以下、200ヌクレオチド長以下、または500ヌクレオチド
長以下である。
【0040】
幾つかの場合において、サンプルは、血液、血漿、血清、脳脊髄液、滑液、気管支肺胞
洗浄液、尿、便、唾液、鼻スワブおよびそれらの任意の組合せからなる群から選択される
。幾つかの場合には、サンプルは無細胞核酸を含む。幾つかの場合には、サンプルは循環
無細胞核酸を含む。幾つかの場合には、対象はヒトである。幾つかの場合には、病原体は
細菌、ウイルス、真菌または寄生生物である。幾つかの場合には、対象は敗血症を有する
又は有すると疑われる。幾つかの場合には、病原体は敗血症に関連している。幾つかの場
合には、前記の2以上の病原体核酸は3以上、5以上、10以上、50以上、100以上
、1,000以上、2,000以上、5,000以上、8,000以上、10,000以
上、15,000以上、または20,000以上の病原体核酸配列を含む。
【0041】
幾つかの場合には、第1病原体核酸の相対的存在量の決定は、1以上のゲノムコピーを
生成させることを含む。幾つかの場合には、1以上のゲノムコピーの生成は体積当たりの
ゲノムコピーとして表される。幾つかの場合には、本明細書に記載されている方法は更に
、サンプルから核酸を抽出することを含む。幾つかの場合には、サンプルからの核酸の抽
出は、磁気ビーズを使用して行う。幾つかの場合には、本明細書に記載されている方法は
更に、低品質の配列決定リードを除去することを含む。幾つかの場合には、本明細書に記
載されている方法は更に、対象の種の参照配列に対してアライメント(整列)またはマッ
ピングされた配列決定リードを除去することを含む。幾つかの場合には、本明細書に記載
されている方法は更に、1以上の異なる長さの核酸を回収する相対的効率を決定すること
を含む。幾つかの場合には、本明細書に記載されている方法は更に、1以上の合成核酸の
測定濃度を決定することを含む。幾つかの場合には、本明細書に記載されている方法は、
前記の1以上の合成核酸の測定濃度を既知濃度と比較することを含む。幾つかの場合には
、本明細書に記載されている方法は更に、配列決定アッセイにおいて、1以上、2以上、
3以上、5以上、10以上、50以上、100以上、1,000以上、2,000以上、
5,000以上、8,000以上、10,000以上、15,000以上、または20,
000以上の病原体核酸を検出することを含む。幾つかの場合には、本明細書に記載され
ている方法は更に、配列決定アッセイにおいて、抗微生物、抗細菌、抗ウイルスまたは抗
真菌耐性を示す1以上、2以上、3以上、5以上、10以上、50以上、100以上、1
,000以上、2,000以上、5,000以上、8,000以上、10,000以上、
15,000以上、または20,000以上の病原体核酸を検出することを含む。幾つか
の場合には、本明細書に記載されている方法は更に、サンプルにおける2以上、3以上、
5以上、10以上、50以上、100以上の病原体の同時存在を特定することを含む。
【0042】
幾つかの場合には、サンプルからの核酸の抽出の前または途中に、前記の2以上の合成
核酸をサンプルに加える。幾つかの場合には、サンプルからの核酸の抽出の後および核酸
のライブラリー調製の前に、前記の2以上の合成核酸をサンプルに加える。幾つかの場合
には、前記の2以上の合成核酸の長さは少なくとも約20塩基対異なる。幾つかの場合に
は、前記の2以上の合成核酸は3以上、5以上、8以上、10以上、20以上または50
以上の合成核酸を含む。幾つかの場合には、前記の2以上の合成核酸は、配列番号111
~配列番号118およびそれらの任意の組合せからなる群から選択される。幾つかの場合
には、前記の2以上の合成核酸は共通のフォワード配列を共有する。幾つかの場合には、
前記の共通のフォワード配列は約20塩基対長以下である。幾つかの場合には、前記の2
以上の合成核酸は共通のリバース配列を共有する。幾つかの場合には、前記の共通のリバ
ース配列は約20塩基対長以下である。
【0043】
幾つかの場合には、本明細書に記載されている方法は更に、第2合成核酸の生測定値を
第2合成核酸の既知濃度と比較して、第2合成核酸に関する回収プロファイルを得、第2
合成核酸に関する回収プロファイルを使用して、第2病原体核酸に関する生測定値を正規
化し、それにより、第2病原体核酸の相対的存在量または出発濃度を決定することを含む
【0044】
幾つかの場合には、前記の2以上の病原体核酸は、異なる長さを有する5以上の病原体
核酸を含み、前記の2以上の合成核酸は、前記の5以上の病原体核酸のそれぞれの長さの
65%~135%、75%~125%、または85%~115%の長さを有する1以上の
合成核酸を含み、前記の2以上の核酸は前記の5以上の病原体核酸にハイブリダイズせず
、サンプルに関して配列決定アッセイを行うことにより、前記の2以上の合成核酸および
前記の5以上の病原体核酸に関する生測定値を得、該生測定値の比較は、該生測定値を各
合成核酸の既知濃度と比較して、各合成核酸に関する回収プロファイルを得ることを含み
、および/または該回収プロファイルの使用は、各合成核酸に関する回収プロファイルを
使用して、前記の5以上の病原体核酸のそれぞれの生測定値を正規化し、それにより、前
記の5以上の病原体核酸のそれぞれの相対的存在量または出発濃度を決定することを含む
。幾つかの場合には、前記の5以上の病原体核酸は、10以上、50以上、100以上、
1,000以上、2,000以上、5,000以上、8,000以上、10,000以上
、15,000以上、または20,000以上の病原体核酸を含む。幾つかの場合には、
本明細書に記載されている方法は更に、前記の2以上の合成核酸および核酸のサンプルに
おける核酸を抽出または精製することを含む。幾つかの場合には、前記の2以上の合成核
酸および核酸のサンプルにおける核酸の抽出または精製は、前記の2以上の合成核酸およ
び核酸のサンプルにおける核酸の相対的濃度を変化させる。幾つかの場合には、該生測定
値はリード数である。
【0045】
病原体からの核酸を検出するための方法を本発明で提供し、該方法は、(a)第1病原
体核酸を含む第1核酸サンプルを得、ここで、第1病原体に感染している又は第1病原体
に感染していると疑われる第1対象から第1核酸サンプルを得、(b)第2病原体核酸を
含む第2核酸サンプルを得、ここで、第2病原体に感染している又は第2病原体に感染し
ていると疑われる第2対象から第2核酸サンプルを得、(c)病原体核酸にハイブリダイ
ズし得ない異なる合成核酸をそれぞれが含む第1サンプル識別子および第2サンプル識別
子を得、第1サンプル識別子を第1核酸サンプルに、そして第2サンプル識別子を第2核
酸サンプルに割り当て、(d)第1サンプル識別子を第1核酸サンプルに、そして第2サ
ンプル識別子を第2核酸サンプルに加え、(e)第1サンプル識別子を含む第1核酸サン
プルに関して、および第2サンプル識別子を含む第2核酸サンプルに関して配列決定アッ
セイを行い、それにより、第1サンプルおよび第2サンプルに関する配列結果を得、(f
)該配列結果における第1サンプル識別子、第2サンプル識別子および病原体核酸の存在
または非存在を検出し、(g)該配列決定アッセイが第1サンプル識別子および標的核酸
を検出するが、第2サンプル識別子を検出しない場合には、第1サンプル中に標的核酸が
元々存在すると決定することを含む。
【0046】
幾つかの場合には、該合成核酸は約500塩基対長以下である。幾つかの場合には、該
合成核酸は約100塩基対長以下である。幾つかの場合には、該合成核酸は少なくとも約
50塩基対長である。幾つかの場合には、該合成核酸は少なくとも約100塩基対長であ
る。幾つかの場合には、該合成核酸はDNAまたは修飾DNAを含む。幾つかの場合には
、該合成核酸はRNAまたは修飾RNAを含む。幾つかの場合には、該合成核酸は修飾核
酸である。幾つかの場合には、該合成核酸は、配列番号1~配列番号110およびそれら
の任意の組合せからなる群から選択される配列を含む。幾つかの場合には、第1サンプル
は無細胞体液を含む。
【0047】
サンプルにおいて試薬を検出するための方法を本発明で提供し、該方法は、第1合成核
酸を試薬に加え(ここで、第1合成核酸はユニーク配列を含む)、第1合成核酸を含む試
薬を核酸サンプルに加え、配列決定アッセイのための核酸サンプルを調製し、核酸サンプ
ルに関して配列決定アッセイを行い、それにより、核酸サンプルに関する配列結果を得、
核酸サンプルに関する配列結果に基づいて、該サンプルにおける第1合成核酸の存在また
は非存在を決定することにより、該サンプルにおいて試薬を検出することを含む。
【0048】
幾つかの場合には、工程aにおいて第1合成核酸を試薬に加えることは、試薬の特定の
ロットに第1合成核酸を加えることを含む。幾つかの場合には、本明細書に記載されてい
る方法は更に、核酸サンプルに関する配列結果に基づいて、試薬の特定のロットを検出す
ることを含む。幾つかの場合には、第1合成核酸は病原体からの核酸にハイブリダイズし
ない。幾つかの場合には、本明細書に記載されている方法は更に、試薬の異なるロットに
第2合成核酸を加えることを含み、ここで、第2合成核酸は、試薬の異なるロットをユニ
ーク(一意)に特定する。幾つかの場合には、本明細書に記載されている方法は更に、核
酸サンプルの配列決定アッセイからの結果に基づいて標的核酸を検出することを含む。幾
つかの場合には、本明細書に記載されている方法は更に、(i)標的核酸が正確に検出さ
れる場合には、将来の配列決定アッセイにおいて、試薬の特定のロットを使用し、または
(ii)標的核酸が正確に検出されない場合には、将来の配列決定アッセイにおいて、試
薬の特定のロットを使用することを控えることを含む。幾つかの場合には、該試薬は水溶
液を含む。幾つかの場合には、該合成核酸は約50~約500塩基対長である。幾つかの
場合には、該合成核酸はDNAまたは修飾DNAを含む。幾つかの場合には、該合成核酸
はRNAまたは修飾RNAを含む。幾つかの場合には、該合成核酸は、配列番号1~配列
番号110およびそれらの任意の組合せからなる群から選択される配列を含む。幾つかの
場合には、該合成核酸はDNアーゼにより分解され得ない。
【0049】
サンプルにおける核酸の多様性減少または存在量を決定するための方法を本発明で提供
し、該方法は、標的核酸を含むサンプルに既知濃度の1,000個のユニーク合成核酸を
加え、サンプルに関して配列決定アッセイを行い、それにより、標的核酸の配列リード数
、および前記の1,000個のユニーク合成核酸の少なくとも一部の配列リード数を得、
前記の1,000個のユニーク合成核酸の少なくとも一部の配列リード数を、工程aにお
いて標的核酸を含むサンプルに加えられた1,000個のユニーク核酸の配列とアライメ
ント(整列)させ、アライメント配列リード数の多様性を前記の1,000個以上のユニ
ーク合成核酸の多様性と比較することにより、前記の1,000個のユニーク合成核酸の
多様性減少を検出し、前記の1,000個のユニーク合成核酸の多様性減少を使用して、
該サンプルにおける標的核酸における多様性減少または該標的核酸の存在量を計算するこ
とを含む。
【0050】
幾つかの場合には、前記の1,000個のユニーク合成核酸は約500塩基対長以下ま
たは約100塩基対長以下である。幾つかの場合には、前記の1,000個のユニーク合
成核酸を等モル濃度で加える。幾つかの場合には、前記の1,000個のユニーク合成核
酸は少なくとも約1×10の多様性を有する。幾つかの場合には、前記の1,000個
のユニーク合成核酸は少なくとも約1×10の多様性を有する。幾つかの場合には、前
記の1,000個のユニーク合成核酸は少なくとも約1×10の多様性を有する。幾つ
かの場合には、前記の1,000個のユニーク合成核酸は少なくとも約1×10の多様
性を有する。幾つかの場合には、前記の1,000個のユニーク合成核酸はランダム化部
分を有する。幾つかの場合には、前記の1,000個のユニーク合成核酸はDNA、修飾
DNA、RNAまたは修飾RNAを含む。幾つかの場合には、前記の1,000個のユニ
ーク合成核酸は、配列番号119および配列番号120において特定されている配列を含
む。幾つかの場合には、第1サンプル処理工程において、前記の1,000個のユニーク
合成核酸をサンプルに加える。幾つかの場合には、該方法は更に、第2サンプル処理工程
において、1,000個のユニーク合成核酸の追加的プールをサンプルに加えることを含
み、ここで、第2サンプル処理工程は第1サンプル処理工程とは異なる。幾つかの場合に
は、1,000個のユニーク合成核酸の追加的プールに関する多様性減少を計算する。幾
つかの場合には、本明細書に記載されている方法は、前記の1,000個のユニーク合成
核酸に関する多様性減少を1,000個のユニーク合成核酸の追加的プールに関する多様
性減少と比較することにより、比較的高い多様性減少を示すサンプル処理工程を特定する
ことを含む。幾つかの場合には、前記の1,000個のユニーク合成核酸は、前記の1,
000個のユニーク合成核酸のプールのメンバーとして該合成核酸を特定するドメインを
含む。幾つかの場合には、1,000個のユニーク合成核酸の追加的プールは、1,00
0個のユニーク合成核酸の追加的プールのメンバーとして該合成核酸を特定するドメイン
を含む。幾つかの場合には、前記の1,000個のユニーク合成核酸を標的核酸の抽出の
前にサンプルに加える。幾つかの場合には、前記の1,000個のユニーク合成核酸を標
的核酸のライブラリー調製の前にサンプルに加える。幾つかの場合には、本明細書に記載
されている方法は更に、標的核酸を含むサンプルに既知濃度の5,000個のユニーク合
成核酸を加えることを含む。
【0051】
更に、分子を分析するための方法および組成物を本明細書において開示する。1つの態
様においては、配列決定ライブラリーの製造方法を本明細書において開示し、該方法は、
a)(i)標的核酸、(ii)配列決定アダプター、および(iii)少なくとも1つの
合成核酸を含むサンプルを得、ここで、前記の少なくとも1つの合成核酸はDNAを含み
、核酸への連結に抵抗し、b)該配列決定アダプターが前記の少なくとも1つの合成核酸
よりも優先的に標的核酸に連結するように、該サンプルに関して連結反応を行うことを含
む。
【0052】
幾つかの場合には、前記の少なくとも1つの合成核酸はホスホジエステル結合を介した
該核酸への連結に抵抗する。幾つかの場合には、前記の少なくとも1つの合成核酸は該配
列決定アダプターへの連結に抵抗する。もう1つの態様においては、配列決定ライブラリ
ーの製造方法を本明細書において開示し、該方法は、a)標的核酸と少なくとも1つの合
成核酸とを含むサンプルを得、b)前記の少なくとも1つの合成核酸を該サンプルから除
去し、それにより、該標的核酸を含み前記の少なくとも1つの合成核酸を含まない配列決
定サンプルを得、c)配列決定アダプターを配列決定サンプルにおける標的核酸に結合さ
せることを含む。幾つかの場合には、前記の少なくとも1つの合成核酸の除去はエンドヌ
クレアーゼ消化によっては実施されない。幾つかの場合には、サンプルから除去された前
記の少なくとも1つの合成核酸は別の合成核酸に結合していない。幾つかの場合には、前
記の少なくとも1つの合成核酸は末端修復に抵抗する。
【0053】
もう1つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示
し、該方法は、a)標的核酸と少なくとも1つの合成核酸とを含むサンプルを得、b)配
列決定アダプターを該サンプルにおける標的核酸に結合させ、それにより、配列決定サン
プルを得、c)前記の少なくとも1つの合成核酸を、アフィニティに基づく枯渇(除去)
、RNA誘導性DNアーゼ消化またはそれらの組合せにより、該配列決定サンプルから除
去する(ここで、該配列決定サンプルからの前記の少なくとも1つの合成核酸の除去は、
該配列決定アダプターよりも、および該配列決定アダプターの多量体よりも、前記の少な
くとも1つの合成核酸を優先的に除去することを含む)ことを含む。
【0054】
幾つかの場合には、該方法は更に、エンドヌクレアーゼ消化、サイズに基づく除去また
はそれらの組合せにより、前記の少なくとも1つの合成核酸を除去することを含む。幾つ
かの場合には、該配列決定アダプターは核酸である。幾つかの場合には、前記の少なくと
も1つの合成核酸の除去を、アフィニティに基づく枯渇により行い、前記の少なくとも1
つの合成核酸は固定化タグを含む。幾つかの場合には、前記の少なくとも1つの合成核酸
の除去をRNA誘導性DNアーゼ消化により行う。幾つかの場合には、RNA誘導性DN
アーゼはCRISPR関連タンパク質を含む。幾つかの場合には、前記の少なくとも1つ
の合成核酸の除去をエンドヌクレアーゼ消化により行う。幾つかの場合には、前記の少な
くとも1つの合成核酸の除去を、サイズに基づく除去により行い、前記の少なくとも1つ
の合成核酸は、標的核酸の長さより長い長さを有する。幾つかの場合には、前記の少なく
とも1つの合成核酸の除去をRNアーゼで行い、前記の少なくとも1つの合成核酸の除去
はDNA-RNAハイブリッドである。幾つかの場合には、配列決定アダプターを標的核
酸に結合させることは、配列決定アダプターを標的核酸に連結することを含む。幾つかの
場合には、配列決定アダプターを標的核酸に結合させることは、配列決定アダプターを標
的核酸に連結することを含む。
【0055】
もう1つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示
し、該方法は、a)標的核酸と少なくとも1つの合成核酸とを含むサンプルを得、ここで
、前記の少なくとも1つの合成核酸は、(i)一本鎖DNA、(ii)該合成核酸の増幅
を抑制するヌクレオチド修飾、(iii)固定化タグ、(iv)DNA-RNAハイブリ
ッド、(v)標的核酸の長さより長い長さを有する核酸、または(vi)それらの任意の
組合せを含み、b)配列決定反応のためのサンプルから配列決定ライブラリーを製造する
こと(ここで、前記の少なくとも1つの合成核酸の少なくとも一部は該配列決定反応にお
いて配列決定されない)を含む。
【0056】
幾つかの場合には、前記の少なくとも1つの合成核酸は更に、エンドヌクレアーゼ認識
部位を含む。幾つかの場合には、サンプルを得ることは、試験サンプルから標的核酸を抽
出することを含み、更に、試験サンプルから標的核酸を抽出した後、前記の少なくとも1
つの合成核酸を試験サンプルに加えることを含む。幾つかの場合には、サンプルを得るこ
とは、試験サンプルから標的核酸を抽出することを含み、更に、試験サンプルから標的核
酸を抽出する前に、前記の少なくとも1つの合成核酸を試験サンプルに加えることを含む
。幾つかの場合には、前記の少なくとも1つの合成核酸が、連結反応を阻害するブロッキ
ング基を含む場合には、該ブロッキング基は修飾ヌクレオチドを含む。幾つかの場合には
、修飾ヌクレオチドは反転(inverted)デオキシ-糖を含む。幾つかの場合には
、反転デオキシ-塩基は3’反転デオキシ-糖を含む。幾つかの場合には、修飾ヌクレオ
チドは反転チミジン、反転アデノシン、反転グアノシンまたは反転シチジンを含む。幾つ
かの場合には、修飾ヌクレオチドは反転ジデオキシ-糖を含む。幾つかの場合には、反転
ジデオキシ-糖は5’反転ジデオキシ-糖を含む。幾つかの場合には、修飾ヌクレオチド
は反転ジデオキ-シチミジン、反転ジデオキシ-アデノシン、反転ジデオキシ-グアノシ
ンまたは反転ジデオキシ-シチジンを含む。幾つかの場合には、修飾ヌクレオチドはジデ
オキシ-シチジンである。幾つかの場合には、前記の少なくとも1つの合成核酸は連結反
応を阻害するブロッキング基を含み、ブロッキング基はスペーサーを含む。幾つかの場合
には、スペーサーはC3スペーサーまたはスペーサー18を含む。幾つかの場合には、前
記の少なくとも1つの合成核酸は、連結反応を阻害するブロッキング基を含み、ブロッキ
ング基はヘアピン構造を含む。幾つかの場合には、該合成核酸は、前記の少なくとも1つ
の合成核酸の増幅を阻害するヌクレオチド修飾を含み、該ヌクレオチド修飾は少なくとも
1つの脱塩基部位を含む。幾つかの場合には、前記の少なくとも1つの脱塩基部位は少な
くとも1つの内部脱塩基部位である。幾つかの場合には、該ヌクレオチド修飾は8~10
個の脱塩基部位を含む。幾つかの場合には、前記の少なくとも1つの脱塩基部位は単一脱
塩基部位である。幾つかの場合には、前記の少なくとも1つの脱塩基部位は修飾リボース
上に存在する。幾つかの場合には、前記の少なくとも1つの脱塩基部位は、1’,2’-
ジデオキシリボース、ロック化(locked)核酸、架橋核酸、またはねじれたインタ
ーカレーティング核酸を含む。幾つかの場合には、前記の少なくとも1つの合成核酸は固
定化タグを含み、固定化タグはビオチン、ジゴキシゲニン、ポリヒスチジンまたはNi-
ニトリロ三酢酸を含む。幾つかの場合には、前記の少なくとも1つの合成核酸はDNAを
含み、内部ウラシルで標識されている。幾つかの場合には、前記の少なくとも1つの合成
核酸を、ウラシル特異的切除試薬酵素を使用して、配列決定サンプルから除去する。
【0057】
幾つかの場合には、試験サンプルは生物学的サンプルである。幾つかの場合には、生物
学的サンプルは全血、血漿、血清または尿である。幾つかの場合には、標的核酸は無細胞
核酸である。幾つかの場合には、無細胞核酸は無細胞DNAである。幾つかの場合には、
無細胞核酸は病原体核酸である。幾つかの場合には、無細胞核酸は循環無細胞核酸である
。幾つかの場合には、前記の少なくとも1つの合成核酸は二本鎖核酸を含む。幾つかの場
合には、前記の少なくとも1つの合成核酸は一本鎖核酸を含む。幾つかの場合には、前記
の少なくとも1つの合成核酸はDNA、RNA、DNA-RNAハイブリッドまたはそれ
らの任意の類似体を含む。
【0058】
幾つかの場合には、該方法は更に、(a)サンプルから標的核酸を抽出すること、(b
)サンプルから標的核酸を精製すること、(c)標的核酸を末端修復すること、(d)標
的核酸を断片化すること、(e)標的核酸を増幅すること、(f)配列決定アダプターを
標的核酸に結合させること、および(g)標的核酸を配列決定することの1以上を含む。
幾つかの場合には、該方法は、配列決定アダプターを標的核酸に結合させることを含み、
更に、配列決定アダプターを標的核酸に結合させる前に、配列決定サンプルをエンドヌク
レアーゼで処理することを含む。幾つかの場合には、該方法は、配列決定アダプターを標
的核酸に結合させることを含み、更に、配列決定アダプターを標的核酸に結合させた後、
配列決定サンプルをエンドヌクレアーゼで処理することを含む。幾つかの場合には、該方
法は、標的核酸を末端修復することを含み、ここで、標的核酸を末端修復する前に、前記
の少なくとも1つの合成核酸をサンプルに加える。幾つかの場合には、該方法は、標的核
酸を末端修復することを含み、ここで、標的核酸を末端修復した後、前記の少なくとも1
つの合成核酸をサンプルに加える。幾つかの場合には、該方法は、配列決定アダプターを
標的核酸に結合させることを含み、配列決定アダプターを標的核酸に結合させる前に、前
記の少なくとも1つの合成核酸をサンプルに加える。幾つかの場合には、サンプルにおけ
る前記の少なくとも1つの合成核酸の濃度とサンプルにおける標的核酸の濃度との比は1
:1~1000:1である。
【0059】
幾つかの場合には、前記の少なくとも1つの合成核酸のサイズと標的核酸のサイズとの
差異は、前記の少なくとも1つの合成核酸を標的核酸からサイズに基づいて分離すること
を可能にする。幾つかの場合には、合成核酸は、連結反応を阻害するブロッキング基、お
よび増幅反応を阻害するヌクレオチド修飾を含む。幾つかの場合には、連結反応を阻害す
るブロッキング基は3’反転デオキシ-Tを含み、増幅反応を阻害するヌクレオチド修飾
は内部脱塩基部位を含む。幾つかの場合には、ブロッキング基は更に、5’反転ジデオキ
シ-Tを含む。幾つかの場合には、該方法は更に、サンプルをエンドヌクレアーゼVII
Iと共にインキュベートすることを含む。幾つかの場合には、サンプルをエンドヌクレア
ーゼVIIIと共に1時間以下、インキュベートする。幾つかの場合には、該方法は、サ
ンプルから標的核酸を抽出することを含み、標的核酸を抽出することは、前記の少なくと
も1つの合成核酸を含有しないサンプルから標的核酸を抽出することと比較して高い収率
を示す。幾つかの場合には、該方法は、標的核酸を末端修復することを含み、標的核酸を
末端修復することは、前記の少なくとも1つの合成核酸を含有しないサンプルにおける標
的核酸を末端修復することと比較して高い効率を示す。幾つかの場合には、標的核酸は、
天然に存在する核酸またはそのコピーを含む。幾つかの場合には、該方法は更に、コンピ
ュータを使用して、標的核酸の少なくとも1つの配列情報を得ることを含む。
【0060】
もう1つの態様においては、配列決定ライブラリーの製造方法を本明細書において開示
し、該方法は、(a)(i)標的核酸、(ii)配列決定アダプター、および(iii)
少なくとも1つの合成核酸(ここで、前記の少なくとも1つの合成核酸はDNAを含み、
末端修復に抵抗する)を含むサンプルを得、b)前記の少なくとも1つの合成核酸よりも
標的核酸が優先的に末端修復されるように、該サンプルに関して末端修復反応を行うこと
を含む。
【0061】
幾つかの実施形態においては、前記方法のいずれかは、該方法の結果を患者、介護者ま
たは他の者に報告することを含みうる。
【0062】
もう1つの態様においては、配列決定ライブラリーを製造するためのキットを本明細書
において開示し、該キットは、a)配列決定アダプター、およびb)少なくとも1つの合
成核酸(ここで、前記の少なくとも1つの合成核酸はDNAを含み、核酸に対する末端修
復に抵抗する)を含む。幾つかの場合には、前記の少なくとも1つの合成核酸の量と配列
決定アダプターの量との比は1:1以下である。
【0063】
開示されている内容の新規特徴は添付の特許請求の範囲に詳細に記載されている。本開
示の内容の特徴および利点のより深い理解は、開示されている内容の原理を利用する例示
的な実施形態を記載する以下の詳細な説明および後記の添付図面を参照することによりも
たらされる。
【0064】
文献の援用
本明細書に挙げられている全ての刊行物、特許および特許出願の全体を、各個の刊行物
、特許または特許出願が参照により本明細書に組み入れられると具体的かつ個別に示され
ている場合と同様に、参照により本明細書に組み入れることとする。
【0065】
詳細な説明
概要
本開示は、次世代シーケンシングアッセイおよび他のアッセイにおける核酸の、改良さ
れた特定または定量のための複数の方法およびアプローチを提供する。一般に、本発明で
提供する方法は、特定の配列、長さ、GC含量、縮重度、多様性の度合および/または既
知の出発濃度のような特別な特徴を有するスパイクイン合成核酸の使用を含む。そのよう
なスパイクイン合成核酸の使用は、絶対的存在量の決定、相対的存在量の決定、存在量の
正規化、汎用的な定量、バイアス制御、サンプルの特定(同定)、交差汚染の検出、情報
伝達効率、試薬追跡、多様性減少の正規化、絶対的または相対的な損失の決定、品質管理
および多数の他の用途を可能にし、改善しうる。本発明で提供するスパイクイン合成核酸
は、特別に設計された担体(carrier)核酸をも含み、該担体核酸はサンプルにお
ける核酸の全濃度を増加させうるが、配列決定または他のアッセイによる検出を回避する
能力を有する。
【0066】
好ましい実施形態においては、本開示は、スパイクイン合成核酸の種のセットを提供し
、ここで、それぞれの種の長さおよび/またはGC含量は、分析されるべき標的核酸のセ
ットの、予想されるまたは観察可能な長さおよび/またはGC含量に合致または近似する
ように設計される。例えば、スパイクイン合成核酸の長さは、そのような病原体に感染し
ているヒト患者から得られたサンプル(例えば、血漿)における疾患特異的または病原体
特異的無細胞核酸の長さに近似可能である。他の好ましい実施形態においては、本開示は
、サンプル、試薬または試薬ロットをユニークに特定するための配列を含むスパイクイン
合成核酸を提供する。更に他の好ましい実施形態においては、本開示は、ユニーク配列を
有する多数のスパイクイン合成核酸(例えば、10、10、10、10、10
、10または1010個のユニークスパイクイン合成核酸)を含むプールを提供し、こ
れは、ハイスループット配列決定アッセイの経過中、特にサンプル処理工程、例えば核酸
抽出および/またはライブラリー製造におけるユニークスパイクイン配列の多様性の減少
を介してサンプルにおける絶対的核酸減少を追跡するために使用されうる。
【0067】
絶対的核酸減少を追跡しうることは初期サンプルにおける標的核酸の絶対的存在量の決
定を可能にしうる。例えば、臨床サンプルにおける病原体の絶対量は、その病原体に起因
する配列決定リードの数に基づいて決定されうる。抗生物質または医薬組成物での治療の
前、途中および後などに経時的に採取された臨床サンプルにおける病原体の絶対的存在量
を決定することにより、医学的治療がモニターまたは調節されうる。特定の病原体が存在
するかどうかを決定することに加えて、感染または疾患の度合または段階も決定されうる
【0068】
該方法は、臨床サンプル、処理サンプル(例えば、抽出核酸、抽出無細胞DNA、抽出
無細胞RNA、血漿、血清)、未処理サンプル(例えば、全血)および任意の他のタイプ
のサンプル、特に核酸を含むサンプル(これらに限定されるものではない)を含む多種多
様なサンプルにスパイクイン合成核酸を加えることを含みうる。幾つかの場合には、該方
法は、試薬、特に、配列決定(例えば、次世代シーケンシング)によるサンプルの分析の
任意の段階で使用される検査用試薬(または特定の試薬ロット)に該スパイクイン合成核
酸を加えることを含みうる。好ましい実施形態においては、該方法は、既知濃度の合成核
酸を試薬およびサンプル内に導入することを含みうる。該方法は、臨床サンプルにおける
病原体に由来する低存在量の病原体または核酸を検出、特定、モニターまたは定量するよ
うに設計されたアッセイの精度および効率を高めるのに特に有用でありうる。該方法はま
た、サンプルトラッキング(サンプル追跡)のエラーで生じる、あるいはサンプル調製、
核酸精製または配列決定ライブラリー製造中の核酸配列の不均一な減少から生じる、ある
いは異なる標的核酸または異なるサンプルの分析を比較する際の内部正規化標準の欠如か
ら生じる望ましくない影響を低減しうる。
【0069】
図1は、特に存在量の正規化に関する本発明で提供する方法の多くの工程の一般的概要
を示す。該方法は、対象110(例えば、ヒト患者)からサンプルを得ることを含みうる
。幾つかの特定の実施形態においては、対象は感染症を有し、または病原体に感染してい
ると疑われる。サンプルは、図示されているとおり、血液サンプル120または血漿サン
プル130、あるいは任意の他のタイプの生物学的サンプル、特に、体液、組織および/
または細胞を含有する生物学的サンプル、あるいは無細胞生物学的サンプルでありうる。
【0070】
サンプル140からの核酸(例えば、無細胞核酸)を抽出し、アッセイ、例えば配列決
定アッセイ(例えば、次世代シーケンシングアッセイ)において使用することが可能であ
る。1以上のタイプの合成核酸150を、該方法における1以上の工程において、例えば
血液サンプル120、血漿サンプル130またはサンプル核酸140に加える(またはス
パイクイン(添加)する)。該合成核酸は、分析すべき標的核酸のセットの長さに近似す
るように設計された長さ、および/または分析すべき標的核酸のセットのGC含量に近似
するように設計されたGC含量を有しうる。一般に、該合成核酸は既知の出発濃度をも有
する。ついで該合成核酸を含むサンプルを配列決定アッセイ160、例えば次世代シーケ
ンシングアッセイにより分析することが可能である。幾つかの場合には、配列決定アッセ
イにより特定された合成核酸の量を該合成核酸の既知出発濃度と比較して、リード数を既
知出発濃度と相関させる。結果として、特に、検出された標的核酸の存在量を、長さおよ
び/またはGC含量においてそのような標的核酸170に最も近い合成核酸の存在量と比
較することにより、サンプル核酸における標的核酸を特定または定量することが可能であ
る。そのような方法および本発明で提供する他の方法の使用により、対象の状態を、より
高い精度および確実性のレベルで特定することが可能である。幾つかの特定の実施形態に
おいては、配列決定アッセイ(例えば、次世代シーケンシングアッセイ)はヒト患者由来
の無細胞核酸(例えば、DNA)のサンプルにおける病原体核酸を検出する。
【0071】
それらの工程は任意の順序および任意の組合せで行われうる。幾つかの場合には、ある
工程は行われない。幾つかの場合には、図示されている工程に新たな工程を加え、または
図示されている工程の間に介在させる。
【0072】
図2は典型的な感染の概要図を示す。病原体感染源は、例えば肺におけるものでありう
る。病原体に由来する無細胞核酸、例えば無細胞DNAなどの無細胞核酸は血流を通って
移動し、分析のために血漿サンプル中に収集されうる。ついでサンプルにおける核酸を、
図1に示されているとおりに配列決定アッセイにより分析することが可能である。
【0073】
図3は、本発明で提供する方法の幾つかの一般的スキームを示す。該方法は、宿主(例
えば、ヒト)核酸および非宿主(例えば、病原体)核酸を含有するサンプルを得ることを
含みうる。サンプルは対象、例えば患者から得られうる。幾つかの特定の実施形態におい
ては、対象は感染症を有し、または病原体に感染していると疑われる。サンプルは血液サ
ンプルまたは血漿サンプル、または任意の他のタイプの生物学的サンプル、特に、体液、
組織および/または細胞を含有する生物学的サンプルでありうる。サンプルからの核酸(
例えば、無細胞核酸)を既知量の合成核酸と一緒にすることが可能である。ついで、合成
核酸を含有するサンプルを、配列決定アッセイ、例えば次世代シーケンシングアッセイに
より分析することが可能である。配列決定結果を既知の宿主および非宿主参照配列に対し
てマッピングすることが可能である。幾つかの場合には、配列決定アッセイにより特定さ
れた合成核酸の量を該合成核酸の既知出発濃度と比較して、リード数を該既知出発濃度と
相関させる。結果として、非宿主配列の相対的存在量が決定されうる。それらの工程は任
意の順序および任意の組合せで行われうる。幾つかの場合には、ある工程は数回反復され
うる。幾つかの場合には、ある工程は行われない。幾つかの場合には、図示されている工
程に新たな工程を加え、または図示されている工程の間に介在させる。
【0074】
本発明で提供する方法は、標的核酸がサンプル中に低存在量で存在する場合または複数
のサンプルもしくは複数の標的核酸を比較もしくは追跡する場合には特に、次世代シーケ
ンシングによる標的核酸の改良された特定または定量を可能にしうる。例えば、次世代シ
ーケンシングによる臨床サンプルにおける標的病原体、腫瘍細胞または腫瘍原性マーカー
の正確な検出および定量は、該サンプルが不適切に追跡される場合または標的核酸が不正
確に正規化もしくは定量される場合には、損なわれ、または負の影響を受けうる。したが
って、本発明で提供する方法は、サンプルトラッキングもしくは特定における又は核酸の
定量もしくは配列決定データのクラウド分析におけるエラーから生じる陥穽を回避するこ
とを助けうる。
【0075】
本発明で提供する方法および組成物は、出発サンプルが比較的少量の核酸を含有する場
合には特に、配列決定ライブラリーの収率、品質または効率を向上させるために配列決定
ライブラリーの製造中に合成核酸を加えるおよび/または除去するために使用されうる。
一般に、幾つかの場合には、該合成核酸はこれらの用途において担体核酸として作用して
、サンプル調製プロセス中に全核酸の濃度を上昇させうる。サンプルへの該合成核酸の添
加は配列決定ライブラリーの製造(作製)の1以上の工程の収率および/または効率を増
加させうる。前記の1以上の工程は核酸濃度に感受性でありうる。例えば、該工程の収率
および/または効率はサンプルにおける核酸濃度に左右されうる。そのような工程は核酸
抽出、精製、連結および末端修復を含みうる。幾つかの場合には、該合成核酸は該配列決
定ライブラリーから除去されうる。該合成核酸は、該配列決定ライブラリーの製造におけ
る1以上の工程にそれらが関与することを妨げる或る特徴を含みうる。したがって、該合
成核酸は配列決定工程において配列決定されない可能性がある。
【0076】
該方法および組成物は、複数の対象からのサンプルを分析するために(例えば、サンプ
ルにおける標的核酸から配列決定ライブラリーを製造するために)使用されうる。これら
のサンプルにおける標的核酸の濃度は対象によって異なりうる。この場合のこれらのサン
プルへの該合成核酸の添加はサンプル間の濃度変動を低減して、分析の精度を改善しうる
【0077】
該方法および組成物は、少なくとも1つの合成核酸を加えることにより、サンプルから
配列決定ライブラリーを製造するために使用されうる。該合成核酸は、配列決定反応にお
いてそれらが配列決定されないようにする1以上の特徴を有しうる。幾つかの場合には、
該合成核酸は、配列決定ライブラリーの製造における1以上の反応、例えばアダプター連
結および核酸増幅を抑制する修飾を含む。例えば、該核酸は一方または両方の末端に反転
糖および/または1以上の脱塩基部位を含みうる。
【0078】
幾つかの場合には、該合成核酸は配列決定前に配列決定ライブラリーから除去されうる
。幾つかの場合には、該合成核酸は酵素消化により除去されうる。例えば、該合成核酸は
制限酵素認識部位を含むことが可能であり、制限酵素により分解されうる。幾つかの場合
には、該合成核酸は、アフィニティに基づく枯渇により除去されうる。例えば、該合成核
酸は1以上の固定化タグを含むことが可能であり、アフィニティに基づく枯渇により除去
されうる。ある場合においては、該合成核酸は、サイズに基づく除去により除去されうる
。該合成核酸は配列決定ライブラリーにおける他の分子とは異なるサイズを有することも
可能であり、その結果、該合成核酸は、サイズに基づく除去により除去されうる。幾つか
の場合には、該合成核酸は本明細書における特徴および/または修飾の組合せを含むこと
が可能であり、その結果、それらは配列ライブラリーの製造の1以上の工程に関与せず、
配列決定前に除去されうる。
【0079】
サンプル
本発明で提供する方法は多種多様なサンプルの改良された分析を可能にしうる。本発明
で提供する合成核酸は、そのようなサンプルを分析するために使用可能であり、それは、
サンプルに、またはサンプルの加工形態、例えば臨床血漿サンプルからの抽出無細胞核酸
に該合成核酸を直接加えることを含みうる。
【0080】
本発明で提供する方法において分析されるサンプルは、好ましくは、任意のタイプの臨
床サンプルである。幾つかの場合には、サンプルは細胞、組織または体液を含有する。好
ましい実施形態においては、サンプルは液体または流体サンプルである。幾つかの場合に
は、サンプルは体液、例えば全血、血漿、血清、尿、便、唾液、リンパ液、髄液、滑液、
気管支肺胞洗浄液、鼻腔スワブ、呼吸器分泌物、膣液、羊水、精液または月経物を含有す
る。幾つかの場合には、サンプルは、全体的または部分的に、細胞または組織から構成さ
れる。幾つかの場合には、細胞、細胞断片またはエキソソームは、例えば遠心分離または
濾過によりサンプルから取り出される。本明細書におけるサンプルは生物学的サンプルで
ありうる。
【0081】
サンプルは任意の濃度の核酸を含みうる。本明細書における組成物および方法は、低濃
度の全核酸を含有するサンプルに有用でありうる。幾つかの場合には、サンプルは、多く
とも100ng/μL、50ng/μL、10ng/μL、5ng/μL、2ng/μL
、1.5ng/μL、1.2ng/μL、1ng/μL、0.8ng/μL、0.4ng
/μL、0.2ng/μL、0.1ng/μL、0.05ng/μL、0.01ng/μ
L、10ng/mL、5ng/mL、2ng/mL、1ng/mL、0.8ng/mL、
0.6ng/mL、0.5ng/mLまたは0.1ng/mLの核酸の全濃度を有する。
幾つかの場合には、サンプルは、少なくとも0.1ng/mL、0.5ng/mL、0.
6ng/mL、0.8ng/mL、1ng/mL、2ng/mL、5ng/mL、10n
g/mL、0.01ng/μL、0.05ng/μL、0.1ng/μL、0.2ng/
μL、0.4ng/μL、0.8ng/μL、1ng/μL、1.2ng/μL、1.5
ng/μL、2ng/μL、5ng/μL、10ng/μL、50ng/μLまたは10
0ng/μLの核酸の全濃度を含む。幾つかの場合には、サンプルは約0.1ng/mL
~約10,000ng/mL(すなわち、約0.1ng/mL~約10ng/μL)の範
囲内の核酸の全濃度を有する。
【0082】
サンプルは1以上の対照を含みうる。幾つかの場合には、サンプルは1以上の陰性対照
を含む。典型的な陰性対照は、汚染物質を特定するために調製されたサンプル(例えば、
血漿マイナスサンプル)、健康な対象からの血漿、および低多様性サンプル(例えば、見
かけ上健康な対象から採取されたサンプル)を含む。幾つかの場合には、サンプルは1以
上の陽性対照を含む。典型的な陽性対照は、既知病原体からのゲノムDNAを有する健常
対象からのサンプル(例えば、血漿サンプル)を含む。既知病原体からのゲノムDNAは
完全なゲノムDNAでありうる。幾つかの場合には、既知病原体からのゲノムDNAは、
例えば種々の平均長までせん断されうる。せん断は機械的せん断(例えば、超音波、流体
力学的せん断力)、酵素的せん断(例えば、エンドヌクレアーゼ)、熱分解(例えば、高
温でのインキュベーション)、化学的断片化(例えば、アルカリ溶液、二価イオン)によ
り行われうる。
【0083】
サンプルは標的核酸を含みうる。標的核酸は、サンプルにおいて分析される核酸を意味
しうる。例えば、標的核酸はサンプル中に元々存在することが可能であり、例えば、天然
核酸でありうる。サンプルは更に、本明細書に開示されている1以上の合成核酸を含みう
る。幾つかの場合には、標的核酸は、本明細書に記載されている無細胞核酸である。例え
ば、標的核酸は無細胞DNA、無細胞RNA(例えば、無細胞mRNA、無細胞miRN
A、無細胞siRNA)、またはそれらの任意の組合せでありうる。ある場合においては
、無細胞核酸は病原体核酸、例えば、病原体からの核酸である。無細胞核酸は循環核酸、
例えば、循環腫瘍DNAまたは循環胎児DNAでありうる。サンプルは、病原体、例えば
ウイルス、細菌、真菌および/または真核寄生生物からの核酸を含みうる。
【0084】
ある場合においては、サンプルはアダプターをも含む。アダプターは、既知または未知
配列を有する核酸でありうる。アダプターは核酸の3’末端、5’末端または両方の末端
に結合されうる。アダプターは既知配列および/または未知配列を含みうる。アダプター
は二本鎖または一本鎖でありうる。幾つかの場合には、アダプターは配列決定アダプター
である。配列決定アダプターは標的核酸に結合し、標的核酸の配列決定を助けうる。例え
ば、配列決定アダプターは、配列決定用プライマー結合部位、ユニーク識別子配列、非ユ
ニーク識別子配列、および固体支持体上に標的核酸を固定化するための配列の1以上を含
みうる。配列決定アダプターに結合される標的核酸はシーケンサー上の固体支持体上に固
定化されうる。配列決定用プライマーはアダプターにハイブリダイズし、配列決定反応に
おいて標的核酸を鋳型として使用して伸長されうる。幾つかの場合には、アダプターにお
ける識別子を使用して、異なる標的配列の配列リードを標識し、それにより、複数の標的
核酸のハイスループット配列決定が可能となる。
【0085】
「結合」なる語およびその文法的等価体は、任意の結合形態を用いて2つの分子を連結
することを意味しうる。例えば、結合は、2つの分子を化学結合または他の方法により連
結して新しい分子を生成させることを意味しうる。核酸にアダプターを結合させることは
、アダプターと核酸との間に化学結合を形成させることを意味しうる。幾つかの場合には
、結合は、例えばリガーゼを使用する連結により行われる。例えば、核酸アダプターは、
リガーゼによって触媒されるホスホジエステル結合を形成させることにより、連結により
標的核酸に結合されうる。
【0086】
配列決定ライブラリーは、本発明で提供する方法および組成物を使用して、サンプルか
ら製造されうる。配列決定ライブラリーは、使用される配列決定システムに適合した複数
の核酸を含みうる。例えば、配列決定ライブラリーにおける核酸は、1以上のアダプター
に結合した標的核酸を含みうる。配列決定ライブラリーを製造するための工程は、サンプ
ルから標的核酸を抽出すること、標的核酸を断片化すること、標的核酸にアダプターを結
合させること、標的核酸-アダプター複合体を増幅すること、および増幅された標的核酸
-アダプター複合体を配列決定することの1以上を含みうる。
【0087】
サンプル(特に、細胞サンプルまたは組織生検)は身体の任意の部分または領域からの
ものでありうる。典型的なサンプルは、例えば血液、中枢神経系、脳、脊髄、骨髄、膵臓
、甲状腺、胆嚢、肝臓、心臓、脾臓、結腸、直腸、肺、呼吸器系、咽喉、鼻腔、胃、食道
、耳、眼、皮膚、四肢、子宮、前立腺、生殖器または身体の任意の他の器官または領域か
ら得られうる。
【0088】
一般に、サンプルはヒト対象、特にヒト患者からのものである。しかし、サンプルはま
た、任意の他のタイプの対象、例えば任意の哺乳動物、非ヒト哺乳動物、非ヒト霊長類、
飼育動物(例えば、実験動物、家庭用ペットまたは家畜)または非飼育動物(例えば、野
生動物)からのものでありうる。幾つかの特定の実施形態においては、対象はイヌ、ネコ
、げっ歯類、マウス、ハムスター、ウシ、トリ、ニワトリ、ブタ、ウマ、ヤギ、ヒツジ、
ウサギ、類人猿、サルまたはチンパンジーである。
【0089】
好ましい実施形態においては、対象は、病原体に感染している、または病原体による感
染のリスクを有する、または病原体感染を有すると疑われる宿主生物(例えば、ヒト)で
ある。幾つかの場合には、対象は、特定の感染を有することが疑われ、例えば、結核を有
することが疑われる。他の場合においては、対象は未知起源の感染を有することが疑われ
る。幾つかの場合には、宿主または対象は(例えば、1以上の微生物、病原体、細菌、ウ
イルス、真菌または寄生生物に)感染している。幾つかの場合には、宿主または対象は、
1以上の型の癌を有すると診断されており、または1以上の型の癌を発生するリスクを有
する。幾つかの場合には、宿主または対象は(例えば、1以上の微生物、病原体、細菌、
ウイルス、真菌または寄生生物に)感染していない。幾つかの場合には、宿主または対象
は健康である。幾つかの場合には、宿主または対象は感染に感受性である、または感染の
リスクを有する。
【0090】
幾つかの場合には、対象は抗微生物剤、抗細菌剤、抗ウイルス剤または抗寄生生物剤で
治療されていてもよく、または治療されうる。対象は(例えば、1以上の微生物、病原体
、細菌、ウイルス、真菌または寄生生物による)実際の感染を有しうる。幾つかの場合に
は、対象は(例えば、1以上の微生物、病原体、細菌、ウイルス、真菌または寄生生物に
)感染していない。幾つかの場合には、対象は健康である。幾つかの場合には、対象は感
染に感受性であり、または感染のリスクを有する(例えば、患者は免疫無防備状態である
)。対象は、別の疾患または障害を有する、またはそのリスクを有しうる。例えば、対象
は、疾患、例えば癌(例えば、乳癌、肺癌、膵臓癌、血液癌など)を有しうる、またはそ
のリスクを有しうる、またはそのような疾患を有すると疑われうる。
【0091】
サンプルは核酸サンプルでありうる。幾つかの場合には、サンプルは或る量の核酸を含
有する。サンプル中の核酸は二本鎖(ds)核酸、一本鎖(ss)核酸、DNA、RNA
、cDNA、mRNA、cRNA、tRNA、リボソームRNA、dsDNA、ssDN
A、miRNA、siRNA、循環核酸、循環無細胞核酸、循環DNA、循環RNA、無
細胞核酸、無細胞DNA、無細胞RNA、循環無細胞DNA、無細胞dsDNA、無細胞
ssDNA、循環無細胞RNA、ゲノムDNA、エキソソーム、無細胞病原体核酸、循環
病原体核酸、ミトコンドリア核酸、非ミトコンドリア核酸、核DNA、核RNA、染色体
DNA、循環腫瘍DNA、循環腫瘍RNA、環状核酸、環状DNA、環状RNA、環状一
本鎖DNA、環状二本鎖DNA、プラスミドまたはそれらの任意の組合せを含みうる。幾
つかの場合には、サンプル核酸は合成核酸を含みうる。ある場合においては、合成核酸は
、本明細書に開示されている任意のタイプの核酸、例えばDNA、RNA、DNA-RN
Aハイブリッドを含む。例えば、合成核酸はDNAでありうる。
【0092】
幾つかの場合には、サンプル中には種々のタイプの核酸が存在しうる。例えば、サンプ
ルは無細胞RNAおよび無細胞DNAを含みうる。同様に、本発明で提供する方法は、サ
ンプル中に存在するRNAおよびDNAの両方を単独でまたは組合せて分析する方法を含
みうる。
【0093】
本明細書中で用いる「無細胞」なる語は、体からサンプルが得られる前に体内に出現し
た核酸の状態を意味する。例えば、サンプルにおける循環無細胞核酸は、人体の血流中を
循環する無細胞核酸に起源を有しうる。これとは対照的に、生検のような固体組織から抽
出された核酸は一般に「無細胞」であるとはみなされない。
【0094】
幾つかの場合には、サンプルは、無細胞核酸または細胞結合核酸を含有する処理サンプ
ル(例えば、血清、血漿)または未処理サンプル(例えば、全血)でありうる。幾つかの
場合には、サンプルは、あるタイプの核酸、例えばDNA、RNA、無細胞DNA、無細
胞RNA、無細胞循環DNA、無細胞循環RNAなどに関して富化されている。幾つかの
場合には、サンプルは、核酸を単離するために、またはサンプルにおける他の成分から核
酸を分離するために、何らかの方法で処理されている。幾つかの場合には、サンプルは病
原体特異的核酸に関して富化されている。
【0095】
しばしば、サンプルは新鮮なサンプルである。幾つかの場合には、サンプルは凍結サン
プルである。幾つかの場合には、サンプルは、例えばホルマリン固定パラフィン包埋組織
のように、例えば化学的固定剤で固定される。
【0096】
標的核酸
本発明で提供する方法は、多数の標的核酸を検出するために使用されうる。標的核酸に
は、全ゲノムまたは部分ゲノム、エクソーム、遺伝子座、遺伝子、エキソン、イントロン
、修飾核酸(例えば、メチル化核酸)、および/またはミトコンドリア核酸が含まれるが
、これらに限定されるものではない。しばしば、本発明で提供する方法は、病原体標的核
酸を検出するために使用されうる。幾つかの場合には、病原体標的核酸は、対象からの核
酸を含有する複雑な臨床サンプル中に存在する。病原体標的核酸は、感染症、例えばイン
フルエンザ、結核または任意の他の公知の感染性の疾患または障害(本明細書に更に詳細
に記載されているものを含む)に関連していることが可能である。幾つかの場合には、本
明細書に記載されている標的核酸は標的核酸でありうる。
【0097】
幾つかの場合には、病原体標的核酸は、組織サンプル、例えば、感染部位からの組織サ
ンプル中に存在する。他の場合においては、病原体標的核酸は感染部位から移動しており
、例えば、それは、循環無細胞核酸(例えば、DNA)を含有するサンプルから得られう
る。
【0098】
幾つかの場合には、標的核酸は癌組織に由来する。標的核酸は組織または腫瘍から直接
得られうる。幾つかの場合には、標的癌核酸は循環無細胞核酸または循環腫瘍細胞(CT
C)から得られる。
【0099】
幾つかの場合には、標的核酸は、サンプル全体の非常に小さな部分のみ、例えば、サン
プルにおける全核酸の1%未満、0.5%未満、0.1%未満、0.01%未満、0.0
01%未満、0.0001%未満、0.00001%未満または0.0000001%未
満を構成しうる。幾つかの場合には、標的核酸はサンプルにおける全核酸の約0.000
01%~約0.5%を構成しうる。しばしば、元のサンプルにおける全核酸は変動しうる
。例えば、全無細胞核酸(例えば、DNA、mRNA、RNA)は1~100ng/ml
(例えば、約1、5、10、20、30、40、50、80、100ng/ml)の範囲
でありうる。幾つかの場合には、サンプルにおける無細胞核酸の全濃度はこの範囲外であ
る(例えば、1ng/ml未満;他の場合においては、全濃度は100ng/mlを超え
る)。これは、ヒトDNAおよび/またはRNAから主に構成される無細胞核酸(例えば
、DNA)サンプルの場合に当てはまりうる。そのようなサンプルにおいては、病原体標
的核酸または癌標的核酸は、例えば化学療法を受けている対象からのサンプルに関しては
、ヒト核酸または健常核酸と比較して十分には存在しないかもしれない。例えば、病原体
標的核酸はサンプルにおける全核酸の0.001%未満を構成することが可能であり、癌
標的核酸はサンプルにおける全核酸の1%未満を構成することが可能である。
【0100】
標的核酸の長さは様々でありうる。幾つかの場合には、標的核酸は少なくとも約20、
30、40、50、60、70、80、90、100、110、120、130、140
、150、160、170、180、190、200、250、300、350、400
、450、500、750、1000、1500、2000、3000、4000、50
00、10000、15000、20000、25000または50000ヌクレオチド
(または塩基対)長でありうる。幾つかの場合には、標的核酸は多くとも約20、30、
40、50、60、70、80、90、100、110、120、130、140、15
0、160、170、180、190、200、250、300、350、400、45
0、500、750、1000、1500、2000、3000、4000、5000、
10000、15000、20000、25000または50000ヌクレオチド(また
は塩基対)長でありうる。幾つかの特定の実施形態においては、標的核酸は比較的短く、
例えば、500塩基対(またはヌクレオチド)長未満または1000塩基対(またはヌク
レオチド)長未満である。幾つかの場合には、標的核酸は比較的長く、例えば、1000
塩基対(またはヌクレオチド)長を超える、1500塩基対(またはヌクレオチド)長を
超える、2000塩基対(またはヌクレオチド)長を超える、2500塩基対(またはヌ
クレオチド)長を超える、3000塩基対(またはヌクレオチド)長を超える、または5
000塩基対(またはヌクレオチド)長を超える。幾つかの場合には、標的核酸は約20
~約120塩基対の範囲でありうる。幾つかの場合には、標的核酸は約40~約100塩
基対の範囲でありうる。
【0101】
サンプル核酸の場合と同様に、標的核酸は、二本鎖(ds)核酸、一本鎖(ss)核酸
、DNA、RNA、cDNA、mRNA、cRNA、tRNA、リボソームRNA、ds
DNA、ssDNA、miRNA、siRNA、循環核酸、循環無細胞核酸、循環DNA
、循環RNA、無細胞核酸、無細胞DNA、無細胞RNA、循環無細胞DNA、無細胞d
sDNA、無細胞ssDNA、循環無細胞RNA、ゲノムDNA、エキソソーム、無細胞
病原体核酸、循環病原体核酸、ミトコンドリア核酸、非ミトコンドリア核酸、核DNA、
核RNA、染色体DNA、循環腫瘍DNA、循環腫瘍RNA、環状核酸、環状DNA、環
状RNA、環状一本鎖DNA、環状二本鎖DNA、プラスミドまたはそれらの任意の組合
せを含む任意のタイプの核酸でありうる。標的核酸は、好ましくは、ウイルス、細菌、真
菌、寄生生物および任意の他の微生物、特に感染性微生物(これらに限定されるものでは
ない)を含む病原体に由来する核酸である。標的核酸は、特定の器官または組織に由来す
る核酸でありうる。幾つかの場合には、標的核酸は、病原体ではなく対象から直接的に誘
導される。
【0102】
スパイクイン(spike-in)合成核酸
本開示は、特にハイスループットまたは次世代シーケンシングアッセイに関連した種々
の用途で使用される単一合成核酸および合成核酸のセットを記載する。幾つかの場合には
、スパイクイン合成核酸は、記載されている方法で使用される場合、例えば、それが由来
する個体、分析前サンプル処理条件、核酸抽出の方法、分子生物学的手段および方法によ
る核酸操作、核酸精製の方法、測定自体の実施、保存条件および時間経過には無関係に、
サンプルにわたる核酸(例えば、疾患特異的核酸、病原体核酸)の効率的な正規化を可能
にしうる。幾つかの場合には、本開示は、例えば多数のユニーク配列のような特定の特徴
を有する合成核酸のプールまたはセットを提供する。合成核酸のセットは、サンプル分析
の経過中に多様性減少をモニターするために使用可能であり、そして該多様性減少は、出
発核酸の存在量を決定するために使用されうる。本発明で提供する合成核酸はまた、サン
プルを追跡するため、サンプル間の交差汚染をモニターするため、試薬を追跡するため、
試薬ロットを追跡するため、および多数の他の用途に使用されうる。しばしば、合成核酸
の設計、長さ、品質、濃度、多様性レベルおよび配列は個々の用途に適合化されうる。幾
つかの場合には、スパイクイン合成核酸には、本明細書に記載されている担体合成核酸(
例えば、担体合成核酸)が含まれる。
【0103】
本発明で提供する合成核酸の集合体(コレクション)(またはセット)は幾つかの種の
合成核酸を含みうる。幾つかの場合には、該種の長さ、濃度および/または配列は同じで
ある、または類似していることが可能である。幾つかの場合には、該種の長さ、濃度およ
び/または配列は異なっていてもよい。
【0104】
好ましい実施形態においては、合成核酸の種は長さにおいて様々である。例えば、合成
核酸種の集合体は全体として、サンプルにおける或る標的核酸の長さの観察可能な範囲、
またはそのような観察可能な範囲の少なくとも一部にわたりうる。例えば、該種は全体と
して、サンプル(特に、病原体に感染している又は感染していると疑われる対象から得ら
れたサンプル)における疾患特異的または病原体特異的核酸の長さにわたりうる。幾つか
の場合には、サンプルにおける疾患特異的または病原体特異的核酸の長さは約40~約1
00塩基対の範囲でありうる。幾つかの場合には、該種は全体として、サンプルにおける
多種多様な疾患特異的または病原体特異的核酸の長さにわたりうる。幾つかの場合には、
該種は全体として、特定の病原体特異的核酸、例えば、特定の病原体ゲノム内の核酸の長
さにわたりうる。幾つかの場合には、該核酸は、病原体ゲノム内の特異的核酸、例えば、
病原体のビルレンス領域内の核酸、病原体の抗生物質耐性領域、あるいは他の領域または
特定の核酸もしくは遺伝子でありうる。幾つかの場合には、長さまたは核酸は感染の個々
のタイプ(例えば、急性、慢性、活動性または潜伏性)に特異的でありうる。他の例にお
いては、該種は全体として、サンプル(例えば、感染対象由来のもの)における或る対象
核酸および/または病原体核酸の長さにわたりうる。
【0105】
集合体内の合成核酸の種の長さは特定の標的核酸の長さ(例えば、サンプルにおける病
原体特異的または疾患特異的核酸の観察可能な範囲)と厳密に一致しうる。他の場合にお
いては、合成核酸の集合体内の合成核酸の種の長さは標的核酸の長さと厳密に一致し、ま
たはそのような長さに実質的に一致しうる。例えば、合成核酸の種の長さは標的核酸の長
さの50%~150%、標的核酸の長さの55%~145%、標的核酸の長さの60%~
140%、標的核酸の長さの65%~135%、標的核酸の長さの70%~130%、標
的核酸の長さの75%~125%、標的核酸の長さの80%~120%、標的核酸の長さ
の85%~115%、標的核酸の長さの90%~110%、標的核酸の長さの95%~1
05%、標的核酸の長さの96%~104%、標的核酸の長さの99%~101%、また
は標的核酸の長さの99.5%~100.5%の範囲内である。幾つかの場合には、合成
核酸の種の長さは標的核酸の長さの50%~150%の範囲内でありうる。幾つかの場合
には、合成核酸の種の長さは標的核酸の長さの2倍、3倍、4倍または5倍まででありう
る。幾つかの場合には、合成核酸の種の長さは標的核酸の長さの1、2、3、4、5、1
0、20、30、40、50、60、70、80、90、100、125、150または
200ヌクレオチド以内でありうる。幾つかの場合には、集合体内の合成核酸の種は、最
も厳密に一致した標的核酸の長さの65%、75%、80%、85%、90%、92%、
95%、97%または99%より大きい。
【0106】
本明細書に開示されている合成核酸の集合体(またはプール)内のそれぞれ又はほとん
どの核酸「種」は、関心のある1以上のドメインまたは領域を含みうる。幾つかの場合に
は、関心のあるドメインまたは領域は長さ識別子配列である。長さ識別子配列は、特定の
長さを示す又は表すと予め定められたコードを含有しうる。しばしば、そのような長さ識
別子は短い配列であることが可能であり、例えば、10塩基対(bp)、9bp、8bp
、7bp、6bp、5bp、4bpまたは3bp;9bp未満、8bp未満、7bp未満
または6bp未満;あるいは6~15bp、5~10bp、4~8bp、または6~9b
pでありうる。該種は1個、2個またはそれ以上の長さ識別子配列を含有しうる。幾つか
の場合には、長さ識別子はフォワードおよび/またはリバース配列として存在する。
【0107】
幾つかの場合には、合成核酸の集合体内の核酸種におけるドメインは、存在する場合の
該合成核酸における長さ識別配列によりコードされる長さに一般に対応する特定の長さの
ロード(load)配列でありうる。スパイクイン核酸またはロードの長さは様々であり
うる。幾つかの場合には、スパイクイン核酸全体は少なくとも約20、30、40、50
、60、70、80、90、100、110、120、130、140、150、160
、170、180、190、200、250、300、350、400、450または5
00ヌクレオチド長でありうる。幾つかの場合には、スパイクイン核酸は多くとも約20
、30、40、50、60、70、80、90、100、110、120、130、14
0、150、160、170、180、190、200、250、300、350、40
0、450または500ヌクレオチド長でありうる。幾つかの場合には、スパイクイン核
酸は約20~約200塩基対、例えば約20~約120塩基対の範囲でありうる。幾つか
の場合には、スパイクイン核酸内のロード配列ドメインの長さは少なくとも約20、30
、40、50、60、70、80、90、100、110、120、130、140、1
50、160、170、180、190、200、250、300、350、400、4
50または500ヌクレオチド長でありうる。幾つかの場合には、スパイクイン核酸内の
ロード配列ドメインの長さは多くとも約20、30、40、50、60、70、80、9
0、100、110、120、130、140、150、160、170、180、19
0、200、250、300、350、400、450または500ヌクレオチド長であ
りうる。幾つかの場合には、スパイクイン核酸内のロード配列ドメインの長さは0~約2
00bpの範囲内でありうる。
【0108】
合成核酸の集合体内の核酸種におけるドメインは、該核酸が元のサンプルの一部ではな
くスパイクインであることを示すユニークコードを含む合成核酸識別配列[例えば、スパ
ーク(Spark)識別配列、スパンク(Spank)識別配列]でありうる。一般に、
該ユニークコードは、元のサンプルに又は標的核酸のプールに存在しないコードである。
該合成核酸識別配列は特定の数のbp、例えば25bp、20bp、19bp、18bp
、16bp、15bp、12bp、10bpまたは他の長さを含みうる。該種は1個、2
個またはそれ以上の合成核酸識別配列またはドメインを含有しうる。幾つかの場合には、
該合成核酸識別配列はフォワードおよび/またはリバース配列として存在する。
【0109】
幾つかの場合には、合成核酸の集合体内の核酸種におけるドメインは、合成核酸の全体
的なプールまたは集合体に関連する「多様性コード」でありうる。多様性コードドメイン
は、合成核酸のプール内の多様性の量を示すユニークコードでありうる。そのような場合
、該多様性プール内の各合成核酸は、該プールの多様性の度合(例えば、10個のユニ
ーク配列)を示す配列でコードされうる。幾つかの場合、例えば、2以上の多様性プール
が同一サンプルに関して使用される場合には、該多様性コードは、それらの2以上のプー
ルにおける多様性減少を特定するために使用されうる。
【0110】
幾つかの場合には、合成核酸の集合体内の核酸種におけるドメインは、用途に応じて、
サンプルまたは試薬の特徴の1以上に関連する特徴ドメインでありうる。例えば、該特徴
ドメインは、特定の試薬、特定の試薬ロットまたは特定のサンプル(例えば、サンプル番
号、患者番号、患者名、患者の年齢、患者の性別、患者の人種、サンプルが患者から得ら
れた場所)を示すようにコードされた配列を含みうる。
【0111】
関心のあるドメインまたは領域は任意の組合せおよび数で存在しうる。例えば、合成核
酸は、1以上の長さ識別子配列、1以上のロード配列、1以上の合成核酸識別配列、1以
上の多様性コードおよび/または1以上の特徴ドメインを任意の組合せまたは比で含みう
る。例えば、幾つかの場合には、合成核酸は長さ識別子配列およびロード配列を含有する
。幾つかの場合には、合成核酸は合成核酸識別子配列および特徴ドメイン配列を含む。幾
つかの場合には、合成核酸は合成核酸識別子配列を含み、他の場合においては、それはそ
のような配列を含有しない。
【0112】
幾つかの場合には、合成核酸は、重複する目的を有するドメインを含有しうる。例えば
、幾つかの場合には、合成核酸は、ロード配列としても機能する1以上の長さ識別子配列
を含有する。幾つかの場合には、長さ識別子配列および/またはロード配列は合成核酸識
別子配列としても機能する。
【0113】
合成またはスパイクイン核酸は、核酸ライブラリーに適合するように選択または設計さ
れうる。幾つかの場合には、合成核酸またはスパイクインは、アダプター、共通配列、ラ
ンダム配列、ポリ(A)尾部、平滑末端もしくは不整(ragged)末端またはそれら
の任意の組合せを含有しうる。幾つかの場合には、合成核酸またはスパイクインは、これ
らの又は他の特性の1以上において、サンプルにおける核酸を模倣するように設計される
【0114】
本発明で提供する合成核酸(例えば、スパイクイン合成核酸)は任意のタイプの核酸、
または核酸タイプの組合せを含有しうる。好ましい実施形態においては、合成またはスパ
イクイン核酸はDNAである。幾つかの場合には、合成またはスパイクイン核酸は一本鎖
DNAである。幾つかの場合には、合成またはスパイクイン核酸は二本鎖DNAである。
幾つかの場合には、合成またはスパイクイン核酸はRNAである。幾つかの場合には、合
成またはスパイクイン核酸は修飾塩基または人工塩基を含有しうる。二本鎖合成またはス
パイクイン核酸は平滑末端または陥凹末端を有しうる。合成またはスパイクイン核酸はリ
ン酸化または脱リン酸化末端を有しうる。幾つかの場合には、合成核酸は二本鎖(ds)
核酸、一本鎖(ss)核酸、DNA、RNA、cDNA、mRNA、cRNA、tRNA
、リボソームRNA、dsDNA、ssDNA、snRNA、ゲノムDNA、オリゴヌク
レオチド、二本鎖オリゴヌクレオチド、より長い合体(assembled)二本鎖DN
A(例えば、Integrated DNA TechnologiesのgBlock
s)、プラスミド、PCR産物、インビトロ合成転写産物、ウイルス粒子、断片化または
非断片化ゲノムDNA、環状核酸、環状DNA、環状RNA、環状一本鎖DNA、環状二
本鎖DNA、プラスミドまたはそれらの任意の組合せを含有しうる。合成核酸は、しばし
ば、核酸塩基、例えばアデニン(A)、シトシン(C)、グアニン(G)、チミン(T)
および/またはウラシル(U)を含みうる。
【0115】
合成核酸は任意の合成核酸または核酸類似体であることが可能であり、あるいは任意の
合成核酸または核酸類似体を含みうる。合成核酸は、修飾または改変リン酸骨格、修飾ペ
ントース糖(例えば、修飾リボースまたはデオキシリボース)、あるいは修飾または改変
核酸塩基(例えば、修飾アデニン(A)、シトシン(C)、グアニン(G)、チミン(T
)、ウラシル(U))を含みうる。幾つかの場合には、合成核酸は1以上の修飾塩基、例
えば5-メチルシトシン(m5C)、シュードウリジン(Ψ)、ジヒドロウリジン(D)
、イノシン(I)および/または7-メチルグアノシン(m7G)を含みうる。幾つかの
場合には、合成核酸はペプチド核酸(PNA)、架橋核酸(BNA)、類似核酸、グリセ
ロール核酸(GNA)、トレオース核酸(TNA)、ロックト核酸(LNA)、2’-O
-メチル置換RNA、モルホリノ、またはヌクレオチド側鎖を有する他の合成ポリマーを
含みうる。幾つかの場合には、合成核酸はDNA、RNA、PNA、LNA、BNAまた
はそれらの任意の組合せを含みうる。幾つかの場合には、合成核酸は二重らせんまたは三
重らせんまたは他の構造を含みうる。
【0116】
合成核酸は任意のヌクレオチドの任意の組合せを含みうる。ヌクレオチドは天然物また
は合成物でありうる。幾つかの場合には、ヌクレオチドは酸化またはメチル化されていて
もよい。ヌクレオチドには以下のものが含まれうる(それらに限定されるものではない)
:アデノシン一リン酸(アデノシンモノホスファート)(AMP)、アデノシン二リン酸
(ADP)、アデノシン三リン酸(ATP)、グアノシン一リン酸(GMP)、グアノシ
ン二リン酸(GDP)、グアノシン三リン酸(GTP)、チミジン一リン酸(UTP)、
ウリジン二リン酸(UDP)、ウリジン三リン酸(UTP)、シチジン一リン酸(CMP
)、シチジン二リン酸(CDP)、シチジン三リン酸(CTP)、5-メチルシチジン一
リン酸、5-メチルシチジン二リン酸、5-メチルシチジン三リン酸、5-ヒドロキシメ
チルシチジン一リン酸、5-ヒドロキシメチルシチジン二リン酸、5-ヒドロキシメチル
シチジン三リン酸、環状アデノシン一リン酸(cAMP)、環状グアノシン一リン酸(c
GMP)、デオキシアデノシン一リン酸(dAMP)、デオキシアデノシン二リン酸(d
ADP)、デオキシアデノシン三リン酸(dATP)、デオキシグアノシン一リン酸(d
GMP)、デオキシグアノシン二リン酸(dGDP)、デオキシグアノシン三リン酸(d
GTP)、デオキシチミジン一リン酸(DTMP)、デオキシチミジン二リン酸(dTD
P)、デオキシチミジン三リン酸(dTTP)、デオキシウリジン一リン酸(dUMP)
、デオキシウリジン二リン酸(dUDP)、デオキシウリジン三リン酸(dUTP)、デ
オキシシチジン一リン酸(dCMP)、デオキシシチジン二リン酸(dCDP)およびデ
オキシシチジン三リン酸(dCTP)、5-メチル-2’-デオキシシチジン一リン酸、
5-メチル-2’-デオキシシチジン二リン酸、5-メチル-2’-デオキシシチジン三
リン酸、5-ヒドロキシメチル-2’-デオキシシチジン一リン酸、5-ヒドロキシメチ
ル-2’-デオキシシチジン二リン酸および5-ヒドロキシメチル-2’-デオキシシチ
ジン三リン酸。
【0117】
合成またはスパイクイン核酸は、サンプルに添加される任意の分子を意味することが可
能であり、例えばカラム上で化学合成された分子には限定されない。幾つかの場合には、
合成またはスパイクイン核酸は、例えばPCR増幅、インビトロ転写、または鋳型に基づ
く他の複製により合成されうる。幾つかの場合には、合成またはスパイクイン核酸は、せ
ん断または断片化された核酸であり、あるいは、せん断または断片化された核酸を含む。
該せん断または断片化核酸はゲノム核酸、例えばヒトまたは病原体ゲノム核酸を含みうる
。幾つかの場合には、合成核酸はヒト核酸を含有しない。幾つかの場合には、合成核酸は
、天然で見出されうる核酸を含有しない。幾つかの場合には、合成核酸はサンプル核酸を
含有しない。
【0118】
スパイクインまたは合成核酸のグアニン-シトシン含量(GC含量)は様々でありうる
。幾つかの場合には、スパイクインまたは合成核酸のGC含量は少なくとも約0%、5%
、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%
、60%、65%、70%、75%、80%、85%、90%、95%または100%で
ありうる。幾つかの場合には、GC含量は多くとも約5%、10%、15%、20%、2
5%、30%、35%、40%、45%、50%、55%、60%、65%、70%、7
5%、80%、85%、90%、95%または100%でありうる。幾つかの場合には、
スパイクインまたは合成核酸のGC含量は約15%~約85%、例えば約20%~約80
%の範囲内でありうる。集合体内の合成核酸の種のGC含量は特定の標的核酸(例えば、
サンプルにおける病原体特異的または疾患特異的核酸の観察可能な範囲)のGC含量と厳
密に一致しうる。他の場合においては、合成核酸の集合体内の合成核酸の種のGC含量は
標的核酸のGC含量と厳密に一致し、またはそのようなGC含量に実質的に一致しうる。
例えば、合成核酸の種のGC含量は標的核酸のGC含量の75%~125%、標的核酸の
GC含量の80~120%、標的核酸のGC含量の85%~115%、標的核酸のGC含
量の90%~110%、標的核酸のGC含量の95%~105%、標的核酸のGC含有量
の96%~104%、標的核酸のGC含量の99%~101%、または標的核酸のGC含
有量の99.5%~100.5%の範囲内でありうる。
【0119】
スパイクイン核酸は、異なる分子、例えばビーズ、発蛍光団、ポリマーに結合され、連
結され、またはコンジュゲート化されうる。発蛍光団の例には、蛍光タンパク質、緑色蛍
光タンパク質(GFP)、Alexa色素、フルオレセイン、赤色蛍光タンパク質(RF
P)および黄色蛍光タンパク質(YFP)が含まれるが、これらに限定されるものではな
い。スパイクイン核酸はタンパク質(例えば、ヒストン、核酸結合タンパク質、DNA結
合タンパク質、RNA結合タンパク質)に結合されうる。他の場合においては、スパイク
イン核酸はタンパク質に結合されない。スパイクイン核酸は粒子で保護されうる(例えば
、ビリオン内の核酸に類似)。幾つかの場合には、スパイクイン核酸は粒子内に封入され
、または粒子に結合している。幾つかの場合には、粒子はタンパク質、脂質、金属、金属
酸化物、プラスチック、ポリマー、生体高分子、セラミックまたは複合材料を含む。
【0120】
スパイクイン核酸は、サンプルまたは宿主において潜在的に見出される配列とは異なる
配列を有しうる。幾つかの場合には、スパイクイン核酸配列は天然に存在する。幾つかの
場合には、スパイクイン核酸配列は天然に存在しない。幾つかの場合には、スパイクイン
核酸配列は宿主に由来する。幾つかの場合には、スパイクイン核酸配列は宿主に由来しな
い。幾つかの場合には、スパイクインまたは合成核酸は1以上の標的核酸(例えば、病原
体核酸、疾患特異的核酸)および/または1以上のサンプル核酸にハイブリダイズし得な
い(または相補的でない)。
【0121】
サンプルにおけるスパイクイン核酸の濃度は様々でありうる。スパイクインは、感度お
よびサンプル損失を決定するのに有用でありうる広範囲の濃度で添加されうる。幾つかの
場合には、10万、50万、100万、200万、300万、400万、500万、60
0万、700万、800万、900万、1000万、2000万、3000万、4000
万、5000万、6000万、7000万、8000万、9000万、1億、5億または
10億個の、各スパイクイン核酸の分子が、血漿またはサンプルの1mL当たりに添加さ
れる。幾つかの場合には、約1000万~約10億個の、各スパイクイン核酸の分子が、
血漿またはサンプルの1mL当たりに添加される。他の場合においては、合成核酸は、異
なる濃度でサンプルにスパイクイン(添加)される。
【0122】
サンプルに添加される種々のスパイクイン核酸の数は様々でありうる。複数のスパイク
イン核酸がサンプルまたは試薬に添加されうる。幾つかの場合には、少なくとも約1、2
、3、4、5、6、7、8、9または10個のスパイクイン核酸がサンプルまたは試薬に
添加される。幾つかの場合には、多くとも約1、2、3、4、5、6、7、8、9または
10個のスパイクイン核酸がサンプルまたは試薬に添加される。幾つかの場合には、サン
プルまたは試薬に添加されるスパイクイン核酸は、同じ長さである。幾つかの場合には、
サンプルまたは試薬に添加されるスパイクイン核酸は、異なる長さである。幾つかの場合
には、スパイクイン核酸は、配列番号1~120およびそれらの任意の組合せからなる群
から選択される。
【0123】
スパイクイン核酸のユニーク性(一意性)のレベルは様々でありうる。本質的に無制限
の数のスパイクイン(例えば、IDスパイク)が設計または使用されうる。
【0124】
スパイクイン核酸が添加されるプロセスにおける工程は様々でありうる。サンプルトラ
ッキングのためには、スパイクイン核酸の、より早期の添加がより良好であり、その後の
オペレータまたはシステムエラーの可能性を減少させうる。幾つかの場合には、サンプル
(例えば、血液)が最初に添加されるチューブは既にスパイクイン核酸を含有していても
よい。これらのチューブの製造は、診療所または研究検査施設におけるサンプルへのスパ
イクイン核酸の添加と比較して、より体系的に制御および試験されることが可能であり、
それにより、サンプルの混同の可能性が低減されうる。幾つかの場合には、IDスパイク
が全ての外部ラベル(「ホワイトラベル」)に取って代わりうる。
【0125】
幾つかの場合には、各配列リードが識別マーカーを含有するように、識別核酸マーカー
がサンプルにおける各核酸断片に加えられうる。この方法は初期のものと下流のものとの
交差汚染の識別を可能にするであろう。断片のタグ付けが十分に完了している場合、それ
は、バーコードがサンプル断片に加えられるとすぐに、サンプルの意図的な多重化をも可
能にしうるであろう。タグを組み込むための方法には、トランスポゾン、末端トランスフ
ェラーゼ、メチル化部位での切断、および脱メチル化部位での切断が含まれるが、これら
に限定されるものではない。
【0126】
プロセス品質管理または開発作業に関連する用途(これらに限定されるものではない)
を含む他の用途の場合、スパイクイン核酸は該プロセスにおける種々の工程で添加されう
る。例えば、RNA分析の場合には、異なる濃度、長さ、配列および/またはGC含量を
それぞれが有する複数のRNAスパイクインがサンプル調製の開始時に添加可能であり、
RNAがDNAに変換された後、DNAスパイクインが添加可能である。DNAライブラ
リーの場合には、種々の形態のDNAがライブラリー作製プロセスの種々の工程で添加さ
れうる。例えば、末端修復工程を試験するために、非平滑末端を有する、5’-リン酸を
有する又は有さない(+/- 5’-リン酸)、および3’-アデニン伸長を有する又は
有さない(+/- 3’-アデニン伸長)DNAスパイクインが使用されうる。アダプタ
ーを末端修復断片に連結する工程を試験するために、予め適合化された又はされていない
(+/- pre-adapted)スパイクインが使用されうる。配列決定qPCRは
個々の工程におけるサンプル損失を定量しうる。スパイクインのqPCRはまた、配列決
定前の最終的なライブラリー評価のための他のライブラリー定量法と併用されうる。
【0127】
「スパイクイン」、「スパイクイン合成核酸」、「スパイク」および「合成核酸」なる
語は本明細書においては互換的に用いられ、異なる解釈を文脈が示す場合を除き、そのよ
うなものとして解釈されるべきである。「IDスパイク」または「トレーサー」なる語は
、例えばサンプル識別トラッキング、交差汚染検出、試薬トラッキングまたは試薬ロット
トラッキングに使用されうる識別スパイクを意味するものとして本明細書において一般に
用いられる。「スパーク(Spark)」なる語は、存在量の正規化、開発および/また
は分析の目的ならびに他の目的で使用されうる、サイズまたは長さマーカーである核酸を
意味するものとして本明細書において一般に用いられる。「スパンク(Spank)」な
る語は、縮重プール、または多様な配列を有する核酸のプールを意味するものとして一般
に用いられ、しばしば、多様性評価および存在量の計算のために用いられうる。
【0128】
核酸の測定結果の一般的な正規化
本開示は、記載されている方法において使用される場合、サンプルにおける疾患特異的
核酸、病原体特異的核酸または他の標的核酸の量の効率的かつ改善された正規化を可能に
しうる合成核酸のセットを記載する。添加(spiked)核酸のセットは、長さにおい
て異なる核酸の幾つかの「種」を含有することが可能であり、その結果、添加核酸種の集
合体は全体として、測定される病原体核酸、疾患特異的核酸または他の標的核酸の長さの
観察可能な範囲にわたる。
【0129】
スパイクイン合成核酸は、多種多様な方法でサンプルを正規化するために使用されうる
。しばしば、正規化は、サンプルが由来する対象、分析前サンプル処理条件、核酸抽出の
方法、分子生物学的手段および方法による核酸操作、核酸精製の方法、測定自体の実施、
保存条件ならびに/または時間経過には無関係に、サンプル全体にわたりうる。
【0130】
幾つかの好ましい実施形態では、スパイクイン核酸は、疾患特異的核酸、病原体特異的
核酸または他の標的核酸を測定する全ての方法および全てのサンプルにわたって正規化し
うる。幾つかの場合には、スパイクインは、サンプルにおける病原体核酸(または疾患特
異的核酸または標的核酸)の、他の病原体核酸と比較した場合の相対的存在量を決定する
ために使用されうる。
【0131】
一般に、本発明で提供する方法は、合成核酸のセットの1以上をサンプル内に添加(ス
パイクイン)または導入することを含む。この添加工程は、プロセスの初期、中期または
終期を含む、該方法全体の任意の時点で行われうる。例えば、合成核酸は、対象からサン
プルが採取された時点またはその直後、サンプルの保存の前または途中、サンプルの輸送
の前、核酸抽出の前または途中、ライブラリー調製の前または途中、配列決定アッセイの
直前、あるいは該方法の任意の他の工程において導入されうる。幾つかの場合には、該方
法は、同じ方法により測定されうるが病原体特異的もしくは疾患特異的核酸または他のサ
ンプル核酸から容易に識別される既知量のユニーク核酸分子を該プロセスの初期に生物学
的サンプルに添加することを含みうる。幾つかの場合には、該プロセスの単一工程(例え
ば、サンプルを対象から採取したとき、分析を行うためにサンプルを得たとき、サンプル
保存中、核酸抽出の前または途中、ライブラリー調製の前または途中、あるいは配列決定
アッセイの直前)において合成核酸を生物学的サンプルに添加する。他の場合においては
、同じ又は異なるスパイクイン合成核酸を該プロセスにおける異なる工程において導入す
る。例えば、ユニーク合成核酸を該プロセスの初期(例えば、サンプル採取時)に導入す
ることが可能であり、異なるセットのユニーク核酸を、該プロセスの、より後の時点(例
えば、抽出、精製またはライブラリー調製の前または後)で導入することが可能である。
また、スパイクイン核酸の同一集合体または何らかの態様で異なる集合体を使用して、該
方法の異なる工程で添加工程を繰り返すことも可能である。
【0132】
一般に、既知濃度(または複数濃度)の合成核酸の種を各サンプルに添加することが可
能である。多くの場合においては、合成核酸の種を各種の等モル濃度で添加する。幾つか
の場合には、合成核酸種の濃度は異なる。
【0133】
サンプルが処理され、最終的に測定される場合、サンプルの取り扱い、調製および測定
の固有の偏りゆえに、核酸種の相対的存在量は変化しうる。測定後、添加核酸の各「種」
の測定存在量を最初の添加量と比較することにより、各長さの核酸の回収効率が決定され
うる。これは「長さに基づく回復プロファイル」を与えうる。
【0134】
「長さに基づく回復プロファイル」を用いて、最も近い長さの添加分子に対して、また
は種々の長さの添加分子にフィットされた関数に対して、疾患特異的核酸の存在量(また
は病原体核酸もしくは他の標的核酸の存在量)を正規化することにより、疾患特異的核酸
、病原体核酸または他の標的核酸の全て(または大部分または幾つか)の存在量を正規化
することが可能である。このプロセスは疾患特異的核酸に適用可能であり、サンプル添加
の時点の「全ての疾患特異的核酸の元の長さの分布」の推定をもたらしうる。同様に、こ
のプロセスは他の標的核酸、例えば病原体特異的核酸にも適用可能であり、サンプル添加
の時点の「全ての病原体特異的核酸の元の長さの分布」の推定をもたらしうる。「全ての
標的核酸の元の長さの分布」はサンプル添加の時点の標的核酸(例えば、疾患特異的核酸
、病原体特異的核酸)に関する長さの分布プロファイルを示しうる。完璧またはほぼ完璧
な存在量の正規化を達成するために添加核酸が再現(recapitulate)しよう
とするのは、この長さの分布である。
【0135】
特定のサンプルにおける疾患特異的核酸、病原体核酸または他の標的核酸の相対的存在
量プロファイルを厳密に再現する既知核酸の混合物をサンプルに添加することは可能でな
い可能性があるため(これは1つには、該サンプルが使い果たされた、または時間が相対
的存在量プロファイルを変化させた可能性があるからである)、スパイクインの各「種」
は「全ての疾患特異的核酸の元の長さの分布」におけるその相対的存在量に比例して加重
(weight)されうる。全ての「加重係数(weighting factor)」
の和は1.0に等しいことが可能である。
【0136】
正規化は単一工程または一連の工程を含みうる。幾つかの場合には、最も近いサイズの
添加核酸の存在量の生測定値を用いて、病原体特異的核酸(または病原体核酸もしくは他
の標的核酸)の存在量を正規化して、「正規化疾患特異的核酸(または病原体核酸もしく
は他の標的核酸)存在量」を得ることが可能である。ついで「正規化疾患特異的核酸存在
量」(または病原体核酸もしくは他の標的核酸存在量)に「加重係数」を掛け算して、そ
の長さの回収の相対的重要性に関して補正して、「加重正規化疾患特異的(または病原体
特異的もしくは他の標的)核酸存在量」を得ることが可能である。この正規化方法の利点
の1つは、それが、疾患特異的核酸の存在量を測定する全て(またはほとんど)の方法に
わたって、方法には無関係に、標的核酸(例えば、疾患特異的核酸、病原体核酸)の存在
量の同等の測定を可能にすることであろう。
【0137】
標的核酸存在量または相対的存在量の測定は、検出、予測、モニターおよび診断アッセ
イに特に有用でありうる。そのようなアッセイは、病原体の存在を検出するために、また
は病態を特定するために、生物学的サンプル(例えば、血漿)における標的核酸(例えば
、疾患特異的核酸)の量を測定することを含みうる。本明細書に記載されている方法は、
これらの測定を、サンプル、測定時間、核酸抽出方法、核酸操作方法、核酸測定方法およ
び/または種々のサンプル処理条件の全体にわたって同等にしうる。
【0138】
添加分子の厳密な配列、「種」の厳密な数、「種」の長さの範囲、添加分子の濃度、各
分子の相対量、各添加分子の実際の量、分子が添加される段階は、サンプルに基づいて最
適化または調整されうる。長さはGC含量、核酸構造、DNA損傷またはDNA修飾状態
で置換または分析されうる。
【0139】
幾つかの場合には、本発明で提供する方法は、(幾つかの方法における幾つかの短いラ
ンダム化部分を除き)大部分が固定された配列組成をしばしば伴う、核酸の単一の長さを
含む添加核酸の使用を含みうる。この方法は、疾患特異的核酸、病原体特異的核酸または
他の標的核酸が添加核酸とほぼ同じ長さのものである場合に、良好に機能しうる。
【0140】
単一の長さの核酸は単独で使用可能であり、あるいは該方法は、複数の長さの核酸の使
用を伴う別の方法と組合されうる。例えば、サンプルが得られた際または核酸の抽出の前
に、複数の長さの核酸のプールをサンプルに添加することが可能であり、単一の長さの核
酸のプールを該プロセスにおける異なる時点で(例えば、核酸の抽出の後およびライブラ
リー調製の前に)サンプルに添加することが可能である。単一の長さおよび/または複数
の長さの核酸を使用する場合、疾患特異的核酸、病原体核酸または他の標的核酸の量を、
該方法の終了時の測定された添加核酸の量に対して正規化することが可能である。
【0141】
多くの場合、本明細書に記載されているとおり、複数の長さを有する合成核酸の使用は
、単一の長さの合成核酸の使用を含む方法より好ましいかもしれない。本発明で提供する
核酸は、標的核酸が複数の長さを有する場合に特に有用である。例えば、疾患特異的(ま
たは病原体特異的)核酸は長さにおいて広範に変動しうる。したがって、疾患特異的核酸
の観察可能な長さにわたるスパイクイン核酸の使用が特に役立ちうる。更に、測定された
疾患特異的核酸の長さは、それが由来する個体の代謝、分析前的サンプル処理条件、核酸
抽出の方法、分子生物学手段および方法による核酸操作、核酸精製の方法、測定自体の実
施、保存条件および時間経過を含む多数の要因によっても劇的な影響を受けうる。これら
の要因は、異なる長さの核酸に対して差動的な影響を及ぼし、したがって、単一の添加核
酸は、混合した長さの核酸に関して行われるプロセスの全体的な効率を適切に反映しない
可能性がある。
【0142】
「体積当たりのゲノムコピー数」の計算
本発明で提供する方法および合成核酸は、次世代シーケンシングの結果からサンプルに
おける微生物または病原体の体積当たりのゲノムコピー数を決定することを含む或る計算
を助けるために使用されうる。一般に、体積当たりのゲノムコピー数は流体(例えば、血
漿、尿、バッファーなど)1ml当たりの標的核酸(例えば、特定の病原体に由来する標
的核酸)の量の絶対的尺度を示すことが可能であり、個々の病原体の存在量または相対的
存在量を示すための表現としてしばしば用いられうる。病原体の存在量のリード(rea
d;読取り)の総数および/または大きさはサンプルごとに異なりうる。感染の生物学的
レベルに対応し、サンプルとサンプルとの比較に有用でありうる値を報告することが望ま
しいことがある。
【0143】
特定の例においては、該方法は、サンプル(特に、病原体に感染している又は病原体に
感染していると疑われる対象から得られたサンプル)における病原体核酸の体積当たりの
ゲノムコピー数を決定するために使用されうる。体積当たりのゲノムコピー数は、統計的
枠組みを使用して決定または推定されうる。該統計的枠組みは、サンプルからの配列決定
結果における非ヒトリード(例えば、病原体リード)の集合体(コレクション)を与える
1以上のゲノムの相対的存在量を推定するために使用されうる。
【0144】
本発明で提供するスパイクイン合成核酸を使用して、サンプルにおける1以上の病原体
/生物の「体積当たりのゲノムコピー数」の推定値が計算されうる。一般に、種々の長さ
の核酸が既知濃度でサンプルに添加されうる。幾つかの場合には、配列データにおいて実
際に観察されるサンプルからの情報の割合が、(例えば、観察されたリード数を、添加核
酸に関連するリード数と比較することにより、または観察されたリード数を添加リード数
で割り算することにより)各スパイクイン長に関して観察されうる。各長さにおける非宿
主または病原体分子の元の数を逆算することも可能である(例えば、各長さにおけるスパ
イクインリードの数から部分的に推測される)。各病原体のゲノムの長さが知られている
場合、このロード(load)は「体積当たりのゲノムコピー数」の尺度に変換されうる
【0145】
多くの場合、体積当たりのゲノムコピーを検出するための方法(および本発明で提供す
る他の方法)は低品質のリードの除去または隔離を含みうる。低品質のリードの除去は、
本発明で提供する方法の精度および信頼性を改善しうる。幾つかの場合には、該方法は、
マッピング不可能なリード、PCRデュープリケート(duplicate)から得られ
たリード、低品質リード、アダプター二量体リード、配列決定アダプターリード、非ユニ
ークマップ化リードおよび/または情報価値のない配列に位置するリードの(任意の組合
せでの)除去または隔離を含みうる。
【0146】
幾つかの場合には、配列リードは参照ゲノムに対してマッピングされ、そのような参照
ゲノムにマッピングされていないリードが1以上の標的または病原体ゲノムにマッピング
される。幾つかの例においては、リードはヒト参照ゲノム(例えば、hg19)にマッピ
ングされ、一方、残りのリードはウイルス、細菌、真菌および他の真核生物病原体(例え
ば、真菌、原虫、寄生生物)のキュレート参照データベースに対してマッピングされる。
【0147】
幾つかの特定の例においては、該方法は、DNA抽出(例えば、無細胞DNA抽出、無
細胞RNA抽出)の前またはアッセイの異なる段階(例えば、抽出後、ライブラリー調製
前、配列決定前、サンプルの保存中)において、既知濃度の合成核酸(例えば、DNA)
をサンプル(例えば、血漿サンプル)に添加することを含みうる。合成核酸は陰性および
/または陽性対照サンプルにも添加されうる。幾つかの場合には、対照サンプルはサンプ
ルと並行して処理されうる。該方法は更に、サンプル(例えば、血漿サンプル、陽性対照
、陰性対照)のための配列決定ライブラリーを製造することを含みうる。該ライブラリー
は、当技術分野で公知の配列決定装置、特に、次世代シーケンシングの性能を有する装置
において多重化され、配列決定されうる。該方法は更に、低品質のリードを破棄すること
、およびヒト参照配列(例えば、hg19)に対するアライメントによりヒトリードを除
去することを含みうる。ついで、残りのリードは病原体配列のデータベースにアライメン
トされうる。幾つかの場合には、関心のある標的配列(例えば、病原体配列)に対応する
リードはNGSリードセットから定量される。この情報から、標的核酸(例えば、病原体
核酸)の相対的存在量が体積当たりのゲノムコピー数として表されうる。体積当たりのゲ
ノムコピー数は、例えば、サンプル(例えば、血漿)に添加された既知量のオリゴヌクレ
オチドに対して正規化された各生物(例えば、病原体)に関する存在配列の数を決定する
ことにより決定されうる。体積当たりのゲノム数の計算は個々の病原体ゲノムの相対的長
さをも考慮しうる。幾つかの場合には、体積当たりのゲノムコピー数は、各生物(例えば
、病原体)に関する存在配列の数を定量し、サンプルに添加された既知量の合成核酸に対
して正規化することにより決定可能であり、ここで、病原体配列の正規化は、長さにおい
て病原体配列に最も近い合成核酸を考慮する。同様に、正規化は、種々の長さ(例えば、
2、3、4、5、6、10、15、20個またはそれ以上の異なる長さ)のスパイクイン
合成核酸の集合体の使用を含むことが可能であり、ここで、病原体核酸は、スパイクイン
の集合体内の、長さにおいて最も近いそれぞれのスパイクイン核酸に対して正規化される
【0148】
サンプルの追跡(トラッキング)および/または分析のためのスパイクイン
分子をサンプルに添加して、ユニーク(unique;一意の、特有の)識別子および
トレーサーを得ることが可能である。これらの分子はサンプルの一部となることが可能で
あり、適切な測定装置により読取られうる(レーザースキャナーにより読取られるサンプ
ルチューブの外表面上の1Dまたは2Dバーコードに類似した概念)。光学的、放射性お
よび他のトレーサーが可能であるが、核酸サンプルの分析のためには、核酸トレーサーが
最適な選択肢でありうる。なぜなら、スパイクインが何であるかが、サンプルの核酸を評
価する同じプロセス(例えば、DNAまたはRNA配列決定)において示されうるからで
ある。
【0149】
外部由来の核酸には、オリゴヌクレオチド、二本鎖オリゴヌクレオチド、より長い合体
(assembled)二本鎖DNA(例えば、Integrated DNA Tec
hnologiesのgBlocks)、プラスミド、PCR産物、インビトロ合成転写
産物、ウイルス粒子、および断片化または非断片化ゲノムDNA(これらに限定されるも
のではない)が含まれ、それらはサンプル、例えば対象からの体液に添加されうる。スパ
イクインを使用する利点には、核酸配列、長さ、多様性および濃度がサンプルまたは用途
に適合化されうることが含まれるが、これに限定されるものではない。
【0150】
用途には以下のものが含まれるが、それらに限定されるものではない:サンプルの追跡
(トラッキング)[例えば、通常のラベルバーコードに加えて、または潜在的にその代わ
りに、IDスパイク(Spike)が使用されうる]、サンプル交差汚染(例えば、サン
プルのいずれにおいてもIDスパイクが天然で見出されない場合、およびサンプルによっ
て異なるIDスパイクがサンプルに添加される場合には、サンプルの混合が判定されうる
)、試薬の追跡[例えば、IDスパイクは試薬にも添加されうる。例えば、各試薬ロット
は、それが使用される各サンプルに関して追跡可能であり、エラーのより少ない試薬追跡
分子実験室情報管理システム(LIMS)がもたらされうる]、品質管理または開発作業
[例えば、ライブラリーの複雑性(例えば、PCRデュープリケート(duplicat
e))、サンプル損失または感度をモニターするために、異なるスパイクインがサンプル
処理プロセスにおける種々の時点で添加されうる]、正規化または収率[例えば、既知入
力をスパイクインの測定出力と比較することは、(例えばサンプルにおける)未知入力の
、その測定出力による推測を可能にしうる。これらの測定および計算から、例えばサンプ
ルの病原体量が判明しうる]、および核酸濃度の増加(例えば、バーコードが核酸である
場合、それは、限定的である核酸濃度を有するサンプルに関して高濃度で使用可能であり
、このことはサンプルの回収を改善しうる)。
【0151】
幾つかの好ましい実施形態においては、スパイクインは、関心のある特定の核酸配列が
、それが観察されたサンプルに由来する可能性、または観察されたサンプルにおけるその
存在が、異なるサンプルからの交差汚染もしくは持ち越し汚染の結果でありうるかどうか
を推定するために使用されうる。ユニークスパイクイン分子を、特定の病原体からの分子
(または関心のある他の配列クラス)から合理的に予想される濃度より高い濃度で各サン
プル内に導入することにより、交差汚染または持ち越し汚染によって偶然に導入されたい
ずれかの病原体配列(または関心のある他の配列クラス)が、該汚染または持ち越し汚染
配列の起源からの、より一層多数のスパイクイン分子を伴う可能性が高い。したがって、
交差汚染または持ち越し汚染スパイクイン分子数に対する病原体配列数(または他のクラ
スの配列)の比率を用いて、サンプル間の交差汚染または持ち越し汚染の結果でありうる
任意の病原体配列を特定することが可能である。幾つかの場合には、交差汚染または持ち
越し汚染スパイクイン分子の非存在、または閾値レベル未満のレベルでのその存在を利用
して、サンプルが汚染されていないことを示す。
【0152】
幾つかの用途には、サンプルが由来する対象の遺伝子型を、特にサンプル追跡のために
使用することが可能である。幾つかの場合には、遺伝子型は分析操作中に決定可能であり
、あるいはアリコートを取り出し、別個の遺伝子型決定法を行うことにより決定可能であ
る。幾つかの場合には、サンプルの遺伝子型は既に知られている。対象のDNAの配列決
定出力を、独立して得られた遺伝子型と比較することが可能である。遺伝子型を使用する
利点は、それが既にサンプルの一部であり、サンプルに固有のものであることである。典
型的な直交性(orthogonal)遺伝子型決定法は、ショート・タンデム・リピー
ト(STR)分析である。例えば、ATCCの試験サービスを参照されたい。
【0153】
幾つかの場合には、表現型の特徴がサンプルの特定を助けうる。例えば、対象の眼の色
、血液型、性別、人種および他の形質が遺伝子型の手がかりをもたらしうるであろう。
【0154】
IDスパイク
ユニークサンプル識別子は完全にスクランブルされることが可能であり(例えば、DN
AではA、C、GおよびTのランダム化、またはRNAではA、C、GおよびUのランダ
ム化)、あるいはそれらは共通配列の幾つかの領域を有することが可能である。例えば、
各末端の共有領域は連結事象における配列の偏りを減少させうる。幾つかの場合には、共
有領域は少なくとも約1、2、3、4、5、6、7、8、9、10、15または20個の
共通塩基対である。幾つかの場合には、共有領域は多くとも約1、2、3、4、5、6、
7、8、9、10、15または20個の共通塩基対である。典型的な配列は、表1を参照
されたい。
【0155】
IDスパイクの組合せは、膨大な数のIDスパイクを使用しなくても多様性を増大させ
るために添加されうる。IDスパイクはマイクロタイタープレートにおけるウェル位置に
関する識別子として使用可能であり(例えば、96ウェルプレートの場合には96個の異
なるIDスパイク)、別のIDスパイクはプレート番号に関する識別子として使用可能で
あり(例えば、24個の異なるプレートの場合には24個の異なるIDスパイク)、僅か
96+24=120の配列を使用して、96×24=2,304の組合せが得られる。サ
ンプル当たり3個以上のIDスパイクの使用は、達成可能な多様性を、より一層劇的に増
大させうる。
【表1】
【0156】
スパーク(Spark)バイアス制御スパイクイン
複数の長さにわたる核酸配列のセット(「スパーク(Spark)」)はサイズマーカ
ーとして働きうる。これらの配列はサンプル核酸と共にサンプルに添加され、処理(例え
ば、抽出、精製、配列決定)されうる。あるプロセスは、異なる長さの核酸に差動的に影
響を及ぼしうる。例えば、シリカ膜カラムを使用する核酸精製は、より長い長さの配列に
対して偏向することが可能であり、または特定の長さの配列を保持するように最適化され
うる。核酸配列決定は、典型的には、サンプルから核酸が抽出された後に行われるため、
配列決定結果における長さの出現率または分布は元のサンプルを代表するものではない可
能性がある。既知の量および長さのスパーク配列を添加することにより、種々の長さのサ
ンプル核酸に対する処理および配列決定の効果をモニターし、定量化することが可能であ
る。また、サンプル核酸およびスパークサイズセット(Spark size set)
核酸に関する配列決定リードの最終的な数を測定し、元のサンプルに添加された既知量の
スパークサイズセット核酸に対して正規化することにより、元のサンプルにおける種々の
長さのサンプル核酸の相対および/または絶対量を推定することが可能である。
【0157】
幾つかの場合には、スパークサイズセットは、少なくとも約3、4、5、6、7、8、
9、10、11、12、13、14、15、20、25、30、35、40、45、50
、100、200、250、300、350、400、500、600、700、800
、1000個またはそれ以上の核酸を含みうる。幾つかの場合には、スパークサイズセッ
トは、多くとも約3、4、5、6、7、8、9、10、11、12、13、14、15、
20、25、30、35、40、45、50、100または200個の核酸を含みうる。
幾つかの場合には、スパークサイズセットは約3~約50個の核酸、例えば約3~約30
個の核酸を含む。幾つかの場合には、スパークサイズセットにおける核酸は、1以上の異
なる特性、例えば、異なる長さ、異なるGC含量および/または異なる配列を有する。
【0158】
スパーク核酸は、長さ識別配列、ロード(load)配列、合成核酸識別配列(それは
、この場合、スパーク識別配列であろう)および特徴ドメインを含む、本明細書に記載さ
れている合成スパイクイン核酸の特徴のいずれかを含みうる。幾つかの場合には、スパー
クサイズセットにおける核酸は、固定されたフォワード配列および/または固定されたリ
バース配列を含有する。固定されたフォワード配列および/または固定されたリバース配
列はスパークサイズセットにおける全ての核酸に共通であることが可能であり、配列をス
パークとして識別しうる。幾つかの場合には、固定されたフォワード配列および/または
固定されたリバース配列は、少なくとも約5、10、11、12、13、14、15、1
6、17、18、19、20、25、30、32、40、50、60、70、80、90
または100塩基対長である。幾つかの場合には、固定されたフォワード配列および/ま
たは固定されたリバース配列は、多くとも約5、10、11、12、13、14、15、
16、17、18、19、20、25、30、32、40、50、60、70、80、9
0または100塩基対長である。幾つかの場合には、固定されたフォワード配列および/
または固定されたリバース配列は、約8bp~約50bp、例えば、約8bp~約20b
p、または約16bp~約40bpの範囲内である。幾つかの場合には、スパーク識別配
列はサンプルにおいて見出されず、または天然で存在しない。幾つかの場合には、固定さ
れたフォワード配列は、固定されたリバース配列とは異なる。
【0159】
幾つかの場合には、スパークサイズセットにおける核酸はユニークフォワード配列およ
び/またはユニークリバース配列を含有する。ユニークフォワード配列および/またはユ
ニークリバース配列は該サイズセットにおけるスパークをお互いから識別しうる。幾つか
の場合には、ユニークフォワード配列および/またはユニークリバース配列は、少なくと
も約0、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、
16、17、18、19、20、25、30、32、40、50、60、70、80、9
0または100塩基対長である。幾つかの場合には、ユニークフォワード配列および/ま
たはユニークリバース配列は、多くとも約1、2、3、4、5、6、7、8、9、10、
11、12、13、14、15、16、17、18、19、20、25、30、32、4
0、50、60、70、80、90、100、200、300、306、400または5
00塩基対長である。幾つかの場合には、ユニークフォワード配列および/またはユニー
クリバース配列は約4~約10塩基対長の範囲内である。幾つかの場合には、スパークサ
イズセットにおける各核酸は、異なるユニークフォワード配列および/またはユニークリ
バース配列を有する。幾つかの場合には、スパークサイズセットにおける各核酸は、同じ
長さを有するユニークフォワード配列および/またはユニークリバース配列を有する。幾
つかの場合には、スパークサイズセットにおける各核酸は、異なる長さを有するユニーク
フォワード配列および/またはユニークリバース配列を有する。
【0160】
幾つかの場合には、スパークサイズセットにおける核酸は充填(filler)配列を
含有する。幾つかの場合には、充填配列はサイズセットにおけるスパークをお互いから識
別しうる。幾つかの場合には、充填配列は、少なくとも約0、1、2、3、4、5、6、
7、8、9、10、11、12、13、14、15、16、17、18、19、20、2
5、30、32、40、50、60、70、80、90または100塩基対長である。幾
つかの場合には、充填配列は、多くとも約1、2、3、4、5、6、7、8、9、10、
11、12、13、14、15、16、17、18、19、20、25、30、32、4
0、50、60、70、80、90、100、200、300、306、400または5
00塩基対長である。幾つかの場合には、充填配列は0~約350bpの範囲内である。
幾つかの場合には、スパークサイズセットにおける各核酸は、異なる長さを有する充填配
列を有する。幾つかの場合には、充填配列の長さは、0、8、31、56、81、106
、131および306bpからなる群から選択される。
【0161】
幾つかの場合には、スパークサイズセットにおける核酸は、少なくとも約10、20、
30、32、40、50、60、70、80、90または100塩基対長である。幾つか
の場合には、スパークサイズセットにおける核酸は、多くとも約100、200、300
、350、400、500、600、700、800、900または1,000塩基対長
である。幾つかの場合には、スパークサイズセットにおける核酸は約20~約500塩基
対長の範囲内、約20~約400塩基対長の範囲内、または約20~約200塩基対長の
範囲内である。
【0162】
例えば、以下の特徴を有する8個の二重鎖DNA配列(表2、図4における配列番号1
11~118)のセットが設計されうる:32~350bpサイズ範囲(例えば、それぞ
れ0、8、31、56、81、106、131および306bpの充填配列長を有する3
2、52、75、100、125、150、175および350bpの断片)、固定され
た16bpのフォワード配列、フォワード配列とは異なる固定された16bpのリバース
配列、ならびにユニーク6bpフォワードおよびリバース配列。
【表2】
【0163】
GC含量スパイクインパネル
既知濃度でサンプルに添加され、ついで、処理後に測定された核酸(例えば、DNA)
は、収率およびプロセスに関する他の情報をもたらすことが可能であり、これらは、収率
およびサンプル自体に関する追加的特性を推定するために使用されうる。例えば、あるサ
イズ範囲を含む核酸スパイクインセットはサンプル(例えば、血漿)に添加され、ついで
抽出およびそれに続いて次世代シーケンシング(NGS)に付されうる。各サイズスパイ
クの収率は、意図的なサイズ選択、温度および他の変性要因ならびにPCRバイアスを含
む、処理中の多数の要因に応じて変動しうる。この情報は、所望のサイズ範囲の回収を最
大にすることを目的とした新規方法を開発するために、または既存プロセスをモニターす
る(例えば、品質管理)ために有用でありうる。
【0164】
二本鎖DNAライブラリー調製物の場合、比較的低い融解温度(T)のDNA二重鎖
の変性は、Tに反比例して、これらの二本鎖の収率を低下させる。与えられた条件(例
えば、塩濃度、温度、pHなど)において、二重鎖のTに影響を及ぼす寄与因子には、
長さおよびGC含量が含まれる。単一GC含量を有する単一種で各サイズが代表される、
二重鎖のサイズ範囲は、種々の条件に対するTの応答に関する部分的な情報のみを提供
しうる。
【0165】
核酸の長さおよび/またはGC含量が核酸のTおよび処理にどのように影響を及ぼす
かに関する情報は、例えば、血中の種々の病原体からの短い無細胞断片の回収を推測する
ための代用物としてスパイクインを使用する場合に重要でありうる。病原体核酸はそれら
のGC含量において劇的に変動する可能性があり、したがって、短い断片長において非常
に様々なTを有しうる。多数のcfDNA断片の短い長さ(例えば、30、40、50
bp)を考慮すると、それらは、例えばNGSのための処理中の変性に感受性でありうる
。広範なT範囲にわたって回収を追跡するための、より詳細なスパイクインセットは、
未知サンプルの出発量のより良好な推測を可能にしうる。
【0166】
ある範囲のT、GCおよび/または長さにわたるスパイクイン核酸のパネルは、絶対
的存在量の決定のために、および/または変性の詳細なモニターを可能にするために使用
されうる。例えば、表3に示されているとおり、4つの異なる長さ(例えば、32、42
、52および75bp)および各長さについて7つの異なるGC含量(約20、30、4
0、50、60、70または80%のGC)を有する核酸を含む28個の異なる核酸(例
えば、二重鎖)のパネルが使用されうる。全体として、該パネルは、各サイズごとに単一
のGC含量を有するセットより高い細分性をもたらしうる。幾つかの場合には、合成核酸
(dsDNA、ssDNA、dsRNA、ssRNA)のパネルは、少なくとも3個の異
なる長さ、および各長さについて少なくとも2個の異なるGC含量、少なくとも3個のG
C含量、少なくとも4個のGC少なくとも5個のGC含量、少なくとも7個のGC含量ま
たは少なくとも10個のGC含量の核酸を含有しうる。幾つかの場合には、合成核酸(d
sDNA、ssDNA、dsRNA、ssRNA)のパネルは、少なくとも5個の異なる
長さ、および各長さについて少なくとも2個の異なるGC含量、少なくとも3個のGC含
量、少なくとも4個のGC少なくとも5個のGC含量、少なくとも7個のGC含量または
少なくとも10個のGC含量の核酸を含有しうる。
【0167】
幾つかの場合には、スパイクインパネルは、少なくとも3、5、10、15、20、2
5または30個のユニーク核酸を含む。幾つかの場合には、スパイクインパネルは、多く
とも15、20、25、30、35、40、45、50または100個のユニーク核酸を
含む。
【0168】
種々のGC含量を有するスパイクイン核酸が使用されうる。幾つかの場合には、スパイ
クインパネルは、約40~60%のGC、約45~65%のGC、約30~70%のGC
、約25~75%のGC、または約20~80%のGCの範囲にわたるGC含有量を有す
る核酸を含む。幾つかの場合には、スパイクインパネルは、少なくとも2、3、4、5、
6、7、8、9または10個の異なるGC含量を有する核酸を含む。幾つかの場合には、
スパイクインパネルは、多くとも3、4、5、6、7、8、9、10、15または20個
の異なるGC含量を有する核酸を含む。幾つかの場合には、スパイクインパネルは、GC
が少なくとも1、2、3、4、5、6、7、8、9、10、15または20%異なる種々
のGC含有量を有する核酸を含む。GCの百分率は、GヌクレオチドおよびCヌクレオチ
ドの数の和を配列内の総ヌクレオチド数で割り算することにより算出されうる。例えば、
配列ACTGの場合、GCの百分率(% GC)は(1+1)/4=50% GCとして
算出されるであろう。
【0169】
種々の長さを有するスパイクイン核酸が使用されうる。幾つかの場合には、スパイクイ
ンパネルは、少なくとも3、4、5、6、7、8、9、10または15個の異なる長さを
有する核酸を含む。幾つかの場合には、スパイクインパネルは、多くとも3、4、5、6
、7、8、9、10、15、20、25、50または100個の異なる長さを有する核酸
を含む。幾つかの場合には、スパイクインパネルは、約40~50bp、約35~55b
p、約30~60bp、約35~60bp、約35~65bp、約35~70bp、約3
5~75bp、約30~70bp、約30~80bp、約30~90bp、約30~10
0bp、約25~150bp、約20~300bp、または約20~500bpの範囲に
わたる長さを有する核酸を含む。幾つかの場合には、スパイクインパネルは、少なくとも
1、2、3、4、5、6、7、8、9、10、15または20bp異なる種々の長さを有
する核酸を含む。幾つかの場合には、スパイクインパネルは、32、42、52および7
5bpの長さ、または27、37、47、57、62および67bpの長さを有する核酸
を含む。
【0170】
一連の値から選択された長さおよびGC含量を有するスパイクイン核酸が使用されうる
。例えば、合成核酸のセットは2以上の長さおよび2以上のGC含量から選択されうる。
表3における28個の合成核酸のセット(配列番号125~配列番号152)は4つの異
なる長さ(例えば、32、42、52および75塩基対)および7つの異なるGC含量(
例えば、約20、30、40、50、60、70および80% GC)から構成される。
異なる長さ(例えば、27、37、47、57、62および67bp)および異なるGC
含量(例えば、約15、25、35、45、55、65および75% GC)を用いて、
合成核酸の類似セットが得られうる。
【0171】
種々の融解温度(T)を有するスパイクイン核酸が使用されうる。幾つかの場合には
、スパイクインパネルは、約40~50℃、約35~55℃、約30~60℃、約35~
60℃、約35~65℃、約35~70℃、約35~75℃、または約30~70℃の範
囲にわたる融解温度(T)を有する核酸を含む。幾つかの場合には、幾つかの場合には
、スパイクインパネルは、少なくとも1、2、3、4、5、6、7、8、9、10、15
、20、25または30℃異なる種々の融解温度(T)を有する核酸を含む。
【0172】
幾つかの場合には、Tは、二本鎖の長さおよびGC含量に加えて、二本鎖濃度、ヌク
レオチド配列の最近傍効果、高次DNA構造、1価および/または2価カチオン濃度なら
びにヌクレオチド濃度に基づいて計算されうる。幾つかの場合には、Tは、与えられた
条件、例えば、二本鎖DNA特異的色素および温度の漸増および色素シグナルの検出に関
して、実験的に計算されうる。
【0173】
種々の配列を有するスパイクイン核酸が使用されうる。好ましくは、非天然もしくは非
自然配列、またはサンプル核酸にハイブリダイズし得ない配列が使用される。幾つかの場
合には、スパイクインパネルは、少なくとも3、4、5、6、7、8、9、10または1
5個の異なる配列を有する核酸を含む。幾つかの場合には、スパイクインパネルは、多く
とも3、4、5、6、7、8、9、10、15、20、25、50または100個の異な
る配列を有する核酸を含む。
【0174】
種々の数のスパイクイン核酸が使用されうる。幾つかの場合には、約1、2、3、4、
5、6、7、8、9、10、15、20、25、30、40または50個の核酸が使用さ
れる。例えば、表3に列挙された28個の配列のサブセット(例えば、32/42/52
/75bp×20/50/80 %GC)が使用されうる。
【0175】
RNAの用途には、RNAパネルが使用されうる。本明細書に記載されているとおり、
RNAパネルは、同一分子、あるいは長さ、GC含量および/または他の特性に関して異
なる多様な分子を含みうる。
【0176】
8個のDNA配列のセット(それぞれ約50%GCである、表2における配列番号11
1~118)は、表3に列挙された28個のメンバーのGCパネルの部分的な適用範囲(
カバレッジ)をもたらす。
【表3】
【0177】
縮重スパイクイン:スパンク(Spank)
スパイクイン合成核酸は、核酸の縮重プール、または高い多様度を有する核酸のプール
でありうる(本明細書においては「スパンク(Spank)」と称されることもある)。
一般に、スパンクは、配列決定反応につながるおよび/または配列決定反応を含むサンプ
ル処理工程中に生じうる絶対的もしくは相対的な核酸損失または多様性減少を決定するた
めに使用されうる。スパンク配列のユニークプールの場合、プール内の配列多様性の減少
は核酸存在量の減少に直接対応するはずであり、この場合、増幅またはPCRバイアスの
影響を考慮する必要はない。例えば、10個のユニークスパンク配列をサンプルに添加
し、配列決定後に10個のユニークスパンク配列しか回収されなかった場合、核酸の存
在量および核酸の多様性は共に、10分の1に減少したことになる。幾つかの場合には
、スパンクは、重複分子の回収の度合を決定するために使用されうる。例えば、抽出およ
びライブラリー処理(これは種々の投入分子のPCRおよび潜在的不均一増幅を含みうる
)の後、個々のスパンクの配列決定およびアライメントは重複分子の回収の度合を示しう
る。
【0178】
ついで、決定された多様性減少を用いて、1以上のサンプル処理または配列決定工程の
前に、初期サンプルにおける核酸(例えば、標的核酸)の絶対的存在量を決定することが
可能である。幾つかの場合には、決定された多様性減少を用いて、初期サンプルにおける
核酸の相対的存在量を決定する。図5に示されているとおり、サンプル核酸(S、S
、...、S)は、1以上のサンプル処理工程の前に、スパンク(Spank)スパイ
クイン合成核酸(SP、SP、...、SP)と一緒にされうる。例えば、約10
個のユニークスパンクがサンプルに添加されうる。サンプル処理(例えば、核酸抽出、
精製、連結および/または末端修復)中に、サンプル核酸の一部および合成核酸の一部が
失われうる。サンプル処理後、最初の10個のユニーク配列のうちの約10個のユニ
ーク配列が残存しうる。ついで、これらの配列の一部、例えば10個のユニーク配列が
配列決定されうる。絶対的多様性減少は、最初のユニーク配列の数を配列決定または回収
されたユニーク配列の数で割り算したものとして算出されうる(例えば、10/10
=10)。同様に、回復値は、配列決定または回収されたユニーク配列の数を最初のユ
ニーク配列の数で割り算したものとして算出されうる(例えば、10/10=10
)。算出された多様性減少は、初期サンプルにおける核酸の絶対的存在量を決定するた
めに用いられうる。例えば、スパンク配列に関する及びサンプル配列に関する配列決定リ
ード数は配列決定分析から決定可能であり、サンプルに添加されるスパンク配列の初期濃
度または量は既知である。決定された多様性減少を用いて、初期サンプルにおける核酸(
例えば、特定の生物、病原体、腫瘍または器官からの核酸)の初期濃度または量が決定さ
れうる。元のサンプルにおけるサンプル核酸の絶対量は、サンプル核酸およびスパンク核
酸に関する配列決定リードの最終的な数ならびに/またはスパンク核酸の最終的な多様性
を測定し、元のサンプルに添加されたスパンク核酸の既知量または多様性に対して正規化
することにより推定されうる。
【0179】
ユニーク配列リードの数は種々の方法により決定されうる。例えば、識別タグを有する
配列リードが特定(識別)されうる。ついで、識別タグを有する配列リード内のユニーク
配列の数は、重複配列を重複排除(de-duplicate)(「デデュープ(ded
upe)」)または除去することにより決定されうる。例えば、それらの配列を、可能な
配列の参照データベースに対して又はお互いに対してアライメントさせて、どれが重複し
ているのか、およびどれがユニークである又は異なるのかを決定することが可能である。
識別タグは典型的には配列間で保存されているため、各添加分子内に埋め込まれたランダ
ム化配列領域が分析されうる。幾つかの場合には、スパンク核酸は識別タグを含まず、そ
のような場合には、スパンクは、例えば、既知配列を含むデータベースに対する参照また
はアライメントのような他の方法により特定されうる。
【0180】
スパンク配列は、相対的損失および/または絶対的損失をモニターするために使用され
うる。幾つかの場合には、スパンク配列の多様性が十分に高い場合には、サンプルに添加
されるスパンク配列は実質的に全て非ユニークであると仮定されうる。したがって、配列
決定された重複スパンク配列が存在する場合、それはPCR増幅によるものであり、サン
プルに添加された同じスパンク配列の複数コピーによるものではない可能性が高く、分析
から除外されうる。また、各スパンク配列がユニークである場合、サンプルに最初に添加
されたスパンク配列の総数は、サンプルに添加された核酸の濃度および体積に基づいて既
知であり、配列決定後のユニークスパンク配列決定リードの総数は既知である。これらの
値を一緒に使用して、多様性減少値または回収値が計算されうる。
【0181】
本発明で提供する方法は、ボトルネック効果(population bottlen
eck)または多様性の減少に関連するサンプル処理中の工程を特定する方法を含む。幾
つかの場合には、ボトルネック効果が特定された場合、出発集団における最初は未知であ
ったその他の分子に補正係数が適用されうる。例えば、投入スパンク分子は実質的に全て
ユニークであるが、回収されたスパンクは50%しかユニークでない場合、これは、サン
プルからのその他の分子の多様性の解釈に関する情報をもたらしうるボトルネック効果お
よび多様性の減少を示す。
【0182】
ボトルネック効果が生じる工程を特定するために、サンプル処理中の任意の工程におい
て、スパンクの集合体(コレクション)がサンプルに添加されうる。例えば、サンプル(
例えば、体液)を対象から採取した際に、スパンクの第1集合体を導入することが可能で
あり、採取サンプルの後続処理(例えば、残存細胞の除去、保存)の前または途中に、ス
パンクの第2集合体をサンプル内に導入することが可能であり、および/または、ライブ
ラリーの製造の前に、スパンクの第3集合体を導入することが可能である。幾つかの場合
には、サンプル処理中の異なる工程においてサンプルに添加されたスパンクの集合体は、
同じまたは類似した組成を有する。幾つかの場合には、スパンクの別の集合体をサンプル
処理中の異なる工程においてサンプルに添加する。
【0183】
幾つかの場合には、スパンク核酸はそれぞれ、ユニーク配列を有するランダム化部分を
含有しうる。スパンクは1以上の異なるドメインを含みうる。幾つかの場合には、スパン
クは1以上のプロセスコード、1以上の多様性コード、1以上の長さ識別配列、1以上の
ロード(load)配列、1以上の合成核酸識別配列(またはスパンク識別配列)および
/または1以上の特徴ドメインを含みうる。幾つかの場合には、スパンクは識別タグおよ
びユニーク核酸配列を含みうる。
【0184】
スパンクの種々の集合体が使用される場合、各集合体は、特定の工程(例えば、サンプ
ル採取、抽出、ライブラリー処理)においてサンプル内に導入されるスパンク集合体を識
別するための「プロセスコード」でコードされうる。そのような場合においては、同一プ
ロセスコードを有するスパンクは生物情報学的に分類され、多様性減少に関して分析され
うる。ついで、特定の工程に関連する多様性減少の度合が決定され、ついで各サンプル処
理工程にわたって比較されうる。
【0185】
スパンクは、合成核酸またはスパンクの全プールまたは集合体に関連する「多様性コー
ド」を含みうる。多様性コードドメインは、合成核酸のプール内の多様性の量を示すユニ
ークコードでありうる。そのような場合においては、多様性プール内の各合成核酸は、プ
ールの多様性の度合(例えば、10個のユニーク配列)を示す配列でコードされうる。
幾つかの場合、例えば、2以上の多様性プールが同一サンプルに関して使用される場合に
は、該多様性コードは、それらの2以上のプールにおける多様性減少を特定するために使
用されうる。
【0186】
幾つかの場合には、スパンクは、特定のスパンクプールまたは集合体のメンバーとして
スパンクを特定する1以上のコード(例えば、プロセスコード)を含みうる。幾つかの場
合には、スパンクは、サンプルに最初に存在した核酸ではなくスパンクとしてスパンクを
特定する1以上のスパンク識別ドメインを含みうる。本明細書に更に詳細に記載されてい
るとおり、スパンクは特徴ドメイン、長さ識別子ドメイン(長さ識別ドメイン)およびロ
ード(load)ドメインをも含みうる。
【0187】
スパンクは、核酸の存在量を計算するため、または他の用途のために、単独で、または
他の合成核酸と組合せて使用されうる。幾つかの場合には、スパンクは他の合成核酸と共
に使用されうる。例えば、幾つかの場合には、スパンクのパネルおよびスパーク(Spa
rk)のパネルがサンプルに添加されうる。幾つかの場合には、サンプル識別核酸もサン
プルに添加されうる。
【0188】
スパンクプールは、好ましくは、核酸配列の多様な混合物を含む。したがって、スパン
クプールは、多様性を最大にするように設計されうる。幾つかの場には、スパンクプール
は、より一層大きなスパンクプールに由来する。例えば、幾つかの場合には、75bpの
オリゴヌクレオチドは、2つの8bpストリング(文字列)のN(例えば、等しい比率の
A/C/G/T)を使用して合成されうる。スパンクは、(i)1以上の識別タグと(i
i)ユニーク核酸配列とを含む合成核酸でありうる。幾つかの場合には、ユニーク核酸配
列は複数の縮重またはランダム位置であることが可能であり、例えば、図6に示されてい
るとおり、1以上のヌクレオチドによって隔てられた8bpストリングの縮重位置の2つ
のグループでありうる。2つの典型的な配列が表4に列挙されている。2つの8bpスト
リングのNを有するオリゴヌクレオチド設計は、416=4.3×10個の異なるオリ
ゴヌクレオチドのプールで、合計16個のNを含有する。例えば、このプールの1×10
個の分子が1mLの血漿に添加され、IDスパイクおよびスパークに関して前記で記載
されているとおりに処理された場合には、スパンクのほぼ全てがユニークとなる。例えば
、そのような場合には、スパンクの90%超(すなわち、90%を超える)、95%超、
99%超がユニークでありうる。
【0189】
幾つかの場合には、スパンク核酸は、少なくとも約20、30、40、50、60、7
0、75、80、90、100、110、120、125、130、140、150、1
60、170、175、180、190、200、250、300、350、400、4
50、500、600、700、800、900または1000ヌクレオチド長でありう
る。幾つかの場合には、スパンク核酸は、多くとも約20、30、40、50、60、7
0、75、80、90、100、110、120、125、130、140、150、1
60、170、175、180、190、200、250、300、350、400、4
50、500、600、700、800、900または1000ヌクレオチド長でありう
る。幾つかの場合には、スパンク核酸は約20~約175塩基対の範囲内の長さを有しう
る。幾つかの場合には、スパンクセットにおける核酸は同じ長さを有する。幾つかの場合
には、スパンクセットにおける核酸は2以上の異なる長さ(例えば、2、3、4、5個ま
たはそれ以上の長さ)を有する。
【0190】
幾つかの場合には、スパンク核酸は、少なくとも約5、6、7、8、9、10、11、
12、13、14、15、16、17、18、19、20、21、22、23、24、2
5、26、27、28、29または30個の縮重位置を有しうる。幾つかの場合には、ス
パンク核酸は、多くとも約10、11、12、13、14、15、16、17、18、1
9、20、21、22、23、24、25、26、27、28、29または30個の縮重
位置を有しうる。スパンク核酸は約5個~約25個の範囲内の数の縮重位置を有しうる。
幾つかの場合には、縮重位置は連続的であり、分離しており、または2以上のグループ、
例えば2、3、4または5個のグループに分割されうる。縮重位置が幾つかのグループに
分割される幾つかの場合には、縮重位置はグループ間で均等に分割されることが可能であ
り(例えば、8bpストリングの縮重位置の2つのグループで、合計16個の縮重位置)
、あるいはグループ間で不均等に分割されることが可能である(例えば、1つのグループ
は10個の縮重位置で、別のグループは6個の縮重位置で、合計16個の縮重位置)。縮
重位置が幾つかのグループに分割される幾つかの場合には、それらのグループは1以上の
ヌクレオチドによって隔てられうる。幾つかの場合には、それらのグループは少なくとも
約1、2、3、4、5、6、7、8、9、10、15、20、30、40または50個の
ヌクレオチドによって隔てられる。幾つかの場合には、それらのグループは少なくとも約
1、2、3、4、5、6、7、8、9、10、15、20、30、40または50ヌクレ
オチドによって隔てられる。
【0191】
幾つかの場合には、スパンク核酸は、少なくとも1×10、1×10、1×10
、1×10、2×10、3×10、4×10、5×10、6×10、7×1
、8×10、9×10、1×10、2×10、3×10、4×10、5
×10、6×10、7×10、8×10、9×10、1×10、2×10
、3×10、4×10、5×10、6×10、7×10、8×10、9×1
、1×10、2×10、3×10、4×10、5×10、6×10、7
×10、8×10、9×10、1×1010または1×1011個のユニーク配列
の多様性を有しうる。幾つかの場合には、スパンク核酸は、多くとも1×10、2×1
、3×10、4×10、5×10、6×10、7×10、8×10、9
×10、1×10、2×10、3×10、4×10、5×10、6×10
、7×10、8×10、9×10、1×10、2×10、3×10、4×1
、5×10、6×10、7×10、8×10、9×10、1×10、2
×10、3×10、4×10、5×10、6×10、7×10、8×10
、9×10、1×1010または1×1011個のユニーク配列の多様性を有しうる。
幾つかの場合には、スパンク核酸は約1×10~約1×1011個のユニーク配列の範
囲内の多様性を有しうる。
【表4】
【0192】
トレーサー配列
実験室(検査室)由来の核酸(例えば、病原体ゲノムDNA)は、感染症診断試験の開
発、立証、検証、アッセイ対照などのための標準として有用である。しかし、これらの同
じ生物は臨床サンプル(例えば、病原体感染サンプル)中に存在しうるため、実験室由来
の物質が、試験中に、臨床サンプルを交差汚染して、偽陽性判定を与える危険性があり、
これは患者および医師に不正確な情報を与えうるだけでなく、ある病原体種に関しては、
保健当局への法定の届出をも生じさせうるであろう。実際の参照核酸(例えば、実際の病
原体ゲノムDNA、癌核酸、腫瘍核酸または他の疾患関連核酸)は陽性対照として有用で
あり、または更には不可欠であるが、それを取り扱う際の通常の又は更には特別な注意は
、次世代シーケンシング(NGS)のような高感度アッセイの場合には特に、交差汚染を
予防するのには不十分でありうる。
【0193】
天然に存在しない又はサンプル核酸にハイブリダイズし得ない合成トレーサー核酸は、
陽性対照核酸と少なくとも同程度に高い有効濃度で、陽性対照核酸ストックに添加されう
る。トレーサーおよび陽性対照核酸は、それらが同じ様態で処理され検出されるような形
態で存在する。したがって、エンドポイント(例えば、NGSの場合のアライメントされ
た配列リード)はトレーサーおよび陽性対照核酸の両方に関して同じであり、トレーサー
は、より高いその有効濃度ゆえに、陽性対照核酸と少なくとも同じくらい容易に検出され
る。幾つかの場合には、陽性対照核酸は病原体ゲノムDNAである。幾つかの場合には、
陽性対照核酸は発癌遺伝子のような疾患関連核酸を含む。
【0194】
トレーサー配列は、例えば配列、長さ、濃度、GC含量などのような1以上の特性にお
いて変動可能である。表5に示され実施例6で使用される配列は約50%のGC含量を有
するが、トレーサー配列は、それが組合される陽性対照またはゲノムの組成に合致するよ
うに変動可能であり、例えば、30%のGC含量、35%のGC含量、40%のGC含量
、45%のGC含量、50%のGC含量、55%のGC含量、60%のGC含量、65%
のGC含量、または70%のGC含量を有しうる。
【0195】
幾つかの場合には、トレーサー配列は、例えば実施例6に記載されているとおり、断片
化後の陽性対照核酸またはゲノムDNAに添加されうる。幾つかの場合には、陽性対照核
酸またはサンプル核酸に対して行われる完全な処理をより良好に表すために、トレーサー
配列は断片化前の陽性対照核酸またはゲノムDNAに添加されうる。臨床サンプル(例え
ば、病原体DNA)において稀であり低濃度で見出される陽性対照核酸は、未標識核酸で
の交差汚染を最小にするために、可能な限り早くトレーサー配列で標識されうる。
【0196】
幾つかの場合には、2以上のトレーサー配列が各陽性対照核酸に添加される。幾つかの
場合には、2以上、3以上、4以上または5以上のトレーサー配列が、同じ濃度または異
なる濃度で添加される。
【0197】
用途によって異なる形態のトレーサー配列が使用されうる。例えば、トレーサー配列の
長さは、対照配列の長さに、例えば平均または中央値の長さに一致させることが可能であ
る。幾つかの場合には、トレーサー配列の長さは対照配列の平均または中央値の長さの5
%、10%または20%以内でありうる。
【0198】
RNA用途にはRNAトレーサー配列が使用されうる。
【表5】
【0199】
分子LIMS
実験室情報管理システム(LIMS)は、消耗品の消費および使用を追跡する方法であ
り、幾つかの場合には、与えられた実験に必要な化学物質または試薬、および与えられた
実験に必要な化学物質または試薬のみがその実験に使用されたことを保証するための方法
である。LIMSは、実験の各繰り返しに使用される化学物質のロット番号を追跡するの
にも役立ちうる。これらの機能(例えば、ロット番号の追跡)は全て、例えば単一の化学
物質の品質が低下した場合または誤った試薬が実験で使用された場合、実験の失敗の問題
解決を助けうる。
【0200】
LIMSシステムは、プロセスにおいて使用される各消耗品に関するカタログ番号およ
びロット番号を実験室員が入力する電子的またはウェブアプリケーションとして設計され
うる。典型的には、該プロセスを促進し、その精度を高めるために、バーコードが使用さ
れる。しかし、人為的な誤りが尚も、反応の所与反復に関する不完全な記録をもたらしう
る。
【0201】
試薬、特に試薬、試薬ロット、アリコート、または出荷品を分子的に標識する方法を本
発明で提供する。幾つかの場合には、該方法は、種々の試薬の異なる容器を分子的にバー
コード化するための、スパイクイン合成核酸の使用を含む。例えば、ユニーク配列(例え
ば、非ヒト、非病原体)を有するスパイクイン核酸または短い核酸オリゴマー(例えば、
50~100bp)を各試薬、試薬ロット、試薬アリコートまたは試薬出荷品に添加する
ことは、個々のライブラリーを製造するために使用されるために使用される試薬の在庫を
追跡するのに役立ちうる。幾つかの場合には、1以上のIDスパイク(Spike)、ス
パーク(Spark)またはスパンク(Spank)配列が分子LIMSに使用されうる
。ついで、各サンプルの処理において使用されるロット番号および試薬が配列決定によっ
て自動的に検出されることが可能であり、例えば、成功した実施において使用されたロッ
ト番号と比較すること、またはそのサンプルの処理において使用される欠如している若し
くは余分な試薬を特定することにより、問題のある実施の問題解決に使用されることが可
能である。
【0202】
同様に、特定の試薬、試薬ロット番号、アリコートまたは出荷品に関連するスパイクイ
ン核酸の検出は、成功する配列決定実施において使用される試薬のロット番号、アリコー
トまたは出荷品を特定するために用いられうる。幾つかの場合には、核酸またはスパイク
インは配列決定以外の方法により検出されることが可能であり、例えば、1以上の蛍光プ
ローブで標識された一般的なポリマーが、蛍光を用いて検出されうる。
【0203】
DNAオリゴマーは多数の水溶液に有効でありうるが、DNアーゼ作用を受けない核酸
オリゴマー(例えば、RNA、修飾主鎖を有するDNAオリゴマー)がDNアーゼ含有溶
液のために設計されうる。同様に、RNアーゼに抵抗性の合成核酸(例えば、DNA)が
、RNアーゼ含有溶液を追跡するために使用されうる。
【0204】
核酸の富化およびライブラリーの製造
本発明で提供する方法においては、核酸は、当技術分野で公知の任意の手段を用いて、
サンプルから単離されうる。例えば、核酸は、液体抽出(例えば、トリゾール(Triz
ol)、DNAzol)技術を用いて抽出されうる。核酸は、商業的に入手可能なキット
[QIAamp循環核酸キット(Circulating Nucleic Acid
Kit)、Qiagen DNeasyキット、QIAampキット、Qiagen M
idiキット、QIAprep]を使用することによっても抽出されうる。
【0205】
核酸は、単なる例示として遠心分離を含む公知方法により濃縮または沈殿されうる。核
酸は、精製目的で、選択的膜(例えば、シリカ)に結合されうる。核酸は、所望の長さの
断片、例えば、1000、500、400、300、200または100塩基対長未満の
断片に関しても富化されうる。サイズに基づくそのような富化は、例えば、PEG誘導沈
殿、電気泳動ゲルまたはクロマトグラフィー材(Huberら(1993)Nuclei
c Acids Res.21:1061-6)、ゲル濾過クロマトグラフィーまたはT
SKゲル(Katoら(1984)J.Biochem,95:83-86)(それらの
刊行物の全体をあらゆる目的で参照により本明細書に組み入れることとする)を使用して
行われうる。
【0206】
核酸サンプルは、標的ポリヌクレオチド、特に、炎症または感染に関連する標的核酸に
関して富化されうる。幾つかの好ましい場合には、標的核酸は病原体核酸(例えば、無細
胞病原体核酸)である。幾つかの好ましい場合には、標的核酸は、子宮、心臓、肺、腎臓
、胎児脳、肝臓または子宮頸組織(これらに限定されるものではない)を含む特定の器官
または組織に関連する無細胞RNAである。
【0207】
標的富化は、当技術分野で公知の任意の手段によるものでありうる。例えば、核酸サン
プルは、標的特異的プライマー(例えば、病原体核酸に特異的なプライマー)を使用して
標的配列を増幅することにより富化されうる。標的増幅は、当技術分野で公知の任意の方
法またはシステムを使用して、デジタルPCR形態で行われうる。核酸サンプルは、標的
選択的オリゴヌクレオチドが固定化されたアレイ上に標的配列を捕捉することにより富化
されうる。核酸サンプルは、溶液中に遊離した又は固体支持体上の標的選択的オリゴヌク
レオチドにハイブリダイズさせることにより富化されうる。オリゴヌクレオチドは、捕捉
試薬による捕捉を可能にする捕捉部分を含みうる。幾つかの実施形態においては、核酸サ
ンプルは標的ポリヌクレオチドに関しては富化されず、例えば、全ゲノムを表す。
【0208】
幾つかの場合には、標的(例えば、病原体器官)核酸は、例えばプルダウン(pull
-down)(例えば、ビオチンタグのような標識に結合した相補的オリゴヌクレオチド
に標的核酸をハイブリダイズさせ、そして、例えば、固体支持体に結合したアビジンまた
はストレプトアビジンを使用することにより、プルダウンアッセイにおいて標的核酸を優
先的にプルダウンさせること)、標的化PCRまたは他の方法により、サンプル中のバッ
クグラウンド(例えば、対象、健常組織)核酸に対して富化されうる。富化技術の例には
、(a)核酸のサンプルにおける主要集団がサンプルにおける少数集団より迅速に自己ハ
イブリダイズする、自己ハイブリダイゼーション技術、(b)遊離DNAからのヌクレオ
ソーム関連DNAの枯渇、(c)特定の長さ間隔のDNAを除去および/または単離する
こと、(d)エキソソーム枯渇または富化、ならびに(e)関心領域の戦略的捕捉が含ま
れるが、これらに限定されるものではない。
【0209】
幾つかの場合には、富化工程は、(a)宿主からの核酸のサンプルを準備すること(こ
こで、宿主からの核酸のサンプルは宿主からの一本鎖核酸のサンプルであり、宿主核酸お
よび非宿主核酸を含む)、(b)宿主からの一本鎖核酸の少なくとも一部を再生させ、そ
れにより、サンプルにおける二本鎖核酸の集団を生成させること、および(c)ヌクレア
ーゼを使用してサンプル内の二本鎖核酸の少なくとも一部を取り出し、それにより、宿主
からの核酸のサンプルにおける非宿主配列を富化させることを含む。幾つかの場合には、
富化工程は、(a)宿主からの核酸のサンプルを準備すること(ここで、宿主からの核酸
のサンプルは、ヌクレオソームに関連する宿主核酸および非宿主核酸を含む)、および(
b)ヌクレオソームに関連する宿主核酸の少なくとも一部を除去し、それにより、宿主か
らの核酸のサンプルにおける非宿主核酸を富化することを含む。幾つかの場合には、富化
工程は、(a)宿主からの核酸のサンプルを準備すること(ここで、宿主からの核酸のサ
ンプルは宿主核酸および非宿主核酸を含む)、および(b)1以上の長さ間隔のDNAを
除去または単離し、それにより、宿主からの核酸のサンプルにおける非宿主核酸を富化す
ることを含む。幾つかの場合には、富化工程は、(a)宿主からの核酸のサンプルを準備
すること(ここで、宿主からの核酸のサンプルは宿主核酸、非宿主核酸およびエキソソー
ムを含む)、および(b)エキソソームの少なくとも一部を除去または単離し、それによ
り、宿主からの核酸のサンプルにおける非宿主配列を富化することを含む。幾つかの場合
には、富化工程は、約300塩基長以上の長さを有する核酸をサンプルから優先的に除去
することを含む。幾つかの場合には、富化工程は、サンプルからの非宿主核酸を優先的に
増幅または捕捉することを含む。
【0210】
富化工程は、約120、約150、約200または約250塩基長以上の核酸をサンプ
ルから優先的に除去することを含みうる。幾つかの場合には、富化工程は、約10塩基~
約60塩基長、約10塩基~約120塩基長、約10塩基~約150塩基長、約10塩基
~約300塩基長、約30塩基~約60塩基長、約30塩基~約120塩基長、約30塩
基~約150塩基長、約30塩基~約200塩基長、または約30塩基~約300塩基長
の、サンプルからの核酸を優先的に富化することを含む。幾つかの場合には、富化工程は
、宿主(例えば、対象)からの核酸を優先的に消化させることを含む。幾つかの場合には
、富化工程は、非宿主核酸を優先的に複製させることを含む。
【0211】
幾つかの場合には、富化工程は、宿主(例えば、対象)核酸に対する非宿主核酸の比率
を、少なくとも2倍、少なくとも3倍、少なくとも4倍、少なくとも5倍、少なくとも6
倍、少なくとも7倍、少なくとも8倍、少なくとも9倍、少なくとも10倍、少なくとも
11倍、少なくとも12倍、少なくとも13倍、少なくとも14倍、少なくとも15倍、
少なくとも16倍、少なくとも17倍、少なくとも18倍、少なくとも19倍、少なくと
も20倍、少なくとも30倍、少なくとも40倍、少なくとも50倍、少なくとも60倍
、少なくとも70倍、少なくとも80倍、少なくとも90倍、少なくとも100倍、少な
くとも1000倍、少なくとも5000倍または少なくとも10,000倍増加させる。
幾つかの場合には、富化工程は、宿主(例えば、対象)核酸に対する非宿主核酸の比率を
少なくとも10倍増加させる。幾つかの場合には、富化工程は宿主(例えば、対象)核酸
に対する非宿主核酸の比率を約10倍~約100倍増加させる。
【0212】
幾つかの場合には、核酸ライブラリーを製造する。核酸ライブラリーは一本鎖核酸ライ
ブラリーまたは二本鎖核酸ライブラリーでありうる。幾つかの場合には、一本鎖核酸ライ
ブラリーは一本鎖DNAライブラリー(ssDNAライブラリー)またはRNAライブラ
リーでありうる。幾つかの場合には、二本鎖核酸ライブラリーは二本鎖DNAライブラリ
ー(dsDNAライブラリー)である。ssDNAライブラリーの製造方法は、二本鎖D
NA断片をssDNA断片に変性させ、プライマードッキング配列をssDNA断片の一
端に連結し、プライマーを該プライマードッキング配列にハイブリダイズさせることを含
みうる。プライマーは、次世代シーケンシングプラットフォームと組合されるアダプター
配列の少なくとも一部を含みうる。該方法は更に、ハイブリダイズしたプライマーを伸長
させて二本鎖を生成させることを含むことが可能であり、ここで、該二本鎖は元のssD
NA断片および伸長プライマー鎖を含む。該伸長プライマー鎖は元のssDNA断片から
分離されうる。該伸長プライマー鎖は回収可能であり、ここで、該伸長プライマー鎖はs
sDNAライブラリーのメンバーである。RNAライブラリーの製造方法は、プライマー
ドッキング配列をRNA断片の一端に連結し、プライマーをプライマードッキング配列に
ハイブリダイズさせることを含みうる。プライマーは、次世代シーケンシングプラットフ
ォームと組合されるアダプター配列の少なくとも一部を含みうる。該方法は更に、ハイブ
リダイズしたプライマーを伸長させて二本鎖を生成させることを含むことが可能であり、
ここで、該二本鎖は元のRNA断片および伸長プライマー鎖を含む。該伸長プライマー鎖
は元のRNA断片から分離されうる。該伸長プライマー鎖は回収可能であり、ここで、該
伸長プライマー鎖はRNAライブラリーのメンバーである。dsDNAライブラリーの製
造方法は、アダプター配列をdsDNA断片の一端または両端に連結することを含みうる
【0213】
種々の態様においては、dsDNAは、当技術分野で公知の又は本明細書に記載されて
いる任意の手段により断片化されうる。幾つかの場合においては、dsDNAは物理的手
段(例えば、機械的剪断、噴霧または超音波処理)、酵素的手段または化学的手段により
断片化されうる。
【0214】
幾つかの実施形態においては、RNAからcDNAを生成させる。例えば、ランダムプ
ライム逆転写(RNアーゼH+)を用いて、ランダムなサイズのcDNAを得ることによ
り、cDNAを生成させることが可能である。
【0215】
核酸の長さは様々でありうる。核酸または核酸断片(例えば、dsDNA断片、RNA
、またはランダムなサイズのcDNA)は、1000bp未満、800bp未満、700
bp未満、600bp未満、500bp未満、400未満bp、300bp未満、200
bp未満または100bp未満である。DNA断片は約40~約100bp、約50~約
125bp、約100~約200bp、約150~約400bp、約300~約500b
p、約100~約500、約400~約700bp、約500~約800bp、約700
~約900bp、約800~約1000bp、または約100~約1000bpである。
幾つかの場合には、核酸または核酸断片(例えば、dsDNA断片、RNA、またはラン
ダムなサイズのcDNA)は約20~約200bpの範囲内、例えば約40~約100b
pの範囲内でありうる。
【0216】
dsDNA断片の末端はポリッシュ(polish)(例えば、平滑末端化)されうる
。DNA断片の末端はポリメラーゼでの処理によりポリッシュされうる。ポリッシュは、
3’オーバーハング(突出)の除去、5’オーバーハングの補充(フィルイン;fill
-in)またはそれらの組合せを含みうる。ポリメラーゼはプルーフリーディングポリメ
ラーゼ(例えば、3’から5’へのエキソヌクレアーゼ活性を含む)でありうる。プルー
フリーディングポリメラーゼは、例えば、T4 DNAポリメラーゼ、Pol 1クレノ
ー断片またはPfuポリメラーゼでありうる。ポリッシュは、当技術分野で公知の任意の
手段を用いて損傷ヌクレオチド(例えば、脱塩基部位)を除去することを含みうる。
【0217】
核酸断片の3’末端へのアダプターの連結は該断片の3’OH基とアダプターの5’ホ
スファートとの間の結合の形成を含みうる。したがって、核酸断片からの5’ホスファー
トの除去は2つのライブラリーメンバーの異常連結を最小限に抑えうる。したがって、幾
つかの実施形態においては、5’ホスファートが核酸断片から除去される。幾つかの実施
形態においては、5’ホスファートはサンプルにおける核酸断片の少なくとも50%、5
5%、60%、65%、70%、75%、80%、85%、90%、95%または95%
超から除去される。幾つかの実施形態においては、実質的に全てのホスファート基(リン
酸基)が核酸断片から除去される。幾つかの実施形態においては、実質的に全てのホスフ
ァートがサンプルにおける核酸断片の少なくとも50%、55%、60%、65%、70
%、75%、80%、85%、90%、95%または95%超から除去される。核酸サン
プルからのホスファート基の除去は、当技術分野で公知の任意の手段によるものでありう
る。ホスファート基の除去は、サンプルを熱不安定性ホスファターゼで処理することを含
みうる。幾つかの実施形態においては、ホスファート基は核酸サンプルから除去されない
。幾つかの実施形態においては、核酸断片の5’末端へのアダプターの連結が行われる。
【0218】
配列決定(シーケンシング)
本開示は核酸の分析方法を提供する。そのような分析方法は核酸の配列決定および配列
決定結果の生物情報学的(バイオインフォマティクス)分析を含む。本方法により得られ
た核酸は、ゲノム、エピジェネティック(例えば、メチル化)およびRNA発現を含む種
々のタイプの情報を得るために分析されうる。メチル化分析は、例えば、メチル化塩基の
変換およびそれに続くDNA配列決定により行われうる。RNA発現分析は、例えば、ポ
リヌクレオチドアレイハイブリダイゼーション、RNA配列決定技術、またはRNAから
生成されたcDNAの配列決定により行われうる。
【0219】
好ましい実施形態においては、配列決定は、次世代シーケンシングアッセイを用いて行
われる。本明細書中で用いる「次世代」なる語は当技術分野において十分に理解されてお
り、一般に、限定的なものではないが以下の1以上を含む任意のハイスループット配列決
定アプローチを意味する:大規模並列シグネチャー配列決定、ピロシーケンス(例えば、
Roche454配列決定装置を使用するもの)、イルミナ(Illumina)(ソレ
クサ(Solexa))配列決定、合成による配列決定(Illumina)、イオント
レント(Ion torrent)配列決定、連結による配列決定(例えば、SOLiD
配列決定)、単分子リアルタイム(SMRT)配列決定(例えば、Pacific Bi
oscience)、ポロニー(polony)配列決定、DNAナノボール(nano
ball)配列決定、ヘリスコープ単分子(heliscope single mol
ecule)配列決定(Helicos Biosciences)およびナノポア(n
anopore)配列決定(例えば、Oxford Nanopore)。幾つかの場合
には、配列決定アッセイはナノポア配列決定を用いる。幾つかの場合には、配列決定アッ
セイはサンガー配列決定の幾つかの形態を含む。幾つかの場合には、配列決定はショット
ガン配列決定を含み、幾つかの場合には、配列決定はブリッジ(bridge)PCRを
含む。幾つかの場合には、配列決定は広域スペクトルである。幾つかの場合には、配列決
定は標的化される。
【0220】
幾つかの場合には、配列決定アッセイはギルバートの配列決定法を含む。そのようなア
プローチにおいては、核酸(例えば、DNA)を化学修飾し、ついで特定の塩基において
切断する。幾つかの場合には、配列決定アッセイはジデオキシヌクレオチド鎖終結または
サンガー配列決定を含む。
【0221】
本発明で提供する方法においては、合成による配列決定アプローチが用いられうる。幾
つかの場合においては、蛍光標識可逆的ターミネーターヌクレオチドを、ガラスフローセ
ルの表面上に固定化されたクローン増幅DNA鋳型に導入する。各配列決定サイクル中に
、単一の標識デオキシヌクレオシド三リン酸(dNTP)が核酸鎖に付加されうる。標識
ターミネーターヌクレオチドは、塩基を特定するために、添加されたらイメージングされ
ることが可能であり、ついで酵素的に切断されて、次のヌクレオチドの取り込みを可能に
しうる。全4個の可逆的ターミネーター結合dNTP(A、C、T、G)は、一般に、単
一の分離した分子として存在するため、自然競合が取り込みバイアスを最小にしうる。
【0222】
幾つかの場合には、単一分子リアルタイム(SMRT)と称される方法を用いる。その
ようなアプローチにおいては、核酸(例えば、DNA)をゼロモード導波路(ZMW)に
おいて合成する。ZMWは、ウェルの底部に位置する捕捉手段を含有する小さなウェル様
容器である。未修飾ポリメラーゼ(ZMW底部に結合している)および溶液中で自由流動
する蛍光標識ヌクレオチドを使用して、配列決定を行う。蛍光標識は、DNA鎖内への取
り込みに際してヌクレオチドから分離され、未修飾DNA鎖が残る。ついで、カメラのよ
うな検出器を使用して、発光を検出することが可能である。データを生物情報学的に分析
して、配列情報を得ることが可能である。
【0223】
幾つかの場合においては、連結アプローチによる配列決定を用いて、サンプルにおける
核酸を配列決定する。一例としては、SOLiD[オリゴヌクレオチド連結および検出に
よる配列決定(Sequencing by Oligonucleotide Lig
ation and Detection)]配列決定(Life Technolog
ies)の次世代シーケンシング法が挙げられる。この次世代技術は数億個~数十億個の
小さな配列リード(read)を同時に生成しうる。該配列決定方法は、配列決定される
べきサンプルからDNA断片のライブラリーを製造することを含みうる。幾つかの場合に
は、該ライブラリーを使用して、各ビーズ(例えば、磁気ビーズ)の表面上にただ1つの
種の断片が存在するクローンビーズ集団を調製する。磁気ビーズに結合した断片は、各断
片の出発配列が既知かつ同一となるように結合した汎用P1アダプター配列を有しうる。
幾つかの場合には、該方法は更に、PCRまたはエマルジョンPCRを含みうる。例えば
、エマルジョンPCRは、PCR用の試薬を含有するマイクロリアクターの使用を含みう
る。ついで、ビーズに結合した得られたPCR産物をガラススライドに共有結合させるこ
とが可能である。配列決定アッセイ、例えばSOLiD配列決定アッセイまたは連結アッ
セイによる他の配列決定は、プライマーの使用を含む工程を含みうる。プライマーはP1
アダプター配列またはライブラリー鋳型内の他の配列にハイブリダイズしうる。該方法は
更に、配列決定プライマーへの連結に関して競合する4つの蛍光標識二塩基プローブを導
入することを含みうる。該二塩基プローブの特異性は、各連結反応における各第1および
第2塩基をイントロゲート(interrogate)することにより達成されうる。連
結、検出および切断の複数のサイクルが、最終的なリード長を決定するサイクル数で行わ
れうる。幾つかの場合には、一連の連結サイクルの後、伸長産物を除去し、第2ラウンド
の連結サイクルのために、n-1位に相補的なプライマーを使用して、鋳型を再配置する
。各配列タグのために、複数ラウンド(例えば、5ラウンド)のプライマー再配置が完了
されうる。プライマー再配置プロセスを通じて、各塩基は、2つの異なるプライマーによ
る2つの独立した連結反応においてイントロゲートされうる。例えば、リード位置5にお
ける塩基は、連結サイクル2においてはプライマー番号2によって、そして連結サイクル
1においてはプライマー番号3によってアッセイされる。
【0224】
該実施形態のいずれかにおいては、オリゴヌクレオチドの検出または定量分析は配列決
定により達成されうる。サブユニットまたは全合成オリゴヌクレオチドは、本明細書に記
載されている配列決定方法を含む当技術分野で公知の任意の適切な方法(例えば、Ill
umina HiSeq 2500)による全オリゴヌクレオチドの完全な配列決定によ
り検出されうる。
【0225】
配列決定は、当技術分野でよく知られた古典的なサンガー配列決定法により達成されう
る。配列決定は、ハイスループット系を使用することによっても達成可能であり、それら
のうちの幾つかは、配列決定ヌクレオチドが、成長中の鎖内へのその取り込みの直後また
は該取り込みに際して検出されること(例えば、リアルタイムまたは実質的にリアルタイ
ムでの配列の検出)を可能にする。幾つかの場合には、ハイスループット配列決定は、1
時間当たり少なくとも1,000、少なくとも5,000、少なくとも10,000、少
なくとも20,000、少なくとも30,000、少なくとも40,000、少なくとも
50,000、少なくとも100,000または少なくとも500,000個の配列リー
ド(read)を生成する。幾つかの場合には、各リードはリード当たり少なくとも50
、少なくとも60、少なくとも70、少なくとも80、少なくとも90、少なくとも10
0、少なくとも120または少なくとも150塩基である。幾つかの場合には、各リード
はリード当たり多くとも2000、多くとも1000、多くとも900、多くとも800
、多くとも700、多くとも600、多くとも500、多くとも400、多くとも300
、多くとも200または多くとも100塩基である。長いリード配列決定は、例えば、5
00塩基より長い、800塩基より長い、1000塩基より長い、1500塩基より長い
、2000塩基より長い、3000塩基より長い、または4500より長い連続配列リー
ドを与える配列決定を含みうる。
【0226】
幾つかの場合には、ハイスループット配列決定は、IlluminaのGenome
Analyzer IIX、MiSeqパーソナルシーケンサー、またはHiSeqシス
テム、例えば、HiSeq 2500、HiSeq 1500、HiSeq 2000も
しくはHiSeq 1000を使用するものにより利用可能な技術の使用を含む。これら
の装置は、合成化学による可逆的ターミネーターベース配列決定を利用する。これらの装
置は8日間で2,000億個以上のDNAの読取りを行いうる。より小さいシステムは、
3日、2日もしくは1日以内またはそれより短い時間内の実施のために利用されうる。短
い合成サイクルは、配列決定結果を得るために要する時間を最小するために用いられうる
【0227】
幾つかの場合には、ハイスループット配列決定は、ABI Solid System
により利用可能な技術の使用を含む。この遺伝子解析プラットフォームは、ビーズに結合
したクローン増幅DNA断片の大規模並列配列決定を可能にしうる。該配列決定方法は色
素標識オリゴヌクレオチドとの連続的連結に基づく。
【0228】
次世代シーケンシングはイオン半導体配列決定(例えば、Life Technolo
gies(Ion Torrent)の技術を利用するもの)を含みうる。イオン半導体
配列決定は、ヌクレオチドがDNA鎖内に取り込まれる際にイオンが放出されうるという
事実を利用しうる。イオン半導体配列決定を行うために、微細加工ウェルの高密度アレイ
を形成させることが可能である。各ウェルは単一DNA鋳型を保持しうる。ウェルの下に
はイオン感受性層が存在することが可能であり、イオン感受性層の下にはイオンセンサー
が存在することが可能である。ヌクレオチドがDNAに加えられると、H+が放出される
可能性があり、これはpHの変化として測定されうる。H+イオンは電圧に変換され、半
導体センサにより記録されうる。アレイチップは1ヌクレオチドずつ連続的に水に浸され
うる。スキャン、ライト、カメラは不要でありうる。幾つかの場合には、IONPROT
ON(商標)シーケンサーが、核酸を配列決定するために使用される。幾つかの場合には
、IONPGM(商標)Sequencerが使用される。イオン・トレント・パーソナ
ル・ゲノム・マシン(Ion Torrent Personal Genome Ma
chine)(PGM)は2時間で1,000万の読取りを行いうる。
【0229】
幾つかの場合には、ハイスループット配列決定は、Helicos BioScien
ces Corporation(Cambridge,Massachusetts)
により利用可能な技術、例えば、合成による単一分子配列決定(Single Mole
cule Sequencing by Synthesis)(SMSS)法の使用を
含む。SMSSは、ヒトゲノム全体を24時間以内に配列決定することを可能にしうる。
SMSSは、MIP技術と同様に、ハイブリダイゼーションの前に前増幅工程を要しない
であろう。SMSSは増幅を要しないであろう。SMSSは、米国特許出願公開第200
60024711号、第20060024678号、第20060012793号、第2
0060012784号および第20050100932号に部分的に記載されている。
【0230】
幾つかの場合には、ハイスループット配列決定は、454 Lifesciences
、Inc.(Branford,Connecticut)により利用可能な技術、例え
ばPico Titer Plate装置の使用を含み、該装置は、該装置内のCCDカ
メラにより記録される、配列決定反応により生成された化学発光シグナルを伝達する光フ
ァイバープレートを含む。光ファイバーのこの使用は4.5時間で少なくとも2,000
万塩基対の検出を可能にしうる。
【0231】
ビーズ増幅およびそれに続く光ファイバー検出を使用するための方法は、Margui
les,M.ら,“Genome sequencing in microfabri
cated high-density picolitre reactors”,N
ature,doi:10.1038/nature03959、ならびに米国特許出願
公開第20020012930号、第20030058629号、第200301001
02号、第20030148344号、第20040248161号、第2005007
9510号、第20050124022号および第20060078909号に記載され
ている。
【0232】
幾つかの場合には、ハイスループット配列決定は、Clonal Single Mo
lecule Array(Solexa,Inc.)を用いて、または可逆的ターミネ
ーター化学を利用する合成による配列決定(SBS)を用いて行われる。これらの技術は
、米国特許第6,969,488号、第6,897,023号、第6,833,246号
、第6,787,308号、および米国特許出願公開第20040106110号、第2
0030064398号、第20030022207号、およびConstans,A.
,The Scientist 2003,17(13):36に部分的に記載されてい
る。
【0233】
幾つかの場合には、次世代シーケンシングはナノポア(nanopore)配列決定で
ある(例えば、Soni GVおよびMeller A.(2007)Clin Che
m 53:1996-2001を参照されたい)。ナノポアは、例えば、直径約1ナノメ
ートルのオーダーの小孔でありうる。導電性流体中にナノポアを浸漬し、それを越えるポ
テンシャルを印加すると、ナノポアを通るイオンの伝導によるわずかな電流が生じうる。
流れる電流の量はナノポアのサイズに感受性でありうる。DNA分子がナノポアを通過す
る際、DNA分子上の各ヌクレオチドは種々の度合でナノポアを妨害しうる。したがって
、DNA分子がナノポアを通過する際にナノポアを通過する電流の変化はDNA配列の読
取りを表しうる。ナノポア配列決定技術はOxford Nanopore Techn
ologiesからのもの、例えばGridIONシステムでありうる。マイクロウェル
の最上部を横切るポリマー膜内に単一ナノポアが挿入されうる。各マイクロウェルは個々
のセンシングのための電極を有しうる。マイクロウェルは、チップ当たり100,000
個以上(例えば、200,000、300,000、400,000、500,000、
600,000、700,000、800,000、900,000または1,000,
000個以上)のマイクロウェルを有するアレイチップへと加工されうる。チップを分析
するために装置(またはノード)が使用されうる。データはリアルタイムで分析されうる
。1以上の装置が同時に作動されうる。ナノポアはタンパク質ナノポア、例えば、ヘプタ
マータンパク質ナノポアであるタンパク質アルファ溶血素でありうる。ナノポアは固体状
態(ソリッドステート)であることが可能であり、例えば、合成膜(例えば、SiNxま
たはSiO)中に形成されるナノメートルサイズの孔でありうる。ナノポアはハイブリ
ッドポア(例えば、固体膜内へのタンパク質ポアの組み込み)でありうる。ナノポアは集
積センサ(例えば、トンネル電極検出器、容量検出器、またはグラフェンベースナノギャ
ップもしくはエッジ状検出器(例えば、Garajら(2010)Nature vol
.67,doi:10.1038/nature09379)を参照されたい))を有す
るナノポアでありうる。ナノポアは、特定のタイプの分子(例えば、DNA、RNAまた
はタンパク質)を分析するために機能化されうる。ナノポア配列決定は「鎖配列決定(ス
トランドシーケンシング)」を含むことが可能であり、この場合、無傷DNAポリマーが
、該DNAがポアへ移動するにつれて、リアルタイムで配列決定されながら、タンパク質
ナノポアを通過しうる。酵素は二本鎖DNAの鎖を分離し、ナノポアを通して鎖を供給し
うる。DNAは一端にヘアピンを有することが可能であり、該システムは両鎖を読取りう
る。幾つかの場合には、ナノポア配列決定は「エキソヌクレアーゼ配列決定」であり、こ
の場合、個々のヌクレオチドが加工性(プロセッシブ)エキソヌクレアーゼによりDNA
鎖から切断され、ヌクレオチドがタンパク質ナノポアを通過しうる。ヌクレオチドはポア
内の分子(例えば、シクロデキストラン)に一時的に結合しうる。電流の特徴的な乱れ(
disruption)を利用して、塩基を特定することが可能である。
【0234】
GENIAからのナノポア配列決定技術が利用されうる。操作されたタンパク質ポアが
脂質二重層膜内に包埋されうる。効率的なナノポア-膜集合、およびチャネルを通るDN
A移動の制御を可能にするために、「アクティブ制御」技術が用いられうる。幾つかの場
合には、ナノポア配列決定技術はNABsysからのものである。ゲノムDNAは約10
0kbの平均長の鎖に断片化されうる。100kbの断片は一本鎖にされることが可能で
あり、ついで、6マー(mer)プローブにハイブリダイズされうる。プローブを有する
ゲノム断片はナノポアを通り抜けることが可能であり、これは電流対時間トレーシングを
生成しうる。該電流トレーシングは各ゲノム断片上のプローブの位置を示しうる。それら
のゲノム断片を並べて、ゲノムに関するプローブ地図を作成することが可能である。該プ
ロセスはプローブのライブラリに関して並行して行われうる。各プローブのゲノム長プロ
ーブ地図が作成されうる。エラーは、「移動ウインドウ・シーケンシング・バイ・ハイブ
リダイゼーション(moving window Sequencing By Hyb
ridization)(mwSBH)」と称されるプロセスで修正されうる。幾つかの
場合には、ナノポア配列決定技術はIBM/Rocheからのものである。電子ビームを
用いて、マイクロチップ内にナノポアサイズの開口部を生成させることが可能である。電
場を用いて、ナノポアを介してDNAを引っ張り、または通すことが可能である。ナノポ
ア内のDNAトランジスタデバイスは金属および誘電体の交互のナノメートルサイズの層
を含みうる。DNA骨格内の孤立電荷はDNAナノポア内の電場により捕捉されうる。ゲ
ート電圧をオフおよびオンにすることにより、DNA配列を読取ることが可能となりうる
【0235】
次世代シーケンシングはDNAナノボール(nanoball)配列決定(例えば、C
omplete Genomicsにより行われるもの;例えば、Drmanac et
ら(2010)Science 327:78-81を参照されたい)を含みうる。DN
Aを単離し、断片化し、サイズ選択することが可能である。例えば、DNAは(例えば、
超音波処理により)約500bpの平均長に断片化されうる。アダプター(Adl)が断
片の末端に結合される。アダプターを使用して、配列決定反応用アンカーにハイブリダイ
ズさせることが可能である。各末端に結合したアダプターを有するDNAをPCR増幅す
ることが可能である。アダプター配列は、相補的な一本鎖末端が互いに結合して環状DN
Aを形成するように修飾されうる。DNAは、後続工程で使用されるIIS型制限酵素に
よる切断から保護するためにメチル化されうる。アダプター(例えば、右アダプター)は
制限認識部位を有することが可能であり、制限認識部位は非メチル化状態のままでありう
る。アダプター内の非メチル化制限認識部位は制限酵素(例えば、AcuI)により認識
されることが可能であり、該DNAは、右アダプターの13bp右側で、AcuIにより
切断されて、線状二本鎖DNAを形成しうる。第2ラウンドの右および左アダプター(A
d2)を該線状DNAのいずれかの末端に連結することが可能であり、両方のアダプター
が結合された全てのDNAを(例えばPCRにより)PCR増幅することが可能である。
Ad2配列は、それらが互いに結合して環状DNAを形成するように修飾されうる。該D
NAはメチル化されうるが、制限酵素認識部位は左Ad1アダプター上で非メチル化状態
のままでありうる。制限酵素(例えば、AcuI)が適用可能であり、該DNAはAd1
の13bp左側で切断されて線状DNA断片を形成しうる。第3ラウンドの右および左ア
ダプター(Ad3)を該線状DNAの右および左側に連結することが可能であり、得られ
た断片をPCR増幅することが可能である。該アダプターは、それらが互いに結合して環
状DNAを形成しうるように修飾されうる。III型制限酵素(例えば、EcoP15)
が添加されうる。EcoP15はAd3の26bp左側およびAd2の26bp右側でD
NAを切断しうる。この切断は大きなDNAセグメントを除去し、DNAを再び線状化し
うる。第4ラウンドの右および左アダプター(Ad4)をDNAに連結し、DNAを(例
えばPCRにより)増幅し、修飾して、それらが互いに結合し、完全な環状DNA鋳型を
形成するようにすることが可能である。
【0236】
ローリングサークル複製(例えば、Phi 29 DNAポリメラーゼを使用するもの
)を用いて、DNAの小さな断片を増幅することが可能である。4つのアダプター配列は
、ハイブリダイズ可能な回文配列を含むことが可能であり、単一鎖がそれ自体に対してフ
ォールディングして、約200~300ナノメートルの平均直径を有しうるDNAナノボ
ール(DNB(商標))を形成しうる。DNAナノボールはマイクロアレイ(配列決定フ
ローセル)に(例えば吸着により)結合されうる。該フローセルは、二酸化ケイ素、チタ
ンおよびヘキサメチルジシラザン(HMDS)でコーティングされたシリコンウェハなら
びにフォトレジスト材でありうる。配列決定は、蛍光プローブをDNAに連結することに
より、非連鎖(unchained)配列決定により行われうる。イントロゲート(in
terrogated)位置の蛍光の色は高分解能カメラにより可視化されうる。アダプ
ター配列間のヌクレオチド配列の同一性が決定されうる。
【0237】
本発明で提供する方法はシステムの使用を含むことが可能であり、例えば、DNAまた
はRNA配列情報を得るための核酸シーケンサー(例えば、DNAシーケンサー、RNA
シーケンサー)を含むシステムの使用を含みうる。該システムは、DNAまたはRNA配
列情報に関するバイオインフォマティクス(生物情報学的)分析を実行するソフトウェア
を含むコンピュータを含みうる。バイオインフォマティクス分析には、限定的なものでは
ないが、配列データの構築、サンプルにおける遺伝的変異体[生殖系列変異体および体細
胞変異体(例えば、癌または前癌状態に関連する遺伝的変異、感染に関連する遺伝的変異
)を含む]の検出および定量が含まれる。
【0238】
配列データを使用して、遺伝子配列情報、倍数性状態、1以上の遺伝的変異体の同一性
、および変異体の定量的尺度(相対的および絶対的相対尺度を含む)を決定することが可
能である。
【0239】
幾つかの場合には、ゲノムの配列決定は全ゲノム配列決定または部分ゲノム配列決定を
含む。配列決定は不偏性(unbiased)であることが可能であり、サンプルにおけ
る核酸の全てまたは実質的に全て(例えば、70%、80%、90%を超える)の配列決
定を含みうる。ゲノムの配列決定は選択的であることが可能であり、例えば、関心のある
ゲノムの部分に向けられたものでありうる。例えば、多数の遺伝子(およびこれらの遺伝
子の変異形態)は種々の癌に関連していることが公知である。所望の分析のためには、選
択された遺伝子または遺伝子の一部の配列決定で十分でありうる。関心のある対象である
、ゲノム内の特定の遺伝子座に位置決定(マッピング)されたポリヌクレオチドは、例え
ば配列捕捉または部位特異的増幅により、配列決定のために単離されうる。
【0240】
用途
本発明で提供する方法は種々の目的に使用可能であり、例えば、状態(例えば、感染)
の診断または検出、状態の発生または再発の予測、治療のモニター、治療レジメンの選択
または修飾、あるいは療法の最適化に使用されうる。このアプローチにより、治療および
/または診断レジメンを、治療経過にわたる種々の時点で得られたデータに従い個別化お
よび調整し、それにより、個別に適切なレジメンを提供することが可能である。
【0241】
状態の検出/診断/予後判定
本発明で提供する方法は、患者のサンプル、例えばヒトの血液サンプルにおいて感染ま
たは疾患を検出、診断または予後判定するために使用されうる。該方法は、ヒト核酸から
主に構成されるサンプルにおける希少微生物核酸断片を検出するために使用されうる。例
えば、血液中の無細胞DNA(cfDNA)は、主に宿主由来のDNA断片からなるが、
体内の微生物由来の少量の断片をも含有する。cfDNAの抽出およびそれに続く詳細な
配列決定(例えば、次世代シーケンシングまたはNGS)は、宿主および非宿主ゲノムデ
ータベースに対して位置決定(マッピング)されうる数百万個または数十億個の配列リー
ド(read;読取り)を生成しうる。同様に、該方法は、特定の器官からの循環または
無細胞RNAの希少集団を検出するためにも使用されうる。非宿主リードが全体のうちの
ごく少数であるサンプルの場合、本発明で提供する方法によらなければ、異なる標的核酸
(例えば、異なる微生物または生物に由来するもの)と比較するための又は異なるサンプ
ルもしくは試薬を追跡するための内部正規化標準の欠如により損なわれるアッセイの感度
および特異性を、本発明で提供する方法は改善しうる。また、該方法は、標的核酸が核酸
の全集団のより大きな部分を構成する場合に使用されうる。
【0242】
本発明で提供する方法は、多種多様な疾患および障害を検出、モニター、診断、予後判
定、治療または予防するために使用されうる。特に、該方法は、感染性疾患または障害に
関連する病原体に由来する1以上の標的核酸を検出するために使用されうる。典型的な疾
患および障害には、感染に関連する任意の疾患または障害、例えば、敗血症、肺炎、結核
、HIV感染、肝炎感染(例えば、Hep A、BまたはC)、ヒトパピローマウイルス
(HPV)感染、クラミジア感染、梅毒感染、エボラ感染、スタフィロコッカス・アウレ
ウス(staphylococcus aureus)感染またはインフルエンザが含ま
れる。本発明で提供する方法は、薬剤耐性微生物、例えば、多剤耐性微生物、または容易
には培養されず若しくは典型的には試験されない微生物による感染を検出するのに特に有
用である。本方法で検出されうる疾患および障害の幾つかの非限定的な例には以下のもの
が含まれる:癌、拡張型心筋症、ギラン・バレー症候群、多発性硬化症、結核、炭疽病、
睡眠病、赤痢、トキソプラズマ症、白癬、カンジダ症、ヒストプラスマ症、エボラ、アシ
ネトバクター感染、放線菌症、アフリカ睡眠病(アフリカトリパノソーマ症)、エイズ(
後天性免疫不全症候群)、HIV感染、アメーバ症、アナプラズマ症、炭疽病、アルカン
バクテリウム・ヘモリティカム(Arcanobacterium haemolyti
cum)感染、アルゼンチン出血熱、アスカリアシス、アスペルギルス症、アストロウイ
ルス感染、バベシア症、バシルス・セレウス(Bacillus cereus)感染、
細菌性肺炎、細菌性膣症(BV)、バクテロイデス感染、バランチジウム症、ベイリサス
カリス(Baylisascaris)感染、BKウイルス感染、黒色砂毛、胚盤胞感染
、胚盤葉感染、ボリビア出血熱、ボレリア感染、ボツリヌス中毒(および幼児ボツリヌス
中毒症)、ブラジル出血熱、ブルセラ症、腺ペスト、バークホルデリア感染、ブルリ潰瘍
、カリシウイルス感染(ノロウイルスおよびサポウイルス)、カンピロバクター症、カン
ジダ症(モニリア症;膣炎)、猫引っかき病、蜂巣炎、シャガス病(アメリカトリパノソ
ーマ症)、軟性下疳、水痘、チクングニア熱、クラミジア、クラミドフィラ・ニューモニ
エ(Chlamydophila pneumoniae)感染(台湾急性呼吸器症候群
またはTWAR)、コレラ、クロモブラストミコーシス、肝吸虫症、クロストリジウム・
ディフィシレ(Clostridium difficile)感染、コクシジオイデス
症、コロラドダニ熱(CTF)、感冒(急性ウイルス性鼻咽頭炎;急性コリーザ)、クロ
イツフェルト・ヤコブ病(CJD)、クリミア・コンゴ出血熱(CCHF)、クリプトコ
ックス症、クリプトスポリジウム症、皮膚幼虫遊走(CLM)、シクロスポラ症、嚢虫症
、サイトメガロウイルス感染、デング熱、二核アメーバ症、ジフテリア、裂頭条虫症、メ
ジナ虫症、エボラ出血熱、エキノコックス症、エーリキア症、蟯虫症(蟯虫感染症)、腸
球菌感染症、エンテロウイルス感染、流行チフス、伝染性紅斑(第五病)、突発性発疹(
第六病)、肥大吸虫症、肝蛭症、フィラリア症、クロストリジウム・パーフリンジェンス
(Clostridium perfringens)による食中毒、自由生活アメーバ
感染、フゾバクテリウム感染、ガス壊疽(クロストリジウム筋壊死)、ゲオトリクム症、
ゲルストマン-シュトロイスラー-シャインカー症候群(GSS)、ジアルジア症、鼻疽
、顎口虫症、淋病、鼠径肉芽腫(ドノヴァン症)、A群連鎖球菌感染、B群レンサ球菌感
染、ヘモフィルス・インフルエンゼ(Haemophilus influenzae)
感染、手足口病(HFMD)、ハンタウイルス肺症候群(HPS)、ハートランド(He
artland)ウイルス疾患、ヘリコバクター・ピロリ(Helicobacter
pylori)感染、溶血性尿毒症症候群(HUS)、腎症候性出血熱(HFRS)、A
型肝炎、B型肝炎、C型肝炎、D型肝炎、E型肝炎、単純ヘルペス、ヒストプラスマ症、
鉤虫感染、ヒトボカウイルス感染、ヒト・エウィンギイエールリキオシス(ewingi
i ehrlichiosis)、ヒト顆粒球アナプラズマ症(HGA)、ヒトメタニュ
ーモウイルス感染、ヒト単球エールリヒア症、ヒトパピローマウイルス(HPV)感染、
ヒトパラインフルエンザウイルス感染、膜様条虫症、エプスタイン-バーウイルス感染性
単核球症(Mono)、インフルエンザ(flu)、イソスポラ症、川崎病、角膜炎、キ
ンゲラ・キンゲ(Kingella kingae)感染、クールー、ラッサ熱、レジオ
ネラ症(レジオネラ病)、レジオネラ症(ポンティアック熱)、リーシュマニア症、ハン
セン病、レプトスピラ症、リステリア症、ライム病(ライムボレリア症)、リンパ管フィ
ラリア症(象皮病)、リンパ球性脈絡髄膜炎、マラリア、マールブルグ出血熱(MHF)
、麻疹、中東呼吸器症候群(MERS)、類鼻疽(ホイットモア病)、髄膜炎、髄膜炎菌
性疾患、横川吸虫症、微胞子虫症、伝染性軟属腫(MC)、サル痘、流行性耳下腺炎、マ
ウスチフス(流行チフス)、マイコプラズマ肺炎、菌腫、ハエ幼虫症、新生児結膜炎(新
生児眼炎)、(新)変種クロイツフェルト・ヤコブ病(vCJD、nvCJD)、ノカル
ジア症、オンコセルカ症(河川盲目症)、パラコクシジオイデス(南米ブラストミセス症
)、肺吸虫症、パスツレラ症、アタマジラミ寄生症(アタマジラミ)、コロモジラミ寄生
症(着物虱)、ケジラミ症(恥毛シラミ、カニシラミ)、骨盤内炎症性疾患(PID)、
百日咳(百日ぜき)、ペスト、肺炎球菌感染、ニューモシスチス肺炎(PCP)、肺炎、
ポリオ、プレボテラ感染、原発性アメーバ性髄膜脳炎(PAM)、進行性多巣性白質脳症
、オウム病、Q熱、狂犬病、呼吸器合胞体ウイルス感染、リスノポリジウム症、ライノウ
イルス感染、リケッチア感染、リケッチア痘、リフトバレー熱(RVF)、ロッキー山紅
斑熱(RMSF)、ロタウイルス感染、風疹、サルモネラ症、SARS(重症急性呼吸器
症候群)、疥癬、住血吸虫症、敗血症、細菌性赤痢(細菌赤痢)、帯状疱疹(帯状ヘルペ
ス)、天然痘(痘瘡)、スポロトリクス症、ブドウ球菌食中毒、ブドウ球菌感染、糞線虫
症、亜急性硬化性全脳炎、梅毒、テニア症、破傷風(咬痙)、白癬性毛瘡(床屋痒み症)
、頭部白癬(しらくも)、体部白癬(ぜにたむし)、股部白癬(いんきんたむし)、手白
癬(手の白癬)、黒癬、足白癬(水虫)、爪白癬(爪真菌症)、澱風(なまず)、トキソ
カラ症(眼幼虫移行症(OLM))、トキソカラ症(内臓幼虫移行症(VLM))、トラ
コーマ、トリノククリアシス(Trinochccliasis)、旋毛虫病(Tric
hinlosis)、鞭虫症(鞭虫感染)、結核、野兎病、腸チフス、ウレアプラズマ・
ウレアリチカム(Ureaplasma urealyticum)感染、渓谷熱、ベネ
ズエラウマ脳炎、ベネズエラ出血熱、ウイルス性肺炎、西ナイル熱、白色砂毛(チネア・
ブランカ(Tinea blanca)、エルシニア・シュードツベルクローシス(Ye
rsinia pseudotuberculosis)感染、エルシニア症、黄熱病、
ジカウイルス、および接合菌症。
【0243】
幾つかの場合には、本明細書に記載されている方法は、感染が活動性であるか潜在性で
あるかを決定することを含む。幾つかの場合には、遺伝子発現の定量は、活動性感染を検
出、予測、診断またはモニターするための方法を提供しうる。幾つかの場合には、本明細
書に記載されている方法は、活動性感染を検出することを含む。幾つかの場合には、遺伝
子発現は、関心のある1以上の標的核酸の検出または配列決定により定量されうる。幾つ
かの場合には、遺伝子発現の定量は、潜伏感染を検出、予測、診断またはモニターするた
めの方法を提供しうる。幾つかの場合には、本明細書に記載されている方法は、潜伏感染
を検出することを含む。
【0244】
本発明で提供する方法は、癌を検出するために使用可能であり、特に、そのような癌を
有する対象、そのような癌を有するリスクのある対象、またはそのような癌を有すると疑
われる対象において、癌を検出するために使用されうる。癌の例には、限定的なものでは
ないが、脳腫瘍、頭頸部癌、喉頭癌、口腔癌、乳癌、骨癌、血液癌、白血病、リンパ腫、
肺癌、腎癌、膵臓癌、胃癌、結腸癌、直腸癌、皮膚癌、生殖路の癌、前立腺癌などが含ま
れる。幾つかの場合には、本発明で提供する方法は、非血液癌、例えば、実質臓器の癌(
例えば、肺癌、乳癌、膵臓癌など)を検出するのに特に有用である。
【0245】
該方法は、対象の任意の他のタイプの疾患または状態を検出するのにも有用でありうる
。しばしば、それは、希少遺伝的変異を検出するのに有用であり、あるいは、サンプルに
おける全核酸集団のうちの非常に小さな部分のみを構成する核酸配列を検出するのに有用
である。
【0246】
病原体または器官核酸の検出は、病原体または器官核酸の存在もしくは非存在および/
または病原体もしくは器官核酸の量を決定するために、病原体または器官核酸のレベルを
対照または参照値と比較することを含みうる。レベルは定性的または定量的レベルであり
うる。幾つかの場合には、対照または参照値は、無細胞病原体核酸または無細胞器官由来
核酸の存在または非存在を示す所定の絶対的な値である。例えば、対照値を超える無細胞
病原体核酸のレベルの検出は病原体または感染の存在を示しうる。一方、対照値より低い
レベルは病原体または感染の非存在を示しうる。該対照値は、感染を有さない対象の無細
胞核酸レベルを分析することにより得られる値でありうる。幾つかの場合には、対照値は
陽性対照値であることが可能であり、特定の感染を有する、または特定の器官の特定の感
染を有する対象からの無細胞核酸を分析することにより得られうる。
【0247】
幾つかの場合には、感染が存在するか否かを決定するために、そしてしばしば、正確な
結果を得るために、以下の方法の1以上が適用されうる:(i)WO 20150700
86 A1の特許に記載されているとおり、配列決定により得られたリード(read)
の全体はキュレート(curated)宿主ゲノム参照データベース(これはヒト、イヌ
、ネコ、霊長類由来または任意の他の宿主由来であることが可能であり、例えば、Gen
Bank hg19ヒト参照配列を含む)に対してアライメントされうる;(ii)病原
体関連配列を含む非宿主配列のみが更に分析されうるように、バイオインフォマティクス
分析のためのデータプロセッサは宿主配列を除去または隔離しうる;(iii)データプ
ロセッサは、例えばGenBankおよびRefseqからの例示参照配列を含むキュレ
ート微生物参照配列データベースに対して非宿主配列をアライメントさせることにより、
1以上の病原体の存在を決定しうる;(iv)1以上の病原体の存在が統計的に有意であ
るかどうかを判定するために、統計的解析フレームワークが適用されうる;および/また
は(v)幾つかの場合には、データプロセッサは、配列決定前に既知濃度でサンプルに添
加された対照分子により得られたリードの数と比較した場合の、病原体に関して得られた
リードの数に基づいて、存在する病原体の量を定量しうる。
【0248】
対照値は、異なる時点、例えば、試験時点の前の時点で、対象(例えば、感染を有する
対象または感染を有すると疑われる対象)から得られた無細胞病原体または器官特異的核
酸のレベルでありうる。そのような場合、異なる時点でのレベルの比較は、感染の存在、
特定の器官における感染の存在、感染の改善、または感染の悪化を示しうる。例えば、無
細胞病原体核酸の経時的な一定量の増加は感染の存在または感染の悪化を示しうる。例え
ば、元の値と比較して、少なくとも5%、10%、20%、25%、30%、50%、7
5%、100%、200%、300%または400%の、病原体または器官特異的無細胞
核酸の増加は、感染の存在または感染の悪化を示しうる。他の例においては、元の値と比
較して、少なくとも5%、10%、20%、25%、30%、50%、75%、100%
、200%、300%または400%の、病原体または器官特異的無細胞核酸の減少は、
感染の非存在または感染の改善を示しうる。しばしば、そのような測定は、特定の期間に
わたって、例えば毎日、隔日、毎週、隔週、毎月または隔月に行われうる。例えば、1週
間わたる、少なくとも50%の、病原体または器官無細胞核酸の増加は、感染の存在を示
しうる。
【0249】
対照または参照値は濃度として又は配列決定リードの数として測定されうる。対照また
は参照値は病原体依存的でありうる。例えば、大腸菌(Escherichia col
i)の対照値はマイコプラズマ・ホミニス(Mycoplasma hominis)の
対照値と異なりうる。レベルまたは対照値のデータベースは、1以上の病原体、1以上の
器官および/または1以上の時点に関して、1以上の対象から得られたサンプルに基づい
て作成されうる。そのようなデータベースはキュレート(curated)物または独占
物でありうる。推奨治療選択肢は種々の閾値レベルに基づきうる。例えば、低レベルは感
染を示しうるが、治療は不要でない可能性があり、中等度のレベルは抗生物質治療につな
がる可能性があり、高レベルは即座の又は重大な介入を要しうる。
【0250】
本発明で提供する方法は高効率、高精度および/または高感度での配列決定データの作
成を可能にしうる。しばしば、そのような方法は、プレート培養またはポリメラーゼ連鎖
反応(PCR)のような他の方法によっては検出されず又は検出可能である病原体または
感染を検出しうる。該方法は一般に、非常に高い感度、例えば、80%、85%、90%
、95%、99%または99.5%を超える感度を有しうる。該方法は一般に、非常に低
い偽陽性率、例えば、5%、4%、3%、2%、1%、0.1%、0.05%、0.01
%未満の偽陽性率を有しうる。
【0251】
本発明で提供する方法は、高い特異性、高い感度、高い陽性的中度および/または低い
陰性的中度を与えうる。本発明で提供する方法は、少なくとも70%、75%、80%、
85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、
95%、96%、97%、98%、99%またはそれ以上である特異性(または陰性一致
率)および/または感度(または陽性一致率)を示しうる。幾つかの場合には、名目上の
特異性は70%以上である。名目上の陰性的中度(NPV)は95%以上である。幾つか
の場合には、NPVは少なくとも95%、95.5%、96%、96.5%、97%、9
7.5%、98%、98.5%、99%、99.5%またはそれ以上である。
【0252】
感度、陽性一致率(PPA)または真陽性率(有病正診率)(TPR)はTP/(TP
+FN)またはTP/(感染対象の総数)の式に関するものでありうる(ここで、TPは
真陽性の数であり、FNは偽陰性の数である)。前記式の分母を計算する場合、該値は、
特定の独立した感染検出方法(例えば、血液培養またはPCR)に基づく感染結果の総数
を反映しうる。
【0253】
特異性、陰性一致率または真陰性率(無病正診率)は、TN/(TN+FP)またはT
N/(未感染対象の総数)のような式に関するものでありうる(ここで、TNは真陰性で
あり、FPは偽陽性である)。前記式の分母を計算する場合、該値は、独立した感染検出
方法(例えば、血液培養またはPCR)により決定された実際の「未感染」の総数を反映
しうる。
【0254】
幾つかの場合には、サンプルは、75%、80%、85%、86%、87%、88%、
89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、
99%、99.5%またはそれ以上の精度で、感染していると特定される。幾つかの場合
には、サンプルは、95%を超える感度で、感染していると特定される。幾つかの場合に
は、サンプルは、95%を超える特異性で、感染していると特定される。幾つかの場合に
は、サンプルは、95%を超える感度および95%を超える特異性で、感染していると特
定される。幾つかの場合には、精度は、学習したアルゴリズムを使用して計算される。本
明細書中で用いる診断精度は特異性、感度、陽性的中度、陰性的中度および/または偽発
見率を含む。幾つかの場合には、本明細書に記載されている方法は、70%、75%、8
0%、85%、86%、87%、88%、89%、90%、91%、92%、93%、9
4%、95%、96%、97%、98%、99%、または99.5%を超える特異性また
は感度、あるいは少なくとも95%、95.5%、96%、96.5%、97%、97.
5%、98%、98.5%、99%、99.5%またはそれ以上の陽性的中度または陰性
的中度を有する。
【0255】
感染の診断のためにサンプルを分類する場合、典型的には、二項分類指標からの4つの
可能な結果が存在する。予測からの結果がpであり、実際の値もpである場合、それは真
陽性(TP)と称される。しかし、実際の値がnであれば、それは偽陽性(FP)である
と称される。逆に、予測結果と実際の値の両方がnである場合には真陰性が生じ、実際の
値がpである場合に予測結果がnである場合には偽陰性となる。そのような感染症のよう
な疾患または障害を検出する試験では、対象(被験体)が陽性試験結果を示すが実際には
感染を有さない場合には、この場合の偽陽性が生じうる。一方、対象が実際に感染してい
るが、そのような感染に関する陰性試験結果を示す場合には、偽陰性が生じうる。
【0256】
陽性的中度(PPV)、または精度(precision rate)、または疾患の
検査後確率は、正確に診断された陽性試験結果を有する患者の割合である。それは、以下
の式:PPV=TP/(TP+FP)を適用することにより計算されうる。PPVは、陽
性試験結果が、試験されている基礎状態(基礎疾患)を反映する確率を反映しうる。しか
し、その度合は、変動しうる当該疾患の罹患率に左右されうる。陰性的中度(NPV)は
、以下の式:TN/(TN+FN)により計算される。陰性的中度は、正確に診断された
陰性試験結果を有する患者の割合でありうる。PPVおよびNPV測定値は、適切な疾患
有病率推定値を用いて導出されうる。
【0257】
幾つかの場合には、本明細書に記載されている方法の配列決定分析の結果は、与えられ
た診断が正しいという統計的信頼水準を示す。幾つかの場合には、そのような統計的信頼
水準は85%、90%、91%、92%、93%、94%、95%、96%、97%、9
8%、99%または99.5%を超える。
【0258】
モニターおよび治療
該方法は、経時的に対象が感染を有するかどうかをモニター(監視)することを含みう
る。例えば、感染の存在または非存在を決定するために、サンプルを種々の時点で連続的
に採取されうる。他の例では、該方法は、経時的に感染経過をモニターすることを含みう
る。そのような場合、サンプルは感染または疾患中の種々の時点で連続的に採取可能であ
り、幾つかの場合には、連続的に採取されたサンプルを互いに比較して、感染が改善して
いるか悪化しているかを決定する。
【0259】
本発明で提供する方法は、対象、例えば、感染を有する対象または感染を有すると疑わ
れる対象の治療方法を含む。治療は対象における感染を軽減、予防または排除しうる。幾
つかの場合には、治療は感染および/または炎症を軽減、予防または排除しうる。
【0260】
治療は、炎症および/または感染を軽減または排除するために薬物または他の療法を投
与することを含みうる。幾つかの場合には、例えば、感染または炎症の発生を予防するた
めに、対象を薬物で予防的に治療(処置)する。
【0261】
感染または炎症の症状を改善または軽減するための任意の療法(薬物を含む)を対象に
投与することが可能である。典型的な薬物には、限定的なものではないが、抗生物質、抗
ウイルス薬、アンピシリン、スルバクタム、ペニシリン、バンコマイシン、ゲンタマイシ
ン、アミノグリコシド、クリンダマイシン、セファロスポリン、メトロニダゾール、チメ
ンチン、チカルシリン、クラブラン酸、セフォキシチン、抗レトロウィルス薬(例えば、
高活性抗レトロウィルス療法(HAART)、逆転写逆転インヒビター、ヌクレオシド/
ヌクレオチド逆転写酵素インヒビター(NRTI)、非ヌクレオシドRTインヒビターお
よび/またはプロテアーゼインヒビター)、抗体-薬物コンジュゲート、および免疫グロ
ブリンが含まれる。
【0262】
該方法は治療レジメンを調節する方法を含みうる。例えば、対象は既知の感染を有する
可能性があり、該感染を治療するための薬物が投与されている可能性がある。本発明で提
供する方法は、薬物治療の有効性を追跡またはモニターするために使用されうる。幾つか
の場合には、該治療レジメンは、そのようなモニターの結果に応じて調節されうる。例え
ば、本発明で提供する方法が、薬物治療の結果として感染が改善していないことを示して
いる場合には、患者に投与する薬物または治療のタイプを変更すること、先行薬物の使用
を中止すること、該薬物の使用を継続すること、薬物治療の用量を増加させること、ある
いは新たな薬物または他の治療を対象の治療レジメンに加えることにより、治療レジメン
が調節されうる。幾つかの場合には、治療レジメンは特定の処置を含みうる。同様に、該
方法が、感染が改善している又は消散していることを示している場合には、調節は、薬物
治療を低減または中止することを含みうる。
【0263】
本明細書に記載されている方法は更に、RNA配列決定(RNA-Seq)を含むこと
が可能であり、またはRNA-Seqを含む方法と組合されうる。組織損傷または感染は
特定の器官または組織からの無細胞核酸の放出をもたらしうる。例えば、組織におけるア
ポトーシス細胞によりRNAが放出されうる。無細胞RNAのRNA-Seqは体内の種
々の組織の健康または状態を示しうる。
【0264】
RNA配列決定を含む方法は、感染した特定の器官または組織の検出を可能にし、器官
の健康状態を検出またはモニターするために使用されうる。RNA-Seqは、器官の健
康を調べるために独立して使用可能であり、または本明細書に記載されている方法により
検出された感染が特定の器官の感染であるという信頼性を高めうる。RNA-Seq試験
は、感染の検出方法と同時に、感染の検出方法の後で、または感染の検出方法の前に行わ
れうる。
【0265】
本発明が提供する病原体検出方法が体液中の無細胞RNAのRNA配列決定による感染
部位の検出方法と組合されうる多数の潜在的シナリオが存在する。例えば、本発明で提供
する方法は、病原体からの循環無細胞核酸を検出するために使用されうる。該方法は更に
、対象血液における器官特異的無細胞RNAの増加を検出するためのRNA-Seq試験
を行うことを含みうる。試験結果の組合せは、病原体が器官に感染していることを示すこ
とが可能であり、更には、どの器官組織が感染しているかをも決定することが可能であり
うる。
【0266】
RNA-Seq試験(または一連のRNA-Seq試験)は、時には、本明細書に記載
されている方法が陽性試験結果(例えば、病原体感染の検出)を示した後に行われうる。
RNA-Seq試験は、感染を確認するため、または感染の位置を特定するために特に有
用でありうる。例えば、該方法は、循環無細胞核酸を分析することにより、対象における
病原体の存在を検出しうるが、感染部位は不明でありうる。そのような場合には、該方法
は更に、(例えば、器官組織に由来する循環無細胞RNAのレベルの増加の検出により)
感染が器官内に存在することを確認するために、対象からの無細胞RNAを配列決定する
ことを含みうる。ついで、特定の器官または組織において感染が悪化または改善している
かどうか、あるいはそれが異なる器官または組織に広がっているかどうかを判定するため
に、RNA配列決定試験を経時的に反復することが可能である。同様に、病原体検出アッ
セイを経時的に反復することが可能である。
【0267】
幾つかの場合には、本明細書に記載されている病原体検出方法は、RNA-Seq試験
の実施の後で行われる。例えば、器官に関連する無細胞RNAの血漿レベルの上昇は器官
の感染のような障害を示しうる。そのような場合、該方法は更に、器官感染に関連する循
環無細胞核酸のレベルを検出することを含みうる。
【0268】
本明細書に記載されている方法は、例えば、経時的に感染または治療をモニターするた
めに反復されうる。本明細書に記載されている方法は、1、2、3、4、5、6、7、8
、9または10日ごと、1、2、3、4、5または6週ごと、あるいは1、2、3、4、
5、6、7、8または9ヶ月ごとに反復されうる。
【0269】
幾つかの場合には、本明細書に記載されている方法が陰性試験結果を示す(例えば、病
原体が検出されない)場合、対象における病原体核酸をモニターするために、方法を経時
的に連続的に反復することが可能である。また、幾つかの場合においては、陰性病原体試
験結果または陰性RNA-Seq結果の後、RNA-Seqアッセイを経時的に連続的に
反復する。
【0270】
幾つかの場合には、本明細書に記載されている方法が陽性試験結果(例えば、病原体の
検出)を示す場合、治療レジメンを対象に投与することが可能である。治療レジメンには
、薬物投与、抗生物質投与または抗ウイルス投与が含まれ得るが、これに限定されるもの
ではない。
【0271】
幾つかの場合には、本明細書に記載されている方法が陽性試験結果を示す場合、感染の
経過をモニターするために、方法または試験を経時的に連続的に反復することが可能であ
る。例えば、感染の上方または下方の経過に応じて、治療レジメンを調節することが可能
である。他の場合には、最初はいずれの治療レジメンをも行わない。例えば、追加的な医
学的介入を行うことなく感染が消失するかどうかを見るために、「監視的待機」または「
経過観察」の方法で感染がモニターされうる。幾つかの場合には、本明細書に記載されて
いる方法が陽性試験結果を示す場合、薬物を投与することが可能であり、該薬物がどれほ
ど良好に作用するか、または薬物治療をいつ終了すべきかを調べるために、感染の経過を
モニターすることが可能である。幾つかの場合には、必要に応じて療法が改変されうる。
【0272】
コンピュータ制御システム
本開示は、本開示の方法を実施するようにプログラムされたコンピュータ制御システム
を提供する。図7は、本開示の方法を実施するようにプログラムまたは他の方法で構成さ
れたコンピュータシステム701を示す。
【0273】
コンピュータシステム701は中央処理装置(CPU;本明細書においては「プロセッ
サ」および「コンピュータプロセッサ」とも称される)705を含み、これは単一コアも
しくはマルチコアプロセッサ、または並列処理のための複数のプロセッサでありうる。コ
ンピュータシステム701はまた、メモリまたはメモリロケーション710(例えば、ラ
ンダムアクセスメモリ、読み出し専用メモリ、フラッシュメモリ)、電子記憶装置715
(例えば、ハードディスク)、1以上の他のシステムと通信するための通信インターフェ
イス720(例えば、ネットワークアダプタ)、および周辺装置725、例えばキャッシ
ュ、他のメモリ、データ記憶装置および/または電子ディスプレイアダプタを含む。メモ
リ710、記憶装置715、インタフェース720および周辺装置725は、マザーボー
ドのような通信バス(実ライン)を介してCPU705につながっている。記憶装置71
5は、データを格納するためのデータ記憶装置(またはデータリポジトリ)でありうる。
コンピュータシステム701は、通信インタフェース720を用いてコンピュータネット
ワーク(「ネットワーク」)730に機能的に接続されうる。ネットワーク730は、イ
ンターネット、インターネットおよび/またはエクストラネット、あるいはインターネッ
トとつながったイントラネットおよび/またはエクストラネットでありうる。ネットワー
ク730は、幾つかの場合には、テレコミュニケーションおよび/またはデータネットワ
ークである。ネットワーク730は1以上のコンピュータサーバを含み、これは分散コン
ピューティング、例えばクラウドコンピューティングを可能にしうる。ネットワーク73
0は、幾つかの場合には、コンピュータシステム701を用いて、ピアツーピアネットワ
ークを実行することが可能であり、これは、コンピュータシステム701に接続した装置
がクライアントまたはサーバとして動作することを可能にしうる。
【0274】
CPU705は、プログラムまたはソフトウェアにおいて表されうる一連の機械可読命
令を実行しうる。命令はメモリ位置、例えばメモリ710に格納されうる。命令はCPU
705に向けられ、これはついで、本開示の方法を実施するようにCPU705をプログ
ラムまたは構成しうる。CPU705によって実行される動作の例には、フェッチ、デコ
ード、実行およびライトバックが含まれうる。
【0275】
CPU705は集積回路のような回路の一部でありうる。システム701の1以上の他
の構成要素が回路に含まれうる。幾つかの場合には、回路は特定用途向け集積回路(AS
IC)である。
【0276】
記憶装置715は、ファイル、例えばドライバ、ライブラリおよび保存プログラムを格
納しうる。記憶装置715は、ユーザデータ、例えば、利用者選好およびユーザプログラ
ムを格納しうる。コンピュータシステム701は、幾つかの場合には、コンピュータシス
テム701の外部にある1以上の追加的データ記憶装置を含むことが可能であり、該追加
的データ記憶装置は、例えば、イントラネットまたはインターネットを介してコンピュー
タシステム701につながっているリモートサーバ上に位置する。
【0277】
コンピュータシステム701はネットワーク730を介して1以上のリモートコンピュ
ータシステムと通信可能である。例えば、コンピュータシステム701はユーザ(例えば
、医療提供者)のリモートコンピュータシステムと通信可能である。リモートコンピュー
タシステムの例には、パーソナルコンピュータ(例えば、ポータブルPC)、スレートま
たはタブレットPC(例えば、Apple(登録商標)iPad、Samsung(登録
商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標
)iPhone、Android対応デバイス、Blackberry(登録商標))ま
たはパーソナルデジタルアシスタントが含まれる。ユーザはネットワーク730を介して
コンピュータシステム701にアクセス可能である。
【0278】
本明細書に記載されている方法は、コンピュータシステム701の電子記憶場所、例え
ばメモリ710または電子記憶装置715上に記憶された機械(例えば、コンピュータプ
ロセッサ)実行可能コードにより実行されうる。機械実行可能コードまたは機械可読コー
ドはソフトウェアの形態で提供されうる。コードは、使用中に、プロセッサ705により
実行されうる。幾つかの場合には、コードは記憶装置715から検索され、プロセッサ7
10によって容易にアクセスできるようにメモリ710に記憶されうる。幾つかの場合に
は、電子記憶装置715は除外可能であり、機械実行可能命令はメモリ710に格納され
る。
【0279】
コードは、コードを実行するように適合化されたプロセッサを有する機械と共に使用さ
れるように、プリコンパイルされ、構成されることが可能であり、または実行中にコンパ
イルされうる。コードは、プリコンパイルまたはコンパイル形態でコードが実行可能とな
るように選択されうるプログラミング言語で供給されうる。
【0280】
コンピュータシステム701のような、本発明で提供するシステムおよび方法の態様は
、プログラミングにおいて具体化されうる。該技術の種々の態様は、典型的には機械(ま
たはプロセッサ)実行可能コードの形態および/または機械可読媒体の一種に搭載または
組み込まれた関連データの形態の「製品」または「製造品」であると考えられうる。機械
実行可能コードは、電子記憶装置、例えばメモリ(例えば、リードオンリメモリ、ランダ
ムアクセスメモリ、フラッシュメモリ)またはハードディスクに格納されうる。「記憶(
ストレージ)」タイプのメディアには、コンピュータ、プロセッサなどの有形メモリ、ま
たは関連モジュール、例えば種々の半導体メモリ、テープドライブ、ディスクドライブな
どのありとあらゆるものが含まれることが可能であり、それらはソフトウェアプログラミ
ングのために任意の時点で非一時的ストレージを提供しうる。ソフトウェアの全部または
一部は、時には、インターネットまたは種々の他のテレコミュニケーションネットワーク
を介して通信されうる。そのような通信は、あるコンピュータまたはプロセッサから別の
コンピュータまたはプロセッサへ、例えば、管理サーバまたはホストコンピュータからア
プリケーションサーバのコンピュータプラットフォームへの、ソフトウェアのロードを可
能にしうる。したがって、ソフトウェア要素を担いうる別のタイプの媒体には、有線およ
び光陸線ネットワークならびに種々のエアリンクを介してローカルデバイス間の物理イン
タフェースを越えて使用されるような、光波、電波および電磁波が含まれる。そのような
波を運ぶ物理的要素、例えば有線または無線リンク、光リンクなども、ソフトウェアを担
持する媒体とみなされうる。本明細書中で用いる、コンピュータまたは機械「可読媒体」
のような語は、非一時的な有形「記憶」媒体に限定されない限り、実行のためにプロセッ
サに命令を与えることに関与する任意の媒体を意味する。
【0281】
したがって、機械可読媒体、例えばコンピュータ実行可能コードは、有形記憶媒体、搬
送波媒体または物理的伝送媒体(これらに限定されるものではない)を含む多数の形態を
取りうる。不揮発性記憶媒体には、例えば、光学または磁気ディスク、例えば、任意のコ
ンピュータなどにおける記憶装置のいずれか、例えば、図面に示されているデータベース
を実行するために使用されうるものが含まれる。揮発性記憶媒体には、動的メモリ、例え
ば、そのようなコンピュータプラットフォームのメインメモリが含まれる。有形伝送媒体
には、同軸ケーブル、銅線および光ファイバ(コンピュータシステム内のバスを構成する
ワイヤを含む)が含まれる。搬送波伝送媒体は、電気または電磁信号、あるいは音響波ま
たは光波、例えば、無線周波数(RF)および赤外線(IR)データ通信中に生成される
ものの形態を取りうる。したがって、コンピュータ可読媒体の一般的な形態には、例えば
、フロッピーディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他
の磁気媒体、CD-ROM、DVDまたはDVD-ROM、任意の他の光学媒体、パンチ
カード紙テープ、ホールのパターンを有する任意の他の物理的記憶媒体、RAM、ROM
、PROMおよびEPROM、FLASH-EPROM、任意の他のメモリチップまたは
カートリッジ、データまたは命令を搬送する搬送波、そのような搬送波を搬送するケーブ
ルまたはリンク、あるいはコンピュータがプログラミングコードおよび/またはデータを
読取りうる任意の他の媒体が含まれうる。コンピュータ可読媒体のこれらの形態の多くは
、実行のために1以上の命令のシーケンスの1以上をプロセッサに搬送することに関与し
うる。
【0282】
コンピュータシステム701は、電子ディスプレイ735を含むことが可能であり、ま
たは電子ディスプレイ735と通信可能であり、電子ディスプレイ735は、対象の診断
または対象に対する治療的介入を含みうる報告の出力を提供するユーザインターフェース
(UI)740を含む。UIの例には、限定的なものではないが、グラフィカルユーザイ
ンタフェース(GUI)およびウェブベースユーザインタフェースが含まれる。分析は報
告として提供されうる。報告は対象、医療従事者、研究者または他の個人に提供されうる
【0283】
本開示の方法およびシステムは1以上のアルゴリズムにより実行されうる。アルゴリズ
ムは、中央処理ユニット705による実行に際してソフトウェアにより実行されうる。ア
ルゴリズムは、例えば、病原体または他の標的核酸の富化、配列決定および/または検出
を容易にしうる。
【0284】
患者または対象に関する情報、例えば患者の背景、患者の病歴または医学的スキャンが
コンピュータシステムに入力されうる。コンピュータシステムは、本明細書に記載されて
いる方法からの結果を分析するため、あるいは結果を患者または医師に報告するため、あ
るいは治療計画を策定するために使用されうる。
【0285】
試薬およびキット
本明細書に記載されている方法の1以上を行うための試薬およびそのキットも提供する
。該試薬およびそのキットは多種多様でありうる。関心のある試薬には、対象から得られ
たサンプルにおける1以上の病原体または他の標的核酸の特定、検出および/または定量
における使用のために特別に設計された試薬が含まれる。該キットは、本明細書に記載さ
れている方法、例えばPCRおよび配列決定を用いて核酸抽出および/または核酸検出を
行うのに必要な試薬を含みうる。該キットは更に、データ解析用のソフトウェアパッケー
ジを含むことが可能であり、これは、試験プロファイルとの比較のための参照プロファイ
ルを含むことが可能であり、特に、参照データベースを含みうる。該キットは、試薬、例
えばバッファーおよび水を含みうる。
【0286】
そのようなキットはまた、情報、例えば科学文献リファレンス、添付文書資料、臨床試
験結果および/またはこれらの概要などを含むことが可能であり、これらは、該組成物の
活性および/もしくは利点を示し、もしくは確定し、および/または用量、投与、副作用
、薬物相互作用、もしくは医療提供者にとって有用な他の情報を記載している。そのよう
なキットは、データベースにアクセスするための説明をも含みうる。そのような情報は、
種々の研究の結果、例えば、インビボモデルを含む実験動物を用いる研究およびヒト臨床
試験に基づく研究に基づくものでありうる。本明細書に記載されているキットは、医師、
看護師、薬剤師、処方職員などを含む医療提供者に提供、販売および/または宣伝されう
る。キットはまた、幾つかの実施形態においては、消費者に直接販売されうる。
【0287】
本開示は、配列決定ライブラリーを製造するためのキットをも提供する。該キットは、
本明細書に記載されている少なくとも1つの合成核酸、および配列決定ライブラリー反応
のための試薬を含みうる。幾つかの場合には、該キットは、1以上の配列決定アダプター
および1以上の担体(carrier)核酸を含む。該キットにおける担体核酸は、i)
末端修復に抵抗性である1以上の担体核酸、ii)連結に抵抗性である1以上の担体核酸
、iii)増幅に抵抗性である1以上の担体核酸、iv)固定化タグを含む1以上の担体
核酸、v)サイズに基づく枯渇を可能にするサイズを有する1以上の担体核酸、および/
またはvi)それらの任意の組合せを含みうる。例えば、該キットは、1以上の配列決定
アダプター、および末端修復に抵抗性である1以上の担体核酸を含みうる。
【0288】
キットにおける配列決定ライブラリーアダプターの量および1以上の担体核酸の量は一
定の比率でありうる。幾つかの場合には、配列決定ライブラリーアダプターの量と1以上
の担体核酸の量との比は、1:10、1:5、1:1、5:1、10:1、20:1、5
0:1、100:1、500:1、または1000:1以下である。例えば、配列決定ラ
イブラリーアダプターの量と1以上の担体核酸の量との比は1:1以下でありうる。
【0289】
担体核酸(CNA)
本開示は、担体(carrier)核酸(CNA)、特に、配列決定アッセイの工程の
1以上からそれを除外するように設計された特徴を含有する密かな(surreptit
ious)CNAを提供する。本開示はまた、配列決定アッセイの工程の1以上を回避し
うるCNAを使用する方法を提供する。本発明で提供するCNAは密かに作用しうるが、
それらは、一般に、サンプルにおける全核酸量を増加させることが可能であり、それによ
り、典型的な「担体」核酸として作用しうる。担体核酸は、一般に、サンプルから配列決
定ライブラリーを製造する際の収率および/または効率を改善するために核酸量を増加さ
せ、最終的に配列決定アッセイの精度および/または感度を改善しうる。本発明で提供す
る修飾CNAを含む担体核酸の添加は、サンプルが少量(例えば、1ng未満)の標的核
酸を含有する場合に特に有用でありうる。なぜなら、核酸の量が少ないと、ライブラリー
製造の1以上の工程(例えば、核酸抽出、核酸精製、核酸末端修復、アダプター連結など
)または配列決定アッセイにおける後の工程(例えば、増幅)の効率および/または収率
が低下しうるからである。DNAおよび/またはRNAに基づく核酸は、それらの構造的
形態がいずれであっても、および/または1以上の化学修飾を伴う場合も伴わない場合も
、関心のある核酸サンプルにCNAとして添加されうる。典型的には、CNAは、例えば
阻害によっても、あるいは、配列決定スループットの過度な部分を占めることによっても
、核酸配列決定を妨げない。幾つかの場合には、DNAサンプルおよび/またはRNAサ
ンプルにDNA CNAを添加する。幾つかの場合には、DNAサンプルおよび/または
RNAサンプルにRNA CNAを添加する。
【表6】
【0290】
本発明で提供するCNAは、配列決定ライブラリー製造の工程の1以上、例えば、末端
修復、断片化、増幅、連結および配列決定を回避するように設計または修飾されうる。C
NAは配列決定ライブラリー製造における1以上の工程に添加されうる。例えば、図8
示されているとおり、CNAは、サンプル採取802の途中もしくは直後、サンプル調製
、例えば血漿803の単離の途中もしくは後、核酸単離804もしくは抽出805の前、
途中もしくは後、核酸精製の前、途中もしくは後に、核酸806の末端修復の前、途中も
しくは後、連結807もしくは核酸にアダプターを結合させるための他の操作の前、途中
もしくは後、および/または増幅808の前もしくは途中に添加されうる。幾つかの場合
には、CNAは、例えば、酵素消化、アフィニティに基づく枯渇および/またはサイズに
基づく枯渇により、配列決定アッセイにおける工程から除去されうる。例えば、本発明で
提供するCNAは、それが配列決定ライブラリーに含まれないように、配列決定アッセイ
の工程から物理的に除去されうる。幾つかの場合に は、CNAは配列決定ライブ
ラリー自体から物理的に除去されうる。
【0291】
結合に抵抗するCNA
本発明で提供するCNAは、1以上の配列決定アダプターおよび/または標的核酸のよ
うな他の分子に対する結合または連結に抵抗しうる(抵抗性でありうる)。幾つかの場合
には、CNAは、アダプターがCNAよりも優先的に標的核酸に優先的に連結するように
設計されうる。アダプターまたは標的核酸への連結または結合を回避することにより、C
NAは配列決定されることも回避されうる。
【0292】
幾つかの場合、特に、サンプルにおける核酸にアダプターを結合させるために連結を用
いる場合には、CNAは、連結反応に加わることに抵抗するように設計されうる。一般に
、連結反応は、2つの核酸をホスホジエステル結合により連結することを含む。幾つかの
場合には、CNAは、連結反応に抵抗する二次構造(例えば、一本鎖構造、ヘアピン構造
)を有するように設計されうる。二次構造はRNA、DNA、ssDNA、dsDNA、
DNA-RNAハイブリッドおよび/または他の特徴を含みうる。幾つかの場合には、C
NAは、連結を妨げるように設計されたブロッキング基または他の構造を含有しうる。
【0293】
本発明で提供するCNAは、結合または連結に抵抗し又はそれらを低減するように設計
された一本鎖および/または二本鎖二次構造を含有しうる。CNAは1以上の一本鎖領域
を含有することが可能であり、あるいは全体が一本鎖でありうる。一本鎖領域はCNAの
任意の位置に存在しうるが、幾つかの好ましい場合には、CNAは、その末端付近または
末端の一方もしくは両方に一本鎖領域を含有する。例えば、CNAは、一方または両方の
末端から50ヌクレオチド以内に、例えば、一方または両方の末端から50nt、45n
t、40nt、35nt、30nt、25nt、20nt、15nt、10ntまたは5
nt以内に、一本鎖領域を含有しうる。幾つかの好ましい場合には、CNAは、その末端
の一方または両方(例えば、5’末端、3’末端)に一本鎖領域を含有しうる。幾つかの
場合には、CNAは全体が二本鎖であることが可能であり、あるいは、二本鎖である領域
を単に含有することが可能である。二次構造(特にヘアピンループ)は、リガーゼによる
CNAの結合および/または認識を妨げうる。幾つかの場合には、CNAはY字型二本鎖
核酸を含有することが可能であり、その結果、CNAのY字型部分は別の核酸に連結また
は結合できない。
【0294】
本発明で提供するCNAに存在しうるヘアピン構造は、一般に、ループおよびハイブリ
ダイゼーション領域、例えばヘアピンステムを有する。例えば、ヘアピンは、二本鎖ハイ
ブリダイゼーション領域を形成する2つの相補的領域と、それらの2つの相補的領域を連
結するループとを含みうる。相補的領域は少なくとも5、10、15、20、30、40
、50ヌクレオチドを含みうる。ループ領域は少なくとも3、4、5、10、15、20
、30、40、50ヌクレオチドを含みうる。一般に、ヘアピン構造は、しばしば、結合
を伴わない一本鎖核酸であるため、製造が比較的容易でありうる。ヘアピンはRNAまた
はDNAを含有しうる。
【0295】
本発明で提供するCNAは、結合または連結に抵抗しまたはそれを低減しうる環状構造
を含有しうる。環状構造は環状DNA、環状RNAまたは環状DNA-RNAハイブリッ
ドでありうる。幾つかの場合には、環状構造は環状DNAである。環状構造は二本鎖また
は一本鎖でありうる。環状構造は、特定の長さ、例えば少なくとも5nt、10nt、2
0nt、30nt、32nt、40nt、50nt、60nt、70nt、80nt、9
0nt、100nt、120nt、140nt、160nt、180nt、200nt、
250nt、300nt、400nt、500ntまたは1000ntのものでありうる
。幾つかの場合には、環状構造は約30~約100ヌクレオチドを含む。幾つかの場合に
は、環状構造は約10ヌクレオチド~約10,000ヌクレオチドの範囲内、例えば約1
00ヌクレオチド~約1,000ヌクレオチドの範囲内のサイズを有しうる。環状構造が
二本鎖である場合、環状構造は少なくとも10bp、20bp、30bp、40bp、5
0bp、60bp、70bp、80bp、90bp、100bp、200bp、250b
p、300bp、400bp、500bpまたは1000bpのサイズを有しうる。幾つ
かの場合にて、二本鎖環状構造は約30bp~100bpを含む。幾つかの場合には、二
本鎖環状構造は、約10塩基対~約10,000塩基対の範囲内、例えば、約100塩基
対~約1,000塩基対の範囲内のサイズを有しうる。幾つかの場合には、環状構造は、
ある酵素、例えばエンドヌクレアーゼからの消化に対してCNAが抵抗性となることを可
能にしうる。例えば、CNAは二本鎖環状構造を含有することが可能であり、エンドヌク
レアーゼ、例えば、二本鎖線状DNAを消化するが二本鎖環状DNAを消化しないエンド
ヌクレアーゼによる消化に抵抗しうる。幾つかの場合には、CNAは、大部分または全体
が環状であり、例えば、環状二本鎖DNA、環状一本鎖DNAである。幾つかの場合には
、CNAは、エンドヌクレアーゼ、例えば、CNAの二次構造に結合しないおよび/また
はそれを認識しないエンドヌクレアーゼによる消化に抵抗する二次構造を含む。例えば、
CNAは、一本鎖DNAを認識するが二本鎖DNAを認識しないエンドヌクレアーゼによ
る消化に抵抗する二本鎖DNAを含みうる。もう1つの例では、CNAは、二本鎖DNA
を認識するが一本鎖DNAを認識しないエンドヌクレアーゼによる消化に抵抗する一本鎖
DNAを含みうる。
【0296】
幾つかの場合には、CNAは、1以上のニック(切れ目)を有する二本鎖である。ニッ
クは二本鎖核酸分子において不連続性であることが可能であり、この場合、該鎖の1つの
隣接ヌクレオチド間にホスホジエステル結合が存在しない。ニックは酵素(例えば、ニッ
キングエンドヌクレアーゼ)により生成されうる。幾つかの場合には、ニックは酵素(例
えば、リガーゼ)により連結されうる。ある場合には、ニックはエキソヌクレアーゼ消化
および/または連結から保護される。
【0297】
CNAは、連結反応に抵抗する1以上の修飾(例えば、修飾ヌクレオチド)を含みうる
。幾つかの場合には、修飾は、核酸にCNAが連結するのを妨げるブロッキング基であり
うる。例えば、CNAは3’末端、5’末端または両末端にブロッキング基を有しうる。
ブロッキング基は、反転(inverted)デオキシ糖を含みうる。反転デオキシ糖は
反転デオキシ糖、反転ジデオキシ糖または他の反転デオキシ糖でありうる。反転デオキシ
糖は3’反転デオキシ糖または5’反転ジデオキシ糖でありうる。例えば、ブロッキング
基は3’反転チミジン(dT)、3’反転アデノシン(dA)、3’反転グアノシン(d
G)、3’反転シチジン(dC)、3’反転デオキシウラシル(dU)、5’反転ジデオ
キシチミジン(ddT)、5’反転ジデオキシアデノシン(ddA)、5’反転ジデオキ
シグアノシン(ddG)、5’反転ジデオキシシチジン(ddC)、5’(反転)ジデオ
キシウラシル(ddU)またはそれらの任意の類似体でありうる。幾つかの場合には、C
NAは3’反転チミジンを含む。幾つかの場合には、CNAは5’反転ジデオキシチミジ
ンを含む。幾つかの場合には、CNAは3’反転チミジンおよび/または5’反転ジデオ
キシチミジンを含む。幾つかの場合には、ブロッキング基はジデオキシシチジンを含む。
幾つかの場合には、修飾はウラシル(U)塩基、2’OMe修飾RNA、C3-18スペ
ーサー(例えば、3~18個の連続炭素原子を有する構造)、ビオチン、ジ-デオキシヌ
クレオチドトリホスファート、エチレングリコール、アミンおよび/またはホスファート
(リン酸)を含む。
【0298】
増幅に抵抗する担体核酸
CNAは、核酸増幅を阻害することにより配列決定反応においてCNAが増幅されるこ
とを妨げる1以上の核酸修飾を含みうる。幾つかの場合には、修飾は、例えば、ポリメラ
ーゼを機能停止または阻害(例えば、機能低下)することにより、核酸ポリメラーゼの機
能を妨げうる。幾つかの場合には、修飾は1以上の脱塩基(abasic)部位を含みう
る。脱塩基部位は、塩基を有さない核酸内の位置を意味しうる。例えば、核酸内の脱塩基
部位は、塩基を有さない1’末端に存在しうる。脱塩基部位はアプリンもしくはアピリミ
ジン構造、塩基類似体またはリン酸骨格類似体を有しうる。幾つかの場合には、脱塩基部
位は、アミド結合により連結されたN-(2-アミノエチル)-グリシン、テトラヒドロ
フランまたは1’,2’-ジデオキシリボース(dSpacer)を有する。幾つかの場
合には、修飾は、脱塩基部位および修飾糖残基、例えば、3個の炭素原子を含有する糖残
基、例えば、部分リボース構造(例えば、3’、4’、5’末端炭素原子のみが保持され
ている)を含むことが可能であり、それにより、骨格(バックボーン)に沿った接続性が
維持されうる。
【0299】
脱塩基部位は、CNAをポリメラーゼが増幅するのを妨げうる。幾つかの場合には、C
NAにおける脱塩基部位はポリメラーゼ(例えば、Taqポリメラーゼ)を脱塩基部位1
個当たり1桁阻害しうる。
【0300】
本発明で提供するCNAは複数の脱塩基部位、例えば、複数の内部脱塩基部位および1
以上の他の特徴を含みうる。CNAは、1以上のライブラリー生成反応に加わることを妨
げる特徴を含みうる。例えば、CNAは1以上の内部脱塩基部位、3’反転dTおよび/
または5’反転ddTを任意の組合せで含みうる。
【0301】
幾つかの場合には、CNAは、核酸増幅を阻害する他の修飾を含みうる。幾つかの場合
には、核酸増幅を阻害する修飾には、ウラシル(U)塩基、2’OMe修飾RNA、C3
-18スペーサー(例えば、C3スペーサーのような3~18個の連続炭素原子を有する
構造)、エチレングリコール多量体スペーサー(例えば、スペーサー18(ヘキサ-エチ
レングリコールスペーサー)、ビオチン、ジ-デオキシヌクレオチドトリホスファート、
エチレングリコール、アミンおよび/またはホスファート)が含まれる。
【0302】
修飾
CNAは少なくとも1、2、3、4、5、6、7、8、9、10個またはそれ以上の修
飾(例えば、脱塩基部位)を含みうる。CNAが複数の修飾(例えば、核酸増幅を阻害す
る修飾)を含む場合、修飾はクラスター化されうる(例えば、修飾は互いに隣接して連続
して位置する)。幾つかの場合には、1以上の修飾がCNAの5’末端に存在する。幾つ
かの場合には、1以上の修飾がCNAの3’末端に存在する。幾つかの場合には、前記の
1以上の修飾はCNAの3’末端および5’末端の両方に存在する。幾つかの場合には、
前記の1以上の修飾はCNAの内部位置に存在する。例えば、CNAは、1以上の内部d
spacer(idsp)を含みうる。
【0303】
本明細書に記載されている修飾には、2-アミノプリン、2,6-ジアミノプリン、5
-ブロモdU、デオキシウリジン、反転dT、反転ジデオキシ-T、ジデオキシ-C、5
-メチルdC、デオキシノシン、汎用塩基、例えば5-ニトロインドール、2’-O-メ
チルRNA塩基、イソ-dC、イソ-dG、リボヌクレオチド、モルホリノ、タンパク質
ヌクレオチド類似体、糖ヌクレオチド類似体、ロックド(Locked)ヌクレオチド類
似体、トレオースヌクレオチド類似体、鎖終結ヌクレオチド類似体、チオウリジン、プソ
イドウリジン、ジヒドロウリジン、キューオシン、ワイオシンヌクレオチド、脱塩基部位
、官能基、例えばアルキン官能基、アジド官能基、例えばアジド(NHSエステル、非天
然結合、例えばホスホロチオアート結合、スペーサー、例えば2’-ジデオキシリボース
(dSpacer)、ヘキサンジオール、光切断性スペーサー、種々の数の炭素原子を有
する種々の長さのスペーサー、例えばC3スペーサーホスホラミダイト、C9スペーサー
、例えばトリエチレングリコールスペーサー、CI8(18原子ヘキサエチレングリコー
ルスペーサー)が含まれうる。そのようなスペーサーはCNAまたはアダプターの5’末
端または3’末端または内部に組み込まれうる。更に、CNAの少なくとも1つの鎖は、
例えば、5’ホスファートまたは3’ホスファート(例えば、相補鎖上)のいずれかまた
は両方を含むように、リン酸化により修飾されうる。
【0304】
酵素認識部位
CNAは、配列決定ライブラリーからCNAが除去されることを可能にする特徴を含み
うる。そのような特徴は酵素認識部位を含みうる。例えば、CNAは、合成核酸が酵素に
より分解されうるように、1以上の酵素認識部位を含みうる。幾つかの場合には、CNA
は、標的核酸およびアダプターに存在しない1以上の酵素認識部位を含みうる。したがっ
て、担体核酸は、標的核酸またはアダプターの酵素分解をもたらすことなく、認識部位を
標的とする酵素により除去されうる。
【0305】
幾つかの場合には、CNAはヌクレアーゼ認識部位を含みうる。例えば、ヌクレアーゼ
認識部位はエンドヌクレアーゼ認識部位でありうる。エンドヌクレアーゼはI型、II型
(IIS型、IIG型を含む)、III型またはIV型エンドヌクレアーゼでありうる。
幾つかの場合には、エンドヌクレアーゼ認識部位は制限ヌクレアーゼ認識部位である。例
えば、エンドヌクレアーゼ認識部位は、AatII、Acc65I、AccI、AclI
、AatII、Acc65I、AccI、AclI、AfeI、AflII、AgeI、
ApaI、ApaLI、ApoI、AscI、AseI、AsiSI、AvrII、Ba
mHI、BclI、BglII、Bme1580I、BmtI、BsaHI、BsiEI
、BsiWI、BspEI、BspHI、BsrGI、BssHII、BstBI、Bs
tZ17I、BtgI、ClaI、DraI、EaeI、EagI、EcoRI、Eco
RV、FseI、FspI、HaeII、HincII、HindIII、HpaI、K
asI、KpnI、MfeI、MluI、MscI、MspA1I、MfeI、MluI
、MscI、MspA1I、NaeI、NarI、NcoI、NdeI、NgoMIV、
NheI、NotI、NruI、NsiI、NspI、PacI、PciI、PmeI、
PmlI、PsiI、PspOMI、PstI、PvuI、PvuII、SacI、Sa
cII、SalI、SbfI、ScaI、SfcI、SfoI、SgrAI、SmaI、
SmlI、SnaBI、SpeI、SphI、SspI、StuI、SwaI、XbaI
、XhoIまたはXmaIの認識部位でありうる。酵素認識部位は、前記で挙げられてい
ないDNアーゼ、例えばエキソデオキシリボヌクレアーゼの部位でありうる。酵素認識部
位はウラシルDNAグリコシラーゼ(UDG)、DNAグリコシラーゼ-リアーゼ(エン
ドヌクレアーゼVIII)またはそれらの混合物(例えば、ウラシル特異的切断試薬(U
SER)酵素)の部位でありうる。例えば、CNAは1以上のウラシル(例えば、内部ウ
ラシル)を含みうる。酵素認識部位はRNA誘導DNアーゼの部位、例えばCRISPR
関連タンパク質ヌクレアーゼ、例えばCas9の部位でありうる。ある場合には、ヌクレ
アーゼ認識部位は、RNアーゼ、例えばエンドリボヌクレアーゼ、例えばRNアーゼA、
RNアーゼH、RNアーゼIII、RNアーゼL、RNアーゼP、RNアーゼPhyM、
RNアーゼT1、RNアーゼT2、RNアーゼU2、RNアーゼV、またはエキソリボヌ
クレアーゼ、例えばポリヌクレオチドホスホリラーゼ、RNアーゼPH、RNアーゼR、
RNアーゼD、RNアーゼT、オリゴリボヌクレアーゼ、エキソリボヌクレアーゼIまた
はエキソリボヌクレアーゼIIの認識部位でありうる。幾つかの特定の例では、CNAは
制限酵素認識部位を含むことが可能であり、本発明で提供する方法は、そのような部位を
認識する制限酵素でCNAを消化することを含みうる。幾つかの場合には、CNAは、酵
素(例えば、CNAに結合しおよび/またはCNAを分解する酵素)、リボザイム、アプ
タマーおよびDNAに基づく触媒または結合ポリマーにより認識されうる二次または三次
構造を含む。幾つかの場合には、CNAは、酵素により認識されうる1以上の特異的結合
性核酸配列を含む。
【0306】
幾つかの場合には、CNAは、DNアーゼまたはRNアーゼにより分解されうるDNA
-RNAハイブリッドを含みうる。幾つかの場合には、CNAはDNA-RNA-DNA
ハイブリッドを含む。そのような分子は二本鎖でありうる。CNAの末端領域はデオキシ
リボヌクレオチドを含みうる。内部領域はリボヌクレオチドを含みうる。幾つかの場合に
は、DNA-RNAハイブリッドは標的核酸またはアダプターに連結することが可能であ
り、ついでDNA-RNAハイブリッドは配列決定の前(例えば、増幅工程の前)にRN
アーゼにより消化されうる。幾つかの特定の場合には、DNA-RNAハイブリッドは(
例えば、RNアーゼにより)消化され、一方、標的核酸(例えばDNA、例えば無細胞D
NA)はRNアーゼによっては消化されない。
【0307】
CNAのDNA部分が、増幅に抵抗するのに十分な程度に長い場合には、配列決定の前
にDNA-RNAハイブリッドを除去するためのRNアーゼ消化工程は必要ないかもしれ
ない。あるいは、DNA-RNAハイブリッド分子が増幅前に酵素消化により分解される
場合には、DNA-RNAハイブリッドは、増幅に抵抗するサイズまたは長さを有する必
要がないかもしれない。
【0308】
サイズに基づく枯渇のためのCNA
CNAは、サイズに基づく枯渇(depletion)により配列決定ライブラリーか
ら分離されうるサイズを有しうる。幾つかの場合には、CNAは、標的核酸の長さよりも
長い、または標的核酸の平均長よりも長い長さを有する。例えば、CNAは、標的核酸の
長さ又は標的核酸の平均長より少なくとも1.5、2、3、4、5、10、20または5
0倍長い長さを有しうる。CNAは少なくとも150bp、200bp、300bp、4
00bp、500bp、600bp、800bp、1kb、2kb、5kbまたは10k
bの長さを有しうる。例えば、CNAは少なくとも500bpの長さを有しうる。幾つか
の場合には、CNAは約150bp~約1000bpの範囲内のサイズを有しうる。幾つ
かの場合には、CNAは2kbまでのサイズを有しうる。幾つかの場合には、CNAの長
さは標的核酸の長さまたは標的核酸の平均長より短い。例えば、CNAは標的核酸の長さ
または標的核酸の平均長の多くとも99%、95%、90%、80%、60%、50%、
40%、20%または10%の長さを有しうる。幾つかの場合には、CNAは標的核酸の
サイズまたは標的核酸の平均サイズの多くとも50%のサイズを有しうる。ある場合には
、CNAは標的核酸または標的核酸の平均長と実質的に同じ長さを有する。
【0309】
サイズに基づく枯渇を可能にするサイズまたは長さを有するCNAは、本開示に記載さ
れている任意の修飾、例えば、連結、増幅、末端修復またはそれらの組合せを妨げるため
の修飾を含有しうる。幾つかの場合には、CNAの末端の一方または両方は該修飾の1以
上を含有しうる。幾つかの場合には、修飾は内部修飾、例えば内部脱塩基部位、または末
端修飾と内部修飾との組合せでありうる。
【0310】
幾つかの特定の例においては、CNAは、サイズに基づく枯渇を可能にする、より長い
長さ、および連結を妨げる反転塩基のような修飾(例えば、末端修飾など)を有しうる。
連結を防止するまたは妨げる構造の他の組合せも可能である(例えば、ヘアピンループ、
ヘアピンループと末端修飾との組合せ)。幾つかの場合には、CNAは1以上のヘアピン
構造および1以上の脱塩基部位を含みうる。幾つかの特定の場合には、CNAは、500
bpを超えるサイズまたは長さを有することが可能であり、3’反転dT、5’反転dd
T、C3スペーサー、またはスペーサー18、またはヘアピン構造(一方の末端に存在す
る)を有しうる。幾つかの特定の場合には、CNAは、600bpを超えるサイズまたは
長さを有することが可能であり、3’反転dT、5’反転ddT(一方の末端に存在する
)および1以上の内部脱塩基部位を有しうる。
【0311】
固定化タグ
CNAは1以上の固定化タグを含みうる。固定化タグは、アフィニティに基づく枯渇に
よる溶液(例えば、配列決定ライブラリーの溶液)からCNAを除去するために使用され
うる。例えば、固定化タグは固体支持体、例えばビーズまたはプレートに結合しうる。溶
液を固体支持体に接触させた際に、CNAは溶液から除去されうる。1以上の固定化タグ
を含むCNAは標的核酸より短いことが可能である。あるいは、CNA分子は、例えば、
配列決定反応へのCNAの持ち越し(キャリーオーバー)を最小限に抑えるために、標的
核酸より長いことが可能である。
【0312】
固定化タグには、ビオチン、ジゴキシゲニン、Ni-ニトリロトリ酢酸、デスチオビオ
チン、ヒスチジン、ポリヒスチジン、myc、ヘマグルチニン(HA)、FLAG、蛍光
タグ、タンデムアフィニティー精製(TAP)タグ、グルタチオンSトランスフェラーゼ
(GST)、ポリヌクレオチド、アプタマー、ポリペプチド(例えば、抗原または抗体)
またはそれらの誘導体が含まれうる。例えば、CNAはビオチン、例えば、内部または末
端ビオチン化鎖を含みうる。幾つかの場合には、固定化タグは磁気感受性材料、例えば磁
石、または磁気感受性金属を含みうる。幾つかの特定の例においては、ビオチン化CNA
は、増幅工程の前に、サンプルまたは配列決定ライブラリーからの、CNAの、磁気ビー
ズに基づく枯渇(例えば、アビジン-磁気ビーズによるもの)を可能にしうる。幾つかの
場合には、CNAは、固体支持体に結合しうる又は固定化タグに結合しうる二次または三
次構造を含む。
【0313】
幾つかの場合には、標的核酸および/または配列決定ライブラリー核酸は1以上の固定
化タグを含む。これらの場合には、CNAは固定化タグを含まず、または標的核酸とは異
なる固定化タグを含む。したがって、CNAは、異なる固定化タグを使用する、アフィニ
ティに基づく枯渇により、標的核酸および/または配列決定ライブラリ核酸から分離され
うる。例えば、標的核酸および/または配列決定ライブラリー核酸は固体支持体上に固定
化されることが可能であり、一方、CNAは洗い流されうる。幾つかの場合には、CNA
は直接的または間接的に固定化タグに連結される。幾つかの場合には、CNAは固定化タ
グから切断される。
【0314】
CNAは、本明細書に開示されている特徴および構造の組合せを含みうる。幾つかの場
合には、CNAは、核酸増幅を阻害する1以上の修飾と、連結反応に抵抗する1以上の修
飾とを含む。例えば、CNAは1以上の脱塩基部位(例えば、内部dspacer)およ
び反転デオキシ塩基(例えば、3’反転チミジン)を含みうる。修飾を含むCNAは更に
、酵素認識部位および/または固定化タグを含みうる。ある場合には、CNAは、1以上
の固定化タグを有するDNA-RNAハイブリッド、例えばビオチン化DNA-RNA-
DNAハイブリッド分子を含む。CNAは、特定の酵素またはタンパク質、非アミノ酸に
基づく任意の触媒またはアフィニティ単位、例えばリボザイム、DNAに基づく触媒高分
子および分子刷込高分子に対して高いアフィニティを有する核酸の二次および/または三
次構造をも有しうる。
【0315】
サンプルにおける核酸に対する担体核酸の比
例えば、サンプルにおける核酸から配列決定ライブラリーを製造するために、核酸を含
むサンプルに特定の量のCNAが添加されうる。幾つかの場合には、サンプルにおける全
核酸の量とサンプルに添加されるCNAの量との比は少なくとも1:100,1:50、
1:10、1:1、10:1、50:1、100:1、500:1、1000:1、20
00:1、または5000:1である。幾つかの場合には、サンプルにおける標的核酸の
量とサンプルに添加されるCNAの量との比は少なくとも1:100、1:50、1:1
0、1:1、10:1、50:1、100:1、500:1、1000:1、2000:
1または5000:1である。幾つかの場合には、サンプルにおける全核酸の量とサンプ
ルに添加されるCNAの量との比は多くとも10:1、1:1、1:10、1:50、1
:100、1:500、1:1000、1:2000または1:5000である。幾つか
の場合には、サンプルにおける標的核酸の量とサンプルに添加されるCNAの量との比は
多くとも10:1、1:1、1:10、1:50、1:100、1:500、1:100
0、1:2000または1:5000である。幾つかの場合には、サンプルにおける全核
酸の量とサンプルに添加されるCNAの量との比は約1:1~約1:100の範囲内であ
る。幾つかの場合には、サンプルにおける標的核酸の量とサンプルに添加されるCNAの
量との比は約1:1~約1:100の範囲内である。幾つかの場合には、該比はモル比で
ある。
【0316】
配列決定ライブラリーを製造する際のCNAの使用方法
本明細書の開示は配列決定ライブラリーの製造方法を含む。該方法は、配列決定ライブ
ラリーの製造の効率および/または収率を改善するために、本明細書に開示されているC
NAを添加することを含みうる。配列決定ライブラリーは、配列決定に付される核酸分子
の集団を意味しうる。該方法は、標的核酸および/またはアダプター(例えば、配列決定
アダプター)を含むサンプル、ならびに1以上のCNAを得ることを含みうる。該方法は
更に、配列決定ライブラリーを製造するための1以上を含みうる。該方法はまた、配列決
定ライブラリーにおける1以上の核酸を配列決定することを含みうる。CNAは配列決定
されないことが可能である。例えば、CNAはライブラリーから物理的に除去されること
が可能であり、あるいは、配列決定ライブラリーの製造における1以上の工程にそれが関
与しないように設計されることが可能である。
【0317】
該方法は、標的核酸および/またはアダプターを含むサンプルにCNAを添加すること
を含みうる。サンプルに添加されるCNAの量は少なくとも0.1ng、0.5ng、1
ng、5ng、10ng、20ng、30ng、40ng、50ng、60ng、70n
g、80ng、90ng、100ng、150ng、200ng、300ng、400n
gまたは500ngである。幾つかの場合には、CNAの量は0.1ng~200ng、
1ng~100ng、5ng~80ng、10~60ng、または20ng~50ngで
ありうる。サンプルにおけるCNAの濃度は少なくとも0.1ng/mL、0.5ng/
mL、0.6ng/mL、0.8ng/mL、1ng/mL、2ng/mL、5ng/m
L、10ng/mL、0.01ng/μL、0.05ng/μL、0.1ng/μL、0
.2ng/μL、0.4ng/μL、0.8ng/μL、1ng/μL、1.2ng/μ
L、1.5ng/μL、2ng/μL、5ng/μLまたは10ng/μLでありうる。
幾つかの場合には、サンプルに添加されるCNAの量は約1ng/15μL~約5ng/
15μLの範囲内でありうる。幾つかの場合には、サンプルに添加されるCNAの量は約
0.05ng/μL~約0.5ng/μLの範囲内でありうる。
【0318】
本明細書における方法は、本開示の全体にわたって記載されている任意のタイプの合成
核酸を添加することを含みうる。例えば、該方法は、以下の合成核酸、すなわち、配列決
定ライブラリーの製造のための合成核酸、標的核酸の相対的存在量を正規化するための合
成核酸(例えば、既知濃度の合成核酸)、および/またはサンプルにおける核酸の多様性
減少を決定するための合成核酸の1以上を添加することを含みうる。
【0319】
核酸抽出
該方法はサンプルから核酸(例えば、標的核酸、無細胞核酸)を抽出することを含みう
る。抽出は、サンプル中に存在しうる他の細胞成分および汚染物、例えば生物学的流体ま
たは組織サンプルから核酸を分離することを含みうる。幾つかの場合には、フェノールク
ロロホルム抽出または有機溶媒(例えば、エタノールまたはイソプロパノール)による沈
殿により抽出を行う。幾つかの場合には、核酸結合カラムを使用して抽出を行う。幾つか
の場合には、商業的に入手可能なキット、例えばQiagen Qiamp循環核酸キッ
ト(Circulating Nucleic Acid Kit) Qiagen Q
ubit dsDNA HSアッセイキット、Agilent(商標)DNA 1000
キット、TruSeq(商標)配列決定ライブラリー製造(Sequencing Li
brary Preparation)、または核酸結合スピンカラム(例えば、Qia
gen DNAミニプレップキット)を使用して抽出を行う。幾つかの場合には、無細胞
核酸の抽出は濾過または限外濾過を含みうる。
【0320】
CNAは抽出の前または途中にサンプルに添加されうる。例えば、担体核酸は、それが
抽出試薬、例えば抽出バッファーと混合される前に、サンプルに添加されうる。あるいは
、担体核酸は、抽出試薬、例えば抽出バッファーに添加され、ついでそれがサンプルと混
合されうる。ある場合には、CNAはサンプルと抽出試薬、例えば抽出バッファーとの混
合物にも添加されうる。これらの場合には、標的核酸およびCNAは同時に抽出されうる
【0321】
サンプルへのCNAの添加は核酸抽出の収率を増加させうる。標的核酸をCNAと共に
抽出する収率は、標的核酸をCNAの非存在下で抽出する収率よりも、例えば少なくとも
10%、20%、40%、60%、80%、100%、2倍、4倍、6倍、8倍または1
0倍高くなりうる。幾つかの場合には、CNAは、核酸抽出後に標的核酸を含むサンプル
に添加されうる。該抽出は少なくとも10ng、50ng、100ng、200ng、3
00ng、400ng、500ng、600ng、700ng、800ng、900ng
または1000ngの核酸を与えうる。
【0322】
核酸の精製
該方法は、標的核酸を精製することを含みうる。典型的な精製方法には、エタノール沈
殿、イソプロパノール沈殿、フェノールクロロホルム精製、およびカラム精製(例えば、
アフィニティに基づくカラム精製)、透析、濾過または限外濾過が含まれる。
【0323】
CNAは精製の前または途中にサンプルに添加されうる。例えば、担体核酸は、それが
精製試薬、例えば精製バッファーと混合される前に、サンプルに添加されうる。あるいは
、担体核酸は、精製試薬、例えば精製バッファーに添加され、ついでそれがサンプルと混
合されうる。ある場合には、CNAはサンプルと精製試薬、例えば精製バッファーとの混
合物にも添加されうる。これらの場合には、標的核酸およびCNAは同時に抽出されうる
【0324】
サンプルへのCNAの添加は核酸精製の収率を増加させうる。標的核酸をCNAと共に
精製する収率は、標的核酸をCNAの非存在下で精製する収率よりも、例えば少なくとも
10%、20%、40%、60%、80%、100%、2倍、4倍、6倍、8倍または1
0倍高くなりうる。幾つかの場合には、CNAは、核酸精製後に標的核酸を含むサンプル
に添加されうる。幾つかの場合には、CNAが添加されたサンプルにおける核酸の精製は
サンプルにおける全核酸の少なくとも1pg、10pg、50pg、100pg、500
pg、1ng、5ng、10ng、50ng、100ng、200ng、300ng、4
00ng、500ng、600ng、700ng、800ng、900ngまたは100
0ngを与える。幾つかの場合には、CNAが添加されたサンプルにおける核酸の精製は
サンプルにおける標的核酸の少なくとも1pg、10pg、50pg、100pg、50
0pg、1ng、5ng、10ng、50ng、100ng、200ng、300ng、
400ng、500ng、600ng、700ng、800ng、900ngまたは10
00ngを与える。
【0325】
断片化
該方法は、標的核酸を断片化することを含みうる。標的核酸の断片化は、例えば機械的
剪断、サンプルをシリンジに通すこと、超音波処理、加熱処理またはそれらの組合せによ
り行われうる。幾つかの場合には、標的核酸の断片化は、ヌクレアーゼまたはトランスポ
ザーゼを含む酵素を使用することにより行われる。断片化に使用されるヌクレアーゼは、
制限エンドヌクレアーゼ、ホーミングエンドヌクレアーゼ、ニッキングエンドヌクレアー
ゼ、高忠実度制限酵素、または本明細書に開示されている任意の酵素を含みうる。該方法
は、標的核酸を、ある長さ、例えば少なくとも50、60、80、100、120、14
0、160、180、200、300、400、500、1000、2000、4000
、6000、8000または10000bpの長さの断片に断片化することを含みうる。
CNAは標的核酸の断片化の前にサンプルに添加されうる。CNAは標的核酸の断片化の
後でサンプルに添加されうる。
【0326】
A-テーリング
該方法は、標的核酸に対してA-テーリング(tailing)を行うことを含みうる
。A-テーリング反応は、1以上のA-テーリング酵素を使用して行われうる。例えば、
単一の3’アデニン残基を付加する非プルーフリーディングDNAポリメラーゼおよびd
ATPと共にDNAをインキュベートすることにより、アデニン(A)残基を付加するこ
とが可能である。A-テーリングの前に、標的核酸を含むサンプルにCNAを添加するこ
とが可能である。あるいは、A-テーリングの後に、標的核酸を含むサンプルにCNAを
添加することが可能である。
【0327】
末端修復
該方法は、標的核酸に対して末端修復を行うことを含みうる。例えば、標的核酸が配列
決定ライブラリーの他の工程に適合しうるように、標的核酸に対して末端修復が行われう
る。末端修復反応は、1以上の末端修復酵素を使用して行われうる。DNAを修復するた
めの酵素はポリメラーゼおよびエキソヌクレアーゼを含みうる。例えば、ポリメラーゼは
、5’から3’の方向に、DNA鎖の欠失塩基を埋めることが可能である。得られる二本
鎖DNAは元の最長DNA鎖と実質的に同じ長さを有しうる。エキソヌクレアーゼは3’
オーバーハングを除去しうる。得られる二本鎖DNAは元の最短DNA鎖と実質的に同じ
長さを有しうる。
【0328】
CNAは、末端修復の前に、標的核酸を含むサンプルに添加されうる。幾つかの場合に
は、CNAの添加は末端修復反応の効率を、例えば少なくとも10%、20%、40%、
60%、80%または100%増加させる。幾つかの場合には、CNAは、末端修復の後
で、標的核酸を含むサンプルに添加されうる。幾つかの場合には、CNAの添加は、酵素
、例えば末端修復酵素の活性および/または機能を維持しうる。例えば、酵素は、核酸の
量が少ないサンプルにおいては、低下した活性または異常な機能を有する可能性があり、
CNAの添加はサンプルにおける全核酸量を増加させることが可能であり、その結果、酵
素はサンプルにおいて正常に機能することが可能である。
【0329】
アダプターの結合
該方法は、1以上のアダプターを標的核酸に結合させることを含みうる。アダプターは
、プライマー伸長、逆転写またはハイブリダイゼーションにより標的核酸に結合されうる
。幾つかの場合には、アダプターは連結により標的核酸に結合される。例えば、アダプタ
ーは、リガーゼにより標的核酸に結合されうる。例えば、アダプターは粘着末端連結また
は平滑末端連結により標的核酸に結合されうる。幾つかの場合には、アダプターはトラン
スポザーゼにより標的核酸に結合されうる。標的核酸は3’末端、5’末端またはそれら
の両方の末端においてアダプターに結合されうる。幾つかの場合には、標的核酸は、両方
の末端において、同じアダプターまたは異なるアダプターに結合される。幾つかの場合に
は、標的核酸は、一方の末端において、1以上のアダプターに結合されうる。
【0330】
CNAは結合工程の前に添加されうる。あるいは、CNAは結合工程の後で添加されう
る。CNAは連結反応に抵抗しうる。例えば、CNAは、標的核酸および/またはアダプ
ターとの連結に抵抗しうる。これらの場合、CNAが結合工程の前に添加された場合、そ
れらは標的核酸またはアダプターのいずれにも連結せず、配列決定工程において配列決定
されない。他の場合には、CNAは結合工程の前にサンプルから除去されうる。あるいは
、CNAはサンプル抽出の後および結合工程の前に除去されうる。
【0331】
サンプルにおける標的核酸にアダプターを結合させる前に、サンプルを酵素で処理する
ことが可能である。例えば、サンプルをエンドヌクレアーゼで処理して、連結部位、例え
ば粘着末端または平滑末端を生成させることが可能である。あるいは、アダプターが標的
核酸に結合した後、サンプルを酵素で処理することが可能である。
【0332】
増幅
該方法は、標的核酸を増幅することを含みうる。増幅は、核酸配列のコピー数を増加さ
せるための任意の方法を意味しうる。例えば、増幅は、例えば1以上のポリメラーゼ連鎖
反応において、ポリメラーゼを使用して行われうる。増幅は、当技術分野で公知の方法を
用いて行われうる。これらの方法は、しばしば、核酸またはその相補体の複数のコピーの
産物触媒形成によるものである。そのような方法の1つとして、以下のものを含むポリメ
ラーゼ連鎖反応(PCR)が挙げられる:AFLP(増幅断片長多型)PCR、対立遺伝
子特異的PCR、Alu PCR、アセンブリ、非対称PCR、コロニーPCR、ヘリカ
ーゼ依存性PCR、ホットスタートPCR、インバースPCR、in situ(インシ
トゥ)PCR、配列間特異的PCRまたはIS SR PCR、デジタルPCR、ドロッ
プレット(droplet)デジタルPCR、線形後指数関数的PCRまたはレイト(L
ate)PCR、ロング(long)PCR、ネスティッドPCR、リアルタイムPCR
、二重PCR、マルチプレックスPCR、定量的PCRまたはシングルセルPCR。リガ
ーゼ連鎖反応(LCR)、核酸配列ベース増幅(NASBA)、線形増幅、等温線形増幅
、Q-ベータ-レプリカーゼ法、3SR、転写媒介増幅(TMA)、鎖置換(Stran
d Displacement)増幅(SDA)またはローリングサークル増幅(RCA
)を含む他の増幅方法も用いられうる。
【0333】
CNAは増幅前に添加されうる。あるいは、CNAは増幅後に添加されうる。CNAは
増幅されないことが可能である。例えば、CNAは、増幅を阻害する修飾を含みうる。こ
れらの場合、CNAが増幅前に添加されると、それは増幅されない。したがって、CNA
は配列決定ライブラリーに存在しない、または配列決定されないことが可能である。
【0334】
CNAの除去
該方法は更に、CNAをサンプルから除去することを含むことが可能であり、これは、
しばしば、CNAが配列決定されることを妨げる。幾つかの場合には、該方法は、サンプ
ルからCNAの一部または全部を除去して、配列決定サンプルを調製することを含む。得
られる配列決定サンプルはCNAを含有していないことが可能であり、配列決定にそのま
ま使用されうる。幾つかの場合には、該方法は、サンプルにおける他の核酸、例えば標的
核酸、アダプターまたはアダプターの多量体よりも優先的に、少なくとも1つのCNAを
除去することを含む。
【0335】
CNAの除去は、酵素を使用して行われうる。例えば、CNAは酵素、例えば酵素消化
により分解されうる。幾つかの場合には、該方法は、ヌクレアーゼを使用してCNAを除
去することを含む。例えば、該方法は、エンドヌクレアーゼ、例えばI型、II型(II
S型、IIG型を含む)、III型またはIV型エンドヌクレアーゼを使用して、CNA
を除去することを含みうる。該方法は、制限エンドヌクレアーゼ、例えばAatII、A
cc65I、AccI、AclI、AatII、Acc65I、AccI、AclI、A
feI、AflII、AgeI、ApaI、ApaLI、ApoI、AscI、AseI
、AsiSI、AvrII、BamHI、BclI、BglII、Bme1580I、B
mtI、BsaHI、BsiEI、BsiWI、BspEI、BspHI、BsrGI、
BssHII、BstBI、BstZ17I、BtgI、ClaI、DraI、EaeI
、EagI、EcoRI、EcoRV、FseI、FspI、HaeII、HincII
、HindIII、HpaI、KasI、KpnI、MfeI、MluI、MscI、M
spA1I、MfeI、MluI、MscI、MspA1I、NaeI、NarI、Nc
oI、NdeI、NgoMIV、NheI、NotI、NruI、NsiI、NspI、
PacI、PciI、PmeI、PmlI、PsiI、PspOMI、PstI、Pvu
I、PvuII、SacI、SacII、SalI、SbfI、ScaI、SfcI、S
foI、SgrAI、SmaI、SmlI、SnaBI、SpeI、SphI、SspI
、StuI、SwaI、XbaI、XhoI、XmaIまたはそれらの任意の組合せを使
用して、CNAを除去することを含みうる。該方法は、前記で挙げられていないDNアー
ゼ、例えばエキソデオキシリボヌクレアーゼを使用して、CNAを除去することを含みう
る。該方法は、ウラシルDNAグリコシラーゼ(UDG)、DNAグリコシラーゼ-リア
ーゼ(エンドヌクレアーゼVIII)またはそれらの混合物(例えば、ウラシル特異的切
断試薬(USER)酵素)を使用して、CNAを除去することを含みうる。該方法は、R
NA誘導DNアーゼの部位、例えばCRISPR関連タンパク質ヌクレアーゼ、例えばC
as9、RNアーゼを使用して、CNAを除去することを含みうる。該方法は、RNアー
ゼ、例えばエンドリボヌクレアーゼ、例えばRNアーゼA、RNアーゼH、RNアーゼI
II、RNアーゼL、RNアーゼP、RNアーゼPhyM、RNアーゼT1、RNアーゼ
T2、RNアーゼU2、RNアーゼV、またはエキソリボヌクレアーゼ、例えばポリヌク
レオチドホスホリラーゼ、RNアーゼPH、RNアーゼR、RNアーゼD、RNアーゼT
、オリゴリボヌクレアーゼ、エキソリボヌクレアーゼIまたはエキソリボヌクレアーゼI
I、あるいはそれらの任意の組合せを使用して、担体合成核酸を除去することを含みうる
。幾つかの場合には、該方法は、当技術分野で公知の任意の核酸分解試薬を使用して、C
NAを除去することを含む。幾つかの場合には、該方法は、CNAを物理的処理、例えば
加熱、冷却またはせん断に付すことにより、CNAを除去することを含みうる。幾つかの
場合には、CNAの除去方法は、標的核酸、アダプター、または配列決定ライブラリーに
おける他の任意の分子をサンプルから除去しない。幾つかの場合には、CNAの除去は酵
素分解、例えばエンドヌクレアーゼ消化によっては行われない。
【0336】
CNAを除去するために、該方法は、酵素が機能する温度でCNAを酵素と共にインキ
ュベートすることを含みうる。例えば、該方法は、10℃~80℃、例えば20℃~60
℃、20℃~40℃、30℃~40℃、または20℃~25℃の温度でCNAを酵素と共
にインキュベートすることを含みうる。該方法は、少なくとも10℃、20℃、25℃、
30℃、31℃、32℃、33℃、34℃、35℃、36℃、37℃、38℃、39℃、
40℃、50℃、60℃または70℃の温度でCNAを酵素と共にインキュベートするこ
とを含みうる。幾つかの場合には、該方法は、約20℃、21℃、22℃、23℃、24
℃、25℃、26℃、27℃、28℃、29℃、30℃、31℃、32℃、33℃、34
℃、35℃、36℃、37℃、38℃、39℃、40℃、41℃または42℃の温度でC
NAを酵素と共にインキュベートすることを含みうる。
【0337】
CNAを除去するために、該方法は、酵素が機能的である時間にわたってCNAを酵素
と共にインキュベートすることを含みうる。幾つかの場合には、該方法は、少なくとも1
分間、5分間、10分間、15分間、20分間、30分間、40分間、50分間、1時間
、2時間、5時間、12時間、24時間、48時間または72時間、CNAを酵素と共に
インキュベートすることを含みうる。
【0338】
該方法は、アフィニティに基づく枯渇(depletion)により担体合成核酸を除
去することを含みうる。アフィニティに基づく枯渇は、1以上の固定化タグを含みうる担
体合成核酸上で行われうる。これらの場合には、該方法は、固体支持体に固定化タグを結
合させることによりCNAを除去することを含みうる。そのような固体支持体は紙、ガラ
ス(例えば、制御孔ガラス(CPG))、プラスチック(例えば、ポリメチルアクリル酸
、ポリエチレン、ポリプロピレン、ポリアクリラート、ポリメチルメタクリラート、ポリ
塩化ビニル、ポリテトラフルオロエチレン、ポリスチレン、ポリカーボネートマクロポロ
スポリスチレン(MPPS)またはナイロン)、ポリアクリルアミド、酢酸セルロース、
硝酸セルロース、ニトロセルロース、シリコンまたは他の金属、または光ファイバーであ
りうる。
【0339】
アフィニティに基づく枯渇のための固体支持体は任意の形状および形態に成形されうる
。幾つかの場合には、固体支持体は、ウェル、桶(トラフ)、台(ペデスタル)、疎水性
もしくは親水性パッチ、ダイカット接着剤リザーバ、または流体流動に対する他の物理的
障壁の形態の、分離した隔離領域を有する平面装置の形態で製造されうる。そのような固
体支持体の例には、スライド、マイクロプレート、シート、フィルム、ディップスティッ
クなどが含まれる。
【0340】
他の場合には、固体支持体は、被覆カチオン性表面を含有するビーズまたはペレットの
形態でありうる。ビーズは、被覆固体支持体上のプローブ密度を増加させるための手段を
提供しうる。ビーズは、例えばアミノ化によりビーズをカチオン性にするのに適した種々
の表面化学または官能基(例えば、アミン、カルボキシルまたはヒドロキシル)を提供し
うる。適切なビーズ組成物には、例えば、プラスチック、例えば、ポリスチレン、メチル
スチレン、アクリルポリマー、セラミック、ガラス、ポリマー材料、例えば、架橋デキス
トラン、セルロース、ナイロンおよびラテックス、常磁性材料、二酸化チタン、ラテック
スが含まれる。ビーズは、任意のタイプの中実もしくは中空の球、ボール、ベアリング、
シリンダーまたは他の固体形状を含みうる。ビーズは本質的に多孔質または非多孔質であ
りうる。多孔質ビーズの使用は、核酸検出に利用可能なビーズの表面積を増加させうる。
ビーズサイズは、100nm~5mm、例えば0.2μm~200μm、または0.5μ
m~5μmの範囲でありうる。幾つかの場合には、固体支持体は磁性または磁気感受性で
ありうる。固体支持体は被覆されうる。被覆(コーティング)は固定化タグに結合しうる
。例えば、固体支持体は、固定化タグの結合相手、例えば、ストレプトアビジン、抗原、
抗体(例えば、抗ポリヒスチジン抗体)、グルタチオンSトランスフェラーゼ、またはそ
の類似体で被覆されうる。
【0341】
該方法は、サイズに基づく枯渇によりCNAを除去することを含みうる。例えば、サイ
ズに基づく枯渇は、多孔性ビーズ(例えば、固相可逆的固定化(Solid Phase
Reversible Immobilization)(SPRI)磁気ビーズ、電
気泳動ゲル精製(例えば、アガロースゲル精製)および/またはゲル濾過を用いて行われ
うる。幾つかの場合には、該方法は、50bp、100bp、200bp、300bp、
400bp、500bp、600bp、700bp、800bp、900bp、1kb、
2kp、5kbまたは10kbの長さを有する合成核酸を除去することを含みうる。例え
ば、該方法は、少なくとも500bpの長さを有する合成核酸を除去することを含みうる
【0342】
配列決定
該方法は、配列決定ライブラリーにおける標的核酸および/またはアダプターを配列決
定することを含みうる。配列決定は、マキサム-ギルバート(Maxam-Gilber
t)配列決定、鎖終結配列決定、ショットガン配列決定またはブリッジPCRを含む基本
的な配列決定方法により行われうる。配列決定は、大規模並列配列決定法(例えば、次世
代シーケンシング)、例えば、ハイスループット配列決定、パイロシーケンシング、合成
による配列決定、単一分子配列決定、ナノポア配列決定、半導体配列決定、連結による配
列決定、ハイブリダイゼーションによる配列決定、RNA-Seq(Illumina)
、デジタル遺伝子発現(Digital Gene Expression)(Heli
cos)、次世代シーケンシング、合成による単分子配列決定(Single Mole
cule Sequencing by Synthesis)(SMSS)(Heli
cos)、大規模並列配列決定、クローン単一分子アレイ(Clonal Single
Molecule Array)(Solexa)、ショットガン配列決定、マキサム
-ギルバート(Maxam-Gilbert)またはサンガー(Sanger)配列決定
、プライマーウォーキング、Illumina、PacBio、SOLiD、Ion T
orrent、454またはナノポアプラットフォームを使用する配列決定によっても行
われうる。配列決定を次世代シーケンシング法により行う場合、ここで作製される配列決
定ライブラリーは次世代シーケンシングライブラリーである。
【0343】
本明細書の全体にわたって用いる、数字または数値範囲に関する「約」なる語は、言及
された数字または数値範囲が実験的変動内(または統計的実験誤差内)の近似であること
、あるいは数字または数値範囲が、例えば、示されている数字または数値範囲の1%~1
5%で変動しうることを意味する。例えば、「約」なる語は、示されている数または値の
±10%を意味する。
【0344】
本明細書中で用いる「または」なる語は、特に示されていない限り、非排他的であり、
例えば、「AまたはB」は「BではなくA」、「AではなくB」および「AおよびB」を
含む。
【図面の簡単な説明】
【0345】
図1図1は本開示の基本的方法の概要図を示す。
図2図2は典型的な感染の概要図を示す。
図3図3は、本発明で提供する方法の幾つかの一般的スキームを示す。
図4図4は8つの典型的なスパーク(Spark)サイズセットスパイクインの設計を示す。
図5図5は、多様性減少を決定するための本発明で提供する方法の一般的スキームを示す。
図6図6は典型的なスパンク(Spank)スパイクインの設計を示す。
図7図7は、本発明で提供する方法を実行するようにプログラムまたは構成されたコンピュータ制御システムを示す。
図8図8は、担体(carrier)核酸が加えられうる配列決定ライブラリーの製造における工程を示す。
図9図9は110個の典型的なIDスパイクに関する正規化リード数を示す。
図10図10は110個の典型的なシグナル正規化IDスパイクに関する正規化リード数を示す。
図11図11は、病原体トレーサーを使用してシゲラ・フレックスネリ(Shigella flexneri)の陽性対照からの交差汚染を特定するための方法からの結果を示す。
図12図12は、病原体トレーサーを使用してサルモネラ・エンテリカ(Salmonella enterica)の陽性対照からの交差汚染を特定するための方法からの結果を示す。
図13図13は、病原体トレーサーを使用してスタフィロコッカス・アウレウス(Staphylococcus aureus)の陽性対照からの交差汚染を特定するための方法からの結果を示す。
図14図14は、病原体トレーサーを使用してシュードモナス・エルジノーサ(Pseudomonas aeruginosa)の陽性対照からの交差汚染を特定するための方法からの結果を示す。
図15図15は、病原体トレーサーを使用してクロストリジウム・スポロゲネス(Clostridium sporogenes)の陽性対照からの交差汚染を特定するための方法からの結果を示す。
図16図16は典型的なスパーク(Spark)サイズスパイクインの相対収率に対するサイズ選択ライブラリ処理方法の効果を示す。
図17図17は、種々のGC含量の核酸を用いて、酵素加熱失活工程を含む配列決定ライブラリーの製造方法からの結果を示す。
図18図18は、種々のGC含量の核酸を使用する、酵素加熱失活工程を欠く配列決定ライブラリーの製造方法からの結果を示す。
図19図19は、両端の連結を妨げる大きなサイズを有する担体合成核酸を使用する、配列決定ライブラリーの典型的な製造方法を示す。
図20図20Aは、脱塩基部位および修飾を有する担体合成核酸を使用する、配列決定ライブラリーの典型的な製造方法を示す。図20Bは、エンドヌクレアーゼVIII消化の非存在下で担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。レーンA1:TapeStationラダー。レーンB1:CNA無し、第1複製。レーンC1:CNA無し、第2複製。レーンD1:CNA無し、第3複製。レーンE1:10ngのCNA、第1複製。レーンF1:10ngのCNA、第2複製。レーンG1:10ngのCNA、第3複製。図20Cは、エンドヌクレアーゼVIII消化の存在下で担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。レーンA1:TapeStationラダー。レーンB1:CNA無し、第1複製。レーンC1:CNA無し、第2複製。レーンD1:CNA無し、第3複製。レーンE1:10ngのCNA、第1複製。レーンF1:10ngのCNA、第2複製。レーンG1:10ngのCNA、第3複製。
図21図21Aは、エンドヌクレアーゼVIII消化の非存在下で脱塩基部位を有する担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。図21Bは、エンドヌクレアーゼVIII消化の存在下で脱塩基部位を有する担体合成核酸を使用する配列決定ライブラリーの製造からの結果を示す。
図22図22は、DNA-RNAハイブリッドを有する担体合成核酸の典型的配列を示す。「rX」なる文字(例えば、rG、rC、rA)はRNA配列を示す。
図23図23Aは、DNA-RNAハイブリッドを有する担体合成核酸を使用する、配列決定ライブラリーの典型的な製造方法を示す。図23Bは、DNA-RNAハイブリッドを有する担体合成核酸を使用する、配列決定ライブラリーの製造からの結果を示す。
【0346】
実施例
実施例1:無細胞DNA配列決定アッセイによる診断
無細胞血漿サンプルを調製する。次世代シーケンシングのためのDNAライブラリーを
、既に記載されているとおりに製造する(De Vlaminck I,Khush K
K,Strehl Cら,Temporal response of the hum
an virome to immunosuppression and antiv
iral therapy.Cell 2013;155(5):1178-87.;D
e Vlaminck I,Martin L,Kertesz Mら,Noninva
sive monitoring of infection and rejecti
on after lung transplantation. Proceedin
gs of the National Academy of Sciences o
f the United States of America 2015;112(
43):13336-41;それらのそれぞれの全体を参照により本明細書に組み入れる
こととする)。配列決定をIllumina NextSeq装置で行い、分析する。簡
潔に説明すると、低品質リードを除去した後、リードをヒト参照ゲノム(例えば、hg1
9)に対してマッピングする。残りのリードをウイルス性、細菌性、真菌性および他の真
核性病原体のキュレート参照データベースに対してマッピングする。個々の病原体の存在
量を、血漿1ml当たりの特定の病原体由来の核酸量の絶対的尺度である、体積当たりの
ゲノムコピー数として表す。耐性を付与することが知られている配列を特定するために、
更なる分析を行うことが可能である。
【0347】
患者の血漿の直接次世代シーケンシング(NGS)
DNA抽出の前に既知濃度の合成DNA分子を血漿サンプルに添加する。改変された磁
気ビーズに基づく方法(Omega Biotek,Norcross,GA)を用いて
DNAを抽出する。改変されたライブラリー調製キット(NuGEN,San Carl
os,CA)を使用して、NGSライブラリーを構築する。陰性(バッファーを含有する
が血漿を含有しない)および陽性(健常ドナーからの血漿および既知濃度の剪断された実
験室由来の病原体DNAを含有する)対照サンプルを、サンプルと並行して処理する。7
5サイクルのシングルエンド(single-end)デュアルインデックス(dual
-index)配列決定キットを使用するIllumina NextSeqで全3個の
DNAライブラリータイプを多重化し、配列決定する。
【0348】
バイオインフォマティクス分析
病原体リードをNGSリードセットから定量する。簡潔に説明すると、低品質リードを
破棄した後、ヒト参照配列(例えば、hg19)に対してアライメントすることによりヒ
トリードを除去する。完全スパイクイン配列のデータベースに対するアライメントにより
、合成スパイクインリードを特定する。残りのリードを、ウイルス、原核生物および真菌
(真菌、原生動物および寄生生物を含む)の8000個を超える参照配列のキュレートデ
ータベースに対してアライメントする。PCR重複(duplicate)または配列決
定装置のエラーに由来すると推定される重複リードをアライメントに基づき特定し、除去
する。生物の相対的存在量を、推定される重複排除(deduped)リード(EDR)
または百万当たりのリード(RPM;サンプルに関する全リードに対して正規化されたも
の)、またはサンプルの体積当たりのリード(MPM;1マイクロリットル当たりの分子
)として表す。MPMは、血漿1マイクロリットルにおける各生物に関して表される、核
酸断片の推定数を見積もる正規化量である。この計算は、抽出の開始時に血漿に添加され
た既知量の合成DNAに対して正規化された各生物に関して存在する配列の数から導出さ
れる。
【0349】
2つの患者サンプルの処理の説明は以下の通りである。スパンク(Spank)-75
B(配列番号120)、スパーク(Spark)-32/52/75/100/125/
150/175/350(配列番号111~118)、およびIDスパイク(血漿1マイ
クロリットル当たりの各スパイクインの3×10個の分子)の混合物を血漿に添加する
。各サンプルには同じスパンク/スパーク混合物を加えるが、異なるIDスパイクを加え
る。添加された血漿を16,000gで10分間遠心分離し、無細胞血漿からなる上清を
新鮮なチューブに移す。デュアルインデックスIlluminaアダプターを添加するた
めの無細胞DNA抽出およびライブラリー調製の後、サンプルをプールし、それと並行し
て、陰性対照サンプルおよび陽性対照サンプルを処理し、ついでIllumina Ne
xtSeqで配列決定する。典型的には、約4億個のリードがバッチ内のサンプルに分布
し、任意の個々のサンプルのリード数は、サンプルが含む全ライブラリプールの割合に比
例し、そしてこの割合は無細胞血漿中のDNAの量に比例する。
【0350】
計算分析:個々のサンプルのリードを、対応するアダプターバーコード配列に基づいて
特定した(「脱多重化」)。アダプター二量体配列の除去、および品質に基づくリードの
トリミングの後、ヒトゲノム、スパイクインおよび病原体ゲノム参照配列に対するアライ
メントにより、リード配列の推定起源を特定した。IDスパイクおよびSPANK(スパ
ンク)-75Bリードの数を、スパイクインアライメントを用いてカウントし、各添加分
子内に埋め込まれたランダム化配列タグを使用して、スパンク(SPANK)-75Bリ
ードを重複排除(de-duplicate)(「デデュープ(dedupe)」)した
。ゲノム位置に基づいて病原体アライメントを重複排除し、機械学習アプローチを用いて
、各リードの最も可能性の高い分類学的起源を決定して、特定の病原体に起因する推定重
複リードを得た。正規化病原体存在量を1マイクロリットル当たりの病原体分子(MPM
-スパンク)としての濃度で表し、以下のとおりに計算する:MPM-スパンク=(推定
重複排除リード/スパンク-75Bの数)×c(ここで、cは、サンプルに添加されたス
パンク-75Bリードの濃度、すなわち、1マイクロリットル当たり3×10リードで
ある)。
【0351】
IDスパイクは、配列決定バッチにおける各サンプルに関してユニークであるスパイク
インの一種でありうる。スパンク分子は全ライブラリーにわたって一定濃度で添加されう
る。したがって、個々のライブラリーにおいて検出される重複排除スパンク分子の数は、
そのライブラリーにおいて検出可能な最小濃度の代用物でありうる。より一般的には、そ
れは、そのライブラリーが元のサンプルにおける核酸(例えば、DNA)分子を核酸配列
決定データにおけるリードに変換した効率に正比例しうる。スパンク分子の目的は、サン
プルにおいて表される混合物における標的(例えば、病原体または疾患関連)分子の相対
的存在量を確定するのを助けることでありうる。
【表7】
【0352】
実施例2:IDスパイクの合成および処理
インテグレーテッドDNAテクノロジーズ(Integrated DNA Tech
nologies)により合成された相補的な100マー(mer)オリゴヌクレオチド
のペアをアニーリングさせることにより、110個の典型的なIDスパイク(IDスパイ
ク28~137;配列は表1に列挙されている)を構築した。ついで、これらの配列を4
つのグループにサブプールし、ヒト血漿の4つのアリコートに加え、抽出し、血漿の無細
胞DNAと共に配列決定ライブラリーへと処理し、Illumina NextSeq5
00装置で配列決定した。110個のIDスパイクのそれぞれにマッピングされたリード
の数を決定し、ついで100万個の全リードごとに正規化した。100万個の全リード当
たり最小約12,000個および最大約88,000個を示すプロットを図9に示す。
【0353】
IDスパイクからのシグナルは調節可能である。IDスパイクは、例えば、図9に示さ
れているシグナル中央値に基づいて各IDスパイクの入力量を調節することにより、シグ
ナル正規化されうる。シグナル正規化IDスパイクの再試験は、図10に示されていると
おり、より均一なリード数を与える。この場合、各IDスパイクにマッピングされるリー
ドの数は100万個の全リード当たり10,000~25,000の範囲内であり、ほと
んどのIDスパイクは100万個の全リード当たり15,000~20,000の範囲内
のリード数を有する。異なるIDスパイクのシグナルを等化または正規化する利点は、そ
れが交差汚染検出の精度を向上させうることである。例えば、1つのIDスパイクが典型
的には100万当たり70,000個のリードを与え、別のIDスパイクが19,000
個を与える場合、後者はより低感度の交差汚染トレーサでありうる。それらの2つのID
スパイク間のシグナルの正規化はより高い均一性をもたらしうる。
【0354】
実施例3:IDスパイクを使用するサンプルの交差汚染の測定
4つのサンプルを調製する。IDスパイク124~127をサンプル1に添加する。I
Dスパイク128~131をサンプル2に添加する。IDスパイク132~134をサン
プル3に添加する。IDスパイク135~137をサンプル4に添加する。それらの4つ
のサンプルを処理し、配列決定する。表7にIDスパイクのサブセットに関して示されて
いるとおり、交差汚染(例えば、IDスパイクが意図的には添加されなかったサンプルに
おけるIDスパイクに起因するリード)は1:10,000未満であることが示されてい
る。
【表8】
【0355】
実施例4:IDスパイクを使用するサンプルの交差汚染の特定
4つのサンプルを調製する。IDスパイク124をサンプルAに添加する。IDスパイ
ク123をサンプルBに添加する。IDスパイク122をサンプルCに添加する。IDス
パイク119をサンプルDに添加する。それらの4つのサンプルを処理し、配列決定する
。サンプルAおよびBにおけるIDスパイク123およびIDスパイク124の両方から
の相当数のリードは、表8に示されているとおり、それらの2つのIDスパイクストック
間またはサンプルAおよびBの間の交差汚染を示している。
【表9】
【0356】
実施例5:IDスパイクを使用する交差汚染源の特定
幾つかのサンプルにおいては、実質的にだた1つのIDスパイクのみが特定されるが、
他のサンプルにおいては、幾つかの汚染IDスパイクが有意レベルで観察される。そのよ
うな状況においては、表9に示されているとおり、汚染IDスパイクが何であるかが、例
えば、マイクロタイタープレートの隣接ウェルからの交差汚染源を示しうる。
【表10】
【0357】
実施例6:病原体DNAの陽性対照からの交差汚染を特定するためのトレーサー配列
実験室(検査室)病原体DNAサンプルは陽性対照として使用されるが、臨床サンプル
を交差汚染し、偽陽性リードまたは診断をもたらすリスクを伴う。交差汚染検出を可能に
するために、トレーサーを実験室病原体DNAサンプルに添加する。血液からの無細胞病
原体DNA断片のNGS検出の場合には、比較的短いトレーサーが使用されうる。なぜな
ら、無細胞病原体断片は比較的短く、例えば20~120bpであり、しばしば、平均約
75bpであるからである。ここでは、病原体対照当たり1個のユニークトレーサー配列
を含有する75bpの合成DNA二本鎖のセットをトレーサーとして使用する。実験室で
得られたゲノムDNA(ATCCまたはNIST)を、DNaseI(New Engl
and Biolabs)またはフラグメンターゼ(Fragmentase)ヌクレア
ーゼ混合物(New England Biolabs)を使用して剪断することにより
、病原体断片を得た。
【0358】
表10~12に列挙されている11種の異なる病原体由来のゲノムDNAを約75bp
の平均断片長に個々に剪断し、精製し、定量した(Qubit,Thermo Fish
er)。各断片プールに、別の75bpの合成DNA二本鎖(Integrated D
NA Technologies)を約10倍高い質量で加えて(Qubit,Ther
mo Fisher)、各断片化病原体にユニークトレーサーを付与した。好ましくは、
ゲノムDNAに対して少なくとも約5倍高いシグナルが該トレーサーに関して得られる。
同時感染をシミュレートするために、病原体/トレーサーペアを3つの種々の組合せで一
緒に混合し(表10~12に列挙されているとおり、混合物1は4つの病原体を含有し、
混合物2は4つの病原体を含有し、混合物3は3つの病原体を含有していた)、ヒト血漿
に加え、ヒト血漿において更に希釈して濃度系列を得、ついで無細胞DNA抽出、ライブ
ラリー調製およびNGSに付した。データベースに対するアライメントは全サンプルにお
ける全11個のトレーサーおよび全11個の病原体の検出濃度を算出した。
【0359】
表10~12および図11図15に示されている結果はトレーサーと病原体との1:
1のペア形成を示している。各場合において、トレーサーは病原体より高い濃度で検出さ
れ、濃度差は希釈系列にわたって一貫したままである。低レベルの交差汚染事象から予想
されるような非常に低い濃度への外挿は、病原体の前にトレーサーが検出されることを強
く示唆している。表10~12は全てのサンプルからのデータを示し、図11~15は、
それぞれシゲラ・フレックスネリ(Shigella flexneri)、サルモネラ
・エンテリカ(Salmonella enterica)、スタフィロコッカス・アウ
レウス(Staphylococcus aureus)、シュードモナス・エルジノー
サ(Pseudomonas aeruginosa)およびクロストリジウム・スポロ
ゲネス(Clostridium sporogenes)に関する代表的なトレーサー
:病原体のペアをプロットしている。トレーサーは、それが意図的に添加されたサンプル
でのみ観察された。未添加サンプルにおいては、1つの病原体、すなわち、大腸菌(E.
coli)のみが観察された。それらのサンプルにおいては大腸菌(E.coli)トレ
ーサー#143は観察されなかったため、大腸菌(E.coli)はヒト血漿中に低レベ
ルで存在していたと結論づけることが可能であり、これはこの共生生物ではよくあること
である。
【表11】

【表12】

【表13】
【0360】
実施例7:スパーク配列を使用する、種々の長さの核酸の相対的収量の決定
8個のスパーク(Spark)をヒト血漿に等モル量で加え、抽出し、血漿の無細胞D
NAと共に配列決定ライブラリーへと処理し、Illumina NextSeq500
装置で配列決定した。種々の処理方法(例えば、図16に示されているとおり、種々のサ
イズ範囲を有するライブラリーのサブセットを選択するもの)が、種々のスパークの相対
的収率を決定することによりモニターされうる。更に、全てのサンプルに同じ量のスパー
クを添加した場合、例えば8個のスパークのそれぞれの1億個の分子を血漿1mL当たり
に加えた場合、与えられたスパークのリード数を用いて、サンプルにおける他の類似サイ
ズの断片(例えば、感染因子由来の無細胞DNA)の出発濃度を推測することが可能であ
る。
【0361】
実施例8:種々のGC含量を有する合成核酸を使用する配列決定ライブラリーの製造
無細胞病原体核酸はそれらのGC含量において様々であることが可能であり、短い断片
長で多種多様なTを有しうる。無細胞病原体断片は比較的短い長さ(例えば、20~1
20bp、そしてしばしば平均約75bp)を有するため、より短い断片は、例えばNG
Sのための処理中に、より変性し易く、したがって、サンプル中に存在していたとしても
配列決定も検出もされない可能性がある。低いTの断片(例えば、低いGCゲノムから
の短い断片)、特に、32~75bpの範囲の断片の回収を追跡するための方法を用いて
、より高い比率の低いTの断片が維持されるように、核酸処理を最適化することが可能
である。
【0362】
28個の二本鎖のそれぞれを、2個のオリゴヌクレオチドをアニーリングすることによ
って作製した。二本鎖DNAの濃度がQubit(Thermo Fisher)により
を測定された。それらの28個の等モル量を1つの混合物へと一緒にした。該混合物の8
個の重複サンプルを標準的なライブラリー製造方法1(酵素加熱不活性化工程を含む)で
処理し、別の8個を、改変されたライブラリー製造方法2(酵素加熱不活性化工程を欠く
)で処理した。ライブラリー製造の後、それらの16個のサンプルを1回の配列決定の実
施において組合せ、各サンプルに関する28個のスパイクのそれぞれの収率を計算し、各
ライブラリーに関する100万当たりのリード数に対して正規化した。
【0363】
該正規化リード数は、標準方法1(図17に示されている)と比較した場合の、改変法
2(図18に示されている)における低いTの種の回収の増加を示しており、例えば、
32bp長および20%GC含量、32bp長および30%GC含量、32bp長および
40%GC含量、42bp長および20%GC含量、42bp長および30%GC含量、
または52bp長および20%GC含量であるスパイクインに関して、それが認められる
。GCパネルのこの粒度が無かったなら、そのような差は遥かに不明確であったであろう
。例えば、50%GC含量においては、試験した4つの長さのうち、32bpの長さのみ
が回復レベルの差を示す。
【0364】
実施例9:サイズに基づく枯渇を可能にする長い長さを有する担体合成核酸を使用する
配列決定ライブラリーの製造
本実施例は、サンプルにおける標的核酸より長い合成DNA(例えば、PCRにより合
成されたDNA)を使用して配列決定ライブラリーを製造するための典型的方法を示す。
合成DNAは、サンプルにおける標的核酸からの、サイズに基づく分離を可能にする長さ
を有しうる。合成DNAの一方または両方の末端は、連結に抵抗する修飾を有しうる。該
修飾は、1以上の末端における1以上の内部脱塩基部位および/または反転(inver
ted)ヌクレオチドを含みうる。合成DNAは、配列決定ライブラリーに加えられた後
、合成DNAの比較的長い長さを利用する、サイズに基づく枯渇法を用いて、任意の時点
で、該ライブラリーから枯渇されうる。
【0365】
無細胞DNAを含む血漿サンプルを対象から得る。合成DNAを、ライブラリー作製キ
ットのための最小必要量のDNAの濃度で、ライブラリーDNA投入溶液(例えば、無細
胞DNA抽出物)に添加する。末端修復工程の前、または末端修復工程の後かつアダプタ
ー連結工程の前に、合成DNAを血漿DNA抽出物に添加する。
【0366】
ついで、DNA濃度感受性連結を、キット製造者の説明に従い行う。合成DNAはPC
R増幅されない。むしろ、合成DNAをサイズ選択し、短い断片(例えば、110bp未
満の断片)の富化中に配列決定ライブラリーから枯渇させる。また、合成DNAを、末端
修復または連結に抵抗するように修飾した場合、またはそれが連結に抵抗するように末端
修復後にそれを添加した場合には、それは両末端においてアダプターを欠き、したがって
配列決定されない。
【0367】
図19は配列決定ライブラリーの製造における工程を示す。サンプル(例えば、血漿)
における無細胞DNA断片1901を工程1902において単離して、非常に低い濃度の
無細胞DNA1903を得ることが可能である。工程1904において該断片を末端修復
に付すことが可能である。ついで、一方の末端において連結に抵抗する修飾を有する長い
担体核酸1910を添加することが可能である。ついで、核酸をアダプター連結工程19
05に付すことが可能であり、ここで、末端修復断片は、両端に連結されたアダプターを
有するが、担体核酸は、一方の末端に連結されたアダプターのみを有する。増幅工程19
06中に、連結断片は増幅されるが、担体核酸は増幅されない。ついで、サイズ選択工程
1907を行うことが可能である。
【0368】
合成DNAの一方の末端は、ライブラリー製造における反応に合成DNAが関与するこ
とを妨げる修飾または構造を含む。アダプターを合成DNAの3’末端に連結する場合、
合成DNAを2つの制限酵素で二重消化して、2つの異なるオーバーハングを有する、ま
たは一方の末端にオーバーハングを有し他方の末端に平滑末端を有する500bpを超え
る分子を得る。次に、それぞれ相補的オーバーハングまたは平滑末端化ヘアピンを特異的
に使用して、オーバーハングまたは平滑末端にヘアピンを連結する。アダプターが合成D
NAの5’末端に連結することが予想される場合には、PCRプライマーのペア[そのう
ちの一方は不活性化5’末端(例えば、5’反転ジデオキシ-T、C3スペーサー、スペ
ーサー18など)を有する]を使用して、合成DNAを合成する。
【0369】
実施例10:脱塩基部位および修飾を有する担体合成核酸を使用する配列決定ライブラ
リーの製造
cfDNA抽出工程中に担体核酸として機能し、ライブラリー製造中に最小ライブラリ
ー投入量をもたらす担体合成核酸を設計した。担体合成核酸は中央脱塩基伸長を含有し、
修飾を含む両端を有していた。担体合成核酸の配列を以下に示す(5Invddtは5’
反転ddTを示し、3invdTは3’反転dTを示し、idSpは内部脱塩基部位を示
す)。
【0370】
5’-/5InvddT/GCGTCCCGGCGCGCGTTTAGGGATAACA
/idSp/idSp/idSp/idSp/GGGTAATGGCGCAAGGGTG
CTGGC/3InvdT/-3’;
3’-/3InvdT/CGCAGGGCCGCGCGCAAATCCCTATTGT/
idSp/idSp/idSp/idSp/CCCATTACCGCGTTCCCACG
ACCG/5InvddT/-5’。
【0371】
該方法の工程を図20Aに示す。2つの並行実験を行った。2つの実験のうちの1つで
エンドヌクレアーゼVIII消化を行った。エンドヌクレアーゼVIII消化を伴わない
実験においては、該方法は末端修復(工程2001)、酢酸ナトリウムおよびエタノール
でのMagBind精製(工程2002)、アダプター連結(工程2003)、アンプア
(Ampure)精製(工程2004)およびライブラリー増幅(工程2005)を含む
。エンドヌクレアーゼVIII消化を伴う実験においては、該方法は末端修復(工程20
06)、酢酸ナトリウムおよびエタノールでのMagBind精製(工程2007)、ア
ダプター連結(工程2008)、アンプル(Ampure)精製(工程2009)、エン
ドヌクレアーゼVIII消化(工程2010)およびライブラリー増幅(工程2011)
を含む。
【0372】
エンドヌクレアーゼVIII消化を37℃で行い、1時間進行させた。アダプター連結
後には担体合成核酸の枯渇は不要であった。なぜなら、脱塩基部位が鋳型の増幅を既に効
率的に阻害したからである。また、該修飾はアダプター連結を妨げ、全ては、担体合成核
酸が配列決定されることを妨げた。エンドヌクレアーゼVIIIはライブラリーにおける
アダプター二量体を枯渇させるために使用されうる。
【0373】
図20Bおよび20Cは、エンドヌクレアーゼVIII消化を伴う又は伴わない配列決
定ライブラリーの作製を示す。担体合成核酸を含有するライブラリーにおけるアダプター
連結後のエンドヌクレアーゼVIIIによる消化は、担体合成核酸を含有しないライブラ
リーと比較して改善された再現性およびより高いスパイクインシグナルをもたらした。
【0374】
実施例11:脱塩基部位を有する合成核酸を使用する配列決定ライブラリーの製造
cfDNA抽出工程中に担体核酸として機能し、ライブラリー製造中に最小ライブラリ
ー投入量をもたらす脱無塩基含有担体合成核酸を設計した。配列決定ライブラリーの製造
方法は、実施例8で用いたものと実質的に同じであった。種々のタイプの脱塩基含有担体
合成核酸を設計した。担体合成核酸分子の配列を以下に示す。
【0375】
連結に抵抗する修飾を含む二本鎖の一端を有する部分的に活性な脱塩基担体合成核酸(
部分的ab-CNA)(連結用に二本鎖の一端を残したことは、末端修復およびアダプタ
ー連結反応に対するいずれかの濃度効果をもたらすことを助けた)(5Invddtは5
’反転ddTを示し、3invdTは3’反転dTを示し、idSpは内部脱塩基部位を
示す):
5’-GCGTCCCGGCGCGCGTTTAGGGATAACA/idSp/idS
p/idSp/idSp/GGGTAATGGCGCAAGGGTGCTGGC/3In
vdT/-3’;
3’-CGCAGGGCCGCGCGCAAATCCCTATTGT/idSp/idS
p/idSp/idSp/CCCATTACCGCGTTCCCACGACCG/5In
vddT/-5’。
【0376】
二本鎖の両端を含有する活性な脱塩基性担体合成核酸(活性ab-CNA)は連結可能
であった(連結用に両端を残したことは、濃度効果の効率的低減に末端が要求される場合
に担体合成核酸投入量を減少させるのに有用であった)(idSpは内部脱塩基部位を示
す):
5’-GCGTCCCGGCGCGCGTTTAGGGATAACA/idSp//id
Sp//idSp//idSp/GGGTAATGGCGCAAGGGTGCTGGC-
3’;
3’-CGCAGGGCCGCGCGCAAATCCCTATTGT/idSp//id
Sp//idSp//idSp/CCCATTACCGCGTTCCCACGACCG-
5’。
【0377】
鎖当たりだた1つの脱塩基部位を有する単一脱塩基担体合成核酸(単一ab-CNA)
(単一脱塩基部位はエンドヌクレアーゼVIIIで、より効率的に消化された)(idS
pは内部脱塩基部位を示す):
5’-GCGTCCCGGCGCGCGTTTAGGGATAACAGT/idSp/G
GGTAA T GGCGCAAGGGTGCTGGC-3’;
3’-CGCAGGGCCGCGCGCAAATCCCTATTGTCA T CCCA
TT/idSp/CCGCGTTCCCACGACCG-5’。
【0378】
全てのライブラリーを製造し、各変異を3回重複して施した。また、連結用の二本鎖末
端の作製はスパイクイン分子(例えば、スパーク)のバンドを拡散させた。このことは、
この実験条件下、多様性の減少が有意でありうることを示唆している。図21Aおよび2
1Bは配列決定ライブラリーの製造の結果を示す。エンドヌクレアーゼVIII消化は該
重複体の幾つかにおいてアダプター二量体バンドの消失を引き起こした。エンドヌクレア
ーゼVIII消化物を用いた場合、より多数の非アダプター二量体鋳型が増幅に利用可能
となった。
【0379】
実施例12:DNA-RNAハイブリッドを含有する合成核酸を使用する配列決定ライ
ブラリーの製造
cfDNA抽出工程中に担体核酸として機能し、ライブラリー製造中に最小ライブラリ
ー投入量をもたらす、DNA-RNAハイブリッドを含有する担体合成核酸(RnD-C
NA)を設計した。図22に示されているとおり、配列決定可能な分子の最終プールにお
けるRnD-CNA枯渇はアダプター連結後かつライブラリー増幅前のRNアーゼH消化
により達成された。RNアーゼHに基づく枯渇をライブラリー増幅バッファー中、37℃
で行い、1時間進行させた。
【0380】
該方法の工程を図23Aに示す。典型的な実験においては、該方法は末端修復(工程2
301)、酢酸ナトリウムおよびエタノールでのMagBind精製(工程2302)、
アダプター連結(工程2303)、アンプル(Ampure)精製(工程2304)、担
体核酸枯渇(工程2305)およびライブラリー増幅(工程2306)を含む。これらの
実験におけるRnD-CNAは、連結または増幅を妨げる末端を有さなかった。図23B
はライブラリの製造の結果を示す。アダプター二量体バンドは、RnD-CNAがライブ
ラリー投入物の一部として導入された場合には消失した。
【0381】
図23Aおよび23BはRNアーゼH消化後のRnD-CNAを示す。RNアーゼH消
化により得られた断片は、両側をアダプターに連結した場合、2本のアダプターの全長が
145bpであると仮定すると、175bpおよび166bpの断片を与えた。この連結
は、最初に増幅バッファー中でポリメラーゼにより3’陥凹末端が埋められた場合に可能
であった。これは、消化後の断片が共に3’オーバーハングを含有するように、そして増
幅ポリメラーゼが3’エンドヌクレアーゼ活性を示さないように、RnA-CNA内のリ
ボヌクレオチドの位置を設計することにより妨げられた。
【0382】
本開示内容の好ましい実施形態が本明細書に示され、記載されているが、そのような実
施形態は単なる例示として記載されていることが当業者に明らかであろう。本開示内容か
ら逸脱することなく、多数の変形、変更および置換が当業者に今や見出されるであろう。
本明細書に記載されている開示内容の実施形態の種々の代替物が本開示内容の実施におい
て使用されうると理解されるべきである。以下の特許請求の範囲は本開示内容の範囲を定
め、特許請求の範囲の範囲内の方法および構造ならびにそれらの均等物はそれに包含され
ると意図される。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20A
図20B
図20C
図21A
図21B
図22
図23A
図23B
【配列表】
2022120165000001.app
【手続補正書】
【提出日】2022-06-17
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
標的核酸を含む初期サンプルにおける核酸の存在量を決定するための方法であって、
(a)標的核酸を含む初期サンプルに、既知量のスパイクイン核酸を加え、ここで、該スパイクイン核酸は、少なくとも1,000個のスパイクイン核酸を含み、ここで、前記の少なくとも1,000個のスパイクイン核酸は、相互にユニークな配列を含み、
(b)該標的核酸の一部および前記の少なくとも1,000個のスパイクイン核酸の一部に関して配列決定アッセイを行い、それにより、標的およびスパイクイン核酸配列リードを得、
(c)該スパイクイン核酸配列リードを用いて、標的核酸の存在量を正規化することを含む、前記方法。
【請求項2】
標的核酸が微生物核酸を含む、請求項1に記載の方法。
【請求項3】
標的核酸が少なくとも5つの異なる微生物由来の微生物核酸を含む、請求項2に記載の方法。
【請求項4】
前記の少なくとも1,000個のスパイクイン核酸がDNAを含む、請求項1から3のいずれか1項に記載の方法。
【請求項5】
前記の少なくとも1,000個のスパイクイン核酸のそれぞれが500塩基対長またはヌクレオチド長未満である、請求項1から4のいずれか1項に記載の方法。
【請求項6】
前記の少なくとも1,000個のスパイクイン核酸のそれぞれが200塩基対長またはヌクレオチド長未満である、請求項1から4のいずれか1項に記載の方法。
【請求項7】
前記の少なくとも1,000個のスパイクイン核酸のそれぞれが少なくとも25塩基対長であり、かつ、500塩基対長以下である、請求項1から4のいずれか1項に記載の方法。
【請求項8】
初期サンプルが血液、血漿、血清、脳脊髄液、滑液、気管支肺胞洗浄液、尿、便、唾液、鼻サンプル、またはこれらの組合せである、請求項1から7のいずれか1項に記載の方法。
【請求項9】
初期サンプルが血漿サンプルである、請求項1から7のいずれか1項に記載の方法。
【請求項10】
初期サンプルが生物学的サンプルから単離された核酸のサンプルである、請求項1から9のいずれか1項に記載の方法。
【請求項11】
配列決定アッセイが配列決定ライブラリーを製造することを含み、ここで、配列決定ライブラリーがスパイクイン核酸および標的核酸を含む、請求項1から10のいずれか1項に記載の方法。
【請求項12】
スパイクイン核酸が第1の長さ、第2の長さおよび第3の長さを有する核酸を含み、ここで、第1の長さ、第2の長さおよび第3の長さは、異なった長さである、請求項1から11のいずれか1項に記載の方法。
【請求項13】
第1の長さ、第2の長さおよび第3の長さを有する核酸が、それぞれ異なったGC含量を有する、請求項12に記載の方法。
【請求項14】
第1の長さ、第2の長さおよび第3の長さを有する核酸の存在量を用いて、標的核酸の存在量を正規化することをさらに含む、請求項12に記載の方法。
【請求項15】
GC含量を用いて標的核酸の存在量を正規化することをさらに含む、請求項13に記載の方法。
【請求項16】
初期サンプルが血漿サンプルであり、スパイクイン核酸を該血漿サンプルに直接加える、請求項1から15のいずれか1項に記載の方法。
【請求項17】
血漿サンプルから抽出されたDNAにスパイクイン核酸を加える、請求項1から16のいずれか1項に記載の方法。
【請求項18】
初期サンプルがヒト由来である、請求項1から17のいずれか1項に記載の方法。
【請求項19】
標的核酸が無微生物細胞核酸を含む、請求項1から18のいずれか1項に記載の方法。
【請求項20】
初期サンプルがDNAを含む、請求項1から19のいずれか1項に記載の方法。
【請求項21】
初期DNAがゲノムDNAを含む、請求項1から19のいずれか1項に記載の方法。
【請求項22】
初期サンプルが微生物DNAを含む、請求項1から19のいずれか1項に記載の方法。
【請求項23】
初期サンプルが微生物DNAを含む、請求項1から19のいずれか1項に記載の方法。
【請求項24】
初期サンプルが寄生生物DNAを含む、請求項1から19のいずれか1項に記載の方法。
【請求項25】
初期サンプルが真菌DNAを含む、請求項1から19のいずれか1項に記載の方法。
【請求項26】
初期サンプルが無細胞DNA(cfDNA)を含む、請求項1から19のいずれか1項に記載の方法。
【請求項27】
標的核酸の一部および前記の少なくとも1,000個のスパイクイン核酸の一部に関して配列決定アッセイを行い、標的核酸配列リードおよびスパイクイン核酸配列リードを得ることをさらに含む、請求項1から26のいずれか1項に記載の方法。
【請求項28】
配列決定アッセイがハイスループット配列決定を含む、請求項1から27のいずれか1項に記載の方法。
【請求項29】
ハイスループット配列決定が合成による配列決定(sequencing-by-synthesis)アッセイを含む、請求項28に記載の方法。
【請求項30】
ハイスループット配列決定が次世代シーケンシングである、請求項28に記載の方法。
【請求項31】
配列リードの生物情報学的(bioinformatic)分析をさらに含む、請求項1から26のいずれか1項に記載の方法。
【請求項32】
初期サンプルがヒト配列を含み、生物情報学的分析が、配列リードの生物情報学的分析から宿主配列を隔離または除去することを含む、請求項31に記載の方法。
【請求項33】
初期サンプルが免疫無防備の患者由来である、請求項1から32のいずれか1項に記載の方法。