(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-03-19
(45)【発行日】2024-03-28
(54)【発明の名称】核酸増幅のための方法
(51)【国際特許分類】
C12Q 1/6844 20180101AFI20240321BHJP
C12N 15/10 20060101ALI20240321BHJP
【FI】
C12Q1/6844 Z
C12N15/10 Z
(21)【出願番号】P 2020541387
(86)(22)【出願日】2019-01-28
(86)【国際出願番号】 US2019015452
(87)【国際公開番号】W WO2019148119
(87)【国際公開日】2019-08-01
【審査請求日】2022-01-27
(32)【優先日】2018-01-29
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】512264013
【氏名又は名称】セント ジュード チルドレンズ リサーチ ホスピタル,インコーポレイティド
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】ガワド,チャールズ
(72)【発明者】
【氏名】イーストン,ジョン
(72)【発明者】
【氏名】ゴンザレス-ペーニャ,ヴェロニカ
【審査官】鳥居 敬司
(56)【参考文献】
【文献】国際公開第2016/090273(WO,A1)
【文献】国際公開第2003/002736(WO,A2)
【文献】米国特許出願公開第2013/0309676(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-1/70
C12N 15/00-15/90
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
標的核酸分子を増幅する方法であって、前記方法は、
a.標的核酸分子、少なくとも1つの増幅プライマー、3’->5’エキソヌクレアーゼ活性を含む少なくとも1つの核酸ポリメラーゼ
、およびヌクレオチドの混合物を含むサンプルを接触させる工程であって、ここで、ヌクレオチドの混合物は、ポリメラーゼによる核酸複製を停止する少なくとも1つのターミネーターヌクレオチドを含み、ここで、前記ターミネーターヌクレオチドは、α-チオジデオキシヌクレオチドである、工程と、
b.複数の停止増幅産物を生成するために標的核酸分子を増幅する工程であって、ここで、前記ターミネーターヌクレオチドが前記停止増幅産物の3’末端に結合しており、ここで、複製は鎖置換複製により進行する、工程と、
を含む、方法。
【請求項2】
前記
核酸ポリメラーゼは鎖置換DNAポリメラーゼである、請求項1に記載の方法。
【請求項3】
前記核酸ポリメラーゼは、バクテリオファージphi29(Φ29)ポリメラーゼ、遺伝子改変phi29(Φ29)DNAポリメラーゼ、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bsu DNAポリメラーゼ、Vent
R DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、DNAポリメラーゼI、T5 DNAポリメラーゼ、T7 DNAポリメラーゼ、あるいはT4 DNAポリメラーゼである、請求項1に記載の方法。
【請求項4】
前記核酸ポリメラーゼは前記3’->5’エキソヌクレアーゼ活性を含み、および、少なくとも1つのターミネーターヌクレオチドは、前記3’->5’エキソヌクレアーゼ活性を阻害する、請求項1に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本出願は、2018年1月29日に出願された米国仮特許出願第62/623,471号の利益を主張するものであり、参照によりその全体が本明細書に組み込まれる。
【背景技術】
【0002】
核酸増幅(nucleic amplification)(例えば、次世代シーケンシング)を利用する研究方法は、複合サンプル、ゲノム、および他の核酸源に関する大量の情報を提供する。しかし、少量のサンプルを含む研究、診断、ならびに処置のための、非常に正確で、スケーラブルで、効率的な核酸増幅および配列決定の方法が必要とされる。
【発明の概要】
【0003】
少なくとも1つの標的核酸分子およびアンプリコンライブラリを含む組成物が本明細書で提供され、ここで、上記アンプリコンライブラリは、少なくとも1つの標的核酸分子の増幅から得られた複数のポリヌクレオチドを含み、ポリヌクレオチドの少なくともいくつかは、ターミネーターヌクレオチドを含み、ポリヌクレオチドの少なくとも5%は、少なくとも1つの標的核酸分子の直接コピーである。ポリヌクレオチドの少なくとも10%が少なくとも1つの標的核酸分子の直接コピーである組成物が、本明細書でさらに提供される。ポリヌクレオチドの少なくとも15%が少なくとも1つの標的核酸分子の直接コピーである組成物が、本明細書でさらに提供される。ポリヌクレオチドの少なくとも25%が少なくとも1つの標的核酸分子の直接コピーである組成物が、本明細書でさらに提供される。ポリヌクレオチドの少なくとも50%が少なくとも1つの標的核酸分子の直接コピーである組成物が、本明細書でさらに提供される。ポリヌクレオチドの5~50%が少なくとも1つの標的核酸分子の直接コピーである組成物が、本明細書でさらに提供される。ポリヌクレオチドの5~25%が少なくとも1つの標的核酸分子の直接コピーである組成物が、本明細書でさらに提供される。本明細書にさらに提供されるのは、ポリヌクレオチドの累積画分の50%以下が、少なくとも1つの標的核酸分子の配列の累積画分の少なくとも80%の配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドの累積画分の50%以下が、標的核酸配列の累積画分の少なくとも85%の配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドの累積画分の50%以下が、標的核酸配列の累積画分の少なくとも90%の配列を含む組成物である。アンプリコンライブラリが0.5以下のジニ係数(Gini index)を有する組成物が本明細書でさらに提供される。アンプリコンライブラリが0.4以下のジニ係数を有する組成物が、本明細書でさらに提供される。複数のポリヌクレオチドが約50~約2000のヌクレオチド長さである組成物が、本明細書でさらに提供される。本明細書でさらに提供されるのは、ポリヌクレオチドが約400~約600のヌクレオチド長さである組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が100~5000である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が250~1250である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が少なくとも100である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が少なくとも500である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が少なくとも1000である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくともいくつかがバーコードを含む組成物である。本明細書でさらに提供されるのは、バーコードは細胞バーコードを含む組成物である。本明細書でさらに提供されるのは、バーコードがサンプルバーコードを含む組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくともいくつかが固有分子識別子(unique molecular identifier)を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドがゲノムを少なくとも部分的に表す配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドが少なくとも2つのゲノムを少なくとも部分的に表す配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドはcDNAからの配列を含む組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくとも90%がターミネーターヌクレオチドを含む組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくとも98%がターミネーターヌクレオチドを含む組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが少なくともいくつかのポリヌクレオチドの3’末端に結合している組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが、α基への修飾を伴うヌクレオチド、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸(inverted nucleic acids)、2’フルオロヌクレオチド、3’リン酸化ヌクレオチド、2’-O-メチル修飾ヌクレオチド、およびトランス核酸(trans nucleic acids)からなる群から選択される組成物である。本明細書でさらに提供されるのは、α基への修飾を伴うヌクレオチドがα-チオジデオキシヌクレオチドである組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドがデオキシリボースの3’炭素のr基の修飾を含む組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが、3’ブロックされた可逆的ターミネーターを含有するヌクレオチド、3’ブロックされてない可逆的ターミネーターを含有するヌクレオチド、デオキシリボヌクレオチドの2’修飾を含有するターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含有するターミネーター、およびそれらの組み合わせからなる群から選択される組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが、ジデオキシヌクレオチド、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’-リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド(acyclonucleotides)、およびそれらの組み合わせからなる群から選択される組成物である。液滴中に含まれている組成物が本明細書でさらに提供される。
【0004】
少なくとも1つの標的核酸分子およびアンプリコンライブラリを含む組成物が本明細書で提供され、ここで、上記アンプリコンライブラリは、少なくとも1つの標的核酸分子の増幅から得られた複数のポリヌクレオチドを含み、ポリヌクレオチドの少なくともいくつかは、ターミネーターヌクレオチドを含み、ポリヌクレオチドの累積画分の50%以下が、少なくとも1つの標的核酸分子の配列の累積画分の少なくとも80%の配列を含む。本明細書でさらに提供されるのは、複数のポリヌクレオチドの累積画分の50%以下が、標的核酸配列の累積画分の少なくとも85%の配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドの累積画分の50%以下が、標的核酸配列の累積画分の少なくとも90%の配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドが約50~約2000のヌクレオチド長さである組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドが約400~約600のヌクレオチド長さである組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が100-5000である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が250-1250である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が少なくとも100である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が少なくとも500である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの数が少なくとも1000である組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくともいくつかがバーコードを含む組成物である。本明細書でさらに提供されるのは、バーコードが細胞バーコードを含む組成物である。本明細書でさらに提供されるのは、バーコードがサンプルバーコードを含む組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくともいくつかが固有分子識別子を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドはゲノムを少なくとも部分的に表す配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドが少なくとも2つのゲノムを少なくとも部分的に表す配列を含む組成物である。本明細書でさらに提供されるのは、複数のポリヌクレオチドがcDNAからの配列を含む組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくとも90%がターミネーターヌクレオチドを含む組成物である。本明細書でさらに提供されるのは、ポリヌクレオチドの少なくとも98%がターミネーターヌクレオチドを含む組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが少なくともいくつかのポリヌクレオチドの3’末端に結合している組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが、α基への修飾を伴うヌクレオチド、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸(inverted nucleic acids)、2’フルオロヌクレオチド、3’リン酸化ヌクレオチド、2’-O-メチル修飾ヌクレオチド、およびトランス核酸(trans nucleic acids)からなる群から選択される組成物である。本明細書でさらに提供されるのは、α基への修飾を伴うヌクレオチドがα-チオジデオキシヌクレオチドである組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドがデオキシリボースの3’炭素のr基の修飾を含む組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが、3’ブロックされた可逆的ターミネーターを含有するヌクレオチド、3’ブロックされてない可逆的ターミネーターを含有するヌクレオチド、デオキシリボヌクレオチドの2’修飾を含有するターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含有するターミネーター、およびそれらの組み合わせからなる群から選択される組成物である。本明細書でさらに提供されるのは、ターミネーターヌクレオチドが、ジデオキシヌクレオチド、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’-リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド(acyclonucleotides)、およびそれらの組み合わせからなる群から選択される組成物である。液滴中に含まれている組成物が本明細書でさらに提供される。
【0005】
標的核酸分子を増幅する方法が本明細書で提供され、上記方法は:標的核酸分子、少なくとも1つの増幅プライマー、少なくとも1つの核酸ポリメラーゼ、およびヌクレオチドの混合物を含むサンプルを接触させる工程であって、ここで、上記ヌクレオチドの混合物は、ポリメラーゼによる核酸複製を停止する少なくとも1つのターミネーターヌクレオチドを含む、工程と、複数の停止増幅産物(terminated amplification products)を生成するために標的核酸分子を増幅する工程であって、ここで、上記複製は鎖置換複製により進行する、工程と、を含む。増幅は実質的に等温条件下で実施される方法が、本明細書でさらに提供される。温度が10°C以下変動する条件下で増幅が実施される方法が本明細書でさらに提供される。温度が5°C以下変動する条件下で増幅が実施される方法が本明細書で提供される。核酸ポリメラーゼがDNAポリメラーゼである方法が本明細書でさらに提供される。DNAポリメラーゼが鎖置換(strand displacing)DNAポリメラーゼである方法が本明細書でさらに提供される。核酸ポリメラーゼが、バクテリオファージphi29(Φ29)ポリメラーゼ、遺伝子改変phi29(Φ29)DNAポリメラーゼ、DNAポリメラーゼIのクレノウ断片、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bst DNAポリメラーゼ、Bst ラージフラグメントDNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、Therminator DNAポリメラーゼ、T5 DNAポリメラーゼ、シーケナーゼ(Sequenase)、T7 DNAポリメラーゼ、T7-シーケナーゼ、あるいはT4 DNAポリメラーゼである方法が本明細書でさらに提供される。核酸ポリメラーゼは3’->5’エキソヌクレアーゼ活性を含み、および、少なくとも1つのターミネーターヌクレオチドは、3’->5’エキソヌクレアーゼ活性を阻害する方法が本明細書でさらに提供される。核酸ポリメラーゼは3’->5’エキソヌクレアーゼ活性を含まない方法が本明細書でさらに提供される。ポリメラーゼが、Bst DNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、クレノウ断片(exo-)DNAポリメラーゼ、あるいはTherminator DNAポリメラーゼである方法が本明細書でさらに提供される。少なくとも1つのターミネーターヌクレオチドは、デオキシリボースの3’炭素のr基の修飾を含む方法が本明細書でさらに提供される。本明細書でさらに提供されるのは、少なくとも1つのターミネーターヌクレオチドが、3’ブロックされた可逆的ターミネーターを含有するヌクレオチド、3’ブロックされてない可逆的ターミネーターを含有するヌクレオチド、デオキシリボヌクレオチドの2’修飾を含有するターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含有するターミネーター、およびそれらの組み合わせからなる群から選択される方法である。本明細書でさらに提供されるのは、少なくとも1つのターミネーターヌクレオチドが、ジデオキシヌクレオチド、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’-リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド、およびそれらの組み合わせからなる群から選択される方法である。本明細書でさらに提供されるのは、少なくとも1つのターミネーターヌクレオチドが、α基への修飾を伴うヌクレオチド、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸、2’フルオロヌクレオチド、3’リン酸化ヌクレオチド、2’-O-メチル修飾ヌクレオチド、およびトランス核酸からなる群から選択される方法である。本明細書でさらに提供されるのは、α基への修飾を伴うヌクレオチドがα-チオジデオキシヌクレオチドである方法である。増幅プライマーが4~70のヌクレオチド長さである方法が本明細書でさらに提供される。少なくとも1つの増幅プライマーが4~20のヌクレオチド長さである方法が、本明細書でさらに提供される。上記方法は、PCRを使用する追加の増幅工程をさらに含む方法が、本明細書でさらに提供される。少なくとも1つの増幅プライマーがランダム化された領域を含む方法が、本明細書でさらに提供される。本明細書でさらに提供されるのは、ランダム化された領域が4~20のヌクレオチド長さである方法である。本明細書でさらに提供されるのは、ランダム化された領域が8~15のヌクレオチド長さである方法である。本明細書でさらに提供されるのは、増幅産物が約50~約2000のヌクレオチド長さである方法である。本明細書でさらに提供されるのは、増幅産物が約200~約1000のヌクレオチド長さである方法である。低頻度の配列変異体(low frequency sequence variants)の同定のための方法が本明細書でさらに提供される。本明細書でさらに提供されるのは、低頻度の配列変異体が全配列の≧0.01%を構成する方法である。本明細書でさらに提供されるのは、低頻度の配列変異体が全配列の≧0.05%を構成する方法である。本明細書でさらに提供されるのは、低頻度の配列変異体が全配列の≧0.10%を構成する方法である。
【0006】
標的核酸分子を配列決定する方法が本明細書で提供され、上記方法は:標的核酸分子、少なくとも1つの増幅プライマー、少なくとも1つの核酸ポリメラーゼ、およびヌクレオチドの混合物を含むサンプルを接触させる工程であって、ここで、上記ヌクレオチドの混合物は、ポリメラーゼによる核酸複製を停止する少なくとも1つのターミネーターヌクレオチドを含む、工程と、複数の停止増幅産物を生成するために標的核酸分子を増幅する工程であって、ここで、上記複製は鎖置換複製により進行する、工程と;停止増幅産物から少なくとも1つのターミネーターヌクレオチドを除去する工程と;方法で得られた分子をアダプターに連結し、それにより、増幅産物のライブラリを生成する工程と;増幅産物のライブラリを配列決定する工程と、を含む。末端修復およびAテーリングをさらに含む方法が本明細書でさらに提供される。本明細書でさらに提供されるのは、標的核酸がDNAである方法である。本明細書でさらに提供されるのは、DNAがcDNAである方法である。本明細書でさらに提供されるのは、DNAがゲノムDNAである方法である。本明細書でさらに提供されるのは、少なくとも1つの増幅プライマーが2つ以上のプライマーを含む方法である。本明細書でさらに提供されるのは、少なくとも1つの増幅プライマーがランダムプライマーである方法である。本明細書でさらに提供されるのは、少なくとも1つの増幅プライマーがバーコードを含む方法である。本明細書でさらに提供されるのは、バーコードが細胞バーコードを含む方法である。本明細書でさらに提供されるのは、バーコードがサンプルバーコードを含む方法である。本明細書でさらに提供されるのは、増幅プライマーが固有分子識別子(UMI)を含む方法である。本明細書でさらに提供されるのは、最初のプライマーアニーリングの前に標的核酸またはゲノムDNAを変性させる方法をさらに含む方法である。変性がアルカリ性条件下で実施され、その後、中和される方法が本明細書でさらに提供される。本明細書でさらに提供されるのは、サンプル、増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物が、マイクロ流体デバイスに含有されている方法である。本明細書でさらに提供されるのは、サンプル、増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物が液滴に含有されている方法である。サンプルは、組織サンプル、細胞、生体液サンプル、骨髄サンプル、精液サンプル、生検サンプル、癌サンプル、腫瘍サンプル、細胞溶解サンプル、法医学サンプル、考古学サンプル、古生物学サンプル、感染サンプル、生成物サンプル、植物全体、植物部分、細菌叢サンプル、ウイルス調製物、土壌サンプル、海水サンプル、真水サンプル、家庭用あるいは工業用サンプル、およびそれらの組み合わせならびに分離物から選択される方法が、本明細書でさらに提供される。生体液は、血液、尿、唾液、リンパ液、脳脊髄液(CSF)、羊水、胸膜液、心膜液、腹水、および眼房水から選択される方法が、本明細書でさらに提供される。上記方法は、PCRを使用する追加の増幅工程をさらに含む方法が、本明細書でさらに提供される。
【0007】
単一細胞を配列決定する方法が本明細書で提供され、上記方法は:上記単一細胞からの細胞溶解物を提供する工程と;細胞溶解物を、少なくとも1つの増幅プライマー、少なくとも1つの核酸ポリメラーゼ、およびヌクレオチドの混合物と接触させる工程であって、ここで、ヌクレオチドの混合物は、ポリメラーゼによる核酸複製を停止する少なくとも1つのターミネーターヌクレオチドを含む、工程と、複数の停止増幅産物を生成するために標的核酸分子を増幅する工程であって、ここで、上記複製は鎖置換複製により進行する、工程と;停止増幅産物から少なくとも1つのターミネーターヌクレオチドを除去する工程と;上記方法で得られた分子をアダプターに連結し、それにより、増幅産物のライブラリを生成する工程と;増幅産物のライブラリを配列決定する工程と、を含む。細胞溶解にはタンパク質分解が伴う方法が本明細書でさらに提供される。サンプル、少なくとも1つの増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物が、マイクロ流体デバイスに含有されている方法が本明細書でさらに提供される。サンプル、少なくとも1つの増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物が、液滴に含有されている方法が本明細書でさらに提供される。少なくとも1つの増幅プライマーが固体支持体に結合される方法が本明細書でさらに提供される。固体支持体がビーズである方法が本明細書でさらに提供される。本明細書でさらに提供されるのは、少なくとも1つの増幅プライマーが切断可能なリンカーによって固体支持体に結合される方法である。本明細書でさらに提供されるのは、さらに、少なくとも1つの増幅プライマーがバーコードを含む方法である。増幅前に切断可能なリンカーを切断する工程をさらに含む方法が本明細書でさらに提供される。細胞は、動物細胞、植物細胞、真菌細胞、細菌細胞、および原生動物細胞から選択される方法が本明細書でさらに提供される。動物細胞はヒト細胞である方法が本明細書でさらに提供される。細胞は、着床前胚からの細胞、幹細胞、胎児細胞、腫瘍細胞、疑わしい癌細胞、癌細胞、遺伝子編集手順を受けた細胞、病原体からの細胞、法医学サンプルから得られた細胞、考古学サンプルから得られた細胞、および古生物学サンプルから得られた細胞から選択される方法が本明細書でさらに提供される。着床前胚細胞が割球である方法が本明細書でさらに提供される。割球は、体外受精によって生成された8つの細胞期の胚から得られる方法が本明細書でさらに提供される。胚細胞中の疾患の素因となる生殖系列変異体あるいは体細胞変異体の存在を決定する工程をさらに含む方法が、本明細書でさらに提供される。病原体は、細菌、真菌、あるいは原生動物である方法が本明細書でさらに提供される。病原体から得られる細胞は、患者、細菌叢サンプル、あるいは留置医療機器から採取された流体から得られる方法が、本明細書でさらに提供される。病原体の同一性を決定する工程をさらに含む方法が、本明細書でさらに提供される。処置に対する病原体の耐性の原因となる遺伝子変異体の存在を決定する工程をさらに含む方法が、本明細書でさらに提供される。細胞は、腫瘍細胞、疑わしい癌細胞、あるいは癌細胞である方法が本明細書でさらに提供される。1つ以上の診断変異あるいは予後変異(diagnostic or prognostic mutations)の存在を決定する工程をさらに含む方法が本明細書でさらに提供される。処置に対する耐性の原因となる生殖系列変異体または体細胞変異体の存在を決定する工程をさらに含む方法が本明細書でさらに提供される。上記細胞は遺伝子編集手順を受けた細胞である方法が、本明細書でさらに提供される。遺伝子編集プロセスによって引き起こされた計画外の突然変異の存在を決定する工程をさらに含む方法が、本明細書でさらに提供される。細胞系統の履歴(history)を決定する工程をさらに含む方法が本明細書でさらに提供される。低頻度の配列変異体の同定のための方法が本明細書でさらに提供される。低頻度の配列変異体が全配列の≧0.01%を構成する方法が、本明細書でさらに提供される。低頻度の配列変異体が全配列の≧0.05%を構成する方法が、本明細書でさらに提供される。低頻度の配列変異体が全配列の≧0.10%を構成する方法が、本明細書でさらに提供される。上記方法は、PCRを使用する追加の増幅工程をさらに含む方法が、本明細書でさらに提供される。
【0008】
環境条件の変異原性を決定する方法が本明細書で提供され、上記方法は:環境条件に細胞をさらす工程と;集団から単一細胞を単離する工程と;単一細胞からの細胞溶解物を提供する工程と;細胞溶解物を、少なくとも1つの増幅プライマー、少なくとも1つの核酸ポリメラーゼ、およびヌクレオチドの混合物と接触させる工程であって、ここで、ヌクレオチドの混合物は、ポリメラーゼによる核酸複製を停止する少なくとも1つのターミネーターヌクレオチドを含む、工程と、複数の停止増幅産物を生成するために標的核酸分子を増幅する工程であって、ここで、上記複製は鎖置換複製により進行する、工程と;停止増幅産物から少なくとも1つのターミネーターヌクレオチドを除去する工程と;上記方法で得られた分子をアダプターに連結し、それにより、増幅産物のライブラリを生成する工程と;増幅産物のライブラリを配列決定する工程と、突然変異を同定するために、増幅産物の配列を少なくとも1つの参照配列と比較する工程と、を含む。単一細胞がヒト細胞である方法が本明細書でさらに提供される。環境条件が化学物質を含む方法が本明細書でさらに提供される。環境条件が放射線を含む方法が本明細書でさらに提供される。環境条件が紫外線を含む方法が本明細書でさらに提供される。単一細胞は、肝臓、皮膚、腎臓、血液、あるいは肺に由来する方法が本明細書でさらに提供される。増幅産物の少なくともいくつかがバーコードを含む方法が明細書でさらに提供される。本明細書でさらに提供されるのは、バーコードが細胞バーコードを含む方法である。本明細書でさらに提供されるのは、バーコードがサンプルバーコードを含む方法である。本明細書でさらに提供されるのは、増幅プライマーの少なくともいくつかが固有分子識別子(UMI)を含む方法である。上記方法は、PCRを使用する追加の増幅工程をさらに含む方法が、本明細書でさらに提供される。
【0009】
引用による組み込み
本明細書で言及される全ての刊行物、特許、および特許出願は、あたかも個々の刊行物、特許、または特許出願が引用によって組み込まれるよう具体的且つ個別に示されるかのように、同じ程度まで引用により本明細書に組み込まれる。
【図面の簡単な説明】
【0010】
本発明の新規な特徴は、とりわけ添付の特許請求の範囲で説明される。本発明の特徴および利点のより良い理解は、本発明の原理が用いられる例示的実施形態を説明する以下の詳細な説明と、以下の添付図面とを引用することによって得られるであろう。
【0011】
【
図1A】前の多置換増幅(MDA)法と、一次鋳型指向性増幅(Primary Template-Directed Amplification)(PTA)法の実施形態の1つ、すなわちPTA-不可逆的ターミネーター法との比較を示す。
【
図1B】PTA-不可逆的ターミネーター法と、異なる実施形態、すなわちPTA可逆的ターミネーター法との比較を示す。
【
図1C】突然変異伝播(mutation propagation)に関連する場合の、MDA法およびPTA不可逆的ターミネーター法の比較を示す。
【
図1D】増幅後に実施される方法の工程を示し、それは、アダプターライゲーション前のターミネーターの除去、末端修復、およびAテーリングの実行を含む。その後、プールされた細胞のライブラリは、配列決定の前に、すべてのエクソンあるいは対象の他の特定領域についてハイブリダイゼーション媒介濃縮(hybridization-mediated enrichment)を受ける場合がある。各リードの起原の細胞は、細胞バーコード(緑色および青色の配列として示される)によって同定される。
【
図2A】増大する濃度のターミネーター(上のゲル)の添加による、PTAを受けた後のアンプリコンの粒度分布を示す。下のゲルは、増大する濃度の可逆的ターミネーターの添加、あるいは増加する濃度の不可逆的ターミネーターの添加によるPTAを受けた後のアンプリコンの粒度分布を示す。
【
図2B】MDAおよびPTAの配列決定された塩基のGC含有量の比較を示す(GC)。
【
図2C】単一細胞がPTAまたはMDAを受けた後の、ヒトゲノムにマッピングする(p_mapped)マップ品質スコア(mapQ)を示す。
【
図2D】単一細胞がPTAまたはMDAを受けた後の、ヒトゲノムにマッピングする(p_mapped)リードのパーセントを示す。
【
図2E】単一細胞がMDAおよびPTAを受けた後の、2000万のサブサンプリングされたリードのPCR複製であるリードのパーセントの比較を示す(PCR)。
【
図3A】単一細胞が可逆的あるいは不可逆的ターミネーターを用いたPTAを受けた後の、ヒトゲノムにマッピングする(p_mapped2)マップ品質スコア(c)(mapQ2)を示す。
【
図3B】単一細胞が可逆的あるいは不可逆的ターミネーターを用いたPTAを受けた後の、ヒトゲノムにマッピングする(p_mapped2)リードのパーセントを示す。
【
図3C】様々な方法を使用した、Alu要素と重複するリードの平均パーセントについてアライメントしたリードを記載する一連のボックスプロットを示す。PTAは、ゲノムにアライメントする最も多くのリードを有していた。
【
図3D】様々な方法を使用した、Alu要素と重複するリードの平均パーセントについてPCR重複を記載する一連のボックスプロットを示す。
【
図3E】様々な方法を使用した、Alu要素と重複するリードの平均パーセントについてリードのGC含有量を記載する一連のボックスプロットを示す。
【
図3F】様々な方法を使用した、Alu要素と重複するリードの平均パーセントのマッピング品質を記載する一連のボックスプロットを示す。PTAは、試験された方法の中で最も高いマッピング品質を有していた。
【
図3G】固定された7.5X配列決定深度で、様々なWGA法でのSCミトコンドリアゲノムカバレッジ幅の比較を示す。
【
図4A】各細胞を4000万のペアリードにダウンサンプリングした後のランダムプライマーのPTA増幅細胞と比較した、高品質MDA細胞(~50%細胞を表す)を選択した後の、第1染色体にわたる10キロベースのウィンドウの平均カバレッジ深度を示す。この図は、MDAが、平均カバレッジ深度の2倍より高い(ボックスA)あるいはより低い(ボックスC)ウィンドウが多く、より低い均一性を有することを示す。反復領域(ボックスB)のより高いGC含有量およびより低いマッピング品質ゆえに、セントロメアではMDAとPTAの両方においてカバレッジが存在しない。
【
図4B】MDAおよびPTAの方法の配列決定カバレッジ対ゲノム位置のプロットを示す(上)。より低いボックスプロットは、バルクサンプル(bulk sample)と比較した、MDAとPTAの方法の対立遺伝子頻度を示す。
【
図4C】MDAとPTAの実験のカバレッジの均一性についての平均カバレッジ対ゲノムウィンドウのプロットを示す。PTAは、MDAよりも、ゲノムにわって非常に均一なカバレッジをもたらした。
【
図5A】様々な方法に対する増大する配列決定深度におけるカバレッジを評価するための、カバーされたゲノムの画分対リードゲノムの数のプロットを示す。PTA法は、あらゆる深度で2つのバルクサンプルに近く、試験した他の方法よりも改善されている。
【
図5B】カバレッジの均一性を評価するための、ゲノムカバレッジ対リードの数の変動係数のプロットを示す。PTA法は、試験された方法の中で最も高い均一性を有することが分かった。
【
図5C】全リードの累積画分対ゲノムの累積画分のローレンツプロットを示す。PTA法は、試験された方法の中で最も高い均一性を有することが分かった。
【
図5D】完全な均一性との各増幅反応の違いを評価するために、試験された方法の各々について計算されたジニ係数(Gini Indices)の一連のボックスプロットを示す。PTA法は、試験された他の方法よりも、再現性が高い均一性であることが分かった。
【
図5E】コールされるバルク変異体(bulk variants)の画分対リードの数のプロットを示す。方法の各々の変異コールレート(variant call rates)を、配列決定深度が増大する際の対応するバルクサンプルと比較した。感度を評価するために、各配列決定深度(
図3A)で各細胞において見つけられた6億5000万のリードにサブサンプリングされた、対応するバルクサンプル中でコールされる変異体のパーセントを計算した。PTAの改善されたカバレッジおよび均一性は、次に最も感度が高い方法であったQ-MDA法よりも、30%多い変異体の検出を結果としてもたらした。
【
図5F】Alu要素と重複するリードの平均パーセントの一連のボックスプロットを示す。PTA法は、これらのヘテロ接合部位で対立遺伝子の歪みを有意に減少させた。PTA法は、試験された他の方法と比較して、同じ細胞中の2つの対立遺伝子をより平等に増幅する。
【
図5G】変異コールの特異性を評価するための、変異コールの特異性対リードの数のプロットを示す。バルクサンプルでは見つからなかった、様々な方法を使用して見つかった変異体は、偽陽性と見なされた。PTA法は、試験された方法の中で最も低い偽陽性コール(最も高い特異性)を結果としてもたらした。
【
図5H】様々な方法に対する各タイプの塩基変化の偽陽性塩基変化の画分を示す。理論によって縛られることなく、そのようなパターンはポリメラーゼ依存性であってもよい。
【
図5I】偽陽性変異コールのAlu要素と重複するリードの平均パーセントの一連のボックスプロットを示す。PTA法は、偽陽性変異コールの最も低い対立遺伝子頻度を結果としてもたらした。
【
図6A】本開示のクロノタイプの薬剤感受性のカタログの概略的な説明を示す。別個のクロノタイプの薬剤感受性を同定することによって、腫瘍学者が患者の腫瘍で同定されたクロノタイプを、抵抗性集団を最も良く標的とする薬剤のリストへと変換することができるカタログを生成することができる。
【
図6B】100回のシミュレーション後の、1クローン当たりの白血球細胞の数の増加に伴う白血病のクローンの数の変化を示す。細胞ごとの突然変異率を使用して、1つの細胞が100億~1,000億の細胞に増える際に、大量の様々なより小さなクローンが作られることがシミュレーションにより予測される(ボックスA)。最も高い頻度1-5クローンのみ(ボックスC)が、現在の配列決定方法を用いて検出される。本発明の一実施形態では、現在の方法(ボックスB)の検出レベルのすぐ下にある、数百のクローンの薬剤抵抗性を決定する方法が提供される。
【
図7】本開示の例示的な実施形態を示す。下の列の診断サンプルと比較して、化学療法なしの培養が、活性化KRAS突然変異を抱えるクローン(赤色のボックス、右下隅)のために選択された。反対に、そのクローンはプレドニゾロンあるいはダウノルビシンによって殺されたが(緑色の箱、右上隅)、より低い頻度のクローンは正の選択を受けた(破線のボックス)。
【
図8】本開示の1つの実施形態、すなわち、特定の薬剤への特定の遺伝子型を有するクローンの相対的感受性を定量化するための実験計画の概観である。
【
図9】部分Aは、切断可能なリンカー、固有の細胞バーコード、およびランダムプライマーを用いて結合されたオリゴヌクレオチドを有するビーズを示す。部分Bは、同じ液滴中に封入され、その後、細胞を溶解し、プライマーを切断した、単一細胞およびビーズを示す。その後、液滴を、PTA増幅混合物(amplification mix)を含む別の液滴と融合してもよい。部分Cは、増幅後に液滴が破壊され、すべての細胞からのアンプリコンがプールされることを示す。その後、本開示によるプロトコルは、アダプターライゲーション前のターミネーターの除去、末端修復、およびAテーリングのために利用される。その後、プールされた細胞のライブラリは、配列決定前に、対象のエクソンのハイブリダイゼーション媒介濃縮を受ける。その後、各リードの起原の細胞は、細胞バーコードを使用して同定される。
【
図10A】細胞のバーコードおよび/または固有分子識別子を含むプライマーを使用した、細胞のバーコードおよび/または固有分子識別子のPTAの反応への取り込みを実証する。
【
図10B】細胞のバーコードおよび/または固有分子識別子を含むヘアピンプライマーを使用した、細胞のバーコードおよび/または固有分子識別子のPTAの反応への取り込みを実証する。
【
図11A】固有分子識別子(UMI)の取り込みがコンセンサスリードの生成を可能にし、配列決定および他のエラーにより引き起こされる偽陽性率を低下させ、生殖系列あるいは体細胞の変異コーリングを実施する際の感受性の増大につながることを示す(PTA_UMI)。
【
図11B】同じUMIを有するリードを崩壊させることにより、コピー数変異をコールする際に、増幅、および誤検出あるいは制限された感受性を結果としてもたらす他のバイアスを修正することができることを示す。
【
図12A】環境変異原性実験(environmental mutagenicity experiment)の直接測定のための突然変異の数対処理群のプロットを示す。単一のヒト細胞を、様々な処理レベルで、ビヒクル(VHC)、マンノース(MAN)、あるいは、直接突然変異原N-エチル-N-ニトロソウレア(ENU)に暴露し、突然変異の数を測定した。
【
図12B】突然変異の数対様々な処理群およびレベルの一連のプロットを、塩基突然変異のタイプによってさらに分けて示す。
【
図12C】トリヌクレオチドに関する突然変異のパターン表現を示す。y軸上の塩基はn-1位置にあり、x軸上の塩基はn+1位置にある。より暗い領域はより低い突然変異の頻度を示し、より明るい領域はより高い突然変異の頻度を示す。上の列(シトシン突然変異)にある黒一色のボックスは、シトシンがグアニンに続く場合、シトシン突然変異誘発がそれほど頻繁ではないことを示す。下の列(チミン突然変異)にある破線の黒色ボックスは、ほとんどのチミン突然変異が、アデニンがチミンのすぐ前にある位置で生じることを示す。
【
図12D】CD34+細胞における既知のDNase Iの高感受性部位の位置を、N-エチル-N-ニトロソウレア処理細胞からの対応する位置と比較したグラフを示す。シトシン変異体の有意な濃縮は観察されなかった。
【
図12E】DNase I高感受性(DH)部位でのENU誘発変異の割合を示す。予めRoadmap Epigenomics Projectによってカタログ化(catalogued)されたCD34+細胞におけるDH部位を使用して、ENU突然変異がオープンクロマチンの部位を表すDH部位においてより頻繁であるかどうかを調査した。DH部位での変異体の位置の有意な濃縮は同定されず、シトシンに制限された変異体の濃縮はDH部位で観察されなかった。
【
図12F】特定のアノテーションを用いたゲノムの位置でのENU誘発変異の割合の一連ボックスプロットを示す。各アノテーションを含むゲノム(右のボックス)の割合と比較して、特定の濃縮は、各細胞中の変異体(左のボックス)の特定のアノテーションにおいて見られなかった。
【発明を実施するための形態】
【0012】
再現可能な様式で、配列表現、均一性、および正確さを増大させることにより現在の方法の制限を克服する、核酸増幅(単一細胞および多細胞のゲノム増幅を含む)と配列決定のための、新規で、スケーラブルで、正確で、ならびに効率的な方法を開発する必要がある。正確かつスケーラブルな一次鋳型指向性増幅(PTA)ならびに配列決定をもたらすための組成物および方法が本明細書で提供される。単一のヌクレオチド変異体の決定、コピー数多型、クロノタイピング(clonotyping)、および環境変異原性の測定の方法が本明細書でさらに提供される。そのような方法および組成物は、標的(あるいは「鋳型」)核酸の非常に正確な増幅を促進し、次世代シーケンシングなどの下流の適用(downstream applications)の精度と感度を増大させる。
【0013】
定義
【0014】
他に定義されない限り、本明細書で使用されるすべての技術的および科学的用語は、これらの発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。
【0015】
本開示全体にわたって、数値的特徴は範囲形式で示される。範囲形式での記載は単に利便性と簡潔さのためのものに過ぎず、任意の実施形態の範囲に対する確固たる限定として解釈されてはならないということを理解されたい。したがって、範囲の記載は、文脈で別段の定めのない限り、すべての可能性のある下位範囲と、下限の単位の小数第2位までのその範囲内の個々の数値を具体的に開示していると考えられなければならない。例えば、1~6などの範囲の記載は、1~3、1~4、1~5、2~4、2~6、3~6などの下位範囲と、例えば、1.1、2、2.3、5、および5.9のその範囲内の個々の数値を具体的に開示していると考えられなければならない。これは、範囲の広さにかかわらず適用される。これらの介在する範囲の上限および下限は、より小さな範囲内に独立して含まれてもよく、また、定められた範囲内のあらゆる具体的に除外された限界に従って、本発明内に包含される。定められた範囲が上限および下限の1つまたはその両方を含む場合、これらの含まれた上限および下限のいずれかまたは両方を除く範囲も、文脈が明らかに他に指示しない限り、本発明内に包含される。
【0016】
本明細書で使用される用語は、特定の実施形態のみを記載するためのものあり、いずれの実施形態を限定することを意図してはいない。本明細書で使用されるように、単数形「a」、「an」、および「the」は、文脈が他に明白に示していない限り、同様に複数形を含むように意図される。用語「含む(comprises)」および/または「含むこと(comprising)」は、本明細書での使用時に、明示された特徴、整数、工程、操作、要素、および/または構成要素の存在を特定するが、1以上の他の特徴、整数、工程、操作、要素、構成要素、および/またはそれらの群の存在または追加を排除しないことが、さらに理解される。本明細書で使用されるように、用語「および/または」は、関連する列挙された項目の1つ以上のあらゆる組み合わせを含む。
【0017】
別段の定めのない限り、あるいは文脈から明らかでない限り、本明細書で使用されるように、数あるいは数の範囲に関連して用語「約」とは、明示された数とその数+/-10%、あるいはある範囲の列挙された値について列挙された下限の10%以下と列挙された10%以上を意味するものと理解されたい。
【0018】
「被験体」あるいは「患者」または「個体」という用語は、本明細書で使用されるように、例えば、ヒト、獣医学的な動物(veterinary animals)(例えば、ネコ、イヌ、雌ウシ、ウマ、ヒツジ、ブタなど)、および疾患の実験動物モデル(例えば、マウス、ラット)などの哺乳動物を含む。本発明においては、従来の分子生物学、微生物学、および組換DNA技法を、当業者の技能範囲内で利用することができる。そのような技術は、文献に十分に説明されている。とりわけ、例えば、Sambrook, Fritsch & Maniatis, Molecular Cloning: A Laboratory Manual, Second Edition (1989) Cold Spring Harbor Laboratory Press, Cold Spring Harbor, New York (本明細書では“Sambrook et al., 1989”);DNA Cloning: A practical Approach, Volumes I and II (D.N. Glover ed. 1985);Oligonucleotide Synthesis (MJ. Gait ed. 1984);Nucleic Acid Hybridization (B.D. Hames & S.J. Higgins eds. (1985≫;Transcription and Translation (B.D. Hames & S.J. Higgins, eds. (1984≫;Animal Cell Culture (R.I. Freshney, ed. (1986≫;Immobilized Cells and Enzymes (lRL Press, (1986≫;B. Perbal, A practical Guide To Molecular Cloning (1984);F.M. Ausubel et al. (eds.), Current Protocols in Molecular Biology, John Wiley & Sons, Inc. (1994);を参照。
【0019】
用語「核酸」は、一本鎖分子ならびに多鎖分子を包含する。二本鎖または三本鎖の核酸では、核酸鎖は同一の広がりをもつ必要がない(つまり、二本鎖または三本鎖の核酸は、両方の鎖の全長にわたって二本鎖である必要がない)。本明細書に記載される核酸鋳型は、サンプルに応じて任意のサイズ(小さな無細胞DNA断片から全ゲノムまで)であってもよく、限定されないが、50~300の塩基、100~2000の塩基、100~750の塩基、170~500の塩基、100~5000の塩基、50~10,000の塩基、あるいは50~2000の塩基長さを含む。いくつかの例では、鋳型は、少なくとも50、100、200、500、1000、2000、5000、10,000、20,000 50,000、100,000、200,000、500,000、1,000,000であるか、あるいは1,000,000を超える塩基長さである。本明細書に記載される方法は、核酸鋳型などの核酸の増幅を提供する。本明細書にさらに記載される方法は、単離され、かつ少なくとも部分的に精製された核酸および核酸のライブラリの生成を提供する。核酸としては、限定されないが、DNA、RNA、環状RNA、cfDNA(無細胞DNA)、cfRNA(無細胞RNA)、siRNA(低分子干渉RNA)、cffDNA(細胞フリー胎児DNA)、mRNA、tRNA、rRNA、miRNA(microRNA)、合成ポリヌクレオチド、ポリヌクレオチドアナログ、本明細書と一致する範囲で任意の他の核酸、あるいはそれらの任意の組み合わせを含むものが挙げられる。ポリヌクレオチドの長さは、提供される場合、塩基の数として記載され、nt(ヌクレオチド)、bp(塩基)、kb(キロベース)、あるいはGb(gigabases)などに省略される。
【0020】
用語「液滴」は、本明細書で使用されるように、液滴アクチュエータ上の液体の体積(volume)を指す。例えば、いくつかの例では、液滴は水性または非水性であるか、もしくは、水性および非水性の成分を含む混合物あるいはエマルジョンであってもよい。液滴操作を受け得る液滴流体の非限定的な例については、例えば、国際特許出願公開公報WO2007/120241を参照されたい。液滴を形成および操作するための任意の適切なシステムが、本明細書に提示される実施形態において使用されてもよい。例えば、いくつかの例では、液滴アクチュエータが使用される。使用可能な液滴アクチュエータの非限定的な例については、例えば、米国特許第6,911,132号、第6,977,033号、第6,773,566号、第6,565,727号、第7,163,612号、第7,052,244号、第7,328,979号、第7,547,380号、第7,641,779号、米国特許出願公開US20060194331、US20030205632、US20060164490、US20070023292、US20060039823、US20080124252、US20090283407、US20090192044、US20050179746、US20090321262、US20100096266、US20110048951、国際特許出願公開第WO2007/120241を参照されたい。いくつかの例では、ビーズは、液滴中で、液滴操作ギャップ中で、あるいは液滴操作面上でもたらされる。いくつかの例では、ビーズは、液滴操作ギャップの外部にあるか、あるいは液滴操作面から離れて置かれるリザーバー内で提供され、上記リザーバーは、ビーズを含む液滴が液滴操作ギャップ内にもたらされるか、あるいは、液滴操作面と接触することを可能にする流路と関連する。磁気応答性ビーズおよび/または非磁気応答性ビーズを固定するための、および/またはビーズを使用して液滴操作プロトコルを実施するための液滴アクチュエータ技術の非限定的な例は、米国特許出願公開US20080053205、国際出願公開WO2008/098236、WO2008/134153、WO2008/116221、WO2007/120241に記載されている。ビーズ特性は、本明細書に記載される方法の多重化の実施形態において使用され得る。多重化に適している特性を有するビーズ、ならびに、そのようなビーズから発せられたシグナルを検出および分析する方法の例は、米国特許出願公開US20080305481、US20080151240、US20070207513、US20070064990、US20060159962、US20050277197、US20050118574で見ることができる。
【0021】
本明細書で使用されるように、用語「固有分子識別子(UMI)」は、複数の核酸分子の各々に結合される固有の核酸配列を指す。核酸分子に組み込まれると、UMIは、いくつかの例では、増幅後に配列決定されるUMIを直接計数することによって後の増幅バイアスを修正するために使用される。UMIの設計、組み込み、および適用は、例えば、国際出願公開WO2012/142213、Islam et al. Nat. Methods (2014) 11:163-166, and Kivioja, T. et al. Nat. Methods (2012) 9: 72-74において記載される。
【0022】
本明細書で使用されるように、用語「バーコード」は、核酸材料のサンプルまたはソースを同定するために使用することができる、核酸タグを指す。したがって、核酸サンプルが複数のソースに由来する場合、各核酸サンプル中の核酸は、場合によっては、サンプルのソースを同定することができるように異なる核酸タグでタグ付けされる。指標、タグなどとも一般的に呼ばれるバーコードは、当業者に公知である。任意の適切なバーコードあるいはバーコードのセットが使用され得る。例えば、米国特許第8,053,192号、国際出願公開WO2005/068656において提供される非限定的な例を参照されたい。単一細胞のバーコーディングは、例えば、米国特許出願2013/0274117において記載される通りに実施されてもよい。
【0023】
用語「固体表面」、「固体支持体」、ならびに本明細書における他の文法的等価物は、本明細書に記載されるプライマー、バーコード、および配列の取り付けに適切であるか、あるいは、それらの取り付けに適切になるよう修飾され得る任意の材料を指す。例示的な基質としては、限定されないが、ガラスおよび改良ガラスあるいは機能化ガラス、プラスチック(アクリル樹脂、スチレンおよび他の材料のポリスチレンおよびコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、Teflon(商標)などを含む)、多糖類、ナイロン、ニトロセルロース、セラミックス、樹脂剤、シリカ、シリカベースの材料(例えば、シリコンあるいは変性シリコン)、炭素、金属、無機ガラス、プラスチック、光ファイバー束、ならびに様々な他のポリマーなどが挙げられる。いくつかの実施形態において、固体支持体は、規則正しいパターンで、プライマー、バーコード、および配列を固定するのに適したパターン化表面を含む。
【0024】
本明細書で使用されるように、用語「生体サンプル」としては、限定されないが、組織、細胞、体液、およびそれらの分離物(isolates)が挙げられる。本明細書に記載される方法において使用される細胞あるいは他のサンプルは、場合によっては、ヒト患者、動物、植物、土壌、あるいは、微生物、例えば、細菌、菌類、原生動物などを含む他のサンプルから単離される。いくつかの例では、生体サンプルはヒト由来である。いくつかの例では、生体はヒト以外に由来する。細胞は、いくつかの例では、本明細書に記載されるPTA法および配列決定を受ける。ゲノム全体にわたって、あるいは特定の位置で検出された変異体は、その被験体から単離された他のすべての細胞と比較して、研究または診断目的のために細胞系統の履歴を追跡することができる。
【0025】
一次鋳型指向性増幅
【0026】
「一次鋳型指向性増幅(PTA)」などの核酸増幅方法が本明細書に記載されている。例えば、本明細書に記載されるPTA法は、
図1A-1Dに概略的に表される。PTA法では、アンプリコンは、ポリメラーゼ(例えば、鎖置換ポリメラーゼ)を使用して、一次鋳型(「直接コピー」)から優先的に生成される。結果的に、エラーは、MDAと比較して、後の増幅中にドーターアンプリコン(daughter amplicons)からより低い速度で伝播される。その結果、既存のWGAプロトコルとは異なり、正確かつ再現可能な様式で、高いカバレッジ幅および均一性で、単一細胞のゲノムを含む低いDNA入力を増幅することが可能な、容易に実行される方法が得られる。さらに、停止増幅産物は、ターミネーターの除去後に方向ライゲーションを受ける場合があり、これにより、並列増幅反応を受けた後、すべての細胞からの産物がプールされ得るように、増幅プライマーに細胞バーコードを取り付けることができる(
図1B)。
【0027】
増幅のために鎖置換活性を有する核酸ポリメラーゼを使用する方法が本明細書に記載されている。いくつかの例では、そのようなポリメラーゼは、鎖置換活性および低いエラー率を含む。いくつかの例では、そのようなポリメラーゼは、鎖置換活性および校正エキソヌクレアーゼ活性、例えば、3’->5’校正活性を含む。いくつかの例では、核酸ポリメラーゼは、他の成分、例えば、可逆的あるいは不可逆的ターミネーター、または追加の鎖置換因子(strand displacement factors)と共に使用される。いくつかの例では、ポリメラーゼは鎖置換活性を有しているが、エキソヌクレアーゼ校正活性は有していない。例えば、いくつかの例では、そのようなポリメラーゼは、バクテリオファージphi29(Φ29)ポリメラーゼを含み、それは、3’->5’校正エキソヌクレアーゼ活性の結果である非常に低いエラー率を有している(例えば、米国特許第5,198,543号および第5,001,050号を参照)。いくつかの例では、鎖置換核酸ポリメラーゼの非限定的な例は、例えば、遺伝子改変されたphi29(Φ29)DNAポリメラーゼ、DNAポリメラーゼIのクレノウ断片(Jacobsen et al., Eur. J. Biochem. 45:623-627 (1974))、ファージM2 DNAポリメラーゼ (Matsumoto et al., Gene 84:247 (1989))、ファージphiPRD1 DNAポリメラーゼ(Jung et al., Proc. Natl. Acad. Sci. USA 84:8287 (1987); Zhu and Ito, Biochim. Biophys. Acta. 1219:267-276 (1994))、Bst DNAポリメラーゼ(例えば、BstラージフラグメントDNAポリメラーゼ(Exo(-) Bst;Aliotta et al., Genet. Anal.(Netherlands) 12:185-195 (1996))、exo(-)Bca DNAポリメラーゼ(Walker and Linn, Clinical Chemistry 42:1604-1608 (1996))、Bsu DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼを含むVentR DNAポリメラーゼ(Kong et al., J. Biol. Chem. 268:1965-1975 (1993))、Deep Vent(exo-)DNAポリメラーゼを含むDeep Vent DNAポリメラーゼ、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、Therminator DNAポリメラーゼ、T5 DNAポリメラーゼ (Chatterjee et al., Gene 97:13-19 (1991))、シーケナーゼ(U.S. Biochemicals)、T7 DNAポリメラーゼ、T7-シーケナーゼ、T7 gp5 DNAポリメラーゼ、PRDI DNAポリメラーゼ、T4 DNAポリメラーゼ(Kaboord and Benkovic, Curr. Biol. 5:149-157 (1995))を含む。さらなる鎖置換核酸ポリメラーゼは、本明細書に記載される方法と適合性がある。所与のポリメラーゼが鎖置換複製を実行する能力は、例えば、鎖置換複製アッセイ(例えば、米国特許第6,977,148号に開示されるような)におけるポリメラーゼを使用することにより、決定することができる。例えば、そのようなアッセイは、いくつかの例において、使用される酵素の最適な活性に適した温度で実施され、例えば、phi29 DNAポリメラーゼの場合は32°C、exo(-)Bst DNAポリメラーゼの場合は46°C~64°C、あるいは、超好熱性生物からの酵素の場合は約60°C~70°Cで実施される。ポリメラーゼを選択するための別の有用なアッセイは、Kong et al., J. Biol. Chem. 268:1965-1975 (1993)に記載されるプライマーブロックアッセイ(primer-block assay)である。上記アッセイは、伸長プライマーの上流にハイブリダイズしてその進行をブロックするオリゴヌクレオチドの存在下または非存在下で、M13一本鎖DNA鋳型を使用するプライマー伸長アッセイからなる。このアッセイ中のブロッキングプライマーを置換することができる他の酵素は、場合によっては、本開示される方法に有用である。いくつかの例では、ポリメラーゼは、ほぼ等しい速度でdNTPおよびターミネーターを組み込む。いくつかの例では、本明細書に記載されるポリメラーゼについてのdNTPおよびターミネーターの取り込みの速度の比は、約1:1、約1.5:1、約2:1、約3:1、約4:1、約5:1、約10:1、約20:1、約50:1、約100:1、約200:1、約500:1、あるいは約1000:1である。いくつかの例では、本明細書に記載されるポリメラーゼについてのdNTPおよびターミネーターの取り込みの速度の比は、1:1~1000:1、2:1~500:1、5:1~100:1、10:1~1000:1、100:1~1000:1、500:1~2000:1、50:1~1500:1、あるいは25:1~1000:1である。
【0028】
増幅の方法が本明細書に記載され、ここで、鎖置換因子、例えば、ヘリカーゼなどの使用を通じて、鎖置換を促進することができる。そのような因子は、いくつかの例では、ポリメラーゼ、ターミネーター、あるいは他の成分などの追加の増幅成分と共に使用されてもよい。いくつかの例では、鎖置換因子は、鎖置換活性を有していないポリメラーゼと共に使用される。いくつかの例では、鎖置換因子は、鎖置換活性を有しているポリメラーゼと共に使用される。理論によって縛られることなく、鎖置換因子は、より小さな二本鎖のアンプリコンが再刺激される率を増加することができる。いくつかの例では、鎖置換因子の存在下において鎖置換複製を実施することができる任意のDNAポリメラーゼは、たとえDNAポリメラーゼがそのような要因の不在下では鎖置換複製を実施しない場合でも、PTA法での使用に適している。鎖置換複製に有用な鎖置換因子は、いくつかの例において、(限定されないが)BMRF1ポリメラーゼアクセサリーサブユニット(Tsurumi et al., J. Virology 67(12):7648-7653 (1993)), アデノウイルスDNA結合タンパク質 (Zijderveld and van der Vliet, J. Virology 68(2): 1158-1164 (1994))、単純ヘルペスウイルスタンパク質ICP8(Boehmer and Lehman, J. Virology 67(2):711-715 (1993);Skaliter and Lehman, Proc. Natl. Acad. Sci. USA 91(22):10665-10669 (1994));一本鎖DNA結合タンパク質(SSB; Rigler and Romano, J. Biol. Chem. 270:8910-8919 (1995));T4ファージ遺伝子32タンパク質 (Villemain and Giedroc, Biochemistry 35:14395-14404 (1996);T7ヘリカーゼプライマーゼ;T7 gp2.5 SSBタンパク質;Tte-UvrD(Thermoanaerobacter tengcongensis)、子ウシ胸腺ヘリカーゼ(Siegel et al., J. Biol. Chem. 267:13629-13635 (1992));細菌SSB(例えば、大腸菌SSB)、真核生物における複製タンパク質A(RPA)、ヒトミトコンドリアSSB(mtSSB)、およびレコンビナーゼ(例えば、レコンビナーゼA(RecA)ファミリータンパク質、T4 UvsX、ファージHK620のSak4、Rad51、Dmc1、あるいはRadb)を含む。さらに、鎖置換およびプライミングを促進する因子の組み合わせも、本明細書に記載される方法と一致している。例えば、ヘリカーゼはポリメラーゼと共に使用される。いくつかの例では、PTA法は、一本鎖DNA結合タンパク質(SSB、T4 gp32、あるいは他の一本鎖DNA結合タンパク質)、ヘリカーゼ、およびポリメラーゼ(例えば、SauDNAポリメラーゼ、Bsuポリメラーゼ、Bst2.0、GspM、GspM2.0、GspSSD、あるいは他の適切なポリメラーゼ)の使用を含む。いくつかの例では、逆転写酵素は、本明細書に記載される鎖置換因子と共に使用される。
【0029】
ターミネーターヌクレオチド、ポリメラーゼ、および追加の因子あるいは条件の使用を含む増幅方法が本明細書に記載されている。例えば、そのような因子は、増幅中に核酸鋳型あるいはアンプリコンを断片化するために、いくつかの例において使用される。いくつかの例では、そのような因子はエンドヌクレアーゼを含む。いくつかの例では、因子はトランスポゼースを含む。いくつかの例では、機械的剪断(mechanical shearing)が、増幅中に核酸を断片化するために使用される。いくつかの例では、さらなるタンパク質あるいは条件の追加により断片化され得るヌクレオチドが増幅中に加えられる。例えば、ウラシルはアンプリコンに取り込まれており;ウラシル含有位置でのウラシルDグリコシラーゼ断片核酸による処理。選択的な核酸切断のためのさらなるシステム、例えば、改変されたシトシン-ピレン塩基対を切断する操作されたDNAグリコシラーゼも、いくつかの例でさらに使用される(Kwon, et al. Chem Biol. 2003, 10(4), 351)。
【0030】
核酸複製を停止し、したがって、増幅産物のサイズを減少させる、ターミネーターヌクレオチドの使用を含む増幅方法が本明細書に記載される。そのようなターミネーターは、いくつかの例では、ポリメラーゼ、鎖置換因子、あるいは本明細書に記載される他の増幅成分と共に使用される。いくつかの例では、ターミネーターヌクレオチドは、核酸複製の効率を低減させる。いくつかの例では、そのようなターミネーターは、伸長率を少なくとも99.9%、99%、98%、95%、90%、85%、80%、75%、70%、あるいは少なくとも65%減少させる。いくつかの例では、そのようなターミネーターは、伸長率を50%-90%、60%-80%、65%-90%、70%-85%、60%-90%、70%-99%、80%-99%、あるいは50%-80%減少させる。いくつかの例では、ターミネーターは、平均アンプリコン産物の長さを少なくとも99.9%、99%、98%、95%、90%、85%、80%、75%、70%、あるいは少なくとも65%減少させる。いくつかの例では、ターミネーターは、平均アンプリコンの長さを50%-90%、60%-80%、65%-90%、70%-85%、60%-90%、70%-99%、80%-99%、あるいは50%-80%を減少させる。いくつかの例では、ターミネーターヌクレオチドを含むアンプリコンは、ループあるいはヘアピンを形成し、そのようなアンプリコンを鋳型として使用するポリメラーゼの能力を低下させる。いくつかの例では、ターミネーターの使用は、ターミネーターヌクレオチド(例えば、DNA伸長を停止するために、エキソヌクレアーゼ耐性になるよう修飾されるジデオキシヌクレオチド)の取り込みによって、初期の増幅部位での増幅の速度を遅くし、より小さな増幅産物を結果としてもたらす。現在用いられている方法より小さな増幅産物(例えば、PTA法の場合の50-2000のヌクレオチド長さの平均長と比較して、MDA法の場合の>10,000のヌクレオチドの平均産物長さ)を産生することによって、いくつかの例では、PTAの増幅産物は、切断の必要なくアダプターの直接ライゲーションを受け、細胞バーコードおよび固有分子識別子(UMI)の効率的な取り込みを可能にする(
図1D、2B-3E、9、10A、および10Bを参照)。
【0031】
ターミネーターヌクレオチドは、要因、例えば、ポリメラーゼ、鋳型、あるいは他の要因などに応じて様々な濃度で存在する。例えば、いくつかの例では、ターミネーターヌクレオチドの量は、非ターミネーターヌクレオチド対本明細書に記載される方法のターミネーターヌクレオチドの比率として発現される。いくつかの例では、そのような濃度は、アンプリコン長さの制御を可能にする。いくつかの例では、ターミネーターヌクレオチド対非ターミネーターの比は、約2:1、5:1、7:1、10:1、20:1、50:1、100:1、200:1、500:1、1000:1、2000:1、あるいは5000:1である。いくつかの例では、ターミネーターヌクレオチド対非ターミネーターの比は、2:1~10:1、5:1~20:1、10:1~100:1、20:1~200:1、50:1~1000:1、50:1~500:1、75:1~150:1、あるいは100:1~500:1である。いくつかの例では、本明細書に記載される方法を使用した増幅中に存在するヌクレオチドの少なくとも1つは、ターミネーターヌクレオチドである。各ターミネーターは、ほぼ同じ濃度で存在する必要はなく;いくつかの例では、本明細書に記載される方法において存在する各ターミネーターの比は、反応条件、サンプルタイプ、あるいはポリメラーゼの特定のセットのために最適化される。理論によって縛られることなく、各ターミネーターは、鋳型鎖上の対応するヌクレオチドと対になることに応答して、アンプリコンの伸長中のポリヌクレオチド鎖への取り込みについて異なる効率を有することがある。例えば、いくつかの例では、シトシンと対になるターミネーターは、平均ターミネーター濃度より約3%、5%、10%、15%、20%、25%、あるいは50%高い濃度で存在する。いくつかの例では、チミンと対になるターミネーターは、平均ターミネーター濃度より約3%、5%、10%、15%、20%、25%、あるいは50%高い濃度で存在する。いくつかの例では、グアニンと対になるターミネーターは、平均ターミネーター濃度より約3%、5%、10%、15%、20%、25%、あるいは50%高い濃度で存在する。いくつかの例では、アデニンと対になるターミネーターは、平均ターミネーター濃度より約3%、5%、10%、15%、20%、25%、あるいは50%高い濃度で存在する。いくつかの例では、ウラシルと対になるターミネーターは、平均ターミネーター濃度より約3%、5%、10%、15%、20%、25%、あるいは50%高い濃度で存在する。いくつかの例で、核酸ポリメラーゼによる核酸伸長を停止することができる任意のヌクレオチドは、本明細書に記載される方法においてターミネーターヌクレオチドとして使用される。いくつかの例では、可逆的ターミネーターが核酸複製を停止するために使用される。いくつかの例では、非可逆的ターミネーター(non-reversible terminator)が核酸複製を停止するために使用される。いくつかの例では、ターミネーターの非制限の例は、可逆的および非逆的核酸ならびに可逆的および非逆的核酸アナログ、例えば、3’ブロックされた可逆的ターミネーターを含むヌクレオチド、3’ブロックされてない可逆的ターミネーターを含むヌクレオチド、デオキシリボヌクレオチドの2’修飾を含むターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含むターミネーター、あるいはそれらの任意の組み合わせなどを含む。一実施形態では、ターミネーターヌクレオチドはジデオキシヌクレオチドである。核酸複製を停止し、本発明を実施するのに適切であり得る他のヌクレオチド修飾は、限定されることなく、デオキシリボースの3’炭素のr基のあらゆる修飾、例えば、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド、およびそれらの組み合わせを含む。いくつかの例では、ターミネーターは、1、2、3、あるいは4以上の塩基長さを含むポリヌクレオチドである。いくつかの例では、ターミネーターは、検出可能な部分またはタグ(例えば、多量タグ、蛍光性のタグ、色素、放射性原子、あるいは他の検知可能な部分)を含まない。いくつかの例では、ターミネーターは、検知可能な部分またはタグの取り付けを可能にする化学的部分(例えば、「クリック」アジド/アルキン、結合付加パートナー、あるいはタグの取り付けのための他の化学的ハンドル(chemical handle))を含まない。いくつかの例では、すべてのターミネーターヌクレオチドは、ヌクレオチドの領域(例えば、糖部、塩基部分、あるいはリン酸部分)で、増幅を減少させる同じ修飾を含む。いくつかの例では、少なくとも1つのターミネーターは、増幅を減少させる異なる修飾を有している。いくつかの例では、すべてのターミネーターは、実質的に同様の蛍光励起あるいは発光波長を有する。いくつかの例では、リン酸基への修飾のないターミネーターは、エキソヌクレアーゼ校正活性を有しないポリメラーゼと共に使用される。ターミネーターは、ターミネーターヌクレオチドを除去することができる3’->5’校正エキソヌクレアーゼ活性(例えば、phi29など)を有するポリメラーゼと共に使用される場合、いくつかの例では、それらをエキソヌクレアーゼ耐性なるようにさらに修飾される。例えば、ジデオキシヌクレオチドは、これらのヌクレオチドを核酸ポリメラーゼの3’->5’校正エキソヌクレアーゼ活性に対して耐性にする、ホスホロチオエート結合を作成するαチオ基で修飾される。いくつかの例では、そのような修飾は、ポリメラーゼのエキソヌクレアーゼ校正活性を少なくとも99.5%、99%、98%、95%、90%、あるいは少なくとも85%減少させる。3’->5’エキソヌクレアーゼ活性に対する耐性をもたらす他のターミネーターヌクレオチド修飾の非限定的な例は、いくつかの例では、α基への修飾を伴うヌクレオチド、例えば、ホスホロチオエート結合を作成するα-チオジデオキシヌクレオチド、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸、2’フルオロ塩基、3’リン酸化、2’-O-メチル修飾(あるいは、他の2’-O-アルキル修飾)、プロピン修飾塩基(例えば、デオキシシトシン、デオキシウリジン)、L-DNAヌクレオチド、L-RNAヌクレオチド、逆結合を有するヌクレオチド(inverted linkages)(例えば、5’-5’あるいは3’-3’)、5’逆塩基(例えば、5’逆2’,3’-ジデオキシdT)、メチルホスホナート骨格、およびトランス核酸を含む。いくつかの例では、修飾を伴うヌクレオチドは、遊離3’OH基(例えば、2-ニトロベンジルアルキル化HOMedU三リン酸、固体支持体あるいは他の大きな部分などの大きな化学基での修飾を含む塩基)を含む、塩基修飾核酸を含む。いくつかの例では、鎖置換活性を有するが、3’->5’エキソヌクレアーゼ校正活性を有しないポリメラーゼは、エキソヌクレアーゼ耐性にする修飾を伴うか、あるいは伴わない、ターミネーターヌクレオチドと共に使用される。そのような核酸ポリメラーゼは、限定されることなく、Bst DNAポリメラーゼ、Bsu DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、クレノウ断片(exo-)DNAポリメラーゼ、Therminator DNAポリメラーゼ、およびVentR(exo-)を含む。
【0032】
プライマーおよびアンプリコンライブラリ
【0033】
少なくとも1つの標的核酸分子の増幅に起因するアンプリコンライブラリが本明細書に記載されている。そのようなライブラリは、いくつかの例では、本明細書に記載される方法、例えば、ターミネーターを使用するものなどを使用して生成される。そのような方法は、因子の鎖置換ポリメラーゼ、ターミネーターヌクレオチド(可逆的あるいは不可逆的)、または本明細書に記載される他の特徴および実施形態の使用を含む。いくつかの例では、本明細書に記載されるターミネーターの使用によって生成されたアンプリコンライブラリは、後の増幅反応(例えば、PCR)でさらに増幅される。いくつかの例では、後の増幅反応はターミネーターを含まない。いくつかの例では、アンプリコンライブラリはポリヌクレオチドを含み、ここで、ポリヌクレオチドの少なくとも50%、60%、70%、80%、90%、95%、あるいは少なくとも98%は、少なくとも1つのターミネーターヌクレオチドを含む。いくつかの例では、アンプリコンライブラリは、アンプリコンライブラリが由来する標的核酸分子を含む。アンプリコンライブラリは、複数のポリヌクレオチドを含み、ここで、ポリヌクレオチドの少なくともいくつかは、直接コピーである(例えば、標的核酸分子、例えば、ゲノムDNA、RNA、あるいは他の標的核酸から直接複製された)。例えば、アンプリコンポリヌクレオチドの少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、あるいは95%よりも多くは、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも5%は、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも10%は、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも15%は、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも20%は、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも50%は、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの3%~5%、3~10%、5%~10%、10%~20%、20%~30%、30%~40%、5%~30%、10%~50%、あるいは15%~75%は、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、ポリヌクレオチドの少なくともいくつかは、標的核酸分子の直接コピー、あるいは娘(標的核酸の第一のコピー)子孫である。例えば、アンプリコンポリヌクレオチドの少なくとも5%、10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、あるいは95%より多くは、少なくとも1つの標的核酸分子あるいは娘子孫の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも5%は、少なくとも1つの標的核酸分子あるいは娘子孫の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも10%は、少なくとも1つの標的核酸分子あるいは娘子孫の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも20%は、少なくとも1つの標的核酸分子あるいは娘子孫の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの少なくとも30%は、少なくとも1つの標的核酸分子あるいは娘子孫の直接コピーである。いくつかの例では、アンプリコンポリヌクレオチドの3%~5%、3%~10%、5%~10%、10%~20%、20%~30%、30%~40%、5%~30%、10%~50%、あるいは15%~75%は、少なくとも1つの標的核酸分子あるいは娘子孫の直接コピーである。いくつかの例では、標的核酸の直接コピーは、50~2500、75~2000、50~2000、25~1000、50~1000、500~2000、あるいは50~2000の塩基長さである。いくつかの例では、娘子孫は、1000~5000、2000~5000、1000~10,000、2000~5000、1500~5000、3000~7000、あるいは2000~7000の塩基長さである。いくつかの例では、PTA増幅産物の平均長は、50~2500、75~2000、50~2000、25~1000、50~1000、500~2000、あるいは50~2000の塩基長さである。いくつかの例では、PTAから生成されたアンプリコンは、5000、4000、3000、2000、1700、1500、1200、1000、700、500、あるいは300の塩基長さ以下を有する。いくつかの例において、PTAからの生成されたアンプリコンは、1000~5000、1000~3000、200~2000、200~4000、500~2000、750~2500、あるいは1000~2000塩基長さである。いくつかの例では、本明細書に記載される方法を使用して生成されたアンプリコンライブラリは、ユニーク配列を含む少なくとも1000、2000、5000、10,000、100,000、200,000、500,000、あるいは500,000よりも多いアンプリコンを含む。いくつかの例では、ライブラリは、少なくとも100、200、300、400、500、600、700、800、900、1000、1100、1200、1300、1400、1500、2000、2500、3000、あるいは少なくとも3500のアンプリコンを含む。いくつかの例では、1000の塩基長さ未満を有するアンプリコンポリヌクレオチドの少なくとも5%、10%、15%、20%、25%、30%、あるいは30%より多くは、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、2000の塩基長さ以下を有するアンプリコンポリヌクレオチドの少なくとも5%、10%、15%、20%、25%、30%、あるいは30%よりも多くは、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、3000~5000塩基長さを有するアンプリコンポリヌクレオチドの少なくとも5%、10%、15%、20%、25%、30%、あるいは30%より多くは、少なくとも1つの標的核酸分子の直接コピーである。いくつかの例では、直接コピーのアンプリコン対標的核酸分子の比率は、少なくとも10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1であるか、あるいは10,000,000:1を超える。いくつかの例では、直接コピーのアンプリコン対標的核酸分子の比率は、少なくとも10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1であるか、あるいは10,000,000:1を超え、ここで、直接コピーのアンプリコンは、700~1200の塩基長さ以下である。いくつかの例では、直接コピーのアンプリコンおよびドーターアンプリコン対標的核酸分子の比率は、少なくとも10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1であるか、あるいは10,000,000:1を超える。いくつかの例では、直接コピーのアンプリコンおよびドーターアンプリコン対標的核酸分子の比率は、少なくとも10:1、100:1、1000:1、10,000:1、100,000:1、1,000,000:1、10,000,000:1であるか、あるいは10,000,000:1を超え、ここで、直接コピーのアンプリコンは、700~1200塩基長さであり、およびドーターアンプリコンは2500~6000塩基長さである。いくつかの例では、ライブラリは、標的核酸分子の直接コピーである約50~10,000、約50~5,000、約50~2500、約50~1000、約150~2000、約250~3000、約50~2000、約500~2000、あるいは約500~1500のアンプリコンを含む。いくつかの例では、ライブラリは、標的核酸分子の直接コピードーターアンプリコンである約50~10,000、約50~5,000、約50~2500、約50~1000、約150~2000、約250~3000、約50~2000、約500~2000、あるいは約500~1500のアンプリコンを含む。本明細書に記載される方法を使用して生成されたアンプリコンライブラリは、いくつかの例では、追加の工程、例えば、アダプターライゲーションおよびさらなるPCR増幅を受ける。いくつかの例では、そのような追加の工程は配列決定工程に先行する。
【0034】
PTA法から生成されたポリヌクレオチドのアンプリコンライブラリ、および、いくつかの例では、本明細書に記載される組成物(ターミネーター、ポリメラーゼなど)は、均一性を増大させた。均一性は、いくつかの例では、ローレンツ曲線(例えば、
図5C)、あるいは他のそのような方法を使用して記載されている。いくつかの例では、そのような増加は、標的核酸分子(例えば、ゲノムDNA、RNA、あるいは他の標的核酸分子)の所望のカバレッジに必要とされる、配列決定リードの低下をもたらした。例えば、ポリヌクレオチドの累積画分の50%以下は、標的核酸分子の配列の累積的な画分の少なくとも80%の配列を含む。いくつかの例では、ポリヌクレオチドの累積画分の50%以下は、標的核酸分子の配列の累積画分の少なくとも60%の配列を含む。いくつかの例では、ポリヌクレオチドの累積画分の50%以下は、標的核酸分子の配列の累積画分の少なくとも70%の配列を含む。いくつかの例では、ポリヌクレオチドの累積画分の50%以下は、標的核酸分子の配列の累積画分の少なくとも90%の配列を含む。いくつかの例では、均一性はジニ係数を用いて記載される(ここで、0のインデックス(index)は、ライブラリの完全な均等性を表し、1のインデックスが完全な不均等性を表す)。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.55、0.50、0.45、0.40、あるいは0.30以下のジニ係数を有する。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.50以下のジニ係数を有する。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.40以下のジニ係数を有する。いくつかの例では、そのような均一性メトリックは、得られたリードの数に依存する。例えば、1億、2億、3億、4億、あるいは5億以下のリードが得られる。いくつかの例では、リードの長さは、約50、75、100、125、150、175、200、225、あるいは約250の塩基長さである。いくつかの例では、均一性メトリックは、標的核酸のカバレッジの深度に依存する。例えば、カバレッジの平均深度は、約10X、15X、20X、25X、あるいは約30Xである。いくつかの例では、カバレッジの平均深度は、10~30X、20~50X、5~40X、20~60X、5~20X、あるいは10~20Xである。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.55以下のジニ係数を有し、約3億のリードが得られた。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.50以下のジニ係数を有し、約3億のリードが得られた。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.45以下のジニ係数を有し、約3億のリードが得られた。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.55以下のジニ係数を有し、3億以下のリードが得られた。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.50以下のジニ係数を有し、3億以下のリードが得られた。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.45以下のジニ係数を有し、3億以下のリードが得られた。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.55以下のジニ係数を有し、配列決定カバレッジの平均深度は約15Xである。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.50以下のジニ係数を有し、配列決定カバレッジの平均深度は約15Xである。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.45以下のジニ係数を有し、配列決定カバレッジの平均深度は約15Xである。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.55以下のジニ係数を有し、配列決定カバレッジの平均深度は少なくとも15Xである。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.50以下のジニ係数を有し、配列決定カバレッジの平均深度は少なくとも15Xである。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.45以下のジニ係数を有し、配列決定カバレッジの平均深度は少なくとも15Xである。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.55以下のジニ係数を有し、配列決定カバレッジの平均深度は15X以下である。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.50以下のジニ係数を有し、配列決定カバレッジの平均深度は15X以下である。いくつかの例では、本明細書に記載されるアンプリコンライブラリは、0.45以下のジニ係数を有し、配列決定カバレッジの平均深度は15X以下である。本明細書に記載される方法を使用して生成された均一のアンプリコンライブラリは、いくつかの例では、追加の工程、アダプターライゲーションおよびさらにPCR増幅を受ける。いくつかの例では、そのような追加の工程は配列決定工程に先行する。
【0035】
プライマーは、本明細書に記載される増幅反応を刺激するために使用される核酸を含む。いくつかの例では、そのようなプライマーは、限定されることなく、エキソヌクレアーゼ耐性にするための修飾を伴う、あるいは伴わない任意の長さのランダムなデオキシリボヌクレオチド、エキソヌクレアーゼ耐性にするための修飾を伴う、あるいは伴わない任意の長さのランダムなリボヌクレオチド、修飾核酸、例えば、特定のゲノム領域に標的とされるロックド核酸、DNAあるいはRNAプライマー、およびプライマーゼなどの酵素で刺激される反応を含む。全ゲノムPTAの場合には、ランダムあるいは部分的にランダムなヌクレオチド配列を有するプライマーのセットを使用することが好ましい。有意な複雑さの核酸サンプルでは、そのサンプル中に存在する特定の核酸配列は既知である必要がなく、プライマーは、任意の特定の配列に相補的に設計される必要はない。さらに正確に言えば、核酸サンプルの複雑さは、そのサンプル中の多くの様々なハイブリダイゼーション標的配列を結果としてもたらし、それは、ランダムあるいは部分的にランダムな配列の様々なプライマーに相補的である。PTAで使用されるプライマーの相補的部分は、いくつかの例では、十分にランダム化されるか、ランダム化される部分のみ含むか、そうでなければ選択的にランダム化される。いくつかの例では、プライマーの相補的部分におけるランダム塩基位置の数は、例えば、プライマーの相補的部分におけるヌクレオチドの合計数の20%~100%である。いくつかの例では、プライマーの相補的部分におけるランダム塩基位置の数は、プライマーの相補的部分におけるヌクレオチドの合計数の10%~90%、15~95%、20%~100%、30%~100%、50%~100%、75~100%、あるいは90~95%である。いくつかの例では、プライマーの相補的部分におけるランダム塩基位置の数は、プライマーの相補的部分におけるヌクレオチドの合計数の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、あるいは少なくとも90%である。ランダムあるいは部分的にランダムな配列を有するプライマーのセットは、いくつかの例では、標準的な技術を使用して、各位置での任意のヌクレオチドの添加のランダム化を可能にすることにより合成される。いくつかの例では、プライマーのセットは、同様の長さおよび/またはハイブリダイゼーション特性のプライマーからなる。いくつかの例では、用語「ランダムプライマー」とは、各位置で4倍の縮退を示すことができるプライマーを指す。いくつかの例では、用語「ランダムプライマー」とは、各位置で3倍の縮退を示すことができるプライマーを指す。いくつかの例では、本明細書に記載された方法で使用されるランダムプライマーは、3、4、5、6、7、8、10、11、12、13、14、15、16、17、18、19、20、あるいはより多くの塩基長さであるランダム配列を含む。いくつかの例では、プライマーは、3~20、5~15、5~20、6~12、あるいは4~10の塩基長さであるランダム配列を含む。プライマーは、その生成されたアンプリコンの後の増幅を制限する、非拡張可能な要素(non-extendable elements)も含んでいてもよい。例えば、非拡張可能な要素を有するプライマーは、いくつかの例では、ターミネーターを含む。いくつかの例では、プライマーは、ターミネーターヌクレオチド、例えば、1、2、3、4、5、10、あるいは10より多いターミネーターヌクレオチドを含む。プライマーは、増幅反応に外部から添加される成分に制限される必要はない。いくつかの例では、プライマーは、プライミングを促進するヌクレオチドおよびタンパク質の添加により、インサイチュで生成される。例えば、ヌクレオチドと組み合わせたプライマーゼ様酵素(primase-like enzymes)は、いくつかの例では、本明細書に記載される方法でランダムプライマーを生成するために使用される。いくつかの例では、プライマーゼ様酵素は、DnaGまたはAEP酵素スーパーファミリーのメンバーである。いくつかの例では、プライマーゼ様酵素は、TthPrimPolである。いくつかの例では、プライマーゼ様酵素は、T7 gp4ヘリカーゼ-プライマーゼである。そのようなプライマーゼは、いくつかの例では、本明細書に記載されるポリメラーゼあるいは鎖置換因子と共に使用される。いくつかの例では、プライマーゼは、デオキシリボヌクレオチドでプライミングを始める。いくつかの例では、プライマーゼは、リボヌクレオチドでプライミングを始める。
【0036】
アンプリコンの特定のサブセットの選択が、PTA増幅に続く場合がある。そのような選択は、いくつかの例では、サイズ、親和性、活性、プローブへのハイブリダイゼーション、あるいは当技術分野において他の既知の選択因子に依存する。いくつかの例では、選択は、アダプターライゲーションおよび/またはライブラリ増幅などの本明細書に記載される追加の工程に先行するか、あるいは追加の工程の後に続く。いくつかの例では、選択はアンプリコンのサイズ(長さ)に基づく。いくつかの例では、指数関数的増幅を受けている可能性が低い、より小さなアンプリコンが選択され、これによって、増幅を指数関数的増幅から準線形増幅プロセスにさらに変換しながら、一次鋳型に由来する産物を濃縮する(
図1A)。いくつかの例では、50~2000、25~5000、40~3000、50~1000、200~1000、300~1000、400~1000、400~600、600~2000、あるいは800~1000の塩基長さを含むアンプリコンが選択される。いくつかの例では、サイズ選択は、プロトコル、例えば、特定のサイズの核酸断片を濃縮するためのカルボキシル化常磁性ビーズ上の固体相の可逆的固定(SPRI)あるいは当業者に既知の他のプロトコルの使用の選択により行われる。随意に、あるいは組み合わせて、選択は、イルミナシーケンシング中のより小さな配列決定ライブラリフラグメントからのクラスタの優先的形成の結果と同様に、配列決定ライブラリを調製する間に、PCR中のより小さな断片の優先的増幅(preferential amplification)によって行われる。より小さな断片を選択するための他の戦略は、本明細書に記載される方法とも一致しており、および、限定されることなく、ゲル電気泳動後に特定のサイズの核酸断片を単離すること、特定のサイズの核酸断片を結合するシリカカラムの使用、ならびに、より小さな断片をより強く濃縮する他のPCR戦略の使用を含む。
【0037】
PTAで使用されるプライマーの非相補的部分は、増幅された配列をさらに操作および/または分析するために使用することができる配列を含み得る。そのような配列の一例は「検出タグ」である。検出タグは、検出プローブに相補的な配列を有し、それらの同族の検出プローブを使用して検出される。プライマー上には、1、2、3、4、あるいは4より多くの検出タグがあってもよい。プライマーのサイズを除いて、プライマー上に存在し得る検出タグの数に基本的制限はない。いくつかの例では、プライマー上に単一の検出タグがある。いくつかの例では、プライマー上に2つの検出タグがある。複数の検出タグがある場合、それらは同じ配列を有していてもよく、あるいは、それらは異なる配列を有していてもよく、各異なる配列は、異なる検出プローブに相補的である。いくつかの例では、複数の検出タグは同じ配列を有する。いくつかの例では、複数の検出タグは異なる配列を有する。
【0038】
プライマーの非相補的部分に含まれ得る配列の別の例は、「アドレスタグ」である。アドレスタグは、アドレスプローブに相補的な配列を有する。アドレスタグは、増幅された鎖の末端に取り込まれるようになる。存在する場合、プライマー上に1つ、あるいは1つより多いアドレスタグがあってもよい。プライマーのサイズを除いて、プライマー上で存在し得るアドレスタグに数の基本的制限はない。複数のアドレスタグがある場合、それらは同じ配列を有していてもよく、あるいは、それらは異なる配列を有していてもよく、各異なる配列は、異なるアドレスプローブに相補的である。アドレスタグ部分は、アドレスタグとアドレスプローブの間の特定の安定したハイブリダイゼーションをサポートする任意の長さであり得る。いくつかの例では、1つを超えるソースからの核酸は、可変タグ配列を取り込むことができる。このタグ配列は、最大100のヌクレオチド長さ、好ましくは、1~10のヌクレオチド長さ、最も好ましくは、4、5、あるいは6のヌクレオチド長さであり得、および、ヌクレオチドの組み合わせを含む。いくつかの例では、タグ配列は、1~20、2~15、3~13、4~12、5~12、あるいは1~10ヌクレオチドである。例えば、6つの塩基対がタグを形成するために選択され、かつ、4つの異なるヌクレオチドの順列(permutation)が使用される場合、各々が固有の6つの塩基タグを有する合計4096の核酸アンカー(例えば、ヘアピン)を作ることができる。
【0039】
本明細書に記載されるプライマーは、溶液中に存在してもよいし、あるいは固体支持体上で固定化されてもよい。いくつかの例では、サンプルバーコードおよび/またはUMI配列を有するプライマーは、固体支持体上で固定化され得る。固体支持体は、例えば、1つ以上のビーズであり得る。いくつかの例では、個々の細胞を、個々の細胞を同定するために、サンプルバーコードおよび/またはUMI配列の固有のセットを有する1つ以上のビーズと接触させる。いくつかの例では、個々の細胞溶解物を同定するために、個々の細胞からのライゼートを、サンプルバーコードおよび/またはUMI配列の固有のセットを有する1つ以上のビーズと接触させる。いくつかの例では、個々の細胞から精製された核酸を同定するために、個々の細胞から精製された核酸を、サンプルバーコードおよび/またはUMI配列の固有のセットを有する1つ以上のビーズと接触させる。ビーズは、当技術分野において既知の任意の適切な様式、例えば、本明細書に記載されるような液滴アクチュエータを使用して、操作することができる。ビーズは、例えば、マイクロビーズ、微粒子、ナノビーズ、およびナノ粒子を含む、任意の適切なサイズであり得る。いくつかの実施形態において、ビーズは磁気応答性であり;他の実施形態では、ビーズは有意に磁気応答性ではない。適切なビーズの非限定的な例は、フローサイトメトリーマイクロビーズ、ポリスチレンの微粒子およびナノ粒子、機能化されたポリスチレン微粒子およびナノ粒子、コーティングされたポリスチレン微粒子およびナノ粒子、シリカマイクロビーズ、蛍光性のマイクロスフェアおよびナノスフェア、機能化された蛍光性のマイクロスフェアおよびナノスフェア、コーティングされた蛍光性のマイクロスフェアおよびナノスフェア、着色された微粒子およびナノ粒子、磁性微粒子およびナノ粒子、超常磁性微粒子およびナノ粒子(例えば、 Invitrogen Group、Carlsbad、CAから入手可能なDYNABEADS(登録商標))、蛍光性の微粒子およびナノ粒子、コーティングされた磁気微粒子およびナノ粒子、強磁性の微粒子およびナノ粒子、コーティングされた強磁性の微粒子およびナノ粒子、ならびに米国特許出願US20050260686、US20030132538、US20050118574、20050277197、および20060159962を含む。ビーズは、抗体、タンパク質、または抗原、DNA/RNAプローブ、あるいは所望の標的に対する親和性を有する他の分子とあらかじめ結合され得る。いくつかの実施形態において、サンプルバーコードおよび/またはUMI配列を有するプライマーは、溶液中にあってもよい。ある実施形態では、複数の液滴が存在してもよく、ここで、複数の液滴中の各液滴は、UMIが液滴の収集物内で何度も反復されるように、液滴に固有のサンプルバーコードと、分子に固有のUMIとを有する。いくつかの実施形態において、個々の細胞を同定するために、個々の細胞を、サンプルバーコードおよび/またはUMI配列の固有のセットを有する液滴と接触させる。いくつかの実施形態において、個々の細胞溶解物を同定するために、個々の細胞からのライゼートを、サンプルバーコードおよび/またはUMI配列の固有のセットを有する1つ以上の液滴と接触させる。いくつかの実施形態において、個々の細胞から精製された核酸を同定するために、個々の細胞から精製された核酸を、サンプルバーコードおよび/またはUMI配列の固有のセットを有する1つ以上の液滴と接触させる。
【0040】
PTAプライマーは、配列特異的なプライマーあるいはランダムプライマー、細胞バーコードおよび/または固有分子識別子(UMI)(例えば、
図10A(線形プライマー)、10B(ヘアピンプライマー)を参照)を含み得る。いくつかの例では、プライマーは配列特異的プライマーを含む。いくつかの例では、プライマーはランダムプライマーを含む。いくつかの例では、プライマーは細胞バーコードを含む。いくつかの例では、プライマーはサンプルバーコードを含む。いくつかの例では、プライマーは固有分子識別子を含む。いくつかの例では、プライマーは2つ以上の細胞バーコードを含む。いくつかの例では、そのようなバーコードは、固有のサンプルソース、あるいは固有のワークフローを同定する。そのようなバーコードあるいはUMIは、いくつかの例では、5、6、7、8、9、10、11、12、15、20、25、30、あるいは30よりも多い塩基長さである。いくつかの例では、プライマーは、少なくとも1000、10,000、50,000、100,000、250,000、500,000、10
6、10
7、10
8、10
9、あるいは少なくとも10
10の固有のバーコードまたはUMIを含む。いくつかの例では、プライマーは、少なくとも8、16、96、あるいは384の固有のバーコードあるいはUMIを含む。いくつかの例では、標準的アダプターは、配列決定前に増幅産物上に連結され;配列決定後、リードは、初めに細胞バーコードに基づいて特定の細胞に割り当てられる。PTA法で利用され得る適切なアダプターは、例えば、Integrated DNA Technologies(IDT)から入手可能なxGen(登録商標) デュアルインデックスUMIアダプターを含む。その後、各細胞からのリードは、UMIを使用してグループ化され、同じUMIを有するリードは崩壊してコンセンサスリードになることがある。細胞バーコードの使用は、すべての細胞をライブラリ調製前にプールすることを可能にする。なぜなら、上記細胞は、後で細胞バーコードによって同定することができるからである。いくつかの例では、コンセンサスリードを形成するUMIの使用は、PCRバイアスを修正し、コピー数多型(CNV)検出を改善する(
図11Aおよび11B)。加えて、同じ分子からのリードの一定割合が各位置で同じ塩基変化が検出されることを要求することにより、配列決定エラーは修正されることがある。このアプローチは、バルクサンプル中のCNV検出を改善し、および、配列決定エラーを修正するために利用された。いくつかの例では、UMIは、本明細書に記載される方法と共に使用され、例えば、米国特許第8,835,358号は、ランダム増幅可能なバーコードを付けた後のデジタル計数の原則を開示する。SchmittらおよびFanらは、配列決定エラーを修正する同様の方法を開示する。
【0041】
本明細書に記載される方法は、サンプルまたは鋳型上で実施される工程を含む、追加の工程をさらに含むことがある。いくつかの例では、そのようなサンプルあるいは鋳型は、PTA前に1つ以上の工程を受ける。いくつかの例では、細胞を含むサンプルは、前処理工程を受ける。例えば、細胞は、凍結融解、トリトンX-100、Tween 20、およびプロテイナーゼKの組み合わせを使用して、クロマチンアクセシビリティを向上させるために、溶解およびタンパク質分解を受ける。他の溶解戦略も、本明細書に記載される方法を実行するのに適切である。そのような戦略は、限定されることなく、界面活性剤および/またはリゾチームおよび/またはプロテアーゼ処理および/または細胞の物理的破壊、例えば、音波粉砕および/またはアルカリ性溶解および/または低張溶解の他の組み合わせを使用した溶解を含む。いくつかの例では、一次鋳型あるいは標的分子は、前処理工程を受ける。いくつかの例では、一次鋳型(あるいは標的)を、水酸化ナトリウムを使用して、その後、溶液を中和することで、変性させる。他の変性戦略も、本明細書に記載される方法を実行するのに適切であり得る。そのような戦略は、限定されることなく、アルカリ性溶解と他の塩基性溶液の組み合わせ、サンプルの温度の上昇および/またはサンプル中の塩濃度の変更、溶媒または油などの添加剤の添加、他の修飾、あるいはそれらの任意の組み合わせを含んでいてもよい。いくつかの例では、追加の工程は、サンプル、鋳型、あるいはアンプリコンを、サイズによって選別、濾過、または単離すること含む。例えば、本明細書に記載される方法を用いた増幅の後、アンプリコンライブラリを、所望の長さを有するアンプリコンについて濃縮する。いくつかの例では、アンプリコンライブラリを、50~2000、25~1000、50~1000、75~2000、100~3000、150~500、75~250、170~500、100~500、あるいは75~2000塩基長さを有するアンプリコンについて濃縮する。いくつかの例では、アンプリコンライブラリを、75、100、150、200、500、750、1000、2000、5000、あるいは10,000塩基長さ以下を有するアンプリコンについて濃縮する。いくつかの例では、アンプリコンライブラリを、少なくとも25、50、75、100、150、200、500、750、1000、あるいは少なくとも2000の塩基長さを有するアンプリコンについて濃縮する。
【0042】
本明細書に記載される方法および組成物は、緩衝液あるいは他の製剤を含み得る。いくつかの例では、そのような緩衝液は、界面活性物質/界面活性剤または変性剤(Tween 20、DMSO、DMF、疎水基を含むペグ化高分子、あるいは他の界面活性物質を含む)、塩(カリウムまたはリン酸ナトリウム(一塩基あるいは二塩基の)、塩化ナトリウム、塩化カリウム、TrisHCl、塩化マグネシウムまたはサフレート(suflate)、アンモニウム塩、例えば、リン酸塩、硝酸塩、あるいは硫酸塩、EDTA)、還元剤(DTT、THP、DTE、βメルカプトエタノール、TCEP、あるいは他の還元剤)、または他の成分(グリセロール、親水性ポリマー、例えば、PEG)を含む。いくつかの例では、緩衝液は、ポリメラーゼ、鎖置換因子、ターミネーター、あるいは本明細書に記載される他の反応成分などの成分と共に使用される。
【0043】
本明細書に記載される方法に従って増幅された核酸分子は、当業者に既知の方法を用いて配列決定および分析され得る。いくつかの例で使用される配列決定方法の非限定的な例は、例えば、ハイブリダイゼーションによる配列決定(SBH)、ライゲーションによる配列決定(SBL)(Shendure et al. (2005) Science 309:1728)、定量的増分蛍光ヌクレオチド付加配列決定(QIFNAS)、段階的なライゲーションおよび切断、蛍光共鳴エネルギー移動(FRET)、分子ビーコン、TaqManレポータープローブ消化、パイロシークエンシング、蛍光インサチュ配列決定(FISSEQ)、FISSEQビーズ(米国特許第7,425,431号)、ゆらぎ配列決定(wobble sequencing)(国際特許出願公開WO2006/073504、マルチプレックス配列決定(米国特許出願US2008/0269068;Porreca et al., 2007, Nat. Methods 4:931)、重合コロニー(polymerized colony)(POLONY)配列決定(米国特許第6,432,360号、第6,485,944号および第6,511,803号、ならびに国際特許出願公開WO2005/082098、ナノグリッドローリングサークル配列決定(ROLONY)(米国特許第9,624,538)、対立遺伝子特異的オリゴライゲーションアッセイ(例えば、オリゴライゲーションアッセイ(OLA)、連結された線形プローブ(linear probe)およびローリングサークル増幅(RCA)読み出し(readout)を使用する単一の鋳型分子OLA、連結されたパドロックプローブ、および/または連結された円形パドロックプローブおよびローリングサークル増幅(RCA)読み出しを使用する単一の鋳型分子OLA)、ハイスループットシーケンシング方法、例えば、Roche 454、Illumina Solexa、AB-SOLiD、Helicos、Polonatorプラットフォームなどを使用する方法、ならびに光ベースの配列決定技術(Landegren et al. (1998) Genome Res. 8:769-76; Kwok (2000) Pharmacogenomics 1:95-100; and Shi (2001) Clin. Chem.47:164-172)を含む。いくつかの例では、増幅核酸分子はショットガンシーケンシングされる。
【0044】
方法および適用
【0045】
PTA法を用いて細胞中の突然変異を同定する方法が本明細書に記載されている。いくつかの例では、PTA法の使用により、既知の方法、例えば、MDAよりも改善される。いくつかの例では、PTAは、MDA法よりも低い偽陽性および偽陰性変異コーリング率を有する。いくつかの例では、NA12878プラチナゲノムなどのゲノムは、PTAのより大きなゲノムカバレッジおよび均一性が、より低い偽陰性変異コーリング率を結果としてもたらすか否かを決定するために使用される。理論によって縛られることなく、PTAでのエラー伝播の欠如により偽陽性変異コール率を減少すると判断することができる。いくつかの例では、2つの方法を用いた対立遺伝子間の増幅平衡は、既知の陽性遺伝子座(positive loci)でのヘテロ接合変異コールの対立遺伝子頻度を比較することによって評価される。いくつかの例では、PTAを使用して生成されたアンプリコンライブラリは、PCRによってさらに増幅される。
【0046】
いくつかの例では、本明細書に記載される方法を使用して分析された細胞は、腫瘍細胞を含む。例えば、循環腫瘍細胞は、患者から採取された体液、例えば、制限されないが、血液、骨髄、尿、唾液、脳脊髄液、胸膜液、心膜液、腹水、あるいは眼房水から単離することができる。その後、細胞は、各細胞中の突然変異量および突然変異の組み合わせを決定するために、本明細書に記載される方法(例えば、PTA)および配列決定を受ける。いくつかの例では、これらのデータは、特定の疾患の診断に使用されるか、あるいは処置応答を予測するツールとして使用される。同様に、いくつかの例では、いくつかの例での未知の悪性度を有する細胞は、患者から採取された体液、例えば、限定されないが、血液、骨髄、尿、唾液、脳脊髄液、胸膜液、心膜液、腹水、あるいは眼房水から単離される。本明細書に記載される方法および配列決定を利用した後に、そのような方法が、各細胞中の突然変異量および突然変異の組み合わせを決定するためにさらに使用される。いくつかの例では、これらのデータは、特定の疾患の診断に使用されるか、あるいは前癌状態から明白な悪性病変の進行を予測するツールとして使用される。いくつかの例では、細胞は原発性腫瘍サンプルから単離することができる。その後、細胞は、各細胞中の突然変異量および突然変異の組み合わせを決定するために、PTAおよび配列決定を受ける場合がある。これらのデータは、特定の疾患の診断に使用することができるか、あるいは、患者の悪性病変が利用可能な抗癌剤に耐性がある確率を予測するためのツールとして使用することができる。様々な化学療法薬剤にサンプルをさらすことによって、マイナークローンおよびメジャークローンが、既知の「ドライバー突然変異」の存在と必ずしも相関しない特定の薬剤に対して分差感受性を有していることが分かり、このことは、クローン集団内の突然変異の組み合わせが、特定の化学療法剤に対するその感受性を決定することを示唆している。理論によって縛られることなく、これらの発見により、まだ拡大しておらず、およびクローンに発展する前癌病変が検出される場合、悪性病変の根絶がより容易であることが示唆され、そのゲノム修飾の数の増加により、処置に耐性を有する可能性がより高くなる可能性がある。Ma et al., 2018,“Pan-cancer genome and transcriptome analyses of 1,699 pediatric leukemias and solid tumors”を参照。いくつかの例では、単一細胞ゲノミクスプロトコルは、患者のサンプルから単離される正常細胞と悪性細胞の混合物内で、単一の癌細胞、あるいはクロノタイプの体細胞遺伝子変異体の組み合わせを検出するために使用される。この技術は、いくつかの例では、インビトロおよび/または患者内の両方で、薬剤にさらされた後に、正の選択を受けるクロノタイプを同定するためにさらに利用される。
図6Aに示されるように、診断で同定されたクローンと化学療法にさらされた残存するクローンを比較することによって、特定の薬剤に対する耐性を実証する癌クロノタイプのカタログを作成することができる。いくつかの例では、PTA法は、既存する薬剤あるいは新規な薬剤、ならびにそれらの組み合わせに対する、複数のクロノタイプからなるサンプル中の特定のクローンの感受性を検出し、ここで、上記方法は、上記薬剤に対する特定のクローンの感受性を検出することができる。いくつかの例では、このアプローチは、1回の測定ですべての癌クローンの感受性をともに考慮する現在の薬剤感受性測定では検出されない可能性がある、特定のクローンについての薬剤の有効性を示す。所与の患者の癌における癌クロノタイプを検出するために、本明細書に記載されるPTA法を診断の時点で採取された患者のサンプルに適用する場合、薬剤感受性のカタログを使用してそれらのクローンを調べ、それにより、どの薬剤あるいは薬剤の組み合わせが作用しないか、および、どの薬剤あるいは薬剤の組み合わせがその患者の癌に対して最も効果的であるかに関して、腫瘍学者に通知することができる。
【0047】
環境因子の変異原性を測定する方法が本明細書に記載されている。例えば、細胞(単一または集団)は潜在的な環境条件にさらされる。例えば、臓器(肝臓、膵臓、肺、結腸、甲状腺、あるいは他の臓器)、組織(皮膚、あるいは他の組織)、血液、または他の生体ソースに由来する細胞が、いくつかの例では、本方法と共に使用される。いくつかの例では、環境条件は、熱、光(例えば、紫外線)、放射線、化学物質、あるいはそれらの任意の組み合わせを含む。いくつかの例では、数分、数時間、数日、あるいはそれより長く環境条件にさらした後、単一細胞は単離されて、PTA法を受ける。いくつかの例では、分子バーコードおよび固有分子識別子は、サンプルをタグ付するために使用される。サンプルを配列決定し、その後、分析することで、環境条件への暴露に起因する突然変異を同定する。いくつかの例では、そのような突然変異は、既知の非変異原物質、ビヒクル/溶媒、あるいは環境条件の欠如などの対照環境条件と比較される。いくつかの例では、そのような分析は、環境条件によって引き起こされた突然変異の合計数だけでなく、そのような突然変異の位置および性質も提供する。いくつかの例では、パターンはデータから識別され、疾患あるいは疾病の診断に使用され得る。いくつかの例では、パターンは、将来の疾患の状態あるいは状況を予測するために使用される。いくつかの例では、本明細書に記載される方法は、環境要因、例えば、潜在的変異原または催奇形物質などにさらされた後に、細胞中の突然変異量、位置、およびパターンを測定する。いくつかの例では、このアプローチは、疾患の進行に寄与し得る突然変異を誘発する可能性など、所与の薬剤の安全性を評価するために使用される。例えば、特定の薬剤の特定の濃度にさらした後の特定の細胞型に対する薬剤の癌原性あるいは催奇性を予測するために、上記方法を使用することができる。
【0048】
ゲノム編集(例えば、CRISPR技術を使用した)を受けた動物、植物、あるいは微生物細胞中の突然変異を同定する方法が本明細書に記載されている。いくつかの例では、そのような細胞を単離し、PTAおよび配列決定を行い、各細胞の突然変異量ならびに突然変異の組み合わせを決定することができる。いくつかの例では、ゲノム編集プロトコルに起因する細胞ごとの突然変異率および突然変異の位置が、所与のゲノム編集方法の安全性を評価するために使用される。
【0049】
細胞療法、例えば、限定されないが、人工多能性幹細胞の移植、操作されていない造血細胞または他の細胞の移植、あるいはゲノム編集を受けた造血細胞または他の細胞の移植に使用される細胞中の突然変異を決定する方法が本明細書に記載される。その後、細胞は、各細胞中の突然変異量および突然変異の組み合わせを決定するために、PTAおよび配列決定を受ける場合がある。細胞療法産物中の細胞ごとの突然変異率および突然変異の位置は、産物の安全性ならびに潜在的な有効性を評価するために使用することができる。
【0050】
さらなる実施形態では、細胞は、体外受精によって作られる割球から単離することができる。その後、その細胞は、各細胞中の潜在的な疾患の素因になる遺伝子変異体の量および組み合わせを決定するために、PTAおよび配列決定を受ける場合がある。その後、細胞の突然変異プロファイルは、移植前に特定の疾患への割球の遺伝的素因を外挿するために使用することができる。
【0051】
別の実施形態では、微生物細胞(例えば、細菌、菌類、原生動物)は、植物あるいは動物から単離することができる(例えば、細菌叢サンプル[例えば、GI細菌叢、皮膚細菌叢、など]から、あるいは体液、例えば、血液、骨髄、尿、唾液、脳脊髄液、胸膜液、心膜液、腹水、あるいは眼房水などから)。加えて、微生物細胞は、限定されないが、静脈内カテーテル、尿道カテーテル、脳脊髄シャント、人工弁、人工関節、あるいは気管内チューブなどの留置医療機器から単離することができる。その後、細胞は、特定の微生物の同一性を決定するために、ならびに、特定の抗菌薬に対する応答(あるいは、耐性)を予測する微生物遺伝子変異体の存在を検知するために、PTAおよび配列決定を受ける場合がある。これらのデータは、特定の感染症の診断に使用され、および/または、処置応答を予測するためのツールとして使用することができる。
【0052】
本明細書に記載されるPTA法を使用して、短い核酸を含むサンプルからアンプリコンライブラリを生成する方法が本明細書に記載されている。いくつかの例では、PTAは、より短い核酸の増幅の忠実度および均一性の改善につながる。いくつかの例では、核酸は2000塩基長さ以下である。いくつかの例では、核酸は1000塩基長さ以下である。いくつかの例では、核酸は500塩基長さ以下である。いくつかの例では、核酸は、200、400、750、1000、2000、あるいは5000の塩基長さ以下である。いくつかの例では、短い核酸断片を含むサンプルとしては、限定されないが、古代DNA(何百、何千、何百万、あるいは何十億年前)、FFPE(ホルマリン固定パラフィン包埋)サンプル、無細胞DNA、あるいは短い核酸を含む他のサンプルが挙げられる。
【0053】
実施形態
【0054】
標的核酸分子を増幅する方法が本明細書に記載され、上記方法は:a)標的核酸分子、1つ以上の増幅プライマー、核酸ポリメラーゼ、および、ポリメラーゼによる核酸複製を停止する1つ以上のターミネーターヌクレオチドを含むヌクレオチドの混合物を含む、サンプルを接触させる工程と、b)複数の停止増幅産物を得るために、標的核酸分子の複製を促進する条件下でサンプルをインキュベートする工程であって、ここで、上記複製は鎖置換複製により進行する、工程と、を含む。上記方法のいずれかの1つの実施形態では、上記方法は、複数の停止増幅産物から、約50~約2000のヌクレオチド長さである産物を単離する工程をさらに含む。上記方法のいずれかの1つの実施形態では、上記方法は、複数の停止増幅産物から、約400~約600のヌクレオチド長さである産物を単離する工程をさらに含む。上記方法のいずれかの1つの実施形態では、上記方法は:c)停止増幅産物から末端ターミネーターヌクレオチドを除去する工程と;d)末端修復およびAテーリングを行う工程と、e)工程(d)で得られた分子をアダプターに連結し、それにより、増幅産物のライブラリを生成する工程と、を含む。上記方法のいずれかの1つの実施形態では、上記方法は、増幅産物を配列決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、増幅は実質的に等温条件下で実施される。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼはDNAポリメラーゼである。
【0055】
上記方法のいずれかの1つの実施形態では、DNAポリメラーゼは鎖置換DNAポリメラーゼである。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼは、バクテリオファージphi29(Φ29)ポリメラーゼ、遺伝子改変phi29(Φ29)DNAポリメラーゼ、DNAポリメラーゼIのクレノウ断片、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bst DNAポリメラーゼ、Bst ラージフラグメントDNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、Therminator DNAポリメラーゼ、T5 DNAポリメラーゼ、シーケナーゼ、T7 DNAポリメラーゼ、T7-シーケナーゼ、およびT4 DNAポリメラーゼから選択される。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性を有し、およびターミネーターヌクレオチドはそのような3’->5’エキソヌクレアーゼ活性を阻害する。1つの特定の実施形態では、ターミネーターヌクレオチドは、α基への修飾を伴うヌクレオチド(例えば、ホスホロチオエート結合を作るαチオジデオキシヌクレオチド)、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸、2’フルオロヌクレオチド、3’リン酸化ヌクレオチド、2’-O-メチル修飾ヌクレオチド、およびトランス核酸から選択される。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性を有しない。1つの特定の実施形態では、ポリメラーゼは、Bst DNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、クレノウ断片(exo-)DNAポリメラーゼ、およびTherminator DNAポリメラーゼから選択される。1つの特定の実施形態では、ターミネーターヌクレオチドは、デオキシリボースの3’炭素のr基の修飾を含む。1つの特定の実施形態では、ターミネーターヌクレオチドは、3’ブロックされた可逆的ターミネーターを含むヌクレオチド、3’ブロックされてない可逆的ターミネーターを含むヌクレオチド、デオキシリボヌクレオチドの2’修飾を含むターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含むターミネーター、およびそれらの組み合わせから選択される。1つの特定の実施形態では、ターミネーターヌクレオチドは、ジデオキシヌクレオチド、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’-リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド(acyclonucleotides)、およびそれらの組み合わせから選択される。上記方法のいずれかの1つの実施形態では、増幅プライマーは4~70のヌクレオチド長さである。上記方法のいずれかの1つの実施形態では、増幅産物は、約50~約2000ヌクレオチド長さである。上記方法のいずれかの1つの実施形態では、標的核酸は、DNA(例えば、cDNAまたはゲノムDNA)である。上記方法のいずれかの1つの実施形態では、増幅プライマーはランダムプライマーである。上記方法のいずれかの1つの実施形態では、増幅プライマーはバーコードを含む。1つの特定の実施形態では、バーコードは細胞バーコードを含む。1つの特定の実施形態では、バーコードはサンプルバーコードを含む。上記方法のいずれかの1つの実施形態では、増幅プライマーは固有分子識別子(UMI)を含む。上記方法のいずれかの1つの実施形態では、上記方法は、最初のプライマーアニーリングの前に標的核酸またはゲノムDNAを変性させる工程を含む。1つの特定の実施形態では、変性はアルカリ性条件下で実施され、その後、中和される。上記方法のいずれかの1つの実施形態では、サンプル、増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物は、マイクロ流体デバイスに含有されている。上記方法のいずれかの1つの実施形態では、サンプル、増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物は、液滴に含有されている。上記方法のいずれかの1つの実施形態では、サンプルは、組織サンプル、細胞、体液サンプル(例えば、血液、尿、唾液、リンパ液、脳脊髄液(CSF)、羊水、胸膜液、心膜液、腹水、眼房水)、骨髄サンプル、精液サンプル、生検サンプル、癌サンプル、腫瘍サンプル、細胞溶解サンプル、法医学サンプル、考古学サンプル、古生物学サンプル、感染サンプル、産生サンプル、植物全体、植物部品、細菌叢サンプル、ウイルス調製物、土壌サンプル、海水サンプル、真水サンプル、家庭用あるいは工業用サンプル、およびそれらの組み合わせならびに分離物から選択される。上記方法のいずれかの1つの実施形態では、サンプルは、細胞(例えば、動物細胞[例えば、ヒト細胞]、植物細胞、真菌細胞、細菌細胞、および原生動物細胞)である。1つの特定の実施形態では、細胞は複製前に溶解される。1つの特定の実施形態では、細胞溶解にはタンパク質分解が伴う。1つの特定の実施形態では、細胞は、着床前胚からの細胞、幹細胞、胎児細胞、腫瘍細胞、疑わしい癌細胞、癌細胞、遺伝子編集手順を受けた細胞、病原体からの細胞、法医学サンプルから得られた細胞、考古学サンプルから得られた細胞、および古生物学サンプルから得られた細胞から選択される。上記方法のいずれかの1つの実施形態では、サンプルは、着床前胚(例えば、割球[例えば、体外受精によって生成された8つの細胞期の胚から得られる割球])の細胞である。1つの特定の実施形態では、上記方法は、胚細胞中の疾患の素因となる生殖系列変異体あるいは体細胞変異体の存在を決定する工程をさらに含む。上記方法の1つの実施形態では、サンプルは、病原体(例えば、細菌、真菌、原生動物)の細胞である。1つの特定の実施形態では、病原体細胞は、患者、細菌叢サンプル(例えば、GI細菌叢サンプル、膣細菌叢サンプル、皮膚細菌叢サンプルなど)、あるいは留置医療機器(例えば、静脈内カテーテル、尿道カテーテル、脳脊髄シャント、人工弁、人工関節、気管内チューブなど)から採取された体液から得られる。1つの特定の実施形態では、上記方法は、病原体の同一性を決定する工程をさらに含む。1つの特定の実施形態では、上記方法は、処置に対する病原体の耐性の原因となる遺伝子変異体の存在を決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、サンプルは、腫瘍細胞、疑わしい癌細胞、あるいは癌細胞である。1つの特定の実施形態では、上記方法は、1つ以上の診断変異あるいは予後変異の存在を決定する工程をさらに含む。1つの特定の実施形態では、上記方法は、処置に対する耐性の原因となる生殖系列変異体あるいは体細胞変異体の存在を決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、サンプルは、遺伝子編集手順を受けた細胞である。1つの特定の実施形態では、上記方法は、遺伝子編集プロセスによって引き起こされた計画外の突然変異の存在を決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、上記方法は、細胞系統の履歴を決定する工程をさらに含む。関連する態様では、本発明は、低頻度の配列変異体(例えば、全配列の≧0.01%を構成する変異体)を同定するための上記方法のいずれかの使用を提供する。
【0056】
関連する態様では、本発明は、核酸ポリメラーゼ、1つ以上の増幅プライマー、1つ以上のターミネーターヌクレオチドを含むヌクレオチドの混合物、および随意に使用説明書を含むキットを提供する。本発明のキットの1つの実施形態では、核酸ポリメラーゼは鎖置換DNAポリメラーゼである。本発明のキットの1つの実施形態では、核酸ポリメラーゼは、バクテリオファージphi29(Φ29)ポリメラーゼ、遺伝子改変phi29(Φ29)DNAポリメラーゼ、DNAポリメラーゼIのクレノウ断片、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bst DNAポリメラーゼ、Bst ラージフラグメントDNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、Therminator DNAポリメラーゼ、T5 DNAポリメラーゼ、シーケナーゼ、T7 DNAポリメラーゼ、T7-シーケナーゼ、およびT4 DNAポリメラーゼから選択される。本発明のキットの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性を有し、および、ターミネーターヌクレオチドは、そのような3’->5’エキソヌクレアーゼ活性(例えば、α基への修正を伴うヌクレオチド[例えば、α-チオジデオキシヌクレオチド]、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸、2’フルオロヌクレオチド、3’リン酸化ヌクレオチド、2’-O-メチル修飾ヌクレオチド、トランス核酸)を阻害する。本発明のキットの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性(例えば、Bst DNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、クレノウ断片(exo-)DNAポリメラーゼ、Therminator DNAポリメラーゼ)を含まない。1つの特定の実施形態では、ターミネーターヌクレオチドは、デオキシリボースの3’炭素のr基の修飾を含む。1つの特定の実施形態では、ターミネーターヌクレオチドは、3’ブロックされた可逆的ターミネーターを含むヌクレオチド、3’ブロックされてない可逆的ターミネーターを含むヌクレオチド、デオキシリボヌクレオチドの2’修飾を含むターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含むターミネーター、およびそれらの組み合わせから選択される。1つの特定の実施形態では、ターミネーターヌクレオチドは、ジデオキシヌクレオチド、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’-リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド、およびそれらの組み合わせから選択される。
【0057】
ゲノムを増幅する方法が本明細書に記載され、上記方法は:a)ゲノム、複数の増幅プライマー、(例えば、2つ以上のプライマー)、核酸ポリメラーゼ、および、ポリメラーゼによる核酸複製を停止する1つ以上のターミネーターヌクレオチドを含むヌクレオチドの混合物を含む、サンプルを接触させる工程と、b)複数の停止増幅産物を得るために、ゲノムの複製を促進する条件下でサンプルをインキュベートする工程であって、ここで、上記複製は鎖置換複製により進行する、工程と、を含む。上記方法のいずれかの1つの実施形態では、上記方法は、複数の停止増幅産物から、約50~約2000のヌクレオチド長さである産物を単離する工程をさらに含む。上記方法のいずれかの1つの実施形態では、上記方法は、複数の停止増幅産物から、約400~約600のヌクレオチド長さである産物を単離する工程をさらに含む。上記方法のいずれかの1つの実施形態では、上記方法は:c)停止増幅産物から末端ターミネーターヌクレオチドを除去する工程と;d)末端修復およびAテーリングを行う工程と、e)工程(d)で得られた分子をアダプターに連結し、それにより、増幅産物のライブラリを生成する工程と、を含む。上記方法のいずれかの1つの実施形態では、上記方法は、増幅産物を配列決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、増幅は実質的に等温条件下で実施される。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼはDNAポリメラーゼである。
【0058】
上記方法のいずれかの1つの実施形態では、DNAポリメラーゼは鎖置換DNAポリメラーゼである。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼは、バクテリオファージphi29(Φ29)ポリメラーゼ、遺伝子改変phi29(Φ29)DNAポリメラーゼ、DNAポリメラーゼIのクレノウ断片、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bst DNAポリメラーゼ、Bst ラージフラグメントDNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、Therminator DNAポリメラーゼ、T5 DNAポリメラーゼ、シーケナーゼ、T7 DNAポリメラーゼ、T7-シーケナーゼ、およびT4 DNAポリメラーゼから選択される。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性を有し、およびターミネーターヌクレオチドはそのような3’->5’エキソヌクレアーゼ活性を阻害する。1つの特定の実施形態では、ターミネーターヌクレオチドは、α基への修飾を伴うヌクレオチド(例えば、ホスホロチオエート結合を作るαチオジデオキシヌクレオチド)、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸、2’フルオロヌクレオチド、3’リン酸化ヌクレオチド、2’-O-メチル修飾ヌクレオチド、およびトランス核酸から選択される。上記方法のいずれかの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性を有しない。1つの特定の実施形態では、ポリメラーゼは、Bst DNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、クレノウ断片(exo-)DNAポリメラーゼ、およびTherminator DNAポリメラーゼから選択される。1つの特定の実施形態では、ターミネーターヌクレオチドは、デオキシリボースの3’炭素のr基の修飾を含む。1つの特定の実施形態では、ターミネーターヌクレオチドは、3’ブロックされた可逆的ターミネーターを含むヌクレオチド、3’ブロックされてない可逆的ターミネーターを含むヌクレオチド、デオキシリボヌクレオチドの2’修飾を含むターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含むターミネーター、およびそれらの組み合わせから選択される。1つの特定の実施形態では、ターミネーターヌクレオチドは、ジデオキシヌクレオチド、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’-リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド(acyclonucleotides)、およびそれらの組み合わせから選択される。上記方法のいずれかの1つの実施形態では、増幅プライマーは4~70のヌクレオチド長さである。上記方法のいずれかの1つの実施形態では、増幅産物は、約50~約2000のヌクレオチド長さである。上記方法のいずれかの1つの実施形態では、標的核酸は、DNA(例えば、cDNAまたはゲノムDNA)である。上記方法のいずれかの1つの実施形態では、増幅プライマーはランダムプライマーである。上記方法のいずれかの1つの実施形態では、増幅プライマーはバーコードを含む。1つの特定の実施形態では、バーコードは細胞バーコードを含む。1つの特定の実施形態では、バーコードはサンプルバーコードを含む。上記方法のいずれかの1つの実施形態では、増幅プライマーは固有分子識別子(UMI)を含む。上記方法のいずれかの1つの実施形態では、上記方法は、最初のプライマーアニーリングの前に標的核酸またはゲノムDNAを変性させる工程を含む。1つの特定の実施形態では、変性はアルカリ性条件下で実施され、その後、中和される。上記方法のいずれかの1つの実施形態では、サンプル、増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物は、マイクロ流体デバイスに含有されている。上記方法のいずれかの1つの実施形態では、サンプル、増幅プライマー、核酸ポリメラーゼ、およびヌクレオチドの混合物は、液滴に含有されている。上記方法のいずれかの1つの実施形態では、サンプルは、組織サンプル、細胞、体液サンプル(例えば、血液、尿、唾液、リンパ液、脳脊髄液(CSF)、羊水、胸膜液、心膜液、腹水、眼房水)、骨髄サンプル、精液サンプル、生検サンプル、癌サンプル、腫瘍サンプル、細胞溶解サンプル、法医学サンプル、考古学サンプル、古生物学サンプル、感染サンプル、産生サンプル、植物全体、植物部品、細菌叢サンプル、ウイルス調製物、土壌サンプル、海水サンプル、真水サンプル、家庭用あるいは工業用サンプル、およびそれらの組み合わせならびに分離物から選択される。上記方法のいずれかの1つの実施形態では、サンプルは、細胞(例えば、動物細胞[例えば、ヒト細胞]、植物細胞、真菌細胞、細菌細胞、および原生動物細胞)である。1つの特定の実施形態では、細胞は複製前に溶解される。1つの特定の実施形態では、細胞溶解にはタンパク質分解が伴う。1つの特定の実施形態では、細胞は、着床前胚からの細胞、幹細胞、胎児細胞、腫瘍細胞、疑わしい癌細胞、癌細胞、遺伝子編集手順を受けた細胞、病原体からの細胞、法医学サンプルから得られた細胞、考古学サンプルから得られた細胞、および古生物学サンプルから得られた細胞から選択される。上記方法のいずれかの1つの実施形態では、サンプルは、着床前胚(例えば、割球[例えば、体外受精によって生成された8つの細胞期の胚から得られる割球])の細胞である。1つの特定の実施形態では、上記方法は、胚細胞中の疾患の素因となる生殖系列変異体あるいは体細胞変異体の存在を決定する工程をさらに含む。上記方法の1つの実施形態では、サンプルは、病原体(例えば、細菌、真菌、原生動物)の細胞である。1つの特定の実施形態では、病原体細胞は、患者、細菌叢サンプル(例えば、GI細菌叢サンプル、膣細菌叢サンプル、皮膚細菌叢サンプルなど)、あるいは留置医療機器(例えば、静脈内カテーテル、尿道カテーテル、脳脊髄シャント、人工弁、人工関節、気管内チューブなど)から採取された体液から得られる。1つの特定の実施形態では、上記方法は、病原体の同一性を決定する工程をさらに含む。1つの特定の実施形態では、上記方法は、処置に対する病原体の耐性の原因となる遺伝子変異体の存在を決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、サンプルは、腫瘍細胞、疑わしい癌細胞、あるいは癌細胞である。1つの特定の実施形態では、上記方法は、1つ以上の診断変異あるいは予後変異の存在を決定する工程をさらに含む。1つの特定の実施形態では、上記方法は、処置に対する耐性の原因となる生殖系列変異体あるいは体細胞変異体の存在を決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、サンプルは、遺伝子編集手順を受けた細胞である。1つの特定の実施形態では、上記方法は、遺伝子編集プロセスによって引き起こされた計画外の突然変異の存在を決定する工程をさらに含む。上記方法のいずれかの1つの実施形態では、上記方法は、細胞系統の履歴を決定する工程をさらに含む。関連する態様では、本発明は、低頻度の配列変異体(例えば、全配列の≧0.01%を構成する変異体)を同定するための上記方法のいずれかの使用を提供する。
【0059】
関連する態様では、本発明は、核酸ポリメラーゼ、1つ以上の増幅プライマー、1つ以上のターミネーターヌクレオチドを含むヌクレオチドの混合物、および随意に使用説明書を含むキットを提供する。本発明のキットの1つの実施形態では、核酸ポリメラーゼは鎖置換DNAポリメラーゼである。本発明のキットの1つの実施形態では、核酸ポリメラーゼは、バクテリオファージphi29(Φ29)ポリメラーゼ、遺伝子改変phi29(Φ29)DNAポリメラーゼ、DNAポリメラーゼIのクレノウ断片、ファージM2 DNAポリメラーゼ、ファージphiPRD1 DNAポリメラーゼ、Bst DNAポリメラーゼ、Bst ラージフラグメントDNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、IsoPol DNAポリメラーゼ、DNAポリメラーゼI、Therminator DNAポリメラーゼ、T5 DNAポリメラーゼ、シーケナーゼ、T7 DNAポリメラーゼ、T7-シーケナーゼ、およびT4 DNAポリメラーゼから選択される。本発明のキットの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性を有し、および、ターミネーターヌクレオチドは、そのような3->5’エキソヌクレアーゼ活性(例えば、α基への修正を伴うヌクレオチド[例えば、α-チオジデオキシヌクレオチド]、C3スペーサーヌクレオチド、ロックド核酸(LNA)、逆核酸、2’フルオロヌクレオチド、3’リン酸化ヌクレオチド、2’-O-メチル修飾ヌクレオチド、トランス核酸)を阻害する。本発明のキットの1つの実施形態では、核酸ポリメラーゼは、3’->5’エキソヌクレアーゼ活性(例えば、Bst DNAポリメラーゼ、exo(-)Bstポリメラーゼ、exo(-)Bca DNAポリメラーゼ、Bsu DNAポリメラーゼ、VentR(exo-)DNAポリメラーゼ、Deep Vent(exo-)DNAポリメラーゼ、クレノウ断片(exo-)DNAポリメラーゼ、Therminator DNAポリメラーゼ)を含まない。1つの特定の実施形態では、ターミネーターヌクレオチドは、デオキシリボースの3’炭素のr基の修飾を含む。1つの特定の実施形態では、ターミネーターヌクレオチドは、3’ブロックされた可逆的ターミネーターを含むヌクレオチド、3’ブロックされてない可逆的ターミネーターを含むヌクレオチド、デオキシリボヌクレオチドの2’修飾を含むターミネーター、デオキシリボヌクレオチドの窒素塩基への修飾を含むターミネーター、およびそれらの組み合わせから選択される。1つの特定の実施形態では、ターミネーターヌクレオチドは、ジデオキシヌクレオチド、逆ジデオキシヌクレオチド、3’ビオチン化ヌクレオチド、3’アミノヌクレオチド、3’-リン酸化ヌクレオチド、3’-O-メチルヌクレオチド、3’C3スペーサーヌクレオチドを含む3’炭素スペーサーヌクレオチド、3’C18ヌクレオチド、3’ヘキサンジオールスペーサーヌクレオチド、アシクロヌクレオチド(acyclonucleotides)、およびそれらの組み合わせから選択される。
【実施例】
【0060】
以下の実施例は、本明細書に開示される実施形態の原理および実践をより明白に当業者に例証するために記載され、任意の請求された実施形態の範囲を制限するものとして解釈されるものではない。他に明示されない限り、全ての部分およびパーセンテージは重量基準である。
【0061】
実施例1:一次鋳型指向性増幅(PTA)
【0062】
PTAは、任意の核酸増幅に使用することができるが、全ゲノム増幅に特に有用である。なぜなら、PTAは、より均一でより再現可能な様式で、かつ現在用いられている方法、例えば、多置換増幅(MDA)よりも低いエラー率で、細胞ゲノムより大きな割合を捕捉し、これにより、遺伝子座と対立遺伝子のランダムな過剰表現および突然変異伝播を結果としてもたらす、ポリメラーゼが初めにランダムプライマーを伸長する位置での指数関数的増幅などの、現在用いられている方法の欠点を回避することができるからである(
図1A-1Cを参照)。
【0063】
細胞培養
【0064】
ヒトNA12878(Coriell Institute)細胞を、15%のFBSと2mMのL-グルタミン、および100単位/mLのペニシリン、100μg/mLのストレプトマイシン、ならびに0.25μg/mLのアムホテリシンB(Gibco, Life Technologies)で補足されたRPMI溶媒中で維持した。細胞を3.5×105細胞/mlの密度で播種した。培養物を3日毎に分割して、5%のCO2で、37°Cで、加湿型インキュベータ中で維持した。
【0065】
単一細胞の単離およびWGA
【0066】
3.5×105細胞/mlの密度での播種後、NA12878細胞を最低3日間培養した後に、3mLの細胞懸濁液を300xgで10分間ペレット化した。その後、培地を破棄し、細胞を、1mLの細胞洗浄緩衝液(Mg2またはCa2を含まない2%のFBSを含有する1X PBS)で3回洗浄し、300xg、200xg、および最後に100xgで5分間回転させた。その後、500μLの細胞洗浄緩衝液中で細胞を再撹拌した。その後、100nMのカルセインAM(分子プローブ)および100ng/mlのヨウ化プロピジウム(PI;Sigma-Aldrich)で染色して、生細胞集団を識別した。ELIMINase(Decon Labs)を用いて完全に清潔にし、かつ細胞選別のためにAccudrop蛍光ビーズ(BD Biosciences)を使用してキャリブレーションしたBD FACScanフローサイトメーター(FACSAria II)(BD Biosciences)に細胞を充填した。PTAを受ける細胞中の0.2%のTween 20(Sigma-Aldrich)を有する、3μLのPBS(Qiagen, REPLI-g SC Kit)を含有する96ウェルプレートの各ウェル内で、カルセインAM-陽性画分、PI-陰性画分からの単一細胞を選別した。複数のウェルを意図的に空のままにして、ノーテンプレートコントロール(NTC)として使用した。選別の直後に、プレートを短時間遠心分離機にかけ、氷上に置いた。その後、細胞を-20°Cで最低夜通し凍結した。次の日に、HEPA除菌空気の一定の陽圧を提供する、各実験前にUV光で30分間除染されたプレPCRワークステーション上で、WGA反応物を組み立てた。
【0067】
増幅均一性を改善すると以前示された修正と共に、REPLI-g単一細胞キット(Qiagen)を使用して、MDAを行った。具体的に、エキソヌクレアーゼ耐性のランダムプライマー(ThermoFisher)を、緩衝液D2(REPLI-g単一細胞キット、Qiagen)に加えて、緩衝液D2中の最終濃度を125μMにした。4μLの結果として生じる溶解/変性の混合物(mix)を、単一細胞を含有するチューブに加え、ボルテックスし、短時間回転させ、および氷上で10分間インキュベートした。細胞溶解物を、3μLの停止液(REPLI-g単一細胞キット、Qiagen)の添加により中和し、短時間遠心分離機にかけ、ボルテックスにより混合し、および、室温に静置した。続いて、40μlの増幅混合物を加えた後に、30°Cで8時間インキュベートし、その後、3分間65°Cに加熱することにより増幅を停止した。
【0068】
最初に、5%のトリトンX-100(Sigma-Aldrich)と20mg/mlのプロテイナーゼK(Promega)の1:1の混合物の2μlの予め冷却した溶液を加えることによる凍結融解の後、細胞をさらに溶解することによって、PTAを実行した。その後、細胞をボルテックスし、短時間遠心分離機にかけた後に、40度で10分間静置した。その後、4μlの緩衝液D2(REPLI-g単一細胞キット、Qiagen)および1μlの500μMのエキソヌクレアーゼ耐性のランダムプライマーを、溶解した細胞に加えて、ボルテックス、回転、および65度での15分間の静置前に、DNAを変性した。その後、4μlの室温の停止液(REPLI-g単一細胞キット、Qiagen)を加え、サンプルをボルテックスして遠心沈殿させた。最終増幅反応物中に1200μMの濃度の等比でα-チオ-ddNTPsを含有した56μlの増幅混合物(REPLI-g単一細胞キット、Qiagen)。次に、サンプルを30°Cで8時間静置し、その後、3分間65°Cに加熱することにより増幅を停止した。
【0069】
増幅工程後に、MDAとPTAの反応物の両方からのDNAを、AMPure XP磁気ビーズ(Beckman Coulter)を使用して、ビーズ対サンプルの2:1の比率で精製し、および、メーカーの説明書(Life Technologies)に従ってQubit3.0蛍光測定器を用いたQubit dsDNA HSアッセイキットを使用して、収率を測定した。
【0070】
ライブラリ調製
【0071】
MDA反応物は、40μgの増幅されたDNAの産生をもたらした。コンディショニング溶液(KAPA Biosystems)の添加後に、KAPA HyperPlusプロトコルに従って、1μgの産物を30分間断片化した。その後、15μMのデュアルインデックスアダプター(Integrated DNA Technologies)および4サイクルのPCRによる標準的なライブラリ調製を、サンプルに行った。40-60ngの材料で各PTAの反応物を生成し、この材料を、切断せずにKAPA HyperPlusキットを使用して、その全体をDNA配列決定ライブラリ調製に使用した。UMIおよびデュアル指標(dual indices)(Integrated DNA Technologies)を有する2.5μMのアダプターを、ライゲーションで使用し、および、15サイクルのPCRを最終増幅で使用した。その後、ライブラリを、右側と左側選択でそれぞれ0.65Xと0.55Xの比率を用いて、両側のSPRIを使用して清潔にした。Qubit dsDNA BRアッセイキットおよび2100のバイオアナライザ(Agilent Technologies)を使用して、最終ライブラリを定量化した後、Illumina NextSeqプラットフォーム上で配列決定した。NovaSeqを含むすべてのIlluminaシーケンシングプラットフォームはさらに、プロトコルと適合する。
【0072】
データ分析
【0073】
配列決定リードを、Bcl2fastqを使用して、細胞バーコードに基づいて逆多重化した。その後、trimmomaticを使用して上記リードを整え、続いて、BWAを使用してhg19にアラインメントした。リードに対してPicardによる複製マーキング(duplicate marking)を行い、その後、GATK 4.0を使用して、局所的再アラインメント(local realignment)およびベース再キャリブレーション(base recalibration)を行った。品質メトリクスを計算するために使用されるファイルすべてを、Picard DownSampleSamを使用して、2000万のリードにダウンサンプリングした。qualimap、ならびに、Picard AlignmentSummaryMetricsおよびCollectWgsMetricsを使用して、最終bamファイルから品質メトリクスを取得した。全ゲノムカバレッジをさらに、Preseqを使用して評価した。
【0074】
変異コーリング
【0075】
一塩基変異(single nucleotide variants)およびインデルを、GATK 4.0からのGATK UnifiedGenotyperを使用してコールした。GATKベストプラクティスを使用する標準的なフィルタリング基準( filtering criteria)を、プロセスのすべての工程で使用した(「<https://software.broadinstitute.org/gatk/best-practices/>」)。コピー数変異を、Control-FREEC(Boeva et al., Bioinformatics, 2012, 28(3):423-5)を使用してコールした。構造変異も、CREST(Wang et al., Nat Methods, 2011, 8(8):652-4)を使用して検出した。
【0076】
結果
図3Aおよび
図3Bで示されるように、ジデオキシヌクレオチド(「可逆的」)のみを用いた増幅のマッピング率とマッピング品質のスコアはそれぞれ、15.0+/-2.2および0.8+/-0.08であり、エキソヌクレアーゼ耐性のα-チオジデオキシヌクレオチドターミネーター(「不可逆的」)の取り込みはそれぞれ、97.9+/-0.62および46.3+/-3.18のマッピング率と品質のスコアを結果としてもたらした。可逆的ddNTP、およびターミネーターの様々な濃度を使用して、実験をさらに実行した(
図2A、下)。
【0077】
図2B-2Eは、MDA(Dong, X. et al., Nat Methods. 2017, 14(5):491-493)あるいはPTAを受けたNA12878ヒト単一細胞から生成された比較データを示す。どちらのプロトコルも、同等に低いPCR重複率(MDA 1.26%+/-0.52対PTA 1.84%+/-0.99)およびGC%(MDA 42.0+/-1.47対PTA 40.33+/-0.45)を生成したが、PTAはより小さなアンプリコンを産生した。MDA(ぞれぞれ、PTA 97.9+/-0.62対MDA 82.13+/-0.62およびPTA 46.3+/-3.18対MDA 43.2+/-4.21)と比較して、マッピングされたリードのパーセントおよびマッピング品質のスコアも、PTAで大幅に高かった。全体的に、PTAは、MDAと比較して、より使いやすいマッピングされたデータを生成する。
図4Aは、MDAと比較して、PTAが増幅の均一性を有意に改善し、カバレッジ幅がより大きくなり、およびカバレッジが0に近い領域がより少なくなることを示す。PTAの使用により、全配列の≧0.01%を構成する変異体を含む、核酸の集団中の低頻度の配列変異体を同定することができる。PTAは、単一細胞ゲノム増幅に成功裡に使用することができる。
【0078】
実施例2:PTAの比較分析
【0079】
PTAおよびSCMDAの細胞維持ならびに単離のベンチマーク
【0080】
1000のゲノムプロジェクト対象NA12878(Coriell Institute, Camden, NJ, USA)からのリンパ芽球様細胞を、15%のFBS、2mMのL-グルタミン、100単位/mLのペニシリン、100μg/mLのストレプトマイシン、および0.25μg/mLのアムホテリシンBで補足されたRPMI培地中で維持した。細胞を3.5×105細胞/mlの密度で播種し、3日毎に分割した。それらを5%のCO2で、37°Cで、加湿型インキュベータ中で維持した。単一細胞の単離前に、前の3日にわたって増殖した細胞の懸濁液3mLを、300xgで10分間回転させた。ペレット状の細胞を、1mLの細胞洗浄緩衝液(Mg2+またはCa2+を含まない2%のFBSを含む1XPBS)で3回洗浄し、5分間300xg、200xg、および最後に100xgで順次回転させて、死細胞を除去した。その後、細胞を500uLの細胞洗浄緩衝液において再懸濁し、その後、100nMのカルセインAMおよび100ng/mlのヨウ化プロピジウム(PI)で染色して、生細胞集団を識別した。ELIMINaseを用いて完全に清潔にされ、かつAccudrop蛍光ビーズを使用してキャリブレーションされたBD FACScanフローサイトメーター(FACSAria II)に細胞を充填した。0.2%のTween 20を有する3uLのPBSを含む96ウェルプレートの各ウェルにおいて、カルセインAM-陽性画分、PI-陰性画分からの単一細胞を選別した。複数のウェルを意図的に空のままにして、ノーテンプレートコントロールとして使用した。選別の直後に、プレートを短時間遠心分離機にかけ、氷上に置いた。その後、細胞を-80°Cで最低夜通し凍結した。
【0081】
PTAおよびSCMDAの実験
【0082】
HEPA除菌空気で一定の陽圧を提供する、各実験前にUV光で30分間除染されたプレPCRワークステーション上で、WGA反応物を組み立てた。公開されたプロトコル(Dong et al. Nat. Meth. 2017, 14, 491-493)に従ってREPLI-g単一細胞キットを使用して、SCMDA方法に従ってMDAを実行した。具体的には、エキソヌクレアーゼ耐性のランダムプライマーを、12.5uMの最終濃度で溶解緩衝液に加えた。4uLの結果として生じる溶解の混合物を、単一細胞を含有するチューブに加え、3~6回ピペッティングし、短時間回転させ、および氷上で10分間インキュベートした。細胞溶解物を3uLのクエンチング緩衝液の添加により中和して、3回のピペッティングにより混合し、短時間遠心分離機にかけ、氷上に置いた。続いて、40ulの増幅混合物を加えた後に、30°Cで8時間インキュベートし、その後、3分間65°Cに加熱することにより増幅を停止した。最初に、5%のトリトンX-100および20mg/mlのプロテイナーゼKの1:1の混合物の2μlの予め冷却した溶液を加えることによる凍結融解の後、細胞をさらに溶解することによって、PTAを実行した。その後、細胞をボルテックスし、短時間遠心分離機にかけた後に、40度で10分間静置した。その後、4μlの変性緩衝液および1μlの500μMのエキソヌクレアーゼ耐性のランダムプライマーを溶解した細胞に加えて、ボルテックス、回転、および65度での15分間の静置の前に、DNAを変性した。その後、4μlの室温のクエンチング溶液を加えて、サンプルをボルテックスして、遠心沈殿させた。最終増幅反応において、1200μMの濃度の等しい比率でα-チオ-ddNTPsを含有していた56μlの増幅混合物。次に、サンプルを30°Cで8時間静置し、その後、3分間65°Cに加熱することにより増幅を停止した。SCMDAまたはPTAの増幅後、DNAを、AMPure XP磁気ビーズを使用して、ビーズ対サンプルの2:1の比率で精製し、メーカーの説明書に従って、Qubit 3.0蛍光測定器を用いたQubit dsDNA HSアッセイキットを使用して、収率を測定した。可逆的ddNTPsおよびターミネーターの様々な濃度を使用して、PTAの実験をさらに実行した(
図2A、上)。
【0083】
ライブラリ調製
【0084】
1ugのSCMDA産物を、コンディショニング溶液の添加後に、HyperPlusプロトコルに従って30分間断片化した。その後、15uMのユニークインデックスアダプターおよび4サイクルのPCRによる標準的なライブラリ調製をサンプルに行った。各PTAの反応物の全産物を、切断せずにKAPA HyperPlusキットを使用して、DNA配列決定ライブラリ調製に使用した。2.5uMのユニーク・デュアル・インデックス・アダプターをライゲーションで使用し、15サイクルのPCRを最終増幅で使用した。その後、SCMDAおよびPTAのライブラリを、1%のアガロースE-ゲルで可視化した。400-700bpの断片をゲルから切除し、ゲルDNA回収キット(Gel DNA Recovery Kit)を使用して回収した。Qubit dsDNA BRアッセイキットおよびAgilent2100のバイオアナライザを使用して、最終ライブラリを定量化した後、NovaSeq 6000上で配列決定した。
【0085】
データ分析
【0086】
データをtrimmomaticを使用して整え、続いて、BWAを使用してhg19にアラインメントした。リードに対してPicardによる複製マーキングを行い、その後、GATK 3.5ベストプラクティスを使用して、局所的再アラインメントおよびベース再キャリブレーションを行った。Picard DownSampleSamを使用して、すべてファイルを、指定された数のリードにダウンサンプリングした。qualimap、ならびに、Picard AlignmentMetricsAummaryおよびCollectWgsMetricsを使用して、最終bamファイルから品質メトリクスを取得した。ローレンツ曲線を描いて、htSeqToolsを使用してジニ係数を計算した。UnifiedGenotyperを使用して、SNVコーリングを実施し、その後、それを、どれが標準的な推奨基準(QD < 2.0 || FS > 60.0 || MQ < 40.0 || SOR > 4.0 || MQRankSum < -12.5 || ReadPosRankSum < -8.0)を使用してフィルタリングした。分析から除外された領域はなく、他のデータの正規化や操作は実施されなかった。試験された方法のシーケンシングメトリックが、表1に示される。
【0087】
【0088】
ゲノムカバレッジの幅および均一性
【0089】
PTA法と、すべての一般の単一細胞のWGA法との包括的な比較を実施した。これを遂行するために、PTAおよび、単一細胞MDA(Dong et al. Nat. Meth. 2017, 14, 491-493)(SCMDA)と呼ばれるMDAの改良版を、10のNA12878細胞それぞれで実施した。加えて、DOP-PCR (Zhang et al. PNAS 1992, 89, 5847-5851)、MDAキット1(Dean et al. PNAS 2002, 99, 5261-5266)、MDAキット2、MALBAC(Zong et al. Science 2012, 338, 1622-1626)、LIANTI(Chen et al., Science 2017, 356, 189-194)、あるいはPicoPlex(Langmore, Pharmacogenomics 3, 557-560 (2002))による増幅を受けた細胞に対するそれらの結果を、LIANTI試験の一部として生成されたデータを使用して比較した。
【0090】
サンプルにわたって正規化するために、すべてのサンプルからのデータを整列し、同じパイプラインを使用して変異コーリングのために前処理を行った。その後、bamファイルを、比較を行う前に3億のリードへとそれぞれサブサンプリングした。重要なことは、PTAおよびSCMDAの産物を、さらなる分析を実施する前にスクリーニングしなかったが、他のすべての方法では、後の分析で使用された最高品質の細胞を選択する前に、ゲノムカバレッジおよび均一性のためのスクリーニングを行った。注目すべきことに、SCMDAおよびPTAをバルク二倍体NA12878サンプルと比較したが、他のすべての方法では、LIANTI試験で使用されたバルクBJ1二倍体線維芽細胞と比較した。
図3C-3Fに見られるように、PTAは、ゲノムにアライメントしたリードの最も高いパーセント、ならびに最も高いマッピング品質を有している。PTA、LIANTI、およびSCMDAは類似したGC含有量を有しており、それらのすべては他の方法よりも低かった。PCR重複率はすべての方法にわたって同様であった。さらに、PTA法より、ミトコンドリアゲノムなどのより小さな鋳型で、試験された他の方法と比較して、より高いカバレッジ率(より大きな基準染色体に類似する)を得ることができた(
図3G)。
【0091】
その後、すべての方法のカバレッジの幅および均一性を比較した。SCMDAとPTAについての第1染色体にわたるカバレッジプロットの例が示され、PTAがカバレッジの均一性を有意に改善したことが示される(
図4Bおよび4C)。その後、増加した数のリードを使用して、すべての方法についてカバレッジ率を計算した。PTAは、すべての深度で2つのバルクサンプルに近く、他のすべての方法よりも有意に改善されている(
図5A)。その後、我々は、カバレッジの均一性を測定するために2つの戦略を使用した。第1のアプローチは、増大する配列決定深度でのカバレッジの変動係数を計算することであり、PTAが他のすべての方法と比べてより均一であることが分かった(
図5B)。第2の戦略は、各サブサンプリングされたbamファイルについてローレンツ曲線を計算することであり、PTAが最も大きな均一性を有することが再び分かった(
図5C)。増幅均一性の再現性を測定するために、ジニ係数を計算して、完全な均一性との各増幅反応の違いを評価した(de Bourcy et al., PloS one 9, e105585 (2014))。PTAは、他の方法よりも再現性が高い均一性を再び示した(
図5D)。
【0092】
SNV感度
【0093】
SNVコーリングに対する、増幅方法の性能のこれらの差の影響を判定するために、増大する配列決定深度での、対応するバルクサンプルに対する各々の変異コール率を比較した。感度を評価するために、各配列決定深度で各細胞において見られた6億5000万のリードにサブサンプリングされた対応するバルクサンプルにおける、コールされた変異体のパーセントを比較した(
図5E)。PTAの改善されたカバレッジおよび均一性は、次に最も敏感な方法であったMDAキット2よりも45.6%多い変異体の検出を結果としてもたらした。バルクサンプルにおいてヘテロ接合としてコールされた部位の検査は、PTAが、ヘテロ接合部位で対立遺伝子の歪みを有意に減少させたことを示した(
図5F)。この発見は、PTAはゲノム全体でより均一な増幅を有するだけなく、同じ細胞中の2つの対立遺伝子をより平等に増幅するという主張を裏付ける。
【0094】
SNV特異性
【0095】
変異コールの特異性を評価するために、対応するバルクサンプルで見られない各単一細胞中でコールされた変異体を偽陽性とみなした。SCMDAの低温溶解は、偽陽性変異コールの数を大幅に減少させた(
図5G)。熱安定性ポリメラーゼ(MALBAC、PicoPlex、およびDOP-PCR)を使用する方法は、配列決定深度が増大するにつれてSNVコーリングの特異性をさらに減少させた。理論によって縛られることなく、これは、phi29 DNAポリメラーゼと比較して、それらのポリメラーゼのエラー率が大幅に増加した結果である可能性がある。加えて、偽陽性コール中で見られた塩基変化パターンも、ポリメラーゼ依存性であるように見える(
図5H)。
図5Gで見られるように、PTAの抑えられたエラー伝播のモデルは、標準的なMDAプロトコルと比較した、PTAのより低い偽陽性SNVコーリング率によって裏付けられる。加えて、PTAは、偽陽性変異コールの最低の対立遺伝子頻度を有し、これも、PTAによる抑えられたエラー伝播のモデルと一致している(
図5I)。
【0096】
実施例3:環境変異原性の直接測定(DMEM)
【0097】
PTAを使用して、高解像度のゲノムワイドヒト・トキシコゲノミクス試験を実施するためのフレームワークをもたらす、新規な変異誘発性アッセイを実施した。エイムズ試験などの以前の試験は、ヒト細胞を代表すると仮定される測定を行なうために細菌遺伝学に依存するが、各露出した細胞中で引き起こされた突然変異数およびパターンに関する制限された情報のみを提供する。これらの制限を克服するために、ヒト変異誘発系「環境変異原性(DMEM)の直接測定」が開発され、単一のヒト細胞を、環境化合物にさらし、単一細胞として単離し、および各細胞中で誘発された新しい突然変異を同定するために単一細胞シーケンシングを行う。
【0098】
基部/前駆体マーカーCD34を発現する臍帯血細胞を、増加する濃度の直接変異原であるN-エチル-N-ニトロン尿素(ENU)にさらした。ENUは比較的低いSwain-Scott基質定数を有すると知られており、O4チミン、O2チミン、およびO2シトシンの優先的なアルキル化を結果としてもたらす2段階SN1メカニズムによって主に作用することが示された。標的遺伝子の制限された配列決定によって、ENUは、マウスにおけるTからAへの(AからTへの)、TからCへの(AからGへの)、およびCからTへの(GからAへの)の変化を優先することが示され、これは大腸菌で見られるパターンと大幅に異なる。
【0099】
変異誘発性実験のための臍帯血細胞の単離および増殖
【0100】
ENU(CAS 759-73-9)およびD-マンニトール(CAS 69-65-8)を、それらの最大の溶解度で溶液に入れた。新しい抗凝固剤で処理された臍帯血(CB)を、St. Louis Cord Blood Bankから得た。CBをPBSで1:2に希釈し、および、単核細胞(MNC)を、メーカーの説明書に従って、Ficoll-Paque Plus上で密度勾配遠心分離によって単離した。その後、CD34を発現するCB MNCを、メーカーに従って、ヒトCD34マイクロビーズキットおよび磁気細胞分離(MACS)法を使用して、免疫磁気的(immunomagnetically)に選択した。細胞数と生存率を、Luna FL細胞計数装置を使用して評価した。1X CD34+Expansion supplement、100単位/mLのペニシリン、および100ug/mLのストレプトマイシンで補足されたStemSpan SFEMにおいて、CB CD34+細胞を2.5x104細胞/mLの密度で播種し、変異原曝露に進める前に96時間増やした。
【0101】
環境変異原性の直接測定(DMEM)
【0102】
増やした臍帯血CD34+細胞を、1X CD34+Expansion Supplement、100単位/mLのペニシリン、および100ug/mLのストレプトマイシンで補足されたStemSpan SFEMにおいて培養した。その細胞を、8.54、85.4、および854uMの濃度のENU、1152.8のD-マンニトール、ならびに11528uM、あるいは0.9%の塩化ナトリウム(ビヒクル対照)に40時間さらした。薬剤で処理された細胞およびビヒクル対照サンプルからの単一細胞懸濁液を、採取して、上記のように生存率について染色した。上記のように、単一細胞選別を実施した。PTAを実施し、本明細書に記載される方法の一般的な方法および実施例2に従って、単純化および改善されたプロトコルを使用して、ライブラリを調製した。
【0103】
DMEMデータの分析
【0104】
DMEM実験において細胞から獲得したデータを、Trimmomaticを使用して整えて、BWAを使用してGRCh38に整列し、推奨パラメータから逸脱することなくGATK 4.0.1ベストプラクティスを使用して、さらに処理した。HaplotypeCallerを使用して遺伝子型判定を実施し、標準的なパラメータを使用して、ジョイント遺伝子型を再びフィルタリングした。変異体は、少なくとも100のPhred品質スコアを有しており、1つの細胞のみで見られるが、バルクサンプルで見られない場合のみ、変異原の結果であると考えられた。各SNVのトリヌクレオチドの文脈を、bedtoolsを使用して、参照ゲノムから周囲の塩基を抽出することにより決定した。突然変異の計数および文脈を、Rにおいてggplot2ならびにheatmap2を使用して可視化した。
【0105】
突然変異が、CD34+細胞のDNase I過感受性部位(hypersensitivity sites)(DHS)で濃縮されるか否かを決定するために、Roadmap Epigenomics Projectによって生成された10のCD34+初代細胞データセットのDHS部位と重複する、各サンプル中のSNVの割合を計算した。DHS部位を、いずれかの方向に2つのヌクレオソーム、あるいは340の塩基だけ延長した。各DHSデータセットを単一細胞サンプルとペアにし、DHSと重複した細胞中で少なくとも10xカバレッジを有するヒトゲノムの割合を決定し、それを、覆われたDHS部位内で見られたSNVの割合と比較した。
【0106】
結果
【0107】
これらの試験と一致して、各細胞の突然変異数の用量依存性増加が観察され、マンニトールのビヒクル対照あるいは中毒量のいずれかと比較して、類似する数の突然変異がENUの最低用量で検出された(
図12A)。ENUを使用したマウスにおける前の研究とも一致して、最も一般的な突然変異は、TからA(AからT)、TからC(AからG)、およびCからT(GからA)である。CからG(GからC)へのトランスバージョンは稀のようだが、他の3つの型の塩基変化も観察された(
図12B)。SNVのトリヌクレオチド文脈の調査は、2つの異なるパターンを示す(
図12C)。第1のパターンは、グアニンがシトシンに続く場合、シトシン変異誘発が稀に現れるというものである。グアニンが続くシトシンは、ヒトゲノム中の5番目の炭素部位で一般的にメチル化され、これは、ヘテロクロマチンのマーカーである。理論によって縛られることなく、ヘテロクロマチンへの到達しにくさゆえに、あるいは、シトシンと比較して5-メチルシトシンとの好ましくない反応条件の結果として、5-メチルシトシンがENUによるアルキル化を受けないという仮説が立てられた。前の仮説を試験するために、突然変異部位の位置を、Roadmap Epigenomics Projectによってカタログ化されたCD34+細胞の既知のDNase I高感受性部位と比較した。
図12Dで見られるように、DNase I高感受性部位のシトシン変異(cytosine variants)の濃縮は観察されなかった。さらに、シトシンに制限された変異体の濃縮は、DH部位で観察されなかった(
図12E)。加えて、アデニンがチミンの前に存在する場所でほとんどのチミン変異が生じる。変異体のためのゲノム特徴のアノテーションは、ゲノム中のそれらの特徴のアノテーションとは大幅に異なっていなかった。(
図12F)
【0108】
実施例4:超並列単一細胞DNAシーケンシング(Massively Parallel Single-Cell DNA Sequencing)
【0109】
PTAを使用して、超並列DNAシーケンシングのためのプロトコルを確立する。初めに、細胞バーコードをランダムプライマーに加える。細胞バーコードにより導入された、増幅のいかなるバイアスも最小限に抑えるための2つの策略を使用した:1)ランダムプライマーのサイズの延長すること、および/または2)細胞バーコードが鋳型に結合するのを防ぐために、それ自体にループして戻るプライマーを作ること(
図10B)。一旦最適なプライマー戦略が確立されると、例えば、粘性液体でも高精度で25nLの容量までピペッティングできるMosquito HTSリキッドハンドラーを使用して、最大384の選別された細胞を調整する(scaled)。このリキッドハンドラーはさらに、基準的な50μLの反応量の代わりに、1μLのPTAの反応を使用することにより、試薬コストをおよそ50分の1に削減する。
【0110】
増幅プロトコルは、細胞バーコードを有するプライマーを液滴に送達することにより、液滴に移行される。スプリットアンドプール(split-and-pool)戦略を使用して作られたビーズなどの固体支持体が、随意に使用される。適切なビーズは、例えば、ChemGenesから入手可能である。いくつかの例では、オリゴヌクレオチドは、ランダムプライマー、細胞バーコード、固有分子識別子、ならびに、ビーズおよび細胞が同じ液滴中に封入された後に、オリゴヌクレオチドを放出する切断可能な配列あるいはスペーサーを含む。このプロセス中に、液滴中の低いナノリットル量について、鋳型、プライマー、dNTP、α-チオ-ddNTP、およびポリメラーゼの濃度が最適化される。いくつかの例では、最適化は、反応容量を増やすためにより大きな液滴の使用を含む。
図9で見られるように、このプロセスは、細胞を溶解するために2つの連続反応、その後のWGAを必要とする。溶解された細胞およびビーズを含有している第1の液滴を、増幅混合物を有する第2の液滴と組み合わせる。代替的に、あるいは組み合わせて、溶解の前にヒドロゲルビーズにおいて細胞を封入し、その後、両方のビーズを油滴に加えてもよい。Lan, F. et al., Nature Biotechnol., 2017, 35:640-646を参照。
【0111】
さらなる方法はマイクロウェルの使用を含み、それは、いくつかの例では、3”×2”のスライドガラスのサイズであるデバイス上の20ピコリッターの反応チャンバにおいて、140,000の単一細胞を補足する。液滴ベースの方法と同様に、これらのウェルは、細胞バーコードを含有しているビーズを細胞と組み合わせて、超並列処理を可能にする。Gole et al., Nature Biotechnol., 2013, 31:1126-1132を参照。
【0112】
実施例5:小児急性リンパ芽球性白血病(ALL)へのPTAの適用
【0113】
ETV6-RUNX1転座を抱える個々の白血病細胞の単一細胞エクソームシーケンシングを実施し、1細胞当たりおよそ200のコーディング突然変異を測定し、それらのうちの25のみが、その患者の標準的なバルクシーケンシングで検出されるのに十分な細胞中に存在した。その後、1細胞当たりの突然変異荷重を、このタイプの白血病の他の既知の特徴、例えば、複製に関連する突然変異率(1コーディング突然変異/300の細胞分裂)、開始から診断までの時間(4.2年)、および診断の時点での個体群サイズ(1000億の細胞)とともに取り込んで、その病気の進行のインシリコシミュレーションを作成した。小児ALLなどの遺伝学的に単純な癌であると思われたものでさえ、その患者の診断の時点で異なるコーディング突然変異プロファイルを有する概算3億3000万のクローンが存在することが予想外に発見された。興味深いことには、
図6Bで見られるように、5つの最も豊富なクローン(ボックスC)に対して1つのみが、標準的なバルクシーケンシングで検出され;少数の細胞からなり、したがって、臨床的に有意である可能性が低い何千万ものクローンが存在する(ボックスA)。したがって、細胞(ボックスB)の少なくとも0.01%(1:10,000)を占めるクローンを検出することができるように(なぜなら、これが再発を引き起こす最も抵抗性の疾患が存在すると仮定される層であるため)、検出の感度の増強するための方法が提供される。
【0114】
そのような大規模な集団遺伝的多様性を考慮すると、所与の患者内の処置に対して、より耐性があるクローンが存在すると仮定された。その仮説を試験するために、サンプルを培養液に入れて、標準的ALL化学療法剤の増加する濃度に白血病細胞をさらす。
図7で見られるように、対照サンプル、および低用量のアスパラギナーゼを受けるものにおいて、活性化するKRAS突然変異を抱えるクローンは拡大し続けた。しかし、そのクローンは、プレドニゾロンおよびダウノルビシンに対してより敏感に反応することが分かったが、それらの薬剤による処置の後に、以前は検出不可能であった他のクローンを、より明確に検出することができた(
図7、破線のボックス)。このアプローチは、処置されたサンプルのバルクシーケンシングも使用した。いくつかの例では、単一細胞DNAシーケンシングの使用により、拡大する集団の多様性およびクロノタイプを決定することができる。
【0115】
ALLクロノタイプ薬剤感受性のカタログの作成
【0116】
図8に示されるように、ALLクロノタイプ薬剤感受性のカタログを作るために、診断サンプルのアリコートを採取して、10,000の細胞の単一細胞配列決定を実施して、各クロノタイプの存在量を決定する。平行して、診断白血球細胞を、標準的なALL薬剤(ビンクリスチン、ダウノルビシン、メルカプトプリン、プレドニゾロン、およびアスパラギナーゼ)、ならびに、標的とされた薬剤(イブルチニブ、ダサチニブ、およびルキソリチニブ)の群にインビトロでさらす。生細胞を選択して、単一細胞DNAシーケンシングを、1回の薬剤曝露当たり少なくとも2500の細胞上で実施する。最後に、6週間の処置を終えた後の同じ患者の骨髄サンプルを、バルクシーケンシング試験のために確立されたプロトコルを使用して、生きている残存前白血病および白血病について選別する。その後、PTAを使用して、スケーラブルで、効率的で、費用対効果の高い様式で、何万もの細胞の単一細胞DNAシーケンシングを実施し、これにより以下の目的を達成する。
【0117】
薬剤感受性のクロノタイプから薬剤感受性カタログまで
一旦シーケンシングデータが獲得されると、各細胞のクロノタイプが確立される。これを達成するために、変異体をコールしてクロノタイプを決定する。PTAを利用することによって、現在使用されるWGA法の間に導入される対立遺伝子欠落(allelic dropout)およびカバレッジのバイアスが制限される。MDAを受けた単一細胞から変異体をコールするためのツールの体系的比較を実施し、最近開発されたツールMonovarは、最も高い感度および特異性を有することが分かった(Zafar et al., Nature Methods, 2016, 13:505-507)。一旦変異コールが行われると、対立遺伝子欠落により一部の変異コールが欠落しているにかかわらず、2つの細胞は同じクロノタイプを有しているかどうかが決定される。これを達成するために、多変量のBernoulli分布の混合モデルを使用してもよい(Gawad et al., Proc. Natl. Acad. Sci. USA, 2014, 111(50):17947-52)。細胞が同じクロノタイプを有することが立証された後に、カタログに含める変異体を決定する。以下の基準のいずれかを満たす遺伝子が含まれる:1)大規模な小児の癌ゲノムシーケンシングプロジェクトで識別された既知の癌抑制遺伝子に生じる、突然変異のホットスポットまたは機能喪失型変異体(フレームシフト、ナンセンス、スプライシング)のいずれかで検出された非同義変異体であること;2)再発性の癌サンプル中で繰り返し検出される変異体であること;および、3)ALL患者が6週間の処置を受けるため、残存病変の現在のバルクシーケンシング試験において正の選択を受ける再発性変異体であること。クローンは、これらの基準を満たす少なくとも2つの変異体を有しない場合、カタログに含まれない。処置抵抗あるいは疾患再発に関連したより多くの遺伝子が同定されると、クローンを「救出」し、カタログに含むことができる。クロノタイプが対照と薬剤処置の間の正または負の選択を受けたか否かを決定するために、フィッシャーの正確確率検定を使用して、対照とは有意に異なるクローンを同定する。突然変異の少なくとも2つの一致した組み合わせが特定の薬剤への暴露と同じ相関を有すると示される場合のみ、クローンをカタログに加える。癌遺伝子中の既知の活性化する突然変異あるいは同じ遺伝子中の腫瘍抑制因子中の機能喪失型突然変異は、クローン間で同等であると考えられる。クロノタイプが正確に一致していない場合、共通の突然変異をカタログに入れる。例えば、クロノタイプ1がA+B+Cであり、クロノタイプ2がB+C+Dである場合、B+Cクロノタイプをカタログに入れる。限られた数の同時に生じる突然変異を有する耐性細胞中で繰り返し変異する遺伝子が同定される場合、それらのクローンは崩壊して、機能的に同等なクロノタイプになる可能性がある。
【0118】
実施例6:PTA法
【0119】
変更を伴う実施例1の一般的な方法を使用して、PTA法を実施する。1つの実施形態では、ターミネーターを標準的dNTPと取り替えて、増幅中の伸長を遅くするために添加剤を使用する。別の実施形態では、ターミネーターを標準的なdNTPと取り替えて、伸長速度を遅くするために鎖置換ポリメラーゼを修飾する。別の実施形態では、ターミネーターを、伸長中に、標準的なヌクレオチドよりもゆっくりと取り込むdNTP、あるいは、標準的ヌクレオチドを含む鋳型と比べて、取り込み後により遅い伸長反応を結果としてもたらすdNTPと取り替える。いくつかの例では、そのような低速取り込みのdNTPは、ヌクレアーゼ耐性である。
【0120】
実施例7:ターミネーターを用いるヘアピンあるいはループ方法
【0121】
サンプルを随意に溶解し(単一細胞など)、サンプル鋳型(標的核酸分子)DNAを、準ランダムプライミングおよび線形増幅にさらす。ターミネーターとdNTPの混合物を、準ランダムプライミング工程中に使用する。プライマーを、ヘアピン構造あるいはループ構造を生成するように設計し、これは、オリジナルサンプル鋳型DNAよりも、さらなる増幅に対する効率が低い鋳型である。これにより、オリジナルサンプル鋳型に由来するアンプリコンの割合がより高くなる。次に、アンプリコンのライブラリを、指数関数的増幅工程を用いてさらに増幅して、配列決定のためのライブラリを生成する。いくつかの例では、溶解、線形増幅、および指数関数的増幅は、同じ容器内で生じる。代替的に、あるいは組み合わせて、ターミネーターを指数関数的増幅工程で使用する。いくつかの例では、標準的なdNTPを線形増幅中に使用し、ターミネーターを指数関数的増幅工程中に使用する。ターミネーターの使用により、非ターミネーターヌクレオチドと比較して、非オリジナル鋳型増幅が減少する。
【0122】
実施例8:ターミネーターを用いるレコンビナーゼポリメラーゼ増幅(RPA)
【0123】
サンプルを随意に溶解し(単一細胞など)、サンプル鋳型DNAを、レコンビナーゼ、一本鎖DNA結合タンパク質、プライマー、ポリメラーゼ、およびターミネーターとdNTPの混合物を含む、RPA反応混合物(例示的な手順の場合、Daher et al., Clin. Chem. 2016, 62(7), 947-958)にさらす。例えば、レコンビナーゼはRecAであり、一本鎖DNA結合タンパク質はSSBである。いくつかの例では、レコンビナーゼはT4 UvsXであり、一本鎖DNA結合タンパク質はT4 gp32である。様々なポリメラーゼとしては、限定されないが、SauポリメラーゼあるいはBsuポリメラーゼが挙げられる。いくつかの例では、追加の薬剤、例えば、ポリエチレングリコールまたはCarbowax20Mを反応混合物に加える。いくつかの例では、逆転写酵素を加えて、RNAサンプル鋳型を増幅する。いくつかの例では、完全にあるいは部分的にランダム化されたプライマーを使用する。RPAによって生成されたアンプリコンは、追加の工程、例えば、アダプターへのライゲーション、指数関数的増幅、配列決定、あるいはその任意の組み合わせを随意に受ける。ターミネーターの使用により、非ターミネーターヌクレオチドと比較して、非オリジナルの鋳型増幅が減少する。
【0124】
実施例9:ターミネーターを用いるヘリカーゼ依存性増幅(HDA)
【0125】
サンプルを随意に溶解し(単一細胞など)、サンプル鋳型DNAを、ヘリカーゼ、ポリメラーゼ、およびターミネーターとdNTPの混合物を含むHDA反応混合物(例示的な手順の場合、Yang et al., Chembiochem 2015, 16(9), 1365-1370)にさらす。例えば、ポリメラーゼはBst2.0、GspM、GspM2.0、GspSSD、あるいは他のポリメラーゼであり、ヘリカーゼは、好熱性ヘリカーゼ、Tte-UvrD、あるいは他のヘリカーゼである。いくつかの例では、追加の一本鎖DNA結合タンパク質を加える。いくつかの例では、逆転写酵素を加えてRNAサンプル鋳型を増幅する。いくつかの例では、完全にあるいは部分的にランダム化されたプライマーを使用する。HDAによって生成されたアンプリコンは、追加の工程、例えば、アダプターへのライゲーション、指数関数的増幅、配列決定、あるいはその任意の組み合わせを随意に受ける。ターミネーターの使用により、非ターミネーターヌクレオチドと比較して、非オリジナルの鋳型増幅が減少する。
【0126】
本発明の好ましい実施形態が本明細書で示され、記載されてきたが、こうした実施形態がほんの一例として提供されているに過ぎないということは当業者にとって明白である。当業者であれば、多くの変更、変化、および置換が、本発明から逸脱することなく思いつくだろう。本明細書に記載される本発明の実施形態の様々な代案が、本発明の実施において利用され得ることを理解されたい。以下の請求項は本発明の範囲を定義するものであり、この請求項とその均等物の範囲内の方法、および構造体がそれによって包含されるものであるということが意図されている。