(58)【調査した分野】(Int.Cl.,DB名)
【発明を実施するための形態】
【0011】
定義
以下の定義は、本開示を理解するのに役立つ。
用語「試料」とは、標的核酸を含有する、又は含有すると推定される任意の組成物を意味する。これは、個体から単離された組織又は体液、例えば、皮膚、血漿、血清、骨髄液、リンパ液、滑液、尿、涙、血液細胞、器官及び腫瘍の試料を含み、ホルマリン固定したパラフィン包埋組織(FFPET)及びそれらから単離された核酸を含む個々の患者又はモデル生物から採取された細胞から確立されたインビトロ培養物の試料も含む。試料はまた、無細胞DNA(cfDNA)又は循環腫瘍DNA(ctDNA)を含有する無細胞血液画分などの無細胞材料も含むことができる。
【0012】
用語「核酸」とは、DNA、RNA及びそれらの下位区分、例えば、cDNA、mRNAなどを含むヌクレオチド(例えば、リボヌクレオチド及びデオキシリボヌクレオチド、いずれも天然及び非天然)のポリマーを意味する。核酸は、一本鎖又は二本鎖であってもよく、一般的に5’−3’ホスホジエステル結合を含有するが、場合によっては、ヌクレオチド類似体はその他の結合を有していてもよい。核酸は、天然に生じる塩基(アデノシン、グアノシン、シトシン、ウラシル及びチミジン)並びに非天然塩基を含んでいてもよい。非天然塩基のいくつかの例は、例えば、Seela等(1999)Helv.Chim.Acta 82:1640に記載されたものを含む。非天然塩基は、特定の機能、例えば、核酸二本鎖の安定性の増強、ヌクレアーゼ消化の阻害又はプライマー伸長若しくは鎖重合の遮断を有することができる。
【0013】
用語「ポリヌクレオチド」及び「オリゴヌクレオチド」は同義に使用される。ポリヌクレオチドは、一本鎖又は二本鎖核酸である。オリゴヌクレオチドは、短いポリヌクレオチドを示すために時々使用される用語である。オリゴヌクレオチドは、少なくとも6ヌクレオチド又は約15〜30ヌクレオチドから構成されていてもよい。オリゴヌクレオチドは、当業界で公知の任意の適切な方法、例えば、Narang等(1979)Meth.Enzymol.68:90〜99;Brown等(1979)Meth.Enzymol.68:109〜151;Beaucage等(1981)Tetrahedron Lett.22:1859〜1862;Matteucci等(1981)J.Am.Chem.Soc.103:3185〜3191に記載されたような直接化学合成を含む方法によって調製される。
【0014】
用語「プライマー」とは、標的核酸(「プライマー結合部位」)中の配列とハイブリダイズし、このような合成に適切な条件下で核酸の相補鎖に沿って合成開始点として作用することができる一本鎖オリゴヌクレオチドを意味する。プライマー結合部位は、各標的に特有であり得るか、又は全標的に付加され得る(「ユニバーサルプライミング部位」又は「ユニバーサルプライマー結合部位」)。
【0015】
用語「アダプター」は、別の配列にさらなる特性を導入するためにその配列に付加され得るヌクレオチド配列を意味する。アダプターは、典型的に、一本鎖若しくは二本鎖であることができ、又は一本鎖部分及び二本鎖部分の両方を有していてもよいオリゴヌクレオチドである。アダプターは、バーコード及びユニバーサルプライマー又はプローブ部位などの配列を含有していてもよい。
【0016】
用語「連結」とは、1分子の5’リン酸基が別の分子の3’ヒドロキシル基と反応する、2つの核酸鎖を繋ぐ縮合反応を意味する。連結は、典型的に、リガーゼ又はトポイソメラーゼによって触媒される酵素反応である。連結は、2つの一本鎖を繋いで、1つの一本鎖分子を生成することができる。連結はまた、それぞれ二本鎖分子に属する二本の鎖を繋ぐことができ、したがって、2つの二本鎖分子を繋ぐ。連結はまた、二本鎖分子の両鎖を別の二本鎖分子の両鎖に繋ぐことができ、したがって、2つの二本鎖分子を繋ぐ。連結はまた、二本鎖分子内の鎖の2つの末端を繋ぐことができ、したがって、二本鎖分子中の切れ目を修復する。
【0017】
用語「バーコード」とは、検出して識別され得る核酸配列を意味する。バーコードは、様々な核酸に組み込まれ得る。バーコードは、著しく長く、例えば、2、5、10ヌクレオチドであり、したがって、試料中で、バーコードを組み込んだ核酸はバーコードによって区別されたり、グループ分けされたりすることが可能である。
【0018】
用語「複合識別子」及び「MID」とは、標的核酸の供給源(例えば、多数の試料の核酸を一緒にするとき必要とされる、核酸が得られる試料)を識別するバーコードを意味する。同じ試料由来の標的核酸の全て又は実質的に全ては同じMIDを共有する。異なる供給源又は試料由来の標的核酸は、混合され、同時に配列決定され得る。MIDを使用して、配列リードは、標的核酸が生じた個々の試料に割り当てられ得る。
【0019】
用語「一意分子識別子」及び「UID」とは、それが結合している核酸を識別するバーコードを意味する。同じ試料由来の標的核酸の全て又は実質的に全ては、異なるUIDを有する。同じ元の標的核酸から得られた後代(例えば、アンプリコン)の全て又は実質的に全ては同じUIDを共有する。
【0020】
用語「ユニバーサルプライマー」及び「ユニバーサルプライミング結合部位」又は「ユニバーサルプライミング部位」とは、異なる標的核酸中に存在する(典型的には、インビトロにおいて付加された)プライマー及びプライマー結合部位を意味する。例えば、ユニバーサルプライミング部位は、複数の標的核酸に連結したアダプターに含まれていてもよい。ユニバーサルプライミング部位はまた、例えば、標的特異的プライマーの5’末端に付加されることによって、標的特異的(非ユニバーサル)プライマーの一部であってもよい。ユニバーサルプライマーは、ユニバーサルプライミング部位に結合し、そこからのプライマー伸長を誘導することができる。
【0021】
本明細書では、用語「標的配列」、「標的核酸」又は「標的」とは、検出又は分析すべき試料中の核酸配列の一部を意味する。標的という用語は、標的配列のバリアント全て、例えば、1つ又は複数の変異体バリアント及び野生型バリアントを含む。
【0022】
用語「シークエンシング」とは、標的核酸中のヌクレオチドの配列を判定する任意の方法を意味する。
【0023】
単一分子のシークエンシングは、両側に同じアダプターを有する、本明細書では、対称的にアダプター付加されたシークエンシング鋳型と呼ばれる、二本鎖DNA(dsDNA)分子で実施されることが多い。典型的に、これらの分子のシークエンシングは、1つのシークエンシングリードにおけるセンス鎖及びアンチセンス鎖の少なくとも一部からデータを得る(米国特許第8,822,150号を参照のこと)。その他の技術では、鋳型は、一緒に結合した2つの相補鎖を含有する形態的に環状の一本鎖分子である(米国特許第9,404,146号を参照のこと)。1本の鎖のみからシークエンシングライブラリーを生成するために、アダプター(2016年10月31日に出願された米国特許仮出願第62/415,245号「Barcoded circular library construction for identification of chimeric products」を参照のこと)又はスプリント(米国特許出願公開第20120003657号)を使用する標的分子の環状化が使用され得る。しかし、この手法は、前者ではCIRCLIGASE(商標)制限のためサイズ制限(500bpまで)があり、後者では非効率的である。本明細書で記載した方法は、2つのシークエンシング鋳型分子におけるセンス鎖及びアンチセンス鎖の分離を可能にし、元の二本鎖標的分子のサイズによって制限されない。
【0024】
一実施形態では、本発明は、シークエンシングのための一本鎖環状核酸のライブラリーを作製する方法である。
図1は、本発明による方法の一例を示す。
【0025】
最初のステップでは、複数の二本鎖DNA分子が提供される。二本鎖DNA分子は、単離されたゲノムDNA又は複雑さを低減したゲノムDNA(例えば、エキソームなどのゲノムの増幅された選択領域又はゲノムの捕捉された選択領域)であってもよい。
【0026】
次のステップでは、二本鎖DNA分子の各末端にアダプターが連結される。アダプターは、少なくとも1つの連結可能な二本鎖部分及び少なくとも1つの一本鎖部分を含んでいてもよい。
図1の例においては、Y型アダプターである。非相補的領域は、任意の立体配置、例えば、フォーク構造(Y−アダプター)又はステムループ構造を想定することができる。非相補的領域は1本又は2本の鎖を含有していてもよい。2本の鎖は、同じ又は異なる長さであってもよい。非相補的領域は、反応条件で安定なハイブリッドを形成せず、本発明の方法のステップ中は一本鎖のままである。アダプターは、複数の二本鎖領域及び複数の一本鎖領域を含有していてもよい。例えば、一本鎖領域は、2つの二本鎖領域が隣接していてもよい。
【0027】
二本鎖標的核酸は、二本鎖アダプターの連結に適切な末端を含んでいなければならない。一部の実施形態では、標的核酸の末端は、「平滑化(polish)」されている、すなわち、二本鎖末端を確実にするために核酸ポリメラーゼで伸長されている。一部の実施形態では、標的核酸の5’末端はリン酸化されている。一部の実施形態では、連結は平滑末端連結である。一部の実施形態では、連結は粘着末端連結である。標的核酸の3’末端は、単一のヌクレオチド(例えば、A)で伸長されており、アダプターは、3’末端に相補的オーバーハング(例えば、T)を含有するように操作されている。
【0028】
次のステップでは、アダプターを連結した標的DNA分子は変性され、一本鎖捕捉DNA環(sscDNA分子)と接触する。所望の配列を含有する小さな一本鎖DNA環の生成は当業界では日常的で、このような環は市販されている(Bio−Synthesis,Inc.、Lewisville、Tex)。本発明では、環はアダプター中の2つの非相補的配列のそれぞれと相補的な領域を有する(
図1)。一部の実施形態では、相補的な領域は、所望の距離によって分離され得る。方法の以下のステップから分かるように、相補的な領域の間の配列はライブラリー分子中にコピーされ、したがって、ライブラリー分子中に追加的配列を組み込むために使用され得る。一部の実施形態では、追加的配列は、プライマー結合部位、制限酵素部位、バーコードなどから選択される。
【0029】
一部の実施形態では、sscDNA分子は、固相支持体に結合させることができる。一部の実施形態では、固相支持体への結合は、ビオチン標識sscDNA分子によって引き起こされるビオチン−ストレプトアビジン結合を介する。一部の実施形態では、固相支持体は、溶液中に存在するビーズである。一部の実施形態では、ビーズはポリスチレンビーズ、常磁性ビーズ、吸着ビーズ又は荷電ビーズである。その他の実施形態では、固相支持体は、表面、例えば、スライド又はアレイである。
図1の例では、環状一本鎖核酸分子は、捕捉可能な部分を含み、例えば、ビオチンにコンジュゲートされている。環状一本鎖核酸分子と各末端にアダプター配列を有する一本鎖分子とのハイブリダイゼーション複合体は、例えば、ポリマービーズなどの固相支持体にコンジュゲートしたストレプトアビジンを使用して、捕捉され得る。
【0030】
sscDNAと変性標的分子の比は、アダプター連結標的DNA分子の各鎖に単一のsscDNAをアニーリングするために最適化され得る。sscDNA分子は、標的分子の各一本鎖に対して2つの相補的配列を有するので、空間的近接が標的分子の第2の末端の結合を容易にして、
図1に示した構造を形成する。sscDNA分子と標的DNA分子の鎖との結合は、自由な伸長可能な3’末端を有する構造を生成する。
【0031】
次のステップでは、sscDNAにアニーリングした標的DNA鎖の伸長可能な3’末端は、DNAポリメラーゼによってsscDNA分子の周りに伸長され、標的DNA鎖の5’末端に到達する。一部の実施形態では、DNAポリメラーゼは、非鎖置換型ポリメラーゼである。一部の実施形態では、ポリメラーゼは、Taq、Klenow、Bst、Pfu、T4、T7、大腸菌pol I、スルホロブス種pol IVDNAポリメラーゼから選択され得る。
【0032】
一部の実施形態では、ポリメラーゼ伸長は必要ではない。例えば、アダプターに相補的な捕捉分子の領域は捕捉分子上で互いに隣接する。捕捉分子にアニーリングした後、アダプターの末端は直接連結され得る。一部の実施形態では、アダプターの一本鎖領域の長さが不等である非対称アダプターが使用される。非対称アダプターに相補的な捕捉分子の領域は捕捉分子上で互いに隣接する。捕捉分子にアニーリングした後、アダプターの長い末端及び短い末端は直接連結され得る。
【0033】
次のステップでは、標的核酸鎖の伸長された3’末端は、標的核酸鎖の5’末端に連結され、一部がssdDNA分子の一部にアニーリングされたアダプター連結標的核酸鎖を含有するハイブリッド分子を生成する(
図1)。このハイブリッド分子は、2つの部分的に相補的な一本鎖環状分子から構成され、sscDNA分子を分離するために融解され得る。一部の実施形態では、融解は加熱による。その他の実施形態では、融解は、化学的、例えば、アルカリ又は類似の核酸二本鎖変性剤への曝露による。
【0034】
一部の実施形態では、分離されたsscDNA分子は、サイズ分離又はクロマトグラフィー(ビーズ、カラム若しくはゲル電気泳動)によって除去される。sscDNAがビオチン化されている実施形態では、例えば、ストレプトアビジンをコンジュゲートしたポリマーをコーティングした磁性又は常磁性ビーズによって、sscDNAはビオチン−ストレプトアビジン複合体を形成することによって捕捉され、除去され得る。その他の実施形態では、sscDNAは、ヌクレアーゼ消化部位を含有するように操作され得る。一部の実施形態では、sscDNAはデオキシウラシルを含有するように操作される。このようなDNAは、ウラシルDNA N−グリコシラーゼ(UNG)で処理し、環状DNAをエキソヌクレアーゼで消化され得る直鎖型に変換するために加熱することによって、除去され得る。さらにその他の実施形態では、sscDNAは、光切断可能なリンカーを含有するように操作され得る。
【0035】
一部の実施形態では、本発明は、各環が本発明の方法を使用して産生される元の標的核酸の1本の鎖のみを含む、核酸シークエンシングのための一本鎖環状分子のライブラリーである。ライブラリー中の各標的核酸は、2つのアダプターの配列及びsscDNA配列の一部を含有する。
【0036】
一部の実施形態では、本発明は、本明細書で記載したような一本鎖環状核酸分子のライブラリーの生成を介した、核酸のシークエンシング方法である。
【0037】
本発明は、核酸シークエンシングのために試料から標的核酸のライブラリーを作製することを含む。試料中の核酸全てを含む多数の核酸は、本明細書で記載した方法及び組成物を使用してライブラリー分子に変換され得る。一部の実施形態では、試料は、対象又は患者から得られる。一部の実施形態では、試料は、例えば、生検によって、対象又は患者から得られた固形組織又は固形腫瘍の断片を含むことができる。試料はまた、体液(例えば、尿、痰、血清、血漿若しくはリンパ液、唾液、痰、汗、涙、脳脊髄液、羊水、滑液、心膜液、腹水、胸水、嚢胞液、胆汁、胃液、腸液又は糞便試料)を含むことができる。試料は、正常若しくは腫瘍細胞が存在し得る全血又は血液画分を含むことができる。一部の実施形態では、試料、特に液体試料は、無細胞腫瘍DNA又は腫瘍RNA又は無細胞胎児DNAを含む無細胞DNA又はRNAなどの無細胞材料を含むことができる。一部の実施形態では、試料は、無細胞試料、例えば、無細胞腫瘍DNA又は腫瘍RNAが存在する、無細胞血液由来試料である。その他の実施形態では、試料は、培養試料、例えば、培養物中の細胞又は培養物中に存在する感染因子から得られた核酸を含有する、又は含有する疑いがある培養物又は培養上清である。一部の実施形態では、感染因子は、細菌、原生動物、ウイルス又はマイコプラズマである。試料はまた、生物の核酸を含有する、又は含有する疑いがある環境試料であってもよい。
【0038】
標的核酸は、試料中に存在し得る目的の核酸である。一部の実施形態では、標的核酸は遺伝子又は遺伝子断片である。一部の実施形態では、遺伝子、遺伝子断片及び遺伝子間領域は全て(全ゲノム)、標的核酸となる。一部の実施形態では、ゲノムの一部のみ、例えば、ゲノムのコーディング領域(エキソーム)のみが標的核酸となる。一部の実施形態では、標的核酸は、一塩基多型若しくは一塩基変異(SNP若しくはSNV)、又は、例えば、遺伝子融合において生じる遺伝子再配置を含む、遺伝子変異、例えば、遺伝子多型の座を含有する。一部の実施形態では、標的核酸はバイオマーカー、すなわち、変異が疾患又は病気と関連する遺伝子を含む。その他の実施形態では、標的核酸は特定の生物の特徴であり、その生物の識別に役立つか、又は薬剤感受性若しくは薬剤耐性などの病原生物の特徴である。さらにその他の実施形態では、標的核酸はヒト対象の特徴、例えば、対象に特有のHLA又はKIR遺伝子型を規定するHLA又はKIR配列である。
【0039】
本発明の一実施形態では、1つ又は複数の標的核酸は、本発明の鋳型の立体配置に変換される。一部の実施形態では、標的核酸は天然では一本鎖の形態(例えば、mRNA、マイクロRNA、ウイルスRNA又は一本鎖ウイルスDNAを含むRNA)で生じる。その他の実施形態では、標的核酸は天然では二本鎖の形態で生じる。当業者であれば、本発明の方法は多数の実施形態を有することを認識するであろう。一本鎖標的核酸は、二本鎖の形態に変換されて、その後
図1で示したステップを施され得る。長い標的核酸は断片化されてもよいが、一部の適用では、長い標的核酸は長いリードを実現するために所望されることがある。一部の実施形態では、標的核酸は天然に断片化され、例えば、環状化した無細胞DNA(cfDNA)又は化学的に保存された、若しくは記録された試料中に見いだされるものなどの化学的に分解されたDNAである。
【0040】
本発明の利点の1つは、長さの制限がない一本鎖環状核酸を生成する能力である。本発明の方法は、一本鎖環状連結(例えば、CIRCLIGASE(商標)、国際公開第2010094040号パンフレットを使用する)に付き物の低いサイズ制限を有さない。この方法はまた、スプリント連結の動力学的非効率を回避する(米国特許出願公開第20120003657号を参照のこと)。
【0041】
本発明は、アダプター分子を利用する。一部の実施形態では、アダプターは、一末端で標的核酸のいずれかの末端に連結することができる二本鎖核酸である。一部の実施形態では、アダプターは、少なくとも1つの5’末端がリン酸化されている。一部の実施形態では、アダプターは、標的核酸上に生成された対応するオーバーハングに合致する1つ又は複数のヌクレオチドのオーバーハングを含有する。
【0042】
一部の実施形態では、アダプターは、一末端に二本鎖領域を含み、もう1つの末端に一本鎖領域を含む。二本鎖領域は核酸のハイブリダイズした鎖を含有し、一本鎖領域は1本の鎖又は互いにハイブリダイズしない2本の鎖を含有する。一本鎖領域を含む末端は、標的核酸に連結することはできない。一部の実施形態では、アダプターはY型アダプターである(Prashar及びWeissman、(1996)Proc.Natl.Acad.Sci.USA 93:659を参照のこと)。一部の実施形態では、Y−アダプターは同じ、又はほぼ同じ長さの一本鎖領域を有する対称Y−アダプターである。その他の実施形態では、アダプターは、その他の領域よりも実質的に長い1つの一本鎖領域を有する非対称Y−アダプターである。
【0043】
その他の実施形態では、アダプターは一本鎖領域が二本鎖領域の2本の鎖を連結するリンカーである、ステムループ構造を有する。
【0044】
以下にさらに詳細に記載するように、アダプターの二本鎖末端は、二本鎖標的核酸分子の各末端に連結される。二本鎖核酸分子の連結は当業界ではよく知られており(Green M.及びSambrook,J.、Molecular Cloning、2012 CSHL Pressを参照のこと)、一般的な方法に対する改善を本明細書に記載する。一部の実施形態では、アダプター分子は、インビトロにおいて合成された人工的配列である。その他の実施形態では、アダプター分子は、インビトロにおいて合成された天然に生じる配列である。さらにその他の実施形態では、アダプター分子は、単離された天然に生じる分子又は単離された非天然に生じる分子である。
【0045】
一部の実施形態では、アダプターは1つ又は複数のバーコードを含む。バーコードは、試料が混合された(複合された)試料の供給源を識別するために使用される複合試料ID(MID)であってもよい。バーコードはまた、元の分子及びその後代それぞれを識別するために使用される一意分子ID(UID)として役立つことができる。バーコードはまた、UID及びMIDの組合せであってもよい。一部の実施形態では、単一のバーコードは、UID及びMIDの両方として使用される。
【0046】
一部の実施形態では、各バーコードは予め規定された配列を含む。その他の実施形態では、バーコードはランダム配列を含む。バーコードは1〜20ヌクレオチド長であってもよい。
【0047】
一部の実施形態では、一意バーコード(UID)は、アダプターの二本鎖部分に存在する。これらの実施形態では、各鎖は、以下及び米国特許出願公開第20150044687号にさらに記載されているようなコンセンサスシークエンシング及びエラー修正を可能にする、バーコード(又はバーコード相補体)のコピーを有する。
【0048】
本発明の実施形態では、各標的分子は2つのアダプターに連結される。一部の実施形態では、各分子は2つの一意バーコード(UID)を有する。一部の実施形態では、各分子はまた、標的核酸が得られる試料を識別するために同じ複合試料ID(MID)バーコードを有する。
【0049】
一部の実施形態では、本発明は、一本鎖環状バーコード化分子のライブラリーを生成するためにアダプターのプールを含む。プール内のアダプターは、プール中のその他のバーコードから少なくとも1又は少なくとも3編集距離離れた一意バーコードを有する。当業者ならば、シークエンシング技術の典型的なエラー率をベースにしてどの編集距離が特定の実験に最適であるかを判定することができるであろう。一般的に、編集距離が大きいことは、1つのプールで使用され得るバーコードが少ないことを意味する。しかし、シークエンシング技術又は製造方法が高いエラー率を有するならば、大きな編集距離が必要であろう。例えば、アダプターを製作するために使用したオリゴヌクレオチド製造方法は、高いエラー率を有していてもよい。同様に、シークエンシング−合成のワークフローにおけるDNA増幅又はプライマー伸長で使用される核酸ポリメラーゼは、高いエラー率を有し得る。これらのエラー率は、プールのアダプターにおけるバーコード間の編集距離を増加させることが必要であろう。反対に、前述した方法のそれぞれの正確度を改善すると、プールのアダプターにおけるバーコード間の編集距離を減少させることが可能である。
【0050】
一部の実施形態では、本発明は、アダプターのプール全体を含有する単一のバイアルで表される製造品を含む。或いは、製造品はプールの1つ又は複数のアダプターが別々のバイアル中に存在するキットを含むことができる。
【0051】
一部の実施形態では、アダプターはさらに、少なくとも1つのユニバーサルプライマーのためのプライマー結合部位を含む。プライマー結合部位は、プライマーが結合し、鎖伸長を容易にすることができるプライマーと相補的な配列である。
【0052】
一部の実施形態では、アダプターは1つより多くの、例えば、2つのプライマー結合部位を有する。一部の実施形態では、1つのプライマーは、例えば、PCR(非対称PCRを含む)、直線増幅又はローリングサークル複製(RCA)による増幅のために使用される。
【0053】
一部の実施形態では、本発明はアダプターの連結のために標的DNAを調製するステップを含む。一部の実施形態では、これらのステップは、「平滑化すること」、例えば、引っ込んだ3’末端をDNAポリメラーで伸長することによって、又は突出した3’末端をマングビーンエキソヌクレアーゼなどの3’−5’エキソヌクレアーゼで消化することによって、鎖オーバーハングを有する分子を完全な二本鎖形態に変換することを含む。
【0054】
一部の実施形態では、二本鎖連結は平滑末端連結である。その他の実施形態では、二本鎖連結はT−A連結又はその他のオーバーハング連結である。一部の実施形態では、この方法は、アダプター上のオーバーハングに合致する(すなわち、相補的な)鎖のオーバーハングを標的核酸に付加するステップを含む。一部の実施形態では、オーバーハングは、標的核酸の1つ又は両方の末端に付加されたAヌクレオチドであってもよく、一方、アダプターは、Tヌクレオチドを含有するように設計され、末端は連結される。アダプター分子のインビトロ合成中に、単一のヌクレオチドが人工的に合成され得る。単一のヌクレオチドはまた、例えば、Taqポリメラーゼ又はターミナルトランスフェラーゼによって、標的核酸の1つ又は両方の末端に酵素的に付加され得る。1つ又は両方
【0055】
本発明は、一本鎖環状捕捉DNA分子(sscDNA)を利用する。一部の実施形態では、環状分子は30から500塩基長の間である。分子は好ましくは、環内の自己相補性を回避し、本明細書で記載した反応条件下での一本鎖立体構造を確実にするように設計された(若しくは修飾された)人工的な配列又は修飾された天然に生じる配列から構成される。
【0056】
sscDNA分子は、アダプター配列と相補的な少なくとも2つの領域を含む。相補的な2つの領域は、アダプター連結標的DNA鎖及びsscDNA分子によって形成されるハイブリッド分子のエネルギー的に好ましいトポロジーを確実にするように、sscDNA分子内に位置する。一部の実施形態では、アダプター配列と相補的な2つの領域は、1、2、5、10又はそれ以上の塩基離れている。一部の実施形態では、アダプター配列と相補的な2つの領域は、環において互いに最大限の距離(正反対)に位置する。
【0057】
一部の実施形態では、sscDNA分子はアダプター中に存在しないさらなる人工的配列を含有する。sscDNA分子は、1つ若しくは複数のプライマー結合部位、1つ若しくは複数のバーコード、1つ若しくは複数の制限酵素部位又は標的DNA分子に組み込まれることが必要な任意のその他の配列を含有することができる。
【0058】
一部の実施形態では、アダプターは使用されない。代わりに、捕捉分子は天然の標的核酸(外来配列を有さない)がハイブリダイズすることができる標的特異的領域を含む。一部の実施形態では、標的核酸の限定されたライブラリー又は単一種の標的核酸(例えば、ウイルス病原体、例えば、HIVなどの病原体、又は細菌病原体、又は病原体の群、例えば、ストレプトコッカス種の配列)が検出され得る。限定された数の標的特異的領域を有する捕捉分子の限定されたライブラリー又は2つの標的特異的領域を有する単一種の捕捉分子が使用され得る。
【0059】
一部の実施形態では、捕捉分子は遺伝子融合を検出するために使用され得る。このような実施形態では、捕捉分子は、それぞれが融合相手の1つとハイブリダイズすることができる2つの標的特異的領域を有する。
【0060】
一部の実施形態では、本発明は酵素を利用する。酵素は、DNAポリメラーゼ(シークエンシングポリメラーゼを含む)DNAリガーゼ及びターミナルトランスフェラーゼを含むことができる。
【0061】
一部の実施形態では、DNAポリメラーゼは、非鎖置換型ポリメラーゼである。一部の実施形態では、ポリメラーゼは、Taq、Klenow、Bst、Pfu、T4、T7、大腸菌pol I、スルホロブス種pol IV DNAポリメラーゼから選択され得る。
【0062】
一部の実施形態では、本発明はまたDNAリガーゼを利用する。一部の実施形態では、T4DNAリガーゼ又は大腸菌DNAリガーゼが使用される。
【0063】
一部の実施形態では、本発明はまた、鋳型非依存性DNAポリメラーゼ、例えば、ターミナルトランスフェラーゼ又は鋳型に依存しない様式で1つ又は複数のヌクレオチドを付加する活性を備えたDNAポリメラーゼを利用する。一部の実施形態では、本発明は、哺乳類ターミナルトランスフェラーゼ又はTaqポリメラーゼを使用する。
【0064】
ライブラリーから作製された一本鎖環状バーコード化分子のライブラリーに核酸シークエンシングを施すことができる。本発明の方法によって生成された鋳型ライブラリーは特に、長さに制限がない環状鋳型のシークエンシング又は例えば、ローリングサークル複製を介した環状分子の反復読み取りに適合したシークエンシング技術に有利である。このような技術の例は、SMRT(登録商標)技術を利用するPacific BioSciencesプラットフォーム(Pacific Biosciences,Menlo Park,Cal.)又はOxford Nanopore Technologies(Oxford,UK)若しくはRoche Genia(Santa Clara,Cal.)によって製造されたものなどのナノポア技術を利用するプラットフォーム及び長さに制限がない環状鋳型のシークエンシング若しくは環状分子の反復読み取りに適した任意のその他の既存の、若しくは将来的な単一分子シークエンシング技術を含む。シークエンシングステップは、プラットフォーム特異的シークエンシングプライマーを利用することができる。これらのプライマーの結合部位は、本発明で使用したアダプターに導入され得る。一部の実施形態では、シークエンシングプライマーのための結合部位は、sscDNAのコピーされた部分に導入される。標的DNA分子の3’末端及び5’末端を連結する鎖伸長ステップ中に、これらのプライマー結合部位は標的DNA分子に組み込まれるようになる。
【0065】
一部の実施形態では、シークエンシングステップは配列解析を含む。配列解析は、2次解析、例えば、機器によって収集されたシグナルをベースコールに変換する(1次解析)機器によって集められた配列に実施される解析を含むことができる。一部の実施形態では、解析は配列整列のステップを含む。一部の実施形態では、整列は、複数の配列、例えば、同じバーコード(UID)を有する複数からコンセンサス配列を判定するために使用される。同じUIDを備えたこのような複数の配列は、例えば、DNAポリメラーゼによるローリングサークル複製又はシークエンシングポリメラーゼによる読み取りを介したシークエンシング中の標的核酸分子又は環状核酸分子の反復読み取りの産物又は増幅であってもよい。一部の実施形態では、バーコード(UID)は、標的核酸分子の2本の鎖からコンセンサス配列を確立するために使用される。これらの鎖は2つの別々の一本鎖環状分子に分配されるようになるが、元の2本の鎖はアダプターからの同じUIDを有する(
図1)。
【0066】
その他の実施形態では、バーコード(UID)を使用するコンセンサス配列の作製は、アーチファクト、すなわち、同一のバーコード(UID)を有する配列のいくつかに存在するが全てには存在しない変動を排除するステップを含む。このようなアーチファクトは、増幅誤差又はシークエンシング誤差から生じる可能性があるので、コンセンサス配列から排除され得る。
【0067】
一部の実施形態では、試料中の各配列のコピー数は、試料中における各バーコード(UID)を備えた配列の相対数を定量することによって定量され得る。各UIDは、元の試料中における単一分子を表し、各配列バリアントに関連した異なるUIDを計数すると元の試料中における各配列の画分を判定することができる。当業者であれば、コンセンサス配列を判定するために必要な配列リードの数を判定することができるであろう。一部の実施形態では、相対数は正確な定量結果に必要なUID当たりのリード(「シーケンス深度)である。一部の実施形態では、所望の深度はUID当たり5〜50リードである。
【実施例】
【0068】
実施例1
一本鎖バーコード化環状分子のライブラリーの(予備的)生成
この実施例では、DNAは患者の試料から単離される。場合によっては、RNAが試料から単離され、cDNAに逆転写され、試料から直接単離されたDNAと同じ方法でその後のステップで処理される。
【0069】
DNAは末端が修復され、T4DNAポリメラーゼでAが尾部に付加される。A尾部の付加は、平滑連結による複雑さを回避しながら、その後の効率的なアダプター連結を可能にする。次に、Y型アダプターは、T4DNAリガーゼを使用してDNAの両末端に連結される。アダプターは、各3’末端にTを付加するためにターミナルトランスフェラーゼで予め処理される。アダプターは、各5’末端にリン酸基を付加するために、T4ポリヌクレオチドキナーゼで予め処理される。Y型アダプターは、連結に関わる二本鎖領域を含む。Y型アダプターはまた、相補的ではなく、ハイブリダイズしないままの2つの一本鎖から構成される一本鎖領域を含む。連結後、アダプター連結標的分子は加熱変性され、氷上で保存される。
【0070】
長さが30〜500塩基の一本鎖環状捕捉DNA分子が試料に添加される。捕捉分子は、少なくとも1つのビオチン化ヌクレオチドを含有する。捕捉分子は、ストレプトアビジンで修飾された磁性ビーズの表面に結合する。捕捉分子は、それぞれがアダプター中の非相補的な鎖のそれぞれに相補的な2つの配列を含有する。2つのアダプター相補的配列の間の領域中に、捕捉分子は試料バーコード及びプライマー結合部位を含有する。
【0071】
捕捉分子は、特定のDNAハイブリダイゼーションに好ましい条件下で、変性したアダプター連結標的分子を含有する試料に添加される。捕捉分子は、最適な比で添加され、アダプター連結標的分子のY−アダプター末端は、少なくとも1つの末端が捕捉分子に結合すべきである。最初のハイブリダイゼーション後、標的分子のもう一方の末端は捕捉分子中のアダプター相補的配列と空間的に近接しており、結合及び2回目のハイブリダイゼーションの可能性が高い。ハイブリダイゼーションは、直鎖状一本鎖標的核酸がその3’末端及び5’末端で捕捉分子に結合したハイブリッド分子の形成を引き起こす。
【0072】
標的核酸の3’末端は、Pfuポリメラーゼ、dNTP及びマグネシウムの存在下で、適切な温度で伸長される。ポリメラーゼは、環状捕捉分子の周りを回り、捕捉分子に結合された、アダプター連結標的核酸の5’末端に到達する。
【0073】
次に、T4DNAリガーゼは、連結に適切な条件下で添加される。連結は環状標的分子の一部が環状捕捉分子の一部にハイブリダイズしたハイブリッド分子を生成する。
【0074】
ハイブリッド分子は、捕捉され、ビオチン標識した捕捉分子に結合するストレプトアビジンで修飾された常磁性ビーズを使用して試料から単離される。ハイブリッド分子は、熱変性され、一本鎖捕捉分子は捕捉され、ストレプトアビジンビーズを使用して再度除去される。
【0075】
一旦、環状標的DNA分子のライブラリーの生成が完了したら、環状コンセンサスシークエンシングのために使用され得る。元のDNA分子の一本の鎖から生じる各環状分子は、Pacific BioSciences機器でSMRT(登録商標)技術を使用して、又はGenia機器でナノポア技術を使用して配列決定される。相補鎖は、異なる反応で配列決定される。
【0076】
シークエンシングの後に生物情報学解析を行う。2本の鎖は、生物情報学的に関連しており、コンセンサス配列が作製される。