IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ エフ.ホフマン−ラ ロシュ アーゲーの特許一覧

特表2024-506732シーケンシング中に核酸鋳型がナノポアを通り抜けるのを防止する構造
<>
  • 特表-シーケンシング中に核酸鋳型がナノポアを通り抜けるのを防止する構造 図1
  • 特表-シーケンシング中に核酸鋳型がナノポアを通り抜けるのを防止する構造 図2
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-02-14
(54)【発明の名称】シーケンシング中に核酸鋳型がナノポアを通り抜けるのを防止する構造
(51)【国際特許分類】
   C12N 15/11 20060101AFI20240206BHJP
   C40B 40/06 20060101ALI20240206BHJP
   C12Q 1/6869 20180101ALI20240206BHJP
【FI】
C12N15/11 Z
C40B40/06
C12Q1/6869 Z
【審査請求】有
【予備審査請求】未請求
(21)【出願番号】P 2023549902
(86)(22)【出願日】2021-02-18
(85)【翻訳文提出日】2023-10-05
(86)【国際出願番号】 EP2021053946
(87)【国際公開番号】W WO2022174898
(87)【国際公開日】2022-08-25
(81)【指定国・地域】
(71)【出願人】
【識別番号】591003013
【氏名又は名称】エフ. ホフマン-ラ ロシュ アーゲー
【氏名又は名称原語表記】F. HOFFMANN-LA ROCHE AKTIENGESELLSCHAFT
(74)【代理人】
【識別番号】100118902
【弁理士】
【氏名又は名称】山本 修
(74)【代理人】
【識別番号】100106208
【弁理士】
【氏名又は名称】宮前 徹
(74)【代理人】
【識別番号】100196508
【弁理士】
【氏名又は名称】松尾 淳一
(74)【代理人】
【識別番号】100196243
【弁理士】
【氏名又は名称】運 敬太
(72)【発明者】
【氏名】フランクリン,ヘレン
(72)【発明者】
【氏名】フリドランド,スタニスラフ
(72)【発明者】
【氏名】クルゲルツ,スペンサー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QQ42
4B063QQ52
4B063QR32
4B063QR35
(57)【要約】
本発明は、ナノポアに基づく方法を用いてシーケンシングするためのコントロール鋳型を含む核酸鋳型の形成に関し、本明細書中に開示される新規構造の鋳型は、シーケンシング中にナノポアを通り抜けることが制限または防止されている。
【選択図】図1
【特許請求の範囲】
【請求項1】
第1の鎖および第2の鎖を含む、核酸ライブラリー用のアダプターであって、
a. 前記第1の鎖は、5’部分および3’部分を有し、前記5’部分は、前記第1の鎖の5’末端を含むループおよびステムを有するステムループ構造を形成し、前記3’部分は、前記第2の鎖に相補的な配列を含み;
b. 前記第2の鎖は、5’部分および3’部分を有し、前記3’部分は、前記第2の鎖の3’末端を含むループおよびステムを有するステムループ構造を形成し、前記5’部分は、前記第1の鎖に相補的な配列を含み;
c. 前記第1の鎖と前記第2の鎖とが、前記第1の鎖の3’部分および前記第2の鎖の5’部分を介して二重鎖を形成する、
アダプター。
【請求項2】
前記第2の鎖の3’部分が、核酸ポリメラーゼによって伸長可能である、請求項1に記載のアダプター。
【請求項3】
一方または両方のループ形成領域が、少なくとも4、5、6ヌクレオチド長かつ最大20またはそれを超えるヌクレオチド長である、請求項1に記載のアダプター。
【請求項4】
1つ以上の分子バーコードを含む、請求項1に記載のアダプター。
【請求項5】
前記分子バーコードが、試料バーコード(SID)および固有分子識別子バーコード(UID)から選択される、請求項4に記載のアダプター。
【請求項6】
前記SIDが、前記第1の鎖の3’部分と前記第2の鎖の5’部分とによって形成される前記二重鎖の外側に位置する、請求項4に記載のアダプター。
【請求項7】
前記UIDが、前記第1の鎖の3’部分と前記第2の鎖の5’部分とによって形成される前記二重鎖内に位置する、請求項4に記載のアダプター。
【請求項8】
前記SIDおよび前記UIDが、予め定義された配列またはランダムな配列を含む、請求項4に記載のアダプター。
【請求項9】
核酸のライブラリーを作製する方法であって、試料中の複数の二本鎖核酸に複数のアダプターを付着させることを含み、各アダプターは、
a. 5’部分および3’部分を有する第1の鎖であって、前記5’部分は、前記第1の鎖の5’末端を含むループおよびステムを有するステムループ構造を形成し、前記3’部分は、第2の鎖に相補的な配列を含む、第1の鎖;
b. 5’部分および3’部分を有する第2の鎖であって、前記3’部分は、前記第2の鎖の伸長可能な3’末端を含むループおよびステムを有するステムループ構造を形成し、前記5’部分は、前記第1の鎖に相補的な配列を含む、第2の鎖;ならびに
c. 前記第1の鎖の3’部分および前記第2の鎖の5’部分を介して二重鎖を形成する前記第1の鎖および前記第2の鎖
を含む、方法。
【請求項10】
前記アダプターが、前記第1の鎖の3’部分と前記第2の鎖の5’部分とによって形成される前記二重鎖を前記二本鎖核酸の一方または両方の末端にライゲートすることによって付着される、請求項9に記載の方法。
【請求項11】
付着の前に、前記複数の核酸を前処理して、各核酸の一方または両方の末端に平滑末端を形成する、請求項9に記載の方法。
【請求項12】
前記第1の鎖の3’部分と前記第2の鎖の5’部分とによって形成される前記二重鎖が、1つ以上のヌクレオチドの一本鎖オーバーハングを有する、請求項9に記載の方法。
【請求項13】
試料中の核酸をシーケンシングする方法であって、請求項9に記載の核酸のライブラリーを形成すること、および前記アダプターの前記第2の鎖の伸長可能な3’末端を伸長することを含む合成法によるシーケンシングによって前記ライブラリーをシーケンシングすることを含む、方法。
【請求項14】
第1の鎖と、前記第1の鎖に相補的な第2の鎖と、2つの末端とを含む、シーケンシング反応において使用するためのコントロール核酸であって、前記2つの末端のうちの少なくとも1つは、
a. ステムループ構造を形成する3’-オーバーハングであって、前記オーバーハングの3’末端は、核酸ポリメラーゼによって伸長可能である、3’-オーバーハング、および
b. 伸長された3’末端によって置換されると、ステムループ構造を形成する5’末端
を含む、コントロール核酸。
【請求項15】
核酸のライブラリーをシーケンシングする方法であって、前記ライブラリーを請求項14に記載のコントロール核酸と接触させること、およびナノポアによる検出を含む方法によって前記核酸のライブラリーをシーケンシングすること、を含む、方法。
【発明の詳細な説明】
【技術分野】
【0001】
発明の分野
本発明は、核酸シーケンシングの分野に関する。より詳細には、本発明は、シーケンシング用の核酸標的のライブラリーを形成する分野に関する。
【背景技術】
【0002】
発明の背景
生物学的ナノポアおよび固体ナノポアを使用する核酸シーケンシングは、急速に成長している分野である。Ameur,et al.(2019)Single molecule sequencing:towards clinical applications,Trends Biotech.,37:72を参照のこと。いくつかの方法では、核酸鋳型を、生物学的ナノポア(米国特許第10337060号)もしくは固体ナノポア(米国特許第10288599号、米国特許出願公開第20180038001号、米国特許第10364507号)、または2つの電極間のトンネル接合部PCT/EP2019/066199および米国特許出願公開第20180217083号)に通している。他の方法では、鋳型をナノポアに通さず、検出可能な部分(例えば、ラベルまたはタグ)を通す(米国特許第8461854号)。鋳型核酸がナノポアを通り抜けるのを防止するまたは通り抜ける速度を制御する方法がある。例えば、「スピードバンプ」は、ポアの外側に配置された相補的オリゴヌクレオチドである(米国特許第10400278号)。トレフォイル構造を有するtRNAを鋳型に付着させ、「ブレーキ」タンパク質と相互作用させることにより、ポアへの鋳型の挿入速度を制御することができる(米国特許第10131944号)。ヘアピンおよびループが、プライマーに存在し得るか、または相補的プローブが、非貫通ナノポアシーケンシング法(米国特許第9605309号)において完全に貫通を防止し得る。ヘリカーゼなどの翻訳酵素を使用することによっても、通り抜ける速度を制御することができる(米国特許出願公開第20180201993号)。固体シーケンシングでは、鋳型核酸を薄い固体層のポアに通す。そのような貫通は、核酸鎖を「伸ばす」磁気ビーズを用いて制御され得る(米国特許出願公開第20190317040号)。
【0003】
シーケンシング中に核酸が生物学的ナノポアまたは固体ナノポアを通り抜けるのをコントロールまたは防止する革新的かつ経済的な手段が必要とされている。理想的には、この手段は、複雑なシーケンシングワークフローに最小数の工程または構成要素を追加するものであり得る。
【発明の概要】
【0004】
発明の概要
本発明は、自己プライミング能力を有するダブルヘアピンアダプターの使用に関する。5’-ヘアピンは、ナノポアシーケンシングにとって特に有利であり、置換された(displaced)鎖がナノポアを通り抜けるのを防ぐ。本発明は、核酸シーケンシング用のライブラリーおよびナノポアシーケンシング用のコントロール核酸分子を作製する方法も含む。
【0005】
得られる核酸構築物の5’末端と3’末端の両方がヘアピン構造を含むように(一方または両方の末端において)、標的核酸が新規ダブルヘアピンアダプターにライゲートされる。3’-ヘアピンは、第1の鎖のシーケンシングプライマーとして作用する伸長可能な末端を有する。第2の鎖は、プライマー伸長中に置換されるが、第1の鎖と第2の鎖の両方が、ヘアピンを保持し、ナノポアを通り抜けるのを防止する。
【0006】
いくつかの実施形態において、本発明は、第1の鎖および第2の鎖を含む核酸ライブラリー用のアダプターであり、第1の鎖は、5’部分および3’部分を有し、5’部分は、第1の鎖の5’末端を含むループおよびステムを有するステムループ構造を形成し、3’部分は、第2の鎖に相補的な配列を含み;第2の鎖は、5’部分および3’部分を有し、3’部分は、第2の鎖の3’末端を含むループおよびステムを有するステムループ構造を形成し、5’部分は、第1の鎖に相補的な配列を含み;ならびに第1の鎖および第2の鎖は、第1の鎖の3’部分および第2の鎖の5’部分を介して二重鎖を形成する。第2の鎖の3’部分は、核酸ポリメラーゼによって伸長可能であり得る。ループ形成領域は、少なくとも4、5、6ヌクレオチド長かつ最大20またはそれを超えるヌクレオチド長であり得る。アダプターは、試料バーコード(SID)および固有分子識別子バーコード(UID)から選択される1つ以上の分子バーコードを含み得る。例えば、SIDは、第1の鎖の3’部分と第2の鎖の5’部分とによって形成される二重鎖の外側に配置され得るか、またはUIDは、第1の鎖の3’部分と第2の鎖の5’部分とによって形成される二重鎖内に配置され得る。SIDおよびUIDは、予め定義された配列を含み得るか、またはUIDは、ランダムな配列であり得る。
【0007】
いくつかの実施形態において、本発明は、核酸のライブラリーを作製する方法であり、その方法は、試料中の複数の二本鎖核酸に複数のアダプターを付着させることを含み、各アダプターは、5’部分および3’部分を有する第1の鎖(その5’部分は、第1の鎖の5’末端を含むループおよびステムを有するステムループ構造を形成し、3’部分は、第2の鎖に相補的な配列を含む);5’部分および3’部分を有する第2の鎖(その3’部分は、第2の鎖の伸長可能な3’末端を含むループおよびステムを有するステムループ構造を形成し、5’部分は、第1の鎖に相補的な配列を含む);ならびに第1の鎖の3’部分および第2の鎖の5’部分を介して二重鎖を形成する第1の鎖および第2の鎖を含む。アダプターは、第1の鎖の3’部分と第2の鎖の5’部分とによって形成される二重鎖を、二本鎖核酸の一方または両方の末端にライゲートすることによって付着され得る。いくつかの実施形態では、付着の前に、複数の核酸を前処理して、各核酸の一方または両方の末端に平滑末端を形成する。複数の核酸をさらに前処理して、各核酸の一方または両方の末端において1つ以上の非鋳型ヌクレオチドを一方の鎖に付加してもよい。いくつかの実施形態において、第1の鎖の3’部分と第2の鎖の5’部分とによって形成される二重鎖は、1つ以上のヌクレオチドの一本鎖オーバーハングを有する。アダプターは、試料バーコード(SID)および固有分子識別子バーコード(UID)などの1つ以上の分子バーコードを含み得る。いくつかの実施形態において、複数のアダプター内のUIDの数は、複数の核酸内の核酸の数を超え得る。いくつかの実施形態において、複数の核酸内の核酸の数は、複数のアダプター内のUIDの数を超える。
【0008】
いくつかの実施形態において、本発明は、試料中の核酸をシーケンシングする方法であり、その方法は、本明細書中に記載されるような核酸のライブラリーを形成すること、およびアダプターの第2の鎖の伸長可能な3’末端を伸長することを含む合成法によるシーケンシングによって核酸をシーケンシングすることを含む。合成によるシーケンシング方法は、ナノポアを用いた検出を含み得る。
【0009】
いくつかの実施形態において、本発明は、第1の鎖と、第1の鎖に相補的な第2の鎖と、2つの末端とを含む、シーケンシング反応において使用するためのコントロール核酸であり、その2つの末端のうちの少なくとも1つは、ステムループ構造を形成する3’-オーバーハングであって、そのオーバーハングの3’末端は、核酸ポリメラーゼによって伸長可能である、3’-オーバーハング、および伸長された3’末端による置換の際にステムループ構造を形成する5’末端を含む。3’末端または5’末端によって形成されるループのループ形成領域は、少なくとも4、5、6ヌクレオチド長かつ最大20またはそれを超えるヌクレオチド長である。
【0010】
いくつかの実施形態において、本発明は、核酸のライブラリーをシーケンシングする方法であり、その方法は、ライブラリーを本明細書中に記載されるコントロール核酸と接触させること、およびナノポアによる検出を含む方法によって核酸のライブラリーをシーケンシングすることを含む。
【図面の簡単な説明】
【0011】
図1図1は、2つのヘアピンループを有するシーケンシングアダプターの図である。
図2図2は、単一のヘアピンループを有するシーケンシングアダプターの図である。
【発明を実施するための形態】
【0012】
定義
別段定義されない限り、本明細書中で使用される専門用語および科学用語は、当業者が通常理解する意味と同じ意味を有する。Sambrook et al.,Molecular Cloning,A Laboratory Manual,4th Ed.Cold Spring Harbor Lab Press(2012)を参照のこと。
【0013】
以下の定義は、本開示の理解を容易にするために提供される。
【0014】
「アダプター」という用語は、別の配列に追加のエレメントおよび特性を付与するためにその配列に付加され得るヌクレオチド配列のことを指す。その追加のエレメントとしては、バーコード、プライマー結合部位、捕捉部分、標識、二次構造が挙げられるが、これらに限定されない。
【0015】
「バーコード」という用語は、検出および識別することができる核酸配列のことを指す。バーコードは、一般に、2ヌクレオチドまたはそれを超えるかつ最大約50ヌクレオチドの長さであり得る。バーコードは、集団中の他のバーコードと少なくとも最小数の違いを有するように設計される。バーコードは、試料中の各分子に固有であってもよいし、試料に固有であってもよく、試料中の複数の分子によって共有されてもよい。「多重識別子」、「MID」または「試料バーコード」という用語は、試料または試料の起源を識別するバーコードのことを指す。したがって、単一の起源または試料由来のすべてまたは実質的にすべてのMIDバーコード化ポリヌクレオチドは、同じ配列のMIDを共有し、異なる起源または試料由来のすべてまたは実質的にすべて(例えば、少なくとも90%または99%)のMIDバーコード化ポリヌクレオチドは、異なるMIDバーコード配列を有する。MIDバーコードにコードされた試料情報を維持しながら、異なるMIDを有する異なる起源からのポリヌクレオチドを混合し、並行してシーケンシングすることができる。「固有分子識別子」または「UID」という用語は、それが付着しているポリヌクレオチドを識別するバーコードのことを指す。典型的には、UIDバーコード化ポリヌクレオチドの混合物中のすべてまたは実質的にすべて(例えば、少なくとも90%または99%)のUIDバーコードが固有である。
【0016】
「DNAポリメラーゼ」という用語は、デオキシリボヌクレオチドからのポリヌクレオチドの鋳型指向合成を行う酵素のことを指す。DNAポリメラーゼとしては、原核生物のPol I、Pol II、Pol III、Pol IVおよびPol V、真核生物のDNAポリメラーゼ、古細菌のDNAポリメラーゼ、テロメラーゼならびに逆転写酵素が挙げられる。「熱安定性ポリメラーゼ」という用語は、熱に対して安定であり、耐熱性であり、かつ、その後のポリヌクレオチド伸長反応を行うのに十分な活性を保持するが、二本鎖核酸の変性をもたらすのに必要な時間にわたって高温に供されたとき、不可逆的に変性(不活性化)されない、酵素のことを指す。いくつかの実施形態では、以下の熱安定性ポリメラーゼを使用することができる:Thermococcus litoralis(Vent,GenBank:AAA72101)、Pyrococcus furiosus(Pfu,GenBank:D12983、BAA02362)、Pyrococcus woesii、Pyrococcus GB-D(Deep Vent,GenBank:AAA67131)、Thermococcus kodakaraensis KODI(KOD,GenBank:BD175553、BAA06142;Thermococcus sp.株KOD(Pfx,GenBank:AAE68738))、Thermococcus gorgonarius(Tgo,Pdb:4699806)、Sulfolobus solataricus(GenBank:NC002754,P26811)、Aeropyrum pernix(GenBank:BAA81109)、Archaeglobus fulgidus(GenBank:029753)、Pyrobaculum aerophilum(GenBank:AAL63952)、Pyrodictium occultum(GenBank:BAA07579、BAA07580)、Thermococcus 9 degree Nm(GenBank:AAA88769、Q56366)、Thermococcus fumicolans(GenBank:CAA93738、P74918)、Thermococcus hydrothermalis(GenBank:CAC18555)、Thermococcus sp.GE8(GenBank:CAC12850)、Thermococcus sp.JDF-3(GenBank:AX135456;WO0132887)、Thermococcus sp.TY(GenBank:CAA73475)、Pyrococcus abyssi(GenBank:P77916)、Pyrococcus glycovorans(GenBank:CAC12849)、Pyrococcus horikoshii(GenBank:NP 143776)、Pyrococcus sp.GE23(GenBank:CAA90887)、Pyrococcus sp.ST700(GenBank:CAC 12847)、Thermococcus pacificus(GenBank:AX411312.1)、Thermococcus zilligii(GenBank:DQ3366890)、Thermococcus aggregans、Thermococcus barossii、Thermococcus celer(GenBank:DD259850.1)、Thermococcus profundus(GenBank:E14137)、Thermococcus siculi(GenBank:DD259857.1)、Thermococcus thioreducens、Thermococcus onnurineus NA1、Sulfolobus acidocaldarium、Sulfolobus tokodaii、Pyrobaculum calidifontis、Pyrobaculum islandicum(GenBank:AAF27815)、Methanococcus jannaschii(GenBank:Q58295)、Desulforococcus種TOK、Desulfurococcus、Pyrolobus、Pyrodictium、Staphylothermus、Vulcanisaetta、Methanococcus(GenBank:P52025)および他の古細菌のBポリメラーゼ、例えば、GenBank AAC62712、P956901、BAAA07579))、好熱性細菌Thermus種(例えば、flavus、ruber、thermophilus、lacteus、rubens、aquaticus)、Bacillus stearothermophilus、Thermotoga maritima、Methanothermus fervidus、KODポリメラーゼ、TNA1ポリメラーゼ、Thermococcus sp.9 degreeのN-7、T4、T7、phi29、Pyrococcus furiosus、P.abyssi、T.gorgonarius、T.litoralis、T.zilligii、T.sp.GT、P.sp.GB-D、KOD、Pfu、T.gorgonarius、T.zilligii、T.litoralisおよびThermococcus sp.9N-7ポリメラーゼ。いくつかの場合において、核酸(例えば、DNAまたはRNA)ポリメラーゼは、改変された天然に存在するA型ポリメラーゼであり得る。本発明のさらなる実施形態は、例えばプライマー伸長、末端修飾(例えば、ターミナルトランスフェラーゼ、分解または研磨(polishing))または増幅反応における、改変されたA型ポリメラーゼが、Meiothermus属、Thermotoga属またはThermomicrobium属の任意の種から選択され得る方法に広く関する。本発明の別の実施形態は、ポリメラーゼが、例えばプライマー伸長、末端修飾(例えば、ターミナルトランスフェラーゼ、分解または研磨)または増幅反応において、Thermus aquaticus(Taq)、Thermus thermophilus、Thermus caldophilusまたはThermus filiformisのいずれかから単離され得る方法に広く関する。本発明のさらなる実施形態は、改変されたA型ポリメラーゼが、例えば、プライマー伸長、末端修飾(例えば、ターミナルトランスフェラーゼ、分解または研磨)または増幅反応において、Bacillus stearothermophilus、Sphaerobacter thermophilus、Dictoglomus thermophilumまたはEscherichia coliから単離され得る方法を広く包含する。別の実施形態において、本発明は、改変されたA型ポリメラーゼが、例えば、プライマー伸長、末端修飾(例えば、ターミナルトランスフェラーゼ、分解または研磨)または増幅反応において、変異Taq-E507Kポリメラーゼであり得る方法に広く関する。本発明の別の実施形態は、熱安定性ポリメラーゼを使用して標的核酸の増幅を行い得る方法に広く関する。
【0017】
「ヘアピン」という用語は、少なくとも1つの二本鎖領域(「ステム」)を含む核酸の一本鎖によって形成された二次構造のことを指し、ステムを形成する領域は、一本鎖領域の「ループ」によって中断されている。ステム領域およびループ領域のサイズまたは相対サイズは規定されていない。
【0018】
「核酸」または「ポリヌクレオチド」という用語は、一本鎖または二本鎖の形態のデオキシリボ核酸(DNA)またはリボ核酸(RNA)およびそれらのポリマーのことを指す。具体的に限定されない限り、この用語は、参照核酸と同様の結合特性を有し、天然に存在するヌクレオチドと同様の様式で代謝される、天然ヌクレオチドの既知のアナログを含む核酸を包含する。別段示されない限り、特定の核酸配列はまた、それらの保存的に改変されたバリアント(例えば、縮重コドン置換体)、対立遺伝子、オルソログ、SNPおよび相補的配列、ならびに明示的に示された配列を暗黙的に包含する。
【0019】
「プライマー」という用語は、一本鎖鋳型核酸分子の特定の領域に結合し、ポリメラーゼ媒介性酵素反応を介して核酸合成を開始するオリゴヌクレオチドのことを指す。典型的には、プライマーは、約100個未満のヌクレオチドを含み、好ましくは、約30個未満のヌクレオチドを含む。標的特異的プライマーは、ハイブリダイゼーション条件下において標的ポリヌクレオチドに特異的にハイブリダイズする。そのようなハイブリダイゼーション条件としては、約40℃~約70℃の温度の等温増幅緩衝液(20mM Tris-HCl、10mM(NHSO)、50mM KCl、2mM MgSO、0.1% TWEEN(登録商標)20,pH8.8、25℃)におけるハイブリダイゼーションが挙げられ得るが、これらに限定されない。プライマーは、標的結合領域に加えて、典型的には5’部分に追加の領域を有し得る。その追加の領域は、ユニバーサルプライマー結合部位またはバーコードを含み得る。
【0020】
「試料」という用語は、典型的にはDNAまたはRNAを含む核酸分子を含む任意の生物学的試料のことを指す。試料は、組織、細胞もしくはそれらの抽出物であり得るか、または核酸分子の精製試料であり得る。「試料」という用語は、標的核酸を含むまたは含むと推定される任意の組成物のことを指す。「試料」という用語の使用は、試料中に存在する核酸分子に標的配列が存在することを必ずしも意味しない。試料は、個体から単離された組織または流体の検体、例えば、皮膚、血漿、血清、髄液、リンパ液、滑液、尿、涙、血液細胞、器官および腫瘍、ならびにホルマリン固定されたパラフィン包埋組織(FFPET)およびそこから単離された核酸を含む、個体から採取された細胞から確立されたインビトロ培養物の試料であり得る。試料には、セルフリーDNA(cfDNA)または循環腫瘍DNA(ctDNA)を含む無細胞血液画分などの無細胞材料も含まれ得る。試料は、非ヒト対象または環境から収集され得る。
【0021】
「標的」または「標的核酸」という用語は、試料中の目的の核酸のことを指す。試料は、複数の標的ならびに複数コピーの各標的を含み得る。
【0022】
「ユニバーサルプライマー」という用語は、ユニバーサルプライマー結合部位にハイブリダイズすることができるプライマーのことを指す。ユニバーサルプライマー結合部位は、典型的には標的特異的でない様式で標的配列に付加される天然または人工の配列であり得る。
【0023】
生物学的ナノポアまたは固体ナノポアを使用した核酸のシーケンシングは、急速に発展している分野であり、多くの技術的解決策が利用可能になりつつある(Ameur,et al.(2019)Single molecule sequencing:towards clinical applications,Trends Biotech.,37:72を参照のこと。ナノポアシーケンシングに伴う共通の問題の1つは、核酸がポアを通る移動(貫通)のコントロールである。いくつかのワークフローは、核酸が開口部を通って動く速度を単にコントロールすることを含む。解決策としては、ヘリカーゼ(米国特許出願公開第20180201993号)または磁性粒子(米国特許出願公開第20190317040号)を使用して移動速度を減速または制御することが挙げられる。何らかの構造、例えば、「スピードバンプ」相補的オリゴヌクレオチド(米国特許第10400278号)が、ポアに接続され得る。他の構造、例えば、ポア複合体内の「ブレーキ」タンパク質(米国特許第10131944号)と相互作用する鋳型に付着したtRNA構造、またはシーケンシングプライマー上に存在するヘアピン(米国特許第9605309号)が、鋳型分子に付着される。
【0024】
一部のナノポアシーケンシング技術は、ナノポアを通る鎖の移動を必要としない。そのような技術では、移動(貫通)を完全に防止することが望ましい。本発明は、ナノポアを通る移動のコントロールと防止の両方に適している。
【0025】
シーケンシングされる鎖の移動をコントロールすることに加えて、二本鎖鋳型の場合の相補鎖の廃棄が別の問題である。二本鎖核酸鋳型が、合成によるシーケンシング(SBS)反応中にほどけるとき、ナノポアシーケンシングの貫通実施形態と非貫通実施形態の両方において、シーケンシングされない鎖は、ナノポアを貫通しないようにしなければならない。
【0026】
本発明は、シーケンシング用の核酸鋳型およびシーケンシング用の核酸鋳型のライブラリーの形成に関する方法および組成物を含む。その鋳型およびライブラリーは、いずれのシーケンシング方法にも適しているが、ナノポアシーケンシングに対して特別な利点がある。
【0027】
1つの実施形態において、本発明は、シーケンシングされる核酸へのライゲーションのための二本鎖部分を含む新規アダプターである。そのアダプターは、二本鎖部分の反対側の末端に少なくとも1つのステムループ構造またはヘアピン構造という新規の特徴をさらに含む。いくつかの実施形態において、アダプターは、単一のステムループ構造を有する。他の実施形態において、アダプターは、2つのステムループ構造を有する。アダプターは、プライマー、例えば、シーケンシングプライマーまたは増幅プライマーとして働くことができる伸長可能な3’末端を保持する。アダプターは、例えば、適合核酸の分離または精製のための、バーコード、プライマー結合部位または捕捉部分を含むシーケンシングアダプターにおいて有用な特徴のいずれかを含み得る。例えば、アダプターの二本鎖部分は、適合核酸を固有にマークする固有分子バーコード(UID)、または試料中のすべての核酸を同じ起源に由来するものとして同一にマークする多重化試料バーコード(SID)もしくは(MID)を含み得る。アダプターは、適合核酸を捕捉し、それらを非適合核酸から分離するための捕捉部分、例えば、ビオチンを含み得る。アダプターの特別な利点は、適合核酸内の各鎖の少なくとも1つの末端によって形成されるステムループ構造またはヘアピン構造である。ループのサイズは、シーケンシング中にナノポアを通る鎖の移動を阻害または防止するのに十分なサイズである。使用されるナノポアに応じて、移動を防止または阻害するのに十分なサイズのループを形成するために、ループ形成配列の長さは、4、5、6および最大20またはそれを超えるヌクレオチドであり得る。当業者は、ナノポア形成タンパク質の配列および二次、三次または四次構造を実験的または経験的に知っているので、ループ形成配列の長さを決定することができる。
【0028】
1つの実施形態において、本発明は、シーケンシング用の適合核酸のライブラリーを作製する方法である。新規アダプターは、各試料核酸の一方または両方の末端に付着されている。ライブラリーは、未使用アダプターおよび非適合試料核酸から精製または分離され得る。
【0029】
なおも別の実施形態において、本発明は、試料核酸のライブラリーをシーケンシングするためのコントロール分子である。このコントロール分子は、本明細書中に記載される新規構造を有する末端を有する。特に、このコントロール核酸分子は、第1の鎖と、第1の鎖に相補的な第2の鎖とを含む。このコントロール分子は、2つの末端をさらに含み、その2つの末端のうちの少なくとも1つは、ステムループ構造を形成する3’-オーバーハングであって、そのオーバーハングの3’末端が核酸ポリメラーゼによって伸長可能である、3’-オーバーハングと、伸長された3’末端による置換の際にステムループ構造も形成する陥凹5’末端とを含む。両方の鎖のステムループ構造のループのサイズは、シーケンシング中にナノポアを通る鎖の移動を阻害または防止するのに十分なサイズである。
【0030】
本発明は、試料中の標的核酸の単離とシーケンシングとを同時に行うことを含む。いくつかの実施形態において、試料は、対象または患者に由来する。いくつかの実施形態において、試料は、例えば、生検によって、対象または患者に由来する固形組織または固形腫瘍の断片を含み得る。試料は、体液(例えば、尿、痰、血清、血漿もしくはリンパ、唾液、痰、汗、涙、脳脊髄液、羊水、滑液、心膜液、腹水、胸膜液、嚢胞液、胆汁、胃液、腸液または糞便試料)も含み得る。試料は、正常細胞または腫瘍細胞が存在し得る全血または血液画分を含み得る。いくつかの実施形態において、試料、特に液体試料は、セルフリー腫瘍DNAまたはセルフリー腫瘍RNAを含むセルフリーDNAまたはセルフリーRNAなどの無細胞材料を含み得る。いくつかの実施形態において、試料は、無細胞試料、例えば、セルフリー腫瘍DNAまたはセルフリー腫瘍RNAが存在する無細胞の血液由来試料である。他の実施形態において、試料は、培養試料、例えば、培養物中の細胞または培養物中に存在する感染病原体に由来する核酸を含むかまたは含むと疑われる培養物または培養上清である。いくつかの実施形態において、感染病原体は、細菌、原生動物、ウイルスまたはマイコプラズマである。
【0031】
標的核酸は、試料中に存在し得る目的の核酸である。各標的は、その核酸配列によって特徴付けられる。本発明は、1つ以上のRNA標的またはDNA標的の検出を可能にする。いくつかの実施形態において、DNA標的核酸は、遺伝子または遺伝子断片(エクソンおよびイントロンを含む)または遺伝子間領域であり、RNA標的核酸は、標的特異的プライマーがハイブリダイズする転写物または転写物の一部分である。いくつかの実施形態において、標的核酸は、遺伝子バリアントの遺伝子座、例えば、単一ヌクレオチド多型もしくは単一ヌクレオチドバリアント(SNPまたはSNV)を含む多型、または例えば遺伝子融合をもたらす遺伝子再配列を含む。いくつかの実施形態において、標的核酸は、バイオマーカー、すなわち、そのバリアントが疾患または症状に関連する遺伝子を含む。例えば、標的核酸は、2015年9月10日に出願された米国特許出願第14/774,518号に記載されている疾患関連マーカーのパネルから選択され得る。そのようなパネルは、AVENIO ctDNA Analysis(キットRoche Sequencing Solutions,Pleasanton,Cal.)として入手可能である。他の実施形態において、標的核酸は、特定の生物に特徴的であり、その生物または薬物感受性もしくは薬物耐性などの病原性生物の特徴の特定を助ける。なおも他の実施形態において、標的核酸は、ヒト対象の固有の特徴、例えば、対象の固有のHLAまたはKIR遺伝子型を規定するHLAまたはKIR配列の組み合わせである。なおも他の実施形態において、標的核酸は、免疫グロブリン(IgG、IgMおよびIgA免疫グロブリンを含む)またはT細胞受容体配列(TCR)に相当する再編成された免疫配列などの体細胞配列である。なおも別の適用において、標的は、胎児の疾患もしくは状態または妊娠に関連する母体の状態に特徴的な胎児配列を含む、母体血液中に存在する胎児配列である。
【0032】
いくつかの実施形態において、標的核酸は、RNA(mRNA、マイクロRNA、ウイルスRNAを含む)である。他の実施形態において、標的核酸は、細胞DNAを含むDNA、または循環腫瘍DNA(ctDNA)を含むセルフリーDNA(cfDNA)である。標的核酸は、短い形態で存在してもよいし、長い形態で存在してもよい。より長い標的核酸は、断片化されてもよい。いくつかの実施形態において、標的核酸は、天然に断片化されており、例えば、循環セルフリーDNA(cfDNA)または化学的に保存された試料もしくは古い試料に見られるものなどの化学的に分解されたDNAを含む。
【0033】
いくつかの実施形態において、本発明は、核酸単離の工程を含む。一般に、DNAまたはRNAを含む単離された核酸を生じる任意の核酸抽出方法が使用され得る。ゲノムDNAまたはRNAは、溶液ベースまたは固相ベースの核酸抽出法を用いて、組織、細胞、液体生検試料(血液または血漿試料を含む)から抽出され得る。核酸抽出には、洗浄剤ベースの細胞溶解、核タンパク質の変性、および任意に夾雑物の除去が含まれ得る。保存された試料からの核酸の抽出は、脱パラフィンの工程をさらに含み得る。溶液ベースの核酸抽出方法は、塩析法または有機溶媒法もしくはカオトロープ法を含み得る。固相核酸抽出方法としては、シリカ樹脂法、陰イオン交換法または磁性ガラス粒子および常磁性ビーズ(KAPA Pure Beads,Roche Sequencing Solutions,Pleasanton,Cal.)もしくはAMPureビーズ(Beckman Coulter,Brea,Cal.)が挙げられ得るが、これらに限定されない。
【0034】
典型的な抽出方法は、試料中に存在する組織材料および細胞の溶解を含む。溶解された細胞から放出された核酸は、溶液中またはカラム中、または膜中に存在する固体支持体(ビーズまたは粒子)に結合され得、その核酸は、タンパク質、脂質およびそれらの断片を含む夾雑物を試料から除去する1つ以上の洗浄工程を受け得る。最後に、結合した核酸は、固体支持体、カラムまたは膜から放出され、さらなる処理の準備が整うまで適切な緩衝液中に保存され得る。DNAとRNAの両方を単離しなければならないので、ヌクレアーゼを使用してはならず、精製プロセス中にヌクレアーゼ活性を阻害するように注意すべきである。
【0035】
いくつかの実施形態において、投入DNAまたは投入RNAは、断片化を必要とする。そのような実施形態では、RNAは、熱と金属イオン、例えばマグネシウムとの組み合わせによって断片化され得る。いくつかの実施形態では、試料をマグネシウムの存在下において1~6分間、85°~94℃に加熱する。(KAPA RNA HyperPrep Kit,KAPA Biosystems,Wilmington,Mass)。DNAは、利用可能な機器(Covaris,Woburn.Mass.)を使用した物理的手段、例えば超音波処理、または酵素的手段(KAPA Fragmentase Kit,KAPA Biosystems)によって断片化され得る。
【0036】
いくつかの実施形態において、単離された核酸は、DNA修復酵素で処理される。いくつかの実施形態において、DNA修復酵素は、5’-3’ポリメラーゼ活性および3’-5’一本鎖エキソヌクレアーゼ活性を有するDNAポリメラーゼ、dsDNA分子に5’リン酸を付加するポリヌクレオチドキナーゼ、ならびにdsDNA分子の3’末端に単一のdA塩基を付加するDNAポリメラーゼを含む。末端修復/Aテール化キット、例えば、KAPA Hyper PrepおよびKAPA HyperPlus(Kapa Biosystems,Wilmington,Mass.)を含むKapa Library Preparationキットが利用可能である。
【0037】
いくつかの実施形態において、DNA修復酵素は、単離された核酸内の損傷塩基を標的とする。いくつかの実施形態において、試料核酸は、保存された試料、例えば、ホルマリン固定パラフィン包埋(FFPET)試料からの部分的に損傷したDNAである。塩基の脱アミノ化および酸化は、シーケンシングプロセス中に誤った塩基の読み取りをもたらし得る。いくつかの実施形態において、損傷したDNAは、ウラシルN-DNAグリコシラーゼ(UNG/UDG)および/または8-オキソグアニンDNAグリコシラーゼで処理される。
【0038】
いくつかの実施形態において、本発明は、増幅工程を含む。単離された核酸は、さらなる処理の前に増幅され得る。この工程は、線形増幅または指数関数的増幅を含み得る。増幅は、等温であってもよいし、サーモサイクリングを含んでもよい。いくつかの実施形態において、増幅は、指数関数的であり、PCRを含む。いくつかの実施形態では、増幅のために遺伝子特異的プライマーを使用する。他の実施形態では、例えば、ユニバーサルプライマー結合部位を含むアダプターをライゲートすることによって、ユニバーサルプライマー結合部位が標的核酸に付加される。すべてのアダプターライゲート核酸が、同じユニバーサルプライマー結合部位を有し、同じプライマーセットを用いて増幅され得る。ユニバーサルプライマーが使用される増幅サイクルの数は、少なくてもよいが、その後の工程に必要な産物の量に応じて、10、20もしくは約30またはそれを超えるもの多さのサイクルであってもよい。ユニバーサルプライマーを用いたPCRは、配列バイアスが低減されているので、増幅バイアスを回避するために増幅サイクルの数を制限する必要はない。
【0039】
いくつかの実施形態において、本発明は、本明細書中に記載される構造を有する2本の鎖から構成されるアダプター核酸を利用する。いくつかの実施形態において、アダプター分子は、インビトロで合成された人工配列である。他の実施形態において、アダプター分子は、インビトロで合成された天然に存在する配列である。なおも他の実施形態において、アダプター分子は、単離された天然に存在する分子または単離された天然に存在しない分子である。
【0040】
ヘアピンアダプターの二本鎖末端は、二本鎖核酸分子にライゲートされ得る。アダプターは、二本鎖分子の一方または両方の末端においてライゲートされ得る。
【0041】
アダプターオリゴヌクレオチドは、標的核酸にライゲートされる末端にオーバーハングまたは平滑末端を有し得る。いくつかの実施形態において、本明細書中に記載される新規アダプターは、標的核酸の平滑末端ライゲーションが適用され得る平滑末端を含む。標的核酸は、平滑末端化され得るか、または酵素処理(例えば「末端修復」)によって平滑末端にされ得る。他の実施形態において、平滑末端化されたDNAは、単一のAヌクレオチドが一方または両方の平滑末端の3’末端に付加されるAテール化を受ける。本明細書中に記載されるアダプターは、核酸とアダプターとの間のライゲーションを容易にするために平滑末端から単一のTヌクレオチドが伸びているように作製される。アダプターライゲーションを行うための商業的に入手可能なキットとしては、AVENIO ctDNA Library Prep KitまたはKAPA HyperPrepキットおよびHyperPlusキット(Roche Sequencing Solutions,Pleasanton,CA)が挙げられる。いくつかの実施形態において、アダプターライゲートDNAは、過剰なアダプターおよびライゲートしなかったDNAから分離され得る。
【0042】
いくつかの実施形態において、アダプターは、追加の特徴、例えば、バーコード、増幅プライマー結合部位またはシーケンシングプライマー結合部位を含む。
【0043】
図1は、目的の核酸にライゲートされた新規アダプターを図示している。図1を参照すると、アダプターは、第1の鎖(上部の鎖、「アダプターオリゴ1」)および第2の鎖(下部の鎖、「アダプターオリゴ2」)を含む。アダプターは、第1のアダプター鎖と第2のアダプター鎖(「アダプターオリゴ」)との間のハイブリダイゼーションの二本鎖領域を含む。この領域が、標的核酸(「ライブラリーインサート」)にライゲートすることができる。各鎖は、ステムおよびループを有するヘアピン領域も含む。図1に図示されるアダプターを参照して、アダプターは、標的核酸に、一方の末端ならびにライゲートしていない残りの1つの5’末端およびライゲートしていない残りの1つの3’末端において標的核酸にライゲートされる。第1(上部)の鎖は、上部のステムループ構造の二本鎖ステム部分にある伸長不可能な5’末端を含む。第2(下部)の鎖は、3’末端を含む。その3’末端は、下部のステムループ構造の二本鎖ステム部分にある。その3’末端は、伸長可能であり、別個のプライマーを必要とせずに標的核酸の下部の鎖をコピーするためにプライマーとして働くことができる。この実施形態において、アダプターの3’末端は、自己プライミング領域である。この自己プライミング領域は、シーケンシングプライマーまたは増幅プライマーとして作用する。
【0044】
いくつかの実施形態において、アダプターライゲート核酸は、アダプターのライゲーション後にシーケンシングされる。他の実施形態において、アダプターライゲート標的核酸は、シーケンシングの前に増幅される。コピー鎖の各々は、図1に示されるダブルヘアピン構造としてフォールディングすることができるアダプター配列を含む。ループのサイズは、シーケンシング中にいずれかの鎖がナノポアを通る移動を阻害または防止するのに十分なサイズである。ループ形成領域の長さは、シーケンシングに使用されるナノポアに応じて、少なくとも3、4、5、6ヌクレオチド長かつ最大20またはそれを超えるヌクレオチド長であるように設計され得る。
【0045】
図2は、目的の核酸にライゲートされた新規アダプターの異なる実施形態を図示している。図2を参照すると、アダプターは、第1の鎖(上部の鎖、「アダプターオリゴ1」)および第2の鎖(下部の鎖、「アダプターオリゴ2」)を含む。アダプターは、第1のアダプター鎖と第2のアダプター鎖(「アダプターオリゴ」)との間のハイブリダイゼーションの二本鎖領域を含む。この領域が、標的核酸(「ライブラリーインサート」)にライゲートすることができる。第1(上部)の鎖は、ステムおよびループを有するヘアピン領域を含む。第2(下部)の鎖は、捕捉部分を含む。図2に示される実施形態において、捕捉部分は、下部のアダプター鎖の3’末端にハイブリダイズした第3のオリゴヌクレオチドに存在する。
【0046】
捕捉部分は、別の捕捉分子と特異的に相互作用することができる任意の部分であり得る。捕捉部分-捕捉分子対には、アビジン(ストレプトアビジン)-ビオチン、抗原-抗体、磁性(常磁性)粒子-磁石、またはオリゴヌクレオチド-相補的オリゴヌクレオチドが含まれる。捕捉部分が存在する任意の核酸が、固体支持体上に捕捉され、試料または反応混合物の残りから分離されるように、捕捉分子は、固体支持体に結合され得る。いくつかの実施形態において、捕捉分子は、2次捕捉分子に対する捕捉部分を含む。例えば、捕捉部分は、捕捉オリゴヌクレオチド(捕捉分子)に相補的なオリゴヌクレオチドであり得る。その捕捉オリゴヌクレオチドは、ビオチン化され得、ストレプトアビジンビーズ上に捕捉され得る。
【0047】
いくつかの実施形態では、捕捉部分を捕捉し、試料中のライゲートされていない核酸から、アダプターにライゲートした標的核酸を分離することによって、アダプターにライゲートした核酸が濃縮される。
【0048】
いくつかの実施形態において、下部のアダプター鎖の3’末端にハイブリダイズした第3のオリゴヌクレオチド(図2)は、シーケンシングプライマーまたは増幅プライマーとして働く。いくつかの実施形態において、第3のオリゴヌクレオチドの伸長産物は、捕捉部分を介して捕捉される。伸長産物の捕捉により、伸長産物が、ライゲートされていない試料核酸から、および任意に、捕捉部分を有しない標的核酸鎖から、分離される。
【0049】
いくつかの実施形態において、アダプターのステム部分としては、捕捉オリゴヌクレオチドの融解温度を上昇させる修飾ヌクレオチド、例えば、5-メチルシトシン、2,6-ジアミノプリン、5-ヒドロキシブチニル-2’-デオキシウリジン、8-アザ-7-デアザグアノシン、リボヌクレオチド、2’O-メチルリボヌクレオチドまたはロック核酸が挙げられる。別の態様において、捕捉オリゴヌクレオチドは、ヌクレアーゼによる消化、例えば、ホスホロチオエートヌクレオチドによる消化を阻害するように修飾される。
【0050】
いくつかの実施形態において、本発明は、例えば本明細書中に記載される新規アダプターをライゲートする前に、増幅工程を含む。プライマーは、標的特異的であり得る。標的特異的プライマーは、標的に相補的な少なくとも一部を含む。バーコードまたは第2のプライマー結合部位などの追加の配列が存在する場合、それらは、通常、プライマーの5’部分に配置される。標的は、遺伝子配列(コードまたは非コード)であり得るか、またはRNAに存在する制御配列、例えば、エンハンサーもしくはプロモーターであり得る。標的は、遺伝子間配列でもあり得る。他の実施形態において、プライマーは、ユニバーサルプライマーであり、例えば、標的配列を問わず試料中のすべての核酸を増幅することができる。ユニバーサルプライマーは、ユニバーサルプライマー結合部位を有するプライマーを伸長することによって、またはアダプター(本明細書中に記載される新規構造を有するアダプターを含む)をライゲートすることによって、試料中の核酸に付加されたユニバーサルプライマー結合部位にアニールする。
【0051】
いくつかの実施形態において、本発明は、バーコードを利用する。個々の分子の検出は通常、米国特許第7,393,665号、同第8,168,385号、同第8,481,292号、同第8,685,678号および同第8,722,368号に記載されているものなどの分子バーコードを必要とする。固有分子バーコードは、通常インビトロ操作の最初の工程の間に患者の試料中の各分子に付加される、短い人工配列である。バーコードは、当該分子とその子孫をマークする。固有分子バーコード(UID)には、複数の用途がある。バーコードは、生検なしでがんを検出およびモニターするために、試料中の個々の各核酸分子を追跡して、例えば、患者の血液中の循環腫瘍DNA(ctDNA)分子の存在および量を評価することを可能にする(Newman,A.,et al.,(2014)An ultrasensitive method for quantitating circulating tumor DNA with broad patient coverage,Nature Medicine doi:10.1038/nm.3519)。
【0052】
試料が混合(多重化)される場合、バーコードは、試料の起源を識別するために使用される多重試料ID(MID)であり得る。バーコードは、元の各分子およびその子孫を識別するために使用される固有分子ID(UID)としても働き得る。バーコードはまた、UIDとMIDとの組み合わせであってもよい。いくつかの実施形態において、単一のバーコードが、UIDとMIDの両方として使用される。いくつかの実施形態において、各バーコードは、予め定義された配列を含む。他の実施形態では、バーコードは、ランダム配列を含む。本発明のいくつかの実施形態において、バーコードは、約4~20塩基長であり、その結果、96~384個の異なるアダプター(各々が、同一バーコードの異なる対を有する)が、ヒトゲノム試料に付加される。当業者であれば、バーコードの数が試料の複雑さ(すなわち、固有の標的分子の予想数)に依存し、各実験に適した数のバーコードを作製することができ得ることを認識するだろう。
【0053】
固有分子バーコードは、分子の計数およびシーケンシングのエラー訂正にも使用され得る。単一の標的分子の子孫全体が同じバーコードでマークされ、バーコード化されたファミリーを形成する。バーコード化されたファミリーの全メンバーに共有されていない配列のばらつきは、アーチファクトとして廃棄され、これは真の変異ではない。ファミリー全体が、元の試料中の単一分子を表すので(Newman,A.,et al.,(2016)Integrated digital error suppression for improved detection of circulating tumor DNA,Nature Biotechnology 34:547)、バーコードは、位置重複排除(positional deduplication)および標的定量にも使用され得る。
【0054】
いくつかの実施形態において、複数のアダプター内のUIDの数は、複数の核酸内の核酸の数を超え得る。いくつかの実施形態において、複数の核酸内の核酸の数は、複数のアダプター内のUIDの数を超える。
【0055】
いくつかの実施形態において、本発明は、本明細書中に記載されるように形成された標的核酸のライブラリーである。ライブラリーは、元の試料中に存在する核酸標的を含む二本鎖核酸分子を含む。ライブラリーの核酸分子は、標的核酸配列の一方または両方の末端に、本明細書中に記載される新規アダプターをさらに含む。ライブラリー核酸は、バーコードおよびプライマー結合部位などの追加のエレメントを含み得る。いくつかの実施形態において、追加のエレメントは、アダプターに存在し、アダプターのライゲーションを介してライブラリー核酸に付加される。他の実施形態において、追加のエレメントの一部または全部が、増幅プライマーに存在し、プライマーの伸長によって、アダプターのライゲーションの前にライブラリー核酸に付加される。増幅は、線形(ただ1回の伸長を含む)であり得るか、または指数関数的、例えば、ポリメラーゼ連鎖反応(PCR)であり得る。いくつかの実施形態において、いくつかの追加のエレメントは、プライマー伸長によって付加され、残りの追加のエレメントは、アダプターのライゲーションによって付加される。
【0056】
シーケンシングされる核酸のライブラリーに追加のエレメントを導入するためのアダプターおよび増幅プライマーの有用性は、例えば、米国特許第9476095号、同第9260753号、同第8822150号、同第8563478号、同第7741463号、同第8182989号および同第8053192号に記載されている。
【0057】
いくつかの実施形態において、本発明は、所望の標的核酸を濃縮する工程をさらに含む。所望の核酸は、本明細書中に記載される新規のライブラリー形成方法に従ってライブラリーを形成する前に濃縮され得る。あるいは、濃縮は、ライブラリーが形成された後に、すなわちライブラリーの分子に対して行うことができる。
【0058】
いくつかの実施形態において、本方法は、標的特異的オリゴヌクレオチドプローブ(例えば、捕捉プローブ)のプールを利用する。濃縮は、サブトラクションによるものであり得、この場合、捕捉プローブは、リボソームRNA(rRNA)または豊富に発現される遺伝子(例えば、グロビン)をはじめとする望まれない豊富な配列に相補的である。サブトラクションの場合、望まれない配列は、捕捉プローブによって捕捉され、標的核酸の混合物または核酸のライブラリーから除去され、廃棄される。例えば、捕捉プローブは、固体支持体上に捕捉され得る結合部分を含み得る。
【0059】
他の実施形態において、濃縮は、捕捉および保持であり、この場合、捕捉プローブは、1つ以上の標的配列に相補的である。この場合、標的配列は、捕捉プローブによって標的核酸の混合物または核酸のライブラリーから捕捉され、保持される一方で、残りの溶液は廃棄される。
【0060】
濃縮の場合、捕捉プローブは、溶液中に遊離していてもよいし、固体支持体に固定されていてもよい。プローブは、例えば、米国特許第9,790,543号に記載されている方法によって作製および増幅され得る。プローブはまた、結合部分(例えば、ビオチン)を含み得、固体支持体(例えば、アビジンまたはストレプトアビジンを含む支持材料)上に捕捉されることができ得る。
【0061】
いくつかの実施形態において、本発明は、中間の精製工程を含む。例えば、過剰なプライマーおよび過剰なアダプターなどの任意の未使用のオリゴヌクレオチドを、例えば、ゲル電気泳動、アフィニティークロマトグラフィおよびサイズ排除クロマトグラフィから選択されるサイズ選択法によって除去する。いくつかの実施形態において、サイズ選択は、Beckman Coulter(Brea,Cal.)による固相可逆固定化(SPRI)技術を用いて行われ得る。いくつかの実施形態では、捕捉部分(図2)を使用して、アダプターにライゲートした核酸を、ライゲートしていない核酸から、またはプライマー伸長産物を鋳型鎖から捕捉および分離する。
【0062】
本明細書中に記載されるように形成された核酸および核酸のライブラリーまたはそれらのアンプリコンは、核酸シーケンシングに供され得る。シーケンシングは、当該分野で公知の任意の方法によって行われ得る。特に有利なのは、ナノポアを利用したハイスループット単分子シーケンシング方法である。いくつかの実施形態において、本明細書中に記載されるように形成された核酸および核酸のライブラリーは、生物学的ナノポア(米国特許第10337060号)または固体ナノポア(米国特許第10288599号、米国特許出願公開第20180038001号、米国特許第10364507号)を通り抜けることを含む方法によってシーケンシングされる。他の実施形態において、シーケンシングは、タグをナノポアに通すこと(米国特許第8461854号)またはナノポアを利用した他の任意の現在既存のもしくは将来のDNAシーケンシング技術を含む。
【0063】
いくつかの実施形態において、シーケンシング工程は、配列の解析を含む。いくつかの実施形態において、その解析は、配列アラインメントの工程を含む。いくつかの実施形態では、アラインメントを用いることにより、複数の配列、例えば、同じバーコード(UID)を有する複数の配列からコンセンサス配列が決定される。いくつかの実施形態では、バーコード(UID)を用いることにより、すべてが同一のバーコード(UID)を有する複数の配列からコンセンサスが決定される。他の実施形態では、バーコード(UID)を用いることにより、アーチファクト、すなわち、いくつかの配列が同一のバーコード(UID)を有するがすべてが有するわけではない配列に存在するばらつきが排除される。PCRのエラーまたはシーケンシングのエラーから生じるこのようなアーチファクトが、排除され得る。
【0064】
いくつかの実施形態において、試料中の各配列の数は、試料中の各バーコード(UID)を有する配列の相対数を定量することによって定量され得る。各UIDは、元の試料中の単一の分子を表し、各配列バリアントに関連する異なるUIDを計数することによって、元の試料中の各配列の割合を決定することができる。当業者は、コンセンサス配列を決定するために必要な配列リードの数を決定することができる。いくつかの実施形態において、妥当な数は、正確な定量結果のために必要なUID1つあたりのリード数(「配列深度(sequence depth)」)である。いくつかの実施形態において、所望の深度は、UID1つあたり5~50個のリードである。
【実施例
【0065】
実施例1.核酸シーケンシング用の新規アダプター
【0066】
シーケンシングアダプターは、それらが部分的に二本鎖のアダプターを形成することを可能にする相補的部分を有する2つのオリゴヌクレオチド(アダプターオリゴ1およびアダプターオリゴ2)から構成される。アダプターオリゴ1は、シーケンシング反応条件下において分子内ステムループ構造を形成するシーケンシングされたDNAを5’末端にさらに含む。置換された5’末端がシーケンシングナノポアを通り抜ける可能性を最小限に抑えるために、DNAの長さおよび配列組成によってループ構造のサイズを調整することができる。アダプターオリゴ2は、核酸ポリメラーゼが結合するための3’末端および遊離3’末端にステムループ形成構造も含む。この3;末端は、増幅またはシーケンシング中に伸長され、アダプターオリゴ1にライゲートした鎖は、最終的にシーケンシングまたは増幅ポリメラーゼによって置換され、5’末端ループは、置換鎖がシーケンシングナノポアを通り抜けるのを制限する。
【0067】
実施例2.ナノポアシーケンシング用のコントロール核酸の形成
【0068】
まず、所望のエンドヌクレアーゼ部位、DNAプライマーアニーリング部位および自己相補的末端配列を含むDNAインサートをプラスミドベクターにクローニングする。そのプラスミドを宿主細菌内で増殖させ;プラスミドを抽出し、精製する。次いで、そのプラスミドを線状化するために、平滑末端の切断をもたらすエンドヌクレアーゼ、例えばPmeIでプラスミドを消化する。線状化されたプラスミドをニッキングエンドヌクレアーゼ、例えばNt.BbvCIでさらに消化することにより、線状化プラスミドの5末端に短い切断された一本鎖断片が提供される。プラスミドをさらに変性させ、切断された断片に相補的なオリゴの存在下において冷却する。切断された断片は、その相補的なオリゴにハイブリダイズする。その相補的なオリゴは、ストレプトアビジンビーズ精製を用いて、ハイブリダイズされた切断断片の除去を可能にするために、ビオチン標識され得る。プラスミドの5’末端の切断により、DNAのシーケンシング中に一本鎖末端がナノポアを通り抜けるのを防止するヘアピン(ステムループ)などの二次構造を3’末端が形成することが可能になる。プラスミドの新生5’末端は、3’末端の一本鎖領域にアニールされたプライマーオリゴのポリメラーゼ伸長中の置換の際に、5’末端も二次構造を形成して、置換された5’末端がナノポアを通り抜けるのを防止するように、同様に設計される。
図1
図2
【国際調査報告】