(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-10-11
(45)【発行日】2023-10-19
(54)【発明の名称】方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20231012BHJP
C12Q 1/6844 20180101ALI20231012BHJP
C12Q 1/6869 20180101ALI20231012BHJP
【FI】
C12N15/09 110
C12Q1/6844 Z ZNA
C12Q1/6869 Z
(21)【出願番号】P 2020562111
(86)(22)【出願日】2019-05-24
(86)【国際出願番号】 GB2019051444
(87)【国際公開番号】W WO2019224560
(87)【国際公開日】2019-11-28
【審査請求日】2022-04-14
(32)【優先日】2018-05-24
(33)【優先権主張国・地域又は機関】GB
(73)【特許権者】
【識別番号】511252899
【氏名又は名称】オックスフォード ナノポール テクノロジーズ ピーエルシー
(74)【代理人】
【識別番号】100092783
【氏名又は名称】小林 浩
(74)【代理人】
【識別番号】100120134
【氏名又は名称】大森 規雄
(74)【代理人】
【識別番号】100196966
【氏名又は名称】植田 渉
(74)【代理人】
【識別番号】100104282
【氏名又は名称】鈴木 康仁
(72)【発明者】
【氏名】グラハム,ジェームス エドワード
(72)【発明者】
【氏名】ライモンドー,エティエンヌ
(72)【発明者】
【氏名】ボーエン,レベッカ ビクトリア
【審査官】田ノ上 拓自
(56)【参考文献】
【文献】国際公開第2017/044843(WO,A1)
【文献】MASAYUKI FUKASAWA; ET AL,MICROARRAY ANALYSIS OF PROMOTER METHYLATION IN LUNG CANCERS,JOURNAL OF HUMAN GENETICS,TO,SPRINGER-VERLAG,2006年04月,VOL:51, NR:4,PAGE(S):368 - 374,http://dx.doi.org/10.1007/s10038-005-0355-4
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/00-3/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に
修飾するための方法であって、
(a)酵素を用いてポリヌクレオチドの末端を化学的に改変することによって、前記サンプル中の前記ポリヌクレオチドの末端を保護すること
であって、前記サンプル中の前記ポリヌクレオチドの末端が、(i)前記ポリヌクレオチドの5’末端を脱リン酸化すること、または(ii)前記ポリヌクレオチドの3’末端を伸長して、一本鎖オーバーハングを生成することによって保護されることと、
(b)前記ポリヌクレオチドを、前記標的ポリヌクレオチドの配列に結合するガイドポリヌクレオチドおよび
RNA誘導型エフェクタータンパク質と接触させ、それにより前記
RNA誘導型エフェクタータンパク質が、前記標的ポリヌクレオチドを切断して、前記ガイドポリヌクレオチドが結合する配列によって判定された部位において2つの対向する切断末端を生成する、ことと、
(c)アダプターを、前記標的ポリヌクレオチドの前記2つの対向する切断末端のうちの一方または両方に結合させることと、を含み、
前記アダプターが、前記標的ポリヌクレオチドの切断末端のうちの一方または両方に結合するが、前記サンプル中の前記ポリヌクレオチドの保護末端には結合しない、方法。
【請求項2】
前記ポリヌクレオチドの5’末端が、前記ポリヌクレオチドのサンプルにデホスホリラーゼを添加することによって脱リン酸化される、請求項1に記載の方法。
【請求項3】
前記ポリヌクレオチドの3’末端が、前記ポリヌクレオチドのサンプルに末端トランスフェラーゼおよびdNTPを添加することによって伸長される、請求項1に記載の方法。
【請求項4】
前
記RNA誘導型エフェクタータンパク
質が、Cas3、Cas4、Cas8a、Cas8b、Cas8c、Cas9、Cas10、Cas10d、Cas12a、Cas13、Csn2、Csf1、Cmr5、Csm2、Csy1、Cse1、またはC2c2である、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記標的ポリヌクレオチドが、二本鎖DNAを含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
(i)前記
RNA誘導型エフェクタータンパク質が、二本鎖ポリヌクレオチドの一方の鎖を切断する、または(ii)前記
RNA誘導型エフェクタータンパク質が、二本鎖ポリヌクレオチドの両方の鎖を切断して、平滑末端を生成する、または一本鎖オーバーハングを生成する、請求項1~5のいずれか1項に記載の方法。
【請求項7】
前記方法が、前記サンプルをポリメラーゼまたは末端トランスフェラーゼおよびdNTPと接触させて、オーバーハングを充填し、平滑末端または単一ヌクレオチドオーバーハングを生成することを含む、請求項6に記載の方法。
【請求項8】
前記アダプターが、単一のTまたはポリT尾部を含み、前記方法が、ステップ(c)の前に前記サンプルをポリメラーゼおよびdATPと接触させて、単一のA尾部を前記標的ポリヌクレオチドの切断末端のうちの少なくとも1つに添加することをさらに含
む、請求項1~7のいずれか1項に記載の方法。
【請求項9】
前記ポリメラーゼが、Taqポリメラーゼである、請求項8に記載の方法。
【請求項10】
前記アダプターが、中間アダプターであり、前記方法が、前記中間アダプターにさらなるアダプターを結合することを含
む、請求項1~
9のいずれか1項に記載の方法。
【請求項11】
前記さらなるアダプターが、シークエンシングアダプターである、請求項10に記載の方法。
【請求項12】
前記ポリヌクレオチドを、関心対象の領域内のまたは関心対象の領域外の前記標的ポリヌクレオチドに結合する1つ以上のガイドポリヌクレオチドと接触させる、請求項1~
11のいずれか1項に記載の方法。
【請求項13】
前記ポリヌクレオチドを、前記標的ポリヌクレオチドの異なる配列に結合する2つ以上のガイドポリヌクレオチドと接触させ、それにより前記
RNA誘導型エフェクタータンパク質が、2つ以上の部位において前記標的ポリヌクレオチドを切断し、各部位において2つの対向する切断末端を生成す
る、請求項1~
12のいずれか1項に記載の方法。
【請求項14】
前記2つ以上の部位のうちの少なくとも1つが、前記標的ポリヌクレオチドの関心対象の領域の各側に位置し、前記2つ以上の部位のいずれも、関心対象の領域内に位置しない、および/または関心対象の領域の各側に位置する部位において前記標的ポリヌクレオチドを切断した後、前記ポリヌクレオチド誘導型エフェクタータンパク質が、関心対象の領域を含まない前記ポリヌクレオチドの切断末端に結合したままであるように、前記ガイドポリヌクレオチドが配向されている、請求項13に記載の方法。
【請求項15】
前記方法が、
修飾されたポリヌクレオチドの関心対象の領域に隣接する前記アダプター内の配列にハイブリダイズする一対のPCRプライマーを使用して、標的ポリヌクレオチドの関心対象の領域を増幅することをさらに含む、請求項
14に記載の方法。
【請求項16】
(i)2つ以上の異なる標的ポリヌクレオチドの配列に結合する2つ以上のガイドポリヌクレオチドが、前記標的ポリヌクレオチドのそれぞれにおいて関心対象の少なくとも1つの領域内のまたはそれに隣接するアダプターを結合するために、前記方法において使用され、または(ii)前記2つ以上のガイドポリヌクレオチドが、標的ポリヌクレオチドの関心対象の2つ以上の領域内のまたはそれに隣接するアダプターを結合するために、前記方法において使用される、請求項1~
15のいずれか1項に記載の方法。
【請求項17】
標的ポリヌクレオチドを検出するおよび/または特徴付ける方法であって、
(i)請求項1~
16のいずれか1項に記載の方法によって得られたサンプルをナノ細孔と接触させることと、
(ii)前記ナノ細孔にわたって電位差を印加することと、
(iii)前記標的ポリヌクレオチドと前記ナノ細孔との相互作用から生じる効果の存在または不在についてモニタリングして、前記標的ポリヌクレオチドの存在または不在を判定し、それにより前記サンプル中の前記標的ポリヌクレオチドを検出すること、および/または前記標的ポリヌクレオチドと前記ナノ細孔との相互作用をモニタリングして、前記標的ポリヌクレオチドの1つ以上の特徴を判定することと、を含む、方法。
【請求項18】
請求項1~17のいずれか1項に記載の方法において用いるためのキットであって、
(i)デホスホリラー
ゼ、単一のNまたはポリN尾部を含むアダプターであって、Nが、ヌクレオチドA、T、C、またはGである、アダプタ
ー、RNA誘導型エフェクタータンパク質および/またはガイドポリヌクレチド
、または
(ii)デホスホリラーゼ、単一のNまたはポリN尾部を含むアダプターであって、Nが、ヌクレオチドA、T、C、またはGである、アダプター、RNA誘導型エフェクタータンパク質および/またはガイドポリヌクレチド、ならびにポリメラーゼおよびリガーゼのうちの1つ以上、
を含む、キット。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させる方法に関する。本発明はまた、修飾されたポリヌクレオチドを特徴付ける方法に関する。
【背景技術】
【0002】
幅広い用途にわたる迅速かつ安価なポリヌクレオチド(例えば、DNAまたはRNA)配列決定および同定技術が現在必要とされている。既存の技術は、主に、多量のポリヌクレオチドを生成するために増幅技法に依存し、信号検出のために多量の専門蛍光薬剤を必要とするため、時間がかかり、高価である。
【0003】
膜貫通孔(ナノ細孔)は、ポリマーおよび様々な小分子用の直接的な電気バイオセンサーとして大きな将来性を有する。特に、最近は、潜在的なDNA配列決定技術としてナノ細孔が注目されている。
【0004】
ナノ細孔にわたって電位が印加されると、ヌクレオチドなどの分析物が特定の時間バレル中に一時的に滞留する場合、電流の流れに変化がある。ヌクレオチドのナノ細孔検出は、既知のシグネチャーおよび持続時間の電流変化をもたらす。鎖配列決定方法では、単一のポリヌクレオチド鎖は細孔を通過させ、ヌクレオチドの同一性が誘導される。鎖配列決定は、細孔を通るポリヌクレオチドの移動を制御するために分子ブレーキの使用を含み得る。
【0005】
ポリヌクレオチド配列決定および同定技術を含む、核酸ライブラリーの調製を必要とする多くの商業的状況がある。これは、しばしばトランスポザーゼを使用して達成される。ライブラリーを調製するために使用されるトランスポザーゼに応じて、例えば、シークエンシングにおける、ライブラリーを使用することができる前にインビトロで転位事象を修復する必要があり得る。
【発明の概要】
【0006】
本発明者らは、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させる方法を考案した。この方法では、ポリヌクレオチドの末端を保護して、サンプル中のポリヌクレオチドの末端へのアダプターの非特異的付加を防止する。この方法は、ガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質を利用して、標的ポリペプチド内で切断し、切断末端のうちの少なくとも1つに1つ以上のアダプターを付加する。次いで、標的ポリヌクレオチドを、サンプル中の他のポリヌクレオチドから標的ポリヌクレオチドを物理的に分離する必要なしに、鎖配列決定などによって特徴付けることができる。例えば、ナノ細孔配列決定法では、標的ポリヌクレオチドから得られたシグナルは、それらの末端で適合されたポリヌクレオチドから生じるバックグラウンドシグナルが非常に低いため、効果的に増強される。
【0007】
サンプル中のポリヌクレオチドの末端は、ポリヌクレオチドの末端を化学的に変えるだけで保護することができる。例えば、ポリヌクレオチドの5’末端は、通常リン酸化されている。ポリヌクレオチドの末端が脱リン酸化され、標的ポリヌクレオチドがポリヌクレオチド誘導型エフェクタータンパク質を使用して切断される場合、アダプターは、切断末端に結合(連結)され得るが、脱リン酸化された末端では結合(連結)され得ない。これにより、アダプターを標的ポリヌクレオチドの切断末端に選択的に共有結合させることができる。末端の脱リン酸化は、ポリヌクレオチドのサンプルにデホスホリラーゼを添加することによって、簡単かつ容易に達成することができる。サンプルをさらに処理する前に、デホスホリラーゼをサンプルから除去する必要はない。デホスホリラーゼは、切断酵素を添加する前に、単に熱で不活性化することができる。
【0008】
ポリヌクレオチドの末端を化学的に改変する方法の別の例は、少なくとも1つのヌクレオチドを含む3’尾部を付加するために末端トランスフェラーゼを使用して、ポリヌクレオチドの3’末端を伸長することである。これにより、3’オーバーハングを有するアダプターへの連結が防止される。これにより、アダプターを標的ポリヌクレオチドの切断末端に共有結合させることができる。したがって、サンプル中のポリヌクレオチドの末端を保護するために複雑なステップは必要とされず、ポリヌクレオチド誘導型エフェクタータンパク質によって切断されないアダプターがサンプル中のポリヌクレオチドに添加されない。標的ポリヌクレオチドへのアダプターの選択的付加により、サンプル中の他のポリヌクレオチドから標的ポリヌクレオチドを物理的に分離する必要なしに、標的ポリペプチドの検出および/または特徴付けが可能になり、いかなる検出/特徴付け方法のバックグラウンドシグナルも、両端が保護されない方法と比較して低下しない。標的ポリヌクレオチドへのアダプターの選択的付加を使用して、サンプル中の他のポリヌクレオチドから標的ポリヌクレオチドを物理的に分離することもできる。例えば、アダプターをタグとして使用して、例えば、アダプターを使用してビオチンを標的ポリヌクレオチドに結合させ、標的ポリヌクレオチドをビーズに結合させることによって、標的ポリヌクレオチドを分離することができる。
【0009】
この方法には、サンプルの調製が最小限で済むという利点がある。方法のステップは、方法のステップ間のクリーンアップステップを必要とせずに実行することができ、いくつかの実施形態において、方法は、単一のポットで実行することができる。非標的ポリヌクレオチドから分離することなく、サンプルを直接分析して、標的ポリヌクレオチドを特徴付けることができる。配列決定の文脈では、この方法により、長い読み込みを得ることを可能にする。特徴付けの文脈では、この方法により、長いポリヌクレオチドを修飾のためにスクリーニングして、例えば、メチル化されたまたはそうでなければ修飾された塩基の検出、ポリヌクレオチドの構造変化の同定、例えば、転位事象の検出、多型の検出、または拡張反復のモニタリングを可能にする。標的ポリヌクレオチドの切断部位は、複数の断片として長いポリヌクレオチドのカバレッジを達成するように設計することもできる。
【0010】
したがって、以下が提供される。
-ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させるための方法であって、サンプル中のポリヌクレオチドの末端を保護することと、ポリヌクレオチドを、標的ポリヌクレオチドの配列に結合するガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質と接触させることであって、それによりポリヌクレオチド誘導型エフェクタータンパク質が標的ポリヌクレオチドを切断して、ガイドポリヌクレオチドが結合する配列によって判定された部位において2つの対向する切断末端を生成する、接触させることと、アダプターを、標的ポリヌクレオチドの2つの対向する切断末端のうちの一方または両方に結合させることと、を含み、アダプターは、標的ポリヌクレオチドの切断末端のうちの一方または両方に結合するが、サンプル中のポリヌクレオチドの保護末端には結合しない、方法、
-標的ポリヌクレオチドを検出するおよび/または特徴付けする方法であって、上記の方法によって得られたサンプルをナノ細孔と接触させることと、ナノ細孔にわたって電位差を印加することと、標的ポリヌクレオチドとナノ細孔との相互作用から生じる効果の存在または不在についてモニタリングして、標的ポリヌクレオチドの存在または不在を判定し、それによりサンプル中の標的ポリヌクレオチドを検出すること、および/または標的ポリヌクレオチドとナノ細孔との相互作用をモニタリングして、標的ポリヌクレオチドの1つ以上の特徴を判定することと、を含む、方法。
-ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に修飾するためのキットであって、デホスホリラーゼと、単一のNまたはポリN尾部を含むアダプターであって、Nが、ヌクレオチドA、T、C、またはGである、アダプターと、任意にポリメラーゼ、リガーゼ、ポリヌクレオチド誘導型エフェクタータンパク質、およびガイドポリヌクレオチドのうちの1つ以上と、を含む、キット、ならびに
-ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させるための方法であって、サンプル中のポリヌクレオチドを、標的ポリヌクレオチドの配列に結合する2つのガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質と接触させることであって、2つのガイドポリヌクレオチドが結合する配列が、密接に位置していても位置していなくてもよい2つの異なる部位にポリヌクレオチド誘導型エフェクタータンパク質を導き、それによりポリヌクレオチド誘導型エフェクタータンパク質が、2つの部位のうちの少なくとも1つにおいて標的ポリヌクレオチドを切断して、2つの対向する切断末端を生成する、接触させることと、アダプターを、標的ポリヌクレオチドの2つの対向する切断末端のうちの一方または両方を結合させることと、を含む、方法。
【0011】
図は、説明を目的としており、限定することを意図するものではないことを理解されたい。
【図面の簡単な説明】
【0012】
【
図1】tracrRNA BおよびcrRNA Cが結合したCas9酵素Aをどのように使用して、プロトスペーサー隣接モチーフ(PAM)Eを含む標的dsDNA分子Dを切断することができるかを図式的に示す。tracrRNAおよびcrRNAは、2つをヘアピンFで連結することによって、シングルガイドRNA(sgRNA)分子として組み込まれ得る。Cas9は、2つのヌクレアーゼセンターGを使用して分子を切断し、2つのdsDNA断片HおよびJを生成し、そのうちの一方(H)はCas9によって保護され、もう一方(J)は遊離の5’リン酸Kおよび3’ヒドロキシル基Lを持っている。
【
図2】crRNA Bが結合したCpf1酵素Aをどのように使用して、プロトスペーサー隣接モチーフ(PAM)Dを含む標的dsDNA分子Cを切断することができるかを図式的に示す。Cpf1は、2つの部位Eで単一のヌクレアーゼセンターを使用して分子を切断し、2つのdsDNA断片FおよびGを生成し、そのうちの一方(F)はCpf1によって保護され、もう一方(G)は遊離5’リン酸H、3’ヒドロキシル基J、および5’オーバーハングKを持っている。
【
図3】DNAプロセシング酵素による様々なDNA産物の処理:3’-dA尾部断片Bを得るためにポリメラーゼ(例えば、TaqまたはKlenowエキソポリメラーゼ)およびdATPで処理した平滑末端dsDNA断片A;3’-dA尾部断片Dを得るためにポリメラーゼ(例えば、TaqまたはKlenowエキソポリメラーゼ)ならびにdATP、dCTP、dGTP、およびdTTPの混合物で処理した5’オーバーハング断片C;3’-dA尾部の5’-脱リン酸化断片Fを得るためにポリメラーゼ(例えば、TaqまたはKlenowエキソポリメラーゼ)およびdATPで処理した5’-脱リン酸化断片E;ならびに断片の末端構造に全体的な変化はないポリメラーゼ(例えば、TaqまたはKlenowエキソポリメラーゼ)およびdNTPで処理した3’-オーバーハング断片(例えば、末端トランスフェラーゼによって生成される)G、を図式的に示す。
【
図4】脱リン酸化によって末端を保護し、ポリヌクレオチド誘導型エフェクタータンパク質の切断(例えばCRISPR/Casの切断)によってリン酸塩を明らかにし、ポリヌクレオチド誘導型エフェクタータンパク質(例えばCas9)を除去し、末端をdAテーリングし、アダプターを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得る1つの可能なワークフローを示す。標的(A)および非標的(B)の高分子量DNAの混合物を、デホスホリラーゼ酵素(子ウシ腸ホスファターゼなど)によって処理して、ブロックされた末端Cを有するライブラリー分子を得る。ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質複合体(例えばCRISPR RNP)Dを結合すると、標的分子を2つの断片EおよびFに切断する二本鎖切断が導入される。除タンパク質によって結合複合体(例えばRNP)を除去すると、シークエンシングアダプターのdAテーリングおよび連結により、2つのアダプターが連結された標的断片GおよびHを得、ナノ細孔に導入されるとき、膜Jおよび孔Kを含むシークエンシングフローセルは両方とも、配列決定され得る。標的分子および非標的分子の両方が、フローセルに導入されるが、標的分子のみが膜につながれ、配列決定される。
【
図5】脱リン酸化によって末端を保護し、ポリヌクレオチド誘導型エフェクタータンパク質の切断(例えばCRISPR/Casの切断)によってリン酸塩を明らかにし、末端をdAテーリングし、アダプターを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得る1つの可能なワークフローを示す。標的(A)および非標的(B)の高分子量DNAの混合物を、デホスホリラーゼ酵素(子ウシ腸ホスファターゼなど)によって処理して、ブロックされた末端Cを有するライブラリー分子を得る。ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質複合体(例えばCRISPR RNP)Dを結合すると、標的分子を2つの断片EおよびFに切断する二本鎖切断が導入される。シークエンシングアダプターのdAテーリングおよび連結により、1つのアダプターが連結された標的断片Gを得、ナノ細孔に導入されるとき、膜Hおよび孔Jを含むシークエンシングフローセルは、配列決定され得る。標的分子および非標的分子の両方が、フローセルに導入されるが、標的分子のみが膜につながれ、配列決定される。
【
図6】脱リン酸化によって末端を保護し、ポリヌクレオチド誘導型エフェクタータンパク質の切断(例えばCRISPR/Casの切断)によってリン酸塩を明らかにし、末端をdAテーリングし、アダプターを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得る1つの可能なワークフローを示す。標的(A)および非標的(B)の高分子量DNAの混合物を、デホスホリラーゼ酵素(子ウシ腸ホスファターゼなど)によって処理して、ブロックされた末端Cを有するライブラリー分子を得る。ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質複合体(例えばCRISPR RNP)Dを結合すると、標的分子を2つの断片EおよびFに切断する二本鎖切断が導入される。ここで、複合体(RNP)は、自然発生的に解離する。シークエンシングアダプターのdAテーリングおよび連結により、2つのアダプターが連結された標的断片GおよびHを得、ナノ細孔に導入されるとき、膜Jおよび孔Kを含むシークエンシングフローセルは両方とも、配列決定され得る。標的分子および非標的分子の両方が、フローセルに導入されるが、標的分子のみが膜につながれ、配列決定される。
【
図7】脱リン酸化によって末端を保護し、ポリヌクレオチド誘導型エフェクタータンパク質の切断(例えばCRISPR/Casの切断)によってリン酸塩を明らかにし、相補的アダプターを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得る1つの可能なワークフローを示す。標的(A)および非標的(B)の高分子量DNAの混合物を、デホスホリラーゼ酵素(子ウシ腸ホスファターゼなど)によって処理して、ブロックされた末端Cを有するライブラリー分子を得る。ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質複合体(例えばCRISPR RNP)Dを結合すると、標的分子を2つの断片EおよびFに切断する二本鎖切断が導入される。ここで、複合体(RNP)は、自然発生的に解離する。相補的シークエンシングアダプター(G)の連結により、1つのアダプターが連結された標的断片Hを得、ナノ細孔に導入されるとき、膜Jおよび孔Kを含むシークエンシングフローセルは両方とも、配列決定され得る。標的分子および非標的分子の両方が、フローセルに導入されるが、標的分子のみが膜につながれ、配列決定される。
【
図8】脱リン酸化によって末端を保護し、ポリヌクレオチド誘導型エフェクタータンパク質の切断(例えばCRISPR/Casの切断)によってリン酸塩を明らかにし、相補的な中間バーコードのピースを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得る1つの可能なワークフローを示す。標的(A)および非標的(B)の高分子量DNAの混合物を、デホスホリラーゼ酵素(子ウシ腸ホスファターゼなど)によって処理して、ブロックされた末端Cを有するライブラリー分子を得る。ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質複合体(例えばCRISPR RNP)Dを結合すると、標的分子を2つの断片EおよびFに切断する二本鎖切断が導入される。ここで、RNPは、自然発生的に解離する。相補的中間バーコード(G)の連結およびアダプター(H)の配列決定により、1つのアダプターが連結された標的断片Iを得、ナノ細孔に導入されるとき、膜Jおよび孔Kを含むシークエンシングフローセルは両方とも、配列決定され得る。標的分子および非標的分子の両方が、フローセルに導入されるが、標的分子のみが膜につながれ、配列決定される。
【
図9】脱リン酸化によって末端を保護し、CRISPR/Cas9の切断によってリン酸塩を明らかにし、dAテーリングをし、シークエンシングアダプターを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得るワークフローの一例を示す。チューブAでは、高分子量ゲノムDNAは、37℃で10分間、脱ホスホリラーゼ酵素(子ウシ腸のホスファターゼなど)によって脱リン酸化され、酵素は、80℃で5分間熱不活性化される。同時にチューブBでは、crRNAは、tracrRNAにアニールされ、RNPは、この混合物をCas9で、室温で10分間インキュベートすることによって形成される。その後、TaqポリメラーゼおよびdATPに加えて、チューブBの内容物を、チューブAに添加する。混合物を、37℃で15~60分間インキュベートして、脱リン酸化された標的DNAの切断およびdA-テーリングを可能にする。関心対象の断片は、T4 DNAリガーゼを使用して、シークエンシングアダプターに連結され、シークエンシングライブラリーを形成する。ライブラリーのSPRI精製後、サンプルを、シークエンシングデバイスに導入する。
【
図10】脱リン酸化によって末端を保護し、CRISPR/Cpf1の切断によってリン酸塩を明らかにし、dAテーリングをし、シークエンシングアダプターを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得るワークフローの一例を示す。チューブAでは、高分子量ゲノムDNAは、37℃で10分間、脱ホスホリラーゼ酵素(子ウシ腸のホスファターゼなど)によって脱リン酸化され、酵素は、80℃で5分間熱不活性化される。同時にチューブBでは、crRNAは、熱変性であり、RNPは、この混合物をCas9で、室温で10分間インキュベートすることによって形成される。続いて、チューブBの内容物をチューブAに添加し、37℃で15~60分間インキュベートして、脱リン酸化された標的DNAの切断を可能にする。関心対象の断片は、バーコードおよびシークエンシングアダプターに連結され、シークエンシングライブラリーを形成する。ライブラリーのSPRI精製後、サンプルを、シークエンシングデバイスに導入する。
【
図11】冗長プローブが関心対象の領域(D)の隣接領域に相補的である、ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質の切断(例えばCRISPR/CasのRNP)(C)によって誘導された非標的DNA(A)の切断パターンではなく、標的DNA(B)の切断パターンを図式的に示す。RNP1および2は、ROIの上流のセンス鎖(+)に結合しており、RNP3および4は、アンチセンス鎖(-)を認識する。RNPによる切断後に、5つの断片が生成される。生成された断片のうち3つだけが、5’リン酸(E、F、G)を含み、シークエンシングデバイスによって読み取ることができる。断片Gは、連結可能な両端を含む唯一の断片である。
図3に示すように、dAテーリングが実行される。
【
図12】
図11に示すように、生成された標的DNA断片へのシークエンシングアダプターの連結を示す。dAテーリング後に、シークエンシングアダプターの連結により、3つのアダプターが連結された標的断片A、B、Cが生成される。断片Aは、センス方向に配列決定することができ、断片Bは、アンチセンス方向から読み取ることができる。断片Cの両端は、RNPによって切断され、両端の2つのシークエンシングアダプターの連結が可能になり、センスおよびアンチセンスの両方向でのシークエンシングが可能になった。シークエンシング読み取りの長さおよび方向は、概略
図Dに要約されている。ゲノム座標に沿った読み取り数またはカバレッジの深さのプロットは、断片Cのシークエンシングの双方向性により、RNP2とRNP3の間のカバレッジの古典的な増加を示す。
【
図13】シークエンシングのために
図11に示すように生成された標的DNA断片のPCR増幅を示す。dAテーリング後に、PCRアダプターのアニーリングにより、3つのアダプターが連結された標的断片A、B、およびCが生成される。断片Cの両端は、RNPによって切断され、各末端で2つのPCRアダプターの連結が可能になり、PCR増幅が可能になる。PCR後に、関心対象の増幅された領域を、シークエンシングアダプターに連結して、センス方向およびアンチセンス方向の両方で配列決定を可能にする。この場合、ゲノム座標に沿ったカバレッジの深さのプロットは、RNP2と3の切断部位間のカバレッジのみを示す。
【
図14】ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質切断(例えばCRISPR/CasのRNP)(A)により誘発された関心対象の領域(ROI)における単一のdsDNA切断のシークエンシングパターンを調査する。RNPが切断の両側を解放した場合、2つの断片(BおよびC)は、dAテーリングおよびシークエンシングアダプター連結にアクセス可能である。断片Bは、アンチセンス方向(-)で読み取られ、断片Cは、センス方向(+)で読み取られ、その結果、両方向で切断位置からカバレッジの深さ(D)の減少をもたらす。
【
図15】E.coli K-12、株MG1655のrrs遺伝子に対して行われた生成されたcrRNAプローブを用いて、全E.coliゲノムサンプルからの全1 6S(rrs)遺伝子の富化を示すカバレッジプロットの一例を示す。パネルは、順(正の数)方向および逆(負の数)方向読み取りについてのカバレッジ対位置のプロットを示す。7つの標的ピーク、i~viiは、同定され、バックグラウンドに対して大きな比率を占める。
【
図16-1】実施例1で使用した3つのアプローチ(1)、(2)、および(3)の違いを強調する。(1)、(2)、および(3)のそれぞれの左側および中央のパネルは、3つのアプローチを使用して得られたカバレッジを示し、(1)、(2)、および(3)のそれぞれの右側のパネルは、シークエンシング読み取りおよびE.coli参照のアラインメントをもたらすパイルアップを示す。
【
図17-1】実施例2に記載のライブラリーAのCas9濃縮を示す。パネルは、Cas9切断後のエキソKlenowによるdAテーリング後に、ヒトNA12878参照へのシークエンシング読み取りのアラインメントから生じた結果のパイルアップを示す。
【
図18】E.coli K-12、株MG1655のrrs遺伝子に対して行われたcrRNAプローブを用いて、全E.coliゲノムサンプルからの全16S(rrs)遺伝子の富化を示すカバレッジプロットの一例を示す。A、左は、順(正の数)方向および逆(負の数)方向読み取りについてのカバレッジ対位置のプロットを示す。7つの標的ピーク、i~viiは、同定され、バックグラウンドBに対して大きな比率を占める。A、下は、順方向および逆方向読み取りの凝集を示す。Cは、各ビンにマッピングされた塩基の数に対して正規化された、参照に首尾よくマッピングしたすべての読み取りの読み取り長さのヒストグラムを示す。
【
図19-1】Cpf1濃縮のための異なるアプローチの使用を比較する。Aは、5’ntのオーバーハング切断部位配列に対する特定のバーコードが、E.coli rrs 16S遺伝子を配列決定するために使用された実験を示す。Bは、一般的なバーコードが複数の5’ntオーバーハング配列に結合することができる同等の実験を示す。CおよびDは、酵素(Klenow(エキソ-)またはTaq)をそれぞれ使用して、5’ntオーバーハングを埋め、dAテーリングする同等の実験を比較する。
【
図20-1】ヒトゲノムDNAサンプルによるCpf1濃縮のための特定のバーコードアプローチを使用して得られたヒトNA12878参照へのシークエンシング読み取りのアラインメントから生じた結果のパイルアップを示す。
【
図21-1】ヒトゲノムDNAサンプルでCpf1を濃縮するためのKlenow(エキソ-)アプローチを用いたdA-テーリングを使用して得られたシークエンシング読み取りおよびヒトNA12878参照のアラインメントから生じるパイルアップを示す。
【
図22】脱リン酸化によって末端を保護し、2つの部位においてポリヌクレオチド誘導型エフェクタータンパク質の切断(例えばCRISPR/Casの切断)によってリン酸塩を明らかにし、任意に末端をdAテーリングし、アダプターを連結し、シークエンシングデバイスに導入することによって、標的DNA分子が配列決定され得る1つの可能なワークフローを示す。標的(A)および非標的(B)の高分子量DNAの混合物を、デホスホリラーゼ酵素(子ウシ腸ホスファターゼなど)によって処理して、ブロックされた末端Cを有するライブラリー分子を得る。ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質複合体(例えばCRISPR RNP)Dを結合すると、標的分子を3つの断片EおよびFに切断する二本鎖切断が導入される。ここで、複合体(RNP)は、2つの外側断片Fに結合したままである。一本鎖の外側領域を含む中間アダプターピースGが、内側の断片Eに連結されている。断片Eは、中間アダプターピースGの一本鎖の外側領域に特異的なプライマーHを使用して増幅される。シークエンシングアダプターの連結により、アダプターが連結された標的断片Kを得、ナノ細孔に導入されるとき、膜Mおよび孔Lを含むシークエンシングフローセルは、配列決定され得る。標的分子および非標的分子の両方が、フローセルに導入されるが、標的分子のみが膜につながれ、配列決定される。
【
図23-1】実施例5に記載されるように、ライブラリーA(1)およびB(2)に対するヒトNA12878参照(HTT遺伝子)へのシークエンシング読み取りのアラインメントから生じるパイルアップ、ならびにライブラリーB(3)の遺伝子ごとのバーコードあたりの読み取り数を示す。
【
図24】実施例6の増幅なし(1)、リン酸化(2)または脱リン酸化(3)PCRアダプターアプローチによる増幅後のE.coli SCS110参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。
【
図25-1】実施例7に記載されるように、E.coli参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。(1)は、シークエンシングアダプターが、標的が切断され、dAテーリングされたサンプルに連結された反応からのパイルアップを示す。(2)は、シークエンシングアダプターの連結前に、標的が切断され、RNAseHによって消化され、次いでTaqポリメラーゼによってdAテーリングされた反応からのパイルアップを示す。(3)は、標的が切断されたDNAが、Cas9変性後にRNAseHでインキュベートされ、次いでシークエンシングアダプターの連結前に、dAテーリングされた反応からのパイルアップを示す。
【
図26-1】実施例8に記載されているように、E.coli参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。(1)は、シークエンシングアダプターが、標的が切断され、dAテーリングされたサンプルに連結された反応からのパイルアップを示す。(2)は、標的が切断されたDNAが、T4 DNAポリメラーゼでインキュベートされ、次いでシークエンシングアダプターの連結前に、dAテーリングされた反応からのパイルアップを示す。(3)は、標的が切断されたものが、Cas9変性後にRNAseHでインキュベートされ、シークエンシングアダプターの連結前に、dAテーリングされた反応からのパイルアップを示す。
【発明を実施するための形態】
【0013】
開示される方法および産物の異なる適用が、当該技術分野における特定の必要性に合わせられ得ることが理解されるべきである。本明細書で使用される用語は、方法および産物の特定の実施形態を説明する目的のためだけのものであり、限定を意図するものではないことも理解されたい。また、一実施形態に関連するものとして定義された特徴は、別の実施形態に関連する特徴と組み合わせることができる。
【0014】
さらに、本明細書および添付の特許請求の範囲に使用される場合、単数形「a」、「an」、および「the」は、文脈が別途明確に示さない限り、複数の指示物を含む。したがって、例えば、「ポリヌクレオチド」への言及は、2つ以上のポリヌクレオチドを含み、「アンカー」への言及は、2つ以上のアンカーを含み、「ヘリカーゼ」への言及は、2つ以上のヘリカーゼを含み、「膜貫通孔」への言及は、2つ以上の細孔などを含む。
【0015】
上記または下記の本明細書に引用されるすべての出版物、特許、および特許出願は、その全体が参照により本明細書に組み込まれる。
【0016】
本発明者らは、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に修飾するための方法を考案した。この方法は、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドの選択的修飾をもたらす。これは、アダプターが標的ポリヌクレオチドまたは標的ポリヌクレオチドにのみ付加されることを意味する。次いで、標的ポリヌクレオチド(複数可)を、サンプル中の他の(非標的)ポリヌクレオチドから分離する必要なしに、分析または特徴付けることができる。
【0017】
本発明者らによって考案された方法は、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドまたは複数の標的ポリヌクレオチドの選択的適合をもたらし、この方法は、サンプル中のポリヌクレオチドの末端を保護することと、ポリヌクレオチドを、標的ポリヌクレオチドの配列に結合するガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質と接触させることであって、それによりポリヌクレオチド誘導型エフェクタータンパク質が標的ポリヌクレオチドを切断して、ガイドポリヌクレオチドが結合する配列によって判定された部位において2つの対向する切断末端を生成する、接触させることと、アダプターを、標的ポリヌクレオチドの2つの対向する切断末端のうちの一方または両方に結合することと、を含み、アダプターは、標的ポリヌクレオチドの切断末端のうちの一方または両方に結合するが、サンプル中のポリヌクレオチドの保護末端には結合しない。
【0018】
この方法は、適合されたポリヌクレオチドのライブラリーを生成するために使用することができ、複数のガイドポリヌクレオチドを使用して、1つ以上の標的ポリヌクレオチドを切断する、および/または同じ標的ポリヌクレオチド内の複数の部位内で切断するように、1つ以上のポリヌクレオチド誘導型エフェクタータンパク質を導く。
【0019】
末端を保護する
この方法は、サンプル中のポリヌクレオチドの末端を保護するステップを含む。サンプル中のポリヌクレオチドの末端は、アダプターがポリヌクレオチドの末端に結合するのを防ぐために保護される。理想的には、サンプル内のすべてのポリヌクレオチドの末端が、保護される。しかしながら、実際には、サンプル中のポリヌクレオチドの一部のみが、両端を保護することができる。例えば、サンプル中のポリヌクレオチドの約50%以上、約60%以上、約70%以上、約80%以上、約90%以上、または約95%以上は、保護された末端を有し得る。
【0020】
サンプル中のポリヌクレオチドの末端は、ポリヌクレオチドの末端を化学的に改変することによって保護することができる。末端は、酵素的に保護されていることが好ましい。これは、末端が、酵素を、任意に1つ以上の遊離dNTPなどの基質を有する、サンプルに添加することによって保護されることを意味する。酵素は、例えば、デホスホリラーゼまたは末端トランスフェラーゼであり得る。
【0021】
例えば、ポリヌクレオチドの5’末端は、通常リン酸化されている。ポリヌクレオチドの末端が脱リン酸化され、標的ポリヌクレオチドがポリヌクレオチド誘導型エフェクタータンパク質を使用して切断される場合、アダプターは、切断末端に結合(連結)され得るが、脱リン酸化された末端では結合(連結)され得ない。これにより、例えば、単一のTオーバーハングまたはポリTオーバーハングを含むアダプターを標的ポリヌクレオチドの切断末端に選択的にハイブリダイズするか、または共有結合させることができる。末端の脱リン酸化は、ポリヌクレオチドのサンプルにデホスホリラーゼを添加することによって、簡単かつ容易に達成することができる。サンプルをさらに処理する前に、デホスホリラーゼをサンプルから除去する必要はない。デホスホリラーゼは、切断酵素を添加する前に、単に熱で不活性化することができる。
【0022】
したがって、この方法では、サンプル中のポリヌクレオチドの末端は、ポリヌクレオチドの5’末端を脱リン酸化することによって保護することができる。この方法は、ポリヌクレオチドのサンプルにデホスホリラーゼを添加することを含み得る。デホスホリラーゼをサンプルに添加して、適切な時間インキュベートすることができる。当業者は、好適な期間を容易に決定することができるであろう。例えば、サンプルがデホスホリラーゼとインキュベートされる期間は、約5~約30分、例えば約10~約15分、好ましくは約10分であり得る。インキュベーション温度は、典型的には、使用されるデホスホリラーゼの最適温度によって決定されるが、例えば、約20℃~約40℃の範囲、例えば、約30℃、または好ましくは約37℃であり得る。
【0023】
ポリヌクレオチドの末端を化学的に改変する方法の別の例は、少なくとも1つのヌクレオチドを含む3’尾部を付加するために末端トランスフェラーゼを使用して、ポリヌクレオチドの3’末端を伸長することである。これにより、3’オーバーハングを有するアダプターへの連結が防止される。これにより、アダプターが標的ポリヌクレオチドの切断末端に共有結合させることができる。デホスホリラーゼおよび末端トランスフェラーゼの両方を使用して、ポリヌクレオチドの末端を保護することができる。
【0024】
ポリヌクレオチドの末端を保護する方法は、好ましくは、サンプル中の二本鎖ポリヌクレオチドの反対の鎖の5’および3’末端を結合することを含まず、例えば、この方法は、二本鎖ポリヌクレオチドの反対の鎖の隣接する5’末端と3’末端の間にヘアピンループを結合することを含まない。しかしながら、例えば、二本鎖ポリヌクレオチドの各鎖の5’末端を同じ鎖の3’末端に結合することによって、ポリヌクレオチドの環状化によって末端を保護することができる。
【0025】
サンプル中のポリヌクレオチドの末端は、ブロッキング化学を使用して保護することができる。例えば、ビオチンは、鎖のうちの一方または両方のポリヌクレオチドの末端に結合され、次いでストレプトアビジンに結合され得る。代替的に、各ポリヌクレオチドのうちの一端または両端を、ビオチン-ストレプトアビジンなどの好適な付着手段または他の親和性分子を使用して、ビーズの表面などの固体表面に結合させることができる。
【0026】
サンプル
サンプルは、ポリヌクレオチドを含む任意の好適なサンプルであり得る。
【0027】
サンプルは、生体サンプルであってもよい。本発明は、任意の有機体または微生物から得られたかまたは抽出されたサンプル上で、インビトロで実施され得る。有機体または微生物は、典型的には、古細菌、原核生物、または真核生物であり、典型的には、植物界、動物界、真菌界、モネラ界、および原生生物界の5つの界のうちの1つに属する。本発明は、任意のウイルスから得られたかまたは抽出されたサンプル上で、インビトロで実施され得る。
【0028】
サンプルは、好ましくは、流体サンプルである。サンプルは、通常は、体液を含む。体液は、ヒトまたは動物から取得してもよい。ヒトまたは動物は、疾患を有する、疾患を有する疑いがある、または疾患の危険性があるものであってもよい。サンプルは、尿、リンパ液、唾液、粘液、精液、または羊水であってもよいが、好ましくは、全血、血漿、または血清である。典型的には、サンプルは、ヒト由来のものであるが、代わりに、別の哺乳動物由来のもの、例えば、ウマ、ウシ、ヒツジまたはブタなどの商業的に飼育されている動物由来のもの、あるいはネコまたはイヌなどのペットであってもよい。
【0029】
代替的に、植物由来のサンプルは、通常は、穀物、豆類、果物、または野菜などの市販の作物、例えば、小麦、大麦、オート麦、セイヨウアブラナ、トウモロコシ、大豆、米、バナナ、リンゴ、トマト、ジャガイモ、ブドウ、タバコ、豆、レンズ豆、サトウキビ、ココア、綿、茶、またはコーヒーから取得する。
【0030】
サンプルは、非生体サンプルであってもよい。非生体サンプルは、好ましくは、液状サンプルである。非生物学的サンプルの例としては、外科用流体、水、例えば飲料水、海水、または河川水、および臨床検査用の試薬が挙げられる。
【0031】
サンプルは、方法を実施する前に、例えば、遠心分離によって、または不必要な分子もしくは細胞、例えば赤血球を濾過して取り除く膜を通過させることによって処理され得る。この方法は、採取された直後にサンプルに対して実行されてもよい。サンプルは、通常、方法の前に、好ましくは-70℃未満で保存することもできる。
【0032】
サンプルは、ゲノムDNAを含み得る。好ましくは、ゲノムDNAは断片化されていない。ゲノムDNAは、任意の生物からのものであり得る。ゲノムDNAは、ヒトゲノムDNAであり得る。
【0033】
標的ポリヌクレオチド
ポリヌクレオチドは、デオキシリボ核酸(DNA)またはリボ核酸(RNA)などの核酸であり得る。ポリヌクレオチドは、DNAの1本の鎖にハイブリダイズされたRNAの1本の鎖を含み得る。ポリヌクレオチドは、1つ以上の合成スペーサーを含み得る。当該技術分野で既知の合成ポリヌクレオチドには、ペプチド核酸(PNA)、グリセロール核酸(GNA)、トレオース核酸(TNA)、ロックド核酸(LNA)、またはヌクレオチド側鎖を有する他の合成ポリマーが含まれる。
【0034】
ポリヌクレオチドは、好ましくは、DNA、RNA、またはDNA/RNAハイブリッド、最も好ましくはDNAである。標的ポリヌクレオチドは、好ましくは、ガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質が結合する二本鎖領域を含む。標的ポリヌクレオチドは二本鎖であってもよい。標的ポリペプチドは、一本鎖であり得、小さい一本鎖ポリヌクレオチドは、ガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質の標的部位にハイブリダイズされ得る。標的ポリペプチドは、一本鎖領域ならびに他の構造、例えばヘアピンループ、三重螺旋、および/または四重螺旋を有する領域を含み得る。DNA/RNAハイブリッドは、同じ鎖上にDNAとRNAとを含み得る。好ましくは、DNA/RNAハイブリッドはRNA鎖にハイブリダイズした一本のDNA鎖を含む。好ましい実施形態において、ポリヌクレオチドは、ゲノムDNAである。ゲノムDNAは、典型的には二本鎖である。
【0035】
標的ポリヌクレオチドは、任意の長さであり得る。例えば、ポリヌクレオチドは、長さが少なくとも500ヌクレオチドまたはヌクレオチド対であり得る。標的ポリヌクレオチドは、1000個以上のヌクレオチドもしくはヌクレオチド対、5000個以上のヌクレオチドもしくはヌクレオチド対の長さ、または100000個以上のヌクレオチドもしくはヌクレオチド対の長さであり得る。
【0036】
標的ポリヌクレオチドは、疾患および/または微生物に関連するポリヌクレオチドであり得る。
【0037】
この方法は、複数の標的ポリヌクレオチドを含み得る。標的ポリヌクレオチドは、ポリヌクレオチドの群であり得る。例えば、群は、特定の表現型に関連付けられ得る。群は、特定の種類の細胞に関連付けられ得る。例えば、群は、細菌細胞を示し得る。群は、ウイルス、真菌、細菌、マイコバクテリウム、または寄生生物を示し得る。
【0038】
標的ポリヌクレオチドは、特定の疾患または状態に関連するバイオマーカーである、2つ以上のポリヌクレオチドの群であり得る。バイオマーカーは、疾患または状態を診断または予後診断するために使用することができる。バイオマーカーの好適なパネルは、例えば、Edwards et al(2008)Mol.Cell.Proteomics 7:1824-1837、Jacquet et al(2009)Mol.Cell.Proteomics 8:2687-2699、Anderson et al(2010)Clin.Chem.56:177-185に記載されるように、当該技術分野で既知である。疾患または状態は、例えば、癌、冠状動脈性心疾患および心血管疾患を含む心疾患、または結核もしくは敗血症などの感染性疾患であり得る。疾患または状態は、ハンチントン病、脆弱性X、脊髄および球部の筋萎縮症または筋緊張性ジストロフィーなどの拡張反復に関連する疾患であり得る。
【0039】
標的ポリヌクレオチドは、マイクロRNA(またはmiRNA)または低分子干渉RNA(siRNA)であり得る。2つ以上の標的ポリヌクレオチドの群は、2つ以上のmiRNAの群であり得る。本発明での使用に適したmiRNAは、当該技術分野で周知である。例えば、好適なmiRNAは、公的に利用可能なデータベースに保存される。
【0040】
標的ポリヌクレオチドの配列は、既知であっても未知であってもよい。標的ポリヌクレオチドの少なくとも一部は、ガイドポリヌクレオチドがエフェクタータンパク質を標的ポリヌクレオチドに標的化することができるように既知であることが好ましい。
【0041】
ポリヌクレオチド誘導型エフェクタータンパク質
ポリヌクレオチド誘導型エフェクタータンパク質は、ガイドポリヌクレオチドに結合し、ガイドポリヌクレオチドが結合するポリヌクレオチドを切断する任意のタンパク質であり得る。ガイドポリヌクレオチドは、ガイドRNA、ガイドDNA、またはDNAおよびRNAの両方を含むガイドであり得る。ガイドポリヌクレオチドは、好ましくは、ガイドRNAである。したがって、ポリヌクレオチド誘導型エフェクタータンパク質は、好ましくは、RNA誘導型エフェクタータンパク質である。
【0042】
RNA誘導型エフェクタータンパク質は、ガイドRNAに結合する任意のタンパク質であり得る。RNA誘導型エフェクタータンパク質は、典型的には、標的ポリヌクレオチドに結合するガイドRNAの領域ではないガイドRNAの領域に結合する。例えば、ガイドRNAがcrRNAおよびtracrRNAを含む場合、RNA誘導型エフェクタータンパク質は、典型的には、tracrRNAに結合し、crRNAは、典型的には、標的ポリヌクレオチドに結合する。RNA誘導型エフェクタータンパク質は、好ましくは、標的ポリヌクレオチドにも結合する。RNA誘導型エフェクタータンパク質は、典型的には、標的ポリヌクレオチドの二本鎖領域に結合する。RNA誘導型エフェクタータンパク質の結合によって切断される標的ポリヌクレオチドの部位は、典型的には、ガイドRNAがハイブリダイズする配列の近くに位置する。
【0043】
RNA誘導型エフェクタータンパク質は、ガイドRNAが結合する配列の上流または下流を切断し得る。例えば、RNA誘導型エフェクタータンパク質は、ガイドRNAが結合する配列の隣に位置するDNA中のプロトスペーサー隣接モチーフ(PAM)に結合し得る。PAMは、典型的には、5’-NGG-3’(式中、Nは任意の塩基である)、5’-NGA-3’、5’-YG-3’(式中、Yはピリミジンである)、5’TTN-3’、または5’-YTN-3’などの、2~6塩基対配列である。異なるRNA誘導型エフェクタータンパク質は、異なるPAMに結合する。RNA誘導型エフェクタータンパク質は、特に、標的がRNAまたはDNA/RNAハイブリッドである場合、PAMを含まない標的ポリヌクレオチドに結合し得る。
【0044】
RNA誘導型エフェクタータンパク質は、典型的には、RNA誘導型エンドヌクレアーゼなどのヌクレアーゼである。RNA誘導型エフェクタータンパク質は、典型的には、Casタンパク質である。RNA誘導型エフェクタータンパク質は、Cas、Csn2、Cpf1、Csf1、Cmr5、Csm2、Csy1、Cse1、またはC2c2であり得る。Casタンパク質は、Cas3、Cas4、Cas8a、Cas8b、Cas8c、Cas9、Cas10、Cas10d、Cas12a(Cpf1)、またはCas13であり得る。好ましくは、Casタンパク質は、Cas9またはCas12aである。Cas、Csn2、Cpf1、Csf1、Cmr5、Csm2、Csy1、またはCse1は、好ましくは、標的ポリヌクレオチドが二本鎖DNA領域を含む場合に使用される。C2c2は、好ましくは、標的ポリヌクレオチドが二本鎖RNA領域を含む場合に使用される。RecAファミリーからのタンパク質などのDNA誘導型エフェクタータンパク質は、DNAを標的化するために使用され得る。使用され得るRecAファミリーからのタンパク質の例は、RecA、RadA、およびRad51である。
【0045】
RNA誘導型エンドヌクレアーゼのヌクレアーゼ活性は、部分的に無効化され得る。RNA誘導型エンドヌクレアーゼの1つ以上の触媒ヌクレアーゼ部位は、酵素が標的ポリヌクレオチドの少なくとも1つの鎖を切断する能力を保持しているという条件で不活性化され得る。例えば、RNA誘導型エンドヌクレアーゼが2つの触媒ヌクレアーゼ部位を含む場合、触媒部位のうちの一方は、不活性化され得る。典型的には、触媒部位のうちの一方は、それが特異的に結合するポリヌクレオチドのうちの一方の鎖を切断し、他方の触媒部位は、ポリヌクレオチドの反対の鎖を切断するであろう。したがって、RNA誘導型エンドヌクレアーゼは、標的ポリヌクレオチドの二本鎖領域の両方の鎖または一方の鎖を切断し得る。
【0046】
二本鎖標的ポリヌクレオチドのうちの一方の鎖のみを切断することができるポリヌクレオチド誘導型エンドヌクレアーゼは、ニッカーゼと称され得る。ニッカーゼは、典型的には、標的ポリヌクレオチドに一本鎖切断を生じさせる。2つのニッカーゼを使用して、第1のニッカーゼが標的ポリヌクレオチドのうちの一方の鎖を切断し、第2のニッカーゼが標的ポリヌクレオチドの他方の鎖を切断する、オーバーハングを有する切断末端を生成し得る。例えば、ニッカーゼは、同じエンドヌクレアーゼの部分的に不活性化されたバージョンであってもよく、一方のニッカーゼでは、第1の触媒部位が不活性化され、他方のニッカーゼでは、第2の触媒部位が不活性化されている。この例示的な実施形態において、第1のニッカーゼは、RuvCドメインが不活性化されているCas9エンドヌクレアーゼであってよく、第2のニッカーゼは、HNHドメインが不活性化されているCas9エンドヌクレアーゼであってよい。第1および第2のニッカーゼは、異なるガイドポリヌクレオチドによって誘導され得、それによりニッカーゼは、所望の長さのオーバーハングを有する切断末端が形成されるように、二本鎖標的ポリヌクレオチドの異なる場所で切断する。
【0047】
RNA誘導型エンドヌクレアーゼの触媒部位は、変異によって不活性化され得る。変異は、置換、挿入、または欠失変異であり得る。例えば、1つ以上、例えば2、3、4、5、または6つのアミノ酸が、置換または触媒部位に挿入または触媒部位から欠失され得る。変異は、好ましくは置換または挿入であり、より好ましくは触媒部位における単一のアミノ酸の置換である。当業者であれば、RNA誘導型エンドヌクレアーゼの触媒部位およびそれらを不活性化する変異を容易に同定することができるであろう。例えば、RNA誘導型エンドヌクレアーゼがCas9である場合、一方の触媒部位はD10での変異によって、他方はH640での変異によって不活性化され得る。
【0048】
エフェクタータンパク質がニッカーゼである場合、この方法は、5’から3’へのまたは3’から5’へのエキソヌクレアーゼ活性を有する酵素をサンプルに添加して、ユニバーサル配列を含む一本鎖部分(典型的には3’)を含むアダプターなどのアダプターがハイブリダイズすることができる一続きの一本鎖ポリヌクレオチドを曝露するために、標的ポリヌクレオチドのニックの入った鎖のニックの片側に隣接するヌクレオチドを除去することをさらに含み得る。ポリメラーゼを使用して、アダプターの標的ポリヌクレオチドへの連結などの共有結合の前に、アダプター(典型的には、3’)の末端と標的ポリヌクレオチドの二本鎖領域(典型的には、5’)の末端と)の間の任意のギャップを閉じることができる。
【0049】
ガイドポリヌクレオチド
ガイドポリヌクレオチドは、標的ポリヌクレオチドにハイブリダイズすることができ、ポリヌクレオチド誘導型エフェクタータンパク質に結合することもできる配列を含む。ガイドポリヌクレオチドは、それが標的ポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質に結合することを可能にする任意の構造を有し得る。
【0050】
ガイドポリヌクレオチドは、典型的には、標的ポリヌクレオチド中の約20ヌクレオチドの配列にハイブリダイズする。ガイドRNAが結合する配列は、約10~約40、例えば約15~約30、好ましくは約18~約25ヌクレオチド、例えば、21、22、23、または24ヌクレオチドであり得る。ガイドポリヌクレオチドは、典型的には、標的ポリヌクレオチドの二本鎖領域の一本鎖の一部に相補的である。
【0051】
ガイドRNAは、PAMに対して5’または3’である標的ポリヌクレオチド中の領域に相補的であり得る。これは、標的ポリヌクレオチドがDNAを含む場合、特にRNAエフェクタータンパク質がCas9またはCpf1である場合に好ましい。ガイドRNAは、グアニンに隣接する標的ポリヌクレオチド中の領域に相補的であり得る。これは、標的ポリヌクレオチドがRNAを含む場合、特にRNAエフェクタータンパク質がC2c2である場合に好ましい。
【0052】
ガイドRNAは、それが標的ポリヌクレオチドおよびRNA誘導型エフェクタータンパク質に結合することを可能にする任意の構造を有し得る。ガイドRNAは、標的ポリヌクレオチドの配列に結合するcrRNAおよびtracrRNAを含み得る。tracrRNAは、典型的には、RNA誘導型エフェクタータンパク質に結合する。ガイドRNAの典型的な構造は、当該技術分野で既知である。例えば、crRNAは、典型的には、一本鎖RNAであり、tracrRNAは、典型的には、一本鎖がcrRNAの3’末端に結合している二本鎖領域およびcrRNAに結合していない鎖の3’末端にヘアピンループを形成する部分を有する。crRNAおよびtracrRNAは、単一片sgRNAとしてインビトロで転写され得る。
【0053】
ガイドRNAは、追加のRNA塩基もしくはDNA塩基または他の核酸塩基などの他の成分を含み得る。ガイドRNA中のRNAおよびDNA塩基は、天然塩基または修飾塩基であり得る。ガイドRNAの代わりにガイドDNAが使用され、RNA誘導型エフェクタータンパク質の代わりにDNA誘導型エフェクタータンパク質が使用され得る。標的ポリヌクレオチドがRNAである場合、ガイドDNAおよびDNA誘導型エフェクタータンパク質の使用が好ましくあり得る。
【0054】
カスタマイズされたガイドポリヌクレオチドは、例えば、Integrated DNA Technologies(IDT)から市販されている。
【0055】
この方法は、ポリヌクレオチドのサンプルを複数のガイドポリヌクレオチドと接触させることを含み得る。例えば、1~100、例えば2~50、例えば4、6、8、10、20、または30のガイドポリヌクレオチドを使用することができる。複数のガイドポリヌクレオチドは、同じ標的ポリヌクレオチドの異なる部位において、例えば、標的ポリヌクレオチドの関心対象の領域の末端(隣接する)で、あるいは標的ポリヌクレオチドのすべてまたは長い長さのカバレッジがアダプターを結合させることができる標的ポリヌクレオチドの断片を生成することによって得ることができるように、配列を結合し得る。断片は、異なる断片または重複する断片であり得る。複数のガイドポリヌクレオチドは、異なる標的ポリヌクレオチドの配列に結合し得る。
【0056】
一実施形態において、この方法は、一方のガイドポリヌクレオチドがニッカーゼに二本鎖標的ポリヌクレオチドの一方の鎖を切断するように導き、他方のガイドポリヌクレオチドがニッカーゼを導いて二本鎖ポリヌクレオチドの他方の鎖を切断するように設計された2つのガイドポリヌクレオチドを利用し得る。このようにして、オーバーハングを有する対向する切断末端がそれぞれ、形成され得る。この方法は、そのようなガイドポリヌクレオチドの2つ以上の対を利用して、標的ポリヌクレオチドにおいて2つ以上のオーバーハングを有する切断末端を生成し得る。
【0057】
一実施形態において、切断部位は、標的ポリヌクレオチドにおける関心対象の領域の末端20ヌクレオチドのうちの1つ以上を含み得、および/または標的ポリヌクレオチドにおける関心対象の領域の末端の0~50ヌクレオチド、例えば、1~40、5~30、または10~20ヌクレオチド内であり得る。
【0058】
一実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、標的ポリヌクレオチドの1つの部位において切断する。
【0059】
別の実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、標的ポリヌクレオチドの2つ以上の部位において切断する。この実施形態において、2つの部位は、好ましくは、標的ポリヌクレオチドの末端にあるか、または標的ポリヌクレオチドにおける関心対象の領域の末端にある。したがって、方法は、ポリヌクレオチドのサンプルを2つ以上のガイドポリヌクレオチドと接触させることを含み得、第1のガイドポリヌクレオチドは、標的ポリヌクレオチドの一方の末端近くの配列に結合し、第2のガイドポリヌクレオチドは、標的ポリヌクレオチドのうちの他方の末端近くの配列に結合するか、または、第1のガイドポリヌクレオチドは、関心対象の領域のうちの一方の末端近くの配列に結合し、第2のガイドポリヌクレオチドは、関心対象の領域のうちの他方の末端近くの配列に結合する。代替的に、この方法は、ポリヌクレオチドのサンプルを2対以上のガイドポリヌクレオチドと接触させることを含み得、第1の対は、標的ポリヌクレオチドの一方の末端または関心対象の領域で切断するように、一対のニッカーゼを導き、第2の対は、標的ポリヌクレオチドのうちの他方の末端または関心対象の領域で切断するように一対のニッカーゼを導く。
【0060】
一実施形態において、標的ポリヌクレオチド内の3つ以上の部位、例えば4、5、6、7、8、9、10またはそれ以上の部位が、切断される。この方法は、例えば、3つのガイドポリヌクレオチドまたは3対のガイドポリヌクレオチドを使用することを含み得、1つは、標的ポリヌクレオチドまたは関心対象の領域内の配列に結合し、他の2つは、標的ポリヌクレオチドの末端、または関心対象の領域の配列に結合する。
【0061】
ガイドポリヌクレオチドは、ポリヌクレオチド誘導型エフェクタータンパク質の作用がより長いポリヌクレオチドから関心対象の領域を切り出すように、またはそれが標的ポリヌクレオチド全体を切り出すように設計され得る。例えば、この方法は、2つのガイドポリヌクレオチド、または2対のガイドポリヌクレオチドを利用することができ、1つのガイドポリヌクレオチドまたは1対のガイドポリヌクレオチドは、標的ポリヌクレオチドのうちの一方の末端の部位に結合し、他のガイドポリヌクレオチドまたは対のガイドポリヌクレオチドは、標的ポリヌクレオチドのうちの他方の末端の部位に結合する。
【0062】
ガイドポリヌクレオチドは、ポリヌクレオチド誘導型エフェクタータンパク質に結合され得る、すなわち、ガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質は、リボ核タンパク質(RNP)と称され得る複合体を形成し得る。RNPを形成するための条件は、当該技術分野で周知である。例えば、等モルのcrRNAプールを、約95℃で約5分間tracrRNAにアニーリングして、ガイドポリヌクレオチドを形成し、次いでポリヌクレオチド誘導型エフェクタータンパク質を添加して、ポリヌクレオチド誘導型エフェクタータンパク質をガイドポリヌクレオチドに結合させるために、少なくとも約10分間インキュベートする前に室温に冷却することができる。ガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質を含む複合体を、サンプルに添加することができる。この方法は、2つ以上の異なるガイドポリヌクレオチドを使用する場合、それぞれが、ポリヌクレオチド誘導型エフェクタータンパク質と複合体化され得る。したがって、この方法は、2つ以上、例えば3、4、5、7、8、9、10またはそれ以上のそのような複合体をサンプルに添加することを含み得る。
【0063】
この方法は、2つ以上の異なる標的ポリヌクレオチドの配列に結合する2つ以上のガイドポリヌクレオチドを使用する場合、ガイドポリヌクレオチドを使用して、各標的ポリヌクレオチド内の関心対象のうちの少なくとも1つの領域内または隣接するアダプターを結合させることができる。
【0064】
切断末端
この方法では、ポリヌクレオチド誘導型エフェクタータンパク質は、標的ポリヌクレオチドを切断して、2つの対向する切断末端を生成する。ポリヌクレオチド誘導型エフェクタータンパク質およびガイドポリヌクレオチドは、典型的には、ポリヌクレオチドの脱リン酸化サンプルを用いて、約20℃~約40℃、例えば約30℃、好ましくは約37℃の温度で約15分間~約1時間以上、例えば、約30分間インキュベートされる。例えば、サンプルの量、エフェクタータンパク質濃度、インキュベーション温度、およびインキュベーション時間を含む反応条件は、必要に応じて調整することができる。
【0065】
ポリヌクレオチド誘導型エフェクタータンパク質は、典型的には、二本鎖領域の標的ポリヌクレオチドを切断して、2つの対向する切断末端を生成する。対向する切断末端は、例えば、ポリヌクレオチド誘導型エフェクタータンパク質がニッカーゼである場合、二本鎖ポリヌクレオチドのちょうど一方の鎖にあり得る。対向する切断末端は、二本鎖ポリヌクレオチドの両方の鎖にあり得る。対向する切断末端は、平滑末端であり得る、すなわち、ポリヌクレオチド誘導型エフェクタータンパク質は、二本鎖ポリヌクレオチドの両方の鎖を同じ地点で切断し得る。したがって、一実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、二本鎖ポリヌクレオチドの両方の鎖を切断して、平滑末端を生成する。別の実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、二本鎖ポリヌクレオチドの両方の鎖を切断して、一本鎖オーバーハングを生成する。対向する切断末端はそれぞれ、一本鎖オーバーハングを有してもよく、各末端の一本鎖オーバーハングは、5’オーバーハングであるか、または各末端の一本鎖オーバーハングは、3’オーバーハングである。一本鎖オーバーハングは、好ましくは、3’オーバーハングである。
【0066】
一実施形態において、切断末端は、それぞれ、一本鎖オーバーハングを含む。一本鎖オーバーハングは、例えばCas12a(Cpf1)などの単一のポリヌクレオチド誘導型エフェクタータンパク質によって形成され得る。別の実施形態において、一本鎖オーバーハングを含む切断末端は、2つのポリヌクレオチド誘導型エフェクタータンパク質の作用によって生成され、各タンパク質は、標的ポリヌクレオチドの異なる鎖を切断する。この方法では、アダプターを、エフェクタータンパク質(複数可)によって生成された切断末端のうちの一方または両方に結合する。オーバーハングは、任意の好適な長さのものであり得る。典型的には、オーバーハングは、4~30、例えば、5~25、6~20、7~15、8~12、または9~10ヌクレオチドを含む。
【0067】
オーバーハングの配列は、既知であっても未知であってもよい。ガイドポリヌクレオチドは、標的ポリヌクレオチドにおける特定の既知の配列に導かれ得る。ポリヌクレオチド誘導型エフェクタータンパク質が標的を切断する部位は、既知であるので、オーバーハングの配列は、予め決定される。したがって、アダプターは、例えば、アダプターの結合を望む切断末端のオーバーハングと反対側の鎖に一本鎖オーバーハングなどの一本鎖領域を有するように設計することができ、アダプターの一本鎖領域の配列は、切断末端のオーバーハングの配列に相補的である。標的ポリヌクレオチドの切断末端のオーバーハングは、アダプターのオーバーハングなどの一本鎖領域にハイブリダイズすることができる。
【0068】
一実施形態において、アダプターのオーバーハングの配列は、切断末端の配列とまさに相補的である。2つのオーバーハング配列の間に1つ以上の塩基対のミスマッチがあり得る可能性がある。例えば、2つまたは3つの塩基対のミスマッチなど、1~4つの塩基対のミスマッチがあり得る。しかしながら、典型的には、2つのオーバーハング配列の間に少なくとも4、例えば、5~20、6~15、または8~10のマッチした塩基がある。
【0069】
一実施形態において、アダプターは、5’リン酸を欠いている場合がある。これにより、アダプター自体の連結を防ぐのに役立ち得る。
【0070】
一実施形態において、アダプターの一本鎖オーバーハングの配列は、ユニバーサル配列である。アダプターのユニバーサル配列は、約3~約15ヌクレオチドの長さ、例えば、約4、5、6、または7~約12、10、または8ヌクレオチドの長さであり得る。ユニバーサル配列は、二本鎖ポリヌクレオチドを切断することによって形成されるオーバーハングの任意のポリヌクレオチド配列にハイブリダイズすることができるユニバーサルヌクレオチドを含む。
【0071】
ユニバーサルヌクレオチドは、テンプレートポリヌクレオチドのすべてのヌクレオチドにある程度ハイブリダイズするヌクレオチドである。ユニバーサルヌクレオチドは、好ましくは、ヌクレオシドアデノシン(A)、チミン(T)、ウラシル(U)、グアニン(G)、およびシトシン(C)を含むヌクレオチドにある程度ハイブリダイズするものである。ユニバーサルヌクレオチドは、他のヌクレオチドよりもいくつかのヌクレオチドにより強くハイブリダイズし得る。例えば、ヌクレオシド、2’-デオキシイノシンを含むユニバーサルヌクレオチド(I)は、I-C>I-A>I-Gの優先的な対合順序がおよそ=I-Tであることを示すであろう。アダプターで使用されるユニバーサルヌクレオチドが二本鎖ポリヌクレオチドのすべてのヌクレオチドにハイブリダイズすることのみが必要である。例えば、二本鎖ポリヌクレオチドがDNAである場合、アダプターのユニバーサルヌクレオチドは、A、C、G、およびTにのみ結合する必要がある。
【0072】
ユニバーサルヌクレオチドは、ヒポキサンチン、4-ニトロインドール、5-ニトロインドール、6-ニトロインドール、3-ニトロピロール、ニトロイミダゾール、4-ニトロピラゾール、4-ニトロベンゾイミダゾール、5-ニトロインダゾール、4-アミノベンゾイミダゾール、またはフェニル(C6芳香族環の、核酸塩基のうちの1つを含み得る。ユニバーサルヌクレオチドは、より好ましくは、2’-デオキシイノシン、イノシン、7-デアザ-2’-デオキシイノシン、7-デアザ-イノシン、2-アザ-デオキシイノシン、2-アザ-イノシン、4-ニトロインドール2’-デオキシリボヌクレオシド、4-ニトロインドールリボヌクレオシド、5-ニトロインドール2’-デオキシリボヌクレオシド、5-ニトロインドールリボヌクレオシド、6-ニトロインドール2’-デオキシリボヌクレオシド、6-ニトロインドールリボヌクレオシド、3-ニトロピロール2’-デオキシリボヌクレオシド、3-ニトロピロールリボヌクレオシド、ヒポキサンチンの非環状糖類似体、ニトロイミダゾール2’-デオキシリボヌクレオシド、ニトロイミダゾールリボヌクレオシド、4-ニトロピラゾール2’-デオキシリボヌクレオシド、4-ニトロピラゾールリボヌクレオシド、4-ニトロベンゾイミダゾール2’-デオキシリボヌクレオシド、4-ニトロベンゾイミダゾールリボヌクレオシド、5-ニトロインダゾール2’-デオキシリボヌクレオシド、5-ニトロインダゾールリボヌクレオシド、4-アミノベンゾイミダゾール2’-デオキシリボヌクレオシド、4-アミノベンゾイミダゾールリボヌクレオシド、フェニルC-リボヌクレオシド、またはフェニルC-2’-デオキシリボシルヌクレオシドのヌクレオシドのうちの1つを含む。
【0073】
5’オーバーハングで切断末端にアダプターの結合を望む場合、相補的またはユニバーサル一本鎖領域は、一本鎖アダプターの5’末端にあるか、または二本鎖アダプター上の一本鎖5’オーバーハングである。例えば、アダプターが、ユニバーサルオーバーハングまたは切断末端のオーバーハングに相補的な一本鎖オーバーハングを有する場合、切断末端のオーバーハングが上部の鎖上に5’オーバーハングである場合、アダプターのオーバーハングが、下部の鎖上に5’オーバーハングであるか、または逆も同様である。代替的に、3’オーバーハングを有する切断末端へのアダプターの結合を望む場合、ユニバーサルまたは相補的一本鎖領域は、一本鎖アダプターの3’末端にあるか、または二本鎖アダプターの3’オーバーハングである。例えば、切断末端のオーバーハングが、下部の鎖上の3’オーバーハングである場合、アダプターのオーバーハングは、上部の鎖上の3’オーバーハングであるか、または逆も同様である。
【0074】
アダプターのオーバーハングの長さは、典型的には、切断末端のオーバーハングの長さと同じである。オーバーハングのうちの1つが他のオーバーハングよりも短くなり得ることが可能である。典型的には、オーバーハングは、4~30、例えば、5~25、6~20、7~15、8~12、または9~10ヌクレオチドの領域にわたってハイブリダイズすることができる。ハイブリダイゼーション後、一続きの一本鎖ヌクレオチドが存在する場合、例えば、ポリメラーゼを使用してギャップを埋めることができる。好ましくは、2つの相補的オーバーハングの長さは同一であるか、または標的配列におけるオーバーハングおよびユニバーサルオーバーハングの長さは同一である。
【0075】
ポリヌクレオチド誘導型エフェクタータンパク質(複数可)の作用が一本鎖オーバーハングをもたらす実施形態において、この方法は、サンプルをポリメラーゼおよびdNTPと接触させて、オーバーハングを充填し、平滑末端を生成することを含み得る。
【0076】
アダプターがdT尾部を含む場合、この方法は、サンプルをポリメラーゼおよびdATPと接触させて、dA尾部を標的ポリヌクレオチドの切断末端のうちの少なくとも1つに付加することをさらに含み得る。dA尾部は、平滑末端または一本鎖オーバーハングに付加され得る。代替例として、アダプターがdA尾部を含む場合、この方法は、サンプルをポリメラーゼおよびdTTPと接触させて、dT尾部を標的ポリヌクレオチドの切断末端のうちの少なくとも1つに付加することをさらに含み得る。同様に、dAおよびdTの代わりにdGおよびdCが、使用され得る。
【0077】
アダプターの結合のための遊離切断末端
ポリヌクレオチドを切断した後、ポリヌクレオチド誘導型エフェクタータンパク質は、切断部位の片側に結合したままであり得るか、または標的ポリヌクレオチドから放出され得る。ポリヌクレオチド誘導型エフェクタータンパク質が、切断部位の片側に結合したままである場合、エフェクタータンパク質が結合したままである切断部位の側の切断末端へのアダプターの結合を防止され得る。この場合、エフェクタータンパク質が結合されていない切断部位の面の切断末端へのアダプターの付加に対してバイアスが存在する。したがって、この方法の一実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、2つの対向する切断末端のうちの一方に結合したままであり、アダプターは、2つの対向する切断末端のうちの他方に結合している。
【0078】
ガイドポリヌクレオチドは、ポリヌクレオチドを切断し、関心対象の領域に切断部位の反対側に留まるように、ポリヌクレオチド誘導型エフェクタータンパク質を導くように設計され得る。ガイドポリヌクレオチドは、ポリヌクレオチド誘導型エフェクタータンパク質がポリヌクレオチドを切断し、関心対象の領域の切断部位上流の反対側に留まり、ポリヌクレオチドを切断し、関心対象の領域の切断部位下流の反対側に留まるように設計され得る。典型的には、ポリヌクレオチド誘導型エフェクタータンパク質は、切断部位のPAM遠位側に結合したままであり、切断部位のPAM近位側を、dAテーリング酵素および/またはアダプター結合にアクセス可能なままにする。
【0079】
ポリヌクレオチド誘導型エフェクタータンパク質は、各標的部位において100%の割合で切断しない。本発明者らは、標的ポリヌクレオチドが切断および適合される可能性を高める方法を考案した。この方法は、例えば、アダプターが関心対象の領域の両側に付加されることを確実にするために使用され得る。この方法では、ガイドポリヌクレオチドは、ポリヌクレオチド誘導型エフェクタータンパク質を、標的ポリヌクレオチドの同じ領域内の2つ以上、例えば、3、4、5、6またはそれ以上の部位に導くように設計され、典型的には、例えば、標的ポリヌクレオチドを切断した後、エフェクタータンパク質が、関心対象の領域に切断部位の反対側に結合したままであるように、ポリヌクレオチド誘導型エフェクタータンパク質は同じ配向にある。これは、エフェクタータンパク質が標的ポリヌクレオチドを切断部位のうちの一方または両方で切断した場合に、アダプターを必要に応じて結合することができることを意味する。同じ領域内の2つの切断部位は、互いに約10kb、5kb、1kb、500ヌクレオチド、または100ヌクレオチド内、例えば、約90、80、70、60、50、40、30、20、または10ヌクレオチド内に配置され得る。定義された関心対象の領域の両側に切断部位がある場合、2つ以上、例えば、3、4、5、6、またはそれ以上の切断部位が関心対象の領域のいずれかの側にあり得る。標的ポリヌクレオチドの同じ領域内の切断部位は、同じポリヌクレオチド誘導型エフェクタータンパク質が導かれる部位、または例えばCas9およびCas12a(Cpf1)などの異なるポリヌクレオチド誘導型エフェクタータンパク質が導かれる部位であり得る。
【0080】
したがって、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させるための方法であって、サンプル中のポリヌクレオチドを、標的ポリヌクレオチドの配列に結合する2つのガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質と接触させることであって、2つのガイドポリヌクレオチドが結合する配列が、2つの密接に位置している部位にポリヌクレオチド誘導型エフェクタータンパク質を導き、それによりポリヌクレオチド誘導型エフェクタータンパク質が、2つの部位のうちの少なくとも1つで標的ポリヌクレオチドを切断して、2つの対向する切断末端を生成する、接触させることと、アダプターを、標的ポリヌクレオチドの2つの対向する切断末端のうちの一方または両方を結合させることと、を含む、方法が提供される。
【0081】
関心対象の領域は、配列決定されるなどの特徴付けられる標的ポリヌクレオチドの領域である。関心対象の領域は、その末端で標的化された切断部位によって定義され得る。関心対象の領域は、一端が標的切断部位の位置によって定義され、関心対象の領域が、一方向または両方向に標的切断部位から離れて伸長するという意味で「開口末端」であり得る。切断部位から離れた特定の方向の関心対象の領域の特徴付けは、ガイドポリヌクレオチドを設計することによってバイアスをかけることができ、それによりエフェクタータンパク質は、優先的に、例えば関心対象の領域を特徴付けることを望む側面に対して切断部位の反対側に結合したままである。
【0082】
標的ポリヌクレオチドは、例えばSNPなどの多型を含み得る。一実施形態において、ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質は、SNPなどの多型の部位を標的とするように設計することができ、多型の存在下(または非存在下)でのみ標的ポリヌクレオチドに結合し、切断することができる。代替的に、ガイドポリヌクレオチド/ポリヌクレオチド誘導型エフェクタータンパク質は、例えば、関心対象の領域が、多型を含んでも含まなくてもよい領域であるように、多型を含む領域を特徴付けることができるように、標的ポリヌクレオチドを切断するように設計することができる。
【0083】
ポリヌクレオチド誘導型エフェクタータンパク質が切断して、標的ポリヌクレオチド中に平滑末端を残す場合、アダプター連結を促進するために、末端を修飾してもよい。例えば、アダプターが、単一のまたはポリT尾部などのdT尾部を有する場合、切断末端は、例えば単一のdTまたはポリT尾部を付加するために、dAテーリングされ得る。平滑末端にdA尾部を付加するための方法は、当該技術分野で既知である。任意の好適な方法を使用することができる。一実施形態において、dA尾部は、ポリメラーゼを使用して添加される。ポリメラーゼは、例えば、耐熱性または熱安定性ポリメラーゼであってよい。耐熱性ポリメラーゼまたは熱安定性ポリメラーゼは、典型的には、約50℃、約60℃、約70℃、約75℃、または約80℃を超える温度で安定したままである。典型的には、耐熱性ポリメラーゼまたは熱安定性ポリメラーゼは、約50℃、約60℃、約70℃、約75℃、または約80℃を超える温度でポリメラーゼ活性を有する。例えば、耐熱性ポリメラーゼまたは熱安定性ポリメラーゼは、Taqポリメラーゼであってよい。Taqポリメラーゼが使用される場合、dA尾部は、例えば、約72℃の温度で付加され得る。
【0084】
dAが切断部位をテーリングする前に、エフェクタータンパク質は、不活性化され得る。典型的には、不活性化は、サンプルを、例えば、少なくとも約50℃、約60℃、約70℃、約75℃、または約80℃に加熱することによって達成され得る。サンプルを加熱して、エフェクタータンパク質を、約2分~約20分、例えば、約5分~約15分または約10分不活性化することができる。耐熱性ポリメラーゼまたは熱安定性ポリメラーゼが、dAテーリングに使用される場合、エフェクタータンパク質の熱による不活性化の前に添加され得る。例えば、熱安定性ポリメラーゼは、ポリヌクレオチド誘導型エフェクタータンパク質と同時にサンプルに添加され得る。この実施形態において、エフェクタータンパク質の不活化ステップ中に、dA尾部を切断部位に付加することができる。エフェクタータンパク質を不活性化するために使用される温度で活性ではないポリメラーゼ、例えば、中温性ポリメラーゼがdAテーリングに使用される場合、熱不活化後、サンプルは、典型的には、dAテーリングに使用されるポリメラーゼが最適に活性である温度、例えば、サンプルにポリメラーゼを添加する前に、約37℃または室温まで冷却される。代替的に、中温性ポリメラーゼは、ポリヌクレオチド誘導型エフェクタータンパク質と同時に活性になるように、ポリヌクレオチド誘導型エフェクタータンパク質と同時にサンプルに添加され得る。しかしながら、この実施形態において、dAテーリングにアクセス可能な末端の数は、エフェクタータンパク質の熱不活性化の後にdAテーリングが行われる場合よりも少なくてもよい。好適な中温性ポリメラーゼの例は、E.coli DNAポリメラーゼIのエキソヌクレアーゼ変異体である3’-5’エキソ-KlenowなどのKlenow断片である。
【0085】
この方法の一実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、標的ポリヌクレオチドから除去される。この方法の別の実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、標的ポリヌクレオチドに結合したままではない。
【0086】
エフェクタータンパク質の熱不活化は、標的ポリヌクレオチドからのエフェクタータンパク質の解離を助け、したがって、dAテーリングおよび/またはアダプターの結合のためにアクセス可能な切断末端の数を増加させ、特に、切断部位で形成された2つの対向する末端の両方へのアダプターの結合を促進することができる。エフェクタータンパク質は、典型的には、このステップで変性される。
【0087】
一実施形態において、サンプルは、タンパク質除去されて、切断後に標的ポリヌクレオチドに結合したままである任意のエフェクタータンパク質を除去することができる。例えば、プロテイナーゼは、サンプルをエフェクタータンパク質で十分な時間インキュベートした後、エフェクタータンパク質の熱不活性化の前または後のいずれかに、サンプルに添加することができる。典型的には、除タンパク質ステップは、ポリメラーゼを添加して、dAテーリングステップを実施する前に実施される。除タンパク質ステップの目的は、エフェクタータンパク質の作用によって形成された対向する切断末端の両方にアダプターを結合することができるように、結合したエフェクタータンパク質を放出させることである。
【0088】
場合によっては、エフェクタータンパク質は、例えばエフェクタータンパク質がCas12a(Cpf1)またはS.pyogenes Cas9の類似体である場合、切断後に標的ポリヌクレオチドから放出されてもよい。この場合、切断部位において2つの対向する末端の両方にアダプターを結合するために、除タンパク質は必要とされない。エフェクタータンパク質の熱不活化も、必要とされ得ない。
【0089】
この方法は、サンプル中のポリヌクレオチドを、1つ以上の標的ポリヌクレオチドに結合する1つ以上のガイドポリヌクレオチドと接触させることを含み得る。1つ以上のガイドポリヌクレオチドは、関心対象の領域内または関心対象の領域外の標的ポリヌクレオチドに結合し得る。したがって、この方法は、2つ以上、例えば、3、4、5、7、8、9、10、20、50、100、200、300、400、500、1000、5000、10,000、または100,000もしくはそれ以上のガイドポリヌクレオチドをポリヌクレオチドのサンプルに添加することを含み得る。ガイドポリヌクレオチドは、1つ、2つまたはそれ以上、例えば、3、4、5、7、8、9、10、50、100、500、1000、10,000、または100,000もしくはそれ以上の標的ポリヌクレオチドなどを標的とし得る。
【0090】
ポリヌクレオチドのサンプルが、標的ポリヌクレオチドの異なる配列に結合する2つ以上のガイドポリヌクレオチドと接触させられると、ポリヌクレオチド誘導型エフェクタータンパク質は、2つ以上の部位において標的ポリヌクレオチドを切断し、各部位において2つの対向する切断末端を生成し得る。一実施形態において、2つ以上の部位のうちの少なくとも1つは、標的ポリヌクレオチドの関心対象の領域の第1の側に位置し、2つ以上の部位のうちの少なくとも1つは、標的ポリヌクレオチドの関心対象の領域の第2の側に位置し、2つ以上の部位のうちのいずれも、関心対象の領域内に位置しない。
【0091】
関心対象の領域の各側に位置する部位において標的ポリヌクレオチドを切断した後、ポリヌクレオチド誘導型エフェクタータンパク質が、関心対象の領域を含まないポリヌクレオチドの切断末端に結合したままであるように、ガイドポリヌクレオチドは、配向され得る。このようにして、アダプターは、標的ポリヌクレオチドから脱落するポリヌクレオチド誘導型エフェクタータンパク質に依存することなく、またはポリヌクレオチド誘導型エフェクタータンパク質を能動的に除去するステップを含むことなく、関心対象の領域を含むポリヌクレオチドの両端に添加することができる。
【0092】
一実施形態において、ガイドポリヌクレオチドによって標的化される2つ以上の部位は、標的ポリヌクレオチドの関心対象の領域のいずれかの側において少なくとも2つの部位を含む。一実施形態において、同じポリヌクレオチド誘導型エフェクタータンパク質は、2つ以上の部位のすべてにおいて切断するために使用される。別の実施形態において、異なるポリヌクレオチド誘導型エフェクタータンパク質は、2つ以上の部位において切断するために使用される。例えば、関心対象の領域のうちのいずれかの側にガイドポリヌクレオチドによって標的化される少なくとも2つの部位がある場合、関心対象の領域の第1の側にある部位のうちの1つは、第1のガイドポリヌクレオチドおよび第1のポリヌクレオチド誘導型エフェクタータンパク質によって標的化され得、別の部位は、第2のガイドポリヌクレオチドおよび第2のポリヌクレオチド誘導型エフェクタータンパク質によって標的化され得る。
【0093】
切断部位の片側に結合したままのエフェクタータンパク質から生じる読み取りバイアスは、読み取りの方向性を改善するため、または必要に応じて双方向読み取りの数を増やすために、増加または減少させてもよい。いくつかの実施形態において、バイアスは、エフェクタータンパク質を熱不活性化(変性)することによって、および/またはサンプルを脱タンパク質化することによって低減されてもよい。
【0094】
いくつかの実施形態において、バイアスは、切断されたポリヌクレオチド、典型的にはDNAをRNAaseHで処理することによって低減されてもよい。RNAaseHは、RNA/DNA基質のRNAを切断する。RNAaseH処理は、エフェクタータンパク質の脱タンパク質化または熱不活化の前または後に、好ましくはその後に実行され得るか、またはタンパク質化もしくは熱不活化ステップの非存在下で実行され得る。RNAaseは、典型的には、dAテーリングおよびアダプター連結の前にサンプルに添加される。
【0095】
いくつかの実施形態において、バイアスは、切断されたポリヌクレオチドを3’-5’エキソヌクレアーゼ活性を有する酵素で処理することによって増加してもよい。そのような酵素の一例は、3’-5’エキソヌクレアーゼ活性を有するエキソヌクレアーゼドメインを含むポリメラーゼである。ポリメラーゼは、典型的には、dNTPの不在下で添加され、それにより、それはポリメラーゼ活性を有しない。そのような酵素の別の例は、3’-5’エキソヌクレアーゼである。好ましくは、3’-5’エキソヌクレアーゼ活性を有する酵素は、5’-3’エキソヌクレアーゼ活性を有しない。3’-5’エキソヌクレアーゼ活性を有する好適な酵素の例には、エキソヌクレアーゼI、エキソヌクレアーゼIII、エキソヌクレアーゼT、T4 DNAポリメラーゼ、E.coli DNAポリメラーゼI、phi29 DNAポリメラーゼ、およびT7 DNAポリメラーゼが含まれるが、これらに限定されない。ポリメラーゼは、エフェクタータンパク質の脱タンパク質化または熱不活化の前または後に、好ましくはその後に添加され得るか、または脱タンパク質化もしくは熱不活化ステップが、方法に不在であり得る。ポリメラーゼは、典型的には、dAテーリングおよびアダプター連結の前にサンプルに添加される。
【0096】
アダプターの結合
アダプターは、1つ以上の切断末端、または例えば、dAテーリングされた切断末端などの1つ以上の修飾された切断末端にハイブリダイズされ得る。
【0097】
アダプターが標的ポリヌクレオチドにハイブリダイズして、アダプターの末端(例えば、3’末端)と、アダプターもハイブリダイズされている標的ポリヌクレオチド鎖にハイブリダイズした標的ポリヌクレオチド鎖の末端(例えば、5’末端)との間にギャップがある場合、ギャップを埋めることができる。これにより、アダプターの末端(例えば3’末端)および標的ポリヌクレオチドの末端(例えば5’末端)を互いに共有結合させることができる。
【0098】
二本鎖構築物における一本鎖ギャップを修復するための方法は、当該技術分野で既知である。例えば、ギャップは、DNAポリメラーゼおよびDNAリガーゼなどのポリメラーゼおよびリガーゼを使用して修復することができる。代替的に、ギャップは、ギャップおよびリガーゼを架橋するのに十分な長さのランダムオリゴヌクレオチドを使用して修復することができる。
【0099】
例えば、5’から3’の方向に作用するポリメラーゼを使用して、アダプターを一本鎖領域にハイブリダイズした後、アダプターの末端を伸長して、アダプターの3’末端と、隣接する二本鎖DNAの5’末端との間のギャップを閉じることができる。5’から3’の方向に作用する好適なポリメラーゼには、Taqポリメラーゼ、E.coli DNAポリメラーゼI、Klenow断片、Bst DNAポリメラーゼ、M-MuLV逆転写酵素、phi29ポリメラーゼ、T4 DNAポリメラーゼ、T7 DNAポリメラーゼ、VentおよびDeep Vent DNAポリメラーゼが含まれる。
【0100】
この方法は、アダプターを二本鎖ポリヌクレオチドに共有結合していることをさらに含み得る。典型的には、アダプターの3’末端ヌクレオチドは、一本鎖領域に隣接する5’末端ヌクレオチドに共有結合している。共有結合は、任意の好適な手段によって、例えば、連結またはクリック化学によって達成され得る。
【0101】
したがって、この方法は、共有結合すること、例えば、アダプターを二本鎖ポリヌクレオチドに連結することをさらに含み得る。例えば、T4 DNAリガーゼなどのリガーゼをサンプルに添加して、アダプターを二本鎖ポリヌクレオチドに連結し得る。アダプターは、ATPの不在下で、またはATPの代わりにガンマ-S-ATP(ATPγS)を使用して、二本鎖ポリヌクレオチドに連結され得る。使用することができるリガーゼの例には、T4 DNAリガーゼ、E.coli DNAリガーゼ、Taq DNAリガーゼ、Tma DNAリガーゼ、9°N DNAリガーゼが含まれる。アダプターは、トポイソメラーゼを使用して結合することができる。トポイソメラーゼは、例えば、部分分類(EC)群5.99.1.2および5.99.1.3のうちのいずれかのメンバーであり得る。
【0102】
アダプター
アダプターは、典型的には、3’部分または領域、および5’部分または領域を含み得る。アダプターの3’部分は、二本鎖ポリヌクレオチドにおける一本鎖ポリヌクレオチドの露出したストレッチにハイブリダイズする一本鎖ポリヌクレオチドの3’ストレッチを含む。
【0103】
アダプター中の一本鎖ポリヌクレオチドの3’ストレッチは、約1、2、または3~約15ヌクレオチドの長さ、例えば約4、5、6、または7~約12、10、または8ヌクレオチドの長さであり得る。
【0104】
一実施形態において、アダプター中の一本鎖ポリヌクレオチドの3’ストレッチは、二本鎖ポリヌクレオチド中の一本鎖ポリヌクレオチドの露出したストレッチ中の任意のポリヌクレオチド配列にハイブリダイズすることができるユニバーサルヌクレオチドを含む。
【0105】
一実施形態において、アダプター中の一本鎖ポリヌクレオチドの3’ストレッチは、標的切断部位において一本鎖オーバーハングで露出されるポリヌクレオチド配列に対して相補的な、少なくとも約80%、例えば少なくとも約90%または95%である配列を含む。例えば、アダプター中の一本鎖ポリヌクレオチドの3’ストレッチは、二本鎖ポリヌクレオチド中の一本鎖ポリヌクレオチドの露出したストレッチ中のポリヌクレオチド配列に対して正確に相補的である配列を含み得る。
【0106】
一実施形態において、アダプター中の一本鎖ポリヌクレオチドの3’ストレッチは、アダプターの3’部分の3’末端のヌクレオチドが、一本鎖オーバーハングの5’末端のヌクレオチドにハイブリダイズするように、二本鎖ポリヌクレオチド中の一本鎖ポリヌクレオチドの露出したストレッチにハイブリダイズする。
【0107】
アダプター内の一本鎖ポリヌクレオチドの3’ストレッチは、標的ポリヌクレオチド内の一本鎖オーバーハングと同じ長さであり得るか、またはアダプター中の一本鎖ポリヌクレオチドの3’ストレッチは、標的ポリヌクレオチド中のオーバーハングの長さよりも短くあり得る。
【0108】
アダプターの5’部分は、標的ポリヌクレオチドにハイブリダイズしない。5’部分は、二本鎖でも一本鎖でもよい。典型的には、5’部分は、一本鎖であるか、または一本鎖領域を含む。アダプターの5’部分の一本鎖領域は、例えば、シークエンシング、または他のアダプター、またはプライマーなどのアダプターをさらなるポリペプチドに結合するために使用され得る。
【0109】
5’部分は、約3~約45ヌクレオチド、例えば、約6、8、10、または15~約30、25、または20ヌクレオチドの長さを有し得る。5部分のすべてであり得る5’部分の一本鎖領域は、典型的には、少なくとも約3、6、8、10、または15ヌクレオチドの長さである。
【0110】
アダプターは、典型的には、約15~約40または約20~約30ヌクレオチドなどの約10~約50または約60ヌクレオチドの長さを有する。
【0111】
一実施形態において、アダプターは、一本鎖ポリヌクレオチドであるか、またはそれを含む。一本鎖ポリヌクレオチドは、標的ポリヌクレオチドが切断部位においてポリヌクレオチド誘導型エフェクタータンパク質によって切断されたときに、例えば、5’オーバーハングの標的ポリヌクレオチドの標的切断部位において露出されている配列に、ハイブリダイズする、例えば相補的であるように設計された3’部分を有し得る。アダプターは、一本鎖ポリヌクレオチドのライブラリー中に存在し得る。ライブラリーは、1つ以上の標的ポリヌクレオチドにおける複数の異なる切断部位にハイブリダイズするように設計された一本鎖ポリヌクレオチドを含み得る。この実施形態において、一本鎖ポリヌクレオチドは、バーコードと称され得る。ライブラリー内の各一本鎖ポリヌクレオチドは、相補鎖がハイブリダイズして、5’または中央二本鎖部分を含むアダプターを生成し得る共通の配列を有し得る。ライブラリー内の一本鎖ポリヌクレオチドは、例えば、5’オーバーハングの標的ポリヌクレオチドの標的化された切断部位において露出されている配列に正確に相補的である配列を有する場合、標的ポリヌクレオチドが切断部位においてポリヌクレオチド誘導型エフェクタータンパク質によって切断されたときに、一本鎖ポリヌクレオチドは、特定のバーコードであるとみなされ得る。ライブラリー内の一本鎖ポリヌクレオチドは、例えば、5’オーバーハングの標的ポリヌクレオチドの標的化された切断部位において露出されている配列に部分的にのみ相補的である配列を有する場合、標的ポリヌクレオチドが切断部位においてポリヌクレオチド誘導型エフェクタータンパク質によって切断されたときに、一本鎖ポリヌクレオチドは、一般的なバーコードであるとみなされ得る。
【0112】
一実施形態において、アダプターは、二本鎖ポリヌクレオチドを含み、二本鎖は、中央領域でハイブリダイズし、二本鎖ポリヌクレオチドの一本鎖は、第1の一本鎖オーバーハングを含む3’部分を含む。第1の一本鎖オーバーハングは、ポリヌクレオチド誘導型エフェクタータンパク質が標的ポリヌクレオチドを切断するときに生成されるオーバーハングの配列に相補的である第1の配列を含み得るか、または第1の一本鎖オーバーハングは、例えば、dA尾部にハイブリダイズし得るdT尾部を含み得る。
【0113】
アダプターは、第1の一本鎖オーバーハングに対して中央領域の反対側に配列を有する第2の一本鎖オーバーハングを含み得、第2の配列は、第1の配列とは異なる。第2の一本鎖オーバーハングは、第1の一本鎖オーバーハングと同じ鎖にあってもよく、または第1の一本鎖オーバーハングと反対の鎖にあってもよい。第2の一本鎖オーバーハングは、1、2、3、または4~30、例えば、5~25、6~20、7~15、8~12、または9~10ヌクレオチドの長さを有し得る。第2の一本鎖オーバーハングは、5’オーバーハングまたは3’オーバーハングであり得る。一実施形態において、本方法は、さらなるアダプターを第2の一本鎖オーバーハング配列にハイブリダイズさせることによって、標的ポリヌクレオチドの切断末端に結合したアダプターにさらなるアダプターを結合することをさらに含む。
【0114】
アダプターは、典型的には、ポリヌクレオチドであり、DNA、RNA、修飾DNA(塩基性DNAなど)、RNA、PNA、LNA、BNA、および/またはPEGを含み得る。アダプターは、好ましくは、一本鎖および/または二本鎖DNAおよび/またはRNAを含む。
【0115】
アダプターは、アダプターの5’部分をさらなるアダプターに結合するための化学基(例えば、クリック化学)および/またはアダプターの3’部分を二本鎖ポリヌクレオチドに結合するための化学基(例えば、クリック化学)をさらに含み得る。
【0116】
アダプターは、3’部分および/または5’部分に反応基をさらに含み得る。3’部分の反応基は、アダプターを二本鎖ポリヌクレオチドに共有結合させるために使用され得、および/または5’部分の反応基は、アダプターをさらなるアダプターに共有結合させるために使用され得る。
【0117】
反応基は、クリック化学を使用して、断片をオーバーハングに連結するために使用され得る。クリック化学は、2001年にKolbらによって最初に導入された用語であり、小規模利用および大規模利用の両方において確実に作用する、強力であり、選択的なモジュラービルディングブロックを記載している(Kolb HC,Finn,MG,Sharpless KB,Click chemistry:diverse chemical function from a few good reactions,Angew.Chem.Int.Ed.40(2001)2004-2021)。彼らは、以下のとおりにクリック化学の厳しい基準のセットを定義している:「反応は、モジュラーであって、範囲が広く、非常に高い収率が得られ、非クロマトグラフィー法で除去することができる無害な副産物だけを生成し、立体特異的でなければならない(しかし、必ずしもエナンチオ選択的である必要はない)。要求されるプロセス特徴には、単純な反応条件(理想的には、プロセスは酸素および水に対して無反応性でなければならない)、容易に入手可能な出発物質および試薬、溶媒の不使用、または良溶媒(水など)であり、または容易に除去される溶媒の使用、および簡単な生成物分離が含まれる。必要であれば、精製は、結晶化または蒸留などの非クロマトグラフィー法によるものでなければならず、生成物は、生理学的条件下で安定でなければならない」。
【0118】
クリック化学の好適な例には、以下が含まれるが、これらに限定されない。
(a)アジドが、例えばシクロオクタン環に、歪みを受けているアルキンと反応する、1,3双極性環化付加反応の銅不含バリアント、
(b)一方のリンカー上の酸素求核試薬と、他方のエポキシドまたはアジリジン反応性部分との反応、および
(c)アルキン部分をアリールホスフィンで置換して、アジドとの特異的反応をもたらして、アミド結合を付与することができる、Staudinger連結。
【0119】
本発明では、任意の反応基を使用してもよい。反応基は、クリック化学に適したものであり得る。反応基は、WO2010/086602、特にその出願の表4に開示されているもののうちのいずれであってもよい。
【0120】
一実施形態において、切断部位に結合されたアダプターは、シークエンシングアダプターであり得る。アダプターは、標的ポリヌクレオチドの切断末端に連結され得る。アダプターは、ATPの不在下で、またはATPの代わりにガンマ-S-ATP(ATPγS)を使用して、標的ポリヌクレオチドに連結され得る。アダプターが、核酸処理酵素が結合しているシークエンシングアダプターであるATPの不在下でポリヌクレオチドに連結されることが好ましい。
【0121】
この方法が、同じ標的ポリヌクレオチドまたは異なる標的ポリヌクレオチドにあり得る2つ以上の部位において切断することを含み、一本鎖オーバーハングを生成する場合、切断末端で生成されたオーバーハングは、異なるヌクレオチド配列を有し得る。この実施形態において、方法は、サンプルを複数のアダプターと接触させることを含むことができ、異なるアダプターは、典型的にはオーバーハング配列である異なる一本鎖ポリヌクレオチド配列を含む。異なるアダプターの異なる配列は、異なる標的ポリヌクレオチドまたは同じ標的ポリヌクレオチドの異なる部位においてポリヌクレオチド誘導型エフェクタータンパク質の作用によって生成される異なるオーバーハング配列にハイブリダイズするように設計される。
【0122】
複数のアダプターを利用する方法において、各アダプターは、異なる第1の配列を含み、アダプターのすべては、同じ第2の配列を含み得る。この実施形態において、第2の配列を使用して、アダプターが同じ方法で結合されている標的ポリヌクレオチドのすべてをさらに処理することができる。例えば、第1のアダプター上の5’オーバーハング中の第2の配列にハイブリダイズすることができる一本鎖ポリヌクレオチドを含むさらなるアダプターは、サンプル中の標的ポリヌクレオチドのすべてに結合され得る。さらなるアダプターは、典型的には、第1の第2の配列に相補的である配列を有する一本鎖オーバーハングを含む。第1のアダプターの第2の配列は、さらなるアダプターのオーバーハングの相補配列にハイブリダイズすることができる。
【0123】
第1のアダプターが一本鎖ポリヌクレオチドアダプターである場合、さらなるアダプターは、第1のアダプターが切断末端に結合するときにオーバーハングを形成する一本鎖アダプターのすべてまたは一部にハイブリダイズし得る。
【0124】
好ましくは、第1のアダプターの第2の配列は、さらなるアダプターのオーバーハング配列に正確に相補的である。2つのオーバーハング配列間に1つ以上の塩基対のミスマッチがあり得る可能性がある。例えば、2つまたは3つの塩基対のミスマッチなど、1~4つの塩基対のミスマッチがあり得る。しかしながら、典型的には、2つのオーバーハング配列の間に少なくとも4、例えば、5~20、6~15、または8~10のマッチした塩基がある。
【0125】
さらなるアダプターの5’オーバーハングへの結合を望む場合、相補的な一本鎖領域は、好ましくは、二本鎖のさらなるアダプター上の5’オーバーハングである。例えば、切断末端に結合されるときに露出したアダプターのオーバーハングが、上部の鎖上の5’オーバーハングである場合、さらなるアダプターのオーバーハングは、下部の鎖上の5’オーバーハングであるか、または逆も同様である。代替的に、さらなるアダプターの3’オーバーハングへの結合を望む場合、相補的な一本鎖領域は、典型的には、二本鎖アダプター上の3’オーバーハングである。例えば、切断末端に結合されるときに露出したアダプターのオーバーハングが、下部の鎖上の3’オーバーハングである場合、アダプターのオーバーハングは、上部の鎖上の3’オーバーハングであるか、または逆も同様である。
【0126】
さらなるアダプターのオーバーハングの長さは、典型的には、第1のアダプターが切断末端に結合されるときに露出された第1のアダプターのオーバーハングの長さと同じである。オーバーハングのうちの1つが他のオーバーハングよりも短くなり得ることが可能である。典型的には、オーバーハングは、4~30、例えば、5~25、6~20、7~15、8~12、または9~10ヌクレオチドの領域にわたってハイブリダイズすることができる。ハイブリダイゼーション後、一続きの一本鎖ヌクレオチドが存在する場合、例えば、ポリメラーゼを使用してギャップを埋めることができる。好ましくは、2つの相補的なオーバーハングの長さは、同一である。
【0127】
ユニバーサルオーバーハングに結合されているさらなるアダプターは、例えば、シークエンシングアダプターであり得る。シークエンシングアダプターは、膜貫通孔を利用する配列決定方法のために設計され得る。
【0128】
標的ポリヌクレオチドは、標的ポリヌクレオチド内の単一の切断部位内から配列決定され得る。全標的ポリヌクレオチドは、配列決定され得る。代替的に、標的ポリヌクレオチド内の関心対象の領域のみが、配列決定され得る。
【0129】
アダプターまたはさらなるアダプターは、膜貫通孔を使用して標的ポリヌクレオチドを特徴付けるためのアダプターであり得る。膜貫通孔を使用して標的ポリヌクレオチドを特徴付けるためのアダプターは、好ましくは、リーダー配列、ポリヌクレオチド結合タンパク質、および/または膜もしくは細孔アンカーを含む。
【0130】
第1のアダプターおよび/またはさらなるアダプターは、核酸処理酵素が結合する一本鎖ポリヌクレオチドを含み得る。
【0131】
アダプターまたはさらなるアダプターは、ビーズに結合するためのタグを含み得る。
【0132】
アダプターは、好ましくは、合成または人工のものである。アダプターは、好ましくは、ポリマーを含む。ポリマーは、好ましくは、ポリヌクレオチドである。ポリヌクレオチドアダプターは、DNA、RNA、修飾DNA(塩基性DNAなど)、RNA、PNA、LNA、BNAおよび/またはPEGを含み得る。アダプターは、より好ましくは、DNAまたはRNAを含む。
【0133】
第1のアダプターまたはさらなるアダプターは、シークエンシングアダプターであり得る。シークエンシングアダプターは、Yアダプターであり得る。Yアダプターは、典型的には、ポリヌクレオチドアダプターである。Yアダプターは、典型的には、二本鎖であり、(a)2つの鎖が一緒にハイブリダイズする領域と、(b)2つの鎖が相補的でない末端領域と、を含む。鎖の非相補的な部分がオーバーハングを形成する。Yアダプター中の非相補領域の存在は、二本鎖部分とは異なり2本の鎖が典型的には互いにハイブリダイズしないため、アダプターにY形状を与える。二本鎖部分は、好ましくは、5~約50、例えば、6~約30、7~約20、8~15、または9~約12ヌクレオチド塩基対の長さを有する。オーバーハング領域は、好ましくは、5~約50、例えば、6~約30、7~約20、8~15、または9~約12ヌクレオチドの長さを有する。
【0134】
非相補鎖Yアダプターのうちの1つは、典型的には、リーダー配列を含み、これは膜貫通孔と接触させられると、孔に通すことができる。リーダー配列は、通常は、ポリマーを含む。ポリマーは、好ましくは、負に荷電されている。ポリマーは、好ましくは、DNAまたはRNAなどのポリヌクレオチド、(無塩基DNAなどの)修飾ポリヌクレオチド、PNA、LNA、ポリエチレングリコール(PEG)またはポリペプチドである。リーダーは、好ましくは、ポリヌクレオチドを含み、より好ましくは、一本鎖ポリヌクレオチドを含む。一本鎖リーダー配列は、最も好ましくは、ポリdT切片などのDNAの一本鎖を含む。リーダー配列は、好ましくは、1つ以上のスペーサーを含む。
【0135】
リーダー配列は、任意の長さであり得るが、典型的には、10~150ヌクレオチドの長さ、例えば、20~120、30~100、40~80、または50~70ヌクレオチドの長さである。
【0136】
核酸処理酵素は、好ましくは、リーダー配列を含むオーバーハングであるオーバーハングおよび/または二本鎖領域に結合され得る。酵素は、好ましくは、典型的にはスペーサーによって、またはスペーサーで停止される。WO2014/135838に開示されている酵素およびスペーサーの任意の構成を使用することができる。好ましいスペーサーは、2~20、例えば、4、6、8、または12のiSpC3基、iSp18基またはiSp9基、より好ましくは、4、12、または20のiSpC3基、6のiSpC9基または2もしくは6のiSpC18基を含む。非相補鎖Yアダプターのうちの1つは、典型的には、リーダー配列を含み、これは膜貫通孔と接触させられると、孔に通すことができる。
【0137】
一実施形態において、Yアダプターは、膜アンカーまたは細孔アンカーを含む。アンカーは、酵素が結合していないオーバーハングに相補的であり、したがってそれとハイブリダイズするポリヌクレオチドに結合することができる。アンカーが結合するポリヌクレオチドは、好ましくは、5~約50、例えば6~約30、7~約20、8~15、または9~約12ヌクレオチドの長さである。
【0138】
Yアダプターは、典型的には、ハイブリダイズした領域の反対側の端に、アダプターにそのY形状を与えるオーバーハングに対するさらなる一本鎖オーバーハングを含む。第1のアダプターがYアダプターである場合、Yアダプターは、標的ポリヌクレオチドの切断末端のオーバーハングに相補的であり、2つの鎖が相補的ではない末端領域へのYアダプターの反対側の端にある、一本鎖領域を含む。さらなるアダプターがYアダプターである場合、Yアダプターは、標的ポリヌクレオチドの切断末端に結合された第1のアダプターの末端のオーバーハングに相補的であり、2つの鎖が相補的ではない末端領域へのYアダプターの反対側の端にある、一本鎖領オーバーハングを含む。
【0139】
一実施形態において、アダプターが標的ポリヌクレオチドの各末端の切断部位に結合している場合、アダプターのうちの1つは、ヘアピンループアダプターであり得るか、または2つの末端のうちの1つでアダプターに付加されたさらなるアダプターは、ヘアピンループアダプターであり得る。ヘアピンループアダプターは、単一のポリヌクレオチド鎖を含むアダプターであり、ポリヌクレオチド鎖の末端は、互いにハイブリダイズすることができるか、または互いにハイブリダイズし、ポリヌクレオチドの中央部分はループを形成する。好適なヘアピンループアダプターは、当該技術分野で既知の方法を使用して設計することができる。ループは、任意の長さであり得る。ループは、好ましくは、約2~400、5~300、10~200、20~100ヌクレオチド、または30~50ヌクレオチドの長さである。ポリヌクレオチド鎖の2つのハイブリダイズしたセクションによって形成されるアダプターの二本鎖セクションは、ステムと呼ばれる。ヘアピンループのステムは、好ましくは4~200、例えば、5~150、10~100、20~90、30~80、40~70、または50~60ヌクレオチド対の長さである。核酸処理酵素がヘアピンアダプターに結合しているか、または結合する場合、それは、典型的には、ステムではなくヘアピンのループに結合する。
【0140】
一実施形態において、Yアダプターを標的ポリヌクレオチドの一端に、ヘアピンループアダプターを他端に付加することができる。
【0141】
一実施形態において、Yアダプターおよび/またはヘアピンアダプターなどのシークエンシングアダプターは、膜アンカーまたは細孔アンカーをさらに含む。好適なアンカーは、例えば、WO2012/164270およびWO2015/150786に記載されているように、当該技術分野で既知である。好ましくは、アンカーは、膜アンカーである。好ましくは、膜アンカーは、コレステロールまたは脂肪アシル鎖を含む。例えば、ヘキサデカン酸などの6~30個の炭素原子の長さを有する任意の脂肪アシル鎖を使用することができる。
【0142】
一実施形態において、アダプターまたはさらなるアダプターは、バーコード配列を含む。ポリヌクレオチドバーコードは、当該技術分野で周知である(Kozarewa,et al(2011)Methods Mol.Biol.733:279-298)。
【0143】
一実施形態において、アダプターまたはさらなるアダプターは、PCRプライマーまたは等温増幅用のプライマーなどの増幅プライマーに相補的な配列を含み得る。この方法は、適合したポリヌクレオチドの関心対象の領域に隣接するアダプター内の配列にハイブリダイズする一対のPCR配列を使用して、標的ポリヌクレオチドの関心対象の領域を増幅することをさらに含み得る。この方法は、標的ポリヌクレオチドに結合したアダプター内の配列にハイブリダイズする1つ以上のプライマーを使用して、標的ポリヌクレオチドの関心対象の領域を増幅することをさらに含み得る。
【0144】
一実施形態において、切断された標的ポリヌクレオチドは、アダプター結合の前に増幅され得る。この実施形態において、PCRアダプターなどの増幅アダプターは、切断されたポリヌクレオチドのdA尾部末端に付加される。次いで、PCRなどの増幅反応は、シークエンシングアダプターを付加する前に実行される。
【0145】
PCRアダプターなどの増幅アダプターは、リン酸化または脱リン酸化され得る。いくつかの実施形態において、増幅アダプターの脱リン酸化が好ましい。増幅は、例えば、少なくとも約5%まで、少なくとも約10%以上まで、標的読み取りの数を増加させる。
【0146】
一実施形態において、エフェクタータンパク質(複数可)は、増幅アダプター(例えば、PCRアダプター)は、標的ポリヌクレオチドの両方の末端に連結されるように、標的ポリヌクレオチドの一方の末端の切断部位を標的とし、次いで、標的DNAに連結された増幅アダプター(例えば、PCRアダプター)のオーバーハングに結合するプライマー(例えば、PCR)を使用して増幅される。オーバーハングは、典型的には、プライマーに相補的な5’オーバーハングである。
【0147】
したがって、一実施形態において、増幅プライマー(例えば、PCRプライマー)は、典型的には、二本鎖部分および一本鎖部分を含む。一本鎖部分は、典型的には、5’オーバーハングである。一本鎖部分は、例えば、約10~約100、例えば約30~約80、または約40~約60、例えば約50ヌクレオチドの長さを有し得る。一本鎖領域のすべてまたは一部は、PCRプライマーなどの増幅用プライマーに相補的である。二本鎖部分は、平滑末端を有し得る。平滑末端は、平滑末端切断部位に連結され得る。代替的に、二本鎖領域は、増幅アダプターの中央にあってもよく、増幅アダプターは、第2の一本鎖領域を含んでもよく、第2の一本鎖領域は、3’オーバーハングである。3’オーバーハングは、上記のアダプターの一本鎖ポリヌクレオチドの3’ストレッチと同じ特徴を有し得る一本鎖ポリヌクレオチドの3’ストレッチである。
【0148】
一実施形態において、第1のアダプターまたはさらなるアダプターは、例えば、ビオチン化された第1のアダプターもしくはビオチン化されたさらなるアダプター、または別の親和性分子に結合している第1のアダプターもしくはさらなるアダプター、あるいは捕捉鎖に結合することができるポリヌクレオチド配列を使用することによって、標的ポリヌクレオチドの捕捉を可能にし得る。シグナルは、標的ポリヌクレオチドの容易な検出および/または同定を可能にするために、第1のアダプターまたはさらなるアダプターに結合され得る。シグナルは、例えば、分子ビーコンまたはフルオロフォアであり得る。一実施形態において、第1のアダプターは、消光剤を含み得、さらなるアダプターは、フルオロフォアを含み得、または逆も同様である。
【0149】
一実施形態において、アダプターは、バーコード配列を含み得る。バーコード配列は、当該技術分野で既知である。バーコードは、特定の既知の方法で細孔を通る電流に影響を与える異なるシグナルを生成するポリヌクレオチドの特定の配列である。この方法は、複数のサンプルを分析するための多重法であってもよく、それぞれが異なるバーコードを有する複数のアダプターが利用される。例えば、一実施形態において、複数、例えば2~約100以上、例えば、約5、約10、約20、または約50のサンプルが分析され、各サンプルは、本明細書に開示された方法により処理され、固有のバーコードを含むアダプターが、試験される各サンプルに使用される。サンプルを使用する方法の産物は、バーコードアダプターの連結後にプールされ得る。
【0150】
バーコードは、中間アダプター、例えば、増幅アダプターおよび/またはシークエンシングアダプターに含まれ得る。バーコードがシークエンシングアダプターにある実施形態において、異なるサンプルに対して実施される方法の産物は、シークエンシングアダプターの結合の前または後にプールされ得る。
【0151】
シークエンシングアダプターの付加
一実施形態において、方法は、シークエンシングアダプターを、切断部位に結合されているアダプターの5’部分に結合することをさらに含む。したがって、アダプターは、第1のアダプターまたは中間アダプターとしての役割を果たし得る。
【0152】
シークエンシングアダプターは、第1のアダプターの5’部分における一本鎖ポリヌクレオチドのストレッチにハイブリダイズする一本鎖部分を含み得る。シークエンシングアダプターは、一本鎖リーダー配列、ポリヌクレオチド結合タンパク質、および/または膜もしくは細孔アンカーを含み得る。シークエンシングアダプターは、上記のアダプターの特性のうちのいずれかを有し得る。
【0153】
ハイブリダイゼーション後、シークエンシングアダプターは、リガーゼを使用して、またはクリック化学によってアダプターに共有結合し得る。リガーゼは、例えば、T4 DNAリガーゼ、E.coli DNAリガーゼ、Taq DNAリガーゼ、Tma DNAリガーゼ、および9°N DNAリガーゼであってよい。アダプターは、トポイソメラーゼを使用して結合することができる。トポイソメラーゼは、例えば、部分分類(EC)群5.99.1.2および5.99.1.3のうちのいずれかのメンバーであり得る。シークエンシングアダプターは、ATPの不在下で、またはATPの代わりにガンマ-S-ATP(ATPγS)を使用して、ポリヌクレオチドに連結され得る。核酸処理酵素がシークエンシングアダプターに結合しているATPの不在下で、アダプターをポリヌクレオチドに連結することが好ましい。
【0154】
シークエンシングアダプターは、アダプターが標的ポリヌクレオチドに結合した後に、アダプターに結合させることができる。したがって、この方法は、第1のアダプターを標的ポリヌクレオチドの切断部位に結合させるステップと、シークエンシングアダプターを第1のアダプターに結合させるステップと、を含み得る。したがって、シークエンシングアダプターをサンプルに添加する前に、第1の(中間)アダプターは、サンプルに添加することができる。
【0155】
シークエンシングアダプターは、第1のアダプターが標的ポリヌクレオチドに結合する前に、第1のアダプターに結合させることができる。また、この方法は、単一のステップにおいて、第1のアダプターを標的ポリヌクレオチドに結合させることと、シークエンシングアダプターを第1のアダプターに結合させることと、を含み得る。したがって、シークエンシングアダプターおよび第1の(中間)アダプターは、同時にサンプルに添加することができる。
【0156】
シークエンシングアダプターは、一実施形態において、増幅アダプターが結合している標的ポリヌクレオチドの増幅後に、標的ポリヌクレオチドに添加され得る。
【0157】
核酸処理酵素
アダプターの核酸処理酵素は、ポリヌクレオチドに結合し、ポリヌクレオチドを処理することができる任意のタンパク質であってよい。ポリヌクレオチドの処理において、核酸処理酵素はポリヌクレオチドに沿って移動する。酵素の移動の方向は一貫している。一貫した動きとは、酵素がポリヌクレオチドの5’末端から3’末端に、またはその逆に移動することを意味する。酵素は、ポリヌクレオチドを処理するときにポリヌクレオチドを修飾することができる。ポリヌクレオチドの修飾が起こることは必須ではない。したがって、核酸処理酵素は、ポリヌクレオチドに沿って移動するその能力を保持する修飾された酵素であり得る。
【0158】
核酸処理酵素は、例えば、トランスロカーゼ、ヘリカーゼ、ポリメラーゼ、またはエキソヌクレアーゼであってよい。
【0159】
核酸処理酵素は、一本鎖DNAまたは一本鎖RNAなどの一本鎖ポリヌクレオチドに沿って移動してもよく、または二本鎖DNAまたはDNA/RNAハイブリッドなどの二本鎖ポリヌクレオチドに沿って移動してもよい。例えば、一本鎖または二本鎖DNAのいずれかに作用するヘリカーゼまたはトランスロカーゼを使用することができる。好適なヘリカーゼの例には、Dda、Hel308、NS3、およびTraIが含まれる。これらのヘリカーゼは、典型的には、一本鎖DNAに作用する。二本鎖DNAの両方の鎖に沿って移動することができるヘリカーゼの例には、FtfK、およびRecBCDなどの六量体酵素複合体が含まれる。
【0160】
ヘリカーゼは、WO2013/057495、WO2013/098562、WO2013/098561、WO2014/013260、WO2014/013259、WO2014/013262、およびWO/2015/055981に開示されているヘリカーゼ、修飾ヘリカーゼ、またはヘリカーゼ構築物のいずれであってもよい。Ddaヘリカーゼは、好ましくは、WO/2015/055981、およびWO2016/055777に開示されている修飾のうちのいずれかを含む。
【0161】
核酸処理酵素は、ポリメラーゼであってもよい。ポリメラーゼは通常、ポリヌクレオチドに沿って移動するときに相補的なポリヌクレオチド鎖を合成する。そうでなければ、ポリメラーゼはトランスロカーゼと同様の方法で使用されてもよい。ポリメラーゼは、ポリヌクレオチドに沿って移動する能力を保持するが、相補鎖を合成しない修飾されたポリメラーゼであってもよい。ポリメラーゼは、例えば、PyroPhage(登録商標)3173 DNAポリメラーゼ(Lucigen(登録商標)Corporationから市販されている)、SDポリメラーゼ(Bioron(登録商標)から市販されている)、またはそれらのバリアントであり得る。酵素は、好ましくは、Phi29 DNAポリメラーゼまたはそのバリアントである。トポイソメラーゼは、好ましくは、部分分類(EC)群5.99.1.2および5.99.1.3のいずれかのメンバーである。
【0162】
核酸処理酵素は、エキソヌクレアーゼであってもよい。エキソヌクレアーゼは通常、ポリヌクレオチドに沿って移動するときに、ポリヌクレオチドを消化する。エキソヌクレアーゼは、典型的には、二本鎖ポリヌクレオチドの一方の鎖を切断して、個々のヌクレオチドまたはヌクレオチドのより短い鎖、例えば、ジヌクレオチドまたはトリヌクレオチドを形成する。エキソヌクレアーゼが使用される場合、最終的に選択されるポリヌクレオチドは、二本鎖ポリヌクレオチドの未消化の鎖、または一方の鎖が部分的に消化され、他方の鎖が無傷であるポリヌクレオチドである。
【0163】
核酸処理酵素は、好ましくは、長いポリヌクレオチド鎖を処理することができるものである。典型的には、核酸処理酵素は、500ヌクレオチド塩基対~2億5000万ヌクレオチド塩基対まで、例えば、1,000、2,000、5,000、10,000、50,000または100,000ヌクレオチド塩基対~2億、1億、1千万、100万ヌクレオチド塩基対までのポリヌクレオチド鎖に沿って移動することができる。
【0164】
酵素は、修飾されていても、修飾されていなくてもよい。酵素は修飾されて、閉鎖複合体を形成し得る。閉鎖複合体は、酵素がポリヌクレオチドの末端に到達する場合を除き酵素がポリヌクレオチドから脱落しないように酵素がポリヌクレオチドの周りで閉鎖されるようにポリヌクレオチド結合部位が修飾されている酵素である。好適な閉鎖複合体酵素および閉鎖複合体を生成するために酵素を修飾する方法の例は、例えば、WO2014/013260およびWO2015/055981に開示されている。
【0165】
特徴付け方法
ポリヌクレオチドを特徴付ける方法が提供される。上記の方法は、標的ポリヌクレオチドを特徴付けることをさらに含み得る。
【0166】
標的ポリヌクレオチドを検出および/または特徴付ける方法は、典型的には、
(a)本明細書に記載の方法により得られた修飾ポリヌクレオチドサンプルを、膜貫通孔を含む膜と接触させることと、
(b)膜にわたって電位差を印加することと、
(c)複合体と膜貫通孔との相互作用から生じる効果の存在または不在についてモニタリングして、複合体の存在または不在を判定し、それによりサンプル中の標的ポリヌクレオチドを検出すること、および/または複合体と膜貫通孔との相互作用をモニタリングして、標的ポリヌクレオチドの1つ以上の特徴を判定することと、を含む。
【0167】
この方法は、各ポリヌクレオチドの2つ、3つ、4つ、または5つ以上の特徴を測定することを含み得る。1つ以上の特徴は、好ましくは、(i)ポリヌクレオチドの長さ、(ii)ポリヌクレオチドの同一性、(iii)ポリヌクレオチドの配列、(iv)ポリヌクレオチドの二次構造、および(v)ポリヌクレオチドが修飾されているか否かから選択される。{i}、{ii}、{iii}、{iv}、{v}、{i,ii}、{i,iii}、{i,iv}、{i,v}、{ii,iii}、{ii,iv}、{ii,v}、{iii,iv}、{iii,v}、{iv,v}、{i,ii,iii}、{i,ii,iv}、{i,ii,v}、{i,iii,iv}、{i,iii,v}、{i,iv,v}、{ii,iii,iv}、{ii,iii,v}、{ii,iv,v}、{iii,iv,v}、{i,ii,iii,iv}、{i,ii,iii,v}、{i,ii,iv,v}、{i,iii,iv,v}、{ii,iii,iv,v}、または{i,ii,iii,iv,v}などの(i)~(v)の任意の組み合わせが本発明に従って測定され得る。
【0168】
標的ポリヌクレオチドは、好ましくは、配列決定によって特徴付けられる。
【0169】
(i)について、ポリヌクレオチドの長さは、例えば、ポリヌクレオチドと細孔との間の相互作用の数またはポリヌクレオチドと細孔との間の相互作用の持続時間を判定することによって測定され得る。
【0170】
(ii)について、ポリヌクレオチドの同一性は、いくつかの方法で測定され得る。ポリヌクレオチドの同一性は、ポリヌクレオチドの配列の測定と併せて、またはポリヌクレオチドの配列の測定を伴わずに測定され得る。前者は簡単であり、ポリヌクレオチドが配列決定され、それにより同定される。後者は、いくつかの方法で行うことができる。例えば、ポリヌクレオチド中の特定のモチーフの存在が測定され得る(ポリヌクレオチドの残りの配列を測定することなく)。代替的には、本方法における特定の電気的および/または光学的シグナルの測定は、特定の供給源から得られるものとしてポリヌクレオチドを同定することができる。
【0171】
(iii)について、ポリヌクレオチドの配列は、前述のように決定することができる。好適な配列決定方法、特に電気的測定を使用するものは、Stoddart D et al.,Proc Natl Acad Sci,12;106(19):7702-7、Lieberman KR et al,J Am Chem Soc.2010;132(50):17961-72、および国際出願第WO2000/28312号に記載されている。
【0172】
(iv)について、二次構造は、様々な方法で測定され得る。例えば、方法が電気的測定を伴う場合、二次構造は、滞留時間の変化または細孔を通過する電流の変化を使用して測定され得る。これは、一本鎖および二本鎖ポリヌクレオチドの領域を識別することを可能にする。
【0173】
(v)について、任意の修飾の存在または不在が測定され得る。この方法は、好ましくは、メチル化によって、酸化によって、損傷によって、1つ以上のタンパク質によって、または1つ以上の標識、タグ、もしくはスペーサーによってポリヌクレオチドが修飾されているか否かを決定することを含む。特異的修飾は、細孔との特異的相互作用をもたらすことになり、これは下記の方法を使用して測定することができる。例えば、メチルシオチン(methylcyotsine)は、各ヌクレオチドとのその相互作用中に細孔を通過する電流に基づき、シトシンと区別され得る。
【0174】
この方法は、細孔が膜中に存在する膜/細孔システムを調査するのに適した任意の装置を用いて実施してもよい。この方法は、膜貫通孔センシングに適した任意の装置を用いて実施してもよい。例えば、装置は、水溶液を含むチャンバと、チャンバを2つの区画に分ける障壁とを備える。障壁は、典型的には、細孔を含有する膜が形成される孔を有する。代替的には、障壁は、細孔が存在する膜を形成する。膜貫通孔は、当該技術分野で既知である。ポリヌクレオチドの配列および他の特性を決定するために電流シグナルを分析する方法と同様に、好適な膜およびデバイスもまた知られている。この方法は、WO2008/102120に記載されている装置を用いて実施してもよい。様々な異なる種類の測定を行ってもよい。これは、電気的測定および光学的測定を含むが、これらに限定されない。蛍光の測定を含む好適な光学的方法は、J.Am.Chem.Soc.2009,131 1652-1653によって開示されている。考えられる電気的測定としては、電流測定、インピーダンス測定、トンネル効果測定(Ivanov AP et al.,Nano Lett.2011 Jan 12;11(1):279-85)、およびFET測定(国際出願第WO2005/124888号)が挙げられる。光学的測定は、電気的測定と組み合わされ得る(Soni GV et al.,Rev Sci Instrum.2010 Jan;81(1):014301)。測定は、膜貫通電流測定、例えば、細孔を通過するイオン電流の測定であり得る。
【0175】
特徴付け方法は、典型的には、ポリヌクレオチドが膜貫通孔に対して移動する際に膜貫通孔を通過する電流を測定することを含む。
【0176】
ビーズは、例えばWO2016/059375に開示されているように、細孔への標的ポリヌクレオチドの送達を促進するために使用されてもよい。
【0177】
キット
ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に修飾するためのキットも提供される。一実施形態において、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に修飾するためのキットは、デホスホリラーゼと、アダプターと、任意にポリメラーゼ、リガーゼ、ポリヌクレオチド誘導型エフェクタータンパク質、およびガイドポリヌクレオチドのうちの1つ以上と、を含む。キットは、1つ以上のガイドポリヌクレオチドおよび/または1つ以上のポリヌクレオチド誘導型エフェクタータンパク質をさらに含み得る。キット中のアダプターは、単一のNまたはポリN尾部などのdN尾部を含むことができ、式中、Nは、ヌクレオチドA、T、C、またはGである。
【0178】
一実施形態において、キットは、本明細書に記載されるように、1つ以上のガイドポリヌクレオチドおよび/または1つ以上の第1のアダプターと一緒に1つ以上の第1のアダプターを含み得る。キットは、本明細書に定義されるように、1つ以上のポリヌクレオチド誘導型エフェクタータンパク質および/または1つ以上のさらなるアダプターをさらに含み得る。
【0179】
一実施形態において、キットは、標的ポリヌクレオチド中の配列に結合するガイドポリヌクレオチドと、標的ポリヌクレオチドを切断して、オーバーハングを含む切断末端を生成することができるポリヌクレオチド誘導型エフェクタータンパク質と、中央二本鎖領域を含む第1のアダプターと、を含み得、一方の末端の第1の一本鎖領域は、ポリヌクレオチド誘導型エフェクタータンパク質が標的ポリヌクレオチドを切断するときに生成されるオーバーハングの配列に相補的である第1の配列を有する。
【0180】
第1のアダプターは、本明細書で定義されているアダプターのうちのいずれであってもよい。第1のアダプターは、任意に、第1の一本鎖オーバーハングへのアダプターの他方の末端に第2の一本鎖オーバーハングをさらに含んでもよく、第2の一本鎖オーバーハングは、第1の配列とは異なる第2の配列を有し、このキットは、第1のアダプターの第2の配列に相補的である配列を有する一本鎖領域を含むさらなるアダプターを含み得る。
【0181】
中央二本鎖領域と、ポリヌクレオチド誘導型エフェクタータンパク質が標的ポリヌクレオチドを切断するときに生成されるオーバーハングの配列に相補的である第1の配列を有する一方の末端に第1の一本鎖領域と、第2の配列が、第1の配列とは異なる、ポリヌクレオチドおよび第2の配列を有する他方の末端に第2の一本鎖領域と、を含む、第1のアダプターと、第1のアダプターにおける第2の配列に相補的である配列を有する一本鎖領域を含むさらなるアダプターと、を含むキットも提供される。
【0182】
第1のアダプターは、本明細書で定義されているアダプターのうちのいずれであってもよい。さらなるアダプターは、本明細書で定義されているさらなるアダプターうちのいずれであってもよい。
【0183】
上記の上のキットの実施形態のいずれにおいても、キットは、本明細書に記載されているように、1つ以上、例えば、2~50、3~40、5~30、または10~20の第1のアダプターと、本明細書で定義されているように、1つ以上のさらなるアダプター、例えば、2~50、3~40、5~30、または10~20のさらなるアダプターを含み得る。
【0184】
好ましくは、キットは、第1のアダプターのパネルを含み、各アダプターは、第1のオーバーハング領域内に異なる配列および第2のオーバーハング領域内に同じ配列を有する。パネルの第1のアダプターが、第2のオーバーハング領域内に同じ配列を有する場合、キットは、好ましくは、1種類のさらなるアダプターを含む。
【0185】
システム
一態様では、ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させるためのシステムが、提供され、このシステムは、
(a)ポリヌクレオチドの末端を保護するための手段と、
(b)標的ポリヌクレオチドの配列に結合するガイドポリヌクレオチドと、
(c)ポリヌクレオチド誘導型エフェクタータンパク質と、
(d)ポリヌクレオチド誘導型エフェクタータンパク質によって生成(create)された切断ポリヌクレオチド末端と互換性があるアダプターと、を含む。
【0186】
一実施形態において、ポリヌクレオチドの末端を保護するための手段は、デホスホリラーゼである。デホスホリラーゼは、ポリヌクレオチドの5’末端を脱リン酸化することによって、サンプル中のポリヌクレオチドの末端を保護する。
【0187】
サンプル中の標的ポリヌクレオチドの存在を検出するためのシステムも提供され、このシステムは、ナノ細孔、例えば、膜中に存在するナノ細孔をさらに含む。いくつかの実施形態において、このシステムは、シークエンシングデバイスまたは装置と互換性があるフローセルを含む。
【0188】
このシステムでは、ポリヌクレオチド誘導型エフェクタータンパク質は、いくつかの実施形態において、RNA誘導型エフェクタータンパク質、例えば、Cas3、Cas4、Cas8a、Cas8b、Cas8c、Cas9、Cas10、Cas10d、Cas12a、Cas13、Csn2、Csf1、Cmr5、Csm2、Csy1、Cse1、C2c2、Cas14、CasX、またはCasYである。いくつかの実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、二本鎖ポリヌクレオチドの一方の鎖を切断する。他の実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、二本鎖ポリヌクレオチドの両方の鎖を切断して、平滑末端を生成する。さらに他の実施形態において、ポリヌクレオチド誘導型エフェクタータンパク質は、二本鎖ポリヌクレオチドの両方の鎖を切断して、一本鎖オーバーハングを生成する。
【0189】
このシステムでは、いくつかの実施形態において、アダプターは、単一のNまたはポリN尾部を含み、式中、Nは、ヌクレオチドA、T、C、またはGである。一実施形態において、アダプターは、単一のTまたはポリT尾部を含む。一実施形態において、アダプターは、中間アダプターであり、システムは、中間アダプターに相補的な部分を含むシークエンシングアダプターをさらに含む。シークエンシングアダプターは、例えば、一本鎖リーダー配列、ポリヌクレオチド結合タンパク質、および/または膜もしくは細孔アンカーであり得る。
【0190】
一実施形態において、システムは、ポリヌクレオチド誘導型エフェクタータンパク質が、2つ以上の部位において標的ポリヌクレオチドを切断して、各部位において2つの対向する切断末端を生成するように、標的ポリヌクレオチドの異なる配列に結合する2つ以上のガイドポリヌクレオチドを含む。
【0191】
一実施形態において、システムは、アダプター内の配列に相補的な一対のPCRプライマーをさらに含む。
【0192】
いくつかの実施形態において、システムは、ポリメラーゼおよび/またはリガーゼをさらに含む。
本発明の様々な実施形態を以下に示す。
1.ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させるための方法であって、
(a)前記サンプル中の前記ポリヌクレオチドの末端を保護することと、
(b)前記ポリヌクレオチドを、前記標的ポリヌクレオチドの配列に結合するガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質と接触させ、それにより前記ポリヌクレオチド誘導型エフェクタータンパク質が、前記標的ポリヌクレオチドを切断して、前記ガイドポリヌクレオチドが結合する配列によって判定された部位において2つの対向する切断末端を生成する、ことと、
(c)アダプターを、前記標的ポリヌクレオチドの前記2つの対向する切断末端のうちの一方または両方に結合させることと、を含み、
前記アダプターが、前記標的ポリヌクレオチドの切断末端のうちの一方または両方に結合するが、前記サンプル中の前記ポリヌクレオチドの保護末端には結合しない、方法。
2.前記サンプル中の前記ポリヌクレオチドの末端が、前記ポリヌクレオチドの5’末端を脱リン酸化することによって保護される、上記1に記載の方法。
3.前記ポリヌクレオチドの5’末端が、前記ポリヌクレオチドのサンプルにデホスホリラーゼを添加することによって脱リン酸化される、上記2に記載の方法。
4.前記サンプル中の前記ポリヌクレオチドの末端が、前記ポリヌクレオチドの3’末端を伸長して、一本鎖オーバーハングを生成することによって保護される、上記1に記載の方法。
5.前記ポリヌクレオチドの3’末端が、前記ポリヌクレオチドのサンプルに末端トランスフェラーゼおよびdNTPを添加することによって伸長される、上記4に記載の方法。
6.前記ポリヌクレオチド誘導型エフェクタータンパク質が、RNA誘導型エフェクタータンパク質である、上記1~5のいずれかに記載の方法。
7.前記ポリヌクレオチド誘導型エフェクタータンパク質が、Cas3、Cas4、Cas8a、Cas8b、Cas8c、Cas9、Cas10、Cas10d、Cas12a、Cas13、Csn2、Csf1、Cmr5、Csm2、Csy1、Cse1、またはC2c2である、上記6に記載の方法。
8.前記標的ポリヌクレオチドが、二本鎖DNAを含む、上記1~7のいずれかに記載の方法。
9.前記ポリヌクレオチド誘導型エフェクタータンパク質が、二本鎖ポリヌクレオチドの一方の鎖を切断する、上記1~8のいずれかに記載の方法。
10.前記ポリヌクレオチド誘導型エフェクタータンパク質が、二本鎖ポリヌクレオチドの両方の鎖を切断して、平滑末端を生成する、上記1~9のいずれかに記載の方法。
11.前記ポリヌクレオチド誘導型エフェクタータンパク質が、二本鎖ポリヌクレオチドの両方の鎖を切断して、一本鎖オーバーハングを生成する、上記1~10のいずれかに記載の方法。
12.前記方法が、前記サンプルをポリメラーゼまたは末端トランスフェラーゼおよびdNTPと接触させて、オーバーハングを充填し、平滑末端または単一ヌクレオチドオーバーハングを生成することを含む、上記11に記載の方法。
13.前記アダプターが、単一のTまたはポリT尾部を含み、前記方法が、ステップ(c)の前に前記サンプルをポリメラーゼおよびdATPと接触させて、単一のA尾部を前記標的ポリヌクレオチドの切断末端のうちの少なくとも1つに添加することをさらに含む、上記1~12のいずれかに記載の方法。
14.前記ポリメラーゼが、約60℃を超える温度で活性である、上記13に記載の方法。
15.前記ポリメラーゼが、Taqポリメラーゼである、上記13または14に記載の方法。
16.前記アダプターが、前記標的ポリヌクレオチドに共有結合している、上記1~15のいずれかに記載の方法。
17.前記アダプターが、連結またはトポ異性化によって標的ポリヌクレオチドに共有結合している、上記16に記載の方法。
18.前記ポリヌクレオチド誘導型エフェクタータンパク質が、前記2つの対向する切断末端のうちの一方に結合したままであり、前記アダプターが、前記2つの対向する切断末端のうちの他方に結合している、上記1~17のいずれかに記載の方法。
19.前記ポリヌクレオチド誘導型エフェクタータンパク質が、前記標的ポリヌクレオチドに結合したままではないか、または前記標的ポリヌクレオチドから除去される、上記1~18のいずれかに記載の方法。
20.前記アダプターが、中間アダプターであり、前記方法が、前記中間アダプターにさらなるアダプターを結合することを含む、上記1~19のいずれかに記載の方法。
21.前記さらなるアダプターが、シークエンシングアダプターである、上記20に記載の方法。
22.前記ポリヌクレオチドを、関心対象の領域内の前記標的ポリヌクレオチドに結合する1つ以上のガイドポリヌクレオチドと接触させる、上記1~21のいずれかに記載の方法。
23.前記ポリヌクレオチドを、関心対象の領域外の前記標的ポリヌクレオチドに結合する1つ以上のガイドポリヌクレオチドと接触させる、上記1~21のいずれかに記載の方法。
24.前記ポリヌクレオチドを、前記標的ポリヌクレオチドの異なる配列に結合する2つ以上のガイドポリヌクレオチドと接触させ、それにより前記ポリヌクレオチド誘導型エフェクタータンパク質が、2つ以上の部位において前記標的ポリヌクレオチドを切断し、各部位において2つの対向する切断末端を生成する、上記1~23のいずれかに記載の方法。
25.前記2つ以上の部位のうちの少なくとも1つが、前記標的ポリヌクレオチドの関心対象の領域の各側に位置し、前記2つ以上の部位のいずれも、関心対象の領域内に位置しない、上記24に記載の方法。
26.関心対象の領域の各側に位置する部位において前記標的ポリヌクレオチドを切断した後、前記ポリヌクレオチド誘導型エフェクタータンパク質が、関心対象の領域を含まない前記ポリヌクレオチドの切断末端に結合したままであるように、前記ガイドポリヌクレオチドが配向されている、上記24または25に記載の方法。
27.前記2つ以上の部位が、前記標的ポリヌクレオチドの関心対象の領域のいずれかの側において少なくとも2つの部位を含む、上記24~26のいずれかに記載の方法。
28.前記同じポリヌクレオチド誘導型エフェクタータンパク質が、前記2つ以上の部位のすべてにおいて切断するために使用される、上記24~27のいずれかに記載の方法。
29.異なるポリヌクレオチド誘導型エフェクタータンパク質が、前記2つ以上の部位において切断するために使用される、上記24~27のいずれかに記載の方法。
30.前記方法が、前記適合されたポリヌクレオチドの関心対象の領域に隣接する前記アダプター内の配列にハイブリダイズする一対のPCRプライマーを使用して、標的ポリヌクレオチドの関心対象の領域を増幅することをさらに含む、上記24~29のいずれかに記載の方法。
31.2つ以上の異なる標的ポリヌクレオチドの配列に結合する2つ以上のガイドポリヌクレオチドが、前記標的ポリヌクレオチドのそれぞれにおいて関心対象の少なくとも1つの領域内のまたはそれに隣接するアダプターを結合するために、前記方法において使用される、上記1~30のいずれかに記載の方法。
32.前記2つ以上のガイドポリヌクレオチドが、標的ポリヌクレオチドの関心対象の2つ以上の領域内のまたはそれに隣接するアダプターを結合するために、前記方法において使用される、上記1~31のいずれかに記載の方法。
33.前記適合されたポリヌクレオチドにおいて前記アダプターにさらなるアダプターを結合することをさらに含む、上記1~32のいずれかに記載の方法。
34.前記さらなるアダプターが、シークエンシングアダプターである、上記33に記載の方法。
35.前記シークエンシングアダプターが、一本鎖リーダー配列、ポリヌクレオチド結合タンパク質、および/または膜もしくは細孔アンカーを含む、上記34に記載の方法。
36.前記方法が、前記標的ポリヌクレオチドを特徴付けることをさらに含む、上記1~35のいずれかに記載の方法。
37.標的ポリヌクレオチドを検出するおよび/または特徴付ける方法であって、
(i)上記1~35のいずれかに記載の方法によって得られたサンプルをナノ細孔と接触させることと、
(ii)前記ナノ細孔にわたって電位差を印加することと、
(iii)前記標的ポリヌクレオチドと前記ナノ細孔との相互作用から生じる効果の存在または不在についてモニタリングして、前記標的ポリヌクレオチドの存在または不在を判定し、それにより前記サンプル中の前記標的ポリヌクレオチドを検出すること、および/または前記標的ポリヌクレオチドと前記ナノ細孔との相互作用をモニタリングして、前記標的ポリヌクレオチドの1つ以上の特徴を判定することと、を含む、方法。
38.前記標的ポリヌクレオチドが、配列決定によって特徴付けられる、上記37に記載の方法。
39.ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に修飾するためのキットであって、デホスホリラーゼと、単一のNまたはポリN尾部を含むアダプターであって、Nが、ヌクレオチドA、T、C、またはGである、アダプターと、任意にポリメラーゼ、リガーゼ、ポリヌクレオチド誘導型エフェクタータンパク質、およびガイドポリヌクレオチドのうちの1つ以上と、を含む、キット。
40.ポリヌクレオチドのサンプル中の標的ポリヌクレオチドを選択的に適合させるための方法であって、
(a)前記サンプル中の前記ポリヌクレオチドを、前記標的ポリヌクレオチドの配列に結合する2つのガイドポリヌクレオチドおよびポリヌクレオチド誘導型エフェクタータンパク質と接触させることであって、前記2つのガイドポリヌクレオチドが結合する配列が、前記ポリヌクレオチド誘導型エフェクタータンパク質を2つの部位に導き、それにより前記ポリヌクレオチド誘導型エフェクタータンパク質が、前記2つの部位のうちの少なくとも1つにおいて前記標的ポリヌクレオチドを切断して、2つの対向する切断末端を生成する、ことと、
(b)アダプターを、前記標的ポリヌクレオチドの前記2つの対向する切断末端のうちの一方または両方に結合することと、を含む、方法。
【0193】
下記の非限定的な実施例は、本発明を説明する。
【0194】
実施例1
この実施例は、単一の縮退合成crRNAプローブをどのように使用して、ナノ細孔シークエンシング用の細菌ゲノムの重複領域を濃縮するかを示す。この濃縮は、標的DNAと非標的DNAの物理的な分離によってではなく、標的領域の脱リン酸化およびCRISPR/Cas9によって媒介した切断によってアダプター連結に対するDNA末端の保護および脱保護によって、それぞれ発生する。ここでは、酵素ステップ(脱リン酸化、Cas9によって媒介した切断、dAテーリング、およびアダプター連結)が、連続して実行される、シンプルなワンポットアプローチについて説明する。
【0195】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して大腸菌(SCS110株)から抽出することによって精製した。5μgのgDNAは、子ウシ腸デホスホリラーゼによる処理を介して脱リン酸化された。2.5μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs,Inc.、カタログ番号M0508から)を、合計50μLのNEB CutSmart緩衝液(New England Biolabs,Inc.、カタログ番号B7204)の5μgのgDNAに37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0196】
野生型S.pyogenes Cas9リボ核タンパク質複合体(RNP)は、以下のとおりに調製した。オリゴヌクレオチドAR363(5’DNA伸長を有する合成tracrRNA、ここでは使用されない)およびAR400(合成crRNA)は、初めに、1μLのAR363(100μM)、1μLのAR400(100μM)、および8μLのヌクレアーゼフリー二重緩衝液(Integrated DNA Technologies,Inc.、カタログ番号11-01-03-01)で95℃で5分間インキュベートし、室温に冷却することによってアニーリングして、10μMのtracrRNA-crRNA複合体を形成した。次いで、RNPは、9μLのtracrRNA-crRNA複合体(最終濃度600nM)を、合計150μLのNEB CutSmart緩衝液中の200nMのS.pyogenes Cas9(New England Biolabs,Inc.、カタログ番号M0386M)で、室温で20分間インキュベートすることによって形成された。このステップにより、150μLの「Cas9 RNP」を得た。
【0197】
3つの異なる反応が、以下のとおりに、3つの単一のチューブで実施された。
(1)dAテーリングを、Taqポリメラーゼを使用して実施し、Cas9 RNPおよびTaqポリメラーゼを、反応混合物に同時に添加したが、dAテーリング反応は、温度を37℃(Cas9標的の切断が最適に近い温度)から72℃(Cas9を熱不活性化するが、TaqポリメラーゼはdAテーリングに最適な温度)に上昇させることによって開始する、標的切断反応。
500ngの末端保護されたgDNAは、5μL(500ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)、25μLのCas9 RNP(上記)、200μMのdATP(1.6μLの10mMストック)、5,000単位(1μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)、4.5μLのNEB CutSmart緩衝液、40.5μLのヌクレアーゼフリー水の合計77.6μLでのインキュベーションによって、切断され、dAテーリングされた。この混合物を、Cas9を使用して、37℃で30分間インキュベートし、次いで72℃で5分間インキュベートして、標的部位を切断し、PCRサーモサイクラーを使用して、Cas9およびdA尾部の両方を、アクセス可能なすべての3’末端を変性させ、500ngの「TaqポリメラーゼによってdAテーリングされ、標的が切断されたDNA」を得た。このステップは、上記の脱リン酸化ステップと同じチューブで行われ、次の連結ステップに持ち越された。
【0198】
(2)E.coli DNAポリメラーゼIのエキソヌクレアーゼ変異体であるKlenow断片を使用して、Cas9によって媒介した標的切断と同時にdAテーリングを行った、標的切断反応。
500ngの末端保護されたgDNAは、5μL(500ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)、25μLのCas9 RNP(上記)、200μMのdATP(1.6μLの10mMストック)、4.5μLのNEB CutSmart緩衝液、4.5μL(22,500単位)のKlenow断片(5’-3’エキソ-;NEB、カタログ番号M0212)、および40.5μLのヌクレアーゼフリー水を、合計79.5μLのインキュベーションによって切断された。この混合物を、37℃で30分間インキュベートして、Cas9およびdA尾部のすべてのアクセス可能な3’末端を使用して、標的部位を切断した。その後、Cas9およびKlenow断片を、75℃で20分間熱変性した。このステップにより、500ngの「Klenow断片によって同時にdAテーリングされ、標的が切断されたDNA」を得た。
【0199】
(3)Cas9 RNPおよびE.coli DNAポリメラーゼIのエキソヌクレアーゼ変異体であるKlenow断片を使用して、切断およびdAテーリングを連続して行った、標的切断反応。
500ngの末端保護されたgDNAは、5μL(500ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)、25μLのCas9 RNP(上記)、200μMのdATP(1.6μLの10mMストック)、40.5μLのヌクレアーゼフリー水、および4.5μLのNEB CutSmart緩衝液のインキュベーション(37℃で30分間)によって切断された。次いで、Cas9を、75℃で20分間インキュベートし、室温まで冷却することによって熱不活化した。同じチューブに、4.5μL(22,500単位)のKlenow断片(5’-3’エキソ-;NEB、カタログ番号M0212)を、合計79.5μL添加した。この混合物を、37℃で30分間インキュベートして、アクセス可能なDNA末端をdAテーリングした。続いて、Klenow断片を、75℃で20分間熱変性した。このステップにより、500ngの「Klenow断片によって連続的にdAテーリングされ、標的が切断されたDNA」を得た。
【0200】
標的の切断およびdAテーリングのステップに続いて、シークエンシングアダプターを、各サンプルに連結した。標的が切断され、dAテーリングされたgDNAを、40μLの4倍連結緩衝液(ONLS13117)、2.35μLのAMX 1D(Vivaspin-500濃縮器;Sartoriusを使用して1.7μMに濃縮したOxford Nanopore LSK-108から)、10μLのT4 DNAリガーゼ(NEB Quick Ligaseキット、NEB、カタログ番号M2200から200万単位/mL)、および26.7μLのヌクレアーゼフリー水の合計容量約160μLを使用したインキュベーションによって同じチューブ内でアダプター連結を行った。この混合物を、室温で10分間インキュベートして、アダプターが連結したgDNAを得た。次いで、混合物をSPRI精製に供して、連結されていないアダプターおよび他の汚染物質を除去した。0.4容量(約64μL)のSPRIビーズ(AMPure XPビーズ、Beckman Coulter,Inc.)を、アダプター連結したDNAに添加し、逆さにして穏やかに混合し、室温で10分間インキュベートして、アダプター連結DNAをビーズに結合した。磁気セパレーターを使用して、ビーズをペレット化し、上清を除去し、250μLのABB(Oxford Nanopore LSK-108から)で2回洗浄し、各洗浄でビーズを完全に再懸濁し、洗浄後にビーズを再ペレット化した。2回目の洗浄の後、ビーズをもう一度ペレット化し、余分な洗浄緩衝液を除去し、16μLのTris溶出緩衝液(10mMのTris-Cl、20mMのNaCl、室温でpH7.5)にビーズペレットを室温で10分間再懸濁することによって、DNAをビーズから溶出した。ビーズをもう一度ペレット化し、精製されたgDNAを含む溶出液(上清)を、標的部位に適合させて保持した。23.3μLのRBFおよび11.7μLのLLB(どちらもOxford Nanopore TechnologiesのLSK-108から)を、15μLの溶出液に加えて、「MinIONシークエンシングミックス」を得た。
【0201】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-108からの480μLのRBF、520μLのヌクレアーゼフリー水、0.5μLの100μMのコレステロールアダプターテザーSK43を使用して調製)を導入することによって、Oxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックスを、SpotONポートを介してフローセルに添加し、ポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.10.6)を使用して、6時間のシークエンシングデータを収集し、その後、オフラインでベースコール(Albacoreを使用して)して、E.coli SCS110参照ゲノムに位置合わせした。
【0202】
結果
図15および下の表1は、Taqポリメラーゼ条件(条件(1))からの順方向と逆方向の読み取り間のバイアスを調べる。縮重crRNAプローブによって標的化されたrrs遺伝子は、E.coli SCS110参照で両方の方向に見られる。7つのrrs遺伝子のうち6つは、読み取り方向に明らかなバイアスを示し、これは参照ゲノム内の遺伝子の方向と相関した。他の2つの条件(条件(2)および(3)、
図15)でも非常に類似したバイアスが観察された。
【0203】
図16は、E.coli参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。上記の実験で使用したcrRNAは、E.coli SCS110株のrrs遺伝子の7つのコピーすべてに共通のプロトスペーサー配列を標的化する。予想どおりに、7つのrrs遺伝子(その位置は下の表1に示される)のそれぞれで観察された標的領域の濃縮により、Cas9が主に正しい位置で切断し、切断部位が(様々な範囲まで)解放され、dAテーリングされ、アダプターが切断部位に効率的に連結されたことを示す。
【0204】
図16はまた、使用されるアプローチ間の違いも強調する。Taqポリメラーゼを使用して、切断されたサンプルが72℃でdAテーリングされたときに(条件(1))、最高のオンターゲットスループット(8698)を得た。逆に、切断されたサンプルが、37℃(条件(2))でのCas9切断と同時にdAテーリングされたときに、最小のオンターゲット読み取り数(1095)を得た。サンプルが、Cas9の熱不活化(条件(3))後にdAテーリングされたときに、読み取りの中間数(5191)を得た。オンターゲット読み取りの割合は、切断されたサンプルがTaqポリメラーゼを使用して72℃でdAテーリングされたときに(条件(1))、84.1%であり、切断されたサンプルが37℃でCas9切断と同時にdAテーリングされたときに(条件(2))、75.9%であり、サンプルがCas9の熱不活性化後にテーリングされたときに(条件(3))、86.3%であった。
【表1】
【0205】
結合ヌクレアーゼ欠損S.pyogenes dCas9が約60℃以上で5分間酵素をインキュベートすると、標的DNAから解離することを(WO2018/060740に記載されるように)すでに確証している。ここで、野生型Cas9の熱不活化は、72℃で5分(Taq条件、条件(1)の場合)、または75℃で20分(Klenowエキソ条件、条件(2)の場合)のいずれかであった。条件(1)および(2)のオンターゲットの割合の類似性は、72℃で5分がdAテーリング酵素にアクセス可能なCas9で生成された二本鎖切断の少なくともPAM近位側を示すのに十分であることを示す。
【0206】
まとめると、データは、(i)Cas9によって媒介した切断後のCas9の熱不活性化がdAテーリングポリメラーゼへの切断部位のアクセスを増加させることが必要とされる、(ii)熱変性すると、切断の短い(PAM-近位)側がCas9によって優先的に解放されるが、PAM-遠位側は変性されたCas9によって結合されたままであり、dAテーリング酵素へのアクセスが大幅に少なくなる、(iii)72℃で5分間のインキュベーションが、dAテーリング酵素にアクセス可能なCas9で生成された末端を示すのに十分であることを示唆している。
【0207】
実施例2
この実施例は、複数の合成crRNAプローブを使用して、ヒトゲノムDNA(gDNA)サンプルから複数の関心対象の領域(ROI)を切り出し、配列決定することができることを示す。ここでは、一連の冗長プローブを使用して、10のヒト遺伝子標的を切り出し、Cas9を使用して、増幅せずに高いカバレッジの深さ(対立遺伝子あたり100倍超)まで配列決定された。増幅の欠如は、疾患に関連したヌクレオチド拡張反復など、特定の興味深い構造的特徴を保持する。さらに、gDNAライブラリーの脱リン酸化は、読み取られるバックグラウンドDNA鎖の数を減らし、オンターゲットDNA読み取りのスループットが向上するために必要であることをここで示す。
【0208】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して培養されたヒト細胞(細胞株GM12878;Coriell Institute)から抽出することによって精製した。合計25μgのgDNAを、子ウシ腸デホスホリラーゼによる処理を介して大量に脱リン酸化した。12.5μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs,Inc.、カタログ番号M0508からの)を、25μgのgDNAに合計250μLのNEB CutSmart緩衝液(New England Biolabs,Inc.、カタログ番号B7204)37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0209】
別に、対照ライブラリーを、5μgの非脱リン酸化GM12878を合計50μLのNEB CutSmart緩衝液に添加して調製した。このステップにより、「脱リン酸化されていないgDNA」を得た。
【0210】
野生型S.pyogenes Cas9リボ核タンパク質複合体(RNP)は、以下のとおりに調製した。41のカスタムAlt-R Cas9 crRNA(Integrated DNA Technologies,Inc.によって合成された)の等モル混合物を、1μLの各crRNA(100μMのTE緩衝液、pH7.5で再懸濁された)をエッペンドルフDNA Lo-Bindチューブで混合することによって調製した。オリゴヌクレオチドAR363(5’DNA伸長を有する合成tracrRNA、ここでは使用されない)および合成crRNAの41プローブプールを、1μLのAR363(100μM)、1μLのcrRNAミックス(100μM)および8μLのヌクレアーゼフリー二本鎖緩衝液(Integrated DNA Technologies,Inc.、カタログ番号11-01-03-01)を95℃で5分間インキュベートし、室温まで冷却することによってアニーリングして、10μMのtracrRNA-crRNA複合体を形成した。次いで、RNPは、7.5μLのtracrRNA-crRNA複合体(最終濃度600nM)を、合計125μLのNEB CutSmart緩衝液中の300nMのS.pyogenes Cas9(New England Biolabs,Inc.、カタログ番号M0386M)で、室温で20分間インキュベートすることによって形成された。このステップにより、125μLの「Cas9 RNP」を得た。
【0211】
50μL(5μg)の末端保護されたgDNAは、25μLのCas9 RNPの添加によって切断された。反応物を、37℃で60分間インキュベートした後、75℃で20分間熱不活性化し、その後、室温まで徐冷した。同じチューブに、1.6μLの10mM dATPおよび4.5μLのKlenowエキソ-(NEB、カタログ番号M0212)を添加し、37℃で30分間インキュベートした後、75℃で20分間熱不活性化することによって、gDNAをdAテーリングした。この手順は、実施例1に記載されるように条件(3)を複製する。この手順により、ライブラリーA(75μL)を得た。
【0212】
脱リン酸化の要件の対照として、50μL(5μg)の非脱リン酸化gDNAを切断し、末端保護されたgDNAとまったく同じようにdAテーリングした。この手順により、ライブラリーB(75μL)を得た。
【0213】
標的領域内での読み取りのためのCas9を生成した末端の要件の対照として、25μLのNEB CutSmart緩衝液を、50μL(5μg)の末端保護されたgDNAに添加した。混合物を、37℃で60分間インキュベートした後、75℃で20分間熱不活性化し、その後、室温まで徐冷した。同じチューブに、1.6μLの10mMのdATPおよび4.5μLのKlenowエキソ-(NEB、カタログ番号M0212)を添加し、37℃で30分間インキュベートした後、75℃で20分間熱不活性化することによって、gDNAをdAテーリングした。この手順は、実施例1に記載されるように条件(3)を複製する。この手順により、ライブラリーC(75μL)を得た。
【0214】
ライブラリーA、ライブラリーB、またはライブラリーCを別々に、40μLの4倍連結緩衝液(ONLS13117)、2.35μLのAMX 1D(Vivaspin-500濃縮器;Sartoriusを使用して1.7μMに濃縮したOxford Nanopore LSK-108から)、10μLのT4 DNAリガーゼ(NEB Quick Ligaseキット、NEB、カタログ番号M2200から200万単位/mL)、および26.7μLのヌクレアーゼフリー水の合計容量約154μLを使用したインキュベーションによって、ライブラリーA、B、およびCへのアダプター連結を行った。この混合物を、室温で10分間インキュベートして、アダプターが連結したgDNAを得た。次いで、混合物をSPRI精製に供して、連結されていないアダプターおよび他の汚染物質を除去した。0.4容量(約62μL)のSPRIビーズ(AMPure XPビーズ、Beckman Coulter,Inc.)を、アダプター連結したDNAに添加し、逆さにして穏やかに混合し、室温で10分間インキュベートして、アダプター連結DNAをビーズに結合した。磁気セパレーターを使用して、ビーズをペレット化し、上清を除去し、250μLのABB(Oxford Nanopore LSK-108から)で2回洗浄し、各洗浄でビーズを完全に再懸濁し、洗浄後にビーズを再ペレット化した。2回目の洗浄の後、ビーズをもう一度ペレット化し、余分な洗浄緩衝液を除去し、16μLのTris溶出緩衝液(10mMのTris-Cl、20mMのNaCl、室温でpH7.5)にビーズペレットを室温で10分間再懸濁することによって、DNAをビーズから溶出した。ビーズをもう一度ペレット化し、精製されたgDNAを含む溶出液(上清)を、標的部位に適合させて保持した。23.3μLのRBFおよび11.7μLのLLB(どちらもOxford Nanopore TechnologiesのLSK-108から)を、15μLの溶出液に添加して、ライブラリーA、B、およびCに関連する「MinIONシークエンシングミックス」をそれぞれ得た。
【0215】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-108からの480μLのRBF、520μLのヌクレアーゼフリー水、0.5μLの100μMのコレステロールアダプターテザーSK43を使用して調製)を導入することによって3つのOxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックスA、B、またはCを、SpotONポートを介して各フローセルに添加し、これらのポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.10.6)を使用して、48時間のシークエンシングデータを収集し、シークエンシング実行中にオンラインでMinKNOWを使用してベースコールして、bwaを使用してオフラインでNA12878ヒト参照ゲノムに位置合わせした。
【0216】
結果
図17は、ライブラリーAにおけるヒトNA12878参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す上記の実験で使用したcrRNAは、10個のヒト遺伝子のプロトスペーサー配列を標的化する。予想どおりに、標的領域の濃縮が観察され、Cas9が主に正しい位置で切断し、切断部位が(様々な範囲まで)解放され、dAテーリングされ、アダプターが切断部位に効率的に連結されたことを示す。すべての読み取りの約10%が、10個の標的領域のうちの1つにマッピングされた。各標的に対する読み取りの項目別リストを、下の表2に示す。
【表2】
【0217】
下の表3は、サンプルがCas9の切断を開始する前に脱リン酸化されなかった場合、同じ10個の遺伝子標的パネルの約3分の1の読み取り数が得られたが、それ以外はライブラリーA(ライブラリーB)と同じであったことを示す。ライブラリーAの10分の1と比較して、300分の1の読み取りのみが標的領域のうちの1つにマッピングされた(約0.33%)。したがって、非標的DNAの脱リン酸化により、非標的読み取りの数が大幅に減少した。
【表3】
【0218】
下の表4は、ライブラリーが脱リン酸化されたときに、FMR1遺伝子に対応する単一の読み取りのみが得られ、Cas9(ライブラリーC)で切断されなかったことを示す。したがって、Cas9による切断は、ライブラリーが脱リン酸化されているときにオフターゲットの読み取りを得るために絶対に必要である。
【表4】
【0219】
オリゴヌクレオチド
tracrRNA
【表5】
crRNA
全体で使用されているcrRNAは、IDTからカスタム購入されたもの(「Alt-R(登録商標)CRISPR-Cas9 crRNA」)であった
【表6-1】
【表6-2】
wt Cas9ヌクレアーゼ、S.pyogenes
MDKKYSIGLDIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAE
ATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFG
NIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSD
VDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGN
LIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAI
LLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYA
GYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELH
AILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEE
VVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFL
SGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKI
IKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWG
RLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSL
HEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRER
MKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDH
IVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNL
TKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKS
KLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRK
MIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDF
ATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVA
YSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPK
YSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVE
QHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGA
PAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD
ONLS13117
4倍連結緩衝液組成:202mMのTris-HCl(pH8 -4℃)、2.5MのNaCl、30%PEG-8000(w/v)、40mMのATP
【0220】
実施例3
この実施例は、どのようにして合成crRNAプローブを使用して、ナノ細孔シークエンシング用の細菌ゲノムの複製領域の関心対象の領域(ROI)を切り出し、配列決定することができるかを示す。ここでは、酵素ステップ(脱リン酸化、Cpf1によって媒介した切断、バーコーディング、またはdAテーリングおよびアダプター連結)が、連続して実行される、シンプルなワンポットアプローチについて説明する。
【0221】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して大腸菌(SCS110株)から抽出することによって精製した。2μgのgDNAは、子ウシ腸デホスホリラーゼによる処理を介して脱リン酸化された。6μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs,Inc.、カタログ番号M0508からの)を、2μgのgDNAに合計120μLのNEB CutSmart緩衝液(New England Biolabs,Inc.、カタログ番号B7204)37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0222】
オリゴヌクレオチドAR630~AR643(「ガイドRNA」として知られている)を、一緒にプールし、ヌクレアーゼフリー水を用いて10μMに希釈した。複合体形成の前に、CutSmart緩衝液(New England Biolabs B72004)で500nMの「ガイドRNA」を、95℃で4分間インキュベートした後、21℃に冷却した。CRISPR-Cpf1複合体は、500nMのL.bacterium Cpf1(New England Biolabs M0653)を反応物に21℃で20分間添加することによって形成され、500nMのCRISPR-Cpf1複合体を生成した。最終濃度125nMのCRISPR-Cpf1複合体を添加して末端保護されたgDNAを切断し、37℃で15分間インキュベートして、「プローブ-標的複合体」として知られている複合体を得た。
【0223】
4つの異なる反応が、以下のとおりに、4つの単一チューブで実施された。
A.プローブ-標的複合体を、各切断部位の5’ntオーバーハング配列と一致する特定のバーコードのライブラリーを介してシークエンシングアダプターに連結した。
オリゴヌクレオチドAR598、AR656、およびAR657は、それぞれ、各々40μMで、10mMのTris-Cl(pH8.0)、1mMのEDTA、100mMのNaCl中、95℃~25℃、毎分1℃で、NB01にアニールした。ハイブリダイズしたDNAは、一緒にプールされ、「特定のバーコード」として知られていた。ヘリカーゼを有する約33nMのBAM 1D(ONT SQK-LSK308)を、50μLのブラントT/Aリガーゼマスターミックス(New England Biolabs M0367)を使用して1μMに希釈した0.2μLの特定のバーコードでプローブ標的複合体に21℃で20分間連結した。このステップにより、500ngの「特定のバーコードを有する標的が切断されたDNA」を得た。
【0224】
B.プローブ-標的複合体を、各切断部位の部分的に一致する5’ntオーバーハング配列を使用した一般的なバーコードのライブラリーを介してシークエンシングアダプターに連結した。
オリゴヌクレオチドCPBC34およびCPBC37は、それぞれ、各々40μMで、10mMのTris-Cl(pH8.0)、1mMのEDTA、100mMのNaCl中、95℃~25℃、毎分1℃で、NB01にアニールした。ハイブリダイズしたDNAは、一緒にプールされ、「一般的なバーコード」として知られていた。ヘリカーゼを有する約33nMのBAM 1D(ONT SQK-LSK308)を、50μLのブラントT/Aリガーゼマスターミックス(New England Biolabs M0367)の合計120μLを使用して1μMに希釈した0.2μLの一般的なバーコードを有するプローブ-標的複合体に21℃で20分間連結した。このステップにより、500ngの「一般的なバーコードを有する標的が切断されたDNA」を得た。
【0225】
C.プローブ-標的複合体は、E.coli DNAポリメラーゼI、Klenow断片のエキソヌクレアーゼ変異体を使用してdAテーリングした。
5,000単位(1μL)のKlenow断片(3’→5’エキソ-)(New England Biolabs M0212)を、20μMのdNTP(New England Biolabs N0446S)および100μMのdATP(New England Biolabs N0446S)を含むプローブ-標的複合体に添加し、37℃で15分間、65℃で5分間インキュベートした。ヘリカーゼを有する約25nMのAMX 1D(Vivaspin-500濃縮器;Sartoriusを使用して1.7μMに濃縮されたOxford Nanopore LSK-108から)を、50μLのブラントT/Aリガーゼマスターミックス(New England Biolabs M0367)を使用してプローブ-標的複合体に21℃で10分間連結した。このステップにより、500ngの「Klenow断片によってdAテーリングされた標的が切断されたDNA」を得た。
【0226】
D.Taqポリメラーゼを使用して、プローブ-標的複合体をdAテーリングした。
5,000単位(1μL)のTaqポリメラーゼ(New England Biolabs M0273)を、20μMのdNTP(New England Biolabs N0446S)および100μMのdATP(New England Biolabs N0446S)を有するプローブ-標的複合体に添加し、65℃で5分間インキュベートした。ヘリカーゼを有する約25nMのAMX 1D(Vivaspin-500濃縮器;Sartoriusを使用して1.7μMに濃縮されたOxford Nanopore LSK-108から)を、50μLのブラントT/Aリガーゼマスターミックス(New England Biolabs M0367)を使用してプローブ-標的複合体に21℃で10分間連結した。このステップにより、500ngの「TaqポリメラーゼによってdAテーリングされた標的が切断されたDNA」を得た。
【0227】
各混合物を、以下のとおりに、SPRI磁性ビーズを用いた精製ステップに供した:0.4体積当量のAMPure XP SPRI磁性ビーズ(Beckman Coulter)を混合物に添加し、21℃で10分間インキュベートした。磁気ビーズを、磁性分離機を用いてペレット化し、上清を吸引し、DLBで希釈した250μLのABB(ONT SQK-LSK108)を添加して、ビーズを再懸濁した。ビーズをもう一度直ちにペレット化し、上清を吸引し、その後チューブを、ラックから16μLのトリス溶出緩衝液(10mMのトリス-Cl、20mMのNaCl、室温でpH7.5)室温で10分間取り出した。ビーズを、磁性分離機を用いてペレット化し、溶出液を保持した。これにより、「MinIONシークエンシングミックスA、B、C、およびD」として知られている、各端にアダプターを有するニ本鎖DNAをもたらした。
【0228】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-108からの480μLのRBF、520μLのヌクレアーゼフリー水、0.5μLの100μMのコレステロールアダプターテザーSK43を使用して調製)を導入することによって、Oxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックスA、B、C、またはDを、SpotONポートを介してフローセルに添加し、これらのポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.10.6)を使用して、6時間のシークエンシングデータを収集し、その後、オフラインでベースコール(Albacoreを使用して)して、E.coli SCS110参照ゲノムに位置合わせした。
【0229】
結果
図18は、E.coli参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。予想どおりに、7つのrrs遺伝子のそれぞれで標的領域の濃縮が観察され(その位置は表5に示されている)、Cpf1が主に正しい位置で切断されたことを示す。E.coli SCS110株でrrs遺伝子の各コピーを切り出すために使用されるcrRNAの位置を、表5に示し、これは、プルダウンで使用される単一プローブの7つの予想される結合位置を示す。
【0230】
図19は、上記のCpf1切断後に4つの異なるアプローチ(A~D)から生じるパイルアップを比較する。表6は、各アプローチ(A~D)の読み取り数およびオンターゲット読み取りの割合を示す。切断されたサンプルが特定のバーコードを使用してバーコード化されたときに(条件A)、最高のオンターゲットスループット(90%)を得た。オンターゲットの読み取りの最大数(118208)は、TaqポリメラーゼでdAテーリングを使用して達成された。
【表7】
【表8】
【0231】
実施例4
この実施例は、複数の合成crRNAプローブを使用して、ヒトゲノムDNAサンプルから複数の関心対象の領域(ROI)を切り出し、配列決定することができることを示す。ここでは、一連の冗長プローブを使用して、10のヒト遺伝子標的を切り出し、Cpf1を使用して、増幅せずに高いカバレッジの深さ(対立遺伝子あたり100倍超)まで配列決定された。増幅の欠如は、疾患に関連したヌクレオチド拡張反復など、特定の興味深い構造的特徴を保持する。
【0232】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して培養されたヒト細胞(細胞株GM12878;Coriell Institute)から抽出することによって精製した。合計10μgのgDNAを、子ウシ腸デホスホリラーゼによる処理を介して大量に脱リン酸化した。3μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs M0508からの)を、10μgのgDNAに合計60μLのNEB CutSmart緩衝液(New England Biolabs B7204)に37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0233】
39のカスタムAlt-R Cpf1 crRNA(Integrated DNA Technologies,Inc.によって合成された)の等モル混合物を、1μLの各crRNA(100μMのTE緩衝液、pH7.5で再懸濁された)をエッペンドルフDNA Lo-Bindチューブで混合することによって調製した。次いで、混合物を、ヌクレアーゼフリー水を用いて10μMに希釈し、「ガイドRNA」として知られていた。複合体形成の前に、CutSmart緩衝液(New England Biolabs B72004)で500nMの「ガイドRNA」を、95℃で4分間インキュベートした後、21℃に冷却した。CRISPR-Cpf1複合体は、500nMのL.bacterium Cpf1(New England Biolabs M0653)を反応物に21℃で20分間添加することによって形成され、500nMのCRISPR-Cpf1複合体を生成した。125nMのCRISPR-Cpf1複合体を末端保護されたgDNAに添加し、37℃で15分間インキュベートして、「プローブ-標的複合体」として知られている複合体を得た。
【0234】
2つの異なる反応が、以下のとおりに、2つの単一のチューブで実施された。
A.プローブ-標的複合体を、特定の5’ntオーバーハング切断配列を使用して、特定のバーコードを介してシークエンシングアダプターに連結した。
オリゴヌクレオチドAR598、AR656、およびAR657は、それぞれ、各々40μMで、10mMのTris-Cl(pH8.0)、1mMのEDTA、100mMのNaCl中、95℃~25℃、毎分1℃で、NB01にアニールした。ハイブリダイズしたDNAは、一緒にプールされ、「特定のバーコード」として知られていた。ヘリカーゼを有する約33nMのBAM 1D(ONT SQK-LSK308)を、50μLのブラントT/Aリガーゼマスターミックス(New England Biolabs M0367)を使用して1μMに希釈した0.2μLの特定のバーコードでプローブ-標的複合体に21℃で20分間連結した。このステップにより、500ngの「特定のバーコードを有する標的が切断されたDNA」を得た。
【0235】
B.プローブ-標的複合体は、E.coli DNAポリメラーゼI、Klenow断片のエキソヌクレアーゼ変異体を使用してdAテーリングした。
5,000単位(1μL)のKlenow断片(3’→5’エキソ-)(New England Biolabs M0212)を、20μMのdNTP(New England Biolabs N0446S)および100μMのdATP(New England Biolabs N0446S)を含むプローブ-標的複合体に添加し、37℃で15分間、65℃で5分間インキュベートした。ヘリカーゼを有する約25nMのAMX 1D(Vivaspin-500濃縮器;Sartoriusを使用して1.7μMに濃縮されたOxford Nanopore LSK-108から)を、50μLのブラントT/Aリガーゼマスターミックス(New England Biolabs M0367)を使用してプローブ-標的複合体に21℃で10分間連結した。このステップにより、500ngの「Klenow断片によってdAテーリングされた標的が切断されたDNA」を得た。
【0236】
次いで、混合物をSPRI精製に供して、連結されていないアダプターおよび他の汚染物質を除去した。0.4容量のSPRIビーズ(AMPure XPビーズ、Beckman Coulter,Inc.)を、アダプター連結したDNAに添加し、逆さにして穏やかに混合し、室温で10分間インキュベートして、アダプター連結DNAをビーズに結合した。磁気セパレーターを使用して、ビーズをペレット化し、上清を除去し、250μLのABB(Oxford Nanopore LSK-108から)で2回洗浄し、各洗浄でビーズを完全に再懸濁し、洗浄後にビーズを再ペレット化した。2回目の洗浄の後、ビーズをもう一度ペレット化し、余分な洗浄緩衝液を除去し、16μLのTris溶出緩衝液(10mMのTris-Cl、20mMのNaCl、室温でpH7.5)にビーズペレットを室温で10分間再懸濁することによって、DNAをビーズから溶出した。ビーズをもう一度ペレット化し、精製されたgDNAを含む溶出液(上清)を、標的部位に適合させて保持した。23.3μLのRBFおよび11.7μLのLLB(どちらもOxford Nanopore TechnologiesのLSK-108から)を、15μLの溶出液に添加して、「MinIONシークエンシングAとBの混合」を得た。
【0237】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-108からの480μLのRBF、520μLのヌクレアーゼフリー水、0.5μLの100μMのコレステロールアダプターテザーSK43を使用して調製)を導入することによって4つのOxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックスAまたはBを、SpotONポートを介して各フローセルに添加し、これらのポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.10.6)を使用して、48時間のシークエンシングデータを収集し、シークエンシング実行中にオンラインでMinKNOWを使用してベースコールして、bwaを使用してオフラインでNA12878ヒト参照ゲノムに位置合わせした。
【0238】
結果
図20は、特定のバーコードアプローチに従ってヒトNA12878参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。上記の実験で使用したcrRNAは、10個のヒト遺伝子のプロトスペーサー配列を標的化する。予想どおりに、標的領域の濃縮が観察され、Cpf1が主に正しい位置で切断し、切断部位が(様々な範囲まで)解放され、バーコード化され、アダプターが切断部位に効率的に連結されたことを示す。すべての読み取りの約5%が、10個の標的領域のうちの1つにマッピングされた。各標的に対する読み取りの項目別リストを、表7に示す。
【0239】
図21は、Klenow(エキソ-)アプローチによるdAテーリング後に、ヒトNA12878参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。上記の実験で使用したcrRNAは、10個のヒト遺伝子のプロトスペーサー配列を標的化する。予想どおりに、標的領域の濃縮が観察され、Cpf1が主に正しい位置で切断し、切断部位が(様々な範囲まで)解放され、dAテーリングされ、アダプターが切断部位に効率的に連結されたことを示す。すべての読み取りの約0.2%が、10個の標的領域のうちの1つにマッピングされた。各標的に対する読み取りの項目別リストを、表8に示す。
【表9】
【表10】
【0240】
オリゴヌクレオチド
crRNA
全体で使用されているcrRNAは、IDTからカスタム購入されたもの(「Alt-R(登録商標)CRISPR-Cpf1 crRNA」)であった
【表11-1】
【表11-2】
【0241】
バーコード
全体で使用されるバーコードは、IDT(「カスタムDNAオリゴ」)から購入した
【表12-1】
【表12-2】
【0242】
アダプター配列
全体で使用されるバーコードは、IDT(「カスタムDNAオリゴ」)から購入した
【表13】
【0243】
実施例5
この実施例は、複数の合成crRNAプローブを使用して、異なるヒトゲノムDNA(gDNA)サンプルから複数の関心対象の領域(ROI)を切り出し、配列決定することができることを示す。ここでは、一連のプローブおよびバーコードを使用して、10のヒト遺伝子標的を5つの異なる反応から切り出し、Cas9を使用して、増幅せずに高いカバレッジの深さ(対立遺伝子あたり100倍超)まで配列決定された。
【0244】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して培養されたヒト細胞(細胞株GM12878;Coriell Institute)から抽出することによって精製した。合計25μgのgDNAを、子ウシ腸デホスホリラーゼによる処理を介して大量に脱リン酸化した。15μLの10倍CutSmart緩衝液および15μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs,Inc.、カタログ番号M0508からの)を、25μgのgDNAに合計150μL(New England Biolabs,Inc.、カタログ番号B7204)37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0245】
野生型S.pyogenes Cas9リボ核タンパク質複合体(RNP)は、以下のとおりに調製した。41のカスタムAlt-R Cas9 crRNA(Integrated DNA Technologies,Inc.によって合成された)の等モル混合物を、1μLの各crRNA(100μMのTE緩衝液、pH7.5で再懸濁された)をエッペンドルフDNA Lo-Bindチューブで混合することによって調製した。Alt-R(登録商標)CRISPR-Cas9 tracrRNA (Integrated DNA Technologies,Inc.)および合成crRNAの41プローブプールを、1μLのtracrRNA(100μM)、1μLのcrRNAミックス(100μM)および8μLのヌクレアーゼフリー二本鎖緩衝液(Integrated DNA Technologies,Inc.、カタログ番号11-01-03-01)を95℃で5分間インキュベートし、室温まで冷却することによってアニーリングして、10μMのtracrRNA-crRNA複合体を形成した。次いで、RNPは、4.8μLのtracrRNA-crRNA複合体(最終濃度800nM)を、合計60μLのNEB CutSmart緩衝液中の400nMのS.pyogenes Cas9(New England Biolabs,Inc.、カタログ番号M0386M)で、室温で20分間インキュベートすることによって形成された。このステップにより、60μLの「Cas9 RNP」を得た。
【0246】
2つの別々のライブラリーAおよびBは、以下のとおりに生成された。
A.15μLの末端保護されたgDNA(2.5μg)は、10μLのCas9 RNPミックスを30μLの総量で末端保護されたgDNAに添加することによって、Cas9 RNPによって切断された。5単位(1μL)のTaqポリメラーゼ(New England Biolabs M0273)および200μMのdATPも、同じチューブ(New England Biolabs N0446S)に添加した。反応物を37℃で15分間インキュベートし、次いで72℃で5分間インキュベートした。同じチューブ中で、ライブラリーに、5μLのAMXシークエンシングアダプター(Oxford Nanopore LSK-109から)を、10μLのT4リガーゼ(Oxford Nanoporeから)および20μLのLNB緩衝液(Oxford Nanopore LSK-109から)を使用して、総量80μLで、21℃で10分間連結した。このステップにより、2.5μgの「TaqポリメラーゼによってdAテーリングされた標的が切断されたDNA」を得た。
【0247】
B.30μLの末端保護されたgDNA(合計25μg;チューブあたり5μg)の5つの別々のチューブを、末端保護されたgDNAの各チューブに10μLのCas9 RNPミックスを添加することによって、Cas9 RNPによって切断した。5単位(1μL)のTaqポリメラーゼ(New England Biolabs M0273)を、200μMのdATP(New England Biolabs N0446S)と同じチューブに添加し、37℃で15分間インキュベートし、次いで72℃で5分間インキュベートした。約25nMの天然バーコードNB01~NB05(Oxford Nanopore EXP-NBD-104から)を、20μLのブラントT/Aリガーゼマスターミックス(New England Biolabs M0367)を使用して、5つの異なるプローブ-標的複合体 に21℃で10分間連結した。各混合物を、以下のとおりに、SPRI磁性ビーズを使用して精製に供した:0.7体積当量のAMPure XP SPRI磁性ビーズ(Beckman Coulter)を混合物に添加し、21℃で10分間インキュベートした。磁気ビーズを、磁性分離機を用いてペレット化し、上清を吸引し、250μLのエタノールおよびヌクレアーゼフリー水溶液の70%ミックスを使用して、ビーズを洗浄した。ビーズをもう一度直ちにペレット化し、上清を吸引し、その後チューブを、ラックから14μLのヌクレアーゼフリー水を室温で10分間取り出した。ビーズを、磁性分離機を用いてペレット化し、溶出液を保持した。13μLの各溶出液を同じチューブにプールし、65μLの最終容量をもたらした。プローブ-標的複合体に、5μLのAMIIバーコードシークエンシングアダプター(Oxford Nanopore NBD-104から)を、10μLのT4リガーゼ(Oxford Nanoporeから)および20μLのLNB緩衝液(Oxford Nanopore LSK-109から)を使用して、総量80μLで、21℃で10分間連結した。このステップにより、12.5μgの「天然バーコードを有する標的が切断されたDNA」を得た。
【0248】
各混合物を、以下のとおりに、SPRI磁気ビーズを用いた精製ステップに供した:1体積当量のIDTE(Integrated DNA Technologies)および0.3体積当量のAMPure XP SPRI磁気ビーズ(Beckman Coulter)を混合物に添加し、21℃で10分間インキュベートした。磁気ビーズを、磁性分離機を用いてペレット化し、上清を吸引し、250μLのLFB(Oxford Nanopore SQK-LSK109から)を添加して、ビーズを再懸濁した。ビーズをもう一度直ちにペレット化し、上清を吸引し、その後チューブを、ラックから16μLのEB緩衝液(Oxford Nanopore-LSK109)を室温で10分間取り出した。ビーズを、磁性分離機を用いてペレット化し、溶出液を保持した。13μLのLBおよび25μLのSQB(どちらもOxford Nanopore TechnologiesのLSK-109から)を、12μLの溶出液に添加して、「MinIONシークエンシングAとBの混合」を得た。
【0249】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-109から1170μLのFLB、Oxford Nanopore LSK-109から30μLのFLTを使用して調製)を導入することによって、Oxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックスA、Bを、SpotONポートを介してフローセルに添加し、これらのポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.15)を使用して、16時間のシークエンシングデータを収集し、シークエンシング実行中にオンラインでMinKNOWを使用してベースコールして、minimap2を使用してオフラインでNA12878ヒト参照ゲノムに位置合わせした。ライブラリーBは、Oxford Nanopore TechnologiesのGuppyベースコーラーを使用して逆多重化された。
【0250】
結果
図23は、ライブラリーAおよびBに対するヒトNA12878参照(HTT遺伝子)へのシークエンシング読み取りのアラインメントから生じるパイルアップ、ならびにライブラリーBの遺伝子ごとのバーコードあたりの読み取り数を示す。上記の実験で使用したcrRNAは、10個のヒト遺伝子のプロトスペーサー配列を標的化する。予想どおりに、標的領域の濃縮が観察され、Cas9が主に正しい位置で切断し、切断部位が(様々な範囲まで)解放され、dAテーリングされ、バーコード化され、アダプターが切断部位に効率的に連結されたことを示す。すべての読み取りの約10%が、10個の標的領域のうちの1つにマッピングされた。各標的に対する読み取りの項目別リストを、表9に示す。
【表14】
【0251】
表10は、5つの異なるサンプルがバーコード化され、一緒にプールされたときに、同じ10の遺伝子の標的パネルに対してほぼ同じ数の読み取りが得られたことを示す(ライブラリーB)。ライブラリーAの10分の1と比較して、150分の1の読み取りのみが、標的領域のうちの1つにマッピングされた(約0.6%)。サンプルがプールされたため、より多くのバックグラウンド読み取りが、配列決定され、オンターゲットの読み取りの割合の低下が観察された。
【表15】
【0252】
表11は、ライブラリーBの標的(HTT遺伝子)のうちの1つで使用されるバーコードごとの読み取りの分布を示す。バーコードごとの読み取り量は、使用されるすべてのバーコード全体でほぼ一定である。未分類の読み取りが低く、バーコード化および逆多重化が効率的であることを示す。
【表16】
【0253】
実施例6
この実施例は、どのようにして合成crRNAプローブを使用して、ナノ細孔シークエンシング用の低入力細菌ゲノムの複製領域の関心対象の領域(ROI)を切り出し、配列決定することができるかを示す。ここでは、酵素ステップ(脱リン酸化、切断、バーコーディング、増幅、アダプター連結)が、連続して実行される、シンプルなワンポットからツーポツトアプローチについて説明する。
【0254】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して大腸菌(SCS110株)から抽出することによって精製した。2μgのgDNAは、子ウシ腸デホスホリラーゼによる処理を介して脱リン酸化された。3μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs,Inc.、カタログ番号M0508からの)を、合計30μLのNEB CutSmart緩衝液(New England Biolabs,Inc.、カタログ番号B7204)の2μgのgDNAに37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0255】
40μMのCasAmpトップ鎖および40μMのCasAmpボトム鎖を、25μLのヌクレアーゼフリー二本鎖緩衝液(Integrated DNA Technologies、Inc.)で、反応物を95℃で5分間インキュベートし、その後、室温に冷却することによってアニールした。39μLのヌクレアーゼフリー二本鎖緩衝液に1μLのアニーリングしたCasAmp鎖を添加することによって、反応物を1μMに希釈した。これにより、40μLの「脱リン酸化PCRアダプター」を生成した。
【0256】
野生型S.pyogenes Cas9リボ核タンパク質複合体(RNP)は、以下のとおりに調製した。オリゴヌクレオチドCPD1およびCPD8(「ガイドRNA」として知られている)は、最初に等モル比で一緒にプールされた。次いで、Alt-R(登録商標)CRISPR-Cas9 tracrRNA (Integrated DNA Technologies,Inc.)およびガイドcrRNAを、1μLのtracrRNA(100μM)、1μLのガイドRNA(100μM)および8μLのヌクレアーゼフリー二本鎖緩衝液(Integrated DNA Technologies,Inc.、カタログ番号11-01-03-01)を95℃で5分間インキュベートし、室温まで冷却することによってアニーリングして、10μMのtracrRNA-crRNA複合体を形成した。次いで、RNPは、2.4μLのtracrRNA-crRNA複合体(最終濃度800nM)を、合計30μLのNEB CutSmart緩衝液中の400nMのHiFi Cas9 V3(Integrated DNA Technologies,Inc.)で、室温で20分間インキュベートすることによって形成された。このステップにより、30μLの「Cas9 RNP」を得た。300ng(合計2μgからの)の末端保護されたgDNAは、4.5μL(300ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)、30μLのCas9 RNP(上記)、200μMのdATP(1.6μLの10mMストック)、15単位(3μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)の合計126μLでのインキュベーションによって切断され、dAテーリングされた。この混合物を、Cas9を使用して、37℃で30分間インキュベートし、次いで72℃で5分間インキュベートして、標的部位を切断し、PCRサーモサイクラーを使用して、Cas9およびdA尾部の両方を、アクセス可能なすべての3’末端を変性させ、300ngの「TaqポリメラーゼによってdAテーリングされ、標的が切断されたDNA」を得た。このステップは、上記の脱リン酸化ステップと同じチューブで行われ、次の連結ステップに持ち越された。
【0257】
3つの異なる反応が、以下のとおりに、3つの単一のチューブで実施された。
(1)増幅ステップを通して行われなかった反応。
TaqポリメラーゼによってdAテーリングされた、100ngの標的が切断されたDNAを次のステップに持ち越した。
【0258】
(2)PCRアダプターを、標的が切断されたdAテーリングされたサンプルに連結し、増幅ステップを行った反応。
約25nMのPCAアダプター(Oxford Nanopore EXP-PCA001から)を、10μLのT4リガーゼ(Oxford Nanoporeから)および25μLのLNB緩衝液(Oxford Nanopore LSK-109から)を使用して、Taqポリメラーゼ複合体によってdAテーリングされた、100ngの標的が切断されたDNAに21℃で10分間連結した。
【0259】
(3)脱リン酸化されたPCRアダプターを、標的が切断されたdAテーリングされたサンプルに連結し、増幅ステップを行った反応。
約25nMの「脱リン酸化されたPCRアダプター」を、10μLのT4リガーゼ(Oxford Nanoporeから)および25μLのLNB緩衝液(Oxford Nanopore LSK-109から)を使用して、Taqポリメラーゼ複合体によってdAテーリングされた、100ngの標的が切断されたDNAに21℃で10分間連結した。
【0260】
次いで、混合物(2)および(3)をSPRI精製に供して、連結されていないアダプターおよび他の汚染物質を除去した。0.5容量(約50μL)のSPRIビーズ(AMPure XPビーズ、Beckman Coulter,Inc.)を、混合物に添加し、逆さにして穏やかに混合し、室温で10分間インキュベートして、DNAをビーズに結合した。磁気分離機を使用して、ビーズをペレット化し、上清を除去し、250μLのLFB(Oxford Nanopore LSK-109から)で2回洗浄し、各洗浄でビーズを完全に再懸濁し、洗浄後にビーズを再ペレット化した。2回目の洗浄の後、ビーズをもう一度ペレット化し、余分な洗浄緩衝液を除去し、25μLのヌクレアーゼフリー水にビーズペレットを室温で10分間再懸濁することによって、DNAをビーズから溶出した。このステップにより、それぞれ、100μgの「PCA適合した標的が切断されたDNA」および100μgの「脱リン酸化したPCA適合した標的が切断されたDNA」を得た。
【0261】
24μLのこれらのライブラリーは、50μLのLongAmp(登録商標)Taq 2Xマスターミックス(New England Biolabs,Inc.、カタログ番号M0287)に200nMのPCRプライマーを添加して持ち越した。PCRサーモサイクラーを使用して、以下のとおりに増幅を行った:72℃で30秒、95℃で30秒の3サイクル、56℃で30秒、72℃で5秒、続いて95℃で30秒の15サイクル、および72℃で5分間。増幅は、72℃で5分間終了し、4℃で保持した。
【0262】
標的の切断、dAテーリング、PCRアダプターの連結、および増幅ステップ(ライブラリー(2)および(3)の場合)に続いて、シークエンシングアダプターを、各ライブラリーに連結した。50nMのAMX(Oxford Nanopore-LSK109から)、10μLのT4リガーゼ(Oxford Nanoporeから)、および20μLのLNB緩衝液(Oxford Nanopore LSK-109から)を使用して、アダプター連結を、21℃で10分間行った。
【0263】
各混合物を、以下のとおりに、SPRI磁気ビーズを用いた精製ステップに供した:1体積当量のIDTE pH8(Integrated DNA Technologies)および0.3体積当量のAMPure XP SPRI磁気ビーズ(Beckman Coulter)を混合物に添加し、21℃で10分間インキュベートした。磁気ビーズを、磁性分離機を用いてペレット化し、上清を吸引し、250μLのLFB(ONT SQK-LSK109)を添加して、ビーズを再懸濁した。ビーズをもう一度直ちにペレット化し、上清を吸引し、その後チューブを、ラックから16μLのEB緩衝液(Oxford Nanopore-LSK109)を室温で10分間取り出した。ビーズを、磁性分離機を用いてペレット化し、溶出液を保持した。これにより、「MinIONシークエンシングミックス(1)、(2)、および(3)」として知られている、各端にアダプターを有するニ本鎖DNAをもたらした。
【0264】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-109から1170μLのFLB、Oxford Nanopore LSK-109から30μLのFLTを使用して調製)を導入することによって、Oxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックス(1)、(2)、および(3)を、SpotONポートを介してフローセルに添加し、これらのポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.15)を使用して16時間のシークエンシングデータを収集し、シークエンシング実行中にオンラインでMinKNOWを使用してベースコールして、オフラインでE.coli SCS110参照ゲノムに位置合わせした。
【0265】
結果
図24は、増幅なし、リン酸化または脱リン酸化されたPCRアダプターアプローチによる増幅後のE.coli SCS110参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。上記の実験で使用したcrRNAは、E.coliゲノムの4kb領域を標的化する。予想どおりに、すべての条件下で標的領域の濃縮が観察され、正しい位置で切断およびdAテーリングを生じたことを示す。脱リン酸化されたPCRアダプターが、切断され、dAテーリングされたサンプルに連結されるときに、オンターゲットの読み取りの最大数が観察され、アダプターの連結および増幅が予想どおりに生じたことを示す。増幅ステップにより、非常に高い特異性(ほぼ95%)で読み取り数が10倍以上増加した。
【0266】
表12は、ライブラリー((1)~(3))のそれぞれの読み取り数およびオンターゲット読み取りの割合を示す。脱リン酸化されたPCRアダプターを使用して、切断されたサンプルが増幅されたとき、最高のオンターゲットスループット(94.87%)が得られ、Cas9切断、dAテーリング、および増幅が低入力ゲノムから可能であることを示す。
【表17】
【0267】
オリゴヌクレオチド
【表18】
【表19】
【表20】
【0268】
実施例7
この実施例は、どのようにして合成crRNAプローブを使用して、ナノ細孔シークエンシング用の細菌ゲノムの複製領域の関心対象の領域(ROI)を切り出し、配列決定することができるか、ならびにどのようにして読み取り方向のバイアスをRNAseを使用して変調することができるかを示す。ここでは、酵素ステップ(脱リン酸化、切断、消化、およびアダプター連結)が、連続して実行される、シンプルなワンポットアプローチについて説明する。
【0269】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して大腸菌(SCS110株)から抽出することによって精製した。1.5μgのgDNAは、子ウシ腸デホスホリラーゼによる処理を介して脱リン酸化された。7.5μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs,Inc.、カタログ番号M0508からの)を、合計150μLのNEB CutSmart緩衝液(New England Biolabs,Inc.、カタログ番号B7204)の1.5μgのgDNAに37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0270】
野生型S.pyogenes Cas9リボ核タンパク質複合体(RNP)は、以下のとおりに調製した。Alt-R(登録商標)CRISPR-Cas9 tracrRNA (Integrated DNA Technologies,Inc.)およびAR400(合成crRNA)を、最初に、1μLのtracrRNA(100μM)、1μLのAR400(100μM)、および8μLのヌクレアーゼフリー二本鎖緩衝液(Integrated DNA Technologies,Inc.、カタログ番号11-01-03-01)を95℃で5分間インキュベートし、室温まで冷却することによってアニーリングして、10μMのtracrRNA-crRNA複合体を形成した。次いで、RNPは、4.5μLのtracrRNA-crRNA複合体(最終濃度600nM)を、合計75μLのNEB CutSmart緩衝液中の300nMのS.pyogenes Cas9(New England Biolabs,Inc.、カタログ番号M0386M)で、室温で20分間インキュベートすることによって形成された。このステップにより、75μLの「Cas9 RNP」を得た。
【0271】
3つの異なる反応が、以下のとおりに、3つの単一のチューブで実施された。
(1)シークエンシングアダプターが、標的が切断され、dAテーリングされたサンプルに連結された反応。
500ngの末端保護されたgDNAは、50μL(100ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)、25μLのCas9 RNP(上記)、200μMのdATP(1.7μLの10mMストック)、5単位(1μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)の合計85μLでのインキュベーションによって切断され、dAテーリングされた。この混合物を、Cas9を使用して、37℃で30分間インキュベートし、次いで72℃で5分間インキュベートして、標的部位を切断し、PCRサーモサイクラーを使用して、Cas9およびdA尾部の両方を、アクセス可能なすべての3’末端を変性させ、500ngの「TaqポリメラーゼによってdAテーリングされ、標的が切断されたDNA」を得た。
【0272】
(2)標的が切断されたDNAが、RNAseHによって消化され、次いでTaqポリメラーゼによってdAテーリングされた反応。次いで、シークエンシングアダプターを、このサンプルに連結した。
500ngの末端保護されたgDNAは、50μL(100ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)のインキュベーションによって切断され、dAテーリングされ、25μLのCas9 RNP(上記)を、37℃で25分間インキュベーションして、Cas9を使用して標的部位を切断した。5単位(1μL)のRNAseH(New England Biolabs,Inc.、カタログ番号M0297)を、NEBuffer(商標)3(New England Biolabs,Inc.、カタログ番号#B7003)に合計85μL添加した。DNA:RNA二本鎖を消化するために、反応物を37℃で20分間インキュベートし、Cas9およびRNAseHの両方を変性させるために、65℃で20分間インキュベートした。200μMのdATP(1.7μLの10mMストック)、5単位(1μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)を、同じチューブに合計85μL添加した。この混合物を、PCRサーモサイクラーを使用して、アクセス可能なすべての3’末端をdAテーリングさせるために、72℃で5分間インキュベートして、500ngの「RNAseHによって消化され、dAテーリングされた、標的が切断されたDNA」を得た。
【0273】
(3)標的が切断されたDNAが、Cas9変性後にRNAseHでインキュベートされ、次いでdAテーリングされた反応。次いで、シークエンシングアダプターを、このサンプルに連結した。
500ngの末端保護されたgDNAは、50μL(100ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)のインキュベーションによって切断され、dAテーリングされ、25μLのCas9 RNP(上記)を、Cas9を使用して標的部位を切断するために、37℃で25分間インキュベーションし、Cas9を変性するために65℃で5分間インキュベーションした。5単位(1μL)のRNAseH(New England Biolabs,Inc.、カタログ番号M0297)を、合計85μLのNEBuffer(商標)3(New England Biolabs,Inc.、カタログ番号#B7003)の反応物に添加した。DNA:RNA二本鎖を消化するために、反応物を37℃で20分間インキュベートし、RNAseHを変性させるために、65℃で20分間インキュベートした。200μMのdATP(1.7μLの10mMストック)、5単位(1μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)を、同じチューブに合計85μL添加した。この混合物を、PCRサーモサイクラーを使用して、アクセス可能なすべての3’末端をdAテーリングさせるために、72℃で5分間インキュベートして、500ngの「RNAseHによって消化され、dAテーリングされた、標的が切断されたDNA」を得た。
【0274】
次いで、165μLの連結緩衝液(ONLS13117)中で25nMのAMX 1D(Vivaspin-500濃縮器;Sartoriusを使用して1.7μMに濃縮されたOxford Nanopore LSK-108から)、10μLのT4リガーゼ(Oxford Nanopore内製)を添加することによって、シークエンシングアダプターを各ライブラリーに連結した。21℃で10分間インキュベーションした後、各混合物を、以下のとおりに、SPRI磁気ビーズを用いた精製ステップに供した:1体積当量のIDTE pH8(Integrated DNA Technologies)および0.4体積当量のAMPure XP SPRI磁気ビーズ(Beckman Coulter)を混合物に添加し、21℃で10分間インキュベートした。磁気分離機を使用して、ビーズをペレット化し、上清を除去し、DLBで希釈した250μLのABB(Oxford Nanopore LSK-108から)で2回洗浄し、各洗浄でビーズを完全に再懸濁し、洗浄後にビーズを再ペレット化した。2回目の洗浄の後、ビーズをもう一度ペレット化し、余分な洗浄緩衝液を除去し、15μLのELB(Oxford Nanopore SQK-LSK108から)にビーズペレットを室温で10分間再懸濁することによって、DNAをビーズから溶出した。25μLのSQBおよび10μLのLB(どちらもOxford Nanopore TechnologiesのLSK-109から)を、15μLの溶出液に添加して、「MinIONシークエンシングミックス」を得た。
【0275】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-109から1170μLのFLB、Oxford Nanopore LSK-109から30μLのFLTを使用して調製)を導入することによって、Oxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックス(1)、(2)、および(3)を、SpotONポートを介してフローセルに添加し、これらのポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.10.6)を使用して、6時間のシークエンシングデータを収集し、その後、オフラインでベースコール(Albacoreを使用して)して、E.coli SCS110参照ゲノムに位置合わせした。
【0276】
結果
図25は、E.coli参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。上記の実験で使用したcrRNAは、E.coli SCS110株のrrs遺伝子の7つのコピーすべてに共通のプロトスペーサー配列を標的化する。予想どおりに、7つのrrs遺伝子のそれぞれ(それらの位置を、表13~15に示す)で標的領域の濃縮が観察され、Cas9が主に正しい位置で切断し、切断部位が(様々な範囲まで)解放され、dAテーリングされ、アダプターが切断部位に効率的に連結されたことを示す。この図は、より多くの双方向読み取りが、Cas9切断および変性後にRNAseHの添加に伴って観察されることも強調している。
【0277】
表13は、Taqポリメラーゼ条件(条件(1))からの順方向と逆方向の読み取り間のバイアスを調べる。縮重crRNAプローブによって標的化されたrrs遺伝子は、E.coli SCS110参照で両方の方向に見られる。7つのrrs遺伝子のうち6つは、読み取り方向に明らかなバイアスを示し、これは参照ゲノム内の遺伝子の方向と相関した。同様のバイアスが、他の条件(ライブラリー(2)、表14、
図25)で観察された。
【0278】
しかしながら、ライブラリー(3)における読み取りバイアスを調べる表15は、Cas9切断および変性後のRNAseHの添加により、ライブラリー(1)および(2)と比較して読み取りバイアスの一部が軽減されたことを示す。例えば、rrsH遺伝子に対応するピークiの読み取りバイアスは、ライブラリー(1)の34%と比較して、RNAseHの添加に伴って約42%に低下した。
【表21】
【表22】
【表23】
【0279】
実施例8
この実施例は、どのようにして合成crRNAプローブを使用して、ナノ細孔シークエンシング用の細菌ゲノムの複製領域の関心対象の領域(ROI)を切り出し、配列決定することができるか、ならびにどのようにして開裂に由来する読み取りのシークエンシング方向は、T4ポリメラーゼを使用して一方向にバイアスをかけることができるかを示す。ここでは、酵素ステップ(脱リン酸化、切断、消化、およびアダプター連結)が、連続して実行される、シンプルなワンポットアプローチについて説明する。
【0280】
材料および方法
高分子量ゲノムDNA(「gDNA」)は、製造業者の指示に従い、Qiagen tip-500を使用して大腸菌(SCS110株)から抽出することによって精製した。1.5μgのgDNAは、子ウシ腸デホスホリラーゼによる処理を介して脱リン酸化された。7.5μLのQuick CIP(「NEB Quick CIPキット」、New England Biolabs,Inc.、カタログ番号M0508からの)を、合計150μLのNEB CutSmart緩衝液(New England Biolabs,Inc.、カタログ番号B7204)の1.5μgのgDNAに37℃で10分間添加し、続いてデホスホリラーゼを80℃で2分間熱不活化した。このステップにより、「末端保護されたgDNA」を得た。
【0281】
野生型S.pyogenes Cas9リボ核タンパク質複合体(RNP)は、以下のとおりに調製した。Alt-R(登録商標)CRISPR-Cas9 tracrRNA (Integrated DNA Technologies,Inc.)およびAR400(合成crRNA)を、最初に、1μLのtracrRNA(100μM)、1μLのAR400(100μM)、および8μLのヌクレアーゼフリー二本鎖緩衝液(Integrated DNA Technologies,Inc.、カタログ番号11-01-03-01)を95℃で5分間インキュベートし、室温まで冷却することによってアニーリングして、10μMのtracrRNA-crRNA複合体を形成した。次いで、RNPは、4.5μLのtracrRNA-crRNA複合体(最終濃度600nM)を、合計75μLのNEB CutSmart緩衝液中の300nMのS.pyogenes Cas9(New England Biolabs,Inc.、カタログ番号M0386M)で、室温で20分間インキュベートすることによって形成された。このステップにより、75μLの「Cas9 RNP」を得た。
【0282】
3つの異なる反応が、以下のとおりに、3つの単一のチューブで実施された。
(1)シークエンシングアダプターが、標的が切断され、dAテーリングされたサンプルに連結された反応。
500ngの末端保護されたgDNAは、50μL(500ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)、25μLのCas9 RNP(上記)、200μMのdATP(1.7μLの10mMストック)、5単位(1μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)の合計85μLでのインキュベーションによって切断され、dAテーリングされた。この混合物を、Cas9を使用して、37℃で30分間インキュベートし、次いで72℃で5分間インキュベートして、標的部位を切断し、PCRサーモサイクラーを使用して、Cas9およびdA尾部の両方を、アクセス可能なすべての3’末端を変性させ、500ngの「TaqポリメラーゼによってdAテーリングされ、標的が切断されたDNA」を得た。
【0283】
(2)標的が切断されたDNAが、T4 DNAポリメラーゼでインキュベートされ、次いでdAテーリングされた反応。次いで、シークエンシングアダプターを、このサンプルに連結した。
500ngの末端保護されたgDNAは、50μL(100ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)のインキュベーションによって切断され、dAテーリングされ、25μLのCas9 RNP(上記)を、37℃で25分間インキュベーションして、Cas9を使用して標的部位を切断した。3単位(1μL)のT4 DNAポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0203)を、合計85μL添加した。dNTPが存在しない場合、T4 DNAポリメラーゼは、3’から5’末端のエキソヌクレアーゼとして機能し、ここでは、任意の潜在的な3’末端のオーバーハングを除去するために使用される。反応物を、21℃で5分間インキュベートした。200μMのdATP(1.7μLの10mMストック)、5単位(1μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)を、同じチューブに合計80μL添加した。この混合物を、PCRサーモサイクラーを使用して、アクセス可能なすべての3’末端をdAテーリングさせるために、72℃で5分間インキュベートして、500ngの「T4 DNAポリメラーゼによって消化され、dAテーリングされた、標的が切断されたDNA」を得た。
【0284】
(3)標的が切断された反応を、Cas9変性後に、T4 DNAポリメラーゼでインキュベートされ、dAテーリングされた反応。次いで、シークエンシングアダプターを、このサンプルに連結した。
500ngの末端保護されたgDNAは、50μL(100ng)の脱リン酸化ライブラリー(上記の末端保護されたgDNA)のインキュベーションによって切断され、dAテーリングされ、25μLのCas9 RNP(上記)を、Cas9を使用して標的部位を切断するために、37℃で25分間インキュベーションし、Cas9を変性するために65℃で5分間インキュベーションした。3単位(1μL)のT4 DNAポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0203)を、反応物に合計80μL添加した。dNTPが存在しない場合、T4 DNAポリメラーゼは、3’から5’末端のエキソヌクレアーゼとして機能し、ここでは、任意の潜在的な3’末端のオーバーハングを除去するために使用される。反応物を、21℃で5分間インキュベートした。200μMのdATP(1.7μLの10mMストック)、5単位(1μL)のTaqポリメラーゼ(New England Biolabs,Inc.、カタログ番号M0273)を、同じチューブに合計80μL添加した。この混合物を、PCRサーモサイクラーを使用して、アクセス可能なすべての3’末端をdAテーリングさせるために、72℃で5分間インキュベートして、500ngの「変性され、T4 DNAポリメラーゼによって消化され、dAテーリングされた、標的が切断されたDNA」を得た。
【0285】
次いで、165μLの連結緩衝液(ONLS13117)中で25nMのAMX 1D(Vivaspin-500濃縮器;Sartoriusを使用して1.7μMに濃縮されたOxford Nanopore LSK-108から)、10μLのT4リガーゼ(Oxford Nanopore内製)を添加することによって、シークエンシングアダプターを各ライブラリーに連結した。21℃で10分間インキュベーションした後、各混合物を、以下のとおりに、SPRI磁気ビーズを用いた精製ステップに供した:1体積当量のIDTE pH8(Integrated DNA Technologies)および0.4体積当量のAMPure XP SPRI磁気ビーズ(Beckman Coulter)を混合物に添加し、21℃で10分間インキュベートした。磁気分離機を使用して、ビーズをペレット化し、上清を除去し、DLBで希釈した250μLのABB(Oxford Nanopore LSK-108から)で2回洗浄し、各洗浄でビーズを完全に再懸濁し、洗浄後にビーズを再ペレット化した。2回目の洗浄の後、ビーズをもう一度ペレット化し、余分な洗浄緩衝液を除去し、15μLのELB(Oxford Nanopore SQK-LSK108から)にビーズペレットを室温で10分間再懸濁することによって、DNAをビーズから溶出した。25μLのSQBおよび10μLのLB(どちらもOxford Nanopore TechnologiesのLSK-109から)を、15μLの溶出液に添加して、「MinIONシークエンシングミックス」を得た。
【0286】
標的DNAのシークエンシングを行うために、入口ポートを介して、800μLのフローセル調製ミックス(Oxford Nanopore LSK-109から1170μLのFLB、Oxford Nanopore LSK-109から30μLのFLTを使用して調製)を導入することによって、Oxford Nanopore Technologies FLO-MIN106フローセルを調製した。その後、SpotONポートを開き、さらに200μLのフローセル調製ミックスを注入口から灌流した。50μLのMinIONシークエンシングミックス(1)、(2)、および(3)を、SpotONポートを介してフローセルに添加し、これらのポートを閉じた。Oxford Nanopore TechnologiesのMinKNOW(バージョン1.10.6)を使用して、6時間のシークエンシングデータを収集し、その後、オフラインでベースコール(Albacoreを使用して)して、E.coli SCS110参照ゲノムに位置合わせした。
【0287】
結果
図26は、E.coli参照へのシークエンシング読み取りのアラインメントから生じるパイルアップを示す。上記の実験で使用したcrRNAは、E.coli SCS110株のrrs遺伝子の7つのコピーすべてに共通のプロトスペーサー配列を標的化する。予想どおりに、7つのrrs遺伝子のそれぞれ(それらの位置を、表17~19に示す)で標的領域の濃縮が観察され、Cas9が主に正しい位置で切断し、切断部位が(様々な範囲まで)解放され、dAテーリングされ、アダプターが切断部位に効率的に連結されたことを示す。この図は、より少ない双方向の読み取りが、Cas9切断後のT4 DNAポリメラーゼの添加に伴って観察されたことも強調している。
【0288】
表17~19は、Taqポリメラーゼ条件(ライブラリー(1))からの順方向と逆方向の読み取り間のバイアスを調べる。縮重crRNAプローブによって標的化されたrrs遺伝子は、E.coli SCS110参照で両方の方向に見られる。7つのrrs遺伝子のうち6つは、読み取り方向に明らかなバイアスを示し、これは参照ゲノム内の遺伝子の方向と相関した。
【0289】
しかしながら、ライブラリー(2)および(3)における読み取りバイアスを調べる表18および19は、Cas9変性の有無にかかわらずCas9切断後のT4 DNAポリメラーゼの添加が、ライブラリー(1)と比較して、読み取りバイアスが軽減されたことを示す。例えば、rrsH遺伝子に対応するピークiの(+)方向への読み取りバイアスは、ライブラリー(1)の65%と比較して、T4 DNAポリメラーゼの添加に伴って約96%であった。これは、T4 DNAポリメラーゼの添加が、Cas9切断部位のPAM遠位側へのシークエンシングアダプター連結の効率が低下することを示す。
【表24】
【表25】
【表26】