(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023129696
(43)【公開日】2023-09-14
(54)【発明の名称】CRISPR/CAS系タンパク質を使用する核酸の標的化枯渇、富化および分割のための組成物および方法
(51)【国際特許分類】
C12N 15/09 20060101AFI20230907BHJP
C12Q 1/6806 20180101ALN20230907BHJP
C12N 15/11 20060101ALN20230907BHJP
C12Q 1/686 20180101ALN20230907BHJP
C12Q 1/44 20060101ALN20230907BHJP
C12N 9/16 20060101ALN20230907BHJP
【FI】
C12N15/09 110
C12Q1/6806 Z ZNA
C12N15/11 Z
C12Q1/686 Z
C12Q1/44
C12N9/16 Z
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023123444
(22)【出願日】2023-07-28
(62)【分割の表示】P 2021070442の分割
【原出願日】2015-12-19
(31)【優先権主張番号】62/198,097
(32)【優先日】2015-07-28
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/094,980
(32)【優先日】2014-12-20
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】517213223
【氏名又は名称】アーク バイオ, エルエルシー
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】メレディス エル. カーペンター
(72)【発明者】
【氏名】カルロス ディー. ブスタマンテ
(72)【発明者】
【氏名】ステフィン ビー. グーギュッチョン
(57)【要約】
【課題】メタゲノム解析のための低コストの効率的な方法および組成物を提供する。
【解決手段】試料から標的化核酸配列を枯渇させ、試料から目的の配列について富化し、かつ/または試料から配列を分割するための方法および組成物が本明細書に提供されている。この方法および組成物は、生体試料、臨床試料、法医学試料、および環境試料に適用可能である。一態様では、試料を目的の配列について富化する方法が提供され、本方法は、(a)目的の配列および枯渇のための標的化配列を含む試料を準備するステップであって、目的の配列は、試料の30%未満を構成する、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって標的化配列が切断される、ステップとを含む。
【選択図】
図1
【特許請求の範囲】
【請求項1】
図面に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の引用
本願は、2014年12月20日に出願した米国仮出願第62/094,980号および2015年7月28日に出願した米国仮出願第62/198,097号の優先権の利益を主張する。これらの出願の内容は、その全体がこれにより、本明細書中に参考として援用される。
【背景技術】
【0002】
多くのヒト臨床DNA試料、またはRNAに由来するcDNAライブラリーなどの試料ライブラリー、または組織、体液、もしくは他の宿主材料試料から採取される抽出DNA試料は、有益な価値をほとんど有さず、配列決定のコストを増大させる高度に豊富な配列を含有する。これらの配列を枯渇させる(例えば、ハイブリダイゼーションキャプチャーを介して)方法が開発されているが、これらの方法は、時間のかかることが多く、非効率であり得る。さらにハイブリダイゼーションキャプチャーは、残りの配列を廃棄しながら目的のDNA配列を捕捉するように見えることが多い。結果として、ハイブリダイゼーションキャプチャーによる枯渇は、目的のDNA配列が前もって分かっていないとき、例えば、すべての微生物または非宿主DNA配列を研究するために試料をスクリーニングするとき、実行可能な選択肢ではない。
【0003】
微生物DNAを研究するためにヒト試料のショットガン配列決定を行うことができるが、多くの試料中の低レベルの微生物DNAが、コストに起因して多くの複雑なかつ/または興味深い試料のショットガンシークエンシングを妨げている。これは、例えば、試料が1つを超える種の生物(真核生物、原核生物、またはウイルス生物)を含有する、試料のメタゲノム解析に当てはまる。例えば、ヒト全血に由来するDNAライブラリーは、99%超のヒトDNAを含有することが多い。したがって、ショットガンシークエンシングからヒト血液中に循環する感染因子を検出するのに、十分なカバレッジを保証するために非常に高いカバレッジまで配列決定する必要がある。よって、高いヒトDNA試料の配列決定に関連したコストの多くは、相対的に少ないメタゲノムデータをもたらす。結果として、多くのヒト組織DNA試料は、単にデータ収量が要求されるリソースに比較して低いために、メタゲノム配列決定に不適当であると考えられている。よって、高宿主DNA試料中の微生物DNA収量を増大させる、具体的には、高宿主内因性(HHE)DNA試料を配列決定するとき配列決定される微生物DNAのパーセントを増大させる必要性が当技術分野において存在する。
【0004】
DNA抽出における最近の発展は、メタゲノミクスの分野がPCR増幅された16SリボソームRNAマーカーに焦点を当てることから全メタゲノムのショットガンシークエンシングに移行しているところまで、いくつかの配列決定技法をもたらした。しかし、ショットガンシークエンシングは、全試料材料中の微生物DNAの低パーセンテージに起因して、HHE DNA試料を配列決定するとき望ましいとはいえない結果を生じ得る。さらに、ショットガンシークエンシングは、特に、選択された分子(例えば、16SリボソームRNA)が単一系統のみを代表するとき、メタゲノム解析において正確な分解をするのに十分な情報を提供することに失敗することが多い。さらに、16SリボソームRNA系統はしばしば、臨床メタゲノム解析の重要な目標である、密接に関連した細菌の非病原性株から病原性株を識別することができない。
【0005】
代わりに、全ゲノムDNAおよびRNA配列の使用は、メタ遺伝子解析(metagenetic analysis)に好適であり、その理由は、それがメタゲノム全体からの情報を提供するためである。よって、改善された分解を引き出すために、メタゲノム解析のためのDNAおよびRNA配列決定技法を提供する必要性が当技術分野において存在する。例えば、肥満および正常体重患者の糞便材料からのメタゲノムの全ゲノム解析は、微生物群構造における高度に再現可能な差異を明らかにした。これらの材料は、非常に高い微生物DNA含有量(99%超の微生物および1%未満のヒト)を有する傾向がある。
【0006】
対照的に、ヒト血液、膣、鼻粘膜、および肺を含めた多くの他の組織に由来するシークエンシングライブラリーは、典型的には90%超のヒトおよび10%未満の微生物DNAを含有する。10%未満の微生物DNAを含む試料は、依然として、十分な配列決定で、メタゲノム解析のための十分な情報を生じ得るが、標的DNAがより少ない検体の配列決定に必要な量は高価であり、よって多くの研究者にとって支持できない。
【0007】
よって、メタゲノム解析のための低コストの効率的な方法および組成物を達成する必要性が当技術分野において存在する。このような方法および組成物が本明細書に提供されている。
【0008】
本明細書に引用されるすべての特許、特許出願、刊行物、文書、ウェブリンク、および論文は、その全体が参照により本明細書に組み込まれている。
【発明の概要】
【課題を解決するための手段】
【0009】
試料から標的化核酸配列を枯渇させ、試料から目的の配列について富化し、かつ/または試料から配列を分割するための方法および組成物が本明細書に提供されている。この方法および組成物は、生体試料、臨床試料、法医学試料、および環境試料に適用可能である。
【0010】
一態様では、試料を目的の配列について富化する方法であって、(a)目的の配列および枯渇のための標的化配列を含む試料を準備するステップであって、目的の配列は、試料の30%未満を構成する、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって標的化配列が切断される、ステップとを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料から目的の配列および枯渇のための標的化配列を抽出するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、抽出された配列を断片化するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、抽出され断片化された配列の5’および3’末端をアダプターライゲーションするステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、切断された標的化配列は、サイズ排除によって除去される。本明細書に開示の実施形態のいずれかにおいて、切断された標的化配列は、ビオチンを使用して除去される。本明細書に開示の実施形態のいずれかにおいて、本方法は、目的の配列を増幅するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、枯渇のための標的化配列の後にプロトスペーサー隣接モチーフまたは(PAM)配列が続く。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、試料は、生体試料、臨床試料、法医学試料、または環境試料のいずれか1つである。本明細書に開示の実施形態のいずれかにおいて、試料は、枯渇のために標的にされる宿主核酸配列および目的の非宿主核酸配列を含む。本明細書に開示の実施形態のいずれかにおいて、非宿主核酸配列は、微生物核酸配列を含む。本明細書に開示の実施形態のいずれかにおいて、微生物核酸配列は、細菌核酸配列、ウイルス核酸配列、または真核生物寄生虫核酸配列である。本明細書に開示の実施形態のいずれかにおいて、試料をCRISPR/Cas系タンパク質-gRNA複合体と接触させ、gRNAは、リボソームRNA配列に対応するDNAに相補的である。本明細書に開示の実施形態のいずれかにおいて、試料をCRISPR/Cas系タンパク質-gRNA複合体と接触させ、gRNAは、ミトコンドリアDNAに相補的である。本明細書に開示の実施形態のいずれかにおいて、試料をCRISPR/Cas系タンパク質-gRNA複合体と接触させ、gRNAは、グロビンタンパク質をコードする配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメアリピートを含む配列、動原体配列を含む配列、イントロン配列を含む配列、Aluリピートを含む配列、SINEリピートを含む配列、LINEリピートを含む配列、二核酸(dinucleic acid)リピートを含む配列、三核酸(trinucleic acid)リピートを含む配列、四核酸(tetranucleic acid)リピートを含む配
列、ポリ-Aリピートを含む配列、ポリ-Tリピートを含む配列、ポリ-Cリピートを含む配列、ポリ-Gリピートを含む配列、ATリッチ配列を含む配列、またはGCリッチ配列を含む配列に相補的である。本明細書に開示の実施形態のいずれかにおいて、抽出された核酸は、一本鎖DNA、二本鎖DNA、一本鎖RNA、二本鎖RNA、cDNA、合成DNA、人工DNA、およびDNA/RNAハイブリッドのいずれか1つを含む。本明細書に開示の実施形態のいずれかにおいて、目的の配列は、抽出された核酸の10%未満を構成する。本明細書に開示の実施形態のいずれかにおいて、目的の配列は、抽出された核酸の5%未満を構成する。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、またはCm5である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、触媒不活性(catalytically dead)であり、例えば、触媒不活性であるCRI
SPR/Cas系タンパク質は、dCas9である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、CRISPR/Cas系タンパク質ニッカーゼ、例えば、Cas9ニッカーゼである。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、熱安定性である。本明細書に開示の実施形態のいずれかにおいて、方法は、アダプター特異的PCRを使用してステップ(b)の生成物を増幅するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、方法は、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、方法は、陽性対照標的配列の使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、方法は、陰性対照gRNAの使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0011】
別の態様では、試料を富化する方法であって、(a)ミトコンドリアDNAおよび非ミトコンドリアDNAを含む試料を準備するステップであって、ミトコンドリアDNAおよび非ミトコンドリアDNAは、アダプターライゲーションされており、アダプターは、ミトコンドリアDNAおよび非ミトコンドリアDNAの5’および3’末端にライゲーションされている、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、ミトコンドリアDNAに相補的であり、それによって、一端のみでアダプターライゲーションされたミトコンドリアDNAならびに5’および3’末端の両方でアダプターライゲーションされた非ミトコンドリアDNAを生成する、ステップと;(c)試料を非ミトコンドリアDNAについて富化するステップとを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれか1つにおいて、ステップ(c)は、アダプター特異的PCRを使用してステップ(b)の生成物を増幅することを含む。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理することを含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、本方法は、ゲノムDNAを解析するための方法であって、細胞の集団から単離されたDNAを挿入酵素で処理して、非ミトコンドリアゲノムDNAの複数のタグ付き断片を生成し、それによって残留量のタグ付きミトコンドリアDNAも生成するステップを含む、方法に従って実行される。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料からミトコンドリアDNAおよび非ミトコンドリアDNAを抽出するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、抽出された配列を断片化するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、ミトコンドリアDNAは、サイズ排除によって除去される。本明細書に開示の実施形態のいずれかにおいて、ミトコンドリアDNAは、ビオチンを使用して除去される。本明細書に開示の実施形態のいずれかにおいて、試料を富化するステップは、非ミトコンドリアDNAを増幅することを含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、またはCm5である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、触媒不活性である、例えば、dCas9である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、CRISPR/Cas系タンパク質ニッカーゼ、例えば、Cas9ニッカーゼである。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、熱安定性である。本明細書に開示の実施形態のいずれかにおいて、富化するステップは、アダプター特異的PCRを使用してステップ(b)の生成物を増幅することを含む。本明細書に開示の実施形態のいずれかにおいて、富化するステップは、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理することを含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、本方法は、陽性対照標的配列の使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、陰性対照gRNAの使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0012】
別の態様では、試料を富化する方法であって、(a)第1のゲノム由来の核酸および第2のゲノム由来の核酸を含む試料を準備するステップであって、第1のゲノム由来の核酸は、これらの5’および3’末端でアダプターライゲーションされており、第2のゲノム由来の核酸は、これらの5’および3’末端でアダプターライゲーションされている、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、第1のゲノム由来の核酸中の標的にされた部位に相補的であり、それによって一端でのみアダプターライゲーションされた第1のゲノム由来の核酸ならびに5’および3’末端の両方でアダプターライゲーションされた第2のゲノム由来の核酸を生成する、ステップと;(c)試料を第2のゲノム由来の核酸について富化するステップとを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、試料は、追加のゲノム由来の核酸をさらに含む。本明細書に開示の実施形態のいずれかにおいて、第1のゲノムは、宿主ゲノムであり、第2のゲノムは、非宿主ゲノムである。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、核酸は、一本鎖DNA、一本鎖RNA、二本鎖DNA、二本鎖RNA、DNA/RNAハイブリッド、cDNA、合成DNA、および人工DNAからなる群から選択される。本明細書に開示の実施形態のいずれかにおいて、核酸は、二本鎖DNAである。本明細書に開示の実施形態のいずれかにおいて、核酸は、DNAであり、ステップ(b)の接触により、5’末端でアダプターライゲーションされているが、3’末端でアダプターライゲーションされていない第1のゲノムDNA、ならびに5’および3’末端の両方でアダプターライゲーションされた第2のゲノムDNAが生成される。本明細書に開示の実施形態のいずれかにおいて、核酸は、DNAである。本明細書に開示の実施形態のいずれかにおいて、DNAは、ゲノムDNAである。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、またはCm5である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、第1のゲノム核酸中の標的化部位の後に、Cas9によって結合され得るプロトスペーサー隣接モチーフまたは(PAM)配列が続く。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、触媒不活性である、例えば、dCas9である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、CRISPR/Cas系タンパク質ニッカーゼ、例えば、Cas9ニッカーゼである。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、熱安定性である。本明細書に開示の実施形態のいずれかにおいて、第1のゲノムは、ヒト、ウシ、ウマ、ヒツジ、ブタ、サル、イヌ、ネコ、アレチネズミ、トリ、マウス、およびラットからなる群から選択される生物由来である。本明細書に開示の実施形態のいずれかにおいて、第2のゲノムは、原核生物由来である。本明細書に開示の実施形態のいずれかにおいて、第2のゲノムは、真核生物由来である。本明細書に開示の実施形態のいずれかにおいて、第2のゲノムは、寄生虫由来である。本明細書に開示の実施形態のいずれかにおいて、第2のゲノムは、ウイルス、細菌、真菌、または原生動物由来である。本明細書に開示の実施形態のいずれかにおいて、アダプターライゲーションされた第1のゲノム核酸およびアダプターライゲーションされた第2のゲノム核酸は、50~1000bpの範囲である。本明細書に開示の実施形態のいずれかにおいて、第2のゲノム核酸は、試料中の全核酸の50%未満を構成する。本明細書に開示の実施形態のいずれかにおいて、第2のゲノム核酸は、試料中の全核酸の5%未満を構成する。本明細書に開示の実施形態のいずれかにおいて、試料は、生体試料、臨床試料、法医学試料、または環境試料のいずれか1つである。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、アダプター特異的PCRを使用してステップ(b)の生成物を増幅することを含む。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理することを含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、サイズ排除によって第1のゲノム核酸を除去することを含む。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、ビオチンを使用して第1のゲノム核酸を除去することを含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、アダプター特異的PCRを使用してステップ(b)の生成物を増幅するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、本方法は、陽性対照標的配列の使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、陰性対照gRNAの使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0013】
別の態様では、試料を富化する方法であって、(a)宿主核酸および非宿主核酸を含む試料を準備するステップであって、宿主核酸および非宿主核酸は、アダプターライゲーションされており、アダプターは、宿主核酸および非宿主核酸の5’および3’末端にライゲーションされている、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、宿主核酸中の標的化部位に相補的であり、それによって一端のみでアダプターライゲーションされた宿主核酸ならびに5’および3’末端の両方でアダプターライゲーションされた非宿主核酸を生成する、ステップと;(c)試料を非宿主核酸について富化するステップとを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、核酸は、一本鎖DNA、一本鎖RNA、二本鎖DNA、二本鎖RNA、DNA/RNAハイブリッド、cDNA、合成DNA、および人工DNAからなる群から選択される。本明細書に開示の実施形態のいずれかにおいて、核酸は、二本鎖DNAである。本明細書に開示の実施形態のいずれかにおいて、核酸は、DNAであり、ステップ(b)の接触により、5’末端でアダプターライゲーションされているが、3’末端でアダプターライゲーションされていない宿主DNA、ならびに5’および3’末端の両方でアダプターライゲーションされた非宿主DNAが生成される。本明細書に開示の実施形態のいずれかにおいて、核酸は、DNAである。本明細書に開示の実施形態のいずれかにおいて、DNAは、ゲノムDNAである。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、またはCm5である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、宿主核酸中の標的化部位の後に、Cas9によって結合され得るプロトスペーサー隣接モチーフまたは(PAM)配列が続く。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、触媒不活性である、例えば、dCas9である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、CRISPR/Cas系タンパク質ニッカーゼ、例えば、Cas9ニッカーゼである。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、熱安定性である。本明細書に開示の実施形態のいずれかにおいて、宿主は、ヒト、ウシ、ウマ、ヒツジ、ブタ、サル、イヌ、ネコ、アレチネズミ、トリ、マウス、およびラットからなる群から選択される。本明細書に開示の実施形態のいずれかにおいて、非宿主は、原核生物である。本明細書に開示の実施形態のいずれかにおいて、非宿主は、真核生物である。本明細書に開示の実施形態のいずれかにおいて、非宿主は、寄生虫である。本明細書に開示の実施形態のいずれかにおいて、非宿主は、ウイルス、細菌、真菌、および原生動物からなる群から選択される。本明細書に開示の実施形態のいずれかにおいて、アダプターライゲーションされた宿主核酸および非宿主核酸は、50~1000bpの範囲である。本明細書に開示の実施形態のいずれかにおいて、非宿主核酸は、試料中の全核酸の50%未満を構成する。本明細書に開示の実施形態のいずれかにおいて、非宿主核酸は、試料中の全核酸の5%未満を構成する。本明細書に開示の実施形態のいずれかにおいて、試料は、生体試料、臨床試料、法医学試料、または環境試料のいずれか1つである。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、アダプター特異的PCRを使用してステップ(b)の生成物を増幅することを含む。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理することを含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、サイズ排除によって宿主核酸を除去することを含む。本明細書に開示の実施形態のいずれかにおいて、ステップ(c)は、ビオチンを使用して宿主核酸を除去することを含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、アダプター特異的PCRを使用してステップ(b)の生成物を増幅するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理するステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、本方法は、陽性対照標的配列の使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、陰性対照gRNAの使用を含めるステップをさらに含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0014】
別の態様では、試料中の標的化配列を枯渇させる方法であって、(a)目的の配列および枯渇のための標的化配列を含む試料を準備するステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって切断された標的化配列を生成する、ステップと、;(c)ステップ(b)の生成物を、エキソヌクレアーゼ活性を有する酵素と接触させるステップを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、枯渇のための標的化配列は、グロビンタンパク質をコードする配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメアリピートを含む配列、動原体配列を含む配列、イントロン配列を含む配列、Aluリピートを含む配列、SINEリピートを含む配列、LINEリピートを含む配列、二核酸リピートを含む配列、三核酸リピートを含む配列、四核酸リピートを含む配列、ポリ-Aリピートを含む配列、ポリ-Tリピートを含む配列、ポリ-Cリピートを含む配列、ポリ-Gリピートを含む配列、ATリッチ配列を含む配列、またはGCリッチ配列を含む配列を含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0015】
別の態様では、試料中の切断された標的化配列を生成する方法であって、(a)目的の配列および切断のための標的化配列を含む試料を準備するステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって切断された標的化配列を生成する、ステップと;(c)切断された標的化配列からCRISPR/Cas系タンパク質を解離させるステップと;(d)追加の切断された標的化配列を生成するステップと;(e)カットされなかった目的の配列を回収するステップとを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、熱安定性である。本明細書に開示の実施形態のいずれかにおいて、熱安定性CRISPR/Cas系タンパク質は、熱安定性Cas9である。本明細書に開示の実施形態のいずれかにおいて、切断された標的化配列からのCRISPR/Cas系タンパク質の解離は、ステップ(b)の混合物の温度を少なくとも75°に上昇させることによって達成される。本明細書に開示の実施形態のいずれかにおいて、追加の切断された標的化配列の生成は、ステップ(b)の混合物の温度を少なくとも50°に下げることによって達成される。本明細書に開示の実施形態のいずれかにおいて、ステップ(e)は、アダプター特異的PCRを使用してステップ(d)の生成物を増幅することを含む。本明細書に開示の実施形態のいずれかにおいて、ステップ(e)は、エキソヌクレアーゼ活性を有する酵素でステップ(d)の生成物を処理することを含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、切断のための標的化配列は、グロビンタンパク質をコードする配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメアリピートを含む配列、動原体配列を含む配列、イントロン配列を含む配列、Aluリピートを含む配列、SINEリピートを含む配列、LINEリピートを含む配列、二核酸リピートを含む配列、三核酸リピートを含む配列、四核酸リピートを含む配列、ポリ-Aリピートを含む配列、ポリ-Tリピートを含む配列、ポリ-Cリピートを含む配列、ポリ-Gリピートを含む配列、ATリッチ配列を含む配列、またはGCリッチ配列を含む配列を含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0016】
別の態様では、試料中の標的化配列を枯渇させる方法であって、(a)目的の配列および切断のための標的化配列を含む試料を準備するステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって切断された標的化配列を生成し、CRISPR/Cas系タンパク質は、熱安定性である、ステップと;(c)ステップ(b)の混合物の温度を少なくとも75°に上昇させるステップと;(d)ステップ(b)の混合物の温度を少なくとも50°に下げるステップと;(e)ステップ(c)および(d)を少なくとも1回繰り返すステップと;(f)カットされなかった目的の配列を回収するステップとを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、ステップ(f)は、アダプター特異的PCRを使用してステップ(e)の生成物を増幅することを含む。本明細書に開示の実施形態のいずれかにおいて、ステップ(f)は、エキソヌクレアーゼ活性を有する酵素でステップ(e)の生成物を処理することを含む。本明細書に開示の実施形態のいずれかにおいて、酵素は、エキソヌクレアーゼIIIまたはBAL-31である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、切断のための標的化配列は、グロビンタンパク質をコードする配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメアリピートを含む配列、動原体配列を含む配列、イントロン配列を含む配列、Aluリピートを含む配列、SINEリピートを含む配列、LINEリピートを含む配列、二核酸リピートを含む配列、三核酸リピートを含む配列、四核酸リピートを含む配列、ポリ-Aリピートを含む配列、ポリ-Tリピートを含む配列、ポリ-Cリピートを含む配列、ポリ-Gリピートを含む配列、ATリッチ配列を含む配列、またはGCリッチ配列を含む配列を含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0017】
別の態様では、試料中の標的化核酸を連続的に枯渇させるための方法であって、(a)宿主核酸および非宿主核酸を含む試料を準備するステップであって、非宿主核酸は、少なくとも1種の既知の非宿主生物由来の核酸および少なくとも1種の未知の非宿主生物由来の核酸を含む、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、宿主核酸中の標的化配列にハイブリダイズするように配置されており、それによって宿主核酸の一部が切断される、ステップと;(c)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、少なくとも1種の既知の非宿主核酸中の標的化配列にハイブリダイズするように配置されており、それによって少なくとも1種の既知の非宿主核酸の一部が切断される、ステップと;(d)未知の非宿主生物から核酸を単離するステップとを含む、方法が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を、宿主核酸中の標的化配列にハイブリダイズするように配置された少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、本方法は、試料を、少なくとも1種の既知の非宿主核酸中の標的化配列にハイブリダイズするように配置された少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。本明細書に開示の実施形態のいずれかにおいて、未知の非宿主生物由来の核酸は、試料中の全核酸の5%未満を構成する。本明細書に開示の実施形態のいずれかにおいて、宿主は、ヒトである。本明細書に開示の実施形態のいずれかにおいて、少なくとも1つの既知の非宿主生物は、Streptococcusの種である。
【0018】
別の態様では、ゲノムDNAを解析するための方法であって、(a)試料由来の細胞の集団から単離されたDNAを挿入酵素で処理して、非ミトコンドリアゲノムDNAの複数のタグ付き断片を生成し、それによって残留量のタグ付きミトコンドリアDNAも生成する、ステップと;(b)本明細書に提供する関連した方法のいずれかに従って、ステップ(a)の生成物を非ミトコンドリアDNAについて富化するステップとを含む、方法が本明細書に提供されている。例えば、試料を富化するかかる方法は、(a)ミトコンドリアDNAおよび非ミトコンドリアDNAを含む試料を準備するステップであって、ミトコンドリアDNAおよび非ミトコンドリアDNAは、アダプターライゲーションされており、アダプターは、ミトコンドリアDNAおよび非ミトコンドリアDNAの5’および3’末端にライゲーションされている、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、ミトコンドリアDNAに相補的であり、それによって、一端のみでアダプターライゲーションされたミトコンドリアDNAならびに5’および3’末端の両方でアダプターライゲーションされた非ミトコンドリアDNAを生成する、ステップと;(c)試料を非ミトコンドリアDNAについて富化するステップとを含み得る。本明細書に開示の実施形態のいずれかにおいて、本方法は、(a)タグ付き断片の少なくとも一部を配列決定して複数の配列リードを生成するステップと;(b)配列リードから得た情報を領域にマッピングすることによって前記細胞のゲノムの領域のエピジェネティックマップを作製するステップとをさらに含む。本明細書に開示の実施形態のいずれかにおいて、試料は、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される。
【0019】
別の態様では、第1のゲノム由来のDNAおよび第2のゲノム由来のDNAの混合物を含む組成物であって、第1のゲノムDNAおよび第2のゲノムDNAは、アダプターライゲーションされており、第1のゲノムDNAは、gRNA-CRISPR/Cas系タンパク質複合体に複合体形成されている、組成物が本明細書に提供されている。本明細書に開示の実施形態のいずれかにおいて、第1のゲノムは、宿主生物由来であり、第2のゲノムは、非宿主生物由来である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれかにおいて、CRISPR/Cas系タンパク質は、熱安定性である。
【0020】
別の態様では、キットが本明細書に提供されている。別の態様では、(a)CRISPR/Cas系タンパク質;および(b)ミトコンドリアDNAに相補的であるgRNAを含むキットが本明細書に提供されている。別の態様では、(a)CRISPR/Cas系タンパク質;(b)目的の標的に相補的であるgRNA;および(c)エキソヌクレアーゼ活性を有する酵素を含むキットが本明細書に提供されている。別の態様では、(a)熱安定性であるCRISPR/Cas系タンパク質;および(b)目的の標的に相補的であるgRNAを含むキットが本明細書に提供されている。別の態様では、(a)CRISPR/Cas系タンパク質;および(b)目的の標的配列に相補的であるgRNAの第1のセット;および(c)試薬の対照セットを含むキットが本明細書に提供されている。別の態様では、(a)細胞の集団からDNAを単離するための試薬;(b)挿入酵素;(c)CRISPR/Cas系タンパク質;および(d)ミトコンドリアDNAに相補的である複数のgRNAを含むキットが本明細書に提供されている。本明細書に開示のキットのいずれかにおいて、キットは、Y形アダプターまたはポリ-Gアダプターのコレクションをさらに含む。本明細書に開示のキットのいずれかにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示のキットのいずれかにおいて、キットは、試薬の陽性対照セットをさらに含み、例えば、試薬の陽性対照セットは、核酸断片のコレクションを含み、断片は、gRNAが少なくとも85%相補的である目的の標的配列を含む。本明細書に開示のキットのいずれかにおいて、キットは、試薬の陰性対照セットをさらに含み、例えば、試薬の陰性対照セットは、gRNAの第2のセットを含み、gRNAの第2のセットは、gRNAの第1のセットと比較して、目的の標的配列への結合の低減を呈し、または例えば、試薬の陰性対照セットは、核酸断片のコレクションを含み得、断片は、gRNAの第1のセットに90%以下、相補的である。本明細書に開示のキットのいずれか1つにおいて、キットは、少なくとも102のユニークgRNA(unique gRNA)をさらに含む。
【0021】
別の態様では、本発明は、試料中の標的化配列を枯渇させる方法であって、目的の配列および枯渇のための標的化配列を含む試料を準備するステップと;試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって切断された標的化配列を生成する、ステップとを含む、方法を提供する。関連した態様では、本発明は、試料中の標的化配列の枯渇および分割の一方のための方法であって、試料から抽出された核酸を準備するステップであって、抽出された核酸配列は、目的の配列、ならびに枯渇および分割の一方のための標的化配列を含む、ステップと;複数のガイドRNA(gRNA)-CRISPR/Cas系タンパク質複合体を準備するステップであって、gRNAは、異なる標的化配列にハイブリダイズするように配置されている、ステップと;核酸をgRNA-CRISPR/Cas系タンパク質複合体と混合するステップであって、複数のgRNA-CRISPR/Cas系タンパク質複合体の少なくとも一部は、標的化配列にハイブリダイズする、ステップとを含む、方法を提供する。本明細書に開示の実施形態のいずれか1つにおいて、本方法は、試料から核酸配列を抽出するステップをさらに含む。本明細書に開示の実施形態のいずれか1つにおいて、CRISPR/Cas系タンパク質は、Cas9である。本明細書に開示の実施形態のいずれか1つにおいて、本方法は、抽出された核酸を断片化するステップをさらに含む。本明細書に開示の実施形態のいずれか1つにおいて、本方法は、抽出され断片化された核酸の5’および3’末端をアダプターライゲーションするステップをさらに含む。本明細書に開示の実施形態のいずれか1つにおいて、本方法は、混合物をインキュベートして標的化配列を切断するステップをさらに含む。本明細書に開示の実施形態のいずれか1つにおいて、枯渇のために標的にされるそれぞれの配列の後に、細菌種に由来するCas9タンパク質が結合し得るプロトスペーサー隣接モチーフまたは(PAM)配列が続くが、目的の配列(富化のための)は、gRNAによって標的にされない。本明細書に開示の実施形態のいずれか1つにおいて、Cas9タンパク質は、自己に先に結合させた親和性タグを含む触媒不活性であるCas9を含み、混合物を、ガイドRNA/Cas9複合体を含む混合物中に存在する相補的な標的特異的核配列を含む第1の部分、およびガイドRNA/Cas9複合体が結合していない抽出され断片化された核酸配列を含む第2の部分に分割するステップをさらに含み、分割は、親和性タグを使用して実施される。本明細書に開示の実施形態のいずれか1つにおいて、切断された抽出された核酸配列は、切断されなかった抽出され断片化された核酸配列より小さく、本方法は、サイズ選択的排除によって混合物から切断された抽出された核酸配列を除去するステップをさらに含む。本明細書に開示の実施形態のいずれか1つにおいて、本方法は、切断されなかった抽出され断片化された核酸配列を増幅するステップをさらに含む。本明細書に開示の実施形態のいずれか1つにおいて、本方法は、増幅および配列決定によって第1および第2の部分のそれぞれを解析するステップをさらに含む。本明細書に開示の実施形態のいずれか1つにおいて、試料は、生体試料、臨床試料、法医学試料、または環境試料のいずれか1つである。本明細書に開示の実施形態のいずれか1つにおいて、抽出された核酸は、宿主核酸配列および非宿主核酸配列を含む。本明細書に開示の実施形態のいずれか1つにおいて、非宿主核酸配列は、微生物核酸配列を含む。本明細書に開示の実施形態のいずれか1つにおいて、微生物核酸配列は、細菌核酸配列、ウイルス核酸配列、および真核生物寄生虫核酸配列のいずれか1つを含む。本明細書に開示の実施形態のいずれか1つにおいて、宿主核酸配列の少なくとも一部は、枯渇および分割の一方のために標的にされている配列中に含まれている。本明細書に開示の実施形態のいずれか1つにおいて、宿主核酸配列の実質的にすべてが、枯渇および分割の一方のために標的にされている配列中に含まれている。本明細書に開示の実施形態のいずれか1つにおいて、抽出された核酸は、複数の異なるリボソームRNA配列を含み、複数の異なる標的特異的gRNAは、複数の異なるリボソームRNA配列の一部にハイブリダイズするように配置された標的核酸配列の少なくとも一部を含む。本明細書に開示の実施形態のいずれか1つにおいて、抽出された核酸配列は、複数の異なるミトコンドリア核酸配列を含み、複数の異なる標的特異的gRNAは、複数の異なるミトコンドリア核酸配列の一部にハイブリダイズするように配置された1つまたは複数の標的核酸配列を含む。本明細書に開示の実施形態のいずれか1つにおいて、抽出された核酸配列は、枯渇のために標的にされる核酸配列中に複数の異なる反復核酸配列を含み、複数の異なる標的特異的gRNAは、複数の異なる反復核酸配列の一部にハイブリダイズし得る少なくとも1つの標的核酸配列を含む。本明細書に開示の実施形態のいずれか1つにおいて、抽出された核酸は、一本鎖DNA、二本鎖DNA、一本鎖RNA、二本鎖RNA、cDNA、合成DNA、人工DNA、およびDNA/RNAハイブリッドのいずれか1つを含む。本明細書に開示の実施形態のいずれか1つにおいて、目的の配列は、抽出された核酸の50%未満を構成する。本明細書に開示の実施形態のいずれか1つにおいて、目的の配列は、抽出された核酸の5%未満を構成する。
【0022】
別の態様では、本発明は、それぞれが選択された標的核酸配列にハイブリダイズするように配置された複数の標的特異的ガイドRNAを含むガイドRNAライブラリーであって、各ガイドRNAは、Cas9タンパク質によって結合され得る配列を含む、ガイドRNAライブラリーを提供する。本明細書に開示の実施形態のいずれか1つにおいて、それぞれの選択された標的核酸配列の直後にプロトスペーサー隣接モチーフが続く。本明細書に開示の実施形態のいずれか1つにおいて、標的特異的gRNAは、ヒトゲノム中の選択された標的核酸配列とハイブリダイズするのに適したgRNAを含む。本明細書に開示の実施形態のいずれか1つにおいて、ヒトゲノムは、複数の異なる反復核酸配列を含む核酸配列を含み、標的特異的gRNAは、複数の異なる反復核酸配列のそれぞれとハイブリダイズするのに適したガイドエレメントを含む。
【0023】
別の態様では、本明細書に開示の技術は、Cas9-酵素媒介法を使用する核酸試料の選択的もしくは標的化枯渇および/または選択的もしくは標的化分割のための方法およびシステムに関する。
【0024】
別の態様では、本明細書に開示の技術は、gRNAのライブラリーを形成することであって、それぞれのgRNAは、全核酸試料からの除去のために標的にされている核酸配列にハイブリダイズするのに適しており、標的にされている配列の後にプロトスペーサー隣接モチーフ(PAM)配列が続く、形成することに関する。gRNAを核酸試料および細菌種に由来するCas9タンパク質と混合することによって、gRNAは、除去のために標的にされている核酸配列にハイブリダイズし、Cas9酵素は、除去のために標的にされている核酸配列に結合するガイドRNA/Cas9複合体を形成する。その後、ガイドRNA/Cas9複合体をインキュベートして標的化核酸配列をカットすることができ、その結果、カットされた配列をカットされなかった核酸配列から分離することができ、またはその結果、ガイドRNA/Cas9複合体が結合している標的化配列を、ガイドRNA/Cas9複合体が結合していないDNA配列から分割することができる。
【0025】
別の態様では、本明細書に開示の技術は、低レベル(例えば、50%未満)の非宿主核酸を含有する核酸試料から宿主分子を枯渇させるのにも有用である。
【0026】
別の態様では、本明細書に開示の技術は、1)ゲノムDNA試料またはシークエンシングライブラリーをCas9-gRNA複合体の混合物と組み合わせるステップであって、Cas9-gRNA複合体は、Cas9タンパク質およびゲノム中の所定の部位に相補的であるCas9関連gRNAを含む、ステップと;b)反応混合物をインキュベートして標的領域のみをカットするステップとを含む。シークエンシングライブラリーが標的にされる実施形態では、Cas9カッティングは、2つのシークエンシングアダプターを分離し、したがってこれらの断片を増幅することができないようにするはずである。ゲノムDNAが標的にされる実施形態では、Cas9カッティングは、これらの断片をサイズ選択によって除去されるのに十分小さくするはずである。
特定の態様では、例えば以下の項目が提供される:
(項目1)
試料を目的の配列について富化する方法であって、
a.目的の配列および枯渇のための標的化配列を含む試料を準備するステップであって、該目的の配列は、該試料の30%未満を構成する、ステップと;
b.該試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、該gRNAは、該標的化配列に相補的であり、それによって該標的化配列が切断される、ステップと
を含む、方法。
(項目2)
前記試料から前記目的の配列および前記枯渇のための標的化配列を抽出するステップをさらに含む、項目1に記載の方法。
(項目3)
前記抽出された配列を断片化するステップをさらに含む、項目2に記載の方法。
(項目4)
前記抽出され断片化された配列の5’および3’末端をアダプターライゲーションするステップをさらに含む、項目3に記載の方法。
(項目5)
前記切断された標的化配列が、サイズ排除によって、またはビオチンを使用して除去される、項目1に記載の方法。
(項目6)
前記目的の配列を増幅するステップをさらに含む、項目1に記載の方法。
(項目7)
前記試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む、項目1に記載の方法。
(項目8)
前記試料が、生体試料、臨床試料、法医学試料、または環境試料のいずれか1つである、項目1に記載の方法。
(項目9)
前記試料が、枯渇のために標的にされる宿主核酸配列および目的の非宿主核酸配列を含む、項目1に記載の方法。
(項目10)
前記非宿主核酸配列が、微生物核酸配列を含む、項目9に記載の方法。
(項目11)
前記微生物核酸配列が、細菌核酸配列、ウイルス核酸配列、または真核生物寄生虫核酸配列である、項目10に記載の方法。
(項目12)
前記試料をCRISPR/Cas系タンパク質-gRNA複合体と接触させ、該gRNAが、ミトコンドリアDNAに相補的である、項目1に記載の方法。
(項目13)
前記試料をCRISPR/Cas系タンパク質-gRNA複合体と接触させ、該gRNAが、リボソームRNA配列、グロビンタンパク質をコードする配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメアリピートを含む配列、動原体配列を含む配列、イントロン配列を含む配列、Aluリピートを含む配列、SINEリピートを含む配列、LINEリピートを含む配列、二核酸リピートを含む配列、三核酸リピートを含む配列、四核酸リピートを含む配列、ポリ-Aリピートを含む配列、ポリ-Tリピートを含む配列、ポリ-Cリピートを含む配列、ポリ-Gリピートを含む配列、ATリッチ配列を含む配列、またはGCリッチ配列を含む配列に対応するDNAに相補的である、項目1に記載の方法。
(項目14)
抽出された核酸が、一本鎖DNA、二本鎖DNA、一本鎖RNA、二本鎖RNA、cDNA、合成DNA、人工DNA、およびDNA/RNAハイブリッドのいずれか1つを含む、項目2に記載の方法。
(項目15)
前記目的の配列が、抽出された核酸の10%未満を構成する、項目1に記載の方法。
(項目16)
前記CRISPR/Cas系タンパク質が、Cas9である、項目1に記載の方法。
(項目17)
前記CRISPR/Cas系タンパク質が、触媒不活性である、項目1に記載の方法。(項目18)
前記触媒不活性であるCRISPR/Cas系タンパク質が、dCas9である、項目17に記載の方法。
(項目19)
前記CRISPR/Cas系タンパク質が、CRISPR/Cas系タンパク質ニッカーゼである、項目1に記載の方法。
(項目20)
前記CRISPR/Cas系タンパク質ニッカーゼが、Cas9ニッカーゼである、項目19に記載の方法。
(項目21)
前記CRISPR/Cas系タンパク質が、熱安定性である、項目1に記載の方法。
(項目22)
アダプター特異的PCRを使用してステップ(b)の生成物を増幅するステップをさらに含む、項目1に記載の方法。
(項目23)
エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理するステップをさらに含む、項目1に記載の方法。
(項目24)
前記酵素が、エキソヌクレアーゼIIIまたはBAL-31である、項目23に記載の方法。
(項目25)
前記試料が、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される、項目1に記載の方法。
(項目26)
試料を富化する方法であって、
a.宿主核酸および非宿主核酸を含む試料を準備するステップであって、該宿主核酸および非宿主核酸は、アダプターライゲーションされており、該アダプターは、該宿主核酸および該非宿主核酸の5’および3’末端にライゲーションされている、ステップと;
b.該試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、該gRNAは、該宿主核酸中の標的化部位に相補的であり、それによって一端のみでアダプターライゲーションされた宿主核酸、ならびに5’および3’末端の両方でアダプターライゲーションされた非宿主核酸を生成する、ステップと;
c.該試料を非宿主核酸について富化するステップと
を含む、方法。
(項目27)
前記試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む、項目26に記載の方法。
(項目28)
前記核酸は、DNAであり、ステップ(b)の前記接触させるステップにより、5’末端でアダプターライゲーションされているが、3’末端でアダプターライゲーションされていない宿主DNA、ならびに5’および3’末端の両方でアダプターライゲーションされた非宿主DNAが生成される、項目26に記載の方法。
(項目29)
前記CRISPR/Cas系タンパク質が、Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、またはCm5である、項目26に記載の方法。
(項目30)
前記CRISPR/Cas系タンパク質が、Cas9である、項目29に記載の方法。(項目31)
前記CRISPR/Cas系タンパク質が、dCas9である、項目26に記載の方法。
(項目32)
前記CRISPR/Cas系タンパク質が、Cas9ニッカーゼである、項目26に記載の方法。
(項目33)
前記CRISPR/Cas系タンパク質が、熱安定性である、項目26に記載の方法。(項目34)
前記宿主が、ヒト、ウシ、ウマ、ヒツジ、ブタ、サル、イヌ、ネコ、アレチネズミ、トリ、マウス、およびラットからなる群から選択される、項目26に記載の方法。
(項目35)
前記非宿主が、原核生物である、項目26に記載の方法。
(項目36)
前記非宿主が、真核生物、ウイルス、細菌、真菌、および原生動物からなる群から選択される、項目26に記載の方法。
(項目37)
前記アダプターライゲーションされた宿主核酸および非宿主核酸が、50~1000bpの範囲である、項目26に記載の方法。
(項目38)
前記非宿主核酸が、前記試料中の全核酸の50%未満を構成する、項目26に記載の方法。
(項目39)
前記試料が、生体試料、臨床試料、法医学試料、または環境試料のいずれか1つである、項目26に記載の方法。
(項目40)
ステップ(c)が、アダプター特異的PCRを使用してステップ(b)の生成物を増幅することを含む、項目26に記載の方法。
(項目41)
ステップ(c)が、エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理することを含む、項目26に記載の方法。
(項目42)
前記酵素が、エキソヌクレアーゼIIIまたはBAL-31である、項目41に記載の方法。
(項目43)
ステップ(c)が、サイズ排除によって前記宿主核酸を除去することを含む、項目26に記載の方法。
(項目44)
ステップ(c)が、ビオチンを使用して前記宿主核酸を除去することを含む、項目26に記載の方法。
(項目45)
アダプター特異的PCRを使用してステップ(b)の生成物を増幅するステップをさらに含む、項目26に記載の方法。
(項目46)
エキソヌクレアーゼ活性を有する酵素でステップ(b)の生成物を処理するステップをさらに含む、項目26に記載の方法。
(項目47)
前記酵素が、エキソヌクレアーゼIIIまたはBAL-31である、項目46に記載の方法。
(項目48)
陽性対照標的配列の使用を含めるステップをさらに含む、項目26に記載の方法。
(項目49)
陰性対照gRNAの使用を含めるステップをさらに含む、項目26に記載の方法。
(項目50)
前記試料が、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される、項目26に記載の方法。
(項目51)
試料中の標的化核酸を連続的に枯渇させるための方法であって、
a.宿主核酸および非宿主核酸を含む試料を準備するステップであって、該非宿主核酸は、少なくとも1種の既知の非宿主生物由来の核酸および少なくとも1種の未知の非宿主生物由来の核酸を含む、ステップと;
b.該試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、該gRNAは、該宿主核酸中の標的化配列にハイブリダイズするように配置されており、それによって該宿主核酸の一部が切断される、ステップと;
c.該試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、該gRNAは、該少なくとも1種の既知の非宿主核酸中の標的化配列にハイブリダイズするように配置されており、それによって該少なくとも1種の既知の非宿主核酸の一部が切断される、ステップと;
d.該未知の非宿主生物から該核酸を単離するステップと
を含む、方法。
(項目52)
前記試料を、前記宿主核酸中の標的化配列にハイブリダイズするように配置された少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む、項目51に記載の方法。
(項目53)
前記試料を、前記少なくとも1種の既知の非宿主核酸中の標的化配列にハイブリダイズするように配置された少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む、項目51に記載の方法。
(項目54)
前記試料が、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、および生検から選択される、項目51に記載の方法。
(項目55)
未知の非宿主生物由来の核酸が、前記試料中の全核酸の5%未満を構成する、項目51に記載の方法。
(項目56)
前記宿主がヒトである、項目51に記載の方法。
(項目57)
第1のゲノム由来のDNAおよび第2のゲノム由来のDNAの混合物を含む組成物であって、該第1のゲノムDNAおよび該第2のゲノムDNAは、アダプターライゲーションされており、該第1のゲノムDNAは、gRNA-CRISPR/Cas系タンパク質複合体に複合体形成されている、組成物。
(項目58)
前記第1のゲノムが、宿主生物由来であり、前記第2のゲノムが、非宿主生物由来である、項目57に記載の組成物。
(項目59)
前記CRISPR/Cas系タンパク質が、Cas9である、項目57に記載の組成物。
(項目60)
前記CRISPR/Cas系タンパク質が、熱安定性である、項目57に記載の組成物。
(項目61)
a.CRISPR/Cas系タンパク質;および
b.ミトコンドリアDNAに相補的であるgRNA
を含むキット。
(項目62)
a.CRISPR/Cas系タンパク質;
b.目的の標的に相補的であるgRNA;および
c.エキソヌクレアーゼ活性を有する酵素
を含むキット。
(項目63)
a.熱安定性であるCRISPR/Cas系タンパク質;および
b.目的の標的に相補的であるgRNA
を含むキット。
(項目64)
a.CRISPR/Cas系タンパク質;および
b.目的の標的配列に相補的であるgRNAの第1のセット;および
c.試薬の対照セット
を含むキット。
(項目65)
試薬の陽性対照セットをさらに含む、項目64に記載のキット。
(項目66)
試薬の陰性対照セットをさらに含む、項目64に記載のキット。
(項目67)
a.細胞の集団からDNAを単離するための試薬;
b.挿入酵素;
c.CRISPR/Cas系タンパク質;および
d.ミトコンドリアDNAに相補的である複数のgRNA
を含むキット。
(項目68)
前記CRISPR/Cas系タンパク質が、Cas9である、項目61から67のいずれか一項に記載のキット。
(項目69)
少なくとも102のユニークgRNAを含む、項目61から67のいずれか一項に記載のキット。
(項目70)
Y形アダプターまたはポリ-Gアダプターのコレクションをさらに含む、項目61から67のいずれか一項に記載のキット。
【図面の簡単な説明】
【0027】
【
図1】
図1は、Cas9を用いてライブラリーにおける標的配列を選択的に切断する枯渇法の一般的な概略図を示す。
【0028】
【
図2】
図2は、触媒不活性であるCas9を用いてライブラリーを標的配列および非標的配列に分割する枯渇法の一般的な概略図を示す。
【0029】
【
図3】
図3は、シークエンシングライブラリーからミトコンドリアDNAを枯渇し、非ミトコンドリアDNAのみを配列決定のために残す例示的な戦略を示す。
【0030】
【
図4】
図4は、ミトコンドリアDNAが約44%枯渇された(qPCRによって測定)、枯渇実験の結果を示す。
【0031】
【
図5】
図5は、多数のガイドRNAが使用され、ミトコンドリアDNAが約70%枯渇された(qPCRによって測定)、第2の実験の結果を示す。
【0032】
【
図6A】
図6Aは、ミトコンドリアDNAの枯渇の前後でのライブラリーの配列決定の結果を示す。
【
図6B】
図6Bは、異なる数のgRNAを用いるミトコンドリアDNAの枯渇を示す。
【0033】
【
図7】
図7は、DNAのCas9ニッカーゼ媒介性枯渇を示す。
【0034】
【
図8】
図8は、Cas9媒介性枯渇、次いでエキソヌクレアーゼIII処理を示す。
【0035】
【
図9】
図9は、Cas9媒介性枯渇、次いでエキソヌクレアーゼBal-31処理を示す。
【0036】
【
図10】
図10は、Cas9媒介性枯渇の間のビオチン標識を示す。
【0037】
【
図11】
図11は、Cas9媒介性枯渇の効率を増加させるため熱安定性Cas9を用いることを示す。
【発明を実施するための形態】
【0038】
定義
本明細書で別段に定義されていない限り、本明細書で使用する全ての技術用語および科学用語は、本発明が属する技術分野の当業者が一般に理解するのと同じ意味を有する。本明細書に記載のものと同様のまたは等価な任意の方法および材料を、本発明を実践または試験するのに使用することができるが、好適な方法および材料が記載されている。
【0039】
本明細書に提供する表題は、本発明の様々な態様または実施形態の限定ではない。したがって、すぐ下に定義される用語は、全体として本明細書を参照することによってより完全に定義される。
【0040】
別段に定義されていない限り、本明細書で使用するすべての技術用語および科学用語は、本発明が属する技術分野の当業者が一般に理解するのと同じ意味を有する。Singleton
ら、DICTIONARY OF MICROBIOLOGY AND MOLECULAR BIOLOGY、第2版、John Wiley and Sons、New York(1994年)、ならびにHaleおよびMarkham、THE HARPER COLLINS DICTIONARY OF BIOLOGY、Harper Perennial、N.Y.(1991年)には、当業者
に本明細書で使用する用語の多くの一般的な意味が提供されている。それでもなお、ある特定の用語を参照の明確さおよび容易さの目的で以下に定義する。
【0041】
数値範囲は、範囲を規定する数値を含む。
【0042】
用語「試料」は、本明細書で使用する場合、典型的には、しかし必ずしもではなく、1種または複数の目的の分析物を含有する液体形態での材料または材料の混合物を指す。
【0043】
用語「核酸試料」は、本明細書で使用する場合、核酸を含有する試料を表す。本明細書で使用する核酸試料は、これらが配列を含有する複数の異なる分子を含有する点で複合体であり得る。哺乳動物(例えば、マウスまたはヒト)由来のゲノムDNAは、諸タイプの複合試料である。複合試料は、104、105、106、または107超の(more then)異なる核酸分子を有し得る。DNA標的は、任意の源、例えば、ゲノムDNA、cDNA、または人工DNAコンストラクトなどに由来し得る。核酸を含有する任意の試料、例えば、組織培養細胞または組織の試料から作製されるゲノムDNAを本明細書で用いることができる。
【0044】
用語「ヌクレオチド」は、既知のプリンおよびピリミジン塩基だけでなく、修飾された他の複素環式塩基も含有する部分を含むように意図されている。このような修飾としては、メチル化プリンまたはピリミジン、アシル化プリンまたはピリミジン、アルキル化リボースまたは他の複素環が挙げられる。さらに、用語「ヌクレオチド」は、ハプテンまたは蛍光標識を含有する部分を含み、慣例的なリボースおよびデオキシリボース糖だけでなく、他の糖も同様に含有し得る。修飾ヌクレオシドまたはヌクレオチドは、例えば、水酸基の1個または複数が、ハロゲン原子もしくは脂肪族基で置き換えられている、またはエーテル、アミンなどとして官能化されている、糖部分上の修飾も含む。
【0045】
用語「核酸」および「ポリヌクレオチド」は、本明細書で互換的に使用される。ポリヌクレオチドは、ヌクレオチド、例えば、デオキシリボヌクレオチドまたはリボヌクレオチドから構成される任意の長さ、例えば、約2塩基超、約10塩基超、約100塩基超、約500塩基超、1000塩基超、最大で約10,000またはそれ超の塩基の核酸ポリマーを記載するのに使用され、酵素的または合成的に生成することができ(例えば、米国特許第5,948,902号およびその中に引用されている参考文献に記載のPNA)、これらは、2つの天然に存在する核酸のものと類似の配列特異的様式で天然に存在する核酸とハイブリダイズすることができ、例えば、ワトソン-クリック塩基対合相互作用に関与することができる。天然に存在するヌクレオチドとしては、グアニン、シトシン、アデニン、およびチミン(それぞれG、C、A、およびT)が挙げられる。DNAおよびRNAは、それぞれデオキシリボースおよびリボース糖骨格を有し、一方、PNAの骨格は、ペプチド結合によって連結された繰り返しのN-(2-アミノエチル)-グリシン単位から構成されている。PNAでは、様々なプリンおよびピリミジン塩基がメチレンカルボニル結合によって骨格に連結されている。ロックされた核酸(LNA)は、アクセスできないRNAと呼ばれることが多く、修飾RNAヌクレオチドである。LNAヌクレオチドのリボース部分は、2’酸素および4’炭素を接続している追加の架橋で修飾されている。この架橋は、A型二重鎖中に見つかることが多い3’-endo(North)高次構造中のリボースを「ロックする」。LNAヌクレオチドは、望まれるときはいつでもオリゴヌクレオチド中のDNA残基またはRNA残基と混合することができる。用語「非構造化核酸」または「UNA」は、安定性が低減されて互いに結合する非天然ヌクレオチドを含有する核酸である。例えば、非構造化核酸は、G’残基およびC’残基を含有することができ、これらの残基は、非天然起源形態、すなわち、安定性が低減されて互いに塩基対合するGおよびCの類似体に対応するが、それぞれ、天然に存在するC残基およびG残基と塩基対合する能力を保持する。非構造化核酸は、US20050233340に記載されており、これは、UNAの開示に関して本明細書に参照により組み込まれている。
【0046】
用語「オリゴヌクレオチド」は、本明細書で使用する場合、ヌクレオチドの一本鎖多量体を表す。
【0047】
別段に示されていない限り、それぞれ、核酸は、5’から3’方向に左から右に書かれ、アミノ酸配列は、アミノからカルボキシ方向に左から右に書かれる。
【0048】
用語「切断すること(cleaving)」は、本明細書で使用する場合、二本鎖DNA分子の両方の鎖中の2つの隣接するヌクレオチド間のホスホジエステル結合を切断し(break)
、それによってDNA分子中で二本鎖切断をもたらす反応を指す。
【0049】
用語「切断部位」は、本明細書で使用する場合、二本鎖DNA分子が切断された部位を指す。
【0050】
用語「ハイブリダイゼーション」は、核酸の鎖が当技術分野で公知の塩基対合によって相補鎖と結合するプロセスを指す。核酸は、2つの配列が中程度から高ストリンジェンシーのハイブリダイゼーション条件および洗浄条件下で互いに特異的にハイブリダイズする場合、参照核酸配列に「選択的にハイブリダイズ可能」であると見なされる。中程度および高ストリンジェンシーハイブリダイゼーション条件は、公知である(例えば、Ausubel
ら、Short Protocols in Molecular Biology、第3版、Wiley & Sons、1995年、およびSambrookら、Molecular Cloning: A Laboratory Manual、第3版、2001年、Cold Spring Harbor、N.Y.を参照)。高ストリンジェンシー条件の一例は、50%ホルムアミド、5×SSC、5×デンハルト溶液、0.5%SDS、および100μg/ml変性キャリアDNA中の約42℃でのハイブリダイゼーション、その後の室温で2×SSCおよび0.5%SDS中の2回ならびに42℃で0.1×SSCおよび0.5%SDS中の追加の2回の洗浄を含む。
【0051】
用語「二重鎖」、または「二重鎖の」は、本明細書で使用する場合、塩基対合した、すなわち、互いにハイブリダイズした2つの相補的ポリヌクレオチドを表す。
【0052】
用語「増幅すること」は、本明細書で使用する場合、鋳型として標的核酸を使用して標的核酸の1つまたは複数のコピーを生成することを指す。
【0053】
用語「枯渇させること」は、ゲノムに関して、ゲノムの一部分をゲノムの残りか除去してゲノムの残りから単離された生成物を生成することを指す。用語「枯渇させること」は、別の種由来のDNAを保持しながら1つの種由来のDNAを除去することも包含する。
【0054】
用語「ゲノム領域」は、本明細書で使用する場合、ゲノム、例えば、ヒト、サル、ラット、魚、もしくは昆虫、または植物のゲノムなどの動物または植物ゲノムの領域を指す。ある特定の場合では、本明細書に記載の方法で使用するオリゴヌクレオチドは、参照ゲノム領域、すなわち、公知のヌクレオチド配列のゲノム領域、例えば、配列が、例えば、NCBIのGenbankデータベースまたは他のデータベースに寄託された染色体領域を使用して設計することができる。
【0055】
用語「ゲノム配列」は、本明細書で使用する場合、ゲノム中に存在する配列を指す。RNAは、ゲノムから転写されるので、この用語は、生物の核ゲノム中に存在する配列、およびかかるゲノムから転写されるRNA(例えば、mRNA)のcDNAコピー中に存在する配列を包含する。
【0056】
用語「ゲノム断片」は、本明細書で使用する場合、ゲノム、例えば、ヒト、サル、ラット、魚、もしくは昆虫、または植物のゲノムなどの動物または植物ゲノムの領域を指す。ゲノム断片は、染色体全体または染色体の断片であり得る。ゲノム断片は、アダプターライゲーションされていてもよく(この場合、それは、断片の一方もしくは両方の末端に、または分子の少なくとも5’末端にアダプターライゲーションされる)、アダプターライゲーションされていなくともよい。
【0057】
ある特定の場合では、本明細書に記載の方法で使用するオリゴヌクレオチドは、参照ゲノム領域、すなわち、公知のヌクレオチド配列のゲノム領域、例えば、配列が、例えば、NCBIのGenbankデータベースまたは他のデータベースに寄託された染色体領域を使用して設計することができる。このようなオリゴヌクレオチドは、試験ゲノムを含有する試料を使用するアッセイで用いることができ、この場合、試験ゲノムは、オリゴヌクレオチドの結合部位を含有する。
【0058】
用語「ライゲーションすること」は、本明細書で使用する場合、第1のDNA分子の5’末端の末端ヌクレオチドの、第2のDNA分子の3’末端の末端ヌクレオチドへの酵素的に触媒された結合を指す。
【0059】
2つの核酸が「相補的」である場合、核酸の一方のそれぞれの塩基は、他方の核酸中の対応するヌクレオチドと塩基対合する。用語「相補的」および「完全に相補的」は、本明細書で同義的に使用される。
【0060】
用語「分離すること」は、本明細書で使用する場合、2つのエレメントの物理的な分離(例えば、サイズまたは親和性などによる)および他方をインタクトなままにした一方のエレメントの分解を指す。
【0061】
細胞内で、DNAは通常、二本鎖形態で存在し、したがって、「トップ」および「ボトム」鎖と本明細書で呼ばれる核酸の2本の相補鎖を有する。ある特定の場合では、染色体領域の相補鎖は、「プラス」および「マイナス」鎖、「第1」および「第2」の鎖、「コード」および「非コード」鎖、「ワトソン」および「クリック」鎖、または「センス」および「アンチセンス」鎖と呼ばれる場合がある。トップまたはボトム鎖であるとして鎖を割り当てることは、自由裁量によるものであり、任意の特定の方向、機能、または構造を暗示しない。これらが共有結合によって連結された状態になるまで、第1および第2の鎖は、別個の分子である。記載の容易さのために、トップ鎖およびボトム鎖が共有結合によって連結された二本鎖核酸の「トップ」および「ボトム」鎖は、依然として「トップ」および「ボトム」鎖として記載される。言い換えれば、本開示の目的に関して、二本鎖DNAのトップ鎖およびボトム鎖は、別個の分子である必要はない。いくつかの例示的な哺乳動物染色体領域(例えば、BAC、アセンブリー、染色体など)の第1の鎖のヌクレオチド配列は、公知であり、例えば、NCBI’s Genbankデータベース中に見つけることができる。
【0062】
用語「トップ鎖」は、本明細書で使用する場合、核酸のいずれかの鎖を指すが、核酸の両方の鎖を指さない。オリゴヌクレオチドまたはプライマーが「トップ鎖のみに」結合またはアニールするとき、それは、一方の鎖のみに結合するが、他方の鎖に結合しない。用語「ボトム鎖」は、本明細書で使用する場合、「トップ鎖」に相補的である鎖を指す。オリゴヌクレオチドが「一方の鎖のみに」結合またはアニールするとき、それは、一方の鎖、例えば、第1または第2の鎖のみに結合するが、他方の鎖に結合しない。オリゴヌクレオチドが二本鎖DNAの両方の鎖に結合またはアニールする場合、オリゴヌクレオチドは、2つの領域、二本鎖DNAのトップ鎖とハイブリダイズする第1の領域、および二本鎖DNAのボトム鎖とハイブリダイズする第2の領域を有し得る。
【0063】
用語「二本鎖DNA分子」は、トップ鎖およびボトム鎖が共有結合によって連結されていない両方の二本鎖DNA分子、ならびにトップ鎖およびボトム鎖が共有結合によって連結された二本鎖DNA分子を指す。二本鎖DNAのトップ鎖およびボトム鎖は、ワトソン-クリック相互作用によって互いに塩基対合される。
【0064】
用語「変性させること」は、本明細書で使用する場合、適当な変性条件下に二重鎖を配置することによる核酸二重鎖の塩基対の少なくとも一部の分離を指す。変性条件は、当技術分野で周知である。一実施形態では、核酸二重鎖を変性させるために、二重鎖を二重鎖のTmよりも高い温度に曝露し、それによって二重鎖の一方の鎖を他方の鎖から放すことができる。ある特定の実施形態では、核酸は、適当な時間の長さ(amount of time)にわたって(例えば、少なくとも30秒、最大で30分)少なくとも90℃の温度にそれを曝露することによって変性させることができる。ある特定の実施形態では、完全変性条件を使用して二重鎖の塩基対を完全に分離することができる。他の実施形態では、部分変性条件(例えば、完全変性条件より低い温度を伴う)を使用して、二重鎖のある特定の部分の塩基対を分離することができる(例えば、A-T塩基対に富む領域を分離することができ、一方、G-C塩基対に富む領域を対合したままにすることができる)。核酸は、化学的に(例えば、尿素またはNaOHを使用して)変性させることもできる。
【0065】
用語「遺伝子型判定」は、本明細書で使用する場合、任意のタイプの核酸配列の解析を指し、配列決定、多型(SNP)解析、および再配列を同定するための解析を含む。
【0066】
用語「配列決定」は、本明細書で使用する場合、ポリヌクレオチドの連続したヌクレオチドの実体(identity)が得られる方法を指す。
【0067】
用語「次世代シークエンシング」は、いわゆる並列化された合成による配列決定(sequencing-by-synthesis)プラットフォームまたはライゲーションによる配列決定(sequencing-by-ligation)プラットフォーム、例えば、現在、Illumina、Life T
echnologies、およびRocheなどによって用いられているものを指す。次世代シークエンシング法として、ナノ細孔シークエンシング法、またはLife Technologiesが商品化したイオントレント技術などの電子検出ベース法も挙げることができる。
【0068】
用語「宿主核酸」は、試料が得られた多細胞真核生物被験体に由来する核酸を指す。宿主核酸は、例えば、植物、または哺乳動物、特にヒトを含めた動物であり得る。用語「宿主核酸」は、核の核酸、ならびに他の小器官、例えば、ミトコンドリアおよび葉緑体(宿主が植物である場合)中に存在する核酸を含むが、被験体上または被験体中で成長することが多い微生物由来の核酸を含まない。
【0069】
用語「非宿主核酸」は、試料が得られた宿主に属さない核酸を指す。非宿主核酸は、ウイルスDNA、細菌DNA、または他の微生物DNAであり得る。
【0070】
用語「微生物核酸」は、試料中に存在する、起源において微生物(例えば、細菌もしくはウイルス、または真核生物寄生虫由来)である核酸を指す。
【0071】
用語「宿主DNA」は、試料が得られた多細胞真核生物被験体に由来するDNAを指す。宿主DNAは、例えば、植物、または哺乳動物、特にヒトを含めた動物であり得る。用語「宿主DNA」は、核DNA、ならびに他の小器官、例えば、ミトコンドリアおよび葉緑体(宿主が植物である場合)中に存在するDNAを含むが、被験体上または被験体中で成長することが多い微生物由来のDNAを含まない。
【0072】
用語「非宿主DNA」は、試料が得られた宿主に属さないDNAを指す。非宿主DNAは、ウイルスDNA、細菌DNA、または他の微生物DNAであり得る。
【0073】
用語「微生物DNA」は、試料中に存在する、微生物(例えば、細菌もしくはウイルス、または真核生物寄生虫由来)を起源とするゲノムDNAを指す。
【0074】
用語「相補的DNA」またはcDNAは、RNAの逆転写(ランダム六量体またはオリゴ-dTプライマーなどのプライマーを使用する)、その後のRNaseHを用いたRNAの消化およびDNAポリメラーゼによる合成による第2の鎖の合成によってRNA試料から生成された二本鎖DNA試料を指す。
【0075】
用語「RNAプロモーターアダプター」は、バクテリオファージRNAポリメラーゼ、例えば、バクテリオファージT3、T7、SP6など由来のRNAポリメラーゼのプロモーターを含有するアダプターである。
【0076】
用語「メタゲノミクス試料」は、1つを超える種の生物(真核生物、原核生物、またはウイルス生物)を含有する試料を指す。
【0077】
用語「メタゲノミクス解析」は、メタゲノミクス試料の解析を指す。
【0078】
用語の他の定義は、明細書全体にわたって出現し得る。
【0079】
本発明の目的
上記に示した従来の方法および装置に関連した問題を考慮して、本発明の目的は、酵素媒介カッティング機構を使用して核酸試料から選択された核酸を枯渇させることである。
【0080】
本発明の別の目的は、それだけに限らないが、増幅、配列決定、クローニングなどを含めた下流用途を追究する目的で非宿主核酸断片の割合を増大させるための、宿主核酸および非宿主核酸を含むシークエンシングライブラリーから、選択された宿主細胞を枯渇させる方法を提供することである。
【0081】
本発明の別の目的は、メタゲノミクス試料から特定の種のゲノムの一部またはすべてを選択的に枯渇させることによる、特定の種のゲノムにわたる断片に対して公平なメタゲノム解析法を提供することである。
【0082】
本発明のさらなる目的は、配列決定の量を増大させることなく、一部の事例ではそれを減少させながら、種のメタゲノムにマッピングする試料リードの数を増加させることによってメタゲノム解析のより良好な分解能を獲得することである。
【0083】
本発明のさらなる目的は、ミトコンドリアDNAおよび非ミトコンドリアDNAを含む試料からミトコンドリアDNAを枯渇させる方法および組成物を提供することである。
【0084】
核酸、試料
本発明の核酸(富化、分割、または枯渇のために標的にされる)は、一本鎖DNA、一本鎖RNA、二本鎖DNA、二本鎖RNA、人工DNA、人工RNA、合成DNA、合成RNA、およびRNA/DNAハイブリッドであり得る。
【0085】
本発明の核酸は、ゲノムの領域を含むゲノム断片、または全ゲノム自体であり得る。一実施形態では、ゲノムは、DNAゲノムである。別の実施形態では、ゲノムは、RNAゲノムである。
【0086】
本発明の核酸は、真核生物もしくは原核生物から;哺乳動物生物もしくは非哺乳動物生物から;動物もしくは植物から;細菌もしくはウイルスから;動物寄生虫から;または病原体から得ることができる。
【0087】
本発明の核酸は、任意の哺乳動物生物から得ることができる。一実施形態では、哺乳動物は、ヒトである。別の実施形態では、哺乳動物は、家畜動物、例えば、ウマ、ヒツジ、ウシ、ブタ、またはロバである。別の実施形態では、哺乳動物生物は、家庭用愛玩動物、例えば、ネコ、イヌ、アレチネズミ、マウス、ラットである。別の実施形態では、哺乳動物は、サルの一種である。
【0088】
本発明の核酸は、任意のトリまたは鳥類生物から得ることができる。鳥類生物としては、ニワトリ、シチメンチョウ、アヒル、およびガチョウが挙げられるが、これらに限定されない。
【0089】
本発明の核酸は、植物から得ることができる。一実施形態では、植物は、イネ、トウモロコシ、コムギ、バラ、ブドウ、コーヒー、果実、トマト、ジャガイモ、または綿である。
【0090】
一部の実施形態では、本発明の核酸は、細菌の種から得られる。一実施形態では、細菌は、結核を引き起こす細菌である。
【0091】
一部の実施形態では、本発明の核酸は、ウイルスから得られる。
【0092】
一部の実施形態では、本発明の核酸は、真菌の種から得られる。
【0093】
一部の実施形態では、本発明の核酸は、藻類の種から得られる。
【0094】
一部の実施形態では、本発明の核酸は、任意の哺乳動物寄生虫から得られる。
【0095】
一部の実施形態では、本発明の核酸は、任意の哺乳動物寄生虫から得られる。一実施形態では、寄生虫は、蠕虫である。別の実施形態では、寄生虫は、マラリアを引き起こす寄生虫である。別の実施形態では、寄生虫は、リーシュマニア症を引き起こす寄生虫である。別の実施形態では、寄生虫は、アメーバである。
【0096】
一実施形態では、本発明の核酸は、同じ試料中でgRNA(gRNAエレメントとも本明細書で互換的に呼ばれる)の標的である核酸およびgRNAの標的でない核酸を含む。
【0097】
一実施形態では、試料中の核酸は、標的核酸/標的化配列(gRNAの標的)および目的の核酸/目的の配列(gRNAによって標的にされない)を含む。
【0098】
一実施形態では、核酸はすべて、同じ生物に属するが、サブセットが枯渇または分割のために標的にされる。例えば、有益な価値をほとんど有さない核酸を標的にすることができる。
【0099】
有益な価値をほとんど有さない核酸の例としては、それだけに限らないが、ミトコンドリアDNA、ミトコンドリアRNA、ミトコンドリアrRNA、反復配列、マルチコピー配列、グロビンタンパク質をコードする配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメアリピートを含む配列、動原体配列を含む配列、イントロン配列を含む配列、Aluリピート、SINEリピート、LINEリピート、二核酸リピート、三核酸リピート、四核酸リピート、ポリ-Aリピート、ポリ-Tリピート、ポリ-Cリピート、ポリ-Gリピート、ATリッチ配列、またはGCリッチ配列を含む配列が挙げられる。
【0100】
一実施形態では、試料をCRISPR/Cas系タンパク質-gRNA複合体と接触させ、gRNAは、枯渇のための標的配列、グロビンタンパク質をコードする標的配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメアリピートを含む配列、動原体配列を含む配列、イントロン配列を含む配列、Aluリピートを含む配列、SINEリピートを含む配列、LINEリピートを含む配列、二核酸リピートを含む配列、三核酸リピートを含む配列、四核酸リピートを含む配列、ポリ-Aリピートを含む配列、ポリ-Tリピートを含む配列、ポリ-Cリピートを含む配列、ポリ-Gリピートを含む配列、ATリッチ配列を含む配列、またはGCリッチ配列を含む配列に相補的である。
【0101】
例示的な一実施形態では、リボソームRNAを枯渇または分割のために標的にすることができる。別の例示的な実施形態では、反復DNAを枯渇または分割のために標的にすることができる。このような実施形態では、本方法は、有益な価値をほとんど有さないリボソームDNAもしくは反復DNAまたは他の任意のDNAを枯渇させ、DNA抽出物のこれらのエレメントを配列決定するコストを低減し、データ収量を改善するのに使用可能である。
【0102】
一実施形態では、標的DNAは、非ミトコンドリアDNA(例えば、ゲノムDNA)であり得、目的のDNAは、ミトコンドリアDNAであり得、ミトコンドリアDNAは、非ミトコンドリアヒトDNAを標的にし、かつ枯渇させることによって富化される。
【0103】
一実施形態では、枯渇のための標的DNAは、ミトコンドリアDNAであり得、目的のDNAは、非ミトコンドリアDNAであり得、非ミトコンドリアDNAは、ミトコンドリアヒトDNAを標的にし、かつ枯渇させることによって富化される。例示的な実施形態では、ATAC-Seq手順(例えば、WO2014/189957を参照)が実行され、不要な残留するミトコンドリアDNAがもたらされ、本発明の方法を試料から不要なミトコンドリアDNAを枯渇させるのに使用することができる。
【0104】
一実施形態では、枯渇または分割される核酸は、ゲノムの非マッピング可能領域であり得、さらなる解析/配列決定/クローニングのために保持される核酸は、ゲノムのマッピング可能領域であり得る。一実施形態では、枯渇または分割される核酸は、ゲノムのマッピング可能領域であり得、さらなる解析/配列決定/クローニングのために保持される核酸は、ゲノムの非マッピング可能領域であり得る。非マッピング可能領域の例としては、テロメア、動原体、反復領域、またはマッピングすることがより困難な特徴を含有する他のゲノム領域が挙げられる。
【0105】
一部の実施形態では、本発明の方法は、宿主核酸および非宿主核酸を含む試料に対して実行される。一実施形態では、宿主核酸は、哺乳動物核酸であり、非宿主核酸は、非哺乳動物(例えば、細菌、ウイルス、真菌、原生動物)核酸である。一実施形態では、宿主核酸は、ヒト核酸であり、非宿主核酸は、細菌核酸である。一実施形態では、宿主核酸は、ヒト核酸であり、非宿主核酸は、ウイルス核酸である。一実施形態では、宿主核酸は、ヒト核酸であり、非宿主核酸は、真菌核酸である。一実施形態では、宿主核酸は、ヒト核酸であり、非宿主核酸は、原生動物核酸である。一実施形態では、宿主核酸は、家畜の一種由来である。一実施形態では、宿主核酸は、サル由来である。特定の一実施形態では、宿主核酸は、ヒト核酸であり、非宿主核酸は、未同定病原体、例えば、公知もしくは未知のウイルス、または公知もしくは未知の細菌、または公知もしくは未知の動物寄生虫由来である。特定の一実施形態では、宿主核酸は、ウシ由来であり、非宿主核酸は、ウイルス核酸、細菌核酸、真菌核酸、または原生動物核酸である。
【0106】
宿主核酸および非宿主核酸の両方を含有する試料では、宿主核酸および非宿主核酸は、例えば、宿主-病原体関係または共生関係を有する場合がある。一部の実施形態では、宿主から得られる全核酸試料の非宿主画分は、宿主に関連するマイクロバイオームに由来し得る。
【0107】
一実施形態では、宿主生物(例えば、ヒト宿主)から得られる試料は、1種を超える非宿主生物、例えば、同定される少なくとも1種の未知の非宿主生物を含む複数の非宿主生物由来の核酸を含有する。本発明の組成物および方法を利用して、試料中の核酸を連続的に処理して、宿主DNAを最初に枯渇/分割し、次いで目的のものでない他の既知の非宿主核酸を引き続いて枯渇/分割することによって、目的の特定の非宿主核酸を代表する核酸の残りのプールに達することができる。例えば、このような実施形態は、宿主が、例えば、共生の方法で(symbiotically)存在している1種を超える既知の細菌を宿している
と予期される状況において適用可能であるはずである。例えば、このような実施形態は、数種の細菌、例えば、Streptococcusの種を宿すことが分かっている、個体由来の唾液試料中の未知の病原体を検出するのに適用可能である。別の例では、試料は、既知および未知の非宿主核酸を含む哺乳動物宿主由来の糞試料であり得る。
【0108】
一実施形態では、既知の宿主生物(例えば、ヒト宿主)から得られる試料は、非宿主核酸を含有するが、非宿主は、宿主核酸が枯渇または分割され、その結果非宿主核酸が富化され、さらに下流解析に付されるまで未知である(例えば、ヒト血液中の未知の病原性細菌、ウイルス、または他の病原体)。
【0109】
例示的な実施形態では、DNAが宿主DNAおよび非宿主DNAを含む場合、本方法は、さらなる解析のための非宿主DNAのライブラリーを構築するために宿主DNAの実質的にすべてを枯渇させるのに使用可能である。DNAが核DNAおよびミトコンドリアDNAを含む場合では、本方法は、さらなる解析のための核DNAのライブラリーを構築するためにミトコンドリアDNAを枯渇させるのに、またはさらなる解析のためのミトコンドリアDNAのライブラリーを構築するために核DNAを枯渇させるのに使用可能である。DNAが、有益な価値をほとんど有し得ないリボソームRNAまたは反復DNAの豊富な配列を含む場合では、本方法は、有益な価値をほとんど有さないリボソームDNAもしくは反復DNAまたは他の任意のDNAを枯渇させ、DNA抽出物のこれらのエレメントを配列決定するコストを低減し、データ収量を改善するのに使用可能である。それぞれの用途において、得られるDNAは、有意により少ない配列決定するためのDNA断片を有し、それによって配列決定コストおよび複雑性を低減する。さらに、本発明の方法によれば、枯渇された試料は、実効的に枯渇されなかった生体試料中に存在するDNA材料のすべてを依然として提供し、それは、より少ない多様なDNA試料を配列決定することによって、配列決定コストを低減し、かつデータ収量を改善する利点をもたらす。
【0110】
一実施形態では、本発明の核酸は、生体試料から得られる。核酸が得られる生体試料としては、それだけに限らないが、全血、血漿、血清、涙、唾液、粘液、脳脊髄液、歯、骨、指の爪、糞便、尿、組織、生検などが挙げられる。生体試料は、法医学試料、例えば、歯、骨、指の爪などを含み得る。生体試料は、組織、組織生検、例えば、切除された肺組織を含み得る。生体試料は、臨床試料を含み得、臨床試料は、臨床現場において、例えば、病院または診療所において得られる試料を指す。
【0111】
一実施形態では、本発明の核酸は、環境試料、例えば、水、土壌、空気、または岩から得られる。
【0112】
一実施形態では、本発明の核酸は、法医学試料、例えば、進行中の調査などの一部として、犯罪現場における個体から、証拠の一片、検死から得られる試料から得られる。
【0113】
一実施形態では、本発明の核酸は、ライブラリーで提供される。
【0114】
本発明の核酸は、試料から提供または抽出される。抽出により、検体から実質的にすべての核酸配列を抽出することができる。これは、例えば、検体中に存在する宿主の核酸配列および任意の非ヒト生物または非宿主生物の核酸配列であり得る。
【0115】
抽出により、99.999:0.001~0.001:99.999の間のいずれかの比で宿主核酸および非宿主核酸が生じ得る。抽出により、99.999:0.001~0.001:99.999の間のいずれかの比で標的化核酸および目的の核酸が生じ得る。抽出により、99.999:0.001~0.001:99.999の間のいずれかの比で枯渇される核酸と保持/解析/配列決定される核酸が生じ得る。抽出により、99.999:0.001~0.001:99.999の間のいずれかの比で分割される核酸と保持/解析/配列決定される核酸が生じ得る。生体試料からの抽出により、99.999:0.001~0.001:99.999の間のいずれかの比で枯渇される宿主核酸と保持/解析/配列決定される1種を超える非宿主由来の核酸が生じ得る。これらの実施形態では、比は、99.999:0.001~0.001:99.999の間のいずれかに等しい、またはそれに入ることができ、例えば、比は、99:1、95:5、90:10、85:15、80:20、75:25、70:30、65:35、60:40、55:45、50:50、45:55、40:60、35:65、30:70、25:75、20:80、15:85、10:90、5:95、および1:99であり得る。
【0116】
抽出後、抽出された核配列を断片化して、それぞれの抽出された核酸の長さを増幅、配列決定などのためにより管理できる長さに低減することができる。
【0117】
本明細書に提供するように、出発核酸材料の少なくとも10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%の枯渇を、枯渇または分割することができる。この枯渇または分割は、10分、15分、20分、30分、45分、60分、75分、90分、105分、120分、150分、3時間、4時間、5時間、6時間、7時間、8時間、9時間、10時間、11時間、または12時間以下で達成することができる。
【0118】
一実施形態では、本発明の核酸は、アダプターライゲーションされる。アダプターライゲーションされる本発明の核酸は、10bp~1000bpの範囲であり得る。例えば、アダプターライゲーションされる核酸は、少なくとも10、15、20、25、50、75、100、125、150、175、200、25、300、350、400、450、500、550、600、650、700、750、800、850、900、950、または1000bpであり得る。特定の一実施形態では、アダプターライゲーションされる核酸は、100bpである。特定の一実施形態では、アダプターライゲーションされる核酸は、200bpである。特定の一実施形態では、アダプターライゲーションされる核酸は、300bpである。特定の一実施形態では、アダプターライゲーションされる核酸は、400bpである。特定の一実施形態では、アダプターライゲーションされる核酸は、500bpである。
【0119】
一部の実施形態では、試料は、核酸断片のライブラリーを含み、核酸断片は、これらの5’および3’末端でアダプターライゲーションされている。このような実施形態では、アダプターは、5’および3’末端で、核酸断片のそれぞれの各末端にライゲーションされている。他の実施形態では、アダプターは、断片のそれぞれの一端のみにライゲーションされ得る。一部の実施形態では、アダプターは、5’終端および/または3’終端との間に介在配列をさらに含む。例えば、アダプターは、バーコード配列をさらに含み得る。
【0120】
一部の実施形態では、アダプターは、二本鎖DNA分子の両方の鎖にライゲーション可能である核酸である。
【0121】
一部の実施形態では、アダプターは、枯渇/富化の前にライゲーションされる。他の実施形態では、アダプターは、後のステップでライゲーションされる。
【0122】
一部の実施形態では、アダプターは、線状である。一部の実施形態では、アダプターは、線状Y形である。一部の実施形態では、アダプターは、線状円形である。一部の実施形態では、アダプターは、ヘアピンアダプターである。
【0123】
様々な実施形態では、アダプターは、ヘアピンアダプター、すなわち、それ自体と塩基対合して二本鎖ステムおよびループを有する構造を形成する一分子であり得、分子の3’および5’末端は、それぞれ断片の二本鎖DNA分子の5’および3’末端にライゲーションする。
【0124】
あるいは、アダプターは、ユニバーサルアダプターとも呼ばれる、断片の一端または両端にライゲーションされたYアダプターであり得る。あるいは、アダプターは、互いに塩基対合される2つの別個のオリゴヌクレオチド分子からそれ自体構成され得る。その上、アダプターのライゲーション可能末端は、制限酵素による切断によって作製されるオーバーハングに適合するように設計することができ、またはそれは、平滑末端もしくは5’Tオーバーハングを有し得る。
【0125】
アダプターは、二本鎖および一本鎖分子を含み得る。よって、アダプターは、DNAもしくはRNA、または2つの混合物であり得る。RNAを含有するアダプターは、RNase処理またはアルカリ加水分解によって切断可能であり得る。
【0126】
アダプターは、長さが10~100bpであり得るが、この範囲の外側のアダプターも、本発明から逸脱することなく使用可能である。具体的な実施形態では、アダプターは、長さが少なくとも10bp、少なくとも15bp、少なくとも20bp、少なくとも25bp、少なくとも30bp、少なくとも35bp、少なくとも40bp、少なくとも45bp、少なくとも50bp、少なくとも55bp、少なくとも60bp、少なくとも65bp、少なくとも70bp、少なくとも75bp、少なくとも80bp、少なくとも85bp、少なくとも90bp、または少なくとも95bpである。
【0127】
ある特定の場合では、アダプターは、宿主ゲノムの特定の領域、例えば、配列がNCBI’s Genbankデータベースまたは他のデータベースに寄託されている染色体領域のヌクレオチド配列にマッチするように設計されたオリゴヌクレオチドを含み得る。このようなオリゴヌクレオチドは、試験ゲノムを含有する試料を使用するアッセイで用いることができ、この場合、試験ゲノムは、オリゴヌクレオチドの結合部位を含有する。さらなる例では、断片化された核酸配列は、1つまたは複数のDNAシークエンシングライブラリーに由来し得る。アダプターは、次世代シークエンシングプラットフォームのため、例えば、Illuminaシークエンシングプラットフォームで使用するため、またはIonTorrentsプラットフォームで使用するため、またはナノ細孔技術で使用するために配置することができる。
【0128】
ガイドRNA
核酸中の、例えば、宿主由来のゲノムDNA中の標的化部位または標的化配列に相補的である(それに選択的である、それとハイブリダイズすることができる)ガイドRNA(gRNA)が本明細書に提供されている。一実施形態では、本発明は、枯渇または分割のために標的にされる核酸配列とハイブリダイズするように配置されたgRNAのコレクションを含むガイドRNAライブラリーを提供する。
【0129】
一実施形態では、gRNAは、試料中の標的核酸(または標的化配列)に選択的であるが、試料中の目的の配列に選択的でない。
【0130】
一実施形態では、gRNAは、宿主由来の生体試料中の宿主核酸に選択的であるが、宿主由来の試料中の非宿主核酸に選択的でない。一実施形態では、gRNAは、宿主由来の生体試料由来の非宿主核酸に選択的であるが、試料中の宿主核酸に選択的でない。一実施形態では、gRNAは、宿主由来の生体試料中の宿主核酸、および非宿主核酸のサブセットの両方に選択である。例えば、複合生体試料が宿主核酸および1種を超える非宿主生物由来の核酸を含む場合、gRNAは、1種を超える非宿主種に選択的であり得る。このような実施形態では、gRNAは、目的のものでない配列を連続的に枯渇または分割するのに使用される。例えば、ヒト由来の唾液は、ヒトDNAおよび1種を超える細菌種のDNAを含有するが、未知の病原生物のゲノム材料も含有し得る。このような実施形態では、ヒトDNAおよび既知の細菌に向けられたgRNAを使用してヒトDNAおよび既知の細菌のDNAを連続的に枯渇し、こうして未知の病原生物のゲノム材料を含む試料をもたらすことができる。
【0131】
例示的な実施形態では、gRNAは、宿主由来の生体試料から得られるヒト宿主DNAに選択的であるが、やはり試料中の未知の生物(例えば、病原体(複数可))由来のDNAとハイブリダイズしない。
【0132】
一部の実施形態では、gRNAは、Cas9によって結合され得るプロトスペーサー隣接モチーフ(PAM)配列が後に続く標的核酸配列に選択的である。一部の実施形態では、gRNAの配列は、CRISPR/Cas系タンパク質タイプによって決定される。例えば、様々な実施形態では、gRNAは、異なるCas9タイプに適合させることができ、その理由は、PAM配列は、Cas9が由来する細菌の種によって変動し得るためである。
【0133】
gRNAは、例えば、50~250塩基対のサイズの範囲であり得る。例えば、gRNAは、少なくとも50bp、55bp、60bp、65bp、70bp、75bp、80bp、85bp、90bp、95bp、100bp、110bp、120bp、125bp、130bp、140bp、150bp、160bp、170bp、175bp、180bp、190bp、または195bpであり得る。具体的な実施形態では、gRNAは、80bp、90bp、100bp、または110bpである。それぞれの標的特異的gRNAは、標的核酸中の所定の部位に相補的な塩基対配列を含む。その所定の部位の後には細菌種に由来するCRISPR/Cas系タンパク質、例えば、Cas9タンパク質によって結合され得るプロトスペーサー隣接モチーフまたは(PAM)配列が続く。具体的な実施形態では、標的核酸中の所定の部位に相補的であるgRNAの塩基対配列は、15、16、17、18、19、20、25、30、35、40、45、または50塩基対である。
【0134】
本発明は、gRNAライブラリーも提供する。gRNAライブラリーは、それぞれ枯渇または分割のために標的にされている核酸配列とハイブリダイズする(それに選択的である)ように配置された、いくつかの異なる種特異的gRNAを含み得る。各gRNAは、標的特異的ガイド配列およびステムループ結合部位を含み、ステムループ結合部位は、特定のCRISPR/Cas系タンパク質、例えば、Cas9タンパク質と結合するように形成されている。ライブラリーは、それぞれ、標的にされている核酸中の異なる所定の部位に相補的である異なる15~20塩基対配列を有する複数の異なるガイドRNAを含み得る。この所定の部位の後にはCRISPR/Cas系タンパク質によって結合され得る適切なPAM配列が続く。それぞれのガイドRNAに関して、PAM配列は、目的の核酸の所定のDNA標的配列中に存在するが、対応する標的特異的ガイド配列中に存在しない。
【0135】
一般に本発明によれば、適切なPAM配列が後に続く所定の標的配列を含む目的のゲノム中の任意の核酸配列は、ガイドRNAライブラリーに提供されている対応するガイドRNAによってハイブリダイズされ得、CRISPR/Cas系タンパク質、例えば、Cas9によって結合され得る。様々な実施形態では、gRNAライブラリーは、異なるCRISPR/Cas系タンパク質、例えば、異なるCas9タイプに適合させることができ、その理由は、PAM配列は、タンパク質が由来する細菌の種によって変動し得るためである。
【0136】
gRNA中の異なる標的特異的配列を生成することができる。これは、バクテリオファージRNAポリメラーゼ、例えば、バクテリオファージT3、T7、SP6など由来のRNAポリメラーゼのプロモーターを使用することによって行うことができる。したがって、それぞれの異なるT7 RNAポリメラーゼプロモーターは、異なる標的核酸配列にハイブリダイズするのに適した異なる標的特異的配列をもたらす。アニーリングおよび後続のPCR反応の両方に使用可能な順方向プライマーの限定されない例示的なセットを、以下に提供する実施例1の表1および2に列挙する。
【0137】
理論に制限されることなく、標的核酸の95%超の切断に達するgRNA間の距離は、gRNAが約100%の有効性を示す場合、算出することができる。これは、ライブラリーサイズの分布を測定し、平均、N、および標準偏差SD;N-2SD=ライブラリーの95%超についての最低サイズ、を決定し、95%超の枯渇を確実なものにするためにこのサイズの断片1つ当たり1つのガイドRNAが存在することを保証することによって算出することができる。これは、ガイドRNA間の最大距離=ライブラリーサイズの平均-2×(ライブラリーサイズの標準偏差)として記載することもできる。
【0138】
本明細書に提供する実施形態では、gRNAライブラリーを、それぞれの異なるgRNAの多数のコピーおよび所望の枯渇結果に適し得る場合の多数の異なるgRNAを含むように増幅することができる。所与のガイドRNAライブラリー中のユニークgRNAの数は、1つのユニークgRNAから1010もの多くのユニークgRNAまたはヒトゲノム中の2塩基対毎におよそ1つのユニークガイドRNA配列の範囲であり得る。一部の実施形態では、ライブラリーは、少なくとも102のユニークgRNAを含む。一部の実施形態では、ライブラリーは、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010のユニークgRNAを含む。例示的な一実施形態では、ライブラリーは、約103のユニークgRNAを含む。
【0139】
本明細書に提供する実施形態では、本方法は、核酸を含む試料を複数のCRISPR/Cas9系タンパク質-gRNA複合体と接触させるステップを含み、gRNAは、標的配列に相補的であり、このような配列は、枯渇のために標的にされる。一部の実施形態では、本方法は、標的化部位と塩基対合することができるgRNAを使用するステップを含み、試料を少なくとも102のユニークgRNAと接触させる。一部の実施形態では、試料を少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010のユニークgRNAと接触させる。例示的な一実施形態では、試料を約103のユニークgRNAと接触させる。
【0140】
本明細書に提供する実施形態では、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含み、複合体のユニークな特質は、gRNA自体のユニークな特質によって決定される。例えば、2つのユニークなCRISPR/Cas系タンパク質-gRNA複合体は、同じCRISPR/Cas系タンパク質を共有し得るが、gRNAは、わずか1ヌクレオチドによってであっても異なる。よって、一部の実施形態では、本方法は、試料を少なくとも102のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップを含む。一部の実施形態では、試料を、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させる。例示的な一実施形態では、試料を約103のユニークなCRISPR/Cas系タンパク質-gRNA複合体と接触させる。
【0141】
本明細書に提供する実施形態では、本方法は、ゲノムDNAを含む試料を複数のCRISPR/Cas9系タンパク質-gRNA複合体と接触させるステップを含み、gRNAは、枯渇のためのゲノム中の標的にされた部位に相補的である。一部の実施形態では、本方法は、標的化DNAと塩基対合することができるgRNAを使用するステップを含み、目的の標的部位は、目的のゲノムにわたって少なくとも1bp毎、少なくとも2bp毎、少なくとも3bp毎、少なくとも4bp毎、少なくとも5bp毎、少なくとも6bp毎、少なくとも7bp毎、少なくとも8bp毎、少なくとも9bp毎、少なくとも10bp毎、少なくとも11bp毎、少なくとも12bp毎、少なくとも13bp毎、少なくとも14bp毎、少なくとも15bp毎、少なくとも16bp毎、少なくとも17bp毎、少なくとも18bp毎、少なくとも19bp毎、20bp、少なくとも25bp毎、少なくとも30bp毎、少なくとも40bp毎、少なくとも50bp毎、少なくとも100bp毎、少なくとも200bp毎、少なくとも300bp毎、少なくとも400bp毎、少なくとも500bp毎、少なくとも600bp毎、少なくとも700bp毎、少なくとも800bp毎、少なくとも900bp毎、少なくとも1000bp毎、少なくとも2500bp毎、少なくとも5000bp毎、少なくとも10,000bp毎、少なくとも15,000bp毎、少なくとも20,000bp毎、少なくとも25,000bp毎、少なくとも50,000bp毎、少なくとも100,000bp毎、少なくとも250,000bp毎、少なくとも500,000bp毎、少なくとも750,000bp毎、またはさらには少なくとも1,000,000bp毎に間隔をあけられている。
【0142】
本明細書に提供する実施形態では、本方法は、枯渇のために標的にされる核酸を含む試料を複数のCRISPR/Cas9系タンパク質-gRNA複合体と接触させるステップを含み、gRNAは、枯渇のために標的にされる核酸に相補的である。一部の実施形態では、gRNA:枯渇のために標的にされる核酸のモル比は、1:1、5:1、10:1、50:1、100:1、150:1、250:1、500:1、750:1、1000:1、1500:1、2000:1、2500:1、5000:1、7500:1、またはさらには10,000:1である。例示的な実施形態では、gRNA:枯渇のために標的にされる核酸のモル比は、500:1である。
【0143】
本明細書に提供する実施形態では、本方法は、枯渇のために標的にされる核酸を含む試料を複数のCRISPR/Cas9系タンパク質-gRNA複合体と接触させるステップを含み、gRNAは、枯渇のために標的にされる核酸に相補的である。一部の実施形態では、gRNA:枯渇のために標的にされる核酸の重量対重量比は、1:1、5:1、10:1、20:1、30:1、40:1、50:1、60:1、70:1、80:1、90:1、100:1、150:1、250:1、500:1、750:1、1000:1、1500:1、2000:1、2500:1、5000:1、7500:1、またはさらには10,000:1である。例示的な実施形態では、gRNA:枯渇のために標的にされる核酸の重量対重量比は、50:1から100:1の間の範囲である。
【0144】
以下の記載は、例示的な実施形態として
図1を参照する。
図1では、ガイドRNAライブラリー(1050)は、それぞれが、DNA抽出断片(1025)または任意の他のDNA断片であって、これらが目的のものでないために枯渇され得る、任意の他のDNA断片のコレクションから枯渇のために標的にされるヒトDNAまたは核酸配列とハイブリダイズするようにそれぞれ配置されている多数の異なるヒト特異的gRNA(1055)を含む。本実施形態では、枯渇のために標的にされる核酸配列は、さらに解析されるための目的のものである非ヒト遺伝子断片(1030)中に存在する配列でない。各ガイドRNA(1055)は、標的特異的ガイド配列(1060)およびCas9タンパク質と結合するように形成されているステムループ結合部位(1065)を含む。それぞれの標的特異的ガイド配列(1060)はヒトゲノム中の所定の部位に相補的な15~20塩基対配列であり、該所定の部位の後には細菌種に由来するCas9タンパク質によって結合され得るプロトスペーサー隣接モチーフまたは(PAM)配列が続く。約8~100塩基対に及ぶ他の塩基対長も、本発明から逸脱することなく使用可能である。
【0145】
図1において、異なる標的特異的配列(1060)は、バクテリオファージRNAポリメラーゼ、例えば、バクテリオファージT3、T7、SP6など由来のRNAポリメラーゼのプロモーターを含有する異なるT7 RNAポリメラーゼプロモーター配列(1070)によって生成される。したがって、それぞれの異なるT7 RNAポリメラーゼプロモーター(1070)は、異なるヒトDNA配列にハイブリダイズするのに適した異なる標的特異的配列(1060)をもたらす。
【0146】
図1において、ガイドRNAライブラリー(1050)は、それぞれの異なるgRNA(1055)の多数のコピーおよび所望の枯渇結果に適し得る場合の多数の異なるgRNA、例えば、(1055a)(1055b)(1055n)を含むように増幅される。
【0147】
CRISPR/Cas系タンパク質
試料中の、不要な核酸の枯渇および/または目的の配列の富化のための組成物および方法が本明細書に提供されている。これらの組成物および方法は、CRISPR/Cas系タンパク質を利用する。
【0148】
一部の実施形態では、CRISPR/Cas系タンパク質としては、CRISPR I型系、CRISPR II型系、およびCRISPR III型系由来のタンパク質が挙げられる。
【0149】
一部の実施形態では、CRISPR/Cas系タンパク質は、任意の細菌種または古細菌種由来であり得る。
【0150】
一部の実施形態では、CRIPR/Cas系タンパク質は、Streptococcus pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophiles、Treponema denticola、Francisella tularensis、Pasteurella multocida、Campylobacter jejuni、Campylobacter lari、Mycoplasma gallisepticum、Nitratifractor salsuginis、Parvibaculum lavamentivorans、Roseburia intestinalis、Neisseria cinerea、Gluconacetobacter diazotrophicus、Azospirillum、Sphaerochaeta globus、Flavobacterium columnare、Fluviicola taffensis、Bacteroides coprophilus、Mycoplasma mobile、Lactobacillus farciminis、Streptococcus pasteurianus、Lactobacillus johnsonii、Staphylococcus pseudintermedius、Filifactor alocis、Legionella
pneumophila、Suterella wadsworthensis、またはCorynebacter diphtheria由来であり、またはそれ由来のCRISPR/Cas系タンパク質に由来する。
【0151】
一部の実施形態では、CRISPR/Cas系タンパク質の例は、天然に存在するまたは操作されたバージョンであり得る。
【0152】
一部の実施形態では、天然に存在するCRISPR/Cas系タンパク質としては、Cas9、Cpf1、Cas3、Cas8a-c、Cas10、Cse1、Csy1、Csn2、Cas4、Csm2、およびCm5が挙げられる。例示的な実施形態では、CRISPR/Cas系タンパク質は、Cas9を含む。
【0153】
「CRISPR/Cas系タンパク質-gRNA複合体」は、CRISPR/Cas系タンパク質およびガイドRNAを含む複合体を指す。ガイドRNAは、2種の分子、すなわち、標的にハイブリダイズし、配列特異性をもたらす1つのRNA(「crRNA」)、およびcrRNAにハイブリダイズすることができる1つのRNA、「tracrRNA」から構成され得る。代わりに、ガイドRNAは、crRNA配列およびtracrRNA配列を含有する単一分子(すなわち、gRNA)であり得る。CRISPR/Cas系タンパク質は、野生型CRISPR/Cas系タンパク質と少なくとも60%同一(例えば、少なくとも70%、少なくとも80%、または90%同一、少なくとも95%同一、または少なくとも98%同一、または少なくとも99%同一)であり得る。CRISPR/Cas系タンパク質は、結合活性、ヌクレアーゼ活性、およびヌクレアーゼ活性を含めた野生型CRISPR/Cas系タンパク質の機能のすべて、または機能の1つのみもしくは一部を有し得る。
【0154】
用語「CRISPR/Cas系タンパク質関連ガイドRNA」は、上述したガイドRNA(crRNA分子およびtracrRNA分子を含む、またはcrRNA配列およびtracrRNA配列の両方を含む単一RNA分子を含む)を指す。CRISPR/Cas系タンパク質関連ガイドRNAは、単離RNAとして、またはCRISPR/Cas系タンパク質-gRNA複合体の一部として存在し得る。
【0155】
Cas9
一部の実施形態では、CRISPR/Cas系タンパク質は、Cas9を含む。本発明のCas9は、単離することができ、組換えで生成することができ、または合成で生成し得る。
【0156】
本明細書の実施形態において使用され得るCas9タンパク質は、http://www.nature.com/nature/journal/v520/n7546/full/nature14299.htmlに見出すことができる。
【0157】
一部の実施形態では、Cas9は、Streptococcus pyogenes、Staphylococcus aureus、Neisseria meningitidis、Streptococcus thermophiles、Treponema denticola、Francisella tularensis、Pasteurella multocida、Campylobacter jejuni、Campylobacter lari、Mycoplasma gallisepticum、Nitratifractor salsuginis、Parvibaculum
lavamentivorans、Roseburia intestinalis、Neisseria cinerea、Gluconacetobacter diazotrophicus、Azospirillum、Sphaerochaeta globus、Flavobacterium columnare、Fluviicola
taffensis、Bacteroides coprophilus、Mycoplasma mobile、Lactobacillus farciminis、Streptococcus pasteurianus、Lactobacillus johnsonii、Staphylococcus pseudintermedius、Filifactor alocis、Legionella pneumophila、Suterella wadsworthensis、またはCorynebacter diphtheriaに由来するII型CRISPR系である。
【0158】
一部の実施形態では、Cas9は、S.pyogenesに由来するII型CRISPR系であり、PAM配列は、標的特異的ガイド配列の3’末端のすぐ隣に位置したNGGである。例示的な細菌種由来のII型CRISPR系のPAM配列として、Streptococcus pyogenes(NGG)、Staph aureus(NNGRRT)、Neisseria meningitidis(NNNNGATT)、Streptococcus thermophilus(NNAGAA)、およびTreponema denticola(NAAAAC)も挙げることができ、これらはすべて、本発明から逸脱することなく使用可能である((http://www.nature.com/nature/journal/v520/n7546/full/nature14299.html))。
【0159】
例示的な一実施形態では、Cas9配列は、例えば、pX330プラスミド(Addgeneから入手可能)から得て、PCRによって再増幅し、次いでpET30(EMD biosciences製)中にクローニングして細菌内で発現させ、組換え6Hisタグ付きタンパク質を精製することができる。
【0160】
「Cas9-gRNA複合体」は、Cas9タンパク質およびガイドRNAを含む複合体を指す。ガイドRNAは、2種の分子、すなわち、標的にハイブリダイズし、配列特異性をもたらす1つのRNA(「crRNA」)、およびcrRNAにハイブリダイズすることができる1つのRNA、「tracrRNA」から構成され得る。代わりに、ガイドRNAは、crRNA配列およびtracrRNA配列を含有する単一分子(すなわち、gRNA)であり得る。Cas9タンパク質は、野生型Cas9タンパク質、例えば、Streptococcus pyogenes Cas9タンパク質と少なくとも60%同一(例えば、少なくとも70%、少なくとも80%、または90%同一、少なくとも95%同一、または少なくとも98%同一、または少なくとも99%同一)であり得る。Cas9タンパク質は、結合活性、ヌクレアーゼ活性、およびヌクレアーゼ活性を含めた野生型Cas9タンパク質の機能のすべて、または機能の1つのみもしくは一部を有し得る。
【0161】
用語「Cas9関連ガイドRNA」は、上述したガイドRNA(crRNA分子およびtracrRNA分子を含む、またはcrRNA配列およびtracrRNA配列の両方を含むRNA分子を含む)を指す。Cas9関連ガイドRNAは、単離RNAとして、またはCas9-gRNA複合体の一部として存在し得る。
【0162】
触媒不活性であるCRISPR/Cas系タンパク質
一部の実施形態では、CRISPR/Cas系タンパク質の操作された例には、触媒不活性であるCRISPR/Cas系タンパク質が含まれる。用語「触媒不活性である」は一般に、不活化されたHNHヌクレアーゼおよびRuvCヌクレアーゼを有するCRISPR/Cas系タンパク質を指す。このようなタンパク質は、任意の核酸中の標的部位(標的部位は、ガイドRNAによって決定される)に結合することができるが、このタンパク質は、二本鎖DNAを切断またはニックすることができない。
【0163】
一部の実施形態では、触媒不活性であるCRISPR/Cas系タンパク質は、dCas9、dCpf1、dCas3、dCas8a-c、dCas10、dCse1、dCsy1、dCsn2、dCas4、dCsm2、またはdCm5である。
【0164】
一実施形態では、触媒不活性であるCRISPR/Cas系タンパク質は、dCas9である。したがって、dCas9は、混合物の非結合核酸および分割のために標的にされるdCas9結合断片への分割を可能にする。一実施形態では、dCas9/gRNA複合体は、gRNA配列によって決定される標的に結合する。結合したdCas9は、他の操作が進行しながらCas9によるカッティングを防止することができる。これは、
図2に表されている。一実施形態では、dCas9/gRNA複合体は、gRNA配列によって決定される標的に結合し、標的核酸試料の結合した部分は、dCas9タンパク質に先に結合させた親和性タグ(例えば、ビオチン)の結合によって取り出すことができる。結合した核酸配列は、変性条件によってCas9/gRNA複合体から溶出し、次いで増幅および配列決定することができる。反対に、別の実施形態では、これらのdCas9標的化核酸を廃棄することができ、残りの核酸を増幅および配列決定によって解析することができる。
【0165】
CRISPR/Cas系タンパク質ニッカーゼ
一部の実施形態では、CRISPR/Cas系タンパク質の操作された例には、Casニッカーゼも含まれる。Casニッカーゼは、単一の不活性な触媒ドメインを含有するCRISPR/Cas系タンパク質の修飾バージョンを指す。
【0166】
一部の実施形態では、CRISPR/Cas系タンパク質ニッカーゼは、Cas9ニッカーゼ、Cpf1ニッカーゼ、Cas3ニッカーゼ、Cas8a-cニッカーゼ、Cas10ニッカーゼ、Cse1ニッカーゼ、Csy1ニッカーゼ、Csn2ニッカーゼ、Cas4ニッカーゼ、Csm2ニッカーゼ、またはCm5ニッカーゼである。
【0167】
一実施形態では、CRISPR/Cas系タンパク質ニッカーゼは、Cas9ニッカーゼである。
【0168】
一部の実施形態では、Cas9ニッカーゼは、標的配列に結合するのに使用することができる。用語「Cas9ニッカーゼ」は、単一の不活性な触媒ドメイン、例えば、RuvC-ドメインまたはHNH-ドメインのいずれかを含有するCas9タンパク質の修飾バージョンを指す。ただ1つの活性ヌクレアーゼドメインを有するので、Cas9ニッカーゼは、標的DNAの1本の鎖のみをカットし、単鎖切断または「ニック」を生じる。どの変異体が使用されるかに応じて、ガイドRNAがハイブリダイズした鎖またはハイブリダイズしていない鎖が切断され得る。反対鎖を標的にする2つのgRNAに結合したCas9ニッカーゼは、DNA中に二本鎖切断を生じることができる。この「二重ニッカーゼ」ストラテジーは、カッティングの特異性を増大させ、その理由は、それが、二本鎖切断が形成される前に両方のCas9/gRNA複合体が1つの部位で特異的に結合されることを要求するためである。
【0169】
例示的な実施形態では、DNAの枯渇は、Cas9ニッカーゼを使用して実行することができる。一実施形態では、本方法は、除去されるDNA(例えば、目的のものでないヒトDNA)および目的のDNA(例えば、未知の病原体由来のDNA)を含むDNAシークエンシングライブラリーを作製するステップと;枯渇されるすべてのDNAが反対のDNA鎖上で近接して(例えば、15塩基未満離れて)2つのガイドRNA結合部位を有するようにガイドRNAを設計するステップと;Cas9ニッカーゼおよびガイドRNAをDNAライブラリーに加えるステップとを含む。本実施形態では、Cas9ニッカーゼは、除去されるDNA上のその標的部位を認識し、1本の鎖のみをカットする。枯渇されるDNAに関して、2つの別個のCas9ニッカーゼは、近接している除去されるDNA(例えば、ヒトDNA)の両方の鎖をカットすることができ、除去されるDNA(例えば、ヒトDNA)のみが、近接して2つのCas9ニッカーゼ部位を有し、それが二本鎖切断を生じる。Cas9ニッカーゼが目的のDNA(例えば、病原体DNA)上の部位を非特異的にまたは低親和性で認識する場合、これは1本の鎖のみをカットし、それは、DNA分子の後続のPCR増幅または下流のプロセシングを防止しない。これは、
図7に図解で表されている。本実施形態では、2つのガイドRNAが十分近接している2つの部位を非特異的に認識する見込みは、無視できる(<1×10-14)。本実施形態は、標準のCas9媒介切断が目的のDNAをあまりにも多くカットする場合、特に有用であろう。
【0170】
解離性および熱安定性CRISPR/Cas系タンパク質
CRISPR/Cas系タンパク質をガイドRNAのライブラリーと組み合わせて使用して標的DNAのコレクションを効率的に枯渇させることができるが、大量(例えば、30pmole超)のCRISPR/Cas系タンパク質およびガイドRNAが必要であり得る。標的DNAを上回るこの通常100倍超の過剰量についての1つの理由は、切断後にこれらの標的DNAから完全に脱離するEcoRIなどの古典的制限酵素と異なり、CRISPR/Cas系タンパク質は、カッティング反応の完了後に完全に再利用されないことである。CRISPR/Cas系タンパク質、例えば、Cas9は、2つの娘DNA生成物分子の一方に結合したままであり得る(
図11、左の白丸を参照)。結果として、より多くのCRISPR/Cas系タンパク質およびgRNAが、不要なDNAの完全な枯渇を達成するために提供されることが必要であり得る。
【0171】
一部の実施形態では、この問題を克服するために、解離性CRISPR/Cas系タンパク質が本明細書に提供されている。例えば、標的化配列の切断の際に、CRISPR/Cas系タンパク質をgRNAまたは標的から解離させるようにすることができる。一部の実施形態では、解離は、反応の温度を上昇させることによって誘導される。これは、酵素を利用可能なgRNAと複合体形成させることによって酵素の処理能力を増大させ、追加の標的配列と再会合し、追加の切断された標的配列を生成するように作用することができる。
【0172】
一部の実施形態では、この問題を克服するために、熱安定性CRISPR/Cas系タンパク質が本明細書に提供されている。このような実施形態では、反応温度が上昇され、タンパク質の解離を誘導し、反応温度が下げられ、追加の切断された標的配列の生成を可能にする。一部の実施形態では、熱安定性CRISPR/Cas系タンパク質は、少なくとも75℃で少なくとも1分間維持されるとき、少なくとも50%の活性、少なくとも55%の活性、少なくとも60%の活性、少なくとも65%の活性、少なくとも70%の活性、少なくとも75%の活性、少なくとも80%の活性、少なくとも85%の活性、少なくとも90%の活性、少なくとも95%の活性、少なくとも96%の活性、少なくとも97%の活性、少なくとも98%の活性、少なくとも99%の活性、または100%の活性を維持する。一部の実施形態では、熱安定性CRISPR/Cas系タンパク質は、少なくとも75℃で、少なくとも80℃で、少なくとも85℃で、少なくとも90℃で、少なくとも91℃で、少なくとも92℃で、少なくとも93℃で、少なくとも94℃で、少なくとも95℃で、96℃、少なくとも97℃で、少なくとも98℃で、少なくとも99℃で、または少なくとも100℃で少なくとも1分間維持されるとき、少なくとも50%の活性を維持する。一部の実施形態では、熱安定性CRISPR/Cas系タンパク質は、少なくとも1分、2分、3分、4分、または5分間少なくとも75℃で維持されるとき、少なくとも50%の活性を維持する。一部の実施形態では、熱安定性CRISPR/Cas系タンパク質は、温度が上昇され、25℃~50℃に下げられるとき、少なくとも50%の活性を維持する。一部の実施形態では、温度は、25℃に、30℃に、35℃に、40℃に、45℃に、または50℃に下げられる。例示的な一実施形態では、熱安定性酵素は、95℃で1分後に少なくとも90%の活性を保持する。
【0173】
一部の実施形態では、熱安定性CRISPR/Cas系タンパク質は、熱安定性Cas9、熱安定性Cpf1、熱安定性Cas3、熱安定性Cas8a-c、熱安定性Cas10、熱安定性Cse1、熱安定性Csy1、熱安定性Csn2、熱安定性Cas4、熱安定性Csm2、または熱安定性Cm5である。
【0174】
一部の実施形態では、熱安定性CRISPR/Cas系タンパク質は、熱安定性Cas9である。
【0175】
例示的な一実施形態では、ガイドRNA(例えば、ヒトDNAに対するgRNAライブラリー)と複合体形成されている熱安定性Cas9をDNA混合物(例えば、95%のヒトDNAおよび5%のウイルスDNAを含有する)のシークエンシングライブラリーに適用することができる。
図11に表したように(右の灰色円)、Cas9がある期間にわたって消化することを可能にした後、試料混合物の温度を、例えば、最大で95℃またはそれ超に上昇させることができ、それにより、DNA変性ならびにDNA標的からのgRNAおよびCas9の解離を引き起こすことができる。Cas9のgRNAへの結合は、Cas9-gRNAがDNA変性にもかかわらずインタクトな複合体としてDNA標的から解離するように増大させることができる。ジメチルスルホキシドを添加して、DNA変性に要求される温度を低減することができ、その結果、Cas9タンパク質構造は影響されない。Cas9は、カットされなかった標的部位に優先的に結合し、熱安定性Cas9は、煮沸後に活性を保持することができる。これらの特徴のために、温度を例えば最大で100℃に上昇させ、反応物を例えば37℃に冷却することによって、熱安定性Cas9は、依然としてそのgRNAに結合し、より多くのその基質をカットすることができる。Cas9の再利用を可能にすることによって、枯渇効率を増大させることができ、より少ないCas9が反応において必要とされ、オフターゲット(非特異的)切断確率を減少させることもできる。
【0176】
熱安定性CRISPR/Cas系タンパク質を単離する、例えば、好熱性細菌Streptococcus thermophilusおよびPyrococcus furiosusのゲノム中の配列相同性によって同定することができる。次いでCRISPR/Cas系遺伝子を発現ベクター中にクローニングすることができる。例示的な一実施形態では、熱安定性Cas9タンパク質が単離される。
【0177】
別の実施形態では、熱安定性CRISPR/Cas系タンパク質は、非熱安定性CRISPR/Cas系タンパク質のin vitro進化によって得ることができる。CRISPR/Cas系タンパク質の配列を変異誘発させてその熱安定性を改善することができる。一部の実施形態では、これは、部位特異的変異誘発により過剰のループ配列を除去し、タンパク質ドメイン間のイオン架橋(ionic bridge)の数を増やすことによって、ま
たは希釈して液滴にし、PCRを行って潜在的な変異体のプールを作製することによって達成することができる。例示的な一実施形態では、熱安定性Cas9は、非熱安定性Cas9のin vitro進化によって生成することができる。
【0178】
本発明の方法
目的の配列の富化/標的化配列の枯渇
目的のものでない標的化配列(標的配列は、枯渇のために標的にされる配列である)を枯渇させることによって試料を目的の配列について富化する方法が本明細書に提供されている。
【0179】
一実施形態では、試料を目的の配列について富化する方法は、目的の配列および枯渇のための標的化配列を含む試料を準備するステップであって、目的の配列は、試料の50%未満、45%未満、40%未満、35%未満、30%未満、25%未満、20%未満、15%未満、10%未満、9%未満、8%未満、7%未満、6%未満、5%未満、4%未満、3%未満、2%未満、1%未満、0.5%未満、0.1%未満、0.05%未満、0.01%未満、0.005%未満、またはさらには0.001%未満を構成する、ステップと;試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって標的化配列が切断される、ステップとを含む。例示的な実施形態では、CRISPR/Cas系タンパク質は、Cas9である。
【0180】
一実施形態では、試料を非ミトコンドリアDNAについて富化する方法は、(a)ミトコンドリアDNAおよび非ミトコンドリアDNAを含む試料を準備するステップであって、ミトコンドリアDNAおよび非ミトコンドリアDNAは、アダプターライゲーションされており、アダプターは、ミトコンドリアDNAおよび非ミトコンドリアDNAの5’および3’末端にライゲーションされている、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、ミトコンドリアDNAに相補的であり、それによって、一端のみでアダプターライゲーションされたミトコンドリアDNAならびに5’および3’末端の両方でアダプターライゲーションされた非ミトコンドリアDNAを生成する、ステップと;(c)試料を非ミトコンドリアDNAについて富化するステップとを含む。一部の実施形態では、試料は、アダプター特異的PCRを使用して富化される。一部の実施形態では、富化するステップは、エキソヌクレアーゼ活性を有する酵素、例えば、エキソヌクレアーゼIIIまたはBAL-31でステップ(b)の生成物を処理することを含む。例えば、エキソヌクレアーゼIIIが利用される場合、アダプターは、Y形であり得る。BAL-31が利用される場合、アダプターは、ポリ-Gテールを含み得る。一部の実施形態では、試料は、目的の配列の精製によって富化される。
【0181】
別の実施形態では、試料を富化する方法は、(a)第1のゲノム由来の核酸および第2のゲノム由来の核酸を含む試料を準備するステップであって、第1のゲノム由来の核酸は、これらの5’および3’末端でアダプターライゲーションされており、第2のゲノム由来の核酸は、これらの5’および3’末端でアダプターライゲーションされている、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、第1のゲノム由来の核酸上の部位に相補的であり、それによって一端でのみアダプターライゲーションされた第1のゲノム由来の核酸ならびに5’および3’末端の両方でアダプターライゲーションされた第2のゲノム由来の核酸を生成する、ステップと;(c)試料を第1のゲノム由来の核酸について富化するステップとを含む。一部の実施形態では、試料は、アダプター特異的PCRを使用して富化される。一部の実施形態では、富化するステップは、エキソヌクレアーゼ活性を有する酵素、例えば、エキソヌクレアーゼIIIまたはBAL-31でステップ(b)の生成物を処理することを含む。例えば、エキソヌクレアーゼIIIが利用される場合、アダプターは、Y形であり得る。BAL-31が利用される場合、アダプターは、ポリ-Gテールを含み得る。一部の実施形態では、試料は、目的の配列の精製によって富化される。
【0182】
別の実施形態では、試料を非宿主核酸について富化する方法は、宿主核酸および非宿主核酸を含む試料を準備するステップであって、宿主核酸および非宿主核酸は、アダプターライゲーションされており、アダプターは、宿主核酸および非宿主核酸の5’および3’末端にライゲーションされている、ステップと;試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、宿主核酸中の標的化部位に相補的であり、それによって一端のみでアダプターライゲーションされた宿主核酸、ならびに5’および3’末端の両方でアダプターライゲーションされた非宿主核酸を生成する、ステップと;アダプター特異的PCRを使用して生成物を増幅するもしくは精製する、またはエキソヌクレアーゼを用いて処理するステップとを含む。
【0183】
別の実施形態では、試料中の標的化核酸を連続的に枯渇させるための方法であって、(a)宿主核酸および非宿主核酸を含む試料を準備するステップであって、非宿主核酸は、少なくとも1種の既知の非宿主生物由来の核酸および少なくとも1種の未知の非宿主生物由来の核酸を含む、ステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、宿主核酸中の標的化配列にハイブリダイズするように配置されており、それによって宿主核酸の一部が切断される、ステップと;(c)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、少なくとも1種の既知の非宿主核酸中の標的化配列にハイブリダイズするように配置されており、それによって少なくとも1種の既知の非宿主核酸の一部が切断される、ステップと;(d)未知の非宿主生物から核酸を単離するステップとを含む、方法が本明細書に提供されている。
【0184】
図1は、ヒト組織検体(1000)を処理することに関する第1の限定されない例示的方法を提供する。第1のステップ(1005)では、DNA抽出により、検体(1000)中に存在するヒト宿主の核酸配列および任意の非ヒトまたは非宿主生物の核酸配列を含む検体(1000)から実質的にすべての核酸配列が抽出される。DNA抽出ステップ(1005)は、約95%のヒトDNA(1010)および約5%の非ヒトDNA(1015)を生じさせることができ、非ヒトDNA(1015)は、微生物DNAを豊富に含み、本例示的方法の実施形態では、微生物DNAまたは非ヒトDNA(1015)は、さらなるDNA解析のための主要な目的のものである。DNA抽出ステップ(1005)後に、抽出された核酸配列(1010)および(1015)は断片化されて、それぞれの抽出された核酸配列の長さが、増幅、配列決定などのためにより扱いやすい長さに短縮される。断片のそれぞれの各末端にアダプター(1020)がライゲーションされる。それぞれの抽出された核酸配列断片またはゲノム断片はゲノムの領域を含み、例えば、各断片(1025)は、2つのアダプター(1020)間に破線で示した、ヒトゲノムの領域に由来する核酸配列を含み、一方、各断片(1030)は、2つのアダプター(1020)間に実線で示した、組織試料から抽出された非宿主生物のうちの1つの領域に由来する核酸配列を含む。それぞれの抽出された核酸またはゲノム断片はゲノムの領域を含み、例えば、各断片(1025)は、2つのアダプター(1020)間に破線で示した、ヒトゲノムの領域に由来する核酸配列を含み、一方、各断片(1030)は、2つのアダプター(1020)間に実線で示した、組織試料から抽出された非宿主生物のうちの1つの領域に由来する核酸配列を含む。しかし、配列は、さらなる解析なしで区別不能であることが認識される。
【0185】
本明細書に記載の組成物および方法の例示的な用途が
図1に提供されている。図は、生体試料のDNA抽出物を枯渇させるための枯渇法を含む本発明の限定されない例示的な実施形態を表す。
図1において、全部の断片化されたDNA抽出物(1025)および(1030)ならびに全部のガイドRNAライブラリー(1050)がCas9タンパク質と混合されて混合物(1080)となっている。混合物(1080)中にある間、各標的特異的ガイド配列(1060)は、ヒトDNA断片(1025)に見つかるマッチングする核酸配列にハイブリダイズし、Cas9タンパク質およびガイドRNAステム結合部位(1065)は、ガイドRNA(1055)をヒトDNA断片(1025)に結合させるガイドRNA/Cas9複合体(1085)を形成する。ガイドRNAライブラリー(1050)が適切に設計されている場合、実質的にすべてのヒトDNA断片(1025)にガイドRNA/Cas9複合体が結合する。その後、混合物(1080)は、Cas9タンパク質が、ガイドRNA/Cas9複合体が結合している各ヒトDNA断片(1025)の両方の鎖をカットまたは切断するようにインキュベートされる。カットした後、ヒトDNA断片(1025)は、2つのピース(1090)と(1095)になり、カットされなかったDNA断片(1030)はいずれもインタクトなままであり、アダプター(1020)が依然として各末端に結合しており、増幅およびさらなる研究のために準備が整っている。
【0186】
枯渇標的がカットまたは切断された後に行われる様々なさらなる処理ステップでは、混合物(1080)をサイズ選択的にろ過してカットされた断片(1090)および(1095)からカットされなかった断片(1030)を分離することができる。その後、カットされなかった断片(1030)を増幅および配列決定することができる。代わりに、増幅プロセスを使用してカットされなかったセグメントからカットされたものを選別することができ、その理由は、一部の増幅系では、断片の各末端でアダプター(1020)を有するセグメントのみが増幅されるためである。
【0187】
本明細書に記載の組成物および方法の別の例示的用途が
図2に提供されている。
図2は、分割を伴うが、枯渇を伴わない検体またはシークエンシングライブラリー(2000)を処理することに関する第2の限定されない例示的方法を表す。第1のステップ(2005)では、DNA抽出により、検体(2000)中に存在するヒト宿主の核酸配列および任意の他の非宿主生物の核酸配列を含む検体(2000)から実質的にすべての核酸配列が抽出される。本実施例では、DNA抽出ステップ(2005)は、約5~40%のヒトDNAおよび約95~60%の非ヒトDNAを生じさせることができる。上記
図1に関して記載したように、DNA抽出試料は、断片化およびアダプターライゲーションされる。上記
図1に関してさらに記載したように、gRNAのガイドRNAライブラリー(2050)が、それぞれがCas9複合体による結合のために標的にされているヒトDNAまたは核酸配列とハイブリダイズするように配置された多数の異なるヒト特異的gRNA(2055)とハイブリダイズするように開発される。しかし、標的化配列をカットする代わりに、
図2に示した方法が使用されて、断片化された核酸試料が分割されてそれぞれ別個に増幅され得る2つの画分にされる。上述の通り、ガイドライブラリー(2050)および断片化されたDNA抽出試料は、混合物(2080)中のCas9と組み合わされる。しかし、本実施例の実施形態では、Cas9は、触媒不活性であるCas9(dCas9)を含む。用語「触媒不活性である」は、不活化されたHNHヌクレアーゼおよびRuvCヌクレアーゼを有するCasタンパク質を指す。このようなタンパク質は、二本鎖DNA中の標的部位(標的部位は、ガイドRNAによって決定される)に結合することができるが、このタンパク質は、二本鎖DNAを切断またはニックすることができない。したがって、dCas9は、混合物(2080)を分割して非結合非ヒトDNA断片(2030)およびdCas9結合ヒトDNA断片(2090)にする。dCas9/gRNA複合体は、gRNA配列によって決定される標的のみに結合し、標的核酸試料の結合した部分は、dCas9タンパク質に先に結合させた親和性タグ(例えば、ビオチン)の結合によって取り出される。結合した核酸配列(2090)は、変性条件によってCas9/gRNA複合体から溶出し、次いで増幅および配列決定することができる。同様に、非結合核酸配列(2030)を増幅および配列決定することができる。
【0188】
アダプターを用いないDNAの大きい断片の枯渇
一部の実施形態では、本明細書に提供する方法は、枯渇のために使用される。しかし、アダプターを含有するライブラリーを切断する代わりに、ガイドRNAが、大きいサイズ(例えば、100bp~10kbのいずれか)の断片化されたDNAのプール中で複数回切断するのに選択される。CRISPR/Cas系タンパク質-gRNA複合体を用いて切断された後、DNAは、サイズ選択に付されて小さい断片(例えば、インタクトな断片の平均サイズの少なくとも1/2または1/3)が除去される。これは、例えば、5’リン酸特異的エキソヌクレアーゼであるラムダエキソヌクレアーゼでの処理によって補助される。5’リン酸特異的エキソヌクレアーゼは、5’から3’方向に進行し、CRISPR/Cas系タンパク質で先にカットされた任意の断片を攻撃する。次いで得られるライブラリーを、シークエンシングアダプターを要求しない単一分子シーケンサーによる配列決定に付すことができるか、またはアダプターを下流解析のためにライゲーションすることができる。
【0189】
熱安定性CRISPR/Cas系タンパク質を使用する枯渇
別の実施形態では、試料中の切断された標的化配列を生成する方法は、(a)目的の配列および切断のための標的化配列を含む試料を準備するステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって切断された標的化配列を生成する、ステップと;(c)切断された標的化配列からCRISPR/Cas系タンパク質を解離させるステップと;(d)追加の切断された標的化配列を生成するステップと;(c)カットされなかった目的の配列を回収するステップとを含む。一部の実施形態では、CRISPR/Cas系タンパク質は、熱安定性である。一部の実施形態では、切断された標的化配列からのCRISPR/Cas系タンパク質の解離は、ステップ(b)の混合物の温度を少なくとも75°に上昇させることによって達成される。一部の実施形態では、追加の切断された標的化配列の生成は、ステップ(b)の混合物の温度を少なくとも50°に下げることによって達成される。
【0190】
別の実施形態では、試料中の標的化配列を枯渇させる方法は、(a)目的の配列および枯渇のための標的化配列を含む試料を準備するステップと;(b)試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって切断された標的化配列を生成し、CRISPR/Cas系タンパク質は熱安定性である、ステップと、;(c)ステップ(b)の混合物の温度を少なくとも75°に上昇させるステップと;(d)ステップ(b)の混合物の温度を少なくとも50°に下げるステップと;ステップ(c)および(d)を少なくとも1回繰り返すステップと;(f)カットされなかった目的の配列を回収するステップとを含む。
【0191】
CRISPR/Casタンパク質ニッカーゼの存在下でのCRISPR/Cas系タンパク質媒介枯渇
一部の実施形態では、不要な標的化核酸の枯渇は、CRISPR/Cas系タンパク質ニッカーゼを使用して実行することができる。一実施形態では、本方法は、除去されるDNA(例えば、目的のものでないヒトDNA)および目的のDNA(例えば、未知の病原体由来のDNA)を含むDNAシークエンシングライブラリーを作製するステップと;枯渇されるすべてのDNAが、反対のDNA鎖上で近接して(例えば、15塩基未満離れて)2つのガイドRNA結合部位を有するようにガイドRNAを設計するステップと;CRISPR/Cas系タンパク質ニッカーゼおよびガイドRNAをDNAライブラリーに加えるステップとを含む。本実施形態では、CRISPR/Cas系タンパク質ニッカーゼは、除去されるDNA上のその標的部位を認識することができ、1本の鎖のみをカットする。枯渇されるDNAに関して、2つの別個のCRISPR/Cas系タンパク質ニッカーゼは、近接している除去されるDNA(例えば、ヒトDNA)の両方の鎖をカットすることができ、除去されるDNA(例えば、ヒトDNA)のみが、近接して2つのCRISPR/Cas系タンパク質ニッカーゼ部位を有し、それが二本鎖切断を生じる。CRISPR/Cas系タンパク質ニッカーゼが目的のDNA(例えば、病原体DNA)上の部位を非特異的にまたは低親和性で認識する場合、これは1本の鎖のみをカットすることができ、それは、DNA分子の後続のPCR増幅または下流のプロセシングを防止しない。これは、
図7に図解で表されている。本実施形態では、2つのガイドRNAが十分に近接している2つの部位を非特異的に認識する見込みは、無視できる(<1×10-14)。本実施形態は、標準のCRISPR/Cas系タンパク質媒介切断が目的のDNAをあまりにも多くカットする場合、特に有用である。
【0192】
CRISPR/Cas系タンパク質媒介枯渇およびビオチン標識
一部の実施形態では、CRISPR/Cas系タンパク質切断生成物は、ビオチンを使用して排除される。例えば、5%未満の目的のDNAおよび枯渇のために標的にされる95%超のDNAを最初に含む試料では、95%超のDNAは、断片化および枯渇され、ビオチン標識を含むカットされなかった(5%未満の目的のDNA)DNAは、ストレプトアビジンビーズへの結合によって精製される。本実施例は、エキソヌクレアーゼを使用しないCRISPR/Cas系タンパク質媒介切断後に不要なDNA(枯渇された断片化されたDNA)を除去する方法を例示する。
【0193】
例示的な実施形態を
図10に表す。この例示的な実施形態では、DNA混合物(95%超の不要なヒトDNAおよび5%未満の目的の他のDNAを含有する)は、標準のプロトコールに従って断片化され、末端修復され、アダプターにライゲーションされ、次いでビオチン-P5(例えば、5’ビオチン-AATGATACGGCGACCACCGA)およびP7(例えば、5’-CAAGCAGAAGACGGCATACGA)のプライマーを使用するPCRによって増幅される。これは、シークエンシングライブラリー全体がDNA分子の一端のみに5’ビオチン標識を有することを保証する。次いでDNA混合物は、CRISPR/Cas系タンパク質(例えば、Cas9)消化に付され、例えば、この場合に関して、ミトコンドリアDNA(不要なDNA)に対するガイドRNAライブラリーと複合体形成される。CRISPR/Cas系タンパク質によって切断されたDNA分子(例えば、この場合、ミトコンドリアDNA)は、ビオチン標識アダプターを失い、よって配列決定またはPCR増幅され得ず、一方、Cas9によってカットされなかったインタクトなDNAライブラリー(例えば、この場合、目的の非ミトコンドリアDNA)は、ビオチン標識を依然として担持する。結果として、次いでCRISPR/Cas系タンパク質によってカットされなかったインタクトなDNAを、ストレプトアビジンビーズを加えることによって回収することができる。次いで試料をさらなる富化のためにさらなる下流用途、例えば、配列決定、クローニングに付すことができる。
【0194】
枯渇後のエキソヌクレアーゼ処理
一部の実施形態では、PCR増幅または配列決定の前にカットされた断片を除去することが望ましい。
【0195】
一実施形態では、CRISPR/Cas系タンパク質媒介枯渇の後にエキソヌクレアーゼ処理が続く。エキソヌクレアーゼ処理は、CRISPR/Cas系タンパク質切断核酸をさらに分解する一方、目的の配列を含むカットされなかった核酸をインタクトのままにすることができる。
【0196】
一実施形態では、試料中の標的化配列を枯渇させる方法は、目的の配列および枯渇のための標的化配列を含む試料を準備するステップと;試料を複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させるステップであって、gRNAは、標的化配列に相補的であり、それによって切断された標的化配列を生成する、ステップと;ステップ(b)の生成物をエキソヌクレアーゼと接触させるステップとを含む。一実施形態では、エキソヌクレアーゼは、エキソヌクレアーゼIIIである。別の実施形態では、エキソヌクレアーゼは、BAL-31である。
【0197】
例示的な一実施形態では、DNAが生体試料から抽出され、断片化され、こうしてDNAの断片を含むライブラリー、例えば、シークエンシングライブラリーが作製される。Y形アダプターまたは円形アダプターがDNA断片にライゲーションされる。DNA断片は、目的のDNA配列および標的化配列(目的のものでないDNA)を含む。ライブラリーを複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させ、CRISPR/Cas系タンパク質は、目的のものでない標的DNAをカットし、目的の他のDNA配列をインタクトなままにする。得られる生成物をエキソヌクレアーゼIIIと接触させる。エキソヌクレアーゼIIIは、平滑末端または5’オーバーハングを使用することによって1本のDNA鎖の単方向3’>5’分解を開始し、一本鎖DNAおよびヌクレオチドを生じさせることができる。これは、一本鎖DNA上で活性でなく、よってY形アダプター末端などの3’オーバーハングは、分解に抵抗性である。結果として、CRISPR/Cas系タンパク質によってカットされなかったインタクトな二本鎖DNAライブラリーは、エキソヌクレアーゼIIIによって消化されず、一方、CRISPR/Cas系タンパク質によって切断されたDNA分子は、Cas9によってカットされた平滑末端からアダプターに向かうその3’>5’活性でエキソヌクレアーゼIIIによって分解される。
図8は、例示的な実施形態を例示する。DNA混合物(95%超の不要なヒトDNAおよび5%未満の目的の他のDNAを含有する)は、標準のプロトコールに従って断片化され、末端修復され、Y形アダプター(または円形アダプター)にライゲーションされるが、PCRによって増幅されない。次いでDNA混合物は、Cas9消化に付され、例えば、この場合に関して、ミトコンドリアDNAに対するガイドRNAライブラリーと複合体形成される。エキソヌクレアーゼIIIが添加される。不要なミトコンドリアDNAは、消化される。次いで残っているインタクトな二本鎖DNAライブラリーは、カラム精製によって回収され、かつ/またはPCR増幅される。
【0198】
別の例示的な実施形態では、エキソヌクレアーゼBAL-31が、CRISPR/Cas系タンパク質切断DNAを分解し、一方カットされなかった目的のDNAをインタクトなままにするのに使用される。例示的な一実施形態では、DNAが生体試料から抽出され、断片化され、こうしてDNAの断片を含むライブラリー、例えば、シークエンシングライブラリーが作製される。DNA断片は、目的のDNA配列および標的化配列(目的のものでないDNA)を含む。断片の3’末端は、ターミナルトランスフェラーゼを使用してポリ-dGをテール付加される。ライブラリーを複数のCRISPR/Cas系タンパク質-gRNA複合体と接触させ、CRISPR/Cas系タンパク質は、目的のものでない標的DNAをカットし、目的の他のDNA配列をインタクトなままにする。得られる生成物をエキソヌクレアーゼBAL-31と接触させる。エキソヌクレアーゼBAL-31は、2つの活性:二本鎖DNAエキソヌクレアーゼ活性および一本鎖DNA/RNAエンドヌクレアーゼ活性を有する。二本鎖DNAエキソヌクレアーゼ活性は、BAL-31が両方の鎖の開放端からDNAを分解することを可能にし、こうして二本鎖DNAのサイズを低減する。インキュベーションが長いほど、二本鎖DNAのサイズの低減が大きくなり、中程度から大型のDNA(>200bp)を枯渇させるのに有用になる。BAL-31の一本鎖エンドヌクレアーゼ活性は、それがポリ-A、-C、または-Tを非常に急速に消化することを可能にするが、ポリ-Gの消化は極めて弱いことが注目された(Marrone
およびBallantyne、2008年)。この特質のために、ライブラリーの3’末端で一本鎖ポリ-dGを付加することは、BAL-31によって分解されることからの保護として機能を果たす。結果として、CRISPR/Cas系タンパク質によって切断されたDNA分子は、CRISPR/Cas系タンパク質によってカットされた二本鎖平滑末端からポリ-dGを担持する他方の末端に向かうその二本鎖DNAエキソヌクレアーゼ活性でBAL-31によって分解され、枯渇を行うことができ、一方、CRISPR/Cas系タンパク質によってカットされなかったインタクトなDNAライブラリーは、これらの3’末端ポリ-dG保護に起因してBAL-31によって消化されない。
図9は、この手法の例示的な実施形態を表す。シークエンシングライブラリー(例えば、95%超のヒトDNAおよび5%未満の他のものを含有する)が調製される。ライブラリーは、ターミナルトランスフェラーゼを使用して3’末端でポリ-dGをテール付加される。次いでポリ-dGテール付加ライブラリーは、Cas9消化に付され、ガイドRNAライブラリー、例えば、ミトコンドリアDNAに対するガイドRNAライブラリーと複合体形成される。次いで生成物は、エキソヌクレアーゼBAL-31とともにインキュベートされ、それにより、ポリ-dGによってキャッピングされていない末端の消化が開始される。次いで生成物は、さらなるPCRに付され、またはDNA精製カラムで精製される。次いで残っているインタクトな二本鎖DNAライブラリーをカラム精製によって回収し、またはPCR増幅することができる。
【0199】
枯渇をモニターするための対照
論じた実施形態では、陽性対照および/または陰性対照を提供することが望ましい。陽性対照は、標的核酸の枯渇が忠実に進行することを保証することができる。
【0200】
一部の実施形態では、試薬の対照セットは、試薬の陽性対照セット、陽性対照標的配列である。例示的な実施形態では、試薬の陽性対照セットは、核酸断片のコレクションを含み、断片は、gRNAが少なくとも80%、少なくとも85%、少なくとも90%、少なくとも95%、少なくとも96%、少なくとも97%、少なくとも98%、少なくとも99%、または100%相補的である標的配列を含む。この対照は、ユーザーの反応と並行してランさせてすべてのコンポーネントが適切に働いているのを保証することができる。CRISPR/Cas系タンパク質で枯渇させた後、陽性対照標的配列の排除をゲル電気泳動またはqPCRによって測定することができる。
【0201】
一部の実施形態では、試薬の対照セットは、試薬の陰性対照セットである。一部の実施形態では、陰性対照は、オフターゲットカッティングが最小限または非存在であることを保証する。例示的な実施形態では、試薬の陰性対照セットは、gRNAの第2のセットを含み、gRNAの第2のセットは、gRNAの第1のセットと比較して標的配列への結合の低減を呈する。一部の実施形態では、gRNAの第2のセットは、RNAの第1のセットと比較して5%、10%、15%、20%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70%、75%、80%、または85%の標的配列への結合の低減を呈する。別の例示的な実施形態では、試薬の陰性対照セットは、gRNAの第2のセットを含み、gRNAの第2のセットは、標的配列と50%、55%、60%、65%、70%、75%、80%、85%、90%、または95%以下、相補的である。陰性対照は、使用されるgRNAと100%未満の同一性を伴った、例えば、標的特異的配列に対して1、2、3、4、5、またはそれ超のミスマッチを伴った一連のgRNAであり得る。一部の実施形態では、試薬の陰性対照セットは、核酸断片のコレクションを含み、断片は、gRNAの第1のセットと50%、55%、60%、65%、70%、75%、80%、85%、90%、または95%以下、相補的である。DNAライブラリーは、例えば、gRNAの相補配列に対して1、2、3、4、5、またはそれ超のミスマッチを伴って、キットにおいて使用されるgRNAの標的化配列と100%未満の同一性を有し得る。この対照は、ユーザーの反応と並行してランさせて、すべてのコンポーネントが適切に働いているのを保証し、酵素の任意のオフターゲット活性を測定することができる。CRISPR/Cas系タンパク質で枯渇させた後、オフターゲット枯渇の量をゲル電気泳動またはqPCRによって測定することができる。
【0202】
本明細書で企図する陽性および陰性対照に関して、gRNAの、本明細書に提供するその標的に対する相補性は、標的の全長に沿ったgRNAの相補性を指すことができる。しかし一部の実施形態では、相補性は、PAM配列に最も近く結合するエリアで、gRNAの終端における核酸のミスマッチによってより影響を受け得る。この領域中のミスマッチは、gRNAに沿った他の場所の核酸のミスマッチより大きい様式で標的を結合させる能力に影響を与え得る。同様に、PAM配列からさらに離れたgRNA中のミスマッチは、gRNAに沿った他の場所の核酸のミスマッチより小さく、標的を結合させる能力に影響を与え得る。一部の実施形態では、陰性対照gRNAは、PAM配列の近くでより低い相補性(complimentarily)を有するが、PAM配列からさらに遠く離れたところでより高
い相補性を有する。例えば、一部の実施形態では、陰性対照gRNAは、PAM配列の近くで50%~70%の相補性を有するが、PAM配列から遠く離れたところで70%~100%の相補性を有する。一部の実施形態では、陰性対照gRNAは、標的の全長に沿って50%、55%、60%、65%、70%、75%、80%、85%、90%、または95%の相補性を有する。
【0203】
ATAC-seq後のミトコンドリアDNAの枯渇
配列決定を使用するトランスポサーゼアクセス可能クロマチンのアッセイ(ATAC-seq)技法が、クロマチン、すなわちそのアクセス可能な部位を研究するのに分子生物学において使用されている。この方法は、オープンクロマチン領域をトランスポサーゼによってシークエンシングアダプターでタグ付けすることに基づき、その結果これらのオープンクロマチン領域由来のDNA断片を増幅し、ハイスループットシークエンシングに付すことができる(WO2014/189957;Buenrostroら、Nature Methods、10
巻、12号、2013年12月、1213頁)。ATAC-seqは、ゲノムワイドクロマチンアクセシビリティについての他のアッセイと比較してはるかに少ない出発材料を必要とするが、主な欠点の1つは、シークエンシングライブラリーは、高いパーセンテージのミトコンドリアDNA(これもオープンDNAである)が混入していることが多く、ヒトゲノムの標準的なアクセシビリティ研究、例えば、DNase-seqおよびFAIRE-seqについてはるかに多くのシークエンシングリードを要求することである(M. TsompanaおよびMJ. Buck、2014年)。したがって、配列決定コストを減少させるた
めに、ATAC-Seq手順後にシークエンシングライブラリーから不要なミトコンドリアDNA汚染を除去する必要性が当技術分野において存在する。本開示は、ATAC-Seqを受けた試料からミトコンドリアDNAを選択的に枯渇させる方法を提供する。
【0204】
ゲノムDNAを解析するための方法であって、(a)細胞の集団から単離されたDNAを挿入酵素で処理して、非ミトコンドリアゲノムDNAの複数のタグ付き断片を生成し、それによって残留量のタグ付きミトコンドリアDNAも生成する、ステップと;(b)本明細書に提供する富化または枯渇法のいずれかに従って、ステップ(a)の生成物を非ミトコンドリアDNAについて富化するステップとを含む、方法が本明細書に提供されている。一部の実施形態では、本方法は、タグ付き断片の少なくとも一部を配列決定して複数の配列リードを生成するステップと;配列リードから得た情報を前記細胞のゲノムの領域にマッピングすることによって該領域のエピジェネティックマップを作製するステップとをさらに含む。
【0205】
別の態様では、本開示は、一部位における、細胞試料由来であるポリヌクレオチドのアクセシビリティの決定を補助するための方法であって、挿入酵素によりポリヌクレオチド中に複数の分子タグを挿入し、分子タグを使用してその部位におけるアクセシビリティを決定するステップと、本明細書に記載のCRISPR/Cas系ベース枯渇法を使用して不要なDNA汚染物質を除去するステップとを含む、方法を提供する。細胞試料は、プライマリソース由来であり得る。細胞試料は、単一細胞からなり得る。細胞試料は、有限の数の細胞(例えば、約500,000細胞未満)からなり得る。
【0206】
挿入酵素は、ポリヌクレオチド中に核酸配列を挿入することができる任意の酵素であり得る。一部の場合では、挿入酵素は、実質的に配列非依存性の様式でポリヌクレオチド中に核酸配列を挿入することができる。挿入酵素は、原核生物の挿入酵素または真核生物の挿入酵素であり得る。挿入酵素の例としては、それだけに限らないが、トランスポサーゼ、HERMES、およびHIVインテグラーゼが挙げられる。トランスポサーゼは、Tnトランスポサーゼ(例えば、Tn3、Tn5、Tn7、Tn10、Tn552、Tn903)、MuAトランスポサーゼ、Vibharトランスポサーゼ(例えば、Vibrio
harveyi由来)、Ac-Ds、Ascot-I、BsI、Cin4、Copia、En/Spm、Fエレメント、hobo、Hsmarl、Hsmar2、IN(HIV)、ISI、IS2、IS3、IS4、IS5、IS6、ISIO、IS2I、IS30、IS50、ISSI、ISI50、IS256、IS407、IS427、IS630、IS903、IS911、IS982、IS103I、ISL2、LI、マリナー、Pエレメント、Tam3、Tel、Tc3、Tel、THE-I、Tn/O、TnA、Tn3、Tn5、Tn7、TnlO、Tn552、Tn903、Toll、Tol2、TnlO、Tyl、任意の原核生物トランスポサーゼ、または上記に列挙したものに関連した、および/もしくはそれに由来する任意のトランスポサーゼであり得る。ある特定の場合では、親トランスポサーゼに関連した、および/またはそれに由来するトランスポサーゼは、親トランスポサーゼの対応するペプチド断片と少なくとも約50%、約55%、約60%、約65%、約70%、約75%、約80%、約85%、約90%、約91%、約92%、約93%、約94%、約95%、約96%、約97%、約98%、または約99%のアミノ酸配列相同性を有するペプチド断片を含み得る。ペプチド断片は、長さが少なくとも約10、約15、約20、約25、約30、約35、約40、約45、約50、約60、約70、約80、約90、約100、約150、約200、約250、約300、約400、または約500アミノ酸であり得る。例えば、Tn5に由来するトランスポサーゼは、長さが50アミノ酸であり、親Tn5トランスポサーゼ中の対応する断片と約80%相同であるペプチド断片を含み得る。一部の場合では、挿入は、1種または複数種のカチオンの添加によって促進および/または誘発され得る。カチオンは、二価カチオン、例えば、Ca2+、Mg2+、およびMn2+などであり得る。
【0207】
分子タグは、シークエンシングアダプター、ロックされた核酸(LNA)、zip核酸(ZNA)、RNA、親和性反応性分子(affinity reactive molecule)(例えば、ビオチン、dig)、自己相補的分子、ホスホロチオエート修飾、アジド基またはアルキン基を含み得る。一部の場合では、シークエンシングアダプターは、バーコード標識をさらに含み得る。さらに、バーコード標識は、ユニーク配列を含み得る。ユニーク配列は、個々の挿入事象を同定するのに使用することができる。タグのいずれも、蛍光タグ(例えば、フルオレセイン、ローダミン、Cy3、Cy5、チアゾールオレンジなど)をさらに含み得る。
【0208】
キットおよび製造品
本願は、アダプター、gRNA、gRNAライブラリーなどに限定されない、本明細書に記載の組成物のいずれか1つまたは複数を含むキットを提供する。
【0209】
一実施形態では、キットは、gRNAのコレクションまたはライブラリーを含み、gRNAは、ヒトDNA配列を標的にしている。別の実施形態では、キットは、gRNAのコレクションまたはライブラリーを含み、gRNAは、ウシDNA配列を標的にしている。別の実施形態では、キットは、gRNAのコレクションまたはライブラリーを含み、gRNAは、ヒトリボソームRNA配列を標的にしている。別の実施形態では、キットは、gRNAのコレクションまたはライブラリーを含み、gRNAは、ヒトミトコンドリアDNA配列を標的にしている。
【0210】
一部の実施形態では、キットは、CRISPR/Cas系タンパク質およびgRNAを含み、gRNAは、ミトコンドリアDNAに相補的であり;またはgRNAは、ゲノム全体に相補的であり;またはgRNAは、全トランスクリプトームから作製されるcDNAに相補的であり;またはgRNAは、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも750、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010のユニーク転写物から作製されるcDNAに相補的であり;またはgRNAは、トランスクリプトームにおける最も豊富な転写物、例えば、トランスクリプトームにおける最も豊富な100、75、50、25、20、15、もしくは10の転写物から作製されるcDNAに相補的であり;またはgRNAは、トランスクリプトームにおける最も豊富な100、75、50、25、20、15、もしくは10の転写物のサブセットから作製されるcDNAに相補的である。
【0211】
一部の実施形態では、キットは、CRISPR/Cas系タンパク質およびgRNAを含み、CRISPR/Cas系タンパク質は、異なる細菌由来のCRISPR/Cas系タンパク質の混合物を含み;またはCRISPR/Cas系タンパク質は、操作されており;gRNAは、ミトコンドリアDNAに相補的であり;またはgRNAは、ゲノム全体を代表するゲノムDNAに相補的であり;またはgRNAは、全トランスクリプトームに由来するcDNAライブラリーに相補的であり;またはgRNAは、少なくとも10、少なくとも25、少なくとも50、少なくとも100、少なくとも250、少なくとも500、少なくとも750、少なくとも102、少なくとも103、少なくとも104、少なくとも105、少なくとも106、少なくとも107、少なくとも108、少なくとも109、少なくとも1010のユニーク転写物に由来するcDNAライブラリーに相補的であり;またはgRNAは、トランスクリプトームにおける最も豊富な100、75、50、25、20、15、もしくは10の転写物に由来するcDNAライブラリーに相補的であり;またはgRNAは、トランスクリプトームにおける最も豊富な100、75、50、25、20、15、もしくは10の転写物のサブセットに由来するcDNAライブラリーに相補的であり;またはgRNAは、異なる細菌種由来のCRISPR/Cas系タンパク質を標的配列に向けることができるgRNAの混合物を含む。
【0212】
一部の実施形態では、キットは、CRISPR/Cas系タンパク質;目的の標的に相補的であるgRNA;およびエキソヌクレアーゼ活性を有する酵素を含む。一実施形態では、エキソヌクレアーゼは、エキソヌクレアーゼIIIである。一実施形態では、エキソヌクレアーゼは、BAL-31である。
【0213】
一部の実施形態では、キットは、熱安定性であるCRISPR/Cas系タンパク質;および目的の標的に相補的であるgRNAを含む。
【0214】
一部の実施形態では、キットは、CRISPR/Cas系タンパク質;および目的の標的配列に相補的であるgRNAの第1のセット;および試薬の対照セットを含む。一実施形態では、試薬の対照セットは、試薬の陽性対照セットである。例示的な実施形態では、試薬の陽性対照セットは、核酸断片のコレクション、陽性対照標的配列を含み、断片は、gRNAが相補的である標的配列を含む。一実施形態では、試薬の対照セットは、試薬の陰性対照セットである。例示的な実施形態では、試薬の陰性対照セットは、gRNAの第2のセットを含み、gRNAの第2のセットは、gRNAの第1のセットと比較して標的配列への結合の低減を呈する。別の例示的な実施形態では、試薬の陰性対照セットは、核酸断片のコレクションを含み、断片は、gRNAの第1のセットに90%以下、相補的である。
【0215】
一部の実施形態では、キットは、細胞の集団からDNAを単離するための試薬;挿入酵素;CRISPR/Cas系タンパク質;および複数のgRNAを含み、gRNAは、ミトコンドリアDNAに相補的であり;またはgRNAは、ゲノム全体に相補的であり;またはgRNAは、全トランスクリプトームに相補的であり;またはgRNAは、トランスクリプトームにおける上位100、75、50、25、20、15、もしくは10の遺伝子に相補的である。
【0216】
本願は、本明細書に記載のキットのいずれか1つを含む製造品も提供する。製造品の例には、バイアル(密封バイアルを含む)が含まれる。
【0217】
以下の実施例は、例示的な目的で含められており、本発明の範囲を限定するように意図されていない。
【実施例0218】
(実施例1)ATAC-seqライブラリー、ライブラリー1からのミトコンドリアDNAの枯渇
概要
図4で図示されるように、枯渇法を、先に配列決定され、94%ヒト核DNAおよび6%ミトコンドリアDNAからなることが示されている、ヒトDNAライブラリー(ライブラリー1)において検査した。枯渇を、組換えCas9およびミトコンドリアDNAに関して特異的に設計された25種のガイドRNAのライブラリーを用いて実施した。対照の枯渇を、ミトコンドリアDNAを標的にしない無関係のガイドRNAを用いて実施した。約40%のヒトミトコンドリアDNAを枯渇させた。枯渇を、20分間で完了し、次いでPCRでライブラリーを増幅させた。
【0219】
Cas9の発現
Cas9(S.pyogenes由来)を、pET30発現ベクター(EMD biosciences)にクローニングして、Cas9開始コドンのすぐ上流にヘキサヒスチジンタグを挿入した。生じたプラスミドを、Rosetta(DE3)BL21細菌株(EMD biosciences)に形質転換し、1LのLB培地で激しく通気しながら、培養物の光学密度(600nmでのOD)が0.4に達するまで成長させた。温度を25℃に低下させ、0.2mM IPTGを加え、培養物をさらに4時間成長させた。細胞を、次に遠心分離(1,000×g、20分間、4℃)によって採集し、10ml結合緩衝液(20mM Tris pH8、0.5M NaCl、5mMイミダゾール、0.05%NP40)に再懸濁し、超音波処理(30%パワーで7×10秒のバースト、Sonifier250、Branson)によって溶解させた。不溶性の細胞残屑を、10,000×g、20分間での遠心分離によって除去し;可溶性タンパク質を含有する上清を、次に0.4mlのNTAビーズ(Qiagen)と混合し、カラムにロードした。ビーズを、4ml結合緩衝液で3回洗浄し、次に250mMイミダゾールを補充した3x0.5mlの結合緩衝液で溶出した。溶出した画分を次に濃縮し、緩衝液を30,000MWCOタンパク質濃縮器(Life Technologies)を用いて貯蔵緩衝液(10mM Tris pH8、0.3M NaCl、0.1mM EDTA、1mM DTT、50%グリセロール)で交換し、SDS PAGEによって検証し、次いでColloidal Blue染色(Life Technologies)し、定量し、次に-20℃で後に使用するまで貯蔵した。
【0220】
変異体Cas9ニッカーゼ(S.pyogenes Cas9のD10A変異体)を産生し、上記の通りCas9を産生させるために使用した同じ手順を用いて精製した。
【0221】
ガイドRNAライブラリーの調製
25の構築物を、T7 RNAポリメラーゼプロモーター、20塩基対のミトコンドリアDNA特異的配列、およびS.pyogenes由来のガイドRNA足場を各自含有させて設計した。各構築物について、2種のオリゴヌクレオチドを注文し(配列については表1および表2を参照されたい)、5μl中に1μMの最終濃度で組み合わせ、次に98℃、3分間加熱し、次に5℃/分の割合で55℃に冷却し、最終的に55℃で5分間インキュベートした。
【0222】
アニーリングしたオリゴを、次にゴールデンゲートクローニングによりガイドRNA足場を含有する、T7GRNEベクターにライゲーションした;アニーリングしたオリゴを、総容積20μl中の500ngのT7GRNEプラスミド、1μlのBsaI制限酵素および1μlのT7 DNAリガーゼに組み合わせた。反応物を、37℃で15分間、次いで20℃で10分間の10サイクル、次いで80℃で15分間の1サイクルにわたり、サーマルサイクラーでインキュベートした。生成物を、次に特異的なフォワードプライマー(表1および表2を参照されたい)およびリバースプライマー(5’-CAGAGCGAGGTATGTAGG-3’)を用いてPCR増幅した。サイクリング条件は、95℃で1分間、57℃で30秒間、および72℃で90秒間の30サイクルであった。反応の成功を、アガロースゲル電気泳動およびSYBRセーフ染色による1.6kb断片の存在によって確認した。成功した反応物を一緒にプールし、PCRクリーンアップキット(Thermo Fisher Scientific)を用いて精製した。
【0223】
ガイドRNAを、以下の規則を用いて設計した:
【0224】
規則1: 任意の鎖における目的のゲノム領域(例えば、全エクソームまたはミトコンドリアゲノム)において以下の配列(5’>3’方向)を見出した:
NNNNNNNNNNNNNNNNNNNNNGG
【0225】
規則2: 下線を引いた配列(20マー)は、注文したオリゴヌクレオチドに含まれるガイドRNAのターゲティング部分である。
a. 55%超のGC含量を有する任意の20マーを排除した。
b. 塩基対を形成する13超のステムループ(例えば、MfoldまたはViennaソフトウェアのいずれかにより予測される)を有する任意の20マーを排除した。
c. 20マーの第1のヌクレオチドがA/Gではない場合、1つのG残基を5’末端に付加して21マーを得た。
d. 規則3: T7プロモーターおよびプライマー結合部位を付加して以下のプライマー(5’>3’)を得た:
GCCTCGAGCTAATACGACTCACTATAG(G)NNNNNNNNNNNNNNNNNNNN
(G)は、20マーがプリンを5’末端に有していない場合に、Gが付加されることを示す。
【0226】
in vitro転写
ガイドライブラリーをガイドRNAに転写するため、本発明者らは、10μl精製ライブラリー(約500ng)、6.5μlのH2O、2.25μlのATP、2.25μlのCTP、2.25μlのGTP、2.25μlのUTP、2.25μl 10×反応緩衝液(NEB)および2.25μlのT7 RNAポリメラーゼミックスのin vitro転写反応混合物を作製した。反応物を37℃で24時間インキュベートし、次にH2O中で10倍希釈した。単一反応により、約40μgのRNAを生成した。RNA(約150塩基対)の収量およびサイズを、1μlの反応物を5%TBE/尿素ゲルで泳動し、SYBR Gold(Life Technologies)で染色することによって確認した。
【0227】
DNA特異的なCas9媒介性枯渇
希釈したガイドRNA(1μl、2pmolと等価)を、3μl 10×Cas9反応緩衝液(NEB)、20μl H2Oおよび1μlの組換えCas9酵素(NEB、1pmol/μl)と組み合わせた。以下の配列(5’-GGATTTATACAGCACTTTAA-3’)を標的にする対照ガイドRNAを用いる対照反応を、同じパラメータを用いて別々に実施した。この配列は、ヒト染色体DNAまたはミトコンドリアDNAのいずれかに非存在である。反応物を37℃で15分間インキュベートし、次に5μlの希釈したDNAライブラリー(50pg/μl)を補充し、37℃で連続的に90分間インキュベーションした。1:100希釈のRNaseA(Thermo Fisher Scientific)を添加し、98℃に5分間加熱し、次に室温に冷却し、100μl H2Oを添加して、反応を終結させた。反応物を、次に-20℃で使用まで貯蔵した。
【0228】
枯渇後のミトコンドリアDNAの定量
各反応(各検査条件および対照ガイドRNAを用いる反応)について、2つの別々の5μl試料を、対照プライマーおよび検査プライマーの両方を用いてリアルタイムPCRによって解析した。対照プライマー反応について、試料を、2μl H2O、0.25μlの10μMプライマーP5(5’-AATGATACGGCGACCACCGA-3’)、および0.25μlの10μM P7、(5’-CAAGCAGAAGACGGCATACGA-3’)および7.5μlの2×Maxima SYBR Greenマスターミックス(Thermo Fisher Scientific)とインキュベートした。検査プライマー反応について、試料を、1.75μl H2O、0.5μlの10μMミトコンドリアプライマー(表1および表2を参照されたい)、および0.25μlの10μM P7(5’-CAAGCAGAAGACGGCATACGA-3’)および7.5μlの2×Maxima SYBR Greenマスターミックス(Thermo Fisher Scientific)とインキュベートした。反応物を、95℃で3分間、次いで95℃で10秒間、55℃で45秒間の40サイクルの2ステップサイクリング条件を用いてiCyclerリアルタイムPCRサーマルサイクラー(BioRad)中でインキュベートした。
【0229】
2つのリアルタイムPCR条件について、対照プライマーおよび検査プライマーを用いて、較正曲線を作成した。希釈したDNAライブラリー(50pg/μl)を1:10、1:100、1:1000、1:10,000にさらに希釈し、これらの希釈物を上記の同じ反応条件、機器およびサイクリング条件を用いるリアルタイムPCRによって解析した。
【0230】
全DNAおよびミトコンドリアDNAの量を、それぞれ対照プライマーおよび検査プライマー反応の結果から導き出した。各DNAライブラリー枯渇実験について、ミトコンドリアDNA:全DNAの比を決定し、対照ガイドRNAを用いる実験に対して正規化し、次に
図4に示される棒グラフとしてプロットした。
【表1-1】
【表1-2】
【表2】
【0231】
(実施例2)ATAC-seqライブラリー、ライブラリー2からのミトコンドリアDNAの枯渇
概要
図5および
図6で図示されるように、枯渇法を、先に配列決定され、55%ヒト核DNAおよび45%ミトコンドリアDNAからなることが示されている、ヒトDNAライブラリー(ライブラリー2)において検査した。枯渇を、組換えCas9およびミトコンドリアDNAに関して特異的に設計された90種のガイドRNAのライブラリーを用いて実施したところ、ミトコンドリアゲノム中のギャップは残っていなかった。対照の枯渇を、ミトコンドリアDNAを標的としない無関係のガイドRNAを用いて実施した。
【0232】
プレおよびポスト捕獲ライブラリーを、2つの異なるプライマーのセットP5とP7(これは全てのDNAライブラリー断片を増幅する)またはミトコンドリアDNAのみを増幅するミトコンドリアDNA特異的プライマーを用いるリアルタイムPCRによって定量した。これらの2つの別々の反応物の比を使用して、ミトコンドリアDNAの枯渇を定量した。
【0233】
プレおよびポスト捕獲ライブラリーは、Illumina MiSeqプラットフォームでも配列決定を行い、生じたリードをヒトゲノムにマッピングしてミトコンドリアDNA含量を決定した。
【0234】
Cas9の発現
Cas9(S.pyogenes由来)を、pET30発現ベクター(EMD biosciences)にクローニングして、Cas9開始コドンのすぐ上流にヘキサヒスチジンタグを挿入した。生じたプラスミドを、Rosetta(DE3)BL21細菌株(EMD biosciences)に形質転換し、1LのLB培地で激しく通気しながら、培養物の光学密度(600nmでのOD)が0.4に達するまで成長させた。温度を25℃に低下させ、0.2mM IPTGを加え、培養物をさらに4時間成長させた。細胞を、次に遠心分離(1,000×g、20分間、4℃)によって採集し、10ml結合緩衝液(20mM Tris pH8、0.5M NaCl、5mMイミダゾール、0.05%NP40)に再懸濁し、超音波処理(30%パワーで7×10秒のバースト、Sonifier250、Branson)によって溶解させた。不溶性の細胞残屑を、10,000×g、20分間での遠心分離によって除去し;可溶性タンパク質を含有する上清を、次に0.4mlのNTAビーズ(Qiagen)と混合し、カラムにロードした。ビーズを、4ml結合緩衝液で3回洗浄し、次に250mMイミダゾールを補充した3×0.5mlの結合緩衝液で溶出した。溶出した画分を次に濃縮し、緩衝液を30,000MWCOタンパク質濃縮器(Life Technologies)を用いて貯蔵緩衝液(10mM Tris pH8、0.3M NaCl、0.1mM EDTA、1mM DTT、50%グリセロール)で交換し、SDS PAGEによって検証し、次いでColloidal Blue染色(Life Technologies)し、定量し、次に-20℃で後に使用するまで貯蔵した。
【0235】
変異体Cas9ニッカーゼ(S.pyogenes Cas9のD10A変異体)を産生し、上記の通りCas9を産生させるために使用した同じ手順を用いて精製した。
【0236】
ガイドRNAライブラリーの調製
T7-ガイドRNAオリゴヌクレオチド(表3)および別々のオリゴヌクレオチド、stlgR(配列、GT TTT AGA GCT AGA AAT AGC AAG TTA AAA TAA GGC TAG TCC GTT ATC AAC TTG AAA AAG TGG CAC CGA GTC GGT GCT TTT TTT GGA TCC GAT GC)を、注文し、合成した(IDT)。
【0237】
stlgRオリゴヌクレオチド(300pmol)を、製造者の指示に従って、逐次的にT4 PNK(New England Biolabs)を用いて5’リン酸化し、次に5’アデニル化キット(New England Biolabs)を用いて(sing)5’アデニル化した。T7-ガイドRNAオリゴヌクレオチド(5pmol)および5’アデニル化stlgR(10pmol)を、次に熱安定性5’App DNA/RNAリガーゼ(New England Biolabs)を65Cで1時間用いてライゲーションした。ライゲーション反応物を、90℃で5分間熱不活化し、次にプライマーForT7(配列GCC TCG AGC TAA TAC GAC TCA C)およびgRU(配列AAAAAAAGCACCGACTCGGTG)を用いるPCR(OneTaq、New England Biolabs
を用いて、95℃ 30秒、57℃ 20秒、72℃ 20秒の30サイクル)によって増幅した。PCR生成物を、PCRクリーンアップキット(Life Technologies)を用いて精製し、アガロースゲル電気泳動および配列決定によって検証した。
【0238】
検証された生成物を、次にHiScribe T7転写キット(New England Biolabs)を用いてin vitro転写反応のための鋳型として使用した。500~1000ngの鋳型を、製造者の指示に従って、一晩37℃でインキュベートした。生じたガイドRNA(複数可)を、RNAクリーンアップキット(Life Technologies)を用いて精製し、100μlのRNase不含水に溶出し、定量し、-20℃で使用まで貯蔵した。
【0239】
in vitro転写
ガイドライブラリーをガイドRNAに転写するため、本発明者らは、10μl精製ライブラリー(約500ng)、6.5μlのH2O、2.25μlのATP、2.25μlのCTP、2.25μlのGTP、2.25μlのUTP、2.25μl 10×反応緩衝液(NEB)および2.25μlのT7 RNAポリメラーゼミックスのin vitro転写反応混合物を作製した。反応物を37℃で24時間インキュベートし、次にH2O中で10倍希釈した。単一反応により、約40μgのRNAを生成した。RNA(約150塩基対)の収量およびサイズを、1μlの反応物を5%TBE/尿素ゲルで泳動し、SYBR Gold(Life Technologies)で染色することによって確認した。
【0240】
DNA特異的Cas9媒介性枯渇
複数のガイドRNA(単一のまたは複数のin vitro転写反応から)を選択して、枯渇される95%超の標的DNAが、少なくとも1つのガイドRNA標的配列を含有することを確実にした。これは、ライブラリーサイズの分布を測定し、平均(Nおよび標準偏差SD;N-2SD=95%超のライブラリーに関して最小サイズ)を決定することによって計算し、このサイズ当たり1つのガイドRNAが存在することを確実にして95%超の枯渇を保証することができる。これは、ガイドRNAの間の最大距離=ライブラリーサイズの平均-2×(ライブラリーサイズの標準偏差)として記載することもできる。ミトコンドリアライブラリーのケースでは、ライブラリーは、450塩基対の平均長で、標準偏差100である、DNA断片を含有する。これにより、ガイドRNA間で最大250bpがもたらされる。ここで、これらのライブラリー中のDNA断片は、450bpの平均長(100bpの推定標準偏差を有する)であり、5%未満のDNAは250bpよりも小さく、正規分布すると想定される。ガイドRNAがそれらの割り当てられた標的の100%を標的にすると想定すると、95%超の標的DNAは、少なくとも1つのガイドRNA部位を含有し、枯渇されるはずである。
【0241】
本実施例では、実施例1において構築されたものに加えて、実施例2において構築された全てのガイドを使用した。これらの複数のガイドRNAを、等モル量に混合して80pmolトータルまで加え、次に60μl Cas9反応緩衝液(20mM HEPES pH6.5、100mM NaCl、5mM MgCl2、0.1mM EDTA)中の40pmol精製Cas9タンパク質と組み合わせ、37℃で10分間インキュベートした。5ngのDNA混合物(所望のDNAおよび枯渇される標的DNAを含有)を加え、さらに20分間インキュベーションを続けた。反応を、2μg/ml RNaseAを含有する140μlのTE緩衝液(10mM Tris pH 8、1mM EDTA)を加えることによって停止させ、37℃で20分間インキュベートした。DNAを、カラム結合の前にイソプロパノールを加えることなく、PCRクリーンアップキット(Life
Technologies)用いて回収し、20μlの10mM Tris pH8中に溶出させた。溶出させたDNAを、製造者の指示に従って、HiFidelityマスターミックス(New England Biolabs)を使用し、適切なプライマー(例えば、P5およびP7をIlluminaに基づくDNAシークエンシングライブラリーの再増幅に関して)を用いて8~13サイクルのPCRで再増幅した。
【0242】
配列決定およびバイオインフォマティクス
PCR生成物を、PCRクリーンアップキットを用いて精製し、ハイスループットDNA配列決定(Illumina MiSeqまたはNextSeq)のための鋳型として使用した。
【0243】
Fastqファイルをbwaまたはbowtieを用いてヒトゲノム参照(hg20)に対して整列させて、核ゲノム対ミトコンドリアゲノムにマッピングされるリードの割合を決定した。
【表3-1】
【表3-2】
【0244】
(実施例3)CRISPR/Cas9系を用いるDNAライブラリー(トランスクリプトームまたは全ゲノムDNA)からの全ヒト配列の枯渇
トランスクリプトームワイドgRNAライブラリー:
ガイドRNAが生成され、これは全体のトランスクリプトームにわたってタイルされる。設計は、血液トランスクリプトームに基づく。各転写物にわたって約100~200bpごとに間隔をあけたガイドRNAの計算による選択についてのパイプラインは、平均でヒトゲノム中に約10~20bpごとにNGG部位があるとの予想が存在するとの知識に基づいて開発される。この様式では、約200~500bpの典型的なRNA-seqライブラリー挿入サイズを考慮して、各挿入物が標的部位を含有すると予想される。設計の完了に続いて、ガイドRNA標的配列および周辺モチーフ(surrounding motif)を含有するオリゴプールを、注文し、T7プロモーターおよびガイドRNA配列のインバリアント部分を引き続き付加させる。このアプローチにより、新しいプールの注文を必要とする前、一定期間にライブラリーの再生が可能となる。90,000エレメントのアレイサイズに基づいて、トランスクリプトームにわたって約200bpごとに間隔をあけたガイドRNAが、2つのアレイ(約30Mベースのトランスクリプトームサイズと想定される)で、生成されることが予想される。次いで、これらのガイドRNAをCas9と一緒に使用して、先の実施例に記載された通りRNA-seqライブラリーから全てのヒトDNAを枯渇させる。枯渇および配列決定データ解析は、先の実施例に記載されている通り行われる。
【0245】
検証:
記載されたアプローチは、検査RNA-seqライブラリーで検査される。これらのRNA-seqライブラリーは、標的化される配列のタイプをシミュレートするために、ヒトとE.coliのRNAの混合物から作製される。ライブラリーの枯渇に続いて、配列決定を実施して、トランスクリプトームの約10倍のカバレッジを得る。上記の通り、枯渇の前後でヒトにマッピングされる全ての配列の比率が、測定される;クラスカル・ウォリス一元配置ANOVA検定を使用して枯渇の統計学的有意性を決定することができる。
【0246】
この方法が、最適なgRNA設計で、反応においてCas9のレベルを調整することによって、RNA-seqライブラリーからの非リボソームヒト配列の90%枯渇を達成し、非ヒト配列の5%未満が枯渇されることが予想される。
【0247】
(実施例4)ウイルスまたは他の病原体由来配列についてのヒト血液試料の富化
既知の病原体(例えば、エボラ)または未知の病原体を保持するヒト血液試料を得、RNAを抽出し(例えば、PAXgene血液RNA抽出キット、Qiagenを用いて)、標準方法(例えば、KAPA RNA-seqライブラリー調製キットを用いて)を用いてシークエンシングライブラリーに変換する。cDNA作製およびアダプターライゲーションの後、ライブラリーを、次にCas9およびヒトトランスクリプトームにおいて約200塩基ごとに標的にするガイドRNAプールと混合する。反応物を、37Cで20分間インキュベートして、標的配列を含有する任意の断片をCas9によって切断する。次いで、ライブラリーを精製し、アダプター特異的プライマーを用いて増幅する。ヒト配列を、効果的に枯渇させる。未切断配列のみを増幅し、生じたライブラリーをウイルスまたは他の病原体由来配列について富化する。
【0248】
(実施例5)ウイルスおよび他の病原体についてモニターするための家畜からの試料の富化
この実施例では、本方法を使用してミルクおよび家畜におけるウイルスおよび他の病原体をモニターする。
【0249】
雌ウシのミルクまたはウシ(雌ウシ)血液からRNAを抽出し、上記実施例に記載されている通りシークエンシングライブラリーに変換する。cDNA作製およびアダプターライゲーションの後、ライブラリーを、Cas9およびウシ(Bos taurus)トランスクリプトームにおいて約200塩基を標的にするガイドRNAプールと混合する。反応物を、37Cで20分間インキュベートして、標的配列を含有する任意の断片をCas9によって切断する。次いで、ライブラリーを精製し、アダプター特異的プライマーを用いて増幅する。ウシ配列を効果的に枯渇させる。未切断配列のみを増幅し、生じたライブラリーをウイルスまたは他の病原体由来配列について富化する。このシナリオでは、雌ウシ枯渇シークエンシングライブラリー(cow-depleted sequencing library)を配列決
定し、ミルクおよび家畜におけるウイルスおよび他の病原体をモニターするために使用することができる。
【0250】
(実施例6)アダプターなしのDNAの大きい断片の枯渇
この実施例は、アダプターを必要としない枯渇を支持する方法を示す。この実施例では、本方法は、上記実施例に記載されている通り、枯渇実験のために使用される。しかし、アダプターを含有するライブラリーを切断する代わりに、ガイドRNAが選択されて大きいサイズ(例えば、100bp~10kbあたり)の断片化されたDNAのプールにおいて複数回切断する。Cas9/gRNA複合体での切断に続いて、DNAをサイズ選択に付し、小さい断片(例えば、インタクトな断片の平均サイズの少なくとも1/2または1/3)を除去する。これを、例えば、Lambdaエキソヌクレアーゼによる処理によって支援することができる。Lambdaエキソヌクレアーゼは5’リン酸特異的エキソヌクレアーゼであり、5’から3’方向に進行し、Cas9で前にカットされていた任意の断片を攻撃する。生じたライブラリーは次にシークエンシングアダプターを必要としない一分子シーケンサーでの配列決定に付されてもよい;またはアダプターを下流解析のためにライゲーションしてもよい。
【0251】
(実施例7)枯渇、次いでエキソヌクレアーゼIII処理
一部の実施形態では、PCR増幅または配列決定の前にカットされた断片を除去することが望ましい。この実施例は、エキソヌクレアーゼIIIを使用して、切断されたDNAを分解するが、カットされなかった目的のDNAをインタクトなままにすることによる、Cas9媒介性切断後の不要なDNAを除去する方法を例示する。
【0252】
図8で図示されるように、DNA混合物(枯渇のため標的化される95%超のヒトDNA、および目的の5%未満の他のDNAを含有)は、標準のプロトコールに従い、断片化され、末端修復され、およびY形アダプター(または円形アダプター、例えば、NEBNext(登録商標))にライゲーションされるが、PCRによって増幅されない。DNA混合物を、次に、前に記載されている通り、例えば、このケースでは、ミトコンドリアDNAに対するガイドRNAライブラリーと複合体形成させ、Cas9消化に付す。Cas9反応物を、0.5%RNaseA(Thermo Fisher Scientific)を補充したTE(10mM Tris-Cl pH8、1mM EDTA)で1:3に希釈し、37℃で5分間インキュベートする。プロテイナーゼK(NEB)を、次に8単位/mlの最終濃度で加え、37℃で5分間インキュベートする。次いで、GeneJET PCR精製キット(Thermo Fisher Scientific)を用いてDNAを回収し、20μlの1X CutSmart(登録商標)緩衝液(NEB)中に溶出させる。次いで、エキソヌクレアーゼIII(NEB)を加え(50単位)、37℃で20分間インキュベートし、次いで65℃で30分間熱不活化させる。
【0253】
エキソヌクレアーゼIIIは、平滑末端または5’オーバーハングを用いることによって一方のDNA鎖の一方向性の3’>5’分解を開始することができ、一本鎖DNAおよびヌクレオチドが得られる;それは一本鎖DNAにおいて活性ではないことから、3’オーバーハング(例えば、Y形アダプター末端)は、分解に対して抵抗性である。その結果、Cas9によってカットされなかったインタクトな二本鎖DNAライブラリー(例えば、このケースでは、非ミトコンドリアDNA)は、エキソヌクレアーゼIIIによって消化されない、一方、Cas9によって切断されているDNA分子(例えば、このケースでは、ミトコンドリアDNA)は、Cas9によってカットされた平滑末端からアダプターに向かって、エキソヌクレアーゼIIIによってその3’>5’活性で分解される。
【0254】
したがって、不要なDNAが消化される。残存するインタクトな二本鎖DNAライブラリーは、次にGeneJET PCR精製キット(Thermo Fisher Scientific)を用いて回収され、20μl 10mM Tris-Cl pH8中に溶出される。試料は、次にQubit蛍光光度計(Life Technologies)を用いて定量され、MiSeqシステム(Illumina)において配列決定される。
【0255】
あるいは、不要なDNAを、上記の通り、消化することができる、一方、インタクトなDNAは、例えば、カラム精製またはPCR増幅によって回収される。
【0256】
(実施例8)枯渇、次いでエキソヌクレアーゼBal-31処置
一部の実施形態では、PCR増幅または配列決定の前にカットされた断片を除去することが望ましい。この実施例は、エキソヌクレアーゼBal-31を用いることにより、切断されたDNAを分解するが、カットされなかった目的のDNAをインタクトなままにする、Cas9媒介性切断後の不要なDNAを除去する代替法を例示する。
【0257】
図9で図示されるように、シークエンシングライブラリー(例えば、枯渇のため標的化される95%超のヒトDNA(例えば、ミトコンドリアDNA)および目的の5%未満のDNAを含有)は、PCR増幅ステップを含む、従来の方法に従って、調製される。ライブラリー(500nM)は、次に製造者の指示に従って、ターミナルトランスフェラーゼ(NEB)および3mM dGTPを用いて3’末端にポリ-dGでテール付加し、37℃で30分間インキュベートし、次に75℃、20分間、熱不活化する。3’ポリ-dGテール付加ライブラリーは、次に、前に記載されている通り、例えば、このケースでは、ミトコンドリアDNAに対するガイドRNAライブラリーと複合体形成させ、Cas9消化に付し、次に75℃、20分間、熱不活化する。反応物を、次に10単位のエキソヌクレアーゼBal-31(NEB)を補充した1×エキソヌクレアーゼBal-31反応緩衝液(NEB)に1:5に希釈し、37℃で30分間インキュベートした。
【0258】
エキソヌクレアーゼBal-31は、二本鎖DNAエキソヌクレアーゼ活性および一本鎖DNA/RNAエンドヌクレアーゼ活性の2つの活性を有している。二本鎖DNAエキソヌクレアーゼ活性により、BAL-31が両方の鎖におけるオープンエンドからDNAを分解することが可能になり、したがって、二本鎖DNAのサイズが減少する。インキュベーションが長いほど、二本鎖DNAのサイズの減少はより大きくなり、中程度から大型のDNA(200bp超)を枯渇させるのに有用となる。BAL-31の一本鎖エンドヌクレアーゼ活性により、ポリ-A、-Cまたは-Tを非常に迅速に消化することが可能になるが、ポリ-Gの消化は極度に弱いことが留意される(MarroneおよびBallantyne、2
008年)。この性質が理由で、一本鎖ポリ-dGをライブラリーの3’末端に付加することにより、BAL-31による分解からの保護に働くことができ、このことは、本発明者らがPCR生成物を用いて検証した。その結果、Cas9によって切断されているDNA分子(例えば、このケースでは、ミトコンドリアDNA)は、BAL-31によって、枯渇に影響する、Cas9によってカットされた二本鎖平滑末端からポリ-dGを保持する他の末端に向かって、その二本鎖DNAエキソヌクレアーゼ活性で分解され;一方、Cas9によってカットされなかったインタクトなDNAライブラリー(例えば、このケースでは、非ミトコンドリアDNA)は、それらの3’末端ポリ-dG保護に起因してBAL-31によって消化されない。
【0259】
エキソヌクレアーゼBal-31インキュベーションの後、反応混合物は75℃、20分間、熱不活化され、DNAはGeneJET PCR精製キット(Thermo Fisher Scientific)を用いて回収される。試料は、次にQubit蛍光光度計(Life Technologies)を用いて定量され、MiSeqシステム(Illumina)において配列決定される。
【0260】
あるいは、不要なDNAを、上記の通り、消化することができる、一方、インタクトなDNAは、例えば、カラム精製によって回収される。
【0261】
(実施例9)Cas9枯渇およびビオチン標識
一部の実施形態では、Cas9切断生成物は、排除(例えば、95%超のミトコンドリアDNAが、排除される)され、ビオチン標識を含むカットされなかった(目的の5%未満のDNA)のDNAは、ストレプトアビジンビーズに結合させることによって精製される。この実施例は、エキソヌクレアーゼを用いることなく、Cas9媒介性切断後の不要なDNAを除去する方法を例示し、
図10に図示される。
【0262】
DNA混合物(95%超の不要なヒトDNA、および目的の5%未満の他のDNAを含有)は、標準のプロトコールに従い、断片化され、末端修復され、およびアダプターにライゲーションされ、次にビオチン-P5(5’ビオチン-AATGATACGGCGACCACCGA)およびP7(5’-CAAGCAGAAGACGGCATACGA)のプライマーを用いるPCRによって増幅される。これにより、全体のシークエンシングライブラリーが、そのDNA分子の1つの末端のみに5’ビオチン標識を有することが保証される。DNA混合物は、次に、前に記載されている通り、例えば、このケースでは、ミトコンドリアDNA(不要なDNA)に対するガイドRNAライブラリーと複合体形成させて、Cas9消化に付す。Cas9反応物は、0.5% RNaseA(Thermo Fisher Scientific)を補充したTE(10mM Tris-Cl pH8、1mM EDTA)で1:3に希釈され、37℃で5分間インキュベートされる。プロテイナーゼK(NEB)が、次に8単位/mlの最終濃度で加えられ、37℃で5分間インキュベートされる。Cas9によって切断されるDNA分子(例えば、このケースでは、ミトコンドリアDNA)は、ビオチン標識アダプターを失い、したがって、配列決定またはPCR増幅することはできない;一方、Cas9によってカットされなかったインタクトなDNAライブラリー(例えば、このケースでは、目的の非ミトコンドリアDNA)は、なおもビオチン標識を保持する。その結果、Cas9によってカットされなかったインタクトなDNAは、次にストレプトアビジンビーズ(Dynabeads MyOne Streptavidin C1、Thermo Fisher Scientific)を2%の最終濃度で加えることによって回収され得る。ビーズは、磁気スタンドを用いて捕獲され、TE緩衝液で4回洗浄される。DNAを、95℃で3分間加熱することによってビーズから放出させ、次いでP5およびP7プライマー(非ビオチン化)を用いる6サイクルのPCRを行う。DNAは、次にGeneJET PCR精製キット(Thermo Fisher Scientific)を用いて精製される。試料は、次にQubit蛍光光度計(Life Technologies)を用いて定量され、MiSeqシステム(Illumina)において配列決定される。
【0263】
(実施例10)熱安定性Cas9を用いるCas9媒介性枯渇の効率の増加
Cas9は、標的DNAのコレクションを効率的に枯渇させるためガイドRNAのライブラリーと組み合わせて使用することができるが、大量(>30pmol)のCas9およびガイドRNAが必要とされる。この標的DNAに対して通常>100倍過剰量である理由は、切断後それらの標的DNAから完全に脱離する、EcoRIなどの古典的な制限酵素とは異なり、Cas9は、カット反応の完了後に再利用されないからである。Cas9は、2つの娘DNA生成物分子の1つと密接に結合したままで残ることができる(
図11を参照されたい、左の白丸)。その結果、不要なDNAの完全な枯渇を達成するために、より多くのCas9およびgRNAが提供されることが要求される。この問題を克服するため、ガイドRNA(例えば、ヒトDNAに対するgRNAライブラリー)と複合体形成された熱安定性Cas9(95℃で1分後に>90%活性を保持するものとして定義される)が、DNA混合物(例えば、95%のヒトDNAおよび5%のウイルスDNAを含有)のシークエンシングライブラリーに適用され得る。
図11(右の灰色の丸)で図示されるように、Cas9により一定期間消化させた後に、試料混合物は、煮沸されてもよく、これがDNA変性ならびにgRNAおよびCas9のDNA標的からの解離を引き起こす。DNA変性にもかかわらず、Cas9とgRNAの結合は増加することができ、Cas9-gRNAがインタクトな複合体としてDNA標的から解離する。Cas9タンパク質構造が影響されないように、DNA変性に必要とされる温度を減少させるため、ジメチルスルホキシドが加えられ得る。Cas9はカットされていない標的部位に優先的に結合し、熱安定性Cas9は煮沸後に活性を保持する。これらの特性が理由で、反応物を煮沸し37℃に冷却することによって、熱安定性Cas9は、依然としてそのgRNAに結合し、より多くのその基質をカットすることができる。Cas9の再利用が可能となることによって、枯渇効率が増加し、より少ないCas9が、反応に必要とされるので、オフターゲットの(非特異的な)切断確率も減少する。
【0264】
熱安定性Cas9を作製するための2つの例示的な方法が、提供される。
【0265】
第1の方法は、熱安定性Cas9の単離である。熱安定性Cas9に関する遺伝子およびその対応するガイドRNAは、好熱性の細菌であるStreptococcus thermophilusおよびPyrococcus furiosusのゲノムにおける配列相同性によって同定される。Cas9遺伝子は、次に、前の項に記載されている通りCas9を発現させるため発現ベクターpET30(Novagen)にクローニングされる。ガイドRNA配列は、オリゴヌクレオチドに組み立てられ、合成される(IDT)。Cas9およびガイドRNAの活性な組合せは、配列決定されたDNA鋳型の37℃(対照)での、および95℃で3X5分の処理後の37℃での消化によって評価される。第2の方法は、S.pyogenes Cas9のin vitro進化である。Cas9の配列を変異誘発させて、その熱安定性を改善する。簡単に述べると、これは、過剰なループ配列を除去しタンパク質ドメイン間のイオン架橋の数を増加させる、部位特異的変異誘発によって、または液滴へと希釈してPCRで潜在的な変異体のプールを生じさせることによって行われる。全ての変異体は、上記の通り活性および熱安定性に関して評価される。
【0266】
(実施例11)不要なDNAの枯渇およびオフターゲット事象をモニターするための対照
論じられた実施形態では、陽性対照および/または陰性対照を提供することが望ましい。陽性対照は、不要なDNAの枯渇が忠実度および効率性を伴って進行することを保証する。陰性対照は、オフターゲット切断が、最小または非存在であることを保証する。
【0267】
陽性対照は、キットに含まれるgRNAの標的配列の全てまたは大部分を含有する挿入物を有するシークエンシングライブラリーからなり得る。この対照は利用者の反応と並行して処理され、全てのコンポーネントが正しく機能していることを保証する。Cas9での枯渇後、標的配列の排除は、ゲル電気泳動またはqPCRによって測定され得る。
【0268】
陰性対照は、1)標的特異的配列に対して、例えば1、2、3、4、5、またはそれ超のミスマッチを有する、キットに使用されるgRNAに対して100%未満の同一性を有するgRNAのセット;または2)gRNAの相補的な配列に対して、例えば1、2、3、4、5、またはそれ超のミスマッチを有する、キットに使用されるgRNAの標的化配列に対して100%未満の同一性を有する挿入物を有するDNAライブラリーからなり得る。この対照は利用者の反応と並行して処理され、全てのコンポーネントが正しく機能していることおよび酵素の任意のオフターゲット活性が測定されることを保証する。Cas9での枯渇後、オフターゲット枯渇の量は、ゲル電気泳動またはqPCRによって測定され得る。