IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ジャンプコード ゲノミクス,インク.の特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-09-08
(54)【発明の名称】核酸の標的化除去のための方法
(51)【国際特許分類】
   C40B 40/06 20060101AFI20230901BHJP
   C12N 15/10 20060101ALN20230901BHJP
   C12N 9/16 20060101ALN20230901BHJP
   C12Q 1/6869 20180101ALN20230901BHJP
【FI】
C40B40/06
C12N15/10 100Z
C12N9/16 Z
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023509638
(86)(22)【出願日】2021-08-11
(85)【翻訳文提出日】2023-04-10
(86)【国際出願番号】 US2021045521
(87)【国際公開番号】W WO2022035950
(87)【国際公開日】2022-02-17
(31)【優先権主張番号】63/064,833
(32)【優先日】2020-08-12
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】518274618
【氏名又は名称】ジャンプコード ゲノミクス,インク.
(74)【代理人】
【識別番号】110003797
【氏名又は名称】弁理士法人清原国際特許事務所
(72)【発明者】
【氏名】ブラウン,キース
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QQ03
4B063QQ06
4B063QQ07
4B063QQ08
4B063QQ10
4B063QQ42
4B063QQ52
4B063QR14
4B063QS02
4B063QS12
(57)【要約】
本明細書において開示されるのは、例えば、下流の分析またはシーケンシングから第1の核酸を除外するための、あるいは下流のデータセットからそのような配列を除外するための、試料における第1の核酸の削除、および/または第2の核酸の富化に関する、組成物および方法である。
【選択図】図1
【特許請求の範囲】
【請求項1】
(a)多数の核酸分子を含む試料を提供する工程であって、ここで前記多数の核酸分子が第1の核酸と第2の核酸を含む、工程、
(b)閾値サイズより小さい核酸断片を前記試料から取り除く工程、
(c)前記第1の核酸を切断するエンドヌクレアーゼに前記試料を接触させる工程、
(d)エキソヌクレアーゼ消化され、切断された第1の核酸を生成するために、工程(c)からの前記試料をエキソヌクレアーゼに接触させる工程、および
(e)前記閾値サイズより大きい前記多数の核酸分子の一部を含むライブラリを生成する工程を含む、ライブラリを調製する方法。
【請求項2】
前記エンドヌクレアーゼが、多数の切断された第1の核酸を生成するように構成される、請求項1に記載の方法。
【請求項3】
エキソヌクレアーゼ消化され、切断された、前記第1の核酸分子が、閾値サイズより小さい、請求項1に記載の方法。
【請求項4】
前記第1の核酸と第2の核酸をエキソヌクレアーゼ消化に対して耐性にするために、前記第1の核酸と第2の核酸の5’末端または3’末端を修飾する工程をさらに含む、請求項1に記載の方法。
【請求項5】
前記修飾する工程が、前記第1の核酸と第2の核酸の前記5’末端および3’末端に1つまたは複数のアダプターを付加することを含む、請求項4に記載の方法。
【請求項6】
前記1つまたは複数のアダプターが、ヘアピンアダプター、環状アダプター、または線形アダプターを含む、請求項5に記載の方法。
【請求項7】
前記線形アダプターが、ホスホロチオエート、2-Oメチル、インバーテッドdT、インバーテッドddT、リン酸化、およびC3スペーサーからなる群から選択される、請求項6に記載の方法。
【請求項8】
前記修飾する工程が、前記第1の核酸と前記第2の核酸の前記5’末端および/または3’末端を化学的に修飾することを含む、請求項4に記載の方法。
【請求項9】
前記エンドヌクレアーゼが、前記第1の核酸上の少なくとも1つの部位に特異的な制限酵素である、請求項1に記載の方法。
【請求項10】
切断された第1の核酸が、アダプターに付加されている第1の末端、およびアダプターに付加されていない第2の末端を有する、請求項5に記載の方法。
【請求項11】
切断された第1の核酸が、修飾される第1の末端と、修飾されない第2の末端とを有する、請求項5に記載の方法。
【請求項12】
前記エンドヌクレアーゼが、Clustered Regulatory Interspaced Short Palindromic Repeat(クラスター化され規則的に間隔を置かれた短い回文反復)(CRISPR)/Casシステムタンパク質-ガイドRNA(gRNA)複合体、ジンクフィンガーヌクレアーゼ(ZFN)、および転写活性化因子様エフェクターヌクレアーゼから選択される少なくとも1つを含む、請求項1に記載の方法。
【請求項13】
前記gRNAが、1つの末端のみにキャップされた切断された第1の核酸を生成するように、前記第1の核酸上の少なくとも1つの部位に相補的である、請求項12に記載の方法。
【請求項14】
前記エンドヌクレアーゼが、Alu特異的制限酵素を含む、請求項1に記載の方法。
【請求項15】
前記第1の核酸が、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIからなる群から選択される制限エンドヌクレアーゼによって切断可能な少なくとも1つの配列を含む、請求項1に記載の方法。
【請求項16】
エンドヌクレアーゼが、前記第1の核酸内の特定部位を標的とするように構成される、請求項1に記載の方法。
【請求項17】
前記閾値サイズが1キロベースである、請求項1に記載の方法。
【請求項18】
前記第1の核酸と前記第2の核酸が、一本鎖DNA、二本鎖DNA、一本鎖RNA、二本鎖RNA、cDNA、合成DNA、人工DNA、およびDNA/RNAハイブリッドのうちのいずれか1つを含む、請求項1に記載の方法。
【請求項19】
前記第2の核酸を増幅する工程をさらに含む、請求項1に記載の方法。
【請求項20】
前記第2の核酸をシーケンシングする工程をさらに含む、請求項1に記載の方法。
【請求項21】
前記第2の核酸をシーケンシングする工程が、第2世代シーケンシング法によって行われる、請求項20に記載の方法。
【請求項22】
前記第2の核酸をシーケンシングする工程が、ナノポアシーケンシング法を含む、請求項20に記載の方法。
【請求項23】
前記第1の核酸が、ヒト由来の核酸を含む、請求項1に記載の方法。
【請求項24】
前記第1の核酸が、宿主核酸、反復核酸、セントロメア核酸、トランスポゾン、またはAlu要素を含む、請求項1に記載の方法。
【請求項25】
前記第2の核酸が、マイクロバイオーム核酸、腫瘍形成性の核酸、共生生物核酸、半数体ゲノムのシングルコピー領域、または病原体由来の核酸を含む、請求項1に記載の方法。
【請求項26】
前記病原体は、ウイルス、細菌、真菌、および原生動物から成る群から選択される、請求項25に記載の方法。
【請求項27】
前記第2の核酸をシーケンシングし、および病原体のタイプを求める工程を含む、請求項25に記載の方法。
【請求項28】
前記第2の核酸が腫瘍由来の核酸を含む、請求項1に記載の方法。
【請求項29】
前記試料が、唾液、血液、血漿、血清、粘膜、便、尿、脳脊髄液(CSF)、皮膚、組織、および骨から選択される、請求項1に記載の方法。
【請求項30】
第1の核酸と第2の核酸の混合物を含む組成物であって、ここで前記第1の核酸と前記第2の核酸は、3’末端および5’末端においてキャップされ、ここで前記第1の核酸はエンドヌクレアーゼに対して複合体化され、および前記第2の核酸はエンドヌクレアーゼに対して複合体化されない、組成物。
【請求項31】
前記エンドヌクレアーゼが、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-gRNA複合体、ジンクフィンガーヌクレアーゼ(ZFN)、および転写活性化因子様エフェクターヌクレアーゼから選択される少なくとも1つを含む、請求項30に記載の組成物。
【請求項32】
前記エンドヌクレアーゼが、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-ガイドRNA(gRNA)複合体を含む、請求項30に記載の組成物。
【請求項33】
前記gRNAが、1つの末端のみにキャップされた切断された第1の核酸を生成するように、前記第1の核酸上の少なくとも1つの部位に相補的である、請求項32に記載の組成物。
【請求項34】
前記エンドヌクレアーゼが、Alu特異的制限酵素を含む、請求項30に記載の組成物。
【請求項35】
前記第1の核酸が、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIからなる群から選択される制限エンドヌクレアーゼによって切断可能な少なくとも1つの配列を含む、請求項30に記載の組成物。
【請求項36】
前記第1の核酸は、反復領域、Alu反復、ヒト由来の核酸、宿主核酸、反復核酸、セントロメア核酸、トランスポゾン、またはAlu要素を含む、請求項30に記載の組成物。
【請求項37】
前記第2の核酸が、病原体由来の核酸、腫瘍由来の核酸、マイクロバイオーム核酸、腫瘍形成性の核酸、共生生物核酸、または半数体ゲノムのシングルコピー領域を含む、請求項30に記載の組成物。
【請求項38】
前記病原体が、ウイルス、細菌、真菌、および原虫類から成る群から選択される、請求項37に記載の組成物。
【請求項39】
請求項1から38のいずれか1つの前記第2の核酸分子から富化された核酸分子を含むライブラリ。
【請求項40】
10%未満、8%未満、7%未満、6%未満、5%未満、または2%未満の、第1の核酸を含む、請求項39に記載のライブラリ。
【発明の詳細な説明】
【技術分野】
【0001】
本出願は、2020年8月12日に出願された米国仮特許出願第63/064,833号の利益を主張し、当該文献は参照によってその全体が本明細書中に組み込まれる。
【背景技術】
【0002】
本明細書中の開示は、試料由来の標的核酸を除去し、試料由来の目的の配列について富化し、および/または試料由来の配列を分割するための方法および組成物などの、分子生物学の分野に関する。方法および組成物は、生体、臨床、法医学、および環境的試料に応用可能である。
【0003】
組織、体液、または他の宿主物質試料から得られた多くのヒト臨床DNA試料または抽出されたDNA試料は、情報的価値をほとんど持っていない配列を有する大量の核酸を包含し、シーケンシングのコストを増大させる。細胞型の示差溶解などのいくつかの方法は、この問題を扱うために開発されてきたが、これらの方法は、多くの場合時間を消費し、非能率的になり得る。従って、試料中で標的核酸を除去するための、より実行可能な方法を開発する必要がある。
【発明の概要】
【0004】
本明細書において、試料から標的核酸を選択的に除去することができ、試料由来の核酸を分割することができ、および/または試料由来の目的の核酸を富化することができる、方法、組成物、およびシステムが提供される。方法および組成物は、生物、臨床、法医学、および環境の試料に応用可能である。試料からの第1の核酸を除去する方法は、第1の核酸と第2の核酸を含む試料を提供する工程、エキソヌクレアーゼ活性への耐性があるキャップを使用するなどの、第1の核酸と第2の核酸の5’末端と3’末端をキャップする工程、エンドヌクレアーゼ活性を有する部分に試料を接触させて少なくとも1つの切断された第1の核酸を形成する工程であって、ここでエンドヌクレアーゼは第1の核酸を切断するが、第2の核酸を切断しない、工程、および試料をエキソヌクレアーゼに接触させる工程、の1つ以上を含み得る。試料において除去される核酸のいくつかの例として、宿主核酸、試料内の反復領域、トランスポゾン領域、Alu反復、リボソームDNA、高コピー数ミトコンドリアDNA、あるいは高コピー数の配列、または伝達する情報量が低い配列に存在する他の核酸などが挙げられる。他の例も本明細書中の開示と一致し、その結果、任意の高コピーの、余剰な、もしくは望まれない核酸が、試料から選択的に除去される。目的の核酸の例のいくつかとして、限定されないが、宿主試料内の病原体または他の非宿主核酸、腫瘍核酸または突然変異でない素因における他の稀な突然変異核酸、母体の試料中の胎児のDNA、自然発生の安定対立遺伝子、対象の生存中に発生する対立遺伝子が挙げられる。試料またはライブラリ中のあらゆる低コピーの、希少な、またはそれ以外の所望の核酸が、試料中の他の核酸の選択的な除去によって富化されるような、他の例も、本明細書中の開示に一致する。
【0005】
態様として本明細書に提供されるのは、シーケンシングライブラリなどのライブラリを調製する方法である。いくつかの実施形態では、方法は、多数の核酸分子を含む試料を提供することを含み、ここで多数の核酸分子は第1の核酸と第2の核酸を含む。いくつかの実施形態では、方法は、閾値サイズより小さい核酸断片を試料から取り除くことを含む。いくつかの実施形態では、方法は、第1の核酸を切断するエンドヌクレアーゼに試料を接触させる工程を含む。いくつかの実施形態では、方法は、エキソヌクレアーゼ消化され、切断された、第1の核酸を生成するために、前工程からの試料をエキソヌクレアーゼに接触させる工程を含む。いくつかの実施形態では、方法は、閾値サイズより大きい多数の核酸分子の一部を含むライブラリを生成する工程を含む。いくつかの実施形態では、エンドヌクレアーゼは、複数の切断された第1の核酸を生成するように構成される。いくつかの実施形態では、エキソヌクレアーゼ消化され、切断された、第1の核酸分子は、閾値サイズより小さい。いくつかの実施形態では、方法は、第1および第2の核酸をエキソヌクレアーゼ消化に対して耐性にするために、第1の核酸と第2の核酸の5’末端または3’末端を修飾する工程をさらに含む。いくつかの実施形態では、修飾する工程は、第1の核酸と第2の核酸の5’末端および3’末端に1つまたは複数のアダプターを付加することを含む。いくつかの実施形態では、1つまたは複数のアダプターは、ヘアピンアダプター、環状アダプター、または線形アダプターを含む。いくつかの実施形態では、線形アダプターは、ホスホロチオエート、2-Oメチル、インバーテッドdT(inverted dT)、インバーテッドddT(inverted ddT)、リン酸化、およびC3スペーサからなる群から選択される。いくつかの実施形態では、修飾する工程は、第1の核酸と第2の核酸の5’末端および/または3’末端を化学的に修飾することを含む。いくつかの実施形態では、エンドヌクレアーゼは、第1の核酸上の少なくとも1つの部位に特異的な制限酵素である。いくつかの実施形態では、切断された第1の核酸は、アダプターに付加されている第1の末端、およびアダプターに付加されていない第2の末端を有する。いくつかの実施形態では、切断された第1の核酸は、修飾される第1の末端と、修飾されない第2の末端とを有する。いくつかの実施形態では、エンドヌクレアーゼは、Clustered Regulatory Interspaced Short Palindromic Repeat(クラスター化され規則的に間隔を置かれた短い回文反復)(CRISPR)/Casシステムタンパク質-ガイドRNA(gRNA)複合体、ジンクフィンガーヌクレアーゼ(ZFN)、および転写活性化因子様エフェクターヌクレアーゼ(Transcription activator like effector nucleases)から選択される少なくとも1つを含む。いくつかの実施形態では、gRNAsは、1つの末端のみにキャップされた切断された第1の核酸を生成するように、第1の核酸上の少なくとも1つの部位に相補的である。いくつかの実施形態では、エンドヌクレアーゼは、Alu特異的制限酵素を含む。いくつかの実施形態では、第1の核酸は、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIからなる群から選択される制限エンドヌクレアーゼによって切断可能な少なくとも1つの配列を含む。いくつかの実施形態では、エンドヌクレアーゼは、第1の核酸内の特定部位を標的とするように構成される。いくつかの実施形態では、閾値サイズは1キロベースである。いくつかの実施形態では、第1および第2の核酸は、一本鎖DNA、二本鎖DNA、一本鎖RNA、二本鎖RNA、cDNA、合成DNA、人工DNA、およびDNA/RNAハイブリッドのうちのいずれか1つを含む。いくつかの実施形態では、方法は、第2の核酸を増幅する工程をさらに含む。いくつかの実施形態では、方法は、第2の核酸をシーケンシングする工程をさらに含む。いくつかの実施形態では、第2の核酸をシーケンシングする工程は、第2世代シーケンシング法によって行われる。いくつかの実施形態では、第2の核酸をシーケンシングする工程は、ナノポアシーケンシング法を含む。いくつかの実施形態では、第1の核酸は、ヒト由来の核酸を含む。いくつかの実施形態では、第1の核酸は、宿主核酸、反復核酸、セントロメア核酸、トランスポゾン、またはAlu要素を含む。いくつかの実施形態では、第2の核酸は、マイクロバイオーム核酸、腫瘍形成性の核酸、共生生物核酸、半数体ゲノムのシングルコピー領域、または病原体由来の核酸を含む。いくつかの実施形態では、病原体は、ウイルス、細菌、真菌、および原生動物から成る群から選択される。いくつかの実施形態では、方法は、第2の核酸をシーケンシングして病原体のタイプを判定する工程を含む。いくつかの実施形態では、第2の核酸は、腫瘍由来の核酸を含む。いくつかの実施形態では、試料は、唾液、血液、血漿、血清、粘膜、便、尿、脳脊髄液(CSF)、皮膚、組織、および骨から選択される。
【0006】
他の態様では、第1の核酸と第2の核酸の混合物を含む組成物が提供される。いくつかの実施形態では、第1の核酸および第2の核酸は、3’末端および5’末端にてキャップされ、およびここで第1の核酸はエンドヌクレアーゼに対して複合体化され、および第2の核酸はエンドヌクレアーゼに対して複合体化されない。いくつかの実施形態では、エンドヌクレアーゼは、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-gRNA複合体、ジンクフィンガーヌクレアーゼ(ZFN)、および転写活性化因子様エフェクターヌクレアーゼから選択される少なくとも1つを含む。いくつかの実施形態では、エンドヌクレアーゼは、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-ガイドRNA(gRNA)複合体を含む。いくつかの実施形態では、gRNAは、1つの末端のみにキャップされた切断された第1の核酸を生成するように、第1の核酸上の少なくとも1つの部位に相補的である。いくつかの実施形態では、エンドヌクレアーゼは、Alu特異的制限酵素を含む。いくつかの実施形態では、第1の核酸は、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIからなる群から選択される制限エンドヌクレアーゼによって切断可能な少なくとも1つの配列を含む。いくつかの実施形態では、第1の核酸は、反復領域、Alu反復、ヒト由来の核酸、宿主核酸、反復核酸、セントロメア核酸、トランスポゾン、またはAlu要素を含む。いくつかの実施形態では、第2の核酸は、病原体由来の核酸、腫瘍由来の核酸、マイクロバイオーム核酸、腫瘍形成性の核酸、共生生物核酸、または半数体ゲノムのシングルコピー領域を含む。いくつかの実施形態では、病原体は、ウイルス、細菌、真菌、および原虫類から成る群から選択される。
【0007】
本明細書において、第1の核酸および第2の核酸を含む試料由来の選択的な核酸分子を含むライブラリを調製する方法が提供され、上記方法は、(a)第1の核酸と第2の核酸を含む試料を提供する工程、(b)試料を、閾値サイズより小さい核酸断片を試料から取り除く処理にかける工程、(c)第1の核酸および第2の核酸をエンドヌクレアーゼに曝露して、少なくとも1つの切断された第1の核酸を形成する工程であって、ここでエンドヌクレアーゼは第1の核酸を切断するが、第2の核酸を切断しない、工程、(d)工程(c)からの試料をエキソヌクレアーゼに接触させてエキソヌクレアーゼ消化された核酸分子を生成する工程、(e)閾値サイズよりも大きな、エキソヌクレアーゼ消化された核酸分子を富化し、および富化された核酸分子を含むライブラリを生成する工程を含む。いくつかの実施形態では、エンドヌクレアーゼは、複数の切断された第1の核酸を生成するように構成される。いくつかの実施形態では、エキソヌクレアーゼ消化された核酸分子は、第1の核酸由来の核酸分子を含み、ここで第1の核酸由来の核酸分子は閾値サイズよりも小さい。いくつかの実施形態では、ライブラリは、10%未満、8%未満、7%未満、6%未満、5%未満、または2%未満、第1の核酸を含む。
【0008】
本明細書では、一定の態様において、試料から第1の核酸を除去する方法が提供される。いくつかの場合では、本明細書の方法は、第1の核酸と第2の核酸を含む試料を提供する工程、第1の核酸と第2の核酸の5’末端と3’末端をキャップする工程、およびエンドヌクレアーゼに試料を接触させて、少なくとも1つの切断された第1の核酸を形成する工程であって、ここでエンドヌクレアーゼは、第1の核酸を切断するが、第2の核酸を切断しない、工程を含む。いくつかの場合では、本明細書の方法は、試料をエキソヌクレアーゼに接触させる工程を含む。いくつかの場合では、キャップする工程は、第1の核酸と第2の核酸の5’末端または3’末端を修飾して、第1および第2の核酸をエキソヌクレアーゼ分解に対して耐性にすることを含む。いくつかの場合では、キャップする工程は、第1の核酸および第2の核酸の5’末端および3’末端に1つまたは複数のアダプターを付加することを含む。いくつかの場合では、アダプターは、ヘアピンまたは線形のアダプターである。いくつかの場合では、線形アダプターは、ホスホロチオエート、2-Oメチル、インバーテッドdT(inverted dT)、インバーテッドddT(inverted ddT)、リン酸化、およびC3スペーサからなる群から選択される。いくつかの場合では、エンドヌクレアーゼは、第1の核酸上の少なくとも1つの部位に特異的な制限酵素である。いくつかの場合では、エンドヌクレアーゼは、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-ガイドRNA(gRNA)複合体、ジンクフィンガーヌクレアーゼ(ZFN)、および転写活性化因子様エフェクターヌクレアーゼ(Transcription activator like effector nucleases)から選択される少なくとも1つを含む。いくつかの場合では、gRNAsは、1つの末端のみにキャップされた切断された第1の核酸を生成するように、第1の核酸上の少なくとも1つの部位に相補的である。いくつかの場合では、エンドヌクレアーゼは、Alu特異的制限酵素を含む。いくつかの場合では、第1の核酸は、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIからなる群から選択される、少なくとも1つの核酸に対してマッピングする少なくとも1つの配列を含む。いくつかの場合では、切断された第1の核酸は、1つの末端のみにおいてキャップされている。いくつかの場合では、切断された第1の核酸は、アダプターに付加されている第1の末端、およびアダプターに付加されていない第2の末端を有する。いくつかの場合では、方法は、試料から第1の核酸と第2の核酸を抽出する工程、および、第1の核酸と第2核酸を精製する工程を含む。いくつかの場合では、第1の核酸と第2の核酸は、一本鎖DNA、二本鎖DNA、一本鎖RNA、二本鎖RNA、cDNA、合成DNA、人工DNA、およびDNA/RNAハイブリッドのうちのいずれか1つを含む。いくつかの場合では、方法は、第2の核酸を増幅する工程を含む。いくつかの場合では、方法は、第2の核酸をシーケンシングする工程を含む。いくつかの場合では、方法は、第2の核酸を、第2世代シーケンシング法によってシーケンシングする工程を含む。いくつかの場合では、方法は、第2の核酸を、ナノポアシーケンシング法によってシーケンシングする工程を含む。いくつかの場合では、第1の核酸は、ヒト由来の核酸を含む。いくつかの場合では、第1の核酸は、宿主核酸を含む。いくつかの場合では、第1の核酸は、反復核酸を含む。いくつかの場合では、第1の核酸は、セントロメア核酸を含む。いくつかの場合では、第1の核酸は、トランスポゾンを含む。いくつかの場合では、第1の核酸は、Alu要素を含む。いくつかの場合では、第2の核酸は、マイクロバイオーム核酸を含む。いくつかの場合では、第2の核酸は、発癌性核酸を含む。いくつかの場合では、第2の核酸は、共生体核酸を含む。いくつかの場合では、第2の核酸は、半数体ゲノムのシングルコピー領域を含む。いくつかの場合では、第2の核酸は、病原体由来の核酸を含む。いくつかの場合では、病原体は、ウイルス、細菌、真菌、および原生動物から成る群から選択される。いくつかの場合では、方法は、第2の核酸をシーケンシングし、および病原体のタイプを判定する工程を含む。いくつかの場合では、第2の核酸は、腫瘍由来の核酸を含む。いくつかの場合では、試料は、唾液、血液、血漿、血清、粘膜、便、尿、脳脊髄液(CSF)、皮膚、組織、および骨から選択される。
【0009】
本明細書において、一定の態様において、第1の核酸と第2の核酸との混合物を含む組成物がさらに提供され、ここで第1の核酸と第2の核酸は、3’末端と5’末端においてキャップされ、および、ここで第1の核酸はエンドヌクレアーゼに対して複合体化され、および第2の核酸はエンドヌクレアーゼに対して複合体化されない。いくつかの場合では、エンドヌクレアーゼは、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-gRNA複合体、ジンクフィンガーヌクレアーゼ(ZFN)、および転写活性化因子様エフェクターヌクレアーゼから選択される少なくとも1つを含む。いくつかの場合では、エンドヌクレアーゼは、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-ガイドRNA(gRNA)複合体を含む。いくつかの場合では、gRNAは、1つの末端のみにキャップされた切断された第1の核酸を生成するように、第1の核酸上の少なくとも1つの部位に相補的である。いくつかの場合では、エンドヌクレアーゼは、Alu特異的制限酵素を含む。いくつかの場合では、第1の核酸は、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIからなる群から選択される、少なくとも1つの核酸に対してマッピングする少なくとも1つの配列を含む。いくつかの場合では、第1の核酸は、反復領域を含む。いくつかの場合では、第1の核酸は、Alu反復を含む。いくつかの場合では、第1の核酸は、ヒト由来の核酸を含む。いくつかの場合では、第2の核酸は、病原体由来の核酸を含む。いくつかの場合では、病原体は、ウイルス、細菌、真菌、および原虫類から成る群から選択される。いくつかの場合では、第2の核酸は、腫瘍由来の核酸を含む。いくつかの場合では、第1の核酸は、宿主核酸を含む。いくつかの場合では、第1の核酸は、反復核酸を含む。いくつかの場合では、第1の核酸は、セントロメア核酸を含む。いくつかの場合では、第2の核酸は、マイクロバイオーム核酸を含む。いくつかの場合では、第2の核酸は、発癌性核酸を含む。いくつかの場合では、第2の核酸は、共生体核酸を含む。いくつかの場合では、第2の核酸は、半数体ゲノムのシングルコピー領域を含む。いくつかの場合では、第1の核酸は、トランスポゾンを含む。いくつかの場合では、第1の核酸は、Alu要素を含む。
【0010】
他の態様では、上記実施形態のいずれか1つによる第2の核酸分子から富化された核酸分子を含むライブラリが提供される。いくつかの実施形態では、ライブラリは、10%未満、8%未満、7%未満、6%未満、5%未満、または2%未満の、第1の核酸を含む。
【図面の簡単な説明】
【0011】
本発明の諸原則が利用される例示的な実施形態について説明する以下の詳細な記載と、添付の図面を参照することで、本発明の特徴および利点についてのいくらかの理解が得られるであろう。
図1】例示的な第1の核酸の除去、および第2の核酸の富化のワークフローを表す。
図2】ヒトゲノムにおけるAlu配列のマップを表す。
図3A】pBR322プラスミドにおける試験ガイドRNAを表す。
図3B図3Bは、消化物を示している代表的なアガロースゲルを示す。マーカー 1Kb 1KbプラスDNAラダー100ng、レーン1 切断されていないpBR322プラスミド50ng、レーン2 EcoRV-HFで消化されたpBR322プラスミド、レーン3 「EcoRV」RNAガイドを使用してリボ欠失(ribodepleted)されたpBR322 50ng、レーン4 「2069」RNAガイドを使用してリボ欠失されたpBR322 50ng。
図4A】除去実験の典型的なワークフローを表す。
図4B】除去実験の典型的なワークフローを表す。
図4C】除去実験の典型的なワークフローを表す。
図5A図5Aおよび図5Bは、pBR322と大腸菌ゲノムDNAを用いた宿主除去実験におけるリード(read)の相対存在量を示すデータを表す。
図5B図5Aおよび図5Bは、pBR322と大腸菌ゲノムDNAを用いた宿主除去実験におけるリードの相対存在量を示すデータを表す。
図6A図6Aおよび図6Bは、pBR322と大腸菌ゲノムDNAを用いた宿主除去実験における大腸菌ゲノムのカバレッジを示すデータを表す。
図6B図6Aおよび図6Bは、pBR322と大腸菌ゲノムDNAを用いた宿主除去実験における大腸菌ゲノムのカバレッジを示すデータを表す。試料b1および試料b2は、エキソヌクレアーゼがない実験の対照群を表し(除去なし)、試料c1および試料c2は、CRISPRがない実験の対照群を表し(除去なし)、および、試料e1および試料e2は、エキソヌクレアーゼとCRISPRを用いて除去が行われた実験群を表す。
【発明を実施するための形態】
【0012】
本明細書に開示されるのは、複数の核酸、例えば、第1の核酸と第2の核酸などを含む試料の中の第1の核酸を除去し、および/または第2の核酸を富化するための方法、システム、および組成物である。いくつかの場合では、第1の核酸は宿主核酸であり、本明細書に記載の方法は、宿主を除去するための方法に関する。本明細書に記載の方法は、独立して、または組み合わせて実行される以下の工程:a)試料中の第1および第2の核酸分子を、エキソヌクレアーゼを介して分解に対する免疫を付与して、保護する工程、b)第1の核酸(例えば、宿主核酸、宿主DNA、宿主ゲノム、宿主cDNA、宿主RNA)のみに見出される配列モチーフのエンドヌクレアーゼ消化を行う工程、c)エンドヌクレアーゼ消化によって作り出された露出末端のエキソヌクレアーゼ消化を行い、それにより第1の核酸(例えば、宿主核酸、宿主DNA、宿主ゲノム、宿主cDNA、宿主RNA)を分解する工程のうち、1つ以上を含み得る。残るインタクトな第2の核酸(例えば、非宿主核酸)は、標準のライブラリ調製を受ける。得られたライブラリはシーケンシングされ、第1の核酸が病原体由来であるとき、病原体が同定され得る。これにより、新規な病原体と既知の病原体の両方を単一のワークフローで検出することが可能になる。
【0013】
本明細書中の開示を実施することにより、選択的に目的の核酸を富化し、および/または、試料から目的外の核酸を選択的に除去することができ、これによって試料の中の病原体、腫瘍、胎児、特異的な対立遺伝子、および他の目的の核酸をより精密かつ効率的に検出することができる。
【0014】
病原体検出の一例を見ると、全ゲノムシーケンシング、またはショットガンシーケンシングは、病原体を検出するための有望な解決策を提供する。多くの試料タイプが大量の宿主分子を包含して宿主試料中に存在する病原体核酸を検出するためのショットガンシーケンシングの感度を制限するため、病原体、または宿主由来核酸試料上の他の外因性組織体に由来する分子など、試料中の希少な分子を表すリードを得るために生成される必要がある配列の量を増大させることが、課題となり得る。同様の課題は、目的外の核酸の多くのコピーも含む試料中のあらゆる希少な又は単一コピーの核酸の同定においても存在する。病原体検出は、感染症の大流行、免疫力が低下した個体における病原体の検出、血液バンクにおける病原体の検出、獣医学または農業試料の中の病原体の検出、農業試料における植物病原菌の検出、唾液試料からの細菌性汚染因子の除去、ミトコンドリア核酸の除去、あるいは葉緑体核酸の除去を含むが、これらに限定されない、多くの用途に使用することができる。
【0015】
これらの課題に取り組むためにいくつもの試料調製アプローチが提案されてきた。細胞型の示差溶解が記述されている。例えば、ヒト細胞は、1つの溶解方法を介して溶解され、それらの細胞由来のDNAは、エキソヌクレアーゼを介して分解され、続いて残った非ヒト細胞が溶解されて、シーケンシングのために調製される。病原体DNAよりもヒトDNAにおいて豊富であるメチル化DNAを分解することを目的とする、別の方法も記述されている。これらのアプローチは、特定の細胞型または核酸修飾に特異的である。
【0016】
ゲノム断片化などの代替的アプローチが記述されている。これらの方法は、ライブラリ生成後に宿主DNA/cDNA分子を消化するために、CRISPRガイドRNAのプールを使用する。このアプローチは、単純かつ速やかで、コスト効率が良い。しかし、CRISPRエンドヌクレアーゼを配向して特定のシーケンシングライブラリにおいて二本鎖切断を生じさせ、ユニバーサルアダプター配列を介してそれらが増幅をできなくなるようにするには、大量のガイドが必要である。
【0017】
本明細書において、広範囲の試料に対して容易に実施され、かつ除去に増幅を必要としない、選択的な標的富化または選択的なバックグラウンド除去のための組成物および方法が提供される。
【0018】
図1は、第1の核酸(例えば、宿主核酸)を除去し、第2の核酸(例えば、非宿主核酸)を富化するための工程の例を示す。核酸Aは第1の核酸(例えば、宿主DNA分子、余剰な試料核酸、または除去されるべき他の核酸)を表し、核酸Bは、第2の核酸(例えば、病原体DNA分子、対立遺伝子、癌突然変異核酸、ゲノムの高情報量セグメント、または目的外核酸)を表す。Cは、核酸にエキソヌクレアーゼ分解に対する耐性を持たせる核酸末端保護(ヘアピン、環状、もしくはそれ以外の方法で修飾された末端を含む化学修飾、ライゲーション、またはタグ付け)の例を示し、およびDは、標的化除去を容易にする第1の核酸の特異的なエンドヌクレアーゼ認識部位(例えば、制限酵素(RE)、CRISPR相補部位、または他の部位)を示す。Eは、エンドヌクレアーゼ消化の後の、切断された第1の核酸の露出された末端を示し、およびFは、切断された第1の核酸のエキソヌクレアーゼ消化を示す。図1に示される工程の後、第2の核酸、または切断部位の不在を共通の形質として共有する核酸の集団(すなわち、本明細書に記載の、非宿主DNA、非冗長DNA、またはゲノムの高情報量セグメントなどの、切断部位を欠いている核酸)だけが、試料中に残る。いくつかの場合では、エキソヌクレアーゼはExonuclease IIIまたはBAL-31であるが、多くのエキソヌクレアーゼが本明細書中の開示に適合する。
【0019】
様々な核酸供給源の試料が、本明細書中の開示に適合する。いくつかの試料は、出発物質として、異種混合のDNA(例えば、ゲノムDNA、cDNAなど)、RNA、またはRNA/DNA組成物である。従って、本明細書において開示されるのは、RNAとDNAを含む全核酸のサンプルから一定の核酸を富化する、または除去する方法である。RNAは、第1に二本鎖cDNAに変換される。二本鎖cDNAおよびゲノムDNA分子の両方は、それらをエキソヌクレアーゼ分解に対して耐性にするための末端アダプターの添加によって、または1つ以上の化学修飾によって、保護することができる。cDNAとDNA分子は、第1の核酸(例えば、宿主核酸、望まれない核酸、低情報量の核酸、反復核酸、または除去されるべき他の核酸)の特異的な配列モチーフを切断するために、本明細書の記載どおり、エンドヌクレアーゼ消化にかけられる。無保護の、エンドヌクレアーゼ消化された第1の核酸の露出された末端は、エキソヌクレアーゼ消化によって切断された断片を分解するためのエントリー点として振る舞う。残った切断されていない「第2の核酸」の分子は、シーケンシングライブラリに変換され、シーケンシングされ、およびデータは、試料中に存在する、例えば、病原体または癌などの、富化された核酸を同定するために分析される。
【0020】
標的核酸を除去して目的の核酸を富化するために、多くの配列特異的な切断アプローチが使用され得る。ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、およびClustered Regulatory Interspaced Short Palindromic Repeat /CasベースのRNAガイドDNAヌクレアーゼ(CRISPR、例えばCas9、Cas3、Cas1、および他のCas RNAガイドヌクレアーゼ)を含むこれらの技術により、二本鎖DNAの配列特異的な消化が可能になる。代替的に、制限エンドヌクレアーゼ、特に、除去されるべき特定の領域を標的としつつ好適に他の核酸分子を切断されないままにする切断特異性を有する制限エンドヌクレアーゼも、本明細書中の開示に適合する。いくつかの実施形態では、Alu制限エンドヌクレアーゼなどの反復領域特異的なエンドヌクレアーゼあるいは他のトランスポゾンまたは反復領域特異的なエンドヌクレアーゼが、試料由来の対応する核酸を除去するために選択される。これらの技術は、例えば、1つ以上の部位で第1の核酸を切断して、エキソヌクレアーゼ分解に利用可能な露出された末端または露出された末端のセットを生成するために使用することができる。二本鎖DNA切断のために特定の位置の配列を標的化する能力によって、これらのゲノム編集ツールは、試料中の冗長な又は望まれない標的核酸の除去に適合する。
【0021】
一態様では、選択的な除去にかけられる試料は、第1の核酸と第2の核酸の配列を含む。いくつかの実施形態では、標的試料は、非反復配列と反復配列を含む。いくつかの実施形態では、標的試料は、シングルコピー配列とマルチコピー配列を含む。いくつかの場合では、標的試料は、疾病(例えば、癌)に関連づけられる対立遺伝子などの、目的の遺伝学的な変種の対立遺伝子を含む。いくつかの場合では、宿主試料は、例えば、ゲノムの反復領域を選択的に除去しつつ高情報量の領域を分解されないままにすることによって選択的に富化されるように、断片化され、および、分解される。いくつかの実施形態では、試料は、限定されないが、血液、血清、血漿、鼻スワブ(nasal swab)または鼻咽頭洗浄液、唾液、尿、胃液、髄液、涙、便、粘液、汗、耳垢、油、腺分泌物、脳脊髄液、組織、精液、膣液、腫瘍組織由来の間質液を含む間質液、眼液、髄液、咽頭スワブ、息、毛、指の爪、皮膚、生検標本、胎盤液、羊水、臍帯血、強調液(emphatic fluids)、腔液、痰、膿、細菌叢、胎便、母乳、および/または他の排泄物を含む。いくつかの場合では、血液サンプルは、循環腫瘍細胞、あるいは腫瘍DNAまたは胎児のDNAなどの、無細胞DNAを含む。
【0022】
本明細書において、試料中の、病原体核酸、共生生物核酸、マイクロバイオーム核酸、高情報量領域、癌対立遺伝子、または他の目的の核酸の選択的な富化などの、目的の核酸の選択的な富化に関する、方法、組成物、およびキットが提供される。
【0023】
いくつかの場合では、第1の核酸は宿主由来である。いくつかの場合では、第1の核酸は、ヒト、ウシ、ウマ、ヒツジ、ブタ、サル、イヌ、ネコ、アレチネズミ、鳥、マウス、およびラットなどの哺乳動物、あるいは疾患、疾病、または希少な核酸が関与する他の現象についての任意の哺乳動物実験モデルからなる群から選択される1つ以上の宿主に由来する。いくつかの場合では、第1の核酸はヒト由来である。第2の核酸、例えば、目的の核酸の例のいくつかは、病原体、マイクロバイオーム、腫瘍、母体試料中の胎児のDNA、対立遺伝子、および突然変異対立遺伝子に由来し得る。いくつかの場合では、第2の核酸は、非宿主由来である。いくつかの場合では、第2の核酸が原始核生物からである。いくつかの場合では、第2の核酸は、真核生物、ウイルス、細菌、真菌、および原生動物からなる群から選択される1以上に由来する。いくつかの実施形態では、第2の核酸は、腫瘍細胞由来であり得る。いくつかの実施形態では、第2の核酸は、母体試料中の胎児のDNAであり得る。いくつかの実施形態では、第2の核酸は、対立遺伝子または突然変異対立遺伝子であり得る。マイクロバイオームもまた、当業者にとって明白な他の例と同様に、本明細書中の開示と一致する第2の核酸の供給源である。
【0024】
いくつかの場合では、第1の核酸と第2の核酸は、エキソヌクレアーゼ消化から末端を保護するために、5’末端および3’末端においてキャップされる。いくつかの実施形態では、第1の核酸と第2の核酸は、アダプターの付加によりキャップされる。いくつかの実施形態では、付加はライゲーションを含む。いくつかの実施形態では、第1の核酸と第2の核酸は、5’末端および3’末端において化学修飾によりキャップされる。いくつかの実施形態では、キャップはホスホロチオエートを含む。いくつかの実施形態では、キャップは、2’-O-修飾されたリボース、2’-Oメチルヌクレオシド、または2’-O-メトキシエチルヌクレオシドなどの、2’修飾されたヌクレオシドを含む。いくつかの実施形態では、キャップは、反転dT修飾を含む。核酸の末端をキャップして保護する付加的な方法は、本明細書の他の箇所で提供される。
【0025】
いくつかの場合では、第1の核酸は、約10bpから約1000bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第2の核酸は、約10bpから約1000bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第1の核酸は、約25bpから約1000bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第2の核酸は、約25bpから約1000bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第1の核酸は、約50bpから約1000bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第2の核酸は、約50bpから約1000bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第1の核酸は、約50bpから約200bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第2の核酸は、約50から約200bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第1の核酸は、約25bpから約200bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第2の核酸は、約25bpから約200bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第1の核酸は、約10bpから約200bpまでの範囲のサイズを有するアダプターでキャップされる。いくつかの場合では、第2の核酸は、約10bpから約200bpまでの範囲のサイズを有するアダプターでキャップされる。より小さなアダプターも、本明細書中の開示に一致する。多くのアダプターが、核酸断片に付加されたときにそれらが核酸に対してエキソヌクレアーゼ耐性をもたらす特性を共有する。いくつかの実施形態では、アダプターは改変されたナノポアアダプターである。
【0026】
第1の核酸と第2の核酸を含む試料から目的の核酸を選択的に富化することに関する方法、組成物、およびキットが本明細書に提供され、ここで第2の核酸が目的の核酸である。シーケンシング反応から、または配列データセットから、第1の核酸を選択的に排除するための方法もまた本明細書において提供される。いくつかの実施形態では、第1の核酸は、リボソームRNA(rRNA)をコードする配列、グロビン・タンパク質をコードする配列、トランスポゾンをコードするシーケンシング、レトロウイルスの配列をコードする配列、テロメア配列を含む配列、サブテロメア反復を含む配列、セントロメアの配列を含む配列、イントロン配列を含む配列、Alu反復を含む配列、SINE反復、LINE反復、二核酸(dinucleic acid)反復、三核酸(trinucleic acid)反復、四核酸(tetranucleic acid)反復、ポリA反復、ポリT反復、ポリC反復、ポリG反復、ATリッチ配列、またはGCリッチ配列を含む。
【0027】
いくつかの場合では、第1の核酸は、リボソームRNAをコードするRNAから逆転写された配列、グロビンをコードするRNA、過剰発現転写をコードするRNA、あるいは、試料において不釣り合いな程度に存在するかまたは冗長に存在するRNAを含む。
【0028】
いくつかの実施形態では、第1の核酸配列は、例えば、当該第1の核酸配列に特異的に結合する部分を有するエンドヌクレアーゼを使用して、標的化される。いくつかの実施形態では、複数の部分が、第1の核酸(例えば、宿主核酸)の1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74% 75% 76% 77%、78%、79%、80%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または100%に結合する要素を含む。
【0029】
いくつかの実施形態では、複数の部分が、第1の核酸(例えば、宿主核酸)の1%~100%、2%~100%、3%~100%、4%~100%、5%~100%、6%~100%、7%~100%、8%~100%、9%~100%、10%~100%、11%~100%、12%~100%、13%~100%、14%~100%、15%~100%、16%~100%、17%~100%、18%~100%、19%~100%、20%~100%、21%~100%、22%~100%、23%~100%、24%~100%、25%~100%、26%~100%、27%~100%、28%~100%、29%~100%、30%~100%、31%~100%、32%~100%、33%~100%、34%~100%、35%~100%、36%~100%、37%~100%、38%~100%、39%~100%、40%~100%、41%~100%、42%~100%、43%~100%、44%~100%、45%~100%、46%~100%、47%~100%、48%~100%、49%~100%、50%~100%、51%~100%、52%~100%、53%~100%、54%~100%、55%~100%、56%~100%、57%~100%、58%~100%、59%~100%、60%~100%、61%~100%、62%~100%、63%~100%、64%~100%、65%~100%、66%~100%、67%~100%、68%~100%、69%~100%、70%~100%、71%~100%、72%~100%、73%~100%、74%~100%、75%~100%、76%~100%、77%~100%、78%~100%、79%~100%、80%~100%、81%~100%、82%~100%、83%~100%、84%~100%、85%~100%、86%~100%、87%~100%、88%~100%、89%~100%、90%~100%、91%~100%、92%~100%、93%~100%、94%~100%、95%~100%、96%~100%、97%~100%、98%~100%、99%~100%、または100%に対して結合する要素を含む。
【0030】
いくつかの実施形態では、複数の部分が、第1の核酸(例えば、宿主核酸)の1%、1%~2%、1%~3%、1%~4%、1%~5%、1%~6%、1%~7%、1%~8%、1%~9%、1%~10%、1%~11%、1%~12%、1%~13%、1%~14%、1%~15%、1%~16%、1%~17%、1%~18%、1%~19%、1%~20%、1%~21%、1%~22%、1%~23%、1%~24%、1%~25%、1%~26%、1%~27%、1%~28%、1%~29%、1%~30%、1%~31%、1%~32%、1%~33%、1%~34%、1%~35%、1%~36%、1%~37%、1%~38%、1%~39%、1%~40%、1%~41%、1%~42%、1%~43%、1%~44%、1%~45%、1%~46%、1%~47%、1%~48%、1%~49%、1%~50%、1%~51%、1%~52%、1%~53%、1%~54%、1%~55%、1%~56%、1%~57%、1%~58%、1%~59%、1%~60%、1%~61%、1%~62%、1%~63%、1%~64%、1%~65%、1%~66%、1%~67%、1%~68%、1%~69%、1%~70%、1%~71%、1%~72%、1%~73%、1%~74%、1%~75%、1%~76%、1%~77%、1%~78%、1%~79%、1%~80%、1%~81%、1%~82%、1%~83%、1%~84%、1%~85%、1%~86%、1%~87%、1%~88%、1%~89%、1%~90%、1%~91%、1%~92%、1%~93%、1%~94%、1%~95%、1%~96%、1%~97%、1%~98%、1%~99%、または100%に結合する要素を含む。
【0031】
いくつかの実施形態では、第1の核酸は、試料の中の核酸の全体の1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、81%、82%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、97%、98%、99%、または99%以上を含む。
【0032】
いくつかの実施形態では、試料はヒトゲノムDNA試料である。いくつかの実施形態では、第1の核酸は、サンプルの1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、15%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%を含む。いくつかの実施形態では、第1の核酸は試料の2/3または約2/3を含む。いくつかの実施形態では、第1の核酸は、試料の2/3を含む。
【0033】
いくつかの実施形態では、第1の核酸へ特異的に結合する部分は、第1の核酸に特異的な認識部位において結合して切断する特異的エンドヌクレアーゼなどの、制限エンドヌクレアーゼを含む。いくつかの実施形態では、第1の核酸へ特異的に結合する部分の集団は、少なくとも1つの制限エンドヌクレアーゼ、2つの制限エンドヌクレアーゼ、または2つを超える制限エンドヌクレアーゼを含む。
【0034】
いくつかの実施形態では、第1の核酸に特異的に結合する部分は、ガイドRNA分子を含む。いくつかの実施形態では、第1の核酸に特異的に結合する部分の集団は、第1の核酸に結合するガイド分子の集団などの、ガイドRNA分子の集団を含む。
【0035】
核酸の標的化切断のためのエンドヌクレアーゼ
本明細書に開示される標的化法は、部位特異的な、標的化可能な、および/または操作されたヌクレアーゼもしくはヌクレアーゼ・システムを使用して第1の核酸の切断をする工程を含む。そのようなヌクレアーゼは、ゲノムの、cDNAまたは他の核酸分子の中の所望の位置に二本鎖切断(DSB)を生じ得る。他の例では、ヌクレアーゼは、一本鎖切断を生じ得る。いくつかの場合では、2つのヌクレアーゼが使用され、その各々は一本鎖切断を生成する。本明細書中の開示と調和する多くの切断酵素は、一本鎖か二本鎖のエキソヌクレアーゼ活性のためのアクセス可能な末端を有する分子を産生する形質を共有する。
【0036】
本明細書において、使用されるエンドヌクレアーゼは、第1の核酸上の少なくとも1つの部位に特異的であり、かつ第2の核酸を切断しない、制限酵素であり得る。本明細書に記載のエンドヌクレアーゼは、宿主ゲノムにおける、トランスポゾンまたは他の反復、セントロメア領域あるいは他の反復配列などの、核酸配列に特異的であり得る。例えば、本明細書中の開示と一致するいくつかの制限エンドヌクレアーゼは、Alu特異的な制限酵素である。制限が、Alu特異的、さらに言えば、何らかの標的「特異的」であるのは、それが標的を切断し且つ他の基質を切断しないか、あるいは他の標的を稀にしか切断せず、それにより示差的に当該標的を除去する場合である。切断部位が、試料中に存在する宿主ゲノムまたはトランスクリプトーム上の他の箇所、あるいは病原体または他の希少な核酸において稀に発生するなどのために、非Aluまたは他の非標的の切断があることは、望まれない核酸の示差的除去が達成される限り、エンドヌクレアーゼを「非特異的」にはしない。
【0037】
第1の核酸は制限酵素Alu認識部位を含み得る。第2の核酸はAlu認識部位を含まない。いくつかの実施形態では、第1の核酸は、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIからなる認識部位の群から選択される少なくとも1つの核酸認識部位に対してマッピングする少なくとも1つの配列を含む。いくつかの実施形態では、第2の核酸は、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIの認識部位から選択される認識部位の少なくとも1つを含まない。
【0038】
本明細書中の開示と一致するエンドヌクレアーゼは、Clustered Regulatory Interspaced Short Palindromic Repeat(CRISPR)/Casシステムタンパク質-gRNA複合体、ジンクフィンガーヌクレアーゼ(ZFN)、およびエフェクターヌクレアーゼ(TALEN)のような転写活性化因子から選択される少なくとも1つを様々に含む。いくつかの実施形態では、gRNAsは、1つの末端のみにキャップされた切断された第1の核酸を生成するように、第1の核酸上の少なくとも1つの部位に相補的である。他のプログラム可能な、核酸配列特異的なエンドヌクレアーゼも、本明細書中の開示に一致する。
【0039】
ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ(TALEN)、操作されたホーミングエンドヌクレアーゼ、および、Cas1、Cas3,Cas9などのCRISPR/Cas9、またはCPF1などの、RNA若しくはDNAでガイドされるエンドヌクレアーゼ、および/またはアルゴノートシステム(Argonaute systems)などの、操作されたヌクレアーゼは、本開示の方法のうちのいくつかを実行するのに特に適切である。付加的に、または代替的に、c2c2ヌクレアーゼを含むCRISPR/Casシステムなどの、RNAを標的とするシステムが使用されてもよい。
【0040】
本明細書中に開示される方法は、Type I、Type II、Type III、Type IV、Type V、またはType VI CRISPRシステムなどの、CRISPRシステムを使用して、標的核酸を切断する工程を含む場合がある。CRISPR/Casシステムは、多タンパク質システムまたは単一エフェクタータンパク質システムであってよい。多タンパク質の、またはクラス1の、CRISPRシステムは、Type I、Type III、およびType IVシステムを含む。あるいは、クラス2システムは、単一のエフェクター分子を含み、およびType II、Type V、およびType VIを含む。
【0041】
本明細書中に開示されるいくつかの方法で使用されるCRISPRシステムは、単一または多数のエフェクタータンパク質を含む場合がある。エフェクタータンパク質は、1つまたは多数のヌクレアーゼドメインを含む場合がある。エフェクタータンパク質は、DNAまたはRNAを標的とする場合があり、およびDNAまたはRNAは、一本鎖の場合も二本鎖場合もある。エフェクタータンパク質は、二本鎖切断または一本鎖切断を生成する場合がある。エフェクタータンパク質がヌクレアーゼドメインにおける変異を含み、それによりニッカーゼタンパク質を生成する場合がある。エフェクタータンパク質は、1つ以上のヌクレアーゼドメインにおいて変異を含み、それにより、標的配列に結合できるが切断することができない触媒現象的に不活性のヌクレアーゼを生成する場合がある。CRISPRシステムは、単一または多数のガイドRNAを含む場合がある。gRNAは、crRNAを含み得る。gRNAは、crRNAとtracrRNAの配列を有するキメラRNAを含む場合がある。gRNAは、別個のcrRNAおよびtracrRNAを含む場合がある。ターゲット核酸配列は、プロトスペーサ隣接モチーフ(protospacer adjacent motif)(PAM)またはプロトスペーサ側方部位(protospacer flanking site)(PFS)を含む場合がある。PAMまたはPFSは、標的またはプロトスペーサ部位の3’または5’であり得る。標的配列の切断は、平滑末端、3’オーバーハング、または5’オーバーハングを生成する場合がある。いくつかの場合では、標的核酸は、PAMまたはPFSを含まない。
【0042】
gRNAは、スペーサ配列を含む場合がある。スペーサ配列は、標的配列またはプロトスペーサ配列に相補的な場合がある。スペーサ配列は、長さが10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、または36ヌクレオチドであり得る。いくつかの例では、スペーサ配列は、長さが10ヌクレオチド未満または36ヌクレオチド超であり得る。
【0043】
gRNAは、反復配列を含む場合がある。いくつかの場合では、反復配列は、gRNAの二本鎖部分の一部である。反復配列は、長さが10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドであり得る。いくつかの例では、スペーサ配列は、長さが10ヌクレオチド未満、または50ヌクレオチド超であり得る。
【0044】
gRNAは、1つ以上の合成ヌクレオチド、非自然発生のヌクレオチド、修飾があるヌクレオチド、デオキシリボヌクレオチド、またはそれらの任意の組み合わせを含み得る。付加的に、または代替的に、gRNAは、ヘアピン、リンカー領域、一本鎖領域、二本鎖領域、またはそれらの任意の組み合わせを含み得る。付加的に、または代替的に、gRNAは、シグナル分子またはリポーター分子を含み得る。
【0045】
CRISPRヌクレアーゼは、内発的にまたは組み換え的に発現される場合がある。CRISPRヌクレアーゼは、染色体上に、染色体外に、またはプラスミド、合成染色体、または人工染色体上に、コードされる場合がある。CRISPRヌクレアーゼは、ポリペプチドまたはポリペプチドをコードするmRNAとして提供される場合がある。そのような例では、ポリペプチドまたはmRNAは、細胞浸透性ペプチド、ナノ粒子、またはウイルス粒子の使用によるなどの、当該技術分野において既知の標準的な手段によって送達される場合がある。
【0046】
gRNAsは、遺伝学的かエピゾームのDNAによってコードされる場合がある。gRNAsは、CRISPRヌクレアーゼに付随して、または連続して、提供あるいは送達され得る。ガイドRNAは、化学的に合成されるか、あるいはインビトロで転写されるか、さもなければ当該技術分野において既知の標準的なRNA生成技術を使用して生成され得る。
【0047】
CRISPRシステムは、限定されないがCas3システムを含む、Type I CRISPRシステムであり得る。例えば、多構成のCRISPR CAS タイプIシステムが、第1の核酸上のCRISPR標的部位からの、大きな単向性の除去を引き起こすために使用される。いくつかの場合、この処理はエキソヌクレアーゼを必要とせずに特定の断片を分解する。このCRISPR CAS タイプIシステムは、DNAにおける二本鎖切断を生じさせ、次に、鎖のうちの1つを単向的に消化する。ライブラリ構築に先立って使用される場合、一本鎖特異的エキソヌクレアーゼは、第1の核酸(例えば、宿主DNA)を分解するために、組み合わされ得る。ライブラリ構築後に使用される場合、それは一本鎖を分解して、アダプターのうちの1つをライブラリ分子から削除し、それにより分子増幅を役に立たないものにし得る。いくつかの場合では、環状アダプターまたはヘアピンアダプターが使用され、タイプIのCRISPR Cas3システムが、標的鎖を消化し、およし隣接する分子における第2鎖を消化し続けることになる。
【0048】
CRISPRシステムは、タイプII CRISPRシステム、例えば、Cas9システムであり得る。タイプIIヌクレアーゼは、場合によりRuvCおよびHNHヌクレアーゼドメインを含む単一のエフェクタータンパク質を含む場合がある。いくつかの場合では、機能的タイプIIヌクレアーゼは2つ以上のポリペプチドを含む場合があり、それぞれはヌクレアーゼドメインまたはその断片を含む。ターゲット核酸配列は、3’プロトスペーサ隣接モチーフ(PAM)を含む場合がある。いくつかの例では、PAMは、標的核酸の5’であり得る。ガイドRNA(gRNA)は単一のキメラgRNAを含む場合があり、該キメラgRNAはcrRNAとtracrRNA配列の両方を含んでいる場合がある。あるいは、gRNAは、一組の2つのRNA、例えばcrRNAとtracrRNAを含む場合がある。タイプIIヌクレアーゼは、二本鎖切断を生成する場合があり、該二本鎖切断は、場合により2つの平滑末端を生じさせる。いくつかの場合では、タイプII CRISPRヌクレアーゼは、ニッカーゼであるように操作され、その結果、ヌクレアーゼが1つの一本鎖切断だけを生成する。そのような場合、2つの一本鎖切断がニッカーゼによって生成されるように、2つの異なる核酸配列がgRNAによって標的とされ得る。いくつかの例では、2つの一本鎖切断は効果的に二本鎖切断を生じさせる。タイプIIニッカーゼが2つの一本鎖切断を生成するために使用されるいくつかの場合では、生じる核酸遊離末端は平滑であるか、3’オーバーハングを有するか、または5’オーバーハングを有するかのいずれかであり得る。いくつかの例では、タイプIIヌクレアーゼは、標的配列に結合するが切断しないように、触媒現象的に不活性な場合がある。例えば、タイプIIヌクレアーゼは、RuvCとHNHの両方のドメインにおいて変異を有し、それによって両方のヌクレアーゼドメインが非官能性にされる場合がある。タイプII CRISPRシステムは、3つのサブタイプ、具体的には、タイプII-A、タイプII-B、タイプII-Cのうちの1つであり得る。
【0049】
CRISPRシステムは、タイプV CRISPRシステム、例えば、Cpf1、C2c1、C2c3システムであり得る。タイプVヌクレアーゼは、単一のエフェクタータンパク質を含む場合があり、それは場合により単一のRuvCヌクレアーゼドメインを含む。他の場合では、機能タイプVヌクレアーゼは、2つ以上のポリペプチド間で分割されたRuvCドメインを含む。そのような場合、標的核酸配列は、5’PAMまたは3’PAMを含み得る。ガイドRNA(gRNA)は、Cpf1である場合などの、単一のgRNAまたは単一のcrRNAを含み得る。場合によっては、tracrRNAは必要とされない。他の例では、C2c1が使用されるときなど、gRNAは単一のキメラgRNAを含む場合があり、そのときcrRNAとtracrRNAの両方の配列を含むか、またはgRNAは一組の2つのRNA、例えば、crRNAとtracrRNAを含み得る。タイプV CRISPRヌクレアーゼは、二本鎖切断を生成する場合があり、それは場合により5’オーバーハングを生成する。場合よっては、タイプV CRISPRヌクレアーゼは、ヌクレアーゼが一本鎖切断だけを生成するように、ニッカーゼであるように操作される。そのような場合、2つの一本鎖切断がニッカーゼによって生成されるように、2つの異なる核酸配列がgRNAによって標的とされ得る。いくつかの例では、2つの一本鎖切断は効果的に二本鎖切断を生じる。タイプVニッカーゼが2つの一本鎖切断を生成するために使用されるいくつかの場合では、生じる核酸遊離末端は平滑であるか、3’オーバーハングを有するか、または5’オーバーハングを有するかのいずれかであり得る。いくつかの例では、タイプVヌクレアーゼは、標的配列に結合するが切断しないように、触媒現象的に無効な場合がある。例えば、タイプVヌクレアーゼは、RuvCドメインにおいて変異を有し、それによってヌクレアーゼドメインが機能を果たさなくなる場合がある。
【0050】
CRISPRシステムはタイプVI CRISPRシステム、例えば、C2c2システムであり得る。タイプVIヌクレアーゼは、HEPNドメインを含む場合がある。いくつかの例では、タイプVIヌクレアーゼは2つ以上のポリペプチドを含む場合があり、それぞれはHEPNヌクレアーゼドメインまたはその断片を含む。そのような場合、ターゲット核酸配列は一本鎖RNAなどのRNAであり得る。タイプVI CRISPRシステムを使用する時、標的核酸はプロトスペーサ側方部位(PFS)を含み得る。PFSは、3’または5’、あるいは標的またはプロトスペーサ配列であり得る。ガイドRNA(gRNA)は、単一のgRNAまたは単一のcrRNAを含む場合がある。いくつかの場合では、tracrRNAは必要とされない。他の例では、gRNAは単一のキメラgRNAを含む場合があり、そのときcrRNAとtracrRNAの両方の配列を含むか、またはgRNAは一組の2つのRNA、例えば、crRNAとtracrRNAを含み得る。いくつかの例では、タイプVIヌクレアーゼは、標的配列に結合するが切断しないように、触媒現象的に不活性な場合がある。例えば、タイプVIヌクレアーゼは、HEPNドメインにおいて変異を有し、それによってヌクレアーゼドメインが機能を果たさなくなる場合がある。
【0051】
核酸でガイドされるヌクレアーゼを含む、本開示における使用のための適切なヌクレアーゼの非限定的な例は、C2c1、C2c2、C2c3、Cas1、Cas1B、Cas2、Cas3、Cas4、Cas5、Cas6、Cas7、Cas8、Cas9(Csn1およびCsx12としても知られる)、Cas10、Cpf1、Csy1、Csy2、Csy3、Cse1、Cse2、Csc1、Csc2、Csa5、Csn2、Csm2、Csm3、Csm4、Csm5、Csm6、Cmr1、Cmr3、Cmr4、Cmr5、Cmr6、Csb1、Csb2、Csb3、Csx17、Csx14、Csx100、Csx16、CsaX、Csx3、Csx1、Csx15、Csf1、Csf2、Csf3、Csf4、それらの相同体、それらのオーソログ、またはそれらの改変されたものを含む。
【0052】
本明細書に開示されるいくつかの方法では、アルゴノート(Argonaute)(Ago)システムが、ターゲット核酸配列を切断するために使用されてもよい。Agoタンパク質は、原核生物、真核生物、または古細菌に由来する場合がある。標的核酸は、RNAまたはDNAであり得る。DNA標的は、一本鎖または二本鎖であり得る。いくつかの例では、標的核酸は、プロトスペーサ隣接モチーフまたはプロトスペーサ側方配列に等価の配列などの、特定の標的側方配列を必要としない。Agoタンパク質は、二本鎖切断または一本鎖切断を生じる場合がある。いくつかの例では、Agoタンパク質が一本鎖切断を形成する時、2つのAgoタンパク質は、二重鎖切断を生成するために組み合わせて使用されてもよい。いくつかの例では、Agoタンパク質は1、2、またはそれ以上のヌクレアーゼドメインを含む。いくつかの例では、Agoタンパク質は1、2、またはそれ以上の触媒ドメインを含む。1つ以上のヌクレアーゼまたは触媒ドメインはAgoタンパク質において変異させられる場合があり、それによって、一本鎖切断を生成することができるニッカーゼタンパク質が生成される。他の例では、1つ以上のヌクレアーゼまたはAgoタンパク質の触媒ドメインにおける変異は、結合するが標的核酸を切断しない場合があるような、触媒現象的に無効なAgoタンパク質を生成する。
【0053】
Agoタンパク質は、ガイドする核酸によって標的核酸配列に向けられる。多くの例では、ガイドする核酸は、ガイドDNA(gDNA)である。gDNAは、5’にリン酸化された末端を有し得る。gDNAは、一本鎖または二本鎖であり得る。一本鎖gDNAは、長さが10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、または50ヌクレオチドであり得る。いくつかの例では、gDNAは、長さが10ヌクレオチド未満であり得る。いくつかの例では、gDNAは、長さが50ヌクレオチド超であり得る。
【0054】
アルゴノートに媒介された切断は、平滑末端、5’オーバーハング、または3’オーバーハングを生成する場合がある。いくつかの例では、1つ以上のヌクレオチドが、切断の間または後に、標的部位から除去される。
【0055】
アルゴノートタンパク質は、内発的にまたは組み換え的に発現される場合がある。アルゴノートは、染色体上に、染色体外に、またはプラスミド、合成染色体、または人工染色体上に、コードされる場合がある。付加的に、または代替的に、アルゴノートタンパク質は、ポリペプチドをコードするポリペプチドまたはmRNAとして提供される場合がある。そのような例では、ポリペプチドまたはmRNAは、ペプチド、ナノ粒子、またはウイルス粒子の使用によるなどの、当該技術分野において既知の標準的な手段によって送達される場合がある。
【0056】
ガイドDNAは、遺伝子の、またはエピゾームのDNAによって提供される場合がある。いくつかの例では、gDNAは、RNAまたはmRNAから逆転写される。いくつかの例では、ガイドDNAは、Agoタンパク質に付随して、または連続して、提供あるいは送達され得る。ガイドDNAは、化学的に合成、構築される場合があり、さもなければ当該技術分野において既知の標準的なDNA生成技術を使用して、生成される。ガイドDNAは、ゲノムDNA、エピゾームのDNA分子、単離された核酸分子、または核酸分子の他の任意の供給源から、切断されるか、放出されるか、さもなければ取り出され得る。
【0057】
ヌクレアーゼ融合蛋白質は、組み換え的に発現される場合がある。ヌクレアーゼ融合蛋白質は、染色体上に、染色体外に、またはプラスミド、合成染色体、または人工染色体上に、コードされる場合がある。ヌクレアーゼとクロマチンリモデリング酵素は、別々に操作され、その後共有結合でリンクされる場合がある。ヌクレアーゼ融合蛋白質は、ポリペプチドをコードするポリペプチドまたはmRNAとして提供される場合がある。そのような例では、ポリペプチドまたはmRNAは、ペプチド、ナノ粒子、またはウイルス粒子の使用によるなどの、当該技術分野において既知の標準的な手段によって送達される場合がある。
【0058】
ガイド核酸は、適合性のある、核酸でガイドされるヌクレアーゼと複合体化し、および標的配列とハイブリダイズし、それによってヌクレアーゼを標的配列に配向する場合がある。ガイド核酸と複合体化することができる、対象の核酸でガイドされるヌクレアーゼは、ガイド核酸に適合する核酸でガイドされるヌクレアーゼとして言及され得る。同様に、核酸でガイドされるヌクレアーゼと複合体化することができるガイド核酸は、核酸でガイドされるヌクレアーゼに適合性するガイド核酸として言及され得る。
【0059】
ガイド核酸はDNAであり得る。ガイド核酸はRNAであり得る。ガイド核酸は、DNAとRNAの両方を含む場合がある。ガイド核酸は、修飾された非自然発生のヌクレオチドを含んでもよい。ガイド核酸がRNAを含む場合、RNAガイド核酸は、本明細書に開示されるように、プラスミド、線状構築物、または編集カセットなどのポリヌクレオチド分子におけるDNA塩基配列によってコードされてもよい。
【0060】
ガイド核酸はガイド配列を含む場合がある。ガイド配列は、標的配列とハイブリダイズして、複合体化された核酸でガイドされるヌクレアーゼの配列特異的結合を標的配列に向けるために、標的ポリヌクレオチド配列と十分な相補性があるポリヌクレオチド配列である。ガイド配列とその対応する標的配列の間の相補性の程度は、適切なアラインメント・アルゴリズムを使用して、最適にアラインメントしたとき、約50%、60%、75%、80%、85%、90%、95%、97.5%、99%、またはそれらの値以上である。最適なアラインメントは、配列をアラインメントするための任意の適切なアルゴリズムを使用して求められ得る。いくつかの態様において、ガイド配列は、長さが約5、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、35、40、45、50、75ヌクレオチド、またはそれ以上である。いくつかの態様において、ガイド配列は、長さが約75ヌクレオチド未満、50ヌクレオチド未満、45ヌクレオチド未満、40ヌクレオチド未満、35ヌクレオチド未満、30ヌクレオチド未満、25ヌクレオチド未満、20ヌクレオチド未満である。好適には、ガイド配列は、長さが10~30ヌクレオチドである。ガイド配列は、長さが10~25ヌクレオチドであり得る。ガイド配列は、長さが10~20ヌクレオチドであり得る。ガイド配列は、長さが15~30ヌクレオチドであり得る。ガイド配列は、長さが20~30ヌクレオチドであり得る。ガイド配列は、長さが15~25ヌクレオチドであり得る。ガイド配列は、長さが15~20ヌクレオチドであり得る。ガイド配列は、長さが20~25ヌクレオチドであり得る。ガイド配列は、長さが22~25ヌクレオチドであり得る。ガイド配列は、長さが15ヌクレオチドであり得る。ガイド配列は、長さが16ヌクレオチドであり得る。ガイド配列は、長さが17ヌクレオチドであり得る。ガイド配列は、長さが18ヌクレオチドであり得る。ガイド配列は、長さが19ヌクレオチドであり得る。ガイド配列は、長さが20ヌクレオチドであり得る。ガイド配列は、長さが21ヌクレオチドであり得る。ガイド配列は、長さが22ヌクレオチドであり得る。ガイド配列は、長さが23ヌクレオチドであり得る。ガイド配列は、長さが24ヌクレオチドであり得る。ガイド配列は、長さが25ヌクレオチドであり得る。
【0061】
ガイド核酸は、スキャフォールド配列を含む場合がある。一般に、「スキャフォールド配列」は、標的化可能なヌクレアーゼ複合体の生成を促進するために十分な配列を有している任意の配列を含み、ここで標的化可能なヌクレアーゼ複合体は核酸でガイドされるヌクレアーゼとガイド核酸を含み、ガイド核酸はスキャフォールド配列とガイド配列を含む。標的化可能なヌクレアーゼ複合体の生成を促進するためのスキャフォールド配列内の十分な配列は、2次構造の形成するに関与する1つまたは2つの配列領域などの、スキャフォールド配列内の2つの配列領域の長さに沿った相補性の程度を含む場合がある。いくつかの場合では、前記1つまたは2つの配列領域は、同じポリヌクレオチド上に含まれるか、またはコードされる。いくつかの場合では、前記1つまたは2つの配列領域は、別個のポリヌクレオチド上に含まれるか、またはコードされる。最適なアラインメントは、任意の適切なアラインメント・アルゴリズムによって求められる場合があり、1つか2つの配列領域内の自己相補性などの、2次構造をさらに説明し得る。いくつかの態様では、最適にアラインメントされたとき2つのうちより短いものの長さに沿った、1つまたは2つの配列領域間の、相補性の程度は、約25%、30%、40%、50%、60%、70%、80%、90%、95%、97.5%、99%、またはそれら以上である。いくつかの態様では、2つの配列領域の少なくとも1つは、長さが約5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、30、40、50ヌクレオチド、またはそれ以上である。いくつかの態様では、2つの配列領域の少なくとも1つは、長さが約10~30ヌクレオチドである。2つの配列領域の少なくとも1つは、長さが10~25ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが10~20ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが15~30ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが20~30ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが15~25ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが15~20ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが20~25ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが22~25ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが15ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが16ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが17ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが18ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが19ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが20ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが21ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが22ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが23ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが24ヌクレオチドであり得る。2つの配列領域の少なくとも1つは、長さが25ヌクレオチドであり得る。
【0062】
対象ガイド核酸のスキャフォールド配列は、2次構造を含む場合がある。2次構造はシュードノット領域を含む場合がある。いくつかの例では、ガイド核酸と核酸でガイドされるヌクレアーゼの適合性は、ガイドRNAのシュードノット領域に内在または隣接する配列によって、少なくとも部分的に求められる。いくつかの場合では、核酸でガイドされるヌクレアーゼに対する、ガイド核酸の結合キネティクスは、ひとつには、スキャフォールド配列内の2次構造によって求められる。いくつかの場合では、核酸でガイドされるヌクレアーゼに対する、ガイド核酸の結合キネティクスは、ひとつには、スキャフォールド配列を有する核酸配列によって求められる。
【0063】
本開示の態様において、用語「ガイド核酸」は、1)標的配列にハイブリダイズすることができるガイド配列、および、2)本明細書に記載されるような核酸でガイドされるヌクレアーゼと相互作用することができるか、または複合体化することができる、スキャフォールド配列を含む、ポリヌクレオチドを指す。
【0064】
ガイド核酸は、2つの要素が、1つの、標的配列を切断することができる機能的な標的化可能なヌクレアーゼ複合体を形成し得るとき、核酸でガイドされるヌクレアーゼと適合し得る。多くの場合、適合するガイド核酸に適合するスキャフォールド配列は、天然の核酸でガイドされるヌクレアーゼ遺伝子座に隣接している配列を走査することによって見つけられ得る。言いかえれば、天然の核酸でガイドされるヌクレアーゼは、対応している適合のガイド核酸またはスキャフォールド配列の近傍内のゲノム上にコードされ得る。
【0065】
核酸でガイドされるヌクレアーゼは、ヌクレアーゼの内在性ホスト内に存在しないガイド核酸に適合する場合がある。このような直交するガイド核酸は、経験的なテストによって判定することができる。直交するガイド核酸は、異なる細菌種に由来するものであっても、合成されたものであっても、あるいは、自然界に存在しないように操作されたものであってもよい。
【0066】
共通の核酸ガイドヌクレアーゼに適合する直交ガイド核酸は、1つまたは複数の共通の特徴を含んでいてもよい。共通の特徴は、シュードノット領域の外側の配列を含む場合がある。共通の特徴は、シュードノット領域を含む場合がある。共通の特徴は、一次配列または2次構造を含む場合がある。
【0067】
ガイド核酸は、ガイド配列を、ガイド配列が標的配列に相補的であるように変更することにより、所望の標的配列を標的にするように操作される場合があり、それによってガイド配列と標的配列の間のハイブリダイゼーションが可能になる。操作されたガイド核酸を有するガイド配列は、操作されたガイド核酸と呼ばれることがある。操作されたガイド核酸は、多くの場合、非自然発生で、自然界では見出されない。
【0068】
ガイドRNA分子は、例えば、標的配列に結合して、結合された配列の両端にわたって生じるべき核酸重合を妨げることによって、シーケンシングに直接的に干渉する。いくつかの実施形態では、ガイドRNA分子は、タンパク質などのRNA-DNAハイブリッド結合部分とタンデムで働く。いくつかの実施形態では、ガイドRNA分子は、それ自体が結合する場合があるシーケンシングライブラリの要素の、メチル化、塩基削除、または切断などの修飾を配向し、その結果、いくつかの実施形態では、結合されるシーケンシングライブラリの要素が、さらなるシーケンシング反応に適さないものになる。いくつかの実施形態では、ガイドRNA分子は、例えば、Cas9タンパク質などのエンドヌクレアーゼ活性を有するタンパク質によって、結合されるDNA分子のエンドヌクレアーゼ的切断(endonucleolytic cleavage)を配向する。ジンクフィンガーヌクレアーゼ(ZFN)、転写活性化因子様エフェクターヌクレアーゼ、およびClustered Regulatory Interspaced Short Palindromic Repeat /CasベースのRNAガイドDMAヌクレアーゼ(CRISPR/Cas9)は、本明細書中の開示のいくつかの実施形態に適合する。
【0069】
ガイドRNA分子は、シーケンシングから取り除かれるべき標的配列(第1の核酸)と塩基対になる配列を含む。いくつかの実施形態では、塩基対合は完全であり、一方、いくつかの実施形態では、塩基対合は部分的か、または対がない塩基を、非標的配列に対になる塩基と共に、含む。
【0070】
ガイドRNAは、RNA「ヘアピン」構造を形成する領域または複数の領域を含む場合がある。そのような領域または複数の領域は、回文配列を部分的にまたは完全に含み、その結果、領域の5’末端と3’末端は、二本鎖「ステム」構造を形成するように互いにハイブリダイズする場合があり、それは、いくつかの実施形態では、互いに二重鎖環の中の一本鎖の各々をテザーする非回文の環によってキャップされる。
【0071】
いくつかの実施形態では、ガイドRNAは、tracrRNAステムループなどの、ステムループを含む。tracrRNAステムループなどのステムループは、Cas9 DNAエンドヌクレアーゼなどの核酸エンドヌクレアーゼと複合体化または結合し得る。代替的に、ステムループは、Cas9以外のエンドヌクレアーゼ、または塩基除去酵素、メチルトランスフェラーゼ、または1つ以上のDNAポリメラーゼ酵素を妨害する他の核酸修飾活性を有する酵素など、エンドヌクレアーゼ以外の核酸修飾酵素と複合化してもよい。
【0072】
tracrRNA / CRISPR / Endonucleaseシステムは、真正細菌や古細菌の原核生物が、既知の配列のウイルスに繰り返し感染することで細胞が耐性を獲得する適応免疫システムとして特定された。例えば、Deltcheva E, Chylinski K, Sharma CM, Gonzales K, Chao Y, Pirzada ZA et al.(2011) “CRISPR RNA maturation by trans-encoded small RNA and host factor RNase III” Nature 471 (7340):602-7.doi:10.1038/nature09886.PMC 3070239.PMID 21455174、Terns MP, Terns RM (2011) ”CRISPR-based adaptive immune systems” Curr Opin Microbiol 14 (3):321-7.doi:10.1016/j.mib.2011.03.005。PMC 3119747.PMID 21531607、Jinek M, Chylinski K, Fonfara I, Hauer M, Doudna JA, Charpentier E (2012)”A Programmable Dual-RNA-Guided DNA Endonuclease in Adaptive Bacterial Immunity” Science 337 (6096):816-21.doi:10.1126/science.1225829.PMID 22745249、および Brouns SJ (2012) ”A swiss army knife of immunity” Science 337 (6096):808-9.doi:10.1126/science.1227253.PMID 22904002を参照されたい。当該システムは、真核細胞における標的化遺伝子突然変異誘発を導くために、順応してきた。Wenzhi Jiang, Huanbin Zhou, Honghao Bi, Michael Fromm, Bing Yang、および、Donald P. Weeks (2013) ”Demonstration of CRISPR/Cas9/sgRNA-mediated targeted gene modification in Arabidopsis, tobacco, sorghum and rice” Nucleic Acids Res. Nov 2013; 41(20): e188, Published online Aug 31, 2013. doi: 10.1093/nar/gkt780,およびその中の参考文献を参照されたい。
【0073】
本明細書に企図されたように、ガイドRNAは、Cas9エンドヌクレアーゼなどのDNAエンドヌクレアーゼに配列特異性を提供するために、いくつかの実施形態において、使用される。ガイドRNAは、Cas9などのエンドヌクレアーゼに結合するか、またはエンドヌクレアーゼによって結合されるヘアピン構造を含み(他のエンドヌクレアーゼは、いくつかの実施形態において、代替または追加として企図される)、および、ガイドRNAは、配列決定ライブラリまたは配列決定反応から取り除かれることになっている配列に結合するか、特異的に結合するか、排他的に結合する、認識配列をさらに含む。ガイドRNAの中の認識配列の長さは、配列排除プロセスにおける所望の特異性の程度によって変化し得る。サンプル中で頻繁に生じる配列を含むか、または差動的に豊富な配列(ATリッチなゲノムサンプル中でのATの存在量またはGCリッチなゲノムサンプル中でGCの存在量)を含む、短い認識配列は、相対的に大きな数の部位を同定する可能性が高く、従って、エンドヌクレアーゼ活性、塩基切除、メチル化、または少なくとも1つのDNAポリメラーゼ活性に干渉する他の活性などの、頻繁な核酸修飾を導く可能性が高い。サンプル中で希に生じる配列を含むか、または不十分に代表された塩基の組み合わせ(ATリッチなゲノムサンプル中でのGCの存在量またはGCリッチなゲノムサンプル中でATの存在量)を含む、長い認識配列は、相対的に小さな数の部位を同定する可能性が高く、従って、エンドヌクレアーゼ活性、塩基切除、メチル化、または少なくとも1つのDNAポリメラーゼ活性に干渉する他の活性などの、希な核酸修飾を導く可能性が高い。従って、本明細書に開示されるように、いくつかの実施形態では、配列反応から認識配列の長さまたは内容への修飾を介して、配列除去の頻度を加減してもよい。
【0074】
ガイドRNAは、本明細書に記載される開示と一致する多くの方法によって合成される。標準的な合成技術は、大きな分量のガイドRNAを産生するために、および/または非常に反復的な標的領域のために、使用されてもよく、そのことは、多くの不要な遺伝子座を標的とするほんの少数のガイドRNA分子だけを必要とし得る。二本鎖DNA分子は、RNA部位特異的結合配列、Cas9タンパク質のガイドRNA配列、およびT7プロモータ部位を含み得る。場合によっては、二本鎖DNA分子は、約100bp未満の長さであり得る。T7ポリメラーゼは、Cas9タンパク質のための標的RNA配列とガイドRNA配列を含み得る、一本鎖RNA分子を作製するために使用することができる。
【0075】
ガイドRNA配列は、数多くの方法によって設計され得る。例えば、いくつかの実施形態では、ヒトゲノムの非遺伝的な反復配列は、例えば、100bpのスライディングウィンドウに分割される。二本鎖DNA分子は、フォトリソグラフィーを使用して、マイクロ・アレイ上で並列に合成することができる。
【0076】
ウィンドウは、サイズにおいて変化する場合がある。30量体の標的配列は、標的設計配列の5’末端側方N-G-Gの短いトリヌクレオチド・プロトスペーサー隣接モチーフ(PAM)配列を用いて設計することができ、それは場合により、切断を容易にする。中でも、その全体が、参照により本明細書に組み込まれる、Giedrius Gasiunas et al., (2012) ”Cas9-crRNA ribonucleoprotein complex mediates specific DNA cleavage for adaptive immunity in bacteria” Proc. Natl. Acad. Sci. USA. Sep 25, 109(39): E2579-E2586を参照されたい。冗長な配列は除去することができ、および、残りの配列は、REFSEQ、ENSEMBLに対するハイブリダイゼーションを回避するために、ヒトゲノムに対してサーチエンジン(例えば、BLAST)を使用して、およびこれらの部位でのヌクレアーゼ活性を回避するために、他の遺伝子データベースを使用して、解析することができる。ガイドRNA標的配列にユニバーサルCas9トレーサーRNA配列を付加し、T7プロモータをフランキングさせることができる。T7プロモータ部位上流の配列は、合成することができる。ヒトゲノムにおける標的領域の非常に反復的な性質により、多くの実施形態では、相対的に少数のガイドRNA分子は、NGSライブラリ分子のより大きな割合を消化するだろう。
【0077】
遺伝子をコードするタンパク質のわずか約50%がNGG PAM(プロトスペーサー隣接モチーフ)配列を含むエクソンを有すると推定されるが、多数の戦略が、Cas9切断システムを用いて標的とすることができるゲノムの割合を増やすために、本明細書に提供される。例えば、DNA領域でPAM配列が利用可能でない場合、PAM配列を含むヘルパーDNAと結合したガイドRNAを用いた組み合わせ戦略により、PAM配列を導入することができる。ヘルパーDNAは、合成のもの、および/または一本鎖のものであり得る。ヘルパーDNAにおけるPAM配列は、NGSライブラリにおけるgDNAノックアウト標的に相補的でなく、したがって、標的NGSライブラリ鋳型に結合しない場合があるが、ガイドRNAに結合する可能性がある。ガイドRNAは、ターゲット配列とPAM配列を含むヘルパーDNAの両方にハイブリダイズして、Cas9システムによって認識されるハイブリッドDNA:RNA:DNA複合体を形成するように設計することができる。
【0078】
PAM配列は、一本鎖のオーバーハングまたはヘアピンとして表現される場合がある。ヘアピンは、場合により、任意選択的に分解される場合がある修飾ヌクレオチドを含み得る。例えば、ヘアピンはウラシルを含むことができ、これはウラシルDNAグリコシラーゼによって分解され得る。
【0079】
PAM配列を含むDNAを使用する代わりに、PAM配列の必要のない修飾Cas9タンパク質またはPAM配列へのより低い感度を有する修飾Cas9は、ヘルパーDNA配列を必要とせずに、使用されてもよい。
【0080】
以下の場合では、Cas9の認識に用いるガイドRNAの配列は、複数の部位を緊密に切断するためのデュアルカッティングシステムとして機能させるために、1つの末端で長くされ得、および反転され得る。ガイドRNA配列は、NGS DNAライブラリ標的上で2つの切断を作り出すことができる。このことは、制限された距離内の対応する鎖に対する単一のガイドRNAを設計することにより、達成され得る。ガイドRNAの一端は二本鎖DNAライブラリの順鎖に結合し得、および他端は逆鎖に結合し得る。ガイドRNAの各末端は、PAM配列とCas9結合ドメインを含み得る。このことは、所定の距離だけ離れた同じDNA配列由来のNGSライブラリ分子の2重の二本鎖切断をもたらし得る。
【0081】
アッセイの代替的なバージョンは、第1の核酸において豊富な認識部位を有する少なくとも1つの制限エンドヌクレアーゼなどの、少なくとも1つの配列特異的ヌクレアーゼ、いくつかの場合では、配列特異的ヌクレアーゼの1つの組み合わせを含む。いくつかの場合では、酵素は、ある特定の配列に反応して二本鎖切断をもたらす活性を含む。いくつかの場合では、酵素は、RNA/DNAハイブリッドにおいて二本鎖核酸材料を消化する任意のヌクレアーゼまたは他の酵素を含む。
【0082】
第2の核酸に相補的な核酸プローブ(例えば、ビオチン化プローブ)は、溶液において第2の核酸にハイブリタイズし、例えば、磁性ストレプトアビジン被覆ビーズを用いてプルダウンすることができる。非結合核酸は洗い流すことができ、捕捉された核酸は、その後、配列決定または遺伝子型決定のために溶出および増幅され得る。
【0083】
いくつかの実施形態では、本明細書における方法の実施は、配列決定反応の配列決定所用時間を減らし、これにより、核酸ライブラリは、より短い時間で、またはより少ない試薬を使用して、またはより少ない計算能力を使用して配列決定される。いくつかの実施形態では、本明細書における方法の実施は、所与の核酸ライブラリのための配列決定反応の配列決定所用時間を、本明細書における方法の実施がない状態における配列決定に必要な時間の約90%、80%、70%、60%、50%、40%、33%、30%、または30%未満まで減らす。
【0084】
いくつかの実施形態では、所与の配列決定反応において、ある特定の領域からのある特定のリード配列に特に関心が置かれる。そのような特定の領域の迅速な同定を可能にするための手段は、計算時間または試薬の必要性または計算時間と試薬の必要量の両方を減らし得るため有益である。
【0085】
いくつかの実施形態は、ガイドRNA分子の生成に関する。ガイドRNA分子は、場合によっては、DNA鋳型から転写される。T7ポリメラーゼ、RNA PolI、RNA PolII、RNA PolIII、オルガネラRNAポリメラーゼ、ウイルスRNAポリメラーゼ、あるいは真正細菌または古細菌のポリメラーゼなど、多くのRNAポリメラーゼが使用され得る。場合によっては、ポリメラーゼはT7である。
【0086】
ガイドRNA生成テンプレートは、T7ポリメラーゼ、RNA PolI、RNA PolII、RNA PolIII、オルガネラRNAポリメラーゼ、ウイルス性RNAポリメラーゼ、あるいは真正細菌または古細菌のポリメラーゼによって方向づけられる転写に適合したプロモータなどの、プロモータを含む。場合によっては、プロモータはT7プロモータである。
【0087】
ガイドRNA鋳型は、場合により、タグ配列をコードする。タグ配列は、メチラーゼ、塩基除去酵素、エンドヌクレアーゼなどの核酸修飾酵素に結合する。非標的部位に結合されたより大きなガイドRNA分子の文脈において、タグ配列は、酵素を核酸非標的領域にテザーし、活性を上記非標的部位に向けさせる。例示的な、テザーされる酵素(tethered enzyme)は、Cas9などのエンドヌクレアーゼである。
【0088】
ガイドRNA鋳型は、リボソームRNA配列、グロビン・タンパク質をコードする配列、トランスポゾンをコードする配列、レトロウイルス配列をコードする配列、テロメア配列を含む配列、サブテロメア反復を含む配列、セントロメア配列を含む配列、イントロン配列を含む配列、Alu反復を含む配列、SINE反復を含む配列、LINE反復を含む配列、二重核酸反復を含む配列、三重核酸反復を含む配列、テラ核酸反復を含む配列、ポリA反復を含む配列、ポリT反復を含む配列、ポリC反復を含む配列、ポリG反復を含む配列、ATリッチな配列を含む配列、またはGCリッチな配列を含む配列に対応する第1の核酸に相補的である。
【0089】
多くの場合において、タグ配列は、部分的または全体のステムループ構造などの、ステムループを含む。ステムループ構造の「ステム」は、場合によっては回文配列でコードされ、完全なものか、ステムに少なくとも1つの「キンク(kink)」またはターンを導入するために中断されたものかのいずれかである。ステムループ構造の「ループ」は、ほとんどの場合、ステム塩基のペアリングには関与しない。場合によっては、ステムループは、本明細書に組み込まれた参考文献に開示されたtracr配列などの、tracr配列によってコードされる。いくつかのステムループは、例えば、Cas9または他のエンドヌクレアーゼを結合する。
【0090】
ガイドRNA分子は、認識配列をさらに含む。認識配列は、核酸ライブラリ配列セットから除去されるべき非標的配列に対して、完全または不完全に逆相補的である。RNAは、DNA-DNAハイブリッドでは生じない塩基対の組み合わせ(例えば、G:Uの塩基対)でハイブリッドすることができるため、認識配列は、結合することになる非標的配列の正確な逆相補配列である必要はない。加えて、完全な塩基対合からの微小摂動は、場合により、許容される。
【0091】
末端保護
DNA分子の末端を分解から保護することは、最終結果がアダプター付着部位でのエキソヌクレアーゼ分解によるアダプター付加断片の予防である前提で、様々なアプローチを通してもたらされる可能性がある。アダプターは、ライゲーション、ポリメラーゼに媒介された増幅、トランスポゼース送達を介したタグメンテーション、末端修飾、または他のアプローチを通して付加される。代表的なアダプターは、両方の末端に付加された場合、二本鎖核酸の二本鎖を、効果的にリンクして一本鎖環状分子を形成するヘアピンアダプターを含む。そのような分子は、エンドヌクレアーゼによってさらに切断されない限り、一本鎖または二本鎖エキソヌクレアーゼ分解のための露出した末端を欠く。保護は、エキソヌクレアーゼ活性に耐性のあるオリゴヌクレオチドまたは他の分子の付着によってももたらされる。耐エキソヌクレアーゼ性アダプターの例は、ホスホロチオエートオリゴ、2-Oメチル修飾ヌクレオチド糖類、反転されたdTまたはddT、リン酸化、C3スペーサ、またはエキソヌクレアーゼが修飾を妨害して隣接する核酸を分解するのを抑制する他の修飾を含む。代替的にまたは組み合わせにおいて、いくつかの場合では、「アダプター」は、付加的な分子のライゲーションなしに、試料核酸の末端に対する修飾(例えば、化学修飾)を構成し、これにより、修飾は、核酸をエキソヌクレアーゼ分解に耐性のある状態にする。
【0092】
本明細書におけるアダプターの具体的な特徴は、それらが局所的に互いから独立して作動するが、核酸は、両方の末端がアダプター付加または修飾を受けない限り、分解から保護されないという点である。さもなければ、アダプター付加された末端はエキソヌクレアーゼ活性から保護されるが、核酸の反対側の末端は分解を受けやすく、これにより、分子全体として分解されるという点である。これは、本明細書に企図されたように、アダプター修飾されるが、その後、配列特異的な核酸エキソヌクレアーゼによって切断され、それにより、2つの露出した、保護されていない核酸末端を持つことになる核酸の宿命である。
【0093】
非宿主核酸
本明細書における標的化除去法は、試料からの第1の核酸の除去、および第2の核酸の濃縮である。上記試料は、配列決定のためのライブラリを作成するのに使用することができ、上記配列決定は、主に第2の核酸から抽出され得る配列データを送達する。例えば、第2の核酸は、非宿主核酸であり得る。
【0094】
いくらかの態様では、本明細書に提供されるのは、微生物病原体の富化をもたらす方法である。いくつかの場合では、本明細書の方法は、上記微生物病原体の同定を可能にする。いくつかの実施形態では、微生物病原体は細菌性病原体を含む。いくつかの実施形態では、細菌性病原体は、炭疽菌またはセレウス菌など桿菌、バルトネラ・ヘンセラ又はバルトネラ・クインターナなどのバルトネラ属、百日咳菌などのボルデテラ属、ボレリア・ブルグドルフェリ、ボレリア・ガリニ、ボレリア・アフゼリ、回帰熱ボレリアなどのボレリア属、ウシ流産菌、イヌ流産菌、マルタ熱菌、又はブタ流産菌などのブルセラ属、カンピロバクター・ジェジュニなどのカンピロバクター、クラミジア・ニューモニエ、トラコーマクラミジア、オウム病クラミジアなどのクラミジア属又はクラミドフィラ属、ボツリヌス菌、クロストリジウム・ディフィシル、ウエルシュ菌、破傷風菌などのクロストリジウム属、ジフテリア菌などのコリネバクテリア属、エンテロコッカス・フェカーリス又はエンテロコッカス・フェシウムなどのエンテロコッカス属、大腸菌などのエシェリヒア属、フランシセラ・ツラレンシスなどのフランシセラ属、インフルエンザ菌などのヘモフィルス属、ヘリコバクター・ピロリなどのヘリコバクター属、レジュネラ・ニューモフィラ菌などのレジオネラ属、レプトスピラ・インターロガンス、レプトスピラ・サンタロサイ(santarosai)、レプトスピラ・ヴァイル(weilii)、又はレプトスピラ・ノグチ(noguchii)などのレプトスピラ属、リステリア・モノサイトゲネスなどのリステリア属、癩菌、結核菌、又はマイコバクテリウム・ウルセランスなどのマイコバクテリウム、肺炎マイコプラズマなどのマイコプラズマ属、淋菌又は髄膜炎菌などのナイセリア属、緑膿菌などのシュードモナス属、リケッチア-リケッチイなどのリケッチア属、サルモネラ・チフィ又はサルモネラ・チフィムリウムなどのサルモネラ属、ソンネ赤痢菌などのシゲラ属、黄色ブドウ球菌、表皮ブドウ球菌、腐性ブドウ球菌などのスタフィロコッカス属、ストレプトコッカス・アガラクチア、肺炎球菌、化膿連鎖球菌などのストレプトコッカス属、梅毒トレポネーマなどのトレポネーマ属、ビブリオ・コレラなどのビブリオ属、ペスト菌、腸炎エルシニア、又は仮性結核菌などのエルシニア属である。いくつかの実施形態では、上記微生物病原体は、ウイルス病原体を含む。いくつかの実施形態では、上記ウイルス病原体は、アデノウイルスなどのアデノウイルス科、1型単純ヘルペス、2型単純ヘルペス、水痘帯状疱疹ウイルス、エプスタイン-バーウイルス、ヒトサイトメガロウイルス、8型ヒトヘルペスウイルスなどのヘルペスウイルス科、ヒトパピローマウイルスなどのパピローマウイルス科、BKウイルス又はJCウイルスなどポリオーマウイルス科、天然痘などのポックスウイルス科、B型肝炎ウイルスなどのヘパドナウイルス科、ヒトボカウイルス又はパルボウイルスなどのパルボウイルス科、ヒトアストロウイルスなどのアストロウイルス科、ノーウォークウイルスなどのカリシウイルス科、コクサッキーウイルス、A型肝炎ウイルス、ポリオウイルス、ライノウイルスなどのピコルナウイルス科、重症急性呼吸器症候群ウイルスまたは武漢コロナウイルスなどのコロナウイルス科、C型肝炎ウイルス、黄熱ウイルス、デング熱ウイルス、西ナイルウイルスなどのフラビウイルス科、風疹ウイルスなどのトガウイルス科、E型肝炎ウイルスなどのヘペウイルス科、ヒト免疫不全ウイルス(HIV)などのレトロウイルス科、インフルエンザウイルスなどのオルトミクソウイルス科、グアナリトウイルス、フニンウイルス、ラッサウイルス、マチュポウイルス、サビアウイルスなどのアレナウイルス科、クリミア-コンゴ出血性熱ウイルスなどのブンヤウイルス科、エボラウイルス、マールブルグウイルスなどのフィロウイルス科、麻疹ウイルス、ムンプスウイルス、パラインフルエンザウイルス、呼吸系発疹ウイルス、ヒトメタニューモウイルス(metapneumovirus)、ヘンドラウイルス、ニパウイルスなどのパラミクソウイルス科、狂犬病ウイルスなどのラブドウイルス科、D型肝炎ウイルス、又は、ロタウイルス、オルビウイルス、コルチウイルス、バンナウイルス病原体などのレオウイルス科である。いくつかの実施形態では、上記微生物病原体は、真菌類病原体を含む。いくつかの実施形態では、上記真菌類病原体は、放線菌症、アレルギー性気管支肺アスペルギルス症、アスエルギローム、アスペルギルス症、足白癬、バシジオボルス症、バシジオボラス・ラナラム、黒色砂毛症、分芽菌症、カンジダ・クルセイ、カンジダ症、慢性の肺アスペルギルス症、クリソスポリウム、ツボカビ症、コクシジオイデス症、コニジオボロミコシス(conidiobolomycosis)、クリプトコックス症、ガッティ型クリプトコックス症、深層皮膚糸状菌症、皮膚糸状菌、皮膚糸状菌疹、皮膚糸状菌症、毛内菌、昆虫病原糸状菌、家畜流行性リンパ管炎、食道のカンジダ症、毛外白癬菌、真菌性髄膜炎、真菌血症、ゲオトリクム属、ゲオトリクム キャンディダム、ヒストプラスマ症、ロボミコーシス、マッソスポラ・シカジナ、石膏状小胞子菌、カイコ病、真菌症、鼓膜真菌症、ネオジダイツ・レマウディエレイ(neozygites remaudierei)、ネオジダイツ・スラヴィ(neozygites slavi)、オクロコニス・ガロッパバ、オフィアコルディアセップス・アルボレセンス(ophiocordyceps arborescens)、オフィアコルディアセップス・コエノマイア(ophiocordyceps coenomyia、オフィアコルディアセップス・マクロアシキュラリス(ophiocordyceps macroacicularis)、カメムシタケ、鵞口瘡、パラコクシジオイデス症、病原性二形性真菌、ペニシリウム菌症、砂毛症、ピエドライア、ニューモシスティス肺炎、シュードアレシェリア症、スケドスポリウム症、スポロトリクム症、白癬、白癬性毛瘡、頭部白癬、体部白癬、股部白癬、顔面白癬、異型白癬、黒色癬、足部白、癜風、ボモサイトーシス、白色鼻症候群、ゼアスポラ(zeaspora)、または接合菌症を含む。いくつかの場合では、本明細書における方法は、原虫核酸の富化をもたらす。いくつかの場合では、本明細書における方法は、癌核酸の富化をもたらす。いくつかの場合では、本明細書における方法は、胎児核酸の富化をもたらす。
【0095】
標的化除去におけるエンドヌクレアーゼ/エキソヌクレアーゼ組み合わせの使用
第1の核酸を除去するための本明細書に記載される方法は、結果として、劇的に複雑性が低減された、配列決定ライブラリをもたらし得る。不要な配列は、取り除かれ、残りの配列は、NGS技術によってより容易に分析することができる。上記ライブラリの下げられた複雑性は、臨床ディープシーケンスに必要とされるシーケンサ能を減らし、および/または、非反復配列の正確なマッピングのための計算量の要件を低減させる。富化された配列は、遺伝子のアイデンティティを決定するためのBLASTなどの生物情報学データベースにおいて検索することができる。富化された核酸の配列情報は、病原体の種類を決定するのに使用することができる。
【0096】
本明細書に開示される方法を通して、試料は、エキソヌクレアーゼ保護末端を得るために処理され、その後、特定の核酸が、エキソヌクレアーゼ感受性末端を露出させるために切断され、これにより、同時に、または続いて行われるエキソヌクレアーゼ処理は、核酸離層生成物を選択的に分解し、切断されないキャップされた核酸は完全な状態のまま残る。残った核酸は、その後、配列決定ライブラリを調製するのに使用されるか、あるいは、分析評価される。
【0097】
多くのワークフローが、本明細書中の開示と一致する。異なるものも企図されるが、代表的なワークフローは以下の通りである。
【0098】
工程1
核酸抽出/精製
多く精製方法が、本明細書中の開示と一致する。いくつかの場合では、熱のみで細胞を破裂させることができる。試料源は、唾液、血液、尿、CSF、皮膚、組織、骨等を含み得る。各試料の種類および病原体の種類は、異なる抽出および精製の方法を必要とし得る。ゲノム核酸、循環遊離核酸、RNAまたはcDNAなどの、下流での応用に適した核酸を産出する試料調製アプローチは、本明細書中の開示と一致する。
【0099】
工程2:
DNA保護
DNA分子の末端を分解から保護することは、アダプターのライゲーションなしに試料核酸の末端への、ヘアピンアダプターをライゲーションすること、ホスホロチオエートオリゴ、2-Oメチル、反転されたdTまたはddT、リン酸化、C3スペーサなどの修飾を有するアダプターをライゲーションすること、または単純な修飾を行うことによって達成することができる。DNA末端を保護する付加的な方法は、末端修復/合成、または、ターミナルトランスフェラーゼを使用した2’-修飾ヌクレオシドのDNA分子の末端への取り込みを含む。修飾ヌクレオシドまたはヌクレオチドは、一本鎖の部分的な消化を修飾ヌクレオシドまたはヌクレオチドを用いる補填と使用して、DNA分子の5’末端および/または3’末端に取り込むこともできる。エキソヌクレアーゼ消化に耐性のある付加的な修飾ヌクレオチドまたは修飾ヌクレオシド間結合は、ホスホロチオエート結合、チオリン酸結合、ホスホロジセレノエート結合、セレノホスフェート結合、ホスホロアミダート結合、カルボホスホネート結合、メチルホスホネート官能化、フェニルホスフェート官能化、ピリジルホスホネート官能化、アミノメチルホスホネート官能化、アミノエチルホスホネート官能化、メチレン官能化(例えば、デオキシ-3’-C-(ヒドロキシメチル)チミジン(DHMT)または塩基-リン-炭素-塩基)、5’アルキルホスホネート結合(例えば、エチル、ビニル、またはエチニルホスホネート官能化)、ホスホノ酢酸官能化、チオホスホノ酢酸官能化、ホスホノギ酸(phosphonofomate)官能化、1、2、3-トリアゾリルホスホネート官能化、ホスホトリエステル結合、二リン酸ジエステル間結合、ボラノリン酸結合、二重修飾ヌクレオシド結合、炭素-リン-硫黄 メチルホスホン酸チオエート、硫黄-リン-硫黄 ホスホロチオエート結合、硫黄-リン-窒素 チオホスホルアミデート結合、窒素-リン-炭素 メタンホスホンアミダイト結合、ボロン-リン-炭素 ボランメチルホスホネート結合、トリアゾール結合、ジアルキル硫化物結合、スルファミン酸塩結合、ボリン酸結合、ピペラジン結合、グアニジン結合、メチレン(メチルアミノ)結合、アミド結合、尿素結合、モルフォリノ・ホスホルアミデート結合、モルフォリノ・ホスホロジアミデート結合、ジメチルチオ尿素結合、カルバマート結合、および他の適切な結合を含むが、これらに限定はされない。
適切な修飾は、Claveらによる、RSC Chem Biol。 2021、 2、 94-150において議論され、本明細書にその全体が引用によって取り込まれる。ヘアピンアダプターまたは保護されたアダプターのタグメンテーションアプローチがさらに用いられ得る。代替的に、または組み合わせにおいて、上記のいずれかと共に、Chandrasekaran Nature Reviews Chemistry。2021年、5、225-239。に記載されるものなどのDNAナノ構造を使用することができる。
【0100】
工程3
宿主分子のエンドヌクレアーゼ消化
これは、宿主配列モチーフに特異的な制限酵素を用いて達成され得る。これは、CRISPRシステムやCRISPR誘導体などの、RNAガイドエンドヌクレアーゼを含み得る。ヒト特異的配列モチーフの例は、Alu配列を含み得る。Aluは、霊長類に特異的であり、ヒトゲノムにおいて豊富(100万以上)であり、ゲノム全体にわたって間隔をおいて存在する。Aluに特異的な制限酵素の例は、AluI、AsuHPI、Bpu10I、BssECI、BstDEI、BstMAI、HinfI、およびBstTUIを含み得る。図2は、ヒトゲノムにおけるAlu配列のマップを示す。表1は、一定の位置に制限酵素認識部位を含有するAlu反復の量を示す。いくつかの場合では、ヒトAluモノマーの例は、7SL RNAに由来し、GCCGGGCGCGGTGGCGCGTGCCTGTAGTCCCagctACTCGGGAGGCTGAGGCTGGAGGATCGCTTGAGTCCAGGAGTTCTGGGCTGTAGTGCGCTATGCCGATCGGAATAGCCACTGCACTCCAGCCTGGGCAACATAGCGAGACCCCGTCTCの配列を有する長さ153塩基対であり、AluIエンドヌクレアーゼの認識配列は5’ ag/ct 3’であり、すなわち、酵素は、グアニンとシトシン残基(上記小文字)との間のセグメントを切断し、CRISPR-Cas9のためのPAM配列は下線で示される。それは、グアニンと上記(下線)に示されるCRISPR-Cas9のためのシトシン残留物(上記小文字)PAM配列との間のDNAセグメントを切断する酵素である。
【0101】
【表1-1】
【0102】
【表1-2】
【0103】
工程4
ライブラリ調製。
一旦宿主核酸が取り除かれると、非宿主分子の標準的なライブラリ調製が、配列決定のために行われる。
【0104】
図1は、宿主除去方法の合理化されたワークフローを例示する。保護されたアダプターまたはヘアピン配列を用いたタグメンテーション手法が、DNA分子をエキソヌクレアーゼ消化から保護するのに使用され得る。DNAを入力するためのTn5トランスポゼースの比率は、配列決定に十分な長さの保護された分子を産出するために最適化される。ナノポア配列決定の場合では、理想的な分子の長さは1kbよりも大きくなるであろう。タグメンテーションに続いて、エンドヌクレアーゼ消化が行われ、その直後に、切断された分子のエキソヌクレアーゼ消化が続く。残った分子は、ナノポア配列決定へ直接入力され得る。
【0105】
代替的におよび/または加えて、全核酸(RNAおよびDNA)が得られる場合がある。RNAは、最初に二本鎖cDNAへ変換される。ds cDNAおよび/またはゲノムDNA分子の両方は、前述の手段によって保護される。cDNAおよびDNA分子は、前記のように、宿主特異的配列モチーフのための、エンドヌクレアーゼ消化を受ける。保護されていないエンドヌクレアーゼ消化された宿主分子の露出した末端は、エキソヌクレアーゼ消化を介して分解される。
【0106】
残った非宿主分子は、配列決定ライブラリへ変換され、配列決定され、データは、試料における病原体の存在を決定するために分析される。いくつかの実施形態では、非宿主分子を配列決定ライブラリへ変換することは、合成アダプターを切断されなかった分子に加えることを含む。いくつかの実施形態では、合成アダプターは、切断された分子上へライゲーションされる。合成アダプターは、残った非宿主分子に、当業者によって知られている任意の適切な方法によって加えられ得る。アダプターは、非宿主分子を増幅する、非宿主分子を精製する、および/または非宿主分子を配列決定するために本明細書の方法において使用することができる。いくつかの場合では、非宿主分子に宿主分子の除去後に加えられるアダプターは、宿主分子の除去前に加えられるアダプターとは異なる。
【0107】
本明細書に記載される方法は、第2の核酸(例えば、富化される核酸)のゲノム分析を行う工程を含み得る。第2の核酸に関連する配列を見つけるために、ゲノム配列データベースを検索することができる。一般に、コンピュータ実装検索アルゴリズムを使用して、検索する配列をコミュニケーション・ネットワーク、例えば、インターネットを介して入手可能な複数のデータベースに記憶された配列情報と比較することによって、検索を行うことができる。そのようなアルゴリズムの例として、Basic Local Alignment Search Tool (BLAST)アルゴリズム、PSI-blastアルゴリズム、スミス・ウォーターマン・アルゴリズム、隠れマルコフモデル(HMM)アルゴリズム、および他の似たアルゴリズムが挙げられる。
【0108】
いくつかの実施形態では、エンドヌクレアーゼは、除去されるゲノムにおいて複数の部位を標的とするように構成され、その後、エキソヌクレアーゼ消化は、核酸分子または断片を生成し、上記核酸分子から上記断片を除外することができ、上記核酸分子は、アダプターにライゲーションされ、クローン化され、そこからライブラリが調製される。
【0109】
したがって、本明細書に提供されるのは、上記第1の核酸および上記第2の核酸を含む試料から選択的な核酸分子を含むライブラリを調製する改良された方法であり、上記方法は、第1の核酸と第2の核酸を含む試料を提供する工程と、上記試料に、閾値サイズよりも小さい核酸フラグメントを上記試料から取り除く処理にかける工程と、少なくとも1つの切断された第1の核酸を形成するために、上記第1の核酸と上記第2の核酸をエンドヌクレアーゼにさらす工程であって、上記エンドヌクレアーゼは、上記第1の核酸を切断するが、上記第2の核酸を切断しない、工程と、エキソヌクレアーゼ消化された核酸分子を生成するために、工程(c)からの試料をエキソヌクレアーゼに接触させる工程と、閾値サイズより大きい核酸分子をサイズ選択することによって、エキソヌクレアーゼ消化後に残る核酸分子を富化して、富化された核酸分子を含むライブラリを生成する工程とを含む。別の態様では、ライブラリを調製する方法が提供される。上記方法は、複数の核酸分子を含む試料を提供する工程を含む可能性があり、上記複数の核酸分子は、第1の核酸および第2の核酸を含む。その後、上記試料から、閾値サイズより小さい核酸断片を取り除くことができる。その後、上記第1の核酸を切断するエンドヌクレアーゼに、上記試料を接触させることができる。エンドヌクレアーゼに接触された試料はエキソヌクレアーゼに接触されて、エキソヌクレアーゼ消化され、切断された第1の核酸を生成し得る。最後に、複数の、閾値サイズより大きい核酸分子の一部を含むライブラリを生成することができる。
【0110】
いくつかの実施形態では、本明細書に提供されるのは、汚染された試料または生物学的な試料からの核酸分子などの、選択的な核酸分子を富化するための改良された方法である。いくつかの実施形態では、本明細書に提供される方法は、富化された上記核酸の特異性を増加させる。いくつかの実施形態では、方法は、サイズ除外クリーニングおよび富化の付加的な工程を含む。いくつかの実施形態では、本明細書に提供される方法は、富化された上記核酸の収量を増加させる。いくつかの実施形態では、方法は、精製工程のより高い収量のための排除を含む。
【0111】
いくつかの実施形態では、収量は、従来の方法と比較して、10%、20%、30%、40%、50%、60%、70%、80%、90%あるいは100%またはそれ以上、増加する。
【0112】
定義
関連する定義の部分的なリストは以下の通りである。
【0113】
本明細書において用いられるように、用語「富化された」は、相対的な意味で用いられ、これにより、第2のヌクレオチドまたは第2のヌクレオチドを含む集団は、第1のヌクレオチドまたは第1のヌクレオチドを含む集団の選択的な除去にあたって富化される。それは、富化されるものの絶対的な意味での増加を必要としない。むしろ、他の核酸の除去または削除から生じる絶対的な増加または相対的な増加は、本明細書において用いられるように、「富化」を構成し得る。
【0114】
本明細書において用いられるように、用語「除去」または「除去させる」は、相対的な意味で用いられ、これにより、第1のヌクレオチドまたは第1のヌクレオチドを含む集団は、第2のヌクレオチドまたは第2のヌクレオチドを含む集団の選択的な保存にあたって分解される。それは、除去されるものの絶対的な意味での減少を必要としない。むしろ、他の核酸の保存から生じる絶対的な減少または相対的な減少は、本明細書において用いられるように、「除去」を構成し得る。
【0115】
本明細書において用いられるように、「約」所与の値は、当該所与の値の+/-10%と定義される。
【0116】
本明細書において用いられるように、NGSまたは次世代シーケンシングは、5.1大量並行シークエンシング(MPSS)、ポロニーシークエンシング、454パイロシークエンシング、Illumina (Solexa)シークエンシング、SOLiシークエンシング、Ion Torrent半導体シークエンシング、DNAナノボールシークエンシング、ヘリスコープ単分子シークエンシング、一分子リアルタイム(SMRT)シーケンシング、トンネル電流DNAシークエンシング、ハイブリダイゼーションによるシークエンシング、質量分析を用いたシークエンシング、マイクロ流体サンガーシークエンシング、顕微鏡ベース技術、RNAPシークエンシング、体内ウイルス高倍率シークエンシングなどの核酸配列決定技術の任意の数を指す場合がある。
【0117】
本明細書において用いられるように、核酸を「修飾する」ことは、メチル化、塩基除去、またはホスホジエステル骨格の切断などの、核酸における共有結合に変化をもたらすことである。
【0118】
本明細書において用いられるように、「直接転写」は、特定のRNA分子が転写され得る、鋳型配列を提供することである。
【0119】
「増幅核酸」または「増幅されたポリヌクレオチド」は、その量が、その開始量と比較して、インビトロで実行された核酸増幅または複製方法によって増加された、核酸またはポリヌクレオチド分子を含む。例えば、増幅核酸は、随意に、幾つかの事例において指数方法でDNAを増幅することができる(例えば、nサイクルで2nのコピーに増幅)ポリメラーゼ連鎖反応(PCR)から得られ、ここでほとんどの産物が、直接試料鋳型からではなく中間鋳型から生成される。増幅核酸は、代替的に線形増幅から得られ、ここで、その量は、経時的に線形に増加し、これは、幾つかの場合において、試料から直接合成される産物を産生する。
【0120】
用語「生体試料」または「試料」は、一般に、生物学的存在から分離された試料または部分を指す。生体試料は、幾つかの場合において、全生物学的存在の性質を示し、その例は、限定されないが、体液、解離された腫瘍の標本、培養細胞、およびそれらの組み合わせを含む。生体試料は1以上の個体から得られる。1以上の生体試料は同じ個体から得られる。1つの限定しない例において、第1の試料は個体の血液から得られ、第2の試料は個体の腫瘍生検標本から得られる。生体試料の例としては、限定されないが、血液、血清、血漿、鼻スワブ(nasal swab)または鼻咽頭洗浄液、唾液、尿、胃液、髄液、涙、便、粘液、汗、耳垢、油、腺分泌物、脳脊髄液、組織、精液、膣液、腫瘍組織由来の間質液を含む間質液、眼液、髄液、咽頭スワブ、息、毛、指の爪、皮膚、生検標本、胎盤液、羊水、臍帯血、強調液(emphatic fluids)、腔液、痰、膿、細菌叢、胎便、母乳および/または他の分泌物が挙げられる。幾つかの場合では、血液試料は、循環腫瘍細胞、または腫瘍DNAまたは胎児DNAなどの無細胞DNAを含む。試料は鼻咽頭洗浄液を含む。被験体の組織試料の例としては、限定されないが、結合組織、筋組織、神経組織、上皮組織、軟骨、癌または腫瘍の試料、あるいは骨が挙げられる。試料はヒトまたは動物から得られる。試料は、ネズミ、サル、ヒト、家畜、スポーツ動物、またはペットなどの脊椎動物を含む哺乳動物から得られる。試料は、生きているか又は死んでいる被験体から得られる。試料は、被験体から新鮮に得られるか、あるいは前処理、保存、または輸送の幾つかの形態を経ている。
【0121】
本明細書に使用される核酸試料は、第1の核酸が決定される核酸試料を指す。核酸試料は、幾つかの場合において上記の生体試料から抽出される。代替的に、核酸試料は、幾つかの場合において、人為的に合成されるか、合成的であるか、あるいはデノボ合成される。DNA試料は、幾つかの場合においてゲノムであり、一方で代替的な場合において、DNA試料は逆転写されたRNA試料に由来する。
【0122】
「体液」は、一般に被験体の身体から生じる流体または分泌物について記述している。幾つかの事例では、体液は、一緒に混合された1つを超えるタイプの体液の混合物である。体液の幾つかの限定しない例としては、限定されないが、血液、尿、骨髄、髄液、胸膜液、リンパ液、羊水、腹水、痰、またはそれらの組み合わせが挙げられる。
【0123】
「相補的」または「相補性」、あるいは幾つかの場合において、より正確には「逆相補性」は、塩基対合によって関連する核酸分子を指す。相補的なヌクレオチドは、一般に、AおよびT(またはAおよびU)、あるいはCおよびG(またはGおよびU)である。機能的に、2つの一本鎖RNAまたはDNA分子は、水素結合媒介性の塩基対合によって二本鎖分子を形成するときに相補的である。最適に整列された、および適切なヌクレオチドの挿入または欠失が伴う、1つの鎖のヌクレオチドが、少なくとも約90%から約95%またはそれ以上の相補性、およびより好ましくは約98%から約100%の相補性、およびさらにより好ましくは100%の相補性を有して対になるときに、2つの一本鎖RNAまたはDNA分子は、実質的に相補的であると言われている。代替的に、RNAまたはDNAの鎖が選択的なハイブリダイゼーション条件下でその補体にハイブリダイズするときに、相当な相補性が存在する。選択的なハイブリダイゼーション条件は、限定されないが、ストリンジェントなハイブリダイゼーション条件を含むか又は含まない。ハイブリダイゼーション温度は、一般に、融解温度(Tm)より少なくとも約2℃から約6℃低い。
【0124】
「二本鎖」は、幾つかの場合において、逆相補的な配向などで、相補的塩基対合によってアニールされた2つのポリヌクレオチド鎖を指す。
【0125】
「既知のオリゴヌクレオチド配列」または「既知のオリゴヌクレオチド」あるいは「既知の配列」は、知られているポリヌクレオチド配列を指す。幾つかの場合では、既知のオリゴヌクレオチド配列は、設計されたオリゴヌクレオチド、例えば、次世代配列決定プラットフォームのためのユニバーサルプライマー(例えば、Illumina、454)、プローブ、アダプター、タグ、プライマー、分子バーコード配列、識別子に対応している。既知の配列は、随意にプライマーの部分を含む。既知のオリゴヌクレオチド配列は、幾つかの場合において、特定のユーザーに実際には知られていないが、例えば、コンピュータによって利用可能なデータとして保存されることによって構造的に知られている。既知の配列は、随意に、実際に知られていないトレードシークレット(trade secret)または1人以上のユーザーに対するシークレットであるが、ユーザーが使用している実験の特定のコンポーネント、キット、装置またはソフトウェアを設計した実体に知られている。
【0126】
「ライブラリ」は、幾つかの場合において核酸の集合を指す。ライブラリは、随意に1つ以上の標的フラグメントを含有する。幾つかの事例では、標的フラグメントは増幅核酸を含む。他の事例では、標的フラグメントは、増幅されない核酸を含む。ライブラリは、随意に、3’末端、5’末端または3’末端および5’末端の両方に加えられた1つ以上の既知のオリゴヌクレオチド配列を有する核酸を含有する。ライブラリは、随意に、フラグメントが、ライブラリのソース(例えば、患者またはDNA源を特定する分子識別バーコード)を特定する既知のオリゴヌクレオチド配列を含有するように調製される。幾つかの事例では、2つ以上のライブラリが、ライブラリプール(library pool)を作り出すために貯蔵される。ライブラリは、随意に、トランスポゾン媒介性の標識化、または当該技術分野で知られているような「タグ付け(tagmentation)」などの、他のキットおよび技術を用いて生成される。キットは市販で入手可能である。キットの1つの限定しない例は、Illumina NEXTERAキット(Illumina,San Diego,CA)である。
【0127】
用語「ポリヌクレオチド」または「核酸」は、限定されないが、様々なDNA、RNA分子、それらの誘導体または組み合わせを含む。これらは、dNTP、ddNTP、DNA、RNA、ペプチド核酸、cDNA、dsDNA、ssDNA、プラスミドDNA、コスミドDNA、染色体DNA、ゲノムDNA、ウイルスDNA、細菌DNA、mtDNA(ミトコンドリアDNA)、mRNA、rRNA、tRNA、nRNA、siRNA、snRNA、snoRNA、scaRNA、マイクロRNA、dsRNA、リボザイム、リボスイッチおよびウイルスRNAなどの種を含む。
【0128】
本発明の方法、組成物およびキットがより詳細に記載される前に、本発明が、記載される特定の方法、組成物またはキットに限定されず、それ故当然のことながら変化することが理解されるべきである。また、本明細書で使用さる用語が、単に特定の実施形態について記述する目的のものであり、本発明の範囲が本明細書で解釈されるような添付の請求項によってのみ限定されるため、限定するようには意図されていないことも理解されるべきである。本発明を作成する及び使用する方法に関するより完全な開示および記載を当業者に提供するように実施例が明記され、これらは、発明者が本発明として見なすものの範囲を限定するようには意図されておらず、以下の実験が、実行されるすべての又は唯一の実験であることを表わすようにも意図されていない。用いられる数(例えば量、温度など)に関して正確であるように努力を重ねてきたが、実験の誤差や偏差について説明が付くものもあるはずであろう。特段他に示されない限り、部分は重量部である、分子量は平均分子量であり、温度は摂氏温度であり、圧力は気圧近くである。
【0129】
様々な値の範囲が提供されている場合、特段の定めのない限り、その範囲の上限と下限の間の、下限の単位の小数第2位までの各々の介在する値が特に開示される。任意の記載された範囲の任意の記載された値またはその間の値と、その記載された範囲の任意の他の記載されたまたは介在する値との間のそれぞれの小さな範囲は本発明内に包含される。こうした小さな範囲の上下限は独立して、範囲に含まれることもあれば、排除されることもあり、その小さな範囲に一方か、両方が含まれるか、またはいずれも含まれない場合、それぞれの範囲は、記載された範囲中の任意の具体的に除外された制限を受けて、本発明に包含される。記載された範囲が1つまたは両方の限界を含む場合、これらの含まれる限界の一方または両方を除外する範囲は本発明にも含まれる。
【0130】
別段の定めのない限り、本明細書に記載される技術的かつ科学的な用語はすべて、本発明が属する技術分野の当業者によって一般に理解されるのと同じ意味を有する。本明細書に記載される方法や材料と類似するまたは同等の任意の方法や材料を本発明の実施または試験の際に随意に使用することができるが、可能性のある、および好ましい方法や材料がここで記載されている。本明細書で言及されるすべての出版物は、出版物の引用の際に関連付けられる方法および/または材料を開示および記載するために参照により本明細書に組み込まれる。本開示は矛盾がある程度まで、組み込まれた出版物の任意の開示に取って代わることが理解されよう。
【0131】
本開示を精読した当業者に明らかとなるように、本明細書で記載および例証された個々の実施形態の各々は、本発明の範囲または精神から逸脱することなく、他の複数の実施形態のいずれかの特徴から容易に分離され得るまたは該特徴と組み合わせ得る別の構成要素と特徴を有している。どの列挙された方法も、列挙された事象の順序で、または論理上可能な他の順序で実行されるように企図される。
【0132】
本明細書および添付の請求項で使用されるように、単数形(「a」、「an」、および「the」)は、文脈で特段の定めのない限り複数形を含むことを理解されたい。したがって、例えば、「細胞(a cell)」への言及はその複数の細胞を含み、「ペプチド(the peptide)」への言及は1つ以上のペプチドとその等価物、例えば、当業者に知られているポリペプチドなどへの言及を含んでいる。
【0133】
本明細書で議論された出版物は、本出願の出願日よりも前に開示するためだけに提供される。本発明が先行発明によるこうした公開に先行するという資格がないという承認として解釈されるものは本明細書には何もない。さらに、提供される公開日は、独立して確認される必要があることがある実際の公開日とは異なり得る。
【0134】
いくつかの実施形態では、本明細書に記載される方法は、(i)核酸試料から、1kb以下などの、比較的小さなDNA分子を除去する工程と、(ii)ヒトゲノム核酸などの、除去されるゲノム核酸が1kb以下の断片の大きさまで消化される場合がある工程と、(iii)上記消化された核酸が、大きさに基づいて分類および選択される工程と、(iv)ライブラリが、上記選択された消化後の材料から作られる工程とを含む。これは、全長cDNAと同様に、ゲノムDNA上で行うことができる。
【実施例
【0135】
以下の例は、本発明の様々な実施形態を例証する目的で与えられ、いかなるやり方でも本発明を制限することを意図していない。本実施例は、本明細書に記載される方法と共に、好ましい実施形態を現時点において代表するものであり、典型的なものであるが、本発明の範囲を制限する意図はない。それらにおける変更、および特許請求の範囲により定義されるような本発明の趣旨に含まれる他の用途を、当業者は見出すだろう。
【0136】
実施例1
感染症の発生における病原体の検出
類似の症状を有し、いずれも既知の病原体に対して陽性ではない被験体の集団が、診療所において存在する。血液試料は各被験体から得られ、核酸が上記試料から抽出される。保護されたオックスフォード・ナノポアアダプターが、被験体の核酸または宿主核酸および病原体核酸を含有する試料核酸の5’および3’末端上へライゲーションされる。上記宿主核酸は、被験体の核酸に対して標的化されるCRISPR/Casを用いて標的化されて、上記宿主核酸において二本鎖切断を作り出される。エキソヌクレアーゼは試料に加えられる。エキソヌクレアーゼは、修飾されたアダプターを消化することができないため、二本鎖切断を有する核酸のみが、エキソヌクレアーゼによって消化される。
残った核酸は、精製され、ナノポアシーケンサを用いて、共通する病原体を識別するために、配列決定される。
【0137】
実施例2
異なる大きさの大腸菌rRNAライブラリの、大腸菌に特異的なCRISPRガイドと汎細菌CRISPRガイドを用いたリボ除去の比較。
リボ除去は、37℃で、1時間、標的部位:Cas9:sgRNAの比率が1:2000:5000で行われる。2種類のNEBNext Ultra II RNAライブラリは調製され、1)大きな断片ライブラリ(5分間の断片化および「520bp」二重ビーズサイズ選択(大抵の産生されるRNAライブラリに典型的ではない)、および2)小さなフラグメント・ライブラリ(15分間の断片化および単一1Xビーズサイズ選択(典型的なRNAライブラリにより類似する)。
【0138】
リボ除去は、以下の3つの方法のうちの1つで行われた。1)1ng入力、1X Ampureビーズクリーンアップ、ゲルサイズ選択(低い入力およびより高い複製速度、多重化にはおそらく理想的ではない、最も厳重なサイズ選択(ゲルを伴う))、2)10ng入力、0.6X Ampureビーズクリーンアップ(より高い入力、中程度のサイズ選択)、および3)10ng入力、1X Ampureビーズクリーンアップ(より高い入力、より弱いサイズ選択)。
【0139】
大腸菌に特異的なガイドを用いたリボ除去は、最適な条件下で(大きなフラグメント・ライブラリ、厳重なサイズ選択)、最高(>99%)をもたらした。それは、より小さなライブラリを用いた場合、より低かった。つまり、0.6X最終ビーズサイズ選択を用いた場合、リボ除去は95%までであったが、一方で、1X最終ビーズサイズ選択を用いた場合、リボ除去は85から90%であった。
【0140】
細菌にちがうガイドを用いたリボ除去もまた、大きなフラグメント・ライブラリ、低い入力、およびゲルベースのサイズ選択を用いた場合、最高(78から90%)であった。細菌にちがうガイドを用いたリボ除去は、小さなフラグメント・ライブラリ、より高い入力、および0.6X Ampureビーズクリーンアップを用いた場合、実質的により低かった(50%まで)。
【0141】
各ライブラリについてのリボ除去の結果は、以下の表2に説明される。
【0142】
【表2】
【0143】
実施例3
大腸菌全RNAからの指向性RNAライブラリ調製ライブラリ。
NEBNext Ultra II Directional RNAライブラリ調製が、100gの大腸菌全RNAからライブラリを調製するのに用いられた。
【0144】
CRISPRガイドは、全ての細菌種を網羅するように設計された。12,368個のガイドの配列を含有するDNAオリゴヌクレオチドは、アレイ上のAgilentによって産生された。
【0145】
上記オリゴは、PCRによって増幅され、その後、3つのインビトロ転写(IVT)キット(Agilent SureGuide T7, Thermo Fisher MegaScript T7およびLucigen AmpliScribe T7-Flash)を用いるAgilent T7 RNAポリメラーゼ媒介性IVTによる5’T7プロモータ配列を用いて転写された。
【0146】
実施例2と同様に、1ngのNEBライブラリは、Cas9およびsgRNAを用いて、1:2000:5000の標的部位:Cas9:sgRNA比率で処理された。
【0147】
リボ除去の後に、0.6X Ampureビーズサイズ選択、PCR(CRISPR処理および未処理試料のそれぞれに、15および11のサイクル)、および1X Ampureビーズサイズ選択が続いた。
【0148】
リボ除去されたライブラリはゲル上で動かされ、500から900bqのフラグメントは、ゲル精製され、MiSeq器具上に積まれた。
【0149】
S.aureusに特異的なCRISPRガイド(100までの特注ガイド)は、リボソームRNAの試料の除去(16Sおよび23S rRNAのそれぞれにアラインする0.05%および0.11%のリード)において最も効果的であった。パーセンテージ・リボ除去は、99.5%よりも大きかった。
【0150】
パーセンテージ・リボ除去は、Agilent IVT産出CRISPR汎細菌ガイド(94から96%のrRNAが取り除かれた)を用いた場合に最高であった。
【0151】
Lucigen IVTキットは、91から94%のリボ除去比率を有するrRNA除去において、より効果的でなかった。 ThermoFisher IVTキットは、79から92%のリボ除去比率を有するrRNA除去において、最も効果的でなかった。
【0152】
各ライブラリについてのリボ除去は、以下の表3に要約される。
【0153】
【表3】
【0154】
実施例4
ヒトリボソームRNA除去
全RNAは、脳、腎臓、肝臓、および心臓から得られた。NGSライブラリは、上記全RNAから調製された。CRISPR Cas9は、上記NGSライブラリにおけるリボソームRNAを消化するのに使用された。サイズ選択はAmpureビーズを使用して行われ、PCRはサイズ選択されたライブラリ上で行われた。
【0155】
ライブラリ特性は、以下の表4に要約される。
【0156】
【表4】
【0157】
各試料に関するリボソーム除去データは、以下の表5に要約される。
【0158】
【表5】
【0159】
実施例5
宿主DNA(大腸菌)の模範的な除去
主要な実験準備の証拠として、宿主除去は、pBR322および大腸菌ゲノムDNAを用いて行われた。各DNA試料は、90%のpBR322および10%の大腸菌ゲノムDNAを含有する。pBR322ガイドRNAは、図3Aのマップにおいて示されるように産出される。crRNAガイドおよびtracrRNAガイドは、焼鈍反応において、単一RNAガイドを得るために焼鈍される。
【0160】
pBR322 RNAガイドは調製され、DNA試料はShrimp Alkaline Phosphataseを用いて脱リン酸化され、Ampureビーズ(1X)を用いてクリーンアップされ、pBR322における2つの部位を標的化するCRISPRガイドを用いて処置された。「EcoRV」RNAガイドは、EcoRV制限部位で切断する。「2069」RNAガイドは、2069bp部位で切断する。実質的には、上記DNA試料はCovarisを用いて断片化され、ライブラリは上記NEB Next Ultra DNA Library Prep Kitを使用して調製された。上記準備は、末端修復、リン酸化、A-テーリングおよびアダプターライゲーションを含み、これらに、0.9x Ampureビーズクリーンアップおよび7、8または10のPCRサイクル(7のサイクル:試料b;8のサイクル:サイクルc、d、e;10のサイクル:試料a)および最終0.9X Ampureビーズクリーンアップ工程が続く。一般に、2つのpBR322RNAガイドのcRNAおよびtracrRNA焼鈍反応に続いて、Cas 9消化反応は、1:100:100状態で実行され、これに、EcoRV消化反応が続いた。試料は、1%のアガロースゲル上で動く。
【0161】
プロトコル(P1)全体は、以下の工程からなる、脱リン酸化->1x AMPureビーズクリーンアップ->RNP形成およびCas9消化->0.6x AMPureビーズクリーンアップ->ラムダエキソヌクレアーゼおよびエキソヌクレアーゼI消化->1x AMPureビーズクリーンアップ->DNA断片化->DNAライブラリ(NEB)。
2つの他のより短いプロトコルは、上記第2のクリーンアップ工程のないプロトコル
、および上記第1のクリーンアップ工程のないプロトコル。
【0162】
第2のクリーンアップ工程(P2)のないプロトコル
脱リン酸化->1x AMPureビーズクリーンアップ->RNP形成およびCas9消化->ラムダエキソヌクレアーゼおよびエキソヌクレアーゼI消化->1x AMPureビーズクリーンアップ->DNA断片化->DNAライブラリ(NEB)。
【0163】
第1のクリーンアップ工程(P3)のないプロトコル
脱リン酸化->RNP形成およびCas9消化->0.6x AMPureビーズクリーンアップ->ラムダエキソヌクレアーゼおよびエキソヌクレアーゼ消化->1x AMPureビーズクリーンアップ->DNA断片化->DNAライブラリ(NEB)。
【0164】
脱リン酸化は、上記大腸菌配列における5’-末端の保護、Shrimp Alkaline Phosphatase (rSAP)酵素を伴う。反応は37℃、65°Cで30分間、5分間実行される。
【0165】
エキソヌクレアーゼ消化反応(2つの別個の工程)
【0166】
ラムダエキソヌクレアーゼ、上記dsDNAの5’から3’末端を切断する。
【0167】
RT、75°Cで30分間、10分間および氷に2分間。
【0168】
エキソヌクレアーゼI、上記ssDNAの3’から5’末端を切断する、37°Cで実行される、30分間。
【0169】
DNA断片化は、DNA剪断反応50ulおよび300bpにおいて行われた。
【0170】
NEB DNAライブラリ調製は、以下の通りに行われた、末端修復、アダプターライゲーション、0.9 x AMPureビーズクリーンアップ、PCR増幅、0.9x AMPureビーズクリーンアップ。
【0171】
図3Bは、試料消化およびアガロースゲル上の動きを示す。
【0172】
模範的な実験では、前ライブラリ消化反応に、不要なDNA(pBR322)のCRISPR消化→不要なDNA(pBR322)のエキソヌクレアーゼ除去→DNAライブラリ調製が続く。2つのpBR322 RNAガイド(1:50+50:100状態)を使用した。IlluminaのためのNEBNext Ultra II DNA Library Prep Kitを、ライブラリ調製のために用いた。複製試料における5つの実験条件→10個の試料、a1、a2、全長プロトコル-試料1および2、b1、b2、全長プロトコル、エキソヌクレアーゼのない-試料1および2、c1、c2、全長プロトコル、Cas9/sgRNAのない-試料1および2、d1、d2、第2のAMPureビーズクリーンアップのないプロトコル-試料1および2、e1、e2、第1のAMPureビーズクリーンアップのないプロトコル-試料1および2。それぞれに関する実験のワークフローは、図4A図4B、および図4Cに示され、これらの図面は上記プロトコルと上記ワークフローを要約する。
【0173】
図5Aおよび図5Bは、ビーズの関連する存在量を例証する。図6Aおよび図6Bは、大腸菌ゲノムの被覆を例証する。
【0174】
表6Aから表6Hは、除去実験の代表的な結果を以下の通りに示す。
【0175】
表6Aは、上記異なるプロトコルを使用する上記試料の詳細な整列の要約を例証する。
【0176】
【表6A】
【0177】
表6Bは、上記異なるプロトコルを使用する複製メートル方の利点を示す。
【0178】
【表6B】
【0179】
表6Cは、挿入についての詳細を示す。
【0180】
【表6C】
【0181】
表6Dは、除去メトリックをゲノムの割合として示す。
【0182】
【表6D】
【0183】
表6Eは、除去メトリックを上記マップされた塩基の割合として示す。
【0184】
【表6E】
【0185】
表6Fは、ゲノム・被覆・メトリックを示す。
【0186】
【表6F】
【0187】
表6Gは、エキソヌクレアーゼ+CRISPRの平均除去被覆および制御を示す。
【0188】
【表6G】
【0189】
表6Hは、関連する収量を示す。
【0190】
【表6H】
【0191】
1つの代表的な実験では、大腸菌ゲノム(試料e)の被覆は、モック-処置制御(試料c)よりも大きい23.35フォールドである。総体的な結果は、最良の条件が脱リン酸化の後およびリボ除去の前のAMPureビーズクリーンアップを含まないことを示す。
【0192】
本明細書に記載される方法は、1つの有機体のゲノムを別の有機体から取り除くために、様々な適用のために用いられる可能性がある。実施例は、動物の体液試料(例えば、ヒトの唾液)における細菌ゲノム(細菌汚染物質)の除去、土壌マイクロバイオームを識別するための、植物ゲノムの土壌からの除去、微生物(例えば、伝染性の細菌またはウイルスなど)を検出するための動物(例えば、ヒト)ゲノムの動物組織または体液試料からの除去を含む。他の動物宿主は、家畜、穀物/植物、または食糧さえも(つまり、ロメインレタス、コリアンダー、サーモンのすすぎなど)含み得る。いくつかの実施形態では、方法は、1つ以上の組成物の汚染された混合物からの試料における除去を含む。例えば、いくつかの実施形態では、方法は、汚染核酸の、1種、2種、3種、4種、5種、6種、7種、8種、10種またはそれ以上の汚染材料の除去を含む。すべての場合における目的は、病原体または微生物(ウイルス、細菌または菌)を検出するために感度を高めることである。本明細書に記載される方法は、唾液の汚染除去において重要であり得る。唾液は、ゲノム研究のための選択肢の分析物となりつつあり、唾液試料の90%近くを占める、宿主除去と口内細菌汚染物質の除去の両方は、特定のバイオマーカまたは病原体の検出に必要かつ不可欠となり得る。一度上記汚染物質が取り除かれると、残りの材料は、配列決定ライブラリの産出、またはバイオマーカまたは病原体のPCRまたはマイクロ・アレイを介した検出において利用される。配列決定は、長い読み取り、短い読み取り、フィールド展開形および貫通重合化、ナノポア、ハイブリダイゼーションとなる可能性があるが、これらに限定はされない。
【0193】
当業者が企図することのできる、上記で議論される使用、または関連する使用あるいは適用の全てを網羅する一般化された方法は、本明細書に提供される。
【0194】
A.DNA試料を得る工程
長さが1kb以下の短い(短め)の分子を取り除く工程。取り除かれるゲノム種を横切って<1kBの距離を空けるガイド標的を用いて、二本鎖核酸を消化するために、CRISPRを使用する工程。その後、上記切断/消化された材料を取り除くための別のサイズ選択。
RNA特異Cascade酵素は、この同じ目的のために用いられる可能性がある。アルゴノートも、上記目的のために用いられる可能性がある。ここで、付加的な修飾がテンプレート分子に対してなされないことに留意することが重要である。サイジングを介する消化後の簡素で物理的な分離が必要となる。
【0195】
いくつかの実施形態では、分子末端を保護する付加的な工程は、上記に記載されるプロセス工程に取り込まれ得る。これは、粘着質な末端を作成するために、ライゲーション、テンプレートスイッチング、脱リン酸化、ニッキング、エキソヌクレアーゼ消化を介してなされる可能性があり、その後、エキソヌクレアーゼ消化を避けるために、ホスホロチオエートオリゴまたは他の核酸で充填する。その後、試料は、CRISPR、またはアルゴノート、または特異的なエンドヌクレアーゼを用いて処置され、これにより、所望でないテンプレート分子を切断し、これに、エキソヌクレアーゼを介した消化が続き、ここで、エンドヌクレアーゼ被覆によって露出される保護されない末端のみが、エキソヌクレアーゼ消化の標的となる。再び、これは、1kb以下の小さい分子を取り除く最初の工程で開始される。
【0196】
C.核酸を試料から単離する工程、1kb以下(または類似の範囲)の分子を取り除くためにサイズ選択をする工程に、所望でないRNA、DNAまたはcDNA分子の一本または二本鎖RNA/DNAガイドエンドヌクレアーゼを介したCRISPR/アルゴノート消化が続く。次の工程では、所望の長いテンプレートの、Phi29などの高い忠実度、高い処理能力のポリメラーゼを介し、ランダム・プライヤー開始を用いたサイズ選択および/または増幅がなされる。この後者のアプローチは、より長いテンプレートを変位増幅を介して優先的に増幅するであろう。より短いテンプレート(核酸ガイドエンドヌクレアーゼ被覆の標的であるもの)は、より長いテンプレートよりも低い比率で増幅し、さらにバックグラウンドを減らす一方で、さらに所望のテンプレートのために濃縮する。これは、より短いテンプレートがランダムプライマのためのプより少ないプライミング部位を有し、それにより、最初のPhi29、30℃でのプライミングの後に、二本鎖のままであり、典型的なランダム・プライミングのPhi29鎖置換ポリメラーゼを用いた分岐増幅を可能にしない。より長いテンプレートは複数のプライマー部位を有し、上記プライマー部位は、伸長産物をそれらのプライマー開始部位の下流(3’)に置換し、より長い分子に置換をさせ、さらなる増幅の標的とする。これに、再び、任意選択のサイズ選択が続く。Phi29増幅時間を長くすることは、より長いテンプレート産物をさらに「偏らせる」ことに影響するはずである。これは、核酸のより小さな開始量を可能にするさらなる利点を有する。
【0197】
再び、1kb以下の分子を取り除くための第1のサイズ選択の後、熱変性(代替的には、RNAを標的とする場合、cDNA合成工程)、その後、非標的分子(細菌または宿主汚染物質)の消化に、別のサイズ選択が続き、Phi29増幅が続く。残りの材料は、主に、所望でないテンプレート分子がないはずであり、上記残りの材料は、DNA配列決定ライブラリへ変換されることができる。
【0198】
本発明の好ましい実施形態が本明細書において示され、かつ記載されているが、こうした実施形態はほんの一例として提供されているに過ぎないということが当業者にとって明白である。多くの変更、変化、および置換が、本発明から逸脱することなく、当業者の心に思い浮かぶであろう。本明細書に記載される実施形態の様々な代案が、利用され得ることを理解されたい。以下の請求項は本発明の範囲を定義するものであり、これらの範囲内の方法、構造体がそれによって包含されるものであるということが意図されている。請求項およびそれらに等しいものは、ここに網羅される。
図1
図2-1】
図2-2】
図2-3】
図2-4】
図3A
図3B
図4A
図4B
図4C
図5A
図5B
図6A
図6B
【国際調査報告】