(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-09-06
(54)【発明の名称】核酸の配列特異的標的化転位並びに選択及び選別
(51)【国際特許分類】
C12N 15/09 20060101AFI20230830BHJP
C40B 40/06 20060101ALI20230830BHJP
C12Q 1/6869 20180101ALI20230830BHJP
C12Q 1/6888 20180101ALI20230830BHJP
C12Q 1/6844 20180101ALI20230830BHJP
C12N 15/10 20060101ALI20230830BHJP
C12N 9/22 20060101ALN20230830BHJP
【FI】
C12N15/09 100
C40B40/06 ZNA
C12Q1/6869 Z
C12Q1/6888 Z
C12Q1/6844 Z
C12N15/10 100Z
C12N9/22
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023503428
(86)(22)【出願日】2021-08-17
(85)【翻訳文提出日】2023-01-18
(86)【国際出願番号】 US2021046292
(87)【国際公開番号】W WO2022040176
(87)【国際公開日】2022-02-24
(32)【優先日】2020-08-18
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2020-08-18
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-03-18
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-03-19
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-03-31
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-08-02
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(71)【出願人】
【識別番号】502279294
【氏名又は名称】イルミナ ケンブリッジ リミテッド
(74)【代理人】
【識別番号】100107489
【氏名又は名称】大塩 竹志
(72)【発明者】
【氏名】ステーメルス, フランク ジェイ.
(72)【発明者】
【氏名】ボーテル, ジョナサン マーク
(72)【発明者】
【氏名】ガッティ ラフランコーニ, ピエトロ
(72)【発明者】
【氏名】ミラー, オリバー ジョン
(72)【発明者】
【氏名】ベル, エマ
(72)【発明者】
【氏名】リクー, セバスチャン ジョルジ ガブリエル
(72)【発明者】
【氏名】ゴームリー, ナイル アンソニー
(72)【発明者】
【氏名】シュナイダー, キム
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA18
4B063QQ42
4B063QQ52
4B063QR08
4B063QR32
4B063QR35
4B063QR55
4B063QR62
4B063QS25
4B063QS34
(57)【要約】
核酸の配列特異的標的化転位を媒介するために使用され得る、様々な異なるタイプの標的化されたトランスポソーム複合体が本明細書に記載される。本明細書にはまた、所望の試料及び不要な試料の両方を含む試料の混合プール中の所望の試料を特徴付ける方法であって、二本鎖核酸から配列データを産生するために、混合プール由来の複数の核酸試料を含むライブラリーを最初にシークエンシングすることであって、各核酸ライブラリーが、単一試料由来の核酸と、単一試料由来の核酸をライブラリー中の他の試料由来の核酸と区別するための固有の試料バーコードとを含む、ことと、配列データを分析し、所望の試料由来の配列データに関連する固有の試料バーコードを識別することと、所望の試料由来の核酸試料を濃縮すること、及び/又は不要な試料由来の核酸試料を枯渇させることを含む選択工程をライブラリーに対して実施することと、核酸ライブラリーを再シークエンシングすることと、を含む、方法も記載される。
【特許請求の範囲】
【請求項1】
標的化されたトランスポソーム複合体であって、
a.トランスポザーゼと、
b.第1のトランスポゾンであって、
i.3’トランスポゾン末端配列と、
ii.5’アダプタ配列と、を含む、第1のトランスポゾンと、
c.ガイドRNAと会合した触媒的に不活性なエンドヌクレアーゼであって、前記ガイドRNAが、1つ以上の目的の核酸配列へのエンドヌクレアーゼの結合を導くことができる、触媒的に不活性なエンドヌクレアーゼと、
d.前記トランスポゾン末端配列の相補体を含む、第2のトランスポゾンと、を含む、標的化されたトランスポソーム複合体。
【請求項2】
前記触媒的に不活性なエンドヌクレアーゼが、シアノバクテリアScytonema hofmanni(ShCAST)由来であり、任意選択的に、
a.前記gRNA及び前記トランスポザーゼのうちの少なくとも1つがビオチン化され、ビオチン化された前記gRNA及び前記トランスポザーゼのうちの少なくとも1つは、ストレプトアビジンでコーティングされたビーズにカップリングすることができ、
b.ShCASTは、Cas12Kを含み、
c.前記トランスポザーゼは、Tn5若しくはTn7様トランスポザーゼを含み、かつ/又は、
d.前記第1のトランスポゾンは、P5アダプタ及びP7アダプタのうちの少なくとも1つを含む、請求項1に記載の標的化されたトランスポソーム複合体。
【請求項3】
標的化されたトランスポソーム複合体であって、
a.トランスポザーゼと、
b.第1のトランスポゾンであって、
i.3’トランスポゾン末端配列と、
ii.5’アダプタ配列と、を含む、第1のトランスポゾンと、
c.ジンクフィンガーDNA結合ドメインであって、前記ジンクフィンガーDNA結合ドメインが1つ以上の目的の核酸配列に結合できる、ジンクフィンガーDNA結合ドメインと、
d.前記トランスポゾン末端配列の相補体を含む、第2のトランスポゾンと、を含む、標的化されたトランスポソーム複合体。
【請求項4】
前記ジンクフィンガーDNA結合ドメインが、ジンクフィンガーヌクレアーゼに含まれ、任意選択的に、前記ジンクフィンガーヌクレアーゼは、触媒的に不活性である、請求項3に記載の標的化されたトランスポソーム複合体。
【請求項5】
前記1つ以上の目的の核酸配列が、ヒストンと会合したDNAに含まれ、任意選択的に、前記ヒストンと会合したDNAは、無細胞DNAである、請求項3又は4に記載の標的化されたトランスポソーム複合体。
【請求項6】
標的核酸の5’タグ付き断片の標的化生成の方法であって、
a.二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である請求項1~5のいずれか一項に記載のトランスポソーム複合体と、を組み合わせることと、
b.前記トランスポザーゼによって前記核酸を複数の断片に断片化することであって、前記第1のトランスポゾンの前記3’末端を前記断片の前記5’末端に連結して複数の5’タグ付き断片を産生することによる、ことと、を含む、方法。
【請求項7】
タグ付き核酸断片のライブラリーを生成する方法であって、
a.二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である請求項1~5のいずれか一項に記載の第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び5’アダプタ配列を含む、第1のトランスポゾンと、
iii.5’トランスポゾン末端配列を含む第2のトランスポゾンであって、前記5’トランスポゾン末端配列は、前記3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体と、を組み合わせる、ことと、
b.前記トランスポザーゼによって前記核酸を複数の断片に断片化することであって、各第1のトランスポゾンの前記3’末端を前記標的断片の前記5’末端に連結して、前記第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び前記第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む、方法。
【請求項8】
タグ付き核酸断片のライブラリーを生成する方法であって、
a.二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である請求項1~5のいずれか一項に記載の第1のトランスポソーム複合体と、標的化されたトランスポソーム複合体である請求項1~5のいずれか一項に記載の第2のトランスポソーム複合体とを組み合わせる、ことと、
b.前記トランスポザーゼによって前記核酸を複数の断片に断片化することであって、各第1のトランスポゾンの前記3’末端を前記標的断片の前記5’末端に連結して、前記第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び前記第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む、方法。
【請求項9】
二本鎖核酸を含む試料を標的化される1つ以上のトランスポソーム複合体と前記組み合わせることが、
a.前記試料をジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼと組み合わせることであって、前記ジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼが、第1の結合パートナーに結合している、ことと、
b.前記トランスポザーゼ並びに第1のトランスポゾン及び第2のトランスポゾンを添加することであって、前記トランスポザーゼが、第2の結合パートナーに結合しており、前記トランスポザーゼは、前記第1の結合パートナー及び前記第2の結合パートナーの対形成によって前記ジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼに結合することができる、ことと、を含む、請求項6~8のいずれか一項に記載の方法。
【請求項10】
標的化されたトランスポソーム複合体であって、
a.トランスポザーゼと、
b.第1のトランスポゾンであって、
i.3’トランスポゾン末端配列と、
ii.5’アダプタ配列と、
iii.リコンビナーゼでコーティングされた標的化オリゴヌクレオチドと、を含み、前記標的化オリゴヌクレオチドが、1つ以上の目的の核酸配列に結合することができる、第1のトランスポゾンと、
c.5’トランスポゾン末端配列を含む第2のトランスポゾンであって、前記5’トランスポゾン末端配列が、前記3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、標的化されたトランスポソーム複合体。
【請求項11】
前記標的化オリゴヌクレオチドの配列が、前記1つ以上の目的の核酸配列と完全に若しくは部分的に相補的であり、かつ/又は、前記リコンビナーゼが、UVSX、Rec233、若しくはRecAである、請求項10に記載のトランスポソーム複合体。
【請求項12】
キット又は組成物であって、標的化されたトランスポソーム複合体である請求項10又は請求項11に記載の第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び5’アダプタ配列を含む、第1のトランスポゾンと、
iii.5’トランスポゾン末端配列を含む第2のトランスポゾンであって、前記5’トランスポゾン末端配列が、前記3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体と、を含む、キット又は組成物。
【請求項13】
標的核酸の5’タグ付き断片の標的化生成の方法であって、
a.二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である請求項10又は11に記載のトランスポソーム複合体と、を組み合わせることと、
b.前記リコンビナーゼによって前記核酸のストランド侵入を開始させることと、
c.前記トランスポザーゼによって前記核酸を複数の断片に断片化することであって、前記第1のトランスポゾンの前記3’末端を前記断片の前記5’末端に連結して複数の5’タグ付き断片を産生することによる、ことと、を含む、方法。
【請求項14】
タグ付き核酸断片のライブラリーを生成する方法であって、
a.二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である請求項10又は11に記載の第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び5’アダプタ配列を含む、第1のトランスポゾンと、
iii.5’トランスポゾン末端配列を含む第2のトランスポゾンであって、前記5’トランスポゾン末端配列が、前記3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体と、を組み合わせる、ことと、
b.前記リコンビナーゼによって前記核酸のストランド侵入を開始させることと、
c.前記トランスポザーゼによって前記核酸を複数の断片に断片化することであって、各第1のトランスポゾンの前記3’末端を前記標的断片の前記5’末端に連結して、前記第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び前記第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む、方法。
【請求項15】
タグ付き核酸断片のライブラリーを生成する方法であって、
a.二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である請求項10又は11に記載の第1のトランスポソーム複合体と、標的化されたトランスポソーム複合体である請求項10又は11に記載の第2のトランスポソーム複合体と、を組み合わせる、ことと、
b.前記リコンビナーゼによって前記核酸のストランド侵入を開始させることと、
c.前記トランスポザーゼによって前記核酸を複数の断片に断片化することであって、各第1のトランスポゾンの前記3’末端を前記標的断片の前記5’末端に連結して、前記第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び前記第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む、方法。
【請求項16】
標的化されたトランスポソーム複合体である前記第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である前記第2のトランスポソーム複合体に含まれる前記標的化オリゴヌクレオチドが異なり、任意選択的に、標的化されたトランスポソーム複合体である前記第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である前記第2のトランスポソーム複合体の前記標的化オリゴヌクレオチドが、前記二本鎖核酸の逆ストランドに結合する、請求項15に記載の方法。
【請求項17】
ストランド侵入を開始させるために使用される温度が、前記トランスポザーゼによる断片化のための最適温度未満であり、任意選択的に、ストランド侵入の開始が27℃~47℃で行われ、かつ/又は、前記断片化が45℃~65℃で行われる、請求項13~16のいずれか一項に記載の方法。
【請求項18】
前記トランスポザーゼの補因子が、侵入開始後かつ断片化前に前記トランスポソーム複合体に添加される、請求項13~17のいずれか一項に記載の方法。
【請求項19】
標的核酸をシークエンシングする際に連続性情報を保存する方法であって、
a.請求項13~18のいずれか一項に記載の方法に従って、前記標的核酸のタグ付き断片を産生することと、
b.前記5’タグ付き断片又は完全二本鎖タグ付き断片をシークエンシングして、前記断片の配列を提供することと、
c.同じ標的化オリゴヌクレオチドの配列を含む断片の配列をグループ化することと、
d.前記同じ標的化オリゴヌクレオチドの配列を含む場合、配列のグループが前記標的核酸内で近接していたと判定することと、を含む、方法。
【請求項20】
標的核酸をシークエンシングする際に連続性情報を保存する方法であって、
a.請求項13~19のいずれか一項に記載の方法に従って、前記標的核酸のタグ付き断片を産生することであって、1つ以上のアダプタ配列が、単一の標的化オリゴヌクレオチド配列に関連する固有分子識別子(UMI)を含む、ことと、
b.前記5’タグ付き断片又は完全二本鎖タグ付き断片をシークエンシングして、前記断片の配列を提供することと、
c.同じUMIの配列を含む断片の配列をグループ化することと、
d.前記同じUMIの配列を含む場合、配列のグループが前記標的核酸内で近接していたと判定することと、を含む、方法。
【請求項21】
核酸の5’タグ付き断片の標的化生成の方法であって、
a.1つ以上の標的化オリゴヌクレオチドを一本鎖核酸を含む試料にハイブリダイズさせることであって、前記1つ以上の標的化オリゴヌクレオチドがそれぞれ、前記核酸中の目的の配列に結合できる、ことと、
b.トランスポソーム複合体であって、
i.トランスポザーゼと、
ii.3’トランスポゾン末端配列及び5’アダプタ配列を含む、第1のトランスポゾンと、
iii.5’トランスポゾン末端配列を含む第2のトランスポゾンであって、前記5’トランスポゾン末端配列は、前記3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、トランスポソーム複合体を適用する、ことと、
c.前記トランスポザーゼによって前記核酸を複数の断片に断片化することであって、前記第1のトランスポゾンの前記3’末端を前記断片の前記5’末端に連結して複数の5’タグ付き断片を産生することによる、ことと、を含む、方法。
【請求項22】
所望の試料及び不要な試料の両方を含む試料の混合プール中の所望の試料を特徴付ける方法であって,
a.二本鎖核酸から配列データを産生するために、前記混合プール由来の複数の核酸試料を含むライブラリーを最初にシークエンシングすることであって、各核酸ライブラリーが、単一試料由来の核酸と、前記単一試料由来の核酸を前記ライブラリー中の他の試料由来の核酸と区別するための固有の試料バーコードとを含む、ことと、
b.前記配列データを分析し、所望の試料由来の配列データに関連する固有の試料バーコードを識別することと、
c.前記ライブラリーに対して選択工程を実施することであって、
i.所望の試料由来の核酸試料を濃縮すること、及び/又は、
ii.不要な試料由来の核酸試料を枯渇させること、を含む、ことと、
d.前記核酸ライブラリーを再シークエンシングすることと、を含む、方法。
【請求項23】
前記試料の混合プールが、細胞の混合プール、核の混合プール、若しくは高分子量DNAの混合プールを含み、かつ/又は、前記固有の試料バーコードが、固有の細胞バーコードである、請求項22に記載の方法。
【請求項24】
a.前記濃縮工程が、ハイブリッド捕捉、触媒的に不活性なエンドヌクレアーゼによる捕捉、若しくは固有の試料バーコード特異的増幅を含む、又は
b.前記枯渇工程が、ハイブリッド捕捉、触媒的に不活性なエンドヌクレアーゼによる捕捉、CRISPR消化、若しくはガイドRNA(gRNA)にカップリングしたShCASTを含む複合体による切断を含む、請求項22又は請求項23のいずれかに記載の方法。
【請求項25】
前記枯渇工程が、gRNAにカップリングしたShCASTを含む複合体による切断を含み、任意選択的に、
a.前記ShCASTが、Cas12Kを含み、
b.前記トランスポザーゼが、Tn5又はTn7様トランスポザーゼを含み、
c.前記不要な試料由来の核酸試料が、二本鎖DNAを含み、かつ/又は、
d.前記gRNA及び前記トランスポザーゼのうちの少なくとも1つがビオチン化され、前記ビオチン化されたgRNA及びトランスポザーゼのうちの少なくとも1つは、ストレプトアビジンでコーティングされたビーズにカップリングすることができる、請求項24に記載の方法。
【請求項26】
前記エンドヌクレアーゼが、1つ以上の固有の試料バーコードに結合するガイドRNAと会合しており、かつ/又は、ガイドRNAが、不要な試料の核酸に関連する固有の試料バーコードに対して指向されており、若しくは、ガイドRNAが、所望の試料の核酸に関連する固有の試料バーコードに対して指向されている、請求項22~25のいずれか一項に記載の方法。
【請求項27】
前記所望の試料が、試料の混合プールの1%、0.1%、0.01%、0.001%、0.0001%、0.00001%、0.000001%、0.0000001%、0.00000001%、又は0.000000001%以下で存在する希少試料である、請求項22~26のいずれか一項に記載の方法。
【請求項28】
前記方法が、固有の試料バーコードを組み込む前に、前記核酸試料を空間的に分離する工程を含み、かつ/又は、前記試料の混合プール由来の複数の核酸試料をシークエンシングする前に、タグメンテーションすることを含む、請求項22~27のいずれか一項に記載の方法。
【請求項29】
固有の試料バーコードが、各核酸試料に組み込まれ、任意選択的に、前記固有の試料バーコードは、単一の連続バーコード又は複数の不連続バーコードである、請求項22~28のいずれか一項に記載の方法。
【請求項30】
前記初期シークエンシング工程が、
a.全ゲノムシークエンシングを含まず、前記再シークエンシング工程が、全ゲノムシークエンシングを含む、
b.標的化シークエンシングを含み、前記再シークエンシング工程が、全ゲノムシークエンシングを含む、
c.1つ以上の遺伝子特異的プライマーを用いる標的化シークエンシングを含み、任意選択的に、前記遺伝子特異的プライマーは、ユニバーサルプライマーテールを含む、かつ/又は、
d.リボソームシークエンシングを含み、前記再シークエンシング工程が、全ゲノムシークエンシングを含む、請求項22~29のいずれか一項に記載の方法。
【請求項31】
前記方法が、環境試料由来の微生物のシークエンシングに使用され、任意選択的に、前記方法が、前記環境試料由来の前記微生物を培養することを含まない、請求項22~30のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
(関連出願の相互参照)
本出願は、各々2020年8月18日に出願された米国特許仮出願第63/066,905号及び同第63/066,906号、2021年3月18日に出願された同第63/162,775号、2021年3月19日に出願された同第63/163,381号、2021年3月31日に出願された同第63/168,753号、並びに2021年8月2日に出願された同第63/228,344号の優先権の利益を主張し、これらの各々は、任意の目的のためにその全体が参照により本明細書に組み込まれる。
【0002】
(配列表)
本出願は、電子フォーマットでの配列表と共に出願されている。配列表は、2021年7月28日に作成され、サイズが4,096バイトである、「2021-07-28_01243-0020-00PCT_Seq_List_ST25」というタイトルのファイルとして提供される。配列表の電子フォーマット中の情報は、参照によりその全体が本明細書に組み込まれる。
【0003】
(発明の分野)
説明
本開示は、核酸の配列特異的標的化転位に関する。標的化されたトランスポソーム複合体を用いて、配列特異的標的化転位を媒介することができる。本開示は、所望の試料を評価するための初期シークエンシング、選択、及び再シークエンシングを含む方法に関する。本明細書に記載されるように、初期シークエンシングにより、混合試料のプール中の目的の試料を同定することができ、次いで、不要な試料を枯渇させるか、又は固有の試料バーコードに基づいて濃縮することができる。次に、所望の試料に対して再シークエンシングを行うことができる。
【背景技術】
【0004】
標的核酸の選択された領域のライブラリー作製は、多くの異なる用途のために所望され得る。例えば、ゲノムDNAの選択された領域からライブラリーを作製する能力は、プラットフォーム出力が制限される場合(例えば、PacBio、ONT、又はiSeq)に望ましい。また、ゲノムDNAの選択された領域についてのライブラリーは、液体生検試料における希少な体細胞変異についてのスクリーニングなど、非常に高い適用範囲が必要とされる場合に有利である。
【0005】
ゲノムDNAの選択された領域からライブラリーを得るための現在の方法としては、オリゴヌクレオチドハイブリダイゼーションに基づく濃縮キット(例えば、TruSeq Exome、Nextera Flex for Enrichment)が挙げられる。更に、そのようなライブラリーを作製するためのCRISPRベースのシステムが最近公開されている。特に、CRISPRベースのシステムは、PacBio及びONTなどのロングリード技術に適している数十~数百キロベースの領域を引き出すために使用されている。
【0006】
本開示は、ゲノムDNAの所望の領域の標的化ライブラリー調製の新たな方法を記載する。これらの方法は、異なる標的化技術を多くの独特な方法でトランスポソームと組み合わせる。更に、本開示は、タグメンテーション前にヒストンの除去を必要としない、無細胞DNA(cfDNA)からの標的化ライブラリー調製の手段を記載する。
【0007】
本開示はまた、細胞のバルク集団の研究時に決定困難である細胞間の相違を解明するために使用され得る単一細胞分析方法を記載する。希少細胞の特徴は、腫瘍学(液体又は腫瘍生検、最小残存病変又は早期疾患検出、腫瘍の進化、又は腫瘍の抵抗性)、免疫学(免疫又はT細胞受容体レパートリー)、及びメタゲノミクス(培養不可能な生物ゲノムアセンブリ)などのいくつかの用途にとって重要であり得る。
図1は、関心対象であり得るメタゲノム試料及び腫瘍学試料のいくつかの代表的な例を提供し、このとき希少細胞は非常に高い関心対象である。単一細胞シークエンシングにおける現在の方法は、例えば、個々の細胞のゲノム、トランスクリプトーム、又はエピゲノムの特徴を研究するために、何百万もの単一細胞を分解した「オミクス」分析を並行して可能にする。
【0008】
しかしながら、集団中の希少細胞の包括的なシークエンシングに基づく特徴は、所望の試料を選択しない場合、費用がかかり、困難である。更に、細胞選別に基づく濃縮方法は、区分可能な細胞特徴の利用可能性に基づいて制限される。例えば、FACSは、特定の細胞サイズ、形態、及び表面タンパク質発現について濃縮することができるが、他の特徴は、FACSによって区分できない場合がある。特定の「オミクス」特徴に基づいて細胞を濃縮すること(例えば、種、細胞型、又は変異体の存在に基づく濃縮)は非常に有用であろう。これらの特徴は、事前に(最新の技術に基づいて)、又は新たに(初期配列分析によって決定され)、知られ得る。また、初期シークエンシング後に目的のものであると同定された単一細胞由来の試料を再シークエンシングすることによって、追跡、包括的/直交「オミクス」特徴付けを行うことも非常に価値がある。
【0009】
異なる単一細胞から作製されたライブラリーを含む複数の細胞DNAライブラリーからなる「単一細胞配列ライブラリー」又は「scライブラリー」からの個々の細胞のDNAライブラリーの選択、濃縮、及びシークエンシングに基づく特徴付けのための方法論が本明細書に開示される。scライブラリーの初期シークエンシング(すなわち、個々の細胞由来の全てのDNAライブラリーのシークエンシング)を行うことができ、バイオインフォマティクス分析を使用して、目的とする特定の「オミクス」特徴に関して個々の細胞を分類することができる。この方法を使用して、異なる個々の細胞から作製されたライブラリーは、固有の細胞DNAバーコード(UBC)によって同定される。選別に使用される「オミクス」特徴は、比較的小さい標的化されたシークエンシングパネルを用いて、細胞型(例えば、発現、エピジェネティックパターン、又は免疫遺伝子組換え)、種型(例えば、細菌由来の16s、18s、又はITS rRNA/rDNA配列を使用)、又は疾患状態/リスク(例えば、がんにおいて重要な生殖系列又は体細胞変異)を定義し得る。言い換えれば、初期シークエンシングのフットプリントは小さくてもよく、再シークエンシングにより、より包括的である、目的の細胞に焦点を合わせたものにすることができる。したがって、当業者は、試料を所望の試料と不要な試料とに分類するための単一の初期シークエンシングの実施と、それに続く所望の試料の標的化再シークエンシングとを使用して、例示的な特徴について数百万又は数十億の細胞を照会することができる。
【0010】
あるいは、初期シークエンシングを実施して、追跡分析のための例示的な「オミクス」細胞特徴を新たに同定することができる。例えば、初期シークエンシングを実施し、その後分類に使用され得る新たな細胞特徴を同定することができる。
【0011】
本方法における濃縮又は枯渇は、既知の核酸標的濃縮法(例えば、ハイブリッド捕捉、固有の試料バーコード特異的増幅、又はCRISPR消化)によって実施され得る。次いで、目的の細胞由来の個々の細胞DNAを再度シークエンシングし、完全なscライブラリーからの単離において特徴付けし得る。したがって、本方法は、細胞の選別に実施する初期シークエンシングの実行後に、より包括的及び/又は直交的な再シークエンシング及び分析を可能にすることができる。
【発明の概要】
【課題を解決するための手段】
【0012】
本開示は、いくつかの異なる標的化されたトランスポソーム複合体を記載し、これは、トランスポソーム複合体が標的核酸中の1つ以上の目的の核酸配列に結合するように導く1つ以上のエレメントを含む。これらの標的化されたトランスポソーム複合体を使用するいくつかの方法も本明細書に記載される。
【0013】
この説明によれば、所望の試料及び不要な試料の両方を含む試料の混合プール中の所望の試料を特徴付ける方法も記載される。
【0014】
実施形態1.標的化されたトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドであって、標的化オリゴヌクレオチドは、1つ以上の目的の核酸配列に結合することができる、標的化オリゴヌクレオチドと、5’トランスポゾン末端配列を含む第2のトランスポゾンであって、5’トランスポゾン末端配列は、3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、標的化されたトランスポソーム複合体。
【0015】
実施形態2.標的化オリゴヌクレオチドの配列が、1つ以上の目的の核酸配列と完全に又は部分的に相補的である、実施形態1に記載のトランスポソーム複合体。
【0016】
実施形態3.1つ以上の標的化オリゴヌクレオチドが、アダプタ配列の5’末端に連結されている、実施形態1又は2のいずれか1つに記載のトランスポソーム複合体。
【0017】
実施形態4.1つ以上の標的化オリゴヌクレオチドが、アダプタ配列の5’末端に直接連結されている、実施形態1~3のいずれか1つに記載のトランスポソーム複合体。
【0018】
実施形態5.1つ以上の標的化オリゴヌクレオチドが、アダプタ配列の5’末端にリンカーを介して連結されている、実施形態1~4のいずれか1つに記載のトランスポソーム複合体。
【0019】
実施形態6.リンカーが、オリゴヌクレオチドリンカーである、実施形態1~5に記載のトランスポソーム複合体。
【0020】
実施形態7.リンカーが、非オリゴヌクレオチドリンカーである、実施形態1~6に記載のトランスポソーム複合体。
【0021】
実施形態8.アダプタ配列の5’末端及び標的化オリゴヌクレオチドが両方ともビオチン化され、ストレプトアビジンを介して連結されている、実施形態1~7に記載のトランスポソーム複合体。
【0022】
実施形態9.アダプタ配列が、プライマー配列、インデックスタグ配列、捕捉配列、バーコード配列、切断配列、若しくはシークエンシング関連配列、又はこれらの組み合わせを含む、実施形態1~8のいずれか1つに記載のトランスポソーム複合体。
【0023】
実施形態10.アダプタ配列が、P5又はP7配列を含む、実施形態1~9に記載のトランスポソーム複合体。
【0024】
実施形態11.リコンビナーゼが、UVSX、Rec233、又はRecAである、実施形態1~10のいずれか1つに記載のトランスポソーム複合体。
【0025】
実施形態12.トランスポソーム複合体が、溶液中にある、実施形態1~11のいずれか1つに記載のトランスポソーム複合体。
【0026】
実施形態13.トランスポソーム複合体が、固体支持体に固定されている、実施形態1~12のいずれか1つに記載の方法。
【0027】
実施形態14.固体支持体がビーズである、実施形態1~13に記載のトランスポソーム複合体。
【0028】
実施形態15.キット又は組成物であって、標的化されたトランスポソーム複合体である実施形態1~14のいずれか1つに記載の第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、キット又は組成物。
【0029】
実施形態16.それぞれが標的化されたトランスポソーム複合体である、実施形態1~14のいずれか1つに記載の2つのトランスポソーム複合体を含み、2つの標的化されたトランスポソーム複合体が、異なる標的化オリゴヌクレオチドを含む、キット又は組成物。
【0030】
実施形態17.標的核酸の5’タグ付き断片の標的化された生成の方法であって、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である実施形態1~14のいずれか1つに記載のトランスポソーム複合体とを組み合わせることと、リコンビナーゼによって核酸のストランド侵入を開始させることと、トランスポザーゼによって核酸を複数の断片に断片化することであって、第1のトランスポゾンの3’末端を断片の5’末端に連結して複数の5’タグ付き断片を産生することによる、断片化することと、を含む、方法。
【0031】
実施形態18.タグ付き核酸断片のライブラリーを生成する方法であって、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である実施形態1~14のいずれか1つに記載の第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体と、を組み合わせることと、リコンビナーゼによって核酸のストランド侵入を開始させることと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、断片化することと、を含む、方法。
【0032】
実施形態19.タグ付き核酸断片のライブラリーを生成する方法であって、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である実施形態1~14のいずれか1つに記載の第1のトランスポソーム複合体と、標的化されたトランスポソーム複合体である実施形態1~14のいずれか1つに記載の第2のトランスポソーム複合体とを組み合わせる、ことと、リコンビナーゼによって核酸のストランド侵入を開始させることと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、断片化することと、を含む、方法。
【0033】
実施形態20.第1のトランスポソーム複合体及び第2のトランスポソーム複合体に含まれる5’アダプタ配列が異なる、実施形態17~19のいずれか1つに記載の方法、又は実施形態15若しくは実施形態16に記載のキット若しくは組成物。
【0034】
実施形態21.標的化されたトランスポソーム複合体である第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である第2のトランスポソーム複合体に含まれる標的化オリゴヌクレオチドが異なる、実施形態19に記載の方法。
【0035】
実施形態22.標的化されたトランスポソーム複合体である第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である第2のトランスポソーム複合体の標的化オリゴヌクレオチドが、標的核酸中の所与の目的の領域内の異なる目的の配列に結合する、実施形態21に記載の方法。
【0036】
実施形態23.標的化されたトランスポソーム複合体である第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である第2のトランスポソーム複合体の標的化オリゴヌクレオチドが、二本鎖核酸の逆ストランドに結合する、実施形態22に記載の方法。
【0037】
実施形態24.リコンビナーゼによる核酸のストランド侵入の開始が、リコンビナーゼローディング因子の存在下で行われ、任意選択的に、リコンビナーゼローディング因子は、断片化の前に除去又は不活性化される、実施形態17~23のいずれか1つに記載の方法。
【0038】
実施形態25.ストランド侵入の開始が、置換ループ形成を介して起こる、実施形態17~24のいずれか1つに記載の方法。
【0039】
実施形態26.ストランド侵入が、1つ以上の目的の配列への標的化オリゴヌクレオチドの結合部位から40、30、20、15、10、又は5塩基以内で開始される、実施形態17~25のいずれか1つに記載の方法。
【0040】
実施形態27.ストランド侵入を開始させるために使用される温度が、トランスポザーゼによる断片化のための最適温度とは異なる、実施形態17~26のいずれか1つに記載の方法。
【0041】
実施形態28.ストランド侵入を開始させるために使用される温度が、トランスポザーゼによる断片化のための最適温度未満である、実施形態27に記載の方法。
【0042】
実施形態29.ストランド侵入の開始が、27℃~47℃で行われる、実施形態28に記載の方法。
【0043】
実施形態30.ストランド侵入の開始が、32℃~42℃で行われる、実施形態29に記載の方法。
【0044】
実施形態31.ストランド侵入の開始が、37℃で行われる、実施形態30に記載の方法。
【0045】
実施形態32.断片化が、45℃~65℃で行われる、実施形態28のいずれか1つに記載の方法。
【0046】
実施形態33.断片化が、50℃~60℃で行われる、実施形態32のいずれか1つに記載の方法。
【0047】
実施形態34.断片化が、55℃で行われる、実施形態33のいずれか1つに記載の方法。
【0048】
実施形態35.トランスポザーゼの補因子が、侵入開始後かつ断片化前にトランスポソーム複合体に添加される、実施形態17~34のいずれか1つに記載の方法。
【0049】
実施形態36.補因子がMg++である、実施形態35に記載の方法。
【0050】
実施形態37.Mg++濃度が、10mM~18mMである、実施形態36に記載の方法。
【0051】
実施形態38.断片化が、標的化オリゴヌクレオチドによって結合される核酸配列中の1つ以上の目的の配列から40、30、20、15、10、又は5塩基以内で生じる、実施形態17~37のいずれか1つに記載の方法。
【0052】
実施形態39.複数の5’タグ付き標的断片をポリメラーゼ及びリガーゼで処理して、完全二本鎖タグ付き断片を産生するように鎖を伸長かつライゲーションすることを更に含む、実施形態17~38のいずれか1つに記載の方法。
【0053】
実施形態40.5’タグ付き標的断片又は完全二本鎖タグ付き断片のうちの1つ以上をシークエンシングすることを更に含む、実施形態17~39のいずれか1つに記載の方法。
【0054】
実施形態41.標的核酸をシークエンシングする際に連続性情報を保存する方法であって、実施形態17~40のいずれか1つに記載の方法に従って標的核酸のタグ付き断片を産生することと、5’タグ付き断片又は完全二本鎖タグ付き断片をシークエンシングして、断片の配列を提供することと、同じ標的化オリゴヌクレオチドの配列を含む断片の配列をグループ化することと、同じ標的化オリゴヌクレオチドの配列を含む場合、配列のグループが標的核酸内で近接していたと判定することと、を含む、方法。
【0055】
実施形態42.標的核酸をシークエンシングする際に連続性情報を保存する方法であって、実施形態17~40のいずれか1つに記載の方法に従って標的核酸のタグ付き断片を生成することであって、1つ以上のアダプタ配列が、単一の標的化オリゴヌクレオチド配列に関連する固有分子識別子(UMI)を含む、ことと、5’タグ付き断片又は完全二本鎖タグ付き断片をシークエンシングして、断片の配列を提供することと、同じUMIの配列を含む断片の配列をグループ化することと、同じUMIの配列を含む場合、配列のグループが標的核酸内で近接していたと判定することと、を含む、方法。
【0056】
実施形態43.核酸の5’タグ付き断片の標的化生成の方法であって、1つ以上の標的化オリゴヌクレオチドを一本鎖核酸を含む試料にハイブリダイズさせることであって、1つ以上の標的化オリゴヌクレオチドがそれぞれ、核酸中の目的の配列に結合できる、ことと、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、トランスポソーム複合体を適用する、ことと、トランスポザーゼによって核酸を複数の断片に断片化することであって、第1のトランスポゾンの3’末端を断片の5’末端に連結して複数の5’タグ付き断片を産生することによる、ことと、を含む、方法。
【0057】
実施形態44.二本鎖DNAが変性されて、一本鎖DNAを生成する、実施形態43に記載の方法。
【0058】
実施形態45.標的化オリゴヌクレオチドを一本鎖核酸を含む試料にハイブリダイズさせることにより、断片化され得る二本鎖核酸の領域が生成される、実施形態43~44のいずれか1つに記載の方法。
【0059】
実施形態46.異なる配列を有する2つ以上の標的化オリゴヌクレオチドがハイブリダイズされる、実施形態43~45のいずれか1つに記載の方法。
【0060】
実施形態47.単一の標的化オリゴヌクレオチドの複数のコピーがハイブリダイズされる、実施形態43~45のいずれか1つに記載の方法。
【0061】
実施形態48.単一の標的化オリゴヌクレオチドが、単一の標的化オリゴヌクレオチドを一本鎖核酸を含む試料にハイブリダイズさせることによって生成される二本鎖核酸への2つのトランスポソーム複合体の結合を可能にするのに十分な長さである、実施形態47に記載の方法。
【0062】
実施形態49.単一の標的化オリゴヌクレオチドが、80、90、100、110、120、130、140、150、160、170、180、190、又は200塩基対を含む、実施形態47又は実施形態48に記載の方法。
【0063】
実施形態50.断片化が、1つ以上の標的化オリゴヌクレオチドによって結合される核酸配列中の1つ以上の目的の配列内で生じる、実施形態43~49のいずれか1つに記載の方法。
【0064】
実施形態51.複数の5’タグ付き標的断片をポリメラーゼ及びリガーゼで処理して、完全二本鎖タグ付き断片を産生するように鎖を伸長かつライゲーションすることを更に含む、実施形態43~50のいずれか1つに記載の方法。
【0065】
実施形態52.5’タグ付き標的断片又は完全二本鎖タグ付き断片のうちの1つ以上をシークエンシングすることを更に含む、実施形態43~51のいずれか1つに記載の方法。
【0066】
実施形態53.トランスポザーゼと、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、ガイドRNAと会合した触媒的に不活性なエンドヌクレアーゼであって、ガイドRNAが、1つ以上の目的の核酸配列へのエンドヌクレアーゼの結合を導くことができる、触媒的に不活性なエンドヌクレアーゼと、トランスポゾン末端配列の相補体を含む、第2のトランスポゾンと、を含む、標的化されたトランスポソーム複合体。
【0067】
実施形態54.触媒的に不活性なエンドヌクレアーゼが核酸に結合するが、切断を開始しない、実施形態53に記載のトランスポソーム複合体。
【0068】
実施形態55.ガイドRNAが、単一ガイドRNAである、実施形態53又は実施形態54に記載のトランスポソーム複合体。
【0069】
実施形態56.触媒的に不活性なエンドヌクレアーゼが、トランスポザーゼと会合している、実施形態53~55のいずれか1つに記載のトランスポソーム複合体。
【0070】
実施形態57.触媒的に不活性なエンドヌクレアーゼが、トランスポザーゼに連結されている、実施形態56に記載のトランスポソーム複合体。
【0071】
実施形態58.トランスポザーゼ及び触媒的に不活性なエンドヌクレアーゼが、CRISPR関連トランスポザーゼに含まれる、実施形態53~57のいずれか1つに記載のトランスポソーム複合体。
【0072】
実施形態59.CRISPR関連トランスポザーゼが、シアノバクテリアScytonema hofmanni(ShCAST)由来であり、任意選択的に、
a.ShCASTはガイドRNAにカップリングし、任意選択的に、gRNA及びトランスポザーゼのうちの少なくとも1つがビオチン化され、ビオチン化されたgRNA及びトランスポザーゼのうちの少なくとも1つは、ストレプトアビジンでコーティングされたビーズにカップリングすることができ、
b.ShCASTはCas12Kを含み、
c.トランスポザーゼは、Tn5又はTn7様トランスポザーゼを含み、任意選択的に、第1のトランスポゾンは、P5アダプタ及びP7アダプタのうちの少なくとも1つを含む、実施形態58に記載のトランスポソーム複合体。
【0073】
実施形態60.触媒的に不活性なエンドヌクレアーゼが、トランスポザーゼの5’末端に連結されている、実施形態57に記載のトランスポソーム複合体。
【0074】
実施形態61.触媒的に不活性なエンドヌクレアーゼが、トランスポザーゼの3’末端に連結されている、実施形態57に記載のトランスポソーム複合体。
【0075】
実施形態62.トランスポザーゼが、触媒的に不活性なエンドヌクレアーゼの5’末端に連結されている、実施形態57に記載のトランスポソーム複合体。
【0076】
実施形態63.トランスポザーゼが、触媒的に不活性なエンドヌクレアーゼの3’末端に連結されている、実施形態57に記載のトランスポソーム複合体。
【0077】
実施形態64.触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼが、融合タンパク質に含まれる、実施形態53~63のいずれか1つに記載のトランスポソーム複合体。
【0078】
実施形態65.触媒的に不活性及びトランスポザーゼが、リンカーを介して連結されている、実施形態64に記載のトランスポソーム複合体。
【0079】
実施形態66.触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼが、別個のタンパク質に含まれる、実施形態53~56のいずれか1つに記載のトランスポソーム複合体。
【0080】
実施形態67.別個の触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼが、結合パートナーの対形成を介して互いに会合することができ、第1の結合パートナーは触媒的に不活性なエンドヌクレアーゼに結合し、第2の結合パートナーはトランスポザーゼに結合する、実施形態66に記載のトランスポソーム複合体。
【0081】
実施形態68.結合パートナーが、ビオチン及びストレプトアビジン/アビジンである、実施形態67に記載のトランスポソーム複合体。
【0082】
実施形態69.単一ガイドRNAが、第1及び/又は第2のトランスポゾンを含むオリゴヌクレオチドに含まれる、実施形態55~68のいずれか1つに記載のトランスポソーム複合体。
【0083】
実施形態70.オリゴヌクレオチドが、5’単一ガイドRNA並びに3’第1及び/又は第2のトランスポゾンを含む、実施形態69に記載のトランスポソーム複合体。
【0084】
実施形態71.単一ガイドRNAが、20個未満のヌクレオチドを含む、実施形態53~70のいずれか1つに記載のトランスポソーム複合体。
【0085】
実施形態72.単一ガイドRNA配列が、15、16、17、18、又は19個のヌクレオチドを含む、実施形態71に記載のトランスポソーム複合体。
【0086】
実施形態73.単一ガイドRNAが、ヘアピン二次構造を含む、実施形態53~72のいずれか1つに記載のトランスポソーム複合体。
【0087】
実施形態74.触媒的に不活性なエンドヌクレアーゼが、Cas9タンパク質である、実施形態53~73のいずれか1つに記載のトランスポソーム複合体。
【0088】
実施形態75.Cas9タンパク質が、Streptococcus canisのCas9である、実施形態74に記載のトランスポソーム複合体。
【0089】
実施形態76.Streptococcus canisのCas9が、最小限の配列制約を有する、実施形態53~75のいずれか1つに記載のトランスポソーム複合体。
【0090】
実施形態77.標的化されたトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、ジンクフィンガーDNA結合ドメインであって、ジンクフィンガーDNA結合ドメインが1つ以上の目的の核酸配列に結合できる、ジンクフィンガーDNA結合ドメインと、トランスポゾン末端配列の相補体を含む第2のトランスポゾンと、を含む、標的化されたトランスポソーム複合体。
【0091】
実施形態78.ジンクフィンガーDNA結合ドメインが、ジンクフィンガーヌクレアーゼに含まれる、実施形態77に記載の標的化されたトランスポソーム複合体。
【0092】
実施形態79.ジンクフィンガーヌクレアーゼが、触媒的に不活性である、実施形態78に記載の標的化されたトランスポソーム複合体。
【0093】
実施形態80.1つ以上の目的の核酸配列が、ヒストンと会合したDNAに含まれる、実施形態77~79のいずれか1つに記載の標的化されたトランスポソーム複合体。
【0094】
実施形態81.ヒストンと会合したDNAが、無細胞DNAである、実施形態80の標的化されたトランスポソーム複合体。
【0095】
実施形態82.第1のトランスポゾンが、親和性エレメントを含む、実施形態77~81のいずれか1つに記載の標的化されたトランスポソーム複合体。
【0096】
実施形態83.親和性エレメントが、第1のトランスポゾンの5’末端に結合している、実施形態82に記載の標的化されたトランスポソーム複合体。
【0097】
実施形態84.第1のトランスポゾンが、リンカーを含む、実施形態82~83のいずれか1つに記載の標的化されたトランスポソーム複合体。
【0098】
実施形態85.リンカーが、第1のトランスポゾンの5’末端に結合した第1の末端と、親和性エレメントに結合した第2の末端とを有する、実施形態84に記載の標的化されたトランスポソーム複合体。
【0099】
実施形態86.第2のトランスポゾンが、親和性エレメントを含む、実施形態77~85のいずれか1つに記載の標的化されたトランスポソーム複合体。
【0100】
実施形態87.親和性エレメントが、第2のトランスポゾンの3’末端に結合している、実施形態86に記載の標的化されたトランスポソーム複合体。
【0101】
実施形態88.第2のトランスポゾンが、リンカーを含む、実施形態82~85のいずれか1つに記載の標的化されたトランスポソーム複合体。
【0102】
実施形態89.リンカーが、第2のトランスポゾンの3’末端に結合した第1の末端と、親和性エレメントに結合した第2の末端とを有する、実施形態88に記載の標的化されたトランスポソーム複合体。
【0103】
実施形態90.親和性エレメントが、ビオチンである、実施形態82~89のいずれか1つに記載の標的化されたトランスポソーム複合体。
【0104】
実施形態91.複合体が、ジンクフィンガーDNA結合ドメインアレイを含む、実施形態77~90に記載の標的化されたトランスポソーム複合体。
【0105】
実施形態92.ジンクフィンガーDNA結合ドメインが、トランスポザーゼと会合している、実施形態77~91に記載のトランスポソーム複合体。
【0106】
実施形態93.ジンクフィンガーDNA結合ドメインが、トランスポザーゼに連結されている、実施形態92に記載のトランスポソーム複合体。
【0107】
実施形態94.ジンクフィンガーDNA結合ドメインが、トランスポザーゼの5’末端に連結されている、実施形態93に記載のトランスポソーム複合体。
【0108】
実施形態95.ジンクフィンガーDNA結合ドメインが、トランスポザーゼの3’末端に連結されている、実施形態93に記載のトランスポソーム複合体。
【0109】
実施形態96.トランスポザーゼが、ジンクフィンガーDNA結合ドメインの5’末端に連結されている、実施形態94又は95のトランスポソーム複合体。
【0110】
実施形態97.トランスポザーゼが、ジンクフィンガーDNA結合ドメインの3’末端に連結されている、実施形態94又は95のトランスポソーム複合体。
【0111】
実施形態98.ジンクフィンガーDNA結合ドメイン及びトランスポザーゼが、融合タンパク質に含まれる、実施形態77~97のいずれか1つに記載のトランスポソーム複合体。
【0112】
実施形態99.ジンクフィンガーDNA結合ドメイン及びトランスポザーゼが、リンカーを介して連結されている、実施形態77~98のいずれか1つに記載のトランスポソーム複合体。
【0113】
実施形態100.ジンクフィンガーDNA結合ドメイン及びトランスポザーゼが、別個のタンパク質に含まれる、実施形態77~92のいずれか1つに記載のトランスポソーム複合体。
【0114】
実施形態101.別個のジンクフィンガーDNA結合ドメイン及びトランスポザーゼが、結合パートナーの対形成を介して互いに会合することができ、第1の結合パートナーは触媒的に不活性なエンドヌクレアーゼに結合し、第2の結合パートナーはトランスポザーゼに結合する、実施形態100に記載のトランスポソーム複合体。
【0115】
実施形態102.結合パートナーが、(i)ビオチン及び(ii)ストレプトアビジン又はアビジンである、実施形態101に記載のトランスポソーム複合体。
【0116】
実施形態103.アダプタ配列が、プライマー配列、インデックスタグ配列、捕捉配列、バーコード配列、切断配列、若しくはシークエンシング関連配列、又はこれらの組み合わせを含む、実施形態53~102のいずれか1つに記載のトランスポソーム複合体。
【0117】
実施形態104.アダプタ配列が、P5又はP7配列を含む、実施形態53~103に記載のトランスポソーム複合体。
【0118】
実施形態105.トランスポソーム複合体が、溶液中にある、実施形態53~104のいずれか1つに記載のトランスポソーム複合体。
【0119】
実施形態106.トランスポソーム複合体が、固体支持体に固定されている、実施形態53~105のいずれか1つに記載のトランスポソーム複合体。
【0120】
実施形態107.固体支持体がビーズである、実施形態106に記載のトランスポソーム複合体。
【0121】
実施形態108.キット又は組成物であって、標的化されたトランスポソーム複合体である実施形態53~107のいずれか1つに記載の第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、キット又は組成物。
【0122】
実施形態109.それぞれが標的化されたトランスポソーム複合体である、実施形態53~107のいずれか1つに記載の2つのトランスポソーム複合体を含み、2つの標的化されたトランスポソーム複合体が、異なるガイドRNAを含む、実施形態108に記載のキット又は組成物。
【0123】
実施形態110.それぞれが標的化されたトランスポソーム複合体である、実施形態108又は109のいずれか1つに記載の2つのトランスポソーム複合体を含み、2つの標的化されたトランスポソーム複合体が、異なるジンクフィンガーDNA結合ドメインを含む、キット又は組成物。
【0124】
実施形態111.標的核酸の5’タグ付き断片の標的化された生成の方法であって、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である実施形態53~107のいずれか1つに記載のトランスポソーム複合体とを組み合わせることと、トランスポザーゼによって核酸を複数の断片に断片化することであって、第1のトランスポゾンの3’末端を断片の5’末端に連結して複数の5’タグ付き断片を産生することによる、ことと、を含む、方法。
【0125】
実施形態112.タグ付き核酸断片のライブラリーを生成する方法であって、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である実施形態53~107のいずれか1つに記載の第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体とを組み合わせる、ことと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む、方法。
【0126】
実施形態113.タグ付き核酸断片のライブラリーを生成する方法であって、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である実施形態53~107のいずれか1つに記載の第1のトランスポソーム複合体と、標的化されたトランスポソーム複合体である実施形態53~107のいずれか1つに記載の第2のトランスポソーム複合体とを組み合わせる、ことと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む、方法。
【0127】
実施形態114.第1及び/又は第2の標的化されたトランスポソーム複合体が、ジンクフィンガーDNA結合ドメインを含む、実施形態111~113のいずれか1つに記載の方法。
【0128】
実施形態115.ジンクフィンガーDNA結合ドメインが、ジンクフィンガーヌクレアーゼに含まれる、実施形態114に記載の方法。
【0129】
実施形態116.ジンクフィンガーヌクレアーゼが、触媒的に不活性である、実施形態115に記載の方法。
【0130】
実施形態117.標的化されたトランスポソーム複合体に含まれる第1のトランスポゾンが、親和性エレメントを含む、実施形態111~116のいずれか1つに記載の方法。
【0131】
実施形態118.親和性エレメントが、第1のトランスポゾンの5’末端に結合している、実施形態117に記載の方法。
【0132】
実施形態119.標的化されたトランスポソーム複合体に含まれる第1のトランスポゾンが、リンカーを含む、実施形態118のいずれか1つに記載の方法。
【0133】
実施形態120.リンカーが、第1のトランスポゾンの5’末端に結合した第1の末端と、親和性エレメントに結合した第2の末端とを有する、実施形態119に記載の方法。
【0134】
実施形態121.第2のトランスポゾンが、親和性エレメントを含む、実施形態111~120のいずれか1つに記載の方法。
【0135】
実施形態122.親和性エレメントが、第2のトランスポゾンの3’末端に結合している、実施形態121に記載の方法。
【0136】
実施形態123.第2のトランスポゾンが、リンカーを含む、実施形態121に記載の方法。
【0137】
実施形態124.リンカーが、第2のトランスポゾンの3’末端に結合した第1の末端と、親和性エレメントに結合した第2の末端とを有する、実施形態123に記載の方法。
【0138】
実施形態125.親和性エレメントが、ビオチンである、実施形態117~124のいずれか1つに記載の方法。
【0139】
実施形態126.二本鎖核酸が、DNAを含む、実施形態111~125のいずれか1つに記載の方法。
【0140】
実施形態127.DNAが、ヒストンと会合したDNAを含む、実施形態126に記載の方法。
【0141】
実施形態128.ヒストンと会合したDNAが、無細胞DNAである、実施形態127に記載の方法。
【0142】
実施形態129.無細胞DNAが、ジンクフィンガーDNA結合ドメインと組み合わせる前にプロテアーゼで処理されていない、実施形態127又は実施形態128に記載の方法。
【0143】
実施形態130.断片化後に固体支持体上に親和性結合パートナーを添加することを更に含み、タグ付き標的断片が固体支持体に結合される、実施形態111~129のいずれか1つに記載の方法。
【0144】
実施形態131.断片化が、固体支持体上に親和性エレメントを添加する前に停止される、実施形態130に記載の方法。
【0145】
実施形態132.断片化が、プロテイナーゼK及び/又はSDSを含む溶液の添加によって停止される、実施形態131に記載の方法。
【0146】
実施形態133.二本鎖核酸を含む試料と標的化された1つ以上のトランスポソーム複合体と組み合わせることが、試料をジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼと組み合わせることであって、ジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼが第1の結合パートナーに結合している、ことと、トランスポザーゼ並びに第1及び第2のトランスポゾンを添加することであって、トランスポザーゼが第2の結合パートナーに結合しており、トランスポザーゼが第1及び第2の結合パートナーの対形成によってジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼに結合することができる、ことと、を含む、実施形態111~132のいずれか1つに記載の方法。
【0147】
実施形態134.試料を、ジンクフィンガーDNA結合ドメインと組み合わせる、実施形態133に記載の方法。
【0148】
実施形態135.ジンクフィンガーDNA結合ドメインが、ジンクフィンガーヌクレアーゼに含まれる、実施形態134に記載の方法。
【0149】
実施形態136.ジンクフィンガーヌクレアーゼが、触媒的に不活性である、実施形態135に記載の方法。
【0150】
実施形態137.二本鎖核酸が、DNAを含む、実施形態133~136のいずれか1つに記載の方法。
【0151】
実施形態138.二本鎖核酸が、ヒストンと会合したDNAを含む、実施形態137に記載の方法。
【0152】
実施形態139.ヒストンと会合したDNAが、無細胞DNAである、実施形態138に記載の方法。
【0153】
実施形態140.無細胞DNAが、ジンクフィンガーDNA結合ドメインと組み合わせる前にプロテアーゼで処理されていない、実施形態139に記載の方法。
【0154】
実施形態141.方法が、組み合わせた後かつ添加前に洗浄することを含む、実施形態133~140のいずれか1つに記載の方法。
【0155】
実施形態142.標的化された第1のトランスポソーム複合体及び標的化された第2のトランスポゾン複合体が、二本鎖核酸の逆ストランドに結合し、第1のトランスポソーム複合体は第1のトランスポソーム複合体結合部位に結合し、第2のトランスポソーム複合体は第2のトランスポソーム複合体結合部位に結合する、実施形態133~141のいずれか1つに記載の方法。
【0156】
実施形態143.第1の5’タグ付き標的断片及び第2の5’タグ付き標的断片が、第1のトランスポソーム複合体結合部位と第2のトランスポソーム複合体結合部位との間の二本鎖核酸の領域に含まれる核酸配列を含む、実施形態142に記載の方法。
【0157】
実施形態144.第1の5’タグ付き標的断片及び第2の5’タグ付き断片が、少なくとも部分的に相補的である、実施形態143に記載の方法。
【0158】
実施形態145.トランスポソーム複合体が、標的DNAと化学量論的にほぼ等しい、実施形態133~144のいずれか1つに記載の方法。
【0159】
実施形態146.二価カチオンが、組み合わせ中に存在しない、実施形態133~145のいずれか1つに記載の方法。
【0160】
実施形態147.Ca2+及び/又はMn2+が、組み合わせ中に存在する、実施形態133~145のいずれか1つに記載の方法。
【0161】
実施形態148.組み合わせた後かつ断片化前に、試料に1つ以上の二価カチオンを添加することを更に含む、実施形態133~145のいずれか1つに記載の方法。
【0162】
実施形態149.二価カチオンが、Mg2+である、実施形態148に記載の方法。
【0163】
実施形態150.組み合わせた後かつ断片化前に、試料をエキソヌクレアーゼで処理することを更に含む、実施形態133~149のいずれか1つに記載の方法。
【0164】
実施形態151.試料をエキソヌクレアーゼで処理した後かつ断片化前に、Mg2+を添加することを含む、実施形態150に記載の方法。
【0165】
実施形態152.プロテイナーゼK及び/又はSDSを用いてタグ付き断片を遊離させることを更に含む、実施形態133~151のいずれか1つに記載の方法。
【0166】
実施形態153.第1のトランスポソーム複合体及び第2のトランスポソーム複合体に含まれる5’アダプタ配列が異なる、実施形態111~152のいずれか1つに記載の方法、又は実施形態108~110に記載のキット若しくは組成物。
【0167】
実施形態154.標的化されたトランスポソーム複合体である第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である第2のトランスポソーム複合体に含まれる触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインが異なる、実施形態111~153のいずれか1つに記載の方法。
【0168】
実施形態155.標的化されたトランスポソーム複合体である第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である第2のトランスポソーム複合体の触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインが、標的核酸中の所与の目的の領域中の異なる目的の配列に結合する、実施形態111~154に記載の方法。
【0169】
実施形態156.断片化が、45℃~65℃で行われる、実施形態111~155のいずれか1つに記載の方法。
【0170】
実施形態157.断片化が、50℃~60℃で行われる、実施形態156に記載の方法。
【0171】
実施形態158.断片化が、55℃で行われる、実施形態157のいずれか1つに記載の方法。
【0172】
実施形態159.複数の5’タグ付き標的断片をポリメラーゼ及びリガーゼで処理して、完全二本鎖タグ付き断片を産生するように鎖を伸長かつライゲーションすることを更に含む、実施形態111~158のいずれか1つに記載の方法。
【0173】
実施形態160.5’タグ付き標的断片又は完全二本鎖タグ付き断片のうちの1つ以上をシークエンシングすることを更に含む、実施形態111~159のいずれか1つに記載の方法。
【0174】
実施形態161.所望の試料及び不要な試料の両方を含む試料の混合プール中の所望の試料を特徴付ける方法であって、二本鎖核酸から配列データを産生するために、混合プール由来の複数の核酸試料を含むライブラリーを最初にシークエンシングすることであって、各核酸ライブラリーが、単一試料由来の核酸と、単一試料由来の核酸をライブラリー中の他の試料由来の核酸と区別するための固有の試料バーコードとを含む、ことと、配列データを分析し、所望の試料由来の配列データに関連する固有の試料バーコードを識別することと、所望の試料由来の核酸試料を濃縮すること、及び/又は不要な試料由来の核酸試料を枯渇させることを含む選択工程をライブラリーに対して実施することと、核酸ライブラリーを再シークエンシングすることと、を含む、方法。
【0175】
実施形態162.試料の混合プールが、細胞の混合プール、核の混合プール、又は高分子量DNAの混合プールを含む、実施形態161に記載の方法。
【0176】
実施形態163.試料が、細胞、核、又は高分子量DNAである、実施形態161又は実施形態162に記載の方法。
【0177】
実施形態164.固有の試料バーコードが、固有の細胞バーコードである、実施形態161~163のいずれか1つに記載の方法。
【0178】
実施形態165.濃縮する工程が、ハイブリッド捕捉、触媒的に不活性なエンドヌクレアーゼによる捕捉、又は固有の試料バーコード特異的増幅を含む、実施形態161~164のいずれか1つに記載の方法。
【0179】
実施形態166.固有の試料バーコード特異的増幅が、固有の試料バーコード標的化PCR増幅である、実施形態165に記載の方法。
【0180】
実施形態167.枯渇させる工程が、ハイブリッド捕捉、触媒的に不活性なエンドヌクレアーゼによる捕捉、CRISPR消化、又はガイドRNA(gRNA)にカップリングしたShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)を含む複合体による切断を含む、実施形態161~164のいずれか1つに記載の方法。
【0181】
実施形態168.ハイブリッド捕捉が、ハイブリッド捕捉オリゴヌクレオチドを固有の試料バーコードにハイブリダイズさせることを含む、実施形態167に記載の方法。
【0182】
実施形態169.ハイブリッド捕捉オリゴヌクレオチドが、固体支持体に直接又は間接的に結合している、実施形態168に記載の方法。
【0183】
実施形態170.ハイブリッド捕捉オリゴヌクレオチドが、ビオチン-ストレプトアビジン相互作用を介して固体支持体に結合している、実施形態169に記載の方法。
【0184】
実施形態171.CRISPR消化が、触媒的に活性なエンドヌクレアーゼによる切断である、実施形態167に記載の方法。
【0185】
実施形態172.エンドヌクレアーゼがCas9である、実施形態171に記載の方法。
【0186】
実施形態173.Cas9が、Streptococcus canisのCas9である、実施形態172に記載の方法。
【0187】
実施形態174.Streptococcus canisのCas9が、最小限の配列制約を有する、実施形態173に記載の方法。
【0188】
実施形態175.エンドヌクレアーゼが、より高い忠実度の変異体である、実施形態171~174のいずれか1つに記載の方法。
【0189】
実施形態176.gRNAにカップリングしたShCASTを含む複合体による切断を含む、実施形態171に記載の方法。
【0190】
実施形態177.エンドヌクレアーゼが、FokI ヌクレアーゼと共に融合タンパク質に含まれる、実施形態171~176のいずれか1つに記載のトランスポソーム複合体。
【0191】
実施形態178.エンドヌクレアーゼが、1つ以上の固有の試料バーコードに結合するガイドRNAと会合している、実施形態171~177のいずれか1つに記載の方法。
【0192】
実施形態179.ガイドRNAが、不要な試料の核酸に関連する固有の試料バーコードに対して指向される、実施形態178に記載の方法。
【0193】
実施形態180.ガイドRNAが、所望の試料の核酸に関連する固有の試料バーコードに対して指向される、実施形態178に記載の方法。
【0194】
実施形態181.ガイドRNAが、単一ガイドRNAである、実施形態178~180のいずれか1つに記載のトランスポソーム複合体。
【0195】
実施形態182.単一ガイドRNAが、20個未満のヌクレオチドを含む、実施形態181に記載のトランスポソーム複合体。
【0196】
実施形態183.単一ガイドRNA配列が、15、16、17、18、又は19個のヌクレオチドを含む、実施形態182に記載のトランスポソーム複合体。
【0197】
実施形態184.単一ガイドRNAが、ヘアピン二次構造を含む、実施形態178~183のいずれか1つに記載のトランスポソーム複合体。
【0198】
実施形態185.エンドヌクレアーゼが、固体支持体に直接又は間接的に結合している、実施形態171~184のいずれか一項に記載の方法。
【0199】
実施形態186.エンドヌクレアーゼが、ビオチン-ストレプトアビジン相互作用を介して固体支持体に結合している、実施形態185に記載の方法。
【0200】
実施形態187.所望の試料が、試料の混合プールの1%、0.1%、0.01%、0.001%、0.0001%、0.00001%、0.000001%、0.0000001%、0.00000001%、又は0.000000001%以下で存在する希少試料である、実施形態161~186のいずれか1つに記載の方法。
【0201】
実施形態188.所望の試料が、試料の混合プールの1%、0.1%、0.01%、0.001%、0.0001%、0.00001%、0.000001%、0.0000001%、0.00000001%、又は0.000000001%以下で存在する所望の細胞である、実施形態161~186に記載の方法。
【0202】
実施形態189.方法が、再シークエンシング前に増幅工程を含む、実施形態161~188のいずれか1つに記載の方法。
【0203】
実施形態190.増幅工程が、ユニバーサルプライマーを使用する、実施形態189に記載の方法。
【0204】
実施形態191.核酸ライブラリーが、タグメンテーションによって調製される、実施形態161~190のいずれか1つに記載の方法。
【0205】
実施形態192.方法が、固有の試料バーコードを組み込む前に、核酸試料を空間的に分離する工程を含む、実施形態161~191のいずれか1つに記載の方法。
【0206】
実施形態193.方法が、試料の混合プール由来の複数の核酸試料をシークエンシングする前に、タグメンテーションすることを含む、実施形態161~192のいずれか1つに記載の方法。
【0207】
実施形態194.固有の試料バーコードが、各核酸試料に組み込まれる、実施形態161~193のいずれか1つに記載の方法。
【0208】
実施形態195.i5及びi7配列が、各核酸試料に組み込まれる、実施形態161~194のいずれか1つに記載の方法。
【0209】
実施形態196.ユニバーサルプライマーが、各核酸試料に組み込まれる、実施形態161~195のいずれか1つに記載の方法。
【0210】
実施形態197.ユニバーサルプライマーが、P5及び/又はP7プライマーである、実施形態196のいずれか1つに記載の方法。
【0211】
実施形態198.固有の試料バーコードが、単一の連続バーコードである、実施形態161~197のいずれか1つに記載の方法。
【0212】
実施形態199.固有の試料バーコードが、複数の不連続バーコードである、実施形態198のいずれか1つに記載の方法。
【0213】
実施形態200.複数の不連続バーコードが、固定配列によって分離されている、実施形態199に記載の方法。
【0214】
実施形態201.増幅及び再シークエンシングの工程が、1回繰り返される、実施形態161~200のいずれか1つに記載の方法。
【0215】
実施形態202.増幅及び再シークエンシングの工程が、2回以上繰り返される、実施形態161~200のいずれか1つに記載の方法。
【0216】
実施形態203.核酸がDNAである、実施形態161~202のいずれか1つに記載の方法。
【0217】
実施形態204.核酸がRNAである、実施形態161~202のいずれか1つに記載の方法。
【0218】
実施形態205.核酸がrRNAである、実施形態204に記載の方法。
【0219】
実施形態206.核酸が16s rRNAである、実施形態205に記載の方法。
【0220】
実施形態207.核酸が18s rRNAである、実施形態205に記載の方法。
【0221】
実施形態208.核酸がrDNAである、実施形態203に記載の方法。
【0222】
実施形態209.核酸が、内部転写スペーサー核酸である、実施形態161~208のいずれか1つに記載の方法。
【0223】
実施形態210.初期シークエンシング工程が、全ゲノムシークエンシングを含まず、再シークエンシング工程が、全ゲノムシークエンシングを含む、実施形態161~209のいずれか1つに記載の方法。
【0224】
実施形態211.初期シークエンシング工程が、標的化シークエンシングを含み、再シークエンシング工程が、全ゲノムシークエンシングを含む、実施形態161~209のいずれか1つに記載の方法。
【0225】
実施形態212.初期シークエンシング工程が、1つ以上の遺伝子特異的プライマーを用いる標的化シークエンシングを含む、実施形態211に記載の方法。
【0226】
実施形態213.遺伝子特異的プライマーが、ユニバーサルプライマーテールを含む、実施形態212に記載の方法。
【0227】
実施形態214.初期シークエンシング工程が、リボソームシークエンシングを含み、再シークエンシング工程が、全ゲノムシークエンシングを含む、実施形態161~210のいずれか1つに記載の方法。
【0228】
実施形態215.リボソームシークエンシングが、16s、18s、又は内部転写スペーサーシークエンシングを含む、実施形態214に記載の方法。
【0229】
実施形態216.所望の試料が、細胞又は核である、実施形態161~215のいずれか1つに記載の方法。
【0230】
実施形態217.所望の試料が、細胞である、実施形態216に記載の方法。
【0231】
実施形態218.所望の試料が、細胞由来の核である、実施形態161~217のいずれか1つに記載の方法。
【0232】
実施形態219.所望の試料が、ヒト細胞又はヒト細胞由来の核である、実施形態161~217のいずれか1つに記載の方法。
【0233】
実施形態220.所望の試料が、がん細胞又はがん細胞由来の核である、実施形態161~217のいずれか1つに記載の方法。
【0234】
実施形態221.所望の細胞又は核が、特定の所望の細胞型であるか、又はそれに由来する、実施形態161~220のいずれか1つに記載の方法。
【0235】
実施形態222.所望の試料が、プール中の他の試料と比較して変異を有する、実施形態161~221のいずれか1つに記載の方法。
【0236】
実施形態223.所望の試料が、がん細胞若しくは免疫細胞であるか、又はそれに由来する、実施形態161~222のいずれか1つに記載の方法。
【0237】
実施形態224.所望の試料が、がん幹細胞であるか、又はそれに由来する、実施形態223に記載の方法。
【0238】
実施形態225.所望の試料が、液体又は腫瘍生検試料中のがん細胞であるか、又はそれに由来する、実施形態223に記載の方法。
【0239】
実施形態226.所望の試料が、薬物治療に耐性があるがん細胞であるか、又はそれに由来する、実施形態220に記載の方法。
【0240】
実施形態227.所望の試料が、細胞プール中の他のがん細胞と比較して少なくとも1つの突然変異を有するがん細胞であるか、又はそれに由来する、実施形態220に記載の方法。
【0241】
実施形態228.方法が、がんの進化の追跡に使用される、実施形態161~227のいずれか1つに記載の方法。
【0242】
実施形態229.所望の試料が、体細胞ドライバー変異を有する細胞であるか、又はそれに由来する、実施形態161~228のいずれか1つに記載の方法。
【0243】
実施形態230.方法が、メタゲノミクスに使用される、実施形態161~218のいずれか1つに記載の方法。
【0244】
実施形態231.方法が、環境試料由来の微生物のシークエンシングに使用される、実施形態230に記載の方法。
【0245】
実施形態232.方法が、環境試料由来の微生物を培養することを含まない、実施形態231に記載の方法。
【0246】
実施形態233.微生物が、細菌、真菌、古細菌、真菌、藻類、原虫、又はウイルスを含む、実施形態230~232のいずれか1つに記載の方法。
【0247】
実施形態234.所望の試料が、一塩基バリアント(SNV)を有する、実施形態161~233のいずれか1つに記載の方法。
【0248】
実施形態235.所望の試料が、コピー数多型(CNV)を有する、実施形態161~234のいずれか1つに記載の方法。
【0249】
実施形態236.所望の試料が、所望のメチル化パターンを有する、実施形態161~235のいずれか1つに記載の方法。
【0250】
実施形態237.所望の試料が、所望の発現パターンを有する、実施形態161~236のいずれか1つに記載の方法。
【0251】
実施形態238.所望の試料が、所望のエピジェネティックパターンを有する、実施形態161~237のいずれか1つに記載の方法。
【0252】
実施形態239.所望の試料が、所望の免疫遺伝子組換えを有する、実施形態161~229又は234~238のいずれか1つに記載の方法。
【0253】
実施形態240.方法が、TCRレパートリーの特徴確認を含む、実施形態161~229又は234~239のいずれか1つに記載の方法。
【0254】
実施形態241.所望の試料が、特定の種のタイプを有する、実施形態161~240のいずれか1つに記載の方法。
【0255】
実施形態242.所望の試料が、病原体である、実施形態230~238のいずれか1つに記載の方法。
【0256】
実施形態243.所望の試料が、細菌、真菌、古細菌、真菌、藻類、原虫、若しくはウイルスであるか、又はそれらに由来する、実施形態242に記載の方法。
【0257】
実施形態244.方法が、細胞選別に基づく濃縮方法を使用しない、実施形態161~243のいずれか1つに記載の方法。
【0258】
実施形態245.方法が、FACSを使用しない、実施形態244に記載の方法。
【0259】
実施形態246.方法が、細胞サイズ、形態、又は表面タンパク質発現に基づくFACSを使用しない、実施形態245に記載の方法。
【0260】
実施形態247.方法が、マイクロフルイディクスを使用しない、実施形態161~246のいずれか1つに記載の方法。
【0261】
実施形態248.方法が、全ゲノム増幅を使用しない、実施形態161~247のいずれか1つに記載の方法。
【0262】
実施形態249.
a.ShCASTが、Cas12Kを含み、
b.トランスポザーゼが、Tn5若しくはTn7様トランスポザーゼを含み、かつ/又は、
c.gRNA及びトランスポザーゼのうちの少なくとも1つがビオチン化され、ビオチン化されたgRNA及びトランスポザーゼのうちの少なくとも1つが、ストレプトアビジンでコーティングされたビーズにカップリングすることができる、実施形態176に記載の方法。
【0263】
実施形態250.不要な試料由来の核酸試料を枯渇させることが、複合体に含まれるトランスポザーゼの二本鎖核酸への結合を制限するための条件を有する流体中で行われる、実施形態176又は249に記載の方法。
【0264】
実施形態251.複合体に含まれるトランスポザーゼの二本鎖核酸への結合を制限するための条件が、15mM以下のマグネシウム濃度である、実施形態250に記載の方法。
【0265】
実施形態252.複合体に含まれるトランスポザーゼの二本鎖核酸への結合を制限するための条件が、50nM以下のトランスポザーゼ濃度である、実施形態250又は251に記載の方法。
【0266】
実施形態253.不要な試料由来の核酸試料を枯渇させることが、
a.複合体に含まれるトランスポザーゼによる核酸の結合を阻害する条件下で、複合体を二本鎖核酸に結合させることと、
b.結合後に、複合体による核酸の切断を促進することと、を含む、実施形態176又は249に記載の方法。
【0267】
実施形態254.(1)トランスポザーゼが結合中に存在せず、(2)切断を促進することがトランスポザーゼを添加することを含む、実施形態253に記載の方法。
【0268】
実施形態255.(1)トランスポザーゼが結合中に低濃度であり、(2)切断を促進することがトランスポザーゼを添加することを含む、実施形態253に記載の方法。
【0269】
実施形態256.(1)トランスポザーゼが結合中に可逆的に不活性化され、(2)切断を促進することがトランスポザーゼを活性化することを含む、実施形態252~255のいずれか1つに記載の方法。
【0270】
実施形態257.(1)トランスポザーゼが、1つ以上のトランスポゾンの欠如に起因して可逆的に不活性化され、(2)トランスポザーゼを活性化することが、1つ以上のトランスポゾンを提供することを含む、実施形態256に記載の方法。
【0271】
実施形態258.(1)1つ以上の目的の核酸配列を含む標的核酸と、(2)gRNAにカップリングしたShCASTをそれぞれ含む、実施形態59に記載の複数の標的化されたトランスポソーム複合体と、を含み、ShCASTが、それにカップリングした増幅アダプタを有し、標的化されたトランスポソーム複合体の各々が、目的の核酸配列にハイブリダイズされている、組成物。
【0272】
実施形態259.ShCASTがCas12Kを含み、1つ以上の目的の配列への複合体に含まれるCas12Kのハイブリダイゼーションを促進し、かつ複合体に含まれるトランスポザーゼの結合を阻害する条件を有する流体を更に含む、実施形態258に記載の組成物。
【0273】
実施形態260.流体の条件が、トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを更に含み、任意選択的に、マグネシウム濃度が15mM以下である、実施形態259に記載の組成物。
【0274】
実施形態261.トランスポザーゼの活性を促進する条件を有する流体を含み、トランスポザーゼが、標的核酸中の位置に増幅アダプタを付加することができる、実施形態258に記載の組成物。
【0275】
実施形態262.流体の条件が、トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在することを含み、任意選択的に、マグネシウム濃度が15mM以上である、実施形態261に記載の組成物。
【0276】
実施形態263.ShCASTがCas12Kを含む、実施形態258~262のいずれか1つに記載の組成物。
【0277】
実施形態264.トランスポザーゼが、Tn5又はTn7様トランスポザーゼを含む、実施形態258~263のいずれか1つに記載の組成物。
【0278】
実施形態265.アダプタが、P5アダプタ及びP7アダプタのうちの少なくとも1つを含む、実施形態258~264のいずれか1つに記載の組成物。
【0279】
実施形態266.標的核酸が、二本鎖DNAを含む、実施形態258~265のいずれか一項に記載の組成物。
【0280】
実施形態267.gRNA及びトランスポザーゼのうちの少なくとも1つがビオチン化されており、組成物が、ビオチン化されているgRNA及びトランスポザーゼのうちの少なくとも1つがカップリングしているストレプトアビジンでコーティングされたビーズを更に含む、実施形態258~266のいずれか1つに記載の組成物。
【0281】
実施形態268.第1及び/又は第2の標的化されたトランスポソーム複合体が、実施形態59に記載の標的化されたトランスポソーム複合体を含む、実施形態111~113のいずれか1つに記載の方法。
【0282】
実施形態269.方法が、複合体に含まれるトランスポザーゼの結合を制限するための条件を有する流体中で行われる、実施形態268に記載の方法。
【0283】
実施形態270.複合体に含まれるトランスポザーゼの結合を制限するための条件が、15mM以下のマグネシウム濃度である、実施形態269に記載の方法。
【0284】
実施形態271.複合体に含まれるトランスポザーゼの結合を制限するための条件が、50nM以下のトランスポザーゼ濃度である、実施形態269又は270に記載の方法。
【0285】
実施形態272.方法が、
a.複合体に含まれるトランスポザーゼによる二本鎖核酸の結合を阻害する条件下で、複合体を二本鎖核酸に結合させることと、
b.結合後に、複合体による二本鎖核酸の切断を促進することと、を含む、実施形態268に記載の方法。
【0286】
実施形態273.(1)トランスポザーゼが結合中に存在せず、(2)切断を促進することがトランスポザーゼを添加することを含む、実施形態272に記載の方法。
【0287】
実施形態274.(1)トランスポザーゼが結合中に低濃度であり、(2)切断を促進することがトランスポザーゼを添加することを含む、実施形態271~273のいずれか1つに記載の方法。
【0288】
実施形態275.(1)トランスポザーゼが結合中に可逆的に不活性化され、(2)切断を促進することがトランスポザーゼを活性化することを含む、実施形態271~274のいずれか1つに記載の方法。
【0289】
実施形態276.(1)トランスポザーゼが、1つ以上のトランスポゾンの欠如に起因して可逆的に不活性化され、(2)トランスポザーゼを活性化することが、1つ以上のトランスポゾンを提供することを含む、実施形態275に記載の方法。
【0290】
実施形態277.トランスポザーゼが、二本鎖核酸中の位置に増幅アダプタを付加する、実施形態268~276のいずれか1つに記載の方法。
【0291】
追加の目的及び利点は、以下の説明において部分的に記載され、一部は説明から明白であるか、又は実践によって習得され得る。目的及び利点は、添付の特許請求の範囲において特に指摘される要素及び組み合わせによって実現及び達成されるであろう。
【0292】
前述の一般的な説明及び以下の詳細な説明はいずれも例示的かつ説明的なものであり、特許請求の範囲を限定するものではないことを理解されたい。
【0293】
本明細書に組み込まれ、本明細書の一部を構成する添付図面は、1つの(いくつかの)実施形態を図解し、明細書と共に本明細書に記載される原理を説明する役割を果たす。
【図面の簡単な説明】
【0294】
【
図1】本方法で使用することができる例示的な試料集団を提供する。メタゲノミクス試料において、対象となる希少試料は、試料内の特定のプラスミド(影付き挿入図)又は希少なウイルスの存在(黒色挿入図)を発現する細菌であり得る。腫瘍学試料において、対象となる希少試料は、体細胞ドライバー変異(挿入図)を発現する細胞であり得る。一般的に、豊富な試料由来のデータがシークエンシングの結果において圧倒的に多いため、これらの希少試料由来のデータの評価が困難であり得る。
【
図2】メタゲノミクス使用のための代表的な方法を示す。単一細胞由来の複数のライブラリーを含む単一細胞ライブラリー(scライブラリー)が生成される。本発明の方法を使用して、単一細胞由来の各ライブラリー中の断片は、例えば、固有の細胞バーコード(UBC)で、一意的にタグ付けされる。所望の試料(対象となる希少細胞由来のものなど)に関連するUBCを同定するための初期シークエンシングの後、所望の試料の選択及び再シークエンシングが行われる。この方法は、対象となる細胞由来のデータが、豊富な試料から生成された大量の配列データによって失われるか又は圧倒されることを回避する。本発明の品質管理方法がない場合、対象となる希少試料がバイオインフォマティクス分析から失われる可能性がある。
【
図3】希少な単一細胞由来のライブラリーのシークエンシングに基づく選別及び選択の代表的な方法を示す。ライブラリーが構築された後、初期シークエンシング(例えば、16sシークエンシング)が行われ、所望の試料を決定できる。これらの所望の試料は、単一細胞の全集団内の希少細胞から生成されたライブラリーであり得る。次いで、目的の単一細胞由来のライブラリー断片に関連するUBCに基づいて、濃縮又は枯渇のいずれかによって、所望の試料の選択を行う。選択は、例えば、固有の試料バーコード特異的PCR、ハイブリッド捕捉、又は触媒的に不活性なCas9による捕捉を使用することにより、いくつかの異なる手段を介して行うことができる。所望の試料を選択した後、目的の希少細胞の特徴をよりよく理解するために、包括的なシークエンシングを行うことができる。
【
図4】Sci-RNA3法を介して混合集団から生成されたライブラリーと共に使用するための選択方法を示す。同様の方法が、他の手段によって生成されたライブラリーと共に使用され得る。
【
図5】改変されたSCI-seq法を使用してライブラリーを生成して連続バーコードを得る方法を示す。
【
図6】物理的にアドレス可能なバーコードで構築された合成連結DNAライブラリーを使用してライブラリーを生成するための方法を示す。
【
図7】初期標的化シークエンシングを実施する方法を示す。
【
図8】選択のために使用され得るエンドヌクレアーゼ(Cas9など)の特異性を増加させるための様々な手段を示す。
【
図9】リコンビナーゼ媒介標的化転位の概要を提供する。リコンビナーゼ(Rec)でコーティングされた標的化オリゴヌクレオチド(oligos)は、標的化されるゲノムDNAに結合することができる。リコンビナーゼは、目的の領域にトランスポソームを局在化するためのストランド侵入を媒介する。その後の転位により、P5/P7配列をゲノムDNAに挿入することができ、その後、目的の領域の断片を生成することができる。
【
図10】標的化されたオリゴヌクレオチドに基づく標的化転位の概要を示す。一本鎖ゲノム標的DNAを変性することができ、その後、標的化されたオリゴヌクレオチドは、一本鎖DNA(ssDNA)内の1つ以上の目的の核酸配列にハイブリダイズ(hyb)し得る。次いで、トランスポザーゼ及びトランスポゾンを付加することができる。トランスポザーゼは二本鎖核酸の領域に結合するので、転位は、標的化されたオリゴヌクレオチドが結合した領域に標的化される。対照的に、トランスポザーゼはssDNAの他の領域に結合しない。転位により、P5/P7配列をゲノムDNAに挿入することができ、その後、目的の領域の断片を生成することができる。
【
図11】トランスポザーゼ(この実施形態ではTn5)に連結された触媒的に不活性なエンドヌクレアーゼ(この実施形態では不活性化又はdCas9)の融合タンパク質を含む標的化されたトランスポソーム複合体を使用してライブラリーを生成する方法を示す。dCas9と会合した単一ガイドRNA(sgRNA)は、融合タンパク質を標的化して、標的核酸内の特定のヌクレオチド配列に結合する。この結合は、dCas9結合が活性であるが、トランスポザーゼが不活性である条件下(例えば、Ca
2+及び/又はMn
2+の存在下)で行うことができる。融合タンパク質の結合後、トランスポザーゼを介したタグメンテーションをMg
2+で活性化して、Nextera調製物の場合と同様のプロトコルを用いてタグ付きライブラリー断片を生成することができる。次いで、得られた断片をシークエンシングすることができる。
【
図12A】触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼを含む標的化されたトランスポソーム複合体を生成するための様々な手段を提示する。標的化されたトランスポソーム複合体は、エンドヌクレアーゼ及びトランスポザーゼが1つのタンパク質として発現される融合タンパク質を含んでもよい(A)。この融合タンパク質は、エンドヌクレアーゼとトランスポザーゼとの間にリンカーを含むことができる。あるいは、結合ペア(ストレプトアビジン及びビオチンなど)を使用して、トランスポザーゼ及びエンドヌクレアーゼを会合させてもよい(B)。本明細書に記載される任意の実施形態では、短縮型ガイドRNAは、標的核酸中の1つ以上の目的の配列に対する特異性を増加させることができるので、ガイドRNAは、17個のヌクレオチドを含むなど、短縮型であってもよい(例えば、20個未満のヌクレオチドを含む)。単一ガイドRNA(sgRNA)は、トランスポゾンと会合することができ、例えば、sgRNAは、トランスポゾン末端配列及びTn5アダプタ、例えばA14及びB15を含むトランスポゾンと会合する(C)。sgRNAとトランスポゾンとの会合は、相補配列の領域によって媒介され得る。更に、連続したsgRNA転移鎖オリゴヌクレオチド(単一オリゴヌクレオチド)を使用してもよい(D)。
【
図12B】触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼを含む標的化されたトランスポソーム複合体を生成するための様々な手段を提示する。標的化されたトランスポソーム複合体は、エンドヌクレアーゼ及びトランスポザーゼが1つのタンパク質として発現される融合タンパク質を含んでもよい(A)。この融合タンパク質は、エンドヌクレアーゼとトランスポザーゼとの間にリンカーを含むことができる。あるいは、結合ペア(ストレプトアビジン及びビオチンなど)を使用して、トランスポザーゼ及びエンドヌクレアーゼを会合させてもよい(B)。本明細書に記載される任意の実施形態では、短縮型ガイドRNAは、標的核酸中の1つ以上の目的の配列に対する特異性を増加させることができるので、ガイドRNAは、17個のヌクレオチドを含むなど、短縮型であってもよい(例えば、20個未満のヌクレオチドを含む)。単一ガイドRNA(sgRNA)は、トランスポゾンと会合することができ、例えば、sgRNAは、トランスポゾン末端配列及びTn5アダプタ、例えばA14及びB15を含むトランスポゾンと会合する(C)。sgRNAとトランスポゾンとの会合は、相補配列の領域によって媒介され得る。更に、連続したsgRNA転移鎖オリゴヌクレオチド(単一オリゴヌクレオチド)を使用してもよい(D)。
【
図12C】触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼを含む標的化されたトランスポソーム複合体を生成するための様々な手段を提示する。標的化されたトランスポソーム複合体は、エンドヌクレアーゼ及びトランスポザーゼが1つのタンパク質として発現される融合タンパク質を含んでもよい(A)。この融合タンパク質は、エンドヌクレアーゼとトランスポザーゼとの間にリンカーを含むことができる。あるいは、結合ペア(ストレプトアビジン及びビオチンなど)を使用して、トランスポザーゼ及びエンドヌクレアーゼを会合させてもよい(B)。本明細書に記載される任意の実施形態では、短縮型ガイドRNAは、標的核酸中の1つ以上の目的の配列に対する特異性を増加させることができるので、ガイドRNAは、17個のヌクレオチドを含むなど、短縮型であってもよい(例えば、20個未満のヌクレオチドを含む)。単一ガイドRNA(sgRNA)は、トランスポゾンと会合することができ、例えば、sgRNAは、トランスポゾン末端配列及びTn5アダプタ、例えばA14及びB15を含むトランスポゾンと会合する(C)。sgRNAとトランスポゾンとの会合は、相補配列の領域によって媒介され得る。更に、連続したsgRNA転移鎖オリゴヌクレオチド(単一オリゴヌクレオチド)を使用してもよい(D)。
【
図12D】触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼを含む標的化されたトランスポソーム複合体を生成するための様々な手段を提示する。標的化されたトランスポソーム複合体は、エンドヌクレアーゼ及びトランスポザーゼが1つのタンパク質として発現される融合タンパク質を含んでもよい(A)。この融合タンパク質は、エンドヌクレアーゼとトランスポザーゼとの間にリンカーを含むことができる。あるいは、結合ペア(ストレプトアビジン及びビオチンなど)を使用して、トランスポザーゼ及びエンドヌクレアーゼを会合させてもよい(B)。本明細書に記載される任意の実施形態では、短縮型ガイドRNAは、標的核酸中の1つ以上の目的の配列に対する特異性を増加させることができるので、ガイドRNAは、17個のヌクレオチドを含むなど、短縮型であってもよい(例えば、20個未満のヌクレオチドを含む)。単一ガイドRNA(sgRNA)は、トランスポゾンと会合することができ、例えば、sgRNAは、トランスポゾン末端配列及びTn5アダプタ、例えばA14及びB15を含むトランスポゾンと会合する(C)。sgRNAとトランスポゾンとの会合は、相補配列の領域によって媒介され得る。更に、連続したsgRNA転移鎖オリゴヌクレオチド(単一オリゴヌクレオチド)を使用してもよい(D)。
【
図13】触媒的に不活性なエンドヌクレアーゼを含む標的化されたトランスポソーム複合体の特異性を増加させることができる様々な実施形態を示す。短縮型ガイドRNAは、標的核酸における目的とする特定の配列に対する特異性を増加させることができ、特定のプロトスペーサー隣接モチーフ(PAM)に対する最小限の配列制約を有するエンドヌクレアーゼは、より大きな標的設計空間を可能にすることができる。トーホールドでブロックされたガイドRNAなどのヘアピン二次構造もまた、特異性を増加させるために使用できる。
【
図14A】濃縮した標的領域の断片化を媒介するための、dCas9及びトランスポザーゼの融合タンパク質を含む標的化されたトランスポソーム複合体の使用法を示す。融合タンパク質は、標的核酸(DNAなど)をスキャンして、PAMにごく近接してdCas9のガイドRNAに結合する目的の配列を探す(A)。目的の配列を見つけたら、高い特異性でのdCas9の結合を、タグメンテーションによって達成することができる(例えば、まず二価イオン、つまりCa
2+又はMn
2+なしで接触させて、トランスポザーゼによるタグメンテーションを可能にすることなくsgRNA-Cas9の結合及び立体構造変化を可能にする)。dCas9の結合を可能にした後、トランスポザーゼ(Tn5など)を介したタグメンテーションを、Mg
2+を添加することによって開始する。Mg
2+を添加する前のエキソヌクレアーゼ処理により、標的DNAの非Cas9保護領域を除去することによって、更なる特異性を可能にし得る。切断後、プロテイナーゼK及び/又はSDSによってDNA断片を遊離させることができる。これらの方法は、濃縮した標的領域を含むライブラリーにおいて高い割合の断片をもたらし得る。DNAの遊離後、伸長及びギャップ充填ライゲーションを行うことができる(C)。
【
図14B】濃縮した標的領域の断片化を媒介するための、dCas9及びトランスポザーゼの融合タンパク質を含む標的化されたトランスポソーム複合体の使用法を示す。融合タンパク質は、標的核酸(DNAなど)をスキャンして、PAMにごく近接してdCas9のガイドRNAに結合する目的の配列を探す(A)。目的の配列を見つけたら、高い特異性でのdCas9の結合を、タグメンテーションによって達成することができる(例えば、まず二価イオン、つまりCa
2+又はMn
2+なしで接触させて、トランスポザーゼによるタグメンテーションを可能にすることなくsgRNA-Cas9の結合及び立体構造変化を可能にする)。dCas9の結合を可能にした後、トランスポザーゼ(Tn5など)を介したタグメンテーションを、Mg
2+を添加することによって開始する。Mg
2+を添加する前のエキソヌクレアーゼ処理により、標的DNAの非Cas9保護領域を除去することによって、更なる特異性を可能にし得る。切断後、プロテイナーゼK及び/又はSDSによってDNA断片を遊離させることができる。これらの方法は、濃縮した標的領域を含むライブラリーにおいて高い割合の断片をもたらし得る。DNAの遊離後、伸長及びギャップ充填ライゲーションを行うことができる(C)。
【
図14C】濃縮した標的領域の断片化を媒介するための、dCas9及びトランスポザーゼの融合タンパク質を含む標的化されたトランスポソーム複合体の使用法を示す。融合タンパク質は、標的核酸(DNAなど)をスキャンして、PAMにごく近接してdCas9のガイドRNAに結合する目的の配列を探す(A)。目的の配列を見つけたら、高い特異性でのdCas9の結合を、タグメンテーションによって達成することができる(例えば、まず二価イオン、つまりCa
2+又はMn
2+なしで接触させて、トランスポザーゼによるタグメンテーションを可能にすることなくsgRNA-Cas9の結合及び立体構造変化を可能にする)。dCas9の結合を可能にした後、トランスポザーゼ(Tn5など)を介したタグメンテーションを、Mg
2+を添加することによって開始する。Mg
2+を添加する前のエキソヌクレアーゼ処理により、標的DNAの非Cas9保護領域を除去することによって、更なる特異性を可能にし得る。切断後、プロテイナーゼK及び/又はSDSによってDNA断片を遊離させることができる。これらの方法は、濃縮した標的領域を含むライブラリーにおいて高い割合の断片をもたらし得る。DNAの遊離後、伸長及びギャップ充填ライゲーションを行うことができる(C)。
【
図15】血漿中の無細胞DNA(cfDNA)から標的化ライブラリーを生成するためのジンクフィンガーヌクレアーゼ(ZNF)関連トランスポソームの使用を示す。ジンクフィンガーDNA結合ドメイン又はZNFは、cfDNAがヒストンと会合している場合であっても、トランスポソーム複合体をcfDNA内の部位に標的化することができる。
【
図16A】ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮のための例示的な組成物(A)及びプロセスフローにおける操作(B)を概略的に示す。
【
図16B】ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮のための例示的な組成物(A)及びプロセスフローにおける操作(B)を概略的に示す。
【発明を実施するための形態】
【0295】
以下の表2は、標識された成分についての説明を提供する。
【0296】
【0297】
配列の説明
表1は、本明細書中で参照される特定の配列のリストを提供する。
【0298】
【0299】
様々な標的化されたトランスポソーム複合体が本明細書に記載される。本明細書で使用されるとき、「標的化されたトランスポソーム複合体」は、標的核酸中の1つ以上の目的の核酸配列に標的化されるトランスポソーム複合体を指す。
【0300】
I.標的化されたトランスポソーム複合体
本出願は、トランスポソームが標的核酸中の目的の核酸配列に標的化される、いくつかの異なる標的化されたトランスポソーム複合体を記載する。いくつかの実施形態では、標的化されたトランスポソーム複合体は、標的核酸中の1つ以上の目的の核酸配列に結合することができる要素を含む。この結合に基づいて、標的化されたトランスポソーム複合体は、標的核酸中の目的の領域での転位を媒介することができる。
【0301】
標的化されたトランスポソーム複合体は、標的核酸への非ランダム結合を有する任意のトランスポソーム複合体であってよい。したがって、標的化されたトランスポソーム複合体は、標的核酸中の配列にランダムに結合する標的化されていないトランスポソーム複合体とは異なり得る。例えば、標的化されたトランスポソーム複合体は、標的核酸中の1つ以上の目的の核酸配列に結合する要素を含んでもよい。これらの標的化されたトランスポソーム複合体を使用する方法を使用して、標的化ライブラリーを生成することができ、ここで、断片は、標的核酸中に目的の領域を含む。
【0302】
いくつかの異なるタイプの標的化されたトランスポソーム複合体が本明細書に記載されている。
【0303】
A.トランスポソーム複合体
一般に、本発明のトランスポゾン複合体は、1つ以上の目的とする核酸配列への標的化を媒介する1つ以上の要素と共に、トランスポザーゼ並びに第1及び第2のトランスポゾンを含む。
【0304】
本明細書で使用されるとき、「トランスポソーム複合体」は、少なくとも1つのトランスポザーゼ(又は本明細書に記載の他の酵素)及びトランスポゾン認識配列から構成される。いくつかのそのようなシステムでは、トランスポザーゼは、転移反応を触媒することができる機能的複合体を形成するために、トランスポゾン認識配列に結合する。いくつかの態様では、トランスポゾン認識配列は、二本鎖トランスポゾン末端配列である。トランスポザーゼは、標的核酸内のトランスポザーゼ認識部位に結合し、トランスポゾン認識配列を標的核酸に挿入する。いくつかのそのような挿入事象では、トランスポゾン認識配列(又は末端配列)の1つの鎖が標的核酸に転写され、開裂事象が生じる。例示的な経位置手順及びシステムは、トランスポザーゼでの使用に容易に適合され得る。
【0305】
「トランスポザーゼ」は、トランスポゾン末端含有組成物(例えば、トランスポゾン、トランスポゾン末端、トランスポゾン末端組成物)を備えた機能複合体を形成し、二本鎖標的核酸へのトランスポゾン末端含有組成物の挿入又は転位を触媒することができる酵素を意味する。本明細書に提示されるトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルスからのインテグラーゼを含み得る。
【0306】
本明細書に提供される特定の実施形態で使用できる代表的なトランスポザーゼとして、Tn5トランスポザーゼ、Sleeping Beauty(SB)トランスポザーゼ、ビブリオハーベイ(Vibrio harveyi)、R1及びR2末端配列を含むMuAトランスポザーゼ及びMuトランスポザーゼ認識部位、Staphylococcus aureus Tn552、Ty1、Tn7トランスポザーゼ、TN/O及びIS10、Mariner transposase、Tc1、P Element、Tn3、細菌挿入配列、レトロウイルス、及び酵母のレトロトランスポゾンが挙げられる(又はこれらにコードされる)。より多くの例としては、IS5、Tn10、Tn903、IS911、及びトランスポザーゼファミリー酵素の設計されたバージョンが挙げられる。本明細書に記載される方法はまた、トランスポザーゼの組み合わせを含み、単一のトランスポザーゼのみを含むのではない。
【0307】
いくつかの実施形態では、トランスポザーゼは、Tn5、Tn7、MuA、若しくはビブリオハーベイトランスポザーゼ、又はこれらの活性変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその変異体である。他の実施形態では、トランスポザーゼは、Tn5トランスポザーゼ又はその活性変異である。いくつかの実施形態では、Tn5トランスポザーゼは、過活性Tn5トランスポザーゼ、又はその活性変異体である。いくつかの態様では、Tn5トランスポザーゼは、参照により本明細書に組み込まれる、国際公開第2015/160895号に記載されているTn5トランスポザーゼである。いくつかの態様では、Tn5トランスポザーゼは、野生型Tn5トランスポザーゼに対する54、56、372、212、214、251、及び338位での突然変異を有する、過剰活性Tn5である。いくつかの態様では、Tn5トランスポザーゼは、野生型Tn5トランスポザーゼに対する、次の変異、すなわち、E54K、M56A、L372P、K212R、P214R、G251R、及びA338Vを有する高活性Tn5である。いくつかの実施形態では、Tn5トランスポザーゼは、融合タンパク質である。いくつかの実施形態では、Tn5トランスポザーゼ融合タンパク質は、融合伸長因子Ts(Tsf)タグを含む。いくつかの実施形態では、Tn5トランスポザーゼは、野生型配列に対するアミノ酸54、56、及び372における変異を含む過剰活性Tn5トランスポザーゼである。いくつかの実施形態では、過剰活性Tn5トランスポザーゼは融合タンパク質であり、任意選択で、融合タンパク質は伸長因子Ts(Tsf)である。いくつかの実施形態では、認識部位は、Tn5型トランスポザーゼ認識部位である(Goryshin and Reznikoff,J.Biol.Chem.,273:7367,1998)。一実施形態では、高活性Tn5トランスポザーゼと複合体を形成するトランスポザーゼ認識部位が使用される(例えば、EZ-Tn5TMトランスポザーゼ、Epicentre Biotechnologies,Madison,Wis.)。いくつかの実施形態では、Tn5トランスポザーゼは野生型Tn5トランスポザーゼである。
【0308】
全体にわたって使用されるとき、「トランスポザーゼ」という用語は、トランスポゾン含有組成物(例えば、トランスポゾン、トランスポゾン組成物)を備えた機能複合体を形成し、インビトロ転位反応で、共にインキュベートされる二本鎖標的核酸へのトランスポゾン含有組成物の挿入又は転位を触媒することができる酵素を指す。提示される方法のトランスポザーゼはまた、レトロトランスポゾン及びレトロウイルス由来のインテグラーゼを含み得る。提供される方法において使用できる例示的なトランスポザーゼとしては、野生型又は変異型のTn5トランスポザーゼ及びMuAトランスポザーゼが挙げられる。
【0309】
「転位反応」は、1つ以上のトランスポゾンがランダムな部位又はほぼランダムな部位で標的核酸に挿入される反応である。転位反応の必須成分は、転移トランスポゾン配列及びその相補体(すなわち、非転移トランスポゾン末端配列)、並びに官能的転位又はトランスポゾン複合体を形成するために必要な他の成分を含む、トランスポゾンのヌクレオチド配列を示すトランスポザーゼ及びDNAオリゴヌクレオチドである。本開示の方法は、高活性Tn5トランスポザーゼ及びTn5型トランスポゾン末端によって、又はMuA若しくはHYPERMuトランスポザーゼ並びにR1及びR2末端配列を含むMuトランスポゾン末端によって形成される転位複合体を用いることによって例示される(例えば、Goryshin,I.and Reznikoff,W.S.,J.Biol.Chem.,273:7367,1998;and Mizuuchi,Cell,35:785,1983;Savilahti,H,et al.,EMBO J.,14:4893,1995参照、参照によりその全体が本明細書に組み込まれる)。しかし、意図された目的で標的核酸にタグ付けするのに十分な効率でランダム又はほぼランダムな方法でトランスポゾン末端を挿入し得る任意の転位システムを提供される方法で使用し得る。提供される方法で使用できる既知の転位システムの他の例は、Staphylococcus aureus Tn552、Tyl、トランスポゾンTn7、Tn/O及びIS10、Mariner transposase、Tel、P Element、Tn3、細菌挿入配列、レトロウイルス、並びに酵母のレトロトランスポゾンが挙げられるが、これらに限定されない(例えば、Colegio O R et al,J.Bacteriol.,183:2384-8,2001;Kirby C et al,Mol.Microbiol.,43:173-86,2002;Devine S E,and Boeke J D.,Nucleic Acids Res.,22:3765-72,1994;国際公開第95/23875号;Craig,N L,Science.271:1512,1996;Craig,N L,Review in:Curr Top Microbiol Immunol.,204:27-48,1996;Kleckner N,et al.,Curr Top Microbiol Immunol.,204:49-82,1996;Lampe D J,et al.,EMBO J.,15:5470-9,1996;Plasterk R H,Curr Top Microbiol Immunol,204:125-43,1996;Gloor,G B,Methods Mol.Biol,260:97-1 14,2004;Ichikawa H,and Ohtsubo E.,J Biol.Chem.265:18829-32,1990;Ohtsubo,F and Sekine,Y,Curr.Top.Microbiol.Immunol.204:1-26,1996;Brown P O,et al,Proc Natl Acad Sci USA,86:2525-9,1989;Boeke J D and Corces V G,Annu Rev Microbiol.43:403-34,1989;参照によりその全体が本明細書に組み込まれる)。
【0310】
トランスポゾンを標的配列に挿入するための方法は、適切なインビトロ転位システムが利用可能であるか、又は当該技術分野の知識に基づいて開発し得る任意の適切なトランスポゾンシステムを使用してインビトロで実施することができる。一般に、本開示の方法で使用するための適切なインビトロ転位システムは、少なくとも、十分な純度、十分な濃度、及び十分なインビトロ転位活性のトランスポザーゼ酵素、並びにトランスポザーゼが、転位反応を触媒し得るそれぞれのトランスポザーゼと機能複合体を形成するトランスポゾンを必要とする。使用され得る適切なトランスポザーゼトランスポゾン末端配列は、トランスポザーゼの野生型、誘導体又は突然変異体から選択されるトランスポザーゼと複合体を形成する野生型、誘導体又は突然変異体型トランスポゾン末端配列を含むが、それらに限定されない。
【0311】
いくつかの実施形態では、トランスポザーゼは、Tn5トランスポザーゼを含む。いくつかの実施形態では、Tn5トランスポザーゼは、高活性Tn5トランスポザーゼである。
【0312】
いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼの2つの分子のダイマーを含む。いくつかの実施形態では、トランスポソーム複合体は、ホモダイマーであり、トランスポザーゼの2つの分子は各々、同じ型の第1及び第2のトランスポゾンに結合している(例えば、各モノマーに結合した2つのトランスポゾンの配列は同じであり、「ホモダイマー」を形成する)。いくつかの実施形態では、本明細書に記載の組成物及び方法は、2つの集団のトランスポソーム複合体を採用する。いくつかの実施形態では、各集団におけるトランスポゾンは同じである。いくつかの実施形態では、各集団におけるトランスポソーム複合体は、ホモダイマーであり、第1の集団は、各モノマーにおいて第1のアダプタ配列を有し、第2の集団は、各モノマー中に異なるアダプタ配列を有する。
【0313】
「トランスポゾン末端」という用語は、インビトロ転位反応で機能するトランスポザーゼ又はインテグラーゼ酵素との複合体を形成するために必要なヌクレオチド配列(「トランスポゾン末端配列」)のみを示す、二本鎖核酸DNAを指す。いくつかの実施形態では、トランスポゾン末端は、転位反応においてトランスポザーゼと機能複合体を形成することができる。非限定的な例として、参照によりその全体が本明細書に組み込まれる米国特許出願公開第2010/0120098号の開示に記載されるように、トランスポゾン末端は、19-bpの外側末端(「OE」)トランスポゾン末端、内末端(「IE」)トランスポゾン末端、又は野生型若しくは突然変異体型Tn5トランスポザーゼによって認識される「モザイク末端」(「ME」)トランスポゾン末端、又はR1及びR2トランスポゾン末端を含み得る。トランスポゾン末端は、インビトロ転位反応においてトランスポザーゼ又はインテグラーゼ酵素と機能複合体を形成するのに適した任意の核酸又は核酸類似体を含み得る。例えば、トランスポゾン末端は、DNA、RNA、修飾塩基、非天然塩基、修飾骨格を含むことができ、一方又は両方の鎖にニックを含み得る。「DNA」という用語は、トランスポゾン末端の組成物に関連して本開示全体を通して使用されるが、任意の適切な核酸又は核酸類似体がトランスポゾン末端において利用され得ることを理解すべきである。
【0314】
「転移鎖」という用語は、両方のトランスポゾン末端のうちの転移部分を指す。同様に、「非転移鎖」という用語は、両方のトランスポゾン末端のうちの非転移部分を指す。転移鎖の3’末端は、インビトロ転位反応で標的DNAに結合又は転移される。転移されたトランスポゾン末端配列に相補的なトランスポゾン末端配列を示す非転移鎖は、インビトロ転位反応で標的DNAに結合又は転移されない。
【0315】
いくつかの実施形態では、転移鎖及び非転移鎖は、共有結合している。例えば、いくつかの実施形態では、転移及び非転移鎖配列は、単一のオリゴヌクレオチド上に、例えば、ヘアピン構成で提供される。したがって、非転移鎖の遊離末端は、転位反応によって標的DNAに直接的には結合されないが、非転移鎖は、ヘアピン構造のループによって転移鎖に連結されているため、非転移鎖は、DNA断片に間接的に付着することになる。トランスポソーム構造並びにトランスポソームを調製及び使用する方法の更なる例は、米国特許出願公開第2010/0120098号の開示に見出すことができ、その内容は参照によりその全体が本明細書に組み込まれる。
【0316】
いくつかの実施形態では、トランスポソーム複合体は、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンを含む。いくつかの実施形態では、トランスポソーム複合体は、5’トランスポゾン末端配列を含む第2のトランスポゾンを含み、5’トランスポゾン末端配列は、3’トランスポゾン末端配列に相補的である。
【0317】
したがって、いくつかの実施形態では、トランスポゾン組成物は、転移トランスポゾン配列の5’側に1つ以上の他のヌクレオチド配列、例えばアダプタ配列を有する転移鎖を含む。いくつかの実施形態では、アダプタ配列は、タグ配列である。転移トランスポゾン配列に加えて、タグは、1つ以上の他のタグ部分又はタグドメインを有し得る。
【0318】
本明細書で使用するとき、「タグメンテーション」は、断片及びタグ核酸に対するトランスポザーゼの使用を指す。タグメンテーションは、トランスポゾン末端配列(本明細書においてトランスポゾンと呼ばれる)を含む1つ以上のタグ(アダプタ配列など)で複合体化されたトランスポザーゼ酵素を含むトランスポソーム複合体によるDNAの修飾を含む。したがって、タグメンテーションにより、DNAの断片化及び二重鎖断片の両方の鎖の5’末端へのアダプタのライゲーションを同時にもたらし得る。
【0319】
いくつかの標的化されたトランスポソーム複合体が本出願に記載されているが、いくつかの方法は、標的化されたトランスポソーム複合体及び標的化されていないトランスポソーム複合体の両方を使用し得ることが理解される。
【0320】
B.固定化されたトランスポソーム複合体
いくつかの実施形態では、トランスポソーム複合体は、固体支持体上に固定化される。
【0321】
いくつかの実施形態では、トランスポソーム複合体は、1mm2当たり少なくとも103、104、105、106個の複合体の密度で固体支持体上に存在する。
【0322】
いくつかの実施形態では、固定化ライブラリー中の二本鎖断片の長さは、固体支持体上のトランスポソーム複合体の密度を増減することによって調節される。
【0323】
その全体が本明細書に組み込まれる米国特許第9683230号に記載されているように、多くの異なるタイプの固定化トランスポソームをこれらの方法で使用することができる。
【0324】
本明細書に提示される方法及び組成物では、トランスポソーム複合体は、固体支持体に固定化される。いくつかの実施形態では、トランスポソーム複合体及び/又は捕捉オリゴヌクレオチドは、トランスポゾン末端配列を含むポリヌクレオチドなどの1つ以上のポリヌクレオチドを介して支持体に固定化される。いくつかの実施形態では、トランスポソーム複合体は、リンカー分子を介して固定化され、トランスポザーゼ酵素を固体支持体にカップリングし得る。いくつかの実施形態では、トランスポザーゼ酵素及びポリヌクレオチドの両方が、固体支持体に固定化される。固体支持体への分子(例えば、核酸)の固定化に言及する場合、用語「固定化された」及び「結合された」は、本明細書では互換的に使用され、両方の用語は、明示的に又は文脈によってのいずれかで別段指示されない限り、直接的又は間接的、共有結合、又は非共有結合を包含することが意図される。いくつかの実施形態では、共有結合が使用される場合があるが、一般的に、必要とされるのは、例えば、核酸増幅及び/又は核酸シークエンシングを必要とする用途において、支持体を使用することが意図される条件下で、分子(例えば、核酸)が、支持体に固定化されたままである又は結合したままであるということである。
【0325】
特定の実施形態は、例えば、ポリヌクレオチド等の生体分子への共有結合を可能にする反応基を含む中間材料の層又はコーティングの適用によって「機能化」された不活性基材又はマトリックス(例えば、ガラススライド、ポリマービーズ等)から構成される固体支持体を利用することができる。このような支持体の例としては、ガラスなどの不活性基材上に支持されるポリアクリルアミドヒドロゲル、特に国際公開第2005/065814号及び米国特許出願公開第2008/0280773号に記載されているポリアクリルアミドヒドロゲルが挙げられるが、これらに限定されず、その内容は、参照によりその全体が本明細書に組み込まれる。そのような実施形態では、生体分子(例えば、ポリヌクレオチド)は、中間材料(例えば、ヒドロゲル)に直接共有付着してもよいが、中間材料は、それ自体が基質又はマトリックス(例えば、ガラス基質)に非共有付着してもよい。用語「固体支持体への共有結合」は、このタイプの配列を包含するように適宜解釈されるべきである。
【0326】
用語「固体表面」、「固体支持体」、及び本明細書の他の文法的等価物は、トランスポソーム複合体の結合に適切であるか、又は適切であるように修飾され得る任意の材料を指す。当該技術分野において理解されるように、可能な基材の数は非常に多い。可能な基材としては、ガラス及び変性又は機能化ガラス、プラスチック(アクリル、ポリスチレン、並びにスチレン及び他の材料のコポリマー、ポリプロピレン、ポリエチレン、ポリブチレン、ポリウレタン、テフロン(登録商標)など)、多糖類、ナイロン又はニトロセルロース、セラミックス、樹脂、シリカ、又はシリコン及び変性シリコンを含むシリカ系材料、炭素、金属、無機ガラス、プラスチック、光ファイバ束、並びに様々な他のポリマーを含むが、これらに限定されない。いくつかの実施形態では、特に有用な固体支持体及び固体表面は、フローセル装置内に配置される。例示的なフローセルは、以下に更に詳細に示される。
【0327】
いくつかの実施形態では、固体支持体は、規則的なパターンでのトランスポソーム複合体の固定に好適なパターン化された表面を含む。「パターン化された表面」は、固体支持体の露出層内又はその上における、異なる領域の配置を指す。例えば、領域のうちの1つ以上は、1つ以上のトランスポソーム複合体が存在する特徴であり得る。この特徴は、トランスポソーム複合体が存在しない間隙領域によって分離され得る。いくつかの実施形態では、パターンは、行及び列にある特徴のx-yフォーマットであり得る。いくつかの実施形態では、パターンは、特徴及び/又は間質領域の反復配置であり得る。いくつかの実施態様では、パターンは、特徴及び/又は間質領域のランダム配置であり得る。いくつかの実施形態では、トランスポソーム複合体は、固体支持体上にランダムに分布している。いくつかの実施形態では、トランスポソーム複合体は、パターン化された表面上に分布している。本明細書に記載される方法及び組成物において使用することができる例示的なパターン化表面は、米国特許出願第13/661524号又は米国特許出願公開第2012/0316086(A1)号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
【0328】
いくつかの実施形態では、固体支持体は、表面にウェル又は窪みのアレイを含む。これは、フォトリソグラフィ、スタンピング技術、成形技術、及びマイクロエッチング技術を含むがこれらに限定されない様々な技術を使用して、当該技術分野において一般的に既知であるように加工することができる。当該技術分野において理解されるように、使用される技術は、アレイ基質の組成物及び形状に依存する。
【0329】
固体支持体の組成及び幾何学的形状は、その使用によって異なり得る。いくつかの実施形態では、固体支持体は、スライド、チップ、マイクロチップ及び/又はアレイなどの平面構造である。したがって、基材の表面は、平面層の形態であり得る。いくつかの実施形態では、固体支持体は、フローセルの1つ以上の表面を含む。本明細書で使用するとき、用語「フローセル」は、1つ又はそれ以上の流体試薬を流通させることができる固体表面を含むチャンバを指す。本開示の方法において容易に使用することができるフローセル及び関連する流体システム及び検出プラットフォームの例は、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、国際公開第91/06678号、同第07/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されており、これらのそれぞれは、参照により本明細書に組み込まれる。
【0330】
いくつかの実施形態では、固体支持体又はその表面は、管又は容器の内側又は外側表面などの非平面である。いくつかの実施形態では、固体支持体は、ミクロスフェア又はビーズを含む。本明細書における「ミクロスフェア」又は「ビーズ」又は「粒子」又は文法的均等物は、小さな離散粒子を意味する。好適なビーズ組成物としては、プラスチック、セラミックス、ガラス、ポリスチレン、メチルスチレン、アクリルポリマー、常磁性材料、トリアゾル(thoria sol)、カーボングラファイト、二酸化チタン、ラテックス、又はセファロースなどの架橋デキストラン、セルロース、ナイロン、架橋ミセル、及びテフロンが挙げられるが、これらに限定されず、並びに固体支持体について本明細書に概説される任意の他の材料を全て使用することができる。Bangs Laboratories,Fishers,Ind.の「Microsphere Selection Guide」は、有用なガイドである。特定の実施形態では、ミクロスフェアは、磁気ミクロスフェア又はビーズである。
【0331】
ビーズは球状である必要はない。不規則な粒子を使用してもよい。代替的に又は追加的に、ビーズは多孔質であってもよい。ビーズサイズは、ナノメートル、すなわち、100nmから、ミリメートル、すなわち、1mmまでの範囲であり、ビーズは0.2マイクロメートル~200マイクロメートル、又は0.5~5マイクロメートルであるが、いくつかの実施形態では、より小さい又はより大きいビーズが使用されてもよい。
【0332】
これらの表面結合したトランスポソームの密度は、第1のポリヌクレオチドの密度を変化させることによって、又は固形支持体に添加されるトランスポザーゼの量によって調節することができる。例えば、いくつかの実施形態では、トランスポソーム複合体は、1mm2あたり少なくとも103、104、105、又は106個の複合体の密度で固形支持体上に存在する。
【0333】
支持体への核酸の付着は、剛性又は半剛性にかかわらず、共有結合又は非共有結合を介して起こり得る。例示的な結合は、米国特許第6,737,236号、同第7,259,258号、同第7,375,234号、及び同第7,427,678号、並びに米国特許出願公開第2011/0059865(A1)号に記載されており、その各々は参照により本明細書に組み込まれる。いくつかの実施形態では、核酸又は他の反応要素は、ゲル又は他の半固体支持体に結合され得、これは次に、固相支持体に結合又は接着される。このような実施形態では、核酸又は他の反応要素は、固相であると理解される。
【0334】
いくつかの実施形態では、固体支持体は、ビーズ、平面支持体、パターン化表面、又はウェルを含む。いくつかの実施形態では、平面支持体は、管の内面又は外面である。
【0335】
いくつかの実施形態では、固体支持体は、調製されてその上に固定化されたタグ付きDNA断片のライブラリーを有する。
【0336】
いくつかの実施形態では、固体支持体は、その上に固定化された捕捉オリゴヌクレオチドと第1のポリヌクレオチドとを含み、第1のポリヌクレオチドは、トランスポゾン末端配列及び第1のタグを含む3’部分を含む。
【0337】
いくつかの実施形態では、固体支持体は、トランスポソーム複合体を形成するために第1のポリヌクレオチドに結合したトランスポザーゼを更に含む。
【0338】
いくつかの実施形態では、固体支持体は、その上に固定化された捕捉オリゴヌクレオチドと第2のポリヌクレオチドとを含み、第2のポリヌクレオチドは、トランスポゾン末端配列及び第2のタグを含む3’部分を含む。
【0339】
いくつかの実施形態では、固体支持体は、トランスポソーム複合体を形成するために第2のポリヌクレオチドに結合したトランスポザーゼを更に含む。
【0340】
いくつかの実施形態では、キットは、本明細書に記載の固体支持体を含む。いくつかの実施形態では、キットは、トランスポザーゼを更に含む。いくつかの実施形態では、キットは、逆転写ポリメラーゼを更に含む。いくつかの実施形態では、キットは、DNAを固定化するための第2の固体支持体を更に含む。
【0341】
トランスポソーム複合体を固定化する多種多様な異なる手段が、例えば、国際公開第2018/156519号に記載されており、その全体が本明細書に組み込まれる。いくつかの実施形態では、標的化されたトランスポソーム複合体に含まれる第1のトランスポゾンは、親和性エレメントを含む。いくつかの実施形態では、親和性エレメントは、第1のトランスポゾンの5’末端に結合される。いくつかの実施形態では、第1のトランスポゾンは、リンカーを含む。いくつかの実施形態では、リンカーは、第1のトランスポゾンの5’末端に結合した第1の末端と、親和性エレメントに結合した第2の末端とを有する。
【0342】
いくつかの実施形態では、標的化されたトランスポソーム複合体は、第1のトランスポゾン末端配列の少なくとも一部に相補的な第2のトランスポゾンを更に含む。いくつかの実施形態では、第2のトランスポゾンは、親和性エレメントを含む。いくつかの実施形態では、親和性エレメントは、第2のトランスポゾンの3’末端に結合される。いくつかの実施形態では、第2のトランスポゾンは、リンカーを含む。いくつかの実施形態では、リンカーは、第2のトランスポゾンの3’末端に結合した第1の末端と、親和性エレメントに結合した第2の末端とを有する。
【0343】
いくつかの実施形態では、親和性エレメントは、ビオチンである。
【0344】
C.液相トランスポソーム複合体
標的化されたトランスポソーム複合体は、液相トランスポソーム複合体であってもよい。これらの液相トランスポソーム複合体は可動性であってもよく、固体支持体に固定化されていなくてもよい。いくつかの実施形態では、液相の標的化されたトランスポソーム複合体を使用して、溶液中でタグ付き断片を生成する。
【0345】
更に、本方法は、液相トランスポソーム複合体を伴う工程を含んでもよい。例えば、本明細書に提示される方法は、溶液中にトランスポソーム複合体を提供し、DNAがトランスポソーム複合体溶液によって断片化される条件下で、液相トランスポソーム複合体を固定化断片と接触させる工程であって、それにより、溶液中に一端を有する固定化核酸断片が得られる工程を更に含むことができる。いくつかの実施形態では、溶液中のトランスポソーム複合体は第2のタグを含むことができ、その結果、本方法は、第2のタグが溶液中にある、第2のタグを有する固定化核酸断片を生成する。第1及び第2のタグは、異なっていても同じであってもよい。
【0346】
いくつかの実施形態では、方法は、DNA断片が液相トランスポソーム複合体によって更に断片化される条件下で、液相トランスポソーム複合体を固定化DNA断片と接触させる工程であって、それにより、溶液中に一端を有する固定化核酸断片が得られる工程を更に含む。
【0347】
いくつかの実施形態では、液相トランスポソーム複合体は第2のタグを含み、それによって、溶液中に第2のタグを有する固定化核酸断片を生成する。いくつかの実施形態では、第1及び第2のタグは異なる。いくつかの実施形態では、液相トランスポソーム複合体の少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、第2のタグを含む。
【0348】
いくつかの実施形態では、表面結合トランスポソームの1つの形態は、固体支持体上に主に存在する。例えば、いくつかの実施形態では、かかる固体支持体上に存在するタグの少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、同じタグドメインを含む。そのような実施形態では、表面結合トランスポソームとの最初のタグメンテーション反応後、ブリッジ構造の少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、ブリッジの各末端に同じタグドメインを含む。第2のタグメンテーション反応は、ブリッジを更に断片化する溶液からのトランスポソームを添加することによって行うことができる。いくつかの実施形態では、液相トランスポソームのほとんど又は全ては、第1のタグメンテーション反応において生成されたブリッジ構造上に存在するタグドメインとは異なるタグドメインを含む。例えば、いくつかの実施形態では、液相トランスポソーム中に存在するタグの少なくとも50%、55%、60%、65%、70%、75%、80%、85%、90%、95%、96%、97%、98%、又は99%は、第1のタグメンテーション反応において生成されたブリッジ構造上に存在するタグドメインとは異なるタグドメインを含む。
【0349】
いくつかの実施形態では、鋳型の長さは、標準的なクラスタ化学を使用して適切に増幅され得るものよりも長い。例えば、いくつかの実施形態では、鋳型の長さは、少なくとも100bp、200bp、300bp、400bp、500bp、600bp、700bp、800bp、900bp、1000bp、1100bp、1200bp、1300bp、1400bp、1500bp、1600bp、1700bp、1800bp、1900bp、2000bp、2100bp、2200bp、2300bp、2400bp、2500bp、2600bp、2700bp、2800bp、2900bp、3000bp、3100bp、3200bp、3300bp、3400bp、3500bp、3600bp、3700bp、3800bp、3900bp、4000bp、4100bp、4200bp、4300bp、4400bp、4500bp、4600bp、4700bp、4800bp、4900bp、5000bp、10000bp、30000bp、又は100,000bpである。そのような実施形態では、第2のタグメンテーション反応は、その全体が本明細書に組み込まれる米国特許第9683230号に記載されているように、ブリッジを更に断片化する溶液からのトランスポソームを添加することによって行うことができる。したがって、第2のタグメンテーション反応は、ブリッジの内部スパンを除去することができ、更なるシークエンシング工程の準備が整ったクラスタに変換することができる表面に固定された短い断端を残す。特定の実施形態では、鋳型の長さは、上で例示したものから選択される上限及び下限によって規定される範囲内であり得る。
【0350】
D.アダプタ及びタグ
いくつかの実施形態では、第1のトランスポゾンは、3’トランスポゾン末端配列及び5’アダプタ配列を含む。いくつかの実施形態では、5’アダプタ配列は、タグ配列である。3’トランスポゾン末端配列及び5’タグを含む第1のトランスポゾンを含むトランスポソーム複合体によって媒介される断片化は、タグ付き断片のライブラリーを生成する方法において使用することができる。
【0351】
いくつかの実施形態では、アダプタ配列は、プライマー配列、インデックスタグ配列、捕捉配列、バーコード配列、切断配列、若しくはシークエンシング関連配列、又はそれらの組み合わせを含む。本明細書で使用されるとき、シークエンシング関連配列は、後のシークエンシング工程に関連する任意の配列であり得る。シークエンシング関連配列は、下流のシークエンシング工程を簡略化するように作用し得る。例えば、シークエンシング関連配列は、そうでなければ、アダプタを核酸断片にライゲーションする工程を介して組み込まれる配列であり得る。いくつかの実施形態では、アダプタ配列は、特定のシークエンシング方法においてフローセルへの結合を容易にするために、P5又はP7配列(又はそれらの相補体)を含む。
【0352】
本明細書で使用されるとき、用語「タグ」は、所望の意図された目的又は用途のための配列を示すポリヌクレオチドの部分又はドメインを指す。タグドメインは、任意の所望の目的のために提供される任意の配列を含み得る。例えば、いくつかの実施形態では、タグドメインは、1つ以上の制限エンドヌクレアーゼ認識部位を含む。いくつかの実施形態では、タグドメインは、クラスタ増幅反応のためのプライマーとのハイブリダイゼーションに好適な1つ以上の領域を含む。いくつかの実施形態では、タグドメインは、シークエンシング反応のためのプライマーとのハイブリダイゼーションに好適な1つ以上の領域を含む。任意の他の好適な特徴がタグドメインに組み込まれ得ることが理解されるであろう。いくつかの実施形態では、タグドメインは、5bp~200bpの長さを有する配列を含む。いくつかの実施形態では、タグドメインは、10bp~100bpの長さを有する配列を含む。いくつかの実施形態では、タグドメインは、20bp~50bpの長さを有する配列を含む。いくつかの実施形態では、タグドメインは、5、6、7、8、9、10、20、30、40、50、60、70、80、90、100、150又は200bpの長さを有する配列を含む。
【0353】
タグは、必要に応じて又は所望に応じて、1つ以上の機能的配列又は構成要素(例えば、プライマー配列、アンカー配列、ユニバーサル配列、スペーサー領域、又はインデックスタグ配列)を含み得る。
【0354】
いくつかの実施形態では、タグは、クラスタ増幅のための領域を含む。いくつかの実施形態では、タグは、シークエンシング反応をプライミングするための領域を含む。
【0355】
いくつかの実施形態では、方法は、ポリメラーゼと第1のトランスポゾンの一部に対応する増幅プライマーとを反応させることによって、固体支持体上の断片を増幅することを更に含む。いくつかの実施形態では、第1のトランスポゾンの一部は、増幅プライマーを含む。いくつかの実施形態では、第1のトランスポゾンのタグは、増幅プライマーを含む。
【0356】
いくつかの実施形態では、タグは、A14プライマー配列を含む。いくつかの実施形態では、タグは、B15プライマー配列を含む。
【0357】
いくつかの実施形態では、個々のビーズ上のトランスポソームは固有のインデックスを有し、多数のそのようなインデックス付きビーズが使用される場合、位相化された転写物が生じる。
【0358】
E.リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体
いくつかの実施形態では、標的化されたトランスポソーム複合体は、標的化オリゴヌクレオチドを含む。本明細書で使用されるとき、「標的化オリゴヌクレオチド」は、1つ以上の目的の核酸配列に結合し得るオリゴヌクレオチドである。いくつかの実施形態では、標的化オリゴヌクレオチドは、リコンビナーゼでコーティングされる。標的化オリゴヌクレオチドを使用して、トランスポソーム複合体の、標的核酸内の1つ以上の目的の核酸配列への結合を誘導することができる。
【0359】
いくつかの実施形態では、標的化されたトランスポソーム複合体は、トランスポザーゼと、3’トランスポゾン末端配列、5’アダプタ配列、及びリコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含み、標的化オリゴヌクレオチドは、1つ以上の目的の核酸配列に結合することができる、第1のトランスポゾンと、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列は、3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む。
【0360】
1.標的化オリゴヌクレオチド
標的化オリゴヌクレオチドは、標的核酸中の1つ以上の目的の核酸配列に対する親和性を有する任意のタイプの核酸であり得る。いくつかの実施形態では、標的化オリゴヌクレオチドは、標的核酸に含まれる配列に対する相補的配列に基づいて標的核酸にハイブリダイズすることができる。
【0361】
いくつかの実施形態では、標的化オリゴヌクレオチドは、標的核酸に含まれる1つ以上の配列に完全に又は部分的に相補的である核酸配列を含む。いくつかの実施形態では、標的化オリゴヌクレオチドの配列は、1つ以上の目的の核酸配列と完全に又は部分的に相補的である。
【0362】
いくつかの実施形態では、標的化オリゴヌクレオチドは、標的核酸に含まれる配列に80%、85%、90%、95%、97%、99%、又は100%相補的である。
【0363】
当業者は、任意の数の配列のデータベースを使用して、標的核酸中の目的の核酸配列に結合する標的化オリゴヌクレオチドを開発し得る。例えば、当業者は、所定の遺伝子における目的の核酸配列を選択し、目的の配列に相補的な標的化オリゴヌクレオチドを開発し得る。このようにして、トランスポソーム複合体は、所与の遺伝子に標的化される。
【0364】
いくつかの実施形態では、1つ以上の標的化オリゴヌクレオチドは、アダプタ配列の5’末端に連結される。いくつかの実施形態では、1つ以上の標的化オリゴヌクレオチドは、アダプタ配列の5’末端に直接連結される。いくつかの実施形態では、1つ以上の標的化オリゴヌクレオチドは、アダプタ配列の5’末端にリンカーを介して連結される。いくつかの実施形態では、リンカーは、オリゴヌクレオチドリンカーである。いくつかの実施形態では、リンカーは、非オリゴヌクレオチドリンカーである。いくつかの実施形態では、アダプタ配列及び標的化オリゴヌクレオチドの5’末端は、両方ともビオチン化され、ストレプトアビジンを介して連結される。
【0365】
2.リコンビナーゼ
リコンビナーゼは、核酸のストランド侵入を媒介することができる。このストランド侵入は、二本鎖標的DNAなどの二本鎖核酸へのリコンビナーゼの侵入であり得る。
【0366】
標的化オリゴヌクレオチドをリコンビナーゼでコーティングすることによって、これらのコーティングされたオリゴヌクレオチドは、二本鎖核酸のストランド侵入と、続いて、標的化オリゴヌクレオチドの1つ以上の目的の核酸配列への結合を媒介し得る。二本鎖標的核酸へのオリゴヌクレオチドのリコンビナーゼ媒介挿入はStrand Invasion Based Amplification(SIBA、例えば、Hoser et al.PLoS ONE 9(11):e112656参照)に記載されている。リコンビナーゼは、二本鎖核酸の二重鎖領域を解離させて、標的核酸の一本鎖領域への標的化オリゴヌクレオチドの結合を可能にすることができる。
図9に示すように、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドの結合は、トランスポソームを標的核酸中の目的の領域に局在化させることができる。
【0367】
いくつかの実施形態では、リコンビナーゼは、UVSX、Rec233、又はRecAである。
【0368】
F.触媒的に不活性なエンドヌクレアーゼを含む標的化されたトランスポソーム複合体
複合体が触媒的に不活性なエンドヌクレアーゼを含む、標的化されたトランスポソーム複合体が本明細書に記載される。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、トランスポソーム複合体を標的化する役割を果たす。
【0369】
いくつかの実施形態では、標的化されたトランスポソーム複合体は、触媒的に不活性なエンドヌクレアーゼを含む。本明細書で使用されるとき、「触媒的に不活性なエンドヌクレアーゼ」は、核酸に結合できるが、切断を媒介しないエンドヌクレアーゼである(これは、エンドヌクレアーゼが切断活性を有さないことを意味し得るか、又は切断によって失われた核酸の量がタグメンテーションを実質的に妨害しないように、エンドヌクレアーゼが最小限の切断活性のみを有することを意味し得る)。触媒的に不活性なエンドヌクレアーゼは、不活性化エンドヌクレアーゼ(「dCas」タンパク質など)と呼ばれることもある。例示的な触媒的に不活性なエンドヌクレアーゼは、
図11に示されるようなdCas9である。通常、エンドヌクレアーゼは核酸に結合でき、切断を媒介する。したがって、触媒的に不活性なエンドヌクレアーゼは、切断活性を有さずに核酸結合機能を保持するエンドヌクレアーゼである。触媒的に不活性なエンドヌクレアーゼを使用して、トランスポソーム複合体を標的核酸中の1つ以上の目的の核酸配列に標的化することができる。代表的な触媒的に不活性なCas9タンパク質としては、その全体が本明細書に組み込まれる米国特許第10457969号に開示されているものが挙げられる。
【0370】
いくつかの実施形態では、標的化されたトランスポソーム複合体は、トランスポザーゼと、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、ガイドRNAと会合した触媒的に不活性なエンドヌクレアーゼであって、ガイドRNAが、1つ以上の目的の核酸配列へのエンドヌクレアーゼの結合を導くことができる、触媒的に不活性なエンドヌクレアーゼと、トランスポゾン末端配列の相補体を含む、第2のトランスポゾンと、を含む。
【0371】
本明細書で使用されるとき、「ガイドRNA」は、標的核酸に結合するエンドヌクレアーゼに特異性を付与するRNA配列である。触媒的に不活性なエンドヌクレアーゼは、ガイドRNAによって、1つ以上の目的の核酸配列に標的化され得る。
【0372】
ある範囲のガイドRNAを、触媒的に不活性なエンドヌクレアーゼと共に使用することができる。いくつかの実施形態では、ガイドRNAは、トランス活性化CRISPR RNA(tracrRNA)及びCRISPR RNA(crRNA)を含む。いくつかの実施形態では、ガイドRNAは、tracrRNAのみを含む。いくつかの実施形態では、ガイドRNAは、tracrRNA及びcrRNAの両方を含む単一ガイドRNA(又はsgRNA)である。
【0373】
当業者は、利用可能な多くの設計ツールのうちの1つ(例えば、Synthego又はBenchlingから入手可能なもの)を使用して、1つ以上の目的の配列に結合する特異性を有するガイドRNAを開発することができる。ガイドRNAの選択はまた、標的核酸内のプロトスペーサー隣接モチーフ(PAM)の存在に基づくが、設計されたガイドRNAにおいてより大きな柔軟性を可能にする最小のPAM特異性を有するエンドヌクレアーゼが記載されている(
図13に示されるように)。
【0374】
本明細書に記載されるように、単一ガイドRNA配列は、トランスポゾンも含むオリゴヌクレオチドに含まれ得る。このようなオリゴヌクレオチドの開発は、標準的な分子生物学的手法を用いて行うことができる。
【0375】
いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、トランスポザーゼと会合している。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、トランスポザーゼに連結される。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、トランスポザーゼに直接的又は間接的に連結される。
【0376】
いくつかの実施形態では、トランスポザーゼ及び触媒的に不活性なエンドヌクレアーゼは、CRISPR関連トランスポザーゼに含まれる。本明細書で使用されるとき、「CRISPR関連トランスポザーゼ」は、エンドヌクレアーゼ及びトランスポザーゼを含む多タンパク質複合体を指す。
【0377】
CRISPR関連トランスポザーゼを生成するために、Tn7様トランスポゾンがヌクレアーゼ欠損CRISPR-Casシステムを利用している他のシステムも記載されている(Klompe et al.,Nature 571:219-225(2019)参照)。本明細書に記載される標的化されたトランスポソームは、任意のタイプのCRISPR-Casシステムを含み得る。
【0378】
触媒的に不活性なエンドヌクレアーゼはまた、多くの異なる方法でトランスポザーゼに連結され得る。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、トランスポザーゼの5’末端に連結される。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、トランスポザーゼの3’末端に連結される。いくつかの実施形態では、トランスポザーゼは、触媒的に不活性なエンドヌクレアーゼの5’末端に連結される。いくつかの実施形態では、トランスポザーゼは、触媒的に不活性なエンドヌクレアーゼの3’末端に連結される。
【0379】
いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼは、
図12Aに示すように、融合タンパク質に含まれる。融合タンパク質とは、触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼが単一のタンパク質に含まれることを意味する。いくつかの実施形態は、触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼを含む融合タンパク質は、宿主細胞によって発現される核酸構築物を使用して単一タンパク質として発現される。
【0380】
いくつかの実施形態では、触媒的に不活性及びトランスポザーゼは、直接連結される。いくつかの実施形態では、触媒的に不活性及びトランスポザーゼは、リンカーを介して連結される。
【0381】
いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼは、別個のタンパク質に含まれる。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼは、宿主細胞において別個のタンパク質として発現される。
【0382】
いくつかの実施形態では、別個の触媒的に不活性なエンドヌクレアーゼ及びトランスポザーゼは、結合パートナーの対形成を介して互いに会合することができ、第1の結合パートナーは触媒的に不活性なエンドヌクレアーゼに結合し、第2の結合パートナーはトランスポザーゼに結合する。いくつかの実施形態では、結合パートナーは、
図12Bに示されるように、ビオチン及びストレプトアビジン/アビジンである。
【0383】
いくつかの実施形態では、sgRNAは、第1及び/又は第2のトランスポゾンを含むオリゴヌクレオチドに含まれる。いくつかの実施形態では、オリゴヌクレオチドは、5’単一ガイドRNA並びに3’第1及び/又は第2のトランスポゾンを含む。いくつかの実施形態では、sgRNA並びに第1及び/又は第2のトランスポゾンは、相補的配列の対形成を介して互いに会合している(
図12C)。いくつかの実施形態では、sgRNA並びに第1及び/又は第2のトランスポゾンは、別個のオリゴヌクレオチドに含まれる。いくつかの実施形態では、sgRNAは、連続するsgRNA転移鎖オリゴヌクレオチドに含まれる(
図12D)。
【0384】
触媒的に不活性なエンドヌクレアーゼの特異性を増加させるための多くの異なる手段を、
図12A~12D及び
図13に示す。触媒的に不活性なエンドヌクレアーゼの特異性を増加させる任意の手段もまた、触媒的に活性なエンドヌクレアーゼの特異性を増加させるために使用され得る。
【0385】
いくつかの実施形態では、単一ガイドRNAは、20個未満のヌクレオチドを含む(
図12Bの17個のヌクレオチドを有する実施形態又は
図13の18個のヌクレオチドを有する実施形態など)。20個未満のヌクレオチドを含むそのような単一ガイドRNAは、切断型ガイドRNAと称され得る。いくつかの実施形態では、単一ガイドRNA配列は、15、16、17、18、又は19個のヌクレオチドを含む。より短い単一ガイドRNAは、sgRNAの配列に完全に又は高度に相補的でない標的核酸中の配列に単一ガイドRNAが結合する可能性を低下させる。
【0386】
いくつかの実施形態では、単一ガイドRNAは、ヘアピン二次構造を含む(Kocak et al.,Nat Biotechnol.37(6):657-666(2019))。いくつかの実施形態では、ヘアピン二次構造は、トーホールドでブロックされたガイドRNAなどのトリガー鎖の非存在下で標的核酸への結合をブロックするために使用される(Siu et al.Nat Chem Biol 15(3):217-220(2019))。
【0387】
いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、Cas9タンパク質(不活性化Cas9又はdCas9と称され得る)である。多種多様な異なるCas9タンパク質が、本明細書に記載の標的化されたトランスポソーム複合体に含まれてもよい。更に、当業者は、エンドヌクレアーゼの触媒ドメインを認識しており、野生型エンドヌクレアーゼから触媒的に不活性なエンドヌクレアーゼを生成するために突然変異を設計することができるであろう(Maeder et al.,Nat Methods 10(10):977-979(2013)参照)。このような設計された触媒的に不活性なエンドヌクレアーゼは、その切断活性の欠如を確認するために試験され得る。
【0388】
いくつかの実施形態では、Cas9タンパク質は、
図13に示されるようなStreptococcus canis Cas9である。いくつかの実施形態では、Streptococcus canis Cas9は、最小限の配列制約を有する(Chatterjee et al.,Sci.Adv.4:eaau0766(2018)参照)。いくつかの実施形態では、Streptococcus canis Cas9は、ガイドRNAに結合することができる標的核酸中の配列に近接する特定のプロトスペーサー隣接モチーフ(PAM)に対する必要性が低減されている。例えば、Streptococcus canis Cas9は、NRG PAM配列の代わりにNNG PAM配列を必要とする場合があり(
図13に示されるように)、これは、特異的PAMの必要性を低減し、ガイドRNAへの結合のために目的の配列を選択する能力を増加させる。最小限の配列制約を有するエンドヌクレアーゼのより低い配列制約は、標的核酸中の目的の配列に近接する特定のPAM配列に対する要件を低下させるので、改善された標的設計空間を可能にすることができる。
【0389】
いくつかの実施形態では、CRISPR関連トランスポザーゼは、シアノバクテリアScytonema hofmanni(ShCAST)由来である。ShCASTは、Tn7様トランスポザーゼサブユニット及びV-K型CRISPRエフェクター(Cas12k)によって媒介されるRNA指向性(sgRNA)DNA転位のための4タンパク質系である(Strecker et al.,Science.365(6448):48-53(2019)参照、Streckerの
図5に示されている実施形態を含み、これらは全て、ShCASTに関する教示のために参照により組み込まれる)。Tn7様トランスポゾンを含むこれらのシステム及びCRISPR-Casシステムは、CRISPRエフェクターをハイジャックし、標的部位においてRループを生成し、プラスミド及びファージを介したトランスポゾンの拡散を促進し得ることが示唆されている。ShCASTは、RNAガイドTn7様トランスポゾンを介して、標的ヌクレオチド中の固有の部位への挿入をもたらすことができる。したがって、いくつかの実施形態では、標的化されたトランスポソーム複合体は、標的化転位を可能にするために、触媒的に不活性なエンドヌクレアーゼと、ShCAST内のトランスポザーゼと、を含む。
【0390】
1.Casエンドヌクレアーゼを含む標的化されたトランスポソーム複合体
いくつかの実施形態では、標的化されたトランスポソーム複合体は、Casエンドヌクレアーゼを含む。
【0391】
本明細書で使用されるとき、「CRISPR-Casシステム」、「Cas-gRNAリボ核タンパク質」、及びCas-gRNA RNPなどの用語は、標的核酸内の配列に相補的又は実質的に相補的なオリゴヌクレオチド配列を含むガイドRNA(gRNA)配列と、Casタンパク質とを含む酵素系を指す。CRISPR-Casシステムは、一般に、コアエレメント含量及び配列に基づいて、更に10のサブタイプに細分される3つの主要なタイプに分類することができる;例えば、Makarova et al.,「Evolution and classification of the CRISPR-Cas systems,」Nat Rev Microbiol.9(6):467-477(2011)参照。Casタンパク質は、様々な活性、例えばヌクレアーゼ活性を有し得る。したがって、CRISPR-Casシステムは、(例えば、gRNAを介して)特定の配列を標的化するための機構、並びに(例えば、Casタンパク質を介して)配列に対するある特定の酵素活性を提供する。
【0392】
I型CRISPR-Casシステムは、別個のヘリカーゼ活性及びDNase活性を有するCas3タンパク質を含み得る。例えば、1-E型システムにおいて、crRNAは、カスケード(抗ウイルス防御のためのCRISPR関連複合体)と呼ばれるマルチサブユニットエフェクター複合体に組み込まれ、これは、標的DNAに結合し、Cas3タンパク質による分解を誘発する;例えば、Brouns et al.,「Small CRISPR RNAs guide antiviral defense in prokaryotes」,Science 321(5891):960-964(2008);Sinkunas et al.,「Cas3 is a single-stranded DNA nuclease and ATP-dependent helicase in the CRISPR-Cas immune system」,EMBO J 30:1335-1342(2011);及びBeloglazova et al.,「Structure and activity of the Cas3 HD nuclease MJ0384,an effector enzyme of the CRISPR interference,EMBO J 30:4616-4627(2011)を参照されたい。II型CRISPR-Casシステムは、crRNAを生成して標的DNAを切断することができる単一タンパク質(約160kDa)である、シグネチャーCas9タンパク質を含む。Cas9タンパク質は、典型的には、2つのヌクレアーゼドメインである、アミノ末端付近のRuvC様ヌクレアーゼドメインと、タンパク質の中央付近のHNH(又はMcrA様)ヌクレアーゼドメインとを含む。Cas9タンパク質の各ヌクレアーゼドメインは、二重らせんの一方の鎖を切断するように特殊化されている;例えば、Jinek et al.,「A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity,Science 337(6096):816-821(2012)を参照されたい。III型CRISPR-Casシステムは、ポリメラーゼ及びRAMPモジュールを含む。III型システムは、III-A及びIII-Bのサブタイプに更に分けることができる。III-A型CRISPR-Casシステムは、プラスミドを標的化することが示されており、III-A型システムのポリメラーゼ様タンパク質は、標的DNAの切断に関与する;例えば、Marraffini et al.,「CRISPR interference limits horizontal gene transfer in Staphylococci by targeting DNA」,Science 322(5909):1843-1845(2008)を参照されたい。III-B型CRISPR-Casシステムもまた、RNAを標的化することが示されている;例えば、Hale et al.,「RNA-guided RNA cleavage by a CRISPR-RNA-Cas protein complex」,Cell 139(5):945-956(2009)を参照されたい。CRISPR-Casシステムは、天然に存在するCRISPR-Casシステムに由来する操作された及び/又はプログラムされたヌクレアーゼ系を含む。CRISPR-Casシステムは、操作された及び/又は変異したCasタンパク質を含み得る。CRISPR-Casシステムは、操作された及び/又はプログラムされたガイドRNAを含み得る。
【0393】
いくつかの実施形態では、本発明のCas-gRNA RNPのうちの1つにおけるCasタンパクは、Cas9、又はgRNAが相補的である配列で標的核酸を切断することができる他の適切なCasを、以下の参照文献に記載されているような様式で含むことができ、これらの文献のそれぞれの全内容は参照により本明細書に組み込まれる:Nachmanson et al.,「Targeted genome fragmentation with CRISPR/Cas9 enables fast and efficient enrichment of small genomic regions and ultra-accurate sequencing with low DNA input(CRISPR-DS)」,Genome Res.28(10):1589-1599(2018);Vakulskas et al.,「A high-fidelity Cas9 mutant delivered as a ribonucleoprotein complex enables efficient gene editing in human hematopoietic stem and progenitor cells」,Nature Medicine 24:1216-1224(2018);Chatterjee et al.,「Minimal PAM specificity of a highly similar SpCas9 ortholog」,Science Advances 4(10):eaau0766,1-10(2018);Lee et al.,「CRISPR-Cap:multiplexed double-stranded DNA enrichment based on the CRISPR system」,Nucleic Acids Research 47(1):1-13(2019)。S.thermophilus CRISPR-Casシステムから単離されたCas9-crRNA複合体、並びに、別個の要素からインビトロで組み合わされた複合体は、それが合成オリゴデオキシヌクレオチド及びcrRNAに相補的なヌクレオチド配列を有するプラスミドDNAの両方に結合することが実証される。Cas9は、RuvC及びHNH活性部位/ヌクレアーゼドメインの2つのヌクレアーゼドメインを有し、これらの2つのヌクレアーゼドメインは、反対のDNA鎖の切断に関与することが示されている。いくつかの例では、Cas9タンパク質は、S.thermophilus CRISPR-CasシステムのCas9タンパク質に由来する。いくつかの例では、Cas9タンパク質は、約1,409アミノ酸残基を有するマルチドメインタンパク質である。
【0394】
他の実施形態では、Casは、gRNAが相補的である配列で標的核酸を切断しないように操作されて、不活性化Cas(dCas)を、例えば、以下の参照文献に記載されているような様式で調製してもよく、これらの文献のそれぞれの全内容は参照により本明細書に組み込まれる:Guilinger et al.,「Fusion of catalytically inactive Cas9 to Fokl nuclease improves the specificity of genome modification」,Nature Biotechnology 32:577-582(2014);Bhatt et al.,「Targeted DNA transposition using a dCas9-transposase fusion protein」,https://doi.org/10.1101/571653,pages 1-89(2019);Xu et al.,「CRISPR-assisted targeted enrichment-sequencing(CATE-seq)」,available at URL www.biorxiv.org/content/10.1101/672816v1,1-30(2019);及びTijan et al.,「dCas9-targeted locus-specific protein isolation method identifies histone gene regulators」,PNAS 115(12):E2734-E2741(2018)。ヌクレアーゼ活性を欠くCasは、不活性化Cas(dCas)と称され得る。いくつかの実施形態では、dCasは、RuvC及びHNH活性部位/ヌクレアーゼドメインの両方が変異している、Cas9タンパク質のヌクレアーゼ欠損変異体を含んでもよい。Cas9タンパク質のヌクレアーゼ欠損変異体(dCas9)は、二本鎖DNAに結合するが、DNAを切断しない。Cas9タンパク質の別の変異体は、crRNAに相補的な鎖を切断するドメイン中の第1の突然変異と、crRNAに非相補的な鎖を切断するドメイン中の第2の突然変異とを有する、2つの不活性化ヌクレアーゼドメインを有する。いくつかの実施形態では、Cas9タンパク質は第1の突然変異D10A及び第2の突然変異H840Aを有する。
【0395】
いくつかの実施形態では、Casタンパク質は、カスケードタンパク質を含む。E.coliのカスケード複合体は、配列特異的に二本鎖DNA(dsDNA)標的を認識する。E.coliのカスケード複合体は、5つの機能的に必須のCRISPR関連(Cas)タンパク質(CasA1B2C6D1E1、カスケードタンパク質とも呼ばれる)と61ヌクレオチドのcrRNAとを含む、405kDaの複合体である。crRNAは、相補的DNA鎖と塩基対を形成する一方で、非相補鎖を置換してRループを形成することによって、カスケード複合体をdsDNA標的配列に誘導する。カスケードは、ATPを消費することなく標的DNAを認識し、これは、連続的なインベーダーDNA監視がエネルギー投資なしに行われることを示唆する;例えば、Matthijs et al.,「Structural basis for CRISPR RNA-guided DNA recognition by Cascade」,Nature Structural&Molecular Biology 18(5):529-536(2011)を参照されたい。いくつかの実施形態では、Casタンパク質は、Cas3タンパク質を含む。例示的には、E.coli Cas3は、RNAとDNAとのATP非依存的アニーリングを触媒してRループ、及びRNA塩基対のハイブリッドを二本鎖DNAに形成し得る。Cas3タンパク質は、Cas9よりも長いgRNAを使用し得る;例えば、Howard et al.,「Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein」,Biochem J.439(1):85-95(2011)を参照されたい。そのようなより長いgRNAは、標的DNAへの他のエレメントのより容易なアクセス、例えば、ポリメラーゼによって伸長されるプライマーのアクセスを可能にし得る。Cas3タンパク質によって提供される別の特徴は、Cas3タンパク質がCas9のようにPAM配列を必要とせず、したがって、所望の配列を標的化するためにより高い柔軟性を提供することである。Cas3によるRループ形成は、補因子としてマグネシウムを利用し得る;例えば、Howard et al.,「Helicase disassociation and annealing of RNA-DNA hybrids by Escherichia coli Cas3 protein」,Biochem J.439(1):85-95(2011)を参照されたい。カチオンなどの任意の適切な補因子が、本発明の組成物及び方法において使用されるCasタンパク質と一緒に使用され得ることが理解されるであろう。
【0396】
二本鎖ポリヌクレオチドを破壊し、ループ構造を作り出すことができる任意のCRISPR-Casシステムが使用され得ることも理解されるべきである。例えば、Casタンパク質としては、以下の参考文献に記載されているようなCasタンパク質を挙げることができるが、これらに限定されず、これらの文献のそれぞれの全内容は参照により本明細書に組み込まれる:Haft et al.,「A guild of 45 CRISPR-associated(Cas)protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes」,PLoS Comput Biol.1(6):e60,1-10(2005);Zhang et al.,「Expanding the catalog of cas genes with metagenomes」,Nucl.Acids Res.42(4):2448-2459(2013);及びStrecker et al.,「RNA-guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53(2019)(Casタンパク質はCas12kを含み得る)。いくつかのこれらのCRISPR-Casシステムは、標的配列を認識して結合するために特異的配列を利用し得る。例えば、Cas9は、5’-NGGプロトスペーサー隣接モチーフ(PAM)の存在を利用し得る。
【0397】
CRISPR-Casシステムはまた、操作された及び/又はプログラムされたガイドRNA(gRNA)を含み得る。本明細書で使用されるとき、「ガイドRNA」及び「gRNA」(当該技術分野では単一ガイドRNA又はsgRNAと呼ばれることもある)という用語は、標的DNA配列の領域に相補的又は実質的に相補的であり、Casタンパク質をその領域に誘導する配列を含むRNAを意味することが意図される。ガイドRNAは、標的DNA配列の領域に相補的又は実質的に相補的であるヌクレオチド配列に加えて、ヌクレオチド配列を含み得る。gRNAを設計するための方法は、当該技術分野において周知であり、非限定的な例は、以下の参考文献に提供されており、これらの各々の全内容は、参照により本明細書に組み込まれる:Stevens et al.,「A novel CRISPR/Cas9 associated technology for sequence-specific nucleic acid enrichment」,PLoS ONE 14(4):e0215441,pages 1-7(2019);Fu et al.,「Improving CRISPR-Cas nuclease specificity using truncated guide RNAs,Nature Biotechnology 32(3):279-284(2014);Kocak et al.,「Increasing the specificity of CRISPR systems with engineered RNA secondary structures」,Nature Biotechnology 37:657-666(2019);Lee et al.,「CRISPR-Cap:multiplexed double-stranded DNA enrichment based on the CRISPR system」,Nucleic Acids Research 47(1):e1,1-13(2019);Quan et al.,「FLASH:a next-generation CRISPR diagnostic for multiplexed detection of antimicrobial resistance sequences」,Nucleic Acids Research 47(14):e83,1-9(2019);及びXu et al.,「CRISPR-assisted targeted enrichment-sequencing(CATE-seq)」,https://doi.org/10.1101/672816,1-30(2019)。
【0398】
いくつかの実施形態では、gRNAは、キメラ、例えば、トランス活性化CRISPR RNA(tracrRNA)に融合されたCRISPR RNA(crRNA)を含む。そのようなキメラ単一ガイドRNA(sgRNA)は、Jinek et al.,「A programmable dual-RNA-guided endonuclease in adaptive bacterial immunity」,Science 337(6096):816-821(2012)に記載されている。Casタンパク質は、キメラsgRNAによって、5’-NGGプロトスペーサー隣接モチーフ(PAM)が続く任意のゲノム遺伝子座に指向され得る。1つの非限定的な例において、crRNA及びtracrRNAは、T7プロモーターを含む合成二本鎖DNA鋳型を使用して、インビトロ転写によって合成され得る。tracrRNAは固定配列を有してもよいが、標的配列はcrRNAの配列の一部を決定してもよい。等モル濃度のcrRNA及びtracrRNAを混合し、55℃で30秒間加熱してもよい。Cas9を37℃にて同じモル濃度で添加し、RNAミックスと共に10分間インキュベートすることができる。次いで、10~20倍モル過剰の得られたCas9-gRNA RNPを標的DNAに添加することができる。結合反応は15分以内に起こり得る。他の適切な反応条件を容易に使用することができる。
【0399】
2.ShCASTを含む標的化されたトランスポソーム複合体
いくつかの実施形態では、標的化されたトランスポソーム複合体は、ShCASTに含まれる。
【0400】
本明細書におけるいくつかの例は、1つ以上の目的の配列を含む標的核酸(例えば、二本鎖核酸)を含む組成物を提供する。組成物は、ガイドRNA(gRNA)にカップリングしたShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)をそれぞれ含む複数の複合体を含み得る。ShCASTは、それにカップリングした増幅アダプタを有し得る。複合体の各々は、標的核酸(例えば、1つ以上の目的の核酸配列)中のサブ配列の対応する1つにハイブリダイズされ得る。このような複合体は、米国特許仮出願第63/162,775号及び同第63/163,381号に開示されており、これらの各々は、参照によりその全体が本明細書に組み込まれる。
【0401】
いくつかの実施形態では、組成物は、(1)1つ以上の目的の核酸配列を含む標的核酸と、(2)gRNAにカップリングしたShCASTをそれぞれ含む、本明細書に記載の複数の標的化されたトランスポソーム複合体と、を含み、ShCASTは、それにカップリングした増幅アダプタを有し、標的化されたトランスポソーム複合体の各々は、目的のDNA配列にハイブリダイズされる。
【0402】
いくつかの実施形態では、ShCASTは、触媒的に不活性なエンドヌクレアーゼ(Cas12Kなど)と、トランスポザーゼ(Tn5など)と、を含む。いくつかの態様では、ShCASTによる核酸の切断は、1)1つ以上の目的の配列に結合したgRNAへの触媒的に不活性なエンドヌクレアーゼの会合に基づく核酸への結合、及び2)トランスポザーゼによる切断を伴う、2段階プロセスとみなすことができる。いくつかの実施形態では、トランスポザーゼの核酸への非特異的結合を制限することにより、標的断片(すなわち、触媒的に不活性なエンドヌクレアーゼとgRNAとの会合後の切断から生成される断片)の調製頻度が増加する。
【0403】
いくつかの実施形態では、組成物は、サブ配列への複合体のハイブリダイゼーションを促進し、かつトランスポザーゼの結合を阻害する条件を有する流体を更に含む。いくつかの例では、流体の条件は、トランスポザーゼの活性のために十分な量のマグネシウムイオンが存在しないことを含む。
【0404】
トランスポザーゼによる結合を阻害することにより、ShCASTによる切断は、ShCASTに含まれるCas12Kが、核酸中の目的の配列に結合したgRNAと会合している部位に限定される。このようにして、非特異的切断(トランスポザーゼの核酸への非特異的結合に起因する)が制限され、核酸の大部分の切断は、目的の配列内又はその近傍の部位で行われる。
【0405】
いくつかの実施形態では、複合体に含まれるトランスポザーゼの結合を制限するための条件は、15mM以下のマグネシウム濃度及び/又は50nM以下のトランスポザーゼ濃度である。トランスポザーゼの結合を阻害するそのような組成物は、ShCAST中に含まれるトランスポザーゼによる非特異的切断を阻害する働きをすることができ、ほとんどの切断は、核酸中の目的の配列に結合したgRNAへのCasK12の結合に基づいて起こる。
【0406】
いくつかの例では、組成物は、トランスポザーゼの活性を促進する条件を有する流体を更に含み、トランスポザーゼは、標的核酸中の位置に増幅アダプタを付加する。いくつかの例では、流体の条件は、トランスポザーゼの活性のために十分な量のマグネシウムイオンの存在を含む。トランスポザーゼの活性を促進するそのような実施形態は、gRNAによって結合された目的の配列における又はその近傍の断片を、例えばタグメンテーションによって調製するためのものであってもよい。このような条件は、15mM以上のマグネシウム濃度であり得る。
【0407】
いくつかの実施形態では、ShCASTは、Cas12Kを含む。いくつかの例では、トランスポザーゼは、Tn5又はTn7トランスポザーゼを含む。いくつかの実施形態では、アダプタは、P5アダプタ及びP7アダプタのうちの少なくとも1つを含む。いくつかの実施形態では、標的核酸は、二本鎖DNAを含む。
【0408】
いくつかの例では、gRNA及びトランスポザーゼのうちの少なくとも1つは、ビオチン化される。組成物は、ビオチン化されたgRNA及びトランスポザーゼのうちの少なくとも1つがカップリングされる、ストレプトアビジンでコーティングされたビーズを更に含み得る。
【0409】
例えば、
図16A及び
図16Bは、ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮のための例示的な組成物及びプロセスにおける操作を概略的に示す。ShCAST6000は、Cas12k6001と、RNAガイド6004を用いてE.coliゲノム中の特定の部位にDNA6003を挿入することができるTn7様トランスポザーゼ6002とを含む。本明細書で提供されるいくつかの例は、特定の遺伝子の標的化増幅のために、ShCAST又はTn5トランスポザーゼを組み込んだ改変バージョンのShCAST(ShCAST-Tn5)を利用する。このように、ライブラリー調製及び濃縮工程が組み合わされ、したがって、標的ライブラリシークエンシングのワークフロー効率を簡略化し、改善し、自動化を促進する。
【0410】
例示的には、gRNA6004は、特定の遺伝子(配列)を標的化するように設計されてもよく、gRNAの間隔は、挿入サイズを制御してもよい。いくつかの例では、gRNA6004及び/又はShCAST/ShCAST-Tn5 6002は、タグ6005にカップリングされてもよく、例えば、ビオチン化されてもよい。
図16Aに例示されているような様式で、gRNA6004及びアダプタ6003(例えば、Illuminaアダプタ)を有する転位性エレメントをShCASTのトランスポザーゼ6002上に含ませ、複合体6000を得ることができる。
図16Bのプロセスフロー6010に例示されるような様式で、得られたShCAST/ShCAST-Tn5複合体6000は、複合体が標的DNA中のそれぞれの配列に結合することを可能にしながら、タグメンテーションを阻害する流体条件下(例えば、低マグネシウム又はマグネシウムなし)で、ゲノムDNA(標的核酸)6011と混合されてもよい。次いで、複合体は、タグ付けされた(例えば、ビオチン化された)gRNA及び/又はShCAST/ShCAST-Tn5がカップリングを形成することになるストレプトアビジンビーズ6012などのタグパートナーにカップリングされた基質を使用して単離されてもよい。例えば、オフターゲットタグメンテーションを低減又は最小化するために、任意の非結合DNAを洗い流してもよい。次いで、流体条件を変更して(例えば、マグネシウムを十分に増加させて)、タグメンテーションを促進することができる。シークエンシングのための調製においてビーズからライブラリーを遊離させるために、ギャップ充填ライゲーション工程とそれに続く熱解離を使用することができる。
【0411】
図16A及び
図16Bに例示されるような組成物及び操作において、複合体6000のトランスポザーゼ部分6002は、DNAにランダムに挿入することが可能であり得ることに留意されたい。そのような挿入は、ShCAST/ShCAST-Tn5複合体を、タグメンテーションを阻害することによって、標的が結合されることを可能にする流体条件下(例えば、低マグネシウム又は無マグネシウム)でゲノムDNAと混合することによって阻害又は最小化され得る。
【0412】
いくつかの実施形態では、方法は、オフターゲットタグメンテーションを制限するように設計される。いくつかの実施形態では、ShCASTを用いた標的化転位の方法中の低濃度のTn5は、オフターゲットタグメンテーションを制限する。いくつかの実施形態では、低濃度のTn5は、ShCASTが核酸に非特異的に結合する数を制限する。
【0413】
いくつかの実施形態では、gRNAは、標的配列内の1つ以上の目的の遺伝子座におけるShCAST(及び、つまりトランスポザーゼ)の結合を標的とし、これにより、ユーザは、フォワードプライマー及びリバースプライマーの両方を用いて増幅可能なPCR産物を生成することができる。いくつかの実施形態では、異なるgRNAは、目的の遺伝子座において異なる配列に結合する、すなわち、異なるgRNAは、目的の遺伝子座内の2つ以上の目的の配列に結合する。このような目的の遺伝子座は、例えば、目的の遺伝子内の配列又はそれに近接する配列であり得る。
【0414】
本発明の方法を使用して生成された断片は、全てが両端に適切なアダプタを有する断片の調製のために、2つのトランスポソーム複合体によるタグメンテーションを必要とする。断片が、(gRNAによって)目的の遺伝子座に標的化される1つの標的化されたトランスポソーム複合体を使用して生成され、他のトランスポソーム複合体がランダムに結合する場合、断片は、本方法を使用して適切に増幅するには大きすぎる可能性がある。いくつかの実施形態では、トランスポザーゼ濃度が非常に低い場合、増幅可能な/シークエンシング可能な断片を生成するのに十分に近接した別のTn5の隣のゲノムにわたってランダムに結合する可能性は低い。あるいは、ShCASTによる結合及び切断は、低温(37℃未満など)で行われてもよい。したがって、オフターゲット結合及びShCASTによるタグメンテーションを介して生成された断片は、増幅可能なPCR産物ではない可能性が高い。トランスポザーゼが比較的近接してクラスタ化される場合(目的の遺伝子座を標的とするように設計されたgRNAを使用して標的化されたShCAST複合体と同様に)のみ、PCR濃縮を受けることができる断片が生成される。
【0415】
Cas12k及びTn7を含むShCASTに関する更なる詳細については、参照することによりその全体が本明細書に組み込まれる、Strecker et al.,Science.365(6448):48-53(2019)を参照されたい。
【0416】
G.ジンクフィンガーDNA結合ドメインを含む標的化されたトランスポソーム
いくつかの実施形態では、標的化されたトランスポソーム複合体は、ジンクフィンガーDNA結合ドメインを含む。このジンクフィンガーDNA結合ドメインは、トランスポソーム複合体を標的核酸中の目的の配列に標的化する役割を果たし得る。
【0417】
いくつかの実施形態では、ジンクフィンガーDNA結合ドメインは、標的核酸中の1つ以上の目的の配列に結合するように設計される。特定の配列に結合するようにジンクフィンガーDNA結合ドメインを設計する手段は、当該分野で周知である(Wei et al.,BMC Biotechnology 8:28(2008)参照)。
【0418】
いくつかの実施形態では、標的化されたトランスポソーム複合体は、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、ジンクフィンガーDNA結合ドメインであって、ジンクフィンガーDNA結合ドメインが1つ以上の目的の核酸配列に結合できる、ジンクフィンガーDNA結合ドメインと、トランスポゾン末端配列の相補体を含む第2のトランスポゾンと、を含む。
【0419】
いくつかの実施形態では、複合体は、ジンクフィンガーDNA結合ドメインアレイを含む。本明細書で使用されるとき、「ジンクフィンガーDNA結合アレイ」は、2つ以上のジンクフィンガーDNA結合ドメインを含むドメインである。
【0420】
いくつかの実施形態では、ジンクフィンガーDNA結合ドメインは、トランスポザーゼと会合している。いくつかの実施形態では、ジンクフィンガーDNA結合ドメインは、トランスポザーゼに連結される。
【0421】
いくつかの実施形態では、ジンクフィンガーDNA結合ドメインは、トランスポザーゼの5’末端に連結される。いくつかの実施形態では、ジンクフィンガーDNA結合ドメインは、トランスポザーゼの3’末端に連結される。いくつかの実施形態では、トランスポザーゼは、ジンクフィンガーDNA結合ドメインの5’末端に連結される。いくつかの実施形態では、トランスポザーゼは、ジンクフィンガーDNA結合ドメインの3’末端に連結される。いくつかの実施形態では、ジンクフィンガーDNA結合ドメイン及びトランスポザーゼは、融合タンパク質に含まれる。
【0422】
いくつかの実施形態では、ジンクフィンガーDNA結合ドメイン及びトランスポザーゼは、リンカーを介して連結される。
【0423】
いくつかの実施形態では、ジンクフィンガーDNA結合ドメイン及びトランスポザーゼは、別個のタンパク質に含まれる。いくつかの実施形態では、別個のジンクフィンガーDNA結合ドメイン及びトランスポザーゼは、結合パートナーの対形成を介して互いに会合することができ、第1の結合パートナーは触媒的に不活性なエンドヌクレアーゼに結合し、第2の結合パートナーはトランスポザーゼに結合する。
【0424】
II.標的化されたトランスポソームを含むキット又は組成物
様々なキット又は組成物は、標的化されたトランスポソーム複合体を含み得る。
【0425】
いくつかの実施形態では、キット又は組成物は、標的化されたトランスポソーム複合体である第1のトランスポソーム複合体と、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体と、を含む。
【0426】
いくつかの実施形態では、標的化されたトランスポソーム複合体である第1のトランスポソーム複合体は、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む。いくつかの実施形態では、キット又は組成物は、それぞれが標的化されたトランスポソーム複合体である2つのトランスポソーム複合体を含み、2つの標的化されたトランスポソーム複合体は、異なる標的化オリゴヌクレオチドを含む。
【0427】
いくつかの実施形態では、キット又は組成物は、それぞれが標的化されたトランスポソーム複合体である2つのトランスポソーム複合体を含み、2つの標的化されたトランスポソーム複合体は、異なるガイドRNAを含む。
【0428】
いくつかの実施形態では、キット又は組成物は、それぞれが標的化されたトランスポソーム複合体である2つのトランスポソーム複合体を含み、2つの標的化されたトランスポソーム複合体は、異なるジンクフィンガーDNA結合ドメインを含む。
【0429】
III.標的化転位のための標的化されたトランスポソーム複合体を使用する方法
標的化されたトランスポソーム複合体を使用する方法は、標的化されたトランスポソーム複合体が標的核酸に結合している場所に近接した標的核酸の領域内の転位を媒介することができる。言い換えれば、標的化されたトランスポソーム複合体は、核酸の配列特異的標的化転位を媒介することができる。配列特異的転位は、標的核酸を断片化し、標的核酸の特異的部分を含むタグ付き断片を生成するために使用することができる。標的化されたトランスポソーム複合体を使用する代表的な方法が
図14A~14Cに示され、ここでは、標的化されたトランスポソーム複合体は、dCas9などの非切断エンドヌクレアーゼ変異体を含む。
【0430】
一般的に、トランスポソーム複合体は、ランダムに結合する二本鎖核酸によって転位を媒介する。しかし、いくつかの使用のために、当業者は、標的核酸の所望の部分を含む断片を含むライブラリーを調製することを好む場合がある。この所望の部分は、
図14Aに示される濃縮標的領域と呼ぶことができる。
【0431】
標的核酸の特定の部分を含む断片を含むライブラリーの確率を増加させる方法を介して生成されたライブラリーは、「標的化ライブラリー」と呼ばれ得る。標的化されたトランスポソーム複合体を使用する本方法を使用して、標的化ライブラリーを生成することができる。本明細書で使用されるとき、「非標的化ライブラリー」は、標的核酸のランダム断片を含むライブラリー(例えば、標準的なタグメンテーション法などによってランダム断片を用いて生成されたライブラリー)を指す。
【0432】
いくつかの実施形態では、標的化されたトランスポソームを使用する場合、標的核酸中の所望の部位周辺での転位の頻度がより高い。いくつかの実施形態では、本方法を介して生成された標的化ライブラリーはまた、標的核酸の他の部分を含む断片を含み得る。換言すれば、標的化ライブラリーはまた、標的核酸の他の部分を含む断片を含み得る。
【0433】
いくつかの実施形態では、本方法を介して生成される断片のライブラリーに含まれるタグ付き断片の10%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99%、又は100%は、標的核酸の所望の部分の断片を含む。
【0434】
いくつかの実施形態では、標的化されたトランスポソーム複合体を使用する本方法によって生成された断片のライブラリーは、標的化されたトランスポソーム複合体によって生成されなかったライブラリー又は他の濃縮方法(すなわち、非標的化又は非濃縮ライブラリ)と比較して、2倍、5倍、10倍、20倍、50倍、100倍、又は1000倍多い、標的核酸の所望の部分を含むタグ付き断片を含む。いくつかの実施形態では、非標的化又は非濃縮ライブラリーは、標的核酸にランダムに結合して断片化するトランスポソーム複合体を使用する方法によって生成されていてもよい。
【0435】
いくつかの実施形態では、本方法を介して生成された断片のライブラリーは、標的核酸の所望の部分を含むタグ付き断片が、2倍、5倍、10倍、20倍、50倍、100倍、又は1000倍濃縮されている。言い換えれば、標的化されたトランスポソーム複合体を使用する本方法を介して生成された断片のライブラリーは、標的核酸の所望の部分を含むタグ付き断片が、非標的化又は非濃縮ライブラリーにおけるこれらの断片の頻度と比較して、より高い頻度を有し得る。
【0436】
標的化ライブラリーは、多くの重要な利点を有する。標的化ライブラリーは、標的核酸中の目的の領域に焦点を当て、下流のシークエンシングなどの用途において、より小さく、より管理可能なデータセットを生成する。標的化ライブラリーを使用する方法はまた、非標的化ライブラリーを使用する方法と比較して、シークエンシング費用及びデータ分析の負担を低減し、並びに所要時間を短縮することができる。
【0437】
標的核酸の選択された領域を含むライブラリー(「標的化ライブラリー」)は、ある範囲の用途において重要であり得る。一般的に、目的の特定の遺伝子の標的化分析の方法(すなわち、カスタム内容)は、遺伝子内を標的とし、又はミトコンドリアDNAもまた、標的化ライブラリーを生成するための本方法に適し得る。標的化ライブラリーは、プラットフォーム出力が制限される場合、又は非常に高いカバレッジが必要とされる場合に所望され得る。例えば、標的化ライブラリーは、希少なバリアント同定のための高いカバレッジレベルでのディープシークエンシングを可能にすることができる。
【0438】
いくつかの実施形態では、標的化されたトランスポソーム複合体を使用する方法は、標的化されていないトランスポソーム複合体と比較して、標的核酸の量に関してより低い濃度のトランスポソーム複合体の使用を可能にする。いくつかの実施形態では、標的化されたトランスポソーム複合体は、標的DNAとほぼ等しい化学量論で使用される。
【0439】
言い換えれば、モル過剰の標的化されたトランスポソーム複合体は、標的核酸由来の目的の領域を含む十分な断片を有するライブラリーを生成するために必要とされない場合がある。比較すると、非標的化ライブラリー(すなわち、トランスポソーム複合体を1つ以上の目的の核酸配列に標的化しないライブラリー生成方法)において十分な断片を得るためには、非標的化ライブラリーを用いて生成される断片がランダムに生成されるため、より多くのトランスポソーム複合体が必要とされ得る。したがって、標的化されたトランスポソームを用いると、ライブラリー中のより多くの断片が目的の配列を含有することができ、これにより、より少量の標的化されたトランスポソーム複合体及びより少量の標的核酸の使用が可能になる。
【0440】
本明細書に記載される標的化されたトランスポソーム複合体は、標的化されていないトランスポソーム複合体と共に使用されてもよい。いくつかの実施形態では、タグ付き核酸断片のライブラリーを生成する方法は、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体とを組み合わせる、ことと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む。
【0441】
方法はまた、2つの標的化されたトランスポソーム複合体を使用してもよい。
【0442】
いくつかの実施形態では、タグ付き核酸断片のライブラリーを生成する方法は、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体である第1のトランスポソーム複合体と、標的化されたトランスポソーム複合体である第2のトランスポソーム複合体とを組み合わせる、ことと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、ことと、を含む。
【0443】
方法において使用される標的化されたトランスポソームは、触媒的に不活性なエンドヌクレアーゼを含むもの、又はジンクフィンガーDNA結合ドメインを含むものなどの、本明細書に記載されるもののいずれかであり得る。
【0444】
本明細書に記載される方法は、断片化の前に、標的化されたトランスポソーム複合体と標的核酸との組み合わせを促進するように設計することができる。いくつかの実施形態では、トランスポザーゼの断片化活性を促進する薬剤は、組み合わせ工程中に存在しないか、又は低レベルである。いくつかの実施形態では、二価カチオンは、組み合わせ中に存在しない。いくつかの実施形態では、Ca2+及び/又はMn2+は、組み合わせ中に存在する。いくつかの実施形態では、Ca2+及び/又はMn2+は、組み合わせ中に存在するが、Mg2+は存在しない。
【0445】
いくつかの実施形態は、方法は、組み合わせた後かつ断片化前に、試料に1つ以上の二価カチオンを添加することを更に含む。いくつかの実施形態では、二価カチオンは、Mg2+である。
【0446】
いくつかの実施形態では、方法は、組み合わせた後かつ断片化前に、エキソヌクレアーゼで試料を処理することを更に含む。エキソヌクレアーゼは、一本鎖DNAの分解を促進し得る。いくつかの実施形態では、方法は、試料をエキソヌクレアーゼで処理した後かつ断片化前に、Mg2+を添加することを更に含む。
【0447】
いくつかの実施形態では、方法は、プロテイナーゼK及び/又はSDSを用いてタグ付き断片を遊離させることを含む。
【0448】
本発明の方法は、生成された断片の両方の末端をアダプタでタグ付けするために使用され得る。これは、第1のトランスポソーム複合体及び第2のトランスポソーム複合体を用いる方法を使用することによって達成することができる。いくつかの実施形態では、方法は、断片化によって生成される断片の各末端に異なるタグを組み込む。いくつかの実施形態では、第1のトランスポソーム複合体及び第2のトランスポソーム複合体に含まれる5’アダプタ配列は異なる。
【0449】
A.リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体を使用する方法
いくつかの実施形態では、方法は、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体を使用する。例示的な実施形態は、
図9に示される。
【0450】
いくつかの実施形態では、標的核酸の5’タグ付き断片の標的化された生成の方法は、二本鎖核酸を含む試料と、標的化されたトランスポソーム複合体であるトランスポソーム複合体とを組み合わせることを含む。いくつかの実施形態では、標的化されたトランスポソーム複合体は、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む。いくつかの実施形態では、核酸のストランド侵入は、リコンビナーゼによって開始される。いくつかの実施形態では、ストランド侵入後、核酸は、第1のトランスポゾンの3’末端を断片の5’末端に連結して複数の5’タグ付き断片を生成することにより、トランスポザーゼによって複数の断片に断片化される。
【0451】
いくつかの実施形態では、タグ付き核酸断片のライブラリーを生成する方法は、二本鎖核酸を含む試料と、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体である第1のトランスポソーム複合体と、第2のトランスポソーム複合体であって、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体と、を組み合わせることと、リコンビナーゼによって核酸のストランド侵入を開始させることと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、断片化することと、を含む、方法。
【0452】
いくつかの実施形態では、タグ付き核酸断片のライブラリーを生成する方法は、二本鎖核酸を含む試料と、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体である第1のトランスポソーム複合体と、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体である第2のトランスポソーム複合体とを組み合わせることと、リコンビナーゼによって核酸のストランド侵入を開始させることと、トランスポザーゼによって核酸を複数の断片に断片化することであって、各第1のトランスポゾンの3’末端を標的断片の5’末端に連結して、第1のトランスポソーム複合体から生成された複数の第1の5’タグ付き標的断片及び第2のトランスポソーム複合体から生成された複数の第2の5’タグ付き標的断片を産生することによる、断片化することと、を含む、方法。
【0453】
いくつかの実施形態では、第1のトランスポソーム複合体及び第2のトランスポソーム複合体に含まれる5’アダプタ配列は異なる。
【0454】
いくつかの実施形態では、第1のトランスポソーム複合体及び第2のトランスポソーム複合体に含まれる標的化オリゴヌクレオチドは異なる。いくつかの実施形態では、第1のトランスポソーム複合体及び第2のトランスポソーム複合体の標的化オリゴヌクレオチドは、標的核酸中の所与の目的の領域内の異なる目的の配列に結合する。このようにして、第1のトランスポソーム複合体及び第2のトランスポソーム複合体は、所望の目的の配列を含む断片を生成することができる。当業者は、この目的の配列を含む断片を生成するために、目的の配列の末端で、末端付近で、又は末端を越えて結合する標的化オリゴヌクレオチドを設計し得る。このようにして、目的の配列を含む断片の頻度が増加した標的化ライブラリーを生成することができる。
【0455】
いくつかの実施形態では、第2のトランスポソーム複合体は、第1のトランスポソーム複合体と比較して、二本鎖核酸の逆ストランドに結合する。
【0456】
いくつかの実施形態では、リコンビナーゼによる核酸のストランド侵入の開始は、リコンビナーゼローディング因子の存在下で行われる。いくつかの実施形態では、リコンビナーゼローディング因子は、断片化の前に除去又は不活性化される。
【0457】
いくつかの実施形態では、ストランド侵入の開始は、置換ループ形成を介して生じる。
【0458】
いくつかの実施形態では、ストランド侵入は、1つ以上の目的の配列への標的化オリゴヌクレオチドの結合部位から40、30、20、15、10、又は5塩基以内で開始される。言い換えれば、ストランド侵入は、標的化オリゴヌクレオチドの結合部位のすぐ近くで起こり得る。
【0459】
いくつかの実施形態では、方法は、方法中の温度変化に基づいて異なる工程を介して進行する。いくつかの実施形態では、ストランド侵入を開始するために使用される温度は、トランスポザーゼによる断片化のための最適温度とは異なる。いくつかの実施形態では、ストランド侵入を開始するために使用される温度は、トランスポザーゼによる断片化のための最適温度未満である。いくつかの実施形態では、より低い温度でストランド侵入を開始することは、温度の上昇によって断片化が開始される前に、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドに基づくトランスポソーム複合体の適切なターゲティングを促進する。これらの温度変化は、断片化前に、標的核酸中の目的の配列への標的化されたトランスポソーム複合体の結合を促進するのに役立ち得る。
【0460】
いくつかの実施形態では、ストランド侵入の開始は、27℃~47℃で行われる。いくつかの実施形態では、ストランド侵入の開始は、32℃~42℃で行われる。いくつかの実施形態では、ストランド侵入の開始は、37℃で行われる。
【0461】
いくつかの実施形態では、断片化は、45℃~65℃で行われる。いくつかの実施形態では、断片化は、50℃~60℃で行われる。いくつかの実施形態では、断片化は、55℃で行われる。
【0462】
いくつかの実施形態では、ストランド侵入の開始は、反応溶液がトランスポザーゼ活性のための成分を欠く間に行われる。例えば、いくつかの実施形態では、トランスポザーゼの補因子は、侵入開始後かつ断片化前にトランスポソーム複合体に添加される。いくつかの実施形態では、補因子は、Mg++である。いくつかの実施形態では、Mg++濃度は、10mM~18mMである。
【0463】
リコンビナーゼにおいてコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体を使用する方法は、標的化オリゴヌクレオチドが標的核酸に結合した場所に近接して起こる断片化の確率を増加させることができる。いくつかの実施形態では、断片化は、標的化オリゴヌクレオチドによって結合される核酸配列中の1つ以上の目的の配列から40、30、20、15、10、又は5塩基内で生じる。
【0464】
B.一本鎖核酸への標的化オリゴヌクレオチドのハイブリダイゼーションを使用する方法
トランスポザーゼは、二本鎖核酸の転位及び断片化を媒介することができる。したがって、標的化オリゴヌクレオチドの一本鎖核酸(例えば、一本鎖DNA)への結合を介する二本鎖核酸領域の選択的生成は、タグ付き断片を生成するための方法において使用され得る。標的化オリゴヌクレオチドを使用する例示的な方法は、
図10に示される。
【0465】
核酸の5’タグ付き断片の標的化生成の方法は、一本鎖核酸を含む試料に1つ以上の標的化オリゴヌクレオチドをハイブリダイズさせることを含み得る。いくつかの実施形態では、二本鎖標的核酸を変性させて、一本鎖核酸を生成してもよい。いくつかの実施形態では、二本鎖DNAを編成させて、一本鎖DNAを生成する。いくつかの実施形態では、変性は、温度の上昇を介して行われる。いくつかの実施形態では、二本鎖核酸は、温度を核酸の融解温度(Tm)を超えて上昇させることによって変性される。いくつかの実施形態では、二本鎖DNAを含む試料を70℃を超える温度に加熱して、二本鎖DNAの一本鎖DNAへの変性を促進する。いくつかの実施形態は、二本鎖核酸を尿素及び/又はpH変化で処理して、一本鎖DNAを生成する。
【0466】
いくつかの実施形態では、一本鎖核酸を含む試料への1つ以上の標的化オリゴヌクレオチドのハイブリダイゼーションは、一本鎖核酸を含む試料の温度を低下させて、一本鎖核酸への1つ以上の標的化オリゴヌクレオチドの結合を可能にすることによって行われる。
【0467】
いくつかの実施形態では、1つ以上の標的化オリゴヌクレオチドはそれぞれ、核酸中の目的の配列に結合することができる。いくつかの実施形態では、標的化オリゴヌクレオチドは、核酸中の目的の配列に完全に又は部分的に相補的である。
【0468】
いくつかの実施形態では、1つ以上の標的化オリゴヌクレオチドの一本鎖核酸へのハイブリダイゼーションにより、二本鎖核酸の領域が生成される。トランスポザーゼは一本鎖核酸の領域に結合しないが、トランスポザーゼは、標的化オリゴヌクレオチドが一本鎖核酸にハイブリダイズすることによって生じる二本鎖領域に結合することができる。いくつかの実施形態では、標的化オリゴヌクレオチドを一本鎖核酸を含む試料にハイブリダイズさせることにより、断片化され得る二本鎖核酸の領域が生成される。
【0469】
いくつかの実施形態では、方法は、1つ以上の標的化オリゴヌクレオチドを試料にハイブリダイズさせた後に、トランスポソーム複合体を適用することを含む。いくつかの実施形態では、トランスポソーム複合体は、トランスポザーゼと、第1のトランスポゾンであって、3’トランスポゾン末端配列と、5’アダプタ配列と、を含む、第1のトランスポゾンと、第2のトランスポゾンであって、5’トランスポゾン末端配列を含み、5’トランスポゾン末端配列が3’トランスポゾン末端配列に相補的である、第2のトランスポゾンと、を含む、第2のトランスポソーム複合体と、を含む。いくつかの実施形態では、方法は、次いで、第1のトランスポゾンの3’末端を断片の5’末端に連結して複数の5’タグ付き断片を生成することにより、トランスポザーゼによって核酸を複数の断片に断片化することを含む。
【0470】
いくつかの実施形態では、異なる配列を有する2つ以上の標的化オリゴヌクレオチドがハイブリダイズされる。いくつかの実施形態では、2つ以上の標的化オリゴヌクレオチドを用いる方法は、標的核酸中の2つ以上の部位での断片化を媒介し得る。例えば、2つ以上の標的化オリゴヌクレオチドは、断片化により目的の領域を含む断片が生成されるように、標的核酸中の目的の領域の末端で結合し得る。言い換えれば、2つ以上の標的化オリゴヌクレオチドを用いる方法は、標的化ライブラリーを生成し得る。
【0471】
いくつかの実施形態では、単一の標的化オリゴヌクレオチドの複数のコピーがハイブリダイズされる。
【0472】
いくつかの実施形態では、1つのタイプの標的化オリゴヌクレオチドのみがハイブリダイズされる。このようにして、標的核酸は、特定の領域内で断片化される。いくつかの実施形態では、単一の標的化オリゴヌクレオチドは、単一の標的化オリゴヌクレオチドを一本鎖核酸を含む試料にハイブリダイズさせることによって生成される二本鎖核酸への2つのトランスポソーム複合体の結合を可能にするのに十分な長さである。いくつかの実施形態では、単一の標的化オリゴヌクレオチドは、80、90、100、110、120、130、140、150、160、170、180、190、又は200塩基対を含む。
【0473】
いくつかの実施形態では、断片化は、1つ以上の標的化オリゴヌクレオチドによって結合される核酸配列中の1つ以上の目的の配列内で生じる。
【0474】
C.ShCASTを使用する方法
いくつかの実施態様では、
図16A及び16Bに要約されるように、ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮が使用され得る。
【0475】
ライブラリー調製後に別個の濃縮工程を使用する特定の遺伝子の標的化シークエンシングは、時間がかかる場合がある。例えば、このような別個の濃縮工程は、オリゴヌクレオチドプローブをライブラリーDNAにハイブリダイズさせることと、ストレプトアビジンでコーティングされたビーズ上でハイブリダイズしたDNAを単離することと、を包含し得る。効率及び必要な時間が著しく改善されているものの、そのような別個の濃縮プロトコルは、約2時間と多くの試薬を要する場合があり、そのようなプロトコルの自動化を困難にし得る。
【0476】
比較すると、本明細書に記載されるShCASTを使用する方法を使用して、調製及び濃縮の両方について単一工程を使用する、特定の遺伝子の標的化シークエンシングのためのライブラリーの調製及び濃縮ができる。
【0477】
いくつかの実施形態では、第1及び/又は第2の標的化されたトランスポソーム複合体は、ShCASTを含む標的化されたトランスポソーム複合体を含む。
【0478】
いくつかの実施形態では、gRNA及びトランスポザーゼのうちの少なくとも1つはビオチン化されており、組成物は、ビオチン化されているgRNA及びトランスポザーゼのうちの少なくとも1つがカップリングしているストレプトアビジンでコーティングされたビーズを更に含む。このようにして、ShCASTを含む標的化されたトランスポソーム複合体を使用して生成されたタグ付き断片を、ストレプトアビジンでコーティングされたビーズ上に固定化することができる。
【0479】
いくつかの実施形態では、方法のいくつか又は全ての工程は、ShCASTに含まれるトランスポザーゼによる核酸の非特異的結合を制限又は阻害する反応流体中で行われる。いくつかの実施形態では、ShCASTに含まれるトランスポザーゼの非特異的結合を制限又は阻害することにより、ShCASTに含まれるトランスポザーゼによって媒介されるオフターゲット転位反応が減少する。そのようなオフターゲット転位は、ShCASTに含まれるトランスポザーゼが核酸自体にランダムに結合する場合に起こり得、代わりに、ShCASTは、目的の配列に結合したgRNAによって目的の配列に標的化される。オフターゲット切断が低減される場合、ほとんどの断片は、標的化されたトランスポソーム複合体によって媒介される切断から生成される。このようにして、ほとんどのタグ付き断片は、1つ以上の目的の遺伝子座(1つ以上のgRNAに結合できる1つ以上の目的の配列を含む)から調製される。更に、タグ付き断片が2つの標的化されたトランスポソーム複合体から調製される場合、シークエンシング及び/又は増幅することができるサイズである可能性が高い。対照的に、断片を調製するために使用される一方又は両方のトランスポソーム複合体が適切に標的化されていない場合(例えば、ShCASTに含まれるトランスポザーゼが、gRNAによる標的化なしに核酸に直接結合する場合)、断片は、増幅及び/又はシークエンシングするには大きすぎる可能性がある。
【0480】
いくつかの実施形態では、方法は、トランスポザーゼによる複合体の直接的結合を制限するための条件を有する流体中で行われる。いくつかの実施形態では、トランスポザーゼによる複合体の直接的結合を制限するための条件は、15mM以下のマグネシウム濃度、並びに/又は、50nM以下のCas12K及び/若しくはトランスポザーゼの濃度である。
【0481】
いくつかの実施形態では、方法の異なる工程は、異なる条件下で行われる。いくつかの実施形態では、複合体の結合は、トランスポザーゼの二本鎖核酸への結合を阻害する条件下で行われる。このようにして、トランスポザーゼによる直接的なShCASTの核酸への非標的化結合が制限され、大部分のShCASTは、核酸中の1つ以上の目的の配列を標的とするgRNAとのCas12Kの会合に基づいて核酸に結合される。
【0482】
いくつかの実施形態では、結合後、ShCASTに含まれるトランスポザーゼによる切断を促進するように条件を変更してもよい。いくつかの実施形態では、方法は、複合体に含まれるトランスポザーゼによる二本鎖核酸の結合を阻害する条件下で、複合体を二本鎖核酸に結合させることと、結合後に、複合体による二本鎖核酸の切断を促進することと、を含む。
【0483】
いくつかの実施形態では、トランスポザーゼは、結合中に存在しないか又は低濃度で存在し、切断を促進することは、トランスポザーゼを添加することを含む。
【0484】
いくつかの実施形態では、活性化可能なトランスポザーゼは、ShCAST中に含まれる。本明細書で使用されるとき、「活性化可能なトランスポザーゼ」は、可逆的に不活性化され、後に活性化され得るものである。例えば、可逆的に不活性化されたトランスポザーゼは、核酸の適切な切断のための要素を欠いていてもよく、この要素は、方法において後の工程中に添加されてもよい。
【0485】
いくつかの実施形態では、トランスポザーゼは結合中に可逆的に不活性化され、切断を促進することは、トランスポザーゼの活性化を含む。
【0486】
いくつかの実施形態では、トランスポザーゼは、1つ以上のトランスポゾンの欠如により可逆的に不活性化され、トランスポザーゼを活性化することは、1つ以上のトランスポゾンを提供することを含む。
【0487】
いくつかの実施形態では、トランスポザーゼは、二本鎖核酸中の位置に増幅アダプタを付加する。本明細書で使用されるとき、「増幅アダプタ」は、増幅に有用な任意の配列(例えば、増幅プライマーの結合部位)である。このようにして、生成されたタグ付き断片は、追加の増幅アダプタを組み込む必要なく増幅することができる。いくつかの実施形態では、増幅アダプタは、タグ付き断片を調製した後に断片に付加され得る(増幅アダプタのライゲーションなどにより)。
【0488】
D.結合パートナーの対形成を含む方法
第1の対になった結合パートナーが触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインに結合され、第2の結合パートナーがトランスポザーゼに結合されるとき、高分解能シークエンシングライブラリーが生成され得る。
【0489】
結合パートナーの対形成を含む方法は、CUT&Tag法に類似していてもよい(Kaya-Okur et al.,Nature Communications 10:1930(2019)参照)。このような方法において、第1の結合パートナーを含む触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインは、標的核酸に結合される。いくつかの実施形態では、この結合後に反応物を洗浄する。次いで、第2の結合パートナーを含むトランスポザーゼを添加する。トランスポザーゼは、第1の結合パートナーに対する第2の結合パートナーの親和性に基づいて、触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインに局在化する。これらの方法は、触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインによって既に結合されている部位へのトランスポザーゼの結合を可能にする。
【0490】
いくつかの実施形態では、方法は、触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインの結合を制限する条件下で行われる。これらの条件は、オフターゲットトランスポザーゼ結合を制限することができる。いくつかの実施形態では、低濃度のマグネシウム又は低濃度の触媒的に不活性なエンドヌクレアーゼ若しくはジンクフィンガーDNA結合が、オフターゲットトランスポザーゼ結合を低減するために使用される。いくつかの実施形態では、オフターゲット結合から増幅可能なPCR産物を生成する可能性が低減される。いくつかの実施形態では、限定されたオフターゲットトランスポザーゼ結合は、ランダムな(すなわち、非標的化)トランスポザーゼ結合が低頻度で起こり、一般に、増幅及び/又はシークエンシングするには大きすぎる断片をもたらすことを意味する。対照的に、標的化されたトランスポソーム複合体の使用は、増幅及び/又はシークエンシングに適切なサイズの断片を調製するように設計することができる。
【0491】
本明細書で使用されるとき、第1の結合パートナー及び第2の結合パートナーは、「タグ」と称され得る。いくつかの実施形態では、第1のタグは、第1のCas-gRNAリボ核タンパク質(RNP、Cas及びそのgRNAを含む)にカップリングされ、第2のタグは、第2のCas-gRNA RNPにカップリングされる。いくつかの例では、方法は、第1のタグを基材にカップリングされた第1のタグパートナーにカップリングすることと、第2のタグを基材にカップリングされた第2のタグパートナーにカップリングすることとを含む。いくつかの例では、カップリングは、第1及び第2のCas-gRNA RNPがそれぞれ第1及び第2の部分配列にハイブリダイズされた後に行われる。いくつかの例では、第1及び第2のタグがそれぞれ第1及び第2のタグパートナーに付加された後に、第1及び増幅アダプタが付加される。
【0492】
いくつかの例では、第1及び第2のタグは、ビオチンを含む。いくつかの例では、第1及び第2のタグパートナーは、ストレプトアビジンを含む。いくつかの例では、基材は、ビーズを含む。いくつかの例では、Cas-gRNA RNPは、Cas12kを含む。いくつかの例では、トランスポザーゼは、Tn5又はTn7様トランスポザーゼを含む。
【0493】
いくつかの実施形態では、二本鎖核酸を含む試料と標的化された1つ以上のトランスポソーム複合体と組み合わせることは、試料をジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼと組み合わせることであって、ジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼが第1の結合パートナーに結合している、ことと、トランスポザーゼ並びに第1及び第2のトランスポゾンを添加することであって、トランスポザーゼが第2の結合パートナーに結合しており、トランスポザーゼが第1及び第2の結合パートナーの対形成によってジンクフィンガーDNA結合ドメイン又は触媒的に不活性なエンドヌクレアーゼに結合することができる、ことと、を含む。
【0494】
いくつかの実施形態では、方法は、組み合わせた後かつ添加前に洗浄することを含む。いくつかの実施形態では、無細胞DNAは、ジンクフィンガーDNA結合ドメインと組み合わせる前にプロテアーゼで処理されない。
【0495】
E.2つの標的化されたトランスポソーム複合体で標的化断片を生成する方法
いくつかの実施形態では、ポリヌクレオチド(例えば、標的核酸)は、任意の適切な対の位置で切断されて、断片を形成し得る。本明細書に開示される方法を使用して断片を形成した後、任意の適切な増幅プライマーを、得られた断片の末端にカップリングできる。次いで、断片を増幅し、シークエンシングすることができる。
【0496】
両方が標的化されている第1及び第2のトランスポソーム複合体を用いる方法において、複合体は、特定の所望の断片を産生するように設計され得る。いくつかの実施形態では、両方が標的化されている第1及び第2のトランスポソーム複合体を用いる方法は、標的化された又は濃縮されたライブラリーを生成することができる。これらの標的化された又は濃縮されたライブラリーは、濃縮標的領域を含むライブラリー断片をより高い割合で含み得る。この濃縮標的領域は、例えば、シークエンシングに対する目的の遺伝子であり得る。
【0497】
いくつかの実施形態では、標的化された第1のトランスポソーム複合体及び標的化された第2のトランスポゾン複合体は、二本鎖核酸の逆ストランドに結合し、第1のトランスポソーム複合体は第1のトランスポソーム複合体結合部位に結合し、第2のトランスポソーム複合体は第2のトランスポソーム複合体結合部位に結合する。いくつかの実施形態では、第1の5’タグ付き標的断片及び第2の5’タグ付き標的断片は、第1のトランスポソーム複合体結合部位と第2のトランスポソーム複合体結合部位との間の二本鎖核酸の領域に含まれる核酸配列を含む。いくつかの実施形態では、第1の5’タグ付き標的断片及び第2の5’タグ付き断片は、少なくとも部分的に相補的である。
【0498】
いくつかの実施形態では、標的化されたトランスポソーム複合体である第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である第2のトランスポソーム複合体に含まれる触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインは、異なっている。触媒的に不活性なエンドヌクレアーゼを含む2つの標的化されたトランスポソーム複合体を使用する代表的な方法を
図11に示す。
【0499】
いくつかの実施形態では、標的化されたトランスポソーム複合体である第1のトランスポソーム複合体及び標的化されたトランスポソーム複合体である第2のトランスポソーム複合体の触媒的に不活性なエンドヌクレアーゼ又はジンクフィンガーDNA結合ドメインは、標的核酸中の所与の目的の領域内の異なる目的の配列に結合する。
【0500】
F.試料及び標的核酸
いくつかの実施形態では、試料は、標的核酸を含む。いくつかの実施形態では、試料は、DNAを含む。いくつかの実施形態では、DNAは、ゲノムDNAである。いくつかの実施形態では、標的核酸は、二本鎖DNAである。
【0501】
いくつかの実施形態では、標的核酸は、一本鎖DNAである。一本鎖DNAはトランスポザーゼによって断片化することができないが、本明細書に記載の方法は、標的化オリゴヌクレオチドを一本鎖DNAにハイブリダイズさせることなどによって二本鎖DNAの領域を生成する手段を記載する。
【0502】
生体試料は、核酸を含む任意のタイプであり得る。例えば、試料は、精製核酸を含む様々な精製状態の核酸を含むことができる。しかしながら、試料は完全に精製される必要はなく、例えば、タンパク質と混合された核酸、他の核酸種、他の細胞成分、及び/又は任意の他の夾雑物を含むことができる。いくつかの実施形態では、生体試料は、核酸、タンパク質、他の核酸種、他の細胞成分、及び/又はインビボで見られるものとほぼ同じ割合で存在する任意の他の夾雑物の混合物を含む。例えば、いくつかの実施形態では、成分は、無傷細胞に見られるものと同じ割合で見出される。いくつかの実施形態では、生体試料は、2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60以下の、260/280吸光度比を有する。いくつかの実施形態では、生体試料は、少なくとも2.0、1.9、1.8、1.7、1.6、1.5、1.4、1.3、1.2、1.1、1.0、0.9、0.8、0.7、又は0.60の、260/280吸光度比を有する。本明細書で提供される方法により、核酸を固形支持体に結合させることができるため、他の夾雑物は、表面結合タグメンテーションが生じた後に固形支持体を洗浄するだけで除去することができる。生体試料は、例えば、粗細胞溶解物又は全細胞を含み得る。例えば、本明細書に記載の方法において固体支持体に適用される粗細胞溶解物は、他の細胞成分から核酸を単離するために従来から使用している分離工程のうちの1つ以上が行われる必要はない。例示的な分離工程は、Maniatis et al.,Molecular Cloning:A Laboratory Manual,2d Edition,1989、及びShort Protocols in Molecular Biology,ed.Ausubel,et alに記載され、参照により本明細書に組み込まれる。
【0503】
いくつかの実施形態では、固体支持体に適用される試料は、1.7以下の260/280吸光度比を有する。
【0504】
したがって、いくつかの実施形態では、生体試料は、例えば、血液、血漿、血清、リンパ液、粘液、痰、尿、精液、脳脊髄液、気管支吸引液、糞便、及びそれらの浸軟組織、若しくはそれらの溶解物、又は核酸を含む任意の他の生体標本を含み得る。
【0505】
いくつかの実施形態では、試料は、血液である。いくつかの実施形態では、試料は、細胞溶解物である。いくつかの実施形態では、細胞溶解物は、粗細胞溶解物である。いくつかの実施形態では、方法は、試料を固体支持体に適用した後に試料中の細胞を溶解して、細胞溶解物を生成する工程を更に含む。
【0506】
いくつかの実施形態では、試料は、生検試料である。いくつかの実施形態では、生検試料は、液体又は固体試料である。いくつかの実施形態では、がん患者由来の生検試料を使用して、対象が予測遺伝子中に特定の突然変異又はバリアントを有するかどうかを決定するために、目的の配列を評価する。
【0507】
本明細書に提示される方法及び組成物の1つの利点は、フローセルに生体試料を添加することができ、その後の溶解工程及び精製工程は、フローセルに必要な試薬を流すだけで、更なる移動又は取り扱い工程なしにフローセル内で全て生じ得ることである。
【0508】
いくつかの実施形態では、保護エレメントは、ポリヌクレオチド(標的核酸又はタグメンテーションによって生成された二本鎖断片など)に組み込まれ得る。例えば、保護エレメントは、本明細書中に記載される方法のいずれかにおいて、タグメンテーション前に標的核酸に、又はタグメンテーション後に二本鎖核酸断片に付加され得る。本明細書で使用されるとき、用語「保護エレメント」は、ポリヌクレオチドの5’末端又は3’末端に関して使用される場合、ポリヌクレオチドの末端の改変を阻害するエレメントを意味することが意図される。例示的に、保護エレメントは、5’又は3’エキソヌクレアーゼの作用など、ポリヌクレオチドの末端における1つ以上の酵素の作用を阻害し得る。保護エレメントの非限定的な例としては、二本鎖ポリヌクレオチドの末端の5’鎖及び3’鎖にライゲーションされたヘアピン配列、修飾塩基(例えば、ホスホロチオエート結合又は3’リン酸を含む)、又は脱リン酸化塩基が挙げられる。
【0509】
G.ギャップ充填ライゲーション
いくつかの実施形態では、転位事象後に残ったDNA配列中のギャップはまた、Bst DNAポリメラーゼ及びdNTP混合物を含むものなど、鎖置換伸長反応を使用して充填され得る。いくつかの実施形態では、ギャップ充填ライゲーションは、伸長-ライゲーションミックス緩衝液を使用して行われる。
【0510】
いくつかの実施形態では、方法は、複数の5’タグ付き標的断片をポリメラーゼ及びリガーゼで処理して、完全二本鎖タグ付き断片を産生するように鎖を伸長かつライゲーションすることを含む。
【0511】
次いで、二本鎖DNA断片のライブラリーを、任意選択的に増幅し(例えば、クラスタ増幅を用いて)、シークエンシングプライマーを用いてシークエンシングできる。
【0512】
H.増幅
本開示は更に、本明細書に提供される方法に従って生成されるタグ付き断片の増幅に関する。いくつかの実施形態では、固定化されたタグ付き断片は、固体支持体上で増幅される。いくつかの実施形態では、固体支持体は、表面に結合されたタグメンテーションが起こるものと同じ固体支持体である。このような実施形態では、本明細書で提供される方法及び組成物は、試料調製物が、最初の試料導入工程から、増幅まで、及び任意選択的にシークエンシング工程まで、同じ固体支持体上で進行することを可能にする。
【0513】
例えば、いくつかの実施形態では、固定化されたタグ付き断片は、米国特許第7,985,565号及び同第7,115,400号の開示によって例示されるように、クラスタ増幅方法論を使用して増幅され、これらの各々の内容は、参照によりその全体が本明細書に組み込まれる。米国特許第7,985,565号及び同第7,115,400号の組み込まれている材料は、固定化された核酸分子のクラスタ又は「コロニー」からなるアレイを形成するために、増幅産物を固体支持体上に固定化することを可能にする固相核酸増幅の方法を記載する。そのようなアレイ上の各クラスタ又はコロニーは、複数の同一の固定化されたポリヌクレオチド鎖及び複数の同一の固定化された相補的ポリヌクレオチド鎖から形成される。そのように形成されたアレイは、本明細書では一般に「クラスタ化アレイ」と称される。米国特許第7,985,565号及び同第7,115,400号に記載されているような固相増幅反応の生成物は、固定化されたポリポリヌクレオチド鎖と固定化された相補鎖の対をアニーリングすることによって形成されるいわゆる「ブリッジ(bridged)」構造体であり、両方の鎖は、いくつかの実施形態では共有結合を介して、5’末端で固体支持体上に固定化されている。クラスタ増幅法は、固定化された核酸鋳型を使用して固定化されたアンプリコンを生成する方法の例である。他の適切な方法を使用して、本明細書で提供される方法に従って生成された固定化されたDNA断片から固定化されたアンプリコンを生成することもできる。例えば、1つ以上のクラスタ又はコロニーは、増幅プライマーの各対の一方又は両方のプライマーが固定化されているかどうかに関わらず、固相PCRによって形成することができる。
【0514】
他の実施形態では、タグ付き断片は、溶液中で増幅される。例えば、いくつかの実施形態では、タグ付き断片は、切断されるか、又は別の方法で固体支持体から遊離され、次いで増幅プライマーは、溶液中で遊離分子にハイブリダイズされる。他の実施形態では、増幅プライマーを、1つ以上の初期の増幅工程のためにタグ付き断片にハイブリダイズさせ、その後溶液中の後続の増幅工程を行う。いくつかの実施形態では、固定化された核酸鋳型を使用して、液相アンプリコンを生成することができる。
【0515】
本明細書に記載されているか又は当該技術分野で概ね知られている増幅方法のいずれかを、ユニバーサル又は標的特異的プライマーと共に利用して、タグ付き断片を増幅できることが理解されるであろう。増幅に適切な方法には、参照によりその全体が本明細書に組み込まれる、米国特許第8,003,354号に記載されているように、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写増幅法(TMA)及び核酸配列ベース増幅(NASBA)が含まれるが、これらに限定されない。上記の増幅方法を使用して、関心対象の1つ以上の核酸を増幅することができる。例えば、多重PCR、SDA、TMA、NASBAなどを含むPCRを利用して、固定化DNA断片を増幅してもよい。いくつかの実施形態では、関心対象の核酸に特異的に向けられるプライマーは、増幅反応に含まれる。
【0516】
ポリヌクレオチドの増幅に好適な他の方法としては、オリゴヌクレオチド伸長及びライゲーション、ローリングサークル増幅(RCA)(Lizardi et al.,Nat.Genet.19:225-232(1998)、参照により本明細書に組み込まれる。)、及びオリゴヌクレオチドライゲーションアッセイ(OLA)(一般に米国特許第7,582,420号、同第5,185,243号、同第5,679,524号、及び同第5,573,907号、欧州特許第0320308(B1)号、欧州特許第0336731(B1)号、欧州特許第0439182(B1)号、国際公開第90/01069号、国際公開第89/12696号、及び国際公開第89/09835号、その全てが参照により組み込まれる)技術、を挙げることができる。これらの増幅方法は、固定化DNA断片を増幅するように設計され得ることを理解されたい。例えば、いくつかの実施形態では、増幅方法は、関心対象の核酸に特異的に向けられるプライマーを含むライゲーションプローブ増幅又はオリゴヌクレオチドライゲーションアッセイ(OLA)反応を含み得る。いくつかの実施形態では、増幅法は、関心対象の核酸に特異的に指向されるプライマーを含有するプライマー伸長ライゲーション反応を含んでもよい。関心対象の核酸を増幅するように特別に設計することができるプライマー伸長及びライゲーションプライマーの非限定的な例として、増幅は、各々が参照によりその全体が本明細書に組み込まれる、米国特許第7,582,420号及び同第7,611,869号に例示されるようなGoldenGateアッセイ(Illumina,Inc.,San Diego,CA)に使用されるプライマーを含み得る。
【0517】
本開示の方法で使用され得る例示的な等温増幅法としては、例えばDean et al.,Proc.Natl.Acad.Sci.USA 99:5261-66(2002)により例示される多置換増幅(MDA)、又は例えば米国特許第6,214,587号(これらの各々は、参照によりその全体が本明細書に組み込まれる)により例示される等温鎖置換核酸増幅が挙げられるが、これらに限定されない。本開示で使用され得る他の非PCR系方法としては、例えば、Walker et al.,Molecular Methods for Virus Detection,Academic Press,Inc.,1995、米国特許第5,455,166号、及び同第5,130,238号、並びにWalker et al.,Nucl.Acids Res.20:1691-96(1992)に記載されている鎖置換増幅(SDA)又は例えば、Lage et al.,Genome Research 13:294-307(2003)に記載されている超分枝鎖置換増幅が挙げられ、これらの各々は、参照によりその全体が本明細書に組み込まれる。等温増幅法は、ゲノムDNAのランダムプライマー増幅のために、鎖置換Phi 29ポリメラーゼ又はBst DNAポリメラーゼの大型断片、5’→3’エキソ-と共に使用することができる。
【0518】
これらのポリメラーゼの使用は、それらの高い加工性及び鎖置換活性を利用する。高い加工性により、ポリメラーゼは、10~20kbの長さの断片を生成することが可能になる。上記のように、クレノウポリメラーゼなどの低いプロセッシビティと鎖置換活性を有するポリメラーゼを使用して、等温条件下でより小さな断片を生成することができる。増幅反応、条件、及び成分の更なる説明は、参照によりその全体が本明細書に組み込まれる、米国特許第7,670,810号の開示に詳細に記載されている。
【0519】
本開示において有用な別の核酸増幅法は、例えば、参照によりその全体が本明細書に組み込まれる、Grothues,et al.Nucleic Acids Res.21(5):1321-2(1993)に記載されているように、定常5’領域の後にランダム3’領域が続く2ドメインプライマーの集団を使用するタグ付きPCRである。増幅の第1のラウンドは、ランダムに合成された3’領域からの個々のハイブリダイゼーションに基づいて、熱変性DNA上で多数の開始を可能にするために実施される。3’領域の性質により、開始部位は、ゲノム全体にランダムであると考えられる。その後、結合していないプライマーを除去し、定常5’領域に相補的なプライマーを使用して、更なる複製を行うことができる。
【0520】
I.シークエンシング及び再シークエンシング
初期シークエンシング(及び可能性のある再シークエンシング)は、種々の異なる方法を使用して実施され得る。
【0521】
本開示は更に、本明細書に提供される方法に従って生成されるタグ付き断片のシークエンシングに関する。いくつかの実施形態では、方法は、5’タグ付き断片又は完全二本鎖タグ付き断片のうちの1つ以上をシークエンシングすることを含む。
【0522】
トランスポソームが媒介するタグメンテーションにより産生されたタグ付き断片は、合成によるシークエンシング、ライゲーションによるシークエンシング、ハイブリダイゼーションによるシークエンシング、ナノポアシークエンシングなどを含む直接シークエンシングなどの任意の適切な配列決定法に従ってシークエンシングすることができる。いくつかの実施形態では、タグ付き断片は、固体支持体上でシークエンシングされる。いくつかの実施形態では、シークエンシングのための固体支持体は、表面結合されたタグメンテーションが起こるものと同じ固体支持体である。いくつかの実施形態では、シークエンシングのための固体支持体は、増幅が起こるのと同じ固体支持体である。
【0523】
1つの代表的なシークエンシング法は、合成によるシークエンシング(SBS)である。SBSでは、核酸鋳型(例えば標的核酸又はそのアンプリコン)に沿った核酸プライマーの伸長を監視して、鋳型中のヌクレオチドの配列を決定する。基礎となる化学プロセスは、重合(例えば、ポリメラーゼ酵素によって触媒される)であり得る。特定のポリマーベースのSBSの実施態様では、プライマーに付加されるヌクレオチドの順序及び種類の検出を使用して鋳型の配列を決定することができるように、蛍光標識ヌクレオチドを鋳型依存的にプライマーに付加する(それによってプライマーを伸長させる)。
【0524】
フローセルは、本開示の方法によって生成された、増幅されたDNA断片を収容するための便利な固体支持体を提供する。そのようなフォーマットの1つ以上の増幅されたDNA断片は、サイクル中に試薬を繰り返し送達することを含むSBS又は他の検出技術に供することができる。例えば、第1のSBSサイクルを開始するために、1つ以上の標識されたヌクレオチド、DNAポリメラーゼなどを、1つ以上の増幅された核酸分子を収容するフローセルに流入/通過させることができる。プライマー伸長によって標識ヌクレオチドを組み込む部位は、検出することができる。任意選択的に、ヌクレオチドは、ヌクレオチドがプライマーに付加されると、更なるプライマー伸長を終結する可逆的終結特性を更に含むことができる。例えば、可逆的ターミネーター部分を有するヌクレオチド類似体をプライマーに付加して、デブロッキング作用因子が送達されてその部分を除去するまで、その後の伸長が起こらないようにすることができる。したがって、可逆的終端を使用する実施形態では、デブロッキング試薬をフローセルに送達することができる(検出発生の前又は後)。洗浄は、様々な送達工程の間に実施することができる。次に、サイクルをn回繰り返してプライマーをn個のヌクレオチドで伸長し、それによって長さnの配列を検出することができる。本開示の方法によって生成されるアンプリコンと共に使用するために容易に適合させることができる例示的なSBS手順、流体系及び検出プラットフォームは、例えば、Bentley et al.,Nature 456:53-59(2008)、国際公開第04/018497号、米国特許第7,057,026号、国際公開第91/06678号、同第07/123744号、米国特許第7,329,492号、同第7,211,414号、同第7,315,019号、同第7,405,281号、及び米国特許出願公開第2008/0108082号に記載されており、これらのそれぞれは、参照により本明細書に組み込まれる。
【0525】
パイロシークエンシングなどの、サイクル反応を使用する他の配列決定手順を使用することができる。パイロシークエンシングは、特定のヌクレオチドが新生核酸鎖に取り込まれる際の、無機ピロリン酸(PPi)の放出を検出する(Ronaghi et al.,Analytical Biochemistry 242(1),84-9(1996)、Ronaghi,Genome Res.11(1),3-11(2001)、Ronaghi et al.Science 281(5375),363(1998)、米国特許第6,210,891号、同第6,258,568号、及び同第6,274,320号、これらの各々は、参照により本明細書に組み込まれる)。パイロシークエンシングでは、放出されたPPiは、ATPスルフリラーゼによってアデノシン三リン酸(ATP)に即座に変換されることで検出でき、生成されたATPのレベルは、ルシフェラーゼ生成光子を介して検出することができる。したがって、配列決定反応は、発光検出システムを介して監視することができる。蛍光ベースの検出システムに使用される励起放射線源は、パイロシークエンシング手順には必要ない。本開示に従って生成されたアンプリコンへのパイロシークエンシングの適用に適合させることができる有用な流体システム、検出器、及び手順は、例えば国際公開第2012058096号、米国特許出願公開第2005/0191698(A1)号、米国特許第7,595,883号、及び同第7,244,559号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
【0526】
いくつかの実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを伴う方法を利用することができる。例えば、ヌクレオチドの取り込みは、フルオロフォア担持ポリメラーゼとγ-リン酸標識ヌクレオチドとの間の蛍光共鳴エネルギー移動(FRET)相互作用を介して、又はゼロモード導波路(ZMW)を用いて検出することができる。FRETベースのシークエンシングのための技術及び試薬は、例えば、Levene et al.Science 299,682-686(2003);Lundquist et al.Opt.Lett.33,1026-1028(2008)、Korlach et al.Proc.Natl.Acad.Sci.USA 105,1176-1181(2008)に記載され、それらの開示は参照により本明細書に組み込まれる。
【0527】
いくつかのSBS実施形態は、伸長産物へのヌクレオチドの組み込み時に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づくシークエンシングは、Ion Torrent(Guilford,CT、Life Technologiesの子会社)から市販されている電気検出器及び関連技術、又はそれぞれの開示全体が参照により本明細書に組み込まれる、米国特許出願公開第2009/0026082(A1)号、同第2009/0127589(A1)号、同第2010/0137143(A1)号、若しくは同第2010/0282617号(A1)に記載されているシークエンシング法及びシステムを使用できる。結合平衡除外を使用してターゲット核酸を増幅するための本明細書に記載の方法は、プロトンを検出するために使用される基質に容易に適用することができる。より具体的には、本明細書に記載の方法を使用して、プロトンを検出するために使用されるアンプリコンのクローン集団を生成することができる。
【0528】
別の有用なシークエンシング技術は、ナノポアシークエンシングである(例えば、Deamer et al.Trends Biotechnol.18,147-151(2000);Deamer et al.Acc.Chem.Res.35:817-825(2002)、Li et al.Nat.Mater.2:611-615(2003)を参照されたく、これらの開示は、参照により本明細書に組み込まれる)。いくつかのナノポアの実施形態では、標的核酸又は標的核酸から除去された個々のヌクレオチドは、ナノポアを通過する。核酸又はヌクレオチドがナノポアを通過するとき、各ヌクレオチド種は、細孔の電気コンダクタンスの変動を測定することによって識別され得る。(米国特許第7,001,792号、Soni et al.Clin.Chem.53,1996-2001(2007)、Healy,Nanomed.2,459-481(2007)、Cockroft et al.J.Am.Chem.Soc.130,818-820(2008)、これらの開示は、参照により本明細書に組み込まれる)。
【0529】
本開示による検出に適用することができるアレイに基づく発現及び遺伝子型解析のための例示的な方法は、米国特許第7,582,420号、同第6,890,741号、同第6,913,884号、若しくは同第6,355,431号、又は米国特許出願公開第2005/0053980(A1)号、同第2009/0186349(A1)号、若しくは同第2005/0181440(A1)号に記載されており、これらの各々は、参照により本明細書に組み込まれる。
【0530】
本明細書に記載の方法の利点は、複数の標的核酸の迅速かつ効率的な検出を並行して提供することである。したがって、本開示は、上記で例示されるものなどの当技術分野において既知の技術を使用して核酸を調製及び検出することができる統合システムを提供する。したがって、本開示の統合システムは、増幅試薬及び/又はシークエンシング試薬を1つ以上の固定化されたDNA断片に送達することができる流体構成要素を含むことができ、システムは、ポンプ、弁、リザーバ、流体ラインなどの構成要素を含む。フローセルは、標的核酸を検出するための統合システムで構成及び/又は使用することができる。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768(A1)号及び同第2012/0270305(A1)号に記載されており、これらの各々は、参照により本明細書に組み込まれる。フローセルについて例示されるように、統合システムの流体構成要素の1つ以上を増幅方法及び検出方法に使用することができる。核酸配列決定の実施形態を一例として取ると、統合システムの流体構成要素の1つ以上を、本明細書に記載の増幅方法、及び上記に例示したような配列決定方法における配列決定試薬の送達に使用することができる。代替的に、統合システムは、増幅方法を実施し、検出方法を実施するための別々の流体システムを含み得る。増幅された核酸を作成し、又核酸の配列を決定することができる統合シークエンシングシステムの例としては、MiSeqTMプラットフォーム(Illumina,Inc.,San Diego,CA)、及び参照により本明細書に組み込まれる、米国特許出願公開第2012/0270305号に記載の装置が挙げられるが、これらに限定されない。
【0531】
J.標的核酸をシークエンシングする際の連続性情報の保存
いくつかの実施形態では、連続性情報は、標的化オリゴヌクレオチドに基づいて保存される。
【0532】
いくつかの実施形態では、標的核酸をシークエンシングする際に連続性情報を保存する方法は、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体を含む方法を用いて、標的核酸のタグ付き断片を産生することと、5’タグ付き断片又は完全二本鎖タグ付き断片をシークエンシングして、断片の配列を提供することと、同じ標的化オリゴヌクレオチドの配列を含む断片の配列をグループ化することと、同じ標的化オリゴヌクレオチドの配列を含む場合、配列のグループが標的核酸内で近接していたと判定することと、を含む。
【0533】
連続性情報はまた、固有分子識別子(UMI)配列を含むアダプタ配列に基づいて保存され得る。いくつかの実施形態では、標的核酸をシークエンシングする際に連続性情報を保存する方法は、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含む標的化されたトランスポソーム複合体を使用して標的核酸のタグ付き断片を産生することであって、1つ以上のアダプタ配列が、単一の標的化オリゴヌクレオチド配列に関連する固有分子識別子(UMI)を含む、ことと、5’タグ付き断片又は完全二本鎖タグ付き断片をシークエンシングして、断片の配列を提供することと、同じUMIの配列を含む断片の配列をグループ化することと、同じUMIの配列を含む場合、配列のグループが標的核酸内で近接していたと判定することと、を含む。
【0534】
標的化されたトランスポソームはまた、固定化ポリヌクレオチドの物理的マップを生成する方法において使用されてもよい。この方法は、有利には、連結された配列(すなわち、同じ標的ポリヌクレオチド分子由来の第1及び第2の部分)を含有する可能性が高いクラスタを同定に利用することができる。したがって、固定化されたポリヌクレオチドから得られる任意の2つのクラスタの相対的近接度は、2つのクラスタから得られる配列情報のアラインメントに有用な情報を提供する。具体的には、固体表面上の任意の2つの所与のクラスタ間の距離は、その全体が参照により本明細書に組み込まれる国際公開第2012/025250号により詳細に記載されるように、2つのクラスタが同じ標的ポリヌクレオチド分子に由来する確率と正に相関する。
【0535】
例として、いくつかの実施形態では、フローセルの表面上に伸張する長いDNA分子は、インサイチュでタグメンテーションされ、フローセルの表面を横切って接続されたDNAブリッジのラインが生じる。更に、固定化DNAの物理的マップ。したがって、物理的マップは、固定化DNAが増幅された後のクラスタの物理的関係を相関させる。具体的には、物理的マップは、国際公開第2012/025250号の組み込まれた材料に記載されているように、任意の2つのクラスタから得られたシークエンスデータが連結される確率を計算する。
【0536】
いくつかの実施形態では、物理的マップは、固体表面を横切る固定化されたDNA分子の位置を確立するためにDNAを画像化することによって生成される。いくつかの実施形態では、固定化されたDNAは、イメージング剤を固体支持体に添加し、イメージング剤からシグナルを検出することによって画像化される。いくつかの実施形態では、イメージング剤は、検出可能な標識であってもよい。好適な検出可能な標識としては、プロトン、ハプテン、放射性核種、酵素、蛍光標識、化学発光標識、及び/又は発色剤が挙げられるが、これらに限定されない。例えば、いくつかの実施形態では、イメージング剤は、挿入色素又は非挿入DNA結合剤である。当該技術分野において既知の任意の好適な挿入色素又は非挿入DNA結合剤を使用することができ、これには、参照によりその全体が本明細書に組み込まれる米国特許出願公開第2012/0282617号に記載されているものが挙げられるが、これらに限定されない。
【0537】
いくつかの実施形態では、固定化されたDNA二本鎖は、ストランド交換及びクラスタ生成の前に自由末端を遊離させるように更に断片化される。ブリッジ構造の切断は、国際公開第2012/025250号の組み込まれた材料によって例示されるように、当該技術分野において既知の任意の好適な方法論を使用して実行することができる。例えば、切断は、国際公開第2012/025250号に記載されているようなウラシルなどの修飾ヌクレオチドの組み込みによって、制限エンドヌクレアーゼ部位の組み込みによって、又は、本明細書の他の場所で説明されているように、液相トランスポソーム複合体をブリッジDNA構造に適用することによって、起こり得る。
【0538】
特定の実施形態では、複数の核酸が、複数のナノチャネルを備えるフローセル上に流され、ナノチャネルは、それに固定化された複数のトランスポソーム複合体を有する。本明細書で使用するとき、用語「ナノチャネル」は、長い線状核酸分子が流入する狭いチャネルを指す。いくつかの実施形態では、標的核酸の1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、30、40、50、60 70、80、90、100、200、300、400、500、600、700、800、900個以下の又は1000個以下の個々の長鎖の標的DNAが、各ナノチャネルに流入する。いくつかの実施形態では、個々のナノチャネルは、標的DNAの個々の長鎖が複数のナノチャネルと相互作用することを防止する物理的バリアによって分離される。いくつかの実施形態では、固体支持体は、少なくとも10、50、100、200、500、1000、3000、5000、10000、30000、50000、80000、又は100000個のナノチャネルを含む。いくつかの実施形態では、ナノチャネルの表面に結合したトランスポソームは、DNAをタグメンテーションする。次いで、連続マッピングは、例えば、これらのチャネルのうちの1つの長さに沿ってクラスタを追跡することによって実行することができる。いくつかの実施形態では、標的DNAの長鎖は、少なくとも0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kb、1000kb、5000kb、10000kb、20000kb、30000kb、又は50000kbの長さであり得る。いくつかの実施形態では、標的DNAの長鎖は、0.1kb、1kb、2kb、3kb、4kb、5kb、6kb、7kb、8kb、9kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、45kb、50kb、55kb、60kb、65kb、70kb、75kb、80kb、85kb、90kb、95kb、100kb、150kb、200kb、250kb、300kb、350kb、400kb、450kb、500kb、550kb、600kb、650kb、700kb、750kb、800kb、850kb、900kb、950kb以下、又は1000kb以下の長さである。例として、ナノチャネル内にマッピングされた固定化されたタグメンテーション生成物を含む1000以上のナノチャネルを有するフローセルを使用して、短い「ポジショニングされた」リードで生物のゲノムをシークエンシングすることができる。いくつかの実施形態では、ナノチャネル内にマッピングされた固定化されたタグメンテーション生成物を使用して、ハプロタイプを解析することができる。いくつかの実施形態では、ナノチャネル内にマッピングされた固定化されたタグメンテーション生成物を使用して、フェージング課題を解析することができる。
【0539】
IV.無細胞DNAを含む試料と標的化されたトランスポソーム複合体を使用する方法
本明細書に記載される標的化されたトランスポソームは、簡略化されたライブラリー調製及び濃縮プロトコル内での標的化転位のために使用することができる。いくつかの実施形態では、簡略化されたプロトコルは、既存のプロトコルと比較して、必要とする時間又はユーザ工程が少ない。いくつかの実施形態では、1つ以上の目的の核酸配列は、ヒストンと会合したDNAに含まれる。いくつかの実施形態では、ヒストンと会合したDNAは無細胞DNAである。
【0540】
いくつかの実施形態では、簡略化されたライブラリー調製及び濃縮プロトコルは、
図15に示される例示的な方法などの、無細胞DNA(cfDNA)と共に使用するためのものである。cfDNAのための現在のライブラリー調製は、一般に、血漿からcfDNA抽出(30分)、末端修復(30分)、Aテーリング(30分)、非ランダム固有分子識別子(UMI)のライゲーション(30分)、アダプタのライゲーション(30分)、及びSPRIクリーンアップと後続のPCR増幅(~30分)のいくつかの工程を含む。標準的な方法における血漿からのcfDNA抽出は、プロテアーゼ工程(例えば、VeriSeq NIPT用のプロトコルを提供するIllumina Document #1000000001856 v06(2020年4月)に記載されているようなプロテイナーゼK)を含み得る。これらの工程に基づくと、cfDNAライブラリー調製は、時間がかかり、自動化が困難である非効率的なプロセスである。
【0541】
血漿中の無細胞DNA(cfDNA)は、ヒストンと会合して存在することが知られている(Marshman et al.,Cell Death and Disease(2016)7,e2518、及びRumore and Steinman J.Clin Inv.86:69-74(1990)参照)。血漿試料において直接タグメンテーションを実施する際の重要な課題は、cfDNAからヒストンを除去することである。ヒストンを除去する方法は、プロテアーゼ工程を含み得、このプロテアーゼはまた、タグメンテーションに関与するタンパク質を分解し得る。例えば、VeriSeq Non-Invasive Prenatal Testing(NIPT)法(Illumina)における血漿からのcfDNA抽出は、プロテアーゼ工程(VeriSeq NIPT溶液の添付文書、Illumina Document #1000000001856 v06(2020年4月)に記載されているようなプロテイナーゼK)と、それに続くライブラリー調製前の複数の洗浄工程とを含む。目的の特定の配列(ゲノム内の遺伝子など)へのトランスポソームの標的化は、ヒストンの除去を必要とせずに、cfDNAを含む試料を用いたワークフローを著しく簡略化することができた。
【0542】
ジンクフィンガーDNA結合ドメインは、ジンクフィンガーヌクレアーゼを、編集するゲノムの特定の領域に標的化できる(Costa et al.,Genome Editing Using Engineered Nucleases and Their Use in Genomic Screening,PMID:29165977,in Assay Guidance Manual(Markossian et al.,editors)(2017)参照)。特に、ZFNは、ヒストンに結合したDNAを効率的に切断する性能を保持しているが、Cas9ヌクレアーゼは、DNAがヒストンに結合した場合に強く阻害される(Yarringon et al.,PNAS 115(38):9351-9358(2018)参照)。
【0543】
いくつかの実施形態では、ヒストンに結合したDNAは、ヌクレオソームに含まれていてもよい。本明細書で使用されるとき、「ヌクレオソーム」とは、8つのヒストンタンパク質の周りに巻き付いたDNAのセグメントからなる構造を指す。いくつかの実施形態では、ヒストンに結合したDNAは、無細胞DNAである。例示的な無細胞DNAは、妊婦(cfDNAは胎児由来の場合がある)、又はがん若しくはがんの疑いがある患者(cfDNAは腫瘍細胞由来の場合がある)由来の血液試料中に含まれるcfDNAであってもよい。
【0544】
いくつかの実施形態では、標的化されたトランスポソームは、ジンクフィンガーDNA結合ドメインによってcfDNA中の1つ以上の領域に標的化される。いくつかの実施形態では、ヒストン結合DNA(cfDNAなど)は、ジンクフィンガーDNA結合ドメインを含む標的化されたトランスポソームを使用してタグメンテーションされる。
【0545】
いくつかの実施形態では、方法は、断片化後に固体支持体上に親和性結合パートナーを添加する工程を更に含み、タグ付き標的断片は、固体支持体に結合される。いくつかの実施形態では、断片化は、固体支持体上に親和性エレメントを添加する前に停止される。いくつかの実施形態では、断片化は、プロテイナーゼK及び/又はSDSを含む溶液の添加によって停止される。
【0546】
例えば、ジンクフィンガーDNA結合ドメインを含むトランスポソーム複合体は、
図15に示すように、cfDNA内の目的の特定の配列を標的とすることができる。いくつかの実施形態では、標的化されたトランスポソームに含まれるジンクフィンガーDNA結合ドメインは、がん遺伝子内又はその付近に含まれる配列に結合して、がん患者由来の試料内のcfDNAから標的化ライブラリーを生成し、機能獲得型変異がcfDNAに存在するかどうかを評価することができる。あるいは、標的化されたトランスポソームに含まれるジンクフィンガーDNA結合ドメインは、腫瘍抑制遺伝子内又はその付近に含まれる配列に結合して、cfDNAから特異的ライブラリーを生成し、機能喪失型変異(すなわち、活性化変異)がcfDNAに存在するかどうかを評価することができる。このようにして、このような標的トランスポゾンを用いて、より悪性度が高い腫瘍に関連する、又はより不良な予後に関連するがん細胞における変化を評価するための標的化ライブラリーを生成することができる。
【0547】
同様に、cfDNA由来の標的化ライブラリーを使用して、遺伝子疾患に関連する特定の遺伝子配列を評価することができる。これらの遺伝的疾患は、テイ・サックス病、嚢胞性線維症、及び当業者に周知の多くのものなどの、遺伝子配列における既知の変化によって引き起こされる既知の遺伝病であり得る。いくつかの実施形態では、標的化されたトランスポソームに含まれるジンクフィンガーDNA結合ドメインは、遺伝病に関連する遺伝子内又はその付近に含まれる配列に結合して、標的化ライブラリーを生成してもよい。いくつかの実施形態では、標的化ライブラリーは、胎児由来のcfDNAを含む母体血漿を使用する出生前検査において、SNP又は他の突然変異について目的の遺伝子の領域をシークエンシングするためのものであり得る。
【0548】
V.単一細胞核酸の選別及び選択方法
sc-NGS(単一細胞次世代シークエンシング)法を核酸選択技術と組み合わせて利用して、「オミクス」の特徴に基づく細胞選別を可能にするための方法が本明細書に記載される。方法は、固有の細胞バーコードを標的化してscライブラリーメンバーを濃縮又は枯渇させることを含み得る。2回のシークエンシング工程ワークフローを含む本ワークフローは、初期シークエンシングが、所望の細胞の選択後、2回目のより包括的なシークエンシング実行においてどの細胞から追加の「オミクス」データを得るかを決定するために使用される細胞データベースを作成するという管理しやすい方法論を提供する。
図3は、そのような選別及び選択方法の概要を提供し、最初の16sシークエンシングを用いて目的の細胞バーコードIDを決定し、その後、所望の試料の濃縮又は不要な試料の枯渇が続く。濃縮/枯渇後、所望の試料は、包括的なシークエンシングを受けることができる。
【0549】
いくつかの実施形態では、細胞選択は、それらに割り当てられたUBCに基づいて、scライブラリーから関心の低い豊富な細胞などの不要な試料を枯渇させることによって達成される。この枯渇後の二次シークエンシングは、所望の試料、すなわち、ライブラリー内で希少であり得る目的の細胞から生成されたDNAライブラリーを特徴付け得る。いくつかの実施形態では、細胞選択は、scライブラリーから割り当てられたUBCを用いて所望の試料を濃縮することによって達成される。これらの所望の試料は、試料中で希少であるか、又は存在量が低い場合がある。
【0550】
VI.試料の混合プール中の所望の試料を特徴付ける方法
所望の試料及び不要な試料の両方を含む試料の混合プール中の所望の試料を特徴付ける方法が、本明細書に記載される。いくつかの実施形態では、方法は、最初に、試料の混合プール由来の複数の核酸試料を含むライブラリーをシークエンシングして、二本鎖核酸から配列データを生成することを含む。いくつかの実施形態では、各核酸ライブラリーは、単一試料由来の核酸をライブラリー中の他の試料由来の核酸と区別するための、単一試料由来の核酸と、固有の試料バーコードとを含む。
【0551】
本方法は、所望のゲノム特徴(ここで、所望のゲノム特徴は、特定の遺伝子突然変異の存在、所与の遺伝子のメチル化状態などであり得る)を有する細胞に関連するバーコードに基づいて、所与の集団内の単一細胞を特徴付けるための費用効果の高い手段であり得る。この所望のゲノム特徴は、初期シークエンシングから決定され得、その後、選択工程、次いで、目的の単一細胞に関する更なる情報を提供するための再シークエンシングが続く。バーコードを組み込む代表的な方法を
図5及び6に示す。
【0552】
いくつかの実施形態では、方法はまた、配列データを分析し、所望の試料由来の配列データに関連する固有の試料バーコードを識別することと、所望の試料由来の核酸試料を濃縮すること、及び/又は不要な試料由来の核酸試料を枯渇させることを含む選択工程をライブラリーに対して実施することと、核酸ライブラリーを再シークエンシングすることと、を含む。
【0553】
いくつかの実施形態では、再シークエンシングは直交的な再シークエンシングである。本明細書で使用されるとき、「直交的な再シークエンシング」は、初期シークエンシングと比較して異なる生理的特徴を分析する再シークエンシングを指す。例えば、初期シークエンシングはメチル化状態を評価してもよく、再シークエンシングは、所望のメチル化パターンを有する細胞の包括的なゲノム全体のシークエンシングであってもよい。言い換えれば、初期シークエンシング及び再シークエンシングは、試料の混合プールの同じ特徴を評価し得るが、初期シークエンシング及び再シークエンシングはまた、所望の試料の異なる特徴を評価し得る。
【0554】
本方法の利点は、所望の試料に関する配列データを生成するために通常使用され得る特定の工程を回避できることである。言い換えれば、本発明の方法は、他の方法よりも高速若しくは容易であり得るか、又は結果にバイアスをかけ得る工程を回避し得る。いくつかの実施形態では、方法は、細胞選別に基づく濃縮方法を使用しない。いくつかの実施形態では、方法は、FACSを使用しない。いくつかの実施形態では、方法は、細胞サイズ、形態、又は表面タンパク質発現に基づくFACSを使用しない。いくつかの実施形態では、方法は、マイクロフルイディクスを使用しない。いくつかの実施形態では、方法は、全ゲノム増幅を使用しない。本方法においてこれらの工程を回避することは、所望の試料に関する包括的な配列データを生成するために必要な時間及び費用を減少させ得る。更に、これらの工程を回避することは、特定の方法に由来するバイアス(例えば、FACS法を用いて細胞を選別するために表面タンパク質発現に依存すること)を回避し得る。
【0555】
更に、シークエンシング及び分析の本方法は、FACS装置なども必要とせずに、シークエンシングシステムを使用して行うことができる。
【0556】
いくつかの実施形態では、初期シークエンシング結果を使用して、初期シークエンシングが事前にソーティング工程によってバイアスされることなく、選択工程を誘導することができる。本方法を用いて、当業者は、目的の特性について、初期シークエンシングによって複数の単一細胞ライブラリーを選別し、これらの最初の配列結果を使用して、どの細胞が所望の細胞であるかを決定し、次いで、所望の細胞を選択し、再シークエンシングすることができる。
【0557】
本方法の他の利点は、本明細書に記載される。
【0558】
A.ライブラリーの調製
これらの方法の初期シークエンシング工程は、試料の混合プール由来の複数の核酸試料を含むライブラリーを生成する任意の手段であり得る。いくつかの実施形態では、ライブラリーは単一細胞ライブラリー(scライブラリー)である。本明細書で使用されるとき、「単一細胞ライブラリー」又は「scライブラリー」とは、細胞の混合集団内の単一細胞から生成されたライブラリーをいう。しかし、ライブラリーはまた、混合集団内の単一の核、ウイルス、又は高分子量(HMW)DNA由来のライブラリーであり得る。したがって、本発明の方法は、種々の混合集団と共に使用され得、scライブラリーと共に使用するために記載される任意の方法は、他の種類のライブラリーについて使用され得る。
【0559】
いくつかの実施形態では、本方法は、ライブラリーのインデックス付け後であるが、ライブラリーの包括的なシークエンシングの前に実施される。
【0560】
いくつかの実施形態では、核酸ライブラリーは、単一試料由来の核酸をライブラリー中の他の試料由来の核酸と区別するための、固有の試料バーコードを含む単一試料由来の核酸を含む。そのようなライブラリーを生成する多種多様な手段が当該技術分野で周知である。本方法の利点は、多くの異なる方法を介して生成されるライブラリーと共に使用され得ることである。したがって、当業者は、自身の選好に基づいて試料の混合プール由来の複数の核酸試料を含むライブラリーを生成するための特定の方法を選択し、初期シークエンシングを行うことができる。次いで、開示される方法は、固有の試料バーコードに基づく選択、その後の再シークエンシングのために使用することができる。
【0561】
scシークエンシングの代表的な方法には、参照により本明細書に組み込まれる国際公開第2016/130704号の方法が含まれる。いくつかの実施形態では、方法は、固有の試料バーコードを組み込む前に、核酸試料を空間的に分離する工程を含む。
【0562】
これらの方法は、固有の細胞バーコード(UBC)又は固有の試料バーコードを使用する任意のscライブラリー生成及びシークエンシング方法に適用可能である。例示的なscライブラリー生成/シークエンシング方法としては、Biorad ddSEQ(例えば、Illumina Bio-Rad SureCell WTA 3’Library Prep Kitを使用する)、種々の10X Genomicsシステム(例えば、Chromium Single Cell Expression)、Drop-Seq(Macosko et al.,Cell 161(5):1202-1214(2015)参照)、InDrop(商標)(1CellBio)、Tapestri(商標)Platform(MissionBio)、Split-Seq(Rosenburg et al.,Science 360(6385):176-182(2018)参照)、又はIllluminaのSingle Cell Combinatorial Indexing Sequencing(SCI-seq、Cao et al.,Science 357(6352):661-667(2017)参照)が挙げられ、これら全て、ライブラリー生成及びシークエンシング方法の開示のために参照により組み込まれる。
【0563】
いくつかの実施形態では、方法は、試料の混合プール由来の複数の核酸試料をシークエンシングする前に、タグメンテーションすることを含む。いくつかの実施形態では、ライブラリーは、タグメンテーションを使用して生成される。いくつかの実施形態では、タグメンテーションにより、固有の試料バーコードが各核酸試料に組み込まれる。
【0564】
いくつかの実施形態では、ユニバーサルプライマーは、核酸ライブラリー内の各核酸試料内に組み込まれる。いくつかの実施形態では、ユニバーサルプライマーは、ライブラリーの調製中に各核酸試料内に組み込まれる。いくつかの実施形態では、ユニバーサルプライマーは、P5及びP7プライマーである。いくつかの実施形態では、P5及びP7配列は、核酸ライブラリー内の各核酸試料に組み込まれる。
【0565】
いくつかの実施形態では、i5及びi7配列は、核酸ライブラリー内の各核酸試料に組み込まれる。いくつかの実施形態では、i5及びi7配列は、ライブラリーの調製中に各核酸試料に組み込まれる。
【0566】
B.初期シークエンシング
いくつかの実施形態では、非標的化初期シークエンシングは、複数の単一細胞を特徴付けるために有益であり得、その後、選択及び再シークエンシングを行い、集団を用いて目的の単一細胞を更に分析できる。いくつかの実施形態では、初期シークエンシングは、不要な試料に関連する固有の試料バーコードを同定する。いくつかの実施形態では、初期シークエンシングは、所望の試料に関連する固有の試料バーコードを同定する。
【0567】
いくつかの実施形態では、標的化初期シークエンシングは、単一細胞の集団内の目的の細胞を決定する(すなわち、所望の試料を決定する)ことができ、次いで、これらの目的の細胞から生成されたライブラリーを選択し、再シークエンシングして、更なる情報を提供することができる。
【0568】
いくつかの実施形態では、初期シークエンシング工程は、標的化シークエンシングを含み、再シークエンシング工程は、全ゲノムシークエンシングを含む。いくつかの実施形態では、初期シークエンシングは、遺伝子特異的シークエンシングであり得る。いくつかの実施形態では、初期シークエンシングは、16sシークエンシングであり得る。
【0569】
いくつかの実施形態では、初期シークエンシング工程は、1つ以上の遺伝子特異的プライマー(
図7に例示されるような)を用いた標的化シークエンシングを含む。いくつかの実施形態では、遺伝子特異的プライマーは、ユニバーサルプライマーテールを含む。
【0570】
いくつかの実施形態では、初期シークエンシング工程は、全ゲノムシークエンシングを含まず、再シークエンシング工程は、全ゲノムシークエンシングを含む。言い換えれば、初期シークエンシングは包括度が低くてもよく、再シークエンシングはより包括的である。このようなアプローチは、不要な試料の再シークエンシングを回避することによって、所望の試料に関する包括的なデータを生成するために必要な時間/コストを劇的に減少させ得る。
【0571】
いくつかの実施形態では、初期シークエンシング工程は、リボソームシークエンシングを含み、再シークエンシング工程は、全ゲノムシークエンシングを含む。いくつかの実施形態では、リボソームシークエンシングは、16s、18s、又は内部転写スペーサーシークエンシングを含む。いくつかの実施形態では、内部転写スペーサー領域は、16s rRNA遺伝子と23s rRNA遺伝子との間に位置する。いくつかの実施形態では、リボソームシークエンシングは、異なる種由来の試料を含む試料の混合プールを含む試料内の種を決定するために使用される。例えば、リボソームシークエンシングを使用して、メタゲノミクス試料内の細菌種を決定することができる。いくつかの実施形態では、再シークエンシングは、目的の種由来のこれらの所望の試料を濃縮した後、又は目的ではない種由来の不要な試料を枯渇させた後の、目的の種の全ゲノムシークエンシングを含む。
【0572】
いくつかの実施形態では、初期シークエンシングは、細胞集団を特徴付けた後、再シークエンシングが続く。例えば、初期シークエンシングは、血液試料内の所望の細胞型の細胞を同定し得、再シークエンシングは、これらの細胞に特異的に焦点を当て得る。
【0573】
1.標的化初期シークエンシング
いくつかの実施形態では、初期シークエンシングは、標的化シークエンシングである。本明細書で使用されるとき、標的化シークエンシングは、標的核酸の領域のシークエンシングをいう。例えば、標的化シークエンシングは、標的ゲノム内の特定の遺伝子のシークエンシングであってもよい。
【0574】
図7は、標的化初期シークエンシングの実施方法の例を示す。複数の細胞核酸ライブラリーを含むscライブラリーが調製され得、各ライブラリーは、1つ以上のUBCが付けられている。各細胞核酸ライブラリー中の断片は、一方の末端にP5配列を含み、他方の末端にP7配列を含む。scライブラリー由来の増幅物に特異的な標的遺伝子を生成するために、P7テールを有する遺伝子特異的プライマーをP5プライマーと共に使用することができる。このようにして、目的の遺伝子を含む断片が特異的に増幅され、次いで、増幅された断片に含まれる読み取り1及び読み取り2のプライマー配列に基づく初期シークエンシングのために使用され得る。初期シークエンシング結果の分析は、標的遺伝子に関する目的の配列を発現した細胞由来の細胞核酸ライブラリーに関連するUBCを同定し得る。次いで、選択を行い、後続する所望の試料のシークエンシングを行うことができる。
【0575】
いくつかの実施形態では、標的化初期シークエンシングは、目的の細菌分類群又は種に関連する16s rRNA配列を同定する。いくつかの実施形態では、標的化初期シークエンシングは、突然変異を発現するKRAS G12遺伝子を含むがん生検中の細胞を同定する。所望の試料の初期シークエンシング及び同定の後、所望の試料を濃縮するか、又は不要な試料を枯渇させることができる。選択された細胞核酸ライブラリーは、目的の単一細胞の配列をよりよく理解するために、よりディープなシークエンシング又は全ゲノム分析のために使用され得る。
【0576】
同様のアプローチが、目的の任意の遺伝子で使用され得る。更に、初期シークエンシングは、標的核酸の異なる領域におけるmRNA発現レベル又はメチル化状態を分析して、異なるバーコードに対応する細胞型を分類することができる。初期シークエンシングにおいてエピジェネティック因子が評価される場合、再シークエンシングは、次いで、所望の表現型の細胞の包括的な全ゲノムシークエンシングを提供し得る。
【0577】
2.初期シークエンシングから得られた代表的なシークエンシング情報
これらの方法において、初期シークエンシングは、「オミクス」の特徴に基づいて分類するための配列情報を提供し得る。いくつかの実施形態では、初期シークエンシングは、1つ以上の遺伝子の配列又はバリアントなどのゲノム特徴に関する情報を提供する。いくつかの実施形態では、試料由来のDNAをシークエンシングして、ゲノムデータを生成する。いくつかの実施形態では、初期シークエンシングは、異なる遺伝子の発現などのトランスクリプトームの特徴に関する情報を提供する。いくつかの実施形態では、試料由来のRNAをシークエンシングして、トランスクリプトームデータを生成する。いくつかの実施形態では、初期シークエンシングは、メチル化マーク又はパターンに関するデータを提供する。いくつかの実施形態では、試料由来のDNAを、メチル化分析に使用する。いくつかの実施形態では、メチル化分析は、バイサルファイトシークエンシングである。いくつかの実施形態では、単一細胞を選別することができ、次いで、単一細胞由来の試料をバイサルファイトシークエンシング及びメチル化分析に使用することができる。これらの初期シークエンシング法のいずれかについて、シークエンシングは、全ゲノムシークエンシング又は標的化シークエンシングであり得る。
【0578】
いくつかの実施形態では、初期シークエンシングは、メタゲノミクスデータを生成するために使用される。いくつかの実施形態では、初期シークエンシングを使用して、いくつかの種由来の試料を含む試料の混合プール内の種を同定する。いくつかの実施形態では、初期シークエンシングを使用して、いくつかの種由来の試料を含む試料の混合プール内の豊富な種を同定する。次いで、再シークエンシングは、所望の種についての更なる配列データを生成し得る。いくつかの実施形態では、種は、細菌の種である。いくつかの実施形態では、試料の混合プールは、患者から単離された細菌の混合プールを含む。
【0579】
初期配列データは、任意のバイオインフォマティクスアプローチを用いて分析され得る。初期シークエンシング結果の分析は、ユーザがその方法をどのように使用したいかに依存する。言い換えれば、ユーザは、試料を所望の試料と不要な試料とにどのように特徴付けたいかに基づいて、初期シークエンシング結果を分析するための最も適切な方法を選択することができる。例えば、ユーザは、メチル化状態の分析が選択の基準であることを望む場合、メチル化状態の分析を使用する。
【0580】
更に、本方法の1つの明確な利点は、初期シークエンシングが、混合集団のバイアスのない分析であり得、その後、初期シークエンシングを介して決定される所望の試料の再シークエンシングが続くことである。例えば、ユーザは、感染症患者由来のメタゲノミクス試料を有し得るが、ユーザは、その試料に含まれる細菌種に関するいかなる情報も有し得ない。本方法を使用して、初期の16sシークエンシングは、試料中の細菌種を同定することができ、ユーザは、既知の病原体である細菌種由来の試料を同定することができる。この場合、所望の試料は、これらの病原体の可能性がある細菌種であり、一方、不要な試料は、病原体でないことが知られている試料中の豊富な種であり得る。次いで、再シークエンシングを行って、病原体の可能性がある細菌が抗生物質耐性に関連する遺伝子を発現しているかどうかなど、所望の試料に関するより多くの情報を提供することができる。次いで、これらの結果を使用して、対象にとって最良の抗菌療法を決定することができる。この方法は、感染が希少細菌によるものである場合に結果にバイアスを与える可能性がある、推定される病原性種に関する予測をユーザが行う必要がないため、特に強力である。このような方法はまた、病原性細菌が十分に培養されない細菌である試料を評価するために特に有用であり得る。このような場合、本発明の方法は、病原体の可能性がある細菌の同定及び臨床的に関連する評価を可能にし得るが、同じ患者試料を評価する培養ベースの方法は、これらの培養不可能な病原性細菌の存在を見逃す。
【0581】
3.増幅及び再シークエンシング
いくつかの実施形態では、方法は、初期シークエンシング後に1回以上の増幅工程を含む。いくつかの実施形態では、方法は、再シークエンシング前に増幅工程を含む。
【0582】
いくつかの実施形態では、増幅は、選択のために使用される。いくつかの実施形態では、所望の試料は、以下で議論されるように、固有の試料バーコードを使用して所望の試料のPCR増幅を介して濃縮される。
【0583】
いくつかの実施形態では、増幅は、選択後に行われる。いくつかの実施形態では、増幅工程の前に、所望の試料が濃縮されるか、又は不要な試料が枯渇される。そのような場合、増幅はバイアスがない場合があり、選択後のライブラリー中の全ての残った試料が増幅される。いくつかの実施形態では、増幅工程は、ユニバーサルプライマーを使用する。
【0584】
いくつかの実施形態では、増幅及び再シークエンシング工程は、1回繰り返される。いくつかの実施形態では、増幅及び再シークエンシング工程は、2回以上繰り返される。いくつかの実施形態では、増幅及び再シークエンシング工程は、1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55回若しくはそれ以上、又は列挙された整数から作成される任意の間隔で繰り返される。
【0585】
いくつかの実施形態では、試料は、固体支持体上で増幅される。
【0586】
C.試料
いくつかの実施形態では、方法は、核酸試料の混合プールから生成された多数の個々の核酸ライブラリーを含むライブラリーを最初にシークエンシングする工程を含む。
【0587】
1.試料の混合プール
試料の混合プールは、試料の任意の非均質群であり得る。例えば、試料の混合プールは、異なる個々の細胞を含む血液試料、異なる個々の細胞を含む組織試料(すなわち、腫瘍試料)、又は異なる細菌種を含む環境試料などであり得る。
【0588】
いくつかの実施形態では、試料の混合プールは、細胞の混合プール、核の混合プール、又は高分子量DNA(HMW DNA)の混合プールを含む。いくつかの実施形態では、試料は、細胞、核、又はHMW DNAである。いくつかの実施形態では、HMW DNAは、ウイルスDNAである。高分子量DNAは、20kb以上の平均断片長を含む。いくつかの実施形態では、DNAは、25、30、35、40、45、50kb又はそれ以上の平均断片長を含む。
【0589】
いくつかの実施形態では、単一試料は、単一細胞である。いくつかの実施形態では、混合プール由来の複数の核酸試料は、細胞の混合プール由来の複数の核酸である。
【0590】
いくつかの実施形態では、試料の混合プールは、患者から回収される。いくつかの実施形態では、混合プールは、血液若しくは他の組織試料、又は腫瘍から採取された生検試料に由来する。
【0591】
いくつかの実施形態では、試料の混合プールは、環境試料である。いくつかの実施形態では、混合プールは、異なる種の細菌又は他の微生物の混合プールに由来する。
【0592】
いくつかの実施形態では、試料の混合プールは、所望の試料及び不要な試料の両方を含む。
【0593】
2.所望の試料
本明細書で使用されるとき、「所望の試料」は、当業者が評価することを望む試料を指す。この定義は、ユーザが、評価される対象にとって有害である悪性細胞などを研究することを望む場合があるため、所望の試料自体が望ましいことを意味しない。
【0594】
例えば、当業者は、複数の単一細胞ライブラリー内の特定の個々の細胞ライブラリーにのみ関心がある場合がある。ユーザは、がん薬物治療に耐性を付与する遺伝子突然変異を発現する細胞を研究するなど、特定の「オミクス」プロファイルを有する細胞を研究したい場合がある。本方法を使用して、当業者は、特定の薬物治療に対する耐性の潜在的な発生について患者をモニターし得る。
【0595】
多くの場合、所望の試料は、不要な(すなわち、所望されない)他の試料を含む試料のプール内に含まれる。所望の試料は、特定のプロファイルを有する試料であってもよく、所望の試料は、不要な試料を含む試料のプール内にある。例えば、所望の試料は、試料の混合プール由来の不要な試料によって発現されない特定の遺伝子変異を発現し得る。あるいは、所望の試料は、豊富な非病原性細菌も含む試料中に含まれる、病原性細菌であってもよい。
【0596】
本明細書に記載される方法において、シークエンシングで分析され得る任意の特徴は、所望の試料を特徴付けるために使用され得る。したがって、本発明の方法の利点は、広範囲の異なる試料で使用できることである。
【0597】
いくつかの実施形態では、所望の試料は、細胞又は核である。いくつかの実施形態では、所望の試料は、細胞である。いくつかの実施形態では、所望の試料は、細胞由来の核である。
【0598】
いくつかの実施形態では、所望の試料は、ヒト細胞又はヒト細胞由来の核である。いくつかの実施形態では、所望の試料は、がん細胞又はがん細胞由来の核である。いくつかの実施形態では、所望の細胞又は核は、特定の所望の細胞型であるか、又はそれらに由来する。いくつかの実施形態では、所望の試料は、プール中の他の試料と比較して突然変異を有する。いくつかの実施形態では、所望の試料は、がん細胞若しくは免疫細胞であるか、又はそれらに由来する。
【0599】
いくつかの実施形態では、所望の試料は、がん細胞であるか、又はそれに由来する。いくつかの実施形態では、所望の試料は、がん幹細胞であるか、又はそれに由来する。いくつかの実施形態では、所望の試料は、液体又は腫瘍生検試料中のがん細胞であるか、又はそれに由来する。いくつかの実施形態では、所望の試料は、薬物治療に耐性があるがん細胞であるか、又はそれに由来する。
【0600】
いくつかの実施形態では、所望の試料は、細胞プール中の他のがん細胞と比較して少なくとも1つの変異を有するがん細胞であるか、又はそれに由来する。いくつかの実施形態では、方法は、がんの進化を追跡するために使用される。いくつかの実施形態では、がんの進化は、所与の化学療法に対する耐性の出現であり得る。いくつかの実施形態では、所望の試料は、体細胞ドライバー変異を有する細胞であるか、又はそれに由来する。
【0601】
いくつかの実施形態では、所望の試料は、メタゲノミクス試料である。いくつかの実施形態では、所望の試料は、環境試料由来の微生物である。いくつかの実施形態では、所望の試料は、環境試料から培養されていない微生物である。いくつかの実施形態では、微生物は、細菌、真菌、古細菌、真菌、藻類、原虫、又はウイルスを含む。いくつかの実施形態では、所望の試料は、病原体である。
【0602】
いくつかの実施形態では、所望の試料は、他の試料と比較して、その核酸中に突然変異を有する。いくつかの実施形態では、所望の試料は、一塩基バリアント(SNV)を有する。いくつかの実施形態では、所望の試料は、コピー数多型(CNV)を有する。
【0603】
いくつかの実施形態では、所望の試料は、所望のメチル化パターンを有する。いくつかの実施形態では、所望の試料は、所望の発現パターンを有する。いくつかの実施形態では、所望の試料は、所望のエピジェネティックパターンを有する。いくつかの実施形態では、所望の試料は、所望の免疫遺伝子組換えを有する。
【0604】
いくつかの実施形態では、試料は、特定の種のタイプを有する。いくつかの実施形態では、特定の種のタイプは、ヒト種である。いくつかの実施形態では、特定の種のタイプは、細菌の特定の種である。
【0605】
異なるタイプの試料を用いた本方法のいくつかの代表的な使用を以下に記載する。
【0606】
a)希少試料
いくつかの実施形態では、所望の試料は、出発集団内で希少である。例えば、所望の試料は、scライブラリーを生成するために使用される細胞の集団において希少であった単一細胞由来の試料であり得る。したがって、細胞の混合プール中の個々の細胞由来のライブラリーのプール全体からの配列データが評価される場合、希少細胞由来の所望の配列データは、豊富にある不要な細胞由来の配列データに圧倒され得る。
【0607】
本明細書で使用されるとき、所望の試料は、試料の混合プールの1%、0.1%、0.01%、0.001%、0.0001%、0.00001%、0.000001%、0.0000001%、0.00000001%、又は0.000000001%以下で存在する「希少試料」である。いくつかの実施形態では、所望の試料は、所望の細胞である。いくつかの実施形態では、所望の細胞は、細胞の混合プールの1%、0.1%、0.01%、0.001%、0.0001%、0.00001%、0.000001%、0.0000001%、0.00000001%、又は0.000000001%以下で存在する。希少細胞は、初期シークエンシングによって評価することができる任意の特徴、例えば、細胞のゲノム又はエピジェネティック構成に基づく特徴によって特徴付けられ得る。例えば、希少細胞は、そのDNAが試料中の他の細胞のDNAと比較して突然変異を含むものであり得る。いくつかの実施形態では、希少細胞は、そのDNAのメチル化パターンが試料中の他の細胞と比較して異なるものであり得る。本明細書に記載される方法において、配列データを用いて分析され得る任意の特徴は、希少試料を特徴付けるために使用され得る。
【0608】
いくつかの実施形態では、本発明の方法における初期シークエンシングを用いて、希少細胞から産生されたライブラリーを同定することができる。選択工程は、所望の試料(すなわち、対象となる希少細胞由来のライブラリー)を濃縮するため、又は不要な試料(すなわち、豊富にある不要な細胞由来のライブラリー)を枯渇させるために行うことができる。選択後、得られたライブラリーは、所望の希少細胞の特徴を評価するために、よりディープなシークエンシングによって再シークエンシングされ得る。
【0609】
3.不要な試料
本明細書で使用されるとき、「不要な試料」とは、当業者がシークエンシングすることを望まない試料を指す。不要な試料は、有益な細胞であるが、ユーザにとって関心のないものであり得る。例えば、ユーザは、生検由来の肝臓がん細胞を評価したいが、正常な非がん性肝臓組織を含む細胞を評価したくない場合がある。当業者はまた、特定の遺伝子突然変異を発現する細胞由来の試料をシークエンシングすることのみを望み、試料中の他の細胞由来の試料をシークエンシングすることを望まない場合がある。所望の試料を濃縮するか、又は不要な試料を枯渇させるための選択がない場合、不要な試料のシークエンシングは、時間、資源、及びシークエンシング能力を浪費し得る。
【0610】
D.核酸
これらの方法は、核酸を評価するために使用され得る。いくつかの実施形態では、これらの核酸は、単一細胞由来である。いくつかの実施形態では、核酸は、DNAである。いくつかの実施形態では、核酸は、RNAである。いくつかの実施形態では、核酸は、リボソームRNA(rRNA)である。いくつかの実施形態では、核酸は、16s rRNAである。いくつかの実施形態では、核酸は、18s rRNAである。
【0611】
いくつかの実施形態では、核酸は、リボソームDNA(rDNA)である。
【0612】
いくつかの実施形態では、核酸は、内部転写スペーサー核酸である。
【0613】
E.固有の試料バーコード及び固有の細胞バーコード
本明細書で使用されるとき、「固有の試料バーコード」は、試料のプール内の個々の試料に固有のバーコードを指す。いくつかの実施形態では、ライブラリーの初期シークエンシングは、試料の混合プール由来の複数の核酸試料を含むライブラリーをシークエンシングすることを含む。この試料の混合プールは、異なる個々の細胞を含む血液試料などの試料の任意の非均質群であり得る。いくつかの実施形態は、固有の試料バーコードは、所望の単一試料由来の核酸を、ライブラリー中の他の試料由来の核酸と区別することができる。
【0614】
固有の試料バーコードは、単一のバーコード配列から構成され得る。あるいは、固有の試料バーコードは、複数のバーコード配列から構成され得る。本明細書で使用されるとき、「バーコード配列」は、試料を区別するために使用され得る配列を指す。例えば、固有の試料バーコードは、所与のバーコード配列が複数の試料と関連付けられ得る場合であっても、固有の試料バーコードに含まれる複数のバーコードに基づいて、試料の混合プール内の所与の所望の試料に固有であり得る。そのような場合、固有の試料バーコード内のバーコード配列の特定の組み合わせは固有であり得るが、固有の試料バーコード内の1つ以上のバーコード配列は、他の試料と共有される。
【0615】
いくつかの実施形態では、固有の試料バーコードは、固有の細胞バーコードである。本明細書で使用されるとき、「固有の細胞バーコード」又は「UBC」は、細胞の混合プール内の単一細胞に固有のバーコードを指す。配列データを分析する場合、UBCを使用して、細胞の出発混合プール内の同じ単一細胞に元々含まれていた配列を同定することができる。
【0616】
いくつかの実施形態では、固有の試料バーコードは、核のタイプ、HMW DNAなどに固有であり、本発明は、単一細胞での使用に限定されない。
【0617】
堅牢な濃縮方法を可能にするために、特定の固有の試料バーコード設計が望ましい場合がある。例えば、ハイブリッド捕捉アプローチを使用する場合、濃縮特異性は、所望の固有の試料バーコードに特異的にハイブリダイズするプローブを設計する能力に依存する。同様の考察は、固有の試料バーコード標的化PCR増幅についても当てはまる。このため、細胞DNAライブラリーに付加された連続核酸配列として存在する固有の試料バーコードを有することが望ましい場合がある。あるいは、固有の試料バーコード内のバーコード配列間に固定配列を有することが望ましい場合があり、その結果、ユーザは、固有の試料バーコード内のバーコード配列の組み合わせに結合するプライマーが分かる。
【0618】
固有の試料バーコードは、他の既知のバーコード又はアダプタ配列と組み合わせて使用することができる。例えば、ライブラリー断片は、固有の試料バーコードを含み得、1つ以上の市販のアダプタも含み得る。いくつかの実施形態では、i5及び/又はi7アダプタ配列(Illumina)は、ライブラリー断片に含まれる。
【0619】
1.バーコードのタイプ
いくつかの実施形態では、バーコードは、物理的にアドレス可能なバーコードである。「物理的にアドレス可能」とは、バーコードが、別の薬剤に結合できる1つ以上の核酸配列を含むことを意味する。いくつかの実施形態では、物理的にアドレス指定可能なバーコードは、相補的核酸配列に結合できる。いくつかの実施形態では、物理的にアドレス指定可能なバーコードは、プライマー又は捕捉オリゴヌクレオチドによって結合され得る。例えば、物理的にアドレス指定可能なバーコードは、シークエンシングプライマーに結合して、ライブラリー断片のシークエンシングを可能にし得る。別の例では、物理的にアドレス指定可能なバーコードは、捕捉オリゴヌクレオチドに結合して、フローセル上へのライブラリー断片の固定化を可能にし得る。
【0620】
いくつかの実施形態では、バーコードは、固有の試料バーコードである。
【0621】
いくつかの実施形態では、固有の試料バーコードは、単一の連続バーコードである。いくつかの実施形態では、固有の試料バーコードは、異なるバーコード配列間に核酸配列を含まずに、2つ以上のバーコード配列を含む。例えば、複数のバーコード配列(BC
1~BC
X)を異なる工程で付加することができ、この場合、核酸配列はバーコード配列間に組み込まれない。
図5の例示的な方法に示されるように、BC
1は、タグメンテーション中に組み込むことができ、BC
2~BC
Xは、ライゲーションを介して組み込むことができる。
図6の例示的な方法に示されるように、BC
1は、タグメンテーション中に組み込むことができ、ウェル特異的BCの1回以上のライゲーションが続き、その後プールすることができる。単一の連続バーコードの調製は、固有の試料バーコードに結合できるプライマーの設計を容易にすることができる。
【0622】
いくつかの実施形態では、固有の試料バーコードは、複数の不連続バーコードである。いくつかの実施形態では、複数の不連続バーコードは、核酸配列によって分離される。いくつかの実施形態では、複数の不連続バーコードは、固定配列によって分離される。例えば、複数のバーコード配列(BC1~BCX)を異なる工程で付加することができ、この場合、核酸配列がバーコード配列間に組み込まれる。そのような複数の不連続バーコードは、バーコード及び固定配列が既知であるため、固有の試料バーコードに結合できるプライマーの設計を容易にすることができる。
【0623】
F.エンドヌクレアーゼ
異なるエンドヌクレアーゼが本発明の方法において使用され得る。本明細書で使用されるとき、用語「エンドヌクレアーゼ」は、核酸を切断できる酵素を指すために使用される。エンドヌクレアーゼは、触媒的に活性なエンドヌクレアーゼ又は触媒的に不活性なエンドヌクレアーゼのいずれかを指すことができる。エンドヌクレアーゼに関連するガイドRNAに基づいて特定の標的配列を標的化する能力など、エンドヌクレアーゼのいくつかの特徴は、触媒的に活性なエンドヌクレアーゼ及び触媒的に不活性なエンドヌクレアーゼの両方に共通である。いくつかの実施形態では、エンドヌクレアーゼは、1つ以上の固有の試料バーコードに結合するガイドRNAと会合している。特異性を改善するために(すなわち、ターゲティングを改善し、オフターゲット活性を低減するために)使用され得る様々な異なるエンドヌクレアーゼを
図8に示す。
【0624】
いくつかの実施形態では、エンドヌクレアーゼは、触媒的に不活性なエンドヌクレアーゼである。本明細書で使用されるとき、「触媒的に不活性なエンドヌクレアーゼ」は、核酸に結合できるが、核酸切断を媒介しないエンドヌクレアーゼである。触媒的に不活性なエンドヌクレアーゼは、不活性化エンドヌクレアーゼ(「dCas」タンパク質など)と呼ばれることもある。例示的な触媒的に不活性なエンドヌクレアーゼは、
図3(dCas9がビオチンに結合している)及び
図8(dCas9がFokIとの融合タンパク質に含まれている)に示されるようなdCas9である。通常、エンドヌクレアーゼは核酸に結合し、次いで切断を媒介することができる。したがって、触媒的に不活性なエンドヌクレアーゼは、切断活性を有さずに核酸結合機能を保持するエンドヌクレアーゼである。触媒的に不活性なエンドヌクレアーゼは、本方法の選択工程のために使用され得る。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、不要な試料を枯渇させるために使用される。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、所望の試料を濃縮するために使用される。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、固体支持体に直接的又は間接的に結合される。いくつかの実施形態では、触媒的に活性なエンドヌクレアーゼは、ビオチン-ストレプトアビジン相互作用を介して固体支持体に結合される。
【0625】
更に、当業者は、エンドヌクレアーゼの触媒ドメインを認識しており、野生型エンドヌクレアーゼから触媒的に不活性なエンドヌクレアーゼを生成するために突然変異を設計することができるであろう(Maeder et al.,Nat Methods 10(10):977-979(2013)参照)。このような設計された触媒的に不活性なエンドヌクレアーゼは、その切断活性の欠如を確認するために試験され得る。代表的な触媒的に不活性なCas9タンパク質としては、その全体が本明細書に組み込まれる米国特許第10457969号に開示されているものが挙げられる。
【0626】
いくつかの実施形態では、エンドヌクレアーゼは触媒的に活性なエンドヌクレアーゼであり、これは核酸を切断できることを意味する。いくつかの実施形態では、触媒的に活性なエンドヌクレアーゼは、不要な試料を枯渇させるために使用される。
【0627】
いくつかの実施形態では、エンドヌクレアーゼは、ガイドRNAと会合している。エンドヌクレアーゼは、ガイドRNAによって、1つ以上の目的の核酸配列に標的化され得る。いくつかの実施形態では、目的の核酸配列は、1つ以上の固有の試料バーコードである。
【0628】
いくつかの実施形態では、エンドヌクレアーゼは、ガイドRNAを設計する際により大きな柔軟性を可能にする最小限のPAM特異性(
図8に示される)を有する。
【0629】
いくつかの実施形態では、エンドヌクレアーゼは、1つ以上の固有の試料バーコードに結合するガイドRNAと会合している。いくつかの実施形態では、ガイドRNAは、不要な試料の核酸に関連する固有の試料バーコードに対して指向される。いくつかの実施形態では、ガイドRNAは、所望の試料の核酸に関連する固有の試料バーコードに対して指向される。
【0630】
いくつかの実施形態では、エンドヌクレアーゼは、シアノバクテリアScytonema hofmanni(ShCAST)由来である。ShCASTは、Tn7様トランスポザーゼサブユニット及びV-K型CRISPRエフェクター(Cas12k)によって媒介されるRNA指向性(sgRNA)DNA転位のための4タンパク質系である(Strecker et al.,Science.365(6448):48-53(2019)参照、Streckerの
図5に示されている実施形態を含む)。CRISPR関連トランスポザーゼを生成するために、Tn7様トランスポゾンがヌクレアーゼ欠損CRISPR-Casシステムを利用している他のシステムも記載されている(Klompe et al.,Nature 571:219-225(2019)参照)。
【0631】
エンドヌクレアーゼの特異性を増加させる多くの異なる手段を、
図8に示す。本明細書に記載される方法は、特異性を改善し得る任意のタイプのエンドヌクレアーゼ及び/又はガイドRNAを使用し得る。いくつかの実施形態では、エンドヌクレアーゼの改善された特異性は、1つ以上の固有の試料バーコードへのエンドヌクレアーゼの改善された結合によるものである。そのような改善された結合は、他の配列への結合(すなわち、非特異的結合)と比較して、対象の1つ以上の固有の試料バーコードへの結合(すなわち、特異的結合)のより高いパーセンテージであり得る。
【0632】
いくつかの実施形態では、触媒的に活性なエンドヌクレアーゼは、核酸を切断するためにより高い特異性を有するエンドヌクレアーゼである。いくつかの実施形態では、このより高い特異性は、核酸中の標的配列への結合におけるより高い特異性のみによるものではない。いくつかの実施形態では、より高い特異性を有するこれらの触媒的に活性なエンドヌクレアーゼは、不要な試料を切断し、試料からそれらを枯渇させることができる。
【0633】
いくつかの実施形態では、触媒的に活性なエンドヌクレアーゼは、より高い忠実度の変異体である。「高忠実度」エンドヌクレアーゼとは、野生型エンドヌクレアーゼと比較してオフターゲット活性が低下したものを指す。
【0634】
いくつかの実施形態では、触媒的に活性なエンドヌクレアーゼは、FokIヌクレアーゼと共に融合タンパク質内に含まれる。いくつかの実施形態では、融合タンパク質は、Cas9及びFokIヌクレアーゼを含む(Guilinger et al.,Nat Biotechnol.32(6):577-582(2014)参照)。そのような融合タンパク質は、FokIヌクレアーゼに近接して融合された触媒的に不活性なCas9を含む2つの別個の融合タンパク質の結合を必要とするように作用し得(
図8に示されるように)、その後、二量体化FokIヌクレアーゼは、標的核酸を切断することができる。いくつかの実施形態では、2つの融合タンパク質は、異なる標的配列に結合する。いくつかの実施形態では、2つの融合タンパク質は、2つの異なる固有の試料バーコードに結合する。
【0635】
G.濃縮
多数の異なる濃縮方法を使用して、所望の試料を選択する一方で、不要な試料を選択しないことができる。このようにして、不要な試料を再シークエンシングすることなく、所望の試料のみが再シークエンシングされる。
【0636】
いくつかの実施形態では、枯渇は、所望の試料から不要な試料を物理的に分離することを指す。いくつかの実施形態では、枯渇は、固体支持体上に所望の試料を捕捉することと、捕捉されていない配列を廃棄することとを含む。そのような捕捉工程は、不要な試料の捕捉を回避することができ、不要な試料は廃棄される。このような濃縮工程の後、所望の試料のみがライブラリー内に残る。
【0637】
いくつかの実施形態は、濃縮工程は、ハイブリッド捕捉、固有の試料バーコード特異的増幅、又は触媒的に不活性なエンドヌクレアーゼによる捕捉を含む。いくつかの実施形態では、固有の試料バーコードを使用して、所望の試料の濃縮に向かわせる。いくつかの実施形態では、固有の試料バーコードを使用して、細胞の混合プール由来の1つ以上の単一細胞からの所望の試料の濃縮に向かわせる。
【0638】
いくつかの実施形態では、複数の濃縮工程が行われる。いくつかの実施形態は、複数の工程は、同じタイプの濃縮を含む。例えば、異なるハイブリッド捕捉オリゴヌクレオチドが異なる工程に使用され得る、2つ以上のハイブリッド捕捉工程が行われる。
【0639】
いくつかの実施形態では、濃縮の複数の工程は、異なるタイプの濃縮を含む。例えば、ハイブリッド捕捉による濃縮を行った後、PCR増幅を行ってもよい。
【0640】
いくつかの実施形態では、シークエンシングは、複数の濃縮工程の間に実施され得る。そのようなシークエンシング結果は、更に濃縮すべき所望の試料を示すことができる。
【0641】
いくつかの実施形態では、選択は、濃縮工程と枯渇工程とを組み合わせることによって行われる。言い換えれば、本明細書で説明される選択工程の任意の組み合わせは、ユーザによって組み合わされ得る。
【0642】
1.ハイブリッド捕捉
いくつかの実施形態は、濃縮工程は、ハイブリッド捕捉を含む。いくつかの実施形態では、ハイブリッド捕捉工程は、ハイブリッド捕捉オリゴヌクレオチドを固有の試料バーコードにハイブリダイズさせることを含む。この工程は、固有の試料バーコードのセットに結合するいくつかのハイブリッド捕捉オリゴヌクレオチドを用いて実施することができ、固有の試料バーコードは、いくつかの所望の試料の固有の試料バーコードを表す。例えば、初期配列データは、細胞の混合プール中の単一細胞のセットが所与の遺伝子変異を発現することを示し得、これらの単一細胞に関連する固有の試料バーコードは、これらの特定の単一細胞から核酸ライブラリーを濃縮するためのハイブリッド捕捉に使用され得る。濃縮後、再シークエンシングを実施して、目的の単一細胞に関する追加の配列データを生成することができる。この方法は、不要な細胞由来の試料がハイブリッド捕捉工程中に濃縮されないため、不要な細胞に関する追加の配列データの生成を回避することができる。
【0643】
いくつかの実施形態では、固有の試料バーコードは、ハイブリッド捕捉オリゴヌクレオチドの既知のパネルとハイブリダイズするように選択される。あるいは、ハイブリッド捕捉オリゴヌクレオチドのカスタムパネルは、核酸ライブラリーを調製するときに使用される固有の試料バーコードに基づいて生成され得る。
【0644】
いくつかの実施形態では、ハイブリッド捕捉オリゴヌクレオチドは、親和性エレメントに結合されている。いくつかの実施形態では、親和性エレメントは、特定の固有の試料バーコードに結合したオリゴヌクレオチドの捕捉を可能にし、これらの固有の試料バーコードを含むライブラリーの濃縮を可能にするために使用される。いくつかの実施形態では、親和性エレメントは、ビオチンである。ある種の捕捉ビーズによって結合され得る磁性微粒子など、様々な親和性エレメントが当業者に既知である。
【0645】
いくつかの実施形態では、ハイブリッド捕捉オリゴヌクレオチドは、固体支持体に直接的又は間接的に結合される。いくつかの実施形態では、ハイブリッド捕捉オリゴヌクレオチドは、ビオチン-ストレプトアビジン相互作用を介して固体支持体に結合される。いくつかの実施形態では、固体支持体は、ビーズである。
【0646】
2.触媒的に不活性なエンドヌクレアーゼによる捕捉
ハイブリッド捕捉と類似の様式で、特定のガイドRNAと会合した触媒的に不活性なエンドヌクレアーゼを濃縮のために使用することができる。これらの触媒的に不活性なエンドヌクレアーゼは、ガイドRNAを使用して特定の固有の試料バーコードに標的化され得る。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼによる捕捉は、ガイドRNAを介して触媒的に不活性なエンドヌクレアーゼを固有の試料バーコードに結合させることを含む。
【0647】
いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、親和性エレメントに結合される。いくつかの実施形態では、親和性エレメントは、特定の固有の試料バーコードに結合した触媒的に不活性なエンドヌクレアーゼの捕捉を可能にし、これらの固有の試料バーコードを含むライブラリーの濃縮を可能にするために使用される。いくつかの実施形態では、親和性エレメントは、ビオチンである。ある種の捕捉ビーズによって結合され得る磁性微粒子など、様々な親和性エレメントが当業者に既知である。
【0648】
いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、固体支持体に直接的又は間接的に結合される。いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼは、ビオチン-ストレプトアビジン相互作用を介して固体支持体に結合される。いくつかの実施形態では、固体支持体は、ビーズである。
【0649】
3.PCR増幅
いくつかの実施形態では、濃縮は、PCR増幅による。いくつかの実施形態では、濃縮は、固有の試料バーコード標的化PCR増幅による。いくつかの実施形態では、特定の固有の試料バーコードに結合するプライマーは、初期シークエンシングから所望の試料に関連することが知られている固有の試料バーコードに基づいて、所望の試料の増幅を可能にする。対照的に、不要な試料に関連する他の固有の試料バーコードに結合するプライマーは、増幅反応に含まれない。このようにして、所望の試料を選択することができる。
【0650】
H.枯渇
多数の異なる枯渇方法を使用して、所望の試料を除去せずに、不要な試料を除去することができる。このようにして、不要な試料を再シークエンシングすることなく、所望の試料のみが再シークエンシングされる。
【0651】
いくつかの実施形態では、枯渇工程は、ハイブリッド捕捉、触媒的に不活性なエンドヌクレアーゼによる捕捉、又はCRISPR消化を含む。
【0652】
いくつかの実施形態では、固有の試料バーコードを使用して、不要な試料の枯渇に向かわせる。いくつかの実施形態では、固有の試料バーコードを使用して、細胞の混合プール由来の1つ以上の単一細胞からの不要な試料の枯渇に向かわせる。
【0653】
いくつかの実施形態では、複数の枯渇工程が行われる。いくつかの実施形態は、複数の工程は、同じタイプの枯渇を含む。いくつかの実施形態では、濃縮の複数の工程は、異なるタイプの枯渇を含む。例えば、ハイブリッド捕捉による枯渇を行った後、CRISPR消化を行ってもよい。いくつかの実施形態では、シークエンシングは、枯渇工程の間に実施され得る。例えば、方法は、初期標的化シークエンシング、不要な試料の枯渇、別の標的化シークエンシング、更なる不要な試料の枯渇、及び包括的再シークエンシングを含み得る。
【0654】
1.所望の試料から不要な試料を物理的に分離することによる枯渇
いくつかの実施形態では、枯渇は、所望の試料から不要な試料を物理的に分離することを指す。いくつかの実施形態では、枯渇は、固体支持体上に不要な試料を捕捉することと、それらを除去することとを含む。このような枯渇工程の後、所望の試料のみがライブラリー内に残る。
【0655】
いくつかの実施形態では、ハイブリッド捕捉は、ハイブリッド捕捉によって単離された不要な試料が、(濃縮実施形態における所望の試料の場合のように再シークエンシングのために保持される代わりに)更なる再シークエンシングから除去されることを除いて、所望の試料の濃縮について記載されたように実施され得る。
【0656】
いくつかの実施形態では、触媒的に不活性なエンドヌクレアーゼ捕捉による捕捉は、触媒的に不活性なエンドヌクレアーゼによる捕捉によって単離された不要な試料が、(濃縮実施形態における所望の試料の場合のように再シークエンシングのために保持される代わりに)更なる再シークエンシングから除去されることを除いて、所望の試料の濃縮について記載されたように実施され得る。
【0657】
2.不要な試料の切断による枯渇
いくつかの実施形態では、枯渇は、不要な試料を適切にシークエンシングすることを不可能にする切断を含む。言い換えれば、枯渇は、試料の切断に基づいて、不要な試料が適切にシークエンシングされる能力をほとんど又は全く有さないようにすることを指し得る。いくつかの実施形態では、不要な試料由来の核酸は、ライブラリー及び選択内にあるが、枯渇とは、これらの不要な試料がシークエンシングされる能力の低下を指す。
【0658】
例えば、不要な試料に関連する1つ以上の固有の試料バーコード内又はその近くの配列の切断は、シークエンシングに必要な核酸配列を残りの不要な試料から分離することができる。このようにして、この不要な試料は、もはや、枯渇後の再シークエンシングにおいてシークエンシング結果を生成することができない。いくつかの実施形態では、そのような切断は、核酸配列を残りの不要な試料から分離する。いくつかの実施形態では、分離された核酸配列は、アダプタ配列である。いくつかの実施形態では、そのようなアダプタ配列は、プライマー配列又はシークエンシングに使用されるフローセルに核酸を固定化するための配列であり得る。例えば、シークエンシングプライマー結合部位を残りの不要な試料から分離することは、不要な試料を、選択されたシークエンシング方法を介してシークエンシングできなくし得る。当業者は、シークエンシングに使用されるプラットフォーム及び最初に生成されたライブラリーの組成に基づいて、枯渇を媒介するために分離され得るこのような配列を同定し得る。
【0659】
いくつかの実施形態では、枯渇工程は、CRISPR消化を含む。本明細書で使用されるとき、CRISPR(clustered regularly interspaced short palindromic repeats)は、細菌及び古細菌などの原核生物のゲノムにおいて見出されるDNA配列のファミリーを指す。本明細書で使用されるとき、CRISPR消化は、CRISPR配列に基づく1つ以上の核酸の任意の消化を指す。Cas9などのエンドヌクレアーゼは、CRISPR配列を利用して、規定された配列で核酸を切断することができる。いくつかの実施形態では、エンドヌクレアーゼは、触媒的に活性なエンドヌクレアーゼである。
【0660】
いくつかの実施形態では、CRISPR消化は、不要な試料の核酸に関連する固有の試料バーコードに対して指向される。いくつかの実施形態では、CRISPR消化は、不要な試料の切断を含む。いくつかの実施形態では、CRISPR消化は、シークエンシングに必要な核酸配列を残りの不要な試料から分離して、不要な試料を枯渇させる。
【0661】
a)ShCASTによる不要な試料の切断方法
いくつかの実施形態では、枯渇の方法は、ShCASTによる切断を使用して実施される。いくつかの実施形態では、切断は、不要な試料を増幅及び/又はシークエンシングすることを不可能にする。
【0662】
いくつかの実施形態では、ShCASTは、Cas12Kを含み、トランスポザーゼは、Tn5若しくはTn7様トランスポザーゼを含み、かつ/又は、gRNA及びトランスポザーゼのうちの少なくとも1つがビオチン化され、ビオチン化されたgRNA及びトランスポザーゼのうちの少なくとも1つは、ストレプトアビジンでコーティングされたビーズにカップリングすることができる。いくつかの実施形態では、ビオチン化gRNA及び/又はトランスポザーゼは、ストレプトアビジンビーズへの不要な試料の捕捉を可能にする。このようにして、所望の試料を保持しながら、不要な試料を反応混合物から除去することができる。
【0663】
いくつかの実施形態では、ShCASTに含まれるトランスポザーゼの結合を制限する流体(反応用流体としても知られる)が使用される。いくつかの実施形態では、トランスポザーゼの結合を制限又は阻害することにより、ShCASTに含まれるトランスポザーゼによって媒介されるオフターゲット転位反応が減少する。オフターゲット切断が低減される場合、枯渇工程は、所望の試料に影響を及ぼすことなく、不要な試料のみを枯渇させるのにより選択的であり得る。
【0664】
いくつかの実施形態では、不要な試料由来の核酸試料を枯渇させることは、複合体による切断を制限するための条件を有する流体中で行われる。当業者は、トランスポザーゼによって媒介される転移反応による切断を制限するためのいくつかの手段を承知しており、当該技術分野で既知の任意の手段を使用することができる。例えば、トランスポザーゼ活性は用量依存的である(すなわち、トランスポザーゼの濃度が低いほど転位反応の数が制限される)。加えて、トランスポザーゼはマグネシウム依存的である。いくつかの実施形態では、複合体による切断を制限するための条件は、15mM以下のマグネシウム濃度、並びに/又は、50nM以下のCas12K及び/若しくはトランスポザーゼの濃度である。
【0665】
いくつかの実施形態では、ShCASTによる核酸の切断は、工程のタイミングを考慮する。例えば、ユーザは、より高い選択性(例えば、不要な試料を切断し、所望の試料を切断しない)を可能にするために、初期の反応工程におけるShCASTによる核酸の結合及び/又は切断を制限することを望む場合がある。後の反応工程において、ユーザは、不要な試料の効率的な切断のために、複合体に含まれるトランスポザーゼによる核酸の切断を促進することを望む場合がある。言い換えれば、ユーザは、トランスポザーゼによる核酸の切断が比較的高い効率で起こる一方で、トランスポザーゼの結合が比較的選択的であることを望む場合がある。したがって、核酸への複合体のハイブリダイゼーション中の初期条件は、複合体に含まれるトランスポザーゼの核酸への結合を阻害し得、かつ/又は、複合体に含まれるトランスポザーゼによる切断を阻害し得る。その後の方法の条件は、トランスポザーゼによる核酸の切断を促進し得る。
【0666】
いくつかの実施形態では、不要な試料由来の核酸試料を枯渇させることは、(1)複合体による核酸の切断を阻害する条件下で複合体を二本鎖核酸に結合させることと、(2)結合後に、複合体による核酸の切断を促進することと、を含む。
【0667】
いくつかの実施形態では、結合は、(1)標的核酸への複合体の結合を阻害し、かつ(2)複合体による標的核酸の切断を阻害する条件下で行われる。言い換えれば、初期条件は、複合体の結合を阻害と、複合体による切断の両方を阻害することができる。
【0668】
いくつかの実施形態では、トランスポザーゼの選択的活性化の異なる手段が使用され得る。いくつかの実施形態では、結合中、ShCASTに含まれるトランスポザーゼは、使用される反応条件に基づいて不活性であるか、又は活性が低い。いくつかの実施形態では、ShCASTの核酸への結合後に反応条件が変更され、ShCASTのより選択的な結合後にトランスポザーゼによる高効率の切断を可能にする。そのような実施形態では、可逆的に不活性化されたトランスポザーゼが使用されてもよく、ユーザは、選択的活性化の工程を使用することによって、トランスポザーゼが活性である時間を制御することができる。そのようなトランスポザーゼの選択的活性化の手段はShCASTについて記載されているが、これらの方法は、トランスポザーゼを組み込む他の方法と共に使用することができる。
【0669】
いくつかの実施形態では、トランスポザーゼは結合中に可逆的に不活性化され、切断を促進することは、トランスポザーゼの活性化を含む。
【0670】
いくつかの実施形態では、結合中のマグネシウム濃度は低く(例えば、15mM未満)、切断を促進することは、マグネシウム濃度を増加させることを含む。
【0671】
いくつかの実施形態では、トランスポザーゼは結合中に存在せず、切断を促進することは、トランスポザーゼを添加することを含む。
【0672】
いくつかの実施形態では、トランスポザーゼは、1つ以上のトランスポゾンの欠如により可逆的に不活性化され、トランスポザーゼを活性化することは、1つ以上のトランスポゾンを提供することを含む。
【0673】
VII.方法の代表的な使用
本発明の方法は、種々のシークエンシング用途において使用され得る。本明細書中に記載される特定の使用は、本発明を限定することを意味せず、当業者は、本方法が種々のシークエンシング用途の結果を改善するために使用され得る広範な様式を想定し得る。
【0674】
A.ライブラリーの品質管理の補正
いくつかの実施形態では、本方法は、試料の混合プール由来の複数の核酸試料を含むライブラリーの品質管理(QC)のために使用され得る。いくつかの実施形態では、濃縮工程又は枯渇工程は、品質管理のために使用される。いくつかの実施形態では、品質管理工程は、不要な試料由来のシグナルを減少させるという点で補正的である。
図2は、現在の単一細胞法が、本明細書に記載される品質管理工程がないと、メタゲノミクス試料の希少細胞由来の情報を失い得る様式についての概要を提供する。
【0675】
本明細書で使用されるとき、「品質管理」又は「QC」とは、ライブラリー内の種々の個体から得られるライブラリーの性質に基づく選択工程をいい、試料の元の混合集団に関連する因子に基づかない。言い換えれば、QC法は、ライブラリーを作製するために使用される元の試料の混合プール中の試料間の生物学的差異に基づいて、単一細胞ライブラリーの所望の試料又は不要な試料を必ずしも同定するわけではなく、代わりに、作製されたライブラリーに関連する因子に基づいて、所望の試料又は不要な試料を同定する。
【0676】
例えば、単一の細胞から作製された所与のライブラリーは、ライブラリー生成のプロセスにおけるランダムな差異に基づいてより低い品質であり得、元の細胞の混合プール中のこの細胞と他の細胞との間の生物学的差異に基づいていない。不要な試料には、不十分な数の断片を有する単一細胞ライブラリー、望ましくないサイズの断片を有するものなどが含まれ得る。シークエンシング結果の質を低下させ得る任意の因子は、特定の核酸ライブラリーが不要な試料として分類されることをもたらし得る。言い換えれば、当業者は、本発明の方法を使用して、低水準のライブラリー調製(固有の試料バーコードに関連するいくつかの試料がノイズであり、散乱している)を補正することができ、不要な試料がライブラリーから除去され、次いで、再シークエンシングが行われる。次いで、この再シークエンシングは、十分な品質の配列データを潜在的に生成し得るライブラリーに焦点を当てることができる。
【0677】
いくつかの実施形態では、初期シークエンシングは、シークエンシング結果の質に基づいて、所望のライブラリー及び望ましくないライブラリーを同定する。
【0678】
いくつかの実施形態では、初期シークエンシング反応は、不要な試料である単一細胞のライブラリーに関連する固有の試料バーコードを同定するが、これは、これらのライブラリーが低品質であるためである。いくつかの実施形態では、不要な試料のライブラリーは、初期シークエンシングによって同定され、これらのライブラリーは、再シークエンシングの前にscライブラリーから枯渇される。いくつかの実施形態では、所望の試料のライブラリーは、より高い品質のライブラリーを同定するために初期シークエンシングによって同定され、これらのライブラリーは、再シークエンシングの前にscライブラリーから濃縮される。
【0679】
いくつかの実施形態では、品質管理工程は、再シークエンシングのために使用されるライブラリーの品質を向上させる。このようにして、再シークエンシングは、より高品質のライブラリーのよりディープなシークエンシングに焦点を合わせることができる。いくつかの実施形態では、QC工程は、低品質のライブラリー(すなわち、不要な試料)のよりディープなシークエンシングを回避することによって、時間及び試薬の浪費を回避することができる。
【0680】
B.腫瘍学的使用
いくつかの実施形態では、本方法は、疾患を評価又はモニタリングするために使用される。いくつかの実施形態では、疾患は、がんである。
【0681】
いくつかの実施形態では、がんは、血液又は固形腫瘍である。いくつかの実施形態では、がんは、固形腫瘍又は血液試料からの生検に基づいて評価することができる。いくつかの実施形態では、本方法は、不均質な腫瘍を評価するため、又は循環がん細胞(CTC)を評価するために使用される。CTCは、腫瘍予後の推定マーカーであり、所与の治療(化学療法又は免疫療法など)に対する対象の応答を評価するのに役立ち得る。
【0682】
いくつかの実施形態では、本方法は、がん細胞であってもなくてもよい腫瘍微小環境中の細胞を評価するために使用される。がん細胞ではないこれらの細胞は、間質細胞、血管細胞、又はそれ自体ががん性ではなくがん細胞に近接し得る任意の他のタイプの細胞であり得る。腫瘍微小環境中の細胞は、腫瘍増殖及び転移に影響を及ぼすことが知られている。
【0683】
いくつかの実施形態では、初期シークエンシングは、変異細胞に対する標的化されたシークエンシングを介してscライブラリー内のライブラリーを評価する。これらの変異細胞は、それらの核酸中に一塩基多型、挿入、欠失、及び/又はコピー数多型を有するものであり得る。これらの変異細胞はまた、メチル化の変化などの別の因子における差異を有し得る。いくつかの実施形態では、これらの変異体はCTCである。初期シークエンシングに基づいて、選択工程を行い、変異細胞を濃縮又は枯渇させて、目的の細胞核酸ライブラリーを含むscライブラリーを得ることができる。次いで、これらのライブラリーを、変異細胞のより深いゲノム特徴付けのための再シークエンシング工程に使用できる。
【0684】
いくつかの実施形態では、初期シークエンシングは、体細胞ドライバー変異領の標的化シークエンシングである。体細胞ドライバー変異は、それを発現している細胞に増殖優位性を与える突然変異であり、これらの細胞は、がんの進化の間に正に選択され得る。いくつかの実施形態では、初期シークエンシングは、がん/分子タイプを、複数の細胞核酸ライブラリー内の所与の固有の試料バーコードによってタグ付けされた個々の細胞核酸ライブラリーに割り当てる。いくつかの実施形態では、ドライバー変異に関連する固有の試料バーコードによってタグ付けされたライブラリーの選択後に、よりディープな再シークエンシングが行われる。
【0685】
いくつかの実施形態では、体細胞ドライバー変異は、KRAS G12における変異である。いくつかの実施形態では、初期シークエンシングは、KRAS G12の標的化シークエンシングである。いくつかの実施形態では、分析を行い、KRAS G12変異を有する個々の細胞核酸ライブラリーのUBCバーコードを決定する(
図7に示される)。いくつかの実施形態では、これらの目的のライブラリーの選択後、KRAS G12を有する細胞のプロファイルをよりよく理解するため、再シークエンシングは、よりディープなシークエンシング又は全ゲノムシークエンシングである。同様のプロトコルを使用して、任意の目的の他の変異を発現する細胞由来の配列データを選択し、評価することができる。
【0686】
いくつかの実施形態では、本方法は、腫瘍の進化を追跡するために使用される。本明細書で使用されるとき、「腫瘍の進化」は、経時的ながん細胞の特徴の変化を指し、腫瘍の進化の追跡は、細胞進化パターンを特徴付けることを含み得る。例えば、腫瘍は不均質であり、経時的に、特定の形質が経時的に選択されるにつれて、この腫瘍内の不均質性により、腫瘍特性の変化が考慮される。腫瘍特性の変化は、腫瘍がより速い増殖若しくは転移を有すること、又は所与の治療に対する耐性を有するように進化することを可能にし得る。
【0687】
例えば、対象の腫瘍が所与の化学療法に対する耐性を獲得する場合、この薬剤による治療は、もはや腫瘍増殖を遅延又は停止するように作用しない可能性がある。本明細書に記載される方法を使用して、所与の治療に対する耐性の存在又は獲得を評価するために、目的の細胞をディープにシークエンシングするために選択することができる。このようにして、対象の治療計画は、対象にとって有効である可能性が高い治療に焦点を当て、有効である可能性が低い治療を回避するように最適化することができる。
【0688】
C.メタゲノミクス的使用
本方法は、メタゲノミクスのために使用され得る。本明細書で使用されるとき、「メタゲノミクス」は、環境試料から直接回収された遺伝物質の研究を指す。いくつかの実施形態では、これらの環境試料は、2種類以上の微生物を含む。本明細書で使用されるとき、微生物は、細菌、ウイルス、真菌、又は他の小生物を含み得る。例えば、メタゲノミクス試料は、微生物群(様々な細菌など)を含み得る。
【0689】
いくつかの実施形態では、メタゲノミクス分析は、生物の培養を回避する。言い換えれば、メタゲノミクス試料は、最初にそれらを培養して人工的に成長させることなく評価することができる。培養を回避することにより、培養中で十分に増殖しない生物に対する淘汰圧を回避することができる。更に、培養を回避することは、適切な培養条件など、目的の微生物についての知見がほとんどない場合、特に重要であり得る。そうでなければ、目的の微生物は、培養条件によって選択され得、他の微生物培養がより良好に培養される場合、シークエンシングの前に混合集団から失われ得る。
【0690】
従来の方法では、希少で培養不可能な微生物のデノボアセンブリ及び種同定はほぼ不可能である(Malmstrom and Eloe-Fadrosh mSystems 4:e00118-19(2019)参照)。従来のアプローチは、細胞分配(すなわち、FACS、マイクロフルイディクス)によって単一の増幅されたゲノム(SAG)を分離し、続いてセル溶解及び全ゲノム分析を行うことを含んでいた(アプローチ1)。別のアプローチは、メタゲノムアセンブルゲノム(MAG)分析、カバレッジによる差次的ビニングを使用するショート/ロングリードショットガンシークエンシング、及びテトラヌクレオチド頻度の分析であった(アプローチ2)。別のアプローチは、「ミニメタゲノム」ハイブリッドアプローチ(Quake lab、MetaSort)である(アプローチ3)。
【0691】
しかしながら、当該技術分野におけるこれらのアプローチは、多様性が低い試料中の豊富な種のアセンブリ及び種同定に最も適している。多様性とは、試料内の異なる種の数を意味し得る。言い換えれば、従来のメタゲノミクス法は、多様性の高い試料中にあまり見られない、つまり希少な種のアセンブリ及び種同定についての使用が制限されてきた。
【0692】
例えば、アプローチ1は、豊富な種を枯渇させ、希少な種を濃縮するために、分類可能な表現型である経験的な知識を用いてのみ扱うことができる。更に、アプローチ1の細胞分配は、濃縮可能又は分割可能な特徴がない場合には実行することができない。加えて、全ての先行技術の方法は、マイクロバイオーム試料を完全に特徴付けるため法外なシークエンシングコストを伴う可能性がある。
【0693】
対照的に、本方法は、初期シークエンシングに基づいて所望の試料を選択するために使用され得る。これらの所望の試料は、メタゲノミクス試料内の目的の微生物由来の細胞核酸ライブラリーであり得る。選択後、濃縮又は枯渇により、これらの目的の微生物に関するよりディープな配列データを提供するために再シークエンシングを行うことができる。
【0694】
いくつかの実施形態では、本方法は、マイクロバイオーム試料中の各生物のDNA(RNA)を一意的にバーコード化し、その結果、初期シークエンシング及び分析後に、所望の細胞核酸ライブラリーの濃縮又は不要な細胞核酸ライブラリーの枯渇について、物理的にアドレス可能である。
【0695】
いくつかの実施形態では、初期シークエンシングは、標的化シークエンシングに焦点を合わせる。いくつかの実施形態では、初期シークエンシングは、リボソームRNA又はDNA(rRNA又はrDNA)シークエンシングである。いくつかの実施形態では、初期シークエンシングは、16S、18S、又は内部転写スペーサーシークエンシングである。いくつかの実施形態では、初期シークエンシングは、複数の細胞核酸ライブラリー内の所与のバーコードによってタグ付けされた細胞RNA/DNAに分類群レベルの識別を割り当てる。いくつかの実施形態では、この標的化シークエンシングは、原核生物16s rDNA又はrRNAシークエンシングである。16s rRNAの可変領域のシークエンシングは、多様な微生物集団における属又は種などの系統分類のために頻繁に使用される。
【0696】
いくつかの実施形態では、初期シークエンシング反応が行われ、その後、16s rDNA分析から豊富な種/分類群の決定などの分析が行われる(そのような標的化シークエンシングの例については
図7を参照されたい)。例えば、初期シークエンシングは、全ての細胞核酸ライブラリーについての16s rRNAシークエンシングであってよく、その後、選択工程後に所望の細胞核酸ライブラリーの全ゲノムシークエンシングが続く。このような方法は、目的の微生物由来のライブラリーにディープシークエンシングを集中させることによって、時間及び費用を節約することができる。
【0697】
いくつかの実施形態では、初期シークエンシングは、連続性保存転位シークエンシングを使用して行われる。いくつかの実施形態では、連続性保存転位シークエンシングは、試料が、抽出後にかなりの量のインタクトな単一染色体又は高分子量ゲノムを含む場合に使用される。
【0698】
いくつかの実施形態は、メタゲノミクスを使用して、患者から採取された試料を評価することができる。いくつかの実施形態では、試料は、未知の感染症の症状を示す患者から採取され得る。いくつかの実施形態では、試料は、マイクロバイオーム試料(対象のマイクロバイオームを評価するための糞便試料など)であってもよい。本明細書で使用されるとき、マイクロバイオーム試料は、ヒト組織又は生体液の上又は中に存在する微生物叢の集合体を指す。
【0699】
D.免疫学的使用
いくつかの実施形態では、本方法は、免疫学的分析のために使用される。いくつかの実施形態では、方法は、T細胞クローン型を評価するために使用される。所与の個体のT細胞クローン型の組成は、T細胞レパートリーと称され得る。いくつかの実施形態では、初期シークエンシングは、TCRレパートリーを特徴付ける。いくつかの実施形態では、選択工程は、豊富なT細胞クローン型を枯渇させる。いくつかの実施形態では、再シークエンシングは、一般的ではないT細胞クローン型のよりディープなシークエンシングのために使用される。
【実施例】
【0700】
実施例1.Sci-RNA3ライブラリー又は他のscライブラリーからの濃縮
単一細胞ライブラリー(scライブラリー)を生成する広範な異なる手段が、当該分野で既知である。本発明の方法は、ライブラリー断片に含まれる特定のインデックスに基づいて、scライブラリーを生成するこれらの異なる方法のいずれかと共に使用され得る。
【0701】
例えば、単一細胞シークエンシングライブラリーは、
図4に示されるように、sci-RNA-seq3を使用して生成され得る(Cao et al.,Nature 566(7745):496-502(2019)参照)。この方法は、i5及びi7インデックスと共に、RTインデックス(BCRT)及びライゲーションアダプタインデックス(BCLIG)を利用する。i5及びi7インデックスは、市販の96個のユニークアダプタのセット(Illumina)である。
【0702】
RTインデックスは、ヘアピンアダプタインデックス(oligoTp)と組み合わせることができる。複数のインデックスは、同一のUMI、RTインデックス、ライゲーションアダプタインデックス、及びタグメンテーション部位を有するリードに基づいて重複を除去するなど、リードの逆多重化を可能にする。
図4は、黒色の楕円形:BCRT(10ヌクレオチド)、BCLIG(10ヌクレオチド)、i5(8ヌクレオチド)、及びi7として使用される異なるインデックス(すなわち、バーコード)を示す。
【0703】
様々な異なる手段が、sc-RNA-seq3法(Sci-RNA3)によって生成されたscライブラリーと共に濃縮のために使用され得る。
【0704】
第1に、i7選択を回避するプローブ捕捉アプローチが使用され得る。i5、BCLIG、及びBCRTインデックスに含まれるヌクレオチドに基づいて、合計28塩基が、捕捉プローブを開発するための特異的ハイブリダイゼーション塩基を表し、合計67ヌクレオチドが、ハイブリダイゼーションに利用可能である(R1プライマーの33ヌクレオチド及び固定領域の6ヌクレオチドを含む)。この計算において、捕捉プローブは、UMI配列に結合するためのユニバーサル配列を含む。
【0705】
第2に、ネステッドPCRアプローチが使用され得る。このアプローチにおいて、所望の試料の濃縮のためのPCRは、選択されたi5、BCLIG、及びBCRTインデックスに結合するプライマーと共にi7プライマーを用いて行われる。このアプローチでは、BCRTを使用するネステッドPCRアプローチが得られるPCR産物中にUMI配列を保持するように、ライブラリー断片中のBCRT及びUMIの位置を交換するようにライブラリーを設計することができる。
【0706】
第3に、組み合わせアプローチを使用することができる。組み合わせアプローチでは、プローブ捕捉濃縮工程の後に、i7特異的PCR濃縮工程が続く。
【0707】
これらの特定のアプローチは、sci-RNA-seq3ライブラリーの設計を使用するが、他のタイプのscライブラリーにおいて使用されるバーコード/インデックスもまた、濃縮工程のために活用され得る。これらのscライブラリーには、BioRad-ddSEQ、10X Genomics、InDrop、Drop-Seq、及びSplit-Seqが含まれる。
図4に示すように、ライブラリーの特定のバーコード構造(異なるバーコード領域内のヌクレオチドの数を含む)を使用して、濃縮プロトコルを設計することができる。当業者は、種々の方法に関する情報を使用して、初期シークエンシングのために使用される特定のscライブラリーに基づいて、濃縮のための最も適切なアプローチを設計し得る。
【0708】
実施例2.連続バーコードを含むライブラリー断片を生成するための改変SCI-seqアプローチ
改変されたSCI-seqアプローチを用いて、
図5に示されるように、連続バーコードを含む単一細胞RNA/DNA NGSライブラリーを生成できる。
【0709】
第1の工程では、BC1バーコードを組み込むために、BC1配列を含むトランスポゾンを有するTn5トランスポザーゼを含むトランスポソーム複合体を用いてタグメンテーションを行う。細胞又は核を反応ウェルに分配する。出発標的核酸がRNAである場合、cDNA合成を実施して、第1鎖及び第2鎖を生成する。ウェル特異的バーコード(BC1バーコード)を用いてタグメンテーションを実施する。DNAをウェル全体からプールする。ギャップ修復を行い(3’フィルイン)、続いて5’リン酸化及び3’Aテール末端の生成を行う。
【0710】
第2の工程では、1つ以上のバーコード(BC2、...、BCx)を用いてT/Aライゲーションを行う。これらのバーコードはランダムでなくてもよい。この工程では、核又は細胞を反応ウェルに再分配し、続いてウェル特異的バーコード(BC2バーコード)を用いてTテールアダプタをライゲーションする。DNAをウェル全体からプールし、続いて5’リン酸化及び3’Aテールの生成を行った。あるいは、ライブラリー断片は、その後のC/GライゲーションのためのC/Gオーバーハングを有し得る(その他全てのバーコード化工程に使用される)。これらの工程は、必要に応じて、複数のバーコード化工程で繰り返される。
【0711】
第3の工程では、T/Aライゲーションを実施して、BCnバーコードを有する所望の断片を生成する。この工程では、核又は細胞を反応ウェルに再分配し、Tテール付きY型アダプタをウェル特異的バーコードとライゲーションする。次いで、DNAをウェル全体からプールし、試料インデックスを用いてPCRを行った。
【0712】
scライブラリー生成の間、ライブラリーは完全に構築される必要はない。短い非対称末端は、ハイブリダイゼーション及び/又はPCR結果の特異性を改善することができる。
【0713】
次いで、得られたライブラリーは、初期シークエンシングのために使用され得、その後、ライブラリー断片中に存在する連続バーコードに基づいて濃縮又は枯渇され得る。連続バーコードの存在は、プライマーが完全な連続バーコードにわたって設計できるため、PCRによる後の濃縮を改善し得る。
【0714】
実施例3.メタゲノミクス試料中に分配した微生物細胞と共に使用する方法
本方法は、生物が培養されていない生物ゲノムアセンブリなどのメタゲノミクスに使用することができる。これらの生物は、患者から採取された試料中にあるものなどの微生物細胞であってもよい。
【0715】
この方法のために、細胞をウェルに分配し、タグメンテーションによりBC1(のみ)を挿入する。DNAをプールした後、伸長して平滑末端化し、A-テールを生成する。試料を適切なDNAの希釈物に分配する。
【0716】
次に、BC2を含むTテールアダプタを用いてT/Aライゲーションを実施する。DNAをプールし、伸長を行って平滑末端化し、Aテールを生成する。これらの工程を繰り返して、所望の数のバーコード(BCn)を組み込む。
【0717】
最後のライゲーションのために、フォーク型アダプタを添加し、続いてPCRを行ってi5/i7及びP5/P7配列を追加する。P5及びP7配列は、Illuminaプラットフォームを使用するシークエンシング法に有用であるが、シークエンシングが他のプラットフォームで行われる場合、他の配列が追加されてもよい。
【0718】
初期シークエンシング反応を行い、続いて分析を行う。分析は、全ゲノムアセンブリ又はリボソームDNA(rDNA)分析から豊富な種/分類群を決定することを含み得る。例えば、初期シークエンシングは、16s rDNA(又はrRNA)シークエンシングであってよい。rDNA又はrRNAについての初期シークエンシングは、この工程に必要な時間及び資源を低減することができ、これらのデータは、豊富な種又は分類群を同定するのに十分であり得る。
【0719】
あるいは、試料中の微生物のほとんどが、抽出後にインタクトな単一染色体又は高分子量ゲノムDNAを含む場合、連続性保存転位シークエンシング(CPT-seq、Illumina)がシークエンシングに適切であり得る。CPT-seq及びコンビナトリアルインデックス付けの使用は、ゲノム全体のハプロタイピングを可能にする(Amini et al.,Nat Genet.46(12):1343-1349(2014)参照)。このアプローチは、合成連結ロングリードライブラリーに適用することができる。連結ロングリードライブラリーは、(ショートリードで)シークエンシングされ、例示的な親となる「ロング」分子を同定するDNAバーコードは、複合ライブラリーからの濃縮又は枯渇のために標的化され得、その後、二次シークエンシングされる。例えば、メタゲノム試料を用いた作業において、原核生物は約1個の染色体を有し、したがって、CPT-seqなどの連結ロングリードシークエンシング法は、希少種の特徴付け及び分解されたデノボアセンブリに有用であり得る。
【0720】
初期シークエンシングは、濃縮又は枯渇に関する目的の種/分類群についてのデータを生成し得る。例えば、特異的プローブ又はCas9-ガイドRNAを、豊富な種分類群のUBCに対して設計して、目的のより希少な種/分類群に集中させるためにそれらを枯渇させることができる。豊富な種の枯渇は、豊富な種に関連付けられたバーコードに基づくハイブリッド捕捉又はCRISPR消化によって行われ得る。
【0721】
選択後、残りのライブラリーをユニバーサルプライマー(P5/P7)で再増幅することができる。次に、再シークエンシングを行うことができる。
【0722】
所望であれば、豊富な種/分類群の同定を複数回行った後、別の枯渇工程を行うことができる。同定及び枯渇プロセスは、メタゲノミクスの特徴付け基準が満たされるように、配列データにおいて豊富な種/分類群の十分な枯渇が見られるまで繰り返すことができる。
【0723】
所望であれば、初期シークエンシングがrDNA又はrRNA分析に焦点を当てていた場合、全ゲノムシークエンシングを再シークエンシングとして行ってもよい。そのような場合、初期シークエンシングはリボソームシグナルに焦点を当てることができ、一方、最後の再シークエンシングは、目的のより希少な種又は分類群に関するより包括的なデータを提供する。
【0724】
実施例4.物理的にアドレス可能なバーコード及び標的化シークエンシングを用いたNGSライブラリー構築
方法はまた、
図6に示されるように、別個の遊離工程を伴う転位反応を使用して、物理的にアドレス可能なバーコードを生成するために使用され得る。
【0725】
細胞、核、又はHMW DNAを反応ウェルに分配する。次いで、細胞又は核を、必要に応じて溶解して、調製のためにDNAを利用可能にし得る。転移は、第1のバーコードを有するトランスポザーゼ(BC1を有するTn5)を用いて行う。この工程は、ウェル特異的な第1のバーコードを有するタグを組み込むが、トランスポザーゼは遊離されない。次いで、DNAをウェル全体からプールすることができる。固定された2段階バーコード化スキームを用いる高い細胞スループットに対応するために、本方法は、反応ウェル当たりより多くのバーコードを組み込んでもよい。
【0726】
次いで、DNAを反応ウェル中に再分配し、トランスポザーゼを遊離させる。ギャップ充填(3’伸長)及び5’リン酸化を行い、3’Aテール末端を付加する。ウェル特異的な第2のバーコード(BC2)とのTテール付きY型アダプタのライゲーションを実施する。DNAをウェル全体からプールし、試料インデックスに基づいてPCRを行う。ライブラリーは、この工程で完全に構築される必要はなく、というのも、短い非対称末端は、プライマーのハイブリダイゼーション及び/又はPCR反応の特異性を改善できるからである。
【0727】
実施例5.リコンビナーゼ媒介標的化転位
配列特異的転位は、リコンビナーゼコーティングされた標的化オリゴヌクレオチドを含むトランスポソーム複合体によって媒介され得る。
図9に示すように、ゲノムDNAを含む試料を、リコンビナーゼでコーティングされた標的化オリゴヌクレオチドを含むトランスポソーム複合体と組み合わせる。
【0728】
リコンビナーゼでコーティングされたオリゴヌクレオチドは、相補的配列が標的DNA(
図9のゲノムDNAの白い部分)中に見出されるまで、二本鎖DNA(dsDNA)に沿って「スキャン」する。この時点で、リコンビナーゼは、ストランド侵入を容易にして、このオリゴヌクレオチドをdsDNA構造内に配置する(Dループ形成を介して)。このプロセスは、トランスポソーム複合体を標的配列に極めて接近させ、その後の転位は、ストランド侵入部位の近くにトランスポゾン配列を挿入する。
【0729】
リコンビナーゼを有するトランスポソームを介する標的化転位は、以下のように実施することができる。最初に、トランスポソームオリゴヌクレオチドの第1のセットを、5μLの10×TEN緩衝液(100mM Tris pH8、10mM EDTA、250mM NaCl)を17.5μLの配列番号1のオリゴヌクレオチド及び27.5μLの配列番号2のオリゴヌクレオチドと合わせることによってアニーリングする。配列番号2のオリゴヌクレオチドは、95℃に10分間加熱し、次いで0.1℃/秒のランプ速度で10℃に冷却するプロセスによって、配列番号1のオリゴヌクレオチドに(3’から5’の方向で)アニールすることができる。
【0730】
同様に、アニーリングされたオリゴヌクレオチドの第2のセットは、配列番号3及び4のオリゴヌクレオチドをアニーリングすることによって生成され得る。
【0731】
アニーリングされたオリゴヌクレオチドに、以下のプロトコルを用いてトランスポザーゼTn5を追加することができる。14.28μLの35μMアニーリングされたオリゴヌクレオチド、15.9μLの95.6μM tsTn5酵素、及び220μLの50%グリセロール保存緩衝液を合わせ、37℃で一晩インキュベートする。更に250μLの50%グリセロール保存緩衝液を添加し、必要になるまで-20℃で保存することができる。
【0732】
次に、リコンビナーゼをDNAに添加し、続いてタグメンテーションすることができる。リコンビナーゼを使用して、オリゴヌクレオチド対の結合を可能にするストランド侵入を介した一本鎖DNAの領域を生成することができる。10μLのTn5を有するオリゴヌクレオチド「1」(配列番号1及び2のアニール対)と10μLのTn5を有するオリゴヌクレオチド「2」(配列番号3及び4のアニール対)、10μLの5×緩衝液(250mM Tris pH7.6、50mM MgCl2、25mM DTT、2.5mM ATP)、0.5μgのDNA、2μLの2μg/μL RecA、及び17.5μLのH2O(総体積50μL)を合わせ、穏やかに混合し、37℃で1時間インキュベートし得る。
【0733】
次いで、10μLのSTOP緩衝液(1%SDS)を添加し、1600rpmで1分間ボルテックスし、室温で5分間インキュベートすることによって、反応を停止できる。
【0734】
サイズ選択は、2.5×SPRIビーズを用いて行うことができる。150μLのSPRIビーズをチューブに加え、室温で5分間インキュベートする。TWB洗浄緩衝液を使用して洗浄を2回行い、続いてTWB洗浄緩衝液を除去する。
【0735】
次に、PCRライブラリー増幅を実施する。20μLのEPMミックス(Illumina)、20μLのH2O、及び10μLのP5-A14/P7-B15プライマーミックス(H2O中2μMの各プライマー)を洗浄したビーズに添加する。次いで、反応物を、以下のようにプログラムされたPCR装置上に置く:68℃で3分間、98℃で3分間、98℃で45秒間、62℃で30秒間、及び68℃で2分間を8サイクル、68℃で1分間、最後に4℃で保持。
【0736】
実施例6.一本鎖核酸及び標的化オリゴヌクレオチドを使用する標的化転位
トランスポザーゼは、二本鎖DNAなどの二本鎖DNAの転位を媒介することができる。方法を使用して、一本鎖標的核酸内の二本鎖DNAの領域を選択的に生成することができる。この一本鎖核酸は、二本鎖核酸を変性させることによって生成され得る。
【0737】
図10に示すように、標的化オリゴヌクレオチドは、標的化オリゴヌクレオチドが目的の配列に完全に又は部分的に相補的である場合など、一本鎖核酸内の目的の配列にハイブリダイズすることができる。この実施形態では、標的化オリゴヌクレオチドは、リコンビナーゼによるコーティングを必要とせず、標的化オリゴヌクレオチドは、いかなる方法でもトランスポソームに連結される必要はない。
【0738】
標的化オリゴヌクレオチドによって結合される一本鎖核酸の領域は、このとき二本鎖である。トランスポソーム複合体が添加されると、それは二本鎖領域に結合するように進行し、次いでタグ付き断片を生成することができる。言い換えれば、標的化オリゴヌクレオチドのハイブリダイゼーション後、次いで、標準的なトランスポソームを使用することができ、標的DNAがハイブリダイゼーションを介して二本鎖にされた場所にのみ挿入すべきである。このようにして、標的化オリゴヌクレオチドは、標的核酸から目的とする特定の領域を含むタグ付き断片を生成するために使用され得る。
【0739】
標的化オリゴヌクレオチドを使用してタグメンテーションを媒介する代表的な方法が提供される。2μLの配列番号5及び6を含むオリゴヌクレオチド(100μMストック)を、500ngのゲノムDNA(例えば、PhiX)に添加する。反応物を、1×TEN緩衝液(10mM Tris pH8、1mM EDTA、25mM NaCl)で50μLの最終量に希釈する。反応物を95℃に5分間加熱してDNAを変性させ、次いで0.1℃/秒のランプ速度で10℃に冷却する。
【0740】
次に、DNAをタグメンテーションする。10μLのNextera Tn5#1、10μLのNextera Tn5#2、10μLの5×タグメンテーション緩衝液、及び20μLの上記工程のアニーリングされたオリゴヌクレオチド+DNAを合わせる。反応物を41℃で5分間インキュベートし、続いて10℃で保持する。次いで、10μLのSTOP緩衝液(1%SDS)を添加し、1600rpmで1分間ボルテックスし、室温で5分間インキュベートすることによって、反応を停止する。
【0741】
サイズ選択は、2.5×SPRIビーズを用いて行う。150μLのSPRIビーズをチューブに加え、室温で5分間インキュベートする。TWB洗浄緩衝液を使用して反応物を2回洗浄し、続いてTWB洗浄緩衝液を除去する。
【0742】
最後に、PCRを用いてライブラリーを増幅する。20μLのEPMミックス(Illumina)、20μLのH2O、及び10μLのP5-A14/P7-B15プライマーミックス(H2O中2μMの各プライマー)を添加する。反応物を、以下のようにプログラムされたPCR装置上に置く:68℃で3分間、98℃で3分間、98℃で45秒間、62℃で30秒間、及び68℃で2分間を8サイクル、68℃で1分間、4℃で保持。
【0743】
実施例7.ジンクフィンガーDNA結合ドメインを用いた無細胞DNAの標的化転位
図15に概説されるように、cfDNAを用いて配列特異的転位を行うこともできる。cfDNAを含む血漿試料を、ジンクフィンガーDNA結合ドメインを含む標的化されたトランスポソーム複合体と混合することができる。ジンクフィンガーDNA結合ドメインは、
図15に示されるようにジンクフィンガーヌクレアーゼ(ZFN)に含まれてもよく、このときZFNは触媒的に不活性であってもよい。更に、トランスポソーム複合体は、固体支持体への固定化を可能にするように設計することができる(例えば、5’末端にビオチンを含む第1のトランスポゾン、又は3’末端にビオチンを含む第2のトランスポゾンを用いて)。
【0744】
ジンクフィンガーDNA結合ドメインは、目的とする特定のDNA配列、例えば、ユーザがシークエンシングを望む遺伝子内又はそのすぐ近くの配列に結合し得る。この結合は、cfDNAがヒストンに結合している間に(すなわち、プロテアーゼによるcfDNAの前処理なしに)起こり得る。標的化されたトランスポソーム複合体によって媒介されるタグメンテーションの後、標的化cfDNAライブラリーをストレプトアビジンビーズに結合させる。ギャップ充填及びライゲーションの後、cfDNAから生成された標的化ライブラリーは、固体支持体から遊離され得るか、又は固体支持体上で増幅及び/若しくはシークエンシングされ得る。
【0745】
cfDNAからライブラリーを生成する他の手段に対するこの方法の利点は、タグメンテーションの前にヒストンを除去するためのプロテアーゼ工程を回避するこの方法の容易さである。プロテアーゼはトランスポソーム複合体内のトランスポザーゼに干渉するため、cfDNAからヒストンを除去するための任意のプロテアーゼ工程の後に、プロテアーゼを除去するための洗浄又は他の工程が続く必要がある。このようにして、
図15に概説される方法は、ユーザのための改善された容易さ及び速度を提供する。
【0746】
更に、標的化されたトランスポソームの使用は、他のタイプの濃縮工程の必要性を回避することができる。標的化されたトランスポソーム複合体中のジンクフィンガーDNA結合ドメインは、目的の配列を特異的に標的とすることができる。例えば、ジンクフィンガーDNA結合ドメインを含む標的化されたトランスポソームは、遺伝病に関連することが知られている遺伝子の配列を含む断片のライブラリーを生成することができる。このようにして、妊娠患者の血漿中のcfDNAを使用して、遺伝病に関連する遺伝子の配列を含む標的化ライブラリーを生成して、遺伝子における胎児突然変異の潜在的な存在を評価することができる。同様に、がん患者の血漿由来のcfDNAを使用して、腫瘍抑制遺伝子及びがん遺伝子の配列を含む標的化ライブラリーを生成して、予後不良に関連する突然変異が存在するかどうかを決定することができる。
【0747】
実施例8.ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮
ライブラリー調製後に別個の濃縮工程を使用する特定の遺伝子の標的化シークエンシングは、時間がかかる場合がある。例えば、このような別個の濃縮工程は、オリゴヌクレオチドプローブをライブラリーDNAにハイブリダイズさせることと、ストレプトアビジンでコーティングされたビーズ上でハイブリダイズしたDNAを単離することと、を包含し得る。効率及び必要な時間が著しく改善されているものの、そのような別個の濃縮プロトコルは、約2時間と多くの試薬及び工程を要する場合があり、そのようなプロトコルの自動化を困難にし得る。
【0748】
比較すると、本明細書に開示される方法を使用して、調製及び濃縮の両方について単一工程を使用する、特定の遺伝子の標的化シークエンシングのためのライブラリーの調製及び濃縮ができる。例えば、
図16A~
図16Bは、ShCAST(Scytonema hofmanni CRISPR関連トランスポザーゼ)標的化ライブラリー調製及び濃縮のための例示的な組成物及びプロセスにおける操作を概略的に示す。ShCASTは、Cas12kと、ガイドRNA(gRNA)を用いてE.coliゲノム中の特定の部位にDNAを挿入することができるTn7様トランスポザーゼとを含む。これらのgRNAは、周知の設計アルゴリズムを使用して、標的核酸中の1つ以上の目的の配列に対する親和性を伴って生成され得る。
【0749】
これらの方法は、特定の遺伝子の標的化された断片化及び増幅のために、ShCAST又はTn5トランスポザーゼを組み込んだ改変バージョンのShCAST(ShCAST-Tn5)を利用することができる。このように、ライブラリー調製及び濃縮工程が組み合わされる。組み合わされたプロトコルは、標的ライブラリーシークエンシングワークフローを簡略化し、その効率を改善する。組み合わされたプロトコルはまた、工程及びユーザタッチポイントの数を低減し、したがって、自動化を促進することができる。
【0750】
例示的な方法において、gRNAは、特定の遺伝子(目的の配列)を標的化するように設計されてもよく、標的核酸内のgRNAの結合部位間の間隔は、挿入サイズを制御するために使用されてもよい。言い換えれば、gRNAは、トランスポソーム複合体の標的化をもたらす標的核酸内の配列に結合して、所望のサイズの挿入(すなわち、二本鎖DNA断片)を生成するように設計することができる。gRNA及び/又はShCAST/ShCAST-Tn5はビオチン化されていてもよい。
図16Aに例示されるような様式で、gRNA及びアダプタ(例えば、増幅及び/又はシークエンシング法に有用な配列を含むIlluminaアダプタ)を有する転移性エレメントをShCASTのトランスポザーゼに含ませ、複合体6000を得ることができる。
図16Bのプロセスフロー6010に例示されるような様式で、得られたShCAST/ShCAST-Tn5複合体は、複合体が標的DNA中のそれぞれの配列に結合することを可能にしながら、タグメンテーションを阻害する流体条件下(例えば、低マグネシウム又は無マグネシウム)でゲノム配列と混合され得る。次いで、ビオチン化gRNA及び/又はShCAST/ShCAST-Tn5がカップリングされるストレプトアビジンビーズを使用して、複合体を単離することができる。例えば、オフターゲットタグメンテーションを低減又は最小化するために、任意の非結合DNAを洗い流してもよい。次いで、流体条件を変更して(例えば、マグネシウムを十分に増加させて)、タグメンテーションを促進することができる。シークエンシングのための調製においてビーズからライブラリーを遊離させるために、ギャップ充填ライゲーション工程とそれに続く熱解離を使用することができる。
【0751】
図16A~
図16Bに例示されるような組成物及び操作において、複合体のトランスポザーゼ部分もまた、DNAにランダムに挿入することが可能であり得ることに留意されたい。そのような挿入は、ShCAST/ShCAST-Tn5複合体を、タグメンテーションを阻害することによって、標的が結合されることを可能にする流体条件下(例えば、低マグネシウム又は無マグネシウム)でゲノムDNAと混合することによって阻害又は最小化され得る。
【0752】
内部にCas12K及びTn7を含むShCASTに関する更なる詳細については、その全内容が参照により本明細書に組み込まれる、Strecker et al.,「RNA-Guided DNA insertion with CRISPR-associated transposases」,Science 365(6448):48-53(2019)を参照されたい。
【0753】
均等物
前述の明細書は、当業者が実施形態を実践することを可能にするのに十分であると考えられる。前述の説明及び実施例は、特定の実施形態を詳細に詳述し、本発明者らによって想到される最良の様式を説明する。しかしながら、前述の内容が本文にどれほど詳細にあらわれていても、実施形態は多くの方法で実施することができ、添付の特許請求の範囲及びその任意の均等物に従って解釈されるべきであることが理解されるであろう。
【0754】
本明細書で使用するとき、約という用語は、明示的に示されているか否かにかかわらず、例えば、整数、割合、及び百分率を含む数値を指す。用語は、一般に、当業者が列挙された値(例えば、同じ機能又は結果を有する)と同等であると考えられる数値の範囲(例えば、列挙された範囲の±5~10%)を指す。少なくとも及び約などの用語が数値又は範囲のリストの前にある場合、その用語はリスト内に提供される値又は範囲の全てを変更する。場合によっては、約という用語は、最も近い有効数字に丸められた数値を含んでもよい。
【配列表】
【国際調査報告】