(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023075143
(43)【公開日】2023-05-30
(54)【発明の名称】低減した増幅バイアスによるハイスループット単一細胞シークエンシング
(51)【国際特許分類】
C12Q 1/02 20060101AFI20230523BHJP
C12Q 1/6844 20180101ALI20230523BHJP
C40B 40/06 20060101ALN20230523BHJP
C12Q 1/6806 20180101ALN20230523BHJP
C12N 15/11 20060101ALN20230523BHJP
【FI】
C12Q1/02
C12Q1/6844 Z
C40B40/06 ZNA
C12Q1/6806 Z
C12N15/11 Z
【審査請求】有
【請求項の数】9
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023025703
(22)【出願日】2023-02-22
(62)【分割の表示】P 2019569897の分割
【原出願日】2019-05-17
(31)【優先権主張番号】62/821,864
(32)【優先日】2019-03-21
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/673,023
(32)【優先日】2018-05-17
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】500358711
【氏名又は名称】イルミナ インコーポレイテッド
(71)【出願人】
【識別番号】517421758
【氏名又は名称】ユニバーシティ・オブ・ワシントン
【氏名又は名称原語表記】UNIVERSITY OF WASHINGTON
(74)【代理人】
【識別番号】100106518
【弁理士】
【氏名又は名称】松谷 道子
(74)【代理人】
【識別番号】100122301
【弁理士】
【氏名又は名称】冨田 憲史
(74)【代理人】
【識別番号】100157956
【弁理士】
【氏名又は名称】稲井 史生
(74)【代理人】
【識別番号】100170520
【弁理士】
【氏名又は名称】笹倉 真奈美
(72)【発明者】
【氏名】ジャイ・シェンデュア
(72)【発明者】
【氏名】イン・イー
(72)【発明者】
【氏名】フランク・ジェイ・スティーマーズ
(57)【要約】 (修正有)
【課題】複数の細胞からの核酸を含むシークエンシングライブラリーを調製するための方法を提供する。
【解決手段】(a)複数の細胞からの単離された核を提供する工程;(b)第1の複数のコンパートメントに単離された前記核を分配する工程であって、各コンパートメントが単離された核のサブセットを含む、工程、及び各サブセットをトランスポソーム複合体と接触させる工程であって、各コンパートメントの中の前記トランスポソーム複合体が、トランスポザーゼ、他のコンパートメントの中の第1のインデックス配列と異なる第1のインデックス配列、及び少なくとも1つの遍在配列を含む、工程;(c)ヌクレオソームが枯渇された核の前記サブセットの中の核酸を複数の核酸断片に断片化し、前記第1のインデックス配列を前記核酸断片の少なくとも1つの鎖に組み込んでインデックス付きの核酸断片を含むインデックス付きの核を生成する工程;を含む、方法である。
【選択図】なし
【特許請求の範囲】
【請求項1】
複数の単一の核または細胞からの核酸を含むシークエンシングライブラリーを調製するための方法であって、
第1の複数のコンパートメントに複数の単離された核または細胞を提供する工程であって、
各コンパートメントは単離された核または細胞のサブセットを含み、
核または細胞は核酸断片を含む、工程と;
線形増幅媒介物を前記細胞または核に導入する工程と;
線形増幅によって前記核酸断片を増幅する工程と;
核または細胞の各サブセットを処理してインデックス付きの核または細胞を生成する工程であって、
前記処理は単離された前記核または細胞に存在する核酸断片に第1のコンパートメント特異的インデックス配列を加えて単離された核または細胞に存在するインデックス付きの核酸をもたらすことを含み、
前記処理は、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅または転位を含む工程と;
インデックス付きの前記核または細胞を合わせてプールされたインデックス付きの核または細胞を生成し、それによって複数の前記核または細胞からシークエンシングライブラリーを生成する工程と
を含む方法。
【請求項2】
前記増幅が前記処理の前に起こる、請求項1に記載の方法。
【請求項3】
前記処理が前記増幅の前に起こる、請求項1に記載の方法。
【請求項4】
複数の単一の核または細胞からの核酸を含むシークエンシングライブラリーを調製するための方法であって、
複数の単離された核または細胞を提供する工程であって、
核または細胞は核酸断片を含む、工程と;
線形増幅媒介物を単離された前記核または細胞に導入する工程と;
単離された前記核または細胞を第1の複数のコンパートメントに分配する工程であって、
各コンパートメントは単離された核または細胞のサブセットを含む工程と;
線形増幅によって前記核酸断片を増幅する工程と;
単離された核または細胞の各サブセットを処理してインデックス付きの核または細胞を生成する工程であって、
前記処理は単離された前記核または細胞に存在する核酸断片に第1のコンパートメント特異的インデックス配列を加えて単離された核または細胞に存在するインデックス付きの核酸をもたらすことを含み、
前記処理は、ライゲーション、プライマー伸長、増幅または転位を含む工程と;
インデックス付きの前記核を合わせてプールされたインデックス付きの核または細胞を生成し、それによって複数の前記核または細胞からシークエンシングライブラリーを生成する工程と
を含む方法。
【請求項5】
複数の単一の核または細胞からの核酸を含むシークエンシングライブラリーを調製するための方法であって、
複数の単離された核または細胞を第1の複数のコンパートメントに提供する工程であって、
各コンパートメントは単離された核または細胞のサブセットを含み、
核または細胞は核酸断片を含む、工程と;
核または細胞の各サブセットを処理してインデックス付きの核または細胞を生成する工程であって、
前記処理は、単離された前記核または細胞に存在する核酸断片に、(i)第1のコンパートメント特異的インデックス配列を加えて単離された核または細胞に存在するインデックス付きの核酸をもたらすこと、および(ii)線形増幅媒介物によって認識されるヌクレオチド配列を加えることを含み、
前記処理は、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅または転位を含む工程と;
線形増幅媒介物を前記細胞または核に導入する工程と;
線形増幅によって前記核酸断片を増幅する工程と;
インデックス付きの前記核または細胞を合わせてプールされたインデックス付きの核または細胞を生成し、それによって複数の前記核または細胞からシークエンシングライブラリーを生成する工程と
を含む方法。
【請求項6】
前記線形増幅媒介物がファージRNAポリメラーゼまたは線形増幅プライマーを含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項7】
前記核酸断片がT7プロモーターを含み、前記ファージRNAポリメラーゼがT7 RNAポリメラーゼを含む、請求項6に記載の方法。
【請求項8】
前記線形増幅媒介物を導入することが、前記線形増幅媒介物を単離された前記核または細胞に存在する核酸断片に加えることを含む、請求項6に記載の方法。
【請求項9】
各コンパートメントの複数の単離された前記核または細胞を所定の条件に曝露させることをさらに含む、請求項1または5に記載の方法。
【請求項10】
前記曝露の後に複数の前記細胞から核を単離することをさらに含む、請求項9に記載の方法。
【請求項11】
複数の単離された前記核または細胞を所定の条件に曝露させることをさらに含む、請求項4に記載の方法。
【請求項12】
単離された前記核の完全性を維持しつつヌクレオソームが枯渇された核を生成する条件に単離された前記核を付すことをさらに含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項13】
前記処理が、
各サブセットをトランスポソーム複合体と接触させる工程であって、
各コンパートメントの中の前記トランスポソーム複合体は、他のコンパートメントの中の第1のインデックス配列と異なる第1のインデックス配列を含む工程と;
前記サブセットの中の核酸を複数の核酸に断片化し、前記第1のインデックス配列を前記核酸の少なくとも1つの鎖に組み込んでインデックス付きの前記核酸を含むインデックス付きの前記核または細胞を生成する工程と
を含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項14】
前記処理が、
各サブセットを逆転写酵素および単離された前記核の中のRNA分子にアニールするプライマーと接触させる工程であって、各コンパートメントの中の前記プライマーは、他のコンパートメントの中の第1のインデックス配列と異なる第1のインデックス配列を含み、インデックス付きの前記核酸を含むインデックス付きの前記核または細胞を生成する工程
を含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項15】
前記接触させることが特異的ヌクレオチド配列にアニールする標的特異的プライマーをさらに含む、請求項14に記載の方法。
【請求項16】
前記第1のコンパートメント特異的インデックス配列を加える前記処理が、遍在配列を含むヌクレオチド配列を前記核酸断片に加え、次に前記第1のコンパートメント特異的インデックス配列を前記核酸断片に加える2工程法を含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項17】
前記加えることが前記遍在配列を含むトランスポソーム複合体を含む、請求項16に記載の方法。
【請求項18】
前記処理が、第1のインデックスを単離された前記核または細胞に存在するDNA核酸に加えること、第1のインデックスを単離された前記核または細胞に存在するRNA核酸に加えること、またはその組合せを含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項19】
前記の第1のインデックス配列をRNA核酸に加えることが、
各サブセットを逆転写酵素および単離された前記核または細胞の中のRNA分子にアニールするプライマーと接触させる工程であって、
各コンパートメントの中の前記プライマーは、前記第1のコンパートメント特異的インデックス配列を含み、インデックス付きの前記核酸を含むインデックス付きの前記核または細胞を生成する工程
を含む、請求項18に記載の方法。
【請求項20】
前記の第1のインデックス配列をDNA核酸に加えることが、
各サブセットをトランスポソーム複合体と接触させる工程であって、
各コンパートメントの中の前記トランスポソーム複合体は前記第1のコンパートメント特異的インデックス配列を含む工程と;
前記サブセットの中の核酸を複数の核酸に断片化し、前記第1のコンパートメント特異的インデックス配列を前記核酸の少なくとも1つの鎖に組み込んでインデックス付きの前記核酸を含むインデックス付きの前記核または細胞を生成する工程と
を含む、請求項18に記載の方法。
【請求項21】
各コンパートメントにおいてDNA核酸に加えられる前記第1のインデックス配列およびRNA核酸に加えられる前記第1のインデックス配列が同一である、請求項19に記載の方法。
【請求項22】
各コンパートメントにおいてDNA核酸に加えられる前記第1のインデックス配列およびRNA核酸に加えられる前記第1のインデックス配列が同一でない、請求項19に記載の方法。
【請求項23】
前記核酸断片の指数関数的増幅をさらに含み、前記指数関数的増幅は特異的ヌクレオチド配列にアニールする標的特異的プライマーを含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項24】
前記合わせることの後に、
プールされたインデックス付きの前記核または細胞のサブセットを第2の複数のコンパートメントに分配する工程と;
第2のコンパートメント特異的インデックス配列をインデックス付きの核酸に導入して二重インデックス付きの核酸を含む二重インデックス付きの核または細胞を生成する工程であって、
前記導入することは、ライゲーション、プライマー伸長、増幅または転位を含む工程と
をさらに含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項25】
二重インデックス付きの前記核を合わせてプールされた二重インデックス付きの核または細胞を生成する工程と、
プールされた二重インデックス付きの前記核または細胞のサブセットを第3の複数のコンパートメントに分配する工程と;
第3のコンパートメント特異的インデックス配列をインデックス付きの核酸に導入して三重インデックス付きの核酸を含む三重インデックス付きの核または細胞を生成する工程であって、
前記導入することは、ライゲーション、プライマー伸長、増幅または転位を含む工程と
をさらに含む、請求項24に記載の方法。
【請求項26】
メチル化分析のためにインデックス付きの前記核または細胞を処理してメチル化分析のために適する核酸断片を生成することをさらに含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項27】
インデックス付きの前記核または細胞を近接性ライゲーションに付してクロマチン高次構造の分析のために適する核酸断片を生成することをさらに含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項28】
前記シークエンシングライブラリーの前記核酸断片を増幅してDNAナノボールを生成することをさらに含む、請求項1、4または5のいずれか一項に記載の方法。
【請求項29】
前記コンパートメントがウェルまたは液滴を含む、請求項1~28のいずれか一項に記載の方法。
【請求項30】
前記第1の複数のコンパートメントの各コンパートメントが50から100,000,000個の核または細胞を含む、請求項1~29のいずれか一項に記載の方法。
【請求項31】
前記第2の複数のコンパートメントの各コンパートメントが50から100,000,000個の核または細胞を含む、請求項1~29のいずれか一項に記載の方法。
【請求項32】
複数の増幅部位を含む表面を提供する工程であって、
前記増幅部位が遊離の3’末端を有する付着した一本鎖の捕捉オリゴヌクレオチドの少なくとも2つの集団を含む工程と、
複数の増幅部位を生成するのに適する条件の下で増幅部位を含む前記表面をインデックス付きの前記断片と接触させ、各々は複数のインデックスを含む個々の断片からのアンプリコンのクローン集団を含む工程と
をさらに含む、請求項1~31のいずれか一項に記載の方法。
【請求項33】
複数の単一細胞からの核酸を含むシークエンシングライブラリーを調製する方法であって、
(a)複数の細胞からの単離された核を提供する工程と;
(b)単離された前記核の完全性を維持しつつヌクレオソームが枯渇された核を生成する化学処理に単離された前記核を付す工程と;
(c)ヌクレオソームが枯渇された前記核のサブセットを第1の複数のコンパートメントに分配し、各サブセットをトランスポソーム複合体と接触させる工程であって、各コンパートメントの中の前記トランスポソーム複合体がトランスポザーゼおよび他のコンパートメントの中の第1のインデックス配列と異なる第1のインデックス配列を含む工程と;
(d)ヌクレオソームが枯渇された核の前記サブセットの中の核酸を複数の核酸断片に断片化し、前記第1のインデックス配列を前記核酸断片の少なくとも1つの鎖に組み込んでインデックス付きの核酸断片を含むインデックス付きの核を生成する工程であって、インデックス付きの前記核酸断片は前記トランスポザーゼに付着したままである工程と;
(d)インデックス付きの前記核を合わせてプールされたインデックス付きの核を生成する工程と;
(e)プールされたインデックス付きの前記核のサブセットを第2の複数のコンパートメントに分配し、各サブセットをヘアピンライゲーション二重鎖と、インデックス付きの核酸断片の片方または両方の末端への前記ヘアピンライゲーション二重鎖のライゲーションに適する条件の下で接触させて二重インデックス付きの核酸断片をもたらす工程であって、前記ヘアピンライゲーション二重鎖が他のコンパートメントの中の第2のインデックス配列と異なる第2のインデックス配列を含む工程と;
(f)二重インデックス付きの前記核を合わせてプールされたインデックス付きの核を生成する工程と;
(g)プールされた二重インデックス付きの前記核のサブセットを第3の複数のコンパートメントに分配する工程と;
(h)二重インデックス付きの前記核を溶解させる工程と;
(i)他のコンパートメントの中の第3のインデックス配列と異なる第3のインデックス配列を含むように二重インデックス付きの前記核断片を処理する工程と;
(j)前記三重インデックス断片を合わせ、それによって複数の前記単一細胞からの全ゲノム核酸を含むシークエンシングライブラリーを生成する工程と
を含む方法。
【発明の詳細な説明】
【背景技術】
【0001】
関連出願の相互参照
この出願は2018年5月17日に出願の米国特許仮出願第62/673,023号および2019年3月21日に出願の米国特許仮出願第62/821,864号の権益を主張し、その各々は参照により完全に本明細書に組み込まれる。
政府資金提供
【0002】
この発明は、米国国立衛生研究所から授与された助成金番号DP1 HG007811の下の政府援助によって作成された。政府は、本発明にある特定の権利を有する。
【技術分野】
【0003】
本開示の実施形態は、核酸の配列決定に関する。詳細には、本明細書で提供される方法および組成物の実施形態は、インデックス付きの単一細胞シークエンシングライブラリーを生成すること、ならびに交差および染色体誤分離事象を含む稀な事象を特徴付けるために配列データをそこから得ることに関する。一部の実施形態では、本方法は、単細胞レベルでがん不均一性を明らかにすることに関する。
【0004】
背景技術
現代の単一細胞ゲノムシークエンシング技術は、2つの主要な限界を有する。第1に、ほとんどの方法は個々の細胞を区分することを必要とし、それはスループットを制限する可能性がある。第2に、ほとんどの増幅方法はPCRベースであり、したがって、指数関数的増幅バイアスを被る。第1の問題を解決するために、我々および同僚は、単一細胞の核酸内容を特異的にタグ付けし、それによって各連続した回のインデクシングによりスループットにおける指数関数的増加を可能にするために、数回のスプリット-プール分子バーコード化を実行する、単一細胞コンビナトリアルインデクシング(「sci-」)を開発した。sci-方法は、多数の単一細胞において、クロマチンアクセス性(sci-ATAC-seq)、トランスクリプトーム(sci-RNA-seq)、ゲノム(sci-DNA-seq)、メチローム(sci-MET)、染色体高次構造(sci-Hi-C)をプロファイリングするように首尾よく開発されている(Cao et al., 2017, Science 357:661-667;Cusanovich et al., 2015, Science, 348:910-914;Mulqueen et al., 2018, Nat. Biotechnol. 36:428-431;Ramani et al., 2017, Nat. Methods 14:263-266;Vitak et al., 2017, Nat. Methods 14:302-308)。第2の問題を解決するために、T7ベースの転写による線形増幅は、単一細胞アッセイとの関係で以前に利用された潜在的解法を提供する(Eberwine et al., 1992; Proceedings of the National Academy of Sciences 89:3010-3014;Hashimshony et al., 2012, Cell Rep. 2:666-673;Sos et al., 2016, Genome Biolol., 17:20)。例えば、最近、Chen et al.は、ゲノムを断片化し、インビトロ転写(IVT)のためにT7 RNAプロモーターを同時に挿入するためにTn5トランスポゾンを使用するトランスポゾン挿入による線形増幅を開発した(「LIANTI」)。DNA鋳型から生成されるRNAコピーは、さらなる増幅のために鋳型の役割をすることができない。したがって、全てのコピーは、元のDNA鋳型に直接的に由来する。指数関数的増幅を回避することによって、LIANTIは均一性を維持し、配列のエラーを最小にする。しかし、この方法は各単一細胞からの連続的ライブラリー調製を必要とするので、ロースループットである(Chen et al., 2017, Science 356:189-194)。
【発明の概要】
【0005】
スループットの指数関数的増加を可能にすると同時に増幅バイアスを最小にするために、単一細胞コンビナトリアルインデクシングおよび線形増幅を組み入れた方法が本明細書に記載される。複数回の分子バーコード化によって、本方法は、線形増幅の利点を保持しつつ、1回の実験につき少なくとも数千のおよび潜在的に数百万の細胞までスループットを向上させる。発明者は、単一細胞全ゲノムシークエンシング(「sci-L3-WGS」)、標的化ゲノムシークエンシング(「sci-L3-標的-seq」)ならびにゲノムおよびトランスクリプトームの共アッセイ(「sci-L3-RNA/DNA」)の概念実証を通した方法の一般化の可能性を実証する。さらなる実証として、不妊の種間(B6×Spretus)F1雄マウスならびに妊性の種内(B6×Cast)F1雄マウスからの未熟のおよび成熟した雄生殖細胞における、先例のない数の減数分裂の交差および稀な染色体誤分離事象をマッピングするために、単一細胞全ゲノムシークエンシングが適用される。
【0006】
定義
本明細書で使用される用語は、特に明記しない限り、関連する分野におけるそれらの通常の意味をとることが理解される。本明細書で使用されるいくつかの用語およびそれらの意味は、本明細書に示される。
【0007】
本明細書で用いるように、用語「生物体」、「対象」は互換的に使用され、微生物(例えば、原核生物または真核生物)、動物および植物を指す。動物の例は、ヒトなどの哺乳動物である。
【0008】
本明細書で用いるように、用語「細胞型」は、形態、表現型、発生起源または他の公知であるか認識できる特徴的な細胞特性に基づいて細胞を同定することを意図する。単一の生物体から(または、同種の生物体から)から様々な異なる細胞型を得ることができる。例示的な細胞型には、限定されずに、生殖体(雌生殖体、例えば、卵子または卵細胞、および雄生殖体、例えば精子)、上皮卵巣、卵巣線維芽細胞、精巣、尿膀胱、免疫細胞、B細胞、T細胞、ナチュラルキラー細胞、樹状細胞、がん細胞、真核細胞、幹細胞、血液細胞、筋細胞、脂肪細胞、皮膚細胞、神経細胞、骨細胞、膵臓細胞、内皮細胞、膵臓上皮、膵臓アルファ、膵臓ベータ、膵臓内皮、骨髄リンパ芽球、骨髄Bリンパ芽球、骨髄マクロファージ、骨髄赤芽球、骨髄樹状、骨髄脂肪細胞、骨髄骨細胞、骨髄軟骨細胞、前骨髄芽球、骨髄巨核芽球、膀胱、脳Bリンパ球、脳神経膠、ニューロン、脳星状神経膠細胞、神経外胚葉、脳マクロファージ、脳ミクログリア、脳上皮、皮質ニューロン、脳線維芽細胞、乳房上皮、結腸上皮、結腸Bリンパ球、乳房上皮、乳房筋上皮、乳房線維芽細胞、結腸腸細胞、子宮頸管上皮、乳房管上皮、舌上皮、扁桃樹状、扁桃Bリンパ球、末梢血リンパ芽球、末梢血Tリンパ芽球、末梢血皮膚Tリンパ球、末梢血ナチュラルキラー、末梢血Bリンパ芽球、末梢血単球、末梢血骨髄芽球、末梢血単芽球、末梢血前骨髄芽球、末梢血マクロファージ、末梢血好塩基球、肝臓内皮、肝臓マスト、肝臓上皮、肝臓Bリンパ球、脾臓内皮、脾臓上皮、脾臓Bリンパ球、肝細胞、肝臓、線維芽細胞、肺上皮、気管支上皮、肺線維芽細胞、肺Bリンパ球、肺シュワン、肺扁平上皮、肺マクロファージ、肺骨芽細胞、神経内分泌、肺胞、胃上皮および胃線維芽細胞が含まれる。
【0009】
本明細書で用いるように、用語「組織」は、生物体において一緒に作用して1つまたは複数の特定の機能を実行する細胞の集合または凝集を意味するものである。細胞は、形態学的に類似してもよい。例示的な組織には、限定されずに、精巣上体、目、筋肉、皮膚、腱、静脈、動脈、血液、心臓、脾臓、リンパ節、骨、骨髄、肺、気管支、気管、腸、小腸、大腸、結腸、直腸、唾液腺、舌、胆嚢、虫垂、肝臓、膵臓、脳、胃、皮膚、腎臓、尿管、膀胱、尿道、性腺、精巣、卵巣、子宮、卵管、胸腺、脳下垂体、甲状腺、副腎または副甲状腺が含まれる。組織は、ヒトまたは他の生物体の様々な器官のいずれかに由来することができる。組織は、健全な組織または不健全な組織であってよい。不健全な組織の例には、限定されずに、生殖組織、肺、乳房、結直腸、前立腺、鼻咽頭、胃、精巣、皮膚、神経系、骨、卵巣、肝臓、血液組織、膵臓、子宮、腎臓、リンパ系組織等における悪性腫瘍が含まれる。悪性腫瘍は、様々な組織学的サブタイプ、例えば、癌腫、腺癌、肉腫、線維腺癌、神経内分泌または未分化のものであってよい。
【0010】
本明細書で用いるように、用語「ヌクレオソーム」は、クロマチンの基礎反復単位を指す。ヒトゲノムは、約10μmの平均直径を有する、細胞の核の中に詰められている数メートルのDNAからなる。真核生物の核では、DNAはクロマチンとして知られる核タンパク質複合体の中にパッケージされる。ヌクレオソーム(クロマチンの基礎反復単位)は、コアヒストン八量体の周囲に概ね1.7回巻かれる約146塩基対のDNAを一般的に含む。ヒストン八量体は、ヒストンH2A、H2B、H3およびH4の各々の2コピーからなる。ヌクレオソームは、ストリング上のビーズの様式でDNAに沿って規則的に間隔を置いて配置される。
【0011】
本明細書で用いるように、用語「コンパートメント」は、ある物を他の物から分離または隔離する領域または容量を意味するものである。例示的なコンパートメントには、限定されずに、バイアル、チューブ、ウェル、液滴、ボーラス、ビーズ、容器、表面特性、または物理的力、例えば液流、磁気、電流などによって分離される領域もしくは容量が含まれる。一実施形態では、コンパートメントは、マルチウェルプレート、例えば96-または384-ウェルプレートのウェルである。本明細書で用いるように、液滴はヒドロゲルビーズを含むことができ、それは1つまたは複数の核または細胞を封入するためのビーズであり、ヒドロゲル組成物または液滴ベースのマイクロフルーイディックスを含む。一部の実施形態では、液滴はヒドロゲル材料の均一な液滴であるか、またはポリマーヒドロゲルシェルを有する中空の液滴である。均一であれまたは中空であれ、液滴は、1つまたは複数の核または細胞を封入することが可能であってよい。
【0012】
本明細書で用いるように、「トランスポソーム複合体」は、組入れ認識部位を含む組入れ酵素および核酸を指す。「トランスポソーム複合体」は、トランスポジション反応を触媒することが可能であるトランスポザーゼおよびトランスポザーゼ認識部位によって形成される機能的複合体である(例えば、Gunderson et al.、WO2016/130704を参照する)。組入れ酵素の例には、限定されずに、インテグラーゼまたはトランスポザーゼが含まれる。組入れ認識部位の例には、限定されずに、トランスポザーゼ認識部位が含まれる。
【0013】
本明細書で用いるように、用語「核酸」は、当分野でのその使用と一貫しているものであって、天然に存在する核酸またはその機能的類似体を含む。特に有益な機能的類似体は配列特異的に核酸にハイブリダイズすることが可能であるか、または特定のヌクレオチド配列の複製のための鋳型として使用することが可能である。天然に存在する核酸は、ホスホジエステル結合を含有する主鎖を一般的に有する。類似体構造体は、当技術分野で公知である様々なもののいずれかを含む交互の主鎖連結を有することができる。天然に存在する核酸は、デオキシリボース糖(例えば、デオキシリボ核酸(DNA)に見出される)またはリボース糖(例えば、リボ核酸(RNA)に見出される)を一般的に有する。核酸は、当技術分野で公知であるこれらの糖部分の様々な類似体のいずれも含有することができる。核酸は、天然または非天然の塩基を含むことができる。この点に関しては、天然のデオキシリボ核酸は、アデニン、チミン、シトシンまたはグアニンからなる群から選択される1つまたは複数の塩基を有することができ、リボ核酸は、アデニン、ウラシル、シトシンまたはグアニンからなる群から選択される1つまたは複数の塩基を有することができる。核酸に含まれてもよい有益な非天然の塩基は、当技術分野で公知である。非天然の塩基の例には、ロック核酸(LNA)、架橋核酸(BNA)および偽相補的塩基(Trilink Biotechnologies、San Diego、CA)が含まれる。LNAおよびBNA塩基は、DNAオリゴヌクレオチドに組み込むことができ、オリゴヌクレオチドのハイブリダイゼーションの強度および特異性を増加させることができる。LNAおよびBNA塩基およびそのような塩基の使用は、当業者に公知であり、ルーチンである。
【0014】
本明細書で用いるように、用語「標的」は、核酸に関して使用するとき、本明細書に示される方法または組成物との関連で核酸のための意味論的な識別子であるものであり、さもなければ明示的に示されるものを越えて核酸の構造または機能を必ずしも制限するというわけではない。標的核酸は、既知のまたは未知の配列の事実上いかなる核酸であってもよい。それは、例えば、ゲノムDNA(例えば、染色体DNA)、染色体外DNA、例えばプラスミド、無細胞DNA、RNA(例えば、RNAまたは非コードRNA)、タンパク質(例えば、細胞内または細胞表面タンパク質)またはcDNAの断片であってよい。シークエンシングは、標的分子の全体または一部の配列の決定をもたらすことができる。標的は、核などの一次核酸試料に由来することができる。一実施形態では、標的は、各標的断片の片方または両方の末端への遍在(ユニバーサル(universal))配列の設置によって、増幅に適する鋳型に加工することができる。標的は、cDNAへの逆転写によって最初のRNA試料から得ることもできる。一実施形態では、標的は、細胞の中に存在するDNA、RNAまたはタンパク質のサブセットに関して使用される。標的化シークエンシングは、一般的にPCR増幅(例えば、領域特異的プライマー)またはハイブリダイゼーションベースの捕捉方法(例えば、捕捉プローブの使用)または抗体による、目的の遺伝子または領域またはタンパク質の選択および単離を使用する。標的化富化は、本方法の様々な段階で起こすことができる。例えば、標的化RNA表示は、より複雑なライブラリーからのサブセットの逆転写工程またはハイブリダイゼーションベースの富化において標的特異的プライマーを使用して得ることができる。例は、エクソームシークエンシングまたはL1000アッセイ(Subramanian et al., 2017, Cell, 171;1437-1452)である。標的化シークエンシングは、当業者に公知である富化プロセスのいずれも含むことができる。
【0015】
本明細書で用いるように、用語「遍在性」は、ヌクレオチド配列を記載するために使用するとき、2つ以上の核酸分子に共通する配列の領域を指し、ここで、分子は互いと異なる配列の領域も有する。分子の集合の異なるメンバーに存在する遍在配列は、遍在捕捉核酸、例えば、遍在配列、例えば遍在捕捉配列の一部に相補的である捕捉オリゴヌクレオチドの集団を使用して複数の異なる核酸の捕捉を可能にすることができる。遍在捕捉配列の非限定的な例には、P5およびP7プライマーに同一であるかまたは相補的である配列が含まれる。同様に、分子の集合の異なるメンバーに存在する遍在配列は、遍在配列、例えば遍在アンカー配列の一部に相補的である遍在プライマーの集団を使用して複数の異なる核酸の複製(シークエンシング)または増幅を可能にすることができる。遍在アンカー配列の非限定的な例には、スペーサー配列、例えばsp1およびsp2に同一であるかまたは相補的である配列が含まれる。一実施形態では、遍在アンカー配列は、遍在プライマー(例えば、読み取り1(リード(read)1)または読み取り2のためのシークエンシングプライマー)がシークエンシングのためにアニールする部位として使用される。したがって、捕捉オリゴヌクレオチドまたは遍在プライマーは、遍在配列に特異的にハイブリダイズすることができる配列を含む。
【0016】
用語「P5」および「P7」は、遍在性の捕捉配列または捕捉オリゴヌクレオチドに言及するときに使用することができる。用語「P5’」(P5プライム)および「P7’」(P7プライム)は、P5およびP7の相補体をそれぞれ指す。本明細書で提示される方法において、任意の適する遍在性の捕捉配列または捕捉オリゴヌクレオチドを使用することができ、P5およびP7の使用は例示的な実施形態だけであることが理解されよう。P5およびP7などの捕捉オリゴヌクレオチドまたはフローセル上のそれらの相補体の使用は、WO2007/010251、WO2006/064199、WO2005/065814、WO2015/106941、WO1998/044151およびWO2000/018957の開示によって例示されるように、当技術分野で公知である。例えば、相補的な配列とのハイブリダイゼーションおよび配列の増幅のために、本明細書で提示される方法において、固定化されようが溶液状態であるにせよ、任意の適するフォワード増幅プライマーが有益である可能性がある。同様に、相補的な配列とのハイブリダイゼーションおよび配列の増幅のために、本明細書で提示される方法において、固定化されようが溶液状態であるにせよ、任意の適するリバース増幅プライマーが有益である可能性がある。当業者は、本明細書で提示されるような核酸の捕捉および/または増幅のために適するプライマー配列をどのように設計および使用するかを理解する。
【0017】
本明細書で用いるように、用語「プライマー」およびその派生語は、目的の標的配列にハイブリダイズすることができる任意の核酸を一般的に指す。一般的に、プライマーは、その上にヌクレオチドをポリメラーゼによって重合させることができるかまたはインデックスなどのヌクレオチド配列をそれにライゲーションすることができる基質として機能する。しかし、一部の実施形態では、プライマーは合成された核酸鎖に組み込むことができ、および、合成された核酸分子に相補的な新しい鎖の合成を刺激するために、別のプライマーがハイブリダイズすることができる部位を提供することができる。プライマーは、ヌクレオチドまたはその類似体の任意の組合せを含むことができる。一部の実施形態では、プライマーは一本鎖のオリゴヌクレオチドまたはポリヌクレオチドである。用語「ポリヌクレオチド」および「オリゴヌクレオチド」は本明細書では互換的に使用されて任意の長さのヌクレオチドのポリマー形を指し、リボヌクレオチド、デオキシリボヌクレオチド、その類似体またはそれらの混合物を含むことができる。本用語は、同等物として、DNA、RNA、cDNAの類似体またはヌクレオチド類似体から作製される抗体-オリゴコンジュゲートを含むと、ならびに一本鎖(センスまたはアンチセンスなど)および二本鎖のポリヌクレオチドに適用可能であると理解されるべきである。本明細書で使用される本用語は、例えば逆転写酵素の作用によってRNA鋳型から生成される、相補的なまたはコピーのDNAであるcDNAも包含する。この用語は、分子の一次構造だけを指す。したがって、本用語は、三本鎖、二本鎖および一本鎖のデオキシリボ核酸(「DNA」)、ならびに三本鎖、二本鎖および一本鎖のリボ核酸(「RNA」)を含む。
【0018】
本明細書で用いるように、用語「アダプター」およびその誘導体、例えば遍在アダプターは、本開示の核酸分子にライゲーションすることができる任意の線状オリゴヌクレオチドを一般的に指す。一部の実施形態では、アダプターは、試料中に存在するいかなる標的配列の3’末端にも5’末端にも実質的に非相補的である。一部の実施形態では、適するアダプター長は、約10~100ヌクレオチド、約12~60ヌクレオチドまたは約15~50ヌクレオチドの範囲内の長さである。一般的に、アダプターは、ヌクレオチドおよび/または核酸の任意の組合せを含むことができる。一部の態様では、アダプターは、1つまたは複数の位置に1つまたは複数の切断可能な基を含むことができる。別の態様では、アダプターは、プライマー、例えば遍在プライマーの少なくとも一部に実質的に同一であるかまたは実質的に相補的である配列を含むことができる。一部の実施形態では、下流のエラー補正、同定またはシークエンシングを支援するために、アダプターは、バーコード(本明細書において、タグまたはインデックスとも呼ばれる)を含むことができる。用語「アダプター」および「アダプター」は、互換的に使用される。
【0019】
本明細書で用いるように、用語「各々」は、アイテムの集合に関して使用するとき、文脈が明らかに別途指図しない限り、集合の中の個々のアイテムを識別するものであるが、集合の中のあらゆるアイテムを必ずしも指すとは限らない。
【0020】
本明細書で使用されるように、用語「運搬」は、流体を通しての分子の移動を指す。この用語は、それらの濃度勾配に沿った分子の移動(例えば、受動拡散)などの受動運搬を含むことができる。この用語は、分子がそれらの濃度勾配に沿って、またはそれらの濃度勾配の反対に移動することができる、能動運搬を含むこともできる。したがって、運搬は、所望の方向にまたは増幅部位などの所望の位置に1つまたは複数の分子を移動させるためにエネルギーを加えることを含むことができる。
【0021】
本明細書で使用されるように、「増幅する」、「増幅すること」または「増幅反応」およびそれらの派生語は、核酸分子の少なくとも一部が少なくとも1つのさらなる核酸分子の中に複製またはコピーされる、任意の作用またはプロセスを一般的に指す。さらなる核酸分子は、鋳型核酸分子の少なくとも一部の部分に実質的に同一であるかまたは実質的に相補的である配列を含んでもよい。鋳型核酸分子は一本鎖でも二本鎖であってもよく、さらなる核酸分子は独立して一本鎖でも二本鎖であってもよい。増幅は、核酸分子の線形または指数関数的複製を含んでもよい。一部の実施形態では、そのような増幅は、等温条件を使用して実行することができる。他の実施形態では、そのような増幅は、サーモサイクリングを含むことができる。一部の実施形態では、増幅は、単一の増幅反応における複数の標的配列の同時増幅を含む多重増幅である。一部の実施形態では、「増幅」は、単独のまたは組合せた、DNAおよびRNAベースの核酸の少なくとも一部の部分の増幅を含む。増幅反応は、当業者に公知である増幅プロセスのいずれかを含むことができる。一部の実施形態では、増幅反応は、ポリメラーゼ連鎖反応(PCR)を含む。
【0022】
本明細書で使用されるように、「増幅条件」およびその派生語は、1つまたは複数の核酸配列を増幅するのに適する条件を一般的に指す。そのような増幅は、線形であっても指数関数的であってもよい。一部の実施形態では、増幅条件は等温条件を含むことができるか、あるいは、サーモサイクリング条件または等温性およびサーモサイクリング条件の組合せを含むことができる。一部の実施形態では、1つまたは複数の核酸配列を増幅するのに適する条件は、ポリメラーゼ連鎖反応(PCR)条件を含む。一般的に、増幅条件は、遍在配列が隣接している1つまたは複数の標的配列などの核酸を増幅するか、または1つまたは複数のアダプターにライゲーションしている増幅された標的配列を増幅するのに十分である反応混合物を指す。一般的に、増幅条件は、増幅または核酸合成のための触媒、例えばポリメラーゼ;増幅させる核酸に多少の相補性を有するプライマー;およびヌクレオチド、例えば核酸にハイブリダイズしたプライマーの伸長を促進するデオキシリボヌクレオチド三リン酸(dNTP)を含む。増幅条件は、核酸へのプライマーのハイブリダイゼーションまたはアニーリング、プライマーの伸長、および伸長したプライマーが増幅中の核酸配列から分離される変性工程を必要とする可能性がある。一般的に、しかしそうとは限らないが、増幅条件はサーモサイクリングを含むことができ、一部の実施形態では、増幅条件は、アニーリング、伸長および分離の工程が反復される複数のサイクルを含む。一般的に、増幅条件は、Mg2+またはMn2+などのカチオンを含み、イオン性の強度の様々な調節剤を含むこともできる。
【0023】
本明細書で使用されるように、「再増幅」およびそれらの派生語は、増幅される核酸分子の少なくとも一部が任意の適する増幅プロセス(一部の実施形態では「二次」増幅と呼ばれる)を通してさらに増幅され、それによって再増幅された核酸分子を生成する、任意のプロセスを一般的に指す。二次増幅は、増幅された核酸分子を生成した元の増幅プロセスと同一である必要がなく;再増幅された核酸分子が増幅された核酸分子と完全に同一である必要も完全に相補的である必要もなく;必要とされることの全ては、再増幅された核酸分子が増幅された核酸分子またはその相補体の少なくとも一部を含むということである。例えば、再増幅は、一次増幅と異なる標的特異的プライマーを含む、異なる増幅条件および/または異なるプライマーの使用を含むことができる。
【0024】
本明細書で使用されるように、用語「ポリメラーゼ連鎖反応」(「PCR」)は、クローニングも精製もなしでゲノムDNAの混合物中の目的のポリヌクレオチドのセグメントの濃度を増加させるための方法を記載する、Mullisの米国特許第4,683,195号および4,683,202号の方法を指す。目的のポリヌクレオチドを増幅するためのこのプロセスは、所望の目的のポリヌクレオチドを含有するDNA混合物に大過剰の2つのオリゴヌクレオチドプライマーを導入すること、および続くDNAポリメラーゼの存在下での一連の熱サイクルからなる。2つのプライマーは、目的の二本鎖ポリヌクレオチドのそれらのそれぞれの鎖に相補的である。混合物は先ずより高い温度で変性させ、目的のポリヌクレオチド分子の中の相補的配列にプライマーを次にアニールさせる。アニーリングの後、プライマーをポリメラーゼで伸長させ、相補鎖の新しい対を形成する。所望の目的のポリヌクレオチドの高濃度の増幅されたセグメントを得るために、変性、プライマーアニーリングおよびポリメラーゼ伸長の工程を多数回繰り返すことができる(サーモサイクリングと呼ばれる)。所望の目的のポリヌクレオチドの増幅されたセグメント(アンプリコン)の長さは、お互いに対するプライマーの相対的な位置によって決定され、したがって、この長さは制御可能なパラメータである。このプロセスを繰り返すことから、本方法はPCRと呼ばれる。目的のポリヌクレオチドの所望の増幅されたセグメントが混合物中の支配的な核酸配列(濃度に関して)になるので、それらは「PCR増幅された」と言われる。上記の方法の改変形では、標的核酸分子は、複数の異なるプライマーを使用して、一部の場合には、目的の標的核酸1分子につき1つまたは複数のプライマー対を使用してPCR増幅することができ、それによって多重PCR反応を形成する。
【0025】
本明細書で定義される通り、「多重増幅」は、少なくとも1つの標的特異的プライマーを使用した、試料中の2つ以上の標的配列の選択的な非ランダム増幅を指す。一部の実施形態では、多重増幅は、標的配列の一部または全部が単一の反応容器の中で増幅されるように実行される。所与の多重増幅の「プレキシ」または「プレックス」は、その単一の多重増幅の間に増幅される異なる標的特異的配列の数を一般的に指す。一部の実施形態では、プレキシは、約12プレックス、24プレックス、48プレックス、96プレックス、192プレックス、384プレックス、768プレックス、1536プレックス、3072プレックス、6144プレックスまたはそれより多くてもよい。増幅された標的配列を、いくつかの異なる方法によって検出することも可能である(例えば、ゲル電気泳動および続くデンシトメトリー、バイオアナライザーまたは定量的PCRによる定量化、標識プローブとのハイブリダイゼーション;ビオチン化プライマーの組込みおよび続くアビジン-酵素コンジュゲート検出;増幅された標的配列への32P標識デオキシヌクレオチド三リン酸の組込み)。
【0026】
本明細書で使用されるように、「増幅された標的配列」およびその派生語は、本明細書で提供される標的特異的プライマーおよび方法を使用して標的配列を増幅することによって生成された核酸配列を一般的に指す。増幅された標的配列は、標的配列に対して同じセンス(すなわち、正の鎖)またはアンチセンス(すなわち、負の鎖)のいずれであってもよい。
【0027】
本明細書で使用されるように、用語「ライゲーションする」、「ライゲーション」およびそれらの派生語は、2つ以上の分子を共有結合するための、例えば2つ以上の核酸分子をお互いと共有結合させるためのプロセスを一般的に指す。一部の実施形態では、ライゲーションは、核酸の隣接したヌクレオチドの間のニックの連結を含む。一部の実施形態では、ライゲーションは、第1の核酸分子の末端と第2の核酸分子の末端の間で共有結合を形成することを含む。一部の実施形態では、ライゲーションは、1つの核酸の5’リン酸基と第2の核酸の3’ヒドロキシル基の間で共有結合を形成し、それによってライゲーションされた核酸分子を形成することを含むことができる。一般的に、本開示の目的のために、増幅された標的配列をアダプターにライゲーションし、アダプターにライゲーションされた、増幅された標的配列を生成することができる。
【0028】
本明細書で使用されるように、「リガーゼ」およびその派生語は、2つの基質分子のライゲーションを触媒することが可能な任意の薬剤を一般的に指す。一部の実施形態では、リガーゼは、核酸の隣接したヌクレオチドの間のニックの連結を触媒することが可能な酵素を含む。一部の実施形態では、リガーゼは、1つの核酸分子の5’リン酸と別の核酸分子の3’ヒドロキシルの間での共有結合の形成を触媒し、それによってライゲーションされた核酸分子を形成することが可能である酵素を含む。適するリガーゼは、限定されずに、T4 DNAリガーゼ、T4 RNAリガーゼおよびE.コリ(E. coli)DNAリガーゼを含むことができる。
【0029】
本明細書で使用されるように、「ライゲーション条件」およびその派生語は、2つの分子をお互いとライゲーションするのに適する条件を一般的に指す。一部の実施形態では、ライゲーション条件は、核酸間のニックまたはギャップを密封するのに適する。本明細書で使用されるように、用語ニックまたはギャップは、当技術分野での用語の使用と一貫している。一般的に、ニックまたはギャップは、適当な温度およびpHにおいてリガーゼなどの酵素の存在下でライゲーションすることができる。一部の実施形態では、T4 DNAリガーゼは、約70~72℃の温度で核酸の間のニックを連結することができる。
【0030】
本明細書で使用されるように用語「フローセル」は、1つまたは複数の液体試薬を流すことができる固体表面を含むチャンバーを指す。本開示の方法において直ちに使用することができるフローセルおよび関連した液体システムおよび検出プラットホームの例が、例えば、Bentley et al., Nature 456:53-59 (2008)、国際公開第04/018497号;米国特許第7,057,026号;国際公開第91/06678号;国際公開第07/123744号;米国特許第7,329,492号;米国特許第7,211,414号;米国特許第7,315,019号;米国特許第7,405,281号および米国特許出願公開第2008/0108082号に記載される。
【0031】
本明細書で使用されるように、核酸に関して使用されるとき、用語「アンプリコン」は、核酸のコピー産物を意味し、ここで、産物は核酸のヌクレオチド配列の少なくとも一部と同じであるかまたはそれに相補的であるヌクレオチド配列を有する。アンプリコンは、例えば、ポリメラーゼ伸長、ポリメラーゼ連鎖反応(PCR)、ローリングサークル増幅(RCA)、ライゲーション伸長またはライゲーション連鎖反応を含む、核酸またはそのアンプリコンを鋳型として使用する様々な増幅方法のいずれかによって生成することができる。アンプリコンは、特定のヌクレオチド配列(例えばPCR産物)の単一コピーまたはヌクレオチド配列(例えば、RCAのコンカテマー産物)の複数のコピーを有する核酸分子であってよい。標的核酸の第1のアンプリコンは、一般的に相補的なコピーである。以降のアンプリコンは、第1のアンプリコンの生成の後に標的核酸から、または第1のアンプリコンから作製されるコピーである。以降のアンプリコンは、標的核酸に実質的に相補的であるか、標的核酸と実質的に同一である配列を有することができる。
【0032】
本明細書で使用されるように、用語「増幅部位」は、1つまたは複数のアンプリコンを生成することができる、アレイの中のまたはその上の部位を指す。増幅部位は、その部位で生成される少なくとも1つのアンプリコンを含有するか、保持するか、付着させるようにさらに構成することができる。
【0033】
本明細書で使用されるように、用語「アレイ」は、相対的な位置によってお互いから区別することができる部位の集団を指す。アレイの異なる部位にある異なる分子は、アレイの中の部位の位置によってお互いから区別することができる。アレイの個々の部位は、特定のタイプの1つまたは複数の分子を含むことができる。例えば、部位は、特定の配列を有する単一の標的核酸分子を含むことができるか、または、部位は、同じ配列(および/またはその相補的な配列)を有するいくつかの核酸分子を含むことができる。アレイの部位は、同じ基質の上に位置する異なるフィーチャーであってよい。例示的なフィーチャーには、限定されずに、基質の中のウェル、基質の中かその上のビーズ(または、他の粒子)、基質からの突起、基質の上の隆起または基質の中のチャネルが含まれる。アレイの部位は、異なる分子を各々有する別個の基質であってよい。別個の基質に付着している異なる分子は、基質が関連付けられている表面の基質の位置によって、または液体もしくはゲルの中の基質の位置によって同定することができる。別個の基質が表面に位置する例示的なアレイには、限定されずに、ウェルの中のビーズを有するものが含まれる。
【0034】
本明細書で使用されるように、用語「容量」は、部位および核酸材料に関して使用されるとき、部位を占有することができる核酸材料の最大量を意味する。例えば、本用語は、特定の条件において部位を占有することができる核酸分子の総数を指すことができる。例えば、特定の条件において部位を占有することができる核酸材料の総質量または特定のヌクレオチド配列のコピー総数を含む、他の尺度を使用することもできる。一般的に、標的核酸のための部位の容量は、標的核酸のアンプリコンのための部位の容量と実質的に同等である。
【0035】
本明細書で使用されるように、用語「捕捉薬剤」は、標的分子(例えば、標的核酸)に付着するか、保持するか、結合することが可能である材料、化学物質、分子またはその部分を指す。例示的な捕捉薬剤には、限定されずに、標的核酸の少なくとも一部に相補的である捕捉核酸(本明細書において捕捉オリゴヌクレオチドとも呼ばれる)、標的核酸(または、それに付着している連結部分)に結合することが可能である受容体-リガンド結合対のメンバー(例えば、アビジン、ストレプトアビジン、ビオチン、レクチン、炭水化物、核酸結合タンパク質、エピトープ、抗体等)、または標的核酸(または、それに付着している連結部分)と共有結合を形成することが可能な化学薬剤が含まれる。
【0036】
本明細書で使用されるように、用語「レポーター部分」は、調査される分析物の組成、同一性および/または供給源を決定することを可能にする、任意の識別可能なタグ、標識、インデックス、バーコードまたは基を指すことができる。一部の実施形態では、レポーター部分は、タンパク質に特異的に結合する抗体を含むことができる。一部の実施形態では、抗体は、検出可能な標識を含むことができる。一部の実施形態では、レポーターは、核酸タグで標識した抗体または親和性試薬を含むことができる。核酸タグは、例えば近接ライゲーションアッセイ(PLA)または近接伸長アッセイ(PEA)またはシークエンシングベースの読み出し(Shahi et al. Scientific Reports volume 7, Article number: 44447, 2017)、またはCITE-seq(Stoeckius et al. Nature Methods 14:865-868, 2017)を通して検出可能であってよい。
【0037】
本明細書で使用されるように、用語「クローン集団」は、特定のヌクレオチド配列に関して均一である核酸の集団を指す。均一な配列は、長さが一般的に少なくとも10ヌクレオチドであるが、例えば少なくとも50、100、250、500または1000ヌクレオチドの長さを含めてさらにより長くてもよい。クローン集団は、単一の標的核酸または鋳型核酸から導くことができる。一般的に、クローン集団の中の核酸の全ては、同じヌクレオチド配列を有する。クローン性を逸脱しない範囲で、少数の突然変異(例えば増幅アーチファクトによる)がクローン集団の中で起こることができることが理解されよう。
【0038】
本明細書で使用されるように、用語「特異な分子識別子」または「UMI」は、ランダムであれ非ランダムであれまたはセミランダムであれ、核酸分子に付着することができる分子タグを指す。核酸分子に組み込まれるとき、UMIは、増幅の後に配列決定される特異な分子識別子(UMI)を直接的に数えることによって、以降の増幅バイアスを補正するために使用することができる。
【0039】
本明細書で使用されるように、組成物、物品、核酸または核との関連で「提供する」とは、組成物、物品、核酸または核を作製することか、組成物、物品、核酸または核を購入することか、さもなければ化合物、組成物、物品または核を得ることを意味する。
【0040】
用語「および/または」は、掲載されるエレメントの1つもしくは全て、または掲載されるエレメントの任意の2つ以上の組合せを意味する。
【0041】
単語「好ましい」および「好ましくは」は、ある特定の状況の下である特定の利益を与えることができる本開示の実施形態を指す。しかし、同じまたは他の状況の下で、他の実施形態が好ましいこともある。さらに、1つまたは複数の好ましい実施形態の列挙は、他の実施形態が有益でないことを暗示せず、本開示の範囲から他の実施形態を排除するものでない。
【0042】
用語「含む」およびその変形形態は、これらの用語が明細書および請求項に出現する場合、制限する意味を有しない。
【0043】
実施形態が「含む」、「含む」または「含んでいる」などの言葉と一緒に本明細書に記載される場合はいつでも、「からなる」および/または「から事実上なる」の観点から記載されるさもなければ類似した実施形態も提供されることが理解される。
【0044】
特に明記しない限り、「a」、「an」、「the」および「少なくとも1つ」は互換的に使用され、1つまたは複数を意味する。
【0045】
さらに本明細書では、エンドポイントによる数値範囲の列挙は、その範囲の中に包含される全ての数を含む(例えば、1~5は、1、1.5、2、2.75、3、3.80、4、5等を含む)。
【0046】
個別の工程を含む本明細書に開示されるいずれの方法についても、工程は任意の実行可能な順序で実行することができる。さらに、2つ以上の工程の任意の組合せを適宜、同時に実行することができる。
【0047】
この明細書全体を通して、「一実施形態」、「実施形態」、「ある特定の実施形態」または「一部の実施形態」等への言及は、その実施形態に関連して記載される特定のフィーチャー、構成、組成または特徴が、本開示の少なくとも1つの実施形態に含まれることを意味する。したがって、この明細書全体の様々な場所におけるそのような語句の出現は、本開示の同じ実施形態を必ずしも指しているとは限らない。さらに、特定のフィーチャー、構成、組成または特徴は、1つまたは複数の実施形態において任意の適する方法で組み合わせることができる。
【0048】
本開示の例示的実施形態の以下の詳細な記載は、以下の図と一緒に読むときに最も良く理解することができる。
【図面の簡単な説明】
【0049】
【
図1】
図1A~Cは、本開示による単細胞コンビナトリアルインデクシングのための一般的な例示的方法の一般的なブロック図を示す。
【
図2】
図2は、本開示による単細胞コンビナトリアルインデクシングのための一般的な例示的方法の一般的なブロック図を示す。
【
図3】
図3A~Fは、sci-L3-WGSがハイスループットの単細胞線形全ゲノム増幅を可能にすることを示す。(A)3レベルのインデクシングによるsci-L3-WGSワークフローの模式図。(B)上:様々なライブラリー調製方法に適合する、結果として生じる増幅されたDNA二重鎖のバーコード構造。bc、バーコード;sp、スペーサー;gDNA、ゲノムDNA。中央:sci-L3-WGSのためのライブラリー構造の例。P5およびP7シークエンシングアダプターが、A-テーリングおよびライゲーションによって加えられる。ライゲーションの左右対称のためにUMI末端にP7を、gDNA末端にP5を有することが等しく可能であることに留意する。下:sci-L3-標的-seq.のためのライブラリー構造の例。ゲノムの中のスペーサー2(sp2)および目的の標的化遺伝子座からの初回刺激によってP5およびP7シークエンシングアダプターがそれぞれ加えられる。WGSライブラリーの中の各bc3に対応する新しい3回目のバーコードbc3’もPCRによって加えられ、新しいUMI’がbc3’の外側に加えられることに留意する。(C)低いシークエンシング深度でのヒトおよびマウス細胞からの特異なTn5挿入部位の数の散布図、24bc1×64bc2×6bc3 sci-L3-WGS、1ウェルにつき100~300細胞をソーティングした。青色、推測されたマウス細胞数(マウス読取りの百分率>95%、中央値98.7%、n=315);赤色、推測されたヒト細胞数(ヒト読取りの百分率>95%、中央値99.8%、n=719);灰色、推測された衝突(n=48,4%)。(D)1細胞あたり平均2.4Mの生の読み取りおよび1.78×深度における1細胞あたりの特異なTn5挿入部位の数を示すボックス図。深度は、特異なIVT転写物の数と特異なTn5挿入部位の数の間の比と規定される。太い水平線、中央値;ボックスの上および下のエッジ、それぞれ第1および第3四分位値;ひげ、四分位間の範囲の1.5倍;丸、外れ値)。プロトコールの改良版で作製されたライブラリーの特徴付けについては、
図5および実施例2、「sci-L3-WGSおよびsci-L3-標的-seqの方法および分子設計」のセクションも参照する。(E)個々の細胞のための染色体CNV図の例。上、HEK293T細胞、2.6Mの生の読み取り、2.4Mの特異分子、MAPQ>1の1.3Mの特異なTn5挿入部位。下、3T3細胞、2.7Mの生の読み取り、2.4Mの特異分子、MAPQ>1の1.2Mの特異なTn5挿入部位。(F)822個の293T細胞または1,453個のHAP1細胞にわたるコピー数変動のためのボックス図。分節コピーの増加も減少もない正倍数性の染色体が1の値を有するのが予想されるように、Y軸は、染色体長によって正規化された1染色体あたりの読み取り割合を示す。
【
図4】
図4A~Fは、各工程におけるsci-LIANTIの分子構造を示す。破線:RNA、実線:DNA。(A)Tn5アダプターは両方の5’末端がリン酸化され、1つは挿入のために必要とされ、他はライゲーションのために必要とされる。アニールされたトランスポゾンのオーバーハングは、ライゲーションのために1回目のバーコード(「bc1」)およびスペーサー(「sp1」)を含有する。(B)ライゲーション分子はヘアピンループとしてプレアニールされ、それは分子間ライゲーションを3分子から2分子に低減する;ヘアピン構造は、下流工程におけるRT効率の向上も助ける。ヘアピンは、1)ライゲーションのために「sp1」にアニールするオーバーハング、2)下流工程においてSSSのためのステムの中の初回刺激部位の役目をする2回目のバーコード(「bc2」)およびスペーサー(「sp2」)、ならびに3)IVTのためのループの中のT7プロモーターを含有する。(C)ギャップ伸長は、ループ状のT7プロモーターを二重鎖に変換する。ライゲーションが両末端で成功する場合は、T7プロモーターが両側に存在することに留意する;しかし、ライゲーションが1つの末端で成功する場合は、ボックス部分は欠落している。それにもかかわらず、両方とも異なるRTプライマーによって下流工程において逆転写することができる。(D)IVTは、T7プロモーターの下流に一本鎖RNAアンプリコンを生成する。(E)ライゲーションが両末端で成功した場合は、RTは自己ループ化RTプライマーによって好ましくは初回刺激され、それらはループ化ライゲーション分子から受け継がれる;ライゲーションが1つの末端だけで成功した場合は、RTは過剰に加えられる追加のRNA RTプライマーによって初回刺激される。次に、以降のSSS反応への干渉を回避するために、過剰なRNAプライマーはSSSの前に除去される。(F)3回目のバーコードおよびUMIタグを各転写物に同時に加えるために、「sp2」を脱初回刺激するSSSによって二本鎖DNA分子が生成される。より詳細な説明は、実施例2、「sci-L3-WGSおよびsci-L3-標的-seqの方法および分子設計」のセクションで提供される。
【
図5】5A~Gは、異なるsci-L3-WGS実験における読み取り数を異なるTn5トランスポソーム濃度と示す。示した深度での1細胞あたりの特異なTn5挿入部位の数を示すボックス図。深度は、特異なIVT転写物の数と特異なTn5挿入部位の数の間の比と規定される。太い水平線、中央値;ボックスの上および下のエッジ、それぞれ第1および第3四分位値;ひげ、四分位間の範囲の1.5倍;丸、外れ値)。濃縮されたTn5トランスポソーム:0.2μM、希釈されたTn5トランスポソーム:0.1μM。(A)濃縮されたTn5によるyi128(深度中央値:1.19×)のヒト対マウスの特異読み取り(ヒト特異読み取り中央値:215k、n=115細胞;マウス特異読み取り中央値:169k、n=44);濃縮されたTn5(特異読み取り中央値:215k)対希釈されたTn5(特異読み取り中央値:46k)によるヒト特異読み取り。(B)yi129(深度中央値:1.78×)の濃縮されたTn5(特異読み取り中央値:635k)対希釈されたTn5(特異読み取り中央値:183k)によるヒト特異読み取り。マウス特異読み取りは、
図3Dに提供する。(C)濃縮されたTn5によるyi140およびyi141(深度中央値:1.37×;ヒト特異読み取り中央値:660k)。表2および実施例2も参照する。(D)濃縮されたTn5によるyi144およびyi145(深度中央値:1.05×;ヒト特異読み取り中央値:97.3k)。表2も参照する。yi140、yi141、yi144およびyi145は、実施例2で議論される最適化プロトコールによるライブラリーであることに留意する。(E)濃縮されたTn5によるyi174(深度中央値:1.06×)のヒト/マウスの特異読み取り(ヒト特異読み取り中央値:100k、n=103;マウス特異読み取り中央値:23k、n=35);濃縮されたTn5(特異読み取り中央値:100k)および希釈されたTn5(特異読み取り中央値:54k)によるヒト特異読み取り。(F)マウス胚芽細胞のライブラリー:yi186、yi187、yi188は、希釈されたTn5で調製され;yi190、yi192、yi193は濃縮されたTn5で調製される。(G)シークエンシング深度の関数としての特異Tn5挿入部位の数。青色および赤色の線は、RNA RTプライマーありに対するそれらがないsci-L3-WGSをそれぞれ示す(実施例2)。yi129(パネルBの場合のように、深度中央値:1.78×)の濃縮によるヒト特異挿入(特異挿入中央値:635k)。5×および10×深度で推定したとき、予想される特異挿入数はそれぞれ1.9Mおよび2.6Mである。yi140およびyi141を合わせたものは深度中央値が1.37×であり、特異挿入中央値は660kである。1.78×、5×および10×深度で推定したとき、予想される特異挿入数はそれぞれ1.5M、4.2Mおよび6.0Mである。
【
図6】
図6A~Eは、Sci-L3ベースのRNA/DNA共アッセイが、同じ単細胞からのゲノムおよびトランスクリプトームのためのハイスループット線形増幅を共同で可能にすることを示す。(A)3レベルのインデクシングによるsci-L3-RNA/DNA共アッセイワークフローの模式図。Tn5トランスポゾンおよびcDNA合成プライマーの両方が、1回目のバーコードの外側の5’オーバーハングに同じリン酸化ライゲーションランディングパッド(ピンク色)を含有することに留意する。(B)様々なライブラリー調製方法に適合するゲノムおよびトランスクリプトーム(それぞれ左および右)に対応する、結果として生じる増幅された二重鎖のバーコード構造。bc、バーコード;sp、スペーサー;gDNA、ゲノムDNA。(C)一緒にプロットした低いおよび高いシークエンシング深度でのヒトおよびマウス細胞からの特異なTn5挿入部位の数の散布図、24bc1×64bc2×6bc3 sci-L3-RNA/DNA共アッセイ、1ウェルにつき100~300細胞をソーティングした。青色、推測されたマウス細胞数(マウス読取りの百分率>95%、中央値99.5%、n=2002);赤色、推測されたヒト細胞数(ヒト読取りの百分率>95%、中央値99.8%、n=2419);灰色、推測された衝突(n=149、低いおよび高い深度を合わせて6.6%;5/270、高い深度で3.7%)。(D)RNAについては(C)の場合と同じ。青色、推測されたマウス細胞(95.1%のマウス読み取りの純度中央値);赤色、推測されたヒト細胞(91.5%のヒト読み取りの純度中央値);灰色、推測された衝突(n=272、低いおよび高い深度を合わせて12%;7/270、高い深度で5.2%)。(E)RNA-seqシグナルを有するSeuratは、BJ-5taヒト皮膚線維芽細胞(雄)およびHEK293T(雌)細胞に対応する明瞭なクラスターを示す。Y染色体の存在の有無に基づいて、988/1024個の細胞(96.5%)が正しく割り当てられる。
【
図7】
図7A~Eは、交差の有る無しの有糸分裂/均等および減数分裂/還元染色体分離を示す。各縦のセグメントは、1つの染色分体(DNA鎖は示さない)を表す。黒色および青色は、相同体を表す。卵形は、動原体を表す。マウス染色体が端部動原体型であることに留意するべきである。灰色の交差は、4C期のDNA複製の後の交差部位を示す。赤色ボックスはヘテロ接合である有糸分裂の娘細胞を示し、黒色および青色ボックスは、動原体近位領域でそれぞれの系統バックグラウンドについてホモ接合である減数分裂I(meiosis I)(MI)の娘細胞を示す。娘細胞のLOH領域は、巻き毛のブラケットが特徴的である。(A)交差のない有糸分裂/均等分離。両方の娘細胞は、ヘテロ接合性を保持する。(B)相同体間の交差を有する有糸分裂/均等分離。組み換えられた染色分体は分離し、交差に対し動原体遠位のLOHをもたらす。(C)相同体間の交差を有する有糸分裂/均等分離。両方の娘細胞はヘテロ接合性を保持するが1つの娘細胞は連鎖スイッチを有するように、組み換えられた染色分体は一緒に分離する。(D)(B)と違って交差に対し動原体近位のLOHをもたらす、交差を有する減数分裂/還元分離。(E)娘細胞において相互の単為生殖二染色体性(UPD)をもたらす、交差のない減数分裂/還元分離。均等染色体分離を有するMIは、(B)および(C)に似ていることに留意する。本文では、我々の研究は主にMIに重点を置いているので、我々は、姉妹染色分体が一緒に分離するMIの間の予想される減数分裂/還元分離を「還元分離」と呼び、姉妹染色分体が別々に分離するMIの間の予想外の有糸分裂様/均等分離を「均等分離」と呼ぶ。
【
図8】
図8A~Gは、精子および精子前駆体およびFACSによるそれらの倍数性を示す。(A)B6精子の可視化。(B)(B6×Spret)F1精子の可視化。未知の倍数性の小数の丸い生殖細胞、および極めて少ない形態学的に成熟した精子(矢印)が観察される。(C)精巣上体から分離された(B6×Spret)F1精子および精子前駆体は、大きな割合の2C細胞を予想外に含む。375のDAPI電圧。(D)HEK293/Patskiミックス、350のDAPI電圧。Patskiピーク(2C)は、より低いDAPI電圧のために(C)における2Cピークに対してわずかに左にシフトしている。(E)精巣上体から分離された(B6×Cast)F1精子は、1C細胞からほとんど完全になる。375のDAPI電圧。(F)(B6×Cast)F1精子前駆体、解離した精巣からの2C細胞のためのプレソーティング;多数の1C細胞がなお存在する。375のDAPI電圧。(G)sci-L3-WGSの間の(2回のバーコード化の後)FACS工程時の(B6×Cast)F1精子および精子前駆体、なお1C細胞から大部分なる。(F)からのプレソーティングされた2C核の中の混入した1C核の割合に基づいて、2Cであるタグメントされた核の割合は18%と推定され、ホモジナイズされた精巣中の2C核の2.5%から7.2倍の富化である。我々は2C集団からソーティングした(全細胞の約15.4%、タグメンテーション工程で推定された18%に類似する)。375のDAPI電圧。
【
図9】
図9A~Fは、種間雑種マウス雄生殖系列のsci-L3-WGSが、MIにおける非独立均等分離の多数の例を明らかにすることを示す。(A)、(B)および(C)では、赤色線は、HMMによるフィットさせた交差転位を示す。動原体は、各染色体の写真の最も左に位置する。(A)1C細胞のための交差図の例。灰色のドットは、Spret対立遺伝子のために1の値を、およびB6対立遺伝子のために0の値を有する。(B)および(C)では、灰色のドットは、平均40SNP部位のSpretの対立遺伝子頻度を示す。(B)還元分離を有するM2細胞のためのLOH図の例(
図7Dも参照する)。LOHは、交差部位の動原体近位領域に存在する。(C)均等分離を有するM2細胞のためのLOH図の例(
図7Bも参照する)。LOHは、(B)と異なり交差部位の動原体遠位領域に存在する。(D~F)M2細胞の各々のための還元的に(赤色、ピンク色、黒色)および均等に(青色、緑色)分離された染色体の数。各カラムは、1つの単一のM2細胞を表す(1細胞あたり19染色体、色で示す通りに分布される)。(D)二項分布に基づいた、および還元分離の確率pが観察データからのMLE0.76に等しいと仮定した、還元対均等分離の予想される分布。(E)M2細胞における観察データ。稀な場合(27/5,548染色体)では、まばらなSNPカバレージ(パネル最上部の空白)のために、還元対均等分離を区別することができなかった。黒色バーは、染色分体の0または4コピーが観察されたMI不分離(NDJ、合計40染色体)を示す。姉妹染色分体が一緒に分離するので、NDJは還元分離であると考えられることに留意すべきである。(F)(E)と同じであるが、交差(「CO」と略される)の有る無しの染色体の数によってさらに細分化される。細胞は、先ず均等分離染色体の数(薄緑色および青色、降順)によって、次に交差のない観察された均等分離染色体の数(青色、降順)によってソーティングされる。
【
図10】
図10A~Gは、染色体スケールでの減数分裂の交差および単為生殖染色体分布を示す。(A)染色体サイズについて正規化した後、各染色体の上の少なくとも1つの交差を有する一倍体細胞の数は、染色体サイズと負に相関する(r=-0.87、p=2e-6)。(B6×Spret)交雑が示される。(B6×Cast)交雑については、
図14Cを参照する。(B)M2細胞については(A)と同じ(r=-0.91、p=8e-8)。(B6×Cast)交雑については、
図14Dを参照する。(C)一倍体細胞あたりの染色体あたりの交差(CO)数の分布((B6×Spret)については平均=0.62、(B6×Cast)については平均=0.58)。(D)M2細胞については(C)と同じ((B6×Spret)については平均=0.92、(B6×Cast)については平均=1.03)。(E)少なくとも2つの交差を有する染色体のための、全染色体についての交差距離。予想される数の分布は、1染色体につき2つの交差をランダムに置くことによって生成される。(B6×Spret)交雑が示される。(B6×Cast)交雑については、
図14Eを参照する。(F)Patski細胞におけるUPDおよびLOH事象の数(上)および染色体分布(下)。(G)大多数の染色体を還元的に対均等に分離したM2細胞について細分化されたミトコンドリアのコピー数(正規化)。(B6×Spret)交雑。
【
図11】
図11A~Eは、種間雑種マウス雄生殖系列のsci-L3-WGSが、非独立均等分離の多数の例も明らかにすることを示す。(A~B)2つのランダムな1C細胞のダブレットに由来するバーコード第1群からの人工「2C」細胞のための、還元的(赤色)および均等(青色)に分離した染色体の数。各カラムは、1つの単一の2C細胞を表す(1細胞あたり19染色体、色で示す通りに分布する)。(A)二項分布に基づいた、および均等分離の確率pが0.5に等しいと仮定した、還元対均等分離の予想される分布。(B)(A)に示す予想分布に一致する、2C細胞における観察データ。(C~E)2つのランダムな1C核の人工ダブレットおよび実際の2C二次精母細胞の両方の混合物である、バーコード第2群からの非1C細胞のための還元的に(赤色、ピンク色、黒色)および均等に(青色、緑色)分離された染色体の数。各カラムは、1つの単一の非1C細胞を表す(1細胞あたり19染色体、色で示す通りに分布する)。(C)バーコード第2群からの全ての非1C細胞。(D)バイアスされた染色体分離だけを有する、すなわち、均等または還元分離する少なくとも15染色体を有する非1C細胞。黒色バーは、染色分体の0または4コピーが観察された減数分裂I不分離(NDJ、合計2,185染色体のうち2つ)を示す。(E)(D)と同じであるが、交差(「CO」と略される)の有る無しの染色体の数によってさらに細分化される。細胞は、先ず均等分離染色体の数(薄緑色および青色、降順)によって、次に交差のない観察された均等分離染色体の数(青色、降順)によってソーティングされる。
【
図12】
図12A~Cは、マウス雄生殖系列のsci-L3-WGSからの観察データ(下)と比較した3つの二項分布によるフィットさせた有限混合モデル(上)を示す。混合モデル化の詳細については、実施例2を参照する。(A)(B6×Cast)ハイブリッドにおけるバーコード第1群からの非1C細胞の混合モデル化。(B)(B6×Cast)ハイブリッドにおけるバーコード第2群からの非1C細胞の混合モデル化。(C)(B6×Spret)交雑からの2C細胞の混合モデル化。
【
図13】
図13A~Iは、染色体スケールでの減数分裂の交差および単為生殖染色体分布を示す。(A)染色体サイズによって正規化した交差(cM/Mb)の数は、一倍体細胞における染色体サイズと負に相関する(r=-0.66、p=0.002)。(B6×Spret)交雑を示す。(B6×Cast)交雑については、
図14Aを参照する。(B)M2細胞については(A)と同じ(r=-0.83、p=1e-5)。(B6×Spret)交差を示す。(B6×Cast)交差については、
図14Bを参照する。(C)一倍体細胞あたりの染色体あたりの交差(CO)頻度の分布。数の分布については、
図10Cを参照する。(D)M2細胞については(C)と同じ。数の分布については、
図S6Dを参照する。(E)少なくとも2つの交差を有する染色体については、第1、第2、第12および第13染色体の交差の間の距離(Mb)。全ての染色体については
図S6Eを参照する。(B6×Spret)交雑を示す。(B6×Cast)交雑については、
図14Eを参照する。予想される数の分布は、1染色体につき2つの交差をランダムに置くことによって生成される。ボックス図は、(B6×Cast)交雑が(B6×Spret)交雑より強力な交差干渉を有することを示す(p=5e-91)。(F)一倍体(中央値=8、平均=8.1)、M2細胞(中央値=1、平均=1.1)または他の二倍体/4C(中央値=0、平均=0.4)細胞あたりの単為生殖染色体数のヒストグラム。(B6×Spret)交雑を示す。(B6×Cast)交雑については、
図14Fを参照する。(G)一倍体(r=-0.87、p=2e-6)、M2細胞(r=-0.75、p=2e-4)および他の二倍体/4C(r=-0.68、p=0.001)細胞のための単為生殖染色体分布。(B6×Spret)交雑を示す。(B6×Cast)交雑については、
図14Gを参照する。(H)(B6×Spret)(左)および(B6×Cast)(右)交雑における逆分離事象の染色体分布。(I)一倍体、M2細胞および他の二倍体/4C二倍体細胞のための、読み取り深度によって正規化した1細胞あたりのミトコンドリア読み取りの数。(B6×Spret)交雑。
【
図14】
図14A~Gは、減数分裂の交差およびUPDのための染色体分布を示す(B6×Cast)。(A)染色体サイズによって正規化した交差(cM/Mb)の数は、一倍体細胞における染色体サイズと負に相関する(r=-0.65、p=0.003)。(B6×Cast)交雑。(B)M2細胞については(A)と同じ(r=-0.9、p=2e-7)。(B6×Cast)交雑。(C)染色体サイズについて正規化した後、各染色体の上の少なくとも1つの交差を有する一倍体細胞の数は、染色体サイズと負に相関する(r=-0.85、p=5e-6)。(B6×Cast)交雑。(D)M2細胞については(C)と同じ(r=-0.94、p=3e-9)。(B6×Cast)交雑。(E)少なくとも2つの交差を有する染色体のための、全染色体についての交差距離。予想される数の分布は、1染色体につき2つの交差をランダムに置くことによって生成される。(B6×Cast)交雑。(F)一倍体(中央値=8、平均=8.9)およびM2細胞(中央値=0、平均=0.54)細胞あたりの単為生殖染色体数。(B6×Cast)交雑。(G)単為生殖染色体分布(括弧に示す染色体サイズとの相関)、一倍体(r=-0.8、p=4e-5)およびM2細胞(r=-0.45、p=0.05)。(B6×Cast)交雑。
【
図15】
図15A~Cは、交差ブレークポイントパイルアッププロファイルを示す。(A)上から下へ:B6のためのSSDSマップによる減数分裂のDSBホットスポット、Castおよび(B6×Cast)F1ハイブリッド、この研究で作成された(B6×Spret)および(B6×Cast)における交差マップ。一倍体対M2細胞の内訳ならびにSpol1-オリゴマップについては、(B)および(C)を参照する。(B)上から下へ:1)(B6×Cast)F1ハイブリッドのためのSSDSによる減数分裂DSBホットスポットマップ、2)(B6×Cast)の一倍体交差マップ、および3)(B6×Cast)のM2細胞交差マップ。(C)上から下へ:1)「対称形の」ホットスポットを有するSpo11-オリゴマップによる減数分裂DSBホットスポット、2)全ホットスポットを有するSpo11-オリゴマップによる減数分裂DSBホットスポット:PRDM9モチーフは考慮されない。3)(B6×Spret)における一倍体交差マップ、および4)(B6×Spret)におけるM2細胞交差マップ。
【
図16】
図16A~Fは、減数分裂交差ホットニスおよび説明的なゲノムフィーチャーを示す。(A)BMAによる交差ホットニスに関連したフィーチャーのための境界線上の包含確率。x軸は、事後確率によってモデルをランク付けし、ここで、灰色のボックスは各モデルに含まれないフィーチャーを示し(縦線、上位20モデルを示す)、オレンジ色のスケールはモデルの事後確率を示す。(B6×Spret)および(B6×Cast)交雑からの統合データセットをここに示す。別々に分析した2つの交雑については、
図15を参照する。(B)ブレークポイント分解能のためのサイズの分布(log正規分布)。左:(B6×Spret)、中央値150kb。右:(B6×Cast)、中央値250kb。(C~D)各染色体の右端交差の位置。染色体の長さは、赤色線の範囲よりも右端のSNP(黒色バー)によって示される。(C)M2細胞。(B6×Cast)(左)交雑における交差は、染色体の動原体遠位末端を好むが、(B6×Spret)交雑(右)における交差は各染色体の腕の中央領域を好む。染色体間の変動性について考慮した後に、(B6×Spret)交雑における交差は動原体に平均して5.5Mbより近位であると推定する。1C細胞以外類似している、
図20Aを参照する。(D)1CおよびM2細胞を比較する、(B6×Spret)交雑。染色体間の変動性について考慮した後に、M2細胞(右)における交差は、(B6×Spret)交雑における1C(左)より動原体に平均して9.4Mb近位であると推定する。(B6×Cast)交雑において、より低い程度の同じ傾向が観察される(
図20Bを参照する)。(E)0.73のAUCは、マウスゲノムから描かれる領域がB6×Spret交差地帯かまたは同数のランダムにサンプリングした地帯から来るか予測することにおける、予想される精度を定量化する。左:全部で76フィーチャー。右:MIP>0.5のBMAからの25フィーチャーのサブセット。(F)0.85のAUCは、マウスゲノムから描かれる領域がB6×Cast交差地帯かまたは同数のランダムにサンプリングした地帯から来るか予測することにおける、予想される精度を定量化する。左:全部で69フィーチャー。右:MIP>0.5のBMAからの25フィーチャーのサブセット。
【
図17】
図17A~Bは、BMAによる交差ホットニスに関連したフィーチャーのための境界線上の包含確率を示す。x軸は、事後確率によってモデルをランク付けする。(A)(B6×Cast)交雑。(B)(B6×Spret)交雑。
【
図18】
図18は、(B6×Cast)交雑における交差事象およびゲノムフィーチャーの両方のための相関マトリックスを示す。ここでは、100kbウィンドウで計算した、様々な交差パイルアップトラックとゲノムフィーチャーの間の全ての可能なペアワイズ相関を示す。交差パイルアップトラックは、最初の5つのカラムまたは列(「事象」接頭辞;赤色テキスト表示)であり、残りはモデル化で使用した同じゲノムフィーチャーである(青色テキスト表示)。接尾辞「hp_m2」、「hp」、「m2」、「mt」および「me」が付いた交差パイルアップトラックは、それぞれ、一倍体およびM2細胞、一倍体、M2細胞、バイアスされた均等分離を有するM2細胞ならびにバイアスされた還元分離を有するM2細胞に由来する。青色の四角は正の相関を示し、赤色の四角は負の相関を示す。フィーチャーは、階層的クラスタリングによって順序付けられる。オープンな楕円形はフィーチャー「テロメア」および「分位数_75_100」を強調表示し、それは本文に記載の通りに2つの交雑における異なる傾向を示す。
【
図19】
図19は、(B6×Spret)交雑における交差事象およびゲノムフィーチャーの両方のための相関マトリックスを示す。
図18凡例に記載のものと同じフォーマット。
【
図20】
図20A~Eは、各染色体の上の右端の交差の位置を示す。(A)一倍体細胞。両方の交雑において、交差は、染色体の動原体遠位末端を好む。(B)一倍体およびM2細胞を比較する(B6×Cast交雑)。染色体間の変動性について考慮した後に、M2細胞における交差は、(B6×Cast)交雑における一倍体より動原体に平均して5.2Mb近位であると推定する。(C)バイアスされた染色体分離を有するM2細胞を比較する。染色体間の変動性について考慮した後に、バイアスされた均等分離を有するM2細胞における交差は、(B6×Cast)交雑におけるバイアスされた還元分離を有するM2細胞のものより動原体に平均して13.7Mb遠位であると推定する。(D)(B6×Spret)交雑の(C)と同じ。交差は、動原体に平均して8.7Mbより遠位である。(E)適切な染色体分離に及ぼす交差位置の影響のモデル。動原体により近い(最後の四分位ではなく中央の2つの四分位の)交差は、より強力な腕粘着を有することによって還元分離を促進することができる;しかし、染色体腕の末端の近くの交差は、より強力なCEN粘着を有することによってMII分離を促進することができる。
【
図21】
図21は、B6×Spret交雑における交差ホットスポットを区別するフィーチャーの主成分分析を示す。「chr3_bp(ブレークポイント)」および「chr1_upc(単為生殖染色体)」は、全ての染色体のために含まれたフィーチャーの代表であることに留意する。115個の全フィーチャーのうちの44個を示す。省略した36個の他の染色体ブレークポイントおよびUPCフィーチャー以外の35個の他のフィーチャーは、明らかな傾向の欠如のために示されない。
【
図22】
図22は、B6×Cast交雑の交差ホットスポットを区別するフィーチャーの主成分分析を示す。「chr3_bp(ブレークポイント)」および「chr1_upc(単為生殖染色体)」は、全ての染色体のために含まれたフィーチャーの代表であることに留意する。108個の全フィーチャーのうちの19個を示す。省略した36個の他の染色体ブレークポイントおよびUPCフィーチャー以外の53個の他のフィーチャーは、明らかな傾向の欠如のために示されない。
【
図23】
図23は、減数分裂の交差と染色体誤分離の間の関係のモデルを示す。「MI」:減数分裂I、「CEN」:動原体(楕円形または丸い円)、「IH」:相同体間。本開示の例示的実施形態の以下の詳細な記載は、以下の図と一緒に読むときに最も良く理解することができる。
【発明を実施するための形態】
【0050】
略図は、スケール通りとは限らない。図において使用される類似の番号は、類似の構成成分、工程などを指す。しかし、所与の図における構成成分を指す番号の使用は、同じ番号で表示される別の図の構成成分を限定することを意図していないことが理解されよう。さらに、構成成分を指す異なる番号の使用は、異なる番号の付いた構成成分が他の番号の付いた構成成分と同じでも類似するはずでもないことを示すことを意図していない。
【0051】
本明細書で提供される方法は、例えば、全ゲノム(sci-WGS)、トランスクリプトーム(sci-RNA)、ゲノムおよびトランスクリプトーム(sci-DNA/RNA)および/またはメチローム(sci-MET)の共アッセイを含む、複数の単細胞または核の単細胞コンビナトリアルインデクシング(sci)シークエンシングライブラリーを生成するために使用することができる。一実施形態では、本方法は、目的の1つまたは複数の特異的領域の標的化シークエンシングのために使用することができる。例えば、標的化配列のために選択的に富化するために、特異的領域(例えば、コード領域、非コード領域等)にハイブリダイズするプライマー、ガイドRNAまたはガイドRNAによって挿入されるヌクレオチド配列を使用することができる。一実施形態では、個々の遺伝子編集、DNA編集もしくは編集のためのマーカー、細胞または核からの遺伝子サイン、摂動および/または機能的読み取り(RNA、DNA、タンパク質または組合せ)のための情報を収集し、分析することができる(Perturb-seq)。他の実施形態では、本方法は、クロマチンアクセス性(sci-ATAC)、クロマチン高次構造(Hi-C)および他の単細胞コンビナトリアルインデクシング方法を評価するために使用することができる。
【0052】
本方法は、単離した核または細胞を提供すること、核または細胞のサブセットをコンパートメントに分配すること、それらが核酸断片を含むように核または細胞を処理すること、コンパートメント特異的インデックスを核酸断片に加えること、および線形増幅によって核酸断片を増幅することを含む。これらの工程は異なる順序で起こることができ、異なる方法で組み合わせることができる。3つの実施形態を、
図1Aおよび1Bに示す。一実施形態では、本方法は、核酸断片を含有する単離した核または細胞の分配されたサブセットを提供することを含む(
図1A、ブロック1、および
図1B、ブロック1)。
図1ABに示すように、線形増幅による核酸断片の増幅(
図1A、ブロック2)に続いて、増幅された核酸断片にインデックスが加えられる(
図1A、ブロック3)。
図1Bに示すように、分配された核または細胞の中の核酸断片はインデックスを含み、核酸断片は線形増幅によって増幅される(
図1B、ブロック2)。単離した核または細胞を提供する工程、単離した核または細胞のサブセットを分配する工程、核酸断片を含むように単離した核または細胞を処理する工程、コンパートメント特異的インデックスを加える工程、および線形増幅によって核酸断片を増幅する工程が本明細書に記載される。
【0053】
単離した核または細胞を提供する
本明細書で提供される方法は、細胞または複数の細胞から単離した核を提供することを含む。細胞および核は、任意の試料、例えば、任意の生物体(複数可)に、および生物体(複数可)の任意の細胞型または任意の組織に由来することができる。一実施形態では、細胞は、生殖細胞、例えば精子細胞または卵細胞であってよい。一実施形態では、組織は、生殖組織、例えば精巣上体であってよい。一実施形態では、細胞または核は、がんまたは病的な組織に由来することができる。本方法は、細胞を解離させることおよび/または核を単離することをさらに含むことができる。核を細胞から単離するための方法は当業者に公知であり、ルーチンである。核または細胞の数は、少なくとも2つであってよい。上限は、本明細書に記載される方法の他の工程で使用される装置(例えば、マルチウェルプレート)の実際の限界に依存する。使用することができる核または細胞の数は限定するものではなく、数10億を数えることができる。例えば、一実施形態では、核または細胞の数は、100,000,000以下、10,000,000以下、1,000,000,000以下、100,000,000以下、10,000,000以下、1,000,000以下、100,000以下、10,000以下、1,000以下、500以下、または50以下であってよい。1つまたは複数の試料を提供することができる。例えば、試料は、1生物体からの1つの細胞型または組織であってよい。試料を同定し、次に組み合わせるために、本明細書に記載されるインデクシング方法を使用して、複数の試料、例えば、1生物体からの異なる細胞型、2つ以上の生物体からの1つの細胞型もしくは組織、または2つ以上の生物体からの異なる細胞型もしくは組織を第1のインデックスで別々にインデックス付けすることができる。当業者は、一部の実施形態では、各核の中の核酸分子は、生物体の全体の遺伝子相補体(生物体の全ゲノムとも呼ばれる)を表し、イントロンおよびエクソン配列の両方、ならびにプロモーターおよびエンハンサー配列などの非コード調節配列を含むゲノムDNA分子であることを認める。
【0054】
核の単離は、少なくとも1~20分、例えば5、10または15分の間細胞溶解緩衝液の中で細胞をインキュベートすることによって達成することができる。適宜、ピペットによる移動などの、溶解を助ける外部の力に細胞を曝露させることができる。細胞溶解緩衝液の例には、10mMトリス-HCl、pH7.4、10mM NaCl、3mM MgCl2、0.1%IGEPAL CA-630および1%SUPERase In RNase Inhibitorが含まれる。当業者は、核を単離する細胞溶解緩衝液の有用性を低減することなく、構成成分のこれらのレベルを若干変更することができることを認める。当業者は、RNアーゼ阻害剤、BSAおよび/または界面活性剤が核の単離のために使用される緩衝液において有益である可能性があること、および他の下流の単細胞コンビナトリアルインデクシング用のために他の添加剤を緩衝液に加えることができることを認める。
【0055】
一実施形態では、接着性であるかまたは懸濁状である個々の細胞から核が単離される。個々の細胞から核を単離する方法は、当業者に公知である。一実施形態では、組織の中に存在する細胞から核が単離される。単離された核を得る方法は、組織を調製すること、および調製した組織から核を単離することを一般的に含む。一実施形態では、全ての工程は、氷の上で実行される。
【0056】
組織の調製は、液体窒素の中で組織を急冷凍すること、次に組織のサイズを1mm以下の直径の断片に低減するために組織を細かく切り刻むかまたは鈍い力を加えることを含むことができる。適宜、冷たいプロテアーゼおよび/または細胞間連絡を破壊するための他の酵素を使用することができる。細かく切り刻むことは、組織を小片に切るための刃で達成することができる。鈍い力を加えることは、ハンマーまたは類似の物体によって組織を粉砕することによって達成することができ、粉砕された組織の生じる組成物は粉末と呼ばれる。
【0057】
従来の組織核抽出技術は、通常、組織を組織特異的酵素(例えば、トリプシン)と一緒に高温(例えば、37℃)で30分間から数時間インキュベートし、その後、核抽出のために細胞溶解緩衝液で細胞を溶解させる。本明細書におよび米国特許仮出願第62/680,259号に記載される核単離方法は、いくつかの利点を有する:(1)人工酵素は導入されず、全ての工程は氷の上で実行される。これは、細胞状態(例えば、トランスクリプトーム状態、クロマチン状態またはメチル化状態)への潜在的摂動を低減する。(2)脳、肺、腎臓、脾臓、心臓、小脳、および腫瘍組織などの疾患試料を含むほとんどの組織型にわたってこれは検証されている。異なる組織型のために異なる酵素を使用する伝統的な組織核抽出技術と比較して、新しい技術は、異なる組織からの細胞状態を比較するときバイアスを潜在的に低減することができる。(3)本方法は、酵素処理工程を取り除くことによって、費用も低減し、効率も増加させる。(4)他の核抽出技術(例えば、Dounce組織グラインダー)と比較して、本技術は異なる組織型のためにより頑強であり(例えば、Dounce法は異なる組織のためにDounceサイクルを最適化することを必要とする)、大きな試料片をハイスループットで処理することを可能にする(例えば、Dounce法はグラインダーのサイズに制限される)。
【0058】
単離した核または細胞はヌクレオソームを含むことができるか、ヌクレオソーム無しであってよいか、または核のヌクレオソームを枯渇させる条件に付し、ヌクレオソームが枯渇された核を生成することができる。ヌクレオソームが枯渇された核は、細胞の全ゲノムまたはその分画のDNA配列を決定するための方法において有益である。
【0059】
一実施形態では、ヌクレオソーム枯渇のために使用する条件は、単離した核の完全性を維持する。一般的に、ヌクレオソーム枯渇方法は単細胞のペレットまたは懸濁液で使用され、したがって、接着性の細胞培養または組織が細胞の供給源として使用される実施形態では、供給源は単細胞のペレットまたは懸濁液を得るために処理される。
【0060】
ヌクレオソーム枯渇のための方法は公知でルーチンであり、限定されずに、酵素処理および化学的処理を含む。一実施形態では、ヌクレオソーム枯渇のための条件には、核酸-タンパク相互作用を破壊することが可能なカオトロピック剤による化学的処理が含まれる。有益なカオトロピック剤の例には、3,5-リチウムジヨードサリチル酸が限定されずに含まれる。3,5-リチウムジヨードサリチル酸を使用するための条件には、それを細胞のペレットに加え、氷の上でインキュベートすることが含まれる。
【0061】
好ましい実施形態では、条件には、核酸-タンパク相互作用を破壊することが可能な洗浄剤による化学的処理が含まれる。有益な洗浄剤の例には、ドデシル硫酸ナトリウム(SDS)が限定されずに含まれる。SDSを使用するための条件には、それを細胞のペレットに加えて42℃などの高温でインキュベートすること、次にTriton(商標)X-100などの非イオン性洗浄剤を加えて42℃などの高温でインキュベートすることが含まれる。
【0062】
一部の実施形態では、SDSなどの洗浄剤を使用するとき、核はヌクレオソーム枯渇の前に架橋剤に曝露させられる(WO2018/018008)。一実施形態では、核は細胞の中にある間に架橋剤に曝露させられ、別の実施形態では、単離された核が架橋剤に曝露させられる。架橋剤の有益な例には、ホルムアルデヒドが限定されずに含まれる(Hoffman et al., 2015, J. Biol. Chem., 290:26404-26411)。ホルムアルデヒドによる細胞の処理は、ホルムアルデヒドを細胞懸濁液に加えて、室温でインキュベートすることを含むことができる。一実施形態では、ホルムアルデヒド処理の後、核をグリシンおよびIgepal(登録商標)などの非イオン性の非変性洗浄剤に曝露させることができる。
【0063】
単離される核の中のヌクレオソームを枯渇させるプロセスの間、単離される核の完全性は維持される。ヌクレオソームを枯渇させるための条件への曝露の後に核がインタクトなままかどうかは、位相差画像化などのルーチンの方法によって核の状態を可視化することによって決定することができる。一実施形態では、ヌクレオソーム枯渇の後にインタクトな核の数は、1~1,000、1,000~10,000、10,000~100,000、100,000~1,000,000、1,000,000~10,000,000または10,000,000~100,000,000であってよい。
【0064】
本明細書に記載される提供する工程、プールする工程および分配する工程を含む核または細胞の人為操作は、核緩衝液の使用を含むことができる。核緩衝液の例には、10mMトリス-HCl、pH7.4、10mM NaCl、3mM MgCl2、1%SUPERase In RNase Inhibitor(20U/μL、Ambion)および1%BSA(20mg/ml、NEB)が含まれる。当業者は、核を懸濁させる核緩衝液の有用性を低減することなく、構成成分のこれらのレベルを若干変更することができることを認める。当業者は、核を懸濁させる核緩衝液の有用性を低減することなく、様々な構成成分を置換することができることも認める。
【0065】
一実施形態では、細胞(核が単離される細胞を含む)は、異なる所定の条件に曝露させられている。例えば、細胞のサブセットは、異なる所定の条件に曝露させることができる。異なる条件は、例えば、異なる培養条件(例えば、異なる培地、異なる環境条件)、薬剤の異なる用量、異なる薬剤または薬剤の組合せを含むことができる。薬剤は、本明細書に記載される。細胞および/または1つまたは複数の試料の各サブセットの核または細胞は、1つまたは複数のインデックス配列でインデックスが付けられ、プールされ、大規模に多重の単一核または単細胞シークエンシング方法によって分析される。単一核トランスクリプトームシークエンシング(米国特許仮出願第62/680,259号およびGundersonら(WO2016/130704))、単一核の全ゲノムシークエンシング(米国特許出願公開第2018/0023119号)、またはトランスポゾンアクセス可能クロマチンの単一核シークエンシング(米国特許第10,059,989号)、sci-HiC(Ramani et al., Nature Methods, 2017, 14:263-266)、DRUG-seq(Ye et al., Nature Commun., 9, article number 4307)、Perturb-seq(Dixit et al., Cell, 2016, 167(7):1853-1866.e17)、またはDNA、RNAおよびタンパク質からの分析物の任意の組合せ、例えばsci-CAR(Cao et al., Science, 2018, 361(6409):1380-1385)を限定されずに含む、事実上いかなる単一核または単細胞シークエンシング方法も使用することができる。試料インデックスとしてインデックスの使用を含む、初期スプリット-アンド-プールインデクシング(例には10Xゲノム研究Chromium(商標)システムまたはBiorad ddseqシステムが含まれる)の後、液滴ベースの単細胞分析を適用することもできる。異なる条件から個々の細胞または核を非多重化および同定するために、核ハッシングが使用される。
【0066】
一実施形態では、細胞の各サブセットが、薬剤または摂動に曝露させられる。薬剤は、細胞に変化を引き起こす事実上いかなるものであってもよい。例えば、薬剤は、細胞のトランスクリプトームを変更することができるか、細胞のクロマチン構造を変更することができるか、細胞中のタンパク質の活性を変更することができるか、細胞のDNAを変更することができるか、細胞のDNA編集を変更することができるか、または他の変化を引き起こすことができる。薬剤の例には、限定されずに、化合物、例えばタンパク質(抗体を含む)、非リボソームタンパク質、ポリケチド、有機分子(900ダルトン以下の有機分子を含む)、無機分子、RNAまたはRNAi分子、炭水化物、糖タンパク質、核酸またはその組合せが含まれる。一実施形態では、薬剤は、遺伝子の摂動、例えばDNA編集タンパク質および/またはガイドRNA、例えばCRISPRまたはTalenを引き起こす。一実施形態では、薬剤は治療薬である。一実施形態では、細胞は野生型の細胞であってよく、別の実施形態では、遺伝子の摂動、例えば遺伝子ノックインまたは遺伝子ノックアウトを含むように細胞を遺伝子改変することができる(Szlachta et al., Nat Commun., 2018, 9:4275)。細胞のサブセットを同じ薬剤に曝露させることができるが、マルチウェル装置のコンパートメントにわたって異なる変数を変更することができ、単一の実験で複数の変数を試験することを可能にする。例えば、異なる投薬量、異なる曝露時間および異なる細胞型を単一のプレートで試験することができる。一実施形態では、細胞は、既知の活性を有するタンパク質を発現することができ、活性に及ぼす薬剤の影響を異なる条件で評価することができる。核酸断片を標識するインデックス配列の使用は、核または細胞の特異的サブセット、例えばマルチウェルプレートの1つのウェルに由来する核酸の後の同定を可能にする。
【0067】
サブセットを分配する
本明細書で提供される方法は、核、例えばヌクレオソームが枯渇された核または細胞のサブセットを、複数のコンパートメントに分配することを含む。本方法は、単離した核または細胞の集団(本明細書ではプールとも呼ばれる)がサブセットに分割される、複数の分配工程を含むことができる。一般的に、単離した核または細胞のサブセットのプールから複数のコンパートメントへの分配は、単離した核または細胞のサブセットに存在する核酸断片へのインデックスの付加の前に起こる。したがって、本方法は、プールされた単離した核または細胞をとってそれらを分配する少なくとも1つの「スプリットアンドプール」工程を含み、ここで、「スプリットアンドプール」工程の数は、核酸断片に加えられる異なるインデックスの数に依存することができる。インデックスを付けた後、十分な数のインデックスが核酸断片に加えられるまで、必要に応じてサブセットをプールし、サブセットに分割し、インデックスを付け、再びプールすることができる。
【0068】
サブセットに、したがって各コンパートメントに存在する核または細胞の数は、少なくとも1つであってよい。一実施形態では、サブセットに存在する核または細胞の数は、100,000,000以下、10,000,000以下、1,000,000以下、100,000以下、10,000以下、4,000以下、3,000以下、2,000以下、または1,000以下、500以下または50以下である。一実施形態では、サブセットに存在する核または細胞の数は、1~1,000、1,000~10,000、10,000~100,000、100,000~1,000,000、1,000,000~10,000,000または10,000,000~100,000,000であってよい。一実施形態では、各サブセットに存在する核または細胞の数は、概ね等しい。サブセットに、したがって各コンパートメントに存在する核の数は、インデックスの衝突を低減する要求に一部基づき、それは、本方法のこの工程の同じコンパートメントに存在する同じトランスポザーゼインデックスを有する2つの核の存在のことである。核または細胞をサブセットに分配するための方法は、当業者に公知であり、ルーチンである。例には、限定されずに、蛍光標示式細胞分取(FACS)サイトメトリーおよび単純希釈が含まれる。適宜、異なる倍数性の核を染色、例えばDAPI(4’,6-ジアミジノ-2-フェニルインドール)染色によってゲーティングし、富化することができる。
【0069】
分配工程(およびインデックスの以降の付加)におけるコンパートメントの数は、使用するフォーマットに依存することができる。例えば、コンパートメントの数は、2から96コンパートメント(96ウェルプレートが使用されるとき)、2から384コンパートメント(384ウェルプレートが使用されるとき)、または2から1536コンパートメント(1536ウェルプレートが使用されるとき)であってよい。一実施形態では、各コンパートメントは、液滴であってよい。使用するコンパートメントのタイプが2つ以上の核または細胞を含有する液滴であるとき、任意の数の液滴、例えば少なくとも10,000、少なくとも100,000、少なくとも1,000,000または少なくとも10,000,000の液滴を使用することができる。一実施形態では、コンパートメントの数は、24である。
【0070】
核酸断片を生成する処理
一実施形態では、単離した核または細胞の中のDNA核酸、例えば染色体および/またはプラスミドを核酸断片に断片化するために、単離した核または細胞の処理を使用することができる。配列決定をする標的核酸が核または細胞に存在するDNAに由来するとき、処理が一般的に必要である。しかし、一部の実施形態では、RNA分子は断片化する必要がしばしばないので、配列決定をする標的核酸が核または細胞に存在するRNA(例えば、mRNAおよび/または非コードRNA)に由来するとき、処理は適宜である。核または細胞の中の核酸を処理することは、ヌクレオチド配列を処理によって生成される核酸断片の片方または両方の末端に一般的に加え、ヌクレオチド配列は1つまたは複数の遍在配列を含むことができ、および一般的に含む。遍在配列は、例えば、ライゲーション、プライマー伸長または増幅の以降の工程による核酸断片へのインデックスなどの別のヌクレオチド配列の付加のためのプライマーとして使用することができるヌクレオチド配列をアニールする以降の工程における「ランディングパッド」として使用することができる。そのようなプライマーのヌクレオチド配列は、インデックス配列を含んでもよい。核または細胞の中の核酸を処理することは、処理によって生成される核酸断片の片方または両方の末端に1つまたは複数の特異な分子識別子を加えることができる。
【0071】
核酸断片への核酸の処理が起こることができるいくつかの時点が本方法の中にある。例えば、一実施形態では、単離された核または細胞は、単離した核または細胞のサブセットを分配する前に処理することができる。このような実施形態では、全ての単離した核または細胞が組み合わされたときコンパートメント特異的インデックスを加えることはいかなる目的にも一般的に役立たないので、処理は、コンパートメント特異的インデックスでなく、遍在配列および/または遍在分子識別子の核酸断片への付加を一般的に含む。別の実施形態では、単離した核または細胞は、異なるコンパートメントへのサブセットの分配の後に処理することができる(例えば、
図1Aおよび
図1Bを参照)。この実施形態の1つの態様では、処理はインデックスを加えず(
図1A、ブロック1)、この実施形態の別の態様では、処理はコンパートメント特異的インデックスの付加を含むことができる(
図1B、ブロック1)。本方法におけるいかなる時点での処理も、核酸断片の片方または両方の末端への遍在配列および/または遍在分子識別子の付加を含むことができる。
【0072】
核または細胞の中の核酸の核酸断片への処理のための様々な方法が、公知である。例には、CRISPRおよびTalen様酵素、ならびにDNA断片がハイブリダイズして伸長または増幅を開始することができる一本鎖の領域を作製することができるDNAを巻き戻す酵素(例えば、ヘリカーゼ)が含まれる。例えば、ヘリカーゼベースの増幅を使用することができる(Vincent et al., 2004, EMBO Rep., 5(8):795-800)。一実施形態では、伸長または増幅は、ランダムプライマーで開始される。一実施形態では、トランスポソーム複合体が使用される。トランスポソーム複合体は、トランスポザーゼ認識部位に結合しているトランスポザーゼであり、時には「タグメンテーション」と呼ばれる方法で核の中の標的核酸にトランスポザーゼ認識部位を挿入することができる。一部のそのような挿入事象では、トランスポザーゼ認識部位の1本の鎖は、標的核酸に移転させることができる。そのような鎖は、「移転鎖」と呼ばれる。一実施形態では、トランスポソーム複合体は、2つのサブユニットを有する二量体のトランスポザーゼおよび2つの不連続のトランスポゾン配列を含む。別の実施形態では、トランスポザーゼは、2つのサブユニットを有する二量体のトランスポザーゼおよび連続したトランスポゾン配列を含む。一実施形態では、トランスポザーゼ認識部位の片方または両方の鎖の5’末端は、リン酸化することができる。
【0073】
一部の実施形態は、機能亢進性のTn5トランスポザーゼおよびTn5型のトランスポザーゼ認識部位(Goryshin and Reznikoff, J. Biol. Chem., 273:7367 (1998))、または、MuAトランスポザーゼならびにR1およびR2末端配列を含むMuトランスポザーゼ認識部位(Mizuuchi, K., Cell, 35: 785, 1983;Savilahti, H, et al., EMBO J., 14: 4893, 1995)の使用を含むことができる。当業者によって最適化されるような、Tn5 Mosaic End(ME)配列を使用することもできる。
【0074】
本明細書で提供される組成物および方法のある特定の実施形態で使用することができるトランスポジションシステムのより多くの例には、スタフィロコッカス・アウレウス(Staphylococcus aureus)Tn552(Colegio et al., J. Bacteriol., 183: 2384-8, 2001; Kirby C et al., Mol. Microbiol., 43: 173-86, 2002)、Ty1(Devine & Boeke, Nucleic Acids Res., 22: 3765-72, 1994および国際公開第95/23875号)、トランスポゾンTn7(Craig, N L, Science. 271: 1512, 1996;Craig, N L, Review in: Curr Top Microbiol Immunol., 204:27-48, 1996)、Tn/OおよびIS10(Kleckner N, et al., Curr Top Microbiol Immunol., 204:49-82, 1996)、Marinerトランスポザーゼ(Lampe D J, et al., EMBO J., 15: 5470-9, 1996)、Tc1(Plasterk R H, Curr. Topics Microbiol. Immunol., 204: 125-43, 1996)、Pエレメント(Gloor, G B, Methods Mol. Biol., 260: 97-114, 2004)、Tn3(Ichikawa & Ohtsubo, J Biol. Chem. 265:18829-32, 1990)、細菌性挿入配列(Ohtsubo & Sekine, Curr. Top. Microbiol. Immunol. 204: 1-26, 1996)、レトロウイルス(Brown, et al., Proc Natl Acad Sci USA, 86:2525-9, 1989)、および酵母のレトロトランスポゾン(Boeke & Corces, Annu Rev Microbiol. 43:403-34, 1989)が含まれる。より多くの例には、IS5、Tn10、Tn903、IS911およびトランスポザーゼファミリー酵素の工学操作バージョンが含まれる(Zhang et al., (2009) PLoS Genet. 5:e1000689. Epub 2009 Oct 16;Wilson C. et al (2007) J. Microbiol. Methods 71:332-5)。
【0075】
本明細書で提供される方法および組成物で使用することができるインテグラーゼの他の例には、レトロウイルスインテグラーゼ、およびHIV-1、HIV-2、SIV、PFV-1、RSVからのインテグラーゼなどのそのようなレトロウイルスインテグラーゼのためのインテグラーゼ認識配列が含まれる。
【0076】
本明細書に記載される方法および組成物で有益なトランスポゾン配列は、米国特許出願公開第2012/0208705号、米国特許出願公開第2012/0208724号および国際出願番号WO2012/061832に提供される。一部の実施形態では、トランスポゾン配列は、第1のトランスポザーゼ認識部位および第2のトランスポザーゼ認識部位を含む。トランスポソーム複合体がインデックス配列を導入するために使用される実施形態では、インデックス配列は、トランスポザーゼ認識部位の間に、またはトランスポゾンの中に存在することができる。
【0077】
本明細書で有益な一部のトランスポソーム複合体は、2つのトランスポゾン配列を有するトランスポザーゼを含む。一部のそのような実施形態では、2つのトランスポゾン配列はお互いに連結されておらず、言い換えると、トランスポゾン配列はお互いと連続していない。そのようなトランスポソームの例は、当技術分野で公知である(例えば、米国特許出願公開第2010/0120098号を参照する)。
【0078】
一部の実施形態では、トランスポソーム複合体は、2つのトランスポザーゼサブユニットに結合して「ループ状の複合体」または「ループ状のトランスポソーム」を形成する、トランスポゾン配列核酸を含む。一例では、トランスポソームは、二量体のトランスポザーゼおよびトランスポゾン配列を含む。ループ状の複合体は、元の標的DNAの命令情報を維持しつつ、および標的DNAを断片化することなしに、トランスポゾンが標的DNAに挿入されることを確実にすることができる。理解されるように、ループ状の構造は、標的核酸の物理的連続性を維持しつつ、インデックスなどの所望の核酸配列を標的核酸に挿入することができる。一部の実施形態では、ループ状のトランスポソーム複合体のトランスポゾン配列は、トランスポゾン配列を断片化して2つのトランスポゾン配列を含むトランスポソーム複合体を作製することができるように、断片化部位を含むことができる。そのようなトランスポソーム複合体は、トランスポゾンが挿入される近隣の標的DNA断片が、アッセイの後の段階で明白にアセンブルすることができるコード組合せを受けることを確実にするのに有益である。
【0079】
一実施形態では、核酸を断片化することは、核酸に存在する断片化部位を使用して達成される。一般的に、断片化部位は、トランスポソーム複合体を使用して標的核酸に導入される。一実施形態では、核酸が断片化された後、トランスポザーゼは核酸断片に付着したままであり、そのため、同じゲノムDNA分子に由来する核酸断片は物理的に連結されたままである(Adey et al., 2014, Genome Res., 24:2041-2049)。例えば、ループ状のトランスポソーム複合体は、断片化部位を含むことができる。断片化部位は、標的核酸に挿入されたインデックス配列の間の情報の関連でなく物理的関連を切断するために使用することができる。切断は、生化学的であるか、化学的であるかまたは他の手段によることができる。一部の実施形態では、断片化部位は、様々な手段によって断片化することができるヌクレオチドまたはヌクレオチド配列を含むことができる。断片化部位の例には、限定されずに、制限エンドヌクレアーゼ部位、RNアーゼで切断可能な少なくとも1つのリボヌクレオチド、ある特定の化学薬剤の存在下で切断可能なヌクレオチド類似体、過ヨウ素酸塩による処理によって切断可能なジオール結合、化学還元剤で切断可能なジスルフィド基、光化学的切断を受けさせることができる切断可能な部分、およびペプチダーゼ酵素または他の適する手段によって切断可能なペプチドが含まれる(例えば、米国特許出願公開第2012/0208705号、米国特許出願公開第2012/0208724号およびWO2012/061832を参照する)。
【0080】
トランスポソーム複合体は少なくとも1つのインデックス配列を含んでもよく、トランスポザーゼインデックスと呼ぶことができる。インデックス配列は、トランスポゾン配列の一部として存在する。一実施形態では、インデックス配列は、移動させた鎖、標的核酸に移動させたトランスポザーゼ認識部位の鎖に存在することができる。
【0081】
トランスポソーム複合体は、線形増幅媒介物が使用することができる少なくとも1つのヌクレオチド配列を含んでもよい。そのようなヌクレオチド配列の例には、限定されずに、核酸断片がファージプロモーターを含むときのRNAポリメラーゼ、例えばT7プロモーター用としてのT7RNAポリメラーゼ、および線形増幅プライマーが含まれる。線形増幅プライマーの例には、PCRタイプの増幅で使用するための単一のプライマーまたは線形増幅媒介物が含まれる。線形増幅媒介物が使用することができるヌクレオチド配列の他の実施形態は、鎖置換ポリメラーゼによって認識される配列である。媒介物は、複製を開始するためのニッキング部位を含有することができる。一部の場合には、ニッキング部位は、さらなる増幅のために再生される。
【0082】
コンパートメント特異的インデックスを加える
タグまたはバーコードとも呼ばれるインデックス配列は、特定の核酸が存在したコンパートメントに特徴的なマーカーとして有益である。したがって、インデックスは、特定のコンパートメントに存在する標的核酸の各々に付着している核酸配列タグであり、その存在は、単離した核または細胞の集団が本方法の特定の段階に存在したコンパートメントを示すか、またはそれを同定するのに使用される。インデックスの核酸断片への付加は、異なるコンパートメントに分配される単離した核または細胞のサブセットで達成される。
【0083】
インデックス配列は、長さが任意の適する数、例えば、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20またはそれより多くのヌクレオチドであってよい。4ヌクレオチドタグは、同じアレイの上で256個の試料を多重化する可能性を与え、6塩基タグは同じアレイの上で4096個の試料を処理することを可能にする。
【0084】
一実施形態では、インデックスの付加は、核酸断片への核酸の処理の間に達成される。例えば、インデックスを含むトランスポソーム複合体を使用することができる。他の実施形態では、片方または両方の末端にヌクレオチド配列を含有する核酸断片が処理によって生成された後に、インデックスは加えられる。インデックスを加える方法には、限定されずに、ライゲーション、伸長(逆転写酵素を使用した伸長を含む)、ハイブリダイゼーション、吸着、プライマーの特異的もしくは非特異的相互作用または増幅が含まれる。核酸断片の片方または両方の末端に加えられるヌクレオチド配列は、1つまたは複数の遍在配列および/または特異な分子識別子を含むこともできる。遍在配列は、例えば、核酸断片への別のインデックスおよび/または別の遍在配列などの別のヌクレオチド配列の付加のためのプライマーとして使用することができるヌクレオチド配列をアニールする以降の工程における「ランディングパッド」として使用することができる。
【0085】
例えば、mRNAに由来する核酸断片の使用を含む実施形態では、1工程または2工程でインデックスをmRNAに加えるために、様々な方法を使用することができる。例えば、cDNAを生成するために使用されるタイプの方法を使用して、インデックスを加えることができる。逆転写酵素を使用して、3’末端のポリT配列を有するプライマーをmRNA分子にアニールさせ、伸長させることができる。単離した核または細胞を逆転写に適する条件の下でこれらの構成成分に曝露させることは、インデックス付きの核または細胞の集団をもたらす、インデックスの1工程付加をもたらし、ここで、各核または細胞は、インデックス付きの核酸断片を含有する。あるいは、ポリT配列を有するプライマーはインデックスの代わりに遍在配列を含み、インデックスは、ライゲーション、プライマー伸長、増幅の以降の工程によって加えられる。インデックス付きの核酸断片は、合成された鎖の上に特定のコンパートメントを示すインデックス配列を含むことができ、また一般的に含む。
【0086】
非コードRNAに由来する核酸断片の使用を含む実施形態では、1工程または2工程でインデックスを非コードRNAに加えるために、様々な方法を使用することができる。例えば、ランダム配列を含む第1のプライマーおよび鋳型スイッチプライマーを使用してインデックスを加えることができ、ここで、いずれのプライマーもインデックスを含むことができる。合成された鎖の3’末端への非鋳型ヌクレオチドの付加をもたらす末端転移酵素活性を有する逆転写酵素を使用することができ、鋳型スイッチプライマーは、逆転写酵素によって加えられる非鋳型ヌクレオチドとアニールするヌクレオチドを含む。有益な逆転写酵素の一例は、モロニーマウス白血病ウイルス逆転写酵素である。特定の実施形態では、非コードRNA、および所望によりmRNAにインデックスを加えるための鋳型スイッチングの使用のために、Takara Bio USA,Inc.から入手可能なSMARTer(商標)試薬(カタログ番号634926)が使用される。あるいは、第1のプライマーおよび/または鋳型スイッチプライマーはインデックスの代わりに遍在配列を含むことができ、インデックスは、ライゲーション、プライマー伸長または増幅の以降の工程によって加えられる。インデックス付きの核酸断片は、合成された鎖の上に特定のコンパートメントを示すインデックス配列を含むことができ、また一般的に含む。他の実施形態は、RNAの5’もしくは3’プロファイリングまたは完全長RNAプロファイリングを含む。
【0087】
インデックスの核酸断片への付加のために他の方法を使用することができ、インデックスがどのように加えられるかは制限するものでない。例えば、一実施形態では、インデックス配列の組込みは、核酸断片の片方または両方の末端にプライマーをライゲーションすることを含む。ライゲーションプライマーのライゲーションは、核酸断片の末端の遍在配列の存在によって支援することができる。プライマーの非限定的な例は、ヘアピンライゲーション二重鎖である。ライゲーション二重鎖は、核酸断片の1つの末端または好ましくは両末端にライゲーションすることができる。一実施形態では、ヘアピンライゲーション二重鎖などのプライマーは、線形増幅媒介物によって認識されるヌクレオチド配列を含有することができる。そのようなヌクレオチドを含有するヘアピンアダプターの例は、実施例1、
図2に記載される。その分子の増幅産物を生成するためにバーコード化分子の2つの末端のうちの1つでのライゲーションの成功を必要とするだけである増幅媒介物を導入する、実施例1に記載されるものなどのアッセイスキームが望ましく、その理由は、それが鋳型変換の効率が増加する利点を有するからである。例えば、単一のライゲーション事象が50%の効率を有する場合、この改変は分子を増幅するライゲーション工程で25%の代わりに75%の成功率を与える(実施例1、
図2)。
【0088】
別の実施形態では、インデックス配列の組込みは、一本鎖の核酸断片の使用および第2のDNA鎖の合成を含む。一実施形態では、第2のDNA鎖は、一本鎖の核酸断片の末端に存在するヌクレオチドに相補的な配列を含むプライマーを使用して生成される。
【0089】
別の実施形態では、インデックスの組込みは、一重、二重、三重または多重にインデックスが付いた単一細胞ライブラリーをもたらす、1、2、3またはより多くの回数のスプリットおよびプールバーコード化において起こる。
【0090】
別の実施形態では、増幅媒介物が使用することができるインデックスおよびヌクレオチド配列の組込みは一方向で設計され、標的化単一細胞シークエンシングライブラリーの調製を可能にする(実施例1、
図3bを参照する)。
【0091】
核酸断片の線形増幅
本明細書で提供される方法は、核酸断片の線形増幅を含む。ほとんどの増幅方法はPCRベースであり、したがって、指数関数的増幅バイアスを被る。本明細書で使用される線形増幅は指数関数的増幅バイアスを低減または排除することができ、それによってより良い均一性および低減された配列エラーにつながる。全ゲノム増幅を利用する全ての単一細胞ゲノム研究方法では、増幅産物はコンパートメント(例えばウェルまたは液滴)に入れられ、バーコードが直接的または間接的に増幅産物に付着している。このように、1コンパートメントにつき単一の細胞だけが存在し、スループットが制限され、費用が増加する。本発明の特異な態様は、単一のコンパートメントの中で指数関数的増幅バイアスなしで複数の単一細胞ライブラリーを増幅することができることである。単一細胞からのライブラリーは、特異な単一細胞ごとの特異な1つまたは複数のバーコードに基づいて割り当てることができる。
【0092】
一実施形態では、線形増幅は、ファージプロモーターを核酸断片の片方または両方の末端に加えることによって達成される。核酸断片の上流に置かれるとき、ファージプロモーターは、一本鎖のRNAを生成するインビトロ(in vitro)転写による対応するファージRNAポリメラーゼを使用した転写を促進するために使用することができる。DNA鋳型から生成されるRNAコピーは、さらなる増幅のための鋳型の役割をすることができない。したがって、全てのコピーは、元のDNA鋳型に直接的に由来し、指数関数的増幅が回避される。一実施形態では、以降の工程は、一本鎖DNAを得るためのRNAコピーの逆転写、および一本鎖のDNAコピーを二本鎖分子に変換するための第2の鎖合成を次に含むことができる。第2の鎖合成はプライマーの使用を一般的に必要とし、このプライマーは、インデックス、遍在配列および/または遍在分子識別子の1つまたは複数を導入するために使用することができる。
【0093】
線形増幅の他の方法を使用することができる。例えば、PCR増幅は1つのプライマーで、または2つのプライマーで使用することができ、1つは余分である。一部の実施形態では、トランスポゾン挿入部位に隣接している隣接配列の増幅のために、線形PCRを使用することができる(Xianbo et al. AMB Express, 2017, 7:195)。連結線形増幅(Reyes et al., Clin. Chem., 2001, 47(1):31-40)、線形伸長および線形伸長とライゲーション、鎖置換増幅(SDA)(Walker et al., Nucl. Acids Res., 1992, 20(7): 1691-1696)ならびにローリングサークル増幅(Ali et al., Chem. Soc. Rev., 2014, 43:3324-3341)を一部の実施形態で使用することもできる。一部の実施形態では、インデックス、遍在配列および/または特異な分子識別子は、線形増幅の間に核酸断片に加えることができる。
【0094】
一般的に、線形増幅は、単離した核または細胞に線形増幅媒介物を導入することを含む。線形増幅媒介物の例には、核酸断片がファージプロモーターを含むときのRNAポリメラーゼ、例えばT7プロモーター用としてのT7 RNAポリメラーゼ、および線形増幅プライマーが含まれる。線形増幅プライマーの例には、PCRタイプの増幅で使用するための単一のプライマーまたは線形増幅媒介物が含まれる。増幅媒介物の他の実施形態は、ヌクレオチド配列を認識する鎖置換ポリメラーゼである。媒介物は、複製を開始するためのニッキング部位を含有することができる。一部の場合には、ニッキング部位は、さらなる増幅のために再生される。媒介物は、増幅または増幅産物の標識化の間にバーコードの複製を可能にする、特異なバーコードまたはプライマーを含有することができる。
【0095】
固定化のための遍在配列の付加
一実施形態では、処理および/またはインデクシング工程の間のヌクレオチドの付加は、断片の固定化およびシークエンシングにおいて有益である遍在配列を加える。別の実施形態では、インデックス付きの核酸断片は、核酸断片の固定化およびシークエンシングにおいて有益な遍在配列を加えるために、さらに処理することができる。当業者は、コンパートメントが液滴である実施形態において、核酸断片を固定化するための配列は適宜であることを認める。一実施形態では、断片の固定化およびシークエンシングにおいて有益な遍在配列の組込みは、同一の遍在アダプター(「ミスマッチアダプター」とも呼ばれ、その一般的フィーチャーは、Gormleyら、米国特許第7,741,463号、およびBignellら、米国特許第8,053,192号に記載される)をインデックス付きの核酸断片の5’および3’末端にライゲーションすることを含む。一実施形態では、遍在アダプターは、アレイの上にインデックス付きの核酸断片を固定化するための配列を含む、シークエンシングに必要な全ての配列を含む。
【0096】
一実施形態では、平滑末端ライゲーションを使用することができる。別の実施形態では、核酸断片は、例えば、単一のデオキシヌクレオチド、例えばデオキシアデノシン(A)をインデックス付きの核酸断片の3’末端に加える非鋳型依存性末端転移酵素活性を有する、ある特定のタイプのDNAポリメラーゼ、例えばTaqポリメラーゼまたはクレノウエキソマイナスポリメラーゼの活性によって、単一の突出ヌクレオチドで調製される。一部の場合には、突出ヌクレオチドは、複数塩基である。そのような酵素は、単一のヌクレオチド「A」を核酸断片の各鎖の平滑末端3’末端に加えるために使用することができる。したがって、Taqまたはクレノウエキソマイナスポリメラーゼとの反応によって「A」を二本鎖標的断片の各鎖の3’末端に加えることができ、核酸断片の各末端に加えられるさらなる配列は、加えられる二本鎖核酸の各領域の3’末端の上に存在する、適合する「T」突出を含むことができる。この末端改変は核酸のセルフライゲーションも阻止し、そのため、この実施形態で加えられる配列が隣接するインデックス付きの核酸断片の形成の方へのバイアスがある。
【0097】
別の実施形態では、インデックス付きの核酸断片にライゲーションされる遍在アダプターがシークエンシングのために必要な全ての配列を含むとは限らない場合、固定化およびシークエンシングの前に各インデックス付きの核酸断片に存在する遍在アダプターをさらに改変するために、PCRなどの増幅工程を使用することができる。例えば、初期プライマー伸長反応は、インデックス付きの核酸断片に存在する遍在配列に相補的である遍在アンカー配列を使用して実行することができ、ここで、各個々のインデックス付きの核酸断片の両方の鎖に相補的な伸長産物が形成される。一般的に、PCRは、遍在捕捉配列などのさらなる遍在配列を加える。
【0098】
シークエンシングのために必要な全ての配列を含む遍在アダプターをライゲーションする単一工程方法によって、または遍在アダプターをライゲーションし、次に増幅させて遍在アダプターをさらに改変する二工程方法によって遍在アダプターが加えられた後、最終インデックス断片は、遍在捕捉配列およびアンカー配列を含む。各末端に遍在アダプターを加えることの結果は、複数のインデックス付きの核酸断片またはそのライブラリーである。
【0099】
生じるインデックス付きの核酸断片は、固定化して次に配列決定することができる核酸のライブラリーを集団で提供する。本明細書でシークエンシングライブラリーとも呼ばれる用語ライブラリーは、それらの3’および5’末端に公知の遍在配列を含有する単一の核または細胞からの核酸断片の集合を指す。
【0100】
インデックス付きの核酸断片は、所定のサイズ範囲、例えば150から400ヌクレオチドの長さ、例えば150から300ヌクレオチドを選択する条件に付すことができる。生じるインデックス付きの核酸断片をプールし、組み込まれていない遍在アダプターまたはプライマーの少なくとも一部を取り除くことによってDNA分子への純度を強化するためのクリーンアッププロセスに付してもよい。任意の適するクリーンアッププロセス、例えば電気泳動、サイズ排除クロマトグラフィーなどを使用することができる。一部の実施形態では、所望のDNA分子を付着していない遍在アダプターまたはプライマーから分離し、サイズに基づいて核酸を選択するために、固相可逆的固定化常磁性ビーズを用いることができる。固相可逆的固定化常磁性ビーズは、Beckman Coulter(Agencourt AMPure XP)、Thermofisher(MagJet)、Omega Biotek(Mag-Bind)、Promega Beads(Promega)およびKapa Biosystems(Kapa Pure Beads)から市販されている。
【0101】
本開示の非限定的な例示的実施形態は
図2に示し、実施例1に記載する。この実施形態では、本方法は、複数の細胞から単離した核を提供することを含む(
図2、ブロック22)。単離した核はヌクレオソーム無しであってよいか、または核のヌクレオソームを枯渇させる条件に付し、ヌクレオソームが枯渇された核を生成することができる(
図2、ブロック23)。
【0102】
この実施形態では、本方法は、ヌクレオソームが枯渇された核のサブセットを第1の複数のコンパートメントに分配することを含む(
図2、ブロック24)。第1の分配工程(
図2、ブロック24)におけるコンパートメントの数は、使用するフォーマットに依存することができる。一実施形態では、コンパートメントの数は、24である。
【0103】
各コンパートメントは、トランスポソーム複合体を含む。トランスポソーム複合体は、核のサブセットがコンパートメントに加えられる前、後またはそれと同時に各コンパートメントに加えることができる。トランスポソーム複合体は、少なくとも1つのインデックス配列および少なくとも1つの遍在配列を含む。トランスポソーム複合体の一部として存在する遍在配列は、スペーサー配列と呼ぶことができる。スペーサー配列は、トランスポゾン配列の一部として存在する。一実施形態では、スペーサー配列は、移動させた鎖、標的核酸に移動させたトランスポザーゼ認識部位の鎖に存在することができる。スペーサー配列は、相補的な配列とアニーリングするための部位として有益である。例えば、スペーサー配列は、遍在プライマーまたは遍在プライマーの相補体であってよい。トランスポソーム複合体のスペーサー配列は、各コンパートメントで同じであってよい。一実施形態では、インデックス(「bc1」)およびスペーサー(「sp1」)は、実施例1の
図S2Aに示す配向で配置され、突出部に存在している。
【0104】
本方法は、インデックス付きの核を生成することを含む(
図2、ブロック25)。一実施形態では、インデックス付きの核を生成することは、ヌクレオソームが枯渇された核(例えば、各コンパートメントに存在する核酸)のサブセットに存在する核酸を処理して複数の核酸断片にすることを含む。一実施形態では、核酸が断片化された後、トランスポザーゼは核酸断片に付着したままであり、そのため、同じゲノムDNA分子に由来する核酸断片は物理的に連結されたままである(Adey et al., 2014, Genome Res., 24:2041-2049)。断片化の結果はインデックス付きの核の集団であり、ここで、各核はインデックス付きの核酸断片を含有する。トランスポソーム複合体のインデックス配列は各コンパートメントで異なり、したがって、インデックス付きの核酸断片は、少なくとも1つの鎖の上に特定のコンパートメントを示すインデックス配列を含むことができ、また一般的に含む。インデックス付きの核酸断片の例は、実施例1の
図S2Aのボックス部分に示す。
【0105】
複数のコンパートメントからのインデックス付きの核は、組み合わせることができる(
図2、ブロック26)。これらの組み合わせたインデックス付きの核のサブセットは、第2の複数のコンパートメントに次に分配される。サブセットに、したがって各コンパートメントに存在する核の数は、インデックスの衝突を低減する要求に一部基づき、それは、本方法のこの工程の同じコンパートメントに存在する同じトランスポザーゼインデックスを有する2つの核の存在のことである。一実施形態では、各サブセットに存在する核の数は、概ね等しい。
【0106】
サブセットへの核の分配の後に、二重インデックス断片を生成するための、各コンパートメントの中のインデックス付きの核酸断片への第2のインデックス配列の組み込みが続く。これは、インデックス付きの核酸断片のさらなるインデクシングをもたらす(
図2、ブロック27)。細胞が架橋剤によって架橋される実施形態では、インデックス付きの核酸断片に付着したトランスポザーゼはインデックス付きの核酸断片から解離させることができる。トランスポザーゼを解離させるために洗浄剤を使用することができ、一実施形態では、洗浄剤はドデシル硫酸ナトリウム(SDS)である。
【0107】
一実施形態では、第2のインデックス配列の組込みは、各コンパートメントの中のインデックス付きの核酸断片にヘアピンライゲーション二重鎖をライゲーションすることを含む。ライゲーション二重鎖は、二重のインデックス付きの核酸断片の1つの末端または好ましくは両末端にライゲーションすることができる。一実施形態では、ライゲーション二重鎖は、5つのエレメントを含む:1)第1のスペーサー配列の逆相補体(例えば、実施例1の
図S2Bの中の「sp1」)、これは本明細書に記載されるライゲーション工程における「ランディングパッド」の役目をする;2)2回目のバーコードの逆相補体;3)第2の鎖の合成(SSS)プライマーの逆相補体;4)T7プロモーター、これは好ましくはヘアピンのループ領域である;5)T7転写を強化するためのGGGから開始する第2の鎖の合成(SSS)プライマー領域(実施例1の
図S2Bの中の第2のスペーサー配列、「sp2」);および6)2回目のバーコード、第2のインデックス配列、(実施例1の
図S2Bの中の「bc2」)。第2のインデックス配列は各コンパートメントで特異であり、ここでは、分配されるインデックス付きの核は第1のインデックスがタグメンテーションによって加えられた後に置かれた(
図2、ブロック27)。
【0108】
複数のコンパートメントからのインデックス付きの核は、組み合わせることができる(
図2、ブロック28)。これらの組み合わせたインデックス付きの核のサブセットは、第3の複数のコンパートメントに次に分配される。サブセットに、したがって各コンパートメントに存在する核の数は、インデックスの衝突を低減する要求に一部基づき、それは、本方法のこの工程の同じコンパートメントに存在する同じトランスポザーゼインデックスを有する2つの核の存在のことである。一実施形態では、100~300細胞が各ウェルに分配される。一実施形態では、最高300細胞が各ウェルに分配される。一実施形態では、各サブセットに存在する核の数は、概ね等しい。
【0109】
サブセットへの二重インデックス付きの核の分配の後に、溶解およびさらなる人為操作が続く(
図2、ブロック29)。核の溶解のための方法は、当業者に公知であり、ルーチンである。さらなる人為操作には、限定されずに、ギャップ伸長、インビトロ転写(IVT)および逆転写が含まれる。
【0110】
ギャップ伸長は、ヘアピンT7プロモーター構造を二重鎖に変換する(実施例1の
図S2C)。ギャップ伸長のために、鎖置換活性を有するポリメラーゼが一般的に使用される。この活性を有するポリメラーゼ、例えばBstポリメラーゼが利用可能である。
【0111】
IVTは、T7プロモーターの下流に線形増幅一本鎖RNA分子を生成する(実施例1の
図S2D)。IVTのための方法は公知であり、ルーチンである。
【0112】
逆転写は、2つの経路のうちの1つによって起こることができる(実施例1の
図S2E)。本明細書に記載されるライゲーション反応は、2種類の核酸断片をもたらす:両末端にライゲーション二重鎖を有する核酸断片および1つの末端にライゲーション二重鎖を有する核酸断片。ライゲーションが両末端で成功した場合は、逆転写は自己ループ化逆転写プライマーによって初回刺激することができ、それらはループ化ライゲーション二重鎖から受け継がれる。ライゲーションが1つの末端だけで成功した場合は、逆転写は過剰に加えられる追加のRNA逆転写プライマーによって初回刺激される。
【0113】
核の溶解および核酸断片の処理の後に、三重インデックス付き断片を生成するための、各コンパートメントの中の二重インデックス付きの核酸断片への第3のインデックス配列の組み込みが続き、ここで、各コンパートメントの中の第3のインデックス配列は他のコンパートメントの中の第1および第2のインデックス配列と異なり、各コンパートメントの中の第3のインデックス配列は他のコンパートメントの中の第3のインデックス配列と異なる。これは、固定化およびシークエンシングの前にインデックス付きの核酸断片のさらなるインデクシングをもたらす(
図2、ブロック30;実施例1の
図S2F)。第3のインデックスは、第2のDNA鎖の合成によって組み込むことができる。一実施形態では、第2のDNA鎖は、二重インデックス付きの核酸断片の末端に存在するヌクレオチドに相補的な配列を含むプライマーを使用して生成される。例えば、プライマーは、第2のスペーサー配列の逆相補体とアニールする第2のスペーサー配列(sp2)を含むことができる(実施例1の
図S2F)。プライマーは、第3のインデックス(実施例1の
図S2Fの中の「bc3」)および他の特異な分子識別子(UMI)をさらに含む。生じる二本鎖DNAは、ルーチンの方法を使用して精製することができる。
【0114】
シークエンシングのために、複数の三重インデックス付きの断片を調製することができる。三重インデックス付きの断片をプールした後、それらは、シークエンシングの前に一般的に固定化および/または増幅によって富化される(
図2、ブロック31)。
【0115】
シークエンシングのための固定化試料の調製
シークエンシングのために、複数のインデックス付きの断片を調製することができる。例えば、三重インデックス付きの断片のライブラリーが生成される実施形態では、三重インデックス付きの断片は、シークエンシングの前に一般的に固定化および/または増幅によって富化される(
図2、ブロック21)。1つまたは複数の供給源からのインデックス付きの断片を基質に付着させるための方法は、当技術分野で公知である。一実施形態では、インデックス付きの断片は、そのインデックス付きの断片に特異性を有する複数の捕捉オリゴヌクレオチドを使用して富化され、捕捉オリゴヌクレオチドは、固体基質の表面に固定化することができる。例えば、捕捉オリゴヌクレオチドは遍在の結合性の対の第1のメンバーを含むことができ、ここで、結合性の対の第2のメンバーは固体基質の表面に固定化される。同様に、固定化された二重インデックス付きの断片を増幅する方法には、限定されずに、架橋増幅および動態学的排除が含まれる。シークエンシングの前に固定化および増幅する方法は、例えば、Bignellら(米国特許第8,053,192号)、Gundersonら(WO2016/130704)、Shenら(米国特許第8,895,249号)およびPipenburgら(米国特許第9,309,502号)に記載される。
【0116】
プールされた試料は、シークエンシングの準備のために固定化することができる。シークエンシングは単一分子のアレイとして実行することができるか、またはシークエンシングの前に増幅することができる。増幅は、1つまたは複数の固定化プライマーを使用して実行することができる。固定化プライマー(複数可)は、例えば、平らな表面の上、またはビーズのプールの上のローンであってよい。ビーズのプールは、乳濁液の各「コンパートメント」の中に単一のビーズが含まれる乳濁液の中に単離することができる。1「コンパートメント」につき1つの鋳型だけの濃度では、単一の鋳型だけが各ビーズの上で増幅される。
【0117】
本明細書で使用される用語「固相増幅」は、固体支持体の上でまたはそれと共同して実行され、そのため、それらが形成されるにつれて増幅産物の全てまたは一部が固体支持体の上に固定化される、任意の核酸増幅反応を指す。詳細には、本用語は、固相ポリメラーゼ連鎖反応(固相PCR)および固相等温増幅を包含し、それらは、フォワードおよびリバース増幅プライマーの片方または両方が固体支持体の上に固定化されることを除いて、標準の溶液相増幅に類似した反応である。固相PCRは、1つのプライマーがビーズにアンカーされ、他は自由溶液中にある乳濁液、および、1つのプライマーが表面にアンカーされ、1つは自由溶液中にある固相ゲルマトリックスの中でのコロニー形成などのシステムを包含する。
【0118】
一部の実施形態では、固体支持体はパターン化表面を含む。「パターン化表面」は、固体支持体の露出層の中またはその上での異なる領域の配置を指す。例えば、領域の1つまたは複数は、1つまたは複数の増幅プライマーが存在するフィーチャーであってよい。フィーチャーは、増幅プライマーが存在しない中間領域によって分離することができる。一部の実施形態では、パターンは、行および列にあるフィーチャーのx-yフォーマットであってよい。一部の実施形態では、パターンは、フィーチャーおよび/または中間領域の反復配置であってよい。一部の実施形態では、パターンは、フィーチャーおよび/または中間領域のランダム配置であってよい。本明細書に示す方法および組成物において使用することができる例示的なパターン化表面は、米国特許第8,778,848号、第8,778,849号および第9,079,148号、および米国特許出願公開第2014/0243224号に記載される。
【0119】
一部の実施形態では、固体支持体はウェルのアレイまたは表面の陥没を含む。これは、一般的に当技術分野で公知であるように、写真平版、スタンピング技術、成形技術およびマイクロエッチング技術を限定されずに含む、様々な技術を使用して製作することができる。当業者が理解するように、使用する技術はアレイ基質の組成および形状に依存する。
【0120】
パターン化表面のフィーチャーは、ポリ(N-(5-アジドアセトアミジルペンチル)アクリルアミド-co-アクリルアミド)(PAZAM、例えば、米国特許出願公開第2013/184796号、WO2016/066586およびWO2015/002813を参照する)などの、パターン化された共有結合しているゲルを有する、ガラス、シリコン、プラスチック、または他の適する固体支持体の上のウェル(例えば、マイクロウェルまたはナノウェル)のアレイの中のウェルであってよい。このプロセスは、多数のサイクルによるシークエンシングの実行にわたって安定することができるシークエンシングのために使用される、ゲルパッドを作製する。ウェルへのポリマーの共有結合は、様々な使用の間の構造化基質の寿命にわたって構造化フィーチャーにゲルを維持するのに有効である。しかし、多くの実施形態では、ゲルはウェルに共有結合する必要はない。例えば、一部の条件では、構造化基質のいずれの部分にも共有結合していないシランフリーアクリルアミド(SFA、例えば、米国特許第8,563,477号を参照する)を、ゲル材料として使用することができる。
【0121】
特定の実施形態では、構造化基質は、固体支持材をウェル(例えば、マイクロウェルまたはナノウェル)によってパターン化し、パターン化支持体をゲル材料[例えば、PAZAM、SFAまたは化学改変されたその変異体、例えばSFAのアジドール化バージョン(アジド-SFA)]によってコーティングし、ゲルコーティングされた支持体を、例えば化学的または機械的研摩によって研摩し、それによって、ゲルをウェルの中に保持するが、ウェルの間の構造化基質の表面の中間領域からのゲルの実質的に全てを除去または不活性化することによって作製することができる。プライマー核酸は、ゲル材料に付着させることができる。個々のインデックス付きの断片がゲル材料に付着しているプライマーとの相互作用を通して個々のウェルに播種するように、インデックス付きの断片の溶液を研摩された基質と次に接触させることができる。しかし、ゲル材料の不在または不活性のために、標的核酸は中間領域を占有しない。中間領域におけるゲルの不在または不活性は成長する核酸コロニーの外側への移動を阻止するので、インデックス付きの断片の増幅はウェルに限定される。このプロセスは都合よく製作することができ、スケーラブルであり、従来のマイクロ-またはナノファブリケーション方法を利用する。
【0122】
本開示は1つの増幅プライマーだけが固定化される(他のプライマーは通常自由溶液中に存在する)「固相」増幅方法を包含するが、一実施形態では、固体支持体が、固定化されるフォワードおよびリバースプライマーと提供されることが好ましい。実際、増幅プロセスは増幅を持続するために過剰のプライマーを必要とするので、固体支持体上に固定化される「複数」の同一のフォワードプライマーおよび/または「複数」の同一のリバースプライマーがある。本明細書においてフォワードおよびリバースプライマーへの言及は、文脈が別途示さない限り、「複数」のそのようなプライマーを包含するものとして解釈されるべきである。
【0123】
熟練読者が理解するように、いかなる所与の増幅反応も、増幅される鋳型に特異的である少なくとも1つのタイプのフォワードプライマーおよび少なくとも1つのタイプのリバースプライマーを必要とする。しかし、ある特定の実施形態では、フォワードおよびリバースプライマーは、同一の配列の鋳型特異的部分を含むことができ、完全に同一のヌクレオチド配列および構造(任意の非ヌクレオチド改変を含む)を有することができる。言い換えると、1つのタイプのプライマーだけを使用して固相増幅を実行することが可能であり、そのような単一プライマー方法は本開示の範囲内に包含される。他の実施形態は、同一の鋳型特異的配列を含有するが、一部の他の構造的なフィーチャーにおいて異なるフォワードおよびリバースプライマーを使用することができる。例えば、1つのタイプのプライマーは、他に存在しない非ヌクレオチド改変を含有することができる。
【0124】
本開示の全ての実施形態では、固相増幅のためのプライマーは、プライマーの5’末端またはその近くにおける固体支持体への単一点共有結合性付着によって好ましくは固定化され、プライマーの鋳型特異的部分をそのコグネイト鋳型に自由にアニールさせ、3’ヒドロキシル基のプライマー伸長を自由にする。当技術分野で公知の任意の適する共有結合性付着手段を、この目的のために使用することができる。選択される付着化学は、固体支持体の性質、およびそれに適用される任意の誘導体化または官能基化に依存する。プライマーは、付着を促進するために、非ヌクレオチド化学的改変であってよい部分をそれ自体含むことができる。特定の実施形態では、プライマーは5’末端に含硫求核体、例えばホスホロチオエートまたはチオホスフェートを含むことができる。固体によって支持されるポリアクリルアミドヒドロゲルの場合、この求核体は、ヒドロゲルに存在するブロモアセトアミド基に結合する。プライマーおよび鋳型を固体支持体に付着させるより特定の手段は、国際公開第05/065814号に記載の通りに、重合アクリルアミドおよびN-(5-ブロモアセトアミジルペンチル)アクリルアミド(BRAPA)で構成されるヒドロゲルへの5’ホスホロチオエート付着による。
【0125】
本開示のある特定の実施形態は、例えばポリヌクレオチドなどの生体分子への共有結合性付着を可能にする反応性基を含む中間材料の層またはコーティングの適用によって「官能基化された」、不活性の基質またはマトリックス(例えば、ガラススライド、ポリマービーズ等)を含む固体支持体を利用することができる。そのような支持体の例には、限定されずに、ガラスなどの不活性基質の上に支持されるポリアクリルアミドヒドロゲルが含まれる。そのような実施形態では、生体分子(例えばポリヌクレオチド)は中間材料(例えばヒドロゲル)に直接的に共有結合させることができるが、中間材料自体は基質またはマトリックス(例えばガラス基質)に非共有結合的に付着していてもよい。用語「固体支持体への共有結合性付着」は、このタイプの配置を包含するものと解釈するべきである。
【0126】
各ビーズがフォワードおよびリバース増幅プライマーを含有するビーズの上で、プールされた試料を増幅することができる。特定の実施形態では、インデックス付きの断片のライブラリーは、固相増幅、より詳細には固相等温増幅による、米国特許出願公開第2005/0100900号、米国特許第7,115,400号、国際公開第00/18957号および国際公開第98/44151号に記載されるものに類似している、核酸コロニーのクラスター化アレイを調製するために使用される。用語「クラスター」および「コロニー」は、本明細書では複数の同一の固定化された核酸鎖および複数の同一の固定化された相補的な核酸鎖を含む、固体支持体の上の個別の部位を指すために互換的に使用される。用語「クラスター化アレイ」は、そのようなクラスターまたはコロニーから形成されるアレイを指す。この関係において、用語「アレイ」は、整然としたクラスター配置を必要とすると理解するべきでない。
【0127】
用語「固相」または「表面」は、プライマーが平面に、例えばガラス、シリカまたはプラスチック製の顕微鏡スライドまたは類似のフローセル装置に付着している平らなアレイ;1つまたは2つのプライマーがビーズに付着し、ビーズが増幅されるビーズ;または、ビーズが増幅された後の表面のビーズのアレイを意味するために使用される。
【0128】
クラスター化アレイは、国際公開第98/44151号に記載のサーモサイクリングのプロセス、または、温度が定数として維持され、伸長および変性のサイクルが試薬の変更によって実行されるプロセスを使用して調製することができる。そのような等温増幅方法は、特許出願番号国際公開第02/46456号および米国特許出願公開第2008/0009420号に記載される。等温プロセスにおいて有益なより低い温度のために、一部の実施形態ではこれは特に好ましい。
【0129】
固定化されたDNAフラグメントを増幅するために、本明細書に記載されるか当技術分野で一般に公知である増幅方法のいずれをも遍在または標的特異的であるプライマーと使用することができることが理解される。米国特許第8,003,354号に記載の通りに、増幅のために適する方法には、限定されずに、ポリメラーゼ連鎖反応(PCR)、鎖置換増幅(SDA)、転写媒介増幅(TMA)および核酸配列ベースの増幅(NASBA)が含まれる。上記の増幅方法は、目的の1つまたは複数の核酸を増幅するために用いることができる。例えば、多重PCR、SDA、TMA、NASBAなどを含むPCRは、固定化されたDNAフラグメントを増幅するために利用することができる。一部の実施形態では、目的のポリヌクレオチドに特異的に向けられるプライマーが、増幅反応に含まれる。
【0130】
ポリヌクレオチドの増幅のための他の適する方法は、オリゴヌクレオチド伸長およびライゲーション、ローリングサークル増幅(RCA)(Lizardi et al., Nat. Genet. 19:225-232 (1998))ならびにオリゴヌクレオチドライゲーションアッセイ(OLA)(米国特許第7,582,420号、第5,185,243号、第5,679,524号および第5,573,907号;欧州特許第0320308号;欧州特許第0336731号;欧州特許第0439182号;国際公開第90/01069号;国際公開第89/12696号;および国際公開第89/09835号を一般的に参照する)技術を含むことができる。これらの増幅方法は、固定化されたDNAフラグメントを増幅するように設計することができることが理解される。例えば、一部の実施形態では、増幅方法は、目的の核酸に特異的に向けられるプライマーを含有する、ライゲーションプローブ増幅またはオリゴヌクレオチドライゲーションアッセイ(OLA)反応を含むことができる。一部の実施形態では、増幅方法は、目的の核酸に特異的に向けられるプライマーを含有する、プライマー伸長-ライゲーション反応を含むことができる。目的の核酸を増幅するように特異的に設計することができるプライマー伸長およびライゲーションプライマーの非限定的な例として、増幅は、米国特許第7,582,420号および第7,611,869号に例示されるGoldenGateアッセイ(Illumina,Inc.、San Diego、CA)のために使用されるプライマーを含むことができる。
【0131】
本明細書に記載される方法および組成物と組み合わせて、DNAナノボールを使用することもできる。ゲノムシークエンシングのためにDNAナノボールを作製して利用する方法は、例えば、米国特許および出願公開、第7,910,354号、第2009/0264299号、第2009/0011943号、第2009/0005252号、第2009/0155781号、第2009/0118488号に、および、例えばDrmanac et al., 2010, Science 327(5961): 78-81に記載の通りに見出すことができる。簡潔には、ゲノムライブラリーDNA断片化に続いて、アダプターが断片にライゲーションされ、アダプターにライゲーションされた断片は環リガーゼによるライゲーションによって環化され、ローリングサークル増幅が実行される(Lizardi et al., 1998. Nat. Genet. 19:225-232および米国特許出願公開第2007/0099208号に記載の通りに)。アンプリコンの伸長したコンカテマー構造はコイル化を促進し、それによってコンパクトなDNAナノボールを作製する。各ナノボールの間の距離が維持され、それによって別個のDNAナノボールのシークエンシングを可能にするように、好ましくは整然としているかまたはパターン化されたアレイを作製するために、DNAナノボールを基質の上で捕捉することができる。完全ゲノム研究(Mountain View、Calif.)によって使用されるものなどの一部の実施形態では、連続回のアダプターライゲーション、増幅および消化が環状化の前に実行されて、アダプター配列によって分離されるいくつかのゲノムDNA断片を有するヘッド-トゥ-テールコンストラクトを生成する。
【0132】
本開示の方法において使用することができる例示的な等温増幅方法には、限定されずに、例えばDean et al., Proc. Natl. Acad. Sci. USA 99:5261-66 (2002)によって例示される多重置換増幅(MDA)または例えば米国特許第6,214,587号に例示される等温鎖置換核酸増幅が含まれる。本開示において使用することができる他の非PCRベースの方法には、例えば、Walker et al., Molecular Methods for Virus Detection, Academic Press, Inc., 1995;米国特許第5,455,166号および第5,130,238号、およびWalker et al., Nucl. Acids Res. 20:1691-96 (1992)に記載される鎖置換増幅(SDA)、または、例えばLage et al., Genome Res. 13:294-307 (2003)に記載される過分枝鎖置換増幅が含まれる。等温増幅方法は、例えば、ゲノムDNAのランダムプライマー増幅のために、鎖置換ファイ29ポリメラーゼまたはBst DNAポリメラーゼの大きな断片、5’->3’エキソ-と使用することができる。これらのポリメラーゼの使用は、それらの高い処理能力および鎖置換活性を利用する。高い処理能力は、ポリメラーゼが10~20kbの長さである断片を生成することを可能にする。上に示されるように、クレノウポリメラーゼなどの低い処理能力および鎖置換活性を有するポリメラーゼを使用して等温条件でより小さい断片を生成することができる。増幅反応、条件および構成成分のさらなる記載は、米国特許第7,670,810号の開示の中で詳細に示される。
【0133】
本開示において有益である別のポリヌクレオチド増幅方法は、例えば、Grothues et al. Nucleic Acids Res. 21(5):1321-2 (1993)に記載される、定常5’領域および続くランダム3’領域を有する2ドメインプライマーの集団を使用するタグ付きPCRである。増幅の最初の数回は、ランダムに合成された3’領域からの個々のハイブリダイゼーションに基づいて熱変性DNAの上で多数の開始を可能にするために実行される。3’領域の性質のために、開始部位は、ゲノム全体にわたってランダムであると考えられる。その後、未結合のプライマーを除去することができ、定常5’領域に相補的であるプライマーを使用してさらなる複製を起こさせることができる。
【0134】
一部の実施形態では、等温増幅は、排除増幅(ExAmp)とも呼ばれる動態学的排除増幅(KEA)を使用して実行することができる。本開示の核酸ライブラリーは、増幅試薬を反応させて、その部位に播種した個々の標的核酸からアンプリコンの実質的にクローンの集団を各々含む複数の増幅部位を生成する工程を含む方法を使用して作製することができる。一部の実施形態では、増幅反応は、それぞれの増幅部位の容量を満たすのに十分な数のアンプリコンが生成されるまで進行する。この方法により、既に播種された部位を容量まで満たすことは、標的核酸がその部位でランディングおよび増幅することを抑制し、それによってその部位でアンプリコンのクローン集団を生成する。一部の実施形態では、第2の標的核酸がその部位に到着する前に増幅部位が容量まで満たされないとしても、明らかなクローン性を達成することができる。一部の条件下では、第1の標的核酸の増幅は、その部位へ輸送される第2の標的核酸からのコピーの生成を効果的に凌ぐかまたは圧倒するために、十分な数のコピーが作製される時点まで進行することができる。例えば、直径500nm未満の環状フィーチャーの上で架橋増幅プロセスを使用する一実施形態では、第1の標的核酸のための14サイクルの指数関数的増幅の後、同じ部位での第2の標的核酸による汚染は、Illuminaシークエンシングプラットホームでの合成によるシークエンシング分析に不利な影響を及ぼすには不十分な数の汚染性アンプリコンしか生成しないと決定された。
【0135】
一部の実施形態では、アレイの中の増幅部位は、完全にクローンであってよいが、その必要はない。むしろ、一部の適用のために、個々の増幅部位は、第1のインデックス付きの断片からのアンプリコンで主に占められてよく、第2の標的核酸からの低レベルの汚染性アンプリコンを有することもできる。その汚染のレベルがアレイの以降の使用に許容できない影響を及ぼさない限り、アレイは、低レベルの汚染性アンプリコンを有する1つまたは複数の増幅部位を有することができる。例えば、アレイを検出適用において使用するとき、許容されるレベルの汚染は、検出技術の信号対雑音または分解能に許容できない方法で影響を及ぼさないレベルであろう。したがって、明らかなクローン性は、本明細書に示される方法によって作製されるアレイの特定の使用または適用に一般的に関連する。特定の適用のための個々の増幅部位で許容することができる汚染の例示的なレベルには、限定されずに、多くても0.1%、0.5%、1%、5%、10%または25%の汚染性アンプリコンが含まれる。アレイは、汚染性アンプリコンのこれらの例示的なレベルを有する1つまたは複数の増幅部位を含むことができる。例えば、アレイの中の増幅部位の最高5%、10%、25%、50%、75%またはさらに100%は、多少の汚染性アンプリコンを有することができる。アレイまたは部位の他の集合において、部位の少なくとも50%、75%、80%、85%、90%、95%または99%またはそれより多くはクローンであってよいか明らかにクローンであってよいことが理解されよう。
【0136】
一部の実施形態では、別の事象またはプロセスの発生を効果的に排除するために十分に迅速な速度でプロセスが起こるときに、動態学的排除が起こることができる。例えば、アレイの部位が溶液からの三重インデックス付きの断片でランダムに播種され、三重インデックス付きの断片のコピーが、播種された部位の各々を容量まで満たす増幅プロセスにおいて生成される、核酸アレイの作製をとりあげる。本開示の動態学的排除方法により、播種および増幅プロセスは、増幅速度が播種速度を超える条件の下で同時に進行することができる。このように、コピーが第1の標的核酸によって播種された部位で作製される比較的迅速な速度は、第2の核酸が増幅のためにその部位に播種することを効果的に排除する。動態学的排除増幅方法は、米国特許出願公開第2013/0338042号の開示に詳細に記載の通りに実行することができる。
【0137】
動態学的排除は、三重インデックス付きの断片の以降のコピーを作製するための(または、インデックス付きの断片の第1のコピーの)比較的速い速度に対して、増幅を開始するために比較的遅い速度(例えば、インデックス付きの断片の第1のコピーを作製する遅い速度)を活用することができる。前の段落の例では、動態学的排除は、インデックス付きの断片の播種のコピーによって部位を満たすために増幅が起こる比較的速い速度に対して、インデックス付きの断片の播種の比較的遅い速度(例えば、比較的遅い拡散または運搬)のために起こる。別の例示的な実施形態では、動態学的排除は、以降のコピーが作製されてその部位を満たす比較的速い速度に対して、部位に播種されたインデックス付きの断片の第1のコピーの形成の遅れ(例えば、遅れたかまたは遅い活性化)により起こることができる。この例では、個々の部位がいくつかの異なるインデックス付きの断片で播種されていてもよい(例えば、いくつかのインデックス付きの断片が増幅の前に各部位に存在してもよい)。しかし、任意の所与のインデックス付きの断片のための第1のコピー形成は、以降のコピーが生成される速度と比較して第1のコピー形成の平均速度が比較的遅いように、ランダムに活性化することができる。この場合、個々の部位がいくつかの異なるインデックス付きの断片で播種されていてもよいが、動態学的排除は、インデックス付きの断片のうちの1つだけが増幅されることを可能にする。より具体的には、第1のインデックス付きの断片が増幅のために活性化されると、その部位はそのコピーによって迅速に容量まで満たされ、それによって、その部位で第2のインデックス付きの断片のコピーが作製されることを阻止する。
【0138】
一実施形態では、この方法は、(i)平均運搬速度でインデックス付きの断片を増幅部位に運搬するために、および(ii)増幅部位にあるインデックス付きの断片を平均増幅速度で同時に増幅するために実行され、ここで、平均増幅速度は平均運搬速度を超える(米国特許第9,169,513号)。したがって、動態学的排除は、比較的遅い速度の運搬を使用してそのような実施形態で達成することができる。例えば、所望の平均運搬速度を達成するために十分に低い濃度のインデックス付きの断片を選択することができ、より低い濃度は運搬のより遅い平均速度をもたらす。あるいは、またはさらに、運搬速度を低減するために、高粘度溶液および/または溶液中の分子密集試薬の存在を使用することができる。有益な分子密集試薬の例には、限定されずに、ポリエチレングリコール(PEG)、フィコール、デキストランまたはポリビニルアルコールが含まれる。例示的な分子密集試薬および製剤は米国特許第7,399,590号に示され、それは参照により本明細書に組み込まれる。所望の運搬速度を達成するために調整することができる別の因子は、標的核酸の平均サイズである。
【0139】
増幅試薬は、アンプリコン形成を促進する、および一部の場合にはアンプリコン形成の速度を増加させる、さらなる構成成分を含むことができる。例は、リコンビナーゼである。リコンビナーゼは、反復侵入/伸長を可能にすることによって、アンプリコン形成を促進することができる。より具体的には、リコンビナーゼは、アンプリコン形成のための鋳型としてインデックス付きの断片を使用して、ポリメラーゼによるインデックス付きの断片の侵入およびポリメラーゼによるプライマーの伸長を促進することができる。このプロセスは、各ラウンドの侵入/伸長から生成されるアンプリコンが以降のラウンドにおいて鋳型の役割をする、連鎖反応として繰り返すことができる。変性サイクル(例えば、加熱または化学的変性を通した)が必要とされないので、このプロセスは標準のPCRより迅速に起こることができる。このように、リコンビナーゼによって促進される増幅は、等温で実行することができる。増幅を促進するために、リコンビナーゼで促進される増幅試薬にATPまたは他のヌクレオチド(または、一部の場合には加水分解抵抗性であるその類似体)が含まれることが一般的に望ましい。SSBは増幅をさらに促進することができるので、リコンビナーゼおよび一本鎖の結合性(SSB)タンパク質の混合物が特に有益である。リコンビナーゼで促進される増幅のための例示的な製剤には、TwistDx(Cambridge、UK)によりTwistAmpキットとして市販されるものが含まれる。リコンビナーゼで促進される増幅試薬の有益な構成成分および反応条件は、米国特許第5,223,414号および米国特許第7,399,590号に示される。
【0140】
アンプリコン形成を促進する、および一部の場合にはアンプリコン形成の速度を増加させる増幅試薬に含めることができる構成成分の別の例は、ヘリカーゼである。ヘリカーゼは、アンプリコン形成の連鎖反応を可能にすることによって、アンプリコン形成を促進することができる。変性サイクル(例えば、加熱または化学的変性を通した)が必要とされないので、このプロセスは標準のPCRより迅速に起こることができる。このように、ヘリカーゼによって促進される増幅は、等温で実行することができる。SSBは増幅をさらに促進することができるので、ヘリカーゼおよび一本鎖の結合性(SSB)タンパク質の混合物が特に有益である。ヘリカーゼで促進される増幅のための例示的な製剤には、Biohelix(Beverly、MA)からIsoAmpキットとして市販されるものが含まれる。さらに、ヘリカーゼタンパク質を含む有益な製剤の例は、米国特許第7,399,590号および米国特許第7,829,284号に記載される。
【0141】
アンプリコン形成を促進する、および一部の場合にはアンプリコン形成の速度を増加させる増幅試薬に含めることができる構成成分のさらに別の例は、起点結合性タンパク質である。
【0142】
シークエンシング/シークエンシングの方法における使用
表面へのインデックス付きの断片の付着の後、固定化され、増幅されたインデックス付きの断片の配列が決定される。シークエンシングは、任意の適するシークエンシング技術を使用して実行することができ、鎖再合成を含む、固定化および増幅されたインデックス付きの断片の配列を決定する方法は当技術分野で公知であり、例えば、Bignellら(米国特許第8,053,192号)、Gundersonら(WO2016/130704)、Shenら(米国特許第8,895,249号)およびPipenburgら(米国特許第9,309,502号)に記載される。
【0143】
本明細書に記載される方法は、様々な核酸シークエンシング技術と共に使用することができる。特に適用可能な技術は、それらの相対位置が変化しないようにアレイの固定位置に核酸が付着し、アレイが繰り返し画像化されるものである。画像が、例えば、1つのヌクレオチド塩基タイプを別のものと区別するために使用される異なる標識に一致する異なるカラーチャネルで得られる実施形態が、特に適用可能である。一部の実施形態では、インデックス付きの断片のヌクレオチド配列を決定するプロセスは、自動化プロセスであってよい。好ましい実施形態は、合成によるシークエンシング(「SBS」)技術を含む。
【0144】
SBS技術は、鋳型鎖に対するヌクレオチドの反復付加を通した、発生期の核酸鎖の酵素的伸長を一般的に含む。SBSの伝統的な方法では、各デリバリーにおいて単一のヌクレオチド単量体をポリメラーゼの存在下で標的ヌクレオチドに提供することができる。しかし、本明細書に記載される方法では、デリバリーにおいて複数のタイプのヌクレオチド単量体をポリメラーゼの存在下で標的核酸に提供することができる。
【0145】
一実施形態では、ヌクレオチド単量体は、ロック核酸(LNA)または架橋核酸(BNA)を含む。ヌクレオチド単量体におけるLNAまたはBNAの使用は、固定化されたインデックス付きの断片の上に存在するヌクレオチド単量体とシークエンシングプライマー配列の間のハイブリダイゼーション強度を増加させる。
【0146】
SBSは、ターミネーター部分を有するヌクレオチド単量体またはいかなるターミネーター部分も欠いているものを使用することができる。本明細書にさらに詳細に示されるように、ターミネーターを欠いているヌクレオチド単量体を使用する方法には、例えば、ピロシークエンシングおよびγ-リン酸標識ヌクレオチドを使用するシークエンシングが含まれる。ターミネーターを欠いているヌクレオチド単量体を使用した方法では、各サイクルにおいて加えられるヌクレオチドの数は一般的に可変であり、鋳型配列およびヌクレオチドデリバリー様式に依存する。ターミネーター部分を有するヌクレオチド単量体を利用するSBS技術については、ジデオキシヌクレオチドを利用する伝統的なサンガーシークエンシングの場合のように、使用されるシークエンシング条件下でターミネーターは効果的に不可逆的であってよいか、または、Solexa(現、Illumina,Inc.)によって開発されたシークエンシング方法の場合のように、ターミネーターは可逆的であってよい。
【0147】
SBS技術は、標識部分を有するヌクレオチド単量体または標識部分を欠いているものを使用することができる。したがって、組込み事象は、標識の蛍光などの標識の特性;分子量または電荷などのヌクレオチド単量体の特性;ピロリン酸の放出などのヌクレオチドの組込みの副産物;などに基づいて検出することができる。2つ以上の異なるヌクレオチドがシークエンシング試薬に存在する実施形態では、異なるヌクレオチドはお互いから識別可能であるか、あるいは、2つ以上の異なる標識は、使用する検出技術の下で区別できなくてもよい。例えば、シークエンシング試薬に存在する異なるヌクレオチドは異なる標識を有することができ、それらは、Solexa(現、Illumina,Inc.)によって開発されたシークエンシング方法によって例示されるような適当な光学を使用して区別することができる。
【0148】
好ましい実施形態には、ピロシークエンシング技術が含まれる。特定のヌクレオチドが発生期の鎖に組み込まれるので、ピロシークエンシングは無機ピロリン酸(PPi)の放出を検出する(Ronaghi, M., Karamohamed, S., Pettersson, B., Uhlen, M. and Nyren, P. (1996) "Real-time DNA sequencing using detection of pyrophosphate release." Analytical Biochemistry 242(1), 84-9;Ronaghi, M. (2001) "Pyrosequencing sheds light on DNA sequencing." Genome Res. 11(1), 3-11;Ronaghi, M., Uhlen, M. and Nyren, P. (1998) "A sequencing method based on real-time pyrophosphate." Science 281(5375), 363;米国特許第6,210,891号;第6,258,568号および第6,274,320号)。ピロシークエンシングでは、放出されたPPiは、ATPスルフラーゼによってアデノシン三リン酸(ATP)に直ちに変換されることによって検出することができ、生成されるATPのレベルはルシフェラーゼによって生成される光子を通して検出される。配列決定をする核酸はアレイの中のフィーチャーに付着させることができ、アレイは、アレイのフィーチャーにおけるヌクレオチドの組込みによって生成される化学発光シグナルを捕捉するために、画像化することができる。アレイを特定のヌクレオチドタイプ(例えば、A、T、CまたはG)で処理した後に、画像を得ることができる。各ヌクレオチドタイプの付加後に得られる画像は、アレイの中のどのフィーチャーが検出されるかについて異なる。画像におけるこれらの差は、アレイでのフィーチャーの異なる配列含有量を反映する。しかし、各フィーチャーの相対位置は、画像の中では不変のままである。画像は、本明細書に示される方法を使用して保存し、処理し、分析することができる。例えば、各異なるヌクレオチドタイプによるアレイの処理後に得られる画像は、可逆的ターミネーターベースのシークエンシング方法のための異なる検出チャネルから得られる画像のために本明細書に例示されるのと同じ方法で扱うことができる。
【0149】
SBSの別の例示的なタイプでは、例えば、国際公開第04/018497号および米国特許第7,057,026号などに記載される切断可能であるかまたは光漂白可能である色素標識を含有する、可逆的ターミネーターヌクレオチドの段階的付加によってサイクルシークエンシングが達成される。このアプローチはSolexa(現、Illumina Inc.)によって商品化されており、国際公開第91/06678号および国際公開第07/123744号に記載されてもいる。終止を逆転することおよび蛍光標識を切断することの両方が可能である蛍光標識ターミネーターの利用可能性は、効率的な周期的可逆的終止(CRT)シークエンシングを促進する。これらの改変されたヌクレオチドを効率的に組み込み、伸長させるために、ポリメラーゼを同時に工学操作することもできる。
【0150】
一部の可逆的ターミネーターベースのシークエンシング実施形態では、SBS反応条件の下で標識は伸長を実質的に抑制しない。しかし、検出標識は、例えば、切断または分解によって除去可能であってよい。配列された核酸フィーチャーへの標識の組込みの後、画像を捕捉することができる。特定の実施形態では、各サイクルはアレイへの4つの異なるヌクレオチドタイプの同時デリバリーを含み、各ヌクレオチドタイプはスペクトルで識別可能な標識を有する。4つの異なる標識のうちの1つに選択的である検出チャネルを各々使用して、4つの画像を次に得ることができる。あるいは、異なるヌクレオチドタイプは逐次的に加えることができ、アレイの画像は各付加工程の間で得ることができる。そのような実施形態では、各画像は、特定のタイプのヌクレオチドを組み込んだ核酸フィーチャーを示す。各フィーチャーの異なる配列含有量のために、異なる画像に異なるフィーチャーが存在するかまたは不在である。しかし、フィーチャーの相対位置は、画像の中では不変のままである。本明細書に示される通り、そのような可逆的ターミネーター-SBS方法から得られる画像は、保存し、処理し、分析することができる。画像捕捉工程の後、標識は除去することができ、ヌクレオチド付加および検出の以降のサイクルのために可逆的ターミネーター部分を除去することができる。それらが特定のサイクルにおいて検出された後の、および以降のサイクルの前の標識の除去は、サイクルの間のバックグラウンドシグナルおよびクロストークを低減する利点を提供することができる。有益な標識および除去方法の例は、本明細書に示される。
【0151】
特定の実施形態では、ヌクレオチド単量体の一部または全ては、可逆的ターミネーターを含むことができる。そのような実施形態では、可逆的ターミネーター/切断可能な蛍光団は、3’エステル連結を通してリボース部分に連結される蛍光団を含むことができる(Metzker, Genome Res. 15:1767-1776 (2005))。他のアプローチは、ターミネーター化学を蛍光標識の切断から分離した(Ruparel et al., Proc Natl Acad Sci USA 102: 5932-7 (2005))。Ruparelらは、伸長をブロックするために小さい3’アリル基を使用しているが、パラジウム触媒による短い処理によって容易に非ブロック化することができる、可逆的ターミネーターの開発を記載した。長波長UV光への30秒の曝露によって容易に切断することができる光切断性リンカーを通して、蛍光団をベースに付着させた。したがって、ジスルフィド還元または光切断を切断可能リンカーとして使用することができる。可逆的終止への別のアプローチは、dNTPの上へのバルキーな色素の設置の後に起こる自然な終止の使用である。dNTPの上の荷電したバルキーな色素の存在は、立体的および/または静電的障害を通して有効なターミネーターとして作用することができる。色素が除去されない限り、1回の組込み事象の存在はさらなる組込みを阻止する。色素の切断は蛍光団を除去し、終止を効果的に逆転させる。改変されたヌクレオチドの例は、米国特許第7,427,673号および第7,057,026号にも記載される。
【0152】
本明細書に記載される方法およびシステムで利用することができるさらなる例示的なSBSシステムおよび方法は、米国特許出願公開第2007/0166705号、第2006/0188901号、第2006/0240439号、第2006/0281109号、第2012/0270305号および第2013/0260372号、米国特許第7,057,026号、国際公開第05/065814号、米国特許出願公開第2005/0100900号、国際公開第06/064199号および国際公開第07/010251号に記載される。
【0153】
一部の実施形態は、4つ未満の異なる標識を使用した4つの異なるヌクレオチドの検出を使用することができる。例えば、米国特許出願公開第2013/0079232号の組み込まれた資料に記載される方法およびシステムを使用して、SBSを実行することができる。第1の例として、一組のヌクレオチドタイプを同じ波長で検出することができるが、他と比較した組の1メンバーの強度における差に基づいて、または、組の他のメンバーについて検出されるシグナルと比較して明らかなシグナルを出現または消滅させる、組の1メンバーへの変化(例えば、化学的改変、光化学的改変または物理的改変を通した)に基づいて区別することができる。第2の例として、4つの異なるヌクレオチドタイプのうちの3つは特定の条件下で検出することができるが、第4のヌクレオチドタイプは、それらの条件下で検出可能である標識を欠くか、またはそれらの条件下で最小限に検出される(例えば、バックグラウンド蛍光による最小限の検出等)。核酸への最初の3つのヌクレオチドタイプの組込みは、それらのそれぞれのシグナルの存在に基づいて決定することができ、核酸への第4のヌクレオチドタイプの組込みは、任意のシグナルの不在または最小限の検出に基づいて決定することができる。第3の例として、1つのヌクレオチドタイプは、2つの異なるチャネルにおいて検出される標識(複数可)を含むことができるが、他のヌクレオチドタイプは、チャネルの1つだけで検出される。前記の3つの例示的な構成は、相互に排他的であると考えられておらず、様々な組合せで使用することができる。全ての3つの例を組み合わせる例示的な実施形態は、第1のチャネルで検出される第1のヌクレオチドタイプ(例えば、第1の励起波長によって励起したときに第1のチャネルで検出される標識を有するdATP)、第2のチャネルで検出される第2のヌクレオチドタイプ(例えば、第2の励起波長によって励起したときに第2のチャネルで検出される標識を有するdCTP)、第1および第2のチャネルで検出される第3のヌクレオチドタイプ(例えば、第1および/または第2の励起波長によって励起したときに両方のチャネルで検出される少なくとも1つの標識を有するdTTP)、ならびにいずれのチャネルでも検出されないかまたは最小限に検出される標識を欠いている第4のヌクレオチドタイプ(例えば、標識を有していないdGTP)を使用する蛍光ベースのSBS方法である。
【0154】
さらに、米国特許出願公開第2013/0079232号の組み込まれた資料に記載される通り、単一のチャネルを使用してシークエンシングデータを得ることができる。そのようないわゆる1色素シークエンシングアプローチでは、第1のヌクレオチドタイプは標識されるが、その標識は第1の画像が生成された後に除去され、第2のヌクレオチドタイプは第1の画像が生成された後にだけ標識される。第3のヌクレオチドタイプは第1と第2の両画像においてその標識を保持し、第4のヌクレオチドタイプは両画像において非標識のままである。
【0155】
一部の実施形態は、ライゲーション技術によるシークエンシングを使用することができる。そのような技術は、オリゴヌクレオチドを組み込み、そのようなオリゴヌクレオチドの組込みを同定するために、DNAリガーゼを使用する。オリゴヌクレオチドは、オリゴヌクレオチドがハイブリダイズする配列の中の特定のヌクレオチドのアイデンティティと相関する異なる標識を一般的に有する。他のSBS方法と同様に、標識されたシークエンシング試薬による核酸フィーチャーのアレイの処理の後に画像を得ることができる。各画像は、特定のタイプの標識を組み込んだ核酸フィーチャーを示す。各フィーチャーの異なる配列含有量のために、異なる画像に異なるフィーチャーが存在するかまたは不在であるが、フィーチャーの相対位置は、画像の中では不変のままである。本明細書に示される通り、ライゲーションベースのシークエンシング方法から得られる画像は、保存し、処理し、分析することができる。本明細書に記載される方法およびシステムで利用することができる例示的なSBSシステムおよび方法は、米国特許第6,969,488号、第6,172,218号および第6,306,597号に記載される。
【0156】
一部の実施形態は、ナノポアシークエンシングを使用することができる(Deamer, D. W. & Akeson, M. "Nanopores and nucleic acids: prospects for ultrarapid sequencing." Trends Biotechnol. 18, 147-151 (2000);Deamer, D. and D. Branton, "Characterization of nucleic acids by nanopore analysis", Acc. Chem. Res. 35:817-825 (2002);Li, J., M. Gershow, D. Stein, E. Brandin, and J. A. Golovchenko, "DNA molecules and configurations in a solid-state nanopore microscope" Nat. Mater. 2:611-615 (2003))。そのような実施形態では、インデックス付きの断片は、ナノポアを通過する。ナノポアは、α-ヘモリシンなどの合成孔または生体膜タンパク質であってよい。インデックス付きの断片がナノポアを通過するにつれて、孔の電気コンダクタンスの変動を測定することによって、各塩基対を同定することができる。(米国特許第7,001,792号;Soni, G. V. & Meller, "A. Progress toward ultrafast DNA sequencing using solid-state nanopores." Clin. Chem. 53, 1996-2001 (2007);Healy, K. "Nanopore-based single-molecule DNA analysis." Nanomed. 2, 459-481 (2007);Cockroft, S. L., Chu, J., Amorin, M. & Ghadiri, M. R. "A single-molecule nanopore device detects DNA polymerase activity with single-nucleotide resolution." J. Am. Chem. Soc. 130, 818-820 (2008))。本明細書に示される通り、ナノポアシークエンシングから得られるデータは、保存し、処理し、分析することができる。詳細には、データは、光学式画像および本明細書に示される他の画像の例示的な処理により画像として処理することができる。
【0157】
一部の実施形態は、DNAポリメラーゼ活性のリアルタイムモニタリングを含む方法を使用することができる。ヌクレオチドの組込みは、例えば米国特許第7,329,492号および第7,211,414号に記載される通り、蛍光団含有ポリメラーゼとγ-リン酸標識ヌクレオチドの間の蛍光共鳴エネルギー転移(FRET)相互作用を通して検出することができるか、または、ヌクレオチドの組込みは、例えば米国特許第7,315,019号に記載されるゼロモード導波管で、ならびに、例えば米国特許第7,405,281号および米国特許出願公開第2008/0108082号に記載の通り蛍光性ヌクレオチド類似体および工学操作ポリメラーゼを使用して検出することができる。蛍光標識ヌクレオチドの組込みを低いバックグラウンドで観察することができるように、照度は表面連結ポリメラーゼの周囲のゼプトリットルスケールの容量に制限することができる(Levene, M. J. et al. "Zero-mode waveguides for single-molecule analysis at high concentrations." Science 299, 682-686 (2003);Lundquist, P. M. et al. "Parallel confocal detection of single molecules in real time." Opt. Lett. 33, 1026-1028 (2008);Korlach, J. et al. "Selective aluminum passivation for targeted immobilization of single DNA polymerase molecules in zero-mode waveguide nano structures." Proc. Natl. Acad. Sci. USA 105, 1176-1181 (2008))。本明細書に示される通り、そのような方法から得られる画像は、保存し、処理し、分析することができる。
【0158】
一部のSBS実施形態は、伸長産物へのヌクレオチドの組込みの後に放出されるプロトンの検出を含む。例えば、放出されたプロトンの検出に基づくシークエンシングは、Ion Torrent(Guilford、CT、Life Technologiesの子会社)から市販されている電気検出器および関連する技術、または米国特許出願公開第2009/0026082号、第2009/0127589号、第2010/0137143号および第2010/0282617号に記載されるシークエンシング方法およびシステムを使用することができる。動態学的排除を使用して標的核酸を増幅するための本明細書に示される方法は、プロトンの検出のために使用される基質に容易に適用することができる。より具体的には、本明細書に示される方法は、プロトンを検出するために使用されるアンプリコンのクローン集団を生成するために使用することができる。
【0159】
複数の異なるインデックス付きの断片を同時に操作するように、上記のSBS方法を多重フォーマットで都合よく実行することができる。特定の実施形態では、異なるインデックス付きの断片は、一般的な反応容器の中で、または特定の基質の表面で処理することができる。これは、シークエンシング試薬の便利なデリバリー、未反応試薬の除去および組込み事象の多重検出を可能にする。表面結合標的核酸を使用した実施形態では、インデックス付きの断片は、アレイフォーマットの形態であってもよい。アレイフォーマットでは、インデックス付きの断片は、空間的に識別可能な様式で表面に一般的に結合することができる。インデックス付きの断片は、直接的な共有結合性付着、ビーズもしくは他の粒子への付着、または表面に付着しているポリメラーゼもしくは他の分子への結合によって結合することができる。アレイは各部位(フィーチャーとも呼ばれる)にインデックス付きの断片の単一コピーを含むことができるか、または、同じ配列を有する複数のコピーが各部位もしくはフィーチャーに存在することができる。本明細書にさらに詳細に記載される通り、架橋増幅または乳濁液PCRなどの増幅方法によって、複数のコピーを生成することができる。
【0160】
本明細書に示される方法は、例えば、少なくとも約10フィーチャー/cm2、100フィーチャー/cm2、500フィーチャー/cm2、1,000フィーチャー/cm2、5,000フィーチャー/cm2、10,000フィーチャー/cm2、50,000フィーチャー/cm2、100,000フィーチャー/cm2、1,000,000フィーチャー/cm2、5,000,000フィーチャー/cm2またはそれより高いものを含む、様々な密度のいずれかのフィーチャーを有するアレイを使用することができる。
【0161】
本明細書に示される方法の利点は、それらが複数のcm2の迅速で効率的な検出を並行して提供することである。したがって、本開示は、本明細書に例示されるものなどの当技術分野で公知である技術を使用して、核酸を調製および検出することが可能な統合化システムを提供する。したがって、本開示の統合化システムは、1つまたは複数の固定化されたインデックス付きの断片に増幅試薬および/またはシークエンシング試薬を送達することが可能な流体構成成分を含むことができ、システムは、ポンプ、バルブ、レザバー、流体系などの構成成分を含む。フローセルは、標的核酸の検出のために、統合化システムに構成することおよび/またはその中で使用することができる。例示的なフローセルは、例えば、米国特許出願公開第2010/0111768号および米国特許出願第13/273,666号に記載される。フローセルについて例示される通り、統合化システムの流体構成成分の1つまたは複数は、増幅方法および検出方法のために使用することができる。一例として核酸シークエンシング実施形態をとると、統合化システムの流体構成成分の1つまたは複数は、本明細書に示される増幅方法のために、および上で例示されるものなどのシークエンシング方法におけるシークエンシング試薬のデリバリーのために使用することができる。あるいは、統合化システムは、増幅方法を実行するためにおよび検出方法を実行するために、別個の流体システムを含むことができる。増幅された核酸を作製すること、および核酸の配列を決定することも可能である統合化シークエンシングシステムの例には、限定されずに、MiSeq(商標)プラットホーム(Illumina,Inc.、San Diego、CA)および米国特許出願第13/273,666号に記載される装置が含まれる。
【0162】
組成物も、本明細書で提供される。本明細書に記載される方法の実施の間、様々な組成物をもたらすことができる。例えば、三重インデックス付きの核酸断片を含む組成物をもたらすことができる。マルチウェルプレートも提供され、ここで、マルチウェルプレートのウェルは三重インデックス付きの核酸断片を含む。
【0163】
本明細書で、キットも提供される。一実施形態では、キットは、シークエンシングライブラリーを調製するためのものである。キットは、適する包装材料の中に、本明細書に記載されるトランスポソームおよび/または線形増幅媒介物を少なくとも1つのアッセイまたは使用に十分な量で含む。適宜、プライマー、インデックス、遍在配列またはその組合せを含む1つまたは複数の核酸などの、他の構成成分が含まれてもよい。含まれてもよい他の構成成分は、緩衝剤などの試薬および溶液である。包装された構成成分の使用説明書も、一般的に含まれる。本明細書で使用されるように、フレーズ「包装材料」は、キットの内容を収納するために使用される1つまたは複数の物理的構造物を指す。包装材料は、無菌の無汚染物環境を一般的に提供するためにルーチンの方法によって構築される。包装材料は、シークエンシングライブラリーを生成する構成成分を使用することができることを示す標識を有することができる。さらに、包装材料は、キットの中の材料がどのように用いられるかを示す説明書を含有する。本明細書で使用されるように、用語「パッケージ」は、キットの構成成分を固定された限度の範囲内で保持することが可能である、ガラス、プラスチック、紙、ホイルなどの容器を指す。「使用説明書」は、試薬濃度、または混合される試薬および試料の相対量、試薬/試料混合物のための維持時間、温度、緩衝条件などの、少なくとも1つのアッセイ方法パラメータを記載する具体的な表現を一般的に含む。
【0164】
例示的な実施形態
実施形態1。複数の単一の核または細胞からの核酸を含むシークエンシングライブラリーを調製するための方法であって:第1の複数のコンパートメントに複数の単離された核または細胞を提供する工程であって、各コンパートメントは単離された核または細胞のサブセットを含み、核または細胞は核酸断片を含む工程;
線形増幅媒介物を細胞または核に導入する工程;
線形増幅によって核酸断片を増幅する工程;
核または細胞の各サブセットを処理してインデックス付きの核または細胞を生成する工程であって、処理は、単離された核または細胞に存在する核酸断片に第1のコンパートメント特異的インデックス配列を加えて単離された核または細胞に存在するインデックス付きの核酸をもたらすことを含み、処理は、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅または転位を含む工程;および
インデックス付きの核または細胞を合わせてプールされたインデックス付きの核または細胞を生成し、それによって複数の核または細胞からシークエンシングライブラリーを生成する工程を含む方法。
【0165】
実施形態2。増幅が処理の前に起こる、実施形態1の方法。
【0166】
実施形態3。処理が増幅の前に起こる、実施形態1の方法。
【0167】
実施形態4。複数の単一の核または細胞からの核酸を含むシークエンシングライブラリーを調製するための方法であって:
核酸断片を含む複数の単離された核または細胞を提供する工程;
線形増幅媒介物を単離された核または細胞に導入する工程;
第1の複数のコンパートメントに単離された核または細胞を分配する工程であって、各コンパートメントは単離された核または細胞のサブセットを含む工程;
線形増幅によって核酸断片を増幅する工程;
単離された核または細胞の各サブセットを処理してインデックス付きの核または細胞を生成する工程であって、処理は、単離された核または細胞に存在する核酸断片に第1のコンパートメント特異的インデックス配列を加えて単離された核または細胞に存在するインデックス付きの核酸をもたらすことを含み、処理は、ライゲーション、プライマー伸長、増幅または転位を含む工程;
インデックス付きの核を合わせてプールされたインデックス付きの核または細胞を生成し、それによって複数の核または細胞からシークエンシングライブラリーを生成する工程を含む方法。
【0168】
実施形態5。複数の単一の核または細胞からの核酸を含むシークエンシングライブラリーを調製するための方法であって:
第1の複数のコンパートメントに複数の単離された核または細胞を提供する工程であって、各コンパートメントは単離された核または細胞のサブセットを含み、核または細胞は核酸断片を含む工程;
核または細胞の各サブセットを処理してインデックス付きの核または細胞を生成する工程であって、処理は、単離された核または細胞に存在する核酸断片に、(i)第1のコンパートメント特異的インデックス配列を加えて単離された核または細胞に存在するインデックス付きの核酸をもたらすこと、および(ii)線形増幅媒介物によって認識されるヌクレオチド配列を加えることを含み、処理は、ライゲーション、プライマー伸長、ハイブリダイゼーション、増幅または転位を含む工程;
線形増幅媒介物を細胞または核に導入する工程;
線形増幅によって核酸断片を増幅する工程;および
インデックス付きの核または細胞を合わせてプールされたインデックス付きの核または細胞を生成し、それによって複数の核または細胞からシークエンシングライブラリーを生成する工程を含む方法。
【0169】
実施形態6。線形増幅媒介物がファージRNAポリメラーゼまたは線形増幅プライマーを含む、実施形態1~5のいずれか1つの方法。
【0170】
実施形態7。核酸断片がT7プロモーターを含み、ファージRNAポリメラーゼがT7 RNAポリメラーゼを含む、実施形態1~6のいずれか1つの方法。
【0171】
実施形態8。線形増幅媒介物を導入することが、線形増幅媒介物を単離された核または細胞に存在する核酸断片に加えることを含む、実施形態1~7のいずれか1つの方法。
【0172】
実施形態9。各コンパートメントの複数の単離された核または細胞を所定の条件に曝露させることをさらに含む、実施形態1~8のいずれか1つの方法。
【0173】
実施形態10。曝露させた後に複数の細胞から核を単離することをさらに含む、実施形態1~9のいずれか1つの方法。
【0174】
実施形態11。複数の単離された核または細胞を所定の条件に曝露させることをさらに含む、実施形態1~10のいずれか1つの方法。
【0175】
実施形態12。単離された核の完全性を維持しつつヌクレオソームが枯渇された核を生成する条件に単離された核を付すことをさらに含む、実施形態1~11のいずれか1つの方法。
【0176】
実施形態13。処理が、
各サブセットをトランスポソーム複合体と接触させる工程であって、各コンパートメントの中のトランスポソーム複合体は、他のコンパートメントの中の第1のインデックス配列と異なる第1のインデックス配列を含む工程;および
サブセットの中の核酸を複数の核酸に断片化し、第1のインデックス配列をその核酸の少なくとも1つの鎖に組み込んでインデックス付きの核酸を含むインデックス付きの核または細胞を生成する工程を含む、実施形態1~12のいずれか1つの方法。
【0177】
実施形態14。処理が、各サブセットを逆転写酵素および単離された核の中のRNA分子にアニールするプライマーと接触させる工程であって、各コンパートメントの中のプライマーは、他のコンパートメントの中の第1のインデックス配列と異なる第1のインデックス配列を含み、インデックス付きの核酸を含むインデックス付きの核または細胞を生成する工程を含む、実施形態1~13のいずれか1つの方法。
【0178】
実施形態15。接触させることが特異的ヌクレオチド配列にアニールする標的特異的プライマーをさらに含む、実施形態1~14のいずれか1つの方法。
【0179】
実施形態16。第1のコンパートメント特異的インデックス配列を加える処理が、遍在配列を含むヌクレオチド配列を核酸断片に加え、次に第1コンパートメント特異的インデックス配列を核酸断片に加える2工程法を含む、実施形態1~15のいずれか1つの方法。
【0180】
実施形態17。加えることが遍在配列を含むトランスポソーム複合体を含む、実施形態1~16のいずれか1つの方法。
【0181】
実施形態18。処理が、第1のインデックスを単離された核または細胞に存在するDNA核酸に加えること、第1のインデックスを単離された核または細胞に存在するRNA核酸に加えること、またはその組合せを含む、実施形態1~17のいずれか1つの方法。
【0182】
実施形態19。第1のインデックス配列をRNA核酸に加えることが、各サブセットを逆転写酵素および単離された核または細胞の中のRNA分子にアニールするプライマーと接触させる工程であって、各コンパートメントの中のプライマーは、第1のコンパートメント特異的インデックス配列を含み、インデックス付きの核酸を含むインデックス付きの核または細胞を生成する工程を含む、実施形態1~18のいずれか1つの方法。
【0183】
実施形態20。第1のインデックス配列をDNA核酸に加えることが、
各サブセットをトランスポソーム複合体と接触させる工程であって、各コンパートメントの中のトランスポソーム複合体は、第1のコンパートメント特異的インデックス配列を含む工程;および
サブセットの中の核酸を複数の核酸に断片化し、第1のコンパートメント特異的インデックス配列をその核酸の少なくとも1つの鎖に組み込んでインデックス付きの核酸を含むインデックス付きの核または細胞を生成する工程を含む、実施形態1~19のいずれか1つの方法。
【0184】
実施形態21。各コンパートメントにおいてDNA核酸に加えられる第1のインデックス配列およびRNA核酸に加えられる第1のインデックス配列が同一である、実施形態1~20のいずれか1つの方法。
【0185】
実施形態22。各コンパートメントにおいてDNA核酸に加えられる第1のインデックス配列およびRNA核酸に加えられる第1のインデックス配列が同一でない、実施形態1~21のいずれか1つの方法。
【0186】
実施形態23。核酸断片の指数関数的増幅をさらに含み、指数関数的増幅は、特異的ヌクレオチド配列にアニールする標的特異的プライマーを含む、実施形態1~22のいずれか1つの方法。
【0187】
実施形態24。合わせた後に、
プールされたインデックス付きの核または細胞のサブセットを、第2の複数のコンパートメントに分配する工程;および
第2のコンパートメント特異的インデックス配列をインデックス付きの核酸に導入して二重インデックス付きの核酸を含む二重インデックス付きの核または細胞を生成する工程であって、導入することは、ライゲーション、プライマー伸長、増幅または転位を含む工程をさらに含む、実施形態1~23のいずれか1つの方法。
【0188】
実施形態25。二重インデックス付きの核を合わせてプールされた二重インデックス付きの核または細胞を生成する工程、
プールされた二重インデックス付きの核または細胞のサブセットを第3の複数のコンパートメントに分配する工程;および
第3のコンパートメント特異的インデックス配列をインデックス付きの核酸に導入して三重インデックス付きの核酸を含む三重インデックス付きの核または細胞を生成する工程であって、導入することは、ライゲーション、プライマー伸長、増幅または転位を含む工程をさらに含む、実施形態1~24のいずれか1つの方法。
【0189】
実施形態26。メチル化分析のためにインデックス付きの核または細胞を処理してメチル化分析のために適する核酸断片を生成することをさらに含む、実施形態1~25のいずれか1つの方法。
【0190】
実施形態27。インデックス付きの核または細胞を近接性ライゲーションに付してクロマチン高次構造の分析のために適する核酸断片を生成することをさらに含む、実施形態1~26のいずれか1つの方法。
【0191】
実施形態28。シークエンシングライブラリーの核酸断片を増幅してDNAナノボールを生成することをさらに含む、実施形態1~27のいずれか1つの方法。
【0192】
実施形態29。コンパートメントがウェルまたは液滴を含む、実施形態1~28のいずれか1つの方法。
【0193】
実施形態30。第1の複数のコンパートメントの各コンパートメントが50から100,000,000個の核または細胞を含む、実施形態1~29のいずれか1つの方法。
【0194】
実施形態31。第2の複数のコンパートメントの各コンパートメントが50から100,000,000個の核または細胞を含む、実施形態1~29のいずれか1つの方法。
【0195】
実施形態32。複数の増幅部位を含む表面を提供する工程であって、増幅部位が遊離の3’末端を有する付着した一本鎖の捕捉オリゴヌクレオチドの少なくとも2つの集団を含む工程、および
複数の増幅部位を生成するのに適する条件の下で増幅部位を含む表面をインデックス付きの断片と接触させ、各々は複数のインデックスを含む個々の断片からのアンプリコンのクローン集団を含む工程をさらに含む、実施形態1~31のいずれか1つの方法。
【0196】
実施形態33。複数の単一の細胞からの核酸を含むシークエンシングライブラリーを調製するための方法であって、
(a)複数の細胞からの単離された核を提供する工程;
(b)単離された核の完全性を維持しつつヌクレオソームが枯渇された核を生成する化学処理に単離された核を付す工程;
(c)ヌクレオソームが枯渇された核のサブセットを第1の複数のコンパートメントに分配し、各サブセットをトランスポソーム複合体と接触させる工程であって、各コンパートメントの中のトランスポソーム複合体がトランスポザーゼおよび他のコンパートメントの中の第1のインデックス配列と異なる第1のインデックス配列を含む工程;
(d)ヌクレオソームが枯渇された核のサブセットの中の核酸を複数の核酸断片に断片化し、第1のインデックス配列を核酸断片の少なくとも1つの鎖に組み込んでインデックス付きの核酸断片を含むインデックス付きの核を生成する工程であって、インデックス付きの核酸断片はトランスポザーゼに付着したままである工程;
(d)インデックス付きの核を合わせてプールされたインデックス付きの核を生成する工程;
(e)プールされたインデックス付きの核のサブセットを第2の複数のコンパートメントに分配し、各サブセットをヘアピンライゲーション二重鎖と、インデックス付きの核酸断片の片方または両方の末端へのヘアピンライゲーション二重鎖のライゲーションに適する条件の下で接触させて二重インデックス付きの核酸断片をもたらす工程であって、ヘアピンライゲーション二重鎖が他のコンパートメントの中の第2のインデックス配列と異なる第2のインデックス配列を含む工程;
(f)二重インデックス付きの核を合わせてプールされたインデックス付きの核を生成する工程;
(g)プールされた二重インデックス付きの核のサブセットを第3の複数のコンパートメントに分配する工程;
(h)二重インデックス付きの核を溶解させる工程;
(i)他のコンパートメントの中の第3のインデックス配列と異なる第3のインデックス配列を含むように二重インデックス付きの核断片を処理する工程;および
(j)三重インデックス断片を合わせ、それによって複数の単一の細胞からの全ゲノム核酸を含むシークエンシングライブラリーを生成する工程
を含む方法。
【実施例0197】
本開示は、以下の実施例によって例示される。特定の例、材料、量および手順は本明細書に示される開示の範囲および精神にしたがって広義に解釈されるべきであることを理解すべきである。
スループットの指数関数的増加を可能にすると同時に増幅バイアスを最小にするために、単一細胞コンビナトリアルインデクシングおよび線形増幅を組み入れたsci-L3を開発した。3回の分子バーコード化によって、sci-L3は、線形増幅の利点を保持しつつ、1回の実験につき少なくとも数千のおよび潜在的に数百万の細胞までLIANTIのスループットを向上させる。我々は、単一細胞全ゲノムシークエンシング(「sci-L3-WGS」)、標的化ゲノムシークエンシング(「sci-L3-標的-seq」)ならびにゲノムおよびトランスクリプトームの共アッセイ(「sci-L3-RNA/DNA」)の概念実証を通したsci-L3フレームワークの一般化の可能性を実証する。さらなる実証として、不妊の種間(B6×Spretus)F1雄マウスならびに妊性の種内(B6×Cast)F1雄マウスからの未熟のおよび成熟した雄生殖細胞における、先例のない数の減数分裂の交差および稀な染色体誤分離事象をマッピングするために、sci-L3-WGSを適用する。
表2。sci-L3-WGSの費用計算。現在の方法は3レベルのインデクシングを含み、それはスループットを増加させ、バーコード衝突を低減するだけでなく、ライブラリー調製の1細胞あたりの費用も有意に低減する。これは、2つの理由による:1)2レベルインデクシングでは、類似した数の細胞をプロファイリングするためにより多くのTn5トランスポソーム複合体で開始する必要があり、それは費用を実質的に増加させる;2)2レベルインデクシングでは、IVT、RTおよびカラム精製の前に1ウェルあたりかなりより少ない数の核の選別に制限され、それも費用を実質的に増加させる。約10kおよび約1Mの細胞の処理については、3レベルsci-L3-WGSは1細胞あたりLIANTIよりほぼ400倍および7,000倍費用が安いと推定する。
これらの限界の全てに一度に対処するために、sci-L3-WGSを種間交雑(雌Mus musculus domesticus C57BL/6(「B6」)×雄Mus spretus SPRET/Ei(後に「Spret」))の不妊性の子孫ならびに種内雑種(雌B6×雄Mus musculus castaneous CAST/Ei(「Cast」))の妊性の子孫に適用した。高度にスケーラブルな技術によって精子を配列決定することによって、哺乳動物系のために、妊性および不妊性の雑種における先例のない数の交差事象をマッピングすることができる。さらに、稀な2C二次精母細胞からプロファイルを回収するためにsci-L3-WGSのスループットを活用することによって、同じ単一の細胞から交差および染色体誤分離を同時に調査することもできる。
表3。回収した細胞の数および細胞倍数性、(B6×Spret)副睾丸。選別された全ての細胞のためにシークエンシングライブラリーを作製したわけではなかったことに留意する;例えば、Exp1における2Cライブラリーは、細胞のサブセットを含有するだけである。我々は、1C細胞のためにも広くゲーティングし(ある特定のウェルでは最大58個のDAPIシグナル)、この交雑における豊富な2C細胞のために、1C細胞については約51~55%に富化することができるだけである。
まとめると、両方とも同じ技術によって測定した、有糸分裂LOHの低い率(予想される)と均等分離を示す2C細胞の比較的高い率(予想外の)の間のコントラストは、後者が体細胞に対応する可能性が非常に低いことを確認する。次のセクションでは、妊性の(B6×Cast)交雑を分析することによって、1)ここで観察した全ゲノム均等分離事象が、2つの1C細胞のダブレットのアーチファクトでないこと、および2)そのような分離事象は、低い率であるが、妊性の種内雑種においても起こることをさらに示す。
回収およびバーコード衝突率を調査するために品質管理のために主に実行した、この交雑での最初のsci-L3-WGS実験では、1Cの円形精子を均一に分配し、2回のバーコード化の後に1C細胞のために選別しただけだった。それらが非1Cであるという事実によって同定されるダブレットは、バーコード衝突の率を定量化することを可能にする。2,400個の選別された細胞(200/ウェル)の中で、1細胞につき>7,000個の読み取りデータで2,127個(89%)が回収された。これらのうちの2,008個は減数分裂交差を有する1Cであり、5.5%のバーコード衝突率を示す。1.06×のシークエンシング深度で、1細胞につき約60kの特異なTn5挿入の中間値を得、これは、約0.6%の中間ゲノムカバレージに対応した。
我々は雄マウス減数分裂を研究するためにsci-L3-WGSを適用して、M2細胞の予想外の集団を同定した。データの単一細胞の性質は、我々が減数分裂の交差および染色体誤分離を同時に特徴付けることも可能にした。逆分離事象はヒト雌減数分裂(Ottolini et al., 2015)の全分析において以前に観察されており、マウス雄減数分裂との関連で類似の事象がここで観察される(すなわち、1つまたはいくつかの染色体の均等分離)。我々が(B6×Spret)交雑から分析した292個のM2細胞の中で、個々の細胞は、均等または還元染色体分離の方へバイアスされ、細胞が減数分裂を続行するか、またはその染色体の有糸分裂分離に戻るかどうか決定する包括的感知機構を示唆している。さらに、我々の知る限り、哺乳動物の減数分裂で初めて、我々はMIの間の全ゲノム均等分離の複数の例を観察し、染色体自律様式よりはむしろ細胞自律様式の均等分離を示唆している。妊性の(B6×Cast)交雑ではより稀であるが、我々は両交雑においてそのような事象を同定した。
向上したゲノムカバレージは、他の単一細胞シークエンシング方法と比較して交差ブレークポイントの高分解能マッピングを可能にし、合計約87,000個の交差のマッピングのためのスループットは、我々がパイルアップデータによって交差ホットニスに関連したゲノムおよびエピゲノムフィーチャーをより良好に特徴付けることを可能にした。交差ホットニスの連続帯が多くの因子によってどのように形成されるかについて、実施例2、「交差ホットニスおよび関連する(エピ)ゲノム因子」のセクションで議論する。
sci-L3の開発においてトランスポゾン挿入(LIANTI)を通してハイスループット単一細胞コンビナトリアルインデクシング(「sci」)スキームを線形増幅と単に組み合わせることからの1つの重要な差は、ライゲーションによってT7プロモーターを導入したことであり、それは2回を超える細胞バーコード化を可能にし、さらにかなり低減された費用でスループットを増加させるだけでなく、この方法をプロトコールの小さい微調整によって他の単一細胞アッセイに一般化するための柔軟性も提供する。第1の例として、sci-L3-WGSをsci-L3-標的-seqに容易に適合させることができることを実証する。単一細胞標的化シークエンシングは10Xゲノム研究プラットホームによって報告されているが、我々の知る限りでは、それはDNA遺伝子座ではなくRNA転写物のものである。現在の1ハプロタイプにつき10%の「回収率」は標的化シークエンシングに理想的でないかもしれないが、それは分析することができる多数の細胞によって緩和される。第2の例として、sci-L3-WGSをsci-L3-RNA/DNA共アッセイにも適合させることができることを実証する。クロマチンアクセス性、メチロームおよびクロマチン高次構造のそれぞれの単一細胞プロファイリングのために、sci-L3をATAC-seq、重亜硫酸-seqおよびHi-Cに適合させることがさらに可能であるかもしれないと我々は予期し、それは、スループットおよび増幅均一性に関してこれらの目標のための公開されたsci-方法(Cusanovich et al., 2015;Mulqueen et al., 2018;Ramani et al., 2017)に対して利点を有する可能性がある。
要約すると、sci-L3-WGS、sci-L3-標的-seqおよびsci-L3-RNA/DNA共アッセイは、単一細胞シークエンシングのためのツールセットを拡張する。この研究では、我々は、sci-L3-WGSがどのように減数分裂性組換えの系統的で定量的な像を提供することができるかについてさらに示し、スループットの先例のない組合せによって稀な全ゲノム染色体誤分離事象を明るみに出す。sci-L3方法は、例えば、稀な相同体間有糸分裂交差を研究するために、およびがんの遺伝的異質性および発生を解剖するために、単一細胞ゲノムシークエンシングがトランスフォーマティブであることが証明される他の状況で高度に有益になると、我々は予想する。