(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2024-09-19
(45)【発行日】2024-09-30
(54)【発明の名称】核酸シーケンシングの核酸フラグメント起源を追跡するための方法および組成物
(51)【国際特許分類】
C12Q 1/6862 20180101AFI20240920BHJP
C12N 15/00 20060101ALI20240920BHJP
C12Q 1/6813 20180101ALI20240920BHJP
C12Q 1/6834 20180101ALI20240920BHJP
C12Q 1/6869 20180101ALI20240920BHJP
【FI】
C12Q1/6862 Z
C12N15/00 100Z
C12Q1/6813 Z
C12Q1/6834 Z
C12Q1/6869 Z
(21)【出願番号】P 2022509045
(86)(22)【出願日】2020-08-19
(86)【国際出願番号】 US2020047067
(87)【国際公開番号】W WO2021034974
(87)【国際公開日】2021-02-25
【審査請求日】2022-04-28
(32)【優先日】2019-08-19
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】521391748
【氏名又は名称】ユニバーサル シーケンシング テクノロジー コーポレイション
(74)【代理人】
【識別番号】100083806
【氏名又は名称】三好 秀和
(74)【代理人】
【識別番号】100095500
【氏名又は名称】伊藤 正和
(74)【代理人】
【識別番号】100111235
【氏名又は名称】原 裕子
(74)【代理人】
【識別番号】100195257
【氏名又は名称】大渕 一志
(72)【発明者】
【氏名】チェン, ジョウタオ
(72)【発明者】
【氏名】ウー, ツァイ-チン
(72)【発明者】
【氏名】ファム, ロン キム
(72)【発明者】
【氏名】ワン, ヨン
(72)【発明者】
【氏名】レイ, ミン
【審査官】西澤 龍彦
(56)【参考文献】
【文献】国際公開第2019/157318(WO,A1)
【文献】特表2018-501776(JP,A)
【文献】ZHANG, F et al.,Haplotype phasing of whole human genomes using bead-based barcode partitioning in a single tube,Nature Biotechnology,2017年,Vol. 35,pp. 852-857
(58)【調査した分野】(Int.Cl.,DB名)
C12Q
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
バーコード化することによって核酸フラグメントの起源を追跡するための方法であって、前記方法は、
a.複数の2本鎖核酸フラグメントおよび複数のビーズを含む反応混合物を提供する工程であって、ここで各ビーズは、バーコードテンプレートの少なくとも2種の異なる集団に由来する少なくとも2種の異なる固定化されたバーコードテンプレートを含み、ここでバーコードテンプレートの各集団は、同じバーコードテンプレートの複数のコピーを含み、ここで各バーコードテンプレートは、バーコード配列を含み、ここで前記バーコード配列は、
これを含む前記バーコードテンプレートに特有の配列を有することで前記バーコードテンプレートの識別子であるように構成される、工程
b.前記核酸フラグメントから少なくとも2種の、バーコードが結合された部分フラグメントを生成する工程であって、ここで同じ核酸フラグメントに由来する前記少なくとも2種のバーコードが結合された部分フラグメントは、同じビーズに由来する同じ配列を有する前記バーコード配列に各々結合される、工程;および
c.前記バーコードが結合された部分フラグメントの起源を、それらの前記バーコード配列によって追跡/同定する工程であって、ここで前記同じ配列を有するバーコードが結合された部分フラグメントは、前記同じ核酸フラグメントを突き止める、工程、を包含
し、
ここで各ビーズ上の前記バーコードテンプレート集団のうちの少なくとも1つはまた、前記複数のビーズの中で共通の共有バーコードテンプレート集団として少なくとも別のビーズ上に存在し、
ここで前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうちの50%未満である、方法。
【請求項2】
前記反応混合物は、アリコートにも液滴にも区画化されない、請求項1に記載の方法。
【請求項3】
前記反応混合物中の前記ビーズは、合計で少なくと
も1000種の異なるバーコード配列を含む、請求項1に記載の方法。
【請求項4】
前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうち
の10%未満である、請求項
1に記載の方法。
【請求項5】
前記2本鎖核酸は、2本鎖DNA、またはDNA/RNAハイブリッド、またはこれらの組み合わせを含む、請求項1に記載の方法。
【請求項6】
前記2本鎖核酸は
、1000bpより大きい、請求項5に記載の方法。
【請求項7】
前記2本鎖核酸フラグメントは、天然の、改変された、増幅された、または他の化学的に処理された形態またはこれらの組み合わせにおいてDNAまたはRNAを含む核酸分子を含む、請求項1に記載の方法。
【請求項8】
前記2本鎖核酸フラグメントは、
工程bの前に先ず前記ビーズに非特異的に結合される、請求項1に記載の方法。
【請求項9】
前記2本鎖核酸フラグメントは、トランスポソソームにより鎖転移され、前記ビーズとの相互作用の前に、鎖転移複合体を形成する、請求項1に記載の方法。
【請求項10】
前記バーコードが結合された部分フラグメントを生成する工程は、ライゲーション、ハイブリダイゼーション、鎖転移反応、タグメンテーション、増幅、プライマー伸長、またはこれらの組み合わせの工程を含む、請求項1に記載の方法。
【請求項11】
前記鎖転移反応または前記タグメンテーショ
ンは、トランスポザーゼを利用する工程を包含し、ここで前記トランスポザーゼは、野生型のTnトランスポザーゼ、Muトランスポザーゼ、Tyトランスポザーゼ、およびTcトランスポザーゼ、これらの変異体またはタグ付きバージョン、ならびにこれらの組み合わせからなる群より選択される、請求項10に記載の方法。
【請求項12】
前記バーコードが結合された部分フラグメントの起源を追跡/同定する工程は、前記核酸フラグメントのハプロタイプフェージング情報および/または構造バリエーションを決定するためのシーケンシングを含む、請求項1に記載の方法。
【請求項13】
前記バーコードが結合された部分フラグメントの起源を追跡/同定する工程は、重複した核酸フラグメントの正体またはコピー数バリエーション情報を決定するためのシーケンシングを含む、請求項1に記載の方法。
【請求項14】
バーコード化することによって核酸フラグメントの起源を追跡するためのシステムであって、前記システムは、
複数の2本鎖核酸フラグメントおよび複数のビーズを含む反応混合物、を含み、
ここで各ビーズは、バーコードテンプレートの少なくとも2種の異なる集団に由来する少なくとも2種の異なる固定化されたバーコードテンプレートを含み、ここでバーコードテンプレートの各集団は、同じバーコードテンプレートの複数のコピーを含み、
ここで各バーコードテンプレートは、バーコード配列を含み、ここで前記バーコード配列は、
これを含む前記バーコードテンプレートに特有の配列を有することで前記バーコードテンプレートの識別子であるように構成され、
ここで少なくとも2種の、バーコードが結合された部分フラグメントが前記核酸フラグメントから生成され、ここで同じ核酸フラグメントに由来する前記少なくとも2種のバーコードが結合された部分フラグメントは、同じビーズに由来する同じ配列を有する前記バーコード配列に各々結合され;
ここで前記バーコードが結合された部分フラグメントの起源
がそれらの前記バーコード配列によって追跡/同定されるように構成され
、
ここで前記同じ配列を有するバーコードが結合された部分フラグメントは、前記同じ核酸フラグメントを突き止
め、
ここで各ビーズ上の前記バーコードテンプレート集団のうちの少なくとも1つはまた、前記複数のビーズの中で共通の共有バーコードテンプレート集団として少なくとも別のビーズ上に存在し、
ここで前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうちの50%未満である、
システム。
【請求項15】
前記反応混合物は、アリコートにも液滴にも区画化されず;
そして前記反応混合物中の前記ビーズは、合計で少なくと
も1000種の異なるバーコード配列を含む、請求項1
4に記載のシステム。
【請求項16】
前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうち
の10%未満である、請求項1
4に記載のシステム。
【請求項17】
前記2本鎖核酸は、2本鎖DNA、またはDNA/RNAハイブリッド、またはこれらの組み合わせを含む、請求項1
4に記載のシステム。
【発明の詳細な説明】
【技術分野】
【0001】
分野
本発明は一般に、核酸シーケンシングのための方法および組成物に関する。特に、本明細書で提供される方法および組成物は、核酸ライブラリーの調製およびこれに由来するシーケンシングデータの生成に関する。
【背景技術】
【0002】
背景
核酸シーケンシングは、診断、予後、ゲノム薬理学、および法医学生物学を含む、広く種々の生体医学的適用のための情報を提供し得る。シーケンシングは、基本的な低スループット法(Maxam-Gilbertシーケンシング(化学的に改変されたヌクレオチド)およびSangerシーケンシング(チェーンターミネーション)法が挙げられる)または高スループット次世代法(大規模並行パイロシーケンシング、合成によるシーケンシング(sequencing by synthesis)、ライゲーションによるシーケンシング(sequencing by ligation)、半導体シーケンシングなどが挙げられる)を含み得る。大部分のシーケンシング法に関しては、サンプル(例えば、核酸標的)は、シーケンシング機器でシーケンシングされる前に、シーケンシングライブラリーへと処理される必要がある。例えば、サンプルは、フラグメント化され得るか、増幅され得るか、または識別子へと結合され得る。特有の識別子は、特定のサンプルの起源を同定するために、しばしば使用される。
【0003】
大部分の市販されているシーケンシング技術は、シーケンシングリード長が制限されている。第二世代シーケンシング技術は特に、数百塩基をシーケンシングし得るに過ぎず、千塩基に達することは到底ない。しかし、遺伝子の核酸配列は、数キロベースから数十および数百キロベースにまで及び得、これは、数十キロベースのシーケンシングリード長が、全遺伝子のハプロタイプを成功裡に決定するために必要であることを意味する。
シーケンシングリード長が短いという問題を克服するために、長い核酸標的がシーケンシングライブラリー調製のために小さなフラグメントに分解される時に、それらを標的特異的に標識するための多くの方法が開発されてきた。このような方法としては、Complete Genomicsのロングフラグメントリード、Illuminaの合成ロングリード、10x Genomicsの連結リード(Zhengら, 2016)、Illuminaの単一チューブ法(Zhangら, 2017)および本発明者ら自身の単一チューブ法(WO2017/151828)が挙げられる。これらの標的特異的標識は、短い核酸配列(バーコードと称される)である。これらの短い核酸フラグメントの起源は、それらの特有の関連バーコードに基づいて同定され得る。上記方法において使用されるバーコード集団の多様性が広いほど、それが同定を提供する特異性はより良好になる。10x Genomicsの連結リード法は、広く使用されている。しかしそれは、標的特異的バーコード標識化反応のクローン性を維持するために、油中水型エマルジョン法を要求する。この要件は、そのサンプル調製手順の複雑性およびコストを顕著に増大させる。Complete Genomics(米国特許第9328382号)、Illuminaの単一チューブ法(Zhangら, 2017)および本発明者らの方法(WO2017/151828)に属する方法を含むいくつかの方法は、トランスポザーゼベースのシステムを使用し、反応におけるエマルジョン液滴を用いた核酸標的の分割の必要性を除去する。これらの方法は、原則として、単一チューブ反応フォーマットにおいて標的特異的バーコード化を可能にする。本発明は、ワークフローの反応効率および単純性に対する顕著な改善とともに、新規なトランスポザーゼベースの単一チューブバーコード化法を提供する。
【先行技術文献】
【特許文献】
【0004】
【文献】国際公開第2017/151828号
【文献】米国特許第9328382号明細書
【発明の概要】
【課題を解決するための手段】
【0005】
要旨
1つの局面において、バーコードタグ付けによって核酸フラグメント起源を追跡する方法が、本明細書で記載される。上記方法は、固定化されたクローン性のバーコードテンプレートまたは半クローン性のバーコードテンプレートを有する複数の固体支持体を提供する工程であって、ここで上記バーコードテンプレートは、少なくとも2種の異なるバーコード配列、多数派バーコード配列および少数派バーコード配列を含み;バーコード化した固体支持体上の上記多数派バーコード配列は、他のバーコード化した固体支持体の多数派バーコード配列とは実質的に異なり、少数派バーコード配列は、他のバーコード化した固体支持体の少数派バーコード配列と同じである、工程、ならびに複数のトランスポソソームを提供する工程であって、各トランスポソソームは、転移可能DNAおよびトランスポザーゼを含み、ここで上記トランスポソソームにおける少なくとも1種の転移可能DNAは、ハイブリダイゼーションまたはアフィニティー部分によって直接的にまたは間接的に上記固体支持体上のバーコードテンプレートによって捕捉され得る工程を包含する。核酸標的は、上記固体支持体、および1つの反応容器中の上記トランスポソソームに接触して、同時の鎖転移および捕捉反応によって、上記固体支持体上のバーコード情報を上記核酸標的に結合させる。前述の反応は、各核酸標的を複数の核酸標的全体内の別の核酸標的からさらに分割することなしに、実質的に同時に起こる。上記核酸標的は、鎖転移複合体を破壊することによってフラグメントに分解され、ここで少なくとも1つのフラグメントは、上記固体支持体上のバーコードテンプレートに結合される。
【0006】
場合によっては、上記固体支持体上に固定化されたクローン性のバーコードテンプレートまたは半クローン性のバーコードテンプレートは、直接合成、クローン性増幅、またはこれらの組み合わせの方法によって生成される。上記クローン性増幅は、エマルジョンPCR、ブリッジPCR、等温性PCR、テンプレートウォーキング(template walking)、ナノボール生成(nanoball generation)、およびこれらの組み合わせであり得る。特定の場合には、上記バーコード化した固体支持体は、増幅された集団および増幅されなかった集団を分離することなく、クローン性増幅法によって調製される。さらなる場合には、上記バーコード化した固体支持体は、増幅された集団のみまたは主に富化され、増幅された集団での増幅されたクローン性増幅によって調製される。
【0007】
1つの局面において、上記反応は、ポリエチレングリコール、プルロニック(登録商標)、セルロース、アガロース、およびそれらの誘導体、ならびに他のポリマー、ならびにこれらの組み合わせの群より選択される物質を添加することによって、拡散を減少させかつ懸濁を増大させるために粘度を制御した緩衝液系中に(好ましくは、約2~200 mPa・sの粘度を有する)にある。
【0008】
1つの局面において、上記トランスポソソームは、個々の転移可能DNAおよびトランスポザーゼで、それらをトランスポソソームへと予めアセンブリすることなく、置き換えられ得る。
【0009】
別の局面において、第2のトランスポソソームは、反応容器中での最初の反応の後に添加される;ここで先に添加されたトランスポソソームは、第1のトランスポソソームといわれ、上記第1のおよび第2のトランスポソソームは、同じタイプもしくは異なるタイプのもの、または同じタイプの異なるトランスポゾン配列であり得る。別の局面において、第2のトランスポソソームは、上記核酸標的をフラグメントへと破壊した後に添加される。
【0010】
別の局面において、上記核酸標的は、非特異的結合によって上記固体支持体に予め結合され得る。
【0011】
別の局面において、上記容器中での捕捉反応は、ライゲーションによるか、またはハイブリダイゼーションによるか、またはアフィニティータグによるか、または抗体および抗原反応によるか、またはクリックケミストリーによるか、またはこれらの組み合わせによるものである。
【0012】
別の局面において、上記捕捉反応は、第1のハイブリダイゼーション、および次いで、ライゲーションを含む。
【0013】
別の局面において、上記バーコード化した固体支持体は、上記固体支持体上に固定化されたいくつかのバーコードテンプレートの末端に予め結合された、転移可能DNAまたはトランスポソソームを有する。
【0014】
別の局面において、上記トランスポザーゼは、野生型のTnトランスポザーゼ、Muトランスポザーゼ、Tyトランスポザーゼ、およびTcトランスポザーゼ、これらの変異体またはタグ付きバージョン、ならびにこれらの組み合わせからなる群より選択される。特に、上記トランスポザーゼは、MuAトランスポザーゼ、または野生型のTn5トランスポザーゼ、またはその変異体若しくはタグ付きバージョン、またはこれらの組み合わせである。
【0015】
別の局面において、上記転移可能DNAは、トランスポゾンを含み、ここで上記トランスポゾンは、野生型のTnトランスポゾン、Muトランスポゾン、Tyトランスポゾン、およびTcトランスポゾンのDNA、またはこれらの変異体バージョン、およびこれらの組み合わせからなる群より選択される。特に、上記トランスポゾンは、野生型または変異体のMuAトランスポゾンまたはTn5トランスポゾン、またはこれらの組み合わせである。
【0016】
別の局面において、上記転移可能DNAは、アダプター配列をさらに含む。
【0017】
別の局面において、上記バーコードテンプレートによって捕捉され得る上記転移可能DNAは、上記バーコードテンプレートに相補的な配列を有さず、上記バーコードテンプレートへの上記転移可能DNAの捕捉は、リンカーによって促進される。
【0018】
別の局面において、上記トランスポソソームは、少なくとも1つのタイプのトランスポザーゼ、少なくとも1つのタイプの転移可能DNAまたはこれらの組み合わせを含む。
【0019】
1つの局面において、バーコードタグ付けによって核酸フラグメント起源を追跡する方法が、本明細書で提供される。上記方法は、固定化されたクローン性のバーコードテンプレートまたは半クローン性のバーコードテンプレートを有する複数の固体支持体を提供する工程であって、ここで上記バーコードテンプレートは、少なくとも2種の異なるバーコード配列、多数派バーコード配列および少数派バーコード配列を含み;バーコード化した固体支持体上の上記多数派バーコード配列は、他のバーコード化した固体支持体の多数派バーコード配列とは実質的に異なり、少数派バーコード配列は、他のバーコード化した固体支持体の少数派バーコード配列と同じである、工程、ならびに核酸標的を、非特異的結合を介して上記固体支持体に捕捉する工程、ならびに複数のトランスポソソームを提供する工程であって、各トランスポソソームは、転移可能DNAおよびトランスポザーゼを含み、ここで上記トランスポソソームにおける少なくとも1つの転移可能DNAは、直接的にまたは間接的に、上記固体支持体上の上記バーコードテンプレートへと特異的に捕捉され得る工程を包含する。上記固体支持体上の非特異的に結合した核酸標的と、1つの反応容器中の上記トランスポソソームとを接触させて、上記固体支持体上のバーコード情報を、同時の鎖転移および捕捉反応によって上記核酸標的に結合させる。上記核酸標的は、鎖転移複合体を破壊することによって、フラグメントに分解され、ここで少なくとも1つのフラグメントは、上記固体支持体上のバーコードテンプレートに結合される。
【0020】
1つの局面において、バーコードタグ付けによって核酸フラグメント起源を追跡する方法が、本明細書で記載される。上記方法は、固定化されたクローン性のバーコードテンプレートまたは半クローン性のバーコードテンプレートを有する複数の固体支持体を提供する工程であって、ここで上記バーコードテンプレートは、少なくとも2種の異なるバーコード配列、多数派バーコード配列および少数派バーコード配列を含み;バーコード化した固体支持体上の上記多数派バーコード配列は、他のバーコード化した固体支持体の上記多数派バーコード配列とは実質的に異なり、少数派バーコード配列は、他のバーコード化した固体支持体の上記少数派バーコード配列と同じである、工程、ならびに複数のトランスポソソームを提供する工程であって、各トランスポソソームは、転移可能DNAおよびトランスポザーゼを含み、ここで上記トランスポソソームにおける少なくとも1つの転移可能DNAは、直接的にまたは間接的に、上記固体支持体上のバーコードテンプレートに特異的に捕捉され得る工程を包含する。核酸標的は、上記トランスポソソームに接触して、安定な鎖転移複合体を形成する。上記鎖転移複合体は、非特異的結合を介して上記固体支持体に捕捉される。上記固体支持体上のバーコード情報は、特異的捕捉反応によって上記核酸標的に結合される。上記核酸標的は、上記鎖転移複合体を破壊することによってフラグメントに分解され、ここで少なくとも1つのフラグメントは、上記固体支持体上のバーコードテンプレートに結合される。いくつかの実施形態において、上記固体支持体上の鎖転移複合体を用いて捕捉された上記核酸標的は、先ず、上記鎖転移複合体を破壊することによってフラグメントに分解される。上記核酸フラグメントは、非特異的結合によって上記固体支持体上に維持される。上記固体支持体上のバーコード情報は、次いで、特異的捕捉反応によって上記核酸フラグメントに結合され、ここで少なくとも1つのフラグメントは、上記固体支持体上のバーコードテンプレートに結合される。
【0021】
1つの局面において、バーコードタグ付けによって核酸フラグメント起源を追跡する方法が、本明細書で提供される。上記方法は、固定化されたクローン性のバーコードテンプレートまたは半クローン性のバーコードテンプレートを有する複数の固体支持体を提供する工程であって、ここで上記バーコードテンプレートは、少なくとも2種の異なるバーコード配列、多数派バーコード配列および少数派バーコード配列を含み;バーコード化した固体支持体上の上記多数派バーコード配列は、他のバーコード化した固体支持体の上記多数派バーコード配列とは実質的に異なり、少数派バーコード配列は、他のバーコード化した固体支持体の上記少数派バーコード配列と同じである、工程、ならびに複数のトランスポソソームを提供する工程であって、各トランスポソソームは、転移可能DNAおよびトランスポザーゼを含み、ここで上記トランスポソソームにおける少なくとも1つの転移可能DNAは、直接的にまたは間接的に、上記固体支持体上のバーコードテンプレートに特異的に捕捉され得る工程を包含する。核酸標的は、非特異的結合を介して上記固体支持体に捕捉される。上記トランスポソソームは、上記非特異的に結合された核酸標的に接触して、上記固体支持体上で安定な鎖転移複合体を形成する。上記固体支持体上のバーコード情報は、特異的捕捉反応によって上記核酸標的に結合される。上記核酸標的は、上記鎖転移複合体を破壊することによってフラグメントに分解され、ここで少なくとも1つのフラグメントは、上記固体支持体上のバーコードテンプレートに結合される。いくつかの実施形態において、上記固体支持体上の鎖転移複合体を用いて捕捉された上記核酸標的は、先ず、上記鎖転移複合体を破壊することによってフラグメントに分解される。上記核酸フラグメントは、非特異的結合によって上記固体支持体上に維持される。上記固体支持体上のバーコード情報は、次いで、ライゲーションによって上記核酸フラグメントに結合され、ここで少なくとも1つのフラグメントは、上記固体支持体上のバーコードテンプレートに結合される。
【0022】
1つの局面において、核酸標的の連結情報を決定するための方法が、本明細書で記載される。上記方法は、本発明で記載される方法のうちのいずれか1つに従って、核酸標的のバーコードタグ付きフラグメントを生成する工程、上記核酸フラグメントおよび上記バーコードの配列を決定する工程、ならびに同じ核酸標的に由来する少なくとも2つのフラグメントが同一のバーコード情報を受容する場合に、上記バーコード配列に基づいて上記核酸標的の連結情報を決定する工程を包含する。
【0023】
1つの局面において、核酸標的のバーコードタグ付きフラグメントの可溶性ライブラリーを生成するための方法が、本明細書で記載される。いくつかの実施形態において、上記可溶性ライブラリーは、全ゲノムの配列情報を含む。いくつかの実施形態において、上記可溶性ライブラリーは、標的化領域の配列情報を含む。いくつかの実施形態において、上記可溶性ライブラリーは、上記核酸標的のフェージング情報を決定するためのシーケンシングに使用される。いくつかの実施形態において、上記可溶性ライブラリーは、重複したリードの正体を決定するためのシーケンシングに使用される。
【図面の簡単な説明】
【0024】
【
図1】
図1は、核酸標的の分割なしに、オープンバルク反応においてバーコード化した固体支持体上に同時の鎖転移およびライゲーション反応でクローン性のバーコードタグ付き核酸フラグメントを生成する方法を図示する。
【0025】
【
図2】
図2は、異なる転移可能DNA設計、(A)一片での3’オーバーハングを有するトランスポゾン相補鎖、(B)別個の相補的リンカーオリゴを有するトランスポゾン相補鎖、(C)5’オーバーハングを有するトランスポゾン連結鎖、(D)非連結末端において平滑末端を有するトランスポゾンを示す。
【0026】
【
図3】
図3は、異なる遊離リンカー設計の例を示す。(A)1本鎖リンカー、(B)2本鎖リンカー、(C)部分的2本鎖リンカー。
【0027】
【
図4】
図4は、核酸標的の分割なしに、オープンバルク反応において同時に異なるトランスポソソームを使用して、バーコード化した固体支持体上に同時の鎖転移およびライゲーション反応でクローン性のバーコードタグ付き核酸フラグメントを生成する方法を図示する。
【0028】
【
図5】
図5は、エキソヌクレアーゼIを使用する、上記固体支持体上の1本鎖ポリヌクレオチドの除去を示す。
【0029】
【
図6】
図6は、核酸標的の分割なしに、オープンバルク反応において逐次的に異なるトランスポソソームを使用して、バーコード化した固体支持体上に同時の鎖転移およびライゲーション反応でクローン性のバーコードタグ付き核酸フラグメントを生成する方法を図示する。
【0030】
【
図7】
図7は、核酸標的の分割なしに、オープンバルク反応において逐次的に異なるトランスポソソームを使用して、バーコード化した固体支持体上に同時の鎖転移およびライゲーション反応でクローン性のバーコードタグ付き核酸フラグメントを生成する方法を図示する。そのワークフロー順序は、
図6に示されるものとは異なる。
【0031】
【
図8】
図8は、バーコード化した固体支持体上に同時の鎖転移およびライゲーション反応でクローン性のバーコードタグ付き核酸フラグメントを生成するための代替のワークフローを用いる方法を図示する。
【0032】
【
図9】
図9は、バーコード化した固体支持体上に同時の鎖転移およびライゲーション反応でクローン性のバーコードタグ付き核酸フラグメントを生成するための代替のワークフローを用いる方法を図示する。
【0033】
【
図10】
図10は、バーコード化した固体支持体上に非特異的結合およびライゲーションでクローン性のバーコードタグ付き核酸フラグメントを生成する方法を図示する。
【0034】
【
図11】
図11は、バーコード化した固体支持体上に非特異的結合およびライゲーションでクローン性のバーコードタグ付き核酸フラグメントを生成するための代替のワークフローを用いる方法を図示する。
【0035】
【
図12】
図12は、トランスポソソームを使用して、固定化したバーコードタグ付きフラグメント上にアダプターを導入する方法を示す。
【0036】
【
図13】
図13は、フラグメント化およびライゲーション反応で固定化バーコードタグ付きフラグメント上にアダプターを導入する方法を示す。
【0037】
【
図14】
図14は、プライマー伸長および/またはPCR増幅によって、固定化バーコードタグ付きフラグメントのコピーを放出する方法を示す。
【0038】
【
図15】
図15は、バーコードタグ付きフラグメントから生成したIlluminaのシーケンシングライブラリーの例である。
【0039】
【
図16】
図16は、TapeStation上で実行したバーコードタグ付きIlluminaシーケンシングライブラリーの電気泳動図(A)、および同じバーコードを有するリードの次のアラインメントまでのリード距離に基づくシーケンシングリードカウントヒストグラム(B)を図示する。
【0040】
【
図17】
図17は、TapeStation上で実行したバーコードタグ付きIlluminaシーケンシングライブラリーの別の電気泳動図(A)および同じバーコードを有するリードの次のアラインメントまでのリード距離に基づくシーケンシングリードカウントヒストグラム(B)を示す。
【0041】
【
図18】
図18は、核酸標的の分割なしに、オープンバルク反応においてバーコード化した固体支持体上に同時の鎖転移およびハイブリダイゼーション反応でクローン性のバーコードタグ付き核酸フラグメントを生成する方法を図示する。
【0042】
【
図19】
図19は、シーケンシングライブラリー構築のためのクローン性のバーコードタグ付きフラグメントを生成する3種の異なるトランスポザーゼベースの方法を示す。
【0043】
【
図20】
図20は、3種の異なるトランスポザーゼベースの方法を使用する3種の増幅したシーケンシングライブラリーの2% アガロースE-gel EX写真を示す。M1、方法1; M2、方法2; M3、方法3。100bp DNAラダーのフラグメントサイズは、上から下までそれぞれ、3000bp、2000bp、1500bp、1000bp、900bp、800bp、700bp、600bp、500bp、400bp、300bp、200bp、および100bpである。
【0044】
【
図21】
図21は、バーコード化したビーズの3種の異なる調製物から生成したシーケンシングデータからの、同じバーコードを有するリードの次のアラインメントまでのリード距離に基づくシーケンシングリードカウントヒストグラムを示す。
【発明を実施するための形態】
【0045】
全ての図面中のトランスポザーゼは、MuA転移システムに基づくトランスポソソーム中のテトラマーとして図示する。しかし、他のトランスポザーゼがまた使用され得る。
【0046】
詳細な説明
本明細書でおよび添付の特許請求の範囲の中で使用される場合、バーコードテンプレート、および固定化されたクローン性のバーコードテンプレートまたは半クローン性のバーコードテンプレートを有する固体支持体(すなわち、バーコード化した固体支持体)は、特許出願WO2017/151828(これは、その全体において本明細書に参考として援用される)に記載される。いくつかの実施形態において、全上記固体支持体は、結合されたバーコードテンプレートを有する。いくつかの実施形態において、固体支持体の一部のみが、結合されたバーコードテンプレートを有する。バーコードを有する固体支持体の上記一部は、1%~99%の範囲に及び得る。固体支持体が物理的に分離可能である場合(例えば、ビーズまたは微粒子)、バーコード化した固体支持体は、増幅された固体支持体を増幅されていない固体支持体から富化して、または富化せずに、クローン性増幅法によって調製され得る。上記バーコード配列は、異なるバーコードテンプレートの中で顕著な多様性を有する。少なくとも1000の特有のバーコード配列が反応に使用される。上記反応において使用される特有のバーコードが多いほど、検出または追跡のための同定能力がより高い。
【0047】
用語「アダプター」とは、本明細書で使用される場合、プライマー結合配列、バーコード、リンカー配列、リンカー配列に相補的な配列、捕捉配列、捕捉配列に相補的な配列、制限部位、アフィニティー部分、特有の分子識別子、およびこれらの組み合わせを含み得る核酸配列をいう。
【0048】
用語「トランスポザーゼ(transposase)」とは、本明細書で使用される場合、転移の能力がありかつ転移を媒介する機能的な核酸タンパク質複合体の構成要素であるタンパク質(Tn、Mu、Ty、およびTcトランスポザーゼが挙げられるが、これらに限定されない)をいう。用語「トランスポザーゼ」はまた、レトロトランスポゾンに由来するかまたはレトロウイルス起源のインテグラーゼをいう。それはまた、野生型タンパク質、変異タンパク質およびタグ(例えば、GSTタグ、His-タグなど)を有する融合タンパク質、ならびにこれらの組み合わせをいう。
【0049】
用語「トランスポゾン(transposon)」とは、本明細書で使用される場合、トランスポザーゼまたはインテグラーゼによって認識され、転移の能力がある機能的な核酸-タンパク質複合体の必須の構成要素である核酸セグメントをいう。トランスポザーゼと一緒になると、それらは、トランスポソソームを形成し、転移反応を行う。それは、野生型および変異体両方のトランスポゾンに言及する。
【0050】
「転移可能DNA(transposable DNA)」とは、本明細書で使用される場合、少なくとも1つのトランスポゾンユニットを含む核酸セグメントをいう。それはまた、アフィニティー部分、非天然のヌクレオチドおよび他の改変を含み得る。上記転移可能DNAにおけるトランスポゾン配列以外の配列は、アダプター配列を含み得る。
【0051】
用語「トランスポソソーム(transpososome)」とは、本明細書で使用される場合、トランスポゾンに非共有結合的に結合されるトランスポザーゼによって形成される、安定な核酸およびタンパク質の複合体をいう。それは、同じかまたは異なるモノマーユニットのマルチマーユニットを含み得る。
【0052】
「転移反応(transposition reaction)」とは、本明細書で使用される場合、トランスポゾンを標的核酸に挿入する反応をいう。転移反応における主な構成要素は、トランスポゾン、トランスポザーゼまたはインテグラーゼ、およびその標的核酸である。
【0053】
「鎖転移反応」とは、本明細書で使用される場合、核酸とトランスポソソームとの間の、安定な鎖転移複合体が形成される反応をいう。
【0054】
用語「鎖転移複合体(strand transfer reaction)(STC)」とは、本明細書で使用される場合、トランスポソソームおよびトランスポゾンが挿入されるその標的核酸の核酸-タンパク質複合体であって、ここでトランスポゾン連結鎖の3’末端がその標的核酸の二本の鎖に共有結合的に接続されるものをいう。それは、核酸およびタンパク質複合体の非常に安定な形態であり、インビトロで極度の熱および高塩に耐える(Burton and Baker, 2003)。
【0055】
「トランスポザーゼ結合領域(transposase binding region)」とは、本明細書で使用される場合、トランスポザーゼが転移を媒介するときに特異的に結合するトランスポゾン末端配列内に常に存在するヌクレオチド配列をいう。トランスポザーゼ結合領域は、トランスポザーゼサブユニットを結合するために1またはこれより多くの部位を含み得る。
【0056】
「トランスポゾン連結鎖(transposon joining strand)」とは、本明細書で使用される場合、トランスポザーゼによって、挿入部位において標的核酸に連結される2本鎖トランスポゾンDNAの鎖を意味する。
【0057】
「トランスポゾン相補鎖(transposon complementary strand)」とは、本明細書で使用される場合、2本鎖トランスポゾンDNAにおけるトランスポゾン連結鎖の相補鎖を意味する。
【0058】
「固体支持体」とは、本明細書で使用される場合、ビーズ、微粒子、ウェル、チューブ、スライド、プレート、フローセル、およびこれらの組み合わせからなる群より選択され、ここで上記固体支持体が物理的に分離可能である場合(例えば、ビーズまたは微粒子)、上記バーコードテンプレートは、表面全体にクローン性にまたは半クローン性に固定化され、そして上記固体支持体が連続する平らな表面である場合(例えば、ウェル、チューブ、スライド、プレートまたはフローセル)、上記バーコードテンプレートは、分離可能なクローン性クラスターまたは半クローン性クラスターとして表面に固定化される。
【0059】
「リガーゼ」とは、本明細書で使用される場合、野生型のDNAリガーゼまたはRNAリガーゼ、これらの変異体またはタグ付きバージョン、およびこれらの組み合わせからなる群より選択され;それは、ライゲーション反応のために使用される。
【0060】
「捕捉反応」とは、本明細書で使用される場合、ライゲーション、ハイブリダイゼーション、アフィニティー部分とのアフィニティー結合(例えば、ビオチンおよびストレプトアビジン、抗体および抗原)、クリックケミストリー、またはこれらのうちのいずれかの組み合わせなどを介する特異的捕捉を意味する。
【0061】
「反応容器(reaction vessel)」とは、本明細書で使用される場合、液体を保持するために連続する開いた空間を有する物質を意味する;それは、チューブ、ウェル、プレート、マルチウェルプレートのウェル、スライド、スライド上のスポット、液滴、管類、チャネル、ボトル、チャンバおよびフローセルからなる群より選択される。
【0062】
本発明における方法および材料は、インビトロでのMuA転移を使用することによって例証される(Haapaら, 1999およびSavilahtiら, 1995)。他の転移システムまたはこれらの異なる転移システムの組み合わせが使用され得る(例えば、Ty1(Devine and Boeke, 1994)、Tn7(Craig, 1996)、Tn10およびIS10(Klecknerら, 1996)、Marinerトランスポザーゼ(Lampeら, 1996)、Tc1(Vosら, 1996)、Tn5(Parkら, 1992)、Pエレメント(Kaufman and Rio, 1992)およびTn3(Ichikawa and Ohtsubo, 1990)、細菌挿入配列(Ohtsubo and Sekine, 1996)、レトロウイルス(Varmus and Brown, 1989)、ならびに酵母のレトロトランスポゾン(Boeke, 1989))。
【0063】
本発明は一般に、核酸シーケンシングのための方法および組成物に関する。特に、本明細書で提供される方法および組成物は、核酸ライブラリーの調製およびそこからのシーケンシングデータの生成に関する。
【0064】
1つの局面において、上記方法および組成物は、標的核酸のハプロタイプフェージングに関する。いくつかの実施形態において、上記核酸標的は、DNAである。いくつかの実施形態において、上記核酸標的は、ゲノムDNAである。いくつかの実施形態において、上記核酸標的は、増幅されたDNAである。いくつかの実施形態において、上記DNAは、改変されたDNAである。上記改変としては、非天然のヌクレオチド、アフィニティー部分、化学処理(例えば、バイサルファイト処理またはホルマリン固定パラフィン包埋)、およびタンパク質結合(例えば、ヒストン、転写因子)が挙げられる。いくつかの実施形態において、上記核酸標的は、合成されたDNAである。いくつかの実施形態において、上記核酸標的は、RNAである。いくつかの実施形態において、上記核酸標的は、mRNAである。いくつかの実施形態において、上記核酸標的は、相補的DNA(cDNA)である。いくつかの実施形態において、上記核酸標的は、第1鎖cDNAおよびRNAハイブリッドである。いくつかの実施形態において、上記核酸標的は、DNAおよびRNAハイブリッドである。いくつかの実施形態において、上記標的核酸は、単一細胞に由来する。いくつかの実施形態において、上記標的核酸は、無細胞DNAである。上記核酸標的の長さは、大きく変動し得る。それは、約50bp~1Mb、またはより大きな範囲に及び得る。上記核酸標的の長さが長くなるほど、フェージング適用の結果は、より良好である。反応における核酸標的の数は、1~数十億、またはさらにより多い可能性がある。いくつかの実施形態において、反応容器は、チューブ、ウェル、プレート、マルチウェルプレートにおけるウェル、スライド、スライド上のスポット、液滴、管類、チャネル、ボトル、チャンバまたはフローセルである。上記反応は、各核酸標的を複数の核酸標的全体内の別の核酸標的から分割することなく、バルク形式で起こる。分割のような例は、エマルジョン、ウェル、液滴、希釈などである。本発明は、ワークフローを劇的に単純化し、分割の必要性のなしに拡大縮小および自動化することを容易にする。
【0065】
バーコードテンプレートの同時の特異的捕捉に伴う核酸標的への鎖転移反応
本発明は、転移システムを伴う鎖転移反応ならびに特異的捕捉反応(例えば、リガーゼおよび/またはハイブリダイゼーションでの)の両方によって、クローン性にバーコード化した固体支持体に同時に核酸標的を捕捉する方法および組成物を提供する。上記捕捉された核酸標的は、鎖転移複合体を破壊することによってフラグメント化され得、これは、結合された標的特異的バーコードを有する上記核酸標的から小さなフラグメントを生成する(
図1)。
【0066】
1つの実施形態において、転移可能DNAは、1つのみのトランスポゾン配列を含み得る。上記転移可能DNA中のトランスポゾン配列は、従って、ヌクレオチドによって別のトランスポゾン配列に連結されていない。すなわち、上記転移可能DNAは、1つのみのトランスポザーゼ結合領域を含む(
図2)。さらに、上記転移可能DNAの連結鎖の5’末端は、ホスフェートを有し、これは、-OH基で1本鎖の末端から末端へのライゲーション、2本鎖の末端から末端へのライゲーションを通じて、またはリンカー分子を介して任意のDNA鎖の3’末端にライゲーションし得る。
図2は、ライゲーション可能な転移可能DNAのいくつかの例を示す。上記トランスポゾン連結鎖の5’末端は、上記転移可能DNA上のトランスポザーゼの存在があってもなくても、上記固体支持体上のポリヌクレオチドにライゲーションされ得る。いくつかの場合には、上記トランスポゾン相補鎖の3’末端および上記転移可能DNAの連結鎖の5’末端は、異なる長さにある。いくつかの場合には、上記トランスポゾン相補鎖の3’末端および上記転移可能DNAの連結鎖の5’末端は、同じ長さにある。いくつかの場合には、上記トランスポゾン相補鎖の3’末端は、例えば、ジデオキシヌクレオチド、C3-スペーサー、ホスフェート基、チオホスフェート基、アジド基またはアミノリンカーで改変されて、自己ライゲーションが遮断され得る。いくつかの場合には、上記トランスポゾン相補鎖の3’末端は、単一のヌクレオチドオーバーハングまたは単一のヌクレオチド凹部(recess)またはミスマッチヌクレオチドを有して、自己ライゲーションを遮断し得る。いくつかの場合には、上記2本鎖バーコードテンプレートおよび単一ヌクレオチドオーバーハング2本鎖トランスポゾンの両方にある単一ヌクレオチドオーバーハングは、相補的であり、ライゲーションを促進するために使用され得る。いくつかの場合には、2本鎖バーコードテンプレートおよび2本鎖トランスポゾンの両方にある1個より多くのヌクレオチドオーバーハングは、ライゲーションを促進するために使用され得る。いくつかの場合には、上記固体支持体上のバーコードテンプレートは、2本鎖である。いくつかの場合には、上記固体支持体上のバーコードテンプレートは、1本鎖である。いくつかの場合には、上記固体支持体上のバーコードテンプレートは、部分的に1本鎖でありかつ部分的に2本鎖である。いくつかの場合には、上記トランスポゾン配列におけるある配列バリエーションが、さらなるサンプル識別子として使用される。いくつかの場合には、転移可能DNAは、アダプターを含む。いくつかの場合には、上記アダプターにおける配列バリエーションは、さらなるサンプル識別子として使用される。異なるトランスポゾンおよび/または転移可能DNA配列と反応したサンプルは、必要とされる場合に下流のプロセスを単純化するために、反応後に一緒にプールされ得る。
【0067】
1つの実施形態において、上記固体支持体上のバーコードテンプレートと、捕捉されることになる転移可能DNAとの間に相補的捕捉配列は存在しない。リンカーベースの捕捉方法は、捕捉反応を促進するために使用され得る。
図3は、リンカーベースのライゲーションおよび/または捕捉のいくつかの例を示す。1つの実施形態において、上記リンカー分子は、1本鎖である。1つの実施形態において、上記リンカー分子は2本鎖である。1つの実施形態において、上記リンカー分子は、部分的に2本鎖である。いくつかの場合には、上記リンカーオリゴヌクレオチドは、転移可能DNAと予め結合され得る。いくつかの場合には、上記リンカーオリゴヌクレオチドは、固体支持体上の固定化されたポリヌクレオチドと予め結合され得る。いくつかの場合には、上記リンカーオリゴヌクレオチドは、捕捉反応が起こって、上記転移可能DNAの連結鎖の5’末端を、固体支持体上の固定化されたポリヌクレオチドの3’末端へと繋ぐ場合にのみ、添加され得る。遊離リンカー法は、予備結合リンカー法より少ないPCR副生成物を生じる傾向にある。リンカー分子の長さは、変動し得る(例えば、5b(p)、10b(p)、20b(p)、30b(p)、40b(p)、50b(p)、100b(p)、200b(p)またはより大きい)。
【0068】
核酸標的をクローン性にフラグメント化し、バーコード化するための方法は、以下のように記載される(
図1)。1つの反応容器の中で、2本鎖核酸標的、アセンブリしたトランスポソソーム、リガーゼおよびクローン性にまたは半クローン性にバーコード化した固体支持体を、エマルジョンまたは希釈によって区画化することなく一緒に混合する。上記トランスポソソームにおける転移可能DNAは、上記固体支持体上のバーコードテンプレートにライゲーションし得る。上記トランスポソソームと上記核酸標的との間の鎖転移反応、および転移可能DNAとバーコードテンプレートとの間のライゲーション反応は、同じ溶液中で同時に起こる。鎖転移反応の間に形成される安定なSTCは、上記核酸標的を一体に維持する。上記バーコード配列は、STCにおけるライゲーション可能な転移可能DNAを通じて、クローン性にSTCとともに核酸標的に結合される。その反応の後に、上記核酸標的は、STCをSDS溶液で破壊することによって、小さなフラグメントに分解される。多くの小さなフラグメントは、上記バーコード配列を含み、同じ核酸標的に由来するフラグメントは、同じバーコードを有する。同時の鎖転移反応およびバーコードライゲーション反応は、このクローン性のバーコードタグ付け法の高効率にとって重要である。本発明で生成されたバーコードタグ付きフラグメントの収量は、核酸標的が、先ず、溶液中のトランスポソソームとともにSTCを形成し、次いで、上記STCにおける転移可能DNAが、固体支持体上のバーコードテンプレートにライゲーションする特許出願WO2017/151828における方法のものより遙かに高い。本発明の反応効率はまた、トランスポソソームが、先ず、バーコード化したビーズ上に固定化され、これが次いで、鎖転移反応のみによって溶液中の遊離核酸標的を捕捉する、米国特許第9,328,382B2号および単一チューブの文献(Zhangら, 2017)における方法より遙かに良好である。本発明において、ライゲーション反応および鎖転移反応の両方は、核酸標的を捕捉するために使用される。捕捉のためにライゲーションのみを使用する方法に由来する低収量に関する説明は、STCの多い核酸標的が、ライゲーション効率を制限する立体障害を作り出し得ることである。捕捉のために鎖転移のみを使用する方法に由来する低収量に関する説明は、転移可能DNAが、空間的配置および位置が固定されて上記ビーズ表面に固定化されることであり、これは、トランスポソソーム形成および/または遊離核酸標的との鎖転移反応の効率を制限し得る。鎖転移およびライゲーションの同時の反応を十分に利用するために、緩衝液組成、pHおよび温度を含む反応条件が最適化される。
【0069】
複数の核酸標的は、1つの反応容器の中で使用され得る。その反応は、各核酸標的を複数の核酸標的全体内の別の核酸標的から分割することなく、バルク形式で起こる。本発明は、そのワークフローを劇的に単純化し、分割の必要性なしに、拡大縮小および自動化することを容易にする。上記複数の核酸標的は、反応後に固体支持体上に均質に捕捉されるために、溶液中に均一に溶解される。いくつかの実施形態において、反応溶液中での拡散速度の制限は、上記固体支持体上の均質捕捉を容易にするために使用される。上記固体支持体は、単離されてクローン性にまたは半クローン性に固定化されたバーコードテンプレートクラスターを有する、ウェル、チューブ、スライド、プレートもしくはフローセルにおけるような連続した表面であり得る。それはまた、個々のビーズまたは微粒子として物理的に分離され得る。上記ビーズおよび微粒子は、50nm~100μm、好ましくは1μm~15μmの範囲に及ぶサイズを有し得る。各ビーズまたは微粒子は、特有の配列を有する複数のバーコードテンプレートを有する。本開示の主な利点は、標的特異的バーコードタグ付けが、ウェル、マイクロウェル、スポット、ナノチャネル、液滴、エマルジョン液滴、カプセル、または希釈などで核酸標的の分割なしに、オープンバルク反応において起こり得ることである。よりよい結果のために、上記ビーズまたは微粒子のサイズは、50nm~100μm(直径)、好ましくは1μm~15μmの間で制御されるべきであるが、それは、50nmより小さいかまたは100μmより大きい可能性もある。均一な反応のために、ビーズまたは微粒子は、ポリエチレングリコール、プルロニック(登録商標)、セルロース、アガロース、またはそれらの誘導体、または他のポリマー、またはこれらの組み合わせを使用して上記溶液の粘度を制御する(最終の粘度は、20℃で1~100 mPa・s、最も好ましくは20℃で1.5~30mPa・sの範囲に及ぶ)ことによって、反応の間に懸濁されて維持されるべきである。固体表面(例えば、フローセル表面)上のバーコードクラスターに関して、上記クラスターサイズは、50nm~200μm(直径)、好ましくは100nm~10μmの間で制御されるべきである。上記クラスター分離距離が大きいほど、1つの標的核酸分子が2またはこれより多くのバーコードによってタグ付けされる機会は小さくなる。
【0070】
STC構造(Suretteら 1987, Mizuuchiら 1992, Savilahtiら 1995, Burton and Baker 2003, Auら 2004, Aminiら 2014)および固体支持体上のクローン性のバーコードテンプレートの非常に安定な性質から、本発明から生成されるバーコードタグ付きフラグメントは、上記バーコード配列においてそれらの起源核酸標的の識別を維持する。同じ核酸標的に由来するフラグメントは、同じバーコード配列を共有する。このタイプのバーコードタグ付きフラグメントは、ハプロタイプフェージング、デノボアセンブリおよび他の適用に関して使用されることが周知である(Zhengら, 2016, Zhangら, 2017)。
【0071】
1つの局面において、核酸標的は、先ず非特異的に、バーコード化した固体支持体に結合され得る。それは次いで、同時の鎖転移反応およびライゲーション反応を介して共有結合的に、上記バーコード情報を上記核酸標的に結合するために、トランスポソソームおよびリガーゼと混合される。
【0072】
いくつかの実施形態において、トランスポソソームは、反応の前に予めアセンブリされない。トランスポザーゼおよび転移可能DNAは、核酸標的、リガーゼおよび固体支持体との反応において直接使用される。いくつかの実施形態において、上記転移可能DNAは、1本鎖ライゲーションまたは2本鎖ライゲーションを介して、上記固体支持体上のバーコードテンプレートに直接ライゲーションされ得る(
図2)。いくつかの実施形態において、リンカーユニットは、ライゲーションを容易にするために、同時の鎖転移およびライゲーション反応において添加され得る(
図3)。いくつかの実施形態において、全トランスポソソームは、同じ転移可能DNA配列を含む。いくつかの実施形態において、上記トランスポソソームは、異なる転移可能DNA配列を含む(
図4)。いくつかの実施形態において、上記トランスポソソームにおける1つの転移可能DNAのみが、バーコードテンプレートにライゲーションされ得る(
図4)。いくつかの実施形態において、上記トランスポソソームにおける全転移可能DNAは、バーコードテンプレートにライゲーションされ得る。ある実施形態において、同じトランスポソソームにおける転移可能DNAの全モノマーユニット配列は、同じである。ある実施形態において、同じトランスポソソームにおける転移可能DNAのモノマーユニット配列は、異なる。ある実施形態において、異なるトランスポザーゼは、上記反応において使用される。鎖転移複合体を破壊するために、異なる方法が使用され得る(例えば、プロテアーゼ処理、高温処理、またはタンパク質変性剤(例えば、SDS溶液、グアニジン塩酸塩、尿素など)、またはこれらの組み合わせ)。いくつかの実施形態において、1本鎖エキソヌクレアーゼは、バーコードタグ付け後に、上記固体支持体上の不要な1本鎖ポリヌクレオチドを除去するために使用され得る(
図5)。
【0073】
1つの局面において、トランスポソソームは、上記反応において逐次的に使用され得る。いくつかの実施形態において、これらのトランスポソソームは、同じである。他の実施形態において、これらのトランスポソソームは、異なる。いくつかの実施形態(
図6)において、第1のトランスポソソームは、核酸標的、リガーゼおよびバーコード化した固体支持体と混合して、固定化された核酸STC複合体Iを上記固体支持体上に生成する。次いで、第2のトランスポソソームは、上記固定化されたSTC Iを攻撃するために添加され、STC IIを形成する。いくつかの実施形態において、上記第2のトランスポソソームは、異なるタイプのトランスポゾンおよびトランスポザーゼを有し得る。いくつかの実施形態において、上記第2のトランスポソソームにおける転移可能DNAは、第1のトランスポソソームにおける同じタイプのトランスポゾンの異なるトランスポゾン配列を有し得る。いくつかの実施形態において、上記第2のトランスポソソームは、上記第1のトランスポソソームと同じトランスポゾン配列を有することを除いて、異なる転移可能DNA配列を有し得る。いくつかの実施形態において、捕捉反応(例えば、ライゲーションおよび/またはハイブリダイゼーション)は、繰り返しになるが、上記第2の鎖転移反応と同時に起こる。ある実施形態において、反応緩衝液は、トランスポソソームでの第1および第2の同時の鎖転移反応、ならびにハイブリダイゼーションおよび/またはライゲーションでの捕捉反応の両方のために使用されるように最適化される。異なる工程間でいかなる反応緩衝液を交換する必要性もないことは、そのワークフローを顕著に単純化し得る。標的特異的バーコードは、STCを破壊した後にフラグメントへと結合され得る。いくつかの実施形態において、上記第2のトランスポソソームは、第1のSTCを破壊した後にのみ添加され得る(
図7)。この方法は、より良好な鎖転移効率を有する。なぜなら上記第1のSTCに由来する立体障害効果が、上記第2の鎖転移反応の前に除去されるからである。いくつかの実施形態において、上記第2の鎖転移反応は、より短いフラグメントサイズを生成するために使用される。いくつかの実施形態において、上記第2のトランスポソソームは、上記第1のトランスポソソームとは異なるアダプターまたはプライマー配列を導入して、下流の増幅およびシーケンシングを促進するために使用される。
【0074】
1つの局面において、核酸標的は、第1のトランスポソソームと反応して、安定なSTC Iを形成する。次いで、STC Iを有する上記核酸は、第2のトランスポソソーム、リガーゼおよびクローン性のバーコード化した固体支持体と反応して、標的特異的バーコードタグ付きフラグメントを生成する(
図8)。
【0075】
1つの局面において、トランスポソソームは、先ず、バーコード化した固体支持体に結合され得る。標的特異的バーコードタグ付きフラグメントを生成するために、核酸標的、溶液中のトランスポソソーム(in-solution transpososome)、リガーゼおよび上記トランスポソソームが結合し、バーコード化した固体支持体は、次いで、
図9にあるように、1つの反応容器の中で一緒に混合される。いくつかの実施形態において、上記溶液中のトランスポソソームは、上記固体支持体上に予め結合したトランスポソソームと同じである。いくつかの実施形態において、上記溶液中のトランスポソソームは、上記固体支持体上に予め結合したトランスポソソームとは異なる。
【0076】
1つの局面において、転移可能DNAは、先ず、バーコード固体支持体に結合され得る。標的特異的バーコードタグ付きフラグメントを生成するために、核酸標的、溶液中のトランスポソソーム、リガーゼおよび上記転移可能DNAが結合し、バーコード化した固体支持体は、次いで、1つの反応容器の中で一緒に混合される。いくつかの実施形態において、上記溶液中のトランスポソソームは、上記固体支持体上に予め結合した転移可能DNAと同じトランスポゾンを有する。いくつかの実施形態において、上記溶液中のトランスポソソームは、上記固体支持体上に予め結合した転移可能DNAとは異なるトランスポゾンを有する。いくつかの実施形態において、上記溶液中のトランスポソソームは、個々の転移可能DNAおよびトランスポザーゼと置き換えられる。
【0077】
1つの局面において、
図1、
図4、
図6、
図7、
図8および
図9に記載される同時の鎖転移反応およびライゲーション反応の中のライゲーション反応は、
図18におけるようなハイブリダイゼーション反応で置き換えられ得る。リガーゼは、ハイブリダイズした転移可能DNAを、上記固体支持体上のバーコード化したテンプレート上に共有結合的にライゲーションするために、ワークフローにおいて後に、STC破壊の前またはSTC破壊の後のいずれかで添加され得る。
【0078】
1つの局面において、
図18に記載される同時の鎖転移反応およびハイブリダイゼーション反応の中のハイブリダイゼーション反応は、他の捕捉反応(例えば、アフィニティータグ(例えば、ビオチンおよびストレプトアビジン)、抗原に対する抗体、クリックケミストリー、またはこれらの組み合わせ)で置き換えられ得る。
【0079】
バーコードタグ付けのための固体支持体上の非特異的結合による核酸標的をクローン性に捕捉する
本発明は、クローン性にバーコード化した固体支持体上の非特異的結合によって核酸標的を捕捉する方法および組成物を提供する。上記捕捉した核酸標的は、上記固体支持体上のバーコードテンプレートに共有結合され得、結合された標的特異的バーコードを有する核酸標的から小さなフラグメントを生成する。
【0080】
1つの局面において、核酸標的は、トランスポソソームと反応し、鎖転移複合体を形成する。上記STCを有する核酸標的は、表面にクローン性にまたは半クローン性にバーコードテンプレートが固定化された固体支持体に非特異的に結合する(
図10)。いくつかの実施形態において、核酸標的は、先ず、バーコード化した固体支持体に非特異的に結合し得る。上記結合した核酸は、次いで、溶液中でトランスポソソームと反応して、上記固体支持体上にSTCを形成する。1つの局面において、上記STCは、SDS処理によって破壊され、上記核酸標的は、小さなフラグメント(これは、その条件下で非特異的結合によって上記固体支持体になお結合される)に分解する(
図10)。リガーゼは、小さなフラグメントを、上記固体支持体上のバーコードテンプレートに共有結合し、標的特異的バーコード配列で結合された小さなフラグメントを生成するために添加される(
図10)。別の局面において、上記固体支持体に非特異的に結合したSTCを有する上記核酸標的は、先ず、上記STCにおけるライゲーション可能な転移可能DNAを介して、上記固体支持体上のバーコードテンプレートにライゲーションする。次いで、上記STCは、SDS処理によって破壊され、標的特異的バーコード配列で結合された小さなフラグメントを生成する(
図11)。
【0081】
1つの局面において、核酸標的は、先ず、バーコード化した固体支持体に非特異的に結合し得る。その結合した核酸は、次いで、溶液中でトランスポソソームおよびリガーゼと反応して、STCを形成し、上記転移可能DNAを、上記固体支持体上で同時に、上記バーコードテンプレートにライゲーションする。
【0082】
多くの条件が、核酸を作製し得、核酸とタンパク質の複合体は、固体支持体に非特異的に結合し得る。最も顕著なことには、ポリエチレングリコールと塩(Lis and Scheif, 1975)、ポリアミンおよびコバルトヘキサミン(cobalthexamine)(Peltaら, 1996)、ならびにアルコール(Crouse and Amorese, 1987)が、核酸を沈殿および/または濃縮するために広く使用されている。
【0083】
1つの局面において、本明細書に記載されるライゲーション反応は、他の捕捉反応(例えば、ハイブリダイゼーション、アフィニティータグ(例えば、ビオチンおよびストレプトアビジン)、抗原に対する抗体、クリックケミストリー、またはこれらの組み合わせ)で置き換えられ得る。
【0084】
クローン性または半クローン性のバーコード化した固体支持体の追跡
クローン性のバーコード化した固体支持体は、その表面上に同一のバーコード配列を有する複数のバーコードテンプレートを含む。半クローン性のバーコード化した固体支持体は、1より多くの同一のバーコード配列を有する複数のバーコードテンプレートを含む。大部分の場合において、異なるクローン性または半クローン性のバーコード化した固体支持体の中のバーコード配列は、異なる。クローン性または半クローン性のバーコード化した固体支持体の異なるバッチを追跡するために、同一のバーコードを有する複数のバーコードテンプレートは、調製の間にクローン性または半クローン性のバーコード化した固体支持体に結合され、その結果、調製物の同じバッチの中のこれら全てのクローン性または半クローン性のバーコード化した固体支持体は、それらの中で同じ配列を有するさらなるバーコードを含む。このさらなる共有のバーコードテンプレートは、各クローン性または半クローン性のバーコード化した表面およびクラスター上の50%までのバーコード集団を含み得、これを、核酸フラグメント起源を追跡するために使用される上記固体支持体上のバーコードテンプレート(これはここで多数派バーコードグループと定義される)から区別するために、少数派バーコードグループとして定義される。好ましくはこの共有の少数派バーコードテンプレートは、クローン性または半クローン性のバーコード化した表面/クラスターあたり10%未満のバーコード集団を含む。上記バーコード固体支持体上の少数派バーコードの量は、核酸フラグメント起源を追跡するおよび関連する適用のために使用される多数派バーコードの能力に影響を及ぼさない。さらに、上記少数派バーコード配列は、必要とされる場合、予め定義され、情報的に除去され得る。ある実施形態において、異なるバーコード配列を有する1より多くの少数派バーコードテンプレートが使用され得る。上記クローン性または半クローン性のバーコード固体支持体上のこの少数派バーコードは、バーコード固体支持体の識別子として役立ち得る。ある実施形態において、それは、生成をモニターし、上記バーコード化した固体支持体の使用を追跡するために使用され得る;いくつかの実施形態において、それは、任意の潜在的な交差サンプル汚染およびシーケンシングシステム汚染(例えば、Illuminaシーケンシングシステムで同定されるインデックスホッピング(index hopping))を検出するために使用され得る。この種のビーズ(すなわち、表面上に異なるバーコードテンプレートを有するビーズ)はまた、区画化された反応器(例えば、アリコートまたは液滴)の中で核酸バーコード化反応のために使用され得る。
【0085】
シーケンシングライブラリーを生成するためのクローン性にバーコードタグ付けした核酸フラグメントの放出
上記バーコードタグ付きフラグメントは、上記固体支持体上に固定化される。それらは、シーケンシングライブラリーを作製するために使用され得る。いくつかの実施形態において、それは、他の適用(例えば、メチル化研究のためのバイサルファイトでの処理)のためにさらに操作され得る。いくつかの実施形態において、さらなるシーケンシングアダプターは、トランスポザーゼベースのタグ付け方法を使用して、上記バーコードタグ付きフラグメントに結合され得る(
図12)。いくつかの実施形態において、バーコードタグ付きフラグメントは、物理的剪断法および/または酵素によるフラグメント化方法でさらにフラグメント化され得、次いで、さらなるシーケンシングアダプターがライゲーションされ得る(
図13)。固定化されたバーコードタグ付きフラグメントは、多くの方法で上記固体支持体から放出され得る。1つの実施形態において、切断可能な連結または希な制限部位が、上記固体支持体に結合されるオリゴヌクレオチド配列の中に含められ得る。切断反応または制限酵素消化を用いると、上記バーコードタグ付きフラグメントは、上記固体支持体から放出され得る。いくつかの場合には、プライマー伸長は、上記バーコードタグ付きフラグメントのコピーを作製するために行われ得る(
図14A)。いくつかの実施形態において、上記プライマーは、ランダムプライマーである。いくつかの実施形態において、上記プライマーは、標的特異的プライマーである(
図14A、14C)。上記特異的プライマーの標的は、エキソン、イントロン、遺伝子、エキソームなどであり得る。標的化されたシーケンシングのより詳細な適用は、特許出願WO 2017/151828に記載される。シーケンシングプラットフォームに対して特異的なプライマー(例えば、IlluminaのSBSライブラリーのためのP5およびP7プライマー(
図15)、またはTorrentのライブラリーのためのP1およびAプライマー)でのさらなるPCR増幅は、特異的なシーケンシングプラットフォームのためのシーケンシングの準備ができたライブラリーを生成し得る。ライブラリーが、上記バーコードタグ付きフラグメントを上記固体支持体から放出することによって作製される場合、サンプル特異的インデックスを有するプライマーが使用され得る。いくつかの場合には、上記バーコードテンプレートにおける配列は、サンプル特異的インデックスとして使用され得る。サンプル特異的インデックスを有する上記放出されたバーコードタグ付きフラグメントは、それら自体のサンプル特異的インデックスを有する他のサンプルに由来するタグ付きフラグメントと、サンプル調製スループットを増大させ、プロセスを単純化するために、さらに下流のワークフローのために一緒に混合され得る。構築したライブラリーをシーケンシングして、バーコードおよび核酸フラグメントの両方の配列を決定し得、同じ核酸標的に由来する少なくとも2つのフラグメントが同一のバーコード情報を受容した場合には、上記バーコード配列に基づいて上記核酸標的の連結情報を決定し得る。上記連結情報は、ハプロタイプフェージング、構造バリエーション検出、CNV検出などのために使用され得る。上記バーコード情報はまた、重複したリードの供給源を、増幅からまたはシーケンシングから区別するために使用され得る。いくつかの実施形態において、上記核酸標的は、2本鎖DNAである。いくつかの実施形態において、上記核酸標的は、DNAおよびRNAハイブリッドである。
【0086】
バーコードシーケンシングリードを長いリードにアセンブリする
本発明は、他の方法のような精巧な区画化スキームも分割スキームもなしに、オープンバルク反応において核酸サンプルをクローン性にバーコードタグ付けする方法および組成物を提供する。上記バーコードタグ付きフラグメントは、全ゲノムサンプル、またはゲノムの一部、または標的化領域、またはメタゲノムサンプルに由来し得る。これらのバーコードタグ付きフラグメントから生成したシーケンシングリードは、これらのフラグメントの本来の標的を同定するために使用され得るバーコード情報を含む。同じバーコードを有するこれらの短いシーケンシングリードは、一緒にグループ化され得、本来の核酸標的に沿ってクラスター化し得る。どのトランスポザーゼシステムが使用されるかに依存して、同じバーコードを有するこれらのリードの中で、同じ核酸標的に由来するリードに由来する2つの本来隣接するリードの開始末端は、逆相補的配列のいくつかの塩基(MuAトランスポザーゼシステムに関しては5塩基およびTn5トランスポザーゼシステムに関しては9塩基)を共有する。これらの重複する配列はさらに、バーコードリードを一緒に連結し得る。原則として、それは、全てのタグ付きフラグメントが、バーコード化した固体支持体によって捕捉されかつシーケンシングされる場合、本来の核酸標的を完全に再構築し得る。それらは、ハプロタイプフェージングのために使用されるべき有用な長い範囲の連結情報を提供する。本来の核酸標的が長いほど、連結情報はより長くなり、フェージング適用のためにより有用であり得る。分析パイプラインは、デノボシーケンシングおよび再シーケンシングの両方のために、これらのバーコードリードを使用して、全ゲノムアセンブリまたは構造バリエーション分析のために開発され得る。1つの場合には、全てのシーケンシングリードは、多くの初期コンティグを先ず確立するために、標準的なショットガンアセンブリ分析のために使用され得る。次いで、上記バーコード情報は、上記初期コンティグを遙かにより長いコンティグへとフェージングするために使用され得る。これらのバーコードタグ付け法はまた、標的化された遺伝子、遺伝子、またはエキソームをフェージングするために使用され得る。これらのバーコードタグ付け法はまた、標的化シーケンシング適用において重複したリードを区別するためのツールとして使用され得る。この方法は、不均質なサンプル(例えば、がん生検サンプルまたは循環腫瘍細胞/DNAにおける体細胞変異検出)に対するシーケンシングアッセイ検出限界を改善する。
【0087】
本開示は以下の実施形態を含む。
実施形態1
バーコード化することによって核酸フラグメントの起源を追跡するための方法であって、前記方法は、
a.複数の2本鎖核酸フラグメントおよび複数のビーズを含む反応混合物を提供する工程であって、ここで各ビーズは、バーコードテンプレートの少なくとも2種の異なる集団に由来する少なくとも2種の異なる固定化されたバーコードテンプレートを含み、ここでバーコードテンプレートの各集団は、同じバーコードテンプレートの複数のコピーを含み、ここで各バーコードテンプレートは、バーコード配列を含み、ここで前記バーコード配列は、前記バーコードテンプレートの識別子であるように構成される、工程
b.前記核酸フラグメントから少なくとも2種のバーコードが結合された部分フラグメントを生成する工程であって、ここで同じ核酸フラグメントに由来する前記少なくとも2種のバーコードが結合された部分フラグメントは、同じビーズに由来する同じ配列を有する前記バーコード配列に各々結合される、工程;および
c.前記バーコードが結合された部分フラグメントの起源を、それらの前記バーコード配列によって追跡/同定する工程であってここで前記同じ配列を有するバーコードが結合された部分フラグメントは、前記同じ核酸フラグメントを突き止める、工程、を包含する、
方法。
実施形態2
前記反応混合物は、アリコートにも液滴にも区画化されない、実施形態1に記載の方法。
実施形態3
前記反応混合物中の前記ビーズは、合計で少なくとも約1000種の異なるバーコード配列を含む、実施形態1に記載の方法。
実施形態4
各ビーズ上の前記バーコードテンプレート集団のうちの少なくとも1つはまた、前記複数のビーズの中で共通の共有バーコードテンプレート集団として少なくとも別のビーズ上に存在する、実施形態1に記載の方法。
実施形態5
前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうちの約50%未満である、実施形態4に記載の方法。
実施形態6
前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうちの約10%未満である、実施形態4に記載の方法。
実施形態7
前記2本鎖核酸は、2本鎖DNA、またはDNA/RNAハイブリッド、またはこれらの組み合わせを含む、実施形態1に記載の方法。
実施形態8
前記2本鎖核酸は、約1000bpより大きい、実施形態7に記載の方法。
実施形態9
前記2本鎖核酸フラグメントは、天然の、改変された、増幅された、または他の化学的に処理された形態またはこれらの組み合わせにおいてDNAまたはRNAを含む核酸分子を含む、実施形態1に記載の方法。
実施形態10
前記2本鎖核酸フラグメントは、先ず、実施形態1に記載の任意の反応の前に前記ビーズに非特異的に結合される、実施形態1に記載の方法。
実施形態11
前記2本鎖核酸フラグメントは、トランスポソソームにより鎖転移され、前記ビーズとの相互作用の前に、鎖転移複合体を形成する、実施形態1に記載の方法。
実施形態12
前記バーコードが結合された部分フラグメントを生成する工程は、ライゲーション、ハイブリダイゼーション、鎖転移反応、タグメンテーション、増幅、プライマー伸長、またはこれらの組み合わせの工程を含む、実施形態1に記載の方法。
実施形態13
前記鎖転移反応または前記タグメンテーション反応は、トランスポザーゼを利用する工程を包含し、ここで前記トランスポザーゼは、野生型のTnトランスポザーゼ、Muトランスポザーゼ、Tyトランスポザーゼ、およびTcトランスポザーゼ、これらの変異体またはタグ付きバージョン、ならびにこれらの組み合わせからなる群より選択される、実施形態11または12に記載の方法。
実施形態14
前記バーコードが結合された部分フラグメントの起源を追跡/同定する工程は、前記核酸フラグメントのハプロタイプフェージング情報および/または構造バリエーションを決定するためのシーケンシングを含む、実施形態1に記載の方法。
実施形態15
前記バーコードが結合された部分フラグメントの起源を追跡/同定する工程は、重複した核酸フラグメントの正体またはコピー数バリエーション情報を決定するためのシーケンシングを含む、実施形態1に記載の方法。
実施形態16
バーコード化することによって核酸フラグメントの起源を追跡するためのシステムであって、前記システムは、
複数の2本鎖核酸フラグメントおよび複数のビーズを含む反応混合物、を含み、
ここで各ビーズは、バーコードテンプレートの少なくとも2種の異なる集団に由来する少なくとも2種の異なる固定化されたバーコードテンプレートを含み、ここでバーコードテンプレートの各集団は、同じバーコードテンプレートの複数のコピーを含み、
ここで各バーコードテンプレートは、バーコード配列を含み、ここで前記バーコード配列は、前記バーコードテンプレートの識別子であるように構成され、
ここで少なくとも2種のバーコードが結合された部分フラグメントは、前記核酸フラグメントから生成され、ここで同じ核酸フラグメントに由来する前記少なくとも2種のバーコードが結合された部分フラグメントは、同じビーズに由来する同じ配列を有する前記バーコード配列に各々結合され;
ここで前記バーコードが結合された部分フラグメントの起源は、それらの前記バーコード配列によって追跡/同定されるように構成され、そして
ここで前記同じ配列を有するバーコードが結合された部分フラグメントは、前記同じ核酸フラグメントを突き止める、
システム。
実施形態17
前記反応混合物は、アリコートにも液滴にも区画化されず;
そして前記反応混合物中の前記ビーズは、合計で少なくとも約1000種の異なるバーコード配列を含む、実施形態16に記載のシステム。
実施形態18
各ビーズ上の前記バーコードテンプレート集団のうちの少なくとも1つはまた、前記複数のビーズの中で共通の共有バーコードテンプレート集団として少なくとも別のビーズ上に存在する、実施形態16に記載のシステム。
実施形態19
前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうちの約50%未満である、実施形態18に記載のシステム。
実施形態20
前記共通の共有バーコードテンプレートの量は、前記ビーズ上の全バーコードテンプレートのうちの約10%未満である、実施形態19に記載のシステム。
実施形態21
前記2本鎖核酸は、2本鎖DNA、またはDNA/RNAハイブリッド、またはこれらの組み合わせを含む、実施形態16に記載のシステム。
本発明は、実施形態に関して説明されてきたが、多くの他の可能な改変およびバリエーションが、本明細書で記載されるとおりの発明の趣旨および範囲から逸脱することなく行われ得ることは、理解されるべきである。
【0088】
さらに、概して、本明細書で記載されるプロセス、システム、方法などに関して、このようなプロセスなどの工程が、ある特定の規定された順序に従って起こると記載されているが、このようなプロセスが、その記載される工程が本明細書で記載される順序以外の順序で行われて実施され得ることは、理解されるべきである。ある特定の工程が同時に行われ得ること、他の工程が追加され得ること、または本明細書で記載されるある特定の工程が省略され得ることは、さらに理解されるべきである。言い換えると、本明細書中のプロセスの説明は、ある特定の実施形態を例証する目的で提供され、特許請求される発明を限定するようには決して解釈されるべきでない。
【0089】
さらに、上記の説明が、例示であって限定ではないことが意図されることは理解されるべきである。提供される例以外の多くの実施形態および適用は、上記の説明を読めば当業者に明らかである。本発明の範囲は、上記の説明を参照して決定されるべきではなく、代わりに添付の特許請求の範囲を参照して、このような特許請求の範囲によって権利化される均等物の範囲全体とともに決定されるべきである。将来的な進展が本明細書で考察される分野において起こり、開示されるシステムおよび方法が、このような将来の実施形態に組み込まれることは、認識および意図される。まとめると、本発明は、改変およびバリエーションの可能性があり、かつ以下の特許請求の範囲によってのみ限定されることが理解されるべきである。
【0090】
最後に、本出願において使用される全ての定義される用語は、本明細書で提供される定義と一致するそれらの最も広い合理的解釈を与えられることが意図される。特許請求の範囲において使用される全ての定義されていない用語は、本明細書で反対に明示的な指示がなされなければ、当業者によって理解されるとおりのそれらの通常の意味と一致した最も広い合理的解釈を与えられることが意図される。特に、「1つの(a)、「上記、その、この(the)」、「前記、上記(said)」などのような単数形の冠詞の使用は、請求項が反対に明示的な限定を記載しなければ、示された要素の1またはこれより多くを記載すると読んで理解されるべきである。
【実施例】
【0091】
実施例1
本実施例は、同時の鎖転移およびライゲーションを用いて、ゲノムDNAの分割なしに、オープンバルク反応における、バーコード化したビーズ上へのゲノムDNAの標的特異的バーコードタグ付けの方法を記載する(
図4)。クローン性のバーコードビーズを、特許出願WO 2017/151828に記載されるように調製した。各バーコード配列は、18塩基の長さであった。クローン性に増幅されるバーコードテンプレートなしのものを含むビーズ全てを、BEAMing反応(Diehlら, 2005)後に直接収集した。2種のMuAトランスポソソームを、別個に、2種の異なるMuA転移可能DNAと予めアセンブリした。1種のMuAトランスポソソームにおけるMuA転移可能DNAは、ライゲーション可能な5’末端トランスポゾン連結鎖を有し、上記バーコード化したビーズ上のバーコードテンプレートにハイブリダイゼーションおよび/またはライゲーションすることができた。上記ビーズ上の2本鎖バーコードテンプレートを、1本鎖へと変性させた。2000万個の変性ビーズを、反応緩衝液中、ヒト胚性腎細胞293FTから抽出した5ng ゲノムDNA、その2種の予めアセンブリしたMuAトランスポソソームおよびT4 DNAリガーゼとともにインキュベートしたところ、これは、37℃において30分間で、実質的に同時に鎖転移反応およびライゲーション反応の両方を可能にした。0.5% SDS溶液で、反応を終了させた。洗浄したビーズを、エキソヌクレアーゼIで処理して、1本鎖ポリヌクレオチドを取り出し、次いで、15サイクルのPCR増幅に使用して、固定化したバーコードタグ付きDNAフラグメントを放出した。PCR生成物を0.8X AMPure XPビーズで精製して、小さなプライマーダイマーおよびPCR副生成物を除去し、TapeStationで高感度D5000スクリーンテープを使用して試験した(
図16A)。その精製したPCR生成物を、Illumina MiniSeq機器でシーケンシングした。同じバーコード配列を有するリードを、参照ゲノムアラインメント位置に基づいて各バーコードに対してソートした。次のアラインメントまでのリード距離を計算し、そのリード距離に沿ったリードカウント頻度を、
図16Bにプロットした。バーコード化したリードが、タグ付きDNAフラグメントからのリードの連結情報を維持した場合、近位リードの積み重なりが予測された。その本来の異なるDNAフラグメントからのリード距離はまた、遙かにより長い距離を有する遠位リードとして積み重なる。リードカウント頻度プロットの双峰分布が予測され、これは、
図16Bにおいて正確に観察された。シーケンシング深度は、マルチサンプルMiniSeq実行において非常に制限されたが、より短い距離の近位リードの強い富化が、成功裡のバーコードリード近接性を示した。
【0092】
実施例2
本実施例は、同時の鎖転移およびライゲーションを用いて、ゲノムDNAの分割なしに、オープンバルク反応における、バーコード化したビーズ上へのゲノムDNAの標的特異的バーコードタグ付けの方法を記載する(
図7)。MuA転移可能DNAを含む1種のMuAトランスポソソームは、ライゲーション可能な5’末端トランスポゾン連結鎖を有し、上記バーコード化したビーズ上でバーコードテンプレートにライゲーションできた。2000万個のバーコード化したビーズを、反応緩衝液中、37℃において30分間、ヒト胚性腎細胞293FTから抽出した5ng ゲノムDNA、そのライゲーション可能なMuAトランスポソソームおよびT4 DNAリガーゼとともにインキュベートした。0.5% SDS溶液で、反応を終了させた。次いで、洗浄したビーズを、別のMuAトランスポソソームおよびエキソヌクレアーゼIと反応させた。その反応を、0.5% SDSで再び停止させた。バーコードタグ付きフラグメントを有するビーズを、15サイクルのPCR増幅に使用して、固定化したバーコードタグ付きフラグメントを放出した。この方法は、実施例1における方法より少ないPCR副生成物を生じた。PCR生成物を、0.8X AMPure XPビーズで精製して、小さなプライマーダイマーおよびPCR副生成物を除去し、TapeStationで高感度D5000スクリーンテープを使用して試験した(
図17A)。その精製したPCR生成物を、Illumina MiniSeq機器でシーケンシングした。同じバーコード配列を有するリードを、参照ゲノムアラインメント位置に基づいて各バーコードに対してソートした。次のアラインメントまでのリード距離を計算し、そのリード距離に沿ったリードカウント頻度を、
図17Bにプロットした。バーコード化したリードが、タグ付きDNAフラグメントからのリードの連結情報を維持した場合、近位リードの積み重なりが予測された。本来の異なるDNAフラグメントからのリード距離はまた、遙かにより長い距離を有する遠位リードとして積み重なる。リードカウント頻度プロットの双峰分布が予測され、これは、
図17Bにおいて正確に観察された。シーケンシング深度は、マルチサンプルMiniSeq実行において非常に制限されたが、より短い距離の近位リードの強い富化が、成功裡のバーコードリード近接性を示した。
【0093】
実施例3
HapMapサンプルNA12878からの10ng ゲノムDNAを使用して、
図4に図示される方法でバーコードタグ付きIlluminaシーケンシングライブラリーを生成した。2x75bp ペアエンドシーケンシング(paired end sequencing)を、Illumina NextSeqシステムで行った。6億個を超えるペアエンドリードを、HapCUT2アルゴリズム(Edge Pら, 2017)を使用して、ハプロタイプフェージング分析のためにプールした。重複したリードを除去した後、ゲノムカバレッジ深度(genome coverage depth)はおよそ22倍であった。最大のフェージングしたブロックサイズは、9.5Mbであり、N50のフェージングしたブロックサイズは、1.7Mbであり、スイッチエラー率は、0.14%であった。
【0094】
実施例4
本発明者らは、シーケンシングライブラリー構築に関してクローン性のバーコードタグ付きフラグメントを生成する、3種の異なるトランスポザーゼベースの方法を比較した(
図19)。方法1は、本発明において開示される同時の鎖転移および捕捉反応であった。1ng E.coliゲノムDNAを、ライゲーション可能なトランスポソソーム、DNAリガーゼおよび2000万個のビーズ(そのうち、同じ反応緩衝液中に100万個のクローン性にバーコードテンプレート化したビーズが存在した)と混合して、さらなるPCR増幅によって、クローン性のバーコードタグ付きフラグメントおよび可溶性シーケンシングライブラリーを生成した。方法2および方法3は、別個の鎖転移および捕捉反応を使用して、クローン性のバーコードタグ付きフラグメントを生成する2つの方法であった。方法2は、先ず、ライゲーション可能なトランスポソソームと10ng E.coliゲノムDNAとを混合することによって、溶液中のSTCを生成した;次いで、1ngの本来のE.coliゲノムDNAを含むこれらの溶液中のSTCの10分の1を、DNAリガーゼおよび2000万個のビーズ(そのうち、ライゲーション緩衝液中に100万個のクローン性にバーコードテンプレート化したビーズが存在した)と混合して、上記ビーズ上に上記溶液中のSTCを捕捉した。方法3は、先ず、トランスポソソームおよびDNAリガーゼと2000万個のビーズ(そのうち、ライゲーション緩衝液中に100万個のクローン性にバーコードテンプレート化したビーズが存在した)と混合することによって、ライゲーション可能なトランスポソソームを、バーコードテンプレート化ビーズ上に固定化することであった;その反応したビーズを洗浄して、リガーゼを除去し、次いで、鎖転移反応緩衝液中の1ng E.coliゲノムDNAと反応させた。最後に、これら3つの反応からの同数のビーズを、PCR増幅のために使用して、同数のPCRサイクルによって、可溶性シーケンシングライブラリーを生成した。そのPCR生成物を、2% アガロースE-gel EXにローディングして、それらの収量を比較した(
図20)。方法1(
図20、レーンM1)は、本発明者らが予測したように、最大のライブラリー生成物を生じた。これは、方法1の性能が他の2つの方法(
図20、レーンM2およびレーンM3)より優れていることを示す。
【0095】
実施例5
E.coli DH10B細胞から抽出した0.5ng 高分子量ゲノムDNAを使用して、TELL-Seq
TM WGS Library Prep Kit(Universal Sequencing Technology Corporation, Carlsbad, CA)を使用し、キット中のTELLビーズを、本明細書で記載されるクローン性にバーコード化したビーズで置き換えたことを除いて、
図4に図示される方法でバーコードタグ付きIlluminaシーケンシングライブラリーを生成した。クローン性にバーコード化したビーズの3種の異なる調製物を作製した。共通バーコード配列(TAGAGAGGCTCTGGATCG)の3種の異なるレベル(高、中および低)を含むこれらのビーズ上のバーコードテンプレートは、各ビーズが有するクローン性の特有のバーコード配列以外は、これら全てのバーコード化したビーズの中で共有された。これらのビーズ上のバーコード配列のシーケンシング分析に基づいて、各ビーズ上の共通バーコード配列を含むバーコードテンプレートのパーセンテージは、それぞれ、高(T519)、中(T522)および低(T524)レベルに関して、各ビーズ上の全バーコードテンプレートカウントのうちの、平均14.10%、8.51%および0.81%である(表1)。
【0096】
【0097】
これらのビーズから生成したTELL-Seqライブラリーを、Illumina NextSeqシステムでシーケンシングした。一般的なシーケンシング統計を表2にまとめた。上記共通バーコード配列(TAGAGAGGCTCTGGATCG)と関連したリードを、エラーバーコードを有するリードの一部とみなし、これを、さらに下流の分析の前に除去した。
【0098】
【0099】
これら3つのサンプルのバーコードリード距離プロットは全て、近位連結リードおよび非連結遠位リードの非常に良好な双峰分布を示し、互いと非常に類似していた(
図21)。
【0100】
これらのシーケンシングデータのデノボアセンブリを、TELL-linkソフトウェアを使用して成功裏に生成した。全3つのサンプルは、それらのアセンブリにおいて、比較的低いミスマッチおよびインデルエラーを有する上記E.coli DH10Bゲノムのほぼ全長アセンブリを示した(表3)。上記データは、15%までのクローン性のバーコードビーズの中の共通バーコード配列のレベルが、連結リード品質およびデノボアセンブリ結果に対していかなる悪影響をも有しないことを示した。
【0101】
【0102】
Amini S. et al. 2014. Nature Genetics, 46(12): 1343-1349.
【0103】
Au T et al. 2004. EMBO J., 23: 3408-3420.
【0104】
Bankevich A. et al. 2012. J Comput Biol. 5: 455-77.
【0105】
Boeke J. D. 1989. Transposable elements in Saccharomyces cerevisiae in Mobile DNA. pp. 335-374 in Mobile DNA, edited by D. E. BERG and. M. M. HOWE.
【0106】
Burton B.M. and Baker T.A. 2003. Chemistry & Biology 10: 463-472.
【0107】
Chen Z. et al. 2017. Foreign Patent Application WO 2017/151828 A1.
【0108】
Craig N. L. 1996. Transposon Tn7. Curr. Top. Microbiol. Immunol. 204: 27-48.
【0109】
Crouse J. and Amorese D. 1987. Focus, 7(4): 1-2.
【0110】
Devine S. E. and Boeke, J. D. 1994. Nucleic Acids Research, 22(18): 3765-3772.
【0111】
Diehl F. et al. 2005. PNAS, 102 (45): 16368-16373.
【0112】
Drmanac R., Peters B. A. and Alexeev A. 2016. United State Patent US9,328,382 B2.
【0113】
Edge P., Bafna V. and Bansal V. 2017. Genome Res., 27(5): 801-812.
【0114】
Haapa S. et al. 1999. Nucleic Acids Research, 27(13): 2777-2784.
【0115】
Ichikawa H. and Ohtsubo E. 1990. J. Biol. Chem., 265(31): 18829-32.
【0116】
Kaufman P. and Rio D. C. 1992. Cell, 69(1): 27-39.
【0117】
Kleckner N. et al. 1996. Curr. Top. Microbiol. Immunol., 204: 49-82.
【0118】
Mizuuchi M., Baker T.A. and Mizuuchi K. 1992. Cell, 70, 303-311.
【0119】
Lampe D. J., Churchill M. E. A. and Robertson H. M. 1996. EMBO J., 15(19): 5470-5479.
【0120】
Lis J. T. and Schleif R. 1975. Nucleic Acid Research, 2(3): 383-389.
【0121】
Ohtsubo E. and Sekine Y. 1996. Curr. Top. Microbiol. Immunol., 204:126.
【0122】
Park B. T., Jeong M. H. and Kim B. H. 1992. Taehan Misaengmul Hakhoechi, 27(4): 381-9.
【0123】
Pelta J., Livolant F. and Sikorav J. L. 1996. J. Biological Chemistry, 271: 5656-5662.
【0124】
Savilahti H., Rice P. A., and MiZuuchi K. 1995. EMBO J., 14: 4893-4903.
【0125】
Surette M., Buch S.J. and Chaconas G. 1987. Cell, 70: 303-311.
【0126】
Varmus H. and Brown. P. A. 1989. Retroviruses, in Mobile DNA. Berg D. E. and Howe M. eds. American Society for Microbiology, Washington D. C. pp. 53-108.
【0127】
Vos J. C., Baere I. and Plasterk R. H. A. 1996. Genes Dev., 10(6): 755-61.
【0128】
Zhang F. et al. 2017. Nature Biotechnology, 35(9): 852-857.
【0129】
Zheng G.X. et al. 2016. Nature Biotechnology, 34(3): 303-311.