IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ イルミナ ケンブリッジ リミテッドの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-08-19
(45)【発行日】2022-08-29
(54)【発明の名称】連続性を維持した転位
(51)【国際特許分類】
   C12Q 1/6874 20180101AFI20220822BHJP
   C40B 40/06 20060101ALI20220822BHJP
   C12Q 1/6813 20180101ALI20220822BHJP
   C12N 15/09 20060101ALI20220822BHJP
【FI】
C12Q1/6874 Z ZNA
C40B40/06
C12Q1/6813 Z
C12N15/09
【請求項の数】 27
【外国語出願】
(21)【出願番号】P 2020204004
(22)【出願日】2020-12-09
(62)【分割の表示】P 2017520884の分割
【原出願日】2015-10-16
(65)【公開番号】P2021052779
(43)【公開日】2021-04-08
【審査請求日】2021-01-06
(31)【優先権主張番号】62/065,544
(32)【優先日】2014-10-17
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/157,396
(32)【優先日】2015-05-05
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/242,880
(32)【優先日】2015-10-16
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】502279294
【氏名又は名称】イルミナ ケンブリッジ リミテッド
(74)【代理人】
【識別番号】100147485
【弁理士】
【氏名又は名称】杉村 憲司
(74)【代理人】
【識別番号】230118913
【弁護士】
【氏名又は名称】杉村 光嗣
(74)【代理人】
【識別番号】100181272
【弁理士】
【氏名又は名称】神 紘一郎
(72)【発明者】
【氏名】フランク ジェイ スティーマーズ
(72)【発明者】
【氏名】ケヴィン エル ガンダーソン
(72)【発明者】
【氏名】ファン チャン
(72)【発明者】
【氏名】ジェイソン リチャード ベトリー
(72)【発明者】
【氏名】ニール アントニー ゴームリー
(72)【発明者】
【氏名】ウーター メウールマン
(72)【発明者】
【氏名】ジャクリーン ウィアー
(72)【発明者】
【氏名】アヴグスタ イオアノウ
(72)【発明者】
【氏名】ガレス ジェンキンス
(72)【発明者】
【氏名】ロザモンド ジャクソン
(72)【発明者】
【氏名】ナタリー モレル
(72)【発明者】
【氏名】ドミトリー ケイ ポコロック
(72)【発明者】
【氏名】スティーブン ジェイ ノルベルク
(72)【発明者】
【氏名】モーリー ホー
(72)【発明者】
【氏名】アミラーリ キア
(72)【発明者】
【氏名】イゴール ガルィシン
(72)【発明者】
【氏名】リゴー パントーハ
【審査官】山本 晋也
(56)【参考文献】
【文献】国際公開第2014/108810(WO,A2)
【文献】特開2013-150611(JP,A)
【文献】特表2016-508715(JP,A)
【文献】特表2014-506788(JP,A)
【文献】特表2013-535986(JP,A)
【文献】米国特許出願公開第2014/0235506(US,A1)
【文献】国際公開第2013/131962(WO,A1)
【文献】国際公開第2014/124338(WO,A1)
【文献】米国特許出願公開第2012/0053063(US,A1)
(58)【調査した分野】(Int.Cl.,DB名)
C12Q
C12N
C40B
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
複数のトランスポソーム複合体であって、各前記トランスポソーム複合体は1つ又は複数のトランスポゾン及び1つ又は複数のトランスポザーゼを含み、前記トランスポゾンはそれぞれ転移鎖及び非転移鎖を含み、各前記トランスポソーム複合体の少なくとも1つの前記トランスポゾンはアダプター配列を含む、複数のトランスポソーム複合体と、
複数の固体支持体とを含み、
各前記固体支持体は複数の固定化オリゴヌクレオチドを含み、
任意の固体支持体上の各前記固定化オリゴヌクレオチドは、
(a)標的核酸の連結転位後に前記標的核酸に結合している前記複数のトランスポソーム複合体の1つを前記固体支持体に固定化するために、前記複数のトランスポソーム複合体の1つのトランスポゾンのアダプター配列の少なくとも一部にハイブリダイズした相補的な捕捉配列であって、前記複数のトランスポソーム複合体のトランスポザーゼにより作られた前記標的核酸のフラグメントの連続性も、前記標的核酸に結合した前記複数のトランスポソーム複合体のトランスポザーゼにより維持される、相補的な捕捉配列と、
(b)第1のバーコード配列であって、前記複数の固体支持体中の各固体支持体からの第1のバーコード配列は、前記複数の固体支持体中の他の固体支持体からの第1のバーコード配列とは異なる、第1のバーコード配列と
(c)プライマー結合部位と
を含む、組成物。
【請求項2】
前記固定化オリゴヌクレオチドが、(a)第2のバーコード配列又は(b)第2のバーコード配列及び第3のバーコード配列をさらに含む、請求項1に記載の組成物。
【請求項3】
前記固体支持体がミクロスフェア、ビーズ、又は粒子である、請求項1に記載の組成物。
【請求項4】
任意の固体支持体上の各前記固定化オリゴヌクレオチドがプライマー結合部位を含み、前記プライマー結合部位がP5若しくはP7プライマー結合部位又はそれらの相補体である、請求項1に記載の組成物。
【請求項5】
前記複数の固体支持体中の任意の固体支持体上の固定化オリゴヌクレオチドが、部分的二本鎖構造及び部分的一本鎖構造を含む、請求項1~4のいずれか一項に記載の組成物。
【請求項6】
前記固定化オリゴヌクレオチドの一方の鎖は前記固体支持体に固定化され、もう一方の鎖は前記固体支持体に固定化された鎖に部分的に相補的であり、前記相補的な捕捉配列を含む、請求項5に記載の組成物。
【請求項7】
前記相補的な捕捉配列が前記トランスポゾンのアダプター配列にライゲートしている、請求項に記載の組成物。
【請求項8】
記アダプター配列が前記トランスポゾンの転移鎖にある、請求項7に記載の組成物。
【請求項9】
前記トランスポゾンの転移鎖の3’末端にライゲートしている標的核酸のフラグメントをさらに含む、請求項に記載の組成物。
【請求項10】
前記トランスポザーゼがTn5トランスポザーゼである、請求項に記載の組成物。
【請求項11】
前記標的核酸が複数のフラグメントを含み、前記トランスポソーム複合体が前記標的核酸の少なくとも1つのフラグメントに結合している、請求項に記載の組成物。
【請求項12】
前記転移鎖が前記標的核酸に挿入されて、前記転移鎖が前記トランスポゾンの転移鎖の3’末端にライゲートしているフラグメントを形成する、請求項に記載の組成物。
【請求項13】
前記標的核酸の連続性を維持しながら前記転移鎖が前記フラグメントの少なくとも1つの鎖の5’末端に挿入されている、請求項12に記載の組成物。
【請求項14】
前記複数の固体支持体中の任意の固体支持体上の固定化オリゴヌクレオチドが一本鎖構造を含む、請求項5に記載の組成物。
【請求項15】
前記固定化オリゴヌクレオチドがリンカーを介して前記固定化オリゴヌクレオチドの5’末端で固体支持体に固定化され、前記相補的な捕捉配列が前記固定化オリゴヌクレオチドの3’末端にある、請求項に記載の組成物。
【請求項16】
前記相補的な捕捉配列が前記トランスポゾンのアダプター配列にライゲートしている、請求項15に記載の組成物。
【請求項17】
記アダプター配列が前記トランスポゾンの非転移鎖にある、請求項15又は16に記載の組成物。
【請求項18】
前記相補的な捕捉配列が前記非転移鎖のアダプター配列にハイブリダイズしている、請求項17に記載の組成物。
【請求項19】
前記相補的な捕捉配列が前記トランスポゾンの転移鎖にライゲートしている、請求項17に記載の組成物。
【請求項20】
記アダプター配列が前記トランスポゾンの転移鎖にある、請求項15又は16に記載の組成物。
【請求項21】
前記相補的な捕捉配列が前記転移鎖のアダプター配列にハイブリダイズしている、請求項に記載の組成物。
【請求項22】
前記相補的な捕捉配列が前記非転移鎖の5’末端にライゲートしている、請求項21に記載の組成物。
【請求項23】
前記トランスポゾンの転移鎖の3’末端にライゲートしている標的核酸のフラグメントをさらに含む、請求項22のいずれか一項に記載の組成物。
【請求項24】
前記トランスポゾンのアダプター配列がバーコード配列を含む、請求項1~23のいずれか一項に記載の組成物。
【請求項25】
前記トランスポゾンのアダプター配列がプライマー結合部位を含む、請求項1~24のいずれか一項に記載の組成物。
【請求項26】
前記トランスポゾンのプライマー結合部位がP5若しくはP7プライマー結合部位又はそれらの相補体である、請求項22に記載の組成物。
【請求項27】
前記複数の固体支持体中の各固体支持体が、直径が0.5~5μmであるビーズである、請求項3に記載の組成物。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本願は、その全体が参照により本明細書に組み込まれる、2014年10月17日出願
の米国仮特許出願第62/065,544号及び2015年5月5日出願の米国仮特許出
願第62/157,396号の優先権を主張する。
【0002】
本発明の実施形態は、核酸のシークエンシングに関する。具体的には、本明細書で提供
する方法及び組成物の実施形態は、核酸鋳型の調製及び核酸鋳型からの配列データの取得
に関する。
【背景技術】
【0003】
生体試料中に存在する特定の核酸配列の検出は、例えば、微生物の同定及び分類、感染
症の診断、遺伝子異常の検出及び特徴付け、癌に関連した遺伝子変化の同定、疾患への遺
伝的感受性の研究、並びに様々な種類の治療に対する反応の測定を行う方法として用いら
れてきた。生体試料中の特定の核酸配列を検出する一般的な技術は、核酸シークエンシン
グである。
【0004】
核酸シークエンシング法は、Maxam及びGilbertが用いた化学分解法、及び
Sangerが用いた鎖伸長法から著しく発展してきた。今日、核酸の並列処理を全て1
回のシークエンシングランで行うことを可能にする、いくつかのシークエンシング法が用
いられている。従って、1回のシークエンシングランから生成される情報は、膨大なもの
となる可能性がある。
【発明の概要】
【課題を解決するための手段】
【0005】
1つの態様において、本明細書は、標的核酸のバーコード化DNAフラグメントのライ
ブラリーを調製する方法について記載する。当該方法は、標的核酸を複数のトランスポソ
ーム複合体と接触させることを含むものであり、各トランスポソーム複合体は、トランス
ポゾン及びトランスポザーゼを含み、トランスポゾンは転移鎖及び非転移鎖を含む。トラ
ンスポソーム複合体の少なくとも1つのトランスポゾンは、相補的な捕捉配列にハイブリ
ダイズすることが可能なアダプター配列を含む。標的核酸を複数のフラグメントにフラグ
メント化し、標的核酸の連続性(contiguity)を維持しながらフラグメントの
少なくとも1つの鎖の5’末端に複数の転移鎖を挿入する。標的核酸の複数のフラグメン
トを複数の固体支持体と接触させる。複数の固体支持体の各々は複数の固定化オリゴヌク
レオチドを含み、各オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列を
含み、複数の固体支持体中の各固体支持体からの第1のバーコード配列は、複数の固体支
持体中の他の固体支持体からの第1のバーコード配列とは異なる。バーコード配列の情報
を標的核酸のフラグメントに転移させ、それにより、同じ標的核酸の少なくとも2つのフ
ラグメントが同一のバーコード情報を受け取るように、少なくとも1つの鎖が第1のバー
コード配列で5’タグ化された、二本鎖フラグメントの固定化ライブラリーを作製する。
【0006】
1つの態様において、本明細書は、標的核酸配列の連続性情報を決定する方法について
記載する。当該方法は、標的核酸を複数のトランスポソーム複合体と接触させることを含
むものであり、各トランスポソーム複合体は、トランスポゾン及びトランスポザーゼを含
み、トランスポゾンは転移鎖及び非転移鎖を含み、トランスポソーム複合体のトランスポ
ゾンの少なくとも1つは、相補的な捕捉配列にハイブリダイズすることが可能なアダプタ
ー配列を含む。標的核酸を複数のフラグメントにフラグメント化し、標的核酸の連続性を
維持しながら複数の転移鎖を複数のフラグメントに挿入する。標的核酸の複数のフラグメ
ントを複数の固体支持体と接触させる。複数の固体支持体の各々は複数の固定化オリゴヌ
クレオチドを含み、各オリゴヌクレオチドは相補的な捕捉配列及び第1のバーコード配列
を含み、複数の固体支持体中の各固体支持体からの第1のバーコード配列は、複数の固体
支持体中の他の固体支持体からの第1のバーコード配列とは異なる。バーコード配列情報
を、同じ標的核酸の少なくとも2つのフラグメントが同一のバーコード情報を受け取るよ
うに、標的核酸フラグメントに転移させる。標的核酸フラグメントの配列及びバーコード
配列を決定する。標的核酸の連続性情報を、バーコード配列を識別することにより決定す
る。いくつかの実施形態において、トランスポソーム複合体のトランスポザーゼを転位(
transposition)後に除去し、続いて、トランスポゾンのアダプター配列を
相補的な捕捉配列にハイブリダイズさせる。いくつかの実施形態において、トランスポザ
ーゼをSDS処理により除去する。いくつかの実施形態において、トランスポザーゼをタ
ンパク質分解酵素処理により除去する。
【0007】
1つの態様において、本明細書は、標的核酸配列のフェージング情報及びメチル化状態
を同時に測定する方法について記載する。当該方法は、標的核酸を複数のトランスポソー
ム複合体と接触させることを含むものであり、各トランスポソーム複合体は、トランスポ
ゾン及びトランスポザーゼを含み、トランスポゾンは転移鎖及び非転移鎖を含み、トラン
スポソーム複合体のトランスポゾンの少なくとも1つは、相補的な捕捉配列にハイブリダ
イズすることが可能なアダプター配列を含む。標的核酸を複数のフラグメントにフラグメ
ント化し、標的核酸の連続性を維持しながら複数の転移鎖を標的核酸フラグメントに挿入
する。標的核酸の複数のフラグメントを複数の固体支持体と接触させ、複数の固体支持体
の各々は複数の固定化オリゴヌクレオチドを含み、各オリゴヌクレオチドは相補的な捕捉
配列及び第1のバーコード配列を含み、複数の固体支持体中の各固体支持体からの第1の
バーコード配列は、複数の固体支持体中の他の固体支持体からの第1のバーコード配列と
は異なる。バーコード配列情報を、同じ標的核酸の少なくとも2つのフラグメントが同一
のバーコード情報を受け取るように、標的核酸フラグメントに転移させる。バーコードを
含む標的核酸フラグメントを亜硫酸水素塩処理に付し、それにより、バーコードを含む亜
硫酸水素塩処理標的核酸フラグメントを生成する。亜硫酸水素塩処理標的核酸フラグメン
トの配列及びバーコード配列を決定する。標的核酸の連続性情報を、バーコード配列を識
別することにより決定する。
【0008】
1つの態様において、本明細書は、タグ化DNAフラグメントの固定化ライブラリーを
調製する方法について記載する。当該方法は、それに固定化されたトランスポソーム複合
体を有する複数の固体支持体を提供することを含み、トランスポソーム複合体は多量体で
あり、同じトランスポソーム複合体のトランスポソーム単量体単位は互いに結合し、トラ
ンスポソーム単量体単位は第1のポリヌクレオチドに結合したトランスポザーゼを含み、
第1のポリヌクレオチドは、(i)トランスポゾン末端配列を含む3’部分、及び(ii
)第1のバーコードを含む第1のアダプターを含む。標的DNAを、標的DNAがトラン
スポソーム複合体によりフラグメント化され、第1のポリヌクレオチドの3’トランスポ
ゾン末端配列がフラグメントの少なくとも1つの鎖の5’末端に転移する条件下で、複数
の固体支持体に適用する。それにより、少なくとも1つの鎖が第1のバーコードで5’タ
グ付けされた二本鎖フラグメントの固定化ライブラリーを作製する。
【0009】
1つの態様において、本明細書は、標的核酸のメチル化状態を決定するためのシークエ
ンシングライブラリーを調製する方法について記載する。当該方法は、標的核酸を2つ又
はそれ以上のフラグメントにフラグメント化することを含む。第1の共通アダプター配列
を標的核酸のフラグメントの5’末端に組み込み、アダプター配列は、第1のプライマー
結合配列及び親和性部分を含み、親和性部分は、結合ペアの1つのメンバーに存在する。
標的核酸フラグメントを変性させる。標的核酸フラグメントを固体支持体に固定化する。
固体支持体は、結合ペアの他のメンバーを含み、標的核酸の固定化は、結合ペアの結合に
より行う。固定化標的核酸フラグメントを亜硫酸水素塩処理に付す。第2の共通アダプタ
ー配列を亜硫酸水素塩処理した固定化標的核酸フラグメントに組み込み、第2の共通アダ
プターは、第2のプライマー結合部位を含む。固体支持体に固定化された亜硫酸水素塩処
理固定化標的核酸フラグメントを増幅し、それにより、標的核酸のメチル化状態を決定す
るためのシークエンシングライブラリーを作製する。
【0010】
1つの態様において、本明細書は、標的核酸のメチル化状態を決定するためのシークエ
ンシングライブラリーを調製する方法について記載する。当該方法は、それに固定化され
た固定化トランスポソーム複合体を含む複数の固体支持体を提供することを含む。トラン
スポソーム複合体は、トランスポゾン及びトランスポザーゼを含み、トランスポゾンは、
転移鎖及び非転移鎖を含む。転移鎖は、(i)トランスポザーゼ認識配列を含む3’末端
の第1の部分及び(ii)第1のアダプター配列及び結合ペアの第1のメンバーを含む5
’から第1の部分に位置する第2の部分を含む。結合ペアの第1のメンバーは、固体支持
体上で結合ペアの第2のメンバーに結合し、それにより、トランスポゾンを固体支持体に
固定化する。第1のアダプターはまた、第1のプライマー結合配列を含む。非転移鎖は、
(i)トランスポザーゼ認識配列を含む5’末端の第1の部分及び(ii)3’末端の末
端ヌクレオチドがブロックされている第2のアダプター配列を含む3’から第1の部分に
位置する第2の部分を含む。第2のアダプターはまた、第2のプライマー結合配列を含む
。標的核酸を、固定化トランスポソーム複合体を含む複数の固体支持体と接触させる。標
的核酸を複数のフラグメントにフラグメント化し、複数の転移鎖をフラグメントの少なく
とも1つの鎖の5’末端に挿入し、それにより、標的核酸フラグメントを固体支持体に固
定化する。フラグメント化された標的核酸の3’末端を、DNAポリメラーゼで伸長させ
る。非転移鎖を、フラグメント化された標的核酸の3’末端にライゲートする。固定化標
的核酸フラグメントを亜硫酸水素塩処理に付す。亜硫酸水素塩処理中に損傷を受けた固定
化標的核酸フラグメントの3’末端を、固定化標的核酸フラグメントの3’末端がホモポ
リマーテイルを含むように、DNAポリメラーゼを用いて伸長させる。第2のアダプター
配列を、亜硫酸水素塩処理中に損傷を受けた固定化標的核酸フラグメントの3’末端に導
入する。固体支持体に固定化された亜硫酸水素塩処理標的核酸フラグメントを、第1及び
第2のプライマーを用いて増幅し、それにより、標的核酸のメチル化状態を決定するため
のシークエンシングライブラリーを作製する。
【0011】
1つの態様において、本明細書は、標的核酸のメチル化状態を決定するためのシークエ
ンシングライブラリーを調製する方法について記載する。当該方法は、標的核酸をトラン
スポソーム複合体と接触させることを含むものであり、トランスポソーム複合体は、トラ
ンスポゾン及びトランスポザーゼを含む。トランスポゾンは、転移鎖及び非転移鎖を含む
。転移鎖は、(i)トランスポザーゼ認識配列を含む3’末端の第1の部分及び(ii)
第1のアダプター配列及び結合ペアの第1のメンバーを含む5’から第1の部分に位置す
る第2の部分を含み、結合ペアの第1のメンバーは、結合ペアの第2のメンバーに結合す
る。非転移鎖は、(i)トランスポザーゼ認識配列を含む5’末端の第1の部分及び(i
i)3’末端の末端ヌクレオチドがブロックされている第2のアダプター配列を含む3’
から第1の部分に位置する第2の部分を含み、第2のアダプターは、第2のプライマー結
合配列を含む。標的核酸を複数のフラグメントにフラグメント化し、複数の転移鎖をフラ
グメントの少なくとも1つの鎖の5’末端に挿入し、それにより、標的核酸フラグメント
を固体支持体に固定化する。トランスポゾン末端を含む標的核酸フラグメントを結合ペア
の第2のメンバーを含む複数の固体支持体に接触させ、結合ペアの第1のメンバーと結合
ペアの第2のメンバーとの結合により、標的核酸を固体支持体に固定化する。フラグメン
ト化された標的核酸の3’末端を、DNAポリメラーゼで伸長させる。非転移鎖を、フラ
グメント化された標的核酸の3’末端にライゲートする。固定化標的核酸フラグメントを
亜硫酸水素塩処理に付す。亜硫酸水素塩処理中に損傷を受けた固定化標的核酸フラグメン
トの3’末端を、固定化標的核酸フラグメントの3’末端がホモポリマーテイルを含むよ
うに、DNAポリメラーゼを用いて伸長させる。第2のアダプター配列を、亜硫酸水素塩
処理中に損傷を受けた固定化標的核酸フラグメントの3’末端に導入する。固体支持体に
固定化された亜硫酸水素塩処理標的核酸フラグメントを、第1及び第2のプライマーを用
いて増幅し、それにより、標的核酸のメチル化状態を決定するためのシークエンシングラ
イブラリーを作製する。
【0012】
いくつかの実施形態において、第2のアダプターの3’末端の末端ヌクレオチドを、ジ
デオキシヌクレオチド、リン酸基、チオリン酸基、及びアジド基からなる群から選択され
る1つのメンバーによりブロックする。
【0013】
いくつかの実施形態において、親和性部分を結合ペアのメンバーとすることができる。
いくつかのケースにおいて、修飾された核酸は、結合ペアの第1のメンバーを含んでいて
もよく、捕捉プローブは、結合ペアの第2のメンバーを含んでいてもよい。いくつかのケ
ースにおいて、捕捉プローブを固体表面に固定化してもよく、修飾された核酸は、結合ペ
アの第1のメンバーを含んでいてもよく、捕捉プローブは、結合ペアの第2のメンバーを
含んでいてもよい。そのようなケースでは、結合ペアの第1及び第2のメンバーの結合に
より、修飾された標的核酸を固体表面に固定化する。結合ペアの例としては、これに限定
されないが、ビオチン-アビジン、ビオチン-ストレプトアビジン、ビオチン-ニュート
ラアビジン、リガンド-受容体、ホルモン-受容体、レクチン-糖タンパク質、オリゴヌ
クレオチド-相補的オリゴヌクレオチド、及び抗原-抗体が挙げられる。
【0014】
いくつかの実施形態において、第1の共通アダプター配列を、片側(one-side
d)転位により標的核酸の5’末端フラグメントに組み込む。いくつかの実施形態におい
て、第1の共通アダプター配列を、ライゲーションにより標的核酸の5’末端フラグメン
トに組み込む。いくつかの実施形態において、第2の共通アダプター配列を亜硫酸水素塩
処理固定化標的核酸フラグメントに組み込むステップは、(i)固定化標的核酸フラグメ
ントの3’末端を、ターミナルトランスフェラーゼを用いて伸長し、ホモポリマーテイル
を含ませるステップ、(ii)一本鎖ホモポリマー部分を含むオリゴヌクレオチドと、第
2の共通アダプター配列を含む二本鎖部分とをハイブリダイズさせるステップであって、
一本鎖ホモポリマー部分がホモポリマーテイルに相補的である、ステップ、及び(iii
)第2の共通アダプター配列を固定化標的核酸フラグメントにライゲートし、それにより
、第2の共通アダプター配列を亜硫酸水素塩処理固定化標的核酸フラグメントに組み込む
ステップを含む。
【0015】
いくつかの実施形態において、標的核酸は、単一の細胞に由来する。いくつかの実施形
態において、標的核酸は、単一の細胞小器官に由来する。いくつかの実施形態において、
標的核酸は、ゲノムDNAである。いくつかの実施形態において、標的核酸は、他の核酸
と架橋する。いくつかの実施形態において、標的核酸は、ホルマリン固定パラフィン包埋
(FFPE:formarin fixed paraffin embedded)サ
ンプルに由来する。いくつかの実施形態において、標的核酸は、タンパク質と架橋する。
いくつかの実施形態において、標的核酸は、DNAと架橋する。いくつかの実施形態にお
いて、標的核酸は、ヒストンに保護されたDNAである。いくつかの実施形態において、
ヒストンを標的核酸から除去する。いくつかの実施形態において、標的核酸は、無細胞腫
瘍DNAである。いくつかの実施形態において、無細胞腫瘍DNAは、胎盤液から得る。
いくつかの実施形態において、無細胞腫瘍DNAは、血漿から得る。いくつかの実施形態
において、血漿は、血漿用採取ゾーンを有する膜分離装置を用いて全血から採取する。い
くつかの実施形態において、血漿用採取ゾーンは、固体支持体に固定化されたトランスポ
ソーム複合体を含む。いくつかの実施形態において、標的核酸は、cDNAである。いく
つかの実施形態において、固体支持体は、ビーズである。いくつかの実施形態において、
複数の固体支持体は、複数のビーズであり、複数のビーズは、様々なサイズである。
【0016】
いくつかの実施形態において、単一のバーコード配列が、各個々の固体支持体上の複数
の固定化オリゴヌクレオチドに存在する。いくつかの実施形態において、異なるバーコー
ド配列が、各個々の固体支持体上の複数の固定化オリゴヌクレオチドに存在する。いくつ
かの実施形態において、標的核酸フラグメントへのバーコード配列情報の転移は、ライゲ
ーションによる。いくつかの実施形態において、標的核酸フラグメントへのバーコード配
列情報の転移は、ポリメラーゼ伸長による。いくつかの実施形態において、標的核酸フラ
グメントへのバーコード配列情報の転移は、ライゲーション及びポリメラーゼ伸長の両方
による。いくつかの実施形態において、ポリメラーゼ伸長は、ライゲートした固定化オリ
ゴヌクレオチドを鋳型として用い、非ライゲートトランスポゾン鎖の3’末端をDNAポ
リメラーゼで伸長させることによる。いくつかの実施形態において、アダプター配列の少
なくとも一部は、第2のバーコード配列をさらに含む。
【0017】
いくつかの実施形態において、トランスポソーム複合体は、多量体であり、各単量体単
位のトランスポゾンのアダプター配列は、同じトランスポソーム複合体の他の単量体単位
とは異なる。いくつかの実施形態において、アダプター配列は、第1のプライマー結合配
列をさらに含む。いくつかの実施形態において、第1のプライマー結合部位は、捕捉配列
又は捕捉配列の相補体に対して、配列相同性を持たない。いくつかの実施形態において、
固体支持体上の固定化オリゴヌクレオチドは、第2のプライマー結合配列をさらに含む。
【0018】
いくつかの実施形態において、トランスポソーム複合体は、多量体であり、トランスポ
ソーム単量体単位は、同じトランスポソーム複合体内で互いに結合する。いくつかの実施
形態において、トランスポソーム単量体単位のトランスポザーゼは、同じトランスポソー
ム複合体の別のトランスポソーム単量体単位のトランスポザーゼに結合する。いくつかの
実施形態において、トランスポソーム単量体単位のトランスポゾンは、同じトランスポソ
ーム複合体の別のトランスポソーム単量体単位のトランスポゾンに結合する。いくつかの
実施形態において、トランスポソーム単量体単位のトランスポザーゼは、同じトランスポ
ソーム複合体の別のトランスポソーム単量体単位のトランスポザーゼに共有結合により結
合する。いくつかの実施形態において、1つの単量体単位のトランスポザーゼは、同じト
ランスポソーム複合体の別のトランスポソーム単量体単位のトランスポザーゼにジスルフ
ィド結合により結合する。いくつかの実施形態において、トランスポソーム単量体単位の
トランスポゾンは、同じトランスポソーム複合体の別のトランスポソーム単量体単位のト
ランスポゾンに共有結合により結合する。
【0019】
いくつかの実施形態において、標的核酸配列の連続性情報は、ハプロタイプ情報を示す
。いくつかの実施形態において、標的核酸配列の連続性情報は、ゲノム変異を示す。いく
つかの実施形態において、ゲノム変異は、欠損、転位(translocations)
、染色体間の遺伝子融合、重複、及びパラログからなる群から選択される。いくつかの実
施形態において、固体支持体に固定化されたオリゴヌクレオチドは、部分的二本鎖領域及
び部分的一本鎖領域を含む。いくつかの実施形態において、オリゴヌクレオチドの部分的
一本鎖領域は、第2のバーコード配列及び第2のプライマー結合配列を含む。いくつかの
実施形態において、バーコードを含む標的核酸フラグメントを、標的核酸フラグメントの
配列を決定する前に増幅する。いくつかの実施形態において、後続の増幅を、標的核酸フ
ラグメントの配列を決定する前に、単一の反応区画で行う。いくつかの実施形態において
、第3のバーコード配列を、増幅中に標的核酸フラグメントに導入する。
【0020】
いくつかの実施形態において、上記方法は、バーコードを含む標的核酸フラグメントを
、複数の第1のセットの反応区画から、バーコードを含む標的核酸フラグメントのプール
にまとめるステップ、バーコードを含む標的核酸フラグメントの前記プールを複数の第2
のセットの反応区画に再分配するステップ、及び標的核酸フラグメントを第2のセットの
反応区画内でシークエンシング前に増幅することにより、第3のバーコードを標的核酸フ
ラグメントに導入するステップをさらに含んでいてもよい。
【0021】
いくつかの実施形態において、上記方法は、標的核酸をトランスポソーム複合体と接触
させる前にプレフラグメント化するステップをさらに含んでいてもよい。いくつかの実施
形態において、標的核酸のプレフラグメント化は、超音波処理及び制限消化からなる群か
ら選択される方法により行われる。
【図面の簡単な説明】
【0022】
図1】トランスポソームをビーズ表面に結合させる方法の一例を示すフローチャートである。
図2図1の方法のステップを絵で示す図である。
図3】ビーズ表面上でのタグメント化工程の一例を示す模式図である。
図4】DNA収量の一例を、図3のビーズベースタグメント化工程からのクラスター数の観点から示すデータ表である。
図5図3のビーズベースタグメント化工程の再現性の別例を、均一なサイズの観点から示すデータ表である。
図6図6A及び6Bは、それぞれ、図5のインデックス付きサンプルのプール1の挿入サイズのプロット及びプール2の挿入サイズのプロットを示す図である。
図7】リードの合計数及び図5に記載の実験のためにアラインしたリードの割合の再現性を示す棒グラフである。
図8図8A、8B、及び8Cは、それぞれ、エクソーム濃縮アッセイにおける、コントロールライブラリーでの挿入サイズのプロット、ビーズベースタグメント化ライブラリーでの挿入サイズのプロット、及びサマリーデータ表を示す図である。
図9図9A、9B、及び9Cは、それぞれ、エクソーム濃縮アッセイにおける、dups PF画分の棒グラフ、selected bases画分の棒グラフ、及びPCT usable bases on targetの棒グラフを示す図である。
図10】ビーズ表面上でのトランスポソーム複合体の形成方法の一例を示すフローチャートである。
図11図10の方法のステップを絵で示す図である。
図12図10の方法のステップを絵で示す図である。
図13図10の方法のステップを絵で示す図である。
図14図13に示すトランスポソーム被覆ビーズを用いたタグメント化工程の模式図である。
図15】固体支持体上でのトランスポソーム形成の例示的なスキームを示す図である。
図16】固有インデックスを有する連結(contiguously linked)ライブラリー作製の例示的なスキームを示す図である。
図17】固有インデックスを有する連結ライブラリー作製の例示的なスキームを示す図である。
図18】CPT-DNAがビーズに巻き付いている、単一のクローンインデックス付きビーズ上での単一のCPT-DNAの捕捉を表わす図である。
図19】CPT-DNAがビーズに巻き付いている、単一のクローンインデックス付きビーズ上での単一のCPT-DNAの捕捉を表わす図である。
図20】固体表面に固定化したY-アダプターを、ライゲーション及びギャップ充填により標的DNAに結合させる例示的なスキームを示す図である。
図21】CPT-DNAと固体支持体上の固定化オリゴヌクレオチドとのライゲーションの間に、前記Y-アダプターを作製する例示的なスキームを示す図である。
図22】サイズ排除クロマトグラフィーによる連結ライブラリーからの遊離トランスポソームの除去を示す、アガロースゲル電気泳動を表わす図である。
図23】特定のDNAフラグメントのショットガン配列ライブラリーを生成する例示的なスキームを示す図である。
図24】クローンインデックス付きシークエンシングライブラリーからの配列情報をアセンブルする例示的なスキームを示す図である。
図25】ビーズ上の捕捉プローブ密度の最適化の結果を示す図である。
図26】分子内ハイブリダイゼーションによるビーズ上でのCPT-DNAのインデックス付きシークエンシングライブラリーの調製の実現性を試験した結果を示す図である。
図27】クローンインデックス化の実現性を試験した結果を示す図である。
図28】タグメント化後の鋳型核酸に対して隣接して(neighbouring)アラインされたリードの島内(intra)及び島間(intra)の特定の距離に対する、シークエンシングリードの頻度を示すグラフである。
図29図29A及び29Bは、固体支持体上の連続性情報を引き出す例示的なアプローチを示す図である。
図30】単一の反応容器(ワンポット)におけるインデックス付きクローンビーズ転位の概略図及び転位結果を示す図である。
図31】単一の反応容器(ワンポット)におけるインデックス付きクローンビーズ転位の概略図及び転位結果を示す図である。
図32】5’又は3’ビオチン化オリゴヌクレオチドを用いたビーズ上でのクローントランスポソームの作製を示す概略図である。
図33】ビーズ上のトランスポソームに対するライブラリーサイズを示す図である。
図34】挿入サイズに対するトランスポソーム表面密度の影響を示す図である。
図35】サイズ分布に対するインプットDNAの影響を示す図である。
図36】ビーズベース及び溶液ベースのタグメント化反応を用いた島のサイズ及び分布を示す図である。
図37】それぞれ固有インデックスを受け取った、いくつかの個々のDNA分子のクローンインデックス化を示す図である。
図38】全血から血漿を分離する装置の略図である。
図39】血漿を分離する装置及び分離された血漿のその後の使用を示す略図である。
図40】血漿を分離する装置及び分離された血漿のその後の使用を示す略図である。
図41】ゲノムの特定の領域を濃縮することによる標的フェージングの例示的なスキームを示す図である。
図42】エクソン間のSNPを用いたエクソームフェージングの例示的なスキームを示す図である。
図43】フェージング及びメチル化の同時検出の例示的なスキームを示す図である。
図44】フェージング及びメチル化の同時検出の別の例示的なスキームを示す図である。
図45】単一アッセイにおいて、種々のサイズのクローンインデックス付きビーズを用いて種々のサイズのライブラリーを生成する、例示的なスキームを示す図である。
図46】異なる長さスケールのライブラリーで遺伝的変異を決定する例示的なスキームを示す図である。
図47A】染色体1における60kbヘテロ接合欠損の検出結果を示す図である。
図47B】染色体1における60kbヘテロ接合欠損の検出結果を示す図である。
図48】本願の方法を用いた遺伝子融合検出の結果を示す図である。
図49】本願の方法を用いた遺伝子欠損検出の結果を示す図である。
図50】亜硫酸水素塩変換前後のME配列を示す図である。
図51】亜硫酸水素塩変換効率の最適化の結果を示す図である。
図52】亜硫酸水素塩変換後の結果をIVCプロット(各塩基当たりの強度対サイクル)で示す図である。
図53】BSCの後のPCR後のインデックス付き結合ライブラリーのアガロースゲル電気泳動の画像を示す図である。
図54】サイズ選択をしていない濃縮前の全ゲノムインデックス付き結合CPT-seqライブラリーのバイオアナライザートレースを示す図である。
図55】濃縮後のライブラリーのアガロースゲル分析を示す図である。
図56】標的化ハプロタイピングを染色体のHLA領域に適用した結果を示す図である。
図57】ME交換(swapping)のいくつかの考え得るメカニズムを示す図である。
図58】ME交換(swapping)のいくつかの考え得るメカニズムを示す図である。
図59】Cysで置換することができる例示的なアミノ酸残基Asp468、Tyr407、Asp461、Lys459、Ser458、Gly462、Ala466、Met470を有するTn5トランスポザーゼの一部を示す図である。
図60】システイン残基が2つの単量体単位間でジスルフィド結合を形成できるようにした、S458C、K459C、及びA466Cのアミノ酸置換を有するTn5トランスポザーゼの一部を示す図である。
図61】アミン被覆ナノ粒子を用いた二量体トランスポザーゼ(dTnp)ナノ粒子(NP)バイオコンジュゲート(dTnp-NP)の作製及び使用の例示的なスキームを示す図である。
図62】トランスポソーム二量体とアミン被覆固体支持体とのコンジュゲーションの例示的なスキームを示す図である。
図63】トランスポゾン末端が結合したMuトランスポソーム複合体を示す図である。
図64】疑似遺伝子のアセンブリ/フェージングのためのインデックス付き結合リードの略図、及びより短いフラグメントを用いた疑似遺伝子の変異識別の利点を示す図である。
図65】交換された(swapped)インデックスの割合(%)として示す、4つの別個の実験からのインデックス交換(exchange)のプロットを示す図である。
図66】Ts-Tn5滴定のフラグメントサイズの、Agilent BioAnalyzerによる分析を示す図である。
図67】亜硫酸水素塩処理後の破損したライブラリーエレメントを回復させる酵素法を用いて、Epi-CPTSeqプロトコルのDNA収量を改善する、例示的なスキームを示す図である。
図68図68A~68Cは、亜硫酸水素塩処理後の破損したライブラリーエレメントを回復させる酵素法を用いて、Epi-CPTSeqプロトコルのDNA収量を改善する、いくつかの例示的なスキームを示す図である。
図69】ランダムプライマー伸長を用いた鋳型救出(rescue)の例示的なスキームを示す図である。
図70】亜硫酸水素ナトリウム変換中のDNAライブラリーのフラグメント化を示す図である。左のパネルは、磁性ビーズ上にタグメント化されたDNAの一部を亜硫酸水素変換している最中のフラグメント化を示す。右のパネルは、CPT-seq及びEpi-CPT-seq(Me-CPT-seq)ライブラリーのバイオアナライザートレースを示す。
図71】TdT媒介ssDNAライゲーション反応の例示的なスキーム及び結果を示す図である。
図72】ライブラリーに結合した亜硫酸水素ナトリウム変換ビーズのTdT媒介回復のスキーム及び結果を示す図である。左のパネルは、TdT媒介ライゲーション反応を用いた損傷亜硫酸水素塩変換DNAライブラリーの救出の操作フローを示す。DNAライブラリー救出実験の結果を右のパネルに示す。
図73】メチル-CPT-seqアッセイの結果を示す図である。
図74】DNAのビーズベース亜硫酸水素塩変換の例示的なスキームを示す図である。
図75図75A及び75Bは、亜硫酸水素塩変換効率の最適化の結果を示す図である。
【発明を実施するための形態】
【0023】
本発明の実施形態は、核酸のシークエンシングに関する。具体的には、本明細書で提供
する方法及び組成物の実施形態は、核酸鋳型の調製及び核酸鋳型からの配列データの取得
に関する。
【0024】
1つの態様において、本発明は、タグメント化(フラグメント化及びタグ化)した標的
核酸ライブラリーを構築するために、固体支持体上で標的核酸をタグメント化する方法に
関する。1つの実施形態において、固体支持体は、ビーズである。1つの実施形態におい
て、標的核酸は、DNAである。
【0025】
1つの態様において、本発明は、標的核酸の連続性情報を引き出すことが可能な、固体
支持体、トランスポザーゼに基づく方法の、方法及び組成物に関する。いくつかの実施形
態において、組成物及び方法は、アセンブリ/フェージング情報を引き出すことができる
【0026】
1つの態様において、本発明は、連結した転位標的核酸を固体支持体上に捕捉すること
により、連続性情報を引き出す方法及び組成物に関する。
【0027】
1つの態様において、本明細書に開示する方法及び組成物は、ゲノム変異の分析に関す
る。例示的なゲノム変異としては、これに限定されないが、欠損、染色体間転位、重複、
パラログ、染色体間遺伝子融合が挙げられる。いくつかの実施形態において、本明細書に
開示する方法及び組成物は、ゲノム変異のフェージング情報の決定に関する。
【0028】
1つの態様において、本明細書に開示する方法及び組成物は、標的核酸の特定の領域の
フェージングに関する。1つの実施形態において、標的核酸は、DNAである。1つの実
施形態において、標的核酸は、ゲノムDNAである。いくつかの実施形態において、標的
核酸は、RNAである。いくつかの実施形態において、RNAは、mRNAである。いく
つかの実施形態において、標的核酸は、相補的DNA(cDNA:compliment
ary DNA)である。いくつかの実施形態において、標的核酸は、単一の細胞に由来
する。いくつかの実施形態において、標的核酸は、循環腫瘍細胞に由来する。いくつかの
実施形態において、標的核酸は、無細胞DNAである。いくつかの実施形態において、標
的核酸は、無細胞腫瘍DNAである。いくつかの実施形態において、標的核酸は、ホルマ
リン固定パラフィン包埋組織サンプルに由来する。いくつかの実施形態において、標的核
酸は、架橋標的核酸である。いくつかの実施形態において、標的核酸は、タンパク質に架
橋する。いくつかの実施形態において、標的核酸は、核酸に架橋する。いくつかの実施形
態において、標的核酸は、ヒストンに保護されたDNAである。いくつかの実施形態にお
いて、ヒストンに保護されたDNAを、ヒストンに対する抗体を用いて細胞溶解物から沈
殿させ、ヒストンを除去する。
【0029】
いくつかの態様において、インデックス付きライブラリーは、クローンインデックス付
きビーズを用いて、標的核酸から作製する。いくつかの実施形態において、タグメント化
標的核酸は、トランスポザーゼが標的DNAに結合したままで、クローンインデックス付
きビーズを用いて捕捉することができる。いくつかの実施形態において、特異的な捕捉プ
ローブを用いて、標的核酸中の目的の特異的な領域を捕捉する。標的核酸の捕捉された領
域は、種々のストリンジェンシーで洗浄し、任意選択的に増幅し、その後シークエンシン
グすることができる。いくつかの実施形態において、捕捉プローブは、ビオチン化しても
よい。ビオチン化捕捉プローブがインデックス付き標的核酸の特異的な領域にハイブリダ
イズした複合体は、ストレプトアビジンビーズを用いて分離することができる。標的フェ
ージングの例示的なスキームを図41に示す。
【0030】
いくつかの態様において、本明細書に開示する組成物及び方法は、エクソームのフェー
ジングに用いることができる。いくつかの実施形態において、エクソン、プロモーターを
濃縮することができる。マーカー、例えば、エクソン領域間のヘテロ接合SNPは、特に
エクソン間の距離が大きい場合に、エクソンのフェージングに役立つ可能性がある。例示
的なエクソームのフェージングを図42に示す。いくつかの実施形態において、インデッ
クス付き結合リードは、隣接しているエクソンのヘテロ接合SNPに同時に及ぶ(カバー
する)ことができない。従って、2つ又はそれ以上のエクソンをフェージングすることは
困難である。本明細書に開示する組成物及び方法はまた、エクソン間のヘテロ接合SNP
を濃縮し、例えば、エクソン1をSNP1に、SNP2をエクソン2にフェージングする
。従って、SNP1の使用を通じて、エクソン1及びエクソン2を、図42に示すように
フェージングすることができる。
【0031】
1つの態様において、本明細書に開示する組成物及び方法は、フェージング及び同時の
メチル化の検出に用いることができる。亜硫酸水素塩変換(BSC:bisulfite
conversion)によるメチル化検出は、BSC反応がDNAに対して厳しい(
harsh)ものであり、DNAをフラグメント化し、それにより連続性/フェージング
情報を除去するため、困難である。また、本願に開示する方法は、従来のBSCアプロー
チで必要とされるのとは対照的に、更なる精製ステップを必要としないことにより、収率
を改善するため、さらに利点がある。
【0032】
1つの態様において、本明細書に開示する組成物及び方法を用いて、異なるサイズのラ
イブラリーを1つのアッセイで調製することができる。いくつかの実施形態において、異
なるサイズのクローンインデックス付きビーズを用いて、異なるサイズのライブラリーを
調製することができる。図1は、トランスポザーゼをビーズ表面に結合させる方法100
の一例のフローチャートを示す。トランスポザーゼは、トランスポゾンオリゴヌクレオチ
ド、トランスポザーゼ、及び固相に加えてもよい任意の化学物質を用いて、ビーズ表面に
結合させてもよい。1つの例において、トランスポソームを、ビオチン-ストレプトアビ
ジン結合複合体を介してビーズ表面に結合させる。方法100は、これに限定されないが
、以下のステップを含む。
【0033】
1つの実施形態において、トランスポゾンは、シークエンシングプライマー結合部位を
含んでいてもよい。シークエンス結合部位の例示的な配列としては、これに限定されない
が、AATGATACGGCGACCACCGAGATCTACAC(P5配列)及びC
AAGCAGAAGACGGCATACGAGAT(P7配列)が挙げられる。いくつか
の実施形態において、トランスポゾンをビオチン化してもよい。
【0034】
図1のステップ110において、P5及びP7ビオチン化トランスポゾンを生成する。
トランスポゾンはまた、1つ又はそれ以上のインデックス配列(固有の識別子)を含んで
いてもよい。例示的なインデックス配列としては、これに限定されないが、TAGATC
GC、CTCTCTAT、TATCCTCT、AGAGTAGA、GTAAGGAG、A
CTGCATA、AAGGAGTA、CTAAGCCTが挙げられる。別の例では、P5
トランスポゾンのみ又はP7トランスポゾンのみをビオチン化する。さらに別の例では、
トランスポゾンは、モザイク末端(ME:mosaic end)配列のみ、又はME配
列に加えてP5及びP7配列ではない追加の配列を含む。この例では、P5及びP7配列
は、後続のPCR増幅ステップで付加する。
【0035】
図1のステップ115において、トランスポソームをアセンブルする。アセンブルした
トランスポソームは、P5及びP7トランスポソームの混合物である。P5及びP7トラ
ンスポソームの混合物は、図11及び12と関連してより詳細に説明する。
【0036】
図1のステップ120において、P5/P7トランスポソーム混合物を、ビーズ表面に
結合させる。この例では、ビーズは、ストレプトアビジン被覆ビーズであり、トランスポ
ソームを、ビオチン-ストレプトアビジン結合複合体を介してビーズ表面に結合させる。
ビーズは、種々のサイズであってもよい。1つの例において、ビーズは、2.8μmビー
ズであってもよい。別の例において、1μmビーズであってもよい。1μmビーズの懸濁
液(例えば、1μL)は、体積当たり大きな表面積をトランスポソーム結合にもたらす。
トランスポソーム結合に用いることができる表面積により、反応当たりのタグメント化生
成物の数が増加する。
【0037】
図2は、図1の方法100のステップ110、115、及び120を絵で示す。この例
では、トランスポゾンを二本鎖で示す。別の例(図示しない)では、ヘアピン等の別の構
造、即ち、二本鎖を形成することができる自己相補的な領域を有する単一のオリゴヌクレ
オチドを用いてもよい。
【0038】
方法100のステップ110において、複数のビオチン化P5トランスポゾン210a
及び複数のP7トランスポゾン210bを生成する。P5トランスポゾン210a及びP
7トランスポゾン210bをビオチン化する。
【0039】
方法100のステップ115において、P5トランスポゾン210a及びP7トランス
ポゾン210bをトランスポザーゼTn5 215と混合し、複数のアセンブルしたトラ
ンスポソーム220を形成する。
【0040】
方法100のステップ120において、トランスポソーム220を、ビーズ225に結
合させる。ビーズ225は、ストレプトアビジン被覆ビーズである。トランスポソーム2
20を、ビオチン-ストレプトアビジン結合複合体を介してビーズ225に結合させる。
【0041】
1つの実施形態において、トランスポソームの混合物を、図10、11、12、及び1
3に示すように、ビーズ表面等の固体支持体上で形成してもよい。この例では、P5及び
P7オリゴヌクレオチドを、トランスポソーム複合体のアセンブリ前に、初めにビーズ表
面に結合させる。
【0042】
図3は、ビーズ表面上におけるタグメント化工程300の例の模式図を示す。工程30
0において、トランスポソーム220が結合した図2のビーズ225を示す。DNA31
0の溶液をビーズ225の懸濁液に加える。DNA310がトランスポソーム220に接
触すると、DNAがタグメント化(フラグメント化及びタグ化)され、トランスポソーム
220を介してビーズ225に結合する。結合及びタグメント化されたDNA310をP
CR増幅して、溶液中(ビーズを含まない)で増幅産物315のプールを生成してもよい
。増幅産物315は、フローセル320の表面に転移させてもよい。クラスター生成プロ
トコル(例えば、ブリッジ増幅プロトコル、又はクラスター生成に使用することができる
任意のその他の増幅プロトコル)を用いて、複数のクラスター325をフローセル320
の表面上に生成してもよい。クラスター325は、タグメント化DNA310のクローン
増幅産物である。これでクラスター325は、シークエンシングプロトコルの次のステッ
プ用に準備できたことになる。
【0043】
別の実施形態において、トランスポソームは、マイクロ遠心チューブの壁等の任意の固
体表面に結合してもよい。
【0044】
ビーズ表面上にトランスポソーム複合体の混合物を形成する別の実施形態において、オ
リゴヌクレオチドは、トランスポソームのアセンブリ前に、初めにビーズ表面に結合させ
る。図10は、ビーズ表面上でトランスポソーム複合体を形成する方法1000の一例の
フローチャートを示す。方法1000は、これに限定されないが、以下のステップを含む
【0045】
ステップ1010において、P5及びP7オリゴヌクレオチドを、ビーズ表面に結合さ
せる。1つの例において、P5及びP7オリゴヌクレオチドは、ビオチン化し、ビーズは
、ストレプトアビジン被覆ビーズである。このステップはまた、図11の模式図1100
に絵で示す。ここで、図11を参照すると、P5オリゴヌクレオチド1110及びP7オ
リゴヌクレオチド1115は、ビーズ1120の表面に結合する。この例においては、1
つのP5オリゴヌクレオチド1110及び1つのP7オリゴヌクレオチド1115が、ビ
ーズ1120の表面に結合しているが、任意の数のP5オリゴヌクレオチド1110及び
/又はP7オリゴヌクレオチド1115が、複数のビーズ1120の表面に結合してもよ
い。1つの例において、P5オリゴヌクレオチド1110は、P5プライマー配列、イン
デックス配列(固有の識別子)、リード1シークエンシングプライマー配列、及びモザイ
ク末端(ME)配列を含む。この例において、P7オリゴヌクレオチド1115は、P7
プライマー配列、インデックス配列(固有の識別子)、リード2シークエンシングプライ
マー配列、及びME配列を含む。別の例(図示せず)において、インデックス配列は、P
5オリゴヌクレオチド1110のみに存在する。さらに別の例(図示せず)において、イ
ンデックス配列は、P7オリゴヌクレオチド1115のみに存在する。さらに別の例(図
示せず)において、インデックス配列は、P5オリゴヌクレオチド1110及びP7オリ
ゴヌクレオチド1115のいずれにも存在しない。
【0046】
ステップ1015において、相補的モザイク末端(ME’)オリゴヌクレオチドを、ビ
ーズ結合P5及びP7オリゴヌクレオチドにハイブリダイズさせる。このステップはまた
図12の模式図1200に絵で示す。ここで、図12を参照すると、相補的ME配列(
ME’)1125は、P5オリゴヌクレオチド1110及びP7オリゴヌクレオチド11
15にハイブリダイズする。相補的ME配列(ME’)1125(例えば、相補的ME配
列(ME’)1125a及び相補的ME配列(ME’)1125b)は、P5オリゴヌク
レオチド1110及びP7オリゴヌクレオチド1115のME配列にそれぞれハイブリダ
イズする。相補的ME配列(ME’)1125は、典型的には、約15塩基長であり、5
’末端でリン酸化されている。
【0047】
ステップ1020において、トランスポザーゼ酵素をビーズ結合オリゴヌクレオチドに
添加し、ビーズ結合トランスポソーム複合体の混合物を形成する。このステップはまた、
図13の模式図1300に絵で示す。ここで図13を参照すると、トランスポザーゼ酵素
が添加されて、複数のトランスポソーム複合体1310を形成する。この例において、ト
ランスポソーム複合体1310は、トランスポザーゼ酵素、2つの表面結合オリゴヌクレ
オチド配列、及びそれらにハイブリダイズした相補的ME配列(ME’)1125を含む
二本鎖構造である。例えば、トランスポソーム複合体1310aは、相補的ME配列(M
E’)1125にハイブリダイズしたP5オリゴヌクレオチド1110及び相補的ME配
列(ME’)1125にハイブリダイズしたP7オリゴヌクレオチド1115(即ち、P
5:P7)を含み、トランスポソーム複合体1310bは、相補的ME配列(ME’)1
125にハイブリダイズした2つのP5オリゴヌクレオチド1110(即ち、P5:P5
)含み、トランスポソーム複合体1310cは、相補的ME配列(ME’)1125にハ
イブリダイズした2つのP7オリゴヌクレオチド1115(即ち、P7:P7)含む。P
5:P5、P7:P7、及びP5:P7トランスポソーム複合体の割合は、例えば、25
:25:50であってもよい。
【0048】
図14は、図13のトランスポソーム被覆ビーズ1120を用いたタグメント化工程の
例示的な模式図1400を示す。この例において、トランスポソーム複合体1310を有
するビーズ1120を、タグメント化バッファー中のDNA1410の溶液に加え、タグ
メント化を生じさせ、DNAをビーズ1120の表面にトランスポソーム1310を介し
て結合させる。DNA1410の連続したタグメント化により、トランスポソーム131
0間に複数のブリッジ分子1415が生じる。ブリッジ分子1415の長さは、ビーズ1
120の表面におけるトランスポソーム複合体1310の密度に依存する可能性がある。
1つの例において、ビーズ1120の表面上のトランスポソーム複合体1310の密度は
図10の方法100のステップ1010においてビーズ1120の表面に結合するP5
及びP7オリゴヌクレオチドの量を変化させることにより調整してもよい。別の例におい
て、ビーズ1120の表面上のトランスポソーム複合体1310の密度は、図10の方法
1000のステップ1015において、P5及びP7オリゴヌクレオチドにハイブリダイ
ズする相補的ME配列(ME’)の量を変化させることにより、調整してもよい。さらに
別の例において、ビーズ1120の表面上のトランスポソーム複合体1310の密度は、
図1の方法1000のステップ1020において加えるトランポザーゼ酵素の量を変化さ
せることにより、調整してもよい。
【0049】
ブリッジ分子1415の長さは、タグメント化反応で用いられた、トランスポソーム複
合体1310が結合したビーズ1120の量に依存しない。同様に、タグメント化反応に
おいてより多い又はより少ないDNA1410を加えることは、最終的なタグメント化産
物のサイズを変えないが、反応の収率に影響を与える可能性がある。
【0050】
1つの例において、ビーズ1120は、常磁性ビーズである。この例では、タグメント
化反応の精製は、ビーズ1120を磁石で固定化し、洗浄することにより容易に行うこと
ができる。従って、タグメント化及びその後のPCR増幅を、単一の反応区画(「ワンポ
ット(one-pot)」)での反応で実施してもよい。
【0051】
1つの態様において、本発明は、固体支持体上で標的核酸の連続性情報を引き出すこと
が可能なトランスポザーゼに基づく方法の、方法及び組成物に関する。いくつかの実施形
態において、組成物及び方法は、アセンブリ/フェーズ情報を引き出すことができる。1
つの実施形態において、固体支持体は、ビーズである。1つの実施形態において、標的核
酸は、DNAである。1つの実施形態において、標的核酸は、ゲノムDNAである。いく
つかの実施形態において、標的核酸は、RNAである。いくつかの実施形態において、R
NAは、mRNAである。いくつかの実施形態において、標的核酸は、相補的DNA(c
DNA)である。
【0052】
いくつかの実施形態において、トランスポゾンを、ビーズ等の固体支持体に二量体とし
て固定化し、その後トランスポザーゼをトランスポゾンに結合してトランスポソームを形
成してもよい。
【0053】
いくつかの実施形態において、固相化トランスポゾン及びトランスポザーゼの添加によ
る、固相でのトランスポソームの形成に特に関連して、2つのトランスポゾンを、固体支
持体において互いにごく近接して(好ましくは、一定の距離で)固定化してもよい。この
アプローチには、いくつかの利点がある。1つ目としては、好ましくは、2つのトランス
ポゾンがトランスポソームを効率良く形成するのに最適なリンカー長及び方向で、2つの
トランスポゾンが、常に同時に固定化されることになる。2つ目としては、トランスポソ
ームの形成効率が、トランスポゾン密度の関数とはならないであろうことである。2つの
トランスポゾンが、トランスポソームを形成するのに適切な方向及び両者間の距離で、常
に利用できることになる。3つ目としては、表面上のランダムな固定化トランスポゾンに
より、トランスポゾン間に種々の距離が形成され、それにより、1つの画分のみがトラン
スポソームを効率良く形成するのに最適な方向及び距離を有する。結果として、全てのト
ランスポゾンがトランスポソームに変換するのではなく、固相化非複合体化トランスポゾ
ンが存在することになる。これらのトランスポゾンは、ME部分が二本鎖DNAであるた
め、転位の標的となり易い。これにより、転位効率の低下をもたらし、望ましくない副産
物を形成する可能性がある。従って、続けて使用して、タグメント化及びシークエンシン
グを通じて連続性情報を導き出すことができる固体支持体上に、トランスポソームを調製
してもよい。例示的なスキームを図15に示す。いくつかの実施形態において、トランス
ポゾンは、化学的結合以外の手法で固体支持体に固定化してもよい。固体支持体上にトラ
ンスポゾンを固定化する例示的な方法としては、これに限定されないが、ストレプトアビ
ジン-ビオチン、マルトース-マルトース結合タンパク質、抗原-抗体、DNA-DNA
又はDNA-RNAハイブリダイゼーション等の親和結合が挙げられる。
【0054】
いくつかの実施形態において、トランスポソームは、プレアセンブルした後、固体支持
体に固定化することができる。いくつかの実施形態において、トランスポゾンは、固有の
インデックス、バーコード、及び増幅プライマー結合部位を含む。トランスポザーゼを、
トランスポゾンを含む溶液に添加し、固体支持体上に固定化することが可能なトランスポ
ソーム二量体を形成することができる。1つの実施形態において、各セットが固定化トラ
ンスポゾンに由来する同じインデックスを有し、それによりインデックス付きビーズを生
成する、複数のビーズセットを生成することができる。図29Aに示すように、標的核酸
を、インデックス付きビーズの各セットに添加することができる。
【0055】
いくつかの実施形態において、標的核酸は、インデックス付きビーズの各セットに添加
することができ、タグメント化及びその後のPCR増幅を別々に行ってもよい。
【0056】
いくつかの実施形態において、標的核酸、インデックス付きビーズ、及びトランスポソ
ームは、多くの液滴が、1つのビーズと1つ又はそれ以上のDNA分子及び十分なトラン
スポソームとを含むように、液滴内で組み合わせることができる。
【0057】
いくつかの実施形態において、インデックス付きビーズをプールすることができ、プー
ルに標的核酸を加えることができ、タグメント化及びその後のPCR増幅を単一の反応区
画(「ワンポット」)で行ってもよい。
【0058】
1つの態様において、本発明は、連結転位標的核酸を固体支持体上に捕捉することによ
り、連続性情報を引き出す方法及び組成物に関する。いくつかの実施形態において、連続
性保存転位(CPT:contiguity preserving transpos
ition)をDNA上で行うが、DNAは、無傷(intact)のままであり(CP
T-DNA)、従って、連結ライブラリーを形成する。連続性情報は、トランスポザーゼ
を用いて標的核酸に隣接した鋳型核酸フラグメントの関連性(association)
を維持することにより、保存することができる。CPT-DNAは、固体支持体、例えば
、ビーズに固定化された、固有のインデックス又はバーコードを有する相補的オリゴヌク
レオチドのハイブリダイゼーションにより捕捉することができる(図29B)。いくつか
の実施形態において、固体支持体に固定化されたオリゴヌクレオチドは、バーコードに加
えて、プライマー結合部位、固有分子インデックス(UMI:unique molec
ular indices)をさらに含んでいてもよい。
【0059】
有利なことに、このようにトランスポソームを用いて、フラグメント化された核酸の物
理的近接性を保つことにより、同じ起源の分子、例えば、染色体からのフラグメント化さ
れた核酸が、同じ固有のバーコード及びインデックス情報を固体支持体に固定化されたオ
リゴヌクレオチドから受け取る可能性が増える。これにより、固有のバーコードを有する
連結シークエンシングライブラリーが得られることになる。連結シークエンシングライブ
ラリーをシークエンスして、連続配列情報を引き出すことができる。
【0060】
図16及び17は、固有のバーコード又はインデックスを有する連結ライブラリーを作
製する本発明の上記態様の、例示的な実施形態の模式図を示す。例示的な方法は、CPT
-DNAと、固有のインデックス及びバーコードを有する固体支持体上の固定化オリゴヌ
クレオチドとのライゲーション、及び鎖置換PCRを活用して、シークエンシングライブ
ラリーを生成する。1つの実施形態において、クローンインデックス付きビーズは、ラン
ダム又は特定のプライマー及びインデックス等の固定化DNA配列で生成してもよい。連
結ライブラリーは、固定化オリゴヌクレオチドへのハイブリダイゼーションとその後のラ
イゲーションにより、クローンインデックス付きビーズ上に捕捉することができる。分子
内ハイブリダイゼーション捕捉は、分子間ハイブリダイゼーションよりもはるかに速いた
め、連続転位ライブラリーが、ビーズに「巻き付く(wrap around)」ことに
なる。図18及び19は、クローンインデックス付きビーズ上でのCPT-DNAの捕捉
及び連続性情報の保存を示す。鎖置換PCRは、クローンビーズインデックス情報を個々
の分子に転移することができる。従って、各連結ライブラリーは、特異的にインデックス
付けされることになる。
【0061】
いくつかの実施形態において、固体支持体に固定化されたオリゴヌクレオチドは、一方
の鎖は固体支持体に固定化され、もう一方の鎖は、固定化された鎖に部分的に相補的であ
ることによりY-アダプターとなるような、部分的二本鎖構造を含むことができる。いく
つかの実施形態において、固体支持体に固定化されたY-アダプターは、ライゲーション
及びギャップ充填により連結タグメント化DNAに結合する。図20に示す。
【0062】
いくつかの実施形態において、Y-アダプターは、ビーズ等の固体支持体上のプローブ
/インデックスを用いた、CPT-DNAのハイブリダイゼーション捕捉を通じて、形成
される。図21は、このようなY-アダプターを作製する例示的なスキームを示す。これ
らのY-アダプターを使用することにより、潜在的に各フラグメントがシークエンシング
ライブラリーになる可能性があることを確かにする。これにより、シークエンシング当た
りの適用範囲(coverage)が増加する。
【0063】
いくつかの実施形態において、遊離トランスポソームを、CPT-DNAから分離して
もよい。いくつかの実施形態において、遊離トランスポソームの分離は、サイズ排除クロ
マトグラフィーによる。1つの実施形態において、分離は、MicroSpin S-4
00 HR Columns(ペンシルバニア州ピッツバーグ、GE Healthca
re Life Sciences社)により行ってもよい。図22は、遊離トランスポ
ソームから分離したCPT-DNAのアガロースゲル電気泳動を示す。
【0064】
ハイブリダイゼーションを通じた連結転位標的核酸の固体支持体上への捕捉には、いく
つかの特有の利点がある。1つ目としては、方法は、ハイブリダイゼーションに基づくも
のであり、転位に基づくものではない。分子内ハイブリダイゼーション率>>分子間ハイ
ブリダイゼーション率である。従って、単一の標的DNA分子の連続転位ライブラリーが
固有インデックス付きビーズに巻き付く可能性は、2つ又はそれ以上の異なる単一の標的
DNA分子が固有インデックス付きビーズに巻き付くのに比べてはるかに高い。2つ目と
しては、DNAの転位及び転位したDNAのバーコード化は、2つの別個のステップで生
じる。3つ目としては、ビーズ上の活性化トランスポソームのアセンブリ及び固体表面上
のトランスポゾンの表面密度の最適化に関連した課題を、回避することができる。4つ目
としては、自己転位産物をカラム精製により除去することができる。5つ目としては、連
結転位DNAがギャップを含むため、DNAがより柔軟であり、それ故、トランスポソー
ムをビーズに固定化する方法に比べて、転位密度(挿入サイズ)への負荷が少ない。6つ
目としては、方法に、組み合わせ(combinatorial)バーコードスキームを
用いることができる。7つ目としては、インデックス付きオリゴをビーズに共有結合させ
るのが容易である。従って、インデックス交換の可能性が少ない。8つ目としては、タグ
メント化及びその後のPCR増幅を多重化してもよく、単一反応区画(「ワンポット」)
反応で行うことができるため、各インデックス配列に対して個々の反応を行う必要がなく
なる。
【0065】
いくつかの実施形態において、転位の間に、複数の固有のバーコードを標的核酸全体に
わたって挿入してもよい。いくつかの実施形態において、各バーコードは、間にフラグメ
ント化部位が配置された第1のバーコード配列及び第2のバーコード配列を含む。第1の
バーコード配列及び第2のバーコード配列は、互いにペアとなるように同定又は設計する
ことができる。第1のバーコードと第2のバーコードとが関連するようにペアを作ること
は、有益(informative)である可能性がある。有利なことに、ペアとなった
バーコード配列を用いて、シークエンシングデータを鋳型核酸のライブラリーからアセン
ブルすることができる。例えば、第1のバーコード配列を含む第1の鋳型核酸、及び第1
のバーコード配列とペアとなる第2のバーコード配列含む第2の鋳型核酸を同定すること
は、第1及び第2の鋳型核酸が、標的核酸の配列表示において互いに隣接した配列を表す
ことを意味する。このような方法を用いて、参照ゲノムを必要とすることなく、標的核酸
の配列表示をデノボで(新たに)アセンブルすることができる。
【0066】
1つの態様において、本発明は、特定のDNAフラグメントのショットガン配列ライブ
ラリーを生成する方法及び組成物に関する。
【0067】
1つの実施形態において、クローンビーズインデックス付きビーズを、固定化オリゴヌ
クレオチド配列:ランダム又は特異的なプライマー及び固有のインデックスで生成する。
標的核酸を、クローンインデックス付きビーズに加える。いくつかの実施形態において、
標的核酸は、DNAである。1つの実施形態において、標的DNAを変性させる。標的D
NAは、固体表面(例えば、ビーズ)に固定化された固有のインデックスを含むプライマ
ーにハイブリダイズし、続いて、同じインデックスを有する別のプライマーにハイブリダ
イズする。ビーズ上のプライマーは、DNAを増幅させる。1つ又はそれ以上の更なる増
幅ラウンドを行ってもよい。1つの実施形態において、増幅は、3’ランダムn量体配列
を有するビーズ固定化プライマーを用いて、全ゲノム増幅により行ってもよい。好ましい
実施形態において、ランダムn量体は、増幅中のプライマー-プライマー相互作用を防ぐ
ために、疑似相補的塩基(2-チオチミン、2-アミノdA、N4-エチルシトシン等)
を含む(Hoshika,S;Chen,F;Leal,NA;Benner,SA,A
ngew.Chem.Int.Ed.49(32)5554-5557(2010))。
図23は、特定のDNAフラグメントのショットガン配列ライブラリーを生成する例示的
なスキームを示す。クローンインデックス付きシークエンシングライブラリー及び増幅産
物のライブラリーを生成することができる。1つの実施形態において、このようなライブ
ラリーは、転位により生成することができる。インデックス情報を指針として用いること
により、クローンインデックス付きライブラリーの配列情報を用いて、連続性情報をアセ
ンブルすることができる。図24は、クローンインデックス付きシークエンシングライブ
ラリーから配列情報をアセンブルする例示的なスキームを示す。
【0068】
上記実施形態の方法には、いくつかの利点がある。ビーズ上での分子内増幅は、ビーズ
間増幅よりもはるかに速い。従って、ビーズ上の生成物は、同じインデックスを有するこ
とになる。特定のDNAフラグメントのショットガンライブラリーを、作製することがで
きる。ランダムプライマーは、ランダムな場所で鋳型を増幅するため、同じインデックス
を有するショットガンライブラリーを特定の分子から生成することができ、インデックス
付き配列を用いて配列情報をアセンブルすることができる。上記実施形態の方法の大きな
利点は、反応を単一の反応(ワンポット反応)で多重化することができ、多くの個別のウ
ェルを用いる必要がなくなることである。多くのインデックス付きクローンビーズを調製
することができ、そのため、多くの異なるフラグメントを固有にラベルすることができ、
同じゲノム領域に対して親対立遺伝子を識別することができる。多数のインデックスを用
いることにより、父親のDNAコピー及び母親のDNAコピーが同じゲノム領域に対して
同じインデックスを受け取る可能性は低い。当該方法は、内(intra)反応が間(i
nter)反応よりもはるかに速いという事実を利用するものであり、ビーズは、大きな
物理的区画において実質的な仕切りを基本的に作り出す。
【0069】
本発明の全ての上記態様のうちのいくつかの実施形態において、方法を、無細胞DNA
(cfDNA:cell free DNA)アッセイにおいてcfDNAに用いてもよ
い。いくつかの実施形態において、cfDNAは、血漿、胎盤液から得る。
【0070】
1つの実施形態において、血漿は、膜ベースの沈降支援血漿分離器を用いて無希釈の全
血から得ることができる(Liu et al.Anal Chem.2013 Nov
5;85(21):10463-70)。1つの実施形態において、血漿分離器におけ
る血漿採取ゾーンは、トランスポソームを含む固体支持体を含んでいてもよい。トランス
ポソームを含む固体支持体は、血漿が全血から分離される時に、単離された血漿からcf
DNAを捕捉してもよく、cfDNAの濃縮及び/又はDNAのタグメント化を行うこと
ができる。いくつかの実施形態において、タグメント化は、固有のバーコードをさらに導
入することにより、続いて分離(demultiplexing)を、ライブラリープー
ルのシークエンシング後に行うことを可能にするであろう。
【0071】
いくつかの実施形態において、分離器の採取ゾーンは、PCRマスターミックス(プラ
イマー、ヌクレオチド、バッファー、金属)及びポリメラーゼを含んでいてもよい。1つ
の実施形態において、マスターミックスは、血漿が分離器から出てくる時に再構成される
ように、乾燥状態であってもよい。いくつかの実施形態において、プライマーは、ランダ
ムプライマーである。いくつかの実施形態において、プライマーは、特定の遺伝子に対す
る特異的プライマーであってもよい。cfDNAのPCR増幅の結果として、分離された
血漿から直接ライブラリーを生成することになる。
【0072】
いくつかの実施形態において、分離器の採取ゾーンは、RT-PCRマスターミックス
(プライマー、ヌクレオチド、バッファー、金属)、逆転写酵素、及びポリメラーゼを含
んでいてもよい。いくつかの実施形態において、プライマーは、ランダムプライマー又は
オリゴdTプライマーである。いくつかの実施形態において、プライマーは、特定の遺伝
子に対する特異的プライマーであってもよい。得られたcDNAは、シークエンシングに
用いることができる。或いは、cDNAは、配列ライブラリー調製のために、固体支持体
に固定化されたトランスポソームで処理してもよい。
【0073】
いくつかの実施形態において、血漿分離器は、バーコード(1D又は2Dバーコード)
を含んでいてもよい。いくつかの実施形態において、分離装置は、採血装置を有していて
もよい。これにより、血液を血漿分離器及びライブラリー調製装置に直接送ることになる
。いくつかの実施形態において、装置は、下流配列分析器を有していてもよい。いくつか
の実施形態において、配列分析器は、単回使用シークエンサーである。いくつかの実施形
態において、シークエンサーは、まとめてシークエンシングする前に、サンプルの列を作
ることができる。或いは、シークエンサーは、サンプルがシークエンシング領域に送達さ
れる、ランダムアクセス機能を有していてもよい。
【0074】
いくつかの実施形態において、血漿用採取ゾーンは、無細胞DNAが濃縮されるように
、シリカ基質を含んでいてもよい。
【0075】
フェージング及びメチル化の同時検出
5-メチルシトシン(5-Me-C)及び5-ヒドロキシメチルシトシン(5-ヒドロ
キシ-C)は、エピジェネティック(Epi)修飾としても知られ、細胞代謝、分化、及
び癌増殖において重要な役割を果たす。本願の発明者らは、驚くべきことに、且つ予想外
にも、フェージング及び同時のメチル化の検出が、本願の方法及び組成物を用いて可能で
あることを見出した。本願の方法は、ビーズ上でのCPTシークエンシング(CPT-s
eq)(インデックス付き連結ライブラリー)とDNAメチル化検出とを組み合わせるこ
とを可能にするものである。例えば、ビーズ上に生成された個々のライブラリーを亜硫酸
水素塩で処理して、非メチル化CをUに変換するが、メチル化CはUに変換しないことに
より、5-Me-Cの検出を可能にすることができる。ヘテロ接合SNPを用いた更なる
フェージング分析を通じて、Epi-メチル化-フェージングブロックを複数のメガ塩基
領域で確立することができる。
【0076】
いくつかの実施形態において、分析されるDNAのサイズは、約100塩基~約複数メ
ガ塩基まで可能である。いくつかの実施形態において、分析されるDNAのサイズは、約
100塩基、200塩基、300塩基、400塩基、500塩基、600塩基、700塩
基、800塩基、900塩基、1000塩基、1200塩基、1300塩基、1500塩
基、2000塩基、3000塩基、3500塩基、4000塩基、4500塩基、500
0塩基、5500塩基、6000塩基、6500塩基、7000塩基、7500塩基、8
000塩基、8500塩基、9000塩基、9500塩基、10,000塩基、10,5
00塩基、11,000塩基、11,500塩基、12,000塩基、12,500塩基
、13,000塩基、14,000塩基、14,500塩基、15,000塩基、15,
500塩基、16,000塩基、16,500塩基、17,000塩基、17,500塩
基、18,000塩基、18,500塩基、19,000塩基、19,500塩基、20
,000塩基、20,500塩基、21,000塩基、21,500塩基、22,000
塩基、22,500塩基、23,000塩基、23,500塩基、24,000塩基、2
4,500塩基、25,000塩基、25,500塩基、26,000塩基、26,50
0塩基、27,000塩基、27,500塩基、28,000塩基、28,500塩基、
29,500塩基、30,000塩基、30,500塩基、31,000塩基、31,5
00塩基、32,000塩基、33,000塩基、34,000塩基、35,000塩基
、36,000塩基、37,000塩基、38,000塩基、39,000塩基、40,
000塩基、42,000塩基、45,000塩基、50,000塩基、55,000塩
基、60,000塩基、65,000塩基、70,000塩基、75,000塩基、80
,000塩基、85,000塩基、90,000塩基、95,000塩基、100,00
0塩基、110,000塩基、120,000塩基、130,000塩基、140,00
0塩基、150,000塩基、160,000塩基、170,000塩基、180,00
0塩基、200,000塩基、225,000塩基、250,000塩基、300,00
0塩基、350,000塩基、400,000塩基、450,000塩基、500,00
0塩基、550,000塩基、600,000塩基、650,000塩基、700,00
0塩基、750,000塩基、800,000塩基、850,000塩基、900,00
0塩基、1,000,000塩基、1,250,000塩基、1,500,000塩基、
2,000,000塩基、2,500,000塩基、3,000,000塩基、4,00
0,000塩基、5,000,000塩基、6,000,000塩基、7,000,00
0塩基、8,000,000塩基、9,000,000塩基、10,000,000塩基
、15,000,000塩基、20,000,000塩基、30,000,000塩基、
40,000,000塩基、50,000,000塩基、75,000,000塩基、1
00,000,000塩基、又はそれ以上である。
【0077】
5-ヒドロキシ-C、DNA酸化生成物、DNAアルキル化生成物、ヒストン末端(h
istone-foot)プリンティング等の他のEpi修飾はまた、本願に開示する方
法及び組成物を用いてフェージングの中で分析することもできる。
【0078】
いくつかの実施形態において、DNAは、初めに、固体支持体上でインデックス付き結
合ライブラリーに変換される。元のDNAよりもはるかに小さい個々のインデックス付き
ライブラリーは、個々のライブラリーがより小さいため、フラグメント化され難い。イン
デックス付きライブラリーの小画分が消失したとしても、フェージング情報は、インデッ
クス付きDNA分子の全長にわたって依然として維持される。例えば、100kbの分子
の場合、従来の亜硫酸水素塩変換(BSC)では半分にフラグメント化され、連続性はも
はや50kbに制限される。本明細書に開示する方法では、100kbのライブラリーは
、初めにインデックス化され、個々のライブラリーの画分が消失しても、連続性は、依然
として~100kbである(全ライブラリーがDNA分子の一端から消失する稀な事態を
除いて)。また、本明細書に開示する方法は、従来の亜硫酸水素塩変換アプローチでは必
要とされるのとは対照的に、更なる精製ステップが必要とされないことにより、収率が上
がるため、さらに利点を有する。本明細書に開示する方法では、ビーズは、亜硫酸水素塩
変換の後に洗浄するだけである。さらに、DNAが固相に結合しているままで、DNA(
インデックス付きライブラリー)の最小限の消失及び少ない手間でバッファー交換を容易
に行うことができる。
【0079】
フェージング及びメチル化の同時検出の例示的なスキームを図43に示す。操作フロー
は、ビーズ上でのDNAのタグメント化、9塩基対の反復領域のギャップ充填ライゲーシ
ョン、SDSによるTn5の除去、及びビーズ上の個々のライブラリーの亜硫酸水素塩変
換からなる。隣接する相補的ライブラリーが再アニールしないことを確実にするために、
亜硫酸水素塩変換を変性条件下で行い、それにより、亜硫酸水素塩変換効率を低下させる
。BSCは、非メチル化CをUに変換し、メチル化Cは、変換されない。
【0080】
図44は、フェージング及びメチル化の同時検出の別の例示的なスキームを示す。転位
後にシークエンシングライブラリーを調製した後、一本鎖鋳型を調製するために、ギャッ
プ充填ライゲーションしたライブラリーの画分を分解する。一本鎖鋳型は、既に鋳型が、
ライブラリーの消失を低減すること又は亜硫酸水素塩変換効率を改善することができる一
本鎖であるため、亜硫酸水素塩変換に対してより穏やかな条件を必要とする。1つの実施
形態において、3’チオ保護トランスポゾン(Exo抵抗性)及び非保護トランスポゾン
の混合物を、同じビーズ上で用いる。酵素、例えば、Exo Iを用いて、非チオ保護ラ
イブラリーを分解し、それらを一本鎖ライブラリーに変換することができる。チオ保護ト
ランスポゾン:非保護トランスポゾンが50:50である混合物を用いることにより、ラ
イブラリーの50%を一本鎖ライブラリーに変換し(50%では、ライブラリーの1つの
トランスポゾンは保護されており、1つのトランスポゾン(相補鎖)は保護されていない
)、25%は変換せず(両方のトランスポゾンがチオ保護されている)、25%は両方と
も変換してライブラリー全体を除去する(両方のトランスポゾンが保護されていない)。
【0081】
ストレプトアビジン磁性ビーズ等の固相に結合したDNAの亜硫酸水素塩変換を行う上
での1つの課題は、DNAが結合したビーズを、亜硫酸水素ナトリウムにより高温で長時
間処理することで、DNA及びビーズの両方に損傷を与えることである。DNA損傷の回
復を助けるため、キャリアDNA(即ち、ラムダDNA)を亜硫酸水素塩処理前に反応混
合物に加える。キャリアDNAが存在しても、当初のDNAの約80%が消失することが
予測された。結果として、CPTSeq連続性ブロックは、従来のCPTSeqプロトコ
ルよりも少ないメンバーを有する。
【0082】
従って、本明細書において、Epi-CPTSeqプロトコルのDNA収量を改善する
ためのいくつかのストラテジーを提案する。第1のストラテジーは、ストレプトアビジン
ビーズにトランスポソーム複合体をより密集させることで、ライブラリー挿入サイズを小
さくすることに依拠する。ライブラリーサイズを小さくすることにより、より少ない割合
のライブラリーエレメントが亜硫酸水素塩処理により分解される。
【0083】
Epi-CPTSeqプロトコルのDNA収量を改善するための第2のストラテジーは
、破損したライブラリーエレメントを酵素により回復させることである。回復ストラテジ
ーの目的は、ライブラリー増幅に必要な3’共通配列を、亜硫酸水素塩処理中に3’部分
が分解及び消失したビーズ結合ライブラリーエレメントに再び加えることである。3’共
通配列を加えた後は、これらのエレメントをPCR増幅及びシークエンシングすることが
できる。図67及び68は、このストラテジーの例示的なスキームを示す。二本鎖CPT
Seqライブラリーエレメントを変性し、亜硫酸水素塩変換する(上段)。亜硫酸水素塩
変換の間に、DNA鎖の1つが損傷を受け(中段)、3’末端上のPCR共通配列が消失
する。鋳型救出ストラテジーにより、PCR増幅に必要な3’共通配列(緑色)を回復さ
せる(下段)。1つの例において、3’リン酸化アテニュエーターオリゴ、即ち、シーク
エンシングアダプターとそれに続くオリゴdTストレッチを含む配列の存在下で、ターミ
ナルトランスフェラーゼを使用する(図68A)。簡単に言えば、TdTが、10~15
dAのストレッチを、アテニュエーターオリゴのオリゴdT部分にアニールする破損ライ
ブラリーエレメントの3’末端に、加える。このDNAハイブリッドの形成により、Td
T反応が停止し、破損ライブラリーエレメントの3’末端をDNAポリメラーゼにより結
果的に伸長させるための鋳型をもたらす。
【0084】
別の操作フロー(図68B)では、TdTテーリング反応を、一本鎖オリゴdT部分及
び5’リン酸化二本鎖シークエンシングアダプター部分を有する部分的二本鎖アテニュエ
ーターオリゴの存在下で行う。TdT反応の終結時、最後に付加されたdAと5’リン酸
化アテニュエーターオリゴとの間のニックを、DNAリガーゼで封止する。
【0085】
記載した操作フローのどちらも、近年開発された制御可能なTdTテーリング反応に依
拠しており、米国特許出願公開第2015/0087027号明細書に記載されている。
共通シークエンシングアダプターはまた、近年導入されたMMLV RTのssDNA鋳
型スイッチング活性により、破損ライブラリーエレメントの3’末端に付加することがで
きる。つまり、MMLV RT及び鋳型スイッチオリゴ(TSオリゴ:template
switch_oligo)を、損傷DNAに加える(図68C)。この反応の最初の
ステップにおいて、逆転写酵素は、一本鎖DNAフラグメントの3’末端にいくつかの追
加のヌクレオチドを付加し、これらの塩基は、TSオリゴの1つの3’末端に存在するオ
リゴ(N)配列とペアを作る。次いで、逆転写酵素の鋳型スイッチング活性により、アニ
ールされた共通プライマーの配列をBSC破損ライブラリーエレメントの3’末端に付加
し、共通シークエンシングプライマーによるPCRで増幅される能力を回復させる。
【0086】
第3のストラテジーの一部として、Epicentre社のEpiGenomeキット
「ポスト亜硫酸水素塩変換」ライブラリー構築法を用いて、亜硫酸水素塩変換中に3’末
端の共通配列を消失したライブラリーエレメントを救出することができる。図69に示す
ように、このライブラリー救出法は、共通配列及びそれに続く短いストレッチのランダム
配列を有する3’リン酸化オリゴを利用する。これらの短いランダム配列は、亜硫酸水素
塩処理一本鎖DNAにハイブリダイズし、続いて共通配列が、DNAポリメラーゼにより
破損ライブラリー鎖に複製される。
【0087】
図74は、ビーズ上での亜硫酸水素塩シークエンシング法を改良する第4のストラテジ
ーを示す。捕捉タグを含む第1の共通配列を、DNAの5’末端に共有結合させる。第1
の共通配列は、片側転位(図示する)、アダプターライゲーション、又は米国特許出願公
開第2015/0087027号明細書に記載されたターミナルトランスフェラーゼ(T
dT)アダプターライゲーションを含む、種々の方法を用いてDNAに結合させることが
できる。
【0088】
次に、DNAを変性させ(例えば、高熱でのインキュベーション)、固体支持体に結合
させる。ビオチンをCS1上の捕捉タグとして使用する場合は、例えば、DNAは、スト
レプトアビジン磁性ビーズ(図示する)を用いて結合させることができる。固体支持体に
結合してしまえば、バッファー交換を容易に行うことができる。
【0089】
次のステップにおいて、ssDNAの亜硫酸水素塩変換を行う。一本鎖の形では、DN
Aは、亜硫酸水素塩変換に容易に利用できるはずであり、Promega社のMethy
l Edge BSCキットの改良版を用いて変換効率95%まで観察した(図75)。
【0090】
亜硫酸水素塩変換後、第2の共通配列を、固体支持体に結合したssDNAの3’末端
に共有結合させる。オリゴをssDNAに共有結合させるためのいくつかの方法を、上述
してきた。TdTアテニュエーター/アダプターライゲーション法を用いて、>95%の
ライゲーション効率を達成した。結果として、提案したメチルシークエンシング(Met
hylSeq)操作フローを用いた最終ライブラリーの収量は、既存の方法よりも高くな
るはずである。
【0091】
最終ステップにおいて、PCRを行ってライブラリーを増幅し、ライブラリーを固体支
持体から除去する。PCRプライマーは、シークエンシングアダプター等の追加の共通配
列を、MethylSeqライブラリーの末端に付加するようにデザインすることができ
る。
【0092】
単一アッセイにおける様々なサイズのライブラリーの調製
ゲノムのアセンブリの精度は、様々な長さスケールの技術の使用次第である。例えば、
ショットガン(数百bp)-メイトペア(~3Kb)から-Hi-C(Mbスケール)は
全て、アセンブリ及びコンティグ長を経時的に改良する方法である。課題は、これを行う
ために多重アッセイが必要であり、多層アプローチを扱い難く且つ費用が掛かるものとし
ていることである。本明細書に開示する組成物及び方法は、単一のアッセイで複数の長さ
スケールに対応することができる。
【0093】
いくつかの実施形態において、ライブラリー調製を、サイズの異なる固体支持体、例え
ば、ビーズを用いて単一アッセイで達成することができる。各ビーズのサイズは、ビーズ
の物理的サイズがライブラリーサイズを決定し、特定のライブラリーサイズ又はサイズ範
囲をもたらすことになる。様々なサイズのビーズは全て、ライブラリーに転移する固有の
クローンインデックスを有する。従って、様々なサイズのライブラリーが、固有にインデ
ックス付けされた異なる各ライブラリースケール長で生成される。様々な長さスケールの
ライブラリーを同じ物理的区画で同時に調製するため、コストが減り、操作フロー全体を
改善する。いくつかの実施形態において、各特定の固体支持体サイズ、例えば、ビーズサ
イズは、固有のインデックスを受け取る。いくつかの他の実施形態において、同じ固体支
持体サイズ、例えば、同じビーズサイズの複数の異なるインデックスもまた調製すること
で、複数のDNA分子をそのサイズ範囲に対してインデックス区分することができる。図
45は、単一アッセイで、様々なサイズのクローンインデックス付きビーズを用いて様々
なサイズのライブラリーを生成する例示的なスキームを示す。
【0094】
いくつかの実施形態において、生成されるライブラリーのサイズは、約50塩基、75
塩基、100塩基、150塩基、200塩基、250塩基、300塩基、350塩基、4
00塩基、500塩基、600塩基、700塩基、800塩基、900塩基、1000塩
基、1200塩基、1300塩基、1500塩基、2000塩基、3000塩基、350
0塩基、4000塩基、4500塩基、5000塩基、5500塩基、6000塩基、6
500塩基、7000塩基、7,500塩基、8000塩基、8500塩基、9000塩
基、9500塩基、10,000塩基、10,500塩基、11,000塩基、11,5
00塩基、12,000塩基、12,500塩基、13,000塩基、14,000塩基
、14,500塩基、15,000塩基、15,500塩基、16,000塩基、16,
500塩基、17,000塩基、17,500塩基、18,000塩基、18,500塩
基、19,000塩基、19,500塩基、20,000塩基、20,500塩基、21
,000塩基、21,500塩基、22,000塩基、22,500塩基、23,000
塩基、23,500塩基、24,000塩基、24,500塩基、25,000塩基、2
5,500塩基、26,000塩基、26,500塩基、27,000塩基、27,50
0塩基、28,000塩基、28,500塩基、29,500塩基、30,000塩基、
30,500塩基、31,000塩基、31,500塩基、32,000塩基、33,0
00塩基、34,000塩基、35,000塩基、36,000塩基、37,000塩基
、38,000塩基、39,000塩基、40,000塩基、42,000塩基、45,
000塩基、50,000塩基、55,000塩基、60,000塩基、65,000塩
基、70,000塩基、75,000塩基、80,000塩基、85,000塩基、90
,000塩基、95,000塩基、100,000塩基、110,000塩基、120,
000塩基、130,000塩基、140,000塩基、150,000塩基、160,
000塩基、170,000塩基、180,000塩基、200,000塩基、225,
000塩基、250,000塩基、300,000塩基、350,000塩基、400,
000塩基、450,000塩基、500,000塩基、550,000塩基、600,
000塩基、650,000塩基、700,000塩基、750,000塩基、800,
000塩基、850,000塩基、900,000塩基、1,000,000塩基、1,
250,000塩基、1,500,000塩基、2,000,000塩基、2,500,
000塩基、3,000,000塩基、4,000,000塩基、5,000,000塩
基、6,000,000塩基、7,000,000塩基、8,000,000塩基、9,
000,000塩基、10,000,000塩基、15,000,000塩基、20,0
00,000塩基、30,000,000塩基、40,000,000塩基、50,00
0,000塩基、75,000,000塩基、100,000,000塩基、又はそれ以
上である。
【0095】
いくつかの実施形態において、上述の複数の長さスケールのライブラリーを、1つの大
きな長さスケールを有する代わりに、疑似遺伝子、パラログ等のアセンブリに用いること
ができる。いくつかの実施形態において、複数の長さスケールのライブラリーを、単一ア
ッセイで同時に調製する。利点は、少なくとも1つの長さスケールが、疑似遺伝子又は遺
伝子のみを有し、両方は有さない固有領域に結合することである。従って、この長さスケ
ールで検出される変異は、遺伝子又は疑似遺伝子のどちらかに変異を一意的に決めること
ができる。同じことがコピー数の変異、パラログ等にも当てはまる。アセンブリの長所は
、異なる長さスケールの使用である。本明細書に開示する方法を用いることにより、異な
る長さスケールのインデックス付き結合ライブラリーを、異なる長さスケールのための個
々の異なるライブラリー調製を行わずに、単一のアッセイで生成することができる。図4
6は、異なる長さスケールのライブラリーで遺伝子変異を決定する例示的なスキームを示
す。
【0096】
遺伝子変異の分析
本明細書に開示する組成物及び方法は、遺伝子変異の分析に関する。例示的な遺伝子変
異としては、これに限定されないが、欠損、染色体間転位、重複、パラログ、染色体間遺
伝子融合が挙げられる。いくつかの実施形態において、本明細書に開示する組成物及び方
法は、遺伝子変異のフェージング情報の決定に関する。以下の表は、例示的な染色体間遺
伝子融合を示す。
【0097】
【表1】
【0098】
表2は、染色体1における例示的な欠損を示す。
【0099】
【表2】
【0100】
いくつかの実施形態において、標的核酸は、標的核酸をトランスポソームに曝す前にフ
ラグメント化することができる。例示的なフラグメント化法としては、これに限定されな
いが、超音波処理、機械的剪断、及び制限消化が挙げられる。タグメント化(フラグメン
ト化及びタグ化)前の標的核酸のフラグメント化は、疑似遺伝子(例えば、CYP2D6
)のアセンブリ/フェージングに有利である。インデックス付き結合リードの長い島(>
30kb)は、図64に示すように、疑似遺伝子A及びA’に及ぶであろう。高い配列相
同性のため、どの変異が遺伝子A及び遺伝子A’に属するのかを決定することが課題とな
るであろう。より短い変異は、固有の周囲配列で疑似遺伝子の1つの変異に結合するであ
ろう。そのようなより短い島は、タグメント化前に標的核酸をフラグメント化することに
より達成することができる。
【0101】
結合トランスポソーム
いくつかの実施形態において、トランスポザーゼは、トランスポソーム複合体中で多量
体であり、例えば、二量体、四量体等をトランスポソーム複合体中で形成する。本願の発
明者らは、驚くべきことに、且つ予想外にも、多量体トランスポソーム複合体中の単量体
トランスポザーゼを結合させること、又は多量体トランスポソーム複合体中のトランスポ
ソーム単量体のトランスポゾン末端を結合させることには、いくつかの利点があることを
見出した。1つ目としては、トランスポザーゼ又はトランスポゾンの結合は、より安定し
た複合体をもたらし、大きな画分が活性化状態にある。2つ目としては、より低い濃度の
トランスポソームを、転位反応によるフラグメント化において用いることができる可能性
がある。3つ目としては、結合により、トランスポソーム複合体のモザイク末端(ME)
の交換が少なくなり、それにより、バーコード又はアダプター分子の混合が少なくなる。
そのようなME末端の交換は、複合体がバラバラになり、再編成する場合、又は、トラン
スポソームがストレプトアビジン/ビオチンにより固体支持体上に固定化され、ストレプ
トアビジン/ビオチン相互作用が壊れて再編成する場合、又は、コンタミネーションの可
能性がある場合に、生じる可能性がある。本願の発明者らは、種々の反応条件下で、ME
末端の重大な交換(swap又はexchange)があることに気付いた。いくつかの
実施形態において、交換は、15%にまで達する可能性がある。交換は、高塩濃度バッフ
ァーで顕著であり、グルタミン酸バッファーでは低下する。図57及び58は、ME交換
のいくつかの考え得るメカニズムを示す。
【0102】
いくつかの実施形態において、トランスポソーム複合体中のトランスポザーゼのサブユ
ニットは、共有及び非共有手段により互いに結合させることができる。いくつかの実施形
態において、トランスポザーゼ単量体は、トランスポソーム複合体を形成する前に(トラ
ンスポゾンが加わる前に)結合させることができる。いくつかの実施形態において、トラ
ンスポザーゼ単量体は、トランスポソームの形成後に結合させることができる。
【0103】
いくつかの実施形態において、天然アミノ酸残基を多量体界面でシステイン(Cys)
アミノ酸で置換し、ジスルフィド結合の形成を促進していてもよい。例えば、Tn5トラ
ンスポザーゼにおいて、Asp468、Tyr407、Asp461、Lys459、S
er458、Gly462、Ala466、Met470をCysで置換して、単量体サ
ブユニット間のジスルフィド結合を促進していてもよい。図59及び60に示す。Mos
-1トランスポザーゼに関して、システインで置換することができる例示的なアミノ酸と
しては、これに限定されないが、Leu21、Leu32、Ala35、His20、P
he17、Phe36、Ile16、Thr13、Arg12、Gln10、Glu9が
挙げられる。図61に示す。いくつかの実施形態において、システインで置換されたアミ
ノ酸残基を有する修飾トランスポザーゼは、マレイミド又はピリジルジチオール反応基を
用いた化学架橋剤を用いて、互いに化学的に架橋させることができる。例示的な化学架橋
剤は、Pierce Protein Biology/ThermoFisher S
cientific社(米国ニューヨーク州グランドアイランド)から市販されている。
【0104】
いくつかの実施形態において、トランスポソーム多量体複合体は、固体支持体に共有結
合させることができる。例示的な固体支持体としては、これに限定されないが、ナノ粒子
、ビーズ、フローセル表面、カラムマトリックスが挙げられる。いくつかの実施形態にお
いて、固体表面は、アミン基で被覆されていてもよい。システインで置換されたアミノ酸
残基を有する修飾トランスポザーゼは、そのようなアミン基に対し、アミン-スルフヒド
リル架橋剤(即ち、スクシンイミジル-4-(N-マレイミドメチル)シクロヘキサン-
1-カルボキシレート(SMCC))を用いて、化学的に架橋させることができる。例示
的なスキームを図62に示す。いくつかの実施形態において、マレイミド-PEG-ビオ
チン架橋剤を用いて、dTnpをストレプトアビジン被覆固体表面に結合させてもよい。
【0105】
いくつかの実施形態において、トランスポザーゼ遺伝子は、単一のポリペプチドで多量
体タンパク質を発現するように、修飾することができる。例えば、Tn5又はMos-1
遺伝子は、単一のポリペプチドで、2つのTn5又はMos-1タンパク質を発現するよ
うに修飾することができる。同様に、Muトランスポザーゼ遺伝子は、単一のポリペプチ
ドで、4つのmuトランスポザーゼユニットをコードするように修飾することができる。
【0106】
いくつかの実施形態において、トランスポソーム単量体単位のトランスポゾン末端を結
合させて、結合トランスポソーム多量体複合体を形成することができる。トランスポゾン
末端を結合させることにより、プライマー部位を挿入することができ、シークエンシング
プライマー、増幅プライマー、又は任意のロール(role)DNAが、標的DNAをフ
ラグメント化することなくgDNAに働くことができる。そのような機能性の挿入は、情
報を無傷分子から抽出する必要があるか又はサブサンプリングが重要である、ハプロタイ
プアッセイ又は結合部タグ化アッセイにおいて、利点である。いくつかの実施形態におい
て、Muトランスポソームのトランスポゾン末端は、「ループ状の」Muトランスポザー
ゼ/トランスポゾン構造に結合させることができる。Muは四量体であるため、これに制
限されないが、R2UJ及び/又はR1UJをR2J及び/又はR1Jに結合させること
により、種々の構造が可能である。これらの構造において、R2UJ及びR1UJは、R
2J及びR1Jと、それぞれ結合することができる又は結合しない。図63は、トランス
ポゾン末端が結合したMuトランスポソーム複合体を示す。いくつかの実施形態において
、Tn5のトランスポゾン末端又はMos-1トランスポソームのトランスポゾン末端を
、結合させることができる。
【0107】
本明細書で用いる場合、用語「トランスポゾン」は、in vitro転位反応におい
て機能するトランスポザーゼ又はインテグラーゼ酵素と複合体を形成するのに必要なヌク
レオチド配列(「トランスポゾン末端配列」)のみを示す、二本鎖DNAを意味する。ト
ランスポゾンは、トランスポゾンを認識し、且つ結合するトランスポザーゼ又はインテグ
ラーゼとともに、「複合体」又は「シナプス複合体」又は「トランスポソーム複合体」又
は「トランスポソーム組成物」を形成する。複合体は、in vitro転位反応におい
て一緒にインキュベートする標的DNAに、トランスポゾンを挿入又は転位することが可
能である。トランスポゾンは、「転移トランスポゾン配列」すなわち「転移鎖」、及び「
非転移トランスポゾン配列」すなわち「非転移鎖」からなる2つの相補的配列を示す。例
えば、in vitro転位反応において活性がある機能亢進性Tn5トランスポザーゼ
(例えば、EZ-Tn5(商標)トランスポザーゼ、米国ウィスコンシン州マディソン、
EPICENTRE Biotechnologies社)とともに複合体を形成する1
つのトランスポゾンは、以下の「転移トランスポゾン配列」を示す転移鎖:
5’AGATGTGTATAAGAGACAG3’
及び以下の「非転移トランスポゾン配列」を示す非転移鎖:
5’CTGTCT CTTATACACATCT3’
を含む。
【0108】
転移鎖の3’末端は、in vitro転位反応において、標的DNAに結合又は転移
する。非転移鎖は、転移トランスポゾン末端配列に相補的なトランスポゾン配列を示し、
in vitro転位反応において、標的DNAに結合又は転移しない。いくつかの実施
形態において、トランスポゾン配列は、以下の配列うちの1つ又はそれ以上を含んでいて
もよい:バーコード、アダプター配列、タグ配列、プライマー結合配列、捕捉配列、固有
分子識別(UMI:unique molecular identifier)配列。
【0109】
本明細書で用いる場合、用語「アダプター」は、バーコード、プライマー結合配列、捕
捉配列、捕捉配列に相補的な配列、固有分子識別(UMI)配列、親和性部分、制限部位
を含むことができる核酸配列を意味する。
【0110】
本明細書で用いる場合、用語「連続性情報」は、共有情報に基づいた、2つ又はそれ以
上のDNAフラグメント間の空間的関係を指す。情報の共有態様は、隣接関係、区画関係
、及び距離空間関係に関するものとすることができる。これらの関係に関する情報は、順
に、DNAフラグメントに由来する配列リードの階層的なアセンブリ又はマッピングを容
易にする。この連続性情報は、そのようなアセンブリ又はマッピングの効率及び精度を改
善する。なぜなら、従来のショットガンシークエンシングと関連して用いられる伝統的な
アセンブリ又はマッピング法では、個々の配列リードが由来した2つ又はそれ以上のDN
Aフラグメントの空間的関係に関して、個々の配列リードの相対的なゲノム起源又は座標
を考慮に入れないからである。従って、本明細書に記載する実施形態によれば、連続性情
報を捕捉する方法を、隣接空間関係を決定する短距離連続性法、区画空間関係を決定する
中距離連続性法、又は距離空間関係を決定する長距離連続性法により行ってもよい。これ
らの方法は、DNA配列アセンブリ又はマッピングの精度及び質を高める。また、これら
の方法は、上述のシークエンシング法等の任意のシークエンシング法とともに用いてもよ
い。
【0111】
連続性情報は、個々の配列リードが由来した2つ又はそれ以上のDNAフラグメントの
空間的関係に関して、個々の配列リードの相対的なゲノム起源又は座標を含む。いくつか
の実施形態において、連続性情報は、非重複配列リードからの配列情報を含む。
【0112】
いくつかの実施形態において、標的核酸配列の連続性情報は、ハプロタイプ情報を示す
。いくつかの実施形態において、標的核酸配列の連続性情報は、ゲノム変異を示す。
【0113】
本明細書で用いる場合、用語「標的核酸の連続性の維持」は、核酸のフラグメント化と
の関連において、同じ標的核酸からのフラグメントの核酸配列の順番を維持することを意
味する。
【0114】
本明細書で用いる場合、用語「少なくとも一部」及び/又はその文法的等価物は、全量
のうちの任意の分量を指すことができる。例えば、「少なくとも一部」は、全量の少なく
とも約1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、15%、20
%、25%、30%、35%、40%、45%、50%、55%、60%、65%、70
%、75%、80%、85%、90%、95%、99%、99.9%、又は100%を指
すことができる。
【0115】
本明細書で用いる場合、用語「約」は、±10%を意味する。
【0116】
本明細書で用いる場合、用語「シークエンシングリード」及び/又はその文法的等価物
は、ポリマー中の単量体の順序を示すシグナルを得るために行われる物理的又は化学的ス
テップの繰り返し工程を指すことができる。シグナルは、単一の単量体解像度又はより低
い解像度で単量体の順序を示すことができる。特定の実施形態において、ステップを、核
酸標的に対して開始し、核酸標的中の塩基の順序を示すシグナルを得るために行うことが
できる。工程は、典型的な完了まで行うことができ、典型的な完了とは、通常、工程から
のシグナルが、合理的なレベルの確実性で、標的の塩基をそれ以上区別することができな
い時点までと定義される。所望する場合、例えば、所望の配列情報量が得られるまで等、
より早く完了することができる。シークエンシングリードは、単一の標的核酸分子に対し
て、又は同じ配列を有する標的核酸分子群に対して同時に、又は異なる配列を有する標的
核酸群に対して同時に行うことができる。いくつかの実施形態において、シークエンシン
グリードは、シグナルが、シグナル取得が開始された1つ又はそれ以上の標的核酸分子か
らそれ以上は得られない時点で、終了する。例えば、シークエンシングリードは、固相基
質上に存在する1つ又はそれ以上の標的核酸分子に対して開始し、1つ又はそれ以上の標
的核酸分子を基質から除去した時点で終了させることができる。或いは、シークエンシン
グは、シークエンシングランを開始した時に基質上に存在していた標的核酸の検出を中止
することにより、終了することができる。例示的なシークエンシング方法は、その全体が
参照により本明細書に組み込まれる、米国特許第9,029,103号明細書に記載され
ている。
【0117】
本明細書で用いる場合、用語「シークエンシング表示」及び/又はその文法的等価物は
、ポリマー中の単量体単位の順序及び種類を示す情報を指すことができる。例えば、情報
は、核酸中のヌクレオチドの順序及び種類を示すことができる。情報は、例えば、描写、
画像、電子メディア、一連の記号、一連の数字、一連の文字、一連の色等を含む、任意の
種々の形式であってよい。情報は、単一の単量体解像度又はより低い解像度であってもよ
い。例示的なポリマーは、ヌクレオチド単位を有するDNA又はRNA等の核酸である。
一連の「A」、「T」、「G」、及び「C」文字は、単一のヌクレオチド解像度でDNA
分子の実際の配列と相関性があるDNAに対する周知の配列表示である。その他の例示的
なポリマーは、アミノ酸単位を有するタンパク質、及び糖単位を有する多糖類である。
【0118】
固体支持体
本明細書全体を通じて、固体支持体及び固体表面は、交換可能に用いられる。いくつか
の実施形態において、固体支持体又はその表面は、管又は容器の内表面又は外表面等、非
平面である。いくつかの実施形態において、固体支持体は、ミクロスフェア又はビーズを
含む。本明細書において、「ミクロスフェア」又は「ビーズ」又は「粒子」又はその文法
的等価物は、小さな分散粒子を意味する。適切なビーズ組成物としては、これに限定され
ないが、プラスチック、セラミック、ガラス、ポリスチレン、メチルスチレン、アクリル
ポリマー、常磁性物質、トリアゾル(thoria sol)、カーボングラファイト、
二酸化チタン、ラテックス、又は、セファロース等の架橋デキストラン、セルロース、ナ
イロン、架橋ミセル、及びテフロンが挙げられ、同様に、固形支持体として本明細書で概
説する任意の他の材料を全て使用することができる。Bangs Laboratori
es社(インディアナ州フィッシャーズ)の「ミクロスフェア検出ガイド(Micros
phere Detection Guide)」は、役立つガイドである。特定の実施
態様において、ミクロスフェアは、磁性ミクロスフェア又はビーズである。いくつかの実
施形態において、ビーズは、色分けされていてもよい。例えば、Luminex社(テキ
サス州オースティン)のMicroPlex(登録商標)ミクロスフェアを用いてもよい
【0119】
ビーズは球状である必要はなく、不規則粒子を用いてもよい。代わりに又は加えて、ビ
ーズは多孔質であってもよい。ビーズのサイズは、直径で、ナノメートル即ち約10nm
から、ミリメートル即ち1mmに及び、約0.2ミクロン~約200ミクロンのビーズが
好ましく、約0.5~約5ミクロンのビーズが特に好ましいが、いくつかの実施態様にお
いて、より小さい又はより大きいビーズを用いてもよい。いくつかの実施態様において、
ビーズは、直径が約0.1μm、0.2μm、0.3μm、0.4μm、0.5μm、0
.6μm、0.7μm、0.8μm、0.9μm、1μm、1.5μm、2μm、2.5
μm、2.8μm、3μm、3.5μm、4μm、4.5μm、5μm、5.5μm、6
μm、6.5μm、7μm、7.5μm、8μm、8.5μm、9μm、9.5μm、1
0μm、10.5μm、15μm、20μm、25μm、30μm、35μm、40μm
、45μm、50μm、55μm、60μm、65μm、70μm、75μm、80μm
、85μm、90μm、95μm、100μm、150μm、又は200μmであっても
よい。
【0120】
トランスポソーム
「トランスポソーム」は、インテグラーゼ又はトランスポザーゼ等の組み込み(インテ
グレーション)酵素、及びトランスポザーゼ認識部位等の組み込み認識部位を含む核酸を
含む。本明細書で提供する実施形態において、トランスポザーゼは、転位反応を触媒する
ことが可能なトランスポザーゼ認識部位とともに機能的複合体を形成することができる。
トランスポザーゼは、「タグメント化」と称することもある工程において、トランスポザ
ーゼ認識部位に結合し、トランスポザーゼ認識部位を標的核酸に挿入する可能性がある。
いくつかのそのような組み込み事象において、トランスポザーゼ認識部位の1つの鎖が、
標的核酸に転移してもよい。1つの例において、トランスポソームは、2つのサブユニッ
トを含む二量体トランスポザーゼ、及び2つの非連続トランスポゾン配列を含む。別の例
において、トランスポソームは、2つのサブユニットを含む二量体トランスポザーゼを含
むトランスポザーゼ、及び連続トランスポゾン配列を含む。
【0121】
いくつかの実施形態は、機能亢進性Tn5トランスポザーゼ及びTn5型トランスポザ
ーゼ認識部位(Goryshin and Reznikoff,J.Biol.Che
m.,273:7367(1998))、又は、MuAトランスポザーゼ、及びR1及び
R2末端配列を含むMuトランスポザーゼ認識部位(Mizuuchi,K.,Cell
,35:785,1983;Savilahti,H,etal.,EMBOJ.,14
:4893,1995)の使用を含めることができる。機能亢進性Tn5トランスポザー
ゼと複合体を形成する例示的なトランスポザーゼ認識部位(例えば、EZ-Tn5(商標
)トランスポザーゼ、ウィスコンシン州マディソン、Epicentre Biotec
hnologies社)は、以下の19塩基の転移鎖(時に、「M」又は「ME」)及び
非転移鎖:それぞれ、5′AGATGTGTATAAGAGACAG3′、5′CTGT
CTCTTATACACATCT3′を含む。ME配列はまた、当業者により最適化され
て、使用されてもよい。
【0122】
本明細書で提供する組成物及び方法の特定の実施形態とともに使用することができる転
位システムの更なる例としては、黄色ブドウ球菌(Staphylococcus au
reus)Tn552(Colegio et al.,J.Bacteriol.,1
83:2384-8,2001;Kirby C et al.,Mol.Microb
iol.,43:173-86,2002)、Ty1(Devine&Boeke,Nu
cleic Acids Res.,22:3765-72,1994、及び国際公開第
95/23875号)、トランスポゾンTn7(Craig,N L,Science.
271:1512,1996;Craig,N L,Review in:Curr T
op Microbiol Immunol.,204:27-48,1996)、Tn
/O及びIS10(Kleckner N,et al.,Curr Top Micr
obiol Immunol.,204:49-82,1996)、マリナートランスポ
ザーゼ(Lampe D J,et al.,EMBO J.,15:5470-9,1
996)、Tc1(Plasterk R H,Curr.Topics Microb
iol.Immunol.,204:125-43,1996)、Pエレメント(Glo
or,G B,Methods Mol.Biol.,260:97-114,2004
)、Tn3(Ichikawa & Ohtsubo,J Biol.Chem.265
:18829-32,1990)、細菌挿入配列(Ohtsubo&Sekine,Cu
rr.Top.Microbiol.Immunol.204:1-26,1996)、
レトロウイルス(Brown,et al.,Proc Natl Acad Sci
USA,86:2525-9,1989)、及び酵母のレトロトランスポゾン(Boek
e&Corces,Annu Rev Microbiol.43:403-34,19
89)が挙げられる。更なる例としては、IS5、Tn10、Tn903、IS911、
カタバミ(Sleeping Beauty)、SPINhAT、ピギーバック(Pi
ggyBac)、ハーミス(Hermes)、Tcバスター(TcBuster)、Ae
バスター1(AeBuster1)、Tol2、及び改変型トランスポザーゼファミリー
酵素(Zhang et al.,(2009)PLoS Genet.5:e1000
689.Epub 2009 Oct 16;Wilson C.et al(2007
)J.Microbiol.Methods 71:332-5)が挙げられる。
【0123】
本明細書で提供する方法及び組成物とともに使用することができるインテグラーゼの更
なる例としては、レトロウイルスインテグラーゼ、及びレトロウイルスインテグラーゼに
対するインテグラーゼ認識配列が挙げられ、例えば、HIV-1、HIV-2、SIV、
PFV-1、RSVのインテグラーゼが挙げられる。
【0124】
バーコード
一般に、バーコードは、1つ又はそれ以上の特定の核酸を同定するために使用すること
ができる1つ又はそれ以上のヌクレオチド配列を含むことができる。バーコードは、人工
配列であってもよく、或いは、転位の際に生成する自然発生配列、例えば、以前に並置さ
れたDNAフラグメントの末端にある同一のフランキングゲノムDNA配列(gコード)
等であってもよい。いくつかの実施形態において、バーコードは、標的核酸配列にはない
人工配列であり、1つ又はそれ以上の標的核酸配列を同定するのに用いることができる。
【0125】
バーコードは、少なくとも約1個、2個、3個、4個、5個、6個、7個、8個、9個
、10個、11個、12個、13個、14個、15個、16個、17個、18個、19個
、20個、又はそれ以上の連続したヌクレオチドを含んでいてもよい。いくつかの実施形
態において、バーコードは、少なくとも約10個、20個、30個、40個、50個、6
0個、70個、80個、90個、100個、又はそれ以上の連続したヌクレオチドを含む
。いくつかの実施形態において、バーコードを含む核酸群におけるバーコードの少なくと
も一部は、異なっている。いくつかの実施形態において、バーコードの少なくとも約10
%、20%、30%、40%、50%、60%、70%、80%、90%、95%、99
%が、異なっている。更なるそのような実施形態において、バーコードの全てが異なって
いる。バーコードを含む核酸群において、異なるバーコードの多様性は、ランダムに又は
非ランダムに生成することができる。
【0126】
いくつかの実施形態において、トランスポゾン配列は、少なくとも1つのバーコードを
含む。2つの非連続トランスポゾン配列を含むトランスポソーム等、いくつかの実施形態
において、第1のトランスポゾン配列は、第1のバーコードを含み、第2のトランスポゾ
ン配列は、第2のバーコードを含む。いくつかの実施形態において、トランスポゾン配列
は、第1のバーコード配列及び第2のバーコード配列を含むバーコードを含む。前述の実
施形態のいくつかにおいて、第1のバーコード配列は、第2のバーコード配列とペアにな
るように同定又は設計することができる。例えば、互いにペアとなることが知られている
複数の第1及び第2のバーコード配列を含む参照表を用いて、既知の第1のバーコード配
列が既知の第2のバーコード配列とペアになることを知ることができる。
【0127】
別の例において、第1のバーコード配列は、第2のバーコード配列と同じ配列を含んで
いてもよい。別の例において、第1のバーコード配列は、第2のバーコード配列の逆相補
配列を含んでいてもよい。いくつかの実施形態において、第1のバーコード配列及び第2
のバーコード配列は、異なる。第1及び第2のバーコード配列は、バイコード(bi-c
ode)を含んでいてもよい。
【0128】
本明細書に記載する組成物及び方法のいくつかの実施形態において、バーコードは、鋳
型核酸の調製に用いる。当然のことながら、膨大な数の利用可能なバーコードにより、各
鋳型核酸分子は、固有の識別を含むことができる。鋳型核酸の混合物における各分子の固
有の識別は、いくつかの用途に用いることができる。例えば、固有に識別された分子は、
例えば、ハプロタイプシークエンシング、親対立遺伝子の識別、メタゲノムシークエンシ
ング、及びゲノムのサンプルシークエンシングにおいて、複数の染色体を有するサンプル
、ゲノム、細胞、細胞型、細胞の病状、及び種における、個々の核酸分子の同定に応用す
ることができる。
【0129】
例示的なバーコード配列としては、これに限定されないが、TATAGCCT、ATA
GAGGC、CCTATCCT、GGCTCTGA、AGGCGAAG、TAATCTT
A、CAGGACGT、及びGTACTGACが挙げられる。
【0130】
プライマー部位
いくつかの実施形態において、トランスポゾン配列は、「シークエンシングアダプター
」又は「シークエンシングアダプター部位」、言い換えれば、プライマーにハイブリダイ
ズすることができる1つ又はそれ以上の部位を含む領域を含むことができる。いくつかの
実施形態において、トランスポゾン配列は、増幅及びシークエンシング等に有用な少なく
とも第1のプライマー部位を含むことができる。配列結合部位の例示的な配列としては、
これに限定されないが、AATGATACGGCGACCACCGAGATCTACAC
(P5配列)及びCAAGCAGAAGACGGCATACGAGAT(P7配列)が挙
げられる。
【0131】
標的核酸
標的核酸としては、任意の目的の核酸を挙げることができる。標的核酸としては、DN
A、RNA、ペプチド核酸、モルフォリノ核酸、ロックド核酸、グリコール核酸、トレオ
ース核酸、核酸の混合サンプル、倍数性DNA(即ち、植物DNA)、これらの混合物、
及びこれらのハイブリッドを挙げることができる。好ましい実施形態において、ゲノムD
NA又はその増幅コピーを、標的核酸として用いる。別の好ましい実施形態において、c
DNA、ミトコンドリアDNA、又は葉緑体DNAを用いる。いくつかの実施形態におい
て、標的核酸は、mRNAである。
【0132】
いくつかの実施形態において、標的核酸は、単一の細胞由来、又は単一の細胞の画分由
来である。いくつかの実施形態において、標的核酸は、単一の細胞小器官由来である。例
示的な単一の細胞小器官としては、これに限定されないが、単一の核、単一のミトコンド
リア、及び単一のリボソームが挙げられる。いくつかの実施形態において、標的核酸は、
ホルマリン固定パラフィン包埋(FFPE)サンプルに由来する。いくつかの実施形態に
おいて、標的核酸は、架橋核酸である。いくつかの実施形態において、標的核酸は、タン
パク質と架橋する。いくつかの実施形態において、標的核酸は、架橋DNAである。いく
つかの実施形態において、標的核酸は、ヒストンに保護されたDNAである。いくつかの
実施形態において、ヒストンは、標的核酸から除去される。いくつかの実施形態において
、標的核酸は、ヌクレオソーム由来である。いくつかの実施形態において、標的核酸は、
核タンパク質が除去されたヌクレオソーム由来である。
【0133】
標的核酸は、任意のヌクレオチド配列を含むことができる。いくつかの実施形態におい
て、標的核酸は、ホモポリマー配列を含む。標的核酸はまた、繰り返し配列を含むことが
できる。繰り返し配列は、例えば、2ヌクレオチド、5ヌクレオチド、10ヌクレオチド
、20ヌクレオチド、30ヌクレオチド、40ヌクレオチド、50ヌクレオチド、100
ヌクレオチド、250ヌクレオチド、500ヌクレオチド、1000ヌクレオチド、又は
それ以上を含めた任意の種々の長さとすることができる。繰り返し配列は、連続又は非連
続して、例えば、2回、3回、4回、5回、6回、7回、8回、9回、10回、15回、
20回、又はそれ以上を含めた、任意の種々の回数の繰り返しとすることができる。
【0134】
本明細書に記載するいくつかの実施形態は、単一の標的核酸を使用することができる。
他の実施形態は、複数の標的核酸を使用することができる。そのような実施形態において
、複数の標的核酸としては、複数の同じ標的核酸、いくつかの標的核酸は同じである複数
の異なる標的核酸、又は全ての標的核酸が異なる複数の標的核酸を挙げることができる。
複数の標的核酸を使用する実施形態は、例えば、1つ又はそれ以上のチャンバー又はアレ
イ表面で試薬が標的核酸に同時に送られるように、多重型式で行うことができる。いくつ
かの実施形態において、複数の標的核酸としては、実質的に全ての特定の生命体のゲノム
を挙げることができる。複数の標的核酸としては、例えば、ゲノムの少なくとも約1%、
5%、10%、25%、50%、75%、80%、85%、90%、95%,又は99%
を含めた、特定の生命体のゲノムの少なくとも一部を挙げることができる。特定の実施形
態において、当該一部は、ゲノムの最大で約1%、5%、10%、25%、50%、75
%、80%、85%、90%、95%,又は99%である上限を有することができる。
【0135】
標的核酸は、あらゆる供給源から得ることができる。例えば、標的核酸は、単一の生命
体から得られる核酸分子、又は1つ又はそれ以上の生命体を含む自然源から得られる核酸
分子群から調製してもよい。核酸分子の供給源としては、これに限定されないが、細胞小
器官、細胞、組織、臓器、又は生命体が挙げられる。標的核酸分子の供給源として用いら
れてもよい細胞は、原核細胞(バクテリア細胞、例えば、大腸菌(Escherichi
a)、バチルス(Bacillus)、セラチア(Serratia)、サルモネア(S
almonella)、ブドウ球菌(Staphylococcus)、連鎖球菌(St
reptococcus)、クロストリジウム(Clostridium)、クラミジア
(Chlamydia)、ナイセリア(Neisseria)、トレポネーマ(Trep
onema)、マイコプラズマ(Mycoplasma)、ボレリア(Borrelia
)、レジオネラ(Legionella)、シュードモナス(Pseudomonas)
、マイコバクテリウム(Mycobacterium)、ヘリコバクター(Helico
bacter)、エルウィニア(Erwinia)、アグロバクテリウム(Agroba
cterium)、根粒菌(Rhizobium)、及びStreptomyces g
enera);クレン古細菌門(crenarchaeota)、ナノ古細菌門(nan
oarchaeota)、又はユリ古細菌門(euryarchaeotia)等の古細
菌細胞;又は真菌(例えば、酵母)、植物、原生動物や他の寄生生物、及び動物(昆虫(
例えば、ショウジョウバエ(Drosophila spp.)、線形動物(例えば、線
虫(Caenorhabditis elegans)、及び哺乳動物(例えば、ラット
、マウス、サル、非ヒト霊長類、及びヒト)を含む)等の真核細胞であってもよい。標的
核酸及び鋳型核酸は、当該技術分野でよく知られている種々の方法を用いて、目的とする
特定の配列を濃縮することができる。そのような方法の例は、その全体が参照により本明
細書に組み込まれる国際公開第2012/108864号において提供されている。いく
つかの実施形態において、核酸は、鋳型ライブラリーの調製方法の間に、さらに濃縮させ
てもよい。例えば、核酸は、トランスポソームの挿入前、トランスポソームの挿入後、及
び/又は核酸の増幅後に、特定の配列について濃縮させてもよい。
【0136】
また、いくつかの実施形態において、標的核酸及び/又は鋳型核酸は、高度に精製する
ことができ、例えば、核酸は、本明細書で提供する方法で用いる前に、混入物を少なくと
も約70%、80%、90%、95%、96%、97%、98%、99%、又は100%
含まないものとすることができる。いくつかの実施形態において、当該技術分野で知られ
ている標的核酸の質及びサイズを維持する方法を用いることは有益であり、例えば、標的
DNAの単離及び/又は直接転位を、アガロースプラグを用いて行ってもよい。転位はま
た、細胞群、ライセート、及び未精製DNAを用いて、細胞で直接行うことができる。
【0137】
いくつかの実施形態において、標的核酸は、生体サンプル又は患者サンプルから得ても
よい。本明細書で用いる場合、用語「生体サンプル」又は「患者サンプル」は、組織及び
体液等のサンプルを含む。「体液」としては、これに限定されないが、血液、血清、血漿
、唾液、脳脊髄液、胸膜液、涙液、乳管液(lactal duct fluid)、リ
ンパ液、喀痰、尿、羊水、及び精液が挙げられる。サンプルは、「無細胞」である体液を
含んでいてもよい。「無細胞体液」は、約1%(質量/質量)未満の全細胞物質を含む。
血漿又は血清は、無細胞体液の例である。サンプルは、天然又は合成由来(即ち、無細胞
となるように調製された細胞サンプル)の標本を含んでいてもよい。
【0138】
上記に開示した方法のいくつかの実施形態において、標的核酸は、標的核酸をトランス
ポソームに曝す前に、(例えば、超音波処理、制限消化、他の機械的手段により)フラグ
メント化することができる。
【0139】
本明細書で用いる場合、用語「血漿」は、血液で見られる無細胞液体を指す。「血漿」
は、当技術分野で知られている方法(例えば、遠心分離及びろ過等)により、血液から全
細胞物質を除去することにより、血液から得てもよい。
【0140】
特段の定めがない限り、用語「a」又は「an」は、本明細書全体を通じて、「1つ又
はそれ以上」を意味する。
【0141】
用語「例えば(for example)」、「例えば(e.g.)」、「等(suc
h as)」、「含む(include)」、「含めて(including)」、又は
それらの変形が本明細書で用いられる場合、これらの用語は、限定の用語であるとは見な
されないものであり、「これに限定されるものではないが」又は「限定されずに」を意味
すると解釈されるものである。
【0142】
以下の実施例は、説明のための実施例を提供するものであり、決して本明細書で提供す
る発明を制限するものではない。
【実施例
【0143】
実施例1 ビーズベースタグメント化工程からのDNAクラスターの収量
図3のビーズベースタグメント化工程からのDNAクラスターの収量を評価し、図4
表に示した。本実施例において、50ng、250ng、1000ngのヒトNA128
78 DNAを、同じバッチのタグメント化ビーズ(2.8μmビーズ)を用いてタグメ
ント化した。第2の50ng分量のNA12878 DNAを、第2のバッチのタグメン
ト化ビーズ(完全リピート:2.8μmビーズ)を用いてタグメント化した。ビーズ結合
タグメント化DNAサンプルをPCR増幅し、精製した。一定分量(5.4μL)の各精
製PCR産物(未定量)を270倍希釈し、約50pMのストックサンプル溶液を作製し
た。各サンプルに対し、50pMストック溶液を15pM、19pM、21pM、及び2
4pMに希釈した。希釈したサンプルを、クラスター生成及びシークエンシングのために
フローセルにロードした。データによれば、同じ希釈液(~50pM)から始めて、クラ
スター数は、同じセットのビーズを用いた3つの異なるインプットレベル(即ち、50n
g、250ng、1000ng)に対して、100~114%の間であることが分かる。
50ng完全リピートでのクラスター数(異なるバッチのビーズを用いた)は、81%で
あった。異なる希釈液(15pM、19pM、21pM、及び24pM)は、約10%以
内の同数のクラスターを産生する。データによれば、ビーズが収量を大きく制御し、収量
は、異なるDNAインプット及び異なるリピートで再現性があることが分かる。
【0144】
実施例2 ビーズベースタグメント化工程の再現性
図3のビーズベースタグメント化工程の再現性を図5に示す。本実施例において、「同
じ」トランスポソーム密度で作製した6種類の異なるインデックス付きビーズ(インデッ
クス1~6;2.8μmビーズ)調製物を、50ng及び500ngのインプットNA1
2878 DNAを用いたタグメント化DNAの調製に用いた。タグメント化DNAをP
CR増幅し、精製した。2つのHiSeqレーン用に、12種類の精製PCR産物をプー
ルして、6種類ずつの2つの混合物(プール1及びプール2)にした。各プールは、1レ
ーン当たり3~50ng及び3~500ngのサンプルを含む。データ表500は、各イ
ンデックス付きサンプルの挿入サイズ中央値及び挿入サイズ平均値を示す。
【0145】
実施例3 プール1の挿入サイズ及びプール2の挿入サイズ
図5のインデックス付きサンプルのプール1の挿入サイズ及びプール2の挿入サイズを
、それぞれ図6A(プロット600)及び図6B(プロット650)に示す。データはま
た、挿入サイズが、6種類の異なるインデックス付きビーズ調製物の間で均一であること
を示す。ビーズベースタグメント化は、挿入サイズ及びDNA収量を制御するメカニズム
をもたらす。
【0146】
実施例4 リードの合計数の再現性
図5に記載の実験に関して、リードの合計数及びアラインされたリードの割合の再現性
図7(棒グラフ700)に示す。両方のインプット(50ng及び500ng)で、リ
ードの合計数は、同じインデックス付きビーズ調製物に対して同様である。6種類のイン
デックス付きビーズ調製物のうちの4種類(インデックス1、2、3、及び6)で、極め
て近い収量を示し、インデックス付きビーズ調製物4及び5では、インデックス配列によ
るものである可能性がある、幾分のばらつきが見られた。
【0147】
1つの応用において、ビーズベースタグメント化工程は、タグメント化ステップを含む
エクソーム濃縮アッセイ、例えば、Illumina社のNextera(登録商標)急
速捕捉濃縮プロトコルに用いてもよい。現在のエクソーム濃縮アッセイ(即ち、Illu
mina社のNextera(登録商標)急速捕捉濃縮プロトコル)では、溶液ベースの
タグメント化(Nextera)をゲノムDNAのフラグメント化に用いる。その後、遺
伝子特異的プライマーを用いて、目的とする特異的遺伝子フラグメントをプルダウンする
。2回の濃縮サイクルを行った後、プルダウンしたフラグメントをPCR及びシークエン
シングにより濃縮する。
【0148】
エクソーム濃縮アッセイにおけるビーズベースタグメント化工程の使用を評価するため
、ヒトNA12878 DNAを、25ng、50ng、100ng、150ng、20
0ng、及び500ngのインプットDNAを用いてタグメント化した。コントロールラ
イブラリー(NA00536)を、標準プロトコルに従って、50ngのインプットDN
Aから調製した。各DNAインプットは、異なるインデックス(固有識別子)を有した。
標準方法に合わせるため、且つ、十分な量のフラグメントがプルダウン用に存在すること
を確実にするために、濃縮ポリメラーゼマスターミックス(EPM:enhanced
polymerase mastermix)を用いた10サイクルのPCRを行った。
増幅プロトコルは、72℃で3分、98℃で30秒、続いて98℃で10秒を10サイク
ル、65℃で30秒、及び72℃で1分とした。その後、サンプルを10℃で保持した。
次に、サンプルを、エクソーム濃縮プルダウン工程及びシークエンシングを通じて処理し
た。
【0149】
実施例5 エクソーム濃縮アッセイにおけるコントロールライブラリー及びビーズベース
タグメント化ライブラリーの挿入サイズ
図8A、8B、及び8Cは、それぞれ、エクソーム濃縮アッセイにおける、コントロー
ルライブラリーでの挿入サイズのプロット800、ビーズベースタグメント化ライブラリ
ーでの挿入サイズのプロット820、及びサマリーデータ表840を示す。データによれ
ば、ビーズベースタグメント化ライブラリーは、コントロールライブラリーに比べて、広
い挿入サイズ分布を有するが、挿入サイズは、サンプルのDNAインプットに関係なく極
めて近いことが分かる。
【0150】
実施例6 リード配列の質
図9A、9B、及び9Cは、それぞれ、図8A、8B、及び8Cのエクソーム濃縮アッ
セイにおける、フィルターを通過した複製物(dups PF:duplicates
passing filters)の割合の棒グラフ900、PCT selected
basesの棒グラフ920、及びPCT usable bases on tar
getの棒グラフ940を示す。図9Aを参照すると、dups PFの割合(%)は、
いくつのリードがフローセルの他の部分で複製されているかを示す尺度である。この数値
は、全てのクラスターが結果に対して有益なデータをもたらすことを確実にするためには
、理想的には、(ここで示すように)低くなるものである。
【0151】
図9Bは、PCT selected basesを示し、濃縮工程の間に濃縮されて
いたはずの目的の部位に又はその近くに配列するリードの割合の尺度である。理想的には
、この数値は、濃縮工程の成功を反映して1に近くなるものである。また、この数値は、
濃縮されるべきではないリードが工程を終えていないことを示す。
【0152】
図9Cは、PCT usable bases on targetを示し、濃縮され
た領域内で目的とする特定の塩基上に実際に配列しているリードの割合の尺度である。理
想的には、全ての濃縮リードが濃縮されたリード内の目的とする塩基上に配列するもので
あるが、タグメント化のランダム性及び様々な挿入長さのために、目的とする領域上で配
列し終えていないリードが濃縮される可能性がある。
【0153】
2つの技術を使用して挿入サイズ分布を最適化してもよい。一例を挙げれば、SPRI
クリーンアップを用いて小さ過ぎる又は大き過ぎるフラグメントを除去してもよい。SP
RIクリーンアップは、サイズ及び所望の沈澱又は非沈澱DNAの保持(即ち、第1ステ
ップは、所望のサイズよりも大きいDNAのみを沈澱させ、可溶な小さいフラグメントを
保持する)に基づいた選択的DNA沈澱により、所望のサイズよりも大きい又は小さいフ
ラグメントを除去する工程である。その後、小さいフラグメントをさらに沈澱させ、この
時、望まない極めて小さいフラグメント(まだ溶液中にある)を除去し、沈澱したDNA
を保持し、洗浄した後、再可溶化して所望のサイズ範囲のDNAを得る。別の例を挙げれ
ば、ビーズ表面上の活性化トランスポソームのスペーシングを用いて、挿入サイズ分布を
制御してもよい。例えば、ビーズ表面上のギャップを不活性トランスポソーム(例えば、
不活性トランスポゾンを有するトランスポソーム)で充填してもよい。
【0154】
ビーズベースのタグメント化工程の連続性を評価した。表3は、インデックスを共有す
る1000bpウィンドウ内で0回、1回、2回、又は3回のリードが起きた回数を示す
。ビーズを9種類の異なるインデックス付きトランスポソームで生成し、少量のヒトDN
Aのタグメント化に用いた。リードを生成させ、アラインし、同じインデックスを共有す
る1000bp又は10Kbウィンドウ内のリードの数について分析した。インデックス
を共有する小さいウィンドウ内のリードの中には、偶然生成するものがあってもよく、こ
れが何回起こる可能性があるかという予測を、表3及び表4の「ランダム」列に示す。「
ビーズ」列の数は、インデックスを共有する1000bp(表3)又は10Kp(表4)
ウィンドウの実際の数を示す。表3及び表4に示すように、同じインデックスが1000
bp又は10Kpウィンドウ内で見つかった実際の回数は、ランダムケースでの予測より
も顕著に多い。「0」枠は、特定の1000bpウィンドウがそれにマッピングするイン
デックスリードを有さない全ての回数を示す。数値は、極少量のヒトゲノムのみがシーク
エンシングされ、大半のウィンドウがそれらにアラインされるリードを有さないため、こ
こでは最も大きい。「1」は、ただ1つのリードが1000bp(又は10Kp)ウィン
ドウにマップする回数であり、「2」は、1000bp(又は10Kp)ウィンドウ内で
2つのリードがインデックスを共有する回数である、等である。このデータは、1400
超のケースにおいて、同じピースのDNA(10Kp超)が、約15000回のタグメン
ト化事象の中で、同じビーズにより、少なくとも2回から5回までタグメント化されてい
ることを示唆している。フラグメントは、インデックスを共有しているため、それらが偶
然にそこに存在する可能性は低く、同じビーズに由来している。
【0155】
【表3】
【0156】
表4は、インデックスを共有する10Kpウィンドウ内のリード数(5個まで)を示す
【0157】
【表4】
【0158】
実施例7 CPT-DNAからの遊離トランスポソームの分離
転位の後、CPT-DNA及び遊離トランスポソームを含む反応混合物を、Sepha
cryl S-400及びSephacryl S-200サイズ排除クロマトグラフィ
ーを用いたカラムクロマトグラフィーにかけた。図22に示す。CPT-DNAは、NC
P DNAと表示する。
【0159】
実施例8 ビーズ上の捕捉プローブ密度の最適化
捕捉プローブA7及びB7の密度を、1μmビーズ上で最適化し、結果を図25に示し
た。レーン1(A7)及びレーン3(B7)は、高いプローブ密度を有し、レーン2(A
7)及びレーン4(B7)は、1umビーズ当たり推定10,000~100,000の
プローブ密度を有した。標的分子に対する捕捉プローブのライゲーション産物を、アガロ
ースゲルで評価した。ビーズ当たり約10,000~100,000のプローブ密度は、
より高いプローブ密度よりも良好なライゲーション効率を有した。
【0160】
実施例9 分子内ハイブリダイゼーションによるビーズ上でのCPT-DNAのインデッ
クス付きシークエンシングライブラリーの調製の実現性試験
トランスポソームを、ビーズ上のA7及びB7捕捉配列に相補的なA7’及びB7’捕
捉配列を有するトランスポゾンと機能亢進性Tn5トランスポザーゼとを混合することに
より、調製した。高分子量ゲノムDNAをトランスポソームと混合し、CPT-DNAを
生成する。それとは別に、ビーズを、固定化オリゴヌクレオチド:P5-A7、P7-B
7、又はP5-A7+P7-B7で調製する。ここで、P5及びP7は、プライマー結合
配列であり、A7及びB7は、それぞれA7’及びB7’配列に相補的な捕捉配列である
。P5-A7単独、P7-B7単独、P5-A7+P7-B7、又はP5-A7ビーズ及
びP7-B7ビーズの混合物を含むビーズを、CPT-DNAで処理し、反応混合物にリ
ガーゼを添加して、固定化オリゴの転位DNAに対するハイブリダイゼーションの効率を
決定した。結果を図26に示す。シークエンシングライブラリーは、アガロースゲル上で
高分子量バンドにより示されるように、P5-A7及びP7-B7がともに1つのビーズ
上に固定化されている場合(レーン4)のみで作製される。結果は、高効率の分子内ハイ
ブリダイゼーションを示し、また、分子内ハイブリダイゼーションによるビーズ上でのC
PT-DNAのインデックス付きシークエンシングライブラリーの調製の実現性を証明し
た。
【0161】
実施例10 クローンインデックス化の実現性試験
いくつかのトランスポソームセットを調製した。1つのセットにおいて、機能亢進性T
n5トランスポザーゼを、5’ビオチンを有するトランスポゾン配列Tnp1と混合し、
トランスポソーム1を調製する。別のセットにおいて、5’ビオチンを有する固有インデ
ックス2を有するTnp2で、トランスポソーム2を調製する。別のセットにおいて、ト
ランスポソーム3の調製のため、機能亢進性Tn5トランスポザーゼを、5’ビオチンを
有するトランスポゾン配列Tnp3と混合する。別のセットにおいて、固有インデックス
4及び5’ビオチンを有するTnp4でトランスポソーム4を調製する。トランスポソー
ム1及び2、並びにトランスポソーム3及び4を、それぞれ別々にストレプトアビジンビ
ーズと混合し、ビーズセット1及びビーズセット2を生成する。次に、2つのセットのビ
ーズを混合し、ゲノムDNA及びタグメント化バッファーとともにインキュベートして、
ゲノムDNAのタグメント化を促進する。この後、タグメント化配列のPCR増幅を行う
。増幅したDNAをシークエンシングし、インデックス配列の挿入を分析する。タグメン
ト化がビーズに限定される場合、大多数のフラグメントは、Tnp1/Tnp2及びTn
p3/Tnp4インデックスでコードされることになる。分子内ハイブリダイゼーション
がある場合には、フラグメントは、Tnp1/Tnp4、Tnp2/Tnp3、Tnp1
/Tnp3、及びTnp2/Tnp4インデックスでコードされることになる。5サイク
ル及び10サイクルのPCR後のシークエンシング結果を図27に示した。コントロール
は、混合され、ビーズ上に固定化された、4種類全てのトランスポゾンを有する。結果は
、大多数の配列がTnp1/Tnp2又はTnp3/Tnp4インデックスを有すること
を示し、クローンインデックス化が実現可能であることを示している。コントロールは、
インデックスを区別しないことを示す。
【0162】
実施例11 単一反応におけるインデックス付きクローンビーズ転位
96種類のインデックス付きトランスポソームビーズを調製する。個々のインデックス
付きトランスポソームは、5’末端のTn5モザイク末端配列(ME)及びインデックス
配列を有するオリゴヌクレオチドを含むトランスポゾンを混合して、調製した。個々のイ
ンデックス付きトランスポソームを、ストレプトアビジン-ビオチン相互作用によりビー
ズ上に固定化した。ビーズ上のトランスポソームを洗浄し、ビーズ上の96種類全ての個
々にインデックス化されたトランスポソームをプールした。ME配列に相補的でインデッ
クス配列を有するオリゴヌクレオチドを、固定化オリゴヌクレオチドにアニールし、固有
のインデックスを有するトランスポゾンを作製した。96種類のクローンインデックス付
きトランスポソームビーズセットを混ぜ合わせ、高分子量(HMW:high mole
cular weight)ゲノムDNAとともに、Nexteraタグメント化バッフ
ァーの存在下、単一のチューブでインキュベートした。
【0163】
ビーズを洗浄し、反応混合物を0.1%SDSで処理することにより、トランスポザー
ゼを除去する。タグメント化DNAをインデックス付きプライマーで増幅し、PE Hi
Seqフローセルv2で、TrueSeq v3クラスターキットを用いてシークエンシ
ングし、シークエンシングデータを分析する。
【0164】
リードのクラスター、すなわち島を観察する。各配列に対するリード間の最近隣距離の
プロットは、主要なピーク、1つはクラスター内からのもの(近位)ともう1つはクラス
ター間からのもの(遠位)、を基本的に示す。方法及び結果の模式図を、図30及び31
に示す。島のサイズは、約3~10kbの範囲である。カバーされた塩基の割合は、約5
%~10%である。ゲノムDNAの挿入サイズは、約200~300塩基である。
【0165】
実施例12 ビーズ上のトランスポソームに対するライブラリーサイズ
初めに、ME’配列を有する第1のオリゴヌクレオチド、ME-バーコード-P5/P
7配列を有する第2のオリゴヌクレオチド、及びTn5トランスポザーゼを混合すること
により、トランスポソームを溶液中にアセンブルした。第1のセットにおいて、ME’配
列を有する第1のオリゴヌクレオチドを、3’末端でビオチン化する。第2のケースにお
いて、ME-バーコード-P5/P7配列を有するオリゴヌクレオチドを、5’末端でビ
オチン化する。種々の濃度(10nM、50nM、及び200NM)の得られた各トラン
スポソームセットに対し、ストレプトアビジンビーズを添加して、トランスポソームがス
トレプトアビジンビーズに固定化されるようにする。ビーズを洗浄し、HMWゲノムDN
Aを加え、タグメント化を行う。いくつかのケースでは、タグメント化DNAを0.1%
SDSで処理し、他のケースでは、タグメント化DNAを処理しない。タグメント化DN
Aを5~8サイクルでPCR増幅し、シークエンシングする。模式図を図32に示す。
【0166】
図33に示すように、SDS処理により増幅効率及びシークエンシングの質が改善され
る。3’ビオチンを有するオリゴヌクレオチドは、トランスポソームに対してより良いラ
イブラリーサイズを有する。
【0167】
図34は、挿入サイズに対するトランスポソーム表面密度の影響を示す。5’ビオチン
を有するトランスポソームは、より小さいサイズのライブラリー及びより多くの自己挿入
副産物を示す。
【0168】
実施例13 インプットDNAの滴定
種々の量の標的HMW DNAを、50mMのTn5:トランスポゾン密度を有するク
ローンインデックス付きビーズに加え、37℃で15分間若しくは60分間、又は室温で
60分間インキュベートした。トランスポソームは、3’ビオチンを有するオリゴヌクレ
オチドを含んだ。タグメント化を行い、反応混合物を0.1%SDSで処理し、PCR増
幅させた。増幅したDNAをシークエンシングした。図35は、サイズ分布に対するイン
プットDNAの影響を示す。10pgのインプットDNAによる反応は、最小シグナルを
示した。サイズ分布パターンは、20pg、40pg、及び200pgのDNAインプッ
トで同様であった。
【0169】
実施例14 溶液ベース及びビーズベースの方法を用いた島のサイズ及び分布
溶液ベース及びビーズベースの方法を用いて、島のサイズ及び分布を比較した。溶液ベ
ースアプローチにおいて、トランスポゾンにそれぞれ固有のインデックスを有する96種
類のトランスポソームを、96穴プレートにアセンブルする。HMWゲノムDNAを添加
し、タグメント化反応を行う。反応生成物を0.1%SDSで処理し、PCR増幅させる
。増幅したDNAをシークエンシングした。
【0170】
ビーズベースアプローチにおいて、トランスポゾンにそれぞれ固有インデックスを有す
る96種類のトランスポソームを、96穴プレートにアセンブルした。オリゴヌクレオチ
ドは、3’末端ビオチンを含んだ。ストレプトアビジンビーズを96穴プレートの各々に
添加し、トランスポソームがストレプトアビジンビーズに固定化されるようにインキュベ
ートする。ビーズをそれぞれ洗浄してプールし、HMWゲノムDNAを添加し、タグメン
ト化反応を単一反応容器(ワンポット)内で行う。反応生成物を0.1%SDSで処理し
、PCR増幅させる。増幅産物をシークエンシングした。
【0171】
ネガティブコントロールでは、最初に、それぞれ固有のインデックスを有する96種類
全てのトランスポゾン配列を混合する。オリゴヌクレオチドは、3’末端ビオチンを含ん
だ。トランスポソームを個々の混合インデックス付きトランスポゾンから調製する。スト
レプトアビジンビーズを混合物に添加する。HMWゲノムDNAを添加し、タグメント化
反応を行う。反応生成物を0.1%SDSで処理し、PCR増幅させる。増幅産物をシー
クエンシングした。
【0172】
島内リードの数を島のサイズに対してプロットする。図36に示す結果は、島(近位リ
ード)が、溶液ベースの方法と同様に、ワンポットクローンインデックス付きビーズで観
られることを示している。インデックス付きトランスポゾンをトランスポソーム形成前に
混合した場合、島(近位リード)は観られなかった。トランスポソーム形成前にトランス
ポゾンを混合することにより、ビーズ当たり異なるインデックス/トランスポソームを有
する、即ちクローンではないビーズが得られる。
【0173】
実施例15 CPT-seqを用いた構造変異の分析
60kbヘテロ接合欠損の検出
シークエンシングデータをfastqファイルとして抽出し、分離(デマルチプレック
ス)工程を行って、各バーコードに対する個々のfastqファイルを生成する。CPT
シークエンシングからのfastqファイルを、インデックスに従って分離し、重複を除
去した参照ゲノムにアラインする。スキャンウィンドウ内の任意のリードを示すインデッ
クスの数を記録する、5kb/1kbウィンドウにより、染色体をスキャンする。統計的
には、ヘテロ接合欠損領域のため、隣接領域と比較して、半量のDNAしかライブラリー
生成に利用できない。従って、インデックスの数も隣接領域の約半分となるべきである。
NA12878 chr1の60kbヘテロ接合欠損を、9216個のインデックス付き
CPTシークエンシングデータから5kbウィンドウにスキャンすることにより、図47
A及び47Bに示す。
【0174】
遺伝子融合の検出
CPTシークエンシングからのfastqファイルを、インデックスに従って分離し、
重複を除去した参照ゲノムにアラインする。染色体を2kbウィンドウにスキャンする。
各2kbウィンドウは、36864ベクターであり、固有インデックスからのリードがこ
の2kbウィンドウでいくつ見つかったかを各エレメントが記録する。ゲノムにわたり、
2kbウィンドウペア(X、Y)毎に、重み付けジャッカード(weighted-Ja
ccard)インデックスを計算する。このインデックスは、事実上、サンプルの(X、
Y)間の距離を示す。これらのインデックスを、図48に示すヒートマップとして表示す
る。各データポイントは、2kbスキャンウィンドウのペアを表わし、左上の四角は、と
もに領域1からのX、Yであり、右下は、ともに領域2からのX、Yであり、右上は、領
域1から領域2にわたる領域からのX、Yである。遺伝子融合シグナルは、このケースで
は中央の横線として示される。
【0175】
欠損の検出
CPTシークエンシングからのfastqファイルを、インデックスに従って分離し、
重複を除去した参照ゲノムにアラインする。染色体を1kbウィンドウにスキャンする。
図49は、遺伝子欠損の検出結果を示す。
【0176】
実施例16 フェージング及びメチル化検出
亜硫酸水素塩変換効率の最適化
ビーズ上のインデックス付き結合CPT-seqライブラリーに対して、ME(モザイ
クエレメント領域)及びgDNA領域で、変換を評価した。Promega社のMeth
ylEdge亜硫酸水素塩変換システムを最適化して、効率を改善した。
【0177】
【表5】
【0178】
ME配列を分析して、亜硫酸水素塩変換処理の効率を決定した。図50に示す。ビーズ
に付着したインデックス付き結合ライブラリーのうち、95%が亜硫酸水素塩変換(BS
C)した。亜硫酸水素塩条件間で、同様のPCR収量が観察された。>より厳しい亜硫酸
水素塩処理でも、ライブラリーを分解しないように思われた。図51に示す。ビーズ上の
インデックス付き結合ライブラリーの約95%でBSCが観察された。BSCを改良(C
>U)するために研究した変数は、温度及びNaOH濃度(変性)であった。60℃及び
1MのNaOH、又は℃及び0.3MのNaOHで良い結果となった。
【0179】
ビーズライブラリーでのBSC変換CPT-seqのシークエンシング後、期待したシ
ークエンシングリード構造が観察された。塩基の割合(%)の計測値を、IVCプロット
とともに図52に示す。
【0180】
図53は、亜硫酸水素塩変換後のPCRの後の、インデックス付き結合ライブラリーの
アガロースゲル電気泳動の画像を示す。200~500bpの期待したサイズ範囲のライ
ブラリーが観察された。DNA無しでの反応では、インデックス付き結合ライブラリーを
産生しない。
【0181】
実施例17 標的フェージング
全ゲノムインデックス付き結合CPT-seqライブラリーを濃縮した。図54は、サ
イズ選択をしない濃縮前の全ゲノムインデックス付き結合CPT-seqライブラリーの
バイオアナライザートレースを示す。図55は、濃縮後のライブラリーのアガロースゲル
分析を示す。
【0182】
HLA領域に対する濃縮統計を以下に示す。
【0183】
【表6】
【0184】
図56は、染色体のHLA領域に対して標的化ハプロタイピングを適用した結果を示す
。全ゲノムインデックス付き結合リードライブラリーの濃縮の図解を左に示す。小さいバ
ーは、各々インデックス付き短ライブラリーを示す。インデックス付きライブラリーのク
ラスターは、単一ビーズ上で同じインデックスでクローンインデックス付けされた領域で
ある「島」であり、従って、ゲノムスケール上でリードの近位性(「島」性)を示す。標
的領域におけるライブラリーの濃縮(国際公開第2012/108864号「核酸の選択
的濃縮(Selective enrichment of nucleic acid
s)」を参照)を右に示す。リードは、HLA領域で濃縮される。さらに、リードがイン
デックスで選別され、ゲノムにアラインされる場合、リードは、インデックス付き結合リ
ードから連続性情報が維持されていることを示す「島」構造を再び示す。
【0185】
実施例18 インデックス交換
トランスポソーム複合体のモザイク末端(ME)の交換を評価するため、異なるインデ
ックスを有するビーズを調製した。混合後、ライブラリーをシークエンシングし、各ライ
ブラリーのインデックスをレポートすることにより、インデックス交換を決定した。「交
換(swapped)」の割合(%)を、(D4+D5+E3+E5+f4)/(全96
種の合計)で計算した。図65に示す。
【0186】
実施例19 トランスポソーム複合体をストレプトアビジンビーズにより密集させること
によるライブラリー挿入サイズの縮小
ストレプトアビジン磁性ビーズを、1倍、6倍、及び12倍濃度のTsTn5トランス
ポソーム複合体とともにロードした。各ビーズタイプに対して、Epi-CPTSeqプ
ロトコルを実施した。分析のため、最終PCR産物をAgilent BioAnaly
zer上にロードした。図に示す。Epi-CPTSeqライブラリーフラグメントは、
比較的小さく、ビーズ上にTsTn5を多くロードするほど多く産生した。
【0187】
実施例20 亜硫酸水素塩変換中のDNAライブラリーのフラグメント化
亜硫酸水素塩変換後、DNAは損傷を受け、結果としてPCR増幅に必要な共通配列(
CS2)が減少する。DNAフラグメントCPTSeq及びEpi-CPTSeq(Me
-CPTSeq)ライブラリーを、BioAnalyzerで分析した。亜硫酸水素塩変
換中のDNA損傷により、Epi-CPTSeqライブラリーは、図70に示すように、
CPTSeqライブラリーと比較して、5倍低い収量であり、小さいライブラリーサイズ
分布を有する。
【0188】
実施例21 TdT媒介ssDNAライゲーション反応
ターミナルトランスフェラーゼ(TdT)媒介ライゲーションによるDNA末端修復の
実現性を試験した。簡単には、5pmolのssDNA鋳型を,TdT(10/50U)
、アテニュエーター/アダプター二本鎖(0/15/25pmol)、及びDNAリガー
ゼ(0/10U)とともに、37℃で15分間インキュベートした。伸長/ライゲーショ
ンのDNA産物を、TBE-Ureaゲルで分析し、結果を図71に示した。全ての反応
成分を添加した結果、アダプター分子のほぼ完全なライゲーションが行われた(レーン5
~8)。
【0189】
ターミナルトランスフェラーゼ(TdT)媒介ライゲーションによるDNA末端修復の
実現性を、亜硫酸水素ナトリウム変換ビーズ結合ライブラリーに対して試験した。図72
に示す。簡単には、DNAをビーズ上でタグメント化し(最初の2レーン)、Prome
ga社のMethylEdge亜硫酸水素塩変換キットで処理し(レーン3及び4)、D
NA救出プロトコルを行った(レーン5及び6)。救出反応後のDNAライブラリーの収
量及びサイズは、明らかに増加している。また、挿入トランスポゾン(SI)の存在量も
増加しており、アダプター分子の効率的なライゲーションを示している。
【0190】
メチル-CPTSeqアッセイの結果を図73に示す。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26
図27
図28
図29
図30
図31
図32
図33
図34
図35
図36
図37
図38
図39
図40
図41
図42
図43
図44
図45
図46
図47A
図47B
図48
図49
図50
図51
図52
図53
図54
図55
図56
図57
図58
図59
図60
図61
図62
図63
図64
図65
図66
図67
図68
図69
図70
図71
図72
図73
図74
図75