IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ガーダント ヘルス, インコーポレイテッドの特許一覧

特開2023-89062核酸分子を解析するための方法およびシステム
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023089062
(43)【公開日】2023-06-27
(54)【発明の名称】核酸分子を解析するための方法およびシステム
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20230620BHJP
   C12M 1/34 20060101ALI20230620BHJP
   C12Q 1/6876 20180101ALI20230620BHJP
   C12N 15/12 20060101ALI20230620BHJP
   C40B 40/06 20060101ALI20230620BHJP
   G16B 30/00 20190101ALI20230620BHJP
   C12Q 1/6806 20180101ALN20230620BHJP
   C12Q 1/686 20180101ALN20230620BHJP
   C12Q 1/6816 20180101ALN20230620BHJP
   C12N 15/10 20060101ALN20230620BHJP
【FI】
C12Q1/6869 Z
C12M1/34 Z
C12Q1/6876 Z
C12N15/12
C40B40/06
G16B30/00
C12Q1/6806 Z ZNA
C12Q1/686 Z
C12Q1/6816 Z
C12N15/10 100Z
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023060942
(22)【出願日】2023-04-04
(62)【分割の表示】P 2019533331の分割
【原出願日】2017-12-22
(31)【優先権主張番号】62/438,240
(32)【優先日】2016-12-22
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/512,936
(32)【優先日】2017-05-31
(33)【優先権主張国・地域又は機関】US
(31)【優先権主張番号】62/550,540
(32)【優先日】2017-08-25
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】515059083
【氏名又は名称】ガーダント ヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【弁理士】
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【弁理士】
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【弁理士】
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【弁理士】
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【弁護士】
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】アンドリュー ケネディ
(72)【発明者】
【氏名】ステファニー アン ウォード モーティマー
(72)【発明者】
【氏名】ヘルミー エルトーキー
(72)【発明者】
【氏名】アミルアリ タラサズ
(72)【発明者】
【氏名】ダイアナ アブドゥエヴァ
(72)【発明者】
【氏名】マシュー シュルツ
(57)【要約】
【課題】核酸分子を解析するための方法およびシステムの提供。
【解決手段】本開示は、異なる形態(例えば、RNAおよびDNA、一本鎖または二本鎖)および/または修飾(例えば、シトシンメチル化、タンパク質との会合)の程度を含有する核酸集団を処理するための方法を提供する。これらの方法は、複数の形態について配列情報を得ることができるように、試料中の核酸の複数の形態および/または修飾に適応する。方法はまた、配列の解析を、エピジェネティック解析と組み合わせることができるように、処理および解析を通じて複数の形態または修飾状態の同一性を保つ。
【選択図】なし
【特許請求の範囲】
【請求項1】
明細書に記載の発明。
【発明の詳細な説明】
【技術分野】
【0001】
【表1】
関連特許出願の参照
本願は、2016年12月22日に出願された米国仮特許出願第62/438,240号、2017年5月31日に出願された同第62/512,936号、および2017年8月25日に出願された同第62/550,540号の優先日の利益を主張し、これらすべての全体が、参照によって本明細書中に組み込まれる。
【背景技術】
【0002】
がんは、世界中で疾患の主要な原因である。世界中で毎年、数千万人ががんと診断され、半数を超える人が最終的にそれによって死亡する。多くの国において、がんは、心血管疾患に次いで2番目に最も一般的な死因に位置付けられている。早期検出は、多数のがんについて転帰改善と関連している。
【0003】
がんは、個体の正常細胞内での遺伝的変異の蓄積によって引き起こされることがあり、そのうち少なくとも一部は、不適切に調節された細胞分裂をもたらす。このような変異は、一般に、コピー数変異(CNV)、単一ヌクレオチド変異(SNV)、遺伝子融合、挿入および/または欠失(挿入欠失)を含み、エピジェネティック変異は、シトシンの5-メチル化(5-メチルシトシン)ならびにDNAのクロマチンおよび転写因子との会合を含む。
【0004】
がんは、腫瘍の生検と、それに続く細胞、マーカーまたは細胞から抽出されたDNAの解析によって検出されることが多い。しかしより最近では、がんはまた、血液または尿などの体液中の無細胞核酸から検出できるということが提案されている。このような試験は、非侵襲的であり、生検において疑わしいがん細胞を同定することなく実施できる利点を有する。しかし、このような試験は、体液中の核酸の量が極めて少なく、どのような核酸が存在するのかが、形態(例えば、RNAおよびDNA、一本鎖および二本鎖ならびに複製後修飾の種々の状態ならびにヒストンなどのタンパク質との会合)において不均一であるという事実によって複雑にされる。
【0005】
プロセス中の循環核酸(元の材料)またはデータの喪失を低減しながら、液体生検アッセイの感度を増大することが望ましい。
【発明の概要】
【課題を解決するための手段】
【0006】
概要
本開示は、二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析するための、方法、組成物およびシステムを提供する。いくつかの実施形態では、方法は、(a)核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグ核酸と連結するステップと、(b)その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが、存在する場合、増幅されて増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップと、(c)その少なくとも一部にタグが付けられている増幅された核酸の配列データをアッセイするステップと、(d)増幅された核酸のタグ核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するステップとを含む。
【0007】
いくつかの実施形態では、方法は、形態のうち少なくとも1種を、その他の形態のうち1種または複数に対して濃縮するステップをさらに含む。いくつかの実施形態では、集団中の核酸の各形態の分子の少なくとも70%が、ステップ(b)において増幅される。いくつかの実施形態では、少なくとも3種の形態の核酸が集団中に存在し、形態のうち少なくとも2種が、3種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている。いくつかの実施形態では、集団中の少なくとも3種の形態の核酸の各々が、異なるタグに連結されている。いくつかの実施形態では、同一形態の各分子が、同一の同定情報タグを含むタグ(例えば、同一配列を有する、または同一配列を含むタグ)に連結されている。いくつかの実施形態では、同一形態の分子が、異なる種類のタグに連結されている。いくつかの実施形態では、ステップ(a)は、集団を、タグが付けられたプライマーを用いる逆転写に付すステップを含み、タグが付けられたプライマーは、集団中のRNAから作製されたcDNA中に組み込まれる。いくつかの実施形態では、逆転写は、配列特異的である。いくつかの実施形態では、逆転写はランダムである。いくつかの実施形態では、方法は、cDNAと二本鎖を形成しているRNAを分解するステップをさらに含む。いくつかの実施形態では、方法は、一本鎖DNAを二本鎖DNAから分離するステップと、核酸タグを二本鎖DNAにライゲーションするステップとをさらに含む。いくつかの実施形態では、一本鎖DNAは、1種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される。いくつかの実施形態では、方法は、一本鎖核酸で機能するリガーゼを使用して一本鎖タグを用いて一本鎖DNAに差次的にタグを付け、二本鎖核酸で機能するリガーゼを使用して二本鎖アダプターを用いて二本鎖DNAに差次的にタグを付けるステップをさらに含む。いくつかの実施形態では、方法は、アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップをさらに含む。いくつかの実施形態では、方法は、個々のアッセイにおいて別個に分割されたDNAのプールを解析するステップをさらに含む。アッセイは、同一、実質的に同様、同等または異なるものであり得る。
【0008】
上記の方法のいずれかでは、配列データは、体細胞もしくは生殖系列変異またはコピー数変異または単一ヌクレオチド変異または挿入欠失または遺伝子融合の存在を示し得る。
【0009】
本開示は、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法をさらに提供する。いくつかの例では、本開示は、疾患と関連する特徴(例えば、5’メチルシトシン)についてスクリーニングするための方法を提供する。方法は、核酸集団を、修飾を有する核酸と優先的に結合する作用物質(メチル結合ドメインまたはタンパク質など)と接触させるステップと、作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、タグが付けられた核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、増幅された核酸および連結されたタグの配列データをアッセイするステップと、タグを解読して、配列データがアッセイされた核酸が、第1または第2のプール中の鋳型から増幅されたか否かを明らかにするステップとを含む。
【0010】
いくつかの実施形態では、修飾は、核酸のタンパク質との結合である。いくつかの実施形態では、タンパク質は、ヒストンまたは転写因子である。いくつかの実施形態では、核酸修飾は、ヌクレオチドへの複製後修飾である。いくつかの実施形態では、複製後修飾は、5-メチルシトシンであり、捕捉作用物質の核酸との結合の程度は、核酸中の5-メチルシトシンの程度とともに増大する。いくつかの実施形態では、複製後修飾は、5-ヒドロキシメチルシトシンであり、作用物質の核酸との結合の程度は、核酸中の5-ヒドロキシメチルシトシンの程度とともに増大する。いくつかの実施形態では、複製後修飾は、5-ホルミルシトシンまたは5-カルボキシルシトシンであり、作用物質の結合の程度は、核酸中の5-ホルミルシトシンまたは5-カルボキシルシトシンの程度とともに増大する。いくつかの実施形態では、複製後修飾は、N-メチルアデニンである。いくつかの実施形態では、方法は、作用物質と結合している核酸を洗浄するステップと、第1および第2のプールに対して中間の程度に複製後修飾を有する核酸を含む第3のプールとして洗浄物を回収するステップとをさらに含む。いくつかの方法は、アッセイするステップの前に、第1および第2のプールからタグが付けられた核酸をプールするステップをさらに含む。いくつかの実施形態では、作用物質は、メチル結合ドメインまたはメチル-CpG結合ドメイン(MBD)を含む。MBDは、タンパク質、抗体または目的の修飾と特異的に結合可能な任意のその他の作用物質であり得る。好ましくは、MBDは、親和性分離ステップを実施するための磁気ビーズ、ストレプトアビジンまたはその他の結合ドメインをさらに含む。
【0011】
本開示は、核酸の少なくとも一部が、1個または複数の修飾されたシトシン残基を含む、核酸集団を解析するための方法をさらに提供する。方法は、捕捉部分、例えば、ビオチンを、増幅の鋳型として役割を果たす集団中の核酸に連結するステップと、増幅反応を実施して鋳型から増幅産物を産生するステップと、捕捉部分に連結された鋳型を増幅産物から分離するステップと、バイサルファイトシーケンシングによって捕捉部分に連結された鋳型の配列データをアッセイするステップと、増幅産物の配列データをアッセイするステップとを含む。
【0012】
いくつかの実施形態では、捕捉部分は、ビオチンを含む。いくつかの実施形態では、分離するステップは、鋳型をストレプトアビジンビーズと接触させることによって実施される。いくつかの実施形態では、修飾されたシトシン残基は、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシンまたは5-カルボキシルシトシンである。いくつかの実施形態では、捕捉部分は、1個または複数の修飾された残基を含む核酸タグに連結されたビオチンを含む。いくつかの実施形態では、捕捉部分は、切断可能な連結によって集団中の核酸に連結されている。いくつかの実施形態では、切断可能な連結は、光切断可能な連結である。いくつかの実施形態では、切断可能な連結は、ウラシルヌクレオチドを含む。
【0013】
本開示は、異なる程度の5-メチルシトシンを有する核酸を含む核酸集団を解析する方法をさらに提供する。方法は、(a)核酸集団を、5-メチル化核酸と優先的に結合する作用物質と接触させるステップと、(b)作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、5-メチルシトシンについて過剰提示され、第2のプール中の核酸が、5-メチル化について提示不足である、ステップと、(c)第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結するステップであって、第1のプール中の核酸に連結された核酸タグが、捕捉部分(例えば、ビオチン)を含む、ステップと、(d)標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、(e)捕捉部分を有する増幅された核酸を、捕捉部分を有さない増幅された核酸から分離するステップと、(f)分離された増幅された核酸の配列データをアッセイするステップとを含む。
【0014】
本開示は、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、集団中の核酸を、アダプターと接触させて、プライマー結合部位を含むアダプターが隣接する核酸の集団を産生するステップと、プライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、第1および第2のプール中の核酸の第2の増幅ステップを実施するステップと、第1および第2のプール中の増幅された核酸の配列データをアッセイするステップとを含む方法をさらに提供する。各プールの増幅は、異なる反応容器中で別個に起こり得る。プール特異的タグを使用することによって、続いて、アンプリコンをプールし、その後シーケンシングすることが可能になる。
【0015】
本開示は、核酸の少なくとも一部が、1個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、核酸集団を、少なくとも1個の修飾されたシトシンを含むプライマー結合部位を含むアダプターと接触させて、アダプターが隣接する核酸を形成するステップと、核酸に隣接するアダプター中のプライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を第1および第2のアリコートに分けるステップと、第1のアリコートの核酸について配列データをアッセイするステップと、第2のアリコートの核酸を、未修飾シトシン(C)をウラシル(U)に変換するバイサルファイトと接触させるステップと、核酸に隣接するプライマー結合部位からプライムされる、バイサルファイト処理に起因する核酸を増幅するステップであって、バイサルファイト処理によって導入されたUが、Tに変換される、ステップと、第2のアリコートからの増幅された核酸について配列データをアッセイするステップと、第1および第2のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定するステップとを含む方法をさらに提供する。
【0016】
上記の方法のいずれかでは、核酸集団は、血液、血清または血漿などの体液試料由来であり得る。いくつかの実施形態では、核酸集団は、無細胞核酸集団である。いくつかの実施形態では、体液試料は、がんを有すると疑われる対象に由来する。
【0017】
一態様では、二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析する方法であって、少なくとも2種の形態の各々が複数の分子を含み、方法が、核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグ核酸と連結するステップと、その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップと、その少なくとも一部にタグが付けられている増幅された核酸の配列データをアッセイするステップであって、アッセイするステップによって、増幅された核酸のタグ核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供する、ステップとを含む、方法が、本明細書において提供される。一実施形態では、方法は、増幅された核酸のタグ核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するステップをさらに含む。別の実施形態では、方法は、形態のうち少なくとも1種を、その他の形態のうち1種または複数に対して濃縮するステップをさらに含む。別の実施形態では、集団中の核酸の各形態の分子の少なくとも70%が増幅される。別の実施形態では、少なくとも3種の形態の核酸が集団中に存在し、少なくとも2種の形態が、3種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている。別の実施形態では、集団中の少なくとも3種の形態の核酸の各々が、異なるタグに連結されている。別の実施形態では、同一形態の各分子が、同一タグ情報を含むタグに連結されている。別の実施形態では、同一形態の分子が、異なる種類のタグに連結されている。別の実施形態では、方法は、集団を、タグが付けられたプライマーを用いる逆転写に付すステップをさらに含み、タグが付けられたプライマーは、集団中のRNAから作製されたcDNA中に組み込まれる。別の実施形態では、逆転写は、配列特異的である。別の実施形態では、逆転写はランダムである。別の実施形態では、方法は、cDNAと二本鎖を形成しているRNAを分解するステップをさらに含む。別の実施形態では、方法は、一本鎖DNAを二本鎖DNAから分離するステップと、核酸タグを二本鎖DNAにライゲーションするステップとをさらに含む。別の実施形態では、一本鎖DNAは、1種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される。別の実施形態では、方法は、circligaseを用いて一本鎖DNAを環状化するステップと、核酸タグを二本鎖DNAにライゲーションするステップとをさらに含む。別の実施形態では、方法は、アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップを含む。別の実施形態では、核酸集団は、体液試料に由来する。別の実施形態では、体液試料は、血液、血清または血漿である。別の実施形態では、核酸集団は、無細胞核酸集団である。別の実施形態では、体液試料は、がんを有すると疑われる対象に由来する。別の実施形態では、配列データは、体細胞または生殖系列変異の存在を示す。別の実施形態では、配列データは、コピー数変異の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す。
【0018】
別の態様では、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、増幅された核酸および連結されたタグの配列データをアッセイするステップであって、アッセイするステップによって、タグを解読するための配列データを得て、配列データがアッセイされた核酸が、第1または第2のプール中の鋳型から増幅されたか否かを明らかにする、ステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、タグを解読して、配列データがアッセイされた核酸が、第1または第2のプール中の鋳型から増幅されたか否かを明らかにするステップを含む。別の実施形態では、修飾は、核酸のタンパク質との結合である。別の実施形態では、タンパク質は、ヒストンまたは転写因子である。別の実施形態では、修飾は、ヌクレオチドへの複製後修飾である。別の実施形態では、複製後修飾は、5-メチル-シトシンであり、作用物質の核酸との結合の程度は、核酸中の5-メチル-シトシンの程度とともに増大する。別の実施形態では、複製後修飾は、5-ヒドロキシメチル-シトシンであり、作用物質の核酸との結合の程度は、核酸中の5-ヒドロキシメチル-シトシンの程度とともに増大する。別の実施形態では、複製後修飾は、5-ホルミル-シトシンまたは5-カルボキシル-シトシンであり、作用物質の結合の程度は、核酸中の5-ホルミル-シトシンまたは5-カルボキシル-シトシンの程度とともに増大する。別の実施形態では、方法は、作用物質と結合している核酸を洗浄するステップと、第1および第2のプールに対して中間の程度に複製後修飾を有する核酸を含む第3のプールとして洗浄物を回収するステップとをさらに含む。別の実施形態では、方法は、アッセイするステップの前に、第1および第2のプールからタグが付けられた核酸をプールするステップを含む。別の実施形態では、作用物質は、5-メチル結合ドメイン磁気ビーズである。別の実施形態では、核酸集団は、体液試料に由来する。別の実施形態では、体液試料は、血液、血清または血漿である。別の実施形態では、核酸集団は、無細胞核酸集団である。別の実施形態では、体液試料は、がんを有すると疑われる対象に由来する。別の実施形態では、配列データは、体細胞または生殖系列変異の存在を示す。別の実施形態では、配列データは、コピー数変異の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す。
【0019】
別の態様では、核酸の少なくとも一部が、1個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、捕捉部分を、増幅の鋳型として役割を果たす集団中の核酸と連結するステップと、増幅反応を実施して鋳型から増幅産物を産生するステップと、捕捉タグに連結された鋳型を増幅産物から分離するステップと、バイサルファイトシーケンシングによって捕捉タグに連結された鋳型の配列データをアッセイするステップと、増幅産物の配列データをアッセイするステップとを含む方法が、本明細書において提供される。一実施形態では、捕捉部分は、ビオチンを含む。別の実施形態では、分離するステップは、鋳型を、ストレプトアビジンビーズと接触させることによって実施される。別の実施形態では、修飾されたシトシン残基は、5-メチル-シトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシンまたは5-カルボキシルシトシンである。別の実施形態では、捕捉部分は、1個または複数の修飾された残基を含む核酸タグに連結されたビオチンを含む。別の実施形態では、捕捉部分は、切断可能な連結によって、集団中の核酸に連結されている。別の実施形態では、切断可能な連結は、光切断可能な連結である。別の実施形態では、切断可能な連結は、ウラシルヌクレオチドを含む。別の実施形態では、核酸集団は、体液試料に由来する。別の実施形態では、体液試料は、血液、血清または血漿である。別の実施形態では、核酸集団は、無細胞核酸集団である。別の実施形態では、体液試料は、がんを有すると疑われる対象に由来する。別の実施形態では、配列データは、体細胞または生殖系列変異の存在を示す。別の実施形態では、配列データは、コピー数変異の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す。
【0020】
別の態様では、異なる程度の5-メチル化を有する核酸を含む核酸集団を解析する方法であって、核酸集団を、5-メチル化核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、5-メチル化について過剰提示され、第2のプール中の核酸が、5-メチル化について提示不足である、ステップと、第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結するステップであって、第1のプール中の核酸に連結された核酸タグが、捕捉部分(例えば、ビオチン)を含む、ステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、捕捉部分を有する増幅された核酸を、捕捉部分を有さない増幅された核酸から分離するステップと、分離された、増幅された核酸の配列データをアッセイするステップとを含む方法が、本明細書において提供される。
【0021】
別の態様では、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、集団中の核酸を、アダプターと接触させて、プライマー結合部位を含むアダプターが隣接する核酸の集団を産生するステップと、プライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、第1および第2のプール中のタグが付けられた核酸の並行増幅を実施するステップと、第1および第2のプール中の増幅された核酸の配列データをアッセイするステップとを含む方法が、本明細書において提供される。別の実施形態では、アダプターは、ヘアピンアダプターである。
【0022】
別の態様では、核酸の少なくとも一部が、1個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、核酸集団を、修飾されたシトシンを含むプライマー結合部位を含むアダプターと接触させて、アダプターが隣接する核酸を形成するステップと、核酸に隣接するアダプター中のプライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を第1および第2のアリコートに分けるステップと、第1のアリコートの核酸について配列データをアッセイするステップと、第2のアリコートの核酸を、未修飾CをUに変換するバイサルファイトと接触させるステップと、核酸に隣接するプライマー結合部位からプライムされる、バイサルファイト処理に起因する核酸を増幅するステップであって、バイサルファイト処理によって導入されたUが、Tに変換される、ステップと、第2のアリコートからの増幅された核酸の配列データをアッセイするステップであって、第1および第2のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定するために使用できる配列データをもたらすステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、第1および第2のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定することを含む。別の実施形態では、アダプターは、ヘアピンアダプターである。
【0023】
別の態様では、ヒト試料からDNA分子を物理的に分画して、2種またはそれより多い分割物を作製するステップと、2種またはそれより多い分割物の各々に差次的分子タグおよびNGSを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、NGS機器で分子タグが付けられた分割物をアッセイして、試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するステップをさらに含む。別の実施形態では、DNA分子は、抽出された血漿に由来する。別の実施形態では、物理的に分画するステップは、分子をメチル化の種々の程度に基づいて分画することを含む。別の実施形態では、メチル化の種々の程度は、高メチル化および低メチル化を含む。別の実施形態では、物理的に分画するステップは、メチル結合ドメインタンパク質(「MBD」)-ビーズを用いて分画して、種々の程度のメチル化に層別化することを含む。別の実施形態では、差次的分子タグは、MBD-分割物に対応する異なるセットの分子タグである。別の実施形態では、物理的分画は、免疫沈降を使用してDNA分子を分離することを含む。別の実施形態では、方法は、作製された分子タグが付けられた画分のうち2種またはそれより多い分子タグが付けられた画分を再度組み合わせるステップをさらに含む。別の実施形態では、方法は、再度組み合わされた、分子タグが付けられた画分または群を濃縮するステップをさらに含む。別の実施形態では、1つまたは複数の特徴は、メチル化である。別の実施形態では、分画は、メチル結合ドメインを含むタンパク質を使用してメチル化核酸を、非メチル化核酸から分離して、種々の程度のメチル化を含む核酸分子の群を作製することを含む。別の実施形態では、群のうち1つは、高メチル化DNAを含む。別の実施形態では、少なくとも1つの群は、メチル化の程度によって特徴付けられる。別の実施形態では、分画は、タンパク質が結合している核酸を単離することを含む。別の実施形態では、単離することは、免疫沈降を含む。
【0024】
別の態様では、NGSによるMBD-ビーズによって分画されたライブラリーの分子タグ同定のための方法であって、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質-ビーズ精製キットを使用して抽出されたDNA試料を物理的に分画することと、各画分または群に差次的分子タグおよびNGSを可能にするアダプター配列を並行適用することと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的DNAプライマー配列を使用して続いて増幅することと、(d)再度組み合わされ、増幅された総ライブラリーを、目的のゲノム領域を標的としながら濃縮/ハイブリダイゼーションすることと、試料タグを付加しながら、濃縮された総DNAライブラリーを再度増幅することと、異なる試料をプールして、NGS機器で多重でそれらをアッセイすることとを含み、機器によって生成されたNGS配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にMBD分割された分子への試料のデコンボリューションのための配列データを提供する、方法が、本明細書において提供される。一実施形態では、方法は、独特の分子を同定するために使用されている分子タグと、同様に、差次的にMBD分割された分子への試料のデコンボリューションを用いて、NGSデータの解析を実施するステップを含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、核酸分子の集団は、メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始/停止位置からなる群から選択される1つまたは複数の特徴に基づいて分割される。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも1つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、方法は、異なる特徴に基づいて少なくとも1つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、1つまたは複数の遺伝子座で、第1の群の核酸分子に対応する第1の特徴を、第2の群の核酸分子に対応する第2の特徴と比較することを含む。別の実施形態では、核酸分子は、循環腫瘍DNAである。別の実施形態では、核酸分子は、無細胞DNA(「cfDNA」)である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。別の実施形態では、1つまたは複数の特徴は、がんマーカーである。
【0025】
別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、1つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性DNA-タンパク質相互作用についての相対情報を作成するのに十分なデータを含有する配列読み取りデータを作成するステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、配列読み取りデータを解析して、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性DNA-タンパク質相互作用についての相対情報を作成するステップをさらに含む。別の実施形態では、方法は、1つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、1つまたは複数の特徴は、マッピングされた読み取りデータの定量的特徴を含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも1つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、方法は、異なる特徴に基づいて、少なくとも1つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、1つまたは複数の遺伝子座で、第1の群の核酸分子に対応する第1の特徴を、第2の群の核酸分子に対応する第2の特徴と比較することを含む。別の実施形態では、解析するステップは、1つまたは複数の遺伝子座で、正常試料に対して、群における1つまたは複数の特徴のうち1つの特徴を解析することを含む。別の実施形態では、1つまたは複数の特徴は、参照配列上の塩基位置でのベースコール頻度、参照配列上の1つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有する分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される。別の実施形態では、方法は、1つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、訓練された分類子は、1つまたは複数の特徴を対象における組織と関連するとして分類する。別の実施形態では、訓練された分類子は、1つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する。別の実施形態では、1つまたは複数の特徴は、遺伝子発現または疾患の状態を示す。別の実施形態では、核酸分子は、循環腫瘍DNAである。別の実施形態では、核酸分子は、無細胞DNA(「cfDNA」)である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。別の実施形態では、1つまたは複数の特徴は、がんマーカーである。
【0026】
別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、メチル化状態に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するステップとを含む方法であって、1つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはDNA-タンパク質相互作用を示す、方法が、本明細書において提供される。別の実施形態では、方法は、1つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、1つまたは複数の特徴は、マッピングされた読み取りデータの定量的特徴を含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも1つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、方法は、異なる特徴に基づいて、少なくとも1つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、1つまたは複数の遺伝子座で、第1の群の核酸分子に対応する第1の特徴を、第2の群の核酸分子に対応する第2の特徴と比較することを含む。別の実施形態では、解析するステップは、1つまたは複数の遺伝子座で、正常試料に対して、群における1つまたは複数の特徴のうち1つの特徴を解析することを含む。別の実施形態では、1つまたは複数の特徴は、参照配列上の塩基位置でのベースコール頻度、参照配列上の1つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有す分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される。別の実施形態では、方法は、1つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、訓練された分類子は、1つまたは複数の特徴を対象における組織と関連するとして分類する。別の実施形態では、訓練された分類子は、1つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する。別の実施形態では、1つまたは複数の特徴は、遺伝子発現または疾患の状態を示す。別の実施形態では、核酸分子は、循環腫瘍DNAである。別の実施形態では、核酸分子は、無細胞DNA(「cfDNA」)である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。別の実施形態では、1つまたは複数の特徴は、がんマーカーである。
【0027】
別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、核酸分子の集団を分画して、タンパク質が結合している無細胞核酸を含む核酸分子の複数の群を作製するステップと、1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップとを含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の1つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するのに十分であり、1つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはDNA-タンパク質相互作用を示す、方法が、本明細書において提供される。一実施形態では、方法は、配列読み取りデータを、参照配列上の1つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するステップとをさらに含み、1つまたは複数の特徴は、ヌクレオソーム位置付け、ヌクレオソーム修飾またはDNA-タンパク質相互作用を示す。別の実施形態では、方法は、訓練された分類子を使用して、1つまたは複数の特徴に基づいて対象を分類するステップをさらに含む。別の実施形態では、1つまたは複数の特徴は、マッピングされた読み取りデータの定量的特徴を含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、核酸分子の集団は、メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始/停止位置からなる群から選択される1つまたは複数の特徴に基づいて分割される。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、1つまたは複数の特徴は、メチル化である。別の実施形態では、分画は、メチル結合ドメインを含むタンパク質を使用してメチル化核酸を、非メチル化核酸から分離して、種々の程度のメチル化を含む核酸分子の群を作製することを含む。別の実施形態では、群の1つは、高メチル化DNAを含む。別の実施形態では、少なくとも1つの群は、メチル化の程度によって特徴付けられる。別の実施形態では、分画は、一本鎖DNA分子および/または二本鎖DNA分子を分離することを含む。別の実施形態では、二本鎖DNA分子は、ヘアピンアダプターを使用して分離される。別の実施形態では、分画は、タンパク質が結合している核酸を単離することを含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも1つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、単離することは、免疫沈降を含む。別の実施形態では、方法は、異なる特徴に基づいて、少なくとも1つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、1つまたは複数の遺伝子座で、第1の群の核酸分子に対応する第1の特徴を、第2の群の核酸分子に対応する第2の特徴と比較することを含む。別の実施形態では、解析するステップは、1つまたは複数の遺伝子座で、正常試料に対して、群における1つまたは複数の特徴のうち1つの特徴を解析することを含む。別の実施形態では、1つまたは複数の特徴は、参照配列上の塩基位置でのベースコール頻度、参照配列上の1つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有する分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される。別の実施形態では、方法は、1つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、訓練された分類子は、1つまたは複数の特徴を対象における組織と関連するとして分類する。別の実施形態では、訓練された分類子は、1つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する。別の実施形態では、1つまたは複数の特徴は、遺伝子発現または疾患の状態を示す。別の実施形態では、核酸分子は、循環腫瘍DNAである。別の実施形態では、核酸分子は、無細胞DNA(「cfDNA」)である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。
【0028】
別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、1つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップとを含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の1つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するのに十分であり、1つまたは複数の特徴が、複数の群からの配列読み取りデータのプールにおいて検出可能ではない、方法が、本明細書において提供される。一実施形態では、方法は、配列読み取りデータを、参照配列上の1つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するステップとをさらに含み、1つまたは複数の特徴は、複数の群からの配列読み取りデータのプールにおいて検出可能ではない。別の実施形態では、分画は、物理的分画を含む。
【0029】
別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、1つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップであって、複数の群の各々の核酸分子が、別個の識別子を含む、ステップと、複数の群の核酸分子をプールするステップと、プールされた複数の群の核酸分子をシーケンシングして、複数のセット配列読み取りデータを作成するステップと、識別子に基づいて配列読み取りデータを分画するステップとを含む方法が、本明細書において提供される。
【0030】
別の態様では、差次的にタグが付けられた核酸分子を含む核酸分子のプールを含む組成物が本明細書において提供され、プールは、メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始/停止位置からなる群から選択される:からなる群から選択される1つまたは複数の特徴に基づいて差次的にタグが付けられた複数のセットの核酸分子を含み、プールは、生体試料に由来する。一実施形態では、複数のセットは、2、3、4、5または5より多いのいずれかである。
【0031】
別の態様では、核酸分子の集団を、特徴が異なる核酸を含む複数の群に分画するステップと、複数の群の各々の中の核酸に、複数の群の各々の中の核酸を区別するタグのセットを用いてタグを付けて、タグが付けられた核酸の集団を産生するステップであって、タグが付けられた核酸の各々が、1つまたは複数のタグを含む、ステップと、タグが付けられた核酸の集団をシーケンシングして、配列読み取りデータを作成するステップと、1つまたは複数のタグを使用して、各群の配列読み取りデータを群化するステップと、配列読み取りデータを解析して、正常試料または分類子に対して群のうち少なくとも1つにおいてシグナルを検出するステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、別の群または全ゲノム配列に対して、群のうち少なくとも1つにおいてシグナルを正規化するステップをさらに含む。
【0032】
別の態様では、生体試料から無細胞DNAの集団を提供するステップと、無細胞DNAの集団を、非がん性細胞と比較して、がん性に由来する無細胞DNAでは異なるレベルで存在する特徴に基づいて分画し、それによって、無細胞DNAの小集団を作製するステップと、無細胞DNAの小集団のうち少なくとも1つを増幅するステップと、無細胞DNAの増幅された小集団のうち少なくとも1つをシーケンシングするステップとを含む方法が、本明細書において提供される。一実施形態では、特徴は、無細胞DNAのメチル化レベル、無細胞DNAのグリコシル化レベル、無細胞DNA断片の長さまたは無細胞DNAにおける一本鎖切断の存在である。
【0033】
別の態様では、生体試料から無細胞DNAの集団を提供するステップと、無細胞DNAのメチル化レベルに基づいて無細胞DNAの集団を分画し、それによって、無細胞DNAの小集団を作製するステップと、無細胞DNAの小集団のうち少なくとも1つを増幅するステップと、無細胞DNAの増幅された小集団のうち少なくとも1つをシーケンシングするステップとを含む方法が、本明細書において提供される。
【0034】
別の態様では、無細胞DNAのメチル化状態を判定するための方法であって、生体試料から無細胞DNAの集団を提供するステップと、無細胞DNAの集団を、無細胞DNAのメチル化レベルに基づいて分画し、それによって、無細胞DNAの小集団を作製するステップと、無細胞DNAの少なくとも1つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、対応する配列読み取りデータが生じる小集団に応じて、メチル化状態を各無細胞DNAに割り当てるステップとを含む方法が、本明細書において提供される。
【0035】
別の態様では、対象を分類する方法であって、対象由来の生体試料から無細胞DNAの集団を提供するステップと、無細胞DNAの集団を、無細胞DNAのメチル化レベルに基づいて分画し、それによって、無細胞DNAの小集団を作製するステップと、無細胞DNAの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、どの小集団においてどの配列読み取りデータが生じるかに応じて、訓練された分類子を使用して対象を分類するステップとを含む方法が、本明細書において提供される。別の実施形態では、無細胞DNAの集団は、健常および罹患状態の間にシグナルの相違を提供する1つまたは複数の特徴によって分画される。別の実施形態では、無細胞DNAの集団は、無細胞DNAのメチル化レベルに基づいて分画される。別の実施形態では、無細胞DNAの断片化パターンを決定するステップは、参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することをさらに含む。別の実施形態では、方法は、参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することによって、各小集団において無細胞DNAの断片化パターンを決定するステップをさらに含む。
【0036】
別の態様では、無細胞DNAの断片化パターンを解析するための方法であって、生体試料から無細胞DNAの集団を提供するステップと、無細胞DNAの集団を分画し、それによって、無細胞DNAの小集団を作製するステップと、無細胞DNAの少なくとも1つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、配列読み取りデータを参照ゲノムに対してアラインするステップと、以下:参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数または参照ゲノム中の各塩基位置で終了する配列読み取りデータの数のうち任意の数のものを解析することによって各小集団において無細胞DNAの断片化パターンを決定するステップとを含む方法が、本明細書において提供される。別の実施形態では、1つまたは複数の特徴は、メチル化、ヒドロキシメチル化、ホルミル化、アセチル化およびグリコシル化からなる群から選択される化学修飾を含む。
【0037】
本明細書において記載される方法のいずれかでは、DNA:ビーズの比は、1:100である。
【0038】
本明細書において記載される方法のいずれかでは、DNA:ビーズの比は、1:50である。
【0039】
本明細書において記載される方法のいずれかでは、DNA:ビーズの比は、1:20である。
【0040】
一態様では、遺伝子発現または疾患状態を判定するための循環腫瘍DNA(ctDNA)の解析の際の、DNAメチル化の程度に基づく物理的分画の使用が、本明細書において提供される。
【0041】
一態様では、ctDNAの解析の際にctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。
【0042】
一態様では、ctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。
【0043】
一態様では、シーケンシングおよび任意選択の下流解析に先立つ、ctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。
【0044】
一態様では、差次的標識/タグ付けのために、ctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する1つまたは複数の相違によって特徴付けられる
【0045】
一態様では、ctDNAの解析の際の差次的断片化パターンに基づく分画の使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する1つまたは複数の相違によって特徴付けられる
【0046】
一態様では、ctDNAを分割するための差次的断片化パターンの使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する1つまたは複数の相違によって特徴付けられる
【0047】
一態様では、シーケンシングおよび任意選択の下流解析に先立つ、ctDNAを分割するための差次的断片化パターンの使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する1つまたは複数の相違によって特徴付けられる
【0048】
一態様では、差次的標識/タグ付けのために、ctDNAを分割するための差次的断片化パターンの使用が、本明細書において提供される。
【0049】
一態様では、種々の程度のDNAメチル化へ層別化し、次いで、次世代シーケンシング(NGS)によって定量化されるための、分子結合ドメイン(MBD)-ビーズによって分割されたDNA分子の差次的分子タグ付けの使用が、本明細書において提供される。
【0050】
一態様では、二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析する方法であって、少なくとも2種の形態の各々が複数の分子を含み、方法が、核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグ核酸と連結するステップと、その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて、増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップと、タグに連結されている複数の増幅された核酸をシーケンシングするステップであって、配列データが、少なくとも1種のタグに連結する前に集団中の核酸の形態を明らかにする(real)ために解読されるのに十分である、ステップとを含む、方法が、本明細書において提供される。一実施形態では、分子タグは、1つまたは複数の核酸バーコードを含む。別の実施形態、タグが付けられた核酸分子のプールでは、セット中の任意の2つのバーコードの組合せは、任意のその他のセット中の任意の2つのバーコードの組合せとは異なる組み合わされた配列を有する。
【0051】
別の態様では、タグが付けられた核酸分子のプールであって、プール中の各核酸分子が、複数のタグセットのうち1つから選択される分子タグを含み、各タグセットが、複数の異なるタグを含み、任意の1つのセット中のタグが、任意のその他のセット中のタグとは別個であり、各タグセットが、(i)付着される分子の特徴または分子が由来する親分子の特徴を示し、および(ii)単独で、または付着される分子からの情報と組み合わせて、付着される分子を、同一タグセットに由来するタグを用いてタグが付けられているその他の分子から独特に区別する情報を含有する、タグが付けられた核酸分子のプールが、本明細書において提供される。一実施形態では、分子タグは、分子の反対側の末端に付着された2つの核酸バーコードを含む。別の実施形態では、バーコードは、10から30ヌクレオチドの間の長さである。
【0052】
別の態様では、核酸シーケンサーと;少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと;核酸シーケンサーおよびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析するためのアプリケーションであって、少なくとも2種の形態の各々が複数の分子を含み、アプリケーションが、データリンクを介して核酸シーケンサーから、少なくとも一部にタグが付けられている増幅された核酸の配列データを受け取るソフトウェアモジュールであって、配列データが、核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグが付けられた核酸と連結するステップと、その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップとによって作成される、ソフトウェアモジュールと;増幅された核酸のタグが付けられた核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供することによって、増幅された核酸の配列データをアッセイするソフトウェアモジュールとを含む、アプリケーションを作製するために実行可能な命令をさらに含む、システムが、本明細書において提供される。一実施形態では、アプリケーションは、増幅された核酸のタグが付けられた核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するソフトウェアモジュールをさらに含む。別の実施形態では、アプリケーションは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。
【0053】
別の態様では、次世代シーケンシング(NGS)機器と;少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと;NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、データリンクを介してNGS機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、ヒト試料からDNA分子を物理的に分画して、2種またはそれより多い分割物を作製するステップと、2種またはそれより多い分割物の各々に差次的分子タグおよびNGSを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、NGS機器で分子タグが付けられた分割物をアッセイするステップによって作成される、ソフトウェアモジュールと;試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するためのソフトウェアモジュールと;試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するためのソフトウェアモジュールとを含むアプリケーションを作製するために実行可能な命令をさらに含む、システムが、本明細書において提供される。一実施形態では、アプリケーションは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。
【0054】
別の態様では、次世代シーケンシング(NGS)機器と;少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと;NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、MBD-ビーズによって分画されたライブラリーの分子タグ同定のためのアプリケーションであって、データリンクを介してNGS機器から配列データを受け取るように構成されたソフトウェアモジュールであって、配列データが、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質-ビーズ精製キットを使用して、抽出されたDNA試料を物理的に分画するステップと、各画分または群に差次的分子タグおよびNGSを可能にするアダプター配列の並行適用を実施するステップと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的DNAプライマー配列を使用して続いて増幅するステップと、目的のゲノム領域を標的としながら、再度組み合わされ、増幅された総ライブラリーの濃縮/ハイブリダイゼーションを実施するステップと、試料タグを付加しながら、濃縮された総DNAライブラリーを再度増幅するステップと、異なる試料をプールするステップと、NGS機器で多重でそれらをアッセイするステップとによって作成され、機器によって生成されたNGS配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にMBD分割された分子への試料のデコンボリューションのための配列データを提供する、ソフトウェアモジュールと;独特の分子を同定するために分子タグを使用し、試料を、差次的にMBD分割された分子にデコンボリューションすることによって、配列データの解析を実施するように構成されたソフトウェアモジュールとを含むアプリケーションを作製するために少なくとも1つのプロセッサーによって実行可能な命令をさらに含む、システムが、本明細書において提供される。一実施形態では、アプリケーションは、通信網を介して解析の結果を送信するように構成されたソフトウェアモジュールをさらに含む。
【0055】
上記で提供される概要は、実施形態の例示的リストであり、実施形態の完全なリストであるようには意図されない。
【0056】
参照による援用
本明細書において言及されるすべての刊行物、特許および特許出願は、各個々の刊行物、特許または特許出願が、参照により組み込まれると具体的に、個別に示されるかのように同程度に参照により本明細書に組み込まれる。
特定の実施形態では、例えば以下の項目が提供される。
(項目1)
二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析する方法であって、前記少なくとも2種の形態の各々が、複数の分子を含み、前記方法が、
(a)核酸の前記形態のうち少なくとも1種を、前記形態を互いに区別するために少なくとも1種のタグ核酸と連結するステップと、
(b)その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の前記形態を増幅するステップであって、前記核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち前記少なくとも1種の形態から増幅されたものにタグが付けられている、ステップと、
(c)その少なくとも一部にタグが付けられている前記増幅された核酸の配列データをアッセイするステップであって、前記アッセイするステップによって、前記増幅された核酸の前記タグ核酸分子を解読するのに十分な配列情報を得て、前記集団中の核酸の前記形態を明らかにし、配列データがアッセイされた前記タグ核酸分子に連結された前記増幅された核酸の元の鋳型を提供する、ステップと
を含む、方法。
(項目2)
前記増幅された核酸の前記タグ核酸分子を解読して、前記集団中の核酸の前記形態を明らかにし、配列データがアッセイされた前記タグ核酸分子に連結された前記増幅された核酸の元の鋳型を提供するステップをさらに含む、項目1に記載の方法。
(項目3)
前記形態のうち少なくとも1種を、その他の形態のうち1種または複数に対して濃縮するステップをさらに含む、項目1または2に記載の方法。
(項目4)
前記集団中の核酸の各形態の前記分子の少なくとも70%がステップ(b)において増幅される、項目1または2に記載の方法。
(項目5)
少なくとも3種の形態の核酸が前記集団中に存在し、前記形態のうち少なくとも2種が、前記3種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている、項目1または2に記載の方法。
(項目6)
前記集団中の前記少なくとも3種の形態の核酸の各々が、異なるタグに連結されている、項目5に記載の方法。
(項目7)
同一形態の各分子が、同一の同定タグを含むタグに連結されている、項目1または2に記載の方法。
(項目8)
同一形態の分子が、異なる種類のタグに連結されている、項目1または2に記載の方法。
(項目9)
ステップ(a)が、前記集団を、タグが付けられたプライマーを用いる逆転写に付すステップを含み、前記タグが付けられたプライマーが、前記集団中のRNAから作製されたcDNA中に組み込まれる、項目1または2に記載の方法。
(項目10)
前記逆転写が、配列特異的である、項目9に記載の方法。
(項目11)
前記逆転写がランダムである、項目9に記載の方法。
(項目12)
前記cDNAと二本鎖を形成しているRNAを分解するステップをさらに含む、項目9に記載の方法。
(項目13)
一本鎖DNAを二本鎖DNAから分離するステップと、核酸タグを前記二本鎖DNAにライゲーションするステップとをさらに含む、項目5に記載の方法。
(項目14)
前記一本鎖DNAが、1種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される、項目13に記載の方法。
(項目15)
circligaseを用いて一本鎖DNAを環状化するステップと、核酸タグを前記二本鎖DNAにライゲーションするステップとをさらに含む、項目5に記載の方法。
(項目16)
アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップを含む、項目1に記載の方法。
(項目17)
前記核酸集団が、体液試料に由来する、項目1から16に記載の方法。
(項目18)
前記体液試料が、血液、血清または血漿である、項目17に記載の方法。
(項目19)
前記核酸集団が、無細胞核酸集団である、項目1または2に記載の方法。
(項目20)
前記体液試料が、がんを有すると疑われる対象に由来する、項目18に記載の方法。
(項目21)
前記配列データが、体細胞または生殖系列変異の存在を示す、項目1から20に記載の方法。
(項目22)
前記配列データが、コピー数変異の存在を示す、項目1から21に記載の方法。
(項目23)
前記配列データが、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す、項目1から22に記載の方法。
(項目24)
異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、
前記核酸集団を、前記修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、
前記作用物質と結合している第1のプールの核酸を、前記作用物質と結合していない第2のプールの核酸から分離するステップであって、前記第1のプールの核酸が、前記修飾について過剰提示され、前記第2のプール中の前記核酸が、前記修飾について提示不足である、ステップと、
前記第1のプールおよび/または第2のプール中の前記核酸を、前記第1のプールおよび前記第2のプール中の前記核酸を区別する1種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、
標識された核酸を増幅するステップであって、前記核酸および連結されたタグが増幅される、ステップと、
増幅された核酸および連結されたタグの配列データをアッセイするステップであって、前記アッセイするステップによって、前記タグを解読するための配列データを得て、配列データがアッセイされた前記核酸が、前記第1または前記第2のプール中の鋳型から増幅されたか否かを明らかにする、ステップと
を含む方法。
(項目25)
前記タグを解読して、配列データがアッセイされた前記核酸が、前記第1または前記第2のプール中の鋳型から増幅されたか否かを明らかにするステップを含む、項目24に記載の方法。
(項目26)
前記修飾が、核酸のタンパク質との結合である、項目25または26に記載の方法。
(項目27)
前記タンパク質が、ヒストンまたは転写因子である、項目25または26に記載の方法。
(項目28)
前記修飾が、ヌクレオチドへの複製後修飾である、項目25または26に記載の方法。
(項目29)
前記複製後修飾が、5-メチル-シトシンであり、前記作用物質の核酸との結合の程度が、前記核酸中の5-メチル-シトシンの程度とともに増大する、項目27に記載の方法。
(項目30)
前記複製後修飾が、5-ヒドロキシメチル-シトシンであり、前記作用物質の核酸との結合の程度が、前記核酸中の5-ヒドロキシメチル-シトシンの程度とともに増大する、項目27に記載の方法。
(項目31)
前記複製後修飾が、5-ホルミル-シトシンまたは5-カルボキシル-シトシンであり、前記作用物質の結合の程度が、前記核酸中の5-ホルミル-シトシンまたは5-カルボキシル-シトシンの程度とともに増大する、項目27に記載の方法。
(項目32)
前記作用物質と結合している核酸を洗浄するステップと、前記第1および第2のプールに対して中間の程度に複製後修飾を有する核酸を含む第3のプールとして洗浄物を回収するステップとをさらに含む、項目25または26に記載の方法。
(項目33)
アッセイするステップの前に、前記第1および第2のプールからタグが付けられた核酸をプールするステップを含む、項目25または26に記載の方法。
(項目34)
前記作用物質が、5-メチル結合ドメイン磁気ビーズである、項目25または26に記載の方法。
(項目35)
前記核酸集団が、体液試料に由来する、項目24から34に記載の方法。
(項目36)
前記体液試料が、血液、血清または血漿である、項目35に記載の方法。
(項目37)
前記核酸集団が、無細胞核酸集団である、項目25または26に記載の方法。
(項目38)
前記体液試料が、がんを有すると疑われる対象に由来する、項目35に記載の方法。
(項目39)
前記配列データが、体細胞または生殖系列変異の存在を示す、項目25から38に記載の方法。
(項目40)
前記配列データが、コピー数変異の存在を示す、項目25から39に記載の方法。
(項目41)
項目25から39のいずれかに記載の方法であって、前記配列データが、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示し、
iv)核酸であって、前記核酸および前記連結されたタグが増幅され、NGS機器を用いて分子タグが付けられた分割物をアッセイする、核酸と、
v)前記タグを解読するための配列データを作成するためのソフトウェアモジュールと、
vi)前記タグを解読して、配列データがアッセイされた前記核酸が、前記第1または前記第2のプール中の鋳型から増幅されたか否かを明らかにするために前記配列データを解析するためのソフトウェアモジュールと。
【図面の簡単な説明】
【0057】
図1図1は、RNA、一本鎖DNAおよび二本鎖DNAを分割するための例示的概略図を示している。
【0058】
図2図2は、RNA、一本鎖DNAおよび二本鎖DNAを分割するためのさらなる例示的概略図を示している。
【0059】
図3図3は、異なる程度の5-メチルシトシン表示を含有するDNAを分析するための概略図を示している。
【0060】
図4図4は、メチル化DNAのバイサルファイトシーケンシングのための概略図を示している。
【0061】
図5図5は、異なる程度の5-メチルシトシン表示を含有するDNAを分析するためのさらなる概略図を示している。
【0062】
図6図6は、メチル化DNAのバイサルファイトシーケンシングのためのさらなる概略図を示している。
【0063】
図7図7は、差次的タグ付けの概要を示している。
【0064】
図8図8は、分割法の概要を示している。
【0065】
図9図9は、方法論の概要を示している。
【0066】
図10図10は、分画された核酸分子に関するフラグメントーム(fragmentomic)データ解析を使用する例を示している。ゲノムの位置はX軸で、断片長はY軸でおよびカバー度またはコピーはZ軸で示され、上昇した低または高メチル化の対応する領域が指示されている。
【0067】
図11図11は、正常なおよび肺がん試料のメチル化プロファイリングを示している。
【0068】
図12図12A図12B、および図12Cは、全ゲノムシーケンシングを使用するメチル化プロファイリングを示している。図12Aは、X軸で転写開始部位(TSS)における600bp領域に沿った位置、そしてY軸に沿って高メチル化部位の出現頻度を示している。図12Bは、X軸で転写開始部位(TSS)における600bp領域に沿った位置およびY軸に沿って低メチル化部位の出現頻度を示している。図12Cは、X軸でパーセント高メチル化およびY軸で断片長を示している。
【0069】
図13図13Aおよび図13Bは、MOB3AおよびWDR88のメチル化プロファイリングを示している。図13Aは、X軸でMOB3A遺伝子のゲノム位置を示しており、異なる分画群由来の核酸分子の断片長は別の列により示されている。分画群は、高メチル化、低メチル化、低メチル化と混ざり合った高メチル化(高+低)および比較のための非分画群(MBDなし)を含んでいた。
【0070】
図14図14Aおよび図14Bは、分画および非分画群のメチル化プロファイリングを示している。図14Aは、X軸およびY軸にそれぞれ非分画群(MBDなし)からのおよび分画後の混合分割物からのカバー度を用いたヒートマップを示している。
【0071】
図15図15は、分画および非分画試料についてのヌクレオソーム組織を示している。
【0072】
図16図16は、MBDシグナルの検証を示している。
【0073】
図17図17は、ゲノム領域により推定的に調節されるすべての遺伝子のTSSに入力されたゲノム領域を関連付けることについての統計を示している。X軸はTSSまでの距離をキロ塩基(kb)で示し、Y軸は領域と遺伝子の関連をパーセント(%)で示している。グラフにおけるそれぞれのバーの上には計数されている項目の絶対数が挙げられている。黒色バーで表されているフォアグラウンドゲノム領域は、白色バーで示されているバックグラウンドゲノム領域の上位セットから選択された。バックグラウンドゲノム領域は、ゲノム中のすべての反復エレメントから選択される機能的役割に利用されている反復エレメントであった。
【0074】
図18図18Aおよび図18Bは、AP3D1遺伝子のメチル化プロファイリングを示している。図18Aは、X軸でAP3D1遺伝子のゲノム位置を示しており、異なる群由来の核酸分子についての読み取りデータのカバー度は別々の列により示されている。群は、高メチル化、低メチル化などの分画群、および比較のための非分画群(MBDなし)を含む。TSSはヒートマップの中央に垂直線として示されており、矢印は転写の方向を示している。図18Bは、X軸でパーセント高メチル化、Y軸で断片長を示している。例えば、図18Bでは、非分画核酸試料でのパーセントメチル化は、赤色点線で示されるように約65%であることが可能である。
【0075】
図19図19Aおよび図19Bは、DNMT1遺伝子のメチル化プロファイリングを示している。図19Aは、X軸でDNMT1遺伝子のゲノム位置を示しており、異なる群由来の核酸分子についての読み取りデータのカバー度は別々の列により示されている。群は、高メチル化、低メチル化などの分画群、および比較のための非分画群(MBDなし)を含んだ。TSSはヒートマップの中央に垂直線として示されており、矢印は転写の方向を示している。図19Bは、X軸でパーセント高メチル化、Y軸で断片長を示している。
【0076】
図20図20は、核酸分子の鎖の状態に基づく分画のための手順を示している。
【0077】
図21図21は、核酸分子のssDNAおよびdsDNAへの分画を示している。X軸は、変動する入力DNA(200ngおよび500ng)を有する2つの試料の2つの技術的複製物を示している。Y軸は、定量PCR増幅を使用するオンターゲット分子のコピー数を示している。図は、分画されたcfDNAのそれぞれの群における標的配列の定量的決定を示している。
【0078】
図22図22は、核酸分子のssDNAおよびdsDNAへの分画に続くPCR収量を示している。X軸は、2つの技術的複製物におけるcfDNA入力(200ngおよび500ng)を示し、Y軸はPCR収量をpmolで示している。
【0079】
図23図23は、全ゲノムシーケンシングを使用するプロモーター領域のメチル化プロファイリングを示している。
【0080】
図24図24は、メチル結合ドメインタンパク質を使用して分割されたまたは分画された(MBD分割)核酸分子にタグを付けるための戦略の3つの例を提供している。
【0081】
図25図25Aおよび図25Bは、標的シーケンシングアッセイにおけるMBDおよび非MBD試料についてのカバー度間の比較を示している。
【0082】
図26A図26Aおよび図26Bは、15ngのcfDNA入力および2つの臨床試料(PowerpoolV1およびPowerpoolV2)を使用するパネル内の遺伝子についてのカバー度を示している。
図26B図26Aおよび図26Bは、15ngのcfDNA入力および2つの臨床試料(PowerpoolV1およびPowerpoolV2)を使用するパネル内の遺伝子についてのカバー度を示している。
【0083】
図27A図27Aおよび図27Bは、150ngのcfDNA入力および2つの臨床試料(PowerpoolV1およびPowerpoolV2)を使用するパネル内の遺伝子についてのカバー度を示している。
図27B図27Aおよび図27Bは、150ngのcfDNA入力および2つの臨床試料(PowerpoolV1およびPowerpoolV2)を使用するパネル内の遺伝子についてのカバー度を示している。
【0084】
図28AB図28A図28Bおよび図28Cは、15ngのcfDNA入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。
図28C図28A図28Bおよび図28Cは、15ngのcfDNA入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。
【0085】
図29AB図29A図29Bおよび図29Cは、150ngのcfDNA入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。
図29C図29A図29Bおよび図29Cは、150ngのcfDNA入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。
【0086】
図30図30は、全ゲノムバイサルファイトシーケンシング(WGBS)およびMBD分割により測定された平均メチル化レベル間の相関を示している。
【0087】
図31A図31Aおよび図31Bは、MBD分割(Y軸)を使用するおよび全ゲノムバイサルファイトシーケンシングアッセイ(WGBS、X軸)を使用するメチル化DNAを検出する感度(図31A)および特異性(図31B)を示している。
図31B図31Aおよび図31Bは、MBD分割(Y軸)を使用するおよび全ゲノムバイサルファイトシーケンシングアッセイ(WGBS、X軸)を使用するメチル化DNAを検出する感度(図31A)および特異性(図31B)を示している。
【0088】
図32図32は、デジタル処理デバイスの実施形態を示している
【0089】
図33図33は、アプリケーション提供システムの実施形態を示している
【0090】
図34図34は、クラウドベースアーキテクチャーを用いるアプリケーション提供システムの実施形態を示している。
【発明を実施するための形態】
【0091】
用語「無細胞DNA」および「無細胞DNA集団」とは、本明細書で使用される場合、大型の複雑な生物有機体、例えば、哺乳動物中の細胞(単数または複数)において元々見出され、細胞から、生物体中で見られる液体流体、例えば、血漿、リンパ、脳脊髄液、尿中に放出されたDNAを指し、DNAは、流体の試料を得ることによって、in vitro細胞溶解ステップを実施する必要なく得ることができる。
【0092】
全般
【0093】
本開示は、複雑なゲノム材料中に最初に存在している分子の特徴の(例えば、エピジェネティックまたはその他の種類の構造的)情報の喪失を低減または排除しながら、複雑なゲノム材料を解析するための多数の方法、試薬、組成物およびシステムを提供する。いくつかの実施形態では、遺伝子改変(例えば、SNV、挿入欠失、遺伝子融合およびコピー数変異)を判定する目的で、分子タグを使用して、異なる形態の核酸を追跡し、このような異なる形態を数え上げることができる。いくつかの実施形態では、対象におけるがんなどの状態または胎児の状態を検出、解析またはモニタリングするために本明細書において記載される方法が使用される。いくつかの実施形態では、対象は、妊娠中ではない。
【0094】
本開示は、異なる形態を含有する核酸集団を処理するための方法を提供する。本明細書で使用される場合、異なる形態の核酸は、異なる特徴を有する。例えば、制限するものではないが、RNAおよびDNAは、糖同一性に基づいて異なる形態である。一本鎖(ss)および二本鎖(ds)核酸は、鎖の数に関して異なる。核酸分子は、5-メチルシトシンまたはヒストンなどのタンパク質との会合などのエピジェネティック特徴に基づいて異なり得る。核酸は、異なるヌクレオチド配列、例えば、特定の遺伝子または遺伝子座を有し得る。特徴は、程度の点で異なることもある。
【0095】
例えば、DNA分子は、そのエピジェネティック修飾の程度が異なり得る。修飾の程度は、分子が対象であった修飾事象の数、例えば、メチル化基の数(メチル化の程度)またはその他のエピジェネティック変化を指し得る。例えば、メチル化DNAは、低メチル化または高メチル化であり得る。形態は、特徴の組合せ、例えば、一本鎖-非メチル化または二本鎖-メチル化によって特徴付けることができる。特徴のうち1つまたは組合せに基づく分子の分画は、単一分子の多次元解析にとって有用であり得る。これらの方法は、複数の形態について配列情報を得ることができるように、試料中の核酸の複数の形態および/または修飾に適応する。方法はまた、核塩基配列の解析を、エピジェネティック解析と組み合わせることができるように、処理および解析を通じて最初の複数の形態または修飾状態の同一性を保つ。いくつかの方法は、試料中に存在する複数の形態を解析するのに必要な処理ステップの数を低減しながら、異なる形態または修飾状態の分離、タグ付けおよびその後プールすることを含む。試料中の複数の形態の核酸を解析することは、解析するためのより多い分子があるために(これは、極めて少ない、核酸の総量が利用可能である場合には重要であり得る)、また、異なる形態または修飾状態が異なる情報を提供し得るために(例えば、RNA中にだけ突然変異が存在し得る)、また、異なる種類の情報(例えば、遺伝子のおよびエピジェネティック)を互いに関連付け、それによって、より高い精度、確実性を提供する、または医学的状態との新規相関の発見をもたらすことができるために、幾分かより多い情報を提供する。
【0096】
CpGジヌクレオチドは、正常ヒトゲノムにおいて提示不足(underpresented)であり、CpGジヌクレオチド配列の大部分は、転写的に不活性であり(例えば、染色体の動原体周囲部分中の、および反復エレメント中のDNAヘテロクロマチン領域)、メチル化されている。しかし、多数のCpGアイランドは、特に、転写開始部位(TSS)周囲では、このようなメチル化から保護されている。
【0097】
がんは、メチル化などのエピジェネティック変異によって示される場合がある。がんにおけるメチル化変化の例は、正常な成長制御、DNA修復、細胞周期調節および/または細胞分化に関与する遺伝子の転写開始部位(TSS)でのCpGアイランド中のDNAメチル化の局所増加を含む。この高メチル化は、関与する遺伝子の転写能力の異常な喪失と関連する場合もあり、遺伝子発現の変更の原因としての点突然変異および欠失と少なくとも同程度の頻度で起こる。DNAメチル化プロファイリングを使用して、発生の際に変更された、または疾患、例えば、がんもしくは任意のがん関連疾患によって撹乱されたゲノムの異なる程度のメチル化を有する領域(「差次的にメチル化された領域」または「DMR」)を検出できる。がん細胞のゲノムは、上記のDNAメチル化パターンにおいて、したがって、DNAの機能的パッケージングにおいて不均衡を有する。したがって、クロマチン組織化の異常は、メチル化変化と相まって、一緒に解析された場合にがんプロファイリングの増強に寄与し得る。MBD分割を、断片マッピングされた開始および停止位置(ヌクレオソーム位置と相関する)、断片長および関連ヌクレオソーム占有率などのフラグメントームデータと組み合わせることは、バイオマーカー検出率を改善することを目的とした高メチル化研究におけるクロマチン構造解析のために使用できる。
【0098】
メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを含み得る。例えば、メチル化の程度(例えば、分子1つあたりのメチル化部位の相対数)およびシーケンシングに基づいて分子を分割した後、異なる分割物中の分子の配列を、参照ゲノムに対してマッピングしてもよい。これによって、その他の領域と比べて、より高度にメチル化されている、またはあまり高度にメチル化されていないゲノムの領域を示すことができる。このようにして、個々の分子とは対照的にゲノム領域は、そのメチル化の程度が異なり得る。
【0099】
核酸分子の特徴は、種々の化学修飾またはタンパク質修飾(すなわち、エピジェネティック修飾)を含み得る修飾であり得る。化学修飾の限定されない例として、それだけには限らないが、DNAメチル化を含む共有結合性DNA修飾を挙げることができる。いくつかの実施形態では、DNAメチル化は、CpG部位(核酸配列中のシトシンと、それに続くグアニン)でのシトシンへのメチル基の付加を含む。いくつかの実施形態では、DNAメチル化は、N-メチルアデニン中などのアデニンへのメチル基の付加を含む。いくつかの実施形態では、DNAメチル化は、5-メチル化(シトシンの6炭素環の5番目の炭素の修飾)である。いくつかの実施形態では、5-メチル化は、5-メチルシトシン(m5c)を作製するためのシトシンの5C位へのメチル基の付加を含む。いくつかの実施形態では、メチル化は、m5cの誘導体を含む。m5cの誘導体として、それだけには限らないが、5-ヒドロキシメチルシトシン(5-hmC)、5-ホルミルシトシン(5-fC)および5-カルボキシルシトシン(caryboxylcytosine)(5-caC)が挙げられ
る。いくつかの実施形態では、DNAメチル化は、3Cメチル化(シトシンの6炭素環の3番目の炭素の修飾)である。いくつかの実施形態では、3Cメチル化は、3-メチルシトシン(3mC)を作製するためのシトシンの3C位へのメチル基の付加を含む。メチル化はまた、非CpG部位でも起こり得、例えば、メチル化は、CpA、CpTまたはCpC部位で起こり得る。DNAメチル化は、メチル化DNA領域の活性を変化させ得る。例えば、プロモーター領域中のDNAがメチル化される場合には、遺伝子の転写は、抑制され得る。DNAメチル化は、正常な発生にとって重要であり、メチル化の異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節の破壊、例えば、抑制は、がんなどの疾患を引き起こし得る。DNAにおけるプロモーターメチル化は、がんを示すことがある。
【0100】
タンパク質修飾は、クロマチンの成分、特にその修飾された形態を含むヒストンとの結合およびその他のタンパク質、例えば、複製または転写に関与するタンパク質との結合を含む。本開示は、異なる程度の修飾を有する核酸を、その元の修飾の性質が核酸タグと相関し、核酸が解析される場合にはタグをシーケンシングすることによって解読され得るように処理および解析する方法を提供する。次いで、試料核酸修飾の遺伝的変異を、元の試料中のその核酸の修飾(エピジェネティック変異)の程度と関連付けることができる。
【0101】
本明細書で使用される場合、用語「分画すること」および「分割すること」は、異なる特徴に基づいて分子を分離することを指す。試料中の核酸分子は、1つまたは複数の特徴に基づいて分画され得る。分画は、ゲノム特徴の有無に基づいて核酸分子をサブセットまたは群に物理的に分割することを含み得る。分画は、ゲノム特徴が存在する程度に基づいて核酸分子を分割群に物理的に分割することを含み得る。試料は、差次的遺伝子発現または疾患状態を示す特徴に基づいて1つまたは複数の群の分割物に分画または分割してもよい。試料は、核酸、例えば、無細胞DNA(「cfDNA」)、非cfDNA、腫瘍DNA、循環腫瘍DNA(「ctDNA」)および無細胞核酸(「cfNA」)の解析の際に、正常および罹患状態の間にシグナルの相違を提供する特徴またはその組合せに基づいて分画してもよい。
【0102】
本開示は、核酸分子を効率的に解析するための方法およびシステムを提供する。方法は、核酸分子を、1つまたは複数の特徴に基づいて異なる分割物に分画するステップと、続いて、シーケンシングするステップ(単独または一緒に)と、各分割物中の核酸分子を解析するステップとを含み得る。いくつかの場合には、核酸分子の分割物は、シーケンシングの前および/または後に増幅される。方法は、予後、診断などの種々の用途において、および/または疾患のモニタリングのために使用され得る。
【0103】
核酸分子は、1つまたは複数の特徴のうちいずれによって特徴付けてもよい。核酸分子の特徴は、鎖の状態(strandedness)、タンパク質が結合している領域、核酸長、開始/停止位置、化学修飾またはタンパク質修飾を含み得る。核酸分子の鎖の状態は、一本鎖(例えば、ssDNAまたはRNA)または二本鎖分子(例えば、dsDNA)を含み得る。
【0104】
核酸分子のゲノム特徴は、種々の化学修飾を含み得る修飾であり得る。限定されない例として、化学修飾は、DNAメチル化(5mC)、ヒドロキシルメチル化(5hmC)、ホルミルメチル化(5fC)、カルボキシルメチル化(5CaC)、N-メチルアデニンまたはグリコシル化などの共有結合性DNA修飾を含み得る。DNAメチル化は、DNA(例えば、CpG)へのメチル基の付加を含み、メチル化DNA領域の発現を変化させ得る。例えば、プロモーター領域中のDNAがメチル化される場合には、遺伝子の転写は、抑制され得る。DNAメチル化は、正常な発生にとって重要であり、メチル化の異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節の破壊、例えば、抑制は、がんなどの疾患を引き起こし得る。DNAにおけるプロモーターメチル化は、がんを示すことがある。
【0105】
限定されない例として、一本鎖RNAおよび/またはDNAならびに二本鎖DNAを分割して、試料を特徴付けるステップを含む方法の利益として、以下が挙げられる:
1.dsDNAに加えてssDNAおよびRNA分子からのSNV、CNVおよび挿入欠失コールのさらなる支持、
2.イントロンDNA中の可変切断点が、RNAにおいて規定されたエクソン-エクソン接合部をもたらすので、DNAと比較して、より容易なRNAにおける遺伝子融合の同定(ターゲッティング)、
3.メッセンジャーRNA(mRNA)、マイクロRNA(miRNA)および長鎖ノンコーディングRNA(lncRNA)の同定または差次的発現レベルは、多数の疾患状態の特徴であり得る。がんの早期検出において重要であり得る白血球からの健康な無細胞DNA(cfDNA)に対する、循環腫瘍DNA(ctDNA)集団内のヌクレオソーム位置付けの変化において見られる発現シグネチャーの確認およびさらなる支持 さらに、白血球由来cfDNAおよびcfRNA発現変化も、疾患に対する免疫応答を示すことがある。
4.不安定分子の証拠。より短い循環腫瘍DNA(ctDNA)の捕捉-無細胞DNAの研究によって、腫瘍DNA(ctDNA)の長さは、正常DNAよりも大幅に短いことがあるとわかっている。いくつかの証拠によって、これらのより短い配列は、不安定であり、ssDNAとして存在し得ることが示されている。これらはまた、がんの早期検出において重要であり得るcfDNAと比較した、ctDNAにおける転写因子結合変化に関する情報を提供し得る。同様に、cfDNAはまた、疾患応答を示すことがある、ならびに
5.臨床上関連し得て、一本鎖の「ギャップのある」領域を含有する、損傷を受けた/分解されたDNAの捕捉。
試料中の複数の形態の核酸を解析することは、例えば、シーケンシングに先立って、異なる形態の核酸に差次的にタグを付けることおよび/または異なる形態の核酸を分割することによって起こり得る。
【0106】
II.試料中の異なる核酸形態に差次的にタグを付けること
体液中の無細胞核酸などの核酸の試料は、核酸を、一本鎖および二本鎖DNAならびに一本鎖RNAを含む複数の形態で含有することが多い。このような試料中の核酸の総量は、少ないものであり得るために、また、異なる特徴および/または修飾を有する異なる形態の核酸は、試料に関する異なる情報をもたらし得るために、2、3種またはすべてのこのような形態を解析する方法が、本明細書において提供される。
【0107】
複数の形態の調製および解析は、ステップの少なくとも一部を並行して実施できる場合、より効率的である。このような試料から決定される情報は、処理後の特定の核酸の配列情報を、試料中の核酸の元の形態と相関させることができる場合には最も情報価値がある。例えば、処理後に特定の核酸においてSNVが決定される場合には、その核酸が、元の試料中のRNA、一本鎖DNAまたは二本鎖DNAに由来したかが決定され得る。
【0108】
試料中の異なる形態の核酸の同定は、第2の鎖合成または増幅によってなど、その元の形態をわかりにくくする方法で形態が変更される前の、試料中の異なる形態の核酸の差次的タグ付けによって達成できる。したがって、複数の形態を含む核酸では、少なくとも1種の形態が、試料中に存在する1種または複数のその他の形態からそれを区別するために核酸タグに連結される。一本鎖DNA、一本鎖RNAおよび二本鎖DNAなどの3種の形態の核酸を含有する試料では、3種の形態は、形態のうち少なくとも2種を差次的に標識することによって、または3種すべてを差次的に標識することによって区別され得る。同一形態の核酸分子に連結されたタグは、同一である場合も互いに異なる場合もある。しかし、互いに異なる場合には、タグは、いくつかの実施形態では、付着される分子を特定の形態と同定するために、そのコードの一部が共通であり得る。例えば、特定の形態の核酸分子(nucleic molecules)は、形態A1、A2、A3、A4などのコードを有し得、異なる形態の核酸分子は、B1、B2、B3、B4などのコードを有し得る。このようなコーディングシステムによって、形態間および形態内の分子間両方の区別が可能となる。異なる特徴、例えば、メチル結合ドメインタンパク質を使用して決定されるようなメチル化の程度を有する核酸分子に差次的にタグを付けるための例示的戦略が、図24(以下に記載される)に提供される。
【0109】
核酸タグでの、試料中の1種、いくつかまたはすべての形態の核酸の差次的標識後に、核酸タグが元の試料中の形態と一緒に増幅されるように、形態を増幅できる。次いで、増幅された核酸を、配列解析に付して、元々の試料中の核酸の配列の一部またはすべてならびに連結された核酸タグのものを読み取ることができる。次いで、タグの配列を解読して、元の試料中の核酸の形態を示すことができる。次いで、異なる形態の配列を比較して、遺伝的変異が、ある特定の形態の核酸においてのみ主にもしくは独占的に見られるか、または元の形態とは独立してほぼ同一頻度で生じるのかを確かめることができる。異なる形態の差次的タグ付け後のステップの一部またはすべて、特に増幅およびシーケンシングを、プールされた異なる形態の核酸を用いて実施できる。このような方法は、好ましくは、試料中に存在する2、3種またはそれより多い形態の核酸分子の少なくとも40、50、60、70、80、90または95%の増幅およびシーケンシングをもたらす。
【0110】
二本鎖核酸は、少なくとも部分的に二本鎖のアダプターへのライゲーションによって差次的に標識できる。通常、二本鎖核酸は、このようなアダプターに両末端でライゲーションされる。このようなアダプターのいずれかまたは両方が、核酸タグを含み得る。各々タグを有する2つのアダプターが、核酸のそれぞれの末端に連結される場合には、タグ組合せは、識別子として機能し得る。一本鎖DNAまたはRNA分子は、アダプターの二本鎖末端とは相当な程度にはライゲーションせず、そのため、核酸タグを受け取らない。二本鎖アダプターは、Y型アダプターまたはヘアピンアダプターの場合のように、十分に二本鎖である場合も、部分的に二本鎖である場合もある。Y型アダプターの例示的配列を以下に示す。
ユニバーサルアダプター
【0111】
ユニバーサルアダプター
配列番号1:
【化1】
【0112】
アダプタータグ
配列番号2:
【化2】
【0113】
これらのアダプター配列の末端切断型は、Rohlandら、Genome Res.、2012年5月
;22巻(5号):939~946頁に記載されている。
【0114】
Y型アダプターは一本鎖末端を有するので、それらは、避けられる(例えば、Y型アダプターと結合しないプローブを用いて一本鎖DNAを分離することによって)または一本鎖試料核酸をその他の試料核酸から分離するというその後のステップが実施される予定である場合には、保護される必要があり得る。
【0115】
RNA分子は、それらが、RNA依存性DNAポリメラーゼを有する逆転写酵素が作用し得る試料中の分子の唯一の形態であることによって、核酸タグを用いて差次的に標識することができる。核酸タグは、逆転写をプライムするために使用されるプライマーの5’タグとして導入することができる。逆転写は、ランダムである場合も、配列特異的である場合もある。逆転写後、元のRNA鎖は分解され、続いて、第2の相補的DNA鎖が合成され得る。ここで二本鎖となったDNAを、必要に応じて、平滑末端とし、試料中にすでに存在している二本鎖DNA分子と同様の方法でアダプターにつなげてもよい。あるいは、RNA/DNAハイブリッド分子をアダプターに直接つなげてもよい。
【0116】
一本鎖DNA分子は、分子内リガーゼを用いる処理によって二本鎖DNA分子から分画できる。いくつかの実施形態では、分子内リガーゼは、3’タグを用いてssDNAに差次的にタグを付けるための、CircLigase(商標)ssDNAリガーゼである。ssDNAの環状化を防ぐために分子内リガーゼを用いる処理に先立って、ssDNAを、5’末端で脱リン酸化する。一例では、一本鎖DNAにタグを付着するために使用されるリガーゼは、CircLigase(商標)ssDNAリガーゼである。CircLigase(商標)ssDNAリガーゼは、熱安定性ATP依存性リガーゼである。第2鎖合成は、一本鎖DNAを一方の末端でオリゴヌクレオチドと連結して(例えば、T4 RNAリガーゼを用いて)、プライマー結合部位を提供することと、一本鎖DNAを、ハイブリダイズされる鋳型配列に基づいて延長するためのプライマーとして働く相補的オリゴヌクレオチドとハイブリダイズすること、またはハイブリダイズされる鋳型配列に基づく延長のためのプライマーとして同様に働くランダムオリゴヌクレオチドとのハイブリダイゼーションとを含むいくつかの機序によって起こり得る。1つの方法は、一本鎖リガーゼを使用して、一本鎖DNAライブラリーメンバーに、延長可能な3’末端を有するオリゴヌクレオチドを付加する(Gansauge & Meyer、Nature Protocols、8巻、737頁(
2013年)を参照のこと)。第2のDNA鎖は、プライマー結合部位としてアダプターを使用して埋められる。次いで、5’DNAリン酸化ステップおよび標準(dsDNA)ライゲーションを実施して、ライブラリー分子の5’末端にアダプターを付加する。
【0117】
別の方法では、市販のNEBDirect方法論からのステップを、方法に含めてもよく、一本鎖DNA分子を、第2鎖合成のために配列特異的プライマーとハイブリダイズさせ、続いて、末端修復し、隣接するアダプターにライゲーションする(neb.com/nebnext-direct/nebnext-direct-for-target-enrichmentを参照のこと)。プライマーを含有する
第2のDNA鎖は分解され、そのためシーケンシングされない。別の方法は、5’末端にアダプター配列、そして3’末端にランダム塩基を有するランダムプライマーを使用する。通常6個のランダム塩基があるが、4から9塩基長の間であり得る。このアプローチは、RNA-seqまたはバイサルファイト-シーケンシングのための低投入量/単細胞増幅に特に適している(Smallwoodら、Nat. Methods、2014年8月;11巻(8号):817~820頁)。
【0118】
ssDNAは、ハイブリダイゼーションに先立つ標準変性ステップを省くことによって核酸(NA)プローブによって選択的に捕捉することができる。ssDNA-プローブハイブリッドは、cfNA(無細胞核酸)集団から従来方法(例えば、ストレプトアビジン-ビーズ磁石によって捕捉されるビオチン化DNA/RNAプローブ)によって単離することができる。プローブ配列は、標的特異的であり、また、dsDNAワークフロー、そのワークフローのサブセットを用いるパネルと同一または異なる(例えば、エクソン-エクソン接合部、「ホットスポット」DNA配列でのRNA融合物を標的とする)ものであり得る。すべての一本鎖核酸(ssNA)は、デオキシイノシン、3-ニトロピロールおよび5-ニトロインドールなどの「ユニバーサルヌクレオチド塩基」を有するプローブを利用することによって、このステップで、配列にとらわれない方法で捕捉することができる。
【0119】
図1は、核酸の形態を分離するための例示的スキームを示す。図の上部は、二本鎖DNA、一本鎖DNAおよび一本鎖RNAを含む試料を示す。RNAは、5’RNA同定核酸タグを有する、配列特異的またはランダムポリTプライマーを用いて逆転写される。相補的DNA鎖の合成後、RNA鋳型は、RNアーゼHもしくはNaOHまたは選択的ハイブリダイゼーションによるリボソーム枯渇を用いて分解される。次いで、試料を、試料の変性を行わず、捕捉用プローブ(配列特異的であっても、配列にとらわれないものであってもよい)を用いて処理する。これらのプローブは、一本鎖分子とハイブリダイズし、試料から一本鎖分子を除去する。この例では試料中の二本鎖DNA分子を次いで平滑末端とし、核酸タグを含むアダプターに連結する。この例では、アダプターは、Y型であり、Yの二本鎖アーム部分をDNA分子とライゲーションする。一方、分離された一本鎖核酸を、タグの付着を含む上記で論じられたDNAプロトコールまたはNEBdirectプロトコールによって処理する。
【0120】
図2は、単純化されたワークフローを用いて、最も顕著には5’DNAリン酸化ステップを除去して、二本鎖DNA、一本鎖DNAおよび一本鎖RNAを含む試料を用いて出発するさらなる例示的スキームを示す。試料中の二本鎖DNAを、核酸タグを含むヘアピンアダプターにまずライゲーションする。次いで、試料を5’DNA脱リン酸化し、次いで、RNAをcDNAに変換し、また、異なるタグにライゲーションする。次いで、一本鎖DNAを、図1においてと同様に処理する。いくつかの実施形態では、ヘアピンアダプターは、ライブラリー増幅に先立って2つの鎖に切断することができる。
【0121】
図7は、差次的タグ付けの一実施形態を例示する。ステップ701では、核酸の集団が得られる。核酸は、液体生検試料(血清、血漿または血液)に由来するなどの循環核酸(cNA)であり得る。ステップ702では、核酸の第1の形態に差次的にタグを付けて、第1のタグが付けられた核酸形態および第2のタグが付けられていない核酸形態の混合物(703)を形成する。続いて、ステップ704では、核酸の第2の形態(または残存する核酸)に、異なる標識を用いてタグを付ける。上記の方法は、ステップ704に先立って2種またはそれより多い異なる差次的タグ付けステップ(702)を含み得る。集団中の2種またはそれより多い形態の核酸にタグを付けた後、いくつかの実施形態では、異なる形態を分割できる。異なる形態が分割される場合には、次いで、シーケンシングに先立って差次的にタグが付けられた核酸を一緒にプールすることができ、または別個にシーケンシングできる。異なる形態の核酸の差次的タグ付けは、1つの管または反応容積中で起こり、タグが付けられた分子の全体がシーケンシングされる(分割を伴わずに)ことが好ましい。シーケンシングから得られた読み取りデータを、異なる核酸形態ならびに集団的核酸試料に由来する読み取りデータで実施されるべき解析のために使用できる。
【0122】
いくつかの実施形態では、差次的にタグが付けられる第1の形態の核酸は、dsDNAであり、差次的タグ付けは、第1のセットのタグを含むdsDNA二本鎖アダプターに付着させることによって実施される。次いで、ssDNA(残存する核酸)に異なるセットのタグ(第2のセットのタグ)を用いてタグが付けられる。
【0123】
いくつかの実施形態では、差次的にタグが付けられる第1の形態の核酸は、オープンクロマチン領域に由来するDNAであり、タグ付けは、核酸の集団を、Tn5媒介性トランスポサーゼ活性と接触させることによって実施される。
【0124】
いくつかの実施形態では、差次的にタグが付けられる第1の形態の核酸は、二本鎖核酸であり、タグ付けは、ヘアピンアダプターを二本鎖核酸に付着させることによって実施される。
【0125】
III.異なる程度の修飾を有する核酸の分割
本明細書において記載されるある特定の実施形態では、タグ付けおよびシーケンシングに先立って、異なる形態の核酸の集団を、核酸の1つまたは複数の特徴に基づいて分割できる。不均一な核酸集団を分割することによって、例えば、集団のある画分(または分割物)においてより優勢である希少核酸分子を濃縮することによって希少シグナルを増大することができる。例えば、RNAをDNAから分割することによって、RNA中に存在するが、DNA中には少ない(または存在しない)遺伝的変異を検出できる。同様に、試料を高メチル化および低メチル化核酸分子に分割することによって、高メチル化DNA中に存在するが、低メチル化DNA中には少ない(または存在しない)遺伝的変異をより容易に検出できる。試料の複数の画分を解析することによって、単一分子の多次元解析を実施することができ、したがって、より高い感度を達成することができる。
【0126】
いくつかの例では、不均一核酸試料は、2種またはそれより多い分割物(例えば、少なくとも3、4、5、6または7種の分割物)に分割される。いくつかの実施形態では、各分割物は、差次的にタグが付けられる。次いで、タグが付けられた分割物を、集団的試料調製(prep)および/またはシーケンシングのために一緒にプールする。分割-タグ付け-プールステップは、1回を超えて行われる場合もあり、分割の各ラウンドは、異なる特徴(本明細書において例が提供される)に基づいて行われ、その他の分割物から区別される差次的タグおよび分割手段を使用してタグが付けられる。
【0127】
分割するために使用され得る特徴の例として、配列長、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈降および/またはDNAと結合するタンパク質が挙げられる。得られた分割物は、以下の核酸形態:リボ核酸(RNA)、一本鎖DNA(ssDNA)、二本鎖DNA(dsDNA)、より短いDNA断片およびより長いDNA断片のうち1種または複数を含み得る。いくつかの実施形態では、核酸の不均一集団は、ヌクレオソームと会合する核酸分子とヌクレオソームを欠く核酸分子に分割される。あるいは、またはさらに、核酸の不均一集団は、RNAとDNAに分割される。あるいは、またはさらに、核酸の不均一集団は、一本鎖DNA(ssDNA)と二本鎖DNA(dsDNA)に分割され得る。あるいは、またはさらに、核酸の不均一集団は、1つまたは複数のエピジェネティック修飾を有する核酸と1つまたは複数のエピジェネティック修飾を有さない核酸に分割されてもよい。エピジェネティック修飾の例として、メチル化の有無、メチル化のレベル、メチル化の種類(5’シトシン)ならびにヒストンなどの1種または複数のタンパク質との会合および会合のレベルが挙げられる。あるいは、またはさらに、核酸の不均一集団は、核酸長(例えば、最大160bpの分子と160bpより大きい長さを有する分子)に基づいて分割されてもよい。
【0128】
いくつかの例では、各分割物(異なる核酸形態を代表する)を、差次的に標識し、シーケンシングに先立って分割物を一緒にプールする。その他の例では、異なる形態を別個にシーケンシングする。
【0129】
図8は、本開示の一実施形態を例示する。異なる核酸の集団(801)を、2種またはそれより多い異なる分割物(803a、b)に分割する(802)。各分割物(803a、b)は、異なる核酸形態を代表する。各分割物に、それぞれタグを付ける(804)。タグが付けられた核酸を一緒にプールし(807)、その後シーケンシングする(808)。読み取りデータをin silicoで解析する。タグを使用して、異なる分割物からの読み取りデータを選別する。遺伝的変異を検出するための解析は、分割物毎のレベルならびに全核酸集団レベルで実施できる。例えば、解析は、各分割物中の核酸中の遺伝的変異、例えば、CNV、SNV、挿入欠失、融合を決定するためのin silico解析を含み得る。いくつかの例では、in silico解析は、クロマチン構造を決定することを含み得る。例えば、配列読み取りデータのカバー度またはコピー数を使用して、クロマチン中のヌクレオソーム位置付けを決定できる。より高いカバー度は、ゲノム領域中のより高いヌクレオソーム占有率と相関し得、より低いカバー度は、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域(NDR)と相関し得る。
【0130】
試料は、ヌクレオチドへの複製後修飾および1種または複数のタンパク質との普通、非共有結合性の結合を含む修飾が変化する核酸を含み得る。
【0131】
一実施形態では、核酸の集団は、がんを有すると疑われる、またはこれまでにがんと診断された対象由来の血清、血漿または血液試料から得たものである。核酸は、変動するレベルのメチル化を有するものを含む。メチル化は、任意の1つまたは複数の複製後修飾または転写修飾から生じ得る。複製後修飾は、ヌクレオチドシトシンの修飾、特に、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシンおよび5-カルボキシルシトシンを含む。
【0132】
核酸の分割は、核酸を、メチル化結合タンパク質(「MBP」)のメチル化結合ドメイン(「MBD」)と接触させることによって実施される。MBDは、5-メチルシトシン(5mC)と結合する。MBDは、ビオチンリンカーを介してDynabeads(登録商標)M-280ストレプトアビジンなどの常磁気ビーズに結合される。異なる程度のメチル化を有する画分への分割は、NaCl濃度を増大することによって画分を溶出することによって実施できる。
【0133】
一般に、溶出は、分子1つあたりのメチル化部位の数の関数であり、分子は、増大した塩濃度下でより多いメチル化溶出を有する。DNAを、メチル化の程度に基づいて別個の集団に溶出するために、増大するNaCl濃度の一連の溶出バッファーを使用できる。塩濃度は、約100nm~約2500mM NaClの範囲であり得る。一実施形態では、プロセスは、3種(3)の分割物をもたらす。分子を、第1の塩濃度の、メチル結合ドメインを含む分子を含む溶液と接触させ、その分子はストレプトアビジンなどの捕捉部分に付着され得る。第1の塩濃度では、分子のある集団は、MBDと結合し、ある集団は、結合されないままとなる。結合されない集団は、「低メチル化」集団として分離され得る。例えば、DNAの低メチル化形態を代表する第1の分割物は、低塩濃度、例えば、160nMで結合されないままであるものである。中間のメチル化DNAを代表する第2の分割物は、中間の塩濃度、例えば、100mMから2000mMの間の濃度を使用して溶出される。これはまた、試料から分離される。DNAの高メチル化形態を代表する第3の分割物は、高塩濃度、例えば、少なくとも約2000nMを使用して溶出される。
【0134】
各分割物に差次的にタグを付ける。タグは、タグが関連する分子の特性を示す情報を含有する核酸などの分子であり得る。例えば、分子は、試料タグ(ある試料中の分子を、異なる試料中のものと区別する)、分割タグ(ある分割物中の分子を、異なる分割物中のものと区別する)または分子タグ((独特なおよび非独特なタグ付けシナリオの両方で)異なる分子を互いに区別する)を有し得る。ある特定の実施形態では、タグは、バーコードのうち1つまたは組合せを含み得る。本明細書で使用される場合、用語「バーコード」とは、状況に応じて、特定のヌクレオチド配列を有する核酸分子またはヌクレオチド配列自体を指す。バーコードは、例えば、10から100の間のヌクレオチドを有し得る。バーコードの収集物は、特定の目的のために望まれるように、縮重配列を有し得る、またはある特定のハミング距離を有する配列を有し得る。そのため、例えば、試料指標、分割指標または分子指標は、1つのバーコードまたは各々分子の異なる末端に付着された2つのバーコードの組合せから構成され得る。
【0135】
タグを使用して、個々のポリヌクレオチド集団分割物を標識して、タグ(単数または複数)を、特定の分割物と相関させることができる。いくつかの実施形態では、単一タグを使用して、特定の分割物を標識できる。いくつかの実施形態では、複数の異なるタグを使用して、特定の分割物を標識できる。特定の分割物を標識するために複数の異なるタグを使用する実施形態では、1種の分割物を標識するために使用されるタグのセットを、その他の分割物を標識するために使用されるタグのセットと容易に区別することができる。いくつかの実施形態では、タグは、さらなる機能を有し得、例えば、タグを試料供給源に指標を付けるために、または独特の分子識別子(シーケンシングエラーを突然変異から区別することによって、シーケンシングデータの品質を改善するために使用できる)として使用できる。同様に、いくつかの実施形態では、タグは、さらなる機能を有し得、例えば、タグを、試料供給源に指標を付けるために、または非独特の分子識別子(シーケンシングエラーを突然変異から区別することによって、シーケンシングデータの品質を改善するために使用できる)として使用できる。
【0136】
一実施形態では、分割物タグ付けは、試料タグの等価物を用いて各分割物中の分子にタグを付けることを含む。分割物を再度組み合わせて、分子をシーケンシングした後、試料タグによって、供給源分割物が同定される。別の実施形態では、異なる分割物は、例えば、対バーコードから構成される異なる分子タグのセットを用いてタグが付けられる。このような方法で、各分子バーコードは、供給源分割物を示し、同様に分割物内の分子を区別するのに有用である。例えば、35のバーコードの第1のセットを使用して、第1の分割物中の分子にタグを付けることができ、35のバーコードの第2のセットを使用して、第2の分割物中の分子にタグを付けることができる。
【0137】
タグは、1つまたは複数の特徴に基づいて、すでに分割された分子に付着され得るが、ライブラリー中の最終的なタグが付けられた分子は、その特徴をもはや有さない場合がある。例えば、一本鎖DNA分子は、分割され、タグが付けられ得るが、ライブラリー中の最終的なタグが付けられた分子は、二本鎖である可能性が高い。同様に、RNAは、分割に付され得るが、最終ライブラリー中では、これらのRNA分子に由来するタグが付けられた分子は、DNAである可能性が高い。したがって、ライブラリー中の分子に付着されたタグは、通常、最終的なタグが付けられた分子が由来する「親分子」の特徴を示し、必ずしも、タグが付けられた分子自体の特徴ではない。
【0138】
例えば、バーコード1、2、3、4などを使用して、第1の分割物中の分子にタグを付け、標識し、バーコードA、B、C、Dなどを使用して、第2の分割物中の分子にタグを付け、標識し、バーコードa、b、c、dなどを使用して、第3の分割物中の分子にタグを付け、標識する。差次的にタグが付けられた分割物を、シーケンシングに先立ってプールすることができる。差次的にタグが付けられた分割物を、例えば、Illuminaシーケンサーの同一フローセル中で別個にシーケンシングしてもよく、同時に一緒にシーケンシングしてもよい。
【0139】
シーケンシング後、読み取りデータを解析し、遺伝的変異を検出することを分割物ごとのレベルで、ならびに全核酸集団レベルで実施できる。タグを使用して、異なる分割物からの読み取りデータを選別する。解析は、配列情報、ゲノム座標長およびカバー度またはコピー数を使用して遺伝的変異およびクロマチン構造を決定するためのin silico解析を含み得る。より高いカバー度は、ゲノム領域中のより高いヌクレオソーム占有率と相関し得、より低いカバー度は、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域(NDR)と相関し得る。
【0140】
いくつかの実施形態では、元の集団中の核酸は、DNAおよび/またはRNA、一本鎖および/または二本鎖であり得る。一本鎖対二本鎖の状態に基づいて分割することは、例えば、標識された捕捉用プローブを使用して、ssDNAを分割することおよび二本鎖アダプターを使用して、dsDNAを分割することによって達成できる。RNA対DNA組成に基づいて分割することは、それだけには限らないが、二本鎖アダプターを使用して、dsDNAを分割することおよび捕捉用プローブを用いてまたは用いずに逆転写を使用して、RNAを分割することを含む。
【0141】
親和性作用物質は、所望の特異性を有する抗体、天然結合パートナーもしくはそのバリアント(Bockら、Nat Biotech、28巻:1106~1114頁(2010年);Songら、Nat Biotech、29巻、68~72頁(2011年))または例えば、所与の標的に対する特異性を有するようにファージディスプレイによって選択された人工ペプチドであり得る。
【0142】
本明細書において考慮される捕捉部分の例として、メチル結合ドメイン(MBD)およびメチル結合タンパク質(MBP)が挙げられる。本明細書において考慮されるMBPの例として、それだけには限らないが、以下が挙げられる:
(a)MeCP2は、未修飾シトシンよりも5-メチル-シトシンと優先的に結合するタンパク質である。
(b)RPL26、PRP8およびDNAミスマッチ修復タンパク質MHS6は、未修飾シトシンよりも5-ヒドロキシメチル-シトシンと優先的に結合する。
(c)FOXK1、FOXK2、FOXP1、FOXP4およびFOXI3は、好ましくは、未修飾シトシンよりも5-ホルミル-シトシンと結合する(Iurlaroら、Genome Biol.、14巻、R119(2013年))。
(d)1つまたは複数のメチル化ヌクレオチド塩基に対して特異的な抗体。
【0143】
同様に、異なる形態の核酸を分割することは、ヒストンと結合している核酸を、遊離のまたは結合していない核酸から分離できるヒストン結合タンパク質を使用して実施できる。本明細書において開示される方法において使用できるヒストン結合タンパク質の例として、RBBP4、RbAp48およびSANTドメインペプチドが挙げられる。
【0144】
いくつかの親和性作用物質および修飾について、作用物質との結合は、核酸が修飾を有するか否かに応じて、本質的に全または無の方法で起こり得るが、分離は一定の程度があり得る。このような例では、修飾が過剰提示される核酸は、作用物質と、修飾が提示不足である核酸よりも大きな程度で結合する。あるいは、修飾を有する核酸は、全または無の方法で結合し得る。しかし、次いで、種々のレベルの修飾を、結合する作用物質から逐次溶出できる。
【0145】
例えば、いくつかの実施形態では、分割することは、バイナリーであり得る、または修飾の程度/レベルに基づき得る。例えば、すべてのメチル化断片は、メチル結合ドメインタンパク質(例えば、MethylMinderメチル化DNA濃縮キット(ThermoFisher Scientific)を使用して、非メチル化断片から分割できる。続いて、さらなる分割は、メチル結合ドメインおよび結合された断片を有する溶液中の塩濃度を調整することによって異なるレベルのメチル化を有する断片を溶出することを含み得る。塩濃度が増大するにつれ、より高いメチル化レベルを有する断片が溶出される。
【0146】
いくつかの例では、最終分割物は、異なる程度の修飾(過剰提示または提示不足の修飾)を有する核酸を代表するものである。過剰提示および提示不足は、集団中の鎖1つあたりの修飾の中央値数に対する、核酸によって有される修飾の数によって定義され得る。例えば、試料中の核酸中の5-メチルシトシン残基の中央値数が2である場合には、2個を超える5-メチルシトシン残基を含む核酸は、この修飾では過剰提示され、1またはゼロ個の5-メチルシトシン残基を有する核酸は提示不足である。親和性分離の効果は、結合相中の修飾において過剰提示された核酸について、および非結合相中の(すなわち溶液中の)修飾において提示不足である核酸について濃縮することである。その後の処理前に、結合相中の核酸を溶出してもよい。
【0147】
MethylMinerメチル化DNA濃縮キット(ThermoFisher Scientific)を使用する場合には、逐次溶出を使用して種々のレベルのメチル化を分割できる。例えば、低メチル化分割物(メチル化なし)は、磁気ビーズに付着された、キットに由来するMBDと核酸集団を接触させることによって、メチル化分割物から分離できる。ビーズを使用して、メチル化核酸を非メチル化核酸から分離する。続いて、1つまたは複数の溶出ステップを、逐次実施して、異なるレベルのメチル化を有する核酸を溶出する。例えば、160mMまたはそれより高い、例えば、少なくとも200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1000mMまたは2000mMの塩濃度でメチル化核酸の第1のセットを溶出できる。このようなメチル化核酸が溶出された後、磁性分離をもう一度使用して、より高いレベルのメチル化核酸を、より低いレベルのメチル化を有するものから分離する。溶出および磁性分離ステップを、反復して、低メチル化分割物(メチル化なしを代表する)、メチル化分割物(低レベルのメチル化を代表する)および高メチル化分割物(高レベルのメチル化を代表する)などの種々の分割物を作製してもよい。
【0148】
いくつかの方法では、親和性分離に使用される作用物質に結合された核酸は、洗浄ステップに付される。洗浄ステップは、親和性作用物質に弱く結合された核酸を洗浄除去する。このような核酸は、平均または中央値(すなわち、試料の作用物質との最初の接触時に、固相に結合されたままである核酸と、固相に結合されていない核酸の間の中間)に近い程度に修飾を有する核酸が豊富であり得る。
【0149】
親和性分離は、異なる程度の修飾を有する核酸の少なくとも2種、時には、3種またはそれより多い分割物をもたらす。分割物は、依然として分離されながら、少なくとも1種、通常、2種または3種(またはそれより多い)の分割物の核酸を、普通、アダプターの成分として提供される核酸タグに連結し、異なる分割物中の核酸は、1種の分割物のメンバーを別のものから区別する異なるタグを受け取る。同一分割物の核酸分子に連結されるタグは、同一である場合も互いに異なる場合もある。しかし、互いに異なる場合には、タグは、付着される分子を特定の分割物であると同定するために共通のそのコードの一部を有し得る。
【0150】
図3は、例示的スキームを示す。試料は、異なる程度のメチル化を有する核酸を含み、その一部はまた、遺伝的変異も有する。試料を、シトシンよりも5-メチルシトシンと優先的に結合する親和性試薬に連結された磁気ビーズと接触させる。親和性精製は、核酸の2種の分割物をもたらす。図の左の分割物は、親和性試薬と結合する核酸を表し、5-メチルシトシンが過剰提示される核酸が豊富である。右の分割物は、親和性試薬と結合しない核酸を表し、5-メチルシトシンを欠くまたは提示不足である核酸が豊富である。次いで、2種の分割物を、差次的核酸タグを含むY型アダプターに付着させ、増幅する。次いで、増幅された核酸を、配列データ、遺伝的変異を示す試料核酸の配列および試料核酸が分割される分割物を示し、それによって修飾の程度を示すタグの配列についてアッセイする。
【0151】
図24は、MBD分割およびタグ付けアプローチの例示的例を提供する。ワークフロー(1)において、分割前に分子タグの1つのセット(例えば、35×35タグ)を全試料に適用できる。分割後、この例では、高メチル化および低メチル化形態について、各分割物中の分子を、任意選択で増幅し、次いで、独立にシーケンシングする。ワークフロー(2)では、試料中の分子を、例えば、メチル化特徴に基づいて分割する。各分割物に個別にタグを付け、増幅し、シーケンシングする。ワークフロー(3)では、複数の試料の各々の中の分子を、分割に付し、分割物特異的タグを用いてタグを付け、プールし、増幅する。次いで、それらが由来する試料をデコンボリューションするために、各試料中の分子に試料タグを提供する。
【0152】
いくつかの実施形態では、核酸分子を、特定のタンパク質またはその断片に結合されている核酸分子および特定のタンパク質またはその断片に結合されないものに基づいて異なる分割物に分画できる。核酸分子を、DNA-タンパク質結合に基づいて分画できる。タンパク質-DNA複合体を、タンパク質の特定の特性に基づいて分画できる。このような特性の例として、種々のエピトープ、修飾(例えば、ヒストンメチル化またはアセチル化)または酵素活性が挙げられる。DNAと結合し、分画の基礎として働き得るタンパク質の例として、それだけには限らないが、プロテインAおよびプロテインGを挙げることができる。任意の適した方法を使用して、タンパク質が結合している領域に基づいて核酸分子を分画できる。タンパク質が結合している領域に基づいて核酸分子を分画するために使用される方法の例として、それだけには限らないが、SDS-PAGE、クロマチン-免疫沈降(ChIP)、ヘパリンクロマトグラフィーおよび非対称フィールドフロー分画(AF4)が挙げられる。
【0153】
IV.核酸の5-メチルシトシンパターンの決定
バイサルファイトベースのシーケンシングおよびその変種は、核酸のメチル化パターンを決定する手段を提供する。いくつかの実施形態では、メチル化パターンを決定することは、5-メチルシトシン(5mC)を非メチル化シトシンから区別することを含む。いくつかの実施形態では、メチル化パターンを決定することは、N-メチルアデニンを非メチル化アデニンから区別することを含む。いくつかの実施形態では、メチル化パターンを決定することは、5-ヒドロキシメチルシトシン(5hmC)、5-ホルミルシトシン(5fC)および5-カルボキシルシトシン(5caC)を、非メチル化シトシンから区別することを含む。バイサルファイトシーケンシングの例として、それだけには限らないが、酸化バイサルファイトシーケンシング(OX-BS-seq)、Tet補助バイサルファイトシーケンシング(TAB-seq)および還元バイサルファイトシーケンシング(redBS-seq)が挙げられる。
【0154】
酸化バイサルファイトシーケンシング(OX-BS-seq)は、これまでに記載されたように、5hmCを5fCに最初に変換し、次いで、バイサルファイトシーケンシングを進めることによって、5mCおよび5hmCの間を区別するために使用される。Tet補助バイサルファイトシーケンシング(TAB-seq)もまた、5mcおよび5hmCを区別するために使用できる。TAB-seqでは、5hmCをグリコシル化によって保護する。次いで、Tet酵素を使用して、これまでに記載されたようにバイサルファイトシーケンシングを進める前に5mCを5caCに変換する。還元バイサルファイトシーケンシングは、5fCを修飾されたシトシンから区別するために使用される。
【0155】
全般的に、バイサルファイトシーケンシングでは、核酸試料を2つのアリコートに分け、一方のアリコートを、バイサルファイトを用いて処理する。バイサルファイトは、天然シトシンおよびある特定の修飾シトシンヌクレオチド(例えば、5-ホルミルシトシンまたは5-カルボキシルシトシン)をウラシルに変換するが、その他の修飾シトシン(例えば、5-メチルシトシン、5-ヒドロキシルメチルシトシン)は変換されない。2つのアリコートからの分子の核酸配列の比較は、どのシトシンがウラシルに変換された、および変換されなかったかを示す。結果として、修飾された、および修飾されていないシトシンを決定することができる。試料を2つのアリコートに最初に分けることは、ほんの少量の核酸を含有する試料および/または無細胞DNAを含有する体液などの不均一細胞/組織起源から構成される試料にとって不利である。
【0156】
本開示は、バイサルファイトシーケンシングおよびその変種を可能にする方法を提供する。これらの方法は、集団中の核酸を捕捉部分、すなわち、捕捉または固定され得る標識に連結することによって働く。捕捉部分は、制限するものではないが、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテンおよび磁力によって誘引可能な粒子を含む。抽出部分は、ビオチン/ストレプトアビジンまたはハプテン/抗体などの結合対のメンバーであり得る。いくつかの実施形態では、解析物に付着されている捕捉部分が、磁力によって誘引可能な粒子または遠心分離によって沈降できる大きな粒子などの単離可能な部分に付着されているその結合対によって捕捉される。捕捉部分は、捕捉部分を有する核酸の、捕捉部分を欠く核酸からの親和性分離を可能にする任意の種類の分子であり得る。例示的捕捉部分として、固相に連結されたもしくは連結可能なストレプトアビジンとの結合による親和性分離を可能にするビオチン、または固相に連結されたもしくは連結可能な相補的オリゴヌクレオチドとの結合による親和性分離を可能にするオリゴヌクレオチドがある。捕捉部分を試料核酸に連結した後、試料核酸は、増幅の鋳型として働く。増幅後、元の鋳型は、捕捉部分に連結されたままであるが、アンプリコンは捕捉部分に連結されない。
【0157】
捕捉部分は、増幅および/またはシーケンシングプライマー結合部位も提供し得るアダプターの成分としての試料核酸に連結され得る。いくつかの方法では、試料核酸は、アダプターに、両末端で連結され、両アダプターは捕捉部分を有する。好ましくは、アダプター中の任意のシトシン残基は、バイサルファイトの作用から保護するために5メチルシトシンなどによって修飾される。いくつかの例では、捕捉部分は、切断可能な連結(例えば、光切断可能なデスチオビオチン-TEGまたはUSER(商標)酵素、Chem. Commun.
(Camb).、2015年2月21日;51巻(15号):3266~3269頁を用い
て切断可能なウラシル残基)によって元の鋳型に連結され、その場合には、捕捉部分は、必要に応じて除去され得る。
【0158】
アンプリコンを変性し、捕捉タグのための親和性試薬と接触させる。元の鋳型は、親和性試薬と結合するが、増幅から得られた核酸分子は結合しない。したがって、元の鋳型を、増幅から得られた核酸分子から分離できる。
【0159】
分離または分割後、それぞれの核酸の集団(すなわち、元の鋳型および増幅産物)を、バイサルファイト処理に付し、元の鋳型集団は、バイサルファイト処理を受け、増幅産物は受けないことができる。あるいは、増幅産物をバイサルファイト処理に付し、元の鋳型集団は、付さないことができる。このような処理後、それぞれの集団は、増幅され得る(元の鋳型集団が、ウラシルをチミンに変換する場合には)。集団をまた、濃縮のためにビオチンプローブハイブリダイゼーションに付すことができる。次いで、それぞれの集団を解析し、配列を比較して、どのシトシンが元のものにおいて5-メチル化(または5-ヒドロキシルメチル化)されていたかを決定する。鋳型集団中のTヌクレオチド(ウラシルに変換された非メチル化シトシンに対応する)および増幅された集団の対応する位置でのCヌクレオチドの検出は、未修飾Cを示す。元の鋳型および増幅された集団の対応する位置でのCの存在は、元の試料中の修飾されたCを示す。
【0160】
いくつかの実施形態では、方法は、分子タグが付けられたDNAライブラリーの逐次DNA-seqおよびバイサルファイト-seq(BIS-seq)NGSライブラリー調製を使用する(図4を参照のこと)。このプロセスは、アダプターの標識(例えば、ビオチン)、全ライブラリーのDNA-seq増幅、親分子回収(例えば、ストレプトアビジンビーズプルダウン)、バイサルファイト変換およびBIS-seqによって実施される。いくつかの実施形態では、方法は、バイサルファイト処理を用いるおよび用いない、親ライブラリー分子の逐次NGS調製用増幅によって一塩基解像度で5-メチルシトシンを同定する。これは、2つのアダプター鎖の一方で、BIS-seqにおいて使用される5-メチル化NGS-アダプター(方向性アダプター;5-メチルシトシン置換を有するY型/分岐したもの)を、標識(例えば、ビオチン)を用いて修飾することによって達成できる。試料DNA分子を、アダプターライゲーションし、増幅する(例えば、PCRによって)。親分子のみが標識されたアダプター末端を有するので、それらを標識特異的捕捉方法(例えば、ストレプトアビジン磁気ビーズ)によってその増幅された後代から選択的に回収することができる。親分子は、5-メチル化マークを保持するので、捕捉されたライブラリーでのバイサルファイト変換は、対応するDNA-seqの分子情報を保持しながらBIS-seq時に一塩基解像度の5-メチル化状態をもたらす。いくつかの実施形態では、標準マルチプレックス化NGSワークフローにおける試料タグDNA配列の付加によって、濃縮/NGSに先立ってバイサルファイト処理ライブラリーを未処理ライブラリーと組み合わせてもよい。BIS-seqワークフローと同様に、ゲノムアラインメントおよび5-メチル化塩基同定のためにバイオインフォマティクス解析を実施してもよい。要するに、この方法は、ライブラリー増幅後に、5-メチルシトシンマークを保持する、親の、ライゲーションされた分子を選択的に回収する能力を提供し、それによってバイサルファイト変換されたDNAの並行処理を可能にする。これは、ワークフローから抽出されたDNA-seq情報の品質/感度に対するバイサルファイト処理の破壊的性質を克服する。この方法を用いると、回収されたライゲーションされた親DNA分子(標識されたアダプターによって)は、完全なDNAライブラリーの増幅およびエピジェネティックDNA修飾を誘発する処理の並行適用が可能となる。本開示は、シトシン5-メチル化(5-メチルシトシン)を同定するためのBIS-seq方法の使用を論じるが、これは、制限ではない。ヒドロキシメチル化シトシン(5hmC;OX-BS-seq、TAB-seq)、ホルミルシトシン(5fC;redBS-seq)およびカルボキシルシトシンを同定するためのBIS-seqの変種が開発されている。これらの方法論は、本明細書において記載される逐次/並行ライブラリー調製を用いて実行できる。
【0161】
修飾された核酸解析の代替方法
【0162】
本開示は、修飾された核酸(例えば、メチル化された、ヒストンに連結されたおよび上記で論じられたその他の修飾)を解析するための代替方法を提供する。いくつかのこのような方法では、修飾の程度に応じる集団の分画の前に、異なる程度(例えば、核酸分子1つあたり0、1、2、3、4、5個またはそれより多いメチル基)に修飾を有する核酸の集団を、アダプターと接触させる。アダプターは、集団中の核酸分子の一方の末端または両方の末端のいずれかに付着する。好ましくは、アダプターは、タグの組合せの数が低確率をもたらす十分な数の異なるタグを含み、例えば、同一開始および停止点を有する2種の核酸の95、99または99.9%が、同一組合せのタグを受け取る。アダプターの付着後、核酸が、アダプター内のプライマー結合部位に結合するプライマーから増幅される。アダプターは、同一タグを有するか、異なるタグを有するかにかかわらず、同一または異なるプライマー結合部位を含み得るが、アダプターは、同一プライマー結合部位を含むことが好ましい。増幅後、核酸を、好ましくは修飾を有する核酸と結合する作用物質(これまでに記載されたこのような作用物質など)と接触させる。核酸が、作用物質との結合からの修飾を有する程度が異なる、少なくとも2種の分割物中に核酸を分離する。例えば、作用物質が、修飾を有する核酸に対して親和性を有する場合には、修飾が過剰提示される核酸は(集団における中央値提示と比較して)、作用物質と優先的に結合するが、修飾について提示不足である核酸は、結合しない、または作用物質からより容易に溶出される。分離後、次いで異なる分割物を、通常、並行してであるが個別に、さらなる増幅および配列解析を含むさらなる処理ステップに付すことができる。次いで、異なる分割物からの配列データを比較できる。
【0163】
このような分離を実施するための例示的スキームは、図5に示されている。核酸を、プライマー結合部位およびタグを含むY型アダプターの両末端に連結する。分子を増幅する。次いで、増幅された分子を、5-メチルシトシンと優先的に結合する抗体と接触させることによって分画して、2種の分割物を得る。一方の分割物は、メチル化を欠く元の分子およびメチル化が失われている増幅コピーを含む。他方の分割物は、メチル化を有する元のDNA分子を含む。次いで、2種の分割物を処理し、メチル化分割物のさらなる増幅を用いて別個にシーケンシングする。次いで、2種の分割物の配列データを比較できる。この例では、タグは、メチル化および非メチル化DNA間を区別するために使用されず、むしろ、これらの分割物内の異なる分子間を区別するために使用され、その結果、同一開始および停止点を有する読み取りデータが、同一分子に基づくか、異なる分子に基づくかを決定することができる。
【0164】
本開示は、核酸のうち少なくとも一部が、1個または複数の修飾されたシトシン残基、例えば、5-メチルシトシンおよびこれまでに記載されたその他の修飾のいずれかを含む核酸の集団を解析するためのさらなる方法を提供する。これらの方法では、核酸の集団を、1個または複数の、5C位で修飾されたシトシン残基、例えば、5-メチルシトシンを含むアダプターと接触させる。このようなアダプター中のすべてのシトシン残基も修飾されている、またはアダプターのプライマー結合領域中のすべてのこのようなシトシンが修飾されていることが好ましい。アダプターは、集団中の核酸分子の両末端に付着する。好ましくは、アダプターは、タグの組合せの数が低確率をもたらす十分な数の異なるタグを含み、例えば、同一開始および停止点を有する2種の核酸の95、99または99.9%が、同一組合せのタグを受け取る。このようなアダプター中のプライマー結合部位は、同一である場合も異なる場合もあるが、同一であることが好ましい。アダプターの付着後、核酸が、アダプターのプライマー結合部位に結合するプライマーから増幅される。増幅された核酸を、第1および第2のアリコートに分ける。第1のアリコートを、さらなる処理を用いて、または用いずに配列データについてアッセイする。第1のアリコート中の分子に関する配列データは、核酸分子の最初のメチル化状態にかかわらず、このように決定される。第2のアリコート中の核酸分子を、バイサルファイトを用いて処理する。この処理は、未修飾シトシンをウラシルに変換する。次いで、バイサルファイト処理された核酸を、核酸に連結されたアダプターの元のプライマー結合部位に対するプライマーによってプライムされる増幅に付す。これらの核酸は、アダプターのプライマー結合部位中にシトシンを保持するので、(その増幅産物とは異なり)アダプターに元々連結された核酸分子のみが、ここで増幅可能であるが、増幅産物は、これらのシトシン残基のメチル化を失っており、バイサルファイト処理においてウラシルへの変換を受けている。したがって、少なくとも一部がメチル化されている集団中の元の分子のみが、増幅を起こす。増幅後、これらの核酸を、配列解析に付す。第1および第2のアリコートから決定された配列の比較によって、中でも、核酸集団中のどのシトシンがメチル化を受けたかを示すことができる。
【0165】
この解析のための例示的スキームは、図6に示されている。メチル化DNAを、プライマー結合部位およびタグを含む両末端でY型アダプターに連結する。アダプター中のシトシンは、5-メチル化されている。プライマーのメチル化は、その後のバイサルファイトステップにおいてプライマー結合部位を保護するように働く。アダプターの付着後、DNA分子を増幅する。バイサルファイト処理を用いるおよび用いないシーケンシングのために、増幅産物を2つのアリコートに分ける。バイサルファイトシーケンシングに付されないアリコートを、さらなる処理を用いて、または用いずに配列解析に付すことができる。もう一方のアリコートを、バイサルファイトを用いて処理し、これによって、非メチル化シトシンがウラシルに変換される。シトシンのメチル化によって保護されたプライマー結合部位のみが、元のプライマー結合部位に特異的なプライマーと接触させたときに増幅を支持し得る。したがって、元の分子のみがさらなる増幅に付され、第1の増幅からのコピーは付されない。次いで、さらに増幅された分子を配列解析に付す。次いで、2つのアリコートからの配列を比較できる。図5におけるように、アダプター中の核酸タグは、メチル化および非メチル化DNA間を区別するために使用されず、同一分割物内の核酸分子を区別するために使用される。
【0166】
V.方法の一般特性
1.試料
試料は、対象から単離された任意の生体試料であり得る。試料は、身体試料であり得る。試料として、既知または疑われる固形腫瘍、全血、血小板、血清、血漿、便、赤血球、白血球(white blood cell)または白血球(leucocyte)、内皮細胞、組織生検、脳脊髄液滑液、リンパ液、腹水、間質性または細胞外液、歯肉溝滲出液を含む細胞間空間中の流体、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿などの体組織を挙げることができる。試料は、体液、特に、血液およびその画分ならびに尿が好ましい。試料は、対象から元々単離された形態であってもよく、あるいは細胞などの成分を除去もしくは付加するために、またはある成分を別のものに対して濃縮するためにさらなる処理に付されていてもよい。したがって、解析にとって好ましい体液は、無細胞核酸を含有する血漿または血清である。試料を、対象から単離または得て、試料解析の場所に輸送してもよい。試料を、望ましい温度、例えば、室温、4℃、-20℃および/または-80℃で保存し、発送してもよい。試料を、試料解析の場所で対象から単離または得てもよい。対象は、ヒト、哺乳動物、動物、コンパニオンアニマル、介助動物またはペットであり得る。対象は、がんを有し得る。対象は、がんまたは検出可能ながんの症状を有さない場合もある。対象は、1種または複数のがん療法、例えば、化学療法、抗体、ワクチンまたは生物製剤のうち任意の1種または複数で処置されている場合もある。対象は、緩解状態にあり得る。対象は、がんまたは任意のがん関連遺伝的突然変異/障害に対して感受性であると診断されている場合も、診断されていない場合もある。
【0167】
血漿の体積は、シーケンシングされる領域の所望の読み取りデータ深度に応じて変わり得る。例示的体積は、0.4~40ml、5~20ml、10~20mlである。例えば、体積は、0.5mL、1mL、5mL 10mL、20mL、30mLまたは40mLであり得る。試料採取される血漿の体積は、5~20mLであり得る。
【0168】
試料は、ゲノム等価物を含有する種々の量の核酸を含み得る。例えば、約30ngのDNAの試料は、約10,000(10)ハプロイドのヒトゲノム等価物を、cfDNAの場合には、約2000億(2×1011)の個々のポリヌクレオチド分子を含有し得る。同様に、約100ngのDNAの試料は、約30,000ハプロイドヒトゲノム等価物を、cfDNAの場合には、約6000億の個々の分子を含有し得る。
【0169】
試料は、種々の供給源に由来する、例えば、同一対象の細胞および無細胞物に由来する、異なる対象の細胞および無細胞物に由来する核酸を含み得る。試料は、突然変異を保持する核酸を含み得る。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を保持するDNAを含み得る。生殖系列突然変異とは、対象の生殖系列DNA中に存在する突然変異を指す。体細胞突然変異とは、対象の体細胞、例えば、がん細胞を端緒とする突然変異を指す。試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を保持するDNAを含み得る。試料は、エピジェネティックバリアント(すなわち、化学またはタンパク質修飾)を含んでもよく、エピジェネティックバリアントは、がん関連突然変異などの遺伝的変異の存在と関連する。いくつかの実施形態では、試料は、遺伝的変異の存在と関連するエピジェネティックバリアントを含み、試料は、遺伝的変異を含まない。
【0170】
増幅前の試料中の無細胞核酸の例示的量は、約1fg~約1μg、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば、量は、最大約600ng、最大約500ng、最大約400ng、最大約300ng、最大約200ng、最大約100ng、最大約50ngまたは最大約20ngの無細胞核酸分子であり得る。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ngまたは少なくとも200ngの無細胞核酸分子であり得る。量は、最大1フェムトグラム(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ngまたは200ngの無細胞核酸分子であり得る。方法は、1フェムトグラム(fg)~200ngを得るステップを含み得る。
【0171】
無細胞核酸は、細胞内に含有されない、もしくはそうでなければ細胞に結合されない核酸、または言い換えれば、無傷の細胞を除去した後に試料中に残存している核酸である。無細胞核酸は、ゲノムDNA、ミトコンドリアDNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi相互作用RNA(piRNA)、長鎖ノンコーディングRNA(long ncRNA)またはこれらのいずれかの断片を含む、DNA、RNAおよびそのハイブリッドを含む。無細胞核酸は、二本鎖、一本鎖またはそのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死およびアポトーシスによって体液中に放出され得る。いくつかの無細胞核酸、例えば、循環腫瘍DNA(ctDNA)が、がん細胞から体液中に放出される。その他のものは、健康な細胞から放出される。いくつかの実施形態では、cfDNAは、無細胞胎児DNA(cffDNA)である いくつかの実施形態では、無細胞核酸は、腫瘍細胞によって産生される。いくつかの実施形態では、無細胞核酸は腫瘍細胞および非腫瘍細胞の混合物によって産生される。
【0172】
無細胞核酸は、約100~500ヌクレオチドの例示的サイズ分布を有し、110~約230ヌクレオチドの分子が分子の約90%に相当し、約168ヌクレオチドの最頻値を有し、240~440ヌクレオチドの間の範囲に第2のわずかなピークを有する。
【0173】
無細胞核酸は、溶液中に見られるような無細胞核酸が、無傷の細胞および体液のその他の非可溶性成分から分離される分画または分割ステップによって体液から単離できる。分割は、遠心分離または濾過などの技術を含み得る。あるいは、体液中の細胞を溶解し、無細胞および細胞性核酸を一緒に処理してもよい。一般的に、バッファーの添加および洗浄ステップ後、核酸をアルコールを用いて沈殿させることができる。シリカベースのカラムなどのさらなる精製ステップを使用して、夾雑物または塩を除去してもよい。収率などの手順のある特定の態様を最適化するために反応を通じて、Ct-1 DNAなどの非特異的バルク担体核酸、バイサルファイトシーケンシング、ハイブリダイゼーションおよび/またはライゲーションのためのDNAまたはタンパク質を添加してもよい。
【0174】
このような処理後、試料は、二本鎖DNA、一本鎖DNAおよび一本鎖RNAを含む種々の形態の核酸を含み得る。いくつかの実施形態では、一本鎖DNAおよびRNAは、二本鎖形態に変換され、したがって、それらは、その後の処理および解析ステップに含まれ得る。
【0175】
2.アダプターへのDNA分子の連結
試料中の二本鎖DNA分子および二本鎖DNA分子に変換された一本鎖RNAまたはDNA分子を、アダプターに、いずれか一方の末端または両末端で連結してもよい。通常、二本鎖分子を、4種すべての標準ヌクレオチドの存在下での5’-3’ポリメラーゼおよび3’-5’エキソヌクレアーゼ(またはプルーフリーディング機能)を有するポリメラーゼを用いる処理によって平滑末端とする。クレノウ大断片およびT4ポリメラーゼは、適したポリメラーゼの例である。平滑末端化DNA分子を、少なくとも部分的に二本鎖のアダプター(例えば、Y型またはベル型アダプター)とライゲーションさせることができる。あるいは、相補的ヌクレオチドを、試料核酸およびアダプターの平滑末端に付加して、ライゲーションを容易にすることができる。平滑末端ライゲーションおよび粘着末端ライゲーションの両方が本明細書において考慮される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が平滑末端を有する。粘着末端ライゲーションでは、通常、核酸分子は、「A」オーバーハングを有し、アダプターは、「T」オーバーハングを有する。
【0176】
3.増幅
アダプターと隣接する試料核酸を、PCRおよびその他の増幅方法によって増幅することができる。増幅は、通常、増幅されるべきDNA分子に隣接するアダプター中のプライマー結合部位に結合するプライマーによってプライムされる。増幅方法は、熱サイクルに起因する変性、アニーリングおよび伸長のサイクルを含む場合もあり、転写媒介増幅におけるように等温である場合もある。その他の増幅方法として、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベースの増幅および自家持続性配列ベースの複製が挙げられる。
【0177】
好ましくは、本方法は、T尾部およびC尾部アダプターを用いるdsDNA「T/Aライゲーション」を実施し、その結果、アダプターとの連結前の二本鎖核酸の少なくとも50、60、70または80%の増幅が得られる。好ましくは、本方法は、T尾部アダプター単独を用いて実施される対照方法に対して、増幅される分子の量または数を、少なくとも10、15または20%増大する。
【0178】
4.タグ
バーコードを含むタグを、アダプターに組み込む、またはそうでなければつなげることができる。タグは、その他の方法の中でもライゲーション、オーバーラップ伸長PCRによって組み込むことができる。
【0179】
分子タグ付け戦略
【0180】
分子タグ付けとは、配列読み取りデータが起因する分子を区別することを可能にするタグ付け実行を指す。タグ付け戦略は、独特のタグ付けおよび非独特タグ付け戦略に分けることができる。独特のタグ付けでは、試料中のすべてまたは実質的にすべての分子が異なるタグを有し、その結果、タグ情報のみに基づいて、読み取りデータを元の分子に割り当てることができる。このような方法において使用されるタグは、「独特のタグ」と呼ばれることもある。非独特タグ付けでは、同一試料中の異なる分子が、同一タグを有することがあり、その結果、配列読み取りデータを元の分子に割り当てるために、タグ情報に加えて、その他の情報が使用される。このような情報は、開始および停止座標、分子がマッピングされる座標、開始または停止座標単独などを含み得る。このような方法において使用されるタグは、「非独特タグ」と呼ばれることもある。したがって、試料中のどの分子にも必ずしも独特にタグを付ける必要はない。試料内の同定可能なクラス内に入る分子に独特にタグを付けることで十分である。したがって、異なる同定可能なファミリー中の分子は、タグが付けられた分子の同一性に関する情報を失わずに、同一タグを有し得る。
【0181】
非独特タグ付けのある特定の実施形態では、使用される異なるタグの数は、特定の群のすべての分子が異なるタグを有するという極めて高い可能性(例えば、少なくとも99%、少なくとも99.9%、少なくとも99.99%または少なくとも99.999%があるように十分であり得る。バーコードがタグとして使用される場合およびバーコードが、例えば、ランダムに分子の両末端に付着される場合には、バーコードの組合せは、一緒にタグを構成し得るということは注記されるべきである。この数は、用語では、コール中に入る分子の数の関数である。例えば、クラスは、参照ゲノム上の同一の開始-停止位置にマッピングされるすべての分子であり得る。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域(例えば、最大100個の塩基または遺伝子または遺伝子のエクソン)にわたってマッピングされるすべての分子であり得る。ある特定の実施形態では、クラス中の分子の数、zを独特に同定するために使用される異なるタグの数は、2*z、3*z、4*z、5*z、6*z、7*z、8*z、9*z、10*z、11*z、12*z、13*z、14*z、15*z、I6*z、17*z、18*z、19*z、20*zまたは100*zのいずれか(例えば、下限)と、100,000*z、10,000*z、1000*zまたは100*zのいずれか(例えば、上限)の間であり得る。
【0182】
例えば、約5ng~30ngの無細胞DNAの試料中、特定のヌクレオチド座標におよそ3000分子がマッピングされ、約3から10の間の分子が任意の開始座標を有し、同一の停止座標を共有すると予測される。したがって、すべてのこのような分子に独特にタグを付けるのに、約50~約50,000種の異なるタグ(例えば、約6から220種の間のバーコード組合せ)で十分であり得る。ヌクレオチド座標にわたってマッピングされる3000種の分子すべてに独特にタグを付けるには、約100万~約2000万種の異なるタグが必要となる。
【0183】
一般に、反応における独特または非独特タグバーコードの割り当ては、米国特許出願第20010053519号、第20030152490号、第20110160078号、ならびに米国特許第6,582,908号および米国特許第7,537,898号および米国特許第9,598,731号によって記載される方法およびシステムに従う。タグは、試料核酸にランダムに連結されてもよく、または非ランダムに連結されてもよい。
【0184】
いくつかの実施形態では、タグが付けられた核酸を、マイクロウェルプレート中にロードした後にシーケンシングする。マイクロウェルプレートは、96、384または1536のマイクロウェルを有し得る。いくつかの場合には、それらを、独特のタグのマイクロウェルに対する予測される比で導入する。例えば、ゲノム試料1種あたり約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000より多い独特のタグがロードされるように、独特のタグをロードしてもよい。いくつかの場合には、ゲノム試料1種あたり約2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000または1,000,000,000未満の独特のタグがロードされるように、独特のタグをロードしてもよい。いくつかの場合には、試料ゲノム1種あたりロードされる独特のタグの平均数は、ゲノム試料1種あたり約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000もしくは1,000,000,000未満または約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000もしくは1,000,000,000より多い独特のタグである。
【0185】
好ましい形式は、標的核酸の両末端にライゲーションされた、20~50種の異なるタグバーコードを使用する。例えば、標的分子の両末端にライゲーションされた35種の異なるタグバーコードは、35×35の順列(これは、35種のタグバーコードについて1225に等しい)を作製する。同一の開始および停止点を有する異なる分子が、異なるタグの組合せを受け取る高い確率(例えば、少なくとも94%、99.5%、99.99%、99.999%)を有するためには、このような数のタグで十分である。その他のバーコード組合せは、10から500の間、例えば、約15×15、約35×35、約75×75、約100×100、約250×250、約500×500の任意の数を含む。
【0186】
いくつかの場合には、独特のタグは、予め決定された、またはランダムまたは半ランダムな配列のオリゴヌクレオチドであり得る。その他の場合には、複数のバーコードを使用してもよく、その結果、バーコードは必ずしも複数において互いに独特ではない。この例では、バーコードを個々の分子にライゲーションしてもよく、その結果、バーコードおよびライゲーションされ得る配列の組合せが、独特の配列を作り出し、これを個別に追跡してもよい。本明細書において記載されるように、配列読み取りデータの始まり(開始)および終了(停止)部分の配列データと組み合わせた非独特バーコードの検出によって、独特の同一性を特定の分子に割り当てることが可能となり得る。個々の配列読み取りデータの塩基対の長さまたは数も、このような分子に独特の同一性を割り当てるために使用してもよい。本明細書において記載されるように、独特の同一性が割り当てられている核酸の一本鎖に由来する断片は、それによって、親の鎖に由来する断片のその後の同定を可能にし得る。
【0187】
5.標的濃縮
ある特定の実施形態では、試料中の核酸を、標的配列を有する分子が、その後の解析のために捕捉される標的濃縮に付すことができる。標的濃縮は、ビオチンなどの捕捉部分を用いて標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を含み得る。プローブは、遺伝子などの領域のパネル中にタイルを貼るように選択される配列を有し得る。いくつかの実施形態では、ベイトセットは、目的のより特異的に望まれる配列についてより高い相対濃度を有し得る。このようなベイトセットは、標的分子のベイトとのハイブリダイゼーションを可能にする条件下で試料と組み合わされる。次いで、捕捉部分を使用して、捕捉された分子を単離する。例えば、ビーズベースのストレプトアビジンによるビオチン捕捉部分。このような方法は、例えば、2017年2月7日に出願されたUSSN 15/426,668(米国特許第9,850,523号、2017年12月26日に発行)にさらに記載されている。
【0188】
6.シーケンシング
先行する増幅を伴ってまたは伴わずに、アダプターに隣接する試料核酸をシーケンシングに付すことができる。シーケンシング方法として、例えば、サンガー(Sanger)シーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、RNA-Seq(Illumina)、デジタル遺伝子発現(Helicos)、次世代シーケンシング(NGS)、合成による単一分子シーケンシング(SMSS)(Helicos)、大量並列シーケンシング、クローナル単一分子アレイ(Solexa)、ショットガンシーケンシング、Ion Torrent、Oxford Nanopore、Roche Genia、マキシム-ギルバート(Maxim-Gilbert)シーケンシング、プライマーウォーキング、PacBioを使用するシーケンシング、SOLiD、Ion TorrentまたはNanoporeプラットフォームが挙げられる。シーケンシング反応は、複数のレーン、複数のチャネル、複数のウェルまたは複数の試料セットを実質的に同時に処理するその他の手段であり得る種々の試料処理ユニットで実施できる。試料処理ユニットはまた、複数の実施を同時に処理可能にする複数の試料チャンバーを含み得る。
【0189】
シーケンシング反応は、1またはそれより多い形態(one more forms)の核酸で実施でき、そのうち少なくとも1つは、がんのまたはその他の疾患のマーカーを含有するとわかっている。シーケンシング反応はまた、試料中に存在する任意の核酸断片で実施できる。シーケンシング反応は、少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%のゲノムの配列カバー度を提供し得る。その他の場合には、ゲノムの配列カバー度は、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%または100%未満であり得る。配列カバー度は、少なくとも5、10、20、70、100、200もしくは500種の異なる遺伝子、または最大でも5000、2500、1000、500もしくは100種の異なる遺伝子で実施してもよい。
【0190】
同時シーケンシング反応は、マルチプレックスシーケンシングを使用して実施してもよい。いくつかの場合には、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000のシーケンシング反応を用いて無細胞核酸をシーケンシングしてもよい。その他の場合には、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満のシーケンシング反応を用いて無細胞核酸をシーケンシングしてもよい。シーケンシング反応は、逐次実施しても、同時に実施してもよい。その後のデータ解析は、シーケンシング反応のすべてで実施しても、一部で実施してもよい。いくつかの場合には、データ解析は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000のシーケンシング反応で実施してもよい。その他の場合には、データ解析を1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000未満のシーケンシング反応で実施してもよい。例示的読み取りデータ深度は、遺伝子座(塩基)1つあたり1000~50000読み取りデータである。
【0191】
7.解析
本方法を使用して、状態を特徴付ける(例えば、がんをステージ分類する、またはがんの不均一性を決定する)ため、状態の処置に対する応答をモニタリングするため、状態を発生する、または状態のその後の経過の有効な予後リスクのために、対象における状態、特に、がんの存在を診断できる。本開示はまた、特定の処置選択肢の有効性の決定において有用であり得る。処置が成功する場合には、より多くのがんが死滅し、DNAを流し出す可能性があるので、成功する処置選択肢は、対象の血液において検出されるコピー数変異または希少突然変異の量を増大させ得る。その他の例では、これは、起こらない可能性がある。別の例では、おそらくある特定の処置選択肢は、経時的にがんの遺伝子プロファイルと相関し得る。この相関は、療法の選択において有用であり得る。さらに、がんが、処置後に緩解状態にあると観察される場合には、本方法を使用して、残存する疾患または疾患の再発をモニタリングできる。
【0192】
検出され得るがんの種類および数は、血液がん、脳がん、肺がん、皮膚がん、鼻がん、咽頭がん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固体状態腫瘍、不均一腫瘍、均一腫瘍などを含み得る。がんの種類および/またはステージは、突然変異、希少突然変異、挿入欠失、コピー数変異、トランスバージョン、転位置、反転、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造の変化、遺伝子融合、染色体融合、遺伝子末端切断、遺伝子増幅、遺伝子重複、染色体病変、DNA病変、核酸の化学修飾における異常な変化、エピジェネティックパターンにおける異常な変化および核酸5-メチルシトシンにおける異常な変化を含む遺伝的変異から検出され得る。
【0193】
遺伝子データはまた、特定の形態のがんを特徴付けるために使用できる。がんは、組成およびステージ分類の両方において不均一であることが多い。遺伝子プロファイルデータは、その特定の亜種の診断または処置において重要であり得る、がんの特定の亜種を特徴付けることを可能にし得る。この情報はまた、対象または施術者に特定の種類のがんの予後に関する手がかりを提供し、対象または施術者のいずれかが、疾患の進行に従って処置選択肢を適合させることを可能にし得る。いくつかのがんは、より攻撃的に、遺伝子的に不安定になるように進行し得る。その他のがんは、良性で、不活性または休止状態のままであり得る。本開示のシステムおよび方法は、疾患進行の決定において有用であり得る。
【0194】
本解析はまた、特定の処置選択肢の有効性の決定において有用である。処置が成功する場合には、より多くのがんが死滅し、DNAを流し出す可能性があるので、成功する処置選択肢は、対象の血液において検出されるコピー数変異または希少突然変異の量を増大させ得る。その他の例では、これは、起こらない可能性がある。別の例では、おそらくある特定の処置選択肢は、経時的にがんの遺伝子プロファイルと相関し得る。この相関は、療法の選択において有用であり得る。さらに、がんが、処置後に緩解状態にあると観察される場合には、本方法を使用して、残存する疾患または疾患の再発をモニタリングできる。
【0195】
本方法はまた、がん以外の状態において遺伝的変異を検出するために使用できる。B細胞などの免疫細胞は、ある特定の疾患の存在時に迅速なクローン性増殖を起こし得る。クローン性増殖は、コピー数変異検出を使用してモニタリングしてもよく、ある特定の免疫状態をモニタリングしてもよい。この例では、コピー数変異解析を経時的に実施して、特定の疾患がどのように進行し得るのかのプロファイルを作成してもよい。コピー数変異またはさらには希少突然変異検出を使用して、病原体の集団が、どのように感染の過程の間に変化するかを決定してもよい。これは、HIV/AIDSまたは肝炎感染症などの慢性感染の際に特に重要であり得、それによって、ウイルスが、感染の過程の間に、生活環状態を変化させ、および/またはより病原性の形態に突然変異し得る。本方法を、免疫細胞が移植組織を破壊しようとする際の、宿主身体の拒絶活性を決定する、またはプロファイルして、移植組織の状態をモニタリングし、ならびに処置の過程を変更するまたは拒絶を予防するために使用してもよい。
【0196】
さらに、本開示の方法を、対象における異常な状態の不均一性を特徴付けるために使用してもよい。このような方法は、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝子プロファイルを作成することを含むことがあり、遺伝子プロファイルは、コピー数変異および希少突然変異解析に起因する複数のデータを含む。いくつかの実施形態では、異常な状態はがんである。いくつかの実施形態では、異常な状態は、不均一ゲノム集団をもたらすものであり得る。がんの例では、いくつかの腫瘍が、がんの異なるステージの腫瘍細胞を含むとわかっている。その他の例では、不均一性は、複数の病巣を含み得る。やはり、がんの例では、おそらくは、1つまたは複数の病巣が、原発部位から広がった転移の結果である複数の腫瘍病巣がある場合がある。
【0197】
本方法は、不均一疾患中の異なる細胞に由来する遺伝情報の総和である、フィンガープリントまたはデータのセットを作成する、またはプロファイルするために使用してもよい。このデータのセットは、コピー数変異および突然変異解析を単独または組み合わせて含み得る。
【0198】
本方法を、がんまたはその他の疾患を診断、予後予測、モニタリングまたは観察するために使用してもよい。いくつかの実施形態では、本明細書における方法は、胎児を診断すること、予後予測することまたはモニタリングすることを含まず、したがって、非侵襲的出生前検査を対象としない。その他の実施形態では、これらの方法論を、そのDNAおよびその他のポリヌクレオチドが、母体の分子と共循環し得るまだ生まれていない対象におけるがんまたはその他の疾患を診断、予後予測、モニタリングまたは観察するために、妊娠中の対象において使用してもよい。
【0199】
NGSによるMBD-ビーズ分割されたライブラリーの分子タグ同定のための例示的方法は、以下のとおりである:
1.下流処理のためにプロセスからのすべての溶出物を残しておきながら、メチル結合ドメインタンパク質-ビーズ精製キットを使用して抽出されたDNA試料(例えば、ヒト試料から抽出された血漿DNA)を物理的に分画すること。
2.各画分に差次的分子タグおよびNGSを可能にするアダプター配列を並行適用すること。例えば、高メチル化、残存メチル化(「洗浄」)および低メチル化分割物を、分子タグを有するNGSアダプターとライゲーションさせる。
3.すべての分子タグが付けられた分割物を再度組み合わせて、アダプター特異的DNAプライマー配列を使用して続いて増幅すること。
4.再度組み合わされ、増幅された総ライブラリーを、目的のゲノム領域(例えば、がん特異的遺伝的変異および差次的にメチル化された領域)を標的としながら濃縮/ハイブリダイゼーションすること。
5.試料タグを付加しながら、濃縮された総DNAライブラリーを再度増幅すること。異なる試料をプールし、NGS機器で多重でアッセイする。
6.独特の分子を同定するために使用される分子タグと、同様に、差次的にMBD分割された分子への試料のデコンボリューションを用いる、NGSデータのバイオインフォマティクス解析。この解析は、標準遺伝子シーケンシング/遺伝的変異検出と一致する、ゲノム領域についての相対的な5-メチルシトシンに関する情報をもたらし得る。
【0200】
VI.開示を実行する様式
本開示は、無細胞核酸(cfNA)集団を、1つまたは複数の類似する特徴を共有する分割物に分割することを含む方法を提供する。
【0201】
本開示の方法は、一本鎖核酸(ssNA;ssDNA、RNA)とdsDNAを分割するように実施することが可能であり、dsDNA分子は標準ライブラリー調製を通じて調製され、ssNAは補助ライブラリー調製ワークフローで調製され、このワークフローは元の生体分子タイプ(すなわち、RNA、ssDNA、dsDNA)についての情報を保持しつつ、ssNAを濃縮、シーケンシング(例えば、NGS)、および分析を施すことが可能な形態に変換する。
【0202】
cfNA包括的ライブラリー調製でのアプローチは、(a)RNAを同定可能なssDNAに変換することおよび(b)並行するNGSライブラリー調製のためにssDNAとdsDNA分子を分割すること、(c)続いて、(任意選択の)標的濃縮、(d)配列を用いて分子タイプを同定するためのNGSおよび下流データ解析を含むことが可能である(図1参照)。
【0203】
いくつかの実施形態では、cfNA集団のdsDNA特異的NGSアダプターライゲーションを、RNA分子タグ付け、特異的ライゲーション、cDNA変換、およびNGSライブラリー調製に先立って実施することが可能である。同時シーケンシング法は、図2に示されるように、dsDNA、次にRNAがNGSライブラリー作成のために分割なしで順次ライゲーションされるが、cfNA試料に適用可能である。
【0204】
いくつかの実施形態では、プラットホームライゲーションは、ssDNA5’および3’末端を有するライゲーションされたds-cfDNA分子を生成するY字型のまたは「分岐した」アダプターを使用する。これらの末端は、同時シーケンシングまたは従来のssDNAライブラリー調製法においてRNAリガーゼ(またはCircligase(商標)II)により誤ってライゲーションされることがある。Y字型のアダプターの末端を「ヘアピン」または「バブル」に変更することにより、ライゲーションされたcf-dsDNA分子はもはやssDNA末端がなく、同時シーケンシング/従来のDNAライブラリー調製においてそれに続くssNAライゲーションの基質ではなくなる。したがって、遊離のssDNA末端を含有しないNGSアダプターを新たに考案することにより、分子タイプの分割なしで、dsDNAワークフローに加えて、RNAおよびssDNAライブラリー調製が可能になる。
【0205】
本開示の方法は、分子タグ付け尾部を有する遺伝子特異的/ランダム/ポリT DNAプライマーを使用し、逆転写酵素を用いてcfNA集団に実施し、それに続いてRNアーゼHまたはNaOH加水分解によりRNAを除去し、タグが付けられたssDNA(cDNA)を産生してそれぞれのRNA分子を置換することが可能である。選択的ハイブリダイゼーションによるリボソームRNA枯渇などの、当業者には公知である追加の方法論を用いれば、望ましくないRNA配列を除去することが可能である。
【0206】
ssDNAは、ハイブリダイゼーションに先立つ標準変性ステップの省略により、NAプローブによって選択的に捕捉することが可能である。ssDNA-プローブハイブリッドは、当技術分野で公知の方法(例えば、ビオチン化DNA/RNAプローブ、ストレプトアビジン-ビーズ磁石により捕捉される)によってcfNA集団から単離することが可能である。プローブ配列は標的特異的であり、dsDNAワークフロー付きのパネル、そのワークフローのサブセットと同じであり、または異なっていることが可能である(例えば、エクソン-エクソン接合部でのRNA-融合、「ホットスポット」DNA配列を標的にする)。さらに、すべてのssNAは、デオキシイノシン、3-ニトロピロール、および5-ニトロインドールなどの「ユニバーサルヌクレオチド塩基」を有するプローブを利用することにより、このステップにおいて、配列にとらわれない方法で捕捉することが可能である。
【0207】
DNAシーケンシングにより同定される、SNV、挿入欠失、遺伝子融合、およびCNVなどの遺伝子変異に加えて、エピジェネティック変異(5-メチルシトシン、ヒストンメチル化、ヌクレオソーム位置付け、ならびにマイクロ-および長い非コードRNA発現)が、がんなどの疾患進行をもたらすまたはこれに関与することがある。エピジェネティックマーカーのハイスループットな測定は、エピジェネティックマークのタイプごとに特別に開発された複雑な分子生物学技法が必要である。したがって、エピジェネティックシーケンシングプロジェクトは典型的にはDNA(遺伝子)シーケンシングとは並行しており、大量の入力を必要とする。言い換えると、多分析物バイオマーカー検出は試料破壊を伴う。
【0208】
無細胞DNAの遺伝子(DNA)シーケンシングとエピジェネティックシーケンシングの両方が、非侵襲性出生前検査(NIPT)およびがんモニタリング/検出にとって診断学的価値がある。両方の用途では、遺伝物質の量は限られており、稀な分子事象を同定するのが最重要である。したがって、現在の方法論を用いて、エピジェネティックシーケンシングを実施すれば、それぞれのタイプのマーカーが専用の試料を必要とするので、遺伝子バリアントを検出する感度が低下する。
【0209】
本開示は、DNA 5-メチルシトシンのエピジェネティック過程に関する情報を得る方法を提供するが、5-メチルシトシンについて概要を述べた「分子タグを用いた分割」法は他のエピジェネティック機構にも適用可能である。同様に、5-メチルシトシン(5mC)同定について本開示において概要を述べたように、NGS-アダプターライゲーションされた親DNA分子を標識し回収することを使用すれば、他のエピジェネティックDNA修飾マーカー(例えば、ヒドロキシメチル化、ホルミル、およびカルボキシル;それぞれ5hmC、5fC、および5caC)も同定することが可能になる。
【0210】
5-メチルシトシンに関して、バイサルファイトシーケンシングはこれまでもっとも普及しているアプローチであり、5-メチルシトシン塩基を一塩基の解像度で決定することができる。この方法は、すべてのシトシン塩基に作用する化学的処理(バイサルファイト)を含み、その塩基をそれが5-メチル化または5-ヒドロキシルメチル化されていなければウラシルに変換する。バイサルファイト処理に続くシーケンシングにより、5-メチル化シトシンおよび5-ヒドロキシメチル化シトシン残基はシトシンとして検出されることになり、非メチル化シトシン、5-ホルミルメチル化シトシン、および5-カルボキシルメチル化シトシンはチミンとして検出される。バイサルファイトシーケンシングの変形形態は、すでに記載されているが、5mC、5hmC、5fC、および5caCをさらに区別することが可能である。このアプローチの主な弱みは、遺伝物質の大多数が失われることである。過酷なバイサルファイト処理は入力DNAの99%未満を分解し、したがって、試料の分子複雑さおよび達成可能な検出限界を低減する。現在の分子生物学DNA増幅技法(例えば、PCR、LAMP、RCA)はシトシンの5-メチル化状態にとらわれておらず、したがって、5-メチル化マークは増幅とともに失われる。これは液体生検の用途には極めて望ましくない。さらに、バイサルファイト変換DNAライブラリーを用いると、体細胞バリアントを検出するのがより困難になる(例えば、非メチル化シトシンからC->T SNVを識別すること)。したがって、バイサルファイト処理DNAは液体生検の用途では遺伝子バリアント検出には使用されない。DNAに関する5-メチルシトシン分析および遺伝子バリアントコーリングを実施するには試料を分けることが必要となるが、これはそれぞれのワークフローにおける入力/検出の感度を低減し、単一分子上での5-メチルシトシン情報と遺伝子バリアントの両方の同定を妨げる。
【0211】
ある特定の実施形態では、核酸はメチル化差異に基づいて分割される。核酸の「高メチル化」および「低メチル化」形態は、使用される特定の分割法により識別されるメチル化の特定の程度を、それぞれ上回るおよび下回る分子として定義することが可能である。例えば、分割法は、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つまたは少なくとも6つのメチル化ヌクレオチドを有する分子を選択することができる。メチル化の程度とは、核酸断片におけるメチル化ヌクレオチドの数のことである。DNA試料中相対的に「高メチル化」されているDNA分子を同定することは、メチル結合ドメイン(MBD)タンパク質、またはその断片もしくはバリアントに結合する分子を捕捉することにより達成することが可能である。MBDはメチル-CpG-結合ドメインと呼ぶことも可能である。MBDタンパク質は磁気ビーズと複合体化することが可能である。いくつかの実施形態では、MBDに結合するタンパク質は、MECP2、MBD1、MBD2、MBD3、MBD4、またはその断片もしくはバリアントである。5-メチル化部位はこの方法(バイサルファイト変換ではない)で直接指示されるわけではないが、オーバーラップしている高メチル化断片のバイオインフォマティクス解析は5-メチルシトシンの特定の部位(複数可)を決定することが可能である。この方法の主要な欠点は、高メチル化分割物のみをシーケンシングすることにより、メチル化されていないヒトゲノムの大多数(約80~97質量%)がシーケンシングされず、このため遺伝子バリアント(例えば、SNV、挿入欠失、およびCNV)の同定が妨げられる/制限されることである。なぜならば、これらのバリアントは低カバー度領域であるまたは高メチル化分割物には全く存在しないからである。
【0212】
本開示は、同じ低入力試料において稀な遺伝子バリアントを検出する(例えば、液体生検ワークフロー)ために、5-メチルシトシンデータを得るためのおよびシーケンシングデータを得るための方法を提供する。例えば、MBD分画およびタグ付けを含むアプローチは試料中の核酸にとって破壊的ではなく、増幅後のゲノム複雑さを保存する。さらに、分画-タグ付けアプローチ(例えば、MBD分画およびタグ付け)は、差次的に分割された核酸分子を再度組み合わせればゲノム複雑さの保存を確実にすることが可能であり、多分析物バイオマーカー検出(遺伝子バリアントおよびエピジェネティックバリアント)を可能にする。これとは対照的に、他のアプローチは試料中の核酸にとって破壊的である場合がある。こうした他のアプローチは、核酸分子の1つの画分または群のみが分析される場合(例えば、高メチル化核酸分子)には、バイサルファイトシーケンシング、メチル感受性制限酵素消化、およびMBD濃縮を含むことができる。例えば、バイサルファイトシーケンシングは核酸分子に物理的な損傷を生じさせる。メチル感受性制限酵素消化は、メチル化されていない画分を破壊することによりゲノム複雑さを低減し、メチル化された核酸のみを無傷のままにしておく。MBD濃縮は、MBD結合核酸分子のみを分析する場合には、同様に使用して試料中の単一画分の核酸のみを単離することができる。単一画分の核酸分子のみを分析するアプローチは、非濃縮部分に存在する核酸分子についての情報を破壊する。
【0213】
5-メチルシトシンデータ(または他のメチル化状態データ)を得るために本明細書で提供される方法は、一本鎖核酸および二本鎖核酸情報を得るための上記の方法と組み合わせて実行することが可能である。いくつかの実施形態では、本明細書の方法は、MBD-ビーズにより様々な程度のメチル化に分割されているDNA分子を差次的にタグを付けることにより高メチル化DNAの%を定量化する(図3参照)。この方法では、MBD分割プロトコールからのすべての溶出液は回収することが可能であり、NGS-ライブラリーはそのMBD分割物に対応する分子タグの異なるセットを用いて調製することが可能である。したがって、MBD分割プロセスは、典型的なバイサルファイト処理での存在する物質の喪失を低減する。ライゲーションされた分割物は増幅/濃縮/NGS前に再度組み合わせることが可能なので、DNAシーケンシングワークフローにある欠点は最小である。MBDは二本鎖DNA(dsDNA)に結合し、したがって、MBD分割は試料DNAの二本鎖性質を保持しており、感度の良いDNAシーケンシング法による二本鎖分子タグ付けが可能になる。
【0214】
MBD分割された分子タグNGSワークフローでは、分子タグは2つの目的、すなわち、試料から独特のDNA分子を同定すること(タグとゲノム開始/終始座標の組み合わせにより)および分子の相対的5-メチルシトシンレベルを示すこと、にかなうことが可能である。分子タグを使用すれば、独特の核酸分子を同定し計数することが可能である。この情報を使用すれば増幅不均衡を計算することが可能になる。分子タグは試料の最初の複雑さを識別することを可能にする。分子タグ付けを使用すれば、不揃いな増幅がある場合でも試料中の核酸分子を同定し計数することが可能になる。上記の方法論は、5-メチルシトシンの程度による物理的分割、差次的分子タグの適用、DNA-seqと同時の、遺伝子シーケンシング/バリアント検出のために利用されるそれぞれの分子の端緒となる分割物の任意選択のライブラリーの再度の組み合わせ、濃縮、NGSおよびバイオインフォマティクスデコンボリューションを記載している。方法論は、メチル化結合タンパク質(MBD)分割の代わりに、DNA分子の二本鎖性質を保持する異なるDNA-およびタンパク質-結合エレメントを使用することにより、他のエピジェネティック相互作用を特徴づけることに拡張できる。例えば、種々の免疫沈降プロトコールにおいて使用されるヒストン、修飾ヒストン、および転写因子に対する抗体は、分子タグの異なるセットの使用を通じて、試料中のあらゆるDNA分子に関連するヌクレオソーム位置付け、ヌクレオソーム修飾、および転写因子結合に関する相対情報を生じさせるようにMBD分割に代わることが可能である。
【0215】
データ解析
【0216】
液体生検においてがんメチル化解析が直面する大きな難問は、細胞型不均一性である。固有であり明確に文書化されているがん不均一性に加えて、血漿中の無細胞DNAは、主にがん関連ではない混合細胞死タイプを表す。例えば、細胞死は非悪性臓器、生理的造血(hematapoetic)系列においてあり得る。この複雑さには、間質性成分中の非がん細胞、例えば、血管およびリンパ内皮細胞ならびに周皮細胞、マクロファージ、白血球およびリンパ球などの免疫細胞、間質線維芽細胞、筋線維芽細胞、筋上皮細胞、ならびに脂肪細胞、内分泌細胞、神経細胞および異なる発生起源を有する他の細胞および組織要素でさえ極めて異なることが加わる。したがって、いくつかの実施形態では、液体生検からの所見を解析し解釈する場合は、細胞型組成の変化についての調整が実施される。
【0217】
分析パイプラインは以下のステップ:
a)-ome占有率決定
b)ダイアドの位置を突き止め、厳密性を割り当てる
c)全ゲノムにわたって個々のゲノム要素内でガウス混合モデルを適合させる
d)遺伝子レベルで細胞系列をデコンボリューションする
を含む場合がある。
【0218】
用例として、cfDNA断片開始濃縮プロファイルは、個々の分割物から試料において別々に決定することが可能である。例えば、分割された試料は、高、低、または中間メチル化DNAを含んでいる場合がある。決定されたcfDNA断片開始濃縮プロファイルを使用すれば、関連する調節エレメント、例えば、TSS、エンハンサー領域、遠位遺伝子間エレメント内のヌクレオソーム占有率を確立することが可能である。分割物ごとに、占有率ピーク、例えば、ダイアド、を決定することが可能であり、その厳密性を割り当てることが可能である。健康な血漿試料中の観察される細胞状態に関連するキャノニカルプロファイルは、cfDNA断片開始濃縮プロファイルを決定し大きな非悪性対照(例えば、健康な個体または複数の健康な個体由来の試料)においてダイアドの位置を突き止めることにより確立することが可能である。いかなる試料でも、ガウス混合モデルは、分割された試料において観察される悪性(非キャノニカル)クロマチン状態に対応する残留占有率を生じ、それによって非キャノニカルcfDNA断片ピークおよびプロファイルを決定するために、上で定義されるキャノニカルプロファイルを使用して、適合させることが可能である。非キャノニカルcfDNA断片ピークおよびプロファイルは、それぞれの分割された試料においてがんの悪性クロマチン状態と関連している可能性がある。メチル化による生物学的調節は、単一CpGによりまたは互いに極めて近接しているCpGの群により媒介することが可能である。したがって、DNAメチル化の区域解析はメチル化データのより包括的で組織的な見解を提供する。典型的には、メチル化情報はタイリングウィンドウ上にまたは予め定義された領域(プロモーター、CpGアイランド、イントロン、など)のセット上で要約される。
【0219】
ヌクレオソーム組織は、ヌクレオソーム占有率およびヌクレオソーム位置付けなどの、2つの独立した測定基準により決定することが可能である。ヌクレオソーム占有率はヌクレオソームが細胞集団内の特定のゲノム領域上に存在する確率として理解することが可能である。ヌクレオソーム占有率は、カバー度(ゲノム領域にマッピングされたアラインされたシーケンシング読み取りデータの数)としてシーケンシングベースの実験で測定することが可能である。ヌクレオソーム位置付けは、ヌクレオソーム基準点(例えば、ダイアド)が周囲の座標に対する特定のゲノム座標に存在する確率であることが可能である。図9に示されるように、良好なヌクレオソーム位置付けは、存在するたびに同じゲノム座標に生じるヌクレオソームダイアドとして生物学的には解釈することが可能である。不良な位置付けは、ヌクレオソームダイアドが全ヌクレオソームの同じ一般的フットプリント内である範囲の位置を占めると解釈することが可能である。一例では、肺がんを抱えた8人の対象由来の試料を使用して、ダイアド中心を決定した。ヌクレオソーム位置付けおよびヌクレオソーム占有率を決定した。例えば、高占有率および良好な位置付けは、カバー度が>0.5分位(Qu)でありピークの幅が<0.5Quである場合に示すことができる。いくつかの例では、分画試料(高/低メチル化画分などの)中のダイアド中心間の距離は非分画(MBDなし)と比較することが可能である。いくつかの場合、ダイアド中心ならびに隣接クロマチン構造は、ダイアド中心をすべてのピークに割り当てることにより決定することが可能であり、すべてのピークに対する占有率は占有カバー度がゲノムにわたって5%を超える。占有カバー度は15%、20%、25%または30%となり得る。占有カバー度は、ピーク位置、幅、長さ、中心および幅解像度を決定することにより機械学習アプローチを使用して割り当てることが可能である。これは血漿DNAについてのクロマチン構造の経験的決定を提供する。
【0220】
配列読み取りデータのカバー度の増加はより大きなヌクレオソーム占有率と相関している可能性がある。さらに、ヌクレオソーム占有率はヌクレオソーム枯渇領域(NDR)と逆関係にある可能性がある。ヌクレオソーム占有率の増加は、より緻密なクロマチンなどの変更されたクロマチン構造を示している可能性がある。緻密なクロマチンは、正常な細胞機能を攪乱することがある遺伝子発現の下方調節を示している可能性がある。正常な細胞機能の攪乱はがんなどの疾患の徴候としての役割を果たすことが可能である。
【0221】
無細胞DNAは細胞の異種集団(例えば、瀕死の、悪性の、非悪性の、等)からのシグナルを含む。細胞の異種集団は、複数のクロマチン状態にある核酸を有することが可能である。いくつかの例では、複数のクロマチン状態は、良好に位置付けられたまたは分散している(「ファジーな」)ヌクレオソームなどの、ヌクレオソーム占有率の異なる状態を含むことが可能である。良好に位置付けられたヌクレオソームは配列読み取りデータのより大きなカバー度を示し、ファジーなヌクレオソームはより低いカバー度を示す。配列読み取りデータのカバー度に基づけば、クロマチンにわたるヌクレオソーム占有率を決定することが可能である。
【0222】
「デコンボリューション」は、互いにオーバーラップしている無細胞DNA断片占有率ピークを分解し、こうして、「隠れたピーク」についての情報を引き出すプロセスを指すことが可能である。ヌクレオソーム占有率ピークのデコンボリューションは、MBD分割により達成することが可能である。核酸を高メチル化および低メチル化分割物に分割すると、2つのはっきり異なるピーク、ピーク1およびピーク2を生じることが可能である。しかし、核酸が分画されていない場合、1つの連続するピークが得られ、悪性関連ピーク1を非悪性ピーク2からデコンボリューションするのは実行可能ではないことがある。
【0223】
ダイアドはヌクレオソームの中心により占められるDNA領域であることが可能である。ダイアドは分割された試料に位置することが可能である。いくつかの場合、核酸は高および低メチル化画分に分割される。ダイアドの位置付けまたは局在化は参照なしの方法または参照ベースの方法を使用して実施することが可能である。参照なしの方法は、高分割物と低分割物の両方をin silicoで組み合わせ、下にあるダイアド位置を決定し、それによって、ダイアドマップを決定することを含むことが可能である。いくつかの場合、高-および低メチル化分割物由来のシーケンシングデータを組み合わせてヌクレオソーム占有率を決定し、分割物間で比較し、例えば、あらゆる分割物からのシグナルを組み合わせて占有率ピークを検出し、次に、高対低において見られるピークの位置を比較する。参照ベースの方法は分割物の独立した解析を含むことが可能である。例えば、高-および低メチル化画分についてのヌクレオソーム占有率が決定される。第1の実験での分割物ごとのヌクレオソーム占有率は、それに続く実験(複数可)での対応する分割物のために使用することが可能であり、そこでは同じパート1は大きなセットの試料上で独立して行われ(標準WGSで十分と考えられる。なぜならば、分割ベースの情報は使用されず、情報が組み合わされてピーク解像度を改善するからである)、占有率ピークのマップはそれぞれに対して「参照」として保存され、単一分割物(または両方)を比較することが可能である。
【0224】
フラグメントームデータに基づくフラグメントームシグネチャー
【0225】
フラグメントームデータを調べる方法は、例えば、米国特許出願公開第2016/0201142号(Lo)、国際公開第2016/015058号(Shendure)および2017年7月6日に提出されたPCT/US17/40986(「Methods For Fragmentome Profiling Of Cell-Free Nucleic Acids」)に記載されており、これら特許文献はすべて参照により本明細書に組み込む。フラグメントームデータとは、核酸断片を分析することにより得られる配列データのことである。例えば、配列データは、断片長(塩基対で)、ゲノム座標(例えば、参照ゲノム上の開始および停止位置)、カバー度(例えば、コピー数)または配列情報(例えば、塩基A、G、C、T)を含むことが可能である。フラグメントームデータとは、血液または血漿において観察される無細胞DNAの保護された含有量の濃縮に対応する無細胞DNAにおける断片の開始および停止の配列情報および関連する占有率のことである。
【0226】
例えば、試料において、ゲノムまたはその標的部分にわたって特定のヌクレオチド座標にマッピングするその中心点を有するcfDNA分子の数を決定することができるであろう。健康な個体では、これは典型的には、グラフのピークがヌクレオソーム位置(例えば、そこでは細胞DNAがcfDNAへの変換中に開裂していない)を表し、くぼみがヌクレオソーム間位置(例えば、そこでは多くの分子が切断されており、したがって、そこに中心が置かれている分子がほとんどない)を表す波形グラフを生じると考えられる。ピーク間の距離はヌクレオソームダイアドを表す。悪性細胞では、ヌクレオソームの位置は、例えば、メチル化の関数として移動してもよい。この場合、グラフ中のピークおよびくぼみの位置の移動が予想される。そのような移動は、異なる特徴に基づいて分子を分割し、分割物ごとに断片分布を調べることによりもっと容易に検出することが可能である。断片データは、1つまたは複数のより多くの次元でさらに分析することが可能になる。例えば、いかなる座標でも、その座標にマッピングする分子の数は断片サイズに基づいてさらに識別することが可能である。そのようなデータに基づくグラフでは、3番目の「Z」次元は断片サイズを表す。したがって、例えば、二次元グラフでは、X軸はゲノム座標を表し、Y軸は座標にマッピングする分子の数を表す。三次元グラフでは、X軸はゲノム座標を表し、Z次元は断片長を表し、Y軸は座標にマッピングするそれぞれのサイズの分子の数を表す。そのような三次元グラフは二次元ヒートマップとして表すことが可能であり、そこではXおよびZ軸は二次元で表示され、Y軸上の値は、例えば、色彩強度(例えば、暗いほど大きな値を表す)または色彩の「熱さ」(例えば、青色はより低い値を表し、赤色はより高い値を表す)により表される。そのようなデータを掘り出せば、がんの存在または非存在、がんのタイプ、転移の程度、等などの調べられている状態に特徴的であるヌクレオソーム位置パターンを決定することが可能になる。
【0227】
個体のコホートはすべてが共有された特徴を有している場合がある。この共有される特徴は、腫瘍タイプ、炎症状態、アポトーシス状態、壊死状態、腫瘍再発、および処置に対する抵抗性からなる群から選択してもよい。いくつかの例では、コホートは特定タイプのがん(例えば、乳がん、結腸直腸がん、膵臓がん、前立腺がん、黒色腫、肺がんまたは肝臓がん)を抱えた個体を含む。がんのヌクレオソームシグネチャーを得るため、がんに罹っている個体は血液試料を提供する。無細胞DNAは血液試料から得られる。無細胞DNAはシーケンシングされる(ゲノム由来の領域のセットの選択的濃縮とともにまたはそれなしで)。シーケンシング反応からの配列読み取りデータの形態での配列情報はヒト参照ゲノムにマッピングされる。いくつかの実施形態では、分子はマッピング操作の前または後で崩壊して、独特の分子読み取りデータになる。
【0228】
所与の試料中の無細胞DNA断片は無細胞DNAが生じた元の細胞の混合物を表しているので、それぞれの細胞型由来の差次的ヌクレオソーム占有率により、所与の無細胞DNA試料を表す数学的モデルへの寄与をもたらす可能性がある。例えば、断片長の分布は、異なる細胞型にわたる、または腫瘍対非腫瘍細胞にわたる差次的ヌクレオソーム保護のために生じた可能性がある。この方法を使用すれば、配列データの単一パラメトリック、多パラメトリック、および/または統計解析に基づく臨床的に有用な評価のセットを開発することができる。
【0229】
試料中の核酸分子は、1つまたは複数の特徴に基づいて分画してもよい。分画は、核酸分子をゲノム特徴の存在または非存在に基づいてサブセットまたは群に物理的に分割することを含んでいてもよい。分画は、核酸分子をゲノム特徴が存在する程度に基づいて群に物理的に分割することを含んでいてもよい。試料は、差次的遺伝子発現または疾患状態を示している特徴に基づいて1つまたは複数の群に分画するまたは分割してもよい。試料は、核酸、例えば、cfDNA、非cfDNA、腫瘍DNA、循環腫瘍DNA(ctDNA)の分析中に正常と病的状態の間のシグナルの違いを与える特徴に基づいて分画してもよい。
【0230】
フラグメントームデータを使用して遺伝子バリアントを推測してもよい。遺伝子バリアントは、コピー数変異(CNV)、挿入および欠失(indel)、単一ヌクレオチド変異(SNV)ならびに/または遺伝子融合を含む。フラグメントームデータを使用して、がんを示しているバリアントなどの、エピジェネティックバリアントを推測してもよい。それぞれの分画もしくは分割された群および/または非分画核酸中の1つまたは複数の遺伝子バリアントを決定してもよい。分画または分割は、核酸のメチル化状態、サイズ、長さ、および転写結合を含むがこれらに限定されない種々の特徴のうちの少なくとも1つに基づいて実施することが可能である。分画もしくは分割された群で判定された遺伝子バリアントは、互いの間でおよび/または同じ特徴を有することもあれば有さないこともある非分画核酸と比較してもよい。分画もしくは分割された核酸は再度組み合わせることが可能であり、フラグメントームデータは、非分画核酸および/または分画もしくは分割された核酸と同じ特徴を持たない核酸と比較すれば、遺伝子バリアントの存在を判定することが可能になる。
【0231】
モデルをパネル設定において使用して、領域(例えば、フラグメントームプロファイル関連領域)を選択的に濃縮し特定の突然変異にまたがる大きな数の読み取りデータを保証してもよく、転写開始部位(TSS)、プロモーター領域、接合部位、およびイントロン領域のような重要なクロマチン中心イベントを検討してもよい。
【0232】
一例では、フラグメントームプロファイルの違いがイントロンとエクソンの接合部(または境界線)でまたはその近くで見出される。1つまたは複数の体細胞突然変異を同定すると、1つまたは複数の多パラメトリックまたは単一パラメトリックモデルと相関付けられて、cfDNA断片が分散しているゲノム位置を明らかにすることができる。この相関分析は、フラグメントームプロファイル破壊がもっとも著しい1つまたは複数のイントロン-エクソン接合部を明らかにすることができる。
【0233】
別の例として、試料中の高メチル化はTSSからさらに遠い領域で観察することが可能である。高メチル化領域の濃縮は、TSSから0kbと5kb、5kbと50kb、および/または50kbと500kbの間の距離で観察することが可能である。高メチル化領域の濃縮は、TSSから5kbと50kbの間で観察することが可能である。高メチル化領域の濃縮は、TSSから5kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、50kb、100kb、200kb、300kb、400kb、および/または500kb未満で観察することが可能である。高メチル化領域の濃縮は、TSSから5kb、10kb、15kb、20kb、25kb、30kb、35kb、40kb、50kb、100kb、200kb、300kb、400kb、および/または500kbより離れて観察することが可能である。高メチル化の位置および濃縮は、健康なまたは正常な対象から得られるDNA(正常DNA)と病的対象から得られるDNAの間で変動することがある。例えば、肺がんに罹っていると疑われているまたは肺がんに罹っている対象由来のDNA(肺がんDNA)はTSS内のキャノニカル位置からもっとも遠位の高メチル化距離の濃縮を示している場合があり、高メチル化画分中の良好に位置付けされたヌクレオソームはプロモーター領域の近傍を占有している(図17)。例えば、肺がん患者由来の非分画核酸(MBDなし)をシーケンシングのために使用した。ゲノム位置などの、フラグメントームデータに基づいて、ヌクレオソームダイアド中心を配列読み取りデータのために決定した。さらにフラグメントームデータに基づいて、5%未満もしくはこれに等しいカバー度または95%未満もしくはこれに等しいカバー度を有する配列読み取りデータをさらに分析した。Genomic Regions Enrichment of Annotations Tool(GREAT)などの、遺伝子アノテーションツールを使用して近くの遺伝子に基づいてゲノム領域のセットに機能性を割り当てた。配列読み取りデータ間の距離およびその推定される調節された遺伝子を決定した(図17)。距離は4つの別々のビンに分けられ:1つは0から5kb、もう1つは5kbから50kb、三番目は50kbから500kb、最後のビンは500kbを超えるすべての関連物であった。精密には、ビンは[0、5kb]、[5kb、50kb]、[50kb、500kb]、[500kb、無限]である。グラフでは、正確に0で(すなわち、TSS上で)のすべての関連物は[-5kb、0]と[0、5kb]ビンの間で均等に分け合った。この方法を使用すれば、試料中の高メチル化は、バックグラウンドゲノム領域(例えば、すべてのヌクレオソーム)とフォアグラウンドゲノム領域(例えば、メチル化ヌクレオソーム)の両方でTSSからさらに遠位の領域で観察された。例えば、高メチル間領域の濃縮は[5kb、50kb]ビン間で観察された。
【0234】
フラグメントームシグネチャーは、ヌクレオソーム占有率、ヌクレオソーム位置付け、RNAポリメラーゼII休止、細胞死特異的DNアーゼ過感受性、および細胞死中のクロマチン凝縮を判定するのを支援することができる。そのようなシグネチャーは、細胞片クリアランスおよび輸送についての洞察も提供することができる。例えば、細胞片クリアランスは、アポトーシスにより瀕死の細胞においてカスパーゼ活性化DNアーゼ(CAD)により実施されるDNA断片化を伴うことがあるが、瀕死の細胞が貪食された後にリソソームDNアーゼIIにより実施されて、異なる切断地図が生じる場合もある。
【0235】
ゲノム分割地図は、有意義なウィンドウの目的の領域への集合を介してクロマチンの前述の特性に関連する悪性対非悪性状態の差次的クロマチン状態のゲノムワイド同定により構築することが可能である。そのような目的の領域は一般にゲノム分割地図と呼ばれる。
【0236】
メチル化状態に基づく分画
【0237】
試料中の核酸分子は、5-メチルシトシンの特徴に基づいて分画することが可能である。DNAは、CpGジヌクレオチド領域でなどのシトシンでメチル化することが可能である。ヒストン複合体と一体でのDNAメチル化は、クロマチンへのDNAパッケージング並びに遺伝子発現のエピジェネティック調節に影響を及ぼす場合がある。エピジェネティック変更は、がん進行のすべてのステップ、原発または初期段階がんのイニシエーション、再発または転移がんにおいてなどの種々の疾患において極めて重要な役割を果たしている可能性がある。例えば、通常の成長、DNA修復、細胞周期調節および細胞分化に関与している遺伝子の転写開始部位(TSS)などの通常は低メチル化領域の高メチル化は、がんを示している可能性がある。高メチル化は転写を抑制することにより遺伝子発現を変更する場合がある。いくつかの場合、高メチル化は遺伝子発現を低減するおよび/または抑制する場合がある。例えば、高メチル化は発がん遺伝子リプレッサーの発現を低減するおよび/または抑制する場合がある。いくつかの場合、高メチル化は遺伝子発現を増加するおよび/または促進する場合がある。例えば、サプレッサーの高メチル化により、下流レスポンダー、例えば、通常はサプレッサーにより抑制されている発がん遺伝子の遺伝子発現が増加するおよび/または促進される場合がある。
【0238】
DNAメチル化状態に基づいて、試料中の核酸分子を、実験操作を使用して類似するメチル化状態を有する核酸分子を濃縮することが可能な異なる群に分画することが可能である。例えば、メチル結合ドメイン(MBD)タンパク質を使用すれば、高メチル化、低メチル化および残余のメチル化などのメチル化の類似する状態を有する核酸分子を親和性精製することが可能である。別の例では、5-メチル-シトシンに特異的である抗体を使用すれば、メチル化の類似するレベルを有する核酸分子を免疫沈降することが可能である。別の例では、バイサルファイトベースの方法を用いれば、高度にメチル化された核酸分子を選択的に濃縮することが可能になる。さらに別の例では、メチル化感受性制限酵素を使用すれば、高度にメチル化された核酸分子を選択的に濃縮することが可能になる。
【0239】
特徴のうちの1つを使用して分画すると、それぞれの群の核酸分子をシーケンシングして配列読み取りデータを作成することができる。配列読み取りデータは参照ゲノムにマッピングすることができる。マッピングは配列情報を作成することが可能である。配列情報を分析して、例えば、一塩基バリアント、コピー数変異、挿入欠失、または融合を含む、遺伝的変異を判定してもよい。無細胞DNAがアッセイされる例では、本明細書に開示されている方法を使用するとフラグメントームデータを作成することができ、このデータは分画された核酸分子の群間で変化する場合がある。フラグメントームデータは、ゲノム座標、サイズ、カバー度または配列情報を含んでいてもよい。開示は、フラグメントームデータを分割物のそれぞれ由来の配列読み取りデータと統合するための方法を提供する。そのような統合は、疾患状態を示しているバイオマーカーの正確で迅速な検出に有用である可能性がある。
【0240】
本明細書に記載される方法を使用すれば、フラグメントームデータに基づいてin silicoで核酸分子を濃縮することが可能である。例えば、肺がん患者由来の非分画核酸分子(MBDなし)をシーケンシングのために使用することが可能である。別の例では、分画は、モノヌクレオソームもしくはジヌクレオソームプロファイル単独でのまたはこのプロファイルをサイズおよび/もしくはメチル化状態などの他の特徴と組み合わせての違いに基づいて達成することが可能である。モノヌクレオソームプロファイルとは、単一ヌクレオソームに巻くのに必要なおおよその長さ(例えば、約146bp)の断片のカバー度または総数を指すことが可能である。ジヌクレオソームプロファイルとは、単一ヌクレオソームに2度巻くのに必要なおおよその長さ(例えば、約292bp)の断片のカバー度または総数を指すことが可能である。
【0241】
データ解析
【0242】
ある特定の実施形態では、異なるクラスの対象、例えば、がん/がんなし、がん1型/がん2型由来のデータを使用すれば、試料をそのクラスの1つに属すると分類するように機械学習アルゴリズムを訓練することが可能になる。用語「機械学習アルゴリズム」とは、本明細書で使用される場合、コンピュータにより実行され、例えば、クラスタリング、分類またはパターン認識のための分析モデル構築を自動化するアルゴリズムのことである。機械学習アルゴリズムは監視されていても監視されていなくてもよい。学習アルゴリズムは、例えば、人工ニューラルネットワーク(例えば、バックプロパゲーションネットワーク)、判別分析(例えば、ベイズ分類子またはフィッシャー分析)、サポートベクターマシン、決定木(例えば、CART-分類および回帰木などの再帰分割プロセス)、ランダムフォレスト、線形分類子(例えば、多重線形回帰(MLR)、部分最小二乗(PLS)回帰および主成分回帰(PCR))、階層的クラスタリングおよびクラスター解析を含む。機械学習アルゴリズムが学習するデータセットは「トレーニングデータ」と呼ぶことが可能である。
【0243】
用語「分類子」とは、本明細書で使用される場合、入力として試験データを受け取り、出力として、入力データをいずれかのクラスに属するとする分類を提示するアルゴリズムコンピュータコードのことである。
【0244】
用語「データセット」とは、本明細書で使用される場合、系の要素を特徴付ける値のコレクションのことである。系は、例えば、生体試料由来のcfDNAでもよい。そのような系の要素は遺伝子座でもよい。データセット(または「データ セット」)の例は:(i)遺伝子座にマッピングするDNA配列、(ii)遺伝子座で開始するDNA配列、(iii)遺伝子座で終止するDNA配列;(iv)DNA配列のジヌクレオソーム保護またはモノヌクレオソーム保護;(v)参照ゲノムのイントロンまたはエクソンに位置しているDNA配列;(vi)1つまたは複数の特徴を有するDNA配列のサイズ分布;(vii)1つまたは複数の特徴を有するDNA配列の長さ分布、等から選択される特徴の定量的基準を示す値を含む。
【0245】
用語「値」とは、本明細書で使用される場合、その値が指すフィーチャーを特徴付けるいかなるものでも可能であるデータセット中の項目のことである。これには、限定せずに、数、単語もしくは語句、記号(例えば、+または-)または程度が含まれる。
【0246】
デジタル処理デバイス
いくつかの実施形態では、本明細書に記載される方法はデジタル処理デバイスを利用する。さらなる実施形態では、デジタル処理デバイスは、1つまたは複数のハードウェア中央処理装置(CPU)またはデバイスの機能を実行する汎用目的グラフィック処理装置(GPGPU)を含む。なおさらなる実施形態では、デジタル処理デバイスは、実行可能命令を実施するように構成されているオペレーティングシステムをさらに含む。いくつかの実施形態では、デジタル処理デバイスは任意選択でコンピュータネットワークに接続されている。さらなる実施形態では、デジタル処理デバイスは、ワールドワイドウェブにアクセスするように任意選択でインターネットに接続されている。なおさらなる実施形態では、デジタル処理デバイスは、任意選択でクラウドコンピューティング基盤に接続されている。他の実施形態では、デジタル処理デバイスは、任意選択でイントラネットに接続されている。他の実施形態では、デジタル処理デバイスは、任意選択でデータ記憶装置に接続されている。
【0247】
本明細書の記述に従えば、適切なデジタル処理デバイスは、非限定的例として、サーバーコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブック型コンピュータ、ハンドヘルドコンピュータ、インターネット機器、モバイルスマートフォン、およびタブレットコンピュータを含む。
【0248】
いくつかの実施形態では、デジタル処理デバイスは実行可能命令を実施するように構成されているオペレーティングシステムを含む。オペレーティングシステムは、例えば、デバイスのハードウェアを管理しアプリケーションの実行のためのサービスを提供する、プログラムおよびデータを含むソフトウェアである。当業者であれば、適切なサーバーオペレーティングシステムには、非限定的例として、FreeBSD、OpenBSD、NetBSD(登録商標)、Linux(登録商標)、Apple(登録商標)Mac OS
X Server(登録商標)、Oracle(登録商標)Solaris(登録商標)、Windows Server(登録商標)、およびNovell(登録商標)NetWare(登録商標)が含まれることを認識するであろう。当業者であれば、適切なパーソナルコンピュータオペレーティングシステムには、非限定的例として、Microsoft(登録商標)Windows(登録商標)、Apple(登録商標)Mac OS
X(登録商標)、UNIX(登録商標)、およびGNU/Linux(登録商標)などのUNIX様オペレーティングシステムが含まれることを認識するであろう。いくつかの実施形態では、オペレーティングシステムはクラウドコンピューティングにより提供される。当業者であれば、適切なモバイルスマートフォンオペレーティングシステムには、非限定的例として、Nokia(登録商標)Symbian(登録商標)OS、Apple(登録商標)iOS(登録商標)、Research In Motion(登録商標)BlackBerry OS(登録商標)、Google(登録商標)Android(登録商標)、Microsoft(登録商標)Windows Phone(登録商標)OS、Microsoft(登録商標)Windows Mobile(登録商標)OS、Linux(登録商標)、およびPalm(登録商標)WebOS(登録商標)が含まれることも認識するであろう。
【0249】
いくつかの実施形態では、デバイスは記憶および/またはメモリーデバイスを含む。記憶および/またはメモリーデバイスは、一時的にまたは永久にデータまたはプログラムを保存するのに使用される1つまたは複数の物理的装置である。いくつかの実施形態では、デバイスは揮発性メモリーであり、保存された情報を維持するのに電力を必要とする。いくつかの実施形態では、デバイスは非揮発性メモリーであり、デジタル処理デバイスに電力が供給されていないときに保存された情報を保持する。さらなる実施形態では、非揮発性メモリーはフラッシュメモリーを含む。いくつかの実施形態では、非揮発性メモリーはダイナミックランダムアクセスメモリー(DRAM)を含む。いくつかの実施形態では、非揮発性メモリーは強誘電体ランダムアクセスメモリー(FRAM(登録商標))を含む。いくつかの実施形態では、非揮発性メモリーは相変化ランダムアクセスメモリー(PRAM)を含む。他の実施形態では、デバイスは、非限定的例として、CD-ROM、DVD、フラッシュメモリーデバイス、磁気ディスクドライブ、磁気テープドライブ、光学ディスクドライブ、およびクラウドコンピューティングベースの保存を含む記憶装置である。さらなる実施形態では、記憶および/またはメモリーデバイスは、本明細書に開示されるデバイスなどのデバイスの組み合わせである。
【0250】
いくつかの実施形態では、デジタル処理デバイスは、可視情報をユーザーに送るディスプレイを含む。いくつかの実施形態では、ディスプレイは液晶ディスプレイ(LCD)である。さらなる実施形態では、ディスプレイは薄膜トランジスター液晶ディスプレイ(TFT-LCD)である。いくつかの実施形態では、ディスプレイは有機発光ダイオード(OLED)ディスプレイである。種々のさらなる実施形態では、OLEDディスプレイは受動マトリックスOLED(PMOLED)または能動マトリックスOLED(AMOLED)ディスプレイである。いくつかの実施形態では、ディスプレイはプラズマディスプレイである。他の実施形態では、ディスプレイはビデオプロジェクターである。さらに他の実施形態では、ディスプレイは、VRヘッドセットなどの、デジタル処理デバイスと連絡しているヘッドマウントディスプレイである。さらなる実施形態では、適切なVRヘッドセットは、非限定的例として、HTC Vive、Oculus Rift、Samsung Gear VR、Microsoft HoloLens、Razer OSVR、FOVE VR、Zeiss VR One、Avegant Glyph、Freefly VRヘッドセット、および同類のものを含む。さらなる実施形態では、ディスプレイは本明細書に開示されるデバイスなどのデバイスの組み合わせである。
【0251】
いくつかの実施形態では、デジタル処理デバイスはユーザーからの情報を受け取る入力デバイスを含む。いくつかの実施形態では、入力デバイスはキーボードである。いくつかの実施形態では、入力デバイスは、非限定的例として、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラー、またはスタイラスを含む、ポインティングデバイスである。いくつかの実施形態では、入力デバイスは、タッチスクリーンまたはマルチタッチスクリーンである。他の実施形態では、入力デバイスは、音声または他のサウンド入力を捕捉するマイクロフォンである。他の実施形態では、入力装置は、動作または視覚入力を捕捉するビデオカメラまたは他のセンサーである。さらなる実施形態では、入力デバイスは、Kinect、Leap Motionまたは同類のものである。さらなる実施形態では、入力デバイスは、本明細書に開示されるデバイスなどのデバイスの組み合わせである。
【0252】
図32を参照して、特定の実施形態では、例示的デジタル処理デバイス101は、配列および/またはタグデータを分析する、アッセイする、解読するおよび/またはデコンボリューションするようプログラムされているまたは他の方法で構成されている。実施形態では、デジタル処理デバイス101は、中央処理装置(CPU、本明細書では「プロセッサー」および「コンピュータプロセッサー」も)105を含み、これはシングルコアもしくはマルチコアプロセッサー、または並列処理のための複数のプロセッサーが可能である。デジタル処理デバイス101は、メモリーまたはメモリー位置110(例えば、ランダムアクセスメモリー、読み取り専用メモリー、フラッシュメモリー)、電子記憶装置115(例えば、ハードディスク)、1つまたは複数の他のシステムと通信するための通信インターフェイス120(例えば、ネットワークアダプター)、ならびにキャッシュ、他のメモリー、データ記憶および/もしくは電子ディスプレイアダプターなどの周辺機器125も含む。メモリー110、記憶装置115、インターフェイス120および周辺機器125は、マザーボードなどの通信バス(実ライン)を通じてCPU 105と通信している。記憶装置115は、データを保存するためのデータ記憶装置(またはデータレポジトリー)であり得る。デジタル処理デバイス101は、通信インターフェイス120の力を借りてコンピュータネットワーク(「ネットワーク」)130に動作可能に連結することが可能である。ネットワーク130は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信しているイントラネットおよび/もしくはエクストラネットであり得る。ネットワーク130は、いくつかの場合、遠距離通信および/またはデータネットワークである。ネットワーク130は、1つまたは複数のコンピュータサーバーを含むことが可能であり、このサーバーはクラウドコンピューティングなどの分散コンピューティングを作動させることが可能である。ネットワーク130は、いくつかの場合、デバイス101の力を借りてピアツーピアネットワークを実行することが可能であり、このネットワークはデバイス101に連結されてクライアントまたはサーバーとして振る舞うデバイスを作動させることができる。
【0253】
図32への言及を続けると、CPU 105は一続きの機械読み取り可能命令を実行することが可能であり、この命令はプログラムまたはソフトウェアにおいて具体化することが可能である。命令はメモリー110などのメモリー位置に保存してもよい。命令はCPU 105に向けることが可能であり、これにより続いて本開示の方法を実行するようにCPU 105をプログラムするまたは他の方法で構成することが可能になる。CPU 105により実施される操作の例は、取得する、解読する、実行する、およびライトバックすることを含むことが可能である。CPU 105は集積回路などの回路の一部であり得る。デバイス101の1つまたは複数の他の構成成分を回路に含むことが可能である。いくつかの場合、回路は特定用途向け集積回路(ASIC)またはフィールドプログラマブルゲートアレイ(FPGA)である。
【0254】
図32への言及を続けると、記憶装置115は、ドライバー、ライブラリーおよび保存プログラムなどのファイルを保存することが可能である。記憶装置115は、ユーザーデータ、例えば、ユーザーの選好およびユーザーのプログラムを保存することが可能である。デジタル処理デバイス101は、いくつかの場合、イントラネットまたはインターネットを通じて通信しているリモートサーバー上に位置しているなどの、外付けである1つまたは複数の追加のデータ記憶装置を含むことが可能である。
【0255】
図32への言及を続けると、デジタル処理デバイス101は、ネットワーク130を通じて1つまたは複数のリモートコンピュータシステムと通信することが可能である。例えば、デバイス101はユーザーのリモートコンピュータシステムと通信することが可能である。リモートコンピュータシステムの例は、パーソナルコンピュータ(例えば、携帯型PC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab、およびMicrosoft(登録商標)Surface(登録商標))、およびスマートフォン(例えば、Apple(登録商標)iPhone(登録商標)またはAndroid対応機器)を含む。
【0256】
本明細書に記載される方法は、例えば、メモリー110または電子記憶装置115上などの、デジタル処理デバイス101の電子格納場所上に保存された機械(例えば、コンピュータープロセッサー)実行可能コードにより少なくとも部分的に実行することが可能である。機械実行可能または機械読み取り可能コードはソフトウェアの形態で提供することが可能である。使用の間、コードはプロセッサー105により実行することが可能である。いくつかの場合、コードは記憶装置115から引き出し、プロセッサー105による容易なアクセスのためにメモリー110上に保存することが可能である。いくつかの状況では、電子記憶装置115は排除することが可能であり、機械実行可能命令はメモリー110上に保存される。
【0257】
非一時的コンピュータ読み取り可能記憶媒体
【0258】
いくつかの実施形態では、本明細書で開示される方法は、任意選択でネットワークに接続されているデジタル処理デバイスのオペレーティングシステムにより実行可能な命令を含む、プログラムでコード化されている1つまたは複数の非一時的コンピュータ読み取り可能記憶媒体を利用する。さらなる実施形態では、コンピュータ読み取り可能記憶媒体はデジタル処理デバイスの有形構成成分である。なおさらなる実施形態では、コンピュータ読み取り可能記憶媒体は任意選択でデジタル処理デバイスから取り外し可能である。いくつかの実施形態では、コンピュータ読み取り可能記憶媒体は、非限定的例として、CD-ROM、DVD、フラッシュメモリー装置、固体状態メモリー、磁気ディスクドライブ、磁気テープドライブ、光学ディスクドライブ、クラウドコンピューティングシステムおよびサービス、ならびに同類のものを含む。いくつかの場合、プログラムおよび命令は永久的に、実質的に永久的に、半永久的に、または非一時的に媒体上にコード化される。
【0259】
実行可能命令
【0260】
いくつかの実施形態では、本明細書で開示される方法は、少なくとも1つのコンピュータプログラムの形態で、デジタル処理デバイスにより実行可能である命令を利用する。例えば、コンピュータプログラムは、デジタル処理デバイスのCPUで実行可能な、特定のタスクを実施するように書かれた、一続きの命令を含む。コンピュータ読み取り可能な命令は、特定のタスクを実施するまたは特定の抽象データタイプを実行する関数、オブジェクト、アプリケーションプログラムインターフェイス(API)、データ構造、および同類のものなどのプログラムモジュールとして実行してもよい。本明細書で提供される開示に照らして、当業者であればコンピュータプログラムは種々の言語の種々のバージョンで書いてもよいことは認識されるであろう。
【0261】
コンピュータ読み取り可能な命令の機能性は、種々の環境において希望通りに組み合わせるまたは分散させてもよい。いくつかの実施形態では、コンピュータプログラムは1つの一続きの命令を含む。いくつかの実施形態では、コンピュータプログラムは複数の一続きの命令を含む。いくつかの実施形態では、コンピュータプログラムは1つの位置から提供される。他の実施形態では、コンピュータプログラムは複数の位置から提供される。種々の実施形態では、コンピュータプログラムは1つまたは複数のソフトウェアモジュールを含む。種々の実施形態では、コンピュータプログラムは、一部においてまたは全体において、1つまたは複数のウェブアプリケーション、1つまたは複数のモバイルアプリケーション、1つまたは複数のスタンドアロンアプリケーション、1つまたは複数のウェブブラウザプラグイン、機能拡張、アドイン、もしくはアドオン、またはその組合せを含む。
【0262】
ウェブアプリケーション
【0263】
いくつかの実施形態では、コンピュータプログラムはウェブアプリケーションを含む。本明細書で提供される開示に照らして、当業者であれば、ウェブアプリケーションは、種々の実施形態で、1つまたは複数のソフトウェアフレームワークおよび1つまたは複数のデータベースシステムを利用することは認識されるであろう。いくつかの実施形態では、ウェブアプリケーションは、Microsoft(登録商標).NETまたはRuby on Rails(RoR)などのソフトウェアフレームワーク上に作成される。いくつかの実施形態では、ウェブアプリケーションは、非限定的例として、リレーショナル、非リレーショナル、オブジェクト指向、アソシエーティブ、およびXMLデータベースシステムを含む、1つまたは複数のデータベースシステムを利用する。さらなる実施形態では、適切なリレーショナルデータベースシステムは、非限定的例として、Microsoft(登録商標)SQL Server、mySQL(商標)、およびOracle(登録商標)を含む。当業者であれば、ウェブアプリケーションは、種々の実施形態では、1つまたは複数の言語の1つまたは複数のバージョンで書かれることも認識するであろう。ウェブアプリケーションは、1つまたは複数のマークアップ言語、プレゼンテーション定義言語、クライアント側スクリプト言語、サーバー側コーディング言語、データベース問い合わせ言語、またはその組合せで書かれていてもよい。いくつかの実施形態では、ウェブアプリケーションは、Hypertext Markup Language(HTML)、Extensible Hypertext Markup Language(XHTML)、またはeXtensible Markup Language(XML)などのマークアップ言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、Cascading Style Sheets(CSS)などのプレゼンテーション定義言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、Asynchronous Java(登録商標)script and XML(AJAX)、Flash(登録商標)Actionscript、Javascript、またはSilverlight(登録商標)などのクライアント側スクリプト言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、Active Server Pages(ASP)、ColdFusion(登録商標)、Perl、Java(商標)、JavaServer Pages(JSP)、Hypertext Preprocessor(PHP)、Python(商標)、Ruby、Tcl、Smalltalk、WebDNA(登録商標)、またはGroovyなどのサーバー側コーディング言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、Structured Query Language(SQL)などのデータベース問い合わせ言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、IBM(登録商標)Lotus Domino(登録商標)などの企業サーバー製品を統合している。いくつかの実施形態では、ウェブアプリケーションは、メディアプレーヤーエレメントを含む。種々のさらなる実施形態では、メディアプレーヤーエレメントは、非限定的例として、Adobe(登録商標)Flash(登録商標)、HTML 5、Apple(登録商標)QuickTime(登録商標)、Microsoft(登録商標)Silverlight(登録商標)、Java(商標)、およびUnity(登録商標)を含む多くの適切なマルチメディア技術の1つまたは複数を利用する。
【0264】
図33に言及すると、特定の実施形態では、アプリケーション提供システムは、リレーショナルデータベース管理システム(RDBMS)210がアクセスする1つまたは複数のデータベース200を含む。適切なRDBMSは、Firebird、MySQL、PostgreSQL、SQLite、Oracle Database、Microsoft SQL Server、IBM DB2、IBM Informix、SAP Sybase、Teradata、および同類のものを含む。この実施形態では、アプリケーション提供システムは、1つまたは複数のアプリケーションサーバー220(Javaサーバー、.NETサーバー、PHPサーバー、および同類のものなどの)および1つまたは複数のウェブサーバー230(Apache、IIS、GWSおよび同類のものなどの)をさらに含む。ウェブサーバー(複数可)は任意選択で、appアプリケーションプログラミングインターフェイス(API)240を経由する1つまたは複数のウェブサービスをインターネットなどのネットワーク経由で公開し、システムはブラウザベースおよび/またはモバイルネイティブユーザーインターフェイスを提供する。
【0265】
図34に言及すると、特定の実施形態では、アプリケーション提供システムは、あるいは、分散クラウドベースアーキテクチャー300を有し、弾力的負荷分散、自動スケーリングウェブサーバーリソース310およびアプリケーションサーバーリソース320そのうえ同調レプリケートされたデータベース330を含む。
【0266】
モバイルアプリケーション
【0267】
いくつかの実施形態では、コンピュータプログラムはモバイルデジタル処理デバイスに提供されるモバイルアプリケーションを含む。いくつかの実施形態では、モバイルアプリケーションはその製造時にモバイルデジタル処理デバイスに提供される。他の実施形態では、モバイルアプリケーションは、本明細書に記載されるコンピュータネットワークを経由してモバイルデジタル処理デバイスに提供される。
【0268】
本明細書に提供される開示の点から、モバイルアプリケーションは、当技術分野で公知のハードウェア、言語、および開発環境を使用して当業者に公知の技法により作成される。当業者であれば、モバイルアプリケーションがいくつかの言語で書かれることを認識するであろう。適切なプログラミング言語は、非限定的例として、C、C++、C#、Objective-C、Java(商標)、Javascript、Pascal、Object Pascal、Python(商標)、Ruby、VB.NET、WML、およびCSSありのもしくはなしのXHTML/HTML、またはその組合せを含む。
【0269】
適切なモバイルアプリケーション開発環境はいくつかのソースから入手可能である。市販の開発環境は、非限定的例として、AirplaySDK、alcheMo、Appcelerator(登録商標)、Celsius、Bedrock、Flash Lite、.NET Compact Framework、Rhomobile、およびWorkLight Mobile Platformを含む。非限定的例として、Lazarus、MobiFlex、MoSync、およびPhoneGapを含む他の開発環境は無料で利用可能である。その上、モバイルデバイス製造業者は、非限定的例として、iPhoneおよびiPad(iOS)SDK、Android(商標)SDK、BlackBerry(登録商標)SDK、BREW SDK、Palm(登録商標)OS SDK、Symbian SDK、webOS SDK、およびWindows(登録商標)Mobile SDKを含むソフトウェアデベロッパーキットを販売している。
【0270】
当業者であれば、いくつかの商業的フォーラムは、非限定的例として、Apple(登録商標)App Store、Google(登録商標)Play、Chrome WebStore、BlackBerry(登録商標)App World、App Store for Palm devices、App Catalog for webOS、Windows(登録商標)Marketplace for Mobile、Ovi Store for Nokia(登録商標)devices、Samsung(登録商標)Apps、およびNintendo(登録商標)DSi Shopを含むモバイルアプリケーションの流通に利用可能であることは認識するであろう。
【0271】
スタンドアロンアプリケーション
【0272】
いくつかの実施形態では、コンピュータプログラムはスタンドアロンアプリケーションを含み、これは、既存のプロセスへのアドオンではなく、例えば、プラグインではなく、独立したコンピュータプロセスとして実行されるプログラムである。当業者であれば、スタンドアロンアプリケーションが多くの場合コンパイルされることは認識するであろう。コンパイラーは、プログラミング言語で書かれたソースコードをアセンブリ言語または機械コードなどのバイナリオブジェクトコードに変換するコンピュータプログラム(複数可)である。適切なコンパイルプログラミング言語は、非限定的例として、C、C++、Objective-C、COBOL、Delphi、Eiffel、Java(商標)、Lisp、Python(商標)、Visual Basic、およびVB.NET、またはその組合せを含む。コンパイレーションは、少なくとも一部、実行可能なプログラムを作成するために実施されることが多い。いくつかの実施形態では、コンピュータプログラムは1つまたは複数の実行可能なコンパイルアプリケーションを含む。
【0273】
ソフトウェアモジュール
【0274】
いくつかの実施形態では、本明細書に開示される方法は、ソフトウェア、サーバー、および/またはデータベースモジュールを利用する。本明細書に提供される開示の点から、ソフトウェアモジュールは、当技術分野で公知の機械、ソフトウェア、および言語を使用して当業者に公知の技法により作成される。本明細書に開示されるソフトウェアモジュールは、多数の方法で実行される。種々の実施形態では、ソフトウェアモジュールは、ファイル、コードの部分、プログラミングオブジェクト、プログラミング構造、またはその組合せを含む。さらなる種々の実施形態では、ソフトウェアモジュールは、複数のファイル、複数のコードの部分、複数のプログラミングオブジェクト、複数のプログラミング構造、またはその組合せを含む。種々の実施形態では、1つまたは複数のソフトウェアモジュールは、非限定的例として、ウェブアプリケーション、モバイルアプリケーション、およびスタンドアロンアプリケーションを含む。いくつかの実施形態では、ソフトウェアモジュールは、1つのコンピュータプログラムまたはアプリケーションにある。他の実施形態では、ソフトウェアモジュールは、1つよりも多いコンピュータプログラムまたはアプリケーションにある。いくつかの実施形態では、ソフトウェアモジュールは1つの機械上で提供される。他の実施形態では、ソフトウェアモジュールは1つよりも多い機械上で提供される。さらなる実施形態では、ソフトウェアモジュールはクラウドコンピューティングプラットホーム上で提供される。いくつかの実施形態では、ソフトウェアモジュールは、1つの位置において1つまたは複数の機械上で提供される。他の実施形態では、ソフトウェアモジュールは、1つよりも多い位置において1つまたは複数の機械上で提供される。
【0275】
データベース
【0276】
いくつかの実施形態では、本明細書に開示される方法は、1つまたは複数のデータベースを利用する。本明細書に提供される開示の点から、当業者であれば、多くのデータベースが、患者、配列、タグ、コード/デコード、遺伝子バリアント、および疾患情報の保存および検索に適していることは認識するであろう。種々の実施形態では、適切なデータベースは、非限定的例として、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関連モデルデータベース、アソシエーティブデータベース、およびXMLデータベースを含む。さらなる非限定的例は、SQL、PostgreSQL、MySQL、Oracle、DB2、およびSybaseを含む。いくつかの実施形態では、データベースはインターネットベースである。さらなる実施形態では、データベースはウェブベースである。なおさらなる実施形態では、データベースはクラウドコンピューティングベースである。他の実施形態では、データベースは1つまたは複数のローカルコンピュータ記憶装置に基づいている。
【0277】
一態様では、プロセッサーおよびコンピュータメモリーを含むコンピュータを含むシステムが本明細書では提供され、そこではコンピュータは通信ネットワークと通信しており、コンピュータメモリーは、プロセッサーにより実行された場合、(1)通信ネットワークからコンピュータメモリーに配列データを受け取り;(2)本明細書に記載される方法を使用して、配列データ中の遺伝子バリアントが生殖系列突然変異を表すのかまたは体細胞突然変異を表すのかを判定し;(3)通信ネットワークにその判定を報告するコードを含む。
【0278】
通信ネットワークは、インターネットに接続するいかなる利用可能なネットワークでも可能である。通信ネットワークは、例えば、限定せずに、Broadband over
Powerlines(BPL)、Cable Modem、Digital Subscriber Line(DSL)、Fiber、Satellite、およびWirelessを含む高速伝送ネットワークを利用することが可能である。
【0279】
一態様では、ローカルエリアネットワーク;ローカルエリアネットワークに接続されている、DNA配列データを保存するように構成されているコンピュータメモリーを含む1つまたは複数のDNAシーケンサー;ローカルエリアネットワークに接続されている、コンピュータメモリーおよびプロセッサーを含むバイオインフォマティクスコンピュータを含むシステムが本明細書で提供され、コンピュータは、実行されると、DNAシーケンサーに保存されているDNA配列データをコピーし、コピーデータをバイオインフォマティクスコンピュータのメモリーに書き込み、本明細書に記載されるステップを実施するコードをさらに含む。
【0280】
記載された方法を実行するための多数のシステムも本明細書で提供される。いくつかの実施形態では、システムは、次世代DNAシーケンサーを含む核酸シーケンサーを含み、シーケンサーはデジタル処理デバイスとデータ通信(data communication communication)をしており、そこではデジタル処理デバイス上のソフトウェアモジュール(単数または複数)が受け取るデータは、シーケンサーが、主題の方法により分割されタグが付けられている分割されタグが付けられたDNA配列からDNA配列情報を得ると、シーケンサーにより作成される。シーケンサー(sequncer)およびデジタル処理デバイスは互いに近くに位置している必要はなく、いくつかの実施形態では、適切なデータ通信がシステム構成成分間に存在していれば、大きな物理的距離に離れていてもよい。下に記載される特定のシステム実施形態は、本発明により提供されるさらに多くの種類のシステムの見本となる。データ解析(data data analysis)ステップを含む本明細書に記載される方法は、本明細書に開示されるシステムを通じて容易に実行することができ、デジタル処理デバイス上のソフトウェアモジュール(単数または複数)を使用して、主題の方法により生成されるタグが付けられた核酸集団をシーケンシングすることにより得られる配列データを分析することは当業者であれば理解するであろう。
【0281】
実施形態は、核酸シーケンサーと;少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと;核酸シーケンサーおよびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析するためのアプリケーションであって、少なくとも2種の形態の各々が複数の分子を含み、アプリケーションが、(i)データリンクを介して核酸シーケンサーから、少なくとも一部にタグが付けられている増幅された核酸の配列データを受け取るソフトウェアモジュールであって、配列データが、核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグが付けられた核酸と連結するステップと、その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップとによって作成される、ソフトウェアモジュールと;(ii)増幅された核酸のタグが付けられた核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供することによって、増幅された核酸の配列データをアッセイするソフトウェアモジュールとを含む、アプリケーションを作製するために実行可能な命令をさらに含む、システムである。別の実施形態では、システムは、増幅された核酸のタグが付けられた核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するソフトウェアモジュールをさらに含む。システムの他のもう1つの実施形態では、アプリケーションは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。
別の実施形態は、次世代シーケンシング(NGS)機器と;少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと;NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、(i)データリンクを介してNGS機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、ヒト試料からDNA分子を物理的に分画して、2種またはそれより多い分割物を作製するステップと、2種またはそれより多い分割物の各々に差次的分子タグおよびNGSを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、NGS機器で分子タグが付けられた分割物をアッセイするステップによって作成される、ソフトウェアモジュールと;(ii)試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するためのソフトウェアモジュールと;(iii)試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するためのソフトウェアモジュールとを含むアプリケーションを作製するために実行可能な命令をさらに含む、システムである。システムの他のもう1つの実施形態では、システムは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。
【0282】
別の実施形態は、次世代シーケンシング(NGS)機器と;少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと;NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、MBD-ビーズによって分画されたライブラリーの分子タグ同定のためのアプリケーションであって、データリンクを介してNGS機器から配列データを受け取るように構成されたソフトウェアモジュールであって、配列データが、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質-ビーズ精製キットを使用して、抽出されたDNA試料を物理的に分画するステップと、各画分または群に差次的分子タグおよびNGSを可能にするアダプター配列の並行適用を実施するステップと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的DNAプライマー配列を使用して続いて増幅するステップと、目的のゲノム領域を標的としながら、再度組み合わされ、増幅された総ライブラリーの濃縮/ハイブリダイゼーションを実施するステップと、試料タグを付加しながら、濃縮された総DNAライブラリーを再度増幅するステップと、異なる試料をプールするステップと、NGS機器で多重でそれらをアッセイするステップとによって作成され、機器によって生成されたNGS配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にMBD分割された分子への試料のデコンボリューションのための配列データを提供する、ソフトウェアモジュールと;(ii)独特の分子を同定するために分子タグを使用し、試料を、差次的にMBD分割された分子にデコンボリューションすることによって、配列データの解析を実施するように構成されたソフトウェアモジュールとを含むアプリケーションを作製するために少なくとも1つのプロセッサーによって実行可能な命令をさらに含む、システムである。別の実施形態は、アプリケーションが、通信網を介して解析の結果を送信するように構成されたソフトウェアモジュールをさらに含むシステムである。
【0283】
別の実施形態は、(a)次世代シーケンシング(NGS)機器と、(b)少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、(c)NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、i)データリンクを介してNGS機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、NGS機器を用いて分子タグが付けられた分割物をアッセイするステップとによって調製された標識された核酸とともにロードされて作成される、ソフトウェアモジュールと;ii)タグを解読するための配列データを作成するためのソフトウェアモジュールと;iii)タグを解読して、配列データがアッセイされた核酸が、第1または第2のプール中の鋳型から増幅されたか否かを明らかにするために配列データを解析するためのソフトウェアモジュールとを含むアプリケーションを作製するために実行可能な命令をさらに含む、システムである。別の実施形態は、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含むシステムである。
【実施例0284】
VII.実施例
(実施例1)
メチル結合ドメイン(MBD)ベースの分画のための実験手順
【0285】
試料収集
【0286】
肺がん(例えば、NSCLC)を抱えた対象由来の血液、血清または血漿などの試料は、GUARDANT360(商標)アッセイにより決定した場合、高循環腫瘍DNA(ctDNA)含有量を示したGuardant Healthレポジトリーから選択した。健康な正常ドナー由来の無細胞DNA(cfDNA)は、以前記載された(Lanmanら、Analytical and clinical validation of a digital sequencing panel for quantitative, highly accurate evaluation of cell-free circulating tumor DNA、PLoS ONE 10巻(10号):e0140712頁(2015年))通りに血液単離血漿から抽出した。
【0287】
cfDNA抽出
【0288】
試料はプロテイナーゼK消化に付した。DNAはイソプロパノールで沈殿させた。DNAはDNA精製カラム(例えば、QIAamp DNA Blood Mini Kit)上で捕捉し、100μl溶液に溶出させた。500bpより下のDNAはAmpure
SPRI磁気ビーズ捕捉(PEG/塩)で選択した。得られた産物は30μlのHOに懸濁した。サイズ分布を調べ(主ピーク=166ヌクレオチド;小ピーク=330ヌクレオチド)、定量化した。一般に、5ngの抽出DNAはおおよそ1700半数体ゲノム等価物(「HGE」)を含有する。DNAとHGEの量間の一般的相関は以下の通りに収載された:3pgのDNA=1 HGE;3ngのDNA=1K HGE;3ngのDNA=1M HGE;10pgのDNA=3 HE;10ngのDNA=3K HGE;10ngのDNA=3M HGE。
【0289】
DNA分画
【0290】
DNAは複数の画分(分割物)に分画した。cfDNA(10~150ng)を、反応条件を、300mMのNaClインキュベーションおよび洗浄バッファーを使用に変更し、1マイクログラムDNA入力のプロトコールをサブマイクログラム量のDNA入力にスケールダウンしたことを除いて、MethylMiner(商標)親和性濃縮プロトコール(Thermo Fisher Scientific、カタログ番号ME10025)を使用して高メチル化、中間メチル化および低メチル化画分に分画した。
【0291】
ビーズ調製
【0292】
Dynabeads(登録商標)M-280ストレプトアビジンを洗浄する:Dynabeads(登録商標)M-280ストレプトアビジンは、MBD-ビオチンタンパク質とのカップリングに先立って300mMのNaClを含有する洗浄バッファーを使用して洗浄した。Dynabeads(登録商標)M-280ストレプトアビジンのストックを再懸濁して均質な懸濁液を得た。マイクログラムの入力DNAごとに、10μlのビーズを1.7mlのDNアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は1×Bind/洗浄バッファーで100μlにした。チューブは磁気ラック上に1分間置いて、液体を除去して破棄する前にチューブの内壁上にビーズをすべて集めた。チューブを磁気ラックから取り出して等体積(例えば、約100~250μl)の1×Bind/洗浄バッファーを添加してビーズを再懸濁した。再懸濁したビーズは、続けてMBD-ビオチンタンパク質をビーズにカップリングさせる前にもう1度だけ集めて洗浄した。
【0293】
Dynabeads(登録商標)M-280ストレプトアビジンをMBD-ビオチンタンパク質とカップリングする:マイクログラムの入力DNAごとに、7μl(3.5μg)のMBD-ビオチンタンパク質を1.7mlのDNアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は1×Bind/洗浄バッファー(300mMのNaClを含有する)で100μlにした。MBD-ビオチンタンパク質は希釈し、最初のビーズ洗浄から再懸濁ビーズのチューブに移した。ビーズ-タンパク質混合物は、続けてMBD-ビーズを洗浄する前に、回転板混合器上、室温で1時間混合した。
【0294】
MBD-ビーズを洗浄する:チューブ中のMBD-ビーズは、チューブを磁気ラック上に1分間置くことにより集めた。液体は取り除き破棄した。ビーズは100~250μlの1×Bind/洗浄バッファー(300mMのNaClを含有する)で再懸濁し、回転混合器上、室温で5分間混合した。ビーズは集め、さらにもう2回上記の通り洗浄し再懸濁した。次に、チューブを磁気ラック上に1分間置き、液体を慎重に取り除いて破棄した。ビーズは、メチル化DNA捕捉前に100~250μlの1×Bind/洗浄バッファー(300mMのNaClを含有する)で再懸濁した。
【0295】
断片化したメチル化DNAをMBD-ビーズ上に捕捉しMBD-ビーズを断片化したDNAと一緒にインキュベートする:一般に、入力DNAは5ng~1μgまでの範囲であり得る。対照反応は典型的には1μgのK-562DNAを使用する。清潔な1.7mlのDNアーゼフリーのマイクロ遠心チューブに、20μlの5×洗浄/Bindバッファー(300mMのNaClを含有する)を添加した。断片化した試料DNA、例えば、5ng~1μgをチューブに添加し、最終体積をDNアーゼフリーの水で100μlにした。DNA/バッファー混合物をMBD-ビーズを含有するチューブに移し、回転混合器上、室温で1時間混合した。代わりに、混合物は4℃で一晩混合することが可能である。
【0296】
捕捉されていないDNAをビーズ溶液から収集する:捕捉されていない/非メチル化DNAは、DNAとMBD-ビーズ混合物から収集した。DNAとMBD-ビーズの混合物を含有するチューブは磁気ラック上に1分間置いてビーズを集め、上清液は取り除いて清潔なDNアーゼフリーのマイクロ遠心チューブに保存した。この保存上清液は捕捉されていないDNA上清であり、氷上で保存することが可能である。ビーズは、回転混合器上3分間、200μlの1×Bind/洗浄バッファー(300mMのNaClを含有する)で洗浄した。ビーズは上記の通りに集め、捕捉されていない/非メチル化/低メチル化DNAを含有する上清液を取り除き、上記の通り保存し氷上で保管した。ビーズは洗浄し、混合し、集め、上清はさらにもう1度取り除いて保存して2つの洗浄画分を収集した。それぞれの洗浄画分は氷上で保管した。洗浄画分は一緒にプールし適宜に標識することが可能である。
【0297】
捕捉されたDNAを溶出する:捕捉されたDNAは2000mMのNaClを含有する溶出バッファーを使用して溶出させた。ビーズは200μlの溶出バッファー(2000mMのNaCl)に再懸濁した。ビーズは回転混合器上で3分間インキュベートし、磁気ラック上に1分間置いてすべてのビーズを集め、捕捉された/高メチル化されたDNAを含有する液体は取り除いて清潔なDNアーゼフリーのマイクロ遠心チューブに保存した。捕捉された/メチル化されたDNAの保存した第1の画分を氷上で保管した。ビーズはもう1度再懸濁してインキュベートし、捕捉された/メチル化されたDNAを含有する液体を取り除き第2の清潔なチューブに保存した。捕捉された/メチル化されたDNAの第1および第2の収集物をプールし氷上で保管した。
【0298】
分析のためのメチル化分画されたDNAの調製:分割されたcfDNA、高メチル化、中間メチル化および非メチル化DNAは、例えば、SPRIビーズクリーンアップ(Ampure XP、Beckman Coulter)により精製し、続いてライゲーションのために調製し(NEBNext(登録商標)Ultra(商標)End Repair/dA-Tailing Moduleを使用して)、次にLanmanら、2015年に記載される非ランダム分子バーコードを含有する改変Y字型dsDNAアダプターとライゲーションさせた。高メチル化、中間メチル化および低メチル化cfDNA分割物はそれぞれ11、12および12の異なる非ランダム分子バーコードアダプターとライゲーションさせた。試料ごとにライゲーションさせ、分割したcfDNA分子をSPRIビーズ(Ampure XP)で再び精製し、次に再度組み合わせてあらゆるアダプターライゲーション分子に普遍的なオリゴ(NEBNext Ultra II(商標)Q5 master mix)を用いてPCR反応させ、すべてのcfDNA分子を1つの試料から一緒に増幅させた。増幅させたDNAライブラリーを、標準調製技法を使用する標的濃縮または全ゲノムシーケンシング(WGS)に備えてSPRIビーズ(Ampure XP)を使用して再び精製した。
【0299】
標的捕捉および濃縮:DNA試料は市販のプロトコール、例えば、イルミナマルチプレックスシーケンシングのためのSureSelectXT Target Enrichment Systemを使用して濃縮してもよい。
【0300】
(実施例3)
CDKN2Aのメチル化プロファイリング
【0301】
フラグメントームデータと併せたDNAメチル化プロファイリングを使用してCDKN2A遺伝子中の差次的にメチル化された領域(DMR)を捕捉した。CDKN2A遺伝子は、p16INK4Aおよびp14ARFタンパク質をコードする腫瘍抑制遺伝子であり、これらのタンパク質は細胞周期調節に関与している。cfDNA試料は、MBD-親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。分画すると、それぞれの群内の核酸分子をシーケンシングして配列読み取りデータを作成した。配列読み取りデータは、参照ゲノムにマッピングされると、フラグメントームデータを提供し、このデータを次に分画された分割物のそれぞれ由来の配列読み取りデータと組み合わせた(図10)。CDKN2A遺伝子は、高メチル化分割物と比べると低メチル化分割物のカバー度の全体的な増加を示した。
【0302】
(実施例4)
正常試料および肺がん試料のメチル化プロファイル
【0303】
図11に示されるように、MBD分割プロセスを、健康なドナー由来の4つのcfDNA試料(Norm13893、Norm13959、Norm13961、Norm13962)および高%のctDNAを有する肺がん患者由来の2つのcfDNA試料(LungA1345402、LungA0516902)に、変動する入力量(10~150ngのcfDNA)および複製物(例えば、3つの複製物)を用いて適用した。試料は、パネル内の標的とされたすべてのゲノム遺伝子座にわたって高メチル化DNAのパーセントにより階層的にクラスター化された。パーセント高メチル化DNAは、高メチル化無細胞DNA断片の数をすべての分割物にわたって観察される無細胞DNA断片の総数で割ることにより決定することが可能である。パネルは約30kbゲノム領域をカバーするカスタム遺伝子パネルである。パネルは、肺がん、結腸直腸がん、等などの異なるがんを検出するためのより高い感度も有する。健康なドナー由来の試料は、肺がん患者由来の試料とは別々にクラスター化された。個々の肺がん試料は、さらに別々にクラスター化される(すなわち、それぞれの肺がん試料の複製物が正確に同定され一緒に群化される)はっきり異なるメチル化プロファイルを有していた。例えば、国際公開第2017/181146号、2017年10月19日を参照されたい。
【0304】
(実施例5)
全ゲノムシーケンシングを使用するメチル化プロファイリング
【0305】
DNAメチル化プロファイリングをフラグメントームデータと統合して異常な断片化パターンを、したがって、臨床試料中の変更されたクロマチン構造を判定した(図12A図12B、および図12C)。核酸分子は肺がん患者由来であった。核酸分子はMBD-親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。分画すると、それぞれの分割物の核酸分子をシーケンシングして配列読み取りデータを作成した。配列読み取りデータは、参照ゲノムにマッピングされるとフラグメントームデータを提供した。ゲノム位置、断片長およびカバー度などのフラグメントームデータを、それぞれの分割物由来の配列読み取りデータと組み合わせた。図12Aおよび図12Bに示されるように、転写開始部位(TSS)の600bp領域はX軸上にあり出現頻度またはカバー度はY軸に示される。図12CはX軸に全断片と比べた場合の高メチル化断片の割合を、Y軸に出現頻度を示している。例えば、図12Cでは、全断片中の高メチル化断片の割合は約0.2(すなわち、約20%)である。
【0306】
(実施例6)
MOB3AおよびWDR88のメチル化プロファイリング
【0307】
DNAメチル化プロファイリングをフラグメントームデータと統合してエピジェネティック調節の違いを判定した(図13Aおよび図13B)。核酸分子はMBD-親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。分画すると、それぞれの分割物の核酸分子をシーケンシングして配列読み取りデータを作成した。配列読み取りデータは、参照ゲノムにマッピングされるとフラグメントームデータを提供した。ゲノム位置およびカバー度などのフラグメントームデータを、分画された群のそれぞれ由来の配列読み取りデータと組み合わせた。
【0308】
MOB3A遺伝子は未知の生化学的機能を有する可能性があり、腫瘍成長および増殖を維持するのに関係付けられる可能性がある。図13Aにあるヒートマップは、健康な個体由来の試料においてTSSの開始部位近くの低メチル化と比べると高メチル化のより大きなカバー度を示した。本実施例は、分画された群とフラグメントームデータを組み合わせてがんを示し得る遺伝子のTSSにおけるマーカーを検出する用途を提供した。これらのデータは、分画された群(または分割物)が、高メチル化も低メチル化も、TSSなどのゲノム領域にわたってメチル化状態を識別するためのより良好な解像度を提供することを示した。上記のように、分画された群のカバー度は、TSSにわたるメチル化状態の違いを示した。本実施例は、核酸分子を分画して遺伝子にわたってメチル化状態のより良好な解像度を提供する用途を提供した。
【0309】
WDR88遺伝子は、細胞周期調節、アポトーシスおよびオートファジーに関係している可能性がある。ヒートマップは、健康な個体由来の試料においてTSSの開始部位近くの低メチル化と比べると高メチル化のより大きなカバー度を示した(図13B)。さらに、図13Bは、分画された群が、高メチル化も低メチル化も、TSSなどのゲノム領域にわたってメチル化状態を識別するためのより良好な解像度を提供することを示した。上記のように、分画された群のカバー度は、TSSにわたるメチル化状態の違いを示した。本実施例は、核酸分子を分画して遺伝子にわたるメチル化状態のより良好な解像度を提供する用途を提供した。
【0310】
(実施例7)
再度組み合わされた分割物および非分画試料のメチル化プロファイリング
【0311】
図14Aは、X軸およびY軸上にそれぞれ、非分画群(MBDなし)およびMBD親和性分割後の再度組み合わされた分割物(全MBD)由来のカバー度を有するヒートマップを示している。分割物を、高および低メチル化分割物への分割後にin silicoで再度組み合わせて、「高+低」または「全MBD」を形成した。ヒートマップはMBDなしと全MDBのカバー度間の直線相関を示している。直線相関は類似するカバー度を示しており、ゲノム遺伝子座にわたってメチル化状態の類似する解像度を提供する可能性がある。MBDなしおよび/または全MBDにより得られる解像度のレベルは、遺伝子座にわたるメチル化状態の違いを区別するには十分ではなく、MBD親和性に基づく分割の思いがけない利点を示している可能性がある。
【0312】
図14Bは、全MBDを用いたMVAプロットヒートマップを示している。X軸は全MBDにおける平均断片(再度組み合わされた高および低メチル化分割物)を(a+b)/2として示しており、a=全MBDおよびb=MBDなしである。
【0313】
(実施例8)
再度組み合わされた分割物(全MBD)と非分画試料間のヌクレオソーム組織化
【0314】
図15に示されるように、ゲノム領域にわたる全MBD(in silicoで再度組み合わされた高および低メチル化分割物)とMBDなし(非分画)試料についてのヌクレオソーム占有中心間の距離の違いをX軸にプロットした。ゲノム領域にわたる全MBDとMBDなし試料についてのヌクレオソーム占有中心間の距離の分布の違いは「密度」により示されるY軸にプロットした。全MBD試料は、高と低メチル化分割物をin silicoで再度組み合わせることにより調製した。これらの結果は、MBD分割がヌクレオソーム占有に影響を及ぼさないことを示している。
【0315】
(実施例9)
MBDシグナルの検証
【0316】
MBD分割した試料を使用して、健康な試料とがん試料のヌクレオソーム占有を識別した。本実施例では、6人の肺がん患者および3人の非悪性健康成人由来の血液試料を得た。試料由来の無細胞核酸を抽出し、MBD-親和性精製を使用して高および低メチル化分割物に分割した。核酸試料は全ゲノムシーケンシングを使用してシーケンシングした。分割物ごとのおよびすべての試料についてのパーセント高メチル化断片を判定した。図16は、肺がん患者(上から1および2列目)由来および健康な成人(3および4列目)由来の高および低メチル化分割物でのMBDシグナルを示している。図16に示されるように、肺がん患者由来の無細胞DNA断片は、健康な個体由来の高メチル化分割物と比べた場合、高メチル化分割物(LungSigHyper)において遠位遺伝子内領域の濃縮を示している。さらに、上の高いほうから5%のパーセント高メチル化ピーク(LungSigHyper)および低メチル化ピーク(LungSigHypo)における特徴の分布はエクソン1に加えてすべてのエクソンにおける低メチル化ピークの有意な濃縮を示している(図16、1および2列目)。
【0317】
(実施例10)
AP3D1遺伝子のメチル化プロファイリング
【0318】
本明細書に記載される方法を肺がんの予後のために使用した。実験では、肺がん患者由来の核酸分子を有する試料は、MBD-親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。対照として、ある試料は分割しなかった(MBDなし)。試料は全ゲノムシーケンシングを使用してシーケンシングした。
【0319】
AP3D1遺伝子は、オルガネラ輸送に関係付けられる可能性のあるAP-3コンプレックスサブユニットデルタ-1をコードしている可能性がある。ヒートマップは、TSS近くの低メチル化分割物および/またはMBDなしと比べると高メチル化分割物のより大きなカバー度を示した(図18A)。高メチル化分割物はMBDなし群よりも強くおよび/またはより局在化したカバー度を示した。ヒートマップに示されるように、高メチル化分割物はTSS近くに多くの局在化した強いカバー度を有し、MBDなし群はゲノム領域にわたって類似するカバー度を有していた。平均パーセント高メチル化も図18Bの赤色線により示される通りに決定された。本実施例は、核酸分子を分画して遺伝子にわたってメチル化状態のより良好な解像度を提供する用途を提供することができる。これらの結果は、AP3D1遺伝子が特にTSS近くで高メチル化されていること(図18A)およびAP31遺伝子が高メチル化されている(図18Bに示される通りに>60%)ことを示している。AP3D1遺伝子の調節解除は肺がんを引き起こすことに関与している可能性がある。したがって、この実施例は、個体のメチル化プロファイルをモニターすることによる肺がんの予後におけるこの方法の用途を提供することができる。
【0320】
(実施例11)
DNMT1遺伝子のメチル化プロファイリング
【0321】
別の実施例では、DNMT1遺伝子のメチル化プロファイリングを調べた。DNMT1遺伝子は、DNA中の特定のCpGジヌクレオチドへのメチル基の転移を触媒する酵素をコードしている。DNMT1は、受け継がれるエピジェネティックパターンの複製の忠実度を保証するためのDNAメチル化の維持に関係付けられてきた。異常なメチル化パターンはがんおよび発生異常と関連している可能性がある。
【0322】
高メチル化、低メチル化およびMBDなしのヒートマップは、TSSに関して示されている(図19A)。高メチル化分割物は、MBDなし群よりも強いおよび/またはより局在化したカバー度を示した。高メチル化分割物は、TSS近くに局在化したより強いカバー度を有し、MBDなし群は遺伝子にわたって類似するカバー度を有していた。平均パーセント高メチル化も、図19Bの赤色線により示される通り、約75%であると判定した。これらの結果は、DNMT1遺伝子が特にTSS近くで高メチル化されていること(図19A)およびDNMT1遺伝子が高メチル化されている(図19Bに示される通りに約75%)ことを示している。異常なメチル化パターンはクロマチン構造の変化とともに、肺がんを引き起こすことに関与している可能性のあるDNMT1の調節解除をもたらす可能性がある。したがって、本実施例は、個体のメチル化プロファイルをモニターすることによる肺がんの予後におけるこの方法の用途を提供することができる。本実施例は、核酸分子を分画して遺伝子にわたってメチル化状態のより良好な解像度を提供する用途も提供することができる。
【0323】
(実施例12)
修飾ヒストン分画
【0324】
本実施例は、修飾ヒストンアプローチを使用した分割を実証している。DNAをヒストン修飾に基づいて分割する。手短に言えば、アガロースビーズをBSAでブロッキングし、洗浄に続いて、ビーズを、H3K9me3およびH4K20me3に対する抗体(Millipore、Temecula、CA、USA)と一緒に4℃で4時間プレインキュベートする。続いて、200μlの血漿を800μlの分割物希釈バッファー中に希釈し、次に抗体と一緒にプレインキュベートされたペレット状のアガロースビーズに添加する。4℃での一晩インキュベーションに続いて、ビーズを低塩、高塩、LiClおよびTris/EDTAバッファーで洗浄する。最後に、クロマチンを65℃でビーズをインキュベートすることにより溶出させ、タンパク質をプロテイナーゼKを用いた処理により取り除く。次に、分割されたDNAを適切な精製キットを使用して精製し、-20℃で保存した。
【0325】
(実施例13)
タンパク質結合領域に基づく分画
【0326】
本実施例は、タンパク質結合領域を使用した分割アプローチを実証する。DNAを、プロテインAへの結合の違いに基づいて分割する。試料中の核酸分子もタンパク質結合領域に基づいて分画することが可能である。例えば、核酸分子は、特定のタンパク質に結合している核酸分子およびその特定のタンパク質に結合していない核酸分子に基づいて異なる群に分画することが可能である。核酸分子はDNA-タンパク質結合に基づいて分画することが可能である。タンパク質-DNA複合体は、タンパク質の特定の特性に基づいて分画することが可能である。そのような特性の例は、種々のエピトープ、修飾(例えば、ヒストンメチル化またはアセチル化)または酵素活性を含む。DNAに結合し分画の根拠として役立つことができるタンパク質の例は、例えば、プロテインAまたはプロテインGを含んでいてもよい。クロマチン免疫沈降などの実験手順を使用して、プロテインA結合領域に基づいて核酸分子を分画する。
【0327】
(実施例14)
ヒドロキシメチル化に基づいて分画する
【0328】
本実施例は、修飾ヒストンアプローチを使用した分割を実証する。DNAをヒドロキシメチル化に基づいて分割する。手短に言えば、5-hmC-修飾塩基をin vitroでグリコシル化させる。5-hmCの特定のグルコシル化は、Zymo Research製の高度に活性な5-hmCグリコシルトランスフェラーゼ酵素のプロトコールに従うことにより達成される(zymoresearch.com/epigenetics/dna-hydroxymethylation/5-hmc-glucosyltransferase)。J-結合タンパク質-1(JBP-1)は、高親和性でグリコ
シル化DNAに特異的に結合し、5-hmCレベルをJBP-1ベースの濃縮により決定するのが可能になる。さらに、5-hmCのグリコシル化はいくつかの制限酵素によるDNAの消化を変更し、したがって、5-hmC-グリコシル化DNAの消化パターンを使用すればDNAヒドロキシメチル化状態を評価することが可能になる。
【0329】
(実施例15)
核酸分子の鎖の状態に基づいて分画する
【0330】
試料中の核酸分子を鎖の状態に基づいて分画する。例えば、ssDNAおよびdsDNAは2つの群に分画される。これらの群は、個別にまたは同時にシーケンシングアッセイに付す。ssDNAとdsDNAの両方を有する核酸試料は、分画中試料を変性ステップに付さないことにより分画する。変性ステップはdsDNAをssDNAに変換し、鎖の状態に基づく核酸分子の分画ができなくなる。
【0331】
(実施例16)
改変プレ増幅標的捕捉プロトコール(NEBNext Direct)を用いたssDNAおよびdsDNAの分子分割
【0332】
新規のハイブリッド捕捉法は、プレ増幅ハイブリッド捕捉標的シーケンシングプロトコール(例えば、NEBNext Direct HotSpot Cancer Panel)をDNA変性なしで無細胞DNA(cfDNA)試料に適用して、ssDNA分子を捕捉した(図18)。
【0333】
dsDNA分子を含有する非結合画分を単離し、ssDNAに変性させ、捕捉プロトコールに適用した。
【0334】
使用されたプレ増幅ハイブリッド捕捉シーケンシングプロトコールはNEBNext Direct HotSpot Cancer Panelであり、50の遺伝子由来の190の一般的がん標的のベイトを含有し、およそ40kbの配列を包含し、18,000を超えるCOSMICフィーチャーを含んだ(NEBNext Direct HotSpot Cancer Panel; neb.com/products/e7000-nebnext-direct-cancer-hotspot-panel)。手短に言えば、NEBNext Direct標的濃縮アプローチは、DNA試料をビオチン化オリゴヌクレオチドベイトに迅速にハイブリダイズさせ、このベイトは目的のそれぞれの標的の3’末端を定義する。ベイト-標的ハイブリッドはストレプトアビジンビーズに結合していて、酵素反応を使用して3’オフターゲット配列を取り除いた。続いて起こるライブラリー調製は標的を、分子タグおよび試料バーコードを含むIlluminaコンパチブルライブラリーに変換した。キットの使用により、ベイトとのハイブリダイゼーションに先立ってDNA試料を変性することにより試料中のすべてのssDNAおよびdsDNA分子の捕捉が可能になった。
【0335】
ss-およびds-cfDNAを含有するcfDNA試料を、事前dsDNA変性ステップを省いた標的捕捉プロトコールに付した。捕捉されたssDNA分子はNEBNextプロトコールによるNGSのために準備し(図20の左欄)、捕捉物由来の上清は、標準的な事前dsDNA変性ステップのある第2の標的捕捉プロトコールに適用させ、それに続いてNGSのために準備した(図20の右欄)。血漿から抽出されたcfDNAを電気泳動ベースの測定により定量化した。200ngまたは500ngに相当する試料体積を、ssDNA分子だけがベイトにハイブリダイズするように、DNA変性ステップを省いた、NEBNext Direct HotSpot Cancer Panelアッセイに適用させた。dsDNA分子および非標的ssDNA分子を含有する捕捉物の上清は保持して、第2の標的捕捉に付した(図20)。ssDNAとdsDNAライブラリーの両方をNGSのために、下流バイオインフォマティクス分析で同定される独特の試料バーコードタグ付きで、別々に調製された。ssDNAとdsDNA調製ライブラリーの両方をIllumina NextSeq 500(2×75の対をなす末端)上でシーケンシングし、オンターゲット分子(40kbベイトに対応する)の総数をコンピュータで計算した(図1)。
【0336】
一本鎖無細胞DNA(ss-cfDNA)と二本鎖無細胞DNA(ds-cfDNA)の両方を有する無細胞DNA(cfDNA)試料は、上記の方法を使用して、それぞれss-cfDNA群とds-cfDNA群に分画した(図20)。シーケンシングした試料のうちの2つで、ssDNAライブラリーは約80%のdsDNAを含有する(オンターゲット分子、第1は200ngおよび第2は500ngのcfDNA入力)。第2の200ngのcfDNAはssDNAとdsDNAライブラリーの両方を作成できず、ssDNA/dsDNA分割プロセスの上流の試料処理における予想される誤りを示し、第1の500ngのcfDNA入力は重要なdsDNAライブラリーのみを作成し、これによりcfDNA試料中のssDNAとdsDNAの相対量は変わりやすいことが示唆された。オンターゲット分子は、Broad InstituteからのPicardパッケージ(Picard metrics; broadinstitute.github.io/picard/picard-metric-definitions.html)により定義される通りにコンピュータで計算した。この実験でのPCR収量は図20に示した。相対収量、ssDNAのPCR収量/dsDNAのPCR収量は、4つすべての試料において20%と75%の間であると判定された。
【0337】
(実施例17)
MBDベースのメチル化分割法を用いて保持される感度のよい体細胞突然変異検出
【0338】
試料収集およびプール化
【0339】
試料は、高cfDNA収量を示したGuardant Healthレポジトリーから選択した。臨床試料は96の試料を等しい体積で混合することにより調製した。これは、プールが参照ゲノム由来の突然変異を<0.02%から100%で含有するので、突然変異検出に対するアッセイ感度のための試験物質としての役割を果たす。独自成分の試料を有する2つの異なる臨床試料(PowerpoolV1およびPowerpoolV2)を調製した。
【0340】
DNA分割
【0341】
Powerpool cfDNAを複数の画分に分割した。cfDNA(15または150ng)は、反応条件を、300mMのNaClインキュベーションおよび洗浄バッファーを使用に変更し、1マイクログラムDNA入力のプロトコールをサブマイクログラム量のDNA入力に直線的にスケールダウンしたことを除いて、MethylMiner(商標)親和性濃縮プロトコール(Thermo Fisher Scientific、カタログ番号ME10025)を使用して高メチル化、中間メチル化および低メチル化画分に分割した。
【0342】
ビーズ調製
【0343】
Dynabeads(登録商標)M-280ストレプトアビジンを洗浄する
【0344】
Dynabeads(登録商標)M-280ストレプトアビジンは、MBD-ビオチンタンパク質とのカップリングに先立って1×Bind/洗浄バッファー(160mMのNaClを含有する)を使用して洗浄した。手短に言えば、Dynabeads(登録商標)M-280ストレプトアビジンのストックを再懸濁して均質な懸濁液を得た。マイクログラムの入力DNAごとに、10μlのビーズを1.7mlのDNアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は1×Bind/洗浄バッファーで100μlにした。チューブは磁気ラック上に1分間置いて、液体を除去して破棄する前にチューブの内壁上にビーズをすべて集めた。チューブを磁気ラックから取り出して等体積(例えば、約100~250μl)の1×Bind/洗浄バッファーを添加してビーズを再懸濁した。再懸濁したビーズは、続けてMBD-ビオチンタンパク質をビーズにカップリングさせる前にもう1度集めて洗浄した。
【0345】
Dynabeads(登録商標)M-280ストレプトアビジンをMBD-ビオチンタンパク質とカップリングさせる
【0346】
マイクログラムの入力DNAごとに、7μl(3.5μg)のMBD-ビオチンタンパク質を1.7mlのDNアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は1×Bind/洗浄バッファー(300mMのNaClを含有する)で100μlにした。MBD-ビオチンタンパク質は希釈し、最初のビーズ洗浄から再懸濁ビーズのチューブに移した。ビーズ-タンパク質混合物は、続けてMBD-ビーズを洗浄する前に、回転板混合器上、室温で1時間混合した。
【0347】
MBD-ビーズを洗浄する
【0348】
MBD-ビーズを含有するチューブは、MBD-ビーズを磁気ラック上に1分間置くことにより集めた。液体は取り除き破棄した。ビーズは100~250μlの1×Bind/洗浄バッファー(160mMのNaClを含有する)で再懸濁し、回転混合器上、室温で5分間混合した。ビーズは集め、さらにもう2回上記の通り洗浄し再懸濁した。次に、チューブを磁気ラック上に1分間置き、液体を慎重に取り除いて破棄した。ビーズは、使用されたストレプトアビジンビーズのそれぞれのμlあたり10μlの1×DNA捕捉バッファー(300mMのNaClを含有する)で再懸濁した。
【0349】
断片化したメチル化DNAをMBD-ビーズ上に捕捉する
【0350】
MBD-ビーズを断片化したDNAと一緒にインキュベートする
【0351】
一般に、入力DNAは5ng~1μgまでの範囲であり得る。対照反応は典型的には1μgのK-562DNAを使用した。清潔な1.7mlのDNアーゼフリーのマイクロ遠心チューブまたはPCRチューブに、断片化した試料DNA、例えば、5ng~1μgを、等体積の2×DNA捕捉バッファー(300mMのNaClを含有する)と一緒にチューブに添加し、最終体積を1×DNA捕捉バッファーで100または200μlにした。DNA/バッファー混合物をMBD-ビーズを含有するチューブに移し、回転混合器上、室温で1時間混合した。代わりに、混合物は4℃で一晩混合することが可能である。
【0352】
捕捉されていないDNAをビーズ溶液から収集する
【0353】
捕捉されていない/非メチル化DNAは、DNAとMBD-ビーズ混合物から収集した。手短に言えば、DNAとMBD-ビーズの混合物を含有するチューブは磁気ラック上に1分間置いてビーズをすべて集め、上清液は取り除いて清潔なDNアーゼフリーのマイクロ遠心チューブに保存した。この保存上清液は捕捉されていないDNA上清/非メチル化DNA画分であり、氷上で保存することが可能である。ビーズは、回転混合器上3分間、200μlの1×DNA捕捉バッファー(300mMのNaClを含有する)で洗浄した。ビーズは上記の通りに集め、捕捉されていない/非メチル化/低メチル化DNAを含有する上清液を取り除き、保存し上記の通り氷上で保管した。ビーズは洗浄し、混合し、集め、上清はさらにもう1度取り除いて保存して2つの洗浄画分を収集した。それぞれの洗浄画分は氷上で保管した。洗浄画分は一緒にプールし適宜に標識することが可能である。
【0354】
捕捉されたDNAを溶出する
【0355】
捕捉されたDNAは2000mMのNaClを含有する溶出バッファーを使用して溶出させた。ビーズは200μlの溶出バッファー(2000mMのNaCl)に再懸濁した。ビーズは回転混合器上で3分間インキュベートし、磁気ラック上に1分間置いてすべてのビーズを集め、捕捉された/高メチル化されたDNAを含有する液体は取り除いて清潔なDNアーゼフリーのマイクロ遠心チューブに保存した。保存した最初の画分は氷上で保管した。ビーズはもう1度再懸濁してインキュベートし、捕捉された/メチル化されたDNAを含有する液体を取り除き第2の清潔なチューブに保存した。捕捉された/メチル化されたDNAの第1および第2の収集物をプールし氷上で保管した。代わりに、増加するNaCl濃度を用いた複数の溶出を実施すれば、DNAメチル化が増加する画分にDNAをさらに分割することが可能である。
【0356】
分析のためのメチル化分画されたDNAの調製
【0357】
分割されたcfDNA、メチル化、中間メチル化および非メチル化DNAは、例えば、SPRIビーズクリーンアップ(Ampure XP、Beckman Coulter)により精製し、続いてライゲーションのために調製し(NEBNext(登録商標)Ultra(商標)End Repair/dA-Tailing Moduleを使用して)、次にLanmanら、2015年に記載される非ランダム分子バーコードを含有する改変Y字型dsDNAアダプターとライゲーションさせた。高メチル化、中間メチル化および低メチル化cfDNA分割物はそれぞれ11、12および12の異なる非ランダム分子バーコードアダプターとライゲーションさせた。試料ごとにライゲーションさせ、分割したcfDNA分子をSPRIビーズ(Ampure XP)で再び精製し、次に再度組み合わせてあらゆるアダプターライゲーション分子に普遍的なオリゴ(NEBNext Ultra II(商標)Q5 master mix)を用いてPCR反応させ、すべてのcfDNA分子を1つの試料から一緒に増幅させた。増幅させたDNAライブラリーを、ハイブリッド捕捉による標的濃縮に備えてSPRIビーズ(Ampure XP)を使用して再び精製した(Agilent SureSelect 30kbパネル;「パネル」)。
【0358】
分析のための非分割DNAの調製
【0359】
Powerpool cfDNA(10または150ng)をライゲーションのために調製し(NEBNext(登録商標)Ultra(商標)End Repair/dA-Tailing Moduleを使用して)、次にLanmanら、2015年に記載される非ランダム分子バーコードを含有する改変Y字型dsDNAアダプターとライゲーションさせた。cfDNAは35の異なる非ランダム分子バーコードアダプターとライゲーションさせた。試料ごとにライゲーションされたcfDNA分子をSPRIビーズ(Ampure XP)で再び精製し、次にあらゆるアダプターライゲーション分子に普遍的なオリゴ(NEBNext Ultra II(商標)Q5 master mix)を用いてPCR反応させ、すべてのcfDNA分子を1つの試料から一緒に増幅させた。増幅させたDNAライブラリーを、ハイブリッド捕捉による標的濃縮に備えてSPRIビーズ(Ampure XP)を使用して再び精製した(Agilent SureSelect 30kbパネル;「パネル」)。
【0360】
本開示は、異なる形態(例えば、RNAおよびDNA、一本鎖または二本鎖)および/または修飾の程度(例えば、シトシンメチル化、タンパク質との会合)を含有する核酸集団を処理するための方法を提供する。これらの方法は、複数の形態について配列情報が得ることができるように試料中の核酸の複数の形態および/または修飾に適応する。方法はまた、配列の分析をエピジェネティック解析と組み合わせることができるように、処理および分析を通じて複数の形態または修飾状態の同一性を保つ。
【0361】
データ解析
【0362】
異なる試料由来のDNAライブラリーをプールし、Illumina HiSeq2500、2×150対末端シーケンシング上で配列決定した。バイオインフォマティクス処理はLanmanら、2015年および他の場所に記載される標準GUARDANT360(商標)プロトコールにより実施した。MBD分割試料では、さらに分子バーコードを使用して、DNAが分画されていた(高メチル化、中間メチル化、および低メチル化)MBD分割物を同定した。パネルにより標的にされるそれぞれのゲノム遺伝子座では、高メチル化された、中間メチル化された、および低メチル化されたアラインされた分子を合計した。%高メチル化は所与の遺伝子座で、高メチル化されている遺伝子座にまたがる全分子の割合として定義した。MBD分割された試料と非分割DNA試料の両方では、標的領域において、商標付きのGuardant Healthバリアントコーリングソフトウェアを使用して参照ゲノム由来の突然変異対立遺伝子画分(MAF)を呼び出した。
【0363】
(実施例18)
標的シーケンシングアッセイにおけるMBDおよび非MBD試料についてのカバー度間の比較
【0364】
本実施例では、試料は実施例17に記載される通りに処理した。cfDNAの異なる臨床試料(PowerpoolV1およびPowerpoolV2)を、標的シーケンシングアッセイにおいて、MBD-分割、「MBD」および「非MBD」ありおよびなしで、それぞれ3通りアッセイした。パネル由来の遺伝子についてのそれぞれの標的ゲノム位置で配列決定された独特の分子は、PowerpoolV1について15ng(図25A)および150ng(図25B)アッセイ入力でMBDおよび非MBDにおいて比較した。パネルは約30kbゲノム領域をカバーするカスタム遺伝子パネルである。パネルは、肺がん、結腸直腸がん、等などの異なるがんを検出するのにより高い感度も有する。図25Aおよび図25Bは、MBD分割の用途で保持された標的シーケンシングアッセイでの分子の高効率回収を示している。powerpoolV1(a)15ngおよび(b)150ng入力の標的シーケンシングアッセイからの分子数は、MBD-分割あり(Y軸)またはそれなしでも延びる。MBDから非MBD分子数またはカバー度間で直線相関が観察され、MBD分割はアッセイの回収を偏らせないことを示している。
【0365】
パネル由来の遺伝子についての分子数またはカバー度を、非MBDとMBD試料の間で比較した。MBDおよび非MBD試料は、2つの臨床試料から抽出した15ng入力cfDNAを使用して(図26A-PowerpoolV1および図26B-PowerpoolV2)または2つの臨床試料から抽出した150ng入力cfDNAを使用して(図27A-PowerpoolV1;図27B-PowerpoolV2)調製した。左のグラフのX軸は分子数またはカバー度を表し、中央のグラフのX軸は両方の対末端読み取りデータで確認された突然変異を表し(二本鎖オーバーラップ;DSO)、左のグラフのX軸は両方のDNA鎖が配列決定される分子数を表す(二本鎖サポート;DS)。分子数、DSOおよびDSについてのMBDと非MBD試料の間の強い相関は、非MBDと比べた場合、MBD試料が分子の大半を捕捉することが可能であることを示している(図26Aで約94%、図26Bおよび図27Aで約80~85%、ならびに図27Bで約90%)。パネルにわたって、分子カバー度、ならびに他の重要なバリアントコーリング測定基準(DSO、DS)における位置バイアスはない。
【0366】
(実施例19)
MBDおよび非MBD試料におけるバリアント検出の感度および特異性
【0367】
本実施例では、試料は実施例17に記載の通りに処理した。感度および特異性に関するバリアントまたは突然変異検出に対する影響を測定するため、15ng入力cfDNAを使用してパネル中の遺伝子について、MBD(Y軸)試料と非MBD(X軸)試料の間の突然変異対立遺伝子分画(MAF)を比較した。異なるMAFレンジ、例えば、0~100%(図28A)、0~5%(図28B)および0~0.5%(図28C)をX軸にプロットした。MAF値はMBDおよび非MBD由来の3通りの試料由来である。MBD試料について決定されたMAFは、非MBD試料について決定されたMAFに一致していた。MBDと非MBDの間のMAFは、15ng入力(図28A;0~100%)でおよび低い検出限界(図28B;0~5%)でPowerpoolV1について直線相関を示した。MBDと非MBDの間のMAFは、検出限界よりも下では十分相関していなかった(図28C;0~0.5%MAF)。同様に、MBDおよび非MBD試料は、PowerpoolV1由来の150ng cfDNA入力ではMAFでの一致を示した(図29Aおよび図29B)が、0~0.5%レンジでは強い一致はなかった(図29C)。
【0368】
(実施例20)
全ゲノムシーケンシングを使用するプロモーター領域のメチル化プロファイリング
【0369】
分子分割試料は、がんの無細胞DNA断片占有率および検出などのゲノム構造の分析を高めることができる。例えば、転写関連高メチル化事象は、メチル化駆動遺伝子サイレンシングを介して通常がんが標的にする腫瘍抑制遺伝子のプロモーター領域を分析する場合に、無細胞DNA断片占有率を考慮することにより検出することが可能である。異なるMBD分割物において無細胞DNA断片占有率シグナルおよび高メチル化画分を共に調べると、がん試料における転写関連高メチル化事象および遺伝子サイレンシングのMBD駆動発見の実行可能性を確認することができる。
【0370】
説明的例として、一般に公開されているジェンコード(gencode)(v26lift3
7)データを使用して、非悪性健康成人の利用可能なコホート内のすべてのジェンコード遺伝子のTSS領域におけるパーセント高メチル化(高メチル化分割物における断片の数/すべてのMBD分割物における断片の総数)を生み出すことができる。無細胞DNA断片占有率シグナルは非悪性健康成人のコホートにわたって集めることができる。すべてのTSSは、MBD分割アッセイにおいて観察されるパーセント高メチル化画分に基づいてビニングして(bin)もよい。それぞれのビン中の非MBD WSGコホートの断片占有
率を調べてもよい。図23は遺伝子発現とメチル化状態の相関を示している。プロモータープロファイルでのWGS占有率対パーセントMBDメチル化が示されている。図23に見られるように、低メチル化DNA(0~0.1%高)はTSS付近では低断片占有カバー度を有し、高メチル化DNA(10~50%高または>50%高)はTSS付近では高断片占有カバー度およびはっきり異なるNDRを有する。いくつかの場合、低メチル化DNAの断片占有カバー度を使用して、配列深度および/または配列のマッピング可能性を正規化する。高メチル化または低メチル化核酸断片のパーセントは、高メチル化または低メチル化無細胞断片の数をすべての分割物にわたって観察される無細胞DNA断片の総数で割ることにより決定することが可能である。
【0371】
(実施例21)
MBD試料と全ゲノムバイサルファイトシーケンシング(WGBS)試料におけるメチル化レベル間の比較
【0372】
MBDプロトコールを使用して調製される種々の分割物での断片のメチル化レベルを評価するため、よく特徴付けられた試料、NA12878(catalog.coriell.org/0/Sections/Search/Sample_Detail.aspx?Ref=GM12878)を使用した。試料は高-、低-および中間メチル化部分に分割され、続いて実施例1に記載される通りにin silicoで分割物(MBD試料)が再度組み合わされる。MBD試料を、全ゲノムバイサルファイトシーケンシング(WGBS)を利用する、一般に公開されている標準メチル化データセット(basespace.illumina.com/datacentral (HiSeq 4000: TruSeq DNA Methylation (NA12878, 1x151)))と比較した。WGBSは、個々のシトシンのメチル化状態を調べる。
図31は、160bpウィンドウにおいてWGBS(X軸)およびMBD(Y軸)により測定される場合、平均メチル化レベルの相関を示している。MBDメチル化レベルは、区分されたそのウィンドウに入る高メチル化分割物中の読み取りデータの数を高-および低メチル化分割物中の読み取りデータの総数で割ることによりコンピュータで計算した。WGBSメチル化レベルは、ウィンドウ中でメチル化塩基の数をメチル化および非メチル化塩基の数で割ることによりコンピュータで計算した。この実験はいくつかの異なるビーズ比にわたって行い、ビーズ比はメチル化断片の分割に影響を与える。ビーズが少なければ、高メチル化分割物は高度にメチル化された断片に制限され(すなわち、アッセイをメチル化にとってより特異的にし)、ビーズが多ければ、断片を高分割物に入れるのに必要なメチル化の量を減少させる(すなわち、アッセイをメチル化に対してより感度よくする)。経験的に、1:50という入力DNA:ビーズ比は、分割された断片とそのメチル化レベルの間で相互に関連があることが分かった。これらの結果は、MBD分割が試料の根底にあるメチル化状態を確かに正確に反映していることを示している。
【0373】
この分析では、断片中のCG部位の数のその断片の分割に対する効果を判定した。非常に高-または低メチル化(以前の分析で計算された全ゲノムバイサルファイトシーケンシングメチル化レベル>90%または<10%)を示す標準メチル化データセット(NA12878;以前の分析と同じ)と一緒に一般に公開されている断片を分析のために選択した。これらの断片は、それが含有したCG部位の数により層別化した。3またはそれよりも多いCG部位を有する高度メチル化断片は最後には高メチル化分割物になり、アッセイが少量のメチル化に感度がよいことを示した(図31A)。逆に、メチル化を欠く断片は、断片中のCG部位の数とは無関係に主に低メチル化分割物に分割され、アッセイが高度な特異性を有することを示している(図31B)。
【0374】
本開示の好ましい実施形態が本明細書で示され記載されてきたが、そのような実施形態は例としてのみ提供されることは当業者には明らかであろう。数多くの変形、変化、および代替が本開示から逸脱することなく今や当業者には浮かぶであろう。本明細書に記載される開示の実施形態の種々の代替物は本開示を実行する際に用いてもよいことは理解されるべきである。以下の特許請求の範囲が本開示の範囲を定義すること、およびこれらの特許請求の範囲およびその等価物の範囲内の方法および構造物はそれによって包含されることが意図されている。
【0375】
本発明のいくつかの実施形態
【0376】
特許請求の範囲の形式で提供される本発明のいくつかの実施形態が、以下に提供される。
1.二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析する方法であって、少なくとも2種の形態の各々が、複数の分子を含み、方法が、
(a)核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグ核酸と連結するステップと、
(b)その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップと、
(c)増幅された核酸の少なくとも一部にタグが付けられている増幅された核酸の配列データをアッセイするステップであって、アッセイするステップによって、増幅された核酸のタグ核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供する、ステップと
を含む、方法。
1A.増幅された核酸のタグ核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するステップをさらに含む、請求項1に記載の方法。
2.形態のうち少なくとも1種を、その他の形態のうち1種または複数に対して濃縮するステップをさらに含む、請求項1に記載の方法。
3.集団中の核酸の各形態の分子の少なくとも70%がステップ(b)において増幅される、請求項1に記載の方法。
4.少なくとも3種の形態の核酸が集団中に存在し、形態のうち少なくとも2種が、3種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている、請求項1に記載の方法。
5.集団中の少なくとも3種の形態の核酸の各々が、異なるタグに連結されている、請求項4に記載の方法。
6.同一形態の各分子が、同一の同定情報タグを含むタグに連結されている、請求項1に記載の方法。
7.同一形態の分子が、異なる種類のタグに連結されている、請求項1に記載の方法。
8.ステップ(a)が、集団を、タグが付けられたプライマーを用いる逆転写に付すステップを含み、タグが付けられたプライマーが、集団中のRNAから作製されたcDNA中に組み込まれる、請求項1に記載の方法。
9.逆転写が、配列特異的である、請求項8に記載の方法。
10.逆転写がランダムである、請求項8に記載の方法。
11.cDNAと二本鎖を形成しているRNAを分解するステップをさらに含む、請求項8に記載の方法。
12.一本鎖DNAを二本鎖DNAから分離するステップと、核酸タグを二本鎖DNAにライゲーションするステップとをさらに含む、請求項4に記載の方法。
13.一本鎖DNAが、1種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される、請求項12に記載の方法。
14.circligaseを用いて一本鎖DNAを環状化するステップと、核酸タグを二本鎖DNAにライゲーションするステップとをさらに含む、請求項4に記載の方法。
15.アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップを含む、請求項1に記載の方法。
16.核酸集団が、体液試料に由来する、前記の請求項のうちいずれかに記載の方法。
17.体液試料が、血液、血清または血漿である、請求項16に記載の方法。
18.核酸集団が、無細胞核酸集団である、請求項1に記載の方法。
19.体液試料が、がんを有すると疑われる対象に由来する、請求項17に記載の方法。
20.配列データが、体細胞または生殖系列変異の存在を示す、請求項1から19に記載の方法。
21.配列データが、コピー数変異の存在を示す、請求項1から20に記載の方法。
22.配列データが、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す、請求項1から21に記載の方法。
23.異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、
核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、
作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、
第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、
標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、
増幅された核酸および連結されたタグの配列データをアッセイするステップであって、アッセイするステップによって、タグを解読するための配列データを得て、配列データがアッセイされた核酸が、第1または第2のプール中の鋳型から増幅されたか否かを明らかにする、ステップと
を含む方法。
23A.タグを解読して、配列データがアッセイされた核酸が、第1または第2のプール中の鋳型から増幅されたか否かを明らかにするステップを含む、請求項23に記載の方法。
24.修飾が、核酸のタンパク質との結合である、請求項23に記載の方法。
25.タンパク質が、ヒストンまたは転写因子である、請求項23に記載の方法。
26.修飾が、ヌクレオチドへの複製後修飾である、請求項23に記載の方法。
27.複製後修飾が、5-メチル-シトシンであり、作用物質の核酸との結合の程度が、核酸中の5-メチル-シトシンの程度とともに増大する、請求項26に記載の方法。
28.複製後修飾が、5-ヒドロキシメチル-シトシンであり、作用物質の核酸との結合の程度が、核酸中の5-ヒドロキシメチル-シトシンの程度とともに増大する、請求項26に記載の方法。
29.複製後修飾が、5-ホルミル-シトシンまたは5-カルボキシル-シトシンであり、作用物質の結合の程度が、核酸中の5-ホルミル-シトシンまたは5-カルボキシル-シトシンの程度とともに増大する、請求項26に記載の方法。
30.作用物質と結合している核酸を洗浄するステップと、第1および第2のプールに対して中間の程度に複製後修飾を有する核酸を含む第3のプールとして洗浄物を回収するステップとをさらに含む、請求項23に記載の方法。
31.アッセイするステップの前に、第1および第2のプールからタグが付けられた核酸をプールするステップを含む、請求項23に記載の方法。
32.作用物質が、5-メチル結合ドメイン磁気ビーズである、請求項23に記載の方法。
33.核酸集団が、体液試料に由来する、前記の請求項のうちいずれかに記載の方法。
34.体液試料が、血液、血清または血漿である、請求項33に記載の方法。
35.核酸集団が、無細胞核酸集団である、請求項23に記載の方法。
36.体液試料が、がんを有すると疑われる対象に由来する、請求項33に記載の方法。
37.配列データが、体細胞または生殖系列変異の存在を示す、請求項23から36に記載の方法。
38.配列データが、コピー数変異の存在を示す、請求項23から37に記載の方法。
39.配列データが、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す、23から38のいずれかに記載の方法。
40.核酸の少なくとも一部が、1個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、
捕捉部分を、増幅の鋳型として役割を果たす集団中の核酸に連結するステップと、
増幅反応を実施して鋳型から増幅産物を産生するステップと、
捕捉タグに連結された鋳型を増幅産物から分離するステップと、
バイサルファイトシーケンシングによって捕捉タグに連結された鋳型の配列データをアッセイするステップと、
増幅産物の配列データをアッセイするステップと
を含む方法。
41.捕捉部分が、ビオチンを含む、請求項40に記載の方法。
42.分離するステップが、鋳型をストレプトアビジンビーズと接触させることによって実施される、請求項41に記載の方法。
43.修飾されたシトシン残基が、5-メチル-シトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシンまたは5-カルボキシルシトシンである、請求項40に記載の方法。
44.捕捉部分が、1個または複数の修飾された残基を含む核酸タグに連結されたビオチンを含む、請求項40に記載の方法。
45.捕捉部分が、切断可能な連結によって集団中の核酸に連結されている、請求項40に記載の方法。
46.切断可能な連結が、光切断可能な連結である、請求項45に記載の方法。
47.切断可能な連結が、ウラシルヌクレオチドを含む、請求項45に記載の方法。
48.核酸集団が、体液試料に由来する、前記の請求項のうちいずれかに記載の方法。
49.体液試料が、血液、血清または血漿である、請求項48に記載の方法。
50.核酸集団が、無細胞核酸集団である、請求項40に記載の方法。
51.体液試料が、がんを有すると疑われる対象に由来する、請求項48に記載の方法。
52.配列データが、体細胞または生殖系列変異の存在を示す、前記の請求項のうちいずれかに記載の方法。
53.配列データが、コピー数変異の存在を示す、前記の請求項のうちいずれかに記載の方法。
54.配列データが、単一ヌクレオチド変異(SNV)、挿入欠失または遺伝子融合の存在を示す、前記の請求項のうちいずれかに記載の方法。
55.異なる程度の5-メチル化を有する核酸を含む核酸集団を解析する方法であって、
(a)核酸集団を、5-メチル化核酸と優先的に結合する作用物質と接触させるステップと、
(b)作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、5-メチル化について過剰提示され、第2のプール中の核酸が、5-メチル化について提示不足である、ステップと、
(c)第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結するステップであって、第1のプール中の核酸に連結された核酸タグが、捕捉部分(例えば、ビオチン)を含む、ステップと、
(d)標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、
(e)捕捉部分を有する増幅された核酸を、捕捉部分を有さない増幅された核酸から分離するステップと、
(f)分離された、増幅された核酸の配列データをアッセイするステップと
を含む方法。
56.異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、
集団中の核酸を、アダプターと接触させて、プライマー結合部位を含むアダプターが隣接する核酸の集団を産生するステップと、
プライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、
増幅された核酸を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、
作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、
第1および第2のプール中のタグが付けられた核酸の並行増幅を実施するステップと、
第1および第2のプール中の増幅された核酸の配列データをアッセイするステップと
を含む方法。
57.核酸の少なくとも一部が、1個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、
核酸集団を、修飾されたシトシンを含むプライマー結合部位を含むアダプターと接触させて、アダプターが隣接する核酸を形成するステップと、
核酸に隣接するアダプター中のプライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、
増幅された核酸を第1および第2のアリコートに分けるステップと、
第1のアリコートの核酸について配列データをアッセイするステップと、
第2のアリコートの核酸を、未修飾CをUに変換するバイサルファイトと接触させるステップと、
核酸に隣接するプライマー結合部位からプライムされる、バイサルファイト処理に起因する核酸を増幅するステップであって、バイサルファイト処理によって導入されたUが、Tに変換される、ステップと、
第2のアリコートからの増幅された核酸について配列データをアッセイするステップと、
第1および第2のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定するステップと
を含む方法。
58.アダプターが、ヘアピンアダプターである、請求項56または57に記載の方法。
59.(a)ヒト試料からDNA分子を物理的に分画して、2種またはそれより多い分割物を作製するステップと、
(b)2種またはそれより多い分割物の各々に差次的分子タグおよびNGSを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、
(c)NGS機器で分子タグが付けられた分割物をアッセイして、試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するステップと
を含む方法。
60.試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するステップをさらに含む、請求項59に記載の方法。
61.DNA分子が、抽出された血漿に由来する、請求項59に記載の方法。
62.物理的に分画するステップが、分子をメチル化の種々の程度に基づいて分画することを含む、請求項59に記載の方法。
63.メチル化の種々の程度が、高メチル化および低メチル化を含む、請求項61に記載の方法。
64.物理的に分画するステップが、メチル結合ドメインタンパク質(「MBD」)-ビーズを用いて分画して、メチル化の種々の程度に層別化することを含む、請求項59に記載の方法。
65.差次的分子タグが、MBD分割物に対応する異なるセットの分子タグである、請求項59に記載の方法。
66.物理的分画が、免疫沈降を使用してDNA分子を分離することを含む、請求項59に記載の方法。
67.作製された分子タグが付けられた画分のうち2種またはそれより多い分子タグが付けられた画分を再度組み合わせるステップをさらに含む、請求項59に記載の方法。
68.再度組み合わされた、分子タグが付けられた画分または群を濃縮するステップをさらに含む、請求項66に記載の方法。
69.NGSによる、MBD-ビーズによって分画されたライブラリーの分子タグ同定のための方法であって、
(a)下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質-ビーズ精製キットを使用して抽出されたDNA試料を物理的に分画することと、
(b)各画分または群に差次的分子タグおよびNGSを可能にするアダプター配列を並行適用することと、
(c)すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的DNAプライマー配列を使用して続いて増幅することと、
(d)再度組み合わされ、増幅された総ライブラリーを、目的のゲノム領域を標的としながら濃縮/ハイブリダイゼーションすることと
(e)試料タグを付加しながら、濃縮された総DNAライブラリーを再度増幅することと、
(f)異なる試料をプールして、NGS機器で多重でそれらをアッセイすることと
を含み、機器によって生成されたNGS配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にMBD分割された分子への試料のデコンボリューションのための配列データを提供する、方法。
69A.独特の分子を同定するために使用されている分子タグと、同様に、差次的にMBD分割された分子への試料のデコンボリューションを用いて、NGSデータの解析を実施するステップを含む、請求項69に記載の方法。
70.(a)対象の身体試料から得られた核酸分子の集団を提供するステップと、
(b)1つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、
(c)1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
(d)複数の群の核酸分子をシーケンシングして、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性DNA-タンパク質相互作用についての相対情報を作成するのに十分なデータを含有する配列読み取りデータを作成するステップと
を含む方法。
70A.配列読み取りデータを解析して、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性DNA-タンパク質相互作用についての相対情報を作成するステップをさらに含む、請求項70に記載の方法。
71.(a)対象の身体試料から得られた核酸分子の集団を提供するステップと、
(b)メチル化状態に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、
(c)1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
(d)複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップとを含む方法であって、シーケンシング読み取りデータが、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するのに十分であり、1つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはDNA-タンパク質相互作用を示す、方法。
71A.配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するステップを含み、1つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはDNA-タンパク質相互作用を示す、請求項71に記載の方法。
72.対象の身体試料から得られた核酸分子の集団を提供するステップと、
(a)核酸分子の集団を分画して、タンパク質が結合している無細胞核酸を含む核酸分子の複数の群を作製するステップと、
(b)1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
(c)複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップと
を含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の1つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するのに十分であり、1つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはDNA-タンパク質相互作用を示す、方法。
72A.配列読み取りデータを、参照配列上の1つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するステップとをさらに含み、1つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはDNA-タンパク質相互作用を示す、請求項72に記載の方法。
73.対象の身体試料から得られた核酸分子の集団を提供するステップと、
(a)1つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、
(b)1つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
(c)複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップと
を含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の1つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するのに十分であり、1つまたは複数の特徴が、複数の群からの配列読み取りデータのプールにおいて検出可能ではない、方法。
73A.配列読み取りデータを参照配列上の1つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち1つにおいて1つまたは複数の特徴を検出するステップとをさらに含み、1つまたは複数の特徴が、複数の群からの配列読み取りデータのプールにおいて検出可能ではない、請求項73に記載の方法。
74.1つまたは複数の特徴が、マッピングされた読み取りデータの定量的特徴を含む、請求項70から72のいずれか一項に記載の方法。
75.分画が、物理的分画を含む、請求項69から73のいずれか一項に記載の方法。
76.メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始/停止位置からなる群から選択される1つまたは複数の特徴に基づいて、核酸分子の集団が分割される、請求項69または72に記載の方法。
77.(b)の核酸分子をプールするステップをさらに含む、請求項69から72のいずれか一項に記載の方法。
78.1つまたは複数の特徴がメチル化である、請求項69または72に記載の方法。
79.分画が、メチル結合ドメインを含むタンパク質を使用してメチル化核酸を、非メチル化核酸から分離して、種々の程度のメチル化を含む核酸分子の群を作製することを含む、請求項77に記載の方法。
80.群のうち1つが、高メチル化DNAを含む、請求項78に記載の方法。
81.少なくとも1つの群が、メチル化の程度によって特徴付けられる、請求項78に記載の方法。
82.分画が、一本鎖DNA分子および/または二本鎖DNA分子を分離することを含む、請求項72に記載の方法。
83.二本鎖DNA分子が、ヘアピンアダプターを使用して分離される、請求項81に記載の方法。
84.分画が、タンパク質が結合している核酸を単離することを含む、請求項69または72に記載の方法。
85.分画が、モノヌクレオソームプロファイルの相違に基づいて分画することを含む、請求項69から72のいずれか一項に記載の方法。
86.分画が、正常と比較した場合に、少なくとも1つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である、請求項69から72のいずれか一項に記載の方法。
87.単離することが、免疫沈降を含む、請求項85に記載の方法。
88.異なる特徴に基づいて少なくとも1つの群の核酸分子を分画するステップをさらに含む、請求項69から72のいずれか一項に記載の方法。
89.解析するステップが、1つまたは複数の遺伝子座で、第1の群の核酸分子に対応する第1の特徴を、第2の群の核酸分子に対応する第2の特徴と比較することを含む、請求項69から72のいずれか一項に記載の方法。
90.解析するステップが、1つまたは複数の遺伝子座で、正常試料に対して、群における1つまたは複数の特徴のうち1つの特徴を解析することを含む、請求項70から72のいずれか一項に記載の方法。
91.1つまたは複数の特徴が、参照配列上の塩基位置でのベースコール頻度、参照配列上の1つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有する分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される、請求項70から72のいずれか一項に記載の方法。
92.(f)1つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む、請求項70から72のいずれか一項に記載の方法。
93.訓練された分類子が、1つまたは複数の特徴を対象における組織と関連するとして分類する、請求項91に記載の方法。
94.訓練された分類子が、1つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する、請求項91に記載の方法。
95.1つまたは複数の特徴が、遺伝子発現または疾患の状態を示す、請求項70から72に記載の方法。
96.核酸分子が、循環腫瘍DNAである、請求項69から72のいずれか一項に記載の方法。
97.核酸分子が、無細胞DNA(「cfDNA」)である、請求項69から72のいずれか一項に記載の方法。
98.1つまたは複数の特徴が、がんマーカーである、請求項69から71のいずれか一項に記載の方法。
99.タグが、同一試料中の異なる分子を区別するために使用される、請求項69から72のいずれか一項に記載の方法。
100.(a)対象の身体試料から得られた核酸分子の集団を提供するステップと、
(b)1つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップであって、複数の群の各々の核酸分子が、別個の識別子を含む、ステップと、
(c)複数の群の核酸分子をプールするステップと、
(d)プールされた複数の群の核酸分子をシーケンシングして、複数のセット配列読み取りデータを作成するステップと、
(e)識別子に基づいて配列読み取りデータを分画するステップと
を含む方法。
101.差次的にタグが付けられた核酸分子を含む核酸分子のプールを含む組成物であって、プールが、以下からなる群から選択される:メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始/停止位置からなる群から選択される1つまたは複数の特徴に基づいて差次的にタグが付けられた複数のセットの核酸分子を含み、プールが、生体試料に由来する、組成物。
102.複数のセットが、2、3、4、5または5より多いのいずれかである、請求項101に記載の組成物。
103.(a)核酸分子の集団を、特徴が異なる核酸を含む複数の群に分画するステップと、
(b)複数の群の各々の中の核酸に、複数の群の各々の中の核酸を区別するタグのセットを用いてタグを付けて、タグが付けられた核酸の集団を産生するステップであって、タグが付けられた核酸の各々が、1つまたは複数のタグを含む、ステップと、
(c)タグが付けられた核酸の集団をシーケンシングして、配列読み取りデータを作成するステップであって、配列読み取りデータが、1つまたは複数のタグを使用して、各群の配列読み取りデータを群化することを可能にする、ステップと、配列読み取りデータを解析して、正常試料または分類子に対して群のうち少なくとも1つにおいてシグナルを検出するステップとを含む方法。
103A.1つまたは複数のタグを使用して、各群の配列読み取りデータを群化するステップと、
配列読み取りデータを解析して、正常試料または分類子に対して群のうち少なくとも1つにおいてシグナルを検出するステップと
をさらに含む、請求項103に記載の方法。
104.別の群または全ゲノム配列に対して、群のうち少なくとも1つにおけるシグナルを正規化するステップをさらに含む、請求項102に記載の方法。
105.i.生体試料から無細胞DNAの集団を提供するステップと、
ii.無細胞DNAの集団を、非がん性細胞と比較して、がん性に由来する無細胞DNAでは異なるレベルで存在する特徴に基づいて分画し、それによって、無細胞DNAの小集団を作製するステップと、
iii.無細胞DNAの小集団のうち少なくとも1つを増幅するステップと、
iv.無細胞DNAの増幅された小集団のうち少なくとも1つをシーケンシングするステップと
を含む方法。
106.特徴が、
i.無細胞DNAのメチル化レベル、
ii.無細胞DNAのグリコシル化レベル、
iii.無細胞DNA断片の長さ、または
iv.無細胞DNAにおける一本鎖切断の存在
である、請求項104に記載の方法。
107.i.生体試料から無細胞DNAの集団を提供するステップと、
ii.無細胞DNAの集団を、無細胞DNAのメチル化レベルに基づいて分画し、それによって、無細胞DNAの小集団を作製するステップと、
iii.無細胞DNAの小集団のうち少なくとも1つを増幅するステップと、
iv.無細胞DNAの増幅された小集団のうち少なくとも1つをシーケンシングするステップと
を含む方法。
108.無細胞DNAのメチル化状態を判定するための方法であって、
i.生体試料から無細胞DNAの集団を提供するステップと、
ii.無細胞DNAの集団を、無細胞DNAのメチル化レベルに基づいて分画し、それによって、無細胞DNAの小集団を作製するステップと、
iii.無細胞DNAの少なくとも1つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、
iv.対応する配列読み取りデータが生じる小集団に応じて、メチル化状態を各無細胞DNAに割り当てるステップと
を含む方法。
109.対象を分類する方法であって、
i.対象由来の生体試料から無細胞DNAの集団を提供するステップと、
ii.無細胞DNAの集団を、無細胞DNAのメチル化レベルに基づいて分画し、それによって、無細胞DNAの小集団を作製するステップと、
iii.無細胞DNAの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、
iv.どの小集団においてどの配列読み取りデータが生じるかに応じて、訓練された分類子を使用して、対象を分類するステップと
を含む方法。
110.無細胞DNAの断片化パターンを解析するための方法であって、
i.生体試料から無細胞DNAの集団を提供するステップと、
ii.無細胞DNAの集団を分画し、それによって、無細胞DNAの小集団を作製するステップと
iii.無細胞DNAの少なくとも1つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、
iv.配列読み取りデータを参照ゲノムに対してアラインするステップと、
v.以下:
a.参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、
b.配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、
c.参照ゲノム中の各塩基位置で開始する配列読み取りデータの数、または
d.参照ゲノム中の各塩基位置で終了する配列読み取りデータの数
のうち任意の数のものを解析することによって各小集団において無細胞DNAの断片化パターンを決定するステップと
を含む方法。
111.無細胞DNAの集団が、健常および罹患状態の間のシグナルの相違を提供する1つまたは複数の特徴によって分画される、請求項109に記載の方法。
112.1つまたは複数の特徴が、メチル化、ヒドロキシメチル化、ホルミル化、アセチル化およびグリコシル化からなる群から選択される化学修飾を含む、請求項110に記載の方法。
113.DNA:ビーズの比が、1:100である、前記の請求項のうちいずれか一項におけるような方法。
114.DNA:ビーズの比が、1:50である、前記の請求項のうちいずれか一項におけるような方法。
115.DNA:ビーズの比が、1:20である、前記の請求項のうちいずれか一項におけるような方法。
116.無細胞DNAの集団が、無細胞DNAのメチル化レベルに基づいて分画される、請求項109に記載の方法。
117.無細胞DNAの断片化パターンを決定するステップが、参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することをさらに含む、請求項109に記載の方法。
118.参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することによって各小集団において無細胞DNAの断片化パターンを決定するステップをさらに含む、請求項109に記載の方法。
119.遺伝子発現または疾患状態を判定するための循環腫瘍DNA(ctDNA)の解析の際の、DNAメチル化の程度に基づく物理的分画の使用。
120.ctDNAの解析の際にctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
121.ctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
122.シーケンシングおよび任意選択の下流解析に先立つ、ctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
123.差次的標識/タグ付けのために、ctDNAを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
124.ctDNAの解析の際の差次的断片化パターンに基づく分画の使用。
125.ctDNAを分割するための差次的断片化パターンの使用。
126.シーケンシングおよび任意選択の下流解析に先立つctDNAを分割するための差次的断片化パターンの使用。
127.差次的標識/タグ付けのために、ctDNAを分割するための差次的断片化パターンの使用。
128.差次的断片化パターンが、遺伝子発現または疾患状態を示す、請求項123から126に記載の使用。
129.差次的断片化パターンが、
(a)参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、
(b)配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、
(c)参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および
(d)参照ゲノム中の各塩基位置で終了する配列読み取りデータの数
からなる群から選択される正常に対する1つまたは複数の相違によって特徴付けられる、請求項123から126に記載の使用。
130.種々の程度のDNAメチル化に層別化し、次いで、次世代シーケンシング(NGS)によって定量化されるための、分子結合ドメイン(MBD)-ビーズによって分割されたDNA分子の差次的分子タグ付けの使用。
131.二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析する方法であって、少なくとも2種の形態の各々が、複数の分子を含み、方法が、
(a)核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグ核酸と連結するステップと、
(b)その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップと、
(c)タグに連結されている複数の増幅された核酸をシーケンシングするステップであって、配列データが、少なくとも1種のタグに連結する前に集団中の核酸の形態を明らかにする(real)ために解読されるのに十分であるステップと
を含む、方法。
132.タグが付けられた核酸分子のプールであって、プール中の各核酸分子が、複数のタグセットのうち1つから選択される分子タグを含み、各タグセットが、複数の異なるタグを含み、任意の1つのセット中のタグが、任意のその他のセット中のタグとは別個であり、各タグセットが、(i)付着される分子の特徴または分子が由来する親分子の特徴を示し、および(ii)単独で、または付着される分子からの情報と組み合わせて、付着される分子を、同一タグセットに由来するタグを用いてタグが付けられているその他の分子から独特に区別する情報を含有する、タグが付けられた核酸分子のプール。
133.分子タグが、1つまたは複数の核酸バーコードを含む、請求項132に記載のタグが付けられた核酸分子のプール。
134.分子タグが、分子の反対側の末端に付着された2つの核酸バーコードを含む、請求項133に記載のタグが付けられた核酸分子のプール。
135.セット中の任意の2つのバーコードの組合せが、任意のその他のセット中の任意の2つのバーコードの組合せとは異なる組み合わされた配列を有する、請求項134に記載のタグが付けられた核酸分子のプール。
136.バーコードが、10から30ヌクレオチドの間の長さである、請求項133に記載のタグが付けられた核酸分子のプール。
137.各タグセットが、タグセットによってタグが付けられ、同一の開始-停止座標を有するか、または同一ヌクレオチド配列を有するか、または同一ゲノム座標にマッピングされる分子に、独特にタグを付けるのに十分な複数の異なるタグを含む、請求項132に記載のタグが付けられた核酸分子のプール。
138.複数のタグセットが、2、3、4、5、6である、または6より多い、請求項132に記載のタグが付けられた核酸分子のプール。
139.1つのタグセットに由来するタグを用いてタグが付けられたDNA配列を有する分子と、別のタグセットに由来するタグを用いてタグが付けられたcDNA配列を有する分子とを含む、請求項132に記載のタグが付けられた核酸分子のプール。
140.タグセットによって示される分子の特徴が、DNA、RNA、一本鎖、二本鎖、メチル化、非メチル化、メチル化の程度または上記の組合せのうち1つまたは複数を含む、請求項132に記載のタグが付けられた核酸分子のプール。
141.核酸シーケンサーと、
少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
核酸シーケンサーおよびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、二本鎖DNA、一本鎖DNAおよび一本鎖RNAから選択される核酸のうち少なくとも2種の形態を含む核酸集団を解析するためのアプリケーションであって、少なくとも2種の形態の各々が複数の分子を含み、アプリケーションが、
データリンクを介して核酸シーケンサーから、少なくとも一部にタグが付けられている増幅された核酸の配列データを受け取るソフトウェアモジュールであって、配列データが、核酸の形態のうち少なくとも1種を、形態を互いに区別するために少なくとも1種のタグが付けられた核酸と連結するステップと、その少なくとも1種が少なくとも1種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも1種の形態から増幅されたものにタグが付けられている、ステップとによって作成される、ソフトウェアモジュールと
増幅された核酸のタグが付けられた核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供することによって、増幅された核酸の配列データをアッセイするソフトウェアモジュールと
を含む、アプリケーションを作製するために実行可能な命令をさらに含む、システム。
142.アプリケーションが、増幅された核酸のタグが付けられた核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するソフトウェアモジュールをさらに含む、請求項141に記載のシステム。
143.アプリケーションが、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む、請求項141に記載のシステム。
144.次世代シーケンシング(NGS)機器と、
少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、
データリンクを介してNGS機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、ヒト試料からDNA分子を物理的に分画して、2種またはそれより多い分割物を作製するステップと、2種またはそれより多い分割物の各々に差次的分子タグおよびNGSを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、NGS機器で分子タグが付けられた分割物をアッセイするステップとによって作成される、ソフトウェアモジュールと、
試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するためのソフトウェアモジュールと、
試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するためのソフトウェアモジュールと
を含むアプリケーションを作製するために実行可能な命令をさらに含む、システム。
145.アプリケーションが、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む、請求項144に記載のシステム。
146.次世代シーケンシング(NGS)機器と、
少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、MBD-ビーズによって分画されたライブラリーの分子タグ同定のためのアプリケーションであって、
データリンクを介してNGS機器から配列データを受け取るように構成されたソフトウェアモジールであって、配列データが、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質-ビーズ精製キットを使用して、抽出されたDNA試料を物理的に分画するステップと、各画分または群に差次的分子タグおよびNGSを可能にするアダプター配列の並行適用を実施するステップと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的DNAプライマー配列を使用して続いて増幅するステップと、目的のゲノム領域を標的としながら、再度組み合わされ、増幅された総ライブラリーの濃縮/ハイブリダイゼーションを実施するステップと、試料タグを付加しながら、濃縮された総DNAライブラリーを再度増幅するステップと、異なる試料をプールするステップと、NGS機器で多重でそれらをアッセイするステップとによって作成され、機器によって生成されたNGS配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にMBD分割された分子への試料のデコンボリューションのための配列データを提供する、ソフトウェアモジュールと、
独特の分子を同定するために分子タグを使用し、試料を、差次的にMBD分割された分子にデコンボリューションすることによって、配列データの解析を実施するように構成されたソフトウェアモジュールと
を含むアプリケーションを作製するために少なくとも1つのプロセッサーによって実行可能な命令をさらに含む、システム。
147.アプリケーションが、通信網を介して解析の結果を送信するように構成されたソフトウェアモジュールをさらに含む、請求項146に記載のシステム。
148.a)次世代シーケンシング(NGS)機器と、
b)少なくとも1つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
c)NGS機器およびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、
i)データリンクを介してNGS機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第1のプールの核酸を、作用物質と結合していない第2のプールの核酸から分離するステップであって、第1のプールの核酸が、修飾について過剰提示され、第2のプール中の核酸が、修飾について提示不足である、ステップと、第1のプールおよび/または第2のプール中の核酸を、第1のプールおよび第2のプール中の核酸を区別する1種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、NGS機器を用いて分子タグが付けられた分割物をアッセイするステップとによって調製された標識された核酸とともにロードされて作成される、ソフトウェアモジュールと、
ii)タグを解読するための配列データを作成するためのソフトウェアモジュールと、
iii)タグを解読して、配列データがアッセイされた核酸が、第1または第2のプール中の鋳型から増幅されたか否かを明らかにするために配列データを解析するためのソフトウェアモジュールと
を含むアプリケーションを作製するために実行可能な命令をさらに含む、システム。
149.通信網を介して(vai)アッセイの結果を送信するソフトウェアモジュールを
さらに含む、請求項148に記載のシステム。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
図19
図20
図21
図22
図23
図24
図25
図26A
図26B
図27A
図27B
図28AB
図28C
図29AB
図29C
図30
図31A
図31B
図32
図33
図34
【配列表】
2023089062000001.app
【外国語明細書】