特開2023-89062 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ガーダント　ヘルス，　インコーポレイテッドの特許一覧

特開2023-89062核酸分子を解析するための方法およびシステム

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26A
26B
27A
27B
28AB
28C
29AB
29C
30
31A
31B
32
33
34

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公開特許公報(A)

(11)【公開番号】P2023089062

(43)【公開日】2023-06-27

(54)【発明の名称】核酸分子を解析するための方法およびシステム

(51)【国際特許分類】

C12Q 1/6869 20180101AFI20230620BHJP

C12M 1/34 20060101ALI20230620BHJP

C12Q 1/6876 20180101ALI20230620BHJP

C12N 15/12 20060101ALI20230620BHJP

C40B 40/06 20060101ALI20230620BHJP

G16B 30/00 20190101ALI20230620BHJP

C12Q 1/6806 20180101ALN20230620BHJP

C12Q 1/686 20180101ALN20230620BHJP

C12Q 1/6816 20180101ALN20230620BHJP

C12N 15/10 20060101ALN20230620BHJP

【ＦＩ】

C12Q1/6869 Z

C12M1/34 Z

C12Q1/6876 Z

C12N15/12

C40B40/06

G16B30/00

C12Q1/6806 Z ZNA

C12Q1/686 Z

C12Q1/6816 Z

C12N15/10 100Z

【審査請求】有

【請求項の数】1

【出願形態】ＯＬ

【外国語出願】

(21)【出願番号】P 2023060942

(22)【出願日】2023-04-04

(62)【分割の表示】P 2019533331の分割

【原出願日】2017-12-22

(31)【優先権主張番号】62/438,240

(32)【優先日】2016-12-22

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/512,936

(32)【優先日】2017-05-31

(33)【優先権主張国・地域又は機関】US

(31)【優先権主張番号】62/550,540

(32)【優先日】2017-08-25

(33)【優先権主張国・地域又は機関】US

(71)【出願人】

【識別番号】515059083

【氏名又は名称】ガーダントヘルス，インコーポレイテッド

(74)【代理人】

【識別番号】100078282

【弁理士】

【氏名又は名称】山本秀策

(74)【代理人】

【識別番号】100113413

【弁理士】

【氏名又は名称】森下夏樹

(74)【代理人】

【識別番号】100181674

【弁理士】

【氏名又は名称】飯田貴敏

(74)【代理人】

【識別番号】100181641

【弁理士】

【氏名又は名称】石川大輔

(74)【代理人】

【識別番号】230113332

【弁護士】

【氏名又は名称】山本健策

(72)【発明者】

【氏名】アンドリューケネディ

(72)【発明者】

【氏名】ステファニーアンウォードモーティマー

(72)【発明者】

【氏名】ヘルミーエルトーキー

(72)【発明者】

【氏名】アミルアリタラサズ

(72)【発明者】

【氏名】ダイアナアブドゥエヴァ

(72)【発明者】

【氏名】マシューシュルツ

(57)【要約】

【課題】核酸分子を解析するための方法およびシステムの提供。
【解決手段】本開示は、異なる形態（例えば、ＲＮＡおよびＤＮＡ、一本鎖または二本鎖）および／または修飾（例えば、シトシンメチル化、タンパク質との会合）の程度を含有する核酸集団を処理するための方法を提供する。これらの方法は、複数の形態について配列情報を得ることができるように、試料中の核酸の複数の形態および／または修飾に適応する。方法はまた、配列の解析を、エピジェネティック解析と組み合わせることができるように、処理および解析を通じて複数の形態または修飾状態の同一性を保つ。
【選択図】なし

【特許請求の範囲】

【請求項1】

明細書に記載の発明。

【発明の詳細な説明】

【技術分野】

【0001】

【表1】

関連特許出願の参照
本願は、２０１６年１２月２２日に出願された米国仮特許出願第６２／４３８，２４０号、２０１７年５月３１日に出願された同第６２／５１２，９３６号、および２０１７年８月２５日に出願された同第６２／５５０，５４０号の優先日の利益を主張し、これらすべての全体が、参照によって本明細書中に組み込まれる。

【背景技術】

【0002】

がんは、世界中で疾患の主要な原因である。世界中で毎年、数千万人ががんと診断され、半数を超える人が最終的にそれによって死亡する。多くの国において、がんは、心血管疾患に次いで２番目に最も一般的な死因に位置付けられている。早期検出は、多数のがんについて転帰改善と関連している。

【0003】

がんは、個体の正常細胞内での遺伝的変異の蓄積によって引き起こされることがあり、そのうち少なくとも一部は、不適切に調節された細胞分裂をもたらす。このような変異は、一般に、コピー数変異（ＣＮＶ）、単一ヌクレオチド変異（ＳＮＶ）、遺伝子融合、挿入および／または欠失（挿入欠失）を含み、エピジェネティック変異は、シトシンの５－メチル化（５－メチルシトシン）ならびにＤＮＡのクロマチンおよび転写因子との会合を含む。

【0004】

がんは、腫瘍の生検と、それに続く細胞、マーカーまたは細胞から抽出されたＤＮＡの解析によって検出されることが多い。しかしより最近では、がんはまた、血液または尿などの体液中の無細胞核酸から検出できるということが提案されている。このような試験は、非侵襲的であり、生検において疑わしいがん細胞を同定することなく実施できる利点を有する。しかし、このような試験は、体液中の核酸の量が極めて少なく、どのような核酸が存在するのかが、形態（例えば、ＲＮＡおよびＤＮＡ、一本鎖および二本鎖ならびに複製後修飾の種々の状態ならびにヒストンなどのタンパク質との会合）において不均一であるという事実によって複雑にされる。

【0005】

プロセス中の循環核酸（元の材料）またはデータの喪失を低減しながら、液体生検アッセイの感度を増大することが望ましい。

【発明の概要】

【課題を解決するための手段】

【0006】

概要
本開示は、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析するための、方法、組成物およびシステムを提供する。いくつかの実施形態では、方法は、（ａ）核酸の形態のうち少なくとも１種を、形態を互いに区別するために少なくとも１種のタグ核酸と連結するステップと、（ｂ）その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが、存在する場合、増幅されて増幅された核酸を産生し、そのうち少なくとも１種の形態から増幅されたものにタグが付けられている、ステップと、（ｃ）その少なくとも一部にタグが付けられている増幅された核酸の配列データをアッセイするステップと、（ｄ）増幅された核酸のタグ核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するステップとを含む。

【0007】

いくつかの実施形態では、方法は、形態のうち少なくとも１種を、その他の形態のうち１種または複数に対して濃縮するステップをさらに含む。いくつかの実施形態では、集団中の核酸の各形態の分子の少なくとも７０％が、ステップ（ｂ）において増幅される。いくつかの実施形態では、少なくとも３種の形態の核酸が集団中に存在し、形態のうち少なくとも２種が、３種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている。いくつかの実施形態では、集団中の少なくとも３種の形態の核酸の各々が、異なるタグに連結されている。いくつかの実施形態では、同一形態の各分子が、同一の同定情報タグを含むタグ（例えば、同一配列を有する、または同一配列を含むタグ）に連結されている。いくつかの実施形態では、同一形態の分子が、異なる種類のタグに連結されている。いくつかの実施形態では、ステップ（ａ）は、集団を、タグが付けられたプライマーを用いる逆転写に付すステップを含み、タグが付けられたプライマーは、集団中のＲＮＡから作製されたｃＤＮＡ中に組み込まれる。いくつかの実施形態では、逆転写は、配列特異的である。いくつかの実施形態では、逆転写はランダムである。いくつかの実施形態では、方法は、ｃＤＮＡと二本鎖を形成しているＲＮＡを分解するステップをさらに含む。いくつかの実施形態では、方法は、一本鎖ＤＮＡを二本鎖ＤＮＡから分離するステップと、核酸タグを二本鎖ＤＮＡにライゲーションするステップとをさらに含む。いくつかの実施形態では、一本鎖ＤＮＡは、１種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される。いくつかの実施形態では、方法は、一本鎖核酸で機能するリガーゼを使用して一本鎖タグを用いて一本鎖ＤＮＡに差次的にタグを付け、二本鎖核酸で機能するリガーゼを使用して二本鎖アダプターを用いて二本鎖ＤＮＡに差次的にタグを付けるステップをさらに含む。いくつかの実施形態では、方法は、アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップをさらに含む。いくつかの実施形態では、方法は、個々のアッセイにおいて別個に分割されたＤＮＡのプールを解析するステップをさらに含む。アッセイは、同一、実質的に同様、同等または異なるものであり得る。

【0008】

上記の方法のいずれかでは、配列データは、体細胞もしくは生殖系列変異またはコピー数変異または単一ヌクレオチド変異または挿入欠失または遺伝子融合の存在を示し得る。

【0009】

本開示は、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法をさらに提供する。いくつかの例では、本開示は、疾患と関連する特徴（例えば、５’メチルシトシン）についてスクリーニングするための方法を提供する。方法は、核酸集団を、修飾を有する核酸と優先的に結合する作用物質（メチル結合ドメインまたはタンパク質など）と接触させるステップと、作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、タグが付けられた核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、増幅された核酸および連結されたタグの配列データをアッセイするステップと、タグを解読して、配列データがアッセイされた核酸が、第１または第２のプール中の鋳型から増幅されたか否かを明らかにするステップとを含む。

【0010】

いくつかの実施形態では、修飾は、核酸のタンパク質との結合である。いくつかの実施形態では、タンパク質は、ヒストンまたは転写因子である。いくつかの実施形態では、核酸修飾は、ヌクレオチドへの複製後修飾である。いくつかの実施形態では、複製後修飾は、５－メチルシトシンであり、捕捉作用物質の核酸との結合の程度は、核酸中の５－メチルシトシンの程度とともに増大する。いくつかの実施形態では、複製後修飾は、５－ヒドロキシメチルシトシンであり、作用物質の核酸との結合の程度は、核酸中の５－ヒドロキシメチルシトシンの程度とともに増大する。いくつかの実施形態では、複製後修飾は、５－ホルミルシトシンまたは５－カルボキシルシトシンであり、作用物質の結合の程度は、核酸中の５－ホルミルシトシンまたは５－カルボキシルシトシンの程度とともに増大する。いくつかの実施形態では、複製後修飾は、Ｎ^６－メチルアデニンである。いくつかの実施形態では、方法は、作用物質と結合している核酸を洗浄するステップと、第１および第２のプールに対して中間の程度に複製後修飾を有する核酸を含む第３のプールとして洗浄物を回収するステップとをさらに含む。いくつかの方法は、アッセイするステップの前に、第１および第２のプールからタグが付けられた核酸をプールするステップをさらに含む。いくつかの実施形態では、作用物質は、メチル結合ドメインまたはメチル－ＣｐＧ結合ドメイン（ＭＢＤ）を含む。ＭＢＤは、タンパク質、抗体または目的の修飾と特異的に結合可能な任意のその他の作用物質であり得る。好ましくは、ＭＢＤは、親和性分離ステップを実施するための磁気ビーズ、ストレプトアビジンまたはその他の結合ドメインをさらに含む。

【0011】

本開示は、核酸の少なくとも一部が、１個または複数の修飾されたシトシン残基を含む、核酸集団を解析するための方法をさらに提供する。方法は、捕捉部分、例えば、ビオチンを、増幅の鋳型として役割を果たす集団中の核酸に連結するステップと、増幅反応を実施して鋳型から増幅産物を産生するステップと、捕捉部分に連結された鋳型を増幅産物から分離するステップと、バイサルファイトシーケンシングによって捕捉部分に連結された鋳型の配列データをアッセイするステップと、増幅産物の配列データをアッセイするステップとを含む。

【0012】

いくつかの実施形態では、捕捉部分は、ビオチンを含む。いくつかの実施形態では、分離するステップは、鋳型をストレプトアビジンビーズと接触させることによって実施される。いくつかの実施形態では、修飾されたシトシン残基は、５－メチルシトシン、５－ヒドロキシメチルシトシン、５－ホルミルシトシンまたは５－カルボキシルシトシンである。いくつかの実施形態では、捕捉部分は、１個または複数の修飾された残基を含む核酸タグに連結されたビオチンを含む。いくつかの実施形態では、捕捉部分は、切断可能な連結によって集団中の核酸に連結されている。いくつかの実施形態では、切断可能な連結は、光切断可能な連結である。いくつかの実施形態では、切断可能な連結は、ウラシルヌクレオチドを含む。

【0013】

本開示は、異なる程度の５－メチルシトシンを有する核酸を含む核酸集団を解析する方法をさらに提供する。方法は、（ａ）核酸集団を、５－メチル化核酸と優先的に結合する作用物質と接触させるステップと、（ｂ）作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、５－メチルシトシンについて過剰提示され、第２のプール中の核酸が、５－メチル化について提示不足である、ステップと、（ｃ）第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結するステップであって、第１のプール中の核酸に連結された核酸タグが、捕捉部分（例えば、ビオチン）を含む、ステップと、（ｄ）標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、（ｅ）捕捉部分を有する増幅された核酸を、捕捉部分を有さない増幅された核酸から分離するステップと、（ｆ）分離された増幅された核酸の配列データをアッセイするステップとを含む。

【0014】

本開示は、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、集団中の核酸を、アダプターと接触させて、プライマー結合部位を含むアダプターが隣接する核酸の集団を産生するステップと、プライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、第１および第２のプール中の核酸の第２の増幅ステップを実施するステップと、第１および第２のプール中の増幅された核酸の配列データをアッセイするステップとを含む方法をさらに提供する。各プールの増幅は、異なる反応容器中で別個に起こり得る。プール特異的タグを使用することによって、続いて、アンプリコンをプールし、その後シーケンシングすることが可能になる。

【0015】

本開示は、核酸の少なくとも一部が、１個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、核酸集団を、少なくとも１個の修飾されたシトシンを含むプライマー結合部位を含むアダプターと接触させて、アダプターが隣接する核酸を形成するステップと、核酸に隣接するアダプター中のプライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を第１および第２のアリコートに分けるステップと、第１のアリコートの核酸について配列データをアッセイするステップと、第２のアリコートの核酸を、未修飾シトシン（Ｃ）をウラシル（Ｕ）に変換するバイサルファイトと接触させるステップと、核酸に隣接するプライマー結合部位からプライムされる、バイサルファイト処理に起因する核酸を増幅するステップであって、バイサルファイト処理によって導入されたＵが、Ｔに変換される、ステップと、第２のアリコートからの増幅された核酸について配列データをアッセイするステップと、第１および第２のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定するステップとを含む方法をさらに提供する。

【0016】

上記の方法のいずれかでは、核酸集団は、血液、血清または血漿などの体液試料由来であり得る。いくつかの実施形態では、核酸集団は、無細胞核酸集団である。いくつかの実施形態では、体液試料は、がんを有すると疑われる対象に由来する。

【0017】

一態様では、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析する方法であって、少なくとも２種の形態の各々が複数の分子を含み、方法が、核酸の形態のうち少なくとも１種を、形態を互いに区別するために少なくとも１種のタグ核酸と連結するステップと、その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも１種の形態から増幅されたものにタグが付けられている、ステップと、その少なくとも一部にタグが付けられている増幅された核酸の配列データをアッセイするステップであって、アッセイするステップによって、増幅された核酸のタグ核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供する、ステップとを含む、方法が、本明細書において提供される。一実施形態では、方法は、増幅された核酸のタグ核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するステップをさらに含む。別の実施形態では、方法は、形態のうち少なくとも１種を、その他の形態のうち１種または複数に対して濃縮するステップをさらに含む。別の実施形態では、集団中の核酸の各形態の分子の少なくとも７０％が増幅される。別の実施形態では、少なくとも３種の形態の核酸が集団中に存在し、少なくとも２種の形態が、３種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている。別の実施形態では、集団中の少なくとも３種の形態の核酸の各々が、異なるタグに連結されている。別の実施形態では、同一形態の各分子が、同一タグ情報を含むタグに連結されている。別の実施形態では、同一形態の分子が、異なる種類のタグに連結されている。別の実施形態では、方法は、集団を、タグが付けられたプライマーを用いる逆転写に付すステップをさらに含み、タグが付けられたプライマーは、集団中のＲＮＡから作製されたｃＤＮＡ中に組み込まれる。別の実施形態では、逆転写は、配列特異的である。別の実施形態では、逆転写はランダムである。別の実施形態では、方法は、ｃＤＮＡと二本鎖を形成しているＲＮＡを分解するステップをさらに含む。別の実施形態では、方法は、一本鎖ＤＮＡを二本鎖ＤＮＡから分離するステップと、核酸タグを二本鎖ＤＮＡにライゲーションするステップとをさらに含む。別の実施形態では、一本鎖ＤＮＡは、１種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される。別の実施形態では、方法は、ｃｉｒｃｌｉｇａｓｅを用いて一本鎖ＤＮＡを環状化するステップと、核酸タグを二本鎖ＤＮＡにライゲーションするステップとをさらに含む。別の実施形態では、方法は、アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップを含む。別の実施形態では、核酸集団は、体液試料に由来する。別の実施形態では、体液試料は、血液、血清または血漿である。別の実施形態では、核酸集団は、無細胞核酸集団である。別の実施形態では、体液試料は、がんを有すると疑われる対象に由来する。別の実施形態では、配列データは、体細胞または生殖系列変異の存在を示す。別の実施形態では、配列データは、コピー数変異の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す。

【0018】

別の態様では、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、増幅された核酸および連結されたタグの配列データをアッセイするステップであって、アッセイするステップによって、タグを解読するための配列データを得て、配列データがアッセイされた核酸が、第１または第２のプール中の鋳型から増幅されたか否かを明らかにする、ステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、タグを解読して、配列データがアッセイされた核酸が、第１または第２のプール中の鋳型から増幅されたか否かを明らかにするステップを含む。別の実施形態では、修飾は、核酸のタンパク質との結合である。別の実施形態では、タンパク質は、ヒストンまたは転写因子である。別の実施形態では、修飾は、ヌクレオチドへの複製後修飾である。別の実施形態では、複製後修飾は、５－メチル－シトシンであり、作用物質の核酸との結合の程度は、核酸中の５－メチル－シトシンの程度とともに増大する。別の実施形態では、複製後修飾は、５－ヒドロキシメチル－シトシンであり、作用物質の核酸との結合の程度は、核酸中の５－ヒドロキシメチル－シトシンの程度とともに増大する。別の実施形態では、複製後修飾は、５－ホルミル－シトシンまたは５－カルボキシル－シトシンであり、作用物質の結合の程度は、核酸中の５－ホルミル－シトシンまたは５－カルボキシル－シトシンの程度とともに増大する。別の実施形態では、方法は、作用物質と結合している核酸を洗浄するステップと、第１および第２のプールに対して中間の程度に複製後修飾を有する核酸を含む第３のプールとして洗浄物を回収するステップとをさらに含む。別の実施形態では、方法は、アッセイするステップの前に、第１および第２のプールからタグが付けられた核酸をプールするステップを含む。別の実施形態では、作用物質は、５－メチル結合ドメイン磁気ビーズである。別の実施形態では、核酸集団は、体液試料に由来する。別の実施形態では、体液試料は、血液、血清または血漿である。別の実施形態では、核酸集団は、無細胞核酸集団である。別の実施形態では、体液試料は、がんを有すると疑われる対象に由来する。別の実施形態では、配列データは、体細胞または生殖系列変異の存在を示す。別の実施形態では、配列データは、コピー数変異の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す。

【0019】

別の態様では、核酸の少なくとも一部が、１個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、捕捉部分を、増幅の鋳型として役割を果たす集団中の核酸と連結するステップと、増幅反応を実施して鋳型から増幅産物を産生するステップと、捕捉タグに連結された鋳型を増幅産物から分離するステップと、バイサルファイトシーケンシングによって捕捉タグに連結された鋳型の配列データをアッセイするステップと、増幅産物の配列データをアッセイするステップとを含む方法が、本明細書において提供される。一実施形態では、捕捉部分は、ビオチンを含む。別の実施形態では、分離するステップは、鋳型を、ストレプトアビジンビーズと接触させることによって実施される。別の実施形態では、修飾されたシトシン残基は、５－メチル－シトシン、５－ヒドロキシメチルシトシン、５－ホルミルシトシンまたは５－カルボキシルシトシンである。別の実施形態では、捕捉部分は、１個または複数の修飾された残基を含む核酸タグに連結されたビオチンを含む。別の実施形態では、捕捉部分は、切断可能な連結によって、集団中の核酸に連結されている。別の実施形態では、切断可能な連結は、光切断可能な連結である。別の実施形態では、切断可能な連結は、ウラシルヌクレオチドを含む。別の実施形態では、核酸集団は、体液試料に由来する。別の実施形態では、体液試料は、血液、血清または血漿である。別の実施形態では、核酸集団は、無細胞核酸集団である。別の実施形態では、体液試料は、がんを有すると疑われる対象に由来する。別の実施形態では、配列データは、体細胞または生殖系列変異の存在を示す。別の実施形態では、配列データは、コピー数変異の存在を示す。別の実施形態では、配列データは、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す。

【0020】

別の態様では、異なる程度の５－メチル化を有する核酸を含む核酸集団を解析する方法であって、核酸集団を、５－メチル化核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、５－メチル化について過剰提示され、第２のプール中の核酸が、５－メチル化について提示不足である、ステップと、第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結するステップであって、第１のプール中の核酸に連結された核酸タグが、捕捉部分（例えば、ビオチン）を含む、ステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、捕捉部分を有する増幅された核酸を、捕捉部分を有さない増幅された核酸から分離するステップと、分離された、増幅された核酸の配列データをアッセイするステップとを含む方法が、本明細書において提供される。

【0021】

別の態様では、異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、集団中の核酸を、アダプターと接触させて、プライマー結合部位を含むアダプターが隣接する核酸の集団を産生するステップと、プライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、第１および第２のプール中のタグが付けられた核酸の並行増幅を実施するステップと、第１および第２のプール中の増幅された核酸の配列データをアッセイするステップとを含む方法が、本明細書において提供される。別の実施形態では、アダプターは、ヘアピンアダプターである。

【0022】

別の態様では、核酸の少なくとも一部が、１個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、核酸集団を、修飾されたシトシンを含むプライマー結合部位を含むアダプターと接触させて、アダプターが隣接する核酸を形成するステップと、核酸に隣接するアダプター中のプライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、増幅された核酸を第１および第２のアリコートに分けるステップと、第１のアリコートの核酸について配列データをアッセイするステップと、第２のアリコートの核酸を、未修飾ＣをＵに変換するバイサルファイトと接触させるステップと、核酸に隣接するプライマー結合部位からプライムされる、バイサルファイト処理に起因する核酸を増幅するステップであって、バイサルファイト処理によって導入されたＵが、Ｔに変換される、ステップと、第２のアリコートからの増幅された核酸の配列データをアッセイするステップであって、第１および第２のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定するために使用できる配列データをもたらすステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、第１および第２のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定することを含む。別の実施形態では、アダプターは、ヘアピンアダプターである。

【0023】

別の態様では、ヒト試料からＤＮＡ分子を物理的に分画して、２種またはそれより多い分割物を作製するステップと、２種またはそれより多い分割物の各々に差次的分子タグおよびＮＧＳを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、ＮＧＳ機器で分子タグが付けられた分割物をアッセイして、試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するステップをさらに含む。別の実施形態では、ＤＮＡ分子は、抽出された血漿に由来する。別の実施形態では、物理的に分画するステップは、分子をメチル化の種々の程度に基づいて分画することを含む。別の実施形態では、メチル化の種々の程度は、高メチル化および低メチル化を含む。別の実施形態では、物理的に分画するステップは、メチル結合ドメインタンパク質（「ＭＢＤ」）－ビーズを用いて分画して、種々の程度のメチル化に層別化することを含む。別の実施形態では、差次的分子タグは、ＭＢＤ－分割物に対応する異なるセットの分子タグである。別の実施形態では、物理的分画は、免疫沈降を使用してＤＮＡ分子を分離することを含む。別の実施形態では、方法は、作製された分子タグが付けられた画分のうち２種またはそれより多い分子タグが付けられた画分を再度組み合わせるステップをさらに含む。別の実施形態では、方法は、再度組み合わされた、分子タグが付けられた画分または群を濃縮するステップをさらに含む。別の実施形態では、１つまたは複数の特徴は、メチル化である。別の実施形態では、分画は、メチル結合ドメインを含むタンパク質を使用してメチル化核酸を、非メチル化核酸から分離して、種々の程度のメチル化を含む核酸分子の群を作製することを含む。別の実施形態では、群のうち１つは、高メチル化ＤＮＡを含む。別の実施形態では、少なくとも１つの群は、メチル化の程度によって特徴付けられる。別の実施形態では、分画は、タンパク質が結合している核酸を単離することを含む。別の実施形態では、単離することは、免疫沈降を含む。

【0024】

別の態様では、ＮＧＳによるＭＢＤ－ビーズによって分画されたライブラリーの分子タグ同定のための方法であって、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質－ビーズ精製キットを使用して抽出されたＤＮＡ試料を物理的に分画することと、各画分または群に差次的分子タグおよびＮＧＳを可能にするアダプター配列を並行適用することと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的ＤＮＡプライマー配列を使用して続いて増幅することと、（ｄ）再度組み合わされ、増幅された総ライブラリーを、目的のゲノム領域を標的としながら濃縮／ハイブリダイゼーションすることと、試料タグを付加しながら、濃縮された総ＤＮＡライブラリーを再度増幅することと、異なる試料をプールして、ＮＧＳ機器で多重でそれらをアッセイすることとを含み、機器によって生成されたＮＧＳ配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にＭＢＤ分割された分子への試料のデコンボリューションのための配列データを提供する、方法が、本明細書において提供される。一実施形態では、方法は、独特の分子を同定するために使用されている分子タグと、同様に、差次的にＭＢＤ分割された分子への試料のデコンボリューションを用いて、ＮＧＳデータの解析を実施するステップを含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、核酸分子の集団は、メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始／停止位置からなる群から選択される１つまたは複数の特徴に基づいて分割される。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも１つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、方法は、異なる特徴に基づいて少なくとも１つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、１つまたは複数の遺伝子座で、第１の群の核酸分子に対応する第１の特徴を、第２の群の核酸分子に対応する第２の特徴と比較することを含む。別の実施形態では、核酸分子は、循環腫瘍ＤＮＡである。別の実施形態では、核酸分子は、無細胞ＤＮＡ（「ｃｆＤＮＡ」）である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。別の実施形態では、１つまたは複数の特徴は、がんマーカーである。

【0025】

別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、１つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性ＤＮＡ－タンパク質相互作用についての相対情報を作成するのに十分なデータを含有する配列読み取りデータを作成するステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、配列読み取りデータを解析して、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性ＤＮＡ－タンパク質相互作用についての相対情報を作成するステップをさらに含む。別の実施形態では、方法は、１つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、１つまたは複数の特徴は、マッピングされた読み取りデータの定量的特徴を含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも１つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、方法は、異なる特徴に基づいて、少なくとも１つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、１つまたは複数の遺伝子座で、第１の群の核酸分子に対応する第１の特徴を、第２の群の核酸分子に対応する第２の特徴と比較することを含む。別の実施形態では、解析するステップは、１つまたは複数の遺伝子座で、正常試料に対して、群における１つまたは複数の特徴のうち１つの特徴を解析することを含む。別の実施形態では、１つまたは複数の特徴は、参照配列上の塩基位置でのベースコール頻度、参照配列上の１つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有する分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される。別の実施形態では、方法は、１つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、訓練された分類子は、１つまたは複数の特徴を対象における組織と関連するとして分類する。別の実施形態では、訓練された分類子は、１つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する。別の実施形態では、１つまたは複数の特徴は、遺伝子発現または疾患の状態を示す。別の実施形態では、核酸分子は、循環腫瘍ＤＮＡである。別の実施形態では、核酸分子は、無細胞ＤＮＡ（「ｃｆＤＮＡ」）である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。別の実施形態では、１つまたは複数の特徴は、がんマーカーである。

【0026】

別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、メチル化状態に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するステップとを含む方法であって、１つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはＤＮＡ－タンパク質相互作用を示す、方法が、本明細書において提供される。別の実施形態では、方法は、１つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、１つまたは複数の特徴は、マッピングされた読み取りデータの定量的特徴を含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも１つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、方法は、異なる特徴に基づいて、少なくとも１つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、１つまたは複数の遺伝子座で、第１の群の核酸分子に対応する第１の特徴を、第２の群の核酸分子に対応する第２の特徴と比較することを含む。別の実施形態では、解析するステップは、１つまたは複数の遺伝子座で、正常試料に対して、群における１つまたは複数の特徴のうち１つの特徴を解析することを含む。別の実施形態では、１つまたは複数の特徴は、参照配列上の塩基位置でのベースコール頻度、参照配列上の１つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有す分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される。別の実施形態では、方法は、１つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、訓練された分類子は、１つまたは複数の特徴を対象における組織と関連するとして分類する。別の実施形態では、訓練された分類子は、１つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する。別の実施形態では、１つまたは複数の特徴は、遺伝子発現または疾患の状態を示す。別の実施形態では、核酸分子は、循環腫瘍ＤＮＡである。別の実施形態では、核酸分子は、無細胞ＤＮＡ（「ｃｆＤＮＡ」）である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。別の実施形態では、１つまたは複数の特徴は、がんマーカーである。

【0027】

別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、核酸分子の集団を分画して、タンパク質が結合している無細胞核酸を含む核酸分子の複数の群を作製するステップと、１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップとを含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の１つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するのに十分であり、１つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはＤＮＡ－タンパク質相互作用を示す、方法が、本明細書において提供される。一実施形態では、方法は、配列読み取りデータを、参照配列上の１つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するステップとをさらに含み、１つまたは複数の特徴は、ヌクレオソーム位置付け、ヌクレオソーム修飾またはＤＮＡ－タンパク質相互作用を示す。別の実施形態では、方法は、訓練された分類子を使用して、１つまたは複数の特徴に基づいて対象を分類するステップをさらに含む。別の実施形態では、１つまたは複数の特徴は、マッピングされた読み取りデータの定量的特徴を含む。別の実施形態では、分画は、物理的分画を含む。別の実施形態では、核酸分子の集団は、メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始／停止位置からなる群から選択される１つまたは複数の特徴に基づいて分割される。別の実施形態では、方法は、核酸分子をプールするステップをさらに含む。別の実施形態では、１つまたは複数の特徴は、メチル化である。別の実施形態では、分画は、メチル結合ドメインを含むタンパク質を使用してメチル化核酸を、非メチル化核酸から分離して、種々の程度のメチル化を含む核酸分子の群を作製することを含む。別の実施形態では、群の１つは、高メチル化ＤＮＡを含む。別の実施形態では、少なくとも１つの群は、メチル化の程度によって特徴付けられる。別の実施形態では、分画は、一本鎖ＤＮＡ分子および／または二本鎖ＤＮＡ分子を分離することを含む。別の実施形態では、二本鎖ＤＮＡ分子は、ヘアピンアダプターを使用して分離される。別の実施形態では、分画は、タンパク質が結合している核酸を単離することを含む。別の実施形態では、分画は、モノヌクレオソームプロファイルの相違に基づいて分画することを含む。別の実施形態では、分画は、正常と比較した場合に、少なくとも１つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である。別の実施形態では、単離することは、免疫沈降を含む。別の実施形態では、方法は、異なる特徴に基づいて、少なくとも１つの群の核酸分子を分画するステップをさらに含む。別の実施形態では、解析するステップは、１つまたは複数の遺伝子座で、第１の群の核酸分子に対応する第１の特徴を、第２の群の核酸分子に対応する第２の特徴と比較することを含む。別の実施形態では、解析するステップは、１つまたは複数の遺伝子座で、正常試料に対して、群における１つまたは複数の特徴のうち１つの特徴を解析することを含む。別の実施形態では、１つまたは複数の特徴は、参照配列上の塩基位置でのベースコール頻度、参照配列上の１つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有する分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される。別の実施形態では、方法は、１つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む。別の実施形態では、訓練された分類子は、１つまたは複数の特徴を対象における組織と関連するとして分類する。別の実施形態では、訓練された分類子は、１つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する。別の実施形態では、１つまたは複数の特徴は、遺伝子発現または疾患の状態を示す。別の実施形態では、核酸分子は、循環腫瘍ＤＮＡである。別の実施形態では、核酸分子は、無細胞ＤＮＡ（「ｃｆＤＮＡ」）である。別の実施形態では、タグは、同一試料中の異なる分子を区別するために使用される。

【0028】

別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、１つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップとを含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の１つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するのに十分であり、１つまたは複数の特徴が、複数の群からの配列読み取りデータのプールにおいて検出可能ではない、方法が、本明細書において提供される。一実施形態では、方法は、配列読み取りデータを、参照配列上の１つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するステップとをさらに含み、１つまたは複数の特徴は、複数の群からの配列読み取りデータのプールにおいて検出可能ではない。別の実施形態では、分画は、物理的分画を含む。

【0029】

別の態様では、対象の身体試料から得られた核酸分子の集団を提供するステップと、１つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップであって、複数の群の各々の核酸分子が、別個の識別子を含む、ステップと、複数の群の核酸分子をプールするステップと、プールされた複数の群の核酸分子をシーケンシングして、複数のセット配列読み取りデータを作成するステップと、識別子に基づいて配列読み取りデータを分画するステップとを含む方法が、本明細書において提供される。

【0030】

別の態様では、差次的にタグが付けられた核酸分子を含む核酸分子のプールを含む組成物が本明細書において提供され、プールは、メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始／停止位置からなる群から選択される：からなる群から選択される１つまたは複数の特徴に基づいて差次的にタグが付けられた複数のセットの核酸分子を含み、プールは、生体試料に由来する。一実施形態では、複数のセットは、２、３、４、５または５より多いのいずれかである。

【0031】

別の態様では、核酸分子の集団を、特徴が異なる核酸を含む複数の群に分画するステップと、複数の群の各々の中の核酸に、複数の群の各々の中の核酸を区別するタグのセットを用いてタグを付けて、タグが付けられた核酸の集団を産生するステップであって、タグが付けられた核酸の各々が、１つまたは複数のタグを含む、ステップと、タグが付けられた核酸の集団をシーケンシングして、配列読み取りデータを作成するステップと、１つまたは複数のタグを使用して、各群の配列読み取りデータを群化するステップと、配列読み取りデータを解析して、正常試料または分類子に対して群のうち少なくとも１つにおいてシグナルを検出するステップとを含む方法が、本明細書において提供される。一実施形態では、方法は、別の群または全ゲノム配列に対して、群のうち少なくとも１つにおいてシグナルを正規化するステップをさらに含む。

【0032】

別の態様では、生体試料から無細胞ＤＮＡの集団を提供するステップと、無細胞ＤＮＡの集団を、非がん性細胞と比較して、がん性に由来する無細胞ＤＮＡでは異なるレベルで存在する特徴に基づいて分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、無細胞ＤＮＡの小集団のうち少なくとも１つを増幅するステップと、無細胞ＤＮＡの増幅された小集団のうち少なくとも１つをシーケンシングするステップとを含む方法が、本明細書において提供される。一実施形態では、特徴は、無細胞ＤＮＡのメチル化レベル、無細胞ＤＮＡのグリコシル化レベル、無細胞ＤＮＡ断片の長さまたは無細胞ＤＮＡにおける一本鎖切断の存在である。

【0033】

別の態様では、生体試料から無細胞ＤＮＡの集団を提供するステップと、無細胞ＤＮＡのメチル化レベルに基づいて無細胞ＤＮＡの集団を分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、無細胞ＤＮＡの小集団のうち少なくとも１つを増幅するステップと、無細胞ＤＮＡの増幅された小集団のうち少なくとも１つをシーケンシングするステップとを含む方法が、本明細書において提供される。

【0034】

別の態様では、無細胞ＤＮＡのメチル化状態を判定するための方法であって、生体試料から無細胞ＤＮＡの集団を提供するステップと、無細胞ＤＮＡの集団を、無細胞ＤＮＡのメチル化レベルに基づいて分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、無細胞ＤＮＡの少なくとも１つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、対応する配列読み取りデータが生じる小集団に応じて、メチル化状態を各無細胞ＤＮＡに割り当てるステップとを含む方法が、本明細書において提供される。

【0035】

別の態様では、対象を分類する方法であって、対象由来の生体試料から無細胞ＤＮＡの集団を提供するステップと、無細胞ＤＮＡの集団を、無細胞ＤＮＡのメチル化レベルに基づいて分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、無細胞ＤＮＡの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、どの小集団においてどの配列読み取りデータが生じるかに応じて、訓練された分類子を使用して対象を分類するステップとを含む方法が、本明細書において提供される。別の実施形態では、無細胞ＤＮＡの集団は、健常および罹患状態の間にシグナルの相違を提供する１つまたは複数の特徴によって分画される。別の実施形態では、無細胞ＤＮＡの集団は、無細胞ＤＮＡのメチル化レベルに基づいて分画される。別の実施形態では、無細胞ＤＮＡの断片化パターンを決定するステップは、参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することをさらに含む。別の実施形態では、方法は、参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することによって、各小集団において無細胞ＤＮＡの断片化パターンを決定するステップをさらに含む。

【0036】

別の態様では、無細胞ＤＮＡの断片化パターンを解析するための方法であって、生体試料から無細胞ＤＮＡの集団を提供するステップと、無細胞ＤＮＡの集団を分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、無細胞ＤＮＡの少なくとも１つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、配列読み取りデータを参照ゲノムに対してアラインするステップと、以下：参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数または参照ゲノム中の各塩基位置で終了する配列読み取りデータの数のうち任意の数のものを解析することによって各小集団において無細胞ＤＮＡの断片化パターンを決定するステップとを含む方法が、本明細書において提供される。別の実施形態では、１つまたは複数の特徴は、メチル化、ヒドロキシメチル化、ホルミル化、アセチル化およびグリコシル化からなる群から選択される化学修飾を含む。

【0037】

本明細書において記載される方法のいずれかでは、ＤＮＡ：ビーズの比は、１：１００である。

【0038】

本明細書において記載される方法のいずれかでは、ＤＮＡ：ビーズの比は、１：５０である。

【0039】

本明細書において記載される方法のいずれかでは、ＤＮＡ：ビーズの比は、１：２０である。

【0040】

一態様では、遺伝子発現または疾患状態を判定するための循環腫瘍ＤＮＡ（ｃｔＤＮＡ）の解析の際の、ＤＮＡメチル化の程度に基づく物理的分画の使用が、本明細書において提供される。

【0041】

一態様では、ｃｔＤＮＡの解析の際にｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。

【0042】

一態様では、ｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。

【0043】

一態様では、シーケンシングおよび任意選択の下流解析に先立つ、ｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。

【0044】

一態様では、差次的標識／タグ付けのために、ｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する１つまたは複数の相違によって特徴付けられる

【0045】

一態様では、ｃｔＤＮＡの解析の際の差次的断片化パターンに基づく分画の使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する１つまたは複数の相違によって特徴付けられる

【0046】

一態様では、ｃｔＤＮＡを分割するための差次的断片化パターンの使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する１つまたは複数の相違によって特徴付けられる

【0047】

一態様では、シーケンシングおよび任意選択の下流解析に先立つ、ｃｔＤＮＡを分割するための差次的断片化パターンの使用が、本明細書において提供される。一実施形態では、差次的断片化パターンは、遺伝子発現または疾患状態を示す。別の実施形態では、差次的断片化パターンは、参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および参照ゲノム中の各塩基位置で終了する配列読み取りデータの数からなる群から選択される、正常に対する１つまたは複数の相違によって特徴付けられる

【0048】

一態様では、差次的標識／タグ付けのために、ｃｔＤＮＡを分割するための差次的断片化パターンの使用が、本明細書において提供される。

【0049】

一態様では、種々の程度のＤＮＡメチル化へ層別化し、次いで、次世代シーケンシング（ＮＧＳ）によって定量化されるための、分子結合ドメイン（ＭＢＤ）－ビーズによって分割されたＤＮＡ分子の差次的分子タグ付けの使用が、本明細書において提供される。

【0050】

【0051】

別の態様では、タグが付けられた核酸分子のプールであって、プール中の各核酸分子が、複数のタグセットのうち１つから選択される分子タグを含み、各タグセットが、複数の異なるタグを含み、任意の１つのセット中のタグが、任意のその他のセット中のタグとは別個であり、各タグセットが、（ｉ）付着される分子の特徴または分子が由来する親分子の特徴を示し、および（ｉｉ）単独で、または付着される分子からの情報と組み合わせて、付着される分子を、同一タグセットに由来するタグを用いてタグが付けられているその他の分子から独特に区別する情報を含有する、タグが付けられた核酸分子のプールが、本明細書において提供される。一実施形態では、分子タグは、分子の反対側の末端に付着された２つの核酸バーコードを含む。別の実施形態では、バーコードは、１０から３０ヌクレオチドの間の長さである。

【0052】

別の態様では、核酸シーケンサーと；少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと；核酸シーケンサーおよびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析するためのアプリケーションであって、少なくとも２種の形態の各々が複数の分子を含み、アプリケーションが、データリンクを介して核酸シーケンサーから、少なくとも一部にタグが付けられている増幅された核酸の配列データを受け取るソフトウェアモジュールであって、配列データが、核酸の形態のうち少なくとも１種を、形態を互いに区別するために少なくとも１種のタグが付けられた核酸と連結するステップと、その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも１種の形態から増幅されたものにタグが付けられている、ステップとによって作成される、ソフトウェアモジュールと；増幅された核酸のタグが付けられた核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供することによって、増幅された核酸の配列データをアッセイするソフトウェアモジュールとを含む、アプリケーションを作製するために実行可能な命令をさらに含む、システムが、本明細書において提供される。一実施形態では、アプリケーションは、増幅された核酸のタグが付けられた核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するソフトウェアモジュールをさらに含む。別の実施形態では、アプリケーションは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。

【0053】

別の態様では、次世代シーケンシング（ＮＧＳ）機器と；少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと；ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、データリンクを介してＮＧＳ機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、ヒト試料からＤＮＡ分子を物理的に分画して、２種またはそれより多い分割物を作製するステップと、２種またはそれより多い分割物の各々に差次的分子タグおよびＮＧＳを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、ＮＧＳ機器で分子タグが付けられた分割物をアッセイするステップによって作成される、ソフトウェアモジュールと；試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するためのソフトウェアモジュールと；試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するためのソフトウェアモジュールとを含むアプリケーションを作製するために実行可能な命令をさらに含む、システムが、本明細書において提供される。一実施形態では、アプリケーションは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。

【0054】

別の態様では、次世代シーケンシング（ＮＧＳ）機器と；少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと；ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、ＭＢＤ－ビーズによって分画されたライブラリーの分子タグ同定のためのアプリケーションであって、データリンクを介してＮＧＳ機器から配列データを受け取るように構成されたソフトウェアモジュールであって、配列データが、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質－ビーズ精製キットを使用して、抽出されたＤＮＡ試料を物理的に分画するステップと、各画分または群に差次的分子タグおよびＮＧＳを可能にするアダプター配列の並行適用を実施するステップと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的ＤＮＡプライマー配列を使用して続いて増幅するステップと、目的のゲノム領域を標的としながら、再度組み合わされ、増幅された総ライブラリーの濃縮／ハイブリダイゼーションを実施するステップと、試料タグを付加しながら、濃縮された総ＤＮＡライブラリーを再度増幅するステップと、異なる試料をプールするステップと、ＮＧＳ機器で多重でそれらをアッセイするステップとによって作成され、機器によって生成されたＮＧＳ配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にＭＢＤ分割された分子への試料のデコンボリューションのための配列データを提供する、ソフトウェアモジュールと；独特の分子を同定するために分子タグを使用し、試料を、差次的にＭＢＤ分割された分子にデコンボリューションすることによって、配列データの解析を実施するように構成されたソフトウェアモジュールとを含むアプリケーションを作製するために少なくとも１つのプロセッサーによって実行可能な命令をさらに含む、システムが、本明細書において提供される。一実施形態では、アプリケーションは、通信網を介して解析の結果を送信するように構成されたソフトウェアモジュールをさらに含む。

【0055】

上記で提供される概要は、実施形態の例示的リストであり、実施形態の完全なリストであるようには意図されない。

【0056】

参照による援用
本明細書において言及されるすべての刊行物、特許および特許出願は、各個々の刊行物、特許または特許出願が、参照により組み込まれると具体的に、個別に示されるかのように同程度に参照により本明細書に組み込まれる。
特定の実施形態では、例えば以下の項目が提供される。
（項目１）
二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析する方法であって、前記少なくとも２種の形態の各々が、複数の分子を含み、前記方法が、
（ａ）核酸の前記形態のうち少なくとも１種を、前記形態を互いに区別するために少なくとも１種のタグ核酸と連結するステップと、
（ｂ）その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の前記形態を増幅するステップであって、前記核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち前記少なくとも１種の形態から増幅されたものにタグが付けられている、ステップと、
（ｃ）その少なくとも一部にタグが付けられている前記増幅された核酸の配列データをアッセイするステップであって、前記アッセイするステップによって、前記増幅された核酸の前記タグ核酸分子を解読するのに十分な配列情報を得て、前記集団中の核酸の前記形態を明らかにし、配列データがアッセイされた前記タグ核酸分子に連結された前記増幅された核酸の元の鋳型を提供する、ステップと
を含む、方法。
（項目２）
前記増幅された核酸の前記タグ核酸分子を解読して、前記集団中の核酸の前記形態を明らかにし、配列データがアッセイされた前記タグ核酸分子に連結された前記増幅された核酸の元の鋳型を提供するステップをさらに含む、項目１に記載の方法。
（項目３）
前記形態のうち少なくとも１種を、その他の形態のうち１種または複数に対して濃縮するステップをさらに含む、項目１または２に記載の方法。
（項目４）
前記集団中の核酸の各形態の前記分子の少なくとも７０％がステップ（ｂ）において増幅される、項目１または２に記載の方法。
（項目５）
少なくとも３種の形態の核酸が前記集団中に存在し、前記形態のうち少なくとも２種が、前記３種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている、項目１または２に記載の方法。
（項目６）
前記集団中の前記少なくとも３種の形態の核酸の各々が、異なるタグに連結されている、項目５に記載の方法。
（項目７）
同一形態の各分子が、同一の同定タグを含むタグに連結されている、項目１または２に記載の方法。
（項目８）
同一形態の分子が、異なる種類のタグに連結されている、項目１または２に記載の方法。
（項目９）
ステップ（ａ）が、前記集団を、タグが付けられたプライマーを用いる逆転写に付すステップを含み、前記タグが付けられたプライマーが、前記集団中のＲＮＡから作製されたｃＤＮＡ中に組み込まれる、項目１または２に記載の方法。
（項目１０）
前記逆転写が、配列特異的である、項目９に記載の方法。
（項目１１）
前記逆転写がランダムである、項目９に記載の方法。
（項目１２）
前記ｃＤＮＡと二本鎖を形成しているＲＮＡを分解するステップをさらに含む、項目９に記載の方法。
（項目１３）
一本鎖ＤＮＡを二本鎖ＤＮＡから分離するステップと、核酸タグを前記二本鎖ＤＮＡにライゲーションするステップとをさらに含む、項目５に記載の方法。
（項目１４）
前記一本鎖ＤＮＡが、１種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される、項目１３に記載の方法。
（項目１５）
ｃｉｒｃｌｉｇａｓｅを用いて一本鎖ＤＮＡを環状化するステップと、核酸タグを前記二本鎖ＤＮＡにライゲーションするステップとをさらに含む、項目５に記載の方法。
（項目１６）
アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップを含む、項目１に記載の方法。
（項目１７）
前記核酸集団が、体液試料に由来する、項目１から１６に記載の方法。
（項目１８）
前記体液試料が、血液、血清または血漿である、項目１７に記載の方法。
（項目１９）
前記核酸集団が、無細胞核酸集団である、項目１または２に記載の方法。
（項目２０）
前記体液試料が、がんを有すると疑われる対象に由来する、項目１８に記載の方法。
（項目２１）
前記配列データが、体細胞または生殖系列変異の存在を示す、項目１から２０に記載の方法。
（項目２２）
前記配列データが、コピー数変異の存在を示す、項目１から２１に記載の方法。
（項目２３）
前記配列データが、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す、項目１から２２に記載の方法。
（項目２４）
異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、
前記核酸集団を、前記修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、
前記作用物質と結合している第１のプールの核酸を、前記作用物質と結合していない第２のプールの核酸から分離するステップであって、前記第１のプールの核酸が、前記修飾について過剰提示され、前記第２のプール中の前記核酸が、前記修飾について提示不足である、ステップと、
前記第１のプールおよび／または第２のプール中の前記核酸を、前記第１のプールおよび前記第２のプール中の前記核酸を区別する１種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、
標識された核酸を増幅するステップであって、前記核酸および連結されたタグが増幅される、ステップと、
増幅された核酸および連結されたタグの配列データをアッセイするステップであって、前記アッセイするステップによって、前記タグを解読するための配列データを得て、配列データがアッセイされた前記核酸が、前記第１または前記第２のプール中の鋳型から増幅されたか否かを明らかにする、ステップと
を含む方法。
（項目２５）
前記タグを解読して、配列データがアッセイされた前記核酸が、前記第１または前記第２のプール中の鋳型から増幅されたか否かを明らかにするステップを含む、項目２４に記載の方法。
（項目２６）
前記修飾が、核酸のタンパク質との結合である、項目２５または２６に記載の方法。
（項目２７）
前記タンパク質が、ヒストンまたは転写因子である、項目２５または２６に記載の方法。
（項目２８）
前記修飾が、ヌクレオチドへの複製後修飾である、項目２５または２６に記載の方法。
（項目２９）
前記複製後修飾が、５－メチル－シトシンであり、前記作用物質の核酸との結合の程度が、前記核酸中の５－メチル－シトシンの程度とともに増大する、項目２７に記載の方法。
（項目３０）
前記複製後修飾が、５－ヒドロキシメチル－シトシンであり、前記作用物質の核酸との結合の程度が、前記核酸中の５－ヒドロキシメチル－シトシンの程度とともに増大する、項目２７に記載の方法。
（項目３１）
前記複製後修飾が、５－ホルミル－シトシンまたは５－カルボキシル－シトシンであり、前記作用物質の結合の程度が、前記核酸中の５－ホルミル－シトシンまたは５－カルボキシル－シトシンの程度とともに増大する、項目２７に記載の方法。
（項目３２）
前記作用物質と結合している核酸を洗浄するステップと、前記第１および第２のプールに対して中間の程度に複製後修飾を有する核酸を含む第３のプールとして洗浄物を回収するステップとをさらに含む、項目２５または２６に記載の方法。
（項目３３）
アッセイするステップの前に、前記第１および第２のプールからタグが付けられた核酸をプールするステップを含む、項目２５または２６に記載の方法。
（項目３４）
前記作用物質が、５－メチル結合ドメイン磁気ビーズである、項目２５または２６に記載の方法。
（項目３５）
前記核酸集団が、体液試料に由来する、項目２４から３４に記載の方法。
（項目３６）
前記体液試料が、血液、血清または血漿である、項目３５に記載の方法。
（項目３７）
前記核酸集団が、無細胞核酸集団である、項目２５または２６に記載の方法。
（項目３８）
前記体液試料が、がんを有すると疑われる対象に由来する、項目３５に記載の方法。
（項目３９）
前記配列データが、体細胞または生殖系列変異の存在を示す、項目２５から３８に記載の方法。
（項目４０）
前記配列データが、コピー数変異の存在を示す、項目２５から３９に記載の方法。
（項目４１）
項目２５から３９のいずれかに記載の方法であって、前記配列データが、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示し、
ｉｖ）核酸であって、前記核酸および前記連結されたタグが増幅され、ＮＧＳ機器を用いて分子タグが付けられた分割物をアッセイする、核酸と、
ｖ）前記タグを解読するための配列データを作成するためのソフトウェアモジュールと、
ｖｉ）前記タグを解読して、配列データがアッセイされた前記核酸が、前記第１または前記第２のプール中の鋳型から増幅されたか否かを明らかにするために前記配列データを解析するためのソフトウェアモジュールと。

【図面の簡単な説明】

【0057】

【図1】図１は、ＲＮＡ、一本鎖ＤＮＡおよび二本鎖ＤＮＡを分割するための例示的概略図を示している。

【0058】

【図2】図２は、ＲＮＡ、一本鎖ＤＮＡおよび二本鎖ＤＮＡを分割するためのさらなる例示的概略図を示している。

【0059】

【図3】図３は、異なる程度の５－メチルシトシン表示を含有するＤＮＡを分析するための概略図を示している。

【0060】

【図4】図４は、メチル化ＤＮＡのバイサルファイトシーケンシングのための概略図を示している。

【0061】

【図5】図５は、異なる程度の５－メチルシトシン表示を含有するＤＮＡを分析するためのさらなる概略図を示している。

【0062】

【図6】図６は、メチル化ＤＮＡのバイサルファイトシーケンシングのためのさらなる概略図を示している。

【0063】

【図7】図７は、差次的タグ付けの概要を示している。

【0064】

【図8】図８は、分割法の概要を示している。

【0065】

【図9】図９は、方法論の概要を示している。

【0066】

【図10】図１０は、分画された核酸分子に関するフラグメントーム（fragmentomic）データ解析を使用する例を示している。ゲノムの位置はＸ軸で、断片長はＹ軸でおよびカバー度またはコピーはＺ軸で示され、上昇した低または高メチル化の対応する領域が指示されている。

【0067】

【図11】図１１は、正常なおよび肺がん試料のメチル化プロファイリングを示している。

【0068】

【図12】図１２Ａ、図１２Ｂ、および図１２Ｃは、全ゲノムシーケンシングを使用するメチル化プロファイリングを示している。図１２Ａは、Ｘ軸で転写開始部位（ＴＳＳ）における６００ｂｐ領域に沿った位置、そしてＹ軸に沿って高メチル化部位の出現頻度を示している。図１２Ｂは、Ｘ軸で転写開始部位（ＴＳＳ）における６００ｂｐ領域に沿った位置およびＹ軸に沿って低メチル化部位の出現頻度を示している。図１２Ｃは、Ｘ軸でパーセント高メチル化およびＹ軸で断片長を示している。

【0069】

【図13】図１３Ａおよび図１３Ｂは、ＭＯＢ３ＡおよびＷＤＲ８８のメチル化プロファイリングを示している。図１３Ａは、Ｘ軸でＭＯＢ３Ａ遺伝子のゲノム位置を示しており、異なる分画群由来の核酸分子の断片長は別の列により示されている。分画群は、高メチル化、低メチル化、低メチル化と混ざり合った高メチル化（高＋低）および比較のための非分画群（ＭＢＤなし）を含んでいた。

【0070】

【図14】図１４Ａおよび図１４Ｂは、分画および非分画群のメチル化プロファイリングを示している。図１４Ａは、Ｘ軸およびＹ軸にそれぞれ非分画群（ＭＢＤなし）からのおよび分画後の混合分割物からのカバー度を用いたヒートマップを示している。

【0071】

【図15】図１５は、分画および非分画試料についてのヌクレオソーム組織を示している。

【0072】

【図16】図１６は、ＭＢＤシグナルの検証を示している。

【0073】

【図17】図１７は、ゲノム領域により推定的に調節されるすべての遺伝子のＴＳＳに入力されたゲノム領域を関連付けることについての統計を示している。Ｘ軸はＴＳＳまでの距離をキロ塩基（ｋｂ）で示し、Ｙ軸は領域と遺伝子の関連をパーセント（％）で示している。グラフにおけるそれぞれのバーの上には計数されている項目の絶対数が挙げられている。黒色バーで表されているフォアグラウンドゲノム領域は、白色バーで示されているバックグラウンドゲノム領域の上位セットから選択された。バックグラウンドゲノム領域は、ゲノム中のすべての反復エレメントから選択される機能的役割に利用されている反復エレメントであった。

【0074】

【図18】図１８Ａおよび図１８Ｂは、ＡＰ３Ｄ１遺伝子のメチル化プロファイリングを示している。図１８Ａは、Ｘ軸でＡＰ３Ｄ１遺伝子のゲノム位置を示しており、異なる群由来の核酸分子についての読み取りデータのカバー度は別々の列により示されている。群は、高メチル化、低メチル化などの分画群、および比較のための非分画群（ＭＢＤなし）を含む。ＴＳＳはヒートマップの中央に垂直線として示されており、矢印は転写の方向を示している。図１８Ｂは、Ｘ軸でパーセント高メチル化、Ｙ軸で断片長を示している。例えば、図１８Ｂでは、非分画核酸試料でのパーセントメチル化は、赤色点線で示されるように約６５％であることが可能である。

【0075】

【図19】図１９Ａおよび図１９Ｂは、ＤＮＭＴ１遺伝子のメチル化プロファイリングを示している。図１９Ａは、Ｘ軸でＤＮＭＴ１遺伝子のゲノム位置を示しており、異なる群由来の核酸分子についての読み取りデータのカバー度は別々の列により示されている。群は、高メチル化、低メチル化などの分画群、および比較のための非分画群（ＭＢＤなし）を含んだ。ＴＳＳはヒートマップの中央に垂直線として示されており、矢印は転写の方向を示している。図１９Ｂは、Ｘ軸でパーセント高メチル化、Ｙ軸で断片長を示している。

【0076】

【図20】図２０は、核酸分子の鎖の状態に基づく分画のための手順を示している。

【0077】

【図21】図２１は、核酸分子のｓｓＤＮＡおよびｄｓＤＮＡへの分画を示している。Ｘ軸は、変動する入力ＤＮＡ（２００ｎｇおよび５００ｎｇ）を有する２つの試料の２つの技術的複製物を示している。Ｙ軸は、定量ＰＣＲ増幅を使用するオンターゲット分子のコピー数を示している。図は、分画されたｃｆＤＮＡのそれぞれの群における標的配列の定量的決定を示している。

【0078】

【図22】図２２は、核酸分子のｓｓＤＮＡおよびｄｓＤＮＡへの分画に続くＰＣＲ収量を示している。Ｘ軸は、２つの技術的複製物におけるｃｆＤＮＡ入力（２００ｎｇおよび５００ｎｇ）を示し、Ｙ軸はＰＣＲ収量をｐｍｏｌで示している。

【0079】

【図23】図２３は、全ゲノムシーケンシングを使用するプロモーター領域のメチル化プロファイリングを示している。

【0080】

【図24】図２４は、メチル結合ドメインタンパク質を使用して分割されたまたは分画された（ＭＢＤ分割）核酸分子にタグを付けるための戦略の３つの例を提供している。

【0081】

【図25】図２５Ａおよび図２５Ｂは、標的シーケンシングアッセイにおけるＭＢＤおよび非ＭＢＤ試料についてのカバー度間の比較を示している。

【0082】

【図26A】図２６Ａおよび図２６Ｂは、１５ｎｇのｃｆＤＮＡ入力および２つの臨床試料（ＰｏｗｅｒｐｏｏｌＶ１およびＰｏｗｅｒｐｏｏｌＶ２）を使用するパネル内の遺伝子についてのカバー度を示している。

【図26B】図２６Ａおよび図２６Ｂは、１５ｎｇのｃｆＤＮＡ入力および２つの臨床試料（ＰｏｗｅｒｐｏｏｌＶ１およびＰｏｗｅｒｐｏｏｌＶ２）を使用するパネル内の遺伝子についてのカバー度を示している。

【0083】

【図27A】図２７Ａおよび図２７Ｂは、１５０ｎｇのｃｆＤＮＡ入力および２つの臨床試料（ＰｏｗｅｒｐｏｏｌＶ１およびＰｏｗｅｒｐｏｏｌＶ２）を使用するパネル内の遺伝子についてのカバー度を示している。

【図27B】図２７Ａおよび図２７Ｂは、１５０ｎｇのｃｆＤＮＡ入力および２つの臨床試料（ＰｏｗｅｒｐｏｏｌＶ１およびＰｏｗｅｒｐｏｏｌＶ２）を使用するパネル内の遺伝子についてのカバー度を示している。

【0084】

【図28AB】図２８Ａ、図２８Ｂおよび図２８Ｃは、１５ｎｇのｃｆＤＮＡ入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。

【図28C】図２８Ａ、図２８Ｂおよび図２８Ｃは、１５ｎｇのｃｆＤＮＡ入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。

【0085】

【図29AB】図２９Ａ、図２９Ｂおよび図２９Ｃは、１５０ｎｇのｃｆＤＮＡ入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。

【図29C】図２９Ａ、図２９Ｂおよび図２９Ｃは、１５０ｎｇのｃｆＤＮＡ入力を使用するパネル内の遺伝子についてのバリアントまたは突然変異検出の特異性および感度を示している。

【0086】

【図30】図３０は、全ゲノムバイサルファイトシーケンシング（ＷＧＢＳ）およびＭＢＤ分割により測定された平均メチル化レベル間の相関を示している。

【0087】

【図31A】図３１Ａおよび図３１Ｂは、ＭＢＤ分割（Ｙ軸）を使用するおよび全ゲノムバイサルファイトシーケンシングアッセイ（ＷＧＢＳ、Ｘ軸）を使用するメチル化ＤＮＡを検出する感度（図３１Ａ）および特異性（図３１Ｂ）を示している。

【図31B】図３１Ａおよび図３１Ｂは、ＭＢＤ分割（Ｙ軸）を使用するおよび全ゲノムバイサルファイトシーケンシングアッセイ（ＷＧＢＳ、Ｘ軸）を使用するメチル化ＤＮＡを検出する感度（図３１Ａ）および特異性（図３１Ｂ）を示している。

【0088】

【図32】図３２は、デジタル処理デバイスの実施形態を示している

【0089】

【図33】図３３は、アプリケーション提供システムの実施形態を示している

【0090】

【図34】図３４は、クラウドベースアーキテクチャーを用いるアプリケーション提供システムの実施形態を示している。

【発明を実施するための形態】

【0091】

用語「無細胞ＤＮＡ」および「無細胞ＤＮＡ集団」とは、本明細書で使用される場合、大型の複雑な生物有機体、例えば、哺乳動物中の細胞（単数または複数）において元々見出され、細胞から、生物体中で見られる液体流体、例えば、血漿、リンパ、脳脊髄液、尿中に放出されたＤＮＡを指し、ＤＮＡは、流体の試料を得ることによって、ｉｎｖｉｔｒｏ細胞溶解ステップを実施する必要なく得ることができる。

【0092】

全般

【0093】

本開示は、複雑なゲノム材料中に最初に存在している分子の特徴の（例えば、エピジェネティックまたはその他の種類の構造的）情報の喪失を低減または排除しながら、複雑なゲノム材料を解析するための多数の方法、試薬、組成物およびシステムを提供する。いくつかの実施形態では、遺伝子改変（例えば、ＳＮＶ、挿入欠失、遺伝子融合およびコピー数変異）を判定する目的で、分子タグを使用して、異なる形態の核酸を追跡し、このような異なる形態を数え上げることができる。いくつかの実施形態では、対象におけるがんなどの状態または胎児の状態を検出、解析またはモニタリングするために本明細書において記載される方法が使用される。いくつかの実施形態では、対象は、妊娠中ではない。

【0094】

本開示は、異なる形態を含有する核酸集団を処理するための方法を提供する。本明細書で使用される場合、異なる形態の核酸は、異なる特徴を有する。例えば、制限するものではないが、ＲＮＡおよびＤＮＡは、糖同一性に基づいて異なる形態である。一本鎖（ｓｓ）および二本鎖（ｄｓ）核酸は、鎖の数に関して異なる。核酸分子は、５－メチルシトシンまたはヒストンなどのタンパク質との会合などのエピジェネティック特徴に基づいて異なり得る。核酸は、異なるヌクレオチド配列、例えば、特定の遺伝子または遺伝子座を有し得る。特徴は、程度の点で異なることもある。

【0095】

例えば、ＤＮＡ分子は、そのエピジェネティック修飾の程度が異なり得る。修飾の程度は、分子が対象であった修飾事象の数、例えば、メチル化基の数（メチル化の程度）またはその他のエピジェネティック変化を指し得る。例えば、メチル化ＤＮＡは、低メチル化または高メチル化であり得る。形態は、特徴の組合せ、例えば、一本鎖－非メチル化または二本鎖－メチル化によって特徴付けることができる。特徴のうち１つまたは組合せに基づく分子の分画は、単一分子の多次元解析にとって有用であり得る。これらの方法は、複数の形態について配列情報を得ることができるように、試料中の核酸の複数の形態および／または修飾に適応する。方法はまた、核塩基配列の解析を、エピジェネティック解析と組み合わせることができるように、処理および解析を通じて最初の複数の形態または修飾状態の同一性を保つ。いくつかの方法は、試料中に存在する複数の形態を解析するのに必要な処理ステップの数を低減しながら、異なる形態または修飾状態の分離、タグ付けおよびその後プールすることを含む。試料中の複数の形態の核酸を解析することは、解析するためのより多い分子があるために（これは、極めて少ない、核酸の総量が利用可能である場合には重要であり得る）、また、異なる形態または修飾状態が異なる情報を提供し得るために（例えば、ＲＮＡ中にだけ突然変異が存在し得る）、また、異なる種類の情報（例えば、遺伝子のおよびエピジェネティック）を互いに関連付け、それによって、より高い精度、確実性を提供する、または医学的状態との新規相関の発見をもたらすことができるために、幾分かより多い情報を提供する。

【0096】

ＣｐＧジヌクレオチドは、正常ヒトゲノムにおいて提示不足（underpresented）であり、ＣｐＧジヌクレオチド配列の大部分は、転写的に不活性であり（例えば、染色体の動原体周囲部分中の、および反復エレメント中のＤＮＡヘテロクロマチン領域）、メチル化されている。しかし、多数のＣｐＧアイランドは、特に、転写開始部位（ＴＳＳ）周囲では、このようなメチル化から保護されている。

【0097】

がんは、メチル化などのエピジェネティック変異によって示される場合がある。がんにおけるメチル化変化の例は、正常な成長制御、ＤＮＡ修復、細胞周期調節および／または細胞分化に関与する遺伝子の転写開始部位（ＴＳＳ）でのＣｐＧアイランド中のＤＮＡメチル化の局所増加を含む。この高メチル化は、関与する遺伝子の転写能力の異常な喪失と関連する場合もあり、遺伝子発現の変更の原因としての点突然変異および欠失と少なくとも同程度の頻度で起こる。ＤＮＡメチル化プロファイリングを使用して、発生の際に変更された、または疾患、例えば、がんもしくは任意のがん関連疾患によって撹乱されたゲノムの異なる程度のメチル化を有する領域（「差次的にメチル化された領域」または「ＤＭＲ」）を検出できる。がん細胞のゲノムは、上記のＤＮＡメチル化パターンにおいて、したがって、ＤＮＡの機能的パッケージングにおいて不均衡を有する。したがって、クロマチン組織化の異常は、メチル化変化と相まって、一緒に解析された場合にがんプロファイリングの増強に寄与し得る。ＭＢＤ分割を、断片マッピングされた開始および停止位置（ヌクレオソーム位置と相関する）、断片長および関連ヌクレオソーム占有率などのフラグメントームデータと組み合わせることは、バイオマーカー検出率を改善することを目的とした高メチル化研究におけるクロマチン構造解析のために使用できる。

【0098】

メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを含み得る。例えば、メチル化の程度（例えば、分子１つあたりのメチル化部位の相対数）およびシーケンシングに基づいて分子を分割した後、異なる分割物中の分子の配列を、参照ゲノムに対してマッピングしてもよい。これによって、その他の領域と比べて、より高度にメチル化されている、またはあまり高度にメチル化されていないゲノムの領域を示すことができる。このようにして、個々の分子とは対照的にゲノム領域は、そのメチル化の程度が異なり得る。

【0099】

核酸分子の特徴は、種々の化学修飾またはタンパク質修飾（すなわち、エピジェネティック修飾）を含み得る修飾であり得る。化学修飾の限定されない例として、それだけには限らないが、ＤＮＡメチル化を含む共有結合性ＤＮＡ修飾を挙げることができる。いくつかの実施形態では、ＤＮＡメチル化は、ＣｐＧ部位（核酸配列中のシトシンと、それに続くグアニン）でのシトシンへのメチル基の付加を含む。いくつかの実施形態では、ＤＮＡメチル化は、Ｎ^６－メチルアデニン中などのアデニンへのメチル基の付加を含む。いくつかの実施形態では、ＤＮＡメチル化は、５－メチル化（シトシンの６炭素環の５番目の炭素の修飾）である。いくつかの実施形態では、５－メチル化は、５－メチルシトシン（ｍ５ｃ）を作製するためのシトシンの５Ｃ位へのメチル基の付加を含む。いくつかの実施形態では、メチル化は、ｍ５ｃの誘導体を含む。ｍ５ｃの誘導体として、それだけには限らないが、５－ヒドロキシメチルシトシン（５－ｈｍＣ）、５－ホルミルシトシン（５－ｆＣ）および５－カルボキシルシトシン（caryboxylcytosine）（５－ｃａＣ）が挙げられ
る。いくつかの実施形態では、ＤＮＡメチル化は、３Ｃメチル化（シトシンの６炭素環の３番目の炭素の修飾）である。いくつかの実施形態では、３Ｃメチル化は、３－メチルシトシン（３ｍＣ）を作製するためのシトシンの３Ｃ位へのメチル基の付加を含む。メチル化はまた、非ＣｐＧ部位でも起こり得、例えば、メチル化は、ＣｐＡ、ＣｐＴまたはＣｐＣ部位で起こり得る。ＤＮＡメチル化は、メチル化ＤＮＡ領域の活性を変化させ得る。例えば、プロモーター領域中のＤＮＡがメチル化される場合には、遺伝子の転写は、抑制され得る。ＤＮＡメチル化は、正常な発生にとって重要であり、メチル化の異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節の破壊、例えば、抑制は、がんなどの疾患を引き起こし得る。ＤＮＡにおけるプロモーターメチル化は、がんを示すことがある。

【0100】

タンパク質修飾は、クロマチンの成分、特にその修飾された形態を含むヒストンとの結合およびその他のタンパク質、例えば、複製または転写に関与するタンパク質との結合を含む。本開示は、異なる程度の修飾を有する核酸を、その元の修飾の性質が核酸タグと相関し、核酸が解析される場合にはタグをシーケンシングすることによって解読され得るように処理および解析する方法を提供する。次いで、試料核酸修飾の遺伝的変異を、元の試料中のその核酸の修飾（エピジェネティック変異）の程度と関連付けることができる。

【0101】

本明細書で使用される場合、用語「分画すること」および「分割すること」は、異なる特徴に基づいて分子を分離することを指す。試料中の核酸分子は、１つまたは複数の特徴に基づいて分画され得る。分画は、ゲノム特徴の有無に基づいて核酸分子をサブセットまたは群に物理的に分割することを含み得る。分画は、ゲノム特徴が存在する程度に基づいて核酸分子を分割群に物理的に分割することを含み得る。試料は、差次的遺伝子発現または疾患状態を示す特徴に基づいて１つまたは複数の群の分割物に分画または分割してもよい。試料は、核酸、例えば、無細胞ＤＮＡ（「ｃｆＤＮＡ」）、非ｃｆＤＮＡ、腫瘍ＤＮＡ、循環腫瘍ＤＮＡ（「ｃｔＤＮＡ」）および無細胞核酸（「ｃｆＮＡ」）の解析の際に、正常および罹患状態の間にシグナルの相違を提供する特徴またはその組合せに基づいて分画してもよい。

【0102】

本開示は、核酸分子を効率的に解析するための方法およびシステムを提供する。方法は、核酸分子を、１つまたは複数の特徴に基づいて異なる分割物に分画するステップと、続いて、シーケンシングするステップ（単独または一緒に）と、各分割物中の核酸分子を解析するステップとを含み得る。いくつかの場合には、核酸分子の分割物は、シーケンシングの前および／または後に増幅される。方法は、予後、診断などの種々の用途において、および／または疾患のモニタリングのために使用され得る。

【0103】

核酸分子は、１つまたは複数の特徴のうちいずれによって特徴付けてもよい。核酸分子の特徴は、鎖の状態（ｓｔｒａｎｄｅｄｎｅｓｓ）、タンパク質が結合している領域、核酸長、開始／停止位置、化学修飾またはタンパク質修飾を含み得る。核酸分子の鎖の状態は、一本鎖（例えば、ｓｓＤＮＡまたはＲＮＡ）または二本鎖分子（例えば、ｄｓＤＮＡ）を含み得る。

【0104】

核酸分子のゲノム特徴は、種々の化学修飾を含み得る修飾であり得る。限定されない例として、化学修飾は、ＤＮＡメチル化（５ｍＣ）、ヒドロキシルメチル化（５ｈｍＣ）、ホルミルメチル化（５ｆＣ）、カルボキシルメチル化（５ＣａＣ）、Ｎ^６－メチルアデニンまたはグリコシル化などの共有結合性ＤＮＡ修飾を含み得る。ＤＮＡメチル化は、ＤＮＡ（例えば、ＣｐＧ）へのメチル基の付加を含み、メチル化ＤＮＡ領域の発現を変化させ得る。例えば、プロモーター領域中のＤＮＡがメチル化される場合には、遺伝子の転写は、抑制され得る。ＤＮＡメチル化は、正常な発生にとって重要であり、メチル化の異常は、エピジェネティック調節を破壊し得る。エピジェネティック調節の破壊、例えば、抑制は、がんなどの疾患を引き起こし得る。ＤＮＡにおけるプロモーターメチル化は、がんを示すことがある。

【0105】

限定されない例として、一本鎖ＲＮＡおよび／またはＤＮＡならびに二本鎖ＤＮＡを分割して、試料を特徴付けるステップを含む方法の利益として、以下が挙げられる：
１．ｄｓＤＮＡに加えてｓｓＤＮＡおよびＲＮＡ分子からのＳＮＶ、ＣＮＶおよび挿入欠失コールのさらなる支持、
２．イントロンＤＮＡ中の可変切断点が、ＲＮＡにおいて規定されたエクソン－エクソン接合部をもたらすので、ＤＮＡと比較して、より容易なＲＮＡにおける遺伝子融合の同定（ターゲッティング）、
３．メッセンジャーＲＮＡ（ｍＲＮＡ）、マイクロＲＮＡ（ｍｉＲＮＡ）および長鎖ノンコーディングＲＮＡ（ｌｎｃＲＮＡ）の同定または差次的発現レベルは、多数の疾患状態の特徴であり得る。がんの早期検出において重要であり得る白血球からの健康な無細胞ＤＮＡ（ｃｆＤＮＡ）に対する、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）集団内のヌクレオソーム位置付けの変化において見られる発現シグネチャーの確認およびさらなる支持さらに、白血球由来ｃｆＤＮＡおよびｃｆＲＮＡ発現変化も、疾患に対する免疫応答を示すことがある。
４．不安定分子の証拠。より短い循環腫瘍ＤＮＡ（ｃｔＤＮＡ）の捕捉－無細胞ＤＮＡの研究によって、腫瘍ＤＮＡ（ｃｔＤＮＡ）の長さは、正常ＤＮＡよりも大幅に短いことがあるとわかっている。いくつかの証拠によって、これらのより短い配列は、不安定であり、ｓｓＤＮＡとして存在し得ることが示されている。これらはまた、がんの早期検出において重要であり得るｃｆＤＮＡと比較した、ｃｔＤＮＡにおける転写因子結合変化に関する情報を提供し得る。同様に、ｃｆＤＮＡはまた、疾患応答を示すことがある、ならびに
５．臨床上関連し得て、一本鎖の「ギャップのある」領域を含有する、損傷を受けた／分解されたＤＮＡの捕捉。
試料中の複数の形態の核酸を解析することは、例えば、シーケンシングに先立って、異なる形態の核酸に差次的にタグを付けることおよび／または異なる形態の核酸を分割することによって起こり得る。

【0106】

ＩＩ．試料中の異なる核酸形態に差次的にタグを付けること
体液中の無細胞核酸などの核酸の試料は、核酸を、一本鎖および二本鎖ＤＮＡならびに一本鎖ＲＮＡを含む複数の形態で含有することが多い。このような試料中の核酸の総量は、少ないものであり得るために、また、異なる特徴および／または修飾を有する異なる形態の核酸は、試料に関する異なる情報をもたらし得るために、２、３種またはすべてのこのような形態を解析する方法が、本明細書において提供される。

【0107】

複数の形態の調製および解析は、ステップの少なくとも一部を並行して実施できる場合、より効率的である。このような試料から決定される情報は、処理後の特定の核酸の配列情報を、試料中の核酸の元の形態と相関させることができる場合には最も情報価値がある。例えば、処理後に特定の核酸においてＳＮＶが決定される場合には、その核酸が、元の試料中のＲＮＡ、一本鎖ＤＮＡまたは二本鎖ＤＮＡに由来したかが決定され得る。

【0108】

試料中の異なる形態の核酸の同定は、第２の鎖合成または増幅によってなど、その元の形態をわかりにくくする方法で形態が変更される前の、試料中の異なる形態の核酸の差次的タグ付けによって達成できる。したがって、複数の形態を含む核酸では、少なくとも１種の形態が、試料中に存在する１種または複数のその他の形態からそれを区別するために核酸タグに連結される。一本鎖ＤＮＡ、一本鎖ＲＮＡおよび二本鎖ＤＮＡなどの３種の形態の核酸を含有する試料では、３種の形態は、形態のうち少なくとも２種を差次的に標識することによって、または３種すべてを差次的に標識することによって区別され得る。同一形態の核酸分子に連結されたタグは、同一である場合も互いに異なる場合もある。しかし、互いに異なる場合には、タグは、いくつかの実施形態では、付着される分子を特定の形態と同定するために、そのコードの一部が共通であり得る。例えば、特定の形態の核酸分子（nucleic molecules）は、形態Ａ１、Ａ２、Ａ３、Ａ４などのコードを有し得、異なる形態の核酸分子は、Ｂ１、Ｂ２、Ｂ３、Ｂ４などのコードを有し得る。このようなコーディングシステムによって、形態間および形態内の分子間両方の区別が可能となる。異なる特徴、例えば、メチル結合ドメインタンパク質を使用して決定されるようなメチル化の程度を有する核酸分子に差次的にタグを付けるための例示的戦略が、図２４（以下に記載される）に提供される。

【0109】

核酸タグでの、試料中の１種、いくつかまたはすべての形態の核酸の差次的標識後に、核酸タグが元の試料中の形態と一緒に増幅されるように、形態を増幅できる。次いで、増幅された核酸を、配列解析に付して、元々の試料中の核酸の配列の一部またはすべてならびに連結された核酸タグのものを読み取ることができる。次いで、タグの配列を解読して、元の試料中の核酸の形態を示すことができる。次いで、異なる形態の配列を比較して、遺伝的変異が、ある特定の形態の核酸においてのみ主にもしくは独占的に見られるか、または元の形態とは独立してほぼ同一頻度で生じるのかを確かめることができる。異なる形態の差次的タグ付け後のステップの一部またはすべて、特に増幅およびシーケンシングを、プールされた異なる形態の核酸を用いて実施できる。このような方法は、好ましくは、試料中に存在する２、３種またはそれより多い形態の核酸分子の少なくとも４０、５０、６０、７０、８０、９０または９５％の増幅およびシーケンシングをもたらす。

【0110】

二本鎖核酸は、少なくとも部分的に二本鎖のアダプターへのライゲーションによって差次的に標識できる。通常、二本鎖核酸は、このようなアダプターに両末端でライゲーションされる。このようなアダプターのいずれかまたは両方が、核酸タグを含み得る。各々タグを有する２つのアダプターが、核酸のそれぞれの末端に連結される場合には、タグ組合せは、識別子として機能し得る。一本鎖ＤＮＡまたはＲＮＡ分子は、アダプターの二本鎖末端とは相当な程度にはライゲーションせず、そのため、核酸タグを受け取らない。二本鎖アダプターは、Ｙ型アダプターまたはヘアピンアダプターの場合のように、十分に二本鎖である場合も、部分的に二本鎖である場合もある。Ｙ型アダプターの例示的配列を以下に示す。
ユニバーサルアダプター

【0111】

ユニバーサルアダプター
配列番号１：

【化1】

【0112】

アダプタータグ
配列番号２：

【化2】

【0113】

これらのアダプター配列の末端切断型は、Rohlandら、Genome Res.、２０１２年５月
；２２巻（５号）：９３９～９４６頁に記載されている。

【0114】

Ｙ型アダプターは一本鎖末端を有するので、それらは、避けられる（例えば、Ｙ型アダプターと結合しないプローブを用いて一本鎖ＤＮＡを分離することによって）または一本鎖試料核酸をその他の試料核酸から分離するというその後のステップが実施される予定である場合には、保護される必要があり得る。

【0115】

ＲＮＡ分子は、それらが、ＲＮＡ依存性ＤＮＡポリメラーゼを有する逆転写酵素が作用し得る試料中の分子の唯一の形態であることによって、核酸タグを用いて差次的に標識することができる。核酸タグは、逆転写をプライムするために使用されるプライマーの５’タグとして導入することができる。逆転写は、ランダムである場合も、配列特異的である場合もある。逆転写後、元のＲＮＡ鎖は分解され、続いて、第２の相補的ＤＮＡ鎖が合成され得る。ここで二本鎖となったＤＮＡを、必要に応じて、平滑末端とし、試料中にすでに存在している二本鎖ＤＮＡ分子と同様の方法でアダプターにつなげてもよい。あるいは、ＲＮＡ／ＤＮＡハイブリッド分子をアダプターに直接つなげてもよい。

【0116】

一本鎖ＤＮＡ分子は、分子内リガーゼを用いる処理によって二本鎖ＤＮＡ分子から分画できる。いくつかの実施形態では、分子内リガーゼは、３’タグを用いてｓｓＤＮＡに差次的にタグを付けるための、ＣｉｒｃＬｉｇａｓｅ（商標）ｓｓＤＮＡリガーゼである。ｓｓＤＮＡの環状化を防ぐために分子内リガーゼを用いる処理に先立って、ｓｓＤＮＡを、５’末端で脱リン酸化する。一例では、一本鎖ＤＮＡにタグを付着するために使用されるリガーゼは、ＣｉｒｃＬｉｇａｓｅ（商標）ｓｓＤＮＡリガーゼである。ＣｉｒｃＬｉｇａｓｅ（商標）ｓｓＤＮＡリガーゼは、熱安定性ＡＴＰ依存性リガーゼである。第２鎖合成は、一本鎖ＤＮＡを一方の末端でオリゴヌクレオチドと連結して（例えば、Ｔ４ＲＮＡリガーゼを用いて）、プライマー結合部位を提供することと、一本鎖ＤＮＡを、ハイブリダイズされる鋳型配列に基づいて延長するためのプライマーとして働く相補的オリゴヌクレオチドとハイブリダイズすること、またはハイブリダイズされる鋳型配列に基づく延長のためのプライマーとして同様に働くランダムオリゴヌクレオチドとのハイブリダイゼーションとを含むいくつかの機序によって起こり得る。１つの方法は、一本鎖リガーゼを使用して、一本鎖ＤＮＡライブラリーメンバーに、延長可能な３’末端を有するオリゴヌクレオチドを付加する（Gansauge & Meyer、Nature Protocols、８巻、７３７頁（
２０１３年）を参照のこと）。第２のＤＮＡ鎖は、プライマー結合部位としてアダプターを使用して埋められる。次いで、５’ＤＮＡリン酸化ステップおよび標準（ｄｓＤＮＡ）ライゲーションを実施して、ライブラリー分子の５’末端にアダプターを付加する。

【0117】

別の方法では、市販のＮＥＢＤｉｒｅｃｔ方法論からのステップを、方法に含めてもよく、一本鎖ＤＮＡ分子を、第２鎖合成のために配列特異的プライマーとハイブリダイズさせ、続いて、末端修復し、隣接するアダプターにライゲーションする（neb.com/nebnext-direct/nebnext-direct-for-target-enrichmentを参照のこと）。プライマーを含有する
第２のＤＮＡ鎖は分解され、そのためシーケンシングされない。別の方法は、５’末端にアダプター配列、そして３’末端にランダム塩基を有するランダムプライマーを使用する。通常６個のランダム塩基があるが、４から９塩基長の間であり得る。このアプローチは、ＲＮＡ－ｓｅｑまたはバイサルファイト－シーケンシングのための低投入量／単細胞増幅に特に適している（Smallwoodら、Nat. Methods、２０１４年８月；１１巻（８号）：８１７～８２０頁）。

【0118】

ｓｓＤＮＡは、ハイブリダイゼーションに先立つ標準変性ステップを省くことによって核酸（ＮＡ）プローブによって選択的に捕捉することができる。ｓｓＤＮＡ－プローブハイブリッドは、ｃｆＮＡ（無細胞核酸）集団から従来方法（例えば、ストレプトアビジン－ビーズ磁石によって捕捉されるビオチン化ＤＮＡ／ＲＮＡプローブ）によって単離することができる。プローブ配列は、標的特異的であり、また、ｄｓＤＮＡワークフロー、そのワークフローのサブセットを用いるパネルと同一または異なる（例えば、エクソン－エクソン接合部、「ホットスポット」ＤＮＡ配列でのＲＮＡ融合物を標的とする）ものであり得る。すべての一本鎖核酸（ｓｓＮＡ）は、デオキシイノシン、３－ニトロピロールおよび５－ニトロインドールなどの「ユニバーサルヌクレオチド塩基」を有するプローブを利用することによって、このステップで、配列にとらわれない方法で捕捉することができる。

【0119】

図１は、核酸の形態を分離するための例示的スキームを示す。図の上部は、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡを含む試料を示す。ＲＮＡは、５’ＲＮＡ同定核酸タグを有する、配列特異的またはランダムポリＴプライマーを用いて逆転写される。相補的ＤＮＡ鎖の合成後、ＲＮＡ鋳型は、ＲＮアーゼＨもしくはＮａＯＨまたは選択的ハイブリダイゼーションによるリボソーム枯渇を用いて分解される。次いで、試料を、試料の変性を行わず、捕捉用プローブ（配列特異的であっても、配列にとらわれないものであってもよい）を用いて処理する。これらのプローブは、一本鎖分子とハイブリダイズし、試料から一本鎖分子を除去する。この例では試料中の二本鎖ＤＮＡ分子を次いで平滑末端とし、核酸タグを含むアダプターに連結する。この例では、アダプターは、Ｙ型であり、Ｙの二本鎖アーム部分をＤＮＡ分子とライゲーションする。一方、分離された一本鎖核酸を、タグの付着を含む上記で論じられたＤＮＡプロトコールまたはＮＥＢｄｉｒｅｃｔプロトコールによって処理する。

【0120】

図２は、単純化されたワークフローを用いて、最も顕著には５’ＤＮＡリン酸化ステップを除去して、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡを含む試料を用いて出発するさらなる例示的スキームを示す。試料中の二本鎖ＤＮＡを、核酸タグを含むヘアピンアダプターにまずライゲーションする。次いで、試料を５’ＤＮＡ脱リン酸化し、次いで、ＲＮＡをｃＤＮＡに変換し、また、異なるタグにライゲーションする。次いで、一本鎖ＤＮＡを、図１においてと同様に処理する。いくつかの実施形態では、ヘアピンアダプターは、ライブラリー増幅に先立って２つの鎖に切断することができる。

【0121】

図７は、差次的タグ付けの一実施形態を例示する。ステップ７０１では、核酸の集団が得られる。核酸は、液体生検試料（血清、血漿または血液）に由来するなどの循環核酸（ｃＮＡ）であり得る。ステップ７０２では、核酸の第１の形態に差次的にタグを付けて、第１のタグが付けられた核酸形態および第２のタグが付けられていない核酸形態の混合物（７０３）を形成する。続いて、ステップ７０４では、核酸の第２の形態（または残存する核酸）に、異なる標識を用いてタグを付ける。上記の方法は、ステップ７０４に先立って２種またはそれより多い異なる差次的タグ付けステップ（７０２）を含み得る。集団中の２種またはそれより多い形態の核酸にタグを付けた後、いくつかの実施形態では、異なる形態を分割できる。異なる形態が分割される場合には、次いで、シーケンシングに先立って差次的にタグが付けられた核酸を一緒にプールすることができ、または別個にシーケンシングできる。異なる形態の核酸の差次的タグ付けは、１つの管または反応容積中で起こり、タグが付けられた分子の全体がシーケンシングされる（分割を伴わずに）ことが好ましい。シーケンシングから得られた読み取りデータを、異なる核酸形態ならびに集団的核酸試料に由来する読み取りデータで実施されるべき解析のために使用できる。

【0122】

いくつかの実施形態では、差次的にタグが付けられる第１の形態の核酸は、ｄｓＤＮＡであり、差次的タグ付けは、第１のセットのタグを含むｄｓＤＮＡ二本鎖アダプターに付着させることによって実施される。次いで、ｓｓＤＮＡ（残存する核酸）に異なるセットのタグ（第２のセットのタグ）を用いてタグが付けられる。

【0123】

いくつかの実施形態では、差次的にタグが付けられる第１の形態の核酸は、オープンクロマチン領域に由来するＤＮＡであり、タグ付けは、核酸の集団を、Ｔｎ５媒介性トランスポサーゼ活性と接触させることによって実施される。

【0124】

いくつかの実施形態では、差次的にタグが付けられる第１の形態の核酸は、二本鎖核酸であり、タグ付けは、ヘアピンアダプターを二本鎖核酸に付着させることによって実施される。

【0125】

ＩＩＩ．異なる程度の修飾を有する核酸の分割
本明細書において記載されるある特定の実施形態では、タグ付けおよびシーケンシングに先立って、異なる形態の核酸の集団を、核酸の１つまたは複数の特徴に基づいて分割できる。不均一な核酸集団を分割することによって、例えば、集団のある画分（または分割物）においてより優勢である希少核酸分子を濃縮することによって希少シグナルを増大することができる。例えば、ＲＮＡをＤＮＡから分割することによって、ＲＮＡ中に存在するが、ＤＮＡ中には少ない（または存在しない）遺伝的変異を検出できる。同様に、試料を高メチル化および低メチル化核酸分子に分割することによって、高メチル化ＤＮＡ中に存在するが、低メチル化ＤＮＡ中には少ない（または存在しない）遺伝的変異をより容易に検出できる。試料の複数の画分を解析することによって、単一分子の多次元解析を実施することができ、したがって、より高い感度を達成することができる。

【0126】

いくつかの例では、不均一核酸試料は、２種またはそれより多い分割物（例えば、少なくとも３、４、５、６または７種の分割物）に分割される。いくつかの実施形態では、各分割物は、差次的にタグが付けられる。次いで、タグが付けられた分割物を、集団的試料調製（ｐｒｅｐ）および／またはシーケンシングのために一緒にプールする。分割－タグ付け－プールステップは、１回を超えて行われる場合もあり、分割の各ラウンドは、異なる特徴（本明細書において例が提供される）に基づいて行われ、その他の分割物から区別される差次的タグおよび分割手段を使用してタグが付けられる。

【0127】

分割するために使用され得る特徴の例として、配列長、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈降および／またはＤＮＡと結合するタンパク質が挙げられる。得られた分割物は、以下の核酸形態：リボ核酸（ＲＮＡ）、一本鎖ＤＮＡ（ｓｓＤＮＡ）、二本鎖ＤＮＡ（ｄｓＤＮＡ）、より短いＤＮＡ断片およびより長いＤＮＡ断片のうち１種または複数を含み得る。いくつかの実施形態では、核酸の不均一集団は、ヌクレオソームと会合する核酸分子とヌクレオソームを欠く核酸分子に分割される。あるいは、またはさらに、核酸の不均一集団は、ＲＮＡとＤＮＡに分割される。あるいは、またはさらに、核酸の不均一集団は、一本鎖ＤＮＡ（ｓｓＤＮＡ）と二本鎖ＤＮＡ（ｄｓＤＮＡ）に分割され得る。あるいは、またはさらに、核酸の不均一集団は、１つまたは複数のエピジェネティック修飾を有する核酸と１つまたは複数のエピジェネティック修飾を有さない核酸に分割されてもよい。エピジェネティック修飾の例として、メチル化の有無、メチル化のレベル、メチル化の種類（５’シトシン）ならびにヒストンなどの１種または複数のタンパク質との会合および会合のレベルが挙げられる。あるいは、またはさらに、核酸の不均一集団は、核酸長（例えば、最大１６０ｂｐの分子と１６０ｂｐより大きい長さを有する分子）に基づいて分割されてもよい。

【0128】

いくつかの例では、各分割物（異なる核酸形態を代表する）を、差次的に標識し、シーケンシングに先立って分割物を一緒にプールする。その他の例では、異なる形態を別個にシーケンシングする。

【0129】

図８は、本開示の一実施形態を例示する。異なる核酸の集団（８０１）を、２種またはそれより多い異なる分割物（８０３ａ、ｂ）に分割する（８０２）。各分割物（８０３ａ、ｂ）は、異なる核酸形態を代表する。各分割物に、それぞれタグを付ける（８０４）。タグが付けられた核酸を一緒にプールし（８０７）、その後シーケンシングする（８０８）。読み取りデータをｉｎｓｉｌｉｃｏで解析する。タグを使用して、異なる分割物からの読み取りデータを選別する。遺伝的変異を検出するための解析は、分割物毎のレベルならびに全核酸集団レベルで実施できる。例えば、解析は、各分割物中の核酸中の遺伝的変異、例えば、ＣＮＶ、ＳＮＶ、挿入欠失、融合を決定するためのｉｎｓｉｌｉｃｏ解析を含み得る。いくつかの例では、ｉｎｓｉｌｉｃｏ解析は、クロマチン構造を決定することを含み得る。例えば、配列読み取りデータのカバー度またはコピー数を使用して、クロマチン中のヌクレオソーム位置付けを決定できる。より高いカバー度は、ゲノム領域中のより高いヌクレオソーム占有率と相関し得、より低いカバー度は、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

【0130】

試料は、ヌクレオチドへの複製後修飾および１種または複数のタンパク質との普通、非共有結合性の結合を含む修飾が変化する核酸を含み得る。

【0131】

一実施形態では、核酸の集団は、がんを有すると疑われる、またはこれまでにがんと診断された対象由来の血清、血漿または血液試料から得たものである。核酸は、変動するレベルのメチル化を有するものを含む。メチル化は、任意の１つまたは複数の複製後修飾または転写修飾から生じ得る。複製後修飾は、ヌクレオチドシトシンの修飾、特に、５－メチルシトシン、５－ヒドロキシメチルシトシン、５－ホルミルシトシンおよび５－カルボキシルシトシンを含む。

【0132】

核酸の分割は、核酸を、メチル化結合タンパク質（「ＭＢＰ」）のメチル化結合ドメイン（「ＭＢＤ」）と接触させることによって実施される。ＭＢＤは、５－メチルシトシン（５ｍＣ）と結合する。ＭＢＤは、ビオチンリンカーを介してＤｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンなどの常磁気ビーズに結合される。異なる程度のメチル化を有する画分への分割は、ＮａＣｌ濃度を増大することによって画分を溶出することによって実施できる。

【0133】

一般に、溶出は、分子１つあたりのメチル化部位の数の関数であり、分子は、増大した塩濃度下でより多いメチル化溶出を有する。ＤＮＡを、メチル化の程度に基づいて別個の集団に溶出するために、増大するＮａＣｌ濃度の一連の溶出バッファーを使用できる。塩濃度は、約１００ｎｍ～約２５００ｍＭＮａＣｌの範囲であり得る。一実施形態では、プロセスは、３種（３）の分割物をもたらす。分子を、第１の塩濃度の、メチル結合ドメインを含む分子を含む溶液と接触させ、その分子はストレプトアビジンなどの捕捉部分に付着され得る。第１の塩濃度では、分子のある集団は、ＭＢＤと結合し、ある集団は、結合されないままとなる。結合されない集団は、「低メチル化」集団として分離され得る。例えば、ＤＮＡの低メチル化形態を代表する第１の分割物は、低塩濃度、例えば、１６０ｎＭで結合されないままであるものである。中間のメチル化ＤＮＡを代表する第２の分割物は、中間の塩濃度、例えば、１００ｍＭから２０００ｍＭの間の濃度を使用して溶出される。これはまた、試料から分離される。ＤＮＡの高メチル化形態を代表する第３の分割物は、高塩濃度、例えば、少なくとも約２０００ｎＭを使用して溶出される。

【0134】

各分割物に差次的にタグを付ける。タグは、タグが関連する分子の特性を示す情報を含有する核酸などの分子であり得る。例えば、分子は、試料タグ（ある試料中の分子を、異なる試料中のものと区別する）、分割タグ（ある分割物中の分子を、異なる分割物中のものと区別する）または分子タグ（（独特なおよび非独特なタグ付けシナリオの両方で）異なる分子を互いに区別する）を有し得る。ある特定の実施形態では、タグは、バーコードのうち１つまたは組合せを含み得る。本明細書で使用される場合、用語「バーコード」とは、状況に応じて、特定のヌクレオチド配列を有する核酸分子またはヌクレオチド配列自体を指す。バーコードは、例えば、１０から１００の間のヌクレオチドを有し得る。バーコードの収集物は、特定の目的のために望まれるように、縮重配列を有し得る、またはある特定のハミング距離を有する配列を有し得る。そのため、例えば、試料指標、分割指標または分子指標は、１つのバーコードまたは各々分子の異なる末端に付着された２つのバーコードの組合せから構成され得る。

【0135】

タグを使用して、個々のポリヌクレオチド集団分割物を標識して、タグ（単数または複数）を、特定の分割物と相関させることができる。いくつかの実施形態では、単一タグを使用して、特定の分割物を標識できる。いくつかの実施形態では、複数の異なるタグを使用して、特定の分割物を標識できる。特定の分割物を標識するために複数の異なるタグを使用する実施形態では、１種の分割物を標識するために使用されるタグのセットを、その他の分割物を標識するために使用されるタグのセットと容易に区別することができる。いくつかの実施形態では、タグは、さらなる機能を有し得、例えば、タグを試料供給源に指標を付けるために、または独特の分子識別子（シーケンシングエラーを突然変異から区別することによって、シーケンシングデータの品質を改善するために使用できる）として使用できる。同様に、いくつかの実施形態では、タグは、さらなる機能を有し得、例えば、タグを、試料供給源に指標を付けるために、または非独特の分子識別子（シーケンシングエラーを突然変異から区別することによって、シーケンシングデータの品質を改善するために使用できる）として使用できる。

【0136】

一実施形態では、分割物タグ付けは、試料タグの等価物を用いて各分割物中の分子にタグを付けることを含む。分割物を再度組み合わせて、分子をシーケンシングした後、試料タグによって、供給源分割物が同定される。別の実施形態では、異なる分割物は、例えば、対バーコードから構成される異なる分子タグのセットを用いてタグが付けられる。このような方法で、各分子バーコードは、供給源分割物を示し、同様に分割物内の分子を区別するのに有用である。例えば、３５のバーコードの第１のセットを使用して、第１の分割物中の分子にタグを付けることができ、３５のバーコードの第２のセットを使用して、第２の分割物中の分子にタグを付けることができる。

【0137】

タグは、１つまたは複数の特徴に基づいて、すでに分割された分子に付着され得るが、ライブラリー中の最終的なタグが付けられた分子は、その特徴をもはや有さない場合がある。例えば、一本鎖ＤＮＡ分子は、分割され、タグが付けられ得るが、ライブラリー中の最終的なタグが付けられた分子は、二本鎖である可能性が高い。同様に、ＲＮＡは、分割に付され得るが、最終ライブラリー中では、これらのＲＮＡ分子に由来するタグが付けられた分子は、ＤＮＡである可能性が高い。したがって、ライブラリー中の分子に付着されたタグは、通常、最終的なタグが付けられた分子が由来する「親分子」の特徴を示し、必ずしも、タグが付けられた分子自体の特徴ではない。

【0138】

例えば、バーコード１、２、３、４などを使用して、第１の分割物中の分子にタグを付け、標識し、バーコードＡ、Ｂ、Ｃ、Ｄなどを使用して、第２の分割物中の分子にタグを付け、標識し、バーコードａ、ｂ、ｃ、ｄなどを使用して、第３の分割物中の分子にタグを付け、標識する。差次的にタグが付けられた分割物を、シーケンシングに先立ってプールすることができる。差次的にタグが付けられた分割物を、例えば、Ｉｌｌｕｍｉｎａシーケンサーの同一フローセル中で別個にシーケンシングしてもよく、同時に一緒にシーケンシングしてもよい。

【0139】

シーケンシング後、読み取りデータを解析し、遺伝的変異を検出することを分割物ごとのレベルで、ならびに全核酸集団レベルで実施できる。タグを使用して、異なる分割物からの読み取りデータを選別する。解析は、配列情報、ゲノム座標長およびカバー度またはコピー数を使用して遺伝的変異およびクロマチン構造を決定するためのｉｎｓｉｌｉｃｏ解析を含み得る。より高いカバー度は、ゲノム領域中のより高いヌクレオソーム占有率と相関し得、より低いカバー度は、より低いヌクレオソーム占有率またはヌクレオソーム枯渇領域（ＮＤＲ）と相関し得る。

【0140】

いくつかの実施形態では、元の集団中の核酸は、ＤＮＡおよび／またはＲＮＡ、一本鎖および／または二本鎖であり得る。一本鎖対二本鎖の状態に基づいて分割することは、例えば、標識された捕捉用プローブを使用して、ｓｓＤＮＡを分割することおよび二本鎖アダプターを使用して、ｄｓＤＮＡを分割することによって達成できる。ＲＮＡ対ＤＮＡ組成に基づいて分割することは、それだけには限らないが、二本鎖アダプターを使用して、ｄｓＤＮＡを分割することおよび捕捉用プローブを用いてまたは用いずに逆転写を使用して、ＲＮＡを分割することを含む。

【0141】

親和性作用物質は、所望の特異性を有する抗体、天然結合パートナーもしくはそのバリアント（Bockら、Nat Biotech、２８巻：１１０６～１１１４頁（２０１０年）；Songら、Nat Biotech、２９巻、６８～７２頁（２０１１年））または例えば、所与の標的に対する特異性を有するようにファージディスプレイによって選択された人工ペプチドであり得る。

【0142】

本明細書において考慮される捕捉部分の例として、メチル結合ドメイン（ＭＢＤ）およびメチル結合タンパク質（ＭＢＰ）が挙げられる。本明細書において考慮されるＭＢＰの例として、それだけには限らないが、以下が挙げられる：
（ａ）ＭｅＣＰ２は、未修飾シトシンよりも５－メチル－シトシンと優先的に結合するタンパク質である。
（ｂ）ＲＰＬ２６、ＰＲＰ８およびＤＮＡミスマッチ修復タンパク質ＭＨＳ６は、未修飾シトシンよりも５－ヒドロキシメチル－シトシンと優先的に結合する。
（ｃ）ＦＯＸＫ１、ＦＯＸＫ２、ＦＯＸＰ１、ＦＯＸＰ４およびＦＯＸＩ３は、好ましくは、未修飾シトシンよりも５－ホルミル－シトシンと結合する（Iurlaroら、Genome Biol.、１４巻、Ｒ１１９（２０１３年））。
（ｄ）１つまたは複数のメチル化ヌクレオチド塩基に対して特異的な抗体。

【0143】

同様に、異なる形態の核酸を分割することは、ヒストンと結合している核酸を、遊離のまたは結合していない核酸から分離できるヒストン結合タンパク質を使用して実施できる。本明細書において開示される方法において使用できるヒストン結合タンパク質の例として、ＲＢＢＰ４、ＲｂＡｐ４８およびＳＡＮＴドメインペプチドが挙げられる。

【0144】

いくつかの親和性作用物質および修飾について、作用物質との結合は、核酸が修飾を有するか否かに応じて、本質的に全または無の方法で起こり得るが、分離は一定の程度があり得る。このような例では、修飾が過剰提示される核酸は、作用物質と、修飾が提示不足である核酸よりも大きな程度で結合する。あるいは、修飾を有する核酸は、全または無の方法で結合し得る。しかし、次いで、種々のレベルの修飾を、結合する作用物質から逐次溶出できる。

【0145】

例えば、いくつかの実施形態では、分割することは、バイナリーであり得る、または修飾の程度／レベルに基づき得る。例えば、すべてのメチル化断片は、メチル結合ドメインタンパク質（例えば、ＭｅｔｈｙｌＭｉｎｄｅｒメチル化ＤＮＡ濃縮キット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用して、非メチル化断片から分割できる。続いて、さらなる分割は、メチル結合ドメインおよび結合された断片を有する溶液中の塩濃度を調整することによって異なるレベルのメチル化を有する断片を溶出することを含み得る。塩濃度が増大するにつれ、より高いメチル化レベルを有する断片が溶出される。

【0146】

いくつかの例では、最終分割物は、異なる程度の修飾（過剰提示または提示不足の修飾）を有する核酸を代表するものである。過剰提示および提示不足は、集団中の鎖１つあたりの修飾の中央値数に対する、核酸によって有される修飾の数によって定義され得る。例えば、試料中の核酸中の５－メチルシトシン残基の中央値数が２である場合には、２個を超える５－メチルシトシン残基を含む核酸は、この修飾では過剰提示され、１またはゼロ個の５－メチルシトシン残基を有する核酸は提示不足である。親和性分離の効果は、結合相中の修飾において過剰提示された核酸について、および非結合相中の（すなわち溶液中の）修飾において提示不足である核酸について濃縮することである。その後の処理前に、結合相中の核酸を溶出してもよい。

【0147】

ＭｅｔｈｙｌＭｉｎｅｒメチル化ＤＮＡ濃縮キット（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ）を使用する場合には、逐次溶出を使用して種々のレベルのメチル化を分割できる。例えば、低メチル化分割物（メチル化なし）は、磁気ビーズに付着された、キットに由来するＭＢＤと核酸集団を接触させることによって、メチル化分割物から分離できる。ビーズを使用して、メチル化核酸を非メチル化核酸から分離する。続いて、１つまたは複数の溶出ステップを、逐次実施して、異なるレベルのメチル化を有する核酸を溶出する。例えば、１６０ｍＭまたはそれより高い、例えば、少なくとも２００ｍＭ、３００ｍＭ、４００ｍＭ、５００ｍＭ、６００ｍＭ、７００ｍＭ、８００ｍＭ、９００ｍＭ、１０００ｍＭまたは２０００ｍＭの塩濃度でメチル化核酸の第１のセットを溶出できる。このようなメチル化核酸が溶出された後、磁性分離をもう一度使用して、より高いレベルのメチル化核酸を、より低いレベルのメチル化を有するものから分離する。溶出および磁性分離ステップを、反復して、低メチル化分割物（メチル化なしを代表する）、メチル化分割物（低レベルのメチル化を代表する）および高メチル化分割物（高レベルのメチル化を代表する）などの種々の分割物を作製してもよい。

【0148】

いくつかの方法では、親和性分離に使用される作用物質に結合された核酸は、洗浄ステップに付される。洗浄ステップは、親和性作用物質に弱く結合された核酸を洗浄除去する。このような核酸は、平均または中央値（すなわち、試料の作用物質との最初の接触時に、固相に結合されたままである核酸と、固相に結合されていない核酸の間の中間）に近い程度に修飾を有する核酸が豊富であり得る。

【0149】

親和性分離は、異なる程度の修飾を有する核酸の少なくとも２種、時には、３種またはそれより多い分割物をもたらす。分割物は、依然として分離されながら、少なくとも１種、通常、２種または３種（またはそれより多い）の分割物の核酸を、普通、アダプターの成分として提供される核酸タグに連結し、異なる分割物中の核酸は、１種の分割物のメンバーを別のものから区別する異なるタグを受け取る。同一分割物の核酸分子に連結されるタグは、同一である場合も互いに異なる場合もある。しかし、互いに異なる場合には、タグは、付着される分子を特定の分割物であると同定するために共通のそのコードの一部を有し得る。

【0150】

図３は、例示的スキームを示す。試料は、異なる程度のメチル化を有する核酸を含み、その一部はまた、遺伝的変異も有する。試料を、シトシンよりも５－メチルシトシンと優先的に結合する親和性試薬に連結された磁気ビーズと接触させる。親和性精製は、核酸の２種の分割物をもたらす。図の左の分割物は、親和性試薬と結合する核酸を表し、５－メチルシトシンが過剰提示される核酸が豊富である。右の分割物は、親和性試薬と結合しない核酸を表し、５－メチルシトシンを欠くまたは提示不足である核酸が豊富である。次いで、２種の分割物を、差次的核酸タグを含むＹ型アダプターに付着させ、増幅する。次いで、増幅された核酸を、配列データ、遺伝的変異を示す試料核酸の配列および試料核酸が分割される分割物を示し、それによって修飾の程度を示すタグの配列についてアッセイする。

【0151】

図２４は、ＭＢＤ分割およびタグ付けアプローチの例示的例を提供する。ワークフロー（１）において、分割前に分子タグの１つのセット（例えば、３５×３５タグ）を全試料に適用できる。分割後、この例では、高メチル化および低メチル化形態について、各分割物中の分子を、任意選択で増幅し、次いで、独立にシーケンシングする。ワークフロー（２）では、試料中の分子を、例えば、メチル化特徴に基づいて分割する。各分割物に個別にタグを付け、増幅し、シーケンシングする。ワークフロー（３）では、複数の試料の各々の中の分子を、分割に付し、分割物特異的タグを用いてタグを付け、プールし、増幅する。次いで、それらが由来する試料をデコンボリューションするために、各試料中の分子に試料タグを提供する。

【0152】

いくつかの実施形態では、核酸分子を、特定のタンパク質またはその断片に結合されている核酸分子および特定のタンパク質またはその断片に結合されないものに基づいて異なる分割物に分画できる。核酸分子を、ＤＮＡ－タンパク質結合に基づいて分画できる。タンパク質－ＤＮＡ複合体を、タンパク質の特定の特性に基づいて分画できる。このような特性の例として、種々のエピトープ、修飾（例えば、ヒストンメチル化またはアセチル化）または酵素活性が挙げられる。ＤＮＡと結合し、分画の基礎として働き得るタンパク質の例として、それだけには限らないが、プロテインＡおよびプロテインＧを挙げることができる。任意の適した方法を使用して、タンパク質が結合している領域に基づいて核酸分子を分画できる。タンパク質が結合している領域に基づいて核酸分子を分画するために使用される方法の例として、それだけには限らないが、ＳＤＳ－ＰＡＧＥ、クロマチン－免疫沈降（ＣｈＩＰ）、ヘパリンクロマトグラフィーおよび非対称フィールドフロー分画（ＡＦ４）が挙げられる。

【0153】

ＩＶ．核酸の５－メチルシトシンパターンの決定
バイサルファイトベースのシーケンシングおよびその変種は、核酸のメチル化パターンを決定する手段を提供する。いくつかの実施形態では、メチル化パターンを決定することは、５－メチルシトシン（５ｍＣ）を非メチル化シトシンから区別することを含む。いくつかの実施形態では、メチル化パターンを決定することは、Ｎ^６－メチルアデニンを非メチル化アデニンから区別することを含む。いくつかの実施形態では、メチル化パターンを決定することは、５－ヒドロキシメチルシトシン（５ｈｍＣ）、５－ホルミルシトシン（５ｆＣ）および５－カルボキシルシトシン（５ｃａＣ）を、非メチル化シトシンから区別することを含む。バイサルファイトシーケンシングの例として、それだけには限らないが、酸化バイサルファイトシーケンシング（ＯＸ－ＢＳ－ｓｅｑ）、Ｔｅｔ補助バイサルファイトシーケンシング（ＴＡＢ－ｓｅｑ）および還元バイサルファイトシーケンシング（ｒｅｄＢＳ－ｓｅｑ）が挙げられる。

【0154】

酸化バイサルファイトシーケンシング（ＯＸ－ＢＳ－ｓｅｑ）は、これまでに記載されたように、５ｈｍＣを５ｆＣに最初に変換し、次いで、バイサルファイトシーケンシングを進めることによって、５ｍＣおよび５ｈｍＣの間を区別するために使用される。Ｔｅｔ補助バイサルファイトシーケンシング（ＴＡＢ－ｓｅｑ）もまた、５ｍｃおよび５ｈｍＣを区別するために使用できる。ＴＡＢ－ｓｅｑでは、５ｈｍＣをグリコシル化によって保護する。次いで、Ｔｅｔ酵素を使用して、これまでに記載されたようにバイサルファイトシーケンシングを進める前に５ｍＣを５ｃａＣに変換する。還元バイサルファイトシーケンシングは、５ｆＣを修飾されたシトシンから区別するために使用される。

【0155】

全般的に、バイサルファイトシーケンシングでは、核酸試料を２つのアリコートに分け、一方のアリコートを、バイサルファイトを用いて処理する。バイサルファイトは、天然シトシンおよびある特定の修飾シトシンヌクレオチド（例えば、５－ホルミルシトシンまたは５－カルボキシルシトシン）をウラシルに変換するが、その他の修飾シトシン（例えば、５－メチルシトシン、５－ヒドロキシルメチルシトシン）は変換されない。２つのアリコートからの分子の核酸配列の比較は、どのシトシンがウラシルに変換された、および変換されなかったかを示す。結果として、修飾された、および修飾されていないシトシンを決定することができる。試料を２つのアリコートに最初に分けることは、ほんの少量の核酸を含有する試料および／または無細胞ＤＮＡを含有する体液などの不均一細胞／組織起源から構成される試料にとって不利である。

【0156】

本開示は、バイサルファイトシーケンシングおよびその変種を可能にする方法を提供する。これらの方法は、集団中の核酸を捕捉部分、すなわち、捕捉または固定され得る標識に連結することによって働く。捕捉部分は、制限するものではないが、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体によって認識されるハプテンおよび磁力によって誘引可能な粒子を含む。抽出部分は、ビオチン／ストレプトアビジンまたはハプテン／抗体などの結合対のメンバーであり得る。いくつかの実施形態では、解析物に付着されている捕捉部分が、磁力によって誘引可能な粒子または遠心分離によって沈降できる大きな粒子などの単離可能な部分に付着されているその結合対によって捕捉される。捕捉部分は、捕捉部分を有する核酸の、捕捉部分を欠く核酸からの親和性分離を可能にする任意の種類の分子であり得る。例示的捕捉部分として、固相に連結されたもしくは連結可能なストレプトアビジンとの結合による親和性分離を可能にするビオチン、または固相に連結されたもしくは連結可能な相補的オリゴヌクレオチドとの結合による親和性分離を可能にするオリゴヌクレオチドがある。捕捉部分を試料核酸に連結した後、試料核酸は、増幅の鋳型として働く。増幅後、元の鋳型は、捕捉部分に連結されたままであるが、アンプリコンは捕捉部分に連結されない。

【0157】

捕捉部分は、増幅および／またはシーケンシングプライマー結合部位も提供し得るアダプターの成分としての試料核酸に連結され得る。いくつかの方法では、試料核酸は、アダプターに、両末端で連結され、両アダプターは捕捉部分を有する。好ましくは、アダプター中の任意のシトシン残基は、バイサルファイトの作用から保護するために５メチルシトシンなどによって修飾される。いくつかの例では、捕捉部分は、切断可能な連結（例えば、光切断可能なデスチオビオチン－ＴＥＧまたはＵＳＥＲ（商標）酵素、Chem. Commun.
(Camb).、２０１５年２月２１日；５１巻（１５号）：３２６６～３２６９頁を用い
て切断可能なウラシル残基）によって元の鋳型に連結され、その場合には、捕捉部分は、必要に応じて除去され得る。

【0158】

アンプリコンを変性し、捕捉タグのための親和性試薬と接触させる。元の鋳型は、親和性試薬と結合するが、増幅から得られた核酸分子は結合しない。したがって、元の鋳型を、増幅から得られた核酸分子から分離できる。

【0159】

分離または分割後、それぞれの核酸の集団（すなわち、元の鋳型および増幅産物）を、バイサルファイト処理に付し、元の鋳型集団は、バイサルファイト処理を受け、増幅産物は受けないことができる。あるいは、増幅産物をバイサルファイト処理に付し、元の鋳型集団は、付さないことができる。このような処理後、それぞれの集団は、増幅され得る（元の鋳型集団が、ウラシルをチミンに変換する場合には）。集団をまた、濃縮のためにビオチンプローブハイブリダイゼーションに付すことができる。次いで、それぞれの集団を解析し、配列を比較して、どのシトシンが元のものにおいて５－メチル化（または５－ヒドロキシルメチル化）されていたかを決定する。鋳型集団中のＴヌクレオチド（ウラシルに変換された非メチル化シトシンに対応する）および増幅された集団の対応する位置でのＣヌクレオチドの検出は、未修飾Ｃを示す。元の鋳型および増幅された集団の対応する位置でのＣの存在は、元の試料中の修飾されたＣを示す。

【0160】

いくつかの実施形態では、方法は、分子タグが付けられたＤＮＡライブラリーの逐次ＤＮＡ－ｓｅｑおよびバイサルファイト－ｓｅｑ（ＢＩＳ－ｓｅｑ）ＮＧＳライブラリー調製を使用する（図４を参照のこと）。このプロセスは、アダプターの標識（例えば、ビオチン）、全ライブラリーのＤＮＡ－ｓｅｑ増幅、親分子回収（例えば、ストレプトアビジンビーズプルダウン）、バイサルファイト変換およびＢＩＳ－ｓｅｑによって実施される。いくつかの実施形態では、方法は、バイサルファイト処理を用いるおよび用いない、親ライブラリー分子の逐次ＮＧＳ調製用増幅によって一塩基解像度で５－メチルシトシンを同定する。これは、２つのアダプター鎖の一方で、ＢＩＳ－ｓｅｑにおいて使用される５－メチル化ＮＧＳ－アダプター（方向性アダプター；５－メチルシトシン置換を有するＹ型／分岐したもの）を、標識（例えば、ビオチン）を用いて修飾することによって達成できる。試料ＤＮＡ分子を、アダプターライゲーションし、増幅する（例えば、ＰＣＲによって）。親分子のみが標識されたアダプター末端を有するので、それらを標識特異的捕捉方法（例えば、ストレプトアビジン磁気ビーズ）によってその増幅された後代から選択的に回収することができる。親分子は、５－メチル化マークを保持するので、捕捉されたライブラリーでのバイサルファイト変換は、対応するＤＮＡ－ｓｅｑの分子情報を保持しながらＢＩＳ－ｓｅｑ時に一塩基解像度の５－メチル化状態をもたらす。いくつかの実施形態では、標準マルチプレックス化ＮＧＳワークフローにおける試料タグＤＮＡ配列の付加によって、濃縮／ＮＧＳに先立ってバイサルファイト処理ライブラリーを未処理ライブラリーと組み合わせてもよい。ＢＩＳ－ｓｅｑワークフローと同様に、ゲノムアラインメントおよび５－メチル化塩基同定のためにバイオインフォマティクス解析を実施してもよい。要するに、この方法は、ライブラリー増幅後に、５－メチルシトシンマークを保持する、親の、ライゲーションされた分子を選択的に回収する能力を提供し、それによってバイサルファイト変換されたＤＮＡの並行処理を可能にする。これは、ワークフローから抽出されたＤＮＡ－ｓｅｑ情報の品質／感度に対するバイサルファイト処理の破壊的性質を克服する。この方法を用いると、回収されたライゲーションされた親ＤＮＡ分子（標識されたアダプターによって）は、完全なＤＮＡライブラリーの増幅およびエピジェネティックＤＮＡ修飾を誘発する処理の並行適用が可能となる。本開示は、シトシン５－メチル化（５－メチルシトシン）を同定するためのＢＩＳ－ｓｅｑ方法の使用を論じるが、これは、制限ではない。ヒドロキシメチル化シトシン（５ｈｍＣ；ＯＸ－ＢＳ－ｓｅｑ、ＴＡＢ－ｓｅｑ）、ホルミルシトシン（５ｆＣ；ｒｅｄＢＳ－ｓｅｑ）およびカルボキシルシトシンを同定するためのＢＩＳ－ｓｅｑの変種が開発されている。これらの方法論は、本明細書において記載される逐次／並行ライブラリー調製を用いて実行できる。

【0161】

修飾された核酸解析の代替方法

【0162】

本開示は、修飾された核酸（例えば、メチル化された、ヒストンに連結されたおよび上記で論じられたその他の修飾）を解析するための代替方法を提供する。いくつかのこのような方法では、修飾の程度に応じる集団の分画の前に、異なる程度（例えば、核酸分子１つあたり０、１、２、３、４、５個またはそれより多いメチル基）に修飾を有する核酸の集団を、アダプターと接触させる。アダプターは、集団中の核酸分子の一方の末端または両方の末端のいずれかに付着する。好ましくは、アダプターは、タグの組合せの数が低確率をもたらす十分な数の異なるタグを含み、例えば、同一開始および停止点を有する２種の核酸の９５、９９または９９．９％が、同一組合せのタグを受け取る。アダプターの付着後、核酸が、アダプター内のプライマー結合部位に結合するプライマーから増幅される。アダプターは、同一タグを有するか、異なるタグを有するかにかかわらず、同一または異なるプライマー結合部位を含み得るが、アダプターは、同一プライマー結合部位を含むことが好ましい。増幅後、核酸を、好ましくは修飾を有する核酸と結合する作用物質（これまでに記載されたこのような作用物質など）と接触させる。核酸が、作用物質との結合からの修飾を有する程度が異なる、少なくとも２種の分割物中に核酸を分離する。例えば、作用物質が、修飾を有する核酸に対して親和性を有する場合には、修飾が過剰提示される核酸は（集団における中央値提示と比較して）、作用物質と優先的に結合するが、修飾について提示不足である核酸は、結合しない、または作用物質からより容易に溶出される。分離後、次いで異なる分割物を、通常、並行してであるが個別に、さらなる増幅および配列解析を含むさらなる処理ステップに付すことができる。次いで、異なる分割物からの配列データを比較できる。

【0163】

このような分離を実施するための例示的スキームは、図５に示されている。核酸を、プライマー結合部位およびタグを含むＹ型アダプターの両末端に連結する。分子を増幅する。次いで、増幅された分子を、５－メチルシトシンと優先的に結合する抗体と接触させることによって分画して、２種の分割物を得る。一方の分割物は、メチル化を欠く元の分子およびメチル化が失われている増幅コピーを含む。他方の分割物は、メチル化を有する元のＤＮＡ分子を含む。次いで、２種の分割物を処理し、メチル化分割物のさらなる増幅を用いて別個にシーケンシングする。次いで、２種の分割物の配列データを比較できる。この例では、タグは、メチル化および非メチル化ＤＮＡ間を区別するために使用されず、むしろ、これらの分割物内の異なる分子間を区別するために使用され、その結果、同一開始および停止点を有する読み取りデータが、同一分子に基づくか、異なる分子に基づくかを決定することができる。

【0164】

本開示は、核酸のうち少なくとも一部が、１個または複数の修飾されたシトシン残基、例えば、５－メチルシトシンおよびこれまでに記載されたその他の修飾のいずれかを含む核酸の集団を解析するためのさらなる方法を提供する。これらの方法では、核酸の集団を、１個または複数の、５Ｃ位で修飾されたシトシン残基、例えば、５－メチルシトシンを含むアダプターと接触させる。このようなアダプター中のすべてのシトシン残基も修飾されている、またはアダプターのプライマー結合領域中のすべてのこのようなシトシンが修飾されていることが好ましい。アダプターは、集団中の核酸分子の両末端に付着する。好ましくは、アダプターは、タグの組合せの数が低確率をもたらす十分な数の異なるタグを含み、例えば、同一開始および停止点を有する２種の核酸の９５、９９または９９．９％が、同一組合せのタグを受け取る。このようなアダプター中のプライマー結合部位は、同一である場合も異なる場合もあるが、同一であることが好ましい。アダプターの付着後、核酸が、アダプターのプライマー結合部位に結合するプライマーから増幅される。増幅された核酸を、第１および第２のアリコートに分ける。第１のアリコートを、さらなる処理を用いて、または用いずに配列データについてアッセイする。第１のアリコート中の分子に関する配列データは、核酸分子の最初のメチル化状態にかかわらず、このように決定される。第２のアリコート中の核酸分子を、バイサルファイトを用いて処理する。この処理は、未修飾シトシンをウラシルに変換する。次いで、バイサルファイト処理された核酸を、核酸に連結されたアダプターの元のプライマー結合部位に対するプライマーによってプライムされる増幅に付す。これらの核酸は、アダプターのプライマー結合部位中にシトシンを保持するので、（その増幅産物とは異なり）アダプターに元々連結された核酸分子のみが、ここで増幅可能であるが、増幅産物は、これらのシトシン残基のメチル化を失っており、バイサルファイト処理においてウラシルへの変換を受けている。したがって、少なくとも一部がメチル化されている集団中の元の分子のみが、増幅を起こす。増幅後、これらの核酸を、配列解析に付す。第１および第２のアリコートから決定された配列の比較によって、中でも、核酸集団中のどのシトシンがメチル化を受けたかを示すことができる。

【0165】

この解析のための例示的スキームは、図６に示されている。メチル化ＤＮＡを、プライマー結合部位およびタグを含む両末端でＹ型アダプターに連結する。アダプター中のシトシンは、５－メチル化されている。プライマーのメチル化は、その後のバイサルファイトステップにおいてプライマー結合部位を保護するように働く。アダプターの付着後、ＤＮＡ分子を増幅する。バイサルファイト処理を用いるおよび用いないシーケンシングのために、増幅産物を２つのアリコートに分ける。バイサルファイトシーケンシングに付されないアリコートを、さらなる処理を用いて、または用いずに配列解析に付すことができる。もう一方のアリコートを、バイサルファイトを用いて処理し、これによって、非メチル化シトシンがウラシルに変換される。シトシンのメチル化によって保護されたプライマー結合部位のみが、元のプライマー結合部位に特異的なプライマーと接触させたときに増幅を支持し得る。したがって、元の分子のみがさらなる増幅に付され、第１の増幅からのコピーは付されない。次いで、さらに増幅された分子を配列解析に付す。次いで、２つのアリコートからの配列を比較できる。図５におけるように、アダプター中の核酸タグは、メチル化および非メチル化ＤＮＡ間を区別するために使用されず、同一分割物内の核酸分子を区別するために使用される。

【0166】

Ｖ．方法の一般特性
１．試料
試料は、対象から単離された任意の生体試料であり得る。試料は、身体試料であり得る。試料として、既知または疑われる固形腫瘍、全血、血小板、血清、血漿、便、赤血球、白血球（ｗｈｉｔｅｂｌｏｏｄｃｅｌｌ）または白血球（ｌｅｕｃｏｃｙｔｅ）、内皮細胞、組織生検、脳脊髄液滑液、リンパ液、腹水、間質性または細胞外液、歯肉溝滲出液を含む細胞間空間中の流体、骨髄、胸水、脳脊髄液、唾液、粘液、痰、精液、汗、尿などの体組織を挙げることができる。試料は、体液、特に、血液およびその画分ならびに尿が好ましい。試料は、対象から元々単離された形態であってもよく、あるいは細胞などの成分を除去もしくは付加するために、またはある成分を別のものに対して濃縮するためにさらなる処理に付されていてもよい。したがって、解析にとって好ましい体液は、無細胞核酸を含有する血漿または血清である。試料を、対象から単離または得て、試料解析の場所に輸送してもよい。試料を、望ましい温度、例えば、室温、４℃、－２０℃および／または－８０℃で保存し、発送してもよい。試料を、試料解析の場所で対象から単離または得てもよい。対象は、ヒト、哺乳動物、動物、コンパニオンアニマル、介助動物またはペットであり得る。対象は、がんを有し得る。対象は、がんまたは検出可能ながんの症状を有さない場合もある。対象は、１種または複数のがん療法、例えば、化学療法、抗体、ワクチンまたは生物製剤のうち任意の１種または複数で処置されている場合もある。対象は、緩解状態にあり得る。対象は、がんまたは任意のがん関連遺伝的突然変異／障害に対して感受性であると診断されている場合も、診断されていない場合もある。

【0167】

血漿の体積は、シーケンシングされる領域の所望の読み取りデータ深度に応じて変わり得る。例示的体積は、０．４～４０ｍｌ、５～２０ｍｌ、１０～２０ｍｌである。例えば、体積は、０．５ｍＬ、１ｍＬ、５ｍＬ１０ｍＬ、２０ｍＬ、３０ｍＬまたは４０ｍＬであり得る。試料採取される血漿の体積は、５～２０ｍＬであり得る。

【0168】

試料は、ゲノム等価物を含有する種々の量の核酸を含み得る。例えば、約３０ｎｇのＤＮＡの試料は、約１０，０００（１０^４）ハプロイドのヒトゲノム等価物を、ｃｆＤＮＡの場合には、約２０００億（２×１０^１１）の個々のポリヌクレオチド分子を含有し得る。同様に、約１００ｎｇのＤＮＡの試料は、約３０，０００ハプロイドヒトゲノム等価物を、ｃｆＤＮＡの場合には、約６０００億の個々の分子を含有し得る。

【0169】

試料は、種々の供給源に由来する、例えば、同一対象の細胞および無細胞物に由来する、異なる対象の細胞および無細胞物に由来する核酸を含み得る。試料は、突然変異を保持する核酸を含み得る。例えば、試料は、生殖系列突然変異および／または体細胞突然変異を保持するＤＮＡを含み得る。生殖系列突然変異とは、対象の生殖系列ＤＮＡ中に存在する突然変異を指す。体細胞突然変異とは、対象の体細胞、例えば、がん細胞を端緒とする突然変異を指す。試料は、がん関連突然変異（例えば、がん関連体細胞突然変異）を保持するＤＮＡを含み得る。試料は、エピジェネティックバリアント（すなわち、化学またはタンパク質修飾）を含んでもよく、エピジェネティックバリアントは、がん関連突然変異などの遺伝的変異の存在と関連する。いくつかの実施形態では、試料は、遺伝的変異の存在と関連するエピジェネティックバリアントを含み、試料は、遺伝的変異を含まない。

【0170】

増幅前の試料中の無細胞核酸の例示的量は、約１ｆｇ～約１μｇ、例えば、１ｐｇ～２００ｎｇ、１ｎｇ～１００ｎｇ、１０ｎｇ～１０００ｎｇの範囲である。例えば、量は、最大約６００ｎｇ、最大約５００ｎｇ、最大約４００ｎｇ、最大約３００ｎｇ、最大約２００ｎｇ、最大約１００ｎｇ、最大約５０ｎｇまたは最大約２０ｎｇの無細胞核酸分子であり得る。量は、少なくとも１ｆｇ、少なくとも１０ｆｇ、少なくとも１００ｆｇ、少なくとも１ｐｇ、少なくとも１０ｐｇ、少なくとも１００ｐｇ、少なくとも１ｎｇ、少なくとも１０ｎｇ、少なくとも１００ｎｇ、少なくとも１５０ｎｇまたは少なくとも２００ｎｇの無細胞核酸分子であり得る。量は、最大１フェムトグラム（ｆｇ）、１０ｆｇ、１００ｆｇ、１ピコグラム（ｐｇ）、１０ｐｇ、１００ｐｇ、１ｎｇ、１０ｎｇ、１００ｎｇ、１５０ｎｇまたは２００ｎｇの無細胞核酸分子であり得る。方法は、１フェムトグラム（ｆｇ）～２００ｎｇを得るステップを含み得る。

【0171】

無細胞核酸は、細胞内に含有されない、もしくはそうでなければ細胞に結合されない核酸、または言い換えれば、無傷の細胞を除去した後に試料中に残存している核酸である。無細胞核酸は、ゲノムＤＮＡ、ミトコンドリアＤＮＡ、ｓｉＲＮＡ、ｍｉＲＮＡ、循環ＲＮＡ（ｃＲＮＡ）、ｔＲＮＡ、ｒＲＮＡ、核小体低分子ＲＮＡ（ｓｎｏＲＮＡ）、Ｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）、長鎖ノンコーディングＲＮＡ（ｌｏｎｇｎｃＲＮＡ）またはこれらのいずれかの断片を含む、ＤＮＡ、ＲＮＡおよびそのハイブリッドを含む。無細胞核酸は、二本鎖、一本鎖またはそのハイブリッドであり得る。無細胞核酸は、分泌または細胞死プロセス、例えば、細胞壊死およびアポトーシスによって体液中に放出され得る。いくつかの無細胞核酸、例えば、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）が、がん細胞から体液中に放出される。その他のものは、健康な細胞から放出される。いくつかの実施形態では、ｃｆＤＮＡは、無細胞胎児ＤＮＡ（ｃｆｆＤＮＡ）であるいくつかの実施形態では、無細胞核酸は、腫瘍細胞によって産生される。いくつかの実施形態では、無細胞核酸は腫瘍細胞および非腫瘍細胞の混合物によって産生される。

【0172】

無細胞核酸は、約１００～５００ヌクレオチドの例示的サイズ分布を有し、１１０～約２３０ヌクレオチドの分子が分子の約９０％に相当し、約１６８ヌクレオチドの最頻値を有し、２４０～４４０ヌクレオチドの間の範囲に第２のわずかなピークを有する。

【0173】

無細胞核酸は、溶液中に見られるような無細胞核酸が、無傷の細胞および体液のその他の非可溶性成分から分離される分画または分割ステップによって体液から単離できる。分割は、遠心分離または濾過などの技術を含み得る。あるいは、体液中の細胞を溶解し、無細胞および細胞性核酸を一緒に処理してもよい。一般的に、バッファーの添加および洗浄ステップ後、核酸をアルコールを用いて沈殿させることができる。シリカベースのカラムなどのさらなる精製ステップを使用して、夾雑物または塩を除去してもよい。収率などの手順のある特定の態様を最適化するために反応を通じて、Ｃ_ｏｔ－１ＤＮＡなどの非特異的バルク担体核酸、バイサルファイトシーケンシング、ハイブリダイゼーションおよび／またはライゲーションのためのＤＮＡまたはタンパク質を添加してもよい。

【0174】

このような処理後、試料は、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡを含む種々の形態の核酸を含み得る。いくつかの実施形態では、一本鎖ＤＮＡおよびＲＮＡは、二本鎖形態に変換され、したがって、それらは、その後の処理および解析ステップに含まれ得る。

【0175】

２．アダプターへのＤＮＡ分子の連結
試料中の二本鎖ＤＮＡ分子および二本鎖ＤＮＡ分子に変換された一本鎖ＲＮＡまたはＤＮＡ分子を、アダプターに、いずれか一方の末端または両末端で連結してもよい。通常、二本鎖分子を、４種すべての標準ヌクレオチドの存在下での５’－３’ポリメラーゼおよび３’－５’エキソヌクレアーゼ（またはプルーフリーディング機能）を有するポリメラーゼを用いる処理によって平滑末端とする。クレノウ大断片およびＴ４ポリメラーゼは、適したポリメラーゼの例である。平滑末端化ＤＮＡ分子を、少なくとも部分的に二本鎖のアダプター（例えば、Ｙ型またはベル型アダプター）とライゲーションさせることができる。あるいは、相補的ヌクレオチドを、試料核酸およびアダプターの平滑末端に付加して、ライゲーションを容易にすることができる。平滑末端ライゲーションおよび粘着末端ライゲーションの両方が本明細書において考慮される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が平滑末端を有する。粘着末端ライゲーションでは、通常、核酸分子は、「Ａ」オーバーハングを有し、アダプターは、「Ｔ」オーバーハングを有する。

【0176】

３．増幅
アダプターと隣接する試料核酸を、ＰＣＲおよびその他の増幅方法によって増幅することができる。増幅は、通常、増幅されるべきＤＮＡ分子に隣接するアダプター中のプライマー結合部位に結合するプライマーによってプライムされる。増幅方法は、熱サイクルに起因する変性、アニーリングおよび伸長のサイクルを含む場合もあり、転写媒介増幅におけるように等温である場合もある。その他の増幅方法として、リガーゼ連鎖反応、鎖置換増幅、核酸配列ベースの増幅および自家持続性配列ベースの複製が挙げられる。

【0177】

好ましくは、本方法は、Ｔ尾部およびＣ尾部アダプターを用いるｄｓＤＮＡ「Ｔ／Ａライゲーション」を実施し、その結果、アダプターとの連結前の二本鎖核酸の少なくとも５０、６０、７０または８０％の増幅が得られる。好ましくは、本方法は、Ｔ尾部アダプター単独を用いて実施される対照方法に対して、増幅される分子の量または数を、少なくとも１０、１５または２０％増大する。

【0178】

４．タグ
バーコードを含むタグを、アダプターに組み込む、またはそうでなければつなげることができる。タグは、その他の方法の中でもライゲーション、オーバーラップ伸長ＰＣＲによって組み込むことができる。

【0179】

分子タグ付け戦略

【0180】

分子タグ付けとは、配列読み取りデータが起因する分子を区別することを可能にするタグ付け実行を指す。タグ付け戦略は、独特のタグ付けおよび非独特タグ付け戦略に分けることができる。独特のタグ付けでは、試料中のすべてまたは実質的にすべての分子が異なるタグを有し、その結果、タグ情報のみに基づいて、読み取りデータを元の分子に割り当てることができる。このような方法において使用されるタグは、「独特のタグ」と呼ばれることもある。非独特タグ付けでは、同一試料中の異なる分子が、同一タグを有することがあり、その結果、配列読み取りデータを元の分子に割り当てるために、タグ情報に加えて、その他の情報が使用される。このような情報は、開始および停止座標、分子がマッピングされる座標、開始または停止座標単独などを含み得る。このような方法において使用されるタグは、「非独特タグ」と呼ばれることもある。したがって、試料中のどの分子にも必ずしも独特にタグを付ける必要はない。試料内の同定可能なクラス内に入る分子に独特にタグを付けることで十分である。したがって、異なる同定可能なファミリー中の分子は、タグが付けられた分子の同一性に関する情報を失わずに、同一タグを有し得る。

【0181】

非独特タグ付けのある特定の実施形態では、使用される異なるタグの数は、特定の群のすべての分子が異なるタグを有するという極めて高い可能性（例えば、少なくとも９９％、少なくとも９９．９％、少なくとも９９．９９％または少なくとも９９．９９９％があるように十分であり得る。バーコードがタグとして使用される場合およびバーコードが、例えば、ランダムに分子の両末端に付着される場合には、バーコードの組合せは、一緒にタグを構成し得るということは注記されるべきである。この数は、用語では、コール中に入る分子の数の関数である。例えば、クラスは、参照ゲノム上の同一の開始－停止位置にマッピングされるすべての分子であり得る。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域（例えば、最大１００個の塩基または遺伝子または遺伝子のエクソン）にわたってマッピングされるすべての分子であり得る。ある特定の実施形態では、クラス中の分子の数、ｚを独特に同定するために使用される異なるタグの数は、２＊ｚ、３＊ｚ、４＊ｚ、５＊ｚ、６＊ｚ、７＊ｚ、８＊ｚ、９＊ｚ、１０＊ｚ、１１＊ｚ、１２＊ｚ、１３＊ｚ、１４＊ｚ、１５＊ｚ、Ｉ６＊ｚ、１７＊ｚ、１８＊ｚ、１９＊ｚ、２０＊ｚまたは１００＊ｚのいずれか（例えば、下限）と、１００，０００＊ｚ、１０，０００＊ｚ、１０００＊ｚまたは１００＊ｚのいずれか（例えば、上限）の間であり得る。

【0182】

例えば、約５ｎｇ～３０ｎｇの無細胞ＤＮＡの試料中、特定のヌクレオチド座標におよそ３０００分子がマッピングされ、約３から１０の間の分子が任意の開始座標を有し、同一の停止座標を共有すると予測される。したがって、すべてのこのような分子に独特にタグを付けるのに、約５０～約５０，０００種の異なるタグ（例えば、約６から２２０種の間のバーコード組合せ）で十分であり得る。ヌクレオチド座標にわたってマッピングされる３０００種の分子すべてに独特にタグを付けるには、約１００万～約２０００万種の異なるタグが必要となる。

【0183】

一般に、反応における独特または非独特タグバーコードの割り当ては、米国特許出願第２００１００５３５１９号、第２００３０１５２４９０号、第２０１１０１６００７８号、ならびに米国特許第６，５８２，９０８号および米国特許第７，５３７，８９８号および米国特許第９，５９８，７３１号によって記載される方法およびシステムに従う。タグは、試料核酸にランダムに連結されてもよく、または非ランダムに連結されてもよい。

【0184】

いくつかの実施形態では、タグが付けられた核酸を、マイクロウェルプレート中にロードした後にシーケンシングする。マイクロウェルプレートは、９６、３８４または１５３６のマイクロウェルを有し得る。いくつかの場合には、それらを、独特のタグのマイクロウェルに対する予測される比で導入する。例えば、ゲノム試料１種あたり約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００より多い独特のタグがロードされるように、独特のタグをロードしてもよい。いくつかの場合には、ゲノム試料１種あたり約２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００または１，０００，０００，０００未満の独特のタグがロードされるように、独特のタグをロードしてもよい。いくつかの場合には、試料ゲノム１種あたりロードされる独特のタグの平均数は、ゲノム試料１種あたり約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００もしくは１，０００，０００，０００未満または約１、２、３、４、５、６、７、８、９、１０、２０、５０、１００、５００、１０００、５０００、１００００、５０，０００、１００，０００、５００，０００、１，０００，０００、１０，０００，０００、５０，０００，０００もしくは１，０００，０００，０００より多い独特のタグである。

【0185】

好ましい形式は、標的核酸の両末端にライゲーションされた、２０～５０種の異なるタグバーコードを使用する。例えば、標的分子の両末端にライゲーションされた３５種の異なるタグバーコードは、３５×３５の順列（これは、３５種のタグバーコードについて１２２５に等しい）を作製する。同一の開始および停止点を有する異なる分子が、異なるタグの組合せを受け取る高い確率（例えば、少なくとも９４％、９９．５％、９９．９９％、９９．９９９％）を有するためには、このような数のタグで十分である。その他のバーコード組合せは、１０から５００の間、例えば、約１５×１５、約３５×３５、約７５×７５、約１００×１００、約２５０×２５０、約５００×５００の任意の数を含む。

【0186】

いくつかの場合には、独特のタグは、予め決定された、またはランダムまたは半ランダムな配列のオリゴヌクレオチドであり得る。その他の場合には、複数のバーコードを使用してもよく、その結果、バーコードは必ずしも複数において互いに独特ではない。この例では、バーコードを個々の分子にライゲーションしてもよく、その結果、バーコードおよびライゲーションされ得る配列の組合せが、独特の配列を作り出し、これを個別に追跡してもよい。本明細書において記載されるように、配列読み取りデータの始まり（開始）および終了（停止）部分の配列データと組み合わせた非独特バーコードの検出によって、独特の同一性を特定の分子に割り当てることが可能となり得る。個々の配列読み取りデータの塩基対の長さまたは数も、このような分子に独特の同一性を割り当てるために使用してもよい。本明細書において記載されるように、独特の同一性が割り当てられている核酸の一本鎖に由来する断片は、それによって、親の鎖に由来する断片のその後の同定を可能にし得る。

【0187】

５．標的濃縮
ある特定の実施形態では、試料中の核酸を、標的配列を有する分子が、その後の解析のために捕捉される標的濃縮に付すことができる。標的濃縮は、ビオチンなどの捕捉部分を用いて標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を含み得る。プローブは、遺伝子などの領域のパネル中にタイルを貼るように選択される配列を有し得る。いくつかの実施形態では、ベイトセットは、目的のより特異的に望まれる配列についてより高い相対濃度を有し得る。このようなベイトセットは、標的分子のベイトとのハイブリダイゼーションを可能にする条件下で試料と組み合わされる。次いで、捕捉部分を使用して、捕捉された分子を単離する。例えば、ビーズベースのストレプトアビジンによるビオチン捕捉部分。このような方法は、例えば、２０１７年２月７日に出願されたＵＳＳＮ１５／４２６，６６８（米国特許第９，８５０，５２３号、２０１７年１２月２６日に発行）にさらに記載されている。

【0188】

６．シーケンシング
先行する増幅を伴ってまたは伴わずに、アダプターに隣接する試料核酸をシーケンシングに付すことができる。シーケンシング方法として、例えば、サンガー（Ｓａｎｇｅｒ）シーケンシング、ハイスループットシーケンシング、パイロシーケンシング、合成によるシーケンシング、単一分子シーケンシング、ナノポアシーケンシング、半導体シーケンシング、ライゲーションによるシーケンシング、ハイブリダイゼーションによるシーケンシング、ＲＮＡ－Ｓｅｑ（Ｉｌｌｕｍｉｎａ）、デジタル遺伝子発現（Ｈｅｌｉｃｏｓ）、次世代シーケンシング（ＮＧＳ）、合成による単一分子シーケンシング（ＳＭＳＳ）（Ｈｅｌｉｃｏｓ）、大量並列シーケンシング、クローナル単一分子アレイ（Ｓｏｌｅｘａ）、ショットガンシーケンシング、ＩｏｎＴｏｒｒｅｎｔ、ＯｘｆｏｒｄＮａｎｏｐｏｒｅ、ＲｏｃｈｅＧｅｎｉａ、マキシム－ギルバート（Ｍａｘｉｍ－Ｇｉｌｂｅｒｔ）シーケンシング、プライマーウォーキング、ＰａｃＢｉｏを使用するシーケンシング、ＳＯＬｉＤ、ＩｏｎＴｏｒｒｅｎｔまたはＮａｎｏｐｏｒｅプラットフォームが挙げられる。シーケンシング反応は、複数のレーン、複数のチャネル、複数のウェルまたは複数の試料セットを実質的に同時に処理するその他の手段であり得る種々の試料処理ユニットで実施できる。試料処理ユニットはまた、複数の実施を同時に処理可能にする複数の試料チャンバーを含み得る。

【0189】

シーケンシング反応は、１またはそれより多い形態（one more forms）の核酸で実施でき、そのうち少なくとも１つは、がんのまたはその他の疾患のマーカーを含有するとわかっている。シーケンシング反応はまた、試料中に存在する任意の核酸断片で実施できる。シーケンシング反応は、少なくとも５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％のゲノムの配列カバー度を提供し得る。その他の場合には、ゲノムの配列カバー度は、５％、１０％、１５％、２０％、２５％、３０％、４０％、５０％、６０％、７０％、８０％、９０％、９５％、９９％、９９．９％または１００％未満であり得る。配列カバー度は、少なくとも５、１０、２０、７０、１００、２００もしくは５００種の異なる遺伝子、または最大でも５０００、２５００、１０００、５００もしくは１００種の異なる遺伝子で実施してもよい。

【0190】

同時シーケンシング反応は、マルチプレックスシーケンシングを使用して実施してもよい。いくつかの場合には、少なくとも１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００のシーケンシング反応を用いて無細胞核酸をシーケンシングしてもよい。その他の場合には、１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００未満のシーケンシング反応を用いて無細胞核酸をシーケンシングしてもよい。シーケンシング反応は、逐次実施しても、同時に実施してもよい。その後のデータ解析は、シーケンシング反応のすべてで実施しても、一部で実施してもよい。いくつかの場合には、データ解析は、少なくとも１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００のシーケンシング反応で実施してもよい。その他の場合には、データ解析を１０００、２０００、３０００、４０００、５０００、６０００、７０００、８０００、９０００、１００００、５００００、１００，０００未満のシーケンシング反応で実施してもよい。例示的読み取りデータ深度は、遺伝子座（塩基）１つあたり１０００～５００００読み取りデータである。

【0191】

７．解析
本方法を使用して、状態を特徴付ける（例えば、がんをステージ分類する、またはがんの不均一性を決定する）ため、状態の処置に対する応答をモニタリングするため、状態を発生する、または状態のその後の経過の有効な予後リスクのために、対象における状態、特に、がんの存在を診断できる。本開示はまた、特定の処置選択肢の有効性の決定において有用であり得る。処置が成功する場合には、より多くのがんが死滅し、ＤＮＡを流し出す可能性があるので、成功する処置選択肢は、対象の血液において検出されるコピー数変異または希少突然変異の量を増大させ得る。その他の例では、これは、起こらない可能性がある。別の例では、おそらくある特定の処置選択肢は、経時的にがんの遺伝子プロファイルと相関し得る。この相関は、療法の選択において有用であり得る。さらに、がんが、処置後に緩解状態にあると観察される場合には、本方法を使用して、残存する疾患または疾患の再発をモニタリングできる。

【0192】

検出され得るがんの種類および数は、血液がん、脳がん、肺がん、皮膚がん、鼻がん、咽頭がん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、甲状腺がん、膀胱がん、腎臓がん、口腔がん、胃がん、固体状態腫瘍、不均一腫瘍、均一腫瘍などを含み得る。がんの種類および／またはステージは、突然変異、希少突然変異、挿入欠失、コピー数変異、トランスバージョン、転位置、反転、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造の変化、遺伝子融合、染色体融合、遺伝子末端切断、遺伝子増幅、遺伝子重複、染色体病変、ＤＮＡ病変、核酸の化学修飾における異常な変化、エピジェネティックパターンにおける異常な変化および核酸５－メチルシトシンにおける異常な変化を含む遺伝的変異から検出され得る。

【0193】

遺伝子データはまた、特定の形態のがんを特徴付けるために使用できる。がんは、組成およびステージ分類の両方において不均一であることが多い。遺伝子プロファイルデータは、その特定の亜種の診断または処置において重要であり得る、がんの特定の亜種を特徴付けることを可能にし得る。この情報はまた、対象または施術者に特定の種類のがんの予後に関する手がかりを提供し、対象または施術者のいずれかが、疾患の進行に従って処置選択肢を適合させることを可能にし得る。いくつかのがんは、より攻撃的に、遺伝子的に不安定になるように進行し得る。その他のがんは、良性で、不活性または休止状態のままであり得る。本開示のシステムおよび方法は、疾患進行の決定において有用であり得る。

【0194】

本解析はまた、特定の処置選択肢の有効性の決定において有用である。処置が成功する場合には、より多くのがんが死滅し、ＤＮＡを流し出す可能性があるので、成功する処置選択肢は、対象の血液において検出されるコピー数変異または希少突然変異の量を増大させ得る。その他の例では、これは、起こらない可能性がある。別の例では、おそらくある特定の処置選択肢は、経時的にがんの遺伝子プロファイルと相関し得る。この相関は、療法の選択において有用であり得る。さらに、がんが、処置後に緩解状態にあると観察される場合には、本方法を使用して、残存する疾患または疾患の再発をモニタリングできる。

【0195】

本方法はまた、がん以外の状態において遺伝的変異を検出するために使用できる。Ｂ細胞などの免疫細胞は、ある特定の疾患の存在時に迅速なクローン性増殖を起こし得る。クローン性増殖は、コピー数変異検出を使用してモニタリングしてもよく、ある特定の免疫状態をモニタリングしてもよい。この例では、コピー数変異解析を経時的に実施して、特定の疾患がどのように進行し得るのかのプロファイルを作成してもよい。コピー数変異またはさらには希少突然変異検出を使用して、病原体の集団が、どのように感染の過程の間に変化するかを決定してもよい。これは、ＨＩＶ／ＡＩＤＳまたは肝炎感染症などの慢性感染の際に特に重要であり得、それによって、ウイルスが、感染の過程の間に、生活環状態を変化させ、および／またはより病原性の形態に突然変異し得る。本方法を、免疫細胞が移植組織を破壊しようとする際の、宿主身体の拒絶活性を決定する、またはプロファイルして、移植組織の状態をモニタリングし、ならびに処置の過程を変更するまたは拒絶を予防するために使用してもよい。

【0196】

さらに、本開示の方法を、対象における異常な状態の不均一性を特徴付けるために使用してもよい。このような方法は、例えば、対象に由来する細胞外ポリヌクレオチドの遺伝子プロファイルを作成することを含むことがあり、遺伝子プロファイルは、コピー数変異および希少突然変異解析に起因する複数のデータを含む。いくつかの実施形態では、異常な状態はがんである。いくつかの実施形態では、異常な状態は、不均一ゲノム集団をもたらすものであり得る。がんの例では、いくつかの腫瘍が、がんの異なるステージの腫瘍細胞を含むとわかっている。その他の例では、不均一性は、複数の病巣を含み得る。やはり、がんの例では、おそらくは、１つまたは複数の病巣が、原発部位から広がった転移の結果である複数の腫瘍病巣がある場合がある。

【0197】

本方法は、不均一疾患中の異なる細胞に由来する遺伝情報の総和である、フィンガープリントまたはデータのセットを作成する、またはプロファイルするために使用してもよい。このデータのセットは、コピー数変異および突然変異解析を単独または組み合わせて含み得る。

【0198】

本方法を、がんまたはその他の疾患を診断、予後予測、モニタリングまたは観察するために使用してもよい。いくつかの実施形態では、本明細書における方法は、胎児を診断すること、予後予測することまたはモニタリングすることを含まず、したがって、非侵襲的出生前検査を対象としない。その他の実施形態では、これらの方法論を、そのＤＮＡおよびその他のポリヌクレオチドが、母体の分子と共循環し得るまだ生まれていない対象におけるがんまたはその他の疾患を診断、予後予測、モニタリングまたは観察するために、妊娠中の対象において使用してもよい。

【0199】

ＮＧＳによるＭＢＤ－ビーズ分割されたライブラリーの分子タグ同定のための例示的方法は、以下のとおりである：
１．下流処理のためにプロセスからのすべての溶出物を残しておきながら、メチル結合ドメインタンパク質－ビーズ精製キットを使用して抽出されたＤＮＡ試料（例えば、ヒト試料から抽出された血漿ＤＮＡ）を物理的に分画すること。
２．各画分に差次的分子タグおよびＮＧＳを可能にするアダプター配列を並行適用すること。例えば、高メチル化、残存メチル化（「洗浄」）および低メチル化分割物を、分子タグを有するＮＧＳアダプターとライゲーションさせる。
３．すべての分子タグが付けられた分割物を再度組み合わせて、アダプター特異的ＤＮＡプライマー配列を使用して続いて増幅すること。
４．再度組み合わされ、増幅された総ライブラリーを、目的のゲノム領域（例えば、がん特異的遺伝的変異および差次的にメチル化された領域）を標的としながら濃縮／ハイブリダイゼーションすること。
５．試料タグを付加しながら、濃縮された総ＤＮＡライブラリーを再度増幅すること。異なる試料をプールし、ＮＧＳ機器で多重でアッセイする。
６．独特の分子を同定するために使用される分子タグと、同様に、差次的にＭＢＤ分割された分子への試料のデコンボリューションを用いる、ＮＧＳデータのバイオインフォマティクス解析。この解析は、標準遺伝子シーケンシング／遺伝的変異検出と一致する、ゲノム領域についての相対的な５－メチルシトシンに関する情報をもたらし得る。

【0200】

ＶＩ．開示を実行する様式
本開示は、無細胞核酸（ｃｆＮＡ）集団を、１つまたは複数の類似する特徴を共有する分割物に分割することを含む方法を提供する。

【0201】

本開示の方法は、一本鎖核酸（ｓｓＮＡ；ｓｓＤＮＡ、ＲＮＡ）とｄｓＤＮＡを分割するように実施することが可能であり、ｄｓＤＮＡ分子は標準ライブラリー調製を通じて調製され、ｓｓＮＡは補助ライブラリー調製ワークフローで調製され、このワークフローは元の生体分子タイプ（すなわち、ＲＮＡ、ｓｓＤＮＡ、ｄｓＤＮＡ）についての情報を保持しつつ、ｓｓＮＡを濃縮、シーケンシング（例えば、ＮＧＳ）、および分析を施すことが可能な形態に変換する。

【0202】

ｃｆＮＡ包括的ライブラリー調製でのアプローチは、（ａ）ＲＮＡを同定可能なｓｓＤＮＡに変換することおよび（ｂ）並行するＮＧＳライブラリー調製のためにｓｓＤＮＡとｄｓＤＮＡ分子を分割すること、（ｃ）続いて、（任意選択の）標的濃縮、（ｄ）配列を用いて分子タイプを同定するためのＮＧＳおよび下流データ解析を含むことが可能である（図１参照）。

【0203】

いくつかの実施形態では、ｃｆＮＡ集団のｄｓＤＮＡ特異的ＮＧＳアダプターライゲーションを、ＲＮＡ分子タグ付け、特異的ライゲーション、ｃＤＮＡ変換、およびＮＧＳライブラリー調製に先立って実施することが可能である。同時シーケンシング法は、図２に示されるように、ｄｓＤＮＡ、次にＲＮＡがＮＧＳライブラリー作成のために分割なしで順次ライゲーションされるが、ｃｆＮＡ試料に適用可能である。

【0204】

いくつかの実施形態では、プラットホームライゲーションは、ｓｓＤＮＡ５’および３’末端を有するライゲーションされたｄｓ－ｃｆＤＮＡ分子を生成するＹ字型のまたは「分岐した」アダプターを使用する。これらの末端は、同時シーケンシングまたは従来のｓｓＤＮＡライブラリー調製法においてＲＮＡリガーゼ（またはＣｉｒｃｌｉｇａｓｅ（商標）ＩＩ）により誤ってライゲーションされることがある。Ｙ字型のアダプターの末端を「ヘアピン」または「バブル」に変更することにより、ライゲーションされたｃｆ－ｄｓＤＮＡ分子はもはやｓｓＤＮＡ末端がなく、同時シーケンシング／従来のＤＮＡライブラリー調製においてそれに続くｓｓＮＡライゲーションの基質ではなくなる。したがって、遊離のｓｓＤＮＡ末端を含有しないＮＧＳアダプターを新たに考案することにより、分子タイプの分割なしで、ｄｓＤＮＡワークフローに加えて、ＲＮＡおよびｓｓＤＮＡライブラリー調製が可能になる。

【0205】

本開示の方法は、分子タグ付け尾部を有する遺伝子特異的／ランダム／ポリＴＤＮＡプライマーを使用し、逆転写酵素を用いてｃｆＮＡ集団に実施し、それに続いてＲＮアーゼＨまたはＮａＯＨ加水分解によりＲＮＡを除去し、タグが付けられたｓｓＤＮＡ（ｃＤＮＡ）を産生してそれぞれのＲＮＡ分子を置換することが可能である。選択的ハイブリダイゼーションによるリボソームＲＮＡ枯渇などの、当業者には公知である追加の方法論を用いれば、望ましくないＲＮＡ配列を除去することが可能である。

【0206】

ｓｓＤＮＡは、ハイブリダイゼーションに先立つ標準変性ステップの省略により、ＮＡプローブによって選択的に捕捉することが可能である。ｓｓＤＮＡ－プローブハイブリッドは、当技術分野で公知の方法（例えば、ビオチン化ＤＮＡ／ＲＮＡプローブ、ストレプトアビジン－ビーズ磁石により捕捉される）によってｃｆＮＡ集団から単離することが可能である。プローブ配列は標的特異的であり、ｄｓＤＮＡワークフロー付きのパネル、そのワークフローのサブセットと同じであり、または異なっていることが可能である（例えば、エクソン－エクソン接合部でのＲＮＡ－融合、「ホットスポット」ＤＮＡ配列を標的にする）。さらに、すべてのｓｓＮＡは、デオキシイノシン、３－ニトロピロール、および５－ニトロインドールなどの「ユニバーサルヌクレオチド塩基」を有するプローブを利用することにより、このステップにおいて、配列にとらわれない方法で捕捉することが可能である。

【0207】

ＤＮＡシーケンシングにより同定される、ＳＮＶ、挿入欠失、遺伝子融合、およびＣＮＶなどの遺伝子変異に加えて、エピジェネティック変異（５－メチルシトシン、ヒストンメチル化、ヌクレオソーム位置付け、ならびにマイクロ－および長い非コードＲＮＡ発現）が、がんなどの疾患進行をもたらすまたはこれに関与することがある。エピジェネティックマーカーのハイスループットな測定は、エピジェネティックマークのタイプごとに特別に開発された複雑な分子生物学技法が必要である。したがって、エピジェネティックシーケンシングプロジェクトは典型的にはＤＮＡ（遺伝子）シーケンシングとは並行しており、大量の入力を必要とする。言い換えると、多分析物バイオマーカー検出は試料破壊を伴う。

【0208】

無細胞ＤＮＡの遺伝子（ＤＮＡ）シーケンシングとエピジェネティックシーケンシングの両方が、非侵襲性出生前検査（ＮＩＰＴ）およびがんモニタリング／検出にとって診断学的価値がある。両方の用途では、遺伝物質の量は限られており、稀な分子事象を同定するのが最重要である。したがって、現在の方法論を用いて、エピジェネティックシーケンシングを実施すれば、それぞれのタイプのマーカーが専用の試料を必要とするので、遺伝子バリアントを検出する感度が低下する。

【0209】

本開示は、ＤＮＡ５－メチルシトシンのエピジェネティック過程に関する情報を得る方法を提供するが、５－メチルシトシンについて概要を述べた「分子タグを用いた分割」法は他のエピジェネティック機構にも適用可能である。同様に、５－メチルシトシン（５ｍＣ）同定について本開示において概要を述べたように、ＮＧＳ－アダプターライゲーションされた親ＤＮＡ分子を標識し回収することを使用すれば、他のエピジェネティックＤＮＡ修飾マーカー（例えば、ヒドロキシメチル化、ホルミル、およびカルボキシル；それぞれ５ｈｍＣ、５ｆＣ、および５ｃａＣ）も同定することが可能になる。

【0210】

５－メチルシトシンに関して、バイサルファイトシーケンシングはこれまでもっとも普及しているアプローチであり、５－メチルシトシン塩基を一塩基の解像度で決定することができる。この方法は、すべてのシトシン塩基に作用する化学的処理（バイサルファイト）を含み、その塩基をそれが５－メチル化または５－ヒドロキシルメチル化されていなければウラシルに変換する。バイサルファイト処理に続くシーケンシングにより、５－メチル化シトシンおよび５－ヒドロキシメチル化シトシン残基はシトシンとして検出されることになり、非メチル化シトシン、５－ホルミルメチル化シトシン、および５－カルボキシルメチル化シトシンはチミンとして検出される。バイサルファイトシーケンシングの変形形態は、すでに記載されているが、５ｍＣ、５ｈｍＣ、５ｆＣ、および５ｃａＣをさらに区別することが可能である。このアプローチの主な弱みは、遺伝物質の大多数が失われることである。過酷なバイサルファイト処理は入力ＤＮＡの９９％未満を分解し、したがって、試料の分子複雑さおよび達成可能な検出限界を低減する。現在の分子生物学ＤＮＡ増幅技法（例えば、ＰＣＲ、ＬＡＭＰ、ＲＣＡ）はシトシンの５－メチル化状態にとらわれておらず、したがって、５－メチル化マークは増幅とともに失われる。これは液体生検の用途には極めて望ましくない。さらに、バイサルファイト変換ＤＮＡライブラリーを用いると、体細胞バリアントを検出するのがより困難になる（例えば、非メチル化シトシンからＣ－＞ＴＳＮＶを識別すること）。したがって、バイサルファイト処理ＤＮＡは液体生検の用途では遺伝子バリアント検出には使用されない。ＤＮＡに関する５－メチルシトシン分析および遺伝子バリアントコーリングを実施するには試料を分けることが必要となるが、これはそれぞれのワークフローにおける入力／検出の感度を低減し、単一分子上での５－メチルシトシン情報と遺伝子バリアントの両方の同定を妨げる。

【0211】

ある特定の実施形態では、核酸はメチル化差異に基づいて分割される。核酸の「高メチル化」および「低メチル化」形態は、使用される特定の分割法により識別されるメチル化の特定の程度を、それぞれ上回るおよび下回る分子として定義することが可能である。例えば、分割法は、少なくとも２つ、少なくとも３つ、少なくとも４つ、少なくとも５つまたは少なくとも６つのメチル化ヌクレオチドを有する分子を選択することができる。メチル化の程度とは、核酸断片におけるメチル化ヌクレオチドの数のことである。ＤＮＡ試料中相対的に「高メチル化」されているＤＮＡ分子を同定することは、メチル結合ドメイン（ＭＢＤ）タンパク質、またはその断片もしくはバリアントに結合する分子を捕捉することにより達成することが可能である。ＭＢＤはメチル－ＣｐＧ－結合ドメインと呼ぶことも可能である。ＭＢＤタンパク質は磁気ビーズと複合体化することが可能である。いくつかの実施形態では、ＭＢＤに結合するタンパク質は、ＭＥＣＰ２、ＭＢＤ１、ＭＢＤ２、ＭＢＤ３、ＭＢＤ４、またはその断片もしくはバリアントである。５－メチル化部位はこの方法（バイサルファイト変換ではない）で直接指示されるわけではないが、オーバーラップしている高メチル化断片のバイオインフォマティクス解析は５－メチルシトシンの特定の部位（複数可）を決定することが可能である。この方法の主要な欠点は、高メチル化分割物のみをシーケンシングすることにより、メチル化されていないヒトゲノムの大多数（約８０～９７質量％）がシーケンシングされず、このため遺伝子バリアント（例えば、ＳＮＶ、挿入欠失、およびＣＮＶ）の同定が妨げられる／制限されることである。なぜならば、これらのバリアントは低カバー度領域であるまたは高メチル化分割物には全く存在しないからである。

【0212】

本開示は、同じ低入力試料において稀な遺伝子バリアントを検出する（例えば、液体生検ワークフロー）ために、５－メチルシトシンデータを得るためのおよびシーケンシングデータを得るための方法を提供する。例えば、ＭＢＤ分画およびタグ付けを含むアプローチは試料中の核酸にとって破壊的ではなく、増幅後のゲノム複雑さを保存する。さらに、分画－タグ付けアプローチ（例えば、ＭＢＤ分画およびタグ付け）は、差次的に分割された核酸分子を再度組み合わせればゲノム複雑さの保存を確実にすることが可能であり、多分析物バイオマーカー検出（遺伝子バリアントおよびエピジェネティックバリアント）を可能にする。これとは対照的に、他のアプローチは試料中の核酸にとって破壊的である場合がある。こうした他のアプローチは、核酸分子の１つの画分または群のみが分析される場合（例えば、高メチル化核酸分子）には、バイサルファイトシーケンシング、メチル感受性制限酵素消化、およびＭＢＤ濃縮を含むことができる。例えば、バイサルファイトシーケンシングは核酸分子に物理的な損傷を生じさせる。メチル感受性制限酵素消化は、メチル化されていない画分を破壊することによりゲノム複雑さを低減し、メチル化された核酸のみを無傷のままにしておく。ＭＢＤ濃縮は、ＭＢＤ結合核酸分子のみを分析する場合には、同様に使用して試料中の単一画分の核酸のみを単離することができる。単一画分の核酸分子のみを分析するアプローチは、非濃縮部分に存在する核酸分子についての情報を破壊する。

【0213】

５－メチルシトシンデータ（または他のメチル化状態データ）を得るために本明細書で提供される方法は、一本鎖核酸および二本鎖核酸情報を得るための上記の方法と組み合わせて実行することが可能である。いくつかの実施形態では、本明細書の方法は、ＭＢＤ－ビーズにより様々な程度のメチル化に分割されているＤＮＡ分子を差次的にタグを付けることにより高メチル化ＤＮＡの％を定量化する（図３参照）。この方法では、ＭＢＤ分割プロトコールからのすべての溶出液は回収することが可能であり、ＮＧＳ－ライブラリーはそのＭＢＤ分割物に対応する分子タグの異なるセットを用いて調製することが可能である。したがって、ＭＢＤ分割プロセスは、典型的なバイサルファイト処理での存在する物質の喪失を低減する。ライゲーションされた分割物は増幅／濃縮／ＮＧＳ前に再度組み合わせることが可能なので、ＤＮＡシーケンシングワークフローにある欠点は最小である。ＭＢＤは二本鎖ＤＮＡ（ｄｓＤＮＡ）に結合し、したがって、ＭＢＤ分割は試料ＤＮＡの二本鎖性質を保持しており、感度の良いＤＮＡシーケンシング法による二本鎖分子タグ付けが可能になる。

【0214】

ＭＢＤ分割された分子タグＮＧＳワークフローでは、分子タグは２つの目的、すなわち、試料から独特のＤＮＡ分子を同定すること（タグとゲノム開始／終始座標の組み合わせにより）および分子の相対的５－メチルシトシンレベルを示すこと、にかなうことが可能である。分子タグを使用すれば、独特の核酸分子を同定し計数することが可能である。この情報を使用すれば増幅不均衡を計算することが可能になる。分子タグは試料の最初の複雑さを識別することを可能にする。分子タグ付けを使用すれば、不揃いな増幅がある場合でも試料中の核酸分子を同定し計数することが可能になる。上記の方法論は、５－メチルシトシンの程度による物理的分割、差次的分子タグの適用、ＤＮＡ－ｓｅｑと同時の、遺伝子シーケンシング／バリアント検出のために利用されるそれぞれの分子の端緒となる分割物の任意選択のライブラリーの再度の組み合わせ、濃縮、ＮＧＳおよびバイオインフォマティクスデコンボリューションを記載している。方法論は、メチル化結合タンパク質（ＭＢＤ）分割の代わりに、ＤＮＡ分子の二本鎖性質を保持する異なるＤＮＡ－およびタンパク質－結合エレメントを使用することにより、他のエピジェネティック相互作用を特徴づけることに拡張できる。例えば、種々の免疫沈降プロトコールにおいて使用されるヒストン、修飾ヒストン、および転写因子に対する抗体は、分子タグの異なるセットの使用を通じて、試料中のあらゆるＤＮＡ分子に関連するヌクレオソーム位置付け、ヌクレオソーム修飾、および転写因子結合に関する相対情報を生じさせるようにＭＢＤ分割に代わることが可能である。

【0215】

データ解析

【0216】

液体生検においてがんメチル化解析が直面する大きな難問は、細胞型不均一性である。固有であり明確に文書化されているがん不均一性に加えて、血漿中の無細胞ＤＮＡは、主にがん関連ではない混合細胞死タイプを表す。例えば、細胞死は非悪性臓器、生理的造血（hematapoetic）系列においてあり得る。この複雑さには、間質性成分中の非がん細胞、例えば、血管およびリンパ内皮細胞ならびに周皮細胞、マクロファージ、白血球およびリンパ球などの免疫細胞、間質線維芽細胞、筋線維芽細胞、筋上皮細胞、ならびに脂肪細胞、内分泌細胞、神経細胞および異なる発生起源を有する他の細胞および組織要素でさえ極めて異なることが加わる。したがって、いくつかの実施形態では、液体生検からの所見を解析し解釈する場合は、細胞型組成の変化についての調整が実施される。

【0217】

分析パイプラインは以下のステップ：
ａ）－ｏｍｅ占有率決定
ｂ）ダイアドの位置を突き止め、厳密性を割り当てる
ｃ）全ゲノムにわたって個々のゲノム要素内でガウス混合モデルを適合させる
ｄ）遺伝子レベルで細胞系列をデコンボリューションする
を含む場合がある。

【0218】

用例として、ｃｆＤＮＡ断片開始濃縮プロファイルは、個々の分割物から試料において別々に決定することが可能である。例えば、分割された試料は、高、低、または中間メチル化ＤＮＡを含んでいる場合がある。決定されたｃｆＤＮＡ断片開始濃縮プロファイルを使用すれば、関連する調節エレメント、例えば、ＴＳＳ、エンハンサー領域、遠位遺伝子間エレメント内のヌクレオソーム占有率を確立することが可能である。分割物ごとに、占有率ピーク、例えば、ダイアド、を決定することが可能であり、その厳密性を割り当てることが可能である。健康な血漿試料中の観察される細胞状態に関連するキャノニカルプロファイルは、ｃｆＤＮＡ断片開始濃縮プロファイルを決定し大きな非悪性対照（例えば、健康な個体または複数の健康な個体由来の試料）においてダイアドの位置を突き止めることにより確立することが可能である。いかなる試料でも、ガウス混合モデルは、分割された試料において観察される悪性（非キャノニカル）クロマチン状態に対応する残留占有率を生じ、それによって非キャノニカルｃｆＤＮＡ断片ピークおよびプロファイルを決定するために、上で定義されるキャノニカルプロファイルを使用して、適合させることが可能である。非キャノニカルｃｆＤＮＡ断片ピークおよびプロファイルは、それぞれの分割された試料においてがんの悪性クロマチン状態と関連している可能性がある。メチル化による生物学的調節は、単一ＣｐＧによりまたは互いに極めて近接しているＣｐＧの群により媒介することが可能である。したがって、ＤＮＡメチル化の区域解析はメチル化データのより包括的で組織的な見解を提供する。典型的には、メチル化情報はタイリングウィンドウ上にまたは予め定義された領域（プロモーター、ＣｐＧアイランド、イントロン、など）のセット上で要約される。

【0219】

ヌクレオソーム組織は、ヌクレオソーム占有率およびヌクレオソーム位置付けなどの、２つの独立した測定基準により決定することが可能である。ヌクレオソーム占有率はヌクレオソームが細胞集団内の特定のゲノム領域上に存在する確率として理解することが可能である。ヌクレオソーム占有率は、カバー度（ゲノム領域にマッピングされたアラインされたシーケンシング読み取りデータの数）としてシーケンシングベースの実験で測定することが可能である。ヌクレオソーム位置付けは、ヌクレオソーム基準点（例えば、ダイアド）が周囲の座標に対する特定のゲノム座標に存在する確率であることが可能である。図９に示されるように、良好なヌクレオソーム位置付けは、存在するたびに同じゲノム座標に生じるヌクレオソームダイアドとして生物学的には解釈することが可能である。不良な位置付けは、ヌクレオソームダイアドが全ヌクレオソームの同じ一般的フットプリント内である範囲の位置を占めると解釈することが可能である。一例では、肺がんを抱えた８人の対象由来の試料を使用して、ダイアド中心を決定した。ヌクレオソーム位置付けおよびヌクレオソーム占有率を決定した。例えば、高占有率および良好な位置付けは、カバー度が＞０．５分位（Ｑｕ）でありピークの幅が＜０．５Ｑｕである場合に示すことができる。いくつかの例では、分画試料（高／低メチル化画分などの）中のダイアド中心間の距離は非分画（ＭＢＤなし）と比較することが可能である。いくつかの場合、ダイアド中心ならびに隣接クロマチン構造は、ダイアド中心をすべてのピークに割り当てることにより決定することが可能であり、すべてのピークに対する占有率は占有カバー度がゲノムにわたって５％を超える。占有カバー度は１５％、２０％、２５％または３０％となり得る。占有カバー度は、ピーク位置、幅、長さ、中心および幅解像度を決定することにより機械学習アプローチを使用して割り当てることが可能である。これは血漿ＤＮＡについてのクロマチン構造の経験的決定を提供する。

【0220】

配列読み取りデータのカバー度の増加はより大きなヌクレオソーム占有率と相関している可能性がある。さらに、ヌクレオソーム占有率はヌクレオソーム枯渇領域（ＮＤＲ）と逆関係にある可能性がある。ヌクレオソーム占有率の増加は、より緻密なクロマチンなどの変更されたクロマチン構造を示している可能性がある。緻密なクロマチンは、正常な細胞機能を攪乱することがある遺伝子発現の下方調節を示している可能性がある。正常な細胞機能の攪乱はがんなどの疾患の徴候としての役割を果たすことが可能である。

【0221】

無細胞ＤＮＡは細胞の異種集団（例えば、瀕死の、悪性の、非悪性の、等）からのシグナルを含む。細胞の異種集団は、複数のクロマチン状態にある核酸を有することが可能である。いくつかの例では、複数のクロマチン状態は、良好に位置付けられたまたは分散している（「ファジーな」）ヌクレオソームなどの、ヌクレオソーム占有率の異なる状態を含むことが可能である。良好に位置付けられたヌクレオソームは配列読み取りデータのより大きなカバー度を示し、ファジーなヌクレオソームはより低いカバー度を示す。配列読み取りデータのカバー度に基づけば、クロマチンにわたるヌクレオソーム占有率を決定することが可能である。

【0222】

「デコンボリューション」は、互いにオーバーラップしている無細胞ＤＮＡ断片占有率ピークを分解し、こうして、「隠れたピーク」についての情報を引き出すプロセスを指すことが可能である。ヌクレオソーム占有率ピークのデコンボリューションは、ＭＢＤ分割により達成することが可能である。核酸を高メチル化および低メチル化分割物に分割すると、２つのはっきり異なるピーク、ピーク１およびピーク２を生じることが可能である。しかし、核酸が分画されていない場合、１つの連続するピークが得られ、悪性関連ピーク１を非悪性ピーク２からデコンボリューションするのは実行可能ではないことがある。

【0223】

ダイアドはヌクレオソームの中心により占められるＤＮＡ領域であることが可能である。ダイアドは分割された試料に位置することが可能である。いくつかの場合、核酸は高および低メチル化画分に分割される。ダイアドの位置付けまたは局在化は参照なしの方法または参照ベースの方法を使用して実施することが可能である。参照なしの方法は、高分割物と低分割物の両方をｉｎｓｉｌｉｃｏで組み合わせ、下にあるダイアド位置を決定し、それによって、ダイアドマップを決定することを含むことが可能である。いくつかの場合、高－および低メチル化分割物由来のシーケンシングデータを組み合わせてヌクレオソーム占有率を決定し、分割物間で比較し、例えば、あらゆる分割物からのシグナルを組み合わせて占有率ピークを検出し、次に、高対低において見られるピークの位置を比較する。参照ベースの方法は分割物の独立した解析を含むことが可能である。例えば、高－および低メチル化画分についてのヌクレオソーム占有率が決定される。第１の実験での分割物ごとのヌクレオソーム占有率は、それに続く実験（複数可）での対応する分割物のために使用することが可能であり、そこでは同じパート１は大きなセットの試料上で独立して行われ（標準ＷＧＳで十分と考えられる。なぜならば、分割ベースの情報は使用されず、情報が組み合わされてピーク解像度を改善するからである）、占有率ピークのマップはそれぞれに対して「参照」として保存され、単一分割物（または両方）を比較することが可能である。

【0224】

フラグメントームデータに基づくフラグメントームシグネチャー

【0225】

フラグメントームデータを調べる方法は、例えば、米国特許出願公開第２０１６／０２０１１４２号（Ｌｏ）、国際公開第２０１６／０１５０５８号（Ｓｈｅｎｄｕｒｅ）および２０１７年７月６日に提出されたＰＣＴ／ＵＳ１７／４０９８６（「ＭｅｔｈｏｄｓＦｏｒＦｒａｇｍｅｎｔｏｍｅＰｒｏｆｉｌｉｎｇＯｆＣｅｌｌ－ＦｒｅｅＮｕｃｌｅｉｃＡｃｉｄｓ」）に記載されており、これら特許文献はすべて参照により本明細書に組み込む。フラグメントームデータとは、核酸断片を分析することにより得られる配列データのことである。例えば、配列データは、断片長（塩基対で）、ゲノム座標（例えば、参照ゲノム上の開始および停止位置）、カバー度（例えば、コピー数）または配列情報（例えば、塩基Ａ、Ｇ、Ｃ、Ｔ）を含むことが可能である。フラグメントームデータとは、血液または血漿において観察される無細胞ＤＮＡの保護された含有量の濃縮に対応する無細胞ＤＮＡにおける断片の開始および停止の配列情報および関連する占有率のことである。

【0226】

例えば、試料において、ゲノムまたはその標的部分にわたって特定のヌクレオチド座標にマッピングするその中心点を有するｃｆＤＮＡ分子の数を決定することができるであろう。健康な個体では、これは典型的には、グラフのピークがヌクレオソーム位置（例えば、そこでは細胞ＤＮＡがｃｆＤＮＡへの変換中に開裂していない）を表し、くぼみがヌクレオソーム間位置（例えば、そこでは多くの分子が切断されており、したがって、そこに中心が置かれている分子がほとんどない）を表す波形グラフを生じると考えられる。ピーク間の距離はヌクレオソームダイアドを表す。悪性細胞では、ヌクレオソームの位置は、例えば、メチル化の関数として移動してもよい。この場合、グラフ中のピークおよびくぼみの位置の移動が予想される。そのような移動は、異なる特徴に基づいて分子を分割し、分割物ごとに断片分布を調べることによりもっと容易に検出することが可能である。断片データは、１つまたは複数のより多くの次元でさらに分析することが可能になる。例えば、いかなる座標でも、その座標にマッピングする分子の数は断片サイズに基づいてさらに識別することが可能である。そのようなデータに基づくグラフでは、３番目の「Ｚ」次元は断片サイズを表す。したがって、例えば、二次元グラフでは、Ｘ軸はゲノム座標を表し、Ｙ軸は座標にマッピングする分子の数を表す。三次元グラフでは、Ｘ軸はゲノム座標を表し、Ｚ次元は断片長を表し、Ｙ軸は座標にマッピングするそれぞれのサイズの分子の数を表す。そのような三次元グラフは二次元ヒートマップとして表すことが可能であり、そこではＸおよびＺ軸は二次元で表示され、Ｙ軸上の値は、例えば、色彩強度（例えば、暗いほど大きな値を表す）または色彩の「熱さ」（例えば、青色はより低い値を表し、赤色はより高い値を表す）により表される。そのようなデータを掘り出せば、がんの存在または非存在、がんのタイプ、転移の程度、等などの調べられている状態に特徴的であるヌクレオソーム位置パターンを決定することが可能になる。

【0227】

個体のコホートはすべてが共有された特徴を有している場合がある。この共有される特徴は、腫瘍タイプ、炎症状態、アポトーシス状態、壊死状態、腫瘍再発、および処置に対する抵抗性からなる群から選択してもよい。いくつかの例では、コホートは特定タイプのがん（例えば、乳がん、結腸直腸がん、膵臓がん、前立腺がん、黒色腫、肺がんまたは肝臓がん）を抱えた個体を含む。がんのヌクレオソームシグネチャーを得るため、がんに罹っている個体は血液試料を提供する。無細胞ＤＮＡは血液試料から得られる。無細胞ＤＮＡはシーケンシングされる（ゲノム由来の領域のセットの選択的濃縮とともにまたはそれなしで）。シーケンシング反応からの配列読み取りデータの形態での配列情報はヒト参照ゲノムにマッピングされる。いくつかの実施形態では、分子はマッピング操作の前または後で崩壊して、独特の分子読み取りデータになる。

【0228】

所与の試料中の無細胞ＤＮＡ断片は無細胞ＤＮＡが生じた元の細胞の混合物を表しているので、それぞれの細胞型由来の差次的ヌクレオソーム占有率により、所与の無細胞ＤＮＡ試料を表す数学的モデルへの寄与をもたらす可能性がある。例えば、断片長の分布は、異なる細胞型にわたる、または腫瘍対非腫瘍細胞にわたる差次的ヌクレオソーム保護のために生じた可能性がある。この方法を使用すれば、配列データの単一パラメトリック、多パラメトリック、および／または統計解析に基づく臨床的に有用な評価のセットを開発することができる。

【0229】

試料中の核酸分子は、１つまたは複数の特徴に基づいて分画してもよい。分画は、核酸分子をゲノム特徴の存在または非存在に基づいてサブセットまたは群に物理的に分割することを含んでいてもよい。分画は、核酸分子をゲノム特徴が存在する程度に基づいて群に物理的に分割することを含んでいてもよい。試料は、差次的遺伝子発現または疾患状態を示している特徴に基づいて１つまたは複数の群に分画するまたは分割してもよい。試料は、核酸、例えば、ｃｆＤＮＡ、非ｃｆＤＮＡ、腫瘍ＤＮＡ、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）の分析中に正常と病的状態の間のシグナルの違いを与える特徴に基づいて分画してもよい。

【0230】

フラグメントームデータを使用して遺伝子バリアントを推測してもよい。遺伝子バリアントは、コピー数変異（ＣＮＶ）、挿入および欠失（ｉｎｄｅｌ）、単一ヌクレオチド変異（ＳＮＶ）ならびに／または遺伝子融合を含む。フラグメントームデータを使用して、がんを示しているバリアントなどの、エピジェネティックバリアントを推測してもよい。それぞれの分画もしくは分割された群および／または非分画核酸中の１つまたは複数の遺伝子バリアントを決定してもよい。分画または分割は、核酸のメチル化状態、サイズ、長さ、および転写結合を含むがこれらに限定されない種々の特徴のうちの少なくとも１つに基づいて実施することが可能である。分画もしくは分割された群で判定された遺伝子バリアントは、互いの間でおよび／または同じ特徴を有することもあれば有さないこともある非分画核酸と比較してもよい。分画もしくは分割された核酸は再度組み合わせることが可能であり、フラグメントームデータは、非分画核酸および／または分画もしくは分割された核酸と同じ特徴を持たない核酸と比較すれば、遺伝子バリアントの存在を判定することが可能になる。

【0231】

モデルをパネル設定において使用して、領域（例えば、フラグメントームプロファイル関連領域）を選択的に濃縮し特定の突然変異にまたがる大きな数の読み取りデータを保証してもよく、転写開始部位（ＴＳＳ）、プロモーター領域、接合部位、およびイントロン領域のような重要なクロマチン中心イベントを検討してもよい。

【0232】

一例では、フラグメントームプロファイルの違いがイントロンとエクソンの接合部（または境界線）でまたはその近くで見出される。１つまたは複数の体細胞突然変異を同定すると、１つまたは複数の多パラメトリックまたは単一パラメトリックモデルと相関付けられて、ｃｆＤＮＡ断片が分散しているゲノム位置を明らかにすることができる。この相関分析は、フラグメントームプロファイル破壊がもっとも著しい１つまたは複数のイントロン－エクソン接合部を明らかにすることができる。

【0233】

別の例として、試料中の高メチル化はＴＳＳからさらに遠い領域で観察することが可能である。高メチル化領域の濃縮は、ＴＳＳから０ｋｂと５ｋｂ、５ｋｂと５０ｋｂ、および／または５０ｋｂと５００ｋｂの間の距離で観察することが可能である。高メチル化領域の濃縮は、ＴＳＳから５ｋｂと５０ｋｂの間で観察することが可能である。高メチル化領域の濃縮は、ＴＳＳから５ｋｂ、１０ｋｂ、１５ｋｂ、２０ｋｂ、２５ｋｂ、３０ｋｂ、３５ｋｂ、４０ｋｂ、５０ｋｂ、１００ｋｂ、２００ｋｂ、３００ｋｂ、４００ｋｂ、および／または５００ｋｂ未満で観察することが可能である。高メチル化領域の濃縮は、ＴＳＳから５ｋｂ、１０ｋｂ、１５ｋｂ、２０ｋｂ、２５ｋｂ、３０ｋｂ、３５ｋｂ、４０ｋｂ、５０ｋｂ、１００ｋｂ、２００ｋｂ、３００ｋｂ、４００ｋｂ、および／または５００ｋｂより離れて観察することが可能である。高メチル化の位置および濃縮は、健康なまたは正常な対象から得られるＤＮＡ（正常ＤＮＡ）と病的対象から得られるＤＮＡの間で変動することがある。例えば、肺がんに罹っていると疑われているまたは肺がんに罹っている対象由来のＤＮＡ（肺がんＤＮＡ）はＴＳＳ内のキャノニカル位置からもっとも遠位の高メチル化距離の濃縮を示している場合があり、高メチル化画分中の良好に位置付けされたヌクレオソームはプロモーター領域の近傍を占有している（図１７）。例えば、肺がん患者由来の非分画核酸（ＭＢＤなし）をシーケンシングのために使用した。ゲノム位置などの、フラグメントームデータに基づいて、ヌクレオソームダイアド中心を配列読み取りデータのために決定した。さらにフラグメントームデータに基づいて、５％未満もしくはこれに等しいカバー度または９５％未満もしくはこれに等しいカバー度を有する配列読み取りデータをさらに分析した。ＧｅｎｏｍｉｃＲｅｇｉｏｎｓＥｎｒｉｃｈｍｅｎｔｏｆＡｎｎｏｔａｔｉｏｎｓＴｏｏｌ（ＧＲＥＡＴ）などの、遺伝子アノテーションツールを使用して近くの遺伝子に基づいてゲノム領域のセットに機能性を割り当てた。配列読み取りデータ間の距離およびその推定される調節された遺伝子を決定した（図１７）。距離は４つの別々のビンに分けられ：１つは０から５ｋｂ、もう１つは５ｋｂから５０ｋｂ、三番目は５０ｋｂから５００ｋｂ、最後のビンは５００ｋｂを超えるすべての関連物であった。精密には、ビンは［０、５ｋｂ］、［５ｋｂ、５０ｋｂ］、［５０ｋｂ、５００ｋｂ］、［５００ｋｂ、無限］である。グラフでは、正確に０で（すなわち、ＴＳＳ上で）のすべての関連物は［－５ｋｂ、０］と［０、５ｋｂ］ビンの間で均等に分け合った。この方法を使用すれば、試料中の高メチル化は、バックグラウンドゲノム領域（例えば、すべてのヌクレオソーム）とフォアグラウンドゲノム領域（例えば、メチル化ヌクレオソーム）の両方でＴＳＳからさらに遠位の領域で観察された。例えば、高メチル間領域の濃縮は［５ｋｂ、５０ｋｂ］ビン間で観察された。

【0234】

フラグメントームシグネチャーは、ヌクレオソーム占有率、ヌクレオソーム位置付け、ＲＮＡポリメラーゼＩＩ休止、細胞死特異的ＤＮアーゼ過感受性、および細胞死中のクロマチン凝縮を判定するのを支援することができる。そのようなシグネチャーは、細胞片クリアランスおよび輸送についての洞察も提供することができる。例えば、細胞片クリアランスは、アポトーシスにより瀕死の細胞においてカスパーゼ活性化ＤＮアーゼ（ＣＡＤ）により実施されるＤＮＡ断片化を伴うことがあるが、瀕死の細胞が貪食された後にリソソームＤＮアーゼＩＩにより実施されて、異なる切断地図が生じる場合もある。

【0235】

ゲノム分割地図は、有意義なウィンドウの目的の領域への集合を介してクロマチンの前述の特性に関連する悪性対非悪性状態の差次的クロマチン状態のゲノムワイド同定により構築することが可能である。そのような目的の領域は一般にゲノム分割地図と呼ばれる。

【0236】

メチル化状態に基づく分画

【0237】

試料中の核酸分子は、５－メチルシトシンの特徴に基づいて分画することが可能である。ＤＮＡは、ＣｐＧジヌクレオチド領域でなどのシトシンでメチル化することが可能である。ヒストン複合体と一体でのＤＮＡメチル化は、クロマチンへのＤＮＡパッケージング並びに遺伝子発現のエピジェネティック調節に影響を及ぼす場合がある。エピジェネティック変更は、がん進行のすべてのステップ、原発または初期段階がんのイニシエーション、再発または転移がんにおいてなどの種々の疾患において極めて重要な役割を果たしている可能性がある。例えば、通常の成長、ＤＮＡ修復、細胞周期調節および細胞分化に関与している遺伝子の転写開始部位（ＴＳＳ）などの通常は低メチル化領域の高メチル化は、がんを示している可能性がある。高メチル化は転写を抑制することにより遺伝子発現を変更する場合がある。いくつかの場合、高メチル化は遺伝子発現を低減するおよび／または抑制する場合がある。例えば、高メチル化は発がん遺伝子リプレッサーの発現を低減するおよび／または抑制する場合がある。いくつかの場合、高メチル化は遺伝子発現を増加するおよび／または促進する場合がある。例えば、サプレッサーの高メチル化により、下流レスポンダー、例えば、通常はサプレッサーにより抑制されている発がん遺伝子の遺伝子発現が増加するおよび／または促進される場合がある。

【0238】

ＤＮＡメチル化状態に基づいて、試料中の核酸分子を、実験操作を使用して類似するメチル化状態を有する核酸分子を濃縮することが可能な異なる群に分画することが可能である。例えば、メチル結合ドメイン（ＭＢＤ）タンパク質を使用すれば、高メチル化、低メチル化および残余のメチル化などのメチル化の類似する状態を有する核酸分子を親和性精製することが可能である。別の例では、５－メチル－シトシンに特異的である抗体を使用すれば、メチル化の類似するレベルを有する核酸分子を免疫沈降することが可能である。別の例では、バイサルファイトベースの方法を用いれば、高度にメチル化された核酸分子を選択的に濃縮することが可能になる。さらに別の例では、メチル化感受性制限酵素を使用すれば、高度にメチル化された核酸分子を選択的に濃縮することが可能になる。

【0239】

特徴のうちの１つを使用して分画すると、それぞれの群の核酸分子をシーケンシングして配列読み取りデータを作成することができる。配列読み取りデータは参照ゲノムにマッピングすることができる。マッピングは配列情報を作成することが可能である。配列情報を分析して、例えば、一塩基バリアント、コピー数変異、挿入欠失、または融合を含む、遺伝的変異を判定してもよい。無細胞ＤＮＡがアッセイされる例では、本明細書に開示されている方法を使用するとフラグメントームデータを作成することができ、このデータは分画された核酸分子の群間で変化する場合がある。フラグメントームデータは、ゲノム座標、サイズ、カバー度または配列情報を含んでいてもよい。開示は、フラグメントームデータを分割物のそれぞれ由来の配列読み取りデータと統合するための方法を提供する。そのような統合は、疾患状態を示しているバイオマーカーの正確で迅速な検出に有用である可能性がある。

【0240】

本明細書に記載される方法を使用すれば、フラグメントームデータに基づいてｉｎｓｉｌｉｃｏで核酸分子を濃縮することが可能である。例えば、肺がん患者由来の非分画核酸分子（ＭＢＤなし）をシーケンシングのために使用することが可能である。別の例では、分画は、モノヌクレオソームもしくはジヌクレオソームプロファイル単独でのまたはこのプロファイルをサイズおよび／もしくはメチル化状態などの他の特徴と組み合わせての違いに基づいて達成することが可能である。モノヌクレオソームプロファイルとは、単一ヌクレオソームに巻くのに必要なおおよその長さ（例えば、約１４６ｂｐ）の断片のカバー度または総数を指すことが可能である。ジヌクレオソームプロファイルとは、単一ヌクレオソームに２度巻くのに必要なおおよその長さ（例えば、約２９２ｂｐ）の断片のカバー度または総数を指すことが可能である。

【0241】

データ解析

【0242】

ある特定の実施形態では、異なるクラスの対象、例えば、がん／がんなし、がん１型／がん２型由来のデータを使用すれば、試料をそのクラスの１つに属すると分類するように機械学習アルゴリズムを訓練することが可能になる。用語「機械学習アルゴリズム」とは、本明細書で使用される場合、コンピュータにより実行され、例えば、クラスタリング、分類またはパターン認識のための分析モデル構築を自動化するアルゴリズムのことである。機械学習アルゴリズムは監視されていても監視されていなくてもよい。学習アルゴリズムは、例えば、人工ニューラルネットワーク（例えば、バックプロパゲーションネットワーク）、判別分析（例えば、ベイズ分類子またはフィッシャー分析）、サポートベクターマシン、決定木（例えば、ＣＡＲＴ－分類および回帰木などの再帰分割プロセス）、ランダムフォレスト、線形分類子（例えば、多重線形回帰（ＭＬＲ）、部分最小二乗（ＰＬＳ）回帰および主成分回帰（ＰＣＲ））、階層的クラスタリングおよびクラスター解析を含む。機械学習アルゴリズムが学習するデータセットは「トレーニングデータ」と呼ぶことが可能である。

【0243】

用語「分類子」とは、本明細書で使用される場合、入力として試験データを受け取り、出力として、入力データをいずれかのクラスに属するとする分類を提示するアルゴリズムコンピュータコードのことである。

【0244】

用語「データセット」とは、本明細書で使用される場合、系の要素を特徴付ける値のコレクションのことである。系は、例えば、生体試料由来のｃｆＤＮＡでもよい。そのような系の要素は遺伝子座でもよい。データセット（または「データセット」）の例は：（ｉ）遺伝子座にマッピングするＤＮＡ配列、（ｉｉ）遺伝子座で開始するＤＮＡ配列、（ｉｉｉ）遺伝子座で終止するＤＮＡ配列；（ｉｖ）ＤＮＡ配列のジヌクレオソーム保護またはモノヌクレオソーム保護；（ｖ）参照ゲノムのイントロンまたはエクソンに位置しているＤＮＡ配列；（ｖｉ）１つまたは複数の特徴を有するＤＮＡ配列のサイズ分布；（ｖｉｉ）１つまたは複数の特徴を有するＤＮＡ配列の長さ分布、等から選択される特徴の定量的基準を示す値を含む。

【0245】

用語「値」とは、本明細書で使用される場合、その値が指すフィーチャーを特徴付けるいかなるものでも可能であるデータセット中の項目のことである。これには、限定せずに、数、単語もしくは語句、記号（例えば、＋または－）または程度が含まれる。

【0246】

デジタル処理デバイス
いくつかの実施形態では、本明細書に記載される方法はデジタル処理デバイスを利用する。さらなる実施形態では、デジタル処理デバイスは、１つまたは複数のハードウェア中央処理装置（ＣＰＵ）またはデバイスの機能を実行する汎用目的グラフィック処理装置（ＧＰＧＰＵ）を含む。なおさらなる実施形態では、デジタル処理デバイスは、実行可能命令を実施するように構成されているオペレーティングシステムをさらに含む。いくつかの実施形態では、デジタル処理デバイスは任意選択でコンピュータネットワークに接続されている。さらなる実施形態では、デジタル処理デバイスは、ワールドワイドウェブにアクセスするように任意選択でインターネットに接続されている。なおさらなる実施形態では、デジタル処理デバイスは、任意選択でクラウドコンピューティング基盤に接続されている。他の実施形態では、デジタル処理デバイスは、任意選択でイントラネットに接続されている。他の実施形態では、デジタル処理デバイスは、任意選択でデータ記憶装置に接続されている。

【0247】

本明細書の記述に従えば、適切なデジタル処理デバイスは、非限定的例として、サーバーコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、ノートブック型コンピュータ、ハンドヘルドコンピュータ、インターネット機器、モバイルスマートフォン、およびタブレットコンピュータを含む。

【0248】

いくつかの実施形態では、デジタル処理デバイスは実行可能命令を実施するように構成されているオペレーティングシステムを含む。オペレーティングシステムは、例えば、デバイスのハードウェアを管理しアプリケーションの実行のためのサービスを提供する、プログラムおよびデータを含むソフトウェアである。当業者であれば、適切なサーバーオペレーティングシステムには、非限定的例として、ＦｒｅｅＢＳＤ、ＯｐｅｎＢＳＤ、ＮｅｔＢＳＤ（登録商標）、Ｌｉｎｕｘ（登録商標）、Ａｐｐｌｅ（登録商標）ＭａｃＯＳ
ＸＳｅｒｖｅｒ（登録商標）、Ｏｒａｃｌｅ（登録商標）Ｓｏｌａｒｉｓ（登録商標）、ＷｉｎｄｏｗｓＳｅｒｖｅｒ（登録商標）、およびＮｏｖｅｌｌ（登録商標）ＮｅｔＷａｒｅ（登録商標）が含まれることを認識するであろう。当業者であれば、適切なパーソナルコンピュータオペレーティングシステムには、非限定的例として、Ｍｉｃｒｏｓｏｆｔ（登録商標）Ｗｉｎｄｏｗｓ（登録商標）、Ａｐｐｌｅ（登録商標）ＭａｃＯＳ
Ｘ（登録商標）、ＵＮＩＸ（登録商標）、およびＧＮＵ／Ｌｉｎｕｘ（登録商標）などのＵＮＩＸ様オペレーティングシステムが含まれることを認識するであろう。いくつかの実施形態では、オペレーティングシステムはクラウドコンピューティングにより提供される。当業者であれば、適切なモバイルスマートフォンオペレーティングシステムには、非限定的例として、Ｎｏｋｉａ（登録商標）Ｓｙｍｂｉａｎ（登録商標）ＯＳ、Ａｐｐｌｅ（登録商標）ｉＯＳ（登録商標）、ＲｅｓｅａｒｃｈＩｎＭｏｔｉｏｎ（登録商標）ＢｌａｃｋＢｅｒｒｙＯＳ（登録商標）、Ｇｏｏｇｌｅ（登録商標）Ａｎｄｒｏｉｄ（登録商標）、Ｍｉｃｒｏｓｏｆｔ（登録商標）ＷｉｎｄｏｗｓＰｈｏｎｅ（登録商標）ＯＳ、Ｍｉｃｒｏｓｏｆｔ（登録商標）ＷｉｎｄｏｗｓＭｏｂｉｌｅ（登録商標）ＯＳ、Ｌｉｎｕｘ（登録商標）、およびＰａｌｍ（登録商標）ＷｅｂＯＳ（登録商標）が含まれることも認識するであろう。

【0249】

いくつかの実施形態では、デバイスは記憶および／またはメモリーデバイスを含む。記憶および／またはメモリーデバイスは、一時的にまたは永久にデータまたはプログラムを保存するのに使用される１つまたは複数の物理的装置である。いくつかの実施形態では、デバイスは揮発性メモリーであり、保存された情報を維持するのに電力を必要とする。いくつかの実施形態では、デバイスは非揮発性メモリーであり、デジタル処理デバイスに電力が供給されていないときに保存された情報を保持する。さらなる実施形態では、非揮発性メモリーはフラッシュメモリーを含む。いくつかの実施形態では、非揮発性メモリーはダイナミックランダムアクセスメモリー（ＤＲＡＭ）を含む。いくつかの実施形態では、非揮発性メモリーは強誘電体ランダムアクセスメモリー（ＦＲＡＭ（登録商標））を含む。いくつかの実施形態では、非揮発性メモリーは相変化ランダムアクセスメモリー（ＰＲＡＭ）を含む。他の実施形態では、デバイスは、非限定的例として、ＣＤ－ＲＯＭ、ＤＶＤ、フラッシュメモリーデバイス、磁気ディスクドライブ、磁気テープドライブ、光学ディスクドライブ、およびクラウドコンピューティングベースの保存を含む記憶装置である。さらなる実施形態では、記憶および／またはメモリーデバイスは、本明細書に開示されるデバイスなどのデバイスの組み合わせである。

【0250】

いくつかの実施形態では、デジタル処理デバイスは、可視情報をユーザーに送るディスプレイを含む。いくつかの実施形態では、ディスプレイは液晶ディスプレイ（ＬＣＤ）である。さらなる実施形態では、ディスプレイは薄膜トランジスター液晶ディスプレイ（ＴＦＴ－ＬＣＤ）である。いくつかの実施形態では、ディスプレイは有機発光ダイオード（ＯＬＥＤ）ディスプレイである。種々のさらなる実施形態では、ＯＬＥＤディスプレイは受動マトリックスＯＬＥＤ（ＰＭＯＬＥＤ）または能動マトリックスＯＬＥＤ（ＡＭＯＬＥＤ）ディスプレイである。いくつかの実施形態では、ディスプレイはプラズマディスプレイである。他の実施形態では、ディスプレイはビデオプロジェクターである。さらに他の実施形態では、ディスプレイは、ＶＲヘッドセットなどの、デジタル処理デバイスと連絡しているヘッドマウントディスプレイである。さらなる実施形態では、適切なＶＲヘッドセットは、非限定的例として、ＨＴＣＶｉｖｅ、ＯｃｕｌｕｓＲｉｆｔ、ＳａｍｓｕｎｇＧｅａｒＶＲ、ＭｉｃｒｏｓｏｆｔＨｏｌｏＬｅｎｓ、ＲａｚｅｒＯＳＶＲ、ＦＯＶＥＶＲ、ＺｅｉｓｓＶＲＯｎｅ、ＡｖｅｇａｎｔＧｌｙｐｈ、ＦｒｅｅｆｌｙＶＲヘッドセット、および同類のものを含む。さらなる実施形態では、ディスプレイは本明細書に開示されるデバイスなどのデバイスの組み合わせである。

【0251】

いくつかの実施形態では、デジタル処理デバイスはユーザーからの情報を受け取る入力デバイスを含む。いくつかの実施形態では、入力デバイスはキーボードである。いくつかの実施形態では、入力デバイスは、非限定的例として、マウス、トラックボール、トラックパッド、ジョイスティック、ゲームコントローラー、またはスタイラスを含む、ポインティングデバイスである。いくつかの実施形態では、入力デバイスは、タッチスクリーンまたはマルチタッチスクリーンである。他の実施形態では、入力デバイスは、音声または他のサウンド入力を捕捉するマイクロフォンである。他の実施形態では、入力装置は、動作または視覚入力を捕捉するビデオカメラまたは他のセンサーである。さらなる実施形態では、入力デバイスは、Ｋｉｎｅｃｔ、ＬｅａｐＭｏｔｉｏｎまたは同類のものである。さらなる実施形態では、入力デバイスは、本明細書に開示されるデバイスなどのデバイスの組み合わせである。

【0252】

図３２を参照して、特定の実施形態では、例示的デジタル処理デバイス１０１は、配列および／またはタグデータを分析する、アッセイする、解読するおよび／またはデコンボリューションするようプログラムされているまたは他の方法で構成されている。実施形態では、デジタル処理デバイス１０１は、中央処理装置（ＣＰＵ、本明細書では「プロセッサー」および「コンピュータプロセッサー」も）１０５を含み、これはシングルコアもしくはマルチコアプロセッサー、または並列処理のための複数のプロセッサーが可能である。デジタル処理デバイス１０１は、メモリーまたはメモリー位置１１０（例えば、ランダムアクセスメモリー、読み取り専用メモリー、フラッシュメモリー）、電子記憶装置１１５（例えば、ハードディスク）、１つまたは複数の他のシステムと通信するための通信インターフェイス１２０（例えば、ネットワークアダプター）、ならびにキャッシュ、他のメモリー、データ記憶および／もしくは電子ディスプレイアダプターなどの周辺機器１２５も含む。メモリー１１０、記憶装置１１５、インターフェイス１２０および周辺機器１２５は、マザーボードなどの通信バス（実ライン）を通じてＣＰＵ１０５と通信している。記憶装置１１５は、データを保存するためのデータ記憶装置（またはデータレポジトリー）であり得る。デジタル処理デバイス１０１は、通信インターフェイス１２０の力を借りてコンピュータネットワーク（「ネットワーク」）１３０に動作可能に連結することが可能である。ネットワーク１３０は、インターネット、インターネットおよび／もしくはエクストラネット、またはインターネットと通信しているイントラネットおよび／もしくはエクストラネットであり得る。ネットワーク１３０は、いくつかの場合、遠距離通信および／またはデータネットワークである。ネットワーク１３０は、１つまたは複数のコンピュータサーバーを含むことが可能であり、このサーバーはクラウドコンピューティングなどの分散コンピューティングを作動させることが可能である。ネットワーク１３０は、いくつかの場合、デバイス１０１の力を借りてピアツーピアネットワークを実行することが可能であり、このネットワークはデバイス１０１に連結されてクライアントまたはサーバーとして振る舞うデバイスを作動させることができる。

【0253】

図３２への言及を続けると、ＣＰＵ１０５は一続きの機械読み取り可能命令を実行することが可能であり、この命令はプログラムまたはソフトウェアにおいて具体化することが可能である。命令はメモリー１１０などのメモリー位置に保存してもよい。命令はＣＰＵ１０５に向けることが可能であり、これにより続いて本開示の方法を実行するようにＣＰＵ１０５をプログラムするまたは他の方法で構成することが可能になる。ＣＰＵ１０５により実施される操作の例は、取得する、解読する、実行する、およびライトバックすることを含むことが可能である。ＣＰＵ１０５は集積回路などの回路の一部であり得る。デバイス１０１の１つまたは複数の他の構成成分を回路に含むことが可能である。いくつかの場合、回路は特定用途向け集積回路（ＡＳＩＣ）またはフィールドプログラマブルゲートアレイ（ＦＰＧＡ）である。

【0254】

図３２への言及を続けると、記憶装置１１５は、ドライバー、ライブラリーおよび保存プログラムなどのファイルを保存することが可能である。記憶装置１１５は、ユーザーデータ、例えば、ユーザーの選好およびユーザーのプログラムを保存することが可能である。デジタル処理デバイス１０１は、いくつかの場合、イントラネットまたはインターネットを通じて通信しているリモートサーバー上に位置しているなどの、外付けである１つまたは複数の追加のデータ記憶装置を含むことが可能である。

【0255】

図３２への言及を続けると、デジタル処理デバイス１０１は、ネットワーク１３０を通じて１つまたは複数のリモートコンピュータシステムと通信することが可能である。例えば、デバイス１０１はユーザーのリモートコンピュータシステムと通信することが可能である。リモートコンピュータシステムの例は、パーソナルコンピュータ（例えば、携帯型ＰＣ）、スレートまたはタブレットＰＣ（例えば、Ａｐｐｌｅ（登録商標）ｉＰａｄ（登録商標）、Ｓａｍｓｕｎｇ（登録商標）ＧａｌａｘｙＴａｂ、およびＭｉｃｒｏｓｏｆｔ（登録商標）Ｓｕｒｆａｃｅ（登録商標））、およびスマートフォン（例えば、Ａｐｐｌｅ（登録商標）ｉＰｈｏｎｅ（登録商標）またはＡｎｄｒｏｉｄ対応機器）を含む。

【0256】

本明細書に記載される方法は、例えば、メモリー１１０または電子記憶装置１１５上などの、デジタル処理デバイス１０１の電子格納場所上に保存された機械（例えば、コンピュータープロセッサー）実行可能コードにより少なくとも部分的に実行することが可能である。機械実行可能または機械読み取り可能コードはソフトウェアの形態で提供することが可能である。使用の間、コードはプロセッサー１０５により実行することが可能である。いくつかの場合、コードは記憶装置１１５から引き出し、プロセッサー１０５による容易なアクセスのためにメモリー１１０上に保存することが可能である。いくつかの状況では、電子記憶装置１１５は排除することが可能であり、機械実行可能命令はメモリー１１０上に保存される。

【0257】

非一時的コンピュータ読み取り可能記憶媒体

【0258】

いくつかの実施形態では、本明細書で開示される方法は、任意選択でネットワークに接続されているデジタル処理デバイスのオペレーティングシステムにより実行可能な命令を含む、プログラムでコード化されている１つまたは複数の非一時的コンピュータ読み取り可能記憶媒体を利用する。さらなる実施形態では、コンピュータ読み取り可能記憶媒体はデジタル処理デバイスの有形構成成分である。なおさらなる実施形態では、コンピュータ読み取り可能記憶媒体は任意選択でデジタル処理デバイスから取り外し可能である。いくつかの実施形態では、コンピュータ読み取り可能記憶媒体は、非限定的例として、ＣＤ－ＲＯＭ、ＤＶＤ、フラッシュメモリー装置、固体状態メモリー、磁気ディスクドライブ、磁気テープドライブ、光学ディスクドライブ、クラウドコンピューティングシステムおよびサービス、ならびに同類のものを含む。いくつかの場合、プログラムおよび命令は永久的に、実質的に永久的に、半永久的に、または非一時的に媒体上にコード化される。

【0259】

実行可能命令

【0260】

いくつかの実施形態では、本明細書で開示される方法は、少なくとも１つのコンピュータプログラムの形態で、デジタル処理デバイスにより実行可能である命令を利用する。例えば、コンピュータプログラムは、デジタル処理デバイスのＣＰＵで実行可能な、特定のタスクを実施するように書かれた、一続きの命令を含む。コンピュータ読み取り可能な命令は、特定のタスクを実施するまたは特定の抽象データタイプを実行する関数、オブジェクト、アプリケーションプログラムインターフェイス（ＡＰＩ）、データ構造、および同類のものなどのプログラムモジュールとして実行してもよい。本明細書で提供される開示に照らして、当業者であればコンピュータプログラムは種々の言語の種々のバージョンで書いてもよいことは認識されるであろう。

【0261】

コンピュータ読み取り可能な命令の機能性は、種々の環境において希望通りに組み合わせるまたは分散させてもよい。いくつかの実施形態では、コンピュータプログラムは１つの一続きの命令を含む。いくつかの実施形態では、コンピュータプログラムは複数の一続きの命令を含む。いくつかの実施形態では、コンピュータプログラムは１つの位置から提供される。他の実施形態では、コンピュータプログラムは複数の位置から提供される。種々の実施形態では、コンピュータプログラムは１つまたは複数のソフトウェアモジュールを含む。種々の実施形態では、コンピュータプログラムは、一部においてまたは全体において、１つまたは複数のウェブアプリケーション、１つまたは複数のモバイルアプリケーション、１つまたは複数のスタンドアロンアプリケーション、１つまたは複数のウェブブラウザプラグイン、機能拡張、アドイン、もしくはアドオン、またはその組合せを含む。

【0262】

ウェブアプリケーション

【0263】

いくつかの実施形態では、コンピュータプログラムはウェブアプリケーションを含む。本明細書で提供される開示に照らして、当業者であれば、ウェブアプリケーションは、種々の実施形態で、１つまたは複数のソフトウェアフレームワークおよび１つまたは複数のデータベースシステムを利用することは認識されるであろう。いくつかの実施形態では、ウェブアプリケーションは、Ｍｉｃｒｏｓｏｆｔ（登録商標）．ＮＥＴまたはＲｕｂｙｏｎＲａｉｌｓ（ＲｏＲ）などのソフトウェアフレームワーク上に作成される。いくつかの実施形態では、ウェブアプリケーションは、非限定的例として、リレーショナル、非リレーショナル、オブジェクト指向、アソシエーティブ、およびＸＭＬデータベースシステムを含む、１つまたは複数のデータベースシステムを利用する。さらなる実施形態では、適切なリレーショナルデータベースシステムは、非限定的例として、Ｍｉｃｒｏｓｏｆｔ（登録商標）ＳＱＬＳｅｒｖｅｒ、ｍｙＳＱＬ（商標）、およびＯｒａｃｌｅ（登録商標）を含む。当業者であれば、ウェブアプリケーションは、種々の実施形態では、１つまたは複数の言語の１つまたは複数のバージョンで書かれることも認識するであろう。ウェブアプリケーションは、１つまたは複数のマークアップ言語、プレゼンテーション定義言語、クライアント側スクリプト言語、サーバー側コーディング言語、データベース問い合わせ言語、またはその組合せで書かれていてもよい。いくつかの実施形態では、ウェブアプリケーションは、ＨｙｐｅｒｔｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ（ＨＴＭＬ）、ＥｘｔｅｎｓｉｂｌｅＨｙｐｅｒｔｅｘｔＭａｒｋｕｐＬａｎｇｕａｇｅ（ＸＨＴＭＬ）、またはｅＸｔｅｎｓｉｂｌｅＭａｒｋｕｐＬａｎｇｕａｇｅ（ＸＭＬ）などのマークアップ言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、ＣａｓｃａｄｉｎｇＳｔｙｌｅＳｈｅｅｔｓ（ＣＳＳ）などのプレゼンテーション定義言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、ＡｓｙｎｃｈｒｏｎｏｕｓＪａｖａ（登録商標）ｓｃｒｉｐｔａｎｄＸＭＬ（ＡＪＡＸ）、Ｆｌａｓｈ（登録商標）Ａｃｔｉｏｎｓｃｒｉｐｔ、Ｊａｖａｓｃｒｉｐｔ、またはＳｉｌｖｅｒｌｉｇｈｔ（登録商標）などのクライアント側スクリプト言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、ＡｃｔｉｖｅＳｅｒｖｅｒＰａｇｅｓ（ＡＳＰ）、ＣｏｌｄＦｕｓｉｏｎ（登録商標）、Ｐｅｒｌ、Ｊａｖａ（商標）、ＪａｖａＳｅｒｖｅｒＰａｇｅｓ（ＪＳＰ）、ＨｙｐｅｒｔｅｘｔＰｒｅｐｒｏｃｅｓｓｏｒ（ＰＨＰ）、Ｐｙｔｈｏｎ（商標）、Ｒｕｂｙ、Ｔｃｌ、Ｓｍａｌｌｔａｌｋ、ＷｅｂＤＮＡ（登録商標）、またはＧｒｏｏｖｙなどのサーバー側コーディング言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、ＳｔｒｕｃｔｕｒｅｄＱｕｅｒｙＬａｎｇｕａｇｅ（ＳＱＬ）などのデータベース問い合わせ言語である程度書かれている。いくつかの実施形態では、ウェブアプリケーションは、ＩＢＭ（登録商標）ＬｏｔｕｓＤｏｍｉｎｏ（登録商標）などの企業サーバー製品を統合している。いくつかの実施形態では、ウェブアプリケーションは、メディアプレーヤーエレメントを含む。種々のさらなる実施形態では、メディアプレーヤーエレメントは、非限定的例として、Ａｄｏｂｅ（登録商標）Ｆｌａｓｈ（登録商標）、ＨＴＭＬ５、Ａｐｐｌｅ（登録商標）ＱｕｉｃｋＴｉｍｅ（登録商標）、Ｍｉｃｒｏｓｏｆｔ（登録商標）Ｓｉｌｖｅｒｌｉｇｈｔ（登録商標）、Ｊａｖａ（商標）、およびＵｎｉｔｙ（登録商標）を含む多くの適切なマルチメディア技術の１つまたは複数を利用する。

【0264】

図３３に言及すると、特定の実施形態では、アプリケーション提供システムは、リレーショナルデータベース管理システム（ＲＤＢＭＳ）２１０がアクセスする１つまたは複数のデータベース２００を含む。適切なＲＤＢＭＳは、Ｆｉｒｅｂｉｒｄ、ＭｙＳＱＬ、ＰｏｓｔｇｒｅＳＱＬ、ＳＱＬｉｔｅ、ＯｒａｃｌｅＤａｔａｂａｓｅ、ＭｉｃｒｏｓｏｆｔＳＱＬＳｅｒｖｅｒ、ＩＢＭＤＢ２、ＩＢＭＩｎｆｏｒｍｉｘ、ＳＡＰＳｙｂａｓｅ、Ｔｅｒａｄａｔａ、および同類のものを含む。この実施形態では、アプリケーション提供システムは、１つまたは複数のアプリケーションサーバー２２０（Ｊａｖａサーバー、．ＮＥＴサーバー、ＰＨＰサーバー、および同類のものなどの）および１つまたは複数のウェブサーバー２３０（Ａｐａｃｈｅ、ＩＩＳ、ＧＷＳおよび同類のものなどの）をさらに含む。ウェブサーバー（複数可）は任意選択で、ａｐｐアプリケーションプログラミングインターフェイス（ＡＰＩ）２４０を経由する１つまたは複数のウェブサービスをインターネットなどのネットワーク経由で公開し、システムはブラウザベースおよび／またはモバイルネイティブユーザーインターフェイスを提供する。

【0265】

図３４に言及すると、特定の実施形態では、アプリケーション提供システムは、あるいは、分散クラウドベースアーキテクチャー３００を有し、弾力的負荷分散、自動スケーリングウェブサーバーリソース３１０およびアプリケーションサーバーリソース３２０そのうえ同調レプリケートされたデータベース３３０を含む。

【0266】

モバイルアプリケーション

【0267】

いくつかの実施形態では、コンピュータプログラムはモバイルデジタル処理デバイスに提供されるモバイルアプリケーションを含む。いくつかの実施形態では、モバイルアプリケーションはその製造時にモバイルデジタル処理デバイスに提供される。他の実施形態では、モバイルアプリケーションは、本明細書に記載されるコンピュータネットワークを経由してモバイルデジタル処理デバイスに提供される。

【0268】

本明細書に提供される開示の点から、モバイルアプリケーションは、当技術分野で公知のハードウェア、言語、および開発環境を使用して当業者に公知の技法により作成される。当業者であれば、モバイルアプリケーションがいくつかの言語で書かれることを認識するであろう。適切なプログラミング言語は、非限定的例として、Ｃ、Ｃ＋＋、Ｃ＃、Ｏｂｊｅｃｔｉｖｅ－Ｃ、Ｊａｖａ（商標）、Ｊａｖａｓｃｒｉｐｔ、Ｐａｓｃａｌ、ＯｂｊｅｃｔＰａｓｃａｌ、Ｐｙｔｈｏｎ（商標）、Ｒｕｂｙ、ＶＢ．ＮＥＴ、ＷＭＬ、およびＣＳＳありのもしくはなしのＸＨＴＭＬ／ＨＴＭＬ、またはその組合せを含む。

【0269】

適切なモバイルアプリケーション開発環境はいくつかのソースから入手可能である。市販の開発環境は、非限定的例として、ＡｉｒｐｌａｙＳＤＫ、ａｌｃｈｅＭｏ、Ａｐｐｃｅｌｅｒａｔｏｒ（登録商標）、Ｃｅｌｓｉｕｓ、Ｂｅｄｒｏｃｋ、ＦｌａｓｈＬｉｔｅ、．ＮＥＴＣｏｍｐａｃｔＦｒａｍｅｗｏｒｋ、Ｒｈｏｍｏｂｉｌｅ、およびＷｏｒｋＬｉｇｈｔＭｏｂｉｌｅＰｌａｔｆｏｒｍを含む。非限定的例として、Ｌａｚａｒｕｓ、ＭｏｂｉＦｌｅｘ、ＭｏＳｙｎｃ、およびＰｈｏｎｅＧａｐを含む他の開発環境は無料で利用可能である。その上、モバイルデバイス製造業者は、非限定的例として、ｉＰｈｏｎｅおよびｉＰａｄ（ｉＯＳ）ＳＤＫ、Ａｎｄｒｏｉｄ（商標）ＳＤＫ、ＢｌａｃｋＢｅｒｒｙ（登録商標）ＳＤＫ、ＢＲＥＷＳＤＫ、Ｐａｌｍ（登録商標）ＯＳＳＤＫ、ＳｙｍｂｉａｎＳＤＫ、ｗｅｂＯＳＳＤＫ、およびＷｉｎｄｏｗｓ（登録商標）ＭｏｂｉｌｅＳＤＫを含むソフトウェアデベロッパーキットを販売している。

【0270】

当業者であれば、いくつかの商業的フォーラムは、非限定的例として、Ａｐｐｌｅ（登録商標）ＡｐｐＳｔｏｒｅ、Ｇｏｏｇｌｅ（登録商標）Ｐｌａｙ、ＣｈｒｏｍｅＷｅｂＳｔｏｒｅ、ＢｌａｃｋＢｅｒｒｙ（登録商標）ＡｐｐＷｏｒｌｄ、ＡｐｐＳｔｏｒｅｆｏｒＰａｌｍｄｅｖｉｃｅｓ、ＡｐｐＣａｔａｌｏｇｆｏｒｗｅｂＯＳ、Ｗｉｎｄｏｗｓ（登録商標）ＭａｒｋｅｔｐｌａｃｅｆｏｒＭｏｂｉｌｅ、ＯｖｉＳｔｏｒｅｆｏｒＮｏｋｉａ（登録商標）ｄｅｖｉｃｅｓ、Ｓａｍｓｕｎｇ（登録商標）Ａｐｐｓ、およびＮｉｎｔｅｎｄｏ（登録商標）ＤＳｉＳｈｏｐを含むモバイルアプリケーションの流通に利用可能であることは認識するであろう。

【0271】

スタンドアロンアプリケーション

【0272】

いくつかの実施形態では、コンピュータプログラムはスタンドアロンアプリケーションを含み、これは、既存のプロセスへのアドオンではなく、例えば、プラグインではなく、独立したコンピュータプロセスとして実行されるプログラムである。当業者であれば、スタンドアロンアプリケーションが多くの場合コンパイルされることは認識するであろう。コンパイラーは、プログラミング言語で書かれたソースコードをアセンブリ言語または機械コードなどのバイナリオブジェクトコードに変換するコンピュータプログラム（複数可）である。適切なコンパイルプログラミング言語は、非限定的例として、Ｃ、Ｃ＋＋、Ｏｂｊｅｃｔｉｖｅ－Ｃ、ＣＯＢＯＬ、Ｄｅｌｐｈｉ、Ｅｉｆｆｅｌ、Ｊａｖａ（商標）、Ｌｉｓｐ、Ｐｙｔｈｏｎ（商標）、ＶｉｓｕａｌＢａｓｉｃ、およびＶＢ．ＮＥＴ、またはその組合せを含む。コンパイレーションは、少なくとも一部、実行可能なプログラムを作成するために実施されることが多い。いくつかの実施形態では、コンピュータプログラムは１つまたは複数の実行可能なコンパイルアプリケーションを含む。

【0273】

ソフトウェアモジュール

【0274】

いくつかの実施形態では、本明細書に開示される方法は、ソフトウェア、サーバー、および／またはデータベースモジュールを利用する。本明細書に提供される開示の点から、ソフトウェアモジュールは、当技術分野で公知の機械、ソフトウェア、および言語を使用して当業者に公知の技法により作成される。本明細書に開示されるソフトウェアモジュールは、多数の方法で実行される。種々の実施形態では、ソフトウェアモジュールは、ファイル、コードの部分、プログラミングオブジェクト、プログラミング構造、またはその組合せを含む。さらなる種々の実施形態では、ソフトウェアモジュールは、複数のファイル、複数のコードの部分、複数のプログラミングオブジェクト、複数のプログラミング構造、またはその組合せを含む。種々の実施形態では、１つまたは複数のソフトウェアモジュールは、非限定的例として、ウェブアプリケーション、モバイルアプリケーション、およびスタンドアロンアプリケーションを含む。いくつかの実施形態では、ソフトウェアモジュールは、１つのコンピュータプログラムまたはアプリケーションにある。他の実施形態では、ソフトウェアモジュールは、１つよりも多いコンピュータプログラムまたはアプリケーションにある。いくつかの実施形態では、ソフトウェアモジュールは１つの機械上で提供される。他の実施形態では、ソフトウェアモジュールは１つよりも多い機械上で提供される。さらなる実施形態では、ソフトウェアモジュールはクラウドコンピューティングプラットホーム上で提供される。いくつかの実施形態では、ソフトウェアモジュールは、１つの位置において１つまたは複数の機械上で提供される。他の実施形態では、ソフトウェアモジュールは、１つよりも多い位置において１つまたは複数の機械上で提供される。

【0275】

データベース

【0276】

いくつかの実施形態では、本明細書に開示される方法は、１つまたは複数のデータベースを利用する。本明細書に提供される開示の点から、当業者であれば、多くのデータベースが、患者、配列、タグ、コード／デコード、遺伝子バリアント、および疾患情報の保存および検索に適していることは認識するであろう。種々の実施形態では、適切なデータベースは、非限定的例として、リレーショナルデータベース、非リレーショナルデータベース、オブジェクト指向データベース、オブジェクトデータベース、実体関連モデルデータベース、アソシエーティブデータベース、およびＸＭＬデータベースを含む。さらなる非限定的例は、ＳＱＬ、ＰｏｓｔｇｒｅＳＱＬ、ＭｙＳＱＬ、Ｏｒａｃｌｅ、ＤＢ２、およびＳｙｂａｓｅを含む。いくつかの実施形態では、データベースはインターネットベースである。さらなる実施形態では、データベースはウェブベースである。なおさらなる実施形態では、データベースはクラウドコンピューティングベースである。他の実施形態では、データベースは１つまたは複数のローカルコンピュータ記憶装置に基づいている。

【0277】

一態様では、プロセッサーおよびコンピュータメモリーを含むコンピュータを含むシステムが本明細書では提供され、そこではコンピュータは通信ネットワークと通信しており、コンピュータメモリーは、プロセッサーにより実行された場合、（１）通信ネットワークからコンピュータメモリーに配列データを受け取り；（２）本明細書に記載される方法を使用して、配列データ中の遺伝子バリアントが生殖系列突然変異を表すのかまたは体細胞突然変異を表すのかを判定し；（３）通信ネットワークにその判定を報告するコードを含む。

【0278】

通信ネットワークは、インターネットに接続するいかなる利用可能なネットワークでも可能である。通信ネットワークは、例えば、限定せずに、Ｂｒｏａｄｂａｎｄｏｖｅｒ
Ｐｏｗｅｒｌｉｎｅｓ（ＢＰＬ）、ＣａｂｌｅＭｏｄｅｍ、ＤｉｇｉｔａｌＳｕｂｓｃｒｉｂｅｒＬｉｎｅ（ＤＳＬ）、Ｆｉｂｅｒ、Ｓａｔｅｌｌｉｔｅ、およびＷｉｒｅｌｅｓｓを含む高速伝送ネットワークを利用することが可能である。

【0279】

一態様では、ローカルエリアネットワーク；ローカルエリアネットワークに接続されている、ＤＮＡ配列データを保存するように構成されているコンピュータメモリーを含む１つまたは複数のＤＮＡシーケンサー；ローカルエリアネットワークに接続されている、コンピュータメモリーおよびプロセッサーを含むバイオインフォマティクスコンピュータを含むシステムが本明細書で提供され、コンピュータは、実行されると、ＤＮＡシーケンサーに保存されているＤＮＡ配列データをコピーし、コピーデータをバイオインフォマティクスコンピュータのメモリーに書き込み、本明細書に記載されるステップを実施するコードをさらに含む。

【0280】

記載された方法を実行するための多数のシステムも本明細書で提供される。いくつかの実施形態では、システムは、次世代ＤＮＡシーケンサーを含む核酸シーケンサーを含み、シーケンサーはデジタル処理デバイスとデータ通信（data communication communication）をしており、そこではデジタル処理デバイス上のソフトウェアモジュール（単数または複数）が受け取るデータは、シーケンサーが、主題の方法により分割されタグが付けられている分割されタグが付けられたＤＮＡ配列からＤＮＡ配列情報を得ると、シーケンサーにより作成される。シーケンサー（sequncer）およびデジタル処理デバイスは互いに近くに位置している必要はなく、いくつかの実施形態では、適切なデータ通信がシステム構成成分間に存在していれば、大きな物理的距離に離れていてもよい。下に記載される特定のシステム実施形態は、本発明により提供されるさらに多くの種類のシステムの見本となる。データ解析（data data analysis）ステップを含む本明細書に記載される方法は、本明細書に開示されるシステムを通じて容易に実行することができ、デジタル処理デバイス上のソフトウェアモジュール（単数または複数）を使用して、主題の方法により生成されるタグが付けられた核酸集団をシーケンシングすることにより得られる配列データを分析することは当業者であれば理解するであろう。

【0281】

実施形態は、核酸シーケンサーと；少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと；核酸シーケンサーおよびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析するためのアプリケーションであって、少なくとも２種の形態の各々が複数の分子を含み、アプリケーションが、（ｉ）データリンクを介して核酸シーケンサーから、少なくとも一部にタグが付けられている増幅された核酸の配列データを受け取るソフトウェアモジュールであって、配列データが、核酸の形態のうち少なくとも１種を、形態を互いに区別するために少なくとも１種のタグが付けられた核酸と連結するステップと、その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも１種の形態から増幅されたものにタグが付けられている、ステップとによって作成される、ソフトウェアモジュールと；（ｉｉ）増幅された核酸のタグが付けられた核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供することによって、増幅された核酸の配列データをアッセイするソフトウェアモジュールとを含む、アプリケーションを作製するために実行可能な命令をさらに含む、システムである。別の実施形態では、システムは、増幅された核酸のタグが付けられた核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するソフトウェアモジュールをさらに含む。システムの他のもう１つの実施形態では、アプリケーションは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。
別の実施形態は、次世代シーケンシング（ＮＧＳ）機器と；少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと；ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、（ｉ）データリンクを介してＮＧＳ機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、ヒト試料からＤＮＡ分子を物理的に分画して、２種またはそれより多い分割物を作製するステップと、２種またはそれより多い分割物の各々に差次的分子タグおよびＮＧＳを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、ＮＧＳ機器で分子タグが付けられた分割物をアッセイするステップによって作成される、ソフトウェアモジュールと；（ｉｉ）試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するためのソフトウェアモジュールと；（ｉｉｉ）試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するためのソフトウェアモジュールとを含むアプリケーションを作製するために実行可能な命令をさらに含む、システムである。システムの他のもう１つの実施形態では、システムは、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む。

【0282】

別の実施形態は、次世代シーケンシング（ＮＧＳ）機器と；少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと；ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、ＭＢＤ－ビーズによって分画されたライブラリーの分子タグ同定のためのアプリケーションであって、データリンクを介してＮＧＳ機器から配列データを受け取るように構成されたソフトウェアモジュールであって、配列データが、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質－ビーズ精製キットを使用して、抽出されたＤＮＡ試料を物理的に分画するステップと、各画分または群に差次的分子タグおよびＮＧＳを可能にするアダプター配列の並行適用を実施するステップと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的ＤＮＡプライマー配列を使用して続いて増幅するステップと、目的のゲノム領域を標的としながら、再度組み合わされ、増幅された総ライブラリーの濃縮／ハイブリダイゼーションを実施するステップと、試料タグを付加しながら、濃縮された総ＤＮＡライブラリーを再度増幅するステップと、異なる試料をプールするステップと、ＮＧＳ機器で多重でそれらをアッセイするステップとによって作成され、機器によって生成されたＮＧＳ配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にＭＢＤ分割された分子への試料のデコンボリューションのための配列データを提供する、ソフトウェアモジュールと；（ｉｉ）独特の分子を同定するために分子タグを使用し、試料を、差次的にＭＢＤ分割された分子にデコンボリューションすることによって、配列データの解析を実施するように構成されたソフトウェアモジュールとを含むアプリケーションを作製するために少なくとも１つのプロセッサーによって実行可能な命令をさらに含む、システムである。別の実施形態は、アプリケーションが、通信網を介して解析の結果を送信するように構成されたソフトウェアモジュールをさらに含むシステムである。

【0283】

別の実施形態は、（ａ）次世代シーケンシング（ＮＧＳ）機器と、（ｂ）少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、（ｃ）ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクとを含むシステムであって、デジタル処理デバイスが、ｉ）データリンクを介してＮＧＳ機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、ＮＧＳ機器を用いて分子タグが付けられた分割物をアッセイするステップとによって調製された標識された核酸とともにロードされて作成される、ソフトウェアモジュールと；ｉｉ）タグを解読するための配列データを作成するためのソフトウェアモジュールと；ｉｉｉ）タグを解読して、配列データがアッセイされた核酸が、第１または第２のプール中の鋳型から増幅されたか否かを明らかにするために配列データを解析するためのソフトウェアモジュールとを含むアプリケーションを作製するために実行可能な命令をさらに含む、システムである。別の実施形態は、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含むシステムである。

【実施例0284】

ＶＩＩ．実施例
（実施例１）
メチル結合ドメイン（ＭＢＤ）ベースの分画のための実験手順

【0285】

試料収集

【0286】

肺がん（例えば、ＮＳＣＬＣ）を抱えた対象由来の血液、血清または血漿などの試料は、ＧＵＡＲＤＡＮＴ３６０（商標）アッセイにより決定した場合、高循環腫瘍ＤＮＡ（ｃｔＤＮＡ）含有量を示したＧｕａｒｄａｎｔＨｅａｌｔｈレポジトリーから選択した。健康な正常ドナー由来の無細胞ＤＮＡ（ｃｆＤＮＡ）は、以前記載された（Lanmanら、Analytical and clinical validation of a digital sequencing panel for quantitative, highly accurate evaluation of cell-free circulating tumor DNA、PLoS ONE １０巻（１０号）:ｅ０１４０７１２頁（２０１５年））通りに血液単離血漿から抽出した。

【0287】

ｃｆＤＮＡ抽出

【0288】

試料はプロテイナーゼＫ消化に付した。ＤＮＡはイソプロパノールで沈殿させた。ＤＮＡはＤＮＡ精製カラム（例えば、ＱＩＡａｍｐＤＮＡＢｌｏｏｄＭｉｎｉＫｉｔ）上で捕捉し、１００μｌ溶液に溶出させた。５００ｂｐより下のＤＮＡはＡｍｐｕｒｅ
ＳＰＲＩ磁気ビーズ捕捉（ＰＥＧ／塩）で選択した。得られた産物は３０μｌのＨ_２Ｏに懸濁した。サイズ分布を調べ（主ピーク＝１６６ヌクレオチド；小ピーク＝３３０ヌクレオチド）、定量化した。一般に、５ｎｇの抽出ＤＮＡはおおよそ１７００半数体ゲノム等価物（「ＨＧＥ」）を含有する。ＤＮＡとＨＧＥの量間の一般的相関は以下の通りに収載された：３ｐｇのＤＮＡ＝１ＨＧＥ；３ｎｇのＤＮＡ＝１ＫＨＧＥ；３ｎｇのＤＮＡ＝１ＭＨＧＥ；１０ｐｇのＤＮＡ＝３ＨＥ；１０ｎｇのＤＮＡ＝３ＫＨＧＥ；１０ｎｇのＤＮＡ＝３ＭＨＧＥ。

【0289】

ＤＮＡ分画

【0290】

ＤＮＡは複数の画分（分割物）に分画した。ｃｆＤＮＡ（１０～１５０ｎｇ）を、反応条件を、３００ｍＭのＮａＣｌインキュベーションおよび洗浄バッファーを使用に変更し、１マイクログラムＤＮＡ入力のプロトコールをサブマイクログラム量のＤＮＡ入力にスケールダウンしたことを除いて、ＭｅｔｈｙｌＭｉｎｅｒ（商標）親和性濃縮プロトコール（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号ＭＥ１００２５）を使用して高メチル化、中間メチル化および低メチル化画分に分画した。

【0291】

ビーズ調製

【0292】

Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンを洗浄する：Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンは、ＭＢＤ－ビオチンタンパク質とのカップリングに先立って３００ｍＭのＮａＣｌを含有する洗浄バッファーを使用して洗浄した。Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンのストックを再懸濁して均質な懸濁液を得た。マイクログラムの入力ＤＮＡごとに、１０μｌのビーズを１．７ｍｌのＤＮアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は１×Ｂｉｎｄ／洗浄バッファーで１００μｌにした。チューブは磁気ラック上に１分間置いて、液体を除去して破棄する前にチューブの内壁上にビーズをすべて集めた。チューブを磁気ラックから取り出して等体積（例えば、約１００～２５０μｌ）の１×Ｂｉｎｄ／洗浄バッファーを添加してビーズを再懸濁した。再懸濁したビーズは、続けてＭＢＤ－ビオチンタンパク質をビーズにカップリングさせる前にもう１度だけ集めて洗浄した。

【0293】

Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンをＭＢＤ－ビオチンタンパク質とカップリングする：マイクログラムの入力ＤＮＡごとに、７μｌ（３．５μｇ）のＭＢＤ－ビオチンタンパク質を１．７ｍｌのＤＮアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は１×Ｂｉｎｄ／洗浄バッファー（３００ｍＭのＮａＣｌを含有する）で１００μｌにした。ＭＢＤ－ビオチンタンパク質は希釈し、最初のビーズ洗浄から再懸濁ビーズのチューブに移した。ビーズ－タンパク質混合物は、続けてＭＢＤ－ビーズを洗浄する前に、回転板混合器上、室温で１時間混合した。

【0294】

ＭＢＤ－ビーズを洗浄する：チューブ中のＭＢＤ－ビーズは、チューブを磁気ラック上に１分間置くことにより集めた。液体は取り除き破棄した。ビーズは１００～２５０μｌの１×Ｂｉｎｄ／洗浄バッファー（３００ｍＭのＮａＣｌを含有する）で再懸濁し、回転混合器上、室温で５分間混合した。ビーズは集め、さらにもう２回上記の通り洗浄し再懸濁した。次に、チューブを磁気ラック上に１分間置き、液体を慎重に取り除いて破棄した。ビーズは、メチル化ＤＮＡ捕捉前に１００～２５０μｌの１×Ｂｉｎｄ／洗浄バッファー（３００ｍＭのＮａＣｌを含有する）で再懸濁した。

【0295】

断片化したメチル化ＤＮＡをＭＢＤ－ビーズ上に捕捉しＭＢＤ－ビーズを断片化したＤＮＡと一緒にインキュベートする：一般に、入力ＤＮＡは５ｎｇ～１μｇまでの範囲であり得る。対照反応は典型的には１μｇのＫ－５６２ＤＮＡを使用する。清潔な１．７ｍｌのＤＮアーゼフリーのマイクロ遠心チューブに、２０μｌの５×洗浄／Ｂｉｎｄバッファー（３００ｍＭのＮａＣｌを含有する）を添加した。断片化した試料ＤＮＡ、例えば、５ｎｇ～１μｇをチューブに添加し、最終体積をＤＮアーゼフリーの水で１００μｌにした。ＤＮＡ／バッファー混合物をＭＢＤ－ビーズを含有するチューブに移し、回転混合器上、室温で１時間混合した。代わりに、混合物は４℃で一晩混合することが可能である。

【0296】

捕捉されていないＤＮＡをビーズ溶液から収集する：捕捉されていない／非メチル化ＤＮＡは、ＤＮＡとＭＢＤ－ビーズ混合物から収集した。ＤＮＡとＭＢＤ－ビーズの混合物を含有するチューブは磁気ラック上に１分間置いてビーズを集め、上清液は取り除いて清潔なＤＮアーゼフリーのマイクロ遠心チューブに保存した。この保存上清液は捕捉されていないＤＮＡ上清であり、氷上で保存することが可能である。ビーズは、回転混合器上３分間、２００μｌの１×Ｂｉｎｄ／洗浄バッファー（３００ｍＭのＮａＣｌを含有する）で洗浄した。ビーズは上記の通りに集め、捕捉されていない／非メチル化／低メチル化ＤＮＡを含有する上清液を取り除き、上記の通り保存し氷上で保管した。ビーズは洗浄し、混合し、集め、上清はさらにもう１度取り除いて保存して２つの洗浄画分を収集した。それぞれの洗浄画分は氷上で保管した。洗浄画分は一緒にプールし適宜に標識することが可能である。

【0297】

捕捉されたＤＮＡを溶出する：捕捉されたＤＮＡは２０００ｍＭのＮａＣｌを含有する溶出バッファーを使用して溶出させた。ビーズは２００μｌの溶出バッファー（２０００ｍＭのＮａＣｌ）に再懸濁した。ビーズは回転混合器上で３分間インキュベートし、磁気ラック上に１分間置いてすべてのビーズを集め、捕捉された／高メチル化されたＤＮＡを含有する液体は取り除いて清潔なＤＮアーゼフリーのマイクロ遠心チューブに保存した。捕捉された／メチル化されたＤＮＡの保存した第１の画分を氷上で保管した。ビーズはもう１度再懸濁してインキュベートし、捕捉された／メチル化されたＤＮＡを含有する液体を取り除き第２の清潔なチューブに保存した。捕捉された／メチル化されたＤＮＡの第１および第２の収集物をプールし氷上で保管した。

【0298】

分析のためのメチル化分画されたＤＮＡの調製：分割されたｃｆＤＮＡ、高メチル化、中間メチル化および非メチル化ＤＮＡは、例えば、ＳＰＲＩビーズクリーンアップ（ＡｍｐｕｒｅＸＰ、ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）により精製し、続いてライゲーションのために調製し（ＮＥＢＮｅｘｔ（登録商標）Ｕｌｔｒａ（商標）ＥｎｄＲｅｐａｉｒ／ｄＡ－ＴａｉｌｉｎｇＭｏｄｕｌｅを使用して）、次にLanmanら、２０１５年に記載される非ランダム分子バーコードを含有する改変Ｙ字型ｄｓＤＮＡアダプターとライゲーションさせた。高メチル化、中間メチル化および低メチル化ｃｆＤＮＡ分割物はそれぞれ１１、１２および１２の異なる非ランダム分子バーコードアダプターとライゲーションさせた。試料ごとにライゲーションさせ、分割したｃｆＤＮＡ分子をＳＰＲＩビーズ（ＡｍｐｕｒｅＸＰ）で再び精製し、次に再度組み合わせてあらゆるアダプターライゲーション分子に普遍的なオリゴ（ＮＥＢＮｅｘｔＵｌｔｒａＩＩ（商標）Ｑ５ｍａｓｔｅｒｍｉｘ）を用いてＰＣＲ反応させ、すべてのｃｆＤＮＡ分子を１つの試料から一緒に増幅させた。増幅させたＤＮＡライブラリーを、標準調製技法を使用する標的濃縮または全ゲノムシーケンシング（ＷＧＳ）に備えてＳＰＲＩビーズ（ＡｍｐｕｒｅＸＰ）を使用して再び精製した。

【0299】

標的捕捉および濃縮：ＤＮＡ試料は市販のプロトコール、例えば、イルミナマルチプレックスシーケンシングのためのＳｕｒｅＳｅｌｅｃｔ^ＸＴＴａｒｇｅｔＥｎｒｉｃｈｍｅｎｔＳｙｓｔｅｍを使用して濃縮してもよい。

【0300】

（実施例３）
ＣＤＫＮ２Ａのメチル化プロファイリング

【0301】

フラグメントームデータと併せたＤＮＡメチル化プロファイリングを使用してＣＤＫＮ２Ａ遺伝子中の差次的にメチル化された領域（ＤＭＲ）を捕捉した。ＣＤＫＮ２Ａ遺伝子は、ｐ１６ＩＮＫ４Ａおよびｐ１４ＡＲＦタンパク質をコードする腫瘍抑制遺伝子であり、これらのタンパク質は細胞周期調節に関与している。ｃｆＤＮＡ試料は、ＭＢＤ－親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。分画すると、それぞれの群内の核酸分子をシーケンシングして配列読み取りデータを作成した。配列読み取りデータは、参照ゲノムにマッピングされると、フラグメントームデータを提供し、このデータを次に分画された分割物のそれぞれ由来の配列読み取りデータと組み合わせた（図１０）。ＣＤＫＮ２Ａ遺伝子は、高メチル化分割物と比べると低メチル化分割物のカバー度の全体的な増加を示した。

【0302】

（実施例４）
正常試料および肺がん試料のメチル化プロファイル

【0303】

図１１に示されるように、ＭＢＤ分割プロセスを、健康なドナー由来の４つのｃｆＤＮＡ試料（Ｎｏｒｍ１３８９３、Ｎｏｒｍ１３９５９、Ｎｏｒｍ１３９６１、Ｎｏｒｍ１３９６２）および高％のｃｔＤＮＡを有する肺がん患者由来の２つのｃｆＤＮＡ試料（ＬｕｎｇＡ１３４５４０２、ＬｕｎｇＡ０５１６９０２）に、変動する入力量（１０～１５０ｎｇのｃｆＤＮＡ）および複製物（例えば、３つの複製物）を用いて適用した。試料は、パネル内の標的とされたすべてのゲノム遺伝子座にわたって高メチル化ＤＮＡのパーセントにより階層的にクラスター化された。パーセント高メチル化ＤＮＡは、高メチル化無細胞ＤＮＡ断片の数をすべての分割物にわたって観察される無細胞ＤＮＡ断片の総数で割ることにより決定することが可能である。パネルは約３０ｋｂゲノム領域をカバーするカスタム遺伝子パネルである。パネルは、肺がん、結腸直腸がん、等などの異なるがんを検出するためのより高い感度も有する。健康なドナー由来の試料は、肺がん患者由来の試料とは別々にクラスター化された。個々の肺がん試料は、さらに別々にクラスター化される（すなわち、それぞれの肺がん試料の複製物が正確に同定され一緒に群化される）はっきり異なるメチル化プロファイルを有していた。例えば、国際公開第２０１７／１８１１４６号、２０１７年１０月１９日を参照されたい。

【0304】

（実施例５）
全ゲノムシーケンシングを使用するメチル化プロファイリング

【0305】

ＤＮＡメチル化プロファイリングをフラグメントームデータと統合して異常な断片化パターンを、したがって、臨床試料中の変更されたクロマチン構造を判定した（図１２Ａ、図１２Ｂ、および図１２Ｃ）。核酸分子は肺がん患者由来であった。核酸分子はＭＢＤ－親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。分画すると、それぞれの分割物の核酸分子をシーケンシングして配列読み取りデータを作成した。配列読み取りデータは、参照ゲノムにマッピングされるとフラグメントームデータを提供した。ゲノム位置、断片長およびカバー度などのフラグメントームデータを、それぞれの分割物由来の配列読み取りデータと組み合わせた。図１２Ａおよび図１２Ｂに示されるように、転写開始部位（ＴＳＳ）の６００ｂｐ領域はＸ軸上にあり出現頻度またはカバー度はＹ軸に示される。図１２ＣはＸ軸に全断片と比べた場合の高メチル化断片の割合を、Ｙ軸に出現頻度を示している。例えば、図１２Ｃでは、全断片中の高メチル化断片の割合は約０．２（すなわち、約２０％）である。

【0306】

（実施例６）
ＭＯＢ３ＡおよびＷＤＲ８８のメチル化プロファイリング

【0307】

ＤＮＡメチル化プロファイリングをフラグメントームデータと統合してエピジェネティック調節の違いを判定した（図１３Ａおよび図１３Ｂ）。核酸分子はＭＢＤ－親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。分画すると、それぞれの分割物の核酸分子をシーケンシングして配列読み取りデータを作成した。配列読み取りデータは、参照ゲノムにマッピングされるとフラグメントームデータを提供した。ゲノム位置およびカバー度などのフラグメントームデータを、分画された群のそれぞれ由来の配列読み取りデータと組み合わせた。

【0308】

ＭＯＢ３Ａ遺伝子は未知の生化学的機能を有する可能性があり、腫瘍成長および増殖を維持するのに関係付けられる可能性がある。図１３Ａにあるヒートマップは、健康な個体由来の試料においてＴＳＳの開始部位近くの低メチル化と比べると高メチル化のより大きなカバー度を示した。本実施例は、分画された群とフラグメントームデータを組み合わせてがんを示し得る遺伝子のＴＳＳにおけるマーカーを検出する用途を提供した。これらのデータは、分画された群（または分割物）が、高メチル化も低メチル化も、ＴＳＳなどのゲノム領域にわたってメチル化状態を識別するためのより良好な解像度を提供することを示した。上記のように、分画された群のカバー度は、ＴＳＳにわたるメチル化状態の違いを示した。本実施例は、核酸分子を分画して遺伝子にわたってメチル化状態のより良好な解像度を提供する用途を提供した。

【0309】

ＷＤＲ８８遺伝子は、細胞周期調節、アポトーシスおよびオートファジーに関係している可能性がある。ヒートマップは、健康な個体由来の試料においてＴＳＳの開始部位近くの低メチル化と比べると高メチル化のより大きなカバー度を示した（図１３Ｂ）。さらに、図１３Ｂは、分画された群が、高メチル化も低メチル化も、ＴＳＳなどのゲノム領域にわたってメチル化状態を識別するためのより良好な解像度を提供することを示した。上記のように、分画された群のカバー度は、ＴＳＳにわたるメチル化状態の違いを示した。本実施例は、核酸分子を分画して遺伝子にわたるメチル化状態のより良好な解像度を提供する用途を提供した。

【0310】

（実施例７）
再度組み合わされた分割物および非分画試料のメチル化プロファイリング

【0311】

図１４Ａは、Ｘ軸およびＹ軸上にそれぞれ、非分画群（ＭＢＤなし）およびＭＢＤ親和性分割後の再度組み合わされた分割物（全ＭＢＤ）由来のカバー度を有するヒートマップを示している。分割物を、高および低メチル化分割物への分割後にｉｎｓｉｌｉｃｏで再度組み合わせて、「高＋低」または「全ＭＢＤ」を形成した。ヒートマップはＭＢＤなしと全ＭＤＢのカバー度間の直線相関を示している。直線相関は類似するカバー度を示しており、ゲノム遺伝子座にわたってメチル化状態の類似する解像度を提供する可能性がある。ＭＢＤなしおよび／または全ＭＢＤにより得られる解像度のレベルは、遺伝子座にわたるメチル化状態の違いを区別するには十分ではなく、ＭＢＤ親和性に基づく分割の思いがけない利点を示している可能性がある。

【0312】

図１４Ｂは、全ＭＢＤを用いたＭＶＡプロットヒートマップを示している。Ｘ軸は全ＭＢＤにおける平均断片（再度組み合わされた高および低メチル化分割物）を（ａ＋ｂ）／２として示しており、ａ＝全ＭＢＤおよびｂ＝ＭＢＤなしである。

【0313】

（実施例８）
再度組み合わされた分割物（全ＭＢＤ）と非分画試料間のヌクレオソーム組織化

【0314】

図１５に示されるように、ゲノム領域にわたる全ＭＢＤ（ｉｎｓｉｌｉｃｏで再度組み合わされた高および低メチル化分割物）とＭＢＤなし（非分画）試料についてのヌクレオソーム占有中心間の距離の違いをＸ軸にプロットした。ゲノム領域にわたる全ＭＢＤとＭＢＤなし試料についてのヌクレオソーム占有中心間の距離の分布の違いは「密度」により示されるＹ軸にプロットした。全ＭＢＤ試料は、高と低メチル化分割物をｉｎｓｉｌｉｃｏで再度組み合わせることにより調製した。これらの結果は、ＭＢＤ分割がヌクレオソーム占有に影響を及ぼさないことを示している。

【0315】

（実施例９）
ＭＢＤシグナルの検証

【0316】

ＭＢＤ分割した試料を使用して、健康な試料とがん試料のヌクレオソーム占有を識別した。本実施例では、６人の肺がん患者および３人の非悪性健康成人由来の血液試料を得た。試料由来の無細胞核酸を抽出し、ＭＢＤ－親和性精製を使用して高および低メチル化分割物に分割した。核酸試料は全ゲノムシーケンシングを使用してシーケンシングした。分割物ごとのおよびすべての試料についてのパーセント高メチル化断片を判定した。図１６は、肺がん患者（上から１および２列目）由来および健康な成人（３および４列目）由来の高および低メチル化分割物でのＭＢＤシグナルを示している。図１６に示されるように、肺がん患者由来の無細胞ＤＮＡ断片は、健康な個体由来の高メチル化分割物と比べた場合、高メチル化分割物（ＬｕｎｇＳｉｇＨｙｐｅｒ）において遠位遺伝子内領域の濃縮を示している。さらに、上の高いほうから５％のパーセント高メチル化ピーク（ＬｕｎｇＳｉｇＨｙｐｅｒ）および低メチル化ピーク（ＬｕｎｇＳｉｇＨｙｐｏ）における特徴の分布はエクソン１に加えてすべてのエクソンにおける低メチル化ピークの有意な濃縮を示している（図１６、１および２列目）。

【0317】

（実施例１０）
ＡＰ３Ｄ１遺伝子のメチル化プロファイリング

【0318】

本明細書に記載される方法を肺がんの予後のために使用した。実験では、肺がん患者由来の核酸分子を有する試料は、ＭＢＤ－親和性精製を使用して低メチル化分割物と高メチル化分割物に分画した。対照として、ある試料は分割しなかった（ＭＢＤなし）。試料は全ゲノムシーケンシングを使用してシーケンシングした。

【0319】

ＡＰ３Ｄ１遺伝子は、オルガネラ輸送に関係付けられる可能性のあるＡＰ－３コンプレックスサブユニットデルタ－１をコードしている可能性がある。ヒートマップは、ＴＳＳ近くの低メチル化分割物および／またはＭＢＤなしと比べると高メチル化分割物のより大きなカバー度を示した（図１８Ａ）。高メチル化分割物はＭＢＤなし群よりも強くおよび／またはより局在化したカバー度を示した。ヒートマップに示されるように、高メチル化分割物はＴＳＳ近くに多くの局在化した強いカバー度を有し、ＭＢＤなし群はゲノム領域にわたって類似するカバー度を有していた。平均パーセント高メチル化も図１８Ｂの赤色線により示される通りに決定された。本実施例は、核酸分子を分画して遺伝子にわたってメチル化状態のより良好な解像度を提供する用途を提供することができる。これらの結果は、ＡＰ３Ｄ１遺伝子が特にＴＳＳ近くで高メチル化されていること（図１８Ａ）およびＡＰ３１遺伝子が高メチル化されている（図１８Ｂに示される通りに＞６０％）ことを示している。ＡＰ３Ｄ１遺伝子の調節解除は肺がんを引き起こすことに関与している可能性がある。したがって、この実施例は、個体のメチル化プロファイルをモニターすることによる肺がんの予後におけるこの方法の用途を提供することができる。

【0320】

（実施例１１）
ＤＮＭＴ１遺伝子のメチル化プロファイリング

【0321】

別の実施例では、ＤＮＭＴ１遺伝子のメチル化プロファイリングを調べた。ＤＮＭＴ１遺伝子は、ＤＮＡ中の特定のＣｐＧジヌクレオチドへのメチル基の転移を触媒する酵素をコードしている。ＤＮＭＴ１は、受け継がれるエピジェネティックパターンの複製の忠実度を保証するためのＤＮＡメチル化の維持に関係付けられてきた。異常なメチル化パターンはがんおよび発生異常と関連している可能性がある。

【0322】

高メチル化、低メチル化およびＭＢＤなしのヒートマップは、ＴＳＳに関して示されている（図１９Ａ）。高メチル化分割物は、ＭＢＤなし群よりも強いおよび／またはより局在化したカバー度を示した。高メチル化分割物は、ＴＳＳ近くに局在化したより強いカバー度を有し、ＭＢＤなし群は遺伝子にわたって類似するカバー度を有していた。平均パーセント高メチル化も、図１９Ｂの赤色線により示される通り、約７５％であると判定した。これらの結果は、ＤＮＭＴ１遺伝子が特にＴＳＳ近くで高メチル化されていること（図１９Ａ）およびＤＮＭＴ１遺伝子が高メチル化されている（図１９Ｂに示される通りに約７５％）ことを示している。異常なメチル化パターンはクロマチン構造の変化とともに、肺がんを引き起こすことに関与している可能性のあるＤＮＭＴ１の調節解除をもたらす可能性がある。したがって、本実施例は、個体のメチル化プロファイルをモニターすることによる肺がんの予後におけるこの方法の用途を提供することができる。本実施例は、核酸分子を分画して遺伝子にわたってメチル化状態のより良好な解像度を提供する用途も提供することができる。

【0323】

（実施例１２）
修飾ヒストン分画

【0324】

本実施例は、修飾ヒストンアプローチを使用した分割を実証している。ＤＮＡをヒストン修飾に基づいて分割する。手短に言えば、アガロースビーズをＢＳＡでブロッキングし、洗浄に続いて、ビーズを、Ｈ３Ｋ９ｍｅ３およびＨ４Ｋ２０ｍｅ３に対する抗体（Ｍｉｌｌｉｐｏｒｅ、Ｔｅｍｅｃｕｌａ、ＣＡ、ＵＳＡ）と一緒に４℃で４時間プレインキュベートする。続いて、２００μｌの血漿を８００μｌの分割物希釈バッファー中に希釈し、次に抗体と一緒にプレインキュベートされたペレット状のアガロースビーズに添加する。４℃での一晩インキュベーションに続いて、ビーズを低塩、高塩、ＬｉＣｌおよびＴｒｉｓ／ＥＤＴＡバッファーで洗浄する。最後に、クロマチンを６５℃でビーズをインキュベートすることにより溶出させ、タンパク質をプロテイナーゼＫを用いた処理により取り除く。次に、分割されたＤＮＡを適切な精製キットを使用して精製し、－２０℃で保存した。

【0325】

（実施例１３）
タンパク質結合領域に基づく分画

【0326】

本実施例は、タンパク質結合領域を使用した分割アプローチを実証する。ＤＮＡを、プロテインＡへの結合の違いに基づいて分割する。試料中の核酸分子もタンパク質結合領域に基づいて分画することが可能である。例えば、核酸分子は、特定のタンパク質に結合している核酸分子およびその特定のタンパク質に結合していない核酸分子に基づいて異なる群に分画することが可能である。核酸分子はＤＮＡ－タンパク質結合に基づいて分画することが可能である。タンパク質－ＤＮＡ複合体は、タンパク質の特定の特性に基づいて分画することが可能である。そのような特性の例は、種々のエピトープ、修飾（例えば、ヒストンメチル化またはアセチル化）または酵素活性を含む。ＤＮＡに結合し分画の根拠として役立つことができるタンパク質の例は、例えば、プロテインＡまたはプロテインＧを含んでいてもよい。クロマチン免疫沈降などの実験手順を使用して、プロテインＡ結合領域に基づいて核酸分子を分画する。

【0327】

（実施例１４）
ヒドロキシメチル化に基づいて分画する

【0328】

本実施例は、修飾ヒストンアプローチを使用した分割を実証する。ＤＮＡをヒドロキシメチル化に基づいて分割する。手短に言えば、５－ｈｍＣ－修飾塩基をｉｎｖｉｔｒｏでグリコシル化させる。５－ｈｍＣの特定のグルコシル化は、ＺｙｍｏＲｅｓｅａｒｃｈ製の高度に活性な５－ｈｍＣグリコシルトランスフェラーゼ酵素のプロトコールに従うことにより達成される（zymoresearch.com/epigenetics/dna-hydroxymethylation/5-hmc-glucosyltransferase）。Ｊ－結合タンパク質－１（ＪＢＰ－１）は、高親和性でグリコ
シル化ＤＮＡに特異的に結合し、５－ｈｍＣレベルをＪＢＰ－１ベースの濃縮により決定するのが可能になる。さらに、５－ｈｍＣのグリコシル化はいくつかの制限酵素によるＤＮＡの消化を変更し、したがって、５－ｈｍＣ－グリコシル化ＤＮＡの消化パターンを使用すればＤＮＡヒドロキシメチル化状態を評価することが可能になる。

【0329】

（実施例１５）
核酸分子の鎖の状態に基づいて分画する

【0330】

試料中の核酸分子を鎖の状態に基づいて分画する。例えば、ｓｓＤＮＡおよびｄｓＤＮＡは２つの群に分画される。これらの群は、個別にまたは同時にシーケンシングアッセイに付す。ｓｓＤＮＡとｄｓＤＮＡの両方を有する核酸試料は、分画中試料を変性ステップに付さないことにより分画する。変性ステップはｄｓＤＮＡをｓｓＤＮＡに変換し、鎖の状態に基づく核酸分子の分画ができなくなる。

【0331】

（実施例１６）
改変プレ増幅標的捕捉プロトコール（ＮＥＢＮｅｘｔＤｉｒｅｃｔ）を用いたｓｓＤＮＡおよびｄｓＤＮＡの分子分割

【0332】

新規のハイブリッド捕捉法は、プレ増幅ハイブリッド捕捉標的シーケンシングプロトコール（例えば、ＮＥＢＮｅｘｔＤｉｒｅｃｔＨｏｔＳｐｏｔＣａｎｃｅｒＰａｎｅｌ）をＤＮＡ変性なしで無細胞ＤＮＡ（ｃｆＤＮＡ）試料に適用して、ｓｓＤＮＡ分子を捕捉した（図１８）。

【0333】

ｄｓＤＮＡ分子を含有する非結合画分を単離し、ｓｓＤＮＡに変性させ、捕捉プロトコールに適用した。

【0334】

使用されたプレ増幅ハイブリッド捕捉シーケンシングプロトコールはＮＥＢＮｅｘｔＤｉｒｅｃｔＨｏｔＳｐｏｔＣａｎｃｅｒＰａｎｅｌであり、５０の遺伝子由来の１９０の一般的がん標的のベイトを含有し、およそ４０ｋｂの配列を包含し、１８，０００を超えるＣＯＳＭＩＣフィーチャーを含んだ（NEBNext Direct HotSpot Cancer Panel; neb.com/products/e7000-nebnext-direct-cancer-hotspot-panel）。手短に言えば、ＮＥＢＮｅｘｔＤｉｒｅｃｔ標的濃縮アプローチは、ＤＮＡ試料をビオチン化オリゴヌクレオチドベイトに迅速にハイブリダイズさせ、このベイトは目的のそれぞれの標的の３’末端を定義する。ベイト－標的ハイブリッドはストレプトアビジンビーズに結合していて、酵素反応を使用して３’オフターゲット配列を取り除いた。続いて起こるライブラリー調製は標的を、分子タグおよび試料バーコードを含むＩｌｌｕｍｉｎａコンパチブルライブラリーに変換した。キットの使用により、ベイトとのハイブリダイゼーションに先立ってＤＮＡ試料を変性することにより試料中のすべてのｓｓＤＮＡおよびｄｓＤＮＡ分子の捕捉が可能になった。

【0335】

ｓｓ－およびｄｓ－ｃｆＤＮＡを含有するｃｆＤＮＡ試料を、事前ｄｓＤＮＡ変性ステップを省いた標的捕捉プロトコールに付した。捕捉されたｓｓＤＮＡ分子はＮＥＢＮｅｘｔプロトコールによるＮＧＳのために準備し（図２０の左欄）、捕捉物由来の上清は、標準的な事前ｄｓＤＮＡ変性ステップのある第２の標的捕捉プロトコールに適用させ、それに続いてＮＧＳのために準備した（図２０の右欄）。血漿から抽出されたｃｆＤＮＡを電気泳動ベースの測定により定量化した。２００ｎｇまたは５００ｎｇに相当する試料体積を、ｓｓＤＮＡ分子だけがベイトにハイブリダイズするように、ＤＮＡ変性ステップを省いた、ＮＥＢＮｅｘｔＤｉｒｅｃｔＨｏｔＳｐｏｔＣａｎｃｅｒＰａｎｅｌアッセイに適用させた。ｄｓＤＮＡ分子および非標的ｓｓＤＮＡ分子を含有する捕捉物の上清は保持して、第２の標的捕捉に付した（図２０）。ｓｓＤＮＡとｄｓＤＮＡライブラリーの両方をＮＧＳのために、下流バイオインフォマティクス分析で同定される独特の試料バーコードタグ付きで、別々に調製された。ｓｓＤＮＡとｄｓＤＮＡ調製ライブラリーの両方をＩｌｌｕｍｉｎａＮｅｘｔＳｅｑ５００（２×７５の対をなす末端）上でシーケンシングし、オンターゲット分子（４０ｋｂベイトに対応する）の総数をコンピュータで計算した（図１）。

【0336】

一本鎖無細胞ＤＮＡ（ｓｓ－ｃｆＤＮＡ）と二本鎖無細胞ＤＮＡ（ｄｓ－ｃｆＤＮＡ）の両方を有する無細胞ＤＮＡ（ｃｆＤＮＡ）試料は、上記の方法を使用して、それぞれｓｓ－ｃｆＤＮＡ群とｄｓ－ｃｆＤＮＡ群に分画した（図２０）。シーケンシングした試料のうちの２つで、ｓｓＤＮＡライブラリーは約８０％のｄｓＤＮＡを含有する（オンターゲット分子、第１は２００ｎｇおよび第２は５００ｎｇのｃｆＤＮＡ入力）。第２の２００ｎｇのｃｆＤＮＡはｓｓＤＮＡとｄｓＤＮＡライブラリーの両方を作成できず、ｓｓＤＮＡ／ｄｓＤＮＡ分割プロセスの上流の試料処理における予想される誤りを示し、第１の５００ｎｇのｃｆＤＮＡ入力は重要なｄｓＤＮＡライブラリーのみを作成し、これによりｃｆＤＮＡ試料中のｓｓＤＮＡとｄｓＤＮＡの相対量は変わりやすいことが示唆された。オンターゲット分子は、ＢｒｏａｄＩｎｓｔｉｔｕｔｅからのＰｉｃａｒｄパッケージ（Picard metrics; broadinstitute.github.io/picard/picard-metric-definitions.html）により定義される通りにコンピュータで計算した。この実験でのＰＣＲ収量は図２０に示した。相対収量、ｓｓＤＮＡのＰＣＲ収量／ｄｓＤＮＡのＰＣＲ収量は、４つすべての試料において２０％と７５％の間であると判定された。

【0337】

（実施例１７）
ＭＢＤベースのメチル化分割法を用いて保持される感度のよい体細胞突然変異検出

【0338】

試料収集およびプール化

【0339】

試料は、高ｃｆＤＮＡ収量を示したＧｕａｒｄａｎｔＨｅａｌｔｈレポジトリーから選択した。臨床試料は９６の試料を等しい体積で混合することにより調製した。これは、プールが参照ゲノム由来の突然変異を＜０．０２％から１００％で含有するので、突然変異検出に対するアッセイ感度のための試験物質としての役割を果たす。独自成分の試料を有する２つの異なる臨床試料（ＰｏｗｅｒｐｏｏｌＶ１およびＰｏｗｅｒｐｏｏｌＶ２）を調製した。

【0340】

ＤＮＡ分割

【0341】

ＰｏｗｅｒｐｏｏｌｃｆＤＮＡを複数の画分に分割した。ｃｆＤＮＡ（１５または１５０ｎｇ）は、反応条件を、３００ｍＭのＮａＣｌインキュベーションおよび洗浄バッファーを使用に変更し、１マイクログラムＤＮＡ入力のプロトコールをサブマイクログラム量のＤＮＡ入力に直線的にスケールダウンしたことを除いて、ＭｅｔｈｙｌＭｉｎｅｒ（商標）親和性濃縮プロトコール（ＴｈｅｒｍｏＦｉｓｈｅｒＳｃｉｅｎｔｉｆｉｃ、カタログ番号ＭＥ１００２５）を使用して高メチル化、中間メチル化および低メチル化画分に分割した。

【0342】

ビーズ調製

【0343】

Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンを洗浄する

【0344】

Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンは、ＭＢＤ－ビオチンタンパク質とのカップリングに先立って１×Ｂｉｎｄ／洗浄バッファー（１６０ｍＭのＮａＣｌを含有する）を使用して洗浄した。手短に言えば、Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンのストックを再懸濁して均質な懸濁液を得た。マイクログラムの入力ＤＮＡごとに、１０μｌのビーズを１．７ｍｌのＤＮアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は１×Ｂｉｎｄ／洗浄バッファーで１００μｌにした。チューブは磁気ラック上に１分間置いて、液体を除去して破棄する前にチューブの内壁上にビーズをすべて集めた。チューブを磁気ラックから取り出して等体積（例えば、約１００～２５０μｌ）の１×Ｂｉｎｄ／洗浄バッファーを添加してビーズを再懸濁した。再懸濁したビーズは、続けてＭＢＤ－ビオチンタンパク質をビーズにカップリングさせる前にもう１度集めて洗浄した。

【0345】

Ｄｙｎａｂｅａｄｓ（登録商標）Ｍ－２８０ストレプトアビジンをＭＢＤ－ビオチンタンパク質とカップリングさせる

【0346】

マイクログラムの入力ＤＮＡごとに、７μｌ（３．５μｇ）のＭＢＤ－ビオチンタンパク質を１．７ｍｌのＤＮアーゼフリーのマイクロ遠心チューブに添加した。ビーズ体積は１×Ｂｉｎｄ／洗浄バッファー（３００ｍＭのＮａＣｌを含有する）で１００μｌにした。ＭＢＤ－ビオチンタンパク質は希釈し、最初のビーズ洗浄から再懸濁ビーズのチューブに移した。ビーズ－タンパク質混合物は、続けてＭＢＤ－ビーズを洗浄する前に、回転板混合器上、室温で１時間混合した。

【0347】

ＭＢＤ－ビーズを洗浄する

【0348】

ＭＢＤ－ビーズを含有するチューブは、ＭＢＤ－ビーズを磁気ラック上に１分間置くことにより集めた。液体は取り除き破棄した。ビーズは１００～２５０μｌの１×Ｂｉｎｄ／洗浄バッファー（１６０ｍＭのＮａＣｌを含有する）で再懸濁し、回転混合器上、室温で５分間混合した。ビーズは集め、さらにもう２回上記の通り洗浄し再懸濁した。次に、チューブを磁気ラック上に１分間置き、液体を慎重に取り除いて破棄した。ビーズは、使用されたストレプトアビジンビーズのそれぞれのμｌあたり１０μｌの１×ＤＮＡ捕捉バッファー（３００ｍＭのＮａＣｌを含有する）で再懸濁した。

【0349】

断片化したメチル化ＤＮＡをＭＢＤ－ビーズ上に捕捉する

【0350】

ＭＢＤ－ビーズを断片化したＤＮＡと一緒にインキュベートする

【0351】

一般に、入力ＤＮＡは５ｎｇ～１μｇまでの範囲であり得る。対照反応は典型的には１μｇのＫ－５６２ＤＮＡを使用した。清潔な１．７ｍｌのＤＮアーゼフリーのマイクロ遠心チューブまたはＰＣＲチューブに、断片化した試料ＤＮＡ、例えば、５ｎｇ～１μｇを、等体積の２×ＤＮＡ捕捉バッファー（３００ｍＭのＮａＣｌを含有する）と一緒にチューブに添加し、最終体積を１×ＤＮＡ捕捉バッファーで１００または２００μｌにした。ＤＮＡ／バッファー混合物をＭＢＤ－ビーズを含有するチューブに移し、回転混合器上、室温で１時間混合した。代わりに、混合物は４℃で一晩混合することが可能である。

【0352】

捕捉されていないＤＮＡをビーズ溶液から収集する

【0353】

捕捉されていない／非メチル化ＤＮＡは、ＤＮＡとＭＢＤ－ビーズ混合物から収集した。手短に言えば、ＤＮＡとＭＢＤ－ビーズの混合物を含有するチューブは磁気ラック上に１分間置いてビーズをすべて集め、上清液は取り除いて清潔なＤＮアーゼフリーのマイクロ遠心チューブに保存した。この保存上清液は捕捉されていないＤＮＡ上清／非メチル化ＤＮＡ画分であり、氷上で保存することが可能である。ビーズは、回転混合器上３分間、２００μｌの１×ＤＮＡ捕捉バッファー（３００ｍＭのＮａＣｌを含有する）で洗浄した。ビーズは上記の通りに集め、捕捉されていない／非メチル化／低メチル化ＤＮＡを含有する上清液を取り除き、保存し上記の通り氷上で保管した。ビーズは洗浄し、混合し、集め、上清はさらにもう１度取り除いて保存して２つの洗浄画分を収集した。それぞれの洗浄画分は氷上で保管した。洗浄画分は一緒にプールし適宜に標識することが可能である。

【0354】

捕捉されたＤＮＡを溶出する

【0355】

捕捉されたＤＮＡは２０００ｍＭのＮａＣｌを含有する溶出バッファーを使用して溶出させた。ビーズは２００μｌの溶出バッファー（２０００ｍＭのＮａＣｌ）に再懸濁した。ビーズは回転混合器上で３分間インキュベートし、磁気ラック上に１分間置いてすべてのビーズを集め、捕捉された／高メチル化されたＤＮＡを含有する液体は取り除いて清潔なＤＮアーゼフリーのマイクロ遠心チューブに保存した。保存した最初の画分は氷上で保管した。ビーズはもう１度再懸濁してインキュベートし、捕捉された／メチル化されたＤＮＡを含有する液体を取り除き第２の清潔なチューブに保存した。捕捉された／メチル化されたＤＮＡの第１および第２の収集物をプールし氷上で保管した。代わりに、増加するＮａＣｌ濃度を用いた複数の溶出を実施すれば、ＤＮＡメチル化が増加する画分にＤＮＡをさらに分割することが可能である。

【0356】

分析のためのメチル化分画されたＤＮＡの調製

【0357】

分割されたｃｆＤＮＡ、メチル化、中間メチル化および非メチル化ＤＮＡは、例えば、ＳＰＲＩビーズクリーンアップ（ＡｍｐｕｒｅＸＰ、ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）により精製し、続いてライゲーションのために調製し（ＮＥＢＮｅｘｔ（登録商標）Ｕｌｔｒａ（商標）ＥｎｄＲｅｐａｉｒ／ｄＡ－ＴａｉｌｉｎｇＭｏｄｕｌｅを使用して）、次にLanmanら、２０１５年に記載される非ランダム分子バーコードを含有する改変Ｙ字型ｄｓＤＮＡアダプターとライゲーションさせた。高メチル化、中間メチル化および低メチル化ｃｆＤＮＡ分割物はそれぞれ１１、１２および１２の異なる非ランダム分子バーコードアダプターとライゲーションさせた。試料ごとにライゲーションさせ、分割したｃｆＤＮＡ分子をＳＰＲＩビーズ（ＡｍｐｕｒｅＸＰ）で再び精製し、次に再度組み合わせてあらゆるアダプターライゲーション分子に普遍的なオリゴ（ＮＥＢＮｅｘｔＵｌｔｒａＩＩ（商標）Ｑ５ｍａｓｔｅｒｍｉｘ）を用いてＰＣＲ反応させ、すべてのｃｆＤＮＡ分子を１つの試料から一緒に増幅させた。増幅させたＤＮＡライブラリーを、ハイブリッド捕捉による標的濃縮に備えてＳＰＲＩビーズ（ＡｍｐｕｒｅＸＰ）を使用して再び精製した（ＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔ３０ｋｂパネル；「パネル」）。

【0358】

分析のための非分割ＤＮＡの調製

【0359】

ＰｏｗｅｒｐｏｏｌｃｆＤＮＡ（１０または１５０ｎｇ）をライゲーションのために調製し（ＮＥＢＮｅｘｔ（登録商標）Ｕｌｔｒａ（商標）ＥｎｄＲｅｐａｉｒ／ｄＡ－ＴａｉｌｉｎｇＭｏｄｕｌｅを使用して）、次にLanmanら、２０１５年に記載される非ランダム分子バーコードを含有する改変Ｙ字型ｄｓＤＮＡアダプターとライゲーションさせた。ｃｆＤＮＡは３５の異なる非ランダム分子バーコードアダプターとライゲーションさせた。試料ごとにライゲーションされたｃｆＤＮＡ分子をＳＰＲＩビーズ（ＡｍｐｕｒｅＸＰ）で再び精製し、次にあらゆるアダプターライゲーション分子に普遍的なオリゴ（ＮＥＢＮｅｘｔＵｌｔｒａＩＩ（商標）Ｑ５ｍａｓｔｅｒｍｉｘ）を用いてＰＣＲ反応させ、すべてのｃｆＤＮＡ分子を１つの試料から一緒に増幅させた。増幅させたＤＮＡライブラリーを、ハイブリッド捕捉による標的濃縮に備えてＳＰＲＩビーズ（ＡｍｐｕｒｅＸＰ）を使用して再び精製した（ＡｇｉｌｅｎｔＳｕｒｅＳｅｌｅｃｔ３０ｋｂパネル；「パネル」）。

【0360】

本開示は、異なる形態（例えば、ＲＮＡおよびＤＮＡ、一本鎖または二本鎖）および／または修飾の程度（例えば、シトシンメチル化、タンパク質との会合）を含有する核酸集団を処理するための方法を提供する。これらの方法は、複数の形態について配列情報が得ることができるように試料中の核酸の複数の形態および／または修飾に適応する。方法はまた、配列の分析をエピジェネティック解析と組み合わせることができるように、処理および分析を通じて複数の形態または修飾状態の同一性を保つ。

【0361】

データ解析

【0362】

異なる試料由来のＤＮＡライブラリーをプールし、ＩｌｌｕｍｉｎａＨｉＳｅｑ２５００、２×１５０対末端シーケンシング上で配列決定した。バイオインフォマティクス処理はLanmanら、２０１５年および他の場所に記載される標準ＧＵＡＲＤＡＮＴ３６０（商標）プロトコールにより実施した。ＭＢＤ分割試料では、さらに分子バーコードを使用して、ＤＮＡが分画されていた（高メチル化、中間メチル化、および低メチル化）ＭＢＤ分割物を同定した。パネルにより標的にされるそれぞれのゲノム遺伝子座では、高メチル化された、中間メチル化された、および低メチル化されたアラインされた分子を合計した。％高メチル化は所与の遺伝子座で、高メチル化されている遺伝子座にまたがる全分子の割合として定義した。ＭＢＤ分割された試料と非分割ＤＮＡ試料の両方では、標的領域において、商標付きのＧｕａｒｄａｎｔＨｅａｌｔｈバリアントコーリングソフトウェアを使用して参照ゲノム由来の突然変異対立遺伝子画分（ＭＡＦ）を呼び出した。

【0363】

（実施例１８）
標的シーケンシングアッセイにおけるＭＢＤおよび非ＭＢＤ試料についてのカバー度間の比較

【0364】

本実施例では、試料は実施例１７に記載される通りに処理した。ｃｆＤＮＡの異なる臨床試料（ＰｏｗｅｒｐｏｏｌＶ１およびＰｏｗｅｒｐｏｏｌＶ２）を、標的シーケンシングアッセイにおいて、ＭＢＤ－分割、「ＭＢＤ」および「非ＭＢＤ」ありおよびなしで、それぞれ３通りアッセイした。パネル由来の遺伝子についてのそれぞれの標的ゲノム位置で配列決定された独特の分子は、ＰｏｗｅｒｐｏｏｌＶ１について１５ｎｇ（図２５Ａ）および１５０ｎｇ（図２５Ｂ）アッセイ入力でＭＢＤおよび非ＭＢＤにおいて比較した。パネルは約３０ｋｂゲノム領域をカバーするカスタム遺伝子パネルである。パネルは、肺がん、結腸直腸がん、等などの異なるがんを検出するのにより高い感度も有する。図２５Ａおよび図２５Ｂは、ＭＢＤ分割の用途で保持された標的シーケンシングアッセイでの分子の高効率回収を示している。ｐｏｗｅｒｐｏｏｌＶ１（ａ）１５ｎｇおよび（ｂ）１５０ｎｇ入力の標的シーケンシングアッセイからの分子数は、ＭＢＤ－分割あり（Ｙ軸）またはそれなしでも延びる。ＭＢＤから非ＭＢＤ分子数またはカバー度間で直線相関が観察され、ＭＢＤ分割はアッセイの回収を偏らせないことを示している。

【0365】

パネル由来の遺伝子についての分子数またはカバー度を、非ＭＢＤとＭＢＤ試料の間で比較した。ＭＢＤおよび非ＭＢＤ試料は、２つの臨床試料から抽出した１５ｎｇ入力ｃｆＤＮＡを使用して（図２６Ａ－ＰｏｗｅｒｐｏｏｌＶ１および図２６Ｂ－ＰｏｗｅｒｐｏｏｌＶ２）または２つの臨床試料から抽出した１５０ｎｇ入力ｃｆＤＮＡを使用して（図２７Ａ－ＰｏｗｅｒｐｏｏｌＶ１；図２７Ｂ－ＰｏｗｅｒｐｏｏｌＶ２）調製した。左のグラフのＸ軸は分子数またはカバー度を表し、中央のグラフのＸ軸は両方の対末端読み取りデータで確認された突然変異を表し（二本鎖オーバーラップ；ＤＳＯ）、左のグラフのＸ軸は両方のＤＮＡ鎖が配列決定される分子数を表す（二本鎖サポート；ＤＳ）。分子数、ＤＳＯおよびＤＳについてのＭＢＤと非ＭＢＤ試料の間の強い相関は、非ＭＢＤと比べた場合、ＭＢＤ試料が分子の大半を捕捉することが可能であることを示している（図２６Ａで約９４％、図２６Ｂおよび図２７Ａで約８０～８５％、ならびに図２７Ｂで約９０％）。パネルにわたって、分子カバー度、ならびに他の重要なバリアントコーリング測定基準（ＤＳＯ、ＤＳ）における位置バイアスはない。

【0366】

（実施例１９）
ＭＢＤおよび非ＭＢＤ試料におけるバリアント検出の感度および特異性

【0367】

本実施例では、試料は実施例１７に記載の通りに処理した。感度および特異性に関するバリアントまたは突然変異検出に対する影響を測定するため、１５ｎｇ入力ｃｆＤＮＡを使用してパネル中の遺伝子について、ＭＢＤ（Ｙ軸）試料と非ＭＢＤ（Ｘ軸）試料の間の突然変異対立遺伝子分画（ＭＡＦ）を比較した。異なるＭＡＦレンジ、例えば、０～１００％（図２８Ａ）、０～５％（図２８Ｂ）および０～０．５％（図２８Ｃ）をＸ軸にプロットした。ＭＡＦ値はＭＢＤおよび非ＭＢＤ由来の３通りの試料由来である。ＭＢＤ試料について決定されたＭＡＦは、非ＭＢＤ試料について決定されたＭＡＦに一致していた。ＭＢＤと非ＭＢＤの間のＭＡＦは、１５ｎｇ入力（図２８Ａ；０～１００％）でおよび低い検出限界（図２８Ｂ；０～５％）でＰｏｗｅｒｐｏｏｌＶ１について直線相関を示した。ＭＢＤと非ＭＢＤの間のＭＡＦは、検出限界よりも下では十分相関していなかった（図２８Ｃ；０～０．５％ＭＡＦ）。同様に、ＭＢＤおよび非ＭＢＤ試料は、ＰｏｗｅｒｐｏｏｌＶ１由来の１５０ｎｇｃｆＤＮＡ入力ではＭＡＦでの一致を示した（図２９Ａおよび図２９Ｂ）が、０～０．５％レンジでは強い一致はなかった（図２９Ｃ）。

【0368】

（実施例２０）
全ゲノムシーケンシングを使用するプロモーター領域のメチル化プロファイリング

【0369】

分子分割試料は、がんの無細胞ＤＮＡ断片占有率および検出などのゲノム構造の分析を高めることができる。例えば、転写関連高メチル化事象は、メチル化駆動遺伝子サイレンシングを介して通常がんが標的にする腫瘍抑制遺伝子のプロモーター領域を分析する場合に、無細胞ＤＮＡ断片占有率を考慮することにより検出することが可能である。異なるＭＢＤ分割物において無細胞ＤＮＡ断片占有率シグナルおよび高メチル化画分を共に調べると、がん試料における転写関連高メチル化事象および遺伝子サイレンシングのＭＢＤ駆動発見の実行可能性を確認することができる。

【0370】

説明的例として、一般に公開されているジェンコード（gencode）（ｖ２６ｌｉｆｔ３
７）データを使用して、非悪性健康成人の利用可能なコホート内のすべてのジェンコード遺伝子のＴＳＳ領域におけるパーセント高メチル化（高メチル化分割物における断片の数／すべてのＭＢＤ分割物における断片の総数）を生み出すことができる。無細胞ＤＮＡ断片占有率シグナルは非悪性健康成人のコホートにわたって集めることができる。すべてのＴＳＳは、ＭＢＤ分割アッセイにおいて観察されるパーセント高メチル化画分に基づいてビニングして（bin）もよい。それぞれのビン中の非ＭＢＤＷＳＧコホートの断片占有
率を調べてもよい。図２３は遺伝子発現とメチル化状態の相関を示している。プロモータープロファイルでのＷＧＳ占有率対パーセントＭＢＤメチル化が示されている。図２３に見られるように、低メチル化ＤＮＡ（０～０．１％高）はＴＳＳ付近では低断片占有カバー度を有し、高メチル化ＤＮＡ（１０～５０％高または＞５０％高）はＴＳＳ付近では高断片占有カバー度およびはっきり異なるＮＤＲを有する。いくつかの場合、低メチル化ＤＮＡの断片占有カバー度を使用して、配列深度および／または配列のマッピング可能性を正規化する。高メチル化または低メチル化核酸断片のパーセントは、高メチル化または低メチル化無細胞断片の数をすべての分割物にわたって観察される無細胞ＤＮＡ断片の総数で割ることにより決定することが可能である。

【0371】

（実施例２１）
ＭＢＤ試料と全ゲノムバイサルファイトシーケンシング（ＷＧＢＳ）試料におけるメチル化レベル間の比較

【0372】

ＭＢＤプロトコールを使用して調製される種々の分割物での断片のメチル化レベルを評価するため、よく特徴付けられた試料、ＮＡ１２８７８（catalog.coriell.org/0/Sections/Search/Sample_Detail.aspx?Ref=GM12878）を使用した。試料は高－、低－および中間メチル化部分に分割され、続いて実施例１に記載される通りにｉｎｓｉｌｉｃｏで分割物（ＭＢＤ試料）が再度組み合わされる。ＭＢＤ試料を、全ゲノムバイサルファイトシーケンシング（ＷＧＢＳ）を利用する、一般に公開されている標準メチル化データセット（basespace.illumina.com/datacentral (HiSeq 4000: TruSeq DNA Methylation (NA12878, 1x151))）と比較した。ＷＧＢＳは、個々のシトシンのメチル化状態を調べる。
図３１は、１６０ｂｐウィンドウにおいてＷＧＢＳ（Ｘ軸）およびＭＢＤ（Ｙ軸）により測定される場合、平均メチル化レベルの相関を示している。ＭＢＤメチル化レベルは、区分されたそのウィンドウに入る高メチル化分割物中の読み取りデータの数を高－および低メチル化分割物中の読み取りデータの総数で割ることによりコンピュータで計算した。ＷＧＢＳメチル化レベルは、ウィンドウ中でメチル化塩基の数をメチル化および非メチル化塩基の数で割ることによりコンピュータで計算した。この実験はいくつかの異なるビーズ比にわたって行い、ビーズ比はメチル化断片の分割に影響を与える。ビーズが少なければ、高メチル化分割物は高度にメチル化された断片に制限され（すなわち、アッセイをメチル化にとってより特異的にし）、ビーズが多ければ、断片を高分割物に入れるのに必要なメチル化の量を減少させる（すなわち、アッセイをメチル化に対してより感度よくする）。経験的に、１：５０という入力ＤＮＡ：ビーズ比は、分割された断片とそのメチル化レベルの間で相互に関連があることが分かった。これらの結果は、ＭＢＤ分割が試料の根底にあるメチル化状態を確かに正確に反映していることを示している。

【0373】

この分析では、断片中のＣＧ部位の数のその断片の分割に対する効果を判定した。非常に高－または低メチル化（以前の分析で計算された全ゲノムバイサルファイトシーケンシングメチル化レベル＞９０％または＜１０％）を示す標準メチル化データセット（ＮＡ１２８７８；以前の分析と同じ）と一緒に一般に公開されている断片を分析のために選択した。これらの断片は、それが含有したＣＧ部位の数により層別化した。３またはそれよりも多いＣＧ部位を有する高度メチル化断片は最後には高メチル化分割物になり、アッセイが少量のメチル化に感度がよいことを示した（図３１Ａ）。逆に、メチル化を欠く断片は、断片中のＣＧ部位の数とは無関係に主に低メチル化分割物に分割され、アッセイが高度な特異性を有することを示している（図３１Ｂ）。

【0374】

本開示の好ましい実施形態が本明細書で示され記載されてきたが、そのような実施形態は例としてのみ提供されることは当業者には明らかであろう。数多くの変形、変化、および代替が本開示から逸脱することなく今や当業者には浮かぶであろう。本明細書に記載される開示の実施形態の種々の代替物は本開示を実行する際に用いてもよいことは理解されるべきである。以下の特許請求の範囲が本開示の範囲を定義すること、およびこれらの特許請求の範囲およびその等価物の範囲内の方法および構造物はそれによって包含されることが意図されている。

【0375】

本発明のいくつかの実施形態

【0376】

特許請求の範囲の形式で提供される本発明のいくつかの実施形態が、以下に提供される。
１．二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析する方法であって、少なくとも２種の形態の各々が、複数の分子を含み、方法が、
（ａ）核酸の形態のうち少なくとも１種を、形態を互いに区別するために少なくとも１種のタグ核酸と連結するステップと、
（ｂ）その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも１種の形態から増幅されたものにタグが付けられている、ステップと、
（ｃ）増幅された核酸の少なくとも一部にタグが付けられている増幅された核酸の配列データをアッセイするステップであって、アッセイするステップによって、増幅された核酸のタグ核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供する、ステップと
を含む、方法。
１Ａ．増幅された核酸のタグ核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するステップをさらに含む、請求項１に記載の方法。
２．形態のうち少なくとも１種を、その他の形態のうち１種または複数に対して濃縮するステップをさらに含む、請求項１に記載の方法。
３．集団中の核酸の各形態の分子の少なくとも７０％がステップ（ｂ）において増幅される、請求項１に記載の方法。
４．少なくとも３種の形態の核酸が集団中に存在し、形態のうち少なくとも２種が、３種の形態の各々を互いに区別する異なるタグ核酸形態に連結されている、請求項１に記載の方法。
５．集団中の少なくとも３種の形態の核酸の各々が、異なるタグに連結されている、請求項４に記載の方法。
６．同一形態の各分子が、同一の同定情報タグを含むタグに連結されている、請求項１に記載の方法。
７．同一形態の分子が、異なる種類のタグに連結されている、請求項１に記載の方法。
８．ステップ（ａ）が、集団を、タグが付けられたプライマーを用いる逆転写に付すステップを含み、タグが付けられたプライマーが、集団中のＲＮＡから作製されたｃＤＮＡ中に組み込まれる、請求項１に記載の方法。
９．逆転写が、配列特異的である、請求項８に記載の方法。
１０．逆転写がランダムである、請求項８に記載の方法。
１１．ｃＤＮＡと二本鎖を形成しているＲＮＡを分解するステップをさらに含む、請求項８に記載の方法。
１２．一本鎖ＤＮＡを二本鎖ＤＮＡから分離するステップと、核酸タグを二本鎖ＤＮＡにライゲーションするステップとをさらに含む、請求項４に記載の方法。
１３．一本鎖ＤＮＡが、１種または複数の捕捉用プローブとのハイブリダイゼーションによって分離される、請求項１２に記載の方法。
１４．ｃｉｒｃｌｉｇａｓｅを用いて一本鎖ＤＮＡを環状化するステップと、核酸タグを二本鎖ＤＮＡにライゲーションするステップとをさらに含む、請求項４に記載の方法。
１５．アッセイするステップの前に、異なる形態の核酸を含むタグが付けられた核酸をプールするステップを含む、請求項１に記載の方法。
１６．核酸集団が、体液試料に由来する、前記の請求項のうちいずれかに記載の方法。
１７．体液試料が、血液、血清または血漿である、請求項１６に記載の方法。
１８．核酸集団が、無細胞核酸集団である、請求項１に記載の方法。
１９．体液試料が、がんを有すると疑われる対象に由来する、請求項１７に記載の方法。
２０．配列データが、体細胞または生殖系列変異の存在を示す、請求項１から１９に記載の方法。
２１．配列データが、コピー数変異の存在を示す、請求項１から２０に記載の方法。
２２．配列データが、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す、請求項１から２１に記載の方法。
２３．異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、
核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、
作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、
第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、
標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、
増幅された核酸および連結されたタグの配列データをアッセイするステップであって、アッセイするステップによって、タグを解読するための配列データを得て、配列データがアッセイされた核酸が、第１または第２のプール中の鋳型から増幅されたか否かを明らかにする、ステップと
を含む方法。
２３Ａ．タグを解読して、配列データがアッセイされた核酸が、第１または第２のプール中の鋳型から増幅されたか否かを明らかにするステップを含む、請求項２３に記載の方法。
２４．修飾が、核酸のタンパク質との結合である、請求項２３に記載の方法。
２５．タンパク質が、ヒストンまたは転写因子である、請求項２３に記載の方法。
２６．修飾が、ヌクレオチドへの複製後修飾である、請求項２３に記載の方法。
２７．複製後修飾が、５－メチル－シトシンであり、作用物質の核酸との結合の程度が、核酸中の５－メチル－シトシンの程度とともに増大する、請求項２６に記載の方法。
２８．複製後修飾が、５－ヒドロキシメチル－シトシンであり、作用物質の核酸との結合の程度が、核酸中の５－ヒドロキシメチル－シトシンの程度とともに増大する、請求項２６に記載の方法。
２９．複製後修飾が、５－ホルミル－シトシンまたは５－カルボキシル－シトシンであり、作用物質の結合の程度が、核酸中の５－ホルミル－シトシンまたは５－カルボキシル－シトシンの程度とともに増大する、請求項２６に記載の方法。
３０．作用物質と結合している核酸を洗浄するステップと、第１および第２のプールに対して中間の程度に複製後修飾を有する核酸を含む第３のプールとして洗浄物を回収するステップとをさらに含む、請求項２３に記載の方法。
３１．アッセイするステップの前に、第１および第２のプールからタグが付けられた核酸をプールするステップを含む、請求項２３に記載の方法。
３２．作用物質が、５－メチル結合ドメイン磁気ビーズである、請求項２３に記載の方法。
３３．核酸集団が、体液試料に由来する、前記の請求項のうちいずれかに記載の方法。
３４．体液試料が、血液、血清または血漿である、請求項３３に記載の方法。
３５．核酸集団が、無細胞核酸集団である、請求項２３に記載の方法。
３６．体液試料が、がんを有すると疑われる対象に由来する、請求項３３に記載の方法。
３７．配列データが、体細胞または生殖系列変異の存在を示す、請求項２３から３６に記載の方法。
３８．配列データが、コピー数変異の存在を示す、請求項２３から３７に記載の方法。
３９．配列データが、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す、２３から３８のいずれかに記載の方法。
４０．核酸の少なくとも一部が、１個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、
捕捉部分を、増幅の鋳型として役割を果たす集団中の核酸に連結するステップと、
増幅反応を実施して鋳型から増幅産物を産生するステップと、
捕捉タグに連結された鋳型を増幅産物から分離するステップと、
バイサルファイトシーケンシングによって捕捉タグに連結された鋳型の配列データをアッセイするステップと、
増幅産物の配列データをアッセイするステップと
を含む方法。
４１．捕捉部分が、ビオチンを含む、請求項４０に記載の方法。
４２．分離するステップが、鋳型をストレプトアビジンビーズと接触させることによって実施される、請求項４１に記載の方法。
４３．修飾されたシトシン残基が、５－メチル－シトシン、５－ヒドロキシメチルシトシン、５－ホルミルシトシンまたは５－カルボキシルシトシンである、請求項４０に記載の方法。
４４．捕捉部分が、１個または複数の修飾された残基を含む核酸タグに連結されたビオチンを含む、請求項４０に記載の方法。
４５．捕捉部分が、切断可能な連結によって集団中の核酸に連結されている、請求項４０に記載の方法。
４６．切断可能な連結が、光切断可能な連結である、請求項４５に記載の方法。
４７．切断可能な連結が、ウラシルヌクレオチドを含む、請求項４５に記載の方法。
４８．核酸集団が、体液試料に由来する、前記の請求項のうちいずれかに記載の方法。
４９．体液試料が、血液、血清または血漿である、請求項４８に記載の方法。
５０．核酸集団が、無細胞核酸集団である、請求項４０に記載の方法。
５１．体液試料が、がんを有すると疑われる対象に由来する、請求項４８に記載の方法。
５２．配列データが、体細胞または生殖系列変異の存在を示す、前記の請求項のうちいずれかに記載の方法。
５３．配列データが、コピー数変異の存在を示す、前記の請求項のうちいずれかに記載の方法。
５４．配列データが、単一ヌクレオチド変異（ＳＮＶ）、挿入欠失または遺伝子融合の存在を示す、前記の請求項のうちいずれかに記載の方法。
５５．異なる程度の５－メチル化を有する核酸を含む核酸集団を解析する方法であって、
（ａ）核酸集団を、５－メチル化核酸と優先的に結合する作用物質と接触させるステップと、
（ｂ）作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、５－メチル化について過剰提示され、第２のプール中の核酸が、５－メチル化について提示不足である、ステップと、
（ｃ）第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結するステップであって、第１のプール中の核酸に連結された核酸タグが、捕捉部分（例えば、ビオチン）を含む、ステップと、
（ｄ）標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、
（ｅ）捕捉部分を有する増幅された核酸を、捕捉部分を有さない増幅された核酸から分離するステップと、
（ｆ）分離された、増幅された核酸の配列データをアッセイするステップと
を含む方法。
５６．異なる程度の修飾を有する核酸を含む核酸集団を解析する方法であって、
集団中の核酸を、アダプターと接触させて、プライマー結合部位を含むアダプターが隣接する核酸の集団を産生するステップと、
プライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、
増幅された核酸を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、
作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、
第１および第２のプール中のタグが付けられた核酸の並行増幅を実施するステップと、
第１および第２のプール中の増幅された核酸の配列データをアッセイするステップと
を含む方法。
５７．核酸の少なくとも一部が、１個または複数の修飾されたシトシン残基を含む、核酸集団を解析する方法であって、
核酸集団を、修飾されたシトシンを含むプライマー結合部位を含むアダプターと接触させて、アダプターが隣接する核酸を形成するステップと、
核酸に隣接するアダプター中のプライマー結合部位からプライムされる、アダプターが隣接する核酸を増幅するステップと、
増幅された核酸を第１および第２のアリコートに分けるステップと、
第１のアリコートの核酸について配列データをアッセイするステップと、
第２のアリコートの核酸を、未修飾ＣをＵに変換するバイサルファイトと接触させるステップと、
核酸に隣接するプライマー結合部位からプライムされる、バイサルファイト処理に起因する核酸を増幅するステップであって、バイサルファイト処理によって導入されたＵが、Ｔに変換される、ステップと、
第２のアリコートからの増幅された核酸について配列データをアッセイするステップと、
第１および第２のアリコート中の核酸の配列データを比較して、核酸集団中のどのヌクレオチドが修飾されたシトシンであったかを同定するステップと
を含む方法。
５８．アダプターが、ヘアピンアダプターである、請求項５６または５７に記載の方法。
５９．（ａ）ヒト試料からＤＮＡ分子を物理的に分画して、２種またはそれより多い分割物を作製するステップと、
（ｂ）２種またはそれより多い分割物の各々に差次的分子タグおよびＮＧＳを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、
（ｃ）ＮＧＳ機器で分子タグが付けられた分割物をアッセイして、試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するステップと
を含む方法。
６０．試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するステップをさらに含む、請求項５９に記載の方法。
６１．ＤＮＡ分子が、抽出された血漿に由来する、請求項５９に記載の方法。
６２．物理的に分画するステップが、分子をメチル化の種々の程度に基づいて分画することを含む、請求項５９に記載の方法。
６３．メチル化の種々の程度が、高メチル化および低メチル化を含む、請求項６１に記載の方法。
６４．物理的に分画するステップが、メチル結合ドメインタンパク質（「ＭＢＤ」）－ビーズを用いて分画して、メチル化の種々の程度に層別化することを含む、請求項５９に記載の方法。
６５．差次的分子タグが、ＭＢＤ分割物に対応する異なるセットの分子タグである、請求項５９に記載の方法。
６６．物理的分画が、免疫沈降を使用してＤＮＡ分子を分離することを含む、請求項５９に記載の方法。
６７．作製された分子タグが付けられた画分のうち２種またはそれより多い分子タグが付けられた画分を再度組み合わせるステップをさらに含む、請求項５９に記載の方法。
６８．再度組み合わされた、分子タグが付けられた画分または群を濃縮するステップをさらに含む、請求項６６に記載の方法。
６９．ＮＧＳによる、ＭＢＤ－ビーズによって分画されたライブラリーの分子タグ同定のための方法であって、
（ａ）下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質－ビーズ精製キットを使用して抽出されたＤＮＡ試料を物理的に分画することと、
（ｂ）各画分または群に差次的分子タグおよびＮＧＳを可能にするアダプター配列を並行適用することと、
（ｃ）すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的ＤＮＡプライマー配列を使用して続いて増幅することと、
（ｄ）再度組み合わされ、増幅された総ライブラリーを、目的のゲノム領域を標的としながら濃縮／ハイブリダイゼーションすることと
（ｅ）試料タグを付加しながら、濃縮された総ＤＮＡライブラリーを再度増幅することと、
（ｆ）異なる試料をプールして、ＮＧＳ機器で多重でそれらをアッセイすることと
を含み、機器によって生成されたＮＧＳ配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にＭＢＤ分割された分子への試料のデコンボリューションのための配列データを提供する、方法。
６９Ａ．独特の分子を同定するために使用されている分子タグと、同様に、差次的にＭＢＤ分割された分子への試料のデコンボリューションを用いて、ＮＧＳデータの解析を実施するステップを含む、請求項６９に記載の方法。
７０．（ａ）対象の身体試料から得られた核酸分子の集団を提供するステップと、
（ｂ）１つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、
（ｃ）１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
（ｄ）複数の群の核酸分子をシーケンシングして、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性ＤＮＡ－タンパク質相互作用についての相対情報を作成するのに十分なデータを含有する配列読み取りデータを作成するステップと
を含む方法。
７０Ａ．配列読み取りデータを解析して、複数の群の核酸分子の各々の、ヌクレオソーム位置付け、ヌクレオソーム修飾または結合性ＤＮＡ－タンパク質相互作用についての相対情報を作成するステップをさらに含む、請求項７０に記載の方法。
７１．（ａ）対象の身体試料から得られた核酸分子の集団を提供するステップと、
（ｂ）メチル化状態に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、
（ｃ）１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
（ｄ）複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップとを含む方法であって、シーケンシング読み取りデータが、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するのに十分であり、１つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはＤＮＡ－タンパク質相互作用を示す、方法。
７１Ａ．配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するステップを含み、１つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはＤＮＡ－タンパク質相互作用を示す、請求項７１に記載の方法。
７２．対象の身体試料から得られた核酸分子の集団を提供するステップと、
（ａ）核酸分子の集団を分画して、タンパク質が結合している無細胞核酸を含む核酸分子の複数の群を作製するステップと、
（ｂ）１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
（ｃ）複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップと
を含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の１つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するのに十分であり、１つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはＤＮＡ－タンパク質相互作用を示す、方法。
７２Ａ．配列読み取りデータを、参照配列上の１つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するステップとをさらに含み、１つまたは複数の特徴が、ヌクレオソーム位置付け、ヌクレオソーム修飾またはＤＮＡ－タンパク質相互作用を示す、請求項７２に記載の方法。
７３．対象の身体試料から得られた核酸分子の集団を提供するステップと、
（ａ）１つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップと、
（ｂ）１つまたは複数の特徴に基づいて複数の群の各々の中の核酸分子を互いに区別するために複数の群中の核酸分子に差次的にタグを付けるステップと、
（ｃ）複数の群の核酸分子をシーケンシングして、配列読み取りデータを作成するステップと
を含む方法であって、得られた配列情報が、配列読み取りデータを参照配列上の１つまたは複数の遺伝子座にマッピングするのに、および配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するのに十分であり、１つまたは複数の特徴が、複数の群からの配列読み取りデータのプールにおいて検出可能ではない、方法。
７３Ａ．配列読み取りデータを参照配列上の１つまたは複数の遺伝子座にマッピングするステップと、配列読み取りデータを解析して、核酸分子の複数の群のうち１つにおいて１つまたは複数の特徴を検出するステップとをさらに含み、１つまたは複数の特徴が、複数の群からの配列読み取りデータのプールにおいて検出可能ではない、請求項７３に記載の方法。
７４．１つまたは複数の特徴が、マッピングされた読み取りデータの定量的特徴を含む、請求項７０から７２のいずれか一項に記載の方法。
７５．分画が、物理的分画を含む、請求項６９から７３のいずれか一項に記載の方法。
７６．メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始／停止位置からなる群から選択される１つまたは複数の特徴に基づいて、核酸分子の集団が分割される、請求項６９または７２に記載の方法。
７７．（ｂ）の核酸分子をプールするステップをさらに含む、請求項６９から７２のいずれか一項に記載の方法。
７８．１つまたは複数の特徴がメチル化である、請求項６９または７２に記載の方法。
７９．分画が、メチル結合ドメインを含むタンパク質を使用してメチル化核酸を、非メチル化核酸から分離して、種々の程度のメチル化を含む核酸分子の群を作製することを含む、請求項７７に記載の方法。
８０．群のうち１つが、高メチル化ＤＮＡを含む、請求項７８に記載の方法。
８１．少なくとも１つの群が、メチル化の程度によって特徴付けられる、請求項７８に記載の方法。
８２．分画が、一本鎖ＤＮＡ分子および／または二本鎖ＤＮＡ分子を分離することを含む、請求項７２に記載の方法。
８３．二本鎖ＤＮＡ分子が、ヘアピンアダプターを使用して分離される、請求項８１に記載の方法。
８４．分画が、タンパク質が結合している核酸を単離することを含む、請求項６９または７２に記載の方法。
８５．分画が、モノヌクレオソームプロファイルの相違に基づいて分画することを含む、請求項６９から７２のいずれか一項に記載の方法。
８６．分画が、正常と比較した場合に、少なくとも１つの群の核酸分子について異なるモノヌクレオソームプロファイルを作成可能である、請求項６９から７２のいずれか一項に記載の方法。
８７．単離することが、免疫沈降を含む、請求項８５に記載の方法。
８８．異なる特徴に基づいて少なくとも１つの群の核酸分子を分画するステップをさらに含む、請求項６９から７２のいずれか一項に記載の方法。
８９．解析するステップが、１つまたは複数の遺伝子座で、第１の群の核酸分子に対応する第１の特徴を、第２の群の核酸分子に対応する第２の特徴と比較することを含む、請求項６９から７２のいずれか一項に記載の方法。
９０．解析するステップが、１つまたは複数の遺伝子座で、正常試料に対して、群における１つまたは複数の特徴のうち１つの特徴を解析することを含む、請求項７０から７２のいずれか一項に記載の方法。
９１．１つまたは複数の特徴が、参照配列上の塩基位置でのベースコール頻度、参照配列上の１つの塩基または配列にマッピングされる分子の数、参照配列上の塩基位置にマッピングされる開始部位を有する分子の数および参照配列上の塩基位置にマッピングされる停止部位を有する分子の数および参照配列上の遺伝子座にマッピングされる分子の長さからなる群から選択される、請求項７０から７２のいずれか一項に記載の方法。
９２．（ｆ）１つまたは複数の特徴に基づいて対象を分類するために訓練された分類子を使用するステップをさらに含む、請求項７０から７２のいずれか一項に記載の方法。
９３．訓練された分類子が、１つまたは複数の特徴を対象における組織と関連するとして分類する、請求項９１に記載の方法。
９４．訓練された分類子が、１つまたは複数の特徴を対象におけるがんの種類と関連するとして分類する、請求項９１に記載の方法。
９５．１つまたは複数の特徴が、遺伝子発現または疾患の状態を示す、請求項７０から７２に記載の方法。
９６．核酸分子が、循環腫瘍ＤＮＡである、請求項６９から７２のいずれか一項に記載の方法。
９７．核酸分子が、無細胞ＤＮＡ（「ｃｆＤＮＡ」）である、請求項６９から７２のいずれか一項に記載の方法。
９８．１つまたは複数の特徴が、がんマーカーである、請求項６９から７１のいずれか一項に記載の方法。
９９．タグが、同一試料中の異なる分子を区別するために使用される、請求項６９から７２のいずれか一項に記載の方法。
１００．（ａ）対象の身体試料から得られた核酸分子の集団を提供するステップと、
（ｂ）１つまたは複数の特徴に基づいて核酸分子の集団を分画して、核酸分子の複数の群を作製するステップであって、複数の群の各々の核酸分子が、別個の識別子を含む、ステップと、
（ｃ）複数の群の核酸分子をプールするステップと、
（ｄ）プールされた複数の群の核酸分子をシーケンシングして、複数のセット配列読み取りデータを作成するステップと、
（ｅ）識別子に基づいて配列読み取りデータを分画するステップと
を含む方法。
１０１．差次的にタグが付けられた核酸分子を含む核酸分子のプールを含む組成物であって、プールが、以下からなる群から選択される：メチル化状態、グリコシル化状態、ヒストン修飾、長さおよび開始／停止位置からなる群から選択される１つまたは複数の特徴に基づいて差次的にタグが付けられた複数のセットの核酸分子を含み、プールが、生体試料に由来する、組成物。
１０２．複数のセットが、２、３、４、５または５より多いのいずれかである、請求項１０１に記載の組成物。
１０３．（ａ）核酸分子の集団を、特徴が異なる核酸を含む複数の群に分画するステップと、
（ｂ）複数の群の各々の中の核酸に、複数の群の各々の中の核酸を区別するタグのセットを用いてタグを付けて、タグが付けられた核酸の集団を産生するステップであって、タグが付けられた核酸の各々が、１つまたは複数のタグを含む、ステップと、
（ｃ）タグが付けられた核酸の集団をシーケンシングして、配列読み取りデータを作成するステップであって、配列読み取りデータが、１つまたは複数のタグを使用して、各群の配列読み取りデータを群化することを可能にする、ステップと、配列読み取りデータを解析して、正常試料または分類子に対して群のうち少なくとも１つにおいてシグナルを検出するステップとを含む方法。
１０３Ａ．１つまたは複数のタグを使用して、各群の配列読み取りデータを群化するステップと、
配列読み取りデータを解析して、正常試料または分類子に対して群のうち少なくとも１つにおいてシグナルを検出するステップと
をさらに含む、請求項１０３に記載の方法。
１０４．別の群または全ゲノム配列に対して、群のうち少なくとも１つにおけるシグナルを正規化するステップをさらに含む、請求項１０２に記載の方法。
１０５．ｉ．生体試料から無細胞ＤＮＡの集団を提供するステップと、
ｉｉ．無細胞ＤＮＡの集団を、非がん性細胞と比較して、がん性に由来する無細胞ＤＮＡでは異なるレベルで存在する特徴に基づいて分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、
ｉｉｉ．無細胞ＤＮＡの小集団のうち少なくとも１つを増幅するステップと、
ｉｖ．無細胞ＤＮＡの増幅された小集団のうち少なくとも１つをシーケンシングするステップと
を含む方法。
１０６．特徴が、
ｉ．無細胞ＤＮＡのメチル化レベル、
ｉｉ．無細胞ＤＮＡのグリコシル化レベル、
ｉｉｉ．無細胞ＤＮＡ断片の長さ、または
ｉｖ．無細胞ＤＮＡにおける一本鎖切断の存在
である、請求項１０４に記載の方法。
１０７．ｉ．生体試料から無細胞ＤＮＡの集団を提供するステップと、
ｉｉ．無細胞ＤＮＡの集団を、無細胞ＤＮＡのメチル化レベルに基づいて分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、
ｉｉｉ．無細胞ＤＮＡの小集団のうち少なくとも１つを増幅するステップと、
ｉｖ．無細胞ＤＮＡの増幅された小集団のうち少なくとも１つをシーケンシングするステップと
を含む方法。
１０８．無細胞ＤＮＡのメチル化状態を判定するための方法であって、
ｉ．生体試料から無細胞ＤＮＡの集団を提供するステップと、
ｉｉ．無細胞ＤＮＡの集団を、無細胞ＤＮＡのメチル化レベルに基づいて分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、
ｉｉｉ．無細胞ＤＮＡの少なくとも１つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、
ｉｖ．対応する配列読み取りデータが生じる小集団に応じて、メチル化状態を各無細胞ＤＮＡに割り当てるステップと
を含む方法。
１０９．対象を分類する方法であって、
ｉ．対象由来の生体試料から無細胞ＤＮＡの集団を提供するステップと、
ｉｉ．無細胞ＤＮＡの集団を、無細胞ＤＮＡのメチル化レベルに基づいて分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと、
ｉｉｉ．無細胞ＤＮＡの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、
ｉｖ．どの小集団においてどの配列読み取りデータが生じるかに応じて、訓練された分類子を使用して、対象を分類するステップと
を含む方法。
１１０．無細胞ＤＮＡの断片化パターンを解析するための方法であって、
ｉ．生体試料から無細胞ＤＮＡの集団を提供するステップと、
ｉｉ．無細胞ＤＮＡの集団を分画し、それによって、無細胞ＤＮＡの小集団を作製するステップと
ｉｉｉ．無細胞ＤＮＡの少なくとも１つの小集団をシーケンシングし、それによって、配列読み取りデータを作成するステップと、
ｉｖ．配列読み取りデータを参照ゲノムに対してアラインするステップと、
ｖ．以下：
ａ．参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、
ｂ．配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、
ｃ．参照ゲノム中の各塩基位置で開始する配列読み取りデータの数、または
ｄ．参照ゲノム中の各塩基位置で終了する配列読み取りデータの数
のうち任意の数のものを解析することによって各小集団において無細胞ＤＮＡの断片化パターンを決定するステップと
を含む方法。
１１１．無細胞ＤＮＡの集団が、健常および罹患状態の間のシグナルの相違を提供する１つまたは複数の特徴によって分画される、請求項１０９に記載の方法。
１１２．１つまたは複数の特徴が、メチル化、ヒドロキシメチル化、ホルミル化、アセチル化およびグリコシル化からなる群から選択される化学修飾を含む、請求項１１０に記載の方法。
１１３．ＤＮＡ：ビーズの比が、１：１００である、前記の請求項のうちいずれか一項におけるような方法。
１１４．ＤＮＡ：ビーズの比が、１：５０である、前記の請求項のうちいずれか一項におけるような方法。
１１５．ＤＮＡ：ビーズの比が、１：２０である、前記の請求項のうちいずれか一項におけるような方法。
１１６．無細胞ＤＮＡの集団が、無細胞ＤＮＡのメチル化レベルに基づいて分画される、請求項１０９に記載の方法。
１１７．無細胞ＤＮＡの断片化パターンを決定するステップが、参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することをさらに含む、請求項１０９に記載の方法。
１１８．参照ゲノム中の各塩基位置にマッピングされる配列読み取りデータの数を解析することによって各小集団において無細胞ＤＮＡの断片化パターンを決定するステップをさらに含む、請求項１０９に記載の方法。
１１９．遺伝子発現または疾患状態を判定するための循環腫瘍ＤＮＡ（ｃｔＤＮＡ）の解析の際の、ＤＮＡメチル化の程度に基づく物理的分画の使用。
１２０．ｃｔＤＮＡの解析の際にｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
１２１．ｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
１２２．シーケンシングおよび任意選択の下流解析に先立つ、ｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
１２３．差次的標識／タグ付けのために、ｃｔＤＮＡを物理的に分割するための正常および罹患状態の間のシグナルの相違をもたらす特徴の使用。
１２４．ｃｔＤＮＡの解析の際の差次的断片化パターンに基づく分画の使用。
１２５．ｃｔＤＮＡを分割するための差次的断片化パターンの使用。
１２６．シーケンシングおよび任意選択の下流解析に先立つｃｔＤＮＡを分割するための差次的断片化パターンの使用。
１２７．差次的標識／タグ付けのために、ｃｔＤＮＡを分割するための差次的断片化パターンの使用。
１２８．差次的断片化パターンが、遺伝子発現または疾患状態を示す、請求項１２３から１２６に記載の使用。
１２９．差次的断片化パターンが、
（ａ）参照ゲノム中の各塩基位置にマッピングされる各配列読み取りデータの長さ、
（ｂ）配列読み取りデータの長さの関数としての参照ゲノム中の塩基位置にマッピングされる配列読み取りデータの数、
（ｃ）参照ゲノム中の各塩基位置で開始する配列読み取りデータの数および
（ｄ）参照ゲノム中の各塩基位置で終了する配列読み取りデータの数
からなる群から選択される正常に対する１つまたは複数の相違によって特徴付けられる、請求項１２３から１２６に記載の使用。
１３０．種々の程度のＤＮＡメチル化に層別化し、次いで、次世代シーケンシング（ＮＧＳ）によって定量化されるための、分子結合ドメイン（ＭＢＤ）－ビーズによって分割されたＤＮＡ分子の差次的分子タグ付けの使用。
１３１．二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析する方法であって、少なくとも２種の形態の各々が、複数の分子を含み、方法が、
（ａ）核酸の形態のうち少なくとも１種を、形態を互いに区別するために少なくとも１種のタグ核酸と連結するステップと、
（ｂ）その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも１種の形態から増幅されたものにタグが付けられている、ステップと、
（ｃ）タグに連結されている複数の増幅された核酸をシーケンシングするステップであって、配列データが、少なくとも１種のタグに連結する前に集団中の核酸の形態を明らかにする（real）ために解読されるのに十分であるステップと
を含む、方法。
１３２．タグが付けられた核酸分子のプールであって、プール中の各核酸分子が、複数のタグセットのうち１つから選択される分子タグを含み、各タグセットが、複数の異なるタグを含み、任意の１つのセット中のタグが、任意のその他のセット中のタグとは別個であり、各タグセットが、（ｉ）付着される分子の特徴または分子が由来する親分子の特徴を示し、および（ｉｉ）単独で、または付着される分子からの情報と組み合わせて、付着される分子を、同一タグセットに由来するタグを用いてタグが付けられているその他の分子から独特に区別する情報を含有する、タグが付けられた核酸分子のプール。
１３３．分子タグが、１つまたは複数の核酸バーコードを含む、請求項１３２に記載のタグが付けられた核酸分子のプール。
１３４．分子タグが、分子の反対側の末端に付着された２つの核酸バーコードを含む、請求項１３３に記載のタグが付けられた核酸分子のプール。
１３５．セット中の任意の２つのバーコードの組合せが、任意のその他のセット中の任意の２つのバーコードの組合せとは異なる組み合わされた配列を有する、請求項１３４に記載のタグが付けられた核酸分子のプール。
１３６．バーコードが、１０から３０ヌクレオチドの間の長さである、請求項１３３に記載のタグが付けられた核酸分子のプール。
１３７．各タグセットが、タグセットによってタグが付けられ、同一の開始－停止座標を有するか、または同一ヌクレオチド配列を有するか、または同一ゲノム座標にマッピングされる分子に、独特にタグを付けるのに十分な複数の異なるタグを含む、請求項１３２に記載のタグが付けられた核酸分子のプール。
１３８．複数のタグセットが、２、３、４、５、６である、または６より多い、請求項１３２に記載のタグが付けられた核酸分子のプール。
１３９．１つのタグセットに由来するタグを用いてタグが付けられたＤＮＡ配列を有する分子と、別のタグセットに由来するタグを用いてタグが付けられたｃＤＮＡ配列を有する分子とを含む、請求項１３２に記載のタグが付けられた核酸分子のプール。
１４０．タグセットによって示される分子の特徴が、ＤＮＡ、ＲＮＡ、一本鎖、二本鎖、メチル化、非メチル化、メチル化の程度または上記の組合せのうち１つまたは複数を含む、請求項１３２に記載のタグが付けられた核酸分子のプール。
１４１．核酸シーケンサーと、
少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
核酸シーケンサーおよびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、二本鎖ＤＮＡ、一本鎖ＤＮＡおよび一本鎖ＲＮＡから選択される核酸のうち少なくとも２種の形態を含む核酸集団を解析するためのアプリケーションであって、少なくとも２種の形態の各々が複数の分子を含み、アプリケーションが、
データリンクを介して核酸シーケンサーから、少なくとも一部にタグが付けられている増幅された核酸の配列データを受け取るソフトウェアモジュールであって、配列データが、核酸の形態のうち少なくとも１種を、形態を互いに区別するために少なくとも１種のタグが付けられた核酸と連結するステップと、その少なくとも１種が少なくとも１種の核酸タグに連結された核酸の形態を増幅するステップであって、核酸および連結された核酸タグが増幅されて増幅された核酸を産生し、そのうち少なくとも１種の形態から増幅されたものにタグが付けられている、ステップとによって作成される、ソフトウェアモジュールと
増幅された核酸のタグが付けられた核酸分子を解読するのに十分な配列情報を得て、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供することによって、増幅された核酸の配列データをアッセイするソフトウェアモジュールと
を含む、アプリケーションを作製するために実行可能な命令をさらに含む、システム。
１４２．アプリケーションが、増幅された核酸のタグが付けられた核酸分子を解読して、集団中の核酸の形態を明らかにし、配列データがアッセイされたタグ核酸分子に連結された増幅された核酸の元の鋳型を提供するソフトウェアモジュールをさらに含む、請求項１４１に記載のシステム。
１４３．アプリケーションが、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む、請求項１４１に記載のシステム。
１４４．次世代シーケンシング（ＮＧＳ）機器と、
少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、
データリンクを介してＮＧＳ機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、ヒト試料からＤＮＡ分子を物理的に分画して、２種またはそれより多い分割物を作製するステップと、２種またはそれより多い分割物の各々に差次的分子タグおよびＮＧＳを可能にするアダプターを適用して、分子タグが付けられた分割物を作製するステップと、ＮＧＳ機器で分子タグが付けられた分割物をアッセイするステップとによって作成される、ソフトウェアモジュールと、
試料を、差次的に分割された分子にデコンボリューションするための配列データを作成するためのソフトウェアモジュールと、
試料を、差次的に分割された分子にデコンボリューションすることによって配列データを解析するためのソフトウェアモジュールと
を含むアプリケーションを作製するために実行可能な命令をさらに含む、システム。
１４５．アプリケーションが、通信網を介してアッセイの結果を送信するソフトウェアモジュールをさらに含む、請求項１４４に記載のシステム。
１４６．次世代シーケンシング（ＮＧＳ）機器と、
少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、ＭＢＤ－ビーズによって分画されたライブラリーの分子タグ同定のためのアプリケーションであって、
データリンクを介してＮＧＳ機器から配列データを受け取るように構成されたソフトウェアモジールであって、配列データが、下流処理のためにすべての溶出物を残しておきながら、メチル結合ドメインタンパク質－ビーズ精製キットを使用して、抽出されたＤＮＡ試料を物理的に分画するステップと、各画分または群に差次的分子タグおよびＮＧＳを可能にするアダプター配列の並行適用を実施するステップと、すべての分子タグが付けられた画分または群を再度組み合わせて、アダプター特異的ＤＮＡプライマー配列を使用して続いて増幅するステップと、目的のゲノム領域を標的としながら、再度組み合わされ、増幅された総ライブラリーの濃縮／ハイブリダイゼーションを実施するステップと、試料タグを付加しながら、濃縮された総ＤＮＡライブラリーを再度増幅するステップと、異なる試料をプールするステップと、ＮＧＳ機器で多重でそれらをアッセイするステップとによって作成され、機器によって生成されたＮＧＳ配列データが、独特の分子を同定するために使用されている分子タグの配列および差次的にＭＢＤ分割された分子への試料のデコンボリューションのための配列データを提供する、ソフトウェアモジュールと、
独特の分子を同定するために分子タグを使用し、試料を、差次的にＭＢＤ分割された分子にデコンボリューションすることによって、配列データの解析を実施するように構成されたソフトウェアモジュールと
を含むアプリケーションを作製するために少なくとも１つのプロセッサーによって実行可能な命令をさらに含む、システム。
１４７．アプリケーションが、通信網を介して解析の結果を送信するように構成されたソフトウェアモジュールをさらに含む、請求項１４６に記載のシステム。
１４８．ａ）次世代シーケンシング（ＮＧＳ）機器と、
ｂ）少なくとも１つのプロセッサーと、実行可能命令を実施するように構成されたオペレーティングシステムと、メモリーとを含むデジタル処理デバイスと、
ｃ）ＮＧＳ機器およびデジタル処理デバイスを通信可能に接続するデータリンクと
を含むシステムであって、
デジタル処理デバイスが、
ｉ）データリンクを介してＮＧＳ機器から配列データを受け取るためのソフトウェアモジュールであって、配列データが、核酸集団を、修飾を有する核酸と優先的に結合する作用物質と接触させるステップと、作用物質と結合している第１のプールの核酸を、作用物質と結合していない第２のプールの核酸から分離するステップであって、第１のプールの核酸が、修飾について過剰提示され、第２のプール中の核酸が、修飾について提示不足である、ステップと、第１のプールおよび／または第２のプール中の核酸を、第１のプールおよび第２のプール中の核酸を区別する１種または複数の核酸タグと連結して、タグが付けられた核酸の集団を産生するステップと、標識された核酸を増幅するステップであって、核酸および連結されたタグが増幅される、ステップと、ＮＧＳ機器を用いて分子タグが付けられた分割物をアッセイするステップとによって調製された標識された核酸とともにロードされて作成される、ソフトウェアモジュールと、
ｉｉ）タグを解読するための配列データを作成するためのソフトウェアモジュールと、
ｉｉｉ）タグを解読して、配列データがアッセイされた核酸が、第１または第２のプール中の鋳型から増幅されたか否かを明らかにするために配列データを解析するためのソフトウェアモジュールと
を含むアプリケーションを作製するために実行可能な命令をさらに含む、システム。
１４９．通信網を介して（vai）アッセイの結果を送信するソフトウェアモジュールを
さらに含む、請求項１４８に記載のシステム。

【図1】