特表2024-529488 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ザ　チャンセラー，マスターズ　アンド　スカラーズ　オブ　ザ　ユニバーシティ　オブ　オックスフォードの特許一覧

特表2024-529488無細胞ＤＮＡのためのＴＥＴ支援ピリジンボラン配列決定に関する組成物及び方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
2C
2D
2E
2F
2G
2H
2I
3
4A
4B
4C
5
6A
6B
6C
6D
6E
6F
6G
6H
6I
7A
7B
7C
7D
7E
7F
7G
7H
7I
8A
8B
8C
8D
8E
8F
8G
8H
8I
9A
9B
10
11A
11B
11C
12

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-08-06

(54)【発明の名称】無細胞ＤＮＡのためのＴＥＴ支援ピリジンボラン配列決定に関する組成物及び方法

(51)【国際特許分類】

C12Q 1/6869 20180101AFI20240730BHJP

C12Q 1/6809 20180101ALI20240730BHJP

C12Q 1/04 20060101ALI20240730BHJP

【ＦＩ】

C12Q1/6869 Z ZNA

C12Q1/6809 Z

C12Q1/04

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024505327

(86)(22)【出願日】2022-07-26

(85)【翻訳文提出日】2024-03-18

(86)【国際出願番号】 IB2022000420

(87)【国際公開番号】W WO2023007241

(87)【国際公開日】2023-02-02

(31)【優先権主張番号】63/203,565

(32)【優先日】2021-07-27

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＰＹＴＨＯＮ

(71)【出願人】

【識別番号】511301083

【氏名又は名称】ザチャンセラー，マスターズアンドスカラーズオブザユニバーシティオブオックスフォード

(74)【代理人】

【識別番号】110000338

【氏名又は名称】弁理士法人ＨＡＲＡＫＥＮＺＯＷＯＲＬＤＰＡＴＥＮＴ＆ＴＲＡＤＥＭＡＲＫ

(72)【発明者】

【氏名】ソン，チュンシャオ

(72)【発明者】

【氏名】シエイカ－ジエリンスカ，パウリナ

(72)【発明者】

【氏名】チェン，ジンフェイ

(72)【発明者】

【氏名】ジャクソン，フェリックス

(72)【発明者】

【氏名】リウ，イビン

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA13

4B063QA19

4B063QQ03

4B063QQ42

4B063QR32

4B063QR72

4B063QX02

(57)【要約】

【特許請求の範囲】

【請求項1】

メチル化シグネチャを得る方法であって、
試料から無細胞ＤＮＡ（ｃｆＤＮＡ）を単離することと、
前記ｃｆＤＮＡを含む配列決定ライブラリを調製することと、
前記配列決定ライブラリに対してＴＥＴ支援ピリジンボラン配列決定（ＴＡＰＳ）を実施して、前記ｃｆＤＮＡの全ゲノムメチル化シグネチャを得ることと、を含む、前記方法。

【請求項2】

前記ＴＡＰＳから得られる一意のマッピングレートが少なくとも８０％であり、及び／または一意の重複除去されたマッピングレートが少なくとも７０％である、請求項１に記載の方法。

【請求項3】

前記配列決定ライブラリを調製することが、前記単離されたｃｆＤＮＡに配列決定アダプターをライゲーションすることを含む、請求項１または２に記載の方法。

【請求項4】

キャリアＤＮＡが、前記ＴＡＰＳを実施する前に、前記配列決定ライブラリに追加される、請求項１～３のいずれか１項に記載の方法。

【請求項5】

前記ｃｆＤＮＡの前記全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、前記メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む、請求項１～４のいずれか１項に記載の方法。

【請求項6】

前記メチル化バイオマーカーが、差次メチル化領域（ＤＭＲ）を含む、請求項５に記載の方法。

【請求項7】

参照ＤＭＲと比較して、前記ＤＭＲに基づいて前記試料を分類することを更に含む、請求項６に記載の方法。

【請求項8】

前記参照ＤＭＲが、非がん性対照、またはがん性対照に対応する、請求項７に記載の方法。

【請求項9】

前記ｃｆＤＮＡの前記全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、前記メチル化バイオマーカーに対応する起源の組織を決定することと、を更に含む、請求項１～４のいずれか１項に記載の方法。

【請求項10】

前記起源の組織のバイオマーカーに基づいて前記試料を分類することを更に含む、請求項９に記載の方法。

【請求項11】

ＤＮＡ断片化プロファイルを特定することと、前記断片化プロファイルが、がんの指標であるかどうかを決定することと、を更に含む、請求項１～４のいずれか１項に記載の方法。

【請求項12】

前記ｃｆＤＮＡからの少なくとも１つの配列バリアントを特定することと、前記配列バリアントが、がんの指標であるかどうかを決定することと、を更に含む、請求項１～４のいずれか１項に記載の方法。

【請求項13】

前記配列決定ライブラリに対して前記ＴＡＰＳを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記ｃｆＤＮＡ中の５ｍＣ修飾を特定することと、前記５ｍＣ修飾の頻度の定量的尺度を提供することと、を含む、請求項１～１２のいずれか１項に記載の方法。

【請求項14】

前記配列決定ライブラリに対して前記ＴＡＰＳを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記ｃｆＤＮＡ中の５ｈｍＣ修飾を特定することと、前記５ｈｍＣ修飾の頻度の定量的尺度を提供することと、を含む、請求項１～１２のいずれか１項に記載の方法。

【請求項15】

前記配列決定ライブラリに対して前記ＴＡＰＳを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記ｃｆＤＮＡ中の５ｃａＣ修飾を特定することと、前記５ｃａＣ修飾の頻度の定量的尺度を提供することと、を含む、請求項１～１２のいずれか１項に記載の方法。

【請求項16】

前記配列決定ライブラリに対して前記ＴＡＰＳを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記ｃｆＤＮＡ中の５ｆＣ修飾を特定することと、前記５ｆＣ修飾の頻度の定量的尺度を提供することと、を含む、請求項１～１２のいずれか１項に記載の方法。

【請求項17】

請求項１～１６のいずれか１項に記載の方法を使用して、対象が、がんを有するかどうかを決定する、方法。

【請求項18】

前記がんが、肝細胞癌（ＨＣＣ）または膵管腺癌（ＰＤＡＣ）を含む、請求項１７に記載の方法。

【請求項19】

請求項１～１６のいずれか１項に記載の方法を使用して、対象が、早期がんを有するかどうかを決定する、方法。

【請求項20】

前記早期がんが、早期肝細胞癌（ＨＣＣ）または早期膵管腺癌（ＰＤＡＣ）を含む、請求項１９に記載の方法。

【請求項21】

患者試料中のｃｆＤＮＡを分析するマルチモーダル方法であって、
前記患者試料から前記ｃｆＤＮＡを単離することと、
前記試料中の５ｍＣ及び／または５ｈｍＣ残基をＤＨＵ残基に変換して、修飾ｃｆＤＮＡ試料を提供することと、
前記修飾ｃｆＤＮＡ試料を配列決定して、前記試料中のメチル化領域を特定することであって、非修飾参照ｃｆＤＮＡと比較して、前記修飾ｃｆＤＮＡ試料中のシトシン（Ｃ）からチミン（Ｔ）への移行、またはシトシン（Ｃ）からＤＨＵへの移行が、前記ｃｆＤＮＡ中の５ｍＣまたは５ｈｍＣのいずれかの位置を提供する、前記メチル化領域を特定することと、
ａ）前記修飾ｃｆＤＮＡ試料における１つ以上の標的のコピー数変動を決定すること、
ｂ）前記修飾ｃｆＤＮＡ試料における起源の組織または１つ以上の標的を決定すること、
ｃ）前記修飾ｃｆＤＮＡ試料の断片化プロファイルを決定すること、及び
ｄ）前記修飾ｃｆＤＮＡ試料において１つ以上の単一ヌクレオチド変異を特定すること、からなる群から選択される前記修飾ｃｆＤＮＡに対する１つ以上の追加の分析ステップを実施することと、を含む、前記マルチモーダル方法。

【請求項22】

前記修飾ｃｆＤＮＡ試料を配列決定して、前記試料中のメチル化領域を特定するステップが、少なくとも１つの差次メチル化領域（ＤＭＲ）を特定することを含む、請求項２１に記載の方法。

【請求項23】

参照ＤＭＲと比較して、前記ＤＭＲに基づいて前記試料を分類することを更に含む、請求項２２に記載の方法。

【請求項24】

前記参照ＤＭＲが、非がん性対照、またはがん性対照に対応する、請求項２３に記載の方法。

【請求項25】

前記修飾ｃｆＤＮＡ試料における１つ以上の標的のコピー数変動（ＣＮＶ）を決定する前記ステップが、参照ゲノムをビンに分割し、各ビンにおけるリードの数をカウントすることによって、前記ゲノムにわたる標的配列について観察されたリードカウントを決定することを含む、請求項２１に記載の方法。

【請求項26】

５００ｋｂより大きいコピー数異常の存在が、患者におけるＣＮＶの指標である、請求項２５に記載の方法。

【請求項27】

前記修飾ｃｆＤＮＡ試料における前記起源の組織または１つ以上の標的を決定する前記ステップが、前記修飾ｃｆＤＮＡ試料の配列決定から得られたデータの組織デコンボリューションを含む、請求項２１に記載の方法。

【請求項28】

前記組織デコンボリューションが、前記修飾ｃｆＤＮＡ試料において特定されたＤＮＡメチル化値を、２つ以上の異なる組織からの参照ＤＭＲと比較することを含む、請求項２７に記載の方法。

【請求項29】

前記修飾ｃｆＤＮＡ試料の前記断片化プロファイルを決定する前記ステップが、前記修飾ｃｆＤＮＡ試料における断片長さ及び断片の周期性を分類することを含む、請求項２１に記載の方法。

【請求項30】

前記修飾ｃｆＤＮＡ試料における前記断片長さ及び前記断片の周期性を分類することが、１０ｂｐの長さ範囲のビンにおける３００～５００ｂｐのｃｆＤＮＡ断片の割合を計算することを更に含む、請求項２８に記載の方法。

【請求項31】

前記修飾ｃｆＤＮＡ試料において１つ以上の単一ヌクレオチド変異を特定する前記ステップが、ＴＡＰＳ後の配列決定結果を比較することによって、前記ｃｆＤＮＡ中の特定の位置における５ｍＣまたは５ｈｍＣからのＣからＴへのＳＮＰを区別することを更に含み、前記ｃｆＤＮＡの元の下部鎖に対する相補体中の前記特定の位置におけるＴリードの存在が、ＣからＴへのＳＮＰの指標であり、前記ｃｆＤＮＡの前記元の下部鎖に対する相補体中の前記特定の位置におけるＣリードの存在が、５ｍＣまたは５ｈｍＣの指標である、請求項２１に記載の方法。

【請求項32】

ステップａ、ｂ、ｃ及びｄのうちの２つ以上が、前記修飾ｃｆＤＮＡに対して実施される、請求項２１～３１のいずれか１項に記載の方法。

【請求項33】

ステップａ、ｂ、ｃ及びｄのうちの３つ以上が、前記修飾ｃｆＤＮＡに対して実施される、請求項２１～３１のいずれか１項に記載の方法。

【請求項34】

ステップａ、ｂ、ｃ及びｄの全てが、前記修飾ｃｆＤＮＡに対して実施される、請求項２１～３１のいずれか１項に記載の方法。

【請求項35】

前記配列決定するステップから得られる一意のマッピングレートが、少なくとも８０％であり、及び／または一意の重複除去されたマッピングレートが、少なくとも７０％である、請求項２１～３４のいずれか１項に記載の方法。

【請求項36】

前記配列決定するステップが、前記単離されたｃｆＤＮＡに配列決定アダプターをライゲーションすることによる、前記ｃｆＤＮＡを含む配列決定ライブラリを調製することを更に含む、請求項２１～３５のいずれか１項に記載の方法。

【請求項37】

キャリアＤＮＡが、前記ｃｆＤＮＡに追加される、請求項２１～３６のいずれか１項に記載の方法。

【請求項38】

ｃｆＤＮＡ全ゲノムメチル化シグネチャを提供し、前記ｃｆＤＮＡ全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、前記メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む、請求項２１～３７のいずれか１項に記載の方法。

【請求項39】

前記ｃｆＤＮＡ中の５ｍＣ修飾を特定することと、前記５ｍＣ修飾の頻度の定量的尺度を提供することと、を更に含む、請求項２１～３８のいずれか１項に記載の方法。

【請求項40】

前記ｃｆＤＮＡ中の５ｈｍＣ修飾を特定することと、前記５ｈｍＣ修飾の頻度の定量的尺度を提供することと、を更に含む、請求項２１～３９のいずれか１項に記載の方法。

【請求項41】

前記ｃｆＤＮＡ中の５ｃａＣ修飾を特定することと、前記５ｃａＣ修飾の頻度の定量的尺度を提供することと、を更に含む、請求項２１～４０のいずれか１項に記載の方法。

【請求項42】

前記ｃｆＤＮＡ中の５ｆＣ修飾を特定することと、前記５ｆＣ修飾の頻度の定量的尺度を提供することと、を更に含む、請求項２１～４１のいずれか１項に記載の方法。

【請求項43】

前記試料中の５ｍＣ及び／または５ｈｍＣ残基をＤＨＵ残基に変換して、修飾ｃｆＤＮＡ試料を提供するステップが、５ｍＣ及び／または５ｈｍＣ残基を酸化して５ｃａＣ及び／または５ｆＣ残基を提供することと、前記５ｃａＣ及び／または前記５ｆＣ残基をＤＨＵ残基へと還元することと、を含む、請求項２１～４２のいずれか１項に記載の方法。

【請求項44】

５ｍＣ及び／または５ｈｍＣ残基を酸化して５ｃａＣ及び／または５ｆＣ残基を提供する前記ステップが、Ｔｅｔ酵素による前記試料の処理を含む、請求項４３に記載の方法。

【請求項45】

５ｍＣ及び／または５ｈｍＣ残基を酸化して５ｃａＣ及び／または５ｆＣ残基を提供する前記ステップが、１つ以上の５ｆＣ残基が生成されるような化学酸化剤による前記試料の処理を含む、請求項４３に記載の方法。

【請求項46】

前記５ｃａＣ及び／または５ｆＣ残基をＤＨＵ残基へと還元する前記ステップが、ボラン還元剤による前記試料の処理を含む、請求項４３～４５のいずれか１項に記載の方法。

【請求項47】

請求項２１～４６のいずれか１項に記載の方法を使用して、対象が、がんを有するかどうかを決定する、方法。

【発明の詳細な説明】

【0001】

〔技術分野〕
関連出願の相互参照
本出願は、２０２１年７月２７日に出願された米国仮出願第６３／２０３，５６５号の利益を主張し、その内容はその全体が参照により本明細書に組み込まれる。

【0002】

電子配列表の内容（ｓｅｑｕｅｎｃｅｌｉｓｔｉｎｇ．ｘｍｌ、サイズ：８，０００バイト、及び作成日：２０２２年７月２６日）は、その全体が参照により本明細書に組み込まれる。

【0003】

本開示は、ＴＥＴ支援ピリジンボラン配列決定（ＴＡＰＳ）に関する組成物及び方法を提供する。具体的には、本開示は、高品質及び高深度の全ゲノム無細胞メチロームを提供する、ｃｆＤＮＡに最適化されたＴＡＰＳ（ｃｆＴＡＰＳ）を提供する。本明細書に提供される組成物及び方法は、疾患の診断及び治療のためのＤＮＡメチル化、起源の組織、及びＤＮＡ断片化を含む、ｃｆＤＮＡ特徴に関するマルチモーダル情報の取得を容易にする。
〔背景技術〕
がん研究の最近の進歩は、がんを治療するための新しい方法を提供するが、早期発見は、依然としてがんを治癒するための最良の機会を表している。早期治療は、患者の生存率を大幅に改善するだけでなく、コストを大幅に削減する。循環無細胞ＤＮＡ（ｃｆＤＮＡ）は、様々な健康な組織及び疾患組織における細胞死に由来する血漿中の自由に浮遊するＤＮＡであり、早期がん検出アッセイを開発するための素晴らしい可能性を有している。変異及びコピー数変動（ＣＮＶ）などのｃｆＤＮＡにおける遺伝子情報は、がんの進行及び治療を監視するための潜在的な有用性を示す。しかしながら、早期疾患における低い割合の腫瘍ＤＮＡを考慮すると、遺伝的変化を検出することは困難である。更に、遺伝的変化は、悪性腫瘍の位置を決定するために必要とされる、起源の組織についての有益性が弱い。

【0004】

対照的に、がん細胞及び腫瘍微小環境の両方のＤＮＡメチル化などの広範なエピジェネティックな変化は、腫瘍発生の早期に生じる。最近の研究では、検出限界を克服するために組み合わせることができる何千ものメチル化変化と、高い信頼性でがんの局在化を可能にする起源の組織の情報とを提供することによって、ｃｆＤＮＡメチル化が早期がん検出のための最も有望なバイオマーカーの１つであることが示されている。ＤＮＡメチル化は、全ゲノム、塩基解像度、及び亜硫酸水素塩配列決定などの定量的配列決定法によって最適に決定される。しかしながら、亜硫酸水素塩配列決定は、ＤＮＡを損傷し、高価である。したがって、現在のｃｆＤＮＡメチル化配列決定は、低深度、標的化、または低解像度であり、定性的な濃縮ベースの配列決定であることによって限定され、したがって、ｃｆＤＮＡメチロームを不完全に捕捉する。
〔発明の概要〕
本開示の実施形態は、メチル化シグネチャを得る方法を含む。これらの実施形態によれば、本方法は、試料から無細胞ＤＮＡ（ｃｆＤＮＡ）を単離することと、ｃｆＤＮＡを含む配列決定ライブラリを調製することと、配列決定ライブラリに対してＴＥＴ支援ピリジンボラン配列決定（ＴＡＰＳ）を実施して、ｃｆＤＮＡのメチル化シグネチャを得ることと、を含む。いくつかの実施形態において、メチル化シグネチャは、全ゲノムメチル化シグネチャである。

【0005】

いくつかの実施形態において、ｃｆＤＮＡに対してＴＡＰＳから得られる一意のマッピングレートは、少なくとも８０％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも７０％である。

【0006】

いくつかの実施形態において、配列決定ライブラリを調製することは、単離されたｃｆＤＮＡに配列決定アダプターをライゲーションすることを含む。

【0007】

いくつかの実施形態において、キャリアＤＮＡは、ＴＡＰＳを実施する前に、配列決定ライブラリに追加される。

【0008】

いくつかの実施形態において、本方法は、ｃｆＤＮＡ全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む。

【0009】

いくつかの実施形態において、メチル化バイオマーカーは、差次メチル化領域（ＤＭＲ）を含む。

【0010】

いくつかの実施形態において、本方法は、参照ＤＭＲと比較して、ＤＭＲに基づいて試料を分類することを更に含む。

【0011】

いくつかの実施形態において、参照ＤＭＲは、非がん性対照、またはがん性対照に対応する。

【0012】

いくつかの実施形態において、本方法は、ｃｆＤＮＡ全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーに対応する起源の組織を決定することと、を更に含む。

【0013】

いくつかの実施形態において、本方法は、起源の組織のバイオマーカーに基づいて試料を分類することを更に含む。

【0014】

いくつかの実施形態において、本方法は、ＤＮＡ断片化プロファイルを特定することと、断片化プロファイルが、がんの指標であるかどうかを決定することと、を更に含む。

【0015】

いくつかの実施形態において、本方法は、ｃｆＤＮＡからの少なくとも１つの配列バリアントを特定することと、配列バリアントが、がんの指標であるかどうかを決定することと、を更に含む。

【0016】

いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｍＣ修飾を特定することと、５ｍＣ修飾の頻度の定量的尺度を提供することと、を含む。

【0017】

いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｈｍＣ修飾を特定することと、５ｈｍＣ修飾の頻度の定量的尺度を提供することと、を含む。

【0018】

いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｃａＣ修飾を特定することと、５ｃａＣ修飾の頻度の定量的尺度を提供することと、を含む。

【0019】

いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｆＣ修飾を特定することと、５ｆＣ修飾の頻度の定量的尺度を提供することと、を含む。

【0020】

本開示の実施形態はまた、本明細書に記載の方法のいずれかを使用して、対象が、がんを有するかどうかを決定する方法を含む。いくつかの実施形態において、がんは、肝細胞癌（ＨＣＣ）または膵管腺癌（ＰＤＡＣ）を含む。

【0021】

本開示の実施形態はまた、本明細書に記載の方法のいずれかを使用して、対象が、早期がんを有するかどうかを決定する方法を含む。いくつかの実施形態において、がんは、早期肝細胞癌（ＨＣＣ）または早期膵管腺癌（ＰＤＡＣ）を含む。

【0022】

更に他の好ましい実施形態において、本発明は、患者試料中のｃｆＤＮＡを分析するマルチモーダル方法であって、患者試料からｃｆＤＮＡを単離することと、試料中の５ｍＣ及び／または５ｈｍＣ残基をＤＨＵ残基に変換して、修飾ｃｆＤＮＡ試料を提供することと、修飾ｃｆＤＮＡ試料を配列決定して、試料中のメチル化領域を特定することであって、非修飾参照ｃｆＤＮＡと比較して、修飾ｃｆＤＮＡ試料中のシトシン（Ｃ）からチミン（Ｔ）への移行、またはシトシン（Ｃ）からＤＨＵへの移行が、ｃｆＤＮＡ中の５ｍＣまたは５ｈｍＣのいずれかの位置を提供する、配列決定することと、ａ）修飾ｃｆＤＮＡ試料における１つ以上の標的のコピー数変動を決定すること、ｂ）修飾ｃｆＤＮＡ試料における起源の組織または１つ以上の標的を決定すること、ｃ）修飾ｃｆＤＮＡ試料の断片化プロファイルを決定すること、及びｄ）修飾ｃｆＤＮＡ試料において１つ以上の単一ヌクレオチド変異を特定すること、からなる群から選択される修飾ｃｆＤＮＡに対する１つ以上の追加の分析ステップを実施することと、を含む、マルチモーダル方法を提供する。

【0023】

いくつかの実施形態において、少なくとも１つの差次メチル化領域（ＤＭＲ）を特定することを含む、修飾ｃｆＤＮＡ試料を配列決定して、試料中のメチル化領域を特定するステップ。

【0024】

いくつかの実施形態において、本マルチモーダル方法は、参照ＤＭＲと比較して、ＤＭＲに基づいて試料を分類することを更に含む。

【0025】

いくつかの実施形態において、参照ＤＭＲは、非がん性対照、またはがん性対照に対応する。

【0026】

いくつかの実施形態において、修飾ｃｆＤＮＡ試料における１つ以上の標的のコピー数変動（ＣＮＶ）を決定するステップは、参照ゲノムをビンに分割し、各ビンにおけるリードの数をカウントすることによって、ゲノムにわたる標的配列について観察されたリードカウントを決定することを含む。

【0027】

いくつかの実施形態において、５００ｋｂより大きいコピー数異常の存在は、患者におけるＣＮＶの指標である。

【0028】

いくつかの実施形態において、修飾ｃｆＤＮＡ試料における起源の組織または１つ以上の標的を決定するステップは、修飾ｃｆＤＮＡ試料の配列決定から得られたデータの組織デコンボリューションを含む。

【0029】

いくつかの実施形態において、組織デコンボリューションは、修飾ｃｆＤＮＡ試料において特定されたＤＮＡメチル化値を、２つ以上の異なる組織からの参照ＤＭＲと比較することを含む。

【0030】

いくつかの実施形態において、修飾ｃｆＤＮＡ試料の断片化プロファイルを決定するステップは、修飾ｃｆＤＮＡ試料における断片長さ及び断片の周期性を分類することを含む。

【0031】

いくつかの実施形態において、修飾ｃｆＤＮＡ試料における断片の長さ及び断片の周期性を分類することは、１０ｂｐの長さ範囲のビンにおける３００～５００ｂｐのｃｆＤＮＡ断片の割合を計算することを更に含む。

【0032】

いくつかの実施形態において、修飾ｃｆＤＮＡ試料において１つ以上の単一ヌクレオチド変異を特定するステップは、ＴＡＰＳ後の配列決定結果を比較することによって、ｃｆＤＮＡ中の特定の位置における５ｍＣまたは５ｈｍＣからのＣからＴへのＳＮＰを区別することを更に含み、ｃｆＤＮＡの元の下部鎖に対する相補体中の特定の位置におけるＴリードの存在は、ＣからＴへのＳＮＰの指標であり、ｃｆＤＮＡの元の下部鎖に対する相補体中の特定の位置におけるＣリードの存在は、５ｍＣまたは５ｈｍＣの指標である。

【0033】

いくつかの実施形態において、ステップａ、ｂ、ｃ及びｄのうちの２つ以上は、修飾ｃｆＤＮＡに対して実施される。

【0034】

いくつかの実施形態において、ステップａ、ｂ、ｃ及びｄのうちの３つ以上は、修飾ｃｆＤＮＡに対して実施される。

【0035】

いくつかの実施形態において、ステップａ、ｂ、ｃ及びｄの全ては、修飾ｃｆＤＮＡに対して実施される。

【0036】

いくつかの実施形態において、配列決定するステップから得られる一意のマッピングレートは、少なくとも８０％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも７０％である。

【0037】

いくつかの実施形態において、配列決定するステップは、単離されたｃｆＤＮＡに配列決定アダプターをライゲーションすることによる、ｃｆＤＮＡを含む配列決定ライブラリを調製することを更に含む。

【0038】

いくつかの実施形態において、キャリアＤＮＡは、ｃｆＤＮＡに追加される。

【0039】

いくつかの実施形態において、本マルチモーダル方法は、ｃｆＤＮＡ全ゲノムメチル化シグネチャを提供し、本方法は、ｃｆＤＮＡ全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む。

【0040】

いくつかの実施形態において、本マルチモーダル方法は、ｃｆＤＮＡ中の５ｍＣ修飾を特定することと、５ｍＣ修飾の頻度の定量的尺度を提供することと、を更に含む。

【0041】

いくつかの実施形態において、本マルチモーダル方法は、ｃｆＤＮＡ中の５ｈｍＣ修飾を特定することと、５ｈｍＣ修飾の頻度の定量的尺度を提供することと、を更に含む。

【0042】

いくつかの実施形態において、本マルチモーダル方法は、ｃｆＤＮＡ中の５ｃａＣ修飾を特定することと、５ｃａＣ修飾の頻度の定量的尺度を提供することと、を更に含む。

【0043】

いくつかの実施形態において、本マルチモーダル方法は、ｃｆＤＮＡ中の５ｆＣ修飾と、５ｆＣ修飾の頻度の定量的尺度を提供することと、を更に含む。

【0044】

いくつかの実施形態において、試料中の５ｍＣ及び／または５ｈｍＣ残基をＤＨＵ残基に変換して、修飾ｃｆＤＮＡ試料を提供するステップは、５ｍＣ及び／または５ｈｍＣ残基を酸化して５ｃａＣ及び／または５ｆＣ残基を提供することと、５ｃａＣ及び／または５ｆＣ残基をＤＨＵ残基へと還元することと、を含む。

【0045】

いくつかの実施形態において、５ｍＣ及び／または５ｈｍＣ残基を酸化して５ｃａＣ及び／または５ｆＣ残基を提供するステップは、Ｔｅｔ酵素による試料の処理を含む。

【0046】

いくつかの実施形態において、５ｍＣ及び／または５ｈｍＣ残基を酸化して５ｃａＣ及び／または５ｆＣ残基を提供するステップは、１つ以上の５ｆＣ残基が生成されるような化学酸化剤による試料の処理を含む。

【0047】

いくつかの実施形態において、５ｃａＣ及び／または５ｆＣ残基をＤＨＵ残基へと還元するステップは、ボラン還元剤による試料の処理を含む。

【0048】

本開示の実施形態はまた、本明細書に記載のマルチモーダル方法のいずれかを使用して、対象が、早期がんを有するかどうかを決定する方法を含む。
〔図面の簡単な説明〕
〔図１〕ＴＡＰＳによるｃｆＤＮＡ分析。（Ａ）ｃｆＤＮＡ分析のためのＴＡＰＳアプローチの概略図。ｃｆＤＮＡは、１～３ｍＬの血漿から単離される。１０ｎｇのｃｆＤＮＡを、Ｉｌｌｕｍｉｎａ配列決定アダプターにライゲーションし、１００ｎｇのキャリアＤＮＡでいっぱいに満たす。その後、ＤＮＡ中の５ｍＣ及び５ｈｍＣを、ｍＴｅｔ１ＣＤ酵素によって５ｃａＣへと酸化し、ＰｙＢｒによってＤＨＵへと還元し、増幅し、最終的な配列決定において、Ｔとして検出される。ＴＡＰＳデータの計算分析は、ＤＮＡメチル化、起源の組織、断片化パターン及びＣＮＶを含む複数のｃｆＤＮＡ特徴の同時特性決定を可能にする。（Ｂ）８７個のｃｆＤＮＡＴＡＰＳライブラリにおける総リード、一意にマッピングされたリード及び一意にマッピングされたＰＣＲ重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。（Ｃ）既知の位置に修飾または非修飾シトシンを有するスパイクイン対照に基づく、８５個のｃｆＤＮＡＴＡＰＳライブラリにおける５ｍＣの変換率及び擬陽性率。各々の点は、個々の試料を表す。

【0049】

〔図２Ａ〕臨床試料におけるｃｆＤＮＡメチル化。本試験に含まれる２１名のＨＣＣ患者及び２３名のＰＤＡＣ患者のがんステージ分布。

【0050】

〔図２Ｂ〕臨床試料におけるｃｆＤＮＡメチル化。非がん対照、ＨＣＣ及びＰＤＡＣｃｆＤＮＡにおけるＣｐＧゲノム修飾レベル当たりの平均。各々の点は、個々の試料を表す。

【0051】

〔図２Ｃ〕臨床試料におけるｃｆＤＮＡメチル化。非がん対照及びＨＣＣにおける、１ｋｂゲノムウィンドウにおけるｃｆＤＮＡメチル化のＰＣＡプロット。

【0052】

〔図２Ｄ〕臨床試料におけるｃｆＤＮＡメチル化。非がん対照及びＰＤＡＣにおける、１ｋｂゲノムウィンドウにおけるｃｆＤＮＡメチル化のＰＣＡプロット。

【0053】

〔図２Ｅ〕臨床試料におけるｃｆＤＮＡメチル化。領域に対する過剰発現分析は、調節領域においてＨＣＣについてＰＣ２、及びＰＤＡＣについてＰＣ１と最も相関していた。

【0054】

〔図２Ｆ〕臨床試料におけるｃｆＤＮＡメチル化。ＨＣＣ及び非がん対照における差次的にメチル化されたエンハンサーに基づくモデル分類性能の受信者操作特徴（ＲＯＣ）曲線（ｎ＝５１、ＨＣＣ＝２１、非がん対照＝３０）。

【0055】

〔図２Ｇ〕臨床試料におけるｃｆＤＮＡメチル化。ＨＣＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＨＣＣとして予測した。

【0056】

〔図２Ｈ〕臨床試料におけるｃｆＤＮＡメチル化。ＰＤＡＣと非がん対照との間の差次的にメチル化されたエンハンサーに基づくモデル分類性能のＲＯＣ曲線（ｎ＝５３、ＰＤＡＣ＝２３、非がん対照＝３０）。

【0057】

〔図２Ｉ〕臨床試料におけるｃｆＤＮＡメチル化。ＰＤＡＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＰＤＡＣとして予測した。

【0058】

〔図３〕ｃｆＴＡＰＳは、ｃｆＤＮＡにおける起源の組織及び断片化パターンの分析を可能にする。（Ａ）ＮＮＬＳによって推定される非がん個体における平均組織寄与。１．５％未満の組織寄与は、「その他」としてまとめられている。（Ｂ）非がん、ＨＣＣ及びＰＤＡＣ群内の推定肝臓癌寄与を示すボックスプロット。統計的有意性を、対応ありｔ検定により評価した。ｎ．ｓ．－有意でない。（Ｃ）３つの群におけるｃｆＤＮＡ断片の長さ分布。各試料について、長いｃｆＤＮＡ断片（３００～５００ｂｐ）の１０塩基対間隔における割合（Ｐ）を、ＰＣＡ分析及び機械学習のための断片化特徴として使用した。（Ｄ）非がん対照、ＰＤＡＣ、及びＨＣＣにおける短い（７０～１５０ｂｐ）及び長い（３００～５００ｂｐ）断片の割合を示すボックスプロット。クラスカル・ウォリス検定を実施して、群間の断片サイズ分布の差を検定した。統計的に有意な差は、アスタリスクが付けられる（＊Ｐ値＜０．０５、＊＊Ｐ値＜０．０１、＊＊＊Ｐ値＜０．００１、＊＊＊＊Ｐ値＜０．０００１）。（Ｅ）非がん対照及びＨＣＣ（左パネル）、ならびに非がん対照及びＰＤＡＣ（右パネル）におけるｃｆＤＮＡ１０ｂｐ断片の割合のＰＣＡプロット。

【0059】

〔図４〕ｃｆＴＡＰＳからのマルチモーダル特徴を統合することで、複数がん検出を強化する。（Ａ）複数がん予測に対する個々のモデルの性能、及び各患者について予測された確率を示すヒートマップ。各々の垂直列は、患者である。検出のはい／いいえは、特定の特徴に基づいて患者が正しく分類されるか、または誤って分類されることを意味する。予測スコアは、特定の特徴に基づいて患者を特定の群に分類する確率を意味する。（Ｂ）複数がん予測のために、ｃｆＴＡＰＳデータから抽出された複数の特徴（ＤＮＡメチル化、組織寄与及び断片化の割合）を統合する方法を詳述する概略図。（Ｃ）ＬＯＯ交差検証で計算された実際の患者のステータス及び予測患者ステータス。

【0060】

〔図５〕ｃｆＤＮＡＴＡＰＳ。（Ａ）増幅後のクリーンアップの後の１０種類の代表的なｃｆＤＮＡＴＡＰＳライブラリのアガロースゲル。全てのｃｆＤＮＡＴＡＰＳライブラリを、１０ｎｇのｃｆＤＮＡから調製し、７回のＰＣＲサイクルで増幅させた。（Ｂ）８７個のｃｆＤＮＡＴＡＰＳライブラリ中のｈｇ３８、スパイクイン、及びキャリアＤＮＡについてマッピングされたリード対の数。全リード対と比較した、マッピングされたリード対の平均割合が、棒グラフの上に示されている。エラーバーは、標準誤差を表す。（Ｃ）ｃｆＤＮＡＷＧＢＳ（ＥＧＡＤ００００１００４３１７）（２４）における総リード、一意にマッピングされたリード及び一意にマッピングされたＰＣＲ重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。（Ｄ）低深度２．６×に配列決定された同じｃｆＤＮＡ試料から調製されたｃｆＤＮＡＴＡＰＳライブラリの技術的反復間の相関関係。メチル化を１００ｋｂウィンドウで計算した。

【0061】

〔図６Ａ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ｃｆＴＡＰＳコホートに含まれる膵炎、肝硬変、ＰＤＡＣ、ＨＣＣ及び非がん対照患者の年齢及び性別の分布。

【0062】

〔図６Ｂ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照、ＨＣＣ及びＰＤＡＣにおける、ｃｆＤＮＡにおけるＣｐＧ修飾のゲノムワイド分布。バープロットは、各群についての平均ＣｐＧ修飾の分布を示す。オーバーレイラインプロットは、各患者におけるＣｐＧメチル化分布を示す。

【0063】

〔図６Ｃ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＨＣＣ患者における平均ｃｆＤＮＡＣｐＧ修飾レベルと腫瘍サイズ（ｍｍ）との相関プロット。

【0064】

〔図６Ｄ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＨＣＣ患者における平均ｃｆＤＮＡＣｐＧ修飾レベルと腫瘍ステージとの相関プロット。

【0065】

〔図６Ｅ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＰＤＡＣ患者についての腫瘍サイズ（ｍｍ）の相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの９５％信頼区間を表す。ピアソン相関係数（ｃｏｒ）及びＰ値がプロットに示されている。

【0066】

〔図６Ｆ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＰＤＡＣ患者についての腫瘍ステージの相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの９５％信頼区間を表す。ピアソン相関係数（ｃｏｒ）及びＰ値がプロットに示されている。

【0067】

〔図６Ｇ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照、ＨＣＣ及びＰＤＡＣのｃｆＤＮＡにおける染色体４上のＣｐＧ修飾レベルの分布。各線は個々の患者を表す。平均ＣｐＧ修飾値を、染色体４に沿って１Ｍｂウィンドウごとに計算し、ガウス平滑化した（平滑化ウィンドウサイズ１０）。

【0068】

〔図６Ｈ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照、ＨＣＣ及びＰＤＡＣにおける、１Ｍｂゲノムウィンドウにおけるメチル化分散。

【0069】

〔図６Ｉ〕がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照及びＨＣＣ、非がん対象及びＰＤＡＣにおける、１ｋｂのゲノムウィンドウにおけるｃｆＤＮＡメチル化のＰＣＡプロット（クローン病及び大腸炎は、それぞれ緑色及び黄色の着色されている）。

【0070】

〔図７Ａ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＬＯＯモデルの訓練及び検証アプローチの概要。試料の総数は、ｎとラベル付けされている。各々の繰り返しにおいて、モデル訓練セットは、ｎ－１個の試料からなる。差次的にメチル化されたエンハンサー（ＨＣＣの場合）またはプロモーター（ＰＤＡＣの場合）を、モデル構築のために選択した。予測モデルを、各フォールドにおけるホールドアウト試験試料について評価した。肝硬変及び膵炎試料は、ＤＭＲ特定及びモデル構築には含まれなかった。

【0071】

〔図７Ｂ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。肝硬変試料のＨＣＣがん予測スコア。各青色の点は、個々のＬＯＯモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。

【0072】

〔図７Ｃ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＮＣＩ－ＮａｔｕｒｅＰａｔｈｗａｙＩｎｔｅｒａｃｔｉｏｎに対するＥｎｒｉｃｈｒを使用した、ＨＣＣｃｆＤＮＡに基づく差次的にメチル化されたエンハンサーに関連する、遺伝子の遺伝子オントロジー分析（Ｐ値＜０．００２）。Ｐ値に基づいて選択された上位１０のカテゴリが、グラフに示される。遺伝子－エンハンサー相互作用を、ＧｅｎｅＨａｎｃｅｒ参照データベースを使用して割り当てた。

【0073】

〔図７Ｄ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＤＬＣ１遺伝子についてのＨＣＣｃｆＤＮＡにおける代表的な差次的にメチル化されたエンハンサーのメチル化（両側ｔ検定のＰ値＝８．７６５ｅ－０６）。

【0074】

〔図７Ｅ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。膵炎試料のＰＤＡＣがん予測スコア。各黄色の点は、個々のＬＯＯモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＰＤＡＣとして予測した。

【0075】

〔図７Ｆ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＮＣＩ－ＮａｔｕｒｅＰａｔｈｗａｙＩｎｔｅｒａｃｔｉｏｎに対するＥｎｒｉｃｈｒを使用した、ＰＤＡＣｃｆＤＮＡに基づく差次的にメチル化されたプロモーターに最も近い遺伝子の遺伝子オントロジー分析（Ｐ値＜０．００２）。Ｐ値に基づいて選択された上位１０のカテゴリが、グラフ上に示される。

【0076】

〔図７Ｇ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＲＢ１遺伝子についてのＰＤＡＣｃｆＤＮＡにおける代表的な差次的にメチル化されたプロモーターのメチル化（両側ｔ検定のＰ値＝０．００１７）。

【0077】

〔図７Ｈ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。独立したｃｆＤＮＡＷＧＢＳデータセット（ＥＧＡＤ００００１００４３１７）のＨＣＣがん予測スコア。各点は、個々のＬＯＯモデルの予測スコアを表す。灰色の点は、非がん対照に属し、赤色の点は、ＨＣＣに属する。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。

【0078】

〔図７Ｉ〕ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ダウンサンプリングされたリードにおいて検出され得るｒｅｆＤＭＲの割合。元のＬＯＯモデル訓練で特定されたＤＭＲを、ｒｅｆＤＭＲとして処理した。

【0079】

〔図８Ａ〕ｃｆＤＮＡの起源の組織。参照組織メチル化アトラスのｔ－ＳＮＥプロット。

【0080】

〔図８Ｂ〕ｃｆＤＮＡの起源の組織。ＨＣＣ及びＰＤＡＣ個体における平均組織寄与。

【0081】

〔図８Ｃ〕ｃｆＤＮＡの起源の組織。非がん、ＨＣＣ及びＰＤＡＣｃｆＤＮＡ試料における推定Ｔ細胞寄与を示すボックスプロット。

【0082】

〔図８Ｄ〕ｃｆＤＮＡの起源の組織。非がんに対してＨＣＣを分類するために組織寄与を使用したモデル性能のＲＯＣ曲線。

【0083】

〔図８Ｅ〕ｃｆＤＮＡの起源の組織。組織寄与に対して訓練された分類子を使用した、ＨＣＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＨＣＣとして予測した。

【0084】

〔図８Ｆ〕ｃｆＤＮＡの起源の組織。ＨＣＣ対非がん分類子を使用した肝硬変試料のがんスコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。

【0085】

〔図８Ｇ〕ｃｆＤＮＡの起源の組織。対照に対してＰＤＡＣを分類するために組織寄与を使用したモデル性能のＲＯＣ曲線。

【0086】

〔図８Ｈ〕ｃｆＤＮＡの起源の組織。組織寄与に基づいて構築された分類子を使用した、ＰＤＡＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＰＤＡＣとして予測した。

【0087】

〔図８Ｉ〕ｃｆＤＮＡの起源の組織。ＰＤＡＣ対非がん分類子を使用した膵炎試料のＰＤＡＣがんスコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＰＤＡＣとして予測した。

【0088】

〔図９Ａ〕ｃｆＤＮＡにおけるＣＮＶ分析。１００ｋｂのビンにおけるｃｆＤＮＡからのＣＮＶ推定ヒートマップ。

【0089】

〔図９Ｂ〕ｃｆＤＮＡにおけるＣＮＶ分析。５００ｋより大きなＣＮＶを有するｃｆＤＮＡ試料。

【0090】

〔図１０〕がん予測のためのｃｆＤＮＡ断片化パターン。（Ａ）公的な全ゲノム亜硫酸水素塩配列決定データにおけるｃｆＤＮＡの断片サイズ分布。特定の長さの断片の数を断片の総数で割り算することによって、頻度を計算した。（Ｂ）１０ｂｐのビンにおける長いｃｆＤＮＡ断片（３００～５００ｂｐ）の割合を特徴として使用する、一般化された線形モデルからのＨＣＣ及び非がん対照予測スコアのＲＯＣ曲線。（Ｃ）ＬＯＯ交差検証を使用して訓練された分類子におけるＨＣＣ及び非がん対照のがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＨＣＣとして予測した。（Ｄ）これらの分類子における肝硬変試料のＨＣＣがん予測スコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。（Ｅ）１０ｂｐのビンにおける長いｃｆＤＮＡ断片（３００～５００ｂｐ）の割合を特徴として使用する、一般化された線形モデルからのＰＤＡＣ及び非がん対照予測スコアのＲＯＣ曲線。（Ｆ）１０ｂｐの長さ範囲におけるｃｆＤＮＡ断片頻度に基づいて構築された分類子におけるＰＤＡＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＰＤＡＣとして予測した。（Ｇ）１０ｂｐの長さ範囲におけるｃｆＤＮＡ断片頻度に基づいて構築された分類子における膵炎試料のＰＤＡＣがん予測スコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、ＰＤＡＣとして予測した。

【0091】

〔図１１Ａ〕ｃｆＴＡＰＳによる複数がん検出。３クラス分類におけるメチル化、組織寄与及び断片化の割合モデルの性能。上のパネルは、各分類子の正確さを示し、下のパネルは、ＬＯＯ交差検証分析における実際の患者ステータスと予測患者ステータスを示す。

【0092】

〔図１１Ｂ〕ｃｆＴＡＰＳによる複数がん検出。がん型予測に使用される選択されたゲノム領域のメチル化ステータスを示すヒートマップ。

【0093】

〔図１１Ｃ〕ｃｆＴＡＰＳによる複数がん検出。３クラス分類のための選択されたＤＭＲの最も近い遺伝子に対するＮＣＩ－ＮａｔｕｒｅＰａｔｈｗａｙＩｎｔｅｒａｃｔｉｏｎに対するＥｎｒｉｃｈｒを使用した遺伝子オントロジー分析。

【0094】

〔図１２〕ＴＡＰＳの前及び後の標的配列中のＣからＴへのＳＮＰ及びメチル化シトシンに由来する異なるパターンの概略図である。図では、ＯＴは元の上部を意味し、ＯＢは元の下部を意味し、ＣＴＯＴは元の上部に対して相補的であることを意味し、ＣＴＯＢは元の下部に対して相補的であることを意味する。
〔発明を実施するための形態〕
近年、２０１８年１月８日に出願された米国仮特許出願第６２／６１４，７９８号、２０１８年４月２０日に出願された同第６２／６６０，５２３号、及び２０１８年１１月２６日に出願された同第６２／７７１，４０９号（これらの各々は、参照によりその全体が本明細書に組み込まれる）に対する優先権を主張する、２０１９年１月８日に出願された国際ＰＣＴ出願第ＰＣＴ／ＵＳ２０１９／０１２６２７号に記載されるように、亜硫酸水素塩を含まないＤＮＡメチル化配列決定方法であるＴＥＴ支援ピリジンボラン配列決定（ＴＡＰＳ）が開発された。ＴＡＰＳは、ＤＮＡメチル化を直接検出するための穏和な化学反応の使用に基づき、配列決定コストを半減させつつ、亜硫酸水素塩配列決定と比較して、改善された配列品質、マッピングレート、及びカバレッジを示した。直接メチル化検出と、ＴＡＰＳの非破壊的性質との組み合わせは、ＤＮＡメチル化分析にとってだけではなく、本明細書に更に記載されるように、ｃｆＤＮＡにおける同時遺伝子分析にとっても有用であり、液体生検による非侵襲的がん検出を強化することができる。本開示の実施形態は、１０ｎｇのｃｆＤＮＡ程度の低さから高品質かつ高深度の全ゲノムメチロームを届けるためのｃｆＤＮＡに最適化されたＴＡＰＳ（ｃｆＴＡＰＳ）を含む。

【0095】

本明細書に更に記載されるように、ｃｆＴＡＰＳは、肝細胞癌（ＨＣＣ）及び膵管腺癌（ＰＤＡＣ）のｃｆＤＮＡに適用し、これら２種類のがんは、主に進行した疾患段階での検出に起因して、特に予後が不良である。ＰＤＡＣ及びＨＣＣの早期検出のための非侵襲的な方法は、利用可能ではなく、この方法は、それらの後期診断に寄与する。何十年もの間、ＨＣＣの検出は、血清α－フェトプロテイン（ＡＦＰ）測定と組み合わせた肝臓超音波に依存してきた。しかしながら、これらの方法は、特異性及び感度が低い。ＰＤＡＣを検出または診断するための血液検査は存在しない。炭水化物抗原１９－９（ＣＡ１９－９）は、ＰＤＡＣの治療及び発達を監視するために使用されるが、その感度及び特異性は低すぎて、ＰＤＡＣを診断またはスクリーニングすることができない。したがって、ＰＤＡＣ及びＨＣＣ検出のための新規アプローチが緊急に必要とされている。

【0096】

本明細書で提供される結果は、ｃｆＴＡＰＳからの豊富な情報が、差次的なメチル化、起源の組織、及び断片化プロファイルの統合されたマルチモーダルのエピジェネティック分析及び遺伝性分析を可能にし、ＨＣＣ及びＰＤＡＣを有する患者からのｃｆＤＮＡ試料を、対照、及び前がん性炎症状態を有する患者から正確に区別することを示す。加えて、本明細書で提供される結果は、ＨＣＣ、ＰＤＡＣ及び非がん対照からのｃｆＤＮＡにおける全ゲノム塩基解像度メチロームを特性決定するためのｃｆＴＡＰＳの成功した最適化及び適用を示す。わずか１０ｎｇのｃｆＤＮＡを使用して、ｃｆＴＡＰＳライブラリは、以前のｃｆＤＮＡＷＧＢＳと比較して、配列決定の品質及び深度を大幅に改善したことを示した。実際に、以前の研究よりも少ないｃｆＤＮＡインプットを使用して、ｃｆＤＮＡＴＡＰＳは、これまでで最も包括的な無細胞メチル化を生成した。有益なリードのはるかに高い収率は、ｃｆＴＡＰＳが所与の量のｃｆＤＮＡからより多くの情報を抽出することを可能にし、大規模なｃｆＤＮＡメチル化研究のための実行可能な選択肢にする。ＴＡＰＳの使用によって、他の方法と比較して、優れた一意のマッピングレート及び重複除去された一意のマッピングレートが得られた。いくつかの実施形態において、一意のマッピングレートは、少なくとも６５％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも５５％である。いくつかの実施形態において、一意のマッピングレートは、少なくとも７０％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも６０％である。いくつかの実施形態において、一意のマッピングレートは、少なくとも７５％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも６５％である。いくつかの実施形態において、一意のマッピングレートは、少なくとも８０％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも７０％である。いくつかの実施形態において、一意のマッピングレートは、少なくとも８５％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも７２％である。いくつかの実施形態において、一意のマッピングレートは、少なくとも９０％であり、及び／または一意の重複除去されたマッピングレートは、少なくとも７５％である。

【0097】

ｃｆＴＡＰＳによって達成されるディープシーケンシングは、早期がん検出のための無細胞メチローム及びメチル化バイオマーカーの全ゲノム発見の詳細な分析を可能にする。有意な全般的な低いメチル化は観察されず、このことは、腫瘍細胞に由来するｃｆＤＮＡの割合が低いことを示唆している（本明細書に含まれるほとんどのがん患者におけるＣＮＶの欠如によって裏付けられる）が、エンハンサー及びプロモーターなどの調節領域における局所メチル化シグナルが、ＨＣＣ及びＰＤＡＣを対照から正確に区別することができる、がん特異的情報を含有するという結果が示された。このことは、患者コホートで使用される炎症が濃縮された現実世界の対照群を考慮すると特に重要であり、本明細書に開示されるＨＣＣモデルは、独立した検証として、ｃｆＤＮＡＷＧＢＳデータセットから全てのＨＣＣ及び対照患者を正しく特定することができる。

【0098】

早期がん検出のためのｃｆＤＮＡメチル化の別の重要な利点は、起源の組織の情報を決定する能力である。現時点で利用可能な公共のＷＧＢＳ組織データベースを使用して、ｃｆＴＡＰＳデータの全ゲノム組織デコンボリューションを実施し、結果は、ＨＣＣｃｆＤＮＡにおける肝臓腫瘍寄与の増加及びがんｃｆＤＮＡにおける異なる免疫シグネチャを示した。組織デコンボリューション自体を、がん検出に使用することができる。最後に、ＴＡＰＳは、修飾シトシンを直接変換するため、非修飾シトシンを変換する他のアプローチと比較して、基礎となる遺伝情報を最大限に保持する。本開示において、ＣＮＶ及び断片化情報は、ｃｆＴＡＰＳから抽出され、後者は、ｃｆＤＮＡＷＧＢＳにおいて失われる。結果は、差次的なメチル化、起源の組織、及び断片化プロファイルを組み合わせた統合されたアプローチが、複数がん検出のためのモデル性能を改善することができることを更に示した。

【0099】

本セクション及び本明細書の開示全体で使用されるセクションの見出しは、単に組織的な目的のためだけであり、限定することを意図するものではない。
１．定義
別段の定義がない限り、本明細書で使用される全ての技術用語及び科学用語は、当業者によって一般的に理解されるものと同じ意味を有する。矛盾する場合は、定義を含む本文書が優先されるものとする。好ましい方法及び材料については後述するが、本明細書に記載されるものと類似するまたは同等の方法及び材料も、本開示の実施または試験に使用することができる。本明細書において言及される全ての刊行物、特許出願、特許、及び他の参考文献は、参照により、それらの全体が組み込まれる。本明細書に開示される材料、方法、及び例は、例示にすぎず、限定することは意図されない。

【0100】

本明細書で使用される用語「含む（ｃｏｍｐｒｉｓｅ）」、「含む（ｉｎｃｌｕｄｅ）」、「有する（ｈａｖｉｎｇ）」、「有する（ｈａｓ）」、「できる」、「含有する」、及びそれらの変形は、追加の行為または構造の可能性を排除しないオープンエンドな移行句、用語、または単語であることが意図される。単数形「ａ」、「ａｎｄ」、及び「ｔｈｅ」は、文脈で明確に別段指示されない限り、複数の参照を含む。本開示はまた、明示的に記載されるか否かにかかわらず、本明細書に提示される実施形態または要素「を含む（ｃｏｍｐｒｉｓｉｎｇ）」、「～からなる」、及び「～から本質的になる」他の実施形態を企図する。

【0101】

本明細書における数値範囲の列挙のために、それらの間に同じ程度の精度で介在する各数値が明示的に企図される。例えば、６～９の範囲については、数字７及び８が、６及び９に加えて企図され、６．０～７．０の範囲については、数字６．０、６．１、６．２、６．３、６．４、６．５、６．６、６．７、６．８、６．９、及び７．０が明示的に企図される。

【0102】

【0103】

本明細書で使用される「～への相関」は、～と比較して、を指す。

【0104】

本明細書で使用される場合、「メチル化」は、シトシンのＣ５位もしくはＮ４位でのシトシンメチル化、アデニンのＮ６位、または他のタイプの核酸メチル化を指す。インビトロ増幅ＤＮＡは、典型的なインビトロＤＮＡ増幅方法が増幅鋳型のメチル化パターンを保持しないため、通常メチル化されない。しかしながら、「メチル化されていないＤＮＡ」または「メチル化されたＤＮＡ」は、それぞれ元の鋳型がメチル化されていなかった、またはメチル化された増幅ＤＮＡをも指すことが可能である。

【0105】

その結果、本明細書に使用される場合、「メチル化されたヌクレオチド」または「メチル化されたヌクレオチド塩基」は、ヌクレオチド塩基上でのメチル部分の存在を指し、このメチル部分は、認識された典型的なヌクレオチド塩基中に存在しない。例えば、シトシンは、そのピリミジン環上にメチル部分を含有しないが、５－メチルシトシンは、そのピリミジン環の５位にメチル部分を含有する。したがって、シトシンはメチル化ヌクレオチドではなく、５－メチルシトシンはメチル化ヌクレオチドである。

【0106】

本明細書に使用される場合、「メチル化された核酸分子」は、１つ以上のメチル化されたヌクレオチドを含む核酸分子を指す。

【0107】

本明細書で使用される場合、核酸分子の「メチル化状態」、「メチル化プロファイル」、「メチル化ステータス」、及び「メチル化シグネチャ」は、核酸分子中の１つ以上のメチル化ヌクレオチド塩基の有無を指す。例えば、メチル化シトシンを含有する核酸分子は、メチル化されているとみなされる（例えば、核酸分子のメチル化状態は、メチル化されている）。メチル化ヌクレオチドを一切含有しない核酸分子は、メチル化されていないとみなされる。

【0108】

本明細書で使用される場合、「メチル化頻度」または「メチル化パーセント（％）」は、分子または遺伝子座がメチル化されていない事例の数と比較した、分子または遺伝子座がメチル化されている事例の数を指す。メチル化状態頻度は、個体の集団または単一の個体からの試料を説明するために使用することができる。例えば、５０％のメチル化状態頻度を有するヌクレオチド遺伝子座は、５０％の場合にメチル化され、５０％の場合にメチル化されていない。このような頻度を使用して、例えば、ヌクレオチド遺伝子座または核酸領域が個体集団または核酸集合体中でメチル化される程度を説明することが可能である。したがって、核酸分子の第１の集団またはプール中のメチル化が、核酸分子の第２の集団またはプール中のメチル化と異なる場合、第１の集団またはプールのメチル化状態の頻度は、第２の集団またはプールのメチル化状態の頻度とは異なる。また、このような頻度を使用して、例えば、ヌクレオチド遺伝子座または核酸領域が単一の個体中でメチル化される程度を説明することができる。例えば、そのような頻度を使用して、組織試料由来の細胞群がヌクレオチド遺伝子座または核酸領域でメチル化されるか、またはメチル化されない程度を説明することができる。

【0109】

本明細書で使用される場合、「全ゲノムｃｆＤＮＡメチル化シグネチャ」という用語は、（アレイベースの技術と同様に）狭いいくつかの候補部位ではなく、ゲノムの幅全体にわたって候補メチル化マーカーを調べる任意の方法によって得られたシグネチャを指す。

【0110】

本明細書で使用される場合、「コピー数変動」（ＣＮＶと省略される）という用語は、ＤＮＡの特定のセグメントのコピー数が異なる個体のゲノム間で変化する状況を指す。

【0111】

本明細書で使用される場合、「一意のマッピングレート」という用語は、配列決定データの検証に使用される基準を指し、具体的には、参照ゲノム内の正確な１つの位置にマッピングされる配列決定リードの割合を指す。いくつかの実施形態において、一意のマッピングレートは、配列決定されたリードの総数と比較して、定義されたパラメータ（例えば、５００、１２０、１０００、２０）を有するリードの割合（例えば、ｂｗａアラインを使用してＭＡＰＱ≧１）として計算され得る。

【0112】

本明細書で使用される場合、「一意の重複除去されたマッピングレート」という用語は、参照ゲノム内の正確に１つの位置にマッピングされる（重複を除去した後の）重複除去された配列決定リードの割合を指す。いくつかの好ましい実施形態において、一意の重複除去されたマッピングレートは、配列決定されたリードの総数と比較して、（例えば、ＭａｒｋＤｕｐｌｉｃａｔｅｓ（Ｐｉｃａｒｄ）を用いて）ＰＣＲの重複を除去した後に適切にマッピングされたリードの割合を計算することによって決定され得る。

【0113】

本明細書で使用される場合、「組織デコンボリューション」という用語は、試料中の配列決定されたｃｆＤＮＡを、その起源の組織に選別し、組織からの相対的な寄与を決定することを指す。いくつかの好ましい実施形態において、ｃｆＤＮＡメチル化は、参照アトラス中の（例えば、ＤＭＲでの）メチル化値と比較される。これらの方法は、好ましくは、ｃｆＤＮＡの起源の割合が回帰係数である回帰方法を使用する。

【0114】

本明細書で使用される場合、「患者」または「対象」という用語は、本技術によって提供される様々な試験に対象とする生物を指す。「対象」という用語は、動物、好ましくはヒトを含む哺乳動物を含む。好ましい実施形態において、対象は霊長類である。より一層好ましい実施形態において、対象はヒトである。更に診断方法に関して、好ましい対象は、脊椎動物対象である。好ましい脊椎動物は、温血動物であり、好ましい温血脊椎動物は、哺乳動物である。好ましい哺乳動物は、最も好ましくはヒトである。本明細書で使用される場合、「対象」という用語は、ヒト及び動物の両方の対象を含む。したがって、獣医学的な治療的使用が本明細書で提供される。このようなものとして、本発明の科学技術は、ヒトなどの哺乳動物、及びアムールトラなどの絶滅の危機に瀕しているために重要な、ヒトによる消費のために農場で育てられる動物などの経済的に重要なこれらの哺乳動物、及び／またはペットとして、または動物園に飼われている動物など、ヒトにとって社会的に重要な動物の診断のために提供される。そのような動物の例として、限定されないが、ネコ及びイヌなどの肉食動物；ブタ（ｐｉｇ）、ブタ（ｈｏｇ）、及びイノシシを含む、ブタ（ｓｗｉｎｅ）；ウシ（ｃａｔｔｌｅ）、ウシ（ｏｘｅｎ）、ヒツジ、キリン、シカ、ヤギ、バイソン、及びラクダなどの反芻動物及び／または有蹄類；鰭脚類；及びウマが挙げられる。
２．ＴＥＴ支援ピリジンボラン配列決定（ＴＡＰＳ）
本開示の実施形態は、循環無細胞ＤＮＡに使用するためのものを含む、配列内の５－メチルシトシン（５ｍＣ）及び５－ヒドロキシメチルシトシン（５ｈｍＣ）を検出するための亜硫酸水素塩を含まない塩基解像度方法（ＴＡＰＳ）を提供する。国際ＰＣＴ出願第ＰＣＴ／ＵＳ２０１９／０１２６２７号（その各々はその全体が参照により本明細書に組み込まれる、２０１９年１月８日に出願された、２０１８年１月８日に出願された米国仮特許出願第６２／６１４，７９８号、２０１８年４月２０日に出願された同第６２／６６０，５２３号、及び２０１８年１１月２６日に出願された同第６２／７７１，４０９号に対する優先権を主張する）に開示されるように、ＴＡＰＳは、非修飾シトシンに影響を与えることなく、５ｍＣ及び５ｈｍＣを直接、塩基解像度で定量的に検出するための穏和な酵素反応及び化学反応の使用を含む。本開示はまた、非修飾シトシンに影響を与えることなく、塩基解像度で５－ホルミルシトシン（５ｆＣ）及び５－カルボキシルシトシン（５ｃａＣ）を検出するための方法を提供する。したがって、本明細書で提供される方法は、５ｍＣ、５ｈｍＣ、５ｆＣ、及び５ｃａＣのマッピングを提供し、亜硫酸水素塩配列決定などの従来の方法の欠点を克服する。

【0115】

５ｍＣを特定するための方法。いくつかの実施形態において、本開示の方法は、ＤＮＡ試料（標的ＤＮＡまたは全ゲノム）中の５ｍＣを特定することと、ＤＮＡ中で修飾が特定された各位置での５ｍＣ修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、各移行位置におけるＴの割合は、ＤＮＡ中の各位置における５ｍＣの定量的レベルを提供する。これらの実施形態によれば、５ｍＣを特定するための方法は、保護基の使用を含み得る。他の実施形態において、５ｍＣを特定するための方法は、保護基の使用を必要としない（例えば、以下に更に記載されるｃｆＴＡＰＳ）。

【0116】

保護基を使用して、５ｈｍＣを含まずにＤＮＡ（例えば、ｃｆＤＮＡ）中の５ｍＣを特定する場合、試料中の５ｈｍＣは、５ｃａＣ及び／または５ｆＣへの変換を受けないように保護される。いくつかの実施形態において、試料ＤＮＡ中の５ｈｍＣは、保護基を５ｈｍＣに追加することによって、その後のステップに対して非反応性になる。一実施形態において、保護基は、修飾糖、例えば、グルコースまたは６－アジド－グルコース（６－アジド－６－デオキシ－Ｄ－グルコース）を含む、糖である。糖保護基は、ＤＮＡ試料を、１つ以上のグルコシルトランスフェラーゼ酵素の存在下でウリジン二リン酸（ＵＤＰ）糖と接触させることによって、５ｈｍＣのヒドロキシメチル基に付加され得る。いくつかの実施形態において、グルコシルトランスフェラーゼは、Ｔ４バクテリオファージβ－グルコシルトランスフェラーゼ（βＧＴ）、Ｔ４バクテリオファージα－グルコシルトランスフェラーゼ（αＧＴ）、及びそれらの誘導体及び類似体である。βＧＴは、ベータ－Ｄ－グルコシル（グルコース）残基がＵＤＰ－グルコースから核酸中の５－ヒドロキシメチルシトシン残基に移される化学反応を触媒する酵素である。

【0117】

５ｈｍＣを特定するための方法。いくつかの実施形態において、本開示の方法は、ＤＮＡ試料（標的ＤＮＡまたは全ゲノム）中の５ｍＣまたは５ｈｍＣを特定することを含む。いくつかの実施形態において、本方法は、ＤＮＡ中で修飾が特定された各位置での５ｍＣまたは５ｈｍＣ修飾の頻度の定量的尺度を提供する。いくつかの実施形態において、各移行位置におけるＴの割合は、ＤＮＡ中の各位置における５ｍＣまたは５ｈｍＣの定量的レベルを提供する。これらの実施形態によれば、５ｍＣまたは５ｈｍＣを特定するための方法は、５ｍＣ及び５ｈｍＣの位置を提供するが、２つのシトシン修飾を区別しない。むしろ、５ｍＣ及び５ｈｍＣの両方がＤＨＵに変換される。ＤＨＵの存在は、直接検出することができ、または修飾ＤＮＡは、ＤＨＵがＴに変換される既知の方法によって複製することができる。いくつかの実施形態において、５ｈｍＣを特定するための方法は、保護基の使用を含む。他の実施形態において、５ｈｍＣを特定するための方法は、保護基の使用を必要としない（例えば、以下に更に記載されるｃｆＴＡＰＳ）。

【0118】

５ｍＣを特定する方法及び／または５ｈｍＣを特定する方法。本開示は、第１のＤＮＡ試料に対して５ｍＣを特定するための方法を実施し、第２のＤＮＡ試料に対して５ｍＣまたは５ｈｍＣを特定するための方法を実施することによって、ＤＮＡ（例えば、ｃｆＤＮＡ）において５ｍＣを特定し、５ｈｍＣを特定する方法を提供する。いくつかの実施形態において、第１及び第２のＤＮＡ試料は、同じＤＮＡ試料に由来する。例えば、第１の試料及び第２の試料は、分析されるＤＮＡ（例えば、ｃｆＤＮＡ）を含む試料から採取された別個のアリコートであり得る。

【0119】

５ｍＣ及び５ｈｍＣ（保護されていない）は、ＤＨＵへの変換前に５ｆＣ及び５ｃａＣに変換されるため、ＤＮＡ試料中に存在する５ｆＣ及び５ｃａＣは、５ｍＣ及び／または５ｈｍＣとして検出される。しかしながら、通常の条件下でゲノムＤＮＡ中の５ｆＣ及び５ｃａＣがきわめて低いレベルであることを考慮すると、ＤＮＡ試料中のメチル化及びヒドロキシメチル化を分析する場合、このことは多くは許容されるであろう。５ｆＣ及び５ｃａＣシグナルは、例えば、それぞれヒドロキシルアミンコンジュゲーション及びＥＤＣカップリングによって、５ｆＣ及び５ｃａＣをＤＨＵへの変換から保護することによって除外され得る。これらの実施形態によれば、本方法は、５ｍＣの位置及び割合を、５ｍＣまたは５ｈｍＣ（合わせたもの）の位置及び割合と比較することによって、ＤＮＡ中の５ｈｍＣの位置及び割合を特定する。あるいは、ＤＮＡ中の５ｈｍＣ修飾の位置及び頻度を直接測定することができる。

【0120】

いくつかの実施形態において、５ｈｍＣを５ｆＣへと変換するステップは、ＤＮＡを、例えば、過ルテニウム酸カリウム（ＫＲｕＯ_４）と接触させることによって（参照によって本明細書に組み込まれるＳｃｉｅｎｃｅ．２０１２，３３，９３４－９３７及びＷＯ２０１３０１７８５３に記載されるように）、またはＣｕ（ＩＩ）／ＴＥＭＰＯ（過塩素酸銅（ＩＩ）及び２，２，６，６－テトラメチルピペリジン－１－オキシル（ＴＥＭＰＯ））と接触させることによって（参照によって本明細書に組み込まれるＣｈｅｍ．Ｃｏｍｍｕｎ．，２０１７，５３，５７５６－５７５９及びＷＯ２０１７０３９００２に記載されるように）、５ｈｍＣを５ｆＣへと酸化することを含む。次いで、ＤＮＡ試料中の５ｆＣは、本明細書に開示される方法によって（例えば、ボラン反応によって）ＤＨＵに変換される。

【0121】

いくつかの実施形態において、５ｆＣ及び／または５ｃａＣを特定することは、５ｆＣ及び／または５ｃａＣの位置を提供するが、これら２つのシトシン修飾を区別しない。むしろ、５ｆＣ及び５ｃａＣの両方がＤＨＵに変換され、これが本明細書に記載の方法によって検出される。

【0122】

５ｃａＣを特定するための方法。いくつかの実施形態において、本方法は、ＤＮＡ試料（標的ＤＮＡまたは全ゲノム）中の５ｃａＣを特定することを含み、ＤＮＡ中で修飾が特定された各位置での５ｃａＣ修飾の頻度の定量的尺度を提供する。いくつかの実施形態において、各移行位置におけるＴの割合は、ＤＮＡ中の各位置における５ｃａＣの定量的レベルを提供する。これらの実施形態によれば、５ｃａＣを特定するための方法は、保護基の使用を含み得る。他の実施形態において、５ｃａＣを特定するための方法は、保護基の使用を必要としない（例えば、以下に更に記載されるｃｆＴＡＰＳ）。

【0123】

いくつかの実施形態において、５ｆＣが保護される（及び５ｍＣ及び５ｈｍＣがＤＨＵに変換されない）場合、ＤＮＡ中の５ｃａＣの特定を行うことができる。いくつかの実施形態において、ＤＮＡ試料中の５ｆＣに保護基を付加することは、ＤＮＡを、例えば、ヒドロキシルアミン誘導体、ヒドラジン誘導体、及びヒラジド誘導体を含むアルデヒド反応性化合物と接触させることを含む。ヒドロキシルアミン誘導体としては、アシドロキシルアミン（ａｓｈｙｄｒｏｘｙｌａｍｉｎｅ）、塩酸ヒドロキシルアミン、硫酸ヒドロキシルアンモニウム酸、リン酸ヒドロキシルアミン、Ｏ－メチルヒドロキシルアミン、Ｏ－ヘキシルヒドロキシルアミン、Ｏ－ペンチルヒドロキシルアミン、Ｏ－ベンジルヒドロキシルアミンが挙げられ、特に、Ｏ－エチルヒドロキシルアミン（ＥｔＯＮＨ２）、Ｏ－アルキル化またはＯ－アリール化ヒドロキシルアミン、それらの酸または塩が挙げられる。ヒドラジン誘導体としては、Ｎ－アルキルヒドラジン、Ｎ－アリールヒドラジン、Ｎ－ベンジルヒドラジン、Ｎ，Ｎ－ジアルキルヒドラジン、Ｎ，Ｎ－ジアリールヒドラジン、Ｎ，Ｎ－ジベンジルヒドラジン、Ｎ，Ｎ－アルキルベンジルヒドラジン、Ｎ，Ｎ－アリールベンジルヒドラジン、及びＮ，Ｎ－アルキルアリールヒドラジンが挙げられる。ヒドラジド誘導体としては、－トルエンスルホニルヒドラジド、Ｎ－アシルヒドラジド、Ｎ，Ｎ－アルキルアシルヒドラジド、Ｎ，Ｎ－ベンジルアシルヒドラジド、Ｎ，Ｎ－アリールアシルヒドラジド、Ｎ－スルホニルヒドラジド、Ｎ，Ｎ－アルキルスルホニルヒドラジド、Ｎ，Ｎ－ベンジルスルホニルヒドラジド、及びＮ，Ｎ－アリールスルホニルヒドラジドが挙げられる。

【0124】

５ｆＣを特定するための方法。いくつかの実施形態において、本方法は、ＤＮＡ試料（標的ＤＮＡまたは全ゲノム）中の５ｆＣを特定することを含み、ＤＮＡ中で修飾が特定された各位置での５ｆＣ修飾の頻度の定量的尺度を提供する。いくつかの実施形態において、各移行位置におけるＴの割合は、ＤＮＡ中の各位置における５ｆＣの定量的レベルを提供する。これらの実施形態によれば、５ｆＣを特定するための方法は、保護基の使用を含み得る。他の実施形態において、５ｆＣを特定するための方法は、保護基の使用を必要としない（例えば、以下に更に記載されるｃｆＴＡＰＳ）。

【0125】

いくつかの実施形態において、ＤＮＡ試料中の５ｃａＣにブロック基を付加することは、（ｉ）ＤＮＡ試料を、カップリング剤、例えば、カルボン酸誘導体化試薬、例えば、ｌ－エチル－３－（３－ジメチルアミノプロピル）カルボジイミド（ＥＤＣ）またはＮ，Ｎ’－ジシクロヘキシルカルボジイミド（ＤＣＣ）などのカルボジイミド誘導体と接触させることによって、及び（ｉｉ）ＤＮＡ試料を、アミン、ヒドラジンまたはヒドロキシルアミン化合物と接触させることによって、達成することができる。したがって、例えば、５ｃａＣは、ＤＮＡ試料を、ＥＤＣで、次いでベンジルアミン、エチルアミン、または別のアミンで処理して、５ｃａＣをＤＨＵへの変換から保護するアミドを形成することによって保護することができる（例えば、ｐｉｃ－ＢＨ_３による）。
３．ｃｆＤＮＡのためのＴＡＰＳ（ｃｆＴＡＰＳ）
本開示は、高品質及び高深度の全ゲノム無細胞メチロームを提供するためのｃｆＤＮＡに最適化されたＴＡＰＳ（ｃｆＴＡＰＳ）を提供する。以下に更に記載されるように、本開示の一実施形態において、ｃｆＴＡＰＳは、肝細胞癌（ＨＣＣ）または膵管腺癌（ＰＤＡＣ）を有する患者、及び非がん対照からの８５個のｃｆＤＮＡ試料に適用された。わずか１０ｎｇのｃｆＤＮＡ（１～３ｍＬの血漿）から、これまでで最も包括的なｃｆＤＮＡメチロームが生成された。本明細書で提供される結果は、ｃｆＴＡＰＳが、ＤＮＡメチル化、起源の組織、及びＤＮＡ断片化を含むｃｆＤＮＡ特性に関するマルチモーダル情報を提供することを示した。これらのエピジェネティックな特徴及び遺伝的特徴の統合された分析は、早期ＨＣＣ及びＰＤＡＣの正確な特定を可能にする。本開示の方法は、亜硫酸水素塩配列決定などの方法に関連する核酸の実質的な分解を回避する穏和な酵素反応及び化学反応を利用するため、本開示の方法は、例えば、循環無細胞ＤＮＡ及び単一細胞分析などの低いインプットの試料の分析に有用である。

【0126】

これらの実施形態によれば、本開示は、メチル化シグネチャを得る方法を提供する。いくつかの実施形態において、本方法は、試料から無細胞ＤＮＡ（ｃｆＤＮＡ）を単離することと、ｃｆＤＮＡを含む配列決定ライブラリを調製することと、配列決定ライブラリに対してＴＥＴ支援ピリジンボラン配列決定（ＴＡＰＳ）を実施して、ｃｆＤＮＡのメチル化シグネチャを得ることと、を含む。いくつかの実施形態において、メチル化シグネチャは、全ゲノムメチル化シグネチャである。

【0127】

いくつかの実施形態において、配列決定ライブラリを調製することは、単離されたｃｆＤＮＡに配列決定アダプターをライゲーションして、配列決定反応の実施を容易にすることを含む。いくつかの実施形態において、キャリア核酸またはキャリア核酸（例えば、ＤＮＡ）の混合物は、ＴＡＰＳを実施する前に、配列決定ライブラリに追加される。キャリア核酸は、試料からのｃｆＤＮＡ回収の１つ以上の態様を強化する任意の特異的または非特異的ＤＮＡ分子（またはその核酸誘導体）であってもよい。いくつかの実施形態において、キャリアＤＮＡは、特定の配列を有するＤＮＡ分子を含み、他の実施形態において、キャリアＤＮＡは、異なる配列を有するＤＮＡ分子の混合物を含む。いくつかの実施形態において、キャリアＤＮＡは、その任意の断片及び／または誘導体を含む、以下の配列を有するＤＮＡを含み得る。ＡＧＧＣＡＡＣＴＴＴＡＴＧＣＣＣＡＴＧＣＡＡＣＡＧＡＡＡＣＴＡＴＡＡＡＡＡＡＴＡＣＡＧＡＧＡＡＴＧＡＡＡＡＧＡＡＡＣＡＧＡＴＡＧＡＴＴＴＴＴＴＡＧＴＴＣＴＴＴＡＧＧＣＣＣＧＴＡＧＴＣＴＧＣＡＡＡＴＣＣＴＴＴＴＡＴＧＡＴＴＴＴＣＴＡＴＣＡＡＡＣＡＡＡＡＧＡＧＧＡＡＡＡＴＡＧＡＣＣＡＧＴＴＧＣＡＡＴＣＣＡＡＡＣＧＡＧＡＧＴＣＴＡＡＴＡＧＡＡＴＧＡＧＧＴＣＧＡＡＡＡＧＴＡＡＡＴＣＧＣＧＣＧＧＧＴＴＴＧＴＴＡＣＴＧＡＴＡＡＡＧＣＡＧＧＣＡＡＧＡＣＣＴＡＡＡＡＴＧＴＧＴＡＡＡＧＧＧＣＡＡＡＧＴＧＴＡＴＡＣＴＴＴＧＧＣＧＴＣＡＣＣＣＣＴＴＡＣＡＴＡＴＴＴＴＡＧＧＴＣＴＴＴＴＴＴＴＡＴＴＧＴＧＣＧＴＡＡＣＴＡＡＣＴＴＧＣＣＡＴＣＴＴＣＡＡＡＣＡＧＧＡＧＧＧＣＴＧＧＡＡＧＡＡＧＣＡＧＡＣＣＧＣＴＡＡＣＡＣＡＧＴＡＣＡＴＡＡＡＡＡＡＧＧＡＧＡＣＡＴＧＡＡＣＧＡＴＧＡＡＣＡＴＣＡＡＡＡＡＧＴＴＴＧＣＡＡＡＡＣＡＡＧＣＡＡＣＡＧＴＡＴＴＡＡＣＣＴＴＴＡＣＴＡＣＣＧＣＡＣＴＧＣＴＧＧＣＡＧＧＡＧＧＣＧＣＡＡＣＴＣＡＡＧＣＧＴＴＴＧＣＧＡＡＡＧＡＡＡＣＧＡＡＣＣＡＡＡＡＧＣＣＡＴＡＴＡＡＧＧＡＡＡＣＡＴＡＣＧＧＣＡＴＴＴＣＣＣＡＴＡＴＴＡＣＡＣＧＣＣＡＴＧＡＴＡＴＧＣＴＧＣＡＡＡＴＣＣＣＴＧＡＡＣＡＧＣＡＡＡＡＡＡＡＴＧＡＡＡＡＡＴＡＴＡＡＡＧＴＴＣＣＴＧＡＧＴＴＣＧＡＴＴＣＧＴＣＣＡＣＡＡＴＴＡＡＡＡＡＴＡＴＣＴＣＴＴＣＴＧＣＡＡＡＡＧＧＣＣＴＧＧＡＣＧＴＴＴＧＧＧＡＣＡＧＣＴＧＧＣＣＡＴＴＡＣＡＡＡＡＣＡＣＴＧＡＣＧＧＣＡＣＴＧＴＣＧＣＡＡＡＣＴＡＴＣＡＣＧＧＣＴＡＣＣＡＣＡＴＣＧＴＣＴＴＴＧＣＡＴＴＡＧＣＣＧＧＡＧＡＴＣＣＴＡＡＡＡＡＴＧＣＧＧＡＴＧＡＣＡＣＡＴＣＧＡＴＴＴＡＣＡＴＧＴＴＣＴＡＴＣＡＡＡＡＡＧＴＣＧＧＣＧＡＡＡＣＴＴＣＴＡＴＴＧＡＣＡＧＣＴＧＧＡＡＡＡＡＣＧＣＴＧＧＣＣＧＣＧＴＣＴＴＴＡＡＡＧＡＣＡＧＣＧＡＣＡＡＡＴＴＣＧＡＴＧＣＡＡＡＴＧＡＴＴＣＴＡＴＣＣＴＡＡＡＡＧＡＣＣＡＡＡＣＡＣＡＡＧＡＡＴＧＧＴＣＡＧＧＴＴＣＡＧＣＣＡＣＡＴＴＴＡＣＡＴＣＴＧＡＣＧＧＡＡＡＡＡＴＣＣＧＴＴＴＡＴＴＣＴＡＣＡＣＴＧＡＴＴＴＣＴＣＣＧＧＴＡＡＡＣＡＴＴＡＣＧＧＣＡＡＡＣＡＡＡＣＡＣＴＧＡＣＡＡＣＴＧＣＡＣＡＡＧＴＴＡＡＣＧＴＡＴＣＡＧＣＡＴＣＡＧＡＣＡＧＣＴＣＴＴＴＧＡＡＣＡＴＣＡＡＣＧＧＴＧＴＡＧＡＧＧＡＴＴＡＴＡＡＡＴＣＡＡＴＣＴＴＴＧＡＣＧＧＴＧＡＣＧＧＡＡＡＡＡＣＧＴＡＴＣＡＡＡＡＴＧＴＡＣＡＧＣＡＧＴＴＣＡＴＣＧＡＴＧＡＡＧＧＣＡＡＣＴＡＣＡＧＣＴＣＡＧＧＣＧＡＣＡＡＣＣＡＴＡＣＧＣＴＧＡＧＡＧＡＴＣＣＴＣＡＣＴＡＣＧＴＡＧＡＡＧＡＴＡＡＡＧＧＣＣＡＣＡＡＡＴＡＣＴＴＡＧＴＡＴＴＴＧＡＡＧＣＡＡＡＣＡＣＴＧＧＡＡＣＴＧＡＡＧＡＴＧＧＣＴＡＣＣＡＡＧＧＣＧＡＡＧＡＡＴＣＴＴＴＡＴＴＴＡＡＣＡＡＡＧＣＡＴＡＣＴＡＴＧＧＣＡＡＡＡＧＣＡＣＡＴＣＡＴＴＣＴＴＣＣＧＴＣＡＡＧＡＡＡＧＴＣＡＡＡＡＡＣＴＴＣＴＧＣＡＡＡＧＣＧＡＴＡＡＡＡＡＡＣＧＣＡＣＧＧＣＴＧＡＧＴＴＡＧＣＡＡＡＣＧＧＣＧＣＴＣＴＣＧＧＴＡＴＧＡＴＴＧＡＧＣＴＡＡＡＣＧＡＴＧＡＴＴＡＣＡＣＡＣＴＧＡＡＡＡＡＡＧＴＧＡＴＧＡＡＡＣＣＧＣＴＧＡＴＴＧＣＡＴＣＴＡＡＣＡＣＡＧＴＡＡＣＡＧＡＴＧＡＡＡＴＴＧＡＡＣＧＣＧＣＧＡＡＣＧＴＣＴＴＴＡＡＡＡＴＧＡＡＣＧＧＣＡＡＡＴＧＧＴＡＣＣＴＧＴＴＣＡＣＴＧＡＣＴＣＣＣＧＣＧＧＡＴＣＡＡＡＡＡＴＧＡＣＧＡＴＴＧＡＣＧＧＣＡＴＴＡＣＧＴＣＴＡＡＣＧＡＴＡＴＴＴＡＣＡＴＧＣＴＴＧＧＴＴＡＴＧＴＴＴＣＴＡＡＴＴＣＴＴＴＡＡＣＴＧＧＣＣＣＡＴＡＣＡＡＧＣＣＧＣＴＧＡＡＣＡＡＡＡＣＴＧＧＣＣＴＴＧＴＧＴＴＡＡＡＡＡＴＧＧＡＴＣＴＴＧＡＴＣＣＴＡＡＣＧＡＴＧＴＡＡＣＣＴＴＴＡＣＴＴＡＣＴＣＡＣＡＣＴＴＣＧＣＴＧＴＡＣＣＴＣＡＡＧＣＧＡＡＡＧＧＡＡＡＣＡＡＴＧＴＣＧＴＧＡＴＴＡＣＡＡＧＣＴＡＴＡＴＧＡＣＡＡＡＣＡＧＡＧＧＡＴＴＣＴＡＣＧＣＡＧＡＣＡＡＡＣＡＡＴＣＡＡＣＧＴＴＴＧＣＧＣＣＴＡＧＣＴＴＣＣＴＧＣＴＧＡＡＣＡＴＣＡＡＡＧＧＣＡＡＧＡＡＡＡＣＡＴＣＴＧＴＴＧＴＣＡＡＡＧＡＣＡＧＣＡＴＣＣＴＴＧＡＡＣＡＡＧＧＡＣＡＡＴＴＡＡＣＡＧＴＴＡＡＣＡＡＡＴＡＡＡＡＡＣＧＣＡＡＡＡＧＡＡＡＡＴＧＣＣＧＡＴＡＴＣＣＴＡＴＴＧＧＣＡＴＴＧＡＣＧＧＴＣＴＣＣＡＧＴＡＡＡＧＧＴＧＧＡＴＡＣＧＧＡＴＣＣＧＡＡＴＴＣＧＡＧＣＴＣＣＧＴＣＧＡＣＡＡＧＣＴＴＧＣＧＧＣＣＧＣＡＣＴＣＧＡＧＣＡＣＣＡＣＣＡＣＣＡＣＣＡＣＣＡＣＴＧＡＧＡＴＣＣＧＧＣＴＧＣＴＡＡＣＡＡＡＧＣＣＣＧＡＡＡＧＧＡＡＧＣＴＧＡＧＴＴＧＧＣＴＧＣＴＧＣＣＡＣＣＧＣＴＧＡＧＣＡＡＴＡＡＣＴＡＧＣＡＴＡＡＣＣＣＣＴＴＧＧ（配列番号１）
いくつかの実施形態において、キャリアＤＮＡの使用は、より高いライブラリ収率をもたらす。本開示に基づいて当業者によって認識されるように、キャリアＤＮＡは、限定されないが、１つ以上のプライマーを使用したベクターまたはプラスミド鋳型からのＰＣＲ増幅を含む、当業者に既知の任意の手段によって得ることができる。いくつかの実施形態において、少なくとも１ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも１０ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも２５ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも５０ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも１００ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも１５０ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも２００ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも２５０ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、少なくとも５００ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、約１ｎｇ～約５００ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、約１ｎｇ～約５００ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、約５０ｎｇ～約２５０ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、約７５ｎｇ～約１５０ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、約５０ｎｇ～約１５０ｎｇのキャリアＤＮＡを使用することができる。いくつかの実施形態において、約７５ｎｇ～約１２５ｎｇのキャリアＤＮＡを使用することができる。

【0128】

いくつかの実施形態において、また、本明細書に記載されるように、本方法は、ｃｆＤＮＡ全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む。いくつかの実施形態において、メチル化バイオマーカーは、差次メチル化領域（ＤＭＲ）を含む。いくつかの実施形態において、本方法は、参照ＤＭＲと比較して、ＤＭＲに基づいて試料を分類することを更に含む。いくつかの実施形態において、参照ＤＭＲは、非がん性対照、またはがん性対照に対応する。

【0129】

いくつかの実施形態において、また、本明細書に記載されるように、本方法は、ｃｆＤＮＡ全ゲノムメチル化シグネチャから少なくとも１つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーに対応する起源の組織を決定することと、を更に含む。いくつかの実施形態において、本方法は、起源の組織のバイオマーカーに基づいて試料を分類することを更に含む。

【0130】

いくつかの実施形態において、また、本明細書に記載されるように、本方法は、ＤＮＡ断片化プロファイルを特定することと、断片化プロファイルが、がんの指標であるかどうかを決定することと、を更に含む。これらの実施形態によれば、ＤＮＡ断片化プロファイルは、ｃｆＴＡＰＳ全ゲノム配列決定データ（例えば、リード対のアラインメント位置）から決定することができる。いくつかの好ましい実施形態において、ｃｆＴＡＰＳからの配列決定されたリードは、まず、参照ゲノムにアラインメントされる。次いで、ｃｆＤＮＡ断片の長さは、配列決定データから生成されたアラインメントファイルから抽出される。ｃｆＤＮＡ断片の１０ｂｐ間隔における割合は、無細胞ＤＮＡの断片化プロファイルとして使用される。

【0131】

いくつかの実施形態において、本方法は、ｃｆＤＮＡからの少なくとも１つの配列バリアントを特定することと、配列バリアントが、がんの指標であるかどうかを決定することと、を更に含む。例えば、いくつかの実施形態において、ｃｆＴＡＰＳはまた、ＣからＴへの遺伝子バリアントまたは一塩基多型（ＳＮＰ）からメチル化を区別することができ、したがって、これを使用して遺伝子バリアントを検出することができる。いくつかの実施形態において、メチル化及びＣからＴへのＳＮＰは、ｃｆＴＡＰＳにおいて異なるパターンをもたらし得る。例えば、メチル化によって、元の上部鎖／元の下部鎖内にＴ／Ｇリードをもたらすことができ、これらに対して相補的な鎖内にＡ／Ｃリードをもたらすことができる。いくつかの実施形態において、ＣからＴへのＳＮＰは、元の上部鎖／元の下部鎖及びこれらに対して相補的な鎖内にＴ／Ａリードをもたらすことができる。これらの異なるパターンを図１２に示す。これにより、１つの実験及び配列決定試行において、メチル化情報及び遺伝子バリアント、したがって変異の両方を提供することにおけるｃｆＴＡＰＳの有用性を更に増加させる。本明細書に開示されるｃｆＴＡＰＳ方法のこの能力は、標準的な全ゲノム配列決定（ＷＧＳ）を実施する必要性を除外することによって、ゲノム分析とエピジェネティックな分析との統合、及び配列決定費用の実質的な低減を提供する。

【0132】

上の実施形態によれば、本開示の方法は、対象においてがんを診断／検出するための単一の実験において、メチル化シグネチャ、メチル化バイオマーカー、ＤＮＡ断片プロファイル、ＤＮＡ配列情報（例えば、バリアント）、及び起源の組織の情報に関する情報を生成するためのｃｆＴＡＰＳの使用を含む。本開示に基づいて当業者には理解されるように、本明細書に開示されるｃｆＴＡＰＳを使用して、メチル化シグネチャ、メチル化バイオマーカー、ＤＮＡ断片プロファイル、ＤＮＡ配列情報（例えば、バリアント）、及び起源の組織の情報の任意の組み合わせを生成し、対象においてがんを診断／検出することができる。いくつかの実施形態において、メチル化シグネチャを得ることができ、メチル化バイオマーカー、ＤＮＡ断片プロファイル、ＤＮＡ配列情報（例えば、バリアント）、及び起源の組織の情報のうちの１つ以上も得ることができ、これを使用して、対象においてがんを診断／検出することができる。いくつかの実施形態において、バイオマーカーのメチル化ステータスを得ることができ、メチル化シグネチャ、ＤＮＡ断片プロファイル、ＤＮＡ配列情報（例えば、バリアント）、及び起源の組織の情報のうちの１つ以上も得ることができ、これを使用して、対象においてがんを診断／検出することができる。いくつかの実施形態において、ＤＮＡ断片プロファイルを得ることができ、メチル化シグネチャ、メチル化バイオマーカー、ＤＮＡ配列情報（例えば、バリアント）、及び起源の組織の情報のうちの１つ以上も得ることができ、これを使用して、対象においてがんを診断／検出することができる。いくつかの実施形態において、ＤＮＡ配列バリアントを特定することができ、メチル化シグネチャ、メチル化バイオマーカー、ＤＮＡ断片プロファイル、及び起源の組織の情報のうちの１つ以上も得ることができ、これを使用して、対象においてがんを診断／検出することができる。いくつかの実施形態において、起源の組織の情報を得ることができ（例えば、全ゲノムｃｆＤＮＡメチル化シグネチャから）、メチル化シグネチャ、メチル化バイオマーカー、ＤＮＡ断片プロファイル、及びＤＮＡ配列情報（例えば、バリアント）のうちの１つ以上も得ることができ、これを使用して、対象においてがんを診断／検出することができる。

【0133】

したがって、いくつかの好ましい実施形態において、本発明は、患者試料中のｃｆＤＮＡを分析するマルチモーダル方法であって、患者試料からｃｆＤＮＡを単離することと、試料中の５ｍＣ及び／または５ｈｍＣ残基をＤＨＵ残基に変換して、修飾ｃｆＤＮＡ試料を提供することと、修飾ｃｆＤＮＡ試料を配列決定して、試料中のメチル化領域を特定することであって、非修飾参照ｃｆＤＮＡと比較して、修飾ｃｆＤＮＡ試料中のシトシン（Ｃ）からチミン（Ｔ）への移行、またはシトシン（Ｃ）からＤＨＵへの移行が、ｃｆＤＮＡ中の５ｍＣまたは５ｈｍＣのいずれかの位置を提供する、試料中のメチル化領域を特定することと、
ａ）修飾ｃｆＤＮＡ試料における１つ以上の標的のコピー数変動を決定すること、
ｂ）修飾ｃｆＤＮＡ試料における起源の組織または１つ以上の標的を決定すること、
ｃ）修飾ｃｆＤＮＡ試料の断片化プロファイルを決定すること、及び
ｄ）修飾ｃｆＤＮＡ試料において１つ以上の単一ヌクレオチド変異を特定すること、からなる群から選択される修飾ｃｆＤＮＡに対する１つ以上の追加の分析ステップを実施することと、を含む、マルチモーダル方法を提供する。

【0134】

いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップａである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップｂである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップｃである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップｄである。

【0135】

いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップａ及びｂである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップａ及びｃである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップａ及びｄである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップｂ及びｃである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップｂ及びｄである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップｃ及びｄである。

【0136】

いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップａ、ｂ、及びｃである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップａ、ｂ、及びｄである。いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップｂ、ｃ、及びｄである。

【0137】

いくつかの好ましい実施形態において、１つ以上の追加のステップは、ステップａ、ｂ、ｃ、及びｄの全てである。

【0138】

いくつかの実施形態において、修飾ｃｆＤＮＡ試料と比較される非修飾参照ｃｆＤＮＡは、例えば、公的に入手可能な参照ｃｆＤＮＡまたは患者からの非修飾対照試料を含む、任意の非修飾参照ｃｆＤＮＡを含み得る。

【0139】

いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｍＣ修飾を特定することと、５ｍＣ修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｈｍＣ修飾を特定することと、５ｈｍＣ修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｃａＣ修飾を特定することと、５ｃａＣ修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、配列決定ライブラリに対してＴＡＰＳを実施して、全ゲノムメチル化シグネチャを得ることは、ｃｆＤＮＡ中の５ｆＣ修飾を特定することと、５ｆＣ修飾の頻度の定量的尺度を提供することと、を含む。

【0140】

本開示に基づいて当業者によって認識されるように、本明細書に記載の方法（例えば、ｃｆＴＡＰＳ）を使用して、任意の種類のがんを診断／検出することができる。本開示の方法を使用して検出／診断することができるがんの種類としては、限定されないが、肺癌、黒色腫、結腸癌、結腸直腸癌、神経芽細胞腫、乳癌、前立腺癌、腎細胞癌、移行細胞癌、胆管癌、脳癌、非小細胞肺癌、膵臓癌、肝臓癌、胃癌、膀胱癌、食道癌、中皮腫、甲状腺癌、頭頚部癌、骨肉腫、肝細胞癌、原発不明の癌腫、卵巣癌、子宮内膜癌、神経膠芽細胞腫、ホジキンリンパ腫、及び非ホジキンリンパ腫が挙げられる。いくつかの実施形態において、本開示の方法によって検出／診断することができるがんまたはがんの転移形態の種類としては、限定されないが、癌腫、肉腫、リンパ腫、生殖細胞腫瘍、及び芽細胞腫が挙げられる。いくつかの実施形態において、がんは、浸潤性及び／または転移性がん（例えば、ステージＩＩのがん、ステージＩＩＩのがん、またはステージＩＶのがん）である。いくつかの実施形態において、がんは、早期がん（例えば、ステージ０のがん、ステージＩのがん）であり、及び／または浸潤性及び／または転移性がんではない。

【0141】

いくつかの実施形態において、本開示の方法（例えば、ｃｆＴＡＰＳ）を使用して、対象が、肝細胞癌（ＨＣＣ）または膵管腺癌（ＰＤＡＣ）を有するかどうかを決定することができる。いくつかの実施形態において、本方法は、対象が、早期肝細胞癌（ＨＣＣ）または早期膵管腺癌（ＰＤＡＣ）を有するかどうかを決定することを含む。

【0142】

これらの実施形態によれば、本開示は、非修飾シトシンに影響を及ぼすことなく、塩基解像度により定量的に核酸中の５ｍＣ、５ｈｍＣ、５ｃａＣ及び／または５ｆＣのうちの１つ以上の位置を特定するための方法を提供する。いくつかの実施形態において、核酸は、ＤＮＡである。いくつかの実施形態において、ＤＮＡは、ｃｆＤＮＡ（例えば、循環ｃｆＤＮＡ）である。いくつかの実施形態において、核酸は、ＲＮＡである。いくつかの実施形態において、核酸試料は、ＤＮＡである標的核酸またはＲＮＡである標的核酸を含む。いくつかの実施形態において、本方法は、全ゲノムに適用され、特定の標的核酸に限定されない。

【0143】

核酸は、シトシン修飾（すなわち、５ｍＣ、５ｈｍＣ、５ｆＣ、及び／または５ｃａＣ）を有する任意の核酸であり得る。核酸は、試料中の単一の核酸分子であり得るか、または試料中の核酸分子の集団全体（全ゲノムまたはそのサブセット）であり得る。核酸は、供給源（例えば、細胞、組織試料など）からの天然核酸であってもよく、または例えば、配列決定のためのアダプターによる断片化、修復、及びライゲーションによって、高スループットの配列決定に対応した形態に事前に変換されてもよい。したがって、本明細書に記載の方法を使用して、個々に（例えば、個々の標的の配列を決定することによって）、または群で（例えば、高スループットまたは次世代配列決定方法によって）分析することができる標的核酸配列のライブラリを生成し得るように、核酸は、複数の核酸配列を含み得る。

【0144】

核酸試料は、Ｍｏｎｅｒａ（細菌）、Ｐｒｏｔｉｓｔａ、Ｆｕｎｇｉ、Ｐｌａｎｔａｅ、及びＡｎｉｍａｌｉａＫｉｎｇｄｏｍｓからの生物から得ることができる。核酸試料は、患者もしくは対象から、環境試料から、または目的とする生物から得られてもよい。いくつかの実施形態において、試料は、がんを有するヒトまたはがんを有することが疑われるヒトを含むがこれらに限定されない、ヒト対象／患者から得られる。いくつかの実施形態において、試料は、がん性であるか、またはがん性であることが疑われる組織または細胞を含む、ヒトからの組織または細胞から得られる（例えば、生検から得られる）。いくつかの実施形態において、核酸試料は、細胞または細胞の集合体、体液、組織試料、臓器、及び小器官から抽出されるか、またはそれらに由来する。いくつかの実施形態において、核酸試料は、血液（血漿、血清、全血）、尿、糞便／糞便液、精液（男性の生殖液体）、膣分泌物、脳脊髄液（ＣＳＦ）、腹水、滑液、胸水（胸腔洗浄液）、心膜液、腹膜液、羊水、唾液、鼻液、耳液、胃液、母乳、及びｃｆＤＮＡを含む任意の他の体液、ならびに細胞培養上清を含むがこれらに限定されない体液から得られる。いくつかの実施形態において、試料は、がん性であるか、またはがん性であることが疑われる体液から得られる。本開示の方法は、亜硫酸水素塩配列決定などの方法に関連する核酸の実質的な分解を回避する穏和な酵素反応及び化学反応を利用するため、本開示の方法は、例えば、循環無細胞ＤＮＡ及び単一細胞分析などの低いインプットの試料の分析に有用である。

【0145】

いくつかの実施形態において、ＤＮＡ試料は、ピコグラム量のＤＮＡを含む。いくつかの実施形態において、ＤＮＡ試料は、約１ｐｇ～約９００ｐｇのＤＮＡ、約１ｐｇ～約５００ｐｇのＤＮＡ、約１ｐｇ～約１００ｐｇのＤＮＡ、約１ｐｇ～約５０ｐｇのＤＮＡ、または約１～約１０ｐｇのＤＮＡを含む。いくつかの実施形態において、ＤＮＡ試料は、約２００ｐｇ未満、約１００ｐｇ未満のＤＮＡ、約５０ｐｇ未満のＤＮＡ、約２０ｐｇ未満のＤＮＡ、約１５ｐｇ未満のＤＮＡ、約１０ｐｇ未満のＤＮＡ、または約５ｐｇ未満のＤＮＡを含む。

【0146】

いくつかの実施形態において、ＤＮＡ試料は、ナノグラム量のＤＮＡを含む。本開示の方法で使用するための試料ＤＮＡは、単一細胞由来のＤＮＡまたはバルクＤＮＡ試料を含むがこれらに限定されない、任意の量であり得る。いくつかの実施形態において、本方法は、約１～約５００ｎｇのＤＮＡ、約１～約２００ｎｇのＤＮＡ、約１～約１００ｎｇのＤＮＡ、約１～約５０ｎｇのＤＮＡ、約１～約１０ｎｇのＤＮＡ、約２～約５ｎｇのＤＮＡを含むＤＮＡ試料に対して実施することができる。いくつかの実施形態において、ＤＮＡ試料は、約１００ｎｇ未満のＤＮＡ、約５０ｎｇ未満のＤＮＡ、４０ｎｇ未満のＤＮＡ、３０ｎｇ未満のＤＮＡ、２０ｎｇ未満のＤＮＡ、１５ｎｇ未満のＤＮＡ、５ｎｇ未満のＤＮＡ、及び２ｎｇ未満のＤＮＡを含む。いくつかの実施形態において、ＤＮＡ試料は、マイクログラム量のＤＮＡを含む。

【0147】

本明細書に記載の方法で使用されるＤＮＡ試料は、例えば、体液、組織試料、臓器、小器官、細胞または細胞の集合を含む任意の供給源からのものであってもよい。いくつかの実施形態において、ＤＮＡ試料は、がんを有するヒトまたはがんを有することが疑われるヒトを含むがこれらに限定されない、ヒト対象／患者から得られる。いくつかの実施形態において、ＤＮＡ試料は、がん性であるか、またはがん性であることが疑われる組織または細胞を含む、ヒトからの組織または細胞から得られる（例えば、生検から得られる）。いくつかの実施形態において、ＤＮＡ試料は、細胞または細胞の集合体、体液、組織試料、臓器、及び小器官から抽出されるか、またはそれらに由来する。いくつかの実施形態において、ＤＮＡ試料は、血液（血漿、血清、全血）、尿、糞便／糞便液、精液（男性の生殖液体）、膣分泌物、脳脊髄液（ＣＳＦ）、腹水、滑液、胸水（胸腔洗浄液）、心膜液、腹膜液、羊水、唾液、鼻液、耳液、胃液、母乳、及びｃｆＤＮＡを含む任意の他の体液、ならびに細胞培養上清を含むがこれらに限定されない体液から得られる。いくつかの実施形態において、ＤＮＡ試料は、がん性であるか、またはがん性であることが疑われる体液から得られる。いくつかの実施形態において、ＤＮＡ試料は、血液中に見出されるＤＮＡであり、細胞内に存在しない、循環無細胞ＤＮＡ（無細胞ＤＮＡまたはｃｆＤＮＡ）である。本開示に基づいて当業者には理解されているように、ｃｆＤＮＡは、当該技術分野で既知の方法を使用して体液から単離され得る。市販のキットは、例えば、ＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄＫｉｔ（Ｑｉａｇｅｎ）を含め、ｃｆＤＮＡの単離のために利用可能である。ＤＮＡ試料は、抗体免疫沈降、クロマチン免疫沈降、制限酵素消化ベースの濃縮、ハイブリダイゼーションベースの濃縮、または化学標識ベースの濃縮を含むがこれらに限定されない濃縮ステップから得られ得る。

【0148】

ＤＮＡは、ＤＮＡ断片及び／またはゲノムＤＮＡを含むがこれらに限定されない、シトシン修飾（すなわち、５ｍＣ、５ｈｍＣ、５ｆＣ、及び／または５ｃａＣ）を有する任意のＤＮＡであり得る。ＤＮＡは、試料中の単一のＤＮＡ分子であってもよく、または試料中のＤＮＡ分子の集団全体（全ゲノムもしくはそのサブセット）であってもよい。ＤＮＡは、供給源からの天然ＤＮＡであってもよく、または例えば、配列決定のためのアダプターによる断片化、修復、及びライゲーションによって、高スループットの配列決定に対応した形態に事前に変換されてもよい。したがって、本明細書に記載の方法を使用して、個々に（例えば、個々の標的の配列を決定することによって）、または群で（例えば、高スループットまたは次世代配列決定方法によって）分析することができる標的ＤＮＡ配列のライブラリを生成し得るように、ＤＮＡは、複数のＤＮＡ配列を含み得る。

【0149】

これらの実施形態によれば、本開示の方法は、５ｍＣ及び５ｈｍＣ（または５ｈｍＣが保護されている場合は５ｍＣのみ）を５ｃａＣ及び／または５ｆＣに変換するステップを含む。いくつかの実施形態において、このステップは、ＤＮＡまたはＲＮＡ試料を、１０－１１トランスロケーション（ＴＥＴ）酵素と接触させることを含む。ＴＥＴ酵素は、５ｍＣでＣ５メチル基への酸素分子の移動を触媒し、５－ヒドロキシメチルシトシン（５ｈｍＣ）の形成をもたらす酵素のファミリーである。ＴＥＴは、５ｈｍＣの５ｆＣへの酸化及び５ｆＣの酸化を更に触媒して、５ｃａＣを形成する。本開示の方法で有用なＴＥＴ酵素としては、ヒトＴＥＴ１、ＴＥＴ２、及びＴＥＴ３；マウスＴＥＴ１、ＴＥＴ２、及びＴＥＴ３；ＮａｅｇｌｅｒｉａＴＥＴ（ＮｇＴＥＴ）；Ｃｏｐｒｉｎｏｐｓｉｓｃｉｎｅｒｅａ（ＣｃＴＥＴ）；マウスＴＥＴ１の触媒ドメイン（ｍＴＥＴ１ＣＤ）、ならびにそれらの誘導体または類似体のうちの１つ以上が挙げられる。いくつかの実施形態において、ＴＥＴ酵素は、ＮｇＴＥＴである。いくつかの実施形態において、ＴＥＴ酵素は、ヒトＴＥＴ１（ｈＴＥＴ１）である。いくつかの実施形態において、ＴＥＴ酵素は、ｍＴＥＴ１ＣＤである。

【0150】

本開示の方法はまた、核酸試料中の５ｃａＣ及び／または５ｆＣをＤＨＵに変換するステップを含み得る。いくつかの実施形態において、このステップは、ＤＮＡまたはＲＮＡ試料を、例えば、ピリジンボラン、２－ピコリンボラン（ｐｉｃ－ＢＨ_３）、ボラン、水素化ホウ素ナトリウム、シアノ水素化ホウ素ナトリウム、及びトリアセトキシ水素化ホウ素ナトリウムなどのボラン還元剤を含む還元剤と接触させることを含む。いくつかの実施形態において、還元剤は、ピリジンボラン及び／またはｐｉｃ－ＢＨ_３である。

【0151】

本開示の方法はまた、当該技術分野で既知の方法によって、修飾核酸のコピー数を増幅するステップを含み得る。修飾核酸がＤＮＡである場合、コピー数は、例えば、ＰＣＲ、クローニング、及びプライマー伸長によって増加させることができる。個々の標的ＤＮＡのコピー数は、特定の標的ＤＮＡ配列に特異的なプライマーを使用して、ＰＣＲによって増幅させることができる。あるいは、複数の異なる修飾された標的ＤＮＡ配列を、標準的な技術によってＤＮＡベクターにクローニングすることによって増幅させることができる。いくつかの実施形態において、複数の異なる修飾標的ＤＮＡ配列のコピー数をＰＣＲによって増加させ、例えば、二本鎖アダプターＤＮＡが試料ＤＮＡ（または修飾試料ＤＮＡ）に事前にライゲーションされており、アダプターＤＮＡに相補的なプライマーを使用してＰＣＲが行われる、次世代配列決定のためのライブラリを生成する。

【0152】

いくつかの実施形態において、本方法は、修飾核酸の配列を検出するステップを含む。修飾された標的ＤＮＡまたはＲＮＡは、５ｍＣ、５ｈｍＣ、５ｆＣ、及び５ｃａＣのうちの１つ以上が非修飾の標的ＤＮＡまたはＲＮＡ中に存在した位置にＤＨＵを含む。ＤＨＵは、ＤＮＡ複製及び配列決定方法において、Ｔとして作用する。したがって、シトシン修飾は、当該技術分野で既知のＣからＴへの移行を特定する任意の直接的または間接的な方法によって検出することができる。そのような方法には、サンガー配列決定、マイクロアレイ、及び次世代配列決定方法などの配列決定方法が含まれる。ＣからＴへの移行はまた、ＣからＴへの移行が、制限エンドヌクレアーゼ認識配列を排除または導入する、制限酵素分析によって検出することができる。

【0153】

本開示の実施形態はまた、ＤＮＡ中の５ｍＣ及び５ｈｍＣを特定するためのキットを提供する。そのようなキットは、本明細書に記載の方法によって５ｍＣ及び５ｈｍＣを特定するための試薬を含む。キットは、本明細書に記載の方法によって５ｃａＣを特定するための試薬と５ｆＣを特定するための試薬とを含み得る。いくつかの実施形態において、キットは、ＴＥＴ酵素と、ボラン還元剤と、本方法を実施するための説明書と、を含む。いくつかの実施形態において、ＴＥＴ酵素は、ＴＥＴ１であり、ボラン還元剤は、ピリジンボラン、２－ピコリンボラン（ｐｉｃ－ＢＨ３）、ボラン、水素化ホウ素ナトリウム、シアノ水素化ホウ素ナトリウム、及びトリアセトキシ水素化ホウ素ナトリウムからなる群のうちの１つ以上から選択される。いくつかの実施形態において、ＴＥＴ１酵素は、ＮｇＴｅｔ１またはマウスＴｅｔ１（例えばｍＴｅｔ１ＣＤ）であり、ボラン還元剤は、ピリジンボラン及び／またはｐｉｃ－ＢＨ_３である。

【0154】

いくつかの実施形態において、キットは、５ｈｍＣ保護基及びグリコシルトランスフェラーゼ酵素を更に含む。いくつかの実施形態において、５ｈｍＣに付加される保護基は、糖である。いくつかの実施形態において、糖は、天然に存在する糖または修飾糖、例えば、グルコースまたは修飾グルコースである。いくつかの実施形態において、グルコシルトランスフェラーゼ酵素、例えば、Ｔ４バクテリオファージβ－グルコシルトランスフェラーゼ（βＧＴ）及びＴ４バクテリオファージα－グルコシルトランスフェラーゼ（αＧＴ）、ならびにその誘導体及び類似体の存在下で、核酸試料を、糖に連結されたＵＤＰ、例えば、ＵＤＰ－グルコース、または修飾グルコースに連結されたＵＤＰと接触させることによって、保護基を５ｈｍＣに付加する。

【0155】

いくつかの実施形態において、キットは、過ルテニウム酸カリウム（ＫＲｕＯ４）及び／またはＣｕ（ＩＩ）／ＴＥＭＰＯ（過塩素酸銅（ＩＩ）及び２，２，６，６－テトラメチルピペリジン－１－オキシル（ＴＥＭＰＯ））から選択される酸化剤を更に含む。いくつかの実施形態において、キットは、核酸試料中の５ｆＣを保護するための試薬を含む。いくつかの実施形態において、キットは、例えば、本明細書に記載のヒドロキシルアミン誘導体、ヒドラジン誘導体、及びヒドラジド誘導体を含むアルデヒド反応性化合物を含む。いくつかの実施形態において、キットは、本明細書に記載の５ｃａＣを保護するための試薬を含む。いくつかの実施形態において、キットは、ＤＮＡまたはＲＮＡを単離するための試薬を含む。いくつかの実施形態において、キットは、試料から低入力ＤＮＡを、例えば、血液、血漿、または血清からｃｆＤＮＡを単離するための試薬を含む。

【0156】

いくつかの実施形態において、本開示の方法は、患者（例えば、がんを有する患者、早期がんを有する患者、またはがんを有することが疑われる患者）を治療することを含む。いくつかの実施形態において、本方法は、本明細書に提供されるメチル化シグネチャを決定することと、メチル化シグネチャを決定した結果に基づいて、患者に治療を施すことと、を含む。治療は、薬学的化合物、ワクチンの投与、手術の実施、患者の画像診断、及び／または別の試験の実施を含み得る。いくつかの実施形態において、本開示の方法を、臨床スクリーニング、予後評価の方法、療法の結果を監視する方法、特定の療法的治療に応答する可能性が最も高い患者を特定するための方法、患者または対象を撮像する方法、ならびに薬物スクリーニング及び開発のための方法の一部として使用することができる。

【0157】

いくつかの実施形態において、本開示の方法は、対象においてがんを診断することを含む。「診断する」及び「診断」という用語は、本明細書で使用される場合、対象が所与の疾患もしくは状態に罹患しているか否か、または将来的に所与の疾患もしくは状態を発症する可能性があるか否かを、当業者が推定し、更に判定することができる方法を指す。当業者は、多くの場合、１つ以上の診断指標、例えば、メチル化バイオマーカー及び／またはメチル化シグネチャに基づいて診断を行い、これは、状態（例えば、がん）の存在、重症度、または非存在の指標である。

【0158】

診断に加えて、臨床的ながん予後は、がんの攻撃性及び腫瘍再発の可能性を判定し、最も効果的な療法を計画することに関する。更に正確な予後を行うことが可能である場合、またはがんを患う潜在的なリスクを評価することが可能である場合でさえ、適切な治療、及びいくつかの例において患者にそれほど過酷ではない治療を選択することが可能である。メチル化シグネチャに基づく対象の評価は、良好な予後を有し、及び／またはがんを発症するリスクが低く、療法または限定的な療法を必要としない対象を、がんを発症する可能性が高いか、またはがんの再発に苦しみ、より集中的な治療から利益を受け得る対象から分離するのに有用であり得る。したがって、「診断を行う」または「診断する」は、本明細書で使用される場合、本明細書に開示されるように、メチル化シグネチャの特定及び評価に基づいて、がんを発症するリスクの決定を行うこと、または予後を決定すること（臨床転帰の予測を（医学的治療の有無にかかわらず）提供することができる）、適切な治療（または治療が有効であるかどうか）を選択すること、または現在の治療を監視し、治療を潜在的に変更すること、を更に含む。

【0159】

いくつかの実施形態において、本開示の方法は、対象におけるがんの予防または治療を開始または継続するかどうかを決定することを含む。いくつかの実施形態において、本方法は、一定期間にわたって対象からの一連の生体試料を提供することと、一連の生体試料を分析して、各生体試料において本明細書に開示されるメチル化シグネチャを決定することと、各生体試料におけるメチル化シグネチャにおける任意の測定可能な変化を比較することと、を含む。一定期間にわたるメチル化シグネチャの任意の変化を使用して、がんを発症するリスクを予測し、臨床転帰を予測し、がんの予防もしくは療法を開始するか、または継続するかを決定し、現在の療法が、がんを効果的に治療しているかどうかを決定することができる。例えば、第１の時点は、治療の開始前に選択することができ、第２の時点は、治療開始後のある時点で選択することができる。メチル化シグネチャを、異なる時点から採取された試料の各々で測定することができ、定性的差異及び／または定量的差異が示されている。異なる試料からのメチル化シグネチャの変化は、対象におけるがんの発症リスク、予後、治療有効性の決定、及び／またはがんの進行と相関し得る。いくつかの実施形態において、本発明の方法及び組成物は、早期、例えば、疾患の症状が現れる前の疾患の治療または診断のためのものである。いくつかの実施形態において、本発明の方法及び組成物は、臨床ステージにおける疾患の治療または診断のためのものである。

【0160】

本明細書における別段の定義がない限り、本開示に関連して使用される科学用語及び技術用語は、当業者によって一般的に理解されている意味を有するものとする。例えば、本明細書に記載の細胞及び組織の培養、分子生物学、免疫学、微生物学、遺伝学、ならびにタンパク質及び核酸の化学及びハイブリダイゼーションと関連して使用される任意の命名法及び技術は、当該技術分野で周知であり、一般的に使用されている。用語の意味及び範囲は明確でなければならない。ただし、潜在的な曖昧さがある場合、本明細書に提供される定義は、任意の辞書または外在的な定義よりも優先される。更に、文脈によって別段の必要がない限り、単数形の用語は、複数形を含み、複数形の用語は、単数形を含むものとする。
４．材料及び方法
実験設計。３０名の非がん対照からの全血試料を、ＪｏｈｎＲａｄｃｌｉｆｆｅ病院から得た（倫理審査による承認ＩＤ１６／ＹＨ／０２４７及び１８／ＷＭ／０２３７）。８名の患者からの膵炎血液試料を、ＪｏｈｎＲａｄｃｌｉｆｆｅ病院から得た。この研究は、ＯｘｆｏｒｄｓｈｉｒｅＲＥＣ－Ａ（１０／Ｈ０６０４／５１）によって承認され、研究番号１０７７６としてＵＫＮＩＨＲポートフォリオに登録されている。ＰＤＡＣ患者は、ＯｘｆｏｒｄＲａｄｃｌｉｆｆｅＢｉｏｂａｎｋ（０９／Ｈ０６０６／５＋５、プロジェクト：１９／Ａ１７７）によって、この研究について合意し、２４名の患者から全血試料を収集した。２１名のＨＣＣ患者及び４名の肝硬変患者からの血漿試料の収集は、ＲＥＣ承認された（倫理審査による承認２／ＮＥ／０３９５、ＩＲＡＳプロジェクトＩＤ：１１６３７０）。試料サイズの計算は実施されなかった。試料サイズは、入手可能性に基づいて決定された。ＰＤＡＣ、ＨＣＣ、膵炎、及び肝硬変の試料を、臨床的に診断された疾患を有する対象から収集した。非がん対照試料は、試料収集時のがん診断、またはがんの既往歴を有しない個体から収集した。

【0161】

この研究の主な目標は、ＴＡＰＳを使用した全ゲノムメチル化配列決定による、がん及び対照におけるｃｆＤＮＡの包括的な多次元特性決定であった。ｃｆＤＮＡＴＡＰＳライブラリを構築し、ＮｏｖａＳｅｑ６０００シーケンサ（Ｉｌｌｕｍｉｎａ）で配列決定されたペアエンド１５０ｂｐであった。技術的な詳細は、以下のセクションに記載されている。メチル化ラムダスパイクイン対照に基づいて計算された５ｍＣ変換が９０％未満の試料は、下流の分析から除外された。

【0162】

ｃｆＤＮＡ試料の収集及び調製。血液を、ＥＤＴＡコーティングされたＶａｃｕｔａｉｎｅｒに収集した。収集から４時間以内に、収集した血液試料から血漿を分離した。血漿を、４℃、１６００ｘｇで１０分間、及び４℃、１６０００ｘｇで１０分間遠心分離することによって収集し、ｃｆＤＮＡ精製のために－８０℃で保存した。血漿からのｃｆＤＮＡを、ＱｉａｍｐＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉＡｃｉｄＫｉｔ（Ｑｉａｇｅｎ）を使用して抽出した。ｃｆＤＮＡを、ＱｕｂｉｔＦｌｕｏｒｏｍｅｔｅｒ（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ）によって定量した。

【0163】

キャリアＤＮＡ及びスパイクイン対照の調製。１ｎｇのＤＮＡ鋳型、０．５μＭのプライマー（順方向：５’－ＡＧＧＣＡＡＣＴＴＴＡＴＧＣＣＣＡＴＧＣＡＡ－３’（配列番号２）、逆方向：５’－ＣＣＡＡＧＧＧＧＴＴＡＴＧＣＴＡＧＴＴＡＴＴＧＣ－３’（配列番号３））、及びＨＦ緩衝液を含む１倍のＰｈｕｓｉｏｎＨｉｇｈ－ＦｉｄｅｌｉｔｙＰＣＲＭａｓｔｅｒＭｉｘ（ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃ）を含有する反応において、ｐＮＩＣ２８－Ｂｓａ４プラスミド（Ａｄｄｇｅｎｅ、カタログ番号２６１０３）のＰＣＲ増幅によって、キャリアＤＮＡを調製した。ＣｐＧ－メチル化ラムダＤＮＡ及び２ｋｂ非修飾スパイクイン対照ＤＮＡを、前述のように調製した。ＣｐＧ－メチル化ラムダＤＮＡ、キャリアＤＮＡ、及び２ｋｂの非修飾対照を、ＣｏｖａｒｉｓＭ２２０（ピーク入射電力－５０Ｗ、デューティファクタ－２０％、バースト当たりのサイクル数（ｃｐｂ）－２００、時間－１５０秒）によって断片化し、０．９～１．２×ＡＭＰｕｒｅＸＰビーズ上でサイズ選択し、１５０～２５０ｂｐの断片を選択した。

【0164】

配列決定アダプターの調製。アダプターオリゴ（５’－ＡＣＡＣＴＣＴＴＴＣＣＣＴＡＣＡＣＧＡＣＧＣＴＣＴＴＣＣＧＡＴＣＴ－３’（配列番号４）；５’－／５Ｐｈｏｓ／ＧＡＴＣＧＧＡＡＧＡＧＣＡＣＡＣＧＴＣＴ－３’（配列番号５））を、ＨＰＬＣ精製によりＩＤＴから得た。アダプターオリゴを、１５μＭの各オリゴ、１０ｍＭのＴｒｉｓ－Ｃｌ（ｐＨ＝８．０）、０．１ｍＭのＥＤＴＡ（ｐＨ＝８．０）及び５０ｍＭのＮａＣｌを含有する５０μＬの反応物において、９５℃で２分間、９５℃で２０秒間の１４０サイクル（サイクルごとに温度を０．５℃下げる）、及び４℃で保持のプログラムで一緒にアニーリングした。次いで、アニーリングした１５μＭのＩｌｌｕｍｉｎａ多重化アダプターを、小さな単回使用バイアルに等分し、－８０℃で保存した。

【0165】

ｍＴｅｔ１ＣＤ酸化。ｍＴｅｔ１ＣＤを前述のように調製した。ＤＮＡを、５０ｍＭのＨＥＰＥＳ緩衝液（ｐＨ８．０）、１００μＭの硫酸アンモニウム鉄（ＩＩ）、１ｍＭのα－ケトグルタレート、２ｍＭのアスコルビン酸、２ｍＭのジチオスレイトール、１００ｍＭのＮａＣｌ、１．２ｍＭのＡＴＰ及び４μＭのｍＴｅｔ１ＣＤを含有する５０μｌの反応物中で、３７℃で８０分間インキュベートした。その後、０．８ＵのプロテイナーゼＫ（ＮｅｗＥｎｇｌａｎｄＢｉｏｌａｂｓ）を反応混合物に加え、５０℃で１時間インキュベートした。生成物を、製造業者の指示に従って、Ｂｉｏ－ＳｐｉｎＰ－３０ＧｅｌＣｏｌｕｍｎ（Ｂｉｏ－Ｒａｄ）及び１．８×ＡＭＰｕｒｅＸＰビーズでクリーンアップした。

【0166】

ピリジンボラン還元。３５μｌの水中の酸化されたＤＮＡを、ＥｐｐｅｎｄｏｒｆＴｈｅｒｍｏＭｉｘｅｒ中、６００ｍＭの酢酸ナトリウム溶液（ｐＨ４．３）及び１Ｍのピリジンボラン（ＡｌｆａＡｅｓａｒ）を含有する５０μｌの反応物中で、３７℃、８５０ｒ．ｐ．ｍ．で１６時間かけて還元した。生成物を、Ｚｙｍｏ－Ｓｐｉｎカラムを使用して精製した。

【0167】

ｃｆＤＮＡＴＡＰＳ。１０ｎｇのｃｆＤＮＡを、０．１５％のＣｐＧメチル化ラムダＤＮＡ及び０．０１５％の非修飾の２ｋｂ対照によりスパイクインし、末端修復及びＡテーリング反応に使用し、製造業者のプロトコルに従って、ＫＡＰＡＨｙｐｅｒＰｒｅｐキットを用いてＩｌｌｕｍｉｎａＭｕｌｔｉｐｌｅｘｉｎｇアダプターにライゲーションした。その後、１００ｎｇのキャリアＤＮＡを、ライゲーションされたライブラリに追加し、試料を上記のようにｍＴｅｔ１ＣＤで二重酸化し、ピリジンボランで還元した。変換されたライブラリを、ＫＡＰＡＨｉｆｉＵｒａｃｉｌＰｌｕｓＰｏｌｙｍｅｒａｓｅを用い、ＮＥＢＮｅｘｔ（登録商標）ＭｕｌｔｉｐｌｅｘＯｌｉｇｏｓｆｏｒＩｌｌｕｍｉｎａ（登録商標）（９６ＵｎｉｑｕｅＤｕａｌＩｎｄｅｘＰｒｉｍｅｒＰａｉｒｓ）を使用して７サイクル増幅させ、１×ＡＭＰｕｒｅＸＰビーズでクリーンアップした。ｃｆＤＮＡＴＡＰＳライブラリは、ＮｏｖａＳｅｑ６０００シーケンサ（Ｉｌｌｕｍｉｎａ）で配列決定されたペアエンド１５０ｂｐであった。

【0168】

ＴＡＰＳマッピング及び前処理。生の配列決定リードを、ｔｒｉｍ＿ｇａｌｏｒｅ（バージョン０．６．２ｗｗｗ．ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．ｂａｂｒａｈａｍ．ａｃ．ｕｋ／ｐｒｏｊｅｃｔｓ／ｔｒｉｍ＿ｇａｌｏｒｅ／）により処理し、アダプター及び低品質の塩基を、以下のパラメータ－－ペア－－長さ３５－－ｇｚｉｐ－－コア２でトリミングした。クリーンなリードを、以下のパラメータ－Ｉ５００、１２０、１０００、２０を用い、ｂｗａｍｅｍ（バージョン０．７．１７－ｒ１１８８）を使用したスパイクイン配列と組み合わせたヒト参照ゲノム（ＧＲＣｈ３８ｆｔｐ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｇｅｎｏｍｅｓ／ａｌｌ／ＧＣＡ／０００／００１／４０５／ＧＣＡ＿０００００１４０５．１５＿ＧＲＣｈ３８／ｓｅｑｓ＿ｆｏｒ＿ａｌｉｇｎｍｅｎｔ＿ｐｉｐｅｌｉｎｅｓ．ｕｃｓｃ＿ｉｄｓ／ＧＣＡ＿０００００１４０５．１５＿ＧＲＣｈ３８＿ｎｏ＿ａｌｔ＿ａｎａｌｙｓｉｓ＿ｓｅｔ．ｆｎａ．ｇｚ．）にアラインメントした。ＭＡＰＱ＜１のリードは、更なる分析から除外された。ＰｉｃａｒｄＭａｒｋＤｕｐｌｉｃａｔｅｓ（バージョン２．１８．２９－ＳＮＡＰＳＨＯＴ）を使用して、重複リードを特定した。ＭｅｔｈｙｌＤａｃｋｅｌ抽出物（バージョン０．５．０ｈｔｔｐｓ：／／ｇｉｔｈｕｂ．ｃｏｍ／ｄｐｒｙａｎ７９／ＭｅｔｈｙｌＤａｃｋｅｌ）を、以下のパラメータ－ｑ１０－ｐ１３－ｔ４－－ｍｅｒｇｅＣｏｎｔｅｘｔ－－ＯＴ１０，１４０，７５，７５－－ＯＢ１０，１４０，７５，７５を使用したメチル化呼び出しに使用した。更なる分析のために、一般的なＳＮＰ（ｄｂＳＮＰ１５３）、ブラックリストに登録された領域、セントロメア、及び性染色体と重複するＣｐＧ部位を除外した。

【0169】

ｃｆＤＮＡＷＧＢＳ分析。ｃｆＤＮＡＷＧＢＳデータをＥＧＡＤ００００１００４３１７からダウンロードした。生の配列決定リードを、ｔｒｉｍ＿ｇａｌｏｒｅ（バージョン０．６．２ｗｗｗ．ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．ｂａｂｒａｈａｍ．ａｃ．ｕｋ／ｐｒｏｊｅｃｔｓ／ｔｒｉｍ＿ｇａｌｏｒｅ）により処理し、アダプター及び低品質の塩基を、以下のパラメータ－－ペア－－長さ３５－－ｇｚｉｐ－－コア２でトリミングした。クリーンなリードを、デフォルトパラメータを使用したｂｉｓｍａｒｋ（ＢｉｓｍａｒｋＶｅｒｓｉｏｎ：ｖ０．２２．０）を使用して、ヒト参照ゲノム（ＧＲＣｈ３８）にアラインメントした。ｄｅｄｕｐｌｉｃａｔｅ＿ｂｉｓｍａｒｋを重複除去に使用した。Ｓａｍｔｏｏｌｓを使用して、－ｑ１０により断片をフィルタリングし、適切な対にマッピングされたリードのみを、断片化分析に使用した。ｂｉｓｍａｒｋ＿ｍｅｔｈｙｌａｔｉｏｎ＿ｅｘｔｒａｃｔｏｒを使用して、デフォルトパラメータにより、重複除去されたｂａｍファイルからメチル化を抽出した。

【0170】

ＤＮＡメチル化及び特徴の過剰表現分析に関するＰＣＡ。ゲノムを１ｋｂのウィンドウにビニングした。メチル化ＣｐＧの数を、配列決定された総ＣｐＧ数で割り算したものを使用して、メチル化レベルを計算した。平均ＣｐＧカバレッジ（配列決定された総ＣｐＧ数／ＣｐＧ位置の総数）が２未満のウィンドウを、更なる分析のために除外した。ＰＣＡ関数によって得られる各々の主成分に最も寄与する領域（各固有ベクトルの最大固有値）を決定するために、Ｄｉｍｄｅｓｃをパラメータｐｒｏｂａ＝０．０１と共に使用した。Ｂｅｄｔｏｏｌｓｆｉｓｈｅｒを使用して、上位２００の寄与領域（絶対相関値によって選別される）と選択されたゲノム特徴との間の重複の数を試験した。選択されたゲノム特徴は、Ｅｎｓｅｍｂｌｅからの調節エレメント（ｆｔｐ．ｅｎｓｅｍｂｌ．ｏｒｇ／ｐｕｂ／ｒｅｌｅａｓｅ－９７／ｒｅｇｕｌａｔｉｏｎ／ｈｏｍｏ＿ｓａｐｉｅｎｓ／ｈｏｍｏ＿ｓａｐｉｅｎｓ．ＧＲＣｈ３８．Ｒｅｇｕｌａｔｏｒｙ＿Ｂｕｉｌｄ．ｒｅｇｕｌａｔｏｒｙ＿ｆｅａｔｕｒｅｓ．２０１９０３２９．ｇｆｆ．ｇｚ）及びＵＣＳＣからのＣｐＧアイランド（ｈｇｄｏｗｎｌｏａｄ．ｓｏｅ．ｕｃｓｃ．ｅｄｕ／ｇｏｌｄｅｎＰａｔｈ／ｈｇ３８／ｄａｔａｂａｓｅ／ｃｐｇＩｓｌａｎｄＥｘｔ．ｔｘｔ．ｇｚ）を含んでいた。

【0171】

ＤＮＡメチル化シグネチャを用いた２クラス予測。２クラス予測モデルを訓練し、ＬＯＯアプローチに基づいて評価した。手短に言えば、１つの試料を試験セットとして保持し、残りの試料をモデル訓練に使用した。ＤＭＲ（ＰＤＡＣの場合はプロモーター、及びＨＣＣの場合はエンハンサー）を、ｔ検定によって、訓練セットにおいて特定した（Ｐ値＜０．００２、メチル化の差＞０．０５）。各々の一個抜きフォールドにおいて、４４３～７７５個の差次的にメチル化されたエンハンサー及び１６０～３１８個の差次的にメチル化されたプロモーターが、それぞれ、非がん対照に対するＨＣＣ、及び非がん対照に対するＰＤＡＣの特徴選択ステップにおいて特定された。合計して、交差検証プロセス中に１，５２１個のエンハンサー、及び５３１個のプロモーターが選択された。予測モデルを、ｃｖ．Ｇｌｍｎｅｔを使用して、選択されたＤＭＲに対して構築し、試験試料に対して検証した。この手順をＮ回繰り返した。ここで、Ｎは、試料の数である。ＲＯＣ曲線を、ｃｖｇｌｍモデルからのホールドアウトされた試験試料の予測スコアに基づいて、Ｒで調製した。肝硬変患者及びｃｆＤＮＡＷＧＢＳデータを、独立した検証セットとして使用して、ＨＣＣモデルの性能を評価した。膵炎患者を、独立した検証セットとして使用して、ＰＤＡＣモデルの性能を評価した。アラインメントされたＢＡＭファイルを、ｓａｍｔｏｏｌｓを使用して、１００Ｍ～２００Ｍのリード対からダウンサンプリングした。各ダウンサンプリングされたセットについて、上述の方法を使用して、ＤＭＲを検出した。ｒｅｆＤＭＲは、ＬＯＯ交差検証における一意ＤＭＲの合計として定義された。ダウンサンプリングされたセットと、ｒｅｆＤＭＲ及び総ｒｅｆＤＭＲとの間で重複するＤＭＲを分割することによって、ｒｅｆＤＭＲの割合を計算した。

【0172】

ＤＭＲのＧＯ分析。ＨＣＣｃｆＤＮＡ中の差次的にメチル化されたエンハンサーによって調節される遺伝子を、ＧｅｎｅＨａｎｃｅｒデータベースを使用して特定した。ＰＤＡＣにおいて、差次的にメチル化されたプロモーターに最も近い遺伝子は、以下のＲパッケージを使用して、関連するものとして特定された。ＡｎｎｏｔａｔｉｏｎＨｕｂ（バージョン２．１８．０）、ＴｘＤｂ．Ｈｓａｐｉｅｎｓ．ＵＣＳＣ．ｈｇ３８．ｋｎｏｗｎＧｅｎｅ（バージョン３．１０．０）及びｏｒｇ．Ｈｓ．ｅｇ．ｄｂ（バージョン３．１０．０）。これらの特定された遺伝子に対して、ＮＣＩ－ＮａｔｕｒｅＰａｔｈｗａｙＩｎｔｅｒａｃｔｉｏｎデータベースに対してＥｎｒｉｃｈｒツールを使用して、ＧＯ分析を実施した。

【0173】

組織参照マップ。ＣｐＧレベルの組織メチル化データを、６種類の公的な供給源から照合した（組織マップの生成のための公的なメチル化ＷＧＢＳの供給源は、本開示に含まれないが、要求に応じて利用可能にすることができる）。疾患の性別特異的かつ低いカバレッジの試料をフィルタリングした後、１４４個の健康な成人組織試料を保持し、３２の生理学的に異なる組織群にグループ分けした（ｃｆＴＡＰＳコホートにおける各患者についてのｃｆＤＮＡ組織寄与に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。１４４個の試料のうちの１３３個が、すでにｈｇ３８にアラインメントされており、残りの１１個の試料は、ＵＣＳＣｈｇＬｉｆｔＯｖｅｒツールを使用して、ｈｇ１９からｈｇ３８に変換された。

【0174】

Ｍｏｓｓｅｔａｌ．と同様の組織特異的ＤＭＲ発見アルゴリズムを使用して、ＥｎｓｅｍｂｌＲｅｇｕｌａｔｏｒｙＢｕｉｌｄから約７９，０００個のエンハンサーをフィルタリングした。具体的には、このアルゴリズムは、参照アトラス内の各組織群についてのペアワイズ一対全て（ｏｎｅ－ｖｓ－ａｌｌ）比較を実施し、問題の組織群にわたって最大のメチル化の差の中央値と、一致したメチル化を示す領域を選択する。Ｍｏｓｓｅｔａｌ．と同様に、ペアワイズ組織群相関も計算され、各組織群を第１及び第２の最も相関の高い組織から最もよく分離するＤＭＲが含まれていた。

【0175】

非負の線形最小二乗回帰による組織デコンボリューション。組織デコンボリューションは、非負の線形最小二乗回帰を使用して実施され、Ｐｙｔｈｏｎ３．８におけるＳｃｉｐｙの最適化関数を使用して実装された。組織参照マトリックスＡ、及び試料ｓにおいて観察されたメチル化比のベクトルｙ_ｓが与えられたら、組織寄与ｘは、以下の最小化問題を解くことによって推定された。

【0176】

ｍｉｎ｜｜Ａｘ－ｙ_ｓ｜｜^２
ｘ≧０とする。

【0177】

断片化分析。ＤＮＡ断片の長さを、Ｓａｍｔｏｏｌｓを使用してアラインメントファイルから得た。断片化プロファイルを、１０ｂｐの長さ範囲のビンにおけるｃｆＤＮＡ断片の割合として計算した。ＰＣＡ分析及びプロットをＲで生成した。

【0178】

断片化に基づく予測のために、１０ｂｐの長さ範囲のビンにおけるｃｆＤＮＡ断片（３００～５００ｂｐ）の割合を計算した。ｃｖ．ｇｌｍｎｅｔ法を使用して、一個抜き（ｌｅａｖｅ－ｏｎｅ－ｏｕｔ）アプローチによって、モデルを構築し、訓練した。ＲＯＣ曲線を、検証からの予測スコアに基づいて、Ｒで調製した。

【0179】

ＣＮＶ分析。各試料についてのアラインメントファイルを、ｓａｍｔｏｏｌｓビューにより、２２５Ｍのリード対にダウンサンプリングした。ＱＤＮＡｓｅｑパッケージを、コピー数変動分析に使用した。ビンアノテーションを、ＱＤＮＡｓｅｑ．ｈｇ３８（ｇｉｔｈｕｂ．ｃｏｍ／ａｓｎｔｅｃｈ／ＱＤＮＡｓｅｑ．ｈｇ３８）からダウンロードし、ビンサイズ１００ｋｂを使用した。更なる分析のために、ブラックリストに登録された領域、または８０未満のマッピング可能性を有する領域を除外した。カットオフ０．８及び１．２を使用して、ｃａｌｌＢｉｎｓ関数でそれぞれ、コピー数の損失及びゲインを定義した。長さ範囲が５００ｋｂより大きいコピー数異常を有する患者を、ＣＮＶを有する患者として分類した。

【0180】

３クラス予測モデル。３クラス予測モデルを訓練し、ＬＯＯアプローチに基づいて評価した。ＤＮＡメチル化のために、候補特徴は、最初に、前述のように調節領域へのマッピングを包含する８２４，３２０個の１ｋｂウィンドウに絞り込まれた。メチル化モデルは、ｔ検定を用いたペアワイズ比較に基づいてＤＭＲを選択することによって、がん型に特異的なメチル化変化を捕捉することを目的とする。次いで、ＤＭＲをＰ値によってランク付けし、各ペアワイズ比較における上位５つのＤＭＲをモデル訓練のために選択した。予測モデルは、ｃａｒｅｔパッケージ（訓練方法＝「ｓｖｍＬｉｎｅａｒ２」）に実装されたＳＶＭモデルを使用した訓練セットの中から選択されたＤＭＲに対して構築され、試験試料に対して検証された。この手順をＮ回繰り返した。ここで、Ｎは、試料の数である。組織寄与及び断片化の割合のために、生マトリックスを使用して、ＤＭＲと同じ方法に従ってモデルを構築した。これらの３つのモデルは、３つのモダリティにわたって平均化された（平均）予測をとることによって統合され、各症例で選択された予測は、最大の平均化された予測スコアを有するものであった。

【0181】

前述の詳細な説明及び付随する実施例は、単なる例示にすぎず、本開示の範囲を限定するものとして解釈されるべきではなく、本開示の範囲は、専ら添付の特許請求の範囲及びそれらの等価物によって定義されることを理解されたい。

【0182】

開示される実施形態に対する様々な変更及び修正は、当業者には明白であろう。本開示の化学構造、置換基、誘導体、中間体、合成物、組成物、製剤、または使用方法に関連するものを含むがこれらに限定されない、そのような変更及び修正は、その趣旨及び範囲から逸脱することなく行われ得る。

【実施例】

【0183】

５．実施例
本明細書に記載の本開示の方法の他の好適な修正及び適合は、容易に適用可能かつ認識可能であり、本開示の範囲、または本明細書に開示の態様及び実施形態を逸脱することなく、好適な同等物を使用して行われてよいことは当業者には容易に明らかであろう。本開示を詳細に説明したので、以下の実施例を参照することにより、本開示がより明確に理解され、これらは、単に開示のいくつかの態様及び実施形態を説明することのみを意図し、開示の範囲を制限するものとみなすべきではない。本明細書において参照される全てのジャーナルの参照、米国特許、及び刊行物の開示は、参照によりそれらの全体が本明細書に組み込まれる。

【0184】

本開示は、以下の非限定的な実施例によって示される複数の態様を有する。
実施例１
ｃｆＤＮＡ配列決定のためのＴＡＰＳの適応。実験を実施して、低入力ｃｆＤＮＡ（１０ｎｇ、１～３ｍＬの血漿から精製された）で機能するように、ＴＡＰＳプロトコルを最適化した。手短に言えば、まず、１０ｎｇのｃｆＤＮＡをＩｌｌｕｍｉｎａアダプターにライゲーションし、次いで、ＴＥＴ酸化及びピリジンボラン（ＰｙＢｒ）還元ステップの前に、１００ｎｇのキャリアＤＮＡを試料に追加する（図１Ａ）。それにより、キャリアＤＮＡの追加が、ワークフロー中のｃｆＤＮＡの回収を改善し、標準的なＴＡＰＳプロトコルと比較して、より高いライブラリ収率をもたらすことを見出した（図５Ａ）。その後、ｃｆＤＮＡ中の５－メチルシトシン（５ｍＣ）及び５－ヒドロキシメチルシトシン（５ｈｍＣ）は、ｍＴｅｔ１ＣＤ酵素によって５－カルボキシルシトシン（５ｃａＣ）へと酸化され、ジヒドロウラシル（ＤＨＵ）へと還元され、これが最終的なＰＣＲステップにおいて、Ｔとして増幅される（図１Ａ）。

【0185】

ｃｆＴＡＰＳを８７個のｃｆＤＮＡ試料に適用した。ライブラリを、平均３６０Ｍのリード対（１１．６×平均深度、範囲８．２～２２×）に対して配列決定し、それぞれ、９４．８％及び７７．１％の高い一意のマッピングレート及び一意の重複除去されたマッピングレートを得た（図１Ｂ、配列決定統計に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。マッピングされたリードのうち、９９．９５％が、ヒトゲノムにマッピングされた（図５Ｂ）。比較すると、近年のｃｆＤＮＡ全ゲノム亜硫酸水素塩配列決定（ＷＧＢＳ）は、同様の深度（平均３７１Ｍのリード対）で配列決定し、（５ｍＬの血漿から）より多くのｃｆＤＮＡインプットを使用したにもかかわらず、有意に低い一意のマッピングレート（６３．６％）及び一意の重複除去されたマッピングレート（５３．９％）が得られた（図５Ｃ）。このことは、より少ないｃｆＤＮＡインプットを必要としつつ、ｃｆＤＮＡＷＧＢＳよりも高品質であり、より複雑なデータを生成するｃｆＴＡＰＳの利点を強調するものである。

【0186】

その後、５ｍＣを検出するためのｃｆＴＡＰＳの正確さを、既知の位置に修飾シトシン及び非修飾シトシンを有するスパイクイン対照に基づいて評価した。ＣｐＧメチル化ラムダＤＮＡを使用して、５ｍＣの変換を推定した。２つの試料は、８５％未満の低い変換率を有しており、下流の分析から除外された（配列決定統計に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。残りの８５個の試料は、９７．０％の平均５ｍＣ変換率、または３．０％の偽陰性率（５ｍＣの非変換率）を有していた（図１Ｃ）。非修飾アンプリコンスパイクインに基づいて推定された偽陽性率（非修飾Ｃの変換率）は、０．２８％であり、ｃｆＴＡＰＳが、ｃｆＤＮＡにおける５ｍＣの高感度かつ特異的な検出を可能にすることを確認する（図１Ｃ）。技術的反復間のｃｆＴＡＰＳの高い再現性が、更に確認された（図５Ｄ）。
実施例２
ｃｆＴＡＰＳからの全ゲノムＤＮＡメチル化。次に、初期の品質管理に合格した８５個のｃｆＤＮＡ試料中のｃｆＤＮＡメチロームを特性決定する実験を行った。コホートは、ＨＣＣを有する２１名の患者、ＰＤＡＣを有する２３名の患者、３０名の非がん対照、肝硬変を有する４名の患者、及び膵炎を有する７名の患者からの試料を含んでいた（図６Ａ）。肝硬変及び膵炎は、それぞれ肝臓及び膵臓に影響を及ぼす前がん性状態である。コホート中のほとんどのＰＤＡＣ及びＨＣＣ患者は、非転移性のステージにあり、ＰＤＡＣ患者の５２％及び６７％のＨＣＣ患者がステージＩ及びＩＩであった（図２Ａ、ｃｆＴＡＰＳ研究コホートに関連する臨床データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。２１名のＨＣＣ患者のうち、４名（１９％）のみがＡＰＦレベルの上昇（２０ｎｇ／ｍＬを超える）を有していた。ＣＡ１９－９測定を行った１８名のＰＤＡＣ患者のうち、１６名（８９％）が、ＣＡ１９－９の上昇レベル（３７Ｕ／ｍＬを超える）を有していた。しかしながら、ＣＡ１９－９レベルは、炎症性疾患を含む非悪性状態でしばしば上昇することに留意することが重要である。注目すべきことに、非がん対照は、内視鏡診療所から収集され、クローン病及び大腸炎などの胃腸炎症状態が多かった（ｃｆＴＡＰＳ研究コホートに関連する臨床データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。これらの非がん対照を、がん患者と区別することは、典型的に健康な対照群よりも困難であるが、このことは、高齢集団における診断検査のより現実的な比較を提供し得る。

【0187】

がん及び対照試料中のｃｆＤＮＡの全般的なメチル化レベルを分析した。ｃｆＤＮＡメチル化は、ほとんどのＣｐＧ部位が完全にメチル化されているか、またはメチル化されていない全ての群において、典型的な二峰性分布を示した（図５Ｂ）。対照試料中の平均ＣｐＧメチル化レベルは、７５．５％であり、がんｃｆＤＮＡにおいて同様であった（ＨＣＣ：７４．９％、ＰＤＡＣ：７５．１％）。ＨＣＣにおける以前に報告された全般的なｃｆＤＮＡの低いメチル化は、後期または大きな腫瘍サイズを有する少数の試料においてのみ観察された（図２Ｂ及び図６Ｃ～６Ｆ）。これとは対照的に、対照と比較して、がん患者間では、１Ｍｂのゲノムウィンドウにおけるメチル化のより高い分散が観察された（図６Ｇ～６Ｈ）。

【0188】

次いで、全ゲノムｃｆＤＮＡメチル化シグネチャが、がん患者と非がん対照とを識別する可能性を有するかどうかを調べるために実験を行った。１ｋｂのゲノムウィンドウにおけるｃｆＤＮＡメチル化の主成分分析（ＰＣＡ）を最初に行った。ＨＣＣ（図２Ｃ）及びＰＤＡＣ試料（図２Ｄ）の両方が、それぞれ、主成分２（ＰＣ２）及びＰＣ１において、対照から部分的に分離したことを示した。炎症性患者（クローン病及び大腸炎）は、他の非がん対照から分離しないことに留意されたい（図６Ｉ）。次いで、がん／対照分離に最も寄与したウィンドウがゲノム中で濃縮された場所を調べるために実験を行った。結果は、ＨＣＣの場合にＰＣ２との相関が最も高い上位２００ウィンドウがエンハンサー中で濃縮されたことを示した（図２Ｅ）。逆に、ＰＤＡＣの場合にＰＣ１と最も高度に相関する２００個のウィンドウは、プロモーター中で高度に濃縮されており（図２Ｅ）、このことは、異なるがん型が異なるｃｆＤＮＡメチル化シグナルを有することを示唆している。
実施例３
ｃｆＴＡＰＳからの差次的なＤＮＡメチル化。調節領域におけるメチル化パターンが、教師なし分析において、がんと対照との間の区別に有意に寄与したため、それぞれＨＣＣ及びＰＤＡＣ予測のためのエンハンサー及びプロモーター領域におけるｃｆＤＮＡメチル化の予測可能性を、一個抜き（ＬＯＯ）交差検証による教師あり機械学習アプローチを使用して調べるために、実験を行った。手短に言えば、ＬＯＯ交差検証の各ラウンドにおいて、１つの試料を検証セットとして使用し、残りの試料をモデル訓練に使用した。各フォールド内で、それぞれＨＣＣ及びＰＤＡＣについて差次的にメチル化されたエンハンサー及びプロモーターを特定し、これを使用して、各々のがん型を対照試料から区別するように、正規化された一般化された線形モデル分類子（ｇｌｍｎｅｔ）を訓練した。次いで、このモデルを、各フォールドにおけるホールドアウト試験試料について評価した（図７Ａ）。肝硬変及び膵炎試料は、モデル構築には含まれなかったが、がんと前悪性状態とを識別するための分類子の性能を評価するための独立した検証セットとして使用された。

【0189】

ＨＣＣの有意な予測（ＡＵＣ＝０．９９）を、差次的にメチル化されたエンハンサーに基づいて達成した（図２Ｆ～２Ｇ、対照に対するＨＣＣ予測に使用される差次的にメチル化されたエンハンサーに関する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。更に、予測スコアに基づいて、４個の肝硬変試料のうちの３個をＨＣＣから区別することができ、このことは、そのモデルが、がん特異的特徴を検出することができることを示唆している（図７Ｂ）。次いで、差次的にメチル化されたエンハンサーに対して遺伝子オントロジー分析を実施し、ＲＡＣ１活性ならびにＩＬ８媒介性シグナル伝達及びＣＸＣＲ１媒介性シグナル伝達の調節を含む、肝臓癌において一般的に影響を受けるシグナル伝達経路における有意な濃縮を見出した（図７Ｃ）。例えば、ＨＣＣ患者のｃｆＤＮＡにおいて、ＲＡＣ１及びＲｈｏシグナル伝達経路に関与するヒト肝臓癌に対する腫瘍抑制因子であるＤＬＣ１遺伝子の発現を調節するエンハンサーの有意な高メチル化が観察された（図７Ｄ）。

【0190】

ＰＤＡＣの正確な予測（ＡＵＣ＝０．９８）を、差次的にメチル化されたプロモーターに基づいて達成した（図２Ｈ～２Ｉ、対照に対するＰＤＡＣ予測に使用される差次的にメチル化されたプロモーターに関する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。同様に、分類子は、膵炎試料について何ら訓練されていないにもかかわらず、７個の膵炎試料のうち６個を非がんと予測することができた（図７Ｅ）。ＰＤＡＣｃｆＤＮＡにおける差次的にメチル化されたプロモーターは、ＲＢ１調節及びｐ３８シグナル伝達経路を含む、ＰＤＡＣによって影響を受けるシグナル伝達経路において濃縮された（図７Ｆ）。例えば、結果は、十分に研究された腫瘍抑制遺伝子であるＲＢ１遺伝子プロモーターにおいて有意な高メチル化を示した（図７Ｇ）。ＲＢ１プロモーターの高メチル化は、ヒトがんにおいて以前に見出され、ＲＢ１の下方調節は、膵臓癌において報告された。

【0191】

最後に、ＨＣＣモデルは、４名のＨＣＣ患者及び４名の非がん対照を含む最近のｃｆＤＮＡＷＧＢＳ研究からの独立したデータセットで検証された。結果は、ｃｆＴＡＰＳデータから特定された差次的にメチル化されたエンハンサーに対して構築されたモデルが、この外部データセットからの全てのＨＣＣ及び非がん対照を正しく分類することができたことを示した（図７Ｈ）。ｃｆＤＮＡからのデノボの差次的なメチル化分析には、ｃｆＴＡＰＳの高い配列決定深度が不可欠であり、データを１００～２００Ｍのリード対にダウンサンプリングしたときに、特定された差次メチル化領域（ＤＭＲ）が有意に減少したことに留意することが重要である（図７Ｉ）。まとめると、ｃｆＴＡＰＳは、ｃｆＤＮＡにおけるＤＭＲの全ゲノム発見を可能にし、調節領域における異なるメチル化パターンは、ＨＣＣ及びＰＤＡＣの正確な予測を可能にする。
実施例４
ｃｆＴＡＰＳは、起源の組織を知らせる。ｃｆＤＮＡメチル化は、起源の組織の情報を提供することが示されている。ほとんどのアプローチは、ヒトゲノム中のＣｐＧの１％未満を網羅する４５０Ｋメチル化アレイ組織データを使用して、ｃｆＤＮＡメチル化からの組織寄与を推察する。ｃｆＤＮＡデコンボリューションのためにｃｆＴＡＰＳからの全ゲノム情報を更に利用するために、ＣｐＧレベルメチル化データを、１４４の公的に利用可能な組織及び血液細胞のＷＧＢＳから照合し、肝臓腫瘍組織を含む３２の生理学的に異なる組織及び血液細胞型に層別化した（組織マップの生成のための公的なメチル化ＷＧＢＳデータの供給源は、本開示に含まれないが、要求に応じて利用可能にすることができる）。エンハンサー領域における組織特異的なＤＮＡメチル化の存在率を考慮して、組織メチル化のエンハンサーによって集約された参照マップを構築した。得られたメチル化参照マップは、血液及び免疫細胞型、更には生理学的に関連する固体組織の良好なクラスタリングを示す（図８Ａ）。

【0192】

ｃｆＴＡＰＳ試料中の組織寄与を、非負の線形最小二乗回帰（ＮＮＬＳ）を実施することによって計算した。ｃｆＤＮＡ組織寄与は、がん群と対照群との間で広く類似しており、以前の報告と一致して、血液及び免疫細胞が優勢であり、固形組織の割合が低い（図３Ａ、図８Ｂ、ｃｆＴＡＰＳコホートにおける各患者についてのｃｆＤＮＡ組織寄与に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる）。重要なことに、ＨＣＣ単独において、有意に増加した肝臓腫瘍寄与が観察され（図３Ｂ、対応ありｔ検定、Ｐ値０．００１６）、ＰＤＡＣ試料において、有意に増加したメモリーＴ細胞寄与が観察された（対応ありｔ検定、Ｐ値０．０２８）（図８Ｃ）。正規化された一般化された線形モデルを、組織寄与に基づいて訓練し、ＬＯＯ交差検証を使用して全ての試料を評価し、両方のがん型の試料の大部分を正しく分離することが示された（非がん対照に対するＨＣＣ：ＡＵＣ＝０．７７、非がん対照に対するＰＤＡＣ：ＡＵＣ＝０．８１）。しかしながら、これらのモデルは、メチル化に基づくモデルと比較して、膵炎及び肝硬変の区別において、劣っている（図９Ｄ～８Ｉ）。組織デコンボリューションは、現在、公的なＷＧＢＳデータの利用可能性によって制限されている。それにもかかわらず、これらの結果は、ｃｆＴＡＰＳが早期がん検出のための貴重な起源の組織の情報を提供することを示す。
実施例５
ｃｆＴＡＰＳからの断片化パターン。ｃｆＴＡＰＳの主な目的は、ＤＮＡメチル化配列決定であるが、それは、修飾シトシンにおいて塩基変化のみを誘導し、したがって、ＤＮＡの大部分を無傷なままに保つ。したがって、追加の遺伝子情報をｃｆＴＡＰＳデータから抽出して、早期がん検出の感度を更に改善することができる。最初に、ｃｆＴＡＰＳデータからＣＮＶを調べるための実験を行った。非進行がんコホートで予想されるように、ＣＮＶは、４名のＨＣＣ患者及び３名のＰＤＡＣ患者でのみ予測された（図９Ａ～９Ｂ）。次に、ｃｆＴＡＰＳが、信頼性の高いｃｆＤＮＡ断片化情報を保持することができるかどうかを調べるための実験を行い、これは、近年、がん発症中に有意に変化することが示されており、したがって、がん検出アッセイに採用されている。

【0193】

ｃｆＴＡＰＳにより検出されたｃｆＤＮＡ断片化パターンは、全ゲノム配列決定（ＷＧＳ）によって生成されたｃｆＤＮＡ断片化パターンと一致し、１６７ｂｐでの優勢なピーク、約３２０ｂｐでの第２のピーク、及び１６７ｂｐ未満に１０ｂｐ周期で、より小さいピークを有し、ヌクレオソーム断片化パターンを反映している（図３Ｃ、各個体における断片の長さ分布に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる）ことが、まず確認された。対照的に、断片化パターンは、おそらくＤＮＡ損傷に起因して、ｃｆＤＮＡ断片化プロファイルにおける１０ｂｐの振動が失われたため、以前に公開されたｃｆＤＮＡＷＧＢＳにおいて、明らかに異なっていた（図１０Ａ）。以前のｃｆＤＮＡＷＧＳと一致して、結果は、がん患者が、非がん対照と比較して、１５０ｂｐ未満のｃｆＤＮＡ断片のより高い頻度を有することを示し（クラスカル・ウォリス検定、ＨＣＣ：Ｐ値６．８７１ｅ－０６、ＰＤＡＣ：Ｐ値０．００６７３１）、より低い割合の３１０～５００ｂｐの長い断片を有することを示し（クラスカル・ウォリス検定、ＨＣＣ：Ｐ値２．６２７ｅ－０７、ＰＤＡＣ：Ｐ値１．２６３ｅ－０６）（図３Ｄ）、ｃｆＴＡＰＳにおけるｃｆＤＮＡ断片化情報の忠実な保存を更に確認する。

【0194】

次いで、ｃｆＴＡＰＳを使用したｃｆＤＮＡ断片化プロファイルの特性決定のための新しいアプローチを開発した。手短に言えば、ｃｆＤＮＡ断片化分布を１０ｂｐのビンに分割し、各１０ｂｐのビンにおける断片の割合を計算した（図３Ｃ）。１０ｂｐのビン中のｃｆＤＮＡの長い断片（３００～５００ｂｐ）の長さの割合が、ＰＣＡによる教師なし分析において、ＰＤＡＣ及びＨＣＣを対照から分離した（図３Ｅ）。結果は更に、このｃｆＤＮＡ断片化シグネチャを使用して、高い正確さで、ＨＣＣ及びＰＤＡＣを非がん対照から区別することができることを示した（ＨＣＣＡＵＣ＝０．９２、ＰＤＡＣＡＵＣ＝０．８４）（図１０Ｂ、１０Ｃ、１０Ｅ、及び１０Ｆ）。しかしながら、このアプローチは、メチル化に基づく分類子と比較して、がんを肝硬変及び膵炎から区別することが、あまり正確ではなく（図１０Ｄ及び１０Ｇ）、断片化情報が、がん特異的でないことを示唆している。
実施例６
ｃｆＴＡＰＳによる複数がん検出。次いで、複数がん検出のためのｃｆＴＡＰＳの有用性を調べるための実験を実施した。各ペアワイズ比較の上位５のＤＭＲ（ＨＣＣに対する非がん対照、ＰＤＡＣに対する非がん対照、ＰＤＡＣに対するＨＣＣ）を、複数がんの差次的メチル化モデルの特徴として選択した。血液試料が各群に由来するそれぞれの確率を推定するために、サポートベクターマシン（ＳＶＭ）モデルを訓練した。同様のモデルを、組織寄与及び断片化プロファイルを使用して構築した。ＬＯＯ交差検証を使用して、メチル化モデルが、０．７７の全体的な正確さを達成することができるという結果が示され、これは、組織寄与モデル及び断片化プロファイルモデルを上回る（それぞれの正確さは０．６２及び０．４６、図４Ａ、図１１Ａ）。

【0195】

複数がん予測モデルを更に強化するために、差次的なメチル化、組織寄与及び断片化プロファイルを組み合わせたマルチモーダル分類子を構築した（図４Ｂ）。この統合モデルは、３つのモダリティにわたって平均化されたスコアをとり、各試料について最も信頼性の高い予測を使用した。組み合わせたモデルの全体的な正確さは、０．８６であり（７４のうちの６４が正しく分類された）、対照を任意のがん型から区別するための正確さは、０．９２であり（図４Ｃ）、がん型予測のためにマルチモーダル情報を組み込むことの利点を強調している。最後に、複数がん予測に使用されるＤＭＲを探索した（図１１Ｂ、ＨＣＣ、ＰＤＡＣ、及び対照予測に使用されるメチル化特徴に関連するデータは、本開示に含まれないが、要求に応じて利用可能にすることができる）。興味深いことに、これらの領域の近くの遺伝子が、Ｎｏｔｃｈ及びＷｎｔシグナル伝達、ならびにＥＧＦＲ（ＥｒｂＢ）シグナル伝達において濃縮されており、これらの潜在的な複数がんバイオマーカーに生物学的サポートを提供するという結果が示された（図１１Ｃ）。

【図面の簡単な説明】

【0196】

【図1】ＴＡＰＳによるｃｆＤＮＡ分析。（Ａ）ｃｆＤＮＡ分析のためのＴＡＰＳアプローチの概略図。ｃｆＤＮＡは、１～３ｍＬの血漿から単離される。１０ｎｇのｃｆＤＮＡを、Ｉｌｌｕｍｉｎａ配列決定アダプターにライゲーションし、１００ｎｇのキャリアＤＮＡでいっぱいに満たす。その後、ＤＮＡ中の５ｍＣ及び５ｈｍＣを、ｍＴｅｔ１ＣＤ酵素によって５ｃａＣへと酸化し、ＰｙＢｒによってＤＨＵへと還元し、増幅し、最終的な配列決定において、Ｔとして検出される。ＴＡＰＳデータの計算分析は、ＤＮＡメチル化、起源の組織、断片化パターン及びＣＮＶを含む複数のｃｆＤＮＡ特徴の同時特性決定を可能にする。（Ｂ）８７個のｃｆＤＮＡＴＡＰＳライブラリにおける総リード、一意にマッピングされたリード及び一意にマッピングされたＰＣＲ重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。（Ｃ）既知の位置に修飾または非修飾シトシンを有するスパイクイン対照に基づく、８５個のｃｆＤＮＡＴＡＰＳライブラリにおける５ｍＣの変換率及び擬陽性率。各々の点は、個々の試料を表す。

【図2A】臨床試料におけるｃｆＤＮＡメチル化。本試験に含まれる２１名のＨＣＣ患者及び２３名のＰＤＡＣ患者のがんステージ分布。

【図2B】臨床試料におけるｃｆＤＮＡメチル化。非がん対照、ＨＣＣ及びＰＤＡＣｃｆＤＮＡにおけるＣｐＧゲノム修飾レベル当たりの平均。各々の点は、個々の試料を表す。

【図2C】臨床試料におけるｃｆＤＮＡメチル化。非がん対照及びＨＣＣにおける、１ｋｂゲノムウィンドウにおけるｃｆＤＮＡメチル化のＰＣＡプロット。

【図2D】臨床試料におけるｃｆＤＮＡメチル化。非がん対照及びＰＤＡＣにおける、１ｋｂゲノムウィンドウにおけるｃｆＤＮＡメチル化のＰＣＡプロット。

【図2E】臨床試料におけるｃｆＤＮＡメチル化。領域に対する過剰発現分析は、調節領域においてＨＣＣについてＰＣ２、及びＰＤＡＣについてＰＣ１と最も相関していた。

【図2F】臨床試料におけるｃｆＤＮＡメチル化。ＨＣＣ及び非がん対照における差次的にメチル化されたエンハンサーに基づくモデル分類性能の受信者操作特徴（ＲＯＣ）曲線（ｎ＝５１、ＨＣＣ＝２１、非がん対照＝３０）。

【図2G】臨床試料におけるｃｆＤＮＡメチル化。ＨＣＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＨＣＣとして予測した。

【図2H】臨床試料におけるｃｆＤＮＡメチル化。ＰＤＡＣと非がん対照との間の差次的にメチル化されたエンハンサーに基づくモデル分類性能のＲＯＣ曲線（ｎ＝５３、ＰＤＡＣ＝２３、非がん対照＝３０）。

【図2I】臨床試料におけるｃｆＤＮＡメチル化。ＰＤＡＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＰＤＡＣとして予測した。

【図3】ｃｆＴＡＰＳは、ｃｆＤＮＡにおける起源の組織及び断片化パターンの分析を可能にする。（Ａ）ＮＮＬＳによって推定される非がん個体における平均組織寄与。１．５％未満の組織寄与は、「その他」としてまとめられている。（Ｂ）非がん、ＨＣＣ及びＰＤＡＣ群内の推定肝臓癌寄与を示すボックスプロット。統計的有意性を、対応ありｔ検定により評価した。ｎ．ｓ．－有意でない。（Ｃ）３つの群におけるｃｆＤＮＡ断片の長さ分布。各試料について、長いｃｆＤＮＡ断片（３００～５００ｂｐ）の１０塩基対間隔における割合（Ｐ）を、ＰＣＡ分析及び機械学習のための断片化特徴として使用した。（Ｄ）非がん対照、ＰＤＡＣ、及びＨＣＣにおける短い（７０～１５０ｂｐ）及び長い（３００～５００ｂｐ）断片の割合を示すボックスプロット。クラスカル・ウォリス検定を実施して、群間の断片サイズ分布の差を検定した。統計的に有意な差は、アスタリスクが付けられる（＊Ｐ値＜０．０５、＊＊Ｐ値＜０．０１、＊＊＊Ｐ値＜０．００１、＊＊＊＊Ｐ値＜０．０００１）。（Ｅ）非がん対照及びＨＣＣ（左パネル）、ならびに非がん対照及びＰＤＡＣ（右パネル）におけるｃｆＤＮＡ１０ｂｐ断片の割合のＰＣＡプロット。

【図4】ｃｆＴＡＰＳからのマルチモーダル特徴を統合することで、複数がん検出を強化する。（Ａ）複数がん予測に対する個々のモデルの性能、及び各患者について予測された確率を示すヒートマップ。各々の垂直列は、患者である。検出のはい／いいえは、特定の特徴に基づいて患者が正しく分類されるか、または誤って分類されることを意味する。予測スコアは、特定の特徴に基づいて患者を特定の群に分類する確率を意味する。（Ｂ）複数がん予測のために、ｃｆＴＡＰＳデータから抽出された複数の特徴（ＤＮＡメチル化、組織寄与及び断片化の割合）を統合する方法を詳述する概略図。（Ｃ）ＬＯＯ交差検証で計算された実際の患者のステータス及び予測患者ステータス。

【図5】ｃｆＤＮＡＴＡＰＳ。（Ａ）増幅後のクリーンアップの後の１０種類の代表的なｃｆＤＮＡＴＡＰＳライブラリのアガロースゲル。全てのｃｆＤＮＡＴＡＰＳライブラリを、１０ｎｇのｃｆＤＮＡから調製し、７回のＰＣＲサイクルで増幅させた。（Ｂ）８７個のｃｆＤＮＡＴＡＰＳライブラリ中のｈｇ３８、スパイクイン、及びキャリアＤＮＡについてマッピングされたリード対の数。全リード対と比較した、マッピングされたリード対の平均割合が、棒グラフの上に示されている。エラーバーは、標準誤差を表す。（Ｃ）ｃｆＤＮＡＷＧＢＳ（ＥＧＡＤ００００１００４３１７）（２４）における総リード、一意にマッピングされたリード及び一意にマッピングされたＰＣＲ重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。（Ｄ）低深度２．６×に配列決定された同じｃｆＤＮＡ試料から調製されたｃｆＤＮＡＴＡＰＳライブラリの技術的反復間の相関関係。メチル化を１００ｋｂウィンドウで計算した。

【図6A】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ｃｆＴＡＰＳコホートに含まれる膵炎、肝硬変、ＰＤＡＣ、ＨＣＣ及び非がん対照患者の年齢及び性別の分布。

【図6B】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照、ＨＣＣ及びＰＤＡＣにおける、ｃｆＤＮＡにおけるＣｐＧ修飾のゲノムワイド分布。バープロットは、各群についての平均ＣｐＧ修飾の分布を示す。オーバーレイラインプロットは、各患者におけるＣｐＧメチル化分布を示す。

【図6C】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＨＣＣ患者における平均ｃｆＤＮＡＣｐＧ修飾レベルと腫瘍サイズ（ｍｍ）との相関プロット。

【図6D】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＨＣＣ患者における平均ｃｆＤＮＡＣｐＧ修飾レベルと腫瘍ステージとの相関プロット。

【図6E】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＰＤＡＣ患者についての腫瘍サイズ（ｍｍ）の相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの９５％信頼区間を表す。ピアソン相関係数（ｃｏｒ）及びＰ値がプロットに示されている。

【図6F】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。ＰＤＡＣ患者についての腫瘍ステージの相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの９５％信頼区間を表す。ピアソン相関係数（ｃｏｒ）及びＰ値がプロットに示されている。

【図6G】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照、ＨＣＣ及びＰＤＡＣのｃｆＤＮＡにおける染色体４上のＣｐＧ修飾レベルの分布。各線は個々の患者を表す。平均ＣｐＧ修飾値を、染色体４に沿って１Ｍｂウィンドウごとに計算し、ガウス平滑化した（平滑化ウィンドウサイズ１０）。

【図6H】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照、ＨＣＣ及びＰＤＡＣにおける、１Ｍｂゲノムウィンドウにおけるメチル化分散。

【図6I】がん及び対照における全般的なｃｆＤＮＡメチル化パターン。非がん対照及びＨＣＣ、非がん対象及びＰＤＡＣにおける、１ｋｂのゲノムウィンドウにおけるｃｆＤＮＡメチル化のＰＣＡプロット（クローン病及び大腸炎は、それぞれ緑色及び黄色の着色されている）。

【図7A】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＬＯＯモデルの訓練及び検証アプローチの概要。試料の総数は、ｎとラベル付けされている。各々の繰り返しにおいて、モデル訓練セットは、ｎ－１個の試料からなる。差次的にメチル化されたエンハンサー（ＨＣＣの場合）またはプロモーター（ＰＤＡＣの場合）を、モデル構築のために選択した。予測モデルを、各フォールドにおけるホールドアウト試験試料について評価した。肝硬変及び膵炎試料は、ＤＭＲ特定及びモデル構築には含まれなかった。

【図7B】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。肝硬変試料のＨＣＣがん予測スコア。各青色の点は、個々のＬＯＯモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。

【図7C】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＮＣＩ－ＮａｔｕｒｅＰａｔｈｗａｙＩｎｔｅｒａｃｔｉｏｎに対するＥｎｒｉｃｈｒを使用した、ＨＣＣｃｆＤＮＡに基づく差次的にメチル化されたエンハンサーに関連する、遺伝子の遺伝子オントロジー分析（Ｐ値＜０．００２）。Ｐ値に基づいて選択された上位１０のカテゴリが、グラフに示される。遺伝子－エンハンサー相互作用を、ＧｅｎｅＨａｎｃｅｒ参照データベースを使用して割り当てた。

【図7D】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＤＬＣ１遺伝子についてのＨＣＣｃｆＤＮＡにおける代表的な差次的にメチル化されたエンハンサーのメチル化（両側ｔ検定のＰ値＝８．７６５ｅ－０６）。

【図7E】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。膵炎試料のＰＤＡＣがん予測スコア。各黄色の点は、個々のＬＯＯモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＰＤＡＣとして予測した。

【図7F】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＮＣＩ－ＮａｔｕｒｅＰａｔｈｗａｙＩｎｔｅｒａｃｔｉｏｎに対するＥｎｒｉｃｈｒを使用した、ＰＤＡＣｃｆＤＮＡに基づく差次的にメチル化されたプロモーターに最も近い遺伝子の遺伝子オントロジー分析（Ｐ値＜０．００２）。Ｐ値に基づいて選択された上位１０のカテゴリが、グラフ上に示される。

【図7G】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ＲＢ１遺伝子についてのＰＤＡＣｃｆＤＮＡにおける代表的な差次的にメチル化されたプロモーターのメチル化（両側ｔ検定のＰ値＝０．００１７）。

【図7H】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。独立したｃｆＤＮＡＷＧＢＳデータセット（ＥＧＡＤ００００１００４３１７）のＨＣＣがん予測スコア。各点は、個々のＬＯＯモデルの予測スコアを表す。灰色の点は、非がん対照に属し、赤色の点は、ＨＣＣに属する。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。

【図7I】ｃｆＤＮＡＤＭＲに基づくＨＣＣ及びＰＤＡＣ予測。ダウンサンプリングされたリードにおいて検出され得るｒｅｆＤＭＲの割合。元のＬＯＯモデル訓練で特定されたＤＭＲを、ｒｅｆＤＭＲとして処理した。

【図8A】ｃｆＤＮＡの起源の組織。参照組織メチル化アトラスのｔ－ＳＮＥプロット。

【図8B】ｃｆＤＮＡの起源の組織。ＨＣＣ及びＰＤＡＣ個体における平均組織寄与。

【図8C】ｃｆＤＮＡの起源の組織。非がん、ＨＣＣ及びＰＤＡＣｃｆＤＮＡ試料における推定Ｔ細胞寄与を示すボックスプロット。

【図8D】ｃｆＤＮＡの起源の組織。非がんに対してＨＣＣを分類するために組織寄与を使用したモデル性能のＲＯＣ曲線。

【図8E】ｃｆＤＮＡの起源の組織。組織寄与に対して訓練された分類子を使用した、ＨＣＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＨＣＣとして予測した。

【図8F】ｃｆＤＮＡの起源の組織。ＨＣＣ対非がん分類子を使用した肝硬変試料のがんスコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。

【図8G】ｃｆＤＮＡの起源の組織。対照に対してＰＤＡＣを分類するために組織寄与を使用したモデル性能のＲＯＣ曲線。

【図8H】ｃｆＤＮＡの起源の組織。組織寄与に基づいて構築された分類子を使用した、ＰＤＡＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＰＤＡＣとして予測した。

【図8I】ｃｆＤＮＡの起源の組織。ＰＤＡＣ対非がん分類子を使用した膵炎試料のＰＤＡＣがんスコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、ＰＤＡＣとして予測した。

【図9A】ｃｆＤＮＡにおけるＣＮＶ分析。１００ｋｂのビンにおけるｃｆＤＮＡからのＣＮＶ推定ヒートマップ。

【図9B】ｃｆＤＮＡにおけるＣＮＶ分析。５００ｋより大きなＣＮＶを有するｃｆＤＮＡ試料。

【図10】がん予測のためのｃｆＤＮＡ断片化パターン。（Ａ）公的な全ゲノム亜硫酸水素塩配列決定データにおけるｃｆＤＮＡの断片サイズ分布。特定の長さの断片の数を断片の総数で割り算することによって、頻度を計算した。（Ｂ）１０ｂｐのビンにおける長いｃｆＤＮＡ断片（３００～５００ｂｐ）の割合を特徴として使用する、一般化された線形モデルからのＨＣＣ及び非がん対照予測スコアのＲＯＣ曲線。（Ｃ）ＬＯＯ交差検証を使用して訓練された分類子におけるＨＣＣ及び非がん対照のがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＨＣＣとして予測した。（Ｄ）これらの分類子における肝硬変試料のＨＣＣがん予測スコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、ＨＣＣとして予測した。（Ｅ）１０ｂｐのビンにおける長いｃｆＤＮＡ断片（３００～５００ｂｐ）の割合を特徴として使用する、一般化された線形モデルからのＰＤＡＣ及び非がん対照予測スコアのＲＯＣ曲線。（Ｆ）１０ｂｐの長さ範囲におけるｃｆＤＮＡ断片頻度に基づいて構築された分類子におけるＰＤＡＣ及び非がん対照のＬＯＯがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、ＰＤＡＣとして予測した。（Ｇ）１０ｂｐの長さ範囲におけるｃｆＤＮＡ断片頻度に基づいて構築された分類子における膵炎試料のＰＤＡＣがん予測スコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、ＰＤＡＣとして予測した。

【図11A】ｃｆＴＡＰＳによる複数がん検出。３クラス分類におけるメチル化、組織寄与及び断片化の割合モデルの性能。上のパネルは、各分類子の正確さを示し、下のパネルは、ＬＯＯ交差検証分析における実際の患者ステータスと予測患者ステータスを示す。

【図11B】ｃｆＴＡＰＳによる複数がん検出。がん型予測に使用される選択されたゲノム領域のメチル化ステータスを示すヒートマップ。

【図11C】ｃｆＴＡＰＳによる複数がん検出。３クラス分類のための選択されたＤＭＲの最も近い遺伝子に対するＮＣＩ－ＮａｔｕｒｅＰａｔｈｗａｙＩｎｔｅｒａｃｔｉｏｎに対するＥｎｒｉｃｈｒを使用した遺伝子オントロジー分析。

【図12】ＴＡＰＳの前及び後の標的配列中のＣからＴへのＳＮＰ及びメチル化シトシンに由来する異なるパターンの概略図である。図では、ＯＴは元の上部を意味し、ＯＢは元の下部を意味し、ＣＴＯＴは元の上部に対して相補的であることを意味し、ＣＴＯＢは元の下部に対して相補的であることを意味する。

【図1】