(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-08-06
(54)【発明の名称】無細胞DNAのためのTET支援ピリジンボラン配列決定に関する組成物及び方法
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240730BHJP
C12Q 1/6809 20180101ALI20240730BHJP
C12Q 1/04 20060101ALI20240730BHJP
【FI】
C12Q1/6869 Z ZNA
C12Q1/6809 Z
C12Q1/04
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024505327
(86)(22)【出願日】2022-07-26
(85)【翻訳文提出日】2024-03-18
(86)【国際出願番号】 IB2022000420
(87)【国際公開番号】W WO2023007241
(87)【国際公開日】2023-02-02
(32)【優先日】2021-07-27
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】511301083
【氏名又は名称】ザ チャンセラー,マスターズ アンド スカラーズ オブ ザ ユニバーシティ オブ オックスフォード
(74)【代理人】
【識別番号】110000338
【氏名又は名称】弁理士法人 HARAKENZO WORLD PATENT & TRADEMARK
(72)【発明者】
【氏名】ソン,チュンシャオ
(72)【発明者】
【氏名】シエイカ-ジエリンスカ,パウリナ
(72)【発明者】
【氏名】チェン,ジンフェイ
(72)【発明者】
【氏名】ジャクソン,フェリックス
(72)【発明者】
【氏名】リウ,イビン
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA19
4B063QQ03
4B063QQ42
4B063QR32
4B063QR72
4B063QX02
(57)【要約】
本開示は、TET支援ピリジンボラン配列決定(TAPS)に関する組成物及び方法を提供する。具体的には、本開示は、高品質及び高深度の全ゲノム無細胞メチロームを提供する、cfDNAに最適化されたTAPS(cfTAPS)を提供する。本明細書に提供される組成物及び方法は、疾患の診断及び治療のためのDNAメチル化、起源の組織、及びDNA断片化を含む、cfDNA特徴に関するマルチモーダル情報の取得を容易にする。
【特許請求の範囲】
【請求項1】
メチル化シグネチャを得る方法であって、
試料から無細胞DNA(cfDNA)を単離することと、
前記cfDNAを含む配列決定ライブラリを調製することと、
前記配列決定ライブラリに対してTET支援ピリジンボラン配列決定(TAPS)を実施して、前記cfDNAの全ゲノムメチル化シグネチャを得ることと、を含む、前記方法。
【請求項2】
前記TAPSから得られる一意のマッピングレートが少なくとも80%であり、及び/または一意の重複除去されたマッピングレートが少なくとも70%である、請求項1に記載の方法。
【請求項3】
前記配列決定ライブラリを調製することが、前記単離されたcfDNAに配列決定アダプターをライゲーションすることを含む、請求項1または2に記載の方法。
【請求項4】
キャリアDNAが、前記TAPSを実施する前に、前記配列決定ライブラリに追加される、請求項1~3のいずれか1項に記載の方法。
【請求項5】
前記cfDNAの前記全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、前記メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む、請求項1~4のいずれか1項に記載の方法。
【請求項6】
前記メチル化バイオマーカーが、差次メチル化領域(DMR)を含む、請求項5に記載の方法。
【請求項7】
参照DMRと比較して、前記DMRに基づいて前記試料を分類することを更に含む、請求項6に記載の方法。
【請求項8】
前記参照DMRが、非がん性対照、またはがん性対照に対応する、請求項7に記載の方法。
【請求項9】
前記cfDNAの前記全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、前記メチル化バイオマーカーに対応する起源の組織を決定することと、を更に含む、請求項1~4のいずれか1項に記載の方法。
【請求項10】
前記起源の組織のバイオマーカーに基づいて前記試料を分類することを更に含む、請求項9に記載の方法。
【請求項11】
DNA断片化プロファイルを特定することと、前記断片化プロファイルが、がんの指標であるかどうかを決定することと、を更に含む、請求項1~4のいずれか1項に記載の方法。
【請求項12】
前記cfDNAからの少なくとも1つの配列バリアントを特定することと、前記配列バリアントが、がんの指標であるかどうかを決定することと、を更に含む、請求項1~4のいずれか1項に記載の方法。
【請求項13】
前記配列決定ライブラリに対して前記TAPSを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記cfDNA中の5mC修飾を特定することと、前記5mC修飾の頻度の定量的尺度を提供することと、を含む、請求項1~12のいずれか1項に記載の方法。
【請求項14】
前記配列決定ライブラリに対して前記TAPSを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記cfDNA中の5hmC修飾を特定することと、前記5hmC修飾の頻度の定量的尺度を提供することと、を含む、請求項1~12のいずれか1項に記載の方法。
【請求項15】
前記配列決定ライブラリに対して前記TAPSを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記cfDNA中の5caC修飾を特定することと、前記5caC修飾の頻度の定量的尺度を提供することと、を含む、請求項1~12のいずれか1項に記載の方法。
【請求項16】
前記配列決定ライブラリに対して前記TAPSを実施して、前記全ゲノムメチル化シグネチャを得ることが、前記cfDNA中の5fC修飾を特定することと、前記5fC修飾の頻度の定量的尺度を提供することと、を含む、請求項1~12のいずれか1項に記載の方法。
【請求項17】
請求項1~16のいずれか1項に記載の方法を使用して、対象が、がんを有するかどうかを決定する、方法。
【請求項18】
前記がんが、肝細胞癌(HCC)または膵管腺癌(PDAC)を含む、請求項17に記載の方法。
【請求項19】
請求項1~16のいずれか1項に記載の方法を使用して、対象が、早期がんを有するかどうかを決定する、方法。
【請求項20】
前記早期がんが、早期肝細胞癌(HCC)または早期膵管腺癌(PDAC)を含む、請求項19に記載の方法。
【請求項21】
患者試料中のcfDNAを分析するマルチモーダル方法であって、
前記患者試料から前記cfDNAを単離することと、
前記試料中の5mC及び/または5hmC残基をDHU残基に変換して、修飾cfDNA試料を提供することと、
前記修飾cfDNA試料を配列決定して、前記試料中のメチル化領域を特定することであって、非修飾参照cfDNAと比較して、前記修飾cfDNA試料中のシトシン(C)からチミン(T)への移行、またはシトシン(C)からDHUへの移行が、前記cfDNA中の5mCまたは5hmCのいずれかの位置を提供する、前記メチル化領域を特定することと、
a)前記修飾cfDNA試料における1つ以上の標的のコピー数変動を決定すること、
b)前記修飾cfDNA試料における起源の組織または1つ以上の標的を決定すること、
c)前記修飾cfDNA試料の断片化プロファイルを決定すること、及び
d)前記修飾cfDNA試料において1つ以上の単一ヌクレオチド変異を特定すること、からなる群から選択される前記修飾cfDNAに対する1つ以上の追加の分析ステップを実施することと、を含む、前記マルチモーダル方法。
【請求項22】
前記修飾cfDNA試料を配列決定して、前記試料中のメチル化領域を特定するステップが、少なくとも1つの差次メチル化領域(DMR)を特定することを含む、請求項21に記載の方法。
【請求項23】
参照DMRと比較して、前記DMRに基づいて前記試料を分類することを更に含む、請求項22に記載の方法。
【請求項24】
前記参照DMRが、非がん性対照、またはがん性対照に対応する、請求項23に記載の方法。
【請求項25】
前記修飾cfDNA試料における1つ以上の標的のコピー数変動(CNV)を決定する前記ステップが、参照ゲノムをビンに分割し、各ビンにおけるリードの数をカウントすることによって、前記ゲノムにわたる標的配列について観察されたリードカウントを決定することを含む、請求項21に記載の方法。
【請求項26】
500kbより大きいコピー数異常の存在が、患者におけるCNVの指標である、請求項25に記載の方法。
【請求項27】
前記修飾cfDNA試料における前記起源の組織または1つ以上の標的を決定する前記ステップが、前記修飾cfDNA試料の配列決定から得られたデータの組織デコンボリューションを含む、請求項21に記載の方法。
【請求項28】
前記組織デコンボリューションが、前記修飾cfDNA試料において特定されたDNAメチル化値を、2つ以上の異なる組織からの参照DMRと比較することを含む、請求項27に記載の方法。
【請求項29】
前記修飾cfDNA試料の前記断片化プロファイルを決定する前記ステップが、前記修飾cfDNA試料における断片長さ及び断片の周期性を分類することを含む、請求項21に記載の方法。
【請求項30】
前記修飾cfDNA試料における前記断片長さ及び前記断片の周期性を分類することが、10bpの長さ範囲のビンにおける300~500bpのcfDNA断片の割合を計算することを更に含む、請求項28に記載の方法。
【請求項31】
前記修飾cfDNA試料において1つ以上の単一ヌクレオチド変異を特定する前記ステップが、TAPS後の配列決定結果を比較することによって、前記cfDNA中の特定の位置における5mCまたは5hmCからのCからTへのSNPを区別することを更に含み、前記cfDNAの元の下部鎖に対する相補体中の前記特定の位置におけるTリードの存在が、CからTへのSNPの指標であり、前記cfDNAの前記元の下部鎖に対する相補体中の前記特定の位置におけるCリードの存在が、5mCまたは5hmCの指標である、請求項21に記載の方法。
【請求項32】
ステップa、b、c及びdのうちの2つ以上が、前記修飾cfDNAに対して実施される、請求項21~31のいずれか1項に記載の方法。
【請求項33】
ステップa、b、c及びdのうちの3つ以上が、前記修飾cfDNAに対して実施される、請求項21~31のいずれか1項に記載の方法。
【請求項34】
ステップa、b、c及びdの全てが、前記修飾cfDNAに対して実施される、請求項21~31のいずれか1項に記載の方法。
【請求項35】
前記配列決定するステップから得られる一意のマッピングレートが、少なくとも80%であり、及び/または一意の重複除去されたマッピングレートが、少なくとも70%である、請求項21~34のいずれか1項に記載の方法。
【請求項36】
前記配列決定するステップが、前記単離されたcfDNAに配列決定アダプターをライゲーションすることによる、前記cfDNAを含む配列決定ライブラリを調製することを更に含む、請求項21~35のいずれか1項に記載の方法。
【請求項37】
キャリアDNAが、前記cfDNAに追加される、請求項21~36のいずれか1項に記載の方法。
【請求項38】
cfDNA全ゲノムメチル化シグネチャを提供し、前記cfDNA全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、前記メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む、請求項21~37のいずれか1項に記載の方法。
【請求項39】
前記cfDNA中の5mC修飾を特定することと、前記5mC修飾の頻度の定量的尺度を提供することと、を更に含む、請求項21~38のいずれか1項に記載の方法。
【請求項40】
前記cfDNA中の5hmC修飾を特定することと、前記5hmC修飾の頻度の定量的尺度を提供することと、を更に含む、請求項21~39のいずれか1項に記載の方法。
【請求項41】
前記cfDNA中の5caC修飾を特定することと、前記5caC修飾の頻度の定量的尺度を提供することと、を更に含む、請求項21~40のいずれか1項に記載の方法。
【請求項42】
前記cfDNA中の5fC修飾を特定することと、前記5fC修飾の頻度の定量的尺度を提供することと、を更に含む、請求項21~41のいずれか1項に記載の方法。
【請求項43】
前記試料中の5mC及び/または5hmC残基をDHU残基に変換して、修飾cfDNA試料を提供するステップが、5mC及び/または5hmC残基を酸化して5caC及び/または5fC残基を提供することと、前記5caC及び/または前記5fC残基をDHU残基へと還元することと、を含む、請求項21~42のいずれか1項に記載の方法。
【請求項44】
5mC及び/または5hmC残基を酸化して5caC及び/または5fC残基を提供する前記ステップが、Tet酵素による前記試料の処理を含む、請求項43に記載の方法。
【請求項45】
5mC及び/または5hmC残基を酸化して5caC及び/または5fC残基を提供する前記ステップが、1つ以上の5fC残基が生成されるような化学酸化剤による前記試料の処理を含む、請求項43に記載の方法。
【請求項46】
前記5caC及び/または5fC残基をDHU残基へと還元する前記ステップが、ボラン還元剤による前記試料の処理を含む、請求項43~45のいずれか1項に記載の方法。
【請求項47】
請求項21~46のいずれか1項に記載の方法を使用して、対象が、がんを有するかどうかを決定する、方法。
【発明の詳細な説明】
【発明の詳細な説明】
【0001】
〔技術分野〕
関連出願の相互参照
本出願は、2021年7月27日に出願された米国仮出願第63/203,565号の利益を主張し、その内容はその全体が参照により本明細書に組み込まれる。
【0002】
電子配列表の内容(sequencelisting.xml、サイズ:8,000バイト、及び作成日:2022年7月26日)は、その全体が参照により本明細書に組み込まれる。
【0003】
本開示は、TET支援ピリジンボラン配列決定(TAPS)に関する組成物及び方法を提供する。具体的には、本開示は、高品質及び高深度の全ゲノム無細胞メチロームを提供する、cfDNAに最適化されたTAPS(cfTAPS)を提供する。本明細書に提供される組成物及び方法は、疾患の診断及び治療のためのDNAメチル化、起源の組織、及びDNA断片化を含む、cfDNA特徴に関するマルチモーダル情報の取得を容易にする。
〔背景技術〕
がん研究の最近の進歩は、がんを治療するための新しい方法を提供するが、早期発見は、依然としてがんを治癒するための最良の機会を表している。早期治療は、患者の生存率を大幅に改善するだけでなく、コストを大幅に削減する。循環無細胞DNA(cfDNA)は、様々な健康な組織及び疾患組織における細胞死に由来する血漿中の自由に浮遊するDNAであり、早期がん検出アッセイを開発するための素晴らしい可能性を有している。変異及びコピー数変動(CNV)などのcfDNAにおける遺伝子情報は、がんの進行及び治療を監視するための潜在的な有用性を示す。しかしながら、早期疾患における低い割合の腫瘍DNAを考慮すると、遺伝的変化を検出することは困難である。更に、遺伝的変化は、悪性腫瘍の位置を決定するために必要とされる、起源の組織についての有益性が弱い。
【0004】
対照的に、がん細胞及び腫瘍微小環境の両方のDNAメチル化などの広範なエピジェネティックな変化は、腫瘍発生の早期に生じる。最近の研究では、検出限界を克服するために組み合わせることができる何千ものメチル化変化と、高い信頼性でがんの局在化を可能にする起源の組織の情報とを提供することによって、cfDNAメチル化が早期がん検出のための最も有望なバイオマーカーの1つであることが示されている。DNAメチル化は、全ゲノム、塩基解像度、及び亜硫酸水素塩配列決定などの定量的配列決定法によって最適に決定される。しかしながら、亜硫酸水素塩配列決定は、DNAを損傷し、高価である。したがって、現在のcfDNAメチル化配列決定は、低深度、標的化、または低解像度であり、定性的な濃縮ベースの配列決定であることによって限定され、したがって、cfDNAメチロームを不完全に捕捉する。
〔発明の概要〕
本開示の実施形態は、メチル化シグネチャを得る方法を含む。これらの実施形態によれば、本方法は、試料から無細胞DNA(cfDNA)を単離することと、cfDNAを含む配列決定ライブラリを調製することと、配列決定ライブラリに対してTET支援ピリジンボラン配列決定(TAPS)を実施して、cfDNAのメチル化シグネチャを得ることと、を含む。いくつかの実施形態において、メチル化シグネチャは、全ゲノムメチル化シグネチャである。
【0005】
いくつかの実施形態において、cfDNAに対してTAPSから得られる一意のマッピングレートは、少なくとも80%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも70%である。
【0006】
いくつかの実施形態において、配列決定ライブラリを調製することは、単離されたcfDNAに配列決定アダプターをライゲーションすることを含む。
【0007】
いくつかの実施形態において、キャリアDNAは、TAPSを実施する前に、配列決定ライブラリに追加される。
【0008】
いくつかの実施形態において、本方法は、cfDNA全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む。
【0009】
いくつかの実施形態において、メチル化バイオマーカーは、差次メチル化領域(DMR)を含む。
【0010】
いくつかの実施形態において、本方法は、参照DMRと比較して、DMRに基づいて試料を分類することを更に含む。
【0011】
いくつかの実施形態において、参照DMRは、非がん性対照、またはがん性対照に対応する。
【0012】
いくつかの実施形態において、本方法は、cfDNA全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーに対応する起源の組織を決定することと、を更に含む。
【0013】
いくつかの実施形態において、本方法は、起源の組織のバイオマーカーに基づいて試料を分類することを更に含む。
【0014】
いくつかの実施形態において、本方法は、DNA断片化プロファイルを特定することと、断片化プロファイルが、がんの指標であるかどうかを決定することと、を更に含む。
【0015】
いくつかの実施形態において、本方法は、cfDNAからの少なくとも1つの配列バリアントを特定することと、配列バリアントが、がんの指標であるかどうかを決定することと、を更に含む。
【0016】
いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5mC修飾を特定することと、5mC修飾の頻度の定量的尺度を提供することと、を含む。
【0017】
いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5hmC修飾を特定することと、5hmC修飾の頻度の定量的尺度を提供することと、を含む。
【0018】
いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5caC修飾を特定することと、5caC修飾の頻度の定量的尺度を提供することと、を含む。
【0019】
いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5fC修飾を特定することと、5fC修飾の頻度の定量的尺度を提供することと、を含む。
【0020】
本開示の実施形態はまた、本明細書に記載の方法のいずれかを使用して、対象が、がんを有するかどうかを決定する方法を含む。いくつかの実施形態において、がんは、肝細胞癌(HCC)または膵管腺癌(PDAC)を含む。
【0021】
本開示の実施形態はまた、本明細書に記載の方法のいずれかを使用して、対象が、早期がんを有するかどうかを決定する方法を含む。いくつかの実施形態において、がんは、早期肝細胞癌(HCC)または早期膵管腺癌(PDAC)を含む。
【0022】
更に他の好ましい実施形態において、本発明は、患者試料中のcfDNAを分析するマルチモーダル方法であって、患者試料からcfDNAを単離することと、試料中の5mC及び/または5hmC残基をDHU残基に変換して、修飾cfDNA試料を提供することと、修飾cfDNA試料を配列決定して、試料中のメチル化領域を特定することであって、非修飾参照cfDNAと比較して、修飾cfDNA試料中のシトシン(C)からチミン(T)への移行、またはシトシン(C)からDHUへの移行が、cfDNA中の5mCまたは5hmCのいずれかの位置を提供する、配列決定することと、a)修飾cfDNA試料における1つ以上の標的のコピー数変動を決定すること、b)修飾cfDNA試料における起源の組織または1つ以上の標的を決定すること、c)修飾cfDNA試料の断片化プロファイルを決定すること、及びd)修飾cfDNA試料において1つ以上の単一ヌクレオチド変異を特定すること、からなる群から選択される修飾cfDNAに対する1つ以上の追加の分析ステップを実施することと、を含む、マルチモーダル方法を提供する。
【0023】
いくつかの実施形態において、少なくとも1つの差次メチル化領域(DMR)を特定することを含む、修飾cfDNA試料を配列決定して、試料中のメチル化領域を特定するステップ。
【0024】
いくつかの実施形態において、本マルチモーダル方法は、参照DMRと比較して、DMRに基づいて試料を分類することを更に含む。
【0025】
いくつかの実施形態において、参照DMRは、非がん性対照、またはがん性対照に対応する。
【0026】
いくつかの実施形態において、修飾cfDNA試料における1つ以上の標的のコピー数変動(CNV)を決定するステップは、参照ゲノムをビンに分割し、各ビンにおけるリードの数をカウントすることによって、ゲノムにわたる標的配列について観察されたリードカウントを決定することを含む。
【0027】
いくつかの実施形態において、500kbより大きいコピー数異常の存在は、患者におけるCNVの指標である。
【0028】
いくつかの実施形態において、修飾cfDNA試料における起源の組織または1つ以上の標的を決定するステップは、修飾cfDNA試料の配列決定から得られたデータの組織デコンボリューションを含む。
【0029】
いくつかの実施形態において、組織デコンボリューションは、修飾cfDNA試料において特定されたDNAメチル化値を、2つ以上の異なる組織からの参照DMRと比較することを含む。
【0030】
いくつかの実施形態において、修飾cfDNA試料の断片化プロファイルを決定するステップは、修飾cfDNA試料における断片長さ及び断片の周期性を分類することを含む。
【0031】
いくつかの実施形態において、修飾cfDNA試料における断片の長さ及び断片の周期性を分類することは、10bpの長さ範囲のビンにおける300~500bpのcfDNA断片の割合を計算することを更に含む。
【0032】
いくつかの実施形態において、修飾cfDNA試料において1つ以上の単一ヌクレオチド変異を特定するステップは、TAPS後の配列決定結果を比較することによって、cfDNA中の特定の位置における5mCまたは5hmCからのCからTへのSNPを区別することを更に含み、cfDNAの元の下部鎖に対する相補体中の特定の位置におけるTリードの存在は、CからTへのSNPの指標であり、cfDNAの元の下部鎖に対する相補体中の特定の位置におけるCリードの存在は、5mCまたは5hmCの指標である。
【0033】
いくつかの実施形態において、ステップa、b、c及びdのうちの2つ以上は、修飾cfDNAに対して実施される。
【0034】
いくつかの実施形態において、ステップa、b、c及びdのうちの3つ以上は、修飾cfDNAに対して実施される。
【0035】
いくつかの実施形態において、ステップa、b、c及びdの全ては、修飾cfDNAに対して実施される。
【0036】
いくつかの実施形態において、配列決定するステップから得られる一意のマッピングレートは、少なくとも80%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも70%である。
【0037】
いくつかの実施形態において、配列決定するステップは、単離されたcfDNAに配列決定アダプターをライゲーションすることによる、cfDNAを含む配列決定ライブラリを調製することを更に含む。
【0038】
いくつかの実施形態において、キャリアDNAは、cfDNAに追加される。
【0039】
いくつかの実施形態において、本マルチモーダル方法は、cfDNA全ゲノムメチル化シグネチャを提供し、本方法は、cfDNA全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む。
【0040】
いくつかの実施形態において、本マルチモーダル方法は、cfDNA中の5mC修飾を特定することと、5mC修飾の頻度の定量的尺度を提供することと、を更に含む。
【0041】
いくつかの実施形態において、本マルチモーダル方法は、cfDNA中の5hmC修飾を特定することと、5hmC修飾の頻度の定量的尺度を提供することと、を更に含む。
【0042】
いくつかの実施形態において、本マルチモーダル方法は、cfDNA中の5caC修飾を特定することと、5caC修飾の頻度の定量的尺度を提供することと、を更に含む。
【0043】
いくつかの実施形態において、本マルチモーダル方法は、cfDNA中の5fC修飾と、5fC修飾の頻度の定量的尺度を提供することと、を更に含む。
【0044】
いくつかの実施形態において、試料中の5mC及び/または5hmC残基をDHU残基に変換して、修飾cfDNA試料を提供するステップは、5mC及び/または5hmC残基を酸化して5caC及び/または5fC残基を提供することと、5caC及び/または5fC残基をDHU残基へと還元することと、を含む。
【0045】
いくつかの実施形態において、5mC及び/または5hmC残基を酸化して5caC及び/または5fC残基を提供するステップは、Tet酵素による試料の処理を含む。
【0046】
いくつかの実施形態において、5mC及び/または5hmC残基を酸化して5caC及び/または5fC残基を提供するステップは、1つ以上の5fC残基が生成されるような化学酸化剤による試料の処理を含む。
【0047】
いくつかの実施形態において、5caC及び/または5fC残基をDHU残基へと還元するステップは、ボラン還元剤による試料の処理を含む。
【0048】
本開示の実施形態はまた、本明細書に記載のマルチモーダル方法のいずれかを使用して、対象が、早期がんを有するかどうかを決定する方法を含む。
〔図面の簡単な説明〕
〔
図1〕TAPSによるcfDNA分析。(A)cfDNA分析のためのTAPSアプローチの概略図。cfDNAは、1~3mLの血漿から単離される。10ngのcfDNAを、Illumina配列決定アダプターにライゲーションし、100ngのキャリアDNAでいっぱいに満たす。その後、DNA中の5mC及び5hmCを、mTet1CD酵素によって5caCへと酸化し、PyBrによってDHUへと還元し、増幅し、最終的な配列決定において、Tとして検出される。TAPSデータの計算分析は、DNAメチル化、起源の組織、断片化パターン及びCNVを含む複数のcfDNA特徴の同時特性決定を可能にする。(B)87個のcfDNA TAPSライブラリにおける総リード、一意にマッピングされたリード及び一意にマッピングされたPCR重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。(C)既知の位置に修飾または非修飾シトシンを有するスパイクイン対照に基づく、85個のcfDNA TAPSライブラリにおける5mCの変換率及び擬陽性率。各々の点は、個々の試料を表す。
【0049】
〔
図2A〕臨床試料におけるcfDNAメチル化。本試験に含まれる21名のHCC患者及び23名のPDAC患者のがんステージ分布。
【0050】
〔
図2B〕臨床試料におけるcfDNAメチル化。非がん対照、HCC及びPDAC cfDNAにおけるCpGゲノム修飾レベル当たりの平均。各々の点は、個々の試料を表す。
【0051】
〔
図2C〕臨床試料におけるcfDNAメチル化。非がん対照及びHCCにおける、1kbゲノムウィンドウにおけるcfDNAメチル化のPCAプロット。
【0052】
〔
図2D〕臨床試料におけるcfDNAメチル化。非がん対照及びPDACにおける、1kbゲノムウィンドウにおけるcfDNAメチル化のPCAプロット。
【0053】
〔
図2E〕臨床試料におけるcfDNAメチル化。領域に対する過剰発現分析は、調節領域においてHCCについてPC2、及びPDACについてPC1と最も相関していた。
【0054】
〔
図2F〕臨床試料におけるcfDNAメチル化。HCC及び非がん対照における差次的にメチル化されたエンハンサーに基づくモデル分類性能の受信者操作特徴(ROC)曲線(n=51、HCC=21、非がん対照=30)。
【0055】
〔
図2G〕臨床試料におけるcfDNAメチル化。HCC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、HCCとして予測した。
【0056】
〔
図2H〕臨床試料におけるcfDNAメチル化。PDACと非がん対照との間の差次的にメチル化されたエンハンサーに基づくモデル分類性能のROC曲線(n=53、PDAC=23、非がん対照=30)。
【0057】
〔
図2I〕臨床試料におけるcfDNAメチル化。PDAC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、PDACとして予測した。
【0058】
〔
図3〕cfTAPSは、cfDNAにおける起源の組織及び断片化パターンの分析を可能にする。(A)NNLSによって推定される非がん個体における平均組織寄与。1.5%未満の組織寄与は、「その他」としてまとめられている。(B)非がん、HCC及びPDAC群内の推定肝臓癌寄与を示すボックスプロット。統計的有意性を、対応ありt検定により評価した。n.s.-有意でない。(C)3つの群におけるcfDNA断片の長さ分布。各試料について、長いcfDNA断片(300~500bp)の10塩基対間隔における割合(P)を、PCA分析及び機械学習のための断片化特徴として使用した。(D)非がん対照、PDAC、及びHCCにおける短い(70~150bp)及び長い(300~500bp)断片の割合を示すボックスプロット。クラスカル・ウォリス検定を実施して、群間の断片サイズ分布の差を検定した。統計的に有意な差は、アスタリスクが付けられる(*P値<0.05、**P値<0.01、***P値<0.001、****P値<0.0001)。(E)非がん対照及びHCC(左パネル)、ならびに非がん対照及びPDAC(右パネル)におけるcfDNA 10bp断片の割合のPCAプロット。
【0059】
〔
図4〕cfTAPSからのマルチモーダル特徴を統合することで、複数がん検出を強化する。(A)複数がん予測に対する個々のモデルの性能、及び各患者について予測された確率を示すヒートマップ。各々の垂直列は、患者である。検出のはい/いいえは、特定の特徴に基づいて患者が正しく分類されるか、または誤って分類されることを意味する。予測スコアは、特定の特徴に基づいて患者を特定の群に分類する確率を意味する。(B)複数がん予測のために、cfTAPSデータから抽出された複数の特徴(DNAメチル化、組織寄与及び断片化の割合)を統合する方法を詳述する概略図。(C)LOO交差検証で計算された実際の患者のステータス及び予測患者ステータス。
【0060】
〔
図5〕cfDNA TAPS。(A)増幅後のクリーンアップの後の10種類の代表的なcfDNA TAPSライブラリのアガロースゲル。全てのcfDNA TAPSライブラリを、10ngのcfDNAから調製し、7回のPCRサイクルで増幅させた。(B)87個のcfDNA TAPSライブラリ中のhg38、スパイクイン、及びキャリアDNAについてマッピングされたリード対の数。全リード対と比較した、マッピングされたリード対の平均割合が、棒グラフの上に示されている。エラーバーは、標準誤差を表す。(C)cfDNA WGBS(EGAD00001004317)(24)における総リード、一意にマッピングされたリード及び一意にマッピングされたPCR重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。(D)低深度2.6×に配列決定された同じcfDNA試料から調製されたcfDNA TAPSライブラリの技術的反復間の相関関係。メチル化を100kbウィンドウで計算した。
【0061】
〔
図6A〕がん及び対照における全般的なcfDNAメチル化パターン。cfTAPSコホートに含まれる膵炎、肝硬変、PDAC、HCC及び非がん対照患者の年齢及び性別の分布。
【0062】
〔
図6B〕がん及び対照における全般的なcfDNAメチル化パターン。非がん対照、HCC及びPDACにおける、cfDNAにおけるCpG修飾のゲノムワイド分布。バープロットは、各群についての平均CpG修飾の分布を示す。オーバーレイラインプロットは、各患者におけるCpGメチル化分布を示す。
【0063】
〔
図6C〕がん及び対照における全般的なcfDNAメチル化パターン。HCC患者における平均cfDNA CpG修飾レベルと腫瘍サイズ(mm)との相関プロット。
【0064】
〔
図6D〕がん及び対照における全般的なcfDNAメチル化パターン。HCC患者における平均cfDNA CpG修飾レベルと腫瘍ステージとの相関プロット。
【0065】
〔
図6E〕がん及び対照における全般的なcfDNAメチル化パターン。PDAC患者についての腫瘍サイズ(mm)の相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの95%信頼区間を表す。ピアソン相関係数(cor)及びP値がプロットに示されている。
【0066】
〔
図6F〕がん及び対照における全般的なcfDNAメチル化パターン。PDAC患者についての腫瘍ステージの相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの95%信頼区間を表す。ピアソン相関係数(cor)及びP値がプロットに示されている。
【0067】
〔
図6G〕がん及び対照における全般的なcfDNAメチル化パターン。非がん対照、HCC及びPDACのcfDNAにおける染色体4上のCpG修飾レベルの分布。各線は個々の患者を表す。平均CpG修飾値を、染色体4に沿って1Mbウィンドウごとに計算し、ガウス平滑化した(平滑化ウィンドウサイズ10)。
【0068】
〔
図6H〕がん及び対照における全般的なcfDNAメチル化パターン。非がん対照、HCC及びPDACにおける、1Mbゲノムウィンドウにおけるメチル化分散。
【0069】
〔
図6I〕がん及び対照における全般的なcfDNAメチル化パターン。非がん対照及びHCC、非がん対象及びPDACにおける、1kbのゲノムウィンドウにおけるcfDNAメチル化のPCAプロット(クローン病及び大腸炎は、それぞれ緑色及び黄色の着色されている)。
【0070】
〔
図7A〕cfDNA DMRに基づくHCC及びPDAC予測。LOOモデルの訓練及び検証アプローチの概要。試料の総数は、nとラベル付けされている。各々の繰り返しにおいて、モデル訓練セットは、n-1個の試料からなる。差次的にメチル化されたエンハンサー(HCCの場合)またはプロモーター(PDACの場合)を、モデル構築のために選択した。予測モデルを、各フォールドにおけるホールドアウト試験試料について評価した。肝硬変及び膵炎試料は、DMR特定及びモデル構築には含まれなかった。
【0071】
〔
図7B〕cfDNA DMRに基づくHCC及びPDAC予測。肝硬変試料のHCCがん予測スコア。各青色の点は、個々のLOOモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。
【0072】
〔
図7C〕cfDNA DMRに基づくHCC及びPDAC予測。NCI-Nature Pathway Interactionに対するEnrichrを使用した、HCC cfDNAに基づく差次的にメチル化されたエンハンサーに関連する、遺伝子の遺伝子オントロジー分析(P値<0.002)。P値に基づいて選択された上位10のカテゴリが、グラフに示される。遺伝子-エンハンサー相互作用を、GeneHancer参照データベースを使用して割り当てた。
【0073】
〔
図7D〕cfDNA DMRに基づくHCC及びPDAC予測。DLC1遺伝子についてのHCC cfDNAにおける代表的な差次的にメチル化されたエンハンサーのメチル化(両側t検定のP値=8.765e-06)。
【0074】
〔
図7E〕cfDNA DMRに基づくHCC及びPDAC予測。膵炎試料のPDACがん予測スコア。各黄色の点は、個々のLOOモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、PDACとして予測した。
【0075】
〔
図7F〕cfDNA DMRに基づくHCC及びPDAC予測。NCI-Nature Pathway Interactionに対するEnrichrを使用した、PDAC cfDNAに基づく差次的にメチル化されたプロモーターに最も近い遺伝子の遺伝子オントロジー分析(P値<0.002)。P値に基づいて選択された上位10のカテゴリが、グラフ上に示される。
【0076】
〔
図7G〕cfDNA DMRに基づくHCC及びPDAC予測。RB1遺伝子についてのPDAC cfDNAにおける代表的な差次的にメチル化されたプロモーターのメチル化(両側t検定のP値=0.0017)。
【0077】
〔
図7H〕cfDNA DMRに基づくHCC及びPDAC予測。独立したcfDNA WGBSデータセット(EGAD00001004317)のHCCがん予測スコア。各点は、個々のLOOモデルの予測スコアを表す。灰色の点は、非がん対照に属し、赤色の点は、HCCに属する。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。
【0078】
〔
図7I〕cfDNA DMRに基づくHCC及びPDAC予測。ダウンサンプリングされたリードにおいて検出され得るref DMRの割合。元のLOOモデル訓練で特定されたDMRを、ref DMRとして処理した。
【0079】
〔
図8A〕cfDNAの起源の組織。参照組織メチル化アトラスのt-SNEプロット。
【0080】
〔
図8B〕cfDNAの起源の組織。HCC及びPDAC個体における平均組織寄与。
【0081】
〔
図8C〕cfDNAの起源の組織。非がん、HCC及びPDAC cfDNA試料における推定T細胞寄与を示すボックスプロット。
【0082】
〔
図8D〕cfDNAの起源の組織。非がんに対してHCCを分類するために組織寄与を使用したモデル性能のROC曲線。
【0083】
〔
図8E〕cfDNAの起源の組織。組織寄与に対して訓練された分類子を使用した、HCC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、HCCとして予測した。
【0084】
〔
図8F〕cfDNAの起源の組織。HCC対非がん分類子を使用した肝硬変試料のがんスコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。
【0085】
〔
図8G〕cfDNAの起源の組織。対照に対してPDACを分類するために組織寄与を使用したモデル性能のROC曲線。
【0086】
〔
図8H〕cfDNAの起源の組織。組織寄与に基づいて構築された分類子を使用した、PDAC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、PDACとして予測した。
【0087】
〔
図8I〕cfDNAの起源の組織。PDAC対非がん分類子を使用した膵炎試料のPDACがんスコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、PDACとして予測した。
【0088】
〔
図9A〕cfDNAにおけるCNV分析。100kbのビンにおけるcfDNAからのCNV推定ヒートマップ。
【0089】
〔
図9B〕cfDNAにおけるCNV分析。500kより大きなCNVを有するcfDNA試料。
【0090】
〔
図10〕がん予測のためのcfDNA断片化パターン。(A)公的な全ゲノム亜硫酸水素塩配列決定データにおけるcfDNAの断片サイズ分布。特定の長さの断片の数を断片の総数で割り算することによって、頻度を計算した。(B)10bpのビンにおける長いcfDNA断片(300~500bp)の割合を特徴として使用する、一般化された線形モデルからのHCC及び非がん対照予測スコアのROC曲線。(C)LOO交差検証を使用して訓練された分類子におけるHCC及び非がん対照のがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、HCCとして予測した。(D)これらの分類子における肝硬変試料のHCCがん予測スコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。(E)10bpのビンにおける長いcfDNA断片(300~500bp)の割合を特徴として使用する、一般化された線形モデルからのPDAC及び非がん対照予測スコアのROC曲線。(F)10bpの長さ範囲におけるcfDNA断片頻度に基づいて構築された分類子におけるPDAC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、PDACとして予測した。(G)10bpの長さ範囲におけるcfDNA断片頻度に基づいて構築された分類子における膵炎試料のPDACがん予測スコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、PDACとして予測した。
【0091】
〔
図11A〕cfTAPSによる複数がん検出。3クラス分類におけるメチル化、組織寄与及び断片化の割合モデルの性能。上のパネルは、各分類子の正確さを示し、下のパネルは、LOO交差検証分析における実際の患者ステータスと予測患者ステータスを示す。
【0092】
〔
図11B〕cfTAPSによる複数がん検出。がん型予測に使用される選択されたゲノム領域のメチル化ステータスを示すヒートマップ。
【0093】
〔
図11C〕cfTAPSによる複数がん検出。3クラス分類のための選択されたDMRの最も近い遺伝子に対するNCI-Nature Pathway Interactionに対するEnrichrを使用した遺伝子オントロジー分析。
【0094】
〔
図12〕TAPSの前及び後の標的配列中のCからTへのSNP及びメチル化シトシンに由来する異なるパターンの概略図である。図では、OTは元の上部を意味し、OBは元の下部を意味し、CTOTは元の上部に対して相補的であることを意味し、CTOBは元の下部に対して相補的であることを意味する。
〔発明を実施するための形態〕
近年、2018年1月8日に出願された米国仮特許出願第62/614,798号、2018年4月20日に出願された同第62/660,523号、及び2018年11月26日に出願された同第62/771,409号(これらの各々は、参照によりその全体が本明細書に組み込まれる)に対する優先権を主張する、2019年1月8日に出願された国際PCT出願第PCT/US2019/012627号に記載されるように、亜硫酸水素塩を含まないDNAメチル化配列決定方法であるTET支援ピリジンボラン配列決定(TAPS)が開発された。TAPSは、DNAメチル化を直接検出するための穏和な化学反応の使用に基づき、配列決定コストを半減させつつ、亜硫酸水素塩配列決定と比較して、改善された配列品質、マッピングレート、及びカバレッジを示した。直接メチル化検出と、TAPSの非破壊的性質との組み合わせは、DNAメチル化分析にとってだけではなく、本明細書に更に記載されるように、cfDNAにおける同時遺伝子分析にとっても有用であり、液体生検による非侵襲的がん検出を強化することができる。本開示の実施形態は、10ngのcfDNA程度の低さから高品質かつ高深度の全ゲノムメチロームを届けるためのcfDNAに最適化されたTAPS(cfTAPS)を含む。
【0095】
本明細書に更に記載されるように、cfTAPSは、肝細胞癌(HCC)及び膵管腺癌(PDAC)のcfDNAに適用し、これら2種類のがんは、主に進行した疾患段階での検出に起因して、特に予後が不良である。PDAC及びHCCの早期検出のための非侵襲的な方法は、利用可能ではなく、この方法は、それらの後期診断に寄与する。何十年もの間、HCCの検出は、血清α-フェトプロテイン(AFP)測定と組み合わせた肝臓超音波に依存してきた。しかしながら、これらの方法は、特異性及び感度が低い。PDACを検出または診断するための血液検査は存在しない。炭水化物抗原19-9(CA19-9)は、PDACの治療及び発達を監視するために使用されるが、その感度及び特異性は低すぎて、PDACを診断またはスクリーニングすることができない。したがって、PDAC及びHCC検出のための新規アプローチが緊急に必要とされている。
【0096】
本明細書で提供される結果は、cfTAPSからの豊富な情報が、差次的なメチル化、起源の組織、及び断片化プロファイルの統合されたマルチモーダルのエピジェネティック分析及び遺伝性分析を可能にし、HCC及びPDACを有する患者からのcfDNA試料を、対照、及び前がん性炎症状態を有する患者から正確に区別することを示す。加えて、本明細書で提供される結果は、HCC、PDAC及び非がん対照からのcfDNAにおける全ゲノム塩基解像度メチロームを特性決定するためのcfTAPSの成功した最適化及び適用を示す。わずか10ngのcfDNAを使用して、cfTAPSライブラリは、以前のcfDNA WGBSと比較して、配列決定の品質及び深度を大幅に改善したことを示した。実際に、以前の研究よりも少ないcfDNAインプットを使用して、cfDNA TAPSは、これまでで最も包括的な無細胞メチル化を生成した。有益なリードのはるかに高い収率は、cfTAPSが所与の量のcfDNAからより多くの情報を抽出することを可能にし、大規模なcfDNAメチル化研究のための実行可能な選択肢にする。TAPSの使用によって、他の方法と比較して、優れた一意のマッピングレート及び重複除去された一意のマッピングレートが得られた。いくつかの実施形態において、一意のマッピングレートは、少なくとも65%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも55%である。いくつかの実施形態において、一意のマッピングレートは、少なくとも70%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも60%である。いくつかの実施形態において、一意のマッピングレートは、少なくとも75%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも65%である。いくつかの実施形態において、一意のマッピングレートは、少なくとも80%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも70%である。いくつかの実施形態において、一意のマッピングレートは、少なくとも85%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも72%である。いくつかの実施形態において、一意のマッピングレートは、少なくとも90%であり、及び/または一意の重複除去されたマッピングレートは、少なくとも75%である。
【0097】
cfTAPSによって達成されるディープシーケンシングは、早期がん検出のための無細胞メチローム及びメチル化バイオマーカーの全ゲノム発見の詳細な分析を可能にする。有意な全般的な低いメチル化は観察されず、このことは、腫瘍細胞に由来するcfDNAの割合が低いことを示唆している(本明細書に含まれるほとんどのがん患者におけるCNVの欠如によって裏付けられる)が、エンハンサー及びプロモーターなどの調節領域における局所メチル化シグナルが、HCC及びPDACを対照から正確に区別することができる、がん特異的情報を含有するという結果が示された。このことは、患者コホートで使用される炎症が濃縮された現実世界の対照群を考慮すると特に重要であり、本明細書に開示されるHCCモデルは、独立した検証として、cfDNA WGBSデータセットから全てのHCC及び対照患者を正しく特定することができる。
【0098】
早期がん検出のためのcfDNAメチル化の別の重要な利点は、起源の組織の情報を決定する能力である。現時点で利用可能な公共のWGBS組織データベースを使用して、cfTAPSデータの全ゲノム組織デコンボリューションを実施し、結果は、HCC cfDNAにおける肝臓腫瘍寄与の増加及びがんcfDNAにおける異なる免疫シグネチャを示した。組織デコンボリューション自体を、がん検出に使用することができる。最後に、TAPSは、修飾シトシンを直接変換するため、非修飾シトシンを変換する他のアプローチと比較して、基礎となる遺伝情報を最大限に保持する。本開示において、CNV及び断片化情報は、cfTAPSから抽出され、後者は、cfDNA WGBSにおいて失われる。結果は、差次的なメチル化、起源の組織、及び断片化プロファイルを組み合わせた統合されたアプローチが、複数がん検出のためのモデル性能を改善することができることを更に示した。
【0099】
本セクション及び本明細書の開示全体で使用されるセクションの見出しは、単に組織的な目的のためだけであり、限定することを意図するものではない。
1.定義
別段の定義がない限り、本明細書で使用される全ての技術用語及び科学用語は、当業者によって一般的に理解されるものと同じ意味を有する。矛盾する場合は、定義を含む本文書が優先されるものとする。好ましい方法及び材料については後述するが、本明細書に記載されるものと類似するまたは同等の方法及び材料も、本開示の実施または試験に使用することができる。本明細書において言及される全ての刊行物、特許出願、特許、及び他の参考文献は、参照により、それらの全体が組み込まれる。本明細書に開示される材料、方法、及び例は、例示にすぎず、限定することは意図されない。
【0100】
本明細書で使用される用語「含む(comprise)」、「含む(include)」、「有する(having)」、「有する(has)」、「できる」、「含有する」、及びそれらの変形は、追加の行為または構造の可能性を排除しないオープンエンドな移行句、用語、または単語であることが意図される。単数形「a」、「and」、及び「the」は、文脈で明確に別段指示されない限り、複数の参照を含む。本開示はまた、明示的に記載されるか否かにかかわらず、本明細書に提示される実施形態または要素「を含む(comprising)」、「~からなる」、及び「~から本質的になる」他の実施形態を企図する。
【0101】
本明細書における数値範囲の列挙のために、それらの間に同じ程度の精度で介在する各数値が明示的に企図される。例えば、6~9の範囲については、数字7及び8が、6及び9に加えて企図され、6.0~7.0の範囲については、数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、及び7.0が明示的に企図される。
【0102】
本明細書における数値範囲の列挙のために、それらの間に同じ程度の精度で介在する各数値が明示的に企図される。例えば、6~9の範囲については、数字7及び8が、6及び9に加えて企図され、6.0~7.0の範囲については、数字6.0、6.1、6.2、6.3、6.4、6.5、6.6、6.7、6.8、6.9、及び7.0が明示的に企図される。
【0103】
本明細書で使用される「~への相関」は、~と比較して、を指す。
【0104】
本明細書で使用される場合、「メチル化」は、シトシンのC5位もしくはN4位でのシトシンメチル化、アデニンのN6位、または他のタイプの核酸メチル化を指す。インビトロ増幅DNAは、典型的なインビトロDNA増幅方法が増幅鋳型のメチル化パターンを保持しないため、通常メチル化されない。しかしながら、「メチル化されていないDNA」または「メチル化されたDNA」は、それぞれ元の鋳型がメチル化されていなかった、またはメチル化された増幅DNAをも指すことが可能である。
【0105】
その結果、本明細書に使用される場合、「メチル化されたヌクレオチド」または「メチル化されたヌクレオチド塩基」は、ヌクレオチド塩基上でのメチル部分の存在を指し、このメチル部分は、認識された典型的なヌクレオチド塩基中に存在しない。例えば、シトシンは、そのピリミジン環上にメチル部分を含有しないが、5-メチルシトシンは、そのピリミジン環の5位にメチル部分を含有する。したがって、シトシンはメチル化ヌクレオチドではなく、5-メチルシトシンはメチル化ヌクレオチドである。
【0106】
本明細書に使用される場合、「メチル化された核酸分子」は、1つ以上のメチル化されたヌクレオチドを含む核酸分子を指す。
【0107】
本明細書で使用される場合、核酸分子の「メチル化状態」、「メチル化プロファイル」、「メチル化ステータス」、及び「メチル化シグネチャ」は、核酸分子中の1つ以上のメチル化ヌクレオチド塩基の有無を指す。例えば、メチル化シトシンを含有する核酸分子は、メチル化されているとみなされる(例えば、核酸分子のメチル化状態は、メチル化されている)。メチル化ヌクレオチドを一切含有しない核酸分子は、メチル化されていないとみなされる。
【0108】
本明細書で使用される場合、「メチル化頻度」または「メチル化パーセント(%)」は、分子または遺伝子座がメチル化されていない事例の数と比較した、分子または遺伝子座がメチル化されている事例の数を指す。メチル化状態頻度は、個体の集団または単一の個体からの試料を説明するために使用することができる。例えば、50%のメチル化状態頻度を有するヌクレオチド遺伝子座は、50%の場合にメチル化され、50%の場合にメチル化されていない。このような頻度を使用して、例えば、ヌクレオチド遺伝子座または核酸領域が個体集団または核酸集合体中でメチル化される程度を説明することが可能である。したがって、核酸分子の第1の集団またはプール中のメチル化が、核酸分子の第2の集団またはプール中のメチル化と異なる場合、第1の集団またはプールのメチル化状態の頻度は、第2の集団またはプールのメチル化状態の頻度とは異なる。また、このような頻度を使用して、例えば、ヌクレオチド遺伝子座または核酸領域が単一の個体中でメチル化される程度を説明することができる。例えば、そのような頻度を使用して、組織試料由来の細胞群がヌクレオチド遺伝子座または核酸領域でメチル化されるか、またはメチル化されない程度を説明することができる。
【0109】
本明細書で使用される場合、「全ゲノムcfDNAメチル化シグネチャ」という用語は、(アレイベースの技術と同様に)狭いいくつかの候補部位ではなく、ゲノムの幅全体にわたって候補メチル化マーカーを調べる任意の方法によって得られたシグネチャを指す。
【0110】
本明細書で使用される場合、「コピー数変動」(CNVと省略される)という用語は、DNAの特定のセグメントのコピー数が異なる個体のゲノム間で変化する状況を指す。
【0111】
本明細書で使用される場合、「一意のマッピングレート」という用語は、配列決定データの検証に使用される基準を指し、具体的には、参照ゲノム内の正確な1つの位置にマッピングされる配列決定リードの割合を指す。いくつかの実施形態において、一意のマッピングレートは、配列決定されたリードの総数と比較して、定義されたパラメータ(例えば、500、120、1000、20)を有するリードの割合(例えば、bwaアラインを使用してMAPQ≧1)として計算され得る。
【0112】
本明細書で使用される場合、「一意の重複除去されたマッピングレート」という用語は、参照ゲノム内の正確に1つの位置にマッピングされる(重複を除去した後の)重複除去された配列決定リードの割合を指す。いくつかの好ましい実施形態において、一意の重複除去されたマッピングレートは、配列決定されたリードの総数と比較して、(例えば、MarkDuplicates(Picard)を用いて)PCRの重複を除去した後に適切にマッピングされたリードの割合を計算することによって決定され得る。
【0113】
本明細書で使用される場合、「組織デコンボリューション」という用語は、試料中の配列決定されたcfDNAを、その起源の組織に選別し、組織からの相対的な寄与を決定することを指す。いくつかの好ましい実施形態において、cfDNAメチル化は、参照アトラス中の(例えば、DMRでの)メチル化値と比較される。これらの方法は、好ましくは、cfDNAの起源の割合が回帰係数である回帰方法を使用する。
【0114】
本明細書で使用される場合、「患者」または「対象」という用語は、本技術によって提供される様々な試験に対象とする生物を指す。「対象」という用語は、動物、好ましくはヒトを含む哺乳動物を含む。好ましい実施形態において、対象は霊長類である。より一層好ましい実施形態において、対象はヒトである。更に診断方法に関して、好ましい対象は、脊椎動物対象である。好ましい脊椎動物は、温血動物であり、好ましい温血脊椎動物は、哺乳動物である。好ましい哺乳動物は、最も好ましくはヒトである。本明細書で使用される場合、「対象」という用語は、ヒト及び動物の両方の対象を含む。したがって、獣医学的な治療的使用が本明細書で提供される。このようなものとして、本発明の科学技術は、ヒトなどの哺乳動物、及びアムールトラなどの絶滅の危機に瀕しているために重要な、ヒトによる消費のために農場で育てられる動物などの経済的に重要なこれらの哺乳動物、及び/またはペットとして、または動物園に飼われている動物など、ヒトにとって社会的に重要な動物の診断のために提供される。そのような動物の例として、限定されないが、ネコ及びイヌなどの肉食動物;ブタ(pig)、ブタ(hog)、及びイノシシを含む、ブタ(swine);ウシ(cattle)、ウシ(oxen)、ヒツジ、キリン、シカ、ヤギ、バイソン、及びラクダなどの反芻動物及び/または有蹄類;鰭脚類;及びウマが挙げられる。
2.TET支援ピリジンボラン配列決定(TAPS)
本開示の実施形態は、循環無細胞DNAに使用するためのものを含む、配列内の5-メチルシトシン(5mC)及び5-ヒドロキシメチルシトシン(5hmC)を検出するための亜硫酸水素塩を含まない塩基解像度方法(TAPS)を提供する。国際PCT出願第PCT/US2019/012627号(その各々はその全体が参照により本明細書に組み込まれる、2019年1月8日に出願された、2018年1月8日に出願された米国仮特許出願第62/614,798号、2018年4月20日に出願された同第62/660,523号、及び2018年11月26日に出願された同第62/771,409号に対する優先権を主張する)に開示されるように、TAPSは、非修飾シトシンに影響を与えることなく、5mC及び5hmCを直接、塩基解像度で定量的に検出するための穏和な酵素反応及び化学反応の使用を含む。本開示はまた、非修飾シトシンに影響を与えることなく、塩基解像度で5-ホルミルシトシン(5fC)及び5-カルボキシルシトシン(5caC)を検出するための方法を提供する。したがって、本明細書で提供される方法は、5mC、5hmC、5fC、及び5caCのマッピングを提供し、亜硫酸水素塩配列決定などの従来の方法の欠点を克服する。
【0115】
5mCを特定するための方法。いくつかの実施形態において、本開示の方法は、DNA試料(標的DNAまたは全ゲノム)中の5mCを特定することと、DNA中で修飾が特定された各位置での5mC修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、各移行位置におけるTの割合は、DNA中の各位置における5mCの定量的レベルを提供する。これらの実施形態によれば、5mCを特定するための方法は、保護基の使用を含み得る。他の実施形態において、5mCを特定するための方法は、保護基の使用を必要としない(例えば、以下に更に記載されるcfTAPS)。
【0116】
保護基を使用して、5hmCを含まずにDNA(例えば、cfDNA)中の5mCを特定する場合、試料中の5hmCは、5caC及び/または5fCへの変換を受けないように保護される。いくつかの実施形態において、試料DNA中の5hmCは、保護基を5hmCに追加することによって、その後のステップに対して非反応性になる。一実施形態において、保護基は、修飾糖、例えば、グルコースまたは6-アジド-グルコース(6-アジド-6-デオキシ-D-グルコース)を含む、糖である。糖保護基は、DNA試料を、1つ以上のグルコシルトランスフェラーゼ酵素の存在下でウリジン二リン酸(UDP)糖と接触させることによって、5hmCのヒドロキシメチル基に付加され得る。いくつかの実施形態において、グルコシルトランスフェラーゼは、T4バクテリオファージβ-グルコシルトランスフェラーゼ(βGT)、T4バクテリオファージα-グルコシルトランスフェラーゼ(αGT)、及びそれらの誘導体及び類似体である。βGTは、ベータ-D-グルコシル(グルコース)残基がUDP-グルコースから核酸中の5-ヒドロキシメチルシトシン残基に移される化学反応を触媒する酵素である。
【0117】
5hmCを特定するための方法。いくつかの実施形態において、本開示の方法は、DNA試料(標的DNAまたは全ゲノム)中の5mCまたは5hmCを特定することを含む。いくつかの実施形態において、本方法は、DNA中で修飾が特定された各位置での5mCまたは5hmC修飾の頻度の定量的尺度を提供する。いくつかの実施形態において、各移行位置におけるTの割合は、DNA中の各位置における5mCまたは5hmCの定量的レベルを提供する。これらの実施形態によれば、5mCまたは5hmCを特定するための方法は、5mC及び5hmCの位置を提供するが、2つのシトシン修飾を区別しない。むしろ、5mC及び5hmCの両方がDHUに変換される。DHUの存在は、直接検出することができ、または修飾DNAは、DHUがTに変換される既知の方法によって複製することができる。いくつかの実施形態において、5hmCを特定するための方法は、保護基の使用を含む。他の実施形態において、5hmCを特定するための方法は、保護基の使用を必要としない(例えば、以下に更に記載されるcfTAPS)。
【0118】
5mCを特定する方法及び/または5hmCを特定する方法。本開示は、第1のDNA試料に対して5mCを特定するための方法を実施し、第2のDNA試料に対して5mCまたは5hmCを特定するための方法を実施することによって、DNA(例えば、cfDNA)において5mCを特定し、5hmCを特定する方法を提供する。いくつかの実施形態において、第1及び第2のDNA試料は、同じDNA試料に由来する。例えば、第1の試料及び第2の試料は、分析されるDNA(例えば、cfDNA)を含む試料から採取された別個のアリコートであり得る。
【0119】
5mC及び5hmC(保護されていない)は、DHUへの変換前に5fC及び5caCに変換されるため、DNA試料中に存在する5fC及び5caCは、5mC及び/または5hmCとして検出される。しかしながら、通常の条件下でゲノムDNA中の5fC及び5caCがきわめて低いレベルであることを考慮すると、DNA試料中のメチル化及びヒドロキシメチル化を分析する場合、このことは多くは許容されるであろう。5fC及び5caCシグナルは、例えば、それぞれヒドロキシルアミンコンジュゲーション及びEDCカップリングによって、5fC及び5caCをDHUへの変換から保護することによって除外され得る。これらの実施形態によれば、本方法は、5mCの位置及び割合を、5mCまたは5hmC(合わせたもの)の位置及び割合と比較することによって、DNA中の5hmCの位置及び割合を特定する。あるいは、DNA中の5hmC修飾の位置及び頻度を直接測定することができる。
【0120】
いくつかの実施形態において、5hmCを5fCへと変換するステップは、DNAを、例えば、過ルテニウム酸カリウム(KRuO4)と接触させることによって(参照によって本明細書に組み込まれるScience.2012,33,934-937及びWO2013017853に記載されるように)、またはCu(II)/TEMPO(過塩素酸銅(II)及び2,2,6,6-テトラメチルピペリジン-1-オキシル(TEMPO))と接触させることによって(参照によって本明細書に組み込まれるChem.Commun.,2017,53,5756-5759及びWO2017039002に記載されるように)、5hmCを5fCへと酸化することを含む。次いで、DNA試料中の5fCは、本明細書に開示される方法によって(例えば、ボラン反応によって)DHUに変換される。
【0121】
いくつかの実施形態において、5fC及び/または5caCを特定することは、5fC及び/または5caCの位置を提供するが、これら2つのシトシン修飾を区別しない。むしろ、5fC及び5caCの両方がDHUに変換され、これが本明細書に記載の方法によって検出される。
【0122】
5caCを特定するための方法。いくつかの実施形態において、本方法は、DNA試料(標的DNAまたは全ゲノム)中の5caCを特定することを含み、DNA中で修飾が特定された各位置での5caC修飾の頻度の定量的尺度を提供する。いくつかの実施形態において、各移行位置におけるTの割合は、DNA中の各位置における5caCの定量的レベルを提供する。これらの実施形態によれば、5caCを特定するための方法は、保護基の使用を含み得る。他の実施形態において、5caCを特定するための方法は、保護基の使用を必要としない(例えば、以下に更に記載されるcfTAPS)。
【0123】
いくつかの実施形態において、5fCが保護される(及び5mC及び5hmCがDHUに変換されない)場合、DNA中の5caCの特定を行うことができる。いくつかの実施形態において、DNA試料中の5fCに保護基を付加することは、DNAを、例えば、ヒドロキシルアミン誘導体、ヒドラジン誘導体、及びヒラジド誘導体を含むアルデヒド反応性化合物と接触させることを含む。ヒドロキシルアミン誘導体としては、アシドロキシルアミン(ashydroxylamine)、塩酸ヒドロキシルアミン、硫酸ヒドロキシルアンモニウム酸、リン酸ヒドロキシルアミン、O-メチルヒドロキシルアミン、O-ヘキシルヒドロキシルアミン、O-ペンチルヒドロキシルアミン、O-ベンジルヒドロキシルアミンが挙げられ、特に、O-エチルヒドロキシルアミン(EtONH2)、O-アルキル化またはO-アリール化ヒドロキシルアミン、それらの酸または塩が挙げられる。ヒドラジン誘導体としては、N-アルキルヒドラジン、N-アリールヒドラジン、N-ベンジルヒドラジン、N,N-ジアルキルヒドラジン、N,N-ジアリールヒドラジン、N,N-ジベンジルヒドラジン、N,N-アルキルベンジルヒドラジン、N,N-アリールベンジルヒドラジン、及びN,N-アルキルアリールヒドラジンが挙げられる。ヒドラジド誘導体としては、-トルエンスルホニルヒドラジド、N-アシルヒドラジド、N,N-アルキルアシルヒドラジド、N,N-ベンジルアシルヒドラジド、N,N-アリールアシルヒドラジド、N-スルホニルヒドラジド、N,N-アルキルスルホニルヒドラジド、N,N-ベンジルスルホニルヒドラジド、及びN,N-アリールスルホニルヒドラジドが挙げられる。
【0124】
5fCを特定するための方法。いくつかの実施形態において、本方法は、DNA試料(標的DNAまたは全ゲノム)中の5fCを特定することを含み、DNA中で修飾が特定された各位置での5fC修飾の頻度の定量的尺度を提供する。いくつかの実施形態において、各移行位置におけるTの割合は、DNA中の各位置における5fCの定量的レベルを提供する。これらの実施形態によれば、5fCを特定するための方法は、保護基の使用を含み得る。他の実施形態において、5fCを特定するための方法は、保護基の使用を必要としない(例えば、以下に更に記載されるcfTAPS)。
【0125】
いくつかの実施形態において、DNA試料中の5caCにブロック基を付加することは、(i)DNA試料を、カップリング剤、例えば、カルボン酸誘導体化試薬、例えば、l-エチル-3-(3-ジメチルアミノプロピル)カルボジイミド(EDC)またはN,N’-ジシクロヘキシルカルボジイミド(DCC)などのカルボジイミド誘導体と接触させることによって、及び(ii)DNA試料を、アミン、ヒドラジンまたはヒドロキシルアミン化合物と接触させることによって、達成することができる。したがって、例えば、5caCは、DNA試料を、EDCで、次いでベンジルアミン、エチルアミン、または別のアミンで処理して、5caCをDHUへの変換から保護するアミドを形成することによって保護することができる(例えば、pic-BH3による)。
3.cfDNAのためのTAPS(cfTAPS)
本開示は、高品質及び高深度の全ゲノム無細胞メチロームを提供するためのcfDNAに最適化されたTAPS(cfTAPS)を提供する。以下に更に記載されるように、本開示の一実施形態において、cfTAPSは、肝細胞癌(HCC)または膵管腺癌(PDAC)を有する患者、及び非がん対照からの85個のcfDNA試料に適用された。わずか10ngのcfDNA(1~3mLの血漿)から、これまでで最も包括的なcfDNAメチロームが生成された。本明細書で提供される結果は、cfTAPSが、DNAメチル化、起源の組織、及びDNA断片化を含むcfDNA特性に関するマルチモーダル情報を提供することを示した。これらのエピジェネティックな特徴及び遺伝的特徴の統合された分析は、早期HCC及びPDACの正確な特定を可能にする。本開示の方法は、亜硫酸水素塩配列決定などの方法に関連する核酸の実質的な分解を回避する穏和な酵素反応及び化学反応を利用するため、本開示の方法は、例えば、循環無細胞DNA及び単一細胞分析などの低いインプットの試料の分析に有用である。
【0126】
これらの実施形態によれば、本開示は、メチル化シグネチャを得る方法を提供する。いくつかの実施形態において、本方法は、試料から無細胞DNA(cfDNA)を単離することと、cfDNAを含む配列決定ライブラリを調製することと、配列決定ライブラリに対してTET支援ピリジンボラン配列決定(TAPS)を実施して、cfDNAのメチル化シグネチャを得ることと、を含む。いくつかの実施形態において、メチル化シグネチャは、全ゲノムメチル化シグネチャである。
【0127】
いくつかの実施形態において、配列決定ライブラリを調製することは、単離されたcfDNAに配列決定アダプターをライゲーションして、配列決定反応の実施を容易にすることを含む。いくつかの実施形態において、キャリア核酸またはキャリア核酸(例えば、DNA)の混合物は、TAPSを実施する前に、配列決定ライブラリに追加される。キャリア核酸は、試料からのcfDNA回収の1つ以上の態様を強化する任意の特異的または非特異的DNA分子(またはその核酸誘導体)であってもよい。いくつかの実施形態において、キャリアDNAは、特定の配列を有するDNA分子を含み、他の実施形態において、キャリアDNAは、異なる配列を有するDNA分子の混合物を含む。いくつかの実施形態において、キャリアDNAは、その任意の断片及び/または誘導体を含む、以下の配列を有するDNAを含み得る。AGGCAACTTTATGCCCATGCAACAGAAACTATAAAAAATACAGAGAATGAAAAGAAACAGATAGATTTTTTAGTTCTTTAGGCCCGTAGTCTGCAAATCCTTTTATGATTTTCTATCAAACAAAAGAGGAAAATAGACCAGTTGCAATCCAAACGAGAGTCTAATAGAATGAGGTCGAAAAGTAAATCGCGCGGGTTTGTTACTGATAAAGCAGGCAAGACCTAAAATGTGTAAAGGGCAAAGTGTATACTTTGGCGTCACCCCTTACATATTTTAGGTCTTTTTTTATTGTGCGTAACTAACTTGCCATCTTCAAACAGGAGGGCTGGAAGAAGCAGACCGCTAACACAGTACATAAAAAAGGAGACATGAACGATGAACATCAAAAAGTTTGCAAAACAAGCAACAGTATTAACCTTTACTACCGCACTGCTGGCAGGAGGCGCAACTCAAGCGTTTGCGAAAGAAACGAACCAAAAGCCATATAAGGAAACATACGGCATTTCCCATATTACACGCCATGATATGCTGCAAATCCCTGAACAGCAAAAAAATGAAAAATATAAAGTTCCTGAGTTCGATTCGTCCACAATTAAAAATATCTCTTCTGCAAAAGGCCTGGACGTTTGGGACAGCTGGCCATTACAAAACACTGACGGCACTGTCGCAAACTATCACGGCTACCACATCGTCTTTGCATTAGCCGGAGATCCTAAAAATGCGGATGACACATCGATTTACATGTTCTATCAAAAAGTCGGCGAAACTTCTATTGACAGCTGGAAAAACGCTGGCCGCGTCTTTAAAGACAGCGACAAATTCGATGCAAATGATTCTATCCTAAAAGACCAAACACAAGAATGGTCAGGTTCAGCCACATTTACATCTGACGGAAAAATCCGTTTATTCTACACTGATTTCTCCGGTAAACATTACGGCAAACAAACACTGACAACTGCACAAGTTAACGTATCAGCATCAGACAGCTCTTTGAACATCAACGGTGTAGAGGATTATAAATCAATCTTTGACGGTGACGGAAAAACGTATCAAAATGTACAGCAGTTCATCGATGAAGGCAACTACAGCTCAGGCGACAACCATACGCTGAGAGATCCTCACTACGTAGAAGATAAAGGCCACAAATACTTAGTATTTGAAGCAAACACTGGAACTGAAGATGGCTACCAAGGCGAAGAATCTTTATTTAACAAAGCATACTATGGCAAAAGCACATCATTCTTCCGTCAAGAAAGTCAAAAACTTCTGCAAAGCGATAAAAAACGCACGGCTGAGTTAGCAAACGGCGCTCTCGGTATGATTGAGCTAAACGATGATTACACACTGAAAAAAGTGATGAAACCGCTGATTGCATCTAACACAGTAACAGATGAAATTGAACGCGCGAACGTCTTTAAAATGAACGGCAAATGGTACCTGTTCACTGACTCCCGCGGATCAAAAATGACGATTGACGGCATTACGTCTAACGATATTTACATGCTTGGTTATGTTTCTAATTCTTTAACTGGCCCATACAAGCCGCTGAACAAAACTGGCCTTGTGTTAAAAATGGATCTTGATCCTAACGATGTAACCTTTACTTACTCACACTTCGCTGTACCTCAAGCGAAAGGAAACAATGTCGTGATTACAAGCTATATGACAAACAGAGGATTCTACGCAGACAAACAATCAACGTTTGCGCCTAGCTTCCTGCTGAACATCAAAGGCAAGAAAACATCTGTTGTCAAAGACAGCATCCTTGAACAAGGACAATTAACAGTTAACAAATAAAAACGCAAAAGAAAATGCCGATATCCTATTGGCATTGACGGTCTCCAGTAAAGGTGGATACGGATCCGAATTCGAGCTCCGTCGACAAGCTTGCGGCCGCACTCGAGCACCACCACCACCACCACTGAGATCCGGCTGCTAACAAAGCCCGAAAGGAAGCTGAGTTGGCTGCTGCCACCGCTGAGCAATAACTAGCATAACCCCTTGG(配列番号1)
いくつかの実施形態において、キャリアDNAの使用は、より高いライブラリ収率をもたらす。本開示に基づいて当業者によって認識されるように、キャリアDNAは、限定されないが、1つ以上のプライマーを使用したベクターまたはプラスミド鋳型からのPCR増幅を含む、当業者に既知の任意の手段によって得ることができる。いくつかの実施形態において、少なくとも1ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも10ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも25ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも50ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも100ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも150ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも200ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも250ngのキャリアDNAを使用することができる。いくつかの実施形態において、少なくとも500ngのキャリアDNAを使用することができる。いくつかの実施形態において、約1ng~約500ngのキャリアDNAを使用することができる。いくつかの実施形態において、約1ng~約500ngのキャリアDNAを使用することができる。いくつかの実施形態において、約50ng~約250ngのキャリアDNAを使用することができる。いくつかの実施形態において、約75ng~約150ngのキャリアDNAを使用することができる。いくつかの実施形態において、約50ng~約150ngのキャリアDNAを使用することができる。いくつかの実施形態において、約75ng~約125ngのキャリアDNAを使用することができる。
【0128】
いくつかの実施形態において、また、本明細書に記載されるように、本方法は、cfDNA全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーが、がんの指標であるかどうかを決定することと、を更に含む。いくつかの実施形態において、メチル化バイオマーカーは、差次メチル化領域(DMR)を含む。いくつかの実施形態において、本方法は、参照DMRと比較して、DMRに基づいて試料を分類することを更に含む。いくつかの実施形態において、参照DMRは、非がん性対照、またはがん性対照に対応する。
【0129】
いくつかの実施形態において、また、本明細書に記載されるように、本方法は、cfDNA全ゲノムメチル化シグネチャから少なくとも1つのメチル化バイオマーカーを特定することと、メチル化バイオマーカーに対応する起源の組織を決定することと、を更に含む。いくつかの実施形態において、本方法は、起源の組織のバイオマーカーに基づいて試料を分類することを更に含む。
【0130】
いくつかの実施形態において、また、本明細書に記載されるように、本方法は、DNA断片化プロファイルを特定することと、断片化プロファイルが、がんの指標であるかどうかを決定することと、を更に含む。これらの実施形態によれば、DNA断片化プロファイルは、cfTAPS全ゲノム配列決定データ(例えば、リード対のアラインメント位置)から決定することができる。いくつかの好ましい実施形態において、cfTAPSからの配列決定されたリードは、まず、参照ゲノムにアラインメントされる。次いで、cfDNA断片の長さは、配列決定データから生成されたアラインメントファイルから抽出される。cfDNA断片の10bp間隔における割合は、無細胞DNAの断片化プロファイルとして使用される。
【0131】
いくつかの実施形態において、本方法は、cfDNAからの少なくとも1つの配列バリアントを特定することと、配列バリアントが、がんの指標であるかどうかを決定することと、を更に含む。例えば、いくつかの実施形態において、cfTAPSはまた、CからTへの遺伝子バリアントまたは一塩基多型(SNP)からメチル化を区別することができ、したがって、これを使用して遺伝子バリアントを検出することができる。いくつかの実施形態において、メチル化及びCからTへのSNPは、cfTAPSにおいて異なるパターンをもたらし得る。例えば、メチル化によって、元の上部鎖/元の下部鎖内にT/Gリードをもたらすことができ、これらに対して相補的な鎖内にA/Cリードをもたらすことができる。いくつかの実施形態において、CからTへのSNPは、元の上部鎖/元の下部鎖及びこれらに対して相補的な鎖内にT/Aリードをもたらすことができる。これらの異なるパターンを
図12に示す。これにより、1つの実験及び配列決定試行において、メチル化情報及び遺伝子バリアント、したがって変異の両方を提供することにおけるcfTAPSの有用性を更に増加させる。本明細書に開示されるcfTAPS方法のこの能力は、標準的な全ゲノム配列決定(WGS)を実施する必要性を除外することによって、ゲノム分析とエピジェネティックな分析との統合、及び配列決定費用の実質的な低減を提供する。
【0132】
上の実施形態によれば、本開示の方法は、対象においてがんを診断/検出するための単一の実験において、メチル化シグネチャ、メチル化バイオマーカー、DNA断片プロファイル、DNA配列情報(例えば、バリアント)、及び起源の組織の情報に関する情報を生成するためのcfTAPSの使用を含む。本開示に基づいて当業者には理解されるように、本明細書に開示されるcfTAPSを使用して、メチル化シグネチャ、メチル化バイオマーカー、DNA断片プロファイル、DNA配列情報(例えば、バリアント)、及び起源の組織の情報の任意の組み合わせを生成し、対象においてがんを診断/検出することができる。いくつかの実施形態において、メチル化シグネチャを得ることができ、メチル化バイオマーカー、DNA断片プロファイル、DNA配列情報(例えば、バリアント)、及び起源の組織の情報のうちの1つ以上も得ることができ、これを使用して、対象においてがんを診断/検出することができる。いくつかの実施形態において、バイオマーカーのメチル化ステータスを得ることができ、メチル化シグネチャ、DNA断片プロファイル、DNA配列情報(例えば、バリアント)、及び起源の組織の情報のうちの1つ以上も得ることができ、これを使用して、対象においてがんを診断/検出することができる。いくつかの実施形態において、DNA断片プロファイルを得ることができ、メチル化シグネチャ、メチル化バイオマーカー、DNA配列情報(例えば、バリアント)、及び起源の組織の情報のうちの1つ以上も得ることができ、これを使用して、対象においてがんを診断/検出することができる。いくつかの実施形態において、DNA配列バリアントを特定することができ、メチル化シグネチャ、メチル化バイオマーカー、DNA断片プロファイル、及び起源の組織の情報のうちの1つ以上も得ることができ、これを使用して、対象においてがんを診断/検出することができる。いくつかの実施形態において、起源の組織の情報を得ることができ(例えば、全ゲノムcfDNAメチル化シグネチャから)、メチル化シグネチャ、メチル化バイオマーカー、DNA断片プロファイル、及びDNA配列情報(例えば、バリアント)のうちの1つ以上も得ることができ、これを使用して、対象においてがんを診断/検出することができる。
【0133】
したがって、いくつかの好ましい実施形態において、本発明は、患者試料中のcfDNAを分析するマルチモーダル方法であって、患者試料からcfDNAを単離することと、試料中の5mC及び/または5hmC残基をDHU残基に変換して、修飾cfDNA試料を提供することと、修飾cfDNA試料を配列決定して、試料中のメチル化領域を特定することであって、非修飾参照cfDNAと比較して、修飾cfDNA試料中のシトシン(C)からチミン(T)への移行、またはシトシン(C)からDHUへの移行が、cfDNA中の5mCまたは5hmCのいずれかの位置を提供する、試料中のメチル化領域を特定することと、
a)修飾cfDNA試料における1つ以上の標的のコピー数変動を決定すること、
b)修飾cfDNA試料における起源の組織または1つ以上の標的を決定すること、
c)修飾cfDNA試料の断片化プロファイルを決定すること、及び
d)修飾cfDNA試料において1つ以上の単一ヌクレオチド変異を特定すること、からなる群から選択される修飾cfDNAに対する1つ以上の追加の分析ステップを実施することと、を含む、マルチモーダル方法を提供する。
【0134】
いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップaである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップbである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップcである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップdである。
【0135】
いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップa及びbである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップa及びcである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップa及びdである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップb及びcである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップb及びdである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップc及びdである。
【0136】
いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップa、b、及びcである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップa、b、及びdである。いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップb、c、及びdである。
【0137】
いくつかの好ましい実施形態において、1つ以上の追加のステップは、ステップa、b、c、及びdの全てである。
【0138】
いくつかの実施形態において、修飾cfDNA試料と比較される非修飾参照cfDNAは、例えば、公的に入手可能な参照cfDNAまたは患者からの非修飾対照試料を含む、任意の非修飾参照cfDNAを含み得る。
【0139】
いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5mC修飾を特定することと、5mC修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5hmC修飾を特定することと、5hmC修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5caC修飾を特定することと、5caC修飾の頻度の定量的尺度を提供することと、を含む。いくつかの実施形態において、配列決定ライブラリに対してTAPSを実施して、全ゲノムメチル化シグネチャを得ることは、cfDNA中の5fC修飾を特定することと、5fC修飾の頻度の定量的尺度を提供することと、を含む。
【0140】
本開示に基づいて当業者によって認識されるように、本明細書に記載の方法(例えば、cfTAPS)を使用して、任意の種類のがんを診断/検出することができる。本開示の方法を使用して検出/診断することができるがんの種類としては、限定されないが、肺癌、黒色腫、結腸癌、結腸直腸癌、神経芽細胞腫、乳癌、前立腺癌、腎細胞癌、移行細胞癌、胆管癌、脳癌、非小細胞肺癌、膵臓癌、肝臓癌、胃癌、膀胱癌、食道癌、中皮腫、甲状腺癌、頭頚部癌、骨肉腫、肝細胞癌、原発不明の癌腫、卵巣癌、子宮内膜癌、神経膠芽細胞腫、ホジキンリンパ腫、及び非ホジキンリンパ腫が挙げられる。いくつかの実施形態において、本開示の方法によって検出/診断することができるがんまたはがんの転移形態の種類としては、限定されないが、癌腫、肉腫、リンパ腫、生殖細胞腫瘍、及び芽細胞腫が挙げられる。いくつかの実施形態において、がんは、浸潤性及び/または転移性がん(例えば、ステージIIのがん、ステージIIIのがん、またはステージIVのがん)である。いくつかの実施形態において、がんは、早期がん(例えば、ステージ0のがん、ステージIのがん)であり、及び/または浸潤性及び/または転移性がんではない。
【0141】
いくつかの実施形態において、本開示の方法(例えば、cfTAPS)を使用して、対象が、肝細胞癌(HCC)または膵管腺癌(PDAC)を有するかどうかを決定することができる。いくつかの実施形態において、本方法は、対象が、早期肝細胞癌(HCC)または早期膵管腺癌(PDAC)を有するかどうかを決定することを含む。
【0142】
これらの実施形態によれば、本開示は、非修飾シトシンに影響を及ぼすことなく、塩基解像度により定量的に核酸中の5mC、5hmC、5caC及び/または5fCのうちの1つ以上の位置を特定するための方法を提供する。いくつかの実施形態において、核酸は、DNAである。いくつかの実施形態において、DNAは、cfDNA(例えば、循環cfDNA)である。いくつかの実施形態において、核酸は、RNAである。いくつかの実施形態において、核酸試料は、DNAである標的核酸またはRNAである標的核酸を含む。いくつかの実施形態において、本方法は、全ゲノムに適用され、特定の標的核酸に限定されない。
【0143】
核酸は、シトシン修飾(すなわち、5mC、5hmC、5fC、及び/または5caC)を有する任意の核酸であり得る。核酸は、試料中の単一の核酸分子であり得るか、または試料中の核酸分子の集団全体(全ゲノムまたはそのサブセット)であり得る。核酸は、供給源(例えば、細胞、組織試料など)からの天然核酸であってもよく、または例えば、配列決定のためのアダプターによる断片化、修復、及びライゲーションによって、高スループットの配列決定に対応した形態に事前に変換されてもよい。したがって、本明細書に記載の方法を使用して、個々に(例えば、個々の標的の配列を決定することによって)、または群で(例えば、高スループットまたは次世代配列決定方法によって)分析することができる標的核酸配列のライブラリを生成し得るように、核酸は、複数の核酸配列を含み得る。
【0144】
核酸試料は、Monera(細菌)、Protista、Fungi、Plantae、及びAnimalia Kingdomsからの生物から得ることができる。核酸試料は、患者もしくは対象から、環境試料から、または目的とする生物から得られてもよい。いくつかの実施形態において、試料は、がんを有するヒトまたはがんを有することが疑われるヒトを含むがこれらに限定されない、ヒト対象/患者から得られる。いくつかの実施形態において、試料は、がん性であるか、またはがん性であることが疑われる組織または細胞を含む、ヒトからの組織または細胞から得られる(例えば、生検から得られる)。いくつかの実施形態において、核酸試料は、細胞または細胞の集合体、体液、組織試料、臓器、及び小器官から抽出されるか、またはそれらに由来する。いくつかの実施形態において、核酸試料は、血液(血漿、血清、全血)、尿、糞便/糞便液、精液(男性の生殖液体)、膣分泌物、脳脊髄液(CSF)、腹水、滑液、胸水(胸腔洗浄液)、心膜液、腹膜液、羊水、唾液、鼻液、耳液、胃液、母乳、及びcfDNAを含む任意の他の体液、ならびに細胞培養上清を含むがこれらに限定されない体液から得られる。いくつかの実施形態において、試料は、がん性であるか、またはがん性であることが疑われる体液から得られる。本開示の方法は、亜硫酸水素塩配列決定などの方法に関連する核酸の実質的な分解を回避する穏和な酵素反応及び化学反応を利用するため、本開示の方法は、例えば、循環無細胞DNA及び単一細胞分析などの低いインプットの試料の分析に有用である。
【0145】
いくつかの実施形態において、DNA試料は、ピコグラム量のDNAを含む。いくつかの実施形態において、DNA試料は、約1pg~約900pgのDNA、約1pg~約500pgのDNA、約1pg~約100pgのDNA、約1pg~約50pgのDNA、または約1~約10pgのDNAを含む。いくつかの実施形態において、DNA試料は、約200pg未満、約100pg未満のDNA、約50pg未満のDNA、約20pg未満のDNA、約15pg未満のDNA、約10pg未満のDNA、または約5pg未満のDNAを含む。
【0146】
いくつかの実施形態において、DNA試料は、ナノグラム量のDNAを含む。本開示の方法で使用するための試料DNAは、単一細胞由来のDNAまたはバルクDNA試料を含むがこれらに限定されない、任意の量であり得る。いくつかの実施形態において、本方法は、約1~約500ngのDNA、約1~約200ngのDNA、約1~約100ngのDNA、約1~約50ngのDNA、約1~約10ngのDNA、約2~約5ngのDNAを含むDNA試料に対して実施することができる。いくつかの実施形態において、DNA試料は、約100ng未満のDNA、約50ng未満のDNA、40ng未満のDNA、30ng未満のDNA、20ng未満のDNA、15ng未満のDNA、5ng未満のDNA、及び2ng未満のDNAを含む。いくつかの実施形態において、DNA試料は、マイクログラム量のDNAを含む。
【0147】
本明細書に記載の方法で使用されるDNA試料は、例えば、体液、組織試料、臓器、小器官、細胞または細胞の集合を含む任意の供給源からのものであってもよい。いくつかの実施形態において、DNA試料は、がんを有するヒトまたはがんを有することが疑われるヒトを含むがこれらに限定されない、ヒト対象/患者から得られる。いくつかの実施形態において、DNA試料は、がん性であるか、またはがん性であることが疑われる組織または細胞を含む、ヒトからの組織または細胞から得られる(例えば、生検から得られる)。いくつかの実施形態において、DNA試料は、細胞または細胞の集合体、体液、組織試料、臓器、及び小器官から抽出されるか、またはそれらに由来する。いくつかの実施形態において、DNA試料は、血液(血漿、血清、全血)、尿、糞便/糞便液、精液(男性の生殖液体)、膣分泌物、脳脊髄液(CSF)、腹水、滑液、胸水(胸腔洗浄液)、心膜液、腹膜液、羊水、唾液、鼻液、耳液、胃液、母乳、及びcfDNAを含む任意の他の体液、ならびに細胞培養上清を含むがこれらに限定されない体液から得られる。いくつかの実施形態において、DNA試料は、がん性であるか、またはがん性であることが疑われる体液から得られる。いくつかの実施形態において、DNA試料は、血液中に見出されるDNAであり、細胞内に存在しない、循環無細胞DNA(無細胞DNAまたはcfDNA)である。本開示に基づいて当業者には理解されているように、cfDNAは、当該技術分野で既知の方法を使用して体液から単離され得る。市販のキットは、例えば、Circulating Nucleic Acid Kit(Qiagen)を含め、cfDNAの単離のために利用可能である。DNA試料は、抗体免疫沈降、クロマチン免疫沈降、制限酵素消化ベースの濃縮、ハイブリダイゼーションベースの濃縮、または化学標識ベースの濃縮を含むがこれらに限定されない濃縮ステップから得られ得る。
【0148】
DNAは、DNA断片及び/またはゲノムDNAを含むがこれらに限定されない、シトシン修飾(すなわち、5mC、5hmC、5fC、及び/または5caC)を有する任意のDNAであり得る。DNAは、試料中の単一のDNA分子であってもよく、または試料中のDNA分子の集団全体(全ゲノムもしくはそのサブセット)であってもよい。DNAは、供給源からの天然DNAであってもよく、または例えば、配列決定のためのアダプターによる断片化、修復、及びライゲーションによって、高スループットの配列決定に対応した形態に事前に変換されてもよい。したがって、本明細書に記載の方法を使用して、個々に(例えば、個々の標的の配列を決定することによって)、または群で(例えば、高スループットまたは次世代配列決定方法によって)分析することができる標的DNA配列のライブラリを生成し得るように、DNAは、複数のDNA配列を含み得る。
【0149】
これらの実施形態によれば、本開示の方法は、5mC及び5hmC(または5hmCが保護されている場合は5mCのみ)を5caC及び/または5fCに変換するステップを含む。いくつかの実施形態において、このステップは、DNAまたはRNA試料を、10-11トランスロケーション(TET)酵素と接触させることを含む。TET酵素は、5mCでC5メチル基への酸素分子の移動を触媒し、5-ヒドロキシメチルシトシン(5hmC)の形成をもたらす酵素のファミリーである。TETは、5hmCの5fCへの酸化及び5fCの酸化を更に触媒して、5caCを形成する。本開示の方法で有用なTET酵素としては、ヒトTET1、TET2、及びTET3;マウスTET1、TET2、及びTET3;Naegleria TET(NgTET);Coprinopsis cinerea(CcTET);マウスTET1の触媒ドメイン(mTET1CD)、ならびにそれらの誘導体または類似体のうちの1つ以上が挙げられる。いくつかの実施形態において、TET酵素は、NgTETである。いくつかの実施形態において、TET酵素は、ヒトTET1(hTET1)である。いくつかの実施形態において、TET酵素は、mTET1CDである。
【0150】
本開示の方法はまた、核酸試料中の5caC及び/または5fCをDHUに変換するステップを含み得る。いくつかの実施形態において、このステップは、DNAまたはRNA試料を、例えば、ピリジンボラン、2-ピコリンボラン(pic-BH3)、ボラン、水素化ホウ素ナトリウム、シアノ水素化ホウ素ナトリウム、及びトリアセトキシ水素化ホウ素ナトリウムなどのボラン還元剤を含む還元剤と接触させることを含む。いくつかの実施形態において、還元剤は、ピリジンボラン及び/またはpic-BH3である。
【0151】
本開示の方法はまた、当該技術分野で既知の方法によって、修飾核酸のコピー数を増幅するステップを含み得る。修飾核酸がDNAである場合、コピー数は、例えば、PCR、クローニング、及びプライマー伸長によって増加させることができる。個々の標的DNAのコピー数は、特定の標的DNA配列に特異的なプライマーを使用して、PCRによって増幅させることができる。あるいは、複数の異なる修飾された標的DNA配列を、標準的な技術によってDNAベクターにクローニングすることによって増幅させることができる。いくつかの実施形態において、複数の異なる修飾標的DNA配列のコピー数をPCRによって増加させ、例えば、二本鎖アダプターDNAが試料DNA(または修飾試料DNA)に事前にライゲーションされており、アダプターDNAに相補的なプライマーを使用してPCRが行われる、次世代配列決定のためのライブラリを生成する。
【0152】
いくつかの実施形態において、本方法は、修飾核酸の配列を検出するステップを含む。修飾された標的DNAまたはRNAは、5mC、5hmC、5fC、及び5caCのうちの1つ以上が非修飾の標的DNAまたはRNA中に存在した位置にDHUを含む。DHUは、DNA複製及び配列決定方法において、Tとして作用する。したがって、シトシン修飾は、当該技術分野で既知のCからTへの移行を特定する任意の直接的または間接的な方法によって検出することができる。そのような方法には、サンガー配列決定、マイクロアレイ、及び次世代配列決定方法などの配列決定方法が含まれる。CからTへの移行はまた、CからTへの移行が、制限エンドヌクレアーゼ認識配列を排除または導入する、制限酵素分析によって検出することができる。
【0153】
本開示の実施形態はまた、DNA中の5mC及び5hmCを特定するためのキットを提供する。そのようなキットは、本明細書に記載の方法によって5mC及び5hmCを特定するための試薬を含む。キットは、本明細書に記載の方法によって5caCを特定するための試薬と5fCを特定するための試薬とを含み得る。いくつかの実施形態において、キットは、TET酵素と、ボラン還元剤と、本方法を実施するための説明書と、を含む。いくつかの実施形態において、TET酵素は、TET1であり、ボラン還元剤は、ピリジンボラン、2-ピコリンボラン(pic-BH3)、ボラン、水素化ホウ素ナトリウム、シアノ水素化ホウ素ナトリウム、及びトリアセトキシ水素化ホウ素ナトリウムからなる群のうちの1つ以上から選択される。いくつかの実施形態において、TET1酵素は、NgTet1またはマウスTet1(例えばmTet1CD)であり、ボラン還元剤は、ピリジンボラン及び/またはpic-BH3である。
【0154】
いくつかの実施形態において、キットは、5hmC保護基及びグリコシルトランスフェラーゼ酵素を更に含む。いくつかの実施形態において、5hmCに付加される保護基は、糖である。いくつかの実施形態において、糖は、天然に存在する糖または修飾糖、例えば、グルコースまたは修飾グルコースである。いくつかの実施形態において、グルコシルトランスフェラーゼ酵素、例えば、T4バクテリオファージβ-グルコシルトランスフェラーゼ(βGT)及びT4バクテリオファージα-グルコシルトランスフェラーゼ(αGT)、ならびにその誘導体及び類似体の存在下で、核酸試料を、糖に連結されたUDP、例えば、UDP-グルコース、または修飾グルコースに連結されたUDPと接触させることによって、保護基を5hmCに付加する。
【0155】
いくつかの実施形態において、キットは、過ルテニウム酸カリウム(KRuO4)及び/またはCu(II)/TEMPO(過塩素酸銅(II)及び2,2,6,6-テトラメチルピペリジン-1-オキシル(TEMPO))から選択される酸化剤を更に含む。いくつかの実施形態において、キットは、核酸試料中の5fCを保護するための試薬を含む。いくつかの実施形態において、キットは、例えば、本明細書に記載のヒドロキシルアミン誘導体、ヒドラジン誘導体、及びヒドラジド誘導体を含むアルデヒド反応性化合物を含む。いくつかの実施形態において、キットは、本明細書に記載の5caCを保護するための試薬を含む。いくつかの実施形態において、キットは、DNAまたはRNAを単離するための試薬を含む。いくつかの実施形態において、キットは、試料から低入力DNAを、例えば、血液、血漿、または血清からcfDNAを単離するための試薬を含む。
【0156】
いくつかの実施形態において、本開示の方法は、患者(例えば、がんを有する患者、早期がんを有する患者、またはがんを有することが疑われる患者)を治療することを含む。いくつかの実施形態において、本方法は、本明細書に提供されるメチル化シグネチャを決定することと、メチル化シグネチャを決定した結果に基づいて、患者に治療を施すことと、を含む。治療は、薬学的化合物、ワクチンの投与、手術の実施、患者の画像診断、及び/または別の試験の実施を含み得る。いくつかの実施形態において、本開示の方法を、臨床スクリーニング、予後評価の方法、療法の結果を監視する方法、特定の療法的治療に応答する可能性が最も高い患者を特定するための方法、患者または対象を撮像する方法、ならびに薬物スクリーニング及び開発のための方法の一部として使用することができる。
【0157】
いくつかの実施形態において、本開示の方法は、対象においてがんを診断することを含む。「診断する」及び「診断」という用語は、本明細書で使用される場合、対象が所与の疾患もしくは状態に罹患しているか否か、または将来的に所与の疾患もしくは状態を発症する可能性があるか否かを、当業者が推定し、更に判定することができる方法を指す。当業者は、多くの場合、1つ以上の診断指標、例えば、メチル化バイオマーカー及び/またはメチル化シグネチャに基づいて診断を行い、これは、状態(例えば、がん)の存在、重症度、または非存在の指標である。
【0158】
診断に加えて、臨床的ながん予後は、がんの攻撃性及び腫瘍再発の可能性を判定し、最も効果的な療法を計画することに関する。更に正確な予後を行うことが可能である場合、またはがんを患う潜在的なリスクを評価することが可能である場合でさえ、適切な治療、及びいくつかの例において患者にそれほど過酷ではない治療を選択することが可能である。メチル化シグネチャに基づく対象の評価は、良好な予後を有し、及び/またはがんを発症するリスクが低く、療法または限定的な療法を必要としない対象を、がんを発症する可能性が高いか、またはがんの再発に苦しみ、より集中的な治療から利益を受け得る対象から分離するのに有用であり得る。したがって、「診断を行う」または「診断する」は、本明細書で使用される場合、本明細書に開示されるように、メチル化シグネチャの特定及び評価に基づいて、がんを発症するリスクの決定を行うこと、または予後を決定すること(臨床転帰の予測を(医学的治療の有無にかかわらず)提供することができる)、適切な治療(または治療が有効であるかどうか)を選択すること、または現在の治療を監視し、治療を潜在的に変更すること、を更に含む。
【0159】
いくつかの実施形態において、本開示の方法は、対象におけるがんの予防または治療を開始または継続するかどうかを決定することを含む。いくつかの実施形態において、本方法は、一定期間にわたって対象からの一連の生体試料を提供することと、一連の生体試料を分析して、各生体試料において本明細書に開示されるメチル化シグネチャを決定することと、各生体試料におけるメチル化シグネチャにおける任意の測定可能な変化を比較することと、を含む。一定期間にわたるメチル化シグネチャの任意の変化を使用して、がんを発症するリスクを予測し、臨床転帰を予測し、がんの予防もしくは療法を開始するか、または継続するかを決定し、現在の療法が、がんを効果的に治療しているかどうかを決定することができる。例えば、第1の時点は、治療の開始前に選択することができ、第2の時点は、治療開始後のある時点で選択することができる。メチル化シグネチャを、異なる時点から採取された試料の各々で測定することができ、定性的差異及び/または定量的差異が示されている。異なる試料からのメチル化シグネチャの変化は、対象におけるがんの発症リスク、予後、治療有効性の決定、及び/またはがんの進行と相関し得る。いくつかの実施形態において、本発明の方法及び組成物は、早期、例えば、疾患の症状が現れる前の疾患の治療または診断のためのものである。いくつかの実施形態において、本発明の方法及び組成物は、臨床ステージにおける疾患の治療または診断のためのものである。
【0160】
本明細書における別段の定義がない限り、本開示に関連して使用される科学用語及び技術用語は、当業者によって一般的に理解されている意味を有するものとする。例えば、本明細書に記載の細胞及び組織の培養、分子生物学、免疫学、微生物学、遺伝学、ならびにタンパク質及び核酸の化学及びハイブリダイゼーションと関連して使用される任意の命名法及び技術は、当該技術分野で周知であり、一般的に使用されている。用語の意味及び範囲は明確でなければならない。ただし、潜在的な曖昧さがある場合、本明細書に提供される定義は、任意の辞書または外在的な定義よりも優先される。更に、文脈によって別段の必要がない限り、単数形の用語は、複数形を含み、複数形の用語は、単数形を含むものとする。
4.材料及び方法
実験設計。30名の非がん対照からの全血試料を、John Radcliffe病院から得た(倫理審査による承認ID16/YH/0247及び18/WM/0237)。8名の患者からの膵炎血液試料を、John Radcliffe病院から得た。この研究は、Oxfordshire REC-A(10/H0604/51)によって承認され、研究番号10776としてUK NIHRポートフォリオに登録されている。PDAC患者は、Oxford Radcliffe Biobank(09/H0606/5+5、プロジェクト:19/A177)によって、この研究について合意し、24名の患者から全血試料を収集した。21名のHCC患者及び4名の肝硬変患者からの血漿試料の収集は、REC承認された(倫理審査による承認2/NE/0395、IRASプロジェクトID:116370)。試料サイズの計算は実施されなかった。試料サイズは、入手可能性に基づいて決定された。PDAC、HCC、膵炎、及び肝硬変の試料を、臨床的に診断された疾患を有する対象から収集した。非がん対照試料は、試料収集時のがん診断、またはがんの既往歴を有しない個体から収集した。
【0161】
この研究の主な目標は、TAPSを使用した全ゲノムメチル化配列決定による、がん及び対照におけるcfDNAの包括的な多次元特性決定であった。cfDNA TAPSライブラリを構築し、NovaSeq 6000シーケンサ(Illumina)で配列決定されたペアエンド150bpであった。技術的な詳細は、以下のセクションに記載されている。メチル化ラムダスパイクイン対照に基づいて計算された5mC変換が90%未満の試料は、下流の分析から除外された。
【0162】
cfDNA試料の収集及び調製。血液を、EDTAコーティングされたVacutainerに収集した。収集から4時間以内に、収集した血液試料から血漿を分離した。血漿を、4℃、1600xgで10分間、及び4℃、16000xgで10分間遠心分離することによって収集し、cfDNA精製のために-80℃で保存した。血漿からのcfDNAを、Qiamp Circulating Nuclei Acid Kit(Qiagen)を使用して抽出した。cfDNAを、Qubit Fluorometer(Life Technologies)によって定量した。
【0163】
キャリアDNA及びスパイクイン対照の調製。1ngのDNA鋳型、0.5μMのプライマー(順方向:5’-AGGCAACTTTATGCCCATGCAA-3’(配列番号2)、逆方向:5’-CCAAGGGGTTATGCTAGTTATTGC-3’(配列番号3))、及びHF緩衝液を含む1倍のPhusion High-Fidelity PCR Master Mix(Thermo Scientific)を含有する反応において、pNIC28-Bsa4プラスミド(Addgene、カタログ番号26103)のPCR増幅によって、キャリアDNAを調製した。CpG-メチル化ラムダDNA及び2kb非修飾スパイクイン対照DNAを、前述のように調製した。CpG-メチル化ラムダDNA、キャリアDNA、及び2kbの非修飾対照を、Covaris M220(ピーク入射電力-50W、デューティファクタ-20%、バースト当たりのサイクル数(cpb)-200、時間-150秒)によって断片化し、0.9~1.2×AMPure XPビーズ上でサイズ選択し、150~250bpの断片を選択した。
【0164】
配列決定アダプターの調製。アダプターオリゴ(5’-ACACTCTTTCCCTACACGACGCTCTTCCGATCT-3’(配列番号4);5’-/5Phos/GATCGGAAGAGCACACGTCT-3’(配列番号5))を、HPLC精製によりIDTから得た。アダプターオリゴを、15μMの各オリゴ、10mMのTris-Cl(pH=8.0)、0.1mMのEDTA(pH=8.0)及び50mMのNaClを含有する50μLの反応物において、95℃で2分間、95℃で20秒間の140サイクル(サイクルごとに温度を0.5℃下げる)、及び4℃で保持のプログラムで一緒にアニーリングした。次いで、アニーリングした15μMのIllumina多重化アダプターを、小さな単回使用バイアルに等分し、-80℃で保存した。
【0165】
mTet1CD酸化。mTet1CDを前述のように調製した。DNAを、50mMのHEPES緩衝液(pH8.0)、100μMの硫酸アンモニウム鉄(II)、1mMのα-ケトグルタレート、2mMのアスコルビン酸、2mMのジチオスレイトール、100mMのNaCl、1.2mMのATP及び4μMのmTet1CDを含有する50μlの反応物中で、37℃で80分間インキュベートした。その後、0.8UのプロテイナーゼK(New England Biolabs)を反応混合物に加え、50℃で1時間インキュベートした。生成物を、製造業者の指示に従って、Bio-Spin P-30 Gel Column(Bio-Rad)及び1.8×AMPure XPビーズでクリーンアップした。
【0166】
ピリジンボラン還元。35μlの水中の酸化されたDNAを、Eppendorf ThermoMixer中、600mMの酢酸ナトリウム溶液(pH4.3)及び1Mのピリジンボラン(Alfa Aesar)を含有する50μlの反応物中で、37℃、850r.p.m.で16時間かけて還元した。生成物を、Zymo-Spinカラムを使用して精製した。
【0167】
cfDNA TAPS。10ngのcfDNAを、0.15%のCpGメチル化ラムダDNA及び0.015%の非修飾の2kb対照によりスパイクインし、末端修復及びAテーリング反応に使用し、製造業者のプロトコルに従って、KAPA HyperPrepキットを用いてIllumina Multiplexingアダプターにライゲーションした。その後、100ngのキャリアDNAを、ライゲーションされたライブラリに追加し、試料を上記のようにmTet1CDで二重酸化し、ピリジンボランで還元した。変換されたライブラリを、KAPA Hifi Uracil Plus Polymeraseを用い、NEBNext(登録商標)Multiplex Oligos for Illumina(登録商標)(96 Unique Dual Index Primer Pairs)を使用して7サイクル増幅させ、1×AMPure XPビーズでクリーンアップした。cfDNA TAPSライブラリは、NovaSeq 6000シーケンサ(Illumina)で配列決定されたペアエンド150bpであった。
【0168】
TAPSマッピング及び前処理。生の配列決定リードを、trim_galore(バージョン0.6.2 www.bioinformatics.babraham.ac.uk/projects/trim_galore/)により処理し、アダプター及び低品質の塩基を、以下のパラメータ--ペア--長さ35--gzip--コア2でトリミングした。クリーンなリードを、以下のパラメータ-I 500、120、1000、20を用い、bwa mem(バージョン0.7.17-r1188)を使用したスパイクイン配列と組み合わせたヒト参照ゲノム(GRCh38 ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/001/405/GCA_000001405.15_GRCh38/seqs_for_alignment_pipelines.ucsc_ids/GCA_000001405.15_GRCh38_no_alt_analysis_set.fna.gz.)にアラインメントした。MAPQ<1のリードは、更なる分析から除外された。Picard MarkDuplicates(バージョン2.18.29-SNAPSHOT)を使用して、重複リードを特定した。MethylDackel抽出物(バージョン0.5.0 https://github.com/dpryan79/MethylDackel)を、以下のパラメータ-q10-p13-t4--mergeContext--OT 10,140,75,75--OB 10,140,75,75を使用したメチル化呼び出しに使用した。更なる分析のために、一般的なSNP(dbSNP153)、ブラックリストに登録された領域、セントロメア、及び性染色体と重複するCpG部位を除外した。
【0169】
cfDNA WGBS分析。cfDNA WGBSデータをEGAD00001004317からダウンロードした。生の配列決定リードを、trim_galore(バージョン0.6.2 www.bioinformatics.babraham.ac.uk/projects/trim_galore)により処理し、アダプター及び低品質の塩基を、以下のパラメータ--ペア--長さ35--gzip--コア2でトリミングした。クリーンなリードを、デフォルトパラメータを使用したbismark(Bismark Version:v0.22.0)を使用して、ヒト参照ゲノム(GRCh38)にアラインメントした。deduplicate_bismarkを重複除去に使用した。Samtoolsを使用して、-q 10により断片をフィルタリングし、適切な対にマッピングされたリードのみを、断片化分析に使用した。bismark_methylation_extractorを使用して、デフォルトパラメータにより、重複除去されたbamファイルからメチル化を抽出した。
【0170】
DNAメチル化及び特徴の過剰表現分析に関するPCA。ゲノムを1kbのウィンドウにビニングした。メチル化CpGの数を、配列決定された総CpG数で割り算したものを使用して、メチル化レベルを計算した。平均CpGカバレッジ(配列決定された総CpG数/CpG位置の総数)が2未満のウィンドウを、更なる分析のために除外した。PCA関数によって得られる各々の主成分に最も寄与する領域(各固有ベクトルの最大固有値)を決定するために、Dimdescをパラメータproba=0.01と共に使用した。Bedtools fisherを使用して、上位200の寄与領域(絶対相関値によって選別される)と選択されたゲノム特徴との間の重複の数を試験した。選択されたゲノム特徴は、Ensembleからの調節エレメント(ftp.ensembl.org/pub/release-97/regulation/homo_sapiens/homo_sapiens.GRCh38.Regulatory_Build.regulatory_features.20190329.gff.gz)及びUCSCからのCpGアイランド(hgdownload.soe.ucsc.edu/goldenPath/hg38/database/cpgIslandExt.txt.gz)を含んでいた。
【0171】
DNAメチル化シグネチャを用いた2クラス予測。2クラス予測モデルを訓練し、LOOアプローチに基づいて評価した。手短に言えば、1つの試料を試験セットとして保持し、残りの試料をモデル訓練に使用した。DMR(PDACの場合はプロモーター、及びHCCの場合はエンハンサー)を、t検定によって、訓練セットにおいて特定した(P値<0.002、メチル化の差>0.05)。各々の一個抜きフォールドにおいて、443~775個の差次的にメチル化されたエンハンサー及び160~318個の差次的にメチル化されたプロモーターが、それぞれ、非がん対照に対するHCC、及び非がん対照に対するPDACの特徴選択ステップにおいて特定された。合計して、交差検証プロセス中に1,521個のエンハンサー、及び531個のプロモーターが選択された。予測モデルを、cv.Glmnetを使用して、選択されたDMRに対して構築し、試験試料に対して検証した。この手順をN回繰り返した。ここで、Nは、試料の数である。ROC曲線を、cvglmモデルからのホールドアウトされた試験試料の予測スコアに基づいて、Rで調製した。肝硬変患者及びcfDNA WGBSデータを、独立した検証セットとして使用して、HCCモデルの性能を評価した。膵炎患者を、独立した検証セットとして使用して、PDACモデルの性能を評価した。アラインメントされたBAMファイルを、samtoolsを使用して、100M~200Mのリード対からダウンサンプリングした。各ダウンサンプリングされたセットについて、上述の方法を使用して、DMRを検出した。ref DMRは、LOO交差検証における一意DMRの合計として定義された。ダウンサンプリングされたセットと、ref DMR及び総ref DMRとの間で重複するDMRを分割することによって、ref DMRの割合を計算した。
【0172】
DMRのGO分析。HCC cfDNA中の差次的にメチル化されたエンハンサーによって調節される遺伝子を、GeneHancerデータベースを使用して特定した。PDACにおいて、差次的にメチル化されたプロモーターに最も近い遺伝子は、以下のRパッケージを使用して、関連するものとして特定された。AnnotationHub(バージョン2.18.0)、TxDb.Hsapiens.UCSC.hg38.knownGene(バージョン3.10.0)及びorg.Hs.eg.db(バージョン3.10.0)。これらの特定された遺伝子に対して、NCI-Nature Pathway Interactionデータベースに対してEnrichrツールを使用して、GO分析を実施した。
【0173】
組織参照マップ。CpGレベルの組織メチル化データを、6種類の公的な供給源から照合した(組織マップの生成のための公的なメチル化WGBSの供給源は、本開示に含まれないが、要求に応じて利用可能にすることができる)。疾患の性別特異的かつ低いカバレッジの試料をフィルタリングした後、144個の健康な成人組織試料を保持し、32の生理学的に異なる組織群にグループ分けした(cfTAPSコホートにおける各患者についてのcfDNA組織寄与に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。144個の試料のうちの133個が、すでにhg38にアラインメントされており、残りの11個の試料は、UCSC hgLiftOverツールを使用して、hg19からhg38に変換された。
【0174】
Moss et al.と同様の組織特異的DMR発見アルゴリズムを使用して、Ensembl Regulatory Buildから約79,000個のエンハンサーをフィルタリングした。具体的には、このアルゴリズムは、参照アトラス内の各組織群についてのペアワイズ一対全て(one-vs-all)比較を実施し、問題の組織群にわたって最大のメチル化の差の中央値と、一致したメチル化を示す領域を選択する。Moss et al.と同様に、ペアワイズ組織群相関も計算され、各組織群を第1及び第2の最も相関の高い組織から最もよく分離するDMRが含まれていた。
【0175】
非負の線形最小二乗回帰による組織デコンボリューション。組織デコンボリューションは、非負の線形最小二乗回帰を使用して実施され、Python 3.8におけるScipyの最適化関数を使用して実装された。組織参照マトリックスA、及び試料sにおいて観察されたメチル化比のベクトルysが与えられたら、組織寄与xは、以下の最小化問題を解くことによって推定された。
【0176】
min||Ax-ys||2
x≧0とする。
【0177】
断片化分析。DNA断片の長さを、Samtoolsを使用してアラインメントファイルから得た。断片化プロファイルを、10bpの長さ範囲のビンにおけるcfDNA断片の割合として計算した。PCA分析及びプロットをRで生成した。
【0178】
断片化に基づく予測のために、10bpの長さ範囲のビンにおけるcfDNA断片(300~500bp)の割合を計算した。cv.glmnet法を使用して、一個抜き(leave-one-out)アプローチによって、モデルを構築し、訓練した。ROC曲線を、検証からの予測スコアに基づいて、Rで調製した。
【0179】
CNV分析。各試料についてのアラインメントファイルを、samtoolsビューにより、225Mのリード対にダウンサンプリングした。QDNAseqパッケージを、コピー数変動分析に使用した。ビンアノテーションを、QDNAseq.hg38(github.com/asntech/QDNAseq.hg38)からダウンロードし、ビンサイズ100kbを使用した。更なる分析のために、ブラックリストに登録された領域、または80未満のマッピング可能性を有する領域を除外した。カットオフ0.8及び1.2を使用して、callBins関数でそれぞれ、コピー数の損失及びゲインを定義した。長さ範囲が500kbより大きいコピー数異常を有する患者を、CNVを有する患者として分類した。
【0180】
3クラス予測モデル。3クラス予測モデルを訓練し、LOOアプローチに基づいて評価した。DNAメチル化のために、候補特徴は、最初に、前述のように調節領域へのマッピングを包含する824,320個の1kbウィンドウに絞り込まれた。メチル化モデルは、t検定を用いたペアワイズ比較に基づいてDMRを選択することによって、がん型に特異的なメチル化変化を捕捉することを目的とする。次いで、DMRをP値によってランク付けし、各ペアワイズ比較における上位5つのDMRをモデル訓練のために選択した。予測モデルは、caretパッケージ(訓練方法=「svmLinear2」)に実装されたSVMモデルを使用した訓練セットの中から選択されたDMRに対して構築され、試験試料に対して検証された。この手順をN回繰り返した。ここで、Nは、試料の数である。組織寄与及び断片化の割合のために、生マトリックスを使用して、DMRと同じ方法に従ってモデルを構築した。これらの3つのモデルは、3つのモダリティにわたって平均化された(平均)予測をとることによって統合され、各症例で選択された予測は、最大の平均化された予測スコアを有するものであった。
【0181】
前述の詳細な説明及び付随する実施例は、単なる例示にすぎず、本開示の範囲を限定するものとして解釈されるべきではなく、本開示の範囲は、専ら添付の特許請求の範囲及びそれらの等価物によって定義されることを理解されたい。
【0182】
開示される実施形態に対する様々な変更及び修正は、当業者には明白であろう。本開示の化学構造、置換基、誘導体、中間体、合成物、組成物、製剤、または使用方法に関連するものを含むがこれらに限定されない、そのような変更及び修正は、その趣旨及び範囲から逸脱することなく行われ得る。
【実施例】
【0183】
5.実施例
本明細書に記載の本開示の方法の他の好適な修正及び適合は、容易に適用可能かつ認識可能であり、本開示の範囲、または本明細書に開示の態様及び実施形態を逸脱することなく、好適な同等物を使用して行われてよいことは当業者には容易に明らかであろう。本開示を詳細に説明したので、以下の実施例を参照することにより、本開示がより明確に理解され、これらは、単に開示のいくつかの態様及び実施形態を説明することのみを意図し、開示の範囲を制限するものとみなすべきではない。本明細書において参照される全てのジャーナルの参照、米国特許、及び刊行物の開示は、参照によりそれらの全体が本明細書に組み込まれる。
【0184】
本開示は、以下の非限定的な実施例によって示される複数の態様を有する。
実施例1
cfDNA配列決定のためのTAPSの適応。実験を実施して、低入力cfDNA(10ng、1~3mLの血漿から精製された)で機能するように、TAPSプロトコルを最適化した。手短に言えば、まず、10ngのcfDNAをIlluminaアダプターにライゲーションし、次いで、TET酸化及びピリジンボラン(PyBr)還元ステップの前に、100ngのキャリアDNAを試料に追加する(
図1A)。それにより、キャリアDNAの追加が、ワークフロー中のcfDNAの回収を改善し、標準的なTAPSプロトコルと比較して、より高いライブラリ収率をもたらすことを見出した(
図5A)。その後、cfDNA中の5-メチルシトシン(5mC)及び5-ヒドロキシメチルシトシン(5hmC)は、mTet1CD酵素によって5-カルボキシルシトシン(5caC)へと酸化され、ジヒドロウラシル(DHU)へと還元され、これが最終的なPCRステップにおいて、Tとして増幅される(
図1A)。
【0185】
cfTAPSを87個のcfDNA試料に適用した。ライブラリを、平均360Mのリード対(11.6×平均深度、範囲8.2~22×)に対して配列決定し、それぞれ、94.8%及び77.1%の高い一意のマッピングレート及び一意の重複除去されたマッピングレートを得た(
図1B、配列決定統計に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。マッピングされたリードのうち、99.95%が、ヒトゲノムにマッピングされた(
図5B)。比較すると、近年のcfDNA全ゲノム亜硫酸水素塩配列決定(WGBS)は、同様の深度(平均371Mのリード対)で配列決定し、(5mLの血漿から)より多くのcfDNAインプットを使用したにもかかわらず、有意に低い一意のマッピングレート(63.6%)及び一意の重複除去されたマッピングレート(53.9%)が得られた(
図5C)。このことは、より少ないcfDNAインプットを必要としつつ、cfDNA WGBSよりも高品質であり、より複雑なデータを生成するcfTAPSの利点を強調するものである。
【0186】
その後、5mCを検出するためのcfTAPSの正確さを、既知の位置に修飾シトシン及び非修飾シトシンを有するスパイクイン対照に基づいて評価した。CpGメチル化ラムダDNAを使用して、5mCの変換を推定した。2つの試料は、85%未満の低い変換率を有しており、下流の分析から除外された(配列決定統計に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。残りの85個の試料は、97.0%の平均5mC変換率、または3.0%の偽陰性率(5mCの非変換率)を有していた(
図1C)。非修飾アンプリコンスパイクインに基づいて推定された偽陽性率(非修飾Cの変換率)は、0.28%であり、cfTAPSが、cfDNAにおける5mCの高感度かつ特異的な検出を可能にすることを確認する(
図1C)。技術的反復間のcfTAPSの高い再現性が、更に確認された(
図5D)。
実施例2
cfTAPSからの全ゲノムDNAメチル化。次に、初期の品質管理に合格した85個のcfDNA試料中のcfDNAメチロームを特性決定する実験を行った。コホートは、HCCを有する21名の患者、PDACを有する23名の患者、30名の非がん対照、肝硬変を有する4名の患者、及び膵炎を有する7名の患者からの試料を含んでいた(
図6A)。肝硬変及び膵炎は、それぞれ肝臓及び膵臓に影響を及ぼす前がん性状態である。コホート中のほとんどのPDAC及びHCC患者は、非転移性のステージにあり、PDAC患者の52%及び67%のHCC患者がステージI及びIIであった(
図2A、cfTAPS研究コホートに関連する臨床データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。21名のHCC患者のうち、4名(19%)のみがAPFレベルの上昇(20ng/mLを超える)を有していた。CA19-9測定を行った18名のPDAC患者のうち、16名(89%)が、CA19-9の上昇レベル(37U/mLを超える)を有していた。しかしながら、CA19-9レベルは、炎症性疾患を含む非悪性状態でしばしば上昇することに留意することが重要である。注目すべきことに、非がん対照は、内視鏡診療所から収集され、クローン病及び大腸炎などの胃腸炎症状態が多かった(cfTAPS研究コホートに関連する臨床データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。これらの非がん対照を、がん患者と区別することは、典型的に健康な対照群よりも困難であるが、このことは、高齢集団における診断検査のより現実的な比較を提供し得る。
【0187】
がん及び対照試料中のcfDNAの全般的なメチル化レベルを分析した。cfDNAメチル化は、ほとんどのCpG部位が完全にメチル化されているか、またはメチル化されていない全ての群において、典型的な二峰性分布を示した(
図5B)。対照試料中の平均CpGメチル化レベルは、75.5%であり、がんcfDNAにおいて同様であった(HCC:74.9%、PDAC:75.1%)。HCCにおける以前に報告された全般的なcfDNAの低いメチル化は、後期または大きな腫瘍サイズを有する少数の試料においてのみ観察された(
図2B及び
図6C~6F)。これとは対照的に、対照と比較して、がん患者間では、1Mbのゲノムウィンドウにおけるメチル化のより高い分散が観察された(
図6G~6H)。
【0188】
次いで、全ゲノムcfDNAメチル化シグネチャが、がん患者と非がん対照とを識別する可能性を有するかどうかを調べるために実験を行った。1kbのゲノムウィンドウにおけるcfDNAメチル化の主成分分析(PCA)を最初に行った。HCC(
図2C)及びPDAC試料(
図2D)の両方が、それぞれ、主成分2(PC2)及びPC1において、対照から部分的に分離したことを示した。炎症性患者(クローン病及び大腸炎)は、他の非がん対照から分離しないことに留意されたい(
図6I)。次いで、がん/対照分離に最も寄与したウィンドウがゲノム中で濃縮された場所を調べるために実験を行った。結果は、HCCの場合にPC2との相関が最も高い上位200ウィンドウがエンハンサー中で濃縮されたことを示した(
図2E)。逆に、PDACの場合にPC1と最も高度に相関する200個のウィンドウは、プロモーター中で高度に濃縮されており(
図2E)、このことは、異なるがん型が異なるcfDNAメチル化シグナルを有することを示唆している。
実施例3
cfTAPSからの差次的なDNAメチル化。調節領域におけるメチル化パターンが、教師なし分析において、がんと対照との間の区別に有意に寄与したため、それぞれHCC及びPDAC予測のためのエンハンサー及びプロモーター領域におけるcfDNAメチル化の予測可能性を、一個抜き(LOO)交差検証による教師あり機械学習アプローチを使用して調べるために、実験を行った。手短に言えば、LOO交差検証の各ラウンドにおいて、1つの試料を検証セットとして使用し、残りの試料をモデル訓練に使用した。各フォールド内で、それぞれHCC及びPDACについて差次的にメチル化されたエンハンサー及びプロモーターを特定し、これを使用して、各々のがん型を対照試料から区別するように、正規化された一般化された線形モデル分類子(glmnet)を訓練した。次いで、このモデルを、各フォールドにおけるホールドアウト試験試料について評価した(
図7A)。肝硬変及び膵炎試料は、モデル構築には含まれなかったが、がんと前悪性状態とを識別するための分類子の性能を評価するための独立した検証セットとして使用された。
【0189】
HCCの有意な予測(AUC=0.99)を、差次的にメチル化されたエンハンサーに基づいて達成した(
図2F~2G、対照に対するHCC予測に使用される差次的にメチル化されたエンハンサーに関する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。更に、予測スコアに基づいて、4個の肝硬変試料のうちの3個をHCCから区別することができ、このことは、そのモデルが、がん特異的特徴を検出することができることを示唆している(
図7B)。次いで、差次的にメチル化されたエンハンサーに対して遺伝子オントロジー分析を実施し、RAC1活性ならびにIL8媒介性シグナル伝達及びCXCR1媒介性シグナル伝達の調節を含む、肝臓癌において一般的に影響を受けるシグナル伝達経路における有意な濃縮を見出した(
図7C)。例えば、HCC患者のcfDNAにおいて、RAC1及びRhoシグナル伝達経路に関与するヒト肝臓癌に対する腫瘍抑制因子であるDLC1遺伝子の発現を調節するエンハンサーの有意な高メチル化が観察された(
図7D)。
【0190】
PDACの正確な予測(AUC=0.98)を、差次的にメチル化されたプロモーターに基づいて達成した(
図2H~2I、対照に対するPDAC予測に使用される差次的にメチル化されたプロモーターに関する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。同様に、分類子は、膵炎試料について何ら訓練されていないにもかかわらず、7個の膵炎試料のうち6個を非がんと予測することができた(
図7E)。PDAC cfDNAにおける差次的にメチル化されたプロモーターは、RB1調節及びp38シグナル伝達経路を含む、PDACによって影響を受けるシグナル伝達経路において濃縮された(
図7F)。例えば、結果は、十分に研究された腫瘍抑制遺伝子であるRB1遺伝子プロモーターにおいて有意な高メチル化を示した(
図7G)。RB1プロモーターの高メチル化は、ヒトがんにおいて以前に見出され、RB1の下方調節は、膵臓癌において報告された。
【0191】
最後に、HCCモデルは、4名のHCC患者及び4名の非がん対照を含む最近のcfDNA WGBS研究からの独立したデータセットで検証された。結果は、cfTAPSデータから特定された差次的にメチル化されたエンハンサーに対して構築されたモデルが、この外部データセットからの全てのHCC及び非がん対照を正しく分類することができたことを示した(
図7H)。cfDNAからのデノボの差次的なメチル化分析には、cfTAPSの高い配列決定深度が不可欠であり、データを100~200Mのリード対にダウンサンプリングしたときに、特定された差次メチル化領域(DMR)が有意に減少したことに留意することが重要である(
図7I)。まとめると、cfTAPSは、cfDNAにおけるDMRの全ゲノム発見を可能にし、調節領域における異なるメチル化パターンは、HCC及びPDACの正確な予測を可能にする。
実施例4
cfTAPSは、起源の組織を知らせる。cfDNAメチル化は、起源の組織の情報を提供することが示されている。ほとんどのアプローチは、ヒトゲノム中のCpGの1%未満を網羅する450Kメチル化アレイ組織データを使用して、cfDNAメチル化からの組織寄与を推察する。cfDNAデコンボリューションのためにcfTAPSからの全ゲノム情報を更に利用するために、CpGレベルメチル化データを、144の公的に利用可能な組織及び血液細胞のWGBSから照合し、肝臓腫瘍組織を含む32の生理学的に異なる組織及び血液細胞型に層別化した(組織マップの生成のための公的なメチル化WGBSデータの供給源は、本開示に含まれないが、要求に応じて利用可能にすることができる)。エンハンサー領域における組織特異的なDNAメチル化の存在率を考慮して、組織メチル化のエンハンサーによって集約された参照マップを構築した。得られたメチル化参照マップは、血液及び免疫細胞型、更には生理学的に関連する固体組織の良好なクラスタリングを示す(
図8A)。
【0192】
cfTAPS試料中の組織寄与を、非負の線形最小二乗回帰(NNLS)を実施することによって計算した。cfDNA組織寄与は、がん群と対照群との間で広く類似しており、以前の報告と一致して、血液及び免疫細胞が優勢であり、固形組織の割合が低い(
図3A、
図8B、cfTAPSコホートにおける各患者についてのcfDNA組織寄与に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる)。重要なことに、HCC単独において、有意に増加した肝臓腫瘍寄与が観察され(
図3B、対応ありt検定、P値0.0016)、PDAC試料において、有意に増加したメモリーT細胞寄与が観察された(対応ありt検定、P値0.028)(
図8C)。正規化された一般化された線形モデルを、組織寄与に基づいて訓練し、LOO交差検証を使用して全ての試料を評価し、両方のがん型の試料の大部分を正しく分離することが示された(非がん対照に対するHCC:AUC=0.77、非がん対照に対するPDAC:AUC=0.81)。しかしながら、これらのモデルは、メチル化に基づくモデルと比較して、膵炎及び肝硬変の区別において、劣っている(
図9D~8I)。組織デコンボリューションは、現在、公的なWGBSデータの利用可能性によって制限されている。それにもかかわらず、これらの結果は、cfTAPSが早期がん検出のための貴重な起源の組織の情報を提供することを示す。
実施例5
cfTAPSからの断片化パターン。cfTAPSの主な目的は、DNAメチル化配列決定であるが、それは、修飾シトシンにおいて塩基変化のみを誘導し、したがって、DNAの大部分を無傷なままに保つ。したがって、追加の遺伝子情報をcfTAPSデータから抽出して、早期がん検出の感度を更に改善することができる。最初に、cfTAPSデータからCNVを調べるための実験を行った。非進行がんコホートで予想されるように、CNVは、4名のHCC患者及び3名のPDAC患者でのみ予測された(
図9A~9B)。次に、cfTAPSが、信頼性の高いcfDNA断片化情報を保持することができるかどうかを調べるための実験を行い、これは、近年、がん発症中に有意に変化することが示されており、したがって、がん検出アッセイに採用されている。
【0193】
cfTAPSにより検出されたcfDNA断片化パターンは、全ゲノム配列決定(WGS)によって生成されたcfDNA断片化パターンと一致し、167bpでの優勢なピーク、約320bpでの第2のピーク、及び167bp未満に10bp周期で、より小さいピークを有し、ヌクレオソーム断片化パターンを反映している(
図3C、各個体における断片の長さ分布に関連する生データは、本開示に含まれないが、要求に応じて利用可能にすることができる)ことが、まず確認された。対照的に、断片化パターンは、おそらくDNA損傷に起因して、cfDNA断片化プロファイルにおける10bpの振動が失われたため、以前に公開されたcfDNA WGBSにおいて、明らかに異なっていた(
図10A)。以前のcfDNA WGSと一致して、結果は、がん患者が、非がん対照と比較して、150bp未満のcfDNA断片のより高い頻度を有することを示し(クラスカル・ウォリス検定、HCC:P値6.871e-06、PDAC:P値0.006731)、より低い割合の310~500bpの長い断片を有することを示し(クラスカル・ウォリス検定、HCC:P値2.627e-07、PDAC:P値1.263e-06)(
図3D)、cfTAPSにおけるcfDNA断片化情報の忠実な保存を更に確認する。
【0194】
次いで、cfTAPSを使用したcfDNA断片化プロファイルの特性決定のための新しいアプローチを開発した。手短に言えば、cfDNA断片化分布を10bpのビンに分割し、各10bpのビンにおける断片の割合を計算した(
図3C)。10bpのビン中のcfDNAの長い断片(300~500bp)の長さの割合が、PCAによる教師なし分析において、PDAC及びHCCを対照から分離した(
図3E)。結果は更に、このcfDNA断片化シグネチャを使用して、高い正確さで、HCC及びPDACを非がん対照から区別することができることを示した(HCC AUC=0.92、PDAC AUC=0.84)(
図10B、10C、10E、及び10F)。しかしながら、このアプローチは、メチル化に基づく分類子と比較して、がんを肝硬変及び膵炎から区別することが、あまり正確ではなく(
図10D及び10G)、断片化情報が、がん特異的でないことを示唆している。
実施例6
cfTAPSによる複数がん検出。次いで、複数がん検出のためのcfTAPSの有用性を調べるための実験を実施した。各ペアワイズ比較の上位5のDMR(HCCに対する非がん対照、PDACに対する非がん対照、PDACに対するHCC)を、複数がんの差次的メチル化モデルの特徴として選択した。血液試料が各群に由来するそれぞれの確率を推定するために、サポートベクターマシン(SVM)モデルを訓練した。同様のモデルを、組織寄与及び断片化プロファイルを使用して構築した。LOO交差検証を使用して、メチル化モデルが、0.77の全体的な正確さを達成することができるという結果が示され、これは、組織寄与モデル及び断片化プロファイルモデルを上回る(それぞれの正確さは0.62及び0.46、
図4A、
図11A)。
【0195】
複数がん予測モデルを更に強化するために、差次的なメチル化、組織寄与及び断片化プロファイルを組み合わせたマルチモーダル分類子を構築した(
図4B)。この統合モデルは、3つのモダリティにわたって平均化されたスコアをとり、各試料について最も信頼性の高い予測を使用した。組み合わせたモデルの全体的な正確さは、0.86であり(74のうちの64が正しく分類された)、対照を任意のがん型から区別するための正確さは、0.92であり(
図4C)、がん型予測のためにマルチモーダル情報を組み込むことの利点を強調している。最後に、複数がん予測に使用されるDMRを探索した(
図11B、HCC、PDAC、及び対照予測に使用されるメチル化特徴に関連するデータは、本開示に含まれないが、要求に応じて利用可能にすることができる)。興味深いことに、これらの領域の近くの遺伝子が、Notch及びWntシグナル伝達、ならびにEGFR(ErbB)シグナル伝達において濃縮されており、これらの潜在的な複数がんバイオマーカーに生物学的サポートを提供するという結果が示された(
図11C)。
【図面の簡単な説明】
【0196】
【
図1】TAPSによるcfDNA分析。(A)cfDNA分析のためのTAPSアプローチの概略図。cfDNAは、1~3mLの血漿から単離される。10ngのcfDNAを、Illumina配列決定アダプターにライゲーションし、100ngのキャリアDNAでいっぱいに満たす。その後、DNA中の5mC及び5hmCを、mTet1CD酵素によって5caCへと酸化し、PyBrによってDHUへと還元し、増幅し、最終的な配列決定において、Tとして検出される。TAPSデータの計算分析は、DNAメチル化、起源の組織、断片化パターン及びCNVを含む複数のcfDNA特徴の同時特性決定を可能にする。(B)87個のcfDNA TAPSライブラリにおける総リード、一意にマッピングされたリード及び一意にマッピングされたPCR重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。(C)既知の位置に修飾または非修飾シトシンを有するスパイクイン対照に基づく、85個のcfDNA TAPSライブラリにおける5mCの変換率及び擬陽性率。各々の点は、個々の試料を表す。
【
図2A】臨床試料におけるcfDNAメチル化。本試験に含まれる21名のHCC患者及び23名のPDAC患者のがんステージ分布。
【
図2B】臨床試料におけるcfDNAメチル化。非がん対照、HCC及びPDAC cfDNAにおけるCpGゲノム修飾レベル当たりの平均。各々の点は、個々の試料を表す。
【
図2C】臨床試料におけるcfDNAメチル化。非がん対照及びHCCにおける、1kbゲノムウィンドウにおけるcfDNAメチル化のPCAプロット。
【
図2D】臨床試料におけるcfDNAメチル化。非がん対照及びPDACにおける、1kbゲノムウィンドウにおけるcfDNAメチル化のPCAプロット。
【
図2E】臨床試料におけるcfDNAメチル化。領域に対する過剰発現分析は、調節領域においてHCCについてPC2、及びPDACについてPC1と最も相関していた。
【
図2F】臨床試料におけるcfDNAメチル化。HCC及び非がん対照における差次的にメチル化されたエンハンサーに基づくモデル分類性能の受信者操作特徴(ROC)曲線(n=51、HCC=21、非がん対照=30)。
【
図2G】臨床試料におけるcfDNAメチル化。HCC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、HCCとして予測した。
【
図2H】臨床試料におけるcfDNAメチル化。PDACと非がん対照との間の差次的にメチル化されたエンハンサーに基づくモデル分類性能のROC曲線(n=53、PDAC=23、非がん対照=30)。
【
図2I】臨床試料におけるcfDNAメチル化。PDAC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、PDACとして予測した。
【
図3】cfTAPSは、cfDNAにおける起源の組織及び断片化パターンの分析を可能にする。(A)NNLSによって推定される非がん個体における平均組織寄与。1.5%未満の組織寄与は、「その他」としてまとめられている。(B)非がん、HCC及びPDAC群内の推定肝臓癌寄与を示すボックスプロット。統計的有意性を、対応ありt検定により評価した。n.s.-有意でない。(C)3つの群におけるcfDNA断片の長さ分布。各試料について、長いcfDNA断片(300~500bp)の10塩基対間隔における割合(P)を、PCA分析及び機械学習のための断片化特徴として使用した。(D)非がん対照、PDAC、及びHCCにおける短い(70~150bp)及び長い(300~500bp)断片の割合を示すボックスプロット。クラスカル・ウォリス検定を実施して、群間の断片サイズ分布の差を検定した。統計的に有意な差は、アスタリスクが付けられる(*P値<0.05、**P値<0.01、***P値<0.001、****P値<0.0001)。(E)非がん対照及びHCC(左パネル)、ならびに非がん対照及びPDAC(右パネル)におけるcfDNA 10bp断片の割合のPCAプロット。
【
図4】cfTAPSからのマルチモーダル特徴を統合することで、複数がん検出を強化する。(A)複数がん予測に対する個々のモデルの性能、及び各患者について予測された確率を示すヒートマップ。各々の垂直列は、患者である。検出のはい/いいえは、特定の特徴に基づいて患者が正しく分類されるか、または誤って分類されることを意味する。予測スコアは、特定の特徴に基づいて患者を特定の群に分類する確率を意味する。(B)複数がん予測のために、cfTAPSデータから抽出された複数の特徴(DNAメチル化、組織寄与及び断片化の割合)を統合する方法を詳述する概略図。(C)LOO交差検証で計算された実際の患者のステータス及び予測患者ステータス。
【
図5】cfDNA TAPS。(A)増幅後のクリーンアップの後の10種類の代表的なcfDNA TAPSライブラリのアガロースゲル。全てのcfDNA TAPSライブラリを、10ngのcfDNAから調製し、7回のPCRサイクルで増幅させた。(B)87個のcfDNA TAPSライブラリ中のhg38、スパイクイン、及びキャリアDNAについてマッピングされたリード対の数。全リード対と比較した、マッピングされたリード対の平均割合が、棒グラフの上に示されている。エラーバーは、標準誤差を表す。(C)cfDNA WGBS(EGAD00001004317)(24)における総リード、一意にマッピングされたリード及び一意にマッピングされたPCR重複除去されたリードの数。リードの総数、ならびに総リードと比較した一意にマッピングされたリード及び重複除去されたリードの平均割合が、棒グラフの上に示される。エラーバーは、標準誤差を表す。(D)低深度2.6×に配列決定された同じcfDNA試料から調製されたcfDNA TAPSライブラリの技術的反復間の相関関係。メチル化を100kbウィンドウで計算した。
【
図6A】がん及び対照における全般的なcfDNAメチル化パターン。cfTAPSコホートに含まれる膵炎、肝硬変、PDAC、HCC及び非がん対照患者の年齢及び性別の分布。
【
図6B】がん及び対照における全般的なcfDNAメチル化パターン。非がん対照、HCC及びPDACにおける、cfDNAにおけるCpG修飾のゲノムワイド分布。バープロットは、各群についての平均CpG修飾の分布を示す。オーバーレイラインプロットは、各患者におけるCpGメチル化分布を示す。
【
図6C】がん及び対照における全般的なcfDNAメチル化パターン。HCC患者における平均cfDNA CpG修飾レベルと腫瘍サイズ(mm)との相関プロット。
【
図6D】がん及び対照における全般的なcfDNAメチル化パターン。HCC患者における平均cfDNA CpG修飾レベルと腫瘍ステージとの相関プロット。
【
図6E】がん及び対照における全般的なcfDNAメチル化パターン。PDAC患者についての腫瘍サイズ(mm)の相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの95%信頼区間を表す。ピアソン相関係数(cor)及びP値がプロットに示されている。
【
図6F】がん及び対照における全般的なcfDNAメチル化パターン。PDAC患者についての腫瘍ステージの相関プロット。各々の点は、個々の患者を表す。破線は、線形回帰に適合した線形傾向を表す。影付き領域は、適合モデルの95%信頼区間を表す。ピアソン相関係数(cor)及びP値がプロットに示されている。
【
図6G】がん及び対照における全般的なcfDNAメチル化パターン。非がん対照、HCC及びPDACのcfDNAにおける染色体4上のCpG修飾レベルの分布。各線は個々の患者を表す。平均CpG修飾値を、染色体4に沿って1Mbウィンドウごとに計算し、ガウス平滑化した(平滑化ウィンドウサイズ10)。
【
図6H】がん及び対照における全般的なcfDNAメチル化パターン。非がん対照、HCC及びPDACにおける、1Mbゲノムウィンドウにおけるメチル化分散。
【
図6I】がん及び対照における全般的なcfDNAメチル化パターン。非がん対照及びHCC、非がん対象及びPDACにおける、1kbのゲノムウィンドウにおけるcfDNAメチル化のPCAプロット(クローン病及び大腸炎は、それぞれ緑色及び黄色の着色されている)。
【
図7A】cfDNA DMRに基づくHCC及びPDAC予測。LOOモデルの訓練及び検証アプローチの概要。試料の総数は、nとラベル付けされている。各々の繰り返しにおいて、モデル訓練セットは、n-1個の試料からなる。差次的にメチル化されたエンハンサー(HCCの場合)またはプロモーター(PDACの場合)を、モデル構築のために選択した。予測モデルを、各フォールドにおけるホールドアウト試験試料について評価した。肝硬変及び膵炎試料は、DMR特定及びモデル構築には含まれなかった。
【
図7B】cfDNA DMRに基づくHCC及びPDAC予測。肝硬変試料のHCCがん予測スコア。各青色の点は、個々のLOOモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。
【
図7C】cfDNA DMRに基づくHCC及びPDAC予測。NCI-Nature Pathway Interactionに対するEnrichrを使用した、HCC cfDNAに基づく差次的にメチル化されたエンハンサーに関連する、遺伝子の遺伝子オントロジー分析(P値<0.002)。P値に基づいて選択された上位10のカテゴリが、グラフに示される。遺伝子-エンハンサー相互作用を、GeneHancer参照データベースを使用して割り当てた。
【
図7D】cfDNA DMRに基づくHCC及びPDAC予測。DLC1遺伝子についてのHCC cfDNAにおける代表的な差次的にメチル化されたエンハンサーのメチル化(両側t検定のP値=8.765e-06)。
【
図7E】cfDNA DMRに基づくHCC及びPDAC予測。膵炎試料のPDACがん予測スコア。各黄色の点は、個々のLOOモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、PDACとして予測した。
【
図7F】cfDNA DMRに基づくHCC及びPDAC予測。NCI-Nature Pathway Interactionに対するEnrichrを使用した、PDAC cfDNAに基づく差次的にメチル化されたプロモーターに最も近い遺伝子の遺伝子オントロジー分析(P値<0.002)。P値に基づいて選択された上位10のカテゴリが、グラフ上に示される。
【
図7G】cfDNA DMRに基づくHCC及びPDAC予測。RB1遺伝子についてのPDAC cfDNAにおける代表的な差次的にメチル化されたプロモーターのメチル化(両側t検定のP値=0.0017)。
【
図7H】cfDNA DMRに基づくHCC及びPDAC予測。独立したcfDNA WGBSデータセット(EGAD00001004317)のHCCがん予測スコア。各点は、個々のLOOモデルの予測スコアを表す。灰色の点は、非がん対照に属し、赤色の点は、HCCに属する。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。
【
図7I】cfDNA DMRに基づくHCC及びPDAC予測。ダウンサンプリングされたリードにおいて検出され得るref DMRの割合。元のLOOモデル訓練で特定されたDMRを、ref DMRとして処理した。
【
図8A】cfDNAの起源の組織。参照組織メチル化アトラスのt-SNEプロット。
【
図8B】cfDNAの起源の組織。HCC及びPDAC個体における平均組織寄与。
【
図8C】cfDNAの起源の組織。非がん、HCC及びPDAC cfDNA試料における推定T細胞寄与を示すボックスプロット。
【
図8D】cfDNAの起源の組織。非がんに対してHCCを分類するために組織寄与を使用したモデル性能のROC曲線。
【
図8E】cfDNAの起源の組織。組織寄与に対して訓練された分類子を使用した、HCC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、HCCとして予測した。
【
図8F】cfDNAの起源の組織。HCC対非がん分類子を使用した肝硬変試料のがんスコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。
【
図8G】cfDNAの起源の組織。対照に対してPDACを分類するために組織寄与を使用したモデル性能のROC曲線。
【
図8H】cfDNAの起源の組織。組織寄与に基づいて構築された分類子を使用した、PDAC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、PDACとして予測した。
【
図8I】cfDNAの起源の組織。PDAC対非がん分類子を使用した膵炎試料のPDACがんスコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、特定の試料の平均確率スコアを示す。破線は、確率スコア閾値を表す。この閾値を上回る平均確率スコアを有する試料を、PDACとして予測した。
【
図9A】cfDNAにおけるCNV分析。100kbのビンにおけるcfDNAからのCNV推定ヒートマップ。
【
図9B】cfDNAにおけるCNV分析。500kより大きなCNVを有するcfDNA試料。
【
図10】がん予測のためのcfDNA断片化パターン。(A)公的な全ゲノム亜硫酸水素塩配列決定データにおけるcfDNAの断片サイズ分布。特定の長さの断片の数を断片の総数で割り算することによって、頻度を計算した。(B)10bpのビンにおける長いcfDNA断片(300~500bp)の割合を特徴として使用する、一般化された線形モデルからのHCC及び非がん対照予測スコアのROC曲線。(C)LOO交差検証を使用して訓練された分類子におけるHCC及び非がん対照のがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、HCCとして予測した。(D)これらの分類子における肝硬変試料のHCCがん予測スコア。各青色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、HCCとして予測した。(E)10bpのビンにおける長いcfDNA断片(300~500bp)の割合を特徴として使用する、一般化された線形モデルからのPDAC及び非がん対照予測スコアのROC曲線。(F)10bpの長さ範囲におけるcfDNA断片頻度に基づいて構築された分類子におけるPDAC及び非がん対照のLOOがん予測スコア。破線は、確率スコア閾値を表す。この閾値を上回る確率スコアを有する試料を、PDACとして予測した。(G)10bpの長さ範囲におけるcfDNA断片頻度に基づいて構築された分類子における膵炎試料のPDACがん予測スコア。各黄色の点は、個々のモデルの予測スコアを表す。黒色の点は、平均予測スコアを示す。破線は、確率スコア閾値を表し、この閾値を上回る平均確率スコアを有する試料を、PDACとして予測した。
【
図11A】cfTAPSによる複数がん検出。3クラス分類におけるメチル化、組織寄与及び断片化の割合モデルの性能。上のパネルは、各分類子の正確さを示し、下のパネルは、LOO交差検証分析における実際の患者ステータスと予測患者ステータスを示す。
【
図11B】cfTAPSによる複数がん検出。がん型予測に使用される選択されたゲノム領域のメチル化ステータスを示すヒートマップ。
【
図11C】cfTAPSによる複数がん検出。3クラス分類のための選択されたDMRの最も近い遺伝子に対するNCI-Nature Pathway Interactionに対するEnrichrを使用した遺伝子オントロジー分析。
【
図12】TAPSの前及び後の標的配列中のCからTへのSNP及びメチル化シトシンに由来する異なるパターンの概略図である。図では、OTは元の上部を意味し、OBは元の下部を意味し、CTOTは元の上部に対して相補的であることを意味し、CTOBは元の下部に対して相補的であることを意味する。
【配列表】
【国際調査報告】