(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-06-28
(54)【発明の名称】コピー数情報に基づく組織起源分析のための方法および組成物
(51)【国際特許分類】
C12Q 1/68 20180101AFI20240621BHJP
C12Q 1/6886 20180101ALI20240621BHJP
C12Q 1/6869 20180101ALN20240621BHJP
【FI】
C12Q1/68
C12Q1/6886 Z
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023577904
(86)(22)【出願日】2022-06-21
(85)【翻訳文提出日】2024-02-13
(86)【国際出願番号】 US2022034382
(87)【国際公開番号】W WO2022271730
(87)【国際公開日】2022-12-29
(32)【優先日】2021-06-21
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】515059083
【氏名又は名称】ガーダント ヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100078282
【氏名又は名称】山本 秀策
(74)【代理人】
【識別番号】100113413
【氏名又は名称】森下 夏樹
(74)【代理人】
【識別番号】100181674
【氏名又は名称】飯田 貴敏
(74)【代理人】
【識別番号】100181641
【氏名又は名称】石川 大輔
(74)【代理人】
【識別番号】230113332
【氏名又は名称】山本 健策
(72)【発明者】
【氏名】ケネディ, アンドリュー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QA13
4B063QA19
4B063QQ03
4B063QQ08
4B063QQ42
4B063QQ52
4B063QR32
4B063QR35
4B063QR55
4B063QS34
(57)【要約】
本明細書では、コピー数変異体でもある差次的メチル化領域などの細胞タイプまたは組織タイプ特異的エピジェネティック可変領域を含むDNAを検出するための、核酸を分析する方法が提供される。本明細書では、対象ががんなどの疾患または状態を有する可能性を決定するための方法も提供される。この方法は、血液試料またはその部分試料からDNAの少なくともエピジェネティック標的領域セットを捕捉することであって、前記DNAを、前記エピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含む。
【特許請求の範囲】
【請求項1】
血液試料中のDNAを分析するための方法であって、
a)前記血液試料またはその部分試料からDNAの少なくともエピジェネティック標的領域セットを捕捉することであって、前記DNAを、前記エピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含み、
前記エピジェネティック標的領域セットは、コピー数変異体である複数のタイプ特異的エピジェネティック標的領域を含み、前記タイプ特異的エピジェネティック標的領域は、タイプ特異的差次的メチル化領域および/またはタイプ特異的断片であり、それにより捕捉されたDNAが提供されること、ならびに
前記捕捉されたDNAを配列決定し、前記タイプ特異的エピジェネティック標的領域のレベルを決定すること
を含む方法。
【請求項2】
前記タイプ特異的エピジェネティック標的領域は、タイプ特異的差次的メチル化領域である、請求項1に記載の方法。
【請求項3】
前記複数のタイプ特異的エピジェネティック標的領域は、タイプ特異的高メチル化領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項4】
前記複数のタイプ特異的エピジェネティック標的領域は、タイプ特異的低メチル化領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項5】
前記複数のタイプ特異的エピジェネティック標的領域は、前記血液試料中に存在する非免疫細胞タイプと比べて免疫細胞において高メチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項6】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて結腸において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項7】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて肺において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項8】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて乳房において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項9】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて肝臓において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項10】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて腎臓において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項11】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて膵臓において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項12】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて前立腺において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項13】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて皮膚において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項14】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて膀胱において差次的にメチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項15】
高メチル化標的領域は、前記試料における前記標的領域の平均メチル化よりも少なくとも10%、20%、30%、または少なくとも40%高い程度にメチル化されている、先行する請求項のいずれか一項に記載の方法。
【請求項16】
前記複数のタイプ特異的エピジェネティック標的領域は、前記試料中の異なる細胞タイプまたは組織タイプの標的領域のメチル化レベルと比べて非免疫血液細胞において低メチル化されている標的領域を含む、先行する請求項のいずれか一項に記載の方法。
【請求項17】
前記タイプ特異的エピジェネティック標的領域は、タイプ特異的断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項18】
前記複数のタイプ特異的エピジェネティック標的領域は、前記血液試料中に存在する非免疫細胞タイプと比べて免疫細胞に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項19】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて結腸に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項20】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて肺に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項21】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて乳房に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項22】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて肝臓に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項23】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて腎臓に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項24】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて膵臓に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項25】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて前立腺に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項26】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて皮膚に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項27】
前記複数のタイプ特異的エピジェネティック標的領域は、他の組織タイプと比べて膀胱に特異的な断片を含む、先行する請求項のいずれか一項に記載の方法。
【請求項28】
前記タイプ特異的エピジェネティック標的領域の起源である少なくとも1つの細胞タイプまたは組織タイプを識別することを含む、先行する請求項のいずれか一項に記載の方法。
【請求項29】
細胞タイプまたは組織タイプを起源とするタイプ特異的エピジェネティック標的領域のレベルが決定される、直前の請求項に記載の方法。
【請求項30】
免疫細胞、非免疫血液細胞、結腸、肺、乳房、肝臓、腎臓、前立腺、皮膚、膀胱、または膵臓を起源とするタイプ特異的エピジェネティック標的領域のレベルが決定される、直前の請求項に記載の方法。
【請求項31】
前記複数のタイプ特異的エピジェネティック標的領域は、異常に高いコピー数を有するコピー数変異体を含む、先行する請求項のいずれか一項に記載の方法。
【請求項32】
前記複数のタイプ特異的エピジェネティック標的領域が、重複を含む少なくとも1つのコピー数変異体を含む、先行する請求項のいずれか一項に記載の方法。
【請求項33】
前記血液試料は血漿試料である、先行する請求項のいずれか一項に記載の方法。
【請求項34】
前記血液試料は全血試料である、請求項1~32のいずれか一項に記載の方法。
【請求項35】
前記血液試料は、DNAの少なくともエピジェネティック標的領域セットを捕捉する前に分画される、先行する請求項のいずれか一項に記載の方法。
【請求項36】
前記DNAはcfDNAである、先行する請求項のいずれか一項に記載の方法。
【請求項37】
前記DNAを、前記DNA中のメチルシトシンを認識する作用剤と接触させることにより、前記DNAを複数の部分試料へと分配することを含み、前記複数は、第1の部分試料および第2の部分試料を含み、前記第1の部分試料は、前記第2の部分試料よりも高い割合でメチルシトシンを有するDNAを含む、先行する請求項のいずれか一項に記載の方法。
【請求項38】
前記分配することは、前記捕捉の前に実施される、直前の請求項に記載の方法。
【請求項39】
前記分配することは、前記捕捉の後でおよび前記配列決定の前に実施される、直前の請求項に記載の方法。
【請求項40】
前記メチルシトシンを認識する作用剤はメチル結合試薬である、請求項37~39のいずれか一項に記載の方法。
【請求項41】
前記メチル結合試薬は抗体である、直前の請求項に記載の方法。
【請求項42】
前記メチル結合試薬は、5-メチルシトシンを特異的に認識する、請求項40~41に記載の方法。
【請求項43】
前記メチル結合試薬は、固体支持体に固定化されている、請求項40~42に記載の方法。
【請求項44】
前記分配することは、メチル化DNAの免疫沈降を含む、先行する請求項のいずれか一項に記載の方法。
【請求項45】
前記分配することは、タンパク質との結合に基づき分配することを含み、必要に応じて、前記タンパク質は、メチル化タンパク質、アセチル化タンパク質、非メチル化タンパク質、非アセチル化タンパク質であり、および/または必要に応じて、前記タンパク質はヒストンである、請求項37~44のいずれか一項に記載の方法。
【請求項46】
前記分配することは、前記試料の前記DNAを、前記タンパク質に特異的であり、固体支持体に固定化されている結合試薬と接触させることを含む、直前の請求項に記載の方法。
【請求項47】
前記DNAを、少なくとも1つのメチル化感受性制限酵素(MSRE)および/または少なくとも1つのメチル化依存性制限酵素(MDRE)と接触させることを含む、先行する請求項のいずれか一項に記載の方法。
【請求項48】
前記試料または1つもしくは複数の部分試料を、前記DNAの第1の核酸塩基に対して第2の核酸塩基とは異なる影響を及ぼす手順に供することを含む、先行する請求項のいずれか一項に記載の方法。
【請求項49】
タイプ特異的差次的メチル化標的領域のメチル化レベルを決定することを含む、先行する請求項のいずれか一項に記載の方法。
【請求項50】
前記エピジェネティック標的領域セットは、CTCF結合部位および/または転写開始部位を含む、先行する請求項のいずれか一項に記載の方法。
【請求項51】
前記捕捉は、前記DNAの配列可変標的領域を捕捉することを含み、前記DNAを前記配列可変標的領域に特異的な複数の標的特異的プローブと接触させることを含む、先行する請求項のいずれか一項に記載の方法。
【請求項52】
アダプターを前記DNAにライゲートし、それによりアダプターライゲーションDNAを生成することを含む、先行する請求項のいずれか一項に記載の方法。
【請求項53】
前記アダプターライゲーションDNAは、前記配列決定の前に増幅される、直前の請求項に記載の方法。
【請求項54】
前記部分試料は、前記配列決定の前にプールされる、請求項37~53のいずれか一項に記載の方法。
【請求項55】
前記試料は対象から得られる、先行する請求項のいずれか一項に記載の方法。
【請求項56】
前記対象ががんまたは前がんを有する可能性を決定することを含む、直前の請求項に記載の方法。
【請求項57】
前記対象ががんを有する可能性を決定することを含む、直前の請求項に記載の方法。
【請求項58】
前記がんは、標的領域の起源である細胞タイプまたは組織タイプのがんである、直前の請求項に記載の方法。
【請求項59】
前記がんは、健常対象から得られる試料に存在するレベルよりも高いレベルの前記標的領域の起源である細胞タイプまたは組織タイプのがんである、請求項56~58のいずれか一項に記載の方法。
【請求項60】
前記がんはリンパ球がんである、直前の請求項に記載の方法。
【請求項61】
前記がんは、白血病、リンパ腫、または骨髄腫である、直前の請求項に記載の方法。
【請求項62】
前記がんは骨髄がんである、請求項56~59のいずれか一項に記載の方法。
【請求項63】
前記がんは、結腸直腸がん、肺がん、乳がん、前立腺がん、皮膚がん、胃がん、膵臓がん、膀胱がん、または腎臓がんである、請求項56~59のいずれか一項に記載の方法。
【請求項64】
前記対象が前がんを有する前記可能性を決定することを含む、請求項56に記載の方法。
【請求項65】
前記前がんは腺腫である、直前の請求項に記載の方法。
【請求項66】
前記腺腫は進行性腺腫である、直前の請求項に記載の方法。
【請求項67】
前記前がんは、結腸直腸前がん、肺前がん、乳房前がん、前立腺前がん、皮膚前がん、胃前がん、膵臓前がん、膀胱前がん、または腎臓前がんである、請求項64~66のいずれか一項に記載の方法。
【請求項68】
前記配列決定は、複数の配列決定リードを生成することを含み、前記方法は、前記複数の配列リードを1つまたは複数の参照配列にマッピングして、マッピング配列リードを生成すること、および前記マッピング配列リードを処理して、前記対象ががんまたは前がんを有する前記可能性を決定することをさらに含む、先行する請求項のいずれか一項に記載の方法。
【請求項69】
前記試料は、以前にがんと診断され、1つまたは複数の以前のがん処置を受けた対象から得られ、必要に応じて、前記試料は、前記1つまたは複数の以前のがん処置後の1つまたは複数の予め選択された時点で得られる、先行する請求項のいずれか一項に記載の方法。
【請求項70】
がん再発スコアを決定することをさらに含み、必要に応じて、前記対象のがん再発ステータスは、がん再発スコアが所定の閾値であるかもしくはそれを上回ると決定される場合にがん再発のリスクがあると決定されるか、または前記対象のがん再発ステータスは、前記がん再発スコアが前記所定の閾値を下回る場合にがん再発のリスクがより低いと決定される、直前の請求項に記載の方法。
【請求項71】
前記対象の前記がん再発スコアを所定のがん再発閾値と比較することをさらに含み、前記対象は、前記がん再発スコアが前記がん再発閾値を上回る場合にその後のがん処置の候補であると分類されるか、または前記がん再発スコアが前記がん再発閾値を下回る場合にその後のがん処置の候補ではないと分類される、直前の実施形態に記載の方法。
【請求項72】
前記試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配することであって、前記第1の部分試料は、シトシン修飾を有するDNAを前記第2の部分試料よりも高い割合で含むこと、
前記第2の部分試料をメチル化依存性ヌクレアーゼと接触させ、それにより前記第2の部分試料中の非特異的に分配されたDNAを分解して、処理された第2の部分試料を生成すること、および必要に応じて、前記第1の部分試料をメチル化感受性エンドヌクレアーゼと接触させ、それにより前記第1の部分試料中の非特異的に分配されたDNAを分解して、処理された第1の部分試料を生成すること、ならびに
前記第1の部分試料または前記処理された第1の部分試料の少なくとも部分からエピジェネティック標的領域を含む第1の標的領域セットを捕捉すること
をさらに含む、先行する請求項のいずれか一項に記載の方法。
【請求項73】
試料中のDNAを分析するための方法であって、
a)前記試料からDNAの少なくともエピジェネティック標的領域セットを捕捉することであって、前記DNAを、前記エピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含み、前記エピジェネティック標的領域セットは、コピー数変異体である複数のタイプ特異的エピジェネティック標的領域を含み、前記タイプ特異的エピジェネティック標的領域は、タイプ特異的差次的メチル化領域および/またはタイプ特異的断片であり、それにより捕捉されたDNAが提供されること、
b)前記試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配することであって、前記第1の部分試料は、シトシン修飾を有するDNAを前記第2の部分試料よりも高い割合で含むこと、
c)前記第2の部分試料をメチル化依存性ヌクレアーゼと接触させ、それにより前記第2の部分試料中の非特異的に分配されたDNAを分解して、処理された第2の部分試料を生成すること、および必要に応じて、前記第1の部分試料をメチル化感受性エンドヌクレアーゼと接触させ、それにより前記第1の部分試料中の非特異的に分配されたDNAを分解して、処理された第1の部分試料を生成すること、ならびに
d)前記第1の部分試料または前記処理された第1の部分試料の少なくとも部分からエピジェネティック標的領域を含む第1の標的領域セットを捕捉すること
を含む方法。
【請求項74】
前記シトシン修飾はメチル化である、請求項72および73のいずれか一項に記載の方法。
【請求項75】
前記シトシン修飾は、シトシンの5位のメチル化である、請求項72~74のいずれか一項に記載の方法。
【請求項76】
前記第1の部分試料を、メチル化感受性エンドヌクレアーゼと接触させる、実施形態72~75のいずれか一項に記載の方法。
【請求項77】
前記メチル化感受性エンドヌクレアーゼは、非メチル化CpG配列を切断する、直前の請求項に記載の方法。
【請求項78】
前記メチル化感受性エンドヌクレアーゼは、AatII、AccII、AciI、Aor13HI、Aor15HI、BspT104I、BssHII、BstUI、Cfr10I、ClaI、CpoI、Eco52I、HaeII、HapII、HhaI、Hin6I、HpaII、HpyCH4IV、MluI、NaeI、NotI、NruI、NsbI、PmaCI、Psp1406I、PvuI、SacII、SalI、SmaI、およびSnaBIの1つまたは複数である、請求項72~77のいずれか一項に記載の方法。
【請求項79】
前記メチル化感受性エンドヌクレアーゼは、BstUI、HpaII、Hin6I、HhaI、またはAccIIの1つまたは複数であり、必要に応じて、前記メチル化感受性エンドヌクレアーゼは、(i)BstUIおよびHpaII、(ii)BstUI、HpaII、およびHin6I、または(iii)HhaIおよびAccIIである、直前の請求項に記載の方法。
【請求項80】
前記メチル化依存性エンドヌクレアーゼは、メチル化CpG配列を切断する、請求項72~79のいずれか一項に記載の方法。
【請求項81】
前記メチル化依存性エンドヌクレアーゼは、MspJI、LpnPI、FspEI、またはMcrBCの1つまたは複数である、請求項72~80のいずれか一項に記載の方法。
【請求項82】
前記第1の部分試料は、前記DNA中の第1の核酸塩基に対して前記第1の部分試料の前記DNA中の第2の核酸塩基とは異なる影響を及ぼす手順に供され、前記第1の核酸塩基は、修飾または未修飾核酸塩基であり、前記第2の核酸塩基は、前記第1の核酸塩基とは異なる修飾または未修飾核酸塩基であり、前記第1の核酸塩基および前記第2の核酸塩基は同じ塩基対合特異性を有する、請求項72~81のいずれか一項に記載の方法。
【請求項83】
前記第1の部分試料が供される前記手順は、前記第2の核酸塩基の塩基対合特異性を実質的に変更させずに前記第1の核酸塩基の塩基対合特異性を変更する、直前の請求項に記載の方法。
【請求項84】
前記第1の核酸塩基は修飾または未修飾シトシンであり、前記第2の核酸塩基は修飾または未修飾シトシンである、請求項82または83に記載の方法。
【請求項85】
前記第1の核酸塩基は未修飾シトシン(C)を含む、請求項82~83のいずれか一項に記載の方法。
【請求項86】
前記第2の核酸塩基は、5-メチルシトシン(mC)を含む、請求項82~85のいずれか一項に記載の方法。
【請求項87】
前記第1の部分試料が供される前記手順は、亜硫酸水素塩変換を含む、請求項82~86のいずれか一項に記載の方法。
【請求項88】
前記第1の核酸塩基は、mCを含む、請求項82~84のいずれか一項に記載の方法。
【請求項89】
前記第2の核酸塩基は、5-ヒドロキシメチルシトシン(hmC)を含む、請求項82~86のいずれか一項に記載の方法。
【請求項90】
前記第1の部分試料が供される前記手順は、5hmCの保護を含む、請求項86に記載の方法。
【請求項91】
前記第1の部分試料が供される前記手順は、Tet支援亜硫酸水素塩変換を含む、請求項89に記載の方法。
【請求項92】
前記第1の部分試料が供される前記手順は、置換ボラン還元剤を用いたTet支援変換を含み、必要に応じて、前記置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、請求項89に記載の方法。
【請求項93】
前記置換ボラン還元剤は、2-ピコリンボランまたはボランピリジンである、請求項92に記載の方法。
【請求項94】
前記第2の核酸塩基はCを含む、請求項82~84、88~90、または92~93のいずれか一項に記載の方法。
【請求項95】
前記第1の部分試料が供される前記手順は、hmCの保護、それに続いて置換ボラン還元剤によるTet支援変換を含み、必要に応じて、前記置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、請求項88~90または94のいずれか一項に記載の方法。
【請求項96】
前記置換ボラン還元剤は、2-ピコリンボランまたはボランピリジンである、請求項95に記載の方法。
【請求項97】
前記第1の部分試料が供される前記手順は、hmCの保護、それに続いてmCおよび/またはCの脱アミノ化を含む、請求項85、86、88~90、または94のいずれか一項に記載の方法。
【請求項98】
mCおよび/またはCの前記脱アミノ化は、AID/APOBECファミリーDNAデアミナーゼ酵素による処理を含む、請求項97に記載の方法。
【請求項99】
hmCの保護は、hmCのグルコシル化を含む、請求項90または94~98のいずれか一項に記載の方法。
【請求項100】
前記第1の部分試料が供される前記手順は、置換ボラン還元剤による化学支援変換を含み、必要に応じて、前記置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、請求項92~84、86、88、または94のいずれか一項に記載の方法。
【請求項101】
前記置換ボラン還元剤は、2-ピコリンボランまたはボランピリジンである、請求項100に記載の方法。
【請求項102】
前記第1の核酸塩基はhmCを含む、請求項82~84、86、88、94、または100~101のいずれか一項に記載の方法。
【請求項103】
前記第1の部分試料の前記DNAおよび前記第2の部分試料の前記DNAは差次的にタグ付けされ、差次的タグ付けの後、前記第2の部分試料に由来するDNAの部分は、前記第1の部分試料もしくは前記処理された第1の部分試料、またはそれらの少なくとも部分に添加され、それによりプールが形成され、配列可変標的領域およびエピジェネティック標的領域は前記プールから捕捉される、請求項72~102のいずれか一項に記載の方法。
【請求項104】
前記プールは、前記第2の部分試料の前記DNAの約45%、40%、35%、30%、25%、20%、15%、10%、もしくは5%またはそれ未満を含む、直前の請求項に記載の方法。
【請求項105】
前記プールは、前記第2の部分試料の前記DNAの約70~90%、約75~85%、または約80%を含む、直前の請求項に記載の方法。
【請求項106】
前記プールは、前記第1の部分試料の実質的にすべての前記DNAを含む、請求項82~84のいずれか一項に記載の方法。
【請求項107】
前記プールは、前記第1の部分試料または前記処理された第1の部分試料の実質的にすべての前記DNAを含む、請求項82~85のいずれか一項に記載の方法。
【請求項108】
前記第1の標的領域セットは、前記プールの形成後に、前記第1の部分試料または前記処理された第1の部分試料の少なくとも部分から捕捉される、請求項82~86のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願への相互参照
本出願は、2021年6月21日に出願された米国仮特許出願第63/213,050号に基づく優先権の利益を主張するものであり、その全体があらゆる目的で参照により本明細書に組み込まれる。
【0002】
発明の分野
本開示は、DNAなどの核酸の分析に関する方法および組成物を提供する。一部の実施形態では、核酸は、がんなどの疾患または障害を有するかまたは有すると疑われる対象に由来する。一部の実施形態では、核酸としては、がん細胞に由来する核酸が挙げられる。一部の実施形態では、核酸は、細胞タイプまたは組織タイプ特異的差次的メチル化領域または断片およびコピー数変異体を含む。
【背景技術】
【0003】
緒言および要旨
がんは、世界で年間数百万人の死亡の原因である。早期がんは処置に対してより感受性である傾向があるため、がんの早期検出は転帰の向上をもたらすことができる。
【0004】
細胞増殖の不適切な制御は、がんの顕著な特徴である。がんは、通常、個体の正常細胞内の突然変異の蓄積により引き起こされ、そうした突然変異の少なくとも一部は、細胞分裂の不適切な制御をもたらす。そのような突然変異としては、一般的に、一塩基変異(SNV)、遺伝子融合、挿入および欠失(インデル)、トランスバージョン、転座、および逆位が挙げられる。また、がんは、シトシンの修飾(例えば、5-メチルシトシン、5-ヒドロキシメチルシトシン、および他のより酸化された形態)ならびにDNAにクロマチンタンパク質および転写因子が会合することなどを含むエピジェネティック変化の蓄積を呈する可能性がある。
【0005】
生検は、がんの可能性のある部位から細胞または組織を抽出し、関連する表現型および/または遺伝子型特徴を分析する、がんを検出または診断するための伝統的な手法を表す。生検は、侵襲的であるという欠点を有する。血液などの体液の分析(「液体生検」)に基づく疾患および障害の検出は、魅力的な代替手段である。液体生検は非侵襲的であり、場合によっては採血のみを必要とする。しかしながら、タンパク質を含む液体生検物質を分析するための正確で高感度な方法を開発することは、部分的には、体液中に放出される核酸の量が低く、また変動するため困難であり、そのような流体から分析可能な形態で核酸を回収することも同様に困難である。こうした変動の原因は、試料間の突然変異(例えば、転座およびインデルなどの再変性)の予測的価値(predictive value)を不明瞭にする可能性がある。そのような突然変異としては、がんと診断されたか、またはがんの兆候を有することが疑われる対象が、免疫腫瘍学的(I-O)療法など、特定のタイプのがん療法からの恩恵を受けることになるか否かを評価するために使用することができるバイオマーカーを挙げることができる。液体生検手順でのさらなる分析に有用な無細胞DNAの単離および処理は、こうした方法の重要な部分である。したがって、例えば液体生検中の無細胞DNAを分析するための方法および組成物の向上が必要とされている。
【発明の概要】
【課題を解決するための手段】
【0006】
本開示の目的は、腫瘍細胞に由来するcfDNAの分析など、DNA分析の感度を向上させるという必要性を満たすことである。したがって、本明細書の方法は、cfDNAにおけるエピジェネティック変異、コピー数変異、および配列変異を含むがこれらに限定されない、DNA変異および修飾に関する情報を提供することができるステップを含んでいてもよい。DNA分析を含むそのような方法は、対象の特定の疾患状態の可能性についてさらにより向上された情報を提供することができる。血液中のがんマーカーの検出の向上は、障害のより正確な検出(診断)を可能にし、したがって処置の向上を可能にする。したがって、以下の例示的な実施形態が提供される。
【0007】
実施形態1は、血液試料中のDNAを分析するための方法であって、
a)血液試料またはその部分試料からDNAの少なくともエピジェネティック標的領域セットを捕捉することであって、DNAを、エピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含み、
エピジェネティック標的領域セットは、コピー数変異体である複数のタイプ特異的エピジェネティック標的領域を含み、タイプ特異的エピジェネティック標的領域は、タイプ特異的差次的メチル化領域および/またはタイプ特異的断片であり、それにより捕捉されたDNAが提供されること、ならびに
捕捉されたDNAを配列決定し、タイプ特異的エピジェネティック標的領域のレベルを決定すること
を含む方法である。
【0008】
実施形態2は、タイプ特異的エピジェネティック標的領域が、タイプ特異的差次的メチル化領域である、実施形態1に記載の方法である。
【0009】
実施形態3は、複数のタイプ特異的エピジェネティック標的領域が、タイプ特異的高メチル化領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0010】
実施形態4は、複数のタイプ特異的エピジェネティック標的領域が、タイプ特異的低メチル化領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0011】
実施形態5は、複数のタイプ特異的エピジェネティック標的領域が、血液試料中に存在する非免疫細胞タイプと比べて免疫細胞において高メチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0012】
実施形態6は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて結腸において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0013】
実施形態7は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて肺において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0014】
実施形態8は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて乳房において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0015】
実施形態9は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて肝臓において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0016】
実施形態10は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて腎臓において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0017】
実施形態11は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて膵臓において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0018】
実施形態12は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて前立腺において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0019】
実施形態13は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて皮膚において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0020】
実施形態14は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて膀胱において差次的にメチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0021】
実施形態15は、高メチル化標的領域が、試料における標的領域の平均メチル化よりも少なくとも10%、20%、30%、または少なくとも40%高い程度にメチル化されている、先行する実施形態のいずれか1つに記載の方法である。
【0022】
実施形態16は、複数のタイプ特異的エピジェネティック標的領域が、試料中の異なる細胞タイプまたは組織タイプの標的領域のメチル化レベルと比べて非免疫血液細胞において低メチル化されている標的領域を含む、先行する実施形態のいずれか1つに記載の方法である。
【0023】
実施形態17は、タイプ特異的エピジェネティック標的領域が、タイプ特異的断片を含む、先行する実施形態のいずれか1つに記載の方法である。
実施形態18は、複数のタイプ特異的エピジェネティック標的領域が、血液試料中に存在する非免疫細胞タイプと比べて免疫細胞に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0024】
実施形態19は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて結腸に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0025】
実施形態20は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて肺に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0026】
実施形態21は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて乳房に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0027】
実施形態22は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて肝臓に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0028】
実施形態23は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて腎臓に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0029】
実施形態24は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて膵臓に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0030】
実施形態25は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて前立腺に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0031】
実施形態26は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて皮膚に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0032】
実施形態27は、複数のタイプ特異的エピジェネティック標的領域が、他の組織タイプと比べて膀胱に対して特異的な断片を含む、先行する実施形態のいずれか1つに記載の方法である。
【0033】
実施形態28は、タイプ特異的エピジェネティック標的領域の起源である少なくとも1つの細胞タイプまたは組織タイプを識別することを含む、先行する実施形態のいずれか1つに記載の方法である。
【0034】
実施形態29は、細胞タイプまたは組織タイプを起源とするタイプ特異的エピジェネティック標的領域のレベルが決定される、直前の実施形態に記載の方法である。
【0035】
実施形態30は、免疫細胞、非免疫血液細胞、結腸、肺、乳房、肝臓、腎臓、前立腺、皮膚、膀胱、または膵臓を起源とするタイプ特異的エピジェネティック標的領域のレベルが決定される、直前の実施形態に記載の方法である。
【0036】
実施形態31は、複数のタイプ特異的エピジェネティック標的領域が、異常に高いコピー数を有するコピー数変異体を含む、先行する実施形態のいずれか1つに記載の方法である。
【0037】
実施形態32は、複数のタイプ特異的エピジェネティック標的領域が、重複を含む少なくとも1つのコピー数変異体を含む、先行する実施形態のいずれか1つに記載の方法である。
【0038】
実施形態33は、血液試料が血漿試料である、先行する実施形態のいずれか1つに記載の方法である。
【0039】
実施形態34は、血液試料が全血試料である、実施形態1~32のいずれか1つに記載の方法である。
【0040】
実施形態35は、血液試料が、DNAの少なくともエピジェネティック標的領域セットを捕捉する前に分画される、先行する実施形態のいずれか1つに記載の方法である。
【0041】
実施形態36は、DNAがcfDNAである、先行する実施形態のいずれか1つに記載の方法である。
【0042】
実施形態36.1は、DNAの分析が、DNAの標的領域の少なくとも1つのエピジェネティック特徴を定量化することを含み、必要に応じて、エピジェネティック特徴はメチル化を含む、実施形態35~36のいずれか1つに記載の方法である。
【0043】
実施形態36.2は、DNAの分析が、DNAの1つまたは複数の標的領域における1つまたは複数の遺伝子変異体を検出または定量化することを含む、実施形態35~36のいずれか1つに記載の方法である。
【0044】
実施形態37は、DNAを、DNA中のメチルシトシンを認識する作用剤と接触させることにより、DNAを複数の部分試料へと分配することを含み、複数は、第1の部分試料および第2の部分試料を含み、第1の部分試料は、第2の部分試料よりも高い割合でメチルシトシンを有するDNAを含む、先行する実施形態のいずれか1つに記載の方法である。
【0045】
実施形態38は、分配が、捕捉の前に実施される、直前の実施形態に記載の方法である。
【0046】
実施形態39は、分配が、捕捉の後および配列決定の前に実施される、直前の実施形態に記載の方法である。
【0047】
実施形態40は、メチルシトシンを認識する作用剤がメチル結合試薬である、実施形態37~39のいずれか1つに記載の方法である。
【0048】
実施形態41は、メチル結合試薬が抗体である、直前の実施形態に記載の方法である。
【0049】
実施形態42は、メチル結合試薬が、5-メチルシトシンを特異的に認識する、実施形態40~41に記載の方法である。
【0050】
実施形態43は、メチル結合試薬が、固体支持体に固定化されている、実施形態40~42に記載の方法である。
【0051】
実施形態44は、分配が、メチル化DNAの免疫沈降を含む、先行する実施形態のいずれか1つに記載の方法である。
【0052】
実施形態45は、分配が、タンパク質との結合に基づき分配することを含み、必要に応じて、タンパク質は、メチル化タンパク質、アセチル化タンパク質、非メチル化タンパク質、非アセチル化タンパク質であり、および/または必要に応じて、タンパク質はヒストンである、実施形態37~44のいずれか1つに記載の方法である。
【0053】
実施形態46は、分配が、試料のDNAを、タンパク質に特異的であり、固体支持体に固定化されている結合試薬と接触させることを含む、直前の実施形態に記載の方法である。
【0054】
実施形態47は、DNAを、少なくとも1つのメチル化感受性制限酵素(MSRE)および/または少なくとも1つのメチル化依存性制限酵素(MDRE)と接触させることを含む、先行する実施形態のいずれか1つに記載の方法である。
【0055】
実施形態48は、試料または1つもしくは複数の部分試料を、DNAの第1の核酸塩基に対して第2の核酸塩基とは異なる影響を及ぼす手順に供することを含む、先行する実施形態のいずれか1つに記載の方法である。
【0056】
実施形態49は、タイプ特異的差次的メチル化標的領域のメチル化レベルを決定することを含む、先行する実施形態のいずれか1つに記載の方法である。
【0057】
実施形態50は、エピジェネティック標的領域セットが、CTCF結合部位および/または転写開始部位を含む、先行する実施形態のいずれか1つに記載の方法である。
【0058】
実施形態51は、捕捉が、DNAの配列可変標的領域を捕捉することを含み、DNAを配列可変標的領域に特異的な複数の標的特異的プローブと接触させることを含む、先行する実施形態のいずれか1つに記載の方法である。
【0059】
実施形態52は、アダプターをDNAにライゲートさせ、それによりアダプターライゲーションDNAを生成することを含む、先行する実施形態のいずれか1つに記載の方法である。
【0060】
実施形態53は、アダプターライゲーションDNAが、配列決定の前に増幅される、直前の実施形態に記載の方法である。
【0061】
実施形態54は、部分試料が、配列決定の前にプールされる、実施形態37~53のいずれか1つに記載の方法である。
【0062】
実施形態55は、試料が対象から得られる、先行する実施形態のいずれか1つに記載の方法である。
【0063】
実施形態56は、対象ががんまたは前がんを有する可能性を決定することを含む、直前の実施形態に記載の方法である。
【0064】
実施形態57は、対象ががんを有する可能性を決定することを含む、直前の実施形態に記載の方法である。
【0065】
実施形態58は、がんが、標的領域の起源である細胞タイプまたは組織タイプのがんである、直前の実施形態に記載の方法である。
【0066】
実施形態59は、がんが、健常対象から得られる試料に存在するレベルよりも高いレベルの標的領域の起源である細胞タイプまたは組織タイプのがんである、実施形態56~58のいずれか1つに記載の方法である。
【0067】
実施形態60は、がんがリンパ球がんである、直前の実施形態に記載の方法である。
【0068】
実施形態61は、がんが、白血病、リンパ腫、または骨髄腫である、直前の実施形態に記載の方法である。
【0069】
実施形態62は、がんが骨髄がんである、実施形態56~59のいずれか1つに記載の方法である。
【0070】
実施形態63は、がんが、結腸直腸がん、肺がん、乳がん、前立腺がん、皮膚がん、胃がん、膵臓がん、膀胱がん、または腎臓がんである、実施形態56~59のいずれか1つに記載の方法である。
【0071】
実施形態64は、対象が前がんを有する可能性を決定することを含む、実施形態56に記載の方法である。
【0072】
実施形態65は、前がんが腺腫である、直前の実施形態に記載の方法である。
【0073】
実施形態66は、腺腫が進行性腺腫である、直前の実施形態に記載の方法である。
【0074】
実施形態67は、前がんが、結腸直腸前がん、肺前がん、乳房前がん、前立腺前がん、皮膚前がん、胃前がん、膵臓前がん、膀胱前がん、または腎臓前がんである、実施形態64~66のいずれか1つに記載の方法である。
【0075】
実施形態68は、配列決定が、複数の配列決定リードを生成することを含み、この方法は、複数の配列リードを1つまたは複数の参照配列にマッピングして、マッピング配列リードを生成すること、およびマッピング配列リードを処理して、対象ががんまたは前がんを有する可能性を決定することをさらに含む、先行する実施形態のいずれか1つに記載の方法である。
【0076】
実施形態69は、試料が、以前にがんと診断され、1つまたは複数の以前のがん処置を受けた対象から得られ、必要に応じて、試料は、1つまたは複数の以前のがん処置後の1つまたは複数の予め選択された時点で得られる、先行する実施形態のいずれか1つに記載の方法である。
【0077】
実施形態70は、がん再発スコアを決定することをさらに含み、必要に応じて、対象のがん再発ステータスは、がん再発スコアが所定の閾値であるかまたはそれを上回ると決定される場合にがん再発のリスクがあると決定されるか、または対象のがん再発ステータスは、がん再発スコアが所定の閾値を下回る場合にがん再発のリスクがより低いと決定される、直前の実施形態に記載の方法である。
【0078】
実施形態71は、対象のがん再発スコアを所定のがん再発閾値と比較することをさらに含み、対象は、がん再発スコアががん再発閾値を上回る場合にその後のがん処置の候補であると分類されるか、またはがん再発スコアががん再発閾値を下回る場合にその後のがん処置の候補ではないと分類される、直前の実施形態に記載の方法である。
【0079】
実施形態72は、がんをスクリーニングするための方法であって、複数の対象に由来する試料に対して、実施形態1~71のいずれか1つに記載の方法を実施することを含み、少なくとも1つのエピジェネティック標的領域の存在またはレベルは、対応する対象ががんを有する可能性があることを示す、方法である。
【0080】
実施形態73は、残留がんをモニターするための、または再発がんの存在もしくは非存在を検出するための方法であって、実施形態1~71のいずれか1つに記載の方法を実施することを含み、少なくとも1つのエピジェネティック標的領域の存在またはレベルは、がんのステータスまたは再発がんの存在もしくは非存在を示す、方法である。
【0081】
実施形態74は、疾患を処置するための療法を識別するための方法であって、必要に応じて、疾患はがんであり、この方法は、実施形態1~71のいずれか1つに記載の方法を実施することを含み、少なくとも1つのエピジェネティック標的領域の存在またはレベルは、疾患を処置するための好適な療法を示す、方法である。
【0082】
実施形態75は、試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配することであって、第1の部分試料は、シトシン修飾を有するDNAを第2の部分試料よりも高い割合で含むこと、
第2の部分試料をメチル化依存性ヌクレアーゼと接触させ、それにより第2の部分試料中の非特異的に分配されたDNAを分解して、処理された第2の部分試料を生成すること、および必要に応じて、第1の部分試料をメチル化感受性エンドヌクレアーゼと接触させ、それにより第1の部分試料中の非特異的に分配されたDNAを分解して、処理された第1の部分試料を生成すること、ならびに
第1の部分試料または処理された第1の部分試料の少なくとも部分からエピジェネティック標的領域を含む第1の標的領域セットを捕捉すること
をさらに含む、先行する実施形態のいずれか1つに記載の方法。
【0083】
実施形態76は、試料中のDNAを分析するための方法であって、
a)試料からDNAの少なくともエピジェネティック標的領域セットを捕捉することであって、DNAを、エピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含み、エピジェネティック標的領域セットは、コピー数変異体である複数のタイプ特異的エピジェネティック標的領域を含み、タイプ特異的エピジェネティック標的領域は、タイプ特異的差次的メチル化領域および/またはタイプ特異的断片であり、それにより捕捉されたDNAが提供されること、
b)試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配することであって、第1の部分試料は、シトシン修飾を有するDNAを第2の部分試料よりも高い割合で含むこと、
c)第2の部分試料をメチル化依存性ヌクレアーゼと接触させ、それにより第2の部分試料中の非特異的に分配されたDNAを分解して、処理された第2の部分試料を生成すること、および必要に応じて、第1の部分試料をメチル化感受性エンドヌクレアーゼと接触させ、それにより第1の部分試料中の非特異的に分配されたDNAを分解して、処理された第1の部分試料を生成すること、ならびに
d)第1の部分試料または処理された第1の部分試料の少なくとも部分からエピジェネティック標的領域を含む第1の標的領域セットを捕捉すること
を含む方法である。
【0084】
実施形態77は、シトシン修飾がメチル化である、直前の実施形態に記載の方法である。
【0085】
実施形態78は、シトシン修飾が、シトシンの5位のメチル化である、実施形態75~77のいずれか1つに記載の方法である。
【0086】
実施形態79は、第1の部分試料を、メチル化感受性エンドヌクレアーゼと接触させる、実施形態75~78のいずれか1つに記載の方法である。
【0087】
実施形態80は、メチル化感受性エンドヌクレアーゼが、非メチル化CpG配列を切断する、直前の実施形態に記載の方法である。
【0088】
実施形態81は、メチル化感受性エンドヌクレアーゼが、AatII、AccII、AciI、Aor13HI、Aor15HI、BspT104I、BssHII、BstUI、Cfr10I、ClaI、CpoI、Eco52I、HaeII、HapII、HhaI、Hin6I、HpaII、HpyCH4IV、MluI、NaeI、NotI、NruI、NsbI、PmaCI、Psp1406I、PvuI、SacII、SalI、SmaI、およびSnaBIの1つまたは複数である、実施形態75~80のいずれか1つに記載の方法である。
【0089】
実施形態82は、メチル化感受性エンドヌクレアーゼが、BstUI、HpaII、Hin6I、HhaI、またはAccIIの1つまたは複数であり、必要に応じて、メチル化感受性エンドヌクレアーゼは、(i)BstUIおよびHpaII、(ii)BstUI、HpaII、およびHin6I、または(iii)HhaIおよびAccIIである、直前の実施形態に記載の方法である。
【0090】
実施形態83は、メチル化依存性エンドヌクレアーゼが、メチル化CpG配列を切断する、実施形態75~82のいずれか1つに記載の方法である。
【0091】
実施形態84は、メチル化依存性エンドヌクレアーゼが、MspJI、LpnPI、FspEI、またはMcrBCの1つまたは複数である、実施形態75~83のいずれか1つに記載の方法である。
【0092】
実施形態85は、第1の部分試料が、DNA中の第1の核酸塩基に対して第1の部分試料のDNA中の第2の核酸塩基とは異なる影響を及ぼす手順に供され、第1の核酸塩基は、修飾または未修飾核酸塩基であり、第2の核酸塩基は、第1の核酸塩基とは異なる修飾または未修飾核酸塩基であり、第1の核酸塩基および第2の核酸塩基は同じ塩基対合特異性を有する、実施形態75~84のいずれか1つに記載の方法。
【0093】
実施形態86は、第1の部分試料が供される手順が、第2の核酸塩基の塩基対合特異性を実質的に変更させずに第1の核酸塩基の塩基対合特異性を変更する、直前の実施形態に記載の方法である。
【0094】
実施形態87は、第1の核酸塩基が修飾または未修飾シトシンであり、第2の核酸塩基は修飾または未修飾シトシンである、実施形態85または86に記載の方法である。
【0095】
実施形態88は、第1の核酸塩基が未修飾シトシン(C)を含む、実施形態85~87のいずれか1つに記載の方法である。
【0096】
実施形態89は、第2の核酸塩基が5-メチルシトシン(mC)を含む、実施形態85~88のいずれか1つに記載の方法である。
【0097】
実施形態90は、第1の部分試料が供される手順が、亜硫酸水素塩変換を含む、実施形態85~89のいずれか1つに記載の方法である。
【0098】
実施形態91は、第1の核酸塩基がmCを含む、実施形態85~87のいずれか1つに記載の方法である。
【0099】
実施形態92は、第2の核酸塩基が5-ヒドロキシメチルシトシン(hmC)を含む、実施形態85~89のいずれか1つに記載の方法である。
【0100】
実施形態93は、第1の部分試料が供される手順が、5hmCの保護を含む、実施形態89に記載の方法である。
【0101】
実施形態94は、第1の部分試料が供される手順が、Tet支援亜硫酸水素塩変換を含む、実施形態92に記載の方法である。
【0102】
実施形態95は、第1の部分試料が供される手順が、置換ボラン還元剤によるTet支援変換を含み、必要に応じて、置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、実施形態92に記載の方法である。
【0103】
実施形態96は、置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態95に記載の方法である。
【0104】
実施形態97は、第2の核酸塩基がCを含む、実施形態85~87、91~93、または95~96のいずれか1つに記載の方法である。
【0105】
実施形態98は、第1の部分試料が供される手順が、hmCの保護、それに続いて置換ボラン還元剤によるTet支援変換を含み、必要に応じて、置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、実施形態91~93または97のいずれか1つに記載の方法である。
【0106】
実施形態99は、置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態98に記載の方法である。
【0107】
実施形態100は、第1の部分試料が供される手順が、hmCの保護、それに続くmCおよび/またはCの脱アミノ化を含む、実施形態88、89、91~93、または97のいずれか1つに記載の方法である。
【0108】
実施形態101は、mCおよび/またはCの脱アミノ化が、AID/APOBECファミリーDNAデアミナーゼ酵素による処理を含む、実施形態100に記載の方法である。
【0109】
実施形態102は、hmCの保護が、hmCのグルコシル化を含む、実施形態93または97~101のいずれか1つに記載の方法である。
【0110】
実施形態103は、第1の部分試料が供される手順が、置換ボラン還元剤による化学支援変換を含み、必要に応じて、置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである、実施形態85~87、89、91、または97のいずれか1つに記載の方法である。
【0111】
実施形態104は、置換ボラン還元剤が、2-ピコリンボランまたはボランピリジンである、実施形態103に記載の方法である。
【0112】
実施形態105は、第1の核酸塩基がhmCを含む、実施形態95~97、89、91、97、または103~104のいずれか1つに記載の方法である。
【0113】
実施形態105.1は、エピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブが、プローブがハイブリダイズする配列中の少なくとも1つの塩基の修飾状態に特異的なプローブの少なくとも部分を含み、必要に応じて、修飾状態は、修飾(例えば、メチル化)状態、変換修飾(例えば、メチル化)状態、未修飾状態、または未変換状態である、実施形態85~105のいずれか1つに記載の方法である。
【0114】
実施形態105.2は、エピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブが、修飾される可能性のある位置に変換塩基を含む配列、および修飾される可能性のある位置に未変換塩基を含む配列の両方にハイブリダイズすることができるプローブの少なくとも部分を含み、必要に応じて、プローブの少なくとも部分は、修飾される可能性のある位置に相補的である位置に無差別にハイブリダイズする塩基を含む、実施形態85~105のいずれか1つに記載の方法である。
【0115】
実施形態106は、試料を、第1の部分試料および第2の部分試料を含む複数の部分試料に分配することをさらに含み、第1の部分試料のDNAおよび第2の部分試料のDNAは差次的にタグ付けされ;差次的なタグ付けの後、第2の部分試料に由来するDNAの部分は、第1の部分試料もしくは処理された第1の部分試料、またはそれらの少なくとも部分に添加され、それによりプールが形成され、配列可変標的領域およびエピジェネティック標的領域はプールから捕捉される、先行する実施形態のいずれか1つに記載の方法。
【0116】
実施形態107は、プールが、第2の部分試料のDNAの約45%、40%、35%、30%、25%、20%、15%、10%、もしくは5%またはそれ未満を含む、直前の実施形態に記載の方法である。
【0117】
実施形態108は、プールが、第2の部分試料のDNAの約70~90%、約75~85%、または約80%を含む、直前の実施形態に記載の方法である。
【0118】
実施形態109は、プールが、第1の部分試料のDNAの実質的にすべてを含む、実施形態106~108のいずれか1つに記載の方法である。
【0119】
実施形態110は、プールが、第1の部分試料または処理された第1の部分試料のDNAの実質的にすべてを含む、実施形態106~109のいずれか1つに記載の方法である。
【0120】
実施形態111は、第1の標的領域セットが、プールの形成後に、第1の部分試料または処理された第1の部分試料の少なくとも部分から捕捉される、実施形態106~110のいずれか1つに記載の方法である。
【図面の簡単な説明】
【0121】
【
図1】
図1は、本開示の一部の実施形態での使用に好適なシステムの一例の概略図である。
【発明を実施するための形態】
【0122】
ある特定の実施形態の詳細な説明
これから、本発明のある特定の実施形態を詳細に参照するものとする。本発明はそのような実施形態との関連で説明されることになるが、それらは、本発明をそうした実施形態に限定することを意図するものではないことが理解されるだろう。逆に、本発明は、添付の特許請求の範囲により規定される本発明内に含まれ得るすべての代替、改変、および均等物を網羅することが意図されている。
【0123】
本教示を詳細に説明する前に、本開示は、特定の組成物またはプロセスステップに限定されず、それ自体が変化し得ることが理解されるべきである。本明細書および添付の特許請求の範囲で使用される場合、文脈が明らかに別様に指示しない限り、単数形「a」、「an」、および「the」は複数の参照を含むことが留意されるべきである。したがって、例えば、「核酸」への参照は複数の核酸を含み、「細胞」への参照は複数の細胞を含むなどである。
【0124】
数値範囲は、範囲を規定する数値を含む。測定値および測定可能な値は、有効数字および測定に伴う誤差を考慮した近似値であると理解される。また、「含む(comprise)」、「含む(comprises)」、「含むこと(comprising)」、「含む(contain)」、「含む(contains)」、「含むこと(containing)」、「含む(include)」、「含む(includes)」、および「含むこと(including)」の使用は、限定を意図したものではない。上述の一般的な説明および詳細な説明は両方とも例示的および説明的なものに過ぎず、教示を限定するものではないことが理解されるべきである。
【0125】
上記の明細書で特に注記されていない限り、種々の成分を「含む」と記載されている本明細書の実施形態は、記載の成分「からなる」かまたは「から本質的になる」ことも企図され、種々の成分「からなる」と記載されている本明細書の実施形態は、その記載の成分を「含む」かまたは「から本質的になる」ことも企図され、種々の成分「から本質的になる」と記載されている本明細書の実施形態は、その記載の成分「からなる」かまたは「含む」ことも企図される(この同義性は、特許請求の範囲におけるこうした用語の使用には適用されない)。
【0126】
本明細書で使用されるセクション見出しは、構造化を目的としたものであり、本開示の主題をいかなる点でも限定するものとして解釈されるべきではない。参照により組み込まれているあらゆる文書または他の資料が、定義を含む本明細書の任意の明示的な内容と矛盾する場合は、本明細書が優先する。
I.定義
【0127】
「固形組織」または「固形組織細胞」は、本明細書で使用される場合、それぞれ固形組織中のまたはそれに由来する組織または細胞を意味する。固形組織細胞は、血液またはリンパに通常存在する細胞などの循環細胞タイプを除外する。固形組織細胞タイプの例としては、結腸、肺、乳房、皮膚、前立腺、胃、膵臓、膀胱、腎臓、および肝臓が挙げられるが、これらに限定されない。
【0128】
「無細胞DNA」、「cfDNA分子」、または単に「cfDNA」としては、細胞外形態で対象に(例えば、血液、血清、血漿、またはリンパ液、脳脊髄液、尿、または痰などの他の体液中に)天然で存在するDNA分子が挙げられる。cfDNAは、大型で複雑な生物学的有機体、例えば哺乳動物の1つまたは複数の細胞に以前は存在していたが、細胞(複数可)から有機体内に見出される流体へと放出されており、流体の試料から得ることができ、in vitro細胞溶解ステップを実施する必要がない。cfDNA分子は、DNA断片として生じてもよい。
【0129】
核酸の文脈における「標的領域」は、例えば、プローブを使用することにより(例えば、配列相補性により)捕捉、識別、および/または検出が追求される遺伝子座または複数の遺伝子座を含む遺伝子領域を指す。「標的領域セット」または「標的領域のセット」は、例えばプローブのセットを使用することにより(例えば、配列相補性により)識別および/または捕捉の標的とされる複数のゲノム遺伝子座を指す。
【0130】
「配列可変標的領域」は、正常細胞と比べて、新生物細胞(例えば、腫瘍細胞およびがん細胞)において、ヌクレオチド置換(つまり、一塩基変異)、挿入、欠失、または遺伝子融合もしくは転座など、配列に変化を呈し得る標的領域を指す。配列可変標的領域セットは、配列可変標的領域のセットである。一部の実施形態では、配列可変標的領域は、50個未満もしくはそれと等しい連続ヌクレオチド、例えば、40、30、20、10、5、4、3、もしくは2個未満もしくはそれと等しいヌクレオチドに影響を及ぼすか、または1個のヌクレオチドに影響を及ぼす変化を呈し得る標的領域である。
【0131】
「エピジェネティック標的領域」は、異なる細胞タイプもしくは組織タイプにおいて配列非依存性差異を(例えば、造血細胞とは異なる固形組織タイプにおいてメチル化の程度が異なる標的領域)、または正常細胞と比べて腫瘍細胞またはがん細胞などの新生物細胞において差異を示す可能性がある標的領域を指す。一部の実施形態では、エピジェネティック標的領域は、造血細胞を起源とするcfDNAなど、バックグラウンドcfDNAと比べて、肺、結腸など、通常はcfDNAに実質的に寄与しない組織タイプを起源とするcfDNAにおいて配列非依存性差異を示す。一部の実施形態では、エピジェネティック標的領域は、健常対象に由来するcfDNAと比べて、がんを有する対象に由来するcfDNAにおいて配列非依存性差異を示す。配列非依存性変化の例としては、メチル化(増加または減少)、ヌクレオソーム分布、cfDNA断片化パターン、CCCTC結合因子(「CTCF」)結合、転写開始部位、および調節タンパク質結合領域における変化が挙げられるが、これらに限定されない。「エピジェネティック標的領域セット」は、エピジェネティック標的領域のセットである。したがって、エピジェネティック標的領域セットとしては、高メチル化可変標的領域セット、低メチル化可変標的領域セット、ならびにCTCF結合部位および転写開始部位などの断片化可変標的領域セットが挙げられるが、これらに限定されない。本目的では、新生物、腫瘍、またはがんに関連付けられる局所増幅および/または遺伝子融合の影響を受け易い遺伝子座も、エピジェネティック標的領域セットと同様に分析することができる。なぜならば、配列決定によるコピー数の変化の検出、または参照ゲノム中の1つよりも多くの遺伝子座にマッピングされる融合配列の検出は、例えば、局所増幅および/または遺伝子融合は、それらの検出が1つまたは少数の個々の位置における塩基コールの正確性に依存しないため、比較的浅い深度の配列決定で検出することができるという点で、ヌクレオチド置換、挿入、または欠失の検出よりも、上記で考察されている例示的なエピジェネティック変化の検出とより類似する傾向があるからである。
【0132】
本明細書で使用される場合、「エピジェネティック特徴」は、一次配列(つまり、A、C、G、およびT塩基の配列)以外のDNAまたはクロマチンのあらゆる特徴を指す。エピジェネティック特徴としては、メチル化などの塩基の共有結合修飾、ならびにヒストンおよび他の安定的にDNAに会合するタンパク質の修飾および位置が挙げられる。
【0133】
本明細書で使用される場合、「差次的メチル化領域」は、別のタイプの組織におけるメチル化の度合いと比べて少なくとも1つのタイプの組織において、または前がん、がん、もしくは新生物を有する対象におけるメチル化の度合いと比べて健常対象に由来する試料において検出可能な程度に異なる度合いのメチル化を有するDNAの領域を指す。一部の実施形態では、差次的メチル化領域は、健常対象に由来する無細胞DNAにおけるメチル化の度合いと比べて、少なくとも1つのタイプの組織において検出可能により高い度合いのメチル化を有する。一部の実施形態では、差次的メチル化領域は、健常対象に由来する無細胞DNAにおけるメチル化の度合いと比べて、少なくとも1つのタイプの組織において検出可能により低い度合いのメチル化を有する。一部の実施形態では、差次的メチル化領域は、赤血球系列または未熟赤血球(例えば、網状赤血球)では低メチル化されており、少なくとも1つの非赤血球細胞タイプまたは組織タイプ(例えば、白血球、または上皮細胞、筋細胞などの固形組織細胞タイプ)では高メチル化されている。
【0134】
本明細書で使用される場合、エピジェネティック変異の文脈における「タイプ特異的」は、他の細胞タイプまたは組織タイプと比べて、1つの細胞タイプもしくは組織タイプまたは複数の関連する細胞タイプまたは組織タイプにおいて、検出可能に異なる度合いで存在するエピジェネティック変異を意味する。同様に、「タイプ特異的エピジェネティック標的領域」は、他の細胞タイプまたは組織タイプと比べて、1つの細胞タイプもしくは組織タイプにおいてまたは複数の関連する細胞タイプもしくは組織タイプにおいて検出可能に異なるエピジェネティック特質を有するエピジェネティック標的領域である。例示的なエピジェネティック特質は、上記に示されているエピジェネティック標的領域の定義において考察されている。例えば、「タイプ特異的差次的メチル化領域」は、他の細胞タイプまたは組織タイプと比べて、1つの細胞タイプもしくは組織タイプまたは複数の関連する細胞タイプもしくは組織タイプにおいて検出可能に異なる度合いのメチル化を有するDNAの領域である。タイプ特異的差次的メチル化領域の例としては、早期がんにおけるコピー数増加に関連付けられるものを含む、組織特異的差次的メチル化領域が挙げられる。一部の実施形態では、タイプ特異的差次的メチル化領域の捕捉、識別、および/または検出は、DNAの起源である細胞タイプまたは組織タイプの識別を容易にする。タイプ特異的差次的メチル化領域の起源である細胞または組織は、野生型の細胞もしくは組織または新生物細胞もしくは組織であってもよい。別の例では、DNAの「タイプ特異的断片」は、他の細胞タイプまたは組織タイプと比べて、1つの細胞タイプもしくは組織タイプまたは複数の関連する細胞タイプもしくは組織タイプにおいて検出可能に異なる度合いで存在するタイプ特異的断片化パターンから生じるDNA断片である。一部の実施形態では、タイプ特異的断片は、特定の細胞タイプまたは組織タイプ(複数可)にのみ存在する。一部の実施形態では、タイプ特異的断片は、特定の細胞タイプまたは組織タイプ(複数可)に検出可能により多い程度に存在する。
【0135】
本明細書で使用される場合、「血液試料」は、全血またはその成分(例えば、血漿、血清、バフィーコート、血漿ペレット)を含む試料を指す。
【0136】
本明細書で使用される場合、DNA分子などの核酸の「分配」は、複数の部分試料または部分集団の各々において異なる割合で存在する1つまたは複数の修飾または特徴に基づき、核酸の試料または集団を核酸の複数の部分試料または部分集団へと分離、分画、選別、または富化することを意味する。分配は、1つまたは複数のメチル化核酸塩基の存在または非存在に基づき、核酸分子を物理的に分配することを含んでいてもよい。試料または集団は、遺伝子変化もしくはエピジェネティック変化または疾患状態を示す特質に基づき、1つまたは複数の分配された部分試料または部分集団に分配することができる。
【0137】
本明細書で使用される場合、「単離された元の」試料の形態は、試料が単離された時点で、および単離された試料の化学構造を変化させる何らかの手順を受ける前の、試料の組成または化学構造を指す。同様に、分子に「元々存在する」特徴は、分子が分子の化学構造を変化させる何らかの手順を受ける前に「元の分子」に存在する特徴、または特徴を「元々含む」分子に存在する特徴を指す。
【0138】
本明細書で使用される場合、「塩基対合特異性」は、所与の塩基が最も優先的に対合する標準DNA塩基(A、C、G、またはT)を指す。例えば、未修飾シトシンおよび5-メチルシトシンは同じ塩基対合特異性(つまり、Gに対する特異性)を有するが、ウラシルおよびシトシンは、ウラシルがAに対して塩基対合特異性を有し、シトシンがGに対して塩基対合特異性を有するため、異なる塩基対合特異性を有する。それにも関わらず、ウラシルは4つの標準DNA塩基の中で最も優先的にAと対合するため、Gとゆらぎ対を形成するウラシルの能力は無関係である。
【0139】
少なくとも1つの標的領域を含む1つまたは複数の核酸などの1つまたは複数の標的分子の「捕捉」は、1つまたは複数の標的分子を非標的分子から優先的に単離または分離することを指す。
【0140】
本明細書で使用される場合、「標識」は、捕捉部分、フルオロフォア、オリゴヌクレオチド、またはそれが付着しているものの検出、分離、もしくは単離を容易にする他の部分である。
【0141】
本明細書で使用される場合、「捕捉部分」は、捕捉部分に連結した分子を、捕捉部分を欠如する分子から親和性分離することを可能にする分子である。例示的な捕捉部分としては、固相に連結されているかもしくは連結可能なストレプトアビジンに結合することにより親和性分離を可能にするビオチン、または固相に連結されているかまたは連結可能な相補的オリゴヌクレオチドに結合することにより親和性分離を可能にするオリゴヌクレオチドが挙げられる。
【0142】
本明細書で使用される場合、「標的特異的プローブ」は、エピジェネティック標的領域または配列可変標的領域などの標的領域に特異的に結合するプローブを意味する。一部の実施形態では、標的特異的プローブは、それが特異的に結合する標的領域の捕捉を容易にする捕捉部分を含む。
【0143】
本明細書で使用される場合、「タグ」は、タグが会合している分子の特徴を示す情報を含む、核酸、標識、フルオロフォア、またはペプチドなどの分子である。例えば、分子は、試料タグ(1つの試料中の分子を異なる試料中の分子と区別する)、分子タグ/分子バーコード/バーコード(異なる分子を互いに区別する(一意的タグ付けシナリオおよび非一意的タグ付けシナリオの両方において)、精製タグ、および/または検出可能なタグもしくは標識を有してもよい。
【0144】
本明細書で使用される場合、「標的分子」は、捕捉、識別、および/または検出の標的とされる、タンパク質、炭水化物、核酸、または脂質などの分子である。一部の実施形態では、標的分子は、エピジェネティック標的領域および/または配列可変標的領域を含む核酸である。
【0145】
「特異的に結合する」は、プライマー、プローブ、もしくは他のオリゴヌクレオチド、タンパク質、または他の結合分子および標的配列の文脈では、適切なハイブリダイゼーション条件下で、プライマー、オリゴヌクレオチド、またはプローブが、その標的配列もしくはその複製物にハイブリダイズして安定ハイブリッドを形成し、同時に安定非標的ハイブリッドの形成が最小限に抑えられることを意味する。したがって、プライマーまたはプローブは、非標的配列よりも十分により大きな程度に標的配列またはその複製物にハイブリダイズして、最終的に標的配列の捕捉または検出を可能にする。適切なハイブリダイゼーション条件は、当技術分野で周知であり、配列組成に基づいて予測することができるか、または日常的な試験方法を使用することにより決定することができる(例えば、Sambrook et al., Molecular Cloning, A Laboratory Manual, 2nd ed. (Cold Spring Harbor Laboratory Press, Cold Spring Harbor, NY, 1989)の1.90~1.91節、7.37~7.57節、9.47~9.51節、および11.47~11.57節、特に9.50~9.51節、11.12~11.13節、11.45~11.47節、および11.55~11.57節を参照。こうした文献は参照により本明細書に組み込まれる)。
【0146】
分子は、腫瘍細胞を起源とする場合、「腫瘍により産生される」という。腫瘍細胞を起源とするcfDNAは、「循環腫瘍DNA」(「ctDNA」)である。腫瘍細胞は、腫瘍に留まるかまたは腫瘍から分離されるか(例えば、転移性がん細胞および循環腫瘍細胞の場合のように)に関わりなく、腫瘍を起源とする新生物細胞である。
【0147】
所与の標的領域セットに対するプローブのコレクションの「捕捉収量」は、プローブのコレクションが典型的な条件下で捕捉する標的領域セットに対応する核酸の量(例えば、別の標的領域セットと比べた量または絶対量)を指す。例示的で典型的な捕捉条件は、ストリンジェントなハイブリダイゼーション緩衝液を含む少量の反応体積(約20μL)中で、試料核酸およびプローブを65℃で10~18時間インキュベートすることである。捕捉収量は絶対値で表してもよく、プローブの複数のコレクションの場合は相対値で表してもよい。複数のセットの標的領域の捕捉収量を比較する場合は、捕捉収量を、標的領域セットのフットプリントサイズに対して正規化する(例えば、1キロベース当たりの基準で)。したがって、例えば、第1および第2の標的領域のフットプリントサイズがそれぞれ50kbおよび500kbである場合(正規化係数は0.1となる)、第1の標的領域セットに対応するDNAは、第1の標的領域セットに対応する捕捉されたDNAの体積当たりの質量濃度が、第2の標的領域セットに対応する捕捉されたDNAの体積当たりの質量濃度の0.1倍よりも大きい場合、第2の標的領域セットに対応するDNAよりも高い収量で捕捉されている。さらなる例として、同じフットプリントサイズを使用して、第1の標的領域セットに対応する捕捉されたDNAが、第2の標的領域セットに対応する捕捉されたDNAの体積当たりの質量濃度の0.2倍の体積当たりの質量濃度を有する場合、第1の標的領域セットに対応するDNAは、第2の標的領域セットに対応するDNAよりも2倍大きな捕捉収量で捕捉されていた。
【0148】
「メチル化」または「DNAメチル化」という用語は、核酸分子の核酸塩基へのメチル基の付加を指す。一部の実施形態では、メチル化は、CpG部位(シトシン-リン酸-グアニン部位(つまり、核酸配列の5’->3’方向でシトシンの後にグアニンが続く)におけるシトシンへのメチル基の付加を指す。一部の実施形態では、DNAメチル化は、N6-メチルアデニンなど、アデニンへのメチル基の付加を指す。一部の実施形態では、DNAメチル化は、5メチル化(シトシンの6員炭素環の5位の炭素の修飾)である。一部の実施形態では、5-メチル化は、シトシンの5C位にメチル基を付加して5-メチルシトシン(5mC)を作出することを指す。一部の実施形態では、メチル化は5mCの誘導体を含む。5mCの誘導体としては、5-ヒドロキシメチルシトシン(5-hmC)、5-ホルミルシトシン(5-fC)、および5-カルボキシルシトシン(5-caryboxylcytosine)(5-caC)が挙げられるが、これらに限定されない。一部の実施形態では、DNAメチル化は、3Cメチル化(シトシンの6員炭素環の3位の炭素の修飾)である。一部の実施形態では、3Cメチル化は、シトシンの3C位にメチル基を付加して3-メチルシトシン(3mC)を作出することを含む。メチル化は、非CpG部位でも生じる可能性があり、例えば、メチル化は、CpA、CpT、またはCpC部位で生じる可能性がある。DNAメチル化は、メチル化DNA領域の活性を変化させる可能性がある。例えば、プロモーター領域のDNAがメチル化されると、遺伝子の転写が抑制される可能性がある。DNAメチル化は正常な発生にとって重要であり、メチル化の異常はエピジェネティック調節を混乱させる可能性がある。エピジェネティック調節の混乱、例えば抑制は、がんなどの疾患を引き起こす可能性がある。DNAのプロモーターメチル化はがんを示す可能性がある。
【0149】
「高メチル化」という用語は、DNA分子の集団(例えば、試料)内の他のDNA分子と比べて、DNAのメチル化のレベルまたは度合いが増加することを指す。一部の実施形態では、高メチル化DNAは、少なくとも1つのメチル化残基、少なくとも2つのメチル化残基、少なくとも3つのメチル化残基、少なくとも5つのメチル化残基、または少なくとも10個のメチル化残基を含むDNA分子を含んでいてもよい。本明細書で使用される場合、「タイプ特異的高メチル化」は、他の細胞タイプまたは組織タイプと比べて、1つの細胞タイプもしくは組織タイプまたは複数の関連する細胞タイプもしくは組織タイプにおけるDNAのメチル化のレベルまたは度合いが増加することを意味する。一部の実施形態では、タイプ特異的高メチル化領域の捕捉、識別、および/または検出は、DNAの起源である細胞タイプまたは組織タイプの識別を容易にする。タイプ特異的高メチル化領域の起源である細胞または組織は、野生型細胞もしくは組織または新生物細胞もしくは組織であってもよい。
【0150】
「低メチル化」という用語は、核酸分子の集団(例えば、試料)内の他の核酸分子と比べて、核酸分子(複数可)のメチル化のレベルまたは度合いが減少することを指す。一部の実施形態では、低メチル化DNAは、非メチル化DNA分子を含む。一部の実施形態では、低メチル化DNAは、0個のメチル化残基、最大で1個のメチル化残基、最大で2個のメチル化残基、最大で3個のメチル化残基、最大で4個のメチル化残基、または最大で5個のメチル化残基を含むDNA分子を含んでいてもよい。本明細書で使用される場合、「タイプ特異的低メチル化」は、他の細胞タイプまたは組織タイプと比べて、1つの細胞タイプもしくは組織タイプまたは複数の関連する細胞タイプもしくは組織タイプにおけるDNAのメチル化のレベルまたは度合いが減少することを意味する。一部の実施形態では、タイプ特異的低メチル化領域の捕捉、識別、および/または検出は、DNAの起源である細胞タイプまたは組織タイプの識別を容易にする。タイプ特異的低メチル化領域の起源である細胞または組織は、野生型細胞もしくは組織または新生物細胞もしくは組織であってもよい。
【0151】
「DNAの修飾核酸塩基を認識する作用剤」、例えば「DNAの修飾シトシンを認識する作用剤」という用語は、DNAの1つまたは複数の修飾核酸塩基、例えばメチルシトシンに結合または検出する分子または試薬を指す。「修飾核酸塩基」は、未修飾核酸塩基との化学構造の違いを含む核酸塩基である。DNAの場合、未修飾核酸塩基は、アデニン、シトシン、グアニン、またはチミンである。一部の実施形態では、修飾核酸塩基は修飾シトシンである。一部の実施形態では、修飾核酸塩基はメチル化核酸塩基である。一部の実施形態では、修飾シトシンはメチルシトシン、例えば5-メチルシトシンである。そのような実施形態では、シトシン修飾はメチルである。DNAのメチルシトシンを認識する作用剤としては、本明細書ではメチルシトシンに結合する試薬であることを指す「メチル結合試薬」が挙げられるが、これらに限定されない。メチル結合試薬としては、メチル結合ドメイン(MBD)、メチル結合タンパク質(MBP)、およびメチルシトシンに特異的な抗体が挙げられるが、これらに限定されない。一部の実施形態では、そのような抗体は、DNAの5-メチルシトシンに結合する。一部のそのような実施形態では、DNAは一本鎖であってもよくまたは二本鎖であってもよい。
【0152】
「またはそれらの組合せ(単数)」および「またはそれらの組合せ(複数)」という用語は、本明細書で使用される場合、この用語の前に列挙されている用語のありとあらゆる順列および組合せを指す。例えば、「A、B、C、またはそれらの組合せ」は、A、B、C、AB、AC、BC、またはABC、特定の文脈において順序が重要である場合は、さらにBA、CA、CB、ACB、CBA、BCA、BAC、またはCABの少なくとも1つを含むことが意図されている。この例で説明を続けると、BB、AAA、AAB、BBC、AAABCCCC、CBBAAA、およびCABABBなど、1つまたは複数の項目または用語の繰り返しを含む組合せが明示的に含まれる。当業者であれば、文脈からそうでないことが明らかでない限り、典型的には、任意の組合せの項目または用語の数に制限がないことを理解するであろう。
【0153】
「または」は、文脈が別様に要求しない限り、包括的な意味で、つまり「および/または」と等価的に使用される。
II.例示的な方法
A.向上された感度でDNAを分析するための方法
【0154】
本明細書におけるDNAを分析するための方法は、DNAを、タイプ特異的エピジェネティック変異およびコピー数変異を有する標的領域を含むエピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含む。一部の実施形態では、エピジェネティック標的領域セットは、タイプ特異的エピジェネティック変異およびコピー数変異を有する標的領域からなる。一部のそのような実施形態では、複数の標的特異的プローブは、エピジェネティック標的領域セットのメンバーに特異的なプローブからなる。一部の実施形態では、標的領域は、タイプ特異的差次的メチル化領域およびコピー数変異体を含む。一部の実施形態では、標的領域は、タイプ特異的断片化パターンおよびコピー数変異体から生じるタイプ特異的断片を含む。一部の実施形態では、タイプ特異的エピジェネティック変異は、他の細胞タイプまたは組織タイプの野生型ゲノムと比べて、1つまたは複数の細胞タイプまたは組織タイプの野生型ゲノムにおいてより高い割合で存在する。一部の実施形態では、DNAは、対象から得られる血液試料に由来する。一部の実施形態では、本明細書の方法は、試料中の、cfDNAなどのタイプ特異的DNAの異常レベルを検出する。例えば、血液試料中の固形組織を起源とする、cfDNAなどのDNAの正常よりも高いレベルの検出は、固形組織に関する疾患の存在を示すことができる。一部の実施形態では、DNA分析は、対象ががんまたは前がんを有する可能性を決定するために使用される。
【0155】
一部の実施形態では、標的領域のコピー数は、増幅されているかまたは異常に高く、それにより標的領域の検出感度を増加させることが容易になる。一部の実施形態では、標的領域は、タイプ特異的高メチル化領域である。一部の実施形態では、標的領域は、タイプ特異的低メチル化領域である。一部の実施形態では、タイプ特異的差次的メチル化領域は、1つまたは複数の関連する細胞タイプにおいて差次的にメチル化されている。一部のそのような実施形態では、標的領域は、非免疫細胞と比べて免疫細胞において差次的にメチル化されている。一部の実施形態では、タイプ特異的差次的メチル化領域は、1つまたは複数の関連する組織タイプにおいて差次的にメチル化されている。一部のそのような実施形態では、標的領域は、血液試料などの試料中に通常見出される細胞タイプと比べて、1つまたは複数の固形組織タイプにおいて差次的にメチル化されている。一部のそのような実施形態では、標的領域は、血液試料などの試料中に通常見出される細胞タイプと比べて、膀胱組織以外の1つまたは複数の固形組織タイプにおいて差次的にメチル化されている。一部の実施形態では、標的領域は、膀胱において差次的にメチル化されている領域を除外する。一部の実施形態では、標的領域はタイプ特異的断片である。一部の実施形態では、タイプ特異的断片は、1つまたは複数の関連する細胞タイプに特異的な断片化パターンから生じる。一部のそのような実施形態では、断片化パターンは、非免疫細胞と比べて免疫細胞に特異的である。一部の実施形態では、タイプ特異的断片化パターンは、1つまたは複数の関連する組織タイプに特異的である。一部のそのような実施形態では、断片化パターンは、血液試料などの試料中に通常見出される細胞タイプと比べて、1つまたは複数の固形組織タイプに特異的である。
【0156】
一部の実施形態では、1つまたは複数の標的領域のコピー数変異は、局所増幅である。一部のそのような実施形態では、局所増幅はがんに関連付けられる。一部の実施形態では、複数の標的領域は、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1の1つまたは複数の領域を含む。例えば、一部の実施形態では、複数の標的領域は、上述の遺伝子の少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個を含む。したがって、一部の実施形態では、複数の標的特異的プローブは、各々が少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個の上述の遺伝子の1つに特異的に結合するプローブを含む。
【0157】
一部の実施形態では、標的領域は、非免疫細胞を起源とする、cfDNAなどのDNAと比べて、免疫細胞を起源とする、cfDNAなどのDNAに特異的なタイプ特異的エピジェネティック変異を含む。一部のそのような実施形態では、複数の標的領域は、非免疫細胞と比べて免疫細胞において差次的にメチル化されている標的領域を含む。一部のそのような実施形態では、複数の標的領域は、非免疫細胞と比べて少なくとも一部のタイプの免疫細胞において高メチル化されている標的領域を含む。一部の実施形態では、複数の標的領域は、非免疫細胞と比べて少なくとも一部のタイプの免疫細胞において低メチル化されている標的領域を含む。一部の実施形態では、複数の標的領域は、非免疫細胞と比べて免疫細胞においてより高い割合で存在する断片化パターンを含む。一部の実施形態では、標的領域は、試料中に存在する他の免疫細胞タイプおよび非免疫細胞と比べて、複数の免疫細胞タイプを起源とするcfDNAに特異的なタイプ特異的エピジェネティック変異を含む。一部のそのような実施形態では、複数の免疫細胞タイプは、ナイーブリンパ球および活性化リンパ球;単球およびマクロファージ;または骨髄球、好中球、および好酸球を含む。一部の実施形態では、複数の免疫細胞タイプは、ナイーブT細胞、ナイーブB細胞、エフェクターCD4 T細胞、エフェクターCD8 T細胞、Treg細胞、形質細胞、およびメモリ細胞を含む。一部の実施形態では、複数の免疫細胞タイプは後骨髄球を含む。一部の実施形態では、複数の免疫細胞タイプはナチュラルキラー(NK)細胞を含む。
【0158】
一部の実施形態では、標的領域は、試料中に見出される他の細胞タイプなどの他の細胞タイプまたは組織タイプを起源とする、cfDNAなどのDNAと比べて、固形組織を起源とする、cfDNAなどのDNAに特異的なタイプ特異的エピジェネティック変異を含む。一部のそのような実施形態では、複数の標的領域は、試料中の他の組織タイプまたは細胞タイプと比べて固形組織タイプにおいて差次的にメチル化されている標的領域を含む。一部の実施形態では、複数の標的領域は、試料中の他の組織タイプまたは細胞タイプと比べて固形組織タイプにおいて高い割合で存在する断片化パターンを含む。一部の実施形態では、固形組織タイプは、結腸、肺、乳房、肝臓、腎臓、前立腺、皮膚、膀胱、または膵臓である。
【0159】
一部の実施形態では、複数の標的領域は、タイプ特異的高メチル化領域を含む。一部の実施形態では、高メチル化標的領域は、試料中の標的領域の平均メチル化より少なくとも10%、少なくとも20%、少なくとも30%、または少なくとも40%高い程度にメチル化されている。一部の実施形態では、高メチル化標的領域は、試料中の標的領域の平均メチル化よりも5~10%、10~20%、10~30%、20~30%、30~40%、40~50%、または10~50%高い程度にメチル化されている。一部の実施形態では、高メチル化標的領域は、試料中のDNAの平均メチル化より少なくとも10%、少なくとも20%、少なくとも30%、または少なくとも40%高い程度にメチル化されている。一部の実施形態では、高メチル化標的領域は、試料中のDNAの平均メチル化よりも5~10%、10~20%、10~30%、20~30%、30~40%、40~50%、または10~50%高い程度にメチル化されている。一部の実施形態では、高メチル化標的領域は、タイプ特異的高メチル化標的領域の1つまたは複数の関連する細胞タイプまたは組織タイプよりも細胞タイプまたは組織タイプを起源とするDNAにおいて対応する標的領域の平均メチル化よりも少なくとも10%、少なくとも20%、少なくとも30%、または少なくとも40%高い程度にメチル化されている。一部の実施形態では、高メチル化標的領域は、タイプ特異的高メチル化標的領域の1つまたは複数の関連する細胞タイプまたは組織タイプよりも細胞タイプまたは組織タイプを起源とするDNAにおいて対応する標的領域の平均メチル化よりも5~10%、10~20%、10~30%、20~30%、30~40%、40~50%、または10~50%高い程度にメチル化されている。一部の実施形態では、タイプ特異的高メチル化標的領域は、健常細胞(例えば、1つまたは複数の固形組織タイプの健常細胞)または健常対象において高メチル化されている。そのような実施形態では、そのような標的領域のメチル化ステータス自体は、疾患の存在を直接的に示すものではない可能性がある。そのような標的領域のメチル化ステータスは、DNAの起源である細胞タイプまたは組織タイプを示し、DNAの起源である細胞タイプまたは組織タイプが、所与の試料に著しいレベルで存在することが予想されない場合、例えば、DNAが血液試料中の結腸組織に由来する場合、それは、試料が得られた対象に疾患が存在することを示すことができる。一部の実施形態では、タイプ特異的高メチル化標的領域は、健常細胞および対象において、ならびに疾患細胞、ならびに疾患を有する対象において高メチル化されている。一部のそのような実施形態では、メチル化の程度は、健常細胞と比較して疾患細胞においてさらに増加し、それにより、それが得られた対象における疾患を示す可能性があるタイプ特異的DNAの検出感度がさらに増加する。
【0160】
一部の実施形態では、複数の標的領域は、タイプ特異的断片化パターンを含む。一部の実施形態では、そのようなタイプ特異的断片化パターンにより産生される断片は、健常対象から得られる試料中の断片の平均レベルよりも少なくとも10%、少なくとも20%、少なくとも30%、または少なくとも40%高いレベルで存在する。一部の実施形態では、そのようなタイプ特異的断片化パターンにより産生される断片は、健常対象から得られる試料中の断片の平均レベルよりも5~10%、10~20%、10~30%、20~30%、30~40%、40~50%、または10~50%高いレベルで存在する。一部の実施形態では、タイプ特異的断片化パターンは、健常細胞または健常対象に存在する。そのような実施形態では、対応する断片の存在は、疾患の存在を直接的に示すものではない可能性がある。そのような断片化の存在は、DNAの起源である細胞タイプまたは組織タイプを示し、所与の試料に存在することが予想されない細胞タイプまたは組織タイプを起源とするDNA、例えば血液試料中の結腸組織に由来するDNAの存在は、試料が得られた対象に疾患が存在することを示すことができる。一部のそのような実施形態では、タイプ特異的断片化パターンに対応する断片のレベルは、健常細胞と比較して疾患細胞においてさらに増加し、それにより、それが得られた対象における疾患を示す可能性があるタイプ特異的DNAの検出感度をさらに増加させる。DNA断片化パターンを分析するための例示的なアプローチは、例えば、WO2022040163A1、US11352670B2、US20200056245A1、US10297342B2、US10741270B2、US10453556B2、US9892230B2、EP3617324A1、およびEP2860266B1に提供されており、こうした文献は各々、あらゆる目的でそれらの全体が参照により本明細書に組み込まれる。
【0161】
一部の実施形態では、複数の標的領域は、異常に高いコピー数を有するコピー数変異体、例えば局所増幅または重複を含む。一部のそのような実施形態では、標的領域のコピー数の増加は、本明細書に記載の方法の感度をさらに増加させる。一部の実施形態では、コピー数変異体は、タイプ特異的コピー数変異体である。一部の実施形態では、コピー数変異体は異常に高く、前がんまたはがんに関連付けられる。一部の実施形態では、コピー数変異体は、早期がんまたは前がんにおいて生じることが公知であるコピー数増幅である。一部のそのような実施形態では、コピー数変異体は、疾患を有する対象に存在する。一部の実施形態では、コピー数変異体は、健常細胞と比較して疾患細胞において異常に高く、それにより、それが得られた対象における疾患を示す可能性があるタイプ特異的DNAの検出感度が増加する。
B.対象
【0162】
一部の実施形態では、対象に由来するDNAまたは核酸は、がんもしくは前がんを有する対象から得られ、および/またはがんもしくは前がんを有する対象から得られる試料に由来する。一部の実施形態では、試料は、がんまたは前がんを有することが疑われる対象から得られる。一部の実施形態では、試料は、腫瘍を有する対象から得られる。一部の実施形態では、試料は、腫瘍を有することが疑われる対象から得られる。一部の実施形態では、試料は、新生物を有する対象から得られる。一部の実施形態では、試料は、新生物を有することが疑われる対象から得られる。一部の実施形態では、試料は、腫瘍、がん、または新生物が寛解している(例えば、化学療法、外科的切除、放射線療法、またはそれらの組合せ後の)対象から得られる。上述の実施形態のいずれかでは、前がん、がん、腫瘍、もしくは新生物、または前がん、がん、腫瘍、もしくは新生物の疑いは、膀胱、頭頸部、肺、結腸、直腸、腎臓、乳房、前立腺、皮膚、または肝臓のものであってもよい。一部の実施形態では、前がん、がん、腫瘍、もしくは新生物、または前がん、がん、腫瘍、もしくは新生物の疑いは、肺のものである。一部の実施形態では、前がん、がん、腫瘍、もしくは新生物、または前がん、がん、腫瘍、もしくは新生物の疑いは、結腸または直腸のものである。一部の実施形態では、前がん、がん、腫瘍、もしくは新生物、または前がん、がん、腫瘍、もしくは新生物の疑いは、乳房のものである。一部の実施形態では、前がん、がん、腫瘍、もしくは新生物、または前がん、がん、腫瘍、もしくは新生物の疑いは、前立腺のものである。上述の実施形態のいずれかでは、対象はヒト対象であってもよい。一部の実施形態では、試料は、ステージIのがん、ステージIIのがん、ステージIIIのがん、またはステージIVのがんを有する対象から得られる。
C.標的特異的プローブを使用した核酸の分析
【0163】
本明細書における、試料に由来するDNAまたは核酸を分析するための方法は、DNAを、タイプ特異的エピジェネティック変異およびコピー数変異を両方とも有する標的領域を含むかまたはそれからなるエピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含む。一部の実施形態では、タイプ特異的エピジェネティック変異は差次的メチル化である。一部の実施形態では、タイプ特異的変異は、タイプ特異的断片化パターンである。一部の実施形態では、コピー数変異は、異常に高いコピー数である。
【0164】
一部の実施形態では、本明細書で開示される方法は、試料に由来するDNAを、配列可変標的領域および/または第2のエピジェネティック標的領域セットに特異的なプローブと接触させること、ならびに標的領域の配列可変セットおよび/または第2のエピジェネティックセットに特異的なプローブにアニーリングするDNAを捕捉することをさらに含む。そのような実施形態は、本明細書で開示されるものなどの方法を使用して、捕捉されたDNAを配列決定することをさらに含む。
【0165】
本方法は、対象における状態、特にがんまたは前がんの存在を診断し、状態を特徴付け(例えば、がんを病期分類するかまたはがんの不均質性を決定し)、状態の処置に対する応答をモニターし、状態の発症または状態のその後の経過の予後リスクをもたらすために使用することができる。本開示は、特定の処置選択肢の有効性を決定するためにも有用であり得る。処置が成功すると、DNAを排出するがん細胞はより少なくなるため、処置選択肢の成功は、対象の血液中で検出されるコピー数変異または希少突然変異の量を減少させる可能性がある。他の例では、これは生じない可能性がある。別の例では、おそらくは、ある特定の処置選択肢は、時間の経過と共にがんの遺伝子プロファイルと相関する可能性がある。この相関性は、療法を選択する際に有用であり得る。
【0166】
加えて、がんが処置後に寛解していることが観察された場合、本方法を使用して、残留疾患または疾患の再発をモニターすることができる。
【0167】
検出することができるがんのタイプおよび数としては、血液がん、脳がん、肺がん、皮膚がん、鼻がん、喉がん、肝臓がん、骨がん、リンパ腫、膵臓がん、皮膚がん、腸がん、直腸がん、結腸がん、前立腺がん、甲状腺がん、膀胱がん、頭頸部がん、腎臓がん、口腔がん、胃がん、固形腫瘍、不均質腫瘍、および均質腫瘍などを挙げることができる。がんのタイプおよび/または病期は、突然変異、希少突然変異、インデル、コピー数変異、トランスバージョン、転座、組換え、逆位、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造変化、遺伝子融合、染色体融合、遺伝子切断、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸化学修飾の異常変化、エピジェネティックパターンの異常変化、および核酸5-メチルシトシンの異常変化を含む遺伝子変異から検出することができる。
【0168】
一部の実施形態では、本明細書に記載の方法は、腫瘍(または新生物細胞、またはがん細胞)によりまたは前がん細胞により産生される、DNAなどの核酸の存在を識別することを含む。
【0169】
また、遺伝子データは、特定の形態のがんを特徴付けるために使用することができる。がんは、組成および病期が両方とも不均質であることが多い。遺伝子プロファイルデータは、がんの特定のサブタイプの特徴付けを可能にすることができ、それは、その特定のサブタイプの診断または処置に重要であり得る。また、この情報は、特定のタイプのがんの予後に関する手がかりを対象または担当医に提供し、対象または担当医が疾患の進行に応じて処置選択肢を適応させることを可能にすることができる。一部のがんは進行してより侵襲性になり、遺伝的に不安定になる可能性がある。他のがんは、良性、不活性、または休止状態のままである可能性がある。本開示の系および方法は、疾患進行の決定に有用であり得る。
【0170】
さらに、本開示の方法は、対象における異常状態の不均質性を特徴付けるために使用することができる。このような方法は、例えば、対象に由来するDNAのプロファイルを生成することを含んでいてもよく、プロファイルは、エピジェネティックおよび突然変異分析から得られる複数のデータを含む。一部の実施形態では、異常状態は、がんまたは前がんである。一部の実施形態では、異常状態は、不均質なゲノム集団をもたらすものであってもよい。がんの例では、一部の腫瘍は、異なる病期のがんの腫瘍細胞を含むことが公知である。他の例では、不均質性は、複数の疾患病巣を含んでいてもよい。この場合も、がんの例では、複数の腫瘍病巣が存在する可能性があり、おそらくは1つまたは複数の病巣は、原発部位から広がった転移の結果である。
【0171】
本方法は、不均質疾患の異なる細胞に由来する情報の総和であるプロファイル、フィンガープリント、またはデータセットを生成するために使用することができる。このデータセットは、構造変異同一性およびレベル、コピー数変異、エピジェネティック変異、または他の突然変異分析を、単独でまたは組合せで含んでいてもよい。
【0172】
本方法は、前がん、がん、または他の疾患を、診断、予後予測、モニター、または観察するために使用することができる。一部の実施形態では、本明細書の方法は、胎児を診断、予後予測、またはモニターすることを含まず、したがって非侵襲的出生前検査に関するものではない。他の実施形態では、こうした方法論は、DNAおよび他のポリヌクレオチドが母体分子と共循環する可能性のある胎児対象におけるがんまたは他の疾患を診断、予後予測、モニター、または観察するために、妊娠対象において使用することができる。
【0173】
DNAを分析するための例示的な方法は、以下のステップを含む:
1.アダプターをDNAにライゲートさせ、DNAを増幅することにより、抽出されたDNA試料(例えば、ヒト試料から抽出された血漿DNA)を調製するステップ。
2.DNAを、DNA中のメチルシトシンなどの修飾シトシンを認識する作用剤と接触させることにより、アダプターライゲーションDNAを複数の差次的メチル化部分試料へと分配するステップ。
3.部分試料を、ビオチンを含む標的特異的プローブと接触させ、次いで部分試料を、ストレプトアビジンを含む固体支持体などの、捕捉部分の結合パートナーを含む固体支持体と接触させることにより、分配された部分試料に由来する異常に高いコピー数を有するタイプ特異的高メチル化標的領域を含むDNAを捕捉するステップ。
4.捕捉されたDNAを富化および/または溶出するステップ。
5.捕捉されたDNAを再増幅し、NGS機器によりマルチプレックスでアッセイするステップ。
6.一意的分子を識別するために使用されるアダプターの分子タグを用いて、NGSデータを分析するステップ。
【0174】
一部の実施形態では、DNAを捕捉する前に、分配されたDNAをPCR増幅により増幅することができる。一部の実施形態では、捕捉配列のレベルの決定は、疾患診断または適切な処置の識別を容易にする。一部の実施形態では、1つまたは複数の捕捉配列の存在またはそのレベルの変化は、対象におけるがんまたは前がんなどの疾患または障害の存在を示す。一部の実施形態では、エピジェネティック標的領域における配列非依存性変化のcfDNA分析、例えば本明細書に記載のcfDNA分析と組み合わせた標的分子の検出は、対象における疾患または障害、例えば、がん、前がん、または健常対象と比べて核酸に変化を引き起こす他の障害が存在することを示す。
D.DNAの分析および/または分配
【0175】
本明細書で開示される方法は、試料中のDNAを分析することを含む。そのような方法では、異なる形態のDNA(例えば、高メチル化DNAおよび低メチル化DNA)を、DNAの1つまたは複数の特質に基づいて物理的に分配することができる。この手法は、例えば、ある特定の配列が高メチル化されているかまたは低メチル化されているかを決定するために使用することができる。
【0176】
メチル化プロファイリングは、ゲノムの異なる領域にわたってメチル化パターンを決定することを含んでいてもよい。例えば、メチル化の程度(例えば、1分子当たりのメチル化核酸塩基の相対数)および配列決定に基づき分子を分配した後、異なる分配画分中の分子の配列を参照ゲノムに対してマッピングすることができる。これにより、他の領域と比較して、より高度にメチル化されているか、またはそれほど高度にメチル化されていないゲノムの領域を示すことができる。このように、ゲノム領域は、個々の分子とは対照的に、メチル化の程度が異なる可能性がある。
【0177】
試料中の核酸分子を分配することにより、例えば、試料の1つの分配画分においてより多く存在する希少核酸分子を富化することにより、希少シグナルを増加させることができる。例えば、高メチル化DNAには存在するが、低メチル化DNAにはより少量で存在する(または存在しない)遺伝子変異は、試料を高メチル化核酸分子と低メチル化核酸分子とに分配することにより、より容易に検出することができる。試料の複数の分配画分を分析することにより、単一分子の多次元分析を実施することができ、したがってより高い感度を達成することができる。分配は、1つまたは複数のメチル化核酸塩基の存在または非存在に基づき、核酸分子を分配画分または部分試料へと物理的に分配することを含んでいてもよい。試料は、差次的遺伝子発現または疾患状態を示す特質に基づき、分配画分または部分試料へと分配することができる。試料は、核酸、例えば無細胞DNA(cfDNA)、非cfDNA、腫瘍DNA、循環腫瘍DNA(ctDNA)、および無細胞核酸(cfNA)の分析中に、正常状態と疾患状態との間でシグナルの差異をもたらす特質またはその組合せに基づいて分配することができる。
【0178】
一部の実施形態では、高メチル化および/または低メチル化可変エピジェネティック標的領域を分析して、それらが、腫瘍細胞、または分析されているDNA試料(cfDNAなど)に通常は寄与しないタイプの細胞、および/または特定の免疫細胞タイプの異なるメチル化特質を示すか否かを決定する。
【0179】
一部の場合では、試料中の不均質DNAは、2つまたはそれよりも多くの分配画分(例えば、少なくとも3、4、5、6、または7つの分配画分)に分配される。一部の実施形態では、各分配画分は差次的にタグ付けされる。次いで、タグ付き分配画分は、集合的な試料調製および/または配列決定のために一緒にプールすることができる。分配-タグ付け-プール化ステップは1回よりも多く行ってもよい、各ラウンドの分配は、異なる特質(例は本明細書に提供されている)に基づいて行われ、他の分配画分および分配手段と区別される差次的タグを使用してタグ付けされる。他の例では、差次的タグ付き分配画分は別々に配列決定される。
【0180】
一部の実施形態では、差次的タグ付きプールDNAに由来する配列リードが得られ、in silicoで分析される。タグは、異なる分配画分に由来するリードを選別するために使用される。遺伝子変異を検出するための分析は、分配画分ごとのレベル、ならびに全核酸集団レベルで実施することができる。例えば、分析は、各分配画分の核酸におけるCNV、SNV、インデル、融合などの遺伝子変異体を決定するためのin silico分析を含んでいてもよい。一部の場合では、in silico分析は、クロマチン構造の決定を含んでいてもよい。例えば、配列リードの網羅範囲を使用して、クロマチンにおけるヌクレオソーム位置を決定することができる。より高い網羅範囲は、ゲノム領域におけるヌクレオソーム占有率がより高いことと相関する可能性があり、より低い網羅範囲は、ヌクレオソーム占有率がより低いことまたはヌクレオソーム枯渇領域(NDR)と相関する可能性がある。
【0181】
分配に使用することができる特質の例としては、配列長、メチル化レベル、ヌクレオソーム結合、配列ミスマッチ、免疫沈降、および/またはDNAに結合するタンパク質が挙げられる。得られる分配画分としては、以下の核酸形態:一本鎖DNA(ssDNA)、二本鎖DNA(dsDNA)、短鎖DNA断片、および長鎖DNA断片の1つまたは複数が挙げられる。一部の実施形態では、一般に、シトシン修飾(例えば、シトシンメチル化)またはメチル化に基づく分配を実施し、必要に応じて、DNAの上述の特質または形態のいずれかに基づいていてもよい少なくとも1つの追加の分配ステップを組み合わせる。一部の実施形態では、核酸の不均質集団は、1つまたは複数のエピジェネティック修飾を有する核酸と、1つまたは複数のエピジェネティック修飾を有さない核酸とに分配される。エピジェネティック修飾の例としては、メチル化の存在または非存在、メチル化のレベル、メチル化のタイプ(例えば、5-メチルシトシン対アデニンメチル化および/またはシトシンヒドロキシメチル化などの他のタイプのメチル化)、ならびにヒストンなどの1つまたは複数のタンパク質との会合および会合のレベルが挙げられる。代替的にまたは加えて、核酸の不均質集団を、ヌクレオソームと会合している核酸分子とヌクレオソームを欠く核酸分子とに分配してもよい。代替的にまたは加えて、核酸の不均質集団を、一本鎖DNA(ssDNA)と二本鎖DNA(dsDNA)とに分配してもよい。代替的にまたは加えて、核酸の不均質集団を、核酸長(例えば、最大160bpの分子および160bpよりも大きな長さを有する分子)に基づいて分配してもよい。
【0182】
試料内の核酸の集団を分配するために使用される作用剤は、所望の特異性を有する抗体、天然結合パートナー、もしくはそれらの変異体(Bock et al., Nat Biotech 28: 1106-1114 (2010);Song et al., Nat Biotech 29: 68-72 (2011))、または所与の標的に対する特異性を有するように例えばファージディスプレイにより選択された人工ペプチドなどの親和性作用剤であってもよい。一部の実施形態では、分配に使用される作用剤は、修飾核酸塩基を認識する作用剤である。一部の実施形態では、作用剤により認識される修飾核酸塩基は、メチルシトシン(例えば、5-メチルシトシン)などの修飾シトシンである。一部の実施形態では、作用剤により認識される修飾核酸塩基は、DNA中の第1の核酸塩基に対して、試料のDNA中の第2の核酸塩基とは異なるように影響を及ぼす手順の産物である。一部の実施形態では、修飾核酸塩基は、その塩基対合特異性が手順により変更されたことを意味する「変換された核酸塩基」であってもよい。例えば、ある特定の手順では、非メチル化もしくは未修飾のシトシンがジヒドロウラシルへと変換されるか、またはより一般には、少なくとも1つの修飾形態もしくは未修飾形態のシトシンが脱アミノ化を受け、ウラシル(DNAの文脈では修飾核酸塩基とみなされる)もしくはさらなる修飾形態のウラシルがもたらされる。分配作用剤の例としては、メチルシトシン(例えば、5-メチルシトシン)などの修飾シトシンであってもよい修飾核酸塩基を認識する抗体などの抗体が挙げられる。一部の実施形態では、分配作用剤は、5-カルボキシルシトシン(5caC)などの5-メチルシトシン以外の修飾シトシンを認識する抗体である。代替的な分配作用剤としては、MeCP2などのタンパク質を含む、本明細書に記載のメチル結合ドメイン(MBD)およびメチル結合タンパク質(MBP)が挙げられる。
【0183】
分配作用剤の追加の非限定的な例は、ヒストンに結合した核酸を、遊離または未結合核酸から分離することができるヒストン結合タンパク質である。本明細書で開示される方法で使用することができるヒストン結合タンパク質の例としては、RBBP4、RbAp48、およびSANTドメインペプチドが挙げられる。
【0184】
一部の実施形態では、分配は、バイナリ分配および修飾の度合い/レベルに基づく分配の両方を含んでいてもよい。例えば、メチル化断片を、メチル化DNA免疫沈降(MeDIP)により分配してもよく、またはすべてのメチル化断片を、メチル結合ドメインタンパク質(例えば、MethylMinderメチル化DNA富化キット(ThermoFisher Scientific)を使用して非メチル化断片から分配してもよい。その後、追加の分配は、メチル結合ドメインおよび結合断片を有する溶液中の塩濃度を調整することにより、異なるレベルのメチル化を有する断片を溶出することを含んでいてもよい。塩濃度が増加すると共に、より高いメチル化レベルを有する断片が溶出される。
【0185】
DNAの分析は、目的のDNAの検出または定量化を含んでいてもよい。DNAの分析は、遺伝子変異体および/またはエピジェネティック特徴(例えば、DNAメチル化および/またはDNA断片化)を検出することを含んでいてもよい。
【0186】
一部の実施形態では、メチル化レベルは、分配、亜硫酸水素塩変換などの修飾感受性変換、配列決定中の直接検出、メチル化感受性制限酵素消化、メチル化依存性制限酵素消化、または任意の他の好適な手法を使用して決定することができる。例えば、異なる形態のDNA(例えば、高メチル化DNAおよび低メチル化DNA)を、DNAの1つまたは複数の特質に基づいて物理的に分配することができる。例えば、メチル化DNA結合タンパク質(例えば、MBD2、MBD4、またはMeCP2などのMBD)または5-メチルシトシンに特異的な抗体(MeDIPなど)を使用して、DNAを分配することができる。この手法は、例えば、ある特定の配列が高メチル化されているかまたは低メチル化されているかを決定するために使用することができる。一部の実施形態では、DNA断片化パターンは、cfDNA分子などのDNA分子の終点および/または中心点に基づいて決定することができる。
【0187】
一部の場合では、最終分配画分には、異なる程度の修飾(修飾の過剰存在または過少存在)を有する核酸が富化される。過剰存在および過少存在は、核酸に生じた修飾の数を、集団中の1鎖当たりの修飾数の中央値と比べることにより規定することができる。例えば、試料中の核酸の5-メチルシトシン残基数の中央値が2である場合、2つよりも多くの5-メチルシトシン残基を含む核酸では、この修飾が過剰存在し、5-メチルシトシン残基が1つまたはゼロである核酸では、過少存在する。親和性分離の効果は、結合相には修飾が過剰存在する核酸が富化され、非結合相(つまり、溶液中)には修飾が過少存在する核酸が富化されることである。結合相中の核酸は、その後の処理前に溶出することができる。
【0188】
MeDIPまたはMethylMiner(登録商標)メチル化DNA富化キット(ThermoFisher Scientific)を使用すると、連続溶出を使用して種々のレベルのメチル化を分配することができる。例えば、低メチル化分配画分(メチル化無し)は、核酸集団を、磁気ビーズに付着させたキットのMBDと接触させることにより、メチル化分配画分から分離することができる。ビーズは、メチル化核酸を非メチル化核酸から分離するために使用される。続いて、1つまたは複数の溶出ステップを連続して実施して、異なるレベルのメチル化を有する核酸を溶出させる。例えば、メチル化核酸の第1のセットを、160mMまたはそれよりも高い、例えば少なくとも150mM、少なくとも200mM、300mM、400mM、500mM、600mM、700mM、800mM、900mM、1000mM、または2000mMの塩濃度で溶出させてもよい。そのようなメチル化核酸を溶出させた後、磁気分離をもう一度使用して、より高レベルのメチル化核酸をメチル化のレベルがより低いメチル化核酸から分離する。溶出および磁気分離ステップを繰り返して、低メチル化分配画分(メチル化を含まない核酸が富化されている)、メチル化分配画分(低レベルのメチル化を含む核酸が富化されている)、および高メチル化分配画分(高レベルのメチル化を含む核酸が富化されている)など、種々の分配画分を作出することができる。
【0189】
一部の方法では、親和性分離に基づく分配に使用される作用剤に結合した核酸を洗浄ステップに供する。洗浄ステップでは、親和性作用剤に弱く結合した核酸を洗い流す。そのような核酸は、平均値または中央値に近い程度に修飾を有する核酸(つまり、試料と作用剤との初期接触時に固相に結合したままの核酸と固相に結合しない核酸との間の中間)に富化することができる。
【0190】
親和性分離は、修飾の程度が異なる少なくとも2つ、場合によっては3つまたはそれよりも多くの核酸の分配画分をもたらす。分配画分は依然として別々であるが、少なくとも1つの分配画分、通常は2つまたは3つ(またはそれよりも多く)の分配画分の核酸は、通常はアダプターの成分として提供される核酸タグに連結されており、異なる分配画分の核酸は、1つの分配画分のメンバーを別の分配画分のメンバーから区別する異なるタグを受け取る。同じ分配画分の核酸分子に連結されたタグは、互いに同じであってもよくまたは異なっていてもよい。しかしながら、互いに異なる場合、タグは、それらが付着している分子が特定の分配画分のものであることを識別するために、それらのコードの一部が共通していてもよい。
【0191】
メチル化などの特質に基づく核酸試料の分配に関するさらなる詳細は、WO2018/119452を参照されたい。この文献は、参照により本明細書に組み込まれる。
【0192】
一部の実施形態では、分配は、DNAを、メチル化感受性制限酵素(MSRE)および/またはメチル化依存性制限酵素(MDRE)と接触させることを含む。MSREまたはMDREによるDNAの処理後、DNAをサイズに基づいて分配して、高メチル化(MSRE処理後の最長DNA分子およびMDRE処理後の最短DNA断片)、中間(MSREまたはMDRE処理後の中間長DNA分子)、および低メチル化(MSRE処理後の最短DNA分子およびMDRE処理後の最長DNA断片)部分試料を生成することができる。
【0193】
一部の実施形態では、分配は、核酸を、メチル結合タンパク質(「MBP」)のメチル結合ドメイン(「MBD」)と接触させることにより実施される。一部のそのような実施形態では、核酸をMBP全体と接触させる。一部の実施形態では、MBDは、5-メチルシトシン(5mC)に結合し、MBPは、MBDを含み、本明細書では、メチル結合タンパク質またはメチル結合ドメインタンパク質と同義的に参照される。一部の実施形態では、MBDは、ビオチンリンカーを介して、Dynabeads(登録商標)M-280ストレプトアビジンなどの常磁性ビーズにカップリングされている。メチル化の程度が異なる画分への分配は、NaCl濃度を増加させて画分を溶出させることにより実施することができる。
【0194】
一部の実施形態では、結合したDNAは、抗体またはMBDを、プロテイナーゼKなどのプロテアーゼと接触させることにより溶出させる。これは、上記で考察されているようにNaClを使用した溶出ステップの代わりにまたはそれらに加えて実施してもよい。
【0195】
本明細書で企図される修飾核酸塩基を認識する作用剤の例としては、以下のものが挙げられるが、これらに限定されない。
(a)MeCP2は、未修飾シトシンよりも5-メチル-シトシンに優先的に結合するタンパク質である。
(b)RPL26、PRP8、およびDNAミスマッチ修復タンパク質MHS6は、未修飾シトシンよりも5-ヒドロキシメチル-シトシンに優先的に結合する。
(c)FOXK1、FOXK2、FOXP1、FOXP4、およびFOXI3は、未修飾シトシンよりも、好ましくは5-ホルミル-シトシンに結合する(Iurlaro et al., Genome Biol. 14: R119 (2013))。
(d)1つもしくは複数のメチル化もしくは修飾核酸塩基またはそれらの変換産物、例えば5mC、5caC、またはDHUに特異的な抗体。
【0196】
一般に、溶出は、1分子当たりのメチル化部位の数など、修飾の数の関数であり、塩濃度が増加すると、より多くのメチル化を有する分子が溶出する。メチル化の程度に基づいてDNAを異なる集団へと溶出するには、NaCl濃度を漸増させた一連の溶出緩衝液を使用することができる。塩濃度は、約100nm~約2500mM NaClの範囲であってもよい。一実施形態では、このプロセスは、3(三)つの分配画分をもたらす。分子を、修飾核酸塩基を認識する作用剤を含む分子を含む第1の塩濃度の溶液と接触させ、分子はストレプトアビジンなどの捕捉部分に付着していてもよい。第1の塩濃度では、作用剤に結合することになる分子の集団もあり、未結合のままであることになる集団もある。未結合集団は、「低メチル化」集団として分離することができる。例えば、低メチル化形態のDNAが富化された第1の分配画分は、低塩濃度、例えば100mMまたは160mMでは未結合のままである分配画分である。中間メチル化DNAが富化された第2の分配画分は、中間塩濃度、例えば100mM~2000mMの濃度を使用して溶出される。これも試料から分離される。高メチル化形態のDNAが富化された第3の分配画分は、高塩濃度、例えば少なくとも約2000mMを使用して溶出される。
【0197】
一部の実施形態では、5-メチルシチジン(5mC)に対して生じたモノクローナル抗体を使用して、メチル化DNAを精製する。一本鎖DNA断片を得るために、DNAを、例えば95℃で変性させる。標準ビーズまたは磁気ビーズにカップリングさせたプロテインG、ならびに抗5mC抗体とのインキュベーションに続く洗浄を使用して、抗体に結合したDNAを免疫沈降する。次いで、そのようなDNAを溶出させることができる。分配画分は、非沈殿DNAおよびビーズから溶出した1つまたは複数の分配画分を含んでいてもよい。
【0198】
一部の実施形態では、DNAの分配画分は、ライブラリー調製の酵素ステップの調製に備えて脱塩および濃縮される。
【0199】
異常に高いコピー数を含む配列は、高メチル化されている傾向がある可能性がある。したがって、一部の実施形態では、タイプ特異的差次的メチル化領域およびコピー数変異体の両方である複数の標的領域を含むエピジェネティック標的領域セットのメンバーに特異的な標的特異的プローブと接触させたDNAは、高メチル化分配画分の少なくとも部分を含む。高メチル化分配画分の少なくとも部分に由来するかまたはそれを含むDNAは、中間分配画分または低メチル化分配画分などの1つまたは複数の他の分配画分の少なくとも部分に由来するかまたはそれを含むDNAと一緒にしてもよくまたはしなくてもよい。
【0200】
一部の実施形態では、メチル化は、修飾感受性変換を使用して検出される。修飾感受性変換は、修飾依存的に、例えば、メチル化(またはヒドロキシメチル化、またはホルミル化、またはカルボキシル化など)対未修飾、および/または1つの様式での修飾対別の様式での修飾(例えば、メチル化対ヒドロキシメチル化)で、第1の核酸塩基を差次的に変更するが、第2の核酸塩基を変更しないあらゆる技法を指す。そのような変換技法の例としては、未修飾シトシンおよびある特定の修飾シトシン(例えば、5-ホルミルシトシン(fC)または5-カルボキシルシトシン(caC))をウラシルに変換するが、他の修飾シトシン(例えば、5-メチルシトシン、5-ヒドロキシルメチルシトシン)は変換しない亜硫酸水素塩変換を含む。亜硫酸水素塩変換の実施は、配列リードを使用したmCまたはhmCを含む位置の識別を容易にすることができる。亜硫酸水素塩変換の例示的な説明は、例えば、Moss et al., Nat Commun. 2018; 9: 5068を参照されたい。
【0201】
そのような変換技法の例としては、酸化的亜硫酸水素塩(Ox-BS)変換も挙げられる。Ox-BS変換の実施は、配列リードを使用してmCを含む位置を識別することを容易にすることができる。酸化的亜硫酸水素塩変換の例示的な説明は、例えば、Booth et al., Science 2012; 336: 934-937を参照されたい。
【0202】
そのような変換技法の例としては、Tet支援亜硫酸水素塩(TAB)変換も挙げられる。例えば、Yu et al., Cell 2012; 149: 1368-80に記載のように、β-グルコシルトランスフェラーゼを使用してhmCを保護し(5-グルコシルヒドロキシメチルシトシン(ghmC)を形成する)、次いでmTet1などのTETタンパク質を使用してmCをcaCへと変換し、次いで亜硫酸水素塩処理を使用してCおよびcaCをUへと変換することができるが、ghmCは影響を受けないままである。したがって、TAB変換を使用する場合、第1の核酸塩基は、未修飾のシトシン、fC、caC、mC、または亜硫酸水素塩により影響を受ける他のシトシン形態の1つまたは複数を含み、第2の核酸塩基はhmCを含む。TAB変換の実施は、配列リードを使用してhmCを含む位置を識別することを容易にすることができる。
【0203】
そのような変換技法の例としては、置換ボラン還元剤を用いたTet支援変換も挙げられ、必要に応じて、置換ボラン還元剤は、2-ピコリンボラン、ボランピリジン、tert-ブチルアミンボラン、またはアンモニアボランである。例えば、Liu et al., Nature Biotechnology 2019; 37:424-429(例えば、添付の
図1および添付の備考7)を参照されたい。TAP変換の実施は、配列リードを使用して未修飾Cを含む位置を識別することを容易にすることができる。この手順は、上記のLiu et al. 2019にさらに詳細に記載されているTet支援ピリジンボラン配列決定(TAPS)を包含する。
【0204】
代替的に、hmCの保護(例えば、βGTを使用した)を、置換ボラン還元剤によるTet支援変換と組み合わせてもよい。そのようなTAPSβ変換の実施は、配列リードを使用して、未修飾CまたはhmCを含む位置と、一方ではmCを含む位置とを区別することを容易にすることができる。このタイプの変換の例示的な説明は、例えば、Liu et al., Nature Biotechnology 2019; 37:424-429を参照されたい。
【0205】
そのような変換技法の例としては、APOBECカップリングエピジェネティック(ACE)変換も挙げられる。ACE変換の実施は、配列リードを使用して、hmCを含む位置と、mCまたは未修飾Cを含む位置とを区別することを容易にすることができる。ACE変換の例示的な説明は、例えば、Schutsky et al., Nature Biotechnology 2018; 36: 1083-1090を参照されたい。
【0206】
そのような変換技法の例としては、例えばEM-Seqの場合と同様に、核酸塩基の酵素的変換も挙げられる。例えば、www.biorxiv.org/content/10.1101/2019.12.20.884692v1にて入手可能な、Vaisvila R, et al. (2019) EM-seq: Detection of DNA methylation at single base resolution from picograms of DNA. bioRxiv; DOI: 10.1101/2019.12.20.884692を参照されたい。
【0207】
一部の実施形態では、メチル化は、メチル化感受性制限酵素(MSRE)を使用して検出される。例えば、試料、部分試料、または試料の部分を、1つまたは複数のMSREでの消化に供して、非メチル化配列を切断することができる。例示的なMSREとしては、AatII、AccII、AciI、Aor13HI、Aor15HI、BspT104I、BssHII、BstUI、Cfr10I、ClaI、CpoI、Eco52I、HaeII、HapII、HhaI、Hin6I、HpaII、HpyCH4IV、MluI、MspI、NaeI、NotI、NruI、NsbI、PmaCI、Psp1406I、PvuI、SacII、SalI、SmaI、およびSnaBIが挙げられる。一部の実施形態では、少なくとも2つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、少なくとも3つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUIおよびHpaIIを含む。一部の実施形態では、2つのメチル化感受性ヌクレアーゼは、HhaIおよびAccIIを含む。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUI、HpaII、およびHin6Iを含む。一部の実施形態では、1つまたは複数のMSREと接触させる試料の部分は、高メチル化DNAを含むか、または本明細書の他所に記載のように得ることができる高メチル化DNA分配画分であるかもしくはそれを含む。
【0208】
一部の実施形態では、DNA断片化は、配列決定されたDNAの断片(例えば、cfDNA)の終点および/または中間点を決定することにより検出される。例えば、断片が腫瘍を起源とするかまたは健常細胞を起源とするかに応じて、断片化パターンに差異が生じる可能性がある。断片化に基づいてcfDNAの腫瘍細胞由来DNAを検出するために、異常断片のレベルの増加の存在または非存在を、コピー数増幅(例えば、増幅の度合いに比例する)を有する領域において決定することができ、例えば、増加および異常性は、対照試料または健常試料と比べたものである。
【0209】
一部の実施形態では、試料または部分試料(例えば、試料を、シトシンなどのメチル化、例えば5-メチル化などの、シトシン修飾のレベルに基づいて本明細書に記載のように分配することにより調製される第1、第2、または第3の部分試料)を、メチル化依存性ヌクレアーゼまたはメチル化感受性ヌクレアーゼと接触させる。別様の指定がない限り、分配がシトシン修飾に基づいて実施される場合、第1の部分試料は、より高いレベルの修飾を有する部分試料であり、第2の部分試料は、より低いレベルの修飾を有する部分試料であり、第3の部分試料は、存在する場合、第1の部分試料と第2の部分試料との中間のレベルの修飾を有する。
【0210】
上記で考察されているように、分配手順は、部分試料間のDNA分子の不完全な選別をもたらす可能性がある。非特異的に分配されたDNAを分解するように、メチル化依存性ヌクレアーゼまたはメチル化感受性ヌクレアーゼを選択することができる。例えば、第2の部分試料を、メチル化依存性制限酵素などのメチル化依存性ヌクレアーゼと接触させることができる。これにより、第2の部分試料中の非特異的に分配されたDNA(例えば、メチル化DNA)が分解され、処理された第2の部分試料が生成される。代替的にまたは加えて、第1の部分試料を、メチル化感受性制限酵素などのメチル化感受性エンドヌクレアーゼと接触させ、それにより第1の部分試料中の非特異的に分配されたDNAを分解して、処理された第1の部分試料を生成することができる。第1の部分試料または第2の部分試料のいずれかまたは両方における非特異的に分配されたDNAの分解は、例えば、試料中の異常修飾DNAの存在を検出するために、DNAの起源の組織を決定するために、および/または対象ががんを有するか否かを決定するために、シトシン修飾に基づいてDNAを正確に分配することに依存する方法の性能を向上させるものとして提案される。例えば、そのような分解は、感度を向上および/または下流分析を簡素化することができる。一般に、非特異的に分配されたDNAが、低メチル化分配画分中などで高メチル化されている場合、メチル化依存性制限酵素などのメチル化依存性ヌクレアーゼが使用されるべきである。逆に、非特異的に分配されたDNAが、高メチル化分配画分中などで低メチル化されている場合、メチル化感受性制限酵素などのメチル化感受性ヌクレアーゼが使用されるべきである。メチル化依存性制限酵素などのメチル化依存性ヌクレアーゼは、非メチル化DNAと比べてメチル化DNAを優先的に切断し、メチル化感受性制限酵素などのメチル化感受性ヌクレアーゼは、メチル化DNAと比べて非メチル化DNAを優先的に切断する。
【0211】
部分試料をヌクレアーゼと接触させる際には、1つまたは複数のヌクレアーゼを使用することができる。一部の実施形態では、部分試料を複数のヌクレアーゼと接触させる。部分試料を、ヌクレアーゼと逐次的に接触させてもよくまたは同時に接触させてもよい。ヌクレアーゼが同様の条件下(緩衝液組成など)で活性である場合、不必要な試料操作を回避するためにヌクレアーゼを同時に使用することが有利であり得る。第2の部分試料を、1つよりも多くのメチル化依存性制限酵素と接触させると、非特異的に分配された高メチル化DNAをより完全に分解することができる。同様に、第1の部分試料を、1つよりも多くのメチル化感受性制限酵素と接触させると、非特異的に分配された低メチル化および/または非メチル化DNAをより完全に分解することができる。
【0212】
一部の実施形態では、メチル化依存性ヌクレアーゼは、MspJI、LpnPI、FspEI、またはMcrBCの1つまたは複数を含む。一部の実施形態では、少なくとも2つのメチル化依存性ヌクレアーゼが使用される。一部の実施形態では、少なくとも3つのメチル化依存性ヌクレアーゼが使用される。一部の実施形態では、メチル化依存性ヌクレアーゼはFspEIを含む。一部の実施形態では、メチル化依存性ヌクレアーゼは、例えば逐次的に使用されるFspEIおよびMspJIを含む。
【0213】
一部の実施形態では、メチル化感受性ヌクレアーゼは、AatII、AccII、AciI、Aor13HI、Aor15HI、BspT104I、BssHII、BstUI、Cfr10I、ClaI、CpoI、Eco52I、HaeII、HapII、HhaI、Hin6I、HpaII、HpyCH4IV、MluI、MspI、NaeI、NotI、NruI、NsbI、PmaCI、Psp1406I、PvuI、SacII、SalI、SmaI、およびSnaBIの1つまたは複数を含む。一部の実施形態では、少なくとも2つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、少なくとも3つのメチル化感受性ヌクレアーゼが使用される。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUIおよびHpaIIを含む。一部の実施形態では、2つのメチル化感受性ヌクレアーゼは、HhaIおよびAccIIを含む。一部の実施形態では、メチル化感受性ヌクレアーゼは、BstUI、HpaII、およびHin6Iを含む。
【0214】
一部の実施形態では、FspEIは、少なくとも1つの部分試料(例えば、低メチル化分配画分)中の核酸分子を消化するために使用される。一部の実施形態では、BstUI、HpaII、およびHin6Iは、少なくとも1つの部分試料(例えば、高メチル化分配画分)中の核酸分子を消化するために使用され、FspEIは、少なくとも1つの他の部分試料(例えば、低メチル化分配画分)中の核酸分子を消化するために使用される。中間的にメチル化された分配画分を含む実施形態では、その中の核酸分子は、メチル化感受性ヌクレアーゼまたはメチル化依存性ヌクレアーゼで消化することができる。一部の実施形態では、中間的にメチル化された分配画分中の核酸分子は、高メチル化分配画分と同じヌクレアーゼ(複数可)で消化される。例えば、中間的にメチル化された分配画分を高メチル化分配画分と共にプールしてもよく、次いでプールされた分配画分を消化に供してもよい。一部の実施形態では、中間的にメチル化された分配画分中の核酸分子は、低メチル化分配画分と同じヌクレアーゼ(複数可)で消化される。例えば、中間的にメチル化された分配画分を低メチル化分配画分と共にプールしてもよく、次いでプールされた分配画分を消化に供してもよい。
【0215】
一部の実施形態では、アダプターをDNAの両末端にタグ付けまたは付着させるステップの後で、部分試料を、上記に記載のようにヌクレアーゼと接触させる。タグまたはアダプターは、上記に記載の手法のいずれかを使用するヌクレアーゼによる切断に耐性であってもよい。この手法では、切断産物は両末端にタグまたはアダプターを欠如するため、切断により、非特異的に分配された分子が分析中に持ち越されることを防止することができる。
【0216】
代替的に、アダプターをタグ付けまたは付着させるステップは、上記に記載のヌクレアーゼによる切断後に実施することができる。次いで、配列リード中の切断された分子を、ヌクレアーゼ認識部位に対応する末端(タグまたはアダプターとの付着点)を有することに基づいて識別することができる。この方法で分子を処理すると、切断された分子から情報を取得すること、例えば、体細胞突然変異の観察が可能になり得る。部分試料をヌクレアーゼと接触させた後でアダプターをタグ付けまたは付着させ、cfDNAなどの低分子量DNAを分析する場合、接触ステップの前に高分子量DNA(夾雑ゲノムDNAなど)を試料から除去することが望ましい場合がある。また、変性がその後のライゲーションステップを妨害する可能性があるため、DNAの変性を回避するために、比較的低い温度(例えば、65℃もしくはそれよりも低い、または60℃もしくはそれよりも低い)で熱不活化することができるヌクレアーゼを使用することが望ましい場合がある。
【0217】
試料を、中間的にメチル化された分子を含む第3の部分試料を含む3つの部分試料に分配する場合、一部の実施形態では、第3の部分試料をメチル化感受性ヌクレアーゼと接触させる。そのようなステップは、接触ステップに関して本明細書の他所に記載の特徴のいずれかを有してもよく、上記で考察されているようなタグ付けまたはアダプター付着ステップの前に実施してもよくまたは後で実施してもよい。一部の実施形態では、第1および第3の部分試料は、メチル化感受性ヌクレアーゼと接触させる前に一緒にされている。そのようなステップは、接触ステップに関して本明細書の他所に記載の特徴のいずれを有してもよく、上記で考察されているようなタグ付けまたはアダプター付着ステップの前に実施してもよくまたは後で実施してもよい。一部の実施形態では、第1および第3の部分試料は、一緒にする前に差次的にタグ付けされている。
【0218】
代替的に、試料を、中間的にメチル化された分子を含む第3の部分試料を含む3つの部分試料に分配する場合、一部の実施形態では、第3の部分試料をメチル化依存性ヌクレアーゼと接触させる。そのようなステップは、接触ステップに関して本明細書の他所に記載の特徴のいずれを有してもよく、上記で考察されているようなタグ付けまたはアダプター付着ステップの前に実施してもよくまたは後で実施してもよい。一部の実施形態では、第2および第3の部分試料は、メチル化依存性ヌクレアーゼと接触させる前に一緒にされている。そのようなステップは、接触ステップに関して本明細書の他所に記載の特徴のいずれを有してもよく、上記で考察されているようなタグ付けまたはアダプター付着ステップの前に実施してもよくまたは後で実施してもよい。一部の実施形態では、第2および第3の部分試料は、一緒にする前に差次的にタグ付けされている。
【0219】
一部の実施形態では、DNAは、ヌクレアーゼと接触させた後、例えばSPRIビーズを使用して精製される。そのような精製は、ヌクレアーゼの熱不活化後に生じてもよい。代替的に、精製を省略してもよく、したがって、例えば、増幅などのその後のステップを、熱不活化ヌクレアーゼを含む部分試料に対して実施してもよい。別の実施形態では、接触ステップは、例えば、チューブ移送に伴う喪失を最小限に抑えるために、SPRIビーズなどの精製試薬の存在下で生じてもよい。切断および熱不活化の後、SPRIビーズは、分子密集試薬(例えば、PEG)および塩を添加することによりクリーンアップして再使用することできる。
【0220】
一部の実施形態では、修飾感受性変換が試料または部分試料に対して実施される場合、その試料または部分試料に由来する1つまたは複数の標的領域セット(例えば、少なくともエピジェネティック標的領域セット)のその後の捕捉には、修飾状態(例えば、プローブがハイブリダイズする配列の少なくとも1つの塩基の)に特異的な、例えば、変換(例えば、修飾または未修飾シトシンの、ウラシル、またはアデニンと優先的に対合するDHUなどのそれらの類似体への変換)を起こしているかまたは所望の場合は変換を起こしていない標的配列に相補的なプローブを含む標的特異的プローブが使用される。そのため、プローブは、メチル化などの目的の修飾が存在していたかまたは存在していなかった配列に特異的であってもよい。一部の実施形態では、修飾感受性変換が試料または部分試料に対して実施される場合、その試料または部分試料に由来する1つまたは複数の標的領域セット(例えば、少なくともエピジェネティック標的領域セット)のその後の捕捉には、修飾状態(例えば、修飾または未修飾シトシンの、ウラシル、またはアデニンと優先的に対合するDHUなどのそれらの類似体への変換を起こしていてもよくまたは起こしていなくともよい位置に無差別に対合する核酸塩基を含み、例えば、イノシンはCまたはUと対合することができる)に関わらず標的配列にハイブリダイズすることができるプローブを含む標的特異的プローブが使用される。
【0221】
一部の実施形態では、こうした方法は、第2の部分試料(低メチル化分配画分とも呼ばれる)のDNAの少なくとも部分および第1の部分試料(高メチル化分配画分とも呼ばれる)のDNAの少なくとも部分を含むプールを調製することを含む。例えば、エピジェネティック標的領域および/または配列可変標的領域を含む標的領域を、プールから捕捉することができる。本明細書の他所に記載の部分試料の少なくとも部分から標的領域セットを捕捉するステップは、第1および第2の部分試料に由来するDNAを含むプールに対して実施される捕捉ステップを包含する。プール中のDNAを増幅するステップは、プールから標的領域を捕捉する前に実施してもよい。捕捉ステップは、本明細書の他所に記載の特徴のいずれを有してもよい。
【0222】
エピジェネティック標的領域は、本明細書の他所で考察されているように、それらが腫瘍を起源とするかもしくは健常細胞を起源とするか、またはどのタイプの組織を起源とするかに応じて、メチル化レベルおよび/または断片化パターンに差異を示す可能性がある。配列可変標的領域は、それらが腫瘍を起源とするかまたは健常細胞を起源とするかに応じて配列に差異を示す可能性がある。
【0223】
低メチル化分配画分に由来するエピジェネティック標的領域の分析は、一部の応用では、高メチル化分配画分および低メチル化分配画分に由来する配列可変標的領域、ならびに高メチル化分配画分に由来するエピジェネティック標的領域の分析ほど有益ではない可能性がある。そのため、配列可変標的領域およびエピジェネティック標的領域が捕捉されている方法では、後者は、高メチル化分配画分および低メチル化分配画分に由来する配列可変標的領域ならびに高メチル化分配画分に由来するエピジェネティック標的領域の1つまたは複数よりも少ない程度で捕捉される可能性がある。例えば、配列可変標的領域は、高メチル化分配画分とプールされていない低メチル化分配画分の部分から捕捉することができ、プールは、高メチル化分配画分に由来するDNAの一部(例えば、大部分、実質的にすべて、またはすべて)および低メチル化分配画分に由来するDNAのゼロ量または一部(例えば、少量)を用いて調製することができる。そのような手法では、低メチル化分配画分に由来するエピジェネティック標的領域の配列決定を低減または排除することができ、それによりさらなる分析にとって十分である配列決定データの量が低減される。
【0224】
一部の実施形態では、低メチル化分配画分のDNAの少量をプールに含むことにより、1つまたは複数のエピジェネティック特徴(例えば、メチル化または本明細書の他所で詳細に考察される他のエピジェネティック特徴(複数可))の、例えば相対的基準での定量化が容易になる。
【0225】
一部の実施形態では、プールは、低メチル化分配画分のDNAの少量、例えば、低メチル化分配画分のDNAの約45%、40%、35%、30%、25%、20%、15%、10%、もしくは5%またはそれ未満など、例えば低メチル化分配画分のDNAの約50%未満を含んでいてもよい。一部の実施形態では、プールは、低メチル化分配画分のDNAの約5%~25%を含む。一部の実施形態では、プールは、低メチル化分配画分のDNAの約10%~20%を含む。一部の実施形態では、プールは、低メチル化分配画分のDNAの約10%を含む。一部の実施形態では、プールは、低メチル化分配画分のDNAの約15%を含む。一部の実施形態では、プールは、低メチル化分配画分のDNAの約20%を含む。
【0226】
一部の実施形態では、プールは、高メチル化分配画分のDNAの少なくとも約50%であってもよい、高メチル化分配画分の部分を含む。例えば、プールは、高メチル化分配画分のDNAの少なくとも約55%、60%、65%、70%、75%、80%、85%、90%、または95%を含んでいてもよい。一部の実施形態では、プールは、高メチル化分配画分のDNAの50~55%、55~60%、60~65%、65~70%、70~75%、75~80%、80~85%、85~90%、90~95%、または95~100%を含む。一部の実施形態では、第2のプールは、高メチル化分配画分のすべてまたは実質的にすべてを含む。
【0227】
一部の実施形態では、こうした方法は、低メチル化分配画分のDNAの少なくとも部分を含む第1のプールを調製することを含む。一部の実施形態では、こうした方法は、高メチル化分配画分のDNAの少なくとも部分を含む第2のプールを調製することを含む。一部の実施形態では、第1のプールは、高メチル化分配画分のDNAの部分をさらに含む。一部の実施形態では、第2のプールは、低メチル化分配画分のDNAの部分をさらに含む。一部の実施形態では、第1のプールは、低メチル化分配画分のDNAの大部分を含み、必要に応じて、高メチル化分配画分のDNAの少量を含む。一部の実施形態では、第2のプールは、高メチル化分配画分のDNAの大部分、および低メチル化分配画分のDNAの少量を含む。中間的にメチル化された分配画分を含む一部の実施形態では、第2のプールは、中間的にメチル化された分配画分のDNAの少なくとも部分、例えば、中間的にメチル化された分配画分のDNAの大部分を含む。一部の実施形態では、第1のプールは、低メチル化分配画分のDNAの大部分を含み、第2のプールは、高メチル化分配画分のDNAの大部分および中間的にメチル化された分配画分のDNAの大部分を含む。
【0228】
一部の実施形態では、こうした方法は、標的領域の少なくとも第1のセットを第1のプールから捕捉することを含み、例えば、第1のプールは、上記の実施形態のいずれかに示されている通りである。一部の実施形態では、第1のセットは、配列可変標的領域を含む。一部の実施形態では、第1のセットは、低メチル化可変標的領域および/または断片化可変標的領域を含む。一部の実施形態では、第1のセットは、配列可変標的領域および断片化可変標的領域を含む。一部の実施形態では、第1のセットは、配列可変標的領域、低メチル化可変標的領域、および断片化可変標的領域を含む。第1のプール中のDNAを増幅するステップは、この捕捉ステップの前に実施してもよい。一部の実施形態では、標的領域の第1のセットを第1のプールから捕捉することは、第1のプールのDNAを、標的特異的プローブの第1のセットと接触させることを含む。一部の実施形態では、標的特異的プローブの第1のセットは、配列可変標的領域に特異的な標的結合プローブを含む。一部の実施形態では、標的特異的プローブの第1のセットは、配列可変標的領域、低メチル化可変標的領域、および/または断片化可変標的領域に特異的な標的結合プローブを含む。
【0229】
一部の実施形態では、こうした方法は、標的領域の第2のセットまたは標的領域の複数のセットを第2のプールから捕捉することを含み、例えば、第1のプールは、上記の実施形態のいずれかに示されている通りである。一部の実施形態では、第2の複数は、高メチル化可変標的領域および/または断片化可変標的領域などのエピジェネティック標的領域を含む。一部の実施形態では、第2の複数は、高メチル化可変標的領域および/または断片化可変標的領域などの、配列可変標的領域およびエピジェネティック標的領域を含む。第2のプール中のDNAを増幅するステップは、この捕捉ステップの前に実施してもよい。一部の実施形態では、標的領域の第2の複数のセットを第2のプールから捕捉することは、第1のプールのDNAを、標的特異的プローブの第2のセットと接触させることを含み、標的特異的プローブの第2のセットは、配列可変標的領域に特異的な標的結合プローブおよびエピジェネティック標的領域に特異的な標的結合プローブを含む。一部の実施形態では、標的領域の第1のセットおよび標的領域の第2のセットは同一ではない。例えば、標的領域の第1のセットは、標的領域の第2のセットには存在しない1つまたは複数の標的領域を含んでいてもよい。代替的にまたは加えて、標的領域の第2のセットは、標的領域の第1のセットには存在しない1つまたは複数の標的領域を含んでいてもよい。一部の実施形態では、少なくとも1つの高メチル化可変標的領域は、第2のプールから捕捉されるが、第1のプールからは捕捉されない。一部の実施形態では、複数の高メチル化可変標的領域は、第2のプールから捕捉されるが、第1のプールからは捕捉されない。一部の実施形態では、標的領域の第1のセットは配列可変標的領域を含み、および/または標的領域の第2のセットはエピジェネティック標的領域を含む。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域および断片化可変標的領域を含み、標的領域の第2のセットは、高メチル化可変標的領域および断片化可変標的領域など、エピジェネティック標的領域を含む。一部の実施形態では、標的領域の第1のセットは、配列可変標的領域、断片化可変標的領域を含み、低メチル化可変標的領域を含み、標的領域の第2のセットは、高メチル化可変標的領域および断片化可変標的領域など、エピジェネティック標的領域を含む。
【0230】
一部の実施形態では、第1のプールは、低メチル化分配画分のDNAの大部分および高メチル化分配画分のDNAの部分(例えば、約半分)を含み、第2のプールは、高メチル化分配画分のDNAの部分(例えば、約半分)を含む。一部のそのような実施形態では、標的領域の第1のセットは配列可変標的領域を含み、および/または標的領域の第2のセットはエピジェネティック標的領域を含む。配列可変標的領域および/またはエピジェネティック標的領域は、本明細書の他所に記載の実施形態のいずれかに示されている通りであってもよい。
E.アダプターライゲーションまたは付加;タグ付け
【0231】
一部の実施形態では、本開示の方法は、試料中のDNAを分析することを含む。そのような方法では、アダプターをDNAに付加してもよい。これは、例えば、増幅ステップの前または後で、プライマーの5’部分にアダプターを提供することにより、増幅手順と同時に行うことができる(PCRを使用する場合、これは、ライブラリー調製PCRまたはLP-PCRと呼ばれる場合がある)。一部の実施形態では、アダプターは、ライゲーションなどの他の手法により付加される。一部のそのような方法では、任意の分配または捕捉ステップ前に、第1のアダプターを、一本鎖DNAへのライゲーションを含んでいてもよいその3’末端へのライゲーションにより核酸に付加する。アダプターは、例えばユニバーサルプライマーおよびDNAポリメラーゼを使用した第二鎖合成のプライミング部位として使用することができる。次いで、第2のアダプターを、今や二本鎖である分子の第二鎖の少なくとも3’末端にライゲートさせることができる。一部の実施形態では、第1のアダプターは、ビオチンなどの親和性タグを含み、第1のアダプターにライゲートした核酸は、ストレプトアビジンなどの親和性タグの結合パートナーを含んでいてもよい固体支持体(例えば、ビーズ)に結合する。関連手順のさらなる考察は、Gansauge et al., Nature Protocols 8:737-748 (2013)を参照されたい。一本鎖核酸と適合性である配列決定ライブラリー調製用の市販キット、例えば、Swift BiosciencesのAccel-NGS(登録商標)Methyl-Seq DNAライブラリーキットが入手可能である。一部の実施形態では、アダプターライゲーション後、核酸が増幅される。
【0232】
好ましくは、アダプターは、タグの組合せの数が、同じ開始地点および終止地点を有する2つの核酸が同じタグの組合せを受け取る低い確率、例えば95、99または99.9%の確率をもたらすような十分な数の異なるタグを含む。アダプターは、同じタグを有するかまたは異なるタグを有するかに関わらず、同じまたは異なるプライマー結合部位を含んでいてもよいが、好ましくは、アダプターは同じプライマー結合部位を含む。
【0233】
一部の実施形態では、アダプターの付着後、核酸は増幅に供される。増幅には、例えば、アダプターのプライマー結合部位を認識するユニバーサルプライマーを使用することができる。
【0234】
一部の実施形態では、アダプターの付着後、DNAまたはDNAの部分試料もしくは部分を分配し、DNAを、エピジェネティック修飾を有する核酸に優先的に結合する作用剤と接触させることを含む。核酸は、作用剤との結合により、核酸が修飾を有する程度が異なる少なくとも2つの分配部分試料に分配される。例えば、作用剤が、修飾を有する核酸に対して親和性を有する場合、修飾が過剰存在する核酸(集団内の存在中央値と比較して)は、作用剤と優先的に結合するが、修飾が過少存在する核酸は結合しないか、または作用剤からより容易に溶出される。次いで、アダプター内のプライマー結合部位に結合するプライマーから核酸を増幅することができる。代わりに、アダプター付着前に分配を実施してもよく、その場合、アダプターは、分子がどの分配画分に存在していたかを識別する成分を含む差次的タグを含んでいてもよい。
【0235】
一部の実施形態では、核酸は、プライマー結合部位およびタグを含むY字形アダプターに両端が連結される。分子が増幅される。
【0236】
DNA分子のタグ付けは、タグをDNA分子に付着または会合させる手順である。そのようなタグは、タグが会合している分子の特徴を示す情報を含む、核酸などの分子であってもよい。例えば、分子は、試料タグ(1つの試料中の分子を別の試料中の分子と区別する)、または分子タグ/分子バーコード/バーコード(異なる分子を互いに区別する(一意的タグ付けシナリオおよび非一意的タグ付けシナリオの両方において)を有してもよい。分配ステップを含む方法の場合、分配タグ(1つの分配画分中の分子を別の分配画分中の分子と区別する)を含んでいてもよい。一部の実施形態では、DNA分子に付加されるアダプターはタグを含む。ある特定の実施形態では、タグは、1つのバーコードまたはバーコードの組合せを含んでいてもよい。本明細書で使用される場合、「バーコード」という用語は、文脈に応じて、特定のヌクレオチド配列を有する核酸分子、またはヌクレオチド配列自体を指す。バーコードは、例えば、10~100個のヌクレオチドを有してもよい。バーコードのコレクションは、特定の目的に応じて、縮重配列を有してもよく、またはある特定のハミング距離を有する配列を有してもよい。そのため、例えば、分子バーコードは、1つのバーコードまたは各々が分子の異なる末端に付着している2つのバーコードの組合せで構成されていてもよい。加えてまたは代替的に、異なる分配画分および/または試料の場合、分子バーコードまたは分子タグの異なるセットを、バーコードが個々の配列により分子タグとしての役目を果たし、バーコードがメンバーであるセットに基づき、バーコードが対応する分配画分および/または試料を識別する役目も果たすように、使用することができる。
【0237】
一部の実施形態では、2つまたはそれよりも多くの分配画分、例えば各分配画分は、差次的にタグ付けされる。タグを使用して、タグ(またはタグ(複数))が特定の分配画分と相関するように、個々のポリヌクレオチド集団分配画分を標識することができる。代替的に、タグは、分配ステップを使用しない実施形態で使用してもよい。一部の実施形態では、単一のタグを使用して、特定の分配画分を標識することができる。一部の実施形態では、複数の異なるタグを使用して、特定の分配画分を標識することができる。特定の分配画分を標識するために複数の異なるタグが使用される実施形態では、1つの分配画分を標識するために使用されるタグのセットは、他の分配画分を標識するために使用されるタグのセットと容易に区別することができる。一部の実施形態では、タグは追加の機能を有してもよく、例えば、タグは、試料供給源をインデックス化するために使用することができるか、または一意的分子識別子として使用することができるか(これは、例えば、Kinde et al., Proc Nat'l Acad Sci USA 108: 9530-9535 (2011)、Kou et al., PLoS ONE,11: e0146638 (2016)にあるように、配列決定エラーを突然変異と区別することにより配列決定データの品質を向上させるために使用することができる)、または例えば米国特許第9,598,731号に記載のような非一意的分子識別子として使用することができる。同様に、一部の実施形態では、タグは追加の機能を有してもよく、例えば、タグは、試料供給源をインデックス化するために使用することができるか、または非一意的分子識別子として使用することができる(これは、配列決定エラーを突然変異と区別することにより配列決定データの品質を向上させるために使用することができる)。
【0238】
一部の実施形態では、分配画分タグ付けは、各分配画分中の分子を分配タグでタグ付けすることを含む。分配画分を再混合し(例えば、必要な配列決定実行数を低減し、不必要なコストを回避するため)、分子を配列決定した後、供給源分配画分を分配タグにより識別する。別の実施形態では、異なる分配画分は、例えば、一対のバーコードで構成される分子タグの異なるセットでタグ付けされる。このように、各分子バーコードは、供給源分配画分を示し、ならびに分配画分内の分子の区別にも有用である。例えば、35個のバーコードの第1セットを使用して第1の分配画分中の分子をタグ付けすることができ、35個のバーコードの第2セットを使用して第2の分配画分中の分子をタグ付けすることができる。
【0239】
一部の実施形態では、分配および分配タグによるタグ付けの後、分子を、単一実行で配列決定するためにプールしてもよい。一部の実施形態では、試料タグを、例えば分配タグの付加およびプール化に続くステップにおいて分子に付加する。試料タグにより、単回の配列決定実行で配列決定を行うために複数の試料から生成された物質をプールすることが容易になり得る。
【0240】
代替的に、一部の実施形態では、分配タグを、試料ならびに分配画分と相関させることができる。簡単な例として、第1のタグは、第1の試料の第1の分配画分を示すことができ、第2のタグは、第1の試料の第2の分配画分を示すことができ、第3のタグは、第2の試料の第1の分配画分を示すことができ、第4のタグは、第2の試料の第2の分配画分を示すことができる。
【0241】
タグは、1つまたは複数の特質に基づいて既に分配された分子に付着させてもよいが、ライブラリー中の最終タグ付き分子は、もはやその特質を有していない可能性がある。例えば、一本鎖DNA分子を分配およびタグ付けすることができるが、ライブラリー中の最終タグ付き分子は二本鎖である可能性が高い。同様に、DNAを、異なるレベルのメチル化に基づく分配に供することできるが、最終ライブラリーでは、そうした分子に由来するタグ付き分子はメチル化されていない可能性がある。したがって、ライブラリー中の分子に付着したタグは、典型的には、最終タグ付き分子が由来する「親分子」の特質を示し、必ずしもタグ付き分子自体の特質を示すわけではない。
【0242】
一例として、バーコード1、2、3、4などを使用して、第1の分配画分中の分子をタグ付けおよび標識する。バーコードA、B、C、Dなどを使用して、第2の分配画分中の分子をタグ付けおよび標識する。バーコードa、b、c、dなどを使用して、第3の分配画分中の分子をタグ付けおよび標識する。差次的にタグ付けされた分配画分を、配列決定前にプールしてもよい。差次的にタグ付けされた分配画分は、別々に配列決定してもよく、または例えばIlluminaシーケンサーの同じフローセル内で同時に一緒に配列決定してもよい。
【0243】
配列決定後、リードの分析は、分配画分ごとのレベルでならびに全DNA集団レベルで実施することができる。タグを使用して、異なる分配画分のリードを選別する。分析は、配列情報、ゲノム座標長、網羅範囲、および/またはコピー数を使用して、遺伝子変異およびエピジェネティック変異(メチル化、クロマチン構造などの1つまたは複数)を決定するためのin silico分析を含んでいてもよい。一部の実施形態では、より高い網羅範囲は、ゲノム領域におけるヌクレオソーム占有率がより高いことと相関する可能性があり、より低い網羅範囲は、ヌクレオソーム占有率がより低いことまたはヌクレオソーム枯渇領域(NDR)と相関する可能性がある。
【0244】
分子タグ付けは、配列リードの起源であるDNA分子を区別することを可能にするタグ付け操作を指す。タグ付け戦略は、一意的タグ付け戦略と非一意的タグ付け戦略とに分けることができる。一意的タグ付けでは、試料中のすべてまたは実質的にすべての分子が異なるタグを有するため、リードを、タグ情報のみに基づいて元の分子に割り当てることができる。そのような方法で使用されるタグは、「一意的タグ」と呼ばれることがある。非一意的タグ付けでは、同じ試料中の異なる分子が同じタグを有し得るため、タグ情報に加えて他の情報を使用して、配列リードを元の分子に割り当てる。そのような情報には、開始座標および終止座標、分子がマッピングされる座標、開始座標単独または終止座標単独などを挙げることができる。そのような方法で使用されるタグは、「非一意的タグ」と呼ばれることがある。したがって、試料中のあらゆる分子を一意的にタグ付けする必要はない。試料内の識別可能なクラス内に分類される分子を一意的にタグ付けするだけで十分である。したがって、異なる識別可能なファミリーの分子は、タグ付き分子の同一性に関する情報を失うことなく、同じタグを有することができる。
【0245】
非一意的タグ付けのある特定の実施形態では、使用される異なるタグの数は、特定の群のすべてのDNA分子が異なるタグを有する可能性が非常に高くなる(例えば、少なくとも99%、少なくとも99.9%、少なくとも99.99%、または少なくとも99.999%)のに十分な数であり得る。バーコードをタグとして使用する場合、およびバーコードを例えばランダムに分子の両末端に付着させる場合、バーコードの組合せが一緒になってタグを構成することができることに留意されたい。そしてこの数は、該当コールに分類される分子の数の関数である。例えば、クラスは、参照ゲノムの同じ開始-終止位置にマッピングされるすべての分子であってもよい。クラスは、特定の遺伝子座、例えば、特定の塩基または特定の領域(例えば、最大で100個の塩基または遺伝子もしくは遺伝子のエクソン)にわたってマッピングされるすべての分子であってもよい。ある特定の実施形態では、クラス内の分子の数zを一意的に識別するために使用される異なるタグの数は、2*z、3*z、4*z、5*z、6*z、7*z、8*z、9*z、10*z、11*z、12*z、13*z、14*z、15*z、16*z、17*z、18*z、19*z、20*z、または100*z(例えば、下限)のいずれか~100,000*z、10,000*z、1000*z、または100*z(例えば、上限)のいずれかであり得る。
【0246】
例えば、約5ng~30ngの無細胞DNAの試料では、およそ3000個の分子が特定のヌクレオチド座標にマッピングされ、任意の開始座標を有する約3~10個の分子が同じ終止座標を共有すると予想される。したがって、約50~約50,000個の異なるタグ(例えば、約6~220個のバーコードの組合せ)は、すべてのそのような分子を一意的にタグ付けするのに十分であり得る。ヌクレオチド座標にわたってマッピングされる3,000個の分子すべてを一意的にタグ付けするには、約100万~約2,000万個の異なるタグが必要になるだろう。
【0247】
一般に、反応における一意的または非一意的タグバーコードの割り当ては、米国特許出願公開第20010053519号、第20030152490号、第20110160078号、および米国特許第6,582,908号、米国特許第7,537,898号、および米国特許第9,598,731号に記載されている方法および系に従う。タグは、試料核酸にランダムに連結されていてもよくまたは非ランダムに連結されていてもよい。
【0248】
一部の実施形態では、タグ付き核酸は、マイクロウェルプレートに負荷した後に配列決定される。マイクロウェルプレートは、96,384個または1536個のマイクロウェルを有してもよい。一部の場合では、それらを、予想される比の一意的タグで、マイクロウェルに導入する。例えば、一意的タグは、1ゲノム試料当たり約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000、または1,000,000,000個よりも多くの一意的タグが負荷されるように負荷することができる。一部の場合では、一意的タグは、1ゲノム試料当たり約2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000、または1,000,000,000個未満の一意的タグが負荷されるように負荷することができる。一部の場合では、1試料ゲノム当たりの負荷される一意的タグの平均数は、1ゲノム試料当たり約1、2、3、4、5、6、7、8、9、10、20、50、100、500、1000、5000、10000、50,000、100,000、500,000、1,000,000、10,000,000、50,000,000、または1,000,000,000個未満のまたはそれよりも多くの一意的タグである。
【0249】
好ましい形式では、標的核酸の両末端にライゲートされた20~50個の異なるタグ(例えば、バーコード)が使用される。例えば、35個の異なるタグ(例えば、バーコード)を標的分子の両末端にライゲートして35×35の順列を作出し、これは35個のタグでは1225個に相当する。そのようなタグの数は、同じ開始地点および終止地点を有する異なる分子が、異なる組合せのタグを受け取る確率を高くする(例えば、少なくとも94%、99.5%、99.99%、99.999%)のに十分である。他のバーコード組合せとしては、10~500の任意の数、例えば、約15×15、約35×35、約75×75、約100×100、約250×250、約500×500が挙げられる。
【0250】
一部の場合では、一意的タグは、所定のまたはランダムもしくは半ランダム配列のオリゴヌクレオチドであってもよい。他の場合では、複数のバーコードを使用してもよく、複数のバーコードは必ずしも互いに一意ではない。この例では、バーコードおよびそれがライゲートされ得る配列の組合せが、個々に追跡することができる一意的な配列を作出するように、バーコードを個々の分子にライゲートさせることができる。本明細書に記載のように、配列リードの、始まりの部分(開始部分)および停止(終止)部分との組合せでの配列データ非一意的バーコードの検出は、特定の分子への一意的同一性の割り当てを可能にすることができる。個々の配列リードの長さまたは塩基対数も、そのような分子に一意的同一性を割り当てるために使用することができる。本明細書に記載のように、一意的同一性が割り当てられた一本鎖の核酸に由来する断片は、それにより、親鎖に由来する断片のその後の識別を可能にすることができる。
F.富化/捕捉ステップ;増幅
【0251】
本明細書で開示される方法は、コピー数変異体でもあるタイプ特異的cfDNA標的領域などのDNAを富化または捕捉することを含んでいてもよい。一部の実施形態では、捕捉は、DNAを、標的領域に特異的なプローブと接触させることを含む。富化または捕捉は、当技術分野で公知の任意の好適な手法を使用して、本明細書に記載の任意の試料または部分試料に対して実施することができる。
【0252】
一部の実施形態では、標的領域に特異的なプローブ(つまり、標的特異的プローブ)は、プローブにハイブリダイズしたDNAの富化または捕捉を容易にする捕捉部分を含む。一部の実施形態では、捕捉部分はビオチンである。一部のそのような実施形態では、磁気ビーズなどの固体支持体に付着したストレプトアビジンが、ビオチンとの結合に使用される。標的領域を含まない非特異的に結合したDNAを、捕捉されたDNAから洗い流す。一部の実施形態では、次いでDNAをプローブから解離させ、塩洗浄または別のDNA変性剤を含む緩衝液を使用して固体支持体から溶出させる。一部の実施形態では、プローブは、例えばビオチン-ストレプトアビジン相互作用を破壊することによっても固体支持体から溶出される。一部の実施形態では、捕捉されたDNAは、固体支持体からの溶出後に増幅される。一部のそのような実施形態では、アダプターを含むDNAは、アダプターにアニーリングするPCRプライマーを使用して増幅される。一部の実施形態では、捕捉されたDNAは、固体支持体に付着したままで増幅される。一部のそのような実施形態では、増幅は、アダプター内の配列にアニーリングするPCRプライマー、およびDNAの標的領域にアニーリングするプローブ内の配列にアニーリングするPCRプライマーの使用を含む。
【0253】
一部の実施形態では、本明細書の方法は、エピジェネティック標的領域および/または配列可変標的領域を含むDNAを濃縮または捕捉することを含む。そのような領域は、試料のアリコート、部分、または部分試料(例えば、アダプターの付着および増幅を受けた試料)から捕捉してもよく、メチルシトシンを認識する作用剤を用いてDNAを分配するステップが、試料の別々のアリコート、部分、または部分試料に対して実施される。エピジェネティック標的領域および/または配列可変標的領域を含むDNAの富化または捕捉は、DNAを、標的特異的プローブの第1または第2のセットと接触させることを含んでいてもよい。そのような標的特異的プローブは、上記に示されている実施形態および下記のプローブに関するセクションにあるものを含むがそれらに限定されない、標的特異的プローブのセットについて本明細書に記載されている特徴のいずれを有してもよい。捕捉は、本明細書で開示される方法で調製される1つまたは複数の部分試料に対して実施してもよい。一部の実施形態では、DNAは、第1の部分試料または第2の部分試料から捕捉される。一部の実施形態では、部分試料は、差次的にタグ付けされ(例えば、本明細書に記載のように)、次いで捕捉を受ける前にプールされる。エピジェネティック標的領域および/または配列可変標的領域を含むDNAを捕捉するための例示的な方法は、例えば、WO2020/160414に見出すことができる。この文献は、これにより参照により本明細書に組み込まれる。
【0254】
1つまたは複数の捕捉ステップは、一般に、長さ、塩基組成など、プローブの特徴にある程度依存する、特異的な核酸ハイブリダイゼーションに好適な条件を使用して実施することができる。当業者であれば、核酸ハイブリダイゼーションに関する技術分野における一般知識を考慮し、適切な条件に精通しているだろう。
【0255】
一部の実施形態では、本明細書に記載の方法は、対象から得られるcfDNAの標的領域の複数のセットを捕捉することを含む。標的領域は、それらが腫瘍を起源とするかまたは健常細胞を起源とするかまたはある特定の細胞タイプを起源とするかに応じて差異を含む可能性がある。捕捉ステップでは、cfDNA分子の捕捉セットが生成される。一部の実施形態では、配列可変標的領域セットに対応するcfDNA分子は、エピジェネティック標的領域セットに対応するcfDNA分子よりも、cfDNA分子の捕捉セットにおいてより高い捕捉収量で捕捉される。一部の実施形態では、本明細書に記載の方法は、対象から得られるcfDNAを、標的特異的プローブのセットと接触させることを含み、標的特異的プローブのセットは、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収量で、配列可変標的領域セットに対応するcfDNAを捕捉するように構成されている。捕捉ステップ、捕捉収量、および関連態様の追加の考察は、WO2020/160414を参照されたい。この文献は、あらゆる目的で参照により本明細書に組み込まれる。
【0256】
エピジェネティック標的領域を分析するのに必要であり得るよりも十分な信頼性または正確性で配列可変標的領域を分析するには、より深い深度の配列決定が必要であり得るため、配列可変標的領域セットに対応するcfDNAを、エピジェネティック標的領域セットに対応するcfDNAよりも高い捕捉収量で捕捉することは有益であり得る。断片化パターン(例えば、転写開始部位またはCTCF結合部位の破損を調査するため)または断片存在量(例えば、高メチル化分配画分および低メチル化分配画分における)を決定するのに必要なデータ量は、一般に、がん関連配列突然変異の存在または非存在を決定するのに必要なデータ量よりも少ない。異なる収量で標的領域セットを捕捉することにより、同じ配列決定実行で(例えば、プールした混合物を使用して、および/または同じ配列決定セル内で)異なる配列決定深度まで標的領域を配列決定することが容易になり得る。局所増幅などのコピー数変異は、体細胞突然変異であるが、メチル化の変化など、ある特定のエピジェネティック変化を検出するための手法と同様にリード頻度に基づき配列決定することにより検出することができる。したがって、それらは、機能的な理由でエピジェネティック標的領域とみなすことができる。加えて、高メチル化可変標的領域または断片化可変標的領域でもあるコピー数変異を示す領域は、エピジェネティック変異を示す可能性があるため、エピジェネティック標的領域とみなされる。
【0257】
一部の実施形態では、DNAが増幅される。一部の実施形態では、増幅は、捕捉ステップの前に実施される。一部の実施形態では、増幅は、捕捉ステップの後で実施される。一部の実施形態では、増幅は、捕捉ステップの前および後で実施される。種々の実施形態では、こうした方法は、本明細書の考察と一致するように、例えば、エピジェネティック標的領域セットおよび配列可変標的領域セットについて異なる度合いの配列決定深度まで、捕捉されたDNAを配列決定することをさらに含む。一部の実施形態では、RNAプローブが使用される。一部の実施形態では、DNAプローブが使用される。一部の実施形態では、一本鎖プローブが使用される。一部の実施形態では、二本鎖プローブが使用される。一部の実施形態では、一本鎖RNAプローブが使用される。一部の実施形態では、二本鎖DNAプローブが使用される。
【0258】
一部の実施形態では、捕捉ステップは、配列可変標的領域セットに対するプローブおよびエピジェネティック標的領域セットに対するプローブを用いて同じ容器にて同時に実施され、例えば、配列可変標的領域セットおよびエピジェネティック標的領域セットに対するプローブと捕捉用プローブは同じ組成物中にある。この手法は、比較的簡素なワークフローを提供する。
【0259】
一部の実施形態では、アダプターは、本明細書に記載のように、DNAに含まれている。一部の実施形態では、タグは、バーコードであってもよくまたはバーコードを含んでいてもよく、DNAに含まれている。一部の実施形態では、そのようなタグは、アダプターに含まれている。タグは、核酸の起源の識別を容易にすることができる。例えば、バーコードを使用すると、並列配列決定のために複数の試料をプールした後で、DNAの由来元となった起源(例えば、対象)の特定が可能になり得る。これは、例えば本明細書に記載のように、例えばプライマーの5’部分にバーコードを提供することにより、増幅手順と同時に行うことができる。一部の実施形態では、アダプターおよびタグ/バーコードは、同じプライマーまたはプライマーセットにより提供される。例えば、バーコードは、アダプターの3’およびプライマーの標的ハイブリダイゼーション部分の5’に位置してもよい。代替的に、バーコードは、必要に応じて、同じライゲーション基質のアダプターと共に、ライゲーションなどの他の手法により付加することができる。
【0260】
増幅、タグ、およびバーコードに関する追加の詳細は、本明細書で考察されており、それらは、そうした実施形態のいずれかと共に実行可能な程度に組み合わせることができる。
G.捕捉されたDNA;標的領域
【0261】
一部の実施形態では、本明細書に記載の方法を使用して捕捉または富化された核酸は、捕捉されたDNAを含む。一部の実施形態では、捕捉されたDNAは、タイプ特異的エピジェネティック変異およびコピー数変異を両方とも含む領域を含む。一部の実施形態では、変異は、健常細胞には存在するが、血液試料などの試料タイプには通常存在しない。一部の実施形態では、変異は、異常細胞(例えば、過形成細胞、化生細胞、または新生物細胞)に存在する。
【0262】
一部の実施形態では、試料または第1の部分試料から捕捉された第1の捕捉エピジェネティック標的領域セットは、高メチル化可変標的領域を含む。一部の実施形態では、高メチル化可変標的領域は、1つまたは複数の関連する細胞タイプまたは組織タイプに由来する健常cfDNAにおいてタイプ特異的高メチル化を示す。いかなる特定の理論にも束縛されることは望まないが、がん細胞の存在は、血流へのDNAの排出(例えば、がんおよび/または周囲組織から)を増加させる可能性がある。そのため、cfDNAの起源である組織の分布は、発がんに際して変化する可能性がある。したがって、第1の部分試料における高メチル化可変標的領域のレベルの増加は、がんの存在(または対象の病歴に応じて再発)の指標であり得る。
【0263】
一部の実施形態では、本明細書の方法は、試料または第2の部分試料から第2の捕捉エピジェネティック標的領域セットを捕捉することを含む。一部の実施形態では、第2のエピジェネティック標的領域セットは、低メチル化可変標的領域を含む。いかなる特定の理論にも束縛されることを望まないが、がん細胞は、同じ組織タイプの健常細胞よりも多くのDNAを血流へと排出する可能性がある。そのため、cfDNAの起源である組織の分布は、発がんに際して変化する可能性がある。したがって、第2の部分試料における低メチル化可変標的領域のレベルの増加は、がんの存在(または対象の病歴に応じて再発)の指標であり得る。
【0264】
加えて、捕捉された標的領域セットは、配列可変標的領域セットに対応するDNAを含んでいてもよい。捕捉セットを一緒にして、一緒にした捕捉セットを提供することができる。
【0265】
配列可変標的領域セットおよびエピジェネティック標的領域セットに対応するDNAを含む捕捉セットが、上記で考察されている一緒にした捕捉セットを含む一部の実施形態では、配列可変標的領域セットに対応するDNAは、エピジェネティック標的領域セットに対応するDNAよりも高い濃度で、例えば、1.1~1.2倍の濃度で、1.2~1.4倍の濃度で、1.4~1.6倍の濃度で、1.6~1.8倍の濃度で、1.8~2.0倍の濃度で、2.0~2.2倍の濃度で、2.2~2.4倍の濃度で、2.4~2.6倍の濃度で、2.6~2.8倍の濃度で、2.8~3.0倍の濃度で、3.0~3.5倍の濃度で、3.5~4.0、4.0~4.5倍の濃度で、4.5~5.0倍の濃度で、5.0~5.5倍の濃度で、5.5~6.0倍の濃度で、6.0~6.5倍の濃度で、6.5~7.0倍の濃度で、7.0~7.5倍の濃度で、7.5~8.0倍の濃度で、8.0~8.5倍の濃度で、8.5~9.0倍の濃度で、9.0~9.5倍の濃度で、9.5~10.0倍の濃度で、10~11倍の濃度で、11~12倍の濃度で、12~13倍の濃度で、13~14倍の濃度で、14~15倍の濃度で、15~16倍の濃度で、16~17倍の濃度で、17~18倍の濃度で、18~19倍の濃度で、19~20倍の濃度で、20~30倍の濃度で、30~40倍の濃度で、40~50倍の濃度で、50~60倍の濃度で、60~70倍の濃度で、70~80倍の濃度で、80~90倍の濃度で、または90~100倍の濃度で存在してもよい。定義セクションで考察されているように、濃度の差異の度合いは、標的領域のフットプリントサイズの正規化に相当する。
1.標的領域
【0266】
一部の実施形態では、捕捉されたDNAは、タイプ特異的エピジェネティック変異およびコピー数変異を有する領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、タイプ特異的エピジェネティック変異およびコピー数変異を有する標的領域からなる。一部の実施形態では、タイプ特異的エピジェネティック変異、例えば、差次的メチル化またはタイプ特異的断片化パターンは、1つまたは複数の関連する細胞タイプまたは組織タイプに由来するDNAと、試料または対象に存在する他の細胞タイプまたは組織タイプに由来するDNAとを区別する可能性が高い。
【0267】
一部の実施形態では、試料または第1の部分試料から捕捉された捕捉エピジェネティック標的領域セットは、高メチル化可変標的領域を含む。一部の実施形態では、高メチル化可変標的領域は、1つまたは複数の関連する細胞タイプまたは組織タイプにおいて差次的にまたは排他的に高メチル化されている。そのような高メチル化可変標的領域は、他の細胞タイプまたは組織タイプにおいて高メチル化されていてもよいが、1つまたは複数の関連する細胞タイプまたは組織タイプで観察される程ではない。一部の実施形態では、高メチル化可変標的領域は、1つまたは複数の関連する細胞タイプまたは組織タイプの疾患細胞に由来するcfDNAにおいてさらにより高度なメチル化を示す。一部の実施形態では、標的領域は、異常に高いコピー数を有する高メチル化領域を含む。一部のそのような実施形態では、標的領域は、健常および疾患結腸組織において高メチル化されており、前がん性またはがん性結腸組織において異常に高いコピー数を有する。そのような標的領域の例を以下の表1に示す。
【表1-1】
【表1-2】
【0268】
一部の実施形態では、試料または部分試料から捕捉された捕捉エピジェネティック標的領域セットは、低メチル化可変標的領域を含む。一部の実施形態では、低メチル化可変標的領域は、1つまたは複数の関連する細胞タイプまたは組織タイプにおいて排他的に低メチル化されている。そのような低メチル化可変標的領域は、他の細胞タイプまたは組織タイプにおいて低メチル化されていてもよいが、1つまたは複数の関連する細胞タイプまたは組織タイプで観察される程ではない。
【0269】
いかなる特定の理論にも束縛されることは望まないが、がんを有する個体では、増殖中のまたは瀕死のがん細胞は、それぞれ、健常個体の細胞および/または同じ組織タイプの健常細胞よりも多くのDNAを血流へと排出する可能性がある。そのため、cfDNAの起源である細胞タイプおよび/または組織の分布は、発がんに際して変化する可能性がある。したがって、ある特定の細胞タイプまたは組織タイプを起源とするcfDNAの存在および/またはレベルは、疾患の指標であり得る。
【0270】
種々の細胞タイプを区別するために有用なさらなる例示的な高メチル化可変標的領域および低メチル化可変標的領域は、例えば、Scott, C.A., Duryea, J.D., MacKay, H. et al., "Identification of cell type-specific methylation signals in bulk whole genome bisulfite sequencing data," Genome Biol 21, 156 (2020) (doi.org/10.1186/s13059-020-02065-5)に記載のように、種々の細胞タイプから得られるDNAを全ゲノム亜硫酸水素塩配列決定で分析することにより識別されている。全ゲノム亜硫酸水素塩配列データは、Blueprintコンソーシアムから入手可能であり、インターネットのdcc.blueprint-epigenome.euにて入手可能である。
【0271】
一部の実施形態では、第1および第2の捕捉標的領域セットは、例えば、WO2020/160414に記載のように、それぞれ、配列可変標的領域セットに対応するDNAおよびエピジェネティック標的領域セットに対応するDNAを含む。第1および第2の捕捉セットを一緒にして、一緒にした捕捉セットを提供してもよい。一部の実施形態では、配列可変標的領域セットおよびエピジェネティック標的領域セットは、WO2020/160414において、そのようなセットについて記載されている特徴のいずれを有してもよく、この文献は、その全体が参照により本明細書に組み込まれる。一部の実施形態では、エピジェネティック標的領域セットは、高メチル化可変標的領域セットを含む。一部の実施形態では、エピジェネティック標的領域セットは、低メチル化可変標的領域セットを含む。一部の実施形態では、エピジェネティック標的領域セットは、CTCF結合領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、断片化可変標的領域を含む。一部の実施形態では、エピジェネティック標的領域セットは、転写開始部位を含む。
【0272】
一部の実施形態では、配列可変標的領域セットは、がんにおいて体細胞突然変異を起こすことが公知である複数の領域を含む。一部の態様では、配列可変標的領域セットは、がんを有する対象の決定された割合が、パネル中の1つまたは複数の異なる遺伝子またはゲノム領域において遺伝子変異体または腫瘍マーカーを呈するように選択された複数の異なる遺伝子またはゲノム領域(「パネル」)を標的とする。パネルは、配列決定のための領域を一定数の塩基対に制限するように選択することができる。パネルは、例えば、本明細書の他所に記載のようにプローブの親和性および/または量を調整することにより、所望量のDNAを配列決定するように選択してもよい。パネルは、所望の配列リード深度を達成するようにさらに選択してもよい。パネルは、配列決定された塩基対の量に対して、所望の配列リード深度または配列リード網羅範囲を達成するように選択してもよい。パネルは、試料中の1つまたは複数の遺伝子変異体を検出するための理論的感度、理論的特異度、および/または理論的正確性を達成するように選択してもよい。
【0273】
領域のパネルを検出するためのプローブとしては、目的のゲノム領域(ホットスポット領域)を検出するためのプローブを挙げることができる。プローブの設計にはクロマチン構造に関する情報を考慮してもよく、および/またはプローブは、特定の部位(例えば、KRASコドン12および13)を捕捉することができる可能性を最大化するように設計してもよく、ヌクレオソーム結合パターンおよびGC配列組成により影響を受けるcfDNA網羅範囲および断片サイズ変異の分析に基づき捕捉を最適化するように設計してもよい。本明細書で使用される領域として、ヌクレオソーム位置およびGCモデルに基づいて最適化された非ホットスポット領域を挙げることができる。
【0274】
領域のパネルを検出するためのプローブとしては、目的のゲノム領域(ホットスポット領域)を検出するためのプローブを挙げることができる。プローブの設計にはクロマチン構造に関する情報を考慮してもよく、および/またはプローブは、特定の部位(例えば、KRASコドン12および13)が捕捉され得る可能性を最大化するように設計してもよく、ヌクレオソーム結合パターンおよびGC配列組成により影響を受けるcfDNA網羅範囲および断片サイズ変異の分析に基づき捕捉を最適化するように設計してもよい。また、本明細書で使用される領域は、ヌクレオソーム位置およびGCモデルに基づき最適化された非ホットスポット領域を含んでいてもよい。
【0275】
目的のゲノム位置のリストの例は、WO2020/160414の、例えば表4に見出すことができる。一部の実施形態では、本開示の方法で使用される配列可変標的領域セットは、WO2020/160414の表3の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70個の少なくとも部分を含む。一部の実施形態では、本開示の方法で使用される配列可変標的領域セットは、WO2020/160414の表4の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73個の少なくとも部分を含む。加えてまたは代替的に、好適な標的領域セットは文献から入手可能である。例えば、参照により本明細書に組み込まれるGale et al., PLoS One 13: e0194630 (2018)には、配列可変標的領域セットの一部またはすべてとして使用することができる35個のがん関連遺伝子標的のパネルが記載されている。こうした35個の標的は、AKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53、およびU2AF1である。
【0276】
一部の実施形態では、配列可変標的領域セットは、上記およびWO2020/160414に列挙されているがん関連遺伝子など、少なくとも10、20、30、または35個のがん関連遺伝子に由来する標的領域を含む。
H.配列決定
【0277】
一般に、アダプターによりフランキングされている核酸を含む試料核酸は、以前の増幅の有無に関わらず、配列決定に供することができる。配列決定法としては、例えば、サンガー配列決定法、ハイスループット配列決定法、ピロシーケンス法、合成による配列決定法、単一分子配列決定法、ナノポア配列決定法、半導体配列決定法、ライゲーションによる配列決定法、ハイブリダイゼーションによる配列決定法、デジタル遺伝子発現法(Helicos)、次世代配列決定法(NGS)、合成による単一分子配列決定法(SMSS)(Helicos)、酵素的メチル配列決定法(EM-Seq)、Tet支援ピリジンボラン配列決定法(TAPS)、超並列配列決定法、クローン単一分子アレイ法(Solexa)、ショットガン配列決定法、Ion Torrent、Oxford Nanopore、Roche Genia、Maxim-Gilbert配列決定法、プライマーウォーキング法、およびPacBio、SOLiD、Ion Torrent、またはNanoporeプラットフォームを使用した配列決定法が挙げられる。
【0278】
一部の実施形態では、配列決定は、未修飾および修飾核酸塩基を検出および/または区別することを含む。例えば、単一分子リアルタイム(SMRT)配列決定法およびナノポア配列決定法は、例えば、5-メチルシトシンおよび5-ヒドロキシメチルシトシンならびに未修飾シトシンの直接検出を容易にすることができる。例えば、Schatz., Nature Methods. 14(4): 347-348 (2017);US9,150,918;およびSimpson et al., Nature Methods. 14:407-410, doi:10.1038/nmeth.4184 (2017)を参照されたい。配列決定反応は、複数のレーン、複数のチャネル、複数のウェル、または複数の試料セットを実質的に同時に処理する他の手段であってもよい、様々な試料処理ユニットで実施することができる。また、試料処理ユニットは、複数の実行を同時に処理することができるように複数の試料チャンバーを含んでいてもよい。
【0279】
配列決定反応は、がんまたは他の疾患のマーカーを含むことが既知である核酸など、1つまたは複数の形態の核酸に対して実施することができる。配列決定反応は、試料中に存在する任意の核酸断片に対して実施することもできる。一部の実施形態では、ゲノムの配列網羅範囲は、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、95%、99%、99.9%、または100%未満であってもよい。一部の実施形態では、配列決定反応は、ゲノムの少なくとも5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、または80%の配列網羅範囲を提供することができる。配列網羅範囲は、少なくとも5、10、20、70、100、200、または500個の異なる遺伝子、または最大で5000、2500、1000、500、または100個の異なる遺伝子に対して実施することができる。
【0280】
同時配列決定反応は、マルチプレックス配列決定法を使用して実施することができる。一部の場合では、無細胞核酸は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000回の配列決定反応を用いて配列決定してもよい。他の場合では、無細胞核酸は、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000回未満の配列決定反応を用いて配列決定してもよい。配列決定反応は、逐次的に実施してもよくまたは同時に実施してもよい。その後のデータ分析は、配列決定反応のすべてまたは一部に対して実施してもよい。一部の場合では、データ分析は、少なくとも1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000回の配列決定反応に対して実施してもよい。他の場合では、データ分析は、1000、2000、3000、4000、5000、6000、7000、8000、9000、10000、50000、100,000回未満の配列決定反応に対して実施してもよい。例示的なリード深度は、1遺伝子座(塩基)当たり1000~50000個のリードである。
III.ある特定の本開示の方法の追加特徴
A.試料
【0281】
試料は、対象から単離された任意の生物学的試料であってもよい。試料は、身体試料であってもよい。試料としては、既知または疑わしい固形腫瘍、全血、血小板、血清、血漿、便、赤血球、白血球細胞または白血球、内皮細胞、組織生検、脳脊髄液 滑液、リンパ液、腹水、間質液または細胞外液、細胞間の空間にある流体、歯肉溝滲出液、骨髄、胸水、胸膜液、脳脊髄液、唾液、粘液、痰、精液、汗、および尿などの身体組織または流体を挙げることができる。試料は、好ましくは、体液、特に血液およびその画分、脳脊髄液、胸膜液、唾液、痰、または尿である。試料は、対象から単離された元の形態であってもよく、あるいは細胞などの成分を除去もしくは追加するための、または1つの成分を別の成分と比べて富化するためのさらなる処理に供されていてもよい。したがって、分析のための好ましい体液は、無細胞核酸を含む血漿または血清である。
【0282】
一部の実施形態では、核酸の集団は、新生物、腫瘍、前がん、もしくはがんを有することが疑われる対象、または新生物、腫瘍、前がん、もしくはがんと以前に診断された対象に由来する血清、血漿、または血液試料から得られる。集団は、様々なレベルの配列変異、エピジェネティック変異、および/または複製後修飾もしくは転写後修飾を有する核酸を含む。複製後修飾としては、特に核酸塩基の5位におけるシトシンの修飾、例えば、5-メチルシトシン、5-ヒドロキシメチルシトシン、5-ホルミルシトシン、および5-カルボキシルシトシンが挙げられる。
【0283】
試料は、対象から単離または得られ、試料分析の現場へと輸送することができる。試料は、望ましい温度、例えば、室温、4℃、-20℃、および/または-80℃で保存および発送することができる。試料は、試料分析の現場で対象から単離または得ることができる。対象は、ヒト、哺乳動物、動物、伴侶動物、介助動物、またはペットであってもよい。対象は、がん、前がん、感染症、移植拒絶反応、または免疫系の変化に関する他の疾患もしくは障害を有する可能性がある。対象は、がんも検出可能ながんの症状も有していない可能性がある。対象は、1つまたは複数のがん療法、例えば、化学療法、抗体、ワクチン、または生物製剤のいずれか1つまたは複数で処置されていてもよい。対象は、寛解状態にあってもよい。対象は、がんまたは任意のがん関連遺伝子突然変異/障害に罹り易いと診断されていてもよくまたはされていなくてもよい。
【0284】
一部の実施形態では、試料は血漿を含む。得られる血漿の体積は、配列決定された領域の所望のリード深度に依存する可能性がある。例示的な体積は、0.4~40ml、5~20ml、10~20mlである。例えば、体積は、0.5mL、1mL、5mL 10mL、20mL、30mL、または40mLであってもよい。採取される血漿の体積は、5~20mLであってもよい。
【0285】
試料は、ゲノム相当物を含む種々の量の核酸を含んでいてもよい。例えば、約30ngのDNAの試料は、約10,000(104)個の半数体ヒトゲノム相当物、およびcfDNAの場合は、約2,000億(2×1011)個の個々のポリヌクレオチド分子を含んでいてもよい。同様に、約100ngのDNAの試料は、約30,000個の半数体ヒトゲノム相当物、およびcfDNAの場合は、約6,000億個の個々の分子を含んでいてもよい。
【0286】
試料は、異なる供給源に由来する、例えば、同じ対象の細胞および無細胞に由来する、異なる対象の細胞および無細胞に由来する核酸を含んでいてもよい。試料は、突然変異を有する核酸を含んでいてもよい。例えば、試料は、生殖系列突然変異および/または体細胞突然変異を有するDNAを含んでいてもよい。生殖系列突然変異は、対象の生殖系列DNAに存在する突然変異を指す。体細胞突然変異は、対象の体細胞、例えばがん細胞を起源とする突然変異を指す。試料は、がん関連突然変異(例えば、がん関連体細胞突然変異)を有するDNAを含んでいてもよい。試料は、エピジェネティック変異体(つまり、化学的修飾またはタンパク質修飾)を含んでいてもよく、エピジェネティック変異体は、がん関連突然変異などの遺伝子変異体の存在と関連付けられる。一部の実施形態では、試料は、遺伝子変異体の存在に関連付けられるエピジェネティック変異体を含み、試料は遺伝子変異体を含まない。
【0287】
増幅前の試料中の無細胞核酸の量の例は、約1fg~約1μg、例えば、1pg~200ng、1ng~100ng、10ng~1000ngの範囲である。例えば、量は、最大で約600ng、最大で約500ng、最大で約400ng、最大で約300ng、最大で約200ng、最大で約100ng、最大で約50ng、または最大で約20ngの無細胞核酸分子であってもよい。量は、少なくとも1fg、少なくとも10fg、少なくとも100fg、少なくとも1pg、少なくとも10pg、少なくとも100pg、少なくとも1ng、少なくとも10ng、少なくとも100ng、少なくとも150ng、または少なくとも200ngの無細胞核酸分子であってもよい。量は、最大で1フェムトグラム(fg)、10fg、100fg、1ピコグラム(pg)、10pg、100pg、1ng、10ng、100ng、150ng、または200ngの無細胞核酸分子であってもよい。本方法は、1フェムトグラム(fg)~200ngを得ることを含んでいてもよい。
【0288】
無細胞DNAは、対象から単離された時点で細胞内に含まれていないDNAを指す。例えば、cfDNAは、細胞を溶解することも細胞内DNAを抽出することもせず、インタクト細胞を除去した後で試料中に残るDNAとして、試料から単離することができる。無細胞核酸としては、ゲノムDNA、ミトコンドリアDNA、siRNA、miRNA、循環RNA(cRNA)、tRNA、rRNA、核小体低分子RNA(snoRNA)、Piwi結合RNA(piRNA)、長鎖非コードRNA(長鎖ncRNA)、またはこれらのいずれかの断片を含む、DNA、RNA、およびそれらのハイブリッドが挙げられる。無細胞核酸は、二本鎖、一本鎖、またはそれらのハイブリッドであってもよい。無細胞核酸は、分泌または細胞死プロセス、例えば細胞壊死およびアポトーシスにより体液へと放出される可能性がある。一部の無細胞核酸、例えば循環腫瘍DNA(ctDNA)は、がん細胞から体液へと放出される。他のものは健常細胞から放出される。一部の実施形態では、cfDNAは無細胞胎児DNA(cffDNA)である。一部の実施形態では、無細胞核酸は、腫瘍細胞により産生される。一部の実施形態では、無細胞核酸は、腫瘍細胞および非腫瘍細胞の混合物により産生される。
【0289】
無細胞核酸は、約100~500ヌクレオチドの例示的なサイズ分布を有し、110~約230ヌクレオチドの分子が分子の約90%を占め、最頻値は約168ヌクレオチドであり、240~440ヌクレオチドの範囲に第2のマイナーピークがある。
【0290】
無細胞核酸は、溶液中に見出される無細胞核酸がインタクト細胞および体液の他の不溶性成分から分離される分画または分配ステップにより体液から単離することができる。分配は、遠心分離または濾過などの技法を含んでいてもよい。代替的に、体液中の細胞を溶解し、無細胞核酸および細胞性核酸を一緒に処理してもよい。一般に、緩衝液の添加および洗浄ステップの後、核酸をアルコールで沈殿させることができる。夾雑物または塩を除去するために、シリカベースカラムなどのさらなるクリーンアップステップを使用してもよい。亜硫酸水素塩配列決定、ハイブリダイゼーション、および/またはライゲーションのための、C 1 DNA、DNA、またはタンパク質などの非特異的バルクキャリア核酸を、反応の全体にわたって添加して、収量などの、手順のある特定の側面を最適化することができる。
【0291】
そのような処理の後、試料は、二本鎖DNA、一本鎖DNA、および一本鎖RNAを含む種々の形態の核酸を含んでいてもよい。一部の実施形態では、一本鎖DNAおよびRNAを二本鎖形態に変換することができ、それらは、その後の処理および分析ステップに含まれる。
【0292】
試料中の二本鎖DNA分子、および二本鎖DNA分子に変換された一本鎖核酸分子は、一方の末端または両方の末端のいずれかがアダプターに連結されていてもよい。典型的には、二本鎖分子は、4つすべての標準ヌクレオチドの存在下での、5’-3’ポリメラーゼおよび3’-5’エクソヌクレアーゼ(またはプルーフリーディング機能)を有するポリメラーゼでの処理により平滑末端化される。好適なポリメラーゼの例は、Klenow大型断片およびT4ポリメラーゼである。平滑末端化DNA分子は、少なくとも部分的に二本鎖のアダプター(例えば、Y字形またはベル形アダプター)にライゲートされていてもよい。代替的に、ライゲーションを容易にするために、相補的ヌクレオチドを、試料核酸およびアダプターの平滑末端に追加してもよい。本明細書では、平滑末端ライゲーションおよび粘着末端ライゲーションの両方が企図される。平滑末端ライゲーションでは、核酸分子およびアダプタータグの両方が平滑末端を有する。粘着末端ライゲーションでは、典型的には、核酸分子は「A」突出を有し、アダプターは「T」突出を有する。
B.増幅
【0293】
アダプターによりフランキングされている試料核酸は、PCRおよび他の増幅方法により増幅することができる。増幅は、典型的には、増幅しようとするDNA分子をフランキングするアダプターのプライマー結合部位に結合するプライマーによりプライミングされる。増幅方法は、熱サイクルにより生じる、変性、アニーリング、および伸長のサイクルを含んでいてもよく、または転写媒介増幅の場合のように等温であってもよい。他の増幅方法としては、リガーゼ連鎖反応法、鎖置換増幅法、核酸配列ベース増幅法、および自己持続性配列ベース複製法が挙げられる。
【0294】
一部の実施形態では、本方法では、T尾部アダプターおよびC尾部アダプターによるdsDNAライゲーションを実施し、それによりアダプターに連結される前に二本鎖核酸の少なくとも50、60、70、または80%の増幅がもたらされる。好ましくは、本方法は、T尾部アダプターのみを用いて実施される対照方法と比べて、増幅分子の量または数を少なくとも10、15、または20%増加させる。
C.捕捉部分
【0295】
上記で考察されているように、試料中の核酸を、ある特定の特質を有する分子が捕捉および分析される捕捉ステップに供してもよい。標的捕捉は、ビオチンまたは下記に記載の他の例などの捕捉部分で標識されたオリゴヌクレオチドベイトを含むベイトセットの使用を含んでいてもよい。プローブは、遺伝子などの領域のパネルにわたって並べて配置されるように選択された配列を有してもよい。一部の実施形態では、ベイトセットは、本明細書の他所で考察されているように、それぞれ配列可変標的領域セットおよびエピジェネティック標的領域セットの捕捉収量など、標的領域のセットに関してより高い捕捉収量およびより低い捕捉収量を有してもよい。そのようなベイトセットを、標的分子とベイトとのハイブリダイゼーションを可能にする条件下で試料と一緒にする。次いで、捕捉された分子を、捕捉部分を使用して単離する。DNA捕捉は、ビオチンで標識された標的特異的プローブなどの捕捉部分、およびストレプトアビジンなどの、捕捉部分に結合する第2の部分または結合パートナーで標識されたオリゴヌクレオチドの使用を含んでいてもよい。一部の実施形態では、捕捉部分および結合パートナーは、本明細書の他所で考察されているように、それぞれ配列可変標的領域セットおよびエピジェネティック標的領域セットを捕捉するために使用されるものなど、プローブの異なるセットに関してより高い捕捉収量およびより低い捕捉収量を有してもよい。捕捉部分を含む方法は、例えば、2017年12月26日に発行されたUS9,850,523にさらに記載されている。この文献は、参照により本明細書に組み込まれる。
【0296】
捕捉部分としては、限定ではないが、ビオチン、アビジン、ストレプトアビジン、特定のヌクレオチド配列を含む核酸、抗体により認識されるハプテン、および磁気誘引性粒子が挙げられる。抽出部分は、ビオチン/ストレプトアビジンまたはハプテン/抗体などの結合対のメンバーであってもよい。一部の実施形態では、分析物に付着する捕捉部分は、磁気誘引性粒子または遠心分離により沈降させることができる大型粒子などの分離可能部分に付着するその結合対により捕捉される。捕捉部分は、捕捉部分を有する核酸と捕捉部分を欠如する核酸との親和性分離を可能にする任意のタイプの分子であってもよい。例示的な捕捉部分は、固相に連結されているかもしくは連結可能なストレプトアビジンに結合することにより親和性分離を可能にするビオチン、または固相に連結されているかもしくは連結可能な相補的オリゴヌクレオチドに結合することにより親和性分離を可能にするオリゴヌクレオチドである。
D.標的特異的プローブのコレクション
【0297】
一部の実施形態では、標的特異的プローブのコレクションが、本明細書に記載の方法で使用される。一部の実施形態では、標的特異的プローブのコレクションは、配列可変標的領域セットに特異的な標的結合プローブおよびエピジェネティック標的領域セットに特異的な標的結合プローブを含む。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも高い(例えば、少なくとも2倍高い)。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに特異的なその捕捉収量よりも高い(例えば、少なくとも2倍高い)配列可変標的領域セットに特異的な捕捉収量を有するように構成されている。
【0298】
一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも少なくとも1.25、1.5、1.75、2、2.25、2.5、2.75、3、3.5、4、4.5、5、6、7、8、9、10、11、12、13、14、または15倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの捕捉収量は、エピジェネティック標的領域セットに特異的な標的結合プローブの捕捉収量よりも1.25~1.5、1.5~1.75、1.75~2、2~2.25、2.25~2.5、2.5~2.75、2.75~3、3~3.5、3.5~4、4~4.5、4.5~5、5~5.5、5.5~6、6~7、7~8、8~9、9~10、10~11、11~12、13~14、または14~15倍高い。
【0299】
一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに特異的なその捕捉収量よりも少なくとも1.25、1.5、1.75、2、2.25、2.5、2.75、3、3.5、4、4.5、5、6、7、8、9、10、11、12、13、14、または15倍高い、配列可変標的領域セットに特異的な捕捉収量を有するように構成されている。一部の実施形態では、標的特異的プローブのコレクションは、エピジェネティック標的領域セットに特異的なその捕捉収量よりも1.25~1.5、1.5~1.75、1.75~2、2~2.25、2.25~2.5、2.5~2.75、2.75~3、3~3.5、3.5~4、4~4.5、4.5~5、5~5.5、5.5~6、6~7、7~8、8~9、9~10、10~11、11~12、13~14、または14~15倍高い、配列可変標的領域セットに特異的な捕捉収量を有するように構成されている。
【0300】
プローブのコレクションは、濃度、異なる長さおよび/または化学的性質(例えば、親和性に影響を及ぼす)、ならびにそれらの組合せを含む様々な点で、配列可変標的領域セットに関してより高い捕捉収量を提供するように構成することができる。親和性は、プローブの長さを調整することにより、および/または下記に考察されているヌクレオチド修飾を含めることによりモジュレートすることができる。
【0301】
一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも高濃度で存在する。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合プローブの濃度よりも少なくとも1.25、1.5、1.75、2、2.25、2.5、2.75、3、3.5、4、4.5、5、6、7、8、9、10、11、12、13、14、または15倍高い。一部の実施形態では、配列可変標的領域セットに特異的な標的結合プローブの濃度は、エピジェネティック標的領域セットに特異的な標的結合プローブの濃度よりも1.25~1.5、1.5~1.75、1.75~2、2~2.25、2.25~2.5、2.5~2.75、2.75~3、3~3.5、3.5~4、4~4.5、4.5~5、5~5.5、5.5~6、6~7、7~8、8~9、9~10、10~11、11~12、13~14、または14~15倍高い。そのような実施形態では、濃度は、各セットにおける個々のプローブの平均の体積当たりの質量濃度を指す場合がある。
【0302】
一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも、それらの標的に対してより高い親和性を有する。親和性は、異なるプローブ化学を使用することによるなど、当業者に公知の任意の方法でモジュレートすることができる。例えば、シトシン5-メチル化(ある特定の配列文脈における)、2’糖位にヘテロ原子をもたらす修飾、およびLNAヌクレオチドなどのある特定のヌクレオチド修飾は、二本鎖核酸の安定性を増加させることができ、これは、そのような修飾を有するオリゴヌクレオチドが、それらの相補的配列に対して比較的より高い親和性を有することを示す。例えば、Severin et al., Nucleic Acids Res. 39: 8740-8751 (2011);Freier et al., Nucleic Acids Res. 25: 4429-4443 (1997);米国特許第9,738,894号を参照されたい。また、より長い配列長は、一般に親和性の増加をもたらすことになる。グアニンを核酸塩基ヒポキサンチンに置換することなど、他のヌクレオチド修飾は、オリゴヌクレオチドとその相補配列間の水素結合の量を低減させることにより親和性を低減させる。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、それらの標的に対する親和性を増加させる修飾を有する。一部の実施形態では、代替的にまたは加えて、エピジェネティック標的領域セットに特異的な標的特異的プローブは、それらの標的に対する親和性を減少させる修飾を有する。一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブは、エピジェネティック標的領域セットに特異的な標的特異的プローブよりも長い平均長および/または高い平均融解温度を有する。こうした実施形態を、互いに、および/または上記で考察されている濃度の差異と組み合わせて、例えば上記で考察されている任意の差異倍数またはその範囲などの、捕捉収量における所望の差異倍数を達成することができる。
【0303】
一部の実施形態では、標的特異的プローブは捕捉部分を含む。捕捉部分は、本明細書に記載の捕捉部分のいずれか、例えばビオチンであってもよい。一部の実施形態では、標的特異的プローブは、例えば、捕捉部分の結合対の相互作用などにより、共有結合または非共有結合で固体支持体に連結されている。一部の実施形態では、固体支持体は、磁気ビーズなどのビーズである。
【0304】
一部の実施形態では、配列可変標的領域セットに特異的な標的特異的プローブおよび/またはエピジェネティック標的領域セットに特異的な標的特異的プローブは、上記で考察されているベイトセット、例えば、捕捉部分を含むプローブ、および遺伝子などの、領域のパネルにわたって並べて配置されるように選択された配列である。
【0305】
一部の実施形態では、標的特異的プローブは、単一の組成物で提供される。単一組成物は、溶液(液体状または凍結物)であってもよい。代替的に、凍結乾燥物であってもよい。
【0306】
代替的に、標的特異的プローブは、例えば、エピジェネティック標的領域セットに特異的なプローブを含む第1の組成物、および配列可変標的領域セットに特異的なプローブを含む第2の組成物を含む、複数の組成物として提供してもよい。こうしたプローブを適切な割合で混合して、濃度および/または捕捉収量における上述の倍数差異のいずれかを有する組合せプローブ組成物を提供することができる。代替的に、それらを別々の捕捉手順で(例えば、試料のアリコートを用いて、または同じ試料で逐次的に)使用して、それぞれ、捕捉エピジェネティック標的領域および配列可変標的領域を含む第1および第2の組成物を提供してもよい。
1.エピジェネティック標的領域に特異的なプローブ
【0307】
エピジェネティック標的領域セットに対するプローブは、新生物(例えば、腫瘍またはがん)細胞のDNAと、健常細胞、例えば非新生物循環細胞とを区別する可能性が高い1つまたは複数のタイプの標的領域に特異的なプローブを含んでいてもよい。そのような領域の例示的なタイプは、本明細書、例えば捕捉セットに関する上記のセクションにおいて詳細に考察されている。また、エピジェネティック標的領域セットに対するプローブは、例えば本明細書に記載の、1つまたは複数の制御領域に対するプローブを含んでいてもよい。
【0308】
一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、少なくとも100kbp、例えば、少なくとも200kbp、少なくとも300kbp、または少なくとも400kbpのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、100~20Mbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、1.5~2Mbp、2~3Mbp、3~4Mbp、4~5Mbp、5~6Mbp、6~7Mbp、7~8Mbp、8~9Mbp、9~10Mbp、または10~20Mbpの範囲のフットプリントを有する。一部の実施形態では、エピジェネティック標的領域セットは、少なくとも20Mbpのフットプリントを有する。
a.高メチル化可変標的領域
【0309】
一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、1つまたは複数の高メチル化可変標的領域に特異的なプローブを含む。高メチル化可変標的領域は、本明細書では高メチル化DMR(差次的メチル化領域)と呼ばれる場合もある。高メチル化可変標的領域は、上記に示されているもののいずれであってもよい。例えば、一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表1に列挙されている複数の遺伝子座、例えば、表1に列挙されている遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表2に列挙されている複数の遺伝子座、例えば、表2に列挙されている遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に特異的なプローブを含む。一部の実施形態では、高メチル化可変標的領域に特異的なプローブは、表1または表2に列挙されている複数の遺伝子座、例えば、表1または表2に列挙されている遺伝子座の少なくとも10%、20%、30%、40%、50%、60%、70%、80%、90%、または100%に特異的なプローブを含む。一部の実施形態では、標的領域として含まれる各遺伝子座には、遺伝子の転写開始部位と終止コドン(代替的にスプライシングされる遺伝子の最後の終止コドン)との間に結合するハイブリダイゼーション部位を有する1つまたは複数のプローブが存在してもよい。一部の実施形態では、1つまたは複数のプローブは、列挙されている位置の300bp以内、例えば200または100bp以内に結合する。一部の実施形態では、プローブは、上記に列挙されている位置と重複するハイブリダイゼーション部位を有する。一部の実施形態では、高メチル化標的領域に特異的なプローブは、乳がん、結腸がん、腎臓がん、肝臓がん、および肺がんの1、2、3、4、または5つにおいて集合的に高メチル化を示す、高メチル化標的領域の1、2、3、4、または5つのサブセットに特異的なプローブを含む。
b.低メチル化可変標的領域
【0310】
一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、1つまたは複数の低メチル化可変標的領域に特異的なプローブを含む。低メチル化可変標的領域は、本明細書では低メチル化DMR(差次的メチル化領域)と呼ばれる場合もある。低メチル化可変標的領域は、上記に示されているもののいずれであってもよい。例えば、1つまたは複数の低メチル化可変標的領域に特異的なプローブとしては、反復エレメント、例えば、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、セントロメア周囲タンデムリピート、およびサテライトDNAなどの領域、ならびに健常細胞では通常はメチル化されており、腫瘍細胞ではメチル化の低減を示す可能性がある遺伝子間領域に対するプローブを挙げることができる。
【0311】
一部の実施形態では、低メチル化可変標的領域に特異的なプローブとしては、反復エレメントおよび/または遺伝子間領域に特異的なプローブが挙げられる。一部の実施形態では、反復エレメントに特異的なプローブとしては、LINE1エレメント、Aluエレメント、セントロメアタンデムリピート、セントロメア周囲タンデムリピート、および/またはサテライトDNAの1、2、3、4、または5つに特異的なプローブが挙げられる。
【0312】
がん関連低メチル化を示すゲノム領域に特異的な例示的プローブとしては、ヒト1番染色体のヌクレオチド8403565~8953708および/または151104701~151106035に特異的なプローブが挙げられる。一部の実施形態では、低メチル化可変標的領域に特異的なプローブとしては、ヒト1番染色体のヌクレオチド8403565~8953708および/または151104701~151106035と重複するかまたはそれらを含む領域に特異的なプローブが挙げられる。
c.CTCF結合領域
【0313】
一部の実施形態では、エピジェネティック標的領域セットに対するプローブとしては、CTCF結合領域に特異的なプローブが挙げられる。一部の実施形態では、CTCF結合領域に特異的なプローブは、例えば、上記において記載されている、またはCTCFBSDBもしくは上記で引用されているCuddapah et al., Martin et al.もしくはRhee et al.論文の1つまたは複数において記載されているCTCF結合領域など、少なくとも10、20、50、100、200、もしくは500個のCTCF結合領域、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個のCTCF結合領域に特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、CTCF結合部位の上流および下流領域の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、または少なくとも1000bpを含む。
d.転写開始部位
【0314】
一部の実施形態では、エピジェネティック標的領域セットに対するプローブとしては、転写開始部位に特異的なプローブが挙げられる。一部の実施形態では、転写開始部位に特異的なプローブは、少なくとも10、20、50、100、200、もしくは500個の転写開始部位、または10~20、20~50、50~100、100~200、200~500、もしくは500~1000個の転写開始部位、例えば、DBTSSに列挙されている転写開始部位などに特異的なプローブを含む。一部の実施形態では、エピジェネティック標的領域セットに対するプローブは、転写開始部位の上流および下流領域の少なくとも100bp、少なくとも200bp、少なくとも300bp、少なくとも400bp、少なくとも500bp、少なくとも750bp、または少なくとも1000bpの配列に対するプローブを含む。
e.局所増幅
【0315】
上記で述べたように、局所増幅は体細胞突然変異であるが、メチル化の変化など、ある特定のエピジェネティック変化を検出するための手法と同様の様式で、リード頻度に基づく配列決定により検出することができる。そのため、上記で考察されているように、がんにおいて局所増幅を示す可能性のある領域がエピジェネティック標的領域セットに含まれていてもよい。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブとしては、局所増幅に特異的なプローブが挙げられる。一部の実施形態では、局所増幅に特異的なプローブとしては、AR、BRAF、CCND1、CCND2、CCNE1、CDK4、CDK6、EGFR、ERBB2、FGFR1、FGFR2、KIT、KRAS、MET、MYC、PDGFRA、PIK3CA、およびRAF1の1つまたは複数に特異的なプローブが挙げられる。例えば、一部の実施形態では、局所増幅に特異的なプローブは、上述の標的の少なくとも2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、または18個の1つまたは複数に特異的なプローブが挙げられる。
f.制御領域
【0316】
データ検証を容易にするために制御領域を含むことが有用であり得る。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブとしては、本質的にすべての試料においてメチル化されていることが予想される対照メチル化領域に特異的なプローブが挙げられる。一部の実施形態では、エピジェネティック標的領域セットに特異的なプローブとしては、本質的にすべての試料において低メチル化されていることが予想される対照低メチル化領域に特異的なプローブが挙げられる。
2.配列可変標的領域に特異的なプローブ
【0317】
配列可変標的領域セットに対するプローブは、がんにおいて体細胞突然変異を起こすことが公知である複数の領域に特異的なプローブを含んでいてもよい。プローブは、本明細書に記載の任意の配列可変標的領域セットに特異的であってもよい。例示的な配列可変標的領域セットは、本明細書において、例えば捕捉セットに関する上記のセクションにおいて詳細に考察されている。
【0318】
一部の実施形態では、配列可変標的領域プローブセットは、少なくとも0.5kb、例えば、少なくとも1kb、少なくとも2kb、少なくとも5kb、少なくとも10kb、少なくとも20kb、少なくとも30kb、または少なくとも40kbのフットプリントを有する。一部の実施形態では、エピジェネティック標的領域プローブセットは、0.5~100kb、例えば、0.5~2kb、2~10kb、10~20kb、20~30kb、30~40kb、40~50kb、50~60kb、60~70kb、70~80kb、80~90kb、および90~100kbの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、少なくとも50kbp、例えば、少なくとも100kbp、少なくとも200kbp、少なくとも300kbp、または少なくとも400kbpのフットプリントを有する。一部の実施形態では、配列可変標的領域プローブセットは、100~2000kbp、例えば、100~200kbp、200~300kbp、300~400kbp、400~500kbp、500~600kbp、600~700kbp、700~800kbp、800~900kbp、900~1,000kbp、1~1.5Mbp、または1.5~2Mbpの範囲のフットプリントを有する。一部の実施形態では、配列可変標的領域セットは、少なくとも2Mbpのフットプリントを有する。
【0319】
一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70個の少なくとも部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3のSNVの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、または70個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3の融合物の少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、または6つに特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表3のインデルの少なくとも1つ、少なくとも2つ、または3つの少なくとも部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4の遺伝子の少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73個の少なくとも部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4のSNVの少なくとも5、少なくとも10、少なくとも15、少なくとも20、少なくとも25、少なくとも30、少なくとも35、少なくとも40、少なくとも45、少なくとも50、少なくとも55、少なくとも60、少なくとも65、少なくとも70、または73個に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4の融合物の少なくとも1つ、少なくとも2つ、少なくとも3つ、少なくとも4つ、少なくとも5つ、または6つに特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表4のインデルの少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、または18個の少なくとも部分に特異的なプローブを含む。一部の実施形態では、配列可変標的領域セットに特異的なプローブは、表5の遺伝子の少なくとも1、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、または少なくとも20個の少なくとも部分に特異的なプローブを含む。
【0320】
一部の実施形態では、配列可変標的領域セットに特異的なプローブは、AKT1、ALK、BRAF、CCND1、CDK2A、CTNNB1、EGFR、ERBB2、ESR1、FGFR1、FGFR2、FGFR3、FOXL2、GATA3、GNA11、GNAQ、GNAS、HRAS、IDH1、IDH2、KIT、KRAS、MED12、MET、MYC、NFE2L2、NRAS、PDGFRA、PIK3CA、PPP2R1A、PTEN、RET、STK11、TP53、およびU2AF1などの、少なくとも10、20、30、または35個のがん関連遺伝子に由来する標的領域に特異的なプローブを含む。
E.コンピュータシステム
【0321】
本開示の方法は、コンピュータシステムを使用してまたはその支援を受けて実施することができる。
図1は、本開示の方法を実施するようにプログラムまたは別様に構成されたコンピュータシステム101を示す。コンピュータシステム101は、試料調製、配列決定、および/または分析という種々の側面を調節することができる。一部の例では、コンピュータシステム101は、例えば、本明細書で開示される方法のいずれかに従って、試料調製、および(該当する場合は)核酸配列決定することを含む試料分析を実施するように構成されている。
【0322】
コンピュータシステム101は、中央処理装置(CPU、本明細書では「プロセッサ」および「コンピュータプロセッサ」ともいう)105を含み、これは、シングルコアもしくはマルチコアプロセッサであってもよく、または並列処理用の複数のプロセッサであってもよい。また、コンピュータシステム101は、メモリまたはメモリ位置110(例えば、ランダムアクセスメモリ、読み取り専用メモリ、フラッシュメモリ)、電子記憶装置115(例えば、ハードディスク)、1つまたは複数の他のシステムとの通信のための通信インターフェース120(例えば、ネットワークアダプタ)、およびキャッシュ、他のメモリ、データ記憶装置、および/または電子ディスプレイアダプタなどの周辺デバイス125を含む。メモリ110、記憶装置115、インターフェース120、および周辺デバイス125は、マザーボードなどの通信ネットワークまたはバス(実線)を介してCPU105と通信する。記憶装置115は、データを記憶するためのデータ記憶装置(またはデータリポジトリ)であってもよい。コンピュータシステム101は、通信インターフェース120の支援を受けてコンピュータネットワーク130に動作可能に接続されていてもよい。コンピュータネットワーク130は、インターネット、インターネットおよび/もしくはエクストラネット、またはインターネットと通信するイントラネットおよび/もしくはエクストラネットであってもよい。コンピュータネットワーク130は、一部の場合では、電気通信ネットワークおよび/またはデータネットワークである。コンピュータネットワーク130は、クラウドコンピューティングなどの分散コンピューティングを可能にすることができる1つまたは複数のコンピュータサーバを含んでいてもよい。コンピュータネットワーク130は、一部の場合では、コンピュータシステム101の支援を受けて、コンピュータシステム101に接続されたデバイスがクライアントまたはサーバとして動作することを可能にすることができるピアツーピアネットワークを実装してもよい。
【0323】
CPU105は、プログラムまたはソフトウェアで具現化することができる機械可読命令のシーケンスを実行することができる。命令は、メモリ110などのメモリ位置に記憶されていてもよい。CPU105により実施される動作の例としては、フェッチ、デコード、実行、およびライトバックを挙げることができる。
【0324】
記憶装置115は、ドライバ、ライブラリー、および保存されたプログラムなどのファイルを記憶することができる。記憶装置115は、ユーザにより生成されたプログラムおよび記録されたセッション、ならびにプログラムに関連付けられる出力(複数可)を記憶することができる。記憶装置115は、ユーザデータ、例えば、ユーザ選択およびユーザプログラムを記憶することができる。コンピュータシステム101は、一部の場合では、イントラネットまたはインターネットを介してコンピュータシステム101と通信するリモートサーバに位置するなど、コンピュータシステム101の外部にある1つまたは複数の追加のデータ記憶装置を含んでいてもよい。データは、例えば、通信ネットワークまたは物理的データ転送を使用して(例えば、ハードドライブ、サムドライブ、または他のデータ記憶機構を使用して)、1つの場所から別の場所に転送することができる。
【0325】
コンピュータシステム101は、ネットワーク130を介して1つまたは複数のリモートコンピュータシステムと通信することができる。実施形態では、コンピュータシステム101は、ユーザ(例えば、オペレータ)のリモートコンピュータシステムと通信することができる。リモートコンピュータシステムの例としては、パーソナルコンピュータ(例えば、ポータブルPC)、スレートまたはタブレットPC(例えば、Apple(登録商標)iPad(登録商標)、Samsung(登録商標)Galaxy Tab)、電話、スマートフォン(例えば、Apple(登録商標)iPhone(登録商標)、Android(登録商標)対応デバイス、Blackberry(登録商標))、または携帯情報端末が挙げられる。ユーザは、ネットワーク130を介してコンピュータシステム101にアクセスすることができる。
【0326】
本明細書に記載の方法は、例えば、メモリ110または電子記憶装置115など、コンピュータシステム101の電子記憶場所に記憶されている機械(例えばコンピュータプロセッサ)実行可能コードにより実施することができる。機械実行可能コードまたは機械可読コードは、ソフトウェアの形態で提供することができる。使用中、プロセッサ105はコードを実行することができる。一部の場合では、コードは、記憶装置115から取り出され、プロセッサ105が直ちにアクセスすることができるようにメモリ110に記憶されてもよい。一部の場合では、電子記憶装置115は除外することができ、機械実行可能命令は、メモリ110に記憶される。
【0327】
一態様では、本開示は、少なくとも1つの電子プロセッサにより実行されると、本明細書に記載の方法の少なくとも部分を実施するコンピュータ実行可能命令を含む非一過性コンピュータ可読媒体を提供する。例えば、この方法は、対象から試料を収集すること、および必要に応じて試料を分画すること;部分試料または試料を標的特異的プローブと接触させること;プローブに会合しているDNAを捕捉すること;捕捉DNA分子のレベルを検出、配列決定、および/または識別すること;対象ががんもしくは別の疾患を有する可能性および/またはがんもしくは他の疾患に対する適切な処置を決定することを含んでいてもよい。
【0328】
コードは、コードを実行するように適合したプロセッサを有する機械で使用するために事前コンパイルおよび構成されていてもよく、または実行時にコンパイルされてもよい。コードは、事前コンパイル様式または同時コンパイル様式でコードを実行することができるように選択することができるプログラミング言語で提供することできる。
【0329】
コンピュータシステム101など、本明細書で提供されるシステムおよび方法の態様は、プログラミングで具現化することができる。この技術の種々の態様は、典型的には、あるタイプの機械可読媒体で搬送または具現化されている機械(またはプロセッサ)実行可能コードおよび/または関連データの形態の「製品」または「物品」であると考えることができる。機械実行可能コードは、メモリ(例えば、読み取り専用メモリ、ランダムアクセスメモリ、フラッシュメモリ)またはハードディスクなどの電子記憶装置に記憶させることができる。「記憶」型媒体としては、コンピュータもしくはプロセッサなどの有形メモリ、またはソフトウェアプログラミングのために任意の時点で非一過性記憶を提供することができる種々の半導体メモリ、テープドライブ、およびディスクドライブなどの、それらの関連モジュールのいずれかまたはすべてを挙げることができる。
【0330】
ソフトウェアのすべてまたは部分は、インターネットまたは種々の他の電気通信ネットワークを介して随時通信することができる。そのような通信は、例えば、1つのコンピュータまたはプロセッサから別のコンピュータまたはプロセッサへと、例えば、管理サーバまたはホストコンピュータからアプリケーションサーバのコンピュータプラットフォームへとソフトウェアをロードすることを可能にすることができる。したがって、ソフトウェアエレメントを保持することができる別のタイプの媒体としては、有線および光地上回線ネットワークを介して、ならびに種々の無線リンクを通じてローカルデバイス間の物理的インターフェイス間で使用されるものなど、光、電気、および電磁波が挙げられる。有線もしくは無線リンクまたは光リンクなどの、そのような波動を伝送する物理的エレメントも、ソフトウェアを保持する媒体であるとみなすことができる。本明細書で使用される場合、非一過性有形「記憶」媒体に限定されない限り、コンピュータまたは機械「可読媒体」などの用語は、プロセッサに実行のための命令を提供することに関与するあらゆる媒体を指す。
【0331】
したがって、コンピュータ実行可能コードなどの機械可読媒体は、有形記憶媒体、搬送波媒体、または物理的伝送媒体を含むがこれらに限定されない多くの形態をとることができる。不揮発性記憶媒体としては、例えば、図面に示されている、データベースなどを実装するために使用することができるものなど、任意のコンピュータ(複数可)などの記憶デバイスのいずれかなどの、光ディスクまたは磁気ディスクが挙げられる。揮発性記憶媒体としては、そのようなコンピュータプラットフォームのメインメモリなどのダイナミックメモリが挙げられる。有形伝送媒体としては、同軸ケーブル;コンピュータシステム内のバスを構成する有線を含む、銅線および光ファイバーが挙げられる。搬送波伝送媒体は、無線周波数(RF)および赤外線(IR)データ通信中に発生するものなど、電気信号もしくは電磁信号、または音響波または光波の形態をとってもよい。したがって、コンピュータ可読媒体の一般的な形態としては、例えば、フロッピー(登録商標)ディスク、フレキシブルディスク、ハードディスク、磁気テープ、任意の他の磁気媒体、CD-ROM、DVDもしくはDVD-ROM、任意の他の光学媒体、パンチカード、紙テープ、穴のパターンを有する任意の他の物理記憶媒体、RAM、ROM、PROMおよびEPROM、フラッシュ-EPROM、任意の他のメモリチップもしくはカートリッジ、データもしくは命令を運ぶ搬送波、そのような搬送波を運ぶケーブルもしくはリンク、またはコンピュータがプログラミングコードおよび/もしくはデータを読み取ることができる任意の他の媒体が挙げられる。こうした形態のコンピュータ可読媒体の多くは、1つまたは複数の命令の1つまたは複数のシーケンスを、実行のためにプロセッサに搬送することに関与することができる。
【0332】
コンピュータシステム101は、例えば、試料分析の1つまたは複数の結果を提供するためのユーザインターフェース(UI)を備える電子ディスプレイを含むかまたはそれと通信することができる。UIの例としては、限定ではないが、グラフィカルユーザインターフェイス(GUI)およびウェブベースユーザインターフェイスが挙げられる。
【0333】
コンピュータシステムおよびネットワーク、データベース、ならびにコンピュータプログラム製品に関する追加の詳細は、例えば、Peterson, Computer Networks: A Systems Approach, Morgan Kaufmann, 5th Ed. (2011)、Kurose, Computer Networking: A Top-Down Approach, Pearson, 7th Ed. (2016)、Elmasri, Fundamentals of Database Systems, Addison Wesley, 6th Ed. (2010)、Coronel, Database Systems: Design, Implementation, & Management, Cengage Learning, 11th Ed. (2014)、Tucker, Programming Languages, McGraw-Hill Science/Engineering/Math, 2nd Ed. (2006)、およびRhoton, Cloud Computing Architected: Solution Design Handbook, Recursive Press (2011)にも提供されている。こうした文献の各々は、その全体が参照によりここに組み込まれる。
F.応用
1.がんおよび他の疾患
【0334】
本方法は、対象における状態、特にがんまたは前がんの存在を診断し、状態を特徴付け(例えば、がんを病期分類することまたはがんの不均質性を決定すること)、状態の処置に対する応答をモニターし、状態の発症または状態のその後の経過の予後リスクをもたらすために使用することができる。本開示は、特定の処置選択肢の有効性を決定する際にも有用であり得る。処置が成功すると、より多くのがんが死滅し、核酸を排出し得るため、処置選択肢の成功は、対象の血液中で検出されるコピー数変異または任意の他の体細胞突然変異の量を増加させる可能性がある。他の例では、これは生じない可能性がある。別の例では、ある特定の処置選択肢は、時間の経過と共にがんのプロファイル(例えば、遺伝子プロファイル)と相関する可能性がある。この相関性は、療法を選択する際に有用であり得る。一部の実施形態では、高メチル化可変エピジェネティック標的領域を分析して、それらが、腫瘍細胞または通常はcfDNAに著しくは寄与しない細胞の高メチル化特質を示すか否かを決定し、および/または低メチル化可変エピジェネティック標的領域を分析して、それらが、腫瘍細胞または通常はcfDNAに著しくは寄与しない細胞の低メチル化特質を示すか否かを決定する。
【0335】
一部の実施形態では、本方法は、がんのスクリーニングに、またはがんをスクリーニングするための方法に使用される。例えば、試料は、以前にがんと診断されていない対象に由来してもよい。一部の実施形態では、対象は、がんを有していてもよくまたは有していなくてもよい。一部の実施形態では、対象は、早期がんを有していてもよくまたは有していなくてもよい。一部の実施形態では、対象は、タバコ使用(例えば、喫煙)、体重過剰もしくは肥満、高い体格指数(BMI)を有すること、高齢であること、栄養不良、高アルコール消費、またはがんの家族歴など、がんの1つまたは複数のリスク因子を有する。
【0336】
一部の実施形態では、対象は、例えば、少なくとも1、5、10、または15年間、タバコを使用している。一部の実施形態では、対象は、高いBMI、例えば、25もしくはそれよりも高い、26もしくはそれよりも高い、27もしくはそれよりも高い、28もしくはそれよりも高い、29もしくはそれよりも高い、または30もしくはそれよりも高いBMIを有する。一部の実施形態では、対象は、少なくとも40、45、50、55、60、65、70、75、または80歳である。一部の実施形態では、対象は、栄養不良であり、例えば、赤身肉および/または加工肉、トランス脂肪、飽和脂肪、および精製糖の1つまたは複数の消費量が多く、ならびに/または果物および野菜、複合炭水化物、および/もしくは不飽和脂肪の消費量が少ない。高消費量および低消費量は、例えば、それぞれ、www.dietaryguidelines.gov/sites/default/files/2021-03/Dietary_Guidelines_for_Americans-2020-2025.pdfにて入手可能なDietary Guidelines for Americans 2020-2025の推奨値を超えるかまたは下回るかで規定することができる。一部の実施形態では、対象は、アルコール消費量が多く、例えば、1日当たり平均で少なくとも3、4、または5杯のドリンクを飲む(ドリンクは、約1オンスまたは30mLの80プルーフの蒸留酒または同等物である)。一部の実施形態では、対象は、がんの家族歴を有し、例えば、少なくとも1人、2人、または3人の血縁親族が以前にがんと診断されていた。一部の実施形態では、親族は、少なくとも三親等親族(例えば、曽祖父母、大叔母または叔父、いとこ)、少なくとも二親等親族(例えば、祖父母、叔母もしくは叔父、または異母兄弟)、または一親等親族(例えば、親または実兄弟)である。
【0337】
加えて、がんが処置後に寛解していることが観察された場合、本発明の方法を使用して、残留疾患または疾患の再発をモニターすることができる。
【0338】
一部の実施形態では、本明細書で開示される方法およびシステムは、1つもしくは複数の目的のタンパク質の存在および/または体細胞起源であるかもしくは生殖系列起源であるかの核酸変異体の分類に基づいて、患者における所与の疾患または状態を処置するための個別化または標的化療法を識別するために使用することができる。典型的には、検討されている疾患は、がんの一タイプである。そのようながんの非限定的な例としては、以下のものが挙げられる:胆道がん、膀胱がん、頭頸部がん、移行上皮癌、尿路上皮癌、脳がん、神経膠腫、星状細胞腫、乳癌、化生癌、子宮頸がん、子宮頸部扁平上皮癌、直腸がん、結腸直腸癌、結腸がん、遺伝性非ポリポーシス結腸直腸がん、結腸直腸腺癌、消化管間質腫瘍(GIST)、子宮内膜癌、子宮内膜間質肉腫、食道がん、食道扁平上皮癌、食道腺癌、眼黒色腫、ブドウ膜黒色腫、胆嚢癌、胆嚢腺癌、腎細胞癌、明細胞腎細胞癌、移行細胞癌、尿路上皮癌、ウィルムス腫瘍、白血病、急性リンパ性白血病(ALL)、急性骨髄性白血病(AML)、慢性リンパ性白血病(CLL)、慢性骨髄性白血病(CML)、慢性骨髄単球性白血病(CMML)、肝臓がん、肝臓癌、肝細胞腫、肝細胞癌、胆管癌、肝芽腫、肺がん、非小細胞肺がん(NSCLC)、中皮腫、B細胞リンパ腫、非ホジキンリンパ腫、びまん性大細胞型B細胞リンパ腫、マントル細胞リンパ腫、T細胞リンパ腫、非ホジキンリンパ腫、前駆体Tリンパ芽球性リンパ腫/白血病、末梢性T細胞リンパ腫、多発性骨髄腫、上咽頭癌(NPC)、神経芽腫、中咽頭がん、口腔扁平上皮癌、骨肉腫、卵巣癌、膵臓がん、膵管腺癌、偽乳頭状新生物、腺房細胞癌、前立腺がん、前立腺腺癌、皮膚がん、黒色腫、悪性黒色腫、皮膚黒色腫、小腸癌、胃がん、胃癌、消化管間質腫瘍(GIST)、子宮がん、または子宮肉腫。がんのタイプおよび/または病期は、突然変異、希少突然変異、インデル、再編成、コピー数変異、トランスバージョン、転座、組換え、逆位、欠失、異数性、部分異数性、倍数性、染色体不安定性、染色体構造変化、遺伝子融合、染色体融合、遺伝子切断、遺伝子増幅、遺伝子重複、染色体損傷、DNA損傷、核酸化学修飾の異常変化、エピジェネティックパターンの異常変化、および核酸5-メチルシトシンの異常変化を含む遺伝子変異から検出することができる。
【0339】
一部の実施形態では、本明細書に記載の方法は、腫瘍(または新生物細胞、またはがん細胞)によりまたは前がん細胞により産生される標的領域および/またはDNAの存在を識別することを含む。一部の実施形態では、本明細書に記載の方法は、腫瘍(または新生物細胞、またはがん細胞)によりもしくは前がん細胞により産生される標的領域のレベルを決定することおよび/またはDNAの存在を識別することを含む。一部の実施形態では、標的領域のレベルの決定は、標的領域のレベルの増加またはレベルの減少のいずれかを決定することを含み、標的領域のレベルの増加または減少は、標的領域のレベルを閾値レベル/値と比較することにより決定される。
【0340】
遺伝子データは、特定の形態のがんを特徴付けるために使用することもできる。がんは、組成および病期が両方とも不均質であることが多い。遺伝子プロファイルデータは、特定のサブタイプのがんの特徴付けを可能にすることができ、それは、その特定のサブタイプの診断または処置において重要であり得る。また、この情報は、特定のタイプのがんの予後に関する手がかりを、対象または担当医に提供し、対象または担当医のいずれかが、疾患の進行に応じて処置選択肢を適応させることを可能にすることができる。一部のがんは、進行して、より侵襲性になり、遺伝的に不安定になる可能性がある。他のがんは、良性、不活性、または休止状態のままである可能性がある。本開示のシステムおよび方法は、疾患進行の決定に有用であり得る。
【0341】
さらに、本開示の方法は、対象における異常状態の不均質性を特徴付けるために使用することができる。そのような方法は、例えば、対象に由来する核酸の遺伝子プロファイルを生成することを含んでいてもよく、遺伝子プロファイルは、配列可変およびエピジェネティック分析から得られる複数のデータを含む。一部の実施形態では、異常状態はがんである。一部の実施形態では、異常状態は、不均質なゲノム集団をもたらすものであってもよい。がんの例では、一部の腫瘍は、異なる病期のがんの腫瘍細胞を含むことが公知である。他の例では、不均質性は、複数の疾患病巣を含んでいてもよい。この場合も、がんの例では、複数の腫瘍病巣が存在する可能性があり、おそらくは1つまたは複数の病巣は、原発部位から広がった転移の結果である。
【0342】
本方法は、がん、前がん、または他の疾患を、診断、予後判定、モニター、または観察するために使用することができる。一部の実施形態では、本明細書の方法は、胎児を診断、予後判定、またはモニターすることを含まず、したがって非侵襲的出生前検査に関するものではない。他の実施形態では、こうした方法論は、DNAおよび他のポリヌクレオチドが母体分子と共循環する可能性のある胎児対象におけるがんまたは他の疾患を診断、予後判定、モニター、または観察するために、妊娠対象において使用することができる。
【0343】
本明細書で開示される方法および系を使用して必要に応じて評価される他の遺伝子に基づく疾患、障害、または状態の非限定的な例としては、以下のものが挙げられる:軟骨無形成症、アルファ-1抗トリプシン欠損症、抗リン脂質症候群、自閉症、常染色体優性多発性嚢胞腎疾患、シャルコー・マリー・トゥース(CMT)病、ネコ鳴き症、クローン病、嚢胞性線維症、ダーカム病、ダウン症候群、デュアン症候群、デュシェンヌ型筋ジストロフィー、第V因子ライデン血小板増加症、家族性高コレステロール血症、家族性地中海熱、脆弱X症候群、ゴーシェ病、ヘモクロマトーシス、血友病、全前脳症、ハンチントン病、クラインフェルター症候群、マルファン症候群、筋強直性ジストロフィー、神経線維腫症、ヌーナン症候群、骨形成不全症、パーキンソン病、フェニルケトン尿症、ポーランド異常(Poland anomaly)、ポルフィリン症、早老症、網膜色素変性症、重症複合免疫不全症(SCID)、鎌状赤血球症、脊髄性筋萎縮症、テイ-サックス病、サラセミア、トリメチルアミン尿症、ターナー症候群、口蓋心臓顔面症候群、WAGR症候群、またはウィルソン病など。
【0344】
一部の実施形態では、本明細書に記載の方法は、以前にがんと診断された対象の以前のがん処置後の予め選択された時点で、腫瘍細胞を起源とするかまたは由来する核酸(例えば、cfDNAなどのDNA)の存在または非存在を検出することを含む。この方法は、対象の腫瘍細胞を起源とするかまたは由来するDNAの存在またはレベルを示すがん再発スコアを決定することをさらに含んでいてもよい。
【0345】
がん再発スコアが決定される場合、それを、がん再発ステータスを決定するためにさらに使用することができる。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合、がん再発のリスクがある可能性がある。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合、がん再発のリスクが低いかまたはより低い可能性がある。特定の実施形態では、所定の閾値と等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いかもしくはより低いかのいずれのがん再発ステータスももたらし得る。
【0346】
一部の実施形態では、がん再発スコアを所定のがん再発閾値と比較し、がん再発スコアががん再発閾値を上回る場合、対象は、その後のがん処置の候補であると分類されるか、がん再発スコアががん再発閾値を下まわる場合、療法の候補ではないと分類される。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、その後のがん処置の候補であるかまたは療法の候補ではないかのいずれにも分類されるという結果をもたらし得る。
【0347】
上記で考察されている方法は、対象のがん再発のリスクを決定するためのおよび/または対象をその後のがん処置の候補であると分類するための方法に関するセクションを含む、本明細書の他所に示されている1つまたは複数の任意の適合性のある特徴をさらに含んでもよい。
2.対象におけるがん再発のリスクを決定するための、および/または対象をその後のがん処置の候補であると分類するための方法
【0348】
一部の実施形態では、本明細書で提供される方法は、対象のがん再発のリスクを決定するための方法である。一部の実施形態では、本明細書で提供される方法は、対象をその後のがん処置の候補であると分類するための方法である。
【0349】
そのような方法のいずれかは、対象に対する1つまたは複数の以前のがん処置後の1つまたは複数の予め選択された時点で、がんと診断された対象から試料を収集することを含んでいてもよい。対象は、本明細書に記載の対象のいずれであってもよい。試料は、DNA、例えばcfDNAを含んでいてもよい。DNAは、組織試料または液体試料から得ることができる。
【0350】
そのような方法のいずれかは、試料またはその部分試料を、本明細書に記載の実施形態のいずれかによるエピジェネティック標的領域セットのメンバーに特異的な複数の標的特異的プローブと接触させることを含んでいてもよい。こうした方法は、対象に由来するDNAから標的領域の複数のセットを捕捉することをさらに含んでいてもよく、複数の標的領域セットは、配列可変標的領域セットを含み、それによりDNA分子の一緒にされた捕捉セットが生成される。1つまたは複数の捕捉ステップは、本明細書の他所に記載の実施形態のいずれかに従って実施することができる。そのような方法のいずれかは、捕捉DNA分子を配列決定することを含んでいてもよく、それにより配列情報のセットが生成される。配列可変標的領域セットの捕捉DNA分子は、エピジェネティック標的領域セットの捕捉DNA分子よりも深い配列決定深度まで配列決定してもよい。そのような方法のいずれかは、配列情報のセットを使用して、予め選択された時点で、腫瘍細胞を起源とするかまたは由来するDNAの存在または非存在を検出することを含んでいてもよい。腫瘍細胞を起源とするかまたは由来するDNAの存在または非存在の検出は、本明細書の他所に記載のそれらの実施形態のいずれかに従って実施することができる。
【0351】
そのような方法のいずれかでは、以前のがん処置は、手術、治療組成物の投与、および/または化学療法を含んでいてもよい。
【0352】
対象のがん再発のリスクを決定するための方法は、対象の腫瘍細胞を起源とするかまたは由来するタイプ特異的標的領域の存在もしくは非存在または量を示すがん再発スコアを決定することを含んでいてもよい。がん再発スコアは、がん再発ステータスを決定するためにさらに使用することができる。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合、がん再発のリスクがある可能性がある。がん再発ステータスは、例えば、がん再発スコアが所定の閾値を上回る場合、がん再発のリスクが低いかまたはより低い可能性がある。特定の実施形態では、所定の閾値と等しいがん再発スコアは、がん再発のリスクがあるか、またはがん再発のリスクが低いかもしくはより低いかのいずれのがん再発ステータスをもたらす可能性がある。
【0353】
対象をその後のがん処置の候補であると分類するための方法は、対象のがん再発スコアを所定のがん再発閾値と比較し、それにより、がん再発スコアががん再発閾値を上回る場合、対象をその後のがん処置の候補であると分類するか、またはがん再発スコアががん再発閾値を下回る場合、療法の候補ではないと分類することを含んでいてもよい。特定の実施形態では、がん再発閾値と等しいがん再発スコアは、その後のがん処置の候補であるかまたは療法の候補ではないかのいずれにも分類されるという結果をもたらし得る。一部の実施形態では、その後のがん処置は、化学療法または治療組成物の投与を含む。
【0354】
そのような方法はいずれも、がん再発スコアに基づき対象の無病生存(DFS)期間を決定することを含んでいてもよく、例えば、DFS期間は、1年、2年、3年、4年、5年、または10年などであってもよい。
【0355】
一部の実施形態では、配列情報のセットは、配列可変標的領域配列を含み、がん再発スコアの決定は、特定の免疫細胞タイプ、配列可変標的領域配列に存在するSNV、挿入/欠失、CNV、および/または融合のレベルを示す少なくとも第1のサブスコアを決定することを含んでいてもよい。
【0356】
一部の実施形態では、1、2、3、4、または5から選択される、配列可変標的領域における突然変異の数は、第1のサブスコアが、がん再発に陽性であると分類されるがん再発スコアをもたらすのに十分である。一部の実施形態では、突然変異の数は、1、2、または3から選択される。
【0357】
一部の実施形態では、配列情報のセットはエピジェネティック標的領域配列を含み、がん再発スコアの決定は、健常対象に由来する対応する試料に見出されるDNA(例えば、健常対象に由来する血液試料に見出されるcfDNA、または健常対象に由来する組織試料であり、試験対象から得られたものと同じ組織タイプである組織試料に見出されるDNA)とは異なるエピジェネティック状態を表す分子(エピジェネティック標的領域配列から得られる)の量を示す第2のサブスコアを決定することを含む。こうした異常分子(つまり、健常対象に由来する対応する試料中に見出されるDNAとは異なるエピジェネティック状態を有する分子)は、がんに関連付けられるエピジェネティック変化、例えば、高メチル化可変標的領域のメチル化および/または断片化可変標的領域の破損と一致してもよく、「破損」は、健常対象に由来する対応する試料中に見出されるDNAとは異なることを意味する。
【0358】
一部の実施形態では、高メチル化可変標的領域セットにおける高メチル化および/または断片化可変標的領域セットにおける異常断片化を示す、0.001%~10%の範囲の値よりも大きいかまたは等しい、高メチル化可変標的領域セットおよび/または断片化可変標的領域セットに対応する分子の割合は、第2のサブスコアをがん再発陽性であると分類するのに十分である。範囲は、0.001%~1%、0.005%~1%、0.01%~5%、0.01%~2%、または0.01%~1%であってもよい。
【0359】
一部の実施形態では、そのような方法のいずれかは、腫瘍細胞を起源とすることを示す1つまたは複数の特徴を示す配列情報のセット中の分子の割合から腫瘍DNAの割合を決定することを含んでいてもよい。これは、例えば、高メチル化可変標的領域および断片化可変標的領域の一方または両方を含む、エピジェネティック標的領域の一部またはすべてに対応する分子に対して行うことができる(高メチル化可変標的領域の高メチル化および/または断片化可変標的領域の異常断片化は、腫瘍細胞を起源とすることを示すとみなすことができる)。これは、配列可変標的領域に対応する分子、例えば、SNV、インデル、CNV、および/または融合などの、がんと一致する変更を含む分子に対して行うことができる。腫瘍DNAの割合は、エピジェネティック標的領域に対応する分子と配列可変標的領域に対応する分子との組合せに基づいて決定することができる。
【0360】
がん再発スコアの決定は、少なくとも部分的には、腫瘍DNAの割合に基づいてもよく、10-11~1または10-10~1の範囲の閾値より大きな腫瘍DNAの割合は、がん再発スコアをがん再発陽性であると分類するのに十分である。一部の実施形態では、10-10~10-9、10-9~10-8、10-8~10-7、10-7~10-6、10-6~10-5、10-5~10-4、10-4~10-3、10-3~10-2、または10-2~10-1の範囲内の閾値よりも大きいかまたは等しい腫瘍DNAの割合は、がん再発スコアをがん再発陽性であると分類するのに十分である。一部の実施形態では、少なくとも10-7の閾値よりも多くの腫瘍DNAの割合は、がん再発スコアをがん再発陽性であると分類するのに十分である。腫瘍DNAの割合が、上述の実施形態のいずれかに対応する閾値などの閾値よりも大きいという決定は、累積確率に基づいてなすことができる。例えば、腫瘍割合が上述の範囲のいずれかの閾値より大きいという累積確率が、少なくとも0.5、0.75、0.9、0.95、0.98、0.99、0.995、または0.999の確率閾値を超える場合、試料は陽性であるとみなした。一部の実施形態では、確率閾値は、0.99など、少なくとも0.95である。
【0361】
一部の実施形態では、配列情報のセットは、配列可変標的領域配列およびエピジェネティック標的領域配列を含み、がん再発スコアの決定は、配列可変標的領域配列中に存在するSNV、挿入/欠失、CNV、および/または融合物の量を示す第1のサブスコア、およびエピジェネティック標的領域配列中の異常分子の量を示す第2のサブスコアを決定すること、ならびに第1および第2のサブスコアを組み合わせてがん再発スコアを提供することを含む。第1および第2のサブスコアを組み合わせる場合、各サブスコアに閾値を独立して適用することにより(例えば、配列可変標的領域における突然変異の所定の数よりも大きく(例えば、>1)、およびエピジェネティック標的領域における異常分子(つまり、健常対象に由来する対応する試料に見出されるDNAとは異なるエピジェネティック状態を有する分子、例えば腫瘍)の所定の割合よりも大きい)、または機械学習分類器をトレーニングして複数のポジティブトレーニングおよびネガティブトレーニング試料に基づいてステータスを決定することにより、組み合わせることができる。
【0362】
一部の実施形態では、-4~2または-3~1の範囲の組合せスコアの値は、がん再発スコアをがん再発陽性であると分類するのに十分である。
【0363】
がん再発スコアががん再発に陽性であると分類される任意の実施形態では、対象のがん再発ステータスは、がん再発のリスクがある可能性があり、および/または対象は、その後のがん処置の候補であると分類することができる。
【0364】
一部の実施形態では、がんは、本明細書の他所に記載のタイプのがんのいずれか1つ、例えば、結腸直腸がんである。
3.療法および関連投与
【0365】
ある特定の実施形態では、本明細書で開示される方法は、個別化療法を識別し、患者に施すことに関する。一部の実施形態では、特定の核酸のレベルの決定は、適切な処置の選択を容易にする。一部の実施形態では、患者または対象は、所与の疾患、障害、または状態を有する。本質的にあらゆるがん療法(例えば、外科療法、放射線療法、および/または化学療法など)が、こうした方法の一部として含まれ得る。ある特定の実施形態では、対象に施される療法は、少なくとも1つの化学療法薬を含む。一部の実施形態では、化学療法薬は、アルキル化剤(例えば、これらに限定されないが、クロランブシル、シクロホスファミド、シスプラチン、およびカルボプラチン)、ニトロソウレア(例えば、これらに限定されないが、カルムスチンおよびロムスチン)、代謝拮抗剤(例えば、これらに限定されないが、フルオロウラシル(Fluorauracil)、メトトレキサート、およびフルダラビン)、植物アルカロイドおよび天然産物(例えば、これらに限定されないが、ビンクリスチン、パクリタキセル、およびトポテカン)、抗腫瘍抗生物質(例えば、これらに限定されないが、ブレオマイシン、ドキソルビシン、およびミトキサントロン)、ホルモン剤(例えば、これらに限定されないが、プレドニゾン、デキサメタゾン、タモキシフェン、およびロイプロリド)、および生物学的応答調節剤(例えば、これらに限定されないが、ハーセプチンおよびアバスチン、アービタックスおよびリツキサン)を含んでいてもよい。一部の実施形態では、対象に施される化学療法は、FOLFOXまたはFOLFIRIを含んでいてもよい。ある特定の実施形態では、少なくとも1つのPARP阻害剤を含む療法を対象に施すことができる。ある特定の実施形態では、PARP阻害剤としては、なかでも、オラパリブ、タラゾパリブ、ルカパリブ、ニラパリブ(商品名ZEJULA)を挙げることができる。典型的には、療法としては、少なくとも1つの免疫療法(または免疫療法剤)が挙げられる。免疫療法は、一般に、所与のがんタイプに対する免疫応答を増強するための方法を指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を増強するための方法を指す。
【0366】
一部の実施形態では、療法は、体細胞起源であるかまたは生殖系列起源であるかの核酸変異体のステータスに基づいて個別化される。一部の実施形態では、本質的にあらゆるがん療法(例えば、外科療法、放射線療法、および/または化学療法など)が、こうした方法の一部として含まれ得る。典型的には、個別化療法としては、少なくとも1つの免疫療法(または免疫療法剤)が挙げられる。免疫療法は、一般に、所与のがんタイプに対する免疫応答を増強するための方法を指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を増強するための方法を指す。
【0367】
一部の実施形態では、免疫療法または免疫療法剤は、免疫チェックポイント分子を標的とする。ある特定の腫瘍は、免疫チェックポイント経路を乗っ取ることにより免疫系を回避することができる。したがって、免疫チェックポイントを標的にすることは、免疫系を回避する腫瘍の能力に対抗し、ある特定のがんに対する抗腫瘍免疫を活性化するための効果的な手法として浮上している。Pardoll, Nature Reviews Cancer, 2012, 12:252-264。
【0368】
ある特定の実施形態では、免疫チェックポイント分子は、抗原に対するT細胞応答に関与するシグナルを低減させる阻害性分子である。例えば、CTLA4は、T細胞上に発現され、抗原提示細胞上のCD80(別名B7.1)またはCD86(別名B7.2)に結合することによりT細胞活性化を下方制御する役割を果たす。PD-1は、T細胞上に発現される別の阻害性チェックポイント分子である。PD-1は、炎症応答中の末梢組織でのT細胞の活性を制限する。加えて、PD-1のリガンド(PD-L1またはPD-L2)は、多くの異なる腫瘍の表面では一般的に上方制御され、腫瘍微小環境における抗腫瘍免疫応答の下方制御がもたらされる。ある特定の実施形態では、阻害性免疫チェックポイント分子はCTLA4またはPD-1である。他の実施形態では、阻害性免疫チェックポイント分子は、PD-L1またはPD-L2など、PD-1のリガンドである。他の実施形態では、阻害性免疫チェックポイント分子は、CD80またはCD86など、CTLA4のリガンドである。他の実施形態では、阻害性免疫チェックポイント分子は、リンパ球活性化遺伝子3(LAG3)、キラー細胞免疫グロブリン様受容体(KIR)、T細胞膜タンパク質3(TIM3)、ガレクチン9(GAL9)、またはアデノシンA2a受容体(A2aR)である。
【0369】
こうした免疫チェックポイント分子を標的とするアンタゴニストを使用すると、ある特定のがんに対する抗原特異的T細胞応答を増強することができる。したがって、ある特定の実施形態では、免疫療法または免疫療法剤は、阻害性免疫チェックポイント分子のアンタゴニストである。ある特定の実施形態では、阻害性免疫チェックポイント分子はPD-1である。ある特定の実施形態では、阻害性免疫チェックポイント分子はPD-L1である。ある特定の実施形態では、阻害性免疫チェックポイント分子のアンタゴニストは抗体(例えば、モノクローナル抗体)である。ある特定の実施形態では、抗体またはモノクローナル抗体は、抗CTLA4、抗PD-1、抗PD-L1、または抗PD-L2抗体である。ある特定の実施形態では、抗体はモノクローナル抗PD-1抗体である。一部の実施形態では、抗体はモノクローナル抗PD-L1抗体である。ある特定の実施形態では、モノクローナル抗体は、抗CTLA4抗体および抗PD-1抗体、抗CTLA4抗体および抗PD-L1抗体、または抗PD-L1抗体および抗PD-1抗体の組合せである。ある特定の実施形態では、抗PD-1抗体は、ペムブロリズマブ(Keytruda(登録商標))またはニボルマブ(Opdivo(登録商標))の1つまたは複数である。ある特定の実施形態では、抗CTLA4抗体はイピリムマブ(Yervoy(登録商標))である。ある特定の実施形態では、抗PD-L1抗体は、アテゾリズマブ(Tecentriq(登録商標))、アベルマブ(Bavencio(登録商標))、またはデュルバルマブ(Imfinzi(登録商標))の1つまたは複数である。
【0370】
ある特定の実施形態では、免疫療法または免疫療法剤は、CD80、CD86、LAG3、KIR、TIM3、GAL9、またはA2aRに対するアンタゴニスト(例えば、抗体)である。他の実施形態では、アンタゴニストは、阻害性免疫チェックポイント分子の細胞外ドメインおよび抗体のFcドメインを含む可溶性融合タンパク質など、阻害性免疫チェックポイント分子の可溶型である。ある特定の実施形態では、可溶性融合タンパク質は、CTLA4、PD-1、PD-L1、またはPD-L2の細胞外ドメインを含む。一部の実施形態では、可溶性融合タンパク質は、CD80、CD86、LAG3、KIR、TIM3、GAL9、またはA2aRの細胞外ドメインを含む。一実施形態では、可溶性融合タンパク質は、PD-L2またはLAG3の細胞外ドメインを含む。
【0371】
ある特定の実施形態では、免疫チェックポイント分子は、抗原に対するT細胞応答に関与するシグナルを増幅する共刺激分子である。例えば、CD28は、T細胞上に発現される共刺激受容体である。T細胞がT細胞受容体を介して抗原に結合すると、CD28は、抗原提示細胞上のCD80(別名B7.1)またはCD86(別名B7.2)に結合して、T細胞受容体シグナル伝達を増幅し、T細胞活性化を促進する。CD28は、CTLA4と同じリガンド(CD80およびCD86)に結合するため、CTLA4は、CD28により媒介される共刺激シグナル伝達に対抗するかまたはそれを調節することができる。ある特定の実施形態では、免疫チェックポイント分子は、CD28、誘導性T細胞共刺激因子(ICOS)、CD137、OX40、またはCD27から選択される共刺激分子である。他の実施形態では、免疫チェックポイント分子は、例えば、CD80、CD86、B7RP1、B7-H3、B7-H4、CD137L、OX40L、またはCD70を含む、共刺激分子のリガンドである。
【0372】
こうした共刺激チェックポイント分子を標的とするアゴニストを使用すると、ある特定のがんに対する抗原特異的T細胞応答を増強することができる。したがって、ある特定の実施形態では、免疫療法または免疫療法剤は、共刺激チェックポイント分子のアゴニストである。ある特定の実施形態では、共刺激チェックポイント分子のアゴニストは、アゴニスト抗体であり、好ましくはモノクローナル抗体である。ある特定の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗CD28抗体である。他の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗ICOS、抗CD137、抗OX40、または抗CD27抗体である。他の実施形態では、アゴニスト抗体またはモノクローナル抗体は、抗CD80、抗CD86、抗B7RP1、抗B7-H3、抗B7-H4、抗CD137L、抗OX40L、または抗CD70抗体である。
【0373】
ある特定の実施形態では、体細胞起源であるかまたは生殖系列起源であるかとしての、対象に由来する試料の核酸変異体のステータスを、参照集団の比較器結果のデータベースと比較して、その対象のために個別化または標的化された療法を識別することができる。典型的には、参照集団は、対象と同じがんもしくは疾患タイプを有する患者、および/または対象と同じ療法を受けているかもしくは受けたことがある患者を含む。個別化または標的化療法(複数可)は、核酸変異体および比較器結果がある特定の分類基準を満たす(例えば、実質的またはほぼ一致する)場合に、識別することができる。
【0374】
ある特定の実施形態では、本明細書に記載の個別化療法は、典型的には非経口的に(例えば、静脈内または皮下)投与される。免疫療法剤を含む医薬組成物は、典型的には静脈内投与される。ある特定の療法剤は経口投与される。しかしながら、個別化療法(例えば、免疫療法剤など)は、当技術分野で公知の任意の方法により、例えば、頬側、舌下、直腸、膣、尿道内、局所、眼内、鼻腔内、および/または耳内にも投与することができ、投与としては、錠剤、カプセル、顆粒、水性懸濁物、ゲル、スプレー、座薬、膏薬、または軟膏などを挙げることができる。
【0375】
がん以外の、特定の遺伝子に基づく疾患、障害、または状態を処置するための治療選択肢は、一般に、当業者であれば周知であり、検討されている特定の疾患、障害、または状態を考慮すれば明らかであろう。
【0376】
一部の実施形態では、例えば、遺伝子変異体が検出される場合、療法は、体細胞起源であるかまたは生殖系列起源であるかとしての核酸変異体のステータスに基づき個別化される。一部の実施形態では、本質的にあらゆるがん療法(例えば、外科療法、放射線療法、および/または化学療法など)が、こうした方法の一部として含まれ得る。典型的には、個別化療法としては、少なくとも1つの免疫療法(または免疫療法剤)が挙げられる。免疫療法は、一般に、所与のがんタイプに対する免疫応答を増強するための方法を指す。ある特定の実施形態では、免疫療法は、腫瘍またはがんに対するT細胞応答を増強するための方法を指す。
【0377】
ある特定の実施形態では、体細胞起源であるかまたは生殖系列起源であるとしての、対象に由来する試料の核酸変異体のステータスを、参照集団の比較器結果のデータベースと比較して、その対象のための個別化または標的化療法を識別することができる。典型的には、参照集団は、対象と同じがんもしくは疾患タイプを有する患者、および/または対象と同じ療法を受けているかもしくは受けたことがある患者を含む。個別化または標的化療法(複数可)は、核酸変異体および比較器結果がある特定の分類基準を満たす(例えば、実質的またはほぼ一致する)場合に、識別することができる。
【0378】
ある特定の実施形態では、本明細書に記載の個別化療法は、典型的には非経口的に(例えば、静脈内または皮下に)投与される。免疫療法剤を含む医薬組成物は、典型的には静脈内投与される。ある特定の療法剤は経口投与される。しかしながら、個別化療法(例えば、免疫療法剤など)は、例えば、頬側、舌下、直腸、膣、尿道内、局所、眼内、鼻腔内、および/または耳内などの方法によっても投与することもでき、投与としては、錠剤、カプセル、顆粒、水性懸濁物、ゲル、スプレー、座薬、膏薬、または軟膏などを挙げることができる。
IV.キット
【0379】
本明細書に記載の組成物を含むキットも提供される。キットは、本明細書に記載の方法を実施する際に使用することができる。一部の実施形態では、キットは、複数の標的特異的プローブを含む。一部の実施形態では、複数の標的特異的プローブは、タイプ特異的エピジェネティック変異およびコピー数変異を有する標的領域にハイブリダイズする捕捉部分を含むプローブを含むかまたはそれからなる。一部の実施形態では、キットは、捕捉部分の結合パートナーに連結された固体支持体を含む。一部の実施形態では、キットはアダプターを含む。一部の実施形態では、キットは、アダプターにアニーリングするPCRプライマーを含む。一部の実施形態では、キットは、本明細書の他所の追加要素を含む。一部の実施形態では、キットは、本明細書に記載の方法を実施するための使用説明書を含む。
【0380】
一部の実施形態では、キットは、DNA中のメチルシトシンを認識する作用剤をさらに含む。一部のそのような実施形態では、作用剤は、抗体またはメチル結合タンパク質もしくはメチル結合ドメインである。一部の実施形態では、キットは、配列可変標的領域セットに特異的に結合する標的特異的プローブを含む。一部のそのような実施形態では、標的特異的プローブは捕捉部分を含む。
【0381】
キットは、ALK、APC、BRAF、CDKN2A、EGFR、ERBB2、FBXW7、KRAS、MYC、NOTCH1、NRAS、PIK3CA、PTEN、RBI、TP53、MET、AR、ABLl、AKTl、ATM、CDHl、CSFIR、CTNNBl、ERBB4、EZH2、FGFRl、FGFR2、FGFR3、FLT3、GNA11、GNAQ、GNAS、HNF1A、HRAS、IDH1、IDH2、JAK2、JAK3、KDR、KIT、MLH1、MPL、NPM1、PDGFRA、PROC、PTPN11、RET、SMAD4、SMARCB1、SMO、SRC、STK11、VHL、TERT、CCND1、CDK4、CDKN2B、RAF1、BRCA1、CCND2、CDK6、NF1、TP53、ARID1A、BRCA2、CCNE1、ESR1、RIT1、GATA3、MAP2K1、RHEB、ROS1、ARAF、MAP2K2、NFE2L2、RHOA、およびNTRKlからなる群から選択される少なくとも5、6、7、8、9、10、20、30、40個の、またはすべての遺伝子に選択的にハイブリダイズする複数のオリゴヌクレオチドプローブをさらに含んでもよい。オリゴヌクレオチドプローブが選択的にハイブリダイズすることができる遺伝子の数はさまざまであり得る。例えば、遺伝子の数は、1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25、26、27、28、29、30、31、32、33、34、35、36、37、38、39、40、41、42、43、44、45、46、47、48、49、50、51、52、53、または54を含んでいてもよい。キットは、本明細書に記載の方法のいずれかを実施するための複数のオリゴヌクレオチドプローブおよび使用説明書を含む容器を含んでいてもよい。
【0382】
キットは、異なる分子バーコードおよび同一の試料バーコードを有する少なくとも4、5、6、7、または8つの異なるライブラリーアダプターを含んでいてもよい。ライブラリーアダプタは、配列決定アダプターでなくてもよい。例えば、ライブラリーアダプターは、フローセル配列も、配列決定用のヘアピンループの形成を可能にする配列も含まない。分子バーコードおよび試料バーコードの様々な変化型および組合せが全文にわたって説明されており、キットに応用可能である。さらに、一部の場合では、アダプターは配列アダプターではない。加えて、キットに付属のアダプターは、配列決定アダプターをさらに含んでいてもよい。配列決定アダプターは、1つまたは複数の配列決定プライマーにハイブリダイズする配列を含んでいてもよい。配列決定アダプターは、固体支持体にハイブリダイズする配列、例えばフローセル配列をさらに含んでいてもよい。例えば、配列決定アダプターは、フローセルアダプターであってもよい。配列決定アダプターは、ポリヌクレオチド断片の一方または両方の末端に付着させることができる。一部の場合では、キットは、異なる分子バーコードおよび同一の試料バーコードを有する少なくとも8つの異なるライブラリーアダプターを含んでいてもよい。ライブラリーアダプターは、配列決定アダプターでなくてもよい。キットは、ライブラリーアダプターに選択的にハイブリダイズする第1の配列、およびフローセル配列に選択的にハイブリダイズする第2の配列を有する配列決定アダプターをさらに含んでいてもよい。別の例では、配列決定アダプターはヘアピン形状であってもよい。例えば、ヘアピン形状のアダプターは、相補的二本鎖部分およびループ部分を含んでいてもよく、二本鎖部分は、二本鎖ポリヌクレオチドに付着(例えば、ライゲーション)することができる。ヘアピン形状の配列決定アダプターをポリヌクレオチド断片の両末端に付着させて環状分子を生成し、それを複数回配列決定してもよい。配列決定アダプターは、1つまたは複数のバーコードを含んでいてもよい。例えば、配列決定アダプターは、試料バーコードを含んでいてもよい。試料バーコードは、所定の配列を含んでいてもよい。試料バーコードは、ポリヌクレオチドの供給源を識別するために使用することができる。試料バーコードは、少なくとも1、2、3、4、5、6、7、8、9、10、11、12、13、14、15、16、17、18、19、20、21、22、23、24、25個、またはそれよりも多く(または全文に記載の任意の長さ)の核酸塩基、例えば少なくとも8塩基であってもよい。上記に記載のように、バーコードは、連続配列であってもよくまたは不連続配列であってもよい。
【0383】
ライブラリーアダプターは平滑末端およびY字形であってもよく、40核酸塩基長未満であってもよく、またはそれと等しくてもよい。ライブラリーアダプターの他の変化型は、全文に見出すことができ、キットに応用可能である。
【0384】
本発明の好ましい実施形態を本明細書において示し説明してきたが、当業者であれば、そのような実施形態は単なる例として提供されていることが明らかであろう。本発明は、本明細書内で提供される特定の例により限定されることが意図されていない。本発明は上述の明細書を参照して説明されているが、本明細書における実施形態の説明および例示は、限定的な意味で解釈されることを意図したものではない。当業者であれば、今や、本発明から逸脱することなく、数多くの変化型、変更、および置換を思いつくだろう。さらに、本発明のすべての態様は、様々な条件および変数に依存する、本明細書に示されている特定の図示、構成、または相対的割合に限定されないことが理解されるべきである。本明細書に記載の開示の実施形態に対する種々の代替を本発明の実施に使用することができることが理解されるべきである。したがって、本開示は、あらゆるそのような代替、改変、変形型、または均等物も網羅することが企図される。本発明の範囲は以下の特許請求の範囲により規定され、そうした特許請求の範囲内の方法および構造ならびにそれらの均等物がそれにより網羅されることが意図されている。上述の開示は、明瞭性および理解を目的として、例示および例によりある程度詳細に説明されているが、当業者であれば、本開示を読むと、本開示の真の範囲から逸脱することなく、形態および詳細に種々の変更をなすことができ、添付の特許請求の範囲内で実施することができることは明らかであろう。例えば、方法、システム、コンピュータ可読媒体、および/または成分特徴、ステップ、要素、またはそれらの他の態様はすべて、種々の組合せで使用することができる。
【0385】
本明細書で引用される特許、特許出願、ウェブサイト、他の刊行物または文書、および受託番号などはすべて、個々の項目があたかも具体的におよび個々に参照により組み込まれていることを示すかのごとく、あらゆる目的のためにそれらの全体が参照により組み込まれる。異なるバージョンの配列が異なる時点で受託番号に関連付けられている場合、本出願の有効出願日における受託番号に関連付けられているバージョンが意図されている。有効出願日とは、実際の出願日または該当する場合は受託番号を参照する優先権出願の出願日のいずれか早い方を意味する。同様に、刊行物またはウェブサイトなどの異なる版が異なる時期に刊行されている場合、別様の指示がない限り、本出願の有効出願日において最新の刊行された版が意図されている。
【実施例】
【0386】
(実施例1)
対象の早期結腸直腸がんに関連付けられるCNVでもあるタイプ特異的DMRを検出するためのcfDNAの分析
健常対象および早期結腸直腸がんを有する対象に由来する試料を、血液ベースアッセイで分析して、異常に高いコピー数を有する可能性のある結腸組織に関連付けられる高メチル化領域を検出し、そのようなシグナルが、結腸直腸がんまたは結腸直腸前がんを予測するか否かを試験する。こうした対象の血漿からcfDNAを抽出し、次いでビーズに付着したMBDに対する結合に基づいて分配する。漸増塩濃度でビーズを洗浄する。未結合DNAおよびこうした洗浄でのDNAは、漸増的にメチル化されたcfDNAの3つの分配画分(低メチル化、残留メチル化、および高メチル化分配画分)をもたらす。分配画分中のcfDNA分子を浄化して塩を除去し、ライブラリー調製の酵素ステップに備えて濃縮する。
【0387】
分配画分中のcfDNAを濃縮した後、分子バーコードを含むアダプターをcfDNAに付加する。こうした分子バーコードは非一意的であり、各分配画分を、他の分配画分に使用されているアダプターのバーコードと区別可能な非一意的分子バーコードを有するアダプターとライゲートさせる。ライゲーション後、必要に応じて、高メチル化分配画分をメチル化感受性制限酵素で処理して、誤って分配された非メチル化DNAを分解する。分配画分を一緒にプールし、PCRにより増幅する。
【0388】
PCRの後、増幅したDNAを洗浄し、富化する前に濃縮する。濃縮したら、DNAを、塩緩衝液、および血液細胞(つまり、試料中に存在する他の主要な細胞タイプ)と比べて結腸組織において高メチル化されており、高メチル化領域で予想される野生型コピー数と比べて異常に高いコピー数を有するDMRに特異的に結合するビオチン化RNA標的特異的プローブと一緒にする。この混合物を一晩インキュベートする。
【0389】
DNAにハイブリダイズしたビオチン化RNA標的特異的プローブを、ストレプトアビジンコンジュゲート磁気ビーズで捕捉し、一連の塩ベース洗浄により捕捉されない増幅DNAから分離し、それにより試料を富化する。富化後、アンプリコンに試料インデックスを付加するプライマーを使用してさらなる増幅を実施する。Illumina NovaSeqシーケンサーを使用して、富化試料のアリコートを配列決定する。次いで、シーケンサーにより生成された配列リードを、バイオインフォマティクスツール/アルゴリズムを使用して分析する。分子バーコードを使用して一意的な分子を識別し、ならびに差次的に分配された分子へと試料をデコンボリューションする。高メチル化標的領域配列を分析して、結腸組織に関連付けられる領域におけるメチル化cfDNA分子を検出する。相対的メチル化頻度を、入力cfDNAにより正規化されたメチル化割合(高+残留)の合計数として決定する。異常に高いCNVを有する結腸特異的高メチル化DMRは、対象のがんステータスに関連付けられる情報の非常に高感度な検出(例えば、野生型コピー数で存在する結腸特異的高メチル化DMRの分析から得られることになるものよりも高感度な検出)を提供することができる。
(実施例2)
対象の早期結腸直腸がんに関連付けられるCNVでもあるタイプ特異的DMRを検出するためのcfDNAの分析
【0390】
健常対象および早期結腸直腸がんを有する対象に由来する試料を、血液ベースアッセイで分析して、異常に高いコピー数を有する可能性のある結腸組織に関連付けられる高メチル化領域を検出し、そのようなシグナルが、結腸直腸がんまたは結腸直腸前がんを予測するか否かを試験する。こうした対象の血漿からcfDNAを抽出し、次いでメチルシトシンに特異的な抗体と一緒にする。プロテインGとコンジュゲートさせた磁気ビーズを使用して、抗体およびそれに結合したDNAを免疫沈降させ、したがって高メチル化DNAと低メチル化DNAとを分配する。まず、メチル化されていないかまたはメチル化の程度が低いあらゆるDNAを、漸増濃度の塩を含む緩衝液を用いてビーズから溶出させる。最後に、高塩緩衝液を使用して、高度にメチル化されたDNAを、メチルシトシンに特異的な抗体から洗い流す。未結合DNAおよびこうした洗浄でのDNAは、漸増的にメチル化されたcfDNAの3つの分配画分(低メチル化、残留メチル化、および高メチル化分配画分)をもたらす。分配画分中のcfDNA分子を浄化して塩を除去し、ライブラリー調製の酵素ステップに備えて濃縮する。
【0391】
分配画分中のcfDNAを濃縮した後、第1のアダプターを、その3’末端へのライゲーションによりcfDNAに付加する。アダプターを、ユニバーサルプライマーおよびDNAポリメラーゼを使用した第二鎖合成のプライミング部位として使用する。第1のアダプターはビオチンを含み、第1のアダプターにライゲートした核酸は、ストレプトアビジンを含むビーズに結合する。次いで、第2のアダプターを、今や二本鎖である分子の第二鎖の3’末端にライゲートさせる。こうしたアダプターは非一意的分子バーコードを含み、各分配画分を、他の分配画分に使用されているアダプターのバーコードと区別可能な非一意的分子バーコードを有するアダプターとライゲートさせる。ライゲーション後、高メチル化分配画分をメチル化感受性制限酵素で処理して、誤って分配された非メチル化DNAを分解する。分配画分を一緒にプールし、PCRにより増幅する。
【0392】
PCR後、増幅されたDNAを洗浄し、富化する前に濃縮する。濃縮したら、増幅されたDNAを、塩緩衝液、および血液細胞(つまり、試料中に存在する他の主要な細胞タイプ)と比べて結腸組織において高メチル化されており、高メチル化領域で予想される野生型コピー数と比べて異常に高いコピー数を有するDMRに特異的に結合するビオチン化RNA標的特異的プローブと一緒にする。この混合物を一晩インキュベートする。
【0393】
DNAにハイブリダイズしたビオチン化RNA標的特異的プローブを、ストレプトアビジンコンジュゲート磁気ビーズで捕捉し、一連の塩ベースの洗浄により捕捉されない増幅されたDNAから分離し、それにより試料を富化する。富化後、Illumina NovaSeqシーケンサーを使用して、富化試料のアリコートを配列決定する。次いで、シーケンサーにより生成された配列リードを、バイオインフォマティクスツール/アルゴリズムを使用して分析する。分子バーコードを使用して一意的分子を識別し、ならびに差次的に分配された分子へと試料をデコンボリューションする。高メチル化標的領域配列を分析して、結腸組織に関連付けられる領域におけるメチル化cfDNA分子を検出する。相対的メチル化頻度を、入力cfDNAにより正規化されたメチル化割合(高+残留)の合計数として決定する。異常に高いCNVを有する結腸特異的高メチル化DMRは、対象のがんステータスに関連付けられる情報の非常に高感度な検出(例えば、野生型コピー数で存在する結腸特異的高メチル化DMRの分析から得られることになるものよりも高感度な検出)を提供することができる。
(実施例2)
対象の早期結腸直腸がんに関連付けられるCNVでもあるタイプ特異的断片を検出するためのcfDNAの分析
【0394】
健常対象および早期結腸直腸がんを有する対象に由来するcfDNAの試料を得、分配ステップを省略してもよく、異なるビオチン化RNA標的特異的プローブを使用することを除き、実施例1に記載のように分析する。標的特異的プローブは、血液細胞(つまり、cfDNA試料に寄与する主要な細胞タイプ)と比べて結腸組織において異なる断片化パターンを示すことが公知であり、野生型のコピー数と比べて結腸直腸がんにおいて異常に高いコピー数を示す可能性があるDNA領域に特異的に結合する。プローブおよびプローブにハイブリダイズしたDNAを、実施例1に記載のように捕捉し、配列決定する。標的領域断片を分析して、結腸組織に関連付けられるcfDNA分子を検出する。異常に高いCNVを有する結腸特異的断片は、対象のがんステータスに関連付けられる情報の非常に高感度な検出を提供することができる。
(実施例3)
対象におけるがんの存在または非存在を検出するためのcfDNAのエピジェネティックおよび配列可変分析
【0395】
エピジェネティック標的領域セットまたは標的特異的プローブ(つまり、結腸特異的DMRまたは結腸特異的断片化パターン断片に結合するプローブ)に加えて、標的特異的プローブの配列可変標的領域セットも使用されることを除いて、実施例1または2に記載のように、健常対象および早期結腸直腸がんを有する対象に由来するcfDNAの試料を得、調製し、捕捉し、配列決定し、分析する。詳細には、ビオチン化RNA標的特異的プローブは、結腸がんにおいて突然変異することが公知である配列を含む配列可変標的領域セットに対するプローブを含む。配列可変領域セットに対するプローブは、約50kbのフットプリントを有する。
【0396】
実際の腫瘍変異体を技術的エラー(例えば、PCRエラー、配列決定エラー)と区別するのに十分な確度をもってコールすることができる、SNV、挿入、欠失、および融合物などのゲノム変更を検出することにより、配列可変標的領域配列を分析する。エピジェネティック標的領域配列を独立して分析して、結腸組織に由来する高メチル化cfDNA分子を検出する。最後に、両分析の結果を組み合わせて、試料が得られた対象におけるがんまたは前がんの可能性の最終決定を生成する。
【国際調査報告】