(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2023-11-30
(54)【発明の名称】制限酵素及びハイスループット配列決定を用いたDNA試料におけるメチル化変化の検出
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20231122BHJP
【FI】
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023530742
(86)(22)【出願日】2021-11-18
(85)【翻訳文提出日】2023-06-27
(86)【国際出願番号】 IL2021051382
(87)【国際公開番号】W WO2022107145
(87)【国際公開日】2022-05-27
(32)【優先日】2020-11-19
(33)【優先権主張国・地域又は機関】IL
(81)【指定国・地域】
(71)【出願人】
【識別番号】517435261
【氏名又は名称】ニュークレイクス リミテッド
(74)【代理人】
【識別番号】100114775
【氏名又は名称】高岡 亮一
(74)【代理人】
【識別番号】100121511
【氏名又は名称】小田 直
(74)【代理人】
【識別番号】100202751
【氏名又は名称】岩堀 明代
(74)【代理人】
【識別番号】100208580
【氏名又は名称】三好 玲奈
(74)【代理人】
【識別番号】100191086
【氏名又は名称】高橋 香元
(72)【発明者】
【氏名】フラムキン,ダニー
(72)【発明者】
【氏名】ワサーストローム,アダム
(72)【発明者】
【氏名】アクセルラッド,ニムロッド
(72)【発明者】
【氏名】ニルシュ,リヴァイタル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA19
4B063QQ03
4B063QQ34
4B063QQ42
4B063QQ58
4B063QR08
4B063QR58
4B063QR62
4B063QX02
(57)【要約】
メチル化感受性制限酵素によるDNAの消化、それに続くハイスループット配列決定及び配列読み取りの分析を含む、DNA試料の遺伝的及び後成的プロファイリング並びにDNA試料における遺伝的及び後成的変化の検出のための方法及びシステムが提供される。有利なことに、本発明の方法及びシステムは、高感度であるが正確であり、非常に少量のDNAで作業することを可能にし、1回の実行からの配列決定データに基づいて、メチル化データ、変異データなどを含む膨大な量の情報を受け取る。
【特許請求の範囲】
【請求項1】
対象由来の無細胞DNA(cfDNA)試料の遺伝的及び後成的特性をプロファイリングするための方法であって、
(a)前記無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)DNA分子の末端の配列情報を保存しながら、前記制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、前記配列決定ライブラリを調製することが、前記制限エンドヌクレアーゼ処理されたDNA中のDNA分子に配列決定アダプタをライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、前記配列決定ライブラリを配列決定して、配列決定データを提供することと、
(d)前記配列決定データから、少なくとも1つの制限遺伝子座のメチル化値、並びに任意選択で、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択される前記無細胞DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することと、を含み、
3000半数体当量を含む無細胞DNAの量が、前記方法に十分であり、前記無細胞DNA試料が、ライブラリ調製の前に増幅に供されず、前記メチル化値及び前記無細胞DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することが、同じ配列決定データに基づいて実施される、方法。
【請求項2】
無細胞DNA試料を処理して、遺伝的及び後成的分析のための配列決定データを得るための方法であって、
(a)前記無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)DNA分子の末端の配列情報を保存しながら、前記制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、前記配列決定ライブラリを調製することが、前記制限エンドヌクレアーゼ処理されたDNA中のDNA分子に配列決定アダプタをライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、前記配列決定ライブラリを配列決定して、配列決定データを得ることと、を含み、
3000半数体当量を含む無細胞DNAの量が、少なくとも85%のユニークマッピング率、未消化試料と比較して少なくとも0.65のピアソン相関によって特徴付けられるコピー数完全性、及び未消化試料と比較して少なくとも0.55のピアソン相関によって特徴付けられるヌクレオソームポジショニング完全性、のうちの少なくとも1つを達成するのに十分であり、
遺伝的及び後成的分析が、同じ配列決定データに基づいて実施される、方法。
【請求項3】
6,000半数体当量を含む無細胞DNAの量が、前記方法に十分である、請求項1又は2に記載の方法。
【請求項4】
前記無細胞DNAが、血漿無細胞DNAであり、前記無細胞DNAの量が、9~10mLの血液から得られる量である、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記無細胞DNAの量が、10~200ngである、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記無細胞DNAの量が、20~100ngである、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記少なくとも1つのメチル化感受性制限エンドヌクレアーゼが、非平滑末端を生成し、前記方法が、配列決定アダプタの前記ライゲーションの前に前記制限エンドヌクレアーゼ処理されたDNAを末端修復に供して、平滑末端を有するDNA分子を得ることを更に含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記ハイスループット配列決定が、全ゲノムハイスループット配列決定である、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記ハイスループット配列決定が、標的のみを対象にしたハイスループット配列決定である、請求項1~8のいずれか一項に記載の方法。
【請求項10】
請求項1~9のいずれか一項に記載の方法であって、少なくとも1つの制限遺伝子座のメチル化値を決定することが、
(i)少なくとも1つの制限遺伝子座を選択し、前記制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することと、
(ii)ステップ(i)において決定された読み取りカウント及び参照読み取りカウントに基づいて、前記少なくとも1つの制限遺伝子座のメチル化値を計算することと、を含む、方法。
【請求項11】
ステップ(i)が、前記制限遺伝子座を含有する少なくとも100bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することを含む、請求項10に記載の方法。
【請求項12】
前記少なくとも1つの制限遺伝子座が、複数の制限遺伝子座である、請求項1~11のいずれか一項に記載の方法。
【請求項13】
前記少なくとも1つのメチル化感受性制限エンドヌクレアーゼが、複数のメチル化感受性制限エンドヌクレアーゼであり、前記複数のメチル化感受性制限エンドヌクレアーゼによる前記消化が、同時の消化である、請求項1~12のいずれか一項に記載の方法。
【請求項14】
前記複数のメチル化感受性制限エンドヌクレアーゼが、HinP1Iを含む、請求項13に記載の方法。
【請求項15】
前記複数のメチル化感受性制限エンドヌクレアーゼが、AciIを含む、請求項13に記載の方法。
【請求項16】
前記消化が、HinP1I及びAciIを使用して実施される、請求項13に記載の方法。
【請求項17】
前記無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供する前記ステップが、消化効力を決定することと、前記消化効力が所定の閾値を上回る場合に配列決定ライブラリの調製に進むことと、を更に含む、請求項1~16のいずれか一項に記載の方法。
【請求項18】
対象由来の無細胞DNA試料(cfDNA)におけるがん関連の遺伝的及び後成的変化を検出するための方法であって、請求項1~17のいずれか一項に記載のcfDNA試料のメチル化及び任意選択で少なくとも1つの追加の遺伝的及び後成的特性をプロファイリングして、前記cfDNA試料の遺伝的及び後成的プロファイルを得ることと、前記cfDNA試料の前記遺伝的及び後成的プロファイルを、がんプロファイル及び非がんプロファイルから選択される1つ以上の参照遺伝的及び後成的プロファイルと比較して、前記cfDNA試料におけるがん関連の遺伝的及び後成的変化を検出することと、を含む、方法。
【請求項19】
前記無細胞DNA試料が、がんを有することが疑われる、又はがんを有するリスクがある対象からのものであり、前記方法が、がん関連変化が検出された場合に、能動的ながん監視及び追跡検査を前記対象に施すことを更に含み、前記がん監視及び追跡検査が、血液検査、尿検査、細胞診、撮像、内視鏡検査、及び生検のうちの1つ以上を含む、請求項18に記載の方法。
【請求項20】
対象におけるがんの存在又は非存在を評価するための方法であって、
(a)前記対象の無細胞DNA(cfDNA)試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)前記制限エンドヌクレアーゼ処理されたDNAをハイスループット配列決定法によって配列決定することと、
(c)互いに150bp以内の腫瘍高メチル化制限遺伝子座及び腫瘍変異遺伝子座を含む少なくとも1つのマルチオミクスゲノム領域を選択することと、
(d)前記少なくとも1つのマルチオミクス領域をカバーする配列読み取りの分析に基づいて、前記対象ががんを有する可能性を決定することと、を含む、方法。
【請求項21】
前記少なくとも1つのマルチオミクス領域が、互いに100bp以内の腫瘍高メチル化制限遺伝子座及び腫瘍変異遺伝子座を含む、請求項20に記載の方法。
【請求項22】
前記少なくとも1つのマルチオミクス領域をカバーする配列読み取りの分析が、
-各マルチオミクス領域について、
(i)前記制限遺伝子座の全てのヌクレオチドを含み、前記変異遺伝子座に変異遺伝子型を提示する、前記マルチオミクス領域をカバーするメチル化変異配列読み取りの数、
(ii)前記制限遺伝子座の全てのヌクレオチドを含み、前記変異遺伝子座に野生型遺伝子型を提示する、前記マルチオミクス領域をカバーするメチル化野生型配列読み取りの数、
(iii)前記制限遺伝子座内のヌクレオチドで開始又は終了し、前記変異遺伝子座に変異遺伝子型を提示する、前記マルチオミクス領域をカバーする非メチル化変異配列読み取りの数、及び
(iv)前記制限遺伝子座内のヌクレオチドで開始又は終了し、前記変異遺伝子座に野生型遺伝子型を提示する、前記マルチオミクス領域をカバーする非メチル化野生型配列読み取りの数、のうちの少なくとも1つを決定することと、
-前記対象ががんを有する可能性を評価するために、(i)~(iv)において決定された前記読み取りの数をがん患者及び/又は健康な個体の基準値と比較することと、を含む、請求項20又は21に記載の方法。
【請求項23】
がんを有することが疑われるか又はがんを有するリスクがある対象の無細胞DNA(cfDNA)試料を特徴付けるための方法であって、
(a)前記無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)前記制限エンドヌクレアーゼ処理されたDNAをハイスループット配列決定法によって配列決定することと、
(c)互いに150bp以内の腫瘍高メチル化制限遺伝子座及び腫瘍変異遺伝子座を含む少なくとも1つのマルチオミクスゲノム領域を選択することと、
(d)各マルチオミクス領域について、
(i)前記制限遺伝子座の全てのヌクレオチドを含み、前記変異遺伝子座に変異遺伝子型を提示する、前記マルチオミクス領域をカバーするメチル化変異配列読み取りの数、
(ii)前記制限遺伝子座の全てのヌクレオチドを含み、前記変異遺伝子座に野生型遺伝子型を提示する、前記マルチオミクス領域をカバーするメチル化野生型配列読み取りの数、
(iii)前記制限遺伝子座内のヌクレオチドで開始又は終了し、前記変異遺伝子座に変異遺伝子型を提示する、前記マルチオミクス領域をカバーする非メチル化変異配列読み取りの数、及び
(iv)制限遺伝子座内のヌクレオチドで開始又は終了し、変異遺伝子座に野生型遺伝子型を提示する、マルチオミクス領域をカバーする非メチル化野生型配列読み取りの数、のうちの少なくとも1つを決定することと、を含み、
それにより、前記無細胞DNA試料を特徴付ける、方法。
【請求項24】
対象由来のDNA試料のメチル化をプロファイリングするための方法であって、
(a)前記DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)前記制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、前記配列決定ライブラリを調製することが、配列決定アダプタを前記制限エンドヌクレアーゼ処理されたDNA断片にライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、前記配列決定ライブラリを配列決定して、配列読み取りを得ることと、
(d)少なくとも1つの制限遺伝子座を選択し、前記制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することと、
(e)ステップ(d)において決定された読み取りカウント及び参照読み取りカウントに基づいて、少なくとも1つの制限遺伝子座のメチル化値を計算することと、を含み、
それにより、前記無細胞DNA試料のメチル化をプロファイリングする、方法。
【請求項25】
前記制限遺伝子座をカバーする前記所定の領域が、前記制限遺伝子座内の前記切断部位の少なくとも25bp上流から始まり、前記制限遺伝子座内の前記切断部位の少なくとも25bp下流で終了する、請求項24に記載の方法。
【請求項26】
ステップ(d)が、前記制限遺伝子座を含有する少なくとも100bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することを含む、請求項25に記載の方法。
【請求項27】
前記制限遺伝子座をカバーする前記所定の領域が、前記制限遺伝子座内の前記切断部位の少なくとも50bp上流から始まり、前記制限遺伝子座内の前記切断部位の少なくとも50bp下流で終了する、請求項26に記載の方法。
【請求項28】
前記少なくとも1つの制限遺伝子座が、CGアイランド内に位置する、請求項24~27のいずれか一項に記載の方法。
【請求項29】
前記参照読み取りカウントが、未消化対照DNA試料中の前記制限遺伝子座を含有する少なくとも50bpの長さの前記所定のゲノム領域について決定された読み取りカウントであり、任意選択的に、配列決定深度差について補正される、請求項24~28のいずれか一項に記載の方法。
【請求項30】
前記参照読み取りカウントが、前記制限エンドヌクレアーゼによって切断されない参照遺伝子座を含有する少なくとも50bpの長さの参照領域を使用して決定された読み取りカウントである、請求項24~28のいずれか一項に記載の方法。
【請求項31】
前記参照読み取りカウントが、前記制限エンドヌクレアーゼによって切断されない参照遺伝子座を含有する少なくとも50bpの長さの複数の参照領域を使用して決定された平均読み取りカウントである、請求項24~28のいずれか一項に記載の方法。
【請求項32】
メチル化値を計算することが、ステップ(d)において決定された前記読み取りカウントを前記DNA試料の読み取りカウント中央値に対して正規化して、正規化読み取りカウントを得ることと、前記正規化読み取りカウントの正規化参照読み取りカウントに対する比を計算することと、を含む、請求項24~31のいずれか一項に記載の方法。
【請求項33】
DNA試料の遺伝的及び後成的プロファイリングのための方法であって、請求項24~32のいずれか一項に記載の少なくとも1つの制限遺伝子座のメチル化値を決定することと、配列決定データから、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択されるDNA試料の少なくとも1つの追加の遺伝的又は後成的特性を更に決定することと、を含む、方法。
【請求項34】
前記DNAが、生体液試料から抽出された無細胞DNAである、請求項24~33のいずれか一項に記載の方法。
【請求項35】
前記DNAが、腫瘍試料から抽出されたDNAである、請求項24~33のいずれか一項に記載の方法。
【請求項36】
第1及び第2のDNAの給源の間で差次的にメチル化されたゲノム領域を同定するための方法であって、
請求項24~33のいずれか一項に記載の方法に従って、前記第1の給源からの少なくとも1つのDNA試料のメチル化をプロファイリングして、第1のDNAメチル化プロファイルを得ることと、
請求項24~33のいずれか一項に記載の方法に従って、前記第2の給源からの少なくとも1つのDNA試料のメチル化をプロファイリングして、第2のDNAメチル化プロファイルを得ることと、
前記第1及び前記第2のDNAメチル化プロファイルを比較して、前記第1及び前記第2のDNAの給源の間で差次的にメチル化されたゲノム領域を同定することと、を含む、方法。
【請求項37】
前記第1のDNAの給源が、がんDNAであり、前記第2のDNAの給源が、非がんDNAである、請求項36に記載の方法。
【請求項38】
前記第1のDNAの給源が、がん患者の血漿無細胞DNAであり、前記第2のDNAの給源が、1人以上の健康な個体の血漿無細胞DNAである、請求項36に記載の方法。
【請求項39】
前記第1及び前記第2のDNAの給源が、がんの異なる段階のものである、請求項36に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、DNA試料の、そして特に体液から得られた無細胞DNA試料(例えば血漿及び尿)の、遺伝的及び後成的特性のプロファイリングを行うための方法及びシステムに関する。本発明の方法及びシステムは、メチル化感受性又はメチル化依存性制限酵素によるDNAの消化、配列決定ライブラリの調製、ハイスループット配列決定(例えば、次世代配列決定)、及び配列読み取りの分析を含む。有利なことに、本発明の方法及びシステムは、高感度であるが正確であり、非常に少量のDNAで作業することを可能にし、1回の実行からの配列決定データに基づいて、メチル化データ、変異データなどを含む膨大な量の情報を受け取る。本発明の方法及びシステムは、例えば、新しいメチル化マーカーの発見、及び診療所での診断用途の両方に有用である。
【背景技術】
【0002】
変異、DNAメチル化変化(例えば、単離されたCpGの低メチル化及び主にCpGアイランドで生じる高メチル化)、コピー数変動などを含む遺伝的及び後成的変化は、多くのタイプのがんで生じることが知られている。例えば、遺伝子サイレンシングにつながる、腫瘍抑制遺伝子のプロモーター領域にあるCpGアイランドの高メチル化は、広く研究されており、様々な種類のがんで実証されている。
【0003】
腫瘍はDNA断片又は「無細胞DNA」を生体液に放出するため、結果として、血漿や尿などの生体液から得られる「液体生検」において、腫瘍由来のDNA分子の遺伝的及び後成的変化が検出できる。従来の生検とは対照的に、液体生検は非侵襲的であり、腫瘍サブクローンの完全な遺伝的スペクトルをより適切に表す可能性がある。その結果、液体生検におけるがんに関連する遺伝的及び後成的変化の検出は、早期発見、予後、及び治療的監視に大きな期待を抱くものである。ただし、液体生検で腫瘍由来のDNAを検出するには、生体液中の無細胞DNAの濃度が低い場合があり、更に正常なDNAのバックグラウンドが大きいのに関連して、腫瘍DNAが非常に少量しか存在しない可能性があるため、超高感度の生化学的手法が必要である。
【0004】
非メチル化シトシンをウラシルに変換するためのDNAの亜硫酸水素ナトリウム処理、それに続くメチル化変化を検出するための変換されたDNAの定量的PCR又は配列決定に基づく、液体生検中のメチル化DNA分子の検出のためのいくつかの技術が開発されている。変換された塩基は、配列決定データにおいてチミンとして同定され(PCR後)、読み取りカウントを使用して、メチル化シトシンのパーセンテージ(%)を決定することができる。バイサルファイト変換配列決定は、標的化された方法又は全ゲノムバイサルファイト配列決定を用いて行われ得る。次世代配列決定(next-generation sequencing、NGS)などのハイスループット配列決定の進歩は、単一ヌクレオチドレベルでメチル化パターンを同定及び分析するためのゲノムワイド分析及び標的化アプローチの両方を可能にする。
【0005】
その人気にもかかわらず、亜硫酸水素ナトリウムによるDNAの変換は厄介なアッセイであり、鋳型DNAの分解、アッセイにノイズを導入する非特異的又は不完全な変換、並びにPCRの特異性の低下、DNA増幅におけるバイアスの増加、及びDNAの配列決定におけるノイズレベルの増加を引き起こす4塩基ゲノムからおよそ3塩基ゲノムへのゲノムの複雑性の低下を含む欠点を有する。更に、バイサルファイト処理はDNAの配列を変化させ、トランジション事象が配列の変化によってDNA鎖の1つで不明瞭になるため、変異分析が妨げられる。
【0006】
Ball et al.(2009)Nat Biotechnol.,27(4):361-368は、次世代配列決定技術を利用するシトシンメチル化プロファイリングのための2つの技術:バイサルファイトパドロックプローブ(bisulfite padlock probe、BSPP)及びメチル感受性切断計数(methyl sensitive cut counting、MSCC)を報告している。
【0007】
Brunner et al.(2009)Genome Res.,19(6):1044-1056は、Methyl-seqを報告しており、これはゲノム全体にわたって90,000を超える領域でのDNAメチル化をアッセイする方法である。Methyl-seqは、メチル感受性酵素によるDNA消化を次世代(next-gen)DNA配列決定技術と組み合わせるものである。
【0008】
Jelinek et al.(2012)Epigenetics,7:12,1368-1378は、メチル化のデジタル制限酵素分析(Digital Restriction Enzyme Analysis of Methylation、DREAM)と題された方法を報告しており、これは、同じ配列を認識する一対のネオシゾマー(neoschizomeric)制限酵素である、Sma(メチル化感受性酵素)、及びXmaI(メチル化非感受性酵素)によるゲノムDNAの連続的消化によって作成されたメチル化特異的シグネーチャの次世代配列決定分析に基づく。
【0009】
Marsh and Pasqualone(2014)Front Physiol,5:173は、McMurdo Sound、Antarcticaからの海洋多毛類Spiophanes tcherniaiにおけるメチル-シトシン組成のパターンの特徴付けを報告している。メチル化感受性制限エンドヌクレアーゼによるDNA消化と、それに続く次世代配列決定を用いて、メチル化パターンが特徴付けられた。
【0010】
Marsh et al.,2016,Front Genet.,7:191は、メチル感受性制限エンドヌクレアーゼ(methyl-sensitive restriction endonucleases、MSRE)を用いて次世代配列決定(NGS)データから部位特異的CpGメチル化状態をコンピュータで再構築するための定量化方法論を報告している。
【0011】
Viswanathan et al.(2019)Nucleic Acids Research,47(19):e122は、同じ試料中の非メチル化DNA及びメチル化DNAの両方の定量分析を可能にする、単一チューブ酵素法、制限酵素によるDNA分析(DNA Analysis by Restriction Enzymes、DARE)を報告している。両方のメチル化状態の情報は、メチル化感受性及び非感受性制限酵素の対によって連続的に消化されるDNA断片のディファレンシャルアダプタのタギングによって捕捉される。
【0012】
Pereira et al.(2020)PLoS ONE,15(6):e0233800は、ゲノムの二重消化、それに続く特別なアダプタ連結及び次世代配列決定の組み合わせに基づく、メチル感受性(Methyl Sensitive)DArT-seq(MS-DArT-seq)と名付けられた技術を報告している。CCGG部位を標的とし、対照的なメチル化感受性を示す制限酵素(MspI、メチル化非感受性、及び内部シトシンが5’-メチル化されている場合に切断しないHpaII)を使用して、2つのライブラリを並行して構築する。
【0013】
Tanaka et al.(2020)Analytical Biochemistry,609:113977は、絨毛膜絨毛(chorionic villi、CV)と母体血液細胞(MBC)との間で差次的にメチル化された領域を同定するために、メチル化感受性制限酵素(MSRE)と次世代配列決定(NGS)とを組み合わせるアプローチを報告している。
【0014】
米国特許第10,392,666号は、DNAのメチル化パターン(メチローム)の決定、より具体的には、少数ゲノムのメチル化パターン(メチローム)を決定するための、異なるゲノム由来(例えば、胎児及び母親由来、又は腫瘍及び正常細胞由来)のDNAの混合物を含む生体試料(例えば、血漿)の分析を開示している。
【0015】
国際公開第2016/061624号は、メチル化の分析に適した遺伝子又はゲノム内の部位及び領域を同定するための方法を開示している。本方法は、その後の分析のための標的を提供する標的制限部位及び断片のゲノムワイドスケールでの効率的な同定を可能にする。
【0016】
国際公開第2018/195211号は、循環腫瘍DNAを含む、対象の体内の循環ポリヌクレオチド断片などの限定されたDNAインプットに対するゲノムバリアント及びDNAメチル化状態の同時検出のためのライブラリを構築するための組成物、キット、及び方法を開示している。
【0017】
本発明の出願人に譲渡された国際公開第2011/070441号、同第2017/006317号、同第2019/142193及び同第2020/188561号は、DNA試料中のメチル化変化を検出する方法を開示している。
【0018】
対象からの単一のサンプリングから得られた無細胞DNAから、及び一回のランからの配列決定データを使用して、様々なタイプの遺伝的及び後成的データを生成することができる方法及びシステムを有することは、非常に有益であろう。
【発明の概要】
【0019】
本発明は、DNA試料の、そして特に体液から得られた無細胞DNA試料(例えば血漿及び尿)の、遺伝的及び後成的特性のプロファイリングを行うための方法及びシステムに関する。本発明の方法及びシステムは、少なくとも1つのメチル化感受性制限酵素、好ましくは同時に適用される複数のメチル化感受性制限酵素による消化、試料中のDNA分子の末端における配列情報を保存するライブラリ調製方法を用いた配列決定ライブラリの調製、ハイスループット配列決定及び配列読み取りの分析、を含む。
【0020】
本発明は、これまでに記載された方法と比較してより単純かつ正確なアッセイを提供し、バイサルファイト配列決定と比較して高品質の配列決定データをもたらし、がん関連変化の高感度検出を可能にする。メチル化データ、変異データなどを含む、同じ配列決定データに基づく1回の実行からの膨大な量の情報を得ることができ、したがって、包括的な遺伝子及び後成的情報を得るための並行アッセイの必要性が回避される。重要なことには、驚くべきことに、非常に少量のDNAからであっても、ライブラリ調製前に増幅する必要なく、高品質の配列決定データを得ることができることが見出された。以下に例示されるように、本明細書に開示される方法は、単一の標準血液試験管から得られる無細胞DNAの量に基づいて、血漿中の腫瘍由来DNAの量が非常に低い場合でも早期のがんの遺伝的及び後成的変化を検出することができる。
【0021】
本発明の方法及びシステムは、バイサルファイト変換を含まず、又は必要としない。本発明の方法及びシステムは、DNAの配列を変化させることを必要とせず、同じ配列決定データに基づいて、例えば、メチル化、変異、コピー数及びヌクレオソームポジショニングの同時分析を可能にする。
【0022】
以下に例示されるように、メチル化感受性酵素消化に続いてハイスループット配列決定に供された無細胞DNA試料について得られた配列決定データと、バイサルファイト変換及びハイスループット配列決定後に得られた配列決定データとの比較は、バイサルファイト処理DNAと比較し酵素処理DNAについて、顕著に良好な配列決定測定基準(読み取り数、マッピング率など)、コピー数完全性及びヌクレオソームポジショニング完全性を示した。個々の試料と比較したプールされた無細胞DNA試料の分析は、少量のDNAが使用される場合、情報の損失が存在することを示した。しかしながら、酵素処理されたDNA試料の配列決定データの質は高いままであり、信頼できる分析を可能にした一方で、バイサルファイト配列決定は、顕著に減少した読み取り数及びマッピング率を示し、事実上、全てのコピー数及びヌクレオソームポジショニング情報を喪失した。更に、配列決定ノイズは、バイサルファイト処理されたDNA試料について高く、その結果、変異は、配列決定ノイズと区別できなかった。メチル化検出に関して、酵素処理されたDNA試料におけるメチル化分析は、バイサルファイト処理されたDNA試料と比較して、血漿中で顕著により多くのメチル化変化を検出した。
【0023】
以下に更に例示されるように、バイサルファイト処理されたDNA試料は、酵素処理された試料と比較して、配列決定深さ(depth)の下端においてより広いCG範囲をもたらしたが、深さが増加するにつれて、バイサルファイト処理されたDNA試料においてカバーされたCGの数において、連続的かつ鋭い減少が見られた。対照的に、酵素処理された試料は、250~300を超える深さでさえ実質的に一定のカバレッジを示した。高深度では、メチル化感受性消化は、バイサルファイトと比較して有意に良好なCG適用範囲を提供した。メチル化感受性の消化は、非常に高い深さで数百万のCGの適用範囲を提供し、したがって、希少なメチル化シグナル、例えば、血漿中に非常に低い量、すなわち総無細胞DNAの1%又は更に少ない量、で存在し得る、腫瘍の初期段階における血漿中の腫瘍由来のメチル化DNA分子の検出を可能にした。データは、稀なシグナルの同定に必要とされる深さにおいて、バイサルファイトは十分なカバレッジを提供せず、かかる稀なシグナルは、少量のDNAに対してバイサルファイト配列決定を使用する場合に見逃される可能性が高いことを示した。
【0024】
本発明は更に、目的のゲノム遺伝子座のメチル化値を決定するための改善された方法を開示する。本発明によるメチル化分析は、制限遺伝子座、すなわち、アッセイにおいて使用される制限酵素の制限部位について実施される。本明細書に開示されるメチル化分析は、目的の制限遺伝子座を含有する少なくとも50bpの長さ、好ましくは少なくとも100bpの長さの所定のゲノム領域をカバーするアラインメントを分析すること、及び所定のゲノム領域をカバーする配列読み取りの読み取りカウントを決定することに基づく。かかるアラインメントは、少なくとも50bpの長さ(好ましくは少なくとも100bpの長さ)のDNA分子を表し、ここで、分析された制限遺伝子座、並びにDNA分子内の任意の追加の制限遺伝子座は、DNA試料において全てメチル化され、したがって、このDNA分子は、このアッセイにおいて使用される酵素での消化後に無傷なままであった。長さが少なくとも50又は少なくとも100bpであり、DNA試料中で全てメチル化された複数の制限遺伝子座を含むアラインメントを分析することは、がん関連過剰メチル化シグナルの特異性を増加させ、正常試料とがん性試料との間の差異の改善された、より正確な検出を可能にする。加えて、かかるアラインメントのコピー数はヌクレオソーム境界を反映するため、かかるアラインメントの分析は、メチル化に加えて無細胞DNAにおけるヌクレオソーム配置を評価するのに有利であり、ここで、高いコピー数はヌクレオソームの中央に典型的であり、低いコピー数はヌクレオソーム間の境界に典型的である。
【0025】
本発明は更に、DNA試料のメチル化感受性/非依存性制限後に生成された配列決定データに基づいて、DNAのメチル化レベル及び非メチル化レベルの両方を直接計算する方法を開示する。有利なことに、本発明の方法及びシステムは、単一のアッセイにおいて、同じ配列決定データに基づいて、DNAのメチル化レベル及び非メチル化レベルを独立して決定することを可能にし、したがって、メチル化変化の改善された同定を提供する。より詳細には、本明細書に開示される方法及びシステムは、いくつかの実施形態によれば、少なくとも1つのメチル化感受性制限エンドヌクレアーゼによるDNA試料の消化と、それに続く複数の配列読み取りを生成するハイスループット配列決定を含む。配列読み取りを参照ゲノムに対してアラインメントさせることができ、制限遺伝子座、すなわち、ゲノム内の制限部位を選択し、分析する。選択された制限遺伝子座におけるメチル化DNAのレベルは、各制限遺伝子座の読み取りカウントに基づいて決定され、読み取りカウントは、制限遺伝子座がメチル化され、したがって無傷のままであった試料中のDNA分子の数を表す。選択された制限遺伝子座における非メチル化DNAのレベルは、各制限遺伝子座内のヌクレオチドで開始又は終了する読み取りの数を決定することによって、配列読み取りの末端の特有の分析によって決定される。この読み取り数は、制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断された試料中のDNA分子の数を表す。かかる非メチル化DNA分子の直接分析は、既存の方法によって実施されるようなメチル化DNAのレベルに基づく間接的評価よりも有利である。同じ配列決定データを使用するメチル化に加えて非メチル化の直接決定は、ゲノム領域の相補的なメチル化情報を提供し、したがって、メチル化プロファイリングの改善、潜在的なDNAメチル化マーカーのより正確かつ有効な評価、及び試料間のメチル化の差異のより良好な検出を提供する。それはまた、メチル化分析の増加した感度を提供し、特に、非常に高い又は非常に低いメチル化レベルを有するゲノム領域に有益である。
【0026】
一態様によれば、本発明は、対象由来の無細胞DNA(cfDNA)試料の遺伝的及び後成的特性をプロファイリングするための方法を提供し、方法は、
(a)無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、非メチル化制限部位が切断されている制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)DNA分子の末端の配列情報を保存しながら、制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、配列決定ライブラリを調製することが、制限エンドヌクレアーゼ処理されたDNA中のDNA分子に配列決定アダプタをライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、配列決定ライブラリを配列決定して、配列決定データを提供することと、
(d)配列決定データから、少なくとも1つの制限遺伝子座のメチル化値、並びに任意選択で、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択される無細胞DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することと、を含み、
3000半数体当量を含む無細胞DNAの量が当該方法に十分であり、無細胞DNA試料がライブラリ調製の前に増幅に供されず、無細胞DNA試料のメチル化値及び少なくとも1つの追加の遺伝的又は後成的特性を決定することが、同じ配列決定データに基づいて実施される。
【0027】
別の態様によれば、本発明は、無細胞DNA試料を処理して、遺伝的分析及び後成的分析のための配列決定データを得るための方法を提供し、方法は、
(a)無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、非メチル化制限部位が切断されている制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)DNA分子の末端の配列情報を保存しながら、制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、配列決定ライブラリを調製することが、制限エンドヌクレアーゼ処理されたDNA中のDNA分子に配列決定アダプタをライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、配列決定ライブラリを配列決定して、配列決定データを得ることと、を含み、
3000半数体当量を含む無細胞DNAの量が、少なくとも85%のユニークマッピング率、未消化試料と比較して少なくとも0.65のピアソン相関によって特徴付けられるコピー数完全性、及び未消化試料と比較して少なくとも0.55のピアソン相関によって特徴付けられるヌクレオソームポジショニング完全性、のうちの少なくとも1つを達成するのに十分であり、
遺伝的及び後成的分析が、同じ配列決定データに基づいて実施される。
【0028】
いくつかの実施形態では、6,000の半数体当量を含む無細胞DNAの量は、本明細書に開示される方法に十分である。
【0029】
いくつかの実施形態では、無細胞DNAは血漿無細胞DNAであり、無細胞DNAの量は9~10mLの血液から得られる量である。
【0030】
いくつかの実施形態では、無細胞DNAの量は、10~200ngである。追加の実施形態では、無細胞DNAの量は、20~100ngである。
【0031】
いくつかの実施形態では、少なくとも1つのメチル化感受性制限エンドヌクレアーゼは、非平滑末端を生成し、方法は、配列決定のライゲーションの前に、制限エンドヌクレアーゼ処理されたDNAを末端修復に供して、平滑末端を有するDNA分子を得ることを更に含む。
【0032】
いくつかの実施形態では、ハイスループット配列決定は、全ゲノムハイスループット配列決定である。
【0033】
いくつかの実施形態では、ハイスループット配列決定は、標的のみを対象にしたハイスループット配列決定である。
【0034】
いくつかの実施形態では、少なくとも1つの制限遺伝子座のメチル化値を決定することは、
(i)少なくとも1つの制限遺伝子座を選択し、制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することと、
(ii)ステップ(i)において決定された読み取りカウント及び参照読み取りカウントに基づいて、少なくとも1つの制限遺伝子座のメチル化値を計算することと、を含む。
【0035】
いくつかの実施形態では、ステップ(i)は、制限遺伝子座を含有する少なくとも100bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することを含む。
【0036】
いくつかの実施形態では、少なくとも1つの制限遺伝子座は、複数の制限遺伝子座である。
【0037】
いくつかの実施形態では、少なくとも1つのメチル化感受性制限エンドヌクレアーゼは、複数のメチル化感受性制限エンドヌクレアーゼであり、複数のメチル化感受性制限エンドヌクレアーゼによる消化は、同時の消化である。
【0038】
いくつかの実施形態では、複数のメチル化感受性制限エンドヌクレアーゼは、HinP1Iを含む。追加の実施形態では、複数のメチル化感受性制限エンドヌクレアーゼは、AciIを含む。追加の実施形態では、消化は、HinP1I及びAciIを使用して実施される。いくつかの実施形態では、消化は、1:1~5:1(酵素単位)(Hinp:AciI)の比でHinP1I及びAcIIを使用して実施される。
【0039】
いくつかの実施形態では、無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供することは、消化効力を決定することと、消化効力が所定の閾値を上回る場合に配列決定ライブラリの調製に進むことと、を更に含む。
【0040】
別の態様によれば、本発明は、対象由来の無細胞DNA試料(cfDNA)におけるがん関連の遺伝的及び後成的変化を検出するための方法を提供し、方法は、本明細書に開示されるcfDNA試料のメチル化及び任意選択で少なくとも1つの追加の遺伝的及び後成的特性をプロファイリングして、cfDNA試料の遺伝的及び後成的プロファイルを得ることと、cfDNA試料の遺伝的及び後成的プロファイルを、がんプロファイル及び非がんプロファイルから選択される1つ以上の参照遺伝的及び後成的プロファイルと比較して、cfDNA試料におけるがん関連の遺伝的及び後成的変化を検出することと、を含む。
【0041】
いくつかの実施形態では、無細胞DNA試料は、がんを有することが疑われる、又はがんを有するリスクがある対象からのものであり、方法は、がん関連変化が検出された場合に、能動的ながん監視及び追跡検査を対象に施すことを更に含み、がん監視及び追跡検査は、血液検査、尿検査、細胞診、撮像、内視鏡検査、及び生検のうちの1つ以上を含む。
【0042】
追加の態様によれば、本発明は、対象におけるがんの存在又は非存在を評価するための方法を提供し、方法は、
(a)対象の無細胞DNA(cfDNA)試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、非メチル化制限部位が切断されている制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)制限エンドヌクレアーゼ処理されたDNAをハイスループット配列決定法によって配列決定することと、
(c)互いに150bp以内の腫瘍高メチル化制限遺伝子座及び腫瘍変異遺伝子座を含む少なくとも1つのマルチオミクスゲノム領域を選択することと、
(d)少なくとも1つのマルチオミクス領域をカバーする配列読み取りの分析に基づいて、対象ががんを有する可能性を決定することと、を含む。
【0043】
いくつかの実施形態では、少なくとも1つのマルチオミクス領域は、互いに100bp以内の腫瘍高メチル化制限遺伝子座及び腫瘍変異遺伝子座を含む。
【0044】
いくつかの実施形態では、少なくとも1つのマルチオミクス領域をカバーする配列読み取りの分析は、
-各マルチオミクス領域について、
(i)制限遺伝子座の全てのヌクレオチドを含み、変異遺伝子座に変異遺伝子型を提示する、マルチオミクス領域をカバーするメチル化変異配列読み取りの数、
(ii)制限遺伝子座の全てのヌクレオチドを含み、変異遺伝子座に野生型遺伝子型を提示する、マルチオミクス領域をカバーするメチル化野生型配列読み取りの数、
(iii)制限遺伝子座内のヌクレオチドで開始又は終了し、変異遺伝子座に変異遺伝子型を提示する、マルチオミクス領域をカバーする非メチル化変異配列読み取りの数、及び
(iv)制限遺伝子座内のヌクレオチドで開始又は終了し、変異遺伝子座に野生型遺伝子型を提示する、マルチオミクス領域をカバーする非メチル化野生型配列読み取りの数、のうちの少なくとも1つを決定することと、
-対象ががんを有する可能性を評価するために、(i)~(iv)において決定された読み取りの数をがん患者及び/又は健康な個体の基準値と比較することと、を含む。
【0045】
追加の態様によれば、本発明は、がんを有することが疑われるか又はがんを有するリスクがある対象の無細胞DNA(cfDNA)試料を特徴付けるための方法を提供し、方法は、
(a)無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)制限エンドヌクレアーゼ処理されたDNAをハイスループット配列決定法によって配列決定することと、
(c)互いに150bp以内の腫瘍高メチル化制限遺伝子座及び腫瘍変異遺伝子座を含む少なくとも1つのマルチオミクスゲノム領域を選択することと、
(d)各マルチオミクス領域について、
(i)制限遺伝子座の全てのヌクレオチドを含み、変異遺伝子座に変異遺伝子型を提示する、マルチオミクス領域をカバーするメチル化変異配列読み取りの数、
(ii)制限遺伝子座の全てのヌクレオチドを含み、変異遺伝子座に野生型遺伝子型を提示する、マルチオミクス領域をカバーするメチル化野生型配列読み取りの数、
(iii)制限遺伝子座内のヌクレオチドで開始又は終了し、変異遺伝子座に変異遺伝子型を提示する、マルチオミクス領域をカバーする非メチル化変異配列読み取りの数、及び
(iv)制限遺伝子座内のヌクレオチドで開始又は終了し、変異遺伝子座に野生型遺伝子型を提示する、マルチオミクス領域をカバーする非メチル化野生型配列読み取りの数、のうちの少なくとも1つを決定することと、を含み、
それにより、無細胞DNA試料を特徴付ける。
【0046】
別の態様によれば、本発明は、対象からのDNA試料のメチル化をプロファイリングするための方法を提供し、方法は、
(a)DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、配列決定ライブラリを調製することが、配列決定アダプタを制限エンドヌクレアーゼ処理されたDNA断片にライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、配列決定ライブラリを配列決定して、配列読み取りを得ることと、
(d)少なくとも1つの制限遺伝子座を選択し、制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することと、
(e)ステップ(d)において決定された読み取りカウント及び参照読み取りカウントに基づいて、少なくとも1つの制限遺伝子座のメチル化値を計算することと、を含み、
それにより、無細胞DNA試料のメチル化をプロファイリングする。
【0047】
いくつかの実施形態では、制限遺伝子座をカバーする所定の領域は、制限遺伝子座内の切断部位の少なくとも25bp上流で始まり、制限遺伝子座内の切断部位の少なくとも25bp下流で終了する。
【0048】
いくつかの実施形態では、ステップ(d)は、制限遺伝子座を含有する少なくとも100bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することを含む。いくつかの実施形態では、制限遺伝子座をカバーする所定の領域は、制限遺伝子座内の切断部位の少なくとも50bp上流で始まり、制限遺伝子座内の切断部位の少なくとも50bp下流で終了する。
【0049】
いくつかの実施形態では、少なくとも1つの制限遺伝子座は、CGアイランド内に位置する。
【0050】
いくつかの実施形態では、参照読み取りカウントは、未消化対照DNA試料中の制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域について決定された読み取りカウントであり、任意選択的に、配列決定深度差について補正される。
【0051】
いくつかの実施形態では、参照読み取りカウントは、制限エンドヌクレアーゼによって切断されない参照遺伝子座を含有する少なくとも50bpの長さの参照領域を使用して決定された読み取りカウントである。
【0052】
いくつかの実施形態では、参照読み取りカウントは、制限エンドヌクレアーゼによって切断されない参照遺伝子座を含有する少なくとも50bpの長さの複数の参照領域を使用して決定された平均読み取りカウントである。
【0053】
いくつかの実施形態では、メチル化値を計算することは、ステップ(d)において決定された読み取りカウントを、DNA試料の読み取りカウント中央値に対して正規化して、正規化読み取りカウントを得ることと、正規化読み取りカウントの正規化参照読み取りカウントに対する比を計算することとを含む。
【0054】
別の態様によれば、本発明は、DNA試料の遺伝的及び後成的プロファイリングのための方法であって、本明細書に開示される少なくとも1つの制限遺伝子座のメチル化値を決定することと、配列決定データから、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択されるDNA試料の少なくとも1つの追加の遺伝的又は後成的特性を更に決定することと、を含む方法を提供する。
【0055】
いくつかの実施形態では、DNAは、生体液試料から抽出された無細胞DNAである。追加の実施形態では、DNAは、腫瘍試料から抽出されたDNAである。
【0056】
追加の態様によれば、本発明は、DNAの第1の給源と第2の給源との間で差次的にメチル化されたゲノム領域を同定するための方法を提供し、方法は、
本明細書に開示される第1の給源からの少なくとも1つのDNA試料のメチル化をプロファイリングして、第1のDNAメチル化プロファイルを得ることと、
本明細書に開示される第2の給源からの少なくとも1つのDNA試料のメチル化をプロファイリングして、第2のDNAメチル化プロファイルを得ることと、
第1及び第2のDNAメチル化プロファイルを比較して、第1及び第2のDNAの給源の間で差次的にメチル化されたゲノム領域を同定することと、を含む。
【0057】
いくつかの実施形態では、第1のDNAの給源は、がんDNAであり、第2のDNAの給源は、非がんDNAである。いくつかの実施形態では、第1のDNAの給源は、がん患者の血漿無細胞DNAであり、第2のDNAの給源は、1人以上の健康な個体の血漿無細胞DNAである。追加の実施形態では、DNAの第1及び第2の給源は、がんの異なる段階のものである。
【0058】
更なる態様によれば、本発明は、対象からのDNA試料のメチル化をプロファイリングするための方法を提供し、方法は、
(a)対象由来のDNA試料を提供することと、
(b)DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供し、それによって、制限エンドヌクレアーゼにより生成されたDNA断片を含む制限エンドヌクレアーゼ処理されたDNAを得ることと、
(c)エンドヌクレアーゼ処理されたDNAのハイスループット配列決定を実施して、配列読み取りを得ることと、
(d)配列読み取りから、少なくとも1つの制限遺伝子座の読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化され、したがって無傷なままであったDNA試料中のDNA分子の数を表す、決定することと、
(e)配列読み取りから、少なくとも1つの制限遺伝子座内のヌクレオチドで終了する配列読み取りの読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す、決定することと、
(f)ステップ(d)で決定された少なくとも1つの制限遺伝子座の読み取りカウントに基づいて少なくとも1つの制限遺伝子座におけるメチル化DNAのレベルを計算し、ステップ(e)で決定された少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントに基づいて少なくとも1つの制限遺伝子座における非メチル化DNAのレベルを計算して、
それにより、DNA試料のメチル化をプロファイリングすることと、を含む。
【0059】
いくつかの実施形態では、ステップ(c)~(e)は、
複数の制限エンドヌクレアーゼ生成DNA断片にライゲーションされた配列決定アダプタを使用して、制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製し、配列決定ライブラリをハイスループット配列決定に供して、配列読み取りを得ることと、
複数の配列読み取りを参照ゲノムに対してマッピングして、マッピングされた配列読み取りを生成し、参照ゲノム内の少なくとも1つの制限遺伝子座を選択することと、
マッピングされた配列読み取りから、少なくとも1つの制限遺伝子座の読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化され、したがって無傷のままであったDNA試料中のDNA分子の数を表す、決定することと、
マッピングされた配列読み取りから、少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す、決定することと、を含む。
【0060】
いくつかの実施形態では、ハイスループット配列決定は、全ゲノムハイスループット配列決定である。他の実施形態では、ハイスループット配列決定は、標的のみを対象にしたハイスループット配列決定である。
【0061】
いくつかの実施形態では、参照ゲノムは、完全ヒトゲノムである。
【0062】
いくつかの実施形態では、DNAは、生体液試料から抽出された無細胞DNAである。いくつかの実施形態では、生体液試料は、血漿、血清、又は尿である。生物学的試料の各可能性は、本発明の別個の実施形態である。
【0063】
いくつかの態様では、DNAは、腫瘍試料から抽出されたDNAである。
【0064】
いくつかの実施形態では、少なくとも1つの制限遺伝子座におけるメチル化DNAのレベルを計算することは、ステップ(d)で決定された少なくとも1つの制限遺伝子座の読み取りカウントの、少なくとも1つの制限遺伝子座の予想読み取りカウントに対する比を計算することを含む。
【0065】
いくつかの実施形態では、少なくとも1つの制限遺伝子座における非メチル化DNAのレベルを計算することは、ステップ(e)で決定された少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントと、少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列の予想読み取りカウントと、の間の差を計算することと、その後、差を少なくとも1つの制限遺伝子座の予想読み取りカウントで割ることとを含む。
【0066】
いくつかの実施形態では、少なくとも1つの制限遺伝子座におけるメチル化DNAのレベルを計算することは、
ステップ(d)で決定された少なくとも1つの制限遺伝子座の読み取りカウントと、ステップ(e)で決定された少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントとを合計することと、次に、合計から、制限遺伝子座内のヌクレオチドで開始又は終了する配列の予想読み取りカウントを減算することと、によって総断片数を決定することと、
ステップ(d)において決定された少なくとも1つの制限遺伝子座の読み取りカウントを、総断片数によって除算することと、を含む。
【0067】
いくつかの実施形態では、少なくとも1つの制限遺伝子座における非メチル化DNAのレベルを計算することは、
本明細書に記載される総断片数を決定することと、
ステップ(e)で決定された少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントと、制限遺伝子座内のヌクレオチドで開始又は終了する配列の予想読み取りカウントと、の間の差を計算することと、
差を総断片数で割ることと、を含む。
【0068】
いくつかの実施形態では、予想読み取りカウントは、制限エンドヌクレアーゼによって切断されない、少なくとも1つの制限遺伝子座と同じ長さの参照遺伝子座を使用して決定される読み取りカウントである。
【0069】
いくつかの実施形態では、予想読み取りカウントは、制限エンドヌクレアーゼによって切断されない、少なくとも1つの制限遺伝子座と同じ長さの複数の参照遺伝子座を使用して決定された平均読み取りカウントである。
【0070】
いくつかの実施形態では、予想読み取りカウントは、未消化対照DNA試料中の少なくとも1つの制限遺伝子座について決定された読み取りカウントであり、任意選択的に、配列決定深度差について補正される。
【0071】
いくつかの実施形態では、少なくとも1つの制限遺伝子座は、複数の制限遺伝子座である。
【0072】
いくつかの実施形態では、少なくとも1つのメチル化感受性制限エンドヌクレアーゼは、複数のメチル化感受性制限エンドヌクレアーゼである。
【0073】
いくつかの態様では、メチル化をプロファイリングするための方法は、DNA試料のメチル化プロファイルを、1つ以上の参照メチル化プロファイルと比較することによって、DNA試料のメチル化プロファイルに基づいて対象における疾患の存在又は非存在を同定するステップを更に含む。
【0074】
いくつかの実施形態では、本方法は、メチル化プロファイルに基づいて紙又は電子形式でレポートを作成することと、そのレポートを対象及び/又は対象の医療提供者に伝達することと、を更に含む。
【0075】
別の態様によれば、本発明は、DNA試料におけるメチル化変化を検出するための方法を提供し、方法は、本明細書に開示されるようにDNA試料のメチル化をプロファイリングして、DNA試料のメチル化プロファイルを得ることと、DNA試料のメチル化プロファイルを1つ以上の参照メチル化プロファイルと比較して、DNA試料におけるメチル化変化を検出することと、を含む。
【0076】
いくつかの実施形態では、1つ以上の参照メチル化プロファイルは、健康なDNAメチル化プロファイルを含む。追加の実施形態では、1つ以上の参照メチル化プロファイルは、疾患DNAメチル化プロファイルを含む。いくつかの態様では、DNA試料は、疾患を有することが疑われる対象及び/又は疾患を発症するリスクがある対象に由来し、メチル化変化を検出するステップは、DNA試料が健康なDNA試料であるか又は疾患DNA試料であるかを決定することを含む。いくつかの実施形態では、疾患はがんである。
【0077】
追加の態様によれば、本発明は、DNAの第1の給源と第2の給源との間で差次的にメチル化されたゲノム領域を同定するための方法を提供し、方法は、
本明細書に開示される方法に従って第1の給源からの少なくとも1つのDNA試料のメチル化をプロファイリングして、第1のDNAメチル化プロファイルを得ることと、
本明細書に開示される方法に従って第2の給源からの少なくとも1つのDNA試料のメチル化をプロファイリングして、第2のDNAメチル化プロファイルを得ることと、
第1及び第2のDNAメチル化プロファイルを比較して、第1のDNAの給源と第2のDNAの給源との間で差次的にメチル化されたゲノム領域を同定することと、を含む。
【0078】
いくつかの実施形態では、第1のDNAの給源は、疾患DNAであり、第2のDNAの給源は、非疾患DNAである。追加の実施形態では、DNAの第1及び第2の給源は、疾患の異なる段階のものである。いくつかの実施形態では、疾患はがんである。
【0079】
追加の態様によれば、本発明は、DNA試料中の遺伝的及び後成的特性をプロファイリングするための方法を提供し、方法は、
本明細書に開示されるDNA試料のメチル化をプロファイリングすることと、
DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することであって、少なくとも1つの追加の遺伝的又は後成的特性が、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択される、決定することであって、
メチル化のプロファイリング及び少なくとも1つの追加の遺伝的又は後成的特性の決定が、同じ配列決定データを用いて行われ、
それにより、DNA試料の遺伝的及び後成的特性をプロファイリングする、決定することと、を含む。
本発明のこれら及び追加の態様及び特徴は明らかになるであろう。
【0080】
以下の詳細な説明、実施例及び特許請求の範囲から得られる。
【図面の簡単な説明】
【0081】
【
図1A】配列決定の前にメチル化感受性消化、バイサルファイト変換に供した、又は処理しなかった、プールされた血漿無細胞DNA試料のコピー数データ。データは、ゲノム位置当たりのヒット数(カウント)として提示する。
【
図1B】試験(処理)プール血漿無細胞DNA試料と対照(未処理)プール血漿無細胞DNA試料との間のヒットの相関。
【
図2A】配列決定の前にメチル化感受性消化、バイサルファイト変換に供した、又は処理しなかった、プールされた血漿無細胞DNA試料のヌクレオソームポジショニング。データは、「ヒットスパン100」(=分析されたゲノム位置の>50bp上流で開始し、>50bp下流で終了する読み取りの数)として提示する。
【
図2B】試験(処理)プール血漿無細胞DNA試料と対照(未処理)プール血漿無細胞DNA試料との間の「ヒットスパン100」の相関。
【
図3】配列決定前にメチル化感受性消化又はバイサルファイト変換に供した患者BMD LNG165(3A)及び患者BMD LNG166(3B)の血漿無細胞DNAのコピー数完全性。
【
図4】配列決定前にメチル化感受性消化又はバイサルファイト変換に供された患者BMD LNG165(4A)及び患者BMD LNG166(4B)の血漿無細胞DNAのヌクレオソームポジショニング完全性。データは、「ヒットスパン100」(=分析されたゲノム位置の>50bp上流で開始し、>50bp下流で終了する読み取りの数)として提示する。
【
図5】配列決定前にメチル化感受性消化又はバイサルファイト変換に供された患者BMD LNG165(5A)及び患者BMD LNG166(5B)の血漿無細胞DNAのCG深さ。
【
図6】DNAのメチル化感受性消化又はバイサルファイト変換を用いた、患者BMD LNG165及び患者BMD LNG166の血漿無細胞DNAにおける高メチル化マーカー遺伝子座の検出。
【
図7】DNAのメチル化感受性消化又はバイサルファイト変換を使用した、対照と比較した患者BMD LNG165の血漿無細胞DNA(7A)、及び対照と比較した患者BMD LNG166の血漿無細胞DNA(7B)における腫瘍変異の検出。
【
図8】遺伝的及び後成的プロファイリングのための試料調製。(8A)肺がん試料;(8B)対照試料。
【
図9】患者BMD LNG165(9A)及びBMD LNG166(9B)の臨床データ及びメチル化データ。
【
図10】患者BMD LNG165(10A)及びBMD LNG166(10B)のメチル化シグナルを有するメチル化遺伝子座。
【
図11】患者BMD LNG165(11A)及びBMD LNG166(11B)の変異データ。
【
図12】患者BMD LNG165内のマルチオミクス領域。
【
図14】メチル化感受性HinP1I部位の消化の前後及び末端修復の説明図。
【
図15】切断部位でメチル化又は非メチル化されている、HinP1I制限部位にわたるDNA分子の消化及び末端修復後に得られたDNA断片の図。
【
図16】本発明の実施形態による配列読み取りの分析。(16A)制限遺伝子座の読み取りカウント、(16B)制限遺伝子座内のヌクレオチドで開始する配列読み取りの読み取りカウント、(16C)制限遺伝子座内のヌクレオチドで終了する配列読み取りの読み取りカウント。
【
図17】例示的な遺伝子座CG#1(
図17A)、例示的な遺伝子座CG#4(
図17B)及び例示的な遺伝子座CG#5(
図17C)の、本発明の実施形態による配列読み取りの分析。
【
図18】本発明の実施形態による肺がん関連ゲノム領域におけるDNA試料のメチル化をプロファイリングするための例示的な方法を説明するフローチャート。
【
図19】本発明の実施形態による肺がん関連ゲノム領域におけるDNA試料のメチル化をプロファイリングするための追加の例示的な方法を説明するフローチャート。
【
図20】本発明の実施形態による、DNA試料が肺がんに対して陽性であるか陰性であるかを決定するための例示的な方法を説明するフローチャート。
【
図21】本発明の実施形態による、DNA試料が肺がんに対して陽性であるか陰性であるかを決定するための追加の例示的な方法を説明するフローチャート。
【発明を実施するための形態】
【0082】
本発明は、メチル化感受性/メチル化依存性制限酵素によるDNAの消化、それに続くハイスループット配列決定及び配列読み取りの分析を使用して、DNA試料、特に無細胞DNA試料の遺伝的及び後成的特性をプロファイリングするための方法及びシステムに関する。有利なことに、本発明の方法及びシステムは、高感度であるが正確であり、非常に少量のDNAで作業することを可能にし、一回のランからの配列決定データに基づいて、メチル化データ、変異データなどを含む膨大な量の情報を受け取る。
【0083】
注目すべきことに、非常に少量のDNAが使用され得る場合であっても、配列決定データの質、したがって、それから導き出され得る遺伝的及び後成的情報は非常に高く、がん関連変化の高感度かつ包括的な同定を可能にする。
【0084】
本明細書に開示される方法は、いくつかの実施形態によれば、天然末端(例えば、無細胞DNAのヌクレオソームポジショニング評価のため)及び本明細書に開示される制限酵素による消化後に生成される末端(例えば、DNA試料においてメチル化されていなかったDNA分子の分析のため)を含む、DNA分子の5’末端及び/又は3’末端における配列情報を保存することを必要とする。本発明によれば、DNA分子の末端における配列情報の保存、又は「末端保存」は、目的のゲノム領域を濃縮するための、及び/又は配列決定アダプタを導入するための、PCRを回避することを包含する。いくつかの特定の実施形態では、本発明による末端保存は、DNA分子のメチル化状態に関するDNA分子の末端における配列情報を保存することである。
【0085】
いくつかの実施形態では、本発明によるライブラリ調製は、末端保存様式で実施され、このことは、ライブラリ調製プロセスが、目的のゲノム領域を富化するため、及び/又は配列決定アダプタを導入するためのPCRを含まないことを示す。これらの実施形態によれば、ライブラリ調製は、ライゲーション(例えば、酵素的ライゲーション)を介して配列決定アダプタを付加することを含む。特定のゲノム領域の濃縮が所望される場合、これらの実施形態によるライブラリ調製は、捕捉剤を使用して目的のゲノム領域を濃縮することを含む。
【0086】
本発明の方法は、制限酵素アイソシゾマーの使用を必要とせず(ここで、酵素の一方は、制限部位のメチル化形態及び非メチル化形態の両方を認識するが、他方は、非メチル化形態のみを認識する)、又はメチル化感受性制限酵素及びメチル化非感受性制限酵素の組み合わせ使用を必要とする。
【0087】
また、本発明の方法は、消化後の特定のサイズ範囲のDNA断片のサイズ選択、又は配列決定後の特定のサイズ範囲を有する読み取りカウントのフィルタリングを必要とせず、又は使用しない。
【0088】
いくつかの実施形態では、本発明は、目的のゲノム遺伝子座のメチル化値を決定するための改善された方法を提供する。改善された方法は、目的の制限遺伝子座を含む、少なくとも50bpの長さ、好ましくは少なくとも100bpの長さの所定のゲノム領域をカバーする配列読み取りの読み取りカウントを決定することに基づく。
【0089】
いくつかの実施形態では、本発明は、高分解能DNAメチル化プロファイリングのためのシステム及び方法に関する。いくつかの実施形態では、本発明は、DNAメチル化の分析におけるメチル化感受性/メチル化依存性制限酵素及びハイスループット配列決定の使用を提供する。いくつかの特定の実施形態では、本発明は、メチル化及び非メチル化DNAレベルを直接計算するための、メチル化感受性/メチル化依存性制限酵素及びハイスループット配列決定の使用を提供する。
【0090】
ヒトゲノムのメチル化は、5-メチルシトシンの形で発生し、CpGジヌクレオチドとも呼ばれるCG配列の一部であるシトシン残基に限定される(他の配列の一部であるシトシン残基はメチル化されていない)。ヒトゲノムのCGジヌクレオチドにはメチル化されているものとそうでないものがある。更に、メチル化は細胞と組織に特異的であるため、特定のCGジヌクレオチドは、特定の細胞でメチル化され、同時に別の細胞ではメチル化されないか、特定の組織でメチル化され、同時に別の組織でメチル化されないことがあり得る。DNAメチル化は、遺伝子転写の重要な調節因子である。
【0091】
がんDNAのメチル化パターンは、正常なDNAのメチル化パターンとは異なり、一部の遺伝子座は高メチル化されているが、他の遺伝子座は低メチル化されている。いくつかの実施形態では、本発明は、がんに関連する差次的にメチル化された(例えば、過剰メチル化された)ゲノム遺伝子座の高感度検出のための方法及びシステムを提供する。
【0092】
いくつかの実施形態では、本発明は、対象由来の無細胞DNA(cfDNA)試料の遺伝的及び後成的特性をプロファイリングするための方法を提供し、方法は、
(a)無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)DNA分子の末端の配列情報を保存しながら、制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、配列決定ライブラリを調製することが、制限エンドヌクレアーゼ処理されたDNA中のDNA分子に配列決定アダプタをライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、配列決定ライブラリを配列決定して、配列決定データを提供することと、
(d)配列決定データから、少なくとも1つの制限遺伝子座のメチル化値、並びに任意選択で、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択される無細胞DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することと、を含み、
3000半数体当量を含む無細胞DNAの量が当該方法に十分であり、無細胞DNA試料がライブラリ調製の前に増幅に供されず、無細胞DNA試料のメチル化値及び少なくとも1つの追加の遺伝的又は後成的特性を決定することが、同じ配列決定データに基づいて実施される。
【0093】
いくつかの実施形態では、無細胞DNA試料を処理して、遺伝的及び後成的分析のための配列決定データを得るための方法であって
(a)無細胞DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)DNA分子の末端の配列情報を保存しながら、制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することであって、配列決定ライブラリを調製することが、制限エンドヌクレアーゼ処理されたDNA中のDNA分子に配列決定アダプタをライゲーションすることを含み、各アダプタが、消化されたDNA分子及び消化されていないDNA分子の両方にライゲーションすることができる、調製することと、
(c)ハイスループット配列決定法によって、配列決定ライブラリを配列決定して、配列決定データを得ることと、を含み、
3000半数体当量を含む無細胞DNAの量が、少なくとも85%のユニークマッピング率、未消化試料と比較して少なくとも0.65のピアソン相関によって特徴付けられるコピー数完全性、及び未消化試料と比較して少なくとも0.55のピアソン相関によって特徴付けられるヌクレオソームポジショニング完全性、のうちの少なくとも1つを達成するのに十分であり、
遺伝的及び後成的分析が、同じ配列決定データに基づいて実施される。
【0094】
本明細書中で使用される場合、3.3pgのDNAが、1半数体当量に対応する。
【0095】
いくつかの実施形態では、10ngのDNAが、本明細書に開示される方法に十分である。追加の実施形態では、20ngのDNAが、本明細書に開示される方法に十分である。追加の実施形態では、本明細書に開示される方法は、10~200ng、例えば、20~200ng、20~100ngの範囲(範囲内の各値を含む)のDNAの初期量を使用して実施される。各可能性は、別々の実施形態を表す。
【0096】
いくつかの実施形態では、3,000半数体当量が、本明細書に開示される方法に十分である。追加の実施形態では、6,000半数体当量が、本明細書に開示される方法に十分である。追加の実施形態では、本明細書に開示される方法は、3,000~60,000個の一倍体当量、例えば、6,000~60,000個の間の一倍体当量、6,000~30,000個の間の一倍体当量(範囲内の各値を含む)を含む初期量のDNAを使用して実施される。各可能性は、別々の実施形態を表す。
【0097】
いくつかの実施形態では、本明細書に開示される無細胞DNAの量は、少なくとも85%、少なくとも86%、少なくとも87%、少なくとも88%、少なくとも89%の固有のマッピング率を達成するのに十分である。各可能性は、別々の実施形態を表す。
【0098】
いくつかの実施形態では、本明細書に開示される無細胞DNAの量は、未消化試料と比較して少なくとも0.6、例えば、未消化試料と比較して少なくとも0.65、少なくとも0.66、少なくとも0.67、少なくとも0.68、少なくとも0.69のピアソン相関によって特徴付けられるコピー数完全性を達成するのに十分である。各可能性は、別々の実施形態を表す。
【0099】
いくつかの態様では、本明細書に開示される無細胞DNAの量は、未消化試料と比較して少なくとも0.55、例えば、未消化試料と比較して少なくとも0.56、少なくとも0.57、少なくとも0.58、少なくとも0.59のピアソン相関によって特徴付けられるヌクレオソームポジショニング完全性を達成するのに十分である。各可能性は、別々の実施形態を表す。
【0100】
いくつかの実施形態では、本発明は、対象由来のDNA試料のメチル化をプロファイリングするための方法を提供し、方法は、
(a)DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供して、メチル化制限部位が無傷であり、かつ、非メチル化部位が切断されている、制限エンドヌクレアーゼ処理されたDNAを得ることと、
(b)制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することと、
(c)ハイスループット配列決定法によって、配列決定ライブラリを配列決定して、配列読み取りを得ることと、
(d)少なくとも1つの制限遺伝子座を選択し、制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することと、
(e)ステップ(d)において決定された読み取りカウント及び参照読み取りカウントに基づいて、少なくとも1つの制限遺伝子座のメチル化値を決定することと、を含み、
それにより、無細胞DNA試料のメチル化をプロファイリングする。
【0101】
いくつかの実施形態では、DNA試料のメチル化のプロファイリングは、制限遺伝子座を含有する少なくとも60bpの長さの所定のゲノム領域、例えば、制限遺伝子座を含有する少なくとも70bp、少なくとも80bp、少なくとも90bp、少なくとも100bp、50~150bp、50~120bp、50~100bpの所定のゲノム領域をカバーする配列読み取りの数を決定することを含む。各可能性は、別々の実施形態を表す。
【0102】
いくつかの実施形態では、少なくとも1つの制限遺伝子座は、CGアイランド内に位置する。「CGアイランド」(又はCpGアイランド)は、目的の生物の全ゲノムに対して高いG/C含量及び高い頻度のCGジヌクレオチドを有するDNAの領域である。CGアイランドは典型的には200~3,000bpの長さであり、典型的には50%を超えるGC含量及び以下の観察されたものによって特徴付けられる:0.6より大きい予想CG比。より低いCG密度のゲノム領域は、「CGオーシャン」と呼ばれ、ゲノムの大部分を含む。
【0103】
いくつかの実施形態では、対象由来のDNA試料のメチル化をプロファイリングするための方法が提供され、方法は、(i)対象由来のDNA試料を少なくとも1つのメチル化感受性/依存性制限エンドヌクレアーゼによる消化に供することと、(ii)消化されたDNAをハイスループット配列決定法によって配列決定することと、を含み、方法は、単一のアッセイにおいて、同じ配列決定データに基づいて、DNAのメチル化レベル及び非メチル化レベルを独立して決定することができる。
【0104】
いくつかの実施形態では、対象由来のDNA試料のメチル化をプロファイリングするための方法が提供され、方法は、
(a)対象由来のDNA試料を提供することと、
(b)DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供し、それによって、制限エンドヌクレアーゼにより生成されたDNA断片を含む制限エンドヌクレアーゼ処理されたDNAを得ることと、
(c)エンドヌクレアーゼ処理されたDNAのハイスループット配列決定を実施して、複数の配列読み取りを得ることと、
(d)配列読み取りから、少なくとも1つの制限遺伝子座の読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化され、したがって無傷なままであったDNA試料中のDNA分子の数を表す、決定することと、
(e)配列読み取りから、少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す、決定することと、
(f)ステップ(d)で決定された少なくとも1つの制限遺伝子座の読み取りカウントに基づいて、少なくとも1つの制限遺伝子座におけるメチル化DNAのレベルを計算し、ステップ(e)で決定された少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントに基づいて、少なくとも1つの制限遺伝子座における非メチル化DNAのレベルを計算し、それによってDNA試料のメチル化をプロファイリングすることと、を含む。
【0105】
追加の実施形態では、対象由来のDNA試料のメチル化をプロファイリングするための方法が提供され、方法は、
(A)対象由来のDNA試料を提供することと、
(B)DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供し、それによって、複数の制限エンドヌクレアーゼ生成DNA断片を含む制限エンドヌクレアーゼ処理されたDNAを得ることと、
(C)制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製し、配列決定ライブラリをハイスループット配列決定に供して配列読み取りを得ることと、
(D)複数の配列読み取りを参照ゲノムに対してマッピングして、マッピングされた配列読み取りを生成し、参照ゲノム内の少なくとも1つの制限遺伝子座を選択することと、
(E)マッピングされた配列読み取りから、少なくとも1つの制限遺伝子座の読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化され、したがって無傷のままであったDNA試料中のDNA分子の数を表す、決定することと、
(F)マッピングされた配列読み取りから、少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す、決定することと、
(G)ステップ(E)で決定された少なくとも1つの制限遺伝子座の読み取りカウントに基づいて、少なくとも1つの制限遺伝子座におけるメチル化DNAのレベルを計算し、ステップ(F)で決定された少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントに基づいて、少なくとも1つの制限遺伝子座における非メチル化DNAのレベルを計算し、それによってDNA試料のメチル化をプロファイリングすることと、を含む。
【0106】
いくつかの実施形態では、対象由来のDNA試料のメチル化をプロファイリングするための方法であって、DNA試料を少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供することと、消化された試料のハイスループット配列決定を行うことと、少なくとも1つの制限遺伝子座の読み取りカウントを決定することと、読み取りカウントに基づいて少なくとも1つの制限遺伝子座におけるメチル化DNAのレベルを計算することとを含む方法において、改善は、
少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントを決定することであって、読み取りカウントは、少なくとも1つの制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す、決定することと、
少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントに基づいて、少なくとも1つの制限遺伝子座における非メチル化DNAのレベルを計算することと、
少なくとも1つの制限遺伝子座におけるメチル化DNA及び非メチル化DNAのレベルを使用して、DNA試料のメチル化をプロファイリングすることと、を含む。
【0107】
本明細書で使用される「複数」という用語は、「少なくとも2つ」又は「2つ以上」を指す。
【0108】
いくつかの実施形態では、対象における疾患の存在又は非存在を同定するための方法が提供され、方法は、本明細書に開示される対象由来のDNA試料のメチル化をプロファイリングすることと、DNA試料のメチル化プロファイルを1つ以上の参照メチル化プロファイルと比較することと、比較に基づいて、対象における疾患の存在又は非存在を決定することと、を含む。
【0109】
いくつかの実施形態では、本明細書に開示されるメチル化をプロファイリングすることを含む、DNA試料の給源を示すDNAメチル化マーカーを同定するための方法が提供される。追加の実施形態では、本明細書に開示されるようなメチル化をプロファイリングすることを含む、DNAメチル化マーカーの品質を評価するための方法が本明細書において提供される。いくつかの実施形態では、DNAメチル化マーカーは、疾患、例えばがんのタイプの存在又は非存在を示すマーカーである。追加の実施形態では、DNAメチル化マーカーは、疾患の病期、例えばがんの病期を示すマーカーである。追加の実施形態では、DNAメチル化マーカーは、組織のタイプ(例えば、肺組織、乳房組織、結腸組織など)を示すマーカーである。
【0110】
いくつかの実施形態では、DNA試料中の少なくとも1つの制限遺伝子座のメチル化及び非メチル化DNAレベルを直接決定するための、(i)少なくとも1つのメチル化感受性制限酵素及び/又は少なくとも1つのメチル化依存性制限酵素、並びに(ii)ハイスループット配列決定の使用が提供される。
【0111】
いくつかの実施形態では、DNA試料中の少なくとも1つの制限遺伝子座のメチル化及び非メチル化DNAレベルの直接決定によってDNA試料のメチル化をプロファイリングするための、(i)少なくとも1つのメチル化感受性制限酵素及び/又は少なくとも1つのメチル化依存性制限酵素、並びに(ii)ハイスループット配列決定、の使用であって、メチル化及び非メチル化DNAレベルの決定が同じ配列決定データに基づく、使用が提供される。
【0112】
いくつかの実施形態は、DNA試料中の少なくとも1つの制限遺伝子座のメチル化及び非メチル化DNAレベルの直接決定によってDNA試料のメチル化をプロファイリングするための、少なくとも1つのメチル化感受性制限酵素及び/又は少なくとも1つのメチル化依存性制限酵素によるDNA試料の消化、並びにハイスループット配列決定の後に生成される配列読み取り、の使用であって、メチル化及び非メチル化DNAレベルの決定が同じ配列決定データに基づく、使用が提供される。
【0113】
一般に、メチル化感受性制限酵素を用いて実施することができる実施形態は、代わりにメチル化依存性制限酵素を用いて行うことができ、それに応じて下流のステップが調整される。例えば、いくつかの実施形態では、ハイスループット配列決定及び配列読み取りの生成に続いて、本発明によるメチル化をプロファイリングするための方法は、少なくとも1つの制限遺伝子座を選択し、制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することと、所定のゲノム領域の読み取りカウント及び参照読み取りカウントに基づいてメチル化値を計算することと、を含み、計算されたメチル化値は、DNA試料中でメチル化されておらず、したがってメチル化依存性制限酵素による消化後に無傷のままであった分子の数を反映する。
【0114】
別の例として、いくつかの実施形態では、制限遺伝子座のメチル化DNAのレベルを計算するために、ハイスループット配列決定及び配列読み取りの生成に続いて、方法は、配列読み取りから、制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントを決定することであって、読み取りカウントが、制限遺伝子座がメチル化された、すなわち制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す、決定することと、制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの決定された読み取りカウントに基づいて、制限遺伝子座におけるメチル化DNAのレベルを計算することと、を含む。制限遺伝子座の非メチル化DNAのレベルを計算するために、いくつかの実施形態では、本方法は、配列読み取りから制限遺伝子座の読み取りカウントを決定することであって、読み取りカウントは、制限遺伝子座が非メチル化され、したがって無傷のままであったDNA試料中のDNA分子の数を表す、決定することと、制限遺伝子座の決定された読み取りカウントに基づいて制限遺伝子座における非メチル化DNAのレベルを計算することと、を含む。
【0115】
DNA試料
本発明による使用のためのDNA試料は、血液、血漿、血清、尿、脳脊髄液、精液、糞便、痰及び羊水などの生物学的流体試料を含む、核酸を得ることができる対象の任意の生物学的試料から得ることができる。各可能性は、本発明の個別の実施形態を表す。生物学的試料はまた、組織及び器官試料を含む。
【0116】
本発明による対象は、典型的には、ヒト対象である。対象は、特定の疾患を疑われている可能性がある。いくつかの実施形態では、対象は、目的の疾患を有すると診断される。他の実施形態では、対象は、目的の疾患を有さない健康な対象である。対象はまた、例えば、疾患の既往歴、遺伝的素因、及び/若しくは家族歴に基づいて疾患を発症するリスクがあってもよく、並びに/又は疾患の疑わしい臨床徴候を示す対象及び/若しくは他の以前のアッセイに基づいて、例えば、他のバイオマーカーの試験に基づいて疾患を有することが疑われる対象であってもよい。いくつかの実施形態では、対象は、疾患の再発のリスクがある。いくつかの実施形態では、対象は、疾患の少なくとも1つの症状又は特徴を示す。他の実施形態では、対象は無症候性である。
【0117】
いくつかの実施形態では、DNA試料は、生体液試料から抽出された無細胞DNAである。「無細胞DNA」(「cfDNA」と略される)という用語は、体液中を自由に循環し、無傷な細胞内に含有されないDNA分子を指す。cfDNAの起源は完全には理解されていないが、アポトーシス、壊死及び細胞からの能動的放出に関連すると考えられている。cfDNAは、正常細胞及び腫瘍細胞の両方によって放出される。cfDNAは高度に断片化されており、断片は典型的には長さが120~220bpの範囲であり、大部分は長さが150~180bpの範囲である。本明細書で使用される用語「無細胞DNA」は、対象の体内ですでに無細胞であるDNAを指すものと理解されるべきである。無細胞DNA試料について、「制限エンドヌクレアーゼ処理されたDNA」は、消化の結果として生成された断片、及び天然の無細胞DNA断片、例えば、アッセイで使用される酵素の認識配列を含まない無細胞DNA断片、及び全てメチル化され、したがって酵素によって切断されない酵素の1つ以上の認識配列を含む無細胞DNA断片を含むことを理解されたい。
【0118】
あるいは、DNA試料は、細胞から抽出されたDNA、例えば、組織若しくは臓器試料又は血液細胞から抽出されたDNAであってもよい。典型的には、DNAを抽出するために細胞溶解が必要とされる。DNAは、腫瘍試料又は健常組織から得られ得る。本明細書で使用される「腫瘍試料」は、手術によって切除された腫瘍全体又はその一部を包含する。「腫瘍試料」はまた、生検によって腫瘍から採取された試料、及びがん性であると疑われる病変又は組織から採取された試料を包含する。本発明による使用のための腫瘍試料には、新鮮な腫瘍試料並びに凍結/保存腫瘍試料が含まれる。
【0119】
細胞から抽出されたDNAについて、DNAをハイスループット配列決定に適した断片に断片化することは、本発明による少なくとも1つのメチル化感受性又はメチル化依存性制限エンドヌクレアーゼによる消化の前、後、又は間に実施して、下流の処理及び配列決定ライブラリの調製を単純化することができる。かかる断片化は、例えば、超音波処理を使用して、又はメチル化に対して非感受性である制限エンドヌクレアーゼ、すなわちメチル化状態にかかわらずその認識配列を切断する制限エンドヌクレアーゼを使用して行うことができる。CGジヌクレオチドを含まない認識配列を有する制限エンドヌクレアーゼを用いて実施することもできる。
【0120】
本発明は、全ゲノム配列決定並びに標的のみを対象にした配列決定(例えば、CpGアイランド、エクソン又は目的の特定の遺伝子座の配列決定)を包含する。標的のみを対象にした配列決定のために、目的のゲノム領域は、例えば、ビーズに付着した配列特異的プローブなどの捕捉剤を使用して濃縮される。典型的には、目的のゲノム領域の富化は、以下により詳細に記載されるように、本発明に従うメチル化感受性/非メチル化依存性消化の後、及び配列決定ライブラリ調製の後に実施される。いくつかの実施形態では、濃縮は、消化及びライブラリ調製の前に実施され得る。
【0121】
したがって、いくつかの実施形態では、本発明によるメチル化感受性又はメチル化依存性消化に供されるDNA試料は、未処理のDNA試料、すなわち、生物学的試料から抽出されたDNA試料である。他の実施形態では、DNA試料は、処理されたDNA試料であり、例えば、本発明による少なくとも1つのメチル化感受性又はメチル化依存性制限エンドヌクレアーゼによる消化の前に、対象となる特定の領域について濃縮され、かつ/又は断片化されてサイズが縮小されている。
【0122】
好ましくは、メチル化分析が実施されるDNA試料は、一本鎖DNA(ssDNA)を実質的に含まない。本明細書で使用される場合、「実質的にssDNAを含まない」又は「実質的にssDNAを欠く」は、7%未満のDNAがssDNAであり、好ましくは5%未満のDNAがssDNAであり、より好ましくは1%未満のDNAがssDNAである(つまり、DNAの少なくとも99%は二本鎖である)、DNA試料を示す。いくつかの実施形態では、DNA試料は、0.1%未満のssDNAを含む。いくつかの実施形態では、DNA試料は、0.01%未満のssDNAを含む。いくつかの実施形態では、DNA試料は、ssDNAを全く含まない(ssDNAを含まない)。ssDNAを実質的に含まないDNA試料を得るためのDNAの抽出は、例えば、本発明の出願人に譲渡された国際公開第2020/188561号に記載されている。本発明の方法での使用に適した無細胞DNAを抽出するための例示的なキットは、QIAamp(登録商標)Circulating Nucleic Acid Kit(QIAGEN、Hilden,Germany)である。細胞からDNAを抽出するための例示的なキットは、QIAamp(登録商標)Blood Mini Kitである。
【0123】
DNA消化
本発明によれば、抽出(及び任意選択で目的の領域の濃縮及び/又はサイズを減少させるための断片化)に続いて、DNAは、少なくとも1つのメチル化感受性制限エンドヌクレアーゼ及び/又は少なくとも1つのメチル化依存性制限エンドヌクレアーゼ、好ましくは同時に適用される複数のメチル化感受性制限エンドヌクレアーゼ(又は複数のメチル化依存性制限エンドヌクレアーゼ)による消化に供される。本明細書中で使用される場合、「同時に適用される制限エンドヌクレアーゼ」又は「同時消化」は、酵素が、別の酵素の適用の前に1つの酵素を不活性化することなく、活性形態で反応混合物中に一緒に存在することを意味する。
【0124】
例えば、1つ、2つ、3つ、4つ又は5つのメチル化感受性又はメチル化依存性制限エンドヌクレアーゼを使用することができる。アッセイにおいて使用されるエンドヌクレアーゼのそれぞれの数は、本発明の別個の実施形態を表す。
【0125】
いくつかの実施形態では、抽出されたDNA全体が消化ステップで使用される。いくつかの実施形態では、DNAは、消化を受ける前に定量されない。他の実施形態では、DNAは、その消化の前に定量化される。いくつかの実施形態では、DNAは、消化に供される第1のアリコートと、未消化対照として維持される第2のアリコートとに等分される。
【0126】
本明細書で「制限酵素」と互いに置換可能に使用される「制限エンドヌクレアーゼ」は、制限部位としても知られる、特定の認識配列又はその近くでDNAを切断する酵素を指す。制限部位は、通常4~8ヌクレオチド長であり、典型的にはパリンドロームである(すなわち、DNA配列は両方向で同じである)。
【0127】
「メチル化感受性」の制限エンドヌクレアーゼは、メチル化されていない場合にのみ、その認識配列を切断する制限エンドヌクレアーゼである(メチル化された部位は無傷のままである)。したがって、メチル化感受性制限エンドヌクレアーゼによるDNA試料の消化の程度は、メチル化レベルに依存し、メチル化レベルが高いほど、切断から保護され、したがって消化が少なくなる。メチル化感受性制限エンドヌクレアーゼで処理されたDNA試料は、無傷なメチル化部位及び切断された非メチル化部位によって特徴付けられる。100%の消化効率を必要とせず、したがって、いくつかの非メチル化部位が無傷なままであり得ることが理解されるべきである。いくつかの実施形態では、本発明の方法は、消化効率を決定することと、消化効率が所定の閾値/レベルを上回る場合に配列決定ライブラリの調製に進むこととを含む。
【0128】
「メチル化依存性」の制限エンドヌクレアーゼは、メチル化されている場合にのみ、その認識配列を切断する制限エンドヌクレアーゼである(非メチル化部位は無傷のままである)。したがって、メチル化依存性制限エンドヌクレアーゼによるDNA試料の消化の程度は、メチル化レベルに依存し、メチル化レベルが高いほど、より広範な消化がもたらされる。
【0129】
本発明による使用のためのメチル化感受性制限エンドヌクレアーゼは、AatII、Acc65I、AccI、Acil、ACII、Afel、Agel、Apal、ApaLI、AscI、AsiSI、Aval、AvaII、BaeI、BanI、BbeI、BceAI、BcgI、BfuCI、BglI、BmgBI、BsaAI、BsaBI、BsaHI、BsaI、BseYI、BsiEI、BsiWI、BslI、BsmAI、BsmBI、BsmFI、BspDI、BsrBI、BsrFI、BssHII、BssKI、BstAPI、BstBI、BstUI、BstZl7I、Cac8I、ClaI、DpnI、DrdI、EaeI、EagI、Eagl-HF、EciI、EcoRI、EcoRI-HF、FauI、Fnu4HI、FseI、FspI、HaeII、HgaI、HhaI、HincII、HincII、Hinfl、HinPlI、HpaI、HpaII、Hpyl66ii、Hpyl88iii、Hpy99I、HpyCH4IV、KasI、MluI、MmeI、MspAlI、MwoI、NaeI、NacI、NgoNIV、Nhe-HFI、NheI、NlaIV、NotI、NotI-HF、NruI、Nt.BbvCI、Nt.BsmAI、Nt.CviPII、PaeR7I、PleI、PmeI、PmlI、PshAI、PspOMI、PvuI、RsaI、RsrII、SacII、Sall、SalI-HF、Sau3AI、Sau96I、ScrFI、SfiI、SfoI、SgrAI、SmaI、SnaBI、TfiI、TscI、TseI、TspMI及びZraIからなる群から選択され得る。各可能性は、本発明の個別の実施形態を表す。いくつかの特定の実施形態では、少なくとも1つのメチル化感受性制限エンドヌクレアーゼは、HinP1Iを含む。追加の特定の実施形態では、少なくとも1つのメチル化感受性制限エンドヌクレアーゼは、HhaIを含む。更に追加の特定の実施形態では、少なくとも1つのメチル化感受性制限エンドヌクレアーゼは、AciIを含む。
【0130】
メチル化依存性制限エンドヌクレアーゼは、McrBC、McrA、及びMrrAからなる群から選択され得る。各可能性は、本発明の個別の実施形態を表す。
【0131】
いくつかの実施形態では、本発明のDNA試料は、単一のメチル化感受性制限エンドヌクレアーゼによる消化を受ける。いくつかの特定の実施形態では、メチル化感受性制限エンドヌクレアーゼは、HinP1Iである。追加の特定の実施形態では、メチル化感受性制限エンドヌクレアーゼは、HhaIである。追加の実施形態では、DNA試料は、2つのメチル化感受性制限エンドヌクレアーゼによる消化を受ける。
【0132】
いくつかの特定の実施形態では、メチル化感受性制限エンドヌクレアーゼHinP1I及びAciIが使用される。
【0133】
いくつかの実施形態では、DNA試料のメチル化をプロファイリングするための方法であって、DNA試料をメチル化感受性制限エンドヌクレアーゼHinP1I及びAciIによる消化に供することと、HinP1Iの少なくとも1つの制限遺伝子座及び/又はAciIの少なくとも1つの制限遺伝子座のメチル化を分析し、それによってDNA試料のメチル化をプロファイリングすることと、を含む方法が提供される。いくつかの態様では、本方法は、DNA試料をメチル化感受性制限エンドヌクレアーゼHinP1I及びAciIによる消化に供することと、HinP1Iの少なくとも1つの制限遺伝子座及び/又はAciIの少なくとも1つの制限遺伝子座のメチル化DNAのレベル及び任意で非メチル化DNAのレベルを決定し、それによってDNA試料のメチル化をプロファイリングすることと、を含む。いくつかの実施形態では、DNA試料は、生体液から抽出された無細胞DNAである。
【0134】
いくつかの実施形態では、HinP1I及びAciIは、1:1~5:1(酵素単位)(HInP:AciI)の比、例えば、2:1、2.5:1、3:1、3.5:1、4:1及び4.5:1(酵素単位)(Hinp:AciI)の比で、本発明の方法及びシステムとともに使用される。各可能性は、本発明の個別の実施形態を表す。いくつかの実施形態では、HinP1I及びAciIは、2:1~4.5:1(酵素単位)(HInP:AciI)の比で、本発明の方法に使用される。
【0135】
いくつかの実施形態では、DNA試料におけるメチル化変化を検出するための方法であって、HinP1I及びAciI消化を使用してDNA試料のメチル化をプロファイリングすることと、メチル化プロファイルを1つ以上の参照メチル化プロファイルと比較することとを含む方法が提供される。いくつかの実施形態では、DNA試料は、生体液から抽出された無細胞DNAである。
【0136】
いくつかの実施形態では、DNA試料のメチル化をプロファイリングするための方法が提供され、方法は、DNA試料をメチル化感受性制限エンドヌクレアーゼHinP1I及びAciIによる消化に供し、それによって、制限エンドヌクレアーゼによって生成されたDNA断片を含む制限エンドヌクレアーゼ処理されたDNAを得ることと、エンドヌクレアーゼ処理されたDNAのハイスループット配列決定を実施して、複数の配列読み取りを得ることと、配列読み取りから、HinP1Iの少なくとも1つの制限遺伝子座及び/又はAciIの少なくとも1つの制限遺伝子座のメチル化DNAのレベル及び任意選択的に非メチル化DNAのレベルを決定し、それによってDNA試料のメチル化をプロファイリングすることと、を含む。いくつかの実施形態では、DNA試料は、生体液から抽出された無細胞DNAである。
【0137】
いくつかの実施形態では、生体液から抽出されたヒト無細胞DNAと、メチル化感受性制限エンドヌクレアーゼHinP1I及びAciIと、を含む反応混合物が提供される。反応混合物は更に、HinP1I及びAciIの活性に適した緩衝液を含む。いくつかの実施形態では、HinP1I及びAciIは、1:1~5:1(酵素単位)(Hinp:AciI)の比で、例えば、2:1、2.5:1、3:1、3.5:1、4:1及び4.5:1(酵素単位)(Hinp:AciI)の比で、反応混合物中に存在する。各可能性は、本発明の個別の実施形態を表す。いくつかの実施形態では、反応混合物は、HinP1I及びAciIを2:1~4.5:1(酵素単位)(Hinp:AciI)の比で含む。
【0138】
いくつかの実施形態では、遺伝的及び後成的分析のために無細胞DNA試料を処理する方法が提供され、方法は、本明細書に開示される反応混合物を提供することと、反応混合物をインキュベートして、メチル化制限部位が無傷であり、非メチル化制限部位が切断されている制限エンドヌクレアーゼ処理無細胞DNAを得ることと、制限エンドヌクレアーゼ処理無細胞DNAをハイスループット配列決定に供することと、を含む。
【0139】
消化効率は、試験試料に対して内部的に、又は外部的に評価することができる。内部評価は、遍在的にメチル化されていないことが知られているゲノム位置の無傷な切断部位を測定することによって行うことができる。かかる遺伝子座の例は、ミトコンドリアDNA上の任意の部位であり得る。消化効率の外部評価は、非メチル化試料を消化ステップに含め、両方の試料を並行して消化し、次いで非メチル化試料が実際に消化されたことを検証する(無傷な切断部位の数を測定することによって)ことによって行うことができる。かかる非メチル化試料は、例えば、PCRアンプリコン、プラスミドDNA、市販の非メチル化DNA種、又は特定のゲノム位置において非メチル化されていることが知られている細胞株DNAであり得る。あるいは、消化効率の外部評価は、非メチル化試料を調査試料に添加し、調査試料と同じステップで非メチル化DNA試料の消化を測定することによって、単一ステップで実施することができる。この目的のために、上記の全てのタイプの非メチル化DNA種を使用することが可能である。いくつかの実施形態では、小さな標的(例えば、PCRアンプリコン又はプラスミドDNA)の使用が好ましい。
【0140】
いくつかの実施形態では、DNA消化は、完全に消化するまで実施され得る。いくつかの実施形態では、メチル化感受性制限エンドヌクレアーゼはHinP1I及び/又はAciIであり得、完全な消化は37℃での酵素との1~2時間のインキュベーション後に達成され得る。
【0141】
ライブラリの調製及び配列決定
「ハイスループット配列決定」(「次世代配列決定」とも呼ばれる)は、多数(典型的には数千から数十億)の核酸配列を並行して決定する方法を使用する配列決定を含む。ハイスループット配列決定は、一般に、3つの基本的なステップ、すなわちライブラリ調製、配列決定及びデータ分析、を含む。ハイスループット配列決定技術の例としては、合成による配列決定及びライゲーションによる配列決定(例えば、Illumina Inc.、Life Technologies Inc.、Rocheによって採用される)、ナノポア配列決定法、及びIon Torrent(商標)技術(Life Technologies Inc.)などの電子検出に基づく方法が挙げられる。
【0142】
主要なハイスループット配列決定プラットフォームのためのライブラリ調製は、配列決定されるDNAの断片への特異的アダプタオリゴヌクレオチドのライゲーションを必要とする。本明細書中に開示されるように、制限消化は、好ましくは、酵素によるアダプタの可能な消化を回避するために、アダプタライゲーションの前に実施される。本明細書に開示されるメチル化感受性/依存性制限エンドヌクレアーゼによるDNAの消化は、典型的には、均一な平滑末端断片をもたらさない。したがって、末端修復は、各DNA分子がオーバーハングを含まず、5’リン酸基及び3’ヒドロキシル基を含有することを確実にするために必要である。典型的な平滑化酵素混合物は、ポリメラーゼ及びポリヌクレオチドキナーゼ、例えば、T4 DNAポリメラーゼ及びT4ポリヌクレオチドキナーゼ(polynucleotide kinase、PNK)を含む。T4 DNAポリメラーゼ(dNTPの存在下)は、5’オーバーハングを充填し、3’オーバーハングをdsDNA界面までトリミングして平滑末端を生成することができる。次いで、T4 PNKは、5’末端ヌクレオチドをリン酸化することができる。Illuminaライブラリについては、平滑化されたDNA断片の3’末端への非テンプレート化デオキシアデノシン5’-一リン酸(dAMP)の組み込み(dAテーリングとして公知のプロセス)もまた、ライブラリ調製のために必要とされる。dAテールは、下流のライゲーションステップ中のコンカテマー形成を防止し、DNA断片が相補的dTオーバーハングを有するアダプタオリゴヌクレオチドにライゲーションされることを可能にする。
【0143】
本明細書に開示されるように、「配列決定アダプタ」とも呼ばれるアダプタオリゴヌクレオチドは、リガーゼ酵素が配列決定アダプタをDNA断片に共有結合させて完全なライブラリ分子を作製する酵素的ライゲーションなどの末端保存法を使用してDNA断片にライゲーションされる。配列アダプタは、配列決定ライブラリの各DNA断片の5’及び3’末端にライゲーションされる。配列決定アダプタには通常、特定のシーケンサーによる断片認識のためのプラットフォーム固有の配列、例えば、ライブラリ断片をIlluminaプラットフォームのフローセルに結合可能にする配列が含まれる。各解列決定機器のプロバイダーは通常、この目的のために特定の配列セットを使用する。
【0144】
配列決定アダプタはまた、試料インデックスを含み得る。「試料インデックス」、またの名を「試料バーコード」は、複数の試料を同じ機器フローセル又はチップ上で一緒にシーケンス(つまり多重化)できるようにする配列である。各試料インデックス(通常は6~10塩基)は、特定の試料ライブラリに固有であり、データ分析中に逆多重化して個々の配列読み取りを正確な試料に割り当てるために使用される。配列決定アダプタには、組み合わせるライブラリの数と所望の精度のレベルに応じて、シングル又はデュアルの試料インデックスが含まれ得る。
【0145】
配列決定アダプタは、固有の分子識別子(unique molecular identifier、UMI)を含み得る。UMIは、配列決定中に分子追跡、エラー修正及び精度の向上を提供する分子バーコードの一種である。UMIは、典型的には5~20塩基長の短い配列であり、試料ライブラリ中の各分子をユニークにタグ付けするために使用される。出発材料中の各核酸は固有の分子バーコードでタグ付けされているため、バイオインフォマティクスソフトウェアは、高レベルの精度で重複読み取り及びPCRエラーをフィルタリングして除去し、固有の読み取りを報告し、最終的なデータ分析の前に同定されたエラーを除去することができる。
【0146】
いくつかの実施形態では、試料バーコード配列及びUMIの両方が、核酸標的分子に組み込まれる。
【0147】
本明細書に開示される方法は、消化されたDNA分子対未消化DNA分子の示差的アダプタのタグ付け(すなわち、メチル化DNA分子対非メチル化DNA分子の示差的アダプタタグ付け)を必要とせず、混合物中の任意のアダプタが消化されたDNA及び未消化DNAの両方にライゲーションすることができるように、同じアダプタ集団が試料全体に使用される。
【0148】
本発明によるハイスループット配列決定は、Novaseq(商標)、Nextseq(商標)及びMiSeq(商標)(Illumina)、454 Sequencing(Roche)、Ion Chef(商標)(ThermoFisher)、SOLiD(登録商標)(ThermoFisher)及びSequel II(商標)(Pacific Biosciences)を含むがこれらに限定されない、様々なハイスループット配列決定機器及びプラットフォームを使用して実施することができる。適切なプラットフォーム設計の配列決定アダプタが、配列決定ライブラリを調製するために使用される。
【0149】
いくつかの実施形態では、全ゲノム配列決定は、エンドヌクレアーゼ処理されたDNAから調製されたライブラリに対して実施される。ライブラリは、使用される配列決定プラットフォームに適した配列決定アダプタを使用して調製される。
【0150】
他の実施形態では、エンドヌクレアーゼ処理されたDNA中の目的の領域は、例えば、溶液相又は固相ハイブリダイゼーションに基づくプロセスを使用して捕捉され、続いてハイスループット配列決定され得る。目的の領域の濃縮とそれに続くハイスループット配列決定は、本明細書において「標的のみを対象にしたハイスループット配列決定」と称される。標的のみを対象にしたハイスループット配列決定は、例えば、CpGアイランド配列決定及びエクソーム配列決定を含む。標的のみを対象にしたハイスループット配列決定はまた、特定の有益なゲノム領域、例えば、がん組織と非がん組織との間で差次的にメチル化されることが知られている領域の配列決定を含む。標的のみを対象にした配列決定のためのゲノム領域の捕捉は、典型的には、ライブラリ調製後に実施される。いくつかの実施形態では、本明細書に開示される方法は、目的のゲノム領域を濃縮することを含む。DNA試料中のDNA断片の末端を保存するために(例えば、制限遺伝子座内のヌクレオチドで開始又は終結する配列の分析を可能にするために)、本発明による富化は、典型的には、目的のゲノム領域のPCR増幅を使用して行われない。
【0151】
いくつかの実施形態では、本発明によるDNA試料の遺伝的及び後成的プロファイリングのための方法は、
生物学的試料からDNAを抽出することと、
抽出されたDNAを少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供し、それにより制限エンドヌクレアーゼ処理されたDNAを得ることと、
制限エンドヌクレアーゼ処理されたDNAにおいてDNA断片にライゲーションされた配列決定アダプタを使用して、制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することと、
捕捉剤を用いて配列決定ライブラリから少なくとも1つ(好ましくは複数)の目的のゲノム領域を濃縮して、少なくとも1つ(好ましくは複数)の目的のゲノム領域が濃縮された配列決定ライブラリを得ることと、
少なくとも1つの(好ましくは複数の)目的のゲノム領域が濃縮された配列決定ライブラリをハイスループット配列決定に供することと、
配列決定データから、少なくとも1つの制限遺伝子座のメチル化値、並びに任意選択で、本明細書に開示されるDNA変異、コピー数多型及びヌクレオソームポジショニングから選択される無細胞DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することと、を含む。
【0152】
いくつかの実施形態では、本発明によるメチル化をプロファイリングするための方法は、
生物学的試料からDNAを抽出することと、
抽出されたDNAを少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化に供し、それにより制限エンドヌクレアーゼ処理されたDNAを得ることと、
制限エンドヌクレアーゼにより生成したDNAにおいてDNA断片にライゲーションされた配列決定アダプタを使用して、制限エンドヌクレアーゼ処理されたDNAから配列決定ライブラリを調製することと、
捕捉剤を用いて配列決定ライブラリから少なくとも1つ(好ましくは複数)の目的のゲノム領域を濃縮して、少なくとも1つ(好ましくは複数)の目的のゲノム領域が濃縮された配列決定ライブラリを得ることと、
少なくとも1つ(好ましくは複数)の目的のゲノム領域で富化された配列決定ライブラリをハイスループット配列決定に供して、配列読み取りを得ることと、
本明細書に開示されるように、目的のゲノム領域内の少なくとも1つの制限遺伝子座のメチル化DNAのレベル及び非メチル化DNAのレベルを決定することと、を含む。
【0153】
配列読み取りの分析
いくつかの実施形態では、「配列読み取り」(又は単に「読み取り」)、すなわち、配列決定プロセスによって生成されたヌクレオチド配列は、参照ゲノムに対してマッピングされる。本明細書で使用される「参照ゲノム」は、種又は対象の代表例として組み立てられた、部分的であるか完全であるかにかかわらず、以前に同定されたゲノム配列を指す。参照ゲノムは典型的には一倍体であり、典型的には種の単一個体のゲノムを表さず、むしろいくつかの個体のゲノムのモザイクである。本発明の方法のための参照ゲノムは、典型的にはヒト参照ゲノムである。いくつかの実施形態では、参照ゲノムは、National Center for Biotechnology Information(NCBI)又はUniversity of California,Santa Cruz(UCSC)ゲノムブラウザのウェブサイトで入手可能なヒトゲノムアセンブリなどの完全ヒトゲノムである。ヒト研究のための適切な参照ゲノムの例は、「hg18」ゲノムアセンブリである。代替案として、より最近のGRCh38主要アセンブリを使用することができる(パッチp13まで)。
【0154】
読み取りマッピングは、参照ゲノム内の読み取りの位置を同定するために、参照ゲノム上で読み取りをアラインメントさせるプロセスである。アラインメントする配列読み取りは、「マッピング」されていると指定される。アラインメントプロセスは、アラインメント中の様々な配列にわたって配列同一性の領域を得る可能性を最大化し、読み取りの2つの末端上のいくつかの短い断片のミスマッチ、インデル及び/又はクリッピングを可能にすることを目的とする。目的の特定のゲノム遺伝子座にマッピングされた読み取りの数は、本明細書において、このゲノム遺伝子座の「読み取りカウント」又は「コピー数」と称される。コンピュータソフトウェアを使用して、配列読み取りを分析し、参照ゲノムに対して配列読み取りをマッピングし、読み取りの数を定量化することができる。
【0155】
本明細書で使用される「ゲノム遺伝子座」又は「遺伝子座」という用語は互いに置換可能であり、染色体上の特定の位置にあるDNA配列を指す。「遺伝子座」は、単一の位置(ゲノム中の規定された位置における単一のヌクレオチド)、又はゲノム中の規定された位置で開始及び終了するヌクレオチドのストレッチを含み得る。特定の位置は、分子の位置によって、つまり染色体上の開始及び終了塩基対の数によって同定できる。所与のゲノム位置にあるDNA配列のバリアントは、対立遺伝子と呼ばれる。遺伝子座の対立遺伝子は、相同染色体の同一部位に位置する。ゲノムの遺伝子座には、遺伝子配列並びに他の遺伝的要素(遺伝子間配列など)が含まれる。
【0156】
「制限遺伝子座」は、本明細書において、本発明による消化ステップにおいて適用されるメチル化感受性/非依存性制限エンドヌクレアーゼの制限部位であるゲノム遺伝子座を説明するために使用される。本発明による制限遺伝子座は、正常なDNA及び疾患DNAの間で差次的にメチル化され得るが、これは、分析が実施される所与の疾患、例えば、特定のタイプのがんについて、制限遺伝子座が、正常なDNA及びがん細胞由来のDNAの間でメチル化レベルが異なることを意味する。例えば、がん細胞からのDNAは、正常な非がん性DNAと比較して、制限遺伝子座でのメチル化レベルが増加している可能性がある。より具体的には、制限遺伝子座は、正常な非がん性DNAと比較してがんのDNAでよりメチル化されているCGジヌクレオチドを含有する。本発明によれば、異なってメチル化されたCGジヌクレオチドは、消化ステップで適用される少なくとも1つの制限酵素の認識部位内に位置する。
【0157】
いくつかの実施形態では、本発明による制限遺伝子座は、健康な対象の無細胞DNAよりも特定のタイプのがんを有する対象の無細胞DNA、例えば血漿DNAにおいてよりメチル化されているCGジヌクレオチドを含有する。いくつかの実施形態では、がん患者の血漿試料は、健常対象の血漿試料と比較して、制限遺伝子座においてメチル化されているDNA分子をより高い割合で含有する。
【0158】
追加の実施形態では、本発明に従う制限遺伝子座は、非がん性組織由来のDNAよりもがん性組織(例えば、腫瘍試料)由来のDNAにおいてよりメチル化されているCGジヌクレオチドを含み、これは、がん性組織において、非がん性組織と比較してより大きな割合のDNA分子がこの位置でメチル化されていることを意味する。
【0159】
メチル化感受性制限酵素は、メチル化されていない場合にのみ、その認識配列を切断する。メチル化依存性制限酵素は、メチル化されている場合にのみ、その認識配列を切断する。したがって、試料間のメチル化レベルの差は、消化の程度の差をもたらし、その後、後続の配列決定及び定量化ステップにおける配列読み取りの量が異なる。かかる差異は、異なる試料由来のDNA間、例えば、がんを有する被験体由来のDNA試料と健康な被験体由来のDNA試料との間の区別を可能にする。
【0160】
制限遺伝子座の「メチル化DNAのレベル」、「メチル化レベル」又は「メチル化値」という用語は、試料中の制限遺伝子座を含むDNA分子の総数のうち、この制限遺伝子座でメチル化されている(すなわち、制限遺伝子座内のCGジヌクレオチドでメチル化されている)DNA分子の数を表す数値である。いくつかの実施形態では、制限遺伝子座のメチル化DNAのレベルは、本明細書において、少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化後の制限遺伝子座の読み取りカウントから計算される。追加の実施形態では、制限遺伝子座のメチル化DNAのレベルは、本明細書において、制限遺伝子座を含有する少なくとも50bpの所定のゲノム領域の読み取りカウントから計算される。メチル化感受性制限エンドヌクレアーゼは、それらの認識配列がメチル化されていない場合にのみ認識配列を切断するため、制限遺伝子座の読み取りカウントは、制限遺伝子座がメチル化され、したがって無傷のままであったDNA試料中のDNA分子の数を表す。
【0161】
いくつかの実施形態は、制限遺伝子座のメチル化レベルは、制限遺伝子座の読み取りカウント、又は制限遺伝子座を含有する少なくとも50bpの所定のゲノム領域の読み取りカウントを、制限遺伝子座又は制限遺伝子座を含有する少なくとも50bpの所定のゲノム領域の予想読み取りカウントで割ることによって計算される。制限遺伝子座/所定のゲノム領域の予想される読み取りカウントは、例えば、(i)制限エンドヌクレアーゼによって切断されない、制限遺伝子座/ゲノム領域と同じ長さの参照遺伝子座/ゲノム領域の読み取りカウント、(ii)制限エンドヌクレアーゼによって切断されない、制限遺伝子座/ゲノム領域と同じ長さの複数の参照遺伝子座/ゲノム領域の平均読み取りカウント、又は(iii)未消化対照DNA試料中の制限遺伝子座/所定のゲノム領域の読み取りカウントであって、任意選択的に、配列決定深度差について補正された読み取りカウント、を使用して決定され得る。例示的な計算は、本明細書の以下の実施例のセクションに記載されている。
【0162】
追加の実施形態では、メチル化レベルは、制限遺伝子座の読み取りカウント及び制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントから決定される総断片数を決定することによって計算される。例示的な計算は、本明細書の以下の実施例のセクションに記載されている。
【0163】
いくつかの実施形態は、メチル化レベルは、メチル化のパーセンテージ(%)として表され、試料中の制限遺伝子座を含有するDNA分子の総数のうち、制限遺伝子座においてメチル化されているDNA分子のパーセンテージを表す。
【0164】
制限遺伝子座の「非メチル化DNAのレベル」又は「非メチル化レベル」という用語は、試料中の制限遺伝子座を含むDNA分子の総数のうち、この制限遺伝子座においてメチル化されていない(すなわち、制限遺伝子座内のCGジヌクレオチドにおいてメチル化されていない)DNA分子の数を表す数値である。本明細書に開示されるように、制限遺伝子座の非メチル化DNAのレベルは、少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる消化及び任意のその後の末端修復後の、制限遺伝子座内のヌクレオチドで開始又は終了する読み取りの数から計算される。配列読み取りが開始又は終了する制限遺伝子座内の正確なヌクレオチドは、消化ステップで使用される制限エンドヌクレアーゼのタイプ及びその認識配列の長さに依存する。例えば、5’オーバーハングを有する非平滑末端を生成する制限エンドヌクレアーゼについて、消化及び末端修復は、認識配列の2番目のヌクレオチドで始まる断片及び認識配列の最後から2番目のヌクレオチドで終了する断片を生じる。例えば、5’オーバーハングを有する非平滑末端を生成する4塩基カッターについて、消化及び末端修復は、認識配列の第2のヌクレオチドで開始する断片及び認識配列の第3のヌクレオチドで終了する断片を生じる(
図15)。したがって、5’オーバーハングを有する非平滑末端を生成する制限エンドヌクレアーゼについて、その制限遺伝子座の「開始」分析は、制限遺伝子座の2番目のヌクレオチド(認識配列の2番目のヌクレオチド)で開始する配列読み取りに対して行われ、「終了」分析は、制限遺伝子座の最後から2番目のヌクレオチド(認識配列の最後から2番目のヌクレオチド)で終了する配列読み取りに対して実施される。
【0165】
メチル化感受性制限エンドヌクレアーゼは、それらの認識配列がメチル化されていない場合にのみ認識配列を切断するため、制限遺伝子座内のヌクレオチドで開始又は終了する読み取りの数は、制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す。
【0166】
本明細書中に開示されるような制限エンドヌクレアーゼによって切断される各DNA分子は、2つの断片(一方は、制限遺伝子座内のヌクレオチドで開始し、他方は、制限遺伝子座内のヌクレオチドで終結する)を生じる。したがって、所与のDNA分子について、2つの異なる配列読み取りを得ることが可能であり得る。試料中に存在した非メチル化DNA分子の数の正確な分析のために、非メチル化のレベルは、制限遺伝子座で開始する配列読み取りの数、制限遺伝子座で終了する配列読み取りの数に基づいて、又は2つの値の間の平均によって計算され得るが、値の合計には基づいていない。本明細書に開示されるように、制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントに基づいて制限遺伝子座における非メチル化DNAのレベルを計算することは、2つの値の間の平均を使用して非メチル化DNAのレベルを計算することを包含する。
【0167】
いくつかのライブラリ調製方法は、続いて配列決定されない小さな断片の枯渇を生じ得ることが更に注目される。かかる枯渇は、非メチル化レベルの過小評価及びメチル化レベルの過大評価をもたらし得る。加えて、制限遺伝子座で開始する配列読み取りの数は、制限遺伝子座で終了する配列読み取りの数と異なり得る。本発明は、かかるライブラリ調製バイアスに有利に対処する。このバイアスを低減し、より正確な結果を達成するために、制限遺伝子座で開始する読み取りの数及び制限遺伝子座で終了する読み取りの数の両方を決定し、その後、追加の分析及び計算のためにより多くの読み取り数を提供する配向を選択するか、又は2つの値の間の平均を計算し、追加の分析及び計算のために平均を使用することが好ましい。
【0168】
したがって、いくつかの実施形態では、本発明の方法は、制限遺伝子座内のヌクレオチドから始まる配列読み取りの数を決定することと、制限遺伝子座内のヌクレオチドで終了する配列読み取りの数を決定することと、より多数の配列読み取りを提供する配向を使用して、制限遺伝子座における非メチル化DNAのレベルを計算することと、を含む。追加の実施形態では、本発明の方法は、制限遺伝子座内のヌクレオチドから始まる配列読み取りの数を決定することと、制限遺伝子座内のヌクレオチドで終了する配列読み取りの数を決定することと、2つの値の間の平均を計算することと、平均を使用して、制限遺伝子座における非メチル化DNAのレベルを計算することと、を含む。
【0169】
制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの数は、制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの予想数を減算することによって正規化され得る。制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの予想数は、例えば、以下を使用して決定され得る:(i)制限エンドヌクレアーゼによって切断されない、制限遺伝子座と同じサイズの参照遺伝子座で開始又は終了する配列読み取りの数、(ii)酵素によって切断されない、制限遺伝子座と同じサイズの複数の参照遺伝子座で開始又は終了する配列読み取りの平均数、(iii)未消化対照DNA試料中の制限遺伝子座で開始又は終了する読み取りの数であって、任意選択で配列決定深度差について補正された読み取りの数。例示的な計算は、本明細書の以下の実施例のセクションに記載されている。正規化された値を使用して、制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの正規化された数と制限遺伝子座の予想される読み取りカウントとの間の比を作成することによって、非メチル化DNAのレベルを計算することができる。
【0170】
いくつかの実施形態では、非メチル化DNAのレベルは、制限遺伝子座内のヌクレオチドで開始又は終了する読み取りの数と、制限遺伝子座内のヌクレオチドで開始又は終了する読み取りの予想数との間の差を計算し、その後、差を制限遺伝子座の予想読み取りカウントで割ることによって得られる。
【0171】
追加の実施形態では、非メチル化DNAのレベルは、制限遺伝子座の読み取りカウント及び制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントから決定される総断片数を決定することによって計算される。例示的な計算は、本明細書の以下の実施例のセクションに記載されている。
【0172】
いくつかの実施形態は、非メチル化DNAのレベルは、非メチル化のパーセンテージ(%)として表され、試料中の制限遺伝子座を含有するDNA分子の総数のうち、制限遺伝子座において非メチル化されているDNA分子のパーセンテージを表す。
【0173】
メチル化レベル(又は非メチル化DNAのレベル)はまた、複数の制限遺伝子座に及ぶゲノム中の領域(すなわち、複数の制限部位を含有するゲノム領域)について計算され得る。複数の制限遺伝子座にまたがるゲノム領域は、遺伝子、遺伝子間領域、プロモーター領域、染色体の一部(例えば、染色体アーム)、染色体全体などであり得る。各可能性は、本発明の個別の実施形態を表す。
【0174】
メチル化変化の検出
本明細書で使用される場合、「メチル化変化の検出」は、試験されたDNA試料が1つ以上の基準DNA試料と比較してメチル化変化を含むかどうかを検出することと、DNA試料が選択されたゲノム遺伝子座での異なるメチル化プロファイルによって特徴付けられるかどうかを検出することと、及び/又はDNA試料のメチル化プロファイルが正常であるか、又は疾患の存在の指標となるメチル化変化を含むかどうかを決定することと、を指す。各可能性は、本発明の個別の実施形態を表す。メチル化変化の検出はまた、DNAメチル化マーカーとして使用され得る、試料間で差次的にメチル化されたゲノム領域を同定するために、本明細書に開示されるように得られたメチル化データを試料間で比較することを包含する。例えば、本明細書に開示されるように得られたメチル化データを分析して、異なるタイプの組織間で、がんDNAと非がんDNAとの間で、異なるタイプのがん間で、又は特定のタイプのがんの異なるステージ間で示差的にメチル化されたゲノム領域を同定することができる。いくつかの実施形態では、本明細書に開示される方法は、ゲノムワイドのメチル化分析を提供する。他の実施形態では、本明細書に開示される方法は、標的のみを対象にしたメチル化分析を提供する。配列決定及びメチル化データの分析において、コンピュータソフトウェアを使用することができる。
【0175】
本発明の方法は、汎がん診断マーカー、すなわちがんタイプの群を示すDNAメチル化マーカーとして使用され得るDNAメチル化マーカー領域を同定及び分析するために適用され得る。例えば、いくつかの実施形態では、本発明による汎がんマーカーは、肺がん、結腸直腸がん、肝臓がん、乳がん、膵臓がん、子宮がん、卵巣がん、頭部及び頸部がん、胃がん、食道がん、血液がん(例えば、リンパ種)及び肉腫から選択される複数のがん型を示す。本方法はまた、異なるタイプのがん間の差次的メチル化を同定するために、例えば、異なるタイプのがん間を区別することができる、異なるタイプのがんに特徴的なメチル化プロファイルを決定するために適用され得る。本明細書に開示される方法は、肺がん、膀胱がん、乳がん、結腸直腸がん、前立腺がん、胃がん、皮膚がん(例えば、黒色腫)、神経系に影響を及ぼすがん、骨がん、卵巣がん、肝臓がん(例えば、肝細胞がん)、血液悪性腫瘍、膵臓がん、腎臓がん、子宮頸がんを含むがこれらに限定されない任意のタイプのがんに適用可能である。各がんのタイプは、本発明の個別の実施形態を表す。本発明の方法はまた、組織特異的メチル化マーカーを同定するために適用され得る。例えば、肺、膀胱、乳房、結腸直腸、前立腺、胃、卵巣、膵臓、腎臓、子宮頸部組織に特異的なメチル化マーカーを同定するためである。各組織のタイプは、本発明の個別の実施形態を表す。かかるマーカーは、例えば、循環無細胞DNAの組織給源を同定するために使用され得る。
【0176】
本発明の方法はまた、被験体における疾患(例えば、がん)を同定するために適用され得る。本明細書で使用される同定するという用語は、対象において、疾患についてのスクリーニングを行うこと、疾患の存在又は不存在を検出すること、疾患の再発を検出すること、疾患に対する感受性を検出すること、治療に対する応答を検出すること、治療の有効性を決定すること、疾患の病期(重症度)を決定すること、疾患の予後及び早期診断を決定すること、のいずれか1つ以上を包含する。各可能性は、本発明の個別の実施形態を表す。
【0177】
本明細書で使用される「がんを評価する」又は「がんの存在を評価する」又は「がんの存在又は非存在を評価する」は、対象ががんを有する可能性を決定することを指す。これらの用語は、がんの存在を確認する(又は除外する)ために、対象が、確証的な血液検査、尿検査、細胞診、撮像、内視鏡検査及び/又は生検などの確証的ながん検査を受けるべきかどうかを決定することを包含する。これらの用語は更に、対象におけるがんの診断を補助することを包含する。この用語は更に、がんの存在を示す無細胞DNA試料におけるがん関連変化を定量化することを包含する。本発明によるがんの存在の評価は、対象におけるがんのスクリーニング、がんの再発の評価、がんに対する感受性又はリスクの評価、治療に対する応答の評価及び/又はモニタリング、治療の有効性の評価、がんの重症度(病期)の評価並びにがんの予後の評価のうちの1つ又は複数を含む。各可能性は、本発明の個別の実施形態を表す。本明細書に開示されるアッセイにおける陰性結果は、依然として、本発明によるがんの存在についての評価とみなされることを理解されたい。
【0178】
本発明の方法は、腫瘍画分又は腫瘍DNAの画分濃度を決定するステップを更に含み得る。腫瘍画分は、cfDNA試料中の腫瘍分子の割合である。
【0179】
本明細書に開示される「メチル化プロファイル」(又は「DNAメチル化プロファイル」若しくは「DNA試料のメチル化プロファイル」)を決定することは、1つ以上の制限遺伝子座、好ましくは複数の制限遺伝子座におけるメチル化値を決定することを指す。いくつかの実施形態では、メチル化プロファイルを決定することは、1つ以上の制限遺伝子座、好ましくは複数の制限遺伝子座におけるメチル化及び非メチル化DNAのレベルを決定することを含む。
【0180】
本明細書に開示される「参照メチル化プロファイル」は、既知の給源からのDNAにおいて決定されたメチル化プロファイルを指す。「参照DNA試料」は、既知の給源からのDNA試料である。いくつかの実施形態では、参照メチル化プロファイルは、複数の参照DNA試料において決定されたプロファイルである。加えて、本発明の方法は、異なる時点で単一の対象から採取された、例えば、疾患の異なる段階で採取された、又は疾患の治療の前後に採取されたDNA試料間のメチル化変化を分析(例えば、測定)するために使用され得る。第1の時点で採取されたDNA試料のメチル化プロファイルは、第2の(後の)時点で採取されたDNA試料のメチル化プロファイルの参照として使用することができる。
【0181】
特定の制限遺伝子座又は複数の制限遺伝子座にわたる特定のゲノム領域についての「参照メチル化レベル」は、既知の給源由来のDNAにおける特定の制限遺伝子座/ゲノム領域について測定されたメチル化のレベルである。特定の制限遺伝子座又は複数の制限遺伝子座にわたる特定のゲノム領域についての「参照メチル化値」は、既知の給源由来のDNAにおける特定の制限遺伝子座/ゲノム領域のメチル化のレベルを表す数値である。
【0182】
特定の制限遺伝子座又は複数の制限遺伝子座にわたる特定のゲノム領域についての「非メチル化DNAの参照レベル」は、既知の給源由来のDNA中の特定の制限遺伝子座/ゲノム領域について測定された非メチル化DNAのレベルである。
【0183】
参照メチル化/非メチル化レベル/値は、既知の給源からのDNA試料の大きなセットにおける特定の制限遺伝子座又は特定のゲノム領域について決定されたメチル化/非メチル化レベル/値の分布であり得る。いくつかの実施形態では、メチル化/非メチル化レベル/値は基準スケールであり得る。
【0184】
特定の制限遺伝子座/ゲノム領域についての基準スケールは、同じ参照源からの複数のDNA試料中のこの制限遺伝子座について測定されたメチル化/非メチル化レベル/値を含み得る。例えば、基準がん患者の基準スケール又は基準健常者の基準スケール。あるいは、所与の制限遺伝子座についての基準スケールは、健康な個体及び罹患した個体の両方からのメチル化/非メチル化レベル/値、すなわち、両方の給源からの参照メチル化値を組み合わせた単一スケールを含み得る。一般に、単一のスケールが使用される場合、健常者からの値がスケールの一方の端に、例えばカットオフ値より下になるように、患者からの値はスケールのもう一方の端に、例えばカットオフ値より上になるように、値は分布される。いくつかの実施形態では、未知の給源の検査DNA試料について計算されたメチル化/非メチル化レベル/値は、健康及び/又は疾患の基準値の基準スケールと比較することができ、スコアは、スケール内の相対位置に基づいて計算されたメチル化/非メチル化レベル/値に割り当てることができる。
【0185】
「疾患参照メチル化」(例えば:「がん参照メチル化」)、「疾患参照非メチル化」又は「疾患DNAにおける参照メチル化(又は非メチル化)」(例えば:「がんDNAにおける参照メチル化」)という用語は、互換的に、分析が実施される疾患を有する対象、例えば、ある種のがんを有する対象のDNA試料中の特定の制限遺伝子座又は特定のゲノム領域について測定されたメチル化値及び/又は非メチル化値を指す。疾患参照メチル化及び/又は非メチル化は、疾患DNA、すなわち、疾患を有する対象の試料からのDNAにおけるメチル化/非メチル化値を表す。疾患基準メチル化/非メチル化レベル/値は、上で詳述したように、単一の値、又は複数の値(例えば、分布)であり得る。
【0186】
「疾患DNAメチル化プロファイル」(例えば、「がんDNAメチル化プロファイル」)という用語は、分析が実施される疾患を有する対象、例えば、分析されている特定の種類のがんを有する対象の試料(例えば、血漿試料)から決定された、複数の制限遺伝子座におけるメチル化値及び/又は非メチル化値を指す。
【0187】
「健常参照メチル化」、「正常参照メチル化」又は健常/正常DNAにおける参照メチル化」という用語は、互換的に、正常個体由来のDNA試料中の特定の制限遺伝子座/ゲノム領域について測定されたメチル化値を指す。同様に、「健常参照非メチル化」、「正常参照非メチル化」又は健常/正常DNAにおける参照非メチル化」は、正常個体由来のDNA試料中の特定の制限遺伝子座/ゲノム領域について測定された非メチル化値を互換的に指す。「正常」又は「健康」は、分析が実施される特定の疾患に関して定義される。「健康な」又は「正常な」個人は、本明細書では、従来の診断方法によって決定される、検出可能な症状、及び/又は疾患の病理学的知見のない個人として定義される。健康基準メチル化/非メチル化レベル/値は、上で詳述したように、単一の比率、統計値、又は複数の比率(例えば、分布)であり得る。
【0188】
「健康なDNAメチル化プロファイル」又は「正常なDNAメチル化プロファイル」という用語は、上記で定義されるように、正常な個体のDNA試料から決定される、複数の制限遺伝子座におけるメチル化値及び/又は非メチル化値を指す。
【0189】
いくつかの実施形態では、本明細書に開示される診断方法は、疾患DNAからの基準メチル化/非メチル化レベル/値の事前決定を含む。いくつかの実施形態では、本発明の診断方法は、本明細書で開示されるように、正常なDNAからの基準メチル化/非メチル化レベル/値の事前決定を含む。
【0190】
組織特異的メチル化プロファイルはまた、組織の正常な非がんDNAメチル化プロファイルを確立するために、本明細書中に開示される方法を使用して特徴付けられ得る。あるいは、又は更に、循環無細胞DNAの組織給源を同定するために、組織特異的メチル化プロファイルを特徴付けることができる。
【0191】
いくつかの実施形態では、本発明によるメチル化変化の検出は、対象由来のDNA試料のメチル化プロファイルに基づいて、対象における特定の疾患の有無を同定することを含む。
【0192】
いくつかの実施形態では、DNA試料の細胞給源又は組織給源を同定するための方法が提供される(例えば、DNAが由来する組織の種類を同定する、及び/又はDNAが正常な若しくは疾患の細胞/組織に由来するかどうかを同定する)。
【0193】
当業者は、対応する基準値について計算されたDNAメチル化/非メチル化レベル/値と、1つ以上の対応する基準値との比較が、様々な統計的手段を使用して、いくつかの方法で実行され得ることを理解するであろう。
【0194】
いくつかの実施形態では、特定の制限遺伝子座/ゲノム領域について計算された試験メチル化/非メチル化値を基準値と比較することは、試験値を単一の基準値と比較することを含む。単一の基準値は、健常者又は分析が実施される疾患を有する対象の大集団から基準メチル化/非メチル化レベル/値について得られた平均値に対応し得る。他の実施形態では、試験値を基準値と比較することは、試験値を複数の基準値の分布又はスケールと比較することを含む。試験試料について計算された値が疾患基準値又は正常基準値に対応するかどうかを決定するために、既知の統計的手段を使用することができる。
【0195】
いくつかの実施形態では、本発明による診断は、検査DNA試料のメチル化/非メチル化レベル/値が疾患値であるかどうか、すなわち、問題となっている疾患を示すかどうかの分析に基づく。いくつかの実施形態では、本方法は、計算値をその対応する健常基準値と比較して、計算値が疾患値である可能性を反映するスコアを得るステップを含む。いくつかの実施形態では、本明細書に開示される方法は、計算値をその対応する疾患基準値と比較して、計算値が疾患値である可能性を反映するスコアを得ることを含む。いくつかの実施形態では、スコアが高いほど、計算された値が疾患値である可能性が高い。いくつかの実施形態では、スコアは、疾患値の分布内での計算された値の相対的位置に基づく。
【0196】
いくつかの実施形態では、本方法は、それらの対応する健常な及び/又は疾患参照値に対して、複数の制限遺伝子座のために算出される複数の値を比較することを含む。いくつかの実施形態では、値のパターンは、統計的手段及びコンピュータ化されたアルゴリズムを使用して分析され、それが問題となっている疾患のパターン又は正常で健康なパターンを表すかどうかを決定し得る。例示的なアルゴリズムとしては、機械学習及びパターン認識アルゴリズムが含まれるが、これらに限定されない。
【0197】
いくつかの例示的な実施形態では、試験された試料について計算された値は、がん試料、非がん試料、又はその両方の大きなセットから生成された基準値のスケールに対して比較され得る。スケールは、閾値を示してもよく、以下「カットオフ」又は「事前に定義された閾値」とも呼ばれ、それを超えるとがんに対応する基準値であり、それ以下は健常者に対応する基準値であり、又はその逆順である。いくつかの実施形態では、スケールの下部及び/又はカットオフより下のより低い値は、正常人(健康、すなわち、問題となっているがんに罹患していない)の試料からのものであり得、スケールの上部及び/又は所定のカットオフを超えるより高い値は、がん患者からのものであり得る。複数の制限遺伝子座の分析に基づく診断では、各遺伝子座について計算された値に、スケール内のその相対位置に基づくスコアを与えることができ、(各遺伝子座についての)個々のスコアを組み合わせて単一のスコアを与える。いくつかの実施形態では、個々のスコアを合計して単一のスコアを与えることができる。他の実施形態では、個々のスコアを平均して単一のスコアを与えることができる。いくつかの実施形態では、単一のスコアは、対象が問題となっているがんを有しているかどうかを決定するために使用することができ、所定の閾値を超えるスコアは、がんを示す。
【0198】
追加の例示的な実施形態では、複数の制限遺伝子座の分析に基づく診断のために、各計算値について、それががんDNAを表す確率が、対応するがん基準値及び/又は正常基準値との比較に基づいて決定され得る。スコアを各遺伝子座に割り当てることができ、その後、各遺伝子座について計算された個々のスコアを組み合わせて(例えば、合計又は平均して)、組み合わせスコアを得る。複合スコアは、対象ががんに対して陽性若しくは陰性であるかどうかを決定するために使用することができ、所定の閾値を超える複合スコアは、がんを示す。したがって、いくつかの実施形態では、閾値又はカットオフスコアが決定され、それを上回る(又は下回る)対象は、問題となっている疾患、例えば、問題となっているがんに対して陽性であるとして同定される。閾値スコアは、健常者の母集団と非健常者の母集団を区別する。
【0199】
いくつかの実施形態では、本発明の診断方法は、閾値スコアを提供することを含む。
【0200】
多くの場合、統計的有意性は、2つ以上の母集団を比較し、信頼区間(CI)及び/又はp値を決定することによって決定される。いくつかの実施形態では、統計的に有意な値は、約90%、95%、97.5%、98%、99%、99.5%、99.9%及び99.99%の信頼区間(CI)を指し、好ましいp値は約0.1、0.05、0.025、0.02、0.01、0.005、0.001未満又は0.0001未満である。各可能性は、本発明の個別の実施形態を表す。いくつかの実施形態によれば、閾値スコアのp値は最大で0.05である。
【0201】
いくつかの実施形態では、本明細書で開示され診断る方法の診断感度は、少なくとも75%である。いくつかの実施形態では、診断感度は、少なくとも80%である。いくつかの実施形態では、診断感度は、少なくとも85%である。いくつかの実施形態では、方法の診断感度は、少なくとも約90%である。
【0202】
いくつかの実施形態では、本明細書で使用される診断アッセイの「診断感度」は、陽性であると診断された病人のパーセンテージ(「真の陽性」のパーセント)を指す。したがって、アッセイによって検出されない病人は「偽陰性」である。罹患しておらず、アッセイにおいて陰性である被験体は、「真陰性」と呼ばれる。診断アッセイの「特異性」は、1から偽陽性率を引いたものであり、ここで、「偽陽性」率は、試験結果が陽性である疾患を有さない者の割合として定義される。特定の診断方法は状態の確定診断を提供できないが、この方法が診断に役立つ陽性の指標を提供する場合はそれで十分である。
【0203】
いくつかの実施形態では、本明細書に開示される診断方法の診断特異度は、少なくとも約65%であり得る。いくつかの実施形態では、方法の診断特異度は少なくとも約70%であり得る。いくつかの実施形態では、方法の診断特異度は少なくとも約75%であり得る。いくつかの実施形態では、方法の診断特異度は少なくとも約80%であり得る。
【0204】
いくつかの実施形態では、本発明による診断方法は、メチル化プロファイルに基づいてレポート(紙又は電子で)を作成することを含む。報告は、対象及び/又は対象の医療提供者に通信されてもよい。
【0205】
いくつかの実施形態では、本発明による診断方法は、被験体を追跡検査及びスクリーニングに照会することを含む。
【0206】
追加の遺伝的及び後成的特性付け
DNAメチル化/非メチル化値に加えて、本明細書に開示される同じ配列決定データから、DNA変異、コピー数変化、及び無細胞DNAのヌクレオソームポジショニングに関する情報を得ることが可能である。一般に、無細胞DNAは、120~220bpの間の範囲の断片で循環する。このパターンは、単一ヌクレオソームの周りに巻き付いたDNAの長さに加えて、ヒストンに結合した約20bpの短いストレッチ(リンカーDNA)と一致する。ヌクレオソームのポジショニングは、異なる組織間で、及び悪性細胞において変動するため、断片化のパターンは、cfDNAプールに寄与する起源の優勢な細胞型を決定するのに役立つことが示されている。
【0207】
有利には、本明細書に開示されるDNAメチル化プロファイルの決定及び少なくとも1つの追加の遺伝的又は後成的特性の決定は、同じ配列決定データに基づいて行われ得る。
【0208】
いくつかの実施形態では、本明細書に開示される配列決定ベースのアッセイは、メチル化変化の検出を、変異検出及び追加の後成的特性の分析と、全て1つの単一アッセイにおいて組み合わせる。このアッセイは、単一のアッセイで少量のDNAの組み合わせ分析を有利に可能にする。
【0209】
メチル化並びに追加の遺伝的及び後成的特性の組み合わせ分析は、がん(又は任意の他の状態/組織源)の検出を増強するのに有用である。
【0210】
いくつかの例示的な実施形態では、対象におけるがんの存在又は非存在を検出するための方法は、
(A)本明細書に開示されるDNA試料のメチル化をプロファイリングして、1つ以上のがん関連ゲノム領域における過剰メチル化の存在又は非存在を検出すること、及び
(B)以下の1つ以上:
1つ以上のがん関連変異の存在又は非存在(例えば、がん遺伝子/腫瘍抑制因子におけるがん関連変異)を決定すること、
がん関連コピー数多型の存在又は非存在を決定すること、及び
がん関連ヌクレオソームポジショニングの存在又は非存在を決定すること、を行うことを含み、
(A)及び(B)は、同じ配列決定データを用いて行われ、
1つ以上のがん関連ゲノム領域における過剰メチル化の存在、並びに1つ以上のがん関連変異、がん関連コピー数多型及びがん関連ヌクレオソームポジショニングのうちの少なくとも1つを決定することが、対象におけるがんの存在を示す。
【0211】
非メチル化がん関連変化は、がん関連変化が同じDNA断片上に見出されるか否かに応じて、依存的又は非依存的にメチル化情報と組み合わせることができ、同じ断片上に見出される変化は、がんの存在のより強い指標を提供する。
【0212】
いくつかの実施形態では、DNA試料の遺伝的及び後成的特性をプロファイリングするための方法が提供され、方法は、本明細書に開示されるDNA試料のメチル化をプロファイリングすることと、DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することとを含み、少なくとも1つの追加の遺伝的又は後成的特性は、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択され、メチル化のプロファイリング及び少なくとも1つの追加の遺伝的又は後成的特性の決定は、同じ配列決定データを使用して行われ、それによってDNA試料の遺伝的及び後成的特性をプロファイリングする。
【0213】
いくつかの実施形態では、対象における疾患の存在又は非存在を検出するための方法が提供され、方法は、本明細書に開示されるDNA試料のメチル化をプロファイリングすることと、DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することであって、少なくとも1つの追加の遺伝的又は後成的特性は、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択され、メチル化のプロファイリング及び少なくとも1つの追加の遺伝的又は後成的特性の決定は、同じ配列決定データを使用して実施されて、DNA試料の遺伝的及び後成的特性を得ることと、DNA試料の遺伝的及び後成的特性を1つ以上の参照遺伝的及び後成的特性と比較することと、比較に基づいて疾患の存在又は非存在を決定することと、を含む。いくつかの実施形態では、疾患はがんである。
【0214】
システム及びキット
いくつかの実施形態では、DNA試料におけるメチル化変化を検出するためのシステムが本明細書に提供される。いくつかの実施形態では、DNA試料における遺伝的及び後成的変化を検出するためのシステム及び方法が本明細書に提供される。追加の実施形態では、DNA試料におけるメチル化変化を検出するためのキットが本明細書に提供される。追加の実施形態では、DNA試料における遺伝的及び後成的変化を検出するためのキットが本明細書に提供される。
【0215】
本発明によるシステムは、アッセイを実行するため及び/又は結果を処理するための、例えば計算を実行するためのコンピュータプロセッサを含む。いくつかの実施形態では、コンピュータ実装方法が本明細書で提供される。
【0216】
いくつかの実施形態では、システム及びキットは、本明細書に開示される方法に従って、DNA試料のメチル化をプロファイリングするためのものである。いくつかの実施形態では、システム及びキットは、本明細書に開示される方法に従って、DNA試料の遺伝的及び後成的特性をプロファイリングするためのものである。追加の実施形態では、システム及びキットは本明細書に開示される方法に従って、DNA試料のメチル化変化を検出するためのものである。追加の実施形態では、システム及びキットは、本明細書に開示される方法に従って、DNA試料の遺伝的及び後成的変化を検出するためのものである。
【0217】
いくつかの実施形態では、本発明によるシステムは、
DNA試料と、
DNA試料を消化するための少なくとも1つのメチル化感受性制限エンドヌクレアーゼ及び/又は少なくとも1つのメチル化依存性制限エンドヌクレアーゼと、
複数の制限エンドヌクレアーゼにより生成されたDNA断片を含む配列決定ライブラリを調製するための成分と、
配列決定ライブラリを配列決定し、配列読み取りを生成するためのハイスループットシーケンサーと、
非一時的コンピュータ可読媒体に記憶されたコンピュータソフトウェアであって、本明細書に開示される方法に従って、複数の配列読み取りに基づいてDNA試料の遺伝的及び後成的特性をプロファイリングするようにコンピュータプロセッサに指示する、コンピュータソフトウェアと、を含む。いくつかの実施形態では、コンピュータソフトウェアは、本明細書に開示される方法に従って、複数の配列読み取りに基づいてDNA試料のメチル化をプロファイリングするようにコンピュータプロセッサに指示する。
【0218】
いくつかの実施形態では、非一時的コンピュータ可読媒体上に記憶されたコンピュータソフトウェアは、コンピュータプロセッサに、本明細書に開示される方法に従って、複数の配列読み取りに基づいて、DNA試料における遺伝的及び後成的変化を決定するように指示する。いくつかの実施形態では、非一時的コンピュータ可読媒体に記憶されたコンピュータソフトウェアは、コンピュータプロセッサに、本明細書に開示される方法に従って複数の配列読み取りに基づいてDNA試料中のメチル化変化を決定するように指示する。
【0219】
本明細書中で使用される場合、配列決定ライブラリを調製するための「成分」は、生化学的成分(例えば、酵素、ヌクレオチド)、化学的成分(例えば、緩衝液)、及び技術的成分(例えば、チューブ、バイアル、ピペットなどの装置)を包含する。
【0220】
いくつかの実施形態では、本発明によるキット又はシステムは、制限酵素に加えて、1つ以上の緩衝液などの、DNA消化に必要な成分を含む。
【0221】
いくつかの実施形態では、無細胞DNA試料の遺伝的及び後成的特性をプロファイリングするためのシステムが提供され、システムは、無細胞DNA試料と、非一時的コンピュータ可読媒体上に記憶されたコンピュータソフトウェアであって、実行されると、コンピュータプロセッサに以下のステップ:
(i)少なくとも1つのメチル化感受性制限エンドヌクレアーゼによる無細胞DNA試料の消化後に得られたDNA分子のライブラリの配列決定データを受け取り、配列決定アダプタを制限エンドヌクレアーゼ処理されたDNA中のDNA分子にライゲーションすることを含む配列決定ライブラリを調製することであって、各アダプタが、消化されたDNA分子及び未消化のDNA分子の両方にライゲーションすることができる、受け取り、調製することと、
(ii)配列決定データから、少なくとも1つの制限遺伝子座のメチル化値、並びに任意選択で、DNA変異、コピー数多型及びヌクレオソームポジショニングから選択される無細胞DNA試料の少なくとも1つの追加の遺伝的又は後成的特性を決定することと、
を実行させるよう構成され若しくは指示された指令を含む、コンピュータソフトウェアと、を含み、
3000半数体当量を含む無細胞DNAの量が、当該方法に十分であり、無細胞DNA試料が、ライブラリ調製の前に増幅に供されておらず、無細胞DNA試料のメチル化値及び少なくとも1つの追加の遺伝的又は後成的特性を決定することが、同じ配列決定データに基づいて実施される。
【0222】
いくつかの実施形態では、DNA試料のメチル化をプロファイリングするためのシステムが本明細書で提供され、システムは、非一時的コンピュータ可読媒体上に記憶されたコンピュータソフトウェアを含み、このコンピュータソフトウェアは、実行されると、コンピュータプロセッサに以下のステップ:
(i)少なくとも1つのメチル化感受性制限エンドヌクレアーゼによるDNA試料の消化後に得られたDNA分子のライブラリの配列読み取りを受け取ることと、
(ii)少なくとも1つの制限遺伝子座を選択し、制限遺伝子座を含有する少なくとも50bpの長さの所定のゲノム領域をカバーする配列読み取りの数を決定することと、
(iii)ステップ(ii)において決定された読み取りカウント及び参照読み取りカウントに基づいて、少なくとも1つの制限遺伝子座のメチル化値を計算することと、を含む。
【0223】
いくつかの実施形態では、DNA試料のメチル化をプロファイリングするためのシステムが本明細書で提供され、システムは、非一時的コンピュータ可読媒体上に記憶されたコンピュータソフトウェアを含み、このコンピュータソフトウェアは、実行されると、コンピュータプロセッサに以下のステップ:
(i)少なくとも1つのメチル化感受性制限エンドヌクレアーゼによるDNA試料の消化後に得られたDNA断片のライブラリの配列読み取りを受け取ることと、
(ii)複数の配列読み取りを参照ゲノムに対してマッピングして、マッピングされた配列読み取りを生成し、参照ゲノム内の少なくとも1つの制限遺伝子座を選択することと、
(iii)マッピングされた配列読み取りから、少なくとも1つの制限遺伝子座の読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化され、したがって無傷のままであったDNA試料中のDNA分子の数を表す、決定することと、
(iv)マッピングされた配列読み取りから、少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントを決定することであって、読み取りカウントが、少なくとも1つの制限遺伝子座がメチル化されておらず、したがって制限エンドヌクレアーゼによって切断されたDNA試料中のDNA分子の数を表す、決定することと、
(v)ステップ(iii)で決定された少なくとも1つの制限遺伝子座の読み取りカウントに基づいて少なくとも1つの制限遺伝子座におけるメチル化DNAのレベルを計算し、ステップ(iv)で決定された少なくとも1つの制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントに基づいて少なくとも1つの制限遺伝子座における非メチル化DNAのレベルを計算することと、を実行させるよう構成され若しくは指示された指令を含む。
【0224】
いくつかの実施形態では、コンピュータソフトウェアは更に、コンピュータプロセッサに、試験されたDNA試料の遺伝的及び後成的プロファイルを1つ以上の参照遺伝的及び後成的プロファイルと比較し、比較に基づいて、DNA試料が正常DNA試料であるか疾患DNA試料であるかを出力するように指示する。
【0225】
いくつかの態様では、コンピュータソフトウェアは更に、コンピュータプロセッサに、試験されたDNA試料のメチル化プロファイルを1つ以上の参照メチル化プロファイルと比較し、比較に基づいて、DNA試料が正常DNA試料であるか疾患DNA試料であるかを出力するように指示する。
【0226】
いくつかの実施形態では、本発明によるコンピュータソフトウェアは、ハイスループット配列決定の実行の入力生データを受け取る。いくつかの態様では、コンピュータソフトウェアは、本明細書に開示されるような遺伝的及び後成的プロファイルを決定するために配列決定データを分析するようにコンピュータプロセッサに指示する。いくつかの実施形態では、コンピュータソフトウェアは、本明細書に開示されるように、配列決定データを分析してDNAメチル化値及び/又はDNA非メチル化値を決定するようにコンピュータプロセッサに指示する。
【0227】
コンピュータソフトウェアは、非一時的なコンピュータ可読媒体に格納されるプロセッサ実行可能命令を含む。コンピュータソフトウェアはまた、格納データを含み得る。コンピュータ可読媒体は、コンパクトディスク(compact disc、CD)、磁気記憶装置、光学記憶装置、ランダムアクセスメモリ(random access memory、RAM)、読み出し専用メモリ(read only memory、ROM)、又は任意の他の有形的表現媒体などの有形的コンピュータ可読媒体である。
【0228】
本明細書に記載のコンピュータ関連の方法、ステップ、プロセスは、実行されたときに、指示を実行するように構成されているか、又はそれをコンピュータプロセッサ若しくはコンピュータに指示する不揮発性又は非一時的コンピュータ可読命令に格納されたソフトウェアを使用して実施されることが理解される。
【0229】
本明細書に記載のシステム、サーバー、コンピュータデバイス、及びコンピュータのそれぞれは、1つ以上のコンピュータシステムに実装でき、ネットワークを介して通信するように構成できる。それらは全て、単一のコンピュータシステムに実装することもできる。一実施形態では、コンピュータシステムは、情報を通信するためのバス又は他の通信メカニズム、及び情報を処理するためのバスと結合されたハードウェアプロセッサを含む。
【0230】
コンピュータシステムはまた、プロセッサによって実行される情報及び命令を記憶するためにバスに結合された、ランダムアクセスメモリ(RAM)又は他の動的記憶装置などのメインメモリを含む。メインメモリは、プロセッサによって実行される命令の実行中に一時変数又は他の中間情報を格納するために使用することもできる。このような命令は、プロセッサがアクセスできる非一時的な記憶媒体に格納されると、コンピュータシステムを、命令で指定された操作を実行するようにカスタマイズされた専用の機器にレンダリングする。
【0231】
コンピュータシステムは更に、静的情報及びプロセッサへの命令を格納するためにバスに結合された読み取り専用メモリ(ROM)又は他の静的記憶装置を含む。磁気ディスク又は光ディスクなどの記憶装置が提供され、情報及び命令を記憶するためにバスに結合される。
【0232】
コンピュータシステムは、コンピュータユーザーに情報を表示するために、バスを介してディスプレイに結合することができる。
【0233】
英数字及びその他のキーを含む入力デバイスは、情報及びコマンド選択をプロセッサに通信するためにバスに結合される。別のタイプのユーザー入力デバイスは、方向情報及びコマンド選択をプロセッサに伝達し、ディスプレイ上のカーソルの動きを制御するための、マウス、トラックボール、又はカーソル方向キーなどのカーソル制御である。
【0234】
一実施形態によれば、本明細書の技術は、メインメモリに含まれる1つ以上の命令の1つ以上のシーケンスを実行するプロセッサに応答して、コンピュータシステムによって実行される。そのような命令は、記憶装置などの別の記憶媒体からメインメモリに読み込むことができる。メインメモリに含まれる一連の命令を実行すると、プロセッサは、本明細書に記載のプロセスステップを実行する。代替の実施形態では、ハードワイヤー回路を、ソフトウェア命令の代わりに、又はソフトウェア命令と組み合わせて使用することができる。
【0235】
本明細書で使用される記憶媒体という用語は、機械を特定の方法で動作させるデータ及び/又は命令を記憶する任意の非一時的な媒体を指す。記憶媒体の一般的な形式には、例えば、フロッピーディスク、フレキシブルディスク、ハードディスク、ソリッドステートドライブ、磁気テープ、又は任意の他の磁気データ記憶媒体、CD-ROM、任意の他の光データ記憶媒体、穴パターンを伴う任意の物理的媒体、RAM、PROM、及びEPROM、FLASH-EPROM、NVRAM、任意の他のメモリチップ、又はカートリッジが含まれる。
【0236】
記憶媒体は、伝送媒体とは異なるが、伝送媒体と組み合わせて使用できる。伝送媒体は、記憶媒体との間の情報転送に関与する。例えば、伝送媒体には、バスを構成する線を含む、同軸ケーブル、銅線、及び光ファイバーが含まれる。
【0237】
以下の実施例は、本発明の特定の実施形態をより完全に例示するために提示される。しかしながら、それらは決して本発明の広い範囲を限定するものとして解釈されるべきではない。当業者は、本発明の範囲から逸脱することなく、本明細書に開示された原理の多くの変形及び改変を容易に考案することができる。
【実施例】
【0238】
実施例1-メチル化感受性DNA消化とそれに続く次世代配列決定(NGS)対 バイサルファイト処理+NGS
以下の実施例では、メチル化感受性酵素消化、続いてNGSに供された無細胞DNA試料について得られた配列決定データを、バイサルファイト変換及びNGS後に得られた配列決定データと比較した。まず、プールされた血漿DNA試料の配列決定データを試験した。次に、それぞれが約10~200ngのDNA(DNAの約3,000~60,000一倍体当量に対応する)を含有する個々の血漿DNA試料の配列決定データを試験した。
【0239】
A.健康な個体のプールされた血漿試料
QIAamp(登録商標)Circulating Nucleic Acid Kit(QIAGEN、Hilden,Germany)を使用して、56~60人の健常対照対象の血漿試料からDNAを抽出し、プールした。500ngのアリコートを未処理対照DNAとして保持し、1700ngのアリコートをEZ DNA Methylation-Gold(商標)Kit(Zymo research)を使用してバイサルファイト変換に供し、残りのDNA(770ng)をメチル化感受性制限酵素HinP1I及びAciIによる消化に供した。メチル化感受性消化は、試料を10単位のHinP1I及び5単位のAciIとともに37℃で2時間インキュベートし、続いて65℃で20分間不活性化することによって行った。
【0240】
次に、各試料(酵素処理、バイサルファイト処理及び未処理対照試料)から、酵素処理及び未処理対照試料については、NEBNext Ultra DNA Library Prep Kitを、バイサルファイト処理試料については、ACCEL-NGS(登録商標)METHYL-SEQ DNA LIBRARY kit(swift)を、使用することによって、配列決定ライブラリを調製した。配列決定ライブラリは、酵素ライゲーションを使用してIlluminaプラットフォーム配列決定アダプタを付加することによって、DNA分子の末端の情報を保存しながら調製した。S4フローセルを備えたIllumina NovaSeq 6000配列決定プラットフォームを使用して、ライブラリを全ゲノム次世代配列決定に供した。各試料からの配列読み取りを、完全ヒトゲノム(hg18ゲノム構築)に対してマッピングした。
【0241】
配列決定メトリック
表1及び
図1A~
図1B、
図2A~
図2Bは、プールされた血漿DNA試料について得られた配列決定測定基準、コピー数完全性データ及びヌクレオソームポジショニング完全性データを要約する。コピー数の完全性の分析のために、メチル化感受性消化アリコート中の制限遺伝子座から>100bpに位置する各ゲノム位置でのヒット数を、未処理アリコートから得られた対応するヒット数と比較した。バイサルファイト処理アリコートに対しても同じ分析を行った(未処理アリコートと比較して)。ピアソン相関を、各実験設定(メチル化感受性消化DNA及びバイサルファイト処理)における全てのデータ点について計算した。ピアソン相関は、-1から1の間の数をもたらし、1に近い数は、より良好な相関を表す。
【0242】
ヌクレオソームポジショニング完全性分析のために、「ヒットスパン100」(=分析されたゲノム位置の>50bp上流で開始し、>50bp下流で終了する読み取りの数)をヒットの代わりに使用したことを除いて、コピー数分析と同じタイプの手順に従った。
【0243】
【0244】
データから分かるように、メチル化感受性消化は、未処理対照試料について得られたものと実質的に同じマッピング率及びユニークマッピング率をもたらし、92%を超えるユニークマッピング率に達した。対照的に、バイサルファイト処理した試料は、わずか約80%の固有のマッピング率で、情報の有意な損失を示した。
【0245】
バイサルファイト処理試料における情報の喪失は、コピー数及びヌクレオソームポジショニング完全性データによって更に実証された:すなわち、
図1A及び
図2Aに見られるように、コピー数及びヌクレオソームポジショニングの同様のパターンが、メチル化感受性消化試料及び未処理試料について観察された。パターンはバイサルファイト処理試料では維持されなかった。ピアソン相関分析は、メチル化感受性消化試料と未処理対照試料との間で、コピー数において0.9、ヌクレオソームポジショニングにおいて0.88の相関を示した。対照的に、バイサルファイト処理試料と未処理対照試料との間で、0.67(コピー数)及び0.58(ヌクレオソームポジショニング)の相関が得られた(
図1B、
図2B)。
【0246】
B.肺がん患者の血漿試料
上記セクションAは、比較的多量のDNAを含有するプールされた血漿試料を使用した結果を提供する。分析のために、はるかに少ない量のDNAを含有する個々の血漿試料を使用して、メチル化感受性消化とバイサルファイト変換との間の差異をチェックすることは興味深い。
【0247】
この目的のために、治療未経験の非小細胞肺がん(NSCLC)患者の血漿試料からDNAを抽出した。DNAを上記セクションAに記載したように抽出し、バイサルファイト変換又はメチル化感受性制限酵素HinP1I及びAciIによる消化に供した。血漿試料から抽出されたDNAの量は、試料当たり約10~200ngのDNAの範囲であった(DNAの約3,000~60,000一倍体当量に対応する)。酵素消化又はバイサルファイト変換に続いて、試料を上記のようにライブラリ調製及び配列決定に供した。
【0248】
BMD LNG165(26ngの無細胞DNA)及びBMD LNG166(94ngの無細胞DNA)として同定された2人の患者の例示的な結果を以下に提供する。
【0249】
配列決定メトリック
表2~3及び
図3A~
図3B、
図4A~
図4Bは、各血漿DNA試料について得られた配列決定測定基準、コピー数完全性データ及びヌクレオソームポジショニング完全性データを要約する。
【0250】
【0251】
【0252】
結果は、少量のDNAについて、得られる読み取りの数は、バイサルファイト処理対メチル化感受性消化を使用した場合に有意に減少することを示す:すなわち、バイサルファイト処理DNAについて得られた読み取りの数、及び重要なことに、ユニークにマッピングされた読み取りの数は、メチル化感受性消化DNAについて得られた量の半分未満であった。更に、メチル化感受性消化DNAは約90%のユニークマッピング率を示したが、バイサルファイト処理DNAのユニークマッピング率はわずか77~78%であった。
【0253】
バイサルファイト処理試料における情報の有意な喪失は、コピー数及びヌクレオソームポジショニング完全性データによって更に実証された:すなわち、ピアソン相関分析は、メチル化感受性消化DNAと未処理対照試料との間で、コピー数において0.735及び0.693、並びにヌクレオソームポジショニングにおいて0.647及び0.595の相関を示した。対照的に、バイサルファイト処理したDNAと未処理の対照試料との間で、0.196及び0.161の相関(コピー数)、並びに0.19及び0.176の相関(ヌクレオソームポジショニング)が得られた(
図3A~
図3B、
図4A~
図4B)。バイサルファイト配列決定は、少量のDNAがアッセイに使用された場合、事実上全てのコピー数及びヌクレオソームポジショニング情報を損失した。
【0254】
CGカバレッジ
図5A~
図5Bは、バイサルファイト処理DNA及びメチル化感受性消化DNAにおけるCG深さの分布を示す。より詳細には、グラフは、各方法によって各深さでカバーされたゲノム中のCG部位の数を示す。
図5Aは、患者BMD LNG165からの試料について得られたデータを示す。
図5Bは、患者BMD LNG166からの試料について得られたデータを示す。
【0255】
メチル化感受性酵素消化を使用するゲノムワイドメチル化分析は、アッセイにおいて使用される酵素の認識部位内に位置するCGに限定されるが、バイサルファイト配列決定は、原則として、ゲノム中の全てのCG部位を網羅する。ゲノム中のCG部位の画分のみを調査する能力は、制限酵素に基づくメチル化分析の主な制限の1つと考えられてきた。しかしながら、本明細書に提示されるデータは、バイサルファイトが、メチル化感受性消化と比較して深さの下端でより広いCG範囲を提供する一方で、深さが増加するにつれて、バイサルファイト処理されたDNAにおいてカバーされるCGの数において、連続的かつ鋭い減少が見られることを示す。対照的に、メチル化感受性消化は、250~300を超える深さでさえ実質的に一定のカバレッジを示す。高深度では、メチル化感受性消化は、バイサルファイトと比較して有意に良好なCG適用範囲を提供する。
【0256】
例えば、患者BMD LNG165由来のDNA試料において(
図5A)、メチル化感受性消化は、165を超える深さでバイサルファイトよりも多くのゲノムCGをカバーした。300の深さで、メチル化感受性消化試料は4.16MのCGをカバーしたのに対して、バイサルファイト処理試料では44KのCG部位しかカバーされなかった。患者BMD LNG166由来のDNA試料において(
図5B)、メチル化感受性消化は、255を超える深さでバイサルファイトよりも多くのゲノムCGをカバーした。400の深さで、メチル化感受性消化試料は4.24MのCGをカバーしたのに対して、バイサルファイト処理試料では65KのCG部位しかカバーされなかった。
【0257】
したがって、メチル化感受性消化は、非常に高い深さで数百万のCGのカバレッジを提供し、稀なメチル化シグナル、例えば、血漿中に非常に低い量-1%以下で存在し得る腫瘍の初期段階での血漿中の腫瘍由来のメチル化DNA分子の検出を可能にする。データは、稀なシグナルの同定に必要とされる深さにおいて、バイサルファイトは十分なカバレッジを提供せず、かかる稀なシグナルは、少量のDNAに対してバイサルファイト配列決定を使用する場合に見逃される可能性が高いことを示した。
【0258】
メチル化変化の検出
腫瘍対正常組織における高メチル化を示し、健康な個体の血漿中の低バックグラウンドメチル化によって特徴付けられる、低バックグラウンド高メチル化マーカー遺伝子座のセットを編集した。メチル化レベルを、以下の実施例2に記載されるように決定した。マーカー遺伝子座のこのセットは、2人の肺がん患者(BMD LNG165及び患者BMD LNG166)からの試料及び健康な個体のプールされた血漿試料に基づいて編集し、両方の検出方法、すなわち、メチル化感受性消化+NGS及びバイサルファイト変換+NGSを使用して観察された低バックグラウンド高メチル化遺伝子座を含んだ。加えて、イソメチル化マーカー遺伝子座、すなわち、腫瘍組織と正常組織との間で異なるメチル化レベルを示さない遺伝子座のセットを編集した。
【0259】
次に、患者の血漿中の低バックグラウンド高メチル化マーカー遺伝子座のメチル化レベルを決定するために、メチル化感受性消化+NGS又はバイサルファイト変換+NGSを使用して、各患者からの血漿DNAを分析した。閾値メチル化レベルを設定し、それを超えるとマーカー遺伝子座が「検出された」とみなした。95%の検出特異性を得るために、イソメチル化マーカー遺伝子座のセットに基づいて閾値を決定した。各患者由来のメチル化感受性消化DNA及びバイサルファイト変換DNAにおいて閾値を超えた(すなわち、検出された)マーカー遺伝子座の数を比較した。結果を
図6に要約する。メチル化感受性消化+NGSを使用するメチル化分析は、両方の試料において、バイサルファイト+NGSと比較して、血漿中で有意により多くのメチル化変化を検出した。
【0260】
変異検出
腫瘍変異は、同じ患者からの対応する正常組織において最も優勢な遺伝子型とは異なる、腫瘍DNAにおいて見出される遺伝子型として定義した。腫瘍DNA中の変異遺伝子型を有する読み取りの割合は、腫瘍変異レベルを表し、患者の血漿中の同じ変異遺伝子型を有する読み取りの割合は、血漿変異レベルを表した。各試料について、平均腫瘍及び血漿変異レベルを全ての変異にわたって計算し、腫瘍変異負荷を計算した(すなわち、平均血漿変異レベル/平均腫瘍変異レベル)。腫瘍変異負荷は、患者の血漿中の腫瘍DNAの割合を表す。配列決定ノイズを制御するために、患者Aの腫瘍変異負荷を、患者Bの腫瘍変異から計算された対照腫瘍変異負荷(すなわち、患者Aの血漿中の患者Bの腫瘍変異の平均変異レベル/患者Aの腫瘍変異レベル)と比較した。
【0261】
結果を、
図7A~
図7Bに要約する。腫瘍変異は、メチル化感受性消化+NGSによって、配列決定ノイズを明らかに上回るレベルで血漿中に検出されたが、バイサルファイト+NGS変異では、高い配列決定ノイズと区別できなかった。
【0262】
実施例2-肺がん患者の腫瘍及び血漿DNAの遺伝的及び後成的プロファイリング
メチル化及び変異分析を、BMD LNG165及びBMD LNG166として同定された2人の肺がん患者からの試料に対して行った。各患者の臨床データを
図9A~
図9Bに詳述する。
【0263】
分析のための試料調製を
図8Aに示す。正常肺組織試料、腫瘍肺組織試料及び血液試料を各患者に提供した。血液試料をバフィーコート及び血漿試料に分離した。図に示すように、各試料からDNAを抽出した。正常組織DNA、腫瘍組織DNA及びバフィーコートDNAを超音波処理によって断片化した。次に、実施例1と同様にメチル化感受性制限酵素HinP1I及びAciIでDNAを消化し、精製した。各患者からの正常組織DNAのアリコートを未消化のままにし、対照として保存した。精製したDNA試料を、上記のようにライブラリ調製及び配列決定に供した。
【0264】
図8Bは、100人の健常対照対象から採取された対照試料の試料調製を示す。対照試料は、各対照対象からのバフィーコート試料及び血漿試料を含んでいた。図に示すように、各試料からDNAを抽出した。バフィーコートDNAを超音波処理により断片化し、HinP1I及びAciIによる消化に供し、続いて精製した。各対照被験者からのバフィーコートDNAのアリコートを未消化のままにし、対照として保存した。血漿DNAをHinP1I及びAciIによる消化に供し、精製した。血漿DNAのアリコートを、品質管理(例えば、血漿分離の品質の評価)のために、及び血漿DNAの未消化対照プールを作製するために採取した。精製したDNA試料を、上記のようにライブラリ調製及び配列決定に供した。
【0265】
各試料からの配列読み取りを、完全ヒトゲノム(hg18ゲノム構築)に対してマッピングした。CIGAR&MAPQ>0&abs(TLEN)≦500bpを有するアラインメントを、腫瘍におけるメチル化変化及び変異並びに血漿におけるそれらの提示を同定するために、メチル化及び変異の追加の分析のために選択した。
【0266】
各ゲノム位置について、「ヒットスパン100」、すなわち、ゲノム位置の>50bp上流で開始し、>50bp下流で終了する読み取りの数を決定した。
【0267】
「ヒットスパン100」は、少なくとも100bpのアラインメントであり、メチル化感受性消化及びライブラリ調製後に残ったDNA試料中の少なくとも100bpの長さのDNA分子を表す。加えて、かかるアラインメントのコピー数はヌクレオソーム境界を反映するため、かかるアラインメントの分析は、メチル化に加えて無細胞DNAにおけるヌクレオソーム配置を評価するのに有利であり、ここで、高いコピー数はヌクレオソームの中央に典型的であり、低いコピー数はヌクレオソーム間の境界に典型的である。
【0268】
また、多くのがん関連メチル化変化は、CGアイランド内、すなわち、メチル化を受けるCG部位に到達するゲノムの領域内で起こる。アッセイにおいて使用される酵素の制限遺伝子座内に位置する分析されたCG部位の周囲の「ヒットスパン100」領域は、典型的には、追加のCG部位を含有する、酵素の追加の制限遺伝子座を含む。したがって、「ヒットスパン100」アラインメントは、少なくとも100bpの長さのDNA分子を表し、ここで、分析された制限遺伝子座、並びにDNA分子内の任意の追加の制限遺伝子座は、DNA試料において全てメチル化され、そしてアッセイにおいて使用される酵素での消化後に無傷なままであった。長さが少なくとも100bpであり、DNA試料中で全てメチル化された複数の制限遺伝子座を含むアラインメントを分析することは、がん関連過剰メチル化シグナルの特異性を増加させ、正常試料とがん性試料との間の差異の改善された、より正確な検出を可能にする。かかるメチル化分析は、CGアイランド内に位置するCG部位について特に有利である。
【0269】
「ヒットスパン100」値を、同じ試料における中央値「ヒットスパン100」値に対して正規化した。例えば:特定の遺伝子座における正規化された「範囲100のヒット」=その遺伝子座における「範囲100のヒット」の数/試料中の「範囲100のヒット」の中央値数、である。正規化は、染色体1~22にわたる中央値に対するものとした。
【0270】
全ゲノムメチル化解析
メチル化遺伝子座は、未消化正常組織プールにおける所定の閾値を超える正規化された「ヒットスパン100」の数を有する制限遺伝子座として定義した。
【0271】
メチル化遺伝子座のバックグラウンドメチル化レベルは、以下のように決定した:
消化された正常血漿プールにおける正規化「ヒットスパン100」/未消化の正常血漿プールにおける正規化「ヒットスパン100」。
【0272】
未消化正常血漿プールにおける正規化された「ヒットスパン100」=0の場合、値1/中央値「ヒットスパン100」を代わりに使用した。
【0273】
メチル化遺伝子座の腫瘍メチル化レベルは、以下のように決定した:
腫瘍における正規化された「ヒットスパン100」/未消化正常組織プールにおける正規化された「ヒットスパン100」。
【0274】
メチル化遺伝子座の正常メチル化レベルは、以下のように決定した:
正常組織における正規化「ヒットスパン100」/未消化正常組織プールにおける正規化「ヒットスパン100」。
【0275】
メチル化遺伝子座の血漿メチル化レベルを以下のように決定した:
血漿における正規化された「ヒットスパン100」/未消化正常血漿プールにおける正規化された「ヒットスパン100」。
【0276】
各患者について、バックグラウンドメチル化レベルが所定の閾値未満であるメチル化遺伝子座を選択することによって、低バックグラウンドメチル化遺伝子座のセットを編集した。
【0277】
加えて、腫瘍対正常組織における高メチル化を示す高メチル化遺伝子座のセットを編集した。高メチル化遺伝子座の腫瘍-正常差次的メチル化レベル(=腫瘍メチル化レベル-正常メチル化レベル)を決定し、所定の閾値を超える腫瘍-正常差次的メチル化レベルを有するメチル化遺伝子座を選択することによって、高メチル化遺伝子座のセットを編集した。
【0278】
腫瘍対正常組織において低メチル化を示す低メチル化遺伝子座のセットを編集した。低メチル化遺伝子座の腫瘍-正常差次的メチル化レベル(=腫瘍メチル化レベル-正常メチル化レベル)を決定し、所定の閾値を下回る腫瘍-正常差次的メチル化レベルを有するメチル化遺伝子座を選択することによって、高メチル化遺伝子座のセットを編集した。
【0279】
腫瘍と正常組織との間で異なるメチル化レベルを示さないイソメチル化遺伝子座のセットを編集した。イソメチル化遺伝子座のセットは、メチル化遺伝子座の腫瘍正常差次的メチル化レベル(=腫瘍メチル化レベル-正常メチル化レベル)を決定し、腫瘍正常高メチル化でも腫瘍正常低メチル化でもないメチル化遺伝子座を選択することによって編集した。
【0280】
各患者についての分析結果を
図9A~
図9Bに示す。何百万もの高メチル化及び低メチル化事象が、各患者の腫瘍において検出された。更に、各患者の血漿において、何千もの低バックグラウンド高メチル化事象が検出された。検出された事象は、推定メチル化マーカーを表す。
【0281】
図10A~
図10Bは、血漿において特に強い過剰メチル化シグナルを有する何千ものメチル化遺伝子座を同定することができたことを示す。
【0282】
全ゲノム変異分析
腫瘍変異は、同じ患者からの対応する正常組織において最も優勢な遺伝子型とは異なる、腫瘍DNAにおいて見出される遺伝子型として定義した。
【0283】
腫瘍DNA中の変異遺伝子型を有する読み取りの割合は、腫瘍変異レベルを表し、患者の血漿中の同じ変異遺伝子型を有する読み取りの割合は、血漿変異レベルを表した。各試料について、平均腫瘍及び血漿変異レベルを全ての変異にわたって計算し、腫瘍変異負荷を計算した(すなわち、平均血漿変異レベル/平均腫瘍変異レベル)。腫瘍変異負荷は、患者の血漿中の腫瘍DNAの割合を表す。
【0284】
各患者について、所定の閾値未満の血漿変異バックグラウンド(=正常血漿プールにおける変異の割合)を有する変異を選択することによって、低バックグラウンド変異のセットを編集した。更に、血漿中の平均変異率を各患者について決定した。各患者についての分析結果を
図11A~
図11Bに示す。
【0285】
マルチオミクス領域
マルチオミクス領域は、本明細書において、腫瘍高メチル化部位(正常組織と比較して腫瘍において高メチル化されている)及び所定の距離内の腫瘍変異部位を有するゲノム領域として定義する。本発明の方法は、無細胞DNA試料中のがん関連の遺伝的及び後成的変化を検出することを目的とする。したがって、同じ配列読み取り上の腫瘍高メチル化部位及び腫瘍変異部位の両方を含むDNAを同定するためには、150bpまでのマルチオミクス領域が好ましい。本実施例では、腫瘍過剰メチル化遺伝子座及び腫瘍変異が互いに100bp以内にあるマルチオミクス領域を、患者BMD LNG165及び患者BMD LNG166の腫瘍試料において検索した。
【0286】
分析により、患者BMD LNG165において6,060個のマルチオミクス領域が同定され、患者BMD LNG166において9,471個のマルチオミクス領域が同定された。BMD LNG165におけるマルチオミクス領域の例を、
図12に記載する(chr.7 pos.150220856-150220921)。
【0287】
マルチオミクスアラインメントは、マルチオミクス領域にわたるCIGAR&MAPQ>0&TLEN>0&TLEN≦500bpのアラインメントとして定義した。マルチオミクスアラインメントタイプの例は、
図13に記載するとおりであり、以下を含む:
がん表現型がメチル化位置(位置がメチル化されている)及び変異位置(変異体が存在する)の両方で見られる一致したメチル化アラインメント:アラインメントは、高メチル化制限部位の全てにわたり(アッセイで使用される制限酵素の認識配列の全ての文字がアラインメント中に存在し、例えば、HinP1IについてはGCGC)、読み取り中に変異遺伝子型を含有する。
【0288】
がん表現型がメチル化位置で見られ(位置がメチル化されている)、正常表現型が変異位置で見られる(WTバリアントが存在する)不一致メチル化アラインメント:アラインメントは、高メチル化制限部位の全てにわたり(例えば、GCGCの全ての文字がアラインメント中に存在する)、読み取り中にWT(参照)遺伝子型を含有する。
【0289】
正常な表現型がメチル化位置(この位置はメチル化されていない)及び変異位置(WT変異体が存在する)の両方で見られる一致した非メチル化アラインメント:アラインメントは、正確な切断部位で開始又は終了し(制限部位のn位で開始するか、又はn+1位で終了する)、読み取り中にWT(参照)遺伝子型を含む。
【0290】
正常表現型がメチル化位置で見られ(その位置は非メチル化である)、がん表現型が変異位置で見られる(変異バリアントが存在する)不一致非メチル化アラインメント:アラインメントは、正確な切断部位で開始又は終了し(制限部位のn位で開始するか、又はn+1位で終了する)、読み取り中に変異遺伝子型を含有する。
【0291】
上記は、メチル化感受性消化とそれに続く次世代配列決定を採用する本明細書に開示される方法が、少量のDNAで機能し、メチル化データ、変異データなどを含む膨大な量の情報を受け取るのに十分に高感度であるが正確であることを示す。この方法は、例えば新たなメチル化マーカーの発見、及び診療所での診断用途、の両方に有利である。この方法は、バイサルファイトでは検出できないシグナルの検出を可能にする。
【0292】
実施例3-メチル化及び非メチル化DNAレベルの直接計算
以下の実施例において、メチル化/非メチル化の計算は、血漿試料由来の無細胞DNAをメチル化感受性制限酵素HinP1I及びAciIで消化し、続いてライブラリ調製、次世代配列決定及び配列読み取りの分析を行うことによって行った。
【0293】
図14は、消化及び末端修復の前後のメチル化感受性HinP1I部位を示す。HinP1I部位でメチル化されていない無細胞DNA分子は消化を受け、HinP1I切断部位に対応する非平滑(粘着性)末端を有する二本鎖DNA分子を生じる。具体的には、HinP1Iは4塩基の切断部位を有するため、消化は、一方のDNA分子に2塩基の5’オーバーハングを有し、他方に相補的な5’オーバーハングを有する一対の二本鎖DNA分子を生成する。非平滑末端を末端修復に供して(例えば、NEBNext Ultra DNA Library Prep Kitを使用して)、平滑末端DNA分子を生成する。末端修復後、2種類のDNA断片が得られる:HinP1I認識配列の3番目のヌクレオチド(Gヌクレオチド)で終了する断片(3’末端)、及びHinP1I認識配列の2番目のヌクレオチド(Cヌクレオチド)で始まる断片(5’末端)。
【0294】
図15は、切断部位でメチル化又は非メチル化されているHinP1I制限部位にわたる無細胞DNA分子の消化及び末端修復後に得られたDNA断片の差異を示す。黒丸はメチル化を表す。切断部位でメチル化されたDNA分子は、消化後も無傷のままであり、切断部位にまたがるDNA断片が得られる。切断部位でメチル化されていないDNA分子は、酵素によって消化される。末端修復後、結果は、認識配列で開始又は終了するDNA断片(具体的には、認識配列の第3のヌクレオチドGで終了する断片及び第2のヌクレオチドCで開始する断片)である。
【0295】
実験手順
血漿試料を56人の健康な対照対象から収集した。QIAamp(登録商標)Circulating Nucleic Acid Kit(QIAGEN、Hilden,Germany)を使用して血漿試料からDNAを抽出し、プールした。450ngのアリコートを未消化対照DNAとして保持し、残りのDNA(800ng)を消化に供した:試料を10単位のHinP1I及び5単位のAciIとともに37℃で2時間インキュベートし、続いて65℃で20分間不活化した。消化後、NEBNext Ultra DNA Library Prep Kitを使用することによって配列決定ライブラリを調製した。Illumina NovaSeq 6000配列決定プラットフォームをS4フローセルとともに使用して、ライブラリを次世代配列決定に供した。消化及び未消化DNA試料からの配列読み取りを、完全ヒトゲノム(hg18ゲノム構築)に対してマッピングした。
【0296】
メチル化DNAのレベルの計算
メチル化DNAのレベルを計算するために、配列読み取りを4bp遺伝子座当たりの読み取りカウントとしてプロットした。制限酵素(HinP1I)の切断部位に対応する遺伝子座を分析し、完全無傷部位に及ぶ読み取りの数を記録した。
図16Aは、消化されたDNA試料中のHinP1I部位に対応する4bp遺伝子座の例示的な分析を示す(長方形でマーク)。図から分かるように、読み取りカウントの減少がこのHinP1I部位で観察される。減少は、酵素による消化を示し、この位置での読み取りカウントは、遺伝子座が無傷のままであるDNA断片の数に対応する。上記のように、HinP1Iはメチル化感受性であり、したがってメチル化DNAを切断しない。したがって、この制限遺伝子座の読み取りカウントは、制限遺伝子座がメチル化されたDNA試料中のDNA分子の数に対応する。
【0297】
制限遺伝子座でメチル化されたDNAのレベルは、以下のように計算される。
【0298】
(数1)
メチル化DNAのレベル=制限遺伝子座の実際の読み取りカウント
制限遺伝子座の予測読み取りカウント
ここで、制限遺伝子座の予想読み取りカウントは、以下から計算され得る:
(i)酵素によって切断されない4bp参照遺伝子座の読み取りカウント、
(ii)酵素によって切断されない複数の4bp参照遺伝子座(最適には、未消化試料中の制限遺伝子座と同じコピー数を有する遺伝子座からなる)の平均読み取りカウント、又は
(iii)未消化対照試料中の制限遺伝子座の読み取りカウント(深度差について補正可能)。
【0299】
参照遺伝子座は、制限遺伝子座のすぐ上流若しくは下流に位置する4bpストレッチ、又はゲノム中のより離れた位置に位置する4bp遺伝子座であり得る。
【0300】
深度差の補正は、以下のように実施され得る:
制限遺伝子座の予測読み取りカウント=
未消化試料中の制限遺伝子座の読み取りカウント/(未消化試料中の平均配列決定深度/消化試料中の平均配列決定深度)
平均配列決定深度=
読み取り総数*平均読み取り長/ゲノムサイズ
【0301】
得られたメチル化DNAのレベルに100を掛けて、元のDNA試料中の試験したHinP1I遺伝子座におけるメチル化DNAのパーセンテージ(%)を得ることができる。
【0302】
非メチル化DNAのレベルの計算
非メチル化DNAのレベルを計算するために、配列読み取りを、ゲノム全体の各塩基で終了する読み取りカウントとしてプロットした。代替的又は追加的に、配列読み取りは、ゲノムにわたって各塩基で開始する読み取りカウントとしてプロットされ得る。制限酵素(HinP1I)の切断部位に対応するゲノム遺伝子座を分析した。
【0303】
図16Bは、上記で分析したHinP1I部位及び隣接領域についての「開始」分析を示す。図から分かるように、切断部位の2番目のヌクレオチド(Cヌクレオチド)にピークが観察される。ピーク高さ、すなわち、切断部位の2番目のヌクレオチドで始まる配列読み取りの数は、酵素によって切断されたDNA断片の数に対応する。上記のように、HinP1Iはメチル化感受性であり、したがって非メチル化DNAを切断する。したがって、ピーク高さは、制限遺伝子座がメチル化されていないDNA試料中のDNA分子の数に対応する。
【0304】
図16Cは、上記及び隣接領域で分析されたHinP1I部位の「終了」分析を示す。図から分かるように、切断部位の3番目のヌクレオチド(Gヌクレオチド)にピークが観察される。ピーク高さ、すなわち、切断部位の3番目のヌクレオチドで終了する配列読み取りの数は、この切断部位で酵素によって切断されたDNA断片の数に対応する。上記のように、HinP1Iはメチル化感受性であり、したがって非メチル化DNAを切断する。したがって、ピーク高さは、制限遺伝子座がメチル化されていないDNA試料中のDNA分子の数に対応する。
【0305】
制限遺伝子座でメチル化されたDNAのレベルは、以下のように計算される:
非メチル化DNAのレベル=
(制限遺伝子座で開始又は終了する実際の読み取り数-制限遺伝子座で開始又は終了する予想読み取り数)/制限遺伝子座の予想読み取り数
【0306】
制限遺伝子座で開始又は終了する読み取りの予想数は、以下から計算することができる:
(i)酵素によって切断されない4bpの参照遺伝子座で開始又は終了する読み取りの数、
(ii)酵素によって切断されない4bp参照遺伝子座のファミリーで開始又は終了する読み取りの平均数、又は
(iii)未消化対照試料中の制限遺伝子座で開始又は終了する読み取りの数(深度差について補正可能)。
【0307】
制限遺伝子座の予想読み取りカウントは、以下から計算することができる:
(i)酵素によって切断されない4bp参照遺伝子座の読み取りカウント、
(ii)酵素によって切断されない複数の4bp参照遺伝子座(最適には、未消化試料中の制限遺伝子座と同じコピー数を有する遺伝子座からなる)の平均読み取りカウント、又は
(iii)未消化対照試料中の制限遺伝子座の読み取りカウント(深度差について補正可能)。
【0308】
参照遺伝子座は、制限遺伝子座のすぐ上流若しくは下流に位置する4bpストレッチ、又はゲノム中のより離れた位置に位置する4bp遺伝子座であり得る。
【0309】
本明細書中に開示されるような制限エンドヌクレアーゼによって切断される各DNA分子は、2つの断片を生じさせ、一方は、制限遺伝子座内のヌクレオチドで開始し、他方は、制限遺伝子座内のヌクレオチドで終結する。したがって、所与のDNA分子について、2つの異なる配列読み取りを得ることが可能であり得る。試料中に存在した非メチル化DNA分子の数の正確な分析のために、非メチル化DNAレベルの計算は、制限遺伝子座で開始する配列読み取りの数、制限遺伝子座で終了する配列読み取りの数に基づいて、又は2つの値の間の平均によって行われてもよいが、値の合計に基づいて行われなくてもよい。小断片を枯渇させるライブラリ調製方法を使用する場合、小断片の枯渇による偏りを回避するために、より多数の配列読み取りを有する配向を使用して非メチル化DNAレベルを計算することが好ましい。
【0310】
得られた非メチル化DNAのレベルに100を掛けて、元のDNA試料中の試験したHinP1I遺伝子座におけるメチル化DNAのパーセンテージ(%)を得ることができる。
【0311】
かかるメチル化/非メチル化分析は、低いCG含量を有するゲノム領域に位置するCG部位について特に有利である。
【0312】
メチル化+非メチル化DNAレベルの同時計算
メチル化及び非メチル化DNAのレベルを同時に計算するために、「総断片数」を最初に以下のように計算する:
総断片数=
制限遺伝子座の読み取りカウント+制限遺伝子座で開始又は終了する読み取りの数-制限遺伝子座で開始又は終了する読み取りの予想数
【0313】
制限遺伝子座で開始又は終了する読み取りの予想数は、上記のように計算する。
【0314】
メチル化及び非メチル化DNAのレベルは、以下のように総断片数を用いて計算される:
【0315】
(数2)
メチル化DNAのレベル=制限遺伝子座の読み取りカウント
総断片数
非メチル化DNAのレベル=
(制限遺伝子座で開始又は終了する読み取りの数-制限遺伝子座で開始又は終了する読み取りの予想数)/総断片数
【0316】
得られたメチル化及び非メチル化DNAのレベルに100を掛けて、元のDNA試料中の試験したHinP1I遺伝子座におけるメチル化及び非メチル化DNAのパーセンテージ(%)を得ることができる。
【0317】
実施例4-メチル化及び非メチル化DNAレベルを用いた制限遺伝子座の分析
メチル化及び非メチル化DNAのレベルを、実施例3に記載されるプールされた血漿DNA試料において、CG#1~8として同定されるHinP1Iの制限遺伝子座内に位置する8つのCGジヌクレオチドについて計算した(表4)。実施例3に詳述されるように、プールされたDNA試料をメチル化感受性制限酵素HinP1I及びAciIで消化し、続いてライブラリ調製、次世代配列決定、及び完全ヒトゲノムに対する配列読み取りのアラインメントを行った。
【0318】
CG#1(高度にメチル化されている)、CG#4(高度にメチル化されていない)及びCG#5についての例示的な生データを
図17A~
図17Cに示す。各図の上パネルは、制限遺伝子座の読み取り数を決定するための、4bp遺伝子座当たりの読み取り数を示す。制限遺伝子座を長方形で示す。各図の下パネルは、制限遺伝子座で開始又は終了する配列読み取りの読み取りカウントを決定するための、参照ゲノム中の各塩基で開始又は終了する読み取りカウントを示す。「終了」又は「開始」の提示は、より多数の読み取りを提供した方向に従う。
【0319】
各制限遺伝子座におけるメチル化DNAのレベルは、制限遺伝子座の読み取りカウントを予想読み取りカウント(対照遺伝子座の読み取りカウント)で割り、100を掛けて制限遺伝子座におけるメチル化DNAのパーセンテージを得ることによって計算した。
【0320】
各制限遺伝子座における非メチル化DNAのレベルは、制限遺伝子座で開始又は終了する予想読み取り数を減算し、続いて制限遺伝子座の予想読み取り数で除算し、100を乗算して制限遺伝子座における非メチル化DNAのパーセンテージを得ることによって計算した。各制限遺伝子座について、制限遺伝子座で開始する読み取りの数及び制限遺伝子座で終了する読み取りの数を決定し、読み取りのより大きい数に基づいて更なる計算を行った。
【0321】
不一致レベル(%)は、本実施例で計算されたメチル化及び非メチル化パーセンテージの合計と、100%の予想合計との間の差を決定することによって、各制限遺伝子座について計算した。
不一致%=(メチル化%+非メチル化%)-100
【0322】
結果を表4にまとめる。制限遺伝子座を不一致のレベルに従って昇順で表4に列挙する。不一致のレベルは、潜在的なDNAメチル化マーカーを評価及び選択する際に使用することができ、不一致のレベルがより低い遺伝子座が好ましい場合がある。不一致のレベルはまた、すでに同定されたDNAメチル化マーカーについての適切な試料処理及び分析の指標として使用され得、ここで、不一致の低いレベルは、適切な試料処理及び分析を示す。
【0323】
【0324】
結果は、同じ配列決定データを使用するメチル化に加えて非メチル化の直接決定が、ゲノム領域の相補的なメチル化情報を提供し、改善されたメチル化プロファイリング、潜在的なDNAメチル化マーカーのより正確かつ有効な評価、及びその後の試料間のメチル化差異のより正確な分析を可能にすることを実証する。
【0325】
実施例5-肺がんDNAメチル化マーカーにおけるメチル化プロファイリング及び肺がんの診断
血漿試料から抽出したDNA試料のメチル化プロファイルを、肺がんDNAと正常な非肺がんDNAとの間で差次的にメチル化されたHinP1Iの制限遺伝子座を含む6つのゲノム領域で決定する。本発明の出願人に譲渡された国際公開第2019/142193号において以前に開示されたゲノム領域は、配列番号1~6として同定され、それらを表5に詳述する。
【0326】
【表5】
*開始位置。説明はhg18ゲノムビルド上の位置を指す
【0327】
図18は、本発明の実施形態による、DNA試料のメチル化をプロファイリングするための例示的な方法を説明するフローチャートである。例示的な方法は、以下のステップを含む。
1801-メチル化感受性制限エンドヌクレアーゼHinP1IでDNA試料を消化する、
1802-複数のDNA断片にライゲーションされたアダプタを使用して、消化されたDNAから配列決定ライブラリを調製する、
1803-配列読み取りを得るための配列決定ライブラリのハイスループット配列決定、
1804-完全ヒトゲノムに対するマッピング配列読み取り、
1805-肺がんDNAと正常な非肺がんDNAとの間で差次的にメチル化された制限遺伝子座を含むゲノム領域1~6を選択する、
1806-ゲノム領域1~6の各制限遺伝子座について、制限遺伝子座の読み取りカウントを決定する、
1807-ゲノム領域1~6の各制限遺伝子座について、制限遺伝子座の第2のヌクレオチドで開始する配列読み取りの読み取りカウント及び制限遺伝子座の最後から2番目のヌクレオチドで終了する配列読み取りの読み取りカウントを決定し、より大きい読み取りカウントを有する配向を選択する、
1808-ゲノム領域1~6の各制限遺伝子座について、制限遺伝子座の読み取りカウントに基づいてメチル化DNAのレベルを計算する、
1809-ゲノム領域1~6の各制限遺伝子座について、制限遺伝子座内のヌクレオチドで開始又は終了する配列読み取りの読み取りカウントに基づいて、非メチル化DNAのレベルを計算する、
それにより、ゲノム領域1~6におけるDNA試料のメチル化プロファイルを得る(ステップ1910)。
【0328】
図19は、本発明の実施形態による、DNA試料のメチル化をプロファイリングするための追加の例示的な方法を説明するフローチャートである。例示的な方法は、以下のステップを含む。
1901-メチル化感受性制限エンドヌクレアーゼHinP1IでDNA試料を消化する、
1902-複数のDNA断片にライゲーションされたアダプタを使用して、消化されたDNAから配列決定ライブラリを調製する、
1903-肺がんDNAと正常な非肺がんDNAとの間で差次的にメチル化された制限遺伝子座を含むゲノム領域1~6を富化する、
1904-配列読み取りを得るための富化された配列決定ライブラリのハイスループット配列決定、
1905-配列読み取りをゲノム領域1~6のうちの1つに割り当てる、
上記のステップ1906~1910に従って操作し、ゲノム領域1~6でのDNA試料のメチル化プロファイルを得る。
【0329】
図20は、本発明の実施形態による、DNA試料が肺がんに対して陽性であるか陰性であるかを決定するための例示的な方法を説明するフローチャートである。例示的な方法は、以下のステップを含む。
2001-上記のように、メチル化及び非メチル化DNAのレベルを組み合わせて、ゲノム領域1~6におけるDNA試料のメチル化プロファイルを得る、
2002-DNA試料のメチル化プロファイルを、ゲノム領域1~6における少なくとも1つの参照DNAメチル化プロファイル(例えば、肺がん参照プロファイル及び/又は健常非肺がんメチル化プロファイル)と比較する、及び
2003-比較に基づいて、DNA試料を肺がんについて陽性又は陰性として同定する。
【0330】
図21は、本発明の実施形態による、DNA試料が肺がんに対して陽性であるか陰性であるかを決定するための追加の例示的な方法を説明するフローチャートである。例示的な方法は、以下のステップを含む。
2101-上記のように、メチル化及び非メチル化DNAのレベルを組み合わせて、ゲノム領域1~6におけるDNA試料のメチル化プロファイルを得る、
2102-ゲノム領域1~6におけるメチル化プロファイルに基づいてスコアを計算する、
2103-スコアをカットオフ値と比較する、及び
2104-比較に基づいて、DNA試料を肺がんについて陽性又は陰性として同定する。
【0331】
特定の実施形態の前述の説明は、本発明の一般的な性質を完全に明らかにするため、他の者は、現在の知識を適用することにより、過度の実験なしに、及び一般的な概念から逸脱することなく、かかる特定の実施形態の様々な用途に容易に修正及び/又は適合でき、したがって、かかる適合及び変更は、開示された実施形態の均等物の意味及び範囲内で理解されるべきであり、そのように意図されている。本明細書で使用される表現又は用語は、説明を目的としたものであり、限定を目的としたものではないことを理解されたい。開示された様々な化学構造及び機能を実施するための手段、材料、及びステップは、本発明から逸脱することなく、様々な代替形態をとることができる。
【手続補正書】
【提出日】2023-07-20
【手続補正1】
【補正対象書類名】明細書
【補正対象項目名】配列表
【補正方法】追加
【補正の内容】
【配列表】
【国際調査報告】