IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユニバーシティー ヘルス ネットワークの特許一覧 ▶ シナイ ヘルス システムの特許一覧

特開2023-139162メチローム解析を用いる癌の検出及び分類
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023139162
(43)【公開日】2023-10-03
(54)【発明の名称】メチローム解析を用いる癌の検出及び分類
(51)【国際特許分類】
   C12Q 1/6886 20180101AFI20230926BHJP
   C12Q 1/6869 20180101ALI20230926BHJP
   C12Q 1/68 20180101ALI20230926BHJP
   C12N 15/11 20060101ALN20230926BHJP
【FI】
C12Q1/6886 Z
C12Q1/6869 Z
C12Q1/68 100Z
C12N15/11 Z
【審査請求】有
【請求項の数】20
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2023119203
(22)【出願日】2023-07-21
(62)【分割の表示】P 2020501564の分割
【原出願日】2018-07-11
(31)【優先権主張番号】62/531,527
(32)【優先日】2017-07-12
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】507148294
【氏名又は名称】ユニバーシティー ヘルス ネットワーク
(71)【出願人】
【識別番号】517304738
【氏名又は名称】シナイ ヘルス システム
(74)【代理人】
【識別番号】100114188
【弁理士】
【氏名又は名称】小野 誠
(74)【代理人】
【識別番号】100119253
【弁理士】
【氏名又は名称】金山 賢教
(74)【代理人】
【識別番号】100124855
【弁理士】
【氏名又は名称】坪倉 道明
(74)【代理人】
【識別番号】100129713
【弁理士】
【氏名又は名称】重森 一輝
(74)【代理人】
【識別番号】100137213
【弁理士】
【氏名又は名称】安藤 健司
(74)【代理人】
【識別番号】100143823
【弁理士】
【氏名又は名称】市川 英彦
(74)【代理人】
【識別番号】100183519
【弁理士】
【氏名又は名称】櫻田 芳恵
(74)【代理人】
【識別番号】100196483
【弁理士】
【氏名又は名称】川嵜 洋祐
(74)【代理人】
【識別番号】100160749
【弁理士】
【氏名又は名称】飯野 陽一
(74)【代理人】
【識別番号】100160255
【弁理士】
【氏名又は名称】市川 祐輔
(74)【代理人】
【識別番号】100146318
【弁理士】
【氏名又は名称】岩瀬 吉和
(74)【代理人】
【識別番号】100127812
【弁理士】
【氏名又は名称】城山 康文
(72)【発明者】
【氏名】デ カルヴァルホ ダニエル ディニズ
(72)【発明者】
【氏名】ブラットマン スコット ビクター
(72)【発明者】
【氏名】シンガニア ラジャット
(72)【発明者】
【氏名】チャクラヴァルシー アンクール ラヴィナラヤナ
(72)【発明者】
【氏名】シェン シュー イー
(57)【要約】      (修正有)
【課題】対象が癌を有するか又は癌を有するリスクがあることを判定する方法を提供する。
【解決手段】(a)対象のセルフリーデオキシリボ核酸(cfDNA)試料から生成された複数の核酸分子を配列決定に供して、複数の配列決定リードを得る工程であって、前記配列決定が亜硫酸水素塩変換を伴わない工程と、(b)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子についてのメチル化プロファイルを生成する工程と、(c)前記メチル化プロファイルをコンピュータ処理して、少なくとも94%の受信者動作特性曲線下部面積(AUROC)において、前記対象が前記癌を有するか又は前記癌を有するリスクがあることを判定する工程とを備える方法である。前記癌が、肺癌、乳癌、結直腸癌、急性骨髄性白血病、及び多形神経膠芽腫からなる群から選択される。
【選択図】図1(1)
【特許請求の範囲】
【請求項1】
対象における癌細胞由来のDNAの存在を検出する方法であって、
(a)対象由来のセルフリーDNAの試料を準備する工程と、
(b)前記試料をライブラリ調製に供して、引き続く前記セルフリーのメチル化DNA
の配列決定を可能にする工程と、
(c)第1量のフィラーDNAを前記試料に加え、次いで任意選択的に前記試料を変性
する工程であって、前記フィラーDNAの少なくとも一部分がメチル化されている工程と

(d)メチル化ポリヌクレオチドに選択的な結合剤を使用して、セルフリーのメチル化
DNAを捕捉する工程と、
(e)捕捉された前記セルフリーのメチル化DNAを配列決定する工程と、
(f)前記捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体
由来の対照のセルフリーのメチル化DNA配列と比較する工程と、
(g)前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセ
ルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来
のDNAの存在を特定する工程と
を備える方法。
【請求項2】
前記試料が、前記対象の血液又は血漿に由来する請求項1に記載の方法。
【請求項3】
比較工程(f)が、統計的分類器を使用するフィットに基づく請求項1又は請求項2に
記載の方法。
【請求項4】
前記分類器が機械学習由来である請求項3に記載の方法。
【請求項5】
前記分類器が、エラスティックネット分類器、lasso、サポートベクターマシン、
ランダムフォレスト、又はニューラルネットワークである請求項4に記載の方法。
【請求項6】
健康な個体及び癌性個体由来の前記対照のセルフリーのメチル化DNA配列が、健康な
個体と癌性個体との間の可変メチル化領域(DMR)のデータベースに含まれる請求項1
から請求項5のいずれか一項に記載の方法。
【請求項7】
健康な個体及び癌性個体由来の前記対照のセルフリーのメチル化DNA配列が、セルフ
リーDNA由来のDNAにおいて健康な個体と癌性個体との間で差次的にメチル化されて
いる対照のセルフリーのメチル化DNA配列に限定される請求項1から請求項6のいずれ
か一項に記載の方法。
【請求項8】
前記対照のセルフリーのメチル化DNA配列が、血漿由来のDNAにおいて健康な個体
と癌性個体との間で差次的にメチル化されている請求項7に記載の方法。
【請求項9】
前記試料が、100ng未満、75ng未満、又は50ng未満のセルフリーDNAを
有する請求項1から請求項8のいずれか一項に記載の方法。
【請求項10】
前記第1量のフィラーDNAが、約5%、10%、15%、20%、30%、40%、
50%、60%、70%、80%、90%、又は100%のメチル化フィラーDNAを含
み、残部が非メチル化フィラーDNAであり、好ましくは5%~50%、10%~40%
、又は15%~30%がメチル化フィラーDNAである請求項1から請求項9のいずれか
一項に記載の方法。
【請求項11】
前記第1量のフィラーDNAが20ng~100ng、好ましくは30ng~100n
g、より好ましくは50ng~100ngである請求項1から請求項9のいずれか一項に
記載の方法。
【請求項12】
前記試料由来のセルフリーDNA及び前記第1量のフィラーDNAが、合わせて少なく
とも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む請求項1か
ら請求項11のいずれか一項に記載の方法。
【請求項13】
前記フィラーDNAが50bp~800bp長、好ましくは100bp~600bp長
、より好ましくは200bp~600bp長である請求項1から請求項12のいずれか一
項に記載の方法。
【請求項14】
前記フィラーDNAが二本鎖である請求項1から請求項13のいずれか一項に記載の方
法。
【請求項15】
前記フィラーDNAがジャンクDNAである請求項1又は請求項2に記載の方法。
【請求項16】
前記フィラーDNAが内在DNA又は外来DNAである請求項1から請求項3のいずれ
か一項に記載の方法。
【請求項17】
前記フィラーDNAが非ヒトDNA、好ましくはλDNAである請求項16に記載の方
法。
【請求項18】
前記フィラーDNAがヒトDNAに対するアラインメントを有しない請求項1から請求
項17のいずれか一項に記載の方法。
【請求項19】
前記結合剤が、メチルCpG結合ドメインを含むタンパク質である請求項1から請求項
18のいずれか一項に記載の方法。
【請求項20】
前記タンパク質がMBD2タンパク質である請求項1から請求項19のいずれか一項に
記載の方法。
【請求項21】
工程(d)が、抗体を使用して前記セルフリーのメチル化DNAを免疫沈降させること
を含む請求項1から請求項20のいずれか一項に記載の方法。
【請求項22】
免疫沈降のために少なくとも0.05μg、好ましくは少なくとも0.16μgの前記
抗体を前記試料に加えることを含む請求項21に記載の方法。
【請求項23】
前記抗体が5-MeC抗体である請求項21に記載の方法。
【請求項24】
前記免疫沈降反応を確認するために、工程(c)後に第2量の対照DNAを前記試料に
加える工程をさらに備える請求項21に記載の方法。
【請求項25】
セルフリーのメチル化DNAの捕捉を確認するために、工程(c)後に第2量の対照D
NAを前記試料に加える工程をさらに備える請求項1から請求項23のいずれか一項に記
載の方法。
【請求項26】
癌細胞由来のDNAの存在を特定する工程が、原発癌細胞組織を特定することをさらに
備える請求項1から請求項25のいずれか一項に記載の方法。
【請求項27】
前記原発癌細胞組織を特定することが、癌亜型を特定することをさらに備える請求項2
6に記載の方法。
【請求項28】
前記癌亜型が、ステージ、組織学、遺伝子発現パターン、コピー数異常、再構成、又は
点変異状態に基づいて前記癌を識別する請求項27に記載の方法。
【請求項29】
工程(f)の比較が全ゲノムにわたって実施される請求項1から請求項28のいずれか
一項に記載の方法。
【請求項30】
工程(f)の比較が全ゲノムから特定の調節領域に限定される請求項1から請求項28
のいずれか一項に記載の方法。
【請求項31】
前記調節領域が、FANTOM5エンハンサー、CpGアイランド、CpGショア、C
pGシェルフ、又はこれらのいずれかの組み合わせである請求項30に記載の方法。
【請求項32】
工程(f)及び工程(g)がコンピュータプロセッサにより実施される請求項1から請
求項31のいずれか一項に記載の方法。
【請求項33】
癌細胞由来のDNAの存在を検出し、癌亜型を特定する方法であって、
a. 対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と

b. 捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来
の対照のセルフリーのメチル化DNA配列と比較する工程と、
c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセ
ルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来
のDNAの存在を特定する工程と、
d. 工程c.からの癌細胞由来のDNAが特定される場合、工程bの比較に基づいて
、原発癌細胞組織及び癌亜型をさらに特定する工程と
を備える方法。
【請求項34】
癌細胞由来のDNAの存在を検出し、癌亜型を特定するコンピュータ実装方法であって

a. 少なくとも1つのプロセッサで、対象試料由来のセルフリーのメチル化DNAの
配列決定データを受け取る工程と、
b. 前記少なくとも1つのプロセッサで、捕捉されたセルフリーのメチル化DNAの
配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較す
る工程と、
c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセ
ルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、前記少なく
とも1つのプロセッサで、癌細胞由来のDNAの存在を特定し、工程c.からの癌細胞由
来のDNAが特定される場合、工程bの比較に基づいて、原発癌細胞組織及び癌亜型をさ
らに特定する工程と
を備える方法。
【請求項35】
プロセッサ及び前記プロセッサに接続されたメモリを有する汎用性コンピュータと組み
合わせて使用するためのコンピュータプログラム製品であって、コンピュータメカニズム
がエンコードされたコンピュータ可読記憶媒体を含み、前記コンピュータプログラムメカ
ニズムが前記コンピュータの前記メモリにローディングされ、前記コンピュータに請求項
34に記載の方法を実行させてもよいコンピュータプログラム製品。
【請求項36】
請求項35に記載のコンピュータプログラム製品を保存するためのデータ構造が保存さ
れたコンピュータ可読媒体。
【請求項37】
癌細胞由来のDNAの存在を検出して癌亜型を特定するためのデバイスであって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信している電子メモリと
を備え
前記電子メモリは、前記少なくとも1つのプロセッサで実行される場合に、前記少なく
とも1つのプロセッサに、
a. 対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取ることと

b. 捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来
の対照のセルフリーのメチル化DNA配列と比較することと、
c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセ
ルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来
のDNAの存在を特定し、癌細胞由来のDNAが特定される場合に、工程bの比較に基づ
いて、原発癌細胞組織及び癌亜型をさらに特定することと
を実行させるプロセッサ実行可能なコードを保存するデバイス。
【請求項38】
癌細胞由来のDNAの存在を検出して、2以上の可能性のある器官から前記癌細胞が発
生した前記癌の場所を決定する方法であって、
(a)対象由来のセルフリーDNAの試料を準備する工程と、
(b)メチル化ポリヌクレオチドに選択的な結合剤を使用して、前記試料由来のセルフ
リーのメチル化DNAを捕捉する工程と、
(c)捕捉された前記セルフリーのメチル化DNAを配列決定する工程と、
(d)前記捕捉されたセルフリーのメチル化DNAの配列パターンを対照個体の2以上
の母集団のDNA配列パターンと比較する工程であって、前記2以上の母集団の各々は、
異なる器官に限局性癌を有する工程と、
(e)前記セルフリーDNAのメチル化のパターンと前記2以上の母集団のうちの1つ
のメチル化のパターンとの間の統計的に有意な類似性に基づいて、どの器官で前記癌細胞
が発生したかを決定する工程と
を備える方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願
本願は、2017年7月12日出願の米国仮特許出願第62/531527号に基づく
優先権を主張する。この米国仮特許出願は、参照により本願明細書に援用される。
【0002】
技術分野
本発明は、癌の検出及び分類、より具体的には癌の検出及び分類のためのメチローム解
析の使用に関する。
【背景技術】
【0003】
バイオマーカーのソースとしての循環セルフリーDNA(cfDNA)の使用は、腫瘍
学において急速に勢いを持ってきている[1]。バイオマーカーとしてのcfDNAのD
NAメチル化マッピングの使用は、液体細胞診の分野で大きなインパクトを有することが
できよう。というのも、cfDNAのDNAメチル化マッピングの使用により、低侵襲的
に、原発組織の特定を可能にし[2]、癌の型及び亜型の分類を可能にし、そして癌患者
を階層化することができると思われるからである[3]。さらには、cfDNAの全ゲノ
ムDNAメチル化マッピングを使用することで、疾患の証拠となるX線像がないステージ
I~IIIの癌を有する患者において循環腫瘍DNA(ctDNA)を検出する際の重大
な感度の問題を克服することができよう。既存のctDNA検出方法は、変異を配列決定
することに基づいており、腫瘍と健常な循環cfDNAとの間を見分けるために利用可能
な反復突然変異の数が限られていることに一部は起因して、感度に限界がある[4、5]
。他方、全ゲノムDNAメチル化マッピングは、循環腫瘍DNA(ctDNA)を健常な
循環セルフリーDNA(cfDNA)から見分けるために使用されてもよい多くのエピジ
ェネティックな変異を活用する。例えば、上衣腫等のいくつかの腫瘍型は、何ら顕著な再
発性体細胞変異もなく広範なDNAメチル化異常を有することができる[6]。
【0004】
セルフリーのメチル化DNAを捕捉する特定の方法が国際公開第2017/19021
5号パンフレットに記載されており、この特許文献は、参照により援用される。
【先行技術文献】
【特許文献】
【0005】
【特許文献1】国際公開第2017/190215号パンフレット
【発明の概要】
【課題を解決するための手段】
【0006】
一態様では、対象における癌細胞由来のDNAの存在を検出する方法であって、対象由
来のセルフリーDNAの試料を準備する工程と、上記試料をライブラリ調製に供して、引
き続く上記セルフリーのメチル化DNAの配列決定を可能にする工程と、第1量のフィラ
ーDNAを上記試料に加え、次いで任意選択的に上記試料を変性する工程であって、上記
フィラーDNAの少なくとも一部分がメチル化されている工程と、メチル化ポリヌクレオ
チドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、捕捉
された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリ
ーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル
化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の
配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性が
ある場合に、癌細胞由来のDNAの存在を特定する工程とを備える方法が提供される。
【0007】
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定する方法であって、対
象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、捕捉され
たセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリ
ーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNA
の1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意
な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と、癌細胞由来のDN
Aが特定される場合に、上記比較に基づいて原発癌細胞組織及び癌亜型をさらに特定する
工程とを備える方法が提供される。
【0008】
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定するコンピュータ実装
方法であって、少なくとも1つのプロセッサで、対象試料由来のセルフリーのメチル化D
NAの配列決定データを受け取る工程と、上記少なくとも1つのプロセッサで、捕捉され
たセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリ
ーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNA
の1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意
な類似性がある場合に、上記少なくとも1つのプロセッサで、癌細胞由来のDNAの存在
を特定し、癌細胞由来のDNAが特定される場合に、上記比較に基づいて原発癌細胞組織
及び癌亜型をさらに特定する工程とを備える方法が提供される。
【0009】
一態様では、プロセッサ及びこのプロセッサに接続されたメモリを有する汎用性コンピ
ュータと組み合わせて使用するためのコンピュータプログラム製品であって、コンピュー
タメカニズムがエンコードされたコンピュータ可読記憶媒体を含み、上記コンピュータプ
ログラムメカニズムが上記コンピュータの上記メモリにローディングされ、上記コンピュ
ータに本願明細書に記載される方法を実行させてもよいコンピュータプログラム製品が提
供される。
【0010】
一態様では、本願明細書に記載されるコンピュータプログラム製品を保存するためのデ
ータ構造が保存されたコンピュータ可読媒体が提供される。
【0011】
一態様では、癌細胞由来のDNAの存在を検出して癌亜型を特定するためのデバイスで
あって、少なくとも1つのプロセッサと、上記少なくとも1つのプロセッサと通信してい
る電子メモリとを備え、上記電子メモリは、上記少なくとも1つのプロセッサで実行され
る場合に、上記少なくとも1つのプロセッサに、対象試料由来のセルフリーのメチル化D
NAの配列決定データを受け取ることと、捕捉されたセルフリーのメチル化DNAの配列
を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較するこ
とと、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセル
フリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来の
DNAの存在を特定し、癌細胞由来のDNAが特定される場合、上記比較に基づいて、原
発癌細胞組織及び癌亜型をさらに特定することとを実行させるプロセッサ実行可能なコー
ドを保存するデバイスが提供される。
【0012】
一態様では、癌細胞由来のDNAの存在を検出して、2以上の可能性のある器官から上
記癌細胞が発生した上記癌の場所を決定する方法であって、対象由来のセルフリーDNA
の試料を準備する工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、上記
試料由来のセルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーの
メチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配
列パターンを対照個体の2以上の母集団のDNA配列パターンと比較する工程であって、
上記2以上の母集団の各々は、異なる器官に限局性癌を有する工程と、上記セルフリーD
NAのメチル化のパターンと上記2以上の母集団のうちの1つのメチル化のパターンとの
間の統計的に有意な類似性に基づいて、どの器官で上記癌細胞が発生したかを決定する工
程とを備える方法が提供される。
【図面の簡単な説明】
【0013】
本発明の好ましい実施形態のこれらの特徴及び他の特徴は、添付の図面が参照される以
下の詳細な説明においてより明らかとなるであろう。
【0014】
図1(1)】図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。A)ctDNAの濃度(列)、調べられたDMR数(行)、及びシークエンシング深度(x軸)の関数としての少なくとも1つのエピ変異を検出する確率のコンピュータシミュレーション。B)血漿cfDNAを模倣するように断片化されたHCT116細胞系由来の1~100ngのインプットDNAに対するDNAメチル化シグナル間の全ゲノムピアソン(Pearson)相関。各濃度は、2つの生物的複製物を有する。
図1(2)】図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。C)HCT116由来の異なる濃度のインプットDNAからのcfMeDIP-seqから得られるDNAメチル化プロファイル(緑色のトラック)、並びにENCODE(ENCSR000DFS)から得られるRRBS(Reduced Representation Bisulfite Sequencing)HCT116データ及びGEO(GSM1465024)から得られるWGBS(Whole-Genome Bisulfite Sequencing)HCT116データ。ヒートマップ(RRBSトラック)について、黄色はメチル化を意味し、青色は非メチル化を意味し、灰色はカバレッジなしを意味する。
図1(3)】図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。D~E)多発性骨髄腫(MM)細胞系MM1.S中へのCRC細胞系HCT116の段階希釈。cfMeDIP-seqが純粋HCT116 DNA(100%CRC)、純粋MM1.S DNA(100%MM)並びにMM DNA中に希釈された10%、1%、0.1%、0.01%、及び0.001%CRC DNAにおいて実施された。すべてのDNAが血漿cfDNAを模倣するように断片化された。本発明者らは、実測と予測の(D)DMR数及び(E)これらのDMR内のDNAメチル化シグナル(RPKM単位)にほぼ完全な線形相関(r=0.99、p<0.0001)を認めた。
図1(4)】図1は、cfDNAのメチローム解析が少ない量のインプットDNAの中のctDNAを濃縮し検出するための高感度の手法であることを示す。F)同じ希釈系列において、既知の体細胞変異は、バックグラウンドシークエンサー及びポリメラーゼエラー率を超える超深度(>10,000×)標的配列決定によって1/100対立遺伝子割合においてのみ検出可能である。CRC細胞系における各変異の部位に各塩基又は挿入/欠失を含むリードの割合が示されている。G)2人の結直腸癌患者からの患者由来の異種移植片(PDX)を有するマウスの血漿中の総cfDNA(ヒト+マウス)に対する百分率としてのctDNA(ヒト)の頻度。
図2A図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。A)癌の分類のための機械学習分類器構築の手法を示す概略図。
図2B図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。B)多クラスエラスティックネット機械学習分類器内に含まれるDMRのヒートマップ。これらの分類器は、健康な提供者由来の血漿DNA試料(n=24)、肺癌(n=25)、乳癌(n=25)、結直腸癌(n=23)、急性骨髄性白血病(AML)(n=28)、及び多形神経膠芽腫(GBM)(n=71)由来の血漿DNA試料で訓練された。階層的クラスタ分析方法:Ward。
図2C図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。C)モデルの10%又は25%において特定された癌種関連DMRのtSNE(t-Distributed Stochastic Neighbor Embedding:t分布型確率的近傍埋め込み)による2D視覚化。
図2D図2は、血漿cfDNAのメチローム解析が腫瘍の分類を可能にすることを示す。D)血漿cfDNAメチル化ベースの多癌分類器についての性能測定基準。受信者オペレータ曲線下部面積(area under the receiver operator curve:auROC)が、エラスティックネット機械学習分類器の50分割生成の後の各癌種及び健康な提供者についてy軸に示されている。
図3A図3は、独立のコホートにおける多癌分類器の検証を示す。A)肺癌(LUC)(n=55LUC対n=97その他)、AML(n=35AML対n=117その他)、及び健康な提供者(n=62健康な提供者対n=90その他)のコホートでの多癌分類器の独立の検証についてROC曲線が示されている。
図3B図3は、独立のコホートにおける多癌分類器の検証を示す。B)早期LUC(n=32ステージI~IIのLUC対n=97その他)及び末期LUC(n=23ステージIII~IV LUC対n=97その他)での多癌分類器の独立の検証についてのROC曲線が示されている。
図4A図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。A)癌亜型関連DMRのtSNE(t分布型確率的近傍埋め込み)による2D視覚化。乳癌亜型は、別個の遺伝子発現パターン及び転写因子活性(ER状態)並びに別個の腫瘍コピー数異常(HER2状態)を有する腫瘍を有する患者を見分ける能力を示す。AML亜型は、別個の再構成(FLT3状態)を有する腫瘍を有する患者を見分ける能力を示す。多形神経膠芽腫(GBM)亜型は、別個の点変異(IDH遺伝子変異状態)を有する腫瘍を有する患者を見分ける能力を示す。肺癌亜型は、予後的及び治療上の影響を有する別個の組織学(腺癌対扁平上皮癌対小細胞癌)を有する腫瘍を有する患者を見分ける能力を示す。
図4B図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。B)乳癌血漿試料において3つの乳癌亜型の正確な区別を可能にする上位DMRを示すヒートマップ。
図4C図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。C)AML患者血漿試料においてFLT3-ITD状態の正確な区別を可能にする上位DMRを示すヒートマップ。
図4D図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。D)多形神経膠芽腫(GBM)患者血漿試料においてIDH遺伝子変異状態の正確な区別を可能にする上位DMRを示すヒートマップ。
図4E図4は、血漿cfDNAのメチローム解析が腫瘍亜型の分類を可能にすることを示す。E)肺癌血漿試料において3つの肺癌組織学の正確な区別を可能にする上位DMRを示すヒートマップ。
図5図5は、本願明細書に記載される1以上の実施形態を実行するためのプラットフォームを提供するように好適に構成されたコンピュータデバイス、並びに関連する通信ネットワーク、デバイス、ソフトウェア及びファームウェアを示す。
図6(1)】図6は、配列決定飽和分析(sequencing saturation analysis)及び品質管理を示す。A)この図は、血漿cfDNAを模倣するように断片化されたHCT116 DNAからの各インプット濃度に対する各複製物からのcfMeDIP-seqデータを分析するBioconductorパッケージMEDIPSの飽和分析の結果を示す。
図6(2)】図6(1)の続きである。
図6(3)】図6(2)の続きである。
図6(4)】図6(3)の続きである。
図6(5)】図6(4)の続きである。
図6(6)】図6は、配列決定飽和分析及び品質管理を示す。B)HCT116細胞系の4つの開始DNA濃度(100ng、10ng、5ng、及び1ng)の2つの複製物においてプロトコルが試験された。反応特異度は、メチル化及び非メチル化添加シロイヌナズナDNAを使用して計算された。濃縮倍率比は、断片化HCT116 DNAのゲノム領域(メチル化精巣特異的H2B、TSH2B0及び非メチル化ヒトDNA領域(GAPDHプロモーター)のプライマー)を用いて計算された。水平の点線は25の濃縮倍率比閾値を示す。エラーバーは、±1s.e.mを表す。C)配列決定試料のCpG濃縮スコアは、インプット対照と比べて免疫沈降試料からのゲノム領域内のCpGの堅牢な濃縮を示す。CpG濃縮スコアは、上記領域のCpGの相対頻度をヒトゲノムのCpGの相対頻度で除算することにより得られた。エラーバーは、±1s.e.mを表す。
【発明を実施するための形態】
【0015】
以下の説明では、本発明の十分な理解を提供するために、多くの特定の細部が提示され
る。しかしながら、本発明はこれらの特定の細部なしで実施されてもよいということは理
解される。
【0016】
DNAメチル化プロファイルは、細胞型特異的であり、癌では乱れている。最少量の循
環セルフリーDNA(cfDNA)のメチローム解析のために設計された堅牢で高感度の
方法を使用して、本発明者らは、複数の腫瘍型を互いから、及び健康な個体から見分ける
数千の可変メチル化領域(Differentially Methylated Re
gions:DMR)を特定した。cfDNAのメチローム解析は、高感度であり、早期
患者において循環腫瘍DNA(ctDNA)を検出することに好適である。cfDNAメ
チロームを使用する機械学習由来の分類器は、交差検証に基づいて、5つの癌種を有する
患者及び健康な提供者由来の196個の血漿試料を正しく分類することができた。独立の
検証では、血漿cfDNA中で特定された同じDMRを使用して、上記分類器は、AML
、肺癌、及び健康な提供者、並びに早期及び末期の肺癌の両方を正しく分類することがで
きた。それゆえ、cfDNAのメチローム解析は、ctDNAの非侵襲性の早期検出のた
めに使用することができ、癌種を堅牢に分類することができる。
【0017】
一態様では、対象における癌細胞由来のDNAの存在を検出する方法であって、対象由
来のセルフリーDNAの試料を準備する工程と、上記試料をライブラリ調製に供して、引
き続く上記セルフリーのメチル化DNAの配列決定を可能にする工程と、第1量のフィラ
ーDNAを上記試料に加え、次いで任意選択的に上記試料を変性する工程であって、上記
フィラーDNAの少なくとも一部分がメチル化されている工程と、メチル化ポリヌクレオ
チドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、捕捉
された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリ
ーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル
化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の
配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性が
ある場合に、癌細胞由来のDNAの存在を特定する工程とを備える方法が提供される。
【0018】
出願人の共有に係る出願である、2016年5月3日出願の米国仮特許出願第62/3
31,070号及び2017年5月3日出願の国際特許、出願第PCT/CA2017/
000108号は、セルフリーのメチル化DNAを捕捉するための方法を記載しており、
これらは、参照により本願明細書に援用したものとする。
【0019】
癌は、慣例で起源組織によって、例えば、結直腸癌、乳癌、肺癌等と分類されてきた。
臨床腫瘍学の現在の実務では、癌の亜型を種々の分子的、発生的及び機能的基礎によって
見分けることができることが、ますます重要になってきている。治療上の決定は正確な癌
の亜型に依ることが多く、臨床医が、治療の開始に先立って亜型を特定することが必要で
ある場合がある。治療上の決定に影響を及ぼしうる癌の細分類の例としては、ステージ(
例えば、外科手術で処置される早期肺癌対化学療法で処置される末期肺癌)、組織学(組
織像)(例えば、肺癌における小細胞癌対腺癌対扁平上皮癌)、遺伝子発現パターン又は
転写因子活性(例えば、乳癌におけるER状態)、コピー数異常(例えば、乳癌における
HER2状態)、特異的再構成(例えば、AMLにおけるFLT3)、特異的遺伝子点変
異状態(例えば、IDH遺伝子点変異)、及びDNAメチル化パターン(例えば、脳癌に
おけるMGMT遺伝子プロモーターのメチル化)が挙げられる(しかしこれらに限定され
ない)。
【0020】
本願明細書に記載される方法は、実に様々な癌に適用可能であり、それら癌としては、
副腎癌、肛門癌、胆管癌、膀胱癌、骨癌、脳/cns腫瘍、乳癌、キャッスルマン病、子
宮頸癌、結腸/直腸癌、子宮内膜癌、食道癌、ユーイング腫瘍、眼癌、胆嚢癌、消化管カ
ルチノイド、消化管間質腫瘍(gist)、妊娠性絨毛性疾患、ホジキン病、カポジ肉腫
、腎癌、咽頭癌及び下咽頭癌、白血病(急性リンパ性白血病、急性骨髄性白血病、慢性リ
ンパ性白血病、慢性骨髄性白血病、慢性骨髄単球性白血病)、肝癌、肺癌(非小細胞、小
細胞、肺カルチノイド)、リンパ腫、皮膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄
異形成症候群、鼻腔癌及び副鼻腔癌、上咽頭(鼻咽頭)癌、神経芽細胞腫、非ホジキンリ
ンパ腫、口腔癌及び中咽頭癌、骨肉腫、卵巣癌、陰茎癌、下垂体部腫瘍、前立腺癌、網膜
芽細胞腫、横紋筋肉腫、唾液腺癌、成人軟部組織癌(成人軟部肉腫)、皮膚癌(基底細胞
癌及び扁平上皮癌、黒色腫、メルケル細胞癌)、小腸癌、胃癌、精巣癌、胸腺癌、甲状腺
癌、子宮肉腫、膣内癌、外陰癌、ワルデンシュトレームマクログロブリン血症、ウィルム
ス腫瘍が挙げられるが、これらに限定されない。
【0021】
ポリメラーゼ連鎖反応(PCR)及びそれに続くSanger(サンガー)シークエン
シング等、種々の配列決定技法が当業者に知られている。高スループット配列決定として
も知られる次世代シークエンシング(NGS)技法も利用可能であり、次世代シークエン
シング(NGS)技法としては、Illumina(Solexa)シークエンシング、
Roche 454シークエンシング、Ion torrent:Proton/PGM
シークエンシング、SOLiDシークエンシング等、種々の配列決定技術が挙げられる。
NGSは、従来使用されているSangerシークエンシングよりもはるかに速くて安価
に、DNA及びRNAの配列決定を可能にする。いくつかの実施形態では、上記配列決定
は、ショートリード配列決定のために最適化されている。
【0022】
用語「対象」は、本願明細書で使用する場合、動物界の任意のメンバー、好ましくはヒ
ト、最も好ましくは前立腺癌を有しているか、前立腺癌を有していたか、又は前立腺癌を
有していると疑われるヒトを指す。
【0023】
セルフリーのメチル化DNAは、血流の中を自由に循環しているDNAであって、DN
Aの種々の既知の領域でメチル化されているDNAである。セルフリーのメチル化DNA
を分析するために、試料、例えば、血漿試料が採取されてもよい。従って、いくつかの実
施形態では、上記試料は、対象の血液又は血漿である。
【0024】
本願明細書で使用する場合、「ライブラリ調製」は、リスト末端修復(list en
d-repair)、Aテーリング、アダプターライゲーション、又は後続のDNA配列
決定を可能にするためにセルフリーDNA上で行われる任意の他の調製を含む。
【0025】
本願明細書で使用する場合、「フィラーDNA」は非コードDNAとすることができ、
又はフィラーDNAは増幅産物(アプリコン)からなることができる。
【0026】
DNA試料は、例えば、十分な熱を使用して変性されていてもよい。
【0027】
いくつかの実施形態では、上記比較工程は、統計的分類器を使用するフィットに基づく
。DNAメチル化データを使用する統計的分類器が、試料を癌種又は亜型等の特定の病状
に振り分けるために使用されてもよい。癌種又は亜型の分類の目的では、分類器は、統計
モデル内で1以上のDNAメチル化変数(すなわち、特徴量)からなるであろうし、統計
モデルの出力は、別個の病状を見分けるための1以上の閾値を有することになろう。統計
的分類器で使用される特定の特徴量(1若しくは複数)及び閾値(1若しくは複数)は、
癌種若しくは亜型の先行知識に、最も情報が豊富であると思われる特徴量の先行知識に、
機械学習に、又はこれらの手法のうちの2以上のものの組み合わせに由来することができ
る。
【0028】
いくつかの実施形態では、上記分類器は機械学習由来である。好ましくは、上記分類器
は、エラスティックネット(elastic net)分類器、lasso、サポートベ
クターマシン、ランダムフォレスト、又はニューラルネットワークである。
【0029】
分析されるゲノム空間は、全ゲノムであってもよく、又は好ましくは調節領域(すなわ
ち、FANTOM5エンハンサー(FANTOM5 enhancer)、CpGアイラ
ンド(CpG Island)、CpGショア(CpG shore)及びCpGシェル
フ(CpG Shelf))に限定されてもよい。
【0030】
好ましくは、回収された添加メチル化DNAの百分率は、プルダウン効率変数を制御す
るための共変量として含まれる。
【0031】
複数の癌種(又は亜型)を互いから見分けることができる分類器のために、分類器は、
好ましくは、注目する各種(又は亜型)の一対比較からの可変メチル化領域からなるであ
ろう。
【0032】
いくつかの実施形態では、健康な個体及び癌性個体由来の対照のセルフリーのメチル化
DNA配列は、健康な個体と癌性個体との間の可変メチル化領域(DMR)のデータベー
スに含まれる。
【0033】
いくつかの実施形態では、健康な個体及び癌性個体由来の対照のセルフリーのメチル化
DNA配列は、血清、脳脊髄液、尿糞便、痰、胸水、腹水、涙、汗、パップスメア液、内
視鏡検査ブラッシング液等の体液から、好ましくは血漿からのセルフリーDNA由来のD
NAにおいて健康な個体と癌性個体との間で差次的にメチル化されている対照のセルフリ
ーのメチル化DNA配列に限定される。
【0034】
いくつかの実施形態では、上記試料は、100ng未満、75ng未満、又は50ng
未満のセルフリーDNAを有する。
【0035】
いくつかの実施形態では、上記第1量のフィラーDNAは、約5%、10%、15%、
20%、30%、40%、50%、60%、70%、80%、90%、又は100%のメ
チル化フィラーDNAを含み、残部は非メチル化フィラーDNAであり、好ましくは5%
~50%、10%~40%、又は15%~30%がメチル化フィラーDNAである。
【0036】
いくつかの実施形態では、上記第1量のフィラーDNAは、20ng~100ng、好
ましくは30ng~100ng、より好ましくは50ng~100ngである。
【0037】
いくつかの実施形態では、上記試料由来のセルフリーDNA及び上記第1量のフィラー
DNAは、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの
総DNAを含む。
【0038】
いくつかの実施形態では、上記フィラーDNAは、50bp~800bp長、好ましく
は100bp~600bp長、及びより好ましくは200bp~600bp長である。
【0039】
いくつかの実施形態では、上記フィラーDNAは二本鎖である。上記フィラーDNAは
二本鎖である。例えば、フィラーDNAは、ジャンクDNAであってもよい。また、フィ
ラーDNAは、内在DNAでも外来DNAでもよい。例えば、フィラーDNAは非ヒトD
NAであり、好ましい実施形態では、λDNAである。本願明細書で使用する場合、「λ
DNA」は腸内細菌ファージλDNAを指す。いくつかの実施形態では、フィラーDNA
は、ヒトDNAに対するアラインメントを有しない。
【0040】
いくつかの実施形態では、上記結合剤は、メチルCpG結合ドメインを含むタンパク質
である。1つのこのような例示的タンパク質はMBD2タンパク質である。本願明細書で
使用する場合、「メチルCpG結合ドメイン(MBD)」は、およそ70残基長でありか
つ1以上の対称的メチル化CpGを含むDNAに結合するタンパク質及び酵素の特定のド
メインを指す。MeCP2、MBD1、MBD2、MBD4及びBAZ2のMBDは、D
NAへの結合を媒介し、MeCP2、MBD1及びMBD2の場合には、メチル化CpG
への結合を優先的に媒介する。ヒトタンパク質MECP2、MBD1、MBD2、MBD
3及びMBD4は、メチルCpG結合ドメイン(MBD)の各々における存在によって関
連づけられる核タンパク質のファミリーを含む。これらのタンパク質の各々は、MBD3
を除いて、メチル化DNAに特異的に結合することができる。
【0041】
他の実施形態では、上記結合剤は抗体であり、セルフリーのメチル化DNAを捕捉する
ことは、その抗体を使用してセルフリーのメチル化DNAを免疫沈降させることを含む。
本願明細書で使用する場合、「免疫沈降」は、特定の抗原(ポリペプチド及びヌクレオチ
ド等)に特異的に結合する抗体を使用してその抗原を溶液から沈降させる技法を指す。こ
のプロセスは、特定のタンパク質又はDNAを試料から単離及び濃縮するために使用する
ことができ、そして抗体がその手順のある時点で固体基質に結合されることを必要とする
。固体基質としては、例えばビーズ、例えば磁気ビーズが挙げられる。他の種類のビーズ
及び固体基質は当該技術分野で公知である。
【0042】
1つの例示的抗体は5-MeC抗体である。免疫沈降手順については、いくつかの実施
形態では、少なくとも0.05μgのこの抗体が試料に加えられ、より好ましい実施形態
では、少なくとも0.16μgのこの抗体が試料に加えられる。免疫沈降反応を確認する
ために、いくつかの実施形態では、本願明細書に記載される方法は、第2量の対照DNA
を上記試料に加える工程をさらに備える。
【0043】
いくつかの実施形態では、当該方法は、免疫沈降反応を確認するために、第2量の対照
DNAを上記試料に加える工程をさらに備える。
【0044】
本願明細書で使用する場合、「対照」は陽性対照及び陰性対照の両方、又は少なくとも
陽性対照を含んでもよい。
【0045】
いくつかの実施形態では、当該方法は、セルフリーのメチル化DNAの捕捉を確認する
ために、第2量の対照DNAを上記試料に加える工程をさらに備える。
【0046】
いくつかの実施形態では、癌細胞由来のDNAの存在を特定することは、上記原発癌細
胞組織を特定することをさらに備える。
【0047】
いくつかの例では、腫瘍組織サンプリングは、困難である場合があり、又は重大なリス
クを伴う場合があり、いずれの場合も、腫瘍組織サンプリングの必要なしに癌を診断及び
/又は細分類することが所望される可能性がある。例えば、肺腫瘍組織サンプリングは、
縦隔鏡検査、開胸術、又は経皮の針生検等の侵襲的手技を必要とする可能性があり、これ
らの手技・手順は、入院、胸腔チューブ、人工呼吸、抗生物質、又は他の医療行為の必要
を生じる可能性がある。一部の個体は、併存疾患のため、又は好みによって腫瘍組織サン
プリングのために必要な侵襲的手技を受けない可能性がある。いくつかの例では、腫瘍組
織の調達のための現実の手順は、疑われる癌亜型に依存する可能性がある。他の例では、
癌亜型は、同じ個体の中で経時的に発生する可能性があり、侵襲的腫瘍組織サンプリング
手法を用いる連続的な評価は、実施不可能であることが多く、患者に十分に許容されるも
のではない。従って、血液検査による非侵襲的な癌の細分類は、臨床腫瘍学の実務におい
て多くの有利な応用例を有することができよう。
【0048】
従って、いくつかの実施形態では、上記原発癌細胞組織を特定することは、癌亜型を特
定することをさらに備える。好ましくは、癌亜型は、ステージ(例えば、外科手術で処置
される早期肺癌対化学療法で処置される末期肺癌)、組織学(例えば、肺癌における小細
胞癌対腺癌対扁平上皮癌)、遺伝子発現パターン又は転写因子活性(例えば、乳癌におけ
るER状態)、コピー数異常(例えば、乳癌におけるHER2状態)、特異的再構成(例
えば、AMLにおけるFLT3)、特異的遺伝子点変異状態(例えば、IDH遺伝子点変
異)、及びDNAメチル化パターン(例えば、脳癌におけるMGMT遺伝子プロモーター
のメチル化)に基づいて癌を識別する。
【0049】
いくつかの実施形態では、工程(f)の比較は全ゲノムにわたって実施される。
【0050】
他の実施形態では、工程(f)の比較は、全ゲノムから、特定の調節領域へ、例えば、
限定されないが、FANTOM5エンハンサー、CpGアイランド、CpGショア、Cp
Gシェルフ、又はこれらのいずれかの組み合わせに限定される。
【0051】
いくつかの実施形態では、特定の工程は、コンピュータプロセッサにより実施される。
【0052】
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定する方法であって、対
象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、捕捉され
たセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリ
ーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNA
の1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意
な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と、癌細胞由来のDN
Aが特定される場合に、上記比較工程に基づいて原発の上記癌細胞組織及び癌亜型をさら
に特定する工程とを備える方法が提供される。
【0053】
一態様では、癌細胞由来のDNAの存在を検出して、2以上の可能性のある器官から上
記癌細胞が発生した上記癌の場所を決定する方法であって、対象由来のセルフリーDNA
の試料を準備する工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、上記
試料由来のセルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーの
メチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配
列パターンを対照個体の2以上の母集団のDNA配列パターンと比較する工程であって、
上記2以上の母集団の各々は、異なる器官に限局性癌を有する工程と、上記セルフリーD
NAのメチル化のパターンと上記2以上の母集団うちの1つのメチル化のパターンとの間
の統計的に有意な類似性に基づいて、どの器官で上記癌細胞が発生したかを決定する工程
とを備える方法が提供される。
【0054】
本発明のシステム及び方法は種々の実施形態で実施されてよい。好適に構成されたコン
ピュータデバイス、及び関連する通信ネットワーク、デバイス、ソフトウェア及びファー
ムウェアは、1以上の上記の実施形態を実行するためのプラットフォームを提供してもよ
い。例として、図5は、記憶装置104に、及びランダムアクセスメモリ106に接続さ
れた中央処理装置(「CPU」)102を備えてもよい一般的なコンピュータデバイス1
00を示す。CPU102は、オペレーティングシステム101、アプリケーション・プ
ログラム103、及びデータ123を処理してもよい。オペレーティングシステム101
、アプリケーション・プログラム103、及びデータ123は、記憶装置104に保存さ
れ、必要に応じてメモリ106にロードされてもよい。コンピュータデバイス100は、
CPU102から集中的な画像処理計算の負荷を減らしてこれらの計算をCPU102と
並行して実行するために、CPU102に、及びメモリ106に作動可能に接続されてい
るグラフィック処理装置(GPU)122をさらに備えてもよい。操作者107は、ビデ
オインターフェース105によって接続されたビデオディスプレー108、並びにI/O
インターフェース109によって接続されたキーボード115、マウス112、及びディ
スクドライブ又は半導体ドライブ114等の種々の入/出力装置を使用して、コンピュー
タデバイス100と対話してもよい。公知のように、マウス112は、ビデオディスプレ
ー108におけるカーソルの移動を制御し、ビデオディスプレー108に現れる種々のグ
ラフィカルユーザーインターフェース(GUI)コントロールをマウスボタンで操作する
ように構成されていてもよい。ディスクドライブ又は半導体ドライブ114は、コンピュ
ータ可読媒体116を受け入れるように構成されていてもよい。コンピュータデバイス1
00は、ネットワークインターフェース111を介してネットワークの一部を形成して、
コンピュータデバイス100が他の好適に構成されたデータ処理システム(図示せず)と
通信することを可能にしてもよい。種々のソースからの入力を受信するために、1以上の
異なる種類のセンサ135が使用されてもよい。
【0055】
本発明のシステム及び方法は、デスクトップコンピュータ、ラップトップコンピュータ
、タブレットコンピュータ又はワイヤレスの手持ち式のものを含めた事実上任意の態様の
コンピュータデバイスで実施されてよい。本発明のシステム及び方法は、1以上のコンピ
ュータデバイスに本発明に係る方法における種々の工程の各々を実行することを可能にす
るためのコンピュータプログラムコードを備えるコンピュータ可読/可用媒体として実行
されてもよい。複数のコンピュータデバイスが全体のオペレーションを実施する場合には
、このオペレーションの種々の工程を分散させるために、それらのコンピュータデバイス
はネットワーク化される。コンピュータ可読媒体又はコンピュータ可用媒体という用語は
、プログラムコードの物理的実施形態の任意のタイプの1以上を含むということは理解さ
れる。特に、このコンピュータ可読/可用媒体は、1以上の携帯用の記憶用製品(例えば
光ディスク、磁気ディスク、テープ等)に、コンピュータ及び/又は記憶システムに付随
したメモリ等の計算装置の1以上のデータ記憶部分に内蔵されたプログラムコードを含む
ことができる。
【0056】
一態様では、癌細胞由来のDNAの存在を検出し、癌亜型を特定するコンピュータ実装
方法であって、少なくとも1つのプロセッサで、対象試料由来のセルフリーのメチル化D
NAの配列決定データを受け取る工程と、上記少なくとも1つのプロセッサで、捕捉され
たセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリ
ーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNA
の1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意
な類似性がある場合に、上記少なくとも1つのプロセッサで、癌細胞由来のDNAの存在
を特定する工程と、癌細胞由来のDNAが特定される場合、上記比較工程に基づいて上記
原発癌細胞組織及び癌亜型をさらに特定する工程とを備える方法が提供される。
【0057】
一態様では、プロセッサ及びこのプロセッサに接続されたメモリを有する汎用性コンピ
ュータと組み合わせて使用するためのコンピュータプログラム製品であって、コンピュー
タメカニズムがエンコードされたコンピュータ可読記憶媒体を含み、上記コンピュータプ
ログラムメカニズムが上記コンピュータの上記メモリにローディングされ、上記コンピュ
ータに、本願明細書に記載される方法を実行させてもよいコンピュータプログラム製品が
提供される。
【0058】
一態様では、本願明細書に記載されるコンピュータプログラム製品を保存するためのデ
ータ構造が保存されたコンピュータ可読媒体が提供される。
【0059】
一態様では、癌細胞由来のDNAの存在を検出して癌亜型を特定するためのデバイスで
あって、少なくとも1つのプロセッサと、上記少なくとも1つのプロセッサと通信してい
る電子メモリとを備え、上記電子メモリは、上記少なくとも1つのプロセッサで実行され
る場合に、上記少なくとも1つのプロセッサに、対象試料由来のセルフリーのメチル化D
NAの配列決定データを受け取ること、捕捉されたセルフリーのメチル化DNAの配列を
、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較すること
、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリ
ーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDN
Aの存在を特定すること、並びに癌細胞由来のDNAが特定される場合に、上記比較工程
に基づいて、上記原発癌細胞組織及び癌亜型をさらに特定することを実行させるプロセッ
サ実行可能なコードを保存するデバイスが提供される。
【0060】
本願明細書で使用する場合、「プロセッサ」は、いずれのタイプのプロセッサ、例えば
、いずれのタイプの汎用性マイクロプロセッサ又はマイクロコントローラ(例えば、In
tel(商標)x86、PowerPC(商標)、ARM(商標)プロセッサ等)、デジ
タル信号処理(DSP)プロセッサ、集積回路、フィールドプログラマブルゲートアレイ
(FPGA)、又はこれらのいずれかの組み合わせであってもよい。
【0061】
本願明細書で使用する場合、「メモリ」は、内部に又は外部に置かれるいずれのタイプ
のコンピュータメモリ、例えば、ランダムアクセスメモリ(RAM)、読み出し専用メモ
リ(ROM)、コンパクトディスク読み出し専用メモリ(CDROM)、電気光学メモリ
、磁気光学メモリ、消去可能なプログラマブル読み出し専用メモリ(EPROM)、及び
電気的消去可能プログラム可能読み出し専用メモリ(EEPROM)等のうちの好適な組
み合わせを含んでもよい。メモリ102の一部分は、従来のファイルシステムを使用して
組織化され、デバイスの動作全体を支配するオペレーティングシステムにより制御され管
理されてもよい。
【0062】
本願明細書で使用する場合、「コンピュータ可読記憶媒体」(コンピュータ可読プログ
ラムコードが内蔵された機械可読媒体、プロセッサ可読媒体又はコンピュータ可用媒体と
も呼ばれる)は、コンピュータ又は機械によって可読のフォーマットでデータを保存する
ことができる媒体である。機械可読媒体は、磁気的、光学的又は電気的な記憶媒体を含め
たいずれの好適な有形の、非一過性の媒体、例えばディスケット、コンパクトディスク読
み出し専用メモリ(CD-ROM)、メモリ素子(揮発性又は不揮発性)、又は類似の保
存メカニズムであってよい。このコンピュータ可読記憶媒体は、実行されるときに、プロ
セッサに本開示の一実施形態に係る方法における工程を実行させる種々のセットの命令、
コード配列、構成情報、又は他のデータを内蔵することができる。当業者は、記載された
実行形態を実行するために必要な他の命令及びオペレーション(操作)は、コンピュータ
可読記憶媒体に保存されることも可能であるということはわかるであろう。コンピュータ
可読記憶媒体に保存された命令は、プロセッサ又は他の好適な処理装置によって実施され
てよく、記載されたタスクを実行するための電気回路と整合されることが可能である。
【0063】
本願明細書で使用する場合、「データ構造」は、データが効率的に使用することができ
るように、コンピュータにおいてデータを組織化する特定の方法である。データ構造は、
データ構造上で実行することができるオペレーション及びそれらのオペレーションの計算
複雑性を特定する1以上の特定の抽象データ型(ADT)を実行することができる。比較
で、データ構造は、ADTによって与えられる仕様の具体的な実行形態である。
【0064】
本発明の利点は、以下の実施例によりさらに例証される。本明細書中に示される実施例
及びそれらの特定の詳細は、例証のためにのみ提示されており、本発明の特許請求の範囲
に対する限定と解釈されるべきではない。
【実施例0065】
方法及び材料
提供者募集及び試料入手
CRC、乳癌、及びGBMの試料をUniversity Health Netwo
rk BioBankから得て、AML試料をUniversity Health N
etwork Leukemia BioBankから得て、最後に、健康な対照をカナ
ダ、トロントのMount Sinai Hospital(MSH;マウントサイナイ
病院)のFamily Medicine Centreを通して募集した。すべての試
料を患者の承諾を得て集め、Research Ethics Board(研究倫理委
員会)から、University Health Network及びカナダ、トロン
トのMount Sinai Hospitalから、機関承認を得て入手した。
【0066】
検査試料加工-cfDNA
EDTA及びACD血漿試料は、BioBanksから、及びカナダ、トロントのMo
unt Sinai Hospital(MSH)のFamily Medicine
Centreから得た。すべての試料を、使用まで-80℃で、又は気相液体窒素中で保
存した。セルフリーDNAは、QIAamp Circulating Nucleic
Acid Kit(Qiagen(キアゲン))を使用して0.5~3.5mlの血漿
から抽出した。抽出したDNAは、使用に先立ってQubitにより定量した。
【0067】
検査試料加工-PDX cfDNA
University Health NetworkのResearch Ethi
cs Boardにより承認されたとおり、患者の同意を得てUniversity H
ealth Network Biobankから得たヒト結直腸腫瘍組織を、コラゲナ
ーゼAを使用して単一細胞へと消化した。単一細胞を、4~6週齢のNOD/SCID雄
マウスに皮下注射した。心臓穿刺による採血の前にCO2吸入によりマウスを安楽死させ
、採取した血液をEDTA採血管に保存した。採取した血液試料から血漿を単離し、-8
0Cで保存した。セルフリーDNAは、QIAamp Circulating Nuc
leic Acid Kit(Qiagen)を使用して0.3~0.7mlの血漿から
抽出した。すべての動物研究は、University Health Network
のAnimal Care Committee(動物管理委員会)によって承認された
倫理規制を遵守して実施した。
【0068】
cfMeDIP-seq
cfMeDIP-seqプロトコルの概略図は、国際公開第2017/190215号
パンフレットに記載されている。cfMeDIPに先立って、上記DNA試料をKapa
Hyper Prep Kit(Kapa Biosystems)を使用するライブ
ラリ調製に供した。製造業者のプロトコルにいくらか変更を加えてそのプロトコルに従っ
た。手短に言えば、注目するDNAを0.2mLのPCRチューブに加え、末端修復(エ
ンドリペア)及びA-テーリングに供した。その後に、NEBNextアダプター(Il
luminaキット用NEBNext Multiplex Oligos、New E
ngland Biolabs、から)を0.181μMの最終濃度で使用してアダプタ
ーライゲーションを行い、20℃で20分間インキュベーションし、AMPure XP
ビーズで精製した。溶出したライブラリを、USER酵素(New England B
iolabs Canada)を使用して消化し、その後、MeDIPに先立ってQia
gen MinElute PCR Purification Kitを用いて精製し
た。
【0069】
調製したライブラリを、100ngの最終DNA量に、プールしたメチル化/非メチル
化λPCR産物と合わせ、Taiwoら、2012[7]からのプロトコルをいくらか変
更を加えて使用してMeDIPに供した。手短に言えば、MeDIPのために、Diag
enode MagMeDIPキット(カタログ番号C02010021)を、製造業者
のプロトコルにいくらか変更を加えてそのプロトコルに従って使用した。0.3ngの対
照メチル化シロイヌナズナDNA及び0.3ngの対照非メチル化シロイヌナズナDNA
、フィラーDNA(DNAの全量[cfDNA+フィラー+対照]を100ngにするた
め)及び緩衝液を、アダプターライゲーションしたDNAが入っているPCRチューブに
添加した後、この試料を95℃に10分間加熱し、直後に氷水浴の中へ10分間入れた。
各試料を、2つの0.2mLのPCRチューブに小分けし、一方は、10%インプット対
照のためのものであり、他方は、免疫沈降にかけることになる試料のためのものであった
。MagMeDIPキットからの含まれた5-mCモノクローナル抗体33D3(カタロ
グ番号C15200081)を、希釈した抗体混合物を生成する前に1:15に希釈し、
上記試料に加えた。洗浄した磁気ビーズ(製造業者の使用説明書に従った)も加え、その
後に4℃で17時間インキュベーションした。この試料を、Diagenode iPu
re Kitを使用して精製し、50μlのBuffer Cで溶出した。反応(QC1
)の成功は、添加したシロイヌナズナDNAの存在を検出するためのqPCRにより検証
し、非メチル化添加DNAの%回収<1%及び反応の%特異度>99%(1-[添加非メ
チル化対照DNAの回収/添加メチル化対照DNAの回収]として算出)を確認して、そ
の後で次の工程に進んだ。各ライブラリを増幅するための最適サイクル数は、qPCRの
使用により決定し、この後でKAPA HiFi Hotstart Mastermi
xを使用して試料を増幅し、0.3μMの最終濃度までNEBNext multipl
ex oligosを加えた。このライブラリを増幅するために使用したPCR設定は以
下のとおりであった:95℃で3分間の活性化、次いで98℃で20秒間、65℃で15
秒間及び72℃で30秒間及び72℃で1分間の最終伸長の所定のサイクル。増幅したラ
イブラリは、MinElute PCR精製カラムを使用して精製し、次いで、ゲルサイ
ズを3% Nusieve GTGアガロースゲルを用いて選択して、アダプター二量体
があればそれを除去した。配列決定に供する前に、メチル化ヒトDNA領域(精巣特異的
H2B、TSH2B)及び非メチル化ヒトDNA領域(GAPDHプロモーター)の濃縮
倍率を、セルフリーDNA(ATCCから得られる細胞系、Mycoplasma(マイ
コプラズマ)フリー)を模倣するように剪断されたHCT116細胞系DNAから生成さ
れるMeDIP-seq及びcfMeDIP-seqライブラリについて測定した。最終
ライブラリをBioAnalyzer分析に供した後、UHN Princess Ma
rgaret Genomic CentreにおいてIllumina HiSeq
2000で配列決定した。
【0070】
点変異検出のための超深度標的配列決定
本発明者らは、QIAgen Circulating Nucleic Acidキ
ットを使用して、Princess Margaret Cancer Centreに
おいて初期臨床試験での登録前に作成された対応腫瘍組織分子プロファイリングデータを
有する患者由来の約20mLの血漿(4~5×10mLのEDTA採血管)からセルフリ
ーDNAを単離した。細胞系(CRC及びMM細胞系の希釈)からPureGene G
entraキットを使用してDNAを抽出し、Covaris超音波処理器を使用して約
180bpに断片化し、より大きいサイズの断片をAmpureビーズを使用して排除し
て、セルフリーDNAの断片サイズを模倣した。DNA配列決定ライブラリを、NEXT
flex-96 DNA Barcodeアダプター(Bio Scientific、
オースチン(Austin)、テキサス州)アダプターを利用するKAPA Hyper
Prep Kit(Kapa Biosystems、ウィルミントン(Wilmin
gton)、マサチューセッツ州)を使用して83ngの断片化DNAから構築した。既
知の変異を含むDNA断片を単離するために、本発明者らは、Illumina Tru
Seq Amplicon Cancer Panelを使用して臨床検査室によって試
験された48の遺伝子から変異ホットスポットを標的にしたビオチン化DNA捕捉プロー
ブ(xGen Lockdown Custom Probe Mini Pool、I
ntegrated DNA Technologies、コーラルビル(Coralv
ille)、アイオワ州)を設計した。バーコードライブラリをプールし、次いでカスタ
ムハイブリッド捕捉ライブラリを製造業者の使用説明書(IDT xGEN Lockd
ownプロトコルバージョン2.1)に従って適用した。これらの断片を、Illumi
na HiSeq 2000機器を使用して>10,000×リードカバレッジまで配列
決定した。得られたリードをbwa-memを使用して整列(配列比較)し、変異をsa
mtools及びmuTectバージョン1.1.4を使用して検出した。
【0071】
腫瘍特異的特徴の数とシークエンシング深度による検出確率との間の関係のモデル化
本発明者らは、145,000個のシミュレートされたゲノムを作成した。癌特異的メ
チル化DMRの割合は、0.001%、0.01%、0.1%、1%及び10%に設定し
、それぞれ1、10、100、1000及び10000個の独立したDMRからなった。
本発明者らは、14,500個の二倍体ゲノム(100ngのDNAに相当する)をこれ
らの最初の混合物から採取し、10、100、1000及び10000リード/遺伝子座
をさらに採取して、これらの深さにおける配列決定カバレッジを表した。このプロセスを
、カバレッジ、存在量及び特徴数の各組み合わせで100回繰り返した。本発明者らは、
パラメータの各組み合わせで少なくとも1つのDMRの検出成功頻度を推定し、確率曲線
をプロットして(図1A)、シークエンシング深度を条件とする検出成功確率に対する特
徴数の影響を視覚的に評価した。
【0072】
組織特有の特徴の誘導、多組織分類器の開発及び450kデータでの検証
cfDNA MeDIPプロファイルを、MEDIPS Rパッケージ[8]を使用し
て定量し、RPKMに換算し、その後、log2カウントパーミリオン(counts-
per-million)に変換した。その後、線形モデルを、FANTOM5エンハン
サー、CpGアイランド、CpGショア及びCpGシェルフにマッピングした特徴のマト
リクス上でlimma-trend[9]を使用してフィッティングした。回収した添加
メチル化DNAの百分率は、プルダウン効率変動量を制御するための共変量として含めた
。ペアワイズ対比を組織種の各対について評価し、上位150及び下位150のDMRを
エラスティックネット分類器訓練及び癌種特異性の検証のために選択した。性能測定基準
は、交差検証における最高κ値を有するモデル、Chakravarthyらにおいて以
前に用いられたヒューリスティクス[10]から、out-of-fold(データ外の
データ)のコールについてのクラス多数決(majority class vote)
によって導かれた。
【0073】
分類精度の評価のための機械学習分析
モデル訓練及び発見コホート上での評価
高い計算コストをかけずに腫瘍分類におけるcfMeDIPデータの性能を評価するた
めに、本発明者らは、可能性のある候補特徴量の初期セットを、CpGアイランド、ショ
ア、シェルフ及びFANTOM5エンハンサー(本明細書中では「規制特徴量」とラベル
する)を包含するウィンドウ(範囲)に限縮し、196個の試料及び505,027個の
特徴量のマトリクスを得た。本発明者らは、次に、caret Rパッケージを使用して
、発見コホートデータを80%-20%方式で50の独立の訓練セット及びテストセット
に分割した(図2A)。この分割を行ったが、発見コホートにわたるクラス割合を維持し
た。次いで、本発明者らは、各クラス対他クラスについてlimma-trendを使用
して、訓練データパーティションでの調整t統計量(150過剰メチル化、150低メチ
ル化)により上位300のDMRを選択した。次に、Cohen(コーエン)のκ(カッ
パ)を性能測定基準として使用して、混合パラメータの値(α(アルファ)、値=0、0
.2、0.5、0.8及び1)及びペナルティ(λ(ラムダ)、値=0.01の増分で0
~0.05)を最適化するために、これらのDMRを使用して(最大300DMR×7個
の他クラス=2100特徴量)、10分割交差検証(CV)の3回の反復の使用により二
項GLMnetを訓練した。各訓練セットについて、これは、一群の6つの1クラス対他
クラスの二項分類器を与えた。
【0074】
次に、本発明者らは、AUROC(受信者動作特性曲線下部面積)を使用して、ホール
ドアウトテストセットで分類性能を推定した。これらの推定値は、分類の不偏尺度を表す
。というのも、このホールドアウトテストセット試料は、DMR事前選択にもGLMne
tの訓練及びチューニングにも使用されなかったからである。上記50個の独立の訓練セ
ット及びテストセットも、訓練セットバイアスに起因して楽観的推定の最小化を可能にし
た。
【0075】
検証コホートでのモデル評価
各検証コホートcfMeDIP試料について、本発明者らは、上記発見コホート内の上
記50個の異なる訓練セットで訓練したAML、LUC及び健常の一対他の二項分類器に
ついてクラス確率を推定した。上記50個のモデルからの確率を平均して単一スコアを生
成し、この単一スコアを次にAUROC推定のために使用した。本発明者らは、早期LU
C試料(ステージI及びII)又は末期LUC試料(ステージIII及びIV)のいずれ
かが一対他分類器のために残されたときにAUROCを推定することにより、疾患のステ
ージが性能に影響を及ぼすかも評価した。
【0076】
結果と考察
本発明者らは、0.001%~10%まで異なる割合のctDNAを有する混合物を生
物情報学的にシミュレーションした(図1A、列の面)。本発明者らは、ctDNAが1
、10、100、1000、又は10000のDMR(可変メチル化領域)を有する状況
も健常のcfDNAと比べてシミュレーションした(図1A、行の面)。次いで、リード
を様々なシークエンシング深度で各遺伝子座においてサンプリングした(10×、100
×、1000×、及び10000×)(図1A、x軸)。本発明者らは、癌ctDNAの
存在量が少なく、カバレッジが浅いときでも、DMR数が増加すると少なくとも1つの癌
特異的イベントの検出確率が高くなることを見出した(図1A)。
【0077】
さらに、The Cancer Genome Atlas(TCGA)からのpan
-cancerデータは、事実上すべての腫瘍型にわたって腫瘍組織と健常組織との間に
多くのDMRを示した[11]。それゆえ、これらの知見は、癌特異的DNAメチル化異
常をctDNAから成功裏に回収するアッセイが、低配列決定関連コストで悪性疾患を検
出、分類及び追跡するための非常に感度が高いツールとして役立つことができることを強
調した。
【0078】
しかしながら、血漿cfDNA中のDNAメチル化の全ゲノムマッピングは、循環中の
DNAの非常に少ない量及び断片化に起因して困難である[12]。結果として、cfD
NAのメチル化プロファイリングに向けたこれまで試みは、結直腸癌スクリーニングのた
めのFDA承認のSEPT9メチル化アッセイ[13]等、主に遺伝子座特異的なPCR
ベースのアッセイに限られてきた[2、3]。最近の試みは、断片化されたcfDNAの
whole-genome bisulfite-sequencingを実施するため
になされているが[14~16]、CpGの低い全ゲノム存在量は、配列決定から入手で
きる有用なメチル化関連情報の量を減らす可能性が高い。それゆえ、血漿DNAに対する
WGBSに関する主な問題は、高コストであり、低効率であり、そして亜硫酸水素塩変換
に伴うDNAの損失である。他方、メチル化しやすいCpGリッチな特徴を選択的に濃縮
する方法は、リードあたりに利用可能な有用な情報の量を最大にし、コストを下げ、DN
A損失を減らす可能性が高い。
【0079】
cfDNAメチル化マッピングに好適な全ゲノム方法
本発明者らは、セルフリーDNAを使用して全ゲノムDNAメチル化マッピングを行う
ための、cfMeDIP-seq(セルフリーのメチル化DNA免疫沈降及び高スループ
ット配列決定)と呼ぶ新しい方法を開発した。ここで記載するcfMeDIP-seq方
法は、本発明者らの経験では100ngのインプットDNAまで非常に堅牢である既存の
低インプットMeDIP-seqプロトコル[7]の改変によって開発された。しかしな
がら、血漿試料の大部分は、100ngよりはるかに少ないDNAを与える。この難題を
克服するために、本発明者らは、開始DNAの量を100ngまで人為的に高めるために
、外来λDNA(フィラーDNA)をアダプターライゲーションしたcfDNAライブラ
リに添加した。これは、抗体による非特異的結合の量を最少にし、プラスチック製品との
結合のために失われるDNAの量も最少にする。フィラーDNAは、アダプターライゲー
ションしたcfDNAライブラリにサイズが類似した増幅産物からなり、異なるCpG密
度の非メチル化DNA及びインビトロメチル化DNAで構成された。異なる患者は異なる
量のcfDNAを与えることになるので、このフィラーDNAの添加は実用にも役立ち、
インプットDNA量を100ngに規準化することが可能になる。これによって、利用可
能なcfDNAの量にかかわらず、すべての試料について下流のプロトコルが全く同じの
ままであるということが確保される。
【0080】
本発明者らは、まず、cfDNAで認められたものと類似の断片サイズに剪断されたヒ
ト結直腸癌細胞系HCT116からのDNAを使用して、cfMeDIP-seqプロト
コルを検証した。公的なDNAメチル化データが利用可能であるため、HCT116を選
んだ。本発明者らは、100ngの剪断細胞系DNAを使用する至適基準(ゴールドスタ
ンダード)MeDIP-seqプロトコル[7]と10ng、5ng及び1ngの同じ剪
断細胞系DNAを使用するcfMeDIP-seqプロトコルを同時に実施した。これを
2つの生物的複製物において実施した。すべての条件で、本発明者らは、99%超の反応
特異度(1-[添加非メチル化対照DNAの回収/添加メチル化対照DNAの回収])、
及び非メチル化領域(GAPDH)に対する既知のメチル化領域(TSH2B0)の非常
に高い濃縮を得た(図6B)。
【0081】
上記ライブラリを、約3000~7000万リード/ライブラリ(補遺の表1)で飽和
まで配列決定した(図6A)。生のリードをヒトゲノム及び上記λゲノムの両方と整列さ
せ、λゲノムと事実上アラインメントがないことが判明した(補遺の表1)。それゆえ、
フィラーDNAとしての外来λDNAの添加は、配列決定データの生成を妨げなかった。
最後に、本発明者らは、免疫沈降工程の品質管理手段としてCpG濃縮スコアを計算する
[8]。すべてのライブラリはCpGに対して類似の濃縮を示したが、インプット対照は
、予想通り、濃縮を示さず(図6C)、極低インプット(1ng)でも本発明者らの免疫
沈降の有効性を確認した。
【0082】
異なるインプットDNAレベルを比較する全ゲノム相関推定によれば、MeDIP-s
eq(100ng)法とcfMeDIP-seq(10、5及び1ng)法の両方が極め
て堅牢であり、ピアソン相関が任意の2つの生物的複製物間で少なくとも0.94であっ
た(図1B)。この分析の更に示すところによれば、5ng及び10ngのインプットD
NAにおけるcfMeDIP-seqは、従来のMeDIP-seqによって100ng
で得られるメチル化プロファイルを堅牢に再現することができる(少なくとも0.9のペ
アワイズピアソン相関)(図1B)。1ngのインプットDNAにおけるcfMeDIP
-seqの性能は、100ngにおけるMeDIP-seqと比べて低下するが、それで
も>0.7の強いピアソン相関を示す(図1B)。本発明者らは、cfMeDIP-se
qプロトコルが、至適基準であるReduced Representation Bi
sulfite Sequencing(RRBS)及びWhole-Genome B
isulfite Sequencing(WGBS)を用いたHCT116のDNAメ
チル化プロファイルを再現することも認めた(図1C)。要するに、本発明者らのデータ
が示唆するところによれば、cfMeDIP-seqは、循環cfDNA等の断片化され
た低インプットDNA材料の全ゲノムメチル化マッピングの堅牢なプロトコルである。
【0083】
cfMeDIP-seqは、腫瘍由来のctDNAの検出で高感度を示す
cfMeDIP-seqプロトコルの感度を評価するために、本発明者らは、結直腸癌
(CRC)HCT116細胞系DNAを多発性骨髄腫(MM)MM1.S細胞系DNAに
段階希釈した。どちらもcfDNAサイズを模倣するように剪断した。本発明者らは、C
RC DNAを100%、10%、1%、0.1%、0.01%、0.001%から0%
に希釈し、これらの希釈物の各々についてcfMeDIP-seqを行った。本発明者ら
は、同じ試料における3点変異の検出のために超深度(10,000×中央値(メジアン
)カバレッジ)標的配列決定も行った。5%偽陽性率(FDR:False Disco
very rate)閾値を用いた、純粋MM DNAに対する各CRC希釈ポイントで
特定されたDMRの観察数は、希釈倍率に基づくDMRの予想数と0.001%希釈まで
ほぼ完全に線形(r=0.99、p<0.0001)であった(図1D)。さらに、こ
れらのDMR内のDNAメチル化シグナルも、観察対予想シグナルでほぼ完全な線形性を
示す(r=0.99、p<0.0001)(図1E;補遺の表2B)。それに対して、
1%希釈を超えると、超深度標的配列決定は、PCR又は配列決定誤差のために、CRC
特異的変異体と偽変異体を確実に見分けることができなかった(図1F;補遺の表2A)
。従って、cfMeDIP-seqは、癌由来のDNAの検出感度に優れ、標準プロトコ
ルを用いた超深度標的配列決定による変異体検出の性能を超える。
【0084】
癌DNAは、CpGリッチ領域において頻繁に過剰メチル化される[17]。cfMe
DIP-seqはメチル化CpGリッチ配列を特異的に標的にするので、本発明者らは、
ctDNAが免疫沈降手順中に優先的に濃縮されると仮定した。これを試験するために、
本発明者らは、2人の結直腸癌患者から患者由来の異種移植片(PDX)を生成し、マウ
ス血漿を収集した。腫瘍由来のヒトcfDNAは、インプット試料中の総cfDNAプー
ル内で1%未満の頻度で存在し、免疫沈降後2倍の存在量で存在した(図1G;補遺の表
3)。これらの結果の示唆するところによれば、ctDNAの偏りのある配列決定によっ
て、cfMeDIP手順は、ctDNA検出感度を更に増加させることができた。
【0085】
循環血漿cfDNAメチル化プロファイルは複数の癌種と健康な提供者とを見分けるこ
とができる
DNAメチル化パターンは、組織特異的であり、多くの他の癌種の中でもとりわけ、神
経膠芽腫[18]、上衣腫[6]、結直腸癌[19]、及び乳癌[20、21]において
癌患者を臨床的に関連する疾患部分群へと階層化するために使用されてきた。本発明者ら
は、cfDNA関連プロファイルが複数の腫瘍型に対して原発組織を特定するために使用
することができるのではないかと疑問を持った。この目的のために、本発明者らは、5つ
の異なる腫瘍型由来の196個の試料及び早期及び末期の腫瘍由来の健常対照の特性を明
らかにした。本発明者らは、線形モデル化を使用して、各一対比較のために、CpGショ
ア、シェルフ、アイランド及びFANTOM5エンハンサーへの上位300のDMRのマ
ッピングを特定し、全体で2,100個のユニークなDMRを導いた(図2A)。これら
の特徴量のメチル化状態に基づく上記196個の血漿試料のt分布型確率的近傍埋め込み
(tSNE)[22]に基づく密度クラスタ分析により、原発組織及び腫瘍型に基づく試
料の別個のクラスタリングが明らかになった(図2B図2C)。これらの特徴量とのエ
ラスティックネット多癌分類器フィット(図2A)を使用して、本発明者らは、異なる腫
瘍型の間の非常に正確な区別を観察した(図2D)。
【0086】
疾患亜型の区別
本発明者らは、cfDNA MeDIPプロファイルが、5つの別個のケース - 遺
伝子発現パターン(乳癌におけるER状態)、コピー数異常(乳癌におけるHER2状態
)、再構成(AMLにおけるFLT3 ITD状態)、点変異(GBMにおけるIDH変
異)、及び最後に肺癌における組織学 - における疾患亜型を区別する能力を評価した
。いずれの場合も、線形モデルを使用して、これまでに記載したように特徴を選択しラン
ク付けした。いずれの場合も、階層的クラスタ分析を使用して、試料のグループ分けを評
価した。選択した特徴量のメチル化状態に基づくt分布型確率的近傍埋め込み(tSNE
)[22]に基づく密度クラスタ分析により、癌亜型分類のこれらの5つの別個の例の各
々に基づく試料の別個のクラスタリングが明らかになった。
【0087】
機械学習を用いる癌の検出及び癌種の分類
cfMeDIPプロファイルが癌を検出しさらに癌種を分類する能力を厳密に評価する
ために、本発明者らは、次に、本発明者らの発見コホートで一連の機械学習分析を行った
。高速の計算解析を可能にするために、本発明者らは、最初に、本発明者らのcfMeD
IP発見コホートをCpGアイランド、ショア、シェルフ及びFANTOM5エンハンサ
ー(n=505,027ウィンドウ)への特徴量マッピングに限縮した。本発明者らは、
次に、本発明者らの発見コホート試料で、訓練セットバイアスを考慮しつつ、性能の不偏
推定量を誘導するための戦略を実行した。
【0088】
本実施例では、本発明者らは、発見コホートをバランスよく訓練セット及びテストセッ
トに分割した(80%訓練セット、20%テストセット)。上記訓練セットの試料のみを
使用して、本発明者らは、limma-trend検定統計量に基づいて、各クラス(試
料の種類)対他クラスに対して上位300のDMRを選択し、上記訓練セットのデータ上
でこれらの特徴量を使用して一連の一対他クラスGLMnetを訓練した。訓練手順は、
Cohenのκに対して最適化したα及びλの値のグリッドにわたる3ラウンドの10分
割交差検証(CV)からなっていた。多ラウンドの10分割CVの使用は、より一般化可
能なモデルチューニングのためにさらなるランダム化を活用したいという考えに動機づけ
られたものであった。
【0089】
次に、(DMR選択工程及びその後のGLMnet訓練/チューニング工程のあいだホ
ールドアウトした)テストセット試料に由来するAUROC(受信者動作特性曲線下部面
積)を使用して性能を評価した。訓練セットバイアスの影響を緩和するために、このプロ
セスを、発見コホートの訓練セット及びテストセットへの50個の異なる分割を用いて繰
り返した。これは、結果的に、各一対他クラス比較に対して50個のモデル(全部で48
0個のモデル)のコレクションを生じた。ここでは、本発明者らは、このモデルのコレク
ションをE50と称する。
【0090】
その後、本発明者らは、追加の152の血漿試料:AML(n=35)、肺癌(n=5
5)及び健康な対照(n=62)の試料の検証コホート、を生成することによりバッチ間
で性能を評価した。各クラスに対して、本発明者らは、E50において上記モデルにより
出力されたクラス確率を平均し、1クラス対すべての他クラスに対するAUROCを推定
した(図3A)。この分類器は、AML対その他(0.993)、LUC対その他(0.
943)及び健常対その他(1.000)の分類に対して高いAUROC値を示した。こ
のことは、機械学習手法と組み合わせたcfMeDIP-seqが腫瘍型を正確に検出し
分類する能力をさらに裏付けた。最後に、本発明者らは、この分類器が早期試料(0.9
50)において末期試料(0.934)と同程度に正確であること(図3B)を観察し、
このことは、この手法が癌の早期検出並びに早期及び末期の両方で癌の検出に応用可能で
あるということを示唆した。
【0091】
cfMeDIP-seqを用いるcfDNAメチロームプロファイリングのさらなる利

cfDNAメチル化パターンが原発組織を正確に表す能力は、変異ベースのアッセイの
限界も克服し、原発組織に対する特異性は、異なる組織における癌にわたる多くの潜在的
なドライバー変異の再発性に起因して低い可能性がある[23]。変異ベースのアッセイ
も、腫瘍のクローン構造により低感度になる可能性があり、サブクローナルドライバーは
ctDNA中の低存在量のために検出しにくい可能性がある[24]。変異ベースのct
DNA手法は、良性組織におけるドライバー変異による潜在的な交絡に対しても脆弱であ
り、このことは観察されており[25]、正の選択の根拠を提示すると文献に記載されて
いる[26]。
【0092】
これらを合わせると、- これまでに誘導されたうちで癌cfDNAメチロームの最大
のコレクションに基づく - 本発明者らの知見は、cfMeDIP-seqを、癌の管
理及び早期検出に影響を及ぼす潜在能力を有する効率的で費用効率が高いツールとして確
立する。cfMeDIP-seqの精度及び多用途性は、耐性がエピジェネティックな変
異に相関する状況、例えば前立腺癌におけるアンドロゲン受容体阻害への感受性[27]
等における治療上の決定を伝えるために有用でありうる。早期の診断及びスクリーニング
に対する潜在的な機会は、肺癌において特に明らかである可能性がある。というのも、こ
の肺癌は、スクリーニングがすでに臨床上の有用性を示している疾患であり、既存のスク
リーニング試験(すなわち、低線量CTスキャン)が電離放射線曝露及び高偽陽性率等の
重大な制限を有する疾患であるからである。
【0093】
結論として、本発明者らの知見は、非侵襲性の、費用効率が高い、高感度の、非常に正
確な早期の腫瘍検出、多癌分類、及び癌亜型分類のための基礎としてのcfDNAメチル
化プロファイルの有用性を強調する。
【0094】
本発明の好ましい実施形態が本願明細書に記載されたが、本発明の趣旨又は添付の特許
請求の範囲から逸脱せずに上記の実施形態に変更がなされてもよいことは当業者に理解さ
れよう。以下の参考文献リストにあるものを含め、本願明細書に開示されるすべての文献
は、参照により援用される。
【0095】
【表1】
【0096】
【表2A】
【0097】
【表2B】
【0098】
【表3】
【0099】
参考文献リスト
1. Diaz,L.A.,Jr.及びA.Bardelli, Liquid bi
opsies:genotyping circulating tumor DNA.
J Clin Oncol,2014.32(6):579-86頁。
2. Lehmann-Werman,R.ら, Identification o
f tissue-specific cell death using methy
lation patterns of circulating DNA. Proc
Natl Acad Sci USA,2016.113(13):E1826-34
頁。
3. Visvanathan,K.ら, Monitoring of Serum
DNA Methylation as an Early Independent
Marker of Response and Survival in Meta
static Breast Cancer:TBCRC 005 Prospecti
ve Biomarker Study. J Clin Oncol,2016:JC
O2015662080頁。
4. Newman,A.M.ら, An ultrasensitive meth
od for quantitating circulating tumor DN
A with broad patient coverage. Nat Med,2
014.20(5):548-54頁。
5. Aravanis,A.M.,M.Lee,及びR.D.Klausner,
Next-Generation Sequencing of Circulatin
g Tumor DNA for Early Cancer Detection.
Cell,2017.168(4):571-574頁。
6. Mack,S.C.ら, Epigenomic alterations d
efine lethal CIMP-positive ependymomas o
f infancy. Nature,2014.506(7489):445-50頁

7. Taiwo,O.ら, Methylome analysis using
MeDIP-seq with low DNA concentrations. N
at Protoc,2012.7(4):617-36頁。
8. Lienhard,M.ら、MEDIPS:genome-wide diff
erential coverage analysis of sequencing
data derived from DNA enrichment experi
ments. Bioinformatics,2014.30(2):284-6頁。
9. Law,C.W.ら, voom:Precision weights un
lock linear model analysis tools for RNA
-seq read counts. Genome Biol,2014.15(2)
:R29頁。
10. Chakravarthy,A.ら, Human Papillomavi
rus Drives Tumor Development Throughout
the Head and Neck:Improved Prognosis Is
Associated With an Immune Response Large
ly Restricted to the Oropharynx. J Clin
Oncol,2016.34(34):4132-4141頁。
11. Hoadley,K.A.ら, Multiplatform analys
is of 12 cancer types reveals molecular
classification within and across tissues
of origin. Cell,2014.158(4):929-44頁。
12. Fleischhacker,M.及びB.Schmidt, Circul
ating nucleic acids (CNAs) and cancer--a
survey. Biochim Biophys Acta,2007.1775(
1):181-232頁。
13. Potter,N.T.ら, Validation of a real-
time PCR-based qualitative assay for the
detection of methylated SEPT9 DNA in hu
man plasma. Clin Chem,2014.60(9):1183-91
頁。
14. Legendre,C.ら, Whole-genome bisulfit
e sequencing of cell-free DNA identifies
signature associated with metastatic br
east cancer. Clin Epigenetics,2015.7:100
頁。
15. Sun,K.ら, Plasma DNA tissue mapping
by genome-wide methylation sequencing fo
r noninvasive prenatal, cancer, and tran
splantation assessments. Proc Natl Acad
Sci USA,2015.112(40):E5503-12頁。
16. Chan,K.C.ら, Noninvasive detection o
f cancer-associated genome-wide hypometh
ylation and copy number aberrations by p
lasma DNA bisulfite sequencing. Proc Nat
l Acad Sci USA,2013.110(47):18761-8頁。
17. Sharma,S.,T.K.Kelly,及びP.A.Jones, Ep
igenetics in cancer. Carcinogenesis,2010
. 31(1):27-36頁。
18. Sturm,D.ら, Hotspot mutations in H3F
3A and IDH1 define distinct epigenetic a
nd biological subgroups of glioblastoma.
Cancer Cell,2012.22(4):425-37頁。
19. Hinoue,T.ら, Genome-scale analysis o
f aberrant DNA methylation in colorectal
cancer. Genome Res,2012.22(2):271-82頁。
20. Stirzaker,C.ら, Methylome sequencing
in triple-negative breast cancer reveal
s distinct methylation clusters with pro
gnostic value. Nat Commun,2015.6:5899頁。
21. Fang,F.ら, Breast cancer methylomes
establish an epigenomic foundation for m
etastasis. Sci Transl Med,2011.3(75):75r
a25頁。
22. Laurens van der Maaten,G.H., Visual
izing Data using t-SNE. Journal of Machi
ne Learning Research,2008.9:2579-2605頁。
23. Kandoth,C.ら, Mutational landscape a
nd significance across 12 major cancer t
ypes. Nature,2013.502(7471):333-9頁。
24. McGranahan,N.ら, Clonal status of ac
tionable driver events and the timing of
mutational processes in cancer evolutio
n. Sci Transl Med,2015.7(283):283ra54頁。
25. Zauber,P.,S.Marotta,及びM.Sabbath-Sol
itare, KRAS gene mutations are more comm
on in colorectal villous adenomas and in
situ carcinomas than in carcinomas. Int
J Mol Epidemiol Genet,2013.4(1):1-10頁。
26. Martincorena,I.ら, Tumor evolution.
High burden and pervasive positive selec
tion of somatic mutations in normal huma
n skin. Science,2015.348(6237):880-6頁。
27. Beltran,H.ら, Divergent clonal evolu
tion of castration-resistant neuroendocr
ine prostate cancer. 2016.22(3):298-305頁
図1(1)】
図1(2)】
図1(3)】
図1(4)】
図2A
図2B
図2C
図2D
図3A
図3B
図4A
図4B
図4C
図4D
図4E
図5
図6(1)】
図6(2)】
図6(3)】
図6(4)】
図6(5)】
図6(6)】
【手続補正書】
【提出日】2023-07-21
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
対象が癌を有するか又は癌を有するリスクがあることを判定する方法であって、
(a)前記対象のセルフリーデオキシリボ核酸(cfDNA)試料から生成された複数の核酸分子を配列決定に供して、複数の配列決定リードを得る工程であって、前記配列決定が亜硫酸水素塩変換を伴わない工程と、
(b)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子についてのメチル化プロファイルを生成する工程と、
(c)前記メチル化プロファイルをコンピュータ処理して、少なくとも94%の受信者動作特性曲線下部面積(AUROC)において、前記対象が前記癌を有するか又は前記癌を有するリスクがあることを判定する工程と
を備える方法。
【請求項2】
前記癌が、肺癌、乳癌、結直腸癌、急性骨髄性白血病、及び多形神経膠芽腫からなる群から選択される請求項1に記載の方法。
【請求項3】
前記癌が急性骨髄性白血病である請求項2に記載の方法。
【請求項4】
前記AUROCが少なくとも99%である請求項3に記載の方法。
【請求項5】
対象が特定のステージの癌を有するか又は特定のステージの癌を有するリスクがあることを判定する方法であって、
(a)前記対象のセルフリーデオキシリボ核酸(cfDNA)試料から生成された複数の核酸分子を配列決定に供して、複数の配列決定リードを得る工程であって、前記配列決定が亜硫酸水素塩変換を伴わない工程と、
(b)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子についてのメチル化プロファイルを生成する工程と、
(c)前記メチル化プロファイルをコンピュータ処理して、少なくとも93%の受信者動作特性曲線下部面積(AUROC)において、前記対象が前記特定のステージの前記癌を有するか又は前記特定のステージの前記癌を有するリスクがあることを判定する工程とを備える方法。
【請求項6】
前記癌が肺癌である請求項1又は請求項5に記載の方法。
【請求項7】
前記特定のステージが肺癌の早期である請求項6に記載の方法。
【請求項8】
前記AUROCが少なくとも95%である請求項7に記載の方法。
【請求項9】
前記特定のステージが肺癌の後期である請求項6に記載の方法。
【請求項10】
前記AUROCが少なくとも93%である請求項9に記載の方法。
【請求項11】
前記メチル化プロファイルが、前記複数の核酸分子の複数の可変メチル化領域(DMR)のメチル化レベルを含む請求項1又は請求項5に記載の方法。
【請求項12】
前記DMRが過剰メチル化又は低メチル化を含む請求項11に記載の方法。
【請求項13】
前記cfDNA試料をある量のフィラーDNAと混合して、DNA混合物試料を生成する工程をさらに備える請求項1又は請求項5に記載の方法。
【請求項14】
前記DNA混合物試料が、少なくとも50ナノグラム(ng)である少なくともある量の総DNAを含む請求項13に記載の方法。
【請求項15】
前記フィラーDNAが少なくとも部分的にメチル化されており、50bp~800bpの長さを含む請求項13に記載の方法。
【請求項16】
前記DNA混合物をインキュベーションして、前記cfDNA試料の前記複数の核酸分子の少なくとも1以上のメチル化領域の濃縮倍率比を高める工程をさらに備える請求項1又は請求項5に記載の方法。
【請求項17】
前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とともにインキュベーションする工程をさらに備え、前記結合剤が、メチルCpG結合ドメインを含むタンパク質を含む請求項16に記載の方法。
【請求項18】
前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とともにインキュベーションする工程をさらに備え、前記結合剤が抗体を含む請求項16に記載の方法。
【請求項19】
前記メチル化プロファイルをコンピュータ処理することが、健康な対照のメチル化プロファイルと比較すること、又は訓練された機械学習アルゴリズムを使用することを含む請求項1又は請求項5に記載の方法。
【請求項20】
前記訓練された機械学習アルゴリズムが線形回帰を含む請求項19に記載の方法。
【手続補正2】
【補正対象書類名】明細書
【補正対象項目名】0017
【補正方法】変更
【補正の内容】
【0017】
一態様では、対象における癌細胞由来のDNAの存在を検出する方法であって、対象由来のセルフリーDNAの試料を準備する工程と、上記試料をライブラリ調製に供して、引き続く上記セルフリーのメチル化DNAの配列決定を可能にする工程と、第1量のフィラーDNAを上記試料に加え、次いで任意選択的に上記試料を変性する工程であって、上記フィラーDNAの少なくとも一部分がメチル化されている工程と、メチル化ポリヌクレオチドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、捕捉された上記セルフリーのメチル化DNAを配列決定する工程と、上記捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、上記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程とを備える方法が提供される。
一態様では、以下が提供される。
[項目1]
対象における癌細胞由来のDNAの存在を検出する方法であって、
(a)対象由来のセルフリーDNAの試料を準備する工程と、
(b)前記試料をライブラリ調製に供して、引き続く前記セルフリーのメチル化DNAの配列決定を可能にする工程と、
(c)第1量のフィラーDNAを前記試料に加え、次いで任意選択的に前記試料を変性する工程であって、前記フィラーDNAの少なくとも一部分がメチル化されている工程と、
(d)メチル化ポリヌクレオチドに選択的な結合剤を使用して、セルフリーのメチル化DNAを捕捉する工程と、
(e)捕捉された前記セルフリーのメチル化DNAを配列決定する工程と、
(f)前記捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、
(g)前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と
を備える方法。
[項目2]
前記試料が、前記対象の血液又は血漿に由来する項目1に記載の方法。
[項目3]
比較工程(f)が、統計的分類器を使用するフィットに基づく項目1又は項目2に記載の方法。
[項目4]
前記分類器が機械学習由来である項目3に記載の方法。
[項目5]
前記分類器が、エラスティックネット分類器、lasso、サポートベクターマシン、ランダムフォレスト、又はニューラルネットワークである項目4に記載の方法。[項目6]
健康な個体及び癌性個体由来の前記対照のセルフリーのメチル化DNA配列が、健康な個体と癌性個体との間の可変メチル化領域(DMR)のデータベースに含まれる項目1から項目5のいずれか一項に記載の方法。
[項目7]
健康な個体及び癌性個体由来の前記対照のセルフリーのメチル化DNA配列が、セルフリーDNA由来のDNAにおいて健康な個体と癌性個体との間で差次的にメチル化されている対照のセルフリーのメチル化DNA配列に限定される項目1から項目6のいずれか一項に記載の方法。
[項目8]
前記対照のセルフリーのメチル化DNA配列が、血漿由来のDNAにおいて健康な個体と癌性個体との間で差次的にメチル化されている項目7に記載の方法。
[項目9]
前記試料が、100ng未満、75ng未満、又は50ng未満のセルフリーDNAを有する項目1から項目8のいずれか一項に記載の方法。
[項目10]
前記第1量のフィラーDNAが、約5%、10%、15%、20%、30%、40%、50%、60%、70%、80%、90%、又は100%のメチル化フィラーDNAを含み、残部が非メチル化フィラーDNAであり、好ましくは5%~50%、10%~40%、又は15%~30%がメチル化フィラーDNAである項目1から項目9のいずれか一項に記載の方法。
[項目11]
前記第1量のフィラーDNAが20ng~100ng、好ましくは30ng~100ng、より好ましくは50ng~100ngである項目1から項目9のいずれか一項に記載の方法。
[項目12]
前記試料由来のセルフリーDNA及び前記第1量のフィラーDNAが、合わせて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む項目1から項目11のいずれか一項に記載の方法。
[項目13]
前記フィラーDNAが50bp~800bp長、好ましくは100bp~600bp長、より好ましくは200bp~600bp長である項目1から項目12のいずれか一項に記載の方法。
[項目14]
前記フィラーDNAが二本鎖である項目1から項目13のいずれか一項に記載の方法。
[項目15]
前記フィラーDNAがジャンクDNAである項目1又は項目2に記載の方法。[項目16]
前記フィラーDNAが内在DNA又は外来DNAである項目1から項目3のいずれか一項に記載の方法。
[項目17]
前記フィラーDNAが非ヒトDNA、好ましくはλDNAである項目16に記載の方法。
[項目18]
前記フィラーDNAがヒトDNAに対するアラインメントを有しない項目1から項目17のいずれか一項に記載の方法。
[項目19]
前記結合剤が、メチルCpG結合ドメインを含むタンパク質である項目1から項目18のいずれか一項に記載の方法。
[項目20]
前記タンパク質がMBD2タンパク質である項目1から項目19のいずれか一項に記載の方法。
[項目21]
工程(d)が、抗体を使用して前記セルフリーのメチル化DNAを免疫沈降させることを含む項目1から項目20のいずれか一項に記載の方法。
[項目22]
免疫沈降のために少なくとも0.05μg、好ましくは少なくとも0.16μgの前記抗体を前記試料に加えることを含む項目21に記載の方法。
[項目23]
前記抗体が5-MeC抗体である項目21に記載の方法。
[項目24]
前記免疫沈降反応を確認するために、工程(c)後に第2量の対照DNAを前記試料に加える工程をさらに備える項目21に記載の方法。
[項目25]
セルフリーのメチル化DNAの捕捉を確認するために、工程(c)後に第2量の対照DNAを前記試料に加える工程をさらに備える項目1から項目23のいずれか一項に記載の方法。
[項目26]
癌細胞由来のDNAの存在を特定する工程が、原発癌細胞組織を特定することをさらに備える項目1から項目25のいずれか一項に記載の方法。
[項目27]
前記原発癌細胞組織を特定することが、癌亜型を特定することをさらに備える項目26に記載の方法。
[項目28]
前記癌亜型が、ステージ、組織学、遺伝子発現パターン、コピー数異常、再構成、又は点変異状態に基づいて前記癌を識別する項目27に記載の方法。
[項目29]
工程(f)の比較が全ゲノムにわたって実施される項目1から項目28のいずれか一項に記載の方法。
[項目30]
工程(f)の比較が全ゲノムから特定の調節領域に限定される項目1から項目28のいずれか一項に記載の方法。
[項目31]
前記調節領域が、FANTOM5エンハンサー、CpGアイランド、CpGショア、CpGシェルフ、又はこれらのいずれかの組み合わせである項目30に記載の方法。[項目32]
工程(f)及び工程(g)がコンピュータプロセッサにより実施される項目1から項目31のいずれか一項に記載の方法。
[項目33]
癌細胞由来のDNAの存在を検出し、癌亜型を特定する方法であって、
a. 対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、
b. 捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、
c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定する工程と、
d. 工程c.からの癌細胞由来のDNAが特定される場合、工程bの比較に基づいて、原発癌細胞組織及び癌亜型をさらに特定する工程と
を備える方法。
[項目34]
癌細胞由来のDNAの存在を検出し、癌亜型を特定するコンピュータ実装方法であって、
a. 少なくとも1つのプロセッサで、対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取る工程と、
b. 前記少なくとも1つのプロセッサで、捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較する工程と、
c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、前記少なくとも1つのプロセッサで、癌細胞由来のDNAの存在を特定し、工程c.からの癌細胞由来のDNAが特定される場合、工程bの比較に基づいて、原発癌細胞組織及び癌亜型をさらに特定する工程と
を備える方法。
[項目35]
プロセッサ及び前記プロセッサに接続されたメモリを有する汎用性コンピュータと組み合わせて使用するためのコンピュータプログラム製品であって、コンピュータメカニズムがエンコードされたコンピュータ可読記憶媒体を含み、前記コンピュータプログラムメカニズムが前記コンピュータの前記メモリにローディングされ、前記コンピュータに項目34に記載の方法を実行させてもよいコンピュータプログラム製品。
[項目36]
項目35に記載のコンピュータプログラム製品を保存するためのデータ構造が保存されたコンピュータ可読媒体。
[項目37]
癌細胞由来のDNAの存在を検出して癌亜型を特定するためのデバイスであって、
少なくとも1つのプロセッサと、
前記少なくとも1つのプロセッサと通信している電子メモリと
を備え
前記電子メモリは、前記少なくとも1つのプロセッサで実行される場合に、前記少なくとも1つのプロセッサに、
a. 対象試料由来のセルフリーのメチル化DNAの配列決定データを受け取ることと、
b. 捕捉されたセルフリーのメチル化DNAの配列を、健康な個体及び癌性個体由来の対照のセルフリーのメチル化DNA配列と比較することと、
c. 前記捕捉されたセルフリーのメチル化DNAの1以上の配列と癌性個体由来のセルフリーのメチル化DNA配列との間に統計的に有意な類似性がある場合に、癌細胞由来のDNAの存在を特定し、癌細胞由来のDNAが特定される場合に、工程bの比較に基づいて、原発癌細胞組織及び癌亜型をさらに特定することと
を実行させるプロセッサ実行可能なコードを保存するデバイス。
[項目38]
癌細胞由来のDNAの存在を検出して、2以上の可能性のある器官から前記癌細胞が発生した前記癌の場所を決定する方法であって、
(a)対象由来のセルフリーDNAの試料を準備する工程と、
(b)メチル化ポリヌクレオチドに選択的な結合剤を使用して、前記試料由来のセルフリーのメチル化DNAを捕捉する工程と、
(c)捕捉された前記セルフリーのメチル化DNAを配列決定する工程と、
(d)前記捕捉されたセルフリーのメチル化DNAの配列パターンを対照個体の2以上の母集団のDNA配列パターンと比較する工程であって、前記2以上の母集団の各々は、異なる器官に限局性癌を有する工程と、
(e)前記セルフリーDNAのメチル化のパターンと前記2以上の母集団のうちの1つのメチル化のパターンとの間の統計的に有意な類似性に基づいて、どの器官で前記癌細胞が発生したかを決定する工程と
を備える方法。
【手続補正書】
【提出日】2023-08-17
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
対象が癌を有するか又は癌を有するリスクがあることを判定する方法であって、
(a)前記対象のセルフリーデオキシリボ核酸(cfDNA)試料から生成された複数の核酸分子を配列決定に供して、複数の配列決定リードを得る工程と、
(b)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子についてのメチル化プロファイルを生成する工程と、
(c)前記メチル化プロファイルをコンピュータ処理して、少なくとも94%の受信者動作特性曲線下部面積(AUROC)において、前記対象が前記癌を有するか又は前記癌を有するリスクがあることを判定する工程と
を備える方法(配列決定において亜硫酸水素塩変換を伴う方法を除く)。
【請求項2】
前記癌が、肺癌、乳癌、結直腸癌、急性骨髄性白血病、及び多形神経膠芽腫からなる群から選択される請求項1に記載の方法。
【請求項3】
前記癌が急性骨髄性白血病である請求項2に記載の方法。
【請求項4】
前記AUROCが少なくとも99%である請求項3に記載の方法。
【請求項5】
対象が特定のステージの癌を有するか又は特定のステージの癌を有するリスクがあることを判定する方法であって、
(a)前記対象のセルフリーデオキシリボ核酸(cfDNA)試料から生成された複数の核酸分子を配列決定に供して、複数の配列決定リードを得る工程と、
(b)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子についてのメチル化プロファイルを生成する工程と、
(c)前記メチル化プロファイルをコンピュータ処理して、少なくとも93%の受信者動作特性曲線下部面積(AUROC)において、前記対象が前記特定のステージの前記癌を有するか又は前記特定のステージの前記癌を有するリスクがあることを判定する工程とを備える方法(配列決定において亜硫酸水素塩変換を伴う方法を除く)。
【請求項6】
前記癌が肺癌である請求項1又は請求項5に記載の方法。
【請求項7】
前記特定のステージが肺癌の早期である請求項6に記載の方法。
【請求項8】
前記AUROCが少なくとも95%である請求項7に記載の方法。
【請求項9】
前記特定のステージが肺癌の後期である請求項6に記載の方法。
【請求項10】
前記AUROCが少なくとも93%である請求項9に記載の方法。
【請求項11】
前記メチル化プロファイルが、前記複数の核酸分子の複数の可変メチル化領域(DMR)のメチル化レベルを含む請求項1又は請求項5に記載の方法。
【請求項12】
前記DMRが過剰メチル化又は低メチル化を含む請求項11に記載の方法。
【請求項13】
前記cfDNA試料をある量のフィラーDNAと混合して、DNA混合物試料を生成する工程をさらに備える請求項1又は請求項5に記載の方法。
【請求項14】
前記DNA混合物試料が、少なくとも50ナノグラム(ng)である少なくともある量の総DNAを含む請求項13に記載の方法。
【請求項15】
前記フィラーDNAが少なくとも部分的にメチル化されており、50bp~800bpの長さを含む請求項13に記載の方法。
【請求項16】
前記DNA混合物をインキュベーションして、前記cfDNA試料の前記複数の核酸分子の少なくとも1以上のメチル化領域の濃縮倍率比を高める工程をさらに備える請求項1又は請求項5に記載の方法。
【請求項17】
前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とともにインキュベーションする工程をさらに備え、前記結合剤が、メチルCpG結合ドメインを含むタンパク質を含む請求項16に記載の方法。
【請求項18】
前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とともにインキュベーションする工程をさらに備え、前記結合剤が抗体を含む請求項16に記載の方法。
【請求項19】
前記メチル化プロファイルをコンピュータ処理することが、健康な対照のメチル化プロファイルと比較すること、又は訓練された機械学習アルゴリズムを使用することを含む請求項1又は請求項5に記載の方法。
【請求項20】
前記訓練された機械学習アルゴリズムが線形回帰を含む請求項19に記載の方法。
【外国語明細書】