IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ユニバーシティー ヘルス ネットワークの特許一覧

特開2024-126029循環腫瘍核酸分子のマルチモーダル分析
<>
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図1
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図2
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図3
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図4
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図5
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図6
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図7
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図8
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図9
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図10
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図11
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図12
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図13
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図14
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図15
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図16
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図17
  • 特開-循環腫瘍核酸分子のマルチモーダル分析 図18
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2024126029
(43)【公開日】2024-09-19
(54)【発明の名称】循環腫瘍核酸分子のマルチモーダル分析
(51)【国際特許分類】
   C12Q 1/6869 20180101AFI20240911BHJP
   G16B 30/00 20190101ALI20240911BHJP
   C12Q 1/6886 20180101ALI20240911BHJP
   C12Q 1/6806 20180101ALI20240911BHJP
【FI】
C12Q1/6869 Z
G16B30/00
C12Q1/6886 Z
C12Q1/6806 Z
【審査請求】有
【請求項の数】1
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2024099692
(22)【出願日】2024-06-20
(62)【分割の表示】P 2022577358の分割
【原出願日】2021-06-18
(31)【優先権主張番号】63/041,151
(32)【優先日】2020-06-19
(33)【優先権主張国・地域又は機関】US
(71)【出願人】
【識別番号】507148294
【氏名又は名称】ユニバーシティー ヘルス ネットワーク
(74)【代理人】
【識別番号】100114188
【弁理士】
【氏名又は名称】小野 誠
(74)【代理人】
【識別番号】100119253
【弁理士】
【氏名又は名称】金山 賢教
(74)【代理人】
【識別番号】100124855
【弁理士】
【氏名又は名称】坪倉 道明
(74)【代理人】
【識別番号】100129713
【弁理士】
【氏名又は名称】重森 一輝
(74)【代理人】
【識別番号】100137213
【弁理士】
【氏名又は名称】安藤 健司
(74)【代理人】
【識別番号】100183519
【弁理士】
【氏名又は名称】櫻田 芳恵
(74)【代理人】
【識別番号】100196483
【弁理士】
【氏名又は名称】川嵜 洋祐
(74)【代理人】
【識別番号】100160255
【弁理士】
【氏名又は名称】市川 祐輔
(74)【代理人】
【識別番号】100146318
【弁理士】
【氏名又は名称】岩瀬 吉和
(74)【代理人】
【識別番号】100127812
【弁理士】
【氏名又は名称】城山 康文
(72)【発明者】
【氏名】ブラットマン,スコット・ヴィクター
(72)【発明者】
【氏名】バーゲナー,ジャスティン・マシュー
(72)【発明者】
【氏名】ディニーズ・デ・カルヴァロ,ダニエル
(57)【要約】      (修正有)
【課題】対象のがん細胞からctDNAが存在することを検出する方法を提供する。
【解決手段】方法は、対象からセルフリーDNAの試料を得る工程と、試料をライブラリ調製に供して、セルフリーメチル化DNAのその後の配列決定を可能にする工程と、メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNAを捕捉する工程と、捕捉されたセルフリーメチル化DNAを配列決定する工程と、健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用いて、捕捉されたセルフリーメチル化DNAの配列を比較する工程と、捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のDNAの存在を同定する工程と、を含み、対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定される。
【選択図】図4
【特許請求の範囲】
【請求項1】
対象のがん細胞から循環腫瘍デオキシリボ核酸(ctDNA)が存在することを検出す
る方法であって、
(a)前記対象からセルフリーデオキシリボ核酸(DNA)の試料を得る工程、
(b)前記試料をライブラリ調製に供して、前記セルフリーメチル化DNAのその後の
配列決定を可能にする工程、
(c)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNA
を捕捉する工程、
(d)前記捕捉されたセルフリーメチル化DNAを配列決定する工程、
(e)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用い
て、前記捕捉されたセルフリーメチル化DNAの前記配列をコンピュータ処理する工程、
および
(f)前記捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来の
セルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来
のDNAの前記存在を同定する工程を含み、
(d)、(f)および(g)の少なくとも1つにおいて、前記対象のセルフリーメチル
化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法。
【請求項2】
第1の量のフィラーDNAを前記試料に添加することをさらに含み、前記フィラーDN
Aの少なくとも一部がメチル化され、次いでさらに前記試料を変性させていてもよい、請
求項1に記載の方法。
【請求項3】
前記断片の長さのメトリックが断片の長さである、請求項1に記載の方法。
【請求項4】
前記対象のセルフリーメチル化DNAが、<170塩基対(bp)、<165bp、<
160bp、<155bp、<150bp、<145bp、<140bp、<135bp
、<130bp、<125bp、<120bp、<115bp、<110bp、<105
bp、または<100bpの長さを有する断片に限定される、請求項2に記載の方法。
【請求項5】
前記対象のセルフリーメチル化DNAが、約100~約150bp、110~140b
pまたは120~130bpの長さを有する断片に限定される、請求項2に記載の方法。
【請求項6】
前記断片の長さのメトリックが、前記対象のセルフリーメチル化DNAの前記断片の長
さの分布である、請求項1に記載の方法。
【請求項7】
前記対象のセルフリーメチル化DNAが、長さに基づいて下位50、45、40、35
、30、25、20、15または10パーセンタイル内の断片に限定される、請求項5に
記載の方法。
【請求項8】
前記対象のセルフリーメチル化DNAが、差次的メチル化領域(DMR)内の断片にさ
らに限定される、請求項1~6のいずれか一項に記載の方法。
【請求項9】
前記対象のセルフリーメチル化DNAがさらに制限される、前記捕捉する工程の間であ
る、請求項1~7のいずれか一項に記載の方法。
【請求項10】
前記対象のセルフリーメチル化DNAがさらに制限される、前記比較する工程の間であ
る、請求項1~7のいずれか一項に記載の方法。
【請求項11】
前記限定することが、前記同定することの間である、請求項1~7のいずれか一項に記
載の方法。
【請求項12】
前記試料が前記対象の血液または血漿に由来する、請求項1~10のいずれか一項に記
載の方法。
【請求項13】
(f)が統計的分類器を使用することを含む、請求項1~11のいずれか一項に記載の
方法。
【請求項14】
前記分類器が機械学習によって導出される、請求項12に記載の方法。
【請求項15】
健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列は、健常
な個体とがんの個体との間の差次的メチル化領域(DMR)のデータベースに含まれる、
請求項1~14のいずれか一項に記載の方法。
【請求項16】
健常な個体およびがんの個体由来の前記対照のセルフリーメチル化DNA配列が、セル
フリーDNAに由来するDNAにおいて健常な個体とがんの個体との間として差次的にメ
チル化されているその対照のセルフリーメチル化DNA配列に限定される、請求項1~1
5のいずれか一項に記載の方法。
【請求項17】
前記対照のセルフリーメチル化DNA配列が、血漿に由来するDNAにおいて健常な個
体とがんの個体との間として差次的にメチル化される、請求項16に記載の方法。
【請求項18】
前記試料が、100ng、75ngまたは50ng未満のセルフリーDNAを有する、
請求項1~17のいずれか一項に記載の方法。
【請求項19】
前記フィラーDNAの第1の量は、少なくとも約5%、10%、15%、20%、30
%、40%、50%、60%、70%、80%、90%、または100%のメチル化フィ
ラーDNAを含み、残りは非メチル化フィラーDNAであり、好ましくは5%~50%、
10%~40%、または15%~30%のメチル化フィラーDNAである、請求項1~1
8のいずれか一項に記載の方法。
【請求項20】
前記フィラーDNAの第1の量が、20ng~100ng、好ましくは30ng~10
0ng、より好ましくは50ng~100ngである、請求項1~18のいずれか一項に
記載の方法。
【請求項21】
前記試料から得た前記セルフリーDNAおよび前記第1の量のフィラーDNAは、合わ
せて少なくとも50ngの総DNA、好ましくは少なくとも100ngの総DNAを含む
、請求項1~20のいずれか一項に記載の方法。
【請求項22】
前記フィラーDNAが、50bp~800bpの長さ、好ましくは100bp~600
bpの長さ、より好ましくは200bp~600bpの長さである、請求項1~21のい
ずれか一項に記載の方法。
【請求項23】
前記フィラーDNAが二本鎖である、請求項1~22のいずれか一項に記載の方法。
【請求項24】
前記フィラーDNAがジャンクDNAである、請求項1~11のいずれか一項に記載の
方法。
【請求項25】
前記フィラーDNAが内因性または外因性DNAである、請求項1~12のいずれか一
項に記載の方法。
【請求項26】
前記フィラーDNAが非ヒトDNA、好ましくはλDNAである、請求項25に記載の
方法。
【請求項27】
前記フィラーDNAがヒトDNAとアライメントしていない、請求項1~26のいずれ
か一項に記載の方法。
【請求項28】
前記結合剤が、メチル-CpG結合ドメインを含むタンパク質である、請求項1~27
のいずれか一項に記載の方法。
【請求項29】
前記タンパク質がMBD2タンパク質である、請求項1~28のいずれか一項に記載の
方法。
【請求項30】
(d)が、抗体を使用して前記セルフリーメチル化DNAを免疫沈降させることを含む
、請求項1~29のいずれか一項に記載の方法。
【請求項31】
免疫沈降のために少なくとも0.05μg、好ましくは少なくとも0.16μgの前記
抗体を前記試料に添加することを含む、請求項30に記載の方法。
【請求項32】
前記抗体が5-MeC抗体である、請求項30に記載の方法。
【請求項33】
前記免疫沈降反応を確認するために、(c)の後に第2の量の対照DNAを前記試料に
添加することをさらに含む、請求項30に記載の方法。
【請求項34】
セルフリーメチル化DNAの前記捕捉を確認するために、(c)の後に第2の量の対照
DNAを前記試料に添加することをさらに含む、請求項1~32のいずれか一項に記載の
方法。
【請求項35】
がん細胞由来のDNAが前記存在することを同定することは、がん細胞の起源の組織を
同定することをさらに含む、請求項1~34のいずれか一項に記載の方法。
【請求項36】
前記がん細胞の起源の組織を同定することは、がんのサブタイプを同定することをさら
に含む、請求項35に記載の方法。
【請求項37】
前記がんのサブタイプが、ステージ、組織学、遺伝子発現パターン、コピー数異常、再
編成、または点変異状態に基づいて前記がんを区別する、請求項36に記載の方法。
【請求項38】
(f)がゲノムワイドに行われる、請求項1~37のいずれか一項に記載の方法。
【請求項39】
(f)がゲノムワイドから特定の調節領域に制限される、請求項1~37のいずれか一
項に記載の方法。
【請求項40】
前記調節領域が、FANTOM5エンハンサー、CpGアイランド、CpGショア、C
pG Shelf、または前述物の任意の組み合わせである、請求項39に記載の方法。
【請求項41】
工程(f)および(g)がコンピュータプロセッサによって実行される、請求項1~4
0のいずれか一項に記載の方法。
【請求項42】
前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳
がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユー
イングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍
(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽
頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄
単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮
膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、
鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵
巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、
肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細
胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰が
ん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍からなる群から選択さ
れる、請求項1~41のいずれか一項に記載の方法。
【請求項43】
前記がんが頭頸部扁平上皮癌である、請求項1~41のいずれか一項に記載の方法。
【請求項44】
前記がんの前記検出に使用するための、請求項1~43のいずれか一項に記載の方法。
【請求項45】
前記がんの治療のモニタリングに使用するための、請求項1~43のいずれか一項に記
載の方法。
【請求項46】
対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するための方
法であって、
(a)(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断
片の長さプロファイルからなる群から選択される少なくとも1つのプロファイルを生成す
るために前記対象から得られたセルフリー核酸試料に由来する複数の核酸分子をシーケン
シングに供する工程、および
(b)前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なく
とも80%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1
つのプロファイルを処理する工程であって、前記セルフリー核酸試料が30ナノグラム(
ng)/ミリリットル(ml)未満の前記複数の核酸分子を含む、処理する工程を含む、
方法。
【請求項47】
前記セルフリー核酸試料が10ng/ml未満の前記複数の核酸分子を含む、請求項4
6に記載の方法。
【請求項48】
前記セルフリー核酸試料が5ng/ml未満の前記複数の核酸分子を含む、請求項46
に記載の方法。
【請求項49】
前記セルフリー核酸試料が1ng/ml未満の前記複数の核酸分子を含む、請求項46
に記載の方法。
【請求項50】
(a)に前記供する工程が、(i)、(ii)および(iii)からなる群から選択さ
れる少なくとも2つのプロファイルを生成する、請求項46に記載の方法。
【請求項51】
前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記断片の長
さプロファイルを含む、請求項50に記載の方法。
【請求項52】
前記少なくとも2つのプロファイルが、前記変異プロファイルおよび前記断片の長さプ
ロファイルを含む、請求項50に記載の方法。
【請求項53】
前記少なくとも2つのプロファイルが、前記メチル化プロファイルおよび前記変異プロ
ファイルを含む、請求項50に記載の方法。
【請求項54】
(a)を前記供する工程が、前記メチル化プロファイル、前記変異プロファイルおよび
前記断片の長さプロファイルを生成する、請求項46に記載の方法。
【請求項55】
対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有する
リスクがあるかどうかを判定する方法であって、
(a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
(b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リー
ドを生成する工程、
(c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子につい
て、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の
長さプロファイルを同定する工程、および
(d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するた
めに、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長
さプロファイルを使用する工程を含む、方法。
【請求項56】
前記疾患ががんを含む、請求項46~55のいずれか一項に記載の方法。
【請求項57】
前記がんが、副腎がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳
がん、キャッスルマン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユー
イングファミリーの腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍
(gist)、妊娠性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽
頭がん、白血病(急性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄
単球性)、肝臓がん、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮
膚のリンパ腫、悪性中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、
鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵
巣がん、陰茎がん、下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、
肉腫-成人軟部組織がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細
胞)、小腸がん、胃がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰が
ん、ワルデンシュトレームマクログロブリン血症、ウィルムス腫瘍、扁平上皮癌、および
頭頸部扁平上皮癌からなる群から選択される前記がんからなる群から選択される、請求項
56に記載の方法。
【請求項58】
前記がんが扁平上皮癌である、請求項57に記載の方法。
【請求項59】
前記がんが頭頸部扁平上皮癌である、請求項58に記載の方法。
【請求項60】
前記複数のセルフリー核酸分子が循環腫瘍核酸分子を含む、請求項46~56のいずれ
か一項に記載の方法。
【請求項61】
前記循環腫瘍核酸が循環腫瘍DNAを含む、請求項60に記載の方法。
【請求項62】
前記循環腫瘍核酸が循環腫瘍RNAを含む、請求項60に記載の方法。
【請求項63】
前記メチル化プロファイルが、複数の差次的メチル化領域(DMR)を含む、請求項4
6~62のいずれかに記載の方法。
【請求項64】
前記複数のDMRがctDNA由来である、請求項63に記載の方法。
【請求項65】
末梢血白血球に由来する複数のDMRが前記メチル化プロファイルから除去される、請
求項63に記載の方法。
【請求項66】
前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して低メチル
化レベルを有する少なくとも約56のゲノム領域を含む、請求項63に記載の方法。
【請求項67】
前記複数のDMRが、正常で健常な対象からの対応するゲノム領域と比較して、過剰メ
チル化レベルを有する少なくとも約941のゲノム領域を含む、請求項54に記載の方法
【請求項68】
DMRが少なくとも約300bpのサイズを含む、請求項63に記載の方法。
【請求項69】
DMRが、少なくとも約100bp~少なくとも約200bpのサイズを含む、請求項
68に記載の方法。
【請求項70】
DMRが、少なくとも約100bp~少なくとも約150bpのサイズを含む、請求項
68に記載の方法。
【請求項71】
DMRが少なくとも8のCpGゲノムアイランドを含む、請求項63に記載の方法。
【請求項72】
前記正常で健常な対象が、前記対象と同じリスク因子のセットを含む、請求項66また
は67のいずれかに記載の方法。
【請求項73】
前記変異プロファイルが、ミスセンス変異体、ナンセンス変異体、欠失変異体、挿入変
異体、重複変異体、逆位変異体、フレームシフト変異体、または反復伸長変異体を含む、
請求項45~72のいずれかに記載の方法。
【請求項74】
複数の末梢血白血球から得られたゲノムDNA試料に存在する任意の変異体であって、
前記複数の末梢血白血球が前記対象から得られ、前記変異プロファイルから除去される、
請求項45~72のいずれかに記載の方法。
【請求項75】
クローン造血に由来するいずれかの変異体が前記変異プロファイルから除去される、請
求項45~72のいずれかに記載の方法。
【請求項76】
前記変異プロファイルが、遺伝子DNMT3A、TET2、またはASXL1の変異体
を含まない、請求項75に記載の方法。
【請求項77】
前記変異プロファイルが標準的がんドライバ遺伝子を含まない、請求項75に記載の方
法。
【請求項78】
前記変異プロファイルが非標準的がんドライバ遺伝子を含み、前記非標準的遺伝子がG
RIN3AまたはMYCである、請求項75に記載の方法。
【請求項79】
前記断片の長さプロファイルが、少なくとも約80bp~170bpの断片の長さの範
囲に基づいてセルフリー核酸分子を選択することを含む、請求項46~78のいずれかに
記載の方法。
【請求項80】
前記断片の長さプロファイルが、少なくとも約100bp~150bpの断片の長さの
範囲に基づいてセルフリー核酸分子を選択することを含む、請求項46~78のいずれか
に記載の方法。
【請求項81】
前記循環腫瘍核酸分子が濃縮されている、請求項79または80のいずれかに記載の方
法。
【請求項82】
前記セルフリー核酸試料をフィラーDNA分子と混合してDNA混合物を生じることを
さらに含む、請求項46~81のいずれかに記載の方法。
【請求項83】
前記フィラーDNA分子が約50bp~800bpの長さを含む、請求項82に記載の
方法。
【請求項84】
前記フィラーDNA分子が約100bp~600bpの長さを含む、請求項82に記載
の方法。
【請求項85】
前記フィラーDNA分子が、少なくとも約5%のメチル化フィラーDNA分子を含む、
請求項82に記載の方法。
【請求項86】
前記フィラーDNA分子が、少なくとも約20%のメチル化フィラーDNAを含む、請
求項82に記載の方法。
【請求項87】
前記フィラーDNA分子が、少なくとも約30%のメチル化フィラーDNAを含む、請
求項82に記載の方法。
【請求項88】
前記フィラーDNA分子が、少なくとも約50%のメチル化フィラーDNAを含む、請
求項82に記載の方法。
【請求項89】
前記DNA混合物を、メチル化ヌクレオチドに結合するように構成された結合剤とイン
キュベートして濃縮試料を生成することをさらに含む、請求項46~88のいずれかに記
載の方法。
【請求項90】
前記結合剤が、メチル-CpG結合ドメインを含むタンパク質を含む、請求項89に記
載の方法。
【請求項91】
前記タンパク質がMBD2タンパク質である、請求項89に記載の方法。
【請求項92】
前記結合剤が抗体を含む、請求項89に記載の方法。
【請求項93】
前記抗体が5-MeC抗体である、請求項89に記載の方法。
【請求項94】
前記抗体が5-ヒドロキシメチルシトシン抗体である、請求項89に記載の方法。
【請求項95】
前記配列決定が亜硫酸水素塩配列決定を含まない、請求項46~94のいずれかに記載
の方法。
【請求項96】
前記セルフリー核酸試料が血液試料を含む、請求項46~94のいずれかに記載の方法
【請求項97】
前記血液試料が血漿試料を含む、請求項96に記載の方法。
【請求項98】
がん組織の起源を検出することをさらに含む、請求項46~97のいずれかに記載の方
法。
【請求項99】
前記対象の生存率の予後を含む報告を生成することをさらに含む、請求項46~97の
いずれかに記載の方法。
【請求項100】
前記対象に治療を与えることをさらに含む、請求項46~97のいずれかに記載の方法
【請求項101】
前記疾患の治療に続いて、前記治療が有効であるかどうかを示す第2の報告を与えるこ
とをさらに含む、請求項46~97のいずれかに記載の方法。
【請求項102】
対象が状態を有するか、または状態を有するリスクがあるかどうかを判定するための方
法であって、
(a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイす
る工程、
(b)表5に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸
分子の少なくとも一部のメチル化レベルを検出する工程、および
(c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記
メチル化レベルを、前記表5に列挙されたDMRに含まれる前記セルフリー核酸分子の対
応する(1つまたは複数の)部分のメチル化レベルと比較する工程を含む、方法。
【請求項103】
前記セルフリー核酸分子がctDNAを含む、請求項102に記載の方法。
【請求項104】
前記配列決定分析を実施することを含み、前記配列決定分析がcell-free M
ethylated DNA ImmunoPrecipitation(cfMeDI
P)配列決定を含む、請求項102に記載の方法。
【請求項105】
前記検出する工程が、表5に列挙される6つ以上、10以上、15以上、20以上、3
0以上、40以上、50以上、60以上、70以上、80以上、90以上、または100
以上のDMRに含まれる前記核酸分子の少なくとも一部のメチル化レベルを測定すること
を含む、請求項102に記載の方法。
【請求項106】
対象が疾患の治療を受けた後により高い生存率を有するかどうかを判定する方法であっ
て、
(a)前記対象からの試料の少なくとも一部から得たセルフリー核酸分子をアッセイす
る工程、
(b)表6に列挙される差次的メチル化領域(DMR)に含まれる前記セルフリー核酸
分子の少なくとも一部のメチル化レベルを検出する工程、および
(c)少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前記
メチル化レベルを、前記表6に列挙されたDMRに含まれる前記セルフリー核酸分子の対
応する(1つまたは複数の)部分のメチル化レベルと処理する工程を含む、方法。
【請求項107】
前記セルフリー核酸分子がctDNAを含む、請求項106に記載の方法。
【請求項108】
前記検出する工程が、複合体メチル化スコア(CMS)を提示することを含む、請求項
106に記載の方法。
【請求項109】
前記CMSが、表6に列挙されたDMRのβ値の合計を含む、請求項107に記載の方
法。
【請求項110】
CMSがより高いことが、前記対象の生存率がより低いことを示す、請求項107に記
載の方法。
【請求項111】
前記CMSがctDNAの存在量に依存しない、請求項107に記載の方法。
【請求項112】
前記疾患が扁平上皮癌である、請求項102~111のいずれかに記載の方法。
【請求項113】
前記がんが頭頸部扁平上皮癌である、請求項112に記載の方法。
【請求項114】
少なくとも約80bp~170bpの断片の長さの範囲に基づいてセルフリー核酸分子
を選択することをさらに含む、請求項102~113のいずれか一項に記載の方法。
【請求項115】
対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定するためのシ
ステムであって、
(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の長
さプロファイルのうちの少なくとも1つのプロファイルを生成するために前記対象から得
られたセルフリー核酸試料に由来する複数の核酸分子をシーケンシングに供する工程、お
よび
前記対象が前記疾患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも8
0%の感度または少なくとも約90%の特異度で判定するために前記少なくとも1つのプ
ロファイルを処理する工程であって、前記セルフリー核酸試料が30ng/ml未満の前
記複数の核酸分子を含む、処理する工程
を含むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複
数のコンピュータプロセッサを含む、システム。
【請求項116】
対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾患を有する
リスクがあるかどうかを判定するシステムであって、
(a)複数の核酸分子を含む前記セルフリー核酸試料を得る工程、
(b)前記複数の核酸分子またはその誘導体を配列決定に供して、複数の配列決定リー
ドを生成する工程、
(c)前記複数の配列決定リードをコンピュータ処理して、前記複数の核酸分子につい
て、(i)メチル化プロファイル、(ii)変異プロファイル、および(iii)断片の
長さプロファイルを同定する工程、および
(d)前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するた
めに、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長
さプロファイルを使用する工程を含むプロセスを実施するように個別にまたは集合的にプ
ログラムされた1つまたは複数のコンピュータプロセッサを含む、システム。
【発明の詳細な説明】
【技術分野】
【0001】
相互参照
本願は、2020年6月19日に出願された米国仮特許出願第63/041,151号
の利益を主張するものであり、その全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
循環腫瘍DNA(ctDNA)は、日常的な臨床的な使用のための非侵襲的な腫瘍特異
的バイオマーカーとしての可能性をいっそう実証している。ctDNAは、主に細胞死を
経ている腫瘍細胞に由来し、血液を含む様々な体液の循環に放出される。ほとんどのがん
患者において、血液由来のセルフリーDNAの大部分は末梢血白血球(PBL)に由来す
る。したがって、ctDNAの検出および定量には、腫瘍由来の遺伝的およびエピジェネ
ティックな変化の同定が必要である。さらに、観察されたctDNAの画分は、腫瘍の原
発部位および疾患の負荷を含むいくつかの因子に応じて、診断時の全セルフリーDNAの
0.1%未満~90%の範囲であり得る。ctDNAは、腫瘍の分子状況および疾患の負
荷に対する非侵襲的なアクセスをもたらしている。特に、低い存在量のctDNAを有す
る対象において、高感度でctDNAを検出する方法が、必要である。
【0003】
参照による組み込み
個々の刊行物、特許、または特許出願が具体的かつ個別に参照により組み込まれること
を示しているかのように、それと同程度に、本明細書にて言及されるすべての刊行物、特
許、および特許出願は、参照により本明細書に組み込まれる。
【発明の概要】
【発明が解決しようとする課題】
【0004】
態様において、対象のがん細胞からctDNAが存在することを検出する方法であって

(a)対象からセルフリーDNAの試料を得る工程、
(b)試料をライブラリ調製に供して、セルフリーメチル化DNAのその後の配列決定
を可能にする工程、
(c)第1の量のフィラーDNAが試料に添加されていてもよく、フィラーDNAの少
なくとも一部がメチル化され、次いで、さらに、試料を変性されていてもよい工程、
(d)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNA
を捕捉する工程、
(e)捕捉されたセルフリーメチル化DNAを配列決定する工程、
(f)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用い
て、捕捉されたセルフリーメチル化DNAの配列を比較する工程、
(g)捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセル
フリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のD
NAの存在を同定する工程
を含み、捕捉する工程、比較する工程または同定する工程の少なくとも1つにおいて、
対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定され
る、方法が提供される。
【0005】
態様として、本開示は、対象が疾患を有するか、または疾患を有するリスクがあるかど
うかを判定する方法を提供する。方法は、(i)メチル化プロファイル、(ii)変異プ
ロファイル、および(iii)断片の長さプロファイルからなる群から選択される少なく
とも1つのプロファイルを生成するために対象から得られたセルフリー核酸試料に由来す
る複数の核酸分子をシーケンシングに供する工程、および前記対象が前記疾患を有するか
または疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%
の特異度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、
前記セルフリー核酸試料が30ナノグラム(ng)/ミリリットル(ml)未満の複数の
核酸分子を含む、処理する工程を含む。
【0006】
いくつかの実施形態では、セルフリー核酸試料は、10ng/ml未満の前記複数の核
酸分子を含む。いくつかの実施形態では、セルフリー核酸試料は、5ng/ml未満の前
記複数の核酸分子を含む。いくつかの実施形態では、セルフリー核酸試料は、1ng/m
l未満の前記複数の核酸分子を含む。いくつかの実施形態では、(a)に供する工程が、
(i)、(ii)および(iii)からなる群から選択される少なくとも2つのプロファ
イルを生成する。いくつかの実施形態では、少なくとも2つのプロファイルは、前記メチ
ル化プロファイルおよび前記断片の長さプロファイルを含む。
【0007】
いくつかの実施形態では、少なくとも2つのプロファイルは、前記変異プロファイルお
よび前記断片の長さプロファイルを含む。いくつかの実施形態では、少なくとも2つのプ
ロファイルは、前記メチル化プロファイルおよび前記変異プロファイルを含む。いくつか
の実施形態では、(a)を供する工程が、前記メチル化プロファイル、前記変異プロファ
イルおよび前記断片の長さプロファイルを生成する。
【0008】
別の態様では、本開示は、対象のセルフリー核酸試料を処理して、前記対象が疾患を有
するかまたは疾患を有するリスクがあるかどうかを判定する方法を提供する。方法は、複
数の核酸分子を含む前記セルフリー核酸試料を得る工程、前記複数の核酸分子またはその
誘導体を配列決定に供して、複数の配列決定リードを生成する工程、前記複数の配列決定
リードをコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファ
イル、(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する
工程、および前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定す
るために、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片
の長さプロファイルを使用する工程を含む。
【0009】
いくつかの実施形態では、疾患はがんを含む。いくつかの実施形態では、がんが、副腎
がん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマ
ン病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの
腫瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠
性栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急
性リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん
、肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性
中皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽
細胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、
下垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織
がん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃
がん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュト
レームマクログロブリン血症、ウィルムス腫瘍、扁平上皮癌、および頭頸部扁平上皮癌か
らなる群から選択されるがんからなる群から選択される。いくつかの実施形態では、がん
は扁平上皮癌である。いくつかの実施形態では、がんは頭頸部扁平上皮癌である。
【0010】
いくつかの実施形態では、複数のセルフリー核酸分子は、循環腫瘍核酸分子を含む。い
くつかの実施形態では、循環腫瘍核酸は循環腫瘍DNAを含む。いくつかの実施形態では
、循環腫瘍核酸は循環腫瘍RNAを含む。いくつかの実施形態では、メチル化プロファイ
ルは、複数の差次的メチル化領域(DMR)を含む。いくつかの実施形態では、複数のD
MRはctDNA由来である。いくつかの実施形態では、末梢血白血球に由来する複数の
DMRがメチル化プロファイルから除去される。いくつかの実施形態では、複数のDMR
が、正常で健常な対象からの対応するゲノム領域と比較して低メチル化レベルを有する少
なくとも約56のゲノム領域を含む。いくつかの実施形態では、複数のDMRは、正常で
健常な対象からの対応するゲノム領域と比較して、過剰メチル化レベルを有する少なくと
も約941のゲノム領域を含む。いくつかの実施形態では、DMRは、少なくとも約30
0bpのサイズを含む。いくつかの実施形態では、DMRは、少なくとも約100bp~
少なくとも約200bpのサイズを含む。いくつかの実施形態では、DMRは、少なくと
も約100bp~少なくとも約150bpのサイズを含む。いくつかの実施形態では、D
MRが少なくとも8のCpGゲノムアイランドを含む。いくつかの実施形態では、正常で
健常な対象は、前記対象と同じリスク因子のセットを含む。
【0011】
いくつかの実施形態では、変異プロファイルは、ミスセンス変異体、ナンセンス変異体
、欠失変異体、挿入変異体、重複変異体、逆位変異体、フレームシフト変異体、または反
復伸長変異体を含む。いくつかの実施形態では、複数の末梢血白血球から得られたゲノム
DNA試料に存在する任意の変異体であって、前記複数の末梢血白血球が前記対象から得
られ、前記変異プロファイルから除去される、変異体。いくつかの実施形態では、クロー
ン造血に由来する任意の変異体が前記変異プロファイルから除去される。いくつかの実施
形態では、変異プロファイルが、遺伝子DNMT3A、TET2、またはASXL1の変
異体を含まない。いくつかの実施形態では、変異プロファイルは、標準的ながんドライバ
遺伝子を含まない。いくつかの実施形態では、変異プロファイルが非標準的がんドライバ
遺伝子を含み、前記非標準的遺伝子がGRIN3AまたはMYCである。
【0012】
いくつかの実施形態では、断片の長さプロファイルは、少なくとも約80bp~170
bpの断片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む。いくつか
の実施形態では、断片の長さプロファイルは、少なくとも約100bp~150bpの断
片の長さの範囲に基づいてセルフリー核酸分子を選択することを含む。いくつかの実施形
態では、循環腫瘍核酸分子が濃縮される。
【0013】
いくつかの実施形態では、方法は、前記セルフリー核酸試料をフィラーDNA分子と混
合してDNA混合物を生じることをさらに含む。いくつかの実施形態では、フィラーDN
A分子は、約50bp~800bpの長さを含む。いくつかの実施形態では、フィラーD
NA分子は、約100bp~600bpの長さを含む。いくつかの実施形態では、フィラ
ーDNA分子は、少なくとも約5%のメチル化フィラーDNA分子を含む。いくつかの実
施形態では、フィラーDNA分子は、少なくとも約20%のメチル化フィラーDNAを含
む。いくつかの実施形態では、フィラーDNA分子は、少なくとも約30%のメチル化フ
ィラーDNAを含む。いくつかの実施形態では、フィラーDNA分子は、少なくとも約5
0%のメチル化フィラーDNAを含む。
【0014】
いくつかの実施形態では、方法は、前記DNA混合物を、メチル化ヌクレオチドに結合
するように構成された結合剤とインキュベートして濃縮試料を生成することをさらに含む
。いくつかの実施形態では、結合剤は、メチル-CpG結合ドメインを含むタンパク質を
含む。いくつかの実施形態では、タンパク質はMBD2タンパク質である。いくつかの実
施形態では、結合剤は抗体を含む。いくつかの実施形態では、抗体は5-MeC抗体であ
る。いくつかの実施形態では、抗体は5-ヒドロキシメチルシトシン抗体である。いくつ
かの実施形態では、配列決定は亜硫酸水素塩配列決定を含まない。いくつかの実施形態で
は、セルフリー核酸試料は血液試料を含む。いくつかの実施形態では、血液試料は血漿試
料を含む。いくつかの実施形態では、方法は、がん組織の起源を検出することをさらに含
む。
【0015】
いくつかの実施形態では、方法は、前記対象の生存率の予後を含む報告を生成すること
をさらに含む。いくつかの実施形態では、方法は、前記対象に治療を与えることをさらに
含む。いくつかの実施形態では、前記疾患の治療に続いて、方法は、前記治療が有効であ
るかどうかを示す第2の報告を与えることをさらに含む。
【0016】
別の態様において、本開示は、対象が状態を有するか、または状態を有するリスクがあ
るかどうかを判定するための方法であって、前記対象からの試料の少なくとも一部から得
たセルフリー核酸分子をアッセイする工程、表5に列挙される差次的メチル化領域(DM
R)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工
程、および少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前
記メチル化レベルを、前記表5に列挙されたDMRに含まれる前記セルフリー核酸分子の
対応する(1つまたは複数の)部分のメチル化レベルと比較する工程を含む、方法を提供
する。
【0017】
いくつかの実施形態では、セルフリー核酸分子はctDNAを含む。いくつかの実施形
態では、方法は、配列決定分析を実施することを含み、前記配列決定分析がcell-f
ree Methylated DNA ImmunoPrecipitation(c
fMeDIP)配列決定を含む。いくつかの実施形態では、検出する工程が、表5に列挙
される6つ以上、10以上、15以上、20以上、30以上、40以上、50以上、60
以上、70以上、80以上、90以上、または100以上のDMRに含まれる前記核酸分
子の少なくとも一部のメチル化レベルを測定することを含む。
【0018】
別の態様では、本開示は、対象が疾患の治療を受けた後により高い生存率を有するかど
うかを判定する方法であって、前記対象からの試料の少なくとも一部からのセルフリー核
酸分子をアッセイする工程、表6に列挙される差次的メチル化領域(DMR)に含まれる
前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する工程、および少な
くとも1つのコンピュータプロセッサを使用して、(b)で検出された前記メチル化レベ
ルを、表6に列挙される前記DMRに含まれる前記セルフリー核酸分子の対応する(1つ
または複数の)部分のメチル化レベルに処理することを含む方法を提供する。
【0019】
いくつかの実施形態では、セルフリー核酸分子はctDNAを含む。いくつかの実施形
態では、検出する工程は、複合体メチル化スコア(CMS)を提供することを含む。いく
つかの実施形態では、CMSは、表6に列挙されたDMRのβ値の合計を含む。いくつか
の実施形態では、より高いCMSは、前記対象の生存率がより低いことを示す。いくつか
の実施形態では、CMSは、ctDNAの存在量に依存しない。いくつかの実施形態では
、疾患は扁平上皮癌である。いくつかの実施形態では、がんは頭頸部扁平上皮癌である。
【0020】
別の態様では、本開示は、対象が疾患を有するか、または疾患を有するリスクがあるか
どうかを判定するためのシステムであって、(i)メチル化プロファイル、(ii)変異
プロファイル、および(iii)断片の長さプロファイルのうちの少なくとも1つのプロ
ファイルを生成するために前記対象から得られたセルフリー核酸試料に由来する複数の核
酸分子をシーケンシングに供する工程、および前記対象が前記疾患を有するかまたは前記
疾患のリスクがあるかどうかを少なくとも80%の感度または少なくとも約90%の特異
度で判定するために前記少なくとも1つのプロファイルを処理する工程であって、前記セ
ルフリー核酸試料が30ng/ml未満の前記複数の核酸分子を含む、処理する工程を含
むプロセスを実施するように個別にまたは集合的にプログラムされた1つまたは複数のコ
ンピュータプロセッサを含むシステムを提供する。
【0021】
別の態様では、本開示は、対象のセルフリー核酸試料を処理して、前記対象が疾患を有
するかまたは疾患を有するリスクがあるかどうかを判定するシステムであって、複数の核
酸分子を含む前記セルフリー核酸試料を得る工程、前記複数の核酸分子またはその誘導体
を配列決定に供して、複数の配列決定リードを生成する工程、前記複数の配列決定リード
をコンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、
(ii)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、
および前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するため
に、少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さ
プロファイルを使用する工程を含むプロセスを実施するように個別にまたは集合的にプロ
グラムされた1つまたは複数のコンピュータプロセッサを含む、システムを提供する。
【0022】
本発明の好ましい実施形態のこれらおよび他の特徴は、添付の図面を参照する以下の詳
細な説明においてより明らかになるであろう。
【図面の簡単な説明】
【0023】
図1】CAPP-SeqによるctDNAの検出のためのPBLフィルタリングの利用。A)一致した患者の血漿および/またはPBLにおいて同定された候補のSNVの変異対立遺伝子画分。ピアソンの相関を、一致した患者の血漿およびPBLの両方に厳密に見出されるSNVに対して行った。患者の血漿にのみ見られる候補SNVを破線の赤い箱の内部に示す。B)一致した患者の血漿およびPBLの両方において同定された候補SNVの発症。上段のヒストグラムは、患者ごとのSNVの数を示し、右側のヒストグラムは、特定の遺伝子が変異している患者の数を示す。C)PBL関連SNVの除去前後のHNSCC患者のcfDNA(赤色円)およびPBL(青色円)にわたる候補SNVの平均MAF。PBLフィルタリング後に存在しないSNVを有する患者は、ctDNAの偽陽性検出を示す。E)20/32のHNSCC患者において同定された選択されたPBLフィルタリングされたSNVの発症。上のヒストグラムおよび右のヒストグラムは、(B)で前述したようなヒストグラムを示す。F)すべてのHNSCC患者にわたるPBL濾過されたSNVの平均変異対立遺伝子のパーセンテージ。患者ごとの各SNVについて、変異対立遺伝子のパーセンテージを、SNV塩基対の位置と重複するネイティブ配列を含むリードと比較して、目的のSNVを含むリードの画分によって計算した。
図2】CAPP-SeqによるctDNAの検出のためのPBLフィルタリングの利用。B)一致した患者の血漿および/またはPBLにおいて同定された候補のSNVの変異対立遺伝子画分。ピアソンの相関を、一致した患者の血漿およびPBLの両方に厳密に見出されるSNVに対して行った。患者の血漿にのみ見られる候補SNVを破線の赤い箱の内部に示す。C)一致した患者の血漿およびPBLの両方において同定された候補SNVの発症。上段のヒストグラムは、患者ごとのSNVの数を示し、右側のヒストグラムは、特定の遺伝子が変異している患者の数を示す。D)PBL関連SNVの除去前後のHNSCC患者のcfDNA(赤色円)およびPBL(青色円)にわたる候補SNVの平均MAF。PBLフィルタリング後に存在しないSNVを有する患者は、ctDNAの偽陽性検出を示す。E)20/32のHNSCC患者において同定された選択されたPBLフィルタリングされたSNVの発症。上のヒストグラムおよび右のヒストグラムは、(B)で前述したようなヒストグラムを示す。F)すべてのHNSCC患者にわたるPBL濾過されたSNVの平均変異対立遺伝子のパーセンテージ。患者ごとの各SNVについて、変異対立遺伝子のパーセンテージを、SNV塩基対の位置と重複するネイティブ配列を含むリードと比較して、目的のSNVを含むリードの画分によって、計算した。
図3】cfMeDIP-seqによるctDNAの検出のための情報領域の同定。B)FaDuゲノムDNA(gDNA)[1×1×52の比較]、一致しないPBLのgDNA[1×51×52の比較]、および一致するPBLのgDNA[1×1×52の比較]MeDIP-seqプロファイルに対する、患者および健常なドナー由来の8以上のCpGとの300bpの非重複ウィンドウのピアソンの相関(n=52)。C)健常なドナー(右)およびHNSCC(左)のPBL MeDIP-seqプロファイルにおけるインシリコのPBL枯渇のパフォーマンス。絶対的なメチル化スコアを、MeDIP-seqカウントからMeDEStrand(方法)によって計算した。PBL枯渇前の300bpの非重複ウィンドウ(青色)は、8以上のCpGを有する1番染色体から22番染色体までのすべてのウィンドウに対応する(n=702,488)。PBL枯渇後の300bpの非重複ウィンドウ(赤色)は、健常なドナーのPBLにわたる絶対的なメチル化の中央値が<0.1である追加のフィルターを含む(n=99,997)。D)HNSCCおよび健常なドナーのcfMeDIP-seqプロファイルの差次的メチル化分析によるctDNA検出のワークフロー。HNSCC関連cfDNAメチル化を同定するために、CAPP-Seq(すなわち、CAPP-Seq陽性、n=20)による検出可能なSNVを有するHNSCC患者からのcfMeDIP-seqプロファイルを、PBL枯渇ウィンドウ内で健常なドナー(n=20)と比較した。過剰メチル化領域および低メチル化領域は、FDR<10%で健常なドナーと比較して、HNSCCコホートにおいてメチル化がより高いまたはより低い領域として示される。E)CpG部位によって注釈付けされた過剰メチル化領域の順列分析(n=10,000の全順列)。有意な濃縮/枯渇は、0.05未満のp値により観察されたzスコアとして示される。F、TCGA由来の腫瘍特異的メチル化シトシン内の過剰メチル化領域の順列分析(n=合計1000の順列)。有意な濃縮/枯渇は、0.05未満のp値により観察されたzスコアとして示される。
図4】CAPP-SeqプロファイルとcfMeDIP-seqプロファイルとの間のctDNA検出および存在量の一致。A)CAPP-seqによるHNSCC患者にわたる検出されたSNVの断片の長さの中央値。各患者について、各SNVおよび一致する参照対立遺伝子の断片の長さの中央値を測定した。各変異または一致した参照対立遺伝子についての断片の長さの中央値の分布を患者ごとに示す。箱および中心線の端部は、それぞれ上側および下側の四分位および中央値を定義する。単一のSNVを有する場合、色付きの線は、それぞれSNVまたは一致した参照対立遺伝子を含む断片の長さの中央値を示す。B)cfMeDIP-seqによるHNSCC過剰メチル化領域内の断片の長さの分布。健常なドナー由来の断片の長さを分析前にプールし、その後の各箱は個々のHNSCCのcfMeDIP-seqプロファイルを示す。箱および中心線の端部は、それぞれ上側および下側の四分位および中央値を定義する。個々のHNSCC試料は、過剰メチル化領域内のメチル化(RPKM)の平均の増加に基づいて並べられる。破線の青色線は、すべての健常なドナーにわたる断片の長さの中央値を定義する。C)100~220bpの断片による過剰DMR領域の濃縮と比較した、100~150bpの断片による過剰DMR領域の濃縮の比。比率は、解釈を容易にするために増加/減少パーセントに変換した。D)100~220bpの断片による過剰DMR領域の濃縮と比較した、100~150bpの断片による過剰DMR領域の濃縮の比。+の符号は、CAPP-Seqによって検出可能なctDNAを有するHNSCC患者を示す(CAPP-Seq陽性)。E)HNSCCの過剰メチル化領域にわたる対数変換されたRPKMの値による、100bp~150bpに限定されたcfMeDIP-seqプロファイルの教師あり階層的分類。各cfMeDIP-seqプロファイルのRPKMの値を、ユークリッド変換の前にlog2変換し、Wardの方法を使用してクラスター化した。メチル化クラスターは、k=4の閾値で定義された。F)それぞれCAPP-seqおよびcfMeDIP-seq(100~150bpに限定)による、同定されたSNVおよび過剰メチル化領域からの変異対立遺伝子頻度の平均およびRPKMの平均の関係。点は、HNSCCまたは健常なドナーの血漿由来の個々の試料を示す。実線の赤色線および影付きの灰色領域は、それぞれフィッティングされた線形回帰モデルおよび関連する95%信頼区間を示す。G)HNSCCを健常なドナーのcfMeDIP-seqプロファイルと比較する、HNSCCの過剰メチル化領域内のメチル化の値(100~150bpに限定)に基づくAUROC分析。ctDNAの検出は、メチル化の平均が健常なドナーにわたる最大値を超えた場合と定義した。H)メチル化クラスター4と比較した、メチル化クラスター1+2+3内の患者の全生存のカプラン・マイヤー曲線分析。I+J)CAPP-SeqおよびcfMeDIP-seqプロファイルからの断片の長さの中央値(I)と、CAPP-Seqからの断片の長さの中央値と、cfMeDIP-seqプロファイルからの100~150:151~220bpの比(J)との比較。点は、メチル化クラスター1および2内部の個々のHNSCC試料を定義した。実線の赤色線および網掛けの灰色領域は、それぞれフィッティングされた線形回帰モデルおよび95%信頼区間を示す。
図5】cfMeDIP-seqによって検出されるctDNA内の特定のメチル化領域の予後の有用性。A)それぞれCAPP-seqおよびcfMeDIP-seq(100~150bpに限定)による、同定された変異および過剰メチル化領域からの変異対立遺伝子画分の平均およびRPKMの平均の関係。点は、HNSCCまたは健常対照血漿からの個々の試料を示す。実線の赤線:フィッティングされた線形回帰モデル。灰色の境界:95%信頼区間。B)CAPP-SeqおよびcfMeDIP-seqの両方による検出可能なctDNAを有する患者の全生存を示すカプラン・マイヤー解析(過剰DMR内での健常対照を上回るメチル化の平均)C)TCGAによって提示されるHNSCC原発腫瘍にわたる多変量コックス比例ハザード回帰分析による疾患特異的生存に基づく予後領域の同定(n=520)。領域は、前述のように300bpウィンドウとして定義した。ヒトメチル化の450KのデータをTCGAから得て、各領域と重複するプローブIDからのβ値を平均した。予後解析のための候補領域を、固形の隣接する正常組織(n=50)と比較した原発腫瘍(n=520)にわたるメチル化の上昇に基づいて選択した(ウィルコクソン検定、調整されたp値<0.05、log2FC>1)。G~H)特定の300bp領域(箱)のメチル化から特定の転写産物のRNA発現までのスピアマンの相関。絶対的なR値が0.3以上の領域(灰色の破線で示す)を有意な関連性としてラベル付けした。TCGAによって提示されるHNSCC患者の疾患特異的生存についての予後予測であったメチル化領域(n=520)は、赤い輪郭で示されている。RNA発現にさらに関連した予後領域を実線の赤色で示す。RNA発現に関連する予後メチル化領域の例;(G)OSR1、(H)LINC01391を備える。E)それぞれZNF323/ZSCAN1、LINC01391、GATA-AS1、OSR1、およびSTK3/MST2の発現に影響を及ぼす5つの領域にわたる全メチル化に基づくHNSCC-TCGA患者の全生存期間のカプラン・マイヤー曲線。すべての原発腫瘍にわたって(D)で以前に同定された5つの領域の全メチル化の中央値より下(Blw med.青)または上(Abv med.赤)のいずれかであることに基づいて、患者を層別化した。F)CAPP-Seqによる検出可能なctDNAを有するHNSCC血漿コホートについての(E)に記載されるような全生存のカプラン・マイヤー曲線。予後との関連性を有する5つの遺伝子にわたる総メチル化を計算するために、RPKMの値を、生存分析の前に先行して同定されたすべての過剰DMR領域にわたって適宜スケーリングした。
図6】長期モニタリングのためのcfMeDIP-seqによるctDNA検出の臨床的有用性。A)ctDNA動態は、典型的には、治療全体を通して患者にわたって観察される。完全なクリアランスを、診断時の検出されたctDNAから、最初に利用可能な治療中/治療後の時点での検出閾値(すなわち、0.2%)未満のctDNA存在量の減少への変化と定義した。部分クリアランスは、診断時の検出されたctDNAから、最初に利用可能な治療中/治療後の時点で検出閾値を超えるctDNA存在量の減少(90%以上)への変化と定義した。クリアランスなしは、診断時と比較した、治療中/治療後試料におけるctDNA存在量の増加と定義した。lastFU=最後のフォローアップ時の試料採取、RT=放射線療法。B)診断時のctDNA存在量の、HNSCC患者にわたる最初に利用可能な治療中/治療後の時点までの変化(n=30)。赤い線はクリアランスなしの動態を示した患者、灰色の線はクリアランス/部分クリアランスの動態を有する患者を表示する。C、無再発生存のカプラン・マイヤー曲線。クリアランスの動態(すなわち、クリアランスなし対クリアランス/部分クリアランス)に基づいて患者を層別化した。
図7】すべてのまたはctDNAが濃縮された断片に対して行われたcfMeDIP-seq分析の比較。ctDNA濃縮断片は、長さが100~150bpの範囲の断片として定義される。A)すべての断片(左)またはctDNA濃縮断片(右)を含むcfMeDIP-seqプロファイルにおける以前に同定されたHNSCCの過剰DMRのCAPP-Seq対RPKMの平均値によって同定された変異の変異対立遺伝子頻度。B)健常なドナーに対するHNSCCのcfMeDIP-seqプロファイル(CAPP-Seq陽性のみ:赤色、CAPP-Seq陽性および陰性:青色)におけるctDNA検出についての曲線下面積分析(AUROC)。CAPP-Seq陽性患者を用いた交差検証分析の結果も示す(反復=50)。すべての断片(左)またはctDNA濃縮断片(右)を用いたcfMeDIP-seqプロファイルについて分析を示す。C)すべての断片(左)またはctDNA濃縮断片を用いた縦断的cfMeDIP-seqプロファイリングに基づく無再発生存のカプラン・マイヤー分析。患者は、以前に同定された0.2%を超える過剰DMR内のメチル化存在量を実証した場合、治療後のctDNAについて陽性であると分類された。
図8】本明細書で提供される方法を実施するようにプログラムさもなければ構成することができるコンピュータシステムを示す。
図9】HNSCCおよび健常なドナーから単離されたセルフリーDNAの試料の特性。A)血液単離の時点を定義する概略図。B)HNSCC患者ならびに健常なドナー(すなわち、「正常」)についての諸時点にわたる(血漿1mLあたりに対して正規化された)cfDNA収量。
図10】CAPP-SeqセレクタによってカバーされるHNSCC患者ごとのSNVの数の分析であって、HNSCのTCGAコホートにおける364名すべての患者の中で評価されるか(青色の菱形)、または一個抜き交差検証(LOOCV;赤い四角)を使用して評価される分析。
図11】20/32のHNSCC患者において同定されたすべてのPBLフィルタリングされたSNVの発症(図2Eに関連)。
図12】情報領域を同定するための関連性のある図である(図3Bおよび図3Cに関連)。A)n個以上のCpGに基づくゲノムワイド(染色体1~22)300bpの重複しないビンのRPKMの中央値。B)図2Bおよび方法に記載されるようなPBL枯渇ウィンドウ内のHNSCCと健常なドナーのPBLとの間における差次的メチル化分析。低メチル化領域(すなわち、健常なドナーのPBLにおいてメチル化が上昇している領域)を青色で示す。
図13】PBL枯渇ウィンドウ内のHNSCCと健常なドナーのcfDNA試料との間の差次的メチル化分析の結果に関連する図(図2D)。A)DMRは、初期分析に使用した元の300bpの非重複ウィンドウに基づいて定義した。互いに直接隣接するDMRをそれぞれの幅(すなわち、2つの300bpウィンドウは、それぞれ独立して、600bpの長さを有すると定義される)にビニングした。B)低メチル化領域に基づく、図2Eに定義されるCpG特徴の順列分析。
図14】がん特異的な差次的メチル化シトシンの同定に基づくTCGA原発腫瘍の教師あり階層的クラスター化。Cancer_type(列)は、各原発腫瘍またはPBL試料の分類を指し、cancer_DMCs(行)は、各がんタイプについて同定されたがん特異的な差次的メチル化シトシン(PBLは除外される)を指す。
図15図4と関連性のある図である。A)平均変異対立遺伝子画分と比較した、患者ごとのCAPP-Seqによる同定されたSNVSの断片の長さの中央値。B)過剰DMRのRPKMの平均と比較した、患者ごとのcfMeDIP-seqによる過剰DMRS内の断片の長さの中央値。
図16】CAPP-SeqおよびcfMeDIP-seq一致分析の関連性のある図である(図4E)。A)CAPP-Seq陽性HNSCCのcfDNA試料と健常なドナーとの間の差次的メチル化領域呼び出しの交差検証分析(n=50)から得られた曲線下面積の値。B)CAPP-SeqによるctDNAの検出に基づくHNSCC患者の全生存のカプラン-ミール分析。C)およびD)メチル化クラスターに基づいて層別化されたHNSCC患者の試料のRPKMの平均および変異対立遺伝子画分の平均(図4D)。
図17】潜在的な臨床的有用性の領域の同定(図6に関連)。A)TCGA内のHNSCC原発腫瘍ならびに本発明者らのHNSCCコホートからの血漿由来過剰DMRと重複する市販の液体生検試験で現在使用されている遺伝子のゲノムトラック。矢印を有する下の濃い青色のバーは、特定の遺伝子の転写の方向を示す。赤色のバーは、本発明者らのHNSCCコホートの血漿由来の過剰DMRならびにTCGA由来の原発性腫瘍と重複する300bpのウィンドウの位置を示す。B~D)特定の300bp領域(箱)のメチル化から特定の転写産物のRNA発現までのスピアマンの相関。絶対的なR値が0.3以上の領域(灰色の破線で示す)を有意な関連性としてラベル付けした。TCGAによって提示されるHNSCC患者の疾患特異的生存についての予後予測であったメチル化領域(n=520)は、赤い輪郭で示されている。RNA発現にさらに関連した予後領域を実線の赤色で示す。RNA発現に関連する、予後メチル化領域を含む5つすべての遺伝子について図を作成した。(B)GATA2-AS1、(C)ZNF323、(D)、STK3。
図18】すべてのHNSCC患者についての治療全体にわたる、cfMeDIP-seqによるctDNA存在量の変化を示す、図6Aの拡大図である(n=32)。
【発明を実施するための形態】
【0024】
以下の説明では、本発明の完全な理解をもたらすために、多数の具体的な詳細が記載さ
れる。しかし、本発明は、これらの具体的な詳細がなくとも実施され得ることが理解され
る。
【0025】
本開示は、高感度および/または高い特異度で、対象ががんを有する可能性を判定する
際のctDNAのマルチモーダル分析のための方法、システムおよびキットを提供する。
さらに、本開示は、がんの治療後の微小残存病変(MRD)を検出し、そのようながんの
治療が治療上有効であるかどうかを評価するための方法、システムおよびキットを提供す
る。
【0026】
治療前にctDNAから特定の分子的特徴を同定することは、予後について知らせるこ
とができ、および/または治療に対する予測応答であり得るが、治療後のctDNAの検
出は、MRDの同定を促し、再発および/または死亡のリスクが高い患者の同定を補助し
得る。安定した感度を成し遂げるために、ほとんどの臨床研究は、少数の領域を調べるc
tDNA検出方法、一致した腫瘍プロファイリング、および/または高いctDNA存在
量の事例を利用している。しかし、低レベルのctDNAを有するか、または患者全体で
共通する/既知の異常を欠くがんについては、似た程度の感受性を達成するために、追加
の戦略を利用し得る。ゲノムワイドなプロファイリング技術は、極めて多くの領域を網羅
することにより、感度を改善するのに役立ち得る。しかし、1%未満の断片の検出を達成
するために必要なセルフリーDNAの量および配列決定深度は、法外なコストを要してき
た。
【0027】
高感度のctDNA検出が可能な2つの個別化ゲノムワイドプロファイリング技術が記
載されている。1つ目のCAncer Personalized Profiling
by deep Sequencing(CAPP-Seq)は、100を超える遺伝
子を標的とする広範なハイブリッド捕捉プローブを利用して、対立遺伝子の低頻度変異を
同定する。第2の、cell-free Methylated DNA Immuno
Precipitation sequencing(cfMeDIP-seq)は、抗
5-メチルシトシン(抗5mC)抗体を使用することによって、メチル化cfDNA断片
を濃縮する。これらのそれぞれの方法による変異または高メチル化事象の同定は、それぞ
れの利点を有する。適切なエラー抑制ツールが使用され、クローン造血からの変異のいず
れかの寄与が考慮されるならば、変異は、それらの不可逆的な性質のためにctDNAを
セルフリーDNAの健常な源と区別することができる。DNA高メチル化事象は、潜在的
に、がんにおけるより多い数の再発性ゲノム領域に影響を及ぼし、セルフリーDNA分析
によって腫瘍の起源を知らせるそれらの能力に寄与する。さらに、がんドライバ遺伝子の
近傍での高メチル化事象は、それらの発現に影響を及ぼし、それによって潜在的にがんの
挙動を反映し、予後の値を提示し得る。現在までのところ、変異に基づく方法とメチル化
に基づく方法との両方の組み合わせを、限局性のがんにおけるctDNAの腫瘍ナイーブ
での検出および特性評価の改善に利用した研究はない。
【0028】
予後の判定、リスク層別化、および疾患の監視のための流体ベースのバイオマーカーの
利用は、侵襲的腫瘍サンプリングを必要とせずに治療の決定を導くことによって、患者の
転帰を改善し得る。循環腫瘍(ct)DNAは、特に液体生検ツールとして有望であるこ
とが示されているが、限局性非転移性がんを有する患者などの疾患の負荷が低い患者では
、対の腫瘍プロファイリングが頻繁に必要とされる。本発明者らは、血漿のセルフリーD
NA由来の遺伝的およびエピジェネティックな特徴のマルチモーダル解析が、腫瘍ナイー
ブctDNAプロファイリングの広範な適用を可能にし得ると仮定した。変異およびメチ
ル化に基づくプロファイリングにより、限局性頭頸部がん患者の65%において、ctD
NAが同定された。両方のアプローチからの結果は定量的であり、強く相関しており、そ
れらを組み合わせた分析により、腫瘍由来DNA断片の共通の特徴が明らかになった。さ
らに、ctDNAメチルームは、腫瘍組織学、推定予後バイオマーカー、および治療の応
答の動的なパターンを明らかにした。これらの知見は、将来の非侵襲的バイオマーカー発
見の取り組みを助け、限局性のがんに対するctDNAの臨床的実施について知らせる。
【0029】
セルフリーメチル化DNAを捕捉する特定の方法は、本出願人の国際公開第2017/
190215号パンフレットおよび国際公開第2019/010564号パンフレットに
記載されており、両方とも参照により組み込まれる。
【0030】
具体的には、本発明者らは、CAPP-SeqおよびcfMeDIP-seqの両方を
利用して、限局性頭頸部扁平上皮癌(HNSCC)患者のコホート内で、腫瘍ナイーブc
tDNA検出を行う。HNSCCは、根治的治療後に頻繁に再発する臨床的に不均一な疾
患であり、治療の決定および疾患の管理をより良く知らせるために、ctDNA検出から
大きく利益を得ることができる33。本発明者らは、両方の方法を並行して利用すること
、ならびに一致したPBLプロファイリングが、高信頼性の腫瘍ナイーブctDNA検出
を達成し得ることを実証する。さらに、本発明者らは、組み合わせせた分析が腫瘍由来の
DNA断片の共通する分子的な特徴を明らかにすることを示す。最後に、本発明者らは、
ctDNAメチルームが腫瘍組織学、推定予後バイオマーカー、および治療反応の動的な
パターンを明らかにし、他の疾患の状況での将来のバイオマーカー研究のための青写真を
授けることを示す。
【0031】
態様において、対象のがん細胞からctDNAが存在することを検出する方法であって

(a)対象からセルフリーDNAの試料を得る工程、
(b)試料をライブラリ調製に供して、セルフリーメチル化DNAのその後の配列決定
を可能にする工程、
(c)第1の量のフィラーDNAが試料に添加されていてもよく、フィラーDNAの少
なくとも一部がメチル化され、次いで、さらに、試料を変性されていてもよい工程、
(d)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNA
を捕捉する工程、
(e)捕捉されたセルフリーメチル化DNAを配列決定する工程、
(f)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用い
て、捕捉されたセルフリーメチル化DNAの配列を比較する工程、
(g)捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来のセル
フリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来のD
NAの存在を同定する工程
を含み、捕捉する工程、比較する工程または同定する工程の少なくとも1つにおいて、
対象のセルフリーメチル化DNAは、断片の長さのメトリックに従って亜集団に限定され
る、方法が提供される。
【0032】
ポリメラーゼ連鎖反応(PCR)やそれに続くサンガーシーケンシングなどの様々なシ
ーケンシング技術が当業者に公知である。また、ハイスループット配列決定としても知ら
れる次世代配列決定(NGS)技術も利用可能であり、これには様々な配列決定技術が含
まれる、Illumina(Solexa)配列決定、Roche 454配列決定、I
on torrent:Proton/PGM配列決定、SOLiD配列決定、ロングリ
ードシーケンシング(Oxford NanoporeおよびPactbio)が含まれ
る。NGSは、以前に使用されていたサンガー配列決定よりもはるかに迅速かつ安価にD
NAおよびRNAの配列決定を可能にする。いくつかの実施形態では、前記配列決定は、
ショートリードシーケンシングのために最適化される。
【0033】
本明細書で使用される場合、「対象」という用語は、動物界の任意のメンバーを指す。
したがって、方法および本明細書に記載されるのは、ヒトおよび獣医学疾患ならびに動物
モデルの両方に適用可能である。好ましい対象は、「患者」、すなわち、疾患または状態
のために治療または医療が必要であるかどうかを判定するために調査されている、または
疾患もしくは状態(例えば、がん)のための医療を受けている、生きているヒトである。
【0034】
本明細書で使用される場合、「ゲノム」という用語は、一般に、例えば、対象の遺伝情
報の少なくとも一部または全体であり得る、対象由来のゲノム情報を指す。ゲノムは、D
NAまたはRNAのいずれかにコードされ得る。ゲノムは、コード領域(例えば、タンパ
ク質をコードする)ならびに非コード領域を含み得る。ゲノムは、生物においてすべての
染色体の配列を一緒に含むことができる。例えば、ヒトゲノムは、通常、合計46本の染
色体を有する。これらのすべての配列が一緒になってヒトゲノムを構成し得る。
【0035】
本明細書で使用される場合、「核酸」という用語は、2つ以上のヌクレオチド、すなわ
ちデオキシリボヌクレオチド(dNTP)もしくはリボヌクレオチド(rNTP)のいず
れか、またはそれらの類似体の任意の長さのヌクレオチドのポリマー形態を含むポリヌク
レオチドを指す。核酸の非限定的な例としては、デオキシリボ核酸(DNA)、リボ核酸
(RNA)、遺伝子または遺伝子断片のコード領域または非コード領域、連鎖解析から定
義される遺伝子座、エクソン、イントロン、メッセンジャーRNA(mRNA)、トラン
スファーRNA、リボソームRNA、短鎖干渉RNA(siRNA)、短鎖ヘアピンRN
A(shRNA)、マイクロRNA(miRNA)、リボザイム、cDNA、組換え核酸
、分枝核酸、プラスミド、ベクター、任意の配列の単離されたDNA、任意の配列の単離
されたRNA、核酸プローブおよびプライマーが挙げられる。核酸は、メチル化ヌクレオ
チドおよびヌクレオチド類似体などの1つまたは複数の修飾ヌクレオチドを含み得る。存
在する場合、ヌクレオチド構造に対する修飾は、核酸の構築の前または後に行われ得る。
核酸のヌクレオチドの配列は、非ヌクレオチド成分によって中断される場合がある。核酸
は、重合後に、例えばレポーター因子とのコンジュゲーションまたは結合によってさらに
修飾され得る。「変異体」核酸は、少なくとも1つのヌクレオチドがそれぞれ修飾、例え
ば欠失、挿入または置換されていることを除いて、その元の核酸と同一のヌクレオチド配
列を有するポリヌクレオチドである。変異体は、元の核酸のヌクレオチド配列に対し少な
くとも約80%、90%、95%、または99%の同一性のヌクレオチド配列を有し得る
【0036】
セルフリーメチル化DNAは、血流を自由に循環するDNAであり、DNAの様々な領
域でメチル化されている。試料、例えば血漿試料を採取して、セルフリーメチル化DNA
を分析し得る。諸研究が、血液の循環核酸の多くが壊死細胞またはアポトーシス細胞から
生じ、アポトーシスからの核酸のレベルの大幅な上昇が、がんなどの疾患で観察されるこ
とを明らかにしている。特に、循環DNAががん遺伝子の変異を含む疾患の特徴となる証
を有するがんの場合、マイクロサテライト変化、および特定のがんの場合、血漿のウイル
スゲノム配列、DNAまたはRNAは、疾患の潜在的なバイオマーカーとしていっそう研
究されるようになっている。例えば、全循環DNA中の低レベルの循環腫瘍DNAの定量
的アッセイは、臨床的に使用される標準的なバイオマーカーであるがん胎児性抗原と比較
して、結腸直腸がんの再発を検出するためのより良好なマーカーとして役立ち得る。循環
cfDNAは、循環腫瘍DNA(ctDNA)を含み得る。
【0037】
本明細書で使用される場合、「ライブラリ調製」は、リスト末端修復、Aテーリング、
アダプターライゲーション、またはDNAのその後の配列決定を可能にするためにセルフ
リーDNAに対して行われる任意の他の調製を含む。
【0038】
本明細書で使用される場合、「フィラーDNA」は非コードDNAであり得るか、また
はアンプリコンからなり得る。
【0039】
いくつかの実施形態では、断片の長さのメトリックは断片の長さである。いくつかの好
ましい実施形態では、対象のセルフリーメチル化DNAは、<170bp、<165bp
、<160bp、<155bp、<150bp、<145bp、<140bp、<135
bp、<130bp、<125bp、<120bp、<115bp、<110bp、<1
05bp、または<100bpの長さを有する断片に限定される。他の好ましい実施形態
では、対象のセルフリーメチル化DNAは、約100~約150bp、110~140b
pまたは120~130bpの長さを有する断片に限定される。
【0040】
いくつかの実施形態では、断片の長さのメトリックは、対象のセルフリーメチル化DN
Aの断片の長さの分布である。いくつかの好ましい実施形態では、対象のセルフリーメチ
ル化DNAは、長さに基づいて下位50、45、40、35、30、25、20、15ま
たは10パーセンタイル内の断片に限定される。
【0041】
いくつかの実施形態では、対象のセルフリーメチル化DNAは、差次的メチル化領域(
DMR)の断片にさらに限定される。
【0042】
いくつかの実施形態では、対象のセルフリーメチル化DNAの制限は、捕捉工程の間で
ある。
【0043】
いくつかの実施形態では、対象のセルフリーメチル化DNAの限定は、比較工程の間で
ある。
【0044】
いくつかの実施形態では、対象のセルフリーメチル化DNAの制限は、同定工程の間で
ある。
【0045】
いくつかの実施形態では、比較工程は、統計的分類器を使用した適合に基づく。DNA
メチル化データを使用する統計的分類器は、試料をがんのタイプまたはサブタイプなどの
特定の疾患状態に割り当てるために使用され得る。がんのタイプまたはサブタイプの分類
という目的のために、分類器は、統計的モデル内の1つまたは複数のDNAメチル化変数
(すなわち、特徴)からなり、統計的モデルの出力は、異なる疾患状態を区別するための
1つまたは複数の閾値を有する。統計的分類器で使用される特定の(1つまたは複数の)
特徴および(1つまたは複数の)閾値は、がんのタイプまたはサブタイプの事前の知識か
ら、最も情報がある可能性が高い特徴の事前の知識から、機械学習から、またはこれらの
アプローチの2つ以上の組み合わせから導出され得る。
【0046】
いくつかの実施形態では、分類器は機械学習によって導出される。好ましくは、分類器
は、弾性ネット分類器、ラッソ、サポートベクターマシン、ランダムフォレスト、または
ニューラルネットワークである。
【0047】
分析されるゲノム空間は、ゲノムワイドであり得るか、または好ましくは調節領域(す
なわち、FANTOM5エンハンサー、CpGアイランド、CpGショア、およびCpG
Shelf)に限定され得る。
【0048】
好ましくは、回収されたスパイクインメチル化DNAのパーセンテージは、プルダウン
効率変動を制御するための共変量として含まれる。
【0049】
複数のがんのタイプ(またはサブタイプ)を互いに区別することができる分類器の場合
、分類器は、好ましくは、目的の各タイプ(またはサブタイプ)の対の比較に由来する差
次的メチル化領域からなる。
【0050】
いくつかの実施形態では、健常な個体およびがんの個体由来の対照のセルフリーメチル
化DNA配列は、健常な個体とがんの個体との間の差次的メチル化領域(DMR)のデー
タベースに含まれる。
【0051】
いくつかの実施形態では、健常な個体およびがんの個体由来の対照のセルフリーメチル
化DNA配列は、血清、脳脊髄液、尿便、痰、胸水、腹水、涙、汗、パップスメア液、内
視鏡ブラシリング液など、好ましくは血漿由来の体液から得たセルフリーDNAに由来す
るDNAにおいて、健常な個体とがんの個体との間として、差次的にメチル化される対照
セルフリーメチル化DNA配列に限定される。
【0052】
試料
試料は、対象から単離された任意の生物学的試料であり得る。例えば、試料は、限定さ
れないが、体液、全血、血小板、血清、血漿、便、赤血球、白血球、内皮細胞、組織生検
物、滑液、リンパ液、腹水液、間質液または細胞外液、細胞間の空間の流体、例えば歯肉
縁液、骨髄、脳脊髄液、唾液、粘液、痰、精液、汗、尿、鼻ブラッシングからの液、ペッ
プスミアからの液、または任意の他の体液を含み得る。体液は、唾液、血液、または血清
を含み得る。試料はまた、腫瘍試料であり得、これは、静脈穿刺、排泄、射精、マッサー
ジ、生検、針吸引、洗浄、掻き取り、外科的切開、または介入もしくは他のアプローチを
含むがこれらに限定されない様々なアプローチによって、対象から得ることができる。試
料はセルフリー試料(例えば、細胞を実質的に含まない)であり得る。DNA試料は、例
えば、十分な熱を使用して変性させることができる。
【0053】
いくつかの実施形態では、本開示は、1つ以上の生物学的試料を含むかまたは使用する
システム、方法、またはキットを提供する。本明細書で使用される1つ以上の試料は、核
酸を含有するかまたは含有すると推定される任意の物質を含み得る。試料は、対象から得
られた生物学的試料を含み得る。いくつかの実施形態では、生物学的試料は液体試料であ
る。
【0054】
いくつかの実施形態では、試料は、約100ng、90ng、80ng、75ng、7
0ng、60ng、50ng、40ng、30ng、20ng、10ng、5ng、1n
g未満、またはセルフリー核酸分子の数の間の任意の量を含む。さらに、いくつかの実施
形態では、試料は、約1pg未満、約5pg未満、約10pg未満、約20pg未満、約
30pg未満、約40pg未満、約50pg未満、約100pg未満、約200pg未満
、約500pg未満、約1ng未満、約5ng未満、約10ng未満、約20ng未満、
約30ng未満、約40ng未満、約50ng未満、約100ng未満、約200ng未
満、約500ng未満、約1000ng未満、またはセルフリー核酸分子の数の間の任意
の量を含む。
【0055】
いくつかの実施形態では、本開示は、試料にある量のフィラーDNAを充填して混合物
試料を生成するための方法およびシステムを含み、混合物試料は、少なくとも約50ng
、55ng、60ng、65ng、70ng、75ng、80ng、85ng、90ng
、95ng、100ng、120ng、140ng、160ng、180ng、200n
g、または核酸混合物の総量の数の間にある任意の量を含む。いくつかの実施形態では、
フィラーDNAは、少なくとも約5%、10%、15%、20%、30%、40%、50
%、60%、70%、80%、90%、または100%のメチル化フィラーDNAを含み
、残りは非メチル化フィラーDNAであり、好ましくは5%~50%、10%~40%、
または15%~30%のメチル化フィラーDNAである。いくつかの実施形態では、混合
物試料は、20ng~100ng、好ましくは30ng~100ng、より好ましくは5
0ng~100ngの量のフィラーDNAを含む。いくつかの実施形態では、試料から得
たセルフリーDNAおよび第1の量のフィラーDNAは、合わせて少なくとも50ngの
総DNA、好ましくは少なくとも100ngの総DNAを含む。
【0056】
いくつかの実施形態では、フィラーDNAは、50bp~800bpの長さ、好ましく
は100bp~600bpの長さ、より好ましくは200bp~600bpの長さである
。いくつかの実施形態では、フィラーDNAは二本鎖である。フィラーDNAは二本鎖で
ある。例えば、フィラーDNAはジャンクDNAであり得る。また、フィラーDNAは、
内因性または外因性のDNAであってもよい。例えば、フィラーDNAは非ヒトDNAで
あり、好ましい実施形態ではλDNAである。本明細書で使用される場合、「λDNA」
は、腸内細菌ファージλDNAを指す。いくつかの実施形態では、フィラーDNAは、ヒ
トDNAと整合していない。
【0057】
いくつかの実施形態では、試料は、疾患または障害を有する対象の治療の前および/ま
たは後に採取され得る。試料は、治療または治療レジメンの最中に対象から得ることがで
きる。治療の効果を経時的にモニターするために、対象から複数の試料を得ることができ
る。試料は、臨床試験によって確定的な陽性または陰性の診断が得られない疾患または障
害を有することが知られているまたは疑われる対象から採取され得る。試料は、疾患また
は障害を有すると疑われる対象から採取され得る。試料は、疲労、吐き気、体重減少、痛
みおよび疼痛、衰弱または出血などの説明できない症状を経験している対象から採取され
得る。試料は、説明されている症状を有する対象から採取され得る。試料は、家族歴、年
齢、高血圧または高血圧前症、糖尿病または糖尿病前症、過体重または肥満、環境への曝
露、生活習慣リスク因子(例えば、喫煙、アルコール摂取、または薬物使用)、または他
のリスク因子の存在などの因子によって疾患または障害を発症するリスクがある対象から
採取され得る。
【0058】
いくつかの実施形態では、試料は、第1の時点で採取され、配列決定され得、次いで、
別の試料が、その後の時点で採取され、配列決定され得る。そのような方法は、例えば、
疾患の発症または進行を追跡するため長期モニタリングする目的のために使用され得る。
いくつかの実施形態では、治療の有効性を判定するために、治療前、治療後、または治療
の経過中に疾患の進行を追跡することができる。例えば、本明細書に記載の方法は、医学
的治療に応じて疾患の進行または退縮を測定するために、医学的治療の前および後に対象
に対して実施され得る。
【0059】
対象から試料を得た後、試料を処理して、対象の疾患または障害を示すデータセットを
生成することができる。例えば、がん関連ゲノム遺伝子座または微生物関連遺伝子座のパ
ネルでの試料のセルフリー核酸分子(例えば、ctDNA分子)の有無または定量的評価
は、対象のがんを示し得る。対象から得られた試料を処理することは、(i)複数のセル
フリー核酸分子を単離、濃縮または抽出するのに十分な条件に試料を供すること、および
(ii)データセット(例えば、核酸配列)を生成するために複数のセルフリー核酸分子
をアッセイすることを含み得る。いくつかの実施形態では、複数のセルフリー核酸分子が
試料から抽出され、配列決定に供されて、複数の配列決定リードが生成される。
【0060】
いくつかの実施形態では、セルフリー核酸分子は、セルフリーリボ核酸(cfRNA)
またはセルフリーデオキシリボ核酸(cfDNA)を含み得る。セルフリー核酸分子(例
えば、cfRNAまたはcfDNA)は、様々な方法によって試料から抽出され得る。セ
ルフリー核酸分子は、がん関連ゲノム遺伝子座のパネルに対応する核酸(例えば、RNA
またはDNA)分子を濃縮するように構成された複数のプローブによって濃縮され得る。
プローブは、がん関連ゲノム遺伝子座のパネルの1つ以上からの核酸配列との配列相補性
を有し得る。がん関連ゲノム遺伝子座のパネルは、少なくとも2、少なくとも3、少なく
とも4、少なくとも5、少なくとも6、少なくとも7、少なくとも8、少なくとも9、少
なくとも10、少なくとも11、少なくとも12、少なくとも13、少なくとも14、少
なくとも15、少なくとも16、少なくとも17、少なくとも18、少なくとも19、少
なくとも20、少なくとも約25、少なくとも約30、少なくとも約35、少なくとも約
40、少なくとも約45、少なくとも約50、少なくとも約55、少なくとも約60、少
なくとも約65、少なくとも約70、少なくとも約75、少なくとも約80、少なくとも
約85、少なくとも約90、少なくとも約95、少なくとも約100、またはそれより多
く、異なるがん関連ゲノム遺伝子座を含み得る。プローブは、1つまたは複数のゲノム遺
伝子座(例えば、がん関連ゲノム遺伝子座)の核酸配列(例えば、RNAまたはDNA)
と配列相補性を有する核酸分子(例えば、RNAまたはDNA)であり得る。これらの核
酸分子は、プライマーまたは濃縮配列であり得る。1つまたは複数のゲノム遺伝子座(例
えば、がん関連ゲノム遺伝子座または微生物関連遺伝子座)に対して選択的なプローブを
使用する試料のアッセイは、アレイハイブリダイゼーション、ポリメラーゼ連鎖反応(P
CR)または核酸配列決定(例えば、RNA配列決定またはDNA配列決定)の使用を含
み得る。
【0061】
核酸分子の配列決定
本開示は、1つまたは複数のポリヌクレオチドのヌクレオチド塩基の配列を決定するた
めの方法および技術を提供する。ポリヌクレオチドは、例えば、デオキシリボ核酸(DN
A)またはリボ核酸(RNA)などの核酸分子であり得、その変異体または誘導体(例え
ば、一本鎖DNA)を含む。配列決定は、Illumina(登録商標)、Pacifi
c Biosciences(PacBio(登録商標))、Oxford Nanop
ore(登録商標)またはLife Technologies(Ion Torren
t(登録商標))による配列決定システムなどの現在利用可能な様々なシステムによって
行うことができるが、これらに限定されない。さらに、対の末端の配列決定といった断片
の長さを示す任意の配列決定方法を利用することができる。これに代えて、またはこれに
加えて、配列決定は、核酸増幅、ポリメラーゼ連鎖反応(PCR)(例えば、デジタルP
CR、定量的PCR、またはリアルタイムPCR)、または等温増幅を用いて行われ得る
。そのようなシステムは、対象により与えられた試料からシステムによって生成されるよ
うに、対象の遺伝情報(例えば、ヒト)に対応する複数の生の遺伝データを提供すること
ができる。いくつかの例において、そのようなシステムは、配列決定リード(本明細書で
は「リード」とも)を提供する。リードは、配列決定された核酸分子の配列に対応する一
連の核酸塩基を含み得る。いくつかの状況では、本明細書で提供されるシステムおよび方
法は、プロテオームの情報と共に使用され得る。
【0062】
いくつかの実施形態では、配列決定リードは、次世代配列決定法または次・次世代配列
決定法によって得られる。いくつかの実施形態では、配列決定法は、がんの循環DNA(
ctDNA)を定量化するために使用される次世代配列決定ベースの方法である、CAn
cer Personalized Profiling by deep Seque
ncing(CAPP-Seq)を含む。この方法は、再発性変異を有することが知られ
ている任意のがんのタイプに対して一般化され得、10,000分子の健常なDNAの変
異体DNAの一分子を検出し得る。いくつかの実施形態では、配列決定法は、その全体が
本明細書に組み込まれる、Shen et al.,sensitive tumor
detection and classification using plasm
a cell-free DNA methylomes,(2018)Natureに
よって記載されているようなcfMeDIP配列決定を含む。いくつかの実施形態では、
配列決定は亜硫酸水素塩配列決定を含む。
【0063】
いくつかの実施形態では、配列決定は、例えばバーコード、固有の分子識別子(UMI
)、または別のタグを核酸分子またはその断片にライゲーションすることによる、核酸分
子またはその断片の修飾を含む。核酸分子またはその断片の一端にバーコード、UMIま
たはタグをライゲーションすることにより、配列決定後の核酸分子またはその断片の分析
を容易にすることができる。いくつかの実施形態では、バーコードは固有のバーコード(
例えば、UMI)である。いくつかの実施形態では、バーコードは固有ではなく、バーコ
ードの配列は、標的核酸の開始配列および停止配列などの内因性配列情報に関連して使用
され得る(例えば、標的核酸はバーコードに隣接し、バーコードの配列は、標的核酸の開
始部および終了部の配列に関連して、固有にタグ付けされた分子を生成する)。バーコー
ド、UMI、またはタグは、ポリヌクレオチドまたはその断片を入力または標的核酸分子
またはその断片と関連付けるために使用される既知の配列であり得る。バーコード、UM
I、またはタグは、天然ヌクレオチドまたは非天然(例えば、修飾された)ヌクレオチド
(例えば、本明細書に記載されるようなもの)を含み得る。バーコードの配列は、バーコ
ードの配列が配列決定リード内に含まれ得るように、アダプター配列内に含まれ得る。バ
ーコードの配列は、少なくとも4、5、6、7、8、9、10、11、12、13、14
、15、16個、またはそれを超えるヌクレオチドの長さを含み得る。場合によっては、
バーコードの配列は、十分な長さであってもよく、関連するバーコードの配列に基づいて
試料の識別を可能にするために別のバーコードの配列と十分に異なっていてもよい。バー
コードの配列、またはバーコードの配列の組み合わせを使用して、「元の」核酸分子また
はその断片(例えば、対象から得た試料に存在する核酸分子またはその断片)をタグ付け
し、続いて識別することができる。いくつかの場合、バーコードの配列またはバーコード
の配列の組み合わせを内因性配列情報と併せて使用して、元の核酸分子またはその断片を
同定する。例えば、バーコードの配列、またはバーコードの配列の組み合わせを、バーコ
ード、UMI、またはタグ(例えば、内因性配列の開始および終了)に隣接する内因性配
列と共に使用することができる。
【0064】
核酸分子またはその断片を処理することは、核酸の増幅を行うことを含み得る。例えば
、任意のタイプの核酸増幅反応を使用して、標的核酸分子またはその断片を増幅し、増幅
産物を生成することができる。核酸増幅方法の非限定的な例としては、逆転写、プライマ
ー伸長、ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応、非対称増幅、ローリング
サークル増幅、および多置換増幅(MDA)が挙げられる。PCRの例としては、限定さ
れずに、定量的PCR、リアルタイムPCR、デジタルPCR、エマルジョンPCR、ホ
ットスタートPCR、マルチプレックスPCR、非対称PCR、ネステッドPCR、およ
びアセンブリPCRが挙げられる。核酸の増幅は、1つ以上のプライマー、プローブ、ポ
リメラーゼ、緩衝液、酵素、およびデオキシリボヌクレオチドなどの1つ以上の試薬を含
み得る。核酸の増幅は等温であってもよく、または熱サイクルを含んでもよい。および/
または内因性配列の長さを有する。
【0065】
メチル化プロファイル
本開示は、疾患/状態を有するかまたはそのような疾患/状態を有すると疑われる対象
のメチル化プロファイルを生成するための方法、システムおよびキットを提供し、メチル
化プロファイルは、対象が疾患/状態を有するかまたは疾患/状態を有するリスクがある
かどうかを判定するために使用され得る。cfMeDIP-seqを使用する前に、本明
細書に開示される試料をライブラリ調製に供する。手短に言えば、末端修復およびAテー
リングの後、試料を核酸アダプターにライゲートし、酵素を用いて消化する。試料の項で
上述したように、調製したライブラリをフィラー核酸(例えば、フィラーλDNA)と組
み合わせて、調製したライブラリの低い存在量のctDNAの影響を最小限に抑え、混合
試料を作製することができる。いくつかの実施形態では、疾患/状態が局所的な(非転移
性)がんである場合、ctDNAの量は少なく、容易かつ正確に測定および定量化され得
ない。混合試料を少なくとも約50ng、80ng、100ng、120ng、150n
gまたは200ngにして、さらなる濃縮に供する。
【0066】
本明細書に記載の方法、システム、およびキットは、それだけに限ることなく、副腎が
ん、肛門がん、胆管がん、膀胱がん、骨がん、脳/CNS腫瘍、乳がん、キャッスルマン
病、子宮頸がん、結腸/直腸がん、子宮内膜がん、食道がん、ユーイングファミリーの腫
瘍、眼がん、胆嚢がん、消化管カルチノイド腫瘍、消化管間質腫瘍(gist)、妊娠性
栄養膜疾患、ホジキン病、カポジ肉腫、腎臓がん、喉頭および下咽頭がん、白血病(急性
リンパ球性、急性骨髄性、慢性リンパ球性、慢性骨髄性、慢性骨髄単球性)、肝臓がん、
肺がん(非小細胞、小細胞、肺カルチノイド腫瘍)、リンパ腫、皮膚のリンパ腫、悪性中
皮腫、多発性骨髄腫、骨髄異形成症候群、鼻腔および副鼻腔がん、鼻咽頭がん、神経芽細
胞腫、非ホジキンリンパ腫、口腔および口腔咽頭がん、骨肉腫、卵巣がん、陰茎がん、下
垂体がん、前立腺がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、肉腫-成人軟部組織が
ん、皮膚がん(基底細胞および扁平上皮細胞、黒色腫、メルケル細胞)、小腸がん、胃が
ん、精巣がん、胸腺がん、甲状腺がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレ
ームマクログロブリン血症、ウィルムス腫瘍を含む様々ながんに適用できる。実施形態で
は、がんは頭頸部扁平上皮癌である。
【0067】
結合剤を使用して混合試料を濃縮することができる。いくつかの実施形態では、結合剤
は、メチル-CpG結合ドメインを含むタンパク質である。そのような例示的なタンパク
質の1つは、MBD2タンパク質である。本明細書で使用される場合、「メチル-CpG
結合ドメイン(MBD)」は、約70残基の長さであり、1つまたは複数の対称的にメチ
ル化されたCpGを含むDNAに結合するタンパク質および酵素の特定のドメインを指す
。MeCP2、MBD1、MBD2、MBD4およびBAZ2のMBDは、DNAへの結
合を媒介し、MeCP2、MBD1およびMBD2の場合、優先的にはメチル化CpGへ
の結合を媒介する。ヒトタンパク質MECP2、MBD1、MBD2、MBD3、および
MBD4は、メチル-CpG結合ドメイン(MBD)のそれぞれに存在することによって
関連する核タンパク質のファミリーを含む。これらのタンパク質の各々は、MBD3を除
いて、メチル化DNAに特異的に結合することができる。
【0068】
他の実施形態では、結合剤は抗体であり、セルフリーメチル化DNAを捕捉することは
、抗体を使用してセルフリーメチル化DNAを免疫沈降させることを含む。本明細書で使
用される場合、「免疫沈降」は、その特定の抗原に特異的に結合する抗体を使用して抗原
(ポリペプチドおよびヌクレオチドなど)を溶液から沈殿させる技術を指す。このプロセ
スは、試料から特定のタンパク質またはDNAを単離および濃縮するために使用され得、
手順のある時点で抗体が固体の基材に結合されることを必要とする。固体の基材は、例え
ばビーズ、例えば磁気ビーズを含む。他の種類のビーズおよび固体の基材を使用してもよ
い。
【0069】
1つの例示的抗体は5-MeC抗体である。免疫沈降手順のために、いくつかの実施形
態では、少なくとも0.05μgの抗体を試料に添加する。一方、より好ましい実施形態
では、少なくとも0.16μgの抗体を試料に添加する。免疫沈降反応を確認するために
、いくつかの実施形態では、本明細書に記載の方法は、第2の量の対照DNAを試料に添
加する工程をさらに含む。
【0070】
濃縮された試料をさらに増幅し、精製し、配列決定して、複数の配列リードを生成する
。複数の配列リードを分析して、複数の差次的メチル化領域(DMR)を同定する。いく
つかの実施形態では、複数のDMRは、末梢血白血球(PBL)に由来するセルフリー核
酸分子に由来するDMRを含む。いくつかの実施形態では、複数のDMRは、少なくとも
約75万個の重複しない約300bpの核酸断片ウィンドウを含む。これらの断片は、8
個以上のCpGアイランドを含む。いくつかの実施形態では、DMRは、疾患/状態を有
する患者から得られた試料から生成された配列リードを、健常な対照から得られた試料か
ら生成された配列リードと比較することによって、同定される。いくつかの実施形態では
、健常な対照は、疾患/状態を発症するための同じリスク因子のセットを含む。いくつか
の実施形態では、複数のDMRは、少なくとも約997個のDMR、HNSCCにおける
約941個の過剰メチル化およびHNSCCにおける56個の低メチル化を含む(表5)
。本明細書において同じ開示のアプローチを使用して、過剰メチル化DMRを異なるがん
(例えば、肺がん、膵臓がん、結腸直腸がん)について検出することができ、低メチル化
DMRを異なるがんについて検出することができる。
【表1】
【0071】
ゲノム変異プロファイル
本開示は、疾患/状態を有するかまたはそのような疾患/状態を有すると疑われる対象
の変異プロファイルを生成するための方法、システムおよびキットを提供し、メチル化プ
ロファイルは、対象が疾患/状態を有するかまたは疾患/状態を有するリスクがあるかど
うかを判定するために使用され得る。本明細書に開示される試料は、ライブラリ調製およ
び次世代ディープシーケンシング(例えば、CAPP-Seq)に供される。複数の配列
決定リードが生成され、分析される。いくつかの実施形態では、ディープシーケンシング
は、疾患/状態に関連するゲノム変異の同定を最大化するように構成され得る。例えば、
限定することを意図するものではないが、頭頸部扁平上皮癌(HNSCC)については、
標準的なHNSCCドライバ遺伝子のパネルをCAPP-seqのセレクタに含めること
ができる。さらに、肺がんの場合、肺がん駆動遺伝子のパネルがCAPP-seqのセレ
クタに含まれ得る。さらに、膵臓がんの場合、膵臓がん駆動遺伝子のパネルは、CAPP
-seqのためのセレクタに含まれ得る。いくつかの実施形態では、CAPP-seqの
セレクタに特定のがんのタイプにおける既知のドライバ効果のない遺伝子を含めることに
より、ctDNA検出の感度を高めることができる。
【0072】
いくつかの実施形態では、ctDNA存在量の相対的な尺度は、平均変異対立遺伝子画
分(MAF)から計算される。いくつかの実施形態では、変異の平均MAFは、対象を同
定し、その変異プロファイルに含まれるのは、少なくとも約0.01%~少なくとも約1
0%の範囲である。本明細書に開示される試料のctDNA画分は、少なくとも約0.0
1%、0.02%、0.03%、0.04%、0.05%、0.06%、0.07%、0
.08%、0.09%、0.1%、0.15%、0.2%、0.5%、1%、1.5%、
2%、2.5%、3%、3.5%、4%、4.5%、5%、5.5%、6%、6.5%、
7%、7.5%、8%、8.5%、9%、9.5%、10%、またはその間の任意の割合
である。
【0073】
いくつかの実施形態では、対象の生成された変異プロファイルは、PBLに由来するセ
ルフリー核酸分子に由来する変異の変異体を含まない。いくつかの実施形態では、変異プ
ロファイルは、ミスセンス変異体、ナンセンス変異体、欠失変異体、挿入変異体、重複変
異体、逆位変異体、フレームシフト変異体、または反復伸長変異体などの遺伝子多型を含
む。いくつかの実施形態では、変異プロファイルは、特定のサイズ範囲のセルフリー核酸
分子の画分に由来する変異の変異体を含み得る。
【0074】
断片の長さプロファイル
いくつかの実施形態では、ctDNA断片の長さは、健常な対象に由来するセルフリー
核酸分子よりも短い。いくつかの実施形態では、少なくとも1つの変異を含むctDNA
の長さは、対応する参照対立遺伝子を含むセルフリー核酸分子の長さよりも短い。いくつ
かの実施形態では、少なくとも1つのDMRを含有するctDNA断片の長さは、対応す
るゲノム領域を含有するセルフリー核酸分子の断片よりも短い。
【0075】
いくつかの実施形態では、配列決定は、ctDNA断片の分解を引き起こし、ctDN
Aの長さの分布の保存を妨げるので、亜硫酸水素塩配列を利用しない。いくつかの実施形
態では、ctDNAの断片の長さは、少なくとも60~500bp、80~300bp、
90~250bp、80~170bp、または100~150bpである。いくつかの実
施形態では、本開示は、特定のサイズのセルフリー分子の選択に基づいて、セルフリー核
酸試料の濃縮をもたらす。いくつかの実施形態では、マルチモーダル解析は、複数の核酸
分子をそれらの断片の長さに基づいて変異プロファイルに選択的に含めることによって、
本明細書に記載の変異プロファイルおよび断片の長さプロファイルを利用することを含む
。いくつかの実施形態では、マルチモーダル解析は、複数の核酸分子をそれらの断片の長
さに基づいてメチル化プロファイルに選択的に含めることによって、本明細書に記載のメ
チル化プロファイルおよび断片の長さプロファイルを利用することを含む。いくつかの実
施形態では、マルチモーダル解析は、複数の核酸分子をそれらの断片の長さに基づいて変
異プロファイルに選択的に含めることによって、および複数の核酸分子をそれらの断片の
長さにそれぞれ基づいてメチル化プロファイルに選択的に含めることによって、変異プロ
ファイル、メチル化プロファイル、および断片の長さプロファイルを一緒に利用すること
を含む。
【0076】
がんを検出し、腫瘍の起源の組織を決定し、予後を提供するための方法およびシステム
本開示は、対象が疾患を有するか、または疾患を有するリスクがあるかどうかを判定す
るための方法およびシステムを提供し、この方法およびシステムは、(i)メチル化プロ
ファイル、(ii)変異プロファイル、および(iii)断片の長さプロファイルのうち
の少なくとも1つのプロファイルを生成するために前記対象から得られたセルフリー核酸
試料に由来する複数の核酸分子をシーケンシングに供する工程、および前記対象が前記疾
患を有するかまたは前記疾患のリスクがあるかどうかを少なくとも80%の感度または少
なくとも約90%の特異度で判定するために前記少なくとも1つのプロファイルを処理す
る工程であって、前記セルフリー核酸試料が30ng/ml未満の前記複数の核酸分子を
含む、処理する工程を含む。いくつかの実施形態では、感度は、少なくとも約80%、8
1%、82%、83%、84%、85%、86%、87%、88%、89%、90%、9
1%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%
、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパーセン
テージである。いくつかの実施形態では、特異度は、少なくとも約90%、91%、92
%、93%、94%、95%、96%、97%、98%、99%、99.1%、99.2
%、99.3%、99.4%、99.5%、99.6%、99.7%、99.8%、99
.9%、または数字の間の任意のパーセンテージである。
【0077】
いくつかの実施形態では、方法およびシステムは、前記対象から得られたセルフリー核
酸試料に由来する複数の核酸分子を配列決定に供して、(i)メチル化プロファイル、(
ii)変異プロファイルおよび(iii)断片の長さプロファイルのうちの少なくとも2
つのプロファイルを生成させる工程を含む。方法は、少なくとも約80%、81%、82
%、83%、84%、85%、86%、87%、88%、89%、90%、91%、92
%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.6
%、99.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの感
度をもたらす。いくつかの実施形態では、2つのプロファイルを使用する場合の感度は、
1つのプロファイルを使用する場合の感度と比較して、任意の数字の間で少なくとも約0
.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、またはパー
センテージだけ増加する。いくつかの実施形態では、3つのプロファイルを使用する場合
の感度は、2つのプロファイルを使用する場合の感度と比較して、任意の数字の間で少な
くとも約0.5%、1%、2%、3%、4%、5%、6%、7%、8%、9%、10%、
またはパーセンテージだけ増加する。
【0078】
さらに、方法は、少なくとも約90%、91%、92%、93%、94%、95%、9
6%、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、9
9.5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意の
パーセンテージの特異度をもたらす。いくつかの実施形態では、2つのプロファイルを使
用する場合の特異度は、1つのプロファイルを使用する場合の特異度と比較して、任意の
数字の間で少なくとも約0.5%、1%、2%、3%、4%、5%、6%、7%、8%、
9%、10%、またはパーセンテージだけ増加する。いくつかの実施形態では、3つのプ
ロファイルを使用する場合の特異度は、2つのプロファイルを使用する場合の特異度と比
較して、任意の数字の間で少なくとも約0.5%、1%、2%、3%、4%、5%、6%
、7%、8%、9%、10%、またはパーセンテージだけ増加する。
【0079】
本開示は、対象のセルフリー核酸試料を処理して、前記対象が疾患を有するかまたは疾
患を有するリスクがあるかどうかを判定する方法およびシステムであって、複数の核酸分
子を含む前記セルフリー核酸試料を得る工程、前記複数の核酸分子またはその誘導体を配
列決定に供して、複数の配列決定リードを生成する工程、前記複数の配列決定リードをコ
ンピュータ処理して、前記複数の核酸分子について、(i)メチル化プロファイル、(i
i)変異プロファイル、および(iii)断片の長さプロファイルを同定する工程、およ
び前記対象が前記疾患を有するかまたは有するリスクがあるかどうかを判定するために、
少なくとも前記メチル化プロファイル、前記変異プロファイルおよび前記断片の長さプロ
ファイルを使用する工程を含む、方法およびシステムを提供する。いくつかの実施形態で
は、方法は、少なくとも約80%、81%、82%、83%、84%、85%、86%、
87%、88%、89%、90%、91%、92%、93%、94%、95%、96%、
97%、98%、99%、99.5%、99.6%、99.7%、99.8%、99.9
%、または数字の間の任意のパーセンテージの感度をもたらす。方法は、少なくとも約9
0%、91%、92%、93%、94%、95%、96%、97%、98%、99%、9
9.1%、99.2%、99.3%、99.4%、99.5%、99.6%、99.7%
、99.8%、99.9%、または数字の間の任意のパーセンテージの特異度をもたらす
【0080】
本開示は、複数の差次的メチル化領域(DMR)を同定することを含む、腫瘍の組織の
起源を決定するための方法およびシステムを提供し、複数のDMRは、特定のがん(例え
ば、乳がん、結腸がん、前立腺がん、HSNCC)に特異的であり、セルフリー核酸分子
の画分に由来する。いくつかの実施形態では、セルフリー核酸分子の画分はctDNAに
由来する。いくつかの実施形態では、方法は少なくとも約80%、81%、82%、83
%、84%、85%、86%、87%、88%、89%、90%、91%、92%、93
%、94%、95%、96%、97%、98%、99%、99.5%、99.6%、99
.7%、99.8%、99.9%、または数字の間の任意のパーセンテージの感度をもた
らす。方法は、少なくとも約90%、91%、92%、93%、94%、95%、96%
、97%、98%、99%、99.1%、99.2%、99.3%、99.4%、99.
5%、99.6%、99.7%、99.8%、99.9%、または数字の間の任意のパー
センテージの特異度をもたらす。
【0081】
本開示は、疾患/状態の治療を受けた後に対象に対して予後を得るための方法およびシ
ステムを記載する。例えば、治療は、腫瘍の外科的除去、特定の種類のがんのために設計
された化学療法、放射線療法、または免疫療法(例えば、TCR、CARなど)を含む。
いくつかの実施形態では、方法またはシステムは、前記対象から得られたセルフリー核酸
試料に由来する複数の核酸分子を配列決定に供して、(i)メチル化プロファイル、(i
i)変異プロファイルおよび(iii)断片の長さプロファイルのうちの少なくとも1つ
のプロファイルを生成させること、および少なくとも1つのプロファイルに少なくとも基
づいて微小残存病変(MRD)をモニタリングまたは検出することを含む。
【0082】
本開示は、対象からの試料の少なくとも一部からのセルフリー核酸分子をアッセイする
ことによって、前記対象が疾患/状態を有するかどうかを判定するため、表5に列挙され
る差次的メチル化領域(DMR)に含まれる前記セルフリー核酸分子の少なくとも一部の
メチル化レベルを検出するため、また少なくとも1つのコンピュータプロセッサを使用し
て、(b)で検出された前記メチル化レベルを、前記表5に列挙されたDMRに含まれる
前記セルフリー核酸分子の対応する(1つまたは複数の)部分のメチル化レベルと比較す
るための方法およびシステムを提供する。いくつかの実施形態では、表5に列挙される少
なくとも約6個以上、10個以上、15個以上、20個以上、30個以上、40個以上、
50個以上、60個以上、70個以上、80個以上、90個以上、または100個以上、
200個以上、300個以上、400個以上、500個以上、600個以上、または70
0個以上のDMRのメチル化レベルが測定され、本明細書で論じられる健常な対象の対応
するDMRのメチル化レベルと比較される。
【0083】
対象が正確に診断され、外科的除去、化学療法、放射線療法などのがんを治療するため
の治療を受けるたら、治療の有効性をモニタリングし、患者の生存率を予測することが重
要である。さらに、がん細胞の最小限の残存疾患を検出することが重要である。本開示は
、前記対象が疾患の治療を受けた後に生存率が高いかどうかを判定するための方法および
システムを提供し、この方法およびシステムは、前記対象からの試料の少なくとも一部か
らのセルフリー核酸分子をアッセイすること、表6に列挙される差次的メチル化領域(D
MR)に含まれる前記セルフリー核酸分子の少なくとも一部のメチル化レベルを検出する
こと、また少なくとも1つのコンピュータプロセッサを使用して、(b)で検出された前
記メチル化レベルを、表6に列挙された前記DMRに含まれる前記セルフリー核酸分子の
対応する(1つまたは複数の)部分のメチル化レベルと比較することを含む。いくつかの
実施形態では、表6に列挙されるDMRは、遺伝子ZSCAN31、LINC01391
、GATA2-AS1、STK3、およびOSR1に関連する領域を表す。
【表2】
【0084】
いくつかの実施形態では、方法は、免疫沈降反応を確認するために第2の量の対照DN
Aを試料に添加する工程をさらに含む。
【0085】
本明細書で使用される場合、「対照」は、陽性対照と陰性対照の両方、または少なくと
も陽性対照を含み得る。
【0086】
いくつかの実施形態では、方法は、セルフリーメチル化DNAの捕捉を確認するために
、第2の量の対照DNAを試料に添加する工程をさらに含む。
【0087】
いくつかの実施形態では、がん細胞由来のDNAが存在することを同定することは、が
ん細胞の起源の組織を同定することをさらに含む。
【0088】
いくつかの例では、腫瘍組織サンプリングは困難であるか、または重大なリスクを伴う
可能性があり、その場合、腫瘍組織サンプリングを必要とせずにがんを診断および/また
はサブタイプに分けることが望ましい場合がある。例えば、肺腫瘍組織サンプリングは、
縦隔鏡検査、開胸、または経皮的針生検などの侵襲的処置を必要とし得る。これらの処置
は、入院、胸腔チューブ、機械での換気、抗生物質、または他の医学的介入の必要性をも
たらし得る。一部の個体は、医学的併存症のために、または優先度のために、腫瘍組織サ
ンプリングに必要な侵襲的処置を受けないことがある。いくつかの例では、腫瘍組織調達
の実際の手順は、疑われているがんのサブタイプに依存し得る。他の例では、がんのサブ
タイプは、同じ個体の体内で経時的に進展し得、侵襲性腫瘍組織サンプリング処置による
連続的な評価は、多くの場合非現実的であり、患者が十分に忍容できない。したがって、
血液検査による非侵襲性がんのサブタイプ分類は、臨床腫瘍学の実施において多くの有利
な用途を有し得る。
【0089】
したがって、いくつかの実施形態では、がん細胞の起源の組織を同定することは、がん
のサブタイプを同定することをさらに含む。好ましくは、がんのサブタイプは、ステージ
(例えば、外科手術で治療された早期肺がん対化学療法で治療された後期肺がん)、組織
学(例えば、肺がんにおける小細胞癌対腺癌対扁平上皮癌)、遺伝子発現パターンまたは
転写因子活性(例えば、乳がんにおけるER状態)、コピー数の異常(例えば、乳がんに
おけるHER2の状態)、特異的再編成(例えば、AMLにおけるFLT3)、特異的遺
伝子点変異状態(例えば、IDH遺伝子点変異)、およびDNAのメチル化パターン(例
えば、脳がんにおけるMGMT遺伝子プロモーターのメチル化)に基づいてがんを区別す
る。
【0090】
いくつかの実施形態では、工程(f)における比較は、ゲノムワイドで行われる。
【0091】
他の実施形態では、工程(f)における比較は、ゲノムワイドから、限定されないが、
FANTOM5エンハンサー、CpGアイランド、CpGショア、CpG Shelfま
たは前述の任意の組み合わせなどの特定の調節領域に制限される。
【0092】
いくつかの実施形態では、本明細書の方法は、がんの検出に使用するためのものである
【0093】
いくつかの実施形態では、本明細書の方法は、がんの治療のモニタリングに使用するた
めのものである。
【0094】
データ分析システムおよび方法
本明細書に開示される方法およびシステムは、アルゴリズムまたはその使用を含むこと
ができる。1つまたは複数のアルゴリズムは、1つまたは複数の対象から1つまたは複数
の試料を分類するために使用され得る。1つまたは複数のアルゴリズムは、1つまたは複
数の試料からのデータに適用され得る。データはバイオマーカー発現データを含み得る。
本明細書に開示される方法は、1人または複数の対象からの1つまたは複数の試料に分類
を割り当てることを含み得る。分類を試料に割り当てることは、メチル化プロファイル、
変異プロファイルおよび断片の長さプロファイルにアルゴリズムを適用することを含み得
る。場合によっては、少なくとも1つのプロファイルは、対象から得られた試料を疾患ま
たは軽微な損傷を有すると分類するための訓練されたアルゴリズムを含むデータ分析シス
テムに入力される。
【0095】
データ分析システムは、訓練されたアルゴリズムであってもよい。アルゴリズムは、線
形分類器を含み得る。場合によっては、線形分類器は、線形判別分析、フィッシャー線形
判別、ナイーブベイズ分類器、ロジスティック回帰、パーセプトロン、サポートベクター
マシン、またはそれらの組み合わせのうちの1つまたは複数を含む。線形分類器は、サポ
ートベクターマシン(SVM)のアルゴリズムであってもよい。アルゴリズムは、双方向
分類器を含み得る。双方向分類器は、1つまたは複数の決定木、ランダムフォレスト、ベ
イジアンネットワーク、サポートベクターマシン、ニューラルネットワーク、またはロジ
スティック回帰アルゴリズムを含み得る。
【0096】
アルゴリズムは、1つまたは複数の線形判別分析(LDA)、基本パーセプトロン、弾
性ネット、ロジスティック回帰、(カーネル)サポートベクターマシン(SVM)、対角
線形判別分析(DLDA)、ゴルビン分類器、パーゼンベース、(カーネル)フィッシャ
ー判別分類器、k近傍法、反復RELIEF、分類木、最尤分類器、ランダムフォレスト
、最近接重心、マイクロアレイの予測分析(PAM)、k中間クラスタリング、ファジー
C平均クラスタリング、ガウス混合モデル、勾配応答(GR)、勾配ブースティング法(
GBM)、楕円ネットロジスティック回帰、ロジスティック回帰、またはそれらの組み合
わせを含み得る。アルゴリズムは、対角線形判別分析(DLDA)のアルゴリズムを含み
得る。アルゴリズムは、最近接重心のアルゴリズムを含み得る。アルゴリズムは、ランダ
ムフォレストのアルゴリズムを含み得る。いくつかの実施形態では、子癇前症および非子
癇前症を識別するために、ロジスティック回帰、ランダムフォレスト、および勾配ブース
ティング法(GBM)のパフォーマンスは、線形判別分析(LDA)、ニューラルネット
ワーク、およびサポートベクターマシン(SVM)のパフォーマンスよりも優れている。
【0097】
キット
本開示は、対象の疾患または障害(例えば、がん)を同定またはモニタリングするため
のキットを提供する。キットは、対象の試料のがん関連ゲノム遺伝子座のパネルの各々に
おける配列の定量的尺度(例えば、存在、非存在、または相対的な量を示す)を同定する
ためのプローブを含み得る。試料のがん関連ゲノム遺伝子座のパネルの各々における配列
の定量的尺度(例えば、存在、非存在、または相対的な量を示す)は、対象の疾患または
障害(例えば、がん)を示し得る。プローブは、試料のがん関連ゲノム遺伝子座(例えば
、表3、5および6に列挙されるDMR)のパネルにおける配列に対して選択的であり得
る。キットは、プローブを使用して試料を処理し、対象の試料のがん関連ゲノム遺伝子座
のパネルのそれぞれにおける配列の定量的尺度(例えば、存在、非存在、または相対的な
量を示す)を示すデータセットを生成するための説明書を含み得る。
【0098】
キットにあるプローブは、試料のがん関連ゲノム遺伝子座のパネルにおける配列に対し
て選択的であり得る。キットにあるプローブは、がん関連ゲノム遺伝子座のパネルに対応
する核酸(例えば、RNAまたはDNA)分子を選択的に濃縮するように構成され得る。
キットにあるプローブは核酸プライマーであり得る。キットにあるプローブは、がん関連
ゲノム遺伝子座またはゲノム領域のパネルの1つ以上からの核酸配列との配列相補性を有
し得る。がん関連ゲノム遺伝子座または微生物関連ゲノム遺伝子座またはゲノム領域のパ
ネルは、少なくとも2、少なくとも3、少なくとも4、少なくとも5、少なくとも6、少
なくとも7、少なくとも8、少なくとも9、少なくとも10、少なくとも11、少なくと
も12、少なくとも13、少なくとも14、少なくとも15、少なくとも16、少なくと
も17、少なくとも18、少なくとも19、少なくとも20、またはそれより異なるがん
関連ゲノム遺伝子座またはゲノム領域のパネルを含み得る。
【0099】
キットの説明書は、セルフリー生物学的試料のがん関連ゲノム遺伝子座のパネルにおけ
る配列に対して選択的であるプローブを使用して、試料をアッセイするための説明書を含
み得る。これらのプローブは、がん関連ゲノム遺伝子座の複数のパネルのうちの1つ以上
由来の核酸配列(例えば、RNAまたはDNA)との配列相補性を有する核酸分子(例え
ば、RNAまたはDNA)であり得る。これらの核酸分子は、プライマーまたは濃縮配列
であり得る。セルフリー生物試料をアッセイするための説明書は、アレイハイブリダイゼ
ーション、ポリメラーゼ連鎖反応(PCR)、または核酸の配列決定(例えば、DNAの
配列決定またはRNAの配列決定)を実施して試料を処理し、試料のがん関連ゲノム遺伝
子座のパネルのそれぞれにおける配列の定量的尺度を示す(例えば、存在、非存在、また
は相対的な量を示す)データセットを生成するための導入を含み得る。試料のがん関連ゲ
ノム遺伝子座のパネルの各々における配列の定量的尺度(例えば、存在、非存在、または
相対的な量を示す)は、疾患または障害(例えば、がん)を示し得る。
【0100】
キットの説明書は、アッセイ読み出し値を測定および解釈するための説明書を含み得、
それは、試料のがん関連ゲノム遺伝子座のパネルの各々における配列の定量的尺度を示す
(例えば、存在、非存在、または相対的な量を示す)データセットを生成するために、が
ん関連ゲノム遺伝子座のパネルの1つまたは複数において定量化され得る。例えば、がん
関連ゲノム遺伝子座のパネルに対応するアレイハイブリダイゼーションまたはポリメラー
ゼ連鎖反応(PCR)の定量化は、試料のがん関連ゲノム遺伝子座のパネルの各々におけ
る配列の定量的尺度を示す(例えば、存在、非存在、または相対的な量を示す)データセ
ットを生成し得る。アッセイ読み取り値は、定量的PCR(qPCR)値、デジタルPC
R(dPCR)値、デジタル液滴PCR(ddPCR)値、蛍光の値など、またはそれら
の正規化された値を含み得る。
【0101】
コンピュータシステム
いくつかの実施形態では、特定の工程は、コンピュータプロセッサによって実行される
。本システムおよび方法は、様々な実施形態で実施することができる。適切に構成された
コンピュータデバイス、ならびに関連する通信ネットワーク、デバイス、ソフトウェアお
よびファームウェアは、上述の1つまたは複数の実施形態を可能にするためのプラットフ
ォームを提供することができる。例として、図8は、記憶ユニット104およびランダム
アクセスメモリ106に接続された中央処理装置(「CPU」)102を含むことができ
る汎用コンピュータデバイス100を示す。CPU102は、オペレーティングシステム
101、アプリケーションプログラム103、およびデータ123を処理することができ
る。必要に応じて、オペレーティングシステム101、アプリケーションプログラム10
3、およびデータ123を記憶ユニット104に格納し、メモリ106にロードすること
ができる。コンピュータデバイス100は、CPU102およびメモリ106に動作可能
に接続され、CPU102からの集中的な画像処理計算をオフロードし、CPU102と
並列にこれらの計算を実行するグラフィック処理ユニット(GPU)122を、さらに含
むことができる。オペレータ107は、ビデオインターフェース105によって接続され
たビデオディスプレイ108、およびI/Oインターフェース109によって接続された
キーボード115、マウス112、およびディスクドライブまたはソリッドステートドラ
イブ114などの様々な入出力デバイスを使用して、コンピュータデバイス100と対話
することができる。マウス112は、ビデオディスプレイ108のカーソルの移動を制御
し、マウスのボタンでビデオディスプレイ108に表示される様々なグラフィカルユーザ
インターフェース(GUI)の制御を操作するように構成することができる。ディスクド
ライブまたはソリッドステートドライブ114は、コンピュータ可読媒体116を受け入
れるように構成され得る。コンピュータデバイス100は、ネットワークインターフェー
ス111を介してネットワークの一部を形成することができ、コンピュータデバイス10
0が他の適切に構成されたデータ処理システム(図示せず)と通信することを可能にする
。様々なソースからの入力を受信するために、1つまたは複数の異なるタイプのセンサ1
35を使用することができる。
【0102】
本システムおよび方法は、デスクトップコンピュータ、ラップトップコンピュータ、タ
ブレットコンピュータ、またはワイヤレスハンドヘルドを含む実質的に任意の方式のコン
ピュータデバイスで実施することができる。本システムおよび方法はまた、1つまたは複
数のコンピュータデバイスが本発明による方法における様々なプロセス工程の各々を実施
することを可能にするためのコンピュータプログラムコードを含むコンピュータ可読/使
用可能媒体として実施されてもよい。複数のコンピュータデバイスが動作全体を実行する
場合、コンピュータデバイスはネットワーク接続されて動作の様々な工程を分配する。コ
ンピュータ可読媒体またはコンピュータ使用可能媒体という用語は、プログラムコードの
任意のタイプの物理的実施形態の1つまたは複数を含むことが理解される。特に、コンピ
ュータ可読/使用可能媒体は、1つまたは複数の可搬型記憶製品(例えば、光ディスク、
磁気ディスク、テープなど)、コンピュータおよび/または記憶システムに関連するメモ
リなどのコンピューティングデバイスの1つまたは複数のデータ記憶部に組み込まれたプ
ログラムコードを含むことができる。
【0103】
本明細書で使用される場合、「プロセッサ」は、任意のタイプのプロセッサ、例えば、
任意のタイプの汎用マイクロプロセッサまたはマイクロコントローラ(例えば、Inte
l(商標)x86、PowerPC(商標)、ARM(商標)プロセッサなど)、デジタ
ル信号処理(DSP)プロセッサ、集積回路、フィールドプログラマブルゲートアレイ(
FPGA)、またはそれらの任意の組み合わせであってもよい。
【0104】
本明細書で使用される場合、「メモリ」は、例えば、ランダムアクセスメモリ(RAM
)、読み出し専用メモリ(ROM)、コンパクトディスク読み出し専用メモリ(CDRO
M)、電気光学メモリ、光磁気メモリ、消去可能プログラマブル読み出し専用メモリ(E
PROM)、および電気的消去可能プログラマブル読み出し専用メモリ(EEPROM)
など、内部または外部のいずれかに配置された任意のタイプのコンピュータメモリの適切
な組み合わせを含むことができる。メモリ102の一部は、従来のファイルシステムを使
用して編成され、デバイスの全体的な動作を管理するオペレーティングシステムによって
制御および管理され得る。
【0105】
本明細書で使用される場合、「コンピュータ可読記憶媒体」(機械可読媒体、プロセッ
サ可読媒体、またはコンピュータ可読プログラムコードが具現化されたコンピュータ使用
可能媒体とも呼ばれる)は、コンピュータまたは機械によって読み取り可能なフォーマッ
トで、データを記憶することができる媒体である。機械可読媒体は、ディスケット、コン
パクトディスク読み出し専用メモリ(CD-ROM)、メモリデバイス(揮発性または不
揮発性)、または同様の記憶機構を含む磁気、光学、または電気記憶媒体を含む、任意の
適切な有形の非一時的媒体であってもよい。コンピュータ可読記憶媒体は、実行されると
き、プロセッサに、本開示の実施形態による方法の工程を実行させる様々な命令セット、
コードシーケンス、構成情報、または他のデータを含むことができる。当業者は、記載さ
れた実施態様を実施するために必要な他の命令および動作がまた、コンピュータ可読記憶
媒体に記憶され得ることを理解するであろう。コンピュータ可読記憶媒体に記憶された命
令は、プロセッサまたは他の適切な処理デバイスによって実行され得て、記載されたタス
クを実行するための回路とインターフェースすることができる。
【0106】
本明細書で使用される場合、「データ構造」は、コンピュータのデータを編成してそれ
が効率的に使用され得るようにする特定の方法である。データ構造は、1つまたは複数の
特定の抽象データ型(ADT)を実装することができ、それは、データ構造に対して実行
され得る操作、およびそれらの操作の計算の複雑度を明示する。比較すると、データ構造
は、ADTにより得られる仕様の具体的な実装である。
【0107】
本発明の利点は、以下の実施例によってさらに説明される。本明細書に記載の実施例お
よびそれらの特定の細部は、例示のために提示されているにすぎず、本発明の特許請求の
範囲を限定するものとして解釈されるべきではない。
【0108】
[実施例]
材料および方法
HNSCCおよび健常なドナーの末梢血白血球(PBL)ならびに血漿の獲得
2014年~2016年の間にHNSCCと診断された患者が、前向きなAnthol
ogy of Clinical Outcomes(Wong K.et al.20
10)から同定された。すべての研究は、University Health Net
workのResearch Ethics Boardによって承認された。HNSC
C患者の試料は、以下の基準、1)診断時の限局性疾患の提示、2)診断時、および少な
くとも1つの処置後の時点での血液の採取、3)診断後2年の最小フォローアップ時間に
基づいて、Princess Margaret Cancer CentreのHNC
Translational Researchプログラムから得た。すべての患者は
、アジュバント放射線療法を伴うまたは伴わない手術からなる、治癒を意図した治療を受
けた。年齢、性別および現在の喫煙状態が一致する健常なドナーを、前向き肺がんスクリ
ーニングプログラムから同定した。5~10mLの血液をエチレン-ジアミン-四酢酸(
EDTA)チューブに採取した。HNSCC患者については、血液を、診断時(ベースラ
イン、BL)ならびに一次手術の3ヶ月後(3M)に採取した。適用可能な場合、追加の
血液を、補助放射線療法(PreRT)、中間補助放射線療法(MidRT)の前、およ
び/または一次手術の12ヶ月後(12M)に採取した。血漿を採取の1時間以内に血液
から単離し、さらなる処理まで-80℃で保存した。診断時のHNSCC患者または健常
なドナーに対する同じ採血から、末梢血白血球がまた単離された。
【0109】
細胞培養
HPV陰性HNSCC細胞株FaDuは、Bradly Wouters博士(Pri
ncess Margaret Cancer Center)の厚意により提供され、
10%ウシ胎児血清および1%ペニシリン/ストレプトマイシンが補充されたDMEM(
Gibco)で培養された。FaDu細胞培養物を、5%CO2を含有する加湿雰囲気に
おいて37℃でインキュベートした。STRプロファイリングにより、FaDu細胞の同
一性を確認した。使用前に細胞をマイコプラズマ試験e-MycoTMVALiD My
coplasma PCR Detection Kit、Intron Bio)に供
した。
【0110】
セルフリーDNA(cfDNA)およびPBLゲノムDNA(gDNA)の単離
製造業者の指示に従ってQIAamp Circulating Nucleic A
cid Kit(Qiagen)を使用して、総血漿からcfDNAを単離した。ゲノム
DNAをPBLから単離し、Covaris M220集束超音波処理装置を用いて15
0~200塩基対に剪断し、AMPure XP磁気ビーズ(Beckman Coul
ter)によってサイズ選択して、300塩基対を超える断片を除去した。単離されたc
fDNAおよび剪断されたPBLゲノムDNAを、ライブラリ生成前にQubitによっ
て定量した(図9Aおよび図9B)。
【0111】
配列決定ライブラリの調製
それぞれ5~10ngまたは10~20ngのDNAをcfMeDIP-seqまたは
CAPP-seqのインプットとして使用した。いくつかの改変を加えたKAPA Hy
perPrep Kit(KAPA Biosystems)を使用して、ライブラリ生
成のためにインプットDNAを調製した。ライゲーション時にインプットDNAの両鎖に
隣接するランダムな2bpの配列とそれに続く一定の1bpのT配列5’とを組み込むラ
イブラリアダプターを利用した。ライゲーション中のアダプター二量体化を最小限に抑え
るために、ライブラリアダプターを100:1というアダプター:DNAのモル比(10
ngのcfDNAあたり約0.07uM)で添加し、4℃で17時間一晩インキュベート
した。ライゲーション後の浄化後、ライブラリ生成の前に、インプットDNAを40μL
の溶出緩衝液(EB、10mMのTris-HCl、pH8.0~8.5)で溶出した。
【0112】
CAPP-seqライブラリの生成
CAPP-seqライブラリの作製を、いくつかの修正を加えてNewman et
al.2014に記載されているように行った。ライブラリを10サイクルでPCR増幅
し、最大12のインデックス付き増幅ライブラリを500~1000ngで一緒にプール
した。COT DNAおよびブロッキングオリゴを添加した後、プールしたライブラリを
SpeedVac処理してすべての液体を蒸発させ、13μLの再懸濁混合物(8.5μ
Lの2Xハイブリダイゼーション緩衝液、3.4μLのハイブリダイゼーション成分A、
1.1μLのヌクレアーゼ非含有水)に再懸濁した。ハイブリダイゼーションの前に、4
μLのハイブリダイゼーションプローブ(すなわち、HNSCCセレクタ)を合計17μ
Lにわたって再懸濁混合物に添加した。ハイブリダイゼーションおよびPCR増幅/浄化
の後、ライブラリを30μLのIDTE、pH8.0(1×TE溶液)で溶出した。多重
化ライブラリを、Illumina NextSeq/NovaSeq/HiSeq40
00でそれぞれ2×75/100/125の対の試行で配列決定した。HNSCCセレク
タの設計は、COSMICデータベースからのHNSCCならびにHPV-16ゲノムの
E6およびE7領域における頻繁に繰り返されるゲノム変化を組み込んだ(図11)。
【0113】
CAPP-seqライブラリのアライメントおよび質の管理
組み込まれたランダムの分子バーコードに対応する、アラインメントされていない対に
なったリードの各5’末端の最初の2塩基対を抽出し、照合して4bp分子識別子(UM
I)を生成した。第3のT塩基対スペーサーもアライメント前に除去した。対になったリ
ードを、BWA-memによってヒトゲノム(ゲノムアセンブリGRCh37/hg19
)にアラインメントし、SAMtools(v 1.3.1)によってソートおよびイン
デックス付けし、Genome Analysis ToolKit(GATK)Bas
eRecalibrator(v 3.8)を使用して、最良の実践(参照)に従って、
塩基の質のスコアについて再較正した。BAMファイルから得た重複配列をそれらのUM
Iに基づいて折り畳み、ConsensusCruncherによってシングルトン、単
一鎖コンセンサス配列(SSCS)または重複コンセンサス配列(DCS)として標識し
44。各ライブラリの質の管理を、FastQC(Babraham Bioinfo
rmatics)から得られた様々なメトリック、ならびに捕捉効率(CollectH
sMetrics、Picard 2.10.9)、カバレッジの深度(DepthOf
Coverage、GATK 3.8)および塩基対位置誤り率(ides-bgrep
ort.pl、Newmanら、2016)を得るための様々なスクリプトによって評価
した。
【0114】
体細胞ヌクレオチド変異体(SNV)の検出およびctDNAの定量
Newmanら2016に記載されているように、統合デジタルエラー抑制(iDES
)によって潜在的な配列決定エラーの除去を行った。バックグラウンド研磨を、20名の
健常なドナーのcfDNAの試料を訓練コホートとして利用することによって、行った(
図12)。下流の分析に外れ値が影響を与えるのを防ぐために、HNSCC cfDNA
またはPBL gDNA試料にわたる配列決定の深度(1500倍以下、5000倍以上
)の下位15または上位85パーセンタイルの候補SNV、ならびに平均の配列決定の深
度が500倍以下の遺伝子を分析から除外した。クローン造血を説明するために、非生殖
系列変異は、血漿に10%未満の変異対立遺伝子画分を有すると定義された。HNSCC
のcfDNA試料の候補SNVは、一致したPBLのgDNA試料の二重鎖のサポートお
よび完全な非存在でリードをサポートする、3以上の基準に基づいて同定された。同定さ
れたSNVの変異対立遺伝子画分(MAF)を、代替対立遺伝子に対応するリードの数を
、代替対立遺伝子および参照対立遺伝子に対応するリードの合計で割ることによって計算
した。同定可能なSNVを有するHNSCCのcfDNAの試料各々について、SNVに
わたる平均MAFを計算し、ctDNAの存在量の尺度として使用した。1つのみの同定
可能なSNVを有するcfDNA試料では、計算されたMAFを使用した。検出可能なが
ん由来の変異の多くはホモ接合性でなくても、腫瘍の内部でクローン性でなくてもよく、
これらの理由から、平均MAFはセルフリーDNA内の真のctDNAの存在量を過小評
価したものであり得る。
【0115】
cfMeDIP-seqライブラリの生成
「Sequencing Library Preparation」に記載されてい
るようにライブラリ調製工程を変更して、Shenら2019に記載されているように、
cfMeDIP-seqプロトコルを実施した。多重化ライブラリを、Illumina
NextSeq/NovaSeq/HiSeq4000でそれぞれ2×75/100/
125の対の試行で配列決定した。一般化の可能性のために、cfMeDIP-seqラ
イブラリは、供給源(すなわち、cfDNA、gDNA)にかかわりなく、5~10ng
のインプットDNAを利用する任意のMeDIP-seq調製方法として記載されている
【0116】
cfMeDIP-seqライブラリのアラインメントおよび質の管理
CAPP-seqライブラリのアラインメントおよび質の管理において、前に記載され
たように、アラインメントされていない対のリードを処理し、アラインメントし、ソート
し、インデックス付けした。BAMファイルからの重複配列をSAMtoolsによって
崩壊させた。各ライブラリの質の管理は、FastQC(Babraham Bioin
formatics)から得られた様々なメトリック、ならびにCpGカバレッジ(ME
DIPS.seqCoverage)および濃縮(MEDIPS.CpGenrich)
を含むRパッケージMEDIPS(参照)から得られた様々なメトリックによって評価し
た。
【0117】
cfMeDIP-seqプロファイルにおける情報領域の選択
cfMeDIP-seqライブラリのペアリードから生成された断片を、MEDIPS
(MEDIPS.createSet)によって重複しない300塩基対ウィンドウ内で
カウントし、Reads Per Kilobase per Million(RPK
M)によってスケーリングし、WIGフォーマット(MEDIPS.exportWIG
)としてエクスポートした。各試料から得たWIGファイルをRによってインポートし、
マトリックスとして照合した。分析は、非疾患状況の中での適用を可能にするために、2
0人の健常なドナーの試料から得たcfDNAおよびPBLの試料に限定された。情報領
域は、CpGの密度、およびcfDNAと一致したPBLとの間でのRPKM値の相関の
基準に基づいた。CpGの密度(≧nのCpG)に基づくスライディングウィンドウを使
用して、≧8個のCpGの最小閾値を選択した。
【0118】
cfMeDIP-seqライブラリからの絶対的なメチル化の計算
cfMeDIP-seqライブラリの対にしたリードから得た断片を、Selecti
on of Informative Regions in cfMeDIP-seq
Profilesに以前に記載されたようにカウントし、MeDEStrand Rパ
ッケージによって絶対的なメチル化レベルにスケーリングした。カウントから絶対的なメ
チル化を計算するために、ロジスティック回帰モデルを使用して、CpGの密度(すなわ
ち、CpG密度バイアス)に基づいてDNAプルダウンのバイアスを推定した(MeDE
Strand.calibrationCurve)。推定されたCpG密度バイアスに
基づいて、各ウィンドウ内部のメチル化を、陽性および陰性のDNA鎖からの断片につい
て補正した。補正された断片を有するウィンドウを対数変換し、絶対的なメチル化(Me
DEStrand.binMethyl)を表すために、0~1の値にスケーリングした
。各cfMeDIP-seq試料からの絶対的なメチル化レベルを、WIG様ファイル(
すなわち、トラックラインのないWIGファイルフォーマット)としてエクスポートした
【0119】
インシリコのPBL枯渇の設計およびパフォーマンスの評価
疾患状況内のウィンドウを濃縮するために、PBLからのメチル化を「インシリコのP
BL枯渇」と呼ばれるプロセスによって除去した。分析は、非がん特異的状況の中での適
用を可能にするために、20人の健常なドナーの試料のコホートから得たPBL試料に限
定された。インシリコのPBL枯渇のための本発明者らの戦略を以下のように実行した:
1.cfMeDIP-seqプロファイルにおける情報領域の選択において記載される
各情報ウィンドウについて、健常なドナーのPBL試料にわたる絶対的なメチル化の中央
値を計算する。
【0120】
2.絶対的なメチル化の中央値<0.1の基準に基づいて、PBL枯渇ウィンドウを定
義する。
【0121】
3.PBL枯渇ウィンドウ内部のcfDNA試料の分析を制限する。
【0122】
インシリコのPBL枯渇戦略のパフォーマンスを、訓練セットとして使用した健常なド
ナーのコホートから得た枯渇前後のPBL試料の絶対的なメチル化分布を検証セットとし
て使用したHNSCCコホートと比較することによって、評価した。
【0123】
差次的メチル化分析
HNSCC関連の差次的メチル化領域(DMR)のロバストな検出を可能にするために
、分析を、CAPP-seqによる血漿の検出可能なSNVを有するHNSCC患者に限
定した(n=20/32)。差次的メチル化分析は、インシリコのPBL枯渇後の情報領
域に限定された。cfMeDIP-seqプロファイルにおける情報領域の選択において
前に記載されたように作製された、HNSCCおよび健常なドナーcfDNA試料からの
ビニングされた断片数の照合されたマトリックスを、DESeq2 Rパッケージによる
DMRの同定のために利用した。すべてのcfDNA試料にわたって<10カウントの領
域を除去することによってプレフィルタリングを行った。条件(HNSCC対健常なドナ
ー)として定義される単一因子を、差次的メチル化分析中のコントラストに使用した。簡
潔には、サイズ因子および分散推定値に基づいて試料をスケーリングし、続いて負の二項
一般線形モデルをフィッティングすることによって、差次的メチル化分析を行った。各ウ
ィンドウについて、Wald検定によってHNSCCと健常なドナーの状態との間でP値
を計算した。デフォルトのCookの距離カットオフを超える領域内のP値は、調整され
たP値の計算から省かれた(Benjamini-Hochberg)。HNSCCのc
fDNA試料の有意な過剰メチル化または低メチル化領域(過剰DMR/低DMR)は、
調整されたP値<0.1を有するウィンドウとして定義される。
【0124】
HNSCCのcfDNA過剰メチル化領域内のCpG特徴の濃縮
アイランド、ショア、shelf、およびopen sea(interCGI)など
のCpG特徴は、AnnotationHub Rパッケージ(参照)(hg19_cp
gsアノテーション)に定義されている。「annotatr」および「Genomic
Ranges」Rパッケージを利用する社内Rパッケージを使用して、PBL枯渇領域内
の各過剰メチル化ウィンドウ(すなわち、「chr.start.end」)のID座標
を、重複するCpG特徴でラベル付けした(図13)。
【0125】
観察された特徴の重なり対ヌル分布の濃縮確率を判定するために、1000回のランダ
ムサンプリングを行った。各サンプリングについて、CpGの同一の分布を維持しながら
、過剰メチル化ウィンドウの数に基づいて、等しい数のビンを選択した。サンプリング全
体の各CpG特徴について、観察された重複数を使用して、それぞれのヌル分布を生成し
、続いてzスコアスケールに変換した。各CpG特徴について観察された過剰メチル化領
域の重複もzスコア化変換し、ヌル分布から略式の統計を導出した。過剰メチル化ウィン
ドウから得た観察された重複の推定されるP値を、ヌル分布の観察された重複以上/以下
の重複を有するランダムサンプリングの数として、計算した。
【0126】
腫瘍がんゲノムアトラス(TCGA)からのがん特異的過剰メチル化シトシンによるc
fDNA過剰メチル化領域のHNSCCの濃縮
乳房(BRCA)、結腸直腸(COAD)、頭頸部(HNSC)、前立腺(PRAD)
、膵臓(PAAD)、肺アデノ(LUAD)、および肺扁平上皮(LUSC)からのすべ
ての原発腫瘍の公的に利用可能なhm450kのプロファイル由来のファイル情報をTC
GAからダウンロードした。本発明者らのHNSCCコホートの大部分が口腔の腫瘍を呈
することに起因して、HNSC群からのファイルは、「口腔底部」に原発部位を有する患
者に限定された(n=55)。同数のhm450kファイルを、残りのがんのタイプのそ
れぞれから、ならびに健常なPBLの別個のデータベース(GEOシリーズGSE673
93)からランダムに選択した。ダウンロードされたファイルのマニフェストが、(図1
4)に提供される。
【0127】
「腫瘍特異的」過剰メチル化シトシンを生成するために、limmaによる差次的メチ
ル化分析を各々のがんのタイプについて行い、他のがんのタイプならびにPBL(すなわ
ち、造影剤)と個々に比較した。所与のコントラストについて、残差分散および試料β値
を組み込んだ各プローブ対象シトシンについて線形モデルをフィッティングし、次いで、
コントラスト間の観察された差のP値を、経験的ベイズ平滑化によって計算する。個々の
比較に対して所与のがんのタイプにおいてメチル化が上昇した過剰メチル化シトシンを、
対数倍率変化0.25以上および調整P値(Benjamini-Hochberg)0
.01未満によって定義した。個々のがんのタイプに固有の過剰メチル化シトシンを「腫
瘍特異的」と命名した。LUSC、LUADおよびPAADの場合については、腫瘍特異
的な過剰メチル化シトシンが全くまたはほとんど同定されなかったので(0、15、18
)、その後の分析から省いた。cfMeDIP-seqライブラリとの比較のために、腫
瘍特異的過剰メチル化シトシンからの塩基対の位置を、Design of In-si
lico PBL Depletion and Evaluation of Per
formanceに記載されているように、インシリコのPBL枯渇後の情報ウィンドウ
と重ねた。
【0128】
TCGA由来の腫瘍特異的領域とのHNSCC cfDNA過剰メチル化領域について
の重複の濃縮を、HNSCCのcfDNA過剰メチル化領域内のCpG特徴の濃縮に記載
されているのと同じ方法を使用した10,000回のランダムサンプリングによって評価
した。
【0129】
cfMeDIP-seqによるctDNA検出の感度および特異度
32個のHNSCCおよび20個の健常なドナーのcfDNA試料のコホートからのc
fMeDIP-seqライブラリについて、ctDNA検出を、健常なドナーのcfDN
A試料にわたる最大RPKMの平均値よりも大きい個々のHNSCCのcfDNA試料の
HNSCCのcfDNA過剰メチル化領域にわたるRPKMの平均値の観察に基づいて、
定義した。この定義に基づくctDNA検出の感度および特異度を、受信者動作特性(R
OC)曲線分析によって評価した。患者のサブセットにおけるctDNA放出の潜在的な
欠如に起因するいかなる交絡的な結果も最小限に抑えるために、ROC曲線分析がまた、
CAPP-seqによる検出可能なctDNAを有する32個のHNSCC cfDNA
試料のうちの20個のみにおいて行われた。DMR分析によるctDNA検出の精度を評
価するための交差検証を行った。手短に言えば、CAPP-Seq陽性患者および健常な
ドナーを、訓練セット(60%、n=24)および検証セット(40%、n=16)に無
作為に割り当て、一方、両方のセットの間で同様のctDNAの存在量(CAPP-Se
qによって決定される)を維持した。訓練セットの中のHNSCCと健常なドナーの試料
との間の差次的メチル化分析によって、過剰DMRを同定した。これらの過剰DMR内の
ctDNA検出の感度を、AUROCの値を得るために検証セット内で前述のように評価
した(図2C)。ランダムサンプリングを合計50回行った。
【0130】
CAPP-seqおよびcfMeDIP-seqによって検出されたctDNAの断片
の長さの分析
各HNSCC cfDNA CAPP-seqライブラリについて、明示されたSNV
(すなわち、シングルトン、SCS、DCS)のすべてのサポート対リードおよび参照対
立遺伝子を含む対のリードからの断片の長さの中央値を測定した。断片の長さの中央値が
、1を超えるSNVの患者について報告された場合、各SNVからの断片の長さの中央値
にわたる中央値を計算した。各HNSCCのcfDNA、cfMeDIP-seqライブ
ラリについて、以前に決定されたHNSCCのcfDNA過剰メチル化領域にマッピング
するすべての断片からの断片の長さの中央値を計算した。20人の健常なドナーのコホー
トの中にメチル化が相対的に存在しないため、各健常なドナーのcfMeDIP-seq
ライブラリの断片の長さを、いずれかの計算の前に照合した。両方のタイプのライブラリ
において、断片の長さの分析は、1番目のピーク内のcfDNAに限定された(すなわち
、<220塩基対)。
【0131】
過剰DMR内の断片(100~150bpまたは100~220bp)の濃縮を以下の
ように計算した。以前に設計したPBL枯渇ウィンドウ内のランダムな300bpビンか
ら、合計30回のサンプリングから、同一の数およびCpG密度分布で、予想されるカウ
ントのヌル分布を生成した。各試料について観察されたカウントを、過剰DMRにわたる
リードカウントに基づいて決定した。各試料について、平均観察数を平均予想数で割るこ
とに基づいて、濃縮度を計算した。
【0132】
教師付き階層クラスタリング
クラスタリングの前に、log2変換を可能にするために、0.1の擬似カウントをc
fMeDIP-seqライブラリのすべてのRPKM値に追加した。値をユークリッド変
換によってスケーリングし、ウォードの方法によってクラスタリングした。3つの別個の
クラスターの任意の数を選択し(k=3)、メチル化クラスター1~3と命名し、その後
の分析に使用した。
【0133】
HNSCC患者の臨床転帰に対するctDNA検出および定量化のメトリック
ctDNA検出の潜在的な臨床的有用性を、3つのメトリックによって評価した。1)
CAPP-seqによるSNVの検出、2)cfMeDIP-seqによる過剰メチル化
領域における増加した平均RPKMの検出。比較分析のために、患者を以下の基準に基づ
いて層別化した。1)SNVの有無、2)メチル化クラスター1対メチル化クラスター2
+3。患者の特徴を表1に記載する。
【表3】
【表4】
【0134】
cfMeDIP-seq分析によるctDNA由来メチル化の交差検証
ctDNA由来メチル化を同定するためのcfMeDIP-seqのロバスト性を評価
するために、受信者動作特性(ROC)曲線分析を行った。ctDNA低/欠如に起因し
た交絡する結果を最小限に抑えるために、分析を、CAPP-seqによる検出可能なc
tDNAを有するHNSCC患者に限定した。患者および健常対照のcfMeDIP-s
eqプロファイルを訓練セット(HNSCC:n=12/20;健常対照:n=12/2
0)および試験セット(HNSCC:n=8/20;健常対照:n=8/20)に分割し
た。訓練セットおよび試験セットは、CAPP-Seq分析によって判定されるctDN
Aの存在量についてバランスを取るようにした。各反復で実行されたROC曲線分析を用
いて、合計50回の分割を実行した。
【0135】
TCGA分析によるHNSCCの予後領域の同定
一致したレガシーhm450kおよびRNA発現データを有するTCGAからのすべて
の利用可能なHNSCCの症例を選択した(n=520)。生存データをJianfan
gらから得た。hm450kのデータに関して、特定の領域のプローブID間で平均β値
を計算することによって、前述のようにメチル化を300bp領域にまとめた。隣接する
正常組織と比較してHNSCC原発腫瘍において過剰メチル化された領域を同定するため
に、独立したウィルコクソン検定を各領域について行った。隣接する正常組織と比較して
、原発腫瘍において、調整されたp値<0.05(Holms法)ならびにlog倍数変
化1以上である領域を、その後の分析のために選択した。予後と関連する過剰メチル化領
域を同定するために、年齢、性別および臨床病期を考慮して、p値<0.05の領域を選
択して、多変量Cox回帰を行った。生存分析は、HNSCC cfDNAコホート内で
観察されたことを反映して、診断後5年の最大追跡期間に限定された。遺伝子発現の変化
に関連する予後の領域をさらに同定するために、スピアマンの相関を、各領域のhm45
0k原発性腫瘍プロファイルについて、2Kbウィンドウ内の転写物の一致したRNA発
現プロファイルに対して計算した。絶対的なRho値>0.3および偽発見率<0.05
を有する領域を選択し、ZNF323/ZSCAN31、LINC01395、GATA
2-AS1、OSR1、およびSTK3/MST2の発現に関連する5つの予後領域の最
終的な同定をもたらした。TCGA患者プロファイルについては、複合メチル化スコア(
CMS)を、5つすべての予後領域にわたるβ値の合計を計算することによって得た。c
fMeDIP-seqプロファイルの場合、943個すべての過剰DMRにわたるRPK
M値を合計1にスケーリングし、CMSを、5つすべての予後領域にわたるこれらのスケ
ーリングされたRPKM値の合計を計算することによって得た。
【0136】
cfMeDIP-seqによる治療後の血漿試料の長期モニタリング
30/32の患者についてcfMeDIP-seqライブラリの生成に成功した(図1
7A~図17D)。残りの2人の患者については、不十分な材料が血漿から単離され、お
よび/または質のメトリックを満たさなかった。治療後のcfMeDIP-seqライブ
ラリのctDNA定量化を前述のように行い、差次的メチル化分析によって同定された過
剰メチル化領域にわたるRPKMの平均値を計算した。解釈を容易にするために、処理前
および処理後の両方のcfMeDIP-seqライブラリを、一致したCAPP-Seq
プロファイルによって計算された平均MAFに対する線形回帰に基づいて、パーセントの
DNAの値に変換した。残留疾患の高い信頼性の検出を達成するために、0.2%の最小
ctDNA画分が、治療後の試料で必要であり、これはすべての健常対照にわたって観察
されたRPKMの平均値の最大値に対応した。
【0137】
結果および考察
局在化したHNSCCにおけるセルフリーDNAのマルチモーダルプロファイリング
限局性がんの状況においてctDNAを特性評価するためのマルチモーダルプロファイ
リングの能力を調べるために、本発明者らは、末梢血試料を連続した時点で収集した前向
き観察試験に、32人のHNSCC患者を募集した(図9A、表1)。すべての患者は手
術で治療され、サブセットはアジュバント放射線療法(n=14)または化学放射線療法
(n=11)を受けた。追跡調査の中央値が43.2ヶ月で、9/32の患者(28%)
が再発をした(保険統計2年の無再発生存率:88%)。
【0138】
大部分の患者は、体細胞組織のゲノム/エピゲノムランドスケープを変化させ、前がん
病変に寄与することが十分に記載されている重度の喫煙歴を示したので、本発明者らはま
た、以前に肺がんスクリーニングプログラムに登録された20人のリスクが適合する健常
なドナーからの血液試料を分析した34~37。血漿由来のセルフリーDNAおよびPB
L由来のゲノムDNA(gDNA)を血液から共単離し、定量および分析に供した(補足
図1A)。健常対照と比較して、転移性疾患における総血漿のセルフリーDNAの有意に
上昇したレベルを実証した他の研究とは対照的に、HNSCCコホートと健常なドナーと
の間に有意差は認められなかった38~41(補足図1B)。
【0139】
患者および健常対照からのセルフリーDNAおよびPBLのgDNAのマルチモーダル
プロファイリングを行った(図1)。同じ試料を変異およびメチロームプロファイリング
の両方に供することによって、本発明者らは、ctDNAの腫瘍ナイーブ検出および特性
評価へのそれらの寄与を評価することができた。変異およびメチル化を、それぞれCAn
cer Personalized Profiling by deep Seque
ncing(CAPP-Seq)およびcell-free Methylated D
NA ImmunoPrecipitationおよびハイスループットシーケンシング
(cfMeDIP-seq)を使用して独立してプロファイリングした。さらに、配列決
定されたセルフリーDNA断片の長さを得るために、ペアードエンドシーケンシングを両
方の方法論に利用した。
【0140】
治療前の血漿からの変異ベースのctDNAの腫瘍ナイーブ検出
本発明者らは、最初に、一致した腫瘍試料内での確認なしでの変異ベースのctDNA
検出の信頼性を改善するためのアプローチを評価した。最近の研究は、TP53などのc
tDNA検出のために頻繁に標的化される遺伝子が、クローンで拡大されたPBLに由来
する変異を有し得ることを示している。さらに、ctDNAは腫瘍の遺伝的特徴およびエ
ピジェネティックの特徴の両方を含むので、本発明者らは、患者のセルフリーDNAにお
ける両方の特徴の直交解析がctDNA検出の信頼性を高め得ると推論した。したがって
、低い存在量のctDNAの腫瘍ナイーブ検出を高い信頼性で達成するために、cfDN
Aおよび一致したPBLの両方について、CAPP-SeqおよびcfMeDIP-se
qによってそれぞれ変異およびメチル化を独立してプロファイリングした。
【0141】
腫瘍から得る事前の知識なしにHPV陰性HNSCCにおけるctDNA検出の感度を
評価するために、本発明者らはまず、ベースライン血漿試料における変異の存在量を測定
した(図2A)。CAPP-Seqを、HNSCC関連変異の数を最大化するように設計
された配列決定パネルを用いて行った(表3および図10)。本発明者らはまた、バック
グラウンド塩基置換エラーを除去するために、確立されたエラー抑制方法論を採用した。
【表5】
【0142】
10~30ngのインプットDNAを利用する、CAPP-Seqによる診断時のHN
SCC患者および健常なドナーからの血漿およびPBL試料をプロファイリングした。低
い存在量でのctDNAの高感度検出を達成するために、本発明者らは、HNSCCにお
ける検出された変異の数を最大化するように最適化されたCAPP-Seqセレクタを適
用した(表2および図10)。本発明者らは、統合デジタルエラー抑制(iDES)によ
って分析感度をさらに改善し、カスタム分子バーコードを組み込み、健常なドナー血漿試
料(方法)内で同定されたバックグラウンド塩基置換エラーを除去した。
【表6】
【0143】
血漿プロファイリングおよび可能性のある生殖系列変異の除去に基づいて候補の体細胞
一塩基変異体(SNV)を選択した後、本発明者らは、適合したPBLプロファイルとの
比較によってクローン造血(CH)による潜在的偽陽性を特性評価した。同定可能な候補
のSNVを有する24人の患者のうち、10人が、高度に相関する変異対立遺伝子画分(
MAF)を有する一致したPBLプロファイル内で同一のSNVを示した(R=0.94
、p=1.392e-07図2B)。PIK3CAを除いて、これらのSNVを有する
遺伝子は各患者に固有であった(図2C)。DNMT3A、TET2、およびASXL1
などのCHによって一般に影響を受ける遺伝子はCAPP-Seqセレクタ内に含まれな
かったので、一致したcfDNAおよびPBL試料内の患者固有のSNVの本発明者らの
知見は、遺伝子レベルフィルタリングよりもこのアプローチの利点をさらに強調する。4
人の患者から得た血漿試料は、CHに由来するSNVについて厳密に陽性であり(図2D
)、一致したPBLプロファイリングが、低い存在量のctDNAの偽陽性検出を大幅に
最小化し得ることを示唆している。
【0144】
CHを潜在的に反映する候補のSNVを除去した後、ctDNAを20人の患者の血漿
内で検出した(中央値[範囲]:患者1人あたり3[1~10]のSNV)。これらのS
NVの妥当性を評価するために、本発明者らは、結果を、The Cancer Gen
ome Atlas(TCGA)によって公表された279個のHNSCC腫瘍からの全
エクソーム解析データと比較して45、TP53(65%対72%)、PIK3CA(2
0%対21%)、FAT1(15%対23%)およびNOTCH1(10%対19%)を
含む高頻度変異遺伝子における類似性を観察した(図2E)。興味深いことに、2人の患
者は、これらの遺伝子の中で見られない単一のSNVを示し(GRIN3AおよびMYC
図11)、ctDNAの検出感度を高めるための未知/非ドライバ効果の遺伝子プロフ
ァイリングの付加的な有用性を実証した。
【0145】
SNVの平均MAFに基づいてctDNA存在量を計算すると、ctDNAレベルは0
.14%~4.83%の範囲であった(図2F)。この検出下限は、約0.14%と推定
される、腫瘍ナイーブCAPP-Seq分析を利用する他の者によって以前に記載された
ものと類似している。検出不能なctDNAを有する患者を含めて、本発明者らのHNS
CCコホートにわたるctDNA存在量の中央値は0.49%であり、CAPP-Seq
によって限局性NSCLCにおいて観察されたものと類似していた。
【0146】
ベースライン血漿からのメチル化ベースのctDNAの腫瘍ナイーブ検出
次に、本発明者らは、HNSCCおよび健常対照試料におけるctDNA関連メチル化
パターンを定義しようとした。CAPP-Seqの結果は、PBLから生じる偽陽性変異
の影響を示したので、本発明者らは、偽陽性ctDNA関連メチル化の減少が、PBL由
来のDNAメチル化シグナルの除去によって達成され得ると推論した。したがって、本発
明者らは、セルフリーDNAメチル化シグナルへの寄与を抑制するために、HNSCCお
よび健常対照試料からの一致したPBL MeDIP-seqプロファイルを使用し(図
3A)、一致したPBLの分析がまた、メチル化ベースのctDNA検出も可能にし得る
かどうかを評価した(図3A)。治療前のHNSCCおよび健常なドナーの血漿ならびに
PBLを、5~10ngのインプットDNAを利用し、cfMeDIP-seqによって
、プロファイリングした。前に記載されたように、メチル化の存在量を、100万あたり
のキロベース(RPKM)(方法)のリードに対して正規化されたリードカウントで、染
色体1~22にわたる重複しない300bpウィンドウ(n=9,603,454ウィン
ドウ)で定義した。
【0147】
メチル化プルダウンのために利用される抗5mC抗体は、CpGアイランドを含む増加
するCpG密度でDNA断片に優先的に結合するので、本発明者らは、この相互作用を最
初に特性評価して、cfMeDIP-seqデータ内で高度に表される可能性が高い領域
を同定した。本発明者らはまた、MeDIP-seqをHNSCC細胞株FaDuに適用
して、がん由来メチル化DNA断片の優先的な結合を評価した。様々な数のCpGを有す
るウィンドウにわたってDNA断片プルダウン存在量(RPKMの中央値)を比較すると
、本発明者らは、PBLおよびFaDuの両方について最大8CpG以上の濃縮の増加を
観察した(図12Aおよび図12B)。FaDuは、300bpウィンドウあたり8Cp
G以上で、PBLと比較してより大きな濃縮を示した。この結果は、FaDuを含むがん
細胞におけるCpGアイランドの過剰メチル化の確立された現象と一致している。これら
の観察に基づいて、本発明者らは、8以上のCpG(n=702,488)を有するウィ
ンドウがctDNA検出に最も情報があり得、そのためその後のすべての分析に利用され
たと判定した。
【0148】
限局性がんを有する患者の場合、血漿のセルフリーDNAの大部分はPBLに由来する
。したがって、本発明者らは、セルフリーDNAシグナルへのこの寄与を生物情報学的に
抑制するためにPBL MeDIP-seqプロファイルを利用しようとした。本発明者
らは、HNSCCおよび健常なドナーcfDNAから作製されたcfMeDIP-seq
プロファイル内の各ウィンドウについてのRPKMの値を、FaDu(1×1の比較)、
対になっていないPBL(1×51の比較)または対になったPBL(1×1の比較)か
ら作製されたMeDIP-seqプロファイルと比較した。血漿のセルフリーDNAの主
な寄与因子であるPBLによれば、ゲノムワイドのメチル化プロファイルは、血漿のセル
フリーDNAと、対になったまたは対になっていないPBLとの間で高度に相関していた
(それぞれ最頻値R=0.92およびR=0.91)。これらの相関の強さは、血漿のc
fDNAに対するPBLの既知のサイズ外の寄与を反映している可能性が高い。対照的に
、血漿のセルフリーDNAとFaDuとの間の相関はより弱かった(最頻値R=0.78
)(図3B)。
【0149】
優先的プルダウンを考慮しながら、PBLにわたるメチル化の減少の閾値を選択するた
めに、本発明者らは、MeDEStrand Rパッケージ(方法)によるロジスティッ
ク回帰モデリングに基づいて、PBL cfMeDIP-seqプロファイルを絶対的な
メチル化レベル(0~1)にスケーリングおよび正規化した。本発明者らは、健常なドナ
ーのPBLにわたって0.1未満の絶対的なメチル化の中央値を示す99,997個のウ
ィンドウを選択した。これらのウィンドウを、除外されたHNSCC PBLに適用した
とき、本発明者らは、利用された健常なドナーのPBLの絶対的なメチル化分布と同様の
絶対的なメチル化分布を観察し(図3B)、このアプローチの一般化の可能性を実証した
。同様に、これらのウィンドウのいずれも個々には、健常なドナーのPBLと比較してH
NSCCのPBLにわたって有意に高いメチル化を示さず(図3Cおよび図12B)、c
tDNA検出を混乱させ得るHNSCC特異的PBLメチル化のあらゆる供給源を制限し
た。換言すれば、これらの結果は、対照および局所的に限定されたHPV陰性HNSCC
血漿の両方におけるcfDNAメチル化の主な源がPBLに由来し、PBL由来のメチル
化の生物情報学的除去がctDNAの定量化を混乱させたシグナルを制限し得ることを確
認する。
【0150】
治療前のメチル化ベースのctDNAの腫瘍ナイーブ検出
HNSCCコホート内の一般的なctDNA由来の過剰メチル化領域を同定するために
、本発明者らは、HNSCC患者と、CAPP-Seqによる検出可能なctDNA(n
=20)とを、健常なドナーと比較する、差次的メチル化分析を行った。PBLにおける
メチル化のために枯渇される99,994個の300bpウィンドウを利用して、本発明
者らは、20人のHNSCC患者をCAPP-Seq-検出可能なctDNAと20人の
健常対照と比較することによって、ctDNA由来の差次的メチル化領域(DMR)を同
定した。総じて、本発明者らは、HNSCC試料全体で997個の差次的メチル化領域(
DMR)(過剰メチル化:941、低メチル化:56)を同定した(図3C)。過剰メチ
ル化領域(過剰DMR)の半分程度が互いに直接隣接していることが見出され、過剰メチ
ル化のブロックは最大1800塩基対の長さに及んだ(図13A)。これらのデータは、
同定された過剰DMR内のCpGアイランドが存在することを示唆している。逆に、隣接
する低メチル化領域(低DMR)は観察されなかった。300bpの過剰DMRのうち、
47.5%は、長さが1800bpにまで及ぶ過剰メチル化シグナルの連続したブロック
に存在し(図13A)、典型的には長さが300~3000bpに及ぶCpGアイランド
を示した。実際、CpGアイランドは、過剰DMRについて有意に濃縮されていた(図3
E)。対照的に、低DMRについてはCpGアイランドが有意に枯渇した(図13B)。
【0151】
これらの過剰DMRが実際にCpGアイランドについて濃縮されているかどうかを判定
するために、本発明者らは次に、置換分析(方法)によってCpGアイランド、ショア、
shelf、およびopen seaについて、過剰DMRの濃縮を評価した。予想され
るように、CpGアイランドの有意な濃縮、ならびにショアおよびopen seaの有
意な枯渇が、過剰DMR内で観察された(図3E)。対照的に、低DMRは、がん全体で
頻繁に観察されるCpG-スパース領域の低メチル化に従って、open seaが有意
に濃縮され、CpGアイランドが枯渇していた(補足図5B)。
【0152】
最後に、特定の領域のメチル化は、cfMeDIP-seqを使用して以前に記載され
たように起源の組織を区別し得るので、本発明者らはまた、過剰DMRがHNSCCまた
は他のがんに特異的な領域を含むかどうかを調べた。腫瘍特異的メチル化領域を同定する
ために、本発明者らは、TCGA(方法)によってもたらされる原発腫瘍から生成された
HumanMethylation450K(hm450k)のデータを利用した。浸潤
性乳癌(BRCA)、結腸腺癌(COAD)、肺扁平上皮癌(LUSC)、前立腺腺癌(
PRAD)、HNSCC、膵臓腺癌(PAAD)、およびPBL由来の原発腫瘍を比較し
て、本発明者らは、BRCA、COAD、PRAD、およびHNSCC(方法)に特異的
な十分な過剰メチル化CpG(≧50)を同定した(図14)。予想通り、本発明者らは
、HNSC特異的過剰メチル化CpGと重複する血漿由来DMRの有意な濃縮、ならびに
BRCA、COADおよびPRAD特異的過剰メチル化CpGにわたる重複の有意な枯渇
を観察し(図3F)、このことは、過剰DMRが、様々な他のがんのタイプと比較した場
合にHNSCC起源に特異的な領域を含むことを示唆している。
【0153】
変異ベースとメチル化ベースのctDNA検出は特に一致している
いっそう多くの研究が、血漿のセルフリーDNAの健常な源と比較して、減少した断片
の長さに関連するctDNAを記載しており、ロバストな腫瘍ナイーブ検出のためのさら
なるメトリックが得られている。標的化された配列決定が、低下した断片の長さでctD
NAを検出することが以前に示されているので、本発明者らはまず、本発明者らのCAP
P-Seqプロファイルを利用して、本発明者らがHNSCC患者において同様の傾向を
観察し得るかどうかを判定した。患者ごとに同定された各SNV(図2E)について、S
NV対立遺伝子ならびに重複する参照対立遺伝子を含む断片の長さの中央値を測定した。
患者の試料の中で複数のSNVが同定された場合については、すべてのSNVおよびそれ
らの参照対立遺伝子にわたる中央値を使用した。以前の知見によれば、本発明者らは、患
者全体で健常なセルフリーDNAと比較してctDNA断片のサイズの一貫した減少を観
察した(中央値[範囲]Δ=-17.5[1~58]bp)(図4A)。これらの変異の
平均MAFと断片の長さとの間に有意な関連はなかった(図15A)。
【0154】
亜硫酸水素塩ベースのDNAメチル化アプローチとは異なり、cfMeDIP-seq
はDNAの分解を引き起こさず、したがって元の断片サイズ分布を維持する。これは、D
NAメチル化および断片の長さを同時にマッピングする新規な機会を提供する。各患者に
ついて以前に同定された血漿由来過剰DMR内の断片の長さの分布を評価した。これらの
領域が本発明者らの健常なドナーにわたる低いメチル化を有するという性質のために、ド
ナーにわたるDNA断片を、比較のために組み合わせた。変異に基づく分析と同様に、本
発明者らは、グループ化された健常対照と比較して、19/20のCAPP-Seq陽性
患者からの断片の長さの減少を観察した(中央値[範囲]Δ=-7[1~21]bp)(
図4B)。これは、おそらく過剰DMR内のセルフリーDNA断片の健常な組織による部
分的な寄与のために、変異ベースの分析と比較して断片の長さの減少が小さいことを示し
た。この考えを裏付けて、最も短い過剰DMR断片を有する試料は、より高いメチル化c
tDNA存在量(ピアソンr=-0.64、p=0.002)を示した(図15B)。小
さい断片(100bp~150bp)対大きい断片(151bp~220bp)の比を本
発明者らの過剰DMR、ctDNAを濃縮するための以前に記載されたアプローチ、のた
めに使用したとき、本発明者らは、大部分のCAPP-Seq陽性HNSCC試料にわた
ってctDNAの濃縮の同様の傾向を観察した(中央値[範囲]=28[-8~63]%
)(図4C)。
【0155】
本発明者らのHNSCCコホートにおいて同定された血漿のセルフリーDNA過剰DM
Rがこれらの小さな断片(100~150bp)内の個体にわたりどのように異なり得る
かを評価するために、本発明者らは最初に階層的クラスタリングを行った。4つの主要な
クラスターがConsensusClusterPlus Rパッケージを利用して出現
し、それぞれが過剰DMRにわたって異なるレベルのメチル化を有した(図4Eおよび図
16C)。同様に、3つのクラスターは、CAPP-Seq(図16D)によって判定さ
れるような別個のctDNA存在量によって定義され、これは、過剰DMRメチル化の平
均と変異に基づくctDNAの存在量との間の潜在的な関係を示唆している。
【0156】
次に、本発明者らは、断片の長さがCAPP-SeqおよびcfMeDIP-seqの
両方によって同定されたctDNA分子間で一致するかどうかを調査し、本発明者らのマ
ルチモーダルアプローチに対する検証のさらなる層を潜在的にもたらす。バックグラウン
ドDNA断片がcfMeDIP-seqプロファイル内のctDNAの計算された断片の
長さを混同させる可能性を最小限に抑えるために、本発明者らは、過剰DMR全体でメチ
ル化レベルの中央値を超える患者(n=10人のHNSCC患者)に分析を限定した。驚
くべきことに、完全に異なるゲノム領域がこれらの2つのプロファイリング手法を用いて
表されているにもかかわらず、ctDNA断片の長さは、各患者についての対となったC
APP-SeqプロファイルとcfMeDIP-seqプロファイルとの間で非常に一致
していた(図4C)(ピアソンr=0.86、p=0.0016)(CAPP-Seq:
43個の異なる変異、cfMeDIP-seq:941個の過剰DMR)。
【0157】
過剰DMRメチル化レベルと変異ベースのctDNA存在量との間の関係をさらに特性
評価するために、本発明者らは、941の過剰DMRにわたるRPKMの平均値を、各患
者についてCAPP-Seqによって判定されたMAFの平均値と比較した。メチル化ク
ラスター間で観察された傾向と同様に、本発明者らは有意な正の相関(ピアソン相関、R
=0.85、p=5e-10)を観察した(図4F)。cfMeDIP-seqによるこ
れらの過剰DMR内のctDNA検出の感度を評価するために、本発明者らは、本発明者
らのHNSCCコホートと健常なドナーとの間のRPKMの平均値を比較した。CAPP
-Seq陽性患者(n=20)については、ctDNA検出は特に一致しており(AUC
=0.998)、CAPP-Seq陰性患者(n=12)の組み込み時にパフォーマンス
がわずかに低下した(AUC=0.944)(図4G)。CAPP-Seq陽性患者およ
び健常なドナーにわたる交差検証(n=50サンプリング)の結果、0.984のAUC
中央値がもたらされ(図16A)、本明細書に開示されるアプローチのロバスト性が実証
された。
【0158】
これらの観察に基づいて、本発明者らは、短縮された長さのセルフリーDNA断片に分
析を限定することによって、cfMeDIP-seqプロファイル内でctDNAを濃縮
し得るかどうかを評価した。本発明者らは、非メチル化ベースのアプローチを使用してc
tDNAを濃縮する同様の方法が記載されているので、小さい(100~150bp)断
片からなる過剰DMR内のセルフリーDNA断片の割合を評価した。実際、これにより、
CAPP-Seq陽性HNSCC試料の大部分(中央値[範囲]=28[-8~63]%
)にわたってctDNA濃縮がもたらされたが、健常対照のいずれについてももたらされ
なかった(図4D)。したがって、セルフリーDNA断片のインシリコのサイズ選択は、
cfMeDIP-seqライブラリ内のctDNAを濃縮し、腫瘍ナイーブマルチモーダ
ルctDNA分析に寄与し得る。
【0159】
限局性非転移性がんを有する患者において、診断時のCAPP-SeqによるctDN
Aの検出は、予後不良に関連することが以前に記載されている。同様に、SHOX2およ
びSEPT9のメチル化によって評価されるctDNAのレベルは、HNSCCにおける
予後不良と関連している。したがって、本発明者らは、診断時のCAPP-Seqおよび
cfMeDIP-seqによるctDNAの検出または定量化が本発明者らのHNSCC
コホート内の臨床転帰と関連するかどうかを尋ねた。実際、CAPP-Seq(すなわち
、CAPP-Seq陽性対CAPP-Seq陰性)によるctDNAの検出(ハザード比
[HR]=7.6、ログランクp=0.026;補足図8D)、ならびに本発明者らが以
前に同定した過剰DMR内のメチル化の増加(すなわち、メチル化クラスター1+2+3
対メチル化クラスター4)(HR=4.51、p=0.038;図4G)は、生存期間の
短縮と相関していた。この知見と一致して、過剰DMRにわたる平均RPKMは、がんの
ステージと相関した(補足図8E)。
【0160】
次に、本発明者らは、変異またはメチル化に基づくプロファイリングのいずれかによっ
て同定されたctDNAの断片の長さの中央値を比較した。バックグラウンドDNA断片
がcfMeDIP-seqプロファイル内のctDNAの計算された断片の長さを混同さ
せる可能性を最小限に抑えるために、本発明者らは、階層的クラスタリングによって定義
されるように高いctDNA存在量を有する患者を選択した(すなわち、メチル化クラス
ター1および2、図4D、補足図8A~B)。このアプローチでは、完全に異なるゲノム
領域がこれらの2つのプロファイリング手法を用いて表されているにもかかわらず、ct
DNA断片の長さは、各患者について対となったCAPP-SeqプロファイルとcfM
eDIP-seqプロファイルとの間で特に一致していた(R=0.83、p=0.00
16)(図4H)。さらに、すべての長さの断片を用いた本発明者らの分析と同様に、本
発明者らは、CAPP-Seq(R=-0.79、p=0.0038)による小さい断片
比とctDNA断片の長さとの間で同じ関係を観察した(図4I)。
【0161】
これらの結果は、CAPP-SeqおよびcfMeDIP-seqによって検出される
ctDNAから観察される断片の長さの同様の減少が、ゲノム領域によるのではなく、腫
瘍の固有の特性の結果であり得ること、およびより短い断片の長さを利用することがct
DNAのより特異的な同定に寄与し得ることを示唆している。
【0162】
予後の判定のためのマルチモーダルctDNA検出の適用
腫瘍ナイーブマルチモーダルctDNA分析の潜在的な臨床応用を評価するために、本
発明者らは、HNSCCコホートにおいてctDNAを臨床転帰と比較した。断片の長さ
の情報に基づくcfMeDIP-seqプロファイルは、一致したCAPP-Seqプロ
ファイルにおいてMAFと強く関連し(ピアソンr=0.85、p=3×10-9)、9
41個の過剰DMR内のメチル化強度が実際にctDNAの存在量を反映していることを
示唆した(図5C)。重要なことに、交差検証分析により、ctDNAを検出するための
これらの過剰DMRのロバスト性が確認された(図16C)。変異およびメチル化に基づ
く方法の両方によってベースラインの血漿において検出されたctDNAを有する患者(
n=19)は、検出可能なctDNAを有していない患者(n=8/13)と比較した場
合、進行した疾患(すなわち、ステージIII-IVA)を有する可能性が有意に高く(
n=18/19)(フィッシャーの正確検定p=0.028)、劇的に不良な全生存率を
示した(ハザード比[HR]=7.55、95%信頼区間[CI]=[0.95~59.
94]、ログランクp=0.025)(図5G)。比較すると、ステージのみでは、より
不良な全生存(HR=2.59、95%CI=[0.32~20.46]、ログランクp
=0.35)の患者を予測することができず(図16D)、マルチモーダルctDNAプ
ロファイリングの潜在的な臨床的有用性がさらに実証された。
【0163】
がんドライバの遺伝子発現および結果として生じる機能活性に対するDNAメチル化の
既知の効果のために、本発明者らは、特定の遺伝子座におけるctDNAメチル化パター
ンがctDNA存在量とは無関係に予後の有意性を有し得ると推論した。本発明者らの以
前に同定された過剰DMRが、ctDNA存在量とは無関係に予後と関連する特定の領域
を含むかどうかを評価するために、本発明者らは、入手可能なすべてのHNSCC患者(
n=520)についてTCGAによって得られるDNAメチル化、RNA発現および臨床
転帰データを調べた(図5C)。最初に、本発明者らは、TCGA hm450kメチル
化アレイデータから異なる300bpウィンドウ内に含まれるすべてのCpGにわたるβ
の平均値を計算した。分析を、血漿由来過剰DMRと重複するプローブhm450k領域
(n=764/941)に限定して、本発明者らが隣接する正常組織(n=50)と比較
して原発腫瘍(n=520)の483個の過剰メチル化領域を同定した(ウィルコクソン
検定、FDR<0.05、log2FC>1)。本発明者らは、HNSCCならびにTW
IST1およびONECUT2で以前に評価されたSEPT9およびSHOX2を含む、
市販のメチル化ベースのctDNA診断試験によってプロファイリングされた遺伝子内の
CpGの近くに、これらの過剰メチル化領域のいくつかが重複しているかまたは位置して
いることを観察した(図17A)。これらの結果から、本発明者らの血漿由来過剰DMR
の潜在的な臨床的関連性を支持するさらなる証拠が得られる。
【0164】
本発明者らのHNSCCコホートおよびTCGAのHNSC hm450kのプロファ
イルによって共通して保持されるこれらの過剰メチル化領域の潜在的な臨床的有用性をさ
らに調べるために、本発明者らは、利用可能なhm450kのプロファイルおよび疾患特
異的生存(DSS)転帰であるすべてのTCGAのHNSCC患者にわたって単変量コッ
クス比例ハザード回帰を行った(n=493/520)。本発明者らは、DSSと有意に
関連する33の領域を同定した(p<0.05)。腫瘍形成において機能的役割を有する
可能性が高い予後領域をさらに選択するために、本発明者らは、各領域(n=33)のメ
チル化レベルを2kb内の周囲の遺伝子転写物の発現と比較した。次に、本発明者らは、
TCGAのHNSCCコホートを使用して、(1)多変量Cox回帰における予後および
(2)隣接遺伝子転写物の発現に関連する483個のDMRのサブセットを同定した。5
つの領域が両方の基準を満たすように同定され、各領域のメチル化が増加すると、ZNF
323/ZSCAN31、LINC01391、およびGATA2-AS1のより高い発
現がもたらされ(図5G図17A図17C、またSTK3/MST2およびOSR1
のそれぞれのより低い発現がもたらされた(図5H)(図5D)。メチル化の結果として
の発現の減少および増加に関連する領域は、それぞれプロモーターまたは第1のエクソン
/イントロンおよび遺伝子本体内に存在することが見出された。本発明者らは、これらの
5つの領域から複合メチル化スコア(CMS)を構築し(表6)、このスコアに従ってT
CGAのHNSCCコホートを層別化した(図5E)。より高いCMSは、劣った生存転
帰と有意に関連していた(HR=1.67、95%CI=[1.25,2.21]、ログ
ランクp=3.4×10-4)。
【0165】
最後に、本発明者らは、ctDNAに適用した場合にCMSかた同様の予後情報が得ら
れるかどうかも評価した。ctDNAを濃縮するために、cfMeDIP-seqライブ
ラリの分析を、上記のように100~150bpの長さの断片に限定した(図4E)。5
つの推定予後マーカーによって得られるctDNAメチル化レベルの相対的な寄与を説明
するために、本発明者らは、これらの領域からのcfMeDIP-seqのRPKMの値
を941個の過剰DMR全体に正規化した。これは、より高いCMSがより不良な生存と
わずかに関連するという同様の傾向をもたらし(ログランクp=0.1;HR=3.06
)(図5F)、このことは、TCGAから同定されたこれらの推定予後領域のメチル化の
増加がまた、cfMeDIP-seqプロファイル内で情報があり得ることを示唆してい
る。さらに、これらの結果は、バイオマーカー発見のために、血漿のセルフリーDNAメ
チロームプロファイリングを既存のマルチオミックのがんデータベースと組み合わせてど
のように活用できるかを強調している。
【0166】
cfMeDIP-seqによる最終治療後の疾患の監視
cfMeDIP-seqがHNSCC患者において高感度かつ定量的なctDNA検出
を達成したので、本発明者らは、CAPP-seqと同様に、cfMeDIP-seqも
ctDNA存在量の治療関連変化をモニタリングすることができる可能性があると推論し
た。治療後のcfMeDIP-seqプロファイル内のctDNAのパーセントを定量す
るために、本発明者らは、以前に同定された血漿由来の過剰DMR(n=941)にわた
って平均RPKMの線形変換を適用し、ctDNAをさらに濃縮するために100~15
0bpの間の断片のサイズを制限した。すべての健常対照にわたって観察されたRPKM
の平均値の最大値に基づいて、0.2%のctDNAの検出閾値を計算した。1つまたは
複数の利用可能な治療後試料のCAPP-Seq陽性のHNSCC患者(n=20)につ
いては、10ngのインプットcfDNAを利用してcfMeDIP-seqを行った。
【0167】
治療全体にわたるctDNA存在量の変化を測定すると、本発明者らは、完全クリアラ
ンス(CC)、部分クリアランス(PC;90%を超える低下)またはクリアランスなし
(NC)を示す様々な動態を観察した(図6A 補足図10)。18人の適格患者のうち
、5人(28%)がクリアランスなしを示した(図6B)。クリアランスなしの患者は、
完全または部分的クリアランスの患者と比較して、疾患の再発を経験する可能性が高かっ
た(HR=8.73、95%CI=[1.5、50.92]、ログランクp=0.004
6)(図6C)。興味深いことに、診断時と比較して、最後の試料採取時にctDNA存
在量がより多いすべての患者が、疾患の再発を示した。さらに、この群内で疾患の再発が
実証されなかった唯一の患者が、追跡不能になったが、原因不明で治療後1年以内に死亡
した。cfMeDIP-seqによる検出不能な処置後ctDNAを有する13名の患者
については、9名が無病のままであり、追跡調査の中央値は44.4ヶ月であった(最低
値=12.2、最大値=58.7)。他の4人の患者のうち、一人は所属リンパ節内に持
続性疾患を有し、他の人は最後の採取後3.5~7.7ヶ月(中央値7.4ヶ月)で再発
を経験した。注目すべきことに、検出不能な治療後ctDNAを有する患者間のこれらの
再発は、最後の収集後に検出可能な治療後ctDNA(中央値[範囲]:3.0[1.7
~5.2]ヶ月)を有する患者間の4つの再発と比較してかなり遅延した。まとめると、
これらの結果は、cfMeDIP-seqによる血漿のセルフリーDNAメチロームプロ
ファイリングを使用して、根治的治療に対する応答を評価し、急速な再発のリスクが高い
患者を同定することができることを実証している。
【0168】
考察
臨床現場におけるctDNAの広範な実施は、患者全体におよび腫瘍物質の非存在下で
適用することができる方法によって加速され得る。記載される研究において、本発明者ら
は、低ctDNAのHNSCC患者の探索コホート内でのctDNAの腫瘍ナイーブ検出
のためのマルチモーダルゲノムワイドセルフリーDNAプロファイリング技術の能力を評
価した。本発明者らは、一致したPBLの取り込みが、両方の変異(すなわち、CAPP
-Seq)ならびにDNAメチル化(すなわち、cfMeDIP-seq)を使用してc
tDNA検出を改善することを示す。さらに、検出可能および検出不可能なctDNAを
有する患者を層別化するために、CAPP-Seqを利用することによって、本発明者ら
は、ctDNA由来のメチル化パターンのロバストな同定を達成した。本発明者らは、腫
瘍起源(すなわち、断片の長さの短縮)を反映する血漿のセルフリーDNAの生物物理学
的特性が分子異常および検出プラットフォームにわたって保存されていることを初めて示
した。腫瘍ナイーブctDNA検出および定量化は複数の臨床用途を見出し、ctDNA
の存在量およびメチル化パターンの予後関連を調査する。
【0169】
腫瘍ナイーブctDNA検出は、現在、低いctDNA存在量のためにいくつかの制限
に遭遇する。最近の研究では、ctDNAの偽陽性検出の主な原因であるクローン造血に
由来する変異を同定するために、対になったPBLおよび/または健常対照血漿がプロフ
ァイリングされている。しかし、直交メトリックの組み込みは、精度および臨床適用性を
さらに改善することができる。ここで、本発明者らは、低いctDNA存在量を有するH
NSCC患者のコホート内での腫瘍ナイーブctDNA検出のためのマルチモーダルゲノ
ムワイドセルフリーDNAプロファイリング技術の能力を評価した。本発明者らは、変異
ベースおよびメチル化ベースのプロファイリング方法によって検出されたctDNAメト
リック(存在量および断片の長さ)間の高度な一致を実証した。さらに、本発明者らは、
腫瘍ナイーブマルチモーダルctDNAプロファイリングが、ctDNA存在量とは無関
係の推定予後バイオマーカーを同定することによって、ならびに連続試料中のctDNA
存在量をモニタリングすることによって値を提示し得ることを示した。
【0170】
ctDNAの腫瘍ナイーブ検出は、研究および臨床の両方の状況において多くの実用的
な利点を有する。最近の研究では、感度を改善するために、初期疾患における低い存在量
で同定されたctDNA由来領域の検証のために一致した腫瘍プロファイリングが利用さ
れている。しかし、これらのアプローチの1つの制限は、腫瘍のサンプリング不均一性に
起因して失われる情報領域の数であり、これは、以前にサンプリングされていないサブク
ローンに由来する処置後ctDNAに適用された場合にさらに悪化し得る。さらに、これ
らの腫瘍の情報に基づく検出方法の臨床的利点は、非侵襲性液体生検の主な強度の1つを
回避して、生検によって容易に入手可能ながんに限定される。腫瘍ナイーブマルチモーダ
ルプロファイリング戦略を利用することによって、本発明者らは、腫瘍の情報に基づく方
法の欠点なしに早期がんにおいて同様の結果を達成した。
【0171】
これは、限局性がん患者のコホートからのctDNAの包括的検出のために変異および
メチル化プロファイリングを利用する最初の研究である。このマルチモーダルプロファイ
リングアプローチを他のがんのタイプおよび疾患状況に拡張することは、液体生検の継続
的な開発にとって重要である。さらに、HNSCCにおける多数のctDNA研究が、変
異、メチル化またはHPVプロファイリングに基づく検出方法を利用して記載されている
が、本発明者らは、これまでに知られている標的(すなわち、TP53変異またはSEP
T9/SHOX2メチル化)を同定するゲノムワイド変異/メチル化プロファイリング法
の最初の適用を、より少ない/未調査の標的に加えて記載した。
【0172】
ctDNAの腫瘍ナイーブ検出は、研究および臨床の両方の状況において多くの実用的
な利点を有している。腫瘍変異プロファイリングは、低い存在量でctDNA検出のため
の患者特異的マーカーを同定することができるが、そのような個別化アプローチは、十分
な変異の負荷を有するがんのタイプから得る高純度腫瘍試料に依存する。個別化アッセイ
設計のための変異プロファイリングは、費用および時間がかかる可能性があり、また、原
発腫瘍内または転移性クローンにわたるゲノム不均一性の説明をとなることがまれである
。さらに、腫瘍組織へのアクセスに依存するctDNA検出方法は、非侵襲性液体生検の
重要な利点を減少させる。独立したセルフリーDNA特性を統合することにより、本発明
者らは、腫瘍の情報に基づく方法の欠点なしに、初期段階のがんにおける高感度のctD
NAの検出を達成した。
【0173】
本発明者らの分析では、本発明者らは、cfMeDIP-seqを使用してctDNA
由来のメチル化パターンを同定するために、CAPP-Seqによって、検出可能なct
DNAを有する患者を選択した。このアプローチにより、本発明者らのコホートにおける
血漿のセルフリーDNAの腫瘍由来の性質のさらなる検証がなされた。ctDNAメチル
化パターンは、ctDNA変異と同様の方法でctDNAの存在量を定量することができ
た。さらに、メチル化パターンは、腫瘍起源を明らかにし、推定予後および動的バイオマ
ーカーを同定した。CAPP-SeqとcfMeDIP-seqとの組み合わせは、低い
存在量ctDNAの詳細な分子的な特性評価を可能にした。変異に基づくctDNA定量
化は、血漿中のHNSCC特異的過剰DMRの発見に寄与し、その一部はctDNA存在
量を調整した後でも予後であることが確認された。したがって、変異およびメチル化の同
時プロファイリングは、定量的、組織特異的、および予後のctDNAバイオマーカーを
明らかにすることによって、互いに補完することができる。さらに、メチロームプロファ
イリングは、再発性またはクローン性変異がほとんどないがんのタイプにおいて特に有用
であることを判明し得る。
【0174】
以前の研究と同様に、本発明者らはまた、変異およびメチル化ベースのアプローチの両
方を使用して、健常なドナーのセルフリーDNAと比較しながら、ctDNA断片の長さ
の減少を観察した。一貫して平均的な約166~167bpである健常なセルフリーDN
Aとは異なり、患者間のctDNAの長さは非常に可変であり得る。ctDNA断片の長
さに影響を及ぼす因子としては、位置依存的断片化49、転移性疾患対非転移性疾患73
、ならびに健常なセルフリーDNA断片化に関与する様々な細胞内/細胞外DNaseの
調節不全動態74が挙げられ得る。興味深いことに、本発明者らは、両方の技術が異なる
領域および腫瘍由来の異常を探査しているにもかかわらず、CAPP-Seqおよびcf
MeDIP-seqによって同定されたctDNAの断片の長さ間の高い一致を、適格な
患者について観察した。これらの説得力のあるデータで、がん患者における血漿のセルフ
リーDNA断片化の関連性および再現性に関するさらなる証拠が得られる。
【0175】
本発明者らは、CAPP-Seqによる検出可能なctDNAまたはcfMeDIP-
seqによる上昇したctDNA存在量が、本発明者らのHNSCCコホート内の予後不
良と関連することを観察した。これらの結果は、メチル化によるctDNAの検出56
ならびにコピー数収差による存在量の増加75またはHPV検出76が高いリスクの患者
を同定した以前のHNSCC ctDNA研究に従っている。腫瘍病期との不完全な関連
があり、腫瘍生物学の他の測定されていない特徴がctDNA存在量に寄与し得ることを
示唆している。
【0176】
本発明者らの知る限りでは、ctDNA検出/存在量とは無関係に、おそらく部分的に
は一般的に使用されるctDNA検出方法の制限のために、HNSCCのセルフリーDN
Aにおける予後領域を以前に同定した研究はない。本発明者らは、セルフリーDNAメチ
ロームプロファイルが、TCGAデータと併せて、HNSCCにおける新規予後メチル化
バイオマーカーを同定する発見ツールとして役立ち得ることを実証した。5つのDMRか
ら構成される複合体メチル化スコアは、メチル化検出プラットフォーム(hm450kお
よびcfMeDIP-seq)およびバイオスペシメンタイプ(腫瘍組織および血漿のセ
ルフリーDNA)にわたって一貫した予後関連性を実証した。本発明者らの知見を検証す
るためには将来より大きなコホートが必要であるが、この研究は、cfMeDIP-se
qによるメチル化領域のゲノムワイドな同定が、新規の予後バイオマーカーの発見を可能
にし得ることを示している。
【0177】
cfMeDIP-seqのパフォーマンスを、疾患の予後と関連して評価した。治療後
約0.2%超のctDNAのストリンジェントな閾値を検出可能な疾患として適用するこ
とにより、本発明者らは9人の患者のうち4人について疾患の再発を予測することができ
た。検出可能なctDNAを治療後に有することができなかった再発した(n=4)また
は持続性疾患を有した(n=1)残りの5人の患者について、本発明者らは典型的には再
発までの時間がより長いことを観察し、これらの時点でのctDNAの画分がcfMeD
IP-seqの検出の下限を下回っていた可能性があることを示唆した。腫瘍ナイーブ疾
患の監視のためにcfMeDIP-seqを利用するその後の研究では、治療後のより頻
繁な血漿の収集が、これらの限界に対処するのに役立ち得る。
【0178】
本発明者らは、限局性疾患およびHNSCCにおけるマルチモーダルプロファイリング
の潜在的な臨床的有用性を実証しているので、これらの方法は、様々ながんのタイプを有
する患者のための将来のバイオマーカー発見および最終的には臨床的有用性に寄与する。
この研究は、複数の顕著な貢献をしている。第1に、セルフリーDNA変異、メチル化お
よび断片の長さの分析を組み合わせていることである。さらに、本発明者らは、HNSC
C患者およびリスクが一致する健常対照の両方からの血漿試料および対にされたPBLを
、体系的にプロファイリングした。これらの分析は、ctDNAの検出および特性評価の
ためのマルチモーダルプロファイリングの最適な取り扱いに関する重要な洞察を明らかに
した。例えば、寄与するメチル化シグナルを白血球から除去し、断片の長さの特性を使用
して腫瘍由来のメチル化を濃縮する本発明者らの独自のアプローチは、将来の研究にとっ
て有用なものであることが判明するであろう。
【0179】
結論として、本発明者らは、ctDNAの腫瘍ナイーブCAPP-Seqプロファイリ
ングが、cfMeDIP-seqによるctDNA由来のメチル化の高い信頼性の同定を
可能にすることを実証する。cfMeDIP-seqによるエピジェネティックプロファ
イリングの強度を利用して、本発明者らはさらに、これらのctDNA由来メチル化領域
が腫瘍の起源、予後、および治療の反応のマーカーとしての可能性を実証することを示す
。本発明者らがHNSCCにおけるcfMeDIP-seqによるctDNA検出の改善
された感度について記載したいくつかのアプローチ、例えばPBL枯渇ウィンドウおよび
短い断片への分析の制限を組み込むことがまた、臨床的利益のために、様々な他の限局性
がんに適用され得る。開示されたフレームワークは、腫瘍組織の利用可能性が制限される
他の臨床状況に広く適用可能である。
【0180】
本発明の好ましい実施形態を本明細書で説明したが、本発明の精神または添付の特許請
求の範囲から逸脱することなく、本発明に変更を加えることができることは当業者には理
解されよう。以下の参考文献にあるものを含む、本明細書に開示されるすべての文書は、
参照により組み込まれる。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10
図11
図12
図13
図14
図15
図16
図17
図18
【手続補正書】
【提出日】2024-07-19
【手続補正1】
【補正対象書類名】特許請求の範囲
【補正対象項目名】全文
【補正方法】変更
【補正の内容】
【特許請求の範囲】
【請求項1】
対象のがん細胞から循環腫瘍デオキシリボ核酸(ctDNA)が存在することを検出す
る方法であって、
(a)前記対象からセルフリーデオキシリボ核酸(DNA)の試料を得る工程、
(b)前記試料をライブラリ調製に供して、前記セルフリーメチル化DNAのその後の
配列決定を可能にする工程、
(c)メチル化ポリヌクレオチドに選択的な結合剤を用いたセルフリーメチル化DNA
を捕捉する工程、
(d)前記捕捉されたセルフリーメチル化DNAを配列決定する工程、
(e)健常な個体およびがんの個体由来の対照のセルフリーメチル化DNA配列を用い
て、前記捕捉されたセルフリーメチル化DNAの前記配列をコンピュータ処理する工程、
および
(f)前記捕捉されたセルフリーメチル化DNAの1つ以上の配列とがんの個体由来の
セルフリーメチル化DNA配列との間に統計的に有意な類似性がある場合、がん細胞由来
のDNAの前記存在を同定する工程を含み、
(d)、(f)および(g)の少なくとも1つにおいて、前記対象のセルフリーメチル
化DNAは、断片の長さのメトリックに従って亜集団に限定される、方法。
【外国語明細書】