(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-18
(54)【発明の名称】無細胞DNA断片化を用いた肺癌の検出
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20240111BHJP
C12N 15/09 20060101ALI20240111BHJP
G01N 33/50 20060101ALI20240111BHJP
G01N 33/68 20060101ALI20240111BHJP
【FI】
C12Q1/6869 Z
C12N15/09 Z
G01N33/50 P
G01N33/68
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023537339
(86)(22)【出願日】2021-12-21
(85)【翻訳文提出日】2023-08-17
(86)【国際出願番号】 US2021064613
(87)【国際公開番号】W WO2022140386
(87)【国際公開日】2022-06-30
(32)【優先日】2020-12-21
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2021-06-04
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】518056003
【氏名又は名称】ザ ジョンズ ホプキンス ユニバーシティ
(74)【代理人】
【識別番号】100189131
【氏名又は名称】佐伯 拓郎
(74)【代理人】
【識別番号】100182486
【氏名又は名称】中村 正展
(74)【代理人】
【識別番号】100147289
【氏名又は名称】佐伯 裕子
(72)【発明者】
【氏名】ヴェルクレスク, ビクター
(72)【発明者】
【氏名】シャルプ, ロバート ビー.
(72)【発明者】
【氏名】マティオス, ディミトリオス
(72)【発明者】
【氏名】ファレン, ジリアン エー
(72)【発明者】
【氏名】ブルーム, ダニエル
(72)【発明者】
【氏名】クリスティアーノ, スティーブン
【テーマコード(参考)】
2G045
4B063
【Fターム(参考)】
2G045AA26
2G045CA26
2G045DA13
2G045DA36
4B063QA01
4B063QA13
4B063QA19
4B063QQ42
4B063QR08
4B063QR32
4B063QR62
4B063QS25
4B063QS34
4B063QS39
4B063QX02
(57)【要約】
肺癌検出のための無細胞DNA(cfDNA)断片化が、現在の画像化に基づくスクリーニング方法およびバイオマーカーと併用される。
【選択図】
図1A
【特許請求の範囲】
【請求項1】
対象における癌を診断する方法であり、
前記対象の生体試料から無細胞(cfDNA)を抽出すること、
前記抽出されたcfDNAおよびcfDNA断片の全ゲノム配列決定からゲノムライブラリーを生成すること、
前記cfDNA断片をゲノム起源にマッピングし、断片長を評価し、各試料についてゲノム規模の断片化プロファイルを得ること、
前記対象のタンパク質バイオマーカーを同定すること、
前記対象のcfDNA断片化プロファイルおよびタンパク質バイオマーカーを正常参照非癌対象と比較すること、および
対象における癌を診断すること、
を含む、方法。
【請求項2】
前記癌が肺癌である、請求項1に記載の方法。
【請求項3】
前記対象を低線量らせんコンピュータ断層撮影(LDCT)に供することをさらに含む、請求項1または2に記載の方法。
【請求項4】
肺癌を有すると診断された対象と正常な非癌対象とで臨床データを比較することをさらに含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記cfDNA断片の平均長およびプロファイルが、非癌個体間で類似している、請求項1~4のいずれか一項に記載の方法。
【請求項6】
癌対象のcfDNA断片プロファイルが変化する、請求項1~5のいずれか一項に記載の方法。
【請求項7】
1つまたは複数の腫瘍抗原、サイトカインまたはタンパク質の血清レベルが測定される、請求項1~6のいずれか1項に記載の方法。
【請求項8】
1つまたは複数の腫瘍抗原が測定され、前記1つまたは複数の腫瘍抗原が癌胎児性抗原(CEA)、CA19-9、CA 125、組織ポリペプチド抗原(TSA)、CYFRA-21-1、ニューロン特異的エノラーゼ、プロガストリン放出ペプチド(ProGRP)、血漿中カリクレインB1(KLKB1)、血清中アミロイドA、ハプトグロビン-アルファ-2、ADAM-17、オステオプロテゲリン、ペントラキシン3、フォリスタチン、腫瘍壊死因子受容体スーパーファミリーメンバー1Aまたはそれらの組み合わせを含む、請求項7に記載の方法。
【請求項9】
前記1つまたは複数のタンパク質が測定され、前記1つまたは複数のタンパク質がC反応性タンパク質(CRP)、キチナーゼ-3-様タンパク質1(YKL-40/CHI3L1)またはその断片を含む、請求項7または8に記載の方法。
【請求項10】
早期遮断のための断片のDNA評価(DELFI)が、DELFIスコアを生成するために行われる、請求項1~9のいずれか一項に記載の方法。
【請求項11】
非癌個体のDELFIスコアが約0.3未満である、請求項10に記載の方法。
【請求項12】
病期Iの癌のDELFIスコアが約0.3から0.5未満である、請求項10に記載の方法。
【請求項13】
病期IIの癌のDELFIスコアが約0.5から0.8未満である、請求項10に記載の方法。
【請求項14】
病期IIIの癌のDELFIスコアが約0.8から0.95未満である、請求項10に記載の方法。
【請求項15】
病期IVの癌のDELFIスコアが約0.95以上である、請求項10に記載の方法。
【請求項16】
病期Iの癌のDELFIスコアが約0.35である、請求項10に記載の方法。
【請求項17】
病期IIの癌のDELFIスコアが約0.75である、請求項10に記載の方法。
【請求項18】
病期IIIの癌のDELFIスコアが約0.9である、請求項10に記載の方法。
【請求項19】
病期IVの癌のDELFIスコアが約0.99である、請求項10に記載の方法。
【請求項20】
前記対象が癌治療を受ける、請求項1~19のいずれか一項に記載の方法。
【請求項21】
小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別する方法であり、
SCLC、NSCLCまたは白血球の生体試料での転写因子の発現変動を比較すること、
前記生体試料にて同定された転写因子の発現と比較して、より高い発現変動を有する少なくとも1つまたは複数の転写因子を選択すること、
前記対象の生体試料から無細胞(cfDNA)を抽出すること、
前記対象から得られた前記cfDNAのゲノムワイド断片化プロファイルを取得して、前記少なくとも1つまたは複数の転写因子結合部位を同定すること、
前記少なくとも1つまたは複数の転写因子結合部位のcfDNAカバレッジを評価して、非癌対象またはNSCLC対象と比較した断片のカバレッジおよびサイズを決定すること;を含み、それによって
小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別する、方法。
【請求項22】
前記少なくとも1つの転写因子が、Achaete-Scuteファミリー塩基性ヘリックス-ループ-ヘリックス転写因子1(ASCL1)である、請求項21に記載の方法。
【請求項23】
ASCL1結合部位を含む核酸配列中のcfDNA断片サイズが、NSCLCを有する患者または非癌対象と比較してSCLC患者において大きい、請求項22に記載の方法。
【請求項24】
ASCL1結合部位を含む核酸配列における集約断片カバレッジが、NSCLCを有する患者または非癌対象と比較してSCLC患者において減少している、請求項22に記載の方法。
【請求項25】
小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別する方法であり、
前記対象の生体試料から無細胞(cfDNA)を抽出すること、
Achaete-Scuteファミリー塩基性ヘリックス-ループ-ヘリックス転写因子1(ASCL1)結合部位のcfDNAカバレッジを評価して、非癌対象またはNSCLC対象と比較した断片カバレッジおよびサイズを決定すること、を含み、それによって
小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別する、方法。
【請求項26】
ASCL1結合部位を含む核酸配列中の前記cfDNA断片サイズが、NSCLCを有する患者または非癌対象と比較してSCLC患者において大きい、請求項25に記載の方法。
【請求項27】
ASCL1結合部位を含む核酸配列中の集約断片カバレッジが、NSCLCを有する患者または非癌対象と比較してSCLCを有する患者において減少している、請求項25に記載の方法。
【請求項28】
対象の断片化プロファイルが、細胞型特異的ゲノムワイド転写因子結合をもたらし、肺癌のタイプおよび組織学的サブタイプの診断に有効である、請求項21または25に記載の方法。
【請求項29】
対象が癌治療を受ける、請求項21または25に記載の方法。
【請求項30】
請求項1~19のいずれか一項に記載の方法を含む、対象における癌の再発を決定する方法。
【請求項31】
ゲノムワイド断片化分析のGC含量を補正する方法であり、
ポリメラーゼ連鎖反応(PCR)に供されていない試料および可変回数のPCRサイクルに供された試料からの癌対象および癌を有さない対象の全ゲノムライブラリーを配列決定すること、
アダプター配列をフィルタリングし、配列リードをヒト参照ゲノムに対してアライメントし、重複リードを除去し、アライメントされた各対をゲノム区間に変換すること、ここで前記ゲノム区間は配列決定されたDNA断片を表す、および
30以上のmapqスコアを有するリードを選択すること、
を含む、方法。
【請求項32】
前記参照ゲノムを、前記ゲノムの約1~3GBにわたる約100~600個の非重複1~10Mbビンにテーリングし、それによって、低カバレッジ全ゲノム配列決定からの前記ゲノムにわたる断片化における大規模なエピジェネティックな差異を捕捉することをさらに含む、請求項30に記載の方法。
【請求項33】
前記100~600個の非重複1~10Mbビンにわたる短い断片対長い断片(151bp対220bp)の数の比が、GC含量およびライブラリーサイズについて正規化された、請求項31に記載の方法。
【請求項34】
各GC層内の断片の総数を取得することが、0と1との間の約100個の可能なGC層のうちの1つへの断片の割り当てを含む、請求項30~33のいずれか一項に記載の方法。
【請求項35】
lが全てのGおよびCのヌクレオチドを有する断片を示す、請求項33に記載の方法。
【請求項36】
非癌試料についてのGC層による断片数の分布、およびターゲット分布の中央値を得ることをさらに含む、請求項30または31に記載の方法。
【請求項37】
対象での試料間PCRバイアスの正規化が、
【数1】
[ここで、t
iはターゲット分布における断片数を示し、N
iは階層
iにおける断片の総数を示し、i=1,・・・100である]となるように、GC層iにおける前記断片に重みw
iを割り当てることを含む、請求項30または31に記載の方法。
【請求項38】
GCバイアスにおける試料間変動およびライブラリーサイズにおける差異の正規化が、各ビンについての短い断片および長い断片のGC調整された数を、そのビンに整列された断片についての重みの合計として計算することを含む、請求項36に記載の方法。
【請求項39】
断片化プロファイルが、非癌対象および非悪性肺癌を有する対象の間で一貫している、請求項30~38のいずれか一項に記載の方法。
【請求項40】
癌対象が、広範なゲノムワイド変動を表す、請求項30~39のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、1)の優先権の利益を主張する。2021年12月21日に出願された米国仮特許出願第63/128,776号および2020年6月4日に出願された米国仮特許出願第63/197,301号(これらの出願の各々は、その全体が参照により本明細書に組み込まれる)。
【0002】
連邦政府支援の研究に関する記述
本発明は、National Institutes of Healthによって授与された助成金CA121113およびCA233259の下で政府支援を受けてなされた。政府は本発明において一定の権利を有する。
【0003】
技術分野
本開示は、概して、癌、特に肺癌を疾患の初期段階で検出および診断するための方法に関する。
【背景技術】
【0004】
肺癌は世界で最も致死的な癌である1(非特許文献1)。5年生存率は20%未満であり2(非特許文献2)、これは主に、治療が初期段階よりも有効性が低い診断後期段階によるものであり、肺癌の発生率は世界中で増加し続けている3(非特許文献3)。大規模な無作為化試験は、胸部低線量コンピュータ断層撮影(LDCT)を使用する肺癌検診が高リスク個体の死亡率を減少させることを実証している4、5(非特許文献4,5)が、偽陽性撮像結果からの潜在的な害、放射線被曝、および侵襲的診断手順からの罹患率の懸念により、LDCTは十分に活用されていないままであり、スクリーニングされたリスク個体の6%未満であるしかスクリーニングを受けていない6~8(非特許文献6-8)。
【先行技術文献】
【非特許文献】
【0005】
【非特許文献1】Ferlay J, Colombet M, Soerjomataram I, et al. Estimating the global cancer incidence and mortality in 2018: GLOBOCAN sources and methods. International journal of cancer 2019;144:1941-53.
【非特許文献2】De Angelis R, Sant M, Coleman MP, et al. Cancer survival in Europe 1999-2007 by country and age: results of EUROCARE--5-a population-based study. The Lancet Oncology 2014;15:23-34.
【非特許文献3】de Groot PM, Wu CC, Carter BW, Munden RF. The epidemiology of lung cancer. Translational lung cancer research 2018;7:220-33.
【非特許文献4】de Koning HJ, van der Aalst CM, de Jong PA, et al. Reduced Lung-Cancer Mortality with Volume CT Screening in a Randomized Trial. The New England journal of medicine 2020;382:503-13.
【非特許文献5】National Lung Screening Trial Research T, Aberle DR, Adams AM, et al. Reduced lung-cancer mortality with low-dose computed tomographic screening. The New England journal of medicine 2011;365:395-409.
【非特許文献6】Richards TB, Soman A, Thomas CC, et al. Screening for Lung Cancer - 10 States, 2017. MMWR Morbidity and mortality weekly report 2020;69:201-6.
【非特許文献7】Lung cancer Screening. 2020. at https://progressreport.cancer.gov/detection/lung_cancer.)
【非特許文献8】Pinsky PF. Principles of Cancer Screening. The Surgical clinics of North America 2015;95:953-66.
【発明の概要】
【課題を解決するための手段】
【0006】
本発明者らは、癌、特に肺癌を疾患の初期段階で検出および診断するための新規な非侵襲的方法を提供する。したがって、ある実施形態では、対象における癌を診断する方法は、対象の生体試料から無細胞(cfDNA)を抽出すること、抽出されたcfDNAからゲノムライブラリーを生成し、cfDNA断片の全ゲノム配列決定すること、ゲノム起源にcfDNA断片をマッピングし、断片長を評価し、各試料についてゲノムワイド断片化プロファイルを得ること、対象のタンパク質バイオマーカーを同定すること、対象のcfDNA断片化プロファイルおよびタンパク質バイオマーカーを正常参照非癌対象と比較することを含む。特定の実施形態において、癌は肺癌である。
【0007】
特定の実施形態において、本方法は、対象を低線量らせんコンピュータ断層撮影(LDCT)に供することをさらに含む。ある実施形態では、本方法は、肺癌を有すると診断された対象と非癌対象との間で臨床データを比較することをさらに含む。ある実施形態では、cfDNA断片の平均長およびプロファイルは、非癌個体間で類似している。ある実施形態では、癌対象のcfDNA断片プロファイルは変化する。ある実施形態では、血清中の1つまたは複数の、腫瘍抗原、サイトカインまたはタンパク質の血清レベルが測定される。
【0008】
ある実施形態では、1つまたは複数の腫瘍抗原は、癌胎児性抗原(CEA)、CA19-9、CA125、組織ポリペプチド抗原(TSA)、CYFRA-21-1、ニューロン特異的エノラーゼ、プロガストリン放出ペプチド(ProGRP)、血漿カリクレインB1(KLKB1)、血清中アミロイドA、ハプトグロビン-α-2、ADAM-17、オステオプロテゲリン、ペントラキシン3、フォリスタチン、腫瘍壊死因子受容体スーパーファミリーメンバー1Aまたはそれらの組合せを含む。
【0009】
特定の実施形態において、1つまたは複数のタンパク質は、C反応性タンパク質(CRP)、キチナーゼ-3-様タンパク質1(YKL-40/CHI3L1)またはそれらの断片を含む。
【0010】
ある実施形態では、DELFI(早期遮断のための断片のDNA評価)スコアが生成され、この際、交差検証反復(DELFIスコア)にわたる平均として各対象についてのスコアを生成するために、主成分分析が機械学習予測モデルに組み込まれる。例として、トレーニングのために利用可能な試料数に対する断片化特徴が高い次元性を有するため、特徴空間の次元性を低減するために主成分分析を各トレーニングセット内で実施し、試料間の断片化プロファイルの分散の90%を説明するために必要とされる最小数の主成分を保持した。主成分特徴に加えて、全ての39のzスコアを、LASSOペナルティを用いてロジスティック回帰モデルにおいて評価した。本発明者らの分析における最適化されたLASSOペナルティは、カレットRパッケージを使用してリサンプリングすることによって得られた。各試料について導出されたDELFIスコアは、10回の交差検証反復にわたる平均スコアに対応する。本明細書における「DELFIスコア」への言及は、この上記で特定された手順によって決定される値である。
【0011】
ある実施形態において、非癌個体のDELFIスコアは、約0.3未満である。ある実施形態では、病期Iの癌のDELFIスコアは、約0.3から0.5未満である。ある実施形態において、病期IIの癌についてのDELFIスコアは、約0.5から0.8未満である。ある実施形態において、病期IIIの癌についてのDELFIスコアは、約0.8から0.99未満である。ある実施形態では、病期IVのDELFIスコアは、約0.99以上である。ある実施形態において、病期Iの癌のDELFIスコアは約0.35である。ある実施形態において、病期IIの癌のDELFIスコアは、約0.75である。ある実施形態において、病期IIIの癌のDELFIスコアは、約0.9である。ある実施形態において、病期IVの癌のDELFIスコアは、約0.99である。
【0012】
ある実施形態では、小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別する方法は、SCLC、NSCLCまたは白血球の生体試料中の転写因子の発現変動(differential expression)を比較すること;生体試料中で同定された転写因子の発現と比較してより高い発現変動を有する少なくとも1つまたは複数の転写因子を選択すること;対象の生体試料から無細胞(cfDNA)を抽出すること;対象から得られたcfDNAのゲノムワイド断片化プロファイルを得て、少なくとも1つまたは複数の転写因子結合部位を同定すること;少なくとも1つまたは複数の転写因子結合部位のcfDNAカバレッジを評価して、非癌対象またはNSCLC対象と比較して断片カバレッジおよびサイズを決定すること;それによって、小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別することを含む。
【0013】
ある実施形態では、少なくとも1つの転写因子は、Achaete-Scuteファミリー塩基性ヘリックス-ループ-ヘリックス転写因子1(ASCL1)である。
【0014】
ある実施形態では、ASCL1結合部位を含む核酸配列中のcfDNA断片サイズは、NSCLCを有する患者または非癌対象と比較して、SCLC患者においてより大きい。
【0015】
ある実施形態では、ASCL1結合部位を含む核酸配列における集約(aggregate)断片カバレッジは、NSCLCを有する患者又は非癌対象と比較して、SCLC患者において減少している。
【0016】
ある実施形態では、小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別する方法であって、その方法は、対象の生体試料から無細胞(cfDNA)を抽出すること、Achaete-Scuteファミリー塩基性ヘリックス-ループ-ヘリックス転写因子1(ASCL1)結合部位のcfDNAカバレッジを評価して、非癌対象またはNSCLC対象と比較して断片カバレッジおよびサイズを決定すること、それによって、小細胞肺癌(SCLC)を有する対象と、非小細胞肺癌(NSCLC)を有する対象または癌を有さない対象とを診断的に区別することを含む。
【0017】
ある実施形態では、ASCL1結合部位を含む核酸配列中のcfDNA断片サイズは、NSCLCを有する患者または非癌対象と比較して、SCLC患者においてより大きい。
【0018】
ある実施形態では、ASCL1結合部位を含む核酸配列における集約断片カバレッジは、NSCLCを有する患者又は非癌対象と比較して、SCLC患者において減少している。
【0019】
ある実施形態では、対象の断片化プロファイルは、細胞型特異的ゲノムワイド転写因子結合をもたらし、肺癌のタイプおよび組織学的サブタイプの診断を有効にする。
【0020】
ある実施形態において、対象は、癌治療を受ける。
【0021】
特定の実施形態では、対象における癌の再発を決定する方法は、本明細書で具体化される方法を含む。
【0022】
ある実施形態では、ゲノムワイド断片化分析のGC含量を補正する方法は、ポリメラーゼ連鎖反応(PCR)に供されていない試料および可変回数のPCRサイクルに供された試料からの癌対象および癌を有さない対象の全ゲノムライブラリーを配列決定すること、アダプター配列をフィルタリングすること、配列リードをヒト参照ゲノムに対してアライメントし、重複リードを除去すること、アライメントされた各対を、配列決定されたDNA断片を表すゲノム間隔に変換すること、および、30以上のmapqスコアを有するリードを選択することを含む。
【0023】
ある実施形態では、本方法は、参照ゲノムを、ゲノムの約1~3GBにわたる約100~600個の非重複1~10Mbビンにテーリングし、それによって、低カバレッジ全ゲノム配列決定からのゲノムにわたる断片化における大規模なエピジェネティック差異を捕捉することをさらに含む。
【0024】
ある実施形態では、100~600個の非重複1~10Mbビンにわたる短い断片対長い断片(151~220bp)の数の比を、GC含量およびライブラリーサイズについて正規化した。
【0025】
ある実施形態では、本方法は、0と1との間の約100個の可能なGC層のうちの1つに断片を割り当てることを含む、各GC層内の断片の総数を得ることをさらに含む。
【0026】
ある実施形態において、1は、全てのGおよびCのヌクレオチドを有する断片を示す。
【0027】
ある実施形態では、本方法は、非癌試料についてのGC層による断片数の分布、およびターゲット分布の中央値を得ることをさらに含む。
【0028】
ある実施形態では、対象における試料間PCRバイアスの正規化は
【数1】
となるように、GC層iにおける断片に重みw
iを割り当てることを含み、ここで、t
iはターゲット分布における断片の数を示し、N
iは階層iにおける断片の総数を示し、i=1,.100である。ある実施形態では、GCバイアスにおける試料間変動およびライブラリーサイズにおける差異の正規化は、各ビンについての短い断片および長い断片のGC調整された数を、そのビンにアラインされた断片についての重みの合計として計算することを含む。
【0029】
ある実施形態では、断片化プロファイルは、非癌対象および非悪性肺癌を有する対象の間で一貫している。
【0030】
ある実施形態では、癌対象は、広範なゲノムワイドな変動を示す。
【0031】
定義
他に定義されない限り、本明細書で使用されるすべての用語(技術用語および科学用語を含む)は、本発明が属する技術分野の当業者によって一般に理解されるものと同じ意味を有する。一般的に使用される辞書に定義されているような用語は、関連技術の文脈におけるそれらの意味と一致する意味を有するものとして解釈されるべきであり、本明細書において明示的にそのように定義されていない限り、理想化された意味または過度に形式的な意味に解釈されないことがさらに理解されよう。
【0032】
本明細書で使用される場合、単数形「1つの(a)」、「1つの(an)」、および「その(the)」は、文脈がそうでないことを明確に示さない限り、複数形も含むことが意図される。さらに、用語「含む(including)」、「含む(includes)」、「有する(having)」、「有する(has)」、「伴う(with)」、またはそれらの変形が詳細な説明および/または特許請求の範囲のいずれかにおいて使用される限りにおいて、そのような用語は、用語「備える(comprising)」と同様に包括的であることが意図される。
【0033】
「約」または「およそ」という用語は、当業者によって決定される特定の値についての許容可能な誤差範囲内を意味し、これは、値がどのように測定または決定されるか、すなわち、測定システムの限界に部分的に依存する。例えば、「約」は、当技術分野における慣行に従って、1または1を超える標準偏差内を意味し得る。あるいは、「約」は、所与の値または範囲の最大20%、最大10%、最大5%、または最大1%の範囲を意味し得る。あるいは、特に生物学的系またはプロセスに関して、この用語は、値の5倍以内、また2倍以内の大きさのオーダー内を意味し得る。特定の値が本出願および特許請求の範囲に記載されている場合、特に明記しない限り、特定の値について許容可能な誤差範囲内を意味する「約」という用語が想定されるべきである。
【0034】
「アライメントされた(aligned)」、「アライメント(alignment)」、「マッピングされた(mapped)」または「アライメントする(aligning)」、「マッピングする(mapping)」という用語は、参照ゲノム由来の既知の配列に対する核酸分子の順序に関して一致として同定される1つまたは複数の配列を指す。そのようなアラインメントは、手動で、または、例えば、IlluminaのGenomics Analysesパイプラインの一部として配布される効率的局所的アラインメント(Efficient Local Alignment of Nucleotide Data)(ELAND)コンピュータプログラムをotide Data(ELAND)コンピュータプログラム等のコンピューターアルゴリズムによって実施することができる。。整列における配列リードの一致は、100%配列一致または100%未満(不完全一致)であり得る。
【0035】
「代替対立遺伝子」または「ALT」という用語は、例えば既知の遺伝子に対応する参照対立遺伝子と比較して1つまたは複数の突然変異を有する対立遺伝子を指す。
【0036】
「バイオマーカー」という用語は、プロセス、事象または状態の特徴的な生物学的指標または生物学的に誘導される指標を意味する。バイオマーカーは、診断方法、例えば臨床スクリーニングおよび予後評価において;および特定の治療的処置に応答する可能性が最も高い患者を同定するための治療結果のモニタリングにおいて、ならびに薬物スクリーニングおよび開発において使用することができる。バイオマーカーおよびその使用は、新たな薬物治療の同定および薬物治療のための新たな標的の発見に有用である。本明細書で使用される場合、「バイオマーカー」という用語は、生物学的変化と定量的または定性的のいずれかで関連する分子を指す。バイオマーカーの例としては、ポリペプチド、タンパク質またはポリペプチドもしくはタンパク質の断片;およびポリヌクレオチド、例えば遺伝子産物、RNAまたはRNA断片;および他の身体代謝産物が挙げられる。ある実施形態では、「バイオマーカー」は、第2の表現型を有する(例えば、疾患もしくは状態を有さないか、または疾患もしくは状態の重症度の低いバージョンを有する)対象または対象群からの生体試料と比較して、第1の表現型を有する(例えば、疾患もしくは状態を有する)対象または対象群からの生体試料中に差次的に存在する(すなわち、増加または減少する)化合物を意味する。バイオマーカーは、任意のレベルで差次的に存在し得るが、一般に、5%以上、10%、15%以上、20%以上、25%以上、30%以上、35%以上、40%以上、45%以上、50%以上、55%以上、60%以上、65%以上、70%以上、75%以上、80%以上、90%以上、95%以上、100%以上、110%以上、120%以上、130%以上、140%以上、150%以上、もしくはそれ以上増加したレベルで存在するか、または一般に、5%以上、10%以上、15%以上、20%以上、25%以上、30%以上、35%以上、40%以上、45%以上、50%以上、55%以上、60%以上、65%以上、70%以上、75%以上、80%以上、85%以上、90%以上、95%以上、もしくは100%以上(すなわち、存在しない)減少したレベルで存在する。バイオマーカーは、好ましくは、統計的に有意なレベル(例えば、ウェルチのT検定またはウィルコクソンの順位和検定のいずれかを使用して決定される場合、例えば、0.05未満のp値および/または0.10未満のq値)で差次的に存在する。
【0037】
加えて、「バイオマーカー」という用語は、前述のいずれかのアイソフォームおよび/または翻訳後修飾形態も含む。本発明は、非修飾および修飾(例えば、グリコシル化、シトルリン化、リン酸化、酸化または他の翻訳後修飾)タンパク質/ポリペプチド/ペプチドの両方の検出、測定、定量化、決定などを企図する。ある実施形態では、バイオマーカーの検出、測定、決定などへの言及は、タンパク質/ポリペプチド/ペプチド(修飾および/または非修飾)の検出を指すことが理解される。
【0038】
本明細書中で使用される場合、用語「癌」は、当該分野で公知であるような、調節されない細胞の増殖または複製によって特徴付けられる病気、状態、形質、遺伝子型または表現型を意味し;肺の癌(非小細胞肺癌を含む)、胃の癌、結腸直腸の癌、ならびに例えば、白血病(例えば、急性骨髄性白血病(AML)、慢性骨髄性白血病(CML)、急性リンパ性白血病(ALL)、および慢性リンパ性白血病)、AIDS関連の癌(例えば、カポージ肉腫);乳癌;骨肉腫(例えば、骨肉腫、軟骨肉腫、ユーイング肉腫、線維肉腫、巨細胞腫瘍、アダマンチノーマ、および脊索腫);脳の癌(例えば、髄膜腫、膠芽細胞腫、低悪性度星状細胞腫、乏突起細胞腫、下垂体腫瘍、神経鞘腫、および転移性脳腫瘍);頭部および頚部の癌(例えば、種々のリンパ腫、例えば、マントル細胞リンパ腫、非ホジキンリンパ腫、腺腫、扁平上皮癌、喉頭癌、胆嚢癌、および胆管癌)、網膜の癌(例えば、網膜芽腫)、食道癌、胃癌、多発性ミエローマ、卵巣の癌、子宮の癌、甲状腺癌、精巣癌、子宮内膜癌、メラノーマ、膀胱癌、前立腺癌、膵臓癌、肉腫、ウィルムス腫瘍、子宮頸癌、頭部および頚部の癌、皮膚癌、鼻咽頭癌、脂肪肉腫、上皮癌、腎細胞癌、胆嚢腺癌、耳下腺癌、子宮内膜癌、多剤耐性癌);ならびに増殖性の疾患および状態(例えば、腫瘍血管形成に関連する新生血管形成)を含む。
【0039】
「候補変異体」、「コールされた変異体(called variant)」、または「推定上の変異体」という用語は、例えば、変異していると決定されたゲノム中の位置における、ヌクレオチド配列の1つまたは複数の検出されたヌクレオチド変異体を指す。一般に、ヌクレオチド塩基は、試料から得られた配列リード上の代替対立遺伝子の存在に基づいてコールされた変異体とみなされ、この際、配列リードはそれぞれ、ゲノム中の位置にわたって交差する。候補変異体の供給源は、最初は未知または不確かであり得る。処理中、候補変異体は、ゲノムDNA(例えば、血液由来)または癌によって影響を受けた細胞(例えば、腫瘍由来)などの予想される供給源と関連付けられ得る。さらに、候補変異体は、真陽性(true positive)と呼ばれ得る。目的の変異体は、測定、定性、定量、または検出される遺伝子配列の特定の変異体である。いくつかの実施態様では、目的の変異体は、癌、腫瘍、または遺伝的障害などの状態に関連することが知られているか、またはその疑いがある変異体である。
【0040】
「無細胞核酸」、「無細胞DNA」、または「cfDNA」という用語は、個体の体内(例えば、血流)を循環し、1つもしくは複数の健常細胞および/または1つもしくは複数の癌細胞に由来する核酸断片を指す。さらに、cfDNAは、ウイルス、胎児などの他の供給源に由来し得る。
【0041】
「循環腫瘍DNA」または「ctDNA」という用語は、腫瘍細胞または他のタイプの癌細胞に由来する核酸断片を指し、死滅細胞のアポトーシスまたは壊死などの生物学的プロセスの結果として個体の血流中に放出され得るか、または生存腫瘍細胞によって能動的に放出され得る。
【0042】
本明細書で使用される場合、項目、組成物、装置、方法、プロセス、システムなどの定義または記載された要素に関して、用語「含む(comprising)」、「含む(comprise)」、または「含まれた(comprised)」、およびそれらの変形は、包含的またはオープンエンドであることを意味し、追加の要素を許容し、それによって、定義または記載された項目、組成物、装置、方法、プロセス、システムなどが、それらの特定の要素、または必要に応じてそれらの等価物を含み、他の要素が含まれ得、定義された項目、組成物、装置、方法、プロセス、システムなどの範囲/定義内に依然として含まれ得ることを示す。
【0043】
「診断の(diagnostic)」または「診断された(diagnosed)」とは、病的状態の存在または性質を同定することを意味する。診断方法は、それらの感度および特異度が異なる。診断アッセイの「感度」は、陽性と判定された罹患個体の割合(「真陽性」の割合)である。そのアッセイにより検出されなかった罹患個体は「偽陰性」である。罹患しておらず、そのアッセイにより陰性と判定された対象は「真陰性」とよばれる。診断アッセイの「特異度」は、1から偽陽性率を引いたものであり、ここで、「偽陽性」率は、疾患を有さない、試験で陽性と判定された対象の割合として定義される。特定の診断方法が状態の決定的な診断を提供しない場合があるが、その方法が診断を補助する明確な指標を提供する場合、それは十分である。
【0044】
本明細書で使用される「有効量」は、治療的または予防的利益を提供する量を意味する。
【0045】
本明細書中で使用される場合、用語「断片化プロファイル」、「断片化パターンの位置依存的差異」、および「ゲノムにわたる位置依存的様式での断片サイズおよびカバレッジの差異」は同義であり、互換的に用いられ得る。本明細書中で使用される場合、用語「断片化プロファイル」、「断片化パターンの位置依存的差異」、および「ゲノムにわたる位置依存的様式での断片サイズおよびカバレッジの差異」は、等価であり、交換可能に使用され得る。いくつかの実施形態では、哺乳動物でのcfDNA断片化プロファイルの決定は、癌を有する哺乳動物を同定するために使用することができる。例えば、哺乳動物から(例えば、哺乳動物から得られた試料から)得られたcfDNA断片は低カバレッジ全ゲノム配列決定に供することができ、配列決定された断片はゲノムに(例えば、重複しないウィンドウで)マッピングされ、cfDNA断片化プロファイルを決定するために評価され得る。本明細書に記載されるように、癌を有する哺乳動物のcfDNA断片化プロファイルは、健常哺乳動物(例えば、癌を有さない哺乳動物)のcfDNA断片化プロファイルよりも(例えば、断片長において)不均一である。したがって、本開示はまた、癌を有するかまたは有することが疑われる哺乳動物(例えば、ヒト)を評価、モニタリング、および/または処置するための方法および材料を提供する。いくつかの実施形態では、本開示は、哺乳動物が癌を有すると同定するための方法および材料を提供する。例えば、哺乳動物から得られた試料(例えば、血液試料)は、哺乳動物のcfDNA断片化プロファイルに少なくとも部分的に基づいて、哺乳動物における癌の存在および任意選択で癌の起源の組織を決定するために、評価され得る。いくつかの実施形態では、哺乳動物を、癌を有するとしてモニタリングするための方法および材料が提供される。例えば、哺乳動物から得られた試料(例えば、血液試料)は、哺乳動物のcfDNA断片化プロファイルに少なくとも部分的に基づいて、哺乳動物における癌の存在を決定するために評価され得る。いくつかの実施形態において、哺乳動物を、癌を有するとして同定し、哺乳動物を治療するために哺乳動物に1つまたは複数の癌治療を施すための方法および材料が提供される。例えば、哺乳動物から得られた試料(例えば、血液試料)は、その哺乳動物のcfDNA断片化プロファイルに少なくとも部分的に基づいて哺乳動物が癌を有するかどうかを決定するために評価され得、1つまたは複数の癌治療をその哺乳動物に施すことができる。
【0046】
「ゲノム核酸」または「ゲノムDNA」という用語は、1つまたは複数の健常(例えば、非腫瘍)細胞に由来する染色体DNAを含む核酸を指す。様々な実施形態において、ゲノムDNAは、白血球(WBC)などの血液細胞系列に由来する細胞から抽出することができる。
【0047】
「任意選択の」または「任意選択で」は、その後に記載される事象または状況が起こり得るまたは起こり得ないこと、ならびにその記載が、その事象または状況が起こる場合および起こらない場合を含むことを意味する。
【0048】
本明細書および添付の特許請求の範囲において使用される場合、「または」という用語は、内容が明らかに別のことを指示しない限り、「および/または」を含む意味で一般に使用される。
【0049】
免疫原性組成物の「非経口」投与は、例えば、皮下(s.c.)、静脈内(i.v.)、筋肉内(i.m.)、または胸骨内注射、または注入技術を含む。
【0050】
「患者」または「個体」または「対象」という用語は、本明細書において互換的に使用され、治療される哺乳動物の対象を指し、ヒト患者が好ましい。いくつかの実施形態、本発明の方法は、実験動物において、獣医学的適用において、ならびにマウス、ラット、およびハムスターを含む齧歯類、ならびに霊長類を含むがこれらに限定されない疾患のための動物モデルの開発において用途を見出す。
【0051】
用語「参照ゲノム」は、本明細書で使用される場合、種または対象の代表例として組み立てられた、デジタルのまたは以前に同定された核酸配列データベースを指し得る。参照ゲノムは、複数の対象、試料または生物由来の核酸配列からアセンブルされてもよく、必ずしも単一の人の核酸構成を表すわけではない。参照ゲノムは、試料からの配列決定リードを染色体位置にマッピングするために使用され得る。例えば、ヒト対象ならびに多くの他の生物に使用されるための参照ゲノムは、National Center for Biotechnology Informationのncbi.nlm.nih.govで見出される。
【0052】
「リードセグメント」または「リード」という用語は、個体から得られた配列リードを含む任意のヌクレオチド配列、および/または個体から得られた試料からの最初の配列リードに由来するヌクレオチド配列を指す。
【0053】
「試料」、「患者試料」、「生体試料」などの用語は、患者、個体、または対象から得られる様々な試料タイプを包含し、診断、予後および/またはモニタリングアッセイにおいて使用され得る。患者試料は、健常対象、罹患した患者、または肺癌を有する患者から得ることができる。ある実施形態では、「提供される」試料は、アッセイを行う人(または機械)によって得ることができるか、または別の人によって得て、アッセイを行う人(または機械)に移すことができる。また、患者から採取した試料を分割して、一部のみを診断に用いてもよい。さらに、試料またはその一部は、後の分析のために試料を維持する条件下で保存することができる。この定義は、特に、血液および生物学的起源の他の液体試料(末梢血、血清、血漿、臍帯血、羊水、脳脊髄液、尿、唾液、糞便および滑液を含むが、これらに限定されない)、生検標本または組織培養物等の固形組織試料またはそれらに由来する細胞およびそれらの子孫(progeny)を包含する。ある実施形態では、試料は、脳脊髄液を含む。ある実施形態では、試料は血液試料を含む。別の実施形態では、試料は血漿試料を含む。さらに別の実施形態では、血清試料が使用される。「試料」の定義はまた、それらの調達後に、遠心分離、濾過、沈殿、透析、クロマトグラフィー、試薬による処理、洗浄、または特定の細胞集団についての濃縮などの任意の方法で操作された試料を含む。これらの用語は臨床試料をさらに包含し、培養中の細胞、細胞上清、組織試料、臓器なども含む。試料はまた、新鮮凍結および/またはホルマリン固定パラフィン包埋組織ブロック、例えば臨床または病理生検から調製されたブロック、免疫組織化学による病理分析または研究のために調製されたブロックを含んでもよい。
【0054】
「配列リード」という用語は、個体から得られた試料から読み取られたヌクレオチド配列を指す。配列リードは、当技術分野で公知の様々な方法によって得ることができる。
【0055】
本明細書で定義される場合、化合物または薬剤の「治療有効」量(すなわち、有効投与量)は、治療的に(例えば、臨床的に)望ましい結果をもたらすのに十分な量を意味する。組成物は、1日に1回または複数回から週に1回または複数回投与することができ、1日おきに1回を含む。当業者であれば、疾患または障害の重症度、以前の治療、対象の全体的な健康および/または年齢、ならびに存在する他の疾患を含むがこれらに限定されない特定の要因が、対象を効果的に治療するのに必要な投与量およびタイミングに影響を及ぼし得ることを理解するであろう。さらに、治療有効量の本発明の化合物による対象の治療は、単回治療または一連の治療を含むことができる。
【0056】
本明細書で使用される場合、用語「治療する」、「治療すること」、「治療」などは、障害および/またはそれに関連する症状を低減または改善することを指す。障害または状態を処置することは、排除されないが、障害、状態またはそれに関連する症状が完全に排除されることを必要としないことが理解される。
【0057】
遺伝子:本明細書中に開示される全ての遺伝子、遺伝子名、および遺伝子産物は、本明細書中に開示される組成物および方法が適用可能である任意の種由来のホモログに対応することが意図される。特定の種由来の遺伝子または遺伝子産物が開示される場合、この開示は、例示のみを意図しており、それが現れる文脈が明確に示さない限り、限定として解釈されるべきではないことが理解される。したがって、例えば、本明細書に開示される遺伝子または遺伝子産物については、他の種由来の相同および/またはオーソロガス遺伝子ならびに遺伝子産物を包含することが意図される。
【0058】
範囲:本開示全体を通して、本発明の様々な態様を範囲形式で提示することができる。範囲形式での記載は、単に便宜上および簡潔さのためであり、本発明の範囲に対する柔軟性のない限定として解釈されるべきではないことが理解されるべきである。したがって、範囲の記載は、具体的に開示された全ての可能な部分範囲ならびにその範囲内の個々の数値を有すると考えられるべきである。例えば、1~6などの範囲の記載は、1~3、1~4、1~5、2~4、2~6、3~6などの部分範囲、ならびにその範囲内の個々の数、例えば、1、2、2.7、3、4、5、5.3、および6を具体的に開示しているとみなされるべきである。これは、範囲の幅に関係なく適用される。
【0059】
特許または出願ファイルは、カラーで作成された少なくとも1つの図面を含む。カラー図面を含む本特許または特許出願公開のコピーは、請求および必要な手数料の支払いに応じて特許庁によって提供される。
【図面の簡単な説明】
【0060】
【
図1】
図1Aは、アポトーシス肺癌細胞および白血球(WBC)からのDNA断片化および放出の概略図である。様々な長さのリンカーDNAを有するヌクレオソームDNAは、WBCから生じるcfDNA断片と比較してより異常なプロファイルを有する癌細胞cfDNA断片と共に循環中に保存される。ゲノムに沿ったcfDNA断片をマッピングし、短い断片対長い断片の比を計算することにより、非癌の個体とは異なる癌患者でのパターンが明らかになる。
図1Bは、全体的なアプローチの概略図である。肺癌の早期検出のためのDELFIアプローチの概要。LUCAS診断コホートからの合計365人の患者がゲノムワイド断片化プロファイルを導き出すために利用され、このゲノムワイド断片化プロファイルは、交差検証された機械学習モデルを使用してこのコホートにおける診断性能を訓練および評価するために使用された。固定モデルを使用して、46人の肺癌患者および385人の非癌個体の独立コホートにおける性能を検証した。
【
図2】
図2A、2Bおよび2Cは、肺癌患者および非癌個体の無細胞DNA断片化プロファイルを示すグラフの読み出しおよびヒートマップである。
図2A:5Mbビンにおけるゲノム全体にわたる長いcfDNA断片に対する短いcfDNA断片の比を、LCASコホートからの肺癌および非癌個体の血漿試料において評価した。非癌患者は、有意な変動を示した肺癌患者と比較して類似した断片化プロファイルを有していた。
図2B:非癌個体の平均と比較した、肺癌を有する患者または非癌個体についてのゲノムにわたるcfDNA断片化特徴の偏差を表現したヒートマップ。全体的なDELFIスコアおよび臨床特性を、断片化偏差ヒートマップの左側に示す。
図2C:断片化プロファイル特徴の主成分の固有値を表現したヒートマップ。特徴の相対的重要性は、ヒートマップの上部(断片化変化)および右(染色体腕変化)に示され、色は、癌リスクの係数の増加(gain)(赤色)または減少(loss)(青色)を示す。肺腺癌(n=518)および扁平上皮細胞癌(n=501)における染色体腕の増加(赤色)および減少(青色)のTCGA由来の観察を、右余白に示す。LUCASにおける可変重要度バーの色とTCGAコピー数データとの間の一致は、それぞれ、LUCASにおける染色体腕レベル表示の減少(青色)または増加(赤色)によるより高い癌リスクと、TCGAにおけるコピー数増幅(赤色)およびコピー数欠失(青色)との間の対応を示す。
【
図3】
図3A~3Cは、肺癌患者および非癌個体についてのDELFI分析の性能を示す一連のプロットである。
図3A:LUCASコホートにおける病期および組織型群によって層別化された、非癌個体および癌患者にわたるDELFIスコア分布。ボックスプロットは、中央値DELFIスコアおよび四分位数間範囲を示し、個々の試料値はドットとしてオーバーレイされている。良性病変を有するかまたは有さない非癌症例は、癌症例と比較してより低いDELFIスコアを有し、段階的にDELFIスコアが徐々に増加する。最も高い中央値DELFIスコアは、SCLC症例において観察される。ROC図中の点線の垂直線は、決定境界として80%の特異度を表す。
図3B:全LCASコホートならびに病期および組織学によるROC分析。
図3C:DELFI固定モデルの分析およびLUCASコホートから決定された0.344のスコアカットオフを検証コホートに適用した。独立コホートにおけるこの分類子の性能は、すべての腫瘍病期にわたって特異度(左)および感度(右)の両方においてLUCASと同様であった。トレーニングセットおよび検証セットにおける試料数は、横軸のラベルに示されている。提示された間隔は、90%信頼区間を反映する。
【
図4】
図4A~4Cは、肺癌の大きさおよび侵襲性とDELFIスコアとの関係を示す一連のグラフである。
図4A:LCASコホートにおけるT病期またはN病期によって分類された肺癌を有する非転移性患者のDELFIスコアの箱ひげ図。T1~T4のT病期によるDELFIスコアの漸増が観察された(p<0.01、Kruskall-Wallis、df=3)。リンパ節の関与のない肺癌患者は、リンパ節転移を有する患者と比較して有意に低いDELFIスコアを有した(ウィルコクソン順位和検定、p<0.001)。
図4B:TおよびN病期によるDELFIスコアの段階的増加は、各患者においてTおよびN病期の両方を考慮した場合に維持された(Kruskall-Wallis、df=6、p<0.01)。
図4C:原発性肺癌を有する患者を、0.5のDELFIカットオフに基づいて2つの群に層別化した(n=93)。DELFIスコアが0.5超の患者は、DELFIスコアが0.5未満の患者と比較して、癌特異的生存率が有意に悪かった。
【
図5】
図5A~5Fは、ゲノムワイド断片化プロファイルがSCLCをNSCLCから区別することができることを実証する、一連のプロット、ボックスグラフおよび教師なしクラスタリング分析である。
図5A:SCLC(n=79)のTCGA RNA-seq分析におけるASCL1転写因子の発現は、NSCLC(n=1046)またはWBC(755)試料と比較して高い。
図5B:TCGA肺癌コホートにおける遺伝子発現の教師なしクラスタリング分析は、ASCL1結合部位を有する遺伝子がSCLCとNSCLCとの間で差次的に発現されることを示す。LUCASコホート患者におけるASCL1結合部位でのゲノムワイドcfDNA断片化分析は、非癌個体と比較したSCLC患者(
図5C)または他の個体と比較したSCLCを有するDELFI陽性患者(
図5E)の転写因子結合部位付近のカバレッジの減少を明らかにする。これらの分子特徴は、高い精度で、SCLC患者(n=11)を非癌個体(n=158)(
図5D、AUC=0.92)から、ならびにDELFI陽性SCLC患者(n=10)をNSCLC患者およびその他(n=115)(
図5F、AUC=0.98)から区別することができる。
【
図6】
図6A~6Gは、肺癌検診におけるDELFIの実装のモデル化を示す一連のグラフおよび概略図である。
図6A:肺癌検診の現在の臨床診療(上)およびDELFI検査と組み合わせた提案されたアプローチ(下)の概略図。組み合わされたアプローチにおいて、肺癌に対し高リスクの個体は、DELFI試験によってスコア付けされる毎年の採血を受け、陽性結果を有する個体は、その後、LDCTスキャンおよび肺癌の検出のためのその後の診断評価を受け、一方、DELFI陰性結果を有する個体は、毎年検診を繰り返す。
図6B:肺癌検出のためのDELFI単独、またはDELFIとそれに続くLDCTの感度を、単一または組合せ分析について80%の特異度を仮定して決定した。これらの分析のために、本発明者らは、肺癌を有する個体を、ベースラインでLDCTにより検出されたものとみなしたが、3人の個体が、1年以内の反復LDCTにおいて肺癌を有すると同定された。LUCASコホートの個体数は以下の通りである。病期I n=15、II n=7、病期III n=35、病期IV n=72;肺腺癌を有するコホート中の個体は、病期I n=8、病期II n=3、病期III n=14、病期IV n=37を含んでいた。個体数をドットの大きさで模式的に示し、表1に示す。
図6C:LDCT単独ならびにDELFIの感度および特異度の不確実性をモデル化し、続いて、100,000人の高リスク個体の理論的集団におけるスクリーニングのためにLDCTを行った。これらの個体間の、検出された肺癌の数(
図6D)、精度(
図6E)、不必要な手順の割合(
図6F)、および陽性予測値(
図6G)についての予測分布は、肺癌の有病率ならびに画像によるおよび血液によるスクリーニングへのアドヒアランスの両方において変動を取り込んでいた。
【
図7】
図7は、LUCAS診断コホートから分析された試料についての診断アルゴリズムの概略図である。LUCASコホートの患者は、胸部X線または胸部CTでの陽性所見の後に診断精密検査を受けた。全ての患者は、最初のイメージング所見を確認するために、来院時に血漿及び血清の採血、並びに胸部CTを受けた。患者を、肺癌群について低い疑いおよび高い疑いに階層化した。低い疑いを有する患者(n=150)は、最長7年間臨床的およびX線撮影で追跡された。これらの患者のうち145人は、最後の追跡調査の時点で肺癌を発症していなかったが、これらの患者のうち5人は、病歴および画像化特性に基づいて診断された肺癌を有し、剖検で肺癌を有することが確認された。疑いの高い患者(n=208)は、PET-CTスキャンおよび肺生検を含む追加の精密検査を受けた。これらの患者のうち87人は非悪性結節と診断されたが、124人の患者は生検により組織学的に確認された肺癌を有していた。
【
図8】
図8A~8Cは、様々なサイクルのPCR増幅を用いた、マッチしたDNase消化リンパ球DNAにおける断片化プロファイルを示す一連のプロットである。
図8A:4サイクルのPCR(n=4)および12サイクルのPCR(n=3)の技術的反復と比較した、増幅なしの同じ試料(0サイクルのPCR、n=1)の標準化された断片カバレッジ。増幅なしと比較して4サイクルのPCRの影響は最小限であったが、12サイクルは明らかに異なっていた。
図8B:GC補正なしの断片化プロファイルの主成分分析は、0サイクルおよび4サイクルのPCR断片化プロファイルの類似性を強調する。
図8C:4または12サイクルPCRライブラリーからの配列の断片レベルGC補正は、増幅を伴わない天然に存在する断片化プロファイルに類似していたが、ビンレベルGC補正は、4または12サイクルPCRライブラリーにおけるGCバイアスを部分的に軽減しただけであった。
【
図9】
図9は、50回のトレーニング反復にわたる最終DELFIモデルへの特徴寄与の変動のヒートマップ表現である。ヒートマップは、50個のトレーニングセット(5フォールド×10反復、横軸)にわたる各モデル特徴(縦軸)のスケーリングされた回帰係数を示す。灰色のボックスは、示された主成分(PC)を利用しないモデルを示す。右余白は、LUCAS分析からの利用可能なデータを使用する外部検証に使用される最終モデルを表す。
【
図10】
図10A~10Dは、非癌個体におけるDELFIスコアに対する喫煙状態、年齢、および共存症の影響を示す一連のグラフである。
図10A:癌を有さない個体におけるDELFIスコアは、現在喫煙者対喫煙未経験者または喫煙経験者について(Kruskal-Wallis検定、df=154、p=0.47)、ならびにパックイヤー群にわたって(Kruskal-Wallis検定、df=154、p=0.47)類似していた。
図10B、10C:癌を有さず、自己免疫疾患またはCOPDと診断された個体は、これらの状態を有さない個体と同様のDELFIスコアを有した(それぞれp=0.26、p=0.37)。
図10D:DELFIスコアは、臨床的に関連する年齢群間で相違がなかった(Kruskal-Wallis、df=2、p=0.18)。
【
図11】
図11は、非癌個体におけるDELFIスコアおよび血清タンパク質マーカーを示す一連のプロットである。健常個体におけるDELFIスコア(縦軸)と血清タンパク質レベル(横軸)との相関分析。CRPおよびYKL-40レベルは、DELFIスコアと弱い相関を有していた(スピアマン相関係数:それぞれ0.17、p=0.04;0.12、p=0.02)。IL-6(p=0.08)またはCEA(p=0.5)とDELFIスコアとの間に相関はなかった。
【
図12】
図12A~12Cは、DELFIアプローチの性能と他のゲノムアプローチとの比較を示す一連のグラフである。
図12A:LucASコホートにおけるCristianoらの文献
23に記載されているモデル特徴およびGCバイアス補正の実装は、本明細書で実装されるモデルと比較して同様の性能を示すが、本DELFIモデルは、高い特異度範囲でより高い感度を有する。
図12B:本DELFIモデルは、ichor分析または断片長中央値の評価よりも性能が優れている。ROC図における点線の垂直線は、95%、90%および80%の特異度を表す。
図12C:コホートによる断片サイズ中央値の比較は、非癌個体ならびに病期によって分けられた癌を有する患者について、LUCASおよび検証コホートの両方について同様の断片長中央値を示す。
【
図13】
図13は、肺癌検証コホートにおけるDELFIの性能を実証する一連のグラフである。385人の非癌個体および46人の肺癌患者を含む検証コホートの分析は、異なる病期および組織学的サブタイプにわたってLCASコホートと同様の性能測定基準を明らかにした。グラフは、固定カットオフがLCASおよび検証コホートの両方に使用される場合のDELFIの特異度および感度を示す。各行は、上から下に示されるように、それぞれ70%、75%、80%または85%の特異度に対応する異なるDELFIスコアカットオフ(0.252、0.303、0.344または0.377)を表す。図中に示される間隔は、90%信頼区間を反映する。
【
図14】
図14は、非癌個体および肺癌患者にわたるCEAレベルを示すグラフである。診断群、病期、および組織学的サブタイプ間の血清CEAレベル(縦軸)の分布。
【
図15】
図15Aおよび15Bは、肺癌患者および非癌個体についてのDELFImulti分析の性能を示す一連のグラフである。
図15A:病期および組織学的サブタイプにわたるDELFImultiスコア分布。
図15B:病期および組織学によるDELFI ROC曲線。ROC図における点線の垂直線は、95%、90%および80%の特異度を表す。
【
図16】
図16A~16Dは、ASCL1結合部位におけるcfDNA断片サイズが、非癌個体およびNSCLC患者からSCLCを区別することができることを実証する一連のグラフである。LUCASコホート患者におけるASCL1結合部位でのゲノムワイドcfDNA断片化分析は、非癌個体(
図16A)または他の癌を有する個体(
図16C)と比較して、SCLC患者の転写因子結合部位付近の断片サイズが増加していることを明らかにしている。この分子的特徴は、高い精度で、SCLC患者を非癌個体から(
図16B、AUC=0.91)、およびSCLCをNSCLC患者から(
図16D、AUC=0.94)区別することができる。
【
図17】
図17Aおよび17Bは、肺癌患者におけるDELFIスコアおよび臨床転帰を示すグラフである。
図17A:DELFIスコア0.5未満の病期IVの原発性肺癌を有する患者は、DELFIスコア0.5超の患者と比較して、有意に長い癌特異的生存率を示した。
図17B:DELFIスコアが癌特異的全生存の独立予後因子であるかどうかを評価するために、本発明者らは、高いまたは低いDELFIスコア、組織型群、および病期を共変量として用いてコックス比例ハザード比を計算した。DELFIスコア>0.5を有する患者は、組織型群および病期について調整した後、DELFIスコア<0.5(p<0.001)を有する患者と比較して、2.53のHRを有した。間隔は、ハザード比の95%信頼区間を示す。
【
図18】
図18Aおよび18Bは、DELFIが臨床的再発の前に分子再発を同定できることを実証するグラフである。
図18A:癌の既往歴を有する患者のうち、追跡期間中に腫瘍再発を発症した患者は、再発を発症しなかった患者と比較して有意に高いDELFIスコアを有していた(p=0.004)。
図18B:癌の既往歴を有し、ベースライン評価で癌の証拠がなく、陽性DELFIスコアを有する患者は、陰性DELFIスコアを有する患者と比較して有意に短い無増悪生存期間を有していた(p<0.01)。
【発明を実施するための形態】
【0061】
高リスク個体および究極的には一般集団の間で利用可能性を増すことができる標準治療の癌検診を改善するための非侵襲的アプローチの開発について、緊急の臨床ニーズが満たされていない。肺癌の早期検出のためのバイオマーカー開発は、スクリーニングの際、ならびに胸部画像化研究で小結節として同定された円形混濁における悪性腫瘍を識別するために、臨床な適用の可能性を有する8。血液または気道上皮におけるタンパク質9~11、自己抗体12、遺伝子発現プロファイル13およびマイクロRNA14の調査により、肺癌の早期検出のための有望なバイオマーカー候補が得られているが、年齢ならびに喫煙および他の状態への長期曝露によって誘導される全身性炎症によって影響を受ける可能性があるものもあり、臨床使用がまだ承認されていないものもある14。
【0062】
液体生検分析における急速な技術および分析の進歩により、血液のcfDNAコンパートメントにおける癌関連の特徴が同定され、癌の早期検出のための新しい道が提供された。循環腫瘍DNA(ctDNA)における突然変異は、腫瘍におけるこれらの改変の予備知識なしに初期段階の肺癌患者において直接検出することができる15~18。しかしながら、標的化された高カバレッジ配列決定によって評価され得る比較的少数の配列改変を考慮すると、癌を有する多くの個体は、そのようなアプローチによって見落とされる場合があり、クローン造血から生じる変化を排除するために白血球(WBC)の配列決定を必要とする場合もある16,17,19。初期段階の癌の検出感度を増加させるために、DELFI(初期遮断のための断片のDNA評価)20と呼ばれるcfDNA断片化プロファイルの分析のための機械学習を使用して、ゲノムワイドアプローチが開発された。この多特徴分析は、何百万ものcfDNA断片の同時評価を可能にし、検出することができる腫瘍由来エピゲノムおよびゲノム変化の数を増加させる。この研究では、方法が改善され、肺癌患者ならびに非癌個体を含む前向きに収集された診断コホートにおける肺癌検出に適用された。この方法を血漿タンパクバイオマーカーおよび血液細胞数と組み合わせ、それによって早期癌検出のためにゲノム、エピゲノム、タンパク、および細胞の特徴を調べる評価もまた、本明細書に開示される。この努力を通じて、早期肺癌検出のためにDELFIを他のマーカーおよび低線量らせんコンピュータ断層撮影(LDCT)と組み合わせて、非侵襲的液体生体検査アプローチを臨床に組み込むことができる臨床フレームワークが提供される。
【0063】
早期遮断のための断片のDNA評価(DELFI)
早期遮断のための断片のDNA評価(DNA Evaluation of Fragments for early Interception、DELFI)は以前に開発されたCristiano S,Leal A,Phallen JらのGenome-wide cell-free DNA fragmentation in patients with cancer. Nature 2019;570:385-9に記載されており、乳癌、結腸直腸癌、肺癌、卵巣癌、膵臓癌、胃癌、または胆管癌を有する236人の患者ならびに245人の健常個体のcfDNAのゲノムワイドな断片化パターンを評価するために使用されている。これらの分析は、健常個体のcfDNAプロファイルが白血球のヌクレオソーム断片化パターンを反映しているが、癌を有する患者では断片化プロファイルが変化したことを明らかにした。DELFIは、98%の特異度で7つの癌タイプの間で57%から99%超の範囲の検出感度を有し、75%の症例で限られた数の部位に対して癌発生組織を同定した。cfDNAを(例えば、DELFIを使用して)評価することは、癌の早期検出のためのスクリーニングアプローチを提供し、これは、癌を有する患者の治療成功の機会を増加させることができる。cfDNAを(例えば、DELFIを使用して)評価することはまた、癌をモニタリングするためのアプローチを提供することができ、これは、癌を有する患者の治療の成功および転帰の改善の機会を増加させることができる。加えて、cfDNA断片化プロファイルは、限られた量のcfDNAから、安価な試薬および/または機器を使用して得ることができる。
【0064】
したがって、ある実施形態では、対象における癌を診断する方法は、対象の生体試料から無細胞(cfDNA)を抽出すること、抽出されたcfDNAからゲノムライブラリーを生成し、cfDNA断片の全ゲノム配列決定すること、ゲノム起源にcfDNA断片をマッピングし、断片長を評価し、各試料についてゲノムワイド断片化プロファイルを得ること、対象のタンパク質バイオマーカーを同定すること、対象のcfDNA断片化プロファイルおよびタンパク質バイオマーカーを正常参照非癌対象と比較することを含む。ある実施形態において、癌は肺癌である。
【0065】
ある実施形態において、本方法は、対象を低線量らせんコンピュータ断層撮影(LDCT)に供することをさらに含む。ある実施形態において、本方法は、肺癌を有すると診断された対象と正常な非癌対象との間で臨床データを比較することをさらに含む。ある実施形態では、cfDNA断片平均長およびプロファイルは、非癌個体間で類似している。ある実施形態では、癌対象のcfDNA断片プロファイルは変動する。ある実施形態では、1つまたは複数の腫瘍抗原、サイトカインまたはタンパク質の血清レベルが測定される。
【0066】
ある実施形態では、DELFIスコアが生成され、主成分分析が機械学習予測モデルに組み込まれて、各対象についてのスコアが交差検証反復(DELFIスコア)にわたる平均として生成される。ある実施形態において、非癌個体のDELFIスコアは、約0.3未満である。ある実施形態では、病期Iの癌のDELFIスコアは、約0.3~0.5未満である。ある実施形態において、病期IIの癌についてのDELFIスコアは、約0.5~0.8未満である。ある実施形態において、病期IIIの癌についてのDELFIスコアは、約0.8~0.99未満である。ある実施形態では、病期IVのDELFIスコアは、約0.99以上である。ある実施形態において、病期Iの癌のDELFIスコアは約0.35である。ある実施形態において、病期IIの癌のDELFIスコアは、約0.75である。ある実施形態において、病期IIIの癌のDELFIスコアは、約0.9である。ある実施形態において、病期IVの癌のDELFIスコアは、約0.99である。
【0067】
cfDNA断片化プロファイル:cfDNA断片化プロファイルは、1つまたは複数のcfDNA断片化パターンを含み得る。cfDNA断片化パターンは、任意の適切なcfDNA断片化パターンを含み得る。cfDNA断片化パターンの例としては、断片サイズ中央値、断片サイズ分布、大きなcfDNA断片に対する小さなcfDNA断片の比、およびcfDNA断片のカバレッジが挙げられるが、これらに限定されない。いくつかの実施形態では、cfDNA断片化パターンは、中央値断片サイズ、断片サイズ分布、大きいcfDNA断片に対する小さいcfDNA断片の比、およびcfDNA断片のカバレッジのうちの2つ以上(例えば、2つ、3つ、または4つ)を含む。いくつかの実施形態では、cfDNA断片化プロファイルは、ゲノムワイドcfDNAプロファイル(例えば、ゲノムにわたるウィンドウ内のゲノムワイドcfDNAプロファイル)であり得る。いくつかの実施形態において、cfDNA断片化プロファイルは、標的化領域プロファイルであり得る。標的化領域は、ゲノムの任意の適切な部分(例えば、染色体領域)であり得る。本明細書に記載されるようにcfDNA断片化プロファイルを決定することができる染色体領域の例としては、染色体の一部(例えば、2q、4p、5p、6q、7p、8q、9q、10q、11q、12q、および/または14qの一部)および染色体腕(例えば、8q、13q、11q、および/または3pの染色体腕)が挙げられるが、これらに限定されない。いくつかの実施形態では、cfDNA断片化プロファイルは、2つ以上の標的領域プロファイルを含み得る。
【0068】
いくつかの実施形態では、cfDNA断片長の変化(例えば、改変(alternation))を同定するために、cfDNA断片化プロファイルを使用することができる。改変は、ゲノムワイドな改変または1つまたは複数の標的領域/遺伝子座における改変であり得る。標的領域は、1つまたは複数の癌特異的改変を含有する任意の領域であり得る。いくつかの実施形態では、cfDNA断片化プロファイルを使用して、約10個の改変~約500個の改変(例えば、約25~約500、約50~約500、約100~約500、約200~約500、約300~約500、約10~約400、約10~約300、約10~約200、約10~約100、約10~約50、約20~約400、約30~約300、約40~約200、約50~約100、約20~約100、約25~約75、約50~約250、または約100~約200個の改変)を同定(例えば、同時に同定)することができる。
【0069】
いくつかの実施形態では、腫瘍由来DNAを検出するために、cfDNA断片化プロファイルを使用することができる。例えば、cfDNA断片化プロファイルは、癌を有するかまたは有することが疑われる哺乳動物のcfDNA断片化プロファイルを、参照cfDNA断片化プロファイル(例えば、健常哺乳動物のcfDNA断片化プロファイルおよび/または癌を有するかまたは有することが疑われる哺乳動物由来の健常細胞のヌクレオソームDNA断片化プロファイル)と比較することによって、腫瘍由来DNAを検出するために、使用することができる。いくつかの実施形態において、参照cfDNA断片化プロファイルは、健常哺乳動物から以前に生成されたプロファイルである。例えば、本明細書で提供される方法は、健常哺乳動物における参照cfDNA断片化プロファイルを決定するために使用することができ、その参照cfDNA断片化プロファイルは、癌を有するかまたは有することが疑われる哺乳動物における試験cfDNA断片化プロファイルとの将来の比較のために(例えば、コンピュータまたは他の電子記憶媒体に)記憶することができる。いくつかの実施形態において、健常哺乳動物の参照cfDNA断片化プロファイル(例えば、保存されたcfDNA断片化プロファイル)は、全ゲノムにわたって決定される。いくつかの実施形態において、健常哺乳動物の参照cfDNA断片化プロファイル(例えば、保存されたcfDNA断片化プロファイル)は、サブゲノム区間にわたって決定される。
【0070】
いくつかの実施形態では、cfDNA断片化プロファイルは、哺乳動物(例えば、ヒト)を癌(例えば、結腸直腸癌、肺癌、乳癌、胃癌、膵臓癌、胆管癌、および/または卵巣癌)を有すると同定するために使用することができる。
【0071】
cfDNA断片化プロファイルは、cfDNA断片サイズパターンを含み得る。cfDNA断片は、任意の適切なサイズであり得る。例えば、cfDNA断片は、約50塩基対(bp)~約400bpの長さであり得る。本明細書に記載されるように、癌を有する哺乳動物は、健常哺乳動物におけるcfDNA断片サイズ中央値よりも短いcfDNA断片サイズ中央値を含有するcfDNA断片サイズパターンを有し得る。健常哺乳動物(例えば、癌を有さない哺乳動物)は、約166.6bp~約167.2bp(例えば、約166.9bp)のcfDNA断片サイズ中央値を有するcfDNA断片サイズを有し得る。いくつかの実施形態において、癌を有する哺乳動物は、健常哺乳動物におけるcfDNA断片サイズよりも平均して約1.28bp~約2.49bp(例えば、約1.88bp)短いcfDNA断片サイズを有し得る。例えば、癌を有する哺乳動物は、約164.11bp~約165.92bp(例えば、約165.02bp)のcfDNA断片サイズ中央値を有するcfDNA断片サイズを有し得る。
【0072】
cfDNA断片化プロファイルは、cfDNA断片サイズ分布を含み得る。本明細書に記載されるように、癌を有する哺乳動物は、健常哺乳動物におけるcfDNA断片サイズ分布よりも変動性であるcfDNAサイズ分布を有し得る。いくつかの実施形態において、サイズ分布は、標的領域内であり得る。健常哺乳動物(例えば、癌を有さない哺乳動物)は、約1または約1未満の標的領域cfDNA断片サイズ分布を有し得る。いくつかの実施形態では、癌を有する哺乳動物は、健常哺乳動物における標的領域cfDNA断片サイズ分布よりも長い(例えば、10、15、20、25、30、35、40、45、50もしくはそれ以上のbpで長い、またはこれらの数の間の任意の数の塩基対)標的領域のcfDNA断片サイズ分布を有し得る。いくつかの実施形態では、癌を有する哺乳動物は、健常哺乳動物における標的領域cfDNA断片サイズ分布よりも短い(例えば、10、15、20、25、30、35、40、45、50もしくはそれ以上のbpで短い、またはこれらの数の間の任意の数の塩基対短い)標的領域cfDNA断片サイズ分布を有し得る。いくつかの実施形態では、癌を有する哺乳動物は、健常哺乳動物における標的領域cfDNA断片サイズ分布よりも約47bp小さい~約30bp長い標的領域cfDNA断片サイズ分布を有することができる。いくつかの実施形態では、癌を有する哺乳動物は、平均してcfDNA断片の長さにおいて10、11、12、13、14、15、15、17、18、19、20bpまたはそれ以上の差の標的領域cfDNA断片サイズ分布を有することができる。例えば、癌を有する哺乳動物は、cfDNA断片の長さが平均して約13bp異なる標的領域cfDNA断片サイズ分布を有し得る。いくつかの実施形態において、サイズ分布は、ゲノムワイドサイズ分布であり得る。健常哺乳動物(例えば、癌を有さない哺乳動物)は、ゲノムワイドで短いcfDNA断片および長いcfDNA断片の非常に類似した分布を有し得る。いくつかの実施形態では、癌を有する哺乳動物は、ゲノムワイドで、cfDNA断片サイズの1つまたは複数の変化(例えば、増加および減少)を有し得る。1つまたは複数の改変は、ゲノムの任意の適切な染色体領域であり得る。例えば、変化は染色体の一部であり得る。cfDNA断片サイズの1つまたは複数の変化を含有し得る染色体の部分の例としては、2q、4p、5p、6q、7p、8q、9q、10q、11q、12q、および14qの部分が挙げられるが、これらに限定されない。例えば、改変は、染色体腕(例えば、染色体腕全体)にわたるものであり得る。
【0073】
cfDNA断片化プロファイルは、大きいcfDNA断片に対する小さいcfDNA断片の比、および参照断片比に対する断片比の相関を含むことができる。本明細書で使用される場合、大きいcfDNA断片に対する小さいcfDNA断片の比に関して、小さいcfDNA断片は、約100bp長~約150bp長であり得る。本明細書で使用される場合、大きいcfDNA断片に対する小さいcfDNA断片の比に関して、大きいcfDNA断片は、約151bp長~220bp長であり得る。本明細書に記載されるように、癌を有する哺乳動物は、健常哺乳動物よりも低い(例えば、2倍低い、3倍低い、4倍低い、5倍低い、6倍低い、7倍低い、8倍低い、9倍低い、10倍低い、またはそれ以上低い)断片比の相関(例えば、1つまたは複数の健常哺乳動物由来のDNA断片比などの参照DNA断片比に対するcfDNA断片比の相関)を有し得る。健常哺乳動物(例えば、癌を有さない哺乳動物)は、約1(例えば、約0.96)の断片比の相関(例えば、1つまたは複数の健常哺乳動物由来のDNA断片比などの参照DNA断片比に対するcfDNA断片比の相関)を有し得る。いくつかの実施形態では、癌を有する哺乳動物は、健常哺乳動物における断片比の相関(例えば、1つまたは複数の健常哺乳動物由来のDNA断片比などの参照DNA断片比に対するcfDNA断片比の相関)よりも平均して約0.19~約0.30(例えば、約0.25)低い断片比の相関(例えば、1つまたは複数の健常哺乳動物由来のDNA断片比などの参照DNA断片比に対するcfDNA断片比の相関)を有し得る。
【0074】
cfDNA断片化プロファイルは、全ての断片のカバレッジを含み得る。全ての断片のカバレッジは、カバレッジのウィンドウ(例えば、重複しないウィンドウ)を含むことができる。いくつかの実施形態において、全ての断片のカバレッジは、小さな断片(例えば、約100bp~約150bpの長さの断片)のウィンドウを含み得る。いくつかの実施形態において、全ての断片のカバレッジは、大きな断片(例えば、約151bp~約220bpの長さの断片)のウィンドウを含み得る。
【0075】
cfDNA断片化プロファイルは、任意の適切な方法を使用して得ることができる。いくつかの実施形態では、哺乳動物(例えば、癌を有するか、または癌を有することが疑われる哺乳動物)由来のcfDNAを、全ゲノム配列決定(例えば、低カバレッジ全ゲノム配列決定)に供することができる配列決定ライブラリーに処理し、ゲノムにマッピングし、分析してcfDNA断片長を決定することができる。マッピングされた配列は、ゲノムをカバーする非重複ウィンドウにおいて分析することができる。ウィンドウは任意の適切なサイズとすることができる。例えば、ウィンドウは、数千から数百万の塩基長であり得る。1つの非限定的な例として、ウィンドウは、約5メガ塩基(Mb)長であり得る。任意の適切な数のウィンドウをマッピングすることができる。例えば、数十から数千のウィンドウをゲノムにマッピングすることができる。例えば、数百から数千のウィンドウをゲノム中にマッピングすることができる。cfDNA断片化プロファイルは、各ウィンドウ内で決定することができる。
【0076】
いくつかの実施形態では、本明細書に記載される方法および材料はまた、機械学習を含み得る。例えば、機械学習は、改変した断片化プロファイルを同定するために使用することができる(例えば、cfDNA断片のカバレッジ、cfDNA断片の断片サイズ、染色体およびmtDNAのカバレッジを使用して)。
【0077】
バイオマーカー
ある実施形態において、患者からの1つまたは複数のバイオマーカーの検出は、以下の実施例の節において詳細に記載されるように、DELFIと組み合わされる。ある実施形態では、1つまたは複数の腫瘍抗原、サイトカインまたはタンパク質の血清レベルが測定、比較等される。
【0078】
本明細書で使用される場合、「比較すること」または「比較」という用語は、患者由来の試料中の1つまたは複数のバイオマーカーの割合、レベルまたは細胞局在が、標準または対照試料中の対応する1つまたは複数のバイオマーカーの割合、レベルまたは細胞局在とどのように関連するかの評価を行うことを指す。例えば、「比較すること」は、患者由来の試料中の1つまたは複数のバイオマーカーの割合、レベル、または細胞局在が、標準または対照試料中の対応する1つまたは複数のバイオマーカーの割合、レベル、または細胞局在と同じであるか、より多いかもしくはより少ないか、または異なるかどうかを評価することを指し得る。より具体的には、この用語は、患者由来の試料中の1つまたは複数のバイオマーカーの割合、レベル、または細胞局在が、例えば、肺癌を有する患者、肺癌を有さない患者、心筋傷害の治療に応答している患者、心筋傷害の治療に応答していない患者、特定の心筋傷害治療に応答する可能性がない患者、または別の疾患もしくは状態を有する/有していない患者に対応する所定のバイオマーカーレベル/比の割合、レベル、または細胞局在と同じであるか、より多いかもしくはより少ないか、異なるか、またはそうでなければ対応する(もしくはしない)かどうかを評価することを指し得る。ある実施形態では、「比較すること」という用語は、患者由来の試料中の本発明の1つまたは複数のバイオマーカーのレベルが、対照試料中の同じバイオマーカーのレベル/比(例えば、健常個体と相関する所定のレベル/比、肺癌レベル/比など)と同じであるか、より多いかまたはより少ないか、他とは異なるか、そうでなければ、対照試料中の同じバイオマーカーのレベル/比に対応する(または対応しない)かどうかを評価することを指す。別の実施形態では、「比較すること」または「比較」という用語は、患者由来の試料中の1つまたは複数のバイオマーカーの割合、レベルまたは細胞局在が、同じ試料中の別のバイオマーカーの割合、レベルまたは細胞局在とどのように関連するかの評価を行うことを指す。例えば、同じ患者試料からのあるバイオマーカーと別のバイオマーカーとの比が比較され得る。別の実施形態では、試料中の1つのバイオマーカー(例えば、翻訳後改変されたバイオマーカータンパク質)のレベルを、試料中の同じバイオマーカー(例えば、改変されていないバイオマーカータンパク質)のレベルと比較することができる。改変:非改変バイオマーカータンパク質の比は、同じ試料中の他のタンパク質比または所定の参照もしくは対照比と比較され得る。
【0079】
バイオマーカーの関係が比率に関して記載されるある実施形態において、比率は、1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、11倍、12倍、13倍、14倍、15倍、16倍、17倍、18倍、19倍、20倍、21倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍、22倍、23倍、24倍、25倍、26倍、27倍、28倍、29倍、30倍、31倍、22倍、23倍、24倍、25倍、26倍、36倍、37倍、44倍、45倍、46倍、47倍、48倍、49倍、50倍、51倍、52倍、53倍、54倍、55倍、56倍、63倍、64倍、65倍、66倍、67倍、68倍、69倍、70倍、71倍、72倍、73倍、74倍、75倍、76倍、77倍、78倍、79倍、80倍、81倍、82倍、83倍、84倍、85倍、86倍、87倍、88倍、89倍、90倍、91倍、92倍、93倍、94倍、95倍、96倍、97倍、98倍、99倍、100倍またはそれ以上の差(より高いまたは低い)を含み得る。あるいは、その相違として、文脈に応じて、0.9倍、0.8倍、0.7倍、0.7倍、0.6倍、0.5倍、0.4倍、0.3倍、0.2倍、および0.1倍(より高いまたはより低い)を含み得る。前述のことはまた、範囲(例えば、1~5倍高いまたは低い)または閾値(例えば、少なくとも2倍高いまたは低い)に関して表現され得る。
【0080】
他の実施形態において、1つまたは複数のバイオマーカーの量の特定のセットまたはパターンは、罹患していない患者と相関され得る(すなわち、患者が癌、例えば肺癌を有さないことを示す)。ある実施形態では、本開示に従って使用される「示す」または「相関させる」は、診断の評価、癌または癌進行の予測、臨床治療の有効性の評価、特定の治療計画または医薬品に応答し得る患者の同定、治療の進行のモニタリングのための、およびスクリーニングアッセイの文脈において、抗癌治療薬の同定のための、バイオマーカーのレベル/比と標準値、対照値または比較値との間の関係を定量化する任意の線形または非線形方法によるものであり得る。
【0081】
ある実施形態において、検出されるバイオマーカーは腫瘍抗原である。ある実施形態では、1つまたは複数の腫瘍抗原は、癌胎児性抗原(CEA)、CA19-9、CA125、組織ポリペプチド抗原(TSA)、CYFRA-21-1、ニューロン特異的エノラーゼ、プロガストリン放出ペプチド(ProGRP)、血漿カリクレインB1(KLKB1)、血清中アミロイドA、ハプトグロビン-α-2、ADAM-17、オステオプロテゲリン、ペントラキシン3、フォリスタチン、腫瘍壊死因子受容体スーパーファミリーメンバー1Aまたはそれらの組合せを含む。
【0082】
ある実施形態において、1つまたは複数のタンパク質は、C反応性タンパク質(CRP)、キチナーゼ-3-様タンパク質1(YKL-40/CHI3L1)またはそれらの断片を含む。
【0083】
他の腫瘍抗原は、以下が挙げられる(ただし、示される癌指標は非限定的な例を示す):アミノペプチダーゼN(CD13)、アネキシンA1、B7-H3(CD276、様々な癌)、CA125(卵巣癌)、CA15-3(癌腫)、CA19-9(癌腫)、L6(癌腫)、Lewis Y(癌腫)、Lewis X(癌腫)、アルファ・フェトプロテイン(癌腫)、CA242(結腸直腸癌)、胎盤アルカリホスファターゼ(癌腫)、前立腺特異的抗原(前立腺癌)、前立腺酸性ホスファターゼ(前立腺癌)、上皮増殖因子(癌腫)、CD2(Hodgkin病、NHLリンパ腫、多発性骨髄腫)、CD3イプシロン(T細胞リンパ腫、肺癌、乳癌、胃癌、卵巣癌、自己免疫疾患、悪性腹水)、CD19(B細胞悪性腫瘍)、CD20(非ホジキンリンパ腫、B細胞腫瘍、自己免疫疾患)、CD21(B細胞リンパ腫)、CD22(白血病、リンパ腫、多発性骨髄腫、SLE)、CD30(ホジキンリンパ腫)、CD33(白血病、自己免疫疾患)、CD38(多発性骨髄腫)、CD40(リンパ腫、多発性骨髄腫、白血病(CLL))、CD51(転移性黒色腫、肉腫)、CD52(白血病)、CD56(小細胞肺癌、卵巣癌、メルケル細胞癌、および液状腫瘍、多発性骨髄腫)、CD66e(癌腫)、CD70(転移性腎細胞癌および非ホジキンリンパ腫)、CD74(多発性骨髄腫)、CD80(リンパ腫)、CD98(癌腫)、CD123(白血病)、ムチン(癌腫)、CD221(固形腫瘍)、CD227(乳癌、卵巣癌)、CD262(NSCLCおよびその他の癌)、CD309(卵巣癌)、CD326(固形腫瘍)、CEACAM3(結腸直腸癌、胃癌)、CEACAM5(CEA、CD66e)(乳癌、結腸直腸癌、肺癌)、DLL4(A-様-4(A-like-4))、EGFR(様々な癌)、CTLA4(悪性黒色腫)、CXCR4(CD 184,血液腫瘍、固形腫瘍)、Endoglin(CD105、固形腫瘍)、EPCAM(epithelial cell adhesion molecule、膀胱癌、頭頸部癌、結腸癌、NHL前立腺癌、卵巣癌)、ERBB2(肺癌、乳癌、前立腺癌)、FCGR1(自己免疫疾患)、FOLR(葉酸受容体、卵巣癌)、FGFR(癌腫)、GD2ガングリオシド(癌腫)、G-28(細胞表面抗原糖脂質、悪性黒色腫)、GD3イディオタイプ(癌腫)、熱ショックタンパク質(癌腫)、HER1(肺癌、胃癌)、HER2(乳癌、肺癌、および卵巣癌)、HLA-DR10(NHL)、HLA-DRB(NHL、B細胞白血病)、ヒト絨毛性ゴナドトロピン(癌腫)、IGF1R(固形腫瘍、血液癌)、IL-2受容体(T細胞白血病およびリンパ腫)、IL-6R(多発性骨髄腫、RA、キャッスルマン病、IL6依存性腫瘍)、インテグリン(ανβ3、α5β1、α6β4、α11β3、α5β5、ανβ5、様々な癌に対する)、MAGE-1(癌腫)、MAGE-2(癌腫)、MAGE-3(癌腫)、MAGE-4(癌腫)、抗トランスフェリン受容体(癌腫)、p97(悪性黒色腫)、MS4A1(membrane-spanning 4-domains subfamily A member 1、非ホジキンB細胞リンパ腫、白血病)、MUC1(乳癌、卵巣癌、子宮頸癌、気管支癌、消化器癌)、MUC16(CA125)(卵巣癌)、CEA(結腸直腸癌)、gp100(悪性黒色腫)、MARTI(悪性黒色腫)MPG(悪性黒色腫)、MS4A1(膜貫通4領域サブファミリーA、小細胞肺癌、NHL)、ヌクレオリン、Neu癌遺伝子産物(癌腫)、P21(癌腫)、nectin-4(癌腫)、抗-(N-グリコリルノイラミン酸、乳癌、悪性黒色腫癌)のパラトープ(paratope)、PLAP様精巣アルカリホスファターゼ(卵巣癌、精巣癌)、PSMA(前立腺腫瘍)、PSA(前立腺癌)、ROB04、TAG72(tumor associated glycoprotein 72、AML、胃癌、結腸直腸癌、卵巣癌)、T細胞膜貫通タンパク質(癌)、Tie(CD202b)、組織因子、TNFRSF10B(tumor necrosis factor receptor superfamily member 10B、癌腫)、TNFRSF13B(tumor necrosis factor receptor superfamily member 13B、多発性骨髄腫、NHL、その他の癌、RAおよびSLE)、TPBG(trophoblast glycoprotein、腎細胞癌)、TRAIL-R1(tumor necrosis apoptosis inducing ligand receptor 1、リンパ種、NHL、結腸直腸癌、肺癌)、VCAM-1(CD106、悪性黒色腫)、VEGF、VEGF-A、VEGF-2(CD309)(様々な癌)。いくつかの他の腫瘍関連抗原が概説されている(Gerber,et al,mAbs 2009 1:247-253;Novellino et al,Cancer Immunol Immunother. 2005 54:187-207、Franke, et al.Cancer Biother Radiopharm. 2000,15:459-76、Guo et al.Adv Cancer Res.2013;119:421-475、Parmiani et al.、J Immunol. 2007 178:1975-9)。これらの抗原の例としては、分化抗原群(CD4、CD5、CD6、CD7、CD8、CD9、CD10、CDlla、CDllb、CDllc、CD12w、CD14、CD15、CD16、CDwl7、CD18、CD21、CD23、CD24、CD25、CD26、CD27、CD28、CD29、CD31、CD32、CD34、CD35、CD36、CD37、CD41、CD42、CD43、CD44、CD45、CD46、CD47、CD48、CD49b、CD49c、CD53、CD54、CD55、CD58、CD59、CD61、CD62E、CD62L、CD62P、CD63、CD68、CD69、CD71、CD72、CD79、CD81、CD82、CD83、CD86、CD87、CD88、CD89、CD90、CD91、CD95、CD96、CD100、CD103、CD105、CD106、CD109、CD117、CD120、CD127、CD133、CD134、CD135、CD138、CD141、CD142、CD143、CD144、CD147、CD151、CD152、CD154、CD156、CD158、CD163、CD166、.CD168、CD184、CDwl86、CD195、CD202(a、b)、CD209、CD235a、CD271、CD303、CD304)、アネキシンAl、ヌクレオリン、エンドグリン(CD105)、ROB04、アミノペプチダーゼN、-like-4(DLL4)、VEGFR-2(CD309)、CXCR4(CD184)、Tie2、B7-H3、WT1、MUC1、LMP2、HPV E6 E7、EGFRvIII、HER-2/neu、イディオタイプ(idiotype)、MAGE A3、p53非変異体、NY-ESO-1、GD2、CEA、MelanA/MARTl、Ras変異体、gp100、p53変異体、プロテイナーゼ3(PR1)、bcr-abl、チロシナーゼ、サバイビン、hTERT、肉腫転座切断点(translocation breakpoint)、EphA2、PAP、ML-IAP、AFP、EpCAM、ERG(TMPRSS2 ETS融合遺伝子)、NA17、PAX3、ALK、アンドロゲン受容体、サイクリンBl、ポリシアル酸、MYCN、RhoC、TRP-2、GD3、フコシルGMl、メソセリン、PSCA、MAGE Al、sLe(a)、CYPIB I、PLACl、GM3、BORIS、Tn、GloboH、ETV6-AML、NY-BR-1、RGS5、SART3、STn、炭酸脱水酵素IX、PAX5、OY-TES1、精子タンパク質17、LCK、HMWMAA、AKAP-4、SSX2、XAGE1、B7H3、レグマイン、Tie 2、VEGFR2、MAD-CT-1、FAP、PDGFR-β、MAD-CT-2、Notch1、ICAM1およびFos関連抗原1。
【0084】
治療方法
ある実施形態では、本明細書で具体化される方法は、哺乳動物を癌を有するものとして同定する。本方法は、cfDNA断片の全ゲノム配列決定;ゲノム起源へのcfDNA断片のマッピングならびに断片長の評価および各試料についてのゲノムワイド断片化プロファイルの取得;対象のタンパク質バイオマーカーの同定;対象のcfDNA断片化プロファイルおよびタンパク質バイオマーカーと正常参照非癌対象との比較を含む。cfDNA断片化プロファイルを参照cfDNA断片化プロファイルと比較し、哺乳動物から得られた試料中のcfDNA断片化プロファイルが参照cfDNA断片化プロファイルと異なる場合に、哺乳動物を癌を有すると同定する。
【0085】
ある実施形態において、対象は、癌、例えば、初期段階の癌を有すると診断される。ある実施形態では、癌のタイプが同定され、癌は、癌のタイプに特異的な治療法を含む様々な治療方法によって治療される。癌治療は、手術、アジュバント化学療法、ネオアジュバント化学療法、放射線療法、ホルモン療法、細胞毒性療法、免疫療法、養子T細胞療法、標的療法、またはそれらの任意の組合せであり得る。本方法はまた、哺乳動物に癌治療(例えば、手術、アジュバント化学療法、ネオアジュバント化学療法、放射線療法、ホルモン療法、細胞毒性療法、免疫療法、養子T細胞療法、標的療法、またはそれらの任意の組み合わせ)を施すことを含み得る。哺乳動物は、癌治療を受けた後に癌の存在についてモニターされ得る。
【0086】
癌療法は、一般に、化学治療および放射線治療の両方との様々な併用療法も含む。併用化学療法としては、例えば、シスプラチン(CDDP)、カルボプラチン、プロカルバジン、メクロレタミン、シクロホスファミド、カンプトテシン、イフォスファミド、メルファラン、クロランブシル、ブスルファン、ニトロソウレア、ダクチノマイシン、ダウノルビシン、ドキソルビシン、ブレオマイシン、プリコマイシン、マイトマイシン、エトポシド(VP16)、タモキシフェン、ラロキシフェン、エストロゲン受容体結合剤、タキソール、ゲムシタビン、ナベルビン、ファルネシルタンパク質トランスフェラーゼ阻害剤、トランスプラチナム、5-フルオロウラシル、ビンクリスチン、ビンブラスチンおよびメトトレキサート、Temozolomide(DTICの水性形態)、または前述の任意の類似体もしくは誘導体変異体が挙げられる。化学療法と生物学的療法との組み合わせは、生物化学療法として知られている。化学療法は、メトロノミック(metronomic)化学療法として知られている低連続用量で投与することもできる。
【0087】
さらに別の併用化学療法としては、例えば、チオテパおよびシクロホスファミドなどのアルキル化剤;ブスルファン、インプロスルファンおよびピポスルファンなどのスルホン酸アルキル;ベンゾドーパ、カルボコン、メトウレドーパおよびウレドーパなどのアジリジン;アルトレタミン、トリエチレンメラミン、トリエチレンホスホルアミド、トリエチレンチオホスホルアミドおよびトリメチロールメラミンを含むエチレンイミンおよびメチルアメラミン(methylamelamines);アセトゲニン(特に、ブラタシンおよびブラタシノン);カンプトテシン(特に、合成類似体トポテカンを含む);ドラスタチン;デュオカルマイシン(合成類似体KW-2189およびCB1-TM1を含む);エレウテロビン;パンクラチスタチン;サルコジクチン;スポンジスタチン;クロラムブシル、クロルナファジン、コロホスファミド、エストラムスチン、イホスファミド、メクロレタミン、メクロレタミンオキシド塩酸塩、メルファラン、ノベンビチン、フェネステリン、プレドニムスチン、トロホスファミド、ウラシルマスタードなどのナイトロジェンマスタード;カルムスチン、クロロゾトシン、ホテムスチン、ロムスチン、ニムスチン、ラニムスチンなどのニトロソ尿素;エネジイン系抗生物質などの抗生物質(例えば、カリキアミシン、特にカリキアミシンガモールおよびカリキアミシンオメガール;ダイネミシンAなどのダイネミシン;ビスホスホネート、例えばクロドロネート;エスペラマイシン;ならびにネオカルジノスタチンクロモフォアおよび関連するクロモプロテイン・エネディイン抗生物質クロモフォア、アクラシノマイシン、アクチノマイシン、オートラルニシン、アザセリン、ブレオマイシン、カクチノマイシン、カラビシン、カルミノマイシン、カルジノフィリン、クロモマイシン、ダクチノマイシン、ダウノルビシン、デトルビシン、6-ジアゾ-5-オキソ-L-ノルロイシン、ドキソルビシン(モルホリノ-ドキソルビシン、シアノモルホリノ-ドキソルビシン、2-ピロリノ-ドキソルビシン、およびデオキシドキソルビシンを含む)、エピルビシン、エソルビシン、イダルビシン、マルセロマイシン、マイトマイシンCなどのマイトマイシン類、ミコフェノール酸、ノガラルニシン、オリボマイシン、ペプロマイシン、ポトフィロマイシン、ピューロマイシン、ケラマイシン、ロドルビシン、ストレプトニグリン、ストレプトゾシン、ツベルシジン、ウベニメクス、ジノスタチン、ゾルビシンなどのマイトマイシン類;メトトレキサートおよび5-フルオロウラシル(5-FU)などの代謝拮抗薬;デノプテリン、プテロプテリン、トリメトレキサートなどの葉酸類似物質;フルダラビン、6-メルカプトプリン、チアミプリン、チオグアニンなどのプリン類似体;アンシタビン、アザシチジン、6-アザウリジン、カルモファー、シタラビン、ジデオキシウリジン、ドキシフルリジン、エノシタビン、フロクスウリジンなどのピリミジン類似体;カルステロン、プロピオン酸ドロモスタノロン、エピチオスタノール、メピチオスタン、テストラクトンなどのアンドロゲン;ミトタン、トリロスタンなどの抗アドレナリン剤;フロリン酸などの葉酸補充剤;アセグラトン;アルドホスファミド配糖体;アミノレブリン酸;エニルラシル;アムサクリン;ベストラブシル(bestrabucil);ビサントレン;エダトラキセート;デフォファミン;デメコルシン;ジアジコン;エルホルミチン;酢酸エリプチニウム;エポチロン;エトグルシド;硝酸ガリウム;ヒドロキシ尿素;レンチナン;ロニダイニン;メイタンシンおよびアンサミトシンなどのメイタンシノイド;ミトグアゾン;ミトキサントロン;モピダンモール;ニトラエリン;ペントスタチン;フェナメット;ピラルビシン;ロソキサントロン;ポドフィリン酸;2-エチルヒドラジド;プロカルバジン;PSK多糖複合体;ラゾキサン;リゾキシン;シゾフィラン;スピロゲルマニウム;テヌアゾン酸;トリアジコン;2,2’,2’’-トリクロロトリエチルアミン;トリコテセン類(特にT-2毒素、ベラキュリンA、ロリジンAおよびアングイジン);ウレタン;ビンデシン;ダカルバジン;マンノムスチン;ミトブロニトール;ミトラクトール;ピポブロマン;ガセトシン;アラビノシド(「Ara-C」);シクロホスファミド;タキソイド、例えばパクリタキセルおよびドセタキセルゲムシタビン;6-チオグアニン;メルカプトプリン;シスプラチン、オキサリプラチン、およびカルボプラチンなどの白金錯体;ビンブラスチン;白金;エトポシド(VP-16);イホスファミド;ミトキサントロン;ビンクリスチン;ビノレルビン;ノバントロン;テニポシド;エダトレキセート;ダウノマイシン;アミノプテリン;ゼローダ;イバンドロネート;イリノテカン(例えばCPT-11);トポイソメラーゼ阻害剤RFS2000;ジフルオロメチルオルニチン(DMFO);レチノイン酸などのレチノイド;カペシタビン;カルボプラチン、プロカルバジン、プリコマイシン、ゲムシタビエン、ナベルビン、ファルネシル-タンパク質転移酵素阻害剤、トランス白金;および上記のいずれかの薬学的に許容される塩、酸または誘導体。
【0088】
免疫療法は、一般に、癌細胞を標的とし破壊するための免疫エフェクター細胞および分子の使用に依存する。免疫エフェクターは、例えば、腫瘍細胞の表面上のいくつかのマーカーに特異的な抗体であり得る。抗体は単独で治療のエフェクターとして機能し得るか、または他の細胞を動員して実際に細胞死滅をもたらし得る。抗体はまた、薬物または毒素(化学療法剤、放射性核種、リシンA鎖、コレラ毒素、百日咳毒素など)に結合体化され得、そして単に標的化剤として作用し得る。あるいは、エフェクターは、腫瘍細胞標的と直接または間接的に相互作用する表面分子を有するリンパ球であってもよい。種々のエフェクター細胞としては、細胞傷害性T細胞およびNK細胞、ならびにキメラ抗原受容体を発現するように改変されたこれらの細胞型の遺伝子操作された改変体が挙げられる。
【0089】
免疫療法は、制御性T細胞(Treg)、骨髄由来サプレッサー細胞(MDSC)および癌関連線維芽細胞(CAF)の抑制を含み得る。いくつかの実施形態では、免疫療法は、腫瘍ワクチン(例えば、全腫瘍細胞ワクチン、ペプチド、および組換え腫瘍関連抗原ワクチン)、または養子細胞療法(ACT)(例えば、T細胞、ナチュラルキラー細胞、TIL、およびLAK細胞)である。T細胞は、特定の腫瘍抗原に対するキメラ抗原受容体(CAR)またはT細胞受容体(TCR)を用いて操作され得る。本明細書で使用される場合、キメラ抗原受容体(またはCAR)は、T細胞において発現された場合に、CARの特異性をT細胞に付与する、目的の抗原に特異的な任意の操作された受容体を指し得る。標準的な分子技術を使用して作製されると、キメラ抗原受容体を発現するT細胞は、養子細胞移入などの技術を用いて患者に導入され得る。いくつかの態様では、T細胞は、γ-IFN産生 CD4および/もしくはCD8 T細胞によって、ならびに/またはその組合せの投与前と比較して増強された細胞溶解活性によって特徴付けられる、個体において活性化されたCD4および/またはCD8 T細胞である。CD4および/またはCD8 T細胞は、IFN-γ、TNF-αおよびインターロイキンからなる群から選択されるサイトカインの放出の増加を示し得る。CD4および/またはCD8 T細胞は、エフェクターメモリーT細胞であり得る。ある実施形態では、CD4および/またはCD8エフェクターメモリーT細胞は、CD44highCD62Llowの発現を有することを特徴とする。
【0090】
免疫療法は、1つまたは複数の癌抗原、特にタンパク質もしくはその免疫原性断片、前記癌抗原、特にタンパク質もしくはその免疫原性断片をコードするDNAもしくはRNA、癌細胞溶解物、および/または腫瘍細胞からのタンパク質調製物を含む癌ワクチンであってもよい。本明細書中で使用される場合、癌抗原は、癌細胞中に存在する抗原性物質である。変異に起因する異常な構造を有する癌細胞において産生される任意のタンパク質は、基本的には、癌抗原として作用し得る。癌抗原は、基本的には、突然変異癌遺伝子および腫瘍抑制遺伝子の産物、他の突然変異遺伝子の産物、過剰発現または異常発現細胞タンパク質、発癌性ウイルスによって産生される癌抗原、癌胎児性抗原、変化した細胞表面糖脂質および糖タンパク質、または細胞型特異的分化抗原であり得る。癌抗原の例には、rasおよびp53遺伝子の異常産物が含まれる。他の例としては、組織分化抗原、突然変異タンパク質抗原、発癌性ウイルス抗原、癌-精巣抗原および血管または間質特異的抗原が含まれる。組織分化抗原は、ある種の組織に特異的なものである。変異タンパク質抗原は、正常細胞がこれらのタンパク質を含むはずがないので、癌細胞に対してはるかに特異的である可能性が高い。正常細胞は、それらのMHC分子上に正常タンパク質抗原を提示するが、癌細胞は、突然変異体バージョンを提示する。いくつかのウイルスタンパク質は癌の形成に関与しており、いくつかのウイルス抗原も癌抗原である。癌-精巣抗原は、主に精巣の生殖細胞において発現されるが、胎児の卵巣および栄養膜においても発現される抗原である。いくつかの癌細胞は、これらのタンパク質を異常に発現し、したがってこれらの抗原を提示し、これらの抗原に特異的なT細胞による攻撃を可能にする。このタイプの例示的な抗原は、CTAG1 BおよびMAGEA1、ならびに上皮成長因子受容体(EGFR)vlII変異体を標的とする14マー皮内注射可能ペプチドワクチンであるRindopepimutである。Rindopepimutは、本明細書に記載されるCD95/CD95Lシグナル伝達系の阻害剤と組み合わせて使用される場合、神経膠芽腫を治療するのに特に適している。また、通常は非常に少量しか産生されないが、その産生が癌細胞において劇的に増加するタンパク質は、免疫応答を誘発し得る。このようなタンパク質の例は、メラニン産生に必要な酵素チロシナーゼである。通常、チロシナーゼは微量で産生されるが、そのレベルは黒色腫細胞において非常に上昇する。癌胎児性の抗原は、癌抗原の別の重要なクラスである。例は、アルファフェトプロテイン(AFP)および癌胎児性抗原(CEA)である。これらのタンパク質は、通常、胚発生の初期段階で産生され、免疫系が完全に発達するまでに消失する。従って、自己寛容はこれらの抗原に対して発達しない。異常タンパク質はまた、オンコウイルス(例えば、EBVおよびHPV)に感染した細胞によって産生される。これらのウイルスに感染した細胞は潜在ウイルスDNAを含み、これが転写され、得られたタンパク質が免疫応答を生じる。癌ワクチンは、ペプチド癌ワクチンを含み得、これは、いくつかの実施形態では、個別化ペプチドワクチンである。いくつかの実施形態において、ペプチド癌ワクチンは、多価長ペプチドワクチン、マルチペプチドワクチン、ペプチドカクテルワクチン、ハイブリッドペプチドワクチン、またはペプチドパルス樹状細胞ワクチンである。
【0091】
免疫療法は、ポリクローナル抗体調製物の一部などの抗体であってもよく、またはモノクローナル抗体であってもよい。抗体は、ヒト化抗体、キメラ抗体、抗体断片、二重特異性抗体または単鎖抗体であってもよい。本明細書に開示される抗体は、限定されないが、Fab、Fab’およびF(ab’)2、Fd、単鎖Fvs(scFv)、単鎖抗体、ジスルフィド結合Fvs(sdfv)およびVLまたはVHドメインのいずれかを含む断片などの抗体断片を含む。いくつかの態様では、抗体またはその断片は、上皮成長因子受容体(EGFR1、Erb-B1)、HER2/neu(Erb-B2)、CD20、血管内皮成長因子(VEGF)、インスリン様成長因子受容体(IGF-1R)、TRAIL受容体、上皮細胞接着分子、癌胎児性抗原、前立腺特異的膜抗原、ムチン-1、CD30、CD33、またはCD40に特異的に結合する。
【0092】
モノクローナル抗体の例としては、限定されないが、以下が挙げられる:トラスツズマブ(抗HER2/neu抗体);ペルツズマブ(抗HER2mAb);セツキシマブ(上皮成長因子受容体EGFRに対するキメラモノクローナル抗体);パニツムマブ(抗EGFR抗体);ニモツズマブ(抗EGFR抗体);ザルツムマブ(抗EGFR mAb);ネシツムマブ(抗EGFR mAb);MDX-210(ヒト化抗HER-2 二重特異性抗体);MDX-210(ヒト化抗HER-2 二重特異性抗体);MDX-447(ヒト化抗EGF受容体 二重特異性抗体);リツキシマブ(マウス/ヒトキメラ抗CD20 mAb);オビヌツズマブ(抗CD20 mAb);オファツムマブ(抗CD20 mAb);トシツムマブ-I 131(抗CD20 mAb);イブリツモマブチウキセタン(抗CD20 mAb);ベバシズマブ(抗VEGF mAb);ラムシルマブ(抗VEGFR2 mAb);ラニビズマブ(抗VEGF mAb);アフリベルセプト(IgG1 Fcに融合したVEGFR1およびVEGFR2の細胞外ドメイン);AMG386(IgG1 Fcに融合したアンジオポエチン-1および-2結合ペプチド);ダロツズマブ(抗IGF-1R mAb);ゲムツズマブオゾガマイシン(抗CD33 mAb);アレムツズマブ(抗Campath-1/CD52 mAb);ブレンツキシマブベドチン(抗CD30 mAb);カツマキソマブ(上皮細胞接着分子およびCD3を標的とする二重特異性mAb);ナプツモマブ(抗5T4 mAb);ギレンツキシマブ(抗炭酸脱水酵素ix);またはファルレツズマブ(抗葉酸受容体)。他の例には、PanorexTMなどの抗体が含まれる。(17-1A)(マウスモノクローナル抗体);Panorex(MAb17-1A)(マウスキメラモノクローナル抗体);BEC2(抗イディオタイプmAb、GDエピトープを模倣する)(BCGを伴う);Oncolym(Lym-1モノクローナル抗体);SMART M195 Ab、ヒト化13’1 LYM-1(Oncolym)、Ovarex(B43.13、抗イディオタイプマウスmAb);腺癌上のEGP40(17-1A)汎癌抗原に結合する3622W94 mAb;Zenapax(SMART抗Tac(IL-2受容体);SMART M195 Ab、ヒト化Ab、ヒト化);NovoMAb-G2(汎癌特異的Ab);TNT(ヒストン抗原に対するキメラmAb);TNT(ヒストン抗原に対するキメラmAb);Gliomab-H(モノクローナル-ヒト化Ab);GNI-250 Mab;EMD-72000(キメラ-EGFアンタゴニスト);LymphoCide(ヒト化IL.L.2抗体);およびMDX-260二重特異性は、GD-2、ANA Ab、SMART IDIO Ab、SMART ABL 364 AbまたはImmuRAIT-CEAを標的とする。抗体のさらなる例としては、以下が挙げられる:Zanulimumab(抗CD4 mAb)、ケリキシマブ(抗CD4 mAb);イピリムマブ(MDX-101;抗CTLA-4 mAb);トレミリムマブ(抗CTLA-4 mAb);ダクリズマブ(抗IL-25/IL-2R mAb);バシリキシマブ(抗IL-25/IL-2R mAb);MDX-1106(抗PD1 mAb);GITRに対する抗体;GC1008(抗TGF-β抗体);メテリムマブ/CAT-192(抗TGF-β抗体);レルデリムマブ/CAT-152(抗TGF-β抗体);ID11(抗TGF-β抗体);デノスマブ(抗RANKL mAb);BMS-663513(ヒト化抗4-1BB mAb);SGN-40(ヒト化抗CD40 mAb);CP870,893(ヒト抗CD40 mAb);インフリキシマブ(キメラ抗TNF mAb);アダリムマブ(ヒト抗TNF mAb);セルトリズマブ(ヒト化Fab抗TNF);ゴリムマブ(抗TNF);エタネルセプト(IgG1 Fcに融合したTNFRの細胞外ドメイン);ベラタセプト(Fcに融合したCTLA-4の細胞外ドメイン);アバタセプト(Fcに融合したCTLA-4の細胞外ドメイン);ベリムマブ(抗Bリンパ球刺激因子);ムロモナブ-CD3(抗CD3 mAb);オテリキシズマブ(抗CD3 mAb);テプリズマブ(抗CD3 mAb);トシリズマブ(抗IL6R mAb);REGN88(抗IL6R mAb);ウステキヌマブ(抗IL-12/23 mAb);ブリアキヌマブ(抗IL-12/23 mAb);ナタリズマブ(抗α4インテグリン);ベドリズマブ(抗α4β7インテグリンmAb);T1h(抗CD6 mAb);エプラツズマブ(抗CD22 mAb);エファリズマブ(抗CD11a mAb);およびアタシセプト(Fcと融合した膜貫通活性化因子およびカルシウム調節リガンド相互作用因子の細胞外ドメイン)。
【実施例】
【0093】
実施例1:無細胞DNA断片化を用いた肺癌の早期検出
液体生検分析における急速な技術および分析の進歩により、末梢血中のcfDNA断片における癌関連の特徴が同定され、癌の非侵襲的検出のための新たな手段が提供された。循環腫瘍DNA(ctDNA)における突然変異またはメチル化は、腫瘍におけるこれらの変化の予備知識なしに、初期段階の肺癌患者において直接検出することができる
16~21。標的化された高カバレッジ配列決定によって評価され得る比較的少数の配列またはエピジェネティックな変化を考慮すると、癌を有する多くの個体は、そのようなアプローチによって見落とされる可能性があり、クローン造血から生じる変化を排除するために白血球(WBC)の配列決定も必要とし得る
17,18,22。初期段階の癌の検出感度を高めるために、DELFI(DNA evaluation of fragments for early interception)
23と呼ばれるcfDNA断片化プロファイルの分析のためのゲノムワイドアプローチが開発された。このアプローチは、cfDNA「fragmentome」の見解を提供し、ゲノムにわたる数百万の天然に発生するcfDNA断片のサイズ分布および頻度の評価を可能にする。cfDNA fragmentomeは、ゲノム特性およびクロマチン特性の両方を包括的に表すことができるので、循環における多数の腫瘍由来変化を同定する可能性を有する。この研究において、この方法は、悪性および良性肺結節を有する患者ならびに他の臨床状態を有するものを含む非癌個体を含む前向きに収集された実世界コホートにおける肺癌検出および特徴付けのために利用された(
図1A、1B)。この努力を通じて、臨床において非侵襲性液体生検を組み込むためのフレームワークが提供され、cfDNA断片化プロファイルを肺癌検出のための他のマーカーおよびLDCTと組み合わせる。
【0094】
方法
分析された研究集団
LUCAS診断コホートは、Infiltrate Unite、Bispebjerg Hospital(Copenhagen)の呼吸器内科において胸部X線または胸部CTで陽性イメージング所見を示した368人の主に症状のある患者の前向きに収集されたコホートである。研究は、2012年9月から2013年3月までの7ヶ月にわたって行われ、全ての患者は、死亡または2020年4月まで臨床的追跡調査を受けた。全ての患者は、肺癌の可能性のある診断がなされる前に、彼らの最初の来診時に血液試料を採取された。ゲノム配列決定から品質管理に合格した365人の患者からの試料を、その後の分析に含めた。分析されたコホートは、以前、ベースライン、または将来の癌を有さない158人の患者、ベースラインの肺癌を有する129人の患者、および採血時に癌を有さないが、初期または後期癌のいずれかを有する78人の患者を含んだ(
図6、表1)。検証コホートは、デンマークおよびオランダにおける結腸直腸癌についての2つのスクリーニングコホートからの385人の非癌個体、ならびにBioIVT(Westbury,NY)を通じた独立した前向き収集から病理学的に確認された主に初期段階の肺癌を有する46人の患者からなっていた。肺癌患者の検証コホートは、収集時に肺癌の新たな診断を受けた。
【0095】
試料収集および保存
LUCASコホートの試料収集は、スクリーニング来診時に採取され、以下のように実施された。静脈末梢血を1本のK2-EDTAチューブおよび2本の血清ゲルチューブに採取した。2時間以内に、採血管を2330g、4℃で10分間遠心分離した。遠心分離後、EDTA血漿および血清を等分し、それぞれcfDNAおよびタンパク質分析のために-80℃で保存した。
【0096】
検証コホートでは、各個体の静脈末梢血を1本のEDTAチューブに採取した。採血から2時間以内に、チューブを低速(1500~3000g)で10~15分間遠心分離した。遠心分離後、EDTA血漿を等分し、cfDNA分析のために-80℃で保存した。
【0097】
配列決定ライブラリー調製
循環無細胞DNAを、Qiagen QIAamp Circulating Nucleic Acids Kit(Qiagen GmbH)を使用して2~4mlの血漿から単離し、0.04%アジ化ナトリウム(Qiagen GmbH)を含む52μlのRNaseフリー水で溶出し、LoBindチューブ(Eppendorf AG)にて-20℃で保存した。Bioanalyzer 2100(Agilent Technologies)を使用してcfDNAの濃度および品質を評価した。
【0098】
次世代配列決定(NGS)cfDNAライブラリーを、利用可能な場合は15ngのcfDNA、または15ng未満の場合は全精製量を使用して、WGSのために調製した。検証コホートのために、最大125ngの利用可能なcfDNAを、ライブラリー調製のための投入材料として使用した。簡潔に述べると、ゲノムライブラリーを、Illumina用NEBNext DNA Library Prep Kit(New England Biolabs(NEB))を使用して、製造業者のガイドラインに4つの主要な修正を加えて調製した:(i)ライブラリー精製工程は、ビーズ上AMPure XP(Beckman Coulter)アプローチを使用して、溶出およびチューブ移動工程中の試料損失を最小限にする;(ii)NEBNext末端修復、A-テーリングおよびアダプターライゲーション酵素およびバッファー容量を、ビーズ上AMPure XP精製戦略に適合するように適切に調整した;(iii)Illuminaデュアルインデックスアダプターをライゲーション反応に使用した;および(iv)cfDNAライブラリーをPhusion Hot Start Polymeraseで増幅した。全ての試料は、DNAライゲーション工程後に4サイクルのPCR増幅を受けた。
【0099】
合計で、LUCASコホートについてcfDNAライブラリー調製の23バッチを実施した。各バッチは、癌患者および非癌対照の組み合わせを含んでいた。全てのバッチは、異なる日に実施されたバッチにわたる配列決定の一貫性を評価するために、ヌクレアーゼ消化ヒト末梢血単球(PBMC)から得られたヌクレオソームDNAの技術的複製物を含んだ。ライブラリー調製中にDNA汚染がないことを確実にするために、DNA試料の代わりに緩衝液TE pH8.0を使用した陰性ライブラリー対照を定期的に含めた。検証コホートを上記と同じ様式で調製し、実施形態および対照を含む485個の試料を33個のバッチに展開した。
【0100】
低カバレッジ全ゲノム配列決定およびアラインメント
Illumina HiSeq2500プラットフォーム上でゲノム当たり1~2倍のカバレッジで100bpペアエンドラン(200サイクル)を使用して、癌患者および癌のない個体の全ゲノムライブラリーを配列決定した。アラインメントの前に、アダプター配列を、fastpソフトウェア34を使用してリードからフィルタリングした。配列リードを、Bowtie2を用いてhg19ヒト参照ゲノムに対してアライメントさせ35、Sambambaを使用して重複リードを除去した36。アラインメント後、各アラインメントされた対を、配列決定されたDNA断片を表すゲノム区間に、ベッドツール(Bedtools)を使用して変換した37。30以上のmapqスコアを有するリードのみを保持した。リード対は、Duke Excluded Regions blacklist(genome.ucsc.edu/cgi-bin/hgTrackUi?db=hg19&g=wgEncodeMapability;Amemiya,H.M.,Kundaje,A.&Boyle,A.P.The ENCODE Blacklist:Identification of Problematic Regions of the Genome. Sci Rep 9,9354(2019)。https://doi.org/10.1038/s41598-019-45839-z)により提供された問題のある領域に重なる場合はさらにフィルタリングされた。低カバレッジ全ゲノム配列決定から推定可能なゲノムにわたる断片化における大規模なエピジェネティックな差異(epigenetic differences)を捕捉するために、hg19参照ゲノムを、ゲノムの約2.4GBに及ぶ473個の非重複5Mbビンにタイル分割した。全てのビンは、平均GC含量0.3以上および平均マッピング可能性0.9以上を有した。
【0101】
全ゲノム断片特徴
473ビンにわたる、長い(151~220bp)断片に対する短い(100~150bp)断片の数の比を、GC含量およびライブラリーサイズについて正規化した。GC関連バイアスは主にPCR中の優先的な断片の増幅に起因しているので
40、断片レベルGC調整のためにノンパラメトリック法を開発した。LUCASコホートにおける各個体について、断片を、0と1の間(1は、全てのGおよびCヌクレオチドを有する断片を示す)の100個の可能なGC層のうちの1つに割り当て、各GC層内の断片の総数を得た。同様に、54個の非癌試料のホールドアウトセットについてGC層ごとの断片数の分布と、その54個の分布の中央値を求め、ターゲット分布とした。LUCASにおける試料間PCRバイアスを正規化するために、GC層iにおける断片のコレクションに、以下のような重みwiを割り当てた。
【数2】
ここで、t
iはターゲット分布における断片の数を示し、N
iは階層iにおける断片の総数を示し、i=1,.100である。短い断片および長い断片のGC調整された数を、各5Mbビンについて、そのビンに整列された断片についての重みの合計として計算し、それによって、GCバイアスにおける試料間の変動ならびにライブラリーサイズにおける差異の両方を正規化した。GC調整短対長比の断片化プロファイルを、ゲノム全体にわたって平均0および単位標準偏差を有するように標準化した。
【0102】
断片化プロファイルに加えて、染色体腕および全cfDNA断片化のゲノムワイド概要についてもzスコアを計算した。39の常染色体腕の各々についてのZスコアは、参照セット23,41として使用される54の非癌試料における対応する腕特異的カウントの平均および標準偏差によって、各腕についての総GC調整断片カウントをセンタリングおよびスケーリングすることによって得られた。各試料についての全体的なcfDNA断片化サイズを要約するために、本発明者らは、マルチヌクレオソーム(multinucleosomal)(250bp以上)対モノヌクレオソーム(250bp未満)断片の比を計算した。
【0103】
TCGAからの公開データベースに基づく分析
パッケージRTCGA v1.16.051を使用して、TCGAにおける2つの肺癌コホート(LUAD n=518およびLUSC n=501)からのコピー数データを検索した。腫瘍対正常対数コピー比値を腫瘍型特異的閾値52と比較して、コピーの増加および喪失を有するゲノム領域を同定した。ゲノムにわたる5Mbビンの各々におけるコピー数状態を、増加(gain)または喪失(loss)を保有するセグメントによるビン間隔の90%の最小カバレッジを必要とすることによって決定した。ゲノムビンにおけるコピー増加および喪失の頻度を、TCGAにおける肺癌コホートの各々について計算した。
【0104】
機械学習および交差検証分析
初期および後期癌検出のための予測モデルを開発するために5分割交差検証を使用し、特徴選択およびモデル開発を5分割のうちの4分割(トレーニングセット)で評価し、5番目のホールドアウト分割はモデル性能を評価するためだけに使用した(試験セット)。トレーニングおよび試験に利用可能な試料の総数は、以前、ベースライン、または将来の癌を有さない158人の参加者、および採血時に癌を有する129人の患者を含む。以前または将来の癌を有する患者(n=78)は、訓練または試験に使用されなかった。トレーニングのために利用可能な試料の数に対する断片化特徴は高次元であるため、主成分分析を各トレーニングセット内で実施して、特徴空間の次元を低減し、試料間の断片化プロファイルの分散の90%を説明するのに必要な主成分を最小数に保持した。主成分特徴に加えて、全ての39のzスコアを、LASSOのペナルティを用いてロジスティック回帰モデルにおいて評価した。解析における0.0017の最適化されたLASSOペナルティは、Rのcaretパッケージを使用してリサンプリングすることによって得られた。各試料について導出されたDELFIスコアは、10回の交差検証反復にわたる平均スコアに対応する。特徴選択(主成分分析)およびLASSOモデルの両方が、トレーニングセット中の試料に対してのみ評価されたので、このアプローチは、モデル性能の偏りのない推定値を提供する。
【0105】
モデル性能のさらなる尺度として、LCAS研究において158人の非癌個体およびベースライン肺癌を有する129人の患者すべてを使用して最終モデルを得て、非癌個体(n=385)および主に初期段階の癌(n=46)の独立コホート(検証セット)においてこの固定モデルを評価した。固定モデルを使用して、予測スコアを検証セットにおける各個体について得て、80%の所望の特異度を提供するLUCASからの固定カットオフを使用して各個体を非癌または癌として分類した。注目すべきことに、検証コホートからの試料は、試料収集、ライブラリー調製、および配列決定に関して、LUCASコホートから完全にバッチ非依存的であった。
【0106】
断片化特徴に加えて、臨床および血清タンパク質マーカーが予測をさらに改善することができるかどうかを評価するために、反復5分割交差検証アプローチを使用してマルチモーダル予測モデルを評価した。主成分分析およびzスコアによって要約された断片化特徴を、特徴選択およびモデルパラメータの推定の両方が試験セットから独立しているように、上記のように評価した。臨床および血清タンパク質マーカーについては、年齢、喫煙歴、COPD状態、およびCEAを含めた。LASSOペナルティを伴うロジスティック回帰モデルを使用して、各トレーニングフォールドにおける断片化、臨床、およびタンパク質バイオマーカー特徴を評価した。
【0107】
LUCASコホートにおける処置
全ての患者は、1)一次手術、2)治癒目的の併用化学療法および放射線療法、3)標準的な対症的全身腫瘍学的処置(化学療法または標的療法のいずれかを伴う)、または4)最良の支持療法(全て、ESMOガイドライン42~44と一致した2012~13年の肺癌に対するデンマーク国の治療ガイドラインに従う)のいずれかに対する適格性について診断後に評価された。
【0108】
全ての患者を、TNM病期ならびに麻酔の可能性を妨げ得る可能な共存症に基づいて、可能な一次手術について評価した。患者は、孤立性肺転移(2人の結腸-直腸、1人の精巣癌、および1人の乳癌)のために一次肺手術を受け、サブセットは、2012~2013年のESMOガイドラインに従って手術後アジュバント化学療法を受けた。患者が一次手術に適格でなかった場合、治療目的で、併用療法(ビノレルビン(NSCLCに対して)またはエトポシド(SCLCに対して)のいずれかと組み合わせたプラチナダブレット療法)および放射線療法(33分割で2グレイ、5F/Wまたは定位放射線療法、3分割で15グレイ(NSCLCに対して)または45分割で2,05グレイまたは10分割で3グレイ(SCLCに対して)のいずれか)について、複数回チームカンファレンスで評価した。不良なECOGパフォーマンスステータスおよび/または有意な共存症を有する患者は、任意のタイプの腫瘍学的処置を受けることから除外され、支持療法を受けた。診断時に進行した疾患を有する患者は、姑息的化学療法および/または放射線療法に適格であった。EGFR突然変異を有する患者は、ゲフィチニブまたは化学療法のいずれかの後に、1番目のラインにおけるゲフィチニブおよびエルロチニブで主に処置され、ALK転座を有する患者は、クリゾチニブで処置された。最初の姑息的治療コホートからの患者は、疾患の進行後に第2選択腫瘍学的治療(典型的にはペメトレキセド単独療法)を受け続けた。16人の患者のみが、2回目の処置の後にさらなる治療を受け、1人の患者は、合計7回の処置を受けた。コホートは2012~2013年であるため、2人の患者のみが、CheckMateプロトコールにおいてそれぞれ3番目および7番目のラインで免疫療法(ニボルマブ)を受けた。
【0109】
臨床的共変量および生存とDELFIスコアとの関連
DELFIスコアの分布をベースラインの臨床的共変量および実験室共変量の、年齢、喫煙、および血清炎症マーカーと比較する単変量解析を、ウィルコクソン順位和検定を用いて行った。さらに、DELFIスコアと、ベースライン共変量の、年齢、喫煙、および性別を伴うおよび伴わない癌リスクとの関係を、ロジスティック回帰を使用して評価した。
【0110】
DELFIスコアが予後と関連するかどうかを評価するために、高リスクの肺癌患者を、癌を有する可能性が高いかどうか(DELFIスコアが0.5超)に従って分類した。単変量解析において、この分類が肺癌患者間の生存に関連するかどうかを評価するために、ログランク検定を使用して生存曲線を比較した。単変量解析に加えて、DELFIスコアが、さらなる説明変数として原発性肺癌の組織学的サブタイプおよび臨床病期分類を含む多変量のCox比例ハザードモデルにおいて、肺癌特異的生存と独立して関連するかどうかを評価した。
【0111】
組織サブタイプの予測のためのゲノムワイド転写因子分析
The Cancer Genome Atlas(TCGA)によって生成された、SCLC(n=79)
57、肺腺癌(n=542)および肺扁平上皮癌(n=504)、ならびにGenotype-Tissue Expression(GTEx)プロジェクトによって生成された全血(n=755)について、遺伝子発現値を、recount3 1.0.2
56を使用して生カウントとして取得し、recount1.16.1を使用して100万当たりの転写産物(TPM)に変換した。TPM中央値を、各癌/組織型における1,639個の転写因子(TF)
58について計算した。発現されなかったTF(中央値TPM<1)を、肺腺癌、肺扁平上皮細胞癌、および全血において同定し、次いでそれらをSCLCにおける最も高い発現から最も低い発現へと順序付けた。上位の遺伝子はASCL1であった(中央値TPM=101)。次いで、クロマチン免疫沈降を得た後、ASCL1(n=13,920ピーク)(GEO試料受託番号:GSM3704421)
59についてのピークを配列決定(ChIP-seq)した。常染色体(n=13,693ピーク)における各ピークについて、ピークの中心を位置0として定義し、次いで、少なくとも0.37のDELFIスコア(85%の特異度に対応する)を有する125個の試料について、各ピークの周りの+/-3,000bpウィンドウにおいて別々にカバレッジを計算した。試料全体にわたって平均3超のカバレッジで少数のピークを除外した。全てのピークにわたる各位置(-3,000~+3,000)でのカバレッジの平均を、各試料について計算した。
図5C、5Eでは、ASCL1結合部位を取り囲む+/-3,000bpウィンドウ内の各位置でカバレッジをとり、その試料内の最大値で割ることによって、所与の試料の相対的なカバレッジを計算した。SCLC試料は別々にプロットされ、「その他」群の試料は、ASCL1結合部位に対する各位置での相対的なカバレッジまたは断片長の中央値(黒線)ならびに相対カバレッジまたは断片長の0.05および0.95四分位数(影付き領域)としてプロットされる。ROC曲線(
図5D、5F)について、相対カバレッジを各試料について計算し、この際、ASCL1結合部位の中心を囲む+/-100bpウィンドウ内の平均カバレッジを、結合部位の2,750bp上流および下流を囲む+/-250bpウィンドウ内の平均カバレッジで割ったものとして計算した。ROC曲線は、pROC1.16.2
60を用いて作成した。
図5Bについては、620個のASCL1標的遺伝子の名称が得られ
61、そのうちの600個が遺伝子発現データセットにおいて一致する遺伝子名を有していた。これらの600個の遺伝子について、遺伝子は、TPM値が、全ての試料にわたるその遺伝子についての平均を、標準偏差が3超を上回る場合、所与の試料において「過剰発現されている」と定義された。
【0112】
200bp未満の断片を使用して、平均断片サイズを、ASCL1結合部位を囲む+/-3,000bpウィンドウ内の各位置で計算した。
図16Aでは、SCLC試料および10個の無作為なベースライン癌なし試料を別々にプロットし、LOESS法を使用して平滑化する。
図16Cでは、ASCL1結合部位を取り囲む+/-3,000bpウィンドウ内の各位置で平均断片サイズをとり、それをその試料内の最小値で割ることによって、所与の試料の相対断片サイズを計算する。
図16Dでは、SCLC試料を別々にプロットし、LOESS法を使用して平滑化し、「その他」群の試料を、相対断片サイズ中央値(黒線)ならびにASCL1結合部位に対する各位置での相対断片サイズの0.05および0.95分位数(陰影領域)としてプロットする。ROC曲線については、各試料について、ASCL1結合部位の中心を囲む+/-100bpウィンドウ内の平均断片サイズを、結合部位の1,250bp上流および下流を囲む+/-250bpウィンドウ内の平均断片サイズで割ったものとして、相対断片長さを計算した。
【0113】
スクリーニング集団におけるDELFI性能のモデリング
LUCASにおける試料間PCRバイアスを正規化するために、GC層iにおける断片のコレクションを、
【数3】
となるような重みWiに割り当て、ここで、t
iは、ターゲット分布での断片の数を表し、N
iはGC層iでの断片の総数である。
【0114】
100,000人の仮説的スクリーニング集団において、LDCT単独およびDELFIとそれに続くLDCTの性能を評価するために、本発明者らは、モンテカルロシミュレーションを使用して、未知のパラメータ感度、特異度、アドヒアランス、および肺癌有病率の不確実性を捕捉した。LUCAS単独に対する感度の先行モデルは、LUCASおよびNLSTコホートからの経験的推定値に大まかに集中していた:
【数4】
発明者らは、π~「ベルヌーイ」(0.5)をサンプリングした。
特異度については、先行モデルは以下の通りであった:
【数5】
本発明者らのシミュレートしたスクリーニング研究でのスクリーニングされる個体の数は、スクリーニングガイドラインの順守に依存する。nは本発明者らのスクリーニング研究の規模を示すものとし、nに関する本発明者らのサンプリングモデルは以下で表される。
【数6】
LDCT単独の場合、形状パラメータαnおよびβnがDELFImultiは12および188
7であったが、LDCT形状パラメータが後に続くものは80および20
32であった。本発明者らのスクリーニング研究の規模とθ1,Mおよびθ2,Mのそれぞれの事前分布からの抽出を条件とし、本発明者らは疾患状態yおよびスクリーニング結果xを、yを条件としてサンプリングした。
【数7】
本発明者らの仮説集団における有病率についての有益な事前情報ψは、本発明者らのスクリーニング研究が癌を有さない個体から主に構成されることを確実にするが、真の有病率は、NLST研究からの0.91%の推定よりも小さくまたは大きくなり得る
5。検出された肺癌を有する患者の数、精度、偽陽性率、および陽性予測値をxおよびyの同時分布から計算した。本発明者らは、上記のサンプリング手順を10,000回繰り返し、それによって、感度、特異度、アドヒアランス、および有病率の不確実性を反映するこれらの統計値の予測分布を得た。
【0115】
生物情報学および統計ソフトウェア
全ての統計分析は、Rバージョン3.6.1を用いて行った。fastp(0.20.0)を使用したアダプター配列のトリミング後、本発明者らは、Bowtie2(2.3.0)を使用して、ペアエンドリードをhg19参照ゲノムに整列させた。Sambamba(0.6.8)を用いてPCR複製物を除去し、Bedtools(2.29.0)を用いて残りのアラインメントされたリード対をベッドフォーマットに変換した。Rパッケージデータ表(1.12.8)を、ゲノムに沿った5Mbウィンドウにおける表形式データおよびビニング断片の操作のために使用した。Rパッケージcaret(6.0.84)およびgbm(2.1.5)を使用して、勾配ブーストツリーおよびリサンプリングによる分類を実施した。
【0116】
結果
Bispebjerg Hospital in Copenhagen,Denmark(LCASコホート)で行われた365人の前向き診断研究からの患者血液試料を検査した。7ヶ月間。このコホートでの対象の大部分は、肺癌のリスクが高い症状のある個体(50~80歳および喫煙歴20パックイヤー超)であった(表1)。このコホートは、肺、非肺または全身症状を有する323人の対象(90%)を含み、大多数は、咳または呼吸困難などの一般的な喫煙関連症状を有していた。残りは登録時に無症候性であり、肺悪性腫瘍が疑われるX線またはCTによる偶発的な胸部画像所見があった。患者の来院時に、さらなる胸部CTまたは18F-PET/CTを行って、同定された結節または浸潤物を評価した(
図7)。研究された365人の個体のうち、129人は、血液採取の時点から数日後に肺癌を有すると決定されたが(中央値9.5日、範囲0~44)、残りは、組織学的に良性結節であると証明されたか(n=87)、または癌についての低い臨床的疑いおよび放射線写真的疑いのために生検されなかった(n=149)(
図7)。Fleischner Society肺結節推奨
24~26を含む肺結節の管理のための標準的なアルゴリズムを使用して、臨床管理を決定した。
【0117】
肺癌検出のためのDELFI性能
2~4mlの血漿をLCASコホートの各患者から単離し、抽出されたcfDNAを、実験的およびバイオインフォマティクス的改善を伴うDELFIアプローチを使用して調べた。PCRは、GC含量および断片長に依存して増幅されたゲノム断片の提示に影響を及ぼすことが公知であるので、DELFIゲノムワイド断片化プロファイルを、増幅なしで、または4もしくは12サイクルのPCRを用いて作製されたゲノムライブラリーを使用して評価した。4サイクルのPCRで作製されたライブラリーは、増幅なしのものと類似したプロファイルを有していたが、12サイクルは実質的なバイアスをもたらしたことが見出された(
図8A、8B)。断片長および/またはGC含量による優先的増幅を同時に説明する新規な断片ベースのGC補正方法を開発した(方法を参照のこと)。4サイクルライブラリー間のこのアプローチが、一般的に使用されるビンベースのアプローチ
27と比較してGCバイアスをさらに最小化するかどうかを調べ、断片ベースのアプローチが増幅なしのライブラリーに最も近いことを見出した(
図8C)。したがって、4サイクル増幅を使用してゲノムライブラリーを生成し、浅い全ゲノム配列決定(約2×カバレッジ)を使用してcfDNA断片を配列決定し、試料当たり平均4000万対のリードを得た(
図1)。ゲノムワイドなcfDNA断片化パターンを調べるために、断片ベースのGC補正された配列データを使用して、高いマッピング可能性を有する473個の非重複5MB領域におけるゲノムにわたる断片化プロファイルを評価した。各領域は、約80,000個の断片を含み、ゲノムの約2.4GBに及ぶ。
【0118】
得られた断片化プロファイルは、非悪性肺結節を有する個体を含む非癌個体間で著しく 一貫していた(
図2A、2B)。対照的に、癌患者は、広範なゲノム規模の変動を示した(
図2A、2B)。注目すべきことに、断片化プロファイルの差異は、病期および組織学にわたるものを含む、大多数の癌患者のゲノム全体にわたる複数の領域において観察することができた。機械学習モデルを用いて、cfDNAプロファイルが肺癌を有する個体または肺癌を有さない個体の特徴を有するかどうかを調べた。分析された患者の数に対する本発明者らのゲノムワイド断片化プロファイルが高次元であるため、主成分分析(PCA)を実施して、分散の少なくとも90%を説明する本発明者らの断片化特徴の線形組み合わせを同定した。この次元削減ステップを機械学習モデルに組み込み、反復5重交差検証によって性能特性を推定し、交差検証反復にわたる平均として各個体のスコア(DELFIスコア)を生成した。機械学習モデルに組み込まれた特徴の分析および可変重要性の対応する尺度は、癌患者において変化し、癌リスクを予測する断片化および染色体変化を明らかにした(
図2C)。これらの特徴の重要性は、トレーニングフォールドにわたって一貫していた(
図9)。モデルに組み込まれたゲノム変化のうち、cfDNA提示において増加または減少した染色体腕は、肺腺癌(n=518)および扁平上皮癌(n=501)についての以前のTCGA大規模ゲノム研究において見られたように、肺癌において一般的に増加した(gained)または喪失した(lost)ものに対応した(
図2C)。これらには、7q、12p、および20qのcfDNAレベルの増加、または1p、3p、8p、および17pのレベルの喪失が含まれ、これらはすべて、様々な肺癌においてそれぞれ増加または喪失されることが知られている
28~30。
【0119】
DELFIプロファイルとマルチモーダル解析との組み合わせ
臨床特性は腫瘍バイオマーカーに影響を及ぼし得るので、非悪性結節、年齢もしくは喫煙歴などの人口統計パラメータ、または慢性閉塞性肺疾患(COPD)もしくは自己免疫疾患の存在がDELFIスコアと関連するかどうかを調査することが最初に求められた。LUCASコホートの前向き観察試験収集のために、これらの特徴の偏りのない分析が可能であった。良性肺病変を有するまたは有さない非癌個体を比較した場合、DELFIスコアの差は観察されなかった(中央値DELFIスコア0.16対0.21、p=0.99、ウィルコクソン順位和検定、
図3A)。DELFIスコアの変化はまた、年齢群の間(F統計量=1.65、p=0.20)、現在喫煙者、喫煙経験者および喫煙未経験者の間(F統計量=1.3、p=0.27)、および非癌個体におけるパックイヤーにわたって(F統計量=0.67、p=0.57)観察されなかった(
図10A~10D)。同様に、COPDを有する患者もしくは有しない患者(p=0.26)または自己免疫疾患を有する患者もしくは有しない患者(p=0.38)の間で差は観察されなかった。最後に、炎症マーカーCRPまたはIL-6のレベルとIL-6のレベルとDELFIスコアとの間に相関は観察されず、これは、cfDNA断片化の変化が癌に特有であり、DELFIスコアが急性または慢性炎症状態の存在によって影響を受けないという考えと一致する(
図11)。
【0120】
肺癌の進行および転帰のDELFI分析
次に、DELFIスコアと癌病期および組織型との間の関係を調べた。非癌個体についてのDELFIスコアは低かったが(生検なしまたは良性病変を有する個体についてそれぞれ0.16または0.21のDELFIスコア中央値)、癌患者は有意に高いDELFIスコア中央値を有した(病期I=0.35、病期II=0.75、病期III=0.90、および病期IV=0.99についてのDELFIスコア)(病期I、II、III、またはIVについてp<0.01、ウィルコクソン順位和検定)(
図3A)。LUCASコホートにおける癌を有する患者を同定するためのDELFIアプローチの感度および特異度を表す受信者動作特性(ROC)曲線は、0.90(95%CI=0.86~0.94)の曲線下面積(AUC)を明らかにした(
図3B)。病期Iの病気は同定するのがより困難であった(AUC=0.76)が、病期II、IIIおよびIVの病気は同様に高いパフォーマンスを有した(それぞれAUC
II=0.89、AUC
III=0.92、AUC
IV=0.92)。癌の既往歴のない個体の検出を考慮すると、他の癌検診研究
4、5の組み入れ基準と一致して、全体的により高いパフォーマンス(AUC=0.93、95%CI=0.90~0.97)ならびに個々の病期(AUC
I=0.89、AUC
II=0.89、AUC
III=0.93、AUC
IV=0.95)が観察された(
図3B)。同様に、肺癌のリスクが高いと考えられたこの群(50~80歳、喫煙歴20パックイヤー以上)の個体のサブセットの分析は、0.94の全体的なAUCを明らかにした(
図3B)。肺癌の異なる組織学的サブタイプの分析は、小細胞肺癌(SCLC)および扁平上皮癌(SCC)が肺腺癌よりも容易に検出されることを示した(
図3B)。以前の複数癌DELFIアプローチのロバスト性を評価するために、本研究におけるCristiano et al.
23の特徴および機械学習アプローチは、同様の性能を同定した(全ての患者についてAUC=0.87、95%CI=0.82~0.91、癌の既往歴のない患者についてAUC=0.90、95%CI=0.86~0.94)(
図12A)。コピー数変化のみを含むichorCNA31などの他の全ゲノム分析、およびcfDNA断片長の全体中央値の分析は、それぞれ、0.76(95%CI=0.70~0.82)および0.61(95%CI=0.54~0.67)の全体AUCを有する実質的により弱いパフォーマンスを提供した(
図12B)。バルク断片長のより低い性能は、この測定基準がゲノムにわたる断片化変化を捕捉できないことを反映し得る(スピアマン相関=0.29)。
【0121】
肺癌を有する個体または肺癌を有さない個体の独立した群におけるDELFIの予測性能を外部から検証するために、単一の断片化に基づくモデルを、LCAS研究において非癌個体およびベースライン肺癌を有する患者を使用して最初に取得し、70%~85%の範囲の特異度を達成するのに必要なDELFIスコアカットオフを決定した。次に、癌を有さない個体(n=385)または主に初期段階の癌(n=46)からなる独立した検証コホートにおいて、LUCASにおける固定モデルを使用して、検証セットにおけるDELFIスコアを計算した。以前に確立されたカットオフを使用して、検証セットにおける個体についての癌状態を、それらのDELFIスコアがカットオフを上回るかまたは下回るかに従って予測した。検証コホートにおけるこのモデルの感度および特異度は、疾患の異なる段階および異なる組織学的サブタイプの間でLCASコホートにおいて観察されたものと同様であった(
図3C、
図13)。全体として、これらの分析は、DELFIアプローチが、異なる病期および組織学的サブタイプにわたるものを含む、異なる肺癌コホートにわたって一般化可能であることを提供する。
【0122】
DELFIプロファイルとマルチモーダル解析との組み合わせ
マルチフィーチャーcfDNA分析と組み合わせた癌検出のためのマルチモーダルアプローチを評価するために、肺バイオマーカー
12,15,32,33として提案されている分泌タンパク質である癌胎児性抗原(CEA)の血清レベルを最初に評価した。肺癌患者は、癌を有さない患者と比較してより高いCEAレベルを有し、病期I~IIIの癌患者の20%超および病期IVの癌患者の大部分が7.5ng/ml超のレベルで検出されたが、非癌患者の約4%のみがこの閾値12,15,34を超えた(p<0.001)(
図14)。CEAレベルは病期とともに増加し、腺癌およびSCLCサブタイプを有する患者は、SCCまたは肺への転移を有する患者と比較してより高いレベルを示した(
図14)。臨床特性が肺癌および他の癌のリスク因子として提案されているので
35、ゲノムワイドcfDNA断片化特徴を、マルチモーダルモデル(DELFImulti)におけるCEAレベル、年齢、喫煙歴、およびCOPDの存在と組み合わせた(方法を参照されたい)。反復交差検証を使用して、これらのマルチモーダル特徴が非癌個体または癌患者の特徴を表すかどうかを予測した。DELFImultiのパフォーマンスの評価は、個々の病期について(AUC
I=0.78、AUC
II=0.95、AUC
III=0.94、AUCIV=0.95)、および組織サブタイプにわたって(AUC
adeno=0.91、AUC
squamous=0.95;AUC
SCLC=0.96)、0.93の全体的なAUCを明らかにした(
図15A、15B)。このアプローチは検証コホートにおいて評価することができなかったが、これらの分析は、DELFIと血清タンパク質および臨床リスク因子との組合せが、断片化プロファイル単独によって得られるものと比較してDELFI性能を改善するという証拠を提供する。
【0123】
肺癌の進行および転帰のDELFI分析
断片化プロファイルと肺腫瘍進行との間の関係を調べるために、肺癌病変のサイズまたは他の臨床的もしくは放射線学的所見が異常な断片化プロファイルに関連するかどうかを評価した。以前の研究は、特定の位置におけるctDNA分子の数が限られており、これらの方法による検出限界が約0.1%であることを考慮すると、突然変異に基づくアプローチによって小さな腫瘍(例えば、約1cm
3)が見逃され得ることを示唆しているが
20、ゲノムワイドなアプローチは、そのような変化のより高感度な検出を可能にし得る。DELFIアプローチは約4000万個の断片を調べるので、ゲノム全体にわたる約40,000個の断片が、0.1%ctDNA寄与を有する小さな腫瘍を有する患者において腫瘍由来であり、それによって検出の機会を増加させることが予想された。興味深いことに、LUCASコホートにおいて、サイズが2cm未満の9つの腫瘍のうち8つ(T1a)は、非癌集団の中央値よりも高いDELFIスコアを有していた(0.40対0.16のDELFIスコアの中央値)(
図4A)。限局性疾患を有する患者におけるDELFIスコアおよびT病期の分析は、T1からT4病期へのDELFIスコアの段階的増加を示した(T1=0.32、T2=0.56、T3=0.77、T4=0.94についてのDELFIスコア中央値;T1対T4、p<0.001、ウィルコクソン順位和検定)。さらに、リンパ節転移のない肺癌患者(N0)は、リンパ節転移を有する患者と比較して有意に低いDELFIスコアを有した(
図4A、p<0.001、Wilcoxon検定)。DELFIスコアの段階的増加はまた、罹患患者におけるTおよびN段階を評価する場合にも観察された(
図4B、p=0.005)。これらの観察は、肺腫瘍サイズと循環中の異常な断片化プロファイルとの間の直接的関係を示し、深部標的配列決定(約30,000×)を使用して検出不能であった症例において以前に観察されたものを含めて、比較的小さい腫瘍でさえ検出可能であり得るという証拠を提供する
23。
【0124】
LUCASコホートの長期の臨床経過観察(7~8年)により、DELFIスコアと生存率との間の関連性の分析が可能になった。これらの分析により、0.5を超えるDELFIスコアは、0.5未満のDELFIスコアと比較して全生存期間の減少に関連することが明らかになった(P<0.001、
図4C)。Cox比例ハザードモデルを用いた多変量解析において、DELFIスコアと生存率との関連は、癌組織学および病期とは独立しており、ハザード比(HR)は2.53であった(p=0.001、
図17B)。病期IVの腺癌を有する患者の均一な集団を分析した場合(p=0.004、
図17A)、または0.3~0.9の範囲の他のDELFIスコア閾値を使用した場合、同様の結果が得られた。DELFIスコアは、これらの個体(P=0.04、HR=2.3)、または生存期間が短い患者を除外した場合であっても、独立した予後因子のままであった。これらの結果は、断片化パターンと腫瘍負荷または攻撃性との間の関係を実証し、長期肺癌転帰への臨床的洞察を提供し得る。
【0125】
SCLCおよびNSCLCの生物学的特徴および臨床管理における重要な差異を考慮して、ゲノム規模の断片化プロファイルを使用してこれらの癌タイプを非侵襲的に区別することができるかどうかを評価した。肺癌サブタイプからの公的に入手可能なTCGA RNA-seqデータを使用して、SCLC(n=79)とNSCLC(n=1046)または白血球(n=755)試料との間で最も高い発現変動を有する転写因子を同定し、ASCL1(Achaete-Scuteファミリー塩基性ヘリックス-ループ-ヘリックス転写因子1)を最も高度に差次的に発現される遺伝子(NSCLCおよびWBCと比較して960倍超)として同定した(
図5A)。ASCL1は、SCLCの前駆細胞型である神経内分泌細胞におけるパイオニア転写因子であり、SCLCの大部分において過剰発現されることが同定されている
30。予想通り、ASCL1結合部位を有する遺伝子のサブセットは、SCLCとNSCLCとの間で差次的に発現された(
図5B)。転写因子結合
36の領域におけるcfDNAカバレッジの報告された差異を考慮して、ASCL1の観察された13,000ゲノムワイド結合部位にわたる断片カバレッジおよびサイズが、SCLC患者のcfDNAにおいて変化したかどうかを評価した。非癌個体または他の癌タイプを有する個体と比較して、SCLCを有する患者のASCL1結合部位(+/-200bp)を含有する領域において、集約断片カバレッジの顕著かつ一貫した減少が観察された(
図5C)。対照的に、ASCL1結合部位からさらに離れた距離(2000bp超)では、SCLCと他の患者との間の断片範囲は類似していた。ASCL1結合の領域におけるcfDNA断片サイズはより大きく、これはおそらく、非癌cfDNA23よりも典型的に小さい腫瘍由来cfDNAの寄与の減少を反映している(
図16A、16C)。ASCL1結合領域における断片情報を使用して、99%超の特異度(95%CI=98%~100%)(AUC=0.92)で158人の非癌個体と比較して11人のSCLCのうち10人(91%感度、95%CI=65%~99%)を正確に検出するために使用され得る分類子を作製した(
図5D)。さらに、DELFI陽性症例(80%特異度に対応するDELFIスコアが0.34超)を考慮した場合、SCLC患者は、SCLCを有さない他のDELFI陽性症例と比較して高い精度で分類された(100%感度、95%特異度で95%CI=78%~100%、95%CI=90%~98%、AUC=0.98)(
図5E)。限られた数のSCLC症例にもかかわらず、これらの知見は、断片化プロファイルが細胞型特異的ゲノムワイド転写因子結合を反映し得るという証拠を提供し、異なる組織学的サブタイプを有する肺癌を区別するための非侵襲的アプローチを提供する。
【0126】
DELFIベースライン評価時に臨床的寛解にあった癌の既往歴を有する患者の分析により、25人の患者が同定され、5人は再発し、4人は最終的にこの疾患で死亡した。これらには、頭頸部癌を有する3人の患者、結腸癌を有する1人の患者、および悪性黒色腫を有する1人の患者が含まれた。その後再発した患者は、再発していない個体よりも有意に高いDELFIスコアを有していた(中央値DELFIスコア0.65対0.19、p=0.005)(
図18A)。さらに、DELFI試験で陽性と記録された患者(DELFIスコアが0.34超)は、DELFI試験スコアが陰性の患者と比較して、無再発生存期間(採血から再発までの時間)が有意に短かった(p<0.01、
図18B)。これらの結果は、DELFIアプローチが処置後の疾患再発の検出のために使用され得るという概念を支持する。
【0127】
加えて、LUCASコホートにおいて利用可能な長期的な臨床経過観察は、ベースライン時に癌がないと見なされたが、ベースライン評価後に新たな癌を発症した個体における断片化プロファイルの分析を可能にした。2年以内にその後の癌診断を受けた17人の研究対象(限局性皮膚腫瘍を除く)のうち、4人の患者は、登録時に0.5を超えるDELFIスコアを有し、登録後33~481日以内に0.5~1.0の範囲であった。同定された悪性腫瘍は、NSCLCの1つの症例、ならびに慢性リンパ球性白血病(CLL)および2つのB細胞リンパ腫を含む3つの非肺悪性腫瘍を含んだ。これらのデータは、上昇したDELFIスコアが、臨床的に検出されなかった癌の出現を同定し得るという証拠を提供する。
【0128】
肺癌検出に対する非侵襲的分子血液検査の理論的影響を評価するために、DELFIスコアまたはマルチモーダルDELFImultiスコアのパフォーマンスを調べた後、LUCASコホートにおける標準的な診断用CTイメージングを行った。これは、高リスク個体が最初に採血され、cfDNA分析の結果に応じて、個体が、DELFIスコアが陽性である場合にLDCTを有するか、またはスコアが陰性である場合にLDCTを有さないかのいずれかの経路に従うシナリオを調べることを可能にする(
図6A)。LUCASコホートにおけるLDCT単独の性能の分析は、高い感度(95%超)および低い特異度(58%)を示した。DELFIスコアを使用して患者をプレスクリーニングし、陽性であった患者のみをLDCTによってさらに評価したモデルでは、DELFI/LDCT併用アプローチの観察された感度は90%(病期I=80%、病期II=86%、病期III=94、および病期IV=90%)であり、特異度は80%まで増加する(
図6B)。DELFImultiアプローチとそれに続くLDCTは、同じ特異度で感度を全体で94%(病期I=87%、病期II=100%、病期III=97%、および病期IV=96%)に改善し、組み合わせたアプローチを使用した場合、不必要な手順の数をLDCT単独での67から32に減少させた(52%減少)(
図6B)。
【0129】
集団規模で肺癌を有する個体の全体的な検出について本明細書のアプローチがどのように実行されるかを調べるために、モンテカルロシミュレーションを使用して、100,000人の高リスク個体の理論的集団においてDELFIモデルを評価した。この仮説集団におけるプレスクリーニングとして、LDCT単独またはDELFIとの推定感度および特異度を用いて(
図6B)、これらのパラメータの不確実性を、NLSTおよび/またはLUCASコホートから得られた経験的推定値を中心とする確率分布を用いてモデル化した(
図6C)。0.91%のNLST研究
5推定値を使用するこの集団における肺癌の可能性のある有病率は、910人(95%CI、428~1,584)であろう。LDCTスクリーニングについての推奨にもかかわらず、米国におけるアドヒアランスは、わずか5.9%
7であって、試験された平均5979人の個体となる(95%CI、3,176~9,658)。血液検査は、高いアクセス可能性およびコンプライアンスを提供し、80~90%のアドヒアランス率が血液由来バイオマーカーについて報告されている
37,38ため、肺癌検診集団の平均60%(95%信頼区間、39%~76%)が、組み合わせアプローチを使用して検査されると仮定した。これらの確率分布からのモンテカルロシミュレーションは、LDCT単独が肺癌を有する平均51個体(95%CI、17~108)を検出したことを明らかにした(
図6D)。DELFIをLDCTのプレスクリーニングとして使用して、平均して394の追加の肺癌症例が検出されたか、またはLDCT単独と比較して約8倍の増加(95%CI、4.4~19.6倍の増加)であった(
図6D)。組み合わされたアプローチは、肺癌の検出を実質的に改善するだけでなく、検査の精度を増加させ、不必要な手順の数を減少させ、陽性的中率(PPV)をLDCTLUCASについての1.9%およびLDCTNLSTについての2.6%(95%Cl、0.8~3.8%)からDELFIおよびLDCTについての3.9%(95%Cl、1.8~7.9%、
図6E~6G)に増加させることが期待される。これらの分析は、高感度の血液ベースの早期検出試験を、肺癌の検出のためのその後の診断LDCTと組み合わせることについての有意な集団全体の利益を示唆する。
【0130】
考察
全体として、改善されたDELFIアプローチが、肺癌の検出のためのゲノムワイド断片化分析について記載される。cfDNA fragmentomeの容易でスケーラブルな分析を使用して、高リスク集団を肺癌についてプレスクリーニングして、肺癌検出の利用可能性を増加させ、不必要なフォローアップイメージング手順および侵襲的生検を減少させることができることが提案される。LUCASコホートの分析を通して、DELFIアプローチが、良性肺結節を有するまたは有さない非癌個体と比較して、全ての病期および組織学的サブタイプにわたって肺癌を検出することができることが実証された。独立した検証コホートにおけるLUCASコホートからの固定DELFIモデルの検証は、アプローチの一般化可能性を支持する。標的化配列決定アプローチ16,22,39~43による観察と同様に、DELFIスコアと腫瘍進行および長期死亡率との間の関係は、血液ベースの断片化分析が、画像化によって観察されない潜在性疾患を同定し得るか、または疾患の攻撃性をより正確に同定し得るという証拠を提供する。NSCLCとSCLCとの区別は、組織が利用可能でない場合、肺癌患者の非侵襲的特徴付けおよび治療を可能にし得る。標準的な診断方法を通して癌を有することが数ヶ月後に同定されただけのDELFIによる患者の同定は、癌検出のためのアプローチの有用性、再発病の検出、および肺癌検診を通し初期段階(「病期シフト」)での癌の検出の可能性を示す。ゲノムワイド多特徴断片化プロファイル分析を標準タンパク質マーカーおよび臨床特性と組み合わせる可能性は、アプローチの感度をさらに増加させることができる高度に複雑なマルチモーダル分析のための道を提供する。
【0131】
ほぼ10年前のNLST試験の発表にもかかわらず5、肺癌罹患率および死亡率の低減におけるLDCTの影響は限定されている。このアプローチの課題には、多数の患者をスクリーニングすることができる不十分な撮像施設およびインフラストラクチャ、頻繁な訪問および共有される意思決定を必要とする医療精密検査の複雑さ、ならびに毎年のスクリーニングからの反復的な放射線被曝が含まれている44。加えて、画像化研究は、癌ではなく放射線異常を検出し、陽性スキャン所見のごく少数においてのみ生検同定癌診断をもたらすが、偽陽性所見の大部分は、侵襲的診断手順に至らせならびに追跡調査の数ヶ月または数年の間の進行中の患者に不安を促し得る。最後に、スクリーニングは、高リスクの個体における肺癌の早期検出のための重要なステップとして認識されているが、肺癌のかなりの割合が、より低いリスクの個体において生じ45、現在のUSPSTF推奨は、害および利益の不均衡に起因して、これらの患者のためのLDCTスクリーニングを推奨しない。
【0132】
分析されたコホートは、実世界の予想される集団を表し、全ての試料の収集および処理は、系統的な様式で行われ、分析前の特徴の均一性ならびに実験変数および分析変数の注意深い制御を確実にした。組み合わされたLDCT/DELFIアプローチにおける陽性予測値の潜在的な改善は、多くのより少ない不必要な手順が、陽性結果を有する個体において行われることを示唆する。さらに、DELFIスコアは、肺癌検出のための他の潜在的バイオマーカーを混乱させた非癌状態によって影響されないようである。スケーラブルで費用効果の高い非侵襲性cfDNA断片化分析が、肺癌患者を非癌個体から区別することができるという観察は、最終的に、肺癌について高リスク個体だけでなく一般集団も評価する機会を提供し得る。
【0133】
表1.LUCASコホートにおける患者のデモグラフィックと臨床情報
【表1】
*P-値は、以下の項目について、肺癌を有する/有しない個人のデータを比較するために計算された:平均年齢および喫煙パックイヤーはStudentの対応のない両側t検定を使用し、性別分布はカイ二乗検定を使用し、喫煙状態および癌既往歴は一元配置分散分析を用いた。
表2.検証コホートにおける患者のデモグラフィックと臨床情報
【表2】
*P-値は、以下の項目について、肺癌を有する/有しない個人のデータを比較するために計算された:平均年齢はStudentの対応のない両側t検定を使用し、性別分布はカイ二乗検定を使用した。
【0134】
参考文献
1. Ferlay J, Colombet M, Soerjomataram I, et al. Estimating the global cancer incidence and mortality in 2018: GLOBOCAN sources and methods. International journal of cancer 2019;144:1941-53.
2. De Angelis R, Sant M, Coleman MP, et al. Cancer survival in Europe 1999-2007 by country and age: results of EUROCARE--5-a population-based study. The Lancet Oncology 2014;15:23-34.
3. de Groot PM, Wu CC, Carter BW, Munden RF. The epidemiology of lung cancer. Translational lung cancer research 2018;7:220-33.
4. de Koning HJ, van der Aalst CM, de Jong PA, et al. Reduced Lung-Cancer Mortality with Volume CT Screening in a Randomized Trial. The New England journal of medicine 2020;382:503-13.
5. National Lung Screening Trial Research T, Aberle DR, Adams AM, et al. Reduced lung-cancer mortality with low-dose computed tomographic screening. The New England journal of medicine 2011;365:395-409.
6. Richards TB, Soman A, Thomas CC, et al. Screening for Lung Cancer - 10 States, 2017. MMWR Morbidity and mortality weekly report 2020;69:201-6.
7. Lung cancer Screening. 2020. at https://progressreport.cancer.gov/detection/lung_cancer.)
8. Pinsky PF. Principles of Cancer Screening. The Surgical clinics of North America 2015;95:953-66.
9. Mazzone PJ, Sears CR, Arenberg DA, et al. Evaluating Molecular Biomarkers for the Early Detection of Lung Cancer: When Is a Biomarker Ready for Clinical Use? An Official American Thoracic Society Policy Statement. American journal of respiratory and critical care medicine 2017;196:e15-e29.
10. Chaturvedi AK, Caporaso NE, Katki HA, et al. C-reactive protein and risk of lung cancer. Journal of clinical oncology : official journal of the American Society of Clinical Oncology 2010;28:2719-26.
11. Tang H, Bai Y, Shen W, et al. Clinical significance of combined detection of interleukin-6 and tumour markers in lung cancer. Autoimmunity 2018;51:191-8.
12. Integrative Analysis of Lung Cancer E, Risk Consortium for Early Detection of Lung C, Guida F, et al. Assessment of Lung Cancer Risk on the Basis of a Biomarker Panel of Circulating Proteins. JAMA oncology 2018;4:e182078.
13. Tang ZM, Ling ZG, Wang CM, Wu YB, Kong JL. Serum tumor-associated autoantibodies as diagnostic biomarkers for lung cancer: A systematic review and meta-analysis. PloS one 2017;12:e0182117.
14. Silvestri GA, Vachani A, Whitney D, et al. A Bronchial Genomic Classifier for the Diagnostic Evaluation of Lung Cancer. The New England journal of medicine 2015;373:243-51.
15. Seijo LM, Peled N, Ajona D, et al. Biomarkers in Lung Cancer Screening: Achievements, Promises, and Challenges. Journal of thoracic oncology : official publication of the International Association for the Study of Lung Cancer 2019;14:343-57.
16. Phallen J, Sausen M, Adleff V, et al. Direct detection of early-stage cancers using circulating tumor DNA. Science translational medicine 2017;9.
17. Liu MC, Oxnard GR, Klein EA, Swanton C, Seiden M. Response to W.C. Taylor, and C. Fiala and E.P. Diamandis. Annals of oncology : official journal of the European Society for Medical Oncology 2020;31:1268-70.
18. Lennon AM, Buchanan AH, Kinde I, et al. Feasibility of blood testing combined with PET-CT to screen for cancer and guide intervention. Science 2020;369.
19. Chabon JJ, Hamilton EG, Kurtz DM, et al. Integrating genomic features for non-invasive early lung cancer detection. Nature 2020;580:245-51.
20. Abbosh C, Birkbak NJ, Wilson GA, et al. Phylogenetic ctDNA analysis depicts early-stage lung cancer evolution. Nature 2017;545:446-51.
21. Shen SY, Singhania R, Fehringer G, et al. Sensitive tumour detection and classification using plasma cell-free DNA methylomes. Nature 2018;563:579-83.
22. Leal A, van Grieken NCT, Palsgrove DN, et al. White blood cell and cell-free DNA analyses for detection of residual disease in gastric cancer. Nature communications 2020;11:525.
23. Cristiano S, Leal A, Phallen J, et al. Genome-wide cell-free DNA fragmentation in patients with cancer. Nature 2019;570:385-9.
24. MacMahon H, Naidich DP, Goo JM, et al. Guidelines for Management of Incidental Pulmonary Nodules Detected on CT Images: From the Fleischner Society 2017. Radiology 2017;284:228-43.
25. Patel VK, Naik SK, Naidich DP, et al. A practical algorithmic approach to the diagnosis and management of solitary pulmonary nodules: part 1: radiologic characteristics and imaging modalities. Chest 2013;143:825-39.
26. Patel VK, Naik SK, Naidich DP, et al. A practical algorithmic approach to the diagnosis and management of solitary pulmonary nodules: part 2: pretest probability and algorithm. Chest 2013;143:840-6.
27. Benjamini Y, Speed TP. Summarizing and correcting the GC content bias in high-throughput sequencing. Nucleic acids research 2012;40:e72.
28. Cancer Genome Atlas Research N. Comprehensive molecular profiling of lung adenocarcinoma. Nature 2014;511:543-50.
29. Cancer Genome Atlas Research N. Comprehensive genomic characterization of squamous cell lung cancers. Nature 2012;489:519-25.
30. George J, Lim JS, Jang SJ, et al. Comprehensive genomic profiles of small cell lung cancer. Nature 2015;524:47-53.
31. Adalsteinsson VA, Ha G, Freeman SS, et al. Scalable whole-exome sequencing of cell-free DNA reveals high concordance with metastatic tumors. Nature communications 2017;8:1324.
32. Gropp C, Lehmann FG, Havemann K. [Carcinoembryonic antigen (CEA) in patients with lung cancer: correlation with tumour extent and response to treatment (author’s transl)]. Deutsche medizinische Wochenschrift 1977;102:1079-82.
33. Grunnet M, Sorensen JB. Carcinoembryonic antigen (CEA) as tumor marker in lung cancer. Lung cancer 2012;76:138-43.
34. Hanash SM, Ostrin EJ, Fahrmann JF. Blood based biomarkers beyond genomics for lung cancer screening. Translational lung cancer research 2018;7:327-35.
35. Tammemagi MC, Katki HA, Hocking WG, et al. Selection criteria for lung-cancer screening. The New England journal of medicine 2013;368:728-36.
36. Ulz P, Perakis S, Zhou Q, et al. Inference of transcription factor binding from cell-free DNA enables tumor subtype prediction and early detection. Nature communications 2019;10:4666.
37. Bokhorst LP, Alberts AR, Rannikko A, et al. Compliance Rates with the Prostate Cancer Research International Active Surveillance (PRIAS) Protocol and Disease Reclassification in Noncompliers. European urology 2015;68:814-21.
38. Duffy MJ, van Rossum LG, van Turenhout ST, et al. Use of faecal markers in screening for colorectal neoplasia: a European group on tumor markers position paper. International journal of cancer 2011;128:3-11.
39. Phallen J, Leal A, Woodward BD, et al. Early Noninvasive Detection of Response to Targeted Therapy in Non-Small Cell Lung Cancer. Cancer research 2019;79:1204-13.
40. Anagnostou V, Forde PM, White JR, et al. Dynamics of Tumor and Immune Responses during Immune Checkpoint Blockade in Non-Small Cell Lung Cancer. Cancer research 2019;79:1214-25.
41. Nabet BY, Esfahani MS, Moding EJ, et al. Noninvasive Early Identification of Therapeutic Benefit from Immune Checkpoint Inhibition. Cell 2020;183:363-76 e13.
42. Bratman SV, Yang CSY, Iafolla MAJ, et al. Personalized circulating tumor DNA analysis as a predictive biomarker in solid tumor patients treated with pembrolizumab. Nat Cancer 2020;1: 873-881.
43. Zhang Q, Luo J, Wu S, et al. Prognostic and Predictive Impact of Circulating Tumor DNA in Patients with Advanced Cancers Treated with Immune Checkpoint Blockade. Cancer discovery 2020;10:1842-53.
44. Jemal A, Fedewa SA. Lung Cancer Screening With Low-Dose Computed Tomography in the United States-2010 to 2015. JAMA oncology 2017;3:1278-81.
45. Kang HR, Cho JY, Lee SH, et al. Role of Low-Dose Computerized Tomography in Lung Cancer Screening among Never-Smokers. Journal of thoracic oncology : official publication of the International Association for the Study of Lung Cancer 2019;14:436-44.
46. Chen S, Zhou Y, Chen Y, Gu J. fastp: an ultra-fast all-in-one FASTQ preprocessor. Bioinformatics 2018;34:i884-i90.
47. Langmead B, Salzberg SL. Fast gapped-read alignment with Bowtie 2. Nature methods 2012;9:357-9.
48. Tarasov A, Vilella AJ, Cuppen E, Nijman IJ, Prins P. Sambamba: fast processing of NGS alignment formats. Bioinformatics 2015;31:2032-4.
49. Quinlan AR, Hall IM. BEDTools: a flexible suite of utilities for comparing genomic features. Bioinformatics 2010;26:841-2.
50. Leary RJ, Sausen M, Kinde I, et al. Detection of chromosomal alterations in the circulation of cancer patients with whole-genome sequencing. Science translational medicine 2012;4:162ra54.
51. P. KMaB. RTCGA: The Cancer Genome Atlas Data Integration. R package version 1.16.0. 2019.
52. Davoli T, Uno H, Wooten EC, Elledge SJ. Tumor aneuploidy correlates with markers of immune evasion and with reduced response to immunotherapy. Science 2017;355.
53. Vansteenkiste J, De Ruysscher D, Eberhardt WE, et al. Early and locally advanced non-small-cell lung cancer (NSCLC): ESMO Clinical Practice Guidelines for diagnosis, treatment and follow-up. Annals of oncology : official journal of the European Society for Medical Oncology 2013;24 Suppl 6:vi89-98.
54. Sorensen M, Pijls-Johannesma M, Felip E, Group EGW. Small-cell lung cancer: ESMO Clinical Practice Guidelines for diagnosis, treatment and follow-up. Annals of oncology : official journal of the European Society for Medical Oncology 2010;21 Suppl 5:v120-5.
55. D’Addario G, Fruh M, Reck M, et al. Metastatic non-small-cell lung cancer: ESMO Clinical Practice Guidelines for diagnosis, treatment and follow-up. Annals of oncology : official journal of the European Society for Medical Oncology 2010;21 Suppl 5:v116-9.
56. L C-T. Explore and download data from the recount3 project. . 2021.
57. Jiang L, Huang J, Higgs BW, et al. Genomic Landscape Survey Identifies SRSF1 as a Key Oncodriver in Small Cell Lung Cancer. PLoS genetics 2016;12:e1005895.
58. Lambert SA, Jolma A, Campitelli LF, et al. The Human Transcription Factors. Cell 2018;172:650-65.
59. Hokari S, Tamura Y, Kaneda A, et al. Comparative analysis of TTF-1 binding DNA regions in small-cell lung cancer and non-small-cell lung cancer. Molecular oncology 2020;14:277-93.
60. Robin X, Turck N, Hainard A, et al. pROC: an open-source package for R and S+ to analyze and compare ROC curves. BMC bioinformatics 2011;12:77.
61. Borromeo MD, Savage TK, Kollipara RK, et al. ASCL1 and NEUROD1 Reveal Heterogeneity in Pulmonary Neuroendocrine Tumors and Regulate Distinct Genetic Programs. Cell reports 2016;16:1259-72.
【0135】
他の実施形態
本発明をその詳細な説明と併せて説明してきたが、前述の説明は、例示を意図したものであり、添付の特許請求の範囲によって定義される本発明の範囲を限定するものではない。他の態様、利点、および改変は、以下の特許請求の範囲内である。
【0136】
本明細書で言及される特許および科学文献は、当業者に利用可能な知識を確立する。本明細書に引用される全ての米国特許および公開または未公開米国特許出願は、参照により組み込まれる。本明細書で引用される全ての公開された外国特許および特許出願は、参照により本明細書に組み込まれる。本明細書中で引用される全ての他の公開された参考文献、文書、原稿および科学文献は、本明細書中で参考として援用される。
【国際調査報告】