IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ロマ リンダ ユニヴァーシティの特許一覧

(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-01-24
(54)【発明の名称】早期口腔扁平上皮癌の評価方法
(51)【国際特許分類】
   C12Q 1/6837 20180101AFI20240117BHJP
   G01N 33/53 20060101ALI20240117BHJP
【FI】
C12Q1/6837 Z
G01N33/53 M
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2023542944
(86)(22)【出願日】2022-01-14
(85)【翻訳文提出日】2023-09-12
(86)【国際出願番号】 US2022070208
(87)【国際公開番号】W WO2022155679
(87)【国際公開日】2022-07-21
(31)【優先権主張番号】63/199,655
(32)【優先日】2021-01-14
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】519222933
【氏名又は名称】ロマ リンダ ユニヴァーシティ
(74)【代理人】
【識別番号】100094569
【弁理士】
【氏名又は名称】田中 伸一郎
(74)【代理人】
【識別番号】100103610
【弁理士】
【氏名又は名称】▲吉▼田 和彦
(74)【代理人】
【識別番号】100109070
【弁理士】
【氏名又は名称】須田 洋之
(74)【代理人】
【識別番号】100119013
【弁理士】
【氏名又は名称】山崎 一夫
(74)【代理人】
【識別番号】100123777
【弁理士】
【氏名又は名称】市川 さつき
(74)【代理人】
【識別番号】100111796
【弁理士】
【氏名又は名称】服部 博信
(74)【代理人】
【識別番号】100123766
【弁理士】
【氏名又は名称】松田 七重
(72)【発明者】
【氏名】ヴィエット チー ティー
(72)【発明者】
【氏名】アウィゼラット ブラッドリー イー
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA01
4B063QQ03
4B063QQ42
4B063QQ52
4B063QR08
4B063QR56
4B063QS32
4B063QS40
4B063QX02
(57)【要約】
ここに提供されるのは、個人における口腔扁平上皮癌の予後の方法、適切な治療計画の決定の支援を提供する方法、及び治療に対する反応性を監視する方法である。これらの方法は、個人からのサンプルから口腔癌に対する高リスクエピジェネティック及び臨床病理学的スコアを決定するステップを含む。前記サンプルは、ブラシ生検サンプルであり得る。
【特許請求の範囲】
【請求項1】
OSCCを有する個人からの生物学的サンプルから口腔癌の高リスクエピジェネティック及び臨床病理学的(REASON)スコアを決定するステップ、並びに
REASONスコアに応じた治療計画を選択するステップ、ここで前記治療計画は、選択的頸部郭清術、放射線療法、免疫療法、又は化学療法のうちの1つ以上である、
を含む、口腔扁平上皮癌(OSCC)を有する個人の予後に基づく治療計画の決定の支援を提供する、方法。
【請求項2】
前記個人が、早期(I/II)OSCCを有する、請求項1に記載の方法。
【請求項3】
前記REASONスコアを、複数の非分子の変数及び複数の遺伝子の複数のメチル化パターンに基づいて決定する、請求項1に記載の方法。
【請求項4】
前記複数の非分子の変数が、個人の年齢、個人の性別、個人の人種、個人の喫煙、個人の飲酒、OSCCの組織悪性度、OSCCの段階、神経周囲浸潤、リンパ管湿潤、及びOSCCのマージン状態のうちの1つ以上を含む、請求項3に記載の方法。
【請求項5】
メチル化パターンがREASONスコアを決定するような複数の遺伝子が、ABCA2(ATP結合カセットサブファミリーAメンバー2)、CACNA1H(電位依存性カルシウムチャネルα1H)、CCNJL(サイクリン-J-Like)、GPR133(接着型Gタンパク質共役型受容体133)、HGFAC(肝細胞増殖因子アクチベーター)、HORMAD2(HORMAドメイン含有タンパク質2)、MCPH1(マイクロセファリン1)、MYLK(ミオシン軽鎖キナーゼ)、RNF216(リングフィンガータンパク質216)、SOX8(SRY-box転写因子8)、TRPA1(一過性受容体電位型カチオンチャネルサブファミリーAメンバー1)、及びWDR86(WDリピートドメイン86)のうちの2つ以上を含む、請求項3に記載の方法。
【請求項6】
生物学的サンプルを、ブラシスワブを用いて取得する、請求項1に記載の方法。
【請求項7】
OSCCを有する個人のREASONスコアが、正常者の基準REASONスコアを上回る場合、OSCCを有する個人が、予後不良を示す、請求項1に記載の方法。
【請求項8】
前記REASONスコアが、0~35の範囲である、請求項7に記載の方法。
【請求項9】
前記基準REASONスコアが、17である、請求項8に記載の方法。
【請求項10】
OSCCを有する個人からの生物学的サンプルから口腔癌の高リスクエピジェネティック及び臨床病理学的(REASON)スコアを決定するステップ、並びに
正常者の基準REASONスコアを上回っている、OSCCを有する個人のREASONスコアに応じて、個人をOSCC関連死亡の高リスクを有すると分類するステップ、
を含む、口腔扁平上皮癌(OSCC)を有する個人のリスク層別化をする、方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年1月14日に出願された米国仮特許出願第63/199,655号の利益及び優先権を主張し、その全体が参照により本明細書に組み込まれる。
【0002】
本開示は、口腔扁平上皮癌(OSCC)の評価、診断、予後、及び治療支援のためのシステム並びに方法に関する。
【背景技術】
【0003】
毎年30,000人の患者が、口腔扁平上皮癌(OSCC)と診断され、及び残念ながら、その発生率は、増えつつある。これらの早期患者でさえ、5年生存率は60%である。低い生存率は、一つにはリスク予測の不正確さが原因である。早期OSCCは、高リスクの特徴を持つ患者に対して、選択的リンパ節切除、放射線治療、又は化学放射線療法などのアジュバント治療の有無に関わらず、主に癌の外科的切除によって治療される。現在、アジュバント治療を割り当てるためのリスク予測は、すべて臨床病理学的情報に基づいている。複数のレトロスペクティブ研究及びプロスペクティブ研究は、これらの標準的な病床理学的因子は、0.7のc統計量(concordance statistic)(c-statistic)である中程度の精度を持つことが示されている。これまでのゲノムワイド関連解析は、実行可能なバイオマーカーを生み出していない。これらの研究の欠点は、臨床的に変換可能な(clinically translatable)アレイプラットフォーム(array platform)を使用できなかったこと、及び癌治療が行われているリアルタイムでメチル化を定量できなかったことを含む。臨床治療を適切に調整するため、より正確なリスクアセスメント方法を開発することが急務である。
【発明の概要】
【0004】
ここで提供されるのは、OSCCの診断及び治療方法である。例えば、OSCCの予後の方法及び適切な治療計画の決定方法、並びに治療への反応性を監視する方法が提供される。一実施態様において、OSCCを有する個人の予後の方法は、個人からの生物学的サンプルから口腔癌の高リスクエピジェネティック及び臨床病理学的スコア(REASON)スコアを決定するステップを含む。方法は、被験者におけるOSCCの評価のために被験者から生物学的サンプルを採取するための非侵襲的手法も含む。一実施態様は、病気の評価及び患者の予後の決定をするために患者からサンプルを採取する方法も含む。一実施態様において、前記生物学的サンプルは、がんと疑われる組織からの細胞の収集物、又は個人からの唾液、血液若しくは他の体液からの細胞の収集物であり得る。一実施態様において、前記生物学的サンプルを、ブラシ生検によって得る。一実施態様において、前記サンプルは、ブラシスワブサンプルである。一実施態様において、前記被験者は、前記生物学的サンプルのメチロームの評価に基づいて、早期(I/II)OSCCを有することを診断される。前記REASONスコアは、複数の非分子の変数(non-molecular variables)と複数の遺伝子の複数のメチル化パターンとの組み合わせである。前記複数の非分子の変数は、年齢、性別、人種、喫煙、飲酒、組織学的悪性度、段階、神経周囲浸潤(PNI)、リンパ管浸潤(LVI)、及びマージン状態が含まれる。メチル化パターンが前記REASONスコアを決定する前記複数の遺伝子は、ABCA2(ATP結合カセットサブファミリーAメンバー2(ATP-binding cassette sub-family A member 2))、CACNA1H(電位依存性カルシウムチャネルα1H(Calcium Voltage-Gated Channel Subunit Alpha1 H))、CCNJL(サイクリン-J-like(Cyclin-J-Like))、GPR133(接着型Gタンパク質共役型受容体133(Adhesion G-Protein-Coupled Receptor 133))、HGFAC(肝細胞増殖因子アクチベーター(hepatocyte growth factor activator))、HORMAD2(HORMAドメイン含有タンパク質2(HORMA domain containing protein 2))、MCPH1(マイクロセファリン1(Microcephalin 1))、MYLK(ミオシン軽鎖キナーゼ(Myosin Light Chain Kinase))、RNF216(リングフィンガータンパク質216(Ring finger protein 216))、SOX8(SRY-box転写因子8(SRY-box transcription factor 8))、TRPA1(一過性受容体電位型カチオンチャネルサブファミリーAメンバー1(Transient Receptor Potential Cation Channel Subfamily A Member 1))、及びWDR86(WDリピートドメイン86(WD Repeat Domain 86))の2つ以上を含む。
【0005】
実施態様は、OSCCの予後に基づいて治療計画の推奨を提供する方法を含む。前記方法は、個人からのサンプルからREASONスコアを決定するステップを含み、基準REASONスコア以上である前記サンプルからのREASONスコアは、予後不良を示す。臨床病理学的構成要素の前記REASONスコアは、0から9の範囲(9つの二分化された危険因子-人種、性別、7つの危険因子[PNI、腫瘍悪性度、マージン状態、LVI、段階、現在の喫煙、アルコール使用歴])、及び13個のCpGエピジェネティック部位(三部位数(tertiles)として分類される)については0から26の範囲である。前記総REASONスコアは、臨床病理学的スコアとエピジェネティックスコアとを組み合わせることにより、0から35の範囲となる。一実施態様において、前記基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される前記総REASONスコアのカットオフ範囲の中央値である。一実施態様において、17の前記基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される。
【0006】
実施態様は、個人からのサンプルからREASONスコアを決定することにより、外科的治療から恩恵を受け得る早期(I/II)OSCCを有する個人を同定する方法を含む。前記REASONスコアは、医療専門家及び患者が、選択的頸部郭清術、放射線治療法、又は化学療法の1つ以上などの治療計画を評価及び選択するための決定のサポートツールを提供する。実施態様は、OSCCを有する個人の治療法を選択する方法を含む。一実施態様において、前記方法は、個人からのサンプルからREASONスコアを決定することを含む。基準REASONスコア以上であるサンプルからの前記REASONスコアは、頸部郭清術、放射線療法、又は化学療法の1つ以上などの1つ以上の治療選択肢から恩恵を受け得る個人を示す。一実施態様において、前記基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される総REASONスコアのカットオフ範囲の中央値である。一実施態様において、前記17の基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される。
【0007】
実施態様は、前記REASONスコアを用いる口腔扁平上皮癌(OSCC)を有する個人のリスク層別化の方法を含む。そのような方法の1つは、個人からの生物学的サンプルから口腔癌の高リスクエピジェネティック及び臨床病理学的スコア(REASON)スコアを決定するステップ、及び健康な個人の基準REASONスコア以上であるOSCCを有する個人のREASONスコアに応答して、OSCC関連死亡の高いリスクを有するような個人を分類するステップを含む。
【0008】
本特許又は本出願ファイルは、少なくとも1つのカラーで作成された図面を含む。カラー図面を含む本特許又は本特許出願公開公報の写しは、請求及び必要な手数料の支払いにより、特許庁から提供される。
実施態様は、添付図面と併せて以下の詳細な説明により容易に理解される。実施態様は、例として図示されており、及び添付図面の限定をする目的ではない。
【図面の簡単な説明】
【0009】
図1図1は、実施態様による、TCGAコホートからのメチル化アレイデータの解析方法のフローチャートである。
図2図2は、ヒートマップであり、及び異なるメチル化遺伝子の階層クラスタリングは、高リスク対低リスクのOSCC患者における明確なメチル化シグネチャーを示す。それは、がんゲノムアトラス(TCGA)コホートにおいて、5年まで生存した患者と死亡した患者との間で、上位12個のメチル化の異なる遺伝子のヒートマップである。
図3図3A及び図3Bは、機能的なネットワーク解析マッピングからの表示である。機能的なエンリッチメント解析は、3つのパスウェイ上の異なるメチル化をされた遺伝子の凝集体を同定する。図3Aは、最も差次的に摂動されたメチル化経路(Padjusted<0.05)の上位10位にマッピングする、差次的に濃縮された遺伝子のドットプロットである。図3Bは、統計的に最も差次的にメチル化された経路の上位3つの表示を灰色の円で示したもので、及び構成要素遺伝子の異なるメチル化における倍率変化を、各遺伝子の負(緑)から正(赤)の倍率変化で表現する。各円のサイズは、遺伝子数に基づいている。
図4図4Aは、10倍のカバレッジで変曲点を示す全CPGにおける、カバレッジのグラフ表示である。図4Bは、がん被験者及び正常被験者のスワブサンプル及び組織サンプルの両方において定量されたCPGの数のグラフ表示である。カットオフ値として10倍の読み取り深度を使用し、定量化されたCpGサイトの数を、各サンプルにおいて決定する。図4Cは、ブラシスワブ及び組織の平均マッピング効率のグラフ表示である。前記平均マッピング効率は、ブラシスワブでは89.45%、組織では90%であり、2つのサンプリング方法に著しい差はなかった。図4Dは、MC-SeqによってプロファイルされたCPGの相対的な遺伝子位置(左)及び、プロファイルされたEPICアレイによってカバーされたCPGの相対的な遺伝子位置(右)の円グラフ表示のセットである。MC-Seqは、EPICアレイよりも機能的遺伝子領域をより確実にカバーする。
図5図5A及び図5Bは、3人の患者のそれぞれのがん部位及び正常部位の組織検体及びブラシスワブ検体の間の相関を示す散布図である。相関値を記載する。図5Cは、箱ひげ図(中央値、四部位数、最大値及び最小値)を用いて可視化した、MC-Seqで定量した癌サンプル及び正常サンプル間のメチル化差のグラフ表示である。
図6図6A~6Lは、前記特徴的なM-valueの偏りが、組織生検と比較したブラシスワブから得られたサンプルと同様に、正常サンプルと比較した癌サンプルにおいて一貫していることを示す代表的なM-biasカバレッジプロットである。
図7図7は、各生物学的サンプルのマッピング効率を詳述する。MC-Seq配列を使用すると、全サンプルにわたって90%の平均マッピング効率で参照ゲノムにマッピングした。各サンプルのMC-Seq結果を、図7に示す。前記最後の2行は、全てのスワブのサンプル及び全ての組織のサンプルについての平均値を示す。C=癌、N=正常である。
【発明を実施するための形態】
【0010】
詳細な説明
口腔及び中咽頭における癌のほとんどは、口や喉の内側を形成する扁平上皮細胞において発生する扁平上皮細胞扁平上皮細胞癌(OSCC)である。口腔癌は、増加傾向にあり、過去20年で3分の2に増加している。毎年30,000人のアメリカ人が、口腔扁平上皮細胞癌と診断され、及び新たに診断された症例の80%は、領域リンパ節移転又は遠隔転移のない早期I/IIである。たとえ早期口腔癌患者でも、5年間の生存率は60%と低い。OSCC患者は、がん及び頸部リンパ節の外科的切除を処置され、その後、リスク層別化に基づく化学療法及び免疫療法を併用又は併用せずにアジュバント放射線治療を処置される。しかしながら、臨床病理学的情報のみに依存する現在の臨床治療では、リスク予測及び生存率は、依然として低い。OSCC患者の最大40%は、早期癌を呈する患者であっても、5年以内に死亡する。この低い生存率は、他の癌、又は口腔咽頭のSCCなどの他の頭部癌及び頸部癌のサブタイプとは対照的である。臨床病理学的データと分子シグネチャーとの両方を組み合わせ、OSCC患者を高リスク及び低リスクカテゴリーに層別化し、かつ、アジュバント化学療法及び放射線療法に関する臨床決定サポートを提供し、並びに最終的に生存率を改善する、強固な予後方法を開発する必要がある。
【0011】
実施態様は、OSCC特有のメチル化特徴を定量化するためのサンプル収集の方法を含む。そのような方法の1つは、癌の特有のメチル化特徴を定量化するための強固な非侵襲的方法として機能するブラシスワブ生検を含む。特定の実施態様において、前記方法は、メチル化シグネチャーを確立するために、メチルキャプチャーシーケンシング(MC Seq)プロセスを通じて、ブラシスワブ生検からのサンプルのその後の処理を含む。このシグネチャーを、臨床病床理学的因子と組み合わせて評価し、死亡のリスクを決定し、及び適切な治療計画の決定のサポートを提供するために使用される、REASONスコアを得る。
【0012】
ここで開示されるのは、遺伝子メチル化シグネチャーを、臨床病理学的因子と組み合わせて、早期(I/II)OSCC患者における5年死亡率のリスクを決定する際に高い予後性能を有する複合分子及び非複合分子シグネチャーを形成する方法である。臨床病理学的データを、OSCC患者515人の内部のレトロスペクティブコホート、及びTCGAの患者58人のコホートから解析した。これら2つのコホートにおける5年死亡率を高く予測する臨床病理学的因子の上位を、決定した。TCGAコホートで利用可能なメチル化アレイデータを解析し、及び5年後までに死亡したOSCC患者と生存したOSCC患者との間で異なるメチル化がされている12個の遺伝子を同定した。12個の遺伝子のメチル化シグネチャーと関連する臨床病理学的因子を、リスクスコア-REASONスコアと組み合わせる。その予測性能を、診断から5年以内に死亡した早期OSCC患者を特定することで評価した。
【0013】
実施態様は、OSCCの予後に基づく治療計画の推奨を提供する方法を含む。前記方法は、個人からのサンプルからREASONスコアを決定するステップを含み、基準REASONスコア以上である前記サンプルからのREASONスコアは、予後不良を示す。臨床病理学的構成要素の前記REASONスコアは、0~9(9つの二分化された危険因子-人種、性別、7つの危険因子[PNI、腫瘍悪性度、マージン状態、LVI、段階、現在の喫煙、アルコール使用歴])及び13のCpGエピジェネティック部位については、0~26(三分位数として分類)の範囲である。前記総REASONスコアは、臨床病理学的スコアとエピジェネティックスコアとを組み合わせることにより、0~35となる。一実施態様において、基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される総REASONスコアのカットオフ範囲の中央値である。一実施態様において、17の前記基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される。前記方法は、前記REASONスコアに基づいて被験者に治療を提案するステップをさらに含み、前記治療は、少なくとも頸部部分切除(partial neck resection)、放射線治療、化学療法、免疫療法、及びそれらの組み合わせから選択される積極的治療、並びにアクティブサーベイランスのうちの1つ以上である。特定の実施態様において、前記REASONスコアを、選択された治療計画に対する患者の反応性を監視するために使用し得る。
【0014】
実施態様は、早期(I/II)OSCCを有する個人からのサンプルからREASONスコアを決定することにより、外科治療から恩恵を受け得る早期(I/II)OSCCを有する前記個人を特定する方法を含む。前記REASONスコアは、医療専門家及び患者が、選択的頸部郭清術、放射線治療法、免疫療法、又は化学療法などの治療計画を評価及び選択するための決定のサポートツールを提供する。実施態様は、OSCCを有する個人の治療法を選択する方法を含む。一実施態様において、前記方法は、個人からのサンプルからREASONスコアを決定することを含む。前記サンプルからのREASONスコアが基準REASONスコア以上であることは、頸部郭清術、放射線治療法、免疫療法、又は化学療法などの1つ以上の治療選択肢から恩恵を受け得る個人であることを示す。特定の実施態様において、前記スコアは、生存状態に基づいて経験的に決定される。一実施態様において、前記基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される総REASONスコアのカットオフ範囲の中央値である。一実施態様において、17の前記基準REASONスコアは、参加者を低リスクサブグループ及び高リスクサブグループに分類するために使用される。
【0015】
実施態様は、ABCA2、CACNA1H、CCNJL、GPR133、HGFAC、HORMAD2、MCPH1、MYLK、RNF216、SOX8、TRPA1、及びWDR86の2つ以上のメチル化パターンを決定するための少なくとも2つ以上のプライマー及び/又はプローブを含む評価キットも含む。この評価キットは、ABCA2、CACNA1H、CCNJL、GPR133、HGFAC、HORMAD2、MCPH1、MYLK、RNF216、SOX8、TRPA1、及びWDR86のうちの2つ以上メチル化パターンを決定するための命令も含み得る。この評価キットは、CpGエピジェネティックスコアを決定するための命令も含み得る。この評価キットは、CpGエピジェネティックスコア、並びに個人の年齢、個人の性別、個人の人種、個人の喫煙、個人の飲酒、OSCCの組織学的悪性度、OSCCの段階、神経周囲浸潤(PNI)、リンパ管浸潤(LVI)、及びOSCCのマージン状態の1つ以上を含む複数の非分子の変数に基づいてREASONスコアを決定するための命令も含み得る。実施態様は、OSCC患者のリスク層別化のためのこれらの評価キットの使用方法も含む。
【0016】
本明細書で使用される場合、“治療する(treating)”若しくは“治療(treatment)”は、完治若しくは不全治癒を意味し、又は基礎疾患若しくは関連する状態の症状は、少なくとも影響を受け、予防され、軽減され、除去され及び/又は遅延され、及び/又は症状を引き起こす基礎となる細胞的、生理学的、若しくは生化学的原因若しくは機構の1つ以上が影響を受け、予防され、軽減され、遅延され及び/又は除去されることを意味する。この文脈で使用される場合、減少された(reduced)又は遅延された(delayed)は、未治療の病気の生理学的な状態だけでなく、未治療の病気の分子状態を含む、未治療の病気の状態との相対的な関係を意味することが理解される。特定の実施態様において、前記RESONスコアの決定は、被験者を治療するための包括的なリスク層別化戦略の一部である。
【0017】
実施態様は、診断時にOSCC患者のメチル化シグネチャーを非侵襲的に決定するために、ブラシスワブサンプル及びMC-Seqを使用するOSCC被験者のリスク層別化のための方法を含む。前記方法は、ブラシスワブを使用する生体サンプルを採取するステップ、複数の非分子の変数及び複数の遺伝子の複数のメチル化パターンの組み合わせである、REASONスコアを前記生体サンプルから決定するステップ、及び前記RESONスコアに応じてリスク層別化を提供するステップを含む。前記複数の非分子の変数は、年齢、性別、人種、喫煙、飲酒、組織学的悪性度、段階、神経周囲浸潤(PNI)、リンパ管浸潤(LVI)、及びマージン状態を含む。メチル化パターンがREASONスコアを決定する前記複数の遺伝子は、ABCA2、CACNA1H、CCNJL、GPR133、HGFAC、HORMAD2、MCPH1、MYLK、RNF216、SOX8、TRPA1、及びWDR86のうち2つ以上を含む。このように被験者の層別化が改善されることで、一次治療の決定がより適切にサポートされる結果になる。
【0018】
本明細書に、RESONスコアの開発を支援する患者の選択及びデータ収集過程について記載する。前記患者を、彼らが治療を受けた施設で集計された既存のOSCCデータベースから選択した。このデータベースのための臨床データの収集は、ロマリンダ大学(LLU)、コロンビア大学Irvingメディカルセンター(CUIMC)、ポートランドプロビデンスメディカルセンター(PPMC)、イリノイ大学シカゴ校(UIC)、及びアラバマ大学バーミンガム校(UAB)を含む、各施設の治験審査委員会により承認された。前記調査は、口腔舌、上顎及び下顎歯肉、硬口蓋、口腔底部、頬粘膜、並びに唇粘膜を含む口腔サブサイトのみに限定した。臨床病期及び病理学的病期を、対がん米国合同委員会第8版ステージングマニュアル(American Joint Committee on Cancer (AJCC) Eighth Edition Staging Manual)に基づいて記録した。全患者は、生検確認されたOSCCのI期又はII期(すなわち、T1N0M0又はT2N0M0)であった。匿名化された患者の臨床病理学的特徴を、データ解釈に使用した。以下の情報:年齢、性別、人種、喫煙、飲酒、TNM分類、腫瘍位置、病理学的特徴[すなわち、神経周囲浸潤(PNI)、リンパ管浸潤(LVI)、マージン状態、組織学的悪性度]、及び腫瘍切除に加えて受けた治療法(すなわち、頸部リンパ節切除、化学療法を併用又は併用せずに放射線治療)は、カルテレビューから取集された。515人の患者の内部コホート及び58人の患者のTCGAコホートは、病理学的TNM分類に基づく早期(I又はII)OSCC患者からなった。表1は、彼らの人口統計学的及び臨床病理学的特徴を詳述する。統計的検定及びp値を示す。略語:AJCC=対がん米国合同委員会(American Joint Committee on Cancer);NOS=特定不能(not otherwise specified);SD=標準偏差(standard deviation)、TCGA=がんゲノムアトラス(The Cancer Genome Atlas)。
【0019】
【表1-1】
【表1-2】
【0020】
TCGAコホートは、60%が男性であり、93%が白人であり、及び平均年齢は64歳であった。患者の大部分(68%)は、現在又は過去に喫煙者であり、及び患者の61%はアルコールを使用していた。腫瘍サブサイトは、口腔舌、歯茎、頬粘膜、口腔底部を含み、TCGAコホートの57%は、口腔舌SCCからなり、残りは他のサブサイトに分布していた。病理学的病期分類に関しては、31%がI期であり、及び69%はII期であった。腫瘍の悪性度に関しては、19%が高分化型の腫瘍であり、残りの81%は中分化型又は低分化型の腫瘍であった。PNIは、35%存在し、LVIは6.9%存在し、及び断端陽性(positive maragin)又は断端近接(close maragin)は、21%のケースで存在した。5年生存率は、86%であった。TCGAコホート及び内部コホートの間の顕著な差を、表1に示す。性別、年齢、自己申告された人種、及び喫煙は、2つのコホート間で差はなかった。前記内部コホートは、ヒスパニック系を自己申告した患者の割合がより高かった(22%対3.6%、p=0.001)。前記内部コホートは、アルコールを摂取した患者が顕著に少なかった(40%対61%、p=0.002)。腫瘍部位に顕著な違いがあった。舌SCC患者の割合は、両コホートで同様であったが(57%)、前記内部コホートは、前記TCGAコホートよりも歯槽(歯肉)SCCの割合が高かった(17%対5%、p<0.001)。腫瘍悪性度にも差があり、高分化型腫瘍を有する内部コホートが高かった(40%対19%、p=0.001)。TCGAコホートと比較して、内部コホートではPNIを有する割合は低かった(11%対35%、p<0.001)。同様に、内部コホートでは、病理学的病期が低い患者が顕著に多かった(64%対31%、p<0.001)。しかしながら、早期で高分化型腫瘍でPNIが低いにも関わらず、死亡のリスクは、内部コホートよりも顕著に高かった(37%対14%、P=0.001)。
【0021】
前記c-indexを、様々な臨床病理学的因子を用いて算出した。2つのコホートの間で最も高い予測能力を示した前記臨床病理学的特徴は、年齢、人種、性別、喫煙、飲酒、組織学的悪性度、段階、PNI、LVI、及びマージン状態であった。10個の非分子の特徴のこのパネルは、TCGAコホートではc-index=0.72、内部コホートではc-index=0.66の5年死亡リスクを予測した。二つの群間で臨床病理学的特徴の違いが報告されているにも関わらず、予後予測能に顕著な差はなかった。前記2つの群の複合は、5年死亡リスクにおいてc-index=0.67を有した。前記低いc-indexは、臨床病理学的因子だけでは、0.8以上のc-indexで定義されるような疾患リスクを十分に評価できないことを示した過去の臨床研究及びバイオマーカー研究と一致する。現在の臨床治療は、リスク評価及び治療決定のためのこれらの臨床病理学的因子のみに頼っている。
【0022】
TGCAデータベースにおける早期OSCC患者からのメチル化データの解析を、実施した。DNAメチル化データの前処理、品質管理フィルタリング、及び正常化(一括修正(batch correction)及び代理変数解析(surrogate variable analysis)を含む)を、Rバイオコンダクターパッケージのminfiパッケージを用いて実施した。前記minfiパッケージは、Infinium(登録商標)DNAメチル化マイクロアレイの解析のための柔軟な及び包括的なバイオコンダクターパッケージである。メチル化差解析(differential methylation analysis)を、Rパッケージのlimmaパッケージを用いて実施した。前記Illumina Infinium Methylation 450K Arrayデータ解析を図1に記載する。図1は、実施態様による、TCGAコホートからのメチル化アレイデータの解析方法のフローチャートである。
【0023】
方法100において、450Kアレイ102及び表現型データ104の2つのデータセットを、前記minfiパッケージのRGチャネルセット106にロードした。これらは、2色のマイクロアレイ、具体的にはイルミナのメチル化アレイからの生(未処理)データである。次に、前記RGセットデータを、イルミナのメチル化マイクロアレイのために層別化されたクオンタイル正規化前処理(stratified quantile normalization preprocessing)を実行するpreprocessQuantile関数を用いて正規化する108。その後、前記データを、メチル化マイクロアレイをゲノムの位置にマッピングするゲノム比率セット関数(genomic ratio set function)で処理する110。次のステップ112において、前記サンプルの性別を予測し、及び次いで前記サンプルの表現型と照合する。ステップ112は、自己申告と生物学的性別との間に不一致であるサンプルを特定することにより、前記サンプルと出力とが一致していることを判断するための品質管理のステップである。その後、前記データは、プローブフィルターステップ114を受けた。簡単に言えば、総計485,512のプローブの中で、X又はY染色体にハイブリダイズするプローブを除去し116、473,864のプローブが残った。その上、一塩基多形(SNPs)に関連する17,351のプローブを除去し118、及び遺伝子領域をマッピングしていない111,977のプローブを除去した120。前記p値を、前記プローブフィルタープロセスの次のステップ122の一部として、残っているプローブについて計算した。少なくとも50%のサンプルにおける0.01未満の検出p値を、ステップ124で決定すると、少なくとも50%のサンプルで0.01よりも大きい検出p値であったそれらのプローブを、ステップ126において除去した。残りの344,536のプローブから、少なくとも50%のサンプルで0.01未満の検出p値であったそれらのプローブを、ステップ128で保持した。その後、交差反応性又は複数のゲノム位置にマッピングされた前記プローブを、ステップ130でフィルターし、324,465のプローブが残った。
【0024】
次いで、フィルターしたプローブの前記ベータ値及びM値を、ステップ132で計算した。ベータ値は、各CpGサイトにおけるメチル化の生の推定値である(範囲0~1)。M値は、同じメチル化状態の異なる推定値であり、解析のためのより良い統計的特性を有する。全サンプル中で0.1未満のベータ値、又は全サンプル中で0.9を超えるベータ値を有する前記プローブを、ステップ134で除外し、317,016のプローブが残った。結果変数として患者の生存状態を用い、代理変数解析を用いた一括修正を、実施した。サンプル中のベータ値のばらつきを、ステップ136で解析した。生存状態との相関が0.2より高い代理変数を、除外した(14個の代理変数のうち3個が特定された)。代理変数解析を、使用し、関心のある結果(例えば、バッチ効果)とは関係ないが、分析に影響を与え得る不要なばらつきを引き起こすデータにおけるパターンを識別する。代理変数を、高次元データから推測し、及びこれらの不要なばらつきの原因を調整するために共変量として使用される。次に、上位30%の変動するメチル化プローブを、ステップ138で選択し、4,544の遺伝子に及ぶ95,104のプローブの総数が、メチル化差解析のために保持される。前記同じプローブは、ステップ140でM値を保持した。ベータ値を、使用し、CpGサイトのメチル化状態を説明したが、M値を、同じ部位の統計解析に用いる。M値におけるlimma機能を使用するメチル化差解析を、Rバイオコンダクターパッケージを使用して解析し、前記limma機能を、マイクロアレイ解析からから生じた遺伝子発現データの解析のために使用する。
【0025】
解析に利用可能なサンプルサイズを考慮し(n=58)、0.1未満の調整されたp値を示す生存状態について、異なるメチル化をされたCpGを、予後パネルの分子構成要素に含めることを検討した。ヒートマップは、クラスタリング変数として生存状態を用いる、Rにおけるヒートマップパッケージv1.0.12を使用する、階層的クラスタリング解析を使用して構築された。パスウェイ(pathways)の中でメチル化が異なる遺伝子(differentially methylated genes)の濃縮を評価するために、パスウェイ解析を、遺伝子オントロジー(GO)及び京都遺伝子ゲノム百科事典(KEGG)という、2つの相補的及び重複するアノテーションを用いて行った。パスウェイ解析、特に過剰発現解析を、KEGGを用いて実行した。並びに、GOアノテーションは、RのclusterProfiler v3.16.1を使用して実施され、重要でない発現変動遺伝子(differentially expressed genes)を“バックグラウンドユニバース(background universe)”として特定し、及びボンフェローニ補正を用いる多重検定を考慮した。GOアノテーションを用いる過剰発現解析では、パスウェイを、生物学的プロセス、分子機能、及び細胞内コンパートメントにさらに分類した。Rのenrichplotパッケージv1.8.1を用いる機能的濃縮の2つの可視化(すなわち、ドットプロット及び遺伝子概念ネットワーク)によって、異なるメチル化をされたパスウェイを、相互に関連すること、及び異なるメチル化をされた部位に寄与していることを評価した。
【0026】
生存状態と関連する、異なるメチル化部位を持つ遺伝子の発現の相関を、開発した。RNAシーケンシング(RNAseq)により収集された遺伝子発現の解析を、前記TCGAデータベースにおける早期OSCC患者から実施した。生の遺伝子数を、TCGAから得た。少なくとも90%のサンプルで少なくとも10カウントの遺伝子のみを、解析のために保持した。前記遺伝子数のEnsembl識別子(ID)を、RのEnrichmentBrowser v2.18.2パッケージを用いてEntrez IDsにアノテーションした。遺伝子のアノテーションは、Homo.sapiens v.1.3.1パッケージを使用して付与された。RNAseq遺伝子数とCpGサイトメチル化との相関を、STATA/SE 14.2(StataCorp、College Station、TX)を使用して実施した。
【0027】
統計解析を、STATA/SE 14.2で実施した。各コホートについて、単変量解析を実施し、分布特性を決定し、及び欠陥データのランダム性を評価した(最終的な予後パネルリスクファクタースコアに含まれる変数は、欠測値が5%未満であったため、インピュテーションを実施しなかった)。主要転機(5年追跡時の生存状態[生存対死亡])との二変量解析は、結果変数との候補変数(candidate variables)(関連する臨床的及び人口統計学的リスク因子の詳細なスクリーニングからの研究者の選択に基づく)について実施した。連続変数について、カットオフは、カットオフが臨床的に意味を成すことを確認するために、マニュアル調整によって検出されたカイ2乗相互作用を用いて導き出された。スコアの単純性を最大化しながら、再帰分割を使用し、最終的な非分子スコアリングシステムを導き出し、最終セルにおいて誤分類された値の数を最小化することを目的に5年追跡時の生存状態を予測した。各決定ノードにおけるオッズ比率を、最も近い整数に丸めて、スコアを作成した。導き出されたリスクスコアの動作特性を、発見コホート(内部コホート、n=515)及び検証コホート(TCGA、n=58)の両方で計算した。受信者動作曲線下の面積(AUROC)に相当する、前記コンコーダンス統計量(c-統計量)を、使用し、早期死亡及び罹患のリスクにおいてOSCC患者を予後するために導入されたリスク因子スコアを用いたモデルの識別及び適合を評価した。c-統計量の範囲は、0.5(ランダムコンコーダンス)~1(完全コンコーダンス)である。
【0028】
DNAメチル化に基づく、前記RESONスコアの分子構成要素を、メチル化状態遷移マトリックスに従って開発した。各CpGサイトについて、β値が0.3未満は非メチル化状態、0.33~0.75はヘミメチル化状態、及び>0.75は完全メチル化状態を示した。メチル化レベルが、メチル化されていない状態からよりメチル化されている状態へと移動した場合、遺伝子は、高メチル化されたとみなされた。逆に、メチル化レベルがより低い状態に変化した場合、遺伝子は低メチル化されたとみなされた。状態変化のないメチル化の変化は、重要とはみなされなかった。前記RESONスコアを、それぞれの非分子的危険因子及び分子的危険因子の有無を組み合わせることにより、定められた。前記c-統計量を、前記個人のRESONスコアを用いて、5年後に観察された生存状態と5年後に予後された生存状態とを比較することにより、上記のように導き出した。
【0029】
サンプル採取方法を、OSCCの非侵襲的で強固な評価方法を実施するために開発した。相関を、臨床バイオマーカー研究においてブラシスワブを用いたDNAメチル化マークのロバスト性を決定するために各患者の癌及び正常の組織並びにブラシスワブサンプル間で計算した。
【0030】
3人のOSCC患者が、癌及び対側の正常の組織及びブラシスワブ生検の採取を受け、各患者について合計4サンプルを採取した。エピゲノムワイドDNAメチル化定量化を、SureSelectXT Methyl-Seqプラットフォームを用いて実施した。DNAの質及びメチル化部位の分解能を、ブラシスワブ及び組織サンプル間で比較した。前記患者を、生物学的サンプル及び臨床病理学的情報が収集される多施設プロスペクティブ臨床研究に登録した。臨床データ及びサンプルの収集は、ロマリンダ大学(LLU)、イリノイ大学シカゴ校(UIC)、及びアラバマ大学バーミンガム校(UAB)を含む各施設の治験審査委員会により承認を得た。患者は、18歳以上であり、口腔舌、上顎及び下顎歯肉、硬口蓋、口腔底部、頬粘膜、並びに唇粘膜を含む、口腔サブサイトの生検診断での扁平上皮癌を持ち、かつ、OSCCの治療歴がない場合に、患者は適格とされた。臨床病期及び病理学的病理を、対がん米国合同委員会(AJCC)第8版ステージングマニュアルに基づき記録した。以下の情報:年齢、性別、人種、喫煙及び飲酒、段階、腫瘍部位、病理学的特徴、並びに腫瘍除去以外に受けた治療法を、カルテレビューから収集した。手術時に採取された生物学的サンプルは、瞬間冷凍した癌及び対側の正常の組織、並びに癌部位及び対側の正常部位のブラシスワブ生検を含む。Isohelixブラシスワブ(Boca Scientific)を、癌部位又は対側の正常部位で、スワブの各表面に10回ずつ、合計20回ブラッシングした。前記ブラシスワブを、500μlBuccalFixTM安定化溶液(Boca Scientific)を使用して保存した。サンプルは、-80℃で保存した。
【0031】
合計3人の患者を、今回の研究については進行中のプロスペクティブ臨床研究から無作為に選んだ。DNAを、3人の患者の癌側及び対側の正常側の瞬間冷凍された組織及びブラシスワブから抽出し、合計12サンプル(患者1人につき4サンプル)であった。ゲノムDNAの質を、分光光度法で決定し、及び濃度を、蛍光光度法で決定した。DNAの完全性及び断片サイズを、Agilent Bioanalyzer上で動くマイクロ流体チップを用いて決定した。
【0032】
インデックス付きペアエンド全ゲノムシーケシングライブラリーを、SureSelect XT Methyl-Seq kit (Agilent)を用いて調製した。ゲノムDNAを、Covaris E220システムを用いて150~200bpの断片長にせん断した。せん断化したサンプルのサイズ分布を、Caliper LabChip GX system (PerkinElmer)を用いて決定した。断片化したDNA末端を、T4 DNAポリマー及びポリヌクレオチドキナーゼで修復し、並びに“A”塩基を、Klenowフラグメントを用いて付加した後、AMPure XPビードベースの精製(Beckman Coulter)をした。前記メチル化されたアダプターを、T4 DNAリガーゼを用いてライゲーションした後、AMPure XPでビーズ精製された。アダプターライゲーションされたDNAの質及び量を、Caliper LabChip GXシステムで評価した。サンプルを、カスタムSureSelect Methyl-Seq Capture Libraryを使用することにより標的メチル化部位を濃縮した。ハイブリダイゼーションを、サーマルサイクラーを使用し、65℃で16時間実施した。濃縮が完了したら、前記サンプルを、ストレプトアビジンコートビーズ(Thermo Fisher Scientific)と混合し、及び一連のバッファーで洗浄し、非特異的DNAフラグメントを除去した。DNAフラグメントを、0.1M NaOHでビーズから抽出した。濃縮されたDNAの非メチル化C残基は、EZ DNA Methylation-Gold Kit(Zymo Research)を用いて、バイサルファイト変換を行った。前記SureSelect濃縮ライブラリー及びバイサルファイト変換ライブライリーは、カスタムメイドプライマー(IDT)を用いてPCR増幅を行った。デュアルインデックライブラリーを、Library Quantification Kit (KAPA Biosystems)を用いた定量ポリメラーゼ連鎖反応(qPCR)によって定量化し、及び挿入物のサイズ分布を、Caliper LabChip GXシステムを用いて評価した。サンプルを、Illumina HiSeq NovaSeqの100bpペアエンドシーケンシングを用いて、イルミナプロトコルに従って配列決定した。ポジティブコントロール(調製したバクテリオファージPhi Xライブラリー)を、各レーンに0.3%の濃度で添加し、リアルタイムでシーケンスクオリティを評価した。
【0033】
シグナル強度を、システムのReal Time Analysisソフトウェアを使用して、各実行中に個々のベースコールに変換した。サンプルデマルチプレキシングを、Illumina’S CASAVA1.8.2ソフトウェア一式を用いて実行した。前記サンプルのエラーレートは、1%未満及びレーン内のサンプル当たりリード分布が、妥当な許容誤差以内であることを要求された。シーケンスデータの質を、FastQC(ver.0.11.8)を用いて調査した。品質の悪いアダプターシーケンス及びフラグメントを、Trim_galore(ver.0.6.3_dev)により除去した。Bismark pipelines(ver.v0.22.1_dev)を使用し、デフォルトのパラメータでバイサルファイトヒトゲノム(hg19)にリードをアラインした。ヒトゲノムへのサンプルアラインメントを、bowtie 2(ver.2.3.5.1)を使用して実行した。クオリティトリミングされたペアエンドリードを、バイサルファイト順鎖(forward strand)リード(C->T変換)又は逆鎖(reverse strand)リード(G->A変換)に変換した。複製されたリードを、Bismarkマッピング出力から除去し、及びCpGを抽出した。全てのCpGサイトを、シーケンスカバレッジ(すなわち、リード深度)によりグループ化し;カバレッジ≧10x深度のCpGサイトは、高いMC-Seqデータ品質を保証するために、解析に保持された。遺伝子を、Homer annotatePeaks.plを用いてアノテーションした。このソフトウェアで、前記プロモーター領域を、転写開始部位(TSS)から1キロ塩基と定義する。Benjamini-Hochberg FDRプロセスを、適用し、CpGサイトごとのp値を調整した。Pearson相関を、解剖学的部位を一致させた組織サンプル及びブラシスワブサンプル間、並びに同一患者の癌サンプル及び正常サンプル間で計算した。Pearson相関及び絶対差を、前記サンプル間の共通のCpGサイトの間で計算した。MC-Seqで測定された全てのCpGサイトからβ値の相関を示す散布図を、表示した。癌部位及び正常部位について、組織とブラシスワブとの間のこれらのCpGサイトの一致を示す別の散布図を、示す。スチューデントt検定を実施し、癌グループ及び正常グループ、又は組織グループ及びブラシスワブグループの間のβ値を比較した。癌グループ対正常グループにおける最も顕著な1,000個のCpGの特徴を選択した。これらの結果に基づき、-log10(t検定 p値)を、1,000個のCpGサイトごとに計算し、(1)癌対正常、及び(2)組織対ブラシスワブの間で、これら1,000個のCpGについて検定統計量の有意性の相違の程度を比較した。統計解析を、R環境(v.4.1.0)で実施した。
【0034】
5年生存しなかった早期OSCC患者におけるメチル化が異なる遺伝子を明らかにしたメチル化アレイ解析
解析の基準を満たすCpGサイトを持つ4,544遺伝子のうち、12個の遺伝子が、0.1未満の調整されたp値を示した(表2)。遺伝子の位置及びメチル化の倍率変化の値を、示す。ここで低い生存率の予測である各遺伝子の前記メチル化傾向を、過去の研究で低い生存率の予測である遺伝子発現傾向と比較して示す。参照した研究のPMIDを含む。それらは、ABCA2、CACNA1H、CCNJL、GPR133、HGFAC、HORMAD2、MCPH1、MYLK、RNF216、SOX8、TRPA1、及びWDR86を含む。
【0035】
【表2】
【0036】
図2は、ヒートマップであり、及び異なるメチル化遺伝子の階層的クラスタリングは、高リスク対低リスクのOSCC患者における明確なメチル化シグネチャーを示す。図2は、ヒートマップを用いて、上位12個の異なるメチル化遺伝子の58個のTCGAの患者のサンプルのそれぞれのメチル化状態を示している。癌が原因で5年後までに死亡した患者を、ヒートマップの左側にグループ分けし、5年後まで生存した患者と比較してメチル化シグネチャーに顕著な差がある。
【0037】
12個の遺伝子のそれぞれの文献探索は、SOX8を除いて、いずれの遺伝子も、ヒト又は前臨床研究のいずれにおいてもOSCCと過去に関連付けられていないことが明らかにした。表2において、各遺伝子を、癌の生存率の低さを示す参照された臨床研究と関連付ける。SNPs又は過剰メチル化のどちらかを介するHORMAD2の異常調節は、非小細胞肺癌(NSCLC)及び甲状腺癌における低い生存率の原因とみなされる。MYLK過剰発現は、膀胱癌、結腸直腸癌、及び肝細胞癌における生存率の低さと関連している。GPR133発現は、多形膠芽腫を持つ患者の生存率と逆相関している。SOX8の役割は、in vitroモデル及びin vivoモデル、並びにOSCCの臨床サンプルを用いて既に調査されている。臨床研究において、SOX8は、舌SCCを持つ化学療法抵抗性の患者で過剰発現しており、並びにリンパ節移転の高度化、進行した腫瘍の病期、及び全生存期間の短縮と関連している。同様に、SOX8の高発現は、子宮内膜癌を持つ患者における高腫瘍組織悪性度、リンパ節移転、及び全生存期間の短縮と関連している。癌におけるTRPA1発現は、議論の的になっており、遺伝子の過剰発現は上咽頭癌における低い生存率と関連し、及び遺伝子の過小発現は腎明細胞癌における低い生存率と関連している。しかしながら、国際癌ゲノムコンソーシアムのデータを使用する研究は、遺伝子のTRPファミリーは、異なる癌の種類によって異なる発現をし、及びいくつかのTRP遺伝子は、他の遺伝子よりも強い予後予測能を持っていることを示す。ATP結合カセットトランスポーターのスーパーファミリーの膜結合タンパク質をコードするABCA2は、低い生存率を有する卵巣上皮癌及び急性リンパ症白血病の患者で過剰発現している。HGFACの発現は、乳管癌及び卵巣癌における生存率と直接相関している。WDR86の発現は、結腸直腸癌及び乳癌における低い生存率に関連する。胃癌、肺癌及び卵巣癌を含む固形腫瘍の臨床研究では、CACNA1Hを含むT型カルシウムチャネル遺伝子の発現は、生存率についての予後のシグネチャーとして使用される。RNF216の発現は、結腸直腸癌及び卵巣癌における低い生存率と関連しているが、過剰発現又は過小発現が生存率を低下させるのかは、不明である。CCNJLの発現は、肝細胞癌における生存率と逆相関する。
【0038】
注目すべきは、12個の遺伝子のメチル化の差は、いずれのタイプの癌においても低い生存率と以前に関連していなかったことである。HORMAD2及びHGFACを除いて、これらの候補遺伝子について公表された研究は、メチル化よりもむしろ差次的遺伝子発現(differential gene expression)に焦点を当てている。
【0039】
REASONスコアの予後予測能
前記REASONスコアを、10個の因子の非分子のパネルと13個のCpGを含む12個の遺伝子のメチル化パネルとを組み合わせることにより計算し、各遺伝子のメチル化状態を、メチル化状態遷移マトリックスを用いて決定した。前記REASONスコアは、5年の疾患特異的死亡率をc-index=0.915と予測した。
【0040】
異なるメチル化遺伝子の機能的解析
遺伝子発現データは、58人のTCGA OSCC患者のDNAメチル化データのうち55人について利用可能であった。ますます理解されつつあるように、遺伝子の過剰メチル化は、遺伝子発現の減少又は増加をもたらすことができ、これはTCGAサンプルで観察された。各遺伝子における遺伝子発現及びDNAメチル化の間に顕著な相関を、12個の遺伝子のうち6遺伝子(ABCA2[r=0.46、p=0.0005]、GPR133[r=0.42、p=0.0015]、MCPH1[r=0.31、p=0.024]、RNF216[r=-0.38、p=0.0045]、TRPA1[r=-0.60、p<0.0001]、WDR86[r=0.36、p=0.0072])で観察した。さらに、遺伝子ネットワーク解析を、公表されているデータベースを用いて実施し、前記12個の候補遺伝子が、確立されたシグナル伝達ネットワークに直接関連しているかどうかを決定した。表3は、候補遺伝子に関連する前記KEGGパスウェイを詳述する。
【0041】
【表3】
【0042】
表4は、遺伝子オントロジーカテゴリー(すなわち、生物学的サンプル、細胞内コンパートメント、分子機能)によって集約される候補遺伝子に関連するGOパスウェイを詳述する。GOアノテーションに基づく、差次的にメチル化されたパスウェイ(p値<0.05に調整された)を示す。差次的にメチル化されたパスウェイを、生物学的プロセス(BP)、分子機能(MF)、及び細胞内コンパートメント(CC)のオントロジーに基づいて評価した。予後パネルに含まれる12個の異なるメチル化遺伝子のいずれかを含むパスウェイを、同定する。
【0043】
【表4-1】
【表4-2】
【0044】
12個の異なるメチル化遺伝子のうちの7個(すなわち、ABCA2、CACNA1H、MCPH1、MYLK、RNF216、SOX8、TRPA1)は、統計的に重要な差次的メチル化パスウェイにマップした。複数の関連する差次的メチル化パスウェイにマップされた異なるメチル化遺伝子間の複雑な関連性を、遺伝子セットの濃縮ドットプロット及び遺伝子コンセプトネットワークプロットを用いて可視化した(図3A及び図3B)。図3A及び3Bは、機能的ネットワーク解析マッピングによる表現である。機能的濃縮解析は、3つの概念に集約されるパスウェイ上の異なるメチル化遺伝子の集合体を同定する。図3Aは、最も差次的にメチル化されたパスウェイの上位10位に位置する異なる濃縮された遺伝子のドットプロットである(padjusted<0.05)。図3Bは、灰色の円で識別される統計的に最も差次的にメチル化されたパスウェイの上位3つ、及び構成遺伝子の異なるメチル化における倍率変化を、各遺伝子についてネガティブ(緑)からポジティブ(赤)までの倍率変化で色分けした図である。各円のサイズは、遺伝子数に基づく。
【0045】
CACNA1H及びMYLKは、19の統計的に差次的にメチル化されたパスウェイのうち5つに位置付けた(padjusted<0.05、表3)。REASON分類に含まれる12個の異なるメチル化遺伝子のうち、これら2つ(CACNA1H及びMYLK)は、差次的メチル化経路の上位3つ:向神経活性リガンド受容体相互作用、モルヒネ依存、及びカルシウムシグナル伝達経路に位置付ける。
【0046】
早期OSCCの低い生存率の予測に高い精度を示すREASONスコア
前記REASONスコアは、12個の遺伝子のメチル化シグネチャーと同様に、非分子の臨床病理学的因子に依存する。OSCCにおけるこれまでのメチル化研究では、OSCCの予後を示すとしてこれらの12個の遺伝子のいずれも同定されていない。SOX8を除いて、パネル内の前記遺伝子は、これまでOSCCと関連していなかった。しかしながら、これらの遺伝子のいくつかは、発癌において重大な役割を果たすとしてしっかりと確証されていないが、全12個の遺伝子は、患者組織の遺伝子関連研究において、他の癌の生存と関連している。しかし、発現のプロファイルは、OSCCについて予測するメチル化プロファイルと一致していない。
【0047】
登録した3人の患者の臨床病理学的情報を、表4a及び4bに詳述する。前記3人の患者は、早期及び後期OSCC(I期及びIV期)の両方を含み、並びにタバコ及びアルコールの摂取習慣は様々であった。患者の年齢は、49歳及び68歳であった。2人の患者は男性であり、及び1人は女性であった。全ての患者は、白人で、非ヒスパニック系であった。
【0048】
【表5】
【表6】
【0049】
表4a及び4bは、3人の患者の人口統計学的及び臨床病理学的情報を示している。略語:F=女性、M=男性、TNM=腫瘍、リンパ節、転移の分類。
【0050】
手術時に採取した癌及び対側の正常の組織及びブラシスワブ生検は、DNA抽出を行い、その収量及び質を表5に示した。各サンプルの総投入量は30μLで、組織のDNAの総投入量は、187ng~660ngの範囲であり、及び平均は390ngであった。スワブのDNA総投入量は、51ng~1998ngの範囲であり、平均は532ngであった。投入範囲は、この範囲でMC-Seqを用いたCpGサイトの定量が再現可能であることを示した結果と一致した。ここに示すように、150~300ngという少ないDNAの量及び表5の所見と匹敵するDNAの質が、本明細書に記載の方法を用いることでうまく増幅した。表5は、組織生検及びブラシスワブ生検の配列決定の入力として使用されるゲノムDNAの特性を示す。
【0051】
【表7】
【0052】
分光光度法及び蛍光光度法で評価した前記DNA濃度及び質、並びに各サンプルの総DNA投入量を、表5に示す。C=癌、N=正常である。
【0053】
MC-Seqマッピングの効率評価
表6は、各生物学的サンプルのマッピング効率を詳述する。MC-Seq配列を使用すると、全サンプルにわたって90%の平均マッピング効率で参照ゲノムにマッピングした。各サンプルのMC-Seq結果を、表6に示す。前記最後の2行は、全てのスワブのサンプル及び全ての組織のサンプルについての平均値を示す。C=癌、N=正常である。
【0054】
図4Aは、10倍のカバレッジで変曲点を示す全てのCpGにおける、カバレッジのグラフ表示である。組織サンプルとブラシスワブサンプルとの間のマッピング効率に著しい差はなかった(図4A)。図4Bは、癌被験者及び正常者のスワブサンプル及び組織サンプルの両方で定量されたCpGの数のグラフ表示である。カットオフとして10倍の読み取り深度を用い、定量されたCpGサイトの数を、各サンプルにおいて決定した。ペアになったブラシスワブ及び組織の間のマッピング効率における平均差は、最小は-0.567%で、組織サンプルに有利で、範囲は-1.9~1.7%であった。メチル化されたCの大部分は、CpGコンテキストに出現した。各CPGの読み取りの深度を、全てのクエリされたCPGにわたってグラフ化し、及び10倍のカバレッジでの変曲点を示した(図4B)。これらの結果は、以前の提示された結果と同様であり、CpGサイトの大部分は、少なくとも10倍のカバレッジを示した。このカットオフを適応し、少なくとも10倍のカバレッジを持つCpGサイトに解析を集中させた。少なくとも10倍のカバレッジを持つCpGの平均数は、スワブサンプルについて2,716,674個、及び組織サンプルについて2,904,261個であり、2つのサンプルタイプ間に著しい差はなく、DNAメチロームを測定するために最も一般的に使用されるツールであるIllumina EPICアレイよりも3倍多いCpGが調査された。図4Cは、ブラシスワブ及び組織の平均マッピング効率のグラフ表示である。図4Cは、12個の個人のサンプルのそれぞれについて、少なくとも10倍のカバレッジを有するCpGの数を示す。前記平均マッピング効率は、ブラシスワブで89.45%であり、及び組織で90%であり、2つのサンプリング方法の間で著しい差はなかった。
【0055】
メチローム領域の分布
MC-SeqでプロファイルされたCpGサイトの分布を、全12個のサンプル(3,566,843CpG)にわたって重複する10倍の読みの深度以上でうまく測定されたCpGサイトの中で決定した。
【0056】
図4Dは、MC-SeqによってプロファイルされたCpGの相対的な遺伝子位置(左)及びプロファイルされたEPICアレイによってカバーされたCpGの相対的な遺伝子位置(右)のセットの円グラフ表示である。MC-Seqは、EPICアレイよりも機能的遺伝子領域をより確実にカバーした。図4Dは、36%がイントロン、26%がプロモーター、19%がエクソン、19%が遺伝子間領域であったことを示している。全体として、MC-Seqは、EPICアレイによって一般的に提供されるよりもメチロームにおける機能的遺伝子領域のより強固なカバレッジを提供し、EPICアレイよりもプロモーター領域及びエクソンにおいて10倍より多くのCpGサイトを検出した。EPICアレイからの484,697個のCpGのうち、450Kにおいても発見された大部分を、MC-Seqにより少なくとも10倍のカバレッジでプロファイルした。これらCpGの内訳は、33%のイントロン、33%のプロモーター、15%のエクソン、及び19%の遺伝子間領域であったが、機能的遺伝子領域におけるCpGの総数は、カバレッジがより限られているため、比例して少なかった(図4D)。
【0057】
一致した解剖学的部位からのブラシスワブ及び組織生検の相関性
全体として、全サンプルにわたるCpGサイトメチル化間の相関は高く、全て90%を上回っていた。全サンプル(癌+対照)(s=3,566,843)で共有された全てのCpGサイト中の組織及びブラシスワブ(n=12)間の相関の平均は、93.2%(95%信頼区間:93.23%、93.25%)であった。癌サンプル中で共有される全てのCpGサイトにおける組織及びブラシスワブ(n=6)間の平均相関は、91.3%(95%信頼区間:91.32%、91.35%)であった。正常サンプル中で共有される全てのCpGサイトにおける組織及びブラシスワブ(n=6)間の平均相関は、95.1%(95%信頼区間:95.13%、95.14%)であった。図5A及び図5Bは、それぞれ3人の患者の癌部位及び正常部位についての組織及びブラシスワブ生検の相関を示す散布図である。相関値を記載している。10倍カバレッジのCpGのこの散布図は、組織及びブラシスワブ間で高い一致を示していた(図5A及び図5B)。
【0058】
癌サンプル及び正常サンプルの間では差はあるが、組織及びブラシスワブの間では差がない、上位のメチル化特徴
癌サンプル及び正常サンプルの間で最も変わりやすい上位1,000のメチル化特徴が、解析の焦点であり、組織及びブラシスワブのサンプリング方法間で差がかなり少ないと予想される。図5Cは、MC-Seqで定量化した癌サンプル及び正常サンプル間のメチル化の差のグラフ表示であり、箱ひげ図(中央値、四分位数、最大値及び最小値)を用いて可視化した。t検定によるCpGメチル化の差の各検定のp値を、-log10(p値)で表し、及び癌対正常の平均は、3.67(すなわち、p=0.00021)であった。同じCpGサイトは、メチル化に差はなく、組織対ブラシスワブの間で平均-log10(p値)=0.96(すなわち、p=0.11)であった。前記結果は、ブラシスワブが、組織生検の臨床的に実行可能な代替となることを示唆している。
【0059】
M値の偏りは、DNAメチル化を測定するために採用される方法の標準的な定性的な診断である。M値の偏りを、配列決定されたDNA鎖の関数として調査した(R1は“順”鎖、及びR2は同配列であるが“逆”鎖からのものである)。M値の偏りは、特徴的なプロファイルを持ち、前記R1鎖は、鎖の大部分で高いシーケンスカバレッジを示す一方で、逆鎖からのカバレッジは低く及び減衰が早い。図6A~6Lは、特徴的なM値のバイアスが、正常サンプルと比較した癌サンプル、並びに組織生検と比較したブラシスワブ生検において一貫していることを示す、代表的なM-バイアスのカバレッジプロットである。各サンプル(サンプル1、サンプル2、及びサンプル3)に対する4つのパネル(図6A~6D、図6E~6H、及び図6I~6L)のセットは、本質的に同一である。これらのデータは、DNAの供給源及びサンプルの病理学的状態が、M値の偏り、及び推定により収集されたDNAメチル化データの質に影響しないことを証明する。
【0060】
癌患者におけるEWAS研究は、エピゲノムにおける個人間の変動性を同定しており、及び手頃な価格のEWASテクノロジーの最近の利用の可能度は、臨床転帰の予測をし得る異なるメチル化特徴を同定することを目的としたエピジェネティックバイオマーカー研究の急速な増加につながっている。最も一般的に使用されているプラットフォームは、Illumina Human 450K及びInfinium MethylationEPICアレイのようなアレイベースであり、エピゲノム中のCpGサイトの限定的なカバレッジを与える。全ゲノムバイサルファイトシーケンス(WGBS)は、エピゲノムプロファイリングのための最も包括的な方法であり、2800万のCpGを捕捉する。しかしながら、前記コスト、集中的なワークフロー、並びに高品質及び大量のDNAインプットの必要性は、特に癌治療における、その臨床的なトランスレータビリティ(clinical translatability)を著しく制限する。MC-Seqは、アレイ及びWGBSの間の有望な手段として浮上しており、NGSを使用して、アレイベースのプラットフォームよりも著しく多くのCpGを捕捉する一方、WGBSよりもハイスループット及び手頃な価格であるという利点を有する。本明細書で示すように、MC-Seqは、EPICアレイのようなアレイベースのプラットフォームよりも信頼性が高く、及び効率的なエピゲノムプロファイリングのためのプラットフォームである。前記EPICアレイ及びMC-Seqを、末梢血単核細胞サンプルで比較したところ、MC-Seqは、EPICアレイよりもコーディング領域及びCpGアイランドにおいて著しく多くのCpGを捕捉した。前記EPICアレイは、サンプルにつき846,464個のCpGサイトを捕捉したのに対して、MC-Seqは、サンプルにつき3,708,550個のCpGサイトを捕捉した。両方のプラットフォームに捕捉された472,540個のCpGサイトのうち、メチル化状態に高い相関性(r=0.98-0.99)があった。さらに、前記EPICアレイは、発癌における既知の役割を持つ遺伝子に富んでいるが、MC-Seqは、より不可知論的な方法(agnostic manner)でメチル化を定量し、及び前記EPICアレイよりも3~4倍多くのCpGをプロファイルし、癌における新規エピジェネティック修飾を発見できる可能性がより高くなる。さらに、各遺伝子内の前記カバレッジ領域は、前記EPICアレイ、及びPCR又はパイロシークエンジングのような他の一般的に使用されるメチル化解析技術よりも包括的であった。本明細書で開示されるのは、MC-Seqに関する方法であり、この技術の全体的なプロファイリング能力がより高いため、機能的な遺伝子領域内のより著しく多いCpGサイトを捕捉した。ハイスループット能力及びカバレッジの深さは、MC-Seqを臨床環境で使用されるCLIA承認見込み(臨床検査室改善修正法)プラットフォームを充当するようにする。
【0061】
これらのメチル化バイオマーカー研究の臨床解釈は、以下の理由:1)OSCCを他の頭頸部癌のサブサイト(すなわち、中咽頭、下咽頭、喉頭)と組み合わせ、OSCCを明確な臨床疾患として認識できない不均一な(heterogeneous)コホートを作り出すこと、並びに2)限られたCpGの数にクエリする、アレイベースのプラットフォームにだけ依存することにより、制限されている。結果として、これらの研究のいずれからも、高い予後予測能を有するメチル化バイオマーカーを生み出していない。臨床病理学的データと組み合わせたメチル化シグネチャーを、使用し、早期(I/II)OSCCの5年以内の死亡率を予測するためのリスクスコアを開発し、前記リスクスコアは、C統計量=0.915である死亡率を正確に予測した。前記REASONスコアは、診断後に5年間生存した早期OSCC患者対死亡した早期OSCC患者の間で上位12個の異なるメチル化遺伝子を利用した。これらの特定の遺伝子のメチル化の差は、OSCCの転帰と相関していた。
【0062】
他の頭頸部からの明確な臨床的サブサイトであることに加えて、口腔は、非侵襲的な生検技術が容易に利用できる解剖学的部位である。バイオマーカーの臨床解釈は、治療中に測定できることを必要とする。ホルマリン固定パラフィン包理(FFPE)組織を腫瘍除去後まで待つことは、必要な治療が遅れる可能性がある。唾液及びブラシスワブの両方を使用し、診断時にOSCC細胞を非侵襲的にサンプリングする。唾液を、生物学的サンプルとして使用し、OSCCのメチル化バイオマーカーを同定した。しかしながら、唾液及び癌組織の間のメチル化の一致は、非常に変化しやすい。
【0063】
本明細書に開示される実施態様は、ブラシスワブ及びMC-Seqを使用するOSCCの評価方法を含み、診断時のメチル化シグネチャーを決定する。一致した部位からのブラシスワブ生検及び組織生検は、高度に相関したメチル化シグネチャーを有していた。ブラシスワブサンプルの前記DNAの質及び量は、MC-Seqを実施するのに十分であった。マッピング効率は、組織及びブラシスワブの間で同等であった。ペアになった組織及びブラシスワブの間に高い相関があり、及び十分なDNAを得られたことを考慮すると、ブラシスワブは、組織生検の臨床的に強固な代替となる。MC-Seqは、CpGサイトのより広いカバレッジを提供し、及びサンプルベースの相関が、2つのプラットフォーム間で高かった(r=0.98)。従って、ブラシスワブの採取は、リスク層別化のためのメチル化シグネチャーを決定するための非侵襲的な方法である。
【0064】
口腔癌の生存率は、過去40年間改善されていない。実際、世界的にOSCCの発生率は、増加傾向にある。世界中の22の癌登録の疫学研究では、舌癌の発生率は、喫煙又は飲酒の従来の危険因子を持たない45歳未満の若い女性で急増している。OSCCは、ヒトパピロマーウイルス(HPV)によるものではなく、新たに診断された症例の大部分が、HPV陽性と関連している中咽頭SCCとは異なる。HPV陽性の中咽頭SCCは、HPV陰性の疾患よりも生存率が顕著に良好であり、放射線癌療法グループ(RTOG)0129試験のレトロスペクティブ解析では、3年の全生存率が82.4%であったのに対し、HPV陰性群では57.1%に過ぎなかった。HPV陽性の中咽頭SCCの全生存率は、この特定の疾患のサブセットを対象とした臨床試験で90%まで上昇した。同様に、プログラム細胞死タンパク質1(PD-1)阻害薬であるニボルマブ、及びプログラム細胞死(PD-L1)阻害薬であるペムブロリズマブのFDA承認の後、頭頸部SCCにおける第4の治療法としての免疫療法の導入は、特にHPV陽性の中咽頭SCCにおいて、標準的な化学療法及び放射線療法からの治療を“徐々に緩和する(de-escalate)”ための第1の手段として免疫療法を使用する多数の臨床試験を明らかにした。不運にも、免疫療法は、腫瘍微小環境に免疫細胞が豊富に存在し、免疫原性の高い頭頸部癌の12~20%にしか効果がないが、OSCCは、免疫原性が低く、及びその結果、治療が困難である。これらの理由のため、OSCC患者は、頭頸部癌の治療における最近の進歩にも関わらず、低い生存率が続いている。特定の実施態様において、前記REASONスコアは、患者に対する適切な治療を決定する際に、現在の臨床ガイドラインの補助的な尺度として使用される。前記REASONスコアのカットオフは、生存曲線に基づいて決定される。
【0065】
乳癌におけるバイオマーカー研究を反映して、頭頸部癌の研究者は、OSCC患者に対して治療をより適切に調整するための多重遺伝子リスクスコアを開発しよう試みている。これまでの研究は、異なる遺伝子発現、遺伝子の増幅及び欠損、メチル化、並びにマイクロRNA(miRNA)を潜在的なバイオマーカーとして用いてきた。本明細書における実施態様とは対照的に、治療の段階的な拡大から恩恵を受ける高リスク患者を同定し、研究の大部分は、頸部転移のリスクを予測するバイオマーカー開発することにより過剰治療を防ぐことに主として焦点を合わしている。現在、早期OSCC患者の大部分(最大80%)は、頸部転移をしていない。しかしながら、これらの患者の20%以上は、潜在的な(すなわち、臨床検査及び臨床画像で検出できない)頸部転移がある。計算論的モデル研究、レトロスペクティブ研究、及び予防的頸部リンパ節切除を受けた早期OSCC患者と経過観察で管理された患者とを比較した1つの大規模なプロスペクティブ臨床試験を含む、幾多の刊行物はすべて、不顕性転移の20%以上のリスクは、予防的頸部リンパ節切除がない場合の低い生存率の前兆となることを示している。結果として、たとえ予防的頸部リンパ節切除が、肩機能障害、神経損傷及びリンパ浮腫を含む合併症(concomitant morbidity)を伴う患者の最大80%に対して過剰治療を伴うとしても、早期OSCC患者にとって予防的頸部リンパ節切除を受けることが現在の治療の標準となっている。この臨床実践は、患者をリスク層別化する、より微妙なアプローチを開発する必要がある。しかしながら、現在まで、臨床で使用できるほど高い精度で頸部転移のリスクを予測する分子シグネチャーは存在しない。早期OSCCの低い生存率を予測するバイオマーカーが必要である。
【0066】
頸部郭清術を徐々に緩和するためのバイオマーカーに焦点を当てるのではなく、本明細書に開示された方法は、早期OSCC患者における低い生存率のバイオマーカーを開発することに向けられており、治療の段階的な拡大から恩恵を受け得る高リスク患者を同定することを意図している。本研究で開発された前記REASONスコアは、早期OSCC患者の5年後までの死亡リスクを0.915のc-indexで予測する。前記リスクスコアは、非常に変わりやすい疾患において意味のあるバイオマーカーを発見する可能性を最大化するために、特に口腔のサブサイトに焦点を当て、大規模な内部コホートと一般に公開されているTCGAデータの両方を活用して開発された。内部コホート及び一般に公開されているコホートを利用して、12個の遺伝子のメチル化シグネチャーを持つ顕著な臨床病理学的因子を導き出し、5年以内に死亡するリスクの高い早期(I/II)OSCC患者の特定において高い予後予測能を有する複合分子/非分子のREASONスコアを作成する。
【0067】
技術革新の特定の実施態様が、半明細書に開示され、及び説明されてきたが、そのような実施態様が例示としてのみ提供されることは、当業者にとって明らかだろう。前述の実施態様は、例示的な実施例である。多数の変形、変更、及び代替が生じ、並びに本技術革新の要旨及び範囲から外れることなく、当業者に利用可能であろう。本明細書に記載された実施態様に対する様々な代替が、本技術革新の1つ以上の態様を実施する際に採用され得ることを理解されたい。
図1
図2
図3A-B】
図4A
図4B
図4C
図4D
図5A
図5B
図5C
図6A-D】
図6E-H】
図6I-L】
図7
【国際調査報告】