IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ シーフ,モシェの特許一覧 ▶ ペキン ヨウアン ホスピタル,キャピタル メディカル ユニヴァーシティーの特許一覧

特許7008696宿主の末梢血単核細胞およびT細胞におけるがんのDNAメチル化シグネチャー
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-01-13
(45)【発行日】2022-02-10
(54)【発明の名称】宿主の末梢血単核細胞およびT細胞におけるがんのDNAメチル化シグネチャー
(51)【国際特許分類】
   C12Q 1/6886 20180101AFI20220203BHJP
   C12N 15/117 20100101ALN20220203BHJP
【FI】
C12Q1/6886 Z ZNA
C12N15/117 Z
【請求項の数】 9
(21)【出願番号】P 2019520181
(86)(22)【出願日】2016-06-23
(65)【公表番号】
(43)【公表日】2019-07-04
(86)【国際出願番号】 CN2016086845
(87)【国際公開番号】W WO2017219312
(87)【国際公開日】2017-12-28
【審査請求日】2019-02-20
(73)【特許権者】
【識別番号】518455099
【氏名又は名称】シーフ,モシェ
【氏名又は名称原語表記】SZYF, Moshe
(73)【特許権者】
【識別番号】518455103
【氏名又は名称】ペキン ヨウアン ホスピタル,キャピタル メディカル ユニヴァーシティー
【氏名又は名称原語表記】BEIJING YOUAN HOSPITAL, CAPITAL MEDICAL UNIVERSITY
(74)【代理人】
【識別番号】100099623
【弁理士】
【氏名又は名称】奥山 尚一
(74)【代理人】
【識別番号】100129425
【弁理士】
【氏名又は名称】小川 護晃
(74)【代理人】
【識別番号】100087505
【弁理士】
【氏名又は名称】西山 春之
(74)【代理人】
【識別番号】100168642
【弁理士】
【氏名又は名称】関谷 充司
(74)【代理人】
【識別番号】100107319
【弁理士】
【氏名又は名称】松島 鉄男
(74)【代理人】
【識別番号】100096769
【弁理士】
【氏名又は名称】有原 幸一
(72)【発明者】
【氏名】シーフ,モシェ
(72)【発明者】
【氏名】リー,ニン
(72)【発明者】
【氏名】チャン,ヨンホン
(72)【発明者】
【氏名】ペトロポーラス,ソフィー
【審査官】田村 直寛
(56)【参考文献】
【文献】Molecular Carcinogenesis,2017年,vol. 56,pp. 425-435
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/6886
C12N 15/117
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
グループ1:
【表1A】
【表1B】
に示されるCG-IDを有するバイオマーカーのDNAメチル化測定値を検出するための試薬を含むキットであって、
前記試薬が前記バイオマーカーに相補的なプローブを含み、前記バイオマーカーがゲノムワイドなDNAメチル化マッピング法を使用して得られ、
前記グループ1のバイオマーカーが、末梢血単核細胞(PBMC)のDNA由来のCG-IDである、キット。
【請求項2】
前記ゲノムワイドなDNAメチル化マッピング法が、Illumina 450Kまたは850Kアレイ、ゲノムワイドなバイサルファイトシークエンシング、メチル化DNA免疫沈降(MeDIP)シークエンシング、またはオリゴヌクレオチドアレイでのハイブリダイゼーションである、請求項1に記載のキット。
【請求項3】
前記前記グループ1のCG-IDが、HCCステージおよび慢性肝炎を予測するために、以下のサブグループ:
HCCステージ1を対照と分別するための標的CG-ID:cg14983135、cg10203922、cg05941376、cg14762436、cg12019814、cg14426660、cg18882449、cg02914652、
HCCステージ2を対照と分別するための標的CG-ID:cg05941376、cg15188939、cg12344600、cg03496780、cg12019814、
HCCステージ3を対照と分別するための標的CG-ID:cg05941376、cg02782634、cg27284331、cg12019814、cg23981150、
HCCステージ4を対照と分別するための標的CG-ID:cg02782634、cg05941376、cg10203922、cg12019814、cg14914552、cg21164050、cg23981150、
HCCステージ1をB型肝炎と分別するための標的CG-ID:cg05941376、cg10203922、cg11767757、cg04398282、cg11151251、cg24742520、cg14711743、
HCCステージ1をステージ2~4と分別するための標的CG-ID:cg03252499、cg03481488、cg04398282、cg10203922、cg11783497、cg13710613、cg14762436、cg23486701、
HCCステージ2をステージ3~4と分別するための標的CG-ID:cg02914652、cg03252499、cg11783497、cg11911769、cg12019814、cg14711743、cg15607708、cg20956548、cg22876402、cg24958366、および/または
HCCステージ1~3をステージ4と分別するための標的CG-ID:cg02782634、cg11151251、cg24958366、cg06874640、cg27284331、cg16476382、cg14711743
にさらに分類される、請求項1または2に記載のキット。
【請求項4】
AHNAK(CG ID:cg14171514)のDNAメチル化測定値を検出するためのプライマー:
外側フォワード GGATGTGTCGAGTAGTAGGGT、外側リバース CCTATCATCTCCACACTAACGCT、ネステッドフォワード TGTTAGGGGTGATTTTTAGAGG、ネステッドリバース ATTAACCCCATTTCCATCCTAACTATCTT、およびシークエンシングプライマー TTTTAGAGGAGTTTTTTTTTTTTA
をさらに含む請求項1に記載のキット。
【請求項5】
SLFN2L(CG ID:cg00974761)のDNAメチル化測定値を検出するためのプライマー:
外側フォワード GTGATYTTGGTYAYTGTAAYYT、外側リバース TCTCATCTTTCCATARACATTTATTTAR、フォワードネステッド AGGGTTTYAYTATATTAGYYAGGTTGG、リバースネステッド ATRCAAACCATRCARCCCTTTTRC、シークエンシングプライマー YYYAAAATAYTGAGATTATAGGTGT
をさらに含む請求項1に記載のキット。
【請求項6】
AKAP7(CG ID:cg12700074)のDNAメチル化測定値を検出するためのプライマー:
外側フォワード TAGGAGAAAGGGTTTATTGTGGT、外側リバース ACACACCCTACCTTTTTCACTCCA、ネステッドフォワード GGTATTGATTTATGGTTAGGGATTTATAG、ネステッドリバース AAACAAAAAAAACTCCACCTCCAATCC、シークエンシングプライマー GGGATTTATAGTTTTGTGAGA
をさらに含む請求項1に記載のキット。
【請求項7】
HCCを予測するための、請求項1~6のいずれか1項に記載のキットの使用であって、DNAピロシークエンシングメチル化アッセイがDNAメチル化測定値を得るために使用される、使用(ただし、医師が判断するステップを除く)。
【請求項8】
HCCを予測するための、請求項7に記載の使用であって、試料から得られたDNAメチル化測定値における統計解析を行うために受診者動作特性(ROC)アッセイが使用される、使用(ただし、医師が判断するステップを除く)。
【請求項9】
前記統計解析がピアソン相関を含む、請求項8に記載の使用。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、ヒトDNAにおけるDNAメチル化シグネチャー、詳細には、分子診断の分野に関する。
【背景技術】
【0002】
肝細胞癌(HCC)は、世界中で5番目に一般的ながんである(1)。これは特にアジアで流行しており、その発症は、B型肝炎が流行している地域で最も多いことから、可能性がある因果関係が示唆される(2)。慢性肝炎患者のような高リスク集団の追跡、および慢性肝炎からHCCへの移行の早期診断は、治癒率を向上させるはずである。現在、肝細胞癌はほぼ常に後期ステージで診断されるため、その生存率はきわめて低い。肝臓がんは、早期に診断されれば、>80%の治癒率で効果的に治療することができる。イメージングにおける進歩は、HCCの非侵襲性の検出を向上させてきた(3、4)。しかし、アルファ-フェトプロテインなどの単一のタンパク質を用いたイメージングおよびイムノアッセイを含む、現在の診断法は、早期にHCCを診断できないことが多い(2)。これらの課題は、HCCに限定されないが、他のがんにも共通している。がんの分子診断は、血漿中の、腫瘍および腫瘍DNAを含む、腫瘍由来のバイオマテリアル(5、6)、循環腫瘍細胞(7)、ならびに腫瘍-宿主の微小環境(8、9)に焦点が定められている。一般的にかつ広く受け入れられている仮説は、がんの開始および進行を引き起こす分子的変化が主に腫瘍自体の中で生じることならびに宿主における関連した変化が主に腫瘍微小環境中で生じることである。したがって、腫瘍微小環境中の免疫細胞の同一性は、顕著な注目を引きつけている(10、11)。
【0003】
ゲノム機能のエピジェネティックな制御の主な機序である、DNAメチル化、DNAの共有結合的修飾は、HCC(16)を含む腫瘍(12~15)において広範に変化する。腫瘍のDNAメチル化プロファイルは、腫瘍進行の異なるステージを区別し、腫瘍の分類、予後および化学療法に対する反応の予測のための潜在的に強力なツールである(17)。早期診断において腫瘍DNAメチル化を使用することについての主な欠点は、それが、侵襲性の処置および疑われる腫瘍の解剖学的可視化を必要とすることである。循環腫瘍細胞は、腫瘍DNAの非侵襲性の源であり、腫瘍抑制遺伝子におけるDNAメチル化の測定に使用される(18)。HCCのDNAの低メチル化は、患者の血液において検出可能であり(19)、ゲノムワイドなバイサルファイトシークエンシングは、最近、HCC患者からの血漿中の低メチル化DNAの検出に適用された(20)。しかし、この源は、特に、がんの早期のステージに限定され、DNAメチル化プロファイルは、宿主のDNAメチル化プロファイルによって混同される。
【0004】
宿主の免疫監視が、腫瘍発生において腫瘍細胞を排除することおよび腫瘍増殖を抑制することによって重要な役割を果たしているという考えは、Paul Ehrlich(21、22)によって1世紀以上前に提唱されており、その後支持されなくなっていた。しかし、動物およびヒトの両方の臨床試験からの蓄積しているデータは、宿主免疫系が、排除、平衡および逃避の3つのステージを含む「免疫編集」を通じて腫瘍発生において重要な役割を果たしていることを示唆する(23~25)。腫瘍浸潤性細胞傷害性CD8+T細胞の存在は、ヒトの退行性黒色腫(26~31)、食道がん(32)、卵巣がん(33、34)、および大腸がん(35~37)のいくつかの臨床試験においてより良好な予後に関連した。免疫系は、臨床症状の非存在下で循環がん細胞が検出可能であるときのがん休眠の現象の原因であると考えられている(15、38)。興味深いことに、腫瘍のDNAメチル化およびトランスクリプトームの最近の解析は、浸潤性リンパ球の腫瘍ステージ特異的免疫シグネチャーを明らかにした(39、40)。しかし、これらのシグネチャーは、腫瘍微小環境中の標的化された免疫細胞を表し、早期診断のためのこうしたシグネチャーの利用は、侵襲性の処置を必要とする。腫瘍浸潤性免疫細胞は、末梢血液細胞のマイナーな画分のみを表す(41~44)。全体的なDNAメチル化変化は、白血球において以前に報告されており、EWAS調査は、膀胱、頭頸部、および卵巣のがんからの白血球におけるDNAメチル化における差異を明らかにし、これらの差異は、白血球分布における差異とは独立していた(45)。これらの調査は、腫瘍内のDNAメチル化における変化についての代替マーカーとして役立ちうるがん遺伝子において基礎となっているDNAメチル化変化を同定することを主に目的としていた。しかし、宿主の末梢免疫系が、がん進行と相関するがん段階に対して異なるDNAメチル化反応を示すかどうかの疑問は、対処されていなかった。
【発明の概要】
【0005】
本発明者らは、がん進行が、宿主の末梢免疫細胞における異なるDNAメチル化プロファイルと関連していることを見出している。本発明は、これらのDNAメチル化マーカーが、がんと基礎となっている慢性炎症性肝臓疾患とを区別することも示す。
【0006】
本発明は、中国の北京地域からの69人の個体の発見対象集団(10名の対照ならびにB型肝炎、C型肝炎、HCCのためのEASL-EORTC臨床診療ガイドラインを使用してステージ分類された、HCCのステージ1~3の群のそれぞれについての10名の患者およびステージ4についての9名の患者)におけるこれらのDNAメチル化プロファイルを例示する(表1)。本発明は、関与しうる遺伝子の種類における予想されたバイアスなしでDNAメチル化プロファイルを詳細に描写するために全ゲノムアプローチ(Illumina 450kアレイ)を使用した。本発明は、HCCと異なるB型およびC型肝炎の特異的DNAメチル化プロファイルならびに末梢血単核細胞におけるHCCの異なるステージのそれぞれについてのDNAメチル化プロファイルを初めて実証する。これらのプロファイルは、以前に記載されているHCC腫瘍のDNAメチル化プロファイル(16)との顕著な重複を示さず、これらが、末梢血単核細胞ゲノム機能における変化を反映することおよび腫瘍DNAメチル化における変化の代替でないことが示唆される。したがって、本発明は、がんにおける宿主免疫系におけるDNAメチル化変化を明らかにする。本発明は、がんを患う人における宿主T細胞におけるDNAメチル化シグネチャーも明らかにする。本発明は、PBMCおよびT細胞において詳細に描写されたDNAメチル化プロファイルの間に顕著な重複があることも示す。本発明は、患者(n=79)の別々のコホートにおけるT細胞DNAのピロシークエンシングによって発見コホートにおけるHCC患者からのT細胞において差異的にメチル化された4つの遺伝子を検証する。
【0007】
本発明は、これらのDNAメチル化シグネチャーに基づいた統計モデルを使用して、未知試料のがんおよびがんのステージを予測する際の本発明の有用性を実証する。本発明は、疾患およびその治療の機序の理解のために重要な意味を有し、末梢血単核細胞DNAにおけるがんの非侵襲性の診断を提供する。本発明は、当業者が利用可能であるゲノムワイドなメチル化マッピングのためのあらゆる方法、例えば、ゲノムワイドなバイサルファイトシークエンシング、キャプチャーシークエンシング、メチル化DNA免疫沈降(MeDIP)シークエンシングなど、および利用可能になるゲノムワイドなメチル化マッピングの他のあらゆる方法を使用して、あらゆるがんの免疫系におけるDNAメチル化シグネチャーを得るためにいかなる当業者によっても使用されうる。
【0008】
本発明の好ましい実施形態は、以下の通りである。
【0009】
第1の態様では、本発明は、がんを予測するための、末梢血単核細胞(PBMC)におけるがんのDNAメチル化シグネチャーを提供し、前記DNAメチル化シグネチャーは、ゲノムワイドなDNAメチル化マッピング法、例えば、Illumina 450Kまたは850Kアレイ、ゲノムワイドなバイサルファイトシークエンシング、メチル化DNA免疫沈降(MeDIP)シークエンシングまたはオリゴヌクレオチドアレイでのハイブリダイゼーションなどを使用して得られる。
【0010】
一実施形態では、DNAメチル化シグネチャーは、以下にリストされるPBMCのDNA由来のCG-IDであり、前記CG-IDのPBMCまたはT細胞のDNAメチル化レベルのいずれかを使用して肝細胞癌(HCC)ステージおよび慢性肝炎を予測するためのものである。
【0011】
【表1A】
【表1B】
【0012】
一実施形態では、DNAメチル化シグネチャーは、以下にリストされるT細胞由来のCG-IDであり、前記CG-IDのPBMCまたはT細胞のDNAメチル化レベルを使用してHCCステージおよび慢性肝炎を予測するためのものである。
【0013】
【表2A】
【表2B】
【0014】
一実施形態では、DNAメチル化シグネチャーは、以下にリストされるCG-IDであり、罰則付き回帰解析またはクラスタリング解析などの統計モデルを使用することによって得られた、T細胞またはPBMCにおける前記CG-IDのDNAメチル化測定値を使用してHCCの異なるステージを予測するためのものである。
HCCステージ1を対照と分別するための標的CG-ID:cg14983135、cg10203922、cg05941376、cg14762436、cg12019814、cg14426660、cg18882449、cg02914652;
HCCステージ2を対照と分別するための標的CG-ID:cg05941376、cg15188939、cg12344600、cg03496780、cg12019814;
HCCステージ3を対照と分別するための標的CG-ID:cg05941376、cg02782634、cg27284331、cg12019814、cg23981150;
HCCステージ4を対照と分別するための標的CG-ID:cg02782634、cg05941376、cg10203922、cg12019814、cg14914552、cg21164050、cg23981150;
HCCステージ1をB型肝炎と分別するための標的CG-ID:cg05941376、cg10203922、cg11767757、cg04398282、cg11151251、cg24742520、cg14711743;
HCCステージ1をステージ2~4と分別するための標的CG-ID:cg03252499、cg03481488、cg04398282、cg10203922、cg11783497、cg13710613、cg14762436、cg23486701;
HCCステージ2をステージ3~4と分別するための標的CG-ID:cg02914652、cg03252499、cg11783497、cg11911769、cg12019814、cg14711743、cg15607708、cg20956548、cg22876402、cg24958366;
HCCステージ1~3をステージ4と分別するための標的CG-ID:cg02782634、cg11151251、cg24958366、cg06874640、cg27284331、cg16476382、cg14711743。
【0015】
一実施形態では、DNAメチル化シグネチャーは、以下にリストされるCG-ID
【表3】
であり、罰則付き回帰解析またはクラスタリング解析などの統計モデルを使用することによって得られた、T細胞またはPBMCにおける前記CG-IDのDNAメチル化測定値を使用してHCCのステージを予測するためのものである。
【0016】
第2の態様では、本発明は、DNAメチル化シグネチャーのDNAメチル化測定値を検出するための手段および試薬を含む、がんを予測するためのキットを提供する。
【0017】
一実施形態では、本発明は、実施形態中の表3のCG-IDのDNAメチル化測定値を検出するための手段および試薬を含む、肝細胞癌(HCC)ステージおよび慢性肝炎を予測するためのキットを提供する。
【0018】
一実施形態では、本発明は、実施形態中の表6のCG-IDのDNAメチル化測定値を検出するための手段および試薬を含む、HCCステージおよび慢性肝炎を予測するためのキットを提供する。
【0019】
一実施形態では、本発明は、実施形態中の表4のCG-IDのDNAメチル化測定値を検出するための手段および試薬を含む、HCCの異なるステージを予測するためのキットを提供する。
【0020】
一実施形態では、本発明は、実施形態中の表5のCG-IDのDNAメチル化測定値を検出するための手段および試薬を含む、HCCのステージを予測するためのキットを提供する。
【0021】
第3の態様では、本発明は、末梢免疫系におけるがんにおいてエピジェネティックに制御される遺伝子経路を提供する。
【0022】
第4の態様では、本発明は、本発明に開示されるCG-IDの使用を提供する。
【0023】
一実施形態では、本発明は、上記にリストされるCG-IDを使用することによって、例えば、以下に開示されるプライマー:
AHNAKのためのプライマー(外側フォワード GGATGTGTCGAGTAGTAGGGT、外側リバース CCTATCATCTCCACACTAACGCT、ネステッドフォワード TGTTAGGGGTGATTTTTAGAGG、ネステッドリバース ATTAACCCCATTTCCATCCTAACTATCTT、およびシークエンシングプライマー TTTTAGAGGAGTTTTTTTTTTTTA);
SLFN2Lのためのプライマー(外側フォワード GTGATYTTGGTYAYTGTAAYYT、外側リバース TCTCATCTTTCCATARACATTTATTTAR、フォワードネステッド AGGGTTTYAYTATATTAGYYAGGTTGG、リバースネステッド ATRCAAACCATRCARCCCTTTTRC、シークエンシングプライマー YYYAAAATAYTGAGATTATAGGTGT);
AKAP7のためのプライマー(外側フォワード TAGGAGAAAGGGTTTATTGTGGT、外側リバース ACACACCCTACCTTTTTCACTCCA、ネステッドフォワード GGTATTGATTTATGGTTAGGGATTTATAG、ネステッドリバース AAACAAAAAAAACTCCACCTCCAATCC、シークエンシングプライマー GGGATTTATAGTTTTGTGAGA);および
STAP1のためのプライマー(外側フォワード AGTYATGTYTTYTGYAAATAAAAATGGAYAYY、外側リバース、TTRCTTTTTAACCACCAACACTACC ネステッドフォワード YYGTTTYTTTYATYTTYTGGTGATGTTAA、ネステッドリバース ARARRRCAATCTCTRRRTAATCCACATRTR、シークエンシングプライマー GGTGATGTTAATYTTYTGTTTA)
を使用することによってHCCを予測するための、DNAピロシークエンシングメチル化アッセイの使用を提供する。
【0024】
一実施形態では、本発明は、上記にリストされるCG-ID、例えば、STAP1(cg04398282)を使用することによってHCCを予測するための、受診者動作特性(ROC)アッセイの使用を提供する。
【0025】
一実施形態では、本発明は、上記にリストされるCG-IDを使用することによってHCCを予測するための、階層的クラスタリング解析の使用を提供する。
【0026】
第5の態様では、本発明は、試料から得られたDNAメチル化測定値における統計解析を行うステップを含む、疾患を予測するためのDNAメチル化シグネチャーを同定するための方法を提供する。
【0027】
一実施形態では、該方法は、試料から得られたDNAメチル化測定値における統計解析を行うステップを含み、前記DNAメチル化測定値は、試料から抽出されたDNAのIlluminaビーズチップ450Kまたは850Kアッセイを行うことによって得られる。
【0028】
一実施形態では、前記DNAメチル化測定値は、試料から抽出されたDNAの、DNAピロシークエンシング、質量分析に基づく(Epityper(商標))またはPCRに基づくメチル化アッセイを行うことによって得られる。
【0029】
一実施形態では、該方法は、試料から得られたDNAメチル化測定値における統計解析を行うステップを含む;前記統計解析は、ピアソン相関を含む。
【0030】
一実施形態では、前記統計解析は、受診者動作特性(ROC)アッセイを含む。
【0031】
一実施形態では、前記統計解析は、階層的クラスタリング解析アッセイを含む。
【0032】
[定義]
本明細書中で使用される場合、「CG」という用語は、シトシンおよびグアノシン塩基を含む、DNA中のジヌクレオチド配列を指す。これらのジヌクレオチド配列は、ヒトおよび他の動物のDNAにおいてメチル化されるようになりうる。CG-IDは、Illumina 450Kマニフェストによって定義されるようにヒトゲノム内のその位置を明らかにする((本明細書中にリストされるCGのアノテーションは、https://bioconductor.org/packages/release/data/annotation/html/IlluminaHumanMethylation450k.db.htmlにおいて一般公開されており、Triche TおよびJr.に記載のようにR package IlluminaHumanMethylation450k.dbとしてインストールされる。IlluminaHumanMethylation450k.db: Illumina Human Methylation 450kアノテーションデータ。R package バージョン2.0.9.)。
【0033】
本明細書中で使用される場合、「罰則付き回帰」という用語は、例えば、Goeman,J.J.,L1 penalized estimation in the Cox proportional hazards model.Biometrical Journal 52(1),70~84に記載のような「罰則付き」R統計パッケージにおいて実施されるように、バイオマーカーのより大きなリストから結果を予測するために必要とされる最も少ない数の予測因子を同定することを目的とする統計的方法を指す。
【0034】
本明細書中で使用される場合、「クラスタリング」という用語は、(クラスターと呼ばれる)同じ群内の対象が(一部の意味または別の意味において)他の群(クラスター)内の対象よりも互いに類似しているような方法における一組の対象のグループ分けを指す。
【0035】
本明細書中で使用される場合、「階層的クラスタリング」という用語は、例えば、Kaufman,L.;Rousseeuw,P.J.(1990).Finding Groups in Data:An Introduction to Cluster Analysis(第1版).New York:John Wiley.ISBN0-471-87876-6.に記載されているように、クラスターが互いとどのくらい類似しているか(近い)または異なっているか(遠い)どうかに基づき「クラスター」の階層を構築する統計的方法を指す。
【0036】
本明細書中で使用される場合、「遺伝子経路」という用語は、生理学的な経路または過程において互いに相互作用することが知られているタンパク質をコードする一群の遺伝子を指す。これらの経路は、Ingenuity Pathway Analysis:http://www.ingenuity.com/products/ipaのようなバイオコンピューター使用の方法を使用して特徴付けされる。
【0037】
本明細書中で使用される場合、「受診者動作特性(ROC)アッセイ」という用語は、予測因子の性能を図示するグラフィカルプロットを作成する統計的方法を指す。予測の真陽性率は、例えば、Hanley,James A.;McNeil,Barbara J.(1982).「The Meaning and Use of the Area under a Receiver Operating Characteristic(ROC)Curve」.Radiology 143(1):29~36に記載されているように、予測因子についての多様な閾値設定(すなわち、異なる%のメチル化)において偽陽性率に対してプロットされる。
【0038】
本明細書中で使用される場合、「多変量線形回帰」という用語は、メチル化の百分率、年齢、性別などのような複数の「独立変数」または「予測因子」と、がんまたはがんのステージのような「結果」または「従属変数」との間の関係を評価する統計的方法を指す。この方法は、いくつかの「独立変数」がこのモデルに含まれるときに、「結果」(従属変数)の予測におけるそれぞれの「予測因子」(独立変数)の統計的有意性を決定する。
【図面の簡単な説明】
【0039】
図1】末梢血単核細胞におけるがん特異的DNAメチル化シグネチャーのゲノムワイドな分布を示した図である。図1A.健常対照(参照)、慢性B型肝炎(HepB)およびC型肝炎(HepC)、および進行性ステージのHCC(CAN1、CAN2、CAN3、CAN4)からのDNAメチル化における拡大している差異のゲノムワイドビュー(IGVゲノムブラウザ);図1B.上のボックスプロットは、HCCが進行するにつれてメチル化を失う部位のDNAメチル化のベータ値を表す。下のボックスプロットは、HCCの進行中にDNAメチル化を得る部位のDNAメチル化のベータ値を表す。
図2】正常、慢性肝炎および各ステージのHCCの状態にある69名の個人におけるHCC進行のDNAメチル化シグネチャーを示した図である。各カラムは対象を表し、各列はCG部位を表し、メチル化のレベルは灰色のレベルによって示されている。黒色は最も多くメチル化されていることを表し、白色は最も少なくメチル化されていることを表し、灰色は中程度にメチル化されていることを表す。
図3A】HCCのステージ(CAN1、CAN2、CAN3、CAN4)間で差異的にメチル化されているCG部位の数における重複を示した図である。
図3B】HCC進行中(CAN1、CAN2、CAN3、CAN4)に低または高メチル化のいずれかにされるようになるCGの数を示した図である。
図4】ステージ1のHCC(20名の患者)について導かれたDNAメチル化シグネチャーを使用した49名の慢性肝炎およびHCCの患者の予測を示した図である。黒色は最も多くメチル化されていることを表し、白色は最も少なくメチル化されていることを表し、灰色は中程度にメチル化されていることを表す。
図5】ステージ2のHCC(20名の患者)について導かれたDNAメチル化シグネチャーを使用した49名の慢性肝炎およびHCCの患者の予測を示した図である。黒色は最も多くメチル化されていることを表し、白色は最も少なくメチル化されていることを表し、灰色は中程度にメチル化されていることを表す。
図6】ステージ3のHCC(20名の患者)について導かれたDNAメチル化シグネチャーを使用した49名の慢性肝炎およびHCCの患者の予測を示した図である。黒色は最も多くメチル化されていることを表し、白色は最も少なくメチル化されていることを表し、灰色は中程度にメチル化されていることを表す。
図7】ステージ4のHCC(20名の患者)について導かれたDNAメチル化シグネチャーを使用した49名の慢性肝炎およびHCCの患者の予測を示した図である。黒色は最も多くメチル化されていることを表し、白色は最も少なくメチル化されていることを表し、灰色は中程度にメチル化されていることを表す。
図8】350ヵ所のCGのDNAメチル化シグネチャー(表3)を使用した69名の対照、慢性肝炎およびHCCの患者の予測を示した図である。黒色は最も多くメチル化されていることを表し、白色は最も少なくメチル化されていることを表し、灰色は中程度にメチル化されていることを表す。
図9】31ヵ所のCGのDNAメチル化シグネチャー(表5)を使用した69名の対照、慢性肝炎およびHCCの患者の予測を示した図である。黒色は最も多くメチル化されていることを表し、白色は最も少なくメチル化されていることを表し、灰色は中程度にメチル化されていることを表す。
図10A】本発明に記載されている以下の予測的CGのDNAメチル化の測定値を使用してステージHCC2~4をステージ1と区別する予測(0から1の確率)を示した図である。標的CG-ID:cg03252499、cg03481488、cg04398282、cg10203922、cg11783497、cg13710613、cg14762436、cg23486701。
図10B】本発明に記載されている以下の予測的CGのDNAメチル化の測定値を使用してステージHCC3~4をステージ1および2と区別する予測(0から1の確率)を示した図である。標的CG-ID:cg02914652、cg03252499、cg11783497、cg11911769、cg12019814、cg14711743、cg15607708、cg20956548、cg22876402、cg24958366。
図10C】本発明に記載されている予測的CGにおけるDNAメチル化の測定値を使用してステージHCC4をステージ1から3と区別する予測(0から1の確率)を示した図である。標的CG-ID:cg02782634、cg11151251、cg24958366、cg06874640、cg27284331、cg16476382、cg14711743。
図11】健常対照(n=10;TCTRL-1からTCTRL-10)およびHCCステージ(n=10;TCAN1、TCAN2、TCAN3、TCAN4)からのT細胞の間のDNAメチル化プロファイルにおける差異を示した図である。
図12】PBMCのDNAにおける、T細胞由来の370ヵ所のCG(表6)のDNAメチル化の測定値を使用したHCCの予測を示した図である。
図13A】T細胞DNAにおける、PBMCのDNA由来の350ヵ所のCG(表3)のDNAメチル化の測定値を使用したHCCの予測を示した図である。
図13B】異なるステージのHCC(TCAN1~4)からのT細胞DNAおよび異なるステージのHCC(PBMCCAN1、PBMCCAN2、PBMCCAN4)からのPBMCからのDNAにおける差異的にメチル化されたCGの間の重複を示した図である。
図13C】T細胞DNAにおける、PBMCのDNA由来の31ヵ所のCG(表5)のDNAメチル化の測定値を使用したHCCの予測を示した図である。
図14】複製セットからのT細胞DNAにおける、すべての対照試料および早期ステージのHCCの間での4つの遺伝子内のDNAメチル化における差異のピロシークエンシングによる検証を示した図である。
図15】T細胞DNA(Illumina 450Kデータ)を使用して健常対照からHCCを識別するため(図15A)またはPBMCにおいてすべての対照(健常および慢性肝炎)からHCCを識別するため(図15B)のバイオマーカーとしてのSTAP1メチル化の特異度(真陽性の画分)(Y軸)および感度(偽陽性のないこと)(X軸)を測定する受診者動作特性(ROC)を示した図である。
図16】健常対照(図16A)およびすべての対照(図16B)からHCCを識別するためのバイオマーカーとしてのT細胞における(ピロシークエンシングを使用して測定された)STAP1メチル化の特異度(Y軸)および感度(X軸)を測定する受診者動作特性(ROC)を示した図である。
【発明を実施するための形態】
【0040】
[実施形態1.HCCがんステージと相関する、末梢血単核細胞(PBMC)におけるDNAメチル化シグネチャー]
<患者の試料>
HCCステージ分類を、EASL-EORTC臨床診療ガイドライン:肝細胞癌の管理によって診断した。患者を、ステージ0(1)、ステージA(2)、ステージB(3)およびステージC+D(4)を含む、4つの群に分類した。説明を簡単にするために、本発明では、図面および実施形態においてステージ1~4と呼称する。慢性B型肝炎の診断は、慢性B型肝炎用のAASLD診療ガイドラインを使用して確認し、慢性C型肝炎の診断は、C型肝炎の検査、管理および治療用のAASLD推奨基準に従った。厳格な除外判定基準は、T細胞および単球の特性を変化させ得る他のあらゆる既知の炎症性疾患(B型またはC型肝炎を除く細菌またはウイルス感染、糖尿病、喘息、自己免疫疾患、進行中の甲状腺疾患)であった。患者の臨床特性を表1および2に示している。この治験における参加者は、Capital Medical Schoolの規則に従って同意を示した。この治験は、北京にあるCapital Medical School、およびMcGill Universityから倫理的な承認を受けた(IRB治験番号A02-M34-13B)。
【0041】
【表4】
【0042】
【表5】
【0043】
<Illuminaビーズチップ450K解析>
患者から血液をEDTAコーティング付きチューブ内に採取して、標準的なプロトコールを使用して末梢血単核細胞をFicoll-Hypaque密度勾配上での遠心分離によって単離し、単核細胞はより低い密度を有するので研究室の慣例の手順を使用してそれらをFicoll-Hypaque層の最上部に集め、洗浄によって単核細胞を血小板から分離した(46)。市販のヒトDNA抽出キット(Qiagen)を使用して細胞からDNAを抽出して、DNAをバイサルファイト転換させ、製造業者によって推奨される標準的なプロトコールを使用してIlluminaヒトメチル化450kビーズチップハイブリダイゼーションおよびスキャニングを行った。アレイ上のスライドおよび位置に関して試料を無作為化し、McGill Genome Quebecイノベーションセンターによって推奨されるようにIllumina Infinum HD技術ユーザーガイドに従ってすべての試料をハイブリダイズさせ、同時にスキャンしてバッチエフェクトを軽減させた。Illuminaアレイハイブリダイゼーションおよびスキャニングは、製造業者のガイドラインに従ってMcGill Genome Quebecイノベーションセンターによって行われた。R(47)の中のChAMP Bioconductorパッケージを使用してIlluminaアレイを解析した。minfi品質管理および正規化オプションを使用してchamp.load機能においてIDATファイルをインプットとして使用した。生データを、少なくとも1つの試料においてP>0.01の検出値を有するプローブについてフィルター処理した。XまたはY染色体上のプローブをフィルター処理で除外して性別の影響を軽減し、(48)において同定されたようなSNPを有するプローブ、ならびに(48)において同定されたような複数の位置にアラインメントされるプローブをフィルター処理で除外した。正規化されていないデータ上でchamp.svd機能を使用してバッチエフェクトを解析した。最初の6つの主な構成要素からの5つは、群およびバッチ(スライド)に関連した。Infiniumタイプ2プローブ設計によって導入されたバイアスについてデータを調整するためのアレイ内正規化を、champ.norm機能(norm=「BMIQ」)を用いたベータ混合分布正規化(BMIQ)(47)を使用して行った。BMIQ正規化後にchamp.runcombat機能を使用してバッチエフェクトを修正する。
【0044】
本発明の試料における末梢血単核細胞分布についての細胞計数解析を、Housemanアルゴリズム(49)に従ってestimateCellCounts機能および参照としてFlowSorted.Blood.450kデータを使用して行った。バッチ修正された正規化データのベータ値を下流の統計解析のために使用する。
【0045】
HCCステージと450KのCG部位におけるDNAメチル化の定量的分布との間の線形相関をコンピューターで計算するために、正規化されたDNAメチル化値と(対照についての0、B型肝炎およびC型肝炎それぞれについての1および2、ならびにHCCの4つのステージについての3~6のステージコードでの)HCCのステージとの間のピアソン相関は、Rの中のpearson corr機能を使用して行われ、Benjamini Hochbergの方法「fdr」(調整された<0.05のP値(Q))ならびに保存的ボンフェローニ補正(Q<1×10-7)を使用して多重検定のために補正して行われる。Illumina 850Kアレイのような新世代のIlluminaアレイを利用して、同様のアプローチを使用することができる。
【0046】
<部位特異的DNAメチル化レベルの定量的分布とHCCの進行との間の相関>
この解析は、HCCの進行と相関するDNAメチル化の広範なシグネチャー(160,904部位)を明らかにする。本発明のこの解析は、最も強い変化(r>0.8;r<-0.8;デルタベータ>0.2/、デルタベータ>-0.2、p<10-7)を有する3924部位に焦点を定めている。HCC進行中にこれらの部位のDNAメチル化において慢性B型およびC型肝炎ならびに対照に対して相対的に強まっている変化のゲノムワイドなビューを図1Aに示している。HCCの間にメチル化が増加または減少する部位のDNAメチル化レベルのボックスプロットは、HCCの進行に伴うDNAメチル化における変化の進行を確認し、HCCの進行に伴い低メチル化の程度が増加する(図1B)。One minusピアソン相関を使用したクラスタリングは、これらの部位が、HepCおよびHCCの間の境界上にクラスター化された患者CAN1~5を除き、すべての個々のHCC患者を、対照ならびにB型およびC型肝炎の個体から離してクラスター化し、異なる群の個々のメンバーにわたって強い一貫性を示すことを明らかにする(図2)。
【0047】
<がん試料を対照と区別するための、末梢血単核細胞におけるHCCのDNAメチル化シグネチャーの有用性>
これらのDNAメチル化シグネチャーは、したがって、患者試料においてHCCのステージを分類する有用性を有する。図2にあるヒートマップは、HCCの進行と共にDNAメチル化差異における変化が強まることを明らかにする。重要なことに、本発明の解析の組合せにより、DNAメチル化シグネチャーは、HCCの早期診断におけるきわめて重要な課題である、最も早期のステージにある個々のHCC患者をB型およびC型肝炎と区別することが示される。さらに、本発明の解析により、HCC患者からのPBMCにおけるDNAメチル化における変化が、ウイルスによって引き起こされた慢性炎症によって誘発される変化と区別されうることが示される。本発明の明細書に基づき、いかなる当業者も他のがんについての同様のDNAメチル化シグネチャーを得ることができる。
【0048】
[実施形態2.固有でありかつ重複している差異的にメチル化される部位は、異なるHCCステージと関連し、HCCをB型およびC型肝炎と区別する。]
本発明者らは、ChAMPにおいて実施されるようなBioconductorパッケージLimma(50)を独立に使用して、健常対照とHCCステージのそれぞれとの間で差異的にメチル化されるCGを詳細に描写した。各ステージのHCCと健常対照との間で差異的にメチル化されるCG部位(p<1×10-7)の数は、ステージの進行と共に増加する;ステージ1についての14375ヵ所、ステージ2 22018ヵ所、ステージ3、30709ヵ所、およびステージ4についての54580ヵ所。Rの中の超幾何フィッシャーの正確検定を使用して2つの群の間の重複の有意性を決定した。がんのステージ間で有意な重複があり(図3A)、共通のマーカーはすべてのHCCステージにおいて影響を受けることが示唆される(p<1.9e-297)。
【0049】
HCCにおいて高メチル化される部位に対して相対的に低メチル化される部位の画分は、同様にステージ1における26%からステージ4における57%まで増加する(図3B)。HCCの進行に伴う低メチル化部位の数におけるこの増加は、ピアソン相関分析の結果において同様に観察された(図1、2)。各HCCステージについて、HCCステージ1にはp<1×10-7の閾値(ボンフェローニ補正後のゲノムワイドな有意性)および+/-0.3のデルタベータならびにステージ2~4にはp<10-10、+/-0.3のデルタベータ(より後期のステージでは、解析に使用する部位の数を減少させるために、より厳密な閾値を使用する)を使用することによって一組のきわめて強力なCGメチル化マーカーを導き、これらをさらなる解析(ステージ1についての74ヵ所、ステージ2についての14ヵ所、ステージ3についての58ヵ所、およびステージ4についての298ヵ所)のために使用した。各ステージについて独立に導かれたマーカーのリストを組合せることおよびステージ間で重複するCG部位を除外することにより、350ヵ所のCGの重複しない組合せリスト(表3)が導かれる。
【0050】
【表6A】
【表6B】
【0051】
この治験および臨床設定におけるHCC患者は、アルコール、喫煙(52~55)、性別(56)および年齢(57)に関して不均一な群であり、これらの因子のそれぞれが、DNAメチル化に影響を及ぼすことが知られている。さらに、末梢単核細胞は細胞の不均一な混合物であり、細胞分布における個体間での変化も同様にDNAメチル化に影響しうる。本発明は、最初に、Housemanアルゴリズム(49)を使用して各症例についての細胞計数分布を決定した。二元配置ANOVA後のペアワイズ比較、および多重検定のための補正では、群の間で細胞計数における有意差は見出されなかった。多重検定のためのボンフェローニ調整を用いてloop_anova lmFit機能を使用して、補助因子として群、性別および年齢を用いた多因子ANOVAを、HCCとの関連について候補にされたCGについて行った。Rの中のlmFit機能を使用した線形回帰モデルにおいて細胞計数、性別、年齢、およびアルコール乱用が共変量として使用される場合に、これらの関連が残存することになるかどうかを検定するために、HCCに関連することが見出された、候補にされたCG部位において多変量線形回帰を行った。Venny(http://bioinfogp.cnb.csic.es/tools/venny/)を使用して、異なる群における、(対照に対して相対的に)差異的にメチル化される遺伝子リストの比較を行った。One minusピアソン相関を使用して階層的クラスタリングを行い、Broad institute GeneEアプリケーション(http://www.broadinstitute.org/cancer/software/GENE-E/)においてヒートマップを作成した。
【0052】
次いで、群(HCC対非HCC)、性別、アルコール、喫煙、年齢、および細胞計数を共変量として使用して、HCCを他のすべての群と区別する、350ヵ所のCG部位の正規化されたベータ値における多変量線形回帰を行った。すべてのCG部位は、モデル内に他の共変量を含めた後でも、群の共変量についてきわめて有意なままであった。350個の測定値についてのボンフェローニ補正後に、342ヵ所のCG部位は、群(HCC対非HCC)についてきわめて有意なままであった。性別と群、年齢と群とのいずれかの間ならびに性別+年齢とDNAメチル化における群との間に可能な相互作用があるかどうかを決定するために、従属変数としての350部位のベータ値ならびに独立変数としての群(HCC対非HCC)、性別および年齢において多因子ANOVA解析を行う。
【0053】
群は、350ヵ所すべてのCGについて有意なままであったのに対して、ボンフェローニ補正後に、性別または年齢との有意な相互作用は見出されなかった。要約すると、これらのデータは、HCC患者とB型肝炎およびC型肝炎を含む他の非HCC患者との間のPBMCのDNAにおける強いDNAメチル化の差異を示す。
【0054】
[実施形態3.One minusピアソンクラスター分析を使用して患者からの未知試料を予測し、早期ステージのHCCがんを検出し、かつ、それらを慢性肝炎と区別するための、がんステージ特異的DNAメチル化マーカーの有用性。]
HCCステージのそれぞれについての差異的にメチル化される部位は、10名の健常対照および10名のステージ特異的HCCを比較することによって導かれた。他のステージならびにB型およびC型肝炎の試料は、これらの差異的にメチル化されるCGについて「トレーニングされ」ておらず(「トレーニングされる(trained)」は、差異的にメチル化される部位を導くためのモデルによって使用される)、以下の疑問に対処するための「未知」試料の「交差検証」セットとしての役目を果たした:第一に、1つのステージのがん用に導かれたマーカーが、それらのマーカーによって「トレーニングされ」ていないHCC試料を正確にクラスター化することになるか?第二に、HCCを健常対照と区別するように「トレーニングされた」DNAメチル化マーカーが、HCCをB型肝炎およびC型肝炎とも区別することになるか。注目すべき割合のHCC患者が慢性肝炎からHCCに進行するので、HCCを慢性肝炎と区別することは、HCCの早期診断のためにきわめて重要な課題である。
【0055】
HCCの1つのステージのみおよび対照を検査することによって「発見された」一組のCGメチル化マーカーを各個の解析のために使用して、すべてのHCCおよび肝炎試料についてone minusピアソン相関によって階層的クラスタリングを行う。他のすべてのステージは、これらのマーカーに対して「ナイーブ」であって、「交差検証」としての役目を果たした。交差検証とは、それによってこの治験における試料の小さなサブセットが、2つの群(すなわち、「がん」および「対照」)を互いと区別するマーカー(予測因子)のリストを「発見する」ために使用される統計的戦略を指す。これらの「発見した」マーカーを、次いで、この治験における他の「新しい」試料において予測因子として試験する。図4から7に示しているように、特定のステージのHCCについての独立して導かれたマーカーのセットのそれぞれを「交差検証した」;それらは、「新しい」HCCおよび非HCCの症例を含む一群の試料においてHCCを正確に予測した(図4はステージ1マーカーを使用し、図5はステージ2マーカーを使用し、図6はステージ3マーカーを使用し、図7はステージ4マーカーを使用する)。注目すべきことに、HCCの1つのステージのみを健常対照とただ比較することによって発見されたCGマーカーは、HCCおよび慢性肝炎の症例を含んだ別の一組の試料においてHCCを正確に予測した。これは、患者が依然として慢性肝炎を有しているかどうかまたは患者がHCCに移行したかどうかを予測するために利用することができる、慢性肝炎およびがんについての異なるDNAメチル化プロファイルのさらなる証拠を提供する。興味深いことに、同じマーカーは、同様にB型およびC型肝炎の症例を正確に予測した(図4~7)。
【0056】
HCCステージのそれぞれを区別する、独立して導かれたCGマーカー間の重複(図3A)は、ステージ間のすべての可能な重複についてフィッシャーの超幾何検定を使用して有意である(p<1.921718e-297)。10症例のみおよび対照を使用してそれぞれのステージについて独立して導かれたマーカー間のきわめて有意な重複は、これらのマーカーの強力さを強く検証し、早期の検出のために使用することができるHCCの末梢マーカーとしてのこれらの差異的にメチル化されるCGの有用性を例示する。
【0057】
異なるステージのがんにおいて差異的にメチル化されるCG間に大きな重複があるが、その重複は部分的である。本発明は、HCCステージを互いと区別するために(上記(表3)の)350ヵ所のCGのリストを利用できることをここで実証している。これらの350ヵ所のCGを使用した、すべての試料のone minusピアソン相関による階層的クラスタリングは、HCCの症例をステージによって正確にクラスター化したのに対して、B型およびC型肝炎の症例は、健常対照と共にクラスター化された。HCCの異なるステージにおいて健常対照からの差異的にメチル化される部位の間に大きな重複があるが、差異的なメチル化の強度は、HCCの進行と共に増強される。したがって、これらの350ヵ所のCG部位のメチル化のレベルは、HCCのステージを区別するためにも使用することができた。表3のCG-IDのDNAメチル化測定値を検出するための手段および試薬を含む、キットは、肝細胞癌(HCC)ステージおよび慢性肝炎を予測するために使用することができる。DNAメチル化マーカーリストは、健常対照および単一ステージのHCCのみを比較することによって導かれたにもかかわらず、このリストは、他の「新しい」B型およびC型肝炎の症例を非HCCとして正確に予測することができることに留意されたい(図8)。
【0058】
本発明の開示は、HCCの特定のステージを対照および慢性肝炎患者と区別するために使用されうる、HCC患者からのPBMCにおいて差異的にメチル化されているCGを明らかにする。
【0059】
[実施形態4.罰則付き回帰を使用してHCCの早期ステージを後期ステージと区別するステージ特異的CGメチル化マーカー。]
データにより、PBMCのDNAメチル化マーカーは、HCCのステージを区別することが示唆される。本発明は、次いで、HCCのステージを互いと区別するために必要とされる最も少ない数のCG部位のリストを定義した。罰則付き回帰モデルに適合させるための「罰則付き」Rパッケージ(51)を使用して350ヵ所のCG部位の「罰則付き回帰」をステージ試料間で行う。罰則付きRパッケージは、尤度交差検証を使用し、残されたそれぞれの対象において予測を行う。適合したモデルは、ステージ1を対照に対して予測する8ヵ所のCG、ステージ2を対照に対して予測する5ヵ所のCG、ステージ3を対照に対して区別する5ヵ所のCG、ステージ4を対照に対して区別する7ヵ所のCG、およびステージ1をB型肝炎と区別するのに十分である7ヵ所のCGを同定した(表4)。ステージ1とより後期のステージ2~4とを区別する8ヵ所のCG、ステージ1および2をより後期のステージ3~4と区別する10ヵ所のCG、ステージ4をより早期のすべてのステージ(ステージ1~3)と区別する7ヵ所のCGを選択する(表4)。(重複を除外した後の)31ヵ所のステージ分別CGの組み合わせリスト(表5)のPBMCにおけるDNAメチル化測定値は、One minusピアソンクラスタリングを使用してすべてのHCC症例およびそれらのステージを正確に予測した(図9)。表4または5のCG-IDのDNAメチル化測定値を検出するための手段および試薬を含む、キットは、肝細胞癌(HCC)ステージを予測するために使用することができる。
【0060】
【表7】
【0061】
【表8】
【0062】
[実施形態5.未知試料を異なるステージのがんとして100%の特異度および感度で予測するためのCG罰則付き回帰モデルの有用性。]
表4にリストされるCGを使用して特定のステージを区別するために導かれた罰則付きモデルを、次いで、他の「ナイーブな」(マーカーの発見のために使用されなかった新しい試料)HCC症例ならびにB型およびC型肝炎対照において使用して、それぞれの症例がHCCの異なるステージにある可能性を予測した。これらの解析の結果を図10に示している。罰則付きモデルは、すべてのステージ試料を100%の感度および100%の特異度で予測した。
【0063】
[実施形態6.T細胞から抽出されたDNAを使用してHCCと健常対照とを区別するDNAメチル化マーカー。]
多変量解析により、HCCと他の群(対照および慢性肝炎)との間のPBMCのDNAメチル化における差異は、細胞計数における差異が考慮に入れられるときでも残ることが示唆される。さらに、(T細胞サブタイプにおける不均一性が残っているにもかかわらず)特定の細胞型の単離によって細胞組成物の複雑性が一度低減されるとがんと対照との間のDNAメチル化における差異がなくなるかどうかを決定するために、治験に含まれていた39名のHCC患者のうちの10名(表1に対する説明文の中に表示されている、HCCステージのそれぞれからの試料)およびすべての健常対照(n=10)から単離されたT細胞の間のDNAメチル化プロファイルにおける差異を解析して、特定の細胞型の単離によって細胞組成物の複雑性が一度部分的に低減されるとがんと対照との間のDNAメチル化における差異がなくなるかどうかを決定した。
【0064】
抗CD3免疫磁気ビーズ(Dynabed life technologies)を使用してT細胞を単離し、ChAMPパッケージを使用した、HCCと健常対照との間の正規化されたDNAメチル化値における線形(混合効果)回帰により、p<1×10-7の閾値において差異的にメチル化された24863ヵ所の部位を明らかにした。370ヵ所の強力な差異的にメチル化されるCGを、p<1×10-7の閾値およびデルタベータ>0.3、<-0.3において候補にし(表6)、One minusピアソン相関による、健常対照およびHCCのT細胞DNAの階層的クラスタリングを行った(図11)。これらの370ヵ所のCGは、すべての試料をHCCおよび対照の2つの群に正確にクラスター化する。表3のCG-IDのDNAメチル化測定値を検出するための手段および試薬を含む、キットは、肝細胞癌(HCC)ステージおよび慢性肝炎を予測するために使用することができる。
【0065】
【表9A】
【表9B】
【0066】
[実施形態7.「トレーニングされていない」HCCおよび慢性肝炎患者を予測するための、T細胞において発見されたDNAメチル化マーカーの有用性]
HCCおよび健常対照からのT細胞を区別するこれらの370ヵ所のCG部位(表6)を使用して、「トレーニングされていない」異なる慢性肝炎および健常対照のPBMC試料(n=69)をクラスター化することができた。図12に示しているクラスタリング解析は、T細胞DNAにおいて差異的にメチル化される370ヵ所のCG部位が、個々のHCC、肝炎および健常対照のPBMCからのDNAを100%の精度でクラスター化することを示す。したがって、T細胞DNAを使用して発見された差異的にメチル化されたCGを、異なる患者(HCCを有する異なる29名の患者、および慢性肝炎を有する20名の患者)において、PBMCにおけるDNAメチル化測定値を使用して「交差検証した」。
【0067】
[実施形態8.T細胞DNAを使用したHCCがんの予測における、PBMCのDNAの解析から導かれた350ヵ所のCG部位(表3)および31ヵ所のCG部位(表5)の有用性。]
PBMCのDNAの解析によって導かれた350ヵ所のCGは、T細胞健常対照およびHCCの試料を正確にクラスター化した(図13A)。T細胞DNAを使用して健常対照をHCCと区別する有意なCG(フィッシャー、p<1×10-7)と、PBMCのDNAを使用して異なるHCCステージおよび対照を区別するCGとの間にきわめて有意な重複がある(図13B)。
【0068】
本発明は、PBMCのDNAメチル化測定から罰則付き回帰によって導かれた、候補にされた31ヵ所のCG(表5)が、HCC患者および対照からのT細胞DNAメチル化測定値も、One minusピアソン相関を使用して正確にクラスター化およびステージ分類したことも示す(図13C)。これらのデータにより、HCCと他の試料との間のDNAメチル化における差異は、特定の細胞型の単離によって細胞型の複雑性が低減されるときでも残り、HCCおよびそれらの予測値とのこれらのCGの関連についてのさらなる「交差検証」を可能にすることが実証される。
【0069】
[実施形態9.HCCにおけるPBMCにおいて差異的にメチル化された遺伝子は、免疫に関連した正準経路に濃縮されている]
HCCの進行は、メチローム(ゲノムワイドなDNAメチル化プロファイル)における広いフットプリントを有する(図1)。HCC患者からのPBMCおよびT細胞において差異的にメチル化された遺伝子の機能的フットプリントに対する洞察を得るために、差異的なメチル化解析から作製された遺伝子リストに、Ingenuity Pathway Analysis(IPA)を使用して遺伝子セット濃縮解析を行った。本発明者らは、最初に、CGに関連した遺伝子に遺伝子セット濃縮解析を行った。前記CGは、ピアソン相関分析においてHCCのステージとの線形相関を示す(図1)(r>0.8;r<-0.8;デルタベータ>0.2、デルタベータ<-0.2)。注目すべきことに、これらのCGに関連した遺伝子の最上流制御因子は、免疫系の主要な免疫性炎症およびストレス制御因子である、TGFベータ(p<1.09×10-17)、TNF(p<7.32×10-15)、デキサメタゾン(p<7.74×10-12)およびエストラジオール(p<4×10-12)である。同定された上位の疾患は、がん(p値1×10-5から2×10-51)および肝疾患(p<1.24×10-5から1.11×10-25)であった。強いシグナルは、肝過形成(p<6.19×10-1から1.11×10-25)および肝細胞癌(p<5.2×10-1から3.76×10-25)について認められた。差異的にメチル化されている遺伝子の検査は、免疫制御分子の多数の代表、例えば、IL2、IL4、IL5、IL16、IL7、Il10、IL18、Il24、Il1Bおよびインターロイキンレセプター、例えば、IL12RB2、IL1B、IL1R1、IL1R2、IL2RA、IL4R、IL5RAなど;ケモカイン、例えば、CCL1、CCL7、CCL18、CCL24など、ならびにケモカイン受容体、例えば、CCR6、CCR7およびCCR9など;細胞受容体、例えば、CD2、CD6、CD14、CD38、CD44、CD80およびCD83など;TGFベータ3およびTGFベータI、NFKB、STAT1、STAT3ならびにTNFaなどを明らかにする。
【0070】
PBMCおよびT細胞の間の差異的にメチル化された遺伝子の比較IPA解析は、一般的な上流制御因子として、NFKB、TNF、VEGFおよびIL4ならびにNFATを明らかにした。全体として、HCCのPBMCおよびT細胞におけるDNAメチル化変化は、免疫変調機能における強いシグネチャーを示す。HCCおよび非がん性の肝組織の間で差異的にメチル化されたプロモーターは、以前に詳細に描写されている(16、58)。本発明は、HCCにおいてがん生検(1983個のプロモーター)および末梢血単核細胞(545個のプロモーター)において差異的にメチル化されているプロモーター間に重複があったかどうかを決定し、フィッシャーの超幾何検定(p=0.76)によって決定されるように統計的には有意でなかった44個のプロモーターの重複を見出した。これらのデータは、末梢血単核細胞において認められたDNAメチル化における変化がHCCにおける免疫系における変化を反映すること、および、これらの差異的にメチル化されたCGは腫瘍からの循環DNAのフットプリントまたは腫瘍内で生じるDNAメチル化変化の「代替」ではない可能性が最も高いことを示す。これらの経路の有用性は、末梢免疫系におけるがん療法のための新しい標的を提供することによる。
【0071】
[実施形態10.差異的にメチル化されるCGのピロシークエンシングによってHCCおよびがんを予測する]
PyroMark Q24装置を使用してピロシークエンシングを行い、結果をPyroMark(登録商標)Q24 Software(Qiagen)で解析した。すべてのデータは、平均値±平均値の標準誤差(SEM)として表された。Rを使用して統計解析を行った。この解析のために使用したプライマーを表7にリストしている。
【0072】
【表10】
【0073】
本発明は、複製セットには、細胞組成物の問題を減少させるためにT細胞DNAを使用する。複製セットには、79名の人、10名の健常対照、ならびにB型およびC型肝炎ならびに3つのがんステージのそれぞれからの10名の個体、ならびに19名のステージ1の試料が含まれていた(表2)。発見セットにおいてHCCと比較してT細胞において有意に差異的にメチル化されることが見出された以下の遺伝子を調査する:STAP1(cg04398282)(表6にも含まれている)、AKAP7(cg12700074)、SLFNL2(cg00974761)、およびHCCにおいて低メチル化されている含まれる1つのさらなる遺伝子である神経芽細胞分化関連タンパク質(AHNAK)(cg14171514)。すべての対照(健常ならびにB型およびC型肝炎)とHCCステージ1、2(0+A)との間の線形回帰により、多重検定のための補正後の4つすべてのCGについてHCCステージ1、2との有意な関連が明らかにされた(STAP1 p=4.04×10-7;AKAP7 p=0.046;SLFNL2 p=0.012;AHNAK p=0.003436)。すべての対照とすべてのステージのHCCとの間の線形回帰により、多重検定のための補正後のSTAP1(p=6.6×10-6)およびAHNAK(p=0.026)についてHCCとの有意な関連が明らかにされた。
【0074】
ANOVA解析により、検証した4つすべてのCGにおいて対照群(健常対照ならびにB型およびC型肝炎)と早期のHCC(ステージ0+A;1、2)の群との間のメチル化における有意な差異が明らかにされた。すべての対照とすべてのHCCとの間の群の比較により、STAP1(p=1.7×10-6)、AKAP7(p=0.042)、AHNAK(p=0.0062)についてのメチル化における有意な差異が明らかにされたが、SLFNL2についての差異は、傾向はみられたが有意ではなかった(p=0.071)。ANOVAにより、STAP1メチル化における診断についての有意な効果(F=10.017;p=7.49×10-6)が明らかにされた。
【0075】
異なる5つの対照の診断サブグループ(健常対照、慢性B型肝炎および慢性C型肝炎)および早期のHCC(ステージ1および2または0およびA)における多重検定のための補正後のペアワイズ解析により、ステージ1(BCLC 0)のHCCと、健常対照(p=0.00037)、慢性B型肝炎(p=0.00849)またはC型肝炎(p=0.00698)のいずれかとの間ならびにステージ2(BCLC A)と、健常対照(p=0.00018)、B型肝炎(p=0.00670)またはC型肝炎(p=0.00534)のいずれかとの間の有意な差異が明らかにされた。SLFN2Lメチル化(F=3.9376;p=0.00810)、AHNAK(F=3.0219;p=0.02809)およびAKAP7(F=3.4;p=0.01633)に対する診断の効果もあったのに対して、異なる診断サブグループ間でのペアワイズ比較は有意でなかった。
【0076】
これらのデータにより、早期ステージのHCCを予測し、それらを対照と区別するために、これらの4ヵ所のCG部位を使用できることが例示される(図14)。
【0077】
[実施形態11.受診者動作特性(ROC)解析によってHCCを予測するための、発見された差異的にメチル化されるCGのリストの有用性;STAP1の例]
バイオマーカーの診断の値の測定は、「特異度」(偽の発見の割合)の関数として「感度」(真の発見の割合)を測定する受診者動作特性(ROC)である。ROC試験は、最も正確な予測(最も高い割合の「真の発見」および最も少ない数の「偽の発見」)を提供する閾値(すなわち、特定のCGにおけるメチル化の百分率)を決定する(59)(図15)。各試料のDNAメチル化レベルを、閾値のDNAメチル化値と比較し、次いで、対照またはHCCのいずれかとして分類する。本発明は、最初に、健常対照およびHCCからのT細胞についての正規化されたIllumina 450Kベータ値についてのROC特性を決定する(図15A)。STAP1遺伝子cg04398282は、完全なバイオマーカーとしての挙動を示す。0.757の閾値DNAメチル化ベータ値(より高い値を有する試料はいずれもHCCとして、0.757より低い値を有する試料はいずれも対照として分類される)では、HCC試料を名指しする精度は100%であって、AUCは1であり、感度および特異度は100%である。STAP1バイオマーカーは、HCCおよび健常対照からのT細胞DNAメチル化を比較することによって発見された。したがって、本発明者らは、B型肝炎およびC型肝炎患者ならびにT細胞DNAメチル化解析に含まれていなかった29名のさらなるHCC患者を含むPBMCのDNA試料からの正規化されたベータ値を使用してROC特性を調査することによってSTAP1 cg04398282のバイオマーカー特性を交差検証することができた(図15B)。PBMCのDNAを使用してすべてのHCC試料(すべてのステージ)を予測する精度は、0.6729の閾値ベータ値を使用して96%であって、AUCは0.9741379であった(感度0.975および特異度0.973)。T細胞DNAの複製セットにおいてSTAP1のピロシークエンシング値を使用してROC特性を調査する(図16)。ピロシークエンシング部位によって定量化されるようなこのSTAP1のCGメチル化値は、Illumina 450K値よりも全体的に低かった。STAP1 cg04398282についての40.2%のDNAメチル化の閾値において、他のすべての対照(健常ならびにB型およびC型肝炎)からHCCを名指しする精度は、82.2%である。HCCとすべての対照との間の識別のための曲線下面積(AUC)は、0.8(85%の感度および73%の特異度)である(図16A)。STAP1 cg04398282の50.12%のメチル化の閾値において、すべての対照からHCCステージ1を名指しする精度は83.6%であり、AUCは0.89である(84%の感度および83%の特異度)。HCCステージ1を健常対照と区別する精度(図16A)は、47.2の閾値メチル化レベルにおいて93%であり、AUCは0.94である(94%の感度および94%の特異度)(図16B)。要約すると、STAP1により、HCC末梢血単核細胞におけるDNAメチル化バイオマーカーは、肝臓がんの早期診断におけるきわめて重要なハードルである、ステージ1を慢性肝炎および健常対照と識別するために使用できることが例示される。STAP1は、T細胞DNAを使用して同定され、複製セットにおいて検証された(図14)。
【0078】
DNAメチル化を測定するためにここで使用する方法は、例のみを示すものであり、他の許容される方法によるDNAメチル化の測定を排除するものではない。いかなる当業者も、例えば、Illumina 850Kアレイ、質量分析に基づく方法、例えば、Epityper(Seqenom)など、メチル化特異的プライマーを使用するPCR増幅(MS-PCR)、高解像度融解(HRM)、DNAメチル化感受性制限酵素およびバイサルファイトシークエンシングを含む、パブリックドメインにおいて十分に報告されている、承認され利用可能ないくつかの方法を使用して、STAP1および他の差異的にメチル化される部位のDNAメチル化を測定できることに留意しなければならない。
【0079】
[本発明の適用]
本発明の適用は、一般に、HCCおよびがんの分子診断の分野にある。いかなる当業者も、他のがんのための同様のバイオマーカーを得るために本発明を使用することができる。さらに、実施形態9にリストされる標的を使用して、これらの遺伝子およびこれらの遺伝子由来の経路により、末梢免疫系に焦点を定める新しい薬物が導かれうる。がんにおけるDNAメチル化研究における焦点は、これまでのところ、腫瘍、腫瘍微小環境(8、9)および循環腫瘍DNA(5、6)に定められており、この点において大きな進歩がなされた。しかし、システムワイドな疾患の機序について知らせる、および/またはがんの非侵襲性予測因子としての役目を果たしうる、宿主系におけるDNAメチル化の変化があるかどうかの疑問が残る。HCCは、既存の慢性肝炎および肝硬変から進行することが多い(2)ので、きわめて興味深い例であり、この疑問に対処するための扱いやすい臨床的なパラダイムを提供しうる。本発明は、宿主免疫系の質が、がんの臨床的な発生および軌跡を定めうることを明らかにする。
【0080】
重要なことに、本発明は、本発明の実施形態に例示しているように、慢性肝炎からHCCへの早期の移行を診断するために使用することができる、HCCのステージ1と慢性B型およびC型肝炎との間の鮮明な境界を示す。本発明は、がんのステージを互いと分別するために本発明をどのように使用することができるかも明らかにする。すべてのアッセイは、階層的クラスタリング、ROCまたは罰則付き回帰を使用してモデルをトレーニングするために、本発明に開示されるCG-IDについてのメチル化値を有する一組の既知の試料を必要とすることになり、次いで、それらのモデルを使用して、本発明の実施形態に例示しているように未知の試料を解析することになる。
【0081】
本発明が異なる従属請求項に言及しているという事実は、がんを予測するためにこれらの請求項の組合せを使用できないことを意味するものではない。がん、がんのステージおよび慢性肝炎の測定および統計的解析ならびに予測のためにここに開示される例は、限定するものとみなされるべきではない。Illumina 850Kアレイ、キャプチャーアレイシークエンシング、次世代シークエンシング、メチル化特異的PCR、epityper、制限酵素に基づく解析、およびパブリックドメインにおいて見出される他の方法のように、がん患者においてDNAメチル化を測定するための他の様々な変更形態が当業者には明らかであろう。同様に、患者の試料におけるがんの予測のために本発明を使用するためにここにリストされるものに加えて、パブリックドメインに多数の統計的方法がある。
【0082】
参考文献
【表11A】
【表11B】
【表11C】
【表11D】
【表11E】
【表11F】
図1
図2
図3A
図3B
図4
図5
図6
図7
図8
図9
図10A
図10B
図10C
図11
図12
図13A
図13B
図13C
図14
図15
図16