(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-08-31
(45)【発行日】2023-09-08
(54)【発明の名称】肝がん再発予測用DNAメチル化マーカー及びその用途
(51)【国際特許分類】
C12Q 1/68 20180101AFI20230901BHJP
C12N 15/11 20060101ALI20230901BHJP
C12Q 1/6886 20180101ALI20230901BHJP
【FI】
C12Q1/68 ZNA
C12N15/11 Z
C12Q1/6886 Z
(21)【出願番号】P 2021550256
(86)(22)【出願日】2020-02-26
(86)【国際出願番号】 KR2020002727
(87)【国際公開番号】W WO2020175903
(87)【国際公開日】2020-09-03
【審査請求日】2021-08-27
(31)【優先権主張番号】10-2019-0024379
(32)【優先日】2019-02-28
(33)【優先権主張国・地域又は機関】KR
(73)【特許権者】
【識別番号】520181261
【氏名又は名称】レピディン・カンパニー・リミテッド
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ヨン・ジュン・キム
(72)【発明者】
【氏名】タ・ウォン・キム
(72)【発明者】
【氏名】テ・ユ・キム
(72)【発明者】
【氏名】クワン・ウォン・イ
(72)【発明者】
【氏名】ジョン・シル・ハ
【審査官】鳥居 敬司
(56)【参考文献】
【文献】特開2015-006163(JP,A)
【文献】国際公開第2014/046198(WO,A1)
【文献】米国特許出願公開第2014/0094380(US,A1)
【文献】国際公開第2012/102377(WO,A1)
【文献】Hepatology,2015年,Vol.61,pp.1945-1956
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/00-1/70
JSTPlus/JMEDPlus/JST7580(JDreamIII)
CAplus/REGISTRY/MEDLINE/EMBASE/BIOSIS(STN)
GenBank/EMBL/DDBJ/GeneSeq
(57)【特許請求の範囲】
【請求項1】
(a)分析対象の肝組織試料からゲノムDNAを分離する段階と、
(b)配列番号1で表されるDNAメチル化マーカーのメチル化レベルを検出する段階と、
(c)前記検出されたDNAメチル化マーカーのメチル化レベルを正常肝組織で検出したメチル化レベルと比較する段階と、及び、
(d)分析対象の肝組織で確認したDNAメチル化マーカーのメチル化レベルが正常肝組織のメチル化レベル
の50%以下の場合、肝がんの再発可能性が高いと判別する段階と、を含む、
(医師による診断を除く)肝がんの再発予測方法。
【請求項2】
前記肝がんの再発予測方法は、段階(b)において、配列番号2、配列番号3、又は、配列番号4によって表されるDNAメチル化マーカーのメチル化をさらに検出するものである、請求項
1に記載の肝がんの再発予測方法。
【請求項3】
前記肝がんは、肝細胞がん(hepatocellular carcinoma)である、請求項1に記載の肝がんの再発予測方法。
【請求項4】
前記方法は、肝がん患者の治療後、正常肝において肝がんの再発予後を予測するものである、請求項1に記載の肝がんの再発予測方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、肝がんの予後によってゲノムDNAのメチル化レベルが異なる点を用いた肝がんの再発予測用DNAメチル化マーカー及びその用途に関し、具体的には、肝がん患者の治療後、正常肝組織において肝がんの再発の有無を予測するためのDNAメチル化マーカーに関する。
【背景技術】
【0002】
肝がん(liver cancer)は、大きく肝細胞自体から発生した原発性肝がん(肝細胞がん;hepatocellular carcinoma、hepatoma)と他の組織のがんが肝に転移してきた転移性肝がんに区分できる。肝がんの約90%以上は、原発性肝がんであり、一般に肝がんとは、原発性肝がんを指すものと理解される。統計庁が2018年9月に発表した「2017死亡原因統計」によると、2017年人口10万人あたり、がんで死亡した人は、153.9人で前年比1.0人(0.6%)増加した。がん死亡率は、肺がん(35.1人)、肝がん(20.9人)、大腸がん(17.1人)、胃がん(15.7人)、膵臓がん(11.3人)の順で高かった。
【0003】
他のがんと同様に肝がんの治療も大きく根治的治療と保存的治療がある。ここで根治とは、がん自体を完全になくす治療を意味し、肝切除手術、肝移植、高周波熱治療などがある。また、このような治療が不可能な場合、頸動脈化学塞栓術、放射線治療、抗がん治療を行うことになる。しかし、このような治療によっては完治がほとんど難しいため、早期発見を通じて根治的治療をするのが検診の目的である。肝切除手術の場合、約50%の患者においてがんの再発を経験することになるが、その理由は、切除されて残っている肝も正常な肝ではない肝炎にさらされているからである。
【0004】
肝がんの予後(prognosis)は、肝がんが診断された後に肝がんの完治の可能性、治療後の再発の可能性、患者の生存の可能性など肝がんによる患者の各種状態を予測することを意味し、これは疾病の深刻性、診断時点、治療経過などの様々な条件に依存して変わる。肝がんは、その予後によって適切に様々な治療方法が適用されなければ、効率的な治療が不可能である。例えば、予後が良好であると予測される患者に対しては、攻撃的な化学治療や手術、放射線治療など患者に深刻な副作用を引き起こす可能性のある危険な治療方法は、避ける必要があり、相対的に穏健で保存的かつ安全な治療方法を選択しなければならない。逆に、予後不良が予測される患者に対しては、化学治療や手術、放射線治療のような治療方法を積極的に動員し、生存期間や確率を高めるために試みなければならない。
【0005】
しかし、肝がん患者の予後を正確に予測するのは、従来の技術では非常に難しい。予後の正確な予測のためには、患者を危険群別に分類する分析方法が必要であるが、現在までは肝がんの予後を正確に予測できる手段なしに診断時の臨床病理学的な肝がんの段階と1次的外科治療のみに依存して予後を判断しいるのが現状である。
【0006】
本発明者らは、このような問題を解決しようと努力した結果、肝がん組織のDNAメチル化データに基づいて肝がん患者の予後を予測できる方法を用意した。
【発明の概要】
【発明が解決しようとする課題】
【0007】
本発明の目的は、DNAメチル化マーカーを含む肝がんの再発予測用組成物と、これを用いた肝がんの再発の可能性を予測する方法を提供するものである。
【課題を解決するための手段】
【0008】
前記目的を達成するため、本発明の一態様は、配列番号1~4で表されるDNAメチル化マーカーからなる群から選ばれる1つ以上のDNAメチル化マーカーを含む肝がんの再発予測用組成物を提供する。
【0009】
本発明において、前記配列番号1~4で表されるDNAメチル化マーカーは、それぞれCG遺伝子座の記号(Illumina(登録商標) Infinium HumanMethylation 850Kビーズアレイ CpG ID)で表されるDNAメチル化マーカーであるcg21325760、cg10544510、cg06702718及びcg15997204を意味する。
【0010】
本明細書で使用される用語の「肝がん(liver cancer)」とは、肝組織に発生するがんを総称する用語であり、肝細胞自体から発生した原発性肝がん(肝細胞がん;hepatocellular carcinoma、hepatoma)と他の組織のがんが肝に転移してきた転移性肝がんに区分できる。肝がんの治療には、肝切除術、肝移植、高周波熱治療術、頸動脈化学塞栓術など様々な治療法が使用されているが、5年生存率が33.6%(2011年~2015年の平均;保健福祉部の統計)に過ぎず、再発率も70%に達する。他のがん種に比べて、肝がんは、5年生存率は低く、再発率はかなり高いので、再発するかどうかを予測できる方法が必要である。
【0011】
本明細書で使用される用語の「DNAメチル化(DNA methylation)」とは、ゲノムDNAにおいてシトシン塩基のC5-位置にメチル基が共有結合したことを意味する。メチル化レベルは、例えば、すべてのゲノム領域及び一部の非-ゲノム領域内のDNA塩基配列に存在するメチル化の量を意味し、本発明では、配列番号1~4で表されるDNAメチル化マーカーのメチル化程度を意味する。前記配列番号1~4のDNAメチル化マーカーにおいて、メチル化は、配列全体にわたって起こりうる。
【0012】
本発明において、前記肝がんの再発予測用組成物は、前記DNAメチル化マーカーのうち1つ以上、2つ以上、3つ以上または4つを含む組成物であってもよい。具体的には、前記肝がんの再発予測用組成物は、前記DNAメチル化マーカーcg21325760、cg10544510、cg06702718及びcg15997204をそれぞれ1つずつ含んでもよく、2つの組み合わせであるcg21325760及びcg10544510、cg21325760及びcg06702718、cg21325760及びcg15997204、cg10544510及びcg06702718、cg10544510及びcg15997204、またはcg06702718及びcg15997204の組み合わせを含んでもよい。また、前記肝がんの再発予測用組成物は、3つのDNAメチル化マーカーを含んでもよく、例えば、cg21325760、cg10544510及びcg06702718、cg21325760、cg10544510及びcg15997204、cg21325760、cg06702718及びcg15997204、またはcg10544510、cg06702718及びcg15997204の組み合わせを含んでもよい。併せて、前記肝がんの再発予測用組成物は、DNAメチル化マーカーcg21325760、cg10544510、cg06702718及びcg15997204をすべて含んでもよい。
【0013】
本発明において、前記DNAメチル化マーカーcg15997204は、MYT1L遺伝子に存在するマーカーであって、MYT1L(Myelin Transcription Factor 1 Like)遺伝子は、C-C-H-Cジンクフィンガータンパク質に属する転写因子をコードする。TCGA(The Cancer Genome Atlas)に公開されたデータによると、様々ながんにおいてMYT1Lが発現されるが、この遺伝子のメチル化レベルと肝がんの再発の有無の相関関係に対しては、まだ明確に知られていない。
【0014】
本発明において、前記DNAメチル化マーカーcg21325760は、MAGEL2(MAGE(melanoma-associated antigen)family member L2)遺伝子に存在し、TCGAのデータによると、精巣がんにおいて多く発現されるが、この遺伝子のメチル化レベルと肝がんの再発の有無との相関関係に対しては、まだ明確に知られていない。
【0015】
本発明の一具体例において、本発明者らは、肝がん組織からゲノムDNAを分離した後、Illumina(登録商標) Infinium HumanMethylation 850Kビーズアレイでメチル化レベルを確認した。その結果、メチル化レベルによって肝がん組織が2つのグループに分類されることを確認し、前記両グループが肝がんの再発率において著しい差があることが分かった。以後、両グループにおいてメチル化レベルに著しい差のあるDNAメチル化マーカーをランダムフォレストなどの機械学習技法で確認し、前記DNAメチル化マーカーを発掘した(表3参照)。また、1つのDNAメチル化マーカーより4つのDNAメチル化マーカーを併用する場合、肝がんの再発予測の正確度が1に収束することを確認し、本発明を完成した(
図5及び表2)。
【0016】
本発明において、前記肝がんは、肝細胞自体から発生した肝細胞がんまたは他の組織のがんが肝に転移してきた転移性肝がんであってもよいが、好ましくは、肝細胞がんであってもよい。肝細胞がん(hepatocellular carcinoma)は、肝で発生する悪性腫瘍の約90%を占め、韓国と日本、東南アジア、中国などで多く発生する。ほとんどが肝硬変のある状態で発生するが、一部は、慢性B型またはC型肝炎により発生することもある。
【0017】
本明細書で使用される用語の「再発(relapse)」とは、肝がんの患者において肝がんを治療した後、肝で再び非正常な細胞増殖、すなわち、肝がんが発生することを意味する。前記肝がん患者の治療方法は、肝切除術、高周波熱治療術、頸動脈化学塞栓術、経皮的エタノール注入術などが使用されてもよいが、これに制限されない。
【0018】
本発明において、前記肝がんの予後予測用組成物は、DNAメチル化マーカーのメチル化レベル確認に必要な試薬などをさらに含む肝がんの再発予測用キットの形態で具現されてもよい。
【0019】
本発明の一態様は、下記段階を含む肝がんの再発予測方法を提供する。
(a)分析対象の肝組織からゲノムDNAを分離する段階、
(b)配列番号1~4で表されるDNAメチル化マーカーからなる群から選ばれる1つ以上のDNAメチル化マーカーのメチル化レベルを検出する段階、及び
(c)前記検出されたDNAメチル化マーカーのメチル化レベルを正常肝組織で検出したDNAメチル化マーカーのメチル化レベルと比較する段階。
【0020】
本発明において、前記配列番号1~4で表されるDNAメチル化マーカーは、それぞれCG遺伝子座の記号(Illumina(登録商標) Infinium HumanMethylation 850KビーズアレイCpG ID)で表されるDNAメチル化マーカーであるcg21325760、cg10544510、cg06702718及びcg15997204を意味する。
【0021】
本発明の一具体例において、前記分析対象の肝組織は、分析対象個体から分離された肝がん組織、肝細胞がん組織、転移性肝がんまたは肝がんが転移した部位の転移がん組織であってもよく、好ましくは、肝細胞がん組織であってもよい。前記分析対象の肝組織を分析対象個体から分離する方法は、本発明が属する技術分野に知られている経皮生検、頸静脈生検などの方法を使用してもよい。
【0022】
本発明の一具体例において、前記肝がんの予後予測方法は、段階(b)において少なくとも2つ以上のDNAメチル化マーカーのメチル化を確認する方法であってもよい。本発明者らは、肝がんが再発するかどうかを予測できる4つのDNAメチル化マーカー(プローブ)を発掘し(表2参照)、マーカーの数による肝がん再発予測の性能を評価した。評価の結果、マーカーが2つ以上の場合、正確度、敏感度などの性能が0.9に収束し、マーカーの数が3つ以上の場合には、肝がん再発予測性能が1に収束することを確認した(
図5)。
【0023】
この結果から、本発明のDNAメチル化マーカーは、単一で使用されても肝がん予後予測性能に優れているが、複数個使用する場合には、その性能が著しく優れていることが分かる。したがって、本発明のDNAメチル化マーカーは、単一または複数個が組み合わされて肝がん再発予測の用途で使用されてもよい。
【0024】
具体的には、本発明のDNAメチル化マーカーは、cg21325760、cg10544510、cg06702718及びcg15997204がそれぞれ単一のマーカーで使用されてもよく、2つのマーカーの組み合わせ(cg21325760及びcg10544510、cg21325760及びcg06702718、cg21325760及びcg15997204、cg10544510及びcg06702718、cg10544510及びcg15997204、またはcg06702718及びcg15997204)または3つのマーカーの組み合わせ(cg21325760、cg10544510及びcg06702718、cg21325760、cg10544510及びcg15997204、cg21325760、cg06702718及びcg15997204、またはcg10544510、cg06702718及びcg15997204)で使用されてもよい。また、前記4つのマーカーをすべて組み合わせて使用してもよい。
【0025】
本発明の一具体例において、前記肝がんの予後予測方法は、段階(c)以後、分析対象サンプルで確認したDNAメチル化マーカーのメチル化レベルが正常肝組織のメチル化レベルより低い場合、肝がんの再発可能性が高いと判別する段階をさらに含んでもよい。
【0026】
本発明において、DNAメチル化マーカーのメチル化レベルを確認する方法は、当業界に知られているPCR、メチル化特異的PCR(methylation specific PCR)、リアルタイムメチル化特異的PCR(real time methylation specific PCR)、メチル化DNA特異的結合タンパク質を用いたPCR、定量PCR、DNAチップ、パイロシークエンシング、商業的に販売されるチップなどで行われてもよいが、これに制限されるものではない。
【0027】
本発明者らは、肝がんが再発した患者(MG2)においては、前記DNAメチル化マーカーのメチル化レベルが正常肝組織(N)より著しく低いことを確認したところ(
図3、7及び8)、前記DNAメチル化マーカーは、肝がんの再発予測の用途で有用に使用されてもよい。
【発明の効果】
【0028】
本発明の肝がん再発予測用DNAメチル化マーカーを使用すると、肝がんの再発の有無を容易に予測でき、肝がん再発のリスクの高い患者に、より個人化した治療法を提供し、不必要な過剰治療を避けるための臨床情報を提供しうる。
【図面の簡単な説明】
【0029】
【
図1】
図1は、肝細胞がんサンプル(A;n=140))及び正常肝サンプル(B;n=96)から分離したDNAのメチル化レベルを確認した結果を示す。
【
図2】
図2は、肝細胞がんサンプル(n=140)を予後によってメチル化グループ1(MG1;n=81)及びメチル化グループ2(MG2;n=59)に分類した後、DNAのメチル化パターンによって各サンプルをコンセンサスクラスタリング方法で分類した結果を示す。
【
図3】
図3は、メチル化グループ1(MG1)及びメチル化グループ2(MG2)の無-再発生存期間(recurrence free survival、RFS)を確認した結果を示す。
【
図4】
図4は、メチル化グループ1(MG1)及びメチル化グループ2(MG2)において変数重要度のプロット(variable importance plot、varImpPlot)を確認した後(A)、メチル化グループ分類に関与する上位50個のプローブを選別する過程を示す(B)。
【
図5】
図5は、メチル化グループ分類に関与するプローブの個数による肝がん予後予測効率をAUC(area under the curve)値で確認した結果を示す。
【
図6】
図6は、正常肝サンプル(N)、メチル化グループ1(MG1)及びメチル化グループ2(MG2)においてメチル化グループ分類に関与するプローブのメチル化レベルを確認した結果を示す。
【
図7】
図7は、メチル化グループ分類に関与するプローブで自体的に生産した肝がん検証コホートデータを分類した結果を示す。
【
図8】
図8は、メチル化グループ分類に関与するプローブでTCGA(the cancer genome atlas)に公開された肝がんデータを分類した結果を示す。
【発明を実施するための形態】
【0030】
以下、1つ以上の具体例を実施例を通じて、より詳細に説明する。しかし、これらの実施例は、1つ以上の具体例を例示的に説明するためのもので、本発明の範囲がこれらの実施例に限定されるものではない。
【0031】
実験方法
1.肝細胞がん患者の募集
本発明に関連して行われた研究は、ソウル大学校病院(Seoul National University of Hospital)検討委員会の承認を受け、すべての患者から書面同意書を得て行われた。2011年から2016年までソウル大学校病院の外科で肝細胞がん(hepatocellular carcinoma;以下、HCCと記載する)切除術を受けた184人の患者を募集し、手術後にCTスキャンにより、きれいな微細境界(microscopic margins)及び腫瘍の完全切除を確認した。前記患者は、定期的に病院を訪問して血清腫瘍マーカー、アルファ-胎児蛋白(α-fetoprotein、AFP)数値、造影CTスキャン(contrast CT scans)または磁気共鳴画像(magnetic resonance imaging、MRI)を含む標準プロトコルに基づいて、3ヶ月ごとに再発(recurrence)の有無に対してモニタリングが行われた。再発の有無は、早期(
【化1】
1年)及び後期(>1年)再発に分類し、HCC切除術後、1年以内に再発した患者は除外した。人口統計学的データと臨床病理学的特徴は、病院チャートで確認し、前記患者は、切除術後に死亡するまで追跡調査を受けた。1年以内に再発した患者を除いた理由は、早期再発の場合、HCC切除術が失敗したり、または肝がん以外の理由で再発する場合が多く、がんの治療後、純粋に正常肝で新しいがんが再発するのに関与するマーカーを発掘するための本発明の目的に合致していないからである。
【0032】
2.メチル化データ生成
前記182人のHCC患者のうち、手術後1年以内にHCCが再発した42人は、分析から除外した。残り140人の患者から得られた冷凍HCCサンプルからメーカーの指示によってMagListoTM 5MゲノムDNA抽出キット(Bioneer)を使用してDNAを抽出した。各サンプルごとに500ngのDNAを使用し、メーカーの標準プロトコルに基づいてIllumina iScan System(Illumina、CA、USA)とともにIllumina Infinium HumanMethylation EPIC 850K BeadChip(Illumina)分析を行った。前記Illumina Infinium HumanMethylation EPIC BeadChipsは、すべての単一のヌクレオチドの分解能(resolution)のために85万個以上のCpGサイトに対するDNAメチル化値を含む。
【0033】
3.DNAメチル化データ加工
前記2.でIllumina Infinium HumanMethylation EPIC BeadChipsにより得られたデータに対し、公開ソフトウェアであるRプラットフォーム(https://cran.r-project.org/bin/windows/base/;バージョン3.3.2)でminfi Rパッケージを使用してメチル化データに対する事前-加工(pre-processing)を行った。具体的には、HCCサンプルの原本(raw)IDATファイルを加工し、背景補正及び染料偏差を訂正した。以後、メチル化及び非メチル化(unmethylated)プローブの信号強度を測定し、各プローブのDNAメチル化値を0(非メチル化)~1(完全メチル化)範囲のb-値(b-value)で定量化した。次に、すべてのサンプルに対してデータ品質管理を行い、140個のサンプルが全て品質管理基準を通過した。最後に、メチル化データは、バッチ効果問題(batch effect problem)を減らすため、機能的正規化方法(functional normalization method)を使用して正規化させた。
【0034】
4.DNAメチル化値(methylation values)
メチル化b-値は、統計分析のために下記式1によりM-値に変換させた。
【0035】
[式1]
M-値=log((b-値)/(1-(b-値)))
【0036】
M-値は、コンセンサスクラスタリング(consensus clustering)に使用し、b-値は、ヒートマップ視覚化及びボックスプロットの生成に使用した。
【0037】
5.コンセンサスクラスタリング
コンセンサスクラスタリングは、ConcensusClusterPlus(https://bioconductor.org/packages/release/bioc/vignettes/ConcensusClusterPlus/inst/doc/ConcensusClusterPlus.pdf)を使用してHCC小グループを確認するために行った。入力値(input)としては、上位3,000個の最も可変的なプローブ(中央値絶対偏差(median absolute deviation、MAD))(MAD 3K)を使用した。
【0038】
6.予後マーカー(prognostic marker)選別
ランダムフォレスト(Random Forest)方法は、非線形効果(nonlinear effects)をモデリングするために開発された機械学習アルゴリズムを基盤とする。本発明者らは、RプラットフォームのランダムフォレストRパッケージを使用して良いか悪い予後を持つHCCグループを区別できるプローブを発掘し、HCC腫瘍サンプルを4つのトレーニングコホート(cohort)と1つのテストコホートにランダムに分けて5倍交差検証(five-fold cross validation)を行った。その結果、本発明者らは、ランダムフォレストモデルを構築し、各グループの予想比率は、混同行列(confusion matrix)(予測されたサンプルvs観察されたサンプル)によって予測され、各モデルの性能は、曲線下面積(area under the curve、AUC)、敏感度及び特異度値に基づいて測定した。
【0039】
本発明者らは、ジニインデックス(Gini index)、プローブ不純度(impurity)の全体的減少及びランダムフォレストで測定した変数の重要度のドットチャートを考慮し、各プローブの重要度値を測定した。その結果、本発明者らは、HCCサンプルをメチル化グループ1及び2(以下、それぞれMG1及びMG2と記載する)に分類できる上位50個のプローブを発掘した(
図4)。以後、1つのプローブと上位50個のプローブの性能効率を比較するとともに、AUC値を考慮して最大効率を持つプローブの最小個数を確認した。
【0040】
7.遺伝子オントロジー及び経路分析(Gene ontology and pathway analysis)
本発明者らは、innateDB(http://www.innatedb.com/)を使用して様々な経路検索及び遺伝子オントロジー分析を行った。前記innateDBでは、遺伝子オントロジー生物学的過程(Gene Ontology biological processes)、KEGG(Kyoto Encyclopedia of Genes and Genomes)及びリエクトムリソース(Reactome resources)を使用した。有意義なカットオフ基準は、p-値<0.05であった。
【0041】
9.統計分析
カテゴリ変数(categorical variable)の統計分析は、ピアソンカイ(χ2)検定またはフィッシャー正確検証を使用して行った。無-再発生存(relapse-free survival、RFS)の中間期間は、カプラン-マイヤー法で計算し、互いに異なるグループ間の比較は、ログランク検定(log-rank tests)で行った。
【0042】
実験結果
1.患者選別及び基本特性
182人のHCC患者のうち手術後1年以内にHCCが再発した42人は、分析から除外した。140個のHCCサンプルのメチル化を確認した結果、HCCサンプルは、サンプル間でメチル化の変化が大きい反面、正常組織は、メチル化がほぼ一定に現れることが分かった(
図1)。
【0043】
2.MG1とMG2のメチル化プロファイル比較
140個のHCCサンプルをDNAメチル化パターンによって分類した結果、メチル化グループ1(n=81)及びグループ2(n=59)(以下、それぞれMG1及びMG2と記載する)に分けられることを確認した(
図2のA)。また、MG2のメチル化プロファイルは、非腫瘍性肝組織のメチル化プロファイルと最も異なっており、MG1のメチル化プロファイルは、非腫瘍性肝組織のメチル化プロファイルと類似していた(
図2のB)。MG1は、無-再発生存(RFS)の期間が長い反面、MG2は、無-再発生存が短く、予後が悪いことが分かった(
図3)
【0044】
このような後性的変化は、信号伝達、MAPK(mitogen-activated protein kinase)及びGタンパク質-共役受容体(GPCR)信号伝達経路と関連があった(表1)。本発明者らが前記グループのGO(gene ontology)システムに基づいて一連の遺伝子を解析する際に、上位50個のプローブは、理化過程、神経伝達物質の分泌、分子機能の調節、Wnt信号伝達経路、細胞移動調節、mRNA代謝過程、小さな(small)GTPase媒介信号伝達、遺伝子発現調節、細胞死滅過程の調節と関連があった。
【0045】
【0046】
3.HCC再発予測マーカー選別
変数重要度のプロット(variable importance plot、varImpPlot)を用いて、HCCサンプルをMG1及びMG2に分類できる上位50個のプローブを発掘した(
図4)。以後、プローブ数による性能効率を比較するとともに、AUC(area under the curve)値を考慮し、最大の効率を持つプローブの最小個数を選んだ。その結果、プローブの個数が3つ以上の場合、肝がん再発予測の正確度(accuracy)が1に収束することが分かった(
図5及び表2)。下記表2に記載された文字は、それぞれの正確度(Accu.)、敏感度(Sen.)及び特異度(Spec.)を意味する。
【0047】
【0048】
前記表2の結果に基づいて、最終的に下記表3に記載されたプローブを選別し、プローブは、重要度値が高い順に記載した。
【0049】
【0050】
下記表4に表3に記載されたプローブの配列を記載した。
【0051】
【0052】
*ゲノム配列において、[CG]は、該CGマーカーが標的するメチル化部位を意味する。
【0053】
3.HCC再発予測マーカー検証
ランダムフォレスト法を使用して、表3に記載されたプローブに対してメチル化レベルを確認した結果、正常肝組織(緑色)は、メチル化レベルがほぼ100%に近づいて一定のレベルであり、MG1(赤色)は、正常肝組織と類似したメチル化レベルを示す反面、MG2(灰色)は、メチル化レベルが正常肝組織に比べて約50%以下であることが確認できた(
図6;X軸は、選別されたマーカー、Y軸は、メチル化レベルを意味するb-値)。
【0054】
また、140個のHCCサンプルをランダムに訓練データと検証データに分け、表3のプローブで再テストした結果、既存のMG1は、再びMG1に分類され、既存のMG2も再びMG2に分類されることが確認できた(表5)。
【0055】
【0056】
本発明者が自体的に生産した肝がんコホートデータを前記表3のプローブで検証した。その結果、メチル化レベルによって肝がんコホートデータが2つのグループ(Pre_MG1及びPre_MG2)に分類され、Pre_MG2において再発率が高いことが確認できた(
図7のA)。また、RFSを確認した結果、Pre_MG2に比べてPre_MG1のRFSが有意に長いことが確認できた(p=0.0136;
図7のB)。この結果は、本発明のプローブで肝がんの再発の有無を成功的に予測できることを意味する。
【0057】
また、表3のプローブで公開データベースであるTCGA(the cancer genome atlas)肝がんデータに対して同様に検証した結果、肝がん患者がグループ(Pre_MG1及びPre_MG2)に分類され(
図8のA)、これらのグループは、予後が異なることが分かった(
図8のB)。
【配列表】