(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2023-07-03
(45)【発行日】2023-07-11
(54)【発明の名称】遺伝子のCPGメチル化変化を用いた肝癌の予後または危険度を評価する方法
(51)【国際特許分類】
C12Q 1/68 20180101AFI20230704BHJP
C12N 15/09 20060101ALI20230704BHJP
C12Q 1/6886 20180101ALI20230704BHJP
【FI】
C12Q1/68 ZNA
C12N15/09 Z
C12Q1/6886 Z
(21)【出願番号】P 2020546257
(86)(22)【出願日】2018-11-19
(86)【国際出願番号】 KR2018014207
(87)【国際公開番号】W WO2019103421
(87)【国際公開日】2019-05-31
【審査請求日】2020-06-09
(31)【優先権主張番号】10-2017-0156527
(32)【優先日】2017-11-22
(33)【優先権主張国・地域又は機関】KR
(31)【優先権主張番号】10-2018-0137644
(32)【優先日】2018-11-09
(33)【優先権主張国・地域又は機関】KR
【前置審査】
(73)【特許権者】
【識別番号】520181261
【氏名又は名称】レピディン・カンパニー・リミテッド
(74)【代理人】
【識別番号】100108453
【氏名又は名称】村山 靖彦
(74)【代理人】
【識別番号】100110364
【氏名又は名称】実広 信哉
(74)【代理人】
【識別番号】100133400
【氏名又は名称】阿部 達彦
(72)【発明者】
【氏名】ヨン・ジュン・キム
(72)【発明者】
【氏名】タ・ウォン・キム
(72)【発明者】
【氏名】ウォン・ヨン・チェ
(72)【発明者】
【氏名】ジュン・ウ・イ
(72)【発明者】
【氏名】ミン・ヒョク・ジュン
(72)【発明者】
【氏名】ジョン・シル・ハ
(72)【発明者】
【氏名】ジ・ウォン・キム
(72)【発明者】
【氏名】ヨン・ス・イ
(72)【発明者】
【氏名】ジュン・アー・ファン
(72)【発明者】
【氏名】テ・ユ・キム
(72)【発明者】
【氏名】ユ・ジョ・イム
【審査官】市島 洋介
(56)【参考文献】
【文献】特開2015-006163(JP,A)
【文献】国際公開第2014/046198(WO,A1)
【文献】国際公開第2012/102377(WO,A1)
【文献】Hepatology,2015年,Vol.61,pp.1945-1956
(58)【調査した分野】(Int.Cl.,DB名)
C12Q 1/00-3/00
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
(57)【特許請求の範囲】
【請求項1】
(a)対象体(subject)から分離した肝臓組織由来のDNAを分離する段階と;
(b)前記分離したDNAにおける染色体#2の25438725~25439276番目の配列のCpG部位のメチル化レベルを測定する段階;
(c)前記メチル化レベルを正常サンプルのメチル化レベルと比較する段階;及び
(d)分離したDNAのメチル化レベルが正常サンプルのメチル化レベルよりも高い場合に、対象が肝癌の危険性を有すると決定される段階、
を含む、肝癌の危険度を評価することを補助する方法。
【請求項2】
工程(b)において、染色体#12の95941906~95942979番目の配列、染色体#10の134597357~134602649番目の配列、染色体#8の144649774~144651774番目の配列、染色体#1の47998899~47999517番目の配列、染色体#2の26394102~26396102番目の配列、染色体#8の104510870~104513913番目の配列、染色体#8の98289604~98290404番目の配列、染色体#2の63281034~63281347番目の配列、染色体#8の67873388~67875600番目の配列、染色体#4の76555366~76556079番目の配列、染色体#1の63782394~63790471番目の配列、染色体#5の7849945~7850439番目の配列、染色体#2の39186777~39187968番目の配列、および染色体#14の74207665~74208665番目の配列よりなる群から選ばれるCpG部位のメチル化レベルをさらに測定する、請求項1に記載の方法。
【請求項3】
2以上のCpG部位メチル化レベルを測定する、請求項2に記載の方法。
【請求項4】
前記染色体#2の25438725~25439276番目の配列は、配列番号1の塩基配列を有し、
前記染色体#12の95941906~95942979番目の配列は、配列番号2の塩基配列を有し、
前記染色体#10の134597357~134602649番目の配列は、配列番号3の塩基配列を有し、
前記染色体#8の144649774~144651774番目の配列は、配列番号4の塩基配列を有し、
前記染色体#1の47998899~47999517番目の配列は、配列番号5の塩基配列を有し、
前記染色体#2の26394102~26396102番目の配列は、配列番号6の塩基配列を有し、
前記染色体#8の104510870~104513913番目の配列は、配列番号7の塩基配列を有し、
前記染色体#8の98289604~98290404番目の配列は、配列番号8の塩基配列を有し、
前記染色体#2の63281034~63281347番目の配列は、配列番号9の塩基配列を有し、
前記染色体#8の67873388~67875600番目の配列は、配列番号10の塩基配列を有し、
前記染色体#4の76555366~76556079番目の配列は、配列番号11の塩基配列を有し、
前記染色体#1の63782394~63790471番目の配列は、配列番号12の塩基配列を有し、
前記染色体#5の7849945~7850439番目の配列は、配列番号13の塩基配列を有し、
前記染色体#2の39186777~39187968番目の配列は、配列番号14の塩基配列を有し、
前記染色体#14の74207665~74208665番目の配列は、配列番号15の塩基配列を有する、請求項2に記載の方法。
【請求項5】
前記染色体#2の25438725~25439276番目の配列のCpG部位は、染色体#2の25439110番目に位置し、
前記染色体#12の95941906~95942979番目の配列のCpG部位は、染色体#12の95941988番目に位置し、
前記染色体#10の134597357~134602649番目の配列のCpG部位は、染色体#10の134599823番目に位置し、
前記染色体#8の144649774~144651774番目の配列のCpG部位は、染色体#8の144651002番目に位置し、
前記染色体#1の47998899~47999517番目の配列のCpG部位は、染色体#1の47999163番目に位置し、
前記染色体#2の26394102~26396102番目の配列のCpG部位は、染色体#2の26395458番目に位置し、
前記染色体#8の104510870~104513913番目の配列のCpG部位は、染色体#8の104512877番目に位置し、
前記染色体#8の98289604~98290404番目の配列のCpG部位は、染色体#8の98290148番目に位置し、
前記染色体#2の63281034~63281347番目の配列のCpG部位は、染色体#2の63281139番目に位置し、
前記染色体#8の67873388~67875600番目の配列のCpG部位は、染色体#8の67874178番目に位置し、
前記染色体#4の76555366~76556079番目の配列のCpG部位は、染色体#4の76555832番目に位置し、
前記染色体#1の63782394~63790471番目の配列のCpG部位は、染色体#1の63789278番目に位置し、
前記染色体#5の7849945~7850439番目の配列のCpG部位は、染色体#5の7850070番目に位置し、
前記染色体#2の39186777~39187968番目の配列のCpG部位は、染色体#2の39187533番目に位置し、
前記染色体#14の74207665~74208665番目の配列のCpG部位は、染色体#14の74208165番目に位置する、請求項2に記載の方法。
【請求項6】
前記段階(b)は、PCR、メチル化特異PCR(methylation specific PCR)、リアルタイムメチル化特異PCR(real time methylation specific PCR)、MethyLight PCR、MehtyLight digital PCR、EpiTYPER、メチル化DNA特異的結合タンパク質を用いたPCR、定量PCR、DNAチップアッセイ、パイロシークエンシングおよびバイサルファイトシーケンシングよりなる群から選ばれる1種の方法で行われる、請求項1に記載の方法。
【請求項7】
肝癌発病危険度診断用キットの製造のための、染色体#2の25438725~25439276番目の配列の位置のCpG部位に結合するプローブの使用。
【請求項8】
染色体#2の25438725~25439276番目の配列が配列番号1の塩基配列を有する、請求項7に記載のプローブの使用。
【請求項9】
染色体#2の25438725~25439276番目の配列のCpG部位が、染色体#2の25439110番目に位置する、請求項7に記載のプローブの使用。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、特定遺伝子CpG部位のメチル化程度を測定して肝癌関連危険度を評価する方法に関する。
【背景技術】
【0002】
癌は、細胞周期が調節されないため、細胞分裂を継続する疾病であって、周囲組織に浸潤しながら早く成長し、身体各部位に拡散したり転移して生命を威嚇する。
【0003】
肝に発生した癌を肝癌と言い、肝癌は、世界的に発病率が高い癌の一つである。韓国で肝癌の死亡率は、人口10万人当たり23人と非常に高いほうであり、韓国人の総死亡率の約10%は、肝炎、肝硬変および肝癌と関係している。
【0004】
他の組織の癌が肝に転移する移転性肝癌と、肝細胞自体で癌が発生する原発性肝癌(HCC;hepatocellular carcinoma)とに肝癌を分類することができるが、原発性肝癌が肝癌の90%を占めるので、多くの肝癌は、原発性肝癌(HCC)を意味する。
【0005】
肝癌は、超音波検査(ultrasound)、電算化断層撮影(CT)、磁気共鳴撮影(MRI)および肝動脈造影撮影(Angiography)などの映像診断方法がある。超音波検査は、肝癌の大きさによって感度に多くの影響を受け、肝癌の発生を調べる一次映像検査方法として用いられている。
【0006】
5cm以上の大きい肝癌組織の場合、75%以上の感度を示す反面、1cm未満の小さい肝癌の場合、約42%の感度を示す(Gomaa et al.,World J Gastro.,15:1301,2009)。
【0007】
電算化断層撮影(CT)は、最も感度が高い検査であって、2cm以上の肝癌の場合、ほぼ100%、1~2cmの場合、93%、そして1cm以下の肝癌も、60%近い感度で診断することができる(Gomaa et al.,World J Gastro.,15:1301,2009)。
【0008】
しかしながら、このような検査は、費用が比較的高いので、一般大衆で日常的なスクリーニング検査として使用するには負担になる検査法である。
【0009】
肝癌の場合、診断当時の腫瘍の大きさが予後と関連があり、患者の生存率を高めるためには、肝癌を早期に発見することである。したがって、高い感度で早期に肝癌を発見できる診断技術の開発が切実に要求されている。
【0010】
一方、後成遺伝学(epigenetics)は、DNAの塩基配列が変化しない状態で行われる遺伝子の発現調節を研究する分野である。後成遺伝学は、DNAメチル化、miRNAまたはヒストンのアセチル化、メチル化、リン酸化およびユビキチン化などのような後成的変異を通した遺伝子発現調節を研究する。
【0011】
この中でDNAメチル化が最も多く研究がなされている後成的変異である。後成的変異は、遺伝子機能変異および腫瘍細胞への変化をもたらすことができる。したがって、DNAメチル化は、細胞内疾患調節遺伝子の発現(または抑制および誘導)と関連しており、最近、DNAメチル化の測定を通した癌診断方法が提示されている。
【0012】
DNAメチル化は、主に、特定遺伝子のプロモーター部位のCpGアイランド(CpG island)のシトシン(cytosine)で起こり、そのため、転写因子の結合が妨害を受けることになって、特定遺伝子の発現が遮断(gene silencing)されるものであって、コーディング配列(coding sequence)に突然変異がなくてもその遺伝子の機能が消失する主な機序である。
【0013】
遺伝子のプロモーター地域以外にもエンハンサー(enhancer)、調節部位のような非翻訳地域のDNAメチル化も、染色体の構造変異、ヒストン変形(modification)と共に作用し、様々な疾病の原因機序になると知られている。癌を含む多様な疾病においてCpGアイランドでのこのような非正常的なメチル化/脱メチル化が報告され、疾病関連遺伝子のプロモーターメチル化を調査して、各種疾患の診断に使用しようとする試みが活発に行われている。
【0014】
本発明者らは、肝癌発病と関連がある遺伝子のメチル化部位を選別し、これを検証する実験を通じて肝癌の危険性または予後を診断する方法を提供しようとした。
【0015】
本明細書の全体にわたって多数の論文および特許文献が参照され、その引用が表示されている。引用された論文および特許文献の開示内容は、その全体として本明細書に参照に挿入されて、本発明の属する技術分野におけるレベルおよび本発明の内容がより明確に説明される。
【発明の概要】
【発明が解決しようとする課題】
【0016】
本発明は、前述した従来技術の問題点を解決するためのものであって、本発明の目的は、肝癌の危険性を初期に発見するために、正常組織や血液では低いメチル化を示すが、肝癌組織だけで高いメチル化レベルを示す特定のプローブを用いて検体のメチル化レベルを測定することによって、肝癌の危険性または予後を診断する方法を提供する。
【課題を解決するための手段】
【0017】
本発明の一態様によれば、(a)対象体(subject)の生物学的試料でDNAを提供する段階と;(b)前記分離したDNAで染色体#2の25438725ないし25439276番目の配列、染色体#12の95941906~95942979番目の配列、染色体#10の134597357~134602649番目の配列、染色体#8の144649774~144651774番目の配列、染色体#1の47998899~47999517番目の配列、染色体#2の26394102~26396102番目の配列, 染色体#8の104510870~104513913番目の配列、染色体#8の98289604~98290404番目の配列、染色体#2の63281034~63281347番目の配列、染色体#8の67873388~67875600番目の配列、染色体#4の76555366~76556079番目の配列、染色体#1の63782394~63790471番目の配列、染色体#5の7849945~7850439番目の配列、染色体#2の39186777~39187968番目の配列、および染色体#14の74207665~74208665番目の配列よりなる群から選ばれるCpG部位のメチル化レベルを測定する段階と;を含む肝癌の予後または危険度を評価する方法が提供される。
【0018】
一実施例において、前記方法は、2以上のCpG部位メチル化レベルを測定することができる。
【0019】
一実施例において、前記染色体#2の25438725~25439276番目の配列は、配列番号1の塩基配列を有し、前記染色体#12の95941906~95942979番目の配列は、配列番号2の塩基配列を有し、前記染色体#10の134597357~134602649番目の配列は、配列番号3の塩基配列を有し、前記染色体#8の144649774~144651774番目の配列は、配列番号4の塩基配列を有し、前記染色体#1の47998899~47999517番目の配列は、配列番号5の塩基配列を有し、前記染色体#2の26394102~26396102番目の配列は、配列番号6の塩基配列を有し、前記染色体#8の104510870~104513913番目の配列は、配列番号7の塩基配列を有し、前記染色体#8の98289604~98290404番目の配列は、配列番号8の塩基配列を有し、前記染色体#2の63281034~63281347番目の配列は、配列番号9の塩基配列を有し、前記染色体#8の67873388~67875600番目の配列は、配列番号10の塩基配列を有し、前記染色体#4の76555366~76556079番目の配列は、配列番号11の塩基配列を有し、前記染色体#1の63782394~63790471番目の配列は、配列番号12の塩基配列を有し、前記染色体#5の7849945~7850439番目の配列は、配列番号13の塩基配列を有し、前記染色体#2の39186777~39187968番目の配列は、配列番号14の塩基配列を有し、前記染色体#14の74207665~74208665番目の配列は、配列番号15の塩基配列を有しうる。
【0020】
一実施例において、前記染色体#2の25438725~25439276番目の配列のCpG部位は、染色体#2の25439110番目に位置し、前記染色体#12の95941906~95942979番目の配列のCpG部位は、染色体#12の95941988番目に位置し、前記染色体#10の134597357~134602649番目の配列のCpG部位は、染色体#10の134599823番目に位置し、前記染色体#8の144649774~144651774番目の配列のCpG部位は、染色体#8の144651002番目に位置し、前記染色体#1の47998899~47999517番目の配列のCpG部位は、染色体#1の47999163番目に位置し、前記染色体#2の26394102~26396102番目の配列のCpG部位は、染色体#2の26395458番目に位置し、前記染色体#8の104510870~104513913番目の配列のCpG部位は、染色体#8の104512877番目に位置し、前記染色体#8の98289604~98290404番目の配列のCpG部位は、染色体#8の98290148番目に位置し、前記染色体#2の63281034~63281347番目の配列のCpG部位は、染色体#2の63281139番目に位置し、前記染色体#8の67873388~67875600番目の配列のCpG部位は、染色体#8の67874178番目に位置し、前記染色体#4の76555366~76556079番目の配列のCpG部位は、染色体#4の76555832番目に位置し、前記染色体#1の63782394~63790471番目の配列のCpG部位は、染色体#1の63789278番目に位置し、前記染色体#5の7849945~7850439番目の配列のCpG部位は、染色体#5の7850070番目に位置し、前記染色体#2の39186777~39187968番目の配列のCpG部位は、染色体#2の39187533番目に位置し、前記染色体#14の74207665~74208665番目の配列のCpG部位は、染色体#14の74208165番目に位置することができる。
【0021】
一実施例において、前記生物学的試料は、肝癌が疑われる患者または診断対象由来の組織、細胞、血液、血しょう、便および尿よりなる群から選ばれる1種でありうる。
【0022】
一実施例において、前記段階(b)は、PCR、メチル化特異PCR(methylation specific PCR)、リアルタイムメチル化特異PCR(real time methylation specific PCR)、MethyLight PCR、MehtyLight digital PCR、EpiTYPER、メチル化DNA特異的結合タンパク質を用いたPCR、定量PCR、DNAチップ、パイロシークエンシングおよびバイサルファイトシーケンシングよりなる群から選ばれる1種の方法で行われ得る。
【0023】
一実施例において、前記方法は、(c)前記メタル化レベルを正常対照群のメチル化レベルと比較する段階;をさらに含むことができる。
【0024】
本発明の他の態様によれば、染色体#2の25438725~25439276番目の配列、染色体#12の95941906~95942979番目の配列、染色体#10の134597357~134602649番目の配列、染色体#8の144649774~144651774番目の配列、染色体#1の47998899~47999517番目の配列、染色体#2の26394102~26396102番目の配列染色体#8の104510870~104513913番目の配列、染色体#8の98289604~98290404番目の配列、染色体#2の63281034~63281347番目の配列、染色体#8の67873388~67875600番目の配列、染色体#4の76555366~76556079番目の配列、染色体#1の63782394~63790471番目の配列、染色体#5の7849945~7850439番目の配列、染色体#2の39186777~39187968番目の配列、および染色体#14の74207665~74208665番目の配列よりなる群から選ばれるCpG部位に結合するプローブを含む肝癌発病危険度診断用キットが提供される。
【0025】
一実施例において、前記診断用キットは、前記CpG部位に結合する2以上のプローブを含むことができる。
【発明の効果】
【0026】
本発明の一態様によれば、癌と正常組織だけでなく、血液を含む多くの正常細胞と異なるメチル化レベルを示す特定CpG部位のメチル化を測定することによって、正常組織が混ざっている臨床検体を用いて肝癌の発病可能性を効果的に予測することができる。
【0027】
本発明の効果は、上記した効果に限定されるものではなく、本発明の詳細な説明または請求範囲に記載された発明の構成から推論可能なすべての効果を含むものと理解されなければならない。
【図面の簡単な説明】
【0028】
図1は、本発明の肝癌診断マーカー選定パイプラインを図式化したものである。
図2は、本発明の一実施例によるDNAメチル化データ標準化の前(左側)、後(右側)の肝癌患者の分布を示すグラフである。
図3は、本発明の一実施例による肝癌患者で過メチル化し、正常ヒトで低メチル化されたDMPs(Differentially methylated probes)のヒートマップである。
図4は、ヒートマップ(Heatmap)を通じて選別されたプローブに対する肝癌サンプル、肝正常サンプル、血液サンプルにおけるメチル化程度を示すヒートマップである。赤色であるほど過メチル化を示す。
図5は、機械学習を通じて選別した本発明の一実施例による診断マーカーを選別した結果である。
図6は、機械学習を通じて選別した本発明の一実施例による診断マーカーのメチル化程度を肝癌サンプル、肝正常サンプル、血液サンプルで確認したヒートマップである。
図7は、本発明の一実施例による単一プローブの肝癌診断効率を評価した結果である。プローブ別の肝癌診断効率をAUCで表示した。
図8は、Public DBであるTCGA(The Cancer Genome Atlas)の肝癌データで本発明の一実施例による単一プローブの肝癌診断効率を評価した結果である。プローブ別の肝癌診断効率をAUCで表示した。
図9は、本発明の一実施例によるプローブ(15種)の組合せによる診断効率を確認した結果である。
図10は、パイロシークエンシングを通じて本発明の一実施例によって選別されたプローブのメチル化程度を示すヒートマップである。X軸は、独立したコホート196人の肝癌およびこれに相当する肝正常サンプルを意味し、Y軸は、プローブ(黄色ボックス)およびプローブ付近のCpG部位(site)を意味する。
図11は、EpiTYPER実験を通じて本発明の一実施例によって選別されたプローブのメチル化程度を示すヒートマップである。X軸は、独立したコホート184人の肝癌およびこれに相当する肝正常サンプルを意味し、Y軸は、プローブ(黄色ボックス)およびプローブ付近のCpG部位(site)を意味する。
【発明を実施するための形態】
【0029】
以下では、添付の図面を参照して本発明を説明することとする。しかしながら、本発明は、様々な異なる形態に具現され得、したがって、ここで説明する実施例に限定されるものではない。
【0030】
任意の部分が或る構成要素を「含む」というとき、これは、特に反対になる記載がない限り、他の構成要素を除くものではなく、他の構成要素をさらに備えることができることを意味する。
【0031】
別途定義されない限り、分子生物学、微生物学、タンパク質精製、タンパク質工学、およびDNA配列分析および当業者の能力範囲内で組換えDNA分野において頻繁に使用される通常の技術によって行われ得る。前記技術は、当業者に知られており、多くの標準化された教材および参考書に記述されている。
【0032】
本明細書に別途定義されていなければ、使用されたすべての技術および科学用語は、当業界における通常の技術者が通常的に理解するもののような意味を有する。
【0033】
本明細書に含まれる用語を含む多様な科学的辞典がよく知られており、当業界において利用可能である。本明細書に説明されたものと類似または等価の任意の方法および物質が本願の実行または試験に使用されることが発見されるが、いくつかの方法および物質が説明されている。当業者が使用する脈絡によって、多様に使用され得るので、特定の法学、プロトコルおよび試薬に本発明が制限されるものではない。
【0034】
本明細書で使用されるもののように、単数型は、文脈が明確に別途指示しなければ、複数の対象を含む。また、別途指示されたことがなければ、核酸は、それぞれ左側から右側、5’から3’方向に書かれ、アミノ酸配列は、左側から右側、アミノからカルボキシル方向に書かれる。以下、本発明をさらに詳細に説明する。
【0035】
本発明の一態様によれば、1種以上CpG部位のメチル化レベルを測定する段階;を含む肝癌の予後または危険度を評価する方法が提供される。
【0036】
前記対象体(subject)は、診断対象としてヒトであってもよく、前記生物学的試料は、肝癌関連疾患の危険性を評価しようとする前記対象体から分離した試料であって、組織、細胞、血液、血しょう、腹膜液、滑膜液、唾液、尿、便などを含むが、これに制限されるものではない。好ましくは、前記生物学的試料は、血液であってもよく、具体的に血液から分離した血しょうであってもよい
【0037】
また、前記CpG部位のメチル化レベルを個別的に分析して、肝癌の予後または危険性の有無を診断することができるが、好ましくは2種以上、3種以上、または4種以上のCpG部位を同時に分析することによって、診断の正確性を向上させることができる。
【0038】
前記診断は、特定疾病または疾患に対する対象体の感受性(susceptibility)を判定するものであって、好ましくは、対象体が肝癌を現在有しているか否かを判定すること、肝癌にかかった対象体の予後(prognosis)を判定すること、またはテラメトリックス(therametrics)を含むことができる。
【0039】
前記「メチル化」は、DNAを構成する塩基にメチル基が付着することを意味する。好ましくは、メチル化の可否は、特定遺伝子の特定CpG部位のシトシンで起こるメチル化の可否を意味する。
【0040】
前記「メチル化状態」は、DNA塩基配列内での一つ以上のCpGジヌクレオチドの5-メチル-シトシンの存在または不在を意味する。前記「メチル化レベル」は、例えばすべてのゲノム領域および一部の非ゲノム領域内の標的DNAメチル化遺伝子のDNA塩基配列に存在するメチル化の量を意味する。
【0041】
前記メチル化レベルは、PCR、メチル化特異PCR(methylation specific PCR)、リアルタイムメチル化特異PCR(real time methylation specific PCR)、MethyLight PCR、MehtyLight digital PCR、EpiTYPER、メチル化DNA特異的結合タンパク質を用いたPCR、定量PCR、DNAチップ、パイロシークエンシングおよびバイサルファイトシーケンシングよりなる群から選ばれる1種の方法で行われ得るが、これに制限されるものではない。
【0042】
前記メチル化程度は、マイクロアレイにより識別され得る。前記マイクロアレイは、固相の表面に固定化されたプローブを用いることができる。前記プローブは、前記SNPを含む各遺伝子上の10~100個の連続ヌクレオチド配列に相補的な配列を含むことができる。
【0043】
前記CpG部位は、前記遺伝子のDNA上に存在するCpG部位を意味する。前記遺伝子のDNAは、発現するのに必要であり、互いに作動可能に連結されている一連の構成単位を全部含む概念であって、例えば、プロモーター領域、タンパク質コーディング領域(open reading frame,ORF)およびターミネーター領域を含む。
【0044】
したがって、前記遺伝子のCpG部位は、当該遺伝子のプロモーター領域、タンパク質コーディング領域(open reading frame,ORF)またはターミネーター領域などに存在しうる。好ましい例としては、前記遺伝子のプロモーター領域に存在するCpG部位でありうる。
【0045】
前記CpG部位は、染色体#2の25438725~25439276番目の配列、染色体#12の95941906~95942979番目の配列、染色体#10の134597357~134602649番目の配列、染色体#8の144649774~144651774番目の配列、染色体#1の47998899~47999517番目の配列、染色体#2の26394102~26396102番目の配列染色体#8の104510870~104513913番目の配列、染色体#8の98289604~98290404番目の配列、染色体#2の63281034~63281347番目の配列染色体#8の67873388~67875600番目の配列、染色体#4の76555366~76556079番目の配列、染色体#1の63782394~63790471番目の配列、染色体#5の7849945~7850439番目の配列、染色体#2の39186777~39187968番目の配列、染色体#14の74207665~74208665番目の配列よりなる群から選ばれる1種以上の塩基配列内に存在しうる。
【0046】
前記染色体#2の25438725~25439276番目の配列は、配列番号1の塩基配列を有し、前記染色体#12の95941906~95942979番目の配列は、配列番号2の塩基配列を有し、前記染色体#10の134597357~134602649番目の配列は、配列番号3の塩基配列を有し、前記染色体#8の144649774~144651774番目の配列は、配列番号4の塩基配列を有し、前記染色体#1の47998899~47999517番目の配列は、配列番号5の塩基配列を有し、前記染色体#2の26394102~26396102番目の配列は、配列番号6の塩基配列を有し、前記染色体#8の104510870~104513913番目の配列は、配列番号7の塩基配列を有し、前記染色体#8の98289604~98290404番目の配列は、配列番号8の塩基配列を有し、前記染色体#2の63281034~63281347番目の配列は、配列番号9の塩基配列を有し、前記染色体#8の67873388~67875600番目の配列は、配列番号10の塩基配列を有し、前記染色体#4の76555366~76556079番目の配列は、配列番号11の塩基配列を有し、前記染色体#1の63782394~63790471番目の配列は、配列番号12の塩基配列を有し、前記染色体#5の7849945~7850439番目の配列は、配列番号13の塩基配列を有し、前記染色体#2の39186777~39187968番目の配列は、配列番号14の塩基配列を有し、前記染色体#14の74207665~74208665番目の配列は、配列番号15の塩基配列を有しうる。
【0047】
前記染色体#2の25438725~25439276番目の配列のCpG部位は、染色体#2の25439110番目に位置し、前記染色体#12の95941906~95942979番目の配列のCpG部位は、染色体#12の95941988番目に位置し、前記染色体#10の134597357~134602649番目の配列のCpG部位は、染色体#10の134599823番目に位置し、前記染色体#8の144649774~144651774番目の配列のCpG部位は、染色体#8の144651002番目に位置し、前記染色体#1の47998899~47999517番目の配列のCpG部位は、染色体#1の47999163番目に位置し、前記染色体#2の26394102~26396102番目の配列のCpG部位は、染色体#2の26395458番目に位置し、前記染色体#8の104510870~104513913番目の配列のCpG部位は、染色体#8の104512877番目に位置し、前記染色体#8の98289604~98290404番目の配列のCpG部位は、染色体#8の98290148番目に位置し、前記染色体#2の63281034~63281347番目の配列のCpG部位は、染色体#2の63281139番目に位置し、前記染色体#8の67873388~67875600番目の配列のCpG部位は、染色体#8の67874178番目に位置し、前記染色体#4の76555366~76556079番目の配列のCpG部位は、染色体#4の76555832番目に位置し、前記染色体#1の63782394~63790471番目の配列のCpG部位は、染色体#1の63789278番目に位置し、前記染色体#5の7849945~7850439番目の配列のCpG部位は、染色体#5の7850070番目に位置し、前記染色体#2の39186777~39187968番目の配列のCpG部位は、染色体#2の39187533番目に位置し、前記染色体#14の74207665~74208665番目の配列のCpG部位は、染色体#14の74208165番目に位置することができる。
【0048】
本発明の他の態様によれば、染色体#2の25438725~25439276番目の配列、染色体#12の95941906~95942979番目の配列、染色体#10の134597357~134602649番目の配列、染色体#8の144649774~144651774番目の配列、染色体#1の47998899~47999517番目の配列、染色体#2の26394102~26396102番目の配列染色体#8の104510870~104513913番目の配列、染色体#8の98289604~98290404番目の配列、染色体#2の63281034~63281347番目の配列、染色体#8の67873388~67875600番目の配列、染色体#4の76555366~76556079番目の配列、染色体#1の63782394~63790471番目の配列、染色体#5の7849945~7850439番目の配列、染色体#2の39186777~39187968番目の配列、および染色体#14の74207665~74208665番目の配列よりなる群から選ばれるCpG部位に結合するプローブを含む肝癌発病危険度診断用キットが提供される。
【0049】
前記プローブは、ハイブリダイゼーションアレイ要素(hybridizable array element)として用いられ、基体(substrate)上に固定化され得る。
【0050】
前記基体は、適切な堅固性または半堅固性支持体であって、例えば、膜、フィルター、チップ、スライド、ウェハー、ファイバー、磁性ビーズまたは非磁性ビーズ、ゲル、チュービング、プレート、高分子、微小粒子および毛細管を含むことができる。前記ハイブリダイゼーションアレイ要素は、前記の基体上に配列され、固定化され得る。
【0051】
前記固定化は、化学的結合方法またはUVのような共有結合的方法により実施され得る。例えば、前記ハイブリダイゼーションアレイ要素は、エポキシ化合物またはアルデヒド基を含むように変形されたガラスの表面に結合され得、ポリリジンコーティングの表面でUVにより結合されることもできる。また、前記ハイブリダイゼーションアレイ要素は、リンカー(例:エチレングリコールオリゴマーおよびジアミン)を介して基体に結合され得る。
【0052】
前記マイクロアレイに適用される試料DNAは、標識(labeling)され得、マイクロアレイ上のアレイ要素とハイブリダイゼーションされ得る。ハイブリダイゼーション条件は、多様に変更することができ、ハイブリダイゼーション程度の検出および分析は、標識物質によって多様に実施されることもできる。
【0053】
前記プローブの標識は、ハイブリダイゼーションの可否を検出するシグナルを提供することができ、オリゴヌクレオチドに連結され得る。
【0054】
前記標識は、蛍光団(例えば、フルオレセイン(fluorescein)、フィコエリトリン(phycoerythrin)、ローダミン、リサミン(lissamine)、そしてCy3とCy5(Pharmacia))、発色団、化学発光団、磁気粒子、放射性同位元素(P32およびS35)、マス標識、電子密集粒子、酵素(アルカリンホスファターゼまたはホースラディッシュペルオキシダーゼ)、補因子、酵素に対する基質、重金属(例えば、金)、そして抗体、ストレプトアビジン、ビオチン、ジゴキシゲニンとキレート基のような特定の結合パートナーを有するヘプテンを含むことができが、これに限定されるものではない。
【0055】
前記標識は、当業界において通常的に実施される多様な方法、例えば、ニックトランスレーション(nick translation)方法、無作為プライミング方法(Multiprime DNA labelling systems booklet,“Amersham”(1989))およびカイネーション方法(Maxam & Gilbert,Methodsin Enzymology,65:499(1986))によりラベリングされ得る。
【0056】
前記標識は、蛍光、放射能、発色測定、重量測定、X線回折または吸収、磁気、酵素的活性、マス分析、結合親和度、ハイブリダイゼーション高周波、ナノクリスタルにより検出できるシグナルを提供することができる。
【0057】
前記分析対象となる核酸試料は、多様な生試料(biosamples)から得られたmRNAを用いて製造することができる。前記プローブの代わりに分析対象となるcDNAを標識してハイブリダイゼーション反応-基礎分析を実施することもできる。
【0058】
前記プローブを用いる場合、プローブをcDNA分子とハイブリダイゼーションさせることができる。前記適切なハイブリダイゼーション条件は、最適化手続により一連の過程で決定され得る。前記手続は、研究室での使用のためのプロトコルを樹立するために、当業者により一連の過程で実施され得る。
【0059】
例えば、温度、成分の濃度、ハイブリダイゼーションおよび洗浄時間、緩衝液成分およびこれらのpHおよびイオン強さなどの条件は、プローブの長さおよびGC量およびターゲットヌクレオチド配列などの多様な因子に依存する。前記ハイブリダイゼーションのための詳細な条件は、Joseph Sambrook,et al.,MolecularCloning,A LaboratoryManual,Cold Spring Harbor Laboratory Press,Cold Spring Harbor,N.Y.(2001);およびM.L.M.Anderson,NucleicAcid Hybridization,Springer-Verlag New York Inc.N.Y.(1999)を参照することができる。
【0060】
例えば、前記厳格条件のうち高厳格条件は、0.5MのNaHPO4、7%SDS(sodium dodecyl sulfate)、1mMのEDTAで65℃の条件でハイブリダイゼーションし、0.1xSSC(standard saline citrate)/0.1%SDSで68℃の条件で洗浄することを意味する。または、前記高厳格条件は、6xSSC/0.05%ピロリン酸ナトリウムで48℃の条件で洗浄することを意味し、低厳格条件は、0.2xSSC/0.1%SDSで42℃の条件で洗浄することを意味する。
【0061】
前記ハイブリダイゼーション反応後に、ハイブリダイゼーション反応を通じて出るハイブリダイゼーションシグナルを検出することができる。例えば、前記プローブが酵素により標識された場合、前記酵素の基質をハイブリダイゼーション反応結果物と反応させてハイブリダイゼーションの可否を確認することができる。
【0062】
前記酵素および基質は、パーオキシダーゼ(例えば、ホースラディッシュパーオキシダーゼ)とクロロナフト―ル、アミノエチルカルバゾール、ジアミノベンジジン、D-ルシフェリン、ルシゲニン(ビス-N-メチルアクリジニウムニトレート)、レゾルフィンンベンジルエーテル、ルミノール、アンプレックスレッド試薬(10-アセチル-3,7-ジヒドロキシフェノキサジン)、HYR(p-phenylenediamine-HClおよびpyrocatechol)、TMB(tetramethylbenzidine)、ABTS(2,2’-Azine-di[-ethylbenzthiazoline sulfonate])、o-フェニレンジアミン(OPD)およびナフトール/ピロニン;アルカリンホスファターゼとブロモクロロインドリルホスフェート(BCIP)、ニトロブルーテトラゾリウム(NBT)、ナフトール-AS-B1-ホスフェート(naphthol-AS-B1-phosphate)およびECF基質;グルコースオキシダーゼとt-NBT(nitroblue tetrazolium)およびm-PMS(phenzaine methosulfate)が使用され得る。
【0063】
前記プローブが金粒子で標識された場合には、硝酸銀を用いて銀染色方法で検出することもできる。
【0064】
前記肝癌の予後または危険度を評価する方法は、多様な統計処理方法を通じて肝癌診断の可能性を評価することができる。統計的処理方法として一具現例において機械学習(Machine learning)方法が使用され、Maxwell W.Libbrecht,2015,Nature Reviews Genetics 16:321-332を参照することができる。
【0065】
前記マシンラーニングは、人工知能の一分野であって、パターン認識とコンピュータ学習理論の研究から進化した分野である。マシンラーニングは、経験的データをベースに学習をし、予測を行い、自らの性能を向上させるシステムとこのためのアルゴリズムを研究し構築する技術である。マシンラーニングのアルゴリズムは、厳格に定められた静的なプログラム命令を行うことというより、入力データをベースに予測や決定を導き出すために特定のモデルを構築する方式である。
【0066】
以下、実施例を通じて本発明をさらに詳細に記述する。
【0067】
実施例1.肝癌発病に関連したDMP選定
サンプル
肝癌発病に関連したDNAメチル化地域を選別するために、ソウル大病院の肝癌患者184人から肝癌サンプルを得た。肝癌組織と相当する正常組織は、正常対照群として使用した。
【0068】
カラム基盤のDNA抽出方法(PureLinkTM Genomic DNA Mini Kit,Invitrogen)とビーズ(Bead)方式のDNA抽出方法(MagListoTM 5M Genomic DNA Extraction Kit,Bioneer)を用いてそれぞれのサンプルからgenomic DNAを抽出した。抽出されたgenomic DNAは、nanodropを用いて定量し、DNA状態は、1.5%アガロースゲルで電気泳動して、degradationの有無を確認した。
【0069】
バイサルファイト(Bisulfite)処理
Genomic DNAにバイサルファイト(Bisulfite)を処理すると、DNA塩基配列のうち5’-CpG-3’部位のシトシンがメチル化された場合には、そのまま維持されるが、非メチル化された場合には、ウラシルに変わってメチル化程度を測定することができる。
【0070】
したがって、メチル化されたシトシンと非メチル化されたシトシンを区別するために、genomic DNAをバイサルファイトで処理した。700ngのgenomic DNAをEZ DNA Methylation Kit(Zymoresearch Inc.)を用いて製造メーカーのマニュアルによって処理し、このように作られたバイサルファイト処理されたDNAをM-Elution Bufferで溶かして使用時まで-80℃で保管した。
【0071】
バイサルファイト処理されたDNAは、1ヶ月以内に使用した。
【0072】
DNAメチル化マイクロアレイ
Infinium((登録商標)Human Methylation 850K BeadChip)を使用して、DNAメチル化マイクロアレイを行った。
【0073】
Illumina Infinium MethylationEPIC BeadChip kits(Illumina,Inc.,San Diego,CA)を用いて製造メーカーのマニュアルによって、バイサルファイト処理されたDNAを増幅し、切断(fragmentation)、沈殿(precipitation)および再懸濁(resuspension)した後、BeadChipにハイブリダイゼーション(hybridization)した。
【0074】
洗浄後、BeadChipをIllumina iScan scannerを用いてスキャンした。
【0075】
Rパッケージのうち、minfiパッケージを用いてパッケージのマニュアルによってデータの品質管理(quality control)を行った。品質管理基準を通過したサンプルに限ってメチル化程度が色で表示された生データ(raw data)のidatファイルを数値化した値であるβ値を計算した。
【0076】
DNAメチル化程度は、0~1の値を有するβ値で表示され、β値0は、当該CpG部位が完全に非メチル化されたことを意味し、1は、完全にメチル化されたことを意味する。算出された結果を標準化し、補正した。すべての統計は、R統計環境(v.3.3.2以上)で行われた(
図1)。
【0077】
実施例2.診断マーカー候補群の選定
図1を参照すると、182人の肝癌およびこれに相当する肝正常サンプルからDNAを抽出して、Infinium Methylation EPIC BeadChipを行った。
【0078】
自体的に構築したパイプラインでメチル化データ(methylation data)を分析した。正常(normal)でメチル化が低く、腫瘍(tumor)でメチル化レベルが高いプローブ(probe)を選定した。
【0079】
まず、正常と癌サンプルのメチル化の差異を示すDMPを選定した。
【0080】
正常サンプルでメチル化レベルが非常に低く、70%以上の癌患者でメチル化が50%以上と非常に高い7個のプローブを選別し、機械学習方法で効率を検証した(
図1、藍色)。
【0081】
正常サンプルでは、メチル化(methylation)が10%以下と非常に低く、肝癌患者で平均的に30%以上と高いプローブを選別し、機械学習を行って、肝癌/肝正常サンプルを効果的に区分する上位9個のプローブを選別した(
図1、茶色)。
【0082】
最終的に選別された15個(1個重複)の肝癌診断マーカー候補群を多様な実験を通じて検証した。
【0083】
実施例3.ヒートマップ(Heatmap)を通したプローブ選別
182肝癌サンプルおよび127正常サンプルのDNAメチル化を調査した結果、5%以上の肝癌サンプルで30%以上過メチル化された100,053DMP(differentially methylated probes)を選別した。
【0084】
正常/癌サンプル間の差異を示すDMPの中で血液生検が可能となるように正常サンプルでメチル化(methylation)が10%以下と非常に低い13,078プローブを選別した。
【0085】
選別されたプローブのうち70%以上の癌患者で50%以上過メチル化された7個のプローブを選別した(表1)。
【0086】
【0087】
選定された7個のプローブの肝癌患者のメチル化値を確認したヒートマップを作成した(
図4)。
【0088】
実施例4.機械学習を通したプローブ選別
正常/癌サンプル間の差異を示すDMPのうち正常サンプルでメチル化レベルが非常に低く、肝癌患者で平均的に30%以上高いプローブを選別した。
【0089】
前記プローブを用いて機械学習を行って、肝癌/肝正常サンプルを効果的に区分する上位9個のプローブを選別した。
【0090】
図5を参照すると、青色円は、一つのプローブを意味し、重要度が高い順(x、y軸)に上位9個のプローブを選別した。
【0091】
X軸は、機械学習で構築されたモデルで各プローブの正確度を意味し、Y軸は、機械学習で構築されたモデルで各プローブの純粋度を意味する。
【0092】
機械学習で選別された9個のプローブのメチル化程度を200人の全血(whole blood)、125人の正常サンプル、180人の肝癌サンプルでメチル化値を確認したヒートマップを作成した(
図6)。
【0093】
実施例4および5の方法を通じて最終的に選別された15個のプローブ情報は、下記表2の通りである。
【0094】
【0095】
実施例5.単一プローブ肝癌診断効率の評価
選別された15個のプローブの肝癌診断効率を評価した(
図7)。
【0096】
図7は、各プローブの肝癌診断効率をAUCで表示した結果である。
【0097】
15個のプローブを単独で使用して肝癌診断効率(AUC;area under the curve)を確認した結果は、下記表3の通りである。
【0098】
【0099】
また、Public DBで単一プローブの肝癌診断効率を検証した(
図8)。
図8は、各プローブの肝癌診断効率をAUCで表示した結果である。
【0100】
TCGA LIHC methylation data(450K)を用いて単一プローブの効率を検証した結果は、下記表4の通りである。
【0101】
灰色(-)で表示された領域は、Infinium Methylation 450K BeadChipにはなく、Infinium Methylation EPIC BeadChip(850K)にのみあるプローブを意味する。
【0102】
【0103】
また、15個のパネルプローブの肝癌診断効率を分析するために、15個のプローブを統合して肝癌診断効率(AUC;area under the curve)を確認した(
図9)。
図9は、15個のプローブで機械学習を行って出た訓練データおよび検証データの混同行列(Confusion Matrix)結果である(2次交差検証)。
【0104】
データの偏向を防止するために、無作為で2個に分ける2次交差検証方法を10回ずつ行って、テストセット(Testing set)とトレーニングセット(Training set)に分類した。
【0105】
トレーニングセットに分類されたデータをベースに正常と肝癌のパターンを学習し、それによる肝癌特異的診断モデルを構築した。
【0106】
下記表5は、トレーニングセットの誤差行列である。
【0107】
【0108】
前記トレーニングセットで構築された肝癌特異的診断モデルをベースにテストセットを診断して、肝癌診断効率を確認した(表6)。
【0109】
【0110】
表5および表6を参照すると、マシンラーニングをベースに選定された15個のプローブで肝癌特異的診断モデルを構築することができ、診断効率は、非常に高いレベルと評価された。
【0111】
実施例6.複数のプローブを用いた肝癌診断効率の評価
前記肝癌特異的診断モデルをベースに15個のプローブのうち最大効率を有する最小のプローブ個数を探すために、プローブの個数による効率を測定した(
図9)。
【0112】
図9は、可能なプローブ組合せに対して機械学習を進めて算出された結果である(2次交差検証)。X軸は、プローブ個数を意味し、Y軸は、AUC(診断効率)を意味する。
【0113】
図9を参照すると、プローブ個数が3個以上であるとき、診断効率が99%以上に収束するので、非常に正確な診断情報を提供することができる。
【0114】
したがって、単一のプローブを用いるときと比較して、複数のプローブを用いるとき、診断の正確度が顕著に改善され得る。
【0115】
実施例7.パイロシークエンシングを通したプローブを含むCpGアイランドのメチル化分析
選別されたプローブのうちプローブが結合されるCpG部位のメチル化程度を測定するために、パイロシークエンシングを実施した。
【0116】
パイロシークエンシングは、ヌクレオチド添加で放出されたピロホスフェート(PPi)を用いる。PPiは、ATPスルフリラーゼによりアデノシン5’ホスホサルフェートの存在下でATPに変換される。
【0117】
ルシフェラーゼは、ATPを使用してルシフェリンをオキシルシフェリンに変換し、この反応は、探知され、分析され得る光を生成する。
【0118】
選定されたプローブのCpG部位のメチル化程度をヒートマップで示した(
図10)。
【0119】
確認結果、正常(normal)でメチル化レベルが低く、腫瘍(tumor)ではメチル化レベルが高いことが示され、選別されたプローブのCpG部位とその周辺のメチル化程度が類似していることが確認された。
【0120】
実施例8.EpiTYPERを通したプローブを含むCpGアイランドのメチル化分析
データの検証のために、プローブのうち上位3個のプローブのメチル化状態をEpiTYPERTM assay(Sequenom,San Diego,CA)を用いて定量的に分析した。
【0121】
PCR増幅後に、試験管内で転写させた増幅断片(amplicons)をshrimp alkaline phosphataseで処理し、RNaseAで切断した後、メチル化状態を決定するために、MALDI-TOF Mass Spectrometryに入れた。
【0122】
結果は、EpiTYPERTM ver.1.0 softwareを用いて分析した。
【0123】
選定された3個のプローブに対してEpiTYPERでバリデーション(validation)を行った。選定されたプローブとその周辺のCpG部位のメチル化程度は、ヒートマップで確認した(
図11)。
【0124】
図11を参照すると、正常(normal)でメチル化レベルが低く、腫瘍(tumor)ではメチル化レベルが高いことが示され、選別されたプローブのCpG部位とその周辺のメチル化程度が類似していることが確認された。
【0125】
したがって、CpGプローブを含むCpGアイランド全体のメチル化レベルも、癌予後および危険度の診断に同一に使用され得る。
【0126】
前述した本発明の説明は、例示のためのものであり、本発明の属する技術分野における通常の知識を有する者は、本発明の技術的思想や必須の特徴を変更することなく、他の具体的な形態に容易に変形が可能であることを理解することができる。したがって、以上で記述した実施例は、すべての面において例示的なものであり、限定的でないものと理解しなければならない。例えば、単一型と説明されている各構成要素は、分散して実施されることもでき、同様に、分散したものと説明されている構成要素も、結合された形態に実施され得る。
【0127】
本発明の範囲は、後述する請求範囲によって示され、請求範囲の意味および範囲、そしてその均等概念から導き出されるすべての変更または変形された形態が本発明の範囲に含まれるものと解すべきである。
【配列表】