(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023029945
(43)【公開日】2023-03-07
(54)【発明の名称】癌のエピジェネティックプロファイリング
(51)【国際特許分類】
C12Q 1/6869 20180101AFI20230228BHJP
C12N 15/11 20060101ALI20230228BHJP
C12Q 1/68 20180101ALI20230228BHJP
【FI】
C12Q1/6869 Z ZNA
C12N15/11 Z
C12Q1/68
【審査請求】有
【請求項の数】34
【出願形態】OL
【外国語出願】
(21)【出願番号】P 2022193109
(22)【出願日】2022-12-01
(62)【分割の表示】P 2018543192の分割
【原出願日】2017-02-16
(31)【優先権主張番号】10201601141X
(32)【優先日】2016-02-16
(33)【優先権主張国・地域又は機関】SG
(31)【優先権主張番号】10201606828P
(32)【優先日】2016-08-16
(33)【優先権主張国・地域又は機関】SG
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.TWEEN
(71)【出願人】
【識別番号】504354117
【氏名又は名称】エイジェンシー・フォー・サイエンス,テクノロジー・アンド・リサーチ
(74)【代理人】
【識別番号】100116872
【弁理士】
【氏名又は名称】藤田 和子
(72)【発明者】
【氏名】タン パトリック
(72)【発明者】
【氏名】オオイ ウェン フォン
(57)【要約】 (修正有)
【課題】癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法を提供する。
【解決手段】非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法であって、癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップとを備える、方法である。
【選択図】なし
【特許請求の範囲】
【請求項1】
非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの存在または非存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える方法。
【請求項2】
前記癌および非癌生体試料は、単一の細胞、複数の細胞、細胞のフラグメント、体液または組織を備える、請求項1に記載の方法。
【請求項3】
前記癌および非癌生体試料は、同じ被験者から得られる、請求項1~2のいずれか一項に記載の方法。
【請求項4】
前記癌および非癌生体試料は、各々が異なる被験者から得られる、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記核酸は、クロマチンの免疫沈降によって前記癌生体試料から単離される、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記少なくとも1つのスーパーエンハンサーの前記シグナル強度は、前記ヒストン修飾H3K27acのReads Per Kilobase of transcript per Million(RPKM:100万当たり、トランスクリプトのキロベース当たりのリード)値に基づく、請求項1~5のいずれか一項に記載の方法。
【請求項7】
前記少なくとも1つの参照核酸配列は、少なくとも1つの癌細胞株から得られる、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記癌生体試料における前記少なくとも1つのスーパーエンハンサーは、ROSE(Ranking of Super Enhancer)アルゴリズムを用いて同定される、請求項1~7のいずれか一項に記載の方法。
【請求項9】
前記癌生体試料における前記少なくとも1つのスーパーエンハンサーは、前記少なくとも1つの参照核酸配列中の前記少なくとも1つのエンハンサーと重複する少なくとも1つの核酸塩基対を備える、請求項8に記載の方法。
【請求項10】
前記少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーに対する前記RPKM値が、
i)前記非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの前記RPKM値と比較して、RPKM値における2より大きい倍率変化、および
ii)前記非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの前記RPKM値と比較して、0.5RPKMより大きい絶対値差分
であることを判定するステップを備える、請求項6に記載の方法。
【請求項11】
前記非癌生体試料の前記RPKM値と比較して、前記癌生体試料からのRPKM値における増加は、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの存在を示す、請求項10に記載の方法。
【請求項12】
前記非癌生体試料の前記RPKM値と比較して、前記癌生体試料からのRPKM値における減少は、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの非存在を示す、請求項10に記載の方法。
【請求項13】
前記少なくとも1つのスーパーエンハンサーは、遺伝子転写開始点に対して1000kb以内に配置される、請求項1~12のいずれか1項に記載の方法。
【請求項14】
前記遺伝子は、癌関連遺伝子、血管新生遺伝子、細胞増殖遺伝子、細胞浸潤遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞死抵抗性遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの1つ以上である、請求項13に記載の方法。
【請求項15】
前記遺伝子は、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択される、請求項13に記載の方法。
【請求項16】
前記癌生体試料は、胃癌である、請求項1~15のいずれか一項に記載の方法。
【請求項17】
被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
a)前記被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、前記非癌生体試料と比較して、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法。
【請求項18】
被験者における癌を検出するためのバイオマーカーであって、前記バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、バイオマーカー。
【請求項19】
前記癌関連転写因子結合部位は、胃癌関連転写因子結合部位である、請求項18に記載のバイオマーカー。
【請求項20】
前記胃癌関連転写因子は、CDX2、KLF5およびHNF4αからなる群から選択される、請求項19に記載のバイオマーカー。
【請求項21】
被験者における癌の予後を判定するための方法であって、
a)前記被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、前記非癌生体試料と比較して、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、前記被験者における前記癌の予後を示す、方法。
【請求項22】
前記癌生体試料における前記少なくとも1つの癌関連スーパーエンハンサーの存在は、被験者における癌生存の予後不良を示す、請求項21に記載の方法。
【請求項23】
前記癌生体試料における前記少なくとも1つの癌関連スーパーエンハンサーの非存在は、被験者における癌生存の予後改善を示す、請求項21に記載の方法。
【請求項24】
前記少なくとも1つの癌関連スーパーエンハンサーは、細胞浸潤遺伝子、血管新生遺伝子または細胞死抵抗性遺伝子、癌関連遺伝子、細胞増殖遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの1つ以上と関連付けられる、請求項21に記載の方法。
【請求項25】
前記少なくとも1つの癌関連スーパーエンハンサーは、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択された遺伝子と関連付けられる、請求項21に記載の方法。
【請求項26】
癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
a)前記被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を対照生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)前記少なくとも1つのスーパーエンハンサーの存在または非存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)前記少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップとを備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた前記少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法。
【請求項27】
細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための方法であって、CDX2および/またはHNF4αの阻害薬を前記細胞に投与するステップを備える、方法。
【請求項28】
CDX2および/またはHNF4αの前記阻害薬は、siRNAである、請求項27に記載の方法。
【請求項29】
前記阻害薬は、メトホルミンである、請求項27に記載の方法。
【請求項30】
正常非癌生体試料と比較して、癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカー。
【請求項31】
正常非癌生体試料と比較して、癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用。
【請求項32】
細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのCDX2および/またはHNF4αの阻害薬。
【請求項33】
細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるCDX2および/またはHNF4αの阻害薬の使用。
【請求項34】
被験者から得られた癌生体試料における癌細胞生存期間または癌細胞生存率を予測する方法であって、
a)前記癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)前記癌生体試料から核酸を単離するステップであって、前記単離された核酸は、前記ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、前記単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーを前記ヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、前記少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、前記マッピングするステップと、
d)前記癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、前記単離された核酸中の前記少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの前記シグナル強度を非癌生体試料から得られた前記少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を前記少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、前記非癌生体試料と比較して、前記癌生体試料における前記少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
この出願は、シンガポール出願第10201601141X号、2016年2月16日出願およびシンガポール出願第10201606828P号、2016年8月16日出願の優先権の利益を主張し、これらの内容は、すべての目的で参照によりその全体が本明細書に組み込まれる。
【0002】
技術分野
本発明は、癌、特に、癌における調節エレメントに関する。
【背景技術】
【0003】
異常な遺伝子発現パターンは、増殖、浸潤および転移のような臨床的に重要な形質を生じさせるヒト悪性腫瘍の普遍的なホールマークである。体細胞変異、コピー数変化、および構造多型を含むDNA配列ベースの変化は、シグナリング分子および転写因子(TF:transcription factor)の活性および発現を変化させることによって癌トランスクリプトームを再プログラムする能力を有する。タンパク質コード遺伝子に加えて、非コード・ゲノム領域におけるシス調節エレメント、例えば、エンハンサーもTFアクセシビリティを促進または制限することによって転写プログラムに影響を及ぼすことができる。
【0004】
エンハンサーは、プロモーターおよび転写開始点(TSS:transcription start site)より遠位に局在化された調節エレメントである。エンハンサーは、ヒトゲノムのうちの10~15%を占め、遠い距離(>1Mb)にある1つ以上の遺伝子を調節することによって細胞アイデンティティーおよび組織特異的な発現に重要な役割を果たすことが示された。エンハンサーは、ヒト疾患において重要な役割を果たし、それらの重要性は、異なる細胞タイプおよび病状におけるエンハンサーのカタログに対するニーズを高める。癌における調節エレメントをプロファイリングするための研究が存在したが、現在までのこれらの研究の大部分は、インビトロで培養された癌細胞株に依存し、2つの限界を有する。第1に、インビトロの細胞株は、継代の繰り返し後に実質的なエピゲノム変化を経験することが知られている。第2に、多くの癌細胞株では、対応する(matched)正常カウンターパートがしばしば入手できず、真の体細胞変化を同定する能力を複雑化させる。従って、上記の不利点の1つ以上を克服または少なくとも寛解する癌における調節エレメントをプロファイリングする方法が必要である。
【発明の概要】
【課題を解決するための手段】
【0005】
一態様において、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える、方法が提供される。
【0006】
一態様において、被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。
【0007】
一態様において、被験者における癌を検出するためのバイオマーカーであって、バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、バイオマーカーが提供される。
【0008】
一態様において、被験者における癌の予後を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。
【0009】
一態様において、癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
a)被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップと
を備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。
【0010】
一態様において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための方法であって、CDX2および/またはHNF4αの阻害薬を細胞へ投与するステップを備える、方法が提供される。
【0011】
一態様において、正常非癌生体試料と比較して、癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカーが提供される。
【0012】
一態様において、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用が提供される。
【0013】
一態様において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのCDX2および/またはHNF4αの阻害薬が提供される。
【0014】
一態様において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるCDX2および/またはHNF4αの阻害薬の使用が提供される。
【0015】
一態様において、被験者から得られた癌生体試料における癌細胞生存期間または癌細胞生存率を予測する方法であって、
a)癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法が提供される。
【0016】
定義
本明細書に用いられる以下の単語および用語は、示された意味を有するものとする。
【0017】
用語「スーパーエンハンサー」は、互いに近接して発生するDNAエンハンサーエレメントのクラスターを指す。DNAエンハンサーエレメントは、エフェクター遺伝子発現プログラムを調節するために多様な細胞およびシグナル伝達入力を統合することが可能なDNAの領域である。典型的なエンハンサーと比較して、スーパーエンハンサーは、サイズが大きくてよく、高い転写因子結合密度を示してよく、遺伝子座調節領域(LCR:locus control region)、DNAメチル化バレー(methylation valley)、転写開始プラットフォームおよび伸長エンハンサー(stretch enhancer)と同様に、主要な細胞アイデンティティー・レギュレーターとさらに強く関連付けられうる。スーパーエンハンサーは、疾患関連遺伝子変異体に濃縮されてもよく、癌細胞によって主要な癌遺伝子中に獲得されてよく、治療上の擾乱に対してさらに感受性がありうる。
【0018】
用語「ヒストン修飾」は、ヒストンタンパク質の共有結合修飾を指す。ヒストン修飾は、メチル化、リン酸化、アセチル化、ユビキチン化およびSUMO化を含むが、それらには限定されない。ヒストンの修飾は、クロマチン構造を変化させて、遺伝子発現に影響を及ぼしうる。ヒストンの修飾は、1つ以上のヒストン中の1つ以上のアミノ酸において発生しうると一般に理解されている。
【0019】
用語「アノテートされたゲノム配列」は、コードおよび非コード領域、調節領域またはモチーフ、転写開始点および遺伝子を含むがそれらには限定されない情報が同定されたゲノム配列を指す。用語「アノテートされた転写開始点」は、同定された転写開始点を指す。
【0020】
用語「参照」、「対照」または「標準」は、本明細書では比較が行われうる試料または被験者を指す。「参照」、「対照」または「標準」の例は、同じ被験者から得られた非癌試料、非転移腫瘍から得られた試料、癌を有さない被験者から得られた試料、または異なる癌サブタイプを有する被験者から得られた試料を含む。用語「参照」、「対照」または「標準」は、本明細書ではクロマチン修飾の平均シグナル強度も指してよい。用語「参照」、「対照」または「標準」は、本明細書では癌を患っていない被験者、または異なるタイプの癌を患う被験者も指してよい。用語「参照」、「対照」または「標準」は、本明細書では比較が行われうる核酸配列も指してよい。例えば、参照もしくは対照または標準は、トランスフェクトされない細胞であってもよい。
【0021】
用語「癌の(cancerous)」は、本明細書では癌特有の異常によって影響されるかまたはそれらの異常を示すことに関する。
【0022】
用語「抗体」または「複数の抗体」は、本明細書では免疫グロブリンのようなドメインをもつ分子を指し、抗原結合フラグメント、モノクロナール、リコンビナント、ポリクローナル、キメラ、完全ヒト、ヒト化、二重特異性、およびヘテロ共役抗体;単一可変ドメイン、単一鎖Fv、ドメイン抗体、免疫学的に効果的なフラグメントおよび二重特異性抗体を含む。
【0023】
用語「単離された(isolated)」または「単離する(isolating)」は、本明細書では、構成要素がその中で天然に発生する生物の細胞における他の生体構成要素、すなわち、他の染色体および染色体外DNAおよびRNA、タンパク質ならびに細胞小器官から実質的に分離または精製された生体構成要素(例えば、核酸分子、タンパク質または細胞小器官)に関する。「単離された」核酸およびタンパク質は、標準的な精製方法によって精製された核酸およびタンパク質を含む。この用語は、宿主細胞における組み換え発現によって調製された核酸およびタンパク質ならびに化学的に合成された核酸も包含する。
【0024】
用語「核酸」は、本明細書では、一本鎖または二重鎖のいずれかの形態におけるデオキシリボヌクレオチドまたはリボヌクレオチドポリマーを指し、別に限定されない限り、天然に発生するヌクレオチドと同様の仕方で核酸へハイブリダイズする、天然ヌクレオチドの既知の類似体を包含する。「ヌクレオチド」は、以下には限定されないが、ピリミジン、プリンもしくはそれらの合成類似体のような、糖に連結された塩基、またはペプチド核酸(PNA:peptide nucleic acid)におけるように、アミノ酸に連結された塩基を含むモノマーを含む。ヌクレオチドは、ポリヌクレオチドにおける1つのモノマーである。ヌクレオチド配列は、ポリヌクレオチドにおける塩基の配列を指す。
【0025】
用語「バイオマーカー」は、本明細書では、生物学的状態または状況の指標を指す。
【0026】
用語「試料」または「生体試料」は、本明細書では、被験者から得られた、被験者から除去もしくは単離された1つ以上の細胞、細胞のフラグメント、組織または流体を指す。用語「から得られるまたは由来する(obtained or deprived from)」は、本明細書では、包含的に用いられることを意味する。すなわち、生体試料から直接に単離されたいずれかのヌクレオチド配列または試料に由来するいずれかのヌクレオチド配列を包含することが意図される。試料の例は、腫瘍組織バイオプシーである。試料は、凍結新鮮組織、パラフィン包埋組織、またはホルマリン固定パラフィン包埋組織(FFPE:formalin fixed paraffin embedded tissue)であってもよい。生体試料または流体試料の例は、以下には限定されないが、血液、糞便、血清、唾液、尿、脳脊髄液および骨髄液を含む。
【0027】
用語「予後」、またはその文法的変異形は、本明細書では、臨床状態または疾患の確からしい経過およびアウトカムの予測を指す。患者の予後は、通常、疾患の好ましい、もしくは好ましくない経過またはアウトカムを示す疾患の要因または症状を評価することによって行われる。用語「予後」は、状態の経過またはアウトカムを100%の精度で予測する能力を指すものではない。その代わりに、用語「予後」は、ある特定の経過またはアウトカムが発生するであろう確率、すなわち、所与の状態を示す患者にある経過またはアウトカムが生じることが、その状態を示していない患者と比較したときに、より確からしい確率の増加を指す。
【0028】
用語「癌への感受性」は、本明細書では、被験者が癌を発生させるであろう尤度または確率を指す。癌に感受性が高い被験者は、癌をすでに患っていてもいなくてもよく、異なるタイプの癌を患っていてもよい。
【0029】
用語「阻害薬」は、本明細書では生物活性を減少させるかまたは抑制する薬剤を指す。例えば、阻害薬は、遺伝子の発現を減少またはサイレンスさせうる。阻害薬は、タンパク質、酵素または転写因子の活性も減少させうる。阻害薬の例は、以下には限定されないが、オリゴヌクレオチド、小分子または化合物を含む。オリゴヌクレオチドは、以下には限定されないが、低分子干渉RNA(siRNA:small interfering RNA)または低分子ヘアピン型RNA(shRNA:short hairpin RNA)を含めて、干渉RNA(iRNA:interfering RNA)であってよい。小分子は、当技術分野では低分子量を有する化合物として一般に理解されるであろう。阻害薬の別の例は、クラスター化され、規則的に間隔が置かれた短いパリンドローム・リピート(CRISPR:clustered regularly interspaced short palindromic repeat)ゲノム編集システムであってもよい。CRISPRゲノム編集システムは、CRISPR/Casシステムであってよい。CRISPR/Casシステムは、ゲノムを修飾することによって遺伝子発現を阻害しうる。ゲノムの修飾は、以下には限定されないが、ヌクレオチドの欠失、挿入または置換を含む。CRISPR/Casシステムは、さらに、1つ以上のヒストンの翻訳後修飾によって遺伝子発現を阻害しうる。いくつかの実施形態において、CRISPR/Casシステムは、CRISPR/Cas9であってよい。
【0030】
この開示を通じて、ある実施形態は、範囲形式で開示されてよい。範囲形式における開示は、専ら便利さおよび簡潔さのためであり、開示される範囲の視野に対する融通性のない限定として解釈されるべきではないことを理解されたい。従って、範囲の記述は、具体的に開示されるすべての可能な部分的範囲ならびにその範囲内の個々の数値を有すると見做されるべきである。例えば、1~6のような範囲の記述は、1~3、1~4、1~5、2~4、2~6、3~6などのような具体的に開示された部分的範囲、ならびにその範囲内の個々の数、例えば、1、2、3、4、5、および6を有すると見做されるべきである。このことが範囲の幅に係わらず適用される。
【0031】
本明細書ではいくつかの実施形態が概括的かつ一般的に記載されてもよい。属の開示の範囲内にあるより狭い種および亜属集団の各々も本開示の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う実施形態の属の記載を含む。
【0032】
文脈が別の解釈を必要とするか、または具体的に逆に明記されない限り、本明細書に単数の整数、ステップまたは要素として列挙される本発明の整数、ステップ、または要素は、列挙される整数、ステップまたは要素の単数および複数の両方の形態を明確に包含する。
【0033】
単語「実質的に」は、「完全に」を除外せず、例えば、Yが「実質的に」ない組成物は、Yが完全になくてもよい。必要なところでは、単語「実質的に」が本発明の定義から省略されてよい。
【0034】
本明細書に例示的に記載される本発明は、本明細書に具体的には開示されないいずれかの1つまたは複数の要素、1つまたは複数の限定の存在なしに適切に実行されてもよい。従って、例えば、用語「備える(comprising)」、「含む(including)」、「含む(containing)などは、拡張的に限定なしに読まれるものとする。加えて、本明細書に採用された用語および表現は、限定ではなく説明の用語として用いられ、かかる用語および表現の使用には、図示され、記載された特徴またはそれらの部分のいずれかの均等物を排除する意図はないが、請求される本発明の範囲内で様々な変更が可能であることが認識される。従って、本発明は、好ましい実施形態および随意的な特徴によって具体的に開示されたが、本明細書に開示され、そこに具現された本発明の変更形態および変形形態が当業者によって用いられてもよく、かかる変更形態および変形形態がこの発明の範囲内にあると見做されることを理解されたい。
【0035】
本発明は、本明細書に広く一般的に記載された。属の開示の範囲内にあるより狭い種および亜族集団の各々も本発明の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う本発明の属の記載を含む。
【0036】
他の実施形態は、添付される特許請求の範囲および非限定例の範囲内にある。加えて、本発明の特徴または態様がマーカッシュ群の観点から記載されるところでは、本発明がそれによってマーカッシュ群のいずれかの個々のメンバーまたはメンバーのサブグループの観点からも記載されることを当業者は認識するであろう。
【0037】
本発明は、詳細な記載を参照し、非限定例および添付図面と併せて考察したときにさらによく理解されるであろう。
【図面の簡単な説明】
【0038】
【
図1a】
図1は、GC細胞株の遠位予測エンハンサー(Distal Predicted Enhancer)の景観を示す。
図1aでは、OCUM-1およびNCC59 GC細胞のヒストンプロファイルがDDX47転写開始点(TSS)の周りのH3K27acおよびH3K4me3の濃縮を示す。H3K27ac濃縮を示し、かつDDX47 TSSから2.5Kb超離れた予測エンハンサーエレメントを同定した。
【
図1b】上位2000個の予測エンハンサーの活性を視覚化した、11個のGC細胞株のうちの4個における遠位H3K27acプロファイルのスナップショット、および予測エンハンサーの周りのゲノムワイド平均H3K27acシグナル。
【
図1c】予測エンハンサーの周りのゲノムワイド平均H3K4me3シグナルおよびGC細胞株における活性TSS。
【
図1d】2個以上の胃癌細胞株において見出した共通調節エレメントの、細胞株の数の関数としてのパーセンテージ(エンハンサー-濃灰色、プロモーター-薄灰色)。
【
図1e】予測エンハンサー対ランダム選択領域のクロマチンアクセシビリティ。正常胃組織
42からのDNase I高感受性(DHS:DNase I hypersensitivity)データをサロゲートとして用いた。DHSシグナルの分布をウェルチの片側t検定を用いて統計的有意性について試験した。
【
図1f】9個の異なる組織/細胞カテゴリー起源の50個のエピゲノムプロファイルからの、予測エンハンサーと、クロマチンアクセス可能領域(DHS+、x軸として示す)および活性な調節エレメント(H3K27ac+,y軸として示す)との間の重複のパーセンテージ。
【
図1g】EP300および転写因子結合部位と重複した予測エンハンサーのパーセンテージ。
【
図1h】予測エンハンサーおよびランダム選択領域における最高Phastスコアの分布(DNA配列保存の尺度)。
【
図2a】
図2は、GC細胞株由来の予測スーパーエンハンサーを示す。
図2aでは、H3K27ac ChIP-seqシグナルの分布が不均一に高いH3K27acシグナルを示す予測スーパーエンハンサーの位置を明らかにする。予測スーパーエンハンサーに近位の既知の癌関連遺伝子を示す。2つの細胞株を示す。
【
図2b】GC細胞株の増加する数にわたってランダム選択領域を上回る(>99%)H3K27ac濃縮を示す、遠位調節エレメントのパーセンテージ(予測典型エンハンサー-薄灰色、予測スーパーエンハンサー-濃灰色)。
【
図2c】MALAT1遺伝子座におけるH3K27ac ChIP-seqシグナルは、高いH3K27acシグナルをもつ予測スーパーエンハンサー(塗り潰し四角)に対応する、予測エンハンサーの区間を示す。
【
図2d】反復性遠位調節エレメント(予測スーパーエンハンサーおよび上位の予測典型エンハンサー)と関連付けられた、上位の有意に関連付けられた生体プロセスの例。GOrillaから負の対数変換を行った未加工のp値を用いた。
【
図3a】
図3は、1次GCおよび対応する正常試料における体細胞予測スーパーエンハンサーを示す。
図3aは、19個の1次腫瘍および対応する正常試料における細胞株由来の予測スーパーエンハンサーの活性を示す。H3K27ac予測スーパーエンハンサーシグナル(zスコア)を列変換したRPKM値の単位で視覚化した。インビトロのGC株における活性な予測スーパーエンハンサーの頻度が上部のヒストグラム(黒、ヒートマップより上)として提示される。予測スーパーエンハンサーは、体細胞増加、体細胞欠失、非変化および不活性にカテゴリー化した。各カテゴリーでは、予測スーパーエンハンサーを腫瘍と正常試料との間でそれらの減少する平均差によって(左から右へ)順序付けた。
【
図3b】反復性体細胞増加予測スーパーエンハンサー・シグナルを用いた主成分分析は、腫瘍と正常試料との間の分離を確立する。
【
図3c】5つの腫瘍および対応する正常試料からのH3K4me1プロファイルを用いた、3つの予測スーパーエンハンサー・カテゴリー:体細胞増加、体細胞欠失および非変化におけるH3K4me1(T-N)シグナル(RPKM)差。
*P<2.2×10
-16、ウェルチ片側t検定(one-sided Welch t-test)。
【
図3d】腫瘍と対応する正常試料との間の予測スーパーエンハンサーにおける差次的なβ値がメチル化の状態:高メチル化(>0)または低メチル化(<0)を示す。
【
図3e】ABLIM2遺伝子座の体細胞増加予測スーパーエンハンサーにおけるDNA低メチル化。
【
図3f】SLC1A2遺伝子座の体細胞欠失予測スーパーエンハンサーにおけるDNA高メチル化。
【
図4a】
図4は、体細胞予測スーパーエンハンサーと遺伝子発現およびクロマチン相互作用との間の関連付けを示す。
図4aは、予測スーパーエンハンサーの異なるクラス(非変化、体細胞増加、体細胞欠失)間の遺伝子発現における対数変換した倍率変化と、予測標的遺伝子発現との間の相関を示す。
【
図4b】12個の体細胞増加予測スーパーエンハンサーをカバーする20個のキャプチャポイントからの相互作用ヒートマップ。各リングは、黒矢印で示す単一のキャプチャポイントからのプロファイルを表す。予測スーパーエンハンサーの位置を各リング中の遺伝子座によって示す。100kbビン中のゲノムにわたってゲノムワイドな相互作用シグナルを計算した。キャプチャポイントに隣接する200万塩基以内の領域におけるシグナルを視覚化した。
【
図4c】CLDN4遺伝子座における体細胞増加予測スーパーエンハンサーおよび隣接遺伝子との相互作用の例。体細胞増加活性は、1次GCにおけるCLDN4ならびに隣接遺伝子(CLDN3およびABHD11)の上方制御と関連付けられる。SNU16細胞では2つのキャプチャポイント、#33および#34を用いてCapture-Cにより相互作用を検出した。集約した相互作用(Q<0.05、r3Cseq)を最終トラックとして提示する。SNU16細胞では2つの構成要素である予測エンハンサーe1およびe2をCRISPR/Cas9ゲノム編集を用いて独立に欠失させた。
【
図4d】予測スーパーエンハンサー活性と長距離相互作用との間の相関。SNU16およびOCUM-1細胞ではSLC35D3プロモーターに対する長距離相互作用(薄灰色三角)を活性な予測スーパーエンハンサーを用いて検出した。予測スーパーエンハンサーを検出しなかったKATO-III細胞ではかかる相互作用も観測されなかった。
【
図5a】
図5では体細胞予測スーパーエンハンサーが患者生存および疾患リスクを知らせる。
図5aは、反復性体細胞増加、反復性体細胞欠失および非変化H3K27acシグナルを示す予測スーパーエンハンサーを用いた癌ホールマーク解析を示す。フィシャーの片側正確検定から負の対数変換を行ったp値を用いた。
【
図5b】患者群を、上位の反復性体細胞増加予測スーパーエンハンサーと関連付けられた遺伝子からの低(薄灰色)および高(濃灰色)発現を示す試料と比較した生存解析。848人のGC患者の編集物において、シグネチャーは、予後であり(P=1.8×10
-2,ログランク検定)、腫瘍が高シグネチャー発現を有する患者についてより悪い予後を観測した(ハザード比,95%信頼区間:1.30(1.05~1.61);段階、年齢、患者地域性およびローレンの組織学的サブタイプを補正した後のコックス回帰p値=4.4×10
-2)。生存データを10カ月ごとに示す。
【
図5c】予測スーパーエンハンサーにおける疾患関連SNPの濃縮。予測スーパーエンハンサーの2つのクラス:反復性体細胞変化および非変化予測スーパーエンハンサーに対してカイ二乗検定を用いて濃縮を試験した。すべての予測スーパーエンハンサーで見出された少なくとも10個のSNPをもつ疾患/形質のみを解析した。
【
図5d】結腸直腸癌関連SNP有りまたは無しの予測スーパーエンハンサーにおける差次的なH3K27acシグナル。このSNP有りまたは無しの患者の総数を丸括弧内に示す。ウェルチ片側t検定を用いて2つの群間の差を試験した。
【
図6a】
図6ではGCにおける体細胞増加予測スーパーエンハンサーがCDX2およびHNF4α占有と関連付けられる。
図6aは、ReMapデータベースを用いた、反復性体細胞増加予測スーパーエンハンサーおよび非変化予測スーパーエンハンサーにおける上位10個の転写因子の結合濃縮を示す。
【
図6b】非変化予測スーパーエンハンサーと比較した、反復性体細胞増加予測スーパーエンハンサーにおけるReMap転写因子の濃縮または枯渇。
【
図6c】CDX2結合部位およびde novo HOMERモチーフ同定を用いた候補CDX2結合パートナーの検出。
【
図6d】19個の1次腫瘍および対応する正常試料からのRNA-seqを用いた、CDX2と上位20個のCDX2候補結合パートナーとの対発現の相関。
【
図6e】OCUM-1細胞における500bpのウィンドウ内でHNF4α結合部位と同時発生するCDX2結合部位のパーセンテージ。
【
図6f】反復性体細胞増加予測スーパーエンハンサーと非変化予測スーパーエンハンサーとの間の差次的なCDX2(左)およびHNF4α(右)平均結合シグナル解析。予測スーパーエンハンサーは、OCUM-1でも活性であった。
【
図6g】OCUM-1細胞における、シングルおよびダブルTFサイレンシングに対する、体細胞増加予測スーパーエンハンサーと予測典型エンハンサーとの間のH3K27ac枯渇の大きさの分布。ウィルコクソン片側順位和検定を用いて統計学的有意性を評価した。
【
図6h】CDX2、HNF4αまたはCDX2/HNF4α共結合(co-binding)部位に対する、体細胞増加予測スーパーエンハンサーにおけるH3K27acサブ領域枯渇の間の関連付け。距離は、結合部位に対して3つのカテゴリー:近い、中間、遠位に均一に分布した。ウィルコクソン片側順位和検定を用いて統計学的有意性を評価した。
【
図7a】
図7は、異なるマッピング品質フィルター(MAPQ≧10およびMAPQ≧20)間の比較を示す。
図7aは、MAPQ≧10を用いた全マッピングリードと比較した、MAPQ≧20を用いて検出したマッピングリードのパーセンテージを示す。
【
図7b】MAPQ≧10を用いたChIP濃縮ピークの総数と比較した、MAPQ≧20を用いて発見されたChIP濃縮ピークのパーセンテージ。
【
図8】KATO-III細胞からの生物学的レプリケート(biological replicate)におけるH3K27ac濃縮ピークの一致。レプリケート1および2は、Nano-ChIPseqを用いて生成し、一方でBaek et al.Oncotarget(2016)からのデータは、従来のChIPseq法を用いて作成した。レプリケート1および2からのマッピングリードの総数は、Baekらのデータより10倍超多く、それゆえに、本発明者らのレプリケートではより多くのピークを検出した。レプリケートからのピークをBEDToolsを用いてマージした。このアプローチを用いて、30,734個のユニークなピークを同定した。レプリケートで見出した重複ピークのパーセンテージをユニークなピークの総数(total number unique peaks)と比較して計算した。
【
図9】胃癌細胞株における遠位予測エンハンサーおよび活性TSSに隣接するゲノムワイドH3K4me1シグナル。
【
図10a】
図10は、GC細胞株における予測スーパーエンハンサーを示す。
図10aは、それぞれ、OCUM-1およびNCC59におけるKLF5およびMYC関連予測スーパーエンハンサーを示す。
【
図10b】上位の反復性予測スーパーエンハンサー(濃灰色)および予測典型エンハンサー(薄灰色)に連結された遺伝子の発現レベル(複数の細胞株にわたって、パーセンタイル単位)。ランダムに選んだ同一数の遺伝子(黒)を参照として用いた。遺伝子をパーセンタイルにより最高から最低への順序でソートした。
【
図11】公開データセットを用いた反復性予測スーパーエンハンサー/遺伝子相互作用の検証。パーセンテージ値は、元の予測スーパーエンハンサー/遺伝子の割り当てを反映する(結果および方法を参照)。
【
図12】GREAT解析ツールを用いた、反復性予測スーパーエンハンサーと関連付けられた生物学的プロセス。黒矢印によって強調表示したプロセスは、GOrilla(結果を参照)およびGREATの両方によって観測したプロセスを指す。
【
図13a】
図13は、1次試料からのヒストンH3K27acプロファイルを用いた、細胞株由来の予測スーパーエンハンサーのカテゴリー化を示す。
図13aは、3つの腫瘍(T)/対応する正常(N)対におけるGCNT4遺伝子座の体細胞欠失予測スーパーエンハンサーを示す。
【
図13b】T/N20020720、T/N2001206およびT/N980401におけるCMIP遺伝子座の非変化予測スーパーエンハンサー。
【
図13c】FU97およびYCC22 GC細胞において検出した予測スーパーエンハンサーは、3つのT/N対におけるZNF326遺伝子座の不活性状態を示す。
【
図14a】
図14は、コピー数変化と予測スーパーエンハンサーとの間の関連付けを示す。
図14aは、コピー数中立領域で検出した体細胞増加予測スーパーエンハンサーの例を示す。
【
図14b】KATO-III細胞において体細胞コピー数増加の領域で検出したFGFR2-関連予測スーパーエンハンサー。
【
図14c】T/N980447においてコピー数増加を伴う領域で検出した体細胞増加予測スーパーエンハンサー。
【
図14d】高反復性体細胞増加(H3K27ac)予測スーパーエンハンサーをCLDN4遺伝子座において検出した。この領域は、コピー数増加とは関連付けられなかった。
【
図15】Capture-C技術を用いた、TM4SF1遺伝子座における予測スーパーエンハンサー(黒四角)と、OCUM-1細胞において検出したTM4SF4プロモーターとの間の長距離相互作用。下部トラックは、キャプチャポイント#17から集約した相互作用を示す。
【
図16a】
図16は、Capture-C相互作用プロファイルを示す。
図16aは、EHBP1予測スーパーエンハンサー(黒四角)からTMEM1およびEHBP1遺伝子のプロモーターへの相互作用を示す。この予測スーパーエンハンサーは、OCUM-1細胞において検出され、1次腫瘍T20020720では体細胞増加を示し、TMEM1およびEBHP1の上方制御された発現と関連付けられる。
【
図16b】YWHAZ遺伝子座における予測スーパーエンハンサー(黒四角)からYWHAZのプロモーターへの相互作用。予測スーパーエンハンサーは、SNU16細胞において検出され、1次腫瘍試料T990275では体細胞増加を示し、YWHAZの上方制御された発現と関連付けられる。
【
図17a】
図17は、4C相互作用プロファイルを示す。
図17aは、ELF3遺伝子座における体細胞増加予測スーパーエンハンサー、および近接遺伝子、例えば、ELF3、RNPEP、ARL8AおよびLMOD1との相互作用の例を示す。体細胞増加活性は、1次GCにおけるELF3の上方制御と関連付けられる。OCUM-1細胞において4Cを用いて相互作用(Q<0.05,r3Cseq)を検出した。Basic4CSeqパッケージを用いて4Cシグナル・プロット(RPM単位)を生成した。OCUM-1細胞においてCRISPR/Cas9ゲノム編集技術を用いて2つの構成要素であるエンハンサーe3およびe4を独立に欠失させた。
【
図17b】OCUM-1細胞においてKLF5遺伝子座における予測スーパーエンハンサーとKLF5プロモーターとの間の長距離相互作用を検出した。1次腫瘍(T76629543)における体細胞増加活性は、対応する試料におけるKLF5発現の上方制御と関連付けられる。
【
図17c】CABLES1遺伝子座における予測スーパーエンハンサーの、CABLES1およびRIOK3を含んだ、遺伝子の近接する非コード領域およびプロモーターへの相互作用。
【
図18】
図18は、Capture-Cおよび4Cからの相互作用プロファイルを比較する。
図18aでは、ベン図がOCUM-1およびSNU16細胞からの2つの生物学的レプリケート間の(4Cからの)予測スーパーエンハンサー/遺伝子相互作用の重複を示す。同定したすべての相互作用に関して、レプリケート間の一致を計算した(丸括弧内のパーセンテージ)。
図18bでは、ベン図は、(Capture-Cからの)予測スーパーエンハンサー/遺伝子相互作用の、同じ細胞における4Cからの相互作用の一致セットとの重複を示す。Capture-Cを用いることによって同定した相互作用のうちの75~80%を4Cを用いた結果において再発見した。
【
図19】予測スーパーエンハンサー活性と長距離相互作用の存在との間の相関の例。OCUM-1およびKATO-III細胞において活性な予測スーパーエンハンサー(黒四角)を用いてEHBP1プロモーターへの長距離相互作用(薄灰色三角)を検出した。予測スーパーエンハンサーを検出しなかったSNU16細胞ではかかる相互作用も観測されなかった。
【
図20a】
図20は、CRISPR/Cas9欠失を用いた予測エンハンサーの欠失を示す。OCUM-1およびSNU16細胞においてRT-qPCRを用いて以下のPCR解析を行った。プールした細胞を解析した。*P<0.05、#P=0.055、片側t検定;wt:野生型;lad:DNAラダー(BiolineHyperladderI);c1~c3:GAPDHプライマーを用いた野生型細胞。
図20aは、SNU16における構成要素であるエンハンサーe1のCRISPR/Cas9欠失のPCR解析を示す。
【
図20b】OCUM-1における構成要素であるエンハンサーe2のCRISPR/Cas9欠失のPCR解析を示す。
【
図20c】OCUM-1における構成要素であるエンハンサー、e3およびe4のCRISPR/Cas9欠失のPCR解析を示す。
【
図20d】(1つのエンハンサー欠失を伴う)突然変異体と野生型細胞との間の差次的な遺伝子発現のPCR解析を示す。
【
図20e】(1つのエンハンサー欠失を伴う)突然変異体と野生型細胞との間の差次的な遺伝子発現のPCR解析を示す。
【
図20f】(1つのエンハンサー欠失を伴う)突然変異体と野生型細胞との間の差次的な遺伝子発現のPCR解析を示す。
【
図21】他の細胞および組織タイプにおけるGC関連予測スーパーエンハンサーの景観。86個の細胞および組織試料において検出したスーパーエンハンサーと重複する、GCにおいて同定した反復性体細胞増加予測スーパーエンハンサーを、ランダムに選択した領域と比較した濃縮比。癌細胞株をアスタリスクでラベル付けて、濃縮比が統計学的に有意でない(P>0.001)試料は、灰色である。
【
図22a】
図22は、ヒストン修飾および遺伝子発現に対する転写因子サイレンシングの結果を示す。
図22aは、反復性細胞増加予測スーパーエンハンサーと非変化予測スーパーエンハンサーとの間の差次的なCDX2(左)およびHNF4α(右)平均結合シグナル解析を示す。予測スーパーエンハンサーは、SNU16においても活性であった。
【
図22b】1つまたは2つの転写因子を同時にサイレンスさせた後のH3K27acにおける全体的な変化(濃灰色)。バックグラウンドの変化は、2つの対照(NT
CDX2およびNT
HNF4α)間の差から作成する。
【
図22c】OCUM-1細胞における転写因子(単数または複数)のサイレンシング後のH3K27ac枯渇の大きさ。
【
図22d】OCUM-1細胞におけるCDX2サイレンシング後のFGL1遺伝子座の予測スーパーエンハンサーにおけるH3K27ac枯渇を示す視覚的な例。
【
図22e】SNU16細胞におけるCDX2またはHNF4α結合部位に対する、体細胞増加予測スーパーエンハンサー中のH3K27ac枯渇の間の関連付け。距離は、結合部位に対して3つのカテゴリー:近い、中間および遠位に均一に分布し、分類された。ウィルコクソン片側順位和検定を用いて統計学的有意性を評価した。
【
図22f】OCUM-1において体細胞増加予測スーパーエンハンサーと関連付けられた遺伝子発現をシングルまたはダブル転写因子を同時にサイレンスした後に(NT-siTF)調べた。発現における変化(下方制御としてFPKM差>0;上方制御として<0)を示す遺伝子のパーセンテージを示す。下方制御された遺伝子の比率を経験的アプローチ(方法を参照)を用いて試験した。
【
図23a】
図23は、ウエスタンブロッティングおよびリアルタイム(RT:real time)PCRによるCDX2、HNF4αノックダウン効率を示す。
図23aは、SNU16およびOCUM-1細胞におけるCDX2ノックダウン前(siNT)および後(siCDX2)のCDX2タンパク質存在量を測定したウエスタンブロットを示す。対照としてGADPHタンパク質存在量を用いた。
【
図23b】SNU16およびOCUM-1細胞におけるHNF4αノックダウン前(siNT)および後(siHNF4α)のHNF4αタンパク質存在量を測定したウエスタンブロット。対照としてGADPHタンパク質存在量を用いた。
【
図23c】OCUM-1細胞において対照に対するCDX2の相対的RNA存在量をRT-PCRを用いて2つのレプリケート中で測定した。
【
図23d】OCUM-1細胞において対照に対するHNF4αの相対的RNA存在量をRT-PCRを用いて3つのレプリケート中で測定した。
【
図24】CLDN4 e1のCRISPR欠失に対するGC細胞の耐性。H1 ES対SNU16細胞においてより高い割合(20%対1%)のe1ホモ接合型欠失を観測した。CLDN4 e1サブ領域がSNU16における2倍体であることを確認した。
【
図25a】
図25は、PCRを用いた、SNU16細胞からの91個のクローンにおけるエンハンサーe1欠失の確認を示す。
図25aは、外部プライマーを用いた結果として生じたPCRバンドを示す。
【
図25b】内部プライマーを用いた結果として生じたPCRバンド。ホモ接合型欠失を伴うクローンは、外部プライマーを用いると約450bpのバンドを示し、内部プライマーを用いるとバンドがなく、ヘテロ接合型欠失を伴うクローンは、外部および内部プライマーを用いると450bpのバンドを示す。
【
図26a】
図26は、PCRを用いた、H1細胞からの48個のクローンにおけるエンハンサーe1欠失の確認を示す。
図26aは、外部プライマーを用いた結果として生じたPCRバンドを示す。
【
図26b】内部プライマーを用いた結果として生じたPCRバンド。ホモ接合型欠失を伴うクローンは、外部プライマーを用いると約450bpのバンドを示し、内部プライマーを用いるとバンドがなく、ヘテロ接合型欠失を伴うクローンは、外部および内部プライマーを用いると450bpのバンドを示す。
【
図27-1】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-2】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-3】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-4】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-5】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-6】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-7】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-8】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-9】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-10】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-11】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-12】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図27-13】サンガーシークエンシングを用いた、H1 ES細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図28-1】サンガーシークエンシングを用いた、SNU16細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図28-2】サンガーシークエンシングを用いた、SNU16細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【
図28-3】サンガーシークエンシングを用いた、SNU16細胞における両方の対立遺伝子中のホモ接合型e1欠失の確認。空きスペースは、欠失されたサブ配列を示し、灰色強調表示は、sgRNAを示す。
【発明を実施するための形態】
【0039】
一態様において、本発明は、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を判定するための方法に関し、方法は、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)癌生体試料における少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備える。
【0040】
一実施形態において、癌および非癌生体試料は、単一の細胞、複数の細胞、細胞のフラグメント、体液または組織を備えてよい。一実施形態において、癌および非癌生体試料は、同じ被験者から得られてよい。
【0041】
一実施形態において、癌および非癌生体試料は、各々が異なる被験者から得られてもよい。
【0042】
本明細書に記載されるような方法による接触させるステップは、ヒストン修飾に対して特異的な少なくとも1つの抗体を備えてよい。ヒストン修飾の例は、以下には限定されないが、H3K27ac、H3K4me3、H3K4me1およびH2BK20acを含む。ある好ましい実施形態では、ヒストン修飾は、H3K27acである。
【0043】
本明細書に記載されるような方法による単離ステップは、クロマチンの免疫沈降によって核酸を癌生体試料から単離するステップを備えてよい。一実施形態において、単離された核酸は、ヒストン修飾に特異的な少なくとも1つの領域を備える。ヒストン修飾の例は、以下には限定されないが、H3K27ac、H3K4me3、H3K4me1およびH2BK20acを含む。ある好ましい実施形態では、ヒストン修飾に特異的な少なくとも1つの領域は、ヒストン修飾H3K27acに特異的な領域である。
【0044】
本明細書に記載されるような方法によるマッピングするステップは、ヒストン修飾のシグナル強度に基づいてアノテートされたゲノム配列を用いるステップを備えてよい。一実施形態において、ヒストン修飾は、H327acである。一実施形態において、アノテートされたゲノム配列は、公的に利用可能な配列である。一実施形態において、アノテートされたゲノム配列は、エピゲノムロードマップである。別の実施形態では、アノテートされたゲノム配列は、GENCODEv19である。
【0045】
本明細書に記載されるような方法によるマッピングするステップは、アノテートされた転写開始点から少なくとも1kb、少なくとも1.5kb、少なくとも2kb、少なくとも2.5kb、少なくとも3kb、少なくとも3.5kb、少なくとも4kb、少なくとも4.5kb、少なくとも5kb、少なくとも5.5kb、少なくとも6kb、少なくとも6.5kb、少なくとも7kb、少なくとも7.5kb、少なくとも8kb、少なくとも8.5kb、少なくとも9kb、少なくとも9.5kbまたは少なくとも10kbにある少なくとも1つのエンハンサーも備えてよい。
【0046】
方法は、癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップをさらに備えてよい。
【0047】
いくつかの実施形態において、少なくとも1つの参照核酸配列は、i)アノテートされたゲノム配列、ii)de novoトランスクリプトームアセンブリ、および/またはiii)非癌核酸配列ライブラリまたはデータベースに由来する核酸配列を備えてよい。
【0048】
一実施形態において、少なくとも1つの参照核酸配列は、少なくとも1つの癌細胞株から得られる。
【0049】
一実施形態において、少なくとも1つのスーパーエンハンサーのシグナル強度は、ヒストン修飾H3K27acのReads Per Kilobase of transcript per million(RPKM:100万当たり、トランスクリプトのキロベース当たりのリード)値に基づく。一実施形態において、少なくとも1つのスーパーエンハンサーのシグナル強度は、ヒストン修飾H3K27acのFragments Per Kilobase of transcript per Million(FPKM:100万当たり、トランスクリプトのキロベース当たりのフラグメント)値に基づく。
【0050】
一実施形態において、癌生体試料におけるその少なくとも1つのスーパーエンハンサーは、ROSE(Ranking of Super Enhancer:エンハンサーのランキング)アルゴリズムを用いて同定される。
【0051】
いくつかの実施形態において、癌生体試料における少なくとも1つのスーパーエンハンサーは、少なくとも1つの参照核酸試料における少なくとも1つのエンハンサーと重複している、少なくとも1個、少なくとも2個、少なくとも3個、少なくとも4個、少なくとも5個、少なくとも6個、少なくとも7個、少なくとも8個、少なくとも9個または少なくとも10個の核酸塩基対を備える。
【0052】
ある好ましい実施形態において、癌生体試料における少なくとも1つのスーパーエンハンサーは、少なくとも1つの参照核酸試料における少なくとも1つのエンハンサーと重複している少なくとも1つの核酸塩基対を備える。
【0053】
一実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体における少なくとも1つのスーパーエンハンサーに対するRPKM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、RPKM値における1.5倍より大きい倍率変化、2倍より大きい倍率変化、3倍より大きい倍率変化、4倍より大きい倍率変化、5倍より大きい倍率変化、6倍より大きい倍率変化、7倍より大きい倍率変化、8倍より大きい倍率変化、9倍より大きい倍率変化または10倍より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、0.5RPKMより大きい、1.0RPKMより大きい、1.5RPKMより大きい、2.0RPKMより大きい、2.5RPKMより大きい、3.0RPKMより大きい、3.5RPKMより大きい、4.0RPKMより大きい、4.5RPKMより大きいかまたは5.0RPKMより大きい絶対値差分であることを判定するステップを備えてよい。
【0054】
ある好ましい実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体試料における少なくとも1つのスーパーエンハンサーに対するRPKM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、RPKM値における2より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのRPKM値と比較して、0.5RPKMより大きい絶対値差分であることを判定するステップを備える。
【0055】
一実施形態において、非癌生体試料のRPKM値と比較して、癌生体試料からのRPKM値における増加は、癌生体試料における少なくとも1つのスーパーエンハンサーの存在を示す。
【0056】
一実施形態において、非癌生体試料のRPKM値と比較して、癌生体試料からのRPKM値における減少は、癌生体試料における少なくとも1つのスーパーエンハンサーの非存在を示す。
【0057】
いくつかの実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体における少なくとも1つのスーパーエンハンサーに対するFKPM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、FPKM値における1.5より大きい倍率変化、2より大きい倍率変化、3より大きい倍率変化、4より大きい倍率変化、5より大きい倍率変化、6より大きい倍率変化、7より大きい倍率変化、8より大きい倍率変化、9より大きい倍率変化かまたは10より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、0.5FPKMより大きい、1.0FPKMより大きい、1.5FPKMより大きい、2.0FPKMより大きい、2.5FPKMより大きい、3.0FPKMより大きい、3.5FPKMより大きい、4.0FPKMより大きい、4.5FPKMより大きいかまたは5.0RPKMより大きい絶対値差分であることを判定するステップを備えてよい。
【0058】
ある好ましい実施形態において、少なくとも1つのスーパーエンハンサーの存在または非存在を判定するステップは、癌生体試料における少なくとも1つのスーパーエンハンサーに対するFKPM値が、i)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、FPKM値における2より大きい倍率変化、およびii)非癌生体試料から得られた少なくとも1つのスーパーエンハンサーのFPKM値と比較して、0.5FPKMより大きい絶対値差分であることを判定するステップを備える。
【0059】
一実施形態において、非癌生体試料のFPKM値と比較して、癌生体試料からのFPKM値における増加は、癌生体試料における少なくとも1つのスーパーエンハンサーの存在を示す。
【0060】
一実施形態において、非癌生体試料のFPKM値と比較して、癌生体試料からのFPKM値における減少は、癌生体試料における少なくとも1つのスーパーエンハンサーの非存在を示す。
【0061】
いくつかの実施形態において、少なくとも1つのスーパーエンハンサーは、遺伝子転写開始点に対して500kb、600kb、700kb、800kb、900kb、1000kb、1100kb、1200kb、1300kb、1400kb、1500kbまたは2000kb以内に配置される。ある好ましい実施形態では、少なくとも1つのスーパーエンハンサーは、遺伝子転写開始点に対して1000kb以内に配置される。
【0062】
一実施形態において、遺伝子は、癌関連遺伝子、血管新生遺伝子、細胞増殖遺伝子、細胞浸潤遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞死抵抗性遺伝子、細胞エナジェティクス遺伝子(cellular energetics gene)、細胞周期遺伝子または腫瘍促進遺伝子である。
【0063】
いくつかの実施形態において、遺伝子は、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択される。
【0064】
一実施形態において、癌生体試料は、胃癌である。
【0065】
本発明の別の態様において、被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、少なくとも1つの癌関連スーパーエンハンサーの存在を示す、方法が提供される。
【0066】
本発明の別の態様において、被験者における癌を検出するためのバイオマーカーであって、バイオマーカーは、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度の有する少なくとも1つをスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌を検出するためのバイオマーカーが提供される。いくつかの実施形態において、癌関連転写因子結合部位は、胃癌関連転写因子結合部位である。
【0067】
いくつかの実施形態において、胃癌関連転写因子は、CDX2、KLF5およびHNF4αからなる群から選択される。いくつかの実施形態において、胃癌関連転写因子は、CDX2、KLF5、HNF4αおよびそれらの組み合わせからなる群から選択される。
【0068】
本発明の別の態様において、被験者における癌の予後を判定するための方法であって、
a)被験者から得られた癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナルに基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在または非存在を、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、少なくとも1つの癌関連スーパーエンハンサーの存在または非存在は、被験者における癌の予後を示す、方法が提供される。
【0069】
一実施形態において、癌生体試料における少なくとも1つの癌関連スーパーエンハンサーの存在は、被験者における癌生存の予後不良を示す。
【0070】
一実施形態において、癌生体試料における少なくとも1つの癌関連スーパーエンハンサーの非存在は、被験者における癌生存の予後改善を示す。
【0071】
一実施形態において、少なくとも1つの癌関連スーパーエンハンサーは、細胞浸潤遺伝子、血管新生遺伝子または細胞死抵抗性遺伝子、癌関連遺伝子、細胞増殖遺伝子、ゲノム不安定性と関連付けられた遺伝子、細胞エナジェティクス遺伝子、細胞周期遺伝子または腫瘍促進遺伝子のうちの1つ以上と関連付けられる。
【0072】
一実施形態において、少なくとも1つの癌関連スーパーエンハンサーは、CLDN4、ABHD11、WBSCR28、ATAD2、KLH38、WDYHV1、CDH17、CCAT1、CLDN1、SMURF1、GDPD5、ADAMTS12、ASCL2、ASPM、ATP11A、AURKA、CAMK2N1、CBX2、CCNE1、CD9、CDC25B、CDCA7、CDK1、CXCL1、E2F7、ECT2、LAMC2、NID2、PMEPA1、RARRES1、RFC3、SLC39A10、TFAP2A、TMEM158、LINC00299およびそれらの組み合わせからなる群から選択された遺伝子と関連付けられる。
【0073】
本発明の別の態様において、癌または胃腸疾患に対する被験者の感受性を判定する方法であって、
a)被験者から得られた生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体または複数の抗体と接触させるステップと、
b)生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域または複数の領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を対照生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナルに対して比較するステップと、
f)少なくとも1つのスーパーエンハンサーの存在または非存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと、
g)少なくとも1つのスーパーエンハンサーの存在または非存在を癌または胃腸疾患関連SNPを備える参照ゲノム配列に対してマッピングするステップと
を備え、1つ以上の癌または胃腸疾患関連SNPと関連付けられた少なくとも1つのスーパーエンハンサーの存在または非存在は、癌または胃腸疾患に対する被験者の感受性を示す、方法が提供される。
【0074】
一実施形態において、胃腸疾患は、アカラシア、バレット食道、肝硬変、胆汁性肝硬変、セリアック病、結腸直腸ポリープ、クローン病、憩室症、憩室炎、脂肪肝、胆石、胃炎、ヘリコバクター・ピロリ、ヘモクロマトーシス、肝炎、過敏性腸症候群、顕微鏡的大腸炎、食道癌、膵炎、消化性潰瘍、逆流性食道炎、潰瘍性大腸炎、大腸癌および便秘のうちの1つ以上から選択される。
【0075】
一実施形態において、癌は、胃癌、食道癌、結腸直腸癌、乳癌および前立腺癌のうちの1つ以上から選択される。
【0076】
本発明の別の態様では、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための方法であって、CDX2および/またはHNF4αの阻害薬を細胞へ投与するステップを備える、方法が提供される。
【0077】
一実施形態において、阻害薬は、低分子干渉RNA(siRNA)である。別の実施形態では、阻害薬は、低分子ヘアピン型RNA(shRNA)である。
【0078】
一実施形態において、阻害薬は、小分子または抗体である。
【0079】
一実施形態において、阻害薬は、メトホルミンである。
【0080】
一実施形態において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性は、CRISPRゲノム編集システムによって調節されうる。別の実施形態では、CRISPRゲノム編集システムは、CRISPR/Cas9である。
【0081】
一実施形態において、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性は、CRISPRゲノム編集システムによって阻害されうる。別の実施形態では、CRISPRゲノム編集システムは、CRISPR/Cas9である。
【0082】
本発明の別の態様では、正常非癌生体試料と比較して、癌生体試料におけるH3KH27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して、癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備える、被験者における癌の検出に用いるためのバイオマーカーが提供される。
【0083】
本発明の別の態様では、正常非癌生体試料と比較して癌生体試料におけるH3K27acの増加したシグナル強度を有する少なくとも1つのスーパーエンハンサー、もしくは非変化スーパーエンハンサーと比較して癌関連転写因子結合部位における増加と関連付けられた少なくとも1つのスーパーエンハンサー、または両方を備えるバイオマーカーの被験者における癌を検出するための薬物の製造における使用が提供される。
【0084】
本発明の別の態様では、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するのに用いるためのCDX2および/またはHNF4αの阻害薬が提供される。
【0085】
本発明の別の態様では、細胞における少なくとも1つの癌関連スーパーエンハンサーの活性を調節するための薬物の製造におけるCDX2および/またはHNF4αの阻害薬の使用が提供される。
【0086】
一態様において、被験者から得られた癌生体試料における癌細胞生存期間または癌細胞生存率を予測する方法であって、
a)癌生体試料をヒストン修飾H3K27acに対して特異的な少なくとも1つの抗体と接触させるステップと、
b)癌生体試料から核酸を単離するステップであって、単離された核酸は、ヒストン修飾H3K27acに特異的な少なくとも1つの領域を備える、単離するステップと、
c)アノテートされたゲノム配列を用いて、少なくとも1つのエンハンサーをヒストン修飾H3K27acのシグナル強度に基づいてマッピングするステップであって、少なくとも1つのエンハンサーは、アノテートされた転写開始点から少なくとも2.5kbにある、マッピングするステップと、
d)癌生体試料における少なくとも1つのスーパーエンハンサーを同定するために、単離された核酸中の少なくとも1つのエンハンサーを少なくとも1つの参照核酸配列中の少なくとも1つのエンハンサーに対してマッピングするステップと、
e)癌生体試料における少なくとも1つのスーパーエンハンサーのシグナル強度を非癌生体試料から得られた少なくとも1つのスーパーエンハンサーの参照シグナル強度に対して比較するステップと、
f)被験者における少なくとも1つの癌関連スーパーエンハンサーの存在を少なくとも1つのスーパーエンハンサーのシグナル強度における変化に基づいて判定するステップと
を備え、非癌生体試料と比較して、癌生体試料における少なくとも1つのスーパーエンハンサーの増加したシグナル強度は、癌細胞生存期間または癌細胞生存率を予測する、方法が提供される。
【0087】
本明細書に例示的に記載される本発明は、本明細書に具体的には開示されないいずれかの1つまたは複数の要素、1つまたは複数の限定の存在なしに適切に実行されてもよい。従って、例えば、用語「備える(comprising)」、「含む(including)」、「含む(containing)などは、拡張的に限定なしに読まれるものとする。加えて、本明細書に採用された用語および表現は、限定ではなく説明の用語として用いられ、かかる用語および表現の使用には、図示され、記載された特徴またはそれらの部分のいずれかの均等物を排除する意図はないが、請求される本発明の範囲内で様々な変更が可能であることが認識される。従って、本発明は、好ましい実施形態および随意的な特徴によって具体的に開示されたが、本明細書に開示され、そこに具現された本発明の変更形態および変形形態が当業者によって用いられてもよく、かかる変更形態および変形形態がこの発明の範囲内にあると見做されることを理解されたい。
【0088】
本発明は、本明細書に広く一般的に記載された。属の開示の範囲内にあるより狭い種および亜族集団の各々も本発明の一部を形成する。これは、削除される材料が本明細書に具体的に列挙されるか否かに係わらず、属からいずれかの対象を除く但し書きまたは否定的限定を伴う本発明の属の記載を含む。
【0089】
他の実施形態は、添付される特許請求の範囲および非限定例の範囲内にある。加えて、本発明の特徴または態様がマーカッシュ群の観点から記載されるところでは、本発明がそれによってマーカッシュ群のいずれかの個々のメンバーまたはメンバーのサブグループの観点からも記載されることを当業者は認識するであろう。
【実施例0090】
本発明の範囲を何らか限定すると解釈されるべきではない具体的な実施例を参照することによって、本発明の非限定例および比較例がさらにより詳細に記載される。
【0091】
方法
1次組織試料および細胞株
1次患者試料は、SingHealth Centralised Institutional Review Boardからの認可および患者署名入りインフォームド・コンセントを伴ってSingHealth組織リポジトリから得た。この研究に用いた「正常」(すなわち、非悪性)試料は、胃から、腫瘍から遠く離れ、外科的評価の際に腫瘍または腸上皮化生/異形成の視認できる証拠を示していない部位から収集した試料を指す。腫瘍試料は、40%超の腫瘍細胞を含むことを凍結切片によって確認した。FU97、MKN7、OCUM-1およびRERF-GC-1B細胞は、Japan Health Science Research Bank(ヒューマンサイエンス研究資源バンク)から得た。KATO-IIIおよびSNU16細胞は、American Type Culture Collectionから得た。NCC-59は、Korean Cell Line Bankから得た。YCC3、YCC7、YCC21、YCC22は、Yonsei Cancer Centre,韓国から贈られた。細胞株の同一性は、Centre for Translational Research and Diagnostics(Cancer Science Institute of Singapore,シンガポール)で行ったSTR DNAプロファイリングによって確認した。STRプロファイルを標準ANSI/ATCC ASN-0002-2011命名法に従って評価し、本発明者らの細胞株のプロファイルは、参照データベースに対して80%超の類似性を示した。MKN7細胞-ICLAC(http://iclac.org/databases/cross-contaminations/)により概して誤認される1つの株は、Japanese Collection of Research Bioresources Cell Bank(JCRB細胞バンク)におけるMKN7参照プロファイルとの完全な一致(100%)を示すことによってこれを確認した。マイコプラズマ汚染を検出するために、MycoAlert(登録商標)Mycoplasma Detection Kit(Lonza)およびMycoSensor qPCRアッセイキット(アジレント・テクノロジー)を用いた。すべての細胞株がマイコプラズマ汚染について陰性であった。この研究のために、OCUM-1およびSNU16細胞を2つの理由で主要細胞株モデルとして選択した。第1に、OCUM-1およびSNU16細胞は、低分化胃腺癌をもつ患者から元々単離され、この研究における1次GCの過半数が低分化である(63%)。第2に、OCUM-1およびSNU16は、これまでに多くの他の公表された研究で胃癌(GC)モデルとして用いられ、従って、この分野で受け入れられたGCモデルであると見做される。従って、Capture-C、4C、エンハンサーCRISPR、転写因子結合、および転写因子ノックダウンを含めて、いくつかの実験のための一貫した細胞株モデルとしてOCUM-1およびSNU16を用いた。
【0092】
Nano ChIPseq
Nano ChIPseqをわずかな修正を伴って記載したように行った。1次組織については、ChIPごとに約5mgサイズの小片を得るために、剃刀の刃を用いて新鮮冷凍癌および正常組織を液体窒素中で切開した。組織片を室温において10分間、1%ホルムアルデヒト/PBSバッファー中で固定した。グリシンを125mMの最終濃度まで添加することによって固定を停止した。組織片をTBSEバッファーで3回洗浄した。細胞株ついては、100万個の新鮮な収集細胞を室温において10分(min)間、1%ホルムアルデヒト/溶媒バッファー中で固定した。グリシンを125mMの最終濃度まで添加することによって固定を停止した。固定した細胞をTBSEバッファーで3回洗浄して、遠心分離した(5,000r.p.m.,5分)。ペレット状の細胞および粉砕した組織を100μlの1%SDS溶解バッファー中に溶解して、Bioruptor(Diagenode)を用いて300~500bpへ超音波処理した。ChIPは、次の抗体:H3K4me3(07-473,ミリポア)、H3K4me1(ab8895,アブカム)、H3K27ac(ab4729,アブカム)を用いて行った。
【0093】
ChIPおよび入力DNAの回収後に、WGA4キット(シグマ・アルドリッチ)およびBpmI-WGAプライマーを用いて全ゲノム増幅を行った。増幅したDNAをPCR精製カラム(QIAGEN)を用いて精製し、WGAアダプターを除去するためにBpmI(ニュー・イングランド・バイオラボ)で消化した。増幅したDNAのうちの30ngを各シークエンシングライブラリ調製(ニュー・イングランド・バイオラボ)のために用いた。8つのライブラリを多重化(ニュー・イングランド・バイオラボ)して、Hiseq2500(イルミナ)の2つのレーン上でライブラリごとに2,000~3,000万リードの平均深さへシークエンシングした。
【0094】
配列マッピングおよびChIP-seq濃度解析
アラインメント前に最初および最後の10個の塩基をトリミングした後に、Burrows-Wheeler Aligner(BWA-MEM,バージョン0.7.0)を用いて配列リードをヒト参照ゲノム(hg19)に対してマッピングした。高品質のマッピングリード(MAPQ≧10)のみを下流解析のために維持した。MAPQ値(≧10)を選んだが、その理由は、i)この値が、良好/確信的なリードマッピングに用いるのに良い値であることが先に報告され、ii)MAPQ≧10が、彼らのソフトウェアを用いた確信的なマッピングに用いるのに適した閾値であることもBWAアルゴリズムの開発者らによって示され、iii)リードアラインメントに関する様々なアルゴリズムを評価する研究が、マッピング品質スコアは、リードマッピングが真/正確である尤度と良好には相関付けられないことも示し、かつマッピング精度について得られる精度のレベルが10~12MAPQの閾値間で横這いになることを示したためである。この研究は、複数の試料で確実に検出され、解析のロバスト性を高める反復性予測エンハンサーおよびスーパーエンハンサーに焦点を合わせる。配列カバレッジは、ウィンドウサイズが50bpで、リード長を200bpに延長したMEDIPSを用いて計算した。入力ライブラリと比較して著しいChIP濃縮(FDR<5%)を伴うピークをCCAT(バージョン3)を用いて検出した。ライブラリおよび領域サイズによって正規化したマッピングリードの総数、キロベース当たり、100万マッピングリード当たりのリード(RPKM)と等価なメトリックをカウントすることによって、領域内のピーク密度を計算した。この正規化法は、リードが長い方の領域に入る確率が高くなることによるバイアスを調整し、これまでの研究に適用されてきた。この研究は、研究を他の研究と比較可能にするためにRPKMベースの正規化を適用することを選んだ。バックグラウンド・シグナルを考慮するために、各ChIPライブラリのリード密度を対応する入力ライブラリに対して補正した。COMBATを用い、試料変動を確実に等しくするために、複数の試料にわたってリード密度を潜在的なバッチ効果(例えば、ChIPアッセイのデータ)について補正した。2つ以上の細胞株で検出した17,360個の反復性予測エンハンサーのうちで、98%が少なくとも1つの1次試料(正常またはGC)中に存在した。
【0095】
Nano-ChIPseqデータの品質管理評価
2つの異なる方法を用いて、ChIPライブラリ(H3K27ac、H3K4me3およびH3K4me1)の品質を評価した。第1に、ChIP品質、特にH3K27acおよびH3K4me3をタンパク質コード遺伝子のアノテートされたプロモーターにおけるそれらの濃縮レベルを調べることによって推定した。具体的には、本研究は、高発現タンパク質コード遺伝子と関連付けられた1,000個のプロモーターにおける入力および入力補正ChIPシグナルのメジアン・リード密度を計算した。試料ごとに、データ品質のサロゲートとしてH3K27ac割る入力のリード密度比を比較し、H3K27ac/入力比が4倍より大きかった試料のみを維持した。この基準を用いると、50個のH3K27ac試料(GC株および1次試料)のうち48個が4倍より大きい濃縮を示し、好結果の濃縮を示した。H3K4me3ライブラリ(プロモーターマーク)についても同様の解析を行い、すべての42個のライブラリがこの品質管理基準を満たした。第2に、CHANCE(CHip-seq Analytics and Confidence Estimation(CHip-seqアナリティクスおよび信頼推定))、CHip-seq品質管理および好結果または弱い濃縮を用いたことをライブラリが示すかどうかを指示するプロトコル最適化のためのソフトウェアを用いた。本研究における試料の大多数(85%)がCHANCEによって評価した通り好結果の濃縮を示すことがわかった。両方の方法によって評価した、ライブラリごとの評価状況を表1に報告する。
【0096】
【0097】
【0098】
【0099】
本研究は、KATO-III細胞を用いてH3K27ac Nano-ChIP-seqの第2の生物学的レプリケートを実験的に発生させて、さらに通常のChIP-seqプロトコルから発生させた独立したH3K27ac KATO-IIIデータに対して結果を比較した。配列トリミングを除いて、公開されたシークエンシングリードをNanoChIP-seqライブラリと同様に処理した。CCATによって検出したピークをFDR<5%で比較した。
【0100】
クロマチンアクセシビリティ、保存および結合濃縮
エピゲノムロードマップ正常胃組織のクロマチンアクセシビリティ・プロファイルは、Gene Expression Omnibusから得た(GSM1027325,GSM1027320)。クロマチンアクセシビリティ・プロファイルのリード密度を予測エンハンサー領域について計算し、RPKM単位で100,000個のランダムに選択した領域に対して比較した。本研究は、25個のロードマップ・クロマチンアクセシビリティおよびH3K27acプロファイルから、オープンクロマチン領域(.narrowPeak)および活性な調節エレメント(H3K27ac,.gappedPeak)と重複する予測エンハンサーの割合も計算した。転写因子結合濃縮解析については、ENCODE(wgEncodeRegTfbsClusteredV3.bed)によってキュレートしたP300および他の転写因子の結合座標をUCSCゲノムブラウザからダウンロードした。BEDTools交差を用いて少なくとも1bpの重複を同定した。進化的塩基配列保存性(evolutionary sequence conservation)のレベルをPhastConstスコア(Castelo R.phastCons100way.UCSC.hg19:UCSC phastCons conservation scores for hg19. R package version 3.2.0)を用いて評価した。エンハンサー中間点から500bp以内の最高スコアをエンハンサー保存スコアとして用いた。予め検出したエンハンサー領域を除いて、10,000個のランダムに選択した領域についても保存スコアを計算した。
【0101】
予測スーパーエンハンサーの同定
予測エンハンサーは、アノテートされた転写開始点(TSS)から少なくとも2.5kbにあり、H3K4me1の濃縮およびH3K4me3の枯渇も示す、濃縮されたH3K27acの領域として定義した。この研究のためのTSSアノテーションは、GENCODEバージョン19に由来した。H3K4me3/H3K4me1対数比をGC細胞株および1次試料から集約したH3K4me3およびH3K4me1シグナルを用いて計算した。高いH3K27acシグナルを示すが、高いH3K4me3/H3K4me1対数比(>2.4)を示す遠位予測エンハンサーは、誤った予測として分類し、従って、解析から除外した。次に、ROSEアルゴリズムを用いて、予測エンハンサーを予測スーパーエンハンサーまたは典型エンハンサーへ再分割した。複数のGC株にわたって少なくとも1つの塩基重複をもつ予測スーパーエンハンサー領域をBEDToolsを用いてマージし、予測スーパーエンハンサー領域とは別個の領域に局在している予測エンハンサーを予測典型エンハンサーと名付けた。個々の試料における予測典型または予測スーパーエンハンサーの存在をバックグラウンド超のH3K27ac濃縮のレベル(P<0.01,経験的検定)によって判定し、このレベルは、100,000個のランダムに選択した領域からのH3K27acシグナル(RPKM単位)であった。予測エンハンサー/スーパーエンハンサーを遺伝子へ割り当てるために、予測エンハンサー/スーパーエンハンサー中心から、ランダムに選んだ領域を超えるH3K27ac濃縮を伴うプロモーター(TSSにおける500bpのフランキング)として定義される、最近接の活性な転写開始点(TSS)への距離を算出した。反復性予測スーパーエンハンサーと関連付けられた遺伝子をフィシャーの片側正確検定を用いて癌遺伝子濃縮について試験した。上位500個の癌遺伝子を用いた。反復性予測エンハンサーおよび予測スーパーエンハンサーを同定するために、各GC株における領域をシグナル強度に従ってランク付けした。ランクプロダクト(rank prduct)を計算するために、複数の株にわたって各予測エンハンサー/スーパーエンハンサーのランクを乗算した。ランクプロダクトの統計学的有意性を判定するために、観測したランクプロダクトを帰無分布に対して比較し-各株におけるランクをリシャッフルして、ランクプロダクトを計算した。10,000回の反復についてリシャッフル手順を繰り返した。帰無分布未満の観測したランクプロダクトを統計学的に有意であると見做した。
【0102】
予測相互作用の検証
スーパーエンハンサー/遺伝子の割り当ては、3つの直交する相互作用データセットを用いて検証した。これらは、以下を含んだ。
i)12個の細胞株からPreSTIGEによって検出した所定の相互作用。シス調節エレメントおよび標的遺伝子を含む、PreSTIGE相互作用データは、PreSTIGEウェブサイト(prestige.case.edu)からダウンロードした。
ii)デフォルト・パラメータを用いたGREATによるシス調節エレメント/遺伝子の割り当て
iii)K562、HCT-116、NB4、MCF-7、HeLa-S3およびGM12878細胞におけるRNAPII ChIA-PET研究からのエンハンサー-プロモーター相互作用の参照セット。ChIA-PET相互作用データは、encodeproject.orgおよびGSE72816からダウンロードした。各生物学的レプリケートで同定したすべての相互作用を検証のために考慮した。これらの相互作用は、2つの遺伝子座(アンカー)を含み、一方は、TSSの2.5kb以内にあり、他方のアンカーは、本発明者らの研究において見出した予測スーパーエンハンサー領域と重複する。
【0103】
i)~iii)に加えて、GC株に対してCapture-C解析を用いて追加の検証を行った(
図4を参照)。
【0104】
機能的濃縮解析
反復性予測スーパーエンハンサー/遺伝子プロモーターまたは予測典型エンハンサー/遺伝子プロモーター相互作用において強化された生物学的プロセスを同定するために、GOrilla(遺伝子オントロジー・アノテーション)を用いた。デフォルトGOrillaパラメータを用い、GENCODE v19からの遺伝子をバックグラウンドとして用いた。比較可能性を確保するために、反復性予測スーパーエンハンサーと同数に一致させるべく、複数の細胞株にわたって最も高いH3K27acをもつ予測典型エンハンサーを選択した。前者を選択するために、予測典型エンハンサーを各株でランク付けして、ランクプロダクト・スコアに基づいてそれらを選んだ。次に、反復性予測スーパーエンハンサーと関連付けられた最も有意な項目(1.5倍超の濃縮)を上位の予測典型エンハンサーと関連付けられた濃縮レベルに対して比較した。より大きい遺伝子間領域が隣接する遺伝子に対してはGREATが補正を提供するため、GORillaに加えて、デフォルト・パラメータを用いたGREATを利用して、反復性予測スーパーエンハンサーおよび上位の予測典型エンハンサーと関連付けられた機能的濃縮をさらに調べた。有意な(濃縮も1.5倍超の)項目を二項p値(Binomial p-value)に基づいて順序付けた。
【0105】
1次試料における細胞株由来スーパーエンハンサー
2倍以上のH3K27ac濃縮または枯渇を示し、絶対値差分が0.5RPKMより大きい領域は、GCと対応する正常試料との間で差次的に存在すると見做した。主成分分析(PCA:principle component analysis)のために、2人以上の患者において体細胞増加を示す予測スーパーエンハンサーからのシグナルを用いた。PCA分析は、Rを用いて行い、「pca3d」パッケージを用いてプロットした。腫瘍および正常試料からの100個の予測スーパーエンハンサー(表2)の平均シグナルに基づいて、検定力80%および第1種の誤り5%(http://powerandsamplesize.com/)を達成するために必要なサンプルサイズを推定した。この結果は、推奨サンプルサイズ13(平均)をもたらし、本研究(19N/T)ではこれを満たした。1次試料に基づいて、3つのクラスの予測スーパーエンハンサー:i)体細胞増加、ii)体細胞欠失、およびiii)非変化を定義した。i)、ii)およびiii)と関連付けられた遺伝子を先にHnisz,2013において報告された遺伝子群へマッピングし、各遺伝子群がいくつかの遺伝子オントロジー・カテゴリーの編集物であり、様々な癌ホールマークの代わりとして用いられる。Rにおいてフィシャーの片側正確検定を用いて統計学的有意性を計算した。反復的に増加する体細胞予測スーパーエンハンサーの系列特異性を異なる組織タイプにわたって評価するために、胃の予測スーパーエンハンサー間の重複を他の非胃組織に対して計算した。観測した全重複対偶然による全重複に基づいて、各非胃組織との濃縮比を計算した。
【0106】
【0107】
【0108】
【0109】
Capture-Cおよびデータ解析
Capture-Cを先に簡潔に記載したように行い、1×107個の細胞を2%ホルムアルデヒドによって架橋し、溶解、均質化、DpnII消化、ライゲーションおよび解架橋がそれに続いた。オリゴキャプチャに適したDNAを生成するためにCovarisを用いてDNAを150~200bpへ超音波処理した。シークエンシングライブラリ調製(ニュー・イングランド・バイオラボ)のために3μgの剪断DNAを用いた。カスタマイズしたビオチン標識オリゴ(IDT,表3)への逐次的ハイブリダイゼーションおよびDynabeads(LifeTech)を用いた濃縮により、予測スーパーエンハンサー配列のダブルキャプチャ(double captured)を行った。キャプチャしたDNAをIllumina MiSEQ上で150bpペアエンド構成を用いてシークエンシングした。
【0110】
【0111】
【0112】
【0113】
【0114】
【0115】
【0116】
【0117】
【0118】
【0119】
アダプター配列を除去するために生のリードの前処理を行い(trim_galore,http://www.bioinformatics.babraham.ac.uk/projects/trim_galore/)、FLASHを用いて重複リードをマージした。hg19参照ゲノムへのショートリード・マッピングを達成するために、前処理の結果として生じたリードを、次に、DpnIIによってインシリコで消化し、Bowtie(p1,m2,best,およびstrata設定)を用いてアラインした。アラインしたリードは、Capture-C解析を用いてそれらを処理し、(i)PCRデュプリケートを除去して、(ii)サブフラグメントがキャプチャフラグメント内に含まれた場合にはそれらを「キャプチャ」として、それらがキャプチャフラグメントのいずれかの側の1kb以内にあった場合には「近接性除外(proximity exclusion)」として、またはそれらが「キャプチャ」および「近接性除外」の外部にあった場合には「レポータ」として分類した。加えて、この研究は、スケーリングしたバックグラウンドに対するビューポイントの有意な相互作用(Q<0.05,FDR)を同定し、さらに、異なる細胞株間で相互作用プロファイルを比較するために、キャプチャおよびレポーター・フラグメントに対してr3Cseqパッケージを用いた。
【0120】
4C-seqおよびデータ解析
4Cテンプレートをわずかな修正を伴う先に公表されたプロトコルを用いて調製した。手短かに言えば、培養細胞を単一細胞の懸濁物中に希釈し、クロマチンを室温において10分間、1%ホルムアルデヒトで架橋した。細胞を溶解し、架橋したDNAを主要な制限酵素HindIII-HF[R3104L,ニュー・イングランド・バイオラボ(NEB)]で消化した。次に、HindIII-で消化したDNAがT4 DNAリガーゼ(EL0013,サーモサイエンティフィック)を用いた近接性ライゲーション(proximity ligation)を受けて、Proteinase K(AM2546,アンビオン)を用いた架橋除去がそれに続き、3Cライブラリをもたらした。3Cライブラリは、次に、DpnII(R0543L,NEB)を用いた第2の制限酵素消化を受けて、T4 DNAリガーゼを用いた環状化反応がそれに続いた。ビューポイントごとに、スケールアップ・インバース、ネステッドPCR(scale-up inverse,nested PCR)(表4)を行うために3.2μgの結果として生じた4Cテンプレートを用いて、そのうちの32個の反応(各々が100ng)をプールし、MinElute PCR Purification kit(Qiagen)を用いて精製した。10μgのPCR産物を、次に、4~20% TBE PAGEゲル上に流した(ウェル当たり5μg)。ゲル上で、200bp~600bpのスメアを切り取り、不要なPCR産物のバンドを除去した。次に、Illumina MiSeq上の次世代シークエンシングのために、切り取ったゲル片からDNAを抽出した(2x250bp)。
【0121】
【0122】
インバースプライマー(inverse primer)をビューポイントの概念に従って設計した。関心領域の位置を決めるためにUCSCゲノムブラウザ[assembly:Feb.2009(GRCh37/hg19)]を用いた。HindIIIおよびDpnIIトラックの追加の際に、関心領域に隣接する2つHindIII制御部位を同定して、最近接のHindIIIおよびDpnII制限部位間の配列をビューポイント領域として選択した。この領域に基づいて、デフォルト設定に対する以下のアダプテーション、すなわち、58℃の最適プライマー融解温度、最低55℃および最高60℃;39および60%の間のGC含有量とともに、Primer-BLASTプログラム[National Center for Biotechnology Information(NCBI)]を用いて、プライマーの2つの対(アウターおよびネステッド)を設計した。次に、適切なアダプター(Nextera(登録商標)Index Kit-PCRプライマー,Nextera(登録商標)トランスポサーゼ配列)およびインデックス配列をネステッドプライマー対に追加した。この研究に用いたアウターおよびネステッドプライマーをそれぞれ表5および表4に提示する。
【0123】
【0124】
シークエンシングリードの5’末端におけるプライマー配列をTagDust2を用いてトリミングして、Bowtie2(2.2.6)を用いて参照ゲノム(hg19)へマッピングした。アラインされないリードは、それらを参照ゲノムへリアラインする前に、最初の50個の塩基対でトリミングした。MAPQ≧30によるユニークなマッピングリードのみを下流解析に用いた。非重複ウィンドウ・アプローチ(ウィンドウサイズ=5kb)を使用したr3Cseqを用いて、統計学的に有意な相互作用(Q<0.05,FDR)を検出した。Basic4CSeqを用いて4Cデータのシグナル・プロットを生成した。DNA増幅領域内で検出した相互作用は、除外した。次に、相互作用と重複するプロモーター(GENCODEv19からのアノテートされた転写開始点から+/-2.5kb)を用いて、相互作用を遺伝子に対してマッピングした。
【0125】
CRISPR/Cas9エンハンサー欠失
Feng Zhang研究室によって作成されたオンラインソフトウェア(http://tools.genome-engineering.org)を用いてCRISPR sgRNA標的検索を行った。sgRNA対は、欠失について同定したエンハンサーに隣接する配列を標的とするように設計した。端的には、エンハンサーの5’末端の100bp上流/20bp下流に対応する配列、およびエンハンサーの3’末端の20bp上流/100bp下流に対応する配列を検索のために用いた。コード領域オフターゲット(off-target)予測の最低レベルとのトップヒットを選んだ。sgRNAをpSpCas9(BB)-2A-GFPまたは-Puroベクター(Addgene)へクローニングした。端的には、オリゴヌクレオチドの対をCRISPR標的ごとに設計して、Integrated DNA Technologies,Inc.から調達した。次に、クローニングを容易にするために両側にオーバーハングを含むDNAデューレックスを形成すべくオリゴヌクレオチド対をアニールした。個々のエンハンサーの5’末端を標的とするために用いるガイドRNAをBbsI-消化pSpCas9(BB)-2A-GFPベクター中へクローニングし、一方で各エンハンサーの3’末端を標的とするsgRNAをBbsI消化pSpCas9(BB)-2A-Puroベクター中へクローニングした。インサートおよびベクターをT4 DNAリガーゼ(ニュー・イングランド・バイオラボ)を用いて連結した。DH5α細胞をライゲーション産物により形質転換して、アンピシリンを補充したLB寒天上に蒔いた。コロニーを選び取り、培養して、Wizard Plus SV Minipreps DNA Purification System(プロメガ)を用いてプラスミドを抽出した。サンガーシークエンシングを行うことによってプラスミドの配列を確認した。これらの実験に用いたオリゴヌクレオチドを表6にリストする。
【0126】
【0127】
【0128】
【0129】
SNU16およびOCUM-1細胞を10%FBS、1×P/Sおよび0.5×NEAAを補充したRPMI中で80~90%のコンフルエンスへ成長させた。細胞を収集し、遠心沈殿させて、37度で5分間Typsinを用いて処理し、単一細胞の懸濁物を達成するためにピペッティングによって再懸濁した。細胞数をカウントし、細胞をResuspension(再懸濁)バッファー(R)中に1×107細胞/mlで再懸濁する前に1×PBSで一回洗浄した。1mlのResuspensionバッファー中の1×107細胞ごとに、25μgのpCas9-GFP-sgRNAおよび25μgのpCas9-Puro-sgRNAプラスミドをSNU16またはOCUM-1細胞と混合した。3mlのElectrolytic Buffer(電解質バッファー)(E2)を含んだNeonチューブ中で100μlのNeonピペットを用いて100μlの各細胞懸濁物のエレクトロポレーションを行った。エレクトロポレーション条件は、Pulse,V1050,MS30,Number2であった。エレクトロポレーション後に、10%FBS、1×P/Sおよび0.5×NEAAを補充した8mlのRPMI上に細胞を蒔いた。最初のトランスフェクションの24時間後に、細胞を10μgのピュロマイシンで48時間処理して、残りのGFP陽性細胞をFACSを用いてソートした。次に、残りの生存細胞(GFP陽性およびピュロマイシン耐性の両方)をノックアウト効率を推定するためにqPCRを用いて引き続き解析した。
【0130】
CRISPR/Cas9標的細胞における個々のエンハンサーの欠失の効率を判定するために、定量的PCR(qPCR:Quantitative PCR)を行った。標的および(プールした)非標的細胞のゲノムDNAをAllPrep DNA Micro Kit(QIAGEN)を用いて抽出し、CFX96 TouchリアルタイムPCR検出システム(バイオ・ラッドラボラトリーズ社)上でKAPA SYBR FAST qPCR Master Mix(Kapa Biosystems)を用いてテクニカルトリプリケート(technical triplicates)でqPCRに供した。これらの反応に用いたプライマーを表6にリストする(それらの名前に「Int」が付いたプライマーをこの目的に用いた)。GAPDH遺伝子に対して正規化して非標的化細胞と比較した、比較CT(ΔΔCT)法を用いてゲノムDNA試料中に存在する特異的標的化領域の相対量を算出した。
【0131】
前述のプロトコルを用いて、ソートした細胞からゲノムDNAを抽出した。端的には、細胞を0.5×Direct-Lyseバッファー(10mM Tris pH8.0,2.5mM EDTA,0.2M NaCl,0.15%SDS,0.3%Tween-20)中で粉砕して、65℃30秒間、8℃30秒間、65℃1.5分間、97℃3分間、8℃1分間、65℃3分間、97℃1分間、65℃1分間、および80℃10分間の加熱冷却プログラムに供した。その後、ライセートを水中でおよそ4倍に希釈し、Taq DNAポリメラーゼ(ライフテクノロジーズ)を用いて20μlのPCR反応を行うために3μlの稀釈したライセートを用いた。用いたプライマーは、表6中にある(エンハンサーごとに「5’F」および「3’R」のプライマー対)。
【0132】
遺伝子発現レベルを測定するためのRT-qPCR
GFP陽性細胞に対して細胞をFACSソートし、AllPrep DNA/RNA Micro Kit(QIAGEN)を用いて細胞からすべてのRNAを抽出した。iScript Select cDNA Synthesis Kit (バイオ・ラッド)をランダムプライマーとともに用いて、プールした細胞に対して逆転写を行った。CFX384 TouchリアルタイムPCR解析システム(バイオ・ラッド)上でTaqMan Gene Expression Master MixおよびTaqManプローブ(アプライドバイオシステムズ)を用いてqPCRを実施した。すべてのqPCR実験をトリプリケートで実行し、mRNAレベルを判定するために平均値を用いた。参照遺伝子としてGAPDHおよび式2-ΔΔCTを用いた比較CT法を利用して相対的定量化を行った。
【0133】
コピー数変化およびDNAメチル化
胃腫瘍および対応する正常胃組織からのゲノムDNAをAffymetrix SNP6.0アレイ上でハイブリダイズした。(Affymetrix,サンタクララ,カリフォルニア,米国)。.CELフォーマットのデータを以下の順序で処理した、(1)正規化:Affymetrix Genotyping Console4.2を用いて、生の.CELファイルを処理した。ハイブリダイゼーション・バッチによる正常胃組織のSNP6.0プロファイルから参照モデルを作成した。1次正常試料からの参照モデルを用いて、細胞株および1次腫瘍試料におけるコピー数の変化を判定した。(2)セグメンテーション:DNAcopy Rパッケージに実装されたcircular binary segmentation(CBS)アルゴリズムを用いて、コピー数のセグメンテーション・データを生成した。変化点を検出するためのp値カットオフが0.01、順列数が10,000であった。コピー数増加および欠失領域を、それぞれ、平均対数比>0.6および<-1.0を示すために定義した。DNAメチル化レベルをアッセイするために、さらにIllumina HumanMethylation450(HM450)Infinium DNAメチル化アレイを用いた。methylumi R BioConductorパッケージを用いて、メチル化β値を算出し、バックグラウンドを補正した。BMIQ法(Rにおけるwatermelonパッケージ)を用いて正規化を行った。
【0134】
RNAseqおよび解析
すべてのRNAをQiagen RNeasy Miniキットを用いて抽出した。RNA-seqライブラリを、製造業者の使用説明書に従って、Illumina Stranded Total RNA Sample Prep Kit v2(イルミナ,サンディエゴ,カリフォルニア,米国)、Ribo-Zero Goldオプション(Epicentre,マジソン,ウィスコンシン,米国)および1μgトータルRNAを用いて構築した。完成したライブラリをAgilent Bioanalyzer(アジレント・テクノロジー,パロアルト,カリフォルニア)を用いて検証し、Illumina Cluster Stationを介してIlluminaフローセルへ適用した。ペアードエンド101bpリードオプションを用いてシークエンシングを行った。TopHat2-2.0.12(デフォルト・パラメータおよび--library-type fr-firststrand)を用いて、RNA-seqリードをヒトゲノム(hg19)へアラインした。マッピングリードの塩基配列ごとの品質および配列ごとの品質スコアをFastQCバージョン0.10.1(http://www.bioinformatics.babraham.ac.uk/projects/fastqc/)を用いて評価した。遺伝子レベルにおける転写物存在量をCufflinksによって推定した。ゼロより大きい変動を示す1次サンプルからの遺伝子発現をComBatを用いて潜在的なバッチ効果に対して補正した。遺伝子発現値は、FPKM単位で測定した。群間の差次的な発現を少なくとも2倍変化した発現および0.5FPKMの絶対値差分を示す遺伝子として同定した。
【0135】
生存解析
k-medoidsアプローチを用いて7つの独立した研究からのGC試料をクラスター化した。すべての7つの研究において発現値をもつ遺伝子のみを解析に用いた。アウトカム・メトリック(outcome metric)として全生存期間を用いたカプランマイヤー生存解析を採用した。カプランマイヤー曲線の有意性を評価するためにログランク検定を用いた。コックス回帰を用いて、年齢、腫瘍段階、Laurenの組織学的サブタイプおよび地域性(アジア人対非アジア人)のような、追加変数を伴う多変量解析を行った。
【0136】
疾患関連SNP解析
形質関連SNPをゲノムワイド関連研究(2015年8月27日)のUCSCブラウザからダウンロードした。この研究のために、本発明者らは、非コード領域で発生するSNPに焦点を合わせて、コード領域内のSNPを除外した。各形質/疾患からのSNPと体細胞予測スーパーエンハンサーとの間の重複をBEDtools‘intersect(交差)’を用いて計算し(nGWAS)、nGWASを予測スーパーエンハンサーの外部の疾患関連SNPの総数(nGWAS’)に対して比較した。追加の対照として、一般に用いられる2つのSNPアレイ(Illumina HumanHap550およびAffymetrix SNP6)からのすべてのSNPのセットを用いて、「SNPバックグラウンド」モデルを作成した。予測スーパーエンハンサーと重複するSNPバックグラウンドからのSNPの数を算出して(nBackground)、予測スーパーエンハンサーの外部のバックグラウンドSNPの総数(nBackground’)に対して比較した。予測スーパーエンハンサーにおける正常SNPの比をnBackground/nBackground’として計算した。予測スーパーエンハンサーにおける疾患関連SNP数の増加がこれらの領域におけるSNPの高出現率と関連付けられると予想すると、本発明者らの帰無仮説は、結果として、疾患関連SNPの比と正常SNPの比(濃縮比)との間に何も差がないということである。統計学的に有意と見做される濃縮p値<0.01を用いて、カイ二乗検定を実施した。リスク関連SNPとヒストン修飾との間の関係を理解するために、本研究は、少なくとも2つの独立した研究において疾患と関連付けられるがわかった胃腸疾患(例えば、潰瘍性大腸炎および結腸直腸癌)で検証されたSNPを同定した。GATK Unified Genotyperを用いて、試料を疾患関連SNPの存在に基づいて2つの群に分類した。疾患関連SNP有りまたは無しの試料において腫瘍と、対応する正常との間でH3K27acシグナルの差を比較した。
【0137】
転写因結合モチーフ解析
本研究は、ReMapデータベースを用いて、体細胞増加予測スーパーエンハンサーおよび非変化予測スーパーエンハンサーにおける転写因子の濃縮を調べた。予測スーパーエンハンサーと少なくとも60%が重複した転写因子部位をカウントして、上位10個の最も濃縮された転写因子のランクを比較した。転写因子の結合密度は、領域の100万塩基対(Mbp)の単位のトータルサイズで除した、その領域で検出した全結合部位として計算した。CDX2については、他の転写因子の近接した結合を予測するために、HOMERをデフォルト・パラメータとともに用いて反復的に増加する体細胞予測スーパーエンハンサーにおいてCDX2結合部位を検査した。HOMER出力から同定した上位20個の転写因子を発現相関解析のために用いた。加えて、PScanChIPをJASPAR2016とともに用いてCDX2共結合モチーフも同定した。CDX2と潜在的な共結合パートナーとの間の発現相関(スピアマンの相関)を評価した。
【0138】
siRNAトランスフェクション
製造業者の使用説明書に従って、Dharmafect 1トランスフェクト剤を用い、6ウェルプレートにおいて細胞(2×10
5)に50nMでトランスフェクトするために、ON-TARGETplus Human siRNA SMARTpools(HNF4αおよびCDX2)、individual ON-TARGETplus Human individual siRNAs(HNF4α)ならびにON-TARGETplus Non-targeting siRNA対照(Dharmacon/サーモフィッシャーサイエンティフィック)を用いた。定量的RT-PCRおよび/またはウエスタンブロット解析を用いて、72時間のRNAi処理後のノックダウン効率を検査した(
図23)。
【0139】
ウエスタンブロッティング
細胞(2×105)をRIPAバッファー(シグマ)中に収集して、氷上で10分間溶解させた。Pierce BCAタンパク質アッセイ(サーモサイエンティフィック)を用いて上清の濃度を測定した。ライセートを探索するために、CDX2(1:500;MU392A-UC,Biogenex),HNF4α(1:1000;sc-8987,Santa Cruz Biotechnology)およびGAPDH(1:3000;60004-1-Ig,Proteintech Group)抗体を用いた。
【0140】
定量的RT-PCR
すべてのRNAをRNeasy Mini Kit(Qiagen)を用いて単離して、DNAをRNase-Free DNase Set(Qiagen)を用いて除去した。Superscript III First Strand Synthesis System (Invitrogen)を用いて2ugのRNAを逆転写し、相補的DNAをSYBRGreen PCR Master Mix(アプライドバイオシステムズ)を用いて増幅した。倍率変化をGAPDHへ正規化した。プライマー配列は、次の通りである。HNF4α:F1-5’GTGCGGAAGAACCACATGTACTC3’(SEQ ID NO:143)、R1-5’CGGAAGCATTTCTTGAGCCTG3’(SEQ ID NO:144)、F2-5’CTGCAGGCTCAAGAAATGCTT3’(SEQ ID NO:145)、R2-5’TCATTCTGGACGGCTTCCTT3’(SEQ ID NO:146)、F3-5’TGTCCCGACAGATCACCTC3’(SEQ ID NO:147)、R3-5’CACTCAACGAGAACCAGCAG3’(SEQ ID NO:148);CDX2:F1-5’GCAGCCAAGTGAAAACCAGG3’(SEQ ID NO:149)、R1-5’CCTCCGGATGGTGATGTAGC3’(SEQ ID NO:150)、F2-5’AGTCGCTACATCACCATCCG3’(SEQ ID NO:151)、R2-5’TTCCTCTCCTTTGCTCTGCG3’(SEQ ID NO:152);GAPDH:F-5’CCAGGGCTGCTTTTAACTC3’(SEQ ID NO:153)、R-5’GCTCCCCCCTGCAAATGA3’(SEQ ID NO:154)。
【0141】
CDX2およびHNF4α ChIP-seqおよび解析
細胞を室温において10分間、1%ホルムアルデヒトで架橋し、0.2Mの最終濃度までグリシンを添加することにより停止した。クロマチンを抽出して、500bpへ超音波処理した。クロマチン免疫沈澱(ChIP)のために、CDX2(MU392A-UC,Biogenex)およびHNF4α(sc-8987,Santa Cruz Biotechnology)抗体を用いた。ChIPのために、製造業者のプロトコル(ニュー・イングランド・バイオラボ)に従ってChIPed DNA(10ng)をDNAシークエンシング(ChIP-seq)ライブラリ・コンストラクション(library construction)とともに用いた。ChIP-seqピーク抽出(peak calling)を正規化するために、免疫沈降前の細胞からの入力DNAを用いた。シークエンシング前に、陽性および陰性対照ChIP領域が線形範囲内で増幅したことを検証するためにqPCRを用いた。バイオアナライザー(アジレント・エクノロジー)を用いて、ライブラリ試料のサイズ分布をチェックした。腸型およびびまん型GC(腸型10個,びまん6個)に特異的な反復的に増加する予測スーパーエンハンサーを比較した最初の解析では、2つのサブタイプ間でCDX2結合における有意差は何も観測されなかった。しかしながら、CDX2発現には同じサブタイプの個々の腫瘍間で高いサブタイプ内の変動性があることをより深い解析が明らかにし、これは、CDX2発現が腸サブタイプGCと絶対的に関連付けられるわけではないというこれまでの報告と一貫性がある。従って、この研究は、GCをそれらの個々のCDX2発現レベルによって順序付けて調べる、相補的な解析を行った。次に、高(n=8)および低(n=8)CDX2発現を示したGC試料において同定した反復性体細胞増加予測スーパーエンハンサーにおけるCDX2結合密度を計算した。差次的な結合シグナル解析は、1次試料において体細胞増加を示すか、もしくは何も変化を示さず、OCUM-1またはSNU16細胞株においても検出されたそれらの予測スーパーエンハンサーに跨る200ビンについてCDX2およびHNF4αに対する結合シグナルを計算した。シグナルは、RPKM単位で測定した。H3K27ac強度に対する転写因子(TF)ノックダウンの効果を推定するために、独立した野生型(WT:wild type)試料間で観測したH3K27acシグナル変動を備える内部標準を定義した。TFサイレンスした(siCDX2、siHNF4α、およびダブルTF)試料に対するWT試料間の差を測定し、次に、それらの差をこのバックグラウンド変動に対して比較した。バックグラウンド変動の差>99%のサブ領域をH3K27ac枯渇と称し、一方でバックグラウンド変動の差<1%をH3K27ac増加と称した。予測スーパーエンハンサーに対応するH3K27ac枯渇サブ領域の統計学的な濃縮をフィシャーの片側正確検定を用いて実施した。差次的な領域と、近接するCDX2/HNF4α結合部位へのそれらの距離との関係を調べるために、領域をそれらの距離分布に基づいて3つのカテゴリー(近い、中間、遠位)にさらに分離した。H3K27ac枯渇サブ領域と、CDX2-HNF4α共結合部位との間の距離を解析するために、CDX2およびHNF4α頂点間の中点位置を用いた。TFサイレンスした細胞における遺伝子発現と体細胞増加予測スーパーエンハンサーとの間の関連付けを調べるために、本発明者らは、1次試料においてH3K27ac予測スーパーエンハンサー・シグナルと有意な正の発現相関を示し(r>0.4;P<0.05;両側t検定)、GC細胞株においても観測した予測スーパーエンハンサーに連結された遺伝子を選択した。予測スーパーエンハンサー標的遺伝子発現に対する転写因子ノックダウンの有意性を評価するために、順列アプローチを用いた。具体的には、TFサイレンシング後にH3K27ac枯渇を示す予測スーパーエンハンサーに焦点を合わせて、本発明者らは、遺伝子への実際のスーパーエンハンサーの割り当てを10,000回並べ替えた。次に、並べ替えた遺伝子/スーパーエンハンサー・セットにおける下方制御された遺伝子の数が、実際の遺伝子/スーパーエンハンサー・セットにおける下方制御された遺伝子の実験的に観測した数を超過する回数をカウントすることによって、経験的なP値を導出した。
【0142】
データ利用可能性
本研究の間に発生させたヒストンNanoChIP-seq(GSE76153およびGSE75898)、SNPアレイ(GSE85466)、RNA-seq(GSE85465)およびDNAメチル化データ(GSE85464)は、Gene Expression Omnibusに寄託した。先に寄託し、この研究に用いたヒストンChIP-seq(GSE51776およびGSE75595)ならびにSNPアレイ(GSE31168およびGSE36138)は、Gene Expression Omnibusにおいて入手可能である。エピゲノムロードマップからの正常胃組織のクロマチンアクセシビリティ・プロファイルは、Gene Expression Omnibus(GSM1027325、GSM1027320)から得た。この研究において解析したRNAPII ChIA-PETデータは、encodeproject.orgおよびGene Expression Omnibus(GSE72816)から得た。
【0143】
結果
GC細胞株の遠位予測エンハンサーの景観
Nano-ChIPseqを用いて、19個の1次GC、19個の対応する正常胃組織、および複数のヒストンH3修飾(H3K27ac、H3K4me3、H3K4me1)をカバーする11個のGC細胞株から110個のクロマチン・プロファイル(プロファイル当たり平均約3.3×10
7リード)を発生させた。1次GCの臨床情報および分子分類を表8に、シークエンシング統計データを表1に、GC株に関する臨床病理学的詳細を表9に提示する。このシリーズは、腺癌を形成する10個の腺(53%、腸型)、高浸潤性孤立細胞をもつ6個の試料(32%、びまん型)および混合組織の3個のGC試料(15%)を含んだ。腫瘍(n=12)のうちの60%超がステージ3以上(AJCC第7版)であった。マッピング品質フィルターにおける変更、生物学的レプリケートおよびプロモーターChIP濃縮の解析、ならびに品質管理ソフトウェアCHANCE(CHip-seq ANalytics and Confidence Estimation)による評価を含めて、Nano-ChIPseqデータの広範な品質管理解析を行った。マッピング閾値の厳しさを(MAPQ≧10から20へ)増加させても、マッピング統計を感知できるほど変化させることはなく-全マッピングリードのうちの90%超が維持されて、それぞれ、ChIP濃縮ピークのうちの85%および予測エンハンサーのうちの98%を再発見した(
図7)。Nano-ChIPseqによって発生させたKATO-III細胞の生物学的レプリケート間の、さらに従来のChIP-seqによって発生させた独立したKATO-III H3K27acデータに対する、ヒストンピークの一致は、高い再現性(約85%および約90%の重複)(
図8)を確認した。高発現タンパク質コード遺伝子と関連付けられた1,000個のプロモーターにおける入力および入力で補正したH3K27acならびにH3K4me3シグナルの比較は、それぞれ、50個のうちの48個(96%)のH3K27acおよび42個のうちの42個(100%)のH3K4me3ライブラリにおける好結果の濃縮を明らかにした。ChIP濃縮のCHANCE解析は、特に(プロモーターにおいて枯渇した)H3K4me1について、試料の大多数(85%)が好結果の濃縮を示すことを明らかにした(方法)。これらの結果は、Nano-ChIPseqコホートの良好な技術的品質を実証する。Nano-ChIPseqに加えて、さらに、DNAメチル化解析(Infinium HumanMethylation 450K BeadChipアレイ)、コピー数解析(AffymetrixSNPアレイ)およびIllumina RNA-シークエンシングのために試料を処理した。
【0144】
【0145】
【0146】
一次組織における間質性汚染がゲノム結果に影響を及ぼしかねないことをこれまでの研究が示し、細胞株が本質的に純粋に上皮性であり、最も高いデータ品質を有することから、GCにおける癌関連遠位エンハンサーを発見するための発見コホートとしてGC細胞株を選んだ。本研究は、複数のGC試料中に存在し、個別化された細胞株の特徴と関連付けられた「プライベートな」エピジェネティック変化の導入を低減する、反復性エピジェネティック変化にも焦点を合わせる。第1に、活性なプロモーターおよびエンハンサーをマークすることがこれまでに示されたH3K27acシグナルに基づいて、ゲノムワイド・シス調節エレメントをマッピングした。エンハンサーエレメントを濃縮するために、本研究は、既知のアノテートされた転写開始点(
図1a)から遠く離れた位置にある(TSS;>2.5kb)H3K27acシグナルに焦点を合わせた。本研究は、次に、集約したH3K4me1およびH3K4me3データを用い、高H3K4me3/H3K4me1対数比(>2.4)を示す予測エンハンサーを解析から除外して、エンハンサー予測をさらに精緻化した。このアプローチを用いて、GC株において3,017~14,338個の推定上の遠位エンハンサーを同定し(
図1b)、平均ゲノムフットプリントは、25Mb/株であった。
【0147】
合計すると、本研究は、約140Mbまたはヒトゲノムのおよそ5%に及ぶ、36,973個の予測遠位エンハンサー領域を検出した。予測エンハンサーは、二峰性H3K27acシグナル分布(
図1b)を示し、H3K4me3が枯渇し、H3K4me1シグナル(
図1cおよび
図9)が濃縮された。これらのH3K27ac濃縮領域の目視比較は、いくつかの領域が複数の株において活性(「反復性」)であり、一方で他の領域は、1つの株のみで活性(「プライベート」)であることを明らかにした。予測エンハンサーのうちのおよそ47%が反復性であり、少なくとも2つのGC細胞株において活性を示した(
図1d)。反復性エンハンサーのパーセンテージは、プロモーターと比較して著しくより低く(67%対47%,P<2.2×10
-16,片側比率検定)、エンハンサー活性が複数のGC細胞株にわたって非常に可変的であることを示す。
【0148】
予測エンハンサーを公的に利用可能なエピゲノム・データセットを統合することによって検証した。エピゲノムロードマップからの正常胃組織のDNaseI高感受性データを用いると、予測エンハンサーではDHSシグナル分布(log変換したRPKM)がランダムに選択した領域より著しくより大きく(P<2.2×10
-16,ウェルチの片側t検定;
図1e,方法)、予測エンハンサーがオープンクロマチンと関連付けられることを示すことがわかった。9個の異なる組織および細胞カテゴリーのDHSおよびH3K27acデータに対して比較したときに、予測エンハンサーは、消化および上皮組織(胎児の腸、胃、および小腸)からのDHS陽性およびH3K27ac陽性領域と最も高い重複を示し、血液またはT細胞のような非上皮組織タイプとは別個であった(
図1f)。それらの調節潜在力を支持して、予測エンハンサーのうちの54%(n=20,127)がEP300結合部位と関連付けられ(
図1g;P<0.001、経験的検定)、92%が転写因子(TF)結合部位と関連付けられた。DNA配列レベルでは、予測エンハンサー配列のうちの63%が進化的に保存されていた(
図1h;P<0.0001、経験的検定)。
【0149】
スーパーエンハンサーは、癌シグネチャー(cancer signature)中に濃縮される
ROSEアルゴリズムを用いて、全体として3,759個の非冗長予測スーパーエンハンサーを包含する、GC株当たり133~1,318個の予測スーパーエンハンサーを同定した(
図2a)。従って、GC細胞株の予測エンハンサーのうちの約10%が予測スーパーエンハンサー活性と関連付けられると推定される。予測典型エンハンサーと比較して、予測スーパーエンハンサーは、反復性が著しくより強い傾向を示し(
図2b;片側比率検定,P<2.2×10
-16)、3,345個の予測スーパーエンハンサーが少なくとも2つのGC細胞株において活性であった。注目したのは、既知のタンパク質コードGC癌遺伝子(例えば、MYCおよびKLF5;
図10a)と関連付けられた予測スーパーエンハンサー、さらに、長鎖非コードRNA(lncRNA:long-noncoding RNA)をコードする、MALAT1遺伝子座(
図2c)のような非タンパク質コード遺伝子領域にある予測スーパーエンハンサーがGC増殖を促進することが最近示されたことである。
【0150】
最近接の活性TSSを示す領域(プロモーターにおいて、アノテートされたTSSの500bp以内におけるH3K27ac濃縮として定義される)に基づいて、予測スーパーエンハンサーを標的遺伝子へ割り当てた。予測スーパーエンハンサー/遺伝子相互作用のうちの53%のみが最も近い近位遺伝子(closest proximal gene)を伴った(方法を参照、平均距離76kb)。予測スーパーエンハンサー/遺伝子の割り当ては、3つの直交する相互作用データセット:(i)PreSTIGEによって予測された所定の相互作用、(ii)GREAT、および(iii)公表されたRNAPII ChIP-PETデータ(encodeproject.org,GSE72816)を用いて検証した。タンパク質コード遺伝子との2,677個の予測相互作用のうちで、88%がこれら3つのデータセットのうちの少なくとも1つによって支持された(
図11)。i)~iii)における後者の検証データのための生体試料が胃組織を含まなかったので(後続セクションを参照)、この数は、下限値であると思われる。予測スーパーエンハンサーと関連付けられた生物学的テーマを理解するために、本研究は、GOrillaパスウェイ解析を適用し、癌発生とおそらく関係する生物学的プロセス、例えば、シグナル伝達、プログラム細胞死、および細胞増殖が予測スーパーエンハンサー連結遺伝子と強く関連付けられることを見出した(p値6.7×10
-22~2.3×10
-13,GOrillaによる超幾何検定)(
図2d)。これらのプロセスの多く(例えば、プログラム細胞死、細胞増殖の調節)は、反復性予測スーパーエンハンサーをGREATによって解析したときに有意に関連付けられたままであり、これらの濃縮は、大きい遺伝子間領域が隣接した遺伝子に対するバイアスには起因しないことを示した(
図12)。上位の予測典型エンハンサーに連結された遺伝子を採用した同様の解析は、より少ない度合いの濃縮をもたらした(
図2d)。予測スーパーエンハンサー関連遺伝子は、癌遺伝子についても濃縮された(P=1.7×10
-8,フィシャーの片側正確検定)。遺伝子発現へ相関付けられたときには、反復性予測スーパーエンハンサーおよび典型エンハンサーと関連付けられた遺伝子がいずれもRNA発現と有意に相関付けられた(
図10b)。
【0151】
1次腫瘍におけるスーパーエンハンサーの異質性
どの細胞株の予測スーパーエンハンサーが体細胞変化とも関連付けられるかをインビボで判定するために、本研究は、19個の1次GCおよび対応する正常胃組織にわたってH3K27ac濃縮レベルをこれらの領域について比較した。これまでの研究が、限られた標本サイズに起因して、GCの個別的な分子サブタイプの存在を示唆したのに対して、現在の研究は、対応する正常組織と比較して、複数のGC組織中に保存された予測エンハンサーの差に焦点を合わることを選んだ(考察を参照)。解析の前に、公表されたプロファイルに対する相関付け(セクション「エピゲノムロードマップに対する1次胃非悪性試料の比較」を参照)によって、1次胃正常試料が胃上皮を確かに反映していることを確認した。3,759個の細胞株の予測スーパーエンハンサーのうちで、3分の2が腫瘍と対応する正常試料との間で差次的な濃縮を示した(
図3a、表2、以降は体細胞が変化したと称する)。予測スーパーエンハンサーのうちの半数近く(n=1,748;47%)が2つ以上の1次GCにおいて体細胞増加(腫瘍における2倍超の濃縮,最小0.5RPKMの差)を示し、これらの増加した予測スーパーエンハンサーを用いた主成分分析(PCA)は、GCと対応する正常組織との間の分離を確認した(
図3b)。これらの結果の一貫性を支持して、すべての品質管理基準に合格したそれらの正常/腫瘍(N/T)1次対(14対、前を参照)のみを用いたときに、これらの反復性体細胞増加予測スーパーエンハンサーのうちの圧倒的多数(85%、1.5超の倍率変化閾値)を再発見した。予想外に、癌細胞株におけるそれらの活性にも係わらず、予測スーパーエンハンサーのうちの実質的な比率(18%)が、1次GCにおける増加ではなく、むしろ体細胞欠失と関連付けられた(
図3a)。これらの後者の領域は、1次腫瘍ではエピジェネティックにサイレンスされたが、インビトロ培養の間に細胞株中で再活性化された領域を表すかもしれない可能性がある(
図13a)。予測スーパーエンハンサーのうちの11%(n=416)は、GCおよび正常組織間で変化しないH3K27acレベルを示し(
図3a、
図13b)、これらの領域は、癌関連ではないが「ハウスキーピング」または一般的な組織機能に関係することと一貫性があった。最後に、細胞株の予測スーパーエンハンサーのうちの21%(n=808)は、解析のための1次試料において十分なH3K27ac濃縮を示さなかった(RPKM<0.5)(
図13c)。興味深いことに、このクラスは、GC株における低反復性とも関連付けられた(
図3a-黒いヒストグラム)。全体として解釈すると、これらの結果は、細胞株に由来する予測スーパーエンハンサーを1次腫瘍および対応する正常対照からのヒストン修飾データを用いて少なくとも3つのカテゴリー-体細胞増加、体細胞欠失、および非変化へさらに下位分類できることを実証する。上位100個の体細胞予測スーパーエンハンサーのリストを表2に提示する。
【0152】
それらの生物学的特殊性を支持して、3つのカテゴリーに属する予測スーパーエンハンサーは、インビボで他のエピジェネティックな差も示す。例えば、H3K27acにおける予測スーパーエンハンサーの変化は、H3K4mea1のエンハンサーマークの変化と同様に相関付けられ(
図3c)、DNAメチル化レベルにおいては体細胞増加予測スーパーエンハンサーが著しくより低いDNAメチル化レベルを示し、一方で体細胞欠失スーパーエンハンサーは、増加したDNAメチル化を示した(P=3.8×10
-229、ウェルチ片側t検定)。非変化予測スーパーエンハンサーは、中間領域を占めた(
図3d)。視覚的な例として、ABLIM2遺伝子座において体細胞増加予測スーパーエンハンサーへマッピングした、GC T2000721ではその対応する正常(N2000721)と比較して減少したDNAメチル化(より低いベータ値によって示される)を観測した(
図3e)。対照的に、T2000639ではSLC1A2予測スーパーエンハンサーにおけるH3K27acシグナルの体細胞欠失がN2000639と比較して増加したDNAメチル化を示した(
図3f)。これらの結果は、胃組織における予測スーパーエンハンサーの生物学的および分子的異質性をさらに支持する。
【0153】
スーパーエンハンサーは、複雑なクロマチン相互作用を示す
コピー数データとの統合は、体細胞予測スーパーエンハンサーのうちの過半数がコピー数中立領域に局在化されることを明らかにした(
図14a~c、「胃癌におけるコピー数変化と予測スーパーエンハンサーとの間の関連付け」と題するセクション)。予測スーパーエンハンサーと遺伝子発現との間の関連付けを検討するために、本研究は、先のパスウェイ解析(
図2)と同じ予測スーパーエンハンサー/遺伝子の割り当てを用いて、同じ1次試料からのRNA-seq情報を調べた。体細胞増加予測スーパーエンハンサーは、対応する正常試料と比較して、高められた遺伝子発現と関連付けられ、一方で体細胞欠失予測スーパーエンハンサーは、減少した発現と関連付けられた(P<2.2×10
-16、ウェルチ片側t検定;
図4a)。
【0154】
これまでの調査は、エンハンサーが複数の遺伝子の発現に影響を及ぼしうる長距離クロマチン相互作用にしばしば関与することも示した。GCにおける体細胞予測スーパーエンハンサーと関連付けられた長距離相互作用を同定するために、本研究は、1次腫瘍試料では反復性体細胞増加を示し、さらにGC株では活性を実証する領域から選択した、36個の予測スーパーエンハンサーについて相互作用を調査すべく、Capture-C技術を適用した。3つのGC細胞株(OCUM-1,SNU16,KATO-III)を解析し、36個の予測スーパーエンハンサーにわたって複数のゲノム位置(n=92,「キャプチャポイント」と呼ばれる)を探索して、有意な相互作用を伴う88個のキャプチャポイントを同定した(Q<0.05,r3Cseqパッケージ)。
図4bは、20個のキャプチャポイントをカバーする12個の代表的な予測スーパーエンハンサーを示す。平均すると、各予測スーパーエンハンサーは、それぞれ他のゲノム位置およびプロモーターとの20~26および5~7の相互作用を示した。キャプチャポイントと検出した相互作用との間の平均距離は、およそ17.0kb(標準偏差:30.5kb)であった。本研究は、OCUM-1細胞における約100kbの距離のTM4SF4プロモーターとの予測スーパーエンハンサー相互作用を含めて、より長距離の相互作用も同定した(
図15)。注目すべきことに、情報を与える相互作用データをもつ領域については、実験的なCapture-C情報の利用可能性が元の予測スーパーエンハンサー/遺伝子相互作用のうちの93%(n=62)のさらなる検証も許容する。細胞株からの発現データの統合は、相互作用するプロモーターのうちの約70%が検出可能な遺伝子発現(FPKM>0)と関連付けられることを明らかにした。
【0155】
代表的な例として、
図4cは、SNU16細胞におけるCLDN4ゲノム領域の長距離相互作用の景観(他の例については
図16)を示す。CLDN4発現がGCの進行および予後とこれまでに関連付けられていたので、この領域を選択し、CLDN4予測スーパーエンハンサーの反復性の増加を複数の1次GCにおいて観測した(
図14d)。具体的には、本研究は、高いH3K27acシグナルと、さらにCDX2およびHNF4α共結合(以下を参照)とを示す2つの予測サブ・スーパーエンハンサー領域を伴う相互作用を検討することを目指した。CLDN4プロモーターとの相互作用に加えて、他の遠位プロモーター(約100kbまで)、例えば、WBSCR27、CLDN3、ABHD11およびABHD11-AS1との相互作用も検出した。ABHD11-AS1は、長い非コードRNAであり、胃癌において高発現することがこれまでに示された。Capture-Cデータを検証するために、本研究は、2つのGC株(OCUM-1,SNU16)における4つの選択された予測スーパーエンハンサーに対して環状染色体コンフォメーション・キャプチャアッセイ)(4C:circularized chromozome conformation capture asays)も行った(
図17)。4C実験レプリケート間の一致率と同様の、Capture-Cおよび4Cデータ間の75%の一致を観測した(
図18)。4Cシークエンシングが著しくより奥深いことに起因して、さらなる相互作用、例えば、約350kbの距離における予測スーパーエンハンサーとKLF5プロモーターとの間の長距離相互作用(
図17b)も検出した。
【0156】
これまでの報告は、いくつかの長距離相互作用がスーパーエンハンサー活性と関連付けられ、一方では他の相互作用がより不変で細胞系譜を反映することを示唆した。これらの知見と一致して、GC株間で差次的な活性を呈する(36個からの)22個の予測スーパーエンハンサーのうちで、4個の予測スーパーエンハンサーは、予測スーパーエンハンサー活性と長距離相互作用の存在との間の良好な相関を示した(
図4dおよび
図19)。残りの18個の予測スーパーエンハンサーについては、予測スーパーエンハンサー活性とは独立して長距離相互作用を観測した。
【0157】
予測スーパーエンハンサーと遺伝子発現との間の因果的役割を検討するために、本研究は、CLDN4予測スーパーエンハンサー領域内の2つのエンハンサー領域(e1およびe2;
図4cを参照)を欠失させるべくCRISPR/Cas9ゲノム編集を用いた。OCUM-1およびSNU16細胞におけるCRISPR欠失効率を確認した後に(
図20a~c)、エンハンサー欠失および野生型細胞間の予測標的遺伝子発現レベルをRT-qPCRによって比較した。両方の細胞株において、e1のCRISPR欠失は、ABHD11、CLDN3、およびCLDN4(SNU16細胞におけるCLDN4,
図20d)を含めて、複数のCLDN4座位遺伝子の下方制御を生じさせた。同様の仕方で、本研究は、OCUM-1細胞におけるe2欠失後に、ABHD11、CLDN3、およびCLDN4の下方制御も観測した(e2欠失SNU16細胞は生存可能ではなく、従って遺伝子発現解析ができなかった;
図20e)。これらの結果を拡張するために、本研究は、ELF3がいくつかの悪性腫瘍における癌遺伝子としては報告されていることから、次に、OCUM-1細胞におけるELF3予測スーパーエンハンサーから2つの他の予測エンハンサーエレメント(e3およびe4)をCRISPR失欠させた(
図17a,
図20c)。e3およびe4の欠失は、いずれもARL8A、ELF3、RNPEPおよびTIMM17Aを含めて複数のFLF3座位遺伝子の下方制御をもたらした(
図20f)。全体として解釈すると、これらの結果は、予測スーパーエンハンサー活性と腫瘍遺伝子発現との間の因果的関係を支持する。
【0158】
体細胞スーパーエンハンサーおよび臨床的アウトカム
予測スーパーエンハンサーの異質性の生物学的および臨床的関連性をさらに探索すべく、本研究は、体細胞修飾状況(増加、欠失、非変化)によってカテゴリー化した癌ホールマーク解析を行った。10個の癌ホールマークのうちで、体細胞増加予測スーパーエンハンサーは、浸潤(P=8.6×10
-11,フィシャーの片側正確検定)、血管新生(P=2.4×10
-4,フィシャーの片側正確検定)、細胞死抵抗性(P=7.8×10
-3,フィシャーの片側正確検定)に関係する遺伝子中で著しく濃縮されて、体細胞欠失および予測非変化スーパーエンハンサーを1桁超過した(
図5a)。これらの結果は、体細胞増加予測スーパーエンハンサーが進行性GCと関連付けられた形質に関与しうることを示唆する。86個の細胞および組織試料の予測スーパーエンハンサー・プロファイルに対して比較したときに、GCにおける体細胞増加予測スーパーエンハンサーのうちの60%超が高組織特異性を示した。他の癌タイプ、例えば、結腸直腸癌、乳癌、子宮頸管癌および膵臓癌においてこれまでに記載された予測スーパーエンハンサーとの有意な重複(
図21)(P<0.001,経験的検定)も観測し、いくつかのGC関連予測スーパーエンハンサーが他の癌タイプにおいても活性でありうることを示唆した。
【0159】
本研究は、次に、体細胞増加予測スーパーエンハンサーと関連付けられた遺伝子発現パターンがGC患者の生存と関連付けられうるかどうかを尋ねた。複数のGC患者において両方の反復性体細胞増加を示し、標的遺伝子発現との最も高い相関も示す領域から、上位50個の予測スーパーエンハンサーと関連付けられた遺伝子を選択した。このアプローチの妥当性を支持して、このように選択したいくつかの遺伝子、例えば、CDH17およびCCAT1がGCにおいて過剰発現されることがこれまでに示されたことに注目した。遺伝子リストは、潜在的に新規なGC関連遺伝子、例えば、SMURF1およびLINC00299も含んだ(表10)。
【0160】
【0161】
【0162】
生存解析は、848人のGC患者からなる3つの非アジア人GCおよび4つのアジア人GCコホートにわたって行った。予測スーパーエンハンサー関連遺伝子が高発現を示すGCをもつ患者は、これらの遺伝子が比較的低く発現されるGC試料と比較して劣る全生存期間を示した(
図5b,P=1.8×10
-2,ログランク検定)。この関連付けのロバスト性を支持して、患者生存との関係は、予測スーパーエンハンサーの数を変化させた後でも有意なままであった(n=30,P=0.02,ログランク検定;n=60,P=0.03,ログランク検定)。多変量解析では、さらに他のリスク要因、例えば、年齢、段階、患者地域性および組織学的サブタイプについて調整した後でも、生存期間との関連付けが統計学的に有意なままであった(P=0.044,ワルド検定)。このデータは、GCにおいて体細胞増加予測スーパーエンハンサーによって駆動される遺伝子が臨床的に重要でありうることを示す。
【0163】
異なる予測スーパーエンハンサー・カテゴリーと疾患リスクとの間の関係を扱うために、疾患関連一塩基多型(SNP:single nucleotide polymorphism)が調節エレメントにおいて濃縮されること示す、これまでのゲノムワイド関連研究(GWAS:genome-wide association studies)(studies (GWAS) studies)を考慮した。本研究は、1470件のゲノムワイド関連研究から報告された疾患関連SNPのカタログを、反復性体細胞変化(増加または欠失)を示すそれらの予測スーパーエンハンサーまたは非変化予測スーパーエンハンサーに対してマッピングした。体細胞予測スーパーエンハンサーは、様々な癌(前立腺癌、結腸直腸癌、乳癌;濃縮比=3.0~7.2;P<4.4×10
-3,カイ2乗検定)、および潰瘍性大腸炎のような胃腸疾患(濃縮比=3.3;P<5.2×10
-4,カイ2乗検定)と関連付けられた疾患リスクSNPに対して濃縮された(
図5c)。対照的に、非変化予測スーパーエンハンサーは、同様の濃縮を示さなかった。予想外に、本発明者らは、体細胞変化予測スーパーエンハンサーにおける多発性硬化症SNPの濃縮(濃縮比=4.3;P=1.8×10
-7,カイ2乗検定)も観測し、これは、癌と自己免疫性応答との間の相互関連を示唆した。予測スーパーエンハンサーの疾患SNPがクロマチン修飾における局所的な変化と関連付けられうるかどうかを探索するために、本研究は、次に、少なくとも2つの研究において報告された結腸直腸癌と関連付けられ、さらにGC患者のうちの少なくとも1/3において異型接合性を示すSNPに焦点を合わせた(考察を参照)。2つのSNPがこれらの基準を満たした(rs10411210およびrs10505477)。rs10411210 SNPをもつ試料は、対応する正常なものに対して腫瘍では著しくより高いH3K27acシグナルを示し(
図5d;P=0.01,片側ウェルチの片側t検定)、rs10505477 SNPをもつ試料においても同様の傾向を観測した(P=0.07,ウェルチの片側t検定)。かかる関連付けは、疾患関連リスクSNPと癌関連ヒストン修飾との間の関係を示唆する。
【0164】
スーパーエンハンサーは、高密度の転写因子占有を示す
最後に、体細胞増加予測スーパーエンハンサーと関連付けられたトランス作用因子を探索した。GC予測スーパーエンハンサーは、他のゲノム領域と比較して、著しく濃縮されたENCODE TF結合プロファイルを示し、TF「ホットスポット」としての前者を支持した(P<2.2×10
-16,片側比率検定)。ReMapデータベースを調べて、本研究は、次に、異なる予測スーパーエンハンサー・カテゴリーと関連付けられた特異的なTFを同定した。体細胞増加および非変化予測スーパーエンハンサーの両方がCEBPB、MYC、およびFOXA1結合における濃縮を示した。しかしながら、上位10個の濃縮されたTFの中で、CDX2は、体細胞増加予測スーパーエンハンサーにおいて濃縮の上昇を示し(ランク#2)、非変化予測スーパーエンハンサー(ランク#8)と比較して結合密度がおよそ30%増加した(
図6aおよび6b)。
【0165】
TFは、しばしば協同的な仕方で機能するので、HOMER、de novoモチーフ発見アルゴリズムを用いることによって潜在的なCDX2パートナーを同定した。HOMER解析は、CDX2結合と関連付けられたHNF4α、KLF5、およびGATA4結合モチーフを同定した(
図6c)。本研究は、PScanChIPをJASPAR2016とともに用いてCDX2共結合モチーフも解析した。PScanChIPを用いて、本研究は、HNF4α、KLF5、およびGATA4を再び含む、潜在的なCDX2パートナーとして367個のタンパク質を予測した(表7)。遺伝子同時発現解析は、HNF4α(スピアマン相関、r=0.80)およびKLF5(r=0.58)がCDX2発現と最も強く相関付けられた候補であることを明らかにして、HNF4αおよびKLF5が確からしいCDX2パートナーでありうることを示唆した(
図6d)。とりわけ、CDX2は、腸上皮化生のドライバーとしてこれまでにGCにおいて同定され、KLF5およびGATA4/6は、HNF4αを上方制御するために協同するGCにおける発癌性転写因子としてこれまでに報告された。
【0166】
CDX2のHNF4α(最も高く相関付けられた因子)とのゲノム共同専有(co-occupancy)を実験的に確認するために、CDX2およびHNF4α ChIP-seqをOCM-1胃細胞に対して行い、TF結合位置を予測スーパーエンハンサー位置と統合した。OCUM-1細胞では、CDX2およびHNF4α結合頂点(binding summit)(q<0.01,MACS2)が高い共同専有(500bpウィンドウ)を示し、CDX2結合のうちの76%がHNF4αと同時に発生した(CDX2/HNF4α部位として知られる)(
図6e)。高CDX2発現GCのうちの上位50%を下位50%に対して比較して、本発明者らは、前者のサンプルでは、反復性体細胞増加予測スーパーエンハンサーが高い方のCDX2結合密度と確かに関連付けられることを見出した(100万塩基対当たり123個の結合,Mbp対92Mbp;方法を参照)。CDX2/HNF4α部位は、非変化予測スーパーエンハンサーと比較して、体細胞増加予測スーパーエンハンサーに選択的に局在化し(P=2.4×10
-4,カイ2乗検定)、CDX2およびHNF4α結合シグナルの両方が、非変化予測スーパーエンハンサーと比較して、体細胞増加予測スーパーエンハンサーにおいて増加した(
図6f)。SNU16細胞においても同様のCDX2およびHNF4α ChIP-seq結果を得た(
図22a)。この結果は、GCにおける体細胞増加予測スーパーエンハンサーがCDX2およびHNF4α占有と関連付けられることを示す。
【0167】
CDX2およびHNF4αがGCスーパーエンハンサーの維持に役割を果たしうるかどうかを試験するために、各TFのサイレンシングを単独かあるいは両方の因子で同時に行い、ゲノムワイドなH3K27acのプロファイリングがその後に続いた。いずれかの因子の単独かあるいは組み合わせの枯渇は、OCUM-1細胞におけるH3K27acの全体的な変化は誘発しなかった(
図22b)。しかしながら、CDX2およびHNF4αのサイレンシングは、それぞれゲノムのうちの9.7Mbおよび4.3Mbにおける特異的なH3K27acの変化につながり、ダブルTFノックダウンは、著しくより大きいH3K27ac枯渇を誘発した(CDX2およびHNF4α単独と比較してP=3.4×10
-29および1.2×10
-88,ウィルコクソン片側順位和検定)(
図22c)。シングルTFおよびダブルTFサイレンシングの両方に対して、H3K27ac枯渇は、予測典型エンハンサーと比較して、体細胞増加予測スーパーエンハンサーにおいてより顕著に発生し、TF枯渇に対するスーパーエンハンサー活性の感受性が高められたことを示唆する(
図6g,
図2d,表11a~11d;それぞれCDX2,HNF4αおよびCDX2/HNF4αに対してP=5.3×10
-7;P=1.8×10
-17;P=1.5×10
-10,ウィルコクソン片側順位和検定)。これらの効果の特異性を支持して、予測スーパーエンハンサーにおけるH3K27ac枯渇は、CDX2またはHNF4α結合部位に中心がある領域において、特に、両方の因子によって共同で専有された部位においてより顕著であった(
図6h)。SNU16細胞においても同様の結果を得た(
図22e)。次に、予測スーパーエンハンサーと遺伝子発現との間の関係を評価するために、本研究は、TFサイレンシング後にH3K27ac枯渇を示す予測スーパーエンハンサーに焦点を合わせた。予測スーパーエンハンサー標的遺伝子のうちの60%超がTFサイレンシング後に発現の減少も示すことに注目した(siCDX2,P=4×10
-4,経験的検定;siHNF4α,P<1×10
-4,経験的検定;si(CDX2/HNF4α),P<1×10
-4,経験的検定;
図22f)。この比率は、順列解析(「方法」)によって評価されるような、偶然に予想される比率を著しく超過した。全体として解釈すると、これらの結果は、GCスーパーエンハンサーの維持におけるCDX2およびHNF4αに対する機能要件を支持する。
【0168】
【0169】
【0170】
【0171】
【0172】
【0173】
【0174】
【0175】
癌における系譜特異的エンハンサーエレメント
いくつかのエンハンサーサブ領域が癌特異的な必須性を呈しうるというコンセプトの証明として、この研究は、GC細胞または正常ES細胞のいずれかにおいてCLDN4サブエンハンサー領域(e1)を欠失させることができる程度を試験した(
図15,16;表12)。
図24に示すように、CLDN4 e1エンハンサーサブ領域のホモ接合型欠失は、H1 ES細胞(
図26,27)では容易に達成されたが、SNU16 GC細胞では達成されず(
図25,28)、SNU16癌細胞の生存にとってCLDN4 e1の1つのコピーの維持が必須でありうることを示唆した。
【0176】
【0177】
これは、chr7:73,262,400~73,266,700の周りの欠失を許容する。欠失のサイズは、実際の実験中に変動する。それゆえに、前述の欠失領域は、単にsgRNA設計に基づく推定である。sgRNAの配列を表13に示す。
【0178】
【0179】
遺伝子発現と遠位予測調節エレメントとの間の相関
Nano-ChIPseqによって定義した遠位予測調節エレメントを遺伝子発現へ相関付けるために、複数の株にわたって高反復性を示す80個の予測スーパーエンハンサーを同定した(P<0.0001,経験的検定)。高反復性予測典型エンハンサーを同定するためにも同じアプローチを用いた。予測スーパーエンハンサーおよび予測典型エンハンサーの両方に対して、遠位調節エレメントと関連付けられた遺伝子は、ランダムに選択された遺伝子より高発現(higher expression that)を示した(
図10b)。予測スーパーエンハンサー/典型エンハンサー関連遺伝子の発現の比較は、予測スーパーエンハンサー関連遺伝子に対してより高い全体的な発現レベル(パーセンタイル単位)を明らかにした(P=5.2×10
-3,ウィルコクソン片側順位和検定)。これらの結果は、予測スーパーエンハンサーおよび予測典型エンハンサーにおけるH3K27ac濃縮と、標的遺伝子発現との間の正の関連付けを示唆する。
【0180】
1次胃非悪性試料のエピゲノムロードマップとの比較
この研究における非悪性胃組織が筋肉、免疫細胞などではなく、胃上皮を確かに反映することを確認するために、この研究からの非悪性胃H3K27acプロファイルを先に公表された正常胃プロファイルと比較し、胃平滑筋プロファイルとも比較した。Nano-ChIPseqプロファイルごとに、H3K27acシグナルのうちの70%(平均)が公表された正常胃プロファイルと重複し、一方で34%(平均)のみが胃平滑筋と重複した。結果は、非悪性胃試料が胃平滑筋ではなく胃上皮を確かに反映することを示唆する。
【0181】
胃癌におけるコピー数変化と予測スーパーエンハンサーとの間の関連付け
本研究は、反復性体細胞変化予測スーパーエンハンサーが体細胞コピー数の変化(sCNA:somatic copy number alterations)と関連付けられうる程度を検討した。予測スーパーエンハンサー間の重複、ならびに細胞株および1次GCからのコピー数情報をインハウスで発生させたAffymetrix SNP6.0アレイデータを用いて計算した。sCNAの領域を確信的に同定することを許容するために、解析を(平均ゲノムワイド・カバレッジより2倍高い)10kb当たり少なくとも6個のSNPプローブによってカバーした領域に制限した。sCNA解析の信頼性を確認し、後者において見出したGC細胞株(FU97,KATO-III,MKN7,OCUM-1,RERFGC1B,SNU16)について、解析における平均98%のコピー数増加および82%のコピー数欠失をCancer Cell Line Encyclopediaにも報告した。
【0182】
これらの細胞株では、予測スーパーエンハンサーのうちの5~6%(±6%標準偏差)のみがコピー数増加と関連付けられることがわかった(平均log2比>0.6)。例えば、KATO-IIIにおいて検出したFGFR2関連予測スーパーエンハンサーは、コピー数増加と重複し(
図14b)、遺伝子座において観測したより高いH3K27acリード密度が領域的なゲノム増幅によって潜在的に駆動されたことを示唆する。他方では、GC細胞株において検出した予測スーパーエンハンサーのうちの過半数は、コピー数中立領域に局在して、予測スーパーエンハンサーの確立が体細胞コピー数事象から独立していることを示唆する。この割合は、ランダムな偶然によるより大きい(P<0.01,経験的検定)。
【0183】
同様に、1次GCにおいて、この研究は、19個の1次T/N対における1,748個の反復性体細胞増加予測スーパーエンハンサーに対してCNA/SE補正を計算することが可能であった。体細胞増加予測スーパーエンハンサーのごく一部のみ(<2%±3%s.d)がコピー数増加と重複し(
図14c)、個々のT/N対において見出した体細胞増加予測スーパーエンハンサーのうちの90%超がコピー数中立領域内で検出される(
図14a)ことがわかった。この結果は、予測スーパーエンハンサーにおけるH3K27acの体細胞増加とコピー数変化との間に強い関連付けがないこと、および腫瘍試料における予測スーパーエンハンサーでのH3K27ac獲得がおそらくコピー数変化とは別のメカニズムによって駆動されることを示唆する。
【0184】
考察
GCは、臨床的に異質性のある疾患であり、外科手術および化学療法に加えて、トラスツズマブ(抗HER2)およびラムシルマブ(抗VEGFR2)のみが臨床的に認可され、他の分子標的剤は、現在まで不成功であることが判明している。胃腫瘍発生における重要なパスウェイとしてエピゲノム調節解除が出現して、GCではクロマチン修飾遺伝子(例えば、ARID1A)が頻繁に変異し、エピジェネティックな変化が胃前悪性と関連付けられる。しかしながら、現在まで、GCエピゲノム研究のうちの圧倒的多数が腫瘍抑制遺伝子のサイレンシングの文脈におけるプロモーターDNAメチル化に焦点を合わせてきた。対照的に、GCにおける遠位調節エレメント(すなわち、エンハンサー)については、現在、ごくわずかしか知られていない。
【0185】
この研究は、1次胃腫瘍、対応する非悪性組織、およびGC細胞株のマイクロスケール・ヒストン修飾プロファイリングを通じて同定した35k超の予測エンハンサーエレメントを解析した。小規模ChIPプロトコルは、技術的にチャレンジングなものとして知られ、時として著しい試料間変動をもたらしかねない。安心させるように、本発明者らは、腫瘍および正常試料間のNano-ChIPシグナルが、直交するChIP-qPCRの結果と良好な一致を示すことを先に実証し、本研究において、本発明者らは、Nano-ChIPseqライブラリのうちの圧倒的多数(85~100%)が許容しうる品質であることを確認すべく、マッピングの厳しさの変化、生物学的レプリケート解析、プロモーターChIP濃縮およびCHANCE解析を含む、広範な品質管理解析をさらに行った。解析をプロモーター・ベースおよびCHANCE品質解析の両方をパスした「高品質」腫瘍/正常の対のみに限ったときには反復性体細胞増加予測スーパーエンハンサーのうちの84%が依然として再発見されたという観測によって示されるように、複数の試料に存在する反復性エピゲノム変化に焦点を合わせることによって、生物学的結論がさらに確実にロバストになりうる。
【0186】
この研究では、反復性予測スーパーエンハンサーは、主として、既知の癌遺伝子および発癌過程に関与している遺伝子に現れた(
図2d)。近位プロモーターエレメントを超える、個々の試料間の高レベルのエンハンサーの変動(
図1d)も観測した。他の組織および腫瘍タイプに対して比較したときに、GC予測スーパーエンハンサーのうちのほとんど60%が組織特異的であった(
図21)。注目に値するのは、現研究ではGCを対応する非悪性胃組織に対する一般的なカテゴリーとして最大感受性について研究したことである。しかしながら、別個の病理組織学的および分子的GCサブタイプが存在し、GCの異なる組織学的サブタイプには別個のエンハンサー変化が存在しうることを示唆する。かかる知見は、エンハンサーエレメントの絶妙な組織特異的性質と、拡大する患者コホートおよび多くの異なる腫瘍タイプにおける包括的なエンハンサー・カタログを発生させる必然的なニーズとを反映する。
【0187】
本研究において解析した試料のうちの過半数は、インビトロで培養した細胞株ではなく、患者に直接に由来する1次組織であった。予測エンハンサー活性(H3K27ac)を腫瘍と対応する正常なものとの間で比較することによって、細胞株の予測スーパーエンハンサーをそれらの体細胞変化状況(体細胞増加、体細胞欠失および非変化)に従ってさらに下位分類することが可能であった。それらの生物学的特殊性を支持して、サブカテゴリー化した予測スーパーエンハンサーは、エピゲノムパターン(H3K4me1,DNAメチル化)、遺伝子転写、および癌ホールマークを含めて、他の直交する特徴における特異的差異も呈した。とりわけ、本発明者らのデータでは、体細胞増加予測スーパーエンハンサーのごく一部のみがコピー数増幅の領域に局在した。予測スーパーエンハンサーを真の体細胞増加または欠失に従って下位分類する能力が癌におけるスーパーエンハンサーの確立を担う発癌メカニズムを正確に指摘するための下流の試みを改善すると思われる。かかるアプローチは、おそらく他の病状にも拡張可能である。
【0188】
先験的な考察から予測スーパーエンハンサーの異質性が疾患リスクと関連付けられた生殖系列変異体を解析するときにも有用であることがわかるであろう。これまでの知見は、疾患関連SNPが一般に調節エレメントにおいて過剰提示されることを報告したが、わかったことは、非変化予測スーパーエンハンサーではなく、体細胞変化予測スーパーエンハンサーが癌および炎症性胃腸疾患と関連付けられたSNP(胃腸癌に対する既知のリスクファクター)において特異的に濃縮されることである。これらの領域におけるSNPは、TF結合モチーフの修飾、長距離クロマチン相互作用の調節、またはH3K27acレベルの変化を含めて、いくつかの非排他的メカニズムを通じて疾患リスクおよび癌発生を変化させうる。実際に、この研究では、結腸直腸癌(CRC:colorectal cancer)リスクと関連付けられた2つのSNP(rs10505477およびrs10411210)が1次GCにおけるクロマチン修飾の局所的な変化との関連付けられることに注目した。CRCリスクデータをGCと統合することが尤もないくつかの理由がある。第1に、これらのCRCリスクSNPのうちの少なくとも1つ(rs10505477)が治療反応および患者生存の両方においてGCの臨床的アウトカムに影響を及ぼすことも報告されている。第2に、GC予測スーパーエンハンサーと関連付けられた主要な転写因子(CDX2、HNF4α)が結腸発生を調節することも知られている。第3に、GCに対する前悪性リスクファクタとしての腸上皮化生(IM:intestinal metaplasia)の役割がよく確立され、IMでは胃上皮細胞が結腸上皮と同様の細胞アーキテクチャおよび外観を採る。これらの遺伝子変異体が、生殖系列DNAに存在する一方で、腫瘍におけるクロマチン構造および遺伝子発現に影響を及ぼしうるという観測がCRCでも認められている。これらの結果は、疾患素因の根底にある生殖系列過程を本発明者らが精密に理解するために、異常なエピジェネティック状態を研究する重要性をさらに際立たせる。
【0189】
本研究の結果は、GCにおける個々のスーパーエンハンサーがシスおよびトランス作用転写機構とどのように相互作用しうるかに関していくつかの一般原理を示唆する。2つの別個の長距離クロマチン相互作用アッセイ(Capture-Cおよび4C)を用いて、高められた腫瘍発現を示す近位および遠位遺伝子の両方に係わる体細胞増加予測スーパーエンハンサーのいくつかの例を観測した。体細胞増加予測スーパーエンハンサーに連結された遺伝子は、コヒーシン介在エンハンサー-プロモーターループを通じて確立された、同様のトポロジカルな会合ドメイン(topological associating domain)をおそらく占めることが提案された。近位および遠位遺伝子発現の両方に影響を及ぼす体細胞増加予測スーパーエンハンサーの能力は、予測スーパーエンハンサーを、疾患の進行および化学応答に寄与しうる、胃腫瘍における異常遺伝子発現の枢要なレギュレーターとして関係付ける(
図5b)。トランス・レベルでは、GCにおける体細胞増加予測スーパーエンハンサーがCDX2およびHNF4α占有と関連付けられることをデータが明らかにした。これまでの研究は、胃における異常なCDX2の発現が粘膜上皮細胞の腸上皮化生、胃腫瘍形成の重要な初期事象と関連付けられること、およびCDX2がGC癌遺伝子として機能する可能性を有することを示した。HNF4αも、最近、GCにおいて系譜特異的癌遺伝子KLF5およびGATA因子の両方の標的として、ならびにAMPKシグナル伝達パスウェイとして関係付けられた。1次ヒト腫瘍における結果は、CDX2が腸遺伝子発現を制御するためにHNF4α占有率を調節することがわかった、マウス小腸における最近の知見によって支持される。これらの研究を反映して、CDX2/HNF4α枯渇がCDX2および/またはHNF4α結合部位に濃縮された局所領域におけるクロマチンの変化に影響を与えることもわかった。
【0190】
結論として、この研究は、予測スーパーエンハンサーにおける異質性に対する役割および生体調節(regulatory biology)を分析するために1次組織および細胞株からのクロマチン・プロファイルを交差させる有用性を実証する。GC遠位エンハンサーのこの第1世代ロードマップは、GC予測エンハンサー(eRNA)と関連付けられた転写特徴を含み、予測スーパーエンハンサー活性を乱す体細胞調節変異を同定する将来の統合的な研究を今や可能にする。