【実施例】
【0076】
以下で、本発明の理解を助けるために、好ましい実施例を提示する。しかし、下記の実施例は、本発明をより容易に理解するために提供されるだけで、実施例によって本発明の内容が限定されるものではない。
【0077】
実施例1.がん腫別合成がん生存遺伝子対の検出及びこれを利用したカスタマイズ型の薬物選択方法
【0078】
1−1.対象データの選定
分析のためのデータをTCGAデータポータルから2015年3月4日を基準としてダウンロードした。前記データは、5618人のlevel2体細胞突然変異(somatic mutation)データと6838人のlevel2の臨床データを含んでいる。前記level2体細胞突然変異データは、maf(mutation annotation format)形式で格納されている。分析のために、突然変異位置と突然変異分類が適用された。突然変異は、「Missense mutation」、「Nonsense mutation」、「Frameshift indel」、「In frame indel」、「splice site mutation;Silent mutation」、「Intron」、「UTR」及び「Intergenic」などに分類されている。前記level2の臨床データは、がん腫による多様な臨床変因を含んでおり、実際的にCox proportional hazard modelに使用された変因は、専門的な病理学者によって検討された。
【0079】
1−2.データの処理及び分析データの構成
先ず、臨床データのうちCox proportional hazard modelのための情報がない患者のデータを除いた。次に、他の悪性腫瘍を持っているか転移が発生した患者、放射線治療、pharmaco、ablation adjuvant治療のある患者を確認した後、前記要因が患者予後の強い撹乱変因である点を考慮して、当該患者のデータを除いた。また、突然変異データのない患者のデータを除いた。さらに具体的に、突然変異データは、先ずsynonymous突然変異を除いた後、HGNC symbolのない遺伝子でデータに「Unknown」と表記された遺伝子を除いた。最後に、臨床情報のない患者のデータを除き、最終的に4,844人の患者のデータを利用して以降の分析に使用した。
【0080】
データ処理の結果、20個のがん腫で4,884人の臨床データと体細胞突然変異データを得た。このように得られたデータは、二つのデータタイプを全て持っており、Cox proportional hazard modelに必要な全ての臨床変因データを持っており、以降の分析に使用した。
【0081】
1−3.遺伝子損傷点数
本実施例では、遺伝子の有害程度を定量化するために、遺伝子損傷点数(Gene Deleteriousness Score、GDS)を定義した。遺伝子損傷点数は、当該遺伝子の突然変異個数と種類を考慮して計算され、0点から1点間の値を有するように定義された。遺伝子損傷点数は、より小さい点数であるほど当該遺伝子の機能的構造的損傷がさらに激しいという意味で定義された。例えば、もしある遺伝子がnonsense mutation、frameshift insertion and deletion、nonstop mutation and splice site mutationのような機能喪失変異(Loss of Function(LoF)Variant)を持っていれば、当該遺伝子の遺伝子損傷点数は0点と決めた。もしある遺伝子がLoF変異を持たなければ、当該遺伝子の遺伝子損傷点数は、当該遺伝子にある全てのnon−synonymous突然変異のうち、SIFT点数が0.7以下の突然変異のSIFT点数の幾何平均で決めた。この時、分母が0になる場合を避けるために、SIFT点数が0点であれば、これを10e−8点に代替した。前記SIFT点数0.7のフィルタリング基準は、本実施例の場合に適用された任意的なフィルタリング基準であり、分析の目的によって多様なフィルタリング基準を適用することができる。また、分母が0になることを避けるために付与した10e−8点の変異点数も、本実施例の場合に適用された任意的な基準であり、分析の目的によって様々な基準を適用することができる。本実施例で遺伝子損傷点数を算出するために使用されたSIFTアルゴリズム(下記の数3参照)も、本実施例の場合に適用された任意的なアルゴリズムであり、分析の目的によって多様なアルゴリズムを適用することができる。
【0082】
【数3】
【0083】
1−4.遺伝子損傷点数の分布と分析閾値の設定
前記実施例1−2で分類した分析データを元に、それぞれのがん腫で少なくとも一つ以上のnon−synonymous mutationを有する全ての遺伝子の遺伝子損傷点数を計算した。non−synonymous mutationを一つも持たない遺伝子には、1点の遺伝子損傷点数を付与した。
【0084】
その結果、がん細胞で多数の体細胞突然変異が発生するが、全体の遺伝子で体細胞突然変異が発生することはよくある現象ではないため、殆どの遺伝子の遺伝子損傷点数は1点であることを確認することができた。1点の他には、体細胞突然変異を示す多数の遺伝子の遺伝子損傷点数が0点に分布した。本実施例では、遺伝子損傷点数0.3点を基準(分析閾値)として中等度以上の遺伝子機能の損傷が起こった遺伝子と、そうでない遺伝子の二群に分けて、以降の分析に使用した。
【0085】
1−5.がん腫別合成がん生存遺伝子対の検出とがん腫別合成がん生存遺伝子のネットワーク構築
がん患者のゲノムデータから合成がん生存(SCS、Synthetic Cancer Survival)の現象を検出するために、Cox proportional hazard modelを使用した生存分析を行った。Cox proportional hazard modelは、臨床変因の撹乱作用を補正することができる。それぞれのがん腫別患者群を全ての遺伝子対に対して4群に分けた。二つの遺伝子とも遺伝子損傷点数が0.3以下の対損傷群、二つの遺伝子のうち一つの遺伝子の遺伝子損傷点数のみが0.3以下であり、他の一つは、そうでない二つの外損傷群、及び二つの遺伝子とも遺伝子損傷点数が0.3より大きい非損傷群。
【0086】
よく使用される最尤度(maximum likelihood)基盤のCox proportional hazard modelの場合、患者死亡事件が0回の場合に「収斂(convergence)」の問題が発生するため、本実施例では、これを避けるためにpenalized likelihoodを利用したCox proportional hazard modelを使用した。生存分析は、R Statistical Packageバージョン3.2.0の「coxphf」パッケージを利用して進行した。また、それぞれのがん腫別に臨床変数の撹乱作用を補正するために、Cox模型に追加された。年齢や性別のような一般的な臨床変因と病理学専門医が検討し、以前の研究で使用された臨床変因を追加した。
【0087】
図1に、皮膚黒色種患者群をDNAH2遺伝子とXIRP2遺伝子対の体細胞突然変異状態によって一つの対損傷群、二つの外損傷群及び一つの非損傷群などの計4群に分けて、それぞれの生存曲線を例示した。この時、4群の生存曲線と共に生存分析結果を表記した。
図1に示すように、DNAH2遺伝子とXIRP2遺伝子は、互いに合成がん生存遺伝子対の関係にあることが分かる。つまり、DNAH2とXIRP2対において、DNAHのみが遺伝子損傷点数が低いか(青色線)XIRPのみが遺伝子損傷点数が低い(黄色線)外損傷群の場合、二つの遺伝子とも遺伝子損傷点数は低くない非損傷群(緑色線)と比較した時、がん生存率で有意な差を示さないが、DNAH2とXIRP2の遺伝子損傷点数が全て低い対損傷群は、残りの三つの群全てに比べて統計学的に有意にがん患者の生存率が高い(p<0.05、HR>1.0)ことを確認することができた。従って、皮膚黒色種で体細胞突然変異を示すDNAH2遺伝子とXIRP2遺伝子対は、上記で定義した皮膚黒色種の合成がん生存遺伝子対の判断基準に符合することを確認した。
【0088】
また、
図2に、5種のがん腫(肺腺がん、皮膚黒色種、肺扁平上皮がん、頭頸部扁平上皮がん、腎臓細胞がん)で各がん腫別に得た合成がん生存遺伝子対で構成された合成がん生存遺伝子ネットワークを例示した。肺腺がん(LUAD)合成がん生存遺伝子対は、赤色の連結線で、皮膚黒色種(SKCM)合成がん生存遺伝子対は、黄色の連結線で、肺扁平上皮がん(LUSC)合成がん生存遺伝子対は、青色の連結線で、頭頸部扁平上皮がん(HNSC)合成がん生存遺伝子対は、茶色の連結線で、腎臓細胞がん(KIRP)合成がん生存遺伝子対は、紫色の連結線で表記した。
図2に示すように、各がん腫別に多様な合成がん生存(SCS)遺伝子対が存在することを確認することができ、これに対する具体的な説明は、実施例2に開示した。
【0089】
本実施例では、実際のがん患者のがんゲノム変異情報の分析を通じて多様な合成がん生存遺伝子対を得ているが、これは、応用可能な多様な方法のうち一つの方法であるだけで、当該方法だけに制限されない。例えば、細胞株または動物実験環境で様々な方式で遺伝子変異を誘発し、実際のがん患者では観察され難い変異遺伝子の分析を通じて合成がん生存遺伝子対を得て、合成がん生存遺伝子ネットワークを構成することができる。特に、実施例5及び
図9〜
図10に例示されたように、Invasion Assayを含むがん細胞転移能力を同定するための様々な実験方法を使用して、合成がん生存遺伝子対が得られる。
【0090】
1−6.がん腫別合成がん生存遺伝子対の分析を利用したカスタマイズ型の薬物選択方法
本発明によるがん患者のゲノム突然変異と生存分析方法及びシステムを通じて、がん腫別合成がん生存遺伝子対を効果的かつ効率的に求め、これを利用してカスタマイズ型の薬物選択を行うための方法を説明するために、下記のような実験を行った。
【0091】
図3に、ある肺腺がん患者の体細胞突然変異の分布を合成がん生存遺伝子対のネットワークに重ねて図示した。
図3のノードと連結線は、肺腺がんゲノムシーケンシングデータを分析して獲得した合成がん生存遺伝子対のネットワークを意味する。この時、ノードは、それぞれの遺伝子を意味し、連結線で連結された一対の遺伝子は、肺腺がんの合成がん生存遺伝子対であることを意味する。赤色で塗られた遺伝子ノードは、当該がん患者で対応する遺伝子と共に合成がん生存遺伝子対をなして体細胞突然変異が発見される遺伝子を意味する。黄色で塗られた遺伝子ノードは、当該遺伝子は、低い遺伝子損傷点数を示す体細胞突然変異を有する遺伝子であるが、当該遺伝子と対をなして合成がん生存遺伝子対をなす遺伝子の中では、低い遺伝子損傷点数を示す体細胞突然変異を有する対応遺伝子が一つも発見されず、合成がん生存遺伝子対をなしていない遺伝子を意味する。灰色で塗られた遺伝子ノードは、当該がん患者で低い遺伝子損傷点数を示す体細胞突然変異が発見されない遺伝子を意味する。
【0092】
従って、
図3は、灰色で塗られた遺伝子の中で合成がん生存遺伝子ネットワーク情報を考慮して選定した一つ以上の遺伝子を当該の遺伝子に対する一つ以上の遮断剤で抑制すれば、他の遺伝子とどのように幾つの合成がん生存遺伝子対をなすかが分かる方法を例示する。例えば、
図3に例示された肺腺がん患者のがん細胞にXIRP2遮断剤を処理すれば、RYR2、LPA、FAT4等の遺伝子と複数の合成がん生存遺伝子対をなし、当該肺腺がん患者の生存率が向上可能なことを予測することができる。また、前記肺腺がん患者のがん細胞にRYR3を遮断しても、複数の遺伝子と合成がん生存遺伝子対をなすことができることが分かるが、RYR3の場合、Dandroleneなどのカルシウムチャネル遮断剤で遮断することができる。最近では、抗体新薬の開発を通じて特定遺伝子を遮断することが可能であるため、本発明による合成遺伝子対の分析を通じて新しい新薬開発の標的遺伝子を選別することも可能である。一研究(Zhang et al.,Proc Natl Acad Sci U S A.2011 Aug 16;108(33):13653−13658.)によると、RYR3を抑制するmicro−RNA miR−367の結合部位の単一塩基多型性によって卵巣がんの予後が異なることを明らかにし、このような所見が本発明の結果物である合成がん生存遺伝子対の主要参加遺伝子であるRYR3遮断効果によるものであるかは未だ明らかでないが、本発明の結果物である合成がん生存ゲノム上の関係を通じて予後の差異を示した学術的蓋然性は高いと推定することができる。新薬の開発は、その効果性だけでなく副作用といった安全性も共に考慮して開発しなければならないが、本実施例は、がん患者のゲノム情報の次世代のシーケンシングデータ分析を通じて本発明で究明した合成がん生存遺伝子対の特性を活用して、がん患者のカスタマイズ型の薬物選択及び開発に有用な情報が提供可能なことを示す。
【0093】
実施例2.がん腫別合成がん生存遺伝子対の分布及び予後の予測
前記実施例1で提示したように、合成がん生存遺伝子分析を行った結果、5つのがん腫で436個の合成がん生存遺伝子対を選定し、その結果を表1に示した(p<0.05、HR>1)。本実施例で使用された合成がん生存遺伝子対の選別基準は、厳格に適用された。合成がん生存遺伝子対を検出するための様々な条件の組み合わせが可能なことは明確であるが、実施例1に例示したように、対損傷群と非損傷群との比較でも統計的に有意な差異を示し、対損傷群と二つの外損傷群とのそれぞれの比較でも統計的に有意な差異を示す一方、非損傷群と二つの外損傷群との間の三回の比較では統計的に有意な差異を示さない厳格な判断基準を適用して、がん腫別合成がん生存遺伝子対を選定した。
【0094】
【表1】
【0095】
表1に示すように、肺腺がん(Lung adenocarcinoma、LUAC)及び皮膚黒色種(Skin cutaneous melanoma、SKCM)で特に多くの合成がん生存遺伝子対を選別し、本実施例で選定した436個の合成がん生存遺伝子対は、さらに具体的には、281個の遺伝子で構成されており、最も多くの合成がん生存遺伝子対に属する遺伝子は、XIRP2とRYR3などである。
【0096】
本実施例の判断基準を適用して、5個のがん腫別に得た436個の合成がん生存遺伝子対のリストを表2に示した。
【0097】
【表2】
【0098】
合成がん生存遺伝子対に属する二つの遺伝子のうち、二つとも低い遺伝子損傷点数を有する変異遺伝子の場合、当該二つの遺伝子は合成がん生存遺伝子対を構成したと定義する。合成がん生存遺伝子対に属する二つの遺伝子のうち、一つは低い遺伝子損傷点数を有する変異遺伝子であり、他の一つは遺伝子損傷点数は低くない対応遺伝子の場合、当該対応遺伝子を抑制する薬物を利用すれば、当該がん患者の生存率が高められると予測することができる。
【0099】
図2に、前記表2に開示した合成がん生存遺伝子対で構成された遺伝子ネットワークを多重グラフで例示した。この時、それぞれのノードは遺伝子であり、互いに連結線で連結された遺伝子対は、合成がん生存遺伝子対を意味する。
【0100】
また、
図4に、肺腺がん患者群で遺伝子損傷点数が0.3点以下の変異遺伝子の頻度をバーグラフで図示し、
図5に、肺腺がんから検出された合成がん生存遺伝子対に属する変異遺伝子が肺腺がん患者から発見される頻度を図示した。
【0101】
図4及び
図5に示すように、多くの患者でXIRP2とRYR3遺伝子が合成がん生存遺伝子対を構成していることが分かる。一方、TTN遺伝子の場合、TTN遺伝子の遺伝子損傷点数が低い患者の数は多かったが、TTN遺伝子が合成がん生存遺伝子対をなす患者の数は相対的に少ないことが分かった。即ち、従来の研究は、がん遺伝子の体細胞突然変異頻度を中心として行われてきたが、単に個別遺伝子の突然変異の分析だけでは、がん患者の予後及び治療反応の予測が容易でなく、本発明のように遺伝子対の分析及び遺伝子ネットワークの分析ががん患者の予後及び治療反応の予測に大きく寄与することができることを示唆する。
【0102】
実施例3.がん腫別合成がん生存の負担を利用したがんの生存及び予後の予測
がん患者の合成がん生存遺伝子対の個数ががん患者の予後と生存率に及ぼす影響を分析した。その一例として、341人の肺腺がん患者(LUAD)と181人の皮膚黒色種患者(SKCM)における結果を
図6及び
図7にそれぞれ示した。
【0103】
先ず、341人の肺腺がん患者を、合成がん生存遺伝子対を一つも持っていない149人、1つ以上〜10個未満を持っている122人、及び10個以上を持っている70人と、計三群に分けて、Cox proportional hazard modelを適用した生存分析を行った。その結果、
図6に示すように、合成がん生存遺伝子対を最も多く持っている(10個以上を持っている)70人の生存率が最も高く、1つ以上〜10個未満を持っている122人の生存率が中間値を表し、合成がん生存遺伝子対を一つも持っていない149人の生存率が最も低いことを確認し、これを通じて、合成がん生存遺伝子対を多く持つほど肺腺がん患者の生存率が統計学的に有意に高いことを確認することができた。
【0104】
次に、181人の皮膚黒色種患者を、合成がん生存遺伝子対を一つも持っていない88人、1つ以上〜5個未満を持っている47人、及び5個以上持っている46人と、計三群に分けて、Cox proportional hazard modelを適用した生存分析を行った。その結果、
図7に示すように、合成がん生存遺伝子対を多く持つほど皮膚黒色種患者の生存率が統計学的に有意に高いことを確認することができた。
【0105】
以上の実験を通じて、がん患者の遺伝対分析を通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担を確認することで、当該がん患者の生存予後を効果的に予測することができることを確認した。
【0106】
実施例4.がん腫別合成がん生存の負担と体細胞突然変異の負担を利用したがんの生存及び予後の予測
前記実施例3で開示したがん患者から発見される合成がん生存遺伝子対の個数を活用したがん患者の生存率の分析は、医学的に非常に重要な意味を有する。現在、一般的には、がん細胞のnon−synonymous体細胞突然変異が多いほどがん患者の予後が悪いと知られていたが、これとは異なる分析結果だからである。
【0107】
さらに具体的に、合成がん生存遺伝子対の個数とnon−synonymous体細胞突然変異の頻度をログ−ロググラフで示した(
図8)。
図8に示すように、合成がん生存遺伝子対の個数は、肺腺がんと皮膚黒色種の両方でnon−synonymous体細胞突然変異の頻度と正比例する。従って、体細胞突然変異が多いほど予後が悪いとされる現在の一般的な見解によると、体細胞突然変異の負担に正比例するがん生存遺伝子対の個数が多いほど予後が悪く表れる可能性は高いと判断することができる。しかし、実施例3の結果は、合成がん生存遺伝子対の個数が多いほど予後が良いことを示す。つまり、実施例3に開示したように、合成がん生存遺伝子対の個数が多い患者の場合、体細胞突然変異も共に増える可能性が高いが、体細胞突然変異の特殊な形態である合成がん生存遺伝子対の変異がさらに増えれば、むしろ予後が良いことが分かる。
【0108】
このようながん腫別合成がん生存の負担と体細胞突然変異の負担のがん患者の予後に与える影響の逆相関関係は、
図6及び
図7の下段に表記された各群別の生存分析グラフで明確に確認することができる。さらに具体的に、
図6の下段にある3個の生存分析グラフは、341人の肺腺がん患者を合成がん生存遺伝子対の保有数によって三群に分けて生存分析を行った結果、三群の全てで赤色で表記された体細胞突然変異の負担がより高い患者(それぞれ74人、61人、35人)が空色で表記された体細胞突然変異の負担がより低い患者(それぞれ75人、61人、35人)より統計的に有意に悪い予後を示すことを提示する。
【0109】
また、
図7の下段にある3個の生存分析グラフは、181人の皮膚黒色種患者を合成がん生存遺伝子対の保有数によって三群に分けて、生存分析を行った結果、三群の全てで赤色で表記された体細胞突然変異の負担がより高い患者(それぞれ44人、23人、23人)が空色で表記された体細胞突然変異の負担がより低い患者(それぞれ44人、24人、23人)より統計的に有意に悪い予後を示すことを提示する。
【0110】
前記結果を通じて、合成がん生存遺伝子対の個数が補正されれば、体細胞突然変異数が多いほど予後が悪いという従来の学説と一致することが分かる。逆に、
図6及び
図7に示した分析結果を通じて、体細胞突然変異数が多い場合でも、その突然変異数を補正すれば合成がん生存遺伝子対の負担が重要ながん予後の予測因子であることが分かる。
【0111】
総合的に本発明で提示している合成がん生存遺伝子対の分析は、従来に知られた体細胞突然変異の分析と差別化される概念である。つまり、体細胞突然変異の負担が同一であれば、合成がん生存負担が大きいほど当該のがん患者の予後が良く、合成がん生存の負担が同一であれば、体細胞突然変異の負担が少ないほど当該がん患者の予後が良いと予測することが可能である。このような現象を関数化することで、がん患者の予後を予測するためにがんゲノム分析を通じて獲得可能な合成がん生存の負担と体細胞突然変異の負担情報を提供することができる。
【0112】
さらに、前記実施例1で開示したように、がん患者のカスタマイズ型の薬物選択方法を適用して選択した薬物を患者に処置した場合、当該薬物に対する治療反応も当該薬物が遮断する遺伝子により増加する合成がん生存遺伝子対の個数分析を通じて予測可能なことが分かる。つまり、当該処置薬物が当該患者の合成がん生存遺伝子対の個数を増やす程度によって当該治療反応を予測することができ、逆に、当該治療反応の向上が大きい薬物でカスタマイズの治療薬物を選択することができる。
【0113】
実施例5.がん腫別合成がん生存の負担と体細胞突然変異の負担を利用したがん細胞の転移能力の予測
がん患者は、がんで死亡するよりがんの転移で死亡する。がん組織自体は除去するか放射線治療などの局所治療法で統制できるが、転移がんの処置は非常に難しく、転移したがん細胞が多様な危害を誘発するからである。即ち、本発明の結果物である合成がん生存遺伝子対が多くなるほどがんの予後が良くなることは、合成がん生存遺伝子対が当該がん細胞の転移能力を低下させることと関連があると推定することができる。現在、がん細胞の転移能力を同定する方法の一つとして、細胞浸潤検査(cell invasion assay)がある。一例として、コーニング社で提供するMatrigel invasion assay方法は、Engelbreth−Holm−Swarm(EHS)マウス肉腫細胞が分泌するゼラチン形態のタンパク質混合物であり、がん細胞がこのMatrigelをどれだけ入り込む能力を持っているかを定量的に評価することができる実験方法を提供する。
【0114】
本発明の結果で得られた合成がん生存遺伝子対のがん転移に及ぼす影響を分析するために、肺がん細胞株5個(A、B、C、D、E)でWhole exome sequencing(WXS)とMatrigel invasion assayを進行した。実験は、二回行い検証し、最初の実験のMatrigelの最終濃度は300ug/ml、培養時間は24時間、使用細胞数はウェル当たり約75000個で行い、二回目の実験のMatrigelの最終濃度は300ug/ml、培養時間は42時間、使用細胞数はウェル当たり約75000個を実験条件として使用して、二回繰り返し実験した。実験は、計3回行われた。WXSは、illnumina HiSeq 2000 Systemを使用し、Hg19バージョンのHuman Reference Genomeを使用した。
【0115】
図9は、前記5個の細胞株の体細胞突然変異の負担と合成がん生存の負担の分布を例示する。
図9は、実施例4で説明したように、合成がん生存遺伝子対の個数が体細胞突然変異の個数と正比例して増加することを示す。
図10は、Matrigel invasion assayの結果である各細胞株別Matrigel浸潤能力(invasiveness)または転移能力をバーグラフで示す。つまり、フィールド当たり浸潤した細胞数が多いほど当該がん細胞株の浸潤能力あるいは転移能力が大きく、これは、がん転移能力が大きいことを意味する。従って、C、B、D、E、A細胞株順でがん転移能力が高いと判断することができる。
【0116】
図9に示した体細胞突然変異の負担と合成がん生存の負担の分布を活用すれば、体細胞突然変異の負担が400個を少し超えるDとAの比較で、合成がん生存の負担がより大きいAのがん転移能力がより低いと予測され、これは、
図10の棒グラフで予測通り確認される。また、体細胞突然変異の負担が460個前後のBとEの比較で、合成がん生存の負担がより大きいEのがん転移能力がより低いと予測され、これは、
図10の棒グラフで予測通り確認される。また、合成がん生存負担37個のBとAの比較で、体細胞突然変異の負担がより大きいBのがん転移能力がより高いと予測され、これは、
図10の棒グラフで予測通り確認される。そのため、本発明の結果物である合成がん生存遺伝子対の分析を通じて、がん細胞の転移能力が評価可能なことが確認できた。本実施例では、がん細胞又は組織の浸潤能力、あるいは転移能力の同定のために、がん細胞株のMatrigel細胞浸潤検査を行ったが、これに制限されない。例えば、がん細胞又は組織の浸潤能力、あるいは転移能力を評価するために、免疫能力が統制された実験動物にがん細胞または組織を移植して、より直接的にがん細胞又は組織の浸潤能力、あるいは転移能力を同定する方法が可能であり、このような様々ながん細胞又は組織の浸潤能力、あるいは転移能力の同定を通じて合成がん生存遺伝子対を発見し、合成がん生存現象を活用したカスタマイズ型の薬物選択方法は、本発明の範囲に属する。
【0117】
実施例6.生物学的マーカーを活用してがんの細部群の分類による合成がん生存遺伝子対分析の有用性
本実施例は、分析対象がん腫を特定の生物学的マーカーを活用して細部群に分けた後、合成がん生存遺伝子対を検出し、カスタマイズ型の薬物選択及び予後を予測する方法を例示する。即ち、本実施例は、前記実施例1〜4で例示されたがん腫別合成がん生存分析において、従来の臨床的、病理学的がん分類体系だけでなく、主要診断、治療及び予後関連の生物学的マーカーに伴う細部群に分けて、さらに精密な合成がん生存分析を行うことが可能であり、このような生物学的マーカーを活用した細部群別合成がん生存分析が本発明の範囲に属することを例示する。
【0118】
一例として、MSI(Microsatellite instability)は、大腸がんの診断、治療及び予後に非常に重要な生物学的マーカーとして知られている。本実施例は、大腸がんでMSIの状態によって患者群を分けて合成がん生存分析を行うことが、上述した実施例1〜実施例4に該当する合成がん生存分析の結果を導出することができるだけでなく、さらに有用で安定した精密分析結果が得られることを例示する。
【0119】
大腸がん(COAD)データは、米国NCI GDC(National Cancer Institute Genomic Data Commons)データポータルから2016年7月11日基準、TCGAデータポータルから2016年3月21日基準としてダウンロードした。前記データのうちNCI GDCデータは、433人の体細胞突然変異(somatic mutation)データを含み、TCGAデータは、458人のMSI(Microsatellite instability)データと459人の臨床データとを含んでいる。前記体細胞突然変異データは、VCF(Variant Call Format)ファイル形式であり、人間標準ゲノムGRCh38標準で整列し、MuTect2で変異を決定した。前記level2の臨床データは、様々な臨床変因を含んでおり、Cox proportional hazard modelに使用される変因は、病理学者が選別した。前記MSIデータは、各患者別にMSIの状態によって「MSS」、「MSI−L」、「MSI−H」に分類しており、本実施例では、MSI−LとMSI−H群をMSI陽性群、MSS群をMSI陰性群に区分して分析した。
【0120】
Cox proportional hazard modelの適用に必要な情報のない患者、他の悪性腫瘍の陽性、あるいは転移陽性、放射線治療、薬物、ablation adjuvantの治療患者のデータを除いた。そして、体細胞突然変異データとMSIデータのない患者を除いた。VAT(Variant Annotation Tool)で変異の注釈を付けてsynonymous変異を除いた後、HGNC symbolのない遺伝子のデータを除いた。最後に、臨床情報とMSIデータのない患者のデータを除いた。最終的に、427人の大腸がん患者が分析に使用された。
【0121】
先ず、全体427人の大腸がん患者を対象として実施例1〜2に例示された方法で合成がん生存遺伝子対を探そうとしたが、一つの有意な合成がん生存遺伝子対も見つけられなかった。大腸がんの場合、MSIの状態によって体細胞突然変異の数及び予後が異なるので、MSI陽性群151人と陰性群276人に区分した。MSIの状態によって大腸がん患者を二群に分けて、MSI陽性群(MSI−L&MSI−H)で14個の有意な合成がん生存遺伝子対を検出した(p<0.05、HR>1)。しかし、体細胞突然変異の負担が低いMSI陰性群では、有意な合成がん生存遺伝子対が一つも発見されなかった。MSI陽性群で検出した大腸がんの合成がん生存遺伝子対を表3に示した。
【0122】
【表3】
【0123】
表3に示すように、14個の合成がん生存遺伝子対は、17個の遺伝子で構成され、細胞のmotor activityやnucleoside/nucleotide bindingと関連した。特に、MSI群でOBSCN遺伝子とPIK3CA遺伝子が互いに合成がん生存遺伝子対をなすことを確認した。つまり、OBSCNとPIK3CA対において、OBSCNのみが遺伝子損傷点数が低いか、IK3CAのみが遺伝子損傷点数が低い外損傷群の二群は、二つの遺伝子とも遺伝子損傷点数は低くない非損傷群と比較した時、がん生存率で有意な差異を示さなかったが、OBSCNとPIK3CAの遺伝子損傷点数が低い対損傷群は、残りの三群全てに比べて統計学的に有意にがん患者の生存率が高い(p<0.05、HR>1.0)ことを確認することができた。従って、大腸がんで体細胞突然変異を示すOBSCN遺伝子とPIK3CA遺伝子対は、上記で定義した大腸がんの合成がん生存遺伝子対の判断基準に符合することを確認した。
【0124】
次に、実施例3と同様に、合成がん生存遺伝子対の個数ががん患者の予後と生存率に及ぼす影響を分析した。その結果を表4に示した。
【0125】
【表4】
【0126】
表4に示すように、427人の大腸がん患者を合成がん生存遺伝子対を一つも持たない345人、1つ以上持った82人の二群に分けて、Cox proportional hazard modelを適用した生存分析を行った結果、合成がん生存遺伝子対を持った82人の生存率が統計学的に有意に高いことを確認することができた(p<0.0005、HR>1.0)。これを通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担の確認を通じて、当該がん患者の生存予後が予測可能なことが分かった。
【0127】
上述したように、同一のデータでMSIの状態を区分せず全体の大腸がん患者を対象として行った分析で合成がん生存遺伝子対が一つも発見されなかったことと比較して、以上の結果は非常に重要な医学的意味を有する。一般的に、全体の大腸がん患者を使用した場合のように、より多くの患者を対象として統計分析を行う場合、有意な結果が検出される確率が高いと知られている。
【0128】
しかし、本実施例は、生物学的マーカーを基準として区分したさらに同質的な群で合成がん生存分析を行うことがより精密な結果が提供可能なことを例示する。例えば、乳がんは、ER(Estrogen Receptor)、PR(Progesteron Receptor)などのホルモン受容体発現有無によって、診断、治療、予後に重大な影響を及ぼすため、臨床的な細部群を分けて判断する。従って、本実施例は、最新の生物学的マーカーによって同じがん腫も多様な細部群に分けて合成がん生存分析を行うことが有用かつ効果的なことを例示し、このような方法が本発明の範囲に属することを例示する。