特許第6681475号(P6681475)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ サイフェロームの特許一覧

特許6681475がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム
<>
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000024
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000025
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000026
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000027
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000028
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000029
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000030
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000031
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000032
  • 特許6681475-がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム 図000033
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】6681475
(24)【登録日】2020年3月25日
(45)【発行日】2020年4月15日
(54)【発明の名称】がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステム
(51)【国際特許分類】
   G16B 20/00 20190101AFI20200406BHJP
【FI】
   G16B20/00
【請求項の数】22
【全頁数】50
(21)【出願番号】特願2018-542073(P2018-542073)
(86)(22)【出願日】2016年10月26日
(65)【公表番号】特表2019-503016(P2019-503016A)
(43)【公表日】2019年1月31日
(86)【国際出願番号】KR2016012108
(87)【国際公開番号】WO2017074036
(87)【国際公開日】20170504
【審査請求日】2018年5月23日
(31)【優先権主張番号】10-2015-0148717
(32)【優先日】2015年10月26日
(33)【優先権主張国】KR
(31)【優先権主張番号】10-2016-0140346
(32)【優先日】2016年10月26日
(33)【優先権主張国】KR
(73)【特許権者】
【識別番号】518148009
【氏名又は名称】サイフェローム
(74)【代理人】
【識別番号】110000109
【氏名又は名称】特許業務法人特許事務所サイクス
(72)【発明者】
【氏名】キム ジュ ハン
【審査官】 山内 裕史
(56)【参考文献】
【文献】 韓国公開特許第10−2015−0021476(KR,A)
【文献】 特開2014−021977(JP,A)
(58)【調査した分野】(Int.Cl.,DB名)
G16B 5/00 − 99/00
(57)【特許請求の範囲】
【請求項1】
がん患者のゲノム塩基配列情報から、合成がん生存(SyntheticCancerSurvival)遺伝子対に属する一つ以上の遺伝子の塩基配列変異情報を決定する段階と;および、
前記遺伝子塩基配列変異情報から合成がん生存遺伝子対に属する、一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選択する段階;
とを含む、
がん患者のゲノム塩基配列変異を利用した、カスタマイズ型の抗がん治療薬物の選択のための情報を提供する方法であって:
ここで、前記合成がん生存遺伝子対は、がん細胞株またはがん組織に含まれる二つ以上の変異遺伝子の組み合わせが、当該がん患者の生存率の向上を誘発する遺伝子対を意味し、そして、
前記二つ以上の変異遺伝子の中で個別の変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、前記二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する方法。
【請求項2】
前記遺伝子塩基配列変異情報が、遺伝子のエクソン(exon)を構成する塩基の置換、付加または欠失についてである、請求項1に記載の方法
【請求項3】
前記塩基の置換、付加または欠失が、染色体の切断、欠失、複製、逆位または転座を含む構造的異常による、請求項2に記載の方法。
【請求項4】
前記遺伝子塩基配列変異情報、参照群のゲノム塩基配列との比較分析を通じて得られる、請求項1に記載の方法
【請求項5】
前記変異遺伝子と前記対応遺伝子は、機能喪失変異(LossofFunction(LoF)Variant)を保有しているか否かを基準として算出される、請求項1に記載の方法
【請求項6】
前記変異遺伝子と前記対応遺伝子が、各当該遺伝子が保有した遺伝子塩基配列変異点数によって決定される、請求項1に記載の方法
【請求項7】
前記変異遺伝子と前記対応遺伝子が、SIFT(SortingIntolerantFromTolerant)、PolyPhen、PolyPhen−2(PolymorphismPhenotyping)、MAPP(MultivariateAnalysisofProteinPolymorphism)、Logre(LogRPfamE−value)、MutationAssessor、Condel、GERP(GenomicEvolutionaryRateProfiling)、CADD(CombinedAnnotation−DependentDepletion)、MutationTaster、MutationTaster2、PROVEAN、PMuit、CEO(CombinatorialEntropyOptimization)、SNPeffect、fathmm、MSRV(MultipleSelectionRuleVoting)、Align−GVGD、DANN、Eigen、KGGSeq、LRT(LikelihoodRatioTest)、MetaLR、MetaSVM、MutPred、PANTHER、Parepro、phastCons、PhD−SNP、phyloP、PON−P、PON−P2、SiPhy、SNAP、SNPs&GO、VEP(VariantEffectPredictor)、VEST(VariantEffectScoringTool)、SNAP2、CAROL、PaPI、Grantham、SInBaD、VAAST、REVEL、CHASM(Cancer−specificHigh−throughputAnnotationofSomaticMutations)、mCluster、nsSNPAnayzer、SAAPpred、HanSa、CanPredict、FIS及びBONGO(BondsONGraphs)からなる群より選択されたいずれか一つ以上のアルゴリズムを、各当該遺伝子が保有した遺伝子塩基配列変異に適用して算出された、一つ以上の遺伝子塩基配列変異点数から算出される、請求項1に記載の方法
【請求項8】
前記変異遺伝子と前記対応遺伝子は、SIFT(SortingIntolerantFromTolerant)、PolyPhen、PolyPhen−2(PolymorphismPhenotyping)、MAPP(MultivariateAnalysisofProteinPolymorphism)、Logre(LogRPfamE−value)、MutationAssessor、Condel、GERP(GenomicEvolutionaryRateProfiling)、CADD(CombinedAnnotation−DependentDepletion)、MutationTaster、MutationTaster2、PROVEAN、PMuit、CEO(CombinatorialEntropyOptimization)、SNPeffect、fathmm、MSRV(MultipleSelectionRuleVoting)、Align−GVGD、DANN、Eigen、KGGSeq、LRT(LikelihoodRatioTest)、MetaLR、MetaSVM、MutPred、PANTHER、Parepro、phastCons、PhD−SNP、phyloP、PON−P、PON−P2、SiPhy、SNAP、SNPs&GO、VEP(VariantEffectPredictor)、VEST(VariantEffectScoringTool)、SNAP2、CAROL、PaPI、Grantham、SInBaD、VAAST、REVEL、CHASM(Cancer−specificHigh−throughputAnnotationofSomaticMutations)、mCluster、nsSNPAnayzer、SAAPpred、HanSa、CanPredict、FIS及びBONGO(BondsONGraphs)からなる群より選択されたいずれか一つ以上のアルゴリズムを、各当該遺伝子が保有した遺伝子塩基配列変異に適用して算出された一つ以上の遺伝子塩基配列変異点数から算出される遺伝子損傷点数によって決定される、請求項1に記載の方法
【請求項9】
各当該遺伝子が保有した遺伝子塩基配列変異が二つ以上の場合、前記変異遺伝子と前記対応遺伝子が、遺伝子塩基配列変異点数の平均値として算出される遺伝子損傷点数によって決定される、請求項1に記載の方法
【請求項10】
前記平均値は、幾何平均、算術平均、調和平均、算術幾何平均、算術調和平均、幾何調和平均、ピタゴラス平均、ヘロン平均、逆調和平均、平均平方根偏差、セントロイド平均、四分平均、二次平均、切削平均、ウィンザー化平均、加重平均、加重幾何平均、加重算術平均、加重調和平均、関数の平均、冪平均、一般化されたf−平均、百分位数、最大値、最小値、最頻値、中央値、中央範囲、中心傾向度(measuresofcentraltendency)、単純積及び加重積からなる群より選択されたいずれか一つ以上によって計算される、請求項9に記載の方法
【請求項11】
前記遺伝子損傷点数は、下記数式1によって算出される、請求項8に記載の方法
【数1】
前記数式1において、
Sgは、遺伝子gがコーディングするタンパク質の遺伝子損傷点数(gene deleteriousness score)、
nは、前記遺伝子gの塩基配列変異の中で分析対象の塩基配列変異の数、
viは、i番目の分析対象の塩基配列変異の前記塩基配列変異点数であり、および、
pは、0でない実数である。
【請求項12】
前記遺伝子損傷点数(gene deleteriousness score)、下記数式2によって算出される、請求項8に記載の方法
【数2】
前記数式2において、
Sgは、遺伝子gがコーディングするタンパク質の遺伝子損傷点数、
nは、前記遺伝子gの塩基配列変異の中で分析対象の塩基配列変異の数、
viは、i番目の分析対象の塩基配列変異の遺伝子塩基配列変異点数であり、そして、
wiは、前記i番目の塩基配列変異の前記遺伝子塩基配列変異点数viに与えられる加重値である。
【請求項13】
前記合成がん生存遺伝子対情報を利用して、前記がん患者に対して適用される薬物間の優先順位を決定する段階、または、前記合成がん生存遺伝子対情報を利用して前記がん患者に適用される薬物を、使用するか否かを決定する段階を、
さらに含む請求項1に記載の方法
【請求項14】
前記塩基配列変異情報の決定対象である一つ以上の遺伝子を含む合成がん生存遺伝子対の選定
がん患者の遺伝子の突然変異と生存情報を利用した、がん患者の生存分析によって行われ、または
がん細胞株またはがん組織におけるゲノム突然変異の分析及び、前記がん細胞株またはがん組織における浸潤能または転移能の同定によって行われる、請求項1に記載の方法
【請求項15】
前記がん患者の生存分析が、生物学的マーカーを基準として二つ以上の部分群に区分した後、各部分群におけるゲノム突然変異情報と患者生存情報を利用して行われる、請求項14に記載の方法。
【請求項16】
前記候補薬物の選定は、
前記がん患者のゲノム塩基配列情報から選別された合成がん生存遺伝子対に属する一つ以上の対応遺伝子と対をなす一つ以上の変異遺伝子の個数を算出し、その算出された個数を基準として候補薬物の優先順位または組み合わせを決定することによって行われる、請求項1に記載の方法
【請求項17】
がん患者のゲノム塩基配列変異情報を利用した、カスタマイズ型の抗がん治療薬物の選択システムであって、前記システムは、以下を含む。
・がん患者に対して適用対象となる抗がん治療薬物及び前記薬物によって抑制される遺伝子、と関連した情報の検索または抽出が可能なデータベース;
・前記データベースにアクセス可能な通信部;
・がんゲノム塩基配列分析部;
・薬物選択情報提供部;および、
表示部。
ここで、前記がんゲノム塩基配列分析部は:
合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子選定部;及び
・合成がん生存遺伝子対を構成する一つ以上の当該変異遺伝子と対をなす、一つ以上の対応遺伝子を選定する対応遺伝子選定部;
を含み、
前記薬物選択情報提供部は、前記一つ以上の当該対応遺伝子を抑制することについての、抗がん治療薬物選択情報を提供し、
前記合成がん生存遺伝子対は、がん細胞株またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対を意味し、そして、
前記二つ以上の変異遺伝子の中で個別の変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、前記二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する。
【請求項18】
下記プロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な記憶媒体であって、
ここで、前記プロセッサは、以下を含む動作を行い、
・がん患者のゲノム塩基配列情報から、合成がん生存(SyntheticCancerSurvival)遺伝子対を選別し;および、
・前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選別する:
および、ここで、
前記合成がん生存遺伝子対は、がん細胞株またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対を意味し、そして、
前記二つ以上の変異遺伝子の中で個別の変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、前記二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する。
【請求項19】
がん患者ゲノムの塩基配列情報から合成がん生存(SyntheticCancerSurvival)遺伝子対に属する一つ以上の遺伝子の数を算出することを含む、がん患者の予後の予測のための情報を提供する方法。
ここで、前記合成がん生存遺伝子対は、がん細胞株またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対を意味し、そして、
前記二つ以上の変異遺伝子の中で個別の変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、前記二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する。
【請求項20】
前記がん患者のゲノムの塩基配列情報から、合成がん生存(SyntheticCancerSurvival)遺伝子対に属する一つ以上の遺伝子の数及び体細胞突然変異遺伝子の数、
を算出する段階を含む、請求項19に記載の方法
【請求項21】
がん患者のゲノム塩基配列変異情報を利用した、カスタマイズ型の抗がん治療薬物選択システムであって、前記システムは、以下を含む。
・がん患者に対して適用対象となる抗がん治療薬物及び前記薬物によって抑制される遺伝子と関連した情報の検索または抽出が可能なデータベース;
・前記データベースにアクセス可能な通信部;
・がんゲノム塩基配列分析部;
・薬物選択情報提供部;および、
表示部。
ここで、前記がんゲノム塩基配列分析部は:
合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子対選定部;及び
・合成がん生存遺伝子対を構成する一つ以上の当該変異遺伝子と対をなす、一つ以上の対応遺伝子を選定する対応遺伝子選定部;
を含み、
前記薬物選択情報提供部は、前記がん患者の合成がん生存遺伝子対の個数を増加させる薬物選択情報を提供し、
前記合成がん生存遺伝子対は、がん細胞株またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対を意味し、そして、
前記二つ以上の変異遺伝子の中で個別の変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、前記二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する。
【請求項22】
下記プロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な記憶媒体であって
ここで、前記プロセッサは、以下を含む動作を行い、
がん患者のゲノム塩基配列情報から合成がん生存(SyntheticCancerSurvival)遺伝子対を選別し、および、
前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物の中で合成がん生存遺伝子対の個数を増加させる候補薬物を選別し、そして、
前記合成がん生存遺伝子対は、がん細胞株またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対を意味し、そして、
前記二つ以上の変異遺伝子の中で個別の変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、前記二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、がん患者のゲノム塩基配列変異情報と生存情報を利用したカスタマイズ型の薬物選択方法とシステムに関し、さらに具体的に、がん患者のゲノム塩基配列変異の中で合成がん生存(Synthetic Cancer Survival)遺伝子の変異情報を利用したカスタマイズ型の抗がん治療薬物選択方法及びシステムに関する。
【背景技術】
【0002】
生命工学技術の発展により、現在は、人間の全ゲノム塩基配列(whole genome sequence)を分析して、個々人の疾病を予測し、カスタマイズ型の疾病予防及び治療方法を提供する段階まで到達した。
【0003】
ゲノム学の急速な発展により、がんの病因論としてゲノムの不安定性と累積した変形が定説として扱われ、ゲノムの高速大容量の分析及び情報処理新技術の急速な発展により、先進国では実際の臨床適用が急速に実現されている。
【0004】
一方、原発性腫瘍のあるがん患者の治療において、重要な部分の一つは、正確な予後(prognosis)の予測であり、このような予後は、年齢、病理学的所見などの一般的な臨床変因に基づいて判断されるだけでなく、最近では、ゲノム学的変異や増幅のような分子的変因に基づいて判断されている。代表として、ER、PR、HER2のタンパク質発現レベルが乳がんの重要な予後因子として確認され、これは、実際の治療にも適用されている。また、最近の卵巣がんの分子的プロファイルを利用して予後予測した研究が紹介され、この研究では、乳がんの予後因子として知られていたBRCA1遺伝子とBRCA2遺伝子に存在する突然変異の有無によって当該患者群の予後が互いに異なることを報告した。この研究は、臨床的変因の他に分子的プロファイルでもがん患者の予後が測定可能なことを確認した初期研究の一つであり、分子ゲノム学的指標が様々ながん腫に多様な方式で活用可能なことを示唆した研究である。
【0005】
最近、多様ながんゲノム分析データとその分析結果などがTCGA(The Cancer Genome Atlas)、ICGC(International Cancer Genome Consortium)などの事業を通じて発表され、関連論文も多数発表された。現在、多くの主要がん腫に対して、ゲノム、トランスクリプトーム、後成ゲノムなどのプロファイル分析データが発表され、がんの原因遺伝子探し、がんの分子的分類を助ける生物学的指標(biomarker)探し、予後因子探し、治療反応指標探し、がん組織とがんゲノム変異の異質性(heterogeneity)などに関する多様な内容が含まれた。
【0006】
現在まで発表された多くの研究は、個別遺伝子の特性と役割に対する研究に焦点が当てられており、がんの治療標的や予後指標と関連した研究も、個別遺伝子と単一がん腫に対する限定的研究がほとんどである。しかし、このように確認された原因遺伝子が直接的に治療標的や新薬開発に適用することはあまり容易ではなく、がんの複雑性と異質性(heterogeneity)により単一生物学的指標中心のがん研究の結果は、個人差を反映した個別化医学(personalized medicine)的適用が容易ではなく、実際の臨床適用で多様な限界を表している。
【0007】
従って、現在の単一生物学的指標を利用したがん研究の限界を克服するためには、個人別ゲノム塩基配列変異の総合的な分析情報を直接活用したデータ基盤のカスタマイズ型の抗がん治療薬物選択方法論に基づいた個人カスタマイズ型のがん診断及び治療方法論の開発の必要性が強く提起される。
【発明の概要】
【発明が解決しようとする課題】
【0008】
本発明は、上記のような点を勘案して案出されたもので、がん患者のゲノム突然変異情報と生存情報を活用して、がん腫別合成がん生存の遺伝子対を導出した後、個人のがん患者のゲノム塩基配列変異情報の分析を通じて、一つ以上の合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定し、前記選定された一つ以上の変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子が抑制可能な一つ以上の候補薬物を選択することで、カスタマイズ型の抗がん治療薬物選択のための情報を提供する方法及びシステムを提供する。
【課題を解決するための手段】
【0009】
一つの様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対に属する一つ以上の遺伝子の塩基配列変異情報を決定する段階と、前記塩基配列変異情報から合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選定する段階とを含む、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法を提供する。
【0010】
他の様態において、本発明は、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、前記データベースにアクセス可能な通信部と、がんゲノム塩基配列分析部と、薬物選択情報提供部と、表示部とを含み、前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、前記薬物選択情報提供部は、前記一つ以上の対応遺伝子を抑制する抗がん治療薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムを提供する。
【0011】
また、他の様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対を選別する段階と、前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選別する段階とを含む動作を行うプロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体を提供する。
【0012】
また、他の様態において、本発明は、がん患者ゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対に属する一つ以上の遺伝子の数を算出する段階を含む、がん患者の予後の予測のための情報を提供する方法を提供する。
【0013】
また、他の様態において、本発明は、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、前記データベースにアクセス可能な通信部と、がんゲノム塩基配列分析部と、薬物選択情報提供部と、表示部とを含み、前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子対選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、前記薬物選択情報提供部は、前記がん患者の合成がん生存遺伝子対の個数を増加させる薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムを提供する。
【0014】
また、他の様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対を選別する段階と、前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物の中で合成がん生存遺伝子対の個数を増加させる候補薬物を選別する段階とを含む動作を行うプロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体を提供する。
【発明の効果】
【0015】
本発明によるがん患者のゲノム突然変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステムは、がん患者のゲノム突然変異情報と生存情報から導出した合成がん生存遺伝子対の塩基配列変異分析を通じて、個人別に治療効果及び予後の良い抗がん治療薬物を選択することができる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。
【0016】
本発明による方法及びシステムを利用する場合、合成がん生存を誘発する遺伝子対に属する一つ以上の変異遺伝子を選定し、当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子の選定を通じて、前記対応遺伝子を抑制する一つ以上の抗がん治療薬物を選択することで、数個の比較対象薬物の中で個人別カスタマイズ型の抗がん剤の選択が可能であり、薬物の効果または副作用のリスクなどを事前に予測することで、個人に適用される抗がん剤間の優先順位、最適な組み合わせ、または使用可否を決定することができる。また、合成がん生存遺伝子対に属する変異遺伝子の組み合わせの中で、特定のがん腫別に当該がん腫で多数の患者から発見される一つ以上の変異遺伝子の組み合わせを選定し、個別患者のゲノム塩基配列分析結果とは独立して、一般的に当該がん腫の多数の患者で治療効果及び予後が良いと予測される一つ以上の抗がん治療薬物の組み合わせを選択して、各がん腫別に特化した複合抗がん療法(combination chemotherapy)の開発及び臨床適用に活用することができる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。
【0017】
また、本発明による方法及びシステムは、合成がん生存遺伝子対の個人別の塩基配列変異の頻度及び分布分析を通じて、がんの予後を予測するのに使用されることができ、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じて、がんの予後を予測するのに使用されることができる。また、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じて、薬物治療反応性を予測するのにも効果的に使用されることができる。
【図面の簡単な説明】
【0018】
図1】皮膚黒色種患者から発見された合成がん生存遺伝子対の一つであるDNAH2とXIRP2遺伝子対の一例を挙げて、当該一合成がん生存遺伝子対に属する二つの遺伝子とも深刻な(低い)遺伝子損傷点数を示す場合(赤色線)、二つの遺伝子のうち一つのみが深刻な遺伝子損傷点数を示す二種の場合(黄色線と青色線)、二つの遺伝子とも深刻な遺伝子損傷点数を示さない場合(緑色線)の生存分析曲線を示す図である。
図2】合成がん生存遺伝子対を構成する遺伝子のネットワークを示す図である(肺腺がん(LUAD、赤色線)、皮膚黒色種(SKCM、黄色線)、肺扁平上皮がん(LUSC、青色線)、HNSC(頭頸部扁平上皮がん、茶色線)、KIRP(Kidney Renal Clear Cell Carcinoma、紫色線))。
図3】肺腺がん患者群から発見される合成がん生存遺伝子対で構成された肺腺がん合成がん生存ネットワークを背景として、一人の肺腺がん患者の体細胞突然変異を重ねて描いた図面である。灰色で描かれた肺腺がん合成がん生存ネットワークにおいて、一つのノードは、肺腺がんの合成がん生存遺伝子対に属する一つの遺伝子を意味し、連結線は、一対の合成がん生存遺伝子対を連結する。黄色のノードと赤色のノードは、当該肺腺がん患者で遺伝子損傷点数の低い体細胞突然変異を示す遺伝子を表し、この中で赤色ノードは、連結線で連結された対応ノードと共に合成がん生存遺伝子対を構成したノードを意味する。黄色のノードは、連結線で連結された対応ノードのうち低い遺伝子損傷点数を有する遺伝子が存在せず合成がん生存遺伝子対を構成しないノードを意味する。
図4】肺腺がんの一例を挙げて、肺腺がん患者で低い遺伝子損傷点数を示す体細胞突然変異の発生頻度を遺伝子別に例示し、棒グラフで示す図である。TP53とTTN遺伝子が最も多く遺伝子損傷の体細胞突然変異を示すことが例示された。
図5】肺腺がんの一例を挙げて、肺腺がん患者で合成がん生存遺伝子対をなす遺伝子がそれぞれ幾つの合成がん生存遺伝子対に参加するかを当該参加頻度によって累積棒グラフで示す図である。例示された赤色の折れ線グラフは、当該遺伝子が幾つの合成がん生存遺伝子対に参加して発見されるか、その頻度を例示した図である。肺腺がんの場合、XIRP2とRYR3が最も多く合成がん生存遺伝子対を構成することが例示された。
図6】341人の肺腺がん患者を対象として、合成がん生存遺伝子対を一つも持っていない149人、1個以上〜10個未満を持っている122人、及び10個以上を持っている70人と、計三群に分けて、Cox proportional hazard modelを適用した生存分析を行った図面である。図6の下段にある3個の生存分析グラフは、341人の肺腺がん患者を合成がん生存遺伝子対の保有数によって計三群に分けた後、それぞれの部分群を体細胞突然変異個数の多少によって折半して、体細胞突然変異の負担がより高い(high)74人、61人、35人の生存曲線は赤色で、体細胞突然変異の負担がより低い(low)75人、61人、35人の生存曲線は空色で示した図面である。
図7】181人の皮膚黒色種患者を対象として、合成がん生存遺伝子対を一つも持っていない88人、1個以上〜5個未満を持っている47人、及び5個以上持っている46人と、計三群に分けて、Cox proportional hazard modelを適用した生存分析を行った図面である。図7の下段にある3個の生存分析グラフは、181人の皮膚黒色種患者を合成がん生存遺伝子対の保有数によって計三群に分けた後、それぞれの部分群を体細胞突然変異数の多少によって折半して、体細胞突然変異の負担がより高い(high)44人、23人、23人の生存曲線は赤色で、体細胞突然変異の負担がより低い(low)44人、24人、23人の生存曲線は空色で示した図面である。
図8】肺腺がん患者と皮膚黒色種患者で体細胞突然変異の負担と合成がん生存の負担の相関関係をログ−ログ関係で示す図である。
図9】5個の肺がん細胞株、A(□)、B(○)、C(△)、D(+)、及びE(x)のゲノム塩基配列分析で得た体細胞突然変異の負担と合成がん生存の負担の相関関係を示す図である。
図10】Matrigel invasion assay方法を使用して5個の肺がん細胞株、A(□)、B(○)、C(△)、D(+)、及びE(x)のMatrigel浸潤能力または転移能力を3回の実験で同定した結果を棒グラフで示した図面である。図10の下段に並べられた3行の撮影写真は、前記5個の肺がん細胞株に対する3回のMatrigel invasion assay結果を撮影して示す図である。
【発明を実施するための形態】
【0019】
本発明は、従来公知された合成致死(synthetic lethality)の概念から脱して、特定の患者で特定の二つの遺伝子のうち、当該二つの遺伝子の機能が全て損傷される場合のみに当該患者の生存率が高く、当該二つの遺伝子の機能が正常であるか、当該二つの遺伝子のいずれか一つの機能が損傷された場合でも患者の生存率が低い組み合わせの形態である「合成がん生存(Synthetic Cancer Survival、SCS)」の概念に基づいたもので、これを利用してがんの遺伝子相互作用の分析、カスタマイズ型の抗がん治療薬物選択及びがん患者の予後を予測することに活用することができる新しい方法を提供する。
【0020】
一つの様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対に属する一つ以上の遺伝子の塩基配列変異情報を決定する段階と、前記塩基配列変異情報から合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選定する段階とを含む、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択のための情報を提供する方法を提供する。
【0021】
本発明で使用される用語である「塩基配列またはヌクレオチド配列(base sequence or nucleotide sequence)」とは、核酸DNAまたはRNA構成の基本単位であるヌクレオチドの構成成分の一つである塩基を順に並べた配列である。
【0022】
本発明で使用される用語である「塩基配列変異情報」は、核酸塩基配列が比較対象である参照塩基配列と配列上の差異を示す場合、その差異を示す部分を意味するもので、遺伝子のエクソンを構成する塩基の置換、付加または結実に関する情報を意味する。このような塩基の置換、付加、または結実は、様々な原因によって発生することができ、例えば、染色体の突然変異、切断、結実、重複、逆位及び/又は転座を含む構造的差異によることができる。
【0023】
前記参照塩基配列または参照誘電体(Reference base(or nucleotide)sequence or Reference genome)とは、塩基配列を比較する際に基準となる塩基配列で、参照塩基配列もしくは標準塩基配列という。
【0024】
本発明で使用されるがんゲノム塩基配列情報は、公知された塩基配列分析法を利用して決定されることができ、また、商用化されたサービスを提供するBGI(Beijing Genome Institute)、Knome、Macrogen、DNALinkなどのサービスを利用することができ、これに制限されない。
【0025】
本発明において、がんゲノム塩基配列に存在する遺伝子塩基配列変異情報は、様々な方法を利用して抽出されることができ、参照群、例えばHG19のゲノム塩基配列との配列比較プログラム、例えば、ANNOVAR(Wang et al.,Nucleic Acids Research、2010;38(16):e164)、SVA(Sequence Variant Analyzer)(Ge et al.,Bioinformatics.2011;27(14):1998−2000)、BreakDancer(Chen et al.,Nat Methods.2009 Sep;6(9):677−81)などを利用した塩基配列比較分析を通じて得られることができる。
【0026】
前記遺伝子塩基配列変異情報は、コンピュータシステムを通じて受付及び得られることができ、このような側面で、本発明の方法は、遺伝子変異情報をコンピュータシステムで受け付ける段階をさらに含むことができる。本発明で使用されるコンピュータシステムは、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースを含む一つ以上のデータベースを含むか、データベースにアクセスすることができる。
【0027】
本発明で使用される用語である「合成がん生存(Synthetic Cancer Survival、SCS)」は、がん細胞またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する現象であり、それらの二つ以上の変異遺伝子のうち、個別変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、それらの二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する場合、その現象を合成がん生存という。本発明で使用される用語である合成がん生存は、合成がん生存を誘発する二つ以上の変異遺伝子の組み合わせが必ずしも一つのがん細胞内で発生した場合のみを指すものではない。このような二つ以上の変異遺伝子の組み合わせが互いに異なるがん細胞であっても、同一のがん組織内の互いに異なるがん細胞でそれぞれ発生して組み合わせをなした場合でも、これを合成がん生存という。本発明の一実施例では、がん患者のゲノム突然変異と生存情報を利用したがん患者の生存分析を通じて合成がん生存遺伝子を選定し、本発明の他の一実施例では、がん細胞株またはがん組織におけるゲノム突然変異の分析及び、前記がん細胞株またはがん組織における浸潤能または転移能の同定を通じて合成がん生存遺伝子を選定した。
【0028】
本発明で使用される用語である「合成がん生存遺伝子対(SCS pair of genes)」は、がん細胞またはがん組織に含まれた二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する遺伝子対であり、それらの二つ以上の変異遺伝子のうち、個別変異遺伝子のそれぞれは、当該がん患者の生存率の向上を誘発しないが、それらの二つ以上の変異遺伝子の組み合わせが当該がん患者の生存率の向上を誘発する場合、その遺伝子対を合成がん生存遺伝子対という。本発明で使用される用語である合成がん生存遺伝子対は、合成がん生存を誘発する遺伝子対が必ずしも一つのがん細胞内で発生した場合のみを指すものではなく、互いに異なるがん細胞であっても、同一のがん組織内の互いに異なるがん細胞でそれぞれ発生して組み合わせをなした遺伝子対も合成がん生存遺伝子対という。この時、合成がん生存遺伝子対に属する二つの遺伝子のうち、二つとも低い遺伝子損傷点数を有する変異遺伝子であれば、当該二つの遺伝子は合成がん生存遺伝子対を構成したと定義する。また、合成がん生存遺伝子対に属する二つの遺伝子のうち一つは、低い遺伝子損傷点数を有する変異遺伝子であり、他の一つは、遺伝子損傷点数が低くない対応遺伝子であれば、当該対応遺伝子を抑制する薬物で当該対応遺伝子を抑制すれば、当該がん患者の生存率が高められると予測することができる。本発明の一実施例では、がんゲノム突然変異と患者生存情報を利用した生存分析を通じて合成がん生存遺伝子対を選定し、その具体的な例を表2に示し、本発明の範囲がこれに制限されない。
【0029】
さらに具体的に、本発明の一実施例では、がん患者のゲノム突然変異と生存情報を利用したがん患者の生存分析を通じて合成がん生存遺伝子対を選定したが、前記合成がん生存遺伝子対は、がん患者から直接得たがん細胞やがん組織のみを使用して得るだけでなく、in vitro上でがん細胞株実験やがん組織実験を通じても得られる。この場合、がん患者の生存情報に対応するがん細胞の転移または浸潤能力を基準として、転移または浸潤能力が低いほど対応する生存率が高いと推定することができ、転移または浸潤能力が高いほど対応する生存率が低いと推定することができる。即ち、本発明による合成がん生存遺伝子対は、患者群の臨床情報だけでなく、細胞、組織、または動物実験などを通じても得られる。特に、細胞、組織、または動物実験の場合、自然発生的なゲノム塩基配列変異だけでなく、突然変異の誘発(mutagenesis)、薬物やRNA干渉現象などを通じた遺伝子発現の抑制実験を通じて、特定遺伝子の機能損傷状況を実験的に実現できるため、実際の臨床で観察可能ながん患者のゲノム塩基配列変異よりさらに多様な塩基配列変異を人為的に誘発するか、これに該当する遺伝子機能抑制を多様に実験して、さらに多様な合成がん生存遺伝子対が得られる。
【0030】
このようにがん患者の生存情報及び自然発生的なゲノム塩基配列変異だけでなく、人為的に突然変異を誘発した塩基配列変異や遺伝子発現の抑制などの方法により、がん細胞、組織又は動物実験で転移または浸潤能力の同定を通じて得た合成がん生存遺伝子対も本発明の範囲に属する。
【0031】
本発明で使用される用語である合成がん生存は、「合成致死(Synthetic Lethality)」とは互いに差別される概念である。合成致死は、二つ以上の遺伝子の塩基配列変異の組み合わせが細胞死を誘発する現象で、それらの二つ以上の遺伝子の塩基配列変異のうち個別遺伝子の塩基配列変異のそれぞれは、細胞死を誘発しない生存可能な塩基配列変異(viable mutation/variant)であるが、それらの二つ以上の遺伝子の生存可能な塩基配列変異の組み合わせが細胞死を誘発する場合、その現象を合成致死という。
【0032】
前記合成致死は、二つ以上の遺伝子の塩基配列変異の組み合わせが細胞死を誘発する現象で、がん疾患に適用すると、二つ以上の遺伝子の塩基配列変異の組み合わせががん細胞の死亡を誘発する現象を指す。がん疾患の場合、がん細胞の死亡が当該がん患者の生存率に多少の影響を及ぼすことはできるが、その影響の程度は制限的であり、がんの転移ががん細胞の死亡よりがん患者の生存率にさらに大きな影響を及ぼすことが知られている。また、合成致死の評価指標は、細胞死であり、がん患者の生存率ではなく、本発明の合成がん生存は、がん細胞を死亡に至らせる合成致死とは違って、がんのゲノム変異ががん細胞の成長能力や転移能力など、当該がん患者に与える能力の低下を誘発して、当該がん患者の生存に向上をもたらす現象を指す概念で、本発明で開示している合成がん生存と従来公知された合成致死とは差別化される概念である。
【0033】
また、二つ以上の遺伝子の塩基配列変異の組み合わせが細胞死を誘発する従来に公知された合成致死現象の場合、当該がん細胞は死亡に至るものであるため、実験室(in vitro)で観察はできるが、実際の患者のがん組織では発見し難いという特徴がある。一方、合成がん生存は、実際の患者のがん組織で発見される二つ以上の遺伝子の塩基配列変異の組み合わせによって発生する現象であるため、従来公知された合成致死とは差別化される概念である。
【0034】
さらに具体的に、本発明の実施例1〜実施例3に例示されたように、本発明者は、実際に様々ながん腫の組織及びがん細胞株で多数の合成がん生存遺伝子対を発見し、前記がん組織及びがん細胞株が細胞死に至らず生きていることを確認した。このような結果から、上述したように、本発明で開示しているがん患者の生存に関する概念である合成がん生存と細胞死に関する概念である合成致死とは差別化される概念であることを確認することができる。
【0035】
また、本発明の実施例4及び実施例5に例示されたように、本発明者は、合成がん生存の負担(Synthetic Cancer Survival Burden)に対する概念を提示し、合成がん生存遺伝子対をさらに多く持った患者であるほどがん生存率がよくなる量の線形相関関係を確認した。一方、合成致死の概念では、このような線形相関関係が議論されたことがなく、合成致死の概念では、一対の合成致死遺伝子対の損傷だけでも当該細胞が不可逆的に死亡すると定義される。従って、二対、または三対、またはそれ以上の合成致死遺伝子対がさらに発見されるからといって、さらに多いか大きいか強い死亡を誘発するという概念は有効でない。従って、「合成致死の負担(Synthetic Lethality Burden)」のような概念は、成立しないか立証されていない。合成がん生存の負担の新概念から確認できるように、合成がん生存と合成致死は差別化される概念である。
【0036】
本発明において、変異遺伝子と対応遺伝子は、機能喪失変異(Loss of Function Variant)を保有するか否かを基準として算出されることができる。前記機能喪失変異には、nonsense mutation、frameshift insertion and deletion、nonstop mutation and splice site mutationが含まれることができ、これに制限されない。
【0037】
さらに具体的に、変異遺伝子と対応遺伝子は、各当該遺伝子が保有した遺伝子塩基配列変異の点数によって決定されることができる。
【0038】
本発明で使用される用語である「遺伝子塩基配列変異点数」とは、ゲノム塩基配列変異がタンパク質をコーディングする遺伝子のエクソン部位から発見された時、このような個別変異が当該遺伝子がコーディングするタンパク質のアミノ酸配列変異(置換、付加または結実)または転写調節変異などをもたらして、当該タンパク質の構造及び/又は機能に有意な変化もしくは損傷を誘発する程度を数値化した点数をいい、前記遺伝子塩基配列変異点数は、ゲノム塩基配列上でアミノ酸の進化論的な保存程度、変形されたアミノ酸の物理的特性による当該タンパク質の構造や機能の変化に及ぼす程度を考慮して算出することができる。
【0039】
本発明による遺伝子損傷点数の算出方法に使用される遺伝子塩基配列変異点数を算出することは、当業界に公知された方法を利用して行うことができる。例えば、SIFT(Sorting Intolerant From Tolerant、Pauline C et al.,Genome Res.2001 May;11(5):863−874;Pauline C et al.,Genome Res.2002 March;12(3):436−446;Jing Hul et al.,Genome Biol.2012;13(2):R9)、PolyPhen、PolyPhen−2(Polymorphism Phenotyping、Ramensky V et al.,Nucleic Acids Res.2002 September 1;30(17):3894−3900;Adzhubei IA et al.,Nat Methods 7(4):248−249(2010)、MAPP(Eric A.et al.,Multivariate Analysis of Protein Polymorphism、Genome Res.2005;15:978−986)、Logre(Log R Pfam E−value、Clifford R.J et al.,Bioinformatics 2004;20:1006−1014)、Mutation Assessor(Reva B et al.,Genome Biol.2007;8:R232、http://mutationassessor.org/)、Condel(Gonzalez−Perez A et al.,The American Journal of Human Genetics 2011;88:440−449、http://bg.upf.edu/fannsdb/)、GERP(Cooper et al.,Genomic Evolutionary Rate Profiling、Genome Res.2005;15:901−913、http://mendel.stanford.edu/SidowLab/downloads/gerp/)、CADD(Combined Annotation−Dependent Depletion、http://cadd.gs.washington.edu/)、MutationTaster、MutationTaster2(Schwarz et al.,MutationTaster2:mutation prediction for the deep−sequencing age.Nature Methods 2014;11:361−362、http://www.mutationtaster.org/)、PROVEAN(Choi et al.,PLoS One.2012;7(10):e46688)、PMuit(Ferrer−Costa et al.,Proteins 2004;57(4):811−819、http://mmb.pcb.ub.es/PMut/)、CEO(Combinatorial Entropy Optimization、Reva et al.,Genome Biol 2007;8(11):R232)、SNPeffect(Reumers et al.,Bioinformatics.2006;22(17):2183−2185、http://snpeffect.vib.be)、fathmm(Shihab et al.,Functional Analysis through Hidden Markov Models、Hum Mutat 2013;34:57−65、http://fathmm.biocompute.org.uk/)、MSRV(Jiang、R.et al.Sequence−based prioritization of nonsynonymous single−nucleotide polymorphisms for the study of disease mutations.Am J Hum Genet 2007;81:346−360、http://msms.usc.edu/msrv/)、Align−GVGD(Tavtigian、Sean V.、et al.Comprehensive statistical study of 452 BRCA1 missense substitutions with classification of eight recurrent substitutions as neutral.Journal of medical genetics 2006:295−305.、http://agvgd.hci.utah.edu/)、DANN(Quang、Daniel、Yifei Chen、and Xiaohui Xie.DANN:a deep learning approach for annotating the pathogenicity of genetic variants.Bioinformatics 2014:btu703.、https://cbcl.ics.uci.edu/public_data/DANN/)、Eigen(Ionita−Laza、Iuliana、et al.A spectral approach integrating functional genomic annotations for coding and noncoding variants.Nature genetics(2016):214−220.、http://www.columbia.edu/〜ii2135/eigen.html)、KGGSeq(Li MX、Gui HS、Kwan JS、Bao SY、Sham PC.A comprehensive framework for prioritizing variants in exome sequencing studies of Mendelian diseases.Nucleic Acids Res.2012 Apr;40(7):e53.、http://grass.cgs.hku.hk/limx/kggseq/)、LRT(Chun、Sung、and Justin C.Fay.Identification of deleterious mutations within three human genomes.Genome Res.2009:1553−1561.、http://www.genetics.wustl.edu/jflab/lrt_query.html)、MetaLR(Dong、Chengliang、et al.Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies.Human molecular genetics 2015;24(8):2125−2137)、MetaSVM(Dong、Chengliang、et al.Comparison and integration of deleteriousness prediction methods for nonsynonymous SNVs in whole exome sequencing studies.Human molecular genetics 2015;24(8):2125−2137)、MutPred(Mort、Matthew、et al.MutPred Splice:machine learning−based prediction of exonic variants that disrupt splicing.Genome Biology 2014;(15)1:1、http://www.mutdb.org/mutpredsplice/about.htm)、PANTHER(Mi、Huaiyu、et al.The PANTHER database of protein families、subfamilies、functions and pathways.Nucleic Acids Research 2005;(33)suppl 1:D284−D288.、http://www.pantherdb.org/tools/csnpScoreForm.jsp)、Parepro(Tian、Jian、et al.Predicting the phenotypic effects of non−synonymous single nucleotide polymorphisms based on support vector machines.BMC bioinformatics 2007;8.1、http://www.mobioinfor.cn/parepro/contact.htm)、phastCons(Siepel、Adam、et al.Evolutionarily conserved elements in vertebrate、insect、worm、and yeast genomes.Genome Res.2005;915)8:1034−1050、http://compgen.cshl.edu/phast/)、PhD−SNP(Capriotti、E.、Calabrese、R.、Casadio、R.Predicting the insurgence of human genetic diseases associated to single point protein mutations with support vector machines and evolutionary information.Bioinformatics 2006;22:2729−2734.、http://snps.biofold.org/phd−snp/)、phyloP(Pollard、Katherine S.、et al.Detection of nonneutral substitution rates on mammalian phylogenies._Genome Res.2010;(20)1:110−121.、http://compgen.cshl.edu/phast/background.php)、PON−P(Niroula、Abhishek、Siddhaling Urolagin、and Mauno Vihinen.PON−P2:prediction method for fast and reliable identification of harmful variants.PLoS One 2015;(10)2:e0117380.、http://structure.bmc.lu.se/PON−P2/)、SiPhy(Garber、Manuel、et al.Identifying novel constrained elements by exploiting biased substitution patterns.Bioinformatics 2009;(25)12:i54−i62、http://portals.broadinstitute.org/genome_bio/siphy/documentation.html)、SNAP(Bromberg、Y.and Rost、B.SNAP:predict effect of non−synonymous polymorphisms on function.Nucleic Acids Res.2007;35:3823−3835、w http://www.rostlab.org/services/SNAP)、SNPs&GO(Remo Calabrese、Emidio Capriotti、Piero Fariselli、Pier Luigi Martell


i、and Rita Casadio.Functional annotations improve the predictive score of human disease−related mutations in proteins.Human Mutatation 2009;30:1237−1244、http://snps.biofold.org/snps−and−go/)、VEP(McLaren W、Pritchard B、Rios D、Chen Y、Flicek P and Cunningham F.Deriving the consequences of genomic variants with the Ensembl API and SNP Effect Predictor.Bioinformatics 2010;26:2069−70 http://www.ensembl.org/info/docs/tools/vep/)、VEST(Carter H、Douville C、Stenson P、Cooper D、Karchin R Identifying Mendelian disease genes with the Variant Effect Scoring Tool BMC Genomics 2013;14(Suppl 3):S3)、SNAP2(Yana Bromberg、Guy Yachdav、and Burkhard Rost.SNAP predicts effect of mutations on protein function.Bioinformatics 2008;24:2397−2398、http://www.rostlab.org/services/SNAP)、CAROL(Lopes MC、Joyce C、Ritchie GR、John SL、Cunningham F et al.A combined functional annotation score for non−synonymous variants、http://www.sanger.ac.uk/science/tools/carol)、PaPI(Limongelli、Ivan、Simone Marini、and Riccardo Bellazzi.PaPI:pseudo amino acid composition to score human protein−coding variants.BMC bioinformatics 2015;(16)1:1、http://papi.unipv.it/)、Grantham(Grantham、R.Amino acid difference formula to help explain protein evolution.Science 1974;(185)4154:862−864、https://ionreporter.thermofisher.com/ionreporter/help/GUID−D9DFB21C−652D−4F95−8132−A0C442F65399.html)、SInBaD(Lehmann、Kjong−Van、and Ting Chen.Exploring functional variant discovery in non−coding regions with SInBaD.Nucleic Acids Research 2013;(41)1:e7−e7、http://tingchenlab.cmb.usc.edu/sinbad/)、VAAST(Hu、Hao、et al.VAAST 2.0:Improved variant classification and disease_]gene identification using a conservation_]controlled amino acid substitution matrix.Genetic epidemiology 2013;(37)6:622−634、http://www.yandell−lab.org/software/vaast.html)、REVEL(Ioannidis、Nilah M.、et al.REVEL:an Ensemble Method for Predicting the Pathogenicity of Rare Missense Variants._AGHG 2016、https://sites.google.com/site/revelgenomics/)、CHASM(Carter H、Chen S、Isik L、Tyekucheva S、Velculescu VE、Kinzler KW、Vogelstein B、Karchin R Cancer−specific high−throughput annotation of somatic mutations:computational prediction of driver missense mutations Cancer Res 2009;69(16):6660−7、http://www.cravat.us)、mCluster(Yue P、Forrest WF、Kaminker JS、Lohr S、Zhang Z、Cavet G:Inferring the functional effects of mutation through clusters of mutations in homologous proteins.Human mutation.2010;31(3):264−271.10.1002/humu.21194.)、nsSNPAnayzer(Lei Bao、Mi Zhou、and Yan Cui nsSNPAnalyzer:identifying disease−associated nonsynonymous single nucleotide polymorphisms.Nucleic Acids Res 2005;33:480−482、http://snpanalyzer.uthsc.edu/)、SAAPpred(Nouf S Al−Numair and Andrew C R Martin.The SAAP pipeline and database:tools to analyze the impact and predict the pathogenicity of mutations.BMC Genomics 2013;14(3):1−11、www.bioinf.org.uk/saap/dap/)、HanSa(Acharya V.and Nagarajaram H.A. Hansa An automated method for discriminating disease and neutral human nsSNPs.Human Mutation 2012;2:332−337、hansa.cdfd.org.in:8080/)、CanPredict(Kaminker、J.S.et al.CanPredict:a computational tool for predicting cancer−associated missense mutations.Nucleic Acids Res.、2007;35:595:598、http://pgws.nci.nih.gov/cgi−bin/GeneViewer.cgi_)、FIS(Boris Reva、Yevgeniy Antipin、and Chris Sander.Predicting the functional impact of protein mutations:Application to cancer genomics.Nucleic Acids Res 2011;39:e118−e118.)、BONGO(Cheng T.M.K.、Lu Y−E、Vendruscolo M.、Lio P.、Blundell T.L. Prediction by graph theoretic measures of structural effects in proteins arising from non−synonymous single nucleotide polymorphisms.PLoS Comp Biology 2008;(4)7:e1000135、http://www.bongo.cl.cam.ac.uk/Bongo2/Bongo.htm)などのようなアルゴリズムを各当該遺伝子が保有した遺伝子塩基配列変異に適用して、遺伝子塩基配列変異情報から遺伝子塩基配列変異点数を算出することができ、これに制限されない。例えば、SIFT点数を利用して遺伝子塩基配列変異点数を付与する時、SIFT点数0.7点以上の変異は、当該遺伝子の機能に有意味な変化を誘発しないという仮定を適用して、0.7点以上の変異を変異が存在しないものに換算するなどのフィルタリング過程が適用されることができ、このような変形は、本発明の範囲に属する。例えば、SIFT点数を利用して遺伝子塩基配列変異点数を付与する時、当該SIFTの点数を任意の関数を通じて変形(transform)した値を算出して適用した点数も、本発明の範囲に属する。
【0040】
上述したアルゴリズムの目的は、それぞれの遺伝子塩基配列変異が当該タンパク質の発現または機能にどれだけ影響を及ぼし、この影響がタンパク質にどれだけ損傷を与えるか、あるいは特に影響がないかなどを見出すためである。それらは、基本的に個別遺伝子塩基配列変異がもたらす当該遺伝子がコーディングするタンパク質のアミノ酸配列及び関連変化を判断することで、当該タンパク質の発現、構造及び/又は機能に及ぼす影響を判断するという点で共通点がある。
【0041】
本発明による一実施形態では、個別遺伝子塩基配列変異点数を算出するために、SIFT(Sorting Intolerant From Tolerant)アルゴリズムを利用した。SIFTアルゴリズムの場合、例えば、VCF(Variant Call Format)形式ファイルで遺伝子塩基配列変異情報の入力を受けて、それぞれの遺伝子塩基配列変異が当該遺伝子を損傷させる程度を点数化する。SIFTアルゴリズムの場合、算出点数が0に近いほど当該遺伝子がコーディングするタンパク質の損傷が激しく、当該機能が損傷されたと判断し、1に近いほど当該遺伝子がコーディングするタンパク質が正常機能を維持していると判断する。
【0042】
また、他のアルゴリズムであるPolyPhen−2の場合、算出点数が高いほど当該遺伝子がコーディングするタンパク質の機能的な損傷程度が大きいと判断する。
【0043】
最近では、SIFT、Polyphen2、MAPP、Logre、Mutation Assessorを互いに比較し総合してCondelアルゴリズムを提示した研究(Gonzalez−Peerez、A.&Lopez−Bigas、N.Improving the assessment of the outcome of nonsynonymous SNVs with a consensus deleteriousness score、Condel.The American Journal of Human Genetics、2011;88(4):440−449)が発表され、前記研究では、タンパク質に損傷を与える遺伝子塩基配列変異及び影響の少ない遺伝子塩基配列変異と関連して公知されたデータの集合であるHumVarとHumDiv(Adzhubei、IAet al.,A method and server for predicting damaging missense mutations.Nature Methods、2010;7(4):248−249)を使用して前記5個のアルゴリズムを比較した。その結果、HumVarの97.9%のタンパク質の損傷を引き起こす遺伝子塩基配列変異と97.3%の影響の少ない遺伝子塩基配列変異が前記5個のアルゴリズムのうち少なくとも3個のアルゴリズムで同一に感知され、HumDivの99.7%のタンパク質損傷を引き起こす遺伝子塩基配列変異と98.8%の影響の少ない遺伝子塩基配列変異が前記5個のアルゴリズムのうち少なくとも3個のアルゴリズムで同一に感知された。また、前記HumDivとHumVarに対して、前記5個のアルゴリズムと各アルゴリズムを統合して計算した結果の正確度を表すROC(Reciever Operating Curve)曲線を描いた結果、非常に高い水準(69%〜88.2%)でAUC(Area Under the Reciever Operating Curve)の一致度を表すことを確認した。つまり、上述した様々なアルゴリズムは、その算出方法は異なっても、算出された遺伝子塩基配列変異点数は互いに有意に相関したものである。従って、上述したアルゴリズムまたはアルゴリズムを応用した方法を適用して遺伝子塩基配列変異点数を算出する互いに異なるアルゴリズムの種類に関係なく、本発明の範囲に属する。遺伝子塩基配列変異がタンパク質をコーディングする遺伝子のエクソン部位に発生する場合、タンパク質の発現、構造及び/又は機能に直接的な影響を及ぼし得る。従って、前記遺伝子塩基配列変異情報をタンパク質機能の損傷程度と関連させることができる。このような側面で、本発明の方法は、遺伝子塩基配列変異点数を基盤として「遺伝子損傷点数」を算出する概念を含む。さらに具体的に、変異遺伝子と対応遺伝子は、前述したアルゴリズムを各当該遺伝子が保有した遺伝子塩基配列変異に適用して算出された遺伝子塩基配列変異点数から算出される遺伝子損傷点数によって決定されることができる。
【0044】
本発明において、変異遺伝子と対応遺伝子は、各当該遺伝子が保有した遺伝子塩基配列変異が二つ以上の場合、各遺伝子塩基配列変異点数の平均値として算出される遺伝子損傷点数によって決定されることができる。
【0045】
本発明で使用される用語である「遺伝子損傷点数(Gene Deleteriousness Score、GDS)」とは、一つのタンパク質をコーディングする遺伝子に二つ以上の有意な塩基配列変異が発見され、一つのタンパク質が二つ以上の遺伝子塩基配列変異点数を有する場合、前記遺伝子塩基配列変異点数を総合して計算された点数をいい、もし、タンパク質をコーディングする遺伝子部位に有意な塩基配列変異が一つである場合は、遺伝子損傷点数を当該遺伝子塩基配列変異点数と同一に算出することができる。この時、タンパク質をコーディングする遺伝子塩基配列変異が二つ以上である場合、遺伝子損傷点数は、各変異別に計算された遺伝子塩基配列変異点数の平均値で計算され、このような平均値は、例えば、幾何平均、算術平均、調和平均、算術幾何平均、算術調和平均、幾何調和平均、ピタゴラス平均、四分平均、二次平均、切削平均、ウィンザー化平均、加重平均、加重幾何平均、加重算術平均、加重調和平均、関数の平均、冪平均、一般化されたf−平均、百分位数、最大値、最小値、最頻値、中央値、中央範囲、または中心傾向度(measures of central tendency)、単純積または加重積、または前記算出値の関数演算で計算されることができるが、これに制限されない。
【0046】
本発明による一実施形態では、下記の数1によって遺伝子損傷点数を算出し、下記の数1は、多様な変形が可能であるので、これに制限されない。
【0047】
【数1】
【0048】
前記数1において、Sgは、遺伝子gがコーディングするタンパク質の遺伝子損傷点数、nは、前記遺伝子gの塩基配列変異の中で分析対象の塩基配列変異の数、viは、i番目の分析対象の塩基配列変異の前記塩基配列変異点数であり、pは、0ではなく実数である。
【0049】
前記数1において、前記pの値が1の場合は算術平均、前記pの値が−1の場合は調和平均となり、前記pの値が0に近づく極限の場合は幾何平均となる。
【0050】
本発明によるまた他の一実施形態では、下記の数2によって遺伝子損傷点数を算出した。
【0051】
【数2】
【0052】
前記数2において、Sgは、遺伝子gがコーディングするタンパク質の遺伝子損傷点数、nは、前記遺伝子gの塩基配列変異の中で分析対象の塩基配列変異の数、viは、i番目の分析対象の塩基配列変異の前記遺伝子塩基配列変異点数であり、wiは、前記i番目の塩基配列変異の前記遺伝子塩基配列変異点数viに与えられる加重値である。
【0053】
全ての加重値wiが同じ値を有する場合、前記遺伝子損傷点数Sgは、前記遺伝子塩基配列変異点数viの幾何平均値となる。前記加重値は、当該タンパク質の種類、当該タンパク質の薬動学的または薬力学的分類、当該薬物酵素タンパク質の薬動学的パラメータ、人口集団または人種別分布を考慮して付与されることができる。
【0054】
本発明による塩基配列変異点数及び遺伝子損傷点数は、大韓民国特許出願番号10−2014−0107916、PCT国際出願番号PCT/KR2014/007685に開示され、この開示内容は、その全体が参照として本願に含まれる。
【0055】
本発明による方法は、前記合成がん生存遺伝子対情報を利用して、前記がん患者に対して適用される薬物間の優先順位を決定する段階、または前記合成がん生存遺伝子対情報を利用して、前記がん患者に適用される薬物を使用するか否かを決定する段階をさらに含むことができる。
【0056】
本発明による方法は、追加的にがん腫別に有意な生物学的マーカーを基準として二つ以上の部分群に区分した後、各部分群におけるゲノム突然変異と患者生存情報を利用した生存分析を通じて、合成がん生存遺伝子対を選定することができる。
【0057】
前記生物学的マーカーは、がんと関連した診断、治療及び予後に関与するもので、当業界に知られた公知されたマーカーを全て含む概念である。例えば、大腸がんの診断、治療及び予後に重要な生物学的マーカーとして知られたMSI(Microsatellite instability)をはじめ、各がん別に公知されたマーカーを制限なく利用することができる。
【0058】
本発明において、候補薬物の選定は、前記がん患者のゲノム塩基配列情報から選別された合成がん生存遺伝子対に属する一つ以上の対応遺伝子と対をなす一つ以上の変異遺伝子の個数を算出し、その算出された個数を基準として候補薬物の優先順位または組み合わせを決定する段階によって行われることができる。
【0059】
他の様態において、本発明は、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、前記データベースにアクセス可能な通信部と、がんゲノム塩基配列分析部と、薬物選択情報提供部と、表示部とを含み、前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、前記薬物選択情報提供部は、前記一つ以上の対応遺伝子を抑制する抗がん治療薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムを提供する。
【0060】
本発明によるシステムは、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースにアクセスして関連情報を抽出し、これにより、前記カスタマイズ型の薬物選択情報をユーザに提供するユーザインタフェースをさらに含むことができる。
【0061】
本発明によるシステムにおいて、前記データベースまたはそのアクセス情報を含むサーバ、算出された情報及びこれと連結したユーザインタフェース装置は、互いに連携して使用されることができる。
【0062】
本発明によるシステムにおいて、ユーザインターフェースまたは端末は、サーバからがんゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択処理を要請、結果を受信及び/又は格納することができ、スマートフォン、PC(Personal Computer)、タブレットPC、個人携帯情報端末機(Personal Digital Assistant、PDA)、ウェブパッドなどのようにメモリー手段を具備し、マイクロプロセッサを搭載して演算能力を備えた移動通信機能を具備した端末機で構成されることができる。
【0063】
本発明によるシステムにおいて、サーバは、データベースに対するアクセスを提供する手段で、通信部を通じてユーザインターフェースまたは端末と連結され、各種の情報が交換できるように構成される。ここで、通信部は、同一のハードウェアにおける通信はもちろん、構内情報通信網(local area network、LAN)、都市圏通信網(metropolitan area network、MAN)、広域通信網(wide area network、WAN)、インターネット、2G、3G、4G移動通信網、ワイファイ(Wi−Fi)、ワイブロ(Wibro)などを含むことができ、通信方式も、有線、無線を問わず、いずれの通信方式でも構わない。データベースも、サーバに直接設置されたものだけでなく、目的によって、インターネットなどを通じてアクセス可能な多様な生命科学データベースに連結されることができる。
【0064】
本発明による方法は、ハードウェア、ファームウェア、またはソフトウェア又はそれらの組み合わせで実現されることができる。ソフトウェアで実現される場合、格納媒体は、コンピュータのような装置によって読み取り可能な形の格納または伝達する任意の媒体を含む。例えば、コンピュータ読み取り可能な媒体は、ROM(read only memory)、RAM(random access memory)、磁気ディスク格納媒体、光格納媒体、フラッシュメモリー装置、及びその他の電気的、光学的または音響的信号伝達媒体などを含む。
【0065】
このような様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対を選別する段階と、前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物を選別する段階とを含む動作を行うプロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体を提供する。
【0066】
本発明によるがん患者のゲノム突然変異情報と生存情報を利用したカスタマイズ型の薬物選択方法及びシステムは、がん患者のゲノム突然変異情報と生存情報から導出した合成がん生存遺伝子対の塩基配列変異分析を通じて、個人別に治療効果及び予後の良い抗がん治療薬物を選択することができる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。
【0067】
本発明による方法及びシステムを利用する場合、合成がん生存を誘発する遺伝子対に属する一つ以上の変異遺伝子を選定し、当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子の選定を通じて、前記対応遺伝子を抑制する一つ以上の抗がん治療薬物を選択することにより、数個の比較対象薬物の中で個人別カスタマイズ型の抗がん剤の選択が可能であり、薬物の効果または副作用のリスクなどを事前に予測することで、個人に適用される抗がん剤間の優先順位、最適な組み合わせ、また使用可否を決定することができる。また、合成がん生存遺伝子対に属する変異遺伝子の組み合わせせの中で、特定がん腫別に当該がん腫で多数の患者から発見される一つ以上の変異遺伝子の組み合わせを選定し、個別患者のゲノム塩基配列分析結果とは独立して、一般的に、当該がん腫の多数の患者で治療効果及び予後が良いと予測される一つ以上の抗がん治療薬物の組み合わせを選択して、各がん腫別に特化された複合抗がん療法(combination chemotherapy)の開発及び臨床適用に活用できる技術であり、信頼度が高く、迅速かつ簡単に関連情報を提供することができる。
【0068】
また、本発明による方法及びシステムは、合成がん生存遺伝子対の個人別の塩基配列変異の頻度及び分布分析を通じて、がんの予後を予測するのに使用されることができ、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じてがんの予後を予測するのに使用されることができる。また、合成がん生存遺伝子対と体細胞突然変異の個人別の塩基配列変異の頻度及び分布分析を通じて、薬物治療反応性を予測するのにも効果的に使用されることができる。
【0069】
また、他の様態において、本発明は、がん患者ゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対に属する一つ以上の遺伝子の数を算出する段階を含む、がん患者の予後の予測のための情報を提供する方法を提供する。
【0070】
前記方法は、前記がん患者のゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対に属する一つ以上の遺伝子の数及び体細胞突然変異遺伝子の数を算出する段階を含むことができる。
【0071】
本発明の一実施例では、合成がん生存遺伝子対を多く有するほど、がん患者の生存率が統計学的に有意に高まることを確認したが、がん患者の遺伝対分析を通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担を確認することで、当該がん患者の生存予後を効果的に予測することができる。
【0072】
また、他の様態において、本発明は、がん患者に対して適用対象となる抗がん治療薬物及び前記薬物が抑制可能な遺伝子と関連した情報検索または抽出が可能なデータベースと、前記データベースにアクセス可能な通信部と、がんゲノム塩基配列分析部と、薬物選択情報提供部と、表示部とを含み、前記がんゲノム塩基配列分析部は、合成がん生存遺伝子対に属する一つ以上の変異遺伝子を選定する変異遺伝子対選定部、及び前記一つ以上の変異遺伝子に対して当該変異遺伝子と対をなして合成がん生存遺伝子対を構成する一つ以上の対応遺伝子を選定する対応遺伝子選定部を含み、前記薬物選択情報提供部は、前記がん患者の合成がん生存遺伝子対の個数を増加させる薬物選択情報を提供する、がん患者のゲノム塩基配列変異を利用したカスタマイズ型の抗がん治療薬物選択システムを提供する。
【0073】
本発明の一実施例では、カスタマイズ型の薬物選択方法を適用して選択した薬物を患者に処置した場合、当該薬物に対する治療反応も、当該薬物が遮断する遺伝子により増加する合成がん生存遺伝子対の個数分析を通じて予測することができることを確認し、さらに具体的に、当該処置薬物が当該患者の合成がん生存遺伝子対の個数を増やす程度によって当該治療反応を予測することができ、逆に当該治療反応の向上が大きい薬物にカスタマイズの治療薬物を選択することができることを確認した。
【0074】
また、他の様態において、本発明は、がん患者のゲノム塩基配列情報から合成がん生存(Synthetic Cancer Survival)遺伝子対を選別する段階と、前記合成がん生存遺伝子対に属する一つ以上の変異遺伝子と対をなす一つ以上の対応遺伝子を抑制する一つ以上の候補薬物の中で合成がん生存遺伝子対の個数を増加させる候補薬物を選別する段階とを含む動作を行うプロセッサを実行させる実行モジュールを含むコンピュータ読み取り可能な媒体を提供する。
【0075】
本発明に利用されるコンピュータ読み取り可能な媒体については、既に上述したので、重複を避けるためにその記載を省略する。
【実施例】
【0076】
以下で、本発明の理解を助けるために、好ましい実施例を提示する。しかし、下記の実施例は、本発明をより容易に理解するために提供されるだけで、実施例によって本発明の内容が限定されるものではない。
【0077】
実施例1.がん腫別合成がん生存遺伝子対の検出及びこれを利用したカスタマイズ型の薬物選択方法
【0078】
1−1.対象データの選定
分析のためのデータをTCGAデータポータルから2015年3月4日を基準としてダウンロードした。前記データは、5618人のlevel2体細胞突然変異(somatic mutation)データと6838人のlevel2の臨床データを含んでいる。前記level2体細胞突然変異データは、maf(mutation annotation format)形式で格納されている。分析のために、突然変異位置と突然変異分類が適用された。突然変異は、「Missense mutation」、「Nonsense mutation」、「Frameshift indel」、「In frame indel」、「splice site mutation;Silent mutation」、「Intron」、「UTR」及び「Intergenic」などに分類されている。前記level2の臨床データは、がん腫による多様な臨床変因を含んでおり、実際的にCox proportional hazard modelに使用された変因は、専門的な病理学者によって検討された。
【0079】
1−2.データの処理及び分析データの構成
先ず、臨床データのうちCox proportional hazard modelのための情報がない患者のデータを除いた。次に、他の悪性腫瘍を持っているか転移が発生した患者、放射線治療、pharmaco、ablation adjuvant治療のある患者を確認した後、前記要因が患者予後の強い撹乱変因である点を考慮して、当該患者のデータを除いた。また、突然変異データのない患者のデータを除いた。さらに具体的に、突然変異データは、先ずsynonymous突然変異を除いた後、HGNC symbolのない遺伝子でデータに「Unknown」と表記された遺伝子を除いた。最後に、臨床情報のない患者のデータを除き、最終的に4,844人の患者のデータを利用して以降の分析に使用した。
【0080】
データ処理の結果、20個のがん腫で4,884人の臨床データと体細胞突然変異データを得た。このように得られたデータは、二つのデータタイプを全て持っており、Cox proportional hazard modelに必要な全ての臨床変因データを持っており、以降の分析に使用した。
【0081】
1−3.遺伝子損傷点数
本実施例では、遺伝子の有害程度を定量化するために、遺伝子損傷点数(Gene Deleteriousness Score、GDS)を定義した。遺伝子損傷点数は、当該遺伝子の突然変異個数と種類を考慮して計算され、0点から1点間の値を有するように定義された。遺伝子損傷点数は、より小さい点数であるほど当該遺伝子の機能的構造的損傷がさらに激しいという意味で定義された。例えば、もしある遺伝子がnonsense mutation、frameshift insertion and deletion、nonstop mutation and splice site mutationのような機能喪失変異(Loss of Function(LoF)Variant)を持っていれば、当該遺伝子の遺伝子損傷点数は0点と決めた。もしある遺伝子がLoF変異を持たなければ、当該遺伝子の遺伝子損傷点数は、当該遺伝子にある全てのnon−synonymous突然変異のうち、SIFT点数が0.7以下の突然変異のSIFT点数の幾何平均で決めた。この時、分母が0になる場合を避けるために、SIFT点数が0点であれば、これを10e−8点に代替した。前記SIFT点数0.7のフィルタリング基準は、本実施例の場合に適用された任意的なフィルタリング基準であり、分析の目的によって多様なフィルタリング基準を適用することができる。また、分母が0になることを避けるために付与した10e−8点の変異点数も、本実施例の場合に適用された任意的な基準であり、分析の目的によって様々な基準を適用することができる。本実施例で遺伝子損傷点数を算出するために使用されたSIFTアルゴリズム(下記の数3参照)も、本実施例の場合に適用された任意的なアルゴリズムであり、分析の目的によって多様なアルゴリズムを適用することができる。
【0082】
【数3】
【0083】
1−4.遺伝子損傷点数の分布と分析閾値の設定
前記実施例1−2で分類した分析データを元に、それぞれのがん腫で少なくとも一つ以上のnon−synonymous mutationを有する全ての遺伝子の遺伝子損傷点数を計算した。non−synonymous mutationを一つも持たない遺伝子には、1点の遺伝子損傷点数を付与した。
【0084】
その結果、がん細胞で多数の体細胞突然変異が発生するが、全体の遺伝子で体細胞突然変異が発生することはよくある現象ではないため、殆どの遺伝子の遺伝子損傷点数は1点であることを確認することができた。1点の他には、体細胞突然変異を示す多数の遺伝子の遺伝子損傷点数が0点に分布した。本実施例では、遺伝子損傷点数0.3点を基準(分析閾値)として中等度以上の遺伝子機能の損傷が起こった遺伝子と、そうでない遺伝子の二群に分けて、以降の分析に使用した。
【0085】
1−5.がん腫別合成がん生存遺伝子対の検出とがん腫別合成がん生存遺伝子のネットワーク構築
がん患者のゲノムデータから合成がん生存(SCS、Synthetic Cancer Survival)の現象を検出するために、Cox proportional hazard modelを使用した生存分析を行った。Cox proportional hazard modelは、臨床変因の撹乱作用を補正することができる。それぞれのがん腫別患者群を全ての遺伝子対に対して4群に分けた。二つの遺伝子とも遺伝子損傷点数が0.3以下の対損傷群、二つの遺伝子のうち一つの遺伝子の遺伝子損傷点数のみが0.3以下であり、他の一つは、そうでない二つの外損傷群、及び二つの遺伝子とも遺伝子損傷点数が0.3より大きい非損傷群。
【0086】
よく使用される最尤度(maximum likelihood)基盤のCox proportional hazard modelの場合、患者死亡事件が0回の場合に「収斂(convergence)」の問題が発生するため、本実施例では、これを避けるためにpenalized likelihoodを利用したCox proportional hazard modelを使用した。生存分析は、R Statistical Packageバージョン3.2.0の「coxphf」パッケージを利用して進行した。また、それぞれのがん腫別に臨床変数の撹乱作用を補正するために、Cox模型に追加された。年齢や性別のような一般的な臨床変因と病理学専門医が検討し、以前の研究で使用された臨床変因を追加した。
【0087】
図1に、皮膚黒色種患者群をDNAH2遺伝子とXIRP2遺伝子対の体細胞突然変異状態によって一つの対損傷群、二つの外損傷群及び一つの非損傷群などの計4群に分けて、それぞれの生存曲線を例示した。この時、4群の生存曲線と共に生存分析結果を表記した。図1に示すように、DNAH2遺伝子とXIRP2遺伝子は、互いに合成がん生存遺伝子対の関係にあることが分かる。つまり、DNAH2とXIRP2対において、DNAHのみが遺伝子損傷点数が低いか(青色線)XIRPのみが遺伝子損傷点数が低い(黄色線)外損傷群の場合、二つの遺伝子とも遺伝子損傷点数は低くない非損傷群(緑色線)と比較した時、がん生存率で有意な差を示さないが、DNAH2とXIRP2の遺伝子損傷点数が全て低い対損傷群は、残りの三つの群全てに比べて統計学的に有意にがん患者の生存率が高い(p<0.05、HR>1.0)ことを確認することができた。従って、皮膚黒色種で体細胞突然変異を示すDNAH2遺伝子とXIRP2遺伝子対は、上記で定義した皮膚黒色種の合成がん生存遺伝子対の判断基準に符合することを確認した。
【0088】
また、図2に、5種のがん腫(肺腺がん、皮膚黒色種、肺扁平上皮がん、頭頸部扁平上皮がん、腎臓細胞がん)で各がん腫別に得た合成がん生存遺伝子対で構成された合成がん生存遺伝子ネットワークを例示した。肺腺がん(LUAD)合成がん生存遺伝子対は、赤色の連結線で、皮膚黒色種(SKCM)合成がん生存遺伝子対は、黄色の連結線で、肺扁平上皮がん(LUSC)合成がん生存遺伝子対は、青色の連結線で、頭頸部扁平上皮がん(HNSC)合成がん生存遺伝子対は、茶色の連結線で、腎臓細胞がん(KIRP)合成がん生存遺伝子対は、紫色の連結線で表記した。図2に示すように、各がん腫別に多様な合成がん生存(SCS)遺伝子対が存在することを確認することができ、これに対する具体的な説明は、実施例2に開示した。
【0089】
本実施例では、実際のがん患者のがんゲノム変異情報の分析を通じて多様な合成がん生存遺伝子対を得ているが、これは、応用可能な多様な方法のうち一つの方法であるだけで、当該方法だけに制限されない。例えば、細胞株または動物実験環境で様々な方式で遺伝子変異を誘発し、実際のがん患者では観察され難い変異遺伝子の分析を通じて合成がん生存遺伝子対を得て、合成がん生存遺伝子ネットワークを構成することができる。特に、実施例5及び図9図10に例示されたように、Invasion Assayを含むがん細胞転移能力を同定するための様々な実験方法を使用して、合成がん生存遺伝子対が得られる。
【0090】
1−6.がん腫別合成がん生存遺伝子対の分析を利用したカスタマイズ型の薬物選択方法
本発明によるがん患者のゲノム突然変異と生存分析方法及びシステムを通じて、がん腫別合成がん生存遺伝子対を効果的かつ効率的に求め、これを利用してカスタマイズ型の薬物選択を行うための方法を説明するために、下記のような実験を行った。
【0091】
図3に、ある肺腺がん患者の体細胞突然変異の分布を合成がん生存遺伝子対のネットワークに重ねて図示した。図3のノードと連結線は、肺腺がんゲノムシーケンシングデータを分析して獲得した合成がん生存遺伝子対のネットワークを意味する。この時、ノードは、それぞれの遺伝子を意味し、連結線で連結された一対の遺伝子は、肺腺がんの合成がん生存遺伝子対であることを意味する。赤色で塗られた遺伝子ノードは、当該がん患者で対応する遺伝子と共に合成がん生存遺伝子対をなして体細胞突然変異が発見される遺伝子を意味する。黄色で塗られた遺伝子ノードは、当該遺伝子は、低い遺伝子損傷点数を示す体細胞突然変異を有する遺伝子であるが、当該遺伝子と対をなして合成がん生存遺伝子対をなす遺伝子の中では、低い遺伝子損傷点数を示す体細胞突然変異を有する対応遺伝子が一つも発見されず、合成がん生存遺伝子対をなしていない遺伝子を意味する。灰色で塗られた遺伝子ノードは、当該がん患者で低い遺伝子損傷点数を示す体細胞突然変異が発見されない遺伝子を意味する。
【0092】
従って、図3は、灰色で塗られた遺伝子の中で合成がん生存遺伝子ネットワーク情報を考慮して選定した一つ以上の遺伝子を当該の遺伝子に対する一つ以上の遮断剤で抑制すれば、他の遺伝子とどのように幾つの合成がん生存遺伝子対をなすかが分かる方法を例示する。例えば、図3に例示された肺腺がん患者のがん細胞にXIRP2遮断剤を処理すれば、RYR2、LPA、FAT4等の遺伝子と複数の合成がん生存遺伝子対をなし、当該肺腺がん患者の生存率が向上可能なことを予測することができる。また、前記肺腺がん患者のがん細胞にRYR3を遮断しても、複数の遺伝子と合成がん生存遺伝子対をなすことができることが分かるが、RYR3の場合、Dandroleneなどのカルシウムチャネル遮断剤で遮断することができる。最近では、抗体新薬の開発を通じて特定遺伝子を遮断することが可能であるため、本発明による合成遺伝子対の分析を通じて新しい新薬開発の標的遺伝子を選別することも可能である。一研究(Zhang et al.,Proc Natl Acad Sci U S A.2011 Aug 16;108(33):13653−13658.)によると、RYR3を抑制するmicro−RNA miR−367の結合部位の単一塩基多型性によって卵巣がんの予後が異なることを明らかにし、このような所見が本発明の結果物である合成がん生存遺伝子対の主要参加遺伝子であるRYR3遮断効果によるものであるかは未だ明らかでないが、本発明の結果物である合成がん生存ゲノム上の関係を通じて予後の差異を示した学術的蓋然性は高いと推定することができる。新薬の開発は、その効果性だけでなく副作用といった安全性も共に考慮して開発しなければならないが、本実施例は、がん患者のゲノム情報の次世代のシーケンシングデータ分析を通じて本発明で究明した合成がん生存遺伝子対の特性を活用して、がん患者のカスタマイズ型の薬物選択及び開発に有用な情報が提供可能なことを示す。
【0093】
実施例2.がん腫別合成がん生存遺伝子対の分布及び予後の予測
前記実施例1で提示したように、合成がん生存遺伝子分析を行った結果、5つのがん腫で436個の合成がん生存遺伝子対を選定し、その結果を表1に示した(p<0.05、HR>1)。本実施例で使用された合成がん生存遺伝子対の選別基準は、厳格に適用された。合成がん生存遺伝子対を検出するための様々な条件の組み合わせが可能なことは明確であるが、実施例1に例示したように、対損傷群と非損傷群との比較でも統計的に有意な差異を示し、対損傷群と二つの外損傷群とのそれぞれの比較でも統計的に有意な差異を示す一方、非損傷群と二つの外損傷群との間の三回の比較では統計的に有意な差異を示さない厳格な判断基準を適用して、がん腫別合成がん生存遺伝子対を選定した。
【0094】
【表1】
【0095】
表1に示すように、肺腺がん(Lung adenocarcinoma、LUAC)及び皮膚黒色種(Skin cutaneous melanoma、SKCM)で特に多くの合成がん生存遺伝子対を選別し、本実施例で選定した436個の合成がん生存遺伝子対は、さらに具体的には、281個の遺伝子で構成されており、最も多くの合成がん生存遺伝子対に属する遺伝子は、XIRP2とRYR3などである。
【0096】
本実施例の判断基準を適用して、5個のがん腫別に得た436個の合成がん生存遺伝子対のリストを表2に示した。
【0097】
【表2】
【0098】
合成がん生存遺伝子対に属する二つの遺伝子のうち、二つとも低い遺伝子損傷点数を有する変異遺伝子の場合、当該二つの遺伝子は合成がん生存遺伝子対を構成したと定義する。合成がん生存遺伝子対に属する二つの遺伝子のうち、一つは低い遺伝子損傷点数を有する変異遺伝子であり、他の一つは遺伝子損傷点数は低くない対応遺伝子の場合、当該対応遺伝子を抑制する薬物を利用すれば、当該がん患者の生存率が高められると予測することができる。
【0099】
図2に、前記表2に開示した合成がん生存遺伝子対で構成された遺伝子ネットワークを多重グラフで例示した。この時、それぞれのノードは遺伝子であり、互いに連結線で連結された遺伝子対は、合成がん生存遺伝子対を意味する。
【0100】
また、図4に、肺腺がん患者群で遺伝子損傷点数が0.3点以下の変異遺伝子の頻度をバーグラフで図示し、図5に、肺腺がんから検出された合成がん生存遺伝子対に属する変異遺伝子が肺腺がん患者から発見される頻度を図示した。
【0101】
図4及び図5に示すように、多くの患者でXIRP2とRYR3遺伝子が合成がん生存遺伝子対を構成していることが分かる。一方、TTN遺伝子の場合、TTN遺伝子の遺伝子損傷点数が低い患者の数は多かったが、TTN遺伝子が合成がん生存遺伝子対をなす患者の数は相対的に少ないことが分かった。即ち、従来の研究は、がん遺伝子の体細胞突然変異頻度を中心として行われてきたが、単に個別遺伝子の突然変異の分析だけでは、がん患者の予後及び治療反応の予測が容易でなく、本発明のように遺伝子対の分析及び遺伝子ネットワークの分析ががん患者の予後及び治療反応の予測に大きく寄与することができることを示唆する。
【0102】
実施例3.がん腫別合成がん生存の負担を利用したがんの生存及び予後の予測
がん患者の合成がん生存遺伝子対の個数ががん患者の予後と生存率に及ぼす影響を分析した。その一例として、341人の肺腺がん患者(LUAD)と181人の皮膚黒色種患者(SKCM)における結果を図6及び図7にそれぞれ示した。
【0103】
先ず、341人の肺腺がん患者を、合成がん生存遺伝子対を一つも持っていない149人、1つ以上〜10個未満を持っている122人、及び10個以上を持っている70人と、計三群に分けて、Cox proportional hazard modelを適用した生存分析を行った。その結果、図6に示すように、合成がん生存遺伝子対を最も多く持っている(10個以上を持っている)70人の生存率が最も高く、1つ以上〜10個未満を持っている122人の生存率が中間値を表し、合成がん生存遺伝子対を一つも持っていない149人の生存率が最も低いことを確認し、これを通じて、合成がん生存遺伝子対を多く持つほど肺腺がん患者の生存率が統計学的に有意に高いことを確認することができた。
【0104】
次に、181人の皮膚黒色種患者を、合成がん生存遺伝子対を一つも持っていない88人、1つ以上〜5個未満を持っている47人、及び5個以上持っている46人と、計三群に分けて、Cox proportional hazard modelを適用した生存分析を行った。その結果、図7に示すように、合成がん生存遺伝子対を多く持つほど皮膚黒色種患者の生存率が統計学的に有意に高いことを確認することができた。
【0105】
以上の実験を通じて、がん患者の遺伝対分析を通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担を確認することで、当該がん患者の生存予後を効果的に予測することができることを確認した。
【0106】
実施例4.がん腫別合成がん生存の負担と体細胞突然変異の負担を利用したがんの生存及び予後の予測
前記実施例3で開示したがん患者から発見される合成がん生存遺伝子対の個数を活用したがん患者の生存率の分析は、医学的に非常に重要な意味を有する。現在、一般的には、がん細胞のnon−synonymous体細胞突然変異が多いほどがん患者の予後が悪いと知られていたが、これとは異なる分析結果だからである。
【0107】
さらに具体的に、合成がん生存遺伝子対の個数とnon−synonymous体細胞突然変異の頻度をログ−ロググラフで示した(図8)。図8に示すように、合成がん生存遺伝子対の個数は、肺腺がんと皮膚黒色種の両方でnon−synonymous体細胞突然変異の頻度と正比例する。従って、体細胞突然変異が多いほど予後が悪いとされる現在の一般的な見解によると、体細胞突然変異の負担に正比例するがん生存遺伝子対の個数が多いほど予後が悪く表れる可能性は高いと判断することができる。しかし、実施例3の結果は、合成がん生存遺伝子対の個数が多いほど予後が良いことを示す。つまり、実施例3に開示したように、合成がん生存遺伝子対の個数が多い患者の場合、体細胞突然変異も共に増える可能性が高いが、体細胞突然変異の特殊な形態である合成がん生存遺伝子対の変異がさらに増えれば、むしろ予後が良いことが分かる。
【0108】
このようながん腫別合成がん生存の負担と体細胞突然変異の負担のがん患者の予後に与える影響の逆相関関係は、図6及び図7の下段に表記された各群別の生存分析グラフで明確に確認することができる。さらに具体的に、図6の下段にある3個の生存分析グラフは、341人の肺腺がん患者を合成がん生存遺伝子対の保有数によって三群に分けて生存分析を行った結果、三群の全てで赤色で表記された体細胞突然変異の負担がより高い患者(それぞれ74人、61人、35人)が空色で表記された体細胞突然変異の負担がより低い患者(それぞれ75人、61人、35人)より統計的に有意に悪い予後を示すことを提示する。
【0109】
また、図7の下段にある3個の生存分析グラフは、181人の皮膚黒色種患者を合成がん生存遺伝子対の保有数によって三群に分けて、生存分析を行った結果、三群の全てで赤色で表記された体細胞突然変異の負担がより高い患者(それぞれ44人、23人、23人)が空色で表記された体細胞突然変異の負担がより低い患者(それぞれ44人、24人、23人)より統計的に有意に悪い予後を示すことを提示する。
【0110】
前記結果を通じて、合成がん生存遺伝子対の個数が補正されれば、体細胞突然変異数が多いほど予後が悪いという従来の学説と一致することが分かる。逆に、図6及び図7に示した分析結果を通じて、体細胞突然変異数が多い場合でも、その突然変異数を補正すれば合成がん生存遺伝子対の負担が重要ながん予後の予測因子であることが分かる。
【0111】
総合的に本発明で提示している合成がん生存遺伝子対の分析は、従来に知られた体細胞突然変異の分析と差別化される概念である。つまり、体細胞突然変異の負担が同一であれば、合成がん生存負担が大きいほど当該のがん患者の予後が良く、合成がん生存の負担が同一であれば、体細胞突然変異の負担が少ないほど当該がん患者の予後が良いと予測することが可能である。このような現象を関数化することで、がん患者の予後を予測するためにがんゲノム分析を通じて獲得可能な合成がん生存の負担と体細胞突然変異の負担情報を提供することができる。
【0112】
さらに、前記実施例1で開示したように、がん患者のカスタマイズ型の薬物選択方法を適用して選択した薬物を患者に処置した場合、当該薬物に対する治療反応も当該薬物が遮断する遺伝子により増加する合成がん生存遺伝子対の個数分析を通じて予測可能なことが分かる。つまり、当該処置薬物が当該患者の合成がん生存遺伝子対の個数を増やす程度によって当該治療反応を予測することができ、逆に、当該治療反応の向上が大きい薬物でカスタマイズの治療薬物を選択することができる。
【0113】
実施例5.がん腫別合成がん生存の負担と体細胞突然変異の負担を利用したがん細胞の転移能力の予測
がん患者は、がんで死亡するよりがんの転移で死亡する。がん組織自体は除去するか放射線治療などの局所治療法で統制できるが、転移がんの処置は非常に難しく、転移したがん細胞が多様な危害を誘発するからである。即ち、本発明の結果物である合成がん生存遺伝子対が多くなるほどがんの予後が良くなることは、合成がん生存遺伝子対が当該がん細胞の転移能力を低下させることと関連があると推定することができる。現在、がん細胞の転移能力を同定する方法の一つとして、細胞浸潤検査(cell invasion assay)がある。一例として、コーニング社で提供するMatrigel invasion assay方法は、Engelbreth−Holm−Swarm(EHS)マウス肉腫細胞が分泌するゼラチン形態のタンパク質混合物であり、がん細胞がこのMatrigelをどれだけ入り込む能力を持っているかを定量的に評価することができる実験方法を提供する。
【0114】
本発明の結果で得られた合成がん生存遺伝子対のがん転移に及ぼす影響を分析するために、肺がん細胞株5個(A、B、C、D、E)でWhole exome sequencing(WXS)とMatrigel invasion assayを進行した。実験は、二回行い検証し、最初の実験のMatrigelの最終濃度は300ug/ml、培養時間は24時間、使用細胞数はウェル当たり約75000個で行い、二回目の実験のMatrigelの最終濃度は300ug/ml、培養時間は42時間、使用細胞数はウェル当たり約75000個を実験条件として使用して、二回繰り返し実験した。実験は、計3回行われた。WXSは、illnumina HiSeq 2000 Systemを使用し、Hg19バージョンのHuman Reference Genomeを使用した。
【0115】
図9は、前記5個の細胞株の体細胞突然変異の負担と合成がん生存の負担の分布を例示する。図9は、実施例4で説明したように、合成がん生存遺伝子対の個数が体細胞突然変異の個数と正比例して増加することを示す。図10は、Matrigel invasion assayの結果である各細胞株別Matrigel浸潤能力(invasiveness)または転移能力をバーグラフで示す。つまり、フィールド当たり浸潤した細胞数が多いほど当該がん細胞株の浸潤能力あるいは転移能力が大きく、これは、がん転移能力が大きいことを意味する。従って、C、B、D、E、A細胞株順でがん転移能力が高いと判断することができる。
【0116】
図9に示した体細胞突然変異の負担と合成がん生存の負担の分布を活用すれば、体細胞突然変異の負担が400個を少し超えるDとAの比較で、合成がん生存の負担がより大きいAのがん転移能力がより低いと予測され、これは、図10の棒グラフで予測通り確認される。また、体細胞突然変異の負担が460個前後のBとEの比較で、合成がん生存の負担がより大きいEのがん転移能力がより低いと予測され、これは、図10の棒グラフで予測通り確認される。また、合成がん生存負担37個のBとAの比較で、体細胞突然変異の負担がより大きいBのがん転移能力がより高いと予測され、これは、図10の棒グラフで予測通り確認される。そのため、本発明の結果物である合成がん生存遺伝子対の分析を通じて、がん細胞の転移能力が評価可能なことが確認できた。本実施例では、がん細胞又は組織の浸潤能力、あるいは転移能力の同定のために、がん細胞株のMatrigel細胞浸潤検査を行ったが、これに制限されない。例えば、がん細胞又は組織の浸潤能力、あるいは転移能力を評価するために、免疫能力が統制された実験動物にがん細胞または組織を移植して、より直接的にがん細胞又は組織の浸潤能力、あるいは転移能力を同定する方法が可能であり、このような様々ながん細胞又は組織の浸潤能力、あるいは転移能力の同定を通じて合成がん生存遺伝子対を発見し、合成がん生存現象を活用したカスタマイズ型の薬物選択方法は、本発明の範囲に属する。
【0117】
実施例6.生物学的マーカーを活用してがんの細部群の分類による合成がん生存遺伝子対分析の有用性
本実施例は、分析対象がん腫を特定の生物学的マーカーを活用して細部群に分けた後、合成がん生存遺伝子対を検出し、カスタマイズ型の薬物選択及び予後を予測する方法を例示する。即ち、本実施例は、前記実施例1〜4で例示されたがん腫別合成がん生存分析において、従来の臨床的、病理学的がん分類体系だけでなく、主要診断、治療及び予後関連の生物学的マーカーに伴う細部群に分けて、さらに精密な合成がん生存分析を行うことが可能であり、このような生物学的マーカーを活用した細部群別合成がん生存分析が本発明の範囲に属することを例示する。
【0118】
一例として、MSI(Microsatellite instability)は、大腸がんの診断、治療及び予後に非常に重要な生物学的マーカーとして知られている。本実施例は、大腸がんでMSIの状態によって患者群を分けて合成がん生存分析を行うことが、上述した実施例1〜実施例4に該当する合成がん生存分析の結果を導出することができるだけでなく、さらに有用で安定した精密分析結果が得られることを例示する。
【0119】
大腸がん(COAD)データは、米国NCI GDC(National Cancer Institute Genomic Data Commons)データポータルから2016年7月11日基準、TCGAデータポータルから2016年3月21日基準としてダウンロードした。前記データのうちNCI GDCデータは、433人の体細胞突然変異(somatic mutation)データを含み、TCGAデータは、458人のMSI(Microsatellite instability)データと459人の臨床データとを含んでいる。前記体細胞突然変異データは、VCF(Variant Call Format)ファイル形式であり、人間標準ゲノムGRCh38標準で整列し、MuTect2で変異を決定した。前記level2の臨床データは、様々な臨床変因を含んでおり、Cox proportional hazard modelに使用される変因は、病理学者が選別した。前記MSIデータは、各患者別にMSIの状態によって「MSS」、「MSI−L」、「MSI−H」に分類しており、本実施例では、MSI−LとMSI−H群をMSI陽性群、MSS群をMSI陰性群に区分して分析した。
【0120】
Cox proportional hazard modelの適用に必要な情報のない患者、他の悪性腫瘍の陽性、あるいは転移陽性、放射線治療、薬物、ablation adjuvantの治療患者のデータを除いた。そして、体細胞突然変異データとMSIデータのない患者を除いた。VAT(Variant Annotation Tool)で変異の注釈を付けてsynonymous変異を除いた後、HGNC symbolのない遺伝子のデータを除いた。最後に、臨床情報とMSIデータのない患者のデータを除いた。最終的に、427人の大腸がん患者が分析に使用された。
【0121】
先ず、全体427人の大腸がん患者を対象として実施例1〜2に例示された方法で合成がん生存遺伝子対を探そうとしたが、一つの有意な合成がん生存遺伝子対も見つけられなかった。大腸がんの場合、MSIの状態によって体細胞突然変異の数及び予後が異なるので、MSI陽性群151人と陰性群276人に区分した。MSIの状態によって大腸がん患者を二群に分けて、MSI陽性群(MSI−L&MSI−H)で14個の有意な合成がん生存遺伝子対を検出した(p<0.05、HR>1)。しかし、体細胞突然変異の負担が低いMSI陰性群では、有意な合成がん生存遺伝子対が一つも発見されなかった。MSI陽性群で検出した大腸がんの合成がん生存遺伝子対を表3に示した。
【0122】
【表3】
【0123】
表3に示すように、14個の合成がん生存遺伝子対は、17個の遺伝子で構成され、細胞のmotor activityやnucleoside/nucleotide bindingと関連した。特に、MSI群でOBSCN遺伝子とPIK3CA遺伝子が互いに合成がん生存遺伝子対をなすことを確認した。つまり、OBSCNとPIK3CA対において、OBSCNのみが遺伝子損傷点数が低いか、IK3CAのみが遺伝子損傷点数が低い外損傷群の二群は、二つの遺伝子とも遺伝子損傷点数は低くない非損傷群と比較した時、がん生存率で有意な差異を示さなかったが、OBSCNとPIK3CAの遺伝子損傷点数が低い対損傷群は、残りの三群全てに比べて統計学的に有意にがん患者の生存率が高い(p<0.05、HR>1.0)ことを確認することができた。従って、大腸がんで体細胞突然変異を示すOBSCN遺伝子とPIK3CA遺伝子対は、上記で定義した大腸がんの合成がん生存遺伝子対の判断基準に符合することを確認した。
【0124】
次に、実施例3と同様に、合成がん生存遺伝子対の個数ががん患者の予後と生存率に及ぼす影響を分析した。その結果を表4に示した。
【0125】
【表4】
【0126】
表4に示すように、427人の大腸がん患者を合成がん生存遺伝子対を一つも持たない345人、1つ以上持った82人の二群に分けて、Cox proportional hazard modelを適用した生存分析を行った結果、合成がん生存遺伝子対を持った82人の生存率が統計学的に有意に高いことを確認することができた(p<0.0005、HR>1.0)。これを通じて、がん患者の合成がん生存遺伝子対の個数で表現される合成がん生存の負担の確認を通じて、当該がん患者の生存予後が予測可能なことが分かった。
【0127】
上述したように、同一のデータでMSIの状態を区分せず全体の大腸がん患者を対象として行った分析で合成がん生存遺伝子対が一つも発見されなかったことと比較して、以上の結果は非常に重要な医学的意味を有する。一般的に、全体の大腸がん患者を使用した場合のように、より多くの患者を対象として統計分析を行う場合、有意な結果が検出される確率が高いと知られている。
【0128】
しかし、本実施例は、生物学的マーカーを基準として区分したさらに同質的な群で合成がん生存分析を行うことがより精密な結果が提供可能なことを例示する。例えば、乳がんは、ER(Estrogen Receptor)、PR(Progesteron Receptor)などのホルモン受容体発現有無によって、診断、治療、予後に重大な影響を及ぼすため、臨床的な細部群を分けて判断する。従って、本実施例は、最新の生物学的マーカーによって同じがん腫も多様な細部群に分けて合成がん生存分析を行うことが有用かつ効果的なことを例示し、このような方法が本発明の範囲に属することを例示する。
図1
図2
図3
図4
図5
図6
図7
図8
図9
図10