(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公開特許公報(A)
(11)【公開番号】P2023023327
(43)【公開日】2023-02-16
(54)【発明の名称】腫瘍のサブタイプ決定方法及びその応用、並びにサブタイプ決定のための方法
(51)【国際特許分類】
C12Q 1/68 20180101AFI20230209BHJP
G16B 25/00 20190101ALI20230209BHJP
【FI】
C12Q1/68
G16B25/00
【審査請求】未請求
【請求項の数】12
【出願形態】OL
(21)【出願番号】P 2021128753
(22)【出願日】2021-08-05
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
1.MATLAB
2.SimBiology
【国等の委託研究の成果に係る記載事項】(出願人による申告)令和元年度、国立研究開発法人科学技術振興機構、未来社会創造事業「創薬を加速する細胞モデリング基盤の構築」委託研究、産業技術力強化法第17条の適用を受ける特許出願
(71)【出願人】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(74)【代理人】
【識別番号】110000729
【氏名又は名称】弁理士法人ユニアス国際特許事務所
(72)【発明者】
【氏名】岡田 眞里子
(72)【発明者】
【氏名】井元 宏明
(72)【発明者】
【氏名】山城 紗和
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA13
4B063QA19
(57)【要約】
【課題】本発明は、腫瘍、特に臨床的特徴にErbB受容体シグナル伝達系が関与する腫瘍について、新規のバイオマーカーを用いて、腫瘍の特徴に応じた新たなサブタイプ分類のいずれに帰属するかを決定する方法を提供することを目的とする。
【解決手段】患者の腫瘍のEGFR遺伝子の発現量のデータ並びにERBB2、ERBB3及びERBB4からなる群より選ばれる少なくとも1種の遺伝子の発現量を含むデータを取得する工程、並びに、EGFR遺伝子の発現量と、ERBB2、ERBB3及びERBB4からなる群より選ばれる1種の遺伝子の発現量又は2種以上の遺伝子の発現量の総和との比率に基づいて、前記腫瘍を2種以上のサブタイプのいずれかに分類する工程を含む、腫瘍のサブタイプ決定方法。
【選択図】
図8
【特許請求の範囲】
【請求項1】
対象の腫瘍のEGFR遺伝子の発現量のデータ並びにERBB2、ERBB3及びERBB4からなる群より選ばれる少なくとも1種の遺伝子の発現量を含むデータを取得する工程、並びに、
EGFR遺伝子の発現量と、ERBB2、ERBB3及びERBB4からなる群より選ばれる1種の遺伝子の発現量又は2種以上の遺伝子の発現量の総和との比率に基づいて、前記腫瘍を2種以上のサブタイプのいずれかに分類する工程
を含む、腫瘍のサブタイプ決定方法。
【請求項2】
前記腫瘍が、乳癌のうち、ER-/ERBB2-/PGR-であるサブタイプに属するものである、請求項1に記載の決定方法。
【請求項3】
前記分類が、前記腫瘍のEGFR遺伝子の発現量と、ERBB2、ERBB3及びERBB4の各遺伝子の発現量の総和との比率に基づいて行われる、請求項1又は2に記載の決定方法。
【請求項4】
請求項1~3のいずれか一項に記載の方法で決定されたサブタイプに予め関連付けられた特徴から、前記腫瘍の特徴を予測する工程
を含む、腫瘍の特徴の予測方法。
【請求項5】
前記特徴が、前記腫瘍を有する患者の予後又は薬剤の感受性である、請求項4に記載の方法。
【請求項6】
前記薬剤の感受性が、ErbB受容体標的薬に対する感受性である、請求項5に記載の方法。
【請求項7】
請求項1~3のいずれか一項に記載の方法で決定されたサブタイプに基づいて、前記対象の治療方法を決定するための情報を得る工程
を含む、対象の治療方法を決定するための方法。
【請求項8】
請求項1~3のいずれか一項に記載の方法で決定されたサブタイプに基づいて、1種以上の腫瘍を選択する工程、及び、
選択された前記腫瘍を、候補となる薬剤又は外的因子に曝露して得られる応答に基づいて、薬剤又は外的因子を選択する工程
を含む、薬剤又は外的因子のスクリーニング方法。
【請求項9】
対象の腫瘍について、EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合のErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性の経時変化データを取得する工程、
前記経時変化データに基づいて、前記腫瘍を2種以上のサブタイプのいずれかに分類する工程、
各々の前記サブタイプに帰属される腫瘍の特徴を抽出する工程、及び、
抽出された前記腫瘍の特徴が、前記サブタイプに特徴的なものかを検証する工程、
を含む、腫瘍のサブタイプの決定のための方法。
【請求項10】
前記分類が、前記シグナル活性の経時変化データにおける、シグナル活性の最大値(Max)、曲線下面積(AUC)、シグナル活性の降下率(Droprate)及びシグナル活性の最大値を与える時間(Argmax)からなる群より選ばれる1種以上のパラメータを用いて行われる、請求項9に記載の方法。
【請求項11】
EGFR、ERBB2、ERBB3、及びERBB4からなる群より選ばれる1種以上のErbB受容体ファミリー遺伝子の発現量を含む腫瘍のデータを取得する工程、
前記腫瘍について、ErbB受容体シグナル伝達経路を含む細胞シグナル伝達系の数理モデルを構築する工程、及び
前記数理モデルに前記腫瘍のデータを入力し、シミュレーションによって前記経時変化データを取得する工程、
をさらに含む、請求項9又は10に記載の方法。
【請求項12】
前記数理モデルが、
腫瘍から得られた前記ErbB受容体ファミリー遺伝子の発現量データと、EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合のErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性の経時変化データとを含むデータセット
を用いた機械学習を経て得られる、請求項11に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、腫瘍のサブタイプ決定方法、該方法を用いた腫瘍の特徴の予測方法、対象の治療方法の決定方法、及び薬剤又は外的因子のスクリーニング方法に関する。また、本発明は、腫瘍のサブタイプ決定のための方法に関する。
【背景技術】
【0002】
癌などの腫瘍において、遺伝子マーカーによる分類は、腫瘍の遺伝的背景に応じた適切な治療方法の選択や、薬剤の治験対象となる腫瘍を有する対象を選択することにより、治療又は治験の成功率を高めるうえで重要な情報となっている。
【0003】
例えば、乳癌においては、病変部の大きさやリンパ節への転移などのほかに、エストロゲン受容体遺伝子(ER)、ErbB2受容体遺伝子(ERBB2、HER2)、及びプロゲストロン受容体遺伝子(PGR)の発現の有無(本明細書中、マーカー遺伝子の発現有り、発現無しを、それぞれ各遺伝子のシンボルに続けて「+」、「-」を付して表す)に基づく4つのサブタイプ分類(ER+/HER2-、ER+/HER2+、ER-/HER2+、ER-/HER2-/PGR-)が、第1段階の治療を決める基準となっている。ER+/HER2-、ER+/HER2+、ER-/HER2+それぞれのサブタイプに対しては、エストロゲン受容体の拮抗剤や生成阻害剤、ERBB2に対する抗体医薬や阻害剤などの分子標的薬が選択される。一方、トリプルネガティブ乳癌(TNBC)とも呼ばれるER-/ERBB2-/PGR-のサブタイプに対しては、分子標的薬が存在せず、極めて予後が悪いことが知られる。TNBCに対して、さまざまな分子標的薬の臨床試験が試みられているが、いまだに効果的な治療薬は見いだされていない。この原因の一つとして、臨床試験のための患者の層別化が適切ではないことが挙げられる(例えば、非特許文献1参照)。
【0004】
そのため、これまで、患者の遺伝子の変異や増幅などのDNA情報に基づいた患者分類の試みがなされ、TNBCグループ内におけるサブタイプの遺伝子マーカーが同定されてきたが(例えば、非特許文献2参照)、現在まで治療に繋げられる成果は得られていない。また、TNBCの患者には、上皮成長因子受容体(EGFR)の高発現が顕著に見られることから、EGFRを対象とした阻害剤の臨床試験が数多く行われてきた。しかし、これらの阻害剤は一部の患者に対しては奏効性があるものの、全体としての奏効性は低い。そこで、薬剤の奏功する患者群をEGFR高発現患者群から選択するためのより詳細な分類が必要とされている(非特許文献1)。
【0005】
これまでに、EGFRに加えて他の遺伝子の情報を利用してサブタイプ分類を行った例として、非特許文献3には、ERBB3(HER3)遺伝子とEGFR遺伝子の発現量の和をバイオマーカーとして用いた場合、EGFR又はERBB2遺伝子単独を指標として使用した場合とは異なり、TNBCの補助的化学療法後の予後(乳癌特異的生存期間及び無遠隔転移生存期間)の異なるサブタイプに分類できることが開示されている。
【先行技術文献】
【非特許文献】
【0006】
【非特許文献1】Ali R. and Wendt M.K. Signal Transduction and Targeted Therapy, 2017, Vol.2, Article No.16042
【非特許文献2】Burstein M.D. et al. Clinical Cancer Research, 2015, Vol.21, No.7, pp.1688-1698
【非特許文献3】Ogden A. et al. Scientific Reports, 2020, Vol.10, Article No. 3009
【発明の概要】
【発明が解決しようとする課題】
【0007】
しかし、非特許文献3のバイオマーカーは、TNBCを補助的化学療法に対する応答性の違いに応じて分類できることが記載されているが、補助的化学療法では用いられない薬剤、例えば、ErbB受容体ファミリーを標的とする薬剤に対する応答性の異なるサブタイプを分類できるか否かは明らかではない。また、他の乳癌のサブタイプや、乳癌以外の他の腫瘍の分類に適用可能か否かも不明である。
【0008】
本発明は、腫瘍、特に臨床的特徴にErbB受容体シグナル伝達系が関与する腫瘍について、新規のバイオマーカーを用いて、腫瘍の特徴に応じた新たなサブタイプ分類のいずれに帰属するかを決定する方法を提供することを目的とする。
【0009】
加えて、本発明は、腫瘍を、その特徴に応じて2種以上のサブタイプに精度よく分類するための方法を提供することを目的とする。
【課題を解決するための手段】
【0010】
上記課題は、以下の態様を含む本発明により解決することができる。
【0011】
[1]
対象の腫瘍のEGFR遺伝子の発現量のデータ並びにERBB2、ERBB3及びERBB4からなる群より選ばれる少なくとも1種の遺伝子の発現量を含むデータを取得する工程、並びに、
EGFR遺伝子の発現量と、ERBB2、ERBB3及びERBB4からなる群より選ばれる1種の遺伝子の発現量又は2種以上の遺伝子の発現量の総和との比率に基づいて、前記腫瘍を2種以上のサブタイプのいずれかに分類する工程
を含む、腫瘍のサブタイプ決定方法。
【0012】
[2]
前記腫瘍が、乳癌のうち、ER-/ERBB2-/PGR-であるサブタイプに属するものである、[1]に記載の決定方法。
【0013】
これらの態様によると、腫瘍から得られるEGFR遺伝子の発現量と、ERBB2、ERBB3及びERBB4からなる群より選ばれる1種の遺伝子の発現量又は2種以上の遺伝子の発現量の総和との比率に基づいて、腫瘍の特徴に応じて分類された新たなサブタイプのいずれに帰属されるかを簡便に決定することができる。得られたサブタイプの情報から、腫瘍の特徴を高い精度で予測することができる。
【0014】
[3]
前記分類が、前記腫瘍のEGFR遺伝子の発現量と、ERBB2、ERBB3及びERBB4の各遺伝子の発現量の総和との比率に基づいて行われる、[1]又は[2]に記載の決定方法。
【0015】
この態様によると、腫瘍の特徴に応じて分類された新たなサブタイプに特に精度よく帰属させることができるので、得られるサブタイプの情報から、腫瘍の特徴をより高い精度で予測することができる。
【0016】
[4]
[1]~[3]のいずれか1に記載の方法で決定されたサブタイプに予め関連付けられた特徴から、前記腫瘍の特徴を予測する工程
を含む、腫瘍の特徴の予測方法。
[5]
前記特徴が、前記腫瘍を有する患者の予後又は薬剤の感受性である、[4]に記載の方法。
[6]
前記薬剤の感受性が、ErbB受容体標的薬に対する感受性である、[5]に記載の方法。
【0017】
これらの態様によると、上記の方法で得られたサブタイプに基づいて、サブタイプに予め関連付けられた腫瘍の特徴から、腫瘍の特徴を精度よく予測することができる。
【0018】
[7]
[1]~[3]のいずれか1に記載の方法で決定されたサブタイプに基づいて、前記対象の治療方法を決定するための情報を得る工程
を含む、対象の治療方法を決定するための方法。
【0019】
この態様によると、対象の腫瘍について、上記の方法で得られたサブタイプから予測される腫瘍の特徴に合わせた治療方法を適切に選択することができる。
【0020】
[8]
[1]~[3]のいずれか1に記載の方法で決定されたサブタイプに基づいて、1種以上の腫瘍を選択する工程、及び、
選択された前記腫瘍を、候補となる薬剤又は外的因子に曝露して得られる応答に基づいて、薬剤又は外的因子を選択する工程
を含む、薬剤又は外的因子のスクリーニング方法。
【0021】
この態様によると、上記方法で得られた新たなサブタイプのうちから特定のサブタイプを選択することにより、腫瘍の特徴が従来に比べてより揃った被験群を設定することができる。その結果、候補薬剤のスクリーニング成功率を高めることができる。
【0022】
[9]
対象の腫瘍について、EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合のErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性の経時変化データを取得する工程、
前記経時変化データに基づいて、前記腫瘍を2種以上のサブタイプのいずれかに分類する工程、
各々の前記サブタイプに帰属される腫瘍の特徴を抽出する工程、及び、
抽出された前記腫瘍の特徴が、前記サブタイプに特徴的なものかを検証する工程、
を含む、腫瘍のサブタイプの決定のための方法。
【0023】
この態様によると、細胞の状態により鋭敏に反応するErbB受容体シグナル伝達系の下流因子の経時変化データを使用することによって、静的な遺伝子発現量データを用いた場合に比べて、腫瘍をErbB受容体シグナル伝達系の違いに基づいたサブタイプに精度よく分類することができる。そして、ErbB受容体シグナル伝達系が腫瘍の表現型に密接に関連することから、得られたサブタイプは、腫瘍の特徴に応じて分類されたものとなる。
【0024】
[10]
前記分類が、前記シグナル活性の経時変化データにおける、シグナル活性の最大値(Max)、曲線下面積(AUC)、シグナル活性の降下率(Droprate)及びシグナル活性の最大値を与える時間(Argmax)からなる群より選ばれる1種以上のパラメータを用いて行われる、[9]に記載の方法。
【0025】
この態様によると、シグナル活性の経時変化を適切に記述するパラメータを使用して分類を行うため、少ない計算量で精度よくサブタイプに分類することができる。
【0026】
[11]
EGFR、ERBB2、ERBB3、及びERBB4からなる群より選ばれる1種以上のErbB受容体ファミリー遺伝子の発現量を含む腫瘍のデータを取得する工程、
前記腫瘍について、ErbB受容体シグナル伝達経路を含む細胞シグナル伝達系の数理モデルを構築する工程、及び
前記数理モデルに前記腫瘍のデータを入力し、シミュレーションによって前記経時変化データを取得する工程、
をさらに含む、[9]又は[10]に記載の方法。
【0027】
ErbB受容体ファミリー遺伝子の発現量を含むデータは、下流因子の経時変化データに比べてin vitroの試験や公知のデータベースから比較的入手が容易である。そして、この態様によると、これらの入手可能なデータを利用して、in silicoシミュレーションによって腫瘍のサブタイプの分類に必要な経時変化データを容易に取得することができる。
【0028】
[12]
前記数理モデルが、
腫瘍から得られた前記ErbB受容体ファミリー遺伝子の発現量データと、EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合のErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性の経時変化データとを含むデータセット
を用いた機械学習を経て得られる、[11]に記載の方法。
【0029】
この態様によると、実際の腫瘍におけるErbB受容体ファミリー遺伝子の発現量とその場合に得られる下流因子のシグナル活性のデータを用いた機械学習によって、遺伝子発現量から腫瘍細胞中のシグナル伝達経路の経時変化をより精度良くシミュレートする数理モデルが得られる。これにより、遺伝子発現量を利用したサブタイプの分類の精度をさらに向上させることができる。
【発明の効果】
【0030】
本発明のサブタイプ決定方法によると、腫瘍、特に臨床的特徴にErbB受容体シグナル伝達系が関与する腫瘍について、生理活性指標を用いて、腫瘍の特徴に応じた新たなサブタイプ分類のいずれに帰属するかを決定することができる。そして、帰属されたサブタイプの腫瘍の特徴に基づいて、腫瘍を有する患者の予後、薬剤感受性の予測や腫瘍を有する対象の治療方法の選択を精度よく行うことができる。
【0031】
本発明のサブタイプの決定のための方法によると、腫瘍を、その特徴に応じて2種以上のサブタイプに精度よく分類することができる。
【図面の簡単な説明】
【0032】
【
図1】シグナル活性の経時変化データから抽出されるパラメータの一例を表す模式図である。
【
図3】試験例1で使用した数理モデルの構築手順を示す模式図である。
【
図4】試験例1のシグナル活性の経時変化に基づくクラスター分析の結果と、各腫瘍の予後(Prognosis)及び乳癌の既存サブタイプ(Subtype)の関係を示す図である。クラスター1及び2がTNBCに対応する。以降の図に共通して、予後のスコアは、サンプル採取後の生存年数(端数は切り上げ)を表し、生存はスコア20で表される。またサブタイプは、LumAはLuminal A-like、LumBはLuminal B-like、Her2はHer2過剰発現、BasalはTNBC(Basal-like)、NormalはNormal breast-likeを表す。
【
図5】試験例1で得られたクラスター1(TNBC予後不良群)及びクラスター2(予後良好群)の患者の生存率曲線(左)、クラスター1~6の患者の生存率曲線(右)である。
【
図6】試験例1で用いたデータセットのうち、PAM50の遺伝子発現量データを用いてクラスター分析を行った結果と、各腫瘍の予後(Prognosis)及び既存サブタイプ(Subtype)の関係を示す図である。クラスター4及び5がTNBCに対応する。
【
図7】PAM50の遺伝子発現量データを用いたクラスター分析で得られたクラスター1~6の患者の生存率曲線(左)、並びに、クラスター4及びクラスター5の患者の生存率曲線(右)である。
【
図8】試験例2において、横軸にExp(ERBB2)+Exp(ERBB3)+Exp(ERBB4)、縦軸にExp(EGFR)をとった時の試験例1のクラスター1及び2の腫瘍の散布図(左)と、2つのクラスターの[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の箱ひげ図(右)である。
【
図9】試験例3で使用した乳癌培養細胞株のうち、クラスター1及び2に分類される細胞株について種々の濃度のEGFR阻害剤又はMEK阻害剤に対する相対生存率(%)の関係を示すグラフである。
【
図10A】試験例4で、横軸にExp(ERBB2)+Exp(ERBB3)+Exp(ERBB4)、縦軸にExp(EGFR)をとった時のCCLEの全ての癌培養細胞株の散布図である。点線は、EGFRの発現量が平均値を表す。high、low、middleは、[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の値が高値、低値、中間値の群を表す。
【
図10B】上記高値群及び低値群について、種々の濃度のEGFR阻害剤に対する相対生存率(%)の関係を表すグラフと、そのactivity areaについて2群を比較した箱ひげ図である。p値はt検定による。
【
図11A】試験例5の肺腺癌におけるクラスター分析の結果(左)と、クラスター1、2の腫瘍の生存率曲線(右)である。
【
図11B】上記肺腺癌のクラスター1及び2の腫瘍について、横軸にExp(ERBB2)+Exp(ERBB3)+Exp(ERBB4)、縦軸にExp(EGFR)をとった時の散布図(左)と、2つのクラスターの[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の箱ひげ図(右)である。
【
図12A】試験例5の子宮頸癌におけるクラスター分析の結果(左)と、クラスター1、2の腫瘍の生存率曲線(右)である。
【
図12B】上記子宮頸癌のクラスター1及び2の腫瘍について、横軸にExp(ERBB2)+Exp(ERBB3)+Exp(ERBB4)、縦軸にExp(EGFR)をとった時の分布(左)と、2つのクラスターの[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の箱ひげ図(右)である。
【
図13A】試験例6で、結腸腺癌について、パラメータとしてdroprate及びargmaxを用いて得られたクラスター分析の結果(左)と、各クラスターの患者の生存率曲線(右)である。
【
図13B】試験例6で、結腸腺癌について、パラメータとしてdroprate及びargmaxを用いて得られたクラスター分析の結果(左)と、各クラスターの患者の生存率曲線(右)である。
【
図13C】試験例6で、結腸腺癌について、パラメータとしてMaxを用いて得られたクラスター分析の結果(左)と、各クラスターの患者の生存率曲線(右)である。
【
図14】試験例6で、胃癌について、パラメータとしてMaxを用いて得られたクラスター分析の結果(左)と、各クラスターの患者の生存率曲線(右)である。
【
図15】試験例6で、食道癌について、パラメータとしてMaxを用いて得られたクラスター分析の結果(左)と、各クラスターの患者の生存率曲線(右)である。
【
図16A】試験例6で、肝細胞癌について、パラメータとしてMaxを用いて得られたクラスター分析の結果(左)と、各クラスターの患者の生存率曲線(右)である。
【
図16B】試験例6で、肝細胞癌について、パラメータとしてargmaxを用いて得られたクラスター分析の結果(左)と、各クラスターの患者の生存率曲線(右)である。
【発明を実施するための形態】
【0033】
[用語の定義]
本明細書における用語の定義は次の通りである。
【0034】
本明細書の遺伝子名の略号は、特にことわりの無い限り、NCBIのGeneデータベース(https://www.ncbi.nlm.nih.gov/gene)で用いられる遺伝子シンボル(ヒトゲノム命名法委員会(HGNC)の公式シンボル)で表す。但し、ERBB2は、マーカータイプにおいては、慣用的によく使用される「HER2」で表すことがある。
【0035】
本明細書において、「ErbB受容体」又は「ErbB受容体ファミリー」は、EGFR、ERBB2、ERBB3及びERBB4にコードされる受容体の総称を表す。また、「ErbB受容体シグナル伝達経路」は、ErbB受容体に属する上記4受容体及びそれら受容体へのリガンドの結合に依存して活性化又は抑制される一連の下流因子(例えば、タンパク質、セカンドメッセンジャー)からなる反応経路を表す。
【0036】
本明細書において「対象」とは、生体試料の採取、検査、投薬、治療等の処置を受ける生体(ヒト、ヒト以外の哺乳動物を含む)を指す。本明細書において、「患者」は「対象」と同義に解釈される。
【0037】
本明細書において、「数理モデル」とは、時間変化する現象の計測可能な指標の動きを模倣する、微分方程式などの数学的記述を指す。
【0038】
本明細書において「腫瘍」は、腫瘍組織のほか、個々の腫瘍細胞を含む。「腫瘍細胞」は、対象の腫瘍組織中の細胞、腫瘍組織から分離された細胞及びその培養物、並びに、突然変異、形質転換等によって自然に又は人為的に癌化した癌細胞等を含む。
【0039】
[腫瘍のサブタイプ決定方法]
本発明の腫瘍のサブタイプ決定方法は、
対象の腫瘍のEGFR遺伝子の発現量のデータ並びにERBB2、ERBB3及びERBB4からなる群より選ばれる少なくとも1種の遺伝子の発現量を含むデータを取得する工程、並びに、
EGFR遺伝子の発現量と、ERBB2、ERBB3及びERBB4からなる群より選ばれる1種の遺伝子の発現量又は2種以上の遺伝子の発現量の総和との比率に基づいて、前記腫瘍を2種以上のサブタイプのいずれかに分類する工程
を含む。
【0040】
腫瘍としては、癌などの悪性腫瘍、良性腫瘍のいずれも含み得るが、悪性腫瘍が好ましい。悪性腫瘍としては、例えば、乳癌、子宮頸癌、肺癌(小細胞肺癌、非小細胞肺癌、肺腺癌、及び肺の扁平上皮癌等)、胃癌(gastric or stomach cancer)(胃腸癌を含む)、食道癌、結腸/直腸癌(結腸/直腸腺癌等)、肝細胞癌、腹膜の癌、膵臓癌、神経膠芽腫、卵巣癌、肝臓癌、膀胱癌、結腸癌、子宮内膜癌、子宮癌、唾液腺癌、腎臓癌(kidney or renal cancer)、前立腺癌、外陰部癌、甲状腺癌、悪性黒色腫(メラノーマ)、扁平上皮癌、基底細胞癌、眼瞼腫瘍(脂腺癌や基底細胞癌を含む)、結膜腫瘍、眼窩腫瘍(涙腺腫瘍を含む)、眼内腫瘍(網膜芽細胞腫や脈絡膜悪性黒色腫を含む)、悪性リンパ腫、眼又は種々のタイプの頭頚部癌(口腔癌、咽頭癌、上咽頭癌、中咽頭癌、下咽頭癌、喉頭癌、鼻・副鼻腔癌、唾液腺癌、甲状腺癌等を含む)などが挙げられる。中でも腫瘍としては、乳癌、子宮頸癌、肺癌、胃癌、食道癌、結腸/直腸癌又は肝細胞癌が好ましく、乳癌、肺腺癌又は子宮頸癌がより好ましい。
【0041】
既存の腫瘍のサブタイプもまた腫瘍に含まれる。例えば、乳癌のサブタイプとしては、例えば、Nature, 2000, Vol.406, pp.747-452、Proc.Natl.Acad.Sci., 2001, Vol.98, No.12, pp.10869-10874に示される、ER、ERBB2(HER2)及びPGRの発現の有無によるIntrinsic subtype分類が挙げられる。Intrinsic subtype分類では、4つのサブタイプ:ER+/HER2-(Luminal-B like)、ER+/HER2+(Luminal A-like)、ER-/HER2+(HER2過剰発現)、ER-/HER2-/PGR-(Basal-like)に分類される。このうち、Basal-likeは、3つのマーカーがいずれも陰性であることから、トリプルネガティブ乳癌(TNBC)とも呼ばれる。一実施態様では、腫瘍として、TNBCを選択することができる。
【0042】
本方法によって決定される腫瘍のサブタイプとしては、2種以上のサブタイプのうちの一部又は全てが既存の分類法に従って得られるサブタイプと同じ特徴を有するものであってもよいし、全てが既存の分類法に従って得られるサブタイプと異なる特徴を有するものであってもよい。
【0043】
本方法で決定される腫瘍のサブタイプの種類は、2種以上であり、例えば3種以上又は4種以上であり、そして、10種以下、9種以下、8種以下、7種以下又は6種以下であり得る。本方法で決定される腫瘍のサブタイプの種類は、例えば、2種、3種、4種、5種、6種、7種又は8種であり得る。
【0044】
対象は、哺乳動物であれば特に限定されず、例えば、ヒト、非ヒト哺乳動物(ヒト以外の霊長目動物、マウス、ラット、モルモット、ウサギ、イヌ、ネコ、ウシ、ウマ、ヒツジ、ヤギ等)が挙げられる。一実施態様では、対象はヒトである。
【0045】
(データ取得工程)
本工程では、下記のサブタイプ分類工程で用いられる比率の算出に使用される、遺伝子の発現量を少なくとも含む腫瘍のデータを取得する。
【0046】
腫瘍の遺伝子の発現量のデータは、個々の遺伝子について、例えば、mRNA若しくはタンパク質の発現量、又はそれらの組み合わせを使用して取得することができるが、実験的に得ることが比較的容易なmRNAの発現量を用いることが好ましい。そのようなmRNAの発現量のデータは、細胞から常法によってmRNAを抽出し、適宜精製、逆転写、PCR増幅等を経たうえで、例えば、RNA-Seq法、DNAマイクロアレイ法、逆転写産物の定量PCRなどの手法を用いて得ることができる。タンパク質の発現量のデータは、電気泳動法、質量分析法、免疫化学的手法(ウェスタンブロット、ELISA、FISH等)、プロテインチップなどの手法を用いて得ることができる
【0047】
また、遺伝子発現量のデータとして、実験的又はシミュレーション等の予測に基づく公知の遺伝子発現量データセットから抽出、取得してもよい。そのようなデータセットとしては、例えば、The Cancer Genome Atlas(TCGA)(https://portal.gdc.cancer.gov/)、International Cancer Genome Consortium(ICGC)(https://dcc.icgc.org/)、the Calalogue of Somatic Mutations in Cancer(COSMIC)(https://cancer.sanger.ac.uk/cosmic)、NCBI GEO(https://www.ncbi.nlm.nih.gov/geo/)、Broad Institute Cancer Cell Line Encyclopedia(CCLE)(https://portals.broadinstitute.org/ccle)などが利用可能である。
【0048】
(サブタイプ分類工程)
本発明のサブタイプ決定方法では、EGFR遺伝子の発現量(Exp(EGFR)と表す)と、ERBB2、ERBB3及びERBB4からなる群より選ばれる1種の遺伝子の発現量(それぞれExp(ERBB2)などと表す)又は2種以上の遺伝子の発現量の総和との比率を用いて腫瘍を分類する。そのような比率として、例えば、[Exp(EGFR)/Exp(ERBB2)]、[Exp(EGFR)/Exp(ERBB3)]、[Exp(EGFR)/Exp(ERBB4)]、[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3))]、[Exp(EGFR)/(Exp(ERBB3)+Exp(ERBB4))]、[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB4))]又は[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の値が挙げられる。
【0049】
一実施態様では、当該比率は、[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の値である。当該値によれば、試験例2で示すように、TNBCなどの乳癌又はその他の腫瘍を、その特徴に応じて、より精度よくサブタイプを決定することができる。
【0050】
腫瘍のサブタイプは、例えば、上記比率の値とサブタイプごとに予め設定された基準値(閾値)とを比較して決定することができる。当該基準値は、例えば試験例2のように、本発明のサブタイプの決定のための方法によって得られたサブタイプのうちの2つのサブタイプの分布に基づいて、両者を区別可能な上記比率の値を選択すればよい。
【0051】
本発明は、さらに、対象がヒト又は非ヒト哺乳動物である場合に、上記決定に基づいて前記腫瘍のサブタイプを診断する工程を含む、腫瘍のサブタイプの診断方法を含む。
【0052】
[腫瘍の特徴を予測する方法]
本発明は、上記サブタイプ決定方法で決定されたサブタイプに基づいて、サブタイプに予め関連付けられた腫瘍の特徴から、腫瘍の特徴を予測する工程を含む、腫瘍の特徴の予測方法、を含む。
【0053】
サブタイプと腫瘍の特徴との関連付けは、例えば、下記の[サブタイプ決定のための方法]に記載されるように、予めサブタイプ内の腫瘍の特徴から、サブタイプの特徴を抽出することにより行われる。例えば、定性的な特徴はサブタイプ内の腫瘍に共通する特徴から得られる。また、定量的な特徴は、サブタイプ内の腫瘍の平均、標準偏差等の統計量や分布等から得られる。
【0054】
腫瘍の特徴としては、例えば、ステージ、グレード、サブタイプ等の既知の腫瘍の分類;増殖性、細胞接着性、運動性、細胞死異常の程度、血管新生誘導能、腫瘍の薬剤感受性などの腫瘍(腫瘍細胞)の表現型;腫瘍の遺伝子型、翻訳後修飾;腫瘍を有する患者の予後(例えば、生存率、腫瘍の転移の可能性、腫瘍の再発可能性等);腫瘍に対する推奨又は非推奨の治療方法、などが挙げられる。
【0055】
腫瘍の特徴として、腫瘍の薬剤感受性の予測を行う場合、当該薬剤はErbB受容体標的薬であることが好ましい。そのような薬剤としては、例えば、ErbB受容体阻害薬、EGFR受容体阻害薬などが挙げられる。より具体的には、例えば、EGFR阻害剤(アファチニブ、エルロチニブ、ゲフィチニブ、セツキシマブ、パニツムマブ等)、EGFR/ERBB2阻害剤(ラパチニブ等)、ERBB2阻害剤(トラスツズマブ、ペルツズマブ等)などが挙げられる。
【0056】
[対象の治療方法を決定する方法]
本発明は、対象の腫瘍について、上記サブタイプ決定方法で決定されたサブタイプに基づいて、対象の治療方法を決定するための情報を得る工程を含む、対象の治療方法を決定するための方法、を含む。
【0057】
治療方法を決定するための情報は、サブタイプに帰属される腫瘍の特徴から得ることができる。治療方法を決定するための情報としては、例えば、薬物療法、放射線療法等のレジメン(薬剤/放射線の種類、用量、投与スケジュール、治療期間、支持療法等)、手術方法等のうち、当該腫瘍に推奨されるもの及び/又は推奨されないものを提示する情報が挙げられる。また、決定されたサブタイプに基づく標準的な治療方法が知られている場合には、上記方法で決定された腫瘍のサブタイプの情報自体もまた、治療方法を決定するための情報となり得る。
【0058】
本発明は、さらに、対象がヒト又は非ヒト哺乳動物である場合に、上記工程で得られた情報に基づいて対象を治療する工程を含む、腫瘍のサブタイプの治療方法、を含む。
【0059】
[薬剤又は外的因子のスクリーニング方法]
本発明は、上記サブタイプ決定方法で決定されたサブタイプに基づいて、1種以上の腫瘍を選択する工程、及び、
選択された前記腫瘍を、候補となる薬剤又は外的因子に曝露して得られる応答に基づいて、薬剤又は外的因子を選択する工程
を含む、薬剤又は外的因子のスクリーニング方法を含む。
【0060】
上記の1種以上の腫瘍を選択する工程では、例えば、決定されたサブタイプに関連づけられた特徴に基づいて、腫瘍を選択することができる。この場合、当該特徴を有する腫瘍に対して効果又は影響を有する薬剤又は外的因子のスクリーニングに適する。
【0061】
また、腫瘍の特徴とは無関係に、腫瘍を選択してもよい。この場合、既存のサブタイプとは異なる腫瘍の集合に対して薬剤又は外的因子のスクリーニングをすることができるので、既存のサブタイプでは奏功又は関連性が見られなかった薬剤又は外的因子の再スクリーニングに適する。
【0062】
候補となる薬剤としては、例えば、上記のErbB受容体標的薬が挙げられる。
【0063】
候補となる外的因子としては、例えば、放射線(X線、γ線、粒子線)、紫外線、酸素濃度、化学物質、薬物、熱、浸透圧ストレス、pH、微生物、ウイルス、DNA突然変異(ゲノム上の挿入、欠失、点突然変異、染色体の転座、重複等)などが挙げられる。
【0064】
一実施態様では、候補となる薬剤又は外的因子は、腫瘍の予後を改善する可能性がある因子である。かかる場合は、上記の薬剤又は外的因子を選択する工程において、上記応答として、例えば、腫瘍の消滅又は縮小、増殖の抑制、血管新生抑制、浸潤抑制、転移抑制及び正常組織化からなる群より選ばれるいずれか1つ以上が得られる場合に、当該候補を選択すればよい。
【0065】
別の実施態様では、候補となる薬剤又は外的因子は、腫瘍の予後に悪影響を及ぼす可能性がある因子である。かかる場合は、上記の薬剤又は外的因子を選択する工程において、上記応答として、例えば、腫瘍の増殖、血管新生促進、浸潤促進、転移促進からなる群より選ばれる1つ以上が得られる場合に当該候補を選択すればよい。
【0066】
[腫瘍のサブタイプを決定するための方法]
本発明は、腫瘍のサブタイプを決定するための方法を含み、該方法は、
対象の腫瘍について、EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合のErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性の経時変化データを取得する工程、
前記経時変化データに基づいて、前記腫瘍を2種以上のサブタイプのいずれかに分類する工程、
各々の前記サブタイプに帰属する腫瘍の特徴を抽出する工程、及び、
抽出された前記腫瘍の特徴が、前記サブタイプに特徴的なものか検証する工程、
を含む。
【0067】
(シグナル活性の経時変化データを取得する工程)
本工程では、EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合の、時間に対するErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性値の関係を表す経時変化データを取得する。EGFRを活性化した場合、ERBB2~4を活性化した場合それぞれについて、同じ下流因子又は異なる下流因子について、少なくとも1種の経時変化データを取得すればよいが、少なくとも1種の下流因子について両方の場合の経時変化データを取得するほうが、腫瘍の特徴に応じたサブタイプの分類の精度をより高めることができる。
【0068】
ERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化する場合、ERBB3及び/又はERBB4を活性化することが好ましい。
【0069】
本方法の対象及び腫瘍の具体的態様については、上記のサブタイプ決定方法に記載のものが挙げられる。
【0070】
下流因子のシグナル活性値は、例えば、リン酸化度、遺伝子の発現量、シグナル因子の濃度(細胞内濃度、局所濃度等)などで表すことができるが、リン酸化度が好ましい。特定のタンパク質の「リン酸化度」としては、例えば、リン酸化された当該タンパク質の量、当該タンパク質全量に対するリン酸化された当該タンパク質の量の割合などが挙げられる。
【0071】
ErbB受容体シグナル伝達経路の下流因子としては、例えば、c-Myc、ERK、Akt、GSK3β、DUSP、MEK、Raf、Ras、SOS、Grb2、PTP1B、PI3K、RasGAP、Shc、Gab1、PTEN、ホスファチジルイノシトール4,5-二リン酸(PIP2)、ホスファチジルイノシトール-3,4,5-トリスリン酸(PIP3)からなる群より選ばれる1種単独又は2種以上の組み合わせが挙げられる。
【0072】
使用する下流因子の種類は、例えば、1種以上、2種以上又は3種以上とすることができ、例えば、10種以下、8種以下又は5種以下とすることができる。また、使用する下流因子の種類は、例えば、1種、2種、3種、4種又は5種とすることができる。
【0073】
一実施態様では、ErbB受容体シグナル伝達経路の下流因子としては、c-Myc、ERK及びAktからなる群より選ばれる1種単独、2種以上の組み合わせ、又は3種全ての組み合わせが選択される。試験例1、5に示されるように、これらの下流因子の経時変化データを用いた場合は、多様な種類の腫瘍をその特徴に応じてサブタイプに分類することができるため、好ましい。
【0074】
上記下流因子のシグナル活性の経時変化のデータは、例えば、腫瘍組織又は腫瘍細胞を用いたin vitro試験で、腫瘍(腫瘍細胞)について、EGFRを特異的に活性化する因子、ERBB2~4受容体を特異的に活性化する因子でそれぞれ刺激してから一定時間後に反応を停止し、下流因子のシグナル活性値を分子生物学的手法で分析することによって取得することができる(例えば、Cell, 2006, Vol.127, Issue 3, pp.635-648の質量分析法による経時的リン酸化プロテオーム解析、などを参照のこと)。
【0075】
例えばEGFRを特異的に活性化する因子として、上皮成長因子(EGF)、トランスフォーミング成長因子α(TGF-α)、アンフィレグリン、ヘパリン結合上皮細胞成長因子(HB-EGF)、β-セルリン、エピグレリン等を使用することができるが、中でもEGFが好ましい。活性化に使用されるEGFの細胞外濃度は、例えば1~100nM、2~50nM又は5~20nMであり得る。
【0076】
例えばERBB2~4受容体を特異的に活性化する因子として、ニューレグリン(NRG)ファミリータンパク質(ヘレグリンファミリータンパク質)を使用することができる。NRGファミリータンパク質として、例えば、NRG1タンパク質であるヘレグリン(HRG)、NRG2タンパク質、NRG3タンパク質、NRG4タンパク質等が挙げられるが、好ましくはHRGである。HRGの細胞外濃度は1~100nM、2~50nM又は5~20nMであり得る。
【0077】
また、後述のように、上記下流因子のシグナル活性の経時変化データは、例えば細胞シグナル伝達数理モデル(以下、「シグナルモデル」と呼ぶことがある)を用いたシミュレーションによって得ることもできる。
【0078】
(腫瘍を2種以上のサブタイプのいずれかに分類する工程)
本工程では、前記工程で得られた1種以上の下流因子のシグナル活性値の経時変化データに基づいて、腫瘍を2種以上のサブタイプのいずれかに分類する。経時変化データの全体又は特定の時間幅のデータが示すパターンをそのまま分類に用いることもできるが、計算量を抑える観点から、経時変化データから1種以上のパラメータを抽出して、分類に用いることが好ましい。
【0079】
上記の1種以上のパラメータとしては、例えば、シグナル活性の最大値(Max)、曲線下面積(AUC)、シグナル活性の降下率(Droprate)及びシグナル活性の最大値を与える時間(Argmax)からなる群より選ばれる1種以上を用いることができる。
図1はこれらのパラメータの理解のための模式図であるが、実施形態は当該図によって限定されるものではない。
【0080】
EGFで活性化した場合の経時変化データとHRGで活性化した場合の経時変化データとの間で、下流因子及び上記パラメータは、それぞれ同一であっても互いに異なっていてもよいが、それぞれ同一であることが好ましい。
【0081】
分類の手法は、分類に使用する変数の数、種類、サンプル数等によって適宜選択することができ、例えば、クラスター分析(k-medoid法、k-means法等)、ロジスティック回帰分析、単純パーセプトロン、単純ベイズ分類器、サポートベクターマシン、k近傍法、決定木、ランダムフォレスト、ニューラルネットワーク、ベイジアンネットワーク、隠れマルコフモデルなどを使用することができる。
【0082】
(腫瘍の特徴を抽出する工程)
本工程では、上記の分類によって得られたサブタイプに帰属する腫瘍の特徴を抽出する。腫瘍の特徴の具体例は、上記の[サブタイプ決定方法]の項で例示したものが挙げられる。定性的な特徴については、例えば、サブタイプ内で共通する特徴から得られる。定量的な特徴については、例えば、平均、標準偏差等の統計量や分布等から得られる。
【0083】
腫瘍の特徴は、サブタイプの分類前又は後に取得された、対象の腫瘍の臨床データ(例えば、腫瘍のステージ、グレード、リンパ節転移の有無;患者の生死、年齢、性別等のデータ)、腫瘍の遺伝子発現量データなどから、直接又は解析を経て取得することができる。
【0084】
一実施態様では、腫瘍の特徴として、既知の腫瘍サブタイプ、患者の予後(例えば、生存期間)及び薬剤感受性からなる群より選ばれる1種以上が抽出される。
【0085】
(腫瘍の特徴がサブタイプに特徴的なものかを検証する工程)
本工程では、サブタイプから抽出された特徴を、他のサブタイプの共通又は対応する特徴と比較して、特徴的なものかを検証する。あるサブタイプの特徴が定性的な特徴の場合は、当該特徴が例えば他のサブタイプのいずれとも異なる特徴であれば、特徴的なものと判定することができる。また、あるサブタイプの特徴が定量的な特徴の場合は、他のサブタイプとの間で当該特徴の統計量、分布等を比較して有意な差がある場合に、特徴的なものと判定することができる。
【0086】
本工程によってサブタイプに特徴的な特徴と判定された特徴は、上記サブタイプ決定方法における「サブタイプに予め関連付けられた特徴」として好適に使用することができる。
【0087】
(シミュレーションによってシグナル活性の経時変化データを取得する工程)
本発明のサブタイプ決定のための方法には、シミュレーションによって、EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合のErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性の経時変化データを取得する工程をさらに含んでもよい。
【0088】
シミュレーションは、例えば、遺伝子の発現量を含む腫瘍のデータを取得し、それを細胞シグナル伝達系の数理モデルに入力することによって行われる。
【0089】
EGFRの活性化、ERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体の活性化は、例えば、それぞれ直接数理モデル上でそれぞれの受容体の活性化を入力してもよいし、数理モデル上のこれら受容体の活性化因子(例えば、EGF、HRG等)の量を入力してもよい。
【0090】
入力する腫瘍のデータは、例えば、EGFR、ERBB2、ERBB3、及びERBB4からなる群より選ばれる1種以上のErbB受容体ファミリー遺伝子の発現量を含むことが好ましく、EGFR、ERBB2、ERBB3、及びERBB4の4遺伝子の発現量を含むことがより好ましい。かかる態様により、ErbB受容体シグナル伝達経路のシミュレーションの精度を高めることができる。
【0091】
入力する腫瘍のデータは、例えば、[サブタイプ決定方法]の項に記載した各種の公知の遺伝子発現量データセットから抽出することができる。中でも、TCGAのデータは、既存のサブタイプの分類に必要な遺伝子(例えばER、PGR等)の発現量の情報のほか、上記の腫瘍の特徴の抽出工程に使用可能なグレード、腫瘍を有する患者の生死、年齢、性別等の臨床データが関連付けられている点で好ましい。
【0092】
細胞シグナル伝達系の数理モデル(以下、シグナルモデルと呼ぶことがある)は、生体内においてシグナル伝達経路中の分子の状態を模倣する数学的記述を含むが、当該数学的記述としては、例えば、常微分方程式(ODE)、データ駆動モデル、ベイズ推定、ブーリアンネットワーク、モジュラー応答分析等を用いることができる。
【0093】
一実施態様では、本発明に使用されるシグナルモデルの数学的記述としては、例えば、常微分方程式を用いる。そのような数理モデルの構築は、例えばLucarelli et al., 2018, Cell Systems 6, 75-89に記載された方法に準じて行うことができる。
【0094】
ErbB受容体シグナル伝達経路を含むシグナルモデルとしては、例えば、試験例1の
図3に示す、実際のErbB受容体シグナル伝達経路の各素反応を模倣した数理モデルを使用することができる。シグナルモデルは、試験例1に示されるように、さらにEGFRタンパク質がERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の遺伝子にコードされる受容体の活性化を阻害するように構築されてもよい。このようなシグナルモデルとしては、例えば、EGFRタンパク質がERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の遺伝子にコードされる受容体の二量体形成を阻害する素反応を含むモデルが挙げられる。
【0095】
シグナルモデルは、シグナル活性値の予測精度を高めるために、事前に実験的に得られたデータを用いて機械学習を行うことが好ましい。例えば、腫瘍のデータとしてErbB受容体ファミリー遺伝子のうちの特定の1種以上の遺伝子の発現量を入力してシミュレーションを行うのであれば、腫瘍から実験的に得られた(A)当該特定の1種以上の遺伝子と、(B)EGFRを活性化した場合及びERBB2、ERBB3及びERBB4からなる群より選ばれる1種以上の受容体を活性化した場合のErbB受容体シグナル伝達経路の1種以上の下流因子のシグナル活性の前記経時変化データ、とを用いて、機械学習を行うことが好ましい。腫瘍としては、サブタイプ分類の対象となる腫瘍が好ましいが、中でも、表現型が安定している点から、そのような腫瘍から樹立された培養細胞株がより好ましい。
【0096】
シミュレーションには、試験例1に示されるように、例えば、BioMASS(https://github.com/okadalabipr/biomassにより無償提供されている細胞シミュレーション解析ツール)を用いることができるが、他の各種シミュレーションソフトウェア(例えば、COPASI、BioNetGen、Matlab Simbiologyなど)を使って行なうことも可能である。但し、BioMASS(Biological Modeling and Analysis of Signaling Systems)には以下の特徴があることから、好適に使用することができる。・環境構築が容易で、プログラミングに詳しくない生物系研究者も使いやすい。・情報の共有、実行、エラーの発見をより多くの人と共有しやすく,計算資源を有効に活用できる。・中規模から大規模モデルの構築に適する。
【0097】
(用途)
上記の方法によれば、腫瘍の特徴によって分類するためのサブタイプを生成することができるほか、生成されたサブタイプに関連付けれた特徴をもとに、サブタイプから腫瘍の特徴を予測することができる。さらに、当該腫瘍の特徴を利用した、治療方法の決定や薬剤スクリーニングのための腫瘍の選択に応用することができる。
【0098】
また、得られたサブタイプの分布をもとに、腫瘍のサブタイプを判別するための指標を得ることができる。例えば、試験例2のように、サブタイプの全部又は一部の分布情報から、第1のサブタイプと第2のサブタイプとを区別する境界を設定することができる。
【0099】
加えて、サブタイプに帰属される腫瘍の経時変化データの特徴(例えば、分類に使用したパラメータのとり得る数値範囲)に基づいて、サブタイプを簡便に分類するための指標を得ることもできる。
【実施例0100】
以下に本発明のより具体的な試験例を示すが、本発明は以下の試験例等に何ら限定されるものではない。
【0101】
下記試験例のクラスター分析結果のヒートマップの各列のラベルは、「下流シグナル因子_与える刺激の別(HRG又はEGF)_使用した経時変化のパラメータ」で表される。例えば、「pc-Myc_HRG_max」と記載した場合、HRGで刺激したときのリン酸化c-Mycの経時変化データにおけるMaxの値を表す。
【0102】
[試験例1.分子ダイナミクスに基づく乳癌サブタイプの分類と予後との関係性の検証]
(解析の概要)
本試験例の全体の流れを
図2に示した。まず、細胞シミュレーション解析ツールBioMASSを用いて、既知のシグナル伝達系数理モデルをin vitroのデータを用いた機械学習によって最適化した。得られたモデルに患者から得られた遺伝子発現量データを入力することにより、種々の初期条件を与えた場合の各患者の腫瘍におけるErbB受容体シグナル伝達経路のリン酸化された下流因子の量の経時変化をシミュレートした。次いで、得られた経時変化データからパラメータを抽出してクラスター分析を行い、患者(腫瘍)をサブタイプに分類した。以下により具体的な手順と結果を示す。
【0103】
(1.学習済みシグナル伝達系数理モデルの生成)
中茎らの文献(Cell, 2010, Vol.141, pp.884-896)に記載されたモデルのうちのc-fosの部分をc-Mycに変換し、Birtwistle MR et al. Molecular Systems Biology, 2007, Vol.3, Article No. 144に記載されたErbB受容体シグナル伝達経路モデルに統合して、BioMASSの解析に使用する数理モデル(
図3)を構築した。
【0104】
以降の数理モデルによる解析では、表1に記載された20種のErbB受容体シグナル因子のタンパク質の経時変化データと38種の遺伝子の発現量のデータを使用した。
【0105】
【0106】
予めLuminal A-like、Luminal B-like、Her2過剰発現、TNBC(Basal-like)に属する乳癌培養細胞株4種(MCF-7、BT-474、SKBR-3、Her2MDA-MB-231)について、10nMのEGF刺激又は10nMのHRG刺激を与えた際のリン酸化されたErk、Akt、c-Mycの量の時系列データを、ウェスタンブロット法を用いて取得した。そして、得られた時系列データと、CCLEのデータベースから得られる上記4種類の乳癌培養細胞株の遺伝子発現量データとを用いて、数理モデルに遺伝子発現量と各シグナル因子のシグナル活性の経時変化の関係を学習させた。
【0107】
(2.臨床遺伝子発現量データに基づくシグナル因子の経時変化のシミュレーション)
臨床遺伝子発現量データとして、2006年に米国で開始された大型癌ゲノムプロジェクトである、The Cancer Genome Atlas(TCGA)の浸潤性乳癌コレクション(TCGA-BRCA)(https://portal.gdc.cancer.gov/projects/TCGA-BRCA)から、転移の無いステージI及びIIの患者377名(最高齢59歳)の腫瘍の遺伝子発現量データ及び臨床データを抽出した。遺伝子発現量のデータはTCGA-BRCAのHT-seq Countsのデータを、臨床データはプログラム言語RのTCGAbiolinksパッケージを用いて入手したサブタイプデータを使用した。各患者の腫瘍の遺伝子発現量を上記の学習済みモデルに入力し、EGF又はHRG刺激を入力した場合の各患者の腫瘍におけるEGFR下流因子のリン酸化タンパク質量の経時変化をシミュレートした。EGF又はHRG刺激の入力は、それぞれのタンパク質10nMを細胞に曝露した状態をシミュレートするものであり、その詳細は上記中茎らの文献に記載されている。
【0108】
(3.経時変化データに基づく患者の分類)
得られた経時変化データのうち、EGF刺激又はHRG刺激した際のc-Myc、ERK活及びAktの3因子のリン酸化度の最大値(Max)を用いて、K-medoid法によるクラスター分析を行った。重心の計算にはユークリッド距離を用いた。
【0109】
(4.結果)
解析の結果、
図4に示したように、乳癌は6つのクラスターに分類された。それぞれのクラスターについて、各患者の腫瘍のサブタイプの情報を照合した。その結果、Akt、c-Myc及びERKのリン酸化がHRG刺激よりもEGF刺激によって顕著に促進される2群である、クラスター1及び2が、TNBC(Basal-like)を多く含むことが判明した。さらに、患者の生存期間の情報から各クラスターの患者の生存率曲線(
図5)を作成したところ、クラスター1が6つのクラスターの中で最も予後不良であったのに対し、クラスター2は意外にも6つのクラスターの中で最も予後が良好であった。以上から、EGF刺激及びHRG刺激を与えた場合の下流シグナル因子の活性の経時変化に基づいて、TNBCを予後不良群(クラスター1)と予後良好群(クラスター2)を分類できることが明らかとなった。
【0110】
予後不良群のクラスター1は、予後良好群のクラスター2に比べて、c―Myc等がHRG刺激でより活性化しにくく、EGF刺激でより活性化しやすいことから、EGFRの高発現によってERBB2、ERBB3、ERBB4のシグナル伝達が阻害され、その結果予後不良となることが推察された。そこで、EGFRがERBB2受容体のホモ二量体の形成を阻害する素反応を追加した数理モデルを構築して細胞シミュレーションを行った。その結果、EGFRが高発現しているほど、ERBB2下流へのシグナル伝達が阻害され、当該阻害の強さと予後の悪さが相関していたことから、上記仮説が裏付けられた。
【0111】
比較例として、上記の377名の患者の腫瘍について、既存の乳癌分類用のバイオマーカーである50個の遺伝子からなるPAM50(J. Clin. Oncol., 2009, Vol.27, No.8, pp.1160-1167)を用いて、クラスター分析を行った結果を
図6に示した。TNBCの患者の多くはクラスター4及び5に分類されたが、それらの生存率曲線は、
図7に示されるようにほぼ同じ傾向を示しており、予後の違いは見られなかった。
【0112】
[試験例2.サブタイプ分類指標の検討]
本発明者らは、上記のErbB受容体の相互作用仮説から、EGFRと他のEGFRファミリータンパク質の発現量の比率が予後に関係すると考えた。そこで、TNBCサブタイプのうち予後不良群(クラスター1)及び予後良好群(クラスター2)に分類される患者の腫瘍のERBB2、ERBB3及びERBB4の発現量の総和[Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4)]に対するEGFRの発現量[Exp(EGFR)]の分布を調べたところ、
図8のように、その2量の比の値によってTNBCの2つのサブタイプを簡便に識別できることが明らかとなった。
【0113】
[試験例3.乳癌サブタイプと薬剤感受性の関係性の検証]
CCLEのデータベースから得られる種々のサブタイプの乳癌培養細胞株(n=41)の遺伝子発現量データを、試験例1で用いたErbB受容体シグナル伝達系数理モデルに入力して、下流シグナル因子の経時変化をシミュレートした。得られた結果に基づいて、試験例1と同様にクラスタリングを行ったところ、試験例1と同様に6つのクラスターに分類された。
【0114】
CCLEのデータベースから、クラスター1とクラスター2に分類された細胞株におけるエルロチニブ又はラパチニブに対する感受性を評価したデータを取得し、両クラスターの薬剤感受性を比較した。結果を
図9に示した。クラスター2に分類される細胞株は、クラスター1に分類される細胞株に比べて、EGFR阻害剤であるエルロチニブ及びラパチニブに対する感受性が高かった。
【0115】
以上から、試験例1のクラスタリング及び試験例2の発現量の比の値によって、EGFR阻害剤の薬剤感受性に基づいてTNBCをサブクラスに分類できることが明らかとなった。
【0116】
一方、比較例として、下流因子であるMEKに対する阻害剤であるセルメチニブ(Selumetinib)及びPD-0325901について、同様の比較を行った場合は、
図9に示すように、クラスター1とクラスター2の薬剤感受性の差異は認められなかった。
【0117】
[試験例4.癌培養細胞株のErbB受容体発現量に基づいた分類と薬剤感受性の関係性の検証]
CCLEで利用可能な全ての癌培養細胞株について、ERBB2、ERBB3及びERBB4の発現量の総和[Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4)]に対するEGFRの発現量[Exp(EGFR)]をプロットした結果を
図10Aに示す。EGFR発現量が単純平均値より高い細胞群を抽出し、[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の値によって、高値群(high)、中値群(middle)、低値群(low)の3群に分類した。
【0118】
試験例3と同様に、高値群と低値群に分類された細胞株についてCCLEのデータベースからエルロチニブとラパチニブに対する感受性のデータを抽出し、上記3群間の比較を行った。結果を
図10Bに示した。試験例3の結果と同様に、乳癌以外の細胞株を含む場合であっても、[Exp(EGFR)/(Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4))]の値が小さいほうが、エルロチニブ及びラパチニブに対する感受性が高かった。よって、このような感受性の違いには、ErbB受容体間の相互作用が強く関係し、他の因子の影響は小さいことが推察される。
【0119】
[試験例5.肺腺癌及び子宮頸癌の分類の検証]
TCGAの肺腺癌コレクション(TCGA-LUAD)、子宮頸癌コレクション(TCGA-CESC)(それぞれ、n=238、n=153)の遺伝子発現量データを用いて、試験例1と同様の方法によってErbB受容体シグナル伝達系の各因子のシグナル活性の経時変化のシミュレーションを行った。
【0120】
得られたシグナル活性の経時変化データから、パラメータとしてMaxを用いてクラスター分析を行った結果を、
図11A及び
図12Aに示した。それぞれ、乳癌と同様に、Akt、c-Myc及びERKがHRG刺激よりもEGF刺激によって顕著に活性化される2群(クラスター1、2)が得られた。そして、いずれの場合もHRG刺激の場合に比べてEGF刺激の下流シグナル因子の活性化がより顕著なクラスター1は予後不良群であった。そして、クラスター2は全てのクラスターの中でも比較的予後が良好であった。
【0121】
さらに、得られたクラスター1、2の患者の腫瘍についてERBB2、ERBB3及びERBB4の発現量の総和[Exp(ERBB2)+Exp(ERBB3)+Exp(ERBB4)]に対するEGFRの発現量[Exp(EGFR)]の分布を調べた。その結果を
図11B及び
図12Bに示した。試験例2の場合と同様に、その2量の比の値によって2つのサブタイプを簡便に識別できることが明らかとなった。
【0122】
[試験例6.種々のパラメータを使用した場合の腫瘍の分類の検証]
TCGAの結腸腺癌コレクション(TCGA-COAD)、食道癌コレクション(TCGA-ESCA)、肝細胞癌コレクション(TCGA-LIHC)、及び胃癌コレクション(TCGA-STAD)から得られるステージI及びIIの患者の腫瘍(それぞれ、n=189、n=24、n=201及びn=138)の遺伝子発現量データを用いて、試験例1と同様の方法によってErbB受容体シグナル伝達系の各因子のシグナル活性の経時変化のシミュレーションを行った。
【0123】
結腸腺癌のデータでは、EGF刺激、HRG刺激それぞれの場合に得られたシグナル活性の経時変化データから、パラメータとしてargmaxとdroprateを用いてクラスター分析を行った。その結果、
図13Aのように、予後不良群のクラスター4を含む、生存率曲線の傾向が異なる5つのクラスターに分類された。また、EGFの際の経時変化データとHRG刺激の際の経時変化データで異なる下流因子、パラメータのデータを使用してクラスター分析を行った結果を
図13Bに示した。クラスター2と3の予後は類似しているが、
図13Aの場合と同様に、予後不良のクラスター4が見出された。さらに、試験例1と同様にパラメータとしてMaxを使用してクラスター分析を行うと、
図13Cに示すように全体は4群に分けられた。乳癌の場合と同様に、Akt、c-Myc及びERKがHRG刺激よりもEGF刺激によって顕著に活性化される2群(クラスター1、2)が得られた。そして、HRG刺激の場合に比べてEGF刺激の下流シグナル因子の活性化がより顕著なクラスター1は、予後不良群であった。クラスター2は、全てのクラスターの中でも比較的予後が良好であった。
【0124】
胃癌のデータでは、得られたシグナル活性の経時変化データから、パラメータとしてMaxを用いてクラスター分析を行った結果を
図14に示した。全体は5群に分けられ、乳癌、結腸癌の場合と同様に、Akt、c-Myc及びERKがHRG刺激よりもEGF刺激によって顕著に活性化される2群(クラスター1、2)が得られた。そして、HRG刺激の場合に比べてEGF刺激の下流シグナル因子の活性化がより顕著なクラスター1は予後不良群であった。クラスター2は全てのクラスターの中でも比較的予後が良好であった。
【0125】
食道癌のデータでは、得られたシグナル活性の経時変化データから、パラメータとしてMaxを用いてクラスター分析を行った結果を
図15に示した。予後不良群のクラスター1を含む、生存率曲線の傾向が異なる5つのクラスターに分類された。
【0126】
肝細胞癌のデータでは、得られたたシグナル活性の経時変化データから、パラメータとしてMax、argmaxをそれぞれ用いてクラスター分析を行った結果を
図16A、
図16Bに示した。パラメータとしてMaxを用いた場合、予後不良群のクラスター5を含む、生存率曲線の傾向が異なる5つのクラスターに分類された。また、argmaxを用いた場合、予後不良群のクラスター1を含む、生存率曲線の傾向が異なる3つのクラスターに分類された。
【0127】
以上のように、いずれの種類の癌でも予後の著しく不良な腫瘍のサブタイプを分離することができた。
【0128】
図15、
図16Aのように、食道癌及び肝細胞癌では、パラメータとしてMaxを用いた場合、乳癌の場合とは逆に、EGF刺激の場合に比べてHRG刺激でより顕著にシグナルの活性化が見られる群が予後不良群であった。しかし、これらは、その傾向がより軽度な群(
図15のクラスター5、
図16Aのクラスター4)には、比較的予後が良好な腫瘍が帰属される点で乳癌の場合と共通していた。