【文献】
Journal of Clinical Oncology,2009年,vol.27, no.8,p.1160-1167
【文献】
Clin. Cancer Res.,2010年,vol.16, no.21,p.5222-5232
(58)【調査した分野】(Int.Cl.,DB名)
次の:腫瘍の大きさ、腫瘍のグレード、結節状態、固有サブタイプ、エストロゲン受容体発現、プロゲステロン受容体発現、及びHER2/ERBB2発現、のうちの少なくとも1種類を測定することをさらに含む、請求項1に記載の方法。
次の:腫瘍の大きさ、腫瘍のグレード、結節状態、固有サブタイプ、エストロゲン受容体発現、プロゲステロン受容体発現、及びHER2/ERBB2発現、のそれぞれを測定することをさらに含む、請求項1に記載の方法。
【発明を実施するための形態】
【0019】
本発明の詳細な説明
本開示は、タキサン又はタキサン誘導体を含む乳癌処置が、乳癌に罹患している患者に投与するのに最適であるか否かを決定する方法を提供する。乳癌患者が、タキサン又はタキサン誘導体を含む処置を受けるべきであるか否かの決定は、固有遺伝子発現セットを用いた乳癌の増殖シグネチャーの決定を含む。本開示はまた、乳癌患者が、タキサン又はタキサン誘導体を含む処置を受けるべきであるか否かを決定し、そしてこの決定に基づいて患者に最適な乳癌処置を施すことによって乳癌を治療する方法を提供する。
【0020】
Perou et al. (2000) Nature 406:747-752で説明されている固有遺伝子は、同一個体からの生物学的サンプル複製物間での発現の変動が小さく、かつ異なる個体からのサンプル全体での発現の変動が大きいものが統計学的に選択される。したがって、固有遺伝子は、乳癌の分類のためのクラシファイア遺伝子として使用される。臨床情報は、乳癌固有サブタイプを導き出すためには使用されなかったが、この分類は、予後に重要であることを証明している。固有遺伝子スクリーニングを使用して、乳癌を様々なサブタイプに分類することができる。乳癌の主要な固有サブタイプは、管腔A(LumA)、管腔B(LumB)、HER2高発現(Her−2−E)、基底様及び正常様と呼ばれる。
【0021】
PAM50遺伝子発現アッセイ(それぞれ参照により本明細書に組み入れられる、Parker et al. J Clin Oncol., 27(8):1160-7 (2009)及び国際公開WO2009/158143)は、標準的なホルマリン固定パラフィン包埋腫瘍組織から固有サブタイプを同定することができる。この方法は、教師付きアルゴリズム(supervised algorithm)を使用して乳癌固有サブタイプに従って対象サンプルを分類する。このアルゴリズムは、本明細書ではPAM50分類モデルと呼ばれ、乳癌固有サブタイプの分類に優れているとして本明細書で同定された、固有遺伝子の指定サブセットの遺伝子発現プロフィールに基づいている。この遺伝子のサブセット及びそれらの検出専用のプライマーが表1に示されている。
【0026】
表2は、表1のPAM50遺伝子の選択配列を示す。
【0066】
発現についてアッセイされるかもしれない遺伝子のサブセットには、表2で列挙した遺伝子のうちの少なくとも1種類、少なくとも2種類、少なくとも3種類、少なくとも4種類、少なくとも5種類、少なくとも6種類、少なくとも7種類、少なくとも8種類、少なくとも9種類、少なくとも10種類、少なくとも11種類、少なくとも12種類、少なくとも13種類、少なくとも14種類、少なくとも15種類、少なくとも16種類、少なくとも17種類、少なくとも18種類、少なくとも19種類、少なくとも20種類、少なくとも21種類、少なくとも22種類、少なくとも23種類、少なくとも24種類、少なくとも25種類、少なくとも26種類、少なくとも27種類、少なくとも28種類、少なくとも29種類、少なくとも30種類、少なくとも31種類、少なくとも32種類、少なくとも33種類、少なくとも34種類、少なくとも35種類、少なくとも36種類、少なくとも37種類、少なくとも38種類、少なくとも39種類、少なくとも40種類、少なくとも41種類、少なくとも42種類、少なくとも43種類、少なくとも44種類、少なくとも45種類、少なくとも46種類、少なくとも47種類、少なくとも48種類、少なくとも49種類又は50種類すべてが含まれる。
【0067】
遺伝子セットは、増殖に関する既知のマーカーである多くの遺伝子を含む。本発明の方法は、増殖シグネチャーを提供する遺伝子のサブセットの測定を提供する。本発明の方法は、少なくとも1種類の増殖遺伝子の発現を測定することを含み得る。好ましくは、少なくとも1種類の増殖の遺伝子とは、表1又は表2で列挙したうちの少なくとも1種類、少なくとも2種類、少なくとも3種類、少なくとも4種類、少なくとも5種類、少なくとも6種類、少なくとも7種類、少なくとも8種類、少なくとも9種類、少なくとも10種類、少なくとも11種類、少なくとも12種類、少なくとも13種類、少なくとも14種類、少なくとも15種類、少なくとも16種類、少なくとも17種類、少なくとも18種類、少なくとも19種類、少なくとも20種類、又は少なくとも21種類の遺伝子である。
【0068】
本発明の方法は、ANLN、BIRC5、CCNB1、CCNE1、CDC20、CDC6、CDCA1、CENPF、CEP55、EXO1、KIF2C、KNTC2、MELK、MKI67、MYBL2、ORC6L、PTTG1、RRM2、TYMS、UBE2C及び/又はUBE2Tから選択されるPAM50固有遺伝子から成る21種類の遺伝子サブセットのうちの少なくとも1種類、それらの組み合わせ、又はそのそれぞれの発現を測定することを含み得る。
本発明の方法は、ANLN、CCNB1、CCNE1、CDC20、CDC6、CDCA1、CENPF、CEP55、EXO1、KIF2C、KNTC2、MELK、MKI67、ORC6L、PTTG1、RRM2、TYMS、UBE2C及び/又はUBE2Tから選択されるPAM50固有遺伝子から成る19種類の遺伝子サブセットのうちの少なくとも1種類、それらの組み合わせ、又はそのそれぞれの発現を測定することを含み得る。
本発明の方法は、ANLN、CCNE1、CDC20、CDC6、CDCA1、CENPF、CEP55、EXO1、KIF2C、KNTC2、MELK、MKI67、ORC6L、PTTG1、RRM2、TYMS、UBE2C及び/又はUBE2Tから選択されるPAM50固有遺伝子から成る19種類の遺伝子サブセットのうちの少なくとも1種類、それらの組み合わせ、又はそのそれぞれの発現を測定することを含み得る。
本発明の方法は、から選択されるPAM50固有遺伝子から成る18種類の遺伝子サブセットのうちの少なくとも1種類、それらの組み合わせ、又はそのそれぞれの発現を測定することを含み得る。
本発明の方法は、BIRC5、CCNB1、CDC20、CDCA1/NUF2、CEP55、KNTC2/NDC80、MKI67、PTTG1、RRM2、TYMS及び/又はUBE2Cから選択されるPAM50固有遺伝子から成る11種類の遺伝子サブセットのうちの少なくとも1種類、それらの組み合わせ、又はそのそれぞれの発現を測定することを含み得る。
本発明の方法は、ANLN、CCNB1、CDC20、CENPF、CEP55、KIF2C、MKI67、MYBL2、RRM2及び/又はUBE2Cから選択されるPAM50固有遺伝子から成る10種類の遺伝子サブセットのうちの少なくとも1種類、それらの組み合わせ、又はそのそれぞれの発現を測定することを含み得る。
【0069】
生物学的サンプルの増殖シグネチャーを決定する方法は、Nielsen et al. Clin. Cancer Res., 16(21):5222-5232 (2009)と補足のオンラインコンテンツ及び(オンラインで刊行された)Bastien et al. BMC Medical Genomics, 5:44 (2012)と補足のオンラインコンテンツ(これらの文書は、それらの全体を参照により本明細書中に援用する)。
【0070】
本発明は、対象からの乳癌サンプルの増殖シグネチャー(増殖スコア又はp−スコアとも呼ばれ、これらの用語は本明細書中で互換的に利用される)を決定する方法を提供する。表1で列挙した遺伝子のうちの1種類以上の発現は、当該技術分野で既知の方法、及び本明細書中に記載した方法を使用して測定され、そして、対照ハウスキーピング遺伝子(すなわち、MRPL19、PSMC4、SF3A1、PUMl、ACTB、GAPD、GUSB、RPLPO、及びTFRC)に対して正規化され得る。好ましくは、表1の1若しくは複数の遺伝子は、本明細書中に記載したように、増殖に関して知られている遺伝子のサブセット(例えば、細胞周期を調節する遺伝子、Bastien et al., BMC Medical Genomics 5:44-, 2012を参照のこと)である。任意に、遺伝子発現はまた、サンプルと対照サンプルの間のそれぞれの遺伝子の比を測定することによって対照サンプルに対して正規化され得る。当該技術分野で知られている任意の対照サンプルが利用され得るが、1つの代表的な対照サンプルは、既知濃度のそれぞれの遺伝子の試験管内転写RNA配列を含んでいる。それぞれの増殖遺伝子の対数比の平均値又は正規化値が、サンプルの平均増殖遺伝子発現を決定するために計算され得る。増殖シグネチャーは、例えば、1〜10(例えば、
図4)の範囲に対して計算した平均遺伝子発現をスケーリングすることによって決定できるが、そのスケーリングは、参照サンプルセットによって決定される。増殖シグネチャーの最低値は、参照サンプルセットで最も低い増殖シグネチャーに相当し、そして、増殖シグネチャーの最高値は、最も高い増殖シグネチャーに相当するので、サンプルの増殖シグネチャーは、参照サンプルセットの最高値と最低値の間の線形補間によって決定できる。
【0071】
参照サンプルセットは、それぞれのサンプルの増殖シグネチャーが前掲に記載したように測定された乳癌サンプルの集団である。参照サンプルセットは、そのセットが、統計的有意性を有する臨床的変数、例えば、処置計画に対する応答、エストロゲン受容体の状態、及び腫瘍の大きさを評価できる位に十分なサイズがなければならない。一部の実施形態では、参照サンプルセットは、乳癌と診断された対象からの原発性乳癌組織又は整復乳房形成や非癌性乳房組織からの「正常な」乳房組織サンプルを含む。これらのサンプルは、本明細書中に記載したPAM50分類モデルを使用することで、特定の乳癌固有サブタイプ、例えば、管腔A、管腔B、基底様、及びHer2に分類できる。例えば、参照サンプルセットは、少なくとも100個のサンプル、少なくとも200個のサンプル、少なくとも300個のサンプル、少なくとも400個のサンプル、少なくとも500個のサンプル、少なくとも600個のサンプル、少なくとも700個のサンプル、少なくとも800個のサンプル、少なくとも900個のサンプル、又は少なくとも1000個のサンプルを含む。好ましくは、参照サンプルセットは、少なくとも500個のサンプルを含む。
【0072】
参照サンプルセット中のそれぞれの参照サンプルの増殖シグネチャーは、最低から最高まで、例えば、1から10まで配列され得る。そして、増殖シグネチャーによって配列された時点で、参照サンプルセットは部分範囲に分割されるが、それぞれの部分範囲は参照セットの非重複部分である。サンプルの増殖シグネチャーは、参照サンプルセットと比較され得る。これらの部分範囲は、低い増殖シグネチャーのカットオフ閾値制限を決定するのに使用される。例えば、部分範囲は、配列された参照サンプルセットの増殖シグネチャーの50%、33%、30%、25%、20%、15%、10%、又は5%であり得る。部分範囲の数に関係なく、サンプルの増殖シグネチャーは、それが参照サンプルセットの最も低い部分範囲内に存在している場合には、低い増殖シグネチャーであると考えられる。例えば、参照サンプルセットが3つの部分範囲に分割される場合、サンプルの増殖シグネチャーが配列された参照サンプルセットの増殖スコアの最も低い33%の範囲内に存在しているのであれば、低い増殖シグネチャーの分類に割り当てられる。
【0074】
本開示において、「乳癌」は、例えば、生検又は組織学によって悪性病変として分類される状態を含む。乳癌診断の臨床的描写は医学の分野で周知である。当業者であれば、乳癌が、例えば、癌腫及び肉腫を含む乳房組織のあらゆる悪性腫瘍を指すことを理解されよう。乳癌の特定の具体例は、非浸潤性腺管癌(ductal carcinoma in situ)(DCIS)、上皮内小葉癌(LCIS)、又は粘液性癌腫を含む。乳癌はまた、浸潤性乳管癌(IDC)、又は浸潤性小葉癌(ILC)も指す。本開示の殆ど実施形態では、目的の対象は、乳癌の疑いのあるヒト患者、又は実際に乳癌と診断されたヒト患者である。
【0075】
本開示において、「タキサン又はタキサン誘導体」は、ジテルペン、すなわち、イチイ(Taxus)属の植物(yews)によって製造される、癌化学療法に使用される薬物のクラスである。これらの薬物は、乳癌を含む多様な癌を処置するために使用される。しかしながら、このクラスの薬物は、極めて毒性が強く、著しく有害な副作用をもたらす。タキサン又はタキサン誘導体は、パクリタキセル(Taxol(登録商標))又はドセタキセル(Taxotere(登録商標))を含む。
【0076】
本開示において、「タキサン又はタキサン誘導体を含む乳癌処置」は、タキサン又はタキサン誘導体を含む乳癌の処置である。これらの処置は、他の抗癌剤も含み得る。これらの他の作用物質は、アントラサイクリン、シクロホスファミド、5−フルオロウラシル、又はそれらの組み合わせを含み得る。
【0077】
本開示において、「タキサン又はタキサン誘導体を含まない乳癌処置」は、タキサン又はタキサン誘導体を一切含まない乳癌の処置である。これらの処置は、他の抗癌剤を含む。
【0078】
好ましくは、タキサン及びタキサン誘導体は、静脈内に投与されるが、当該技術分野で知られている任意の方法によって投与され得る。タキサン又はタキサン誘導体は、約75mg/m
2〜約300mg/m
2、好ましくは約75mg/m
2〜約175mg/m
2、及び最も好ましくは約100mg/m
2の投薬量で投与され得る。投薬量が、約1〜約24時間又は1週間(5〜7日)にわたって投与されるのが好ましい。投薬量が、1〜約4週間以上、好ましくは約2〜約3週間繰り返され得る。好ましくは、投与計画は、60分の静脈内注射によって投与されるパクリタキセルの1週間コース8回である。
【0079】
好ましくは、アントラサイクリンは、静脈内に投与するが、当該技術分野で知られている任意の方法によって投与され得る。アントラサイクリンは、1週間あたり10mg/m
2〜300mg/m
2の投薬量で投与され得る。アントラサイクリンは、1週間あたり20〜200mg/m
2、30〜100mg/m
2、又は35〜75mg/m
2で投与され得る。好ましくは、アントラサイクリンは、1週間あたり約60mg/m
2で投与される。アントラサイクリンは、ダウノルビシン、ドキソルビシン、エピルビシン、イダルビシン、バルルビシン及びミトキサントロンを含む。
【0080】
好ましくは、5−フルオロウラシルは、静脈内投与されるが、当分野で公知の任意の方法によって投与することもできる。5−フルオロウラシルは、1週間に25mg/m
2〜1000mg/m
2の用量で投与することができる。5−フルオロウラシルは、1週間に50mg/m
2〜900mg/m
2、100mg/m
2〜800mg/m
2、300mg/m
2〜700mg/m
2、又は450mg/m
2〜650mg/m
2で投与することができる。好ましくは、5−フルオロウラシルは、1週間に約500mg/m
2で投与される。
【0081】
好ましくは、シクロホスファミドは、経口投与されるが、当分野で公知の任意の方法によって投与することもできる。シクロホスファミドは、1日に10mg/m
2〜300mg/m
2の用量で投与することができる。シクロホスファミドは、1日に20mg/m
2〜200mg/m
2、30mg/m
2〜100mg/m
2、又は40mg/m
2〜80mg/m
2で投与することができる。好ましくは、シクロホスファミドは、1日に約75mg/m
2で投与される。
【0082】
タキサン又はタキサン誘導体、アントラサイクリン、5−フルオロウラシル及び/又はシクロホスファミドを投与するための方法、スケジュール、及び投薬量は、Martin et al., J Natl Cancer Inst. 100(11):805-14, 2008に記載され、そしてそれは、全体を参照により本明細書中に援用する。
【0083】
冠詞「a」及び「an」は、1つ又は複数(すなわち、少なくとも1つ)のその冠詞の文法上の目的語を指すために本明細書で使用される。一例として、「ある要素」は、1つ以上の要素を意味する。
【0084】
本明細書を通して、語「含む(comprising)」又は語尾変化、例えば、「含む(comprises)」又は「含む(comprising)」は、述べられた要素、整数、又はステップ、或いは一群の要素、複数の整数、又は複数のステップを含むが、他の要素、整数、又はステップ、或いは他の一群の要素、複数の整数、又は複数のステップを除外することを意味するのではないことを理解されたい。
【0086】
本明細書に説明されているように、多数の臨床乳癌因子及び予後乳癌因子は、当分野で公知であり、治療結果及び疾患の再発の可能性を予測するために使用される。このような因子は、例えば、リンパ節転移、腫瘍サイズ、組織学的グレード、エストロゲン及びプロゲステロンホルモン受容体の状態、HER−2レベル、及び腫瘍倍数性を含む。一実施形態では、再発のリスク(ROR)スコアは、乳癌と診断された対象又は乳癌の疑いがある対象に対して付与される。このスコアは、リンパ節の状態(N)及び腫瘍サイズ(T)の臨床因子と組み合わせてPAM50分類モデルを使用する。臨床的変数の評価は、乳癌の病期分類用の対癌米国合同委員会(AJCC)標準システムに基づいている。このシステムでは、原発腫瘍サイズは、0〜4の等級(T0:原発腫瘍の証拠がない;T1:<2cm;T2:>2cm−<5cm;T3:>5cm;T4:胸壁又は皮膚に直接転移したあらゆるサイズの腫瘍)に分類される。リンパ節の状態は、N0〜N3(N0:局所リンパ節が転移していない;N1:移動可能な同側腋窩リンパ節(複数可)への転移;N2:互いに又は他の構造に固定された同側リンパ節(複数可)への転移;N3:胸骨下の同側リンパ節への転移)として分類される。乳癌患者の識別方法及び疾患の病期分類方法は、周知であり、指診、生検、患者の病歴及び/又は家族歴の精査、及びイメージング技術、例えば、マンモグラフィー、磁気共鳴影像法(MRI)、及びポジトロン放射型断層撮影法(PET)を含み得る。
【0088】
本開示の一実施形態では、乳癌サブタイプは、1つ以上の対象サンプルにおける表1に列記されている固有遺伝子の発現パターン又は発現プロフィールの評価によって評価される。考察において、用語、対象又は対象サンプルは、健常及び/又は疾患状態を問わない個体を指す。対象は、対象、試験参加者、コントロール対象、スクリーニング対象、又はサンプルが採取されて本開示の文脈で評価される他のクラスの個体とすることができる。したがって、対象は、乳癌と診断され得る、乳癌の1つ以上の症状又は素因、例えば、家族歴(遺伝的)因子若しくは病歴(医学的)因子を示し得る、乳癌の処置又は療法を受け得る、又は同様のものであり得る。或いは、対象は、いずれかの上記の因子又は基準に対して健常であり得る。本明細書で使用される用語「健常」は、あらゆる絶対評価又は状態に一致するように定義できないため、用語「健常」は乳癌の状態に対して相対的であることを理解されたい。したがって、あらゆる指定の疾患又は疾患基準に対して健常として定義される個体は、実際に他の1つ以上の疾患と診断されても良いし、又は乳癌以外の1つ以上の癌を含め、他の1つ以上の疾患基準を示しても良い。しかしながら、健常コントロールは、好ましくは、他の癌に罹患していない。
【0089】
特定の実施形態では、乳癌固有サブタイプを予測する方法は、癌細胞又は組織を含む生物学的サンプル、例えば、乳房組織サンプル又は原発性乳房腫瘍組織サンプルを採取することを含む。「生物学的サンプル」とは、固有遺伝子の発現を検出できる細胞、組織、又は体液の任意の抽出見本のことである。このような生物学的サンプルの例は、限定されるものではないが、生検又は塗沫標本である。本開示に有用な体液は、血液、リンパ液、尿、唾液、乳頭吸引液、婦人科液体、又は他の分泌液、又はそれらの派生物を含み得る。血液は、全血、血漿、血清、又は血液の任意の派生物を含み得る。一部の実施形態では、生物学的サンプルは、乳房細胞、特に生検による乳房組織、例えば、乳房腫瘍組織サンプルを含む。生物学的サンプルは、例えば、ある部位の擦り取り若しくは拭き取り、針を使用した細胞若しくは体液の吸引、又は組織サンプルの除去(すなわち、生検)を含む様々な技術によって対象から得ることができる。様々な生物学的サンプルを採取する方法は、当分野で周知である。一部の実施形態では、乳房組織サンプルは、例えば、微細針吸引生検、針生検、又は切除生検によって得られる。標本の保存及び検査を容易にするために、細胞又は組織を固定液及び染色液に浸漬する。生物学的サンプル、特に乳房組織サンプルは、顕微鏡下で観察するためにスライドガラスに移すことができる。一実施形態では、生物学的サンプルは、ホルマリン固定されたパラフィン包埋乳房組織サンプル、特に原発性乳房腫瘍サンプルである。様々な実施形態では、組織サンプルは、病理医によってガイドされた組織コアサンプルから得られる。
【0091】
様々な実施形態では、本開示は、対象の乳癌を分類する方法、予後を判定する方法、又は監視する方法を提供する。この実施形態では、固有遺伝子の発現の分析から得られるデータを、1つ以上のパターン認識アルゴリズムを用いて評価する。このような分析方法を使用して、予測モデルを形成することができ、この予測モデルを用いて試験データを分類することができる。例えば、特に有効な1つの便利な分類方法は、多変量統計解析モデリングを利用し、先ず既知のサブタイプのサンプル(例えば、特定の乳癌固有サブタイプ:LumA、LumB、基底様、HER2高発現、又は正常様を有する既知の対象に由来する)からデータ(「モデリングデータ」)を用いてモデル(「予測数学モデル」)を作成し、次いでサブタイプに従って未知のサンプル(例えば、「試験サンプル」)を分類する。パターン認識方法は、例えば、言語学、フィンガープリンティング、化学、及び心理学に及ぶ多くの異なる種類の問題を特徴付けるために広く使用されている。本明細書で説明される方法の文脈では、パターン認識は、パラメトリック及びノンパラメトリックの両方の多変量統計学を使用してデータを解析し、これによりサンプルを分類し、そして一連の観察された測定値に基づいて一部の従属変数の値を予測する。2つの主な手法がある。1組の方法は、「教師なし」と呼ばれ、これらは、データの複雑さを合理的な方法で単純に緩和すると共に、人間の眼で解釈できる表示プロットを作成する。しかしながら、このタイプの手法は、予測アルゴリズムの訓練に使用される初期のサンプル集団とは独立した対象に由来するサンプルを分類するために使用することができる臨床アッセイの開発には適していないであろう。
【0092】
もう1つの手法は、「教師付き」と呼ばれ、クラス又は結果が既知であるサンプルの訓練セットを使用して数学モデルを作成し、次いで独立バリデーションデータセットを用いて評価する。ここで、固有遺伝子発現データの「訓練セット」を用いて、各サンプルの「サブタイプ」を正確に予測する統計モデルを構築する。次いで、この訓練セットを独立データ(試験セット又はバリデーションセットと呼ぶ)で試験してコンピュータベースのモデルの頑強性を決定する。これらのモデルは、時には「エキスパートシステム」と呼ばれることもあるが、一連の異なる数学的手順に基づいても良い。教師付き方法は、次元が下げられたデータセット(例えば、最初の2、3の主成分)を使用することができるが、典型的には、次元が下げられていない全次元のデータを使用する。どの場合でも、この方法は、固有遺伝子発現プロフィールに関して各サブタイプを特徴付けて区別する多変量境界の定量的記述を可能にする。また、任意の予測、例えば、適合度に当てはめられる確率のレベルに対する信頼限界を得ることも可能である。予測モデルの頑強性はまた、選択されるサンプルを分析から除外することによって、クロス確認を用いてチェックすることもできる。
【0093】
本明細書で説明されるPAM50分類モデルは、表1に列記されている固有遺伝子を用いた、複数の対象サンプルの遺伝子発現プロフィールに基づいている。複数のサンプルは、各サブタイプクラスに属する対象に由来する十分な数のサンプルを含む。この文脈における「十分なサンプル」又は「代表的な数」とは、各サブタイプをその群の他のサブタイプから確実に区別できる分類モデルを構築するのに十分である、各サブタイプに由来するサンプルの数のことである。教師付き予測アルゴリズムは、このアルゴリズムを「訓練する」ための客観的に選択されるプロトタイプサンプルのプロフィールに基づいて開発されている。サンプルは、参照によりその全容が本明細書に組み入れられる国際公開WO2007/061876に開示されている方法に従って拡大固有遺伝子セットを用いて選択され、サブタイプに分類される。或いは、サンプルは、乳癌のサブタイプを分類するための任意の既知のアッセイに従ってサブタイプに分類することができる。サブタイプに従って訓練サンプルを階層化した後、セントロイドをベースとする予測アルゴリズムを用いて、表1に記載されている固有遺伝子の発現プロフィールに基づいてセントロイドを作成する。
【0094】
一実施形態では、予測アルゴリズムは、参照によりその全容が本明細書に組み入れられるNarashiman and Chu (2002) PNAS 99:6567-6572に記載されているものに関連した最短セントロイド法である。本開示では、この方法は、各サブタイプについての標準セントロイドを計算する。このセントロイドは、各サブタイプ(又は「クラス」)における各遺伝子の平均遺伝子発現をその遺伝子のクラス内の標準偏差で除算した値である。最短セントロイド分類は、新たなサンプルの遺伝子発現プロフィールを取り出して、このプロフィールをこれらのクラスの各セントロイドと比較する。サブタイプ予測は、5つのセントロイドに対して各テストケースのスペアマンの順位相関を計算し、次いで最短セントロイドに基づいてサンプルをサブタイプに割り当てることによって行われる。
【0096】
表1に列記されている固有遺伝子の発現を検出するための、当分野で利用可能なすべての方法が本明細書に含まれる。「発現の検出」とは、固有遺伝子のRNA転写物又はその発現産物の量又は存在を決定することである。本開示の固有遺伝子の発現を検出する方法、すなわち遺伝子発現プロファイリングは、ポリヌクレオチドのハイブリダイゼーション分析をベースとする方法、ポリヌクレオチドの配列決定をベースとする方法、免疫組織化学法、及びプロテオミクスをベースとする方法を含む。これらの方法は、一般に、表1に列記されている固有遺伝子の発現産物(例えば、mRNA)を検出する。好ましい実施形態では、PCRをベースとする方法、例えば、逆転写PCR(RT−PCR)(Weis et al., TIG 8:263- 64, 1992)、及びアレイをベースとする方法、例えば、マイクロアレイ(Schena et al., Science 270:467- 70, 1995)が使用される。「マイクロアレイ」とは、ハイブリダイズ可能なアレイ要素、例えば、ポリヌクレオチドプローブなどが基板上に規則的に配置されたもののことである。用語「プローブ」は、特に意図する標的生体分子、例えば、固有遺伝子によってコードされるか、又は固有遺伝子に対応するヌクレオチド転写物又はタンパク質に選択的に結合できるあらゆる分子を指す。プローブは、当業者が合成することもできるし、又は適切な生物学的標本から得ることもできる。プローブは、標識するように特別に設計することができる。プローブとして利用できる分子の例には、限定されるものではないが、RNA、DNA、タンパク質、抗体、及び有機分子が含まれる。
【0097】
多くの発現検出法は、単離RNAを使用する。開始材料は、典型的には、生物学的サンプル、例えば、腫瘍又は腫瘍細胞株及び対応する正常組織又は細胞株から単離された全RNAである。RNA源が、原発性腫瘍である場合は、RNA(例えば、mRNA)は、例えば、凍結又は保管されたパラフィン包埋されて固定(例えば、ホルマリン固定)された組織サンプル(例えば、病理医によってガイドされた組織コアサンプル)から抽出することができる。
【0098】
RNA抽出の一般的な方法は、当分野で周知であり、Ausubel et al., ed., Current Protocols in Molecular Biology, John Wiley & Sons, New York 1987-1999を含む分子生物学の標準的な教科書に記載されている。パラフィン包埋組織からのRNA抽出の方法は、例えば、Rupp and Locker, Lab Invest. 56:A67, (1987); and De Andres et al. Biotechniques 18:42-44, (1995)に開示されている。特に、RNAの単離は、商業製造業者、例えば、Qiagen(Valencia, CA)社の精製キット、緩衝液セット、及びプロテアーゼを用いて、商業製造業者の説明書に従って行うことができる。例えば、培養細胞由来の全RNAを、Qiagen社のRNeasyミニカラムを用いて単離することができる。他の市販のRNA単離キットには、MASTERPURE(商標)DNA及びRNA完全精製キット(Epicentre, Madison, Wis.)及びパラフィンブロックRNA単離キット(Ambion, Austin, TX)が含まれる。組織サンプル由来の全RNAは、例えば、RNA Stat−60(Tel-Test, Friendswood, TX)を用いて単離することができる。腫瘍から調製したRNAは、例えば、塩化セシウム密度勾配遠心法によって単離することができる。加えて、多数の組織サンプルを、当業者に周知の技術、例えば、Chomczynskiの単一ステップRNA単離プロセス(米国特許第4,843,155号)などを用いて容易に処理することができる。単離RNAは、限定されるものではないが、PCR分析及びプローブアレイを含むハイブリダイゼーション又は増幅アッセイに用いることができる。RNAレベルを検出する1つの方法では、検出され多遺伝子によってコードされるmRNAにハイブリダイズできる核酸分子(プローブ)に単離RNAを接触させる。核酸分子プローブは、例えば、完全長cDNA、又は本開示の固有遺伝子又は任意のDNA若しくはRNA誘導体にストリンジェントな条件下で特異的にハイブリダイズするのに十分である完全長cDNAの一部、例えば、少なくとも7、15、30、60、100、250、若しくは500のヌクレオチド長のオリゴヌクレオチドとすることができる。mRNAのプローブとのハイブリダイゼーションは、目的の固有遺伝子が発現されていることを示す。一実施形態では、mRNAを固体表面に固定し、例えば、単離mRNAをアガロースゲルに流してこのmRNAをゲルから膜、例えば、ニトロセルロースに移してプローブに接触させる。代替の実施形態では、プローブを固体表面に固定し、mRNAを、例えば、Agilent遺伝子チップアレイのプローブに接触させる。熟練技術者であれば、既知のmRNA検出法を本開示の固有遺伝子の発現レベルの検出に用いるために容易に適応させることができる。
【0099】
サンプルにおける固有遺伝子発現産物のレベルを決定する代替の方法では、例えば、RT−PCR(米国特許第4,683,202号)、リガーゼ連鎖反応(Barany, PNAS USA 88: 189-93, (1991))、自己持続配列複製法(self sustained sequence replication)(Guatelli et al., Proc. Natl. Acad. Sci USA 87: 1874-78, (1990))、転写増幅システム(Kwoh et al., Proc. Natl. Acad. ScL USA 86: 1173-77, (1989))、Qベータレプリカーゼ法(Lizardi et al., Bio/Technology 6:1197, (1988))、ローリングサークル複製法(米国特許第5,854,033号)又は任意の他の核酸増幅法による核酸増幅プロセスが行われ、続いて当業者に周知の技術を用いた増幅分子の検出が行われる。これらの検出スキームは、このような分子が非常に少ない数量で存在する場合には、核酸分子の検出に特に有用である。
【0100】
本開示の特定の態様では、固有遺伝子発現は、定量RT−PCRによって評価される。多種多様なPCR又はQPCRプロトコルが当分野で公知であり、このようなプロトコルは、以下に例示され、表1に列記されている固有遺伝子の検出及び/又は定量に直接使用することもできるし、又はここで説明される組成物を用いて使用するように適応させることもできる。一般に、PCRでは、標的ポリヌクレオチド配列は、少なくとも1つのオリゴヌクレオチドプライマー又は一対のオリゴヌクレオチドプライマーとの反応によって増幅される。プライマー(複数可)は、標的核酸の相補領域にハイブリダイズし、そしてDNAポリメラーゼが、プライマー(複数可)を伸長させて標的配列を増幅させる。ポリメラーゼをベースとする核酸増幅産物を提供するのに十分な条件下で、1つのサイズの核酸断片が、反応産物(増幅産物である標的ポリヌクレオチド配列)の大部分を占める。増幅サイクルを繰り返して、1つの標的ポリヌクレオチド配列の濃度を上昇させる。この反応は、PCRに一般的に使用される任意のサーモサイクラーで行うことができる。しかしながら、好ましくは、リアルタイム蛍光測定性能を有するサイクラー、例えば、SMARTCYCLER(登録商標)(Cepheid,Sunnyvale CA)、ABI PRISM 7700(登録商標)(Applied Biosystems,Foster City,Calif.)、ROTOR−GENE(商標)(Corbett Research,Sydney,Australia)、LIGHTCYCLER(登録商標)(Roche Diagnostics Corp,Indianapolis,Ind.)、ICYCLER(登録商標)(Biorad Laboratories,Hercules,Calif.)、及びMX4000(登録商標)(Stratagene,La Jolla,Calif.)である。
【0101】
本開示の別の実施形態では、マイクロアレイが発現プロファイリングに使用される。マイクロアレイは、様々な実験間での再現性から、特にこの目的に適している。DNAマイクロアレイは、多数の遺伝子の発現レベルを同時測定する1つの方法を提供する。各アレイは、固体支持体に取り付けられた捕捉プローブの再現可能なパターンからなる。標識RNA又はDNAが、アレイ上の相補プローブにハイブリダイズし、次いでレーザー走査によって検出される。アレイ上の各プローブのハイブリダイゼーション強度が決定され、相対遺伝子発現レベルを表す定量値に変換される。例えば、米国特許第6,040,138号、同第5,800,992号、及び同第6,020,135号、同第6,033,860号、及び同第6,344,316号を参照されたい。サンプルにおける多数のRNAの遺伝子発現プロフィールの決定には、高密度オリゴヌクレオチドアレイが特に有用である。
【0102】
好ましい実施形態では、nCounter(登録商標)分析システムを用いて固有遺伝子発現を検出する。nCounter(登録商標)分析システムの原理は、アッセイされる各核酸標的に割り当てられた一意のコードである(それぞれ参照によりそれらの全容が本明細書に組み入れられる、国際特許出願PCT/US2008/059959及びGeiss et al. Nature Biotechnology. 2008. 26(3): 317-325)。このコードは、アッセイされる各標的の一意のバーコードを作成する整列した一連の着色蛍光スポットから構成される。一対のプローブが、各DNA又はRNA標的用に設計され、ビオチン化捕捉プローブ及びレポータープローブが、蛍光バーコードを備えている。このシステムは、本明細書では、ナノレポーターコードシステムとも呼ばれる。
【0103】
特定のレポーター及び捕捉プローブを、各標的について合成する。簡単に述べると、配列特異的DNAオリゴヌクレオチドプローブは、コード特異的レポーター分子に付着する。捕捉プローブは、各標的に対する第2の配列特異的DNAオリゴヌクレオチドをビオチンを含むユニバーサルオリゴヌクレオチド(universal oligonucleotide)に結合することによって形成される。レポータープローブ及び捕捉プローブはすべて、1つのハイブリダイゼーション混合物、すなわち「プローブライブラリー」に集められる。
【0104】
各標的の相対的存在量を、1回の多重ハイブリダイゼーション反応で測定する。サンプルをプローブライブラリーと組み合わせて、溶液中でハイブリダイゼーションさせる。ハイブリダイゼーション後、3部分ハイブリダイズ複合体を、捕捉プローブ及びレポータープローブに存在するユニバーサル配列に相補的なオリゴヌクレオチドに連結された磁気ビーズを用いて2段階処置で精製する。この二重精製プロセスにより、標的特異的プローブが過剰に存在する状態でハイブリダイゼーション反応が完了するが、これらのプローブは最終的に除去され、従ってサンプルの結合及びイメージングは妨げられない。ハイブリダイゼーション後のステップはすべて、カスタム液体処理ロボット(Prep Station,NanoString Technologies)でロボット制御で行われる。
【0105】
精製反応物を、Prep Stationによってサンプルカートリッジの個々のフローセル内に入れ、捕捉プローブを介してストレプトアビジン被覆表面に結合させ、電気泳動させてレポータープローブを伸ばし、そして固定する。処理後、サンプルカートリッジを、完全に自動化されたイメージング/データ収集装置(Digital Analyzer,NanoString Technlogies)に移す。標的の発現レベルを、各サンプルをイメージングしてその標的のコードが検出された回数をカウントすることによって測定する。各サンプルに対して、典型的には、600視野(FOV)がイメージングされ(1376×1024ピクセル)、約10mm
2の結合表面を表す。典型的なイメージング密度では、多重化、入力サンプルの量、及び標的全体の存在度によって、1視野当たり100〜1200のレポーターがカウントされる。データは、各サンプルについて各標的当たりのカウント数を列記する単純な表計算形式で出力される。
【0106】
このシステムは、ナノレポーターと共に使用することができる。ナノレポーターに関するさらなる開示は、それぞれ参照によりそれらの全容が本明細書に組み入れられる、国際公開WO07/076129及びWO07/076132で確認することができる。さらに、用語、核酸プローブ及びナノレポーターは、参照によりその全容が本明細書に組み入れられる国際公開WO2010/019826に開示されている合理的に設計されたもの(例えば、合成配列)を含み得る。
【0108】
多くの場合、例えば、欠測データのアドレス指定、変換、スケーリング、正規化、重み付けなどによって遺伝子発現データを前処理することが有用である。多変量投影法、例えば、主成分分析(PCA)及び部分最小二乗法(PLS)は、いわゆるスケーリング高感度法(scaling sensitive method)と呼ばれる。試験データの種類についての従来の知識及び経験を使用することにより、多変量モデリングの前のデータの質を、スケーリング及び/又は重み付けによって向上させることができる。十分なスケーリング及び/又は重み付けにより、データ内に隠れている重要で興味深い変動を明らかにすることができ、従って後続の多変量モデリングをより効率的にすることができる。スケーリング及び重み付けを使用して、試験したシステムの知識及び経験に基づいてデータを正しい測定基準(correct metric)にし、これによりデータに元々存在するパターンを明らかにする。
【0109】
可能であれば、欠測データ、例えば、列の値における空白を回避するべきである。しかしながら、必要に応じて、このような欠測データを、例えば、列の平均値(「平均値充当」);乱数値(「乱数値充当」);又は主成分分析に基づいた値(「主成分値充当」)で置き換える又は「充当する」ことができる。
【0110】
記述子座標軸の「変換」が有用であり得る。このような変換の例には、正規化及び平均センタリングが含まれる。「正規化」を使用してサンプル間のばらつきを排除することができる。マイクロアレイデータの場合、正規化プロセスは、2つの標識色素の蛍光強度を釣り合わせることによってシステムエラーを排除することを目的とする。色素の偏りは、色素標識効率の差異、熱感度及び光感受性、ならびに2つのチャネルを走査するためのスキャナ設定を含む様々な源から生じ得る。正規化因子を計算するために一般的に使用されている一部の方法は、(i)アレイ上のすべての遺伝子を使用する全正規化;(ii)常に発現されるハウスキーピング/不変遺伝子を使用するハウスキーピング遺伝子の正規化;及び(iii)ハイブリダイゼーション中に添加される既知量の外来制御遺伝子を使用する内部コントロール正規化を含む(Quackenbush Nat. Genet. 32 (Suppl.), 496-501 (2002))。一実施形態では、本明細書に開示される固有遺伝子を正規化してハウスキーピング遺伝子を制御することができる。例えば、参照によりその全容が本明細書に組み入れられる米国特許出願公開第2008/0032293号に記載されているハウスキーピング遺伝子を正規化に使用することができる。例示的なハウスキーピング遺伝子には、MRPL19、PSMC4、SF3A1、PUMl、ACTB、GAPD、GUSB、RPLPO、及びTFRCが含まれる。当業者であれば、本明細書に開示される方法が、特定のハウスキーピング遺伝子に対する正規化に縛られるものではなく、当分野で公知の任意の適切なハウスキーピング遺伝子(複数可)を使用できることを理解されよう。
【0111】
多数の正規化手法が可能であり、このよう正規化手法は、分析における任意のいくつかの点で適用できる場合が多い。一実施形態では、マイクロアレイデータは、LOWESS法を用いて正規化され、このLOWESS法は、全局所的重み付け散布図平滑正規化関数(global locally weighted scatterplot smoothing normalization function)である。別の実施形態では、qPCRデータは、複数のハウスキーピング遺伝子のセットの幾何平均に対して正規化される。
【0112】
解釈を簡単にするために、「平均センタリング」を使用することもできる。通常、各記述子に対して、すべてのサンプルの記述子の平均値が減算される。この方法では、記述子の平均値が、原点に一致し、すべての記述子が、0に「中心」が合わされている。「単位分散スケーリング(unit variance scaling)」では、データを、同等の分散にスケーリングすることができる。通常、各記述子の値は、1/StDevによってスケーリングされ、StDevは、すべてのサンプルに対する記述子の標準偏差である。「パレートスケーリング」は、ある意味で、平均センタリングと単位分散スケーリングとの間の中間である。パレートスケーリングでは、各記述子の値は、l/sqrt(StDev)によってスケーリングされ、StDevは、すべてのサンプルに対する記述子の標準偏差である。この方法では、各記述子は、その最初の標準偏差に数値的に等しい分散を有する。パレートスケーリングは、例えば、生データ又は平均センタリングデータに対して行うことができる。
【0113】
データが正のスキューを有する場合及び/又はデータが広範囲、例えば、数桁に跨る場合に解釈を容易にするために「対数スケーリング」を使用することができる。通常、各記述子に対して、値は、その値の対数に置き換えられる。「同等範囲スケーリング」では、各記述子は、すべてのサンプルの記述子の範囲によって除算される。この方法では、すべての記述子は、同じ範囲、すなわち1を有する。しかしながら、この方法は、外れ点の存在に影響される。「自動スケーリング」では、各データベクトルは、平均センタリングされ、単位分散スケーリングされる。この技術は、各記述子が等しく重み付けされ、大きい値と小さい値が等しい重要性で扱われるため、非常に有用である。これは、非常に低いが検出可能なレベルで発現される遺伝子にとって重要となることがある。
【0114】
一実施形態では、1つ以上の試験サンプルに関するデータが収集され、これらのデータが、本明細書で説明されるPAM50分類モデルを用いて分類される。複数の分析からのデータを比較する(例えば、1つ以上の試験サンプルの発現プロフィールを、独立した試験で収集されて分析されたサンプルから構築されたセントロイドと比較する)場合、これらのデータセット全体に亘ってデータを正規化する必要がある。一部の実施形態では、これらのデータセットを一緒にするために距離重み付け区別(DWD)が使用される(参照によりその全容が本明細書に組み入れられるBenito et al. (2004) Bioinformatics 20(1): 105-114)。DWDは、別々のデータセットに存在する系統的偏りを特定して、全体的に調整してこれらの偏りを補正することができる多変量解析ツールであり;本質的には、各別々のデータセットは、データポイントの多次元クラウド(multi-dimensional cloud)であり、DWDは、2つのポイントクラウドをとり、一方が他方により最適に重なるようにシフトさせる。
【0115】
本明細書で説明される方法は、この方法を実施することができ、かつ/又は結果を記録することができる任意の装置を用いて実施することができ、かつ/又は結果を記録することができる。使用できる装置の例には、限定されるものではないが、あらゆるタイプのコンピュータを含む電子計算装置が含まれ得る。本明細書で説明される方法が、コンピュータで実施され、かつ/又は記録される場合は、この方法のステップを実施するためのコンピュータを構成するために使用できるコンピュータプログラムを、このコンピュータプログラムを保存できる任意のコンピュータ可読媒体に保存することができる。使用できるコンピュータ可読媒体の例には、限定されるものではないが、ディスケット、CD−ROM、DVD、ROM、RAM、ならびに他のメモリ及びコンピュータ記憶装置が含まれる。この方法のステップを実施でき、かつ/又は結果を記録するためのコンピュータを構成するために使用できるコンピュータプログラムは、電子ネットワーク、例えば、インターネット、イントラネット、又は他のネットワークを介して提供することもできる。
【0117】
固有サブタイプの文脈内での乳癌の転帰、及び任意選択の他の臨床的変数を予測する方法が本明細書で提供される。転帰とは、全生存率又は疾患特異的生存率、イベントフリー生存率、又は特定の処置若しくは療法に応じた転帰のことである。特に、この方法は、長期に亘る無疾患生存確率を予測するために使用することができる。「乳癌患者の生存確率の予測」とは、原因となる乳癌の結果として患者が死亡するリスクを評価することである。「長期に亘る無疾患生存率」とは、最初の診断又は処置から少なくとも5年、少なくとも10年又はより長い年数の期間内に原因となる乳癌で患者が死亡しないし、患者が乳癌を再発もしないことを意味する。
【0118】
一実施形態では、転帰は、サブタイプに従った対象の分類に基づいて予測される。この分類は、表1に列記されている固有遺伝子のリストを用いた発現プロファイリングに基づいている。サブタイプ割り当てを行うのに加えて、PAM50バイオインフォマティクスモデルは、試験サンプルの4つすべてのサブタイプに対する類似性の測定値を提供し、この測定値は、疾患状態及び処置選択肢にかかわらず、あらゆる患者集団にも使用できる再発リスク(ROR)スコアに変換される。固有サブタイプ及びRORはまた、例えば、ネオアジュバントのタキサン及びタキサン又はタキサン誘導体化学療法(参照によりその全容が本明細書に組み入れられるRouzier et al., J Clin Oncol 23:8331-9 (2005))で処置された女性における病理学的完全奏効の予測の値も提供する。したがって、本開示の様々な実施形態では、再発リスク(ROR)モデルを使用して転帰を予測する。これらのリスクモデルを使用することにより、対象を、低リスク、中リスク、及び高リスク再発群に階層化することができる。RORの計算は、処置の決定を導き、かつ/又は療法に対する応答を監視するために予後情報を提供することができる。
【0119】
本明細書で説明される一部の実施形態では、PAM50によって決定された固有サブタイプ及び/又は他の臨床パラメータの予後成績を、コックス比例ハザードモデル解析を利用して評価され、この解析は、ハザード比及びその信頼区間の推定を提供する生存データの回帰法である。このコックスモデルは、患者の生存と特定の変数との間の関係を利用する周知の統計技術である。この統計方法は、個体の予後変数(例えば、本明細書で説明される追加の臨床因子を有する、又は有しない固有遺伝子発現プロフィール)が与えられた個体のハザード(すなわち、リスク)の推定を可能にする。「ハザード比」とは、特定の予後変数を示す患者のいずれかの時点での死のリスクのことである。一般的には、Spruance et al., Antimicrob. Agents & Chemo. 48:2787-92 (2004)を参照されたい。
【0120】
本明細書で説明されるPAM50分類モデルは、サブタイプ距離(又は相関)のみを用いて、又は上記説明された臨床的変数と共にサブタイプ距離を用いて再発のリスクについて訓練することができる。一実施形態では、試験サンプルのリスクスコアを、以下の式を用いて固有サブタイプ距離のみで計算することができる。
【0121】
ROR=0.05
*基底+0.1l
*Her2+−0.25
*LumA+0.07
*LumB+−0.1l
*正常
式中、変数「基底」、「Her2」、「LumA」、「LumB」、及び「正常」は、試験サンプルからの発現プロフィールが、Gene Expression Omnibus(GEO)に預けられた遺伝子発現データを用いて作成されたセントロイドに対して比較されたときのそれぞれのクラシファイアのセントロイドに対する距離である。
【0122】
リスクスコアは、同様に、以下の式を用いて、乳癌サブタイプと臨床的変数である腫瘍サイズ(T)とリンパ節状態(N)の組み合わせを用いて計算することができる。
ROR(完全)=0.05
*基底+0.1
*Her2+−0.19
*LumA+0.05
*LumB+−0.09
*正常+0.16
*T+0.08
*N
同様に、試験発現プロフィールが、アクセッション番号GSE2845としてGEOに預けられた遺伝子発現データを用いて作成されたセントロイドに対して比較されたときのものである。
【0123】
なお別の実施形態では、試験サンプルのリスクスコアは、以下の式を用いて固有サブタイプ距離のみで計算される。
【0124】
ROR−S=0.05
*基底+0.12
*Her2+−0.34
*LumA+0.0.23
*LumB
式中、変数「基底」、「Her2」、「LumA」、及び「LumB」は、上記説明の通りであり、試験発現プロフィールが、アクセッション番号GSE2845としてGEOに預けられた遺伝子発現データを用いて作成されたセントロイドに対して比較される。なお別の実施形態では、リスクスコアは、以下の式(変数は上記説明のとおりである)を用いて、乳癌サブタイプと臨床的変数である腫瘍サイズ(T)との組み合わせを用いて計算することもできる:
ROR−C=0.05
*基底+0.11
*Her2+−0.23
*LumA+0.09
*LumB+0.17
*T。
【0125】
なお別の実施形態では、試験サンプルのリスクスコアは、以下の式を用いて増殖シグネチャー(「Prolif」)と組み合わせて固有サブタイプ距離を使用して計算される。
【0126】
ROR−P=−0.001
*基底+0.7
*Her2+−0.95
*LumA+0.49
*LumB+0.34
*Prolif
式中、変数「基底」、「Her2」、「LumA」、「LumB」、及び「Prolif」は、上記説明の通りであり、試験発現プロフィールが、アクセッション番号GSE2845としてGEOに預けられた遺伝子発現データを用いて作成されたセントロイドに対して比較される。なお別の実施形態では、リスクスコアは、以下の式(変数は上記説明のとおりである)を用いて、乳癌サブタイプ、増殖シグネチャー及び臨床的変数である腫瘍サイズ(T)との組み合わせを用いて計算することもできる:
ROR−PT=−0.001
*基底+0.73
*Her2+−0.9
*LumA+0.05
*LumB+0.13
*T+0.33
*Prolif。
【0128】
エストロゲン(ER)、プロゲステロン(PgR)、HER2、及びKi67の免疫組織化学を、色原体として3,3’−ジアミノベンジジンを用いる標準的なストレプトアビジン−ビオチン複合体法で連続切片に対して同時に行った。ER、PgR、及びHER2の解釈のための染色を、既に説明したように行うことができるが(Cheang et al., Clin Cancer Res. 2008;14(5):1368-1376)、当分野で公知の任意の方法を使用することもできる。
【0129】
例えば、Ki67抗体(クローンSP6;ThermoScientific,Fremont,CA)を1:200の希釈となるように添加して32分間インキュベートし、次いでVentana Benchmark自動免疫染色装置(Ventana,Tucson AZ)の標準的なCell Conditioner 1(商品名CC1の緩衝液)プロトコルに従って98℃で30分間インキュベートした。ER抗体(クローンSP1;ThermoFisher Scientific,Fremont CA)を、1:250の希釈で使用し、10分間インキュベートし、8分間のマイクロウエーブ後、抗原を10mMのクエン酸ナトリウム(pH 6.0)で回収することができる。すぐに使用できるPR抗体(クローン1E2;Ventana)を、上記のようにCC1プロトコルに従って使用することができる。HER2染色を、スチーマで30分間、95℃で加熱して0.05Mのトリス緩衝液(pH 10.0)で抗原を回収した後に、1:100に希釈したSP3抗体(ThermoFisher Scientific)で行うことができる。HER2蛍光in situハイブリダイゼーション(FISH)アッセイでは、製造業者の取扱説明書に従うが、既に説明したように前処置及びハイブリダイゼーションに変更を加えて、PathVysion HER−2 DNAプローブキット(Abbott Molecular,Abbott Park,IL)を使用することにより、スライドを、プローブを用いてLSI(領域特異的プローブ(locus-specific identifier))HER2/neu及び動原体17にハイブリダイズさせることができる(Brown LA, Irving J, Parker R, et al. Amplification of EMSY, a novel oncogene on 11q13, in high grade ovarian surface epithelial carcinomas. Gynecol Oncol. 2006;100(2):264-270)。次いで、スライドを4’,6−ジアミジノ−2−フェニルインドールで対比染色することができ、染色された物質を、Zeiss Axioplan落射蛍光顕微鏡で可視化し、そしてMetafer画像収集システム(Metasystems,Altlussheim,Germany)でシグナルを分析した。次いで、免疫組織化学アッセイによるバイオマーカーの発現に2人の病理学者がスコアを付けることができ、これらの病理学者は、臨床病理学的特性及び転帰について盲検化され、他の乳癌のコホートに対して開発されたバイオマーカー発現レベルについての、既に確立されて公表された基準を使用した。
【0130】
既に説明したように、腫瘍核の1%を超えて免疫染色が観察された場合、腫瘍は、ER又はPRに対して陽性であると見なされた。免疫染色が、HercepTest基準に従って3+のスコアが付けられた場合は、腫瘍は、HER2に対して陽性であると見なされ、蛍光in situハイブリダイゼーションの増幅比2.0以上が、免疫組織化学的に曖昧な腫瘍(2+のスコア)を分離するために使用されるカットポイントである(Yaziji, et al., JAMA, 291(16):1972?1977 (2004))。Ki67には、2人の病理学者によって、陽性免疫染色がバックグラウンドレベルよりも高い腫瘍細胞核の割合について視覚的にスコアが付けられた。
【0131】
他の方法を用いても、サブタイプを検出することができる。これらの技術には、ELISA、ウエスタンブロット、ノーザンブロット、又はFACS分析が含まれる。
【0133】
本開示は、乳癌固有サブタイプの分類、及び/又はアントラサイクリンにより応答する乳癌を識別する予後情報の提供に有用なキットについて述べる。このようなキットは、表1に列記されている固有遺伝子に特異的な捕捉プローブ及び/又はプライマーのセットを含む。キットは、コンピュータ可読媒体をさらに含み得る。
【0134】
本開示の一実施形態では、捕捉プローブは、アレイ上に固定される。「アレイ」とは、ペプチド又は核酸プローブが取り付けられた固体支持体又は基板のことである。アレイは、典型的には、異なる既知の位置にある基板表面に結合された複数の異なる捕捉プローブを備えている。本開示のアレイは、固有遺伝子発現産物に特異的に結合できる複数の捕捉プローブを有する基板を含む。基板上の捕捉プローブの数は、アレイの意図する目的によって異なる。アレイは、低密度アレイであっても高密度アレイであっても良く、4以上、8以上、12以上、16以上、又は32以上のアドレスを備えることができるが、最小限でも、表1に列記されている50の固有遺伝子に対する捕捉プローブを備える。
【0135】
機械合成法を用いるこのようなアレイの合成技術は、例えば、参照によりその全容が本明細書に組み入れられる米国特許第5,384,261号に記載されている。アレイは、実質的にあらゆる形状の表面、又は複数の表面にさえも形成することができる。アレイは、ビーズ、ゲル、ポリマー表面、ファイバー、例えば、光ファイバー、ガラス、又は任意の他の適切な基板上のプローブ(例えば、核酸結合プローブ)とすることができ、参照によりそれらの全容が本明細書に組み入れられる、米国特許第5,770,358号、同第5,789,162号、同第5,708,153号、同第6,040,193号、及び同第5,800,992号を参照されたい。アレイは、デバイス上で診断又は他の操作ができるようにパッケージングすることができる。例えば、参照により本明細書に組み入れられる、米国特許第5,856,174号及び同第5,922,591号を参照されたい。
【0136】
別の実施形態では、キットは、表1に列記されている固有遺伝子のそれぞれの検出及び/又は定量に十分なオリゴヌクレオチドプライマーのセットを含む。オリゴヌクレオチドプライマーは、凍結乾燥形態又は水で戻す形態で提供しても良いし、或いはヌクレオチド配列のセットとして提供しても良い。一実施形態では、プライマーは、マイクロプレート形式で提供され、各プライマーのセットが、マイクロプレートの1つのウェル(又は、複製の場合には複数のウェル)を占有する。マイクロプレートは、以下に説明される1つ以上のハウスキーピング遺伝子の検出に十分なプライマーをさらに含み得る。キットは、表1に列記されている遺伝子の発現産物の増幅に十分な試薬及び取扱説明書をさらに含み得る。
【0137】
例えば、比較、精査、回収、及び/又は変更のために容易なアクセスを促進するために、分子シグネチャ/発現プロフィールが、典型的には、データベースに記録される。最も典型的には、データベースは、計算機によってアクセス可能なリレーショナルデータベースであるが、他の形式、例えば、写真、アナログ又はデジタル画像読み出し情報などのような手動でアクセス可能な発現プロフィールのインデックスファイルも使用することができる。最初に記録される発現パターンの性質がアナログ又はデジタルであるかにかかわらず、発現パターン、発現プロフィール(集合的発現パターン)、及び分子シグネチャ(相関した発現パターン)が、デジタルで記録され、データベースを介してアクセスされる。典型的には、データベースは、中心施設でコンパイルされて維持され、構内及び/又は遠隔からアクセス可能である。
【実施例】
【0138】
実施例1.増殖シグネチャーは、乳癌の毎週のアジュバントパクリタキセルに対する応答を予測する
患者、サンプル及び臨床データ
【0139】
GEICAM/9906トライアルは、リンパ節陽性乳癌における、6サイクルのフルオロウラシル、エピルビシン、及びCシクロホスファミド単独(FEC、対照治験群)対4サイクルのFECとそれに続く、8回の100mg/m
2のパクリタキセルの1週間サイクル(FEC−P、実験的治験群)を比較する、アジュバントの前向き多施設無作為化第3相試験(n=1,246対象)であった。GEICAM/9906臨床試験の主要な評価項目は、無病生存率であった。副次的評価項目は:(a)全生存;(b)分子/ゲノムマーカーの予後及び予測値、及び(c)安全性であった。試験を、すべての参加研究機関及びSpanish Health Authorityの倫理委員会によって承認されたヘルシンキ宣言に従って実施し、そして、それはwww.clinicaltrials.gov(識別子コード:NCT00129922)に登録された。すべての患者に、処置の無作為化及び分子分析に関して書面によるインフォームドコンセントを提供した。試験設計と患者の特性の詳細は、以前に報告した(Martin et al., J Natl Cancer Inst 100: 805 ? 814, 2008; Martin et al., Breast Cancer Res Treat 123:149?157, 2010)。ホルマリン固定、パラフィン包埋腫瘍ブロックは、825人の患者で入手可能であった。それぞれのFFPE組織ブロックからのH&E切片は、GEICAMの中央検査室の病理学者によって審査された。少なくとも2つの腫瘍コアを、1mmのコアパンチを使用して、代表的な侵襲性乳癌を含む領域から抽出した。FFPE組織からのRNA抽出及びRT−qPCR PAM50アッセイの詳細なプロトコールは、以前に記載した(Parker et al., J Clin Oncol 27:1160?1167, 2009)。
【0140】
PAM50サブタイプの分類
【0141】
サンプルは、以前に記載したRT−qPCRアッセイを使用してプロフィールを示し、そして、サブタイプ予測のための臨床アルゴリズムを使用して分析した遺伝子発現であった(Parker et al., J Clin Oncol 27:1160?1167, 2009; Arup Laboratories: PAM50 Breast Cancer Intrinsic Classifier Information. http://www.aruplab.com/ Lab-Tests/ General-Oncology/ PAM50/ index.jsp)。サンプルを、以下の固有サブタイプカテゴリ:管腔A、管腔B、HER2高発現、基底様及び正常様、に割り当てた。正常様に分類されたサンプルは、腫瘍標本内の正常乳房組織又は間質の混入によりもたらされる分類の誤りの可能性のために、更なる分析から排除した(Elloumi et al., BMC Med Genomics 4:54, 2011)。サブタイプ分類法に加えて、PAM50増殖スコアを、以前に記載した11個の遺伝子シグネチャー(BIRC5、CCNB1、CDC20、CDCA1、CEP55、KNTC2、MKI67、PTTG1、RRM2、TYMS、UBE2C)を使用して計算した(Nielsen et al., Clin Cancer Res 16(21):5222-32, 2010)。増殖の有意を、四分位への分類法を使用し、且つ、連続的変数としての増殖スコアを使用して評価した。
【0142】
免疫組織化学的(IHC)Ki−67定量化
【0143】
Ki−67状態を、中央検査室において、Clone MIB1抗体(DakoCytomation, Glostrup, Denmark)を使用した免疫組織化学法によってパラフィン切片上で評価した。
Ki67スコアは核染色で総数の腫瘍細胞のパーセンテージに規定された。
【0144】
統計解析
【0145】
この分析には、既定義集団における、あらかじめ指定された試験目的及びあらかじめ指定された検査室アッセイを伴った前向き−後向きデザイン(無作為化前向き臨床研究の後向き分析)がある。試験のあらかじめ指定された主要な目的は、PAM50サブタイプ及び/又はPAM50増殖スコアがOS及び/又はパクリタキセル利益の予測に関連しているか否か決定することであった。カプラン−マイヤー法を、全生存(OS)を推定するのに使用し、そして、ログランク検定を、群間のOSを比較するのに使用した。一変量及び多変量コックス比例ハザードモデルを、生存とそれぞれの変数との関連性、及び処置とPAM50サブタイプと増殖との相互作用を調べるために使用した。結果を、腫瘍マーカー予後試験(REMARK)基準に関する報告提言に従って提示する(McShane et al., J Clin Oncol 23:9067?9072, 2005)。
【0146】
患者の人口統計
【0147】
腫瘍ブロックは、825人の患者について入手可能であり、PAM50ゲノムプロファイリングは、サイン済みのインフォームドコンセントが得られた患者の820個のサンプル(99.4%)で成功し(
図5)、そしてそれは、GEICAM/9906トライアルの本来の1,246サンプルセットの66%に相当する(Martin et al., J Natl Cancer Inst 100: 805-814, 2008)。この従属試験に加えられた患者の人口統計及び予後像、並びに10年OSは、全体的な調査集団のものと同様であった。この試験に加えられた患者の臨床−病態学的特徴の分布を、表3に示す。
【0148】
表3.患者の臨床−病態学的特徴
【表3】
【0149】
全生存転帰
【0150】
中央値8.7年の追跡調査で、FEC−P治験群のOSは、FEC治験群と比較して有意に優れており(OSのハザード比[HR]0.693、95%信頼区間[CI]0.693〜0.927、p=0.013)、それぞれ70.90%と78.44%のFEC及びFEC−P治験群における10年OS比を有する(
図1A)。一変量解析法により、以下の変数:閉経状態、結節状態、組織病理学的グレード、腫瘍の大きさ、エストロゲン受容体(ER)状態、プロゲステロン受容体(PR)状態、Ki67、PAM50サブタイプ、及び増殖スコア、OSに有意に関連していることを明らかにした。予想されるように、PAM50管腔A腫瘍が、最も良い転帰(10年で84.04%のOS)を示し、管腔B(70.75%)、基底様(70.42%)、そして、HER2高発現(65.19%)がそれに続いた(
図1B)。管腔A腫瘍と比較して、管腔B、HER2高発現及び基底様腫瘍は、それぞれ1.99(1.35〜2.97)、2.60(1.52〜4.40)、及び2.62(1.74〜3.95)のOSに関するHRを示した。興味深いことに、増殖スコアとKi−67がOSと有意に関連しているのがわかったが(
図2)、四分位分布による曲線の分離で、IHCによってKi−67と比較した増殖スコアをもっと使用することがわかった。
【0151】
評価した変数の中で、腫瘍の大きさ、結節状態、及び増殖シグネチャーは、有意(p=0.067)な傾向を示している処置治験群を用いた多変量解析におおいてOSの独立予測因子であることがわかった(表4)。注目すべきことに、IHCによるKi−67及び組織学的グレードが、増殖シグネチャーによって提供される情報に取って代わった。
【0152】
表4.予測変数
【表4】
【0153】
PAM50サブタイプと増殖スコアにおけるパクリタキセルの効果
【0154】
FEC対FEC−Pで処置を比較するOSのカプラン−マイヤープロットを、PAM50アッセイで規定された各群カテゴリで評価した。個々のPAM50サブタイプに、パクリタキセルの有効性の予兆は見られなかった。その一方、パクリタキセルからの利益は、腫瘍が低い増殖スコア(最も低い四分位の中のHR=0.23、CI 0.09〜0.57、p<0.001)を有する患者で観察され、71.24%から94.42%への10年OSの改善を示した(
図3A)。増殖スコアの下位四分位群(n=181)の中のPAM50サブタイプ分布は、以下のとおりであった:管腔A 76.24%、管腔B 6.63%、HER2高発現 17.13%及び基底様 0%。個別に評価したとき又は一群の中に組み合わせたとき、パクリタキセルの利益は他の増殖スコア群内で観察されず(
図3B)、そこで、OSに関する一変量HRは0.85であった(CI 0.62〜1.16)。増殖スコアを三分位を使用して評価したときに、同様のデータを得た。
【0155】
増殖スコアとパクリタキセル処置の利益の相関
【0156】
パクリタキセルの利益の程度と増殖スコアとの相関の統計的妥当性を試験するために、増殖スコアとパクリタキセル処置との統計的相互作用の形式テストを実施した。パクリタキセル処置と増殖スコアを含むCoxモデルの多変量解析では、相互作用に関する試験により、統計的に有意であることがわかった(連続的変量としてp=0.006;四分位式を使用した群カテゴリとしてp=0.019)。加えて、すべての臨床−病理的変数について調整された、増殖スコアとパクリタキセル処置との相互作用に関する多変量モデルは、増殖スコアとパクリタキセル処置との相互作用の持続する有意性を示した(表5)。
【0157】
表5.多変量コックス比例ハザードモデルにおける増殖シグネチャーとパクリタキセル処置との相互作用
【表5】
【0158】
連続関数としての増殖スコアに対する相関における、パクリタキセル処置による利益の程度について調査するために、OSの見込みを、両治験群に関する増殖スコアの一次関数として当てはめた。予想されるとおり、パクリタキセルの利益の程度は、増殖スコアが減少するに従って、連続的に増加するように見えた(
図4及び表6)。
【0159】
表6.低リスク群内のFEC−T対FECのハザード比
【表6】
【0160】
パクリタキセルの利益と臨床−病理的変数
【0161】
週1回のパクリタキセルに対する応答の他の予測因子を同定するために、パクリタキセル処置の、臨床−病理的変数(年齢、閉経状態、組織学的グレード、腫瘍の大きさ、ER[IHC]状態、PR[IHC]状態、Ki−67[IHC]及びHER2状態[IHC/CISH])との相互作用もまた評価した。これらの変数と処置との間には、有意な相互作用は見られなかった。
【0162】
考察
【0163】
個人化された医療の時代において、乳癌患者について臨床的に有用な予後及び予兆の情報を提供することを可能にし得る新たなツールが必要である。2つのゲノムアッセイ(OncotypeDX及びMammaprint)では、早期の乳癌における予測情報を提供し(Van de Vijver et al., N Engl J Med 347:1999-2009, 2002; Buyse et al., J Natl Cancer Inst 98: 1183 - 92, 2006; Paik et al., N Engl J Med 351:2817-26, 2004)、そして、OncotypeDXでは、ER陽性疾患における、アジュバント化学療法(シクロホスファミド−メトトレキサート−フルオロウラシル(CMF)又はシクロホスファミドドキソルビシン(Adriamycin(登録商標))−フルオロウラシル(CAF))からの利益に関する予兆情報を提供する(Paik et al., J Clin Oncol 24:3726-34, 2006; Albain et al., Lancet Oncol 11: 55-65, 2010)。しかしながら、これらと他のアッセイの現代のタキサン投薬計画に処置利益を予測する、及び/又は特異的薬剤に利益を予測する能力は不明瞭である。
【0164】
アントラサイクリンベースの化学療法に週1回のアジュバントであるパクリタキセルを追加する利益はわずかであるという報告が以前にあった(De Laurentiis et al., J Clin Oncol 26:44-53, 2008; Nowak et al., Lancet Oncol 5: 372-80, 2004; Tang, Cancer Investigation 27:489-495, 2009; Bria et al., Cancer 106: 2337-2344, 2006)。これにより、患者がこの薬物及びスケジュールの利益を最も多く得るという確認は、正当であると思われる。従来の臨床−病理的指標(すなわち、年齢、腫瘍の大きさ、陽性結節の数、ER状態、PR状態、及びHER2状態)並びにPAM50固有サブタイプが、アジュバントであるパクリタキセルの有効性の予兆であると分からなかった。
【0165】
増殖の計測は、特に初期のER陽性乳癌において予後に使用される試験の重要な構成要素である。増殖はまた、有糸分裂像をカウントするか(すなわち、変法ノッティンガム−ブルーム−リチャードソンスコア)又は例えば、Ki−67などの細胞周期調整バイオマーカーを使用した分裂指数を明らかにすることによって(Simpson et al., J Clin Oncol. 18(10):2059-69, 2000; Meyer et al., Mod Pathol. 2005 Aug;18(8):1067-78. Erratum in: Mod Pathol 18(12):1649, 2005; Dowsett et al., J Natl Cancer Inst 99(2):167-70, 2007)、組織学的グレードづけに組み入れられる。この試験では、増殖スコアシグネチャー(11種類の増殖関連遺伝子の平均発現値である)が、アジュバント設定の週1回のパクリタキセルの利益に関して予測的であることがわかった。このシグネチャーのあらかじめ指定されたカットオフをここでのGEICAM/9906トライアルで試験しなかったが、下位四分位群内のOSに関するHRは、注目に値した(HR=0.232、p=0.002)。加えて、他のすべての臨床−病理的変数が考慮されたときでさえ、パクリタキセル処置と増殖スコアとの相互作用の試験は、統計的に有意であった。興味深いことに、IHCによる増殖関連バイオマーカーであるKi−67は、中央病理検査室において評価されたにもかかわらず、パクリタキセルの利益を予測することはなかったが、11種類の遺伝子増殖スコア(11-gene proliferation score)は有意であった。