(58)【調査した分野】(Int.Cl.,DB名)
生物学的サンプルにおける、4つ以上の遺伝子群のそれぞれからの少なくとも1つのRNA転写物のレベルを、前立腺癌患者についての臨床転帰の尤度の指標とする方法であって、
前記患者から採取した癌細胞を含む前記生物学的サンプルにおいて、前記4つ以上の遺伝子群のそれぞれからの少なくとも1つのRNA転写物の前記レベルを決定するステップであって、ここで、前記少なくとも1つのRNA転写物および前記4つ以上の遺伝子群が、
a)細胞構成遺伝子群:BIN1、IGF1、C7、GSN、DES、TGFB1I1、TPM2、VCL、FLNC、ITGA7、COL6A1、PPP1R12A、GSTM1、GSTM2、PAGE4、PPAP2B、SRD5A2、PRKCA、IGFBP6、GPM6B、OLFML3、およびHLF;
b)基底上皮遺伝子群:CYP3A5、KRT15、KRT5、LAMB3、およびSDC1;
c)ストレス応答遺伝子群:DUSP1、EGFR1、FOS、JUN、EGR3、GADD45B、およびZFP36;
d)アンドロゲン遺伝子群:SRD5A2、FAM13C、KLK2、およびAZGP1;
e)間質反応遺伝子群:ASPN、SFRP4、BGN、THBS2、INHBA、COL1A1、COL3A1、COL1A2、SPARC、COL8A1、COL4A1、FN1、FAP、およびCOL5A2;ならびに
f)増殖遺伝子群:CDC20、TPX2、UBE2T、MYBL2、およびCDKN2C
から選択されるステップ;
(1)前記4つ以上の遺伝子群のそれぞれからの前記少なくとも1つのRNA転写物の発現レベルを正規化すること、(2)臨床転帰に対するそれらの寄与により、前記4つ以上の遺伝子群のそれぞれからの前記少なくとも1つのRNA転写物を重み付けすることおよび/または前記4つ以上の遺伝子群を重み付けすること、(3)前記4つ以上の遺伝子群のそれぞれに属する前記少なくとも1つのRNA転写物の正規化発現レベルをグループ化することによって、前記患者の定量スコアを算出するステップ
を含み、ここで、
前記患者の臨床転帰の尤度が、前記定量スコアに基づいて予測される、方法。
前記生物学的サンプルにおいて、少なくとも1つのRNA転写物のレベルをさらに決定するステップであって、ここで、少なくとも1つのRNA転写物が、STAT5B、NFAT5、ANPEP、IGFBP2、SLC22A3、ERG、AR、SRD5A2、GSTM1、およびGSTM2から選択されるステップ;
該少なくとも1つのRNA転写物のレベルを正規化するステップ;
前記臨床転帰に対するその寄与により、前記少なくとも1つのRNA転写物のレベルを重み付けするステップ;および
前記4つ以上の遺伝子群のそれぞれからの前記少なくとも1つのRNA転写物の前記正規化発現レベルと、STAT5B、NFAT5、ANPEP、IGFBP2、SLC22A3、ERG、AR、SRD5A2、GSTM1、およびGSTM2から選択される該少なくとも1つのRNA転写物の正規化発現レベルとに基づいて定量スコアを算出するステップ
をさらに含む、請求項1に記載の方法。
前記間質反応遺伝子群から、少なくとも3つのRNA転写物のレベルを決定し、前記間質反応遺伝子群が、ASPN、BGN、COL1A1、SPARC、FN1、COL3A1、COL4A1、INHBA、THBS2、およびSFRP4を含む、請求項1〜7のいずれか1項に記載の方法。
前記アンドロゲン遺伝子群から、少なくとも1つのRNA転写物のレベルを決定し、前記アンドロゲン遺伝子群が、FAM13C、KLK2、AZGP1、およびSRD5A2を含む、請求項1〜8のいずれか1項に記載の方法。
前記臨床転帰の尤度が、悪性病理の尤度であるか、非器官限局性疾患の尤度であるか、高グレード疾患の尤度であるか、あるいは高グレードまたは非器官限局性疾患の尤度である、請求項1〜4または8〜16のいずれか1項に記載の方法。
生物学的サンプルにおける、細胞構成遺伝子群、アンドロゲン遺伝子群、間質反応遺伝子群、および増殖遺伝子群からなる遺伝子群のそれぞれからの少なくとも1つのRNA転写物のレベルを、前立腺癌患者の臨床転帰の尤度の指標とする方法であって、
前記患者から採取した癌細胞を含む前記生物学的サンプルにおいて、前記遺伝子群のそれぞれからの前記少なくとも1つのRNA転写物の前記レベルを決定するステップであって、ここで、前記少なくとも1つのRNA転写物が、
間質反応遺伝子群:BGN、COL1A1、およびSFRP4;
細胞構成遺伝子群:FLNC、GSN、GSTM2、およびTPM2;
アンドロゲン遺伝子群:AZGP1、KLK2、FAM13C1、およびSRD5A2;ならびに
増殖遺伝子群:TPX2
から選択されるステップ、
前記遺伝子群のそれぞれからの前記少なくとも1つのRNA転写物のレベルを正規化することにより、前記遺伝子群のそれぞれからの前記少なくとも1つのRNA転写物の正規化発現量を取得するステップ、
臨床転帰に対するそれらの寄与により、前記遺伝子群のそれぞれからの1つ以上のRNA転写物の正規化発現量を重み付けすることによって、患者についての前記遺伝子群に対する1つ以上の定量スコアを算出するステップ、
前記正規化発現量をリファレンス前立腺癌サンプルの遺伝子発現データと比較するステップ、
を含み、ここで、
前記少なくとも1つのRNA転写物の1つ以上の定量スコアに基づいて、前記患者における悪性病理の尤度、非器官限局性疾患の尤度、高グレード疾患の尤度、あるいは高グレードまたは非器官限局性疾患の尤度の1つ以上の尤度が予測され、
BGN、COL1A1、SFRP4、およびTPX2の正規化発現量は、悪性病理の尤度、非器官限局性疾患の尤度、高グレード疾患の尤度、あるいは高グレードまたは非器官限局性疾患の尤度と正に相関しており、
FLNC、GSN、GSTM2、TPM2、AZGP1、KLK2、FAM13C1、およびSRD5A2の正規化発現量は、悪性病理の尤度、非器官限局性疾患の尤度、高グレード疾患の尤度、あるいは高グレードまたは非器官限局性疾患の尤度と負に相関している、方法。
BGN、COL1A1、SFRP4、FLNC、GSN、GSTM2、TPM2、AZGP1、KLK2、FAM13C1、SRD5A2、およびTPX2の前記RNA転写物のレベルを決定する、請求項1〜24のいずれか1項に記載の方法。
BGN、COL1A1、SFRP4、FLNC、GSN、TPM2、GSTM2、FAM13C、KLK2、AZGP1、SRD5A2およびTPX2の正規化発現量が、ARF1、ATP5E、CLTC、GPS1およびPGK1の発現レベルに対して正規化される、請求項26〜30のいずれか1項に記載の方法。
【発明を実施するための形態】
【0015】
定義
別途定義がない限り、本願明細書に用いられている技術用語および科学用語は、本発明の帰する当業者に一般的に理解されているのと同じ意味を有する。Singleton et al.,Dictionary of Microbiology and Molecular Biology 2nd ed.,J.Wiley & Sons(New York,NY 1994),and March,Advanced Organic Chemistry Reactions,Mechanisms and Structure 4th ed.,John Wiley & Sons(New York,NY 1992)は、当業者にとって、本出願に用いられている多くの用語に対する一般的指針となる。
【0016】
当業者であれば、本明細書に記述されている方法および材料と類似もしくは等価で、かつ本発明の実施に使用し得る多くの方法および材料を識別するであろう。事実上、本発明はいかなる場合も、本明細書に記述されている方法および材料に限定されない。以下、本発明の目的に合わせて、以下の用語を定義する。
【0017】
本明細書で用いられている「腫瘍」および「病変」という用語は、悪性であるか良性であるかに関係なく、全ての腫瘍細胞の成長および増殖、ならびに全ての前癌性/癌性の細胞および組織を意味する。当業者であれば、1種以上の癌細胞、部分的または断片化した細胞、様々な病期の腫瘍、組織学的に正常な外観の周囲組織、および/またはマクロもしくはミクロ解剖された組織等の複数の生物学的要素を、腫瘍組織標本に含み得ることを理解するであろう。
【0018】
「癌」および「癌性」という用語は、典型的には無秩序な細胞増殖によって特徴づけられる、哺乳類の生理的条件を指し、これを説明するものである。本開示における癌の実施例は、前立腺癌等の尿生殖路癌を包含している。
【0019】
本明細書において「前立腺癌」という用語は、最も広義に用いられ、前立腺の組織から生じる全ての病期の癌および全ての形態の癌を指す。
【0020】
癌の病期分類は、疾患がどれくらい進行しているかを評価し、患者の治療を計画する上で医師の助けとなる。病期分類は、身体的検査、血液検査、または放射線療法に対する応答により臨床的に(臨床的病期分類)、および/または根治的前立腺摘除術などの手術に基づき病理学的に(病理学的病期分類)に実施され得る。American Joint Committee on Cancer(AJCC)のAJCC Cancer Staging Manual(7th Ed.,2010)の腫瘍(tumor)、リンパ節(node)、転移(metastasis)(TNM)病期分類システムによれば、前立腺癌の様々な病期は、腫瘍(T1:臨床的に不顕性な腫瘍であり、かつ画像診断を介しても触知できないかまたは不可視である。T1a:組織学的に偶然検出された腫瘍で切除組織の5%以下、T1b:組織学的に偶然検出された腫瘍で切除組織の5%を超える、T1c:針生検で腫瘍が同定される;T2:腫瘍が前立腺内に限局している、T2a:腫瘍が1葉の半分以下に及んでいる、T2b:腫瘍が1葉の半分を越えた域にまで及んでいるが、両葉には及んでいない、T2c:腫瘍が両葉に及んでいる;T3:腫瘍が前立腺被膜を通過して進展している、T3a:被膜の外へ拡大(片側であるか両側であるかを問わない)、T3b:腫瘍が精嚢に浸潤する;T4:腫瘍が定着しているか、または精嚢以外の隣接する構造(膀胱頚部、外括約筋、直腸、挙筋、もしくは骨盤壁)に侵入する)。一般に、臨床的T(cT)期は、T1またはT2であり、病理学的T(pT)期はT2以上である。リンパ節:N0:局部リンパ節の転移が存在しない;Nl:局部リンパ節における転移。転移:M0:遠隔転移が存在しない;Ml:遠隔転移が存在する。
【0021】
グリソン悪性度分類システム(Gleason Grading system)を使用することで、前立腺癌を有する男性の予後の評価に役立つ。他のパラメーターと共に、前立腺癌の病期分類ストラテジーに組み込まれ、予後を予測し、療法を指導する助けになる。前立腺癌は、その顕微鏡的な外観に基づいてグリソン「スコア」または「グレード」が与えられる。グリソンスコアが低い腫瘍は典型的には、その生涯にわたって患者に有意な脅威を引き起こし得ないほど充分に緩徐に生育する。これらの患者は、経時的な監視(「注意深い経過観察(watchful waiting)」もしくは「積極的サーベイランス(Active Surveillance)」を受ける。グリソンスコアが高い癌は、攻撃性が強く予後が悪化する。これらの患者は一般に手術(例えば、根治的前立腺切除)、および場合によっては療法(例えば、放射線、ホルモン、超音波、化学療法)で治療される。グリソンスコア(もしくは総計)は、2つの最も一般的な腫瘍パターンのグレードを含む。これらのパターンはグリソンパターン1〜5と呼ばれる。パターン1は最も高分化型である。大部分はパターンが混在されている。グリソンスコアまたはグレードを得るには、優性パターンをその次に優性なパターンに加算する。これにより、2〜10の数値が得られる。グリソングレードとしては、以下が挙げられる。G1:高分化(軽度異型性)(グリソン(Gleason)2〜4)
G2:中分化(中等度異型性)(グリソン(Gleason)5〜6)
G3〜4:低分化または未分化(高度異型性)(グリソン(Gleason)7〜10)
【0022】
病期分類:I期:Tla N0 M0 G1。II期:(T1a、N0、M0、G2〜4)または(T1b、c、T1、T2、N0、M0、全てのG);III期:T3、N0、M0、全てのG;IV期:(T4、N0、M0、全てのG)または(全てのT、N1、M0、全てのG)または(全てのT、全てのN、M1、全てのG)。
【0023】
本明細書において「悪性度進行」という用語は、根治的前立腺摘除術(radical prostatectomy)(RP)から決定されたグリソングレードの増加を指す。例えば、悪性度進行は、生検の時点での3+3または3+4から、RPの時点での3+4以上までのグリソングレードの変化を意味する。本明細書で用いる「有意な悪性度進行」または「悪性度進行2」は、生検で決定された3+3もしくは3+4から、RPの時点での4+3以上までのグリソングレードの変化、またはRPの時点での精嚢浸潤(SVI)もしくは被膜外浸潤(ECE)を指す。
【0024】
本明細書において「高グレード」という用語は、RPの時点での≧3+4または≧4+3のグリソンスコアを指す。本明細書において「低悪性度」という用語は、RPの時点での3+3のグリソンスコアを指す。特定の実施形態では、「高グレード」疾患は、少なくともメジャーパターン4、マイナーパターン5、または第3パターン5のグリソンスコアを指す。
【0025】
本明細書において「病期進行」という用語は、生検からRP時点での腫瘍病期までの腫瘍病期の増加を指す。例えば、病期進行は、生検時点での臨床T1またはT2病期から、PR時点での病理T3病期への変化である。
【0026】
本明細書において「非器官限局性疾患」という用語は、RP時点での病理的病期T3疾患を有する場合を指す。本明細書において「器官限局性」という用語は、RP時点での病理的病期pT2を指す。
【0027】
本明細書において「悪性病理」という用語は、上に定義した通りの高グレード疾患、または上に定義した通りの非器官限局性疾患を指す。特定の実施形態では、「悪性病理」は、≧3+4または≧4+3のグリソンスコアまたは病期T3を有す前立腺癌を指す。
【0028】
別の実施形態において、「高グレードまたは非器官限局性疾患」という用語は、少なくともメジャーパターン4、マイナーパターン5、もしくは第3パターン5、または病期T3のグリソンスコアを有する前立腺癌を指す。
【0029】
本明細書において、「積極的サーベイランス(active surveillance)」および「注意深い経過観察(watchful waiting)」という用語は、症候が現れるかまたは変化するまで一切の治療なしに患者の症状を綿密に監視することを意味する。例えば、前立腺癌の場合、注意深い経過観察(watchful waiting)は通常、他の医療問題および早期疾患を有する高齢の男性に用いられる。
【0030】
本明細書において、「手術」という用語は、癌組織を除去するために行われる外科的方法(例えば、骨盤のリンパ節切除、根治的前立腺摘除術、経尿道的前立腺切除術(TURP)、摘出、切開、および腫瘍生検/除去など)に適用される。遺伝子発現解析に使用される腫瘍組織または切片は、これらの方法のいずれかによって採取し得る。
【0031】
本明細書において、「癌細胞を含む生物学的サンプル」という用語は、癌患者から採取した腫瘍材料を含むサンプルを指す。この用語は、腫瘍組織サンプル、例えば、根治的前立腺摘除術により得られる組織、および例えば、コア生検または微細針生検などの生検により得られる組織を包含する。生物学的サンプルは、新鮮なサンプル、凍結、または固定した、ワックス包埋組織サンプル、例えば、ホルマリン固定、パラフィン包埋組織サンプルであってよい。生物学的サンプルはまた、癌細胞を含む体液、例えば、血液、血漿、血清、尿なども包含する。これ以外にも、「癌細胞を含む生物学的サンプル」という用語は、原発腫瘍以外の部位から得られる腫瘍細胞、例えば、循環腫瘍細胞を含むサンプルも包含する。この用語は、患者の腫瘍細胞の子孫である細胞、例えば、原発腫瘍細胞または循環腫瘍細胞に由来する細胞培養物サンプルも包含する。この用語は、さらに、in vivoで腫瘍細胞から放出されるタンパク質または核酸材料、例えば、骨髄、血液、血漿、血清などを含み得るサンプルも包含する。この用語はまた、腫瘍細胞が濃縮されたサンプル、あるいは、その入手後操作されたサンプル、ならびに患者の腫瘍細胞から得られるポリヌクレオチドおよび/またはポリペプチドを含むサンプルも包含する。
【0032】
予後因子は、癌の自然な経過に関連した変数であり、癌をいったん発症した後の患者の再発速度および転帰に影響を及ぼす。予後の悪化と関連する臨床パラメーターとしては、例えば、腫瘍病期の増分、提示される高PSAレベル、および高グリソングレードまたはグリソンパターンが挙げられる。予後因子は多くの場合、様々なベースライン再発リスクを基準に患者をサブグループに分類する場合に使用される。
【0033】
本明細書中で使用されている「予後」という用語は、癌患者が癌に起因し得る死または進行(前立腺癌等の腫瘍性疾患の再発、転移進展、および薬剤抵抗を含む)を有する尤度を指す。例えば、「予後良好」とは再発を伴わない長期生存を包含し、「予後不良」とは癌の再発を包含する。
【0034】
「肯定的臨床転帰」は、患者に対する利益を示す任意のエンドポイントを用いて評価することができ、このようなエンドポイントとして、限定されないが、以下のものが挙げられる:(1)増殖の減速および完全な停止などの腫瘍細胞のある程度の阻害;(2)腫瘍細胞の数の減少;(3)腫瘍サイズの縮小;(4)隣接する周辺器官および/または組織への腫瘍細胞の浸潤の阻害(すなわち、低減、減速、もしくは完全な停止);(5)転移の阻害;(6)腫瘍の後退または拒絶などを引き起こし得る抗腫瘍免疫応答の増大;(7)腫瘍に関連する1つ以上の症状のある程度の軽減;(8)治療後の生存期間の増加;および/または(9)治療後の所与の時点での死亡率の減少。肯定的臨床転帰はまた、同等の臨床診断を有する患者の集団の転帰に対する、個体の転帰に関して考慮することもでき、様々なエンドポイント、例えば、無再発期間(RFI)の増加、集団の生存期間(全体的な生存率(OS))または前立腺癌特異的生存期間(前立腺癌特異的生存率(PCSS))の増加、生検から根治的前立腺摘除術までの腫瘍病期もしくはグリソングレードに病期進行または悪性度進行がないこと、根治的前立腺摘除術時点での3+3グレードおよび器官限局性疾患の存在などを用いて評価することができる。
【0035】
「リスク分類」という用語は、被験者が特定の否定的臨床転帰を経験するリスクのレベル(あるいは尤度)を基準に、被験者をグループ化することを意味する。本開示の方法(例えば、高、中間、低リスク)に基づいて、被験者をリスクグループに分類するかリスクのレベルで分類し得る。「リスクグループ」は、特定の臨床転帰に関して同程度のリスクレベルを有する被験者、または個々のグループである。
【0036】
「長期」生存という用語は、特定期間(例えば、少なくとも5年、または少なくとも10年)の生存を指すために本明細書中に使用されている。
【0037】
「再発」という用語は、癌の局所再発もしくは遠隔再発(即ち、転移)を指すために、本明細書中に使用されている。例えば、前立腺癌は、前立腺の隣の組織内でまたは精嚢内で局所的に再発する可能性がある。癌はまた、骨盤内の周囲リンパ節またはこの領域の外側のリンパ節に影響を及ぼし得る。前立腺癌は、前立腺の隣の組織(例えば、骨盤筋、骨、もしくは他の器官)に広がり得る。再発は、例えば画像診断検査もしくは生検で検出される臨床的再発を基準に判別するか、あるいは、例えば持続的な経過観察による前立腺特異抗原(PSA)レベル≧0.4ng/mL、またはPSAレベル上昇の結果としてサルベージ療法の初発変化で検出される生化学的再発を基準に判別することができる。
【0038】
「臨床的無再発期間(cRFI)」という用語は、本明細書において、手術から最初の臨床的再発まで、または前立腺癌の臨床的再発による死亡までの期間として用いられる。経過観察が、臨床的再発、あるいは他の原発性癌、または臨床的再発に先立つ死亡の発生なしに終了した場合、cRFIまでの時間は打ち切られたとみなされるため、これが起きた場合に唯一わかることは、打ち切り時間に達するまで、この被験者に臨床的再発が起こらなかったという情報だけである。cRFIの計算を目的とする場合、生化学的再発は無視される。
【0039】
「生化学的無再発期間(bRFI)」という用語は、本明細書において、手術から前立腺癌の最初の生化学的再発までの期間として用いられる。臨床的再発が、生化学的再発の前に起こったり、経過観察がbRFI、あるいは他の原発性癌、または生化学的再発に先立つ死亡の発生なしに終了したりした場合、生化学的再発までの期間は、これらの最初の時点で打ち切られたとみなされる。
【0040】
「全体的な生存率(OS)」という用語は、本明細書において、手術から何らかの原因による死亡までの期間を指すために用いられる。被験者が最後の経過観察の時点でまだ生存している場合、生存期間は、最後の経過観察の時点で打ち切られたとみなされる。OSの計算を目的とする場合、生化学的再発および臨床的再発は無視される。
【0041】
「前立腺癌特異的生存率(PCSS)」という用語は、本発明において、手術から前立腺癌による死亡までの期間を指すために用いられる。経過観察の終了前に患者が前立腺癌で死亡しなかったり、あるいは、他の原因で死亡したりした場合、PCSSは、この時点で打ち切られたとみなされる。PCSSの計算を目的とする場合、臨床的再発および生化学的再発は無視される。
【0042】
実際には、上に挙げた事象までの期間の計算は、打ち切られたとみなされる事象の定義に応じて、調査ごとに異なる可能性がある。
【0043】
本明細書において、「発現量」という用語は、遺伝子に適用された場合、遺伝子産物の正規化レベル(例えば、遺伝子のRNAレベル、または遺伝子のポリペプチドレベルに対して決定された正規化値)を指す。
【0044】
「遺伝子産物」または「発現生成物」という用語は、本明細書において、mRNAを含む遺伝子のRNA(リボ核酸)転写産物(転写物)、およびそのようなRNA転写物のポリペプチド翻訳産物を指すために用いられる。遺伝子産物は、例えば、非スプライスRNA、mRNA、スプライスバリアントmRNA、microRNA、断片化RNA、ポリペチド、翻訳後修飾ポリペチド、スプライスバリアントポリペチドなどであり得る。
【0045】
本明細書において「RNA転写物」という用語は、遺伝子のRNA転写産物(例えば、mRNA、非スプライスRNA、スプライスバリアントmRNA、microRNA、および断片化RNAを含む)を指す。
【0046】
特に明記しない限り、本明細書中に使用されている各遺伝子名は、遺伝子に割り当てられた公式シンボルと一致し、これらのシンボルは本出願の出願日時点でEntrez Gene(URL:www.ncbi.nlm.nih.gov/sites/entrez)によって提供されている。
【0047】
「マイクロアレイ」という用語は、ハイブリダイゼーション可能なアレイ要素(例えば、基質上のオリゴヌクレオチド、またはポリヌクレオチドプローブ)の秩序立った配列を指す。
【0048】
「ポリヌクレオチド」という用語は、任意のポリリボヌクレオチドまたはポリデオキシリボヌクレオチドを一般に指し、それらは無修飾RNAもしくはDNA、または修飾RNAもしくはDNAであり得る。したがって、例えば、本明細書中に定義されているポリヌクレオチドは、限定はされないが、一本鎖DNA、二本鎖DNA、一本鎖領域と二本鎖領域とを含むDNA、一本鎖RNA、二本鎖RNA、および一本鎖領域と二本鎖領域とを含むRNA、ならびにDNAとRNA(一本鎖であり得るかより典型的には二本鎖であり得、かつ一本鎖領域と二本鎖領域とを含む)とを含んでなるハイブリッド分子を包含する。加えて、本明細書において「ポリヌクレオチド」という用語は、RNAもしくはDNA、またはRNAおよびDNAの両方を含む三本鎖領域を指す。そのような領域内の鎖は、同じ分子からの鎖であるか、異なる分子からの鎖であり得る。領域は1つ以上の分子を全て含んだ領域を包含し得るが、より典型的には分子をいくつか含んだ領域のみを包含する。三重螺旋領域の分子の1つは、多くの場合オリゴヌクレオチドである。「ポリヌクレオチド」という用語は、特異的にcDNAを包含する。この用語は、DNA(cDNAを含む)、および1つ以上の修飾塩基を含有するRNAを包含する。したがって、安定化または他の理由で主鎖が修正されたDNAまたはRNAは、その用語が本明細書中で意図された「ポリヌクレオチド」である。本明細書で定義されている用語「ポリヌクレオチド」内には更に、イノシン等の異例の塩基を有するDNAもしくはRNA、またはトリチウム化された塩基等の修飾塩基が含有されている。一般に、「ポリヌクレオチド」という用語は、化学的に、酵素によって、かつ/または代謝的に修飾された無修飾ポリヌクレオチドの全ての形態と、ウイルスおよび細胞(単純型および複雑型細胞を含む)に特有のDNAおよびRNAの化学形態とを包含する。
【0049】
「オリゴヌクレオチド」という用語は、比較的短いポリヌクレオチドを指し、限定はされないが、一本鎖デオキシリボヌクレオチド、一本鎖または二本鎖リボヌクレオチド、RNArDNAハイブリッド、および二本鎖DNAを包含する。一本鎖DNAプローブオリゴヌクレオチド等のオリゴヌクレオチドは多くの場合、例えば市販のオートメーション化されたオリゴヌクレオチドシンセサイザーを使用して化学法で合成される。ただし、オリゴヌクレオチドは、細胞および有機体内でのDNAの発現によるインビトロ組み換えDNA媒介技術を含む他の様々な方法で作製し得る。
【0050】
本明細書において「C
T」という用語は閾値サイクル(Threshold cycle)を指す。つまり、或る反応中に発生した蛍光が、定義済みの閾値を優に超える時点(例えば、反応中に充分な数の単位複製配列が累積して定義済み閾値と一致した時点)での定量的ポリメラーゼ連鎖反応(qPCR)のサイクル数である。
【0051】
本明細書において「Cp」という用語は、「クロッシングポイント(crossing point)」を指す。Cp値は、qPCR増幅曲線全体の二次導関数およびその最大値を定量化することによって計算される。Cp値は、蛍光の増加が最高に達し、PCRの対数期が開始する時点でのサイクルを表す。
【0052】
「閾値」または「閾値処理(thresholding)」という用語は、遺伝子発現測定値と臨床反応の非線形関係を説明すると共に、レポートされた患者スコアの変動を更に低減するために使用される手順を指す。閾値処理(thresholding)を適用した場合、閾値に満たないか、または閾値を超える測定値はいずれも、その閾値に設定される。遺伝子発現と転帰の非線形関係は、スムーザーまたは三次スプラインを使用し、無再発期間についてはCox PH回帰を、または悪性病理状態についてはロジスティック回帰を用いて遺伝子発現をモデリングして、調べることができる。D.Cox,Journal of the Royal Statistical Society,Series B 34:187−220(1972)。レポートされた患者スコアの変動は、特定の遺伝子の定量化および/または検出の限界点における遺伝子発現の変動性の関数として調べることができる。
【0053】
本明細書において「単位複製配列」という用語は、ポリメラーゼ連鎖反応(PCR)およびリガーゼ連鎖反応等の増幅技術を使用して合成されたDNAの断片を指す。
【0054】
ハイブリダイゼーション反応の「ストリンジェンシー(stringency)」は当業者であれば容易に判別でき、一般的にプローブ長さ、洗浄温度、および塩濃度に応じて経験則に基づき算定される。一般に、プローブが長いほど適切なアニーリングを得るための所要温度は高く、一方、プローブが短いほど所要温度は低い。ハイブリダイゼーションは一般に、相補鎖がその融解温度未満の環境に存在する場合に、変性DNAが相補鎖をリアニールする能力に依存する。プローブとハイブリダイゼーション可能配列との間の所望の相同性の程度が高いほど、使用可能な相対温度が高い。結果として、相対温度が高いほど反応条件のストリンジェンシーが強まる傾向があり、一方、温度が低いほどその傾向が弱まる。ハイブリダイゼーション反応のストリンジェンシーの更なる詳細および説明については、Ausubel et al.,Current Protocols in Molecular Biology(Wiley Interscience Publishers,1995)を参照されたい。
【0055】
本明細書中に定義されている「ストリンジェントな条件」または「高ストリンジェントな条件」は典型的に(1)洗浄に低イオン強度および高温、例えば、50℃にて0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウムを使用し;(2)ハイブリダイゼーション時に42℃にて750mM塩化ナトリウム、75mMクエン酸ナトリウムを含有する0.1%ウシ血清アルブミン/0.1%Ficoll/0.1%ポリビニルピロリドン/pH6.5の50mMリン酸ナトリウム緩衝液と共に、ホルムアミド、例えば、50%(v/v)ホルムアミドなどの変性剤を使用するか、または(3)42℃にて50%ホルムアミド、5×SSC(0.75MのNaCl、0.075Mクエン酸ナトリウム)、50mMリン酸ナトリウム(pH6.8)、0.1%ピロリン酸ナトリウム、5×デンハート液、音波処理サケ精子DNA(50μg/ml)、0.1%SDS、および10%硫酸デキストランを使用し、42℃にて0.2×SSC(塩化ナトリウム/クエン酸ナトリウム)および50%ホルムアミド中で洗浄した後、55℃にてEDTA含有の0.1×SSCからなる高ストリンジェントな洗浄を行う。
【0056】
「中程度にストリンジェントな条件」は、Sambrook et al.,Molecular Cloning:A Laboratory Manual,New York:Cold Spring Harbor Press,1989の説明に従って確認でき、上記のハイブリダイゼーション条件に比べて低ストリンジェントな洗浄溶液およびハイブリダイゼーション条件(例えば、温度、イオン強度および%SDS)の使用を含む。中程度にストリンジェントな条件の一例は、20%ホルムアミド、5×SSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハート液、10%硫酸デキストラン、および20mg/ml変性剪断サケ精子DNAを含有する溶液中で37℃にて一晩インキュベートした後、約37〜50℃にて1×SSC中でフィルタを洗浄する。プローブ長およびこれに類するもの等の因子に適合させるための所要温度、イオン強度等の調整方法は、当業者によって認識されるであろう。
【0057】
「スプライシング」および「RNAスプライシング」という用語は、交換可能に用いられており、真核細胞の細胞質内に移動する連続したコード配列を有する成熟mRNAを生成するため、イントロンを除去してエクソン同士を連結するRNAプロセッシングを指す。
【0058】
本明細書において「TMPRSS融合」および「TMPRSS2融合」は交換可能に使用される用語であり、アンドロゲン駆動TMPRSS2遺伝子と、前立腺癌と有意な関連性があることが実証されたERGオンコジーンとの融合を指す。S.Perner,et al.,Urologe A.46(7):754−760(2007);S.A.Narod,et al.,Br J Cancer 99(6):847−851(2008)。本明細書において、陽性TMPRSS融合状態はTMPRSS融合が組織標本内に存在することを示し、一方、陰性TMPRSS融合状態はTMPRSS融合が組織標本内に存在しないことを示す。当業者であれば、TMPRSS融合状態の判定方法には、リアルタイム、定量的PCR、または高スループットシークエンシング等、多くの方法があることを認識するであろう。例えば、K.Mertz,et al.,Neoplasis 9(3):200−206(2007);C.Maher,Nature 458(7234):97−101(2009)を参照のこと。
【0059】
「相関」および「関連」という用語は、本明細書中で交換可能に用いられており、2つの測定値の関連(または測定されたエンティティ)を指す。本開示は、遺伝子または遺伝子サブセットを提供するが、それらの発現量は臨床転帰と関連している。例えば、遺伝子の発現量の増加は、良好または肯定的な転帰と正の相関(正の関連性)を示し得る。そのような正の相関は、様々な方法、例えば、1未満の癌の再発ハザード比または1未満の悪性度進行もしくは病期進行オッズ比により、統計学的に実証し得る。別の例では、遺伝子の発現量の増加は、良好または肯定的な臨床転帰と負の相関(負の関連性)を示し得る。その場合、例えば、患者は、癌の再発または癌の悪性度進行/病期進行を経験する可能性があり、これは、様々な方法、例えば、1を超えるハザード比または1を超えるオッズ比により、統計学的に実証し得る。本明細書において「相関」はまた、2つの異なる遺伝子の発現量の関連の強さも指し、このような場合、両者の発現量が高度に相関していれば、所与のアルゴリズムにおいて第1遺伝子の発現量を第2遺伝子の発現量で置換することができる。アルゴリズムにおいて置換が可能な2つの遺伝子のこのような「相関した発現」は、例えば、第1遺伝子の発現増大が、転帰と正の相関を示し(例えば、良好な臨床転帰の尤度増加)、次に、共発現して、第1遺伝子との相関発現を呈示する第2遺伝子も同じ転帰と正の相関を示す場合、通常、互いに正の相関を示す遺伝子発現量である。
【0060】
本明細書において「共発現する」および「共発現した」という用語は、様々な患者からなる集団全体におけるそれぞれの転写物配列の量の統計的な相関を指す。ペアワイズ共発現(Pairwise co−expression)は、当該技術分野で公知の様々な方法で、例えば、ピアソン(Pearson)相関係数またはスピアマン(Spearman)相関係数を算出することによって計算できる。共発現遺伝子クリークは、本明細書の実施例4に記載する極大クリーク列挙(MCE)をシードおよびスタックすることにより同定することもできる。共発現の解析は、正規化された発現データを使用して算定することができる。同じ遺伝サブセット子内の遺伝子も、共発現したとみなされる。
【0061】
「コンピュータベースのシステム」は、情報解析に使用されるハードウェア、ソフトウェアおよびデータ記憶媒体のシステムを指す。患者のコンピュータベースシステムの最小ハードウェアは、中央演算処理装置(CPU)、データ入力/データ出力用ハードウェア(例えば、ディスプレイ装置)、およびデータ記憶装置を備える。現在利用可能な任意のコンピュータベースのシステムおよび/またはそのコンポーネントが、本開示の方法に関連した使用に好適であることは、当業者であれば容易に認めることができる。データ記憶媒体は、上に記載した本情報を記録する装置を備える製造品、またはそのような製造品にアクセスできる記憶アクセス装置を備える任意の製造品を含み得る。
【0062】
データ、プログラミング、または他の情報をコンピュータ可読媒体に「記録する」とは、当該技術分野で公知られている任意の方法を使用して情報を保存する工程を指す。保存された情報へのアクセスに用いる手段に応じて、何らかの便利なデータ記憶構造を選択できる。保存に使用できるデータプロセッサプログラムおよびフォーマットには、例えば、文書処理テキストファイル、データベースフォーマット等、様々なものがある。
【0063】
「プロセッサ」あるいは「コンピューティング手段」とは、それに必要とされる機能を実行する任意のハードウェアおよび/またはソフトウェアの組み合わせを指す。例えば、好適なプロセッサは、電子コントローラ、メインフレーム、サーバ、またはパーソナルコンピュータ(デスクトップ型または携帯型)等の型式で利用可能なプログラム可能なデジタルマイクロプロセッサであり得る。プロセッサがプログラム可能である限り、好適なプログラミングが遠隔位置からプロセッサに伝達できるか、またはコンピュータプログラム製品(携帯型または固定型コンピュータ読み取り可能記憶媒体等、基盤のデバイスが磁気、光学、または固体かを問わない)に予め保存される。磁気媒体または光ディスクは、プログラミングを実行でき、対応する端末で各プロセッサとやり取りする好適な読み取り装置を介して読み取ることが可能である。
【0064】
アルゴリズムに基づく方法および遺伝子サブセット
本発明は、前立腺癌患者の臨床転帰を予測するためのアルゴリズムに基づく分子診断アッセイを提供する。1つ以上の遺伝子の発現量を単独で用いて、または機能遺伝子サブセットに導入して、定量スコアを算出することができ、このスコアは、臨床転帰の尤度を予測するのに使用することができる。アルゴリズムに基づくアッセイ、および本発明の方法の実施により提供される関連情報は、前立腺癌の最適な治療の意思決定を容易にする。例えば、このような臨床ツールにより、医師は、侵襲性癌を有する尤度が低い、従って、RPの必要がない患者、または侵襲性癌を有する尤度が高い、従って、RPが必要な患者を識別することが可能になる。
【0065】
本明細書で用いる「定量スコア」は、計算により、または数学的に算出される数値であり、これは、開示される遺伝子または遺伝子サブセットの或る発現量と前立腺癌患者の臨床転帰の尤度との相関などの、より複雑な量的情報の解析を単純化または開示または知る上で役立てることを目的とする。定量スコアは、特定のアルゴリズムの適用によって決定することができる。本明細書に開示する方法で定量スコアを算出するのに用いるアルゴリズムは、遺伝子の発現量の値を分類し得る。遺伝子の分類は、少なくとも部分的に、本明細書で述べる群のように、生理学的機能または構成細胞の特徴に応じた遺伝子の相対的寄与の知識に基づいて実施され得る。定量スコアは、1遺伝子群について決定することもできる(「遺伝子群スコア」)。加えて、群の形成により、定量スコアに対する遺伝子または遺伝子サブセットの様々な発現量の寄与の数学的重み付けも容易にすることができる。生理学的プロセスまたは構成細胞の特徴を表す遺伝子もしくは遺伝子群の重み付けは、癌の病理および臨床転帰(例えば、癌の再発または悪性度進行/病期進行)に対する上記プロセスまたは特徴の寄与を示している。本発明は、例えば、表4に記載するように、定量スコアを算出するためのいくつかのアルゴリズムを提供する。本発明の一実施形態において、定量スコアの増加は、否定的な臨床転帰の尤度増加を示す。
【0066】
一実施形態において、定量スコアは、「再発スコア」であり、これは、癌再発、癌の悪性度進行もしくは病期進行、悪性病理、非器官限局性疾患、高グレード疾患、および/または高グレードもしくは非器官限局性疾患の尤度を示す。再発スコアの増加は、癌再発、癌の悪性度進行もしくは病期進行、悪性病理、非器官限局性疾患、高グレード疾患、および/または高グレードもしくは非器官限局性疾患の尤度増加と相関している可能性がある。
【0067】
本発明の遺伝子サブセットは、ECM遺伝子群、流動遺伝子群、アンドロゲン遺伝子群、増殖遺伝子群、上皮遺伝子群、およびストレス遺伝子群を含む。
【0068】
本明細書において「ECM遺伝子群」、「間質遺伝子群」および「間質反応遺伝子群」と称する遺伝子サブセットは、交換可能に用いられ、主に間質細胞により合成され、間質反応に関与する遺伝子、およびECM遺伝子群の遺伝子と共発現する遺伝子を包含する。「間質細胞」は、本明細書において、結合組織細胞と呼ばれ、こうした細胞は、生物学的組織の支持構造を構成する。間質細胞は、繊維芽細胞、免疫細胞、血管周囲細胞、上皮細胞、および炎症細胞を含む。「間質反応」は、原発性腫瘍または浸潤の部位での宿主組織の間質線維化反応を指す。例えば、E.Rubin,J.Farber,Pathlogy,985−986(end Ed.1994)を参照。ECM遺伝子群は、例えば、ASPN、SFRP4、BGN、THBS2、INHBA、COL1A1、COL3A1、COL1A2、SPARC、COL8A1、COL4A1、FN1、FAP、およびCOL5A2、ならびにその共発現遺伝子を含む。例示的共発現遺伝子としては、表8に示す遺伝子および/または遺伝子クリークがある。
【0069】
本明細書において「流動遺伝子群」または「流動調節遺伝子群」または「細胞骨格遺伝子群」または「細胞構成遺伝子群」と称する遺伝子サブセットは、交換可能に使用され、アクチンおよび補助タンパク質の動的ミクロフィラメントネットワークの一部であって、細胞に細胞内支持を提供し、細胞運動および細胞分裂のための物理的力を生成すると共に、小胞および細胞小器官の細胞内輸送を促進する遺伝子および共発現遺伝子を含む。流動遺伝子群は、例えば、BIN1、IGF1、C7、GSN、DES、TGFB1I1、TPM2、VCL、FLNC、ITGA7、COL6A1、PPP1R12A、GSTM1、GSTM2、PAGE4、PPAP2B、SRD5A2、PRKCA、IGFBP6、GPM6B、OLFML3、およびHLF、ならびにその共発現遺伝子を含む。例示的共発現遺伝子および/または遺伝子クリークを表9に示す。
【0070】
本明細書において「アンドロゲン遺伝子群」、「PSA遺伝子群」、および「PSA調節遺伝子群」と称する遺伝子サブセットは、交換可能に使用され、セリンプロテアーゼのカリクレインファミリーのメンバー(例えば、カリクレイン3[PSA])、およびアンドロゲン遺伝子群の遺伝子と共発現する遺伝子を含む。アンドロゲン遺伝子群は、例えば、FAM13CおよびKLK2、ならびにその共発現遺伝子を含む。アンドロゲン遺伝子群は、さらにAZGP1およびSRD5A2、ならびにその共発現遺伝子も含み得る。
【0071】
本明細書において「増殖遺伝子群」および「細胞周期遺伝子群」と称する遺伝子サブセットは、交換可能に使用され、細胞周期機能と関連する遺伝子、および増殖遺伝子群の遺伝子と共発現する遺伝子を含む。本明細書で用いる「細胞周期機能」は、細胞増殖および細胞周期制御、例えば、チェックポイント/G1〜S期移行を指す。増殖遺伝子群は、従って、例えば、CDC20、TPX2、UBE2T、MYBL2、およびCDKN2C、ならびにその共発現遺伝子を含む。例示的共発現遺伝子および/または遺伝子クリークを表10に示す。
【0072】
本明細書において「上皮遺伝子群」および「基底上皮遺伝子群」と称する遺伝子サブセットは、交換可能に使用され、極性上皮の分化の過程で発現され、細胞内構造統合性をもたらすことにより、隣接する上皮細胞との物理的相互作用を促進する遺伝子、および上皮遺伝子群の遺伝子と共発現する遺伝子を含む。上皮遺伝子群は、例えば、CYP3A5、KRT15、KRT5、LAMB3、およびSDC1、ならびにその共発現遺伝子を含む。
【0073】
本明細書において「ストレス遺伝子群」、「ストレス応答遺伝子群」、および「早期応答遺伝子群」と称する遺伝子サブセットは、交換可能に使用され、転写因子であり、細胞ストレスおよびその他の細胞外シグナルに応答して迅速かつ一時的に活性化されるDNA−結合タンパク質である、遺伝子および共発現遺伝子を含む。これらの因子もまた、多様な遺伝子の転写を調節する。ストレス遺伝子群は、例えば、DUSP1、EGR1、FOS、JUN、EGR3、GADD45B、およびZFP36、ならびにその共発現遺伝子を含む。例示的共発現遺伝子および/または遺伝子クリークを表11に示す。
【0074】
上記遺伝子サブセットの1つ以上と一緒に、他の遺伝子およびその共発現遺伝子の発現量を用いて、前立腺癌患者の臨床転帰の尤度を予測することができる。例えば、開示した遺伝子サブセットのいずれにも属さない
図1または表1Aもしくは表1Bに示す81の遺伝子から選択した1つ以上の遺伝子の発現量を、開示した遺伝子サブセットの1つ以上と一緒に用いてよい。本発明の一実施形態において、STAT5B、NFAT5、AZGP1、ANPEP、IGFBP2、SLC22A3、ERG、AR、SRD5A2、GSTM1、およびGSTM2を、前述した1つ以上の遺伝子サブセットで用いて、臨床転帰の尤度を予測することができる。
【0075】
本発明はまた、特定の遺伝子についての閾値発現量を決定する方法も提供する。閾値発現量は、特定の遺伝子について計算することができる。或る遺伝子の閾値発現量は、正規化した発現量に基づくものであってよい。一例において、Cp閾値発現量は、ロジスティック回帰またはCox比例ハザード回帰を用いて機能形態を評価することにより、算出することができる。
【0076】
本発明はさらに、特定のタイプの癌に関連する検証済みバイオマーカーとして、例えば、定量RT−PCR(qRT−PCR)により同定される特定の遺伝子と共発現する遺伝子を決定する方法も提供する。共発現する遺伝子はそれ自体で有用なバイオマーカーである。共発現遺伝子は、これらが一緒に共発現する遺伝子の代わりに用いられ得る。本方法は、マイクロアレイデータから遺伝子クリークを同定するステップ、マイクロアレイデータを正規化するステップ、アレイプローブについてのペアワイズスピアマン(Spearman)相関行列を計算するステップ、様々な試験から有意な共発現プローブをフィルタリングにより取得するステップ、グラフを作成するステップ、遺伝子に対しプローブをマッピングするステップ、および遺伝子クリークレポートを作成するステップを含み得る。共発現遺伝子を同定する例示的方法を以下の実施例3に記載し、この方法を用いて同定した共発現遺伝子を表8〜11に表示する。1つ以上の遺伝子クリークの発現量を用いて、前立腺癌患者が、癌再発の尤度減少などの肯定的な臨床転帰を経験する尤度を算出することができる。
【0077】
遺伝子群のいずれか1つ以上の組み合わせを本発明の方法で検定することができる。例えば、間質応答遺伝子群を単独で、あるいは、細胞構成遺伝子群、増殖遺伝子群、および/またはアンドロゲン遺伝子群と組み合わせて検定してよい。さらに、各遺伝子群のいくつの遺伝子を検定してもよい。
【0078】
本発明の特定の実施形態において、前立腺癌患者の臨床転帰を予測する方法は、間質反応遺伝子群、またはその共発現遺伝子からの少なくとも1つの遺伝子と、細胞構成遺伝子群、またはその共発現遺伝子からの少なくとも1つの遺伝子の発現量を測定するステップを含む。別の実施形態では、間質反応遺伝子群、またはその共発現遺伝子からの少なくとも2つの遺伝子と、細胞構成遺伝子群、またはその共発現遺伝子からの少なくとも2つの遺伝子の発現量を測定する。また別の実施形態では、間質反応遺伝子群および細胞構成遺伝子群の各々から、少なくとも3つの遺伝子の発現量を測定する。さらに別の実施形態では、間質反応遺伝子群および細胞構成遺伝子群の各々から、少なくとも4つの遺伝子の発現量を測定する。別の実施形態では、間質反応遺伝子群および細胞構成遺伝子群の各々から、少なくとも5つの遺伝子の発現量を測定する。さらにまた別の実施形態では、間質反応遺伝子群および細胞構成遺伝子群の各々から、少なくとも6つの遺伝子の発現量を測定する。
【0079】
別の具体的実施形態では、アンドロゲン遺伝子群、またはその共発現遺伝子からの少なくとも1つの遺伝子の発現量に加えて、間質反応遺伝子群、またはその共発現遺伝子からの少なくとも1つの遺伝子の発現量を測定してよい。特定の実施形態では、間質反応遺伝子群、またはその共発現遺伝子からの少なくとも3つの遺伝子の発現量と、アンドロゲン遺伝子群からの少なくとも1つの遺伝子、またはその共発現遺伝子の発現量を測定してよい。
【0080】
さらに別の具体的実施形態では、間質反応遺伝子群、アンドロゲン遺伝子群、および細胞構成遺伝子群、またはそれらの共発現遺伝子の各々から少なくとも1つの遺伝子の発現量を測定してよい。特定の実施形態では、間質反応遺伝子群からの少なくとも3つの遺伝子、アンドロゲン遺伝子群からの少なくとも1つの遺伝子、および細胞構成遺伝子群からの少なくとも3つの遺伝子の発現量を測定してよい。別の実施形態では、間質反応遺伝子群、アンドロゲン遺伝子群、および増殖遺伝子群の各々、またはそれらの共発現遺伝子から少なくとも1つの遺伝子の発現量を測定してよい。特定の実施形態では、間質反応遺伝子群からの少なくとも3つの遺伝子、アンドロゲン遺伝子群からの少なくとも1つの遺伝子、および増殖遺伝子群からの少なくとも1つの遺伝子の発現量を測定してもよい。また、これらの組み合わせのいずれかにおいて、アンドロゲン遺伝子群からの少なくとも2つの遺伝子を測定してもよい。また、これら組み合わせのいずれかにおいて、アンドロゲン遺伝子群からの少なくとも4つの遺伝子を測定してもよい。
【0081】
さらに別の具体的実施形態では、間質反応遺伝子群、アンドロゲン遺伝子群、細胞構成遺伝子群、および増殖遺伝子群の各々、またはそれらの共発現遺伝子から少なくとも1つの遺伝子の発現量を測定してよい。特定の実施形態では、間質反応遺伝子群からの少なくとも3つの遺伝子、細胞構成遺伝子群からの少なくとも3つの遺伝子、増殖遺伝子群からの少なくとも1つの遺伝子、およびアンドロゲン遺伝子群からの少なくとも2つの遺伝子の発現量を測定してよい。これら実施形態のいずれかにおいて、アンドロゲン遺伝子群からの少なくとも4つの遺伝子を測定してもよい。
【0082】
さらに、本明細書に記載の遺伝子サブセットに属さない1つ以上の遺伝子の発現量を本明細書に記載の遺伝子サブセットの組み合わせのいずれかと一緒に測定してもよい。あるいは、遺伝子サブセットに属するいずれかの遺伝子をその遺伝子サブセットから個別に、または別の遺伝子サブセットにおいて解析してもよい。例えば、本明細書に記載した遺伝子サブセットに加えて、少なくとも1つ、少なくとも2つ、少なくとも3つ、または少なくとも4つの遺伝子の発現量を測定してもよい。本発明の一実施形態において、追加の遺伝子は、STAT5B、NFAT5、AZGP1、ANPEP、IGFBP2、SLC22A3、ERG、AR、SRD5A2、GSTM1、GSTM2から選択する。
【0083】
特定の実施形態において、本発明の方法は、表4に示す遺伝子および遺伝子サブセットの特定の組み合わせの発現量を測定するステップを含む。さらに別の実施形態では、遺伝子群スコアおよび定量スコアを表4に示すアルゴリズムに従って計算する。
【0084】
開示した遺伝子の発現量の決定のための様々な技術的手法を本明細書に記載するが、そのような手法として、限定するものではないが、RT−PCR、マイクロアレイ、ハイスループット配列決定、遺伝子発現の連続解析(SAGE)およびデジタル遺伝子発現(Digital Gene Expression)(DGE)が挙げられるが、これらについては以下に詳述する。特定の態様では、各遺伝子の発現量を、エクソン、イントロン、タンパク質エピトープおよびタンパク質活性などの遺伝子の発現生成物の様々な特徴に関して決定することができる。
【0085】
アッセイする発現生成物は、例えば、RNAまたはポリペプチドであってよい。発現生成物を断片化してもよい。例えば、アッセイでは、発現生成物の標的配列と相補的なプライマーを用いることができるため、完全転写物、さらには標的配列を含む断片化発現生成物も測定することができる。更なる情報を表Aに記載する。
【0086】
RNA発現生成物は、直接、またはPCRに基づく増幅方法、例えば、定量的逆転写ポリメラーゼ連鎖反応(qRT−PCR)から得られるcDNAの検出により、検定することができる(例えば、米国特許第7,587,279号明細書を参照)。ポリペプチド発現生成物は、プロテオミクス技術により、免疫組織化学(IHC)を用いて検定してもよい。さらに、マイクロアレイを用いて、RNAおよびポリペプチド発現生成物の両方をアッセイしてもよい。
【0087】
遺伝子産物の発現量アッセイ方法
遺伝子発現プロファイリングの方法としては、ポリヌクレオチドのハイブリダイゼーション解析に基づく方法、ポリヌクレオチドの配列決定に基づく方法、およびプロテオミクスに基づく方法が挙げられる。サンプル中のRNAの発現を定量化するための例示的方法としては、当該技術分野で公知のノーザンブロット法およびin situハイブリダイゼーション(Parker & Barnes,Methods in Molecular Biology 106:247−283(1999))、リボヌクレアーゼ(RNAse)プロテクションアッセイ(Hod,Biotechniques 13:852−854(1992))、およびPCRに基づく方法、例えば、逆転写PCR(RT−PCR)(Weis et al.,Trends in Genetics 8:263−264(1992))が挙げられる。配列特異的な二重鎖を認識できる抗体(例えば、DNA二重鎖、RNA二重鎖、およびDNA‐RNAハイブリッド二重鎖、またはDNA−蛋白質二重鎖など)を用いてもよい。配列決定に基づく遺伝子発現解析方法の代表例としては、遺伝子発現の連続解析(SAGE)、および大量並行シグネチャー配列決定(massively parallel signature sequencing)(MPSS)による遺伝子発現解析が挙げられる。当該技術分野で公知の方法も使用され得る。
【0088】
逆転写PCR(RT−PCR)
典型的には、mRNAは、試験サンプルから単離される。出発原料は、典型的には、ヒト腫瘍(通常、原発性腫瘍)から単離される総RNAである。任意選択的に、同じ患者からの正常な組織を内部対照として使用できる。そのような正常な組織は、腫瘍に隣接した組織学的に正常な外観の組織であり得る。mRNAは、組織標本から(例えば、新鮮で冷凍された(例えば新鮮凍結)、またはパラフィン包埋(例えばホルマリン固定)サンプルから)抽出されたものであってよい。
【0089】
mRNA抽出の一般的な方法は当該技術で周知であり、Ausubel et al.,Current Protocols of Molecular Biology,John Wiley and Sons(1997)等の分子生物学の標準教科書で開示されている。パラフィン包埋組織からRNAを抽出する方法は、例えば、Rupp and Locker,Lab Invest.56:A67(1987)、およびDe Andres et al.,BioTechniques 18:42044(1995)で開示されている。特に、RNAの単離は、精製キット、緩衝液セット、およびQiagen等の商業的な製造業者からのプロテアーゼを使用して、そのメーカーの指示に従い実施できる。例えば、培養物内の細胞からの総RNAはQiagen RNeasyミニカラムを使用して単離し得る。他の市販RNA単離キットとしては、MasterPure(商標)Complete DNA and RNA Purification Kit(EPICENTRE(登録商標)、Madison,WI)、およびParaffin Block RNA Isolation Kit(Ambion社)が挙げられる。組織標本からの総RNAは、RNA Stat−60(Tel−Test)を使用して単離し得る。腫瘍から調製されたRNAは、例えば、塩化セシウム密度勾配遠心分離によって単離し得る。
【0090】
次いで、RNA含有のサンプルを逆転写にかけ、RNA鋳型からcDNAを生成した後、PCR反応において指数関数的増幅を行う。最も一般的に使用されている逆転写酵素としては、トリ骨髄芽球症ウイルス逆転写酵素(AMV−RT)、およびモロニーマウス白血病ウイルス逆転写酵素(MMLV−RT)の2つがある。逆転写工程は、典型的には、状況および発現プロファイリングの目標に応じて特定のプライマー、ランダムヘキサマー(random hexamer)、またはオリゴdTプライマーを使用してプライムされる。例えば、抽出されたRNAは、メーカーの指示に従い、GeneAmp RNA PCRキット(Perkin Elmer,CA,USA)を使用して逆転写できる。続いて、誘導されたcDNAは以降のPCR反応で鋳型として使用できる。
【0091】
PCRベースの方法では、耐熱DNA依存性DNAポリメラーゼ(例えば、Taq DNAポリメラーゼ)を使用する。例えば、TaqMan(登録商標)PCRは典型的には、TaqポリメラーゼまたはTthポリメラーゼの5’ヌクレアーゼ活性を利用し、そのアンプリコンに結合されているハイブリダイゼーションプローブを加水分解するが、等価な5’ヌクレアーゼ活性を有する酵素であれば、どのような酵素でも使用できる。2つのオリゴヌクレオチドプライマーを使用して、PCR反応生成物に典型的なアンプリコンを生成する。第3のオリゴヌクレオチドまたはプローブは、2つのPCRプライマーのハイブリダイゼーション部位間に位置するアンプリコンのヌクレオチド配列の検出を容易にするように設計し得る。プローブは、レポーター色素等で検出可能に標識でき、更に蛍光染料および失活剤蛍光染料の両方で標識してTaqman(登録商標)プローブ構成として提供できる。Taqman(登録商標)を使用した場合、増幅反応中にTaq DNAポリメラーゼ酵素は、鋳型に依存した方法でプローブを開裂する。結果として得られたプローブ断片は溶液中で分離し、放出されたレポーター色素からのシグナルは、第2の蛍光体の消光効果を免れる。新しい分子が合成されるたびに、レポーター色素の1分子が遊離される。消光されていないレポーター色素の検出は、データの定量的解釈の基礎となる。
【0092】
TaqMan(登録商標)RT−PCRは、市販の機器(例えば、ABI PRISM 7700 Sequence Detection System(登録商標)(Perkin−Elmer−Applied Biosystems,Foster City,CA,USA)、またはLightcycler(Roche Molecular Biochemicals,Mannheim,Germany)等の高スループットのプラットフォーム)を使用して実施できる。好適な実施形態では、手順をマイクロウェルプレートベースのサイクラープラットフォームであるLightCycler(登録商標)480(Roche Diagnostics)リアルタイムPCRシステム上で実行する。
【0093】
5’ヌクレアーゼアッセイデータは一般的に、初めに閾値サイクル(「C
t」)として表される。蛍光値は全てのサイクルで記録され、増幅反応においてその位置に増幅される生成物の分量を表す。閾値サイクル(C
t)は、蛍光シグナルが統計的に有意として初めて記録される時点である、と一般的に説明される。代わりに、データをクロッシングポイント(crossing point)(「Cp」)として表すこともできる。Cp値は、qPCR増幅曲線全体の二次導関数、およびその最大値を定量化することによって計算される。Cp値は、蛍光の増加が最高に達してPCRの対数期が開始するサイクルを表す。
【0094】
誤差およびサンプル間の変動の効果を最小限に抑えるため、RT−PCRは通常、内部標準を使用して実施される。理想的な内部標準遺伝子(リファレンス遺伝子も呼ばれる)は、同じ起源(即ち、正常組織および癌組織間で有意な相異のないレベル)の癌組織および非癌組織の間で極めて一定のレベルにて表され、実験的処置による有意な影響を受けず(即ち、化学療法に露出された結果として、関連する組織内での発現量における有意差を呈さず)、別々の患者から採取された同じ組織同士の間で極めて一定のレベルで表される。例えば、本明細書中に開示されている方法において有用なリファレンス遺伝子は、癌性前立腺内で、正常前立腺組織と比較して有意に相異する発現量を呈してはならない。正規化に使用される例示的なリファレンス遺伝子は、遺伝子AAMP、ARF1、ATP5E、CLTC、GPS1、およびPGK1のうちの1つ以上を含んで構成される。遺伝子発現の測定値は、1つ以上(例えば、2つ、3つ、4つ、5つまたはそれ以上)のリファレンス遺伝子の平均を基準に正規化できる。基準により正規化された(Reference−normalized)発現測定値は2から15までの範囲に及ぶ可能性があり、ここで、1単位の増加は一般に、RNA量における2倍の増加を反映する。
【0095】
リアルタイムPCRは、標的配列ごとの内部競合核酸(competitor)を正規化に使用する定量的比較PCRと、サンプル中に含有する正規化遺伝子またはRT−PCR用ハウスキーピング遺伝子を使用する定量的比較PCRの両方と互換性を持つ。詳細については、例えば、Held et al.,Genome Research 6:986−994(1996)を参照のこと。
【0096】
本開示の方法に用いられる代表的なプロトコールのステップでは、固定パラフィン包埋組織をRNA供給源として使用する。例えば、mRNAの単離、精製、プライマー伸張および増幅は当該技術分野で利用可能な方法を用いて実施できる(例えば、Godfrey et al.J.Molec.Diagnostics 2:84−91(2000);Specht et al.,Am.J.Pathol.158:419−29(2001))を参照のこと。簡潔に言うと、典型的なプロセスでは、初めに、パラフィン包埋腫瘍組織標本の約10μm厚の切片を切断する。その後、RNAを抽出し、蛋白質およびDNAをRNA含有のサンプルから除去する。RNA濃度を解析した後、遺伝子特異的プライマーを使用してRNAを逆転写し、続いてcDNA増幅産物に対してRT−PCRを行う。
【0097】
イントロンベースのPCRプライマーおよびプローブの設計
PCRプライマーおよびプローブは、対象遺伝子のmRNA転写物中に存在するエクソンまたはイントロン配列に基づいて設計できる。プライマー/プローブの設計を行う際は、DNA BLATソフトウェア(開発元:Kent,W.J.,Genome Res.12(4):656−64(2002))等の一般公開されているソフトウェア、またはBLASTソフトウェア(そのバリエーションを含む)を使用できる。
【0098】
必要であるか望ましい場合、標的配列の反復塩基配列は、非特異的シグナルが緩和されるようにマスクし得る。これを遂行するための例示的なツールとしては、反復因子のライブラリに対してDNA配列をスクリーニングし、内部で反復因子がマスクされる問い合わせ配列を返すためのRepeat Maskerプログラム(Baylor College of Medicineを介してオンラインで利用可能な)が挙げられる。その後、Primer Express(Applied Biosystems)、MGB assay−by−design(Applied Biosystems)、Primer3(Steve Rozen and Helen J.Skaletsky(2000)Primer3 on the WWW for general users and for biologist programmers)等の市販またはそれ以外の一般公開されているプライマー/プローブ設計パッケージいずれかを使用して、マスクしたイントロン配列を使用してプライマーおよびプローブ配列を設計することができる。S.Rrawetz,S.Misener,Bioinformatics Methods and Protocols:Methods in Molecular Biology,pp.365−386(Humana Press)を参照のこと。
【0099】
PCRプライマー設計に影響する可能性のある他の因子としては、プライマーの長さ、融解温度(Tm)およびG/C含量、特異性、相補プライマー配列、ならびに3’末端配列が挙げられる。一般に、PCRプライマーは概ね17〜30塩基の長さで、約20〜80%の含有率(例えば、約50〜60%のG+C塩基)であり、50〜80℃の間(例えば、約50〜70℃)の融解温度を呈するものが、最適である。
【0100】
PCRプライマーおよびプローブの設計に関するガイドラインの詳細については、例えば、Dieffenbach,CW.et al,“General Concepts for PCR Primer Design”in:PCR Primer,A Laboratory Manual,Cold Spring Harbor Laboratory Press,.New York,1995,pp.133−155、Innis and Gelfand,“Optimization of PCRs”in:PCR Protocols,A Guide to Methods and Applications,CRC Press,London,1994,pp.5−11、およびPlasterer,T.N.Primerselect:Primer and probe design.Methods MoI.Biol.70:520−527(1997)を参照のこと。それらの開示全体は、本明細書中で引用により明示的に援用されている。
【0101】
本明細書に開示されている実施例と関連するプライマー、プローブ、およびアンプリコン配列に関する詳細は、表Aに記載のとおりである。
【0102】
MassARRAY(登録商標)システム
MassARRAYベースの方法、例えば、Sequenom、Inc.(San Diego、CA)が策定した例示的な方法では、RNAの単離および逆転写の後、採取されたcDNAを競合核酸(competitor)である合成DNA分子でスパイクし、単一塩基を除く全ての位置にある標的cDNA領域と照合して、内部標準として作用する。cDNA/競合核酸(competitor)の混合物は、増幅されたPCRであり、PCR後のシュリンプ由来アルカリホスファターゼ(SAP)酵素処理を施すことによって、残存ヌクレオチドが脱リン酸化される。アルカリホスファターゼの失活後、競合核酸(competitor)およびcDNAからのPCR産物にプライマー伸張法を行い、それによって、競合核酸(competitor)およびcDNAで誘導されたPCR産物に対して明白なマスシグナルを生成する。精製後、これらの生成物をチップアレイ上に分取し、マトリックス支援レーザー脱離イオン化法飛行時間型質量解析計(MALDI−TOF MS)解析での解析に必要とされる成分を予め装填する。その後、反応において存在するcDNAは、生成されたマススペクトルにおけるピーク領域の比率を解析することによって定量化される。詳細については、例えば、Ding and Cantor,Proc.Natl.Acad.Sci.USA 100:3059−3064(2003)を参照のこと。
【0103】
他のPCRベースの方法
本明細書中に開示されている方法に使用できるPCRベースの技術としては、上述のもの以外に、例えば、BeadArray(登録商標)技術(Illumina,San Diego,CA;Oliphant et al.,Discovery of Markers for Disease(Supplement to Biotechniques),June 2002、Ferguson et al.,Analytical Chemistry 72:5618(2000))、遺伝子発現の迅速アッセイ法において市販のLuminex100 LabMAP(登録商標)システムおよび複数カラーコードミクロスフィア(Luminex Corp.,Austin,TX)を用いた遺伝子発現検出用ビーズアレイ法(BeadsArray for Detection of Gene Expression(BADGE))(登録商標))(Yang et al.,Genome Res.11:1888−1898(2001))、ならびに高カバー率遺伝子発現プロフィール(high coverage expression profiling(HiCEP))解析法(Fukumura et al.,Nucl.Acids.Res.31(16)e94(2003))が挙げられる。
【0104】
マイクロアレイ
関心のある遺伝子またはマイクロアレイの発現量の評価には、マイクロアレイ技術を利用することもできる。この方法では、関心のあるポリヌクレオチド配列(cDNAおよびオリゴヌクレオチドを含む)は、基質上に配列される。その後、アレイ配列(arrayed sequence)は、特定のハイブリダイゼーションに好適な条件下で、試験サンプルのRNAから生成された検出可能に標識されたcDNAと接触される。RT−PCR方法の場合と同様にRNA供給源は、典型的には、腫瘍サンプルから単離された総RNAであり、任意選択的には、同じ患者の正常組織から内部標準または細胞系として単離された総RNAである。RNAは、例えば、凍結またはアーカイブされたパラフィン包埋、および固定(例えばホルマリン固定)組織標本から抽出できる。
【0105】
例えば、アッセイ対象となる遺伝子のcDNAクローンのPCR増幅済みインサートは、高密度の配列内の基質に適用される。通常、少なくとも1万のヌクレオチド配列が基質に適用される。例えば、マイクロチップ上に1万要素ごとに不動化されたマイクロアレイ遺伝子は、ストリンジェントな条件下でのハイブリダイゼーションに好適である。蛍光標識cDNAプローブは、関心のある組織から抽出されたRNAの逆転写によって蛍光ヌクレオチドを組み込むことで生成し得る。チップに適用された標識cDNAプローブは、アレイ上のDNAの各スポットと特異的にハイブリダイズする。ストリンジェントな条件下で洗浄して、非特異的に結合しているプローブを取り除いた後、共焦レーザー顕微鏡、または別の検出方法(CCDカメラ等)でチップをスキャンする。各アレイ済み要素のハイブリダイゼーションを定量化することにより、対応するRNAの存在量の評価が可能になる。
【0106】
二色蛍光により、2つのRNA供給源から生成された別個の標識cDNAプローブを、ペアでアレイにハイブリダイズさせる。したがって、各特異的遺伝子に対応する2つの供給源からの転写物の相対存在量が、同時に定量される。ハイブリダイゼーションを小規模化すると、大量の遺伝子の発現パターンを簡便かつ迅速に評価できる。そのような方法は、1細胞あたり2〜3のコピー数で発現される稀少な転写物を検出するだけでなく、発現量において少なくとも約2倍の差を再現的に検出するのにも必要な感度を有することが証明されてきた(Schena et at,Proc.Natl.Acad.ScL USA 93(2):106−149(1996))。マイクロアレイ解析は、Affymetrix GenChip(登録商標)技術またはIncyteのマイクロアレイ技術等の製造業者のプロトコールに従い、市販の機器で実施できる。
【0107】
遺伝子発現の連続解析(SAGE)
遺伝子発現の連続解析(SAGE)は、転写産物ごとに個々のハイブリダイゼーションプローブを提供する必要なしに多数の遺伝子転写物を同時かつ定量的に解析するための方法である。最初に、転写物を一意に同定するのに充分な情報を含む短配列タグ(約10〜14bp)を生成する。ただし、そのタグは、各転写物内の一意の位置から採取されることを条件とする。その後、配列できる多数の転写物を一括に連結し、長い連続分子を形成して、同時に複数のタグの同一性を暴露する。転写物の任意の母集団の発現パターンは、個々のタグの存在量を定量化し、各タグに対応する遺伝子を同定することによって、定量的に評価し得る。詳細については、例えば、Velculescu et al.,Science 270:484−487(1995)、およびVelculescu et al.,Cell 88:243−51(1997)を参照のこと。
【0108】
核酸配列決定による遺伝子発現解析
核酸配列決定技術は、遺伝子発現解析に好適な方法である。これらの方法の基礎をなすのは、サンプル中にcDNA配列が検出される回数が、その配列に対応するRNAの相対的な発現に直接に関連するという原理である。これらの方法は時折、結果として得られたデータの離散的な数値特性を反映する、デジタル遺伝子発現(DGE)という用語で呼ばれることもある。この原理が適用されている初期の方法は、遺伝子発現の連続解析(SAGE)および大量並行シグネチャー配列決定(massively parallel signature sequencing)(MPSS)であった。例えば、S.Brenner,et al.,Nature Biotechnology 18(6):630−634(2000)を参照のこと。最近では、「次世代の」配列決定技術の出現によって、DGEが単純化され、スループットが向上し、しかも入手しやすくなった。その結果、DGEを利用することによって、これまでよりも多くの個々の患者サンプルにおいて従来可能であったよりも多くの遺伝子の発現をスクリーニングできるようになったラボが増加つつある。例えば、J.Marioni,Genome Research 18(9):1509−1517(2008);R.Morin,Genome Research 18(4):610−621(2008);A.Mortazavi,Nature Methods 5(7):621−628(2008);N.Cloonan,Nature Methods 5(7):613−619(2008)を参照のこと。
【0109】
体液からのRNAの単離
発現解析用にRNAを血液、血漿および血清から(例えば、K.Enders,et al.,Clin Chem 48,1647−53(2002)および同書中の引用文献を参照)、更には尿から(例えば、R.Boom,et al.,J Clin Microbiol.28,495−503(1990)および同書中の引用文献を参照)単離する方法が記載されている。
【0110】
免疫組織化学
免疫組織化学方法はまた、遺伝子の発現量の検出に好適であり、本明細書中に開示されている方法に対する適用されている。そのような方法においては、関心のある遺伝子の遺伝子産物と特異的に結合する抗体(例えば、モノクローナル抗体)を使用できる。例えば、放射性ラベル、蛍光ラベル、ビオチン等のハプテンのラベル、またはワサビ由来ペルオキシダーゼもしくはアルカリホスファターゼ等の酵素で抗体自体を直接標識することによって、抗体を検出し得る。あるいは、未標識の一次抗体を、一次抗体に特異的な標識二次抗体と共に使用することもできる。免疫組織化学プロトコールおよびキットは当該技術分野において周知であり、市販されている。
【0111】
プロテオミクス
「プロテオーム」という用語は、或る時点でサンプル(例えば組織、有機体または細胞培養液)中に存在する蛋白質の総量として定義される。プロテオミクスは、とりわけ、サンプルの蛋白質発現の全体的な変更の研究を包含する(「発現プロテオミクス」とも呼ばれる)。プロテオミクスは典型的には、(1)二次元ゲル電気泳動(2−D PAGE)でサンプル中の個々の蛋白質を分離する工程と、(2)ゲルから回収された個々の蛋白質を同定する工程(例えばマイマススペクトロメトリーまたはN末端配列決定)と、(3)バイオインフォマティクスを使用してデータを解析する工程を含む。
【0112】
mRNAの単離、精製および増幅の概説
固定パラフィン包埋組織をRNA供給源として使用した遺伝子発現プロファイリングの代表的プロトコールの工程(mRNAの単離、精製、プライマー伸長および増幅を含む)は、様々な発行ジャーナル記事に提供されている(例えば、T.E.Godfrey,et al.,J.Molec.Diagnostics 2:84−91(2000);K.Specht et al.,Am.J.Pathol.158:419−29(2001),M.Cronin,et al.,Am J Pathol 164:35−42(2004)を参照)。代表的な方法では、まず組織標本部(例えば、パラフィン包埋腫瘍組織標本の約10μm厚の断片)を切断する。次いで、RNAを抽出し、蛋白質およびDNAを除去する。RNA濃度の解析の後、必要に応じてRNA修復を実行する。続いて、例えば、遺伝子特異的プロモーターを使用した逆転写によってサンプルを解析にかけた後、RT−PCRを行うことができる。
【0113】
遺伝子の同定における発現量の統計解析
当業者であれば、本明細書中に記述されているように、関心のある臨床転帰(例えば、再発)とマーカー遺伝子の発現量との間に有意な関係があるかどうかの判定に用いることができる統計的方法が数多くあることは認識されよう。例示的な実施例において、本発明は3つの試験を含む。第1の試験は、前立腺癌患者からの組織およびデータを用いた、層化コホートサンプリングデザイン(ケースコントロールサンプリングの形態)である。標本の選択は、病期T期(T1、T2)、手術年度(<1993、≧1993)、および前立腺切除グリソンスコア(低/中、高)によって層化した。臨床的再発を有する全ての患者を選択し、臨床的再発を経験しなかった患者の層化ランダムサンプルを選択した。患者ごとに、2つまでの濃縮された腫瘍標本、および1つの正常な外観の組織サンプルを検定した。第2の試験では、第1試験から、適合前立腺生検腫瘍組織が検定された70人の患者のサブセットを用いた。第3の試験は、Cleveland Clinic(CC)で1999〜2010年にその前立腺癌の手術を受けた者で、低または中間リスク(AUAによる)の臨床的な限局性前立腺癌を有する全ての患者(評価可能な170人)を含むが、これらの患者は、積極的サーベイランスの妥当な候補であったかもしれないが、生検による前立腺癌の診断から6ヵ月以内にCCでRPを受けた者である。これらの患者からの生検腫瘍組織を検定した。
【0114】
全ての仮説試験が、両側p値を使用してレポートされた。転帰(例えば、臨床的無再発期間(cRFI)、生化学無再発期間(bRFI)、前立腺癌特異的生存率(PCSS)、全体的生存率(OS))と、個々の遺伝子との間に有意な関係があるかどうか、ならびに人口統計的または臨床的共変量を調査する目的で、重み付き擬似最偏尤推定量(maximum weighted pseudo partial−likelihood estimator)を用いたCox比例ハザード(PH)モデルを使用し、危険率(HR)が1であるという帰無仮説のウォールド試験から得られるp値を記録する。個々の遺伝子と特定のサンプルのグリソンパターンとの間に有意な関係があるかどうかを調査する目的で、重み付き擬似最尤法(maximum weighted pseudolikelihood method)を用いた序数ロジスティック回帰(ordinal logistic regression)モデルを使用し、オッズ比(OR)が1であるという帰無仮説のウォールド試験から得られるp値を記録する。個々の遺伝子と、RP時の悪性度進行および/もしくは病期進行または悪性病理との間に有意な関係があるかどうかを調査する目的で、重み付き擬似最尤法(maximum weighted pseudolikelihood method)を用いたロジスティック回帰(logistic regression)モデルを使用し、オッズ比(OR)が1であるという帰無仮説のウォールド試験から得られるp値を記録する。
【0115】
同時発現解析
例示的な実施例において、調査対象となった前立腺癌標本の間での遺伝子発現量の共同相関を評価することもできる。この目的のために、遺伝子および標本の間の相関構造を、階層的クラスター方法を介して調査することもできる。この情報を用いることによって、前立腺癌標本内で高度な相関を示すことが公知である遺伝子同士が、予期したように群生することを確認し得る。一変量Cox PH回帰分析におけるcRFIと名目上有意な(未調整のp<0.05)関係を示す遺伝子だけが、これらの解析の対象として含まれる。
【0116】
現在公知であるかまたは以後に策定される共発現解析方法の多くは、本発明の範囲および趣旨の範囲内に入るであろう。これらの方法は、例えば、相関係数、共発現ネットワーク分析、クリーク分析等を含むものであってもよいし、RT−PCR、マイクロアレイ、塩基配列決定、および他の類似技術から得られる発現データに基づくものであってもよい。例えば、遺伝子発現クラスターは、相関のペアワイズ解析を使用し、ピアソン(Pearson)相関係数またはスピアマン(Spearman)相関係数に基づいて同定し得る(例えば、Pearson K.and Lee A.,Biometrika 2,357(1902);C.Spearman,Amer.J.Psychol 15:72−101(1904);J.Myers,A.Well,Research Design and Statistical Analysis,p.508(2nd Ed.,2003)を参照)。共発現遺伝子を同定する例示的方法を以下の実施例3に記載する。
【0117】
発現量の正規化
本明細書中に開示されている方法に用いられる発現データは、正規化することが可能である。正規化とは、例えば、アッセイされたRNAの量の差、および使用されるRNAの質の変動性を修正(変動性を排除して正規化)して、C
TまたはCp測定値、およびこれらに類するものにおける系統的バリエーションの不要ソースを除去する工程を指す。アーカイブされた固定パラフィン包埋組織標本を含むRT−PCR実験に関して、系統的バリエーションのソースは、患者サンプルの時間経過、およびサンプルの貯蔵に使用される定着剤の種類を基準としたRNA分解の程度を包含したものであることは公知である。系統的バリエーションの他のソースは、ラボの処理条件に起因する。
【0118】
アッセイは、関連する条件の下で発現量に有意な差がない特定の正規化遺伝子の発現を組み込むことにより、正規化を達成することができる。本明細書に開示する例示的な正規化遺伝子としては、ハウスキーピング遺伝子が挙げられる(例えば、E.Eisenberg,et al.,Trends in Genetics 19(7):362−365(2003)を参照)。正規化は、アッセイされた全ての遺伝子の平均値もしくはメジアンシグナル(C
tまたはCp)、またはその大規模サブセット(全体的な正規化手法)に基づいて行うことができる。一般に、リファレンス遺伝子とも呼ばれる正規化遺伝子は、典型的に、前立腺癌において、非癌性前立腺組織と比較して有意に異なる発現量を呈示せず、しかも様々なサンプルおよび処理条件で再現性のあることがわかっている遺伝子であるため、外的影響を受けずに正規化を達成することができる。
【0119】
例示的な実施態様において、mRNA発現データを正規化するための基準として、次の遺伝子の1つ以上を用いる:AAMP、ARF1、ATP5E、CLTC、GPS1およびPGK1。予後遺伝子および予測的遺伝子の各々についての較正済み加重平均C
TまたはCp測定値は、5つ以上のリファレンス遺伝子の平均値を基準にして正規化することができる。
【0120】
当業者であれば、正規化が多数の方法で達成されることは認識されよう。従って、上述の技術は網羅的なものではなく、単なる例示を意図したものである。
【0121】
発現量の標準化
本明細書に開示する方法に用いられる発現データは、標準化することが可能である。標準化は、全ての遺伝子を同等のスケールに有効に変換する方法を指す。この標準化を行う理由は、一部の遺伝子が他に比べて多くの変動を示す(発現がより広範である)ためである。標準化は、その遺伝子の全てのサンプルにおける各発現値をその標準偏差で除算することによって行う。その場合、ハザード比は、発現における1標準偏差増分当たりの臨床エンドポイント(臨床的再発、生物学的再発、前立腺癌による死亡、または何らかの原因による死亡)についてのハザードの比例変動として解釈される。
【0122】
本発明のキット
本発明の方法に使用される材料は、周知の手順に従って製作されたキットの調製に好適である。したがって、本開示は、開示されている遺伝子の発現を定量化し、予後の転帰または治療に対する反応を予測するために、遺伝子特異的プローブ、遺伝子選択プローブおよび/またはプライマーを含有し得る薬剤を含むキットを提供する。そのようなキットは、任意選択的に、腫瘍サンプルからRNAを抽出するための試薬(特に、固定パラフィン包埋組織標本および/またはRNA増幅用試薬)を含んでもよい。加えて、本キットは、任意選択的に、識別用の記載もしくはラベル付きの試薬、または本発明の方法における使用に関する指示を含んでもよい。キットは容器(本方法の自動化実装での使用に好適なマイクロリットルプレートを含む)を備えてもよく、本方法で利用される各種材料または試薬(典型的には、濃縮形態)のうちの1種以上、例えば、クロマトグラフィーカラム、事前作製済み(pre−fabricated)マイクロアレイ、緩衝液、適当なヌクレオチド三リン酸塩(例えば、dATP、dCTP、dGTPおよびdTTP;またはrATP、rCTP、rGTPおよびUTP)、逆転写酵素、DNAポリメラーゼ、RNAポリメラーゼ、ならびに本発明のプローブおよびプライマー(例えば、適当な長さのポリ(T)、またはRNAポリメラーゼと反応するプロモーターに連結されているランダムプライマー)のうちの1つ以上が、各容器に付属する。予後情報または予測的情報の推定または定量化に使用される数学的アルゴリズムもまた、適切にキットの構成要素となり得る。
【0123】
レポート
商業的な診断目的に実施された場合は通常、レポート、即ち、本明細書に記載されている方法で得られる情報のサマリーを生成する。例えば、レポートは、1つ以上の遺伝子の発現量に関する情報、腫瘍もしくは患者の再発リスクの分類、患者に起こり得る予後またはリスク分類、臨床因子および病理学的因子、および/または他の情報を含み得る。本発明の方法およびレポートは、レポートをデータベースに保管する工程を更に含み得る。本方法は、被験者のデータベースに記録を作成し、その記録にデータを取り込むことができる。レポートは、紙レポート、聴覚レポート、または電子記録であり得る。レポートは表示および/またはコンピュータ(例えば、ハンドヘルドデバイス、デスクトップコンピュータ、スマートデバイス、ウェブサイトなど)への保存が可能である。レポートを医師および/または患者に提供するように企図されている。レポートの受信は、データおよびレポートを含むサーバコンピュータへのネットワーク接続を確立する工程と、サーバコンピュータからデータおよびレポートを要求する工程と、を更に含み得る。
【0124】
コンピュータプログラム
上述の分析で得られた値(例えば、発現データ)は計算して手動で保存することができる。代わりに上記のステップは、コンピュータプログラム製品で完全にまたは部分的に実行できる。したがって、本発明は、コンピュータプログラムを保管した記憶媒体(コンピュータによる読み取りが可能)を備えるコンピュータプログラム製品を提供する。プログラムは、コンピュータでの読み取り時に、個体から採取された1つ以上の生体サンプルの分析により得られた値に基づいて、関連する計算を実行できる(例えば、遺伝子の発現量、正規化、標準化、閾値処理(thresholding)および分析で得られた値からスコアへの変換、および/または腫瘍病期および関連情報のテキストもしくはグラフィック描写への変換)。コンピュータプログラム製品の内部には、計算を実行するためのコンピュータプログラムが保存されている。
【0125】
本開示は、上述のプログラムを実行するためのシステムを提供する。本システムは通常、a)中央コンピューティング環境と、b)患者データを受信するコンピューティング環境に作動可能に接続されている入力装置(ここで、患者データが、例えば、発現量、もしくは患者から採取された生物学的サンプルを使用した分析から得られた他の値、または上に詳述されているマイクロアレイデータを含み得る)と、c)情報をユーザー(例えば、医療関係者)に提供するコンピューティング環境に作動可能に接続されている出力装置と、d)中央コンピューティング環境(例えば、プロセッサ)を介して実行されるアルゴリズム(ここで、アルゴリズムは入力装置で受信されるデータに基づいて実行され、かつアルゴリズムは発現スコア、閾値処理(thresholding)または本明細書に記載されている他の関数の計算を行う)と、を備える。本発明により提供される方法は、全面的または部分的に自動化し得る。
【0126】
本発明について説明してきたが、本発明は、下記の実施例を参照することによってさらに容易に理解されるであろう。下記の実施例は、いかなる形であれ発明を限定することを意図するものでなく、例示として提供されている。
【実施例】
【0127】
実施例1:アルゴリズム開発のための81の遺伝子の選択
臨床的再発、生物学的再発および/または前立腺癌による死亡に関連する遺伝子を同定するための遺伝子同定試験については、2010年7月27日に出願された米国仮特許出願第61/368,217号明細書;2010年11月16日に出願された米国仮特許出願第第61/414,310号明細書;および2011年5月12日に出願された米国仮特許出願第61/485,536号明細書;ならびに2011年7月25日に出願され、2012年2月2日に公開された米国特許第20120028264号明細書に記載されている(これらは全て、参照として本明細書に組み込む)。RT−PCR解析を用いて、根治的前立腺切除の治療を受けた早期前立腺癌の患者における前立腺癌組織およびその周囲の正常に見える組織(NAT)での732個の遺伝子およびリファレンス遺伝子のRNA発現量を定量した。臨床的無再発期間(cRFI)、生物的無再発期間(bRFI)、前立腺癌特異的生存(PCSS)、および悪性度進行/病期進行に有意に関連する遺伝子(p<0.05)を決定した。
【0128】
転帰に関連するものとして同定された遺伝子から、続くアルゴリズムの開発のために81の遺伝子を選択した。81の遺伝子(および5つのリファレンス遺伝子)のプライマー、プローブ、およびアンプリコン配列を表Aに記載する。選択した遺伝子は、中でもcRFIおよびその他の特性に関して最も予後徴候を示したものであり、表1A〜1Bに示す。考慮したその他の特性は、以下のものであった:1)一次グリソンパターン腫瘍での遺伝子発現およびcRFIの関連についての平均補正標準化ハザード比への回帰に関して最も強い遺伝子;2)最も高いグリソンパターン腫瘍を用いたcRFIと関連する一致性(ハザード比);3)前立腺癌特異的生存(PCSS)との関連性;4)The University of San Francisco Cancer of the Prostate Risk Assessment(CAPRA)(Cooperberg et al.,J.Urol.173:1983−1942、2005)の調整後の高いハザード比;5)腫瘍の遺伝子発現および手術によるグリソンパターンの関連について統計的に有意なオッズ比;6)大きな全体的変動性(患者内変動性より、患者間変動性が大きい方が好ましい);および7)高い発現度。
【0129】
真の発見率関連度(TDRDA)方法(Crager,Stat Medi.2010年1月15日;29(1):33−45)を遺伝子発現およびcRFIの解析に用い、結果を表1Aに示す。真の発見率関連度は、偽発見率の相対物である。Univariate Cox PH回帰モデルをあてはめ、TDRDAを用いて、平均への回帰(RM)についての標準化ハザード比の推定値を修正し、少なくとも指定レベルの絶対標準化ハザード比を有する遺伝子を同定するための偽発見率を評価した。偽発見率を10%に制御した。TDRDA法によって、指定した比率が、指定レベル以上の絶対関連(ここでは、絶対標準化ハザード比)を有すると予想される遺伝子の集合を同定する。これにより、遺伝子等級付け方法がもたらされるが、この方法は、各遺伝子がTDRDA集合に属する、最大下限(MLB)度の関連を用いる。平均への回帰による「選択偏向」についての近似修正を含む各遺伝子の実際の関連度の推定値は、単純な2変量正規理論とEfronおよびTibshiraniの経験ベイズ法を用いて導き出すことができる。Efron,Annals of Applied Statistics 2:197−223(2008);Efron and Tibshirani.Genetic Epidemiology 23:70−86。表1Aは、一次グリソンパターン(PGP)または最高グリソンパターン(HGP)サンプル遺伝子発現のいずれかを用いた各遺伝子についての標準化ハザード比のRM修正推定値およびMLBを示す。−1の関連方向の付いた遺伝子は、臨床的再発の尤度低減に関連し、1の関連方向の付いた遺伝子は、臨床的再発の尤度増加に関連する。
【0130】
患者への影響をランダムとして扱う混合モデルを用いて、患者内および患者間変量成分を推定した。正規化遺伝子発現の全体的平均および標準偏差ならびに患者内および患者間変量成分を表1Aに示す。
【0131】
重み付き擬似最偏尤推定量を用いた1変量Cox PH回帰を使用して、遺伝子発現と前立腺癌特異的生存(PCSS)との関連を推定した。StoreyのFDR方法を用いた標準化ハザード比(HR)、p値およびq値を表1Bに記載する。Storey,Journal of the Royal Statistical Society,Series B 64:479−498(2002)。q値は、同定された遺伝子が偽発見であるというデータが与えられれば、経験的ベイズ事後確率、すなわち、臨床的再発との関連が一切ない確率として解釈することができる。
【0132】
1変量順序ロジスティック回帰モデルを用いて、遺伝子発現と、一次グリソンパターン腫瘍のグリソンパターンとの関連を推定した(3、4、5)。StoreyのFDR方法を用いた標準化オッズ比(OR)、p値およびq値を表1Bに記載する。
【0133】
図1は、81の遺伝子の関連を表す樹状図の一例を示す。y軸は、1−ピアソン(Pearson)rとして測定したクラスター間の平均距離に一致する。数(距離測定値)が小さければ小さいほど、遺伝子同士が高度に相関している。合併方法は、重み付きペア群平均法である。共発現した遺伝子を樹状図から同定したが、これらを遺伝子群に分類する。
図1に基づき、遺伝子同定試験からの遺伝子を下記の遺伝子群またはサブセットに形成した。
【0134】
細胞構成遺伝子群(BIN1;IGF1;C7;GSN;DES;TGFB1I1;TPM2;VCL;FLNC;ITGA7;COL6A1;PPP1R12A;GSTM1;GSTM2;PAGE4;PPAP2B;SRD5A2;PRKCA;IGFBP6;GPM6B;OLFML3;HLF)
【0135】
基底上皮遺伝子群(CYP3A5;KRT15;KRT5;LAMB3;SDC1)
【0136】
ストレス応答遺伝子群(DUSP1;EGR1;FOS;JUN;EGR3;GADD45B;ZFP36)
【0137】
アンドロゲン遺伝子群(FAM13C;KLK2;AZGP1;SRD5A2)
【0138】
間質遺伝子群(ASPN;SFRP4;BGN;THBS2;INHBA;COL1A1;COL3A1;COL1A2;SPARC;COL8A1;COL4A1;FN1;FAP;COL5A2)
【0139】
増殖遺伝子群(CDC20;TPX2;UBE2T;MYBL2;CDKN2C)
【0140】
【表1】
【0141】
【表2】
【0142】
【表3】
【0143】
【表4】
【0144】
【表5】
【0145】
【表6】
【0146】
【表7】
【0147】
【表8】
【0148】
実施例2:コンパニオン試験からのデータに基づくアルゴリズムの開発
Cleveland Clinic(「CC」)コンパニオン試験は、表2に記載するように、3つの患者コホートおよび各コホートについての個別の解析からなる。第1コホート(表2)は、1987年〜2004年の間にCCでRPを受け、かつ診断生検組織がCCで入手可能であった、遺伝子ID試験09−002からの低〜高リスク(AUA基準に基づく)を有する男性を含む。コホート2および3は、それぞれ、臨床的に決定された低および中間リスク(AUA基準に基づく)前立腺癌を有する男性を含み、彼らは、積極的サーベイランスの妥当な候補であり得たが、生検による前立腺癌の診断から6ヵ月以内に根治的前立腺摘除(RP)を受けた者である。コホート1の主な目的は、生検組織からの分子プロフィールを根治的前立腺摘除組織からのものと比較することであった。コホート2および3の主な目的は、診断時点の低〜中間リスク患者における生検組織を用いて、RP時点の悪性度進行/病期進行の複数遺伝子予測法を開発することであった。
【0149】
遺伝子同定試験からの患者のサブセット(患者70人)について、適合生検サンプルを採取した。81の選択した遺伝子と5つのリファレンス遺伝子(ARF1、ATP5E、CLTC、GPS1、PGK1)の遺伝子発現をRP標本と、これら70人の患者から採取した生検組織において比較した。
【0150】
悪性度進行および病期進行との関連について、81の遺伝子をコホート2および3で評価した。コホート2および3におけるこれら81の遺伝子と悪性度進行および病期進行との関連を表3に示す。P値および標準化オッズ比を記載する。
【0151】
これに関して、「悪性度進行」は、グリソングレードが生検時点での3+3または3+4から、RPの時点での3+4以上になるまでの増加を指す。「悪性度進行2」は、グリソングレードが生検の時点での3+3または3+4から、RPの時点での4+3以上になるまでの増加を指す。
【0152】
【表9】
【0153】
複数の異なるモデルを調査して、RPと生検標本の発現を比較した。RPと生検標本の発現の一致性に基づいて、遺伝子を選択した。
図2A〜2Eは、各患者からの適合サンプルについての正規化遺伝子発現(Cp)の比較を示す散布図であり、x軸はPGP RPサンプル(PGP)からの正規化遺伝子発現であり、また、y軸は、生検サンプル(BX)からの正規化遺伝子発現である。
図3A〜3Dは、生検(BX)およびPGP RPサンプルにおける各遺伝子群内の個々の遺伝子の遺伝子発現の範囲プロットを示す。
【0154】
生検およびRPサンプルにおける遺伝子発現の一致を評価した後、表4に示す以下のアルゴリズム(RSモデル)を開発したが、ここで、重みは、標準化ではなく、正規化データを用いて決定する。細胞構成遺伝子群に属するSRD5A2およびGSTM2などのいくつかの遺伝子も個別に評価し、独立の係数を割り当てた(表4の「その他の」カテゴリーを参照)。別の例において、GSTM1およびGSTM2を酸化「ストレス」群として分類し、係数をこの「ストレス」群に割り当てた(RS20およびRS22モデルを参照)。遺伝子群のいずれにも属さないAZGP1およびSLC22A3などのその他の遺伝子も特定のアルゴリズムに含ませた(例えば、表4の「その他の」カテゴリーを参照)。さらに、FAM13C、KLK2、AZGP1、およびSRD5A2を含むように、アンドロゲン遺伝子群を確立した。BGN、SPARC、FLNC、GSN、TPX2およびSRD5A2などのいくつかの遺伝子は、モデルにおいて評価する前に閾値処理した。例えば、TPX2の場合、4.5に満たない正規化発現値は、4.5に設定し、SRD5A2の場合、5.5に満たない正規化発現値は、5.5に設定した。
【0155】
【表10】
【0156】
【表11】
【0157】
【表12】
【0158】
【表13】
【0159】
【表14】
【0160】
【表15】
【0161】
【表16】
【0162】
【表17】
【0163】
表5Aは、cRまでの時間について、悪性度進行および病期進行ならびに有意な悪性度進行および病期進行の組み合わせについて、実施例1に記載する最初の遺伝子IDからのデータを用いたRSモデルの各々の標準化オッズ比を示す。表5Bは、悪性度進行および病期進行ならびに有意な悪性度進行および病期進行の組み合わせについて、CCコンパニオン(コホート2および3)試験からのデータを用いたRSモデルの各々の性能を示す。これに関して、「悪性度進行」は、グリソングレードが生検時点での3+3または3+4から、根治的前立腺切除の時点で3+4以上になるまでの増加を指す。これに関連して「有意な悪性度進行」は、グリソングレードが生検の時点での3+3または3+4から、根治的前立腺切除の時点で4+3以上になるまでの上昇を指す。
【0164】
さらに、RS25モデルで用いる遺伝子群を単独および様々な組み合わせで評価した。表6Aは、遺伝子同定試験からのデータを用いた解析の結果を示し、
図6Bは、CCコンパニオン試験のコホート2および3からのデータを用いた解析の結果を示す。
【0165】
ある遺伝子について遺伝子発現を閾値処理してもよく、例えば、SRD5A2<5.5であれば、SRD5A2閾値=5.5であるか、またはSRD5A2≧5.5であれば、SRD5A2であり、TPX2<5.0であれば、TPX2閾値=5.0であるか、またはTPX2≧5.0であれば、TPX2である。ここで、遺伝子シンボルは、正規化遺伝子発現値を表す。
【0166】
表4から得られた等級化されていないRSスコアも、0〜100に等級化することができる。例えば、RS27は、以下のように、0〜100に等級化することができる。
【0167】
13.4×(RSu+10.5)<0であれば、RS(等級化)=0であり;0≦13.4×(RSu+10.5)≦100であれば、13.4x(RSu+10.5)であり;または13.4×(RSu+10.5)>100であれば、100である。
【0168】
等級化RSを用いて、以下の表Bに定義する予め規定したカットポイントにより、患者を低、中間、および高RS群に分類することができる。これらのカットポイントは、低RS群と中間RS群との境界、および中間RS群と高RS群との境界を定める。平均して臨床的に有意な低または高リスクを有した患者の実質的割合を同定することを意図する発見調査から、カットポイントを取得した。等級化RSは、小数点以下を四捨五入した後に、RS群の境界を定めるカットポイントを適用する。
【0169】
【表18】
【0170】
【表19】
【0171】
【表20】
【0172】
【表21】
【0173】
【表22】
【0174】
実施例3:共発現した遺伝子を同定するためのクリークスタック解析
この実施例に記載する遺伝子クリークスタック方法の目的は、上に開示した遺伝子と同様か、またはそれより良好な転帰を、信頼性をもって予測するのに用いることができる1セットの共発現(または代替)バイオマーカーをみいだすことであった。共発現マーカーを同定するのに用いた方法を
図4に示す。この共発現バイオマーカーのセットは、科学文献から引用したキュレーティッド(curated)バイオマーカーと一緒に極大クリーク列挙(MCE)をシードすることにより取得した。極大クリーク列挙(MCE)法[Bron et al,1973]は、遺伝子を密に共発現した群に集合させて、同じ群の遺伝子全てが類似した発現プロフィールを有するようにする。1群の遺伝子全てが最低限の類似性条件を満たすとき、その群はクリークと呼ばれる。クリークが、「非類似」遺伝子をそのクリークに一切入らせることなく、可能な限り大きくなったとき、そのクリークは、極大であるという。MCE法を用いて、全ての極大クリークをデータセット内で検索する。この方法を用いて、最大クリーク同士のほぼあらゆる程度の重なりを、この重なりがデータによって支持されている限り見出すことができる。極大クリーク列挙[Borate et al,2009]は、共発現遺伝子モジュール(CGM)を同定する有効な方法であることがわかっている。
【0175】
1.定義
以下の表は、遺伝子クリークスタック解析で一般に用いられるいくつかの用語である。
【0176】
【表23】
【0177】
2.クリークおよびスタックの例
図5は、3つの異なるグラフのファミリーを示す。グラフは、ノード(番号付)と、連結エッジ(線分)から構成される。
図5(a)は、ノード3および4をつなぐエッジがないため、クリークではない。
図5(b)は、グラフ中のノードの全てのペア毎の組み合わせをつなぐエッジがあるので、クリークである。
図5(c)はクリークであるが、クリーク(b)に含まれているので、極大クリークではない。連結エッジを含むグラフが与えられれば、MCEアルゴリズムは、3つ以上のノードを含む極大クリークの全てを体系的に列挙する。例えば、
図6のグラフは、2つの極大クリーク:1−2−3−4−5および1−2−3−4−6を有する。
【0178】
遺伝子発現データに基づく場合、典型的に、互いに非常に類似した極大クリークが多数存在する。これらの極大クリークは、最大クリークのスタックにマージすることができる。スタックは、目的とする最大遺伝子モジュールであり、一般に、極大クリークよりはるかに数が少ない。
図7は、2つの極大クリークのスタッキングを概略的に示す。
【0179】
3.シーディング
代替共発現マーカーを見出す目的で、文献からのバイオマーカーを同定し、これを用いて、MCEおよびスタッキングアルゴリズムをシードすることができる。基本的構想は次の通りである:各シードについて、1セットの極大クリークを計算する(平行MCEアルゴリズムを用いて)。次に、各シードについて得られた極大クリークをスタックし、1セットのシード済スタックを取得する。最後に、シード済スタックをスタックすることにより、「シード済スタックのスタック」を取得する。シード済スタックのスタックは、従来の(すなわち、シードされていない)MCE/スタッキングアルゴリズムを用いて得られるであろうスタックと近似のものである。上に開示した遺伝子と共発現する遺伝子を同定する方法は
図4に示すが、以下に、より詳しく説明する。
【0180】
3.1 シード済MCEアルゴリズム(ステップ1〜4)
1.このプロセスは、シーディング遺伝子の適切な1セット、S
sを同定することにより開始する。この場合、シーディング遺伝子は、上に開示した遺伝子サブセットから選択した。
【0181】
2.指定したシーディング遺伝子を用いて、いずれか2つの遺伝子g
1、g
2の遺伝子発現プロフィール同士の相関の尺度、R(g
1,g
2)を、相関閾値(これを下回ると、g
1、g
2は非相関とみなされ得る)に従って選択する。シーディングセットS
s中の各シーディング遺伝子sについて、R(s、g)が相関閾値より大きいか、またはこれと等しくなるように、データセットにおいて全ての遺伝子ペア(s、g)を見出す。G
sは、s、およびsと相関する全遺伝子のセットの和集合とする。本試験の場合、スピアマン係数を相関の尺度として用い、相関閾値として0.7を用いた。
【0182】
3.G
sにおける遺伝子(g
i,g
j)のペア毎の組み合わせの各々について相関係数を計算する。X
sは、R(g
i,g
j)が、相関閾値より大きいか、またはこれと等しい全遺伝子ペアの集合であるとする。遺伝子を
図5に示すようにプロットすれば、X
sの遺伝子の各ペアの間にエッジ(線分)が存在するであろう。
【0183】
4.各シーディング遺伝子の遺伝子ペアX
sについて、Schmidt et al(J.Parallel Distrib.Comput.69(2009)417−428)に記載されているように、MCEアルゴリズムを実行する。
【0184】
3.2 シード済スタッキングアルゴリズム(ステップ5〜6)
スタッキングの目的は、クリークの数を処理しやすい数の遺伝子モジュール(スタック)に減らすことである。続いて
図4のステップ5および6を実施する。
【0185】
5.各シーディング遺伝子について、最大から最小まで、すなわち最大数のノードから最小数のノードまでクリークを選別する。残ったクリークから、最大の重なりを有するクリークを見出す。重なりがユーザ指定の閾値Tを超えたら、2つのクリークを一緒にマージして、第1スタックを形成する。クリークおよびスタックを最大から最小まで選択し、重なり試験およびマージを繰り返す。このプロセスを新たなマージが起こらなくなるまで繰り返す。
【0186】
6.現時点で、各シーディング遺伝子について1セットのスタックがある。最終ステップにおいて、シードしたスタックの全てを合わせて、1セットのスタック、σにする。最後の計算として、σにおけるスタックの全てをステップ5と全く同様にスタックする。このスタックのスタックは、本試験に用いる遺伝子モジュールのセットである。
【0187】
この方法により同定された遺伝子と共発現することが判明した遺伝子を表8〜11に示す。これらの表にある「スタックID」は、単純に、スタックを列挙するためのインデックスであり、「プローブWt」は、プローブ重み、すなわちプローブ(遺伝子)がスタックに出現した回数を指す。
【0188】
【表24】
【0189】
【表25】
【0190】
【表26】
【0191】
【表27】
【0192】
【表28】
【0193】
【表29】
【0194】
【表30】
【0195】
【表31】
【0196】
【表32】
【0197】
【表33】
【0198】
【表34】
【0199】
【表35】
【0200】
【表36】
【0201】
【表37】
【0202】
【表38】
【0203】
【表39】
【0204】
【表40】
【0205】
【表41】
【0206】
【表42】
【0207】
【表43】
【0208】
【表44】
【0209】
【表45】
【0210】
【表46】
【0211】
【表47】
【0212】
【表48】
【0213】
【表49】
【0214】
【表50】
【0215】
【表51】
【0216】
実施例4:RS27の予測的バリデーション
試験設計および統計方法
表4のアルゴリズムRS27を予測的臨床バリデーション試験において試験した。この試験は、サンフランシスコ、カリフォルニア大学(UCSF)で1997年〜2010年の間に前立腺癌の手術を受けた評価可能な患者395人を含んだ。患者は、臨床的に決定された前立腺癌の低または中間リスク(CAPRAによる)を有し、積極的サーベイランスの妥当な候補となり得たが、生検による前立腺癌の診断から6ヵ月以内に、UCSFでRPを受けた。患者選択のためのランダム化は実施しなかった。各患者について、1つ以上の腫瘍含有針コアを含む1つの固定パラフィン包埋組織(FPET)ブロックからの前立腺生検サンプルを評価した。
【0217】
RS27またはRS27の任意の成分と、RP時点での悪性病理との間に有意な関係があるかどうかを調べるために、多変量および1変量多項ロジスティック回帰モデルを用いて、オッズ比(OR)が1であるという帰無仮説の尤度比(LR)試験からp値を記録した。また、多項ロジスティック回帰モデルを用いて、高グレードまたは非器官限局性疾患の確率の、95%信頼区間を用いた推定値も計算した。RS27、ベースライン共変量、およびこれら要因の組み合わせと、高グレードまたは非器官限局性疾患との関係を評価するために、多変量および1変量2値ロジスティック回帰モデルを用い、オッズ比(OR)が1であるという帰無仮説の尤度比試験からp値を記録した。
【0218】
主要エンドポイントを以下のように計画した。
【0219】
【表52】
【0220】
ここで、グリソンスコア≦3+3およびpT2(「1」を示す)は、リファランスカテゴリーであり、他の全てのカテゴリー(2〜6)をリファランスカテゴリーと比較する。
【0221】
2値ロジスティック回帰モデルで評価した表12の細胞の組み合わせは以下のものを含む。
細胞2、4、6対1、3、5:非器官限局性疾患
細胞5、6対1、2、3、4:高グレード疾患
細胞2、4、5、6対1および3:高グレード
または非器官限局性疾患
【0222】
RS27アルゴリズム
0〜100の等級のRS27を以下のように、リファランス−正規化遺伝子発現測定値から得た。
【0223】
非等級化RS27(RS27u)を表4に示すように定義した。
【0224】
RS27u=0.735*ECM(間質反応)群−0.368*流動(細胞構成)群−0.352*PSA(アンドロゲン)群+0.095*増殖(TPX2)
ここで、
ECM(間質反応)群スコア=0.527*BGN+0.457*COL1A1+0.156*SFRP4
遊走遊走(細胞構成)群スコア=0.163*FLNC+0.504*GSN+0.421*TPM2+0.394*GSTM2
PSA(アンドロゲン)群スコア=0.634*FAM13C+1.079*KLK2+0.642*AZGP1+0.997*SRD5A2閾値
増殖(TPX2)スコア=TPX2閾値
【0225】
上記式中、SRD5A2およびTPX2についての閾値処理遺伝子スコアは、以下のように計算する。
【数1】
【数2】
【0226】
次に、RS27uを以下のように0〜100の間で再等級化する。
【数3】
【0227】
以下の表13に定義する予め指定したカットポイントを用いて、低、中間および高RS27群に患者を分類した。これらのカットポイントは、低および中間RS27群の間の境界と、中間および高RS27群の間の境界を定めた。カットポイントは、平均して、悪性病理の臨床的に有意な低または高リスクを有した患者の実質的割合を決定することを目的とする発見調査から導き出した。RS27を整数に四捨五入してから、RS27群の境界を定めるカットポイントを適用した。
【0228】
【表53】
【0229】
アッセイ方法
Shandon Xylene代替品(Thermo Scientific,Kalamazoo,MI)を用いて、サンプルからパラフィンを除去した。Agencourt(登録商標)FormaPure(登録商標)XPキット(Beckman Coulter,Beverly,MA)を用いて、核酸を単離した。
【0230】
Quant−iT(商標)RiboGreen(登録商標)RNA Assayキット(Invitrogen(商標),Carlsbad,CA)を用いて、RNAの量を決定した。定量したRNAを、Omniscript(登録商標)RTキット(Qiagen,Valencia,CA)を用いて、相補的DNAに変換した後、表Aに示すように、RS27の12の遺伝子と5つの正規化遺伝子(ARF1、ATP5E、CLTC、GPS1、PGK1)の逆プライマーと結合させた。反応物を37℃で60分インキュベートした後、93℃で5分不活性化した。
【0231】
Genomic Health,Inc.の要請で、Life Technologies(Carlsbad,CA)により製造された特注TaqMan(登録商標)PreAmp Master Mix、ならびに表Aに示す全ての標的についてのフォワードおよびリバースプライマーを用いて、cDNAを予め増幅した。反応物をサーモサイクラー(DNA Engine(登録商標)PTC200G,Bio−Rad,Hercules,CA)内に配置し、下記の条件下でインキュベートした:A)95℃で15秒;B)60℃で4分;C)95℃で15秒の後、D)ステップBおよびCを8回繰り返した。増幅した産物を、表Aに示す標的の各々についてのフォワードおよびリバースプライマーならびにQuantiTect(登録商標)Primer Assayマスターミックス(Qiagen,Valencia,CA)と混合した後、LightCycler 480(Roche Applied Science,Indianapolis,IN)中で45サイクルにわたり増幅した。クロッシングポイント(Cp)法を用いて発現量を計算した。
【0232】
結果
RS27は、悪性病理、非器官限局性疾患、高グレード疾患、および高グレードまたは非器官限局性疾患を有意に予測したため、表14、15、16および17にそれぞれ示す生検グリソンスコアを超える値を付加する。
【0233】
【表54】
【0234】
【表55】
【0235】
【表56】
【0236】
【表57】
【0237】
さらに、RS27は、表18に示すように、従来の臨床/病理治療指数を超える悪性病理を予測した。
【0238】
【表58】
【0239】
CAPRAなどの従来の臨床/病理治療ツールに追加すると、RS27は、高グレードまたは非器官限局性疾患のリスクをさらに精密化した。CAPRAを単独で用いた場合、患者の5%が、高グレードまたは非器官限局性疾患から自由である85%超の確率を有するとして同定されたのに対し、CAPRAにRS27を併用すると、患者の22%が、高グレードまたは非器官限局性疾患から自由であるとものとして同定された(
図8)。
【0240】
AUA(D’Amico et al.,JAMA 280:969−974,1998)などの従来の臨床/病理治療ツールに追加すると、RS27は、高グレードまたは非器官限局性疾患のリスクをさらに精密化した。
図9に示すように、AUAを単独で用いた場合、患者の0%が、高グレードまたは非器官限局性疾患から自由である80%超の確率を有するものとして同定されるのに対し、AUAにGPSを併用すると、患者の27%が、高グレードまたは非器官限局性疾患を含まないものとして同定される。
【0241】
また、表19、20、21および22にそれぞれ示すように、1変量解析において、RS27の個々の遺伝子および遺伝子群を悪性病理、高グレード疾患、非器官限局性疾患、および高グレードまたは非器官限局性疾患とも関連させた。
【0242】
【表59】
【0243】
【表60】
【0244】
【表61】
【0245】
【表62】
【0246】
実施例5:RS27は、臨床的再発の予測において、PTEN/TMPRSS2−ERG状態以外の価値を付加する
PTEN突然変異およびTMPRSS2−ERG融合遺伝子は、一般に、前立腺癌の予後不良に関連している。ここで、RS27を解析することにより、RS27が、臨床的再発の予測において、PTEN/TMPRSS2−ERG状態以外の価値を付与することができるかどうかを決定した。
【0247】
上記実施例1および米国特許公開第20120028264号明細書に記載されている遺伝子同定試験で得られたPTENおよびTMPRSS2−ERG融合物発現レベルを用いて、患者をPTEN低およびPTEN正常グループに層化した。患者のPTENおよびTMPRSS2−ERG(「T2−ERG」)状態は、下記のように判明した。
【0248】
【表63】
【0249】
「PTEN低」のカットポイントを≦8.5に設定したが、これは、約13%のT2−ERG陰性患者と28%のT2−ERG陽性患者を含んだ。PTEN正常は、>8.5として定めた。
【0250】
1変量Cox比例ハザードを適用して、PTEN状態および時間と臨床的再発(cR)の関連を評価した。
図10および表24は、PTEN低の患者が、PTEN正常の患者と比較して、より高い再発のリスクを有することを示している。
【0251】
【表64】
【0252】
患者をPTEN低/T2−ERG陰性(「カテゴリー0」)、PTEN低/T2−ERG陽性(「カテゴリー1」)、PTEN正常/T2−ERG陰性(「カテゴリー2」)、およびPTEN正常/T2−ERG陽性(「カテゴリー3」)にさらに層化したところ、両方のPTEN低カテゴリーが、
図11および表25に示すように、PTEN正常の患者と比較して、最も低い再発率を有した。
【0253】
【表65】
【0254】
以下の表は、PTEN/T2−ERG状態(表26)またはPTEN状態(表27)、RS27、ならびに生検グリソンスコア(Bx GS)を用いた多変量モデルの結果をまとめるが、これらにより、RS27が、臨床的再発の予測において、PTENおよびT2−ERGマーカーならびに生検GS以外の価値を付加することが明らかである。
【0255】
【表66】
【0256】
【表67】
【0257】
【表68】
【0258】
【表69】
【0259】
【表70】
【0260】
【表71】
【0261】
【表72】
【0262】
【表73】