(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】
(24)【登録日】2022-03-17
(45)【発行日】2022-03-28
(54)【発明の名称】癌の臨床転帰を予測する方法
(51)【国際特許分類】
C12Q 1/6851 20180101AFI20220318BHJP
C12Q 1/6806 20180101ALI20220318BHJP
C12Q 1/6886 20180101ALI20220318BHJP
G01N 33/53 20060101ALI20220318BHJP
G01N 33/574 20060101ALI20220318BHJP
G16B 25/10 20190101ALI20220318BHJP
【FI】
C12Q1/6851 Z ZNA
C12Q1/6806 Z
C12Q1/6886 Z
G01N33/53 M
G01N33/574 Z
G16B25/10
(21)【出願番号】P 2018145578
(22)【出願日】2018-08-02
(62)【分割の表示】P 2016129697の分割
【原出願日】2010-11-19
【審査請求日】2018-08-27
【審判番号】
【審判請求日】2020-12-28
(32)【優先日】2009-11-23
(33)【優先権主張国・地域又は機関】US
(73)【特許権者】
【識別番号】504345126
【氏名又は名称】ジェノミック ヘルス, インコーポレイテッド
(74)【代理人】
【識別番号】100149294
【氏名又は名称】内田 直人
(72)【発明者】
【氏名】ベイカー,ジョフリ ビー.
(72)【発明者】
【氏名】クローニン,モーリーン ティー.
(72)【発明者】
【氏名】コリン,フランソア
(72)【発明者】
【氏名】リュー,メイ-ラン
【合議体】
【審判長】上條 肇
【審判官】平林 由利子
【審判官】長井 啓子
(56)【参考文献】
【文献】特表2006-516897(JP,A)
【文献】特表2005-519624(JP,A)
【文献】Br. J. Cancer,2009,Vol.101,No.1,pp.166-173
【文献】Cancer,2000,Vol.88,No.9,pp.2061-2071
【文献】Somat.Cell Mol. Genet.,1992,Vol.18,No.5,pp.477-483
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00-15/90
C12Q 1/68- 1/6897
PubMed
BIOSIS/MEDLINE/WPIDS/WPIX(STN)
JSTPlus(JDreamIII)
(57)【特許請求の範囲】
【請求項1】
乳癌と診断されたヒト患者の臨床転帰を予測するための方法であって、
(a)患者の乳癌腫瘍から得られた試料におけるBIRC5(別名、サバイビン、SURV)、UBE2CおよびIL6STの各々のRNA転写物のレベルを定量的に測定するステップと、
(b)前記BIRC5、UBE2CおよびIL6STのRNA転写物のレベルを正規化して、正規化BIRC5、UBE2CおよびIL6ST発現レベルを得るステップと、
(c)前記正規化BIRC5、UBE2CおよびIL6ST発現レベルを、乳癌参照セットから得た正規化BIRC5、UBE2CおよびIL6ST発現レベルと比較するステップと、
(d)前記正規化IL6ST発現レベルが、乳癌参照セットから得られる正規化IL6ST発現レベルに比して増加しており、かつ、前記正規化BIRC5およびUBE2C発現レベルが、乳癌参照セットから得られる正規化BIRC5およびUBE2C発現レベルに比して減少している場合に、前記患者が予後が良好である可能性が高いことを決定するステップであって、このとき良好な予後が、再発又は転移の可能性の低減ないしは全生存期間の増加である、ステップと、
を含む方法。
【請求項2】
前記正規化BIRC5、UBE2CおよびIL6STの発現レベルに基づきレポートを生成するステップをさらに含む、請求項1に記載の方法。
【請求項3】
前記試料が固定パラフィン包埋組織試料である、請求項1又は2に記載の方法。
【請求項4】
前記BIRC5、UBE2CおよびIL6STのRNA転写物のレベルがPCRベースの方法を用いて測定される、請求項1から3のいずれか一項に記載の方法。
【請求項5】
前記BIRC5、UBE2CおよびIL6STのRNA転写物のレベルが逆転写およびデジタル遺伝子発現核酸配列決定を用いて測定される、請求項1から3のいずれか一項に記載の方法。
【請求項6】
前記試料がコア生検又は細針吸引によって得られる、請求項1から
5のいずれか一項に記載の方法。
【請求項7】
前記BIRC5、UBE2CおよびIL6STのRNA転写物のレベルがクロッシングポイント(C
p)値であり、前記正規化BIRC5、UBE2CおよびIL6STの発現レベルが正規化C
p値である、請求項1から
6のいずれか一項に記載の方法。
【請求項8】
前記BIRC5、UBE2CおよびIL6STのRNA転写物のレベルが閾値サイクル(C
t)値であり、前記正規化BIRC5、UBE2CおよびIL6STの発現レベルが正規化C
t値である、請求項1から
6のいずれか一項に記載の方法。
【請求項9】
予後良好が再発又は転移の可能性の低減である、請求項1から
8のいずれか一項に記載の方法。
【請求項10】
前記乳癌が、エストロゲン受容体(ER)陽性乳癌である、請求項1から
9のいずれか一項に記載の方法。
【請求項11】
乳癌と診断されたヒト患者の臨床転帰を予測するための方法であって、
(a)患者から得られる乳癌組織試料からRNAを抽出するステップと、
(b)BIRC5、UBE2CおよびIL6STの各々のRNA転写物を逆転写して、BIRC5、UBE2CおよびIL6STのcDNAを製造するステップと、
(c)BIRC5、UBE2CおよびIL6STのcDNAを増幅して、BIRC5、UBE2CおよびIL6STのRNA転写物のアンプリコンを製造するステップと、
(d)前記アンプリコンのレベルを定量的にアッセイするステップと、
(e)少なくとも1つの参照RNA転写物のアンプリコンレベルに対して前記アンプリコンレベルを正規化して、正規化BIRC5、UBE2CおよびIL6STのアンプリコンレベルを提供するステップと、
(f)前記正規化BIRC5、UBE2CおよびIL6STアンプリコンレベルを、乳癌参照セットから得られる正規化BIRC5、UBE2CおよびIL6STのアンプリコンレベルと比較するステップと、
(g)前記正規化IL6STアンプリコンレベルが、乳癌参照セットから得られる正規化IL6STアンプリコンレベルに比して増加しており、かつ、前記正規化BIRC5およびUBE2Cアンプリコンレベルが、乳癌参照セットから得られる正規化BIRC5およびUBE2Cアンプリコンレベルに比して減少している場合に、前記患者が予後が良好である可能性が高いことを決定するステップであって、このとき良好な予後が、再発又は転移の可能性の低減ないしは全生存期間の増加である、ステップと、
を含む方法。
【請求項12】
前記正規化BIRC5、UBE2CおよびIL6STのアンプリコンレベルに基づきレポートを生成するステップをさらに含む、請求項
11に記載の方法。
【請求項13】
前記組織試料が、固定パラフィン包埋組織である、請求項
11又は
12に記載の方法。
【請求項14】
前記BIRC5、UBE2CおよびIL6STのcDNAがPCRベースの方法を用いて増幅される、請求項
11から
13のいずれか一項に記載の方法。
【請求項15】
前記BIRC5、UBE2CおよびIL6STのcDNAがデジタル遺伝子発現核酸配列決定を用いて増幅される、請求項11から13のいずれか一項に記載の方法。
【請求項16】
前記BIRC5、UBE2CおよびIL6STのアンプリコンのレベルがクロッシングポイント(C
p)値であり、前記正規化BIRC5、UBE2CおよびIL6STのアンプリコンレベルが正規化C
p値である、請求項
11から
15のいずれか一項に記載の方法 。
【請求項17】
前記BIRC5、UBE2CおよびIL6STのアンプリコンのレベルが閾値サイクル(C
t)値であり、前記正規化BIRC5、UBE2CおよびIL6STアンプリコンレベルが正規化C
t値である、請求項
11から
15のいずれか一項に記載の方法。
【請求項18】
予後良好が再発又は転移の可能性の低減である、請求項
11から
17のいずれか一項に記載の方法。
【請求項19】
前記乳癌が、エストロゲン受容体(ER)陽性乳癌である、請求項
11から
18のいずれか一項に記載の方法。
【請求項20】
乳癌と診断されたヒト患者を予後によって分類するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、
1つ又は複数のメモリ
ユニットと
1つ又は複数のプロセッサ
ユニットとを有するコンピュータと協働して使用され、符号化されたコンピュータプログラムを有するコンピュータ可読記憶媒体を具備し、前記コンピュータプログラム製品は、コンピュータの前記1つ又は複数のメモリユニットにロードされ、且つ前記コンピュータの前記1つ又は複数のプロセッサユニットに、
(a)前記患者の乳癌腫瘍から得られる組織試料におけるBIRC5、UBE2CおよびIL6STの各々のRNA転写物のレベルを含むデータを受け取るステップと、
(b)前記レベルを正規化して、正規化BIRC5、UBE2CおよびIL6STの発現レベルを得るステップと、
(c)前記正規化BIRC5、UBE2CおよびIL6STの発現レベルを、乳癌参照セットから得られる正規化BIRC5、UBE2CおよびIL6STの発現レベルと比較するステップと、
(d)前記正規化IL6ST発現レベルが、乳癌参照セットから得られる正規化IL6ST発現レベルに比して増加しており、かつ、前記正規化BIRC5およびUBE2C発現レベルが、乳癌参照セットから得られる正規化BIRC5およびUBE2C発現レベルに比して減少している場合に、前記患者が予後が良好である可能性が高いと分類するステップであって、このとき良好な予後が、再発又は転移の可能性の低減ないしは全生存期間の増加である、ステップと
を実行させる、コンピュータプログラム製品。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本願は、2009年11月23日に出願された米国仮特許出願第61/263,763号の利益を主張し、この出願は全体として参照により本明細書に援用される。
【背景技術】
【0002】
癌専門医は、「標準処置」として特徴付けられる治療レジメンの種々の組み合わせを含め、医師らに利用可能な数多くの治療オプションを有する。アジュバント治療がもたらす絶対利益は不良な予後像の患者でより大きく、その結果、アジュバント化学療法にこれらのいわゆる「ハイリスク」患者のみを選択する方針となっている。例えば、S.Paikら,J Clin Oncol.24(23):3726~34頁(2006年)を参照のこと。従って、良好な治療転帰の可能性を最も高くするには、患者に利用可能な最善の癌治療を割り当てること、及びその割り当てが診断後、可能な限り迅速に行われることが必要である。
【0003】
今日の我々の医療制度は非効率性と無駄な支出に満ち溢れている-その一例は、僅か約25%の確率でしか効かない多くの腫瘍治療薬の有効率である。こうした癌患者の多くは、効いていないかもしれない高額の治療に対して中毒性副作用を経験している。高い治療費と低い治療効果とのこの不均衡は、多くの場合に、特定の診断を多様な患者集団にわたって一つの方法で治療することから生じる。しかしながら、遺伝子プロファイリングツール、ゲノム検査、及び先端的診断法の出現により、これは変わり始めている。
【0004】
特に、患者が乳癌と診断されると、医師による疾患の予想経過、例えば癌再発の可能性及び患者の長期生存などの予測、並びにそれに応じた最適な治療オプションの選択を可能にする方法が強く求められる。乳癌において認められている予後因子及び予測因子としては、年齢、腫瘍サイズ、腋窩リンパ節の状態、腫瘍組織型、病理学的悪性度及びホルモン受容体の状態が挙げられる。しかしながら、分子診断によると、標準的な予後指標で可能な場合と比べてより多くの低リスク乳癌患者が同定されることが実証されている。S.Paik,The Oncologist 12(6):631~635頁(2007年)。
【0005】
近年の進歩にもかかわらず、特定の治療レジメンによる病原が異なる腫瘍型の標的化、及び最良の転帰を得るための最終的な腫瘍治療の個別化は、依然として乳癌治療の課題である。予後及び臨床転帰の正確な予測があれば、癌専門医は、再発又は予後不良リスクが高い女性ほどより積極的な治療を受け得るように、アジュバント化学療法の投与を調整することが可能となり得る。さらに、リスクに基づき患者を正確に層別化できれば、治療からの予想される絶対利益の理解が大幅に進み、従って新規乳癌療法の臨床試験の奏効率が上昇し得る。
【0006】
現在、診療で用いられている大部分の診断検査は、定量的なものではなく、免疫組織化学(IHC)に頼ることが多い。この方法では、しばしば検査機関によって異なる結果がもたらされ、これは一つには試薬が標準化されていないためであり、一つには解釈が主観的で、容易には定量できないためである。他のRNAベースの分子診断には新鮮凍結組織が必要であり、これは現行の臨床実践及び試料の輸送規制と適合しないことを含め、無数の課題を提起する。固定パラフィン包埋組織はより容易に入手することができ、固定組織でRNAを検出する方法は確立されている。しかしながら、典型的にはこれらの方法では、少量の材料から多数の遺伝子(DNA又はRNA)の試験を行うことができない。従って従来から、固定組織がタンパク質のIHC検出以外で使用されることはほとんどない。
【先行技術文献】
【非特許文献】
【0007】
【文献】S.Paikら,J Clin Oncol.24(23):3726~34頁(2006年)
【文献】S.Paik,The Oncologist 12(6):631~635頁(2007年)
【発明の概要】
【課題を解決するための手段】
【0008】
本発明は、その発現レベルが癌における特定の臨床転帰と関連付けられる遺伝子のセットを提供する。例えば、患者が標準処置を受けると仮定して、臨床転帰は予後が良いことでも、又は予後が悪いことでもあり得る。臨床転帰は、臨床エンドポイント、例えば、無疾患又は無再発生存、無転移生存、全生存等によって定義されてもよい。
【0009】
本発明は、セット中のあらゆるマーカーのアッセイについて、アーカイブのパラフィン包埋生検材料の使用に対応し、従って最も広く利用可能な種類の生検材料に適合する。本発明はまた、いくつかの異なる腫瘍組織採取方法、例えばコア生検又は細針吸引による方法にも適合する。組織試料は癌細胞を含み得る。
【0010】
一態様において、本発明は癌患者の臨床転帰を予測する方法に関し、これは、(a)患者の腫瘍から得られた組織試料から、表1~表12に掲載される少なくとも1つの予後遺伝子の発現産物(例えば、RNA転写物)の発現レベルを得るステップと;(b)少なくとも1つの予後遺伝子の発現産物の発現レベルを正規化して、正規化発現レベルを得るステップと;(c)正規化発現値に基づきリスクスコアを計算するステップであって、表1、表3、表5、及び表7の予後遺伝子の発現増加は予後良好と正の相関を有し、並びに表2、表4、表6、及び表8の予後遺伝子の発現増加は予後良好と負の関連を有する、ステップとを含む。いくつかの実施形態において、腫瘍はエストロゲン受容体陽性である。他の実施形態において、腫瘍はエストロゲン受容体陰性である。
【0011】
一態様において、本開示は癌患者の臨床転帰を予測する方法を提供し、これは、(a)患者の腫瘍から得られた組織試料から、少なくとも1つの予後遺伝子の発現産物(例えば、RNA転写物)の発現レベルを得るステップであって、少なくとも1つの予後遺伝子が、GSTM2、IL6ST、GSTM3、C8orf4、TNFRSF11B、NAT1、RUNX1、CSF1、ACTR2、LMNB1、TFRC、LAPTM4B、ENO1、CDC20、及びIDH2から選択される、ステップと;(b)少なくとも1つの予後遺伝子の発現産物の発現レベルを正規化して、正規化発現レベルを得るステップと;(c)正規化発現値に基づきリスクスコアを計算するステップであって、GSTM2、IL6ST、GSTM3、C8orf4、TNFRSF11B、NAT1、RUNX1、及びCSF1から選択される予後遺伝子の発現増加は予後良好と正の相関を有し、並びにACTR2、LMNB1、TFRC、LAPTM4B、ENO1、CDC20、及びIDH2から選択される予後遺伝子の発現増加は予後良好と負の関連を有する、ステップとを含む。いくつかの実施形態において、腫瘍はエストロゲン受容体陽性である。他の実施形態において、腫瘍はエストロゲン受容体陰性である。
【0012】
様々な実施形態において、少なくとも2個、又は少なくとも5個、又は少なくとも10個、又は少なくとも15個、又は少なくとも20個、又は少なくとも25個の予後遺伝子の正規化発現レベル(遺伝子の発現産物のレベルをアッセイすることにより決定されるとおりの)が決定される。代替的実施形態において、表16~表18にある、予後遺伝子と共発現する遺伝子の少なくとも1つの正規化発現レベルが得られる。
【0013】
別の実施形態において、リスクスコアは、少なくとも1つの間質グループ若しくはトランスフェリン受容体グループの遺伝子、又は間質グループ若しくはトランスフェリン受容体グループの遺伝子と共発現する遺伝子の正規化発現レベルを用いて決定される。
【0014】
別の実施形態において、癌は乳癌である。別の実施形態において、患者はヒト患者である。
【0015】
さらに別の実施形態において、癌はER陽性乳癌である。
【0016】
さらに別の実施形態において、癌はER陰性乳癌である。
【0017】
さらなる実施形態において、発現産物はRNAを含む。例えばRNAは、エクソンRNA、イントロンRNA、又は短鎖RNA(例えば、マイクロRNA、siRNA、プロモーター関連小分子RNA、shRNA等)であってもよい。様々な実施形態において、RNAは断片化RNAである。
【0018】
異なる態様において、本発明は、表1~表12に掲載される予後遺伝子の少なくとも1つのRNA転写(RNA transcription)とハイブリダイズするポリヌクレオチドを含むアレイに関する。
【0019】
さらに別の態様において、本発明は、患者に個別化されたゲノムプロファイルを調製する方法であって、(a)患者の腫瘍から得られた組織試料から、表1~表12に掲載される少なくとも1つの予後遺伝子の発現産物(例えば、RNA転写物)の発現レベルを得るステップと;(b)少なくとも1つの予後遺伝子の発現産物の発現レベルを正規化して、正規化発現レベルを得るステップと;(c)正規化発現値に基づきリスクスコアを計算するステップであって、表1、表3、表5、及び表7の予後遺伝子の発現増加は予後良好と正の相関を有し、並びに表2、表4、表6、及び表8の予後遺伝子の発現増加は予後良好と負の関連を有する、ステップとを含む。いくつかの実施形態において、腫瘍はエストロゲン受容体陽性であり、他の実施形態において、腫瘍はエストロゲン受容体陰性である。
【0020】
様々な実施形態において、本方法は、レポートを提供するステップをさらに含むことができる。このレポートは、前記患者が特定の臨床転帰を有するリスクの可能性の予測を含み得る。
【0021】
本発明はさらに、癌再発のリスクに基づき癌患者を分類するためのコンピュータ実装方法を提供し、これは、(a)コンピュータ上で、患者から採取された腫瘍組織試料における複数の予後遺伝子の発現産物の発現レベルの測定値を含む発現プロファイルに基づき前記患者を予後良好又は予後不良として分類するステップであって、前記複数の遺伝子が、表1~表12のいずれかに掲載される少なくとも3つの異なる予後遺伝子を含み、予後良好は初回診断後の所定期間内における無再発又は無転移を予測し、及び予後不良は初回診断後の前記所定期間内における再発又は転移を予測する、ステップと;(b)前記発現レベルに基づきリスクスコアを計算するステップとを含む。
【発明を実施するための形態】
【0022】
定義
特に定義されない限り、本明細書で使用される科学技術用語は、本発明が属する技術分野の当業者が一般的に理解するのと同じ意味を有する。Singletonら,「Dictionary of Microbiology and Molecular Biology」第2版,J.Wiley & Sons(New York,NY 1994年)、及びMarch,「Advanced Organic Chemistry Reactions,Mechanisms and Structure」第4版,John Wiley & Sons(New York,NY 1992年)は、本願で使用される用語の多くに対する一般的な指針を当業者に提供する。
【0023】
当業者は、本明細書に記載されるものと同様又は同等の、本発明の実施に用いられ得る多くの方法及び材料を認識し得る。実際、本発明は、記載される方法及び材料に何ら限定されるものではない。本発明の目的上、以下の用語は下記のとおり定義される。
【0024】
「予後因子」は、癌の自然歴に関する変動要素であって、患者の癌発症後の再発率及び転帰に影響を与える変動要素である。より悪い予後と関連付けられている臨床パラメータとしては、例えばリンパ節での併発、及び高悪性度の腫瘍が挙げられる。予後因子は、患者を基礎的な再燃リスクの差によりサブグループに類別するために用いられることが多い。
【0025】
用語「予後」は、本明細書では、乳癌などの新生物疾患の、再発、転移拡散、及び薬剤耐性を含めた癌に起因する死亡又は進行の可能性の予測を指して使用される。用語「予後良好」は、望ましい又は「ポジティブな」臨床転帰を意味する。例えば、乳癌との関連において予後良好は、乳癌の初回診断から2年、3年、4年、5年又はそれ以上の年数以内における無再発又は無転移の予想であり得る。用語「予後が悪い」又は「予後不良」は、本明細書では望ましくない臨床転帰を意味して同義的に使用される。例えば、乳癌との関連において予後が悪いとは、乳癌の初回診断から2年、3年、4年、5年又はそれ以上の年数以内における再発又は転移の予想であり得る。
【0026】
用語「予後遺伝子」は、本明細書では、その発現が標準処置で治療される癌患者についての予後良好と正又は負の相関を有する遺伝子を指して使用される。遺伝子は、遺伝子発現レベルの対応するエンドポイントとの相関関係に応じて、予後遺伝子及び予測遺伝子の双方であり得る。例えば、Cox比例ハザードモデルを使用して、遺伝子が予後遺伝子のみである場合、標準処置で治療される患者又は新規のインターベンションで治療される患者において測定したとき、そのハザード比(HR)は変化しない。
【0027】
用語「予測遺伝子」は、本明細書では、その発現が治療に対する有益な応答に対する応答と正又は負の相関を有する遺伝子を指して使用される。例えば、治療は化学療法を含み得る。
【0028】
用語「リスクスコア」又は「リスク分類」は、本明細書では同義的に使用され、患者が特定の臨床転帰を経験するリスク(又は可能性)のレベルを表す。患者はリスクグループに分類され得るか、又は本開示の方法に基づくリスクのレベル、例えば高度、中程度、又は低度リスクで分類され得る。「リスクグループ」は、特定の臨床転帰について同様のリスクレベルを有する対象又は個体のグループである。
【0029】
臨床転帰は種々のエンドポイントを使用して定義することができる。用語「長期」生存は、本明細書では、特定の期間にわたる、例えば、少なくとも3年にわたる、より好ましくは少なくとも5年にわたる生存を指して使用される。用語「無再発生存」(RFS)は、本明細書では、無作為化から最初の癌再発又は癌の再発に起因する死亡までの期間(通常は年数)にわたる生存を指して使用される。用語「全生存」(OS)は、本明細書では、無作為化から任意の原因による死亡までの時間(年数)を指して使用される。用語「無病生存」(DFS)は、本明細書では、無作為化から最初の癌再発又は任意の原因による死亡までの期間(通常は年数)にわたる生存を指して使用される。
【0030】
上記に挙げる尺度の計算は、実際には、打ち切られるか、或いは考慮されないイベントの定義に応じて試験毎に異なり得る。
【0031】
用語「バイオマーカー」は、本明細書で使用されるとき、遺伝子、遺伝子産物を使用して測定されるときの、その発現レベルを指す。
【0032】
用語「マイクロアレイ」は、基板上のハイブリダイズ可能なアレイエレメント、好ましくはポリヌクレオチドプローブの規則正しい配列を指す。
【0033】
本明細書で使用されるとき、用語「正規化発現レベル」は、遺伝子に対して用いられるとき、正規化された遺伝子産物レベル、例えば、遺伝子のRNA発現レベル又は遺伝子のポリペプチド発現レベルについて決定された正規化値を指す。
【0034】
用語「Ct」は、本明細書で使用されるとき、閾値サイクル、定量的ポリメラーゼ連鎖反応(qPCR)において反応ウェル内で発生する蛍光が定義された閾値を超えるときのサイクル数、すなわち反応中に十分な数のアンプリコンが蓄積して定義された閾値に達した点を指す。
【0035】
用語「遺伝子産物」又は「発現産物」は、本明細書では、mRNAを含めた遺伝子のRNA転写産物(転写物)、及びかかるRNA転写物のポリペプチド翻訳産物を指して使用される。遺伝子産物は、例えば、スプライシングされていないRNA、mRNA、スプライス変異型mRNA、マイクロRNA、断片化RNA、ポリペプチド、翻訳後修飾されたポリペプチド、スプライス変異型ポリペプチド等であり得る。
【0036】
用語「RNA転写物」は、本明細書で使用されるとき、遺伝子のRNA転写産物を指し、例えば、mRNA、スプライシングされていないRNA、スプライス変異体mRNA、マイクロRNA、及び断片化RNAが挙げられる。「断片化RNA」は、本明細書で使用されるとき、RNA インタクトなRNAと、試料処理(例えば、固定、組織ブロックの切片化等)の結果として分解されたRNAとの混合物を指す。
【0037】
特に指示がない限り、本明細書で使用される各遺伝子名は、本願の出願日時点でEntrez Gene(URL:www.ncbi.nlm.nih.gov/sites/entrez)によって遺伝子に割り当て及び提供がなされる公式記号に対応する。
【0038】
用語「相関を有する」及び「関連を有する」は、本明細書では同義的に使用され、2つの測定値(又は測定された実体)の間の関連の強さを指す。本開示は、その発現レベルが特定の転帰尺度と関連付けられる遺伝子及び遺伝子サブセットを提供する。例えば、遺伝子の発現レベルの増加は、患者についての良好な臨床転帰の可能性の増加、例えば癌の再発のない長期生存及び/又は無転移生存の可能性の増加と正の相関(正の関連)を有し得る。かかる正の相関は、様々な方法で統計的に、例えば低いハザード比(例えばHR<1.0)により実証され得る。別の例において、遺伝子の発現レベルの増加は、患者についての良好な臨床転帰の可能性の増加と負の相関(負の関連)を有し得る。この場合、例えば患者は、癌の再発及び/又は癌転移のない長期生存の可能性の低下などを有し得る。かかる負の相関は、患者が予後不良である、例えば高いハザード比(例えば、HR>1.0)を有する可能性が高いことを示す。「相関を有する」はまた、本明細書では、所与のアルゴリズムにおいて第1の遺伝子の発現レベルを第2の遺伝子の発現レベルにより、それらの発現の相関関係を考慮して置き換えることができるような、2つの異なる遺伝子の発現レベル間の関連の強さも指して使用される。アルゴリズムのなかで置き換えることが可能な2つの遺伝子のかかる「相関を有する発現」、通常、互いに正の相関を有する遺伝子発現レベル、例えば、第1の遺伝子の発現増加が転帰と正の相関を有する場合(例えば、良好な臨床転帰の可能性の増加)、第1の遺伝子と共発現し、且つそれと相関する発現を示す第2の遺伝子もまた、同じ転帰と正の相関を有する。
【0039】
用語「再発」は、本明細書で使用されるとき、癌の局所再発又は遠隔(転移)再発を指す。例えば乳癌は、局所再発(治療した乳房又は腫瘍手術部位の近傍での)として、又は体内での遠隔再発として再び現れ得る。乳癌の最も多い再発部位としては、リンパ節、骨、肝臓、又は肺が挙げられる。
【0040】
用語「ポリヌクレオチド」は、単数形又は複数形で使用されるとき、概して任意のポリリボヌクレオチド又はポリデオキシリボヌクレオチドを指し、これは修飾されていないRNA若しくはDNAであっても、又は修飾されたRNA若しくはDNAであってもよい。従って、例えば本明細書に定義されるとおりのポリヌクレオチドとしては、限定なしに、一本鎖及び二本鎖DNA、一本鎖及び二本鎖領域を含むDNA、一本鎖及び二本鎖RNA、並びに一本鎖及び二本鎖領域を含むRNA、一本鎖か、若しくはより典型的には二本鎖であり得る、又は一本鎖及び二本鎖領域を含み得るDNA及びRNAを含むハイブリッド分子が挙げられる。加えて、用語「ポリヌクレオチド」は、本明細書で使用されるとき、RNA又はDNA又はRNA及びDNAの双方を含む三本鎖領域を指す。かかる領域の鎖は同じ分子由来であっても、又は異なる分子由来であってもよい。このような領域は分子の1つ又は複数の全てを含み得るが、より典型的には分子の一部の領域のみを含み得る。三重らせん領域の分子の一つは、多くの場合にオリゴヌクレオチドである。用語「ポリヌクレオチド」は特にcDNAを含む。この用語は、1つ又は複数の修飾された塩基を含むDNA(cDNAを含む)及びRNAを含む。従って、安定性のため、又は他の理由で修飾された骨格を有するDNA又はRNAは、当該の用語が本明細書で意図されるところの「ポリヌクレオチド」である。さらに、イノシンなどの普通でない塩基、又は修飾された塩基、例えばトリチウム化された塩基を含むDNA又はRNAが、本明細書に定義されるとおりの用語「ポリヌクレオチド」の範囲内に含まれる。一般に、用語「ポリヌクレオチド」は、未修飾ポリヌクレオチドのあらゆる化学的、酵素的及び/又は代謝的修飾形態、並びにウイルス及び細胞、例えば単純型及び複雑型細胞に特有のDNA及びRNAの化学的形態を包含する。
【0041】
用語「オリゴヌクレオチド」は、比較的短いポリヌクレオチドを指し、限定なしに、一本鎖デオキシリボヌクレオチド、一本鎖又は二本鎖リボヌクレオチド、RNA:DNAハイブリッド及び二本鎖DNAが挙げられる。一本鎖DNAプローブオリゴヌクレオチドなどのオリゴヌクレオチドは、例えば市販の自動オリゴヌクレオチド合成機を使用して、化学的方法により合成されることが多い。しかしながら、オリゴヌクレオチドは様々な他の方法により、例えばインビトロ組換えDNA媒介法並びに細胞及び生物体内でのDNA発現により作製されてもよい。
【0042】
語句「増幅」は、特定の試料又は細胞系において遺伝子又はRNA転写物の複数のコピーが形成される過程を指す。複製された領域(一続きの増幅されたポリヌクレオチド)はしばしば「アンプリコン」と称される。通常、メッセンジャーRNA(mRNA)の産生量、すなわち遺伝子発現レベルもまた、特定の発現遺伝子で作られるコピーの数に比例して増加する。
【0043】
用語「エストロゲン受容体(ER)」は、癌患者のエストロゲン受容体の状態を表す。癌細胞中に有意な数のエストロゲン受容体が存在する場合、腫瘍はER陽性であり、一方、ER陰性は、細胞に有意な数の受容体が存在しないことを示す。「有意な」の定義は検査部位及び方法(例えば、免疫組織化学、PCR)によって異なる。癌患者のER状態は、様々な公知の手段によって評価することができる。例えば、乳癌のERレベルは、患者から得られた乳房腫瘍試料中での、エストロゲン受容体をコードする遺伝子の発現レベルを測定することにより決定される。
【0044】
用語「腫瘍」は、本明細書で使用されるとき、悪性であろうと、又は良性であろうと、あらゆる腫瘍性細胞の成長及び増殖、並びにあらゆる前癌性及び癌性の細胞及び組織を指す。
【0045】
用語「癌」及び「癌性」は、典型的には無秩序な細胞成長により特徴付けられる哺乳動物における生理学的病態を指し、又はそれを表す。癌の例としては、限定はされないが、乳癌、卵巣癌、結腸癌、肺癌、前立腺癌、肝細胞癌、胃癌、膵癌、子宮頸癌、肝癌、膀胱癌、尿路癌、甲状腺癌、腎癌、癌腫、黒色腫、及び脳癌が挙げられる。
【0046】
本明細書で「間質グループ」として特定される遺伝子サブセットは、主に間質細胞により合成され、且つ間質反応に関与する遺伝子、及び間質グループ遺伝子と共発現する遺伝子を含む。「間質細胞」は、本明細書では、生物組織の支持構造を構成する結合組織細胞として定義される。間質細胞には、線維芽細胞、免疫細胞、周皮細胞、内皮細胞、及び炎症細胞が含まれる。「間質反応」は、原発腫瘍又は浸潤の部位における宿主組織の結合組織形成反応を指す。例えば、E.Rubin,J.Farber,「Pathology」,985~986頁(第2版 1994年)を参照のこと。間質グループには、例えば、CDH11、TAGLN、ITGA4、INHBA、COLIA1、COLIA2、FN1、CXCL14、TNFRSF1、CXCL12、C10ORF116、RUNX1、GSTM2、TGFB3、CAV1、DLC1、TNFRSF10、F3、及びDICER1、並びに表16~表18に特定される共発現遺伝子が含まれる。
【0047】
本明細書で「代謝グループ」として特定される遺伝子サブセットは、細胞代謝と関連付けられる遺伝子、例えば、鉄を運ぶための輸送タンパク質、細胞鉄恒常性経路、及び恒常性生化学的代謝経路と関連付けられる遺伝子、並びに代謝グループ遺伝子と共発現する遺伝子を含む。代謝グループには、例えば、TFRC、ENO1、IDH2、ARF1、CLDN4、PRDX1、及びGBP1、並びに表16~表18に特定される共発現遺伝子が含まれる。
【0048】
本明細書で「免疫グループ」として特定される遺伝子サブセットは、T細胞及びB細胞の細胞内輸送などの細胞性免疫調節機能に関与する遺伝子、リンパ球関連又はリンパ球マーカー、及びインターフェロン調節遺伝子、並びに免疫グループ遺伝子と共発現する遺伝子を含む。免疫グループには、例えば、CCL19及びIRF1、並びに表16~表18に特定される共発現遺伝子が含まれる。
【0049】
本明細書で「増殖グループ」として特定される遺伝子サブセットは、細胞の発達及び分裂、細胞周期及び有糸分裂調節、血管新生、細胞複製、核輸送/安定性、wntシグナル伝達、アポトーシスと関連付けられる遺伝子、並びに増殖グループ遺伝子と共発現する遺伝子を含む。増殖グループには、例えば、PGF、SPC25、AURKA、BIRC5、BUB1、CCNB1、CENPA、KPNA、LMNB1、MCM2、MELK、NDC80、TPX2M、及びWISP1、並びに表16~表18に特定される共発現遺伝子が含まれる。
【0050】
用語「共発現される」は、本明細書で使用されるとき、ある遺伝子の発現レベルと別の遺伝子の発現レベルとの間の統計的相関を指す。ペアワイズの共発現は、当該技術分野において公知の様々な方法により、例えば、ピアソン相関係数又はスピアマン相関係数を計算することにより計算され得る。共発現遺伝子クリークもまた、グラフ理論を用いて特定され得る。
【0051】
本明細書で使用されるとき、用語「遺伝子クリーク」及び「クリーク」は、いずれの頂点も辺によって部分グラフの他のあらゆる頂点と連結されている、グラフのなかの部分グラフを指す。
【0052】
本明細書で使用されるとき、「最大クリーク」は、他には頂点を加えることができず、それでもなおクリークであることができるクリークである。
【0053】
癌の「病理」は、患者の健康を損なうあらゆる現象を含む。これには、限定なしに、異常な又は制御できない細胞成長、転移、近接細胞の正常機能の妨害、異常なレベルのサイトカイン又は他の分泌産物の放出、炎症反応又は免疫反応の抑制又は憎悪、新形成、前癌状態、悪性腫瘍、周囲又は遠隔組織又は臓器、例えばリンパ節への浸潤等が含まれる。
【0054】
「コンピュータベースシステム」は、情報を分析するために使用されるハードウェア、ソフトウェア、及びデータ記憶媒体のシステムを指す。患者コンピュータベースシステムの最小限のハードウェアは、中央演算処理装置(CPU)、並びにデータ入力用、データ出力用(例えば、ディスプレイ)、及びデータ記憶用のハードウェアを含む。当業者は、現在利用可能な任意のコンピュータベースシステム及び/又はその構成要素が本開示の方法との関連における使用に好適であることを容易に理解し得る。データ記憶媒体は、上記に記載したとおりの本情報の記録を含む任意の製品、又はかかる製品にアクセスすることのできるメモリアクセスデバイスを含み得る。
【0055】
データ、プログラミング又は他の情報をコンピュータ可読媒体に「記録する」とは、当該技術分野において公知のとおりの任意のかかる方法を用いた、情報を記憶するための方法を指す。記憶された情報にアクセスするために用いられる手段に基づき、任意の好都合なデータ記憶構造を選択することができる。記憶には、様々なデータプロセッサプログラム及びフォーマット、例えば文書処理テキストファイル、データベースフォーマット等が用いられ得る。
【0056】
「プロセッサ」又は「コンピューティング手段」は、その要求される機能を実行し得る任意のハードウェア及び/又はソフトウェアの組み合わせを参照する。例えば、好適なプロセッサは、電子制御器、メインフレーム、サーバ又はパーソナルコンピュータ(デスクトップ又はポータブル)の形態で利用可能なものなどの、プログラマブルデジタルマイクロプロセッサであってもよい。プロセッサがプログラマブルである場合、好適なプログラミングをリモート位置からプロセッサに伝達することができ、又はコンピュータプログラム製品(磁気装置、光学装置又は固体装置のいずれがベースかに関わらず、ポータブル又は固定型のコンピュータ可読記憶媒体など)に予め保存しておくことができる。例えば、磁気媒体又は光ディスクがプログラミングを保持してもよく、その対応するステーションで各プロセッサと通信する好適なリーダにより読み取られ得る。
【0057】
本明細書で使用されるとき、「グラフ理論」は、一組の点とそれらの点の一部を結ぶ線とを含む図によって状況を表現するコンピュータサイエンス及び数学の研究分野を指す。この図は「グラフ」と称され、点及び線はグラフの「頂点」及び「辺」と称される。遺伝子共発現解析では、遺伝子(又はその等価な識別子、例えばアレイプローブ)がグラフの節点又は頂点として表現され得る。2つの遺伝子間の類似性の尺度(例えば、相関係数、相互情報量、及び交替条件付き期待値)が有意な閾値より高い場合、その2つの遺伝子は共発現するとされ、グラフにおいて辺を引くことができる。所与の試験についてのあらゆる可能な遺伝子ペアに対して共発現する辺が引かれると、全ての最大クリークが計算される。得られた最大クリークが遺伝子クリークとして定義される。遺伝子クリークは、事前に定義された基準を満たす計算上の共発現遺伝子グループである。
【0058】
ハイブリダイゼーション反応の「ストリンジェンシー」については、当業者は容易に決定することができ、概して、プローブ長さ、洗浄温度、及び塩濃度に依存する経験的計算である。一般に、プローブが長いほど、適切なアニーリングに高温が必要となる一方、プローブが短いほど低温を要する。ハイブリダイゼーションは、概して、相補鎖がその融解温度未満の環境中に存在するときの変性DNAのリアリーニング能力に依存する。プローブとハイブリダイズ可能配列との間に所望される相同性が高度であるほど、用いられ得る相対温度が高くなる。結果として、相対温度が高ければ反応条件のストリンジェンシーは高くなる一方、温度が低ければそれほど高くならない傾向があるということになる。ハイブリダイゼーション反応のストリンジェンシーさらなる詳細及び説明については、Ausubelら,「Current Protocols in Molecular Biology」,Wiley Interscience Publishers,(1995年)を参照されたい。
【0059】
「ストリンジェントな条件」又は「高ストリンジェンシー条件」は、本明細書に定義されるとき、典型的には:(1)洗浄に低いイオン強度及び高い温度を用いる、例えば、50℃で0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウム;(2)ハイブリダイゼーション中にホルムアミドなどの変性剤を用いる、例えば、42℃で50%(v/v)ホルムアミドと0.1%ウシ血清アルブミン/0.1%フィコール(Ficoll)/0.1%ポリビニルピロリドン/pH6.5の50mMリン酸ナトリウム緩衝液、さらに750mM塩化ナトリウム、75mMクエン酸ナトリウム;又は(3)42℃で50%ホルムアミド、5×SSC(0.75M NaCl、0.075Mクエン酸ナトリウム)、50mMリン酸ナトリウム(pH6.8)、0.1%ピロリン酸ナトリウム、5×デンハルト溶液、超音波処理したサケ精子DNA(50μg/ml)、0.1%SDS、及び10%硫酸デキストランを用い、さらに42℃において0.2×SSC(塩化ナトリウム/クエン酸ナトリウム)で、及び55℃において50%ホルムアミドで洗浄し、続いて55℃でEDTAを含む0.1×SSCからなる高ストリンジェンシー洗浄を行う。
【0060】
「中程度にストリンジェントな条件」は、Sambrookら,「Molecular Cloning:A Laboratory Manual」,New York:Cold Spring Harbor Press,1989年により記載されるとおり特定することができ、上記に記載するものより低いストリンジェンシーの洗浄溶液及びハイブリダイゼーション条件(例えば、温度、イオン強度及び%SDS)の使用を含み得る。中程度にストリンジェントな条件の例は、20%ホルムアミド、5×SSC(150mM NaCl、15mMクエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%硫酸デキストラン、及び20mg/ml変性剪断サケ精子DNAを含む溶液中37℃での一晩のインキュベーションと、それに続く約37~50℃における1×SSCでのフィルタの洗浄である。当業者は、プローブ長さなどの要因に適応させる必要に応じて温度、イオン強度等をどのように調整すればよいかを認識しているであろう。
【0061】
本発明との関連において、任意の特定の遺伝子セットに列挙される遺伝子の「少なくとも1つ」、「少なくとも2つ」、「少なくとも5つ」等と言うとき、それは列挙される遺伝子の任意の1つ又はあらゆる組み合わせを意味する。
【0062】
用語「リンパ節陰性」癌、例えば「リンパ節陰性」乳癌は、本明細書では、リンパ節に広がっていない癌を指して使用される。
【0063】
用語「スプライシング」及び「RNAスプライシング」は同義的に使用され、イントロンを取り除き、且つエクソンを繋ぎ合わせることにより、連続するコード配列を有する成熟mRNAであって、真核生物細胞の細胞質に移動する成熟mRNAを産生するRNAプロセシングを指す。
【0064】
理論的には、用語「エクソン」は、成熟RNA産物中に表現される断続した遺伝子の任意のセグメントを指す(B.Lewin.「Genes IV」 Cell Press,Cambridge Mass.1990年)。理論的には、用語「イントロン」は、転写されるが、その両側にあるエクソンと共にスプライシングされることにより転写物中から取り除かれるDNAの任意のセグメントを指す。操作上、エクソン配列は、参照配列番号により定義されるとおりの遺伝子のmRNA配列中に現れる。操作上、イントロン配列は、遺伝子のゲノムDNA内にある、エクソン配列により囲まれ、且つその5’境界及び3’境界にGT及びAGスプライスコンセンサス配列を有する介在配列である。
【0065】
遺伝子発現アッセイ
本開示は、特に指示されない限り、分子生物学(組換え技術を含む)、微生物学、細胞生物学、及び生化学の従来技術を用いる方法を提供し、それらの技術は当該分野の技術範囲内である。かかる技法は、「Molecular Cloning:A Laboratory Manual」,第2版(Sambrookら,1989年);「Oligonucleotide Synthesis」(M.J.Gait編,1984年);「Animal Cell Culture」(R.I.Freshney編,1987年);「Methods in Enzymology」(Academic Press,Inc.);「Handbook of Experimental Immunology」,第4版(D.M.Weir & C.C.Blackwell編,Blackwell Science Inc.,1987年);「Gene Transfer Vectors for Mammalian Cells」(J.M.Miller & M.P.Calos編,1987年);「Current Protocols in Molecular Biology」(F.M.Ausubelら編,1987年);及び「PCR:The Polymerase Chain Reaction」,(Mullisら編,1994年)などの文献に十分な説明がある。
【0066】
1.遺伝子発現プロファイリング
遺伝子発現プロファイリングの方法としては、ポリヌクレオチドのハイブリダイゼーション分析に基づく方法、ポリヌクレオチドの配列決定に基づく方法、及びプロテオミクスに基づく方法が挙げられる。試料中のmRNA発現の定量化に最も一般的に用いられている当該技術分野で公知の方法としては、ノーザンブロッティング及びインサイチュハイブリダイゼーション(Parker & Barnes,Methods in Molecular Biology 106:247~283頁(1999年));RNアーゼ保護アッセイ(Hod,Biotechniques 13:852~854頁(1992年));及びPCRベースの方法、例えば逆転写ポリメラーゼ連鎖反応(RT-PCR)(Weisら,Trends in Genetics 8:263~264頁(1992年))が挙げられる。或いは、DNA二重鎖、RNA二重鎖、及びDNA-RNAハイブリッド二重鎖又はDNA-タンパク質二重鎖を含む特定の二重鎖を認識することのできる抗体が用いられてもよい。
【0067】
2.PCRベースの遺伝子発現プロファイリング方法
a.逆転写酵素PCR(RT-PCR)
上記に挙げる技法のうち、最も感度が高く、且つ最も柔軟性が高い定量法はRT-PCRであり、これを用いると、正常及び腫瘍組織における薬物治療を伴う場合又は伴わない場合の異なる試料中のmRNAレベルを比較し、それにより遺伝子発現パターンを特徴付け、密接な関係があるmRNA間を判別し、及びRNA構造を分析することができる。
【0068】
第1のステップは、標的試料からのmRNAの単離である。出発物質は、典型的には、ヒト腫瘍又は腫瘍細胞系、及びそれぞれに対応する正常な組織又は細胞系から単離された全RNAである。従ってRNAは、乳房、肺、結腸、前立腺、脳、肝臓、腎臓、膵臓、脾臓、胸腺、精巣、卵巣、子宮等の腫瘍、又は腫瘍細胞系を含む様々な原発腫瘍、さらに健常ドナー由来のプールされたDNAから分離することができる。mRNAの供給源が原発腫瘍である場合、mRNAは、例えば凍結又はアーカイブの、パラフィン包埋され、且つ固定された(例えばホルマリン固定された)組織試料から抽出することができる。
【0069】
一般的なmRNA抽出方法は当該技術分野において公知であり、Ausubelら,「Current Protocols of Molecular Biology」,John Wiley and Sons(1997年)を含めた分子生物学の標準的なテキストに開示されている。パラフィン包埋組織からのRNA抽出方法は、Rupp及びLocker,Lab Invest.56:A67頁(1987年)、及びDe Andresら,BioTechniques 18:42044頁(1995年)に開示されている。特に、RNA単離は、Qiagenなどの商業的な製造業者からの精製キット、緩衝液セット及びプロテアーゼを使用して、製造者の指示に従い実施することができる。例えば、培養下の細胞からの全RNAは、Qiagen RNeasyミニカラムを使用して単離することができる。他の市販のRNA単離キットとしては、MasterPure(商標)完全DNA及びRNA精製キット(Complete DNA and RNA Purification Kit)(EPICENTRE(登録商標),Madison,WI)、及びパラフィンブロックRNA単離キット(Paraffin Block RNA Isolation Kit)(Ambion,Inc.)が挙げられる。組織試料からの全RNAは、RNA Stat-60(Tel-Test)を使用して単離することができる。腫瘍から調製されるRNAは、例えば、塩化セシウム密度勾配遠心法により単離することができる。
【0070】
ある場合には、発現プロファイリングの開始前にRNAを増幅することが適当であり得る。多くの場合、分子解析に有用な臨床標本は極めて限られた量しか利用できない。これは、組織が他の実験室分析に既に使用されていることに起因し得るか、又は針生検若しくは極めて小さい原発腫瘍の場合のように元の標本が極めて小さいことに起因し得る。組織が量的に限られているとき、概して標本から回収することのできる全RNAもまた少量のみとなり、結果として標本において分析することのできるゲノムマーカーが限られた数のみとなることも事実である。RNA増幅は、相対的な組成が同じであるはるかに多量のRNAとして元のRNA試料を忠実に複製することにより、この限界を補う。この元のRNA標本の増幅コピーを使用して無制限のゲノム解析を行うことにより、元の生体試料の臨床的特徴と関連付けられるバイオマーカーを発見することができる。これにより、ゲノム解析及びバイオマーカーの発見の目的上、臨床研究標本が有効に不死化される。
【0071】
RNAはPCRの鋳型として働くことができないため、リアルタイムRT-PCR(RT-PCR)による遺伝子発現プロファイリングの第1のステップは、RNA鋳型のcDNAへの逆転写と、それに続くPCR反応でのその指数関数的増幅である。2つの最も一般的に用いられている逆転写酵素は、トリ骨髄芽球症ウイルス逆転写酵素(AMV-RT)及びモロニーマウス白血病ウイルス逆転写酵素(MMLV-RT)である。逆転写ステップは典型的には、発現プロファイリングの状況及び目標に応じて特異的プライマー、ランダムヘキサマー、又はオリゴdTプライマーを使用してプライムされる。例えば、抽出されたRNAは、GeneAmp RNA PCRキット(Perkin Elmer,CA,USA)を使用して、製造者の指示に従い逆転写することができる。次に生じたcDNAを、続くPCR反応で鋳型として使用することができる。さらなる詳細については、例えばHeldら,Genome Research 6:986~994頁(1996年)を参照されたい。
【0072】
PCRステップには様々な熱安定性DNA依存DNAポリメラーゼを使用することができるが、典型的にはTaq DNAポリメラーゼが用いられ、これは5’-3’ヌクレアーゼ活性を有するが、しかし3’-5’プルーフリーディングエンドヌクレアーゼ活性は欠いている。従って、TaqMan(登録商標)PCRは、典型的にはTaq又はTthポリメラーゼの5’-ヌクレアーゼ活性を利用して、その標的アンプリコンに結合したハイブリダイゼーションプローブを加水分解するが、しかしながら等価な5’ヌクレアーゼ活性を有する任意の酵素を使用することができる。PCR反応に典型的なアンプリコンは、2つのオリゴヌクレオチドプライマーを使用して生成される。第3のオリゴヌクレオチド、すなわちプローブが、2つのPCRプライマー間に位置するヌクレオチド配列を検出するように設計される。プローブはTaq DNAポリメラーゼ酵素によっては展開不可能であり、レポーター蛍光色素及びクエンチャー蛍光色素で標識される。2つの色素がプローブ上にあって互いに近くに位置するとき、レポーター色素からの任意のレーザー誘起発光が消光色素によって消光される。増幅反応中、Taq DNAポリメラーゼ酵素はプローブを鋳型依存的に切断する。得られるプローブ断片は溶液中で解離し、放出されたレポーター色素からのシグナルには第2のフルオロフォアの消光効果がない。新しい分子が合成されるごとにレポーター色素の一方の分子が遊離し、消光されていないレポーター色素を検出することによってデータの定量的解釈の基礎が提供される。
【0073】
TaqMan(登録商標)RT-PCRは、市販の機器、例えば、ABI PRISM 7900(登録商標)Sequence Detection System(商標)(Perkin-Elmer-Applied Biosystems,Foster City,CA,米国)、又はLightCycler(登録商標)480リアルタイムPCRシステム(Roche Diagnostics,GmbH、Penzberg,独国)を使用して実施することができる。好ましい実施形態において、5’ヌクレアーゼ手順は、ABI PRISM 7900(登録商標)Sequence Detection System(商標)などのリアルタイム定量PCR装置で実行される。このシステムは、サーモサイクラー、レーザー、電荷結合素子(CCD)、カメラ及びコンピュータからなる。システムは、サーモサイクラー上の384ウェルフォーマットで試料を増幅する。増幅中、レーザー誘起蛍光シグナルが384ウェル全てについて光ファイバーケーブルを介してリアルタイムで収集され、CCDで検出される。システムは、機器の実行用及びデータ分析用のソフトウェアを含む。
【0074】
5’-ヌクレアーゼアッセイデータは初めはCt、すなわち閾値サイクルとして表される。上述のとおり、サイクル毎にその間の蛍光値が記録され、それらの蛍光値は、増幅反応においてその時点までに増幅された産物の量に相当する。蛍光シグナルが最初に統計的に有意として記録される時点が、閾値サイクル(Ct)である。
【0075】
誤差及び試料間変動の効果を最小限に抑えるため、RT-PCRは通常、内部標準を使用して実施される。理想的な内部標準は、異なる組織間において一定レベルで発現し、及び実験上の取扱いによる影響を受けない。遺伝子発現パターンの正規化に最もよく使用されるRNAは、ハウスキーピング遺伝子のグリセルアルデヒド-3-リン酸デヒドロゲナーゼ(GAPDH)及びβ-アクチンのmRNAである。
【0076】
RNA供給源として固定パラフィン包埋組織を使用する代表的な遺伝子発現プロファイリングプロトコルのステップは、mRNA単離、精製、プライマー伸長及び増幅を含め、様々な既刊のジャーナル論文に示されている。M.Cronin,Am J Pathol 164(1):35~42頁(2004年)。簡潔に言えば、代表的な方法は、パラフィン包埋腫瘍組織試料の約10μm厚の切片を切り取ることから始まる。次にRNAが抽出され、タンパク質及びDNAが取り除かれる。RNA濃度の分析後、必要であればRNA修復及び/又は増幅ステップが含まれてもよく、及び遺伝子特異的プライマーを使用してRNAが逆転写され、続いてRT-PCRが行われる。
【0077】
b.イントロンベースのPCRプライマー及びプローブの設計
PCRプライマー及びプローブは、目的の遺伝子のmRNA転写物中に存在するエクソン配列又はイントロン配列に基づき設計することができる。プライマー/プローブ設計を実施する前に、イントロン-エクソン境界及び全体的な遺伝子構造を特定するため、標的遺伝子配列をヒトゲノムアセンブリにマッピングする必要がある。これは、Primer3(Whitehead Inst.)及びPrimer Express(登録商標)(Applied Biosystems)などの公的に利用可能なソフトウェアを使用して実施することができる。
【0078】
必要な場合、又は望ましい場合、標的配列の反復配列をマスクすることにより非特異的なシグナルを軽減することができる。これを達成するための例示的ツールとしては、Baylor College of Medicineからオンラインで利用可能なRepeat Maskerプログラムが挙げられ、これはDNA配列を反復エレメントのライブラリに対してスクリーニングし、反復エレメントがマスクされた問い合わせ配列を返す。次にマスクされたイントロン配列及びエクソン配列を使用することにより、Primer Express(Applied Biosystems);MGBアッセイ-バイ-デザイン(assay-by-design)(Applied Biosystems);Primer3(Steve Rozen及びHelen J.Skaletsky(2000年)「Primer3 on the WWW for general users and for biologist programmers」.Rrawetz S,Misener S(編)『Bioinformatics Methods and Protocols:Methods in Molecular Biology』所収 Humana Press,Totowa,NJ,365~386頁)などの、市販の、又は他の形で公的に利用可能な任意のプライマー/プローブ設計パッケージを使用して所望の標的部位に対するプライマー配列及びプローブ配列を設計することができる。
【0079】
PCRプライマー設計に影響し得る他の要素としては、プライマー長さ、融解温度(Tm)、及びG/C含量、特異性、相補プライマー配列、及び3’末端配列が挙げられる。一般に、最適なPCRプライマーは、概して17~30塩基長であり、且つ約20~80%、例えば約50~60%のG+C塩基を含み、且つ50~80℃、例えば約50~70℃のTmを示す。
【0080】
PCRプライマー及びプローブ設計についてのさらなる指針は、例えば、Dieffenbach,CWら,「General Concepts for PCR Primer Design」『PCR Primer,A Laboratory Manual』所収,Cold Spring Harbor Laboratory Press,.New York,1995年,133~155頁;Innis及びGelfand,「Optimization of PCRs」『PCR Protocols, A Guide to Methods and Applications』所収,CRC Press,London,1994年,5~11頁;及びPlasterer,T.N.「Primerselect:Primer and probe design」 Methods MoI.Biol.70:520~527頁(1997年)(これらの開示全体が、参照によって本明細書により明示的に援用される)を参照されたい。
【0081】
表Aは、本明細書に開示される実施例に関連するプライマー配列、プローブ配列、及びアンプリコン配列に関するさらなる情報を提供する。
【0082】
c.MassARRAYシステム
RNAの単離及び逆転写後のSequenom,Inc.(San Diego,CA)により開発されたMassARRAYベースの遺伝子発現プロファイリング方法では、得られたcDNAが合成DNA分子(コンペティター)でスパイクされ、このコンペティターは標的のcDNA領域と単一の塩基を除くあらゆる位置で一致し、内部標準として働く。cDNA/コンペティター混合物がPCR増幅され、PCR後エビアルカリホスファターゼ(SAP)酵素処理に供される結果、残りのヌクレオチドの脱リン酸化が起こる。アルカリホスファターゼを不活性化した後、コンペティター及びcDNAからのPCR産物がプライマー伸長に供され、それによりコンペティター由来及びcDNA由来のPCR産物について異なる質量シグナルが生成される。精製後、これらの産物がチップアレイに分取され、チップアレイには、マトリックス支援レーザー脱離イオン化飛行時間型質量分析法(MALDI-TOF MS)による分析に必要な成分が予め負荷されている。次に、生成された質量スペクトルのピーク面積比を分析することにより、反応液中に存在するcDNAが定量される。さらなる詳細については、例えばDing及びCantor,Proc.Natl.Acad.Sci.USA 100:3059~3064頁(2003年)を参照されたい。
【0083】
d.他のPCRベースの方法
別のPCRベースの技法としては、例えば、ディファレンシャルディスプレイ(Liang及びPardee,Science 257:967~971頁(1992年));増幅断片長多型(iAFLP)(Kawamotoら,Genome Res.12:1305~1312頁(1999年));BeadArray(商標)技術(Illumina,San Diego,CA;Oliphantら、Discovery of Markers for Disease(Biotechniquesの補遺),2002年6月;Fergusonら,Analytical Chemistry 72:5618頁(2000年));遺伝子発現の高速アッセイで市販のLuminex100 LabMAPシステム及び多色コードマイクロスフェア(Luminex Corp.,Austin,TX)を使用する遺伝子発現検出用BeadsArray(BeadsArray for Detection of Gene Expression:BADGE)(Yangら,Genome Res.11:1888~1898頁(2001年));及び高カバレッジ発現プロファイリング(HiCEP)分析(Fukumuraら,Nucl.Acids.Res.31(16)e94頁(2003年))が挙げられる。
【0084】
3.マイクロアレイ
差次的遺伝子発現もまた、マイクロアレイ技法を用いて特定、又は確認することができる。従って、乳癌関連遺伝子の発現プロファイルは、新鮮腫瘍組織又はパラフィン包埋腫瘍組織のいずれにおいても、マイクロアレイ技術を用いて測定することができる。この方法では、目的のポリヌクレオチド配列(cDNA及びオリゴヌクレオチドを含む)がマイクロチップ基板上のプレート、又はアレイに配置される。次に、アレイに配置された配列が、目的の細胞又は組織由来の特異的DNAプローブとハイブリダイズされる。RT-PCR方法とまさに同じように、mRNAの供給源は典型的には、ヒト腫瘍又は腫瘍細胞系、及び対応する正常な組織又は細胞系から単離された全RNAである。従ってRNAは、様々な原発腫瘍又は腫瘍細胞系から単離することができる。mRNAの供給源が原発腫瘍である場合、mRNAは、例えば日常の診療でルーチン的に調製及び保存される凍結又はアーカイブのパラフィン包埋及び固定(例えばホルマリン固定)組織試料から抽出することができる。
【0085】
マイクロアレイ技法の特定の実施形態では、cDNAクローンのPCR増幅されたインサートが高密度アレイの基板に適用される。好ましくは少なくとも10,000ヌクレオチド配列が基板に適用される。マイクロチップ上に各10,000エレメントで固定化された、マイクロアレイに配置された遺伝子は、ストリンジェントな条件下でのハイブリダイゼーションに好適である。目的の組織から抽出したRNAを逆転写することにより蛍光ヌクレオチドを取り込むことで、蛍光標識されたcDNAプローブが生成され得る。チップに適用された標識cDNAプローブは、アレイ上のDNAの各スポットと特異性を伴いハイブリダイズする。ストリンジェントな洗浄により非特異的に結合したプローブを取り除いた後、共焦点レーザー顕微鏡法によるか、又は別の検出方法、例えばCCDカメラによりチップが走査される。アレイに配置された各エレメントのハイブリダイゼーションを定量化することにより、対応するmRNA存在量を評価することが可能となる。2つのRNA供給源から生成された、二色蛍光で別個に標識されたcDNAプローブが、アレイに対してペアワイズでハイブリダイズされる。従って、各々特定の遺伝子に対応する2つの供給源由来の転写物の相対存在量が同時に決定される。規模が微小化されたハイブリダイゼーションにより、多数の遺伝子の発現パターンを簡便且つ迅速に評価することが可能となる。かかる方法は、細胞当たり数個のコピーで発現する微量の転写物を検出するのに必要な感度を有し、且つ発現レベルの少なくとも約2倍の差を再現性のある形で検出することが示されている(Schenaら,Proc.Natl.Acad.Sci.USA 93(2):106~149頁(1996年))。マイクロアレイ分析は、Affymetrix GenChip技術、又はAgilentのマイクロアレイ技術を使用するなど、市販の機器により、製造者のプロトコルに従い実施することができる。
【0086】
遺伝子発現の大規模解析用にマイクロアレイ方法を展開することにより、様々な腫瘍型における癌分類及び転帰予測の分子マーカーを系統的に探すことが可能となる。
【0087】
4.核酸配列決定法による遺伝子発現解析
核酸配列決定技術は、遺伝子発現の解析に好適な方法である。これらの方法の基礎となる原理は、試料中でcDNA配列が検出される回数が、当該の配列に対応するmRNAの相対的な発現に直接関係することである。これらの方法は、得られるデータの個別的な数値特性を反映して、ときにデジタル遺伝子発現(Digital Gene Expression:DGE)という用語で参照される。この原理を応用した初期の方法は、連続遺伝子発現解析(Serial Analysis of Gene Expression:SAGE)及び超並列的シグネチャシーケンシング(Massively Parallel Signature Sequencing:MPSS)であった。例えば、S.Brennerら,Nature Biotechnology 18(6):630~634頁(2000年)を参照のこと。最近では、「次世代」シーケンシング技術の出現により、DGEの単純化、ハイスループット化、及び低価格化が進んでいる。結果として、これまで可能であったものと比べてより多くの研究室がDGEを利用し、より多くの個々の患者試料におけるより多くの遺伝子の発現をスクリーニングすることが可能となっている。例えば、J.Marioni,Genome Research 18(9):1509~1517頁(2008年);R.Morin,Genome Research 18(4):610~621頁(2008年);A.Mortazavi,Nature Methods 5(7):621~628頁(2008年);N.Cloonan,Nature Methods 5(7):613~619頁(2008年)を参照のこと。
【0088】
5.体液からのRNAの単離
血液、血漿及び血清から(例えば、Tsui NBら(2002年)48,1647~53頁及びそこに引用される文献を参照のこと)、及び尿から(例えば、Boom Rら(1990年)J Clin Microbiol.28,495~503頁及びそこに引用される文献を参照のこと)、発現解析用のRNAを単離する方法については記載がなされている。
【0089】
6.免疫組織化学
免疫組織化学的方法もまた、本発明の予後マーカーの発現レベルを検出するのに好適である。従って、抗体又は抗血清、好ましくはポリクローナル抗血清、及び最も好ましくは各マーカーに特異的なモノクローナル抗体が、発現の検出に使用される。抗体は、抗体それ自体を、例えば放射性標識、蛍光標識、ビオチンなどのハプテン標識、又は西洋わさびペルオキシダーゼ若しくはアルカリホスファターゼなどの酵素で直接標識することにより検出することができる。或いは、標識されていない一次抗体が、標識された二次抗体、例えば、抗血清、ポリクローナル抗血清又は一次抗体に特異的なモノクローナル抗体と共に使用される。免疫組織化学的プロトコル及びキットは当該技術分野において公知であり、市販されている。
【0090】
7.プロテオミクス
用語「プロテオーム」は、ある時間点で試料(例えば組織、生物、又は細胞培養物)中に存在するタンパク質の総体として定義される。プロテオミクスは、とりわけ、試料中のタンパク質発現の全体的な変化の研究(「発現プロテオミクス」とも称される)を含む。プロテオミクスは、典型的には以下のステップを含む:(1)2-Dゲル電気泳動(2-D PAGE)による試料中の個々のタンパク質の分離;(2)ゲルから回収される個々のタンパク質の同定、例えば、質量分析法又はN末端シーケンシング、及び(3)バイオインフォマティクスを用いたデータの分析。プロテオミクス方法は他の遺伝子発現プロファイリング方法の有用な補足となり、本発明の予後マーカーの産物の検出に単独で、又は他の方法との組み合わせで用いることができる。
【0091】
8.mRNA単離、精製、及び増幅の概要
RNA供給源として固定パラフィン包埋組織を使用する代表的な遺伝子発現プロファイリングプロトコルのステップは、mRNA単離、精製、プライマー伸長及び増幅を含め、様々な既刊のジャーナル論文に提供されている(例えば:T.E.Godfreyら J.Molec.Diagnostics 2:84~91頁[2000年];K.Spechtら Am.J.Pathol.158:419~29頁[2001年])。簡潔に言えば、代表的な方法は、パラフィン包埋腫瘍組織試料の約10μm厚の切片を切り取ることから始まる。次にRNAが抽出され、タンパク質及びDNAが取り除かれる。RNA濃度の分析後、必要であればRNA修復及び/又は増幅ステップが含まれてもよく、及び遺伝子特異的プライマーを使用してRNAが逆転写され、続いてRT-PCRが行われる。最後に、データが分析され、調べた腫瘍試料において特定される特徴的な遺伝子発現パターンに基づき、予測される癌再発の可能性に応じて、患者に利用可能な1つ又は複数の最良の治療オプションが特定される。
【0092】
9.正規化
本明細書に開示される方法で使用される発現データは正規化され得る。正規化は、例えば、アッセイされたRNAの量の差及び用いられたRNAの質のばらつきについて補正し(それを正規化して除き)、Ct測定値等における不要な系統的変動源を取り除く方法を指す。アーカイブの固定パラフィン包埋組織試料が関わるRT-PCR実験に関連して、系統的変動源には、患者試料の保存年数及び試料の保存に用いられている固定剤の種類に対するRNAの分解程度が含まれることが知られている。他の系統的変動源は、実験室での処理条件に起因する。
【0093】
アッセイは、特定の正規化遺伝子の発現を組み込むことにより正規化を提供することができ、こうした遺伝子は、関連する条件下で発現レベルが著しく異なることのないものである。例示的な正規化遺伝子としては、PGK1及びUBBなどのハウスキーピング遺伝子が挙げられる。(例えば、E.Eisenbergら,Trends in Genetics 19(7):362~365頁(2003年)を参照のこと)。正規化は、アッセイした遺伝子全て又はその大きいサブセットのシグナル平均値又は中央値(CT)に基づき得る(大域的正規化手法)。一般に、参照遺伝子とも称される正規化遺伝子は、非癌性の結腸直腸組織と比較したとき結腸直腸癌において著しく異なる発現を呈することがなく、且つ種々の試料及びプロセス条件によって著しい影響を受けず、従って外部効果の正規化による除去を提供することが分かっている遺伝子でなければならない。
【0094】
特に指摘しない限り、各mRNA/被験腫瘍/患者の正規化発現レベルは、参照セットで測定される発現レベルに対する割合として表され得る。十分に多い数(例えば40個)の腫瘍の参照セットから、各mRNA種の正規化レベルの分布が得られる。分析される特定の腫瘍試料で測定されたレベルは何らか百分位数でこの範囲に収まり、これは当該技術分野で公知の方法により決定することができる。
【0095】
例示的実施形態において、以下の遺伝子の1つ又は複数が、発現データの正規化用の参照として使用される:AAMP、ARF1、EEF1A1、ESD、GPS1、H3F3A、HNRPC、RPL13A、RPL41、RPS23、RPS27、SDHA、TCEA1、UBB、YWHAZ、B-アクチン、GUS、GAPDH、RPLPO、及びTFRC。例えば、予後遺伝子の各々についての較正後の加重平均Ct測定値が、少なくとも3つの参照遺伝子、少なくとも4つの参照遺伝子、又は少なくとも5つの参照遺伝子の平均値に対して正規化されてもよい。
【0096】
当業者は、正規化が様々な方法で実現され得るとともに、上述の技法はあくまでも例示を意図し、網羅的であることを意図するものではないことを認識するであろう。
【0097】
レポート結果
本開示の方法は、本開示の方法から得られる臨床転帰の予想又は予測を要約するレポートの作成に適している。「レポート」は、本明細書に記載されるとき、可能性評価又はリスク評価及びその結果に関する目的の情報を提供するレポート要素を含む電子文書又はタンジブルな文書である。対象レポートは、少なくとも可能性評価又はリスク評価、例えば、乳癌の局所再発及び転移を含めた、乳癌の再発リスクに関する指標を含む。対象レポートは、無病生存、無再発生存、無転移生存、及び全生存の1つ又は複数の評価又は推定を含むことができる。対象レポートは完全に又は部分的に電子的に生成されてもよく、例えば、電子ディスプレイ(例えば、コンピュータモニタ)上に提示されてもよい。レポートはさらに、以下の1つ又は複数を含むことができる:1)検査施設に関する情報;2)サービス提供者情報;3)患者データ;4)試料データ;5)解釈レポート、これは、a)指標;b)検査データ(ここで検査データは1つ又は複数の目的の遺伝子の正規化レベルを含み得る)を含め、様々な情報を含むことができる:及び6)他の特徴。
【0098】
従って本開示は、レポートの作成方法及びそれにより得られるレポートを提供する。レポートは、患者の腫瘍から得られた細胞中の特定の遺伝子についての、RNA転写物、又はかかるRNA転写物の発現産物の発現レベルの要約を含んでもよい。レポートは、患者の予後共変量に関する情報を含むことができる。レポートは、患者の再発リスクが高いという推定を含んでもよい。この推定は、スコア又は患者層別化スキーム(例えば、低度、中程度、又は高度の再発リスク)の形態であってもよい。レポートは、その患者に適した手術(例えば、乳腺部分切除又は全切除)又は治療に関する判断の支援に関係する情報を含んでもよい。
【0099】
従って、いくつかの実施形態において、本開示の方法は、患者の推定臨床転帰、例えば再発リスクに関する情報を含むレポートを生成するステップをさらに含む。例えば、本明細書に開示される方法は、対象のリスク評価結果を提供するレポートを生成又は出力するステップをさらに含むことができ、このレポートは、電子媒体の形態(例えば、コンピュータモニタ上の電子表示)で、又はタンジブルな媒体の形態(例えば、紙又は他のタンジブルな媒体に印刷されたレポート)で提供することができる。
【0100】
患者の推定予後(例えば、乳癌を有する患者が手術及び/又は治療に応答して予後良好又はポジティブな臨床転帰となる可能性)に関する情報を含むレポートが、ユーザに提供される。可能性に関する評価は、以下では「リスクレポート」、又は単に「リスクスコア」と称される。レポートを作成する人又は実体(「レポート生成者」)はまた、可能性評価も実施し得る。レポート生成者はまた、試料収集、試料処理、及びデータ生成の1つ又は複数を実施してもよく、例えば、レポート生成者はまた、以下の1つ又は複数も実施し得る:a)試料収集;b)試料処理;c)リスク遺伝子のレベル測定;d)参照遺伝子のレベル測定;及びe)リスク遺伝子の正規化レベルの決定。或いは、レポート生成者以外の実態が1つ又は複数の試料収集、試料処理、及びデータ生成を実施してもよい。
【0101】
明確にするため、「クライアント」と同義的に使用される用語「ユーザ」は、レポートを送る対象の人又は実体を指すことが意図され、以下の1つ又は複数を行う人又は実体と同じであり得ることに留意しなければならない:a)試料を採取する;b)試料を処理する;c)試料又は処理された試料を提供する;及びd)データ(例えば、リスク遺伝子のレベル;1つ以上の参照遺伝子産物のレベル;可能性評価に用いられるリスク遺伝子(「予後遺伝子」)の正規化レベルを生成する。ある場合には、試料採取及び/又は試料処理及び/又はデータ生成を提供する1人以上の人又は1つ以上の実体と、結果及び/又はレポートを受け取る人とは異なる人であってよく、しかしながら混乱を避けるため、本明細書では双方とも「ユーザ」又は「クライアント」と称される。特定の実施形態において、例えば、本方法が全て単一のコンピュータ上で実行される場合、ユーザ又はクライアントはデータ入力を提供するとともに、データ出力を閲覧する。「ユーザ」は、医療従事者(例えば、臨床従事者、検査技師、医師(例えば、癌専門医、外科医、病理医)等)であり得る。
【0102】
ユーザが本方法の一部のみを実行する実施形態では、本開示の方法によるコンピュータ化されたデータ処理の後にデータ出力(例えば、完成したレポートを提供する発行前の結果)を閲覧する個人、又は「未完成の」レポートを閲覧し、手作業での介入及び解釈レポートの完成をもたらす個人は、本明細書では「レビューワ」と称される。レビューワは、ユーザから離れた位置に(例えば、ユーザが位置し得る医療施設から離れて提供されるサービスに)位置してもよい。
【0103】
政府の規制又は他の制限(例えば、健康保険、医療過誤保険、又は賠償責任保険による要件)が適用される場合、全ての結果は、それが完全に電子的に生成されるにしろ、又は部分的に電子的に生成されるにしろ、ユーザに対する発行前に品質管理ルーチンに供される。
【0104】
臨床的有用性
本明細書に開示される方法を実施することにより提供される遺伝子発現アッセイ及び情報により、医師がより十分な情報を得たうえで治療を判断すること、及び癌治療を個々の患者の必要性に対応したものとすることが促進され、それにより治療利益が最大化され、且つ、有意な利益をほとんど又は全く提供せず、しばしば中毒性副作用に起因する重大なリスクを包含し得る不必要な治療を患者に経験させることが最小限に抑えられる。
【0105】
単一又は複数の分析物の遺伝子発現検査を使用して、いくつかの関連する生理学的過程又は構成細胞の特性の各々に関与する1つ又は複数の遺伝子の発現レベルを測定することができる。1つ以上の発現レベルを使用してかかる定量的スコアを計算してもよく、及びかかるスコアがサブグループ(例えば、三分位)に編成されてもよく、ここでは所与の範囲にある全ての患者が、あるリスクカテゴリ(例えば、程度、中程度、又は高度)に属するものとして分類される。遺伝子のグループ化は、少なくとも一部では、上記で考察されるグループなどにおける、生理学的機能又は構成細胞の特性による遺伝子の寄与情報に基づき実施されてもよい。
【0106】
癌の予測における遺伝子マーカーの有用性は、当該のマーカーに特有ではないこともある。選択されたマーカー遺伝子と同等の発現パターンを有する代替マーカーが検査マーカーに代用されても、又はそれに追加して使用されてもよい。かかる遺伝子の共発現に起因して、発現レベル値の代用は、検査の全体的な予後診断上の有用性にほとんど影響を及ぼさないものでなければならない。2つの遺伝子の密接に類似した発現パターンは、双方の遺伝子が同じ過程に関与すること、及び/又は結腸腫瘍細胞において共通する調節制御下にあることによりもたらされ得る。従って本開示は、本開示の予後診断方法を代用するものとしての、又はそれに追加しての、かかる共発現遺伝子又は遺伝子セットの使用を企図する。
【0107】
癌、例えば乳癌における臨床転帰を予測するための本明細書に開示される方法により提供される分子アッセイ及び関連情報は、薬物の開発及び適切な使用による癌の治療、臨床試験に組み入れる(又はそれから除外する)ための癌患者の層別化、治療の判断における患者及び医師の支援、個別化されたゲノムプロファイルに基づき治療を標的化することによる経済的な利益の提供などを含め、多くの領域で有用性を有する。例えば、臨床試験で患者から採取した試料に対して再発スコアを使用し、その検査結果を患者転帰と併せて使用することにより、患者サブグループがグループ全体又は他のサブグループと比べて新規薬物からの絶対利益を示す可能性が高いか、又は低いかを決定してもよい。さらに、かかる方法を用いて、アジュバント療法が有益であると予想される患者の臨床データサブセットを特定することができる。加えて、手術のみで治療した場合に患者の臨床転帰が不良となる可能性が上昇することを検査結果が指示する場合、患者は臨床試験に組み入れられる可能性が高くなり、手術のみで治療した場合に患者の臨床転帰が不良となる可能性が低下することを検査結果が指示する場合、患者は臨床試験に組み入れられる可能性が低くなる。
【0108】
遺伝子発現レベルの統計解析
当業者は、目的の転帰(例えば、生存の可能性、化学療法に応答する可能性)と、本明細書に記載されるとおりのマーカー遺伝子の発現レベルとの間に有意な関係があるかどうかを決定するために用いられ得る多数の統計的方法があることを認識するであろう。この関係は連続的な再発スコア(RS)として提示することができ、又は患者がリスクグループ(例えば、低度、中程度、高度)に層別化されてもよい。例えば、Cox比例ハザード回帰モデルが特定の臨床エンドポイント(例えば、RFS、DFS、OS)に適合し得る。Cox比例ハザード回帰モデルの一つの仮定は、比例ハザード仮定、すなわち効果パラメータが基本となるハザードに乗算されるという仮定である。
【0109】
共発現解析
本開示は、再発及び/又は治療利益と有意な相関関係を有するとして特定された特定の予後及び/又は予測遺伝子と共発現する遺伝子を提供する。特定の生物学的過程を実施するため、遺伝子は多くの場合に協調して共に働き、すなわち遺伝子は共発現する。癌のような疾患過程に対して特定される共発現遺伝子グループは、疾患の進行及び治療に対する応答についてのバイオマーカーとして機能し得る。かかる共発現遺伝子は、それらが共発現する予後及び/又は予測遺伝子のアッセイに代えて、又はそれに加えて、アッセイすることができる。
【0110】
当業者は、現在公知の、又は後に開発される多数の共発現解析方法が本発明の範囲及び趣旨に含まれることを認識するであろう。これらの方法は、例えば、相関係数、共発現ネットワーク解析、クリーク分析等を組み込んでもよく、並びにRT-PCR、マイクロアレイ、配列決定、及び他の同様の技術からの発現データに基づいてもよい。例えば、ピアソン又はスピアマン相関係数に基づくペアワイズ相関分析を用いて、遺伝子発現クラスタを特定することができる。(例えば、Pearson K.及びLee A.,Biometrika 2,357頁(1902年);C.Spearman,Amer.J.Psychol 15:72~101頁(1904);J.Myers,A.Well,「Research Design and Statistical Analysis」,508頁(第2版,2003年)を参照のこと)。一般に、少なくとも20の試料サイズにおいて0.3以上の相関係数が、統計的に有意と見なされる。(例えば、G.Norman,D.Streiner,「Biostatistics:The Bare Essentials」,137~138頁(第3版 2007年)を参照のこと)。本明細書に開示される一実施形態では、少なくとも0.7のスピアマン相関値を使用して共発現遺伝子を特定した。
【0111】
コンピュータプログラム
上記に記載されるアッセイからの値、例えば、発現データ、再発スコア、治療スコア及び/又は利益スコアは、手動で計算及び保存することができる。或いは、上述のステップは、完全に、又は部分的に、コンピュータプログラム製品により実施されてもよい。従って本発明は、コンピュータプログラムが格納されたコンピュータ可読記憶媒体を含むコンピュータプログラム製品を提供する。プログラムは、コンピュータにより読まれると、個体由来の1つ又は複数の生体試料の分析から得られる値(例えば、遺伝子発現レベル、アッセイからの値の正規化、閾値化、並びに再発/化学療法に対する応答の可能性のスコア及び/又は図的表現への変換、遺伝子共発現解析又はクリーク分析など)に基づいて関連する計算を実行することができる。コンピュータプログラム製品は、そこに計算を行うためのコンピュータプログラムを格納している。
【0112】
本開示は、上記に記載されるプログラムを実行するためのシステムを提供し、このシステムは、概して以下を含む:a)セントラルコンピューティング環境;b)入力装置、コンピューティング環境に動作可能に接続されていて、それにより患者データを受け取り、ここで患者データとしては、例えば、発現レベル若しくは患者由来の生体試料を使用したアッセイから得られる他の値、又は上記に詳細に説明したとおりのマイクロアレイデータを挙げることができる;c)出力装置、コンピューティング環境に接続されていて、それによりユーザ(例えば、医療職員)に情報を提供する;及びd)セントラルコンピューティング環境(例えば、プロセッサ)により実行されるアルゴリズム、ここでアルゴリズムは入力装置が受け取るデータに基づき実行され、及びアルゴリズムは、リスク、リスクスコア、又は治療グループ分類、遺伝子共発現解析、閾値化、又は本明細書に記載される他の機能を計算する。本発明により提供される方法はまた、全て又は一部が自動化されてもよい。
【0113】
手動の、及びコンピュータ支援による方法及び製品
本明細書に記載される方法及びシステムは、数多くの方法で実装することができる。特に有益な一実施形態において、本方法は通信基盤、例えばインターネットの使用を含む。以下でいくつかの実施形態を考察する。また、本開示は、様々な形態のハードウェア、ソフトウェア、ファームウェア、プロセッサ、又はそれらの組み合わせで実装され得ることも理解されなければならない。本明細書に記載される方法及びシステムは、ハードウェアとソフトウェアとの組み合わせとして実装されてもよい。ソフトウェアは、プログラム格納装置にタンジブルに具体化されたアプリケーションプログラムとして実装されても、又はソフトウェアの種々の部分がユーザのコンピューティング環境(例えば、アプレットとして)及びレビューワのコンピューティング環境に実装されてもよく、ここでレビューワは、関連する遠隔サイト(例えば、サービス提供者の施設)に位置し得る。
【0114】
例えば、ユーザによるデータ入力中、又はその後、データ処理の一部はユーザ側のコンピューティング環境で実施されてもよい。例えば、ユーザ側のコンピューティング環境が、可能性「リスクスコア」を表すように定義された検査コードを提供するようにプログラムされてもよく、ここでスコアは、処理された、又は部分的に処理された応答として、続く1つ又は複数のアルゴリズムの実行によりレビューワのコンピューティング環境で結果を提供し、及び/又はレポートを生成するための検査コードの形態で、レビューワのコンピューティング環境に送られる。リスクスコアは、数値スコア(代表数値、例えばバリデーション試験対象集団に基づく再発の可能性)であっても、又は数値若しくは数値範囲を代表する非数値スコア(例えば、低度、中程度、又は高度)であってもよい。
【0115】
本明細書に記載されるアルゴリズムを実行するためのアプリケーションプログラムは、任意の好適なアーキテクチャを含むマシンにアップロードされ、及びそれにより実行され得る。一般に、マシンは、1つ又は複数の中央演算処理装置(CPU)、ランダムアクセスメモリ(RAM)、及び1つ又は複数の入出力(I/O)インタフェースなどのハードウェアを有するコンピュータプラットフォームを含む。コンピュータプラットフォームはまた、オペレーティングシステム及びマイクロ命令コードも含む。本明細書に記載される様々な方法及び機能は、マイクロ命令コードの一部か、又はオペレーティングシステムを介して実行されるアプリケーションプログラムの一部か(又はそれらの組み合わせか)のいずれかであってよい。加えて、追加のデータ記憶装置及び印刷装置などの様々な他の周辺装置がコンピュータプラットフォームに接続されてもよい。
【0116】
コンピュータシステムとして、システムは概してプロセッサユニットを含む。プロセッサユニットは情報を受け取るよう動作し、情報は検査データ(例えば、リスク遺伝子のレベル、1つ又は複数の参照遺伝子産物のレベル;遺伝子の正規化レベルを含むことができ;また患者データなどの他のデータも含み得る。この受け取った情報は、少なくとも一時的にデータベースに保存することができ、データを分析して、上記に記載したとおりレポートを生成することができる。
【0117】
入出力データの一部又は全てはまた、電子的に送信されてもよい;特定の出力データ(例えばレポート)は、電子的に又は電話により(例えば、ファクシミリにより、例えばファックスバックなどの装置を用いて)送信されてもよい。例示的な出力受信装置としては、表示要素、プリンタ、ファクシミリ装置などを挙げることができる。電子的形態の送信及び/又は表示としては、電子メール、インタラクティブテレビなどを挙げることができる。特に有益な実施形態では、入力データの全て若しくは一部及び/又は出力データ(例えば、通常は少なくとも最終レポート)の全て若しくは一部は、ウェブサーバ上で、典型的なブラウザによってアクセス、好ましくは機密アクセスが管理される。データは必要に応じて医療従事者によりアクセスされ、又は医療従事者に送信され得る。最終レポートの全て又は一部を含む入出力データを使用して、医療施設の機密データベースに存在し得る患者の診療記録がポピュレートされ得る。
【0118】
本明細書に記載される方法で使用されるシステムは、概して、少なくとも1つのコンピュータプロセッサ(例えば、その場合は本方法が全体として単一のサイトで実行される)、又は少なくとも2つのネットワーク化されたコンピュータプロセッサ(例えば、その場合はデータがユーザ(本明細書ではまた「クライアント」とも称される)により入力され、リモートサイトに分析用の第2のコンピュータプロセッサまで送信され、ここで第1及び第2のコンピュータプロセッサは、ネットワークにより、例えばイントラネット又はインターネットを介して接続されている)を含む。システムはまた、入力用の1つ又は複数のユーザコンポーネント;並びにデータ、生成されたレポートの閲覧、及び手動による介入用の1つ又は複数のレビューワコンポーネントも含むことができる。システムのさらなるコンポーネントとしては、1つ又は複数のサーバコンポーネント;及びデータ格納用の1つ又は複数のデータベース(例えば、レポート要素、例えば解釈レポート要素のデータベース、又はユーザによるデータ入力とデータ出力とを含み得るリレーショナルデータベース(RDB)などを挙げることができる。コンピュータプロセッサは、パーソナルデスクトップコンピュータ(例えば、IBM、Dell、Macintosh)、ポータブルコンピュータ、メインフレーム、ミニコンピュータ、又は他のコンピューティング装置に典型的に存在するプロセッサであってもよい。
【0119】
ネットワーク化されたクライアント/サーバアーキテクチャを必要に応じて選択することができ、例えば、従来の2層又は3層クライアントサーバモデルであってもよい。リレーショナルデータベース管理システム(RDMS)が、アプリケーションサーバコンポーネントの一部として、或いは別個のコンポーネント(RDBマシン)として、データベースとのインタフェースを提供する。
【0120】
一例において、アーキテクチャはデータベース中心のクライアント/サーバアーキテクチャとして提供され、ここではクライアントアプリケーションが、概してアプリケーションサーバからのサービスを要求し、それが、要求されるとおりの様々なレポート要素、詳細には解釈レポート要素、特に解釈テキスト及びアラートをレポートにポピュレートするよう求めるデータベース(又はデータベースサーバ)に対する要求となる。1つ又は複数のサーバが(例えば、アプリケーションサーバマシンの一部、或いは別個のRDB/リレーショナルデータベースマシンとして)、クライアントの要求に応答する。
【0121】
入力クライアントコンポーネントは、アプリケーションを実行するパワー及び機能の全てが揃った一式を提供する完全なスタンドアロンのパーソナルコンピュータであってもよい。クライアントコンポーネントは、通常、任意の所望のオペレーティングシステム下で動作し、通信要素(例えば、ネットワークに接続するためのモデム又は他のハードウェア)、1つ又は複数の入力装置(例えば、キーボード、マウス、キーパッド、又は情報若しくはコマンドを送るために使用される他の装置)、記憶要素(例えば、ハードドライブ又は他のコンピュータ可読でコンピュータ書込み可能な記憶媒体)、及び表示要素(例えば、モニタ、テレビ、LCD、LED、又はユーザに情報を伝える他の表示装置)を含む。ユーザは入力装置を介して入力コマンドをコンピュータプロセッサに入力する。概して、ユーザインタフェースは、ウェブブラウザアプリケーション用に書かれるグラフィカルユーザインターフェース(GUI)である。
【0122】
1つ又は複数のサーバコンポーネントはパーソナルコンピュータ、ミニコンピュータ、又はメインフレームであってもよく、データ管理、クライアント間での情報共有、ネットワーク管理及びセキュリティを提供する。使用されるアプリケーション及び任意のデータベースは同じサーバ上にあっても、又は異なるサーバ上にあってもよい。
【0123】
クライアント及び1つ又は複数のサーバ用の他のコンピューティング構成が、メインフレームなどの単一のマシン、マシンの集合、又は他の好適な機器構成上での処理を含めて企図される。一般に、クライアント及びサーバマシンが協働して本開示の処理を達成する。
【0124】
使用される場合、1つ又は複数のデータベースは、通常はデータベースサーバコンポーネントに接続され、及びデータを保持し得る任意の装置であってもよい。例えば、データベースは任意のコンピュータ用磁気又は光学記憶装置(例えば、CDROM、内蔵ハードドライブ、テープ装置)であってもよい。データベースはサーバコンポーネントから遠隔に位置しても(ネットワーク、モデム等を介したアクセスによる)、又はサーバコンポーネントにローカルに位置してもよい。
【0125】
本システム及び方法において使用される場合、データベースは、データ項目間の関係に従い編成及びアクセスされるリレーショナルデータベースであってもよい。リレーショナルデータベースは、概して複数のテーブル(エンティティ)から構成される。テーブルの行がレコード(個別の項目に関する情報の集合)を表し、列がフィールド(レコードの特定の属性)を表す。その最も単純な概念では、リレーショナルデータベースは、少なくとも1つの共通のフィールドによって互いに関連し合うデータエントリの集合である。
【0126】
データを入力する、及びいくつかの実施形態では、必要であれば適切なレポートを生成するサービスポイントにおいて、コンピュータ及びプリンタが装備されたさらなるワークステーションが使用されてもよい。1つ又は複数のコンピュータが、アプリケーションを立ち上げるためのショートカットを(例えばデスクトップ上に)有し、必要に応じてデータ入力、送信、分析、レポート受信等の開始を容易にすることができる。
【0127】
コンピュータ可読記憶媒体
本開示はまた、プログラムを格納したコンピュータ可読記憶媒体(例えばCD-ROM、メモリキー、フラッシュメモリカード、ディスケット等)も企図し、このプログラムは、コンピューティング環境で実行されるとアルゴリズムの実施を提供し、本明細書に記載されるとおりの応答可能性評価の結果の全て又は一部を実行する。コンピュータ可読媒体が本明細書に記載される方法を実行するための完全なプログラムを含む場合、プログラムは、収集、分析及び出力生成用のプログラム命令を含み、及び概して、本明細書に記載されるとおりユーザと対話し、そのデータを分析情報と併せて処理し、及び当該のユーザに対して独自の印刷された又は電子的な媒体を生成するためのコンピュータ可読コード装置を含む。
【0128】
記憶媒体が、本明細書に記載される方法の一部(例えば、本方法のユーザ側の態様(例えば、データ入力能力、レポート受信能力等))の実装を提供するプログラムを提供する場合、プログラムは、ユーザにより入力されたデータの(例えば、インターネットを介する、イントラネットを介する等による)リモートサイトにあるコンピューティング環境への送信を提供する。データの処理又は処理の完了はリモートサイトで実行され、レポートが生成される。レポートの受信、及び完成レポートの提供に必要な任意の手動介入の完了後、次に完成レポートは、電子文書又は印刷文書(例えば、ファックス又は郵送される紙のレポート)としてユーザに送り返される。本開示に係るプログラムを含む記憶媒体は、好適な担体に記録された(例えば、プログラムのインストール、使用等についての)説明書又はかかる説明書を得ることのできるウェブアドレスと共にパッケージングされてもよい。コンピュータ可読記憶媒体はまた、応答可能性評価を実行するための1つ又は複数の試薬(例えば、プライマー、プローブ、アレイ、又は他のかかるキット構成要素)と組み合わせて提供されてもよい。
【0129】
本発明の全ての態様は、例えば統計的に有意なピアソン及び/又はスピアマン相関係数によって証拠立てられるとおりの、開示される遺伝子と共発現する限られた数の追加的な遺伝子が、開示される遺伝子に加えて、及び/又はそれに代えて予後又は予測検査に含まれるように実施されてもよい。
【0130】
本発明が記載されたが、本発明は以下の実施例を参照することによってさらに容易に理解され得る。実施例は例示として提供され、いかなる形であっても本発明を限定することは意図されない。
【実施例】
【0131】
実施例1:
本試験には、乳癌と診断される136人の患者から得た乳癌腫瘍試料を組み入れた(「Providence試験」)。プロトタイプデータセットの生物統計学的モデリング試験から、増幅RNAがバイオマーカー同定試験に有用な担体であることが実証された。これについて、本試験では、組織試料中の候補予後遺伝子と共に公知の乳癌バイオマーカーを組み入れることにより検証した。公知のバイオマーカーは、このプロトコルで概説される基準に基づき増幅RNAにおいて臨床転帰と関連付けられることが示された。
【0132】
試験設計
生検標本情報について元のProvidence第II相試験プロトコルを参照する。本試験では、元のProvidence第II相試験の136個の試料から得た固定パラフィン包埋組織試料からの25ngの抽出mRNAに由来する増幅した試料中の384個の被験候補バイオマーカーと臨床転帰との間の統計的関連性を検討した。候補遺伝子の発現レベルは参照遺伝子を使用して正規化した。この試験では、いくつかの参照遺伝子を分析した:AAMP、ARF1、EEF1A1、ESD、GPS1、H3F3A、HNRPC、RPL13A、RPL41、RPS23、RPS27、SDHA、TCEA1、UBB、YWHAZ、B-アクチン、GUS、GAPDH、RPLPO、及びTFRC。
【0133】
136個の試料を3つの自動RTプレートに分け、プレートは各々、2×48個の試料及び40個の試料、並びに3個のRT陽性及び陰性対照を有した。QuantiTect Probe PCR Master Mix(登録商標)(Qiagen)を使用して、384ウェルで反復なしに定量的PCRアッセイを実施した。Light Cycler(登録商標)480でプレートを分析し、データ品質管理後、RTプレート3からの全ての試料を繰り返し、新規のRT-PCRデータを生成した。5個の参照遺伝子についてのクロッシングポイント中央値(CP)(検出がバックグラウンドシグナルを上回るまで上昇する点)を各個別の候補遺伝子のCP値から減じることによりデータを正規化した。この正規化は試料の各々で実施され、それによって全体的な試料CPの差が調整された最終データがもたらされる。このデータセットを最終的なデータ分析に使用した。
【0134】
データ分析
各遺伝子について、標準的なz検定を実施した。(S.Darby,J.Reissland,Journal of the Royal Statistical Society 144(3):298~331頁(1981年))。これは、z得点(平均値からの試料の標準偏差単位での距離の尺度)、p値、及び残差を、モデルからの他の統計値及びパラメータと伴せて返す。z得点が負の場合、発現は予後良好と正の相関を有する;正の場合、発現は予後良好と負の相関を有する。p値を用いて、ライブラリq値を使用してq値を得た。ほとんど相関のない発現が弱い遺伝子は、q値に使用される分布の計算から除外した。Cox比例ハザードモデル検定を実行して、生存時間が遺伝子発現に対する事象ベクトルと合致することを確認した。これは、各遺伝子の発現が(個々に)癌関連事象のリスクに及ぼす効果を推定するハザード比(HR)を返した。得られたデータを表1~表6に提供する。HR<1は、当該遺伝子の発現が予後良好と正の関連を有することを示し、一方、HR>1は、当該遺伝子の発現が予後良好と負の関連を有することを示す。
【0135】
実施例2:
試験設計
増幅した試料は、Rush University Medical Centerで行われた第II相乳癌試験からの78例の評価可能症例から得た固定パラフィン包埋組織試料からの25ngの抽出mRNAに由来した。試料のうち3個は25ngで十分な増幅RNAを提供できなかったため、50ngのRNAで2回目の増幅を繰り返した。この試験ではまた、正規化に使用されるいくつかの参照遺伝子も分析した:AAMP、ARF1、EEF1A1、ESD、GPS1、H3F3A、HNRPC、RPL13A、RPL41、RPS23、RPS27、SDHA、TCEA1、UBB、YWHAZ、β-アクチン、RPLPO、TFRC、GUS、及びGAPDH。
【0136】
QuantiTect Probe PCR Master Mixを使用して、384ウェルで反復なしにアッセイを実施した。Light Cycler 480機器でプレートを分析した。このデータセットを最終的なデータ分析に使用した。5個の参照遺伝子についてのCP中央値を、各個別の候補遺伝子のCP値から減じることによりデータを正規化した。この正規化は各試料に対して実施し、それよって全体的な試料CPの差が調整された最終データがもたらされた。
【0137】
データ分析
CP平均値が35を上回る試料が34個あった。しかしながらいずれの試料も、試験に残すだけの十分に有益な情報を有すると考えられたため、分析から除外しなかった。主成分分析(PCA)を用いて、異なるRTプレート間にばらつきを生じさせるプレート効果があったかどうかを決定した。第1の主成分は発現値中央値と十分な相関を有したことから、試料間のばらつきの大部分は発現レベルによってもたらされたことが示された。また、プレート間に予想されないばらつきはなかった。
【0138】
他の変数用のデータ
グループ-患者は2つのグループ(癌/非癌)に分けた。各グループにおけるCP中央値の差が最小(0.7)であったとおり、2つの間に全体的な遺伝子発現の差はほとんどなかった。
【0139】
試料保存年数-試料はその全体的な遺伝子発現が幅広く異なったが、その保存年数が短いほどCP値が低くなる傾向があった。
【0140】
機器-機器ごとの全体的な試料遺伝子発現は一貫していた。1つの機器が他の3つと比較して僅かに高いCP中央値を示したが、十分に許容範囲内のばらつきであった。
【0141】
RTプレート-RTプレート間の全体的な試料遺伝子発現もまた極めて一貫していた。3つのRTプレート(2つは自動RTプレート及び1つは手動プレートで反復試料を含んだ)の各々についてのCP中央値は全て、互いの1CPの範囲内であった。
【0142】
試験グループ間で有意に異なる遺伝子の一変量解析
z検定及びCox比例ハザードモデルを使用して、これらの遺伝子を実施例1に記載のとおり分析した。得られたデータは表7~表12に見ることができる。
【0143】
実施例3:
臨床転帰と、実施例1及び実施例2で特定した遺伝子の発現レベルとの間の統計的相関を、Swiss Institute of Bioinformatics(SIB)によって管理される乳癌遺伝子発現データセットで検証した。SIBデータベース、試験データセット、及び処理方法に関するさらなる情報は、P.Wirapatiら,Breast Cancer Research 10(4):R65頁(2008年)に提供される。一変量Cox比例ハザード分析を実施して、乳癌患者の臨床転帰(DFS、MFS、OS)と、上記に記載される増幅RNA試験で有意と特定された遺伝子の発現レベルとの間の関係を確認した。メタ分析には固定効果モデル及び変量効果モデルの双方を含めた。これらのモデルについては、L.Hedges及びJ.Vevea,Psychological Methods 3(4):486~504頁(1998年)並びにK.Sidik及びJ.Jonkman,Statistics in Medicine 26:1964~1981頁(2006年)(これらの内容は参照により本明細書に援用される)にさらに記載されている。乳癌臨床転帰との統計的に有意な関連性があると特定された全ての遺伝子についての検証結果を表13に示す。これらの表中、「Est」は共変量(遺伝子発現)の推定係数を示し;「SE」は標準誤差であり;「t」はこの推定量についてのt得点(すなわち、Est/SE)であり;及び「fe」はメタ分析からの固定効果推定量である。乳癌における臨床転帰との有意な統計的関連性を有する遺伝子ファミリー(代謝、増殖、免疫、及び間質グループ遺伝子を含む)のいくつかについて、SIBデータセットを使用して確認した。例えば、表14は代謝グループ、及び表15は間質グループに含まれる遺伝子の分析を含む。
【0144】
実施例4:
マイクロアレイデータを使用して6つの乳癌データセットからの共発現解析を実施した。GEOウェブサイトからは「処理済みの」発現値が入手されるが、しかしながら、さらなる処理が必要であった。発現値がRMAである場合、それらは試料レベルに対して中央値で正規化される。発現値がMAS5.0である場合、それらは、(1)<10である場合10に変更され;(2)底eで対数変換され;及び(3)試料レベルに対して中央値で正規化される。
【0145】
相関対の生成:各試料の発現値を降順に並べることによりランク行列を生成した。次に、プローブIDの対ごとにスピアマン相関値を計算することによって相関行列を作成した。スピアマン値≧0.7を有したプローブ対を共発現と見なした。複数のデータセットにおいて冗長な又は重複する相関対を特定した。配列データセットから生成した各相関行列について、>1のデータセットに生じる有意なプローブ対を特定した。これは、分析からの「有意でない」対をフィルタリングするとともに、複数のデータセットに存在する「有意な」対についての追加的なエビデンスを提供する働きをした。各組織特異的分析に組み入れたデータセットの数に応じて、最小の数又は割合のデータセットに現れる対のみを組み入れた。
【0146】
無向グラフにおいて最大クリークを求めるためのブロン-ケルボッシュ(Bron-Kerbosch)アルゴリズムを使用して共発現クリークを生成した。このアルゴリズムは3つの節点集合を生成する:compsub、候補、及びnot。compsubは、木探索におけるその走査方向に応じて1つずつ拡張又は縮小される節点集合を含む。候補は、compsubに追加される対象となる全ての節点からなる。notは、compsubに追加された節点集合であって、その回は拡張から除外される節点集合を含む。このアルゴリズムは5つのステップからなる:候補の選択;候補節点をcompsubに追加する;元の候補及びnot集合から候補節点に接続されない点を全て除くことによりその新しい集合を作成する;新しい候補及びnot集合に対して拡張演算子を再帰的に呼び出す;及び戻ったときはcompsubからその候補節点を除き、元のnot集合に入れる。
【0147】
枝刈りを伴う深さ優先探索があり、候補節点の選択がアルゴリズムの実行時間に影響を及ぼした。対における頻度の降順で節点を選択することにより実行時間を最適化した。また、再帰アルゴリズムは概してマルチスレッド的に実行させることができないが、マルチスレッディングした 第1の再帰レベルの拡張演算子。再帰木の最上位にあったことでスレッド間のデータは独立していたため、スレッドは並列で実行された。
【0148】
クリークマッピング及び正規化:共発現対及びクリークのメンバーはプローブレベルにあるため、それらを分析できるようにするには、まずプローブIDを遺伝子(又はRefseq)にマッピングしなければならない。Affymetrix遺伝子地図情報を使用して全てのプローブIDを遺伝子名にマッピングした。プローブは複数の遺伝子にマッピングされ得るとともに、遺伝子は複数のプローブにより表され得る。各クリークのデータは、単一のクリークからの各対について相関値を手動で計算することにより検証される。
【0149】
この共発現解析の結果を表16~表18に示す。
【0150】
【0151】
【0152】
【0153】
【0154】
【0155】
【0156】
【0157】
【0158】
【0159】
【0160】
【0161】
【0162】
【0163】
【0164】
【0165】
【0166】
【0167】
【0168】
【0169】
【0170】
【0171】
【0172】
【0173】
【0174】
【0175】
【0176】
【0177】
【0178】
【0179】
【0180】
【0181】
【0182】
【0183】
【0184】
【0185】
【0186】
【0187】
【0188】
【0189】
【0190】
【0191】
【0192】
【0193】
【0194】
【0195】
【0196】
【0197】
【0198】
【0199】
【0200】
【0201】
【0202】
【0203】
【0204】
【0205】
【0206】
【0207】
【0208】
【0209】
【0210】
【0211】
【0212】
【0213】
【0214】
【0215】
【0216】
【0217】
【0218】
【0219】
例示的な実施形態
1. エストロゲン受容体(ER)陽性乳癌と診断された患者の臨床転帰を予測するための方法であって、
(a)患者の乳癌腫瘍から得られた組織試料におけるIL6STのRNA転写物のレベルを定量的に測定するステップと、
(b)前記IL6STのRNA転写物のレベルを正規化して、正規化IL6ST発現レベルを得るステップと、
(c)前記正規化IL6ST発現レベルを、乳癌参照セットから得た正規化IL6ST発現レベルと比較するステップと、
(d)前記正規化IL6ST発現レベルが、乳癌参照セットから得た正規化IL6ST発現レベルに比して増加している場合に、前記患者が予後が良好である可能性が高いことを決定するステップであって、このとき良好な予後が、再発又は転移の可能性の低減ないしは全生存期間の増加である、ステップと、
を含む方法。
2. 前記正規化IL6ST発現レベルに基づきレポートを生成するステップをさらに含む、実施形態1に記載の方法。
3. 前記組織試料が固定パラフィン包埋組織試料である、実施形態1又は2に記載の方法。
4. 前記IL6STのRNA転写物のレベルがPCRベースの方法を用いて測定される、実施形態1から3のいずれか一項に記載の方法。
5. P2RY5のRNA転写物のレベルを測定するステップをさらに含む、実施形態1から4のいずれか一項に記載の方法。
6. 前記組織試料がコア生検又は細針吸引によって得られる、実施形態1から5のいずれか一項に記載の方法。
7. IL6STのRNA転写物のレベルがクロッシングポイント(Cp)値であり、正規化IL6ST発現レベルが正規化Cp値である、実施形態1から6のいずれか一項に記載の方法。
8. IL6STのRNA転写物のレベルが閾値サイクル(Ct)値であり、正規化IL6ST発現レベルが正規化Ct値である、実施形態1から6のいずれか一項に記載の方法。
9. 予後良好が再発又は転移の可能性の低減である、実施形態1から8のいずれか一項に記載の方法。
10. エストロゲン受容体(ER)陽性乳癌と診断されたヒト患者の臨床転帰を予測するための方法であって、
(a)患者から得られる乳癌組織試料からRNAを抽出するステップと、
(b)IL6STのRNA転写物を逆転写して、IL6STのcDNAを製造するステップと、
(c)IL6STのcDNAを増幅するステップと、
(d)IL6STのRNA転写物のアンプリコンを製造するステップと、
(e)IL6STのRNA転写物のアンプリコンのレベルを定量的にアッセイするステップと、
(f)前記IL6STのRNA転写物のアンプリコンのレベルを正規化して、正規化IL6STアンプリコンレベルを提供するステップと、
(g)前記正規化IL6STアンプリコンレベルを、乳癌参照セットから得られる正規化IL6STアンプリコンレベルと比較するステップと、
(h)前記正規化IL6STアンプリコンレベルが、乳癌参照セットから得られる正規化IL6STアンプリコンレベルに比して増加している場合に、前記患者が予後が良好である可能性が高いことを決定するステップであって、このとき良好な予後が、再発又は転移の可能性の低減ないしは全生存期間の増加である、ステップと、
を含む方法。
11. 前記正規化IL6STアンプリコンレベルに基づきレポートを生成するステップをさらに含む、実施形態10に記載の方法。
12. 前記組織試料が、固定パラフィン包埋組織である、実施形態10又は11に記載の方法。
13. 前記IL6STのcDNAがPCRベースの方法を用いて増幅される、実施形態10から12のいずれか一項に記載の方法。
14. 患者から得た乳癌組織試料中のP2RY5のRNA転写物を増幅するステップをさらに含む、実施形態10から13のいずれか一項に記載の方法。
15. IL6STのRNA転写物のアンプリコンのレベルがクロッシングポイント(Cp)値であり、正規化IL6STアンプリコンレベルが正規化Cp値である、実施形態10から14のいずれか一項に記載の方法。
16. IL6STのRNA転写物のアンプリコンのレベルが閾値サイクル(Ct)値であり、正規化IL6STアンプリコンレベルが正規化Ct値である、実施形態10から14のいずれか一項に記載の方法。
17. 予後良好が再発又は転移の可能性の低減である、実施形態10から16のいずれか一項に記載の方法。
18. エストロゲン受容体(ER)陽性乳癌と診断されたヒト患者を予後によって分類するためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、メモリとプロセッサとを有するコンピュータと協働して使用され、符号化されたコンピュータプログラムを有するコンピュータ可読記憶媒体を含み、前記コンピュータプログラム製品は、コンピュータの前記1つ又は複数のメモリユニットにロードされ、且つ前記コンピュータの前記1つ又は複数のプロセッサユニットに、
(a)前記患者の乳癌腫瘍から得られる組織試料におけるIL6STのRNA転写物のレベルを含むデータを受け取るステップと、
(b)前記レベルを正規化して、正規化IL6ST発現レベルを得るステップと、
(c)前記正規化IL6ST発現レベルを、乳癌参照セットから得られる正規化IL6ST発現レベルと比較するステップと、
(d)前記正規化IL6ST発現レベルが、乳癌参照セットから得られる正規化IL6STレベルに比して増加している場合に、前記患者が予後が良好である可能性が高いと分類するステップであって、このとき良好な予後が、再発又は転移の可能性の低減ないしは全生存期間の増加である、ステップと
を実行させる、コンピュータプログラム製品。
【配列表】