特許第5725274号(P5725274)IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ 国立大学法人大阪大学の特許一覧 ▶ シスメックス株式会社の特許一覧

<>
  • 特許5725274-乳癌の予後の検査方法 図000026
  • 特許5725274-乳癌の予後の検査方法 図000027
  • 特許5725274-乳癌の予後の検査方法 図000028
  • 特許5725274-乳癌の予後の検査方法 図000029
  • 特許5725274-乳癌の予後の検査方法 図000030
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】特許公報(B2)
(11)【特許番号】5725274
(24)【登録日】2015年4月10日
(45)【発行日】2015年5月27日
(54)【発明の名称】乳癌の予後の検査方法
(51)【国際特許分類】
   C12Q 1/68 20060101AFI20150507BHJP
   G01N 33/53 20060101ALI20150507BHJP
   G01N 37/00 20060101ALI20150507BHJP
   C12N 15/09 20060101ALN20150507BHJP
【FI】
   C12Q1/68 A
   G01N33/53 M
   G01N37/00 102
   !C12N15/00 A
【請求項の数】7
【全頁数】31
(21)【出願番号】特願2010-98935(P2010-98935)
(22)【出願日】2010年4月22日
(65)【公開番号】特開2011-223957(P2011-223957A)
(43)【公開日】2011年11月10日
【審査請求日】2013年2月26日
【国等の委託研究の成果に係る記載事項】(出願人による申告)平成21年度、文部科学省、「関西広域バイオメディカルクラスター構想(大阪北部(彩都)地域)に伴う研究委託業務」に係る再委託契約、産業技術力強化法第19条の適用を受ける特許出願
(73)【特許権者】
【識別番号】504176911
【氏名又は名称】国立大学法人大阪大学
(73)【特許権者】
【識別番号】390014960
【氏名又は名称】シスメックス株式会社
(74)【代理人】
【識別番号】110000280
【氏名又は名称】特許業務法人サンクレスト国際特許事務所
(72)【発明者】
【氏名】野口 眞三郎
(72)【発明者】
【氏名】直居 靖人
(72)【発明者】
【氏名】岸 和希
(72)【発明者】
【氏名】後藤 健吾
【審査官】 森井 文緒
(56)【参考文献】
【文献】 Nature (2002) vol.415, no.6871, p.530-536
【文献】 実験医学 (2007) vol.25, no.17, p.58-62
【文献】 がん研究に関わる特定領域研究研究報告書録 平成20年度 (2009) p.248
【文献】 Bioinformatics (2002) vol.18, no.12, p.1600-1608
【文献】 Expert Opin. Biol. Ther. (2005) vol.5, no.8, p.1069-1083
(58)【調査した分野】(Int.Cl.,DB名)
C12N 15/00−15/90
C12Q 1/68
PubMed
CAplus/MEDLINE/EMBASE/BIOSIS(STN)
JSTPlus/JMEDPlus/JST7580(JDreamIII)
Thomson Innovation
(57)【特許請求の範囲】
【請求項1】
(A)被験者から採取された検体からRNAを抽出する工程、
(B)前記工程(A)で抽出されたRNAを用いて測定用試料を調製する工程、
(C)前記工程(B)で得られた測定用試料を用いて、表1−1−1および表1−2−1に記載の遺伝子群の各遺伝子の発現量を測定する工程、
(D)前記工程(C)で測定された前記各遺伝子の発現量を解析する工程、および
(E)前記工程(D)で得られた解析結果に基づいて、乳癌の予後を検査する工程
を含む、乳癌の予後の検査方法。
【表1】

【表2】
【請求項2】
前記工程(D)において、前記発現量を、クラス分け手法を用いて解析する、請求項1に記載の乳癌の予後の検査方法。
【請求項3】
前記クラス分け手法が、Between−group analysisである、請求項2に記載の乳癌の予後の検査方法。
【請求項4】
前記工程(D)において、前記発現量と、下記式(1):
【数1】

{式(1)中、iは表1−1および表1−2に記載の核酸に付与された遺伝子番号を示し、wiは表1−1および表1−2に記載された遺伝子番号iの核酸に対応する重み係数を示し、Xiは下記式(2):
【数2】

〔式(2)中、jは各検体に付与された検体番号を示し、yijは遺伝子番号iの核酸に対応する遺伝子の検体番号jの検体での標準化された発現量を示し、minは括弧内の値の最小値を示し、roundは括弧内の値の小数点以下第一位を四捨五入した値を示し、absは括弧内の値の絶対値を示し、yiは、下記式(3):
【数3】

(式(3)中、xiは遺伝子番号iの核酸に対応する遺伝子の発現量を示し、uiは遺伝子番号iの核酸に対応する遺伝子の発現量の検体に渡る平均値を示す。)
に示される遺伝子番号iの核酸に対応する遺伝子の標準化された発現量を示す。〕
により標準化され正規化された発現量を示し、Σiは各核酸に渡る総和を示す。}
で表される判別式とを用いて前記判別式の解Dを算出し、
前記工程(E)において、前記判別式の解Dが正の値であるとき、予後が不良であると予測され、解Dがゼロまたは負の値のとき、予後が良好であると予測される、請求項1に記載の乳癌の予後の検査方法。
【表3】

【表4】
【請求項5】
前記工程(D)において、前記発現量を、階層的クラスター分析により解析する、請求項1に記載の乳癌の予後の検査方法。
【請求項6】
前記工程(D)において、前記発現量を、スコア化手法により解析する、請求項1に記載の乳癌の予後の検査方法。
【請求項7】
前記工程(C)において、前記発現量を、前記表1−1−1および表1−2−1に記載の核酸を少なくとも有するマイクロアレイを用いて測定する請求項1〜6のいずれかに記載の乳癌の予後の検査方法。
【発明の詳細な説明】
【技術分野】
【0001】
本発明は、乳癌の予後の検査方法に関する。
【背景技術】
【0002】
原発性乳癌の症例のうち約2/3の症例では、乳癌細胞にエストロゲン受容体(ER)が存在している(「ER陽性」という)。ER陽性の乳癌細胞では、ERへのエストロゲンの結合が、細胞増殖の一因となっている。
したがって、リンパ節転移陰性・ER陽性の乳癌患者に対する治療においては、ERを標的とするホルモン療法は、重要な役割を果たしている。
【0003】
前記リンパ節転移陰性・ER陽性の乳癌患者に対するホルモン療法では、例えば、当該患者に対して、タモキシフェンなどの抗エストロゲン剤を投与し、乳癌細胞のERへのエストロゲンの結合をブロックして乳癌細胞の増殖を抑制することによって、乳癌の転移や再発の抑制が図られている。かかるホルモン療法を前記患者に施した場合、当該患者のうちのほとんどが、比較的良好な予後を示す。
しかしながら、前記患者の約20%において、乳癌が再発することがある。
【0004】
そのため、前記リンパ節転移陰性・ER陽性乳癌患者は、ほとんどの場合、化学療法が不要であると考えられるにもかかわらず、乳癌の再発率を減らすために、前記リンパ節転移陰性・ER陽性乳癌患者のほとんどに対して、ホルモン療法だけでなく、アジュバント化学療法が施されているのが現状である。
したがって、高い再発リスクがある患者に対してのみアジュバント化学療法を施すために、前記リンパ節転移陰性・ER陽性乳癌患者の予後を予測することが重要であると考えられている。
【0005】
近年、網羅的遺伝子発現プロファイルの解析に基づき、乳癌患者における乳癌の予後を予測することが試みられている(例えば、特許文献1、2、非特許文献1などを参照)。
【0006】
前記特許文献1には、117人の乳癌患者の腫瘍サンプルを用いて同定された遺伝子マーカーを用い、乳癌患者の細胞サンプルにおける前記遺伝子マーカーの発現と対照における当該遺伝子マーカーの発現とを比較した差により、乳癌患者を「初期診断から5年以内に遠位転移なし」の患者または「初期診断から5年以内に遠位転移あり」の患者に分類する方法が記載されている。また、前記特許文献1には、前記遺伝子マーカーとして、ERの有無を識別することができる遺伝子マーカー、BRCA1遺伝子の変異を有する腫瘍と散発性腫瘍とを識別することができる遺伝子マーカーおよび「初期診断から5年以内に遠位転移なし」の患者と「初期診断から5年以内に遠位転移あり」の患者とを識別することができる遺伝子マーカーを用いることが記載されている。
【0007】
また、前記特許文献2には、286人のリンパ節転移陰性の乳癌患者の腫瘍サンプルを用いて同定された予後診断の指標となる76個の遺伝子を用い、乳癌患者の生体サンプルにおける前記遺伝子の発現プロファイルを得、当該発現レベルを所定のカットオフレベルと対比することで予後診断をする方法が記載されている。
【0008】
さらに、前記非特許文献1には、189例の侵襲性乳癌患者と3つの公知の乳癌の遺伝子発現データセットとを用いて同定された97個の遺伝子に基づくGenomic Grade Index(GGI)を用い、組織学的悪性度2として従来分類されていた乳癌の症例を、さらに、再発高リスク群と再発低リスク群とに分け、予後を予測する方法が記載されている。
【先行技術文献】
【特許文献】
【0009】
【特許文献1】特表2009−131262号公報
【特許文献2】特開2007−528218号公報
【非特許文献】
【0010】
【非特許文献1】クリストス・ソテリウ(Sotiriou Christos)ら、「乳癌における遺伝子発現プロファイル:予後を改善するための組織学的悪性度の理解(Gene expression profiling in breast cancer: understanding the molecular basis of histologic grade to improve prognosis.)」、ジャーナル・オブ・ザ・ナショナル・キャンサー・インスティチュート(Journal of the National Cancer Institute)、2006年2月15日発行、第98巻、第4号、p.262−272
【発明の概要】
【発明が解決しようとする課題】
【0011】
しかしながら、これらの方法は、調べられた施設間の差や人種間の差などの影響を受け、必ずしも適切に予後を予測することができるとは限らないのが現状である。
【0012】
本発明は、前記従来技術に鑑みてなされたものであり、予後を適切に予測することができる乳癌における予後の検査方法を提供することを目的とする。
【課題を解決するための手段】
【0013】
すなわち、本発明は、
〔1〕(A)乳癌に罹患した被験者から採取された検体からRNAを抽出する工程、
(B)前記工程(A)で抽出されたRNAを用いて測定用試料を調製する工程、
(C)前記工程(B)で得られた測定用試料を用いて、表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を測定する工程、
(D)前記工程(C)で測定された前記発現量を解析する工程、および
(E)前記工程(D)で得られた解析結果に基づいて、乳癌の予後を検査する工程
を含む、乳癌の予後の検査方法、
〔2〕前記工程(D)において、前記発現量を、クラス分け手法を用いて解析する、前記〔1〕に記載の乳癌の予後の検査方法、
〔3〕前記クラス分け手法が、Between−group analysisである、前記〔2〕に記載の乳癌の予後の検査方法、
〔4〕前記工程(D)において、前記発現量と、下記式(1):
【0014】
【数1】
【0015】
{式(1)中、iは表1−1および表1−2に記載の核酸に付与された遺伝子番号を示し、wiは表1−1および表1−2に記載された遺伝子番号iの核酸に対応する重み係数を示し、Xiは下記式(2):
【0016】
【数2】
【0017】
〔式(2)中、jは各検体に付与された検体番号を示し、yijは遺伝子番号iの核酸に対応する遺伝子の検体番号jの検体での標準化された発現量を示し、minは括弧内の値の最小値を示し、roundは括弧内の値の小数点以下第一位を四捨五入した値を示し、absは括弧内の値の絶対値を示し、yiは、下記式(3):
【0018】
【数3】
【0019】
(式(3)中、xiは遺伝子番号iの核酸に対応する遺伝子の発現量を示し、uiは遺伝子番号iの核酸に対応する遺伝子の発現量の検体に渡る平均値を示す。)
に示される遺伝子番号iの核酸に対応する遺伝子の標準化された発現量を示す。〕
により標準化され正規化された発現量を示し、Σiは各核酸に渡る総和を示す。}
で表される判別式とを用いて前記判別式の解Dを算出し、
前記工程(E)において、前記判別式の解Dが正の値であるとき、予後が不良であると予測され、解Dがゼロまたは負の値のとき、予後が良好であると予測される、前記〔1〕に記載の乳癌の予後の検査方法、
〔5〕前記工程(D)において、前記発現量を、階層的クラスター分析により解析する、前記〔1〕に記載の乳癌の予後の検査方法、
〔6〕前記工程(D)において、前記発現量を、スコア化手法により解析する、前記〔1〕に記載の乳癌の予後の検査方法、ならびに
〔7〕前記工程(C)において、前記発現量を、表1−1および表1−2に記載の核酸を少なくとも有するマイクロアレイを用いて測定する前記〔1〕〜〔6〕のいずれかに記載の乳癌の予後の検査方法
に関する。
【発明の効果】
【0020】
本発明の乳癌の予後の検査方法によれば、予後を適切に予測することができるという優れた効果を奏する。
【図面の簡単な説明】
【0021】
図1】実施例1において、プローブ数と、ROC曲線の曲線下面積との関係を調べた結果を示すグラフである。
図2】実施例2において、105例の乳癌患者について、判別式による予測結果と、観察結果とを比較した結果を示す図である。
図3】実施例2において、術後からの期間と、非再発生存率との関係を調べた結果を示すグラフである。
図4】実施例3において、105例の乳癌患者それぞれにおける核酸(プローブセット)に対応する遺伝子の発現量のデータの階層的クラスター分析を行なった結果を示す樹形図である。
図5】実施例4において、105例の乳癌患者それぞれの発現量のデータに基づき算出した第一主成分スコアおよび第二主成分スコアの散布図である。
【発明を実施するための形態】
【0022】
本発明の乳癌の予後の検査方法は、
(A)被験者から採取された検体からRNAを抽出する工程、
(B)前記工程(A)で抽出されたRNAを用いて測定用試料を調製する工程、
(C)前記工程(B)で得られた測定用試料を用いて、表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を測定する工程、
(D)前記工程(C)で測定された前記発現量を解析する工程、および
(E)前記工程(D)で得られた解析結果に基づいて、乳癌の予後を検査する工程
を含むことを特徴としている。
【0023】
【表1】
【0024】
【表2】
【0025】
本明細書において、「プローブセット.ID」は、アフィメトリクス(Affymetrix)社製のマイクロアレイ〔商品名:GeneChip(登録商標) System〕において、基材上に固定されたプローブの11〜20個をまとめたプローブセットそれぞれにつけられているID番号を示す。前記プローブセット.IDで示された核酸(プローブセット)の塩基配列は、ウェブページhttps://www.affymetrix.com/analysis/netaffx/index.affxにより容易に入手することができる(2009年6月30日更新のデータベース)。「UniGene.ID」は、NCBIが公開しているデータベースであるUniGeneのID番号を示す。GenBankアクセッション番号は、前記アフィメトリクス(Affymetrix)社製のマイクロアレイ〔商品名:GeneChip(登録商標) System〕において、基材上に固定されたプローブそれぞれの配列の設計に用いられた公開データベースGenBankのアクセッション番号を示す。
【0026】
なお、本明細書において、「表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量」の用語は、表1−1および表1−2に記載のプローブセット.IDに対応する表1−1および表1−2に記載のGenBankアクセッション番号で示される核酸を保持する遺伝子の発現量を意味する。GenBankは、米国生物工学情報センター(National Center for Biotechnology Information)により提供されているデータベースであり、ウェブページhttp://www.ncbi.nlm.nih.gov/sites/entrez?db=nucleotideなどにより利用可能である。そして、前記表1−1および1−2に記載のGenBankアクセッション番号が付された配列は、上記データベースより入手することができる。また、前記GenBankアクセッション番号は、2009年6月30日時点での最新リリースでの番号を示す。なお、本明細書において、「遺伝子」とは、遺伝子転写産物としてのRNAが抽出される塩基配列の単位またはその一部であればよく、EST(expressed sequence tag)も含む概念である。
【0027】
本発明の検査方法では、まず、被験者から採取された検体からRNAを抽出する〔工程(A)〕。
【0028】
前記被験者とは、乳癌患者および乳癌の疑いのある患者をいう。ここで、乳癌患者としては、特に限定されないが、例えば、リンパ節転移陰性・ER陽性の乳癌患者などが挙げられる。かかるリンパ節転移陰性・ER陽性の乳癌患者は、抗エストロゲン剤を投与するホルモン療法が施されたリンパ節転移陰性・ER陽性の乳癌患者であってもよい。
【0029】
本発明の検査方法では、被験者が、例えば、抗エストロゲン剤を投与するホルモン療法が施されたリンパ節転移陰性・ER陽性の乳癌患者である場合、患者が予後良好であるという予測を高い精度で行なうことができる。なお、本明細書において、「予後良好」とは、術後10年間に再発がないことをいう。
【0030】
前記検体としては、例えば、手術時に切除された腫瘍組織、生検により被験者から採取された検体などが挙げられる。
【0031】
検体からのRNAの抽出は、公知の方法によって行なうことができる。また、検体からのRNAの抽出は、RNAを抽出するための市販のキットを用いることもできる。ここで、市販のキットとしては、キアゲン(Qiagen)社製、商品名:Qiagen RNeasy kit(登録商標)などが挙げられる。
【0032】
つぎに、前記工程(A)で抽出されたRNAを用いて測定用試料を調製する〔工程(B)〕。
【0033】
本工程(B)では、遺伝子の発現量、すなわち、当該遺伝子に対応する転写産物(cRNA、cDNA、mRNAなど)の産生量などを測定するのに適した測定用試料を調製する。具体的には、測定用試料は、例えば、前記工程(A)で抽出されたRNAを用いて、対応するcRNAまたはcDNAを増幅すること、前記工程(A)で抽出されたRNAよりmRNAを精製することなどによって調製することができる。また、本発明においては、遺伝子の発現量を測定することが可能であるのであれば、前記工程(A)で抽出されたRNAをそのまま測定用試料として用いてもよい。
【0034】
前記cRNAの増幅は、公知の方法を用いて行なうことができる。cRNAの増幅には、cRNAの増幅するための市販のキットを用いることもできる。ここで、前記市販のキットとしては、例えば、アフィメトリクス(Affymetrix)社製、商品名:One−Cycle Target Labeling and Control Reagentsなどが挙げられる。また、前記cDNAの増幅は、公知の方法を用いて行なうことができる。cDNAの増幅には、cDNAの増幅するための市販のキットを用いることもできる。前記mRNAの精製は、公知の精製方法を用いて行なうことができる。また、mRNAの精製には、市販の精製キットを用いてもよい。
【0035】
つぎに、前記工程(B)で得られた測定用試料を用いて、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を測定する〔工程(C)〕。
【0036】
本工程(C)において、前記発現量の測定には、例えば、マイクロアレイ、定量的RT-PCR、定量的PCRなどを用いることができる。これらのなかでは、前記発現量を迅速、かつ簡便に測定することができることから、マイクロアレイを用いて測定することが好ましい。この場合、前記発現量は、以下の工程において、マイクロアレイにおける蛍光強度のまま用いてもよい。マイクロアレイによる前記発現量の測定は、公知の方法を用いて行なうことができる。
【0037】
表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量は、例えば、かかる表1−1および表1−2に記載の核酸(プローブセット.IDで示されたプローブセット)を利用することで測定することができる。本発明の検査方法においては、前記表1−1および表1−2に記載の核酸(プローブセット)は、乳癌の予後の検査に際して、予後因子として用いられる。かかる核酸(プローブセット)は、乳癌の多くの症例における予後の検査において、効果量が大きいものとして本発明者らにより見出されたものである。また、本発明の検査方法における予後因子に用いる前記核酸(プローブセット)の数は、95個であり、検査の精度が最も高くなる数とされている。したがって、本発明の検査方法によれば、種々の症例について、予後を適切に予測することができる。
【0038】
本発明の検査方法では、マイクロアレイを用いて前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を測定する場合、前記マイクロアレイとして、例えば、前記表1−1および表1−2に記載の核酸(プローブセット)を少なくとも有するマイクロアレイなどを用いることができる。かかるマイクロアレイとしては、例えば、ヒトゲノムの発現解析が可能なマイクロアレイであるアフィメトリクス(Affymetrix)社製の商品名:Human Genome U133 Plus 2.0 Arrayなどが挙げられる。例えば、前記アフィメトリクス(Affymetrix)社製の商品名:Human Genome U133 Plus 2.0 Arrayを用いた場合、表1−1および表1−2に記載のプローブセット.IDで示される95個の核酸(プローブセット)によって、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を一度に測定することができる。
【0039】
つぎに、前記工程(C)で測定された前記発現量を解析する〔工程(D)〕。その後、前記工程(D)で得られた解析結果に基づいて、乳癌の予後を検査する〔工程(E)〕。
【0040】
前記工程(D)において、前記発現量は、例えば、クラス分け手法、階層的クラスター分析およびスコア化手法を用いて、解析することができる。ここで、前記発現量は、測定された発現量の生データを、例えば、RMAアルゴリズム、MAS5アルゴリズム、PLIERアルゴリズムなどによって正規化したものを用いることができる。前記RMAアルゴリズムは、例えば、解析ソフトウェア〔アフィメトリクス(Affymetrix)社製、商品名:Affymetrix Expression Consoleソフトウェア〕上で利用可能である。
【0041】
前記クラス分け手法として、公知の方法を用いることができる。かかるクラス分け手法としては、例えば、Between−group analysis(BGA)〔カルヘイン(Culhane,A.C.)ら、バイオインフォマティックス(Bioinformatics)、2002年、第18巻、pp.1600−1608参照),「マイクロアレイデータのBetween−group analysis(Between−group analysis of microarray data)」を参照〕、サポートベクターマシン(SVM)、対角線形判別(DLDA)、k最近傍分類(kNN)、決定木、Random Forest、ニューラルネットなどが挙げられる。これらのなかでは、予後良好であることが予測されるものと、予後不良であることが予測されるものとを良好にクラス分けをすることができる観点から、BGAが好ましい。かかるクラス分け手法を用いて発現量を解析する場合、前記発現量に基づいて、予後良好であることが予測されるものと、予後不良であることが予測されるものとにクラス分けがされる。したがって、この場合、前記工程(E)においては、かかるクラス分けの結果によって、乳癌の予後を予測することができる。前記BGAを用いる場合には、判別式を構築して、この判別式の解Dに基づいて、乳癌の予後を予測してもよい。
【0042】
前記判別式としては、下記式(1)
【0043】
【数4】
【0044】
{式(1)中、iは前記表1−1および表1−2に記載の核酸に付与された遺伝子番号を示し、wiは前記表1−1および表1−2に記載された遺伝子番号iの核酸に対応する重み係数を示し、Xiは下記式(2):
【0045】
【数5】
【0046】
〔式(2)中、jは各検体に付与された検体番号を示し、yijは遺伝子番号iの核酸に対応する遺伝子の検体番号jの検体での標準化された発現量を示し、minは括弧内の値の最小値を示し、roundは括弧内の値の小数点以下第一位を四捨五入した値を示し、absは括弧内の値の絶対値を示し、yiは、下記式(3):
【0047】
【数6】
【0048】
(式(3)中、xiは遺伝子番号iの核酸に対応する遺伝子の発現量を示し、uiは遺伝子番号iの核酸に対応する遺伝子の発現量の検体に渡る平均値を示す。)
に示される遺伝子番号iの核酸に対応する遺伝子の標準化された発現量を示す。〕
により標準化され正規化された発現量を示し、Σiは各核酸に渡る総和を示す。}
で表される判別式が挙げられる。かかる判別式を用いて発現量を解析する場合、前記判別式のxi(i=1,2,・・・,95)に、順に、当該検体における発現量の値を代入し、解Dを算出する。この場合、前記工程(E)においては、解Dが正の値のとき、予後が不良であると予測することができ、解Dがゼロまたは負の値のとき、予後が良好であると予測することができる。
【0049】
前記階層的クラスター分析は、例えば、被験者から採取した検体における前記発現量のデータ(あるいは前記発現量に関する蛍光強度のデータ)と、予後良好であることが既知の検体の群における前記発現量のデータ(あるいは前記発現量に関する蛍光強度のデータ)と、予後不良であることが既知の検体の群における前記発現量のデータ(あるいは前記発現量に関する蛍光強度のデータ)とを用い、前記発現量(あるいは前記発現量に関する蛍光強度)に基づいて検体間の類似度を示す距離を計算し、この距離に基づいて種々のクラスターを形成し、クラスターを統合して、樹形図を作成することにより行なうことができる。ここで、前記距離としては、例えば、Spearman順位相関係数、ユークリッド距離などが挙げられる。また、クラスターの統合は、例えば、ward法、最遠隣法、重心間距離法などにより行なうことができる。これらのなかでは、Spearman順位相関係数およびward法を用いることにより、予後良好であることが予測されるものと、予後不良であることが予測されるものとを良好に分けることができる。この場合、前記工程(E)においては、かかる階層的クラスター分析の結果によって、乳癌の予後を適切に予測することができる。
【0050】
前記スコア化手法として、公知の方法を用いることができる。かかるスコア化手法としては、例えば、主成分分析、重回帰分析、ロジスティック回帰分析、Partial Least Squareなどが挙げられる。これらのなかでは、予後良好であることが予測されるものと、予後不良であることが予測されるものとを良好に分けることができる観点から、主成分分析が好ましい。かかるスコア化手法を用いて前記発現量を解析する場合、前記発現量に基づいて、予後良好であることが予測される検体のスコアと、予後不良であることが予測される検体のスコアとが分けられるようスコア化がされる。したがって、この場合、前記工程(E)においては、かかるスコア化の結果によって、乳癌の予後を適切に予測することができる。
【0051】
以上のように、本発明の乳癌の予後の検査方法によれば、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を解析するので、乳癌の予後を適切に検査することができる。
【0052】
なお、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を用いることにより、乳癌の予後を判定するための指標を取得し、提供することができる。乳癌の予後を判定するための指標の取得方法は、
(a)乳癌に罹患した被験者から採取された検体からRNAを抽出する工程、
(b)前記工程(a)で抽出されたRNAを用いて測定用試料を調製する工程、
(c)前記工程(b)で得られた測定用試料を用いて、表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を測定する工程、
(d)前記工程(c)で測定された前記発現量を解析する工程、および
(e)前記工程(d)で得られた解析結果に基づいて、被験者の乳癌の予後不良の可能性の指標または予後良好の可能性の指標を得る工程、
を含む。前記工程(a)〜工程(d)は、前記乳癌の予後の検査方法における工程(A)〜(D)と同様に行なうことができる。また、前記工程(e)において、被験者の乳癌の予後不良の可能性の指標または予後良好の可能性の指標は、前記乳癌の予後の検査方法における工程(E)で用いられる手法により得ることができる。
【実施例】
【0053】
以下、実施例を挙げて本発明を詳細に説明するが、本発明はこれらに限定されるものではない。
【0054】
[実施例1]
マイクロアレイ実験の遺伝子発現情報データベース〔NCBI Gene Expression Omnibus (http://www.ncbi.nlm.nih.gov/geo/)〕のアクセッション番号:GSE2034、GSE2990、GSE4922、GSE6532、GSE7390およびGSE9195の6つのデータセットからリンパ節転移陰性・ER陽性の症例549症例のデータを抽出した。
【0055】
549症例の各データにおいて、前記データの取得に用いられたマイクロアレイ上の各核酸(プローブセット)の発現量について、解析ソフトウェア〔アフィメトリクス(Affymetrix)社製、商品名:Affymetrix Expression Consoleソフトウェア〕のRMAアルゴリズムを用いて前記データセット毎に正規化した。つぎに、前記データセット毎に、データの取得に用いられたアレイ上の核酸(プローブセット)の発現量の値から当該データセット内での前記核酸の平均発現量の値を減じることで、前記核酸の発現量を標準化した。
【0056】
その後、統計解析用ソフトウェア「R」で用いられる追加パッケージ集「BioConductor」ver.2.4に含まれるパッケージ「GeneMeta v1.16.0」(http://www.bioconductor.org/packages/2.4/bioc/html/GeneMeta.html)を用い、ジュン・キョン・チェ(Jung Kyoon Choi)らの文献〔「複数のマイクロアレイ研究の統合および研究間バリデーションのモデリング(Combining multiple microarray studies and modeling interstudy variation)」バイオインフォマティックス(Bioinformatics)、第19巻、補遺1、2003年、p.i84−i90〕にしたがって、前記アレイ上の核酸(プローブセット)毎にz値を算出した。そして、前記核酸(プローブセット)をz値の絶対値の順に並べた。
【0057】
つぎに、Between-group analysisにより、判別式を構築した。最適な精度が得られるように、Sequential Forward Filtering methodによって乳癌の予後の検査に最適なプローブセット数を求めた。ここでは、前記核酸(プローブセット)から、z値の絶対値が大きい順に、300個に達するまで、5個ずつ選択する核酸(プローブセット)の個数を増加させながら、当該核酸(プローブセット)を選択し、判別式の構築を行なった。
【0058】
得られた各判別式と、前記549症例の各データとを用い、Leave-One-Out Cross-Validationにより、各判別式による検査精度を検証した。前記検査精度は、各判別式の感度および特異度を求め、前記感度および特異度からROC曲線を作成し、このROC曲線の曲線下面積を算出することにより評価した。そして、ROC曲線の曲線下面積と、核酸(プローブセット)の個数との関係を調べて、ROC曲線の曲線下面積が最大となる核酸(プローブセット)の個数(最適な個数)を調べた。
【0059】
なお、感度は、観察結果により術後10年間に「再発あり」(予後不良)と判断され、かつ判別式により「再発あり」(予後不良)であると予測された検体の数を、観察結果により術後10年間に「再発あり」(予後不良)と判断された検体の数で除算し、100を乗ずることによって求めた。また、特異度は、観察結果により術後10年間に「再発なし」(予後良好)と判断され、かつ判別式により「再発なし」(予後良好)と予測された検体の数を、観察結果により「再発なし」(予後良好)と判断された検体の数で除算し、100を乗ずることによって求めた。
【0060】
実施例1において、プローブ数とROC曲線の曲線下面積との関係を調べた結果を示すグラフを図1に示す。
【0061】
図1に示された結果から、核酸(プローブセット)の個数が95個である場合、ROC曲線の曲線下面積が最大となることがわかる。この結果から、核酸(プローブセット)の個数が95個である場合、検査精度が最も高くなることがわかる。なお、これら95個の核酸(プローブセット)は、前記表1−1および表1−2に示されるとおりである。
【0062】
また、これら95個の核酸(プローブセット)のz値、術後10年間に再発した再発群での発現傾向および判別式での重み係数を表2−1および表2−2に示す。
【0063】
【表3】
【0064】
【表4】
【0065】
前記結果に基づいて、最終的な判別式を構築した。構築された判別式は、下記式(1):
【0066】
【数7】
【0067】
{式(1)中、iは前記表1−1および表1−2に記載の遺伝子群の各遺伝子に付与された遺伝子番号を示し、wiは前記表1−1および表1−2に記載された遺伝子番号iの遺伝子に対応する重み係数を示し、Xiは下記式(2):
【0068】
【数8】
【0069】
〔式(2)中、jは各検体に付与された検体番号を示し、yijは遺伝子番号iの遺伝子の検体番号jの検体での標準化された発現量を示し、minは括弧内の値の最小値を示し、roundは括弧内の値の小数点以下第一位を四捨五入した値を示し、absは括弧内の値の絶対値を示し、yiは、下記式(3):
【0070】
【数9】
【0071】
(式(3)中、xiは遺伝子番号iの核酸に対応する遺伝子の発現量を示し、uiは遺伝子番号iの核酸に対応する遺伝子の発現量の検体に渡る平均値を示す。)
に示される遺伝子番号iの核酸に対応する遺伝子の標準化された発現量を示す。〕
により標準化され正規化された発現量を示し、Σiは各核酸に渡る総和を示す。}
で表される判別式である。
【0072】
ここで、前記判別式の解Dが正の値のとき、予後が不良であると予測され、解Dがゼロまたは負の値のとき、予後が良好であると予測される。
【0073】
[実施例2]
(1)核酸(プローブセット)の発現量のデータの取得
105人の乳癌患者それぞれの手術時に得られた腫瘍組織から、RNA抽出キット〔キアゲン・サイエンシーズ(QIAGEN Sciences)製、商品名:Qiagen RNeasy mini kit〕を用いてRNAを抽出した。
【0074】
なお、105人の乳癌患者は、リンパ節転移陰性・ER陽性であり、1996年〜2005年の間に、乳房温存手術を受け、その後、放射線療法または乳腺切除術を受けた患者である。これらの患者の年齢の範囲は、30〜83歳であり、年齢の中央値は、54歳である。前記105人の乳癌患者の臨床病理学的特徴を表3に示す。
【0075】
【表5】
【0076】
なお、前記腫瘍径Tは、マンモグラフィや超音波などの画像診断による測定結果に基づき、1〜4の4段階で表される。ここで、T=1は腫瘍の最大径が2cm以下であること、T=2は腫瘍の最大径2cmを超えて5cm以下であること、T=3は腫瘍最大径が5cmを超えていること、T=4は腫瘍の大きさに関わらず、胸壁または皮膚に浸潤していることを示す。
前記組織学的グレードは、核の異型度(1点:核多型性が低頻度、2点:核多型性が中頻度、3点:核多型性が高頻度)のスコア、組織構造の変化度(1点:<10%、2点:10〜75%、3点:>75%)のスコア、細胞分裂の頻度(1点:10高倍率視野(HPF)で細胞の有糸分裂数が0〜4、2点:10HPFで細胞の有糸分裂数が5〜10、3点:10高倍率視野(HPF)で細胞の有糸分裂数が11≦)のスコアの合計によって、1〜3の3段階で表される。ここで、従来、HG=1はスコア3〜5であり予後の良好な癌、HG=2はスコア6〜7であり、HG=3はスコア8〜9であり、最も予後の悪い癌を示すものとされていた。
前記ERの有無は、免疫染色法による結果に基づき、陽性および陰性で表される。従来、ER陰性である場合、一般に、予後が不良であり、ER陽性である場合、予後が良好であるとされていた。
前記PRの有無は、免疫染色法による結果に基づき、陽性および陰性で表される。従来、PR陰性である場合、一般に、予後が不良であり、PR陽性である場合、予後が良好であるとされていた。
前記HER2の有無は、免疫染色法による結果に基づき、陽性および陰性で表される。従来、HER2陽性である場合、一般に、予後が不良であり、HER2陰性である場合、予後が良好であるとされていた。
前記Ki67は、免疫染色法による結果に基づき、陽性および陰性で表わされる。従来、Ki67陽性である場合、一般に、予後が不良であり、Ki67陰性である場合、予後が良好であるとされていた。
【0077】
つぎに、得られたRNA〔RIN(RNA Integrity Number))値>6)1μgと、発現解析用キット〔アフィメトリクス(Affymetrix)社製、商品名:One−Cycle Target Labeling and Control Reagents〕とを用いて、cRNAを増幅し、ビオチン化し、断片化した。
【0078】
得られた断片化ビオチン標識cRNAを、ヒトゲノム発現解析用アレイ〔アフィメトリクス(Affymetrix)社製、商品名:Human Genome U133 Plus 2.0 Array〕上の核酸(プローブセット)と一晩ハイブリダイズさせた。なお、前記断片化ビオチン標識cRNAと前記アレイ上の核酸(プローブセット)とのハイブリダイゼーションは、製造者〔アフィメトリクス(Affymetrix)社〕による推奨条件に従って行なった。
【0079】
つぎに、ハイブリダイゼーション後のアレイを、マイクロアレイ洗浄・染色処理専用機器〔アフィメトリクス(Affymetrix)社製、商品名:GeneChip Fluidics Station 450〕に供して、前記アレイ上の核酸(プローブセット)にハイブリダイズしたcRNAを蛍光染色し、洗浄した。
【0080】
その後、前記アレイをレーザスキャナー〔アフィメトリクス(Affymetrix)社製、商品名:GeneChip(登録商標) Scanner 3000〕に供して、前記アレイ上の核酸(プローブセット)にハイブリダイズしたcRNAの蛍光標識物質に基づくシグナルを読み取り、蛍光強度を定量化した。
【0081】
得られた蛍光強度のデータをソフトウェア〔アフィメトリクス(Affymetrix)社製、商品名:GeneChip(登録商標) Operating Software〕によって処理して、CELファイルを得た。
【0082】
得られた105例のCELファイルのデータと、解析ソフトウェア〔アフィメトリクス(Affymetrix)社製、商品名:Affymetrix Expression Consoleソフトウェア〕のRMAアルゴリズムとを用いて、全105例の乳癌患者における核酸(プローブセット)の発現量のデータ(蛍光強度のデータ)を正規化した。
【0083】
(2)判別式の性能の検証
つぎに、前記(1)で得られた正規化後のデータと、前記判別式とを用いて、全105例の乳癌患者が再発を起こすかどうかを予測した。そして、病理学的な観察結果を真値として、当該病理学的な観察結果と前記判別式による予測結果とを比較することによって、当該判別式の性能を評価した。実施例2において、105例の乳癌患者について、判別式による予測結果と、観察結果との関係を調べた結果を図2に示す。
【0084】
図2に示された結果から、全105例の検体のうち、前記判別式によって、61例の乳癌患者が「再発なし」と予測され、44例の乳癌患者が「再発あり」と予測されることがわかる。すなわち、前記判別式を用いた場合には、前記61例の乳癌患者については、予後が良好であることが予測され、一方、前記44例の乳癌患者については、予後が不良であることが予測されることがわかる。
【0085】
また、病理学的な観察結果を真値として判別式の性能を評価した場合、感度83.3%、特異度70.4%、陰性適中率(NPV)93.4%、および陽性適中率(PPV)45.5%であることがわかる。
【0086】
したがって、これらの結果から、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量と前記判別式とを用いることによって、乳癌の予後を適切に予測することができることが示唆される。
【0087】
また、前記判別式により「再発なし」と予測された乳癌患者(低再発リスク群)および「再発あり」と予測された乳癌患者(高再発リスク群)それぞれについて、術後から観察し、Kaplan−Meierプロットにより、非再発生存率を調べた。また、その結果をlog−rank検定により評価した。実施例2において、術後からの期間と非再発生存率との関係を図3に示す。
【0088】
図3に示された結果から、術後10年間での非再発生存率は、高再発リスク群(図中、「高再発リスク」)では53%であるのに対して、低再発リスク群(図中、「低再発リスク」)では93%であることがわかる。また、log−rank検定によりp=8.6e−7であったため、低再発リスク群は、高再発リスク群と比べて有意に予後が良好であることがわかる。
【0089】
したがって、これらの結果から、前記表1−1および表1−2に記載の核酸(プローブセット)の発現量と前記判別式とを用いることによって、乳癌の予後を高い精度で予測することができ、乳癌の予後を適切に検査できることがわかる。
【0090】
[試験例1]
前記95個の核酸を予後因子として用いる検査方法(実験番号1)、患者の閉経状態を予後因子として用いる検査方法(実験番号2)、腫瘍径を予後因子として用いる検査方法(実験番号3)、組織学的グレードを予後因子として用いる検査方法(実験番号4)、PRの有無を予後因子として用いる検査方法(実験番号5)、ヒト上皮成長因子受容体2(HER2)の有無を予後因子として用いる検査方法(実験番号6)、全細胞中のKi67陽性細胞の割合が20%以上であるかどうかを予後因子として用いる検査方法(実験番号7)または前記95個の遺伝子とは異なる種類の97個の遺伝子を予後因子として用いるGenomic Grade Index(GGI)による検査方法(実験番号8)のそれぞれについて、統計解析用ソフトウェア「R」にて使用する追加パッケージ「survival v2.35−4」(http://cran.r−project.org/web/packages/survival/index.html)を用い、多変量COX回帰ハザード解析を行なった。なお、前記GGIは、クリストス・ソテリウ(Sotiriou Christos)らの文献〔ジャーナル・オブ・ザ・ナショナル・キャンサー・インスティチュート(Journal of the National Cancer Institute)、2006年、第98巻、第4号、p.262−272〕にしたがって求めた。
【0091】
その結果を表4に示す。なお、表中、「95genes」は前記95個の核酸を予後因子として用いる検査方法(実験番号1)、「Mens」は患者の閉経状態を予後因子として用いる検査方法(実験番号2)、「T」は腫瘍径を予後因子として用いる検査方法(実験番号3)、「HG」は組織学的グレードを予後因子として用いる検査方法(実験番号4)、「PgR」はPRの有無を予後因子として用いる検査方法(実験番号5)、「HER2」はHER2の有無を予後因子として用いる検査方法(実験番号6)、「Ki67」は全細胞中のKi67陽性細胞の割合が20%以上であるかどうかを予後因子として用いる検査方法(実験番号7)、「sign.GGI」は前記95個の遺伝子とは異なる種類の97個の遺伝子を予後因子として用いるGGIによる検査方法(実験番号8)をそれぞれ示す。各ハザード比は、表中、「参照」に該当する場合のハザードを1.0として算出した値である。前記閉経状態は、閉経前および閉経後で表される。また、従来、sign.GGIが低い場合、予後は良好であり、高い場合、予後は不良であるとされていた。
【0092】
【表6】
【0093】
表4に示される結果から、前記95個の核酸を予後因子として用いた判別式を用いる検査方法(実験番号1;本発明の検査方法)は、ハザード比が7.70であり、p値が9.6E−04であり、他の検査方法と比べて、精度が高い検査方法であることがわかる。
【0094】
[実施例3]
実施例2の(1)で得られた正規化後のデータについて、Spearman順位相関係数およびward法を用いて、階層的クラスター分析を行ない、樹形図を作成した。実施例3において、105例の乳癌患者それぞれにおける核酸(プローブセット)の発現量のデータの階層的クラスター分析を行なった結果を図4に示す。図4において、左側に、核酸(プローブセット)の発現量を表わすヒートマップを示し、右側に、観察結果による術後10年間に再発あり(図中、「再発」)および術後10年間に再発なし(図中、「非再発」)の判断結果を示す。
【0095】
図4に示された結果から、樹形図を分割するように付された太線を境界として、観察結果により術後10年間に再発あり(予後不良)と判断された乳癌患者(上部に多い)と、観察結果により術後10年間に再発なし(予後良好)と判断された乳癌患者(下部に多い)とを分けることができることがわかる。したがって、これらの結果から、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を用いて、階層的クラスター分析を行なうことによって、乳癌の予後を高い精度で予測することができ、乳癌の予後を適切に検査できることがわかる。
【0096】
[実施例4]
実施例2の(1)で得られた正規化後のデータについて、表1−1および表1−2に記載の遺伝子を用いて主成分分析を行い、各遺伝子の変換係数を算出し、第一および第二主成分スコアを算出した。実施例4において算出された変換係数を表5−1および表5−2に示す。また、実施例4において、105例の乳癌患者の発現量のデータに基づき算出した第一主成分スコアおよび第二主成分スコアの散布図を図5に示す。図5中、PCA1は、第一主成分スコアを示し、PCA2は、第二主成分スコアを示す。図中、白丸は、観察結果により術後10年間に「再発あり」と判断された乳癌患者、クロスは、観察結果により術後10年間に「再発なし」と判断された乳癌患者である。
【0097】
【表7】
【0098】
【表8】
【0099】
図5に示された結果から、横軸の第一主成分スコアがゼロとなる所を境界として、観察結果により術後10年間に「再発なし」(予後良好)と判断される乳癌患者と、観察結果により術後10年間に「再発あり」(予後不良)と判断される乳癌患者とを分けることができることがわかる。
【0100】
したがって、これらの結果から、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を用いて、主成分分析を行なうことによって、乳癌の予後を高い精度で予測することができ、乳癌の予後を適切に検査できることがわかる。
図1
図2
図3
図5
図4