【実施例】
【0053】
以下、実施例を挙げて本発明を詳細に説明するが、本発明はこれらに限定されるものではない。
【0054】
[実施例1]
マイクロアレイ実験の遺伝子発現情報データベース〔NCBI Gene Expression Omnibus (http://www.ncbi.nlm.nih.gov/geo/)〕のアクセッション番号:GSE2034、GSE2990、GSE4922、GSE6532、GSE7390およびGSE9195の6つのデータセットからリンパ節転移陰性・ER陽性の症例549症例のデータを抽出した。
【0055】
549症例の各データにおいて、前記データの取得に用いられたマイクロアレイ上の各核酸(プローブセット)の発現量について、解析ソフトウェア〔アフィメトリクス(Affymetrix)社製、商品名:Affymetrix Expression Consoleソフトウェア〕のRMAアルゴリズムを用いて前記データセット毎に正規化した。つぎに、前記データセット毎に、データの取得に用いられたアレイ上の核酸(プローブセット)の発現量の値から当該データセット内での前記核酸の平均発現量の値を減じることで、前記核酸の発現量を標準化した。
【0056】
その後、統計解析用ソフトウェア「R」で用いられる追加パッケージ集「BioConductor」ver.2.4に含まれるパッケージ「GeneMeta v1.16.0」(http://www.bioconductor.org/packages/2.4/bioc/html/GeneMeta.html)を用い、ジュン・キョン・チェ(Jung Kyoon Choi)らの文献〔「複数のマイクロアレイ研究の統合および研究間バリデーションのモデリング(Combining multiple microarray studies and modeling interstudy variation)」バイオインフォマティックス(Bioinformatics)、第19巻、補遺1、2003年、p.i84−i90〕にしたがって、前記アレイ上の核酸(プローブセット)毎にz値を算出した。そして、前記核酸(プローブセット)をz値の絶対値の順に並べた。
【0057】
つぎに、Between-group analysisにより、判別式を構築した。最適な精度が得られるように、Sequential Forward Filtering methodによって乳癌の予後の検査に最適なプローブセット数を求めた。ここでは、前記核酸(プローブセット)から、z値の絶対値が大きい順に、300個に達するまで、5個ずつ選択する核酸(プローブセット)の個数を増加させながら、当該核酸(プローブセット)を選択し、判別式の構築を行なった。
【0058】
得られた各判別式と、前記549症例の各データとを用い、Leave-One-Out Cross-Validationにより、各判別式による検査精度を検証した。前記検査精度は、各判別式の感度および特異度を求め、前記感度および特異度からROC曲線を作成し、このROC曲線の曲線下面積を算出することにより評価した。そして、ROC曲線の曲線下面積と、核酸(プローブセット)の個数との関係を調べて、ROC曲線の曲線下面積が最大となる核酸(プローブセット)の個数(最適な個数)を調べた。
【0059】
なお、感度は、観察結果により術後10年間に「再発あり」(予後不良)と判断され、かつ判別式により「再発あり」(予後不良)であると予測された検体の数を、観察結果により術後10年間に「再発あり」(予後不良)と判断された検体の数で除算し、100を乗ずることによって求めた。また、特異度は、観察結果により術後10年間に「再発なし」(予後良好)と判断され、かつ判別式により「再発なし」(予後良好)と予測された検体の数を、観察結果により「再発なし」(予後良好)と判断された検体の数で除算し、100を乗ずることによって求めた。
【0060】
実施例1において、プローブ数とROC曲線の曲線下面積との関係を調べた結果を示すグラフを
図1に示す。
【0061】
図1に示された結果から、核酸(プローブセット)の個数が95個である場合、ROC曲線の曲線下面積が最大となることがわかる。この結果から、核酸(プローブセット)の個数が95個である場合、検査精度が最も高くなることがわかる。なお、これら95個の核酸(プローブセット)は、前記表1−1および表1−2に示されるとおりである。
【0062】
また、これら95個の核酸(プローブセット)のz値、術後10年間に再発した再発群での発現傾向および判別式での重み係数を表2−1および表2−2に示す。
【0063】
【表3】
【0064】
【表4】
【0065】
前記結果に基づいて、最終的な判別式を構築した。構築された判別式は、下記式(1):
【0066】
【数7】
【0067】
{式(1)中、iは前記表1−1および表1−2に記載の遺伝子群の各遺伝子に付与された遺伝子番号を示し、w
iは前記表1−1および表1−2に記載された遺伝子番号iの遺伝子に対応する重み係数を示し、X
iは下記式(2):
【0068】
【数8】
【0069】
〔式(2)中、jは各検体に付与された検体番号を示し、y
ijは遺伝子番号iの遺伝子の検体番号jの検体での標準化された発現量を示し、minは括弧内の値の最小値を示し、roundは括弧内の値の小数点以下第一位を四捨五入した値を示し、absは括弧内の値の絶対値を示し、y
iは、下記式(3):
【0070】
【数9】
【0071】
(式(3)中、x
iは遺伝子番号iの核酸に対応する遺伝子の発現量を示し、u
iは遺伝子番号iの核酸に対応する遺伝子の発現量の検体に渡る平均値を示す。)
に示される遺伝子番号iの核酸に対応する遺伝子の標準化された発現量を示す。〕
により標準化され正規化された発現量を示し、Σ
iは各核酸に渡る総和を示す。}
で表される判別式である。
【0072】
ここで、前記判別式の解Dが正の値のとき、予後が不良であると予測され、解Dがゼロまたは負の値のとき、予後が良好であると予測される。
【0073】
[実施例2]
(1)核酸(プローブセット)の発現量のデータの取得
105人の乳癌患者それぞれの手術時に得られた腫瘍組織から、RNA抽出キット〔キアゲン・サイエンシーズ(QIAGEN Sciences)製、商品名:Qiagen RNeasy mini kit〕を用いてRNAを抽出した。
【0074】
なお、105人の乳癌患者は、リンパ節転移陰性・ER陽性であり、1996年〜2005年の間に、乳房温存手術を受け、その後、放射線療法または乳腺切除術を受けた患者である。これらの患者の年齢の範囲は、30〜83歳であり、年齢の中央値は、54歳である。前記105人の乳癌患者の臨床病理学的特徴を表3に示す。
【0075】
【表5】
【0076】
なお、前記腫瘍径Tは、マンモグラフィや超音波などの画像診断による測定結果に基づき、1〜4の4段階で表される。ここで、T=1は腫瘍の最大径が2cm以下であること、T=2は腫瘍の最大径2cmを超えて5cm以下であること、T=3は腫瘍最大径が5cmを超えていること、T=4は腫瘍の大きさに関わらず、胸壁または皮膚に浸潤していることを示す。
前記組織学的グレードは、核の異型度(1点:核多型性が低頻度、2点:核多型性が中頻度、3点:核多型性が高頻度)のスコア、組織構造の変化度(1点:<10%、2点:10〜75%、3点:>75%)のスコア、細胞分裂の頻度(1点:10高倍率視野(HPF)で細胞の有糸分裂数が0〜4、2点:10HPFで細胞の有糸分裂数が5〜10、3点:10高倍率視野(HPF)で細胞の有糸分裂数が11≦)のスコアの合計によって、1〜3の3段階で表される。ここで、従来、HG=1はスコア3〜5であり予後の良好な癌、HG=2はスコア6〜7であり、HG=3はスコア8〜9であり、最も予後の悪い癌を示すものとされていた。
前記ERの有無は、免疫染色法による結果に基づき、陽性および陰性で表される。従来、ER陰性である場合、一般に、予後が不良であり、ER陽性である場合、予後が良好であるとされていた。
前記PRの有無は、免疫染色法による結果に基づき、陽性および陰性で表される。従来、PR陰性である場合、一般に、予後が不良であり、PR陽性である場合、予後が良好であるとされていた。
前記HER2の有無は、免疫染色法による結果に基づき、陽性および陰性で表される。従来、HER2陽性である場合、一般に、予後が不良であり、HER2陰性である場合、予後が良好であるとされていた。
前記Ki67は、免疫染色法による結果に基づき、陽性および陰性で表わされる。従来、Ki67陽性である場合、一般に、予後が不良であり、Ki67陰性である場合、予後が良好であるとされていた。
【0077】
つぎに、得られたRNA〔RIN(RNA Integrity Number))値>6)1μgと、発現解析用キット〔アフィメトリクス(Affymetrix)社製、商品名:One−Cycle Target Labeling and Control Reagents〕とを用いて、cRNAを増幅し、ビオチン化し、断片化した。
【0078】
得られた断片化ビオチン標識cRNAを、ヒトゲノム発現解析用アレイ〔アフィメトリクス(Affymetrix)社製、商品名:Human Genome U133 Plus 2.0 Array〕上の核酸(プローブセット)と一晩ハイブリダイズさせた。なお、前記断片化ビオチン標識cRNAと前記アレイ上の核酸(プローブセット)とのハイブリダイゼーションは、製造者〔アフィメトリクス(Affymetrix)社〕による推奨条件に従って行なった。
【0079】
つぎに、ハイブリダイゼーション後のアレイを、マイクロアレイ洗浄・染色処理専用機器〔アフィメトリクス(Affymetrix)社製、商品名:GeneChip Fluidics Station 450〕に供して、前記アレイ上の核酸(プローブセット)にハイブリダイズしたcRNAを蛍光染色し、洗浄した。
【0080】
その後、前記アレイをレーザスキャナー〔アフィメトリクス(Affymetrix)社製、商品名:GeneChip(登録商標) Scanner 3000〕に供して、前記アレイ上の核酸(プローブセット)にハイブリダイズしたcRNAの蛍光標識物質に基づくシグナルを読み取り、蛍光強度を定量化した。
【0081】
得られた蛍光強度のデータをソフトウェア〔アフィメトリクス(Affymetrix)社製、商品名:GeneChip(登録商標) Operating Software〕によって処理して、CELファイルを得た。
【0082】
得られた105例のCELファイルのデータと、解析ソフトウェア〔アフィメトリクス(Affymetrix)社製、商品名:Affymetrix Expression Consoleソフトウェア〕のRMAアルゴリズムとを用いて、全105例の乳癌患者における核酸(プローブセット)の発現量のデータ(蛍光強度のデータ)を正規化した。
【0083】
(2)判別式の性能の検証
つぎに、前記(1)で得られた正規化後のデータと、前記判別式とを用いて、全105例の乳癌患者が再発を起こすかどうかを予測した。そして、病理学的な観察結果を真値として、当該病理学的な観察結果と前記判別式による予測結果とを比較することによって、当該判別式の性能を評価した。実施例2において、105例の乳癌患者について、判別式による予測結果と、観察結果との関係を調べた結果を
図2に示す。
【0084】
図2に示された結果から、全105例の検体のうち、前記判別式によって、61例の乳癌患者が「再発なし」と予測され、44例の乳癌患者が「再発あり」と予測されることがわかる。すなわち、前記判別式を用いた場合には、前記61例の乳癌患者については、予後が良好であることが予測され、一方、前記44例の乳癌患者については、予後が不良であることが予測されることがわかる。
【0085】
また、病理学的な観察結果を真値として判別式の性能を評価した場合、感度83.3%、特異度70.4%、陰性適中率(NPV)93.4%、および陽性適中率(PPV)45.5%であることがわかる。
【0086】
したがって、これらの結果から、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量と前記判別式とを用いることによって、乳癌の予後を適切に予測することができることが示唆される。
【0087】
また、前記判別式により「再発なし」と予測された乳癌患者(低再発リスク群)および「再発あり」と予測された乳癌患者(高再発リスク群)それぞれについて、術後から観察し、Kaplan−Meierプロットにより、非再発生存率を調べた。また、その結果をlog−rank検定により評価した。実施例2において、術後からの期間と非再発生存率との関係を
図3に示す。
【0088】
図3に示された結果から、術後10年間での非再発生存率は、高再発リスク群(図中、「高再発リスク」)では53%であるのに対して、低再発リスク群(図中、「低再発リスク」)では93%であることがわかる。また、log−rank検定によりp=8.6e−7であったため、低再発リスク群は、高再発リスク群と比べて有意に予後が良好であることがわかる。
【0089】
したがって、これらの結果から、前記表1−1および表1−2に記載の核酸(プローブセット)の発現量と前記判別式とを用いることによって、乳癌の予後を高い精度で予測することができ、乳癌の予後を適切に検査できることがわかる。
【0090】
[試験例1]
前記95個の核酸を予後因子として用いる検査方法(実験番号1)、患者の閉経状態を予後因子として用いる検査方法(実験番号2)、腫瘍径を予後因子として用いる検査方法(実験番号3)、組織学的グレードを予後因子として用いる検査方法(実験番号4)、PRの有無を予後因子として用いる検査方法(実験番号5)、ヒト上皮成長因子受容体2(HER2)の有無を予後因子として用いる検査方法(実験番号6)、全細胞中のKi67陽性細胞の割合が20%以上であるかどうかを予後因子として用いる検査方法(実験番号7)または前記95個の遺伝子とは異なる種類の97個の遺伝子を予後因子として用いるGenomic Grade Index(GGI)による検査方法(実験番号8)のそれぞれについて、統計解析用ソフトウェア「R」にて使用する追加パッケージ「survival v2.35−4」(http://cran.r−project.org/web/packages/survival/index.html)を用い、多変量COX回帰ハザード解析を行なった。なお、前記GGIは、クリストス・ソテリウ(Sotiriou Christos)らの文献〔ジャーナル・オブ・ザ・ナショナル・キャンサー・インスティチュート(Journal of the National Cancer Institute)、2006年、第98巻、第4号、p.262−272〕にしたがって求めた。
【0091】
その結果を表4に示す。なお、表中、「95genes」は前記95個の核酸を予後因子として用いる検査方法(実験番号1)、「Mens」は患者の閉経状態を予後因子として用いる検査方法(実験番号2)、「T」は腫瘍径を予後因子として用いる検査方法(実験番号3)、「HG」は組織学的グレードを予後因子として用いる検査方法(実験番号4)、「PgR」はPRの有無を予後因子として用いる検査方法(実験番号5)、「HER2」はHER2の有無を予後因子として用いる検査方法(実験番号6)、「Ki67」は全細胞中のKi67陽性細胞の割合が20%以上であるかどうかを予後因子として用いる検査方法(実験番号7)、「sign.GGI」は前記95個の遺伝子とは異なる種類の97個の遺伝子を予後因子として用いるGGIによる検査方法(実験番号8)をそれぞれ示す。各ハザード比は、表中、「参照」に該当する場合のハザードを1.0として算出した値である。前記閉経状態は、閉経前および閉経後で表される。また、従来、sign.GGIが低い場合、予後は良好であり、高い場合、予後は不良であるとされていた。
【0092】
【表6】
【0093】
表4に示される結果から、前記95個の核酸を予後因子として用いた判別式を用いる検査方法(実験番号1;本発明の検査方法)は、ハザード比が7.70であり、p値が9.6E−04であり、他の検査方法と比べて、精度が高い検査方法であることがわかる。
【0094】
[実施例3]
実施例2の(1)で得られた正規化後のデータについて、Spearman順位相関係数およびward法を用いて、階層的クラスター分析を行ない、樹形図を作成した。実施例3において、105例の乳癌患者それぞれにおける核酸(プローブセット)の発現量のデータの階層的クラスター分析を行なった結果を
図4に示す。
図4において、左側に、核酸(プローブセット)の発現量を表わすヒートマップを示し、右側に、観察結果による術後10年間に再発あり(図中、「再発」)および術後10年間に再発なし(図中、「非再発」)の判断結果を示す。
【0095】
図4に示された結果から、樹形図を分割するように付された太線を境界として、観察結果により術後10年間に再発あり(予後不良)と判断された乳癌患者(上部に多い)と、観察結果により術後10年間に再発なし(予後良好)と判断された乳癌患者(下部に多い)とを分けることができることがわかる。したがって、これらの結果から、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を用いて、階層的クラスター分析を行なうことによって、乳癌の予後を高い精度で予測することができ、乳癌の予後を適切に検査できることがわかる。
【0096】
[実施例4]
実施例2の(1)で得られた正規化後のデータについて、表1−1および表1−2に記載の遺伝子を用いて主成分分析を行い、各遺伝子の変換係数を算出し、第一および第二主成分スコアを算出した。実施例4において算出された変換係数を表5−1および表5−2に示す。また、実施例4において、105例の乳癌患者の発現量のデータに基づき算出した第一主成分スコアおよび第二主成分スコアの散布図を
図5に示す。
図5中、PCA1は、第一主成分スコアを示し、PCA2は、第二主成分スコアを示す。図中、白丸は、観察結果により術後10年間に「再発あり」と判断された乳癌患者、クロスは、観察結果により術後10年間に「再発なし」と判断された乳癌患者である。
【0097】
【表7】
【0098】
【表8】
【0099】
図5に示された結果から、横軸の第一主成分スコアがゼロとなる所を境界として、観察結果により術後10年間に「再発なし」(予後良好)と判断される乳癌患者と、観察結果により術後10年間に「再発あり」(予後不良)と判断される乳癌患者とを分けることができることがわかる。
【0100】
したがって、これらの結果から、前記表1−1および表1−2に記載の遺伝子群の各遺伝子の発現量を用いて、主成分分析を行なうことによって、乳癌の予後を高い精度で予測することができ、乳癌の予後を適切に検査できることがわかる。