(58)【調査した分野】(Int.Cl.,DB名)
大腸癌患者から採取された生体試料における、C18orf22、C18orf55、CCDC68、CNDP2、CYB5A、LOC400657、LOC440498、MBD2、MBP、MYO5B、NARS、PQLC1、RTTN、SEC11C、SOCS6、TNFRSF11A、TXNL1、TXNL4A、VPS4BおよびZNF407からなる第1遺伝子群の20遺伝子と、ASXL1、C20orf112、C20orf177、CHMP4B、COMMD7、CPNE1、DIDO1、DNAJC5、KIF3B、NCOA6、PHF20、PIGU、PLAGL2、POFUT1、PPP1R3D、PTPN1、RBM39、TAF4およびTCFL5からなる第2遺伝子群の19遺伝子と、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMからなる第3遺伝子群の16遺伝子との55遺伝子の発現量をそれぞれ測定する測定工程と、
前記測定工程において測定された発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程と、
を含み、前記判定工程において、
第1および第2遺伝子群の遺伝子の発現量にかかわらず、第3遺伝子群の遺伝子の発現量の平均値が、第3遺伝子群についての基準値以上である場合に、再発リスクは高いと判定し、
第2遺伝子群の遺伝子の発現量にかかわらず、第3遺伝子群の遺伝子の発現量の平均値が、第3遺伝子群についての基準値よりも小さく、第1遺伝子群の遺伝子の発現量の平均値が、第1遺伝子群についての基準値よりも小さい場合、再発リスクは中程度であると判定し、
第3遺伝子群の遺伝子の発現量の平均値が、第3遺伝子群についての基準値よりも小さく、第1遺伝子群の遺伝子の発現量の平均値が、第1遺伝子群についての基準値以上であり、第2遺伝子群の遺伝子の発現量の平均値が、第2遺伝子群についての基準値以上である場合に、再発リスクは中程度であると判定し、
第3遺伝子群の遺伝子の発現量の平均値が、第3遺伝子群についての基準値よりも小さく、第1遺伝子群の遺伝子の発現量の平均値が、第1遺伝子群についての基準値以上であり、第2遺伝子群の遺伝子の発現量の平均値が、第2遺伝子群についての基準値よりも小さい場合に、再発リスクは低いと判定し、
第1遺伝子群についての基準値が、特定の大腸癌患者群の生体試料から予め測定された第1遺伝子群の遺伝子の発現量の平均値であり、第2遺伝子群についての基準値が、前記特定の大腸癌患者群の生体試料から予め測定された第2遺伝子群の遺伝子の発現量の平均値であり、第3遺伝子群についての基準値が、前記特定の大腸癌患者群の生体試料から予め測定された第3遺伝子群の遺伝子の発現量の平均値である、
大腸癌の再発リスクの診断を補助する方法。
大腸癌患者から採取された生体試料における、C18orf22、C18orf55、CCDC68、CNDP2、CYB5A、LOC400657、LOC440498、MBD2、MBP、MYO5B、NARS、PQLC1、RTTN、SEC11C、SOCS6、TNFRSF11A、TXNL1、TXNL4A、VPS4BおよびZNF407からなる第1遺伝子群の20遺伝子と、ASXL1、C20orf112、C20orf177、CHMP4B、COMMD7、CPNE1、DIDO1、DNAJC5、KIF3B、NCOA6、PHF20、PIGU、PLAGL2、POFUT1、PPP1R3D、PTPN1、RBM39、TAF4およびTCFL5からなる第2遺伝子群の19遺伝子と、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMからなる第3遺伝子群の16遺伝子との55遺伝子の発現量をそれぞれ測定する測定工程と、
前記測定工程において測定された発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程と、
を含み、前記判定工程において、
(I) 前記測定工程において測定された発現量と、再発リスクが高いと判定された患者群の生体試料から予め測定された高リスク群発現量との相関係数を算出し、
前記測定工程において測定された発現量と、再発リスクが中程度と判定された患者群の生体試料から予め測定された中リスク群発現量との相関係数を算出し、
前記測定工程において測定された発現量と、再発リスクが低いと判定された患者群の生体試料から予め測定された低リスク群発現量との相関係数を算出し、
前記生体試料の再発リスクを、最も相関係数の高いリスク群に分類し、分類されたリスク群に対応する再発リスクが、前記患者の大腸癌の再発リスクであると判定するか、又は
(II) 前記測定工程において測定された発現量と、前記高リスク群の発現量と、前記中リスク群の発現量と、前記低リスク群の発現量とを用いてクラスタリング解析を行うことにより、前記生体試料の再発リスクを、最も相関の高いリスク群に分類し、分類されたリスク群に対応する再発リスクが、前記患者の大腸癌の再発リスクであると判定する、
大腸癌の再発リスクの診断を補助する方法。
上記再発リスクが中程度とされた群に対し、KRAS遺伝子変異を有する場合は、再発リスクは高い、KRAS遺伝子変異を有していない場合は再発リスクは低いとする、請求項1〜3のいずれか1項に記載の方法。
【発明を実施するための形態】
【0011】
本実施形態の大腸癌再発リスクの診断補助方法(以下、「診断補助方法」と記す場合がある。)では、まず、大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から選択される複数の遺伝子、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から選択される複数の遺伝子、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から選択される複数の遺伝子の発現量をそれぞれ測定する。
【0012】
「生体試料」としては、大腸癌患者の腫瘍細胞由来の核酸(例えばmRNA)を含むものであれば特に限定されないが、例えば臨床検体を用いることができる。臨床検体として具体的には、血液、血清、手術又は生検により採取した組織などが挙げられる。また、被検者から採取した組織のホルマリン固定パラフィン包埋(FFPE)試料を生体試料として用いてもよい。
【0013】
本実施形態の方法は、測定工程の前に生体試料からDNAを抽出する工程を含んでいてもよい。生体試料からDNAを抽出する方法は、当該技術において公知の方法により行うことができる。たとえば、生体試料を遠心分離してDNAを含む細胞を沈殿させ、この細胞を物理的手法又は化学的手法によって破壊し、細胞破片を除去することにより、DNA抽出物を得ることができる。この操作は、市販のDNA抽出キットなどを用いて行うこともできる。
【0014】
本明細書において、「第1遺伝子群」とは、18番染色体長鎖上の18q21から18q23までの領域に存在する遺伝子の総称である。具体的には、第1遺伝子群は、遺伝子シンボルにより、C18orf22(chromosome 18 open reading frame 22)、C18orf55(chromosome 18 open reading frame 55)、CCDC68(coiled-coil domain containing 68)、CNDP2(CNDP dipeptidase 2 (metallopeptidase M20 family))、CYB5A(cytochrome b5 type A (microsomal))、LOC400657(hypothetical LOC400657)、LOC440498(heat shock factor binding protein 1-like)、MBD2(methyl-CpG binding domain protein 2)、MBP(myelin basic protein)、MYO5B(myosin VB)、NARS(asparaginyl-tRNA synthetase)、PQLC1(PQ loop repeat containing 1)、RTTN(Rotatin)、SEC11C(SEC11 homolog C (S. cerevisiae))、SOCS6(suppressor of cytokine signaling 6)、TNFRSF11A(tumor necrosis factor receptor superfamily, member 11a, NFKB activator)、TXNL1(thioredoxin-like 1)、TXNL4A(thioredoxin-like 4A)、VPS4B(vacuolar protein sorting 4 homolog B (S. cerevisiae))およびZNF407(zinc finger protein 407)と表される遺伝子を含む。
【0015】
本明細書において、「第2遺伝子群」とは、20番染色体長鎖上の20q11から20q13までの領域に存在する遺伝子の総称である。具体的には、第2遺伝子群は、遺伝子シンボルにより、ASXL1(additional sex combs like 1 (Drosophila))、C20orf112(chromosome 20 open reading frame 112)、C20orf177(chromosome 20 open reading frame 177)、CHMP4B(chromatin modifying protein 4B)、COMMD7(COMM domain containing 7)、CPNE1(copine I)、DIDO1(death inducer-obliterator 1)、DNAJC5(DnaJ (Hsp40) homolog, subfamily C, member 5)、KIF3B(kinesin family member 3B)、NCOA6(nuclear receptor coactivator 6)、PHF20(PHD finger protein 20)、PIGU(phosphatidylinositol glycan anchor biosynthesis, class U)、PLAGL2(pleiomorphic adenoma gene-like 2)、POFUT1(protein O-fucosyltransferase 1)、PPP1R3D(protein phosphatase 1, regulatory (inhibitor) subunit 3D)、PTPN1(protein tyrosine phosphatase, non-receptor type 1)、RBM39(RNA binding motif protein 39)、TAF4(TAF4 RNA polymerase II, TATA box binding protein (TBP)-associated factor, 135kDa)およびTCFL5(transcription factor-like 5 (basic helix-loop-helix))と表される遺伝子を含む。
【0016】
本明細書において、「第3遺伝子群」とは、生物学的にはストロマ関連遺伝子、EMT関連遺伝子等と呼ばれるものを含む遺伝子の総称である。具体的には、第3遺伝子群は、遺伝子シンボルにより、ANGPTL2(angiopoietin-like 2)、AXL(AXL receptor tyrosine kinase)、C1R(complement component 1, r subcomponent)、C1S(complement component 1, s subcomponent)、CALHM2(calcium homeostasis modulator 2)、CTSK(cathepsin K)、DCN(Decorin)、EMP3(epithelial membrane protein 3)、GREM1(gremlin 1, cysteine knot superfamily, homolog (Xenopus laevis))、ITGAV(integrin, alpha V (vitronectin receptor, alpha polypeptide, antigen CD51))、KLHL5(kelch-like 5 (Drosophila))、MMP2(matrix metallopeptidase 2 (gelatinase A, 72kDa gelatinase, 72kDa type IV collagenase))、RAB34(RAB34, member RAS oncogene family)、SELM(selenoprotein M)、SRGAP2P1(SLIT-ROBO Rho GTPase activating protein 2 pseudogene 1)およびVIM(Vimentin)と表される遺伝子を含む。本明細書において、第3遺伝子群を「ストロマ関連遺伝子群」と記す場合がある。
【0017】
本実施形態の診断補助方法においては、これら3つの遺伝子群を用いて、大腸癌の再発リスクを判定する。
【0018】
本明細書において、「遺伝子の転写産物」とは、遺伝子が転写されることにより得られる産物のことであり、リボ核酸(RNA)、具体的にはメッセンジャーRNA(mRNA)である。
また、本明細書において、「遺伝子の発現量」とは、上記の生体試料中の遺伝子の転写産物の存在量または該存在量を反映する物質の量のことである。よって、本実施形態の診断補助方法では、遺伝子の転写産物(mRNA)の量、またはmRNAから得られる相補デオキシリボ核酸(cDNA)もしくは相補RNA(cRNA)の量を測定できる。通常、生体試料中のmRNAは微量であるので、そこから逆転写およびインビトロ転写(IVT)により得られるcDNAまたはcRNAの量を測定することが好ましい。
【0019】
生体試料から遺伝子の転写産物を抽出する方法は、当該技術において知られるRNA抽出法を用いて行うことができる。例えば、生体試料を遠心分離して、RNAを含む細胞を沈殿させ、該細胞を物理的手法または酵素的手法によって破壊し、細胞破片を除去することによりRNA抽出物を得ることができる。RNAの抽出は、市販のRNA抽出キットなどを用いて行うこともできる。
【0020】
上記のようにして得られた遺伝子の転写産物の抽出物から、遺伝子の発現量の測定時に混入していないことが好ましい生体試料由来の混入成分、例えば、生体試料が血液である場合はグロビンのmRNAなどを除去するための処理を行うこともできる。
【0021】
上記のようにして得られた遺伝子の転写産物の抽出物について、第1〜第3遺伝子群のそれぞれから複数、好ましくは少なくとも5つ選択される遺伝子の発現量を測定する。5つ以上の遺伝子の発現量を測定することにより、所定の遺伝子の発現が偶然高い又は低い場合等に生じる生物学的なばらつき、および測定誤差を低減させることができるため、より高い信頼性をもって、再発リスク診断を補助することができる。
【0022】
遺伝子の発現量の測定は、それ自体公知の方法に従って行なうことができるが、本実施形態の再発リスク診断補助方法においては、核酸チップを用いる測定方法、いわゆるマイクロアレイを用いる方法が好ましい。
マイクロアレイを用いて遺伝子の発現量を測定する場合、例えば、基板上に固定された20〜25 mer程度の核酸プローブに、遺伝子の転写産物の抽出物または遺伝子の転写産物から作製したcDNAもしくはcRNAを接触させ、ハイブリッドの形成の有無を蛍光、発色、電流などの指標の変化を測定することにより、目的の遺伝子の発現量を測定できる。
上記の核酸プローブは、1つの遺伝子の転写産物に対して少なくとも1つ用いればよく、遺伝子の転写産物の長さなどに応じて、複数のプローブを用いることもできる。プローブの配列は、測定しようとする遺伝子の転写産物の配列に応じて当業者が適宜決定できる。
核酸チップを用いる遺伝子の発現量の測定方法としては、例えば、Affymetrix社により提供されるGeneChipシステムを用いることができる。
【0023】
核酸チップを用いる場合、遺伝子の転写産物またはそのcDNAもしくはcRNAは、核酸プローブとのハイブリッド形成を容易にするために、断片化してよい。断片化は、当該技術において公知の方法により行うことができ、例えば、リボヌクレアーゼ、デオキシリボヌクレアーゼなどの核酸分解酵素を用いて行うことができる。
【0024】
測定工程において、複数の遺伝子の発現量の測定は、各々別々に行ってもよいし、一部の遺伝子または全部の遺伝子の測定を同時に行ってもよい。たとえば核酸チップを用いる場合は、複数の遺伝子の発現量の測定を1枚の核酸チップで同時に行うことができる。
【0025】
核酸チップにおいて核酸プローブと接触させる遺伝子の転写産物またはそのcDNAもしくはcRNAは、通常、5〜20μg程度であればよい。接触条件は、通常、45℃にて16時間程度である。
【0026】
核酸プローブと接触させてハイブリッドを形成した遺伝子の転写産物またはそのcDNAもしくはcRNAは、そのハイブリッド形成の有無およびハイブリッド形成した量について、蛍光物質、色素またはハイブリッド形成したことによる核酸チップ上を流れる電流量の変化などに基づいて検出することができる。
ハイブリッドの形成を、蛍光物質または色素の検出により測定する場合、遺伝子の転写産物またはそのcDNAもしくはcRNAが、蛍光物質または色素の検出のための標識物質で標識されていることが好ましい。このような標識物質は、当該技術において通常用いられるものを用いることができる。通常、ビオチン化ヌクレオチドまたはビオチン化リボヌクレオチドを、cDNAまたはcRNAを合成するときのヌクレオチドまたはリボヌクレオチド基質として混合しておくことにより、得られるcDNAまたはcRNAがビオチンで標識されることができる。cDNAまたはcRNAがビオチン標識されていると、核酸チップ上で、ビオチンに対する結合パートナーであるアビジンまたはストレプトアビジンが結合できる。アビジンまたはストレプトアビジンが、適切な蛍光物質または色素と結合していることにより、ハイブリッドの形成が検出できる。蛍光物質としては、フルオレセインイソチオシアネート(FITC)、グリーン蛍光タンパク質(GFP)、ルシフェリン、フィコエリスリンなどが挙げられる。通常、フィコエリスリン−ストレプトアビジンのコンジュゲートが市販されているので、これを用いることが簡便である。
また、アビジンまたはストレプトアビジンに対する標識抗体を、アビジンまたはストレプトアビジンと接触させ、標識抗体の蛍光物質または色素を検出することもできる。
【0027】
この工程で得られる遺伝子の発現量は、生体試料中の各遺伝子の転写産物の存在量を相対的に表す値であれば、特に限定されない。上記の核酸チップにより測定を行う場合、発現量は、蛍光強度、発色強度、電流量などに基づく核酸チップから得られるシグナルであり得る。
これらのシグナルは、核酸チップ用の測定装置を用いて測定できる。
【0028】
次いで、本実施形態の判定工程においては、測定工程において得られた遺伝子の発現量のデータに基づいて、大腸癌の再発リスクを判定する。具体的には、以下のようにして大腸癌の再発リスクを判定する。
第3遺伝子群が高発現である場合に、再発リスクは高いと判定される。
第1遺伝子群が低発現であり、且つ第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定される。
第1遺伝子群が高発現であり、第2遺伝子群が高発現であり、且つ第3遺伝子群が低発現である場合に、再発リスクは中程度であると判定される。
第1遺伝子群が高発現であり、第2遺伝子群が低発現であり、且つ第3遺伝子群が低発現である場合に、再発リスクは低いと判定される。
【0029】
判定工程では、種々の解析方法を用いることができる。例えば、判定対象となる生体試料の遺伝子発現パターンと各患者群の遺伝子発現パターンとに基づいて相関分析(例えば相関係数比較およびクラスタリング等)を行う方法、判定対象となる生体試料の遺伝子の発現量と基準値とを比較する方法等が挙げられる。
【0030】
1つの好ましい実施形態によると、生体試料の遺伝子発現パターンと各患者群の遺伝子発現パターンとに基づいて相関分析を行うことによって再発リスクが判定される。この方法では、複数の「遺伝子群」を設定するのではなく、再発リスクに応じて複数の患者群を設定する。具体的には、まず、ある患者群を、再発リスクが高いと判定される患者群(以下、「高リスク群」ともいう)、再発リスクが中程度と判定される患者群(以下、「中リスク群」ともいう)および再発リスクが低いと判定される患者群(以下、「低リスク群」ともいう)の3群に分類する。ここで、上記の患者群は、予めクラスタリング解析などにより3群に分類され得る。クラスタリング解析には、各遺伝子群の発現量を用いることができる。たとえば、第3遺伝子群が高発現の群は高リスク群とされる。第1遺伝子群が低発現であり、且つ第3遺伝子群が低発現である群は、中リスク群とされる。第1遺伝子群が高発現であり、第2遺伝子群が高発現であり、且つ第3遺伝子群が低発現である群は、中リスク群であるとされる。第1遺伝子群が高発現であり、第2遺伝子群が低発現であり、且つ第3遺伝子群が低発現である場合に、低リスク群とされる。
【0031】
これら各患者群のサンプルから解析対象となる遺伝子の発現量を取得し、平均値を算出する。たとえば、高リスク群に100人の患者が含まれ、C18orf22の発現量の平均値を算出する場合、100人の患者のC18orf22の発現量の総和を100で除した値が、高リスク群のC18orf22の発現量の平均値となる。中リスク群および低リスク群でも同様にC18orf22の発現量の平均値が算出される。また、本実施形態では、複数の遺伝子が解析対象となるため、複数の遺伝子の発現量の平均値がそれぞれ算出される。ここで、このようにして得られた高リスク群における発現量の平均値のデータセットを高リスク群発現パターンといい、中リスク群における発現量の平均値のデータセットを中リスク群発現パターンといい、低リスク群における発現量の平均値のデータセットを低リスク群発現パターンという。55遺伝子の発現量を解析する場合は、高リスク群発現パターンには、55の値が含まれることとなる。
【0032】
各リスク群の発現パターンは、生体試料の遺伝子発現の測定および再発リスクの判定の前に、予め取得される。
【0033】
次に、生体試料における各遺伝子の発現量が測定される。ここで、測定工程において測定された各遺伝子の発現量のデータセットを生体試料の発現パターンという。55遺伝子の発現量を測定する場合は、生体試料の発現パターンには、55の値が含まれることとなる。
【0034】
生体試料における各遺伝子の発現パターンと、各リスク群の発現パターンとの相関を分析する。生体試料の発現パターンと最も高い相関を示すリスク群を特定する。特定されたリスク群に対応する再発リスクが、生体試料の再発リスクと判定される。たとえば、生体試料における各遺伝子の発現量が、高リスク群と最も高い相関を示す場合は、この生体試料は再発リスクが高いと判定される。
【0035】
上記の相関の分析においては、種々の方法を用いることができる。
1つの好ましい実施形態では、たとえば、生体試料の発現パターンと高リスク群発現パターンとの相関係数、生体試料の発現パターンと中リスク群発現パターンとの相関係数、および生体試料の発現パターンと低リスク群発現パターンとの相関係数を算出する。各層間係数を比較し、最も高い相関係数を示すリスク群に生体試料を分類し、再発リスクの判定を行うことができる。たとえば、高リスク群発現パターンとの相関係数が最も高い場合は、生体試料は高リスク群に分類され、再発リスクは高いと判定される。
【0036】
相関係数の算出は、公知の方法により行うことができる。たとえば、スピアマンの順位相関、ピアソンの積率相関、ケンドールの順位相関などに基づき、相関係数を算出することができる。
【0037】
もう1つの好ましい実施形態では、各リスク群との相関を分析する方法として、例えば最近接距離法のようなクラスタリング方法による、クラスタリング解析を用いることもできる。たとえば、以下のようにして解析を行うことができる。
予め複数の患者において各遺伝子の発現量を取得しておく(なお、この時点では高リスク群、中リスク群および低リスク群の分類は行われていない)。測定工程において、生体試料における各遺伝子の発現量を測定する。各患者の各遺伝子の発現量と生体試料における各遺伝子の発現量とをクラスタリング解析により高リスク群、中リスク群および低リスク群に分類する。生体試料が分類されたリスク群に基づき、生体試料の再発リスクを判定することができる。
【0038】
上述の解析手法の他、線形判別、サポートベクターマシンによる判別などを用いることもできる。
【0039】
別の実施形態では、たとえば、生体試料における第1遺伝子群から選択される遺伝子の発現量と基準値との比較、生体試料における第2遺伝子群から選択される遺伝子の発現量と基準値との比較、および生体試料における第3遺伝子群から選択される遺伝子の発現量と基準値との比較に基づいて再発リスクの判定が行われる。
【0040】
本実施態様においては、判定工程において、第1および第2遺伝子群からそれぞれ選択される遺伝子の発現量にかかわらず、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上である場合に、再発リスクは高いと判定する。
すなわち、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上である場合には、第1及び第2遺伝子群からそれぞれ選択される遺伝子の発現量がこれらの遺伝子群それぞれの基準値以上であっても、あるいは当該基準値よりも小さくても、再発リスクは高いと判定される。
【0041】
本実施態様においては、判定工程において、第2遺伝子群から選択される遺伝子の発現量にかかわらず、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、第1遺伝子群から選択される遺伝子がその遺伝子群の基準値よりも小さい場合、再発リスクは中程度であると判定する。
すなわち、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、かつ、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群の発現量よりも小さい場合には、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上であっても、あるいは当該基準値よりも小さくても、再発リスクは中程度であると判定される。
【0042】
本実施態様においては、判定工程において、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上であり、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上である場合に、再発リスクは中程度であると判定する。
【0043】
本実施態様においては、判定工程において、第3遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さく、第1遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値以上であり、第2遺伝子群から選択される遺伝子の発現量がその遺伝子群の基準値よりも小さい場合に、再発リスクは低いと判定する。
【0044】
上記の実施形態において、各遺伝子群の「基準値」は、各遺伝子群が過剰発現をしているか否かを判定することのできる値に設定される。たとえば、第1遺伝子群の「基準値」は以下のように取得される。まず、特定の患者群において、各遺伝子の発現量の平均値を算出する。たとえば、患者群に含まれる各患者のC18orf22発現量をそれぞれ測定し、発現量の総和を患者数で除することにより、患者群のC18orf22発現量の平均値を取得することができる。第1遺伝子群に含まれるその他の遺伝子についても同様に平均値を取得する。これらの遺伝子の平均値の総和を遺伝子数で除することにより、特定の患者群における第1遺伝子群の平均値を取得することができる。この平均値を「基準値」とすることができる。第2遺伝子群および第3遺伝子群についても同様に「基準値」を取得することができる。
【0045】
ここでは、基準値として「平均値」を例示したが、平均値ではなく中央値や最頻値などを用いてもよい。
【0046】
この基準値は、測定工程および判定工程を実施する前に、予め取得されていることが好ましい。
【0047】
本実施形態の好ましい実施形態においては、生体試料における各遺伝子の発現量の総和を、遺伝子数で除して、生体試料の遺伝子発現量の平均値を取得し、この生体試料の遺伝子発現量の平均値が上述の基準値と比較される。
【0048】
本発明のさらに好ましい実施態様においては、再発リスクが中程度とされた群に対し、KRAS遺伝子に変異を有する場合は再発リスクは高い、KRAS遺伝子に変異を有していない場合は再発リスクは低いと判定する。
【0049】
KRAS遺伝子とは、12番染色体上の25.36〜25.4 Mbの位置に存在する遺伝子であり、ras癌遺伝子の一種で、上皮成長因子受容体(EGFR)のシグナルを核に伝達し、細胞増殖を促進する機能を持つとされる。KRASのcDNAの塩基配列を配列番号56として表す。この塩基配列は、ヒトゲノムデータベースGenBankにおいてアクセッション番号AF493917の下公知である。
【0050】
KRAS遺伝子の変異とは、好ましくは当該遺伝子のエキソン2配列に存在する12及び13番目のコドン(34〜39番目の塩基)にあたるGGTGGCの塩基配列中に起こる変異又はエキソン3配列に存在する61番目のコドン(182〜184番目の塩基)にあたるCAAの塩基配列中に起こる変異を指す。
【0051】
KRAS変異の有無の測定方法は特に限定されず、当業者に公知の方法を用いて行なうことができる。本実施形態においては、KRAS変異の有無の測定は、シーケンス解析を用いて行なわれ得る。
【0052】
KRAS遺伝子の変異の種類は特に限定されず、上記コドン中のいずれかの塩基が変異していれば、変異ありと判定することができる。本実施形態においては、好ましくは、KRASタンパク質のアミノ酸配列の変異を引き起こす塩基配列の変異(即ち、ミスセンス変異、ナンセンス変異、フレームシフト変異など、サイレント変異以外の変異)を対象とする。変異の種類は、ヌクレオチドの置換、欠失、削除および付加が考えられるが、本実施形態においては、好ましくは、置換である。このような置換の具体例としては、34番目のGのAによる置換、35番目のGのA、CまたはTによる置換、38番目のGのAによる置換、182番目のCのAによる置換、184番目のAのCまたはTによる置換等が挙げられる。
【0053】
上記のとおり、KRAS変異の有無を判定基準に加えることによって、中リスク群を高リスク群と低リスク群に分類でき、全体を高低2分類することができる。これにより、中リスク群についても高低いずれかに分類することが可能となり、より多くの症例に対してより有用な情報を提供することができる。
【0054】
本発明には、患者の大腸癌再発リスクの判定をコンピュータに実行させるためのコンピュータプログラム製品も含まれる。コンピュータプログラム製品は、インターネット等を介してダウンロード可能なプログラムや、当該プログラムを記録した媒体などが例示される。
【0055】
たとえば、以下のような工程をコンピュータに実行させるためのプログラムが例示される。
大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から複数選択される遺伝子の発現量を受信し、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から複数選択される遺伝子の発現量を受信し、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から複数選択される遺伝子の発現量を受信する工程;
受信した発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程。
【0056】
以下に、本実施形態の方法を実施するのに好適な装置の一形態を、図面を参照して説明する。しかし、本発明はこの実施形態のみに限定されるものではない。
図1は、患者の大腸癌再発リスクの判定に用いる診断補助装置の一例を示した概略図である。
図1に示された診断補助装置1は、測定装置2と、該測定装置2と接続されたコンピュータシステム3とを含んでいる。
【0057】
本実施形態においては、測定装置2は、核酸チップ用の測定装置である。この測定装置2は、遺伝子の発現量そのものおよび核酸チップの発色蛍光の色相や蛍光強度のような遺伝子の発現量に関連する情報を取得する。大腸癌患者から採取された生体試料を測定装置2にセットすると、測定装置2は、該生体試料における遺伝子の発現量に関連する情報を取得し、得られた情報をコンピュータシステム3に送信する。
【0058】
中リスクと判定された検体についてさらに大腸癌再発リスクの高低判定を行なう場合、診断補助装置1は、測定装置2および該測定装置2と接続されたコンピュータシステム3に加えて、さらに変異測定装置4を含む。
本実施形態においては、この変異測定装置4は、生体試料におけるKRAS遺伝子の変異の有無に関する情報を取得する。大腸癌患者から採取された生体試料を変異測定装置4にセットすると、変異測定装置4は、該生体試料におけるKRAS遺伝子の変異の有無に関する情報を取得し、得られた情報をコンピュータシステム3に送信する。
【0059】
コンピュータシステム3は、コンピュータ本体3aと、キーボードやマウスからなる入力部3bと、LCDやCRTからなり検体情報や判定結果などを表示する表示部3cとを含む。コンピュータシステム3は、測定装置2および変異測定装置4から、それぞれ遺伝子の発現量に関連する情報および必要に応じてKRAS遺伝子の変異の有無に関する情報を受信する。そして、コンピュータシステム3は、これらの情報に基づいて、被検者の大腸癌再発リスクを判定するプログラムを実行する。なお、入力部3bから、後述する「2群分類が必要」を入力することができる。
【0060】
図2は、診断補助装置1のコンピュータ本体3aのソフトウェアを機能ブロックで示すブロック図である。
図2に示されるように、コンピュータは、受信部301と、記憶部302と、算出部303と、判定部304と、出力部305とを備える。受信部301は、測定装置2および必要に応じて変異測定装置4と、ネットワークを介して通信可能に接続されている。判定部304には、入力部3bを介して大腸癌再発リスク判定の実施に必要な情報、具体的には中リスクと判定された検体についてKRAS遺伝子の変異有無の測定(2群分類)を行なうか否かに関する情報を入力することができる。
【0061】
受信部301は、測定装置2および変異測定装置4から送信された情報を受信する。記憶部302は、判定に必要な基準値および遺伝子の発現量を算出するための式や処理プログラムなどを記憶する。算出部303は、受信部301で取得された情報を用い、記憶された式にしたがって、遺伝子の発現量を算出する。判定部304は、受信部301によって取得されたか、または算出部303によって算出された遺伝子の発現量が、記憶部302に記憶された基準値以上であるか否かを判定する。出力部305は、判定部304による判定結果を、被検者の大腸癌再発リスクの判定結果として表示部3cへ出力する。
【0062】
中リスクと判定された検体についてさらに大腸癌再発リスクの高低判定を行なう場合、受信部301は、測定装置2から送信された情報に加えて、さらに変異測定装置4から送信された情報も取得する。記憶部302は、判定に必要な基準値および遺伝子の発現量を算出するための式に加えて、さらにKRAS遺伝子の非変異配列を記憶する。算出部303は、受信部301で取得された情報を用い、記憶された式にしたがって、遺伝子の発現量を算出する。判定部304は、受信部301によって取得されたか、または算出部303によって算出された遺伝子の発現量が、記憶部302に記憶された基準値以上であるか否かを判定することに加え、さらに、受信部301で取得されたKRAS遺伝子の配列と記憶部302に記憶されたKRAS遺伝子の非変異配列とが一致するか否かに基づいてKRAS遺伝子における変異の有無を判定する。出力部305は、判定部304による判定結果を、被検者の大腸癌再発リスクの判定結果として表示部3cへ出力する。
【0063】
図3は、
図2に示すコンピュータ本体3aのハードウェア構成を示すブロック図である。
図3に示されるように、コンピュータ本体3aは、CPU(Central Processing Unit)30と、ROM(Read Only Memory)31と、RAM32と、ハードディスク33と、入出力インターフェイス34と、読出装置35と、通信インターフェイス36と、画像出力インターフェイス37とを備えている。CPU30、ROM31、RAM(Random Access Memory)32、ハードディスク33、入出力インターフェイス34、読出装置35、通信インターフェイス36および画像出力インターフェイス37は、バス38によってデータ通信可能に接続されている。
【0064】
CPU30は、ROM31に記憶されているコンピュータプログラムおよびRAM32にロードされたコンピュータプログラムを実行することが可能である。CPU30がコンピュータプログラムを実行することにより、
図2に示す各機能が実行される。これにより、コンピュータシステム3が、被検者の大腸癌再発リスクを判定するための診断補助装置として機能する。
【0065】
ROM31は、マスクROM、PROM、EPROM、EEPROMなどによって構成されている。ROM31には、前述のようにCPU30によって実行されるコンピュータプログラムおよびこれに用いるデータが記録されている。
【0066】
RAM32は、SRAM、DRAMなどによって構成されている。RAM32は、ROM31およびハードディスク33に記録されているコンピュータプログラムの読み出しに用いられる。RAM32はまた、これらのコンピュータプログラムを実行するときに、CPU30の作業領域として利用される。
【0067】
ハードディスク33は、CPU30に実行させるためのオペレーティングシステム、アプリケーションプログラム(被検者の大腸癌再発リスクを判定するためのコンピュータプログラム)などのコンピュータプログラムおよび当該コンピュータプログラムの実行に用いるデータがインストールされている。
【0068】
読出装置35は、フレキシブルディスクドライブ、CD−ROMドライブ、DVD−ROMドライブなどによって構成されている。読出装置35は、可搬型記録媒体40に記録されたコンピュータプログラムまたはデータを読み出すことができる。
【0069】
入出力インターフェイス34は、例えば、USB、IEEE1394、RS−232Cなどのシリアルインターフェイスと、SCSI、IDE、IEEE1284などのパラレルインターフェイスと、D/A変換器、A/D変換器などからなるアナログインターフェイスとから構成されている。入出力インターフェイス34には、キーボード、マウスなどの入力部3bが接続されている。操作者は、当該入力部3bにより、コンピュータ本体3aに各種の指令を入力することが可能である。
【0070】
通信インターフェイス36は、例えば、Ethernet(登録商標)インターフェイスなどである。コンピュータ本体3aは、通信インターフェイス36により、プリンタなどへの印刷データの送信も可能である。
【0071】
画像出力インターフェイス37は、LCD、CRTなどで構成される表示部3cに接続されている。これにより、表示部3cは、CPU30から与えられた画像データに応じた映像信号を出力することができる。表示部3cは、入力された映像信号にしたがって画像(画面)を表示する。
【0072】
次に、診断補助装置1による、被検者の大腸癌再発リスク判定の処理手順を説明する。
図4は、大腸癌再発リスク判定のフローチャートである。ここでは、被検者由来の生体試料を用いて得られた発色蛍光の情報から蛍光強度を算出し、得られた蛍光強度から遺伝子の発現量を算出し、得られた発現量が基準値以上であるか否かの判定を行う場合を例として挙げて説明する。しかし、本発明は、この実施形態のみに限定されるものではない。
【0073】
まず、ステップS1−1において、診断補助装置1の受信部301は、測定装置2から第3遺伝子群から選択される遺伝子の発現量に関連する発色蛍光の情報を取得する。次に、ステップS1−2において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS1−3において、算出部303は、記憶された該蛍光強度に基づき、記憶された式にしたがって、遺伝子の発現量を算出する。
【0074】
その後、ステップS1−4において、判定部304は、ステップS1−3で算出された発現量が、記憶部302に記憶された基準値以上であるか否かの判定を行う。ここで、発現量が基準値以上であるとき、ルーチンはステップS1−5に進行し、判定部304は被検者の大腸癌再発リスクが高いこと(高リスク)を示す判定結果を出力部305に送信する。一方、発現量が基準値よりも低いとき、ルーチンはステップS1−6に進行する。
【0075】
ステップS1−6において、診断補助装置1の受信部301は、測定装置2から第1遺伝子群から選択される遺伝子の発現量に関連する発色蛍光の情報を取得する。次に、ステップS1−7において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS1−8において、算出部303は、記憶された該蛍光強度に基づき、記憶された式にしたがって、遺伝子の発現量を算出する。
【0076】
その後、ステップS1−9において、判定部304は、算出部303で算出された発現量が、記憶部302に記憶された基準値以上であるか否かの判定を行う。ここで、発現量が基準値以上であるとき、ルーチンはステップS1−11に進行する。また、発現量が基準値よりも低いとき、ルーチンはステップS1−10に進行し、判定部304は被検者の大腸癌再発リスクが中程度(中リスク)であると判定し、その後ルーチンはステップS1−17に進行する。
【0077】
ステップS1−11においては、診断補助装置1の受信部301は、測定装置2から第2遺伝子群から選択される遺伝子の発現量に関連する発色蛍光の情報を取得する。次に、ステップS1−12において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS1−13において、算出部303は、記憶された該蛍光強度に基づき、記憶された式にしたがって、遺伝子の発現量を算出する。
【0078】
その後、ステップS1−14において、判定部304は、算出部303で算出された発現量が、記憶部302に記憶された基準値以上であるか否かの判定を行う。ここで、発現量が基準値以上であるとき、ルーチンはステップS1−15に進行し、判定部304は被検者の大腸癌再発リスクが中程度(中リスク)であると判定し、その後ステップS1−17に進行する。一方、ステップS1−14において、発現量が基準値よりも低いとき、ルーチンはステップS1−16に進行し、判定部304は被検者の大腸癌再発リスクが低いことを示す判定結果(低リスク)を出力部305に送信する。
【0079】
ステップS1−10またはS1−15を経て大腸癌再発リスクが中程度であると判定された検体について、ステップS1−17において、入力部3bから「2群分類が必要」と入力された場合には、これらの検体についてKRAS遺伝子変異測定による大腸癌再発リスクの高低判定を行なう。
【0080】
「2群分類が必要」と入力されていないとき、ルーチンはステップS1−18に進行し、被検者の大腸癌再発リスクが中程度であることを示す判定結果を出力部305に送信する。
【0081】
一方、2群分類が必要である場合、ルーチンはステップS1−19に進行する。ステップS1−19では、中リスクと判定された検体についてKRAS遺伝子の変異の有無に基づく大腸癌再発リスクの高低判定の処理が行われる。この処理には、変異測定装置4が用いられる。
【0082】
ステップS1−19において、受信部301は、中リスクと判定された被検者のKRAS遺伝子の配列情報を取得する。次に、ステップS1−20において、判定部304は、取得したKRAS遺伝子の配列と、記憶部302に記憶されたKRAS遺伝子の非変異配列とを比較して、被検者の生体試料中のKRAS遺伝子に変異があるか否かを判定する。KRAS遺伝子に変異がある場合、ルーチンは、ステップS1−21に進行し、判定部304は、被検者の大腸癌再発リスクが高いこと(高リスク)を示す判定結果を出力部305に送信する。一方、KRAS遺伝子に変異がない場合、ルーチンは、ステップS1−22に進行し、判定部304は、被検者の大腸癌再発リスクが低いこと(低リスク)を示す判定結果を出力部305に送信する。
【0083】
そして、ステップS1−23において、出力部305は、被検者の大腸癌再発リスクの判定結果を出力し、表示部3cに表示させる。これにより、診断補助装置1は、被検者の大腸癌の再発リスクが高いのか、中程度であるのか、または低いのかについて判定することを補助する情報を医師などに提供することができる。
【0084】
別の実施形態によれば、
図1に記載の診断補助装置を用いて、相関係数を算出して再発リスクを判定することもできる。この場合の処理フローを
図5に基づいて説明する。なお、この装置の記憶部は、予め高リスク群発現パターン、中リスク群発現パターンおよび低リスク群発現パターンを記憶している。
【0085】
ステップS2−1において、診断補助装置1の受信部301は、測定装置2から生体試料における各遺伝子の発現量を示す蛍光情報を取得する。次に、ステップS2−2において、算出部303は、取得した情報から蛍光強度を算出し、記憶部302に送信する。そして、ステップS2−3において、算出部303は、記憶された蛍光強度に基づいて、各遺伝子の発現量を算出する(ここで、生体試料の発現パターンが取得される)。その後、ステップS2−4において、判定部304は、記憶部302に記憶されている高リスク群発現パターン、中リスク群発現パターンおよび低リスク群発現パターンを読み出し、これらとステップS2−3において取得した生体試料の発現パターンとに基づいて、生体試料の発現パターンと高リスク群発現パターンとの相関係数(以下、「相関係数H」ともいう)、生体試料の発現パターンと中リスク群発現パターンとの相関係数(以下、「相関係数M」ともいう)、および生体試料の発現パターンと低リスク群発現パターンとの相関係数(以下、「相関係数L」ともいう)を算出する。
【0086】
ステップS2−5において、相関係数Hが最も高いか否かが判定される。すなわち、相関係数Hが相関係数Mより高く、相関係数Hが相関係数Lより高い場合、相関係数Hが最も高いと判定される。相関係数Hが最も高い場合は、ステップS2−6において生体試料が高リスク群に分類され、生体試料の再発リスクは高いと判定される。
【0087】
ステップS2−5において、相関係数Hが最も高い相関係数ではないと判断された場合、ステップS2−7において、相関係数Mが最も高いか否かが判定される。すなわち、相関係数Mが相関係数Hより高く、相関係数Mが相関係数Lより高い場合、相関係数Mが最も高いと判定される。相関係数Mが最も高い場合は、ステップS2−8において生体試料が中リスク群に分類され、生体試料の再発リスクは中程度と判定される。
【0088】
ステップS2−7において、相関係数Mが最も高い相関係数ではないと判断された場合、ステップS2−9において、相関係数Lが最も高いと判定される。関係数Lが最も高い場合は、ステップS2−9において生体試料が低リスク群に分類され、生体試料の再発リスクは低いと判定される。
【0089】
ステップS2−10において、出力部305は、被検者の大腸癌再発リスクの判定結果を出力し、表示部3cに表示させる。これにより、診断補助装置1は、被検者の大腸癌の再発リスクが高いのか、中程度であるのか、または低いのかについて判定することを補助する情報を医師などに提供することができる。
【0090】
また、
図5のフローチャートでは、相関係数Mが最も高いか否かを判断するステップの代わりに、相関係数Lが最も高いか否かを判断するステップを含んでいてもよい。また、相関係数Hが最も高いか否かを判断するステップの代わりに、相関係数Lが最も高いか否かを判断するステップを含んでいてもよい。いずれであっても、相関係数H、MおよびLの何れが最も高いかを判断することができる。何れの場合でも、判断ステップの実行順序は限定されない。
【0091】
さらに好ましい実施形態では、
図5のフローチャートのステップS2−8において再発リスク中と判定された検体について、さらにKRAS遺伝子変異の有無を測定し、再発リスク高低いずれかに2群分類してもよい。このような2群分類を行う場合のフローチャートは、例えば
図4におけるステップS1−17〜S1−22に示したものと同様であり、これらのステップは、例えば
図5のフローチャートのステップS2−8の後に行われる。
【0092】
本発明には、被検者の大腸癌再発リスクの判定に適するシステムも含まれる。
【0093】
なお、記憶部302は、以下の工程をコンピュータシステム3に実行させるためのコンピュータプログラムを記録している:
大腸癌患者から採取された生体試料における、18番染色体長鎖上の18q21から18q23までの領域に存在する第1遺伝子群から複数選択される遺伝子の発現量を受信し、20番染色体長鎖上の20q11から20q13までの領域に存在する第2遺伝子群から複数選択される遺伝子の発現量を受信し、ならびに、ANGPTL2、AXL、C1R、C1S、CALHM2、CTSK、DCN、EMP3、GREM1、ITGAV、KLHL5、MMP2、RAB34、SELM、SRGAP2P1およびVIMを含む第3遺伝子群から複数選択される遺伝子の発現量を受信する工程;
受信した発現量に基づいて、前記患者の大腸癌の再発リスクを判定する工程。
【0094】
本実施形態の方法では、上記の解析工程で得られた解析結果に基づいて、被検者の大腸癌再発リスクを判定する。例えば、被検者の大腸癌が再発する可能性が高い、そのような可能性が中程度である、または、そのような可能性が低い、との判定結果を提供することができる。上記の判定結果を医師等に提供することによって、大腸癌の再発可能性についての医師等による診断が補助される。
【実施例】
【0095】
実施例1:大腸癌患者の予後に応じた分類の検討
Affymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE14333(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ )より入手)のうち、大腸癌(結腸癌)患者72症例をトレーニングセットとして使用した。解析ソフトウェアとして、アレイデータ解析用ソフトウェア(Expression Console v1.1(Affymetrix社製))、表計算用ソフトウェア(Office Excel 2002, 2007(Microsoft社製))、クラスタ解析用ソフトウェア(Cluster3.0, Java(登録商標) Treeview(入手先;http://bonsai.hgc.jp/~mdehoon/software/cluster/software.htm))、統計解析ソフトウェア(MedCalc(MedCalc社製))を使用して各種解析を行なった。
データの正規化にはMAS5を使用した。GeneChip上の全プローブのうち、遺伝子シンボルが不明のプローブおよび平均発現シグナル値が300未満のプローブは解析から除外した。対応する遺伝子が重複するプローブについては、平均発現シグナル値が最大のプローブを代表とし、残りは除外した。シグナル値をZ変換した後、最近接距離法にて無教師階層クラスタリングを行なった。類似性尺度はピアソン相関係数とした。
クラスタ解析の結果から、(1)重要な生物学的機能を反映する、(2)特徴的な症例クラスタの生成に寄与する、という2条件を満たすと推定される遺伝子クラスタを機能モジュールとして定義・抽出し、機能モジュールの組合せによるクラスタリングを繰り返し行なうことで再発リスク群分類法の構築を行なった。
【0096】
図6に、トレーニングセットの症例における再発リスク群分類の結果を示す。以下、全患者症例における遺伝子の発現量の平均値に基づいて、発現量の増減を判断するものとする。例えば、ある遺伝子の発現量が上記した平均値以上である場合には相対的発現量増加と判断され、上記した平均値よりも小さい場合には、相対的発現量減少と判断される。
図6に示されるように、トレーニングセットから、18番染色体長鎖上の遺伝子群(以下、「第1遺伝子群」又は「18q Lossモジュール」と記す場合がある。)の相対的発現量減少、および、20番染色体長鎖上の遺伝子群(以下、「第2遺伝子群」又は「20q Ampモジュール」と記す場合がある。)の相対的発現量増加を示す症例を抽出し、これをタイプBと定義した。トレーニングセットから、18q Lossモジュール及び20q Amp モジュールの発現パターンがタイプBと逆の症例を抽出し、これをタイプAと定義した。また、トレーニングセットにおいて、タイプAおよびタイプBにおける遺伝子の発現量とは無関係に、ストロマ関連遺伝子群の強発現で特徴づけられる症例が出現したため、これらの症例を独立したタイプCと定義した。使用した3機能モジュールを構成する遺伝子を表1に示した。
【0097】
【表1-1】
【0098】
【表1-2】
【0099】
表2に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
【0100】
【表2】
【0101】
全72症例のうち、タイプAに分類された症例は22症例、タイプBに分類された症例は24症例、タイプCに分類された症例は26症例であった。大腸癌の再発率は、タイプAにおいて4.5%、タイプBにおいて12.5%、タイプCにおいて23.1%であった。
【0102】
図7に、分類したタイプ毎に作成したKaplan-Meier曲線を示す。
図7に示されるように、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
表2および
図7に示される結果から、タイプAを再発リスクの低い低リスク群、タイプBを再発リスクが中程度の中リスク群、タイプCを再発リスクの高い高リスク群として定義できることがわかった。以下、低リスク群、中リスク群、および、高リスク群を総称して、再発リスク群と記す場合がある。
【0103】
実施例2:再発リスク群分類の信頼性の検証1
Affymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE14333(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ )より入手)のうち、トレーニングセットで使用しなかった患者74症例をバリデーションセット1として使用した。なお、トレーニングセットの症例とバリデーションセット1の症例とは、それぞれ異なる医療施設にて取得された検体となるように選択されている。
トレーニングセットの72症例にバリデーションセット1の74症例を加えた146症例について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
【0104】
図8に、トレーニングセットおよびバリデーションセット1の症例における再発リスク群分類の結果を示す。
図8に示されるように、トレーニングセットとバリデーションセット1とでは生体試料を取得した施設が異なるが、施設の違いに由来するクラスタを形成することなく、全症例が3つの再発リスク群のいずれかに分類されることがわかった。
【0105】
実施例3:再発リスク群分類の信頼性の検証2
大腸癌(結腸癌)患者53症例についてのAffymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE18088(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ より入手)をバリデーションセット2として使用した。この53症例について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
【0106】
図9に、バリデーションセット2の症例における再発リスク群分類の結果を示す。
図9に示されるように、バリデーションセット2は、トレーニングセットとは、生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、バリデーションセット2における全症例が3つの再発リスク群のいずれかに分類されることがわかった。
表3に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
【0107】
【表3】
【0108】
全53症例のうち、低リスク群に分類された症例は23症例、中リスク群に分類された症例は25症例、高リスク群に分類された症例は5症例であった。大腸癌の再発率は、低リスク群において8.7%、中リスク群において28.0%、高リスク群において80.0%であった。表3の結果から、バリデーションセット 2は、トレーニングセットとは生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、各再発リスク群は、施設の違いに影響されることなく、実施例1と同様の結果を示すことがわかった。
【0109】
実施例4:再発リスク群分類の信頼性の検証3
大腸癌(結腸癌)患者258症例についてのAffymetrix社GeneChip, Human Genome U133 plus 2.0 ArrayのデータセットGSE39582(NCBI Gene Expression Omnibus (URL; http://www.ncbi.nlm.nih.gov/geo/ より入手)をバリデーションセット3として使用した。この256症例について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
【0110】
図10に、バリデーションセット3の症例における再発リスク群分類の結果を示す。
図10に示されるように、バリデーションセット3は、トレーニングセットとは、生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、バリデーションセット3における全症例が3つの再発リスク群のいずれかに分類されることがわかった。
表4に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
【0111】
【表4】
【0112】
全258症例のうち、低リスク群に分類された症例は74症例、中リスク群に分類された症例は123症例、高リスク群に分類された症例は61症例であった。大腸癌の再発率は、低リスク群において12.2%、中リスク群において23.6%、高リスク群において39.3%であった。
【0113】
図11に、分類したタイプ毎に作成したKaplan-Meier曲線を示す。
図11に示されるように、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
表4および
図11の結果から、バリデーションセット3は、トレーニングセットとは生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、各再発リスク群は、施設の違いに影響されることなく、実施例1と同様の結果を示すことがわかった。
【0114】
実施例5:再発リスク群分類の信頼性の検証4
バリデーションセット4として、大腸癌(結腸癌)患者85症例から組織を採取し、凍結保存した。この凍結保存組織85検体を用いてAffymetrix社GeneChip, Human Genome U133 plus 2.0 Arrayで発現解析を行った。この85検体について、実施例1と同様にして、表1の遺伝子を用いてクラスタリングを行った。
【0115】
図12に、バリデーションセット4の症例における再発リスク群分類の結果を示す。
図12に示されるように、バリデーションセット4は、トレーニングセットとは、生体試料を取得した施設及びGeneChip測定を行なった施設が異なるが、バリデーションセット4における全症例が3つの再発リスク群のいずれかに分類されることがわかった。
表5に、上記のようにして分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
【0116】
【表5】
【0117】
全85症例のうち、低リスク群に分類された症例は23症例、中リスク群に分類された症例は26症例、高リスク群に分類された症例は36症例であった。大腸癌の再発率は、低リスク群において0%、中リスク群において11.5%、高リスク群において22.2%であった。
【0118】
図13に、分類したタイプ毎に作成したKaplan-Meier曲線を示す。
図13に示されるように、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
表5の結果から、バリデーションセット4でも実施例1と同様の結果を示すことがわかった。
【0119】
上記のとおり、機能モジュール解析により、大腸癌の症例を3つの再発リスク群に分類することができた。それぞれの再発リスク群は異なる再発リスクを有していた。また、実施例1〜5の結果より、再発リスク群の分類は、データセットの入手先に影響されない信頼性の高い分類法であることがわかった。したがって、本実施形態の大腸癌の再発リスク群分類を用いた再発リスクの診断補助方法により、十分に安定した信頼性の高い結果を得られることが示された。
【0120】
比較例:従来法(デュークス分類)による予後予測
予後予測性能の比較対照として、トレーニングセットの72症例について、デュークス分類による生存時間解析を行なった結果を
図14に示す。
図14において、デュークスAは、癌が大腸壁内にとどまっている状態を示し、デュークスBは、癌が大腸壁を貫いているがリンパ節転移のない状態を示し、デュークスCは、リンパ節転移のある状態を示す。
【0121】
図2および
図14に示されるように、本実施形態の診断補助方法により高リスクと判定された症例は26症例であったのに対し、比較例の判定方法により高リスク(デュークスC)と判定された症例は15症例であった。また、比較例の判定方法によりデュークスAと判定された症例と、デュークスBと判定された症例の無再発生存率にはほとんど差が無いのに対し、本実施形態の診断補助方法により低リスク群と判定された症例と中リスク群と判定された症例の無再発生存率には差が認められた。この結果から、本実施形態の再発リスク診断補助方法によれば、従来の病理学的分類よりも精度良く再発リスクを判定できることが示唆された。
【0122】
実施例6:KRAS遺伝子変異による中リスク群の層別による予後予測性能の向上1
実施例4で行った解析結果で中リスク群とされた検体のうちKRAS遺伝子変異を有する検体を高リスク、KRAS遺伝子変異の無い検体を低リスクとし、全検体を2群に分けた(
図15参照)。具体的には、下記のようにして検体のDNA中のKRAS変異の有無を測定し、その結果に基づいて全検体を2群に分けた。
まず、以下の表6の組成を有するPCR master Mixを調製した。
【0123】
【表6】
【0124】
次いで、ゲノムDNA 10ngを0.5ml PCR tubeへ分注し、全量20μLになるようNuclease free waterを添加した。そして、PCR master Mixを4.8μl/tube添加し、混合した。なお、PCR Master Mixに加えたプライマーは、以下の表7に示したものである。KRAS遺伝子のエキソン2の第12および13コドンを含む領域の増幅には配列番号57および58のプライマー対を、エキソン3の第61コドンを含む領域の増幅には配列番号59および60のプライマー対を用いた。
【0125】
【表7】
【0126】
得られたPCR master MixをThermal Cyclerにセットして以下のプログラムを実施し、KRASのエキソン2配列およびエキソン3配列をPCRにより増幅した。KRAS エキソン295℃:10min → (94℃:1min →55℃:1min →72℃:1min)x 38 cycle → 72℃:10min→4℃ holdKRAS エキソン395℃:10min → (94℃:1min →63℃:1min →72℃:1min)x 38 cycle → 72℃:10min→4℃ hold
【0127】
増幅後、1%アガロースゲル電気泳動を行ない、単一バンドであることを確認した。その後、0.5ml PCR tubeにPCR産物5μlを分注し、ExoSAP-ITを2μl加え混合し、Thermal Cyclerにセットし、以下のプログラムを実施した。37℃15min→80℃ 15min→4℃ hold
【0128】
産物2μlに9.6μlの1 pmol/μlのプライマー(F又はR)、9.4μlのNFWを添加し混合した。シーケンス解析をOperon社に委託して行った。解析対象とした塩基配列と、配列番号1の塩基配列とを比較し、1つでも変異が認められた場合は、KRAS遺伝子に変異あり、とした。実施例4において中リスク群と判断された検体につき、KRAS遺伝子に変異が見られた検体を高リスク群に、KRAS遺伝子に変異が見られなかった検体を低リスク群に分類した。
【0129】
結果を
図15に各群のKaplan-Meier曲線を示す。
図15と
図11を比較して、KRAS遺伝子変異の有無を判断基準に加えることで、中リスク群の症例を無再発生存率に大きな差異の認められる高低2つのリスク群へと分類できることがわかった。
【0130】
実施例7:KRAS遺伝子変異による中リスク群の層別による予後予測性能の向上2
実施例5で行った解析結果で中リスク群とされた検体のうちKRAS遺伝子変異を有する検体を高リスク、KRAS遺伝子変異の無い検体を低リスクとし、全検体を2群に分けた。
結果を
図16に各群のKaplan-Meier曲線を示す。
図16と
図13を比較して、KRAS遺伝子変異の有無を判断基準に加えることで、中リスク群の症例を無再発生存率に大きな差異の認められる高低2つのリスク群への分類できることがわかった。
【0131】
実施例8:ホルマリン固定パラフィン包埋(FFPE)組織を用いた検証
実施例5において使用した凍結保存組織検体85症例のうち18症例からFFPE組織検体を調製した。この18検体を用いて再発リスク群分類を行った。より具体的には、まず、RNAeasy FFPE kit (QIAGEN社)を用いてFFPE組織検体からtotal RNAを抽出した。Sensation Plus FFPE Amplification and 3’ IVT Labeling Kit (Affymetrix社)を用いて核酸チップ前処理を行った。上記で得られたtotal RNAを用いてGene Chip測定を行った。実施例1と同様にして、表1の遺伝子についてクラスタリングを行った。
【0132】
図17に、上記FFPE組織検体18検体について得られた再発リスク群分類の結果を示す。
図17に示されるように、FFPE組織検体を用いた場合にも、表1の遺伝子の発現量に基づいて、大腸癌の症例を3つの再発リスク群に分類できることがわかった。表8に、FFPE組織検体18症例について分類したタイプ毎の症例数(存在比率)及び大腸癌の再発率を示す。
【0133】
【表8】
【0134】
全18症例のうち、低リスク群に分類された症例は4症例、中リスク群に分類された症例は6症例、高リスク群に分類された症例は8症例であった。大腸癌の再発率は、低リスク群において0%、中リスク群において0%、高リスク群において37.5%であった。これらの結果は、FFPE組織検体を用いる場合にも、大腸癌の症例を精度よく再発リスク群分類できることを示す。
【0135】
上記のFFPE組織検体について、中リスク群に分類された6症例におけるKRAS遺伝子変異を測定した。その結果、6症例全てにおいて、KRAS遺伝子変異は陰性であり、低リスク群に分類することができた。
図18に、FFPE組織検体に対して実施例6および7で実施した再発リスク群分類を行った際の各群のKaplan-Meier曲線を示す。
図18に示されるように、FFPE組織検体を用いる場合にも、各タイプにおける手術後の無再発生存率に大きな差異が認められることがわかった。
【0136】
図17および表8の結果から、FFPE組織検体を用いても、実施例1と同様に、大腸癌の症例を、再発リスク群分類できることがわかった。また、
図18の結果から、実施例6及び7と同様に、FFPE組織検体を用いても、KRAS遺伝子変異の有無に基づいて再発リスク群分類の精度を更に高めることができることがわかった。
以下の表9に、凍結保存組織検体での判定結果と、FFPE組織検体での判定結果との相関表を示す。
【表9】
【0137】
一致率は83.3%と非常に高く、この結果からも、FFPE組織検体を用いた場合にも、凍結保存組織検体を用いた場合と同様、再発リスクを判定できることがわかった。
【0138】
実施例9:相関係数を用いた再発リスク判定方法
実施例1において分類した、低リスク群、中リスク群および高リスク群において、表1に示される55遺伝子の発現量をそれぞれ測定した。この発現量に基づき、低リスク群発現パターン、中リスク群発現パターンおよび高リスク群発現パターンを取得した。各発現パターン内には、各遺伝子の平均値が含まれる。
【0139】
検体として、実施例4と同じ検体を用いた。各検体について表1に示される55遺伝子の発現量をそれぞれ測定した。この発現量に基づき、各検体の発現パターンを取得した。
【0140】
検体の発現パターンと、各リスク群の発現パターンとの間の相関係数を、スピアマンの順位相関に基づいて算出した。各検体について最も高い相関係数を示したリスク群を特定した。
【0141】
実施例4の結果(クラスタリング解析によるリスク分類)と、実施例9の結果との一致率を表10に示す。
【0142】
【表10】
【0143】
表10に示されるように、実施例9の結果と実施例4の結果との一致率は83%であった。この結果から、相関係数を用いた場合も、検体の再発リスクを判定できることがわかった。
【0144】
実施例10:KRAS遺伝子変異を用いた再発リスク判定
実施例9で再発リスクが中程度と判定された患者群のKRAS遺伝子変異の有無を検出した。中リスク群のうち、KRAS遺伝子変異を有する検体を再発リスク高、KRAS遺伝子変異の無い検体を再発リスク低に分類した。
【0145】
実施例6の結果と実施例10の結果との一致率を表11に示す。
【0146】
【表11】
【0147】
表11に示されるように、実施例10の結果と実施例6の結果との一致率は85%であった。この結果から、相関係数を用いた場合も、検体の再発リスクを判定できることがわかった。
【0148】
また、
図19に、実施例10の結果から作成したKaplan-Meier曲線を示す。
図19に示されるように、KRAS遺伝子変異の有無を判断基準に加えることで、各検体を無再発生存率の大きく異なる高低二つのリスク群に分類することができた。