【文献】
Clinical Cancer Research,2008年,Vol.14, No.9,Page.2579-2587
【文献】
International Journal of Cancer,2002年,Vol.99, No.5,Page.673-680
【文献】
Human genetics, (2009 Jun) Vol. 125, No. 5-6, pp. 527-39
【文献】
American journal of physiology. Renal physiology, (2009 Sep) Vol. 297, No.3, pp. F816-21. Electronic Publication Date: 17 Jun 2009
【文献】
Clinical cancer research : an official journal of the American Association for Cancer Research, (2008 May 1) Vol. 14, No. 9, pp. 2579-87
(58)【調査した分野】(Int.Cl.,DB名)
癌の存在の尤度が、IL8Rbおよび1種以上のBTMの公知の発現レベルに基づく診断閾値を、正常な患者、および/または膀胱癌を有する患者、および/または炎症疾患を有する患者のレベルを用いて確定することにより決定される、請求項1に記載の方法。
前記統計法が、線形判別分析(LDA)、ロジスティック回帰(LogReg)、サポートベクターマシン(SVM)、k最近接5近傍法(K−nearest 5 neighbors)(KN5N)、および分割木分類器(Partition Tree Classifier)(TREE)の任意の1つである、請求項3に記載の方法。
【発明を実施するための形態】
【0020】
詳細な説明
定義
本発明の実施形態を詳細に説明する前に、本明細書において用いられる用語の一部の定義を示すことが有用となろう。
【0021】
用語「マーカ」は、生物学的現象の存在と定量的または定性的に関連する分子を指す。「マーカ」の例としては、その現象の根底にあるメカニズムに直接関係するか、または間接的に関連するかにかかわらず、ポリヌクレオチド、例えば遺伝子もしくは遺伝子断片、RNAもしくはRNA断片;またはペプチド、オリゴペプチド、蛋白質、もしくは蛋白質断片などのポリペプチドをはじめとする遺伝子産物;または産物による任意の関連する代謝産物;または抗体もしくは抗体断片などの任意の他の同定分子が挙げられる。本発明のマーカとしては、本明細書に開示されたヌクレオチド配列(例えば、GenBankの配列)、特に全長配列、任意のコード配列、任意の断片、または任意のそれらの相補配列、および先に定義されたそれらの任意の測定可能なマーカが挙げられる。
【0022】
本明細書で用いられる「抗体」などの用語は、免疫グロブリン分子および免疫グロブリン(Ig)分子の免疫学的に活性の部分、即ち抗原に特異的に結合する(免疫反応する)抗原結合部位を含む分子を指す。これらには、非限定的に、ポリクローナル、モノクローナル、キメラ、一本鎖、Fc、Fab、Fab’、およびFab
2断片、ならびにFab発現ライブラリが挙げられる。抗体分子は、分子中に存在する重鎖の性質により互いに異なる、分類IgG、IgM、IgA、IgE、およびIgDのいずれかに関係する。これらは、亜分類、例えばIgG1、IgG2なども含む。軽鎖は、κ鎖またはλ鎖であってもよい。本明細書において抗体の参照は、全ての分類、亜分類および型の参照を含む。同じく、キメラ抗体、例えばマウスまたはヒト配列など、1つを超える供給源に特異的なモノクローナル抗体またはその断片も含まれる。更に、ラクダ抗体、サメ抗体またはナノボディーが含まれる。
【0023】
用語「癌」および「癌性」は、典型的には異常な、または未制御の細胞発育を特徴とするホ乳類中の生理学的状態を指す、または説明する。癌および癌の病態は、例えば転移、隣接する細胞の正常機能の妨害、異常なレベルのサイトカイン放出または他の分泌生成物、炎症または免疫反応の抑制または悪化、新生物、前悪性、悪性、周囲の組織または遠隔組織または臓器、例えばリンパ節などの浸潤に関連する可能性がある。
【0024】
用語「腫瘍」は、悪性であろうと、または良性であろうと、新生物の細胞発育および増殖の全て、ならびに前癌性および癌性細胞および組織を指す。
【0025】
用語「膀胱癌」は、膀胱内に発生した腫瘍を指す。これらの腫瘍は、任意の臓器に転移する可能性がある。
【0026】
用語「BTM」または「膀胱腫瘍マーカ」または「BTMファミリーメンバー」は、膀胱癌および膀胱の移行上皮癌(TCC)に関連する腫瘍マーカ(TM)を意味する。用語BTMは、膀胱癌を検出する感度および特異度を改善する、個々のマーカの組合わせも含む。用語BTMが、マーカが膀胱腫瘍のみに特異的であることを必要としないことを、理解しなければならない。むしろBTMの発現は、悪性腫瘍をはじめとする他のタイプの細胞、疾患細胞、腫瘍において変化され得る。
【0027】
用語「過小発現するBTM」は、非悪性膀胱組織よりも膀胱腫瘍において低い発現を示すマーカを意味する。
【0028】
用語「過剰発現するBMT」は、非悪性膀胱組織よりも膀胱腫瘍において高い発現を示すマーカを意味する。
【0029】
用語「差次的に発現される」「差次的発現」などの成句は、対照となる対象(例えば、参照試料)における発現に比較してメラノーマなどの状態、具体的には癌を有する対象(例えば、検査試料)において発現が高いまたは低いレベルに活性化された遺伝子マーカを指す。その用語は、予後が良好もしくは不良の疾患、または増殖レベルの高いもしくは低い細胞において、同じ状態の異なるステージで高いまたは低いレベルに活性化されたマーカも含む。差次的に発現されたマーカは、ポリヌクレオチドレベルもしくはポリペプチドレベルで活性化もしくは阻害することができ、または選択的スプライシングを受けて異なるポリペプチド産物をもたらすことができる。そのような差異は、例えば、mRNAレベル、表面発現、ポリペプチドの分泌の変化または他の分割により示すことができる。
【0030】
差次的発現は、正常な対象と疾患対象の間、または同じ疾患の様々なステージの間、または予後良好もしくは不良の疾患の間、またはより増殖レベルの高い細胞と低い細胞の間、または正常な組織と疾患組織、具体的には癌またはメラノーマとの間で異なる、2種以上のマーカ(例えば、遺伝子またはそれらの遺伝子産物)の間の発現の比較、または2種以上のマーカ(例えば、遺伝子またはそれらの遺伝子産物)の発現率の比較、または同じマーカの異なる処理産物(例えば、転写産物またはポリペプチド)の比較を含んでいてもよい。差次的発現は、例えば正常な細胞と疾患細胞の間、または異なる疾患事象もしくは疾患ステージを受けた細胞の間、または異なる増殖レベルの細胞の間の、遺伝子または発現産物の時間的発現パターンまたは細胞内発現パターンでの定量的差および定性的差を両者とも含む。
【0031】
用語「発現」は、ポリヌクレオチドまたはポリペプチドの産生、特に遺伝子または遺伝子の部分からのRNA(例えば、mRNA)の産生を含み、RNAまたは遺伝子または遺伝子の部分によりコードされたポリペプチドの産生、および発現に関連する検出可能な材料の出現を含む。例えば、ポリペプチド−ポリペプチド相互作用、ポリペプチド−ヌクレオチド相互作用などからの複合体の形成は、用語「発現」の範囲に含まれる。別の例は、遺伝子または他のポリヌクレオチドまたはオリゴヌクレオチド、ポリペプチドまたは蛋白質断片への結合リガンド、例えばハイブリダイゼーションプローブまたは抗体の結合、および結合リガンドの視覚化である。つまりマイクロアレイ上の、ノーザンブロットなどのハイブリダイゼーションブロット上の、ウェスタンブロットなどのイムノブロット上の、もしくはビーズアレイ上のスポット、またはPCR分析によるスポットの強度は、潜在的な生体分子の用語「発現」に含まれる。
【0032】
用語「遺伝子発現の閾値」および「定義された発現の閾値」は、互換的に用いられ、ポリヌクレオチドまたはポリペプチドの発現レベルが患者の状態のための予測マーカとして働く場合を除く、該当するマーカのレベルを指す。例えば、特定の閾値を超えるIL8Rbの発現は、患者が炎症状態を有するとの診断である。閾値は、膀胱癌マーカを用いて膀胱癌の疑いのある患者を検査する場合に、用いることもできる。閾値を超える発現レベルは、患者が癌の偽陽性検査を起こす可能性のある炎症性膀胱状態を有することを示しているが、閾値未満のIL8Rbの発現レベルは、患者が炎症性膀胱状態を有さないと予測される。膀胱腫瘍マーカの発現からの任意の結果は、IL8Rbの測定を含むことにより、IL8Rbレベルが閾値未満かどうかに依存し得る(即ち、陽性結果は、炎症による粘膜の非悪性細胞の剥離から実際に生じた膀胱腫瘍マーカのレベル上昇ではなくむしろ患者が癌を有することによる陽性の可能性が高い)。
【0033】
用語「診断閾値」は、所定の状態、例えば膀胱癌を有する、または有さないと診断された患者が報告し得る閾値を指す。診断閾値は一般に、母集団、罹患率、可能性のある臨床転帰などの因子に応じて、所望の感度および特異度に達するよう設定される。一般に診断閾値は、アルゴリズムを用いて計算および/もしく確定し、ならびに/またはデータ解析によりコンンピュータ化することができる。
【0034】
厳密な閾値は、予測された疾患に用いられる母集団および任意のモデル(予測モデル)に依存するであろう。閾値は、以下の実施例に記載されたような臨床試験から実験的に確定される。用いられた予測モデルに応じて、発現閾値は、最大感度、または最大特異度、または最少誤差(最大分類率)に達するよう設定されてもよい。例えば高い閾値により最小の誤差に達するよう設定されてもよいが、これは、低い感度をもたらす場合がある。それゆえ、任意の所定の予測モデルについて、臨床試験を利用して、概ね最高の感度に達しながら一方で最少誤差率を有する発現閾値を設定する。一般に閾値は、正常な発現の少なくとも1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2、3、4、5、6、7、8、9、または10倍またはそれを超える発現程度になる可能性が高い。
【0035】
用語「感度」は、検査(モデルによる)で陽性となる疾患の個体の割合を意味する。つまり感度が高い程、偽陰性検査結果が少ないことを意味する。
【0036】
用語「特異度」は、検査(モデルによる)で陰性となる疾患を有さない個体の割合を意味する。つまり特異度が高い程、偽陽性検査結果が少ないことを意味する。
【0037】
用語「ROC曲線」、または検査特性曲線は、特定のマーカまたは検査での異なるカットオフポイントの偽陽性率(特異度)に対する真陽性率(感度)のプロットを意味する。ROC曲線上の各ポイントは、所定の閾値に対応する具体的感度/特異度を表す。ROC曲線は、閾値を確定して所望の転帰を与えるのに重要となり得る。ROC曲線下面積(AUC分析として表現される)は、所定のマーカまたは検査が診断結果をどれ程十分に区別し得るかの尺度であってもよい。ROC曲線は、2つの異なる検査の精度を比較するのに用いることもできる。
【0038】
用語「オリゴヌクレオチド」は、非限定的に一本鎖デオキシリボヌクレオチド、一本鎖または二本鎖リボヌクレオチド、RNA:DNAハイブリッド、および二本鎖DNAをはじめとするポリヌクレオチド、典型的にはプローブまたはプライマーを指す。一本鎖DNAプローブオリゴヌクレオチドなどのオリゴヌクレオチドは、多くの場合、化学的方法により、例えば市販の自動オリゴヌクレオチド合成装置を用いて、またはインビトロ発現システム、組換え技術、ならびに細胞および生物体内の発現をはじめとする様々な他の方法により、合成される。
【0039】
用語「過剰発現」または「過剰発現された」は、正常な組織で認められるレベルを超える患者体内の遺伝子またはマーカの発現レベルを指す。発現は、1.1、1.2、1.3、1.4、1.5、1.6、1.7、1.8、1.9、2または2倍を超える倍率であれば、過剰発現であるとみなされ得る。
【0040】
単数形または複数形で用いられる用語「ポリヌクレオチド」は、一般に、任意のポリリボヌクレオチドまたはポリデオキシリボヌクレオチドを指し、非修飾RNAもしくはDNA、または修飾RNAもしくはDNAであってもよい。これには、非限定的に、一本鎖および二本鎖DNA、一本鎖および二本鎖領域を含むDNA、一本鎖および二本鎖RNA、一本鎖および二本鎖領域を含むRNA、一本鎖、もしくはより典型的には二本鎖であってもよい、または一本鎖領域および二本鎖領域を含んでいてもよい、DNAおよびRNAを含むハイブリッド分子が挙げられる。同じく、RNAもしくはDNA、またはRNAおよびDNAの両方を含む三本鎖領域を含む。具体的には、mRNA、cDNA、およびゲノムDNA、ならびにそれらの任意の断片を含む。その用語は、1つ以上の修飾塩基、例えばトリチウム標識塩基、またはイノシンなどの通常にはない塩基を含むDNAおよびRNAを包含する。本発明のポリヌクレオチドは、コードもしくは非コード配列、またはセンスもしくはアンチセンス配列を包含し得る。本明細書における「ポリヌクレオチド」または同様の用語の各参照が、全長配列およびその任意の断片、誘導体、または変異体を含むことは、理解されよう。
【0041】
本明細書において用いられる「ポリペプチド」は、オリゴペプチド、ペプチド、もしくは蛋白質配列、またはそれらの断片を指し、天然由来、組換え、合成、または半合成分子を指す。「ポリペプチド」が、本明細書において天然由来蛋白質分子のアミノ酸配列を指すように引用されている場合、「ポリペプチド」および同様の用語は、アミノ酸配列をその全長分子の完全でネイティブなアミノ酸配列に限定することを意味するのではない。「ポリペプチド」または同様の用語への各参照は、その全長配列に加え、任意の断片、誘導体または変異体を包含することは、理解されよう。
【0042】
用語「qPCR」または「QPCR」は、例えばPCR Technique: Quantitative PCR, J.W. Larrick, ed., Eaton Publishing, 1997、およびA-Z of Quantitative PCR, S. Bustin, ed., IUL Press, 2004において記載された通り、定量的ポリメラーゼ連鎖反応を指す。
【0043】
ハイブリダイゼーション反応の「ストリンジェンシー」は、当業者が即座に決定することができ、一般に、プローブ長、洗浄温度、および塩濃度に応じた経験上の計算である。一般に長いプローブ程、適当なアニーリングのためにより高い温度が必要となり、短いプローブ程、より低い温度が必要となる。相補鎖が融点未満の環境に存在する場合には、ハイブリダイゼーションは一般に、変性DNAが再アニーリングする能力に依存する。プローブとハイブリダイゼーション可能な配列との間で所望の相同性の度合いが高い程、用いられ得る相対温度が高くなる。その結果、相対温度が高い程、反応条件がストリンジェントになり、低い温度程ストリンジェントでなくなる傾向がある。ハイブリダイゼーション反応のストリンジェンシーの追加的詳細および説明は、例えばAusubel et al., Current Protocols in Molecular Biology, Wiley Interscience Publishers, (1995)に見出される。
【0044】
本明細書に定義された「ストリンジェントな条件」または「高ストリンジェンシーの条件」は、典型的には(1)洗浄に低イオン強度および高温を用いる、例えば50℃の0.015M塩化ナトリウム/0.0015Mクエン酸ナトリウム/0.1%ドデシル硫酸ナトリウムを用いるか;(2)ハイブリダイゼーションの際に42℃の変性剤、例えばホルムアミド、例えば0.1%ウシ血清アルブミン/0.1% Fico11/0.1%ポリビニルピロリドン/50mMリン酸ナトリウムを含む50%(v/v)リン酸ホルムアミド、750mM塩化ナトリウムを含むpH6.5の緩衝液、75mMクエン酸ナトリウムを用いるか;または(3)42℃の50%ホルムアミド、5×SSC(0.75M NaCl、0.075Mクエン酸ナトリウム)、50mMリン酸ナトリウム(pH6.8)、0.1%ピロリン酸ナトリウム、5×デンハルト溶液、音波処理されたサケ精子DNA(50μg/ml)、0.1%SDS、および10%デキストラン硫酸を用い、42℃の0.2×SSC(塩化ナトリウム/クエン酸ナトリウム)および55℃の50%ホルムアミドで洗浄し、次に55℃のEDTA含有0.1×SSCを含む高ストリンジェンシー洗浄液で洗浄する。
【0045】
「適度にストリンジェントな条件」は、Sambrook et al., Molecular Cloning: A Laboratory Manual, New York: Cold Spring Harbor Press, 1989に記載された通り同定されてもよく、先に記載されたものよりも低ストリンジェントな洗浄溶液およびハイブリダイゼーション条件(例えば、温度、イオン強度、および%SDS)の使用が含まれる。適度にストリンジェントな条件の例は、20%ホルムアミド、5×SSC(150mM NaCl、15mM クエン酸三ナトリウム)、50mMリン酸ナトリウム(pH7.6)、5×デンハルト溶液、10%デキストラン硫酸、および20mg/ml断片処理済みサケ精子DNAを含む溶液中、37℃で一晩インキュベートし、次にフィルターを1×SSC中、約37℃〜50℃で洗浄することである。当業者には、プローブ長などの因子を適合させるのに必要な場合に、温度、イオン強度などを調整する方法が認識されよう。
【0046】
用語「IL8Rb」は、好中球マーカインターロイキン8受容体B(ケモカイン(C−X−Cモチーフ)受容体2[CXCR2]としても公知)(
図1、配列番号1および2)を意味し、マーカIL8Rbを含む。その用語は、ポリヌクレオチド、例えば遺伝子もしくは遺伝子断片、RNAもしくはRNA断片;またはペプチド、オリゴペプチド、蛋白質、もしくは蛋白質断片などのポリペプチドをはじめとする遺伝子産物;または産物による任意の関連する代謝産物;または抗体もしくは抗体断片などの任意の他の同定分子が挙げられる。
【0047】
用語「信頼性」は、偽陽性および/または偽陰性の低い発生率を含む。つまり、マーカの信頼性が高い程、そのマーカを用いて実施された診断に関連する偽陽性および/または偽陰性が少なくなる。それゆえ特定の実施形態において、約50%を超える先行技術のマーカの信頼性よりも高い信頼性で、膀胱の炎症疾患または癌の検出を可能にするマーカが、提供される。別の実施形態において、約70%を超える信頼性、別の実施形態において約73%を超える信頼性、更に別の実施形態において約80%を超える信頼性、更に別の実施形態において約90%を超える信頼性、更に別の実施形態において約95%を超える信頼性、更に別の実施形態において約98%を超える信頼性、特定の実施形態において約100%の信頼性を有するマーカが提供される。
【0048】
本発明の実践は、他に断りがなければ、当業者の範囲内の分子生物学(組換え技術を含む)、微生物学、細胞生物学、および生化学の従来技術を用いる。そのような技術は、例えば、Molecular Cloning: A Laboratory Manual, 2nd edition, Sambrook et al., 1989; Oligonucleotide Synthesis, MJ Gait, ed., 1984; Animal Cell Culture, R.I. Freshney, ed., 1987; Methods in Enzymology, Academic Press, Inc.; Handbook of Experimental Immunology, 4th edition, D .M. Weir & CC. Blackwell, eds., Blackwell Science Inc., 1987; Gene Transfer Vectors for Mammalian Cells, J.M. Miller & M.P. Calos, eds., 1987; Current Protocols in Molecular Biology, F.M. Ausubel et al., eds., 1987;および PCR: The Polymerase Chain Reaction, Mullis et al., eds., 1994などの文献に完全に説明されている。
【0049】
先の用語が蛋白質、DNA配列および/またはRNA配列を指す場合があることが、理解されなければならない。同じく先の用語が本明細書に示された相同配列を有する非ヒト蛋白質、DNAおよび/またはRNAを指すことも、理解されなければならない。
【0050】
本発明の実施形態の説明
遺伝子マーカは、患者の疾患を検出する診断ツールとして用いることができる。マーカは、例えば疾患組織と対応する非疾患組織の間で差次的に発現することができる。この状況において、差次的発現の検出は、疾患の存在に関連する。あるいはマーカは、疾患組織内に生じた変化、または疾患から生じた変化に直接関連し得る。炎症疾患は、好中球の増加に関連する。好中球マーカインターロイキン8受容体B(IL8Rb)(ケモカイン(C−X−Cモチーフ)受容体2[CXCR2]としても公知)(
図1、配列番号1および2)が、試料中の好中球の存在についての良好なマーカをもたらし、それゆえ試料中の炎症疾患の検出、特に膀胱の炎症疾患の検出についての診断マーカとして用いられ得ることが、見出された。
【0051】
図5に示される通り、尿中のIL8Rbの蓄積は、膀胱の炎症疾患の存在を示している。具体的に
図5に、良性前立腺肥大、尿路感染、非特異的前立腺疾患、血管性前立腺、およびワルファリン使用の続発症などの状態を有する患者の尿中のIL8Rb蓄積を示す。しかし、IL8Rbの使用が、これらの疾患の検出のみに限定されないこと、およびIL8Rbが膀胱の炎症疾患を有する患者の試料中で増加することをこれらの例が示しているということは、理解されよう。即ち、IL8Rbは、膀胱疾患に関連する炎症のマーカとして用いることができ、それゆえ炎症に関連する任意の状態を検出する際の使用に適している。それゆえIL8Rbの量の検出は、膀胱の炎症疾患のマーカとして用いることができる。より特別にはIL8Rbは、好中球の蓄積に関連する膀胱の炎症疾患を検出するのに用いることができる。
【0052】
膀胱の移行上皮癌(TCC)用の尿検査は、尿中の剥離された腫瘍細胞中のマーカの存在に大きく依存する。これらの細胞を検出する能力は、多量の混入細胞、例えば血液および炎症細胞などの存在により遮られる可能性がある。その上、膀胱内層の炎症は、粘膜からの非悪性細胞の剥離増加をもたらす可能性がある。その結果、膀胱移行細胞から得られたマーカを使用する尿検査は、膀胱炎、尿路感染、または尿路感染もしくは移行細胞剥離をもたらす他の状態、例えば尿管結石の患者から採取された尿試料により偽陽性結果を示す可能性がより高くなる(Sanchez-Carbayo et al)。
【0053】
そのような偽陽性結果の回避を試みる一方法は、血液または炎症細胞における相対発現の低いマーカを選択することであった。そのようなマーカを使用すれば、非悪性炎症状態を示すTCC患者の偽陽性が少なくなる。しかし、血液学的に得られた細胞においてマーカの発現が低いと、非悪性移行細胞の剥離率上昇を補てんすることができない。
【0054】
膀胱癌の尿検査の精度に及ぼす、炎症組織から剥離した移行細胞の負の影響は、尿管の炎症状態を有する患者の同定を改善することにより最小にすることができる。意外にも、1種以上の膀胱腫瘍マーカ(BTM)と組合わせたマーカIL8Rbの使用が、膀胱癌のより正確な検出を提供することが、ここに発見された。特にマーカIL8Rbを含む膀胱癌のマーカに基づく検査は、炎症性非癌状態に罹患した患者との結果になり得る偽陽性の結果を生じにくい。
【0055】
一般に炎症状態の有無は、遺伝子発現の閾値を有することにより確定され、それを超えたIL8Rbの発現は、炎症状態を示している。例えば特定の閾値を超えるIL8Rbの発現は、患者が炎症状態を有するという診断になる。IL8Rbが、膀胱癌の存在について予測する1種以上のマーカと協同して用いられる場合、高発現の膀胱腫瘍マーカ(1種または複数)、および特定の閾値を超えるIL8Rbの発現の存在は、炎症状態を有し癌を有さない患者を予測させる。更に検査が患者からの尿でプリフォームされている場合、この結果は、炎症性膀胱状態を有する患者を予測させる。高レベルの膀胱腫瘍マーカは、最も可能性が高いのは炎症の結果、非悪性細胞が粘膜から生じたとの結果である。つまり患者は、高レベルの膀胱腫瘍マーカ(1種または複数)を有するが、実際には膀胱癌を有さず、つまり偽陽性になる。
【0056】
あるいは患者が、高レベルまたは診断レベルの1種以上の膀胱腫瘍マーカを有するが、IL8Rbのレベルが、閾値未満である場合、これは患者が癌、特に膀胱癌を有する可能性が高い、という診断である。このことは、検査が患者の尿でプリフォームされている場合に、特にあてはまる。患者が癌を有することを確証することができ、処置を直ちに開始することができ、偽陽性結果を与える炎症状態を実際に誘発する懸念がないため、この結果は、健康提供者にとって著しく有益である。
【0057】
意外にも、好中球マーカインターロイキン8受容体B(IL8Rb)をコードする遺伝子からのRNAの定量が、公知のTCCまたはBTMマーカを用いて、TCCを有する患者の検出の全体的性能を改善することが示された。IL8Rb(ケモカイン(C−X−Cモチーフ)受容体2[CXCR2]としても公知)の参照配列は、
図1ならびに配列番号1および2に示される。TCCの検出におけるIL8Rbの役割に加えて、IL8Rbが炎症疾患の診断を支援する尿マーカとして用いられ得るかを模索した(
図5)。
【0058】
IL8Rbマーカの新規な使用は、遺伝子発現レベルを検出する公知方法を用いた、膀胱の炎症状態の検出のための単離に用いることができる。遺伝子発現を検出する方法の例を、以下に概説する。
【0059】
あるいはIL8Rbは、1種以上のBTMと組合わせて、膀胱癌を検出することができる。新規な炎症疾患マーカIL8Rbを膀胱癌の検査の一部として用いることにより、偽陽性結果の発生に及ぼす炎症組織の影響が、非常に低くなる。マーカIL8Rbは、任意の膀胱癌マーカに関連して用いることができ、あるいは2種以上のマーカと共に膀胱癌を検出するシグネチャの一部として用いることができる。
【0060】
IL8Rbが膀胱癌の検出を改善する作用は、非悪性状態を、膀胱癌を有する患者と分別する能力から得られる。IL8Rbの増加は試料中好中球の存在増加を示すため、このことが実現される。それゆえIL8Rbの能力は、用いられる膀胱腫瘍マーカに依存しない。
図2および
図12〜15に示される通り、IL8Rbは、様々な膀胱腫瘍マーカおよび複数の膀胱腫瘍マーカと組合わせると、マーカ(1種または複数)の能力が対象における癌を検出する特異度を上昇させるという一般的効果を有する。
【0061】
膀胱癌を検出し得る任意のマーカが、IL8Rbと組合わせた使用に適することは、理解されよう。TCCの検出においてIL8Rbとの組合わせでの使用に適した公知BTMの例が、
図6および7に概説される。具体的には
図6は、膀胱癌において過剰発現されることが公知のマーカを概説しており、
図7は、膀胱癌において過小発現されることが公知の複数のマーカを概説する。本発明のマーカIL8Rbの新規な使用は、
図6または
図7のマーカの任意の1種以上と組合わせて、あるいは
図6または7から選択される2種以上のマーカを含むシグネチャと組合わせて用いることができる。
【0062】
本発明によるシグネチャの一例は、MDK、CDC2、IGFBP5およびHOXA13と組合わせたIL8Rbの使用であり、それは、膀胱癌を検出するのに適した1種以上の他のマーカ、例えば
図6または
図7に概説されたマーカの任意の1種以上との組合せであってもよい。
図14および15に示された通り、IL8Rbは、マーカの任意の組合わせ、具体的には組合わせ:IL8Rb/MDK、IL8Rb/CDC2、IL8Rb/HOXA13、IL8Rb/IGFBP5、IL8Rb/MDK/CDC2、IL8Rb/MDK/HOXA13、IL8Rb/MDK/IGFBP5、IL8Rb/CDC2/HOXA13、IL8Rb/CDC2/IGFBP5、IL8Rb/HOXA13/IGFBP5、IL8Rb/MDK/CDC2/HOXA13、IL8Rb/MDK/CDC2/IGFBP5、IL8Rb/CDC2/HOXA13/IGFBP5、およびIL8Rb/MDK/CDC2/HOXA13/IGFBPにおいて用いることができる。
図14および15に示された通り、IL8Rbを含むと、マーカまたはマーカの組合わせの能力が向上し、対象における膀胱癌が正確に診断された。本発明は、これらの具体的組合わせに限定されず、膀胱癌を検出するのに適した1種以上の更なるマーカ、例えば
図6または
図7に概説されたマーカの任意の1種以上を、場合により含むことができる。
【表1】
【0063】
図2〜4および12〜17は、IL8Rbを膀胱癌の公知の代表的マーカ4種MDK、CDC2、IGFBP5およびHOXA13と組合わせて用いることの影響を示す。結果から、IL8Rbが各マーカ(
図2、14および15〜17)と個別で、そして4種のBMTの全ての可能な組合わせで用いられる場合に、シグネチャとして使用に組入れることにより、TCC患者の試料と非悪性状態の患者の試料を分別する能力が改善される。
【0064】
より具体的には、
図10〜13に示された通り、IL8Rbを4種のマーカMDK、CDC2、IGFBP5およびHOXA13と一緒に含めると(uRNA-D)、4種のマーカ単独に比較して検査の全体的性能が上昇しただけでなく、他の公知検査:NMP22(登録商標)ELISA(米国マサチューセッツ州のMatritech, Inc.の登録商標)、NMP22 BladderChek(登録商標)(米国マサチューセッツ州のMatritech, Inc.の登録商標)、および細胞診に比較しても極めて好適であった。
図14〜17に、4種のマーカMDK、CDC2、IGFBP5およびHOXA13の様々な組合わせにおけるIL8Rbの影響も示す。
【0065】
具体的には
図14は、5種の異なる分類器モデル、(i)線形判別分析(LDA)、(ii)ロジスティック回帰(LogReg)、(iii)サポートベクターマシン(SVM)、(iv)k最近接5近傍法(KN5N)、(v)および分割木の分類器(TREE)を用いて計算された、IL8Rbを含む、または含まない4種のマーカMDK、CDC2、IGFBP5およびHOXA13の組合わせ全てのROC曲線を示す。
図5は、5種の分類器全て、およびIL8Rbを含む、または含まない4種のバイオマーカの15種の組合わせ全ての曲線下面積(AUC)を表化している。このAUCの計算は、偽陽性率0%〜偽陽性率20%の領域に制限され、有用な特異度範囲(80〜100%)を含む。AUCは、
図14のROC曲線における視覚的差を定量するものである。
図16は、(a)80%、(b)85%、(c)90%、(d)95%、および(e)98%の特異度でIL8Rbを含み、または含まずに測定された4種のマーカの全ての組合わせの感度を示す。
図17は、(a、f)80%、(b、g)85%、(c、h)90%、(d、l)95%、および(e、j)98%の固定された特異度での感度(ROC曲線では垂直方向;上になる程良好)または特異度(ROC曲線では垂直方向;左になる程良好)の変化を表化している。
【0066】
これらの表は、IL8Rbが一般に、バイオマーカ(MDK、CDC2、IGFBP5およびHOXA13)の能力を単独で、または組合せることにより改善して、腫瘍と正常な試料とを分類することを示している。
【0067】
これらの結果から、一般に、IL8Rbが精度を向上させることができ、検査により膀胱癌を検出し得ることが示される。最大の増分は、IL8Rbを含まずに良好に働かなかったいずれかのマーカ、または良好に働かなかった分類器で認められた。より小さい増分は、IL8Rbを添加する前に十分にプリフォームしたマーカおよび/または分類器で認められ、それゆえ改善の余地はあまりなかった。その結果が、母集団に基づく分析であり、IL8Rbを組入れることの利益が、個々の患者を診断する場合、特にBMTマーカの発現での診断が不明瞭となり得る患者を診断する場合により大きくなり得ることに留意することが重要である。
【0068】
これらの結果から、IL8Rbが、膀胱の炎症疾患に用いられ得るだけでなく、膀胱癌のマーカと組合わせて用いられる場合にも、膀胱癌の検出を改善し、「偽陽性」結果の減少を生じることが示される。
【0069】
これらの結果から、様々なマーカ組の全体的性能に影響を及ぼすことにおけるIL8Rbの有用性が示され、1種以上の膀胱癌マーカの性能を改善して患者の癌を正確に検出するIL8Rbの能力が確認される。更に
図14および15には、同様の結果が一定範囲の分類器モデルを利用して実現され得ることが示され、その結果が分類器モデルまたはアルゴリズムに依存せず、むしろ用いられたマーカの組合わせに依存することが示される。これらの結果から、任意の適切な分類器モデルまたはアルゴリズムが本発明において用いられ得ることが、確認される。特に
図14および15には、IL8Rbが高い特異度で、特に最も臨床的に適用可能な範囲内で、より大きな影響を有することが示される。
【0070】
本発明は、尿中のポリヌクレオチドまたは蛋白質レベルでの高レベルのIL8Rbの検出が、炎症性膀胱疾患を示すという知見に基づく。これは、対象における炎症性膀胱疾患を確定するための診断ツールとして単独で用いることができるが、真陽性結果(即ち、陽性と検査され、膀胱癌を有する対象)を偽陽性結果(即ち、膀胱癌については陽性と検査されたが実際には炎症性膀胱疾患を有する対象)と識別させて検査の特異度を上昇させるために、膀胱癌の検査と組合わせて用いることも可能である。
【0071】
該方法は、尿を表すであろう身体の任意の適切な試料で実施することができるが、理想的にはIL8Rbのレベル、および任意の更なる癌マーカのレベルが、尿試料から直接確定される。
【0072】
身体試料におけるマーカの検出
複数の実施形態において、癌のアッセイは、所望なら血液、血漿、血清、例えば腹腔洗浄を用いて得られる腹腔液、または他の体液、例えば尿、リンパ、脳脊髄液、胃液または糞便試料、から得られる試料で実施することができる。膀胱の炎症状態または膀胱癌の検出については、検査は、理想的には尿試料でプリフォームされる。
【0073】
具体的には、炎症性膀胱疾患または膀胱癌を検出するための本発明の方法は、尿を示すであろう身体の任意の適切な試料で実施することができるが、理想的にはIL8Rbおよび任意の更なるマーカが、尿試料から直接確定される。
【0074】
検査は、尿試料で直接プリフォームすることができ、あるいは試料中のRNAおよび/もしく蛋白質を安定化させてそれらの分解を防ぎ、後日に分析し得るように、またはRNAおよび/もしくは蛋白質が分析時に確実に安定化されているように、試料が当該技術分野で公知の任意の適切な化合物または緩衝液の添加により安定化されてもよい。
【0075】
対象の尿中の蛋白質および/もしくはRNAレベルの決定は、直接尿でプリフォームすることができ、または尿を処理してRNAおよび/もしくは蛋白質を更に精製および/もしくは濃縮することができる。蛋白質および/またはRNAを抽出および/または濃縮する多くの方法は、当該技術分野で周知であり、本発明において用いることができる。
【0076】
特定の対象が、IL8Rbの差次的発現、および必要に応じて任意の更なる癌マーカを有するかを確定するために、IL8RbのRNAおよび/または蛋白質のいずれか、そして場合により1種以上の癌マーカのレベルを、試料中で測定することができる。多くの方法が、特定の遺伝子のレベルを、そのRNAおよび/または蛋白質レベルのいずれかで確定するために当該技術分野で周知であり、任意の適切な方法が、本発明において用いられ得ることは、理解されよう。幾つかの一般的方法を以下に概説するが、本発明はこれらの方法に限定されず、蛋白質および/またはRNAレベルを定量する任意の方法が、本発明に適する。
【0077】
遺伝子マーカを用いた疾患および癌を検出する一般的アプローチ
発現レベルを決定する一般的方法論を以下に概説するが、発現レベルを決定するための任意の方法が適することは、理解されよう。
【0078】
定量的PCR(qPCR)
定量的PCR(qPCR)は、腫瘍試料で、血清および血漿試料で、特異的プライマーおよびプローブを用いて実施することができる。制御された反応において、PCR反応(Sambrook, J., E Fritsch, E. and T Maniatis, Molecular Cloning: A Laboratory Manual 3
rd. Cold Spring Harbor Laboratory Press: Cold Spring Harbor (2001))で形成された産物の量は、開始時点のテンプレートの量と相関する。PCR産物の定量は、PCR反応を、それが対数期にある時に、試薬が微量になる前に停止させることにより、実施することができる。その後、PCR産物は、アガロースまたはポリアクリルアミドゲルで電気泳動され、臭化エチジウムまたはそれに匹敵するDNA染色剤で染色されて、染色強度をデンシトメトリーにより測定される。あるいはPCR反応の進行を、リアルタイムで産物蓄積を測定するApplied BiosystemsのPrism7000(商標)(米国コネチカット州のApplera Corporationの商標)またはRoch LightCycler(商標)(米国カリフォルニア州のRoche Molecular Systems, Inc.の商標)などのPCR機器を用いて測定することができる。リアルタイムPCRは、合成されたPCR産物中へのDNA挿入染色剤、例えばSybr Greenの蛍光、またはクエンチャー分子から切断された時にレポーター分子によって放出された蛍光、のいずれかを測定するもので;レポーター分子およびクエンチャー分子は、オリゴヌクレオチドプローブに取り込まれ、オリゴヌクレオチドプローブは、プライマーオリゴヌクレオチドからDNA鎖が伸長した後に、標的DNA分子にハイブリダイズする。オリゴヌクレオチドプローブは、次のPCRサイクルで、Taqポリメラーゼの酵素作用により置換および分解されて、クエンチャー分子からレポーターを放出する。スコーピオンとして公知の一変形例において、プローブは、プライマーに共有結合されている。
【0079】
逆転写PCR(RT−PCR)
RT−PCRは、正常な組織および腫瘍組織において異なる試料母集団のRNAレベルを、薬物処理の有無も含めて比較して、発現パターンを特徴づけ、密接に関連するRNAを判別し、RNA構造を分析するために用いることができる。
【0080】
RT−PCRの場合、第一のステップは、標的試料からのRNAの単離である。出発原料は、典型的にはそれぞれヒトの腫瘍または腫瘍細胞株、および対応する正常組織または細胞株から単離された全RNAである。RNAは、様々な試料、例えば、乳房、肺、結腸(例えば、大腸または小腸)、結腸直腸、胃、食道、肛門、直腸、前立腺、脳、肝臓、腎臓、膵臓、脾臓、胸腺、精巣、卵巣、子宮、膀胱などの組織の腫瘍試料から、原発性腫瘍または腫瘍細胞株から、および健常なドナーのプール試料から単離することができる。RNAの供給源が、腫瘍である場合には、RNAは、例えば、冷凍または保管されたパラフィン包埋固定(例えば、ホルマリン固定)組織試料から抽出することができる。
【0081】
RT−PCRによる遺伝子発現プロファイリングの第一のステップは、RNAテンプレートをcDNAに逆転写、その後、PCR反応においてそれを指数関数的に増幅させることである。最も一般的に用いられる2種の逆転写酵素が、トリ骨髄芽球症ウイルス逆転写酵素(AMV−RT)およびモロニーマウス白血病ウイルス逆転写酵素(MMLV−RT)である。逆転写ステップは、典型的には発現プロファイリングの環境および目的に応じて、特異的プライマー、ランダムヘキサマーまたはオリゴdTプライマーを用いてプライミングされる。例えば、抽出されたRNAは、製造業者の使用説明書に従い、GeneAmp(登録商標)RNA PCRキット(米国カリフォルニア州Perkin Elmer)を用いて逆転写させることができる。その後、得られたcDNAは、次のPCR反応においてテンプレートとして用いることがきる。
【0082】
PCRステップでは、様々な熱安定性DNA依存性DNAポリメラーゼが使用され得るが、典型的には5’−3’ヌクレアーゼ活性を有し、3’−5’プルーフリーティングエンドヌクレアーゼ活性を欠くTaq DNAポリメラーゼが用いられる。つまりTaqMan(登録商標)qPCR(米国カリフォルニア州のRoche Molecular Systems, Incの登録商標)では、典型的にはTaqまたはTthポリメラーゼの5’ヌクレアーゼ活性を用いて、その標的アンプリコンに結合するハイブリダイゼーションプローブを加水分解するが、同等の5’ヌクレアーゼ活性を有する任意の酵素を用いることもできる。
【0083】
2種のオリゴヌクレオチドプライマーが、PCR反応に典型的なアンプリコンを作製するのに用いられる。第三のオリゴヌクレオチドまたはプローブは、2つのPCRプライマーの間に位置するヌクレオチド配列を検出するよう設計されている。このプローブは、Taq DNAポリメラーゼ酵素により伸長することができず、レポーター蛍光色素およびクエンチャー蛍光色素により標識されている。2種の色素がプローブ上で互いに接近している場合、レポーター色素からの任意のレーザ誘起発光が、クエンチング色素によりクエンチされる。増幅反応の間、Taq DNAポリメラーゼ酵素が、テンプレートに依存した手法でプローブを切断する。得られたプローブ断片は、溶液中で解離し、放出されたレポーター色素からのシグナルは、第2の蛍光発色団のクエンチング効果を受けない。合成される各新規分子の代わりにレポーター色素の1分子が遊離され、クエンチングされないレポーター色素の検出により、データの定量的解釈の根拠が示される。
【0084】
TaqMan(登録商標)RT-PCR(米国カリフォルニア州のRoche Molecular Systems, Incの登録商標)は、市販の設備、例えば、ABI PRISM 7700(商標)Sequence Detection System(米国コネチカット州のApplera Corporationの商標)(米国カリフォルニア州フォスターシティーのPerkin-Elmer-Applied Biosystems)、またはLightcycler(商標)(米国カリフォルニア州のRoche Molecular Systems, Incの登録商標)(ドイツ マンハイムのRoche Molecular Biochemicals)を用いて実施することができる。好ましい実施形態において、5’ヌクレアーゼ手順は、リアルタイム定量PCR装置、例えばABI PRISM 7700(商標)(米国コネチカット州のApplera Corporationの商標)Sequence Detection System で行われる。このシステムは、サーモサイクラー、レーザ、電荷結合素子(CCD)、カメラおよびコンピュータからなる。このシステムは、サーモサイクラー上の96ウェルフォーマットにおいて試料を増幅する。増幅の際、レーザ誘起蛍光シグナルが、96ウェル全てで光ファイバーケーブルを介してリアルタイムで収集され、CCDで検出される。このシステムは、その機器を運転し、データを分析するためのソフトウェアを含む。
【0085】
5’ヌクレアーゼアッセイのデータは、最初は、Cpまたは閾値サイクルとして表わされる。先に議論された通り、蛍光値は、各サイクル中に記録され、増幅反応においてその時点までに増幅された産物の量を表す。蛍光シグナルが統計的に有意であると最初に記録された時点が、閾値サイクルである。
【0086】
リアルタイム定量PCR(qRT−PCR)
RT−PCR技術のより近年の変法が、リアルタイム定量PCRであり、これは二重標識蛍光プローブ(即ち、TaqMan(登録商標)(プローブ米国カリフォルニア州のRoche Molecular Systems, Incの登録商標))によりPCR産物の蓄積を測定するものである。リアルタイムPCRは、定量競合PCRおよび定量比較PCRの両方に適合する。前者は、正常化のために、各標的配列に対する内部競合物質を用い、後者は試料中に含まれる正常化遺伝子またはRT−PCRのためのハウスキーピング遺伝子を用いる。更なる詳細は、例えば、Held et al., Genome Research 6: 986-994 (1996)により示されている。
【0087】
発現レベルは、固定パラフィン包埋組織をRNA供給源として用いて決定することができる。本発明の一態様によれば、PCRプライマーは、増幅される、遺伝子内に存在するイントロン配列に隣接するように設計されている。この実施形態において、プライマー/プローブ設計における第一のステップは、遺伝子内のイントロン配列の描写である。このことは、公的に入手可能なソフトウェア、例えばKent, W. J., Genome Res. 12 (4): 656-64 (2002)により開発されたDNA BLAT ソフトウェア、またはBLASTソフトウェアおよびその変法により行うことができる。次のステップは、PCRプライマーおよびプローブ設計の確立された方法に従う。
【0088】
プライマーおよびプローブを設計する際に、非特異的シグナルを回避するために、イントロン内の反復配列をマスキングすることが有用である。このことは、Baylor College of Medicineを介してオンラインで入手できるRepeat Maskerプログラムを用いて容易に遂行することができるが、このプログラムは、反復要素のライブラリに対してDNA配列をスクリーニングし、反復要素がマスキングされたクエリー配列に戻る。その後、このマスキングされた配列は、任意の市販された、または他の公的に入手可能なプライマー/プローブ設計パッケージ、例えば、Primer Express (Applied Biosystems); MGB assay-by-design (Applied Biosystems); Primer3 (Steve Rozen and Helen J. Skaletsky (2000)一般ユーザ用および生物学専門プログラマー用のVIMNVでのPrimer3: Krawetz S, Misener S (eds) Bioinformatics Methods and Protocols: Methods in Molecular Biology. Humana Press, Totowa, NJ, pp 365-386)を用いてプライマーおよびプローブ配列を設計するのに用いることができる。
【0089】
PCRプライマーの設計において考慮される最も重要な要素としては、プライマー長、融解温度(Tm)およびG/C含量、特異性、相補プライマー配列ならびに3’末端配列が挙げられる。一般に、最適なPCRプライマーは、概ね1730塩基長であり、G+C塩基を約20〜80%、例えば約50〜60%含有する。50〜80℃の間、例えば約50〜70℃の融解温度が、典型的には好ましい。PCRプライマーおよびプローブ設計の更なる指針については、例えば、Dieffenbach, C. W. et al., General Concepts for PCR Primer Design in: PCR Primer, A Laboratory Manual, Cold Spring Harbor Laboratory Press, New York, 1995, pp. 133-155; Innis and Gelfand, Optimization of PCRs in: PCR Protocols, A Guide to Methods and Applications, CRC Press, London, 1994, pp. 5-11; およびPlasterer, T. N. Primerselect: Primer and probe design. Methods Mol. Biol. 70: 520-527 (1997) を参照されたい(その全体の開示は、参照により本明細書に組入れられる)。
【0090】
マイクロアレイ分析
差次的発現は、マイクロアレイ技術を用いて同定または確認することもできる。つまり疾患特異性マーカの発現プロファイルは、マイクロアレイ技術を用い、新鮮な、またはパラフィン包埋された腫瘍組織のいずれかにおいて測定することができる。この方法において、該当するポリヌクレオチド配列(cDNAおよびオリゴヌクレオチドを含む)が、マイクロチップ基板上にプレーティングまたはアレイ化される。その後、アレイ化された配列(即ち、捕捉プローブ)は、該当する細胞または組織由来の特異的ポリヌクレオチド(即ち、標的)とハイブリダイズされる。RT−PCR法とまさしく同様に、RNA供給源は、典型的にはヒト腫瘍または腫瘍細胞株および対応する正常組織または細胞株から単離された全RNAである。つまりRNAは、様々な原発性腫瘍または腫瘍細胞株から単離することができる。RNA供給源が、原発性腫瘍である場合、RNAは、例えば、日々の診療において日常的に調製および保存されている、冷凍または保管されたホルマリン固定パラフィン包埋(FFPE)組織試料および固定(例えば、ホルマリン固定)組織試料から、抽出することができる。
【0091】
マイクロアレイ技術の具体的実施形態において、cDNAクローンのPCR増幅インサートが、基板に塗布される。この基板は、1、2、5、10、15、20、25、30、35、40、45、50または75ヌクレオチド配列までを含むことができる。他の態様において、この基板は、少なくとも10,000ヌクレオチド配列を含むことができる。マイクロチップ上に固定されたマイクロアレイ配列は、ストリンジェントな条件下でのハイブリダイゼーションに適している。他の実施形態として、マイクロアレイの標的は、少なくとも50、100、200、400、500、1000もしくは2000塩基長であってもよく、または50〜100、100〜200、100〜500、100〜1000、100〜2000もしくは500〜5000塩基長であってもよい。更なる実施形態として、マイクロアレイの捕捉プローブは、少なくとも10、15、20、25、50、75、80もしくは100塩基長であってもよく、または10〜15、10〜20、10〜25、10〜50、10〜75、10〜80もしくは20〜80塩基長であってもよい。
【0092】
蛍光標識されたcDNAプローブは、該当する組織から抽出されたRNAの逆転写で蛍光ヌクレオチドを取込むことにより、作製することができる。チップに塗布された標識cDNAプローブは、アレイ上のDNAの各スポットに特異的にハイブリダイズする。ストリンジェントな洗浄により、非特異的に結合したプローブを除去した後、共焦点レーザ顕微鏡検査により、または他の検出法、例えばCCDカメラにより、チップをスキャンする。アレイ化された各要素のハイブリダイゼーションを定量することにより、対応するmRNA存在量の評価が可能になる。2つのRNA供給源から作製され、二色蛍光を用いて別々に標識されたcDNAプローブは、ペアでアレイにハイブリダイズされる。つまり特異的遺伝子のそれぞれに対応する2つの供給源由来の転写産物の相対存在量が、同時に測定される。
【0093】
小規模なハイブリダイゼーションにより、多数の遺伝子の発現パターンが簡便かつ迅速に評価される。このような方法は、細胞1つあたり数コピーで発現される稀少な転写産物を検出するのに必要な感度を有し、発現レベルにおける少なくともおよそ2倍の差異を再現性よく検出することが示されている(Schena et al., Proc. Natl. Acad. Sci. USA 93 (2): 106-149 (1996))。マイクロアレイ分析は、市販の設備により、製造業者のプロトコルに従って、例えばAffymetrix GenChip 技術、Illumina マイクロアレイ技術またはIncyteのマイクロアレイ技術を用いることにより、実施することができる。遺伝子発現の大規模分析のためのマイクロアレイ法の開発により、様々な腫瘍タイプにおける癌分類および転帰予測の分子マーカについて、体系的に検索することが可能になる。
【0094】
RNAの単離、精製および増幅
mRNA抽出のための一般法は、当該技術分野で周知であり、Ausubel et al., Current Protocols of Molecular Biology, John Wiley and Sons (1997) をはじめとする分子生物学の標準的教書に開示されている。パラフィン包埋組織からのRNAの抽出方法は、例えば、Rupp and Locker, Lab Invest. 56: A67 (1987)および De Sandres et al., BioTechniques 18: 42044 (1995) に開示されている。特にRNAの単離は、商業的製造業者、たとえばQiagenからの精製キット、緩衝液セットおよびプロテアーゼを用い、製造業者の使用説明書に従って実施することができる。例えば、培養中の細胞からの全RNAは、Qiagen RNeasy(登録商標)(ドイツ ヒルデンのQiagen GmbHの登録商標)ミニカラムを用いて単離することができる。他の市販RNA単離キットとしては、MasterPure Complete DNA and RNA Purification Kit (ウィスコンシン州マディソンのEPICENTRE)およびParaffin Block RNA Isolation Kit (Ambion, Inc.)が挙げられる。組織試料からの全RNAは、RNA Stat-60 (Tel-Test)を用いて単離することができる。腫瘍から調製されたRNAは、例えば、塩化セシウム密度勾配遠心分離により単離することができる。
【0095】
mRNAの単離、精製、プライマー伸長および増幅をはじめとする、RNA供給源として固定パラフィン包埋組織を用いて遺伝子発現をプロファイリングするための代表的プロトコルのステップは、様々な発行された学術雑誌記事に示されている(例えば: T. E. Godfrey et al. J. Molec. Diagnostics 2: 84-91 (2000); K. Specht et al., Am. J. Pathol. 158: 419-29 (2001))。簡潔に述べると、代表的工程は、約10μm厚のパラフィン包埋腫瘍組織試料の切片を切出すことにより開始される。その後、RNAが抽出され、蛋白質およびDNAが除去される。RNA濃度の分析後、必要に応じてRNAの修復および/または増幅ステップを含むことができ、RNAは、遺伝子特異的プロモーターを用いて逆転写され、次にRT−PCRが行われる。最後にデータを解析して、試験された腫瘍試料において同定された特徴的な遺伝子発現パターンに基づいて、患者が利用できる最良の治療選択(1種または複数)を同定する。
【0096】
免疫組織化学およびプロテオミクス
免疫組織化学法も、本発明の増殖マーカの発現レベルを検出するのに適している。つまり抗体または抗血清、好ましくはポリクローナル抗血清、最も好ましくは各マーカに特異的なモノクローナル抗体が、発現を検出するために使用される。抗体は、例えば、放射性標識、蛍光標識、ハプテン標識、例えばビオチンまたは酵素、例えば西洋ワサビペルオキシダーゼまたはアルカリホスファターゼで、抗体自身を直接標識することにより検出することができる。あるいは、非標識一次抗体が、一次抗体に特異的な抗血清、ポリクローナル抗血清またはモノクローナル抗体を含む標識二次抗体と協同して用いられる。免疫組織化学のプロトコルおよびキットは、当該技術分野で公知であり、市販されている。
【0097】
プロテオミクスは、特定の時点において試料(例えば、組織、生物体または細胞培養)中に存在するポリペプチドを分析するのに用いることができる。特に、プロテオミクス技術は、試料中のポリペプチド発現の全体的な変化を評価するために使用することができる(発現プロテオミクスとも呼ばれる)。プロテオミクス分析は、典型的には(1)2−Dゲル電気泳動法(2−D PAGE)による試料中の個々のポリペプチドの分離;(2)例えば、質量分析法またはN末端配列決定により、ゲルから回収される個々のポリペプチドの同定、および(3)バイオインフォマティクスを用いたデータの解析、を含む。プロテオミクス法は、遺伝子発現プロファイリングの他の方法の重要な補足であり、単独で、または他の方法と組合わせて使用して、本発明の増殖マーカの産物を検出することができる。
【0098】
マーカに対して選択的な核酸プローブを用いるハイブリダイゼーション法
これらの方法は、核酸プローブを支持体へ結合させること、および適当な条件下で検査試料に由来するRNAまたはcDNAとハイブリダイズさせること、を含む(Sambrook, J., E Fritsch, E. and T Maniatis, Molecular Cloning: A Laboratory Manual 3
rd. ColdSpring HarborLaboratory Press: Cold Spring Harbor(2001))。これらの方法は、腫瘍組織または液体試料に由来するマーカに適用することができる。RNAまたはcDNA調製物は、典型的には蛍光性または放射性分子で標識されて、検出および定量化を可能にする。幾つかの適用例において、ハイブリダイズするDNAを、分岐した蛍光ラベル構造で標識して、シグナル強度を増強することができる(Nolte, F.S., Branched DNA signal amplification for direct quantitation of nucleic acid sequences in clinical specimens. Adv. Clin. Chem. 33, 201-35 (1998))。ハイブリダイズしていない標識を、0.1×SSC、0.5%SDSなどの低塩溶液中での十分な洗浄により除去した後、ゲル像の蛍光検出またはデンシトメトリーによって、ハイブリダイゼーションの量を定量する。支持体は、ナイロンまたはニトロセルロース膜などの固体であってもよく、または液体懸濁液中でハイブリダイズするミクロスフェアまたはビーズから成ってもよい。洗浄および精製が可能なように、ビーズは、磁石であってもよく(Haukanes, B-I and Kvam, C, Application of magnetic beads in bioassays. Bio/Technology 11, 60-63 (1993))、または蛍光標識してフローサイトメトリーを可能にしてもよい (例えば、 Spiro, A., Lowe, M. and Brown, D., A Bead-Based Method for Multiplexed Identification and Quantitation of DNA Sequences Using Flow Cytometry. Appl. Env. Micro. 66, 4258- 4265 (2000) 参照)。
【0099】
ハイブリダイゼーション技術の変形例が、蛍光ビーズ支持体を分岐DNAシグナル増幅と組合わせた、QuantiGene Plex(登録商標)アッセイ(米国カリフォルニア州のPanomicsの登録商標)(Genospectra, Fremont)である。ハイブリダイゼーション技術の更に別の変形例が、Quantikine(登録商標)mRNAアッセイ(ミネアポリスのR&D Systems)である。方法論は、製造業者の使用説明書に記載された通りである。簡潔に述べると、アッセイは、ジゴキシゲニンにコンジュゲートしたオリゴヌクレオチド・ハイブリダイゼーションプローブを用いる。ハイブリダイゼーションは、比色定量アッセイにおいてアルカリホスファターゼに連結された抗ジゴキシゲニン抗体を用いて検出される。
【0100】
追加の方法は当該技術分野において周知であり、本明細書に更に記載する必要はない。
【0101】
酵素免疫測定法(ELISA)
簡潔に述べると、サンドイッチELISAアッセイにおいて、マーカに対するポリクローナルまたはモノクローナル抗体を、固体支持体(Crowther, J.R. The ELISA guidebook. Humana Press: New Jersey (2000); Harlow, E. and Lane, D., Using antibodies: a laboratory manual. Cold Spring Harbor Laboratory Press: Cold Spring Harbor (1999))、または懸濁ビーズに結合させる。他の方法は当該技術分野において公知であり、本明細書で更に記述する必要はない。モノクローナル抗体は、ハイブリドーマから誘導することができ、またはファージ抗体ライブラリ(Hust M. and Dubel S., Phage display vectors for the in vitro generation of human antibody fragments. Methods MoI Biol. 295:71- 96 (2005))から選択することができる。非特異的結合部位は、非標的蛋白質調製物およびディタージェントで阻害される。その後、捕捉抗体が、抗原を含む患者の試料または組織の調製物とインキュベートされる。その混合物を洗浄した後、抗体/抗原複合体が、標的とするマーカを検出する第2の抗体とインキュベートされる。第2の抗体は、典型的には蛍光分子にコンジュゲートされるか、または酵素反応でもしくはレポーターにコンジュゲートした第3の抗体で検出することができる他のレポーター分子にコンジュゲートされる(Crowther,前出)。あるいは、直接ELISAにおいて、マーカを含有する調製物が、支持体またはビーズに結合され、標的とする抗原を抗体−レポーターコンジュゲートで直接検出することができる(Crowther,前出)。
【0102】
モノクローナル抗体およびポリクローナル抗血清を製造する方法は、当該技術分野において周知であり、本明細書に更に記述する必要はない。
【0103】
免疫検出法
この方法は、腫瘍除去手術前および後に採取した膀胱癌患者からの血清または血漿中のマーカファミリーメンバーの免疫検出法、非限定的に結腸直腸、膵臓、卵巣、メラノーマ、肝臓、食道、胃、子宮内膜、および脳をはじめとする他の癌の患者のマーカファミリーメンバーの免疫検出法、ならびに膀胱癌患者からの尿および糞便中のマーカファミリーメンバーの免疫検出法にも用いることもできる。
【0104】
疾患マーカは、他の標準免疫検出技術、例えばイムノブロッティングまたは免疫沈降を用いて組織または試料中で検出することもできる(Harlow, E. and Lane, D., Using antibodies: a laboratory manual. Cold Spring Harbor Laboratory Press: Cold Spring Harbor (1999))。イムノブロッティングでは、マーカを含有する組織または体液からの蛋白質調製物を、変性条件または非変性条件下、ポリアクリルアミドゲルで電気泳動させる。蛋白質は、その後、ナイロンなどの膜支持体に移される。マーカは、その後、免疫組織化学について記載された通り、モロクローナルまたはポリクローナル抗体と直接的または間接的に反応させる。あるいは幾つかの調製物において、蛋白質は、あらかじめ電気泳動分離を行わずに膜に直接スポットすることができる。シグナルは、デンシトメトリーによって定量することができる。
【0105】
免疫沈降では、マーカを含有する可溶性調製物を、マーカに対するモロクローナルまたはポリクローナル抗体とインキュベートする。その後、反応物をプロテインAまたはプロテインGを共有結合で付着させたアガロースまたはポリアクリルアミドで作製された不活性ビーズとインキュベートする。プロテインAまたはGのビーズは、抗体と特異的に相互作用して、ビーズに結合された抗体−マーカ−抗原の固定複合体を形成する。洗浄に続いて、結合したマーカは、イムノブロッティングまたはELISAによって検出し、定量することができる。
【0106】
診断の確定
IL8Rb、および場合により1種以上の更なる癌マーカの発現レベルが得られたら、その後、対象の診断を確定することができる。IL8Rbの発現が、炎症性膀胱疾患を有さない対象に認められる発現を超えていて、および/または炎症性膀胱疾患を有することが既知の対象の発現レベルと一致している場合、対象は、炎症性膀胱疾患を有すると診断される。あるいは発現が、炎症性膀胱疾患を有さない対象に認められる発現を超えておらず、および/または炎症性膀胱疾患を有することが既知の対象の発現レベル未満である場合、対象は、炎症性膀胱疾患でないと診断される。
【0107】
IL8Rbが、膀胱癌の1種以上のマーカと協同して用いられる状況において、IL8Rbの発現レベルは、炎症性膀胱疾患を有さない対象、および/または炎症性膀胱疾患を有することが既知の対象の発現レベルと比較される。1種以上の癌マーカを、膀胱癌を有さない対象および/または膀胱癌を有することが既知の対象の発現レベルと比較する。IL8Rbの発現レベルが、炎症性膀胱疾患を有さない対象と一致していて(炎症性膀胱疾患を有する対象未満)、1種以上の膀胱癌マーカの発現レベルが、膀胱癌を有する対象と一致している(膀胱癌を有さない対象と識別される)場合には、対象は、膀胱癌を有すると診断される。IL8Rbの発現レベルが、炎症性膀胱疾患を有さない対象よりも大きく(炎症性膀胱疾患を有する対象と一致していて)、1種以上の膀胱癌マーカの発現レベルが、膀胱癌を有する対象と一致している(膀胱癌を有さない対象と識別される)場合には、対象は、炎症性膀胱疾患を有すると診断される。IL8Rbの発現レベルが、炎症性膀胱疾患を有さない対象と一致していて(炎症性膀胱疾患を有する対象未満であり)、1種以上の膀胱癌マーカの発現レベルが、膀胱癌を有さない対象と一致している(膀胱癌を有する対象と識別される)場合には、対象は、膀胱癌および炎症性膀胱疾患のどちらも有さないと診断される。
【0108】
診断マーカの正常な発現と疾患のある発現の間で発現レベルが重複することが多いため、対象の診断を確定するために、分類の閾値を確定することが通常である。分類閾値は、対象を疾患または非疾患のカテゴリーに区別する値または閾値である。閾値は、一般に、全ての可能な閾値への特異度に対して感度をプロットした受信者動作特性(ROC)曲線を用いて評価される。
【0109】
診断閾値の決定
疾患マーカを用いた検査の場合、試料を疾患、例えば膀胱癌が陽性または陰性のいずれかとみなし得る診断閾値が、得られる。これらの診断閾値は、膀胱癌または炎症性膀胱疾患の存在について検討された患者のコホートを分析することにより決定される。診断閾値は、異なる検査適用で変動する可能性があり、例えば母集団のスクリーニングにおける検査を使用するための診断閾値は、泌尿器の兆候をほとんど有さない患者のコホートを用いて決定され、これらの診断閾値は、膀胱癌の再発に関する調査下にある患者の検査で用いられた閾値とは異なっていてもよい。診断閾値は、必要とされる臨床設定において検査特異度、即ち、過剰数の患者が偽陽性結果を受けずに合理的感度を可能にする特異度の実践レベルを提供するように選択される。この特異度は、80〜100%の範囲内であってもよい。
【0110】
診断閾値は、各マーカの遺伝子発現レベルをまとめたアルゴリズムを前向き臨床試験の各試料にあてはめることにより決定される。用いられた試料は、膀胱癌患者のものであり、非悪性泌尿器障害の範囲である。診断閾値は、所望の特異度をもたらすアルゴリズムのスコアを決定することにより選択される。例えば幾つかの適用例において、特異度85%が、望ましい。その場合、診断閾値は、膀胱癌を有さない患者の85%が癌が陰性であると正しく分類されるアルゴリズムスコアを選択することにより設定される。他の適用例(母集団スクリーニングなど)において、90%などより高い特異度が、好適である。この適用例で閾値を設定するために、膀胱癌を有さない患者の90%が癌が陰性であると正しく分類されるアルゴリズムスコアが、選択される。アルゴリズムの使用例は、実施例に概説される。
【0111】
その検査は、1つの閾値の代わりに、異なる疾患存在尤度をもたらし異なる臨床結果を関連させる、検査間隔を利用してもよい。例えば検査が、3つの間隔、つまり高い(例えば、90%の)リスクで膀胱癌の存在に関連する1つ、低リスクで膀胱癌に関連する2番目、および疾患が疑われるみなされた3番目、を有していてもよい。「疑わしい」間隔は、定義された時間間隔での反復検査の推奨と関連させることができる。
【0112】
データ解析
RNAおよび/または蛋白質の量について検査する方法が完了したら、腫瘍および正常試料に関連するバイオマーカ値の分布を決定するために、データを解析しなければならない。これは、典型的には生データを正規化すること、即ち、バックグランド「ノイズ」を除去して任意の二重測定(またはそれを超える測定)を平均すること、標準との比較、および2つの試料分類を最適に分別するカットオフまたは閾値を確定すること、を含む。多くの方法は、これを実行することが公知であり、厳密な方法は、用いられたRNAおよび/または蛋白質の量を決定する具体的方法に依存する。
【0113】
以下に示すのは、qRT−PCRを用いてデータ解析を実施し得る方法の例である。しかし、一般的工程が、RNAおよび/もしくは蛋白質の含量を確定する別の方法で用いられるのに適合し得ること、または他の方法が、当業者により確定されて同じ結果を実現し得ることは、理解されよう。
【0114】
データ
蛍光の測定は、PCRの各サイクルで、波長ω
i(i=1、2)で実行される。つまり各ウェルで、f
t(ω
i)(式中、t=1、・・・、kは、サイクル数を示し、i=1、2は、波長を指数化している)により示される一対の蛍光曲線を観察する。
【0115】
蛍光曲線は、ほぼ水平のベースラインで開始して、上の方の漸近線まで滑らかに増加するS字形状を有する。蛍光曲線が直線状ベースラインから逸脱するC
p点の位置が、標的遺伝子の濃度を特徴づけるのに用いられる。C
pの正確な定義は、後に記載される。
【0116】
以下の事柄は、これらのデータを処理するスキームの例である。
・周波数帯域の間の蛍光重複を補正する
・C
pを推定するために各蛍光曲線のスムーズモデルを推定する
・多重測定されたウェルからデータを集める
・標準曲線を推定する
・濃度を標準に関して計算する
各生体試料は、遺伝子5つの相対濃度を生じ、それが判別関数へのインプットとなる。
【0117】
色補正
W
tj(ω)により、サイクルtおよび周波数ωでの色素jの蛍光レベルを示す。多重アッセイにおいて、任意の周波数ωで測定された応答は、その周波数での色素全てによる寄与の合計であり、そのため各サイクルで
f
t(ω)=W
t1(ω)+W
t2(ω)+・・・
【0118】
色補正の目的は、観察された混合物f
t(ω)から個々の寄与W
tj(ω)を抽出することである。
【0119】
理想的状況において、周波数ωでの色素jによる蛍光W
tj(ω
0)は、蛍光W
tj(ω
0)のレベルにかかわらず、参照周波数ω
0での蛍光W
tj(ω
0)に比例する。これは、決定されるべき幾つかの比例定数A
12およびA
21について、直線関係
【数1】
を示唆している。実際に、このシステムにおいて線形項を導入することにより効果的にモデル化される追加の作用があり、つまり
【数2】
となる。
【0120】
「色補正」パラメータA
12およびA
21を推定した後、直線ベースラインによってひずむとしても、蛍光W
t1(ω
1)および蛍光W
t2(ω
2)を行列乗算:
【数3】
により回収することができる。
【0121】
W
t1(ω
1)およびW
t2(ω
2)は、「色補正」データと呼ばれる。この式の最後の項における直線ひずみ
【数4】
は、2未満の色補正データについてのモデルを推定した場合のベースライン推定に適応される。それは、C
pの推定への影響を有さない。
【0122】
色補正係数の推定には、1つの(二重測定とは異なる)プローブを用いた別のアッセイが必要となる。そのため蛍光W
t2(ω
2)=0により、
【数5】
【0124】
ここで係数A
21は、f
t(ω
1)およびPCRサイクルt(t=1、・・・、k)でf
t(ω
2)となる通常の線形回帰により推定することができる。
【0125】
モデル推定
この節では、y
t(t=1、・・・、kは、色補正された蛍光曲線を示す)を行う。
【0126】
増幅
モデルは、大幅な増幅を示す蛍光曲線についての推定に過ぎない。本発明人は、用語「増幅」を、色補正された蛍光曲線の直線ベースラインからの大幅な逸脱と定義する。増幅を定量するために、シグナルノイズ比(SNR)を使用する。本明細書におけるSNRは、ノイズ分散に対するシグナル分散の比と定義される。ノイズ分散は、アッセイ手順の較正の一部として設定され不変のままであり、このために増幅を全く有し得ないウェル、即ちRNAを含まないウェルからのベースラインの直線モデルから得られた剰余分散を使用する。各蛍光曲線では、シグナル分散を最良適合直線(ここでの「最良」は最少二乗法での意味である)からの剰余分散として推定する。
・SNRが指定された閾値未満である場合、蛍光曲線は直線に近くなり、増幅は全く存在しない。そのため、ベースラインからの逸脱点はなく、試料中の濃度が0として明示されてもよい。
・SNRが閾値を超えている場合、増幅が存在し、濃度を推定することができる。
【0127】
(大きさのない)SNRでの閾値は、「増幅」曲線と「非増幅」曲線の間で明白な識別を示すように選択される。例えば以下の閾値範囲は、マーカにとって効果的である。
【表2】
【0128】
モデル
各蛍光曲線のS字曲線モデルを推定する。モデルの任意の適切なパラメトリック形態を用いることができるが、以下の特色をモデル化することができなければならない:
・0でない勾配を有し得る直線ベースライン
・中点を中心として対称
・より低いレベルおよびより高いレベルで漸近線
・ベースラインから高い方の漸近線まで滑らかに増加する
【0129】
これらの要件を実現するモデルの例が、
【数7】
である。
【0130】
本発明人は、これを「6PLモデル」と呼ぶ。パラメータベクトルθ=[A,A
s,D,B,E,F]は、以下の制約を受けることで、g
t(θ)が確実にtの増加関数になり、蛍光曲線の経験的性質を有する。
D>0、B>0、E<0、F<0
【0131】
他の2つのパラメータは、ベースラインA+A
stを決定し、Aは常に正の数であり、勾配パラメータA
sは常に小さいが、これらのパラメータは、明白な制約を必要としない。
【0132】
パラメータDは、ベースラインを超える増幅レベルを決定する。残りのパラメータB、E、Fは、それ自体に固有の解釈を有さず、曲線の形状を制御する。これらのパラメータは、C
pの推定に影響を及ぼすパラメータに過ぎない。A
s=0である場合に、これは、5パラメータロジスティック関数(5PL)として公知であり、加えてF=1である場合には、このモデルは、4パラメータロジスティックモデル(4PL)に減少する(Gottschalk and Dunn (2005), Spiess et al. (2008))。
【0133】
初期化
非線形推定での初期値は、以下の通り設定される。
・A
s=0、F=1
・A=平均(y、・・・、y
5)
・D=範囲(y
1、・・・、yk)
・B=高さの半分に対応するサイクル
・Eは、残りのパラメータの値を先に定義された初期値に設定してg
t(θ)を直線形態に変換することにより、初期化される。直線化により、
【数8】
が得られる。ここで
【数9】
になるように選択されたtについて、
【数10】
での
【数11】
の回帰により、Eを推定する。
【0134】
ほぼ同一の解析に導く(自身の初期化を含む)このモデルの別の形態が、
【数12】
である。As=0である場合には、これは、リチャード式(Richards (1959))として知られる場合もある。
【0135】
推定の基準
パラメータを推定して、二乗基準の罰則付き合計を最小化する。
【数13】
【0136】
ここでのλ(θ)は、θ内のパラメータの幾つか(または全て)の大きな値に罰則をつける非負の関数である。この方法は、正則化またはリッジ回帰として公知であり(Hoerl, 1962)、パラメータベクトルθの適切な事前分布を設定することにより、ベイジアンの立場から得ることができる。罰則にとって十分となる選択は、
【数14】
である。
【0137】
大きなλ値は、パラメータ推定を0方向に偏らせ、パラメータ推定の分散を低減する。逆に小さな(または0の)λは、最小化アルゴリズムにおいて不安定なパラメータ推定および収束困難をもたらす。λの選択とは、偏向と分散または安定性の間で妥協することである。経験的証拠から、ラムダが範囲:
0.01>λ>0.0001
内で選択されれば、偏向と分散の間の十分な妥協が実現され得ることが示される。この選択は、最適化アルゴリズムの収束も確実にする。
【0138】
アルゴリズムの選択
先の範囲内のラムダの任意選択に関して、先の段落における記載は、パラメータ推定を完全に定義している。古典的なガウス・ニュートン法に基づく非線形最少二乗法(More, 1978において提供されたレーベンバーグ・マーカートアルゴリズムなど)は、使用に成功しており、適切なアプローチである。Nelder and Mead, 1965などの一般的目的での最適化アルゴリズム、またはByrd, et al., 1995により提供されたブロイデン・フレッチャーアルゴリズムも、これに関連して試行に成功した。
【0139】
C
p推定
C
pは、第二の導函数g
t(θ)を最大にするポイントtである。各蛍光曲線により、標的遺伝子の濃度を特徴づけるC
pが得られる。
【0140】
技術的反復の各組について推定C
pの平均が計算され、次の解析において用いられる。
【0141】
1.標準曲線
絶対または相対濃度は、同じPCRプレートで標準曲線と比較することから得られる。
【0142】
線形モデル
C
p=R+Slog
10Conc
(式中、Concは、標準物質の絶対または相対濃度である)を用いて希釈系列をモデル化する。切片および勾配パラメータは、プレート特異性である。母集団モデル
【数15】
(式中、パラメータ
【数16】
は、以下に記載される事前データに基づいて設定される)を設定することにより、切片および勾配パラメータのプレート間変動をモデル化する。その後、所定のプレートごとに、RおよびSを、これらの母集団からの観察として解釈することができる。
【0143】
濃度Conc
jでの標準物質の反復jに関して、以下のモデルを用いることができる
【数17】
【数18】
残差の分散が、C
pに依存することに留意されたい。
【数19】
の経験的推定を、表2に示す。尤度関数を最大にすることにより、用いるパラメータRおよびSを推定する。
【数20】
により、PCRプロセスの効率に関して、勾配パラメータを解釈する。
【0144】
このモデルは、ベイジアンの解釈を有する。パラメータ
【数21】
に漠然とした(非情報性の)事前分布を与える。その後、RおよびSの母集団モデル、ならびにC
p(i,j)の母集団モデルにより、事前データの確率モデルが完全に決定される。マルコフ連鎖モンテカルロ(MCMC)アルゴリズム(Lunn et al., 2009)により、
【数22】
の推定が可能になる。事前分布が省略される場合、伝統的な頻度論者的解釈が得られる。この推定手順に従えば、表3における遺伝子依存的母集団パラメータ推定を得ることが可能である。
【表3】
【表4】
【0145】
標準曲線の切片および勾配の推定は、
【数23】
および
【数24】
により示される。
【0146】
2.相対濃度ΔC
p
標準曲線を利用して、濃度Conc
REFでのC
p(REF)を
【数25】
から計算する。
【0147】
試料の相対濃度は、
【数26】
により示される。
【0148】
あるいは
【数27】
は、PCR効率2に対応する固定レベルで近似させてもよい。そのため
【数28】
いずれかの選択では、同じ記号ΔC
pを使用する。得られたΔC
p推定(各遺伝子ごとに1つ)は、次のステップにおける判別関数へのインプットである。
【0149】
3.判別関数
ΔC
p値は、相対的バイオマーカ値に対応し、プレート間変動は除去されている。互いに比較した5つのΔC
p値の検査により(例えば、
図2)、腫瘍試料が典型的に非腫瘍試料とどれ程異なるバイオマーカ値を有するかが示される。更に、腫瘍の領域と正常の領域の間に重複が存在するが、多くの試料は、効率的に十分分別される。これらの環境下で、多くの異なる統計学的分類器を用いて、腫瘍試料から正常試料を分別することができる。本発明人は、本明細書において、複数の分類器の標本で作業を進めて、これらの試料を分別することを示している。本発明人は、5種の異なる分類法:1)線形判別分析(LDA)、2)ロジスティック回帰(LogReg)、3)サポートベクターマシン(SVM)、4)5個の近傍のオブジェクトに基づくk最近接近傍法(KNN)、および5)分割木の分類器(TREE)(引例:Venables & Ripley and Dalgaard)を用いた。
【0150】
分類器の作成には、多数の標本でバイオマーカ値を含むデータセットが必要であり、その標本が分類器により検定される最終的な母集団を代表していなければならない。例えば分類器がリスクのある母集団(例えば、50歳以上、喫煙者)をスクリーニングするのに用いられることになっていれば、分類器を作成するのに必要となるデータセット(「トレーニングセット」と呼ばれる)は、その母集団を反映していなければならず、50歳を超える喫煙者の試料のみを含まなければならない。典型的には、感度および特異度の様なパラメータについて10%未満の誤差の測定精度を得るために、トレーニングセットは、300を超える試料を必要とする。
【0151】
分類器の有効性の推定は、交差確認を利用して実施することができる。交差確認(ウィキペディア:交差確認)において、データセットは、少数で(典型的には3〜10)同サイズの区画に分別される。1つの区分が取り出されて、残りの区分が分類器の構築に用いられ、その後、取り出された区分が新しい分類器によって検定されて、その予測が記録される。これは、各区分ごとに順次実施され、予測の全てをひとまとめにして分析し、分類器の特性、つまり感度、特異度などを計算する。データを10の部分に分別することにより交差検証が実施される場合には、それは、10重交差確認と呼ばれ、同様に3つの部分は、3重交差確認となる。データが多くの分類として分割されて、複数の標本が存在する場合、これは、「1つ抜き交差確認」と呼ばれる。分類器を構築するのに用いられていないデータを検定することにより、この方法は、更なる試料の非存在下での分類器性能の推定を提供する。
【0152】
本発明人は、この文書内の他の部分(実施例1)に記載された臨床試験データセットを利用し、IL8Rbバイオマーカを含むもの、および含まないもので4種のバイオマーカMDK、IGFBP5、CDC2、およびHOXA13の15の組合わせ全てを用いて、分類器を構築し、10重交差確認を用いてそれらの30の分類器を検定した。これは、先に列挙された5タイプの分類器それぞれで実施され、ROC曲線が計算された。全ての作業が、R統計プログラミング環境(CITE)を用いて実施された。これらの結果(
図14)から、ほとんどの例において、IL8Rbを含む分類器が、診断的に有用な特異度の値についてより感度があることが示される(偽陽性率0〜20%;特異度100〜80%)。特異度の診断有用性を含む領域での曲線下面積(AUC)は、分類器がどれ程良好に働くかを定量するのに用いられ、大きな値ほどより良好な分類器性能を示している。
図15aは、各分類器とバイオマーカの組み合わせによるAUCを表化しており、15bは、IL8Rbが添加された場合の各条件のAUC増加量を示している。ほとんどの例において、IL8Rbの添加は、正確な診断を行う能力を改善する。診断的に有用な特異度値での特異的感度値を、表16において分類器全てについて表化している。加えて、
図17は、IL8Rbの添加が行われた場合の感度または特異度の増分量を表化している。
【0153】
分類器を作成してそれを検定した後、新しい標本を検定するのに用いられた場合に、分類器の有用性が生じる。結果の解釈を単純化するために、カットオフスコアまたは閾値が確定され、カットオフの片側の試料は、腫瘍について陽性とみなされ、もう一方の側の試料は、陰性とみなされる。例えば結果の確信度増加を示すために、更なるカットオフが確定されてもよい。この場合、本発明人は、トレーニングセットにおける偽陽性率15%を与えるカットオフを確定した。交差確認されたROC曲線を用いれば、その後、感度を推定することができる。典型的には、陽性の予測値75%でのカットオフも確定する。これらのカットオフを用いるために、本発明人は、85%特異度により確定されたカットオフよりも小さいスコアでの「陰性」結果を確定する。75%PPVを超えるスコアを、「陽性」と呼び、2つの間のスコアを、「不確定」または「疑いあり」と呼ぶ。
【0154】
IL8Rbマーカへの抗体
追加の態様において、本発明は、IL8Rbに対する抗体の製造を含む。マーカIL8Rbは、免疫反応の誘発に適するのに十分な量で製造することができる。幾つかの例において、全長IL8Rbを用いることができ、他では、IL8Rbのペプチド断片が、免疫原として十分となり得る。免疫原は、適切な宿主(例えば、マウス、ウサギなど)に注射することができ、所望ならアジュバント、例えばフロイント完全アジュバントまたはフロイント不完全アジュバントを注射して、免疫反応を増強させることができる。抗体の作製が、免疫の技術分野で日常的なもので、本明細書において更に記載する必要がないことは、理解されよう。その結果、IL8Rbに対して、モノクローナルまたはファージディスプレイ抗体をはじめとする抗体を製造することができる。
【0155】
更なる実施形態において、抗体は、本明細書において同定された腫瘍マーカの蛋白質もしくは蛋白質コアに対して、またはIL8Rbに独特のオリゴヌクレオチド配列に対して作製することができる。特定の蛋白質は、グリコシル化することができるが、グリコシル化のパターンの変動は、特定の環境において、通常のグリコシル化パターンを欠くIL8Rbの形態を誤検出してしまう。こうして本発明の特定の態様において、IL8Rbの免疫原は、脱グリコシル化IL8Rbまたは脱グリコシル化IL8Rb断片を含むことができる。脱グリコシル化は、当該技術分野で公知の1種以上のグリコシダーゼを用いて遂行することができる。あるいはIL8RbのcDNAを、グリコシル化欠損細胞株、例えば大腸菌などをはじめとする原核細胞株において発現させることができる。
【0156】
内部にIL8Rbをコード化したオリゴヌクレオチドを有するベクターを、作製することができる。そのようなベクターの多くは、当該技術分野で公知の標準的ベクターに基づくことができる。ベクターを用いて、様々な細胞株をトランスフェクトして、IL8Rbを生成する細胞株を製造することができ、それを用いて、特異的抗体または他の試薬の開発のため、IL8Rbを検出するため、または開発されたIL8Rb用アッセイを標準化するために、所望の量のIL8Rbを製造することができる。
【0157】
キット
本発明の発見に基づき、複数のタイプの検査キットを企図および製造することができる。第一に、検出分子(または「捕捉試薬」)を前負荷された検出装置を有するキットを、作製することができる。IL8Rb mRNAの検出の実施形態において、そのような装置は、検出されるmRNAとハイブリダイズする捕捉試薬としてのオリゴヌクレオチドが結合した基板(例えば、ガラス、シリコン、水晶、金属など)を含むことができる。幾つかの実施形態において、mRNAの直接的検出は、mRNA(cy3、cy5で標識、放射性標識または他による標識が施される)を基板上のオリゴヌクレオチドにハイブリダイズすることにより、遂行することができる。他の実施形態において、mRNAの検出は、最初に相補DNA(cDNA)から所望のmRNAを作製することにより遂行することができる。その後、標識されたcDNAは、基板上のオリゴヌクレオチドにハイブリダイズして、検出することができる。
【0158】
抗体をキット内で、捕捉試薬として用いることもできる。幾つかの実施形態において、基板(例えば、マルチウェルプレート)は、特異的IL8RbおよびBTM捕捉試薬を、付着させることができる。幾つかの実施形態において、キットは、阻害試薬を含ませることができる。阻害試薬を用いて、非特異的結合を低減することができる。例えば非特異的オリゴヌクレオチド結合は、サケ精子DNAなどのIL8RbおよびBTMオリゴヌクレオチドを含有しない任意の簡便な供給源からの過剰のDNAを用いて、低減することができる。非特異的抗体結合は、血清アルブミンなどの過剰の阻害蛋白質を用いて、低減することができる。オリゴヌクレオチドおよび蛋白質を検出するための数多くの方法が、当該技術分野で公知であり、マーカに会合した分子を特異的に検出し得る任意の方策を用いることができ、それが本発明の範囲内とみなされ得ることは、理解されよう。
【0159】
例えば1つのチップで多数のマーカの検出が可能になる抗体チップを用いて、固体支持体に結合させた抗体を用いることもできる。
【0160】
基板に加えて、検査キットは、捕捉試薬(プローブなど)、洗浄溶液(例えば、SSC、他の塩、緩衝液、ディタージェントなど)、および検出分子(例えば、cy3、cy5、放射性標識など)を含むことができる。キットは、使用説明書およびパッケージを含むこともできる。
【0161】
試料中のIL8RbおよびBTMの検出は、任意の適切な技術を利用して実施することができ、非限定的に、オリゴヌクレオチドプローブ、qPCR、または癌マーカに対して増強させた抗体を含むことができる。
【0162】
検査される試料が、炎症疾患または腫瘍の疑いがある組織の試料に限定されないことは、理解されよう。マーカが、血清または他の体液中に分泌されていてもよい。それゆえ試料は、任意の身体試料を含むことができ、それには生検、血液、血清、腹腔洗浄液、脳脊髄液、尿および糞便試料が含まれる。
【0163】
本発明が、ヒトの癌の検出に限定されず、非限定的にイヌ、ネコ、ウマ、ウシ、ヒツジ、シカ、ブタおよび癌になることが公知の他の任意動物をはじめとする任意の動物における癌の検出に適することも、理解されよう。
【0164】
体液中の炎症疾患または癌マーカのための一般的検査
一般に、これらの液体中のオリゴヌクレオチド、蛋白質およびペプチドをアッセイする方法は、当該技術分野で公知である。オリゴヌクレオチドの検出は、ノーザンブロット、サザンブロットもしくはマイクロアレイ法などのハイブリダイゼーション法、またはqPCRを用いて実施することができる。蛋白質を検出する方法としては、例えば酵素免疫測定法(ELISA)、抗体を有する蛋白質チップ、懸濁ビーズでの放射性免疫測定法(RIA)、ウェスタンブロット、およびレクチン結合が挙げられる。しかし、例示の目的で、疾患マーカの液体レベルは、サンドイッチ酵素免疫測定法(ELISA)を用いて定量することができる。血漿アッセイの場合、適当に希釈された試料または標準マーカの希釈系列のアリコット5μL、およびペルオキシダーゼコンジュゲート抗ヒトマーカ抗体75μLを、マイクロタイタープレートのウェルに添加する。30℃で30分間のインキュベーションの後、ウェルをリン酸緩衝生理食塩水(PBS)中の0.05%Tween20で洗浄して、非結合抗体を除去する。その後、マーカと抗マーカ抗体との結合複合体を、H
2O
2含有o−フェニレンジアミンと30℃で15分間インキュベートする。H
2SO
4を添加することにより反応を停止させて、492nmの吸光度をマイクロタイタープレートリーダで測定する。
【0165】
抗IL8Rb抗体がモノクローナル抗体またはポリクローナル抗血清であってもよいことは、理解されよう。任意の他の体液を適宜、試験され得ることも、理解されよう。
【0166】
分泌されるマーカが、生理学的意味で有用である必要はない。むしろ、マーカ蛋白質または遺伝子が血清に進入する任意のメカニズムが、検出可能で定量可能なレベルのマーカを製造するうえで効果的となり得る。つまり細胞からの可溶性蛋白質の正常な分泌、形質膜からの膜蛋白質の脱落、mRNAまたはそれから発現される蛋白質の選択的スプライシング形態の分泌、細胞死(またはアポトーシス)が、有用となるマーカを十分なレベルで生成する可能性がある。
【0167】
血清マーカを、様々な癌タイプの治療有効性を診断および/または評価するツールとして使用するためのサポート資料が増えつつある。
【0168】
Yoshikawa et al., (Cancer Letters, 151: 81-86 (2000) describes tissue inhibitor of matrix metalloproteinase-1 in plasma of patients with gastric cancer.
Rudland et al., (Cancer Research 62: 3417-3427 (2002) describes osteopontin as a metastasis associated protein in human breast cancer.
Buckhaults et al., (Cancer Research 61:6996-7001 (2002) describes certain secreted and cell surface genes expressed in colorectal tumours.
Kim et al., (JAMA 287(13):1671-1679 (2002) describes osteopontin as a potential diagnostic biomarker for ovarian cancer.
Hotte et al., (AJ. American Cancer Society 95(3):507-512 (2002) describes plasma osteopontin as a protein detectable in human body fluids and is associated with certain malignancies.
Martin et al., (Prostate Cancer Prostatic Dis. March 9, 2004 (PMID: 15007379) (Abstract) described use of human kallikrein 2, prostate-specific antigen (PSA) and free PSA as markers for detection of prostate cancer.
Hall et al (Laryngoscope 113(1):77-81 (2003) (PMID: 12679418) (Abstract) described predictive value of serum thyroglobulin in thyroid cancer.
Mazzaferri et al., (J. Clin. Endocrinol. Metab. 88(4):1433-1441 (2003) (Abstract) describes thyroglobulin as a potential monitoring method for patients with thyroid carcinoma.
Whitley et al, (Dim Lab. Med. 24(1):29-47 (2004) (Abstract) describes thyroglobulin as a serum marker for thyroid carcinoma.
Kuo et al (Clin. Chim. Acta. 294(1-2):157-168 (2000) (Abstract) describes serum matrix metalloproteinase-2 and -9 in HCF- and HBV-infected patients.
Koopman et al., (Cancer Epidemiol. Biomarkers Pre
y 13(3):487-491 (2004) (Abstract) describes osteopontin as a biomarker for pancreatic adenocarcinoma.
Pellegrini et al., (Cancer Immunol. Immunother. 49(7):388-394 (2000) (Abstract) describes measurement of soluble carcinoembryonic antigen and TIMP 1 as markers for pre-invasive colorectal cancer.
Melle et al., (Clin. Chem. 53(4), 629-635 (2007) (Abstract) describes HSP27 as a serum marker for pancreatic adenocarcinoma.
Leman et al., (Urology, 69(4) 714-20 (2007) (Abstract) describes EPCA-2 as a serum marker for prostate cancer.
Tsigkou et al., (I Clin Endocrinol Metab, 92(7) 2526-31 (2007) (Abstract) describes total inhibin as a potential serum marker for ovarian cancer.
Marchi et al., (Cancer 112, 1313-1324 (2008) (Abstract) describes ProApolipoprotein Al as a serum marker of brain metastases in lung cancer patients.
【0169】
実施例
本明細書に記載された実施例は、本発明の実施形態の例示を目的としている。他の実施形態、方法および分析のタイプは、分子診断の技術分野の当業者の範囲内であり、本明細書において詳細に記載する必要はない。当該技術分野の範囲内の他の実施形態は、本発明の一部とみなされる。
【0170】
実施例1:
方法
患者:2008年4月〜2009年9月の間に、肉眼的血尿を示し、尿路悪性疾患の病歴を有さない患者471名を、ニュージーランおよびオーストラリアにおける11の泌尿器医院で募集した。各患者は、尿試料を提供し、その直後に細胞検査および任意の追加的診断手順を受けた。試験登録後3ヶ月以内に、診断を実施した。これらの患者471名のうち患者442名から、5種の試験遺伝子全ての遺伝子発現データを、以下に記載される方法を用いて獲得することに成功した。これらの患者の特徴を、表4に示す。
【表5】
【0171】
尿分析:尿試料は、中央判定の細胞診により分析した(ニュージーランド ダニーデンのSouthern Community Laboratories)。診断検査NMP22 BladderChek (Matritech)およびNMP22 ELISA (Matritech)を、臨床の現場(BladderChek)およびSouthern Community Laboratories(NMP22 ELISA)で、製造業者の使用説明書に従って実施した。
【0172】
RNA定量:各患者の尿2mLを、5.64Mチオシアン酸グアニジン、0.5%サルコシルおよび50mM NaOAc pH6.5を含有するRNA抽出緩衝液と混合した。その後、全RNAを、Trizol抽出(Invitrogen)およびRNeasy手順(Qiagen)により、先に記載された通り抽出した1。RNAを水35μlでカラムから溶出し、3μlを、次の単一または二重測定による定量逆転写ポリメラーゼ連鎖反応(qRT−PCR)アッセイに用いた。qRT−PCR反応物 各16μlは、0.3U RNAse-OUT (Invitrogen)、0.225μM 各Taqmanプローブ、1.25U Superscript III (Invitrogen)、0.275μM 各プライマー、1.5U Fast Start Taqポリメラーゼ(Roche)、10mM DTT、0.375mM dNTP、4.5mM MgSO4、1.6μL 10x Fast Start PCR buffer (Roche)および2.6μLGC Rich solution (Roche)を含有した。プライマーおよび蛍光二重標識プローブを、5種の試験遺伝子:MDK、CDC2、HOXA13、IGFBP5およびIL8RbそれぞれについてIntegrated DNA Technologies (米国のCoralville)から得た。プライマー/プローブ配列を、表2に示す。反応を、96ウェルプレートで設定し、Roche Light Cycler(登録商標)480で以下の通りサイクルした:50℃で15分間;95℃で8分間;95℃15秒と60℃2分間を10サイクル、および95℃15秒間と60℃1分間を30サイクル。参照RNA(プールされた細胞株RNAから得られた)の1/16希釈系列の標準曲線を、各プレートに含めて、0.3pg/μl〜20ng/μlの範囲で作成した。データは、最後の30回の熱サイクルの伸長期に回収して、生データのテキストファイルとしてエクスポートした。
【表6】
【0173】
qRT−PCRデータ解析:生の蛍光データを、Roche LightCycler(登録商標)480から、プレートの全てのウェルの蛍光データの2つのチャネルと対比させたサイクル数を含むタブ区切りファイルとしてエクスポートした。データは、データへの色補正を適用したRプログラムを用いて処理し([Bernard 1999])、1つの蛍光チャネルからもう一方のチャネルへのブリードオーバーを修正した。その後、5点ロジスティックモデルに適合させ、セカンド・デリバティブ・マキシマム法([Spiess 2008])を用いて、C
pを推定した。
【0174】
試料および対照の全てを、PCRプレートに二重測定として塗布した。二重測定のウェルから得たC
p値を、使用前に平均した。2つのC
p値の間の差が、3単位を超えている場合、その試料を再度行った。PCRプレート全体の標準化を与えるために、C
pを、20ng/μlの参照RNA(プールされた細胞株RNAから得られた)に対するΔC
pとして表した:
ΔC
p =C
p (試料)−C
p(参照RNA)
【0175】
統計解析:MDK、CDC2、HOXA13、IGFBP5およびIL8RbからのqRT−PCRΔC
p値を用いて分類器を作成し、線形判別分析またはロジスティック回帰に基づいて、TCCを含む試料をTCCを含まない試料と分離した([Venables 2002])。両方の例において、遺伝子間の相互作用は、分類器モデルにおいて許容された。LDAの作成は、例えば"Modern Applied Statistics with S, 4th edition" by W.N. Venables and B.D. Ripley (2002), Springerに記載された標準の手順に従った。試験のデータセットから、任意の不完全データをクリーニングし、その後、R統計環境(R Development Core Team)およびMASSパッケージの関数「lda」(Venables and Ripley (2002))を用いて、臨床試験データの線形判別を作成し、検定した。
【0176】
ロジスティック回帰分類器の作成は、LDAの作成と類似の手法で実施した。同じく試験データから、不完全データをクリーニングした。ロジスティック回帰分類器は、Rを用いて作成し、更なるパッケージは必要とならなかった。ロジスティック回帰は、Dalgaard (2008)に記載された通り実施した。分類器間の比較は、ROC曲線を利用し、RパッケージROCR(Sing et al. 2009)を用いて実施した。ROC曲線の信頼区間は、Macskassyらの方法 ([Macskassy2005])を用いて作成した。
【0178】
線形判別分類器
最初の分類器である線形判別法(LDA−3と呼ぶ)は、5つの遺伝子値を基づき(参照値を引くことにより参照値に正規化し)、遺伝子間のマルチウェイ相互作用(multiway interaction)を可能にする。その分類器は、MASSと呼ばれるパッケージの「lda()」関数を用いてRで構築した(Rはバージョン2.9.1; MASS はバージョン7.2−49)。分類器は、以下の式を用いて構築した。
lda3<−lda(TCC.YN〜MDK
*IGF
*CDC
*HOXA
*IL8R, data=uRNA.Trial)
【0179】
(式中、lda3は、作成されたモデルであり;TCC.YNは、ゴールドスタンダードである細胞診により決定される「尿中のTCCの存在」の真の値であり;MDK、IGF、CDC、HOXAおよびIL8Rは、正規化された遺伝子C
p値であり;uRNA.Trialは、臨床試験の遺伝子の値およびTCC.YNを含むデータフレームである)。式中のアスタリスク「
*」の使用は、乗法を表しているのではなく、むしろ分類器の「相互作用する関係」を意味する。
【0180】
分類器スコアの評価は、5種の遺伝子値および分類器ida3を含む新しいデータフレームをインプットとして取り入れ、分類器スコアとしてアウトプットする。
score<−c(predict(lda3,new.data)$x)
(式中、scoreは、TCCの存在を予測するために分類器とから用いられるアウトプットであり;lda3は、先に作成された分類器であり、new.dataは、分類器の作成において用いられるのと同じ名称により称される5種の遺伝子の測定値を含むデータフレームである)。シンタクス「$x」およびc()は、予測関数により戻された大量の情報からスコアを特異的に抽出するために存在する。
【0181】
0.112以上のスコアカットオフを設定することで、尿試料中のTCCの存在について85%までの特異度が設定される。
【0182】
LDA−3の係数は:
MDK.d.R100
5.333639e+00
IGF.d.R100
3.905978e+00
CDC.d.R100 6.877143e-
01
HOXA.d.R100
6.073742e+00
IL8R.d.R100 -
1.229466e+00
MDK.d.R100:IGF.d.R100 -7.420480e-
01
MDK.d.R100:CDC.d.R100 -2.611158e-
01
IGF.d.R100:CDC.d.R100 -1.965410e-
01
MDK.d.R100:HOXA.d.R100 -8.491556e-
01
IGF.d.R100:HOXA.d.R100 -4.037102e-
01
CDC.d.R100:HOXA.d.R100 -3.429627e-
01
MDK.d.R100:IL8R.d.R100 1.903118e-
01
IGF.d.R100:IL8R.d.R100 2.684005e-
01
CDC.d.R100:IL8R.d.R100 -1.229809e-
01
HOXA.d.R100:IL8R.d.R100 2.909062e-
01
MDK.d.R100:IGF.d.R100:CDC.d.R100 4.108895e-
02
MDK.d.R100:IGF.d.R100:HOXA.d.R100 7.664999e-
02
MDK.d.R100:CDC.d.R100:HOXA.d.R100 4.832034e-
02
IGF.d.R100:CDC.d.R100:HOXA.d.R100 2.116340e-
02
MDK.d.R100:IGF.d.R100:IL8R.d.R100 -3.750854e-
02
MDK.d.R100:CDC.d.R100:IL8R.d.R100 1.664612e-
02
IGF.d.R100:CDC.d.R100:IL8R.d.R100 2.089442e-
03
MDK.d.R100:HOXA.d.R100:IL8R.d.R100 -1.539486e-
02
IGF.d.R100:HOXA.d.R100:IL8R.d.R100 -3.894153e-
02
CDC.d.R100:HOXA.d.R100:IL8R.d.R100 6.295032e-
03
MDK.d.R100:IGF.d.R100:CDC.d.R100:HOXA.d.R100 -4.359738e-
03
MDK.d.R100:IGF.d.R100:CDC.d.R100:IL8R.d.R100 -2.019317e-
04
MDK.d.R100:IGF.d.R100:HOXA.d.R100:IL8R.d.R100 3.746882e-
03
MDK.d.R100:CDC.d.R100:HOXA.d.R100:IL8R.d.R100 -2.902150e-
03
IGF.d.R100:CDC.d.R100:HOXA.d.R100:IL8R.d.R100 4.799489e-
04
MDK.d.R100:IGF.d.R100:CDC.d.R100:HOXA.d.R100:IL8R.d.R100 7.512308e-
05
【0183】
ロジスティック回帰分類器
ロジスティック回帰に基づく第二の分類器は、LDA−3と同じクリーニングデータセットから得られた。しかし、lda()関数を用いる代わりに、以下に示されるパッケージstats(Rの基本インストールを含む)からのglm()関数を用いた:
lr1<−glm(TCC.YN〜CDC
*IGF
*HOXA
*IL8R
*MDK,
family=binomial(”logit”),data=uRNA.Trial)
(式中、lr1は、作成された分類器であり、他のパラメータは、線形判別法に関して記載された通りである)。再び、完全な相互作用を、「
*」オペレータを用いて明記する。分類は、LDA−3と非常に類似した手法で実施される:
score<−predict(lr1,new.data,type=’response’)
(式中、scoreは、先のnew.dataにおける5種の遺伝子の測定に基づいて尿試料を分類するために使用された値である)。Ir1のカットオフは、特異度85%を達成するために0.102に設定されており、カットオフを超える値は、TCCが陽性とみなされる。分類器の係数は:
-103.0818143 +
3.9043769 * CDC.d.R100 +
13.1120675 * IGF.d.R100 +
17.4771819 * HOXA.d.R100 +
-10.7711519 * IL8R.d.R100 +
21.1027595 * MDK.d.R100 +
-0.5938881 * CDC.d.R100 * IGF.d.R100 +
-1.0736184 * CDC.d.R100 * HOXA.d.R100 +
-1.3340189 * IGF.d.R100 * HOXA.d.R100 +
0.3126461 * CDC.d.R100 * IL8R.d.R100 +
1.4597355 * IGF.d.R100 * IL8R.d.R100 +
1.8739459 * HOXA.d.R100 * IL8R.d.R100 +
-1.035054 * CDC.d.R100 * MDK.d.R100 +
-2.5885156 * IGF.d.R100 * MDK.d.R100 +
-2.7013483 * HOXA.d.R100 * MDK.d.R100 +
1.4546134 * IL8R.d.R100 * MDK.d.R100 +
0.0767503 * CDC.d.R100 * IGF.d.R100 * HOXA.d.R100 +
-0.0663361 * CDC.d.R100 * IGF.d.R100 * IL8R.d.R100 +
-0.1015552 * CDC.d.R100 * HOXA.d.R100 * IL8R.d.R100 +
-0.2110656 * IGF.d.R100 * HOXA.d.R100 * IL8R.d.R100 +
0.1361215 * CDC.d.R100 * IGF.d.R100 * MDK.d.R100 +
0.1601118 * CDC.d.R100 * HOXA.d.R100 * MDK.d.R100 +
0.259745 * IGF.d.R100 * HOXA.d.R100 * MDK.d.R100 +
-0.0106468 * CDC.d.R100 * IL8R.d.R100 * MDK.d.R100 +
-0.1947899 * IGF.d.R100 * IL8R.d.R100 * MDK.d.R100 +
-0.185286 * HOXA.d.R100 * IL8R.d.R100 * MDK.d.R100 +
0.0136603 * CDC.d.R100 * IGF.d.R100 * HOXA.d.R100 * IL8R.d.R100 +
-0.0151368 * CDC.d.R100 * IGF.d.R100 * HOXA.d.R100 * MDK.d.R100 +
0.0056651 * CDC.d.R100 * IGF.d.R100 * IL8R.d.R100 * MDK.d.R100 +
0.0030538 * CDC.d.R100 * HOXA.d.R100 * IL8R.d.R100 * MDK.d.R100 +
0.0232556 * IGF.d.R100 * HOXA.d.R100 * IL8R.d.R100 * MDK.d.R100 +
-0.000867 * CDC.d.R100 * IGF.d.R100 * HOXA.d.R100 * IL8R.d.R100 *
MDK.d.R100
【0184】
結果
尿試料のqRT−PCR分析
TCC検出に及ぼすIL8Rbの影響の概要を得るために、二次元散布図を、TCC(n=56)、または非悪性状態の尿管結石(n=25)、尿路感染(n=18)もしくは膀胱炎(n=18)のいずれかの患者の尿から得られたqRT−PCRを用いて構成した。散布図は、4種の遺伝子シグネチャ(MDK、CDC2、HOXA13、IGFBP5)からの遺伝子対を用いて、構成した。その後、IL8Rbを各対の1つの遺伝子に置き換えて、データを再プロットした。これらのプロットを、
図2a〜fに示す。MDKを用いたプロットにおいて、IGFBP5およびHOXA13の代わりにIL8Rbを用いると(
図2a〜c)、TCC患者の試料と、非悪性状態の患者の試料との分別の改善を示した。同じ傾向が、IL8RbをIGFBP5およびHOXA13の代わりに用いた、CDC2でのプロットにおいて観察された(
図2d〜f)。
【0185】
その後、肉眼的血尿を示した患者におけるTCCの正しい診断へのIL8Rbの寄与を、ROC曲線分析により定量した。シグネチャ(MDK、CDC2、IGFBP5およびHOXA13)およびIL8Rbにおける各遺伝子のqRT−PCRデータを用いて、TCCを有する患者とTCCを有さない患者との判別を最大限に行う線形判別アルゴリズムを開発した。2種の線形判別アルゴリズム、つまりMDK、CDC2、HOXA13およびIGFBP5からのqRT−PCRデータを用いたLD1、ならびにMDK、CDC2、HOXA13、IGFBP5およびIL8Rbを用いたLD2を、442の試料の全コホートを用いて開発した。その後、LD1およびLD2を用いて、TCC(n=56)または非悪性状態の尿管結石(n=25)、尿路感染(n=18)もしくは膀胱炎(n=18)が確認された患者の群において、TCC検出の感度および特異度を示すROC曲線を作成した。
図3aは、LD1およびLD2のROC曲線を示す。LD1のROC曲線下面積は、LD2の84%に比較して78%であった。
【0186】
線形判別分析の代わりとして、ロジスティック回帰を独立した方法として用いて、TCC患者と非悪性状態の患者との判別のためのアルゴリズムを開発した。線形判別分析と同様に、ロジスティック回帰アルゴリズムは、442の試料の全コホートを用いて開発した。ロジスティック回帰ならびに先に記載されたTCC試料56および非悪性試料442を用いて得られたROC曲線を、
図3bに示す。LR1のROC曲線下面積(MDK、CDC2、HOXA13およびIGFBP5からのqRT−PCRデータを用いて得られた)は、LR2(MDK、CDC2、HOXA13、IGFBP5およびIL8RbからのqRT−PCRデータを用いて得られた)の86%に比較して80%であった。このデータは、尿試料を用いたTCCの検出方法においてIL8Rbを含むと、TCC患者と、悪性疾患、例えば膀胱炎、尿路感染および尿管結石などの非悪性疾患の患者との判別を改善し得ることを、明白に示している。
【0187】
TCC患者と、尿管結石、尿路感染および膀胱炎の患者との判別に関してIL8Rbにより与えられた精度の改善が、多数で多様な非悪性疾患患者を含む非選択的な患者コホートにおいて維持されていることを確認するために、ROC曲線分析を、表1に記載された試料442の全コホートで繰り返し行った。この分析において、LD1およびLD2の曲線下面積は、それぞれ86%および89%であった(
図4a)。同様にLR1の曲線下面積は87%、LR2は91%であった(
図4b)。この結果から、IL8Rbが尿試料を用いたTCCの検出において精度を改善することが確認される。
【0188】
IL8Rbを含むことによるこの癌検出の改善は、LD1/LD2およびLR1/LR2を442の患者コホートに適用し、その後、ステージTaのTCCのみを検出する感度を決定することにより、更に示された。ステージTaの腫瘍は、より高ステージの腫瘍よりも小さく分化された腫瘍であり、典型的には検出がより困難である。特異度85%でのTa腫瘍がLD2で19/31(61%)検出されたのに比較して、LD1では18/31(58%)であった。LR2(特異度85%)では24/31(77%)検出されたのに比較して、LR1では21/31(68%)であった。このデータから、IL8RbをLDおよびLRアルゴリズムへ含めると、ステージTaの腫瘍の検出感度を最大9%上昇さたことが示される。これらのRNAの検査に比較して、本試験の他の3種の膀胱癌検査:尿細胞診(感度39%、特異度94%)、NMP22 ELISA (感度35%、特異度88%)およびNMP22 (BladderChek(登録商標)(米国マサチューセッツ州のMatritech, Inc. の登録商標))(感度39%、特異度96%)では、Taの腫瘍の検出について顕著に低い精度が示された。
【0189】
尿路炎症の診断の補助物質としてのIL8Rb
膀胱炎または尿路感染などの原因による尿路の炎症を有する患者の診断において用いられるIL8Rbの能力を決定するために、良性前立腺肥大、非特異的前立腺疾患、血管性前立腺、ワルファリン使用後の血尿、および膀胱炎/尿路感染と診断された血尿患者における尿IL8Rb mRNAレベルを、qRT−PCRにより決定した。これらの状態それぞれの平均IL8Rb ΔCtレベルは、それぞれ−3.12、−3.10、−2.84、−1.98および−5.27であった。膀胱炎/尿路感染患者と、ひとまとめにした他の非悪性状態の患者との、平均IL8Rbレベルの差は、ウィルコクソン順位和検定を用いて有意である(p=0.001)と決定された。このデータを描写している箱ひげ図を、
図5に示す。このデータから、膀胱炎または尿路感染のいずれかと診断された患者の大部分におけるIL8Rbレベルが、検査された他の非悪性状態に比較して上昇したことが示される。プロット間の重複は、3つの要因(i)各状態を正しく診断する標準的診療が不能であること、(ii)共存症(例えば、感染と良性前立腺肥大)、および(iii)良性前立腺肥大、非特異的前立腺疾患、血管性前立腺またはワルファリン使用後の血尿の患者の亜集団において高い尿好中球数をカウントしたことによる正常な関連、の組合わせにより説明される可能性が高い。にもかかわらず、炎症と好中球数との厳密な関連性が前提であれば、尿中IL8Rbの定量は、感染の結果としての、または他の非悪性状態と関連する、尿路の炎症を検出する正確な方法を提供する。
【0190】
実施例2
方法
試験母集団
TCCの病歴を有さない連続した患者群を、2008年4月28日〜2009年8月11日にニュージーランドおよびオーストラリアの7の泌尿器科医院において前向きに募集した。患者セットには、実施例1において用いられた患者に加え、追加の患者46名も含まれたが、追加の患者のデータは、最初の分析には利用できなかった。更なる試験では、得られた結果の更なる分析も含んだ。
【0191】
実施例1に記載された通り、試料を採取し、RNAを採取して検査した。
【0192】
RNA検査の開発
uRNA(登録商標)は、4種のmRNAマーカ、CDC2、HOXA13、MDKおよびIGFBP5で構成されている。これらのマーカは、血液および炎症細胞中での低い発現、およびTCCにおける過剰発現に基づいて選択された
2。このコホート試験において、本発明人は、4種のマーカを1つのスコアにまとめた線形判別アルゴリズム(uRNA-D)を前向きに定めた。uRNA-Dは、独立しており、より早期のデータセットで開発された。しかしそれは、検査に予定された標的母集団を代表する、厳密に特徴づけられた患者群を用いて得られたのではない。その結果、試験プロトコルは、現行のコホート試験に募集された患者から得られたデータを用いた、5種のマーカCDC2、HOXA13、MDK、IGFBP5およびIL8Rbを使用する新しいアルゴリズム(分類器−D)の開発も定義した。
【0193】
分類器−Dに加えて、第二のアルゴリズム(分類器−S)を、コホート試験データを用いて得て、進行したステージ(ステージ1以上)またはより高いグレード(WHO/ISUP 1998 分類)のいずれかである腫瘍の同定を可能にした。アルゴリズム−Sは、ステージTaの腫瘍とステージ1以上の腫瘍とで差次的に発現することが過去に示されたCDC2およびHOXA13をはじめとし、5種のマーカ全てを含んだ。
【0194】
分類器の開発
5種のマーカCDC2、HOXA13、MDK、IGFBP5およびIL8Rbを使用するための2種の分類器(分類器−Dおよび分類器−S)の開発は、本明細書において概説された方法に従い、本試験において得られたデータに基づいた。簡潔に述べると、ロジスティック回帰モデルを、統計プログラム環境R(R Development Core Team(2011)). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http:// www.R-project.org/)を用いて作成した。5種のマーカおよびその双方向相互作用(例えば、MDK×CDC2、MDK×IGFBP5など)のそれぞれのΔC
p値を用いて作成されたモデルを、分類能力について評価し、最も低いAIC値を有したものを、特異度85に設定した場合の感度について、1つ抜き交差確認法において評価した。複数のモデルにおいて、分類器−Dおよび分類器−Sのそれぞれで、最少数のパラメータを選択したモデルと同等の性能が実証された。
【0195】
統計法
診断検査をプロトコルに定めた場合、割合および95%信頼区間を、感度および特異度ごとに計算した。受信者動作特性(ROC)曲線をプロットして、Stata roctabおよびroccompコマンド(Statacorp and Delong)を用いて比較した。分類器−Dでは、信頼区間は、適当でなく、フィッシャー正確確率検定およびカイ二乗検定(標本サイズが可能な場合)を用いて、TCCまたは患者特性と真陽性または偽陽性結果の機会との関連性について検定した。ロジスティック回帰モデルを用いて、偽陽性および偽陰性結果に関連する因子を検索した。解析は全て、Stataバージョン11.2において実施した。
【0196】
結果
最初、患者の合計517名が試験に募集され、患者の4%は、不適格であることが分かったこと(n=10)、細胞診を受けていないこと(n=9、TCCの状態が述べられなかったこと(n=2)、または許容し得ない尿試料を提供したことから、除外された(
図8)。更に患者10名は、1種以上の尿検査の結果を有さなかったため、分析から除外された。残りの患者485名のベースライン個体群統計学的特徴および臨床的特徴を、
図9に示す。
【0197】
コホート中のTCCの罹患率は、13.6%であった。2名は、ステージ判定が無く(両者とも、特定地域での判定でTaであり)、2名はグレード判定が示されなかった(一方は、特定地域の病理学者によりグレード1とされ、もう一方は低かった)。腫瘍66例のうち、55例は表在性(ステージTa、T1またはTis)であり、11名は筋肉に浸潤していた(T2)。検出可能な転移または局部的リンパ節転移を有する患者はいなかった。1973年のグレード判定システムを用いると、24名がグレード3に、38名がグレード2に、3名がグレード1に分類され、1名は不明であった。WHO98システムを用いると、29名が高グレード、4名が混合、32名が低グレードに分類され、1名が不明であった。TCCに加えて、患者2名が乳頭腫、7名が他の新生物と診断された(これらのうち5名は泌尿器系)。
【0198】
uRNA-D検査のカットオフを、特異度85%に設定された試験コホートで決定した。このカットオフを用いると、TCCの症例66例のうち、NMP22(商標) ELISA(感度50%)、 Bladderchek(商標)(38%)および細胞診(56%)に比較して、uRNA-Dは41名検出した(感度62%)。コホートデータ分類器−Dで開発されたRNA検査は、特異度85%でTCC症例54名(82%)を、特異度90%で48名(73%)を検出した。uRNA-DとNMP22(商標)ELISAとの値は、両検査が試験前に完全に定められていたため、直接比較することができた。
図2aには、ROC曲線が示され、曲線下面積(AUC)は、それぞれ0.81および0.73(p=0.03)であった。分類器−DのROC曲線は、0.87(
図11b)であり、uRNA-Dに対する性能の改善は、ほとんどが臨床関連の特異度の範囲内である(80%を超える)と思われる。
【0199】
全体として、分類器−Dは、uRNA-D(83%)、細胞診(83%)NMP22 ELISA(69%)および Bladderchek(38%)に比較して、高い/グレード3の腫瘍を97%検出した。分類器−Dは、低グレードの腫瘍の検出に関してもより感度が高く(69%)、他の検査は28〜41%であった(
図12)。分類器−Dは、ステージが1以上であり加えて両方のTisであるTCC症例全てで陽性となったが、感度はステージTaで68%であった(p=0.016、
図12)。それでもこれは、他の検査よりも実質的に高く、uRNA-Dは、41%で次に高かった。尿試料中で顕微鏡的血尿が示されたTCC患者は、顕微鏡的血尿を有さない患者よりも、IL8Rbを含むことによりTCCが検出される可能性がより高くなった(p<0.0005)が、これは、少なくとも一部として、顕微鏡的血尿を有する患者のうち高ステージおよび高グレードのTCCが高割合であった結果である可能性が高い。回帰分析でこれを更に探索するには、数が不十分であった。
【0200】
分類器−Dができなかった12例のうち、全てがステージTaであり、1例を除く全てが、低グレード(WHO ISUP 1998)であった。12例中2例のみ(両者とも低グレードで、ステージTaのTCC)が、別の検査により選別された(一方はNMP22(商標)ELISAおよびBladderChek(商標)の両者、もう一方はuRNA-D)。分類器−Dができなかった12例のうち、全てがステージTaであり、1例を除く全てが、低グレード(WHO ISUP 1998)であった。12例中2例のみ(両者とも低グレードで、ステージTaのTCC)が、別の検査により選別された(一方はNMP22(商標)ELISAおよびBladderChek(商標)の両者、もう一方はuRNA-D)。細胞診では、分類器−Dができなかった任意のTCCを選別しなかった。
【0201】
患者A:高グレードのT2腎盂腫瘍、同時発生のTisを有さず、サイズは示されていない。
患者B:高グレードのT3a膀胱腫瘍、同時発生のTisを有さず、2×3cm。
患者C:4.8×5.6cmと測定された高グレードの腫瘍で、間質および固有筋層に広範の浸潤があり、膀胱周囲脂肪にまで拡大しており、転移の証拠は示されなかった。
【0202】
別の診断を有し、尿試料の特徴に従った患者の尿検査の特異度を、
図13に示す。顕微鏡的血尿を有する対照患者は、顕微鏡的血尿を有さない患者よりも偽陽性検査を有する可能性が高く(p=0.002)、そして診断による特異度の差は全体として統計的に有意でなかったが(p=0.12)結石を有する患者も同様であることが示唆された。他の泌尿器癌の患者が5名存在し、これらのうち1名のみが陽性の分類器−D検査結果を示した。ロジスティック回帰モデルの適合による結果は、類似していた。診断および顕微鏡的血尿によるロジスティック回帰モデルにおいて、顕微鏡的血尿状態との関連性は、依然として有意であり(p=0.006)、診断されなかったものと直接比較すると、結石を有する患者は、偽陽性検査のオッズの2.7倍を有した(95%CI(1.1〜6.4)、p=0.03)。年齢は、検査の特異度に影響を及ぼさなかった。
【0203】
尿試料中で検出された顕微鏡的血尿は、検査感度に明白に関連する唯一の要因であった。このコホートにおける陽性検査の予測値は、顕微鏡的血尿を有する患者では63%、有さない患者では24%であり、顕微鏡的血尿を有する患者におけるTCCのより大きな罹患率を大きく反映している(39%対6%)。
【0204】
分類器−D検査で陽性となったTCC患者は、54名であった。これらの患者は、分類器−Sを用いると重度およびやや重度のTCCに分類された。重度のTCCは、ステージ1以上であるか、または任意のステージでグレード3であると定義された。特異度90%では、分類器−Sは、重度TCC症例の32/35(91%)を正しく分類した。
【0205】
参考文献
Altekruse SF, Kosary CL, Krapcho M, Neyman N, Aminou R, Waldron W, Ruhl J, Howlader N, Tatalovich Z, Cho H, Mariotto A, Eisner MP, Lewis DR, Cronin K, Chen HS, Feuer EJ, Stinchcomb DG, Edwards BK (eds). SEER Cancer Statistics Review, 1975-2007, National Cancer Institute. Bethesda, MD, http:// seer.cancer.gov/csr/1975_2007/, based on November 2009 SEER data submission, posted to the SEER web site, 2010.
Byrd, R. H., Lu, P., Nocedal, J. and Zhu, C. (1995) A limited memory algorithm for bound constrained optimization. SIAM J. Scientific Computing, 16, 1190-1208.
Dalgaard (2008). "Introductory Statistics with R, 2nd edition" ; Peter Dalgaard, Chapter 13 (2008), Springer, ISBN 978-0-387-79053-4.
DeLong, E. R., D. M. DeLong, and D. L. Clarke-Pearson. 1988. Comparing the areas under two or more correlated receiver operating characteristic curves: A nonparametric approach. Biometrics 44: 837-845.
Gottschalk, P.G. and Dunn, J.R. (2005) The five-parameter logistic: A characterization and comparison with the four-parameter logistic. Analytic Biochemistry, 343, 54-65. Doi:10.1016/j.ab.2005.04.035
Hoerl, A.E. (1962) Application of ridge analysis to regression problems. Chemical Engineering Progress, 58, 54-59.
Holyoake A, O'Sullivan P, Pollock R, Best T, Watanabe J, Kajita Y, et al. Development of a multiplex RNA urine test for the detection and stratification of transitional cell carcinoma of the bladder. Clin Cancer Res. 2008 Feb 1;14(3):742-9.
Lunn, D., Spiegelhalter, D., Thomas, A. and Best, N. (2009) The BUGS project: Evolution, critique and future directions (with discussion), Statistics in Medicine 28: 3049--3082.
More, J.J. (1978) The Levenberg-Marquardt algorithm: implementation and theory, in Lecture Notes in Mathematics 630: Numerical Analysis, G.A. Watson (Ed.), Springer-Verlag: Berlin, pp. 105-116.
Nelder, J. A. and Mead, R. (1965) A simplex algorithm for function minimization. Computer Journal 7, 308-31.
(R Development Core Team (2009). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria. ISBN 3-900051-07-0, URL http://www.R-project.org/)
Richards, F.J. (1959) A flexible growth function for empirical use. Journal of Experimental Botany. 10, 290-300.
Sing et al (2009). (Tobias Sing, Oliver Sander, Niko Beerenwinkel and Thomas Lengauer (2009). ROCR: Visualizing the performance of scoring classifiers.. R package version 1.0-4. http://CRAN.R-project.org/package=ROCR).
Speiss, A.-N., Feig, C. and Ritz, C. (2008) Highly accurate sigmoidal fitting of real-time RCR data by introducing a parameter for asymmetry. BMC Bioinformatics, 9, 221. Doi:10.1186/1471-2105-9-211.
Sprenger H, Lloyd AR, Lautens LL, Bonner TI, Kelvin DJ. Structure, genomic organization, and expression of the human interleukin-8 receptor B gene. J Biol Chem. 1994 Apr 15;269(15):11065-72.
StataCorp. 2009. Stata Statistical Software: Release 11. College Station, TX: StataCorp LP.
Venables, W. N. & Ripley, B. D. (2002). Modern Applied Statistics with S. Fourth Edition. Springer, New York. ISBN 0-387-95457-0).