(58)【調査した分野】(Int.Cl.,DB名)
前記アンプリコンが、該アンプリコンとアレイとのハイブリダイゼーション、制限酵素を用いた該アンプリコンの消化、またはリアルタイムPCR分析のうちの1つ以上を含む工程によって検出される、請求項3または4に記載の方法。
REFSNP_ID 3817198(SNP ID 1152499)によって同定される第11染色体の位置1865582、REFSNP_ID 1318703(SNP
ID 1622530)によって同定される第16染色体の位置7096393、REFSNP_ID 12443621(SNP ID 3712013)によって同定される第16染色体の位置51105538、REFSNP_ID 3857481(SNP
ID 1509710)によって同定される第6染色体の位置87181288、REFSNP_ID 889312(SNP ID 843029)によって同定される第5染色体の位置56067641、REFSNP_ID 13281615(SNP ID
1990126)によって同定される第8染色体の位置128424800、REFSNP_ID 2107425(SNP ID 604819)によって同定される第11染色体の位置1988651、REFSNP_ID 2314099(SNP ID 3025734)によって同定される第4染色体の位置162587067、REFSNP_ID 2981582(SNP ID 2312116)によって同定される第10染色体の位置123342307、REFSNP_ID 4666451(SNP ID 4415909)によって同定される第2染色体の位置19208571、REFSNP_ID 2049621(SNP ID 1732681)によって同定される第11染色体の位置95067936、REFSNP_ID 4841365(SNP ID 4281579)によって同定される第8染色体の位置10425908、REFSNP_ID 7313833(SNP ID 4454457)によって同定される第12染色体の位置27974463、REFSNP_ID 981782(SNP ID 2616199)によって同定される第5染色体の位置45321475、REFSNP_ID
11235127(SNP ID 1720694)によって同定される第11染色体の位置86766192、REFSNP_ID 6463266(SNP ID 4077723)によって同定される第7染色体の位置4926524、REFSNP_ID 8051542(SNP ID 3711990)によって同定される第16染色体の位置51091668、REFSNP_ID 12658840(SNP ID 3337858)によって同定される第5染色体の位置160251566、REFSNP_ID
6469633(SNP ID 4093095)によって同定される第8染色体の位置117205405、REFSNP_ID 7443644(SNP ID 4213825)によって同定される第5染色体の位置29282566、REFSNP_ID 3852789(SNP ID 3488617)によって同定される第16染色体の位置70786007、REFSNP_ID 16998733(SNP ID 3610210)によって同定される第4染色体の位置149695013、REFSNP_ID
6843340(SNP ID 3451239)によって同定される第4染色体の位置48460865、REFSNP_ID 17157070(SNP ID 1582533)によって同定される第7染色体の位置108946886、REFSNP_ID
13110927(SNP ID 3488150)によって同定される第4染色体の位置169674258、REFSNP_ID 30099(SNP ID 2770052)によって同定される第5染色体の位置52454339、REFSNP_ID 7307700(SNP ID 4141351)によって同定される第12染色体の位置124113077、REFSNP_ID 4954956(SNP ID 1335030)によって同定される第2染色体の位置139378309、REFSNP_ID 10508468(SNP ID 2211665)によって同定される染色体の位置13958759、およびREFSNP_ID 2298075(SNP ID 4538418)によって同定される染色体の位置102237398から選択される複数の多型を検出または増幅する複数のマーカープローブまたは増幅プライマーを含む、請求項1〜9のいずれか1項に記載の方法において使用するための組成物であって、該組成物は、少なくとも、REFSNP_ID 3817198(SNP ID 1152499)によって同定される第11染色体の位置1865582を検出または増幅するマーカープローブまたは増幅プライマーを含む、組成物。
(i)前記マーカープローブまたはプライマーのセットが、FGFR2、A2BP1、TNRC9、H19、FSTL5、LOC388927、UNQ9391、HCNl、LOC441192、TNRC9、NR3C2、KIAA0826、FLJ31033、AACS、FRMD4A およびSEC31L2からなる群から選択される遺伝子において多型をさらに検出するか;
(ii)該マーカープローブまたはプライマーのセットが、複数の遺伝子または遺伝子座において複数の多型を検出するか;
(iii)該マーカープローブまたはプライマーのセットが、FGFR2、A2BP1、TNRC9、H19、およびFSTL5のそれぞれにおいて少なくとも1つの多型をさらに検出するか、または
(iv)該マーカープローブまたはプライマーのセットが、REFSNP_ID 2981582(SNP ID 2312116)によって同定される第10染色体の位置123342307、REFSNP_ID1318703(SNP ID 1622530)によって同定される第16染色体の位置7093693、REFSNP_ID12443621(SNP ID 3721013)によって同定される第16染色体の位置51105538、REFSNP_ID 3857481(SNP ID1509710)によって同定される第6染色体の位置87181288、REFSNP_ID 889312(SNP ID 843029)によって同定される第5染色体の位置56067641の多型から選択される少なくとも1つの多型をさらに検出する、請求項12に記載のシステム。
【発明を実施するための形態】
【0026】
(定義)
本発明は特定の実施形態に限られず、当然ながら変わる可能性があることは理解されよう。本明細書で使用する述語は単に特定の実施形態を記載する目的であり、制限することは目的としないことも理解されよう。本明細書および添付の特許請求の範囲中で使用するように、単数および単数形の用語、例えば「a」、「an」および「the」は、内容が明らかに他のことを述べない限り、複数の指示対象を場合によっては含む。したがって、例えば「1つのプローブ」という言及は、複数のプローブ分子を場合によっては含み、同様に、文脈に応じて、用語「核酸」の使用は実際問題として、その核酸分子の多くのコピーを場合によっては含む。遺伝子またはタンパク質に関する文字の表示は、文脈に応じて遺伝子の形および/またはタンパク質の形を指すことができる。当業者は、本明細書の配列、知られている配列および遺伝コードを参照することによって、関連生物分子の核酸とアミノ酸形を関連付けることが完全に可能である。
【0027】
他に示さない限り、核酸は左から右に5’から3’方向で記す。本明細書内に列挙する数的範囲はその範囲を定義する数字を含み、定義した範囲内のそれぞれの整数または任意の非整数部分を含む。他に定義しない限り、本明細書で使用する全ての技術および科学用語は、本発明が属する分野の当業者により一般に理解されているのと同じ意味を有する。本明細書に記載したものと類似または均等の任意の方法および物質は、本発明を試験するための実践において使用することができるが、好ましい物質および方法は本明細書に記載する。本発明の記載および特許請求では、以下に述べる定義に従い以下の述語を使用するはずである。
【0028】
「表現型」は、個体または集団において観察することができる1つの形質または形質の集合である。形質は定量的(定量的形質、またはQTL)または定性的であってよい。例えば、乳癌に対する易罹患性は、本明細書の方法、組成物、キットおよびシステムによりモニタリングすることができる表現型である。
【0029】
「乳癌の易罹患性の表現型」は、個体において乳癌を発症する素因を示す表現型である。乳癌の素因を示す表現型は、例えば所与の組の環境条件下(食生活、身体活動レジメ、地理的位置など)で関連する一般的集団のメンバーよりその表現型を有する個体において乳癌が発症する、より高い可能性を示す可能性がある。
【0030】
「多型」は様々である遺伝子座である、すなわち集団内で、多型でのヌクレオチド配列は2つ以上の型または対立遺伝子を有する。用語「対立遺伝子」は、特定の遺伝子座に存在するかあるいはそこでコードされている2つ以上の異なるヌクレオチド配列、またはそのような遺伝子座によってコードされている2つ以上の異なるポリペプチド配列の1つを指す。例えば、第一の対立遺伝子は1つの染色体上に存在する可能性があり、一方で第二の対立遺伝子は第二の相同染色体上に存在する、例えば異型個体の異なる染色体、あるいは集団内の異なる同型または異型個体の間に存在する。多型の一例は「一塩基多型」(SNP)であり、これはゲノム中の1つのヌクレオチド位置における多型である(特定位置におけるヌクレオチドは個体または集団間で異なる)。
【0031】
形質と「正に」相関した対立遺伝子は、それが形質と連鎖するとき、および対立遺伝子の存在がその形質または形質形の指標であるとき、その対立遺伝子を含む個体中に存在するはずである。形質と負に相関した対立遺伝子は、それが形質と連鎖するとき、および対立遺伝子の存在がその形質または形質形の指標であるとき、その対立遺伝子を含む個体中に存在しないはずである。
【0032】
マーカー多型または対立遺伝子は、それが表現型と統計上(正あるいは負に)連鎖する可能性があるとき、特定の表現型(乳癌易罹患性など)と「関連」または「関係」がある。すなわち特定の多型が、対照集団(例えば、乳癌を有していない個体)中よりも症例集団(例えば、乳癌患者)中により一般的に存在する。この相関関係は本来偶然であると推測されることが多いが、そうである必要はなく、表現型の根底にある形質に関する遺伝子座との単純な遺伝的連鎖(関係)が相関関係/関係を考えるのに充分である。
【0033】
「好ましい対立遺伝子」は、望ましい表現型、例えば乳癌に対する耐性と正に相関した特定の遺伝子座における対立遺伝子、例えば乳癌の素因と負に相関した対立遺伝子である。連鎖マーカーの好ましい対立遺伝子は、好ましい対立遺伝子と共に分離するマーカー対立遺伝子である。染色体セグメントの好ましい対立遺伝子は、望ましい表現型と正に相関しているか、あるいは染色体セグメント上に物理的に位置する1つ以上の遺伝子座における好ましくない表現型と負に相関している、ヌクレオチド配列を含む染色体セグメントである。
【0034】
「好ましくない対立遺伝子」は、望ましい表現型と負に相関しているか、あるいは望ましくない表現型と正に相関している、例えば乳癌易罹患性と正に相関している、特定の遺伝子座における対立遺伝子である。連鎖マーカーの好ましくない対立遺伝子は、好ましくない対立遺伝子と共に分離するマーカー対立遺伝子である。染色体セグメントの好ましい対立遺伝子は、望ましい表現型と負に相関しているか、あるいは染色体セグメント上に物理的に位置する1つ以上の遺伝子座における望ましくない表現型と正に相関している、ヌクレオチド配列を含む染色体セグメントである。
【0035】
「対立遺伝子頻度」は、個体、系、または系の集団内の遺伝子座に対立遺伝子が存在する頻度(割合またはパーセンテージ)を指す。例えば、対立遺伝子「A」に関して、遺伝子型「AA」、「Aa」、または「aa」の二倍体個体はそれぞれ1.0、0.5、または0.0の対立遺伝子頻度を有する。系または集団由来の個体のサンプルの対立遺伝子頻度を平均することによって、その系または集団(例えば、症例または対照)内の対立遺伝子頻度を推定することができる。同様に、集団を構成する系の対立遺伝子頻度を平均することによって、系の集団内の対立遺伝子頻度を計算することができる。
【0036】
個体は、その個体が所与の遺伝子座に1型の対立遺伝子のみを有する場合「同型」である(例えば、二倍体個体は2つの相同染色体のそれぞれの遺伝子座に同じ対立遺伝子のコピーを有する)。個体は、2つ以上の対立遺伝子型が所与の遺伝子座に存在する場合「異型」である(例えば、2つの異なる対立遺伝子のそれぞれの1コピーを有する二倍体個体)。用語「相同性」は、一群の要素が1つ以上の特定の遺伝子座に同じ遺伝子型を有することを示す。対照的に、用語「異質性」を使用して、群内の個体が1つ以上の特定の遺伝子座における遺伝子型が異なることを示す。
【0037】
「遺伝子座」は染色体上の位置または領域である。例えば、多型遺伝子座は、多型核酸、形質決定因子、遺伝子またはマーカーが位置する位置または領域である。他の実施例では、「遺伝子座」は、特定の遺伝子を見つけることができる種のゲノム中の染色体上の特定の位置(領域)である。同様に、用語「定量的形質の遺伝子座」または「QTL」は、少なくとも1つの遺伝的背景において、例えば少なくとも1つの集団または子孫において、発現に示差的に影響を与えるかあるいは定量的または連続的表現型形質のバリエーションを変える、少なくとも2つの対立遺伝子を有する遺伝子座を指す。
【0038】
「マーカー」、「分子マーカー」または「マーカー核酸」は、遺伝子座または連鎖した遺伝子座の同定時の基準点として使用する、ヌクレオチド配列またはそのコードされる産物(例えばタンパク質)を指す。マーカーはゲノムヌクレオチド配列、または発現されるヌクレオチド配列(例えばRNA、nRNA、mRNA、cDNAなどに由来する)、またはコードされるポリペプチドに由来してよい。この用語は、マーカー配列と相補的であるかあるいはそれらに隣接する核酸配列、例えば、マーカー配列を増幅させることができるプローブまたはプライマー対として使用する核酸なども指す。「マーカープローブ」は、それを使用してマーカー遺伝子座の存在を同定することができる核酸配列または分子、例えばマーカー遺伝子座配列と相補的である核酸プローブである。核酸は、それらが例えばワトソン−クリックの塩基対形成の法則に従い、溶液中で特異的にハイブリダイズするとき「相補的」である。「マーカー遺伝子座」は、それを使用して第二の連鎖した遺伝子座の存在を追跡することができる遺伝子座、例えば、表現型形質をコードするかあるいは集団における表現型形質のバリエーションの原因である連鎖または連鎖した遺伝子座である。例えば、マーカー遺伝子座を使用して、QTLなどの遺伝子座における、マーカー遺伝子座と遺伝的または物理的に連鎖している対立遺伝子の分離をモニタリングすることができる。したがって、「マーカー対立遺伝子」、あるいは「マーカー遺伝子座の対立遺伝子」は、マーカー遺伝子座が多型である集団中のマーカー遺伝子座において見られる、複数の多型ヌクレオチド配列の1つである。一態様において本発明は、当該の表現型、例えば乳癌の易罹患性/耐性と相関関係があるマーカー遺伝子座を提供する。同定したマーカーのそれぞれが、関連表現型の原因である遺伝的エレメント、例えばQTLと密接な物理的および遺伝的近似性がある(物理的および/または遺伝的連鎖をもたらす)と予想される。集団の要素間の遺伝的多型に対応するマーカーは、当技術分野において充分確立されている方法によって検出することができる。これらは例えば、PCRに基づく配列特異的増幅法、制限断片長多型(RFLP)の検出、アイソザイムマーカーの検出、対立遺伝子特異的ハイブリダイゼーション(ASH)の検出、1ヌクレオチド伸長の検出、増幅したゲノムの可変配列の検出、自律的配列複製の検出、単純配列反復単位(SSR)の検出、一塩基多型(SNP)の検出、または増幅断片長多型(AFLP)の検出を含む。
【0039】
「遺伝子マップ」は、所与の種内の1つ以上の染色体上(または連鎖群)の遺伝子座間の遺伝子連鎖(または結合)の関係を記載するものであり、一般に図または表形式で示す。「マッピング」は、遺伝子マーカー、そのマーカーに関して分離される集団、および組換え頻度の標準的な遺伝的原理を使用することによって遺伝子座の連鎖関係を定義する方法である。「マッピング位置」は、連鎖した遺伝子マーカーに対する遺伝子マップ上の割り当てられた位置であり、この場合特定のマーカーを所与の種内で発見することができる。用語「染色体セグメント」は、1つの染色体上に存在するゲノムDNAの連続した直線範囲を示す。同様に、「ハプロタイプ」は、個体または集団の遺伝物質において見られる一組の遺伝子座である(その組は連続または非連続状態であってよい)。本発明の文脈では、1つ以上の本明細書の対立遺伝子、および1つ以上の連鎖したマーカー対立遺伝子などの遺伝的エレメントは染色体セグメント内に位置してよく、したがってさらに、20センチモルガン(cM)以下、あるいはそれ未満、例えば15cM以下、しばしば10cM以下、例えば約9、8、7、6、5、4、3、2、1、0.75、0.5、0.25、または0.1CM以下の、遺伝的に連鎖した、特定の遺伝子の組換え距離である。すなわち、1つの染色体セグメント内の2つの密接に連鎖した遺伝的エレメントは、互いに約20%以下、例えば約19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%、または0.1%以下の頻度で、減数分裂中に組換えを経る。ひとたび表現型(例えば、乳癌の素因)と多型遺伝子座との間の相関関係/関係を、例えば症例および対照における遺伝子座の統計的頻度を比較することによって同定した後、関連遺伝子座と連鎖している任意の多型を、関連遺伝子座の代理マーカーとして使用することができる。
【0040】
「遺伝子組換え頻度」は、2つの遺伝子座間の組換え事象の頻度である。組換え頻度は、減数分裂中のマーカーおよび/または形質の分離を追跡することによって観察することができる。本発明の文脈では、身体の染色体の関係により関連遺伝子座が同系群の一部分であり、かつ連鎖不均衡であるとき、マーカー遺伝子座は他のマーカー遺伝子座または幾つかの他の遺伝子座(例えば、乳癌易罹患性の遺伝子座)と「関係がある」。遺伝子座がランダムに分離する場合よりも頻繁に、マーカー遺伝子座と連鎖した遺伝子座が子孫において一緒に見られるとき、この事が起こる。同様に、マーカー遺伝子座が形質と連鎖不均衡であるとき、マーカー遺伝子座が形質と関係がある可能性もあり、例えばマーカー遺伝子座は、所与の形質(乳癌耐性または易罹患性)と「関係がある」可能性がある(例えば症例対対照群においてマーカーがより一般的に見られるとき、これを検出することができる)。用語「連鎖不均衡」は、遺伝子座または形質(あるいは両方)のランダムではない分離を指す。いずれかの場合、連鎖不均衡は、関連遺伝子座は染色体の長さに沿って充分物理的に近い位置にあり、したがってそれらはランダムな頻度より高い頻度で一緒に分離することを意味する(同時分離形質の場合、形質の根底にある遺伝子座は互いに充分近い位置にある)。連鎖した遺伝子座は、50%を超える時間、例えば約51%〜約100%の時間同時分離する。相同染色体対間の組換えが減数分裂中に高い頻度で2つの遺伝子座間において起こらないように、例えば、密接に連鎖した遺伝子座が少なくとも約80%の時間、より好ましくは少なくとも約85%の時間、さらにより好ましくは少なくとも90%の時間、例えば91%、92%、93%、94%、95%、96%、97%、98%、99%、99.5%、99.75%、または99.90%あるいはそれより多くの時間同時分離するように、2つの遺伝子座は非常に接近して位置することが有利である。
【0041】
本出願中の語句「密接に連鎖した」は、2つの連鎖した遺伝子座(例えば、
図1または2中で同定したSNPなどのSNP(例えば、症例集団と対照集団を比較することによって乳癌の表現型と関連付けられる)および第二の連鎖多型)間の組換えが、約20%以下の頻度で起こることを意味する。言い換えれば、密接に(あるいは「しっかりと」)連鎖した遺伝子座は、少なくとも80%の時間同時分離する。マーカー遺伝子座は、それらが標的遺伝子座(例えば乳癌のQTL、あるいは代替的に単なる他の乳癌マーカー遺伝子座)と密接に連鎖しているとき、本発明において特に有用である。マーカーが標的遺伝子座とより密接に連鎖しているほど、マーカーはその標的遺伝子座のより良い指標である。したがって一実施形態では、マーカー遺伝子座と第二の遺伝子座などのしっかりと連鎖した遺伝子座は、約20%以下、例えば15%以下、例えば10%以下、好ましくは約9%以下、さらにより好ましくは約8%以下、さらにより好ましくは約7%以下、さらにより好ましくは約6%以下、さらにより好ましくは約5%以下、さらにより好ましくは約4%以下、さらにより好ましくは約3%以下、およびさらにより好ましくは約2%以下の遺伝子座間組換え頻度を示す。非常に好ましい実施形態では、関連遺伝子座(例えば、マーカー遺伝子座および標的遺伝子座、QTLなど)は、約1%以下、例えば約0.75%以下、より好ましくは約0.5%以下、あるいはさらにより好ましくは約0.25%以下、あるいはさらにより好ましくは約0.1%以下の組換え頻度を示す。同じ染色体に、2つの遺伝子座間の組換えが約20%未満、例えば15%、より好ましくは10%(例えば、約9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%、0.1%以下)の頻度で起こるような距離で位置する2つの遺伝子座も、互いに「隣接している」と言える。形質の原因である遺伝的エレメントおよび隣接マーカーなどの、2つの連鎖した遺伝的エレメント間の関係を言及するとき、「相引」相連鎖は、形質遺伝子座における「好ましい」対立遺伝子が、それぞれの連鎖したマーカー遺伝子座の「好ましい」対立遺伝子と同じ染色体鎖上で物理的に結合している状態を示す。相引相では、両方の好ましい対立遺伝子が、その染色体鎖を受け継ぐ子孫によって一緒に受け継がれる。「相反」相連鎖では、当該の遺伝子座(例えば、乳癌易罹患性に関するQTL)における「好ましい」対立遺伝子は、隣接するマーカー遺伝子座において「好ましくない」対立遺伝子と同じ染色体鎖上で物理的に結合しており、2つの「好ましい」対立遺伝子は一緒に受け継がれない(すなわち、2つの遺伝子座は互いに「不一致」である)。
【0042】
核酸増幅の文脈における用語「増幅」は、それによって選択した核酸(またはその転写形)の他のコピーを生成する任意のプロセスである。典型的な増幅法は、ポリメラーゼ連鎖反応(PCR)を含めた様々なポリメラーゼによる複製法、リガーゼ連鎖反応(LCR)などのリガーゼ介在法、およびRNAポリメラーゼによる増幅(例えば転写による)方法を含む。「アンプリコン」は、増幅した核酸、例えば任意の利用可能な増幅法(例えば、PCR、LCR、転写など)によって鋳型核酸を増幅させることによって生成する核酸である。
【0043】
「ゲノム核酸」は、細胞中の遺伝性核酸に配列が対応する核酸である。一般例は、核ゲノムDNAおよびそのアンプリコンを含む。ゲノム核酸は幾つかの場合、スプライシングRNAまたはcDNAが例えばイントロンを除去するためのスプライシング機構によってプロセシングされる点で、スプライシングRNA、または対応するcDNAと異なる。ゲノム核酸は、非転写(例えば、染色体構造配列、プロモーター領域、エンハンサー領域など)および/または非翻訳配列(例えばイントロン)を場合によっては含み、一方スプライシングRNA/cDNAは典型的にはイントロンを有していない。「鋳型ゲノム核酸」は、増幅反応(例えば、PCRなどのポリメラーゼによる増幅反応、LCRなどのリガーゼ介在増幅反応、転写反応など)において鋳型として働くゲノム核酸である。
【0044】
「外来性核酸」は、配列、ゲノム位置、または両方に関して指定の系(例えば生殖質、細胞、個体など)に由来しない核酸である。ポリヌクレオチドまたはポリペプチドに適用する、本明細書で使用する用語「外来性」または「異型」は、生物系(例えば細胞、個体など)に人為的に供給されその特定の生物系に由来しない分子を典型的には指す。この用語は関連物質が本来存在した供給源以外の供給源に由来したことを示すことができ、あるいは非原型の形状、遺伝的局在またはパーツ配置を有する分子を指すことができる。
【0045】
用語「導入した」は、細胞中への異型または外来性核酸の移動を言及するとき、任意の方法を使用する細胞中への核酸の取り込みを指す。この用語は、「トランスフェクション」、「形質転換」および「形質導入」などの核酸導入法を含む。
【0046】
本明細書で使用する用語「ベクター」は、核酸セグメントを細胞中に移動させるポリヌクレオチドまたは他の分子に関して使用する。用語「媒介体」は、「ベクター」と時折同義的に使用する。ベクターは、ベクターの維持を仲介しその目的の使用を可能にする部分(例えば、複製に必要な配列、薬剤または抗生物質耐性を与える遺伝子、マルチクローニングサイト、クローニング遺伝子の発現を可能にする作動可能に連結したプロモーター/エンハンサーエレメントなど)を場合によっては含む。ベクターはプラスミド、バクテリオファージ、あるいは植物または動物ウイルスに由来することが多い。「クローニングベクター」または「シャトルベクター」または「サブクローニングベクター」は、サブクローニングステップを容易にする作動可能に連結した部分(例えば、多数の制限エンドヌクレアーゼ部位を含むマルチクローニングサイト)を含む。
【0047】
本明細書で使用する用語「発現ベクター」は、特定の宿主生物におけるコード配列の発現を容易にする作動可能に連結したポリヌクレオチド配列を含むベクターを指す(例えば、細菌発現ベクターまたは哺乳動物細胞発現ベクター)。原核生物における発現を容易にするポリヌクレオチド配列は典型的には、例えばプロモーター、オペレーター(任意選択)、およびリボソーム結合部位を、しばしば他の配列と共に含む。真核生物細胞は、原核生物によって使用されるものと一般に異なる、プロモーター、エンハンサー、停止およびポリアデニル化シグナルおよび他の配列を使用することができる。任意選択の一実施形態では、本明細書の遺伝子座に対応する遺伝子を発現ベクターにクローニングし、モジュレーターを同定するための本明細書の方法およびシステムにおいて使用する遺伝子産物と共に発現させる。
【0048】
それが所与の核酸の配列を使用して構築されるとき、あるいは特定の核酸が所与の核酸を使用して構築されるとき、特定の核酸は所与の核酸に「由来する」。
【0049】
「遺伝子」は、1つ以上の発現分子、例えばRNA、またはポリペプチドを一緒にコードするゲノム中のヌクレオチドの1つ以上の配列である。遺伝子は、RNAに転写され次いでポリペプチド配列に翻訳され得るコード配列を含むことができ、遺伝子の複製または発現を容易にする関連構造または制御配列を含むことができる。本発明における当該の遺伝子は、
図1および/または2の遺伝子座を含むかあるいはそれらと密接に連鎖した遺伝子を含む。
【0050】
「遺伝子型」は、1つ以上の遺伝子座における個体(または個体群)の遺伝子の構成である。遺伝子型は個体の1つ以上の知られている遺伝子座の対立遺伝子、典型的にはその両親から受け継がれた対立遺伝子の集合によって定義される。「ハプロタイプ」は、1本のDNA鎖上の複数の遺伝子座における個体の遺伝子型である。典型的には、ハプロタイプによって記載される遺伝子座は物理的および遺伝的に連鎖している、すなわち同じ染色体鎖上に存在する。
【0051】
マーカーまたはプローブの「セット」は、一般的な目的、例えば特定の表現型(例えば、乳癌の耐性または易罹患性)を有する個体の同定に使用される、マーカーまたはプローブの集合または群、あるいはそこから誘導されるデータを指す。マーカーまたはプローブに対応する、あるいはその使用から誘導されるデータは、電子媒体に保存されることが多い。セットの要素のそれぞれは特定の目的に関する有用性を有するが、マーカーの全てではないが幾つかを含むセットおよびサブセットから選択される個々のマーカーも、特定の目的を実施する際に有効である。
【0052】
「索引表」は、1つの形のデータと他のデータ、あるいは1つ以上の形のデータとそのデータと関係がある予想結果を関連付ける表である。例えば索引表は、対立遺伝子データと、1つ以上の所与の対立遺伝子を含む個体が示す可能性がある予想形質との間の相関関係を含み得る。例えば多数の対立遺伝子を同時に考慮に入れて、および場合によっては、例えば形質を予想する際に、遺伝的背景などの他の要因も考慮に入れて、これらの表は多次元であってよく、および典型的には多次元である。
【0053】
「コンピュータ可読媒体」は、利用可能または一般的なインターフェースを使用してコンピュータによってアクセスすることができる情報保存媒体である。例にはメモリー(例えば、ROMまたはRAM、フラッシュメモリーなど)、光学的保存媒体(例えばCD−ROM)、磁気的保存媒体(コンピュータハードドライブ、フロッピー(登録商標)ディスクなど)、パンチカード、および市販されている多くの他のものがある。保存されている情報の保存またはアクセスのために、当該のシステムとコンピュータとの間、あるいはコンピュータにまたはコンピュータから、コンピュータ可読媒体にまたはコンピュータ可読媒体から、情報は伝達され得る。この伝達は送電であってよく、あるいは他の利用可能な方法、例えばIRリンク、ワイヤレス接続などによって実施することができる。
【0054】
「システム指示書」は、システムによって部分的または完全に実行することができる指示書のセットである。典型的には、指示書のセットはシステムソフトウェアとして存在する。
【0055】
「翻訳産物」は、核酸の翻訳の結果として生成する産物(典型的にはポリペプチド)である。「転写産物」は、核酸(例えばDNA)の転写の結果として生成する、産物(例えば、mRNAを場合によっては含めたRNA、あるいは例えば、触媒または生物活性RNA)である。
【0056】
「アレイ」はエレメントの集合体である。集合体は空間的に整列されている(「パターン化されたアレイ」)あるいは整列されていない(「ランダムにパターン化されたアレイ」)可能性がある。アレイは1つ以上の機能的エレメント(例えば、マイクロアレイ上のプローブ領域)を形成するか、あるいはそれらを含むことができ、あるいはそれは非機能的であってよい。
【0057】
本明細書で使用する用語「SNP」または「一塩基多型」は、個体間、例えば変化しやすい生物のDNA中の1つの窒素含有塩基の位置の遺伝的変異を指す。本明細書で使用する「SNPs」はSNPの複数形である。当然ながら、本明細書でDNAを言及するとき、このような言及はDNAの誘導体、例えばアンプリコン、そのRNA転写産物などを含み得る。
【0058】
(詳細な説明)
概説
本発明は、
図1および2の多型(およびこれらの多型を含むかあるいはこれらと隣接する遺伝子)と乳癌の素因との間の新たな相関関係を含む。これらの遺伝子または遺伝子産物における、およびこれらと連鎖した幾つかの対立遺伝子は、関連対立遺伝子を有する個体が乳癌を発症する可能性を予示する。したがって、任意の利用可能な方法によるこれらの対立遺伝子の検出は、乳癌に対する易罹患性の初期検出、および乳癌を示す患者の予後判定などの診断目的で、および診断を容易にする際に、例えば現在の基準が明確な診断に不充分である場合に使用することができる。
【0059】
図1または2の多型、遺伝子または遺伝子産物は乳癌の表現型と相関関係があるという同定結果は、乳癌疾患の潜在的モジュレーターのスクリーニングに関する基盤も与える。
図1および2の多型に対応する任意の遺伝子またはコードされるタンパク質の活性のモジュレーターは、乳癌に対する影響を有すると予想される。したがって、スクリーニングの方法、スクリーニングのためのシステムなどは本発明の特徴である。これらのスクリーニング手法によって同定されるモジュレーターも、本発明の特徴である。
【0060】
例えば関連対立遺伝子を同定するためのプローブ、パッケージ材料、および関連対立遺伝子の検出と乳癌を関連付けるための指示書を含む、乳癌を診断および処置するためのキットも、本発明の特徴である。これらのキットは、乳癌のモジュレーターおよび/または従来の方法を使用して患者を処置するための指示書も含むことができる。
【0061】
乳癌の素因を同定する方法
記したように本発明は、
図1および2の幾つかの遺伝子または他の遺伝子座は乳癌の表現型と連鎖するという発見を提供する。したがって、関連表現型と正または負に相関しているマーカー(例えば、
図1または2中のSNPあるいはそれと密接に連鎖している遺伝子座)を検出することによって、個体または集団がこれらの表現型を含む可能性があるかどうか決定することができる。これは乳癌のリスクがある患者を同定するための充分な初期検出の選択権を与え、幾つかの場合、例えば初期の予防処置(例えば、予防的外科手術、食生活、運動、利用可能な薬剤などを含めた任意の既存の療法)をとることによって、癌の実際の進行を妨げることができる。さらに、本明細書の様々なマーカーの使用も、患者が特定の形の乳癌に罹患しているか否かを同定するための既存の診断技法に確実性を加える。さらに、疾患に関する分子基盤が存在するかどうかの知識も、例えば患者が乳癌用の従来の療法にどの程度応答する可能性があるかという指標を与えることによって、患者の予後の判定を容易にすることができる。どの型の分子異常を患者が示すかに基づいて、疾患の処置を標的化することもできる。
【0062】
関連対立遺伝子を検出するための検出法は、任意の利用可能な方法、例えば増幅技術を含むことができる。例えば検出は、多型または多型と関係がある配列を増幅させること、および生成したアンプリコンを検出することを含むことができる。これは、例えばプライマーまたはプライマー対が、遺伝子または密接に連鎖する多型の少なくとも一部分、またはそれと隣接した配列と相補的かまたは部分的に相補的である、増幅プライマーまたは増幅プライマー対と生物または生物学的サンプル(例えば、SNPまたは他の多型を含む)から単離した核酸鋳型とを混合することを含むことができる。プライマーは典型的には、核酸鋳型においてポリメラーゼによる核酸の重合を開始させることができる。プライマーまたはプライマー対は、例えばポリメラーゼと鋳型核酸とを含むDNA重合反応(PCR、RT−PCRなど)において伸長させて、アンプリコンを生成させる。アンプリコンは任意の利用可能な検出法、例えばシークエンス、アンプリコンとアレイのハイブリダイズ(またはアンプリコンのアレイへの固定およびプローブとそれとのハイブリダイズ)、制限酵素を用いたアンプリコンの消化(例えばRFLP)、リアルタイムPCR分析、1ヌクレオチドの伸長、対立遺伝子特異的ハイブリダイゼーションなどによって検出する。
【0063】
検出した多型と形質との間の関連付けは、対立遺伝子と表現型との間の関係を同定することができる任意の方法によって実施することができる。最も典型的には、これらの方法は、多型の対立遺伝子と表現型との間の相関関係を含む索引表を参照することを含む。この表は多数の対立遺伝子−表現型の関係に関するデータを含むことができ、例えば主成分分析、発見的アルゴリズムなどの統計手段を使用することによって、多数の対立遺伝子−表現型の関係の追加的または他の高次影響を考慮することができる。
【0064】
これらの方法の文脈内において、以下の考察は、マーカーと対立遺伝子がどのように連鎖しているか、およびこの現象を乳癌の表現型を同定するための方法の文脈においてどのように使用することができるかに最初に焦点を置き、次いでマーカー検出法に焦点を置く。以下の他の章でデータ分析を論じる。
【0065】
マーカー、連鎖および対立遺伝子
伝統的な連鎖(または関連)分析では、染色体上の遺伝子の物理的関係の直接的な知識は必要とされない。メンデルの第一法則は形質の対因子が分離するということであり、二倍体形質の対立遺伝子は2つの配偶子、次いで異なる子孫に分離することを意味する。古典的な連鎖分析は、異なる形質の同時分離の相対頻度の統計的記述として考えることができる。連鎖分析は、形質が一緒に分離する頻度に基づいてそれらがどのようにして一緒に分類されるかの、充分特徴付けられた記述構成である。すなわち、2つの非対立遺伝子の形質がランダムな頻度を超える頻度で一緒に受け継がれる場合、それらは「連鎖している」と言える。形質が一緒に受け継がれる頻度は、形質がどの程度しっかり連鎖しているかの主な指標である、すなわち、高い頻度で一緒に受け継がれる形質は、低い(ただしランダムをはるかに超える)頻度で一緒に受け継がれる形質より密接に連鎖している。形質の根底にある遺伝子が同じ染色体上で互いに近くに存在するので、形質は連鎖している。相同染色体は減数分裂中に組換えを起こすので、遺伝子が染色体上で離れて存在するほど、遺伝子が一緒に分離する可能性は低くなる。したがって、遺伝子が染色体上で離れて存在するほど、2つの遺伝子の子孫への別々の分離をもたらす減数分裂中に組換え事象が存在する可能性が高くなる。
【0066】
連鎖(または関連)の一般的な指標は、形質が同時分離する頻度である。これは同時分離の割合(組換え頻度)、あるいはさらに一般的に、実際組換え頻度の相互関係単位であるセンチモルガン(cM)として表すことができる。cMは先駆的遺伝学者Thomas Hunt Morganにちなんで命名され、遺伝的組換え頻度の測定単位である。1cMは、1世代中の組換えによって、他の遺伝子座における形質から1遺伝子座における形質が分離する1%の確率に等しい(その時期の形質が99%一緒に分離することを意味する)。染色体上の距離は形質間の組換え事象の頻度にほぼ比例するので、組換え頻度と相関するおよその物理的距離が存在する。例えばヒトにおいては、1cMは平均して約100万個の塩基対(1Mbp)と相関する。
【0067】
マーカー遺伝子座はそれ自体が形質であり、分離中にマーカー遺伝子座を追跡することによって標準的な連鎖分析によって評価することができる。したがって、本発明の文脈では、1cMは、1世代中の組換えによって、他の遺伝子座(任意の他の形質であってよい、例えば他のマーカー遺伝子座、または乳癌のQTLをコードする他の形質の遺伝子座)からマーカー遺伝子座が分離する1%の確率に等しい。本明細書のマーカー、例えば
図1および2に列挙したマーカーは、乳癌と相関する可能性がある。これは、マーカーは乳癌のQTLを含むかあるいはこれと充分に隣接しており、形質そのものの予測因子としてマーカーを使用することができることを意味する。これは疾患診断の文脈において非常に有用である。
【0068】
図1および2の多型は、症例(乳癌患者)対対照集団においてより見られるとして同定している。当該の形質の遺伝子座(例えば本発明の場合、例えば
図1および2中と同様の、乳癌のQTLまたは同定済みの連鎖したマーカー遺伝子座)と連鎖する任意のマーカーは、その形質のマーカーとして使用することができる。したがって、
図1および2中に記したマーカー以外に、これらの図面中に箇条書きしたマーカーと密接に連鎖する他のマーカーも、図面中に示したマーカー対立遺伝子の存在(およびしたがって、関連表現型形質)を有効に予測することができる。このような連鎖マーカーは、マーカーが所与の遺伝子座と充分に隣接し、したがってそれらがその所与の遺伝子座と低い組換え頻度を示すとき、特に有用である。本発明において、このような密接に連鎖するマーカーは本発明の特徴である。密接に連鎖する遺伝子座は、所与のマーカーと約20%以下の組換え頻度を示す(所与のマーカーは所与のマーカーの20cM以内に存在する)。言い換えると、密接に連鎖する遺伝子座はその時期の少なくとも80%が同時分離する。より好ましくは、組換え頻度は10%以下、例えば9%、8%、7%、6%、5%、4%、3%、2%、1%、0.5%、0.25%、または0.1%以下である。1つの典型的なクラスの実施形態では、密接に連鎖する遺伝子座は互いに5cM以下以内に存在する。
【0069】
当業者は理解しているはずであるが、組換え頻度(および、結果としてマッピング位置)は、使用するマップ(およびマップ上に存在するマーカー)に応じて変わる可能性がある。
図1および2中で同定したマーカーと(例えば、約20cM以内、あるいはより好ましくは約10cM以内、さらにより好ましくは5cM以内に)密接に連鎖する他のマーカーは、乳癌の素因のQTLを同定するために容易に使用することができる。
【0070】
マーカー遺伝子座は、それらが標的遺伝子座(例えば、乳癌の表現型のQTL、あるいは代替的に、それ自体がこのようなQTLと連鎖する単なる他のマーカー遺伝子座)と密接に連鎖し、したがってそれらがマーカーとして使用されるとき、本発明において特に有用である。表現型形質をコードするかあるいはそれに影響を与える標的遺伝子座とマーカーが密接に連鎖するほど、(標的遺伝子座とマーカーの間の低い交差頻度のため)マーカーは標的遺伝子座の良い指標である。したがって、一実施形態では、マーカー遺伝子座と第二の遺伝子座(例えば、
図1および2の所与のマーカー遺伝子座と他の第二の遺伝子座)などの密接に連鎖する遺伝子座は、約20%以下、例えば15%以下、好ましくは10%以下、より好ましくは約9%以下、さらにより好ましくは約8%以下、さらにより好ましくは約7%以下、さらにより好ましくは約6%以下、さらにより好ましくは約5%以下、さらにより好ましくは約4%以下、さらにより好ましくは約3%以下、およびさらにより好ましくは約2%以下の遺伝子座間交差頻度を示す。非常に好ましい実施形態では、関連遺伝子座(例えば、マーカー遺伝子座およびQTLなどの標的遺伝子座)は、約1%以下、例えば約0.75%以下、より好ましくは約0.5%以下、あるいはさらにより好ましくは約0.25%または0.1%以下の組換え頻度を示す。したがって遺伝子座は、約20cM、19cM、18cM、17cM、16cM、15cM、14cM、13cM、12cM、11cM、10cM、9cM、8cM、7cM、6cM、5cM、4cM、3cM、2cM、1cM、0.75cM、0.5cM、0.25cM、0または0.1cM以下離れている。言い換えると、同じ染色体、2遺伝子座間の組換えが20%未満(例えば、約19%、18%、17%、16%、15%、14%、13%、12%、11%、10%、9%、8%、7%、6%、5%、4%、3%、2%、1%、0.75%、0.5%、0.25%、0.1%以下)の頻度で起こるような距離に局在する2つの遺伝子座は、互いに「隣接している」と言える。一態様では、連鎖マーカーは100kb(局所の組換え率に応じて、これはヒトにおいて約0.1cMと相関する)、例えば互いに50kb、またはさらに20kb以下以内に存在する。
【0071】
乳癌の原因である遺伝的エレメントおよび隣接マーカーなどの、2つの連鎖した遺伝的エレメント間の関係を言及するとき、「相引」相連鎖は、形質遺伝子座における「好ましい」対立遺伝子が、それぞれの連鎖したマーカー遺伝子座の「好ましい」対立遺伝子と同じ染色体鎖上で物理的に結合している状態を示す。相引相では、両方の好ましい対立遺伝子が、その染色体鎖を受け継ぐ子孫によって一緒に受け継がれる。「相反」相連鎖では、当該の遺伝子座(例えば、乳癌のQTL)における「好ましい」対立遺伝子は、隣接するマーカー遺伝子座において「好ましくない」対立遺伝子と同じ染色体鎖上で物理的に結合しており、2つの「好ましい」対立遺伝子は一緒に受け継がれない(すなわち、2つの遺伝子座は互いに「不一致」である)。
【0072】
ゲノム、および対応する発現核酸およびポリペプチドにおけるSNPおよび他の多型の追跡以外に、mRNAまたはタンパク質形のいずれかである
図1および2の遺伝子産物に関する、個体または集団間の発現レベルの違いも乳癌と関連付けることができる。したがって、本発明のマーカーは、例えばゲノム遺伝子座、転写核酸、スプライシング核酸、発現タンパク質、転写核酸のレベル、スプライシング核酸のレベル、および発現タンパク質のレベルのいずれかを含むことができる。
【0073】
マーカー増幅戦略
マーカー(例えば、マーカー遺伝子座)を増幅させるための増幅プライマー、および多数のマーカー対立遺伝子に関してこのようなマーカーを検出するかあるいはサンプルの遺伝子型を決定するのに適したプローブは、本発明の特徴である。
図1および2中に、このようなプライマーの設計において知られている隣接配列と共に、増幅用の特定の遺伝子座を与える。例えば、長期PCR用のプライマーの設計は、2002年1月9日に出願されたUSSN10/042,406および2002年9月5日に出願されたUSSN10/236,480中に記載されており、短期PCRに関しては、2003年1月14日に出願されたUSSN10/341,832が、プライマーの選択に関する指針を与える。さらに、プライマーの設計に利用可能な「オリゴ」などの、公に利用可能なプログラムが存在する。このような利用可能なプライマーの選択および設計ソフトウェア、公に利用可能なヒトゲノム配列および
図1および2中に与えた多型の位置によって、当業者はプライマーを構築して、本発明のSNPを増幅することができる。さらに、SNPを含む核酸(例えば、SNPを含むアンプリコン)の検出に使用されるプローブは変わる可能性があり、例えば、検出するマーカーアンプリコンの領域を同定することができる任意のプローブを、本発明と共に使用することができることは理解されるはずである。さらに、検出用プローブの形状は、当然ながら変わる可能性がある。したがって本発明は、本明細書に列挙する配列に限られない。
【0074】
実際、増幅はマーカー検出の要件ではなく、例えば、ゲノムDNAのサンプルにサザンブロットを単に実施することによって、増幅されていないゲノムDNAを直接検出することができることは理解されるはずである。サザンブロッティング、標準的な増幅(PCR、LCRなど)および多くの他の核酸検出法を実施するための手順は充分確立されており、例えばSambrookら、Molecular Cloning−A Laboratory Manual(第3版)、1〜3巻、Cold Spring Harbor Laboratory、Cold Spring Harbor、New York、2000年(「Sambrook」); Current Protocols in Molecular Biology、F.M.Ausubelら編、Current Protocols、Greene Publishing Associates, Inc.とJohn Wiley & Sons, Inc.の間の合作(2002年中に増補)(「Ausubel」))およびPCR Protocols A Guide to Methods and Applications(Innisら、編) Academic Press Inc.San Diego、CA(1990年)(Innis)中で教示されている。
【0075】
例えば生成物への取り込み、アンプリコンへの標識ヌクレオチドの取り込み時の関連増幅プライマーの改変により生成物形成を検出するリアルタイム増幅反応を実施することによって、あるいは(例えば、蛍光偏光によって)非増幅前駆体と比較してアンプリコンの分子回転性の変化をモニタリングすることによって、増幅/検出法において別の検出用プローブを省略することもできる。
【0076】
典型的には、対立遺伝子特異的ハイブリダイゼーション(ASH)、1ヌクレオチド伸長の検出、アレイハイブリダイゼーション(場合によってはASHを含む)、または一塩基多型(SNP)の検出、増幅断片長多型(AFLP)の検出、増幅した可変配列の検出、ランダムに増幅した多型DNA(RAPD)の検出、制限断片長多型(RFLP)の検出、自律的配列複製の検出、単純配列反復単位(SSR)の検出、一本鎖形状多型(SSCP)の検出、アイソザイムマーカーの検出、ノーザン分析(この場合、発現レベルをマーカーとして使用する)、mRNAまたはcDNAの定量増幅などに関する他の方法を非制限的に含めた、当技術分野で利用可能な任意の確立した方法によって分子マーカーを検出する。図面中に与える例示的なマーカーはSNPマーカーであるが、任意の前述のマーカー型を本発明の文脈において使用して、乳癌の表現型と相関する連鎖した遺伝子座を同定することができる。
【0077】
マーカー検出のための例示的な技法
本発明は、乳癌の表現型のQTLを含むかあるいはそれと連鎖する分子マーカーを提供する。これらのマーカーは、疾患の素因の診断、予後判定、処置などにおいて用途が見出される。本発明がこれらのマーカーを検出するためのいずれか特定の方法に限られることは考えられない。
【0078】
集団の要素間の遺伝的多型に対応するマーカーは、当技術分野で充分確立されている多数の方法(例えば、PCRに基づく配列特異的増幅法、制限断片長多型(RFLP)、アイソザイムマーカー、ノーザン分析、対立遺伝子特異的ハイブリダイゼーション(ASH)、アレイに基づくハイブリダイゼーション、増幅したゲノムの可変配列、自律的配列複製、単純配列反復単位(SSR)、一塩基多型(SNP)、ランダムに増幅した多型DNA(「RAPD」)または増幅断片長多型(AFLP)によって検出することができる。他の一実施形態では、分子マーカーの存在または不在は、多型マーカー領域のヌクレオチドのシークエンシングによって容易に決定する。任意のこれらの方法を、高スループット分析に容易に適合させる。
【0079】
遺伝子マーカーを検出するための幾つかの技法は、プローブ核酸と遺伝子マーカーに対応する核酸(例えば、鋳型としてゲノムDNAを使用して生成した増幅核酸)とのハイブリダイゼーションを使用する。ハイブリダイゼーション形式には、溶液相、固体相、混合相があるが、これらだけには限られず、あるいはin situハイブリダイゼーションアッセイが対立遺伝子の検出に有用である。核酸のハイブリダイゼーションの広範囲の指針は、Tijssen(1993年)Laboratory Techniques in Biochemistry and Molecular Biology−−Hybridization with Nucleic Acid Probes Elsevier、New York中、およびSambrook、BergerおよびAusubel中に見られる。
【0080】
例えば、制限断片長多型(RFLP)を含むマーカーは、例えば典型的には検出する核酸の小断片(または小断片に対応する合成オリゴヌクレオチド)であるプローブと、制限酵素により消化したゲノムDNAをハイブリダイズさせることによって検出する。異なる個体または集団において制限酵素を選択して、少なくとも2つの他の(または多型)長さの制限断片を与える。マーカーの各対立遺伝子に関する情報を与える断片を生成する1つ以上の制限酵素の決定は単純な手順であり、当技術分野でよく知られている。適切なマトリクス(例えば、アガロースまたはポリアクリルアミド)における長さによる分離および膜(例えば、ニトロセルロース、ナイロンなど)への移動後、標識プローブをプローブと標的の平衡結合をもたらす条件下でハイブリダイズさせ、次に過剰なプローブを洗浄によって除去する。
【0081】
マーカー遺伝子座に対する核酸プローブは、クローニングおよび/または合成することができる。任意の適切な標識を、本発明のプローブと共に使用することができる。核酸プローブと共に使用するのに適した検出可能な標識には、例えば分光、放射性同位体、光化学、生化学、免疫化学、電気、光学または化学手段によって検出可能な任意の組成物がある。有用な標識には、標識ストレプトアビジン複合体の染色用ビオチン、磁気ビーズ、蛍光色素、放射標識、酵素、および比色分析用標識がある。他の標識には、蛍光色素分子、化学発光物質、および酵素で標識した抗体と結合したリガンドがある。プローブは、放射標識アンプリコンを作製するために使用される放射標識PCRプライマーも構成し得る。核酸を標識するための標識戦略および対応する検出戦略は、例えばMolecular Probes, Inc.(Eugene OR)によるHaugland(2003年)Handbook of Fluorescent Probes and Research Chemicals第9版中で見ることができる。マーカー検出戦略に関する他の詳細は以下で見られる。
【0082】
増幅に基づく検出法
PCR、RT−PCRおよびLCRは、当該の核酸(例えば、マーカー遺伝子座を含む核酸)を増幅させるための増幅および増幅検出法として特に広く使用されており、当該の核酸の検出を容易にする。これらおよび他の増幅法の使用に関する詳細は、例えばSambrook、AusubelおよびBergerを含めた任意の様々な標準的教本中で見ることができる。多くの入手可能な生物学教本は、PCRおよび関連増幅法に関する考察も広げている。当業者は、ほぼ任意のRNAを、制限酵素による消化、逆転写酵素およびポリメラーゼを使用するPCR増幅およびシークエンシング(「逆転写PCR」、または「RT−PCR」)に適した二本鎖DNAに転換することができることを理解しているはずである。Ausubel、Sambrook、およびBerger、上記も参照。これらの方法を使用してmRNAまたは対応するcDNAを定量的に増幅し、個体中の
図1および2の遺伝子または遺伝子産物に対応する遺伝子産物に対応するmRNAの発現レベルの指標を与えることもできる。個体、家族、系および/または集団間のこれらの遺伝子の発現レベルの違いは、乳癌の表現型のマーカーとして使用することができる。
【0083】
リアルタイム増幅/検出法
一態様では、リアルタイムPCRまたはLCRを、例えば分子指標またはTaqMan
TMプローブを使用して、本明細書に記載する増幅混合物に実施する。分子指標(MB)は、適切なハイブリダイゼーション条件下でセルフハイブリダイズしてステムおよびループ構造を形成する、オリゴヌクレオチドまたはPNAである。MBはオリゴヌクレオチドまたはPNAの末端に標識および消光物質を有し、したがって、分子間ハイブリダイゼーションを可能にする条件下では、標識は消光物質によって典型的には消光される(あるいは少なくともその蛍光が変わる)。MBが分子間ハイブリダイゼーションを示さない条件下では(例えば、標的核酸、例えば増幅中のアンプリコンの領域と結合するとき)、MB標識は非消光状態である。MBを作製および使用する標準的な方法に関する詳細は、文献中で充分確立されており、MBは幾つかの市販の試薬供給源から入手可能である。例えば、Leoneら(1995年)「Molecular beacon probes combined with amplification by NASBA enable homogenous real−time detection of RNA.」Nucleic Acids Res.26:2150〜2155頁; TyagiおよびKramer(1996年)「Molecular beacons: probes that fluoresce upon hybridization」Nature Biotechnology14:303〜308頁; BlokおよびKramer(1997年)「Amplifiable hybridization probes containing a molecular switch」Mol Cell Probes11:187〜194頁; Hsuihら、(1997年)「Novel、ligation−dependent PCR assay for detection of hepatitis C in serum」J Clin Microbiol34:501〜507頁; Kostrikisら、(1998年)「Molecular beacons: spectral genotyping of human alleles」Science279:1228〜1229頁; Sokolら、(1998年)「Real time detection of DNA:RNA hybridization in living cells」Proc.Natl.Acad.Sci.U.S.A.95:11538〜11543頁;Tyagiら、(1998年)「Multicolor molecular beacons for allele discrimination」Nature Biotechnology16:49〜53頁; Bonnetら、(1999年)「Thermodynamic basis of the chemical specificity of structured DNA probes」Proc.Natl.Acad.Sci.U.S.A.96:6171〜6176頁; Fangら、(1999年)「Designing a novel molecular beacon for surface−immobilized DNA hybridization studies」J.Am.Chem.Soc.121:2921〜2922頁; Marrasら、(1999年)「Multiplex detection of single−nucleotide variation using molecular beacons」Genet.Anal.Biomol.Eng.14:151〜156頁;およびVetら、(1999年)「Multiplex detection of four pathogenic retroviruses using molecular beacons」Proc.Natl.Acad.Sci.U.S.A.96:6394〜6399頁も参照。MB構築およびその使用に関する他の詳細は、特許文献、例えば、「Detectably labeled dual conformation oligonucleotide probes、assays and kits」という表題のTyagiらへの米国特許第5,925,517号(1999年7月20日)、「Nucleic acid detection probes having non−FRET fluorescence quenching and kits and assays including such probes」という表題のTyagiらへの米国特許第6,150,097号(2000年11月21日)、および「Wavelength−shifting probes and primers and their use in assays and kits」という表題のTyagiらへの米国特許第6,037,130号(2000年3月14日)中に見られる。
【0084】
「TaqMan
TM」プローブと一般に呼ばれる二重標識蛍光性オリゴヌクレオチドプローブを使用する、PCRによる検出および定量化も、本発明により実施することができる。これらのプローブは、2つの異なる蛍光色素で標識された短い(例えば、20〜25塩基の)オリゴデオキシヌクレオチドから構成される。各プローブの5’末端にはレポーター色素が存在し、各プローブの3’末端には消光色素が見られる。オリゴヌクレオチドプローブ配列は、PCRアンプリコンに存在する内部標的配列と相補的である。プローブが完全状態であるとき、2つの蛍光色素分子の間でエネルギーの移動が起こり、FRETにより消光物質によってレポーターからの発光が消される。PCRの伸長期中、プローブは反応中に使用されるポリメラーゼの5’ヌクレアーゼ活性によって切断され、それによってオリゴヌクレオチド−消光物質からレポーターが放出され、レポーターの発光強度の増大を生み出す。したがって、TaqMan
TMプローブは標識および消光物質を有するオリゴヌクレオチドであり、その標識は増幅中に使用されるポリメラーゼのエクソヌクレアーゼ作用によって増幅中に放出される。これは、合成中の増幅のリアルタイム測定をもたらす。様々なTaqMan
TM試薬が、例えばApplied Biosystems(Division Headquarters in Foster City、CA)から、およびBiosearch Technologiesなどの様々な専門業者から市販されている(例えば、ブラックホール消光物質プローブ)。二重標識プローブ戦略に関する他の詳細は、例えばWO92/02638中に見ることができる。
【0085】
他の同様の方法には、例えば米国特許第6,174,670号中に記載された「LightCycler(登録商標)」形式を使用する、例えば2つの隣接してハイブリダイズしたプローブ間の蛍光共鳴エネルギー移動がある。
【0086】
アレイに基づくマーカー検出
アレイに基づく検出は、例えばAffymetrix(Santa Clara、CA)または他の製造者からの、市販のアレイを使用して実施することができる。核酸アレイの操作に関する総説は、Sapolskyら、(1999年)「High−throughput polymorphism screening and genotyping with high−density oligonucleotide arrays.」Genetic Analysis: Biomolecular Engineering14:187〜192頁; Lockhart(1998年)「Mutant yeast on drugs」Nature Medicine4:1235〜1236頁; Fodor(1997年)「Genes、Chips and the Human Genome.」FASEB Journal11:A879;Fodor(1997年)「Massively Parallel Genomics.」Science277:393〜395頁;およびCheeら、(1996年)「Accessing Genetic Information with High−Density DNA Arrays.」Science274:610〜614頁を含む。アレイに基づく検出の本質的に高いスループット性のため、アレイに基づく検出は、サンプル中の本発明のマーカーを同定するのに好ましい方法である。
【0087】
様々なプローブアレイが文献中に記載されてきており、本明細書に記す表現型と相関し得るマーカーの検出に関する本発明の文脈において使用することができる。例えば、DNAプローブアレイチップまたはさらに大きなDNAプローブアレイウエハ(そこから個々のチップが、ウエハの破壊によって他の場合得られるはずである)を、本発明の一実施形態において使用する。DNAプローブアレイウエハは一般に、その上に高密度のDNAプローブ(DNAの短いセグメント)のアレイが配置しているガラスウエハを含む。これらのウエハのそれぞれは、さらに長いサンプルDNA配列(例えば、個体または集団由来の当該のマーカーを例えば含む)を認識するために使用される約6千万個のDNAプローブを、例えば保持することができる。ガラスウエハ上のDNAプローブのセットによるサンプルDNAの認識は、DNAハイブリダイゼーションによって行う。DNAサンプルがDNAプローブのアレイとハイブリダイズすると、そのサンプルはサンプルDNAの配列と相補的なプローブと結合する。個体のサンプルDNAがどのプローブとより強くハイブリダイズするかを評価することによって、核酸の知られている配列がサンプル中に存在するかあるいはしないかを判定することができ、したがってその核酸において見られるマーカーが存在するかどうかを判定することができる。ハイブリダイゼーション条件を調節して、例えばSNP同定用、および1つ以上のSNPのサンプルの遺伝子型決定用に、単一ヌクレオチドの識別を可能にすることによって、この手法を使用してASHを実施することもできる。アレイは、多数の多型マーカーを同時に(あるいは連続して)検出するのに好都合な一実施形態を与える。例えば、本明細書に記す多型(またはそれらと連鎖する多型)のいずれかまたは全てを同時に検出して乳癌易罹患性の表現型を割り当てる、乳癌易罹患性の検出用アレイを構築することができる。当然ながら、任意の検出技術(PCR、LCR、リアルタイムPCRなど)を、例えば、多重増幅/検出反応と共に、あるいは例えば同時にあるいは連続して単に幾つかの別の反応を実施することによって、同様に使用することができる。
【0088】
対立遺伝子の情報を得るためのDNAプローブアレイの使用は、以下の一般的なステップ:DNAプローブアレイの設計および製造、サンプルの調製、サンプルDNAとアレイのハイブリダイゼーション、ハイブリダイゼーション事象の検出および配列を決定するためのデータ分析を典型的には含む。好ましいウエハは、コスト効率および高品質を得るための半導体製造から適合させた方法を使用して製造され、これらは例えばAffymetiix, Inc of Santa Clara、Californiaから入手可能である。
【0089】
例えば、固相化学合成と半導体産業において使用されるフォトリソグラフィーによる製造技法を組合せた、光誘導型の化学合成法によって、プローブアレイを製造することができる。チップ露光部位を画定するための一連のフォトリソグラフィーマスク、次に特異的化学合成ステップを使用することによって、このプロセスは、各プローブがアレイ中の所定の位置に存在する高密度のオリゴヌクレオチドのアレイを構築する。多数のプローブアレイを、大きなガラスウエハ上で同時に合成することができる。この平行プロセスは再現性を高め、一定規模の経済利益の達成を手助けする。
【0090】
ひとたび製造した後、DNAプローブアレイを使用して、当該のマーカーの存在および/または発現レベルに関するデータを得ることができる。標準的な生化学法によりビオチンおよび/または蛍光レポーター基を用いて、DNAサンプルをタグ化することができる。標識したサンプルはアレイと共にインキュベートし、サンプルのセグメントはアレイ上の相補的配列と結合するか、あるいはハイブリダイズする。アレイを洗浄および/または染色して、ハイブリダイゼーションパターンを生み出すことができる。次いでアレイをスキャンし、ハイブリダイゼーションのパターンは蛍光レポーター基からの発光によって検出する。これらの手順に関する他の詳細は、以下の実施例中に見られる。アレイ上の各プローブの同一性および位置は知られているので、アレイに施用するサンプル中のDNA配列の性質を決定することができる。これらのアレイを遺伝子型決定の実験に使用するとき、それらは遺伝子型決定用アレイと呼ぶことができる。既に記したように、本明細書、例えば
図1および/または
図2中に記す多型のいずれかまたは全ての遺伝子型を検出して、例えば乳癌素因の表現型を割り当てることができる。
【0091】
分析する核酸サンプルは単離し、増幅させ、および典型的にはビオチンおよび/または蛍光レポーター基を用いて標識する。標識した核酸サンプルは、流動ステーションおよびハイブリダイゼーション用オーブンを使用して、次いでアレイと共にインキュベートする。検出法に応じて適切に、アレイを洗浄およびまたは染色あるいは対比染色することができる。ハイブリダイゼーション、洗浄および染色後、アレイをスキャナに挿入し、そこでハイブリダイゼーションのパターンを検出する。ハイブリダイゼーションのデータは、標識核酸中に既に取り込まれており現在プローブアレイと結合している蛍光レポーター基から発せられた光として集める。標識核酸と最も明らかに合致するプローブは、ミスマッチを有するプローブより強いシグナルを生成する。アレイ上の各プローブの配列および位置は知られているので、相補性によって、プローブアレイに施用する核酸サンプルの同一性を同定することができる。
【0092】
一実施形態では、2つのDNAサンプルを示差的に標識し、設計した遺伝子型決定用アレイの一組とハイブリダイズさせることができる。このようにして、二組のデータを同じ物理的アレイから得ることができる。使用することができる標識には、cychrome、フルオレセイン、またはビオチン(ハイブリダイゼーション後にフィコエリスリン−ストレプトアビジンで後に染色される)があるが、これらだけには限られない。二色標識は、その全容が参照により本明細書に組み込まれる米国特許第6,342,355号中に記載されている。各アレイは2つの標識からのシグナルを同時に検出するようにスキャンすることができ、あるいは2回スキャンして各シグナルを別々に検出することができる。
【0093】
マーカーの存在に関して試験する各個体用の全てのマーカーに関する強度データを、スキャナによって集める。測定した強度は、所与の個体のサンプル中に存在する特定のマーカーの量を示す指標である(ゲノムまたは発現核酸を分析するかどうかに応じて、個体中に存在する対立遺伝子の発現レベルおよび/またはコピー数)。これを使用して、個体が当該のマーカーに関して同型または異型であるかどうか決定することができる。強度データを処理して、様々な強度の対応するマーカーの情報を与える。
【0094】
増幅させた可変配列、SSR、AFLPASH、SNPおよびアイソザイムマーカーに関する他の詳細
増幅させた可変配列は、同種のメンバー間で高い核酸残基の変動性を示すゲノムの増幅配列を指す。全ての生物は様々なゲノム配列を有しており、それぞれの生物(クローン、例えばクローン細胞以外)は、異なる組の可変配列を有する。ひとたび同定した後、特定の可変配列の存在を使用して表現型形質を予想することができる。ゲノムからのDNAは、DNAの可変配列と隣接するプライマーを用いた増幅用の鋳型として働くことが好ましい。可変配列を増幅させ、次いで配列決定する。
【0095】
あるいは、自律的配列複製を使用して遺伝子マーカーを同定することができる。自律的配列複製は、レトロウイルス複製と関係がある3つの酵素活性:(1)逆転写酵素、(2)RnaseH、および(3)DNA依存性RNAポリメラーゼ(Guatelliら、(1990年)Proc Natl Acad Sci USA87:1874頁)を使用することにより、実質的に等温である条件下においてin vitroで指数関数的に複製する標的核酸配列を使用する、核酸増幅の方法を指す。cDNA中間体によるRNA複製のレトロウイルス戦略を模倣することによって、この反応は元の標的のcDNAおよびRNAのコピーを蓄積させる。
【0096】
増幅断片長多型(AFLP)を、遺伝子マーカーとして使用することもできる(Vosら、(1995年)Nucl Acids Res23:4407頁)。語句「増幅断片長多型」は、制限エンドヌクレアーゼによる切断前後に増幅させる選択した制限断片を指す。増幅ステップは、特異的制限断片の容易な検出を可能にする。AFLPは多数の多型マーカーの検出を可能にし、遺伝子マッピングに使用されてきている(Beckerら、(1995年)Mol Gen Genet249:65頁;およびMeksemら、(1995年)Mol Gen Genet249:74頁)。
【0097】
対立遺伝子特異的ハイブリダイゼーション(ASH)を使用して、本発明の遺伝子マーカーを同定することができる。ASH技術は、短い一本鎖オリゴヌクレオチドプローブの完全に相補的な一本鎖標的核酸への安定したアニーリングに基づく。プローブと結合した等方性または非等方性標識によって、検出を実施することができる。
【0098】
それぞれの多型用に、多型ヌクレオチド以外同一のDNA配列を有する、2つ以上の異なるASHプローブを設計する。それぞれのプローブは1つの対立遺伝子配列と正確な相同性を有するはずであり、したがってこの範囲のプローブは、全ての知られている他の対立遺伝子配列を識別することができる。それぞれのプローブは標的DNAとハイブリダイズする。適切なプローブ設計およびハイブリダイゼーション条件では、プローブと標的DNAとの間の一塩基のミスマッチがハイブリダイゼーションを妨げるはずである。このようにして、他のプローブの1つのみが、同型であるかあるいは対立遺伝子が同型である標的サンプルとハイブリダイズするはずである。異型であるかあるいは2つの対立遺伝子が異型であるサンプルは、2つの他のプローブの両方とハイブリダイズするはずである。
【0099】
ASHマーカーは優性マーカーとして使用され、この場合ただ1つの対立遺伝子の存在または不在が、ただ1つのプローブによってハイブリダイゼーションまたはハイブリダイゼーションの欠如から決定される。他の対立遺伝子は、ハイブリダイゼーションの欠如から推測することができる。ASHプローブおよび標的分子は場合によってはRNAまたはDNAであり、標的分子はプローブと相補的である配列を超える任意の長さのヌクレオチドであり、プローブはDNA標的のいずれかの鎖とハイブリダイズするように設計されており、プローブは様々な厳しいハイブリダイゼーション条件などに適合するようにサイズが様々である。
【0100】
PCRによって、比較的小体積で低濃度の核酸からのASHの標的配列の増幅が可能である。他の場合、ゲノムDNAからの標的配列を制限エンドヌクレアーゼで消化し、ゲル電気泳動によってサイズにより分離する。膜の表面と結合した標的配列とのハイブリダイゼーションが典型的には起こり、あるいは、米国特許第5,468,613号中に記載されたのと同様に、ASHプローブ配列を膜と結合させることが可能である。
【0101】
一実施形態では、PCRを使用してゲノムDNAから核酸断片(アンプリコン)を増幅させること、ドット−ブロット形式でアンプリコン標的DNAを膜に移すこと、標識したオリゴヌクレオチドプローブとアンプリコン標的をハイブリダイズさせること、およびオートラジオグラフィーによりハイブリダイゼーションドットを観察することによって、ASHデータを典型的には得る。
【0102】
一塩基多型(SNP)は、単一ヌクレオチドに基づいて区別される共通の配列からなるマーカーである。典型的にはこの違いは、例えばアクリルアミドゲル上でのSNPを含むアンプリコンの示差的な移動パターンによって検出する。しかしながら、他の形態の検出、ハイブリダイゼーションなど、例えばASH、またはRFLP分析あるいはアレイに基づく検出も適切である。
【0103】
アイソザイムマーカーを遺伝子マーカーとして使用して、例えば本明細書のマーカーと連鎖するアイソザイムマーカーを追跡することができる。アイソザイムは、それらのアミノ酸、したがってそれらの核酸配列が互いに異なる多形の酵素である。幾つかのアイソザイムは、わずかに異なるサブユニットを含むマルチマー酵素である。他のアイソザイムはマルチマーまたはモノマーのいずれかであるが、アミノ酸配列中の異なる部位でプロ酵素から切断されている。アイソザイムはタンパク質レベルで特徴付けおよび分析することができ、あるいは代替的に、核酸レベルで異なるアイソザイムを決定することができる。このような場合、本明細書に記載する核酸に基づく方法のいずれかを使用して、アイソザイムマーカーを分析することができる。
【0104】
核酸増幅に関する他の詳細
記したように、PCRおよびLCRなどの核酸増幅技法は当技術分野でよく知られており、本発明に適用して、マーカー遺伝子座を含む核酸などの当該の核酸を増幅および/または検出することができる。ポリメラーゼ連鎖反応(PCR)、リガーゼ連鎖反応(LCR)、Qβ−レプリカーゼ増幅および他のRNAポリメラーゼ介在技法(例えば、NASBA)を含めたこのようなin vitro法によって当業者が実施するのに充分な技法の例は、前に記した参照文献、例えばInnis、Sambrook、Ausubel、およびBerger中で見られる。他の詳細はMullisら、(1987年)米国特許第4,683,202号;Arnheim & Levinson(1990年10月1日)C&EN36〜47頁;The Journal Of NTH Research(1991年)3、81〜94頁;(Kwohら、(1989年)Proc.Natl.Acad.Sci.USA86、1173頁;Guatelliら、(1990年)Proc.Natl.Acad.Sci.USA87、1874頁;Lomeliら、(1989年)J.Clin.Chem35、1826頁;Landegrenら、(1988年)Science241、1077〜1080頁;Van Brunt(1990年)Biotechnology8、291〜294頁;WuおよびWallace、(1989年)Gene4、560頁;Barringerら、(1990年)Gene89、117頁、およびSooknananおよびMalek(1995年)Biotechnology13:563〜564頁中で見られる。本明細書の多型(
図1および/または2)と連鎖した遺伝子のポジショナルクローニングの文脈において有用である、PCRにより多量の核酸を増幅する改良法は、Chengら、(1994年)Nature、369:684頁、およびその中の参照文献中にさらに要約されており、その中で40kbまでのPCRアンプリコンが生成する。長期PCR用の方法は、例えば「Algorithms for Selection of Primer Pairs」という表題の2002年1月9日に出願された米国特許出願第10/042,406号、「Methods for Amplification of Nucleic Acids」という表題の2002年9月9日に出願された米国特許出願第10/236,480号、および「Methods for Amplification of Nucleic Acids」という表題の2004年5月25日に発行された米国特許第6,740,510号中に開示されている。(2003年1月14日に出願された)USSN10/341,832も、短期PCRを実施するためのプライマー選択法に関する詳細を与える。
【0105】
タンパク質発現産物の検出
図1および/または2中に記す遺伝子によってコードされるタンパク質などのタンパク質は、本明細書の当該の表現型と相関するマーカーを含む核酸を含めた核酸によってコードされる。RNAへのタンパク質へのDNAの発現(転写および/または翻訳)を含めた、分子生物学の基本範例の記載に関しては、Albertsら、(2002年)Molecular Biology of the Cell、第4版、Taylor and Francis, Inc.、ISBN:0815332181(「Alberts」)、およびLodishら、(1999年)Molecular Cell Biology、第4版、W H Freeman & Co、ISBN:071673706X(「Lodish」)を参照。したがって、
図1および/または2中の遺伝子に対応するタンパク質は、例えば個体または集団間の異なるタンパク質イソ型を検出することによって、あるいは当該のこのようなタンパク質(例えば、
図1および/または2の遺伝子産物)の示差的存在、不在または発現レベルを検出することによって、マーカーとして検出することができる。
【0106】
様々なタンパク質検出法が知られており、これらを使用してマーカーを区別することができる。前に記した様々な参照文献以外に、例えばR.Scopes、Protein Purification、Springer−Verlag、N.Y.(1982年);Deutscher、Methods in Enzymology182巻: Guide to Protein Purification、Academic Press, Inc.N.Y. (1990年);Sandana(1997年)Bioseparation of Proteins、Academic Press, Inc.; Bollagら、(1996年)Protein Methods、第2版、Wiley−Liss、NY; Walker(1996年)The Protein Protocols Handbook Humana Press、NJ、Harris and Angal(1990年)Protein Purification Applications: A Practical Approach IRL Press at Oxford、Oxford、England; Harris and Angal Protein Purification Methods: A Practical Approach IRL Press at Oxford、Oxford、England; Scopes(1993年)Protein Purification: Principles and Practice第3版、Springer Verlag、NY; Janson and Ryden(1998年)Protein Purification: Principles、High Resolution Methods and Applications、第2版、Wiley−VCH、NY;およびWalker(1998年) Protein Protocols on CD−ROM Humana Press、NJ;およびこれらの中に列挙された参照文献中に述べられた方法を含めた、様々なタンパク質の操作法および検出法が当技術分野でよく知られている。タンパク質の精製および検出法に関する他の詳細は、Satinder Ahuja編、Handbook of Bioseparations、Academic Press(2000年)中に見ることができる。
【0107】
多くのタンパク質を同時に検出する「プロテオーム」検出法が記載されてきている。これらは様々な多次元電気泳動法(例えば、2次元ゲル電気泳動)、質量分析に基づく方法(例えばSELDI、MALDI、エレクトロスプレーなど)、または表面プラズモン共鳴法を含み得る。例えばMALDIでは、サンプルは通常適切なマトリクスと混合させ、プローブの表面に置き、レーザー脱離/イオン化によって調べる。MALDIの技法は当技術分野でよく知られている。例えば、米国特許第5,045,694号(Beavisら)、米国特許第5,202,561号(Gleissmannら)、および米国特許第6,111,251号(Hillenkamp)を参照。同様に、SELDIに関しては、第一の等分試料を固相担体と結合した(例えば、支持体と結合した)吸着剤と接触させる。支持体は典型的には、気相イオン分光計と呼掛け信号の関係で位置することができるプローブ(例えば、バイオチップ)である。SELDIもよく知られている技法であり、プロテオーム診断適用されている。例えば、Issaqら、(2003年)「SELDI−TOF MS for Diagnostic Proteomics」 Analytical Chemistry75:149A〜155A頁を参照。
【0108】
一般に、前述の方法を使用してタンパク質の異なる形(対立遺伝子)を検出することができ、かつ/あるいはこれらを使用して、個体、家族、系、集団などの間の(対立遺伝子の差異が原因である可能性がある)タンパク質の異なる発現レベルを検出することができる。発現レベルの違いは、環境因子を調節するとき、コードされる示差的に発現されるタンパク質自体が同一である場合でも、当該の遺伝子のQTLにおける異なる対立遺伝子を示し得る。これは例えば、非コード領域、例えば遺伝子発現を調節するプロモーターまたはエンハンサーなどの領域中に、多数の対立遺伝子形の遺伝子が存在する場合に起こる。したがって、示差的発現レベルの検出は、対立遺伝子の違いを検出する方法として使用することができる。
【0109】
本発明の他の態様では、乳癌の表現型と関係がある核酸を含む、それと連鎖不均衡である、あるいはその制御下にある遺伝子は、示差的な対立遺伝子の発現を示す可能性がある。本明細書で使用する「示差的な対立遺伝子の発現」は、細胞中に存在する1つの遺伝子の多数の対立遺伝子の対立遺伝子の発現の定性的差異と定量的差異の両方を指す。このように、示差的な対立遺伝子の発現を示す遺伝子は、同じ細胞/組織中の第二の対立遺伝子と比較して、異なる時間またはレベルで発現される1つの対立遺伝子を有し得る。例えば、乳癌の表現型と関係がある対立遺伝子は、両者が同じ遺伝子の対立遺伝子であり同じ細胞/組織中に存在する場合でさえ、乳癌の表現型と関係がない対立遺伝子より高いまたは低いレベルで発現される可能性がある。示差的な対立遺伝子の発現および分析法は、いずれも「Allele−specific expression patterns」という表題である2003年5月13日に出願された米国特許出願第10/438,184号および2004年5月12日に出願された米国特許出願第10/845,316号中に詳細に開示されている。乳癌の表現型と関係がある1つ以上の核酸、またはその断片、誘導体、多型、変異体または相補体の示差的な対立遺伝子の発現パターンの検出は乳癌に対する易罹患性/耐性の予後判定および診断であり、同様に、乳癌の表現型と関係がある1つ以上の核酸、またはその断片、誘導体、多型、変異体または相補体の示差的な対立遺伝子の発現パターンの検出は、乳癌および乳癌処置の結果の予後判定および診断である。
【0110】
スクリーニングに適したマーカー型に関する他の詳細
本明細書の表現型との相関関係に関してスクリーニングされる生物学的マーカーは、スクリーニングによって検出することができる任意のマーカー型、例えば(例えばSNPと同様の)遺伝子座の対立遺伝子変異体などの遺伝子マーカー、発現マーカー(例えば、mRNAおよび/またはタンパク質の発現または量)などであってよい。
【0111】
本発明の方法中で増幅、転写、翻訳および/または検出される当該の核酸は、ほぼ任意の核酸であってよいが、ヒト供給源由来の核酸が、疾患の診断および臨床用途と関係があるマーカーの検出と特に関係がある。
図1および/または2の遺伝子/タンパク質を含めた、多くの核酸およびアミノ酸(そこから逆翻訳によって核酸配列を誘導することができる)の配列が利用可能である。知られている核酸の一般的な配列保存場所には、GenBank(登録商標)EMBL、DDBJおよびNCBIがある。他の保存場所は、インターネットを検索することによって容易に同定することができる。増幅、転写、翻訳および/または検出される核酸は、RNA(例えば増幅がRT−PCRまたはLCRを含む場合、Van−Gelder Eberwine反応またはRibo−SPIA)またはDNA(例えば、増幅DNA、cDNAまたはゲノムDNA)、あるいはさらにその任意の類似体(例えば、合成核酸またはその類似体の検出用、例えば、当該のサンプルが人造核酸を含む、あるいは人造核酸を誘導または合成するために使用される場合)であってよい。個体または集団間の核酸配列または発現レベルの任意の変化は、マーカー、例えば突然変異、多型、一塩基多型(SNP)、対立遺伝子、イソ型、RNAまたはタンパク質の発現などとして検出することができる。乳癌の表現型と相関する可能性があるマーカーとして、配列、発現レベルまたは遺伝子のコピー数の変化を検出することができる。
【0112】
例えば本発明の方法は、患者由来、例えば患者の体液(血液、唾液、尿など)、生検、組織、および/または排泄物由来のサンプルを、当該のマーカー核酸に関してスクリーニングする際に有用である。したがって、組織生検、大便、喀痰、唾液、血液、リンパ液、涙、汗、尿、膣分泌液、射精液などは、本発明の方法により核酸に関して容易にスクリーニングすることができ、適切な核酸を含むほぼ任意の当該の組織をスクリーニングすることができる。これらのサンプルは典型的には、標準的な医学的試験法によって患者から、インフォームドコンセント後に採取する。
【0113】
マーカーを含む核酸の増幅および/または検出前に、任意の利用可能な方法、例えばBerger and Kimmel, Guide to Molecular Cloning Techniques、Methods in Enzymology 152巻 Academic Press, Inc.、San Diego、CA(Berger); Sambrookら、Molecular Cloning−A Laboratory Manual(第3版)、1〜3巻、Cold Spring Harbor Laboratory、Cold Spring Harbor、New York、2001年(「Sambrook」);および/またはCurrent Protocols in Molecular Biology、F.M.Ausubelら編、Current Protocols、Greene Publishing Associates, Inc.とJohn Wiley & Sons, Inc.の間の合作(2002年中に増補)(「Ausubel」))中に教示された方法によって、サンプルから核酸を場合によっては精製する。細胞または他のサンプルから核酸を精製するための多量のキットも市販されている(例えば、いずれもPharmacia BiotechからのEasyPrep
TM、FlexiPrep
TM;StratageneからのStrataClean
TM;およびQiagenからのQIAprep
TMを参照)。あるいは、例えば等分および/または希釈後に、サンプルを単に増幅または検出に直接施すことができる。
【0114】
マーカーの例は、多型、一塩基多型、サンプル中の1つ以上の核酸の存在、サンプル中の1つ以上の核酸の不在、1つ以上のゲノムDNA配列の存在、1つ以上のゲノムDNA配列の不在、1つ以上のmRNAの存在、1つ以上のmRNAの不在、1つ以上のmRNAの発現レベル、1つ以上のタンパク質の存在、1つ以上のタンパク質の発現レベル、および/または前述のいずれかから誘導されるデータまたはこれらの組合せを含むことができる。利用可能な方法を使用して、例えば高密度、高スループットマーカーマッピングを与えるアレイ技術を使用して、ほぼ任意の数のマーカーを検出することができる。したがって、少なくとも約10、100、1,000、10,000、あるいはさらに100,000以上の遺伝子マーカーを、第一および/または第二集団中の関連表現型との相関関係に関して、同時または連続形式(あるいはこれらの組合せ)で試験することができる。望ましくはマーカーの組合せを試験して、例えば表現型と相関する集団中の遺伝子の組合せまたは発現パターンの組合せを同定することもできる。
【0115】
記したように、検出される生物学的マーカーは、任意の検出可能な生物学的要素であってよい。一般に検出されるマーカーには、遺伝子マーカー(例えば、ゲノムDNAまたはその発現産物中に存在するDNA配列マーカー)および(遺伝的にコードされる因子、環境因子、あるいは両方を反映し得る)発現マーカーがある。マーカーが発現マーカーである場合、方法は第一の個体または集団に関する第一の発現プロファイル(例えば、1つ以上の発現マーカーの、例えば一組の発現マーカー)を測定すること、および第一の発現プロファイルと第二の個体または集団に関する第二の発現プロファイルを比較することを含むことができる。この実施例では、発現マーカーと個々の表現型との関連付けは、第一または第二の発現プロファイルと当該の表現型との関連付けを含むことができる。
【0116】
プローブ/プライマー合成法
一般に、プローブ、プライマー、分子指標、PNA、LNA(固定核酸)などを含めたオリゴヌクレオチドを作製するための合成法はよく知られている。例えばNeedham−VanDevanterら、(1984年)Nucleic Acids Res.、12:6159〜6168頁中に記載されたのと同様に、例えば市販の自動合成装置を使用して、例えば、BeaucageおよびCaruthers(1981年)、Tetrahedron Letts.、22(20):1859〜1862頁により記載された固相ホスホラミダイトトリエステル法によって、オリゴヌクレオチドを化学的に合成することができる。修飾オリゴヌクレオチドを含めたオリゴヌクレオチドは、当業者に知られている様々な市販の供給元から注文することもできる。多くのオリゴ合成サービスの供給業者が存在し、したがってこれは広く利用可能な技術である。The Midland Certified Reagent Company(mere@oligos.com)、The Great American Gene Company(www.genco.com)、ExpressGen Inc.(www.expressgen.com)、Operon Technologies Inc.(Alameda、CA)および多くの他の供給元などの任意の様々な市販の供給元から、任意の核酸を特別注文することができる。同様に、PeptidoGenic(pkim@ccnet.com)、HTT Bio−products、inc.(htibio.com)、BMA Biomedicals Ltd(U.K.)、Bio−Synthesis, Inc.、および多くの他の供給元などの任意の様々な市販の供給元から、PNAを特別注文することができる。
【0117】
in silicoマーカー検出
幾つかの実施形態では、in silico法を使用して当該のマーカー遺伝子座を検出することができる。例えば、当該のマーカー遺伝子座を含む核酸の配列はコンピュータに保存することができる。望ましいマーカー遺伝子座配列またはその相同体は、例えばBLASTなどの容易に利用可能なプログラムによって与えられる適切な核酸検索アルゴリズム、あるいはさらに単なるワープロを使用して同定することができる。完全なヒトゲノムがシークエンスされており、したがって、配列の情報を使用してマーカー領域、隣接核酸などを同定することができる。
【0118】
マーカー検出用の増幅プライマー
幾つかの好ましい実施形態では、適切なPCRに基づく検出法を使用して本発明の分子マーカーを検出し、この場合PCRアンプリコンのサイズまたは配列は、マーカー(例えば、特定のマーカー対立遺伝子)の不在または存在を示す。これらの型の方法では、PCRプライマーを多型マーカー領域と隣接する保存領域とハイブリダイズさせる。
【0119】
本発明と共に使用するのに適したプライマーは、任意の適切な方法を使用して設計することができる。本発明が任意の特定のプライマーまたはプライマー対に限られるとは考えられない。例えば、公的に利用可能である配列情報を考慮して、例えばLASERGENE(登録商標)などの任意の適切なソフトウェアプログラムを使用してプライマーを設計することができる。本明細書で同定した多型の隣接配列は公的に利用可能であり、したがって、適切な増幅プライマーを充分に理解されている塩基対形成の法則に基づいて構築することができる。任意のアンプリコンの配列を、例えばハイブリダイゼーション、アレイハイブリダイゼーション、PCR、リアルタイムPCR、LCRなどによって前で既に論じたのと同様に検出することができる。
【0120】
幾つかの実施形態では、本発明のプライマーを放射標識、あるいは(例えば、非放射性蛍光タグを使用する)任意の適切な手段により標識して、任意の他の標識ステップまたは可視化ステップ無しで、増幅反応後に異なるサイズのアンプリコンを迅速に可視化することができる。幾つかの実施形態では、プライマーは標識せず、そのサイズ解像後、例えばアガロースまたはアクリルアミドゲル電気泳動後に、アンプリコンを可視化する。幾つかの実施形態では、サイズ解像後のPCRアンプリコンの臭化エチジウム染色は、異なるサイズのアンプリコンの可視化を可能にする。
【0121】
本発明のプライマーが、任意の特定サイズのアンプリコンの作製に限られるとは考えられない。例えば、本明細書のマーカー遺伝子座および対立遺伝子を増幅させるために使用するプライマーは、関連遺伝子座の全領域、またはその任意の小区域の増幅に限られない。プライマーは、検出用の任意の適切な長さのアンプリコンを生成することができる。幾つかの実施形態では、マーカー増幅によって少なくとも20ヌクレオチド長、あるいは代替的に少なくとも50ヌクレオチド長、あるいは代替的に少なくとも100ヌクレオチド長、あるいは代替的に少なくとも200ヌクレオチド長のアンプリコンが生じる。任意のサイズのアンプリコンを、本明細書に記載する様々な技術を使用して検出することができる。塩基組成またはサイズの違いは、電気泳動などの従来の方法によって検出することができる。
【0122】
ポジショナルクローニング用のマーカーの検出
幾つかの実施形態では、核酸プローブを使用して、マーカー配列を含む核酸を検出する。乳癌の表現型を決定する際のそれらの役割以外に、このようなプローブを例えばポジショナルクローニングにおいて使用して、マーカーヌクレオチド配列と連鎖したヌクレオチド配列を単離することもできる。本発明の核酸プローブが、任意の特定サイズに限られるとは考えられない。幾つかの実施形態では、核酸プローブは少なくとも20ヌクレオチド長、あるいは代替的に少なくとも50ヌクレオチド長、あるいは代替的に少なくとも100ヌクレオチド長、あるいは代替的に少なくとも200ヌクレオチド長である。
【0123】
検出する標識に応じて、例えばオートラジオグラフィー、蛍光撮影または他の同様の検出技法を使用して、ハイブリダイズしたプローブを検出する。特異的ハイブリダイゼーションのプロトコルの例は当技術分野で広く利用可能であり、例えば、いずれも本明細書中のBerger、Sambrook、およびAusubelを参照。
【0124】
トランスジェニック細胞の作製
本発明は、本発明により同定したQTLに対応する核酸で形質転換した細胞も提供する。例えば、このような核酸は、乳癌の表現型のQTLに対応するかあるいはそれと連鎖する染色体部分(例えば、ゲノム断片)、遺伝子、遺伝子をコードするORFおよび/またはcDNAを含む。さらに本発明は、乳癌の表現型に影響を与えるポリペプチドの生成を提供する。これは例えば、乳癌に影響を与えるのに、かつトランスジェニック細胞を作製するのに有用である。これらの細胞は関連表現型に影響を与える明確な遺伝子を有する商業上有用な細胞系を与え、したがって表現型の潜在的モジュレーターのスクリーニング、および当該の各遺伝子に関する作用機構の基礎研究に関する基盤を与える。さらに、遺伝子療法を使用して、個体またはそれらの集団中に望ましい遺伝子を導入することができる。このような遺伝子療法を使用して、個体によって示される障害に関する処置を与えることができ、あるいは予防措置として使用して、リスクのある個体におけるこのような障害の進行を妨げることができる。
【0125】
核酸のクローニングおよび操作ならびにコードポリペプチドの生成に関する、分子生物学の技法を記載する一般的な教本には、BergerおよびKimmel、Guide to Molecular Cloning Techniques、Methods in Enzymology152巻 Academic Press, Inc.、San Diego、CA(Berger); Sambrookら、Molecular Cloning−A Laboratory Manual(第3版)、1〜3巻、Cold Spring Harbor Laboratory、Cold Spring Harbor、New York、2001年(「Sambrook」);およびCurrent Protocols in Molecular Biology、F.M.Ausubelら編、Current Protocols、Greene Publishing Associates, Inc.とJohn Wiley & Sons, Inc.の間の合作(2004年以降に増補)(「Ausubel」))がある。これらの教本は、突然変異誘発、ベクター、プロモーターの使用、および例えば当該の核酸、例えば遺伝子、マーカー遺伝子座、マーカープローブ、マーカー遺伝子座と共に分離するQTLなどを含むクローンの作製に関する、多くの他の関連する話題を記載する。
【0126】
宿主細胞は、例えばクローニングベクター、シャトルベクターまたは発現ベクターであってよい本発明のベクター(例えば、QTLに由来するかあるいはQTLと関係がある遺伝子またはORFを含む発現ベクターなどのベクター)を用いて、遺伝子工学処理する(例えば形質導入、トランスフェクト、形質転換など)。このようなベクターは、例えばプラスミド、ファージミド、アグロバクテリウム、ウイルス、裸ポリヌクレオチド(直鎖状または環状)、または複合ポリヌクレオチドの形である。ベクターは特に伝播および増殖の目的で細菌に導入することができる。核酸導入法に関する他の詳細は、以下のSambrook、BergerおよびAusubel中に見られる。本発明の核酸を宿主細胞中に導入する方法は本発明にとって重要でなく、本発明が外来遺伝物質を宿主細胞中に導入する任意の特定の方法に限られるとは考えられない。したがって、細胞またはプロトプラスト中への核酸の有効な導入をもたらす、例えば本明細書に与える方法だけには限らないが、これらを含めた任意の適切な方法を使用することができ、本発明と共に用途が見出される。
【0127】
工学処理した宿主細胞は、例えばプロモーター活性化などの活性化、または形質転換体の選択に関して必要に応じて修飾した、従来の栄養培地中で培養することができる。いずれも以下のSambrook、BergerおよびAusubel以外に、Atlas and Parks (編) The Handbook of Microbiological Media(1993年)CRC Press、Boca Raton、FLおよびSigma− Aldrich, Inc(St Louis、MO)(「Sigma−LSRCCC」)からのLife Science Research Cell Culture Catalogue(2004年)などの市販の文献が、他の詳細を与える。
【0128】
マーカーと表現型との関連付け
本発明の一態様は、
図1および/または2中に記した多型と乳癌の表現型との間の相関関係の記載である。これらの相関関係の理解を本発明において使用して、個体またはサンプルが有すると測定される多型のセットに関する情報とそれらがおそらく示す表現型を関連付けることができる。さらに、1つ以上の異なる遺伝子における対立遺伝子の組合せを考慮する高次の相関関係も、表現型との関連付けのために評価することができる。
【0129】
これらの関連付けは、対立遺伝子と表現型、あるいは対立遺伝子の組合せと表現型の組合せとの間の関係を同定することができる任意の方法によって実施することができる。例えば、
図1および/または2中の遺伝子または遺伝子座における対立遺伝子は、1つ以上の乳癌の表現型と関連付けることができる。最も典型的には、これらの方法は、多型の対立遺伝子と乳癌の表現型との間の相関関係を含む索引表を参照することを含む。この表は多数の対立遺伝子−表現型の関係に関するデータを含むことができ、例えば主成分分析、発見的アルゴリズムなどの統計手段を使用することによって、多数の対立遺伝子−表現型の関係の追加的または他の高次影響を考慮することができる。
【0130】
マーカーと表現型との関連付けは、関連付けに関する1つ以上の統計的検定の実施を場合によっては含む。多くの統計的検定が知られており、大部分は分析を容易にするためにコンピュータにより実行される。表現型形質と生物学的マーカーとの間の関係/相関関係を測定する様々な統計法が知られており、本発明に適用することができる。話題への導入のため、Hartl(1981年)A Primer of Population Genetics Washington University、Saint Louis Sinauer Associates, Inc.Sunderland、MA ISBN:0−087893−271−2を参照。様々な適切な統計モデルが、LynchおよびWalsh(1998年)Genetics and Analysis of Quantitative Traits.Sinauer Associates, Inc.Sunderland MA ISBN0−087893−481−2中に記載されている。これらのモデルは、例えば遺伝子型の値と表現型の値との間の相関関係を与え、表現型に対する遺伝子座の影響を特徴付け、環境と遺伝子型との間の関係を選別し、遺伝子の優性または浸透性を測定し、母方および他の後成的影響を測定し、(主成分分析、即ち「PCA」によって)分析中に主成分を測定することなどができる。これらの教本中に列挙された参照文献は、マーカーと表現型とを関連付けるための統計モデルに関する多量の他の詳細を与える。
【0131】
相関関係を測定するための標準的な統計法以外に、遺伝的アルゴリズムの使用などによりパターン認識およびトレーニングによって相関関係を測定する他の方法を使用して、マーカーと表現型との間の相関関係を測定することができる。多数の対立遺伝子と多数の表現型との間の高次の相関関係を同定するとき、これは特に有用である。例示のため、ニューラルネットワークアプローチを、遺伝的情報と表現型の結果との間の相関関係を測定する構造−機能データスペースモデルの発見的開発のために、遺伝的アルゴリズム型プログラミングと結びつけることができる。例えば、NNUGA(Neural Network Using Genetic Algorithms)は(例えば、ニューラルネットワークと遺伝的アルゴリズムが結びついたワールドワイドウエブcs.bgu.ac.il/−omri/NNUGAで)利用可能なプログラムである。ニューラルネットワークへの導入は、例えばKevin Gurney、An Introduction to Neural Networks、UCL Press(1999年)およびワールドワイドウエブshef.ac.uk/psychology/gurney/notes/index.html中で見ることができる。他の有用なニューラルネットワークの参照文献には、遺伝的アルゴリズムに関して前に記した参照文献、および例えばBishop、Neural Networks for Pattern Recognition、Oxford University Press(1995年)、およびRipleyら、Pattern Recognition and Neural Networks、Cambridge University Press(1995年)がある。幾つかの統計分析を含めた例示的なデータセットを示す2つの表を、
図1および/または2中に示す。
【0132】
相関関係、分析の主成分、ニューラルネットワークモデリングなどを使用し確定するためのデータ分析アプリケーションを理解する際に有用である他の参照文献には、例えばHinchliffe、Modeling Molecular Structures、John Wiley and Sons(1996年)、GibasおよびJambeck、Bioinformatics Computer Skills、O’Reilly(2001年)、Pevzner、Computational Molecular Biology and Algorithmic Approach、The MIT Press(2000年)、Durbinら、Biological Sequence Analysis:Probabilistic Models of Proteins and Nucleic Acids、Cambridge University Press(1998年)、およびRashidiおよびBuehler、Bioinformatic Basics:Applications in Biological Science and Medicine、CRC Press LLC(2000年)がある。
【0133】
如何なる場合も、標準的なプログラミング法によって、あるいは例えば多変量データ解析の遺伝的アルゴリズム、インタラクティブな視覚化、変数選択、ニューラルネットワークおよび統計モデリングなどに適用することができるパターン認識のソフトウェアを提供する(例えば、Partek Pro 2000 Pattern Recognition Softwareを提供する)、Partek Incorporated(St.Peters、Missouri; www.partek.com)から市販されている前に記したソフトウェアパッケージを例えば含めた、このような統計分析を実施するための任意の様々な「既製の」ソフトウェアパッケージを使用することによって、ほぼ任意の統計検定をコンピュータが実行するモデルに適用することができる。例えば主成分分析(PCA)マッピングマッピングスキャタープロットおよびバイプロット、多次元スケーリング(MDS)多次元スケーリング(MDS)マッピングスキャタープロット、スタープロットなどによって、関係を分析することができる。相関関係分析を実施するために利用可能なソフトウェアにはSAS、RおよびMathLabがある。
【0134】
多型または発現パターンであろうとマーカーを、任意の様々な遺伝的分析に使用することができる。例えば、ひとたびマーカーを同定した後、本発明の場合と同様に、幾つかの異なるアッセイにおいて関連試験用にマーカーを使用することができる。例えば、これらのマーカーを検索するマイクロアレイ用にプローブを設計することができる。他の例示的なアッセイには、例えば前に記載したTaqmanアッセイおよび分子指標アッセイ、ならびに従来のPCRおよび/またはシークエンシング技法がある。
【0135】
関連試験に関する他の詳細は、「Methods for Genomic Analysis」という表題の2002年3月26日に出願された10/106,097、「Genetic Analysis Systems and Methods」という表題の2002年1月7日に出願された10/042,819、「Methods for Genomic Analysis」という表題の2002年10月31日に出願された10/286,417、「Apparatus and Methods for Analyzing and Characterizing Nucleic Acid Sequences」という表題の2004年1月30日に出願された10/768,788、2003年5月28日に出願された「Liver Related Disease Compositions and Methods」という表題の10/447,685、「Improved Analysis Methods and Apparatus for Individual Genotyping(個体の遺伝子型を決定するための方法)」という表題の2004年10月20日に出願された10/970,761、「Methods for Genetic Analysis」という表題の2004年9月30日に出願された10/956,224において見ることができる。
【0136】
幾つかの実施形態では、マーカーのデータを使用して関連試験を実施して、マーカーと表現型との間の相関関係を示す。これは当該の表現型を有する個体(すなわち、当該の表現型を示す個体または集団)におけるマーカーの特徴を決定すること、およびこれらの個体における対立遺伝子頻度またはマーカーの他の特徴(発現レベルなど)を個体の対照群における対立遺伝子頻度または他の特徴と比較することによって実施することができる。このようなマーカーの決定はゲノム全般規模で実施することができ、あるいはゲノムの特定領域(例えば、当該のハプロタイプ群)に焦点を当てることができる。一実施形態では、
図1および/または2中の遺伝子または遺伝子座と連鎖しているマーカーを、1つ以上の特定の乳癌素因の表現型との相関関係に関して評価する。
【0137】
本明細書に開示する本発明の方法の他の実施形態以外に、幾つかの方法は表現型の「分離」をさらに可能にする。すなわち、個々の表現型は2つ以上の異なる遺伝的基盤から生じる可能性がある(および典型的にはそうである)。例えば、一個体における易罹患性の表現型は、
図1および/または2中の遺伝子の「欠陥」の結果である可能性があり(あるいは単に個々の対立遺伝子−易罹患性の表現型に関する「欠陥」は文脈依存性である、例えば、所与の環境中の個体における表現型が望ましいかあるいは望ましくないかどうか)、一方で異なる個体における同じ基盤の表現型は、
図1および/または2中の多数の遺伝子の多数の「欠陥」の結果である可能性がある。したがって、(例えば、ゲノムまたはハプロタイプ群におけるスキャニングと同様の)複数のマーカーのスキャニングは、類似の(または段階的)表現型に関する様々な遺伝的基盤の分離を可能にする。
【0138】
前の段落中に記載したように、関連試験を実施する1つの方法は、当該の表現型を有する個体(「症例群」)におけるマーカーの対立遺伝子頻度(または発現レベル)と、個体の対照群における対立遺伝子頻度を比較することである。一方法では、情報を与えるSNPを使用してSNPハプロタイプパターンの比較を行う(「情報を与えるSNP」はゲノムまたはハプロタイプ群中のSNPまたは(2つ以上の)SNPの小集団などの遺伝的SNPマーカーであり、これによって1つのSNPまたはゲノムまたはハプロタイプパターンを他のSNP、ゲノムまたはハプロタイプパターンと区別する傾向がある)。情報を与えるSNPを使用する手法は、当技術分野で知られている他の全ゲノムスキャニングまたは遺伝子型決定法に優る利点を有する、というのは各個体のゲノムの全30億の塩基を読み取る、あるいはさらに見つけることができる3〜4百万の一般的なSNPを読み取る代わりに、サンプル集団由来の情報を与えるSNPのみを検出する必要がある。これらの個々の情報を与えるSNPの読み取りは、前に記載したように、特定の実験集団から統計上正確な関連データを抽出することができるほど充分な情報をもたらす。
【0139】
したがって、遺伝的関係を測定する一方法の実施形態では、情報を与えるSNPの対立遺伝子頻度を、その表現型を示さない対照集団のゲノムに関して測定する。情報を与えるSNPの対立遺伝子頻度は、その表現型を示す集団のゲノムに関しても測定する。情報を与えるSNPの対立遺伝子頻度を比較する。対立遺伝子頻度の比較は、例えば各集団中のそれぞれの情報を与えるSNPの位置における対立遺伝子頻度(全数の対立遺伝子で割った集団中の特定の対立遺伝子の事例の数)を測定すること、およびこれらの対立遺伝子頻度を比較することによって行うことができる。対照対症例集団/群の間で発生する対立遺伝子頻度の違いを示す情報を与えるSNPを、分析用に選択する。ひとたび情報を与えるSNPを選択した後、情報を与えるSNPを含むSNPハプロタイプ群を同定し、次いで表現型と関係がある当該のゲノム領域を同定する。例えば薬剤発見標的として、あるいは診断マーカーとして使用するためのゲノム領域は、当技術分野で知られている遺伝的または任意の生物学的方法によって分析することができる。
【0140】
乳癌の表現型を同定するためのシステム
前述の関連付けを実施するためのシステムも本発明の特徴である。典型的にはシステムは、(直接、あるいは例えば発現レベルのいずれかによって検出した)対立遺伝子の存在または不在と予想表現型とを関連付けるシステム指示書を含むはずである。システム指示書は、対立遺伝子の配列または発現レベルに関して検出した情報と、対立遺伝子と関連表現型との間の相関関係を含むデータベースを比較することができる。前に記したように、このデータベースは多次元であってよく、したがって対立遺伝子の組合せと関連表現型との間の高次の関係を含む。これらの関係は任意の数の索引表中に、例えば集計表(例えばExcel
TM集計表)またはAccess
TM、SQL
TM、Oracle
TM、Paradox
TMなどのデータベース、または同様のデータベースの形をとらせて保存することができる。システムは例えば自動的またはユーザインターフェースによって、対立遺伝子の検出情報に関するサンプル特異的な情報をインプットするため、およびその情報を索引表と比較するための設備を含む。
【0141】
場合によっては、システム指示書は、任意の検出した対立遺伝子の情報と関係がある診断情報、例えば関連対立遺伝子を有する対象は、特定の表現型を有するという診断を受け入れるソフトウェアも含むことができる。このソフトウェアは、索引表の精度を改善するかつ/あるいはシステムにより索引表を解釈するためのこのようなインプットした関係を使用する、ヒューリスティック性であってよい。ニューラルネットワーク、マルコフモデリング、および他の統計分析を含めた様々なこのような手法は前に記載している。
【0142】
本発明は、1つ以上の検出可能な遺伝子マーカーを検出するためのデータ収集モジュール(例えば、1つ以上の生物分子プローブ、検出器、流体処理装置などを含む1つ以上のアレイ)を提供する。このようなデータ収集モジュールの生物分子プローブは、生物学的マーカーを検出するのに適した任意のもの、例えばオリゴヌクレオチドプローブ、タンパク質、アプタマー、抗体などを含むことができる。これらは例えばサンプルを収集するため、サンプルを希釈および等分するため、マーカー物質(例えば、核酸またはタンパク質)を精製するため、マーカー核酸を増幅するため、増幅させたマーカー核酸を検出するためなどの、サンプル処理装置(例えば、流体処理装置)、ロボット、マイクロ流体システム、核酸またはタンパク質精製モジュール、アレイ(例えば、核酸アレイ)、検出器、サーモサイクラーまたはこれらの組合せを含むことができる。
【0143】
例えば、本明細書のシステム中に組み込むことができる自動デバイスは、例えば選択した刺激に応答する遺伝子の発現レベル(Service(1998年)「Microchips Arrays Put DNA on the Spot」Science282:396〜399頁)、高スループットDNA遺伝子型決定(Zhangら、(1999年)「Automated and Integrated System for High−Throughput DNA Genotyping Directly from Blood」Anal.Chem.71:1138〜1145頁)および他の多くを含めた、様々な生物現象を評価するために使用されてきている。同様に、混合実験、DNA増幅、DNAシークエンスなどを実施するための総合システムも利用可能である。例えば、Service(1998年)「Coming Soon: the Pocket DNA Sequencer」 Science282:399〜401頁を参照。例えばロボットおよび流体処理モジュールを典型的には含む様々なZymateシステムを例えば利用する、Caliper Technologies(Hopkinton、MA)からの、様々な自動システムの構成要素が利用可能である。同様に、例えばマイクロタイタートレイ操作用に様々な実験室系において使用される、一般的なORCA(登録商標)ロボットも、例えばBeckman Coulter, Inc.(Fullerton、CA)から市販されている。同様に、本発明中のシステム構成要素として使用することができる市販のマイクロ流体システムは、Agilent technologiesおよびCaliper Technologiesからのシステムを含む。さらに、特許および技術文献は、自動流体処理に関してマイクロウエルプレートと直接調和し得るシステムを含めた、マイクロ流体システムの多数の例を含む。
【0144】
任意の様々な液体処理および/またはアレイ配置を、本明細書のシステムにおいて使用することができる。本明細書のシステムにおいて使用する1つの一般的な形式は、アレイまたは液体処理装置がマイクロタイタートレイを含むマイクロタイタープレートである。このようなトレイは市販されており、トレイ当たり様々なウエルサイズおよびウエル数に、およびアッセイまたはアレイ要素を結合させるための任意の様々な機能化表面で並べることができる。一般的なトレイには偏在する96ウエルプレートがあり、384および1536ウエルプレートも一般に使用される。全ての処理ステップをトレイ中で実施しながら、サンプルをこのようなトレイ中で処理することができる。サンプルはマイクロ流体装置、またはマイクロタイター装置とマイクロ流体装置の組合せ中で処理することもできる。
【0145】
液相アレイ以外に、固相アレイにおいて要素を保存または分析することができる。これらのアレイは、例えば膜(例えば、ナイロンまたはニトロセルロース)、ポリマーまたはセラミック表面、ガラスまたは変性シリカ表面、金属表面などの固体支持体上に、空間的にアクセス可能な形(例えば、列および行のグリッド)で物質を固定する。例えばハイブリダイゼーションによって、(例えば、ピペットまたは他の流体処理要素を使用する)局所再水和および流体移動によって、あるいはアレイをこすることまたはアレイ上の当該の部位を切断することによって、要素を評価することができる。
【0146】
システムは、本明細書に記した手法のいずれかを使用して、対立遺伝子の情報を検出するために使用する検出装置も含むことができる。例えば、リアルタイムPCR産物を検出するように構成された検出器(例えば、蛍光検出器などの光検出器)またはアレイリーダーを、システム中に組み込むことができる。例えば検出器は、発光が対立遺伝子の存在または不在を示す当該の対立遺伝子を含むハイブリダイゼーションまたは増幅反応からの、発光を検出するように構成することができる。場合によっては、前に記した検出器とシステム指示書を含むコンピュータとの間の操作可能な関係を与え、検出した対立遺伝子特異的な情報のコンピュータへの自動入力を可能にし、コンピュータは例えばデータベース情報を保存することができ、かつ/あるいはシステム指示書を実行して、検出した対立遺伝子特異的な情報と索引表を比較することができる。
【0147】
検出器によって検出される情報を作成するために使用するプローブも、プローブを使用してアンプリコンを検出するための任意の他のハードウェアまたはソフトウェアと共に、システム中に組み込むことができる。これらは(例えば、プローブによって検出される対立遺伝子のPCRまたはLCR増幅を実施するための)サーモサイクラー要素、その上にプローブが並んでいるかつ/あるいはハイブリダイズしているアレイなどを含むことができる。サンプルを処理するための前に記した流体処理要素は、サンプル物質(例えば、検出する鋳型核酸および/またはタンパク質)プライマー、プローブ、アンプリコンなどを移動させて互いに接触させるために使用することができる。例えばシステムは、表現型と関係がある1つ以上の遺伝子または連鎖した遺伝子座の少なくとも1つの対立遺伝子を検出するように構成された、マーカープローブまたはプライマーのセットを含むことができ、遺伝子は
図1および/または2中の多型をコードする。検出器モジュールは、マーカープローブまたはプライマーのセットからの1つ以上のシグナル出力、あるいはマーカープローブまたはプライマーのセットから生成されたアンプリコンを検出し、それによって対立遺伝子の存在または不在を同定するように構成されている。
【0148】
分析するサンプルは場合によってはシステムの一部であり、あるいはシステムから分離していると考えることができる。本明細書で前に記したように、サンプルは例えばゲノムDNA、増幅されたゲノムDNA、cDNA、増幅されたcDNA、RNA、増幅されたRNA、タンパク質などを場合によっては含む。一態様では、サンプルはヒト患者などの哺乳類に由来する。
【0149】
場合によっては、ユーザとのインターフェースのためのシステム構成要素を与える。例えばシステムは、コンピュータが実行するシステムの命令の出力を見るためのユーザが見ることができるディスプレイ、ユーザのコマンドを入力しシステムをアクティブ化するためのユーザ用入力デバイス(例えば、キーボードまたはマウスなどのポインティングデバイス)などを含むことができる。典型的には、当該のシステムはコンピュータを含み、様々なコンピュータが実行するシステムの命令をコンピュータソフトウェアで具体化し、例えばコンピュータ可読媒体に保存する。
【0150】
ワープロソフト(例えば、Microsoft Word
TMまたはCorel WordPerfect
TM)およびデータベースソフトウェア(例えば、Microsoft Excel
TM、Corel Quattro Pro
TMなどの集計表ソフトウェア、あるいはMicrosoft Access
TMまたはSequel
TM、Oracle
TM、Paradox
TMなどのデータベースプログラム)などの標準的なデスクトップアプリケーションを、本明細書の対立遺伝子、または対立遺伝子と表現型との間の関係に対応する文字列を入力することによって本発明に適合させることが可能である。例えばシステムは、例えば文字列を操作するためにユーザインターフェース(例えば、Windows(登録商標)、MacintoshまたはLINUX(登録商標)システムなどの標準的なオペレーティングシステムにおけるGUI)と共に使用する、適切な文字列情報を有するソフトウェアを含むことができる。BLASTなどの専用配列アラインメントプログラムも、例えば多数の対立遺伝子を同定および関連付けするために、核酸またはタンパク質(または対応する文字列)のアラインメント用に本発明のシステム中に組み込むことができる。
【0151】
記したようにシステムは、適切なデータベースを有するコンピュータ、および本発明の対立遺伝子配列または相関関係を含むことができる。配列アラインメント用ソフトウェア、および本明細書の配列のいずれかを含むソフトウェアシステムに入力するデータセットは、本発明の特徴であってよい。コンピュータは例えば、PC(Intelx86またはPentium(登録商標)チップ−互換性DOS
TM、OS2
TM、WINDOWS(登録商標)
TMWINDOWS(登録商標) NT
TM、WINDOWS(登録商標)95
TM、WINDOWS(登録商標)98
TM、WINDOWS(登録商標)2000、WINDOWS(登録商標)ME、またはLINUX(登録商標)ベースマシン、MACINTOSH
TM、Power PC、またはUNIX(登録商標)ベース(例えば、SUN
TMワークステーションまたはLINUX(登録商標)ベースマシン)または他の当業者に知られている市販の一般的なコンピュータであってよい。入力およびアラインメントあるいは他の場合は配列操作用のソフトウェア、例えばBLASTPおよびBLASTNが利用可能であり、あるいは例えばVisualbasic、Fortran、Basic、Java(登録商標)などの標準的なプログラミング言語を使用して当業者により容易に構築することができる。
【0152】
モジュレーターを同定する方法
乳癌の素因などを同定するための様々な診断および予後判定マーカーを提供する以外に、本発明は乳癌の表現型のモジュレーターを同定する方法も提供する。方法中、潜在的モジュレーターを
図1および/または2中の遺伝子座に対応する関連タンパク質、またはこのようなタンパク質をコードする核酸と接触させる。遺伝子または遺伝子産物に対する潜在的モジュレーターの影響を検出し、それによって潜在的モジュレーターが表現型に関する根底の分子基盤を調節するか否かを同定する。
【0153】
さらに、方法は例えば関連表現型を示す個体に1つ以上の推定モジュレーターを投与すること、および例えば臨床試験または処置の文脈で、推定モジュレーターが個体における表現型を調節するかどうかを判定することを含むことができる。したがって、これは推定モジュレーターが臨床上有用であるかどうかを判定する。
【0154】
モジュレーターによって接触する遺伝子または遺伝子産物は、本明細書に記す任意の対立遺伝子形を含むことができる。望ましくない表現型と正に相関した対立遺伝子形は、遺伝子またはタンパク質であろうと、モジュレータースクリーニングの好ましい標的である。
【0155】
スクリーニングすることができる当該の影響には、(a)モジュレーターの存在下での
図1および/または2中の遺伝子または遺伝子産物の増大または低下した発現、(b)発現のタイミングまたは位置の変化、(c)またはモジュレーターの存在下での
図1および/または2の遺伝子座に対応するタンパク質の局在の変化がある。
【0156】
モジュレータースクリーニングの正確な形式は、検出する影響および利用可能な機器に応じて、当然ながら変わるはずである。ノーザン分析、定量的RT−PCRおよび/またはアレイに基づく検出形式を使用して、前に記した遺伝子の発現レベルを区別することができる。例えばウエスタンブロッティング、ELISA分析、抗体ハイブリダイゼーション、BIAcoreなどの利用可能な方法を使用して、タンパク質の発現レベルを検出することもできる。任意のこれらの方法を使用して、潜在的モジュレーターに起因する発現レベルの変化を区別することができる。
【0157】
したがって、活性または発現に関して潜在的モジュレーターをスクリーニングすることができる。例えば、潜在的モジュレーター(小分子、有機分子、無機分子、タンパク質、ホルモン、転写因子など)を当該の対立遺伝子を含む細胞と接触させることが可能であり、
図1および/または2中の遺伝子座に対応する遺伝子またはタンパク質の活性または発現(あるいは両方)に対する影響を、例えば考えられる発現モジュレーターの施用前後に、ノーザン分析または定量的(場合によってはリアルタイム)RT−PCRによって検出することができる。同様に、様々な遺伝子のプロモーター領域(例えば一般に、転写の開始部位の領域内の配列、例えば開始部位の5kb以内、例えば1kb以下、例えば開始部位の500bpまたは250bpまたは100bp以内)を、レポーター構築体(CAT、β−ガラクトシダーゼ、ルシフェラーゼまたは任意の他の利用可能なレポーター)と結合させることが可能であり、潜在的モジュレーターによる発現活性調節に関して同様に試験することができる。いずれかの場合、例えば連続または平行式に自動流体処理および/または検出システムを使用して、高スループット形式でアッセイを実施することができる。同様に、検出する活性が活性調節、発現調節あるいは両方の結果であるかどうかとは無関係に、本明細書の活性検出法のいずれかを使用して適切な細胞と潜在的モジュレーターを接触させることによって、活性モジュレーターを試験することができる。
【0158】
モジュレーター活性検出を検出するためのバイオセンサーも本発明の特徴である。これらは、遺伝子または産物の1つ以上の活性を測定または表示する読み出し装置と結び付いた、
図1および/または2の遺伝子座に対応する遺伝子または遺伝子産物を含むデバイスまたはシステムを含む。したがって、任意の前に記載したアッセイ要素は、適切なアッセイ要素と読み出し装置を動作可能に結び付けることによりバイオセンサーとして設定することができる。読み出し装置は、(例えば、細胞マーカーまたは細胞生存を検出するために)光学的、(例えば、FET、BIAcore、または任意の様々な他のものと結び付けるために)電気的、分光的なものなどであってよく、ユーザが見ることができるディスプレイ(例えば、CRTまたは光学的表示場所)を場合によっては含むことができる。バイオセンサーは、例えば推定モジュレーター活性の自動高スループット分析のために、推定モジュレーターと本発明のタンパク質を直接接触させるロボットまたは他の自動化、例えばマイクロ流体システムと結び付けることができる。本発明のバイオセンサーと共に使用するために適合させることが可能である、非常に様々な自動システムが市販されている。例えば自動システムは、例えば選択した刺激に応答する遺伝子の発現レベル(Service(1998年)「Microchips Arrays Put DNA on the Spot」Science282:396〜399頁)を含めた、様々な生物現象を評価するために作製されている。実験装置システムは、様々な自動実験法用の基本容器要素として使用されるアレイ、マイクロタイタートレイまたは他のチップトレイなどを含む試薬保存システムにあるいはそこから物質を移動させるために、例えば繰り返しの流体処理操作(例えばピペッティング)も実施することができる。同様に、システムは例えばマイクロタイタートレイを操作し、例えば温度、光または空気に対する露出などの様々な環境条件を制御する。多くのこのような自動システムは市販されており、前に記載したものを含めて本明細書に記載する。これらは様々なZymateシステム、ORCA(登録商標)ロボット、マイクロ流体デバイスなどを含む。例えば、Caliper Technologies、Mountain View、CAによるLabMicrofluidicデバイス(登録商標)高スループットスクリーニングシステム(HTS)を、本発明中での使用に適合させて、モジュレーター活性をスクリーニングすることができる。
【0159】
一般に、R.Scopes、Protein Purification、Springer−Verlag、N.Y.(1982年);Deutscher、Methods in Enzymology182巻:Guide to Protein Purification、Academic Press, Inc.N.Y.(1990年);Sandana(1997年)Bioseparation of Proteins、Academic Press, Inc.; Bollagら、(1996年)Protein Methods、第2版、Wiley−Liss、NY; Walker(1996年)The Protein Protocols Handbook Humana Press、NJ、Harris and Angal(1990年)Protein Purification Applications: A Practical Approach IRL Press at Oxford、Oxford、England; Harris and Angal Protein Purification Methods: A Practical Approach IRL Press at Oxford、Oxford、England; Scopes(1993年)Protein Purification: Principles and Practice、第3版、Springer Verlag、NY; Janson and Ryden(1998年)Protein Purification: Principles、High Resolution Methods and Applications、第2版、Wiley−VCH、NY;およびWalker(1998年)Protein Protocols on CD−ROM Humana Press、NJ;およびSatinder Ahuja編、Handbook of Bioseparations、Academic Press (2000年)を含め前述の様々な参照文献中で教示されたものを含めた、タンパク質の発現レベルおよび活性を検出するための方法およびセンサーが利用可能である。多くのタンパク質を同時に検出する「プロテオーム」検出法は記載されており、さらに様々な多次元電気泳動法(例えば、2次元ゲル電気泳動)、質量分析に基づく方法(例えば、SELDI、MALDI、エレクトロスプレーなど)、または表面プラズモン共鳴法を含めて前に記されている。これらを使用して、タンパク質活性および/または発現レベルを追跡することもできる。
【0160】
同様に、核酸発現レベル(例えばmRNA)は、ノーザン分析、定量的RT−PCRなどを含めた任意の利用可能な方法を使用して検出することができる。これらの方法によって当業者を導くのに充分な参照文献は、Ausubel、SambrookおよびBergerを含めて容易に入手可能である。
【0161】
発現および/または活性に対する影響に関してスクリーニングする、潜在的モジュレーターのライブラリーが利用可能である。これらのライブラリーはランダムであってよく、あるいは標的化することができる。
【0162】
標的ライブラリーは、足場または構成単位を選択してコンビナトリアルライブラリーを作製する、任意の形の合理的な設計技法を使用して設計したライブラリーを含む。これらの技法は、バイオアイソステリック変換によるモーフィング、標的特異的な特別構造の分析などを含めた、標的中心ライブラリーの設計およびコンビナトリアル合成のための幾つかの方法を含む。一般に、
図1および/または2の構造遺伝子または遺伝子産物に関する情報が入手可能である場合、例えば柔軟なドッキング手法などを使用して、おそらく結合パターンを設計することができる。同様に、ランダムなライブラリーが様々な基本的化学足場に存在する。いずれかの場合、ポリペプチド、核酸、炭水化物、および他の骨格を有するものを含めた、化学ライブラリー用の数千の足場および構成単位が利用可能である。市販のライブラリーおよびライブラリー設計サービスには、Chemical Diversity(San Diego、CA)、Affymetrix(Santa Clara、CA)、Sigma(St.LouisMO)、ChemBridge Research Laboratories(San Diego、CA)、TimTec(Newark、DE)、Nuevolution A/S(Copenhagen、Denmark)および他の多くによって与えられるものがある。
【0163】
乳癌の表現型を処置するためのキットは、前に記したのと同様に同定したモジュレーター、および化合物を患者に投与して乳癌を処置するための指示書を含むことができる。
【0164】
遺伝子の遺伝子発現の制御
図1および2中の多型と連鎖した任意の遺伝子の遺伝子発現(例えば、転写および/または翻訳)は、当技術分野で知られている任意の様々な技法を使用して制御することができる。例えば、アンチセンス核酸または干渉RNAを使用して遺伝子発現を抑制することができる。個々の細胞型における発現の抑制は、これらの遺伝子のin vitroまたはin vivoでの役割をさらに試験するため、かつ/あるいは連鎖遺伝子の過剰発現によって引き起こされる状態を処理するための機構として、かつ/あるいはこのような遺伝子の特定の対立遺伝子によって引き起こされる優性効果を処理するために使用することができる。遺伝子発現モジュレーターは、本発明により提供されるモジュレーターの1クラス、例えば乳癌の表現型を調節するために施用されるモジュレーターである。
【0165】
例えば、アンチセンス核酸の使用は当技術分野でよく知られている。アンチセンス核酸は、標的核酸、例えば標的遺伝子、mRNA、またはcDNAと相補的な領域を有する。典型的には、内在性遺伝子のコード(センス)配列に関して相補的、アンチセンス方向にヌクレオチド配列を含む核酸を、細胞中に導入する。アンチセンス核酸は、RNA、DNA、PNAまたは任意の他の適切な分子であってよい。二重鎖がアンチセンス配列とその相補的センス配列との間に形成され、遺伝子の不活性化をもたらす可能性がある。アンチセンス核酸は、遺伝子から転写されたRNAと二重鎖を形成することによって、二重鎖DNAと三重鎖を形成することなどによって、遺伝子発現を抑制することができる。例えば、そのコード配列が知られているかあるいは幾つかの充分に確立された技法(例えば、アンチセンスRNAまたはオリゴヌクレオチド(分解に対する耐性を増大させるかあるいは細胞による取り込みを改善する修飾ヌクレオチドおよび/または連鎖を場合によっては含む)の化学合成またはin vitro転写)によって決定することができる任意の遺伝子に関して、アンチセンス核酸を生成することができる。アンチセンス核酸およびそれらの使用は、例えば「Methods for the selective regulation of DNA and RNA transcription and translation by photoactivation」という表題のHaseltonおよびAlexander(2001年6月5日)への米国特許第6,242,258号、米国特許第6,500,615号、米国特許第6,498,035号、米国特許第6,395,544号、米国特許第5,563,050号、E.Schuchら、(1991年)Symp Soc.Exp Biol45:117〜127頁;de Langeら、(1995年)Curr Top Microbial Immunol197:57〜75頁;Hamiltonら、(1995年)Curr Top Microbiol Imrnunol197:77〜89頁;Finneganら、(1996年)Proc Natl Acad Sci USA93:8449〜8454頁;UhlmannおよびA.Pepan(1990年)、Chem.Rev.90:543頁;P.D.Cook(1991年)、Anti−Cancer Drug Design6:585頁;J.Goodchild、Bioconjugate Chem.1(1990年)165頁;および、S.L.BeaucageおよびR.P.Iyer(1993年)、Tetrahedron49:6123頁;およびF.Eckstein編(1991年)、Oligonucleotides and Analogues−−A Practical Approach、IRL Press中に記載されている。
【0166】
遺伝子発現は、RNAサイレンシングまたは干渉によって抑制することもできる。「RNAサイレンシング」は、RNA干渉、mRNAの安定性を変えない標的遺伝子から転写された標的mRNAの翻訳の抑制、および転写サイレンシング(例えば、標的mRNAの転写の抑制をもたらすヒストンアセチル化およびヘテロクロマチン形成)だけには限られないが、これらを含めた、それによって細胞中の一本鎖、または典型的には二本鎖RNAの存在がRNAのそれと同一あるいはほぼ同一である配列を含む標的遺伝子の発現の抑制をもたらす任意の機構を指す。
【0167】
用語「RNA干渉」(「RNAi」、時折RNA介在型干渉、転写後遺伝子サイレンシング、またはクエリング(quelling)と呼ばれる)は、細胞中のRNA、典型的には二本鎖RNAの存在が二本鎖RNAのそれと同一あるいはほぼ同一である配列を含む遺伝子の発現の抑制をもたらす現象を指す。RNAiの誘導を担う二本鎖RNAは、「干渉性RNA」と呼ばれる。遺伝子の発現は以下に記載するようにRNAiの機構によって抑制され、その中では干渉性RNAの存在が遺伝子から転写されるmRNAの分解をもたらし、したがって低下したレベルのmRNAおよび任意のコードタンパク質をもたらす。
【0168】
RNAiの機構は幾つかの真核生物および細胞型において調べられてきており、現在も広く調べられている。例えば、以下の総説:McManusおよびSharp(2002年)「Gene silencing in mammals by small interfering RNAs」Nature Reviews Genetics3:737〜747頁;HutvagnerおよびZamore(2002年)「RNAi:Nature abhors a double strand」Curr Opin Genet & Dev200:225〜232頁;Hannon(2002年)「RNA interference」Nature418:244〜251頁;Agami(2002年)「RNAi and related mechanisms and their potential use for therapy」Curr Opin Chem Biol6:829〜834頁;TuschlおよびBorkhardt(2002年)「Small interfering RNAs: A revolutionary tool for the analysis of gene function and gene therapy」Molecular Interventions2:158〜167頁;Nishikura(2001年)「A short primer on RNAi:RNA−directed RNA polymerase acts as a key catalyst」Cell107:415〜418頁;およびZamore(2001年)「RNA interference: Listening to the sound of silence」Nature Structural Biology8:746〜750頁を参照。RNAiは特許文献中にも記載されている、例えば、「Method and medicament for inhibiting the expression of a given gene」という表題のKreutzerおよびLimmerによるCA2359180、「Methods and compositions for RNA interference」という表題のBeachらによるWO01/68836、「Genetic silencing」という表題のGrahamらによるWO01/70949、および「RNA sequence−specific mediators of RNA interference」という表題のTuschlらによるWO01/75164を参照。
【0169】
簡単に言うと、細胞中(例えば、細胞質中)に導入する二本鎖RNAを、例えばDicerと呼ばれるRNAseIII様酵素により処理して、小さな干渉性RNAと呼ばれる(siRNA、短い干渉性RNAとも呼ばれる)さらに短い二本鎖断片にする。生成するsiRNAの長さおよび性質は細胞の種類に依存するが、典型的にはsiRNAは21〜25ヌクレオチド長である(例えば、siRNAは各末端に2つのヌクレオチド3’突出部分を有する19塩基対の二重鎖部分を有することができる)。同様のsiRNAをin vitroで生成することができ(例えば、化学合成またはin vitro転写によって)、細胞中に導入してRNAiを誘導することができる。siRNAはRNA誘導型サイレンシング複合体(RISC)と結合した状態になる。siRNAのセンス鎖とアンチセンス鎖の分離、および相補的塩基対の相互作用によるsiRNAのアンチセンス鎖とその標的mRNAの相互作用が、場合によっては生じる。最後に、mRNAが切断および分解される。
【0170】
細胞中での標的遺伝子の発現は、適切に選択した二本鎖RNAを細胞中に導入することによって、このように特異的に抑制することができる。適切な干渉性RNAを設計するためのガイドラインは当業者に知られている。例えば、干渉性RNAは典型的には、イントロンまたは非翻訳領域ではなくエクソン配列に対して設計される。高性能干渉性RNAの特徴は、細胞型によって変わる可能性がある。例えば、siRNAはショウジョウバエ細胞中でのRNAiの最も効率良い誘導のために3’突出部分および5’リン酸を必要とする可能性があるが、哺乳動物細胞中では、5’リン酸を欠く平滑末端siRNAおよび/またはRNAが、3’突出部分および/または5’リン酸を有するsiRNAと同程度有効にRNAiを誘導することができる(例えば、Czaudernaら、(2003年)「Structural variations and stabilizing modifications of synthetic siRNAs in mammalian cells」Nucl Acids Res31:2705〜2716頁を参照)。他の例として、30〜80塩基対長を超える二本鎖RNAは哺乳動物細胞中での抗ウイルス性インターフェロン応答を活性化し、非特異的サイレンシングをもたらすので、哺乳動物細胞中で使用するための干渉性RNAは典型的には30塩基対未満である(例えば、Caplenら、(2001年)「Specific inhibition of gene expression by small double−stranded RNAs in invertebrate and vertebrate systems」Proc.Natl.Acad.Sci.USA98:9742〜9747頁、Elbashirら、(2001年)「Duplexes of 21−nucleotide RNAs mediate RNA interference in cultured mammalian cells」Nature411:494〜498頁およびElbashirら、(2002年)「Analysis of gene function in somatic mammalian cells using small interfering RNAs」方法26:199〜213頁は21ヌクレオチドのsiRNAを使用して哺乳動物細胞系における遺伝子発現を特異的に抑制することを記載しており、およびKimら、(2005年)「Synthetic dsRNA Dicer substrates enhance RNAi potency and efficacy」Nature Biotechnology23:222〜226頁は25〜30ヌクレオチドの二重鎖の使用を記載している)。siRNAのセンス鎖とアンチセンス鎖は典型的には、必ずではないが、(任意の突出部分を除いた)siRNAの二本鎖領域で互いに完全に相補的である。アンチセンス鎖は典型的には、同じ領域で標的mRNAと完全に相補的であるが、数個のヌクレオチド置換は許容することができる(例えば、アンチセンス鎖とmRNAとの間の1個または2個のヌクレオチドのミスマッチは、低い有効性ではあるがRNAiをさらにもたらす可能性がある)。二本鎖領域の末端は典型的には中央部より置換に対する耐性があり、例えば、19bpの二本鎖領域を有する21量体の状況でのアンチセンス鎖と標的mRNAとの間のわずか15bp(塩基対)の相補性は、機能性siRNAをもたらすことは示されてきている(例えば、Czaudernaら、(2003年)「Structural variations and stabilizing modifications of synthetic siRNAs in mammalian cells」Nucl Acids Res31:2705〜2716頁を参照)。任意の突出部分は、しかしながら標的mRNAと必ずしも相補的である必要はなく、例えば、TT(2つの2’−デオキシチミジン)突出部分は合成コストを低下させるために頻繁に使用される。
【0171】
二本鎖RNA(例えば、二本鎖siRNA)はRNAiを開始させるのに必要であると当初は考えられていたが、幾つかの近年の報告は、このようなsiRNAのアンチセンス鎖はRNAiを開始させるのに充分であることを示す。一本鎖アンチセンスsiRNAは、(例えば、特異的mRNAエンドヌクレアーゼ切断断片の出現によって実証されるように)二本鎖siRNAと同じ経路によってRNAiを開始させることができる。二本鎖干渉性RNAと同様に、高性能一本鎖siRNAの特徴は細胞型によって変わる可能性がある(例えば、5’リン酸は幾つかの細胞型におけるRNAiの効率良い誘導のためにアンチセンス鎖において必要とされる可能性があり、一方遊離5’ヒドロキシルは他の細胞型において充分ヒドロキシルをリン酸化することができる)。例えば、Martinezら、(2002年)「Single−stranded antisense siRNAs guide target RNA cleavage in RNAi」Cell110:563〜574頁;Amarzguiouiら、(2003年)「Tolerance for mutations and chemical modifications in a siRNA」Nucl.Acids Res.31:589〜595頁;Holenら、(2003年)「Similar behavior of single−strand and double−strand siRNAs suggests that they act through a common RNAi pathway」Nucl.Acids Res. 31:2401〜2407頁;およびSchwarzら、(2002年)Mol.Cell10:537〜548頁を参照。
【0172】
所与の標的mRNAの異なる領域に対応するsiRNA間の有効性の違いにより、典型的には幾つかのsiRNAをその標的mRNAに対して設計および試験して、どのsiRNAが最も有効であるか決定する。干渉性RNAは小さなヘアピンRNA(shRNA、短いヘアピンRNAとも呼ばれる)として生成することもでき、これは細胞中で処理されてRNAiを開始させるsiRNA様分子になる(例えば、Siolasら、(2005年)「Synthetic shRNAs as potent RNAi triggers」Nature Biotechnology23:227〜231頁を参照)。
【0173】
細胞中のRNA、特に二本鎖RNAの存在は、RNAi以外の機構によって、RNAのそれと同一あるいはほぼ同一である配列を含む遺伝子の発現の抑制をもたらす可能性がある。例えば、標的mRNAと部分的に相補的である二本鎖RNAは、その安定性に影響を与えずにmRNAの翻訳を抑制することができる。他の例として、二本鎖RNAはヒストンメチル化およびヘテロクロマチン形成を誘導し、RNAのそれと同一あるいはほぼ同一である配列を含む遺伝子の転写サイレンシングをもたらす可能性がある(例えば、Schramke and Allshire(2003年)「Hairpin RNAs and retrotransposon LTRs effect RNAi and chromatin−based gene silencing」Science301:1069〜1074頁;KawasakiおよびTaira(2004年)「Induction of DNA methylation and gene silencing by short interfering RNAs in human cells」Nature431:211〜217頁;およびMorrisら、(2004年)「Small interfering RNA−induced transcriptional gene silencing in human cells」Science305:1289〜1292頁を参照)。
【0174】
ミクロRNA(miRNA)と呼ばれる短いRNAが、様々な種において同定されてきている。典型的には、これらの内在性RNAは長いRNAとしてそれぞれ転写され、次いで不完全なヘアピン(ステムループ)構造を形成する約60〜75ヌクレオチドのプレmiRNAに処理される。プレmiRNAは典型的には、次いで例えばDicerにより切断されて成熟miRNAを形成する。成熟miRNAは典型的には約21〜25ヌクレオチド長であるが、例えば約14〜約25以上のヌクレオチドで変わる可能性がある。全てではないが幾つかのmiRNAは、部分的に相補的である配列を有するmRNAの翻訳を抑制することが示されてきている。このようなmiRNAは、miRNAアンチセンス鎖とmRNAの結合により形成された二重鎖の中心における隆起をもたらすと予想される、対応するmRNAとの1つ以上の内部ミスマッチを含む。miRNAは典型的にはmRNAと約14〜17のワトソン−クリック塩基対を形成し、他の不安定な塩基対も形成される可能性がある。さらに、対応するmRNAとの中心のミスマッチを含む(例えば、siRNAと類似した)短い合成二本鎖RNAは、mRNAの翻訳を抑制する(ただし分解は開始させない)ことが示されてきている。例えば、Zengら、(2003年)「MicroRNAs and small interfering RNAs can inhibit mRNA expression by similar mechanisms」Proc.Natl.Acad.Sci.USA100:9779〜9784頁;Doenchら、(2003年)「siRNAs can function as miRNAs」Genes & Dev.17:438〜442頁;BartelおよびBartel(2003年)「MicroRNAs:At the root of plant development?」Plant Physiology132:709〜717頁;SchwarzおよびZamore(2002年)「Why do miRNAs live in the miRNP?」Genes & Dev.16:1025〜1031頁;Tangら、(2003年)「A biochemical framework for RNA silencing in plants」Genes & Dev.17:49〜63頁;Meisterら、(2004年)「Sequence−specific inhibition of microRNA−and siRNA−induced RNA silencing」RNA10:544〜550頁;Nelsonら、(2003年)「The microRNA world:Small is mighty」Trends Biochem.Sci.28:534〜540頁;Scacheriら、(2004年)「Short interfering RNAs can induce unexpected and divergent changes in the levels of untargeted proteins in mammalian cells」Proc.Natl.Acad.Sci.USA101:1892〜1897頁;Sempereら、(2004年)「Expression profiling of mammalian microRNAs uncovers a subset of brain−expressed microRNAs with possible roles in murine and human neuronal differentiation」Genome Biology5:R13;Dykxhoornら、(2003年)「Killing the messenger:Short RNAs that silence gene expression」Nature Reviews Molec.and Cell Biol.4:457〜467頁;McManus(2003年)「MicroRNAs and cancer」Semin Cancer Biol.13:253〜288頁;およびStarkら、(2003年)「Identification of Drosophila microRNA targets」PLoS Biol.1:E60を参照。
【0175】
部分的に相補的であるRNA(例えば、幾つかのmiRNA)によるmRNAの翻訳抑制と関係がある細胞機構は、RNAiと関係がある細胞機構と部分的に重複するようであるが、記したように、それらの安定性ではなくmRNAの翻訳が影響を受け、mRNAは典型的には分解されない。
【0176】
RNAのアンチセンス鎖がmRNAと結合するときに形成される隆起の位置および/またはサイズは、mRNAの翻訳を抑制するRNAの能力に影響を与える可能性がある。同様に、RNA内の任意の隆起の位置および/またはサイズ自体が、翻訳抑制の効率に影響を与える可能性もある。例えば、前の参照文献を参照。典型的には、RNAのアンチセンス鎖がmRNAの3’非翻訳領域(3’UTR)と相補的であるとき翻訳抑制は最も有効である。RNAのアンチセンス鎖と相補的な配列の多数の反復単位、例えばタンデムリピートも、より有効な翻訳抑制をもたらす可能性があり、例えば、内在性miRNAによって翻訳抑制される幾つかのmRNAは、それらの3’UTRにmiRNA結合配列の7〜8個の反復単位を含む。翻訳抑制はRNA干渉よりRNAの濃度に依存するらしいことは注目に値し、翻訳抑制はそれぞれの抑制RNAによる1つのmRNAの結合と関係があると考えられ、一方RNAiは1つのsiRNA−RISC複合体によるmRNAの多数のコピーの切断と関係があると考えられる。
【0177】
適切なRNAを設計して所与の標的mRNAの翻訳を抑制するためのガイダンスは、文献(例えば、前述の参照文献および数ある中で特に、DoenchおよびSharp(2004年)「Specificity of microRNA target selection in translational repression」Genes & Dev.18:504〜511頁;Rehmsmeierら、(2004年)「Fast and effective prediction of microRNA/target duplexes」RNA10:1507〜1517頁;Robinsら、(2005年)「Incorporating structure to predict microRNA targets」Proc Natl Acad Sci102:4006〜4009頁;およびMattickおよびMakunin(2005年)「Small regulatory RNAs in mammals」Hum.Mol.Genet.14:R121−R132)および本明細書中で見ることができる。しかしながら、異なる構造(例えば、隆起サイズ、配列、および/または位置)のRNAと標的mRNAの異なる領域に対応するRNAとの間の翻訳抑制の有効性の違いにより、幾つかのRNAをその標的mRNAに対して場合によっては設計および試験して、標的mRNAの翻訳を抑制する際にどれが最も有効であるか決定する。
【0178】
遺伝子産物に対する抗体
他のクラスのモジュレーターは、本明細書の遺伝子座と連鎖する遺伝子の産物と結合する抗体である。抗体を例えばin situで遺伝子産物を検出および/または精製するために利用して、遺伝子産物をモニタリングすることができる。抗体を使用してin vivo、in situまたはin vitroで遺伝子産物の機能を阻害することもできる。本明細書で使用する用語「抗体」は、ポリクローナル抗体、モノクローナル抗体、ヒト化またはキメラ抗体、および抗体断片とタンパク質を結合させるのに充分な断片である生物学的に機能性がある抗体断片だけには限られないが、これらを含む。
【0179】
関連遺伝子産物に対する抗体を生成するために、任意の様々な宿主動物をポリペプチド、またはその一部分を用いた注射によって免疫処置することができる。このような宿主動物は、数例を挙げればウサギ、マウスおよびラットを含むことができるが、これらだけには限られない。フロインドの(完全および不完全)、水酸化アルミニウムなどのミネラルゲル、リゾレシチンなどの界面活性物質、プルロニックポリオール、ポリアニオン、ペプチド、油性エマルジョン、キーホールリンペットヘモシアニン、ジニトロフェノール、ならびにBCG(カルメット−ゲラン桿菌)およびCorynebacterium parvumなどのおそらく有用であるヒト用アジュバントだけには限られないが、これらを含めた様々なアジュバントを使用して、宿主の種類に応じて免疫応答を増大させることができる。
【0180】
ポリクローナル抗体は、標的遺伝子産物、またはその抗原機能性誘導体などの抗原で免疫処置した動物の血清に由来する異型集団の抗体分子である。ポリクローナル抗体を生成するために、前に記載した宿主動物などの宿主動物を、これも前に記載したのと同様のアジュバントを補ったコードタンパク質、またはその一部分を用いた注射によって免疫処置することができる。
【0181】
特定の抗原に対する同型集団の抗体であるモノクローナル抗体(mAb)は、培養中に連続した細胞系による抗体分子の生成をもたらす任意の技法によって得ることができる。これらはKohlerおよびMilstein(Nature256:495〜497頁、1975年;および米国特許第4,376,110号)のハイブリドーマ技法、ヒトB細胞ハイブリドーマ技法(Kosborら、Immunology Today4:72頁、1983年;Coleら、Proc.Nat’l.Acad.Sci.USA80:2026〜2030頁、1983年)、EBV−ハイブリドーマ技法(Coleら、Monoclonal Antibodies and Cancer Therapy、Alan R.Liss, Inc.、77〜96頁、1985年)を含むが、これらだけには限られない。このような抗体は、IgG、IgM、IgE、IgA、IgDを含めた任意の免疫グロブリンクラス、およびその任意のサブクラスであってよい。本発明のmAbを生成するハイブリドーマは、in vitroまたはin vivoで培養することができる。in vivoでの高力価のmAbの生成は、これを現在好ましい生成法にする。
【0182】
さらに、適切な抗原特異性のマウス抗体分子由来の遺伝子、および適切な生物活性のヒト抗体分子由来の遺伝子をスプライシングすることによる、「キメラ抗体」の生成用に開発された技法(Morrisonら、Proc.Nat’l.Acad.Sci.USA81:6851〜6855頁、1984年;Neubergerら、Nature312:604〜608頁、1984年;Takedaら、Nature314:452〜454頁、1985年)を使用することができる。キメラ抗体は、ネズミmAb由来の可変または超可変領域およびヒト免疫グロブリン定常領域を有する抗体などの、異なる部分が異なる動物種に由来する分子である。同様に、利用可能な技法を使用してヒト化抗体を生成することもできる。
【0183】
あるいは、単鎖抗体の生成に関して記載した技法(米国特許第4,946,778号;Bird、Science242:423〜426頁、1988年;Hustonら、Proc.Nat’l.Acad.Sci.USA85:5879〜5883頁、1988年;およびWardら、Nature334:544〜546頁、1989年)を適用して、示差的に発現する遺伝子−単鎖抗体を生成することができる。単鎖抗体はアミノ架橋を介してFv領域の重鎖断片と軽鎖断片を結合させ、単鎖ポリペプチドを生成することによって形成される。
【0184】
一態様では、「ヒト化抗体」を生成するのに有用な技法を適用して、タンパク質、その断片または誘導体に対する抗体を生成することができる。このような技法は、米国特許第5,932,448号、同5,693,762号、同5,693,761号、同5,585,089号、同5,530,101号、同5,569,825号、同5,625,126号、同5,633,425号、同5,789,650号、同5,661,016号、および同5,770,429号中に開示されている。
【0185】
特異的エピトープを認識する抗体断片は、知られている技法によって作製することができる。例えば、このような断片には、抗体分子のペプシン消化によって生成することができるF(ab’)
2断片、およびF(ab’)
2断片のジスルフィド架橋の還元によって作製することができるFab断片があるが、これらだけには限られない。あるいは、Fab発現ライブラリーを構築して(Huseら、Science246:1275〜1281頁、1989年)、所望の特異性を有するモノクローナルFab断片の迅速かつ容易な同定を可能にすることができる。
【0186】
前述の抗体を使用して遺伝子産物の発現を検出および測定するためのプロトコルは、当技術分野でよく知られている。このような方法には、ドットブロッティング、ウエスタンブロッティング、競合的および非競合的タンパク質結合アッセイ、酵素結合免疫吸着アッセイ(ELISA)、免疫組織化学法、蛍光活性化細胞選別(FACS)、および一般的に使用されており科学文献および特許文献中に広く記載されている他の方法、および商業的に使用されている多くの方法があるが、これらだけには限られない。
【0187】
検出を容易にするための1つの方法はサンドウィッチELISAであり、その幾つかのバリエーションが存在し、それらはいずれも本発明によって含まれると考えられる。例えば、典型的なフォアードアッセイでは、非標識抗体を固相支持体上に固定し、試験するサンプルは結合分子と接触させ、抗体−抗原二元複合体の形成を可能にするのに充分な時間の間インキュベートする。この時点で、検出可能なシグナルを誘導することができるレポーター分子で標識した二次抗体を次いで加え、抗体−抗原−標識抗体の三元複合体の形成を可能にするのに充分な時間インキュベートする。任意の未反応物質を洗浄除去し、抗原の存在はシグナルの観察によって測定し、あるいは知られている量の抗原を含む対照サンプルと比較することによって定量化することができる。フォアードアッセイのバリエーションには、サンプルと抗体の両方を結合抗体に同時に加える同時アッセイ、または標識抗体と試験するサンプルを最初に組合せ、インキュベートし非標識表面結合抗体に加えるリバースアッセイがある。これらの技法は当業者によく知られており、わずかなバリエーションの可能性は容易に理解されるはずである。本明細書で使用する「サンドウィッチアッセイ」は、基本的な2部位技法の全てのバリエーションを含むと考えられる。本発明のイムノアッセイに関しては、唯一の制限要因は、標識抗体が当該の遺伝子によって発現されるタンパク質に特異的な抗体であることである。
【0188】
この型のアッセイにおいて最も一般的に使用されるレポーター分子は、酵素、フルオロフォアまたは放射性核種のいずれかを含む分子である。酵素イムノアッセイの場合、通常グルタルアルデヒドまたは過ヨウ素酸塩によって酵素を二次抗体と結合させる。容易に理解されるように、しかしながら、当業者によく知られている広く様々な異なる結合技法が存在する。一般的に使用される酵素には、特にホースラディッシュペルオキシダーゼ、グルコースオキシダーゼ、β−ガラクトシダーゼおよびアルカリホスファターゼがある。特異的酵素と共に使用する基質は、検出可能な色の変化の対応する酵素による加水分解時の生成に関して一般に選択される。例えば、p−ニトロフェニルリン酸はアルカリホスファターゼ結合体と共に使用するのに適しており、ペルオキシダーゼ結合体に関しては、1,2−フェニレンジアミンまたはトルイジンが一般的に使用される。前に記した発色基質ではなく、蛍光産物を生成する蛍光基質を利用することもできる。適切な基質を含む溶液を、次いで三元複合体に加える。この基質は二次抗体と結合した酵素と反応し、定性的な視覚的シグナルを与え、これは通常分光光度法によってさらに定量化して、血清サンプル中に存在するPLABの量の評価を与えることができる。
【0189】
あるいは、フルオレセインおよびローダミンなどの蛍光化合物は、それらの結合能力を変えずに抗体と化学的に結合させることが可能である。特定の波長の光による照射によって活性化させると、蛍光色素標識した抗体は光エネルギーを吸収し、分子において励起状態、次に特徴的な長い波長での光の発光を誘導する。発光は、光学顕微鏡を用いて肉眼で検出可能な特徴的な色として現れる。免疫蛍光およびEIA技法はいずれも当技術分野で非常に充分に確立されており、本発明の方法に特に好ましい。しかしながら、放射性同位体、化学発光または生物発光分子などの他のレポーター分子を利用することもできる。必要とされる用途に適合させるための手順の変更の仕方は、当業者には容易に理解されるはずである。
【0190】
細胞レスキューおよび治療投与
一態様では本発明は、
図1および/または2の1つ以上の内在性遺伝子またはポリペプチド(したがって、当該の関連表現型、例えば乳癌易罹患性、耐性などを与える)の機能に欠陥がある細胞のレスキューを含む。これは単に遺伝子(または関連タンパク質を発現する異種核酸)、すなわち望まれる対立遺伝子を有する遺伝子の新たなコピーを細胞中に導入することによって実施することができる。(例えば、キメラ形成法によって)欠陥遺伝子を修復するための相同的組換えなどの他の手法も実施することができる。任意の事象において、例えば本明細書に記すアッセイのいずれかにおいて、レスキュー機能を測定することができる。実際、この方法は
図1および/または2の任意の遺伝子または遺伝子産物の発現または活性に関してin vitroで細胞をスクリーニングする一般的な方法として使用することができる。したがって、in vitroでのレスキュー機能は、前に記した無数のin vitroスクリーニング法に関するこの文脈において有用である。レスキューされる細胞は、(患者由来の初代または第二代細胞培養物、および充分樹立した細胞の培養物を含めた)培養中の細胞を含むことができる。細胞を患者から単離する場合、これは関連表現型を示す患者においてどの遺伝子または産物が欠陥性であるかを確定する際に他の診断的有用性を有する。
【0191】
他の態様では、細胞のレスキューは例えば欠陥を修正するために、患者、例えばヒトにおいて起こる。したがって、本発明の一態様は、欠陥を修正するための遺伝子療法である。これらの適用例では、本発明の核酸を適切な遺伝子療法用ベクターに場合によってはクローニングし(かつ/あるいは裸またはリポソーム結合核酸として単に送達し)、次いでそれらは場合によっては適切な担体または送達物質と組合せて送達する。タンパク質を直接送達することもできるが、安定した発現が望まれる適用例では核酸の送達が典型的には好ましい。同様に、本明細書の方法によって同定した任意の欠陥のモジュレーターを治療上使用することができる。
【0192】
投与用の組成物は、例えば治療有効量のモジュレーター、遺伝子療法用ベクターまたは他の関連核酸、および薬剤として許容される担体または賦形剤を含む。このような担体または賦形剤には、生理食塩水、緩衝生理食塩水、デキストロース、水、グリセロール、エタノール、および/またはこれらの組合せがあるが、これらだけには限られない。製剤を作製して投与形態に適合させる。一般に、局所使用のために遺伝子療法用ベクターを投与する方法は当技術分野でよく知られており、本発明の核酸の投与に適用することができる。
【0193】
本発明の1つ以上のモジュレーターまたは遺伝子療法用核酸を含む治療用組成物を、1つ以上の適切なin vitroおよび/またはin vivoの疾患の動物モデルにおいて場合によっては試験して、当技術分野でよく知られている方法によって有効性、組織代謝を同定し、および用量を推定する。特に、製剤の活性、安定性または他の適切な指標によって用量を最初に決定することができる。
【0194】
投与は、分子を導入して細胞と最終的に接触させるために通常使用される経路の、いずれかによる投与である。関連配列をコードするモジュレーターおよび/または核酸を、場合によっては1つ以上の薬剤として許容される担体と共に任意の適切な方法で投与することができる。本発明の文脈で患者にこのような核酸を投与するのに適した方法が利用可能であり、2つ以上の経路を使用して個々の組成物を投与することができるが、個々の経路は他の経路より即時かつより有効な作用または反応をしばしばもたらすことができる。
【0195】
薬剤として許容される担体は投与する個々の組成物によって、および組成物を投与するために使用する個々の方法によって部分的に決定される。したがって、本発明の医薬組成物の広く様々な適切な製剤が存在する。経口、静脈内、腹腔内、筋肉内、経皮、皮下、局所、舌下、または直腸投与だけには限られないが、これらを含めた幾つかの経路によって、組成物を投与することができる。組成物はリポソームによって(例えば局所的に)、あるいは裸DNAまたはウイルスベクターの局所送達によって投与することができる。このような投与経路および適切な製剤は、一般に当業者に知られている。
【0196】
組成物は、単独あるいは他の適切な要素と組合せて、吸入を介して投与するエアロゾル製剤にすることもできる(すなわち、それらは「噴霧」することができる)。エアロゾル製剤は、例えばジクロロジフルオロメタン、プロパン、窒素などの加圧した許容される推進剤中に置くことができる。例えば関節内(関節中)、静脈内、筋肉内、皮内、腹腔内、および皮下経路などによって非経口投与するのに適した製剤には、抗酸化剤、緩衝剤、静菌剤を含むことができる水性および非水性、等張滅菌済み注射溶液、および製剤を目的のレシピエントの血液と等張にする溶質、ならびに懸濁剤、溶解剤、増粘剤、安定剤、および防腐剤を含むことができる水性および非水性、等張滅菌済み懸濁液がある。パッケージ核酸の製剤は、アンプルおよびバイアルなどの単位用量または多用量の密閉容器中に存在してよい。
【0197】
本発明の文脈で患者に投与する用量は、経時的に患者において有益な治療応答に影響を与えるのに充分である。用量は、個々のベクター、または他の製剤の有効性、および発現されるポリペプチドの活性、安定性または血清中半減期、および患者の状態、ならびに処置する患者の体重または体表面積によって決定される。用量のサイズは、特定の患者における個々のベクター、製剤などの投与に付随する任意の悪い副作用の存在、性質、および程度によっても決定される。疾患の処置において投与するベクターまたは製剤の有効量を決定する際に、医師は局所の発現、または循環血漿のレベル、製剤の毒性、関連疾患の進行、および/または関連がある場合、ポリヌクレオチドによりコードされるタンパク質に対する抗体の生成を評価する。例えば70キログラムの患者に投与する用量は典型的には、現在使用されている治療用タンパク質の用量に相当する範囲内にあり、関連組成物の改変活性または血清中半減期に関して調節される。任意の知られている従来の療法によって、本発明のベクターは治療条件を補うことができる。
【0198】
投与に関して、本発明の製剤は、関連製剤のLD−50、および/または例えば全体または局所送達領域に施す様々な濃度での本発明のベクターの任意の副作用の観察結果、および患者の全般的な健康状態により決定した割合で投与する。投与は一回または分割用量によって実施することができる。
【0199】
処置を受けている患者が熱、悪寒、または筋肉の痛みを発症する場合、彼/彼女に適切な用量のアスピリン、イブプロフェン、アセトアミノフェンまたは他の痛み/熱を調節する薬剤を与える。熱、筋肉の痛み、および悪寒などの組成物に対する反応を経験する患者は、アスピリン、アセトアミノフェン、または例えばジフェニドラミンのいずれかを後に注入する前に30分間前投与する。解熱剤および抗ヒスタミン剤にすぐに応答しないより重度の悪寒および筋肉の痛み用に、メペリジンを使用する。反応の重度に応じて処置は遅延または中断する。
【0200】
診断および予後判定アッセイ
本明細書の核酸、ポリペプチド、抗体および他の組成物は、乳癌表現型に対する易罹患性または耐性の予後判定および診断用に、(例えば、予めパッケージされたキットにおいて)試薬として使用することができる。他の疾患の示差的診断または予後判定の一部として、乳癌表現型の1つ以上の症状を有することが知られている対象に、これらの方法を実施することができる。乳癌表現型に対する知られている易罹患性を有する対象に、これらの方法を実施することもできる。このような個体の多型プロファイルは、易罹患性の評価を増大または低下させる可能性がある。例えば、乳癌を有する2人の兄弟がいる個人は、一般集団と比較して乳癌に対する高い易罹患性があることが知られている。易罹患性を裏付ける他の要因を発見することによってリスクは増大し、一方で耐性を裏付ける要因を発見することによってリスクは低下する。
【0201】
本発明は、本発明の1つ以上のSNPにおける個体の多型プロファイルを測定する方法を提供する。SNPは
図1および2中に示すSNP、およびこれらと連鎖不均衡状態にあるSNPを含む。これらと連鎖不均衡状態にあるSNPは通常、同じ遺伝子中あるいは同じ遺伝子の100または50または20kb以内に存在する。本明細書の図面中のSNPと連鎖不均衡状態にあるSNPは、ハプロタイプマッピングによって決定することができる。異なる種由来の2倍体細胞を融合させることによってハプロタイプを決定することができる。生成する細胞は部分的に半数体であり、半数体染色体におけるハプロタイプを決定することができる(例えば、US20030099964を参照)。あるいは、例示したSNPと連鎖不均衡状態にあるSNPは、以下の実施例中に記載した試験と同様の関連試験によって決定することができる。
【0202】
多型プロファイルは、個体中の様々な多型部位を占める多型形を構成する。2倍体ゲノムでは、互いに同じであるかあるいは異なる2つの多型形は、通常それぞれの多型部位を占める。したがって、部位XおよびYにおける多型プロファイルはX(x1、x1)、およびY(y1、y2)の形で表すことができ、前式でx1、x1は部位Xを占める対立遺伝子xの2つのコピーを表し、y1、y2は部位Yを占める異型対立遺伝子を表す。
【0203】
個体の多型プロファイルは、本明細書の図面中に示す各部位に存在する乳癌表現型に対する耐性または易罹患性と関係がある多型形との比較によって記録することができる。比較はこれらの多型部位、および場合によっては、これらと連鎖不均衡状態にある他の多型部位の少なくとも例えば1、2、5、10、25、50個、または全てで実施することができる。多型部位は、他の多型部位と組合せて分析することができる。しかしながら、分析する多型部位の合計数は通常10,000、1000、100、50または25個より少なく、約10個以下、約5個以下、あるいは約2個以下であってよい。
【0204】
特定の個体中に存在する耐性または易罹患性対立遺伝子の数を、付加的あるいは比として組合せて、乳癌表現型に対するその個体の遺伝的傾向に関する全体値を与えることができる(2004年4月28日に出願されたUSSN60,566,302、2004年7月22日に出願されたUSSN60/590,534、2004年9月30日に出願されたUSSN10/956,224、および2005年3月3日に出願されたPCTUS05/07375を参照)。耐性対立遺伝子は+1としてそれぞれ任意に記録することができ、易罹患性対立遺伝子は−1として記録することができる(あるいは逆も然り)。例えば、個体を本発明の100個の多型部位で分類し、それらの全てにおいて耐性に関して同型である場合、彼は乳癌表現型に対する耐性に100%の遺伝的傾向すなわち乳癌表現型に対する易罹患性に0%の傾向という値を割り当てることができる。個体が全ての易罹患性対立遺伝子に関して同型である場合、逆のことが当てはまる。さらに典型的には、個体は幾つかの遺伝子座における耐性対立遺伝子に関して同型であり、幾つかの遺伝子座における易罹患性対立遺伝子に関して同型であり、かつ他の遺伝子座における耐性/易罹患性対立遺伝子に関して異型である。乳癌表現型に関するこのような個体の遺伝的傾向は、全ての耐性対立遺伝子に+1の値、および全ての易罹患性対立遺伝子に−1の値(あるいは逆も然り)を割り当てること、およびそれらの値を組合せることによって記録することができる。例えば、個体が102個の耐性対立遺伝子および204個の易罹患性対立遺伝子を有する場合、個体は耐性に対して33%の遺伝的傾向および易罹患性に対して67%の遺伝的傾向を有するとして記録することができる。あるいは、同型耐性対立遺伝子に+1の値を割り当てることができ、異型対立遺伝子にはゼロの値、および同型易罹患性対立遺伝子には−1の値を割り当てることができる。耐性対立遺伝子と易罹患性対立遺伝子の相対数は、割合として表すこともできる。したがって、30の多型部位において耐性対立遺伝子に関して同型であり、60の多型部位において易罹患性対立遺伝子に関して同型であり、かつ残りの63の部位において異型である個体は、耐性に関する33%の遺伝的傾向を割り当てる。他の代替として、易罹患性に関する同型接合性は+2として、異型接合性は+1として、かつ耐性に関する同型接合性は0として記録することができる。
【0205】
個体の値、および多型プロファイルの性質は、乳癌表現型に対する個体の易罹患性の予後判定または診断において有用である。場合によっては、遺伝的プロファイルによって示される乳癌表現型に対する易罹患性を患者に知らせることができる。乳癌表現型に対する高い遺伝的傾向の存在は、予防または療法治療を開始しなければならない警告として処理することができる。例えば、乳癌表現型を発症する高いリスクを有する個体は別々にモニタリングすることができ(例えば、より頻繁なマンモグラフィー)、あるいは(例えば、1つ以上の薬剤を用いて)予防的に処置することができる。乳癌表現型に対する高い傾向の存在は、生検などの二次試験を実施する有用性も示す。
【0206】
多型プロファイリングは、例えば所与の個体における乳癌表現型の処置または予防に影響を与える物質を選択する際に有用である。類似した多型プロファイルを有する個体は、類似した形式で物質に応答する可能性がある。
【0207】
多型プロファイリングは、乳癌表現型または関連状態を処置する能力に関して試験する物質の臨床試験において個体を階層化するのにも有用である。このような試験は、類似または同一の多型プロファイル、例えば個体が乳癌表現型を発症する高いリスクを有することを示す多型プロファイルを有する処置または対照集団に実施する(EP99965095.5を参照)。遺伝的に一致する集団の使用は、遺伝的要因による治療結果の変動を排除するかあるいは低下させ、可能性のある薬剤の有効性のより正確な評価をもたらす。コンピュータが実行するアルゴリズムを使用してより遺伝的相同性がある副次集団を同定することができ、その中で処置または予防は有意な影響を有するが、にもかかわらずより大きな異型集団中ではその処置または予防は無効である。このような方法では、物質で処置した乳癌表現型を有する第一集団、およびこれも乳癌表現型を有するがプラセボで処置した第二集団に関するデータを与える。2つの集団中の個体の多型プロファイルは、
図1および/または2中に示す遺伝子から選択した遺伝子の100kbまたは50kbまたは20kb以内で少なくとも1つの多型部位において測定する。集団中の各患者が首尾良い処置または予防を示す望ましい終点に到達するかに関してもデータを与える。第一および第二集団のそれぞれの副次集団を、副次集団中の個体が元の第一および第二集団中の個体より高い多型プロファイルの類似性を互いに有するように次いで選択する。それによって類似性を評価することができる多くの基準が存在する。例えば1つの基準は、副次集団中の個体が前述の遺伝子の少なくとも10個のそれぞれにおいて少なくとも1個の易罹患性対立遺伝子を有することを必要とすることである。他の基準は、副次集団中の個体が多型プロファイルを測定する多型部位のそれぞれに関する少なくとも75%の易罹患性対立遺伝子を有することである。類似性を評価するために使用する基準とは無関係に、副次集団の終点データを比較して、処置または予防が副次集団において統計的に有意な結果を得たかどうか測定する。コンピュータによる実行の結果として、類似性に関する無数の基準を分析して、統計的有意性を示す1個または数個の副次集団を同定することができる。
【0208】
多型プロファイリングは、臨床試験から乳癌表現型に対する素因がない個体を除外するのにも有用である。臨床試験中にこのような個体を含めることによって、統計的に有意な結果を得るのに必要とされる集団の大きさが増大する。乳癌表現型に対する素因がない個体は、前に記載したように多型プロファイルにおける耐性および易罹患性対立遺伝子の数を測定することによって同定することができる。例えば、乳癌表現型と関係がある本発明の10個の遺伝子中の10カ所の部位で対象を遺伝子型決定する場合、合計20個の対立遺伝子を測定する。50%を超える、および好ましくは60%または75%を超えるこれらの遺伝子が耐性遺伝子である場合、個体は乳癌表現型を発症する可能性がなく、臨床試験から除外することができる。
【0209】
他の実施形態では、臨床試験における個体の階層化は、家族歴、リスクモデル(例えば、Gail値、Clausモデル)、臨床的表現型(例えば、異型病変および乳房密度)、および特異的候補バイオマーカー(例えば、IGF1、IFG2、IGFBP3、Ki−67、およびエストラジオール)だけには限られないがこれらを含めた、他の階層化法と組合せた多型プロファイリングを使用して実施することができる。例えば、多型プロファイルに基づく階層化を含む化学的予防試験における高リスクの階層化は、結果を改善することができる。特に、FGFR2と連鎖したマーカーを使用して抗VEGFまたは抗血管新生療法応答を階層化することができ、PKHD1と連鎖したマーカーを使用して抗EGF療法の有効性を階層化することができる(抗EGF療法は多嚢胞性腎および肝疾患を有する患者において働く)。
【0210】
多型プロファイルを臨床試験の終了後に使用して、所与の処置に応じた違いを解明することもできる。例えば、多型のセットを使用して、登録患者を疾患の幾つかの亜型またはクラスに階層化することができる。多型を使用して、処置に対して異常な(高いまたは低い)応答性を有するかあるいは全く応答しない(非応答者)、類似した多型プロファイルを有する患者の小集団を同定することもできる。このようにして、処置に対する応答性に影響を与える根底にある遺伝的要因に関する情報を、治療の開発の多くの態様において使用することができる(これらは新たな標的の同定から、生成物標識および患者標的化のための新たな試験の設計に及ぶ)。さらに、多型を使用して、治療に対する悪い応答性と関係がある遺伝的要因(有害事象)を同定することができる。例えば、悪い応答性を示す患者は、偶然に予想されるより類似した多型プロファイルを有する可能性がある。これによって、初期の同定および治療からのこのような個体の除外が可能である。それは、有害事象の生物学的原因を理解するため、および治療を修正してこのような結果を回避するために使用することができる情報も与える。
【0211】
米国特許第6,525,185号によって記載されたのと同様に、実父確定検査および法医学的分析を含めた他の目的で、多型プロファイルを使用することもできる。法医学的分析では、犯行現場におけるサンプルからの多型プロファイルを容疑者のそれと比較する。この2つの間の一致が、容疑者が犯罪を実際に犯した証拠であり、一方で一致の欠如によって容疑者は除外される。存在する多型部位はこのような方法において使用することができ、ヒトゲノム中の他の多型部位も使用することができる。
【実施例】
【0212】
以下の実施例は、特許請求する本発明を制限するためではなく、例示するために与える。当業者は、本発明の範囲内で変えることができる様々な重要でないパラメータを理解しているはずである。
【0213】
(実施例1)
乳癌マーカーを同定するための戦略
導入:一般的な遺伝的変異の同定
乳癌マーカー対立遺伝子の同定において公衆衛生に重要な適用例が存在する。遺伝的変異が多くの遺伝子座によるものである場合、易罹患性の遺伝子座で受け継がれた高リスクの対立遺伝子の数に応じて、個体に対するリスクは広く変化する。Antoniouら
13のモデルに基づく我々の分析は、集団の上位20%と下位20%との間に40倍ものリスクの違いが存在する可能性があることを示唆する。同じモデルの下で、全乳癌の半数が最大リスクの女性の12%において発生し、これらの女性は70才までに少なくとも8分の1のリスクを有する。対照的に、最小リスクの女性の50%は癌のわずか12%、および30分の1未満の個体リスクを有する
14。乳癌のリスクと相関関係があるとして同定する遺伝子は、関連および個体リスクの推定に使用することができる。このリスク推定の実際の結果は重要である。
【0214】
適度のリスクをもたらす一般的な遺伝的変異は、集団レベルで個々に重要な影響を有する。例えば、個体リスクをわずか1.5倍増大させる頻度20%での一般的な変異は、癌の集団の負担(population burden)の15%に相当するはずである。心臓血管病における血圧、またはコレステロールの適度な上昇も同様である。変異が介入に適した機構を示す場合、これは標的予防に関する新規の可能性も与える。
【0215】
これらの実際の結果以外に、癌易罹患性遺伝子の同定は、(例えばBRCA1およびBRCA2に関して既に起こっているのと同様の)発癌の機構の解明を手助けする。知られている候補から全ゲノム検索への拡大には、全く新規の機構が生じるという大きな利点がある。これらの機構は新たな治療標的も与える。
【0216】
最後に、易罹患性遺伝子の知識によって我々は、ライフスタイルによるリスク因子の影響を、例えばEPICコホートを使用して遺伝子とこれらのリスク因子を組合せた影響を試験することによって解明することができる。
【0217】
乳癌
多くの癌における関連試験に関して補強を行うことができるが、乳癌において試験を実施することが何故非常に適切であるかという、幾つかの理由が存在する。乳癌は女性における最も一般的な癌であり、その原因論は依然としてほとんど理解されていない。この疾患の遺伝的根拠は、任意の他の一般的な癌より徹底的に調べられてきている。結果として、多遺伝子的根拠に支持される証拠は他の癌より明らかである。長期の試験によって、確実に易罹患性遺伝子座を同定するほど充分多数の症例系を構築している。さらに、強い家族歴を有する症例は癌臨床遺伝学によって利用可能であり、関連試験中の有効性において相当な利益を与え得る(「Research Proposal」を参照)。最後に、高リスク状態であることが分かっている女性に対して、示される可能性がある介入が存在する。例えば予防的卵巣摘出術は、乳癌の後のリスクを実質的に低下させることができる
15。近年の試験は、MRIによるスクリーニングは著しく高いコストではあるが、マンモグラフィーよりはるかに高い感度を与える可能性があることを示唆する
16。
【0218】
試験設計
200,000の一塩基多型(SNP)の遺伝子型を、EPICコホートからの400の家族性乳癌症例と400の対照のセットにおいて決定し、最も強い関係を示すこれらのSNPの5%を、4,600の症例と4,600の対照の他の集団ベースの系において分析する。他の大きな症例−対照系において、このステージにおける正の関係を同定する。
【0219】
乳癌の終点以外に、多くの量的表現型が対照のセットにおいて入手可能であり、遺伝子分析に関する他のデータを与える。これらは癌のリスクと関係がある表現型(例えば、マンモグラフィーパターン、ホルモンレベル)を含む。
【0220】
収率
スキャンは、反復配列外の全ゲノム中の、頻度10%以上(および幾つかは5〜10%の範囲)の一塩基多型を評価する。スキャンは、乳癌の全ての受け継がれる要素の2%以上を占めるこれらの領域内の、任意の一般的な変異を検出する約80%の能力を有する。
【0221】
一般的な易罹患性変異を検索するための試験の設計
一般的な低リスクの対立遺伝子を同定するのに有効な設計は、症例/対照試験である。易罹患性と関係がある変異体は、遺伝的背景が一致する対照より有意に高い頻度での、癌症例におけるそれらの発生によって同定する。この試験では、変異は一塩基多型(SNP)である。疾患の易罹患性と関係がある可能性がある活性または機能的変異体は知られていないことが最も多く、したがってその検索は、推定(ただし知られていない)活性変異体を報告することができる「タグ化」SNPのセットに依存する。
【0222】
症例−対照関連試験の手法は、「候補遺伝子」規模で乳癌において既に広く使用されている。約100遺伝子のコード領域およびイントロンの多型が、このようにして以前に試験されている。これらは例えば、性ステロイドホルモンの代謝、細胞周期の調節およびDNAの修復と関係がある遺伝子を含む。幾つかの関係が一般的な変異体に関して示唆されてきているが、明確に確定しているものはない。今までの結果は、乳癌のリスクの大部分の変化は、乳癌候補としての第一選択肢である可能性がある遺伝子の遺伝子内DNAの変異によるものではないことを示唆する。さらに、候補遺伝子の手法に対する重大な制約が存在する。それは緩慢で比較的高価であり、試験する各遺伝子のSNPベースによるSNPに関するアッセイの開発に依存し、それは候補遺伝子の範囲内でさえ不完全であり、多くの場合、特に考えられる制御の変化を無視しており、それは疾患の生物学の現在の知識によって制限される。ゲノム全般規模の検索は対照的に、機能または位置の如何なる従来知識も無しで、活性のある一般的な変異体を同定する能力を有する。
【0223】
ゲノムスキャンSNP
ゲノムスキャンに関する要件は、ゲノム中の全ての他のSNPSのセットの報告において、完全性とコストとの間の最良の妥協を与えるSNPのセットを定義することである。Perlegen Sciences(www(dot)perlegen(dot)com)は、ヒト/げっ歯類体細胞ハイブリッドにおける分離した20〜50の1倍体ゲノム中のヒトゲノムの非反復配列をリ配列決定することによって、110万の一般的なSNPマーカー(2kb当たり1SNPの密度)を同定している。このSNP検索は、Patilら
17により報告された染色体21の試験において報告された戦略と同様の戦略に基づく。ここから彼らは、動的計画法アルゴリズム
18を使用して、110万のSNPの完全なセットによって定義される明らかに80%を超える一般的なハプロタイプを報告する、200,000のタグ化SNPのセットを定義している。この実施例で使用したのは、200,000のタグ化SNPのこのセットである。
【0224】
Affymetrixにより開発され通常の使用において広く認められている、高密度オリゴヌクレオチドアレイでSNPを分類する。簡単に言うと、このアレイ設計は、各SNPを検索するために80の特徴(25量体オリゴヌクレオチド)を使用する。80の特徴は10の重複する特徴集合を含み、各特徴集合は、参照対立遺伝子に特異的な4つの特徴(1つの完全一致および3つのミスマッチ特徴)および他の対立遺伝子の4つの同様の特徴を含む。参照対立遺伝子の完全一致特徴の蛍光強度と他の対立遺伝子の完全一致特徴の蛍光強度を比較することによって、3つの考えられるSNP遺伝子型(一般的なホモ接合体、ヘテロ接合体および稀なホモ接合体)を区別することができる。遺伝子型決定アッセイを実施するために、当該のSNPを含むサンプルゲノムの領域を、マルチプレックス(78−plex)短期PCRを使用して特異的に増幅させる。各個体からのPCR産物を集め、ビオチンで標識して標的DNAを作製する。標的DNAは、SNPにより分類した高密度オリゴヌクレオチドアレイとハイブリダイズさせる。一晩のハイブリダイゼーション後、アレイを洗浄し、染色し蛍光強度をスキャンする。
【0225】
この実施例では、200,000のSNPを遺伝子型決定するための特徴は一連の6個の高密度アレイ上に配列しており、約30,000SNPの複雑性を有する標的DNAをハイブリダイゼーションに使用することが必要である。この複雑性の標的は97.3%の度数を与える。高密度アレイ遺伝子型決定技術と他の技術(リアルタイムPCRおよび蛍光偏光)の比較は、約20,000の遺伝子型および20までの異なるSNPで99%を超える一貫した一致を示す。この技術は様々な共同臨床検査質室および研究所由来のDNAと共に使用するとき確かであり、ゲノム増幅DNAと共によく働くことが証明されている。
【0226】
この試験で使用した200,000のタグ化SNPの性質は、ゲノム内の全ての他のSNP変異体を「報告する」それらの能力である。所与の能力に関して、必要とされるサンプルのサイズは1/r
2に比例し、この場合rは検索中の機能的変異体と最も密接に連鎖するタグ化SNPとの間の連鎖不均衡の係数である
19。
【0227】
非タグ化SNPとそれらの対応するタグ化SNPとの間のr
2の分布を、28の無関係な個体(56の染色体)において、ゲノムDNAの4Mb領域上に等しく位置する1608のSNPの遺伝子型を決定することにより経験的に決定した:表1参照。全988の試験体SNPの平均r
2は、それぞれ10%を超える低い対立遺伝子頻度で67%であり、69%のSNPが0.5を超えるr
2を有していた。
【0228】
表1
表1 SNPの発見に使用した個体と異なる28の個体中の染色体21の4Mbセグメントにおいて測定した、417の選択した「タグ化」SNPと988の「試験体」SNPとの間のr
2値の分布。SNPの全セットの15%は低い対立遺伝子頻度1〜10%を有しており、85%は10%を超える頻度を有しており、10%と50%との間で均一に分布していた。全ての試験体SNPは10%を超える低い対立遺伝子頻度を有していた。417のタグ化SNPセットの平均間隔は10kb当たり1であり、ゲノムスキャンにおいて使用した200,000のSNPセットのそれと同様であった。
【0229】
【表1】
200,000のタグ化SNPセットの増大によって、増大したコストではあるが、報告する全ゲノム中のSNPの割合が増大する。110万の一般的なSNPのセットでさえ全範囲はカバーしないはずである。これは、幾つかの塩基はアッセイすることができない可能性があり、調査した染色体の限られた数が原因で幾つかの一般的なSNPが欠失しているからである。この200,000のタグ化SNPセットは対象範囲とコストとの間の妥当な妥協を与えると、我々は結論付ける。
【0230】
以前の試験は、低い浸透率の易罹患性に対する充分な集中を含めて癌素因の遺伝学に集中している
13、14、20−23。関連トピックスには、(1)症例および対照セットの構築、(2)乳癌易罹患性の遺伝的モデルの開発、(3)関連試験の実験施設の設立がある。
【0231】
(1)サンプルセット
乳癌の症例−集団ベースのセット。地方のAnglian Cancer Registryによって同定された70才前に診断済みの侵襲性乳癌の(現在4900の)症例の集団ベースのセットを我々は構築した。診断から動員の終了までの平均期間は、6ヶ月(四分位範囲3〜9ヶ月)である。全ての適格症例の65%が血液サンプルを与えた。このセットは、我々の試験のステージ1で分析する幾つかの家族症例、およびステージ2の集団ベースの一連の症例を与える。血液サンプル以外に、第二度近親との家族歴、出産歴、授乳、経口避妊薬およびHRTの使用、良性乳房疾患、他の癌を含めた病歴、喫煙状態、アルコール摂取、学歴および民族を含めた質問を対象に実施する。登録データは臨床段階、病状等級および段階、単純な治療データおよび生存の追跡調査を含む。腫瘍のパラフィン切片は現在800の症例から入手可能であり、資金が利用可能である場合は全セットの大部分に関して原則として回収することができる。
【0232】
乳癌の症例−家族性のセット。ケンブリッジの家族性乳癌クリニックおよび前に記載した集団ベースのセットによって、BRCA1およびBRCA2突然変異に関して陰性との結果が出た、乳癌または左右の初期乳癌のいずれかの強い家族歴を有する200を超える症例のセットを構築した。これらの症例、および他のCRUK群との共同によって得た同様の症例は、関連試験の第一ステージ用の「遺伝的に多様な」症例のセットを形成する。
【0233】
対照。試験のステージ1とステージ2の両方用の対照DNAは、EPIC−Norfolkコホートから得る
24。これはMulticentre European Prospective Investigation of Cancerの一部であり、全血、広範囲の疫学的情報および追跡調査から動員した45〜70才の男性および女性の450,000強の集団ベースのコホートが利用可能である。EPIC−Norfolkの25,000の参加者は、乳癌の症例をそこから得る同じAnglian領域内のNorfolkにおける家族歴の診療から同定したボランティアである。このプロジェクトの遺伝子発見段階の対照を与える以外に、大きなEPICコホートは正の関係を同定するため、および追跡調査段階での遺伝子/ライフスタイルの相互作用を調べるためのサンプルおよびデータを与える。
【0234】
試験集団は民族的に比較的均質であり、集団の95%より多くを白人であり英国生まれであるとして記録する。この集団における集団層化に関する証拠は、23の非連鎖遺伝子におけるSNPの1655の対照の遺伝子型決定によって評価している。非連鎖遺伝子間の有意な関係は見出せず、層化の証拠は示せなかった
25。
【0235】
EPIC対照セットにおける他の表現型の情報。試験と関連して、広範囲の表現型情報が(個体の小集団内で)利用可能であるか、あるいはステージ1で200,000のSNPに関して遺伝子型決定する400のEPIC対照から容易に得ることができる。これらの定量的または半定量的表現型を、遺伝子型関係に関して評価する。乳癌と関係がある表現型には、マンモグラフィー密度、踵骨密度、体格指数、およびその中でこれまでエストロゲン代謝産物、SHBG、IGF−1、および幾つかのサイトカインが異なるセットの個体において既に入手可能である血清中の一定範囲の測定値がある。他の表現型には、血圧、脂質プロファイル、C−反応性タンパク質、フィブリノゲン、全血球数、糖化ヘモグロビンおよび甲状腺機能がある。2004年および2005年に、再調査およびさらなる血液サンプリングのための限定的な改修、ならびに他の表現型決定および新たな血清および生存細胞の回収の可能性が考えられている。
【0236】
(2)乳癌易罹患性の遺伝的モデル。
【0237】
我々はBRCA1およびBRCA2の突然変異に関するAnglian集団ベースの試験において同定した第一の1500の乳癌を分析し、Petoらと一致して、乳癌の家族集積性のわずか15%が、これらの遺伝子の突然変異に起因することを見出した。この試験の症例の家族(他の系で後に試験した)における乳癌のパターンの我々の分離比分析は、初期に要約された多遺伝子モデルをもたらした
13。したがってこのモデルは、任意抽出症例ではなく家族症例を使用することによって与えられる関連試験に関する高い能力の予測が根底にあり、これはこの実施例で使用する示した2ステージ設計に基づく
26。
【0238】
(3)サンプル処理およびSNP遺伝子型決定用の実験設定。
【0239】
384ウエルのTaqmanプラットホームをベースとする適度なスループットの遺伝子型決定用実験設定を、候補遺伝子関連試験に使用する。遺伝子型決定能力は、1週間当たりで〜100,000SNPである。
【0240】
簡単に言うと、実験設定は以下の通りである。試験の参加者には、全参加者のデータおよびその生物サンプルチューブが付いたままの状態でバーコードとしてコード番号を与える。実験室内では、Laboratory Information Management System(Thermo、Altringham UK)を用いてサンプルを追跡する。96対象のバッチにおいて、Whatman Ltd(Ely、UK)によりコードしたチューブ内の全血からDNAを抽出し、コードしたアレイに戻し、DNAは40ng/μlに標準化する。全ゲノムの予備増幅は標準化したアレイで実施し、産物は等分試料で保存した。遺伝子型決定用の384ウエルの作業用ストックを、陰性対照として対照ウエルを挿入しながら等数の症例および対照から作製する。試験の3%のサンプルが複製である。したがって、(前に記載した)症例および対照は、12の特有サンプルおよび13番目が複製の13プレートに保持する。遺伝子型決定は全ての試験プレートで同時に実施し、試薬はロボット(Matrix、UK)によって加え、MJ Tetrads(GRI、UK)で熱循環させ、および7900 Sequence Detector(ABI、Warrington、UK)によって終点の蛍光を検出する。遺伝子型はデータベースに移し、各対象に関する表現型のデータと関連付ける。最終品質管理ステップとして、対照の遺伝子型をハーディ−ワインベルグ平衡からの逸脱に関して試験する。
【0241】
研究設計
試験は数ステージで編成される:
ステージ1。200,000のタグ化SNPのフルセットを家族歴が多様な400の無関係な乳癌症例において分析し、400の女性対照をEPIC試験から抽出する。これらの乳癌症例は、BRCA1/2突然変異に関して陰性であるとスクリーニングされるはずである。
【0242】
ステージ2。p<0.05レベルで癌系と対照系との間の有意な頻度の違いを示すSNPを、他の4600の乳癌症例および4600の適合対照において再評価する。
【0243】
研究設計の合理性
リスクに対して適度な影響でSNPを検出する高い能力を保ちながら、段階的設計を選択して必要とされる遺伝子型決定の量を最小にする。示した閾値で、約10,000のSNPがステージ2に進むはずであり、一方(「真の」関係にの数に応じて)実質的に少数が、ステージ2の最後で他の試験におけるさらなる同定用に持ち出されると予想される。このような段階的設計は全SNPの全サンプルの遺伝子型決定と比較して、非常に有効であることを計算は示している
27。
【0244】
症例−ステージ1
症例は侵襲性乳癌を有する女性であり、その少なくとも2人の第一度近親は乳癌、あるいは等しく強い家族歴を有している(例えば、1人の第一度および2人の第二度近親が罹患している)。これらの女性は英国の癌遺伝学センターから、またはAnglian Breast Cancer Studyから選択する。その民族が白人として記録されない女性は除外することにする。
【0245】
関係を検出する能力は、症例の家族歴の程度と強く関係があることを、我々は以前に実証している
26。2人の罹患した第一度近親を有する症例の使用は、任意抽出症例の使用と比較して、必要とされるサンプルの大きさを少なくとも4倍低下させる。全ての利用可能な症例から特に、我々は強い家族歴を有する400の症例を選択する。同じ家族からの2つ以上の症例が利用可能である場合、我々はセット中の全ての症例が無関係であるように最も強い直接的な家族歴を有する症例を選択する。
【0246】
全ての症例をBRCA1およびBRCA2突然変異に関してスクリーニングする(そしてこれらに関して陰性である)。このスクリーニングは、感受性スクリーニング技法(例えばCSGE)による全てのエクソンおよびスプライシング接合部のスクリーニングを含む。BRCA1またはBRCA2突然変異の非保因者において乳癌のリスクに影響を与える低い浸透率の対立遺伝子が、保因者におけるリスクにも影響を与えるかどうかは知られていないので、これを実施する。Antoniouら
13の分析は、保因者における同様の「多遺伝子」要素を示唆する。しかしながら、特にBRCAI腫瘍の独特の病状を考慮すると、BRCA1およびBRCA2保因者におけるリスクを変える遺伝子は異なる可能性があると考えられる。BRCA1およびBRCA2突然変異は、ステージ1で使用した基準により選択した20%を超える症例において存在するはずである。当該の多型が保因者における疾患のリスクに影響を与えない場合、保因者を含めることによって試験の能力が低下する可能性がある。したがって試験は保存状態でスクリーニングを行い、知られているBRCA1およびBRCA2突然変異の保因者は除外する。この手法は、約70%のBRCA1突然変異および90%のBRCA2突然変異を除外し、したがって最終セット中の5%未満の症例が未同定の突然変異をおそらく有すると推定される。
【0247】
症例−ステージ2
ステージ2における症例は、集団ベースのAnglian Breast Cancer(ABC)試験から抽出した4,600の症例からなる。
【0248】
ステージ1において能力を最大にしコストを最小にするための「多様な」症例の使用に関する補強が存在するが、ステージ2において症例はより細かくバランスがとれている。家族症例の使用は能力を増大させるが、能力の主な決定要因はステージ1の有効性であるので、利点はそれほど顕著ではない。同時に、集団ベースの症例−対照セットは候補遺伝子関連試験中で既に使用されており、DNAサンプルはステージ1から既に並べてある。この規模での家族症例の新たなセットの開発は、相当な遅れおよび出費を伴うはずである。第二に、症例は対照と地理的に密接に合致しており、対立遺伝子頻度の地域格差による偽陽性関係に対する一層の防御をもたらす。第三に、集団ベースの系は、それぞれのSNPまたはハプロタイプと関係がある相対的リスクの直接推定値を与える。第四に、ABC試験は、癌のライフスタイルのリスク因子および臨床結果に関する系統的情報を回収している。これは、生存との関係およびライフスタイルのリスク因子との相互作用を試験するための、さらなる分析の可能性を与える。同じ質の情報は、家族症例に関して得ることができなかった。
【0249】
要約すると、多様な系と集団ベースの症例系の両方の系を使用することによって、我々は真の関係を検出する能力を最適化しており、一方同時に、充分に特徴付けられている集団ベースの症例−対照試験における遺伝子型決定という付加価値を得ている。
【0250】
対照
ステージ1とステージ2の両方の対照は、前に記載したEPIC試験からの女性であるはずである。対照の年齢分布は、症例のそれと同様である。進行した癌を有することが知られている女性、または白人ではない女性は除外するはずである。ステージ1の対照は、その性ステロイドホルモンおよびマンモグラフィー密度の詳細な分析を実施した、2,000人の閉経後女性のサブコホートからサンプル採取した
28。
【0251】
遺伝的関係試験のための症例サンプルと対照サンプルの両方の使用を含む倫理的承認が得られている。症例と対照の両方が、このような遺伝的試験に使用するそれらのDNAに関するインフォームドコンセントを与えている。
【0252】
統計的考察
統計分析
ステージ1とステージ2の両方における一次分析は、乳癌とそれぞれのSNPの関係を個別に評価することである。疫学的試験は、おそらく非常に若い年齢以外は
1、12、症例の母親および姉妹間で乳癌の相対的リスクがほとんどあるいは全く違わないことを示唆し、(Antoniouら
13の多遺伝子モデルと同様に)最も易罹患性の対立遺伝子は劣性要素をほとんど有していないことを示す。したがって一次分析は、症例と対照との間の対立遺伝子頻度の違いに関する傾向検定に基づく
29。症例は家族歴によって重み付けして、この検定の有効性を改善する。
【0253】
原則として、ハプロタイプ分析または共同遺伝子型分析によってある程度の能力の改善をもたらすことができる
30。しかしながら現在の設計では、ハプロタイプ分析は大部分が冗長である。これは、ごく少数のSNPがステージ2に持ち越されるはずであり、能力の計算値は推定の一回SNP分析値をしたがって有するはずであるからである。群中の全てのタグ化SNPをステージ2に持ち越して完全なハプロタイプ分析を可能にするコストは、能力の如何なる増大より重要である可能性がある。ハプロタイプ分析は同じLD群中の2つ以上の連鎖したSNPをステージ2で分類する症例において使用し、追跡調査試験において広く使用するはずである。
【0254】
能力の計算
試験の能力は、組合せた2ステージ中のp=10
−4という有意なレベルに基づいて導いている。(段階的設計を考慮して)約12の遺伝子座が偶然このレベルで重要であると予想され、処理可能な数の遺伝子座を大きな系で再検定し、「真の」陽性と「偽」陽性の好ましい比を保つ。
【0255】
能力の計算によって、ステージ1の症例は2人の罹患した第一度近親という家族歴を有すると推測される。実際、これは最小基準であり症例の多くはさらに強い家族歴を有するはずなので、能力は幾分高い。タグ化セットからの推定のr
2分布を考慮して、疾患の対立遺伝子頻度および相対的リスクの異なる値に関する、疾患易罹患性の対立遺伝子を検出する能力の例を表2中に与える(.05の対立遺伝子頻度を有する多型に関しては、セットからランダムに選択した一般的な多型と共にD’=1でLD中に多型が存在すると推定することによって能力を計算している)。一般的な対立遺伝子に関しては、能力は全体の遺伝的変異に対する遺伝子座の頁献に主に依存し、1%の変異を説明する遺伝子座に関しては少なくとも50%であり、2%の変異を説明する遺伝子座に関しては約80%である。対照的に、5%未満の頻度を有する遺伝子座に関しては、エフェクトサイズが非常に大きくない限り能力は低い。
【0256】
表2
表2。以前に報告されたデータ(表1)に基づき易罹患性の遺伝子座とタグSNPとの間のr
2の分布を考慮して、所与の相対的リスクを与える所与の対立遺伝子頻度で(2ステージ後にP<.0001)優性な易罹患性の遺伝子座を検出すると推定した全体の能力。全体の遺伝的変異の割合は括弧内に説明した。
【0257】
【表2】
対照において測定した量的形質に関して、遺伝子座を検出する能力は約50%であり、5%の有意レベルで少なくとも5%の表現型変異を説明する。これらの遺伝子座は、EPICコホート内の後の大規模な試験における他の評価に利用可能であるはずである。
【0258】
易罹患性の遺伝子座の詳細な評価
ひとたび有意な関係を同定した後、最も強く関連する変異体またはハプロタイプを確定する目的で領域中の他の多型を評価する。一般的な手順は、候補遺伝子を調べるために使用する手順と類似しているはずである。利用可能なデータベースを、知られているSNPに関して検索する。全ての利用可能なSNPに関する系統的検索を実施していない場合、限られた数の個体(例えば、n=48)の内部リシークエンスを使用する。完全LD状態であるSNPを除外した後、情報を与えるSNPはステージ1および2で使用する症例および対照において遺伝子型を決定する。多重ロジスティック回帰を使用して多数のSNPの複合効果を調べる。さらなる調査を実施して機能性変異体を同定することができる。
【0259】
量的形質遺伝子座のさらなる評価
量的形質とステージ1で有意な関係を示すSNPは、他の系中の反復試験に利用可能である。量的形質遺伝子座の数が多いので、関係の強度、遺伝子座の妥当性および表現型の重要性に基づいて優先順位付けを実施する。例えば、血清中の性ステロイドホルモンのレベルおよびマンモグラフィー密度との関係は優先順位付けすることが好ましい。というのは、これらは乳癌のリスクと関係があるからである。EPICにおいて閉経後女性由来の他の1,600サンプル中で、これらの表現型と関係があるSNPを分類する。関係が再現する場合、前と同様にそれらを追跡する。
【0260】
参考文献:
【0261】
【化1】
【0262】
【化2】
【0263】
【化3】
(実施例2)
乳癌の素因と関係があるマーカー多型
乳癌のリスク(素因)と関係があると同定したSNPを、
図1および2中に述べる。
図1は現在最も好ましい関係を与え、
図2は他の関係を与える。
【0264】
所与のdbSNP_rsID番号(「REFSNP_ID」、図からの第2行を参照)の配列は、:http://www.ncbi.nlm.nih.gov/SNP/で見られる。
図1および2中では、第2行は「REFSNP_ID」と示す。この行中の値は、US National Library of Medicine at the US National Institute of HealthのNCBIによって確立および維持されているdbSNPデータベースによるSNP識別番号である。NCBIのdbSNPデータベースは公的にアクセス可能であり、図中に与えるrsID番号を使用してデータベースを検索し、データベース検索ウインドウ中の「rs」によって接頭辞を表す番号を入力し、および「Search」をクリックすることによって、多量の他の情報を容易に見ることができる。与えられる情報は、SNP遺伝子座における対立遺伝子、隣接ヌクレオチド配列、および寄託情報だけには限られないが、これらを含み得る。
【0265】
SNP_ID行の番号(行1、
図1および2を参照)は公的に利用可能であるPerlegenのSNP識別番号を指し、与えられた指示書(Perlegen Sciences, Inc.、Menlo Park、CA)に従い、genome(dot)perlegen(dot)com/browser/index(dot)htmlで企業の利用可能なゲノムブラウザを使用して、Perlegen(dot)comにおいて関連情報と共にこれを見ることができる。与えられた指示書中に記されたように、ワイルドカード文字(例えば、「
*」記号)はSNP_IDの最初に加えて、SNPの全対立遺伝子に関する関連情報を同定することができる。このデータベースは、NCBIゲノムデータベースともリンクする。
【0266】
図中、各ページの第1列は行名に関する見出し列である。行は以下の通りである:
【0267】
【表3】
前述の本発明を明瞭性および理解の目的である程度詳細に記載してきたが、様々な形および詳細の変形を本発明の真の範囲から逸脱せずに作製することができることは、本開示を読むことから当業者には明らかであるはずである。例えば、前に記載した全ての技法および装置は、様々な組合せで使用することができる。本出願中に列挙した全ての刊行物、特許、特許出願、および/または他の文書は、それぞれ個々の刊行物、特許、特許出願、および/または他の文書が参照によりあらゆる目的で組み込まれることが個別に示される場合と同程度で、参照によりあらゆる目的でその全容が本明細書に組み込まれる。