(58)【調査した分野】(Int.Cl.,DB名)
妊娠女性から採取された生物試料における胎児DNAの分画濃度を決定する方法であって、胎児は父親と妊娠女性である母親を有し、ここで、生物試料は、母親核酸と胎児の核酸の混合物を含み、該方法は、
生物試料由来の複数の核酸分子を分析し、ここで核酸分子の分析は
ヒトゲノムにおける核酸分子の位置を同定し;及び
核酸分子のそれぞれの対立遺伝子を決定する
ことを含み;
1以上の第1の遺伝子座をコンピュータシステムで同定し、ここで、胎児ゲノムが第1の遺伝子座でそれぞれの第1の対立遺伝子及び第2の対立遺伝子を有するように、胎児ゲノムは各々の第1の遺伝子座でヘテロ接合であり、ここで、母親ゲノムが第1の遺伝子座でそれぞれの第2の対立遺伝子の2つを有するように、母親ゲノムは各々第1の遺伝子座でホモ接合であり、第1の対立遺伝子は第2の対立遺伝子とは異なり、ここで、1以上の第1の遺伝子座の1つである特定の遺伝子座の決定が、
特定の遺伝子座でそれぞれの第1の対立遺伝子の予測されたカウント数についてカットオフ値を決定し、該カットオフ値は、母親ゲノムがホモ接合であり、胎児ゲノムがヘテロ接合であるかどうかを予測し、ここで、該カットオフ値は、特定の遺伝子座でホモ接合及びヘテロ接合の異なる組み合わせについてカウント数の統計的分布に基づいて決定され;
複数の核酸分子の分析に基づいて、特定の遺伝子座でそれぞれの第1の対立遺伝子及びそれぞれの第2の対立遺伝子を検出し;
生物試料由来の複数の核酸の分析に基づいて、それぞれの第1の対立遺伝子の実際のカウント数を決定し;及び
実際のカウント数がカットオフ値未満である場合に、特定の遺伝子座が第1の遺伝子座の1つであると決定する
ことを含み;
少なくとも1つの第1の遺伝子座について
それぞれの第1の対立遺伝子のカウントの第1の数P、及びそれぞれの第2の対立遺伝子のカウントの第2の数Qを決定し;及び
第1の数と第2の数に基づいて分画濃度を計算する
ことを含む方法。
核酸分子を分析することが、大規模並列配列決定、マイクロアレイ、ハイブリダイゼーション、リアルタイムPCR、デジタルPCR、及び質量分析からなる群から選択される少なくとも1つの技術を、核酸分子の少なくとも一部に対して実施することを含む、請求項1に記載の方法。
【発明を実施するための形態】
【0020】
定義
用語「生物試料」とは、本明細書で使用するとき、対象(例えば、妊娠女性などのヒト)から採取され、対象とする1以上の核酸分子を含むいずれかの試料を意味する。
【0021】
用語「核酸」又は「ポリヌクレオチド」は、デオキシリボ核酸(DNA)又はリボ核酸(RNA)、及び一本又は二本鎖のいずれかの形態であるそのポリマーのことである。具体的に限定されない限り、当該用語は、基準核酸と同程度の結合特性を有する、既知の天然ヌクレオチドアナログを含む核酸を含み、そして天然に存在するヌクレオチドに同様の方法で代謝される。他に示されない限り、特定の核酸配列はまた、その保存的に改変された改変体(例えば、縮重コドン置換)、対立遺伝子、オルソログ、SNPs、及び相補的配列、並びに明確に示された配列を暗黙的に含む。具体的には、縮重コドン置換は、一つ以上選択された(又は全ての)コドンの第三の位置が混合塩基及び/又はデオキシイノシン残基で置換されている配列を生じさせることによって達成され得る(Batzer et al.,Nucleic Acid Res.19:5081(1991);Ohtsuka et al,J.Biol.Chem.260:2605−2608(1985);及びRossolini et al, Mol.Cell.Probes 8:91−98(1994))。用語、核酸は、遺伝子、cDNA、mRNA、低分子ノンコーディングRNA、マイクロRNA(miRNA)、Piwi相互作用RNA、及び遺伝子又は遺伝子座によってコード化されたショートヘアピンRNA(shRNA)と交換可能に使用される。
【0022】
用語「遺伝子」は、ポリペプチド鎖を産生することに関与するDNA断片を意味する。それは、コード領域に先行する、及びコード領域に続く領域(リーダー及びトレイラー)、並びに個々のコード断片(エキソン)間の介在配列を含み得る。
【0023】
本明細書において使用される用語「臨床的に重要な核酸配列」は、その潜在的不均衡が試験される、より大きな遺伝子配列断片に相当するポリヌクレオチド配列のことか、又はそのより大きな遺伝子配列自体に相当するポリヌクレオチド配列のことであり得る。一つの実施例は、第21番染色体の配列である。他の例は、第18番、第13番、X及びY染色体を含む。さらに他の例は、胎児がその親の片方又は両方から受け継いているかもしれない変異遺伝子配列、又は遺伝子多型、又はコピー数変異を含む。さらに他の実施例は、悪性腫瘍中において変異した、欠失した、又は増幅された配列、例えばヘテロ接合性の欠損又は遺伝子重複が起こっている配列を含む。幾つかの実施形態において、複数の臨床的に重要な核酸配列、又は臨床的に重要な核酸配列の同等の複数のメーカーが、当該不均衡を検出するためのデータを提供するために使用され得る。例えば、第21番染色体上の5つの不連続配列からのデータは、可能性のある第21番染色体不均衡の決定のための付加的な方法において使用され得、効果的に試料の容量を1/5へと減少させる。
【0024】
本明細書において使用される用語「に基づく」は、「少なくとも一部に基づく」ことを意味し、そして、一つの方法の入力とその方法の出力との関係において生じる、一つの値の決定において使用される別の値(又は結果)のことをいう。本明細書において使用される用語「導く」はまた、一つの方法の入力とその方法の出力との関係のことであり、例えば誘導が公式計算であるときに起こる。
【0025】
本明細書において使用される用語「パラメータ」は、定量的データのセットを特徴づける数値、及び/又は定量的データセット間における数的関係を意味する。例えば、第一の核酸配列の第一の量と第二の核酸配列の第二の量との間における比率(又は比率の関数)はパラメータである。
【0026】
本明細書において使用するとき、用語「遺伝子座(locus)」又はその複数形の「遺伝子座(loci)」とは、ゲノム全体での改変を有する任意の長さのヌクレオチド(又は塩基対)の局在又は所在を意味する。
【0027】
用語「配列不均衡」とは、本明細書で使用するとき、参照量からの臨床的に関連した核酸配列における少なくとも1つのカットオフ値によって定義される任意の有意な逸脱を意味する。配列不均衡は、染色体用量不均衡、対立遺伝子不均衡、突然変異用量不均衡、ハプロタイプ用量不均衡、及び他の類似した不均衡を含むことができる。一例として、対立遺伝子不均衡又は突然変異用量不均衡は、胎児が母親由来の異なる遺伝子型を有する場合に生じ、それにより試料中の特定の遺伝子座で不均衡を創出することができる。
【0028】
本明細書において使用される用語「染色体異数性」は、2倍体ゲノムのもの由来の染色体量における変異を意味する。当該変異は、増加又は欠失であり得る。それは、一つの染色体の全体、又は一つの染色体の領域に関連し得る。
【0029】
用語「ハプロタイプ」とは、本明細書において使用するとき、同じ染色体又は染色体領域上の一緒に伝えられる、複数の遺伝子座での対立遺伝子の組み合わせを意味する。ハプロタイプは、僅かに一対の遺伝子座、染色体領域、又は全染色体を意味する場合がある。用語「対立遺伝子」とは、異なる表現型形質に帰着するか又は帰着しない可能性がある同じ物理的ゲノム遺伝子座での代替のDNA配列を意味する。任意の特定の2倍体生物では、各染色体(男性対象における性染色体を除く)の2つのコピーを有し、各遺伝子についての遺伝子型は、ホモ接合体においては同じであり、ヘテロ接合体においては異なる、その遺伝子座に存在する対立遺伝子の対を含む。生物の集団又は種は、典型的には、種々の個体間で各遺伝子座に複数の対立遺伝子を含む。1を超える対立遺伝子がこの集団に見られるゲノム遺伝子座は多形性部位と呼ばれる。遺伝子座での対立遺伝子改変体は、存在する対立遺伝子の数(すなわち、多型の程度)、又は集団におけるヘテロ接合体の比率(すなわち、ヘテロ接合性率)として測定可能である。本明細書において使用するとき、用語「多型」とは、ヒトゲノムにおける任意の個体間改変を意味し、その頻度とは関係しない。このような改変体の例には、限定されないが、単一のヌクレオチド多型、単一のタンデムリピート多型、挿入−欠失多型、突然変異(疾患原因となり得る)、及びコピー数の改変体が含まれる。
【0030】
出生前の胎児の部分的な遺伝子マップ又は完全なゲノム配列の構築は、その親の多型配列のハプロタイプに基づいて提供され得る。用語「ハプロタイプ」とは、本明細書中で使用するとき、同一の染色体又は染色体の領域上に一緒に伝わる複数の遺伝子座での対立遺伝子の組み合わせを意味する。例えば、態様は、母親の試料(母親と胎児のDNAを含む)からのDNA断片を分析し、ある種の特定の遺伝子座(ランドマーク)で対立遺伝子を同定することができる。次に、それらの遺伝子座でのそれぞれの対立遺伝子のDNA断片量を一緒に分析して、これらの遺伝子座についてのハプロタイプの相対量を決定し、それによって、どのハプロタイプが母親及び/又は父親のゲノムから胎児に遺伝されたかを決定することができる。胎児ハプロタイプを同定することによって、特定の遺伝子座を含む対応するゲノム領域内の個々の遺伝子座での胎児遺伝子型を決定することができる。種々の態様では、親がホモ接合とヘテロ接合の特定の組み合わせである遺伝子座は、胎児ゲノムの領域を決定するように分析することができる。1つの実施において、集団に共通したハロタイプの代表である参照ハロタイプは、母親の試料のDNA断片の分析と一緒に用いられて、母親と父親のゲノムを決定する。
【0031】
胎児ゲノムの少なくとも一部を決定するための態様の応用冷は、推定された胎児のゲノム又はハプロタイプと、疑われた父親のゲノム又はハプロタイプとを比較することによる実父確定検査に対するものであり得た。別の例は、胎児が獲得した1以上のデノボの突然変異を検出し、その親からの配偶子の生成中に起こる減数分裂性組み換え事象を検出することである。これらは受精された配偶子であり、得られた接合子は胎児で発生した。
【0032】
さらに、いくつかの態様はまた、任意の所望の解像度で出生前の胎児のゲノム配列を決定することができる。例えば、ある種の応用では、態様は、完全又は完全に近い胎児のゲノム配列を決定することができる。一態様では、決定され得る胎児ゲノム配列の解像度は、胎児核酸を含む母親の生物試料からの配列決定情報と併せて、父親と母親のゲノムの知識の解像度に依存する。父親と母親の完全又は完全に近いゲノム配列が知られている事象では、出生前の胎児の完全又は完全に近いゲノム配列が推定され得た。
【0033】
他の態様では、ゲノム内の選択された領域のゲノム配列だけが、例えば、選択された遺伝的障害、後成的障害(刷り込み障害など)、又は染色体障害の出生前診断について解明されている。態様が適用され得る遺伝的障害の例には、異常ヘモグロビン症(例えば、ベータ−サラセミア、アルファ−サラセミア、鎌状赤血球貧血、ヘモグロビンE疾患)、嚢胞性線維症、及び伴性障害(例えば、血友病及びデュシェンヌ型筋ジストロフィー)などが挙げられる。態様を用いて検出され得る更なる例は、Online Mendelian Inheritance in Man(www.ncbi.nlm.nih.gov/omim/getmorbid.cgi)から見出される。
【0034】
また、いくつかの態様は、胎児DNAの画分濃度を決定するために使用することができ、それは、親の特定のゲノムの任意の従前の知識なしに行われてもよい。さらに、類似の分析を用いて、胎児ゲノムの正確な決定に必要とされる範囲の深度を決定することができる。このようにして、この範囲決定を用いて、どのくらいのデータが正確な結果を得るために分析される必要があるかを見積もることができる。
【0035】
I.導入
母親の試料(例えば、血漿又は血清)が胎児ハプロタイプを解明するための材料として使用される場合、2つの主要な挑戦が存在し得る。第1の挑戦は、母親の血漿又は血清が胎児と母親のDNAの混合物からなるということであり、胎児DNAは最小集団である。胎児DNAは、妊娠の最初の2つの第3期において、母親の血漿中の全DNAの約5%〜10%の平均メジアン濃度を表すことが示されている(Lo YMD et al Am J Hum Genet 1998;62:768−775;Lun FMF et al Clin Chem 2008;54:1664−1672)。DNAは血液凝固過程中に母親の血球によって置換されるので、母親の血清中の胎児DNAの画分濃度は、母親の血漿中のものよりもさらに低くなり得る。このようにして、いくつかの態様では、母親の血漿は母親の血清よりも好ましい。
【0036】
第2の調製は、母親の血清中の胎児DNAと母親DNAは短い断片からなるということである(Chan KCA et al Clin Chem 2004; 50: 88−92)。確かに、胎児由来のDNAは、一般に、母親の血漿中の母親由来のDNAよりも短い。母親の血漿中の大部分の胎児DNAは、長さにして200bp未満である。このように短い血漿DNA断片を単独で用いて、長いゲノム距離と比較して、遺伝的多型のハプロタイプを構築することは挑戦的となり得る。また、母親の血漿及び血漿についての上記した挑戦は、母親の尿における胎児DNAの検出に適用される(Botezatu I et al Clin Chem 2000;46:1078−1084)。胎児DNAだけは、妊娠女性の尿中のDNAの最小画分を表し、母親の尿中の胎児DNAはまた短いDNA断片からなる。
【0037】
A.母親試料の配列決定及び分析
いくつかの態様が第1の挑戦に取り組むために採用してきたアプローチは、高精度で母親の生物試料から得られた核酸の定量的遺伝子型を可能にする方法を用いることである。このアプローチの1つの例では、精度は、大多数(例えば、数百万、数十億)の核酸分子の分析によって達成される。さらに、この精度は、単一の核酸分子の分析、又は単一の核酸分子のクローナル増幅によって高めることができる。1つの態様は、大規模並列配列決定を用い、例えば、限定されないが、Illumina Genome Analyzerプラットフォーム(Bentley DR et al. Nature 2008; 456: 53−59)、Roche 454プラットフォーム(Margulies M et al.Nature 2005;437:376−380)、ABI SOLiDプラットフォーム(McKernan KJ et al. Genome Res 2009;19:1527−1541)、Helicos単一分子配列決定プラットフォーム(Harris TD et al.Science 2008;320:106−109)、単一ポリメラーゼ分子を用いたリアルタイム配列決定(Science 2009;323:133−138)、及びナノ細孔配列決定(Clarke J et al.Nat Nanotechnol.2009;4:265−70)によって実行されるものが挙げられる。一態様では、大規模並列配列決定は、生物試料中の核酸分子のランダムサブセットについて実施される。
【0038】
いくつかの態様では、各分子からのできる限り長い配列読み込みを得ることは利点となり得る。達成され得る配列決定読み込みの長さの1つの制限は、母親の生物試料中の核酸分子の性質である。例えば、母親試料中の大部分のDNA分子は短い断片からなることは知られている(Chan CA et al Clin Chem 2004;50:88−92)。さらに、読み込み長さは、長い読み込み長さでの配列決定システムの忠誠に対して平衡を保たなければならない。上記システムのいくつかについて、分子の両末端からの配列、いわゆる対末端配列決定を得ることが好ましい場合がある。例証として、1つのアプローチはDNA分子の各末端から50bpの配列決定を行い、すなわち、分子あたり全100bpの配列をもたらすことである。別の態様では、DNA分子の各末端からの75bpの配列決定、すなわち、結果としての分子あたり全150bpの配列決定がなされ得る。
【0039】
配列決定がなされた後、次に、配列は参照ヒトゲノムに戻って整列される。態様は、両親からの出生前胎児によって遺伝されたゲノム改変体を解明するので、アラインメントアルゴリズムは配列改変体に対処し得る。このようなソフトウェアパッケージの一例は、Illuminaによって製造されるEfficient Large−Scale Alignment of Nucleotide Databases(ELAND)ソフトウェアである。このようなソフトウェアパッケージの別の例は、SOAP(短いオリゴヌクレオチドアラインメントプログラム)及びSOAP2ソフトウェア(Li R et al.Bioinformatics 2008;24:713−714;Li R et al.Bioinformatics 2009;25:1966−1967)である。
【0040】
実施されることが必要であり得るDNA配列決定の量は、胎児遺伝子マップ又は胎児ゲノム配列が構築される得る解像度に依存し得る。一般に、配列決定される分子が多くなれば、解像度も高くなる。DNA配列決定の所定のレベル又は深度での胎児遺伝子マップ又は胎児ゲノム配列の別の決定因子は、母親の生物試料中の胎児DNAの画分濃度である。一般に、画分胎児DNA濃度が高まると、DNA配列決定の所定のレベルで解明され得る胎児遺伝子マップ又は胎児ゲノム配列の解像度が高まる。母親の血漿中の胎児DNAの画分濃度が母親の血漿中のものよりも高いので、母親の血漿は、いくつかの態様の母親の血清よりも好ましい母親の生物試料タイプである。
【0041】
上記の配列決定に基づく方法のスループットは、インデキシング又はバーコーディングの使用とともに増加し得る。このようにして、試料又は患者特異的なインデックス又はバーコードは、特定の核酸配列決定ライブラリーにおける核酸断片に添加され得る。このようにして、このような多数のライブラリーは、各々が試料又は患者の特異的なインデックス又はバーコードであり、一緒に混合され、一緒に配列決定される。配列決定反応後、配列決定データは、バーコード又はインデックスに基づいて、各試料又は患者から回収され得る。この戦略は、本発明の態様のスループット、したがって、コストパフォーマンスを増大させ得る。
【0042】
一態様では、生物試料中の核酸分子は、定量的なゲノタイピング(例えば、配列決定)前に選択されるか又は分画されてもよい。一変形では、核酸分子は、ゲノム中の選択された遺伝子座(例えば、CFTR遺伝子を含む第7染色体上の領域)由来の核酸分子に選択的に結合することができるデバイス(例えば、マイクロアレイ)を用いて処理される。次に、配列決定は、デバイスによって捕捉された核酸分子上で選択的に実施され得る。このスキームは、対象とするゲノム領域に対して配列決定を標的とすることを可能にする。このスキームの一態様では、Nimblegen配列捕捉システム(www.nimblegen.com/products/seqcap/index.html)又はAgilent SureSelect Target Enrichment System(www.opengenomics.com/SureSelect
Target
Enrichment
System)、又は類似のプラットフォームを用いることができる。いくつかの態様では、ゲノムの選択された領域由来の核酸分子をランダム配列決定に供される。
【0043】
別の態様では、生物試料中の対象とするゲノム領域は、1セット又は複数セットの増幅プライマーによって最初に増幅され得る。次に、定量的なゲノタイピング、例えば、配列決定は、増幅産物上で実施され得る。このスキームの一態様では、RainDance(www.raindancetech.com/technology/pcr−genomics−research.asp)システムを用いることができる。いくつかの態様では、増幅された核酸分子はランダム配列決定に供される。
【0044】
また、サイズ画分肯定は、生物試料中の核酸分子上で実施され得る。胎児DNAは母親の血漿中の母親DNAよりも短いことが知られている(Li et al Clin Chem 2004;50:1002−1011;米国特許出願第20050164241号;米国特許出願第20070202525号)ので、より小さい分子サイズの画分を回収し、次に、定量的なゲノタイピング、例えば、配列決定のために用いることができる。このような画分は、元の生物試料よりも高い胎児DNAの画分濃度を含む。このようにして、胎児DNAに富化された画分の配列決定は、非富化試料を用いた場合よりも、分析の特定レベル(例えば、配列決定の深度)で、より高い解像度を用いて、胎児ゲノムマップ又は胎児ゲノム配列を構築することができるようになる。したがって、これは、本技術をよりコストパフォーマンスにすることができる。サイズ分画の方法の例として、(i)ゲル電気泳動、続く特定のゲル分画からの核酸分子の抽出;(ii)異なるサイズの核酸分子に対する差分親和性を有する核酸結合マトリックス;又は(iii)異なるサイズの核酸分子に対する差分保持を用いたろ過システムを用いることができた。
【0045】
なお別の態様では、核酸配列決定を可能にする特定のサイズ又はサイズ範囲の核酸分子を選択的に分析することができた。例えば、DNA分子の両末端が配列決定される、対末端配列決定を行うことができた。次に、これらの末端の両方のゲノム座標は、参照ヒトゲノムに戻ってマッピングすることができた。その後、両末端のゲノム座標を差し引くことによって分子サイズを推定することができた。このような対末端配列決定を行うための1つの方法は、Illumina Genome Analyerの対末端配列決定プロトコールを用いることである。DNA分子のサイズを推定するための別の方法は、全DNA分子を配列決定することである。これは、相対的に長い読み込み長さを有するプラットフォーム、例えば、Roche 454プラットフォーム(Marguelis et al Nature 2005;437:376−380)及びPacific Biosciences単一分子、リアルタイム(SMRT(商標))技術(Eid et al Science 2009;323:133−138)を配列決定することによって最も容易に行われる。核酸分子のサイズの検出後、特定のサイズのカットオフより小さい分子上の続く分析に焦点を合わせるように選択し、それにより胎児DNAの画分濃度において富化することができる。このサブセットの分子の分析は、この手法がなされなかった場合よりも、サイズ選択後に分析された少ない分子を用いて推定されるべき胎児ゲノムマップ又は胎児ゲノム配列を可能にする。一態様では、300bpのサイズカットオフを用いる。さらに他の態様では、250bp、200bp、180bp、150bp、25bp、100bp、又は75bpのサイズカットオフを用いることができた。
【0046】
B.スキャホールドとしての親のゲノムの使用
第2の挑戦に対処するために、いくつかの態様は「スキャホールド」として母親の染色体のハプロタイプを用いることができる。また、父親の染色体のハプロタイプは別の「スキャホールド」として用いることができる。このスキャホールドは、胎児DNAを含む母親試料から得られた胎児の遺伝子情報と比較することができる。この胎児ゲノム情報は、父親及び/又は母親のスキャホールドがどのようにして胎児ゲノムに構築されたかを決定するために使用して、それにより、そのスキャホールドのコンパートメント部分を用いて、得られた胎児ゲノムを決定することができる。
【0047】
親のハプロタイプは、父親と母親由来、ファミリーの他のメンバー、例えば、現在妊娠している姉妹由来のゲノムDNAから構築することができる。親のハプロタイプの利用可能性は、ゲノム配列決定の費用の削減を考慮して、益々通常になり得る。1つのシナリオでは、片親又は両親が、すでにそれらの配列決定されたゲノムを有し、1以上の染色体領域上のそれらのハプロタイプが決定されている場合、この情報は上述したスキャホールドとして用いることができる。
【0048】
ゲノムにおける配列改変体を調べることができる、当業者に知られている任意のゲノタイピングプラットフォームを用いることができ、例えば、DNA配列決定、マイクロアレイ、ハイブリダイゼーションプローブ、蛍光に基づく技術、光学技術、分子バーコード及び単一分子画像化(Geiss GK et al.Nat Biotechnol 2008;26:317−325)、単一分子分析、PCR、質量分析(例えば、Sequenom MassARRAYなどが挙げられる。より極端な例として、父親と母親のDNA配列は、大規模な並列配列決定法(例えば、Bentley DR et al.Nature 2008;456:53−59;McKernan KJ et al.Genome Res 2009;19:1527−1541)を用いて、全ゲノムDNA配列決定によって決定することができる。対象とし得る配列改変体の例は、単一ヌクレオチド多型(SNP)である。親の遺伝子型を決定する特に好ましい方法は、ゲノム全般規模でSNPのマイクロアレイ分析によるものであり、又は選択されたゲノム領域では、例えば、突然変異が遺伝子疾患を引き起こす可能性がある遺伝子(例えば、ベータ−グロビンクラスターにおける遺伝子、又は嚢胞性線維性膜貫通調節因子(CFTR)遺伝子)を含むものである。配列改変体とは異なって、コピー数改変体も用いることができる。配列改変体及びコピー数改変体はともに多型遺伝的特徴(PMF)と呼ばれる。
【0049】
一局面では、対象とする染色体又は染色体領域上の母親の遺伝子型をハプロタイプに構築することができる。これが行われ得る1つの方法は、母親に関連した他のファミリーメンバー、例えば、母親の息子又は娘、親、姉妹などの分析によるものである。ハプロタイプが構築され得る別の方法は、上記した当業者に周知である他の母親を介するものである。
【0050】
次に、遺伝子型情報は、他のファミリーメンバー、例えば、現在妊娠の胎児の姉妹、又は祖父母の遺伝子型などからの遺伝子型情報と比較することによって、親のハプロタイプ情報に拡張することができる。また、親のハプロタイプは、当業者に周知の他の方法によって構築することができる。このような方法の例には、単一の分子分析に基づく方法、例えば、デジタルPCR(Ding C and Cantor CR.Proc Natl Acad Sci USA 2003;100:7449−7453;Ruano G et al.Proc Natl Acad Sci USA 1990;87:6296−6300)、精子ハプロタイピイング(Lien S et al.Curr Protoc Hum Genet 2002;Chapter 1:Unit 1.6)、及び画像技術(Xiao M et al.Hum Mutat 2007;28:913−921)が挙げられる。他の方法には、対立遺伝子特異的なPCR(Michalatos−Beloin S et al.Nucleic Acids Res 1996;24:4841−4843;Lo YMD et al.Nucleic Acids Res 1991;Nucleic Acids Res 19:3561−3567)、制限酵素消化(Smirnova AS et al.Immunogenetics 2007;59:93−8)に基づくものなどが挙げられる。なお他の方法は、母親のハプロタイプが統計的評価から推定されることを可能にする集団におけるハプロタイプブロックの分布及び連鎖不均衡構造の基づく(Clark AG.Mol Biol Evol 1990;7:111−22;10:13−9;Salem RM et al.Hum Genomics 2005;2:39−66)。
【0051】
C.スキャホールドを組み立てるための母親試料のゲノム情報の使用
一態様では、母親の染色体のうちのいずれが胎児に移動したかを解決すために、相対的なハプロタイプ用量(RHDO)法を用いる。このアプローチの一般的な原理は、母親が遺伝的多型の各々についてヘテロ接合である例に関して以下の通りである。このようにして、2つのハプロタイプが存在し、これらのハプロタイプの相対的な用量は1:1であった。しかしながら、母親の試料において、小比率の胎児DNAの存在は、相対的ハプロタイプ用量を変更する可能性があった。これは、胎児が、そのハプロタイプ補完物の半分を母親から遺伝され、他の半分を父親から遺伝したためである。さらに、各々の染色体について、胎児は、減数分裂性組み換えの出現に依存して、各親から1つのホモ接合染色体と他のホモ接合染色体に由来したハプロタイプの「パッチワーク」を遺伝した。これらの因子の全ては、母親の構成的DNAにおいて1:1の比率から相対的ハプロタイプ用量を逸脱させる可能性があった。したがって、所定の染色体又は染色体領域について、これらのハプロタイプの構成的対立遺伝子は、母親使用から生じた分析データ(例えば、配列決定データ)から探求され得る。
【0052】
次に、統計的手法は、相対的ハプロタイプ用量、又はこれらのハプロタイプが他のハプロタイプに対して過剰表現されているかどうかを決定するために実施され得る。この統計的手法についての分類閾値は、画分胎児DNA濃度に依存して調整することができる。一般に、より高い画分胎児DNA濃度は、より少ない分子を用いて閾値が到達されるのを可能にする。また、分類閾値は、対象とするゲノム又はゲノム領域全体で達成することを希望する分類に成功した画分の数に依存して調整され得る。一態様では、逐次確率比検定を用いることができる。
【0053】
一態様では、相対的突然変異用量(RMD)は、米国特許出願第2009/0087847号に記載されるように、母親の特定の多型での対立遺伝子の相対量を決定するために用いることができる。これらの相対量は、(例えば、多型が連続的又は連結された遺伝子座である場合)胎児のハプロタイプの決定に使用可能である。一実施において、この標的化されたアプローチは、RMD分析についてゲノムの選択された部分からの特定の配列を増幅するためのポリメラーゼ連鎖反応(PCR)の使用である。大きなゲノム領域又は全ゲノム全体で胎児遺伝を決定するためのこのRMDアプローチを広げるために、多量の母親試料を必要とする。
【0054】
ランダム配列決定を用いた態様では、対象とするゲノム領域は特異的に標的化される。したがって、対象とするゲノム領域において得られた配列の数は、(非常な深度の配列決定が行われない場合)標的化されたアプローチにおける場合と同程度に無数でない可能性がある。しかしながら、カウントは、診断目的で必要な統計的検出力を達成するために、多数の連結された多型全体でプールすることができる。この配列決定の態様を用いるという実際の意義は、過剰な深度配列決定の必要性を避けることによって費用を抑えることができるということである。また、デジタルPCRに基づくアプローチよりも少ない量の母親試料をインプットする必要がある。
【0055】
さらに、一括してこのようなRHDO分析を行うことが望まれ得る。換言すると、各染色体は1つのブロックにおいて、又は好ましくは1を超えるブロックにおいて分析することができる。一局面では、後者は、減数分裂性組み換えが観察されるようになり得る。例えば、胎児の特定の染色体のセグメントのハプロタイプは、母親の層同染色体の1つに由来していた可能性があり、一方、同じ胎児染色体の別のセグメントは、他の母親の相同性由来のハプロタイプを持つようである。SPRT分析は、このセグメントを実施されるようにし得る。
【0056】
例えば、SPRT分析は、染色体の一末端から開始して、必要とされる親の遺伝子型形状(すなわち、父親はホモ接合であり、母親はヘテロ接合である)を示す隣接するSNP上で行うことができる。これは、SPRT分析が、母親のハプロタイプの1つが母親の血漿分析データ(例えば、配列決定データ)において優位であることを示すまで継続される。次に、SPRT分析は、「リセット」され、必要とされる親の遺伝子型形状を示す次の隣接するSNPから新たに開始され得る。これは、母親のハプロタイプの1つが母親の血漿分析データ(例えば、配列決定データ)において、母親のハプロタイプの1つが優位であることをSPRT分析が再度指示するまで再び継続することができる。このプロセスは、その最後が該染色体上でSNPを選択するまで継続することができる。染色体上のこれらの種々のSPRT決定されたハプロタイプセグメントは、母親のゲノムにおける2つの相同な染色体のハプロタイプと比較することができる。減数分裂性組み換えは、胎児におけるハプロタイプセグメントが1つの母親の相同染色体から別のものにスイッチされているように見える場合に観察される。このシステムはまた、染色体あたり1を超える減数分裂性組み換えが存在するとしても作用可能である。
【0057】
後述するように、RHDO分析はまた、父親及び母親がともに構成遺伝的多型に対してヘテロ接合であるゲノム領域について実施することができる。このシナリオは、特に、父親と母親が同じ先祖起源由来の疾患遺伝子の突然変異コピーを共有する場合、例えば、彼らが血族である場合、又は疾患について優性突然変異が大きな創始者効果に起因する(すなわち、大部分の個体が、集団の共通の先祖の創始者由来の同じハプロタイプを遺伝した)場合の状況に特に有用である。このようにして、この領域における父親及び母親のハプロタイプを用いて胎児ハプロタイプを推定することができる。
【0058】
II.母親ゲノム由来の胎児ゲノムの構築
親のゲノムの明確な知識を用いた胎児遺伝子マップの構築又は胎児ゲノム配列の解明をここに記載する。
【0059】
A.方法
図1は、妊娠女性の出生前胎児のゲノムの少なくとも一部を決定するための方法100のフローチャートである。胎児は父親と妊娠女性である母親を有する。父親は2つのハプロタイプを有する父親ゲノムを有し、母親は2つのハプロタイプを有する母親ゲノムを有する。方法100は、胎児のゲノムを決定するために、妊娠女性から得られた生物試料から核酸分子(断片)を分析する。方法100は、主に、父親がホモ接合であり、母親が複数の遺伝子座でヘテロ接合である場合の例について記載し、一方、他の例は、他の態様を記載する。
【0060】
方法100及び本明細書に記載されているいずれかの方法は、全体として又は部分的に、工程を実行するために構築され得る、プロセッサーを含むコンピュータシステムを用いて実行されてもよい。したがって、態様は、潜在的に、各工程又はステップの各グループを実行する異なるコンパートメントを用いて、本明細書に記載されている方法のいずれかの工程を実行するために構築されたコンピュータシステムに指向される。番号付けされた工程として示されるが、本明細書の方法の工程は、同時又は異なる純分で実行することができる。さらに、これらの工程の一部は、他の方法からの他の抗体の一部とともに用いられてもよい。また、工程の全て又は一部は任意であってもよい。さらに、本方法のいずれかの工程のいずれかは、これらの工程を実行するためのモジュール、回路、又は他の手段を用いて実行することができる。
【0061】
工程110では、母親ゲノムがヘテロ接合である第1の複数の遺伝子座が同定される。一態様では、この決定は、ゲノム全般レベルで又は対象とする選択されたゲノムの遺伝子座で、父親と母親のゲノタイピングの部分で実行され得る。他の態様では、第1の複数の遺伝子座の決定は、母親試料の分析中に実施され得て、これは、後のセクションに記載されている。
【0062】
工程120では、第1の複数の遺伝子座を覆う2つの母親のハプロタイプの各々が決定される。上記したように、母親ゲノムは直接的な配列決定から得ることができた。他の態様では、ゲノタイピングは複数の遺伝子座で行い、次に、例えば、同じであるか又は類似の集団において共通するファミリーメンバー又は参照ゲノムから、類似のゲノムを有することが期待される者のマッピングされたゲノムを用いることができる。一態様では、工程120は、母親ゲノムの全て又は一部について最初に決定することができ、母親ゲノムは、母親がヘテロ接合である遺伝子座を見出すために調査され得る。
【0063】
一局面では、父親の染色体のハプロタイプを構築することは本質的ではない。しかしながら、父親のハプロタイプが構築されると、追加の情報は配列決定結果から得ることができた。1つのこのような追加情報は、相対的なハプロタイプ用量分析が、両親がヘテロ接合である領域について実行され得る事実を含む。父親のハプロタイプが利用可能である場合に得ることができる別の追加情報は、1以上の父親の染色体と関わる減数分裂性組み換えに関する情報であり、疾患がこのような多型に連結された疾患対立遺伝子が胎児に移動したかどうかを決定する。
【0064】
工程130では、第1の複数の遺伝子座の各々での父親から胎児に遺伝された対立遺伝子が決定される。いくつかの態様では、父親に対してはホモ接合であるが、母親に対してはヘテロ接合であるゲノム遺伝子座を用いる(工程110において言及されている)。したがって、父親は遺伝子座でホモ接合であるある場合、父親から遺伝される対立遺伝子が知られている。父親がホモ接合である遺伝子座を決定するための父親のゲノタイピングは、本明細書に記載されている方法のいずれかにおいて決定することができる。一態様では、第1の複数の遺伝子座の決定は、父親がホモ接合であり、母親がヘテロ接合である遺伝子座を見出すために、父親と母親のゲノタイピングに基づいて決定することができる。
【0065】
別の態様では、ヘテロ接合である親のゲノムの第2の複数の遺伝子座を用いて、父親がホモ接合である第1の複数の遺伝子座で胎児によって遺伝された親のハプロタイプを決定することができる。例えば、母親のゲノムが第2の複数の遺伝子座でホモ接合である場合、第2の複数の遺伝子座のそれぞれでの父親ゲノムに存在し、母親ゲノムに存在しない対立遺伝子を同定することができる。次に、遺伝された父親のハプロタイプは、同定された対立遺伝子を有するハプロタイプとして同定し、これを用いて、第1の複数の遺伝子座で父親から遺伝された対立遺伝子を決定することができる。父親のハプロタイプを決定するとうこれらの局面は、以下により詳細に検討している。
【0066】
工程140では、妊娠女性から得られた生物試料からの複数の核酸分子を分析した。試料は、母親と胎児の核酸の混合物を含む。母親の生物試料を採取し、次に、分析のために受け入れることができる。一態様では、母親の血漿及び血清を用いる。他の態様では、母親の血液、母親の尿、母親の唾液、子宮内洗浄液、又は母親の血液から得られる胎児細胞を用いることができる。
【0067】
一態様では、核酸分子を分析することには、ヒトゲノムにおける核酸分子の局在を同定すること、及び個々の遺伝子座での核酸分子の対立遺伝子を決定することが含まれる。このようにして、一態様は、同一遺伝子座由来の核酸分子の決定された対立遺伝子を用いて、定量的ゲノタイピングを行うことができる。母親の生物試料における核酸分子のゲノム局在及び対立遺伝子(ゲノタイプに関する情報)の決定を可能にする任意の方法を用いることができる。このような方法のいくつかは、米国特許出願第12/178,181号及び第12/614350号、「Size−Based Genomic Analysis」と題する出願に記載されている。
【0068】
工程150では、核酸分子の決定された対立遺伝子に基づいて、第1の複数の遺伝子座の各々での各対立遺伝子の量が決定される。一態様では、この量は、第1の遺伝子座での各タイプの対立遺伝子の数であり得る。例えば、6個のAと4個のTである。別の態様では、量は、特定の対立遺伝子を有する核酸分子のサイズ分布であり得る。例えば、相対量はまた、ある種の長さの相対量の断片を運搬することができる、特定のゲノタイプを有する断片のサイズ分布を含むことができる。また、このような相対量は、胎児断片が母親断片よりも短い傾向にあるため、どのゲノムが胎児ゲノムにあるかについての情報を提供することができる。量及び方法のいくつかの例は、米国特許出願第12/178,181号及び第12/614350号、「Size−Based Genomic Analysis」と題する出願に記載されている。
【0069】
一態様では、遺伝子座での対立遺伝子の相対量は、(例えば、データセットが十分な統計的検出力に到達した後に)どのゲノタイプが胎児によって遺伝されたかについての情報を提供することができる。例えば、相対量は、遺伝子座での母親のゲノタイプと比較して、配列不均衡が起こるかどうかを決定するために用いることができる。上記で引用された関連特許出願は、特定の遺伝子座又は領域での配列不均衡を検出するための態様の例を提供する。
【0070】
工程160では、第1の複数の遺伝子座の1を超える遺伝子座での核酸分子の各対立遺伝子の相対量を比較する。いくつかの態様では、ハプロタイプを含む第1の複数の遺伝子座の各遺伝子座での各対立遺伝子の量は、比較をする前に統合される。親のハプロタイプの統合された量は、ハプロタイプが過剰に表され、等しく表され、又は過少に表されるかどうかを決定するために比較することができる。他の態様では、遺伝子座での対立遺伝子についての量が比較され、複数の遺伝子座での比較が用いられる。例えば、分離値(例えば、相違又は比率)が統合され、それは、カットオフ値との比較において用いることができる。これらの態様の各々は、本明細書に記載されている比較工程のいずれかに適用可能である。
【0071】
種々の態様では、相対量は、特定の遺伝子座での特定の対立遺伝子を有する多数の各断片のカウント、特定のハプロタイプ上の任意の遺伝子座(又は領域内の任意の遺伝子座)からの多数の断片のカウント、及び特定の遺伝子座又は特定のハプロタイプ上のカウント(例えば、平均)の統計値であり得る。このようにして、一態様では、比較は、各遺伝子座での1つの対立遺伝子 対 別の対立遺伝子の分離値(例えば、相違又は比率)の決定であってもよい。
【0072】
工程170では、第1の複数の遺伝子座によってカバーされたゲノムの一部で母親から出生前の胎児によって遺伝されたハプロタイプを決定することができる。一態様では、母親の染色体のいずれが胎児に移動されたかを解決するために、相対的はハプロタイプ用量(RHDO)法が、上記されるように用いられる。母親が第1の遺伝子座の各々についてヘテロ接合であるため、第1の遺伝子座は、第1の遺伝子座のゲノム領域について2つのハプロタイプに対応する。これらのハプロタイプの相対的用量は、試料がちょうど母親から由来する場合に1:1となったであろう。この比からの逸脱又は逸脱ではないことは、母親(及びよう詳細には後述される父親)から遺伝される胎児のハプロタイプを決定するために用いることができる。したがって、所定の染色体又は染色体領域について、これらのハプロタイプの構成対立遺伝子は、工程130において生じさせた分析データ(例えば、配列決定データ)から探索することができる。
【0073】
複数の遺伝子座が分析され、母親のハプロタイプと比較されるため、遺伝子座間の配列は特定のハプロタイプに起因し得る。一態様では、いくつかの遺伝子座は特定のハプロタイプと合致する場合、遺伝子座間の配列セグメントは母親のハプロタイプのものと同じであると推測することができる。減数分裂性組み換えの出現のため、胎児に遺伝された最終のハプロタイプは、染色体のこれらの2つのホモログの1つを起源とする「ハプロタイプセグメント」のパッチワークからなることができる。態様はこのような組換えを検出することができる。
【0074】
このような組換えを検出することができる解像度は、父親と母親の構成DNAにおいて決定した遺伝子マーカーの数と分布、及び(例えば、SPRTを用いた)続くバイオインフォマティックス分析において使用する閾値に依存する。例えば、この比較は、第1セットの連続した遺伝子座の各々での母親から遺伝された対立遺伝子は第1のハプロタイプに対応し、次に、第1のハプロタイプは、第1セットの遺伝子座に対応するゲノム局在について遺伝されることを決定する。第2セットの連続遺伝子座が、第2のハプロタイプが遺伝されることを示唆した場合、第2のハプロタイプは、第2セットの遺伝子座に対応するゲノム局在について遺伝されることが決定される。
【0075】
一態様では、複数の遺伝子座が分析されるため、ハプロタイプはより高い精度で決定され得る。例えば、1つの遺伝子座についての統計データは決定的でない場合があるが、他の遺伝子座の統計データと組み合わせた場合、ハプロタイプが遺伝されるという決定がなされ得る。別の態様では、各遺伝子座は、独立して分析され、分類することができ、次に、この分類は分析され、ハプロタイプが所定の領域について遺伝される決定を提供することができる。
【0076】
一態様では、統計的手法は、(例えば、これらのハプロタイプの1つが他のハプロタイプと比較して過剰に表される場合)相対的はハプロタイプ用量を決定するために実施することができる。この統計的手法についての分類閾値は、画分胎児DNA濃度に依存して調整され得る。一般に、より高い画分胎児DNA濃度は、この閾値がより少ない分子を用いて到達されることを可能にする。分類閾値はまた、対象とするゲノム又はゲノム領域全体で達成することを希望する成功の分類したセグメントの数に依存して調整可能である。
【0077】
図1に戻って参照すると、工程180では、胎児ゲノムは突然変異について分析され得る。例えば、態様は、特定の集団における遺伝疾患を引き起こす突然変異のパネルについて検索するために用いることができる。態様を用いて検出され得る突然変異の例は、Online Mendelian Inheritance in Man(www.ncbi.nlm.nih.gov/omim/getmorbid.cgi)から見出すことができる。これらの突然変異は、工程140〜160中に;又は本明細書に記載されている分離工程として探索可能である。例えば、父親が、母親には存在しない1以上の突然変異のキャリアーであるファミリーにおいて、突然変異(単数又は複数)は、母親の生物試料からの分析データ(配列決定データ)から探索され得た。
【0078】
実際の突然変異を検出することは別にして、父親又は母親における突然変異又は野生型対立遺伝子に連結される多型遺伝子マーカーを探すこともできた。例えば、RHDO分析は、胎児が、疾患について突然変異を担持することが知られている母親からのハプロタイプを遺伝したことを示すことがある。また、本発明の態様は、染色体領域の検出によって引き起こされる疾患、例えば、アルファ−サラセミアを引き起こす東南アジア欠失の非浸襲性の出生前診断に用いることができる。父親と母親がともに欠失のキャリアーであるシナリオでは、胎児が欠失についてホモ接合である場合、及び大規模な並列配列決定が母親の血漿DNA上で実施される場合、母親血漿における欠失領域を起源とするDNA配列の頻度の減少が存在するはずであった。
【0079】
B.実施例
このセクションは、母親がヘテロ接合である単一ヌクレオチド多型(SNP)に適用される態様(例えば、方法100)の例を記載する。同一染色体上のSNP対立遺伝子はハプロタイプを形成し、母親は各染色体の相同な対、すなわち、2つのハプロタイプを有する。このような決定がどのように行われるかを例証するために、例えば、
図2に示されるように、第3染色体上のセグメントを考慮する。
【0080】
図2は、各ゲノムコードの特定のセグメントに対して、父親についての2つのハプロタイプと、母親についての2つのハプロタイプを示す。5つのSNPは、これらのSNPの5つ全部について、父親と母親がそれぞれホモ接合とヘテロ接合であるこのセグメント内に見出された。父親の2つの相同な染色体は、同一のハプロタイプ(Hap)、すなわち、A−G−A−A−G(
図2における上部から下部まで)を有した。簡易化のため、父親のハプロタイプをHapI及びHapIIと呼び、これらの両方はこのセットの5個のSNPについて同一であることを念頭におかれたい。母親について、2つのハプロタイプが観察され、すなわち、HapIII、A−A−A−G−G及びHapIV、G−G−G−A−Aである。
【0081】
この実施例におけるSNPは、さらに2つのタイプに分類することができた。
図3は、本発明の態様に従う2つのタイプのSNPを示す。タイプAは、父親の対立遺伝子が母親のハプロタイプIII上のものと同じであるそれらのSNPからなる。タイプBは、父親の対立遺伝子が母親のハプロタイプIVのものと同じであるそれらのSNPからなす。
【0082】
これらの2つのタイプのSNPは、僅かに異なる数学的処理を必要とし得る。したがって、タイプAにおいて、ハプロタイプIIIの胎児遺伝は、母親血漿中のハプロタイプIVと比較して、ハプロタイプIIIの過剰表現をもたらす(
図4A)。例えば、検討の簡易化のためにちょうど1つのSNP410を調べると、対立遺伝子Aは父親から遺伝され、HapIIIga母親から遺伝される場合、胎児は試料に対して2つのA対立遺伝子を寄与し、Aの過剰表現を引き起こす。胎児がハプロタイプIVを遺伝した場合、胎児はまた遺伝子座にA及びGを有したヘテロ接合であるため、過剰な表現は観察されなかったであろう。
【0083】
他方では、タイプBのシナリオでは、ハプロタイプIIIの胎児遺伝は、母親の血漿におけるハプロタイプIIIとハプロタイプIVの等しい表現をもたらしたであろう(
図4B)。例えば、SNP420に対して見ると、父親からG、及びHapIIIの部分としてAの遺伝は、ちょうど母親のように、SNP420でAとGの等量を寄与するように胎児を引き起こしたであろう。父親はハプロタイプIVを遺伝した場合、過剰表現は、上記での検討から明かのように観察されたであろう。
【0084】
図5A及び5Bは、各遺伝子座について断片の相対量(例えば、カウント)を比較する分析を示し、この比較の結果が、遺伝された特定のハプロタイプを分類することであるかどうかを示す。父親と母親のこれらの遺伝子型の構造(例えば、タイプA又はタイプBシナリオ)の1つとフィットするSNPが存在する任意のゲノム局在は、この実施例に用いることができる。母親血漿の配列決定データから、SNPの特定の対立遺伝子に対応する配列決定された分子の数に焦点を合わせることができる。SPRT分析(又は他の比較法)は、これらの対立遺伝子間に任意の対立遺伝子不均衡が存在するかどうかを決定するために用いることができる(Lo Y D et al Proc Natl Acad Sci USA 2007;104:13116−13121)。
【0085】
図5Aは、タイプAのSNPについての分析を示す。示されるように、各SNPについて、カットオフあたいに対する相対量(例えば、分離値によって定義される)のSPRT比較は分類を与える。一態様では、SPRTについての分類閾値が到達すると、特定の母親のハプロタイプの胎児遺伝が結論付けられた。次に、SPRTについてのカウントをリセットすることができる。続いて、テロメアからセントロメア方向又はその反対のいずれかで、必要とされる遺伝子型構造をフィットする隣接のSNPフィッティングに移動することができる;新しいSPRT分析はこの次のSNPを用いて開始することができる。
【0086】
他方、一態様では、SPRTの分類はSNPを用いて到達されなかった場合、本発明者らは、次のSNPのカウントが前のものに加えることができ、SPRTが再度行われ得ることを除いて、同じように隣接するSNPに移動することができる。このプロセスは、分類閾値が到達されるまで続けることができる。
図5A及び
図5Bは、タイプA及びタイプB分析のためのこのプロセルの操作を示す。一態様では、分類は、領域についての全分類を行うために一緒に分析される。例えば、SNPの第1のグループ、及びSNPの次のグループについて分類が得られた場合、2つの分類は、分類が一致するかどうかを見るために比較することができる。
【0087】
図6は、SPRT分類のための尤度比を変更する効果を示す(Zhou W et al.Nat Biotechnol 2001 ;19:78−81;Karoui NE et al.Statist Med 2006;25:3124−33)。一般に、分類のための低い尤度比(例えば、8)は、分類をより容易に行うようにさせる。これは、ゲノム内の大多数の分類された領域をもたらすことができる。しかしながら、多数のこのような領域は誤って分類されることが予測され得る。他方、より高い尤度比(例えば、1200)は、より多くのSNPがスコアされた場合にだけ分類を可能にする。これは、ゲノム内のより少数の分類された領域をもたらすことができる。誤った分類された領域の数及び比率は、より低い分類閾値を用いた場合の状況と比較して、より低いことが期待できる。
【0088】
一態様では、分類は、2つの連続したSPRT分類が同一のハプロタイプをもたらす場合にだけなされる(「2つの連続したブロック」アルゴリズムと呼ばれる)。一局面では、「2つの連続したブロック」アルゴリズムは、分類の精度を増加させることができる。いくつかの態様では、配列のいずれのストレッチについて、態様は、タイプAのSNPについてSPRT分析を最初に行い、次にタイプBのSNPについて別のSPRT分析を行うことができる。一態様では、タイプAとタイプBのSNPは、遺伝子ランドマークの2つの飛び越し群(例えば、SNP)を形成するための配列のストレッチについてのシナリオを考慮することができる。「2つの連続したブロック」アルゴリズムを用いた態様では、2つのブロックは異なるタイプのものであってもよい。
【0089】
タイプAとタイプB分析からのSPRT結果は、それらの分類結果における一致又は不一致について調べることをできるようにする。分類精度を増大させるために、一態様(「飛び越しアプローチ」)は、所定のゲノム領域についてのタイプAとタイプB分析の両方が一貫した結果をもたらすことができる場合に、分類を行うことができただけであった。2つの分析が不一致な結果を生じさせる場合、領域の次の分類の2つの接触領域(1つはセントロメア末端、他方はテロメア末端にある1つ)の分類結果を見ることができる。これらの2つの接触領域は一致した結果をもたらす場合、これらの2つの領域を有する接触したハプロタイプとして最初の領域を分類することができる。これらの2つの接触領域が一致した結果をもたらさない場合、一致が観察されるまで、次の2つの接触領域に移動することができる。このテーマの1つの変形は、ちょうど1つの方向に移動させ、関心のある元の領域の結果として、次の1つ、又は2つ、又はそれを超える接触領域の分類結果を採用することである。一般的な原理は、特定領域の分類結果を確実にするための隣接ゲノム領域の分類結果を用いることである。
【0090】
III.胎児によって遺伝された親の対立遺伝子の決定
図7は、父親から遺伝された、妊娠女性の出生前胎児のゲノムの少なくとも一部を決定するための方法700のフローチャートである。方法700は、胎児のゲノムを決定するために、妊娠女性から得られた生物試料由来の核酸分子(断片)を分析する。試料は母親と胎児の核酸の混合物を含む。
【0091】
工程710では、生物試料由来の複数の核酸分子の各々は、ヒトゲノムにおいて核酸分子の局在を同定し、核酸分子の対立遺伝子タイプを決定するために分析される。したがって、特定の局在(遺伝子座)での核酸分子の遺伝子型は一態様において決定することができる。上記又は他に記載される方法のいずれかはこの分析に使用されてもよい。
【0092】
工程720では、父親のゲノムがヘテロ接合であり、母親のゲノムがホモ接合である最初の複数の遺伝子座を決定する。一態様、最初の複数の遺伝子座は、父親と母親のゲノムを決定することによって得られる。ゲノムは、ヘテロ接合であり、母親がホモ接合であるゲノム遺伝子座について発掘されてもよい。
【0093】
工程730では、最初の複数の遺伝子座によってカバーされたゲノムの一部で父親から出生前胎児に遺伝されるハプロタイプは、最初の複数の遺伝子座で決定された遺伝子型に基づいて決定される。一態様では、父親によって所有されるが、母親のゲノムには存在しないこれらの遺伝子座の対立遺伝子は、分析データ(例えば、配列決定データ)において探索される。これらの対立遺伝子の組み合わせは、胎児が父親から遺伝された染色体のハプロタイプを示したであろう。
【0094】
別の提要では、父親ゲノムにおける、対象とする各々の染色体又は染色体領域のハプロタイプが知られると、減数分裂性組み換えが父親における精子形成中に発生した場所も決定することができる。したがって、父親の減数分裂性組み換えは、父親から遺伝された染色体におけるDNAのストレッチのハプロタイプが胎児と父親との間で異なるときに観察される。このような組換え情報の包含は、分析データ(例えば、配列決定データ)が、遺伝子多型に対する連鎖分析による遺伝子疾患の出生前診断に用いられる場合に有用となり得る。
【0095】
IV.父親と母親はゲノム領域に対してヘテロ接合である
態様は、父親と母親がゲノム領域に対してヘテロ接合であるシナリオを対処する。このシナリオは、父親と母親が血族であるファミリーに特に関係し得る。疾患が大きな創始者効果に起因している優性変異と関連付けられるときもまた関連し得る。このような状況において、出生前胎児の父親と母親がともに突然変異遺伝子のキャリアーである場合、遺伝子の突然変異コピーを担持する染色体のハプロタイプは、減数分裂性組み換え事象の出現を除いて、本質的には同定し得ることが期待されるべきである。この種の分析は、嚢胞性線維症、ベータ−サラセミア、鎌状赤血球貧血、及びヘモグロビンE疾患などの常染色体劣性疾患に特に有用であり得る。
【0096】
図8は、本発明の態様に従って、母親と父親がヘテロ接合である領域において、出生前胎児のゲノムの少なくとも一部を決定するための方法800のフローチャートである。
【0097】
工程810では、父親と母親がともにヘテロ接合である第1の複数の遺伝子座が決定される。一態様では、第1の遺伝子座は、本明細書に言及されている方法のいずれかによって決定することができる。例えば、親のゲノムの全て又はその領域は配列決定することができ、あるいは異なる部分をゲノタイプして最初の遺伝子座を見出すことができる。このようにして、最初の複数の遺伝子座での父親の2つのハプロタイプの各々、及び母親の2つのハプロタイプを知ることができる。
【0098】
一例として、
図9は、特定のゲノム領域においてともにヘテロ接合である父親と母親のハプロタイプを示す。示されるように、両親は領域1において突然変異遺伝子(対立遺伝子)を有する。具体的には、父親のHapIと母親のHapIIIは突然変異遺伝子を有する。また示されるように、父親と母親は各々、遺伝子の野生型を担持する染色体の他のコピーを有することができる具体的には、父親のHapIIと母親のHapIVは野生型遺伝子を有する。このようにして、この例は、胎児が突然変異遺伝子を遺伝したかどうかの決定において関連性を有する。野生型遺伝子を担持する父親と母親由来の染色体は、この遺伝子のごく近辺に同一のハプロタイプを有するが、この遺伝子からさらに離れて不一致のハプロタイプを有してもよい。この染色体が様々な先祖期限を有する可能性があるので、この染色体は、全染色体を通じて、父親と母親との間に同一のハプロタイプを有する可能性がないようであった。
【0099】
工程820では、父親がヘテロ接合であるが、母親がホモ接合である第2の複数の遺伝子座が決定される。示されるように、第1と第2の複数の遺伝子座は、同一の染色体上にある。領域2はこのような第2の遺伝子座を示す。領域2は、父親がこの領域における1以上のSNPについてヘテロ接合であり、母親がこの領域においてホモ接合であるように選択され得る。
【0100】
工程830では、妊娠女性の試料由来の断片は、ヒトゲノム及び遺伝子型において局在を同定するために分析することができる。局在は、断片(核酸分子)が1以上の第1の遺伝子座又は1以上の第2の遺伝子座を含むかどうかを決定するために用いることができる。次に、この情報は、父親から遺伝されたハプロタイプと母親から遺伝されたハプロタイプを決定するために用いることができる。
【0101】
工程840では、2つの父親のハプロタイプのどれが胎児によって遺伝されたかが、少なくとも1つの第2の遺伝子座で生物試料から複数の核酸分子の決定された遺伝子型を分析することによって決定される。例えば、父親のゲノムに固有に存在するが、母親のゲノムには存在しないSNP対立遺伝子、例えば、
図9において、
*によって記されたT対立遺伝子、及び
+によって記されたA対立遺伝子は、母親の生物試料の分析データ(例えば、工程710からえられる局在及び遺伝子型)から探索され得る。方法700について行われ得るように、
*によって記されたT対立遺伝子が母親血漿から検出される場合、それはハプロタイプII(HapII)が父親から胎児に遺伝されることを意味する。反対に、
+によって記されたA対立遺伝子が母親血漿から検出される場合、HapIは父親から胎児に遺伝されることを意味する。
【0102】
工程850では、1を超える第1の複数の遺伝子座で核酸分子の決定された遺伝子型の相対量を比較することである。一態様では、各遺伝子座の量が集められ、母親のハプロタイプの相対量が比較される。相対量は、どの遺伝子型が特定の遺伝子座での父親ゲノムにあるかについての情報を伝えることができるカウントされた数、サイズ分布、及び任意の他のパラメータを指すことができる。
【0103】
工程860では、胎児によって遺伝されたことが決定された父親のハプロタイプに基づいて、及び相対量の比較に基づいて、第1の複数の遺伝子座によってカバーされたゲノムの一部で母親から出生前胎児に遺伝されるハプロタイプを決定することである。したがって、母親の生物試料の分析データから領域1におけるSNPのRHDO分析(例えば、上記される)は、領域2において胎児によって遺伝された父親のハプロタイプを考慮して、2つの母親のハプロタイプのどれが胎児に遺伝されたかを決定するために実施され得る。一態様では、領域1と領域2が親から胎児に移動する場合には、これらの領域間に組換えはないことが想定される。
【0104】
例えば、領域2の分析を通じて、胎児が父親からHapIを遺伝したことを決定したときを考慮すべきである。次に、母親からのHapIII(領域1のHapIと同一である)の胎児遺伝は、母親血漿中のHapIVと比較して、HapIIIの過剰表現をもたらす。反対に、胎児が母親からHapIVを遺伝した場合、HapIIIとHapIVの等しい表現は母親血漿において観察される。
【0105】
別の例として、領域2の分析を通じて、胎児が、父親からHapIIを遺伝したことが決定されたシナリオを考慮されたい。次に、母親からのHapIV(領域1のHapIIと同一である)の胎児遺伝は、母親血漿中のHapIIIと比較して、HapIVの過剰表現をもたらす。反対に、胎児が母親からHapIIIを遺伝した場合、HapIIIとHapIVの等しい表現は母親血漿において観察される。
【0106】
前のセクションでは、本発明者らは、母親の血漿DNAの配列決定から得られたデータを用いて、胎児ゲノムと画分胎児DNA濃度、並びに廃寺の親の遺伝子型情報を推定した。以下のセクションでは、本発明者らは、母親及び父親の遺伝子型/ハプロタイプの以前の情報なしに、画分胎児DNA濃度及び胎児遺伝子型を推定するための態様を説明する。
【0107】
V.画分胎児DNA濃度の決定
いくつかの態様では、任意の工程は、画分胎児DNA濃度を決定することである。種々の局面では、この画分濃度は、分析量(例えば、必要とされる配列決定の量)を導き、又は所定量のデータ(ゲノム配列についての被覆率の深度)についての分析の精度を見積もることができるようにする。また、画分胎児DNA濃度の決定は、ハプロタイプ及び/又は遺伝子型のどの分類が遺伝されるかを決定するためのカットフの決定に有用となり得る。
【0108】
一態様では、画分胎児DNA濃度は、父親と母親についてホモ接合であるが、異なる対立遺伝子を有する遺伝子座に関しての分析データ(例えば、工程140と710において得られるものなど)を検索することによって決定することができる。例えば、2つの対立遺伝子、A及びGを有するSNPについて、父親は、AAであり得て、母親はGGであり得て、逆も場合も同じである。このような遺伝子座については、胎児は偏性的にヘテロ接合である。上記の例では、胎児遺伝子型はAGとなり、母親試料における対立遺伝子Aの比率は、画分胎児DNA濃度を決定するために使用され得る。別の態様では、統計的分析は、母親がホモ接合であり、胎児がヘテロ接合である遺伝子座を決定するために行われ得る。このようにして、母親ゲノム及び父親ゲノムについて予め情報は必要ない。
【0109】
分析データを検察するための代替として、画分胎児DNA濃度はまた、多型遺伝子マーカーのパネル上で、別のアプローチ、例えば、PCR分析の使用、デジタルPCRアッセイ、又は質量分析に基づくアッセイによって決定することができる(Lun FMF et al Clin Chem 2008;54:1664−1672)。別の代替は、胎児と母親との間の異なるDNAメチル化を提示する1以上のゲノム遺伝子座を用いることである(Poon LLM et al.Clin Chem 2002;48:35−41;Chan KCA et al.Clin Chem 2006;52:2211−2218;米国特許第6,927,028号)。さらに別の代替としては、例えば、同様の妊娠期間で、参照集団から決定される近似の画分胎児DNA濃度を用いることである。しかしながら、画分胎児DNA濃度は試料ごとに変化し得るので、この後者のアプローチは、濃度が試験される試料について特異的に測定されるかどうかよりも正確さが小さいことが期待され得る。
【0110】
A.偏性的ヘテロ接合についての画分濃度の決定
胎児が偏性的ヘテロ接合である態様では、以下のシリーズの計算を用いて(例えば、大規模並列配列決定を用いて)画分胎児DNA濃度を決定することができる。母親ゲノムにはない父親の対立遺伝子のカウントをpとする。他の対立遺伝子、すなわち、母親と父親のゲノムによって共有される対立遺伝子のカウントをqとする。画分胎児DNA濃度は、以下の式によって与えられる:
【0112】
一態様では、この計算は、親の遺伝子型形態(例えば、両親はホモ接合であるが、異なる対立遺伝子である)を満たす異なる多型遺伝子座又は多型遺伝子特徴全体で累積データについて実行され得る。
【0113】
B.情報を与えるSNPに基づく決定
また、胎児DNAの画分濃度は、母親がホモ接合であり、父親がヘテロ接合である任意の遺伝子座について決定することができ、それは、母親が1つの対立遺伝子についてホモ接合であり、父親が異なる対立遺伝子についてホモ接合であるときだけではない。両者の方法は遺伝子座が情報を与えるかどうかを提供する。用語「情報を与えるSNP」は、どの情報が望ましいかに依存して異なる状況において用いることができる。1つの状況では、情報は、その遺伝子座で母親ゲノムに存在しない特定の遺伝子座での父親ゲノムにおける対立遺伝子である。したがって、母親がホモ接合であり、胎児がヘテロ接合であるSNPのサブセットは、胎児DNA濃度を決定するという状況について「情報を与えるSNP」と呼ぶことができる。また、母親及び胎児がともにヘテロ接合であるが、少なくとも1つは異なる対立遺伝子である例は、情報を与えるSNPとして用いることができる。しかしながら、3対立遺伝子SNPは、ゲノムにおいて相対的に珍しい。
【0114】
図10は、本発明の態様に従って、母親試料における父親材料の画分濃度を決定するための方法1000を例証するフローチャートである。工程1010では、妊娠女性の試料由来の断片は、(その局在での遺伝子型決定をもたらすことができる)ヒトゲノム及び対立遺伝子型における局在を同定するために分析することができる。一態様では、断片は、妊娠女性から得られた生物試料由来の複数の核酸分子を配列決定することによって分析される。他の態様では、リアルタイムPcR又はデジタルPCRを用いることができる。
【0115】
工程1020では、1以上の第1の遺伝子座が情報を与えるものとして決定される。いくつかの態様では、母親のゲノムはホモ接合であるが、非母親対立遺伝子は情報を与える遺伝子座で試料において検出される。一態様では、胎児ゲノムは、各第1の遺伝子座でヘテロ接合であり、母親ゲノムは各第1の遺伝子座でホモ接合である。例えば、胎児ゲノムは、第1の遺伝子座で各第1及び第2の対立遺伝子(例えば、TA)を有することができ、母親ゲノムは第1の遺伝子座で各第2の対立遺伝子の2つ(例えば、AA)を有することができる。しかしながら、このような遺伝子座は、例えば、胎児が偏性的ヘテロ接合でない状況では、推測的に知られ得ない。
【0116】
情報を与える遺伝子座を決定するための一態様では、母親がホモ接合であるSNPが考慮される。母親がホモ接合であるSNPについて、胎児は、同じ対立遺伝子であるか又はヘテロ接合であるかのいずれかである。例えば、SNPがAとTについて多型であり、母親がAAの遺伝子型を有する場合、胎児の遺伝子型はAA又はTAである。この事例では、母親血漿試料におけるT対立遺伝子の存在は、胎児ゲノムがAAの代りにTAであることを指示するであろう。ある種の態様は、以下に記載されるように、必要なカットオフを計算することによって、T対立遺伝子の存在のどれくらいがTAの遺伝子型を示すかを対処することができる。
【0117】
工程1030では、少なくとも1つの第1の遺伝子座について、各第1の対立遺伝子のカウントの第1の数p、及び各第2の対立遺伝子のカウントの第2の数qを決定する。一態様では、母親の血漿中の胎児特異的対立遺伝子(T対立遺伝子)及び共通の対立遺伝子(A対立遺伝子)は、種々の方法、例えば、限定されないが、リアルタイムPCR、デジタルPCR、及び大規模並列配列決定によって決定することができる。
【0118】
工程1040では、画分濃度は、第1と第2の数に基づいて計算される。一態様では、遺伝子型AAと女性の胎児がTAである遺伝子型を有する妊娠女性において、画分胎児DNA濃度(f)は、式:f=2×p/(p+q)を用いて計算することができ、式中、pは、胎児特異的な対立遺伝子(対立遺伝子T)に関するカウントを表し、qは、母親と胎児に共通する対立遺伝子(対立遺伝子A)に関するカウントを表す。
【0119】
別の態様では、複数の情報を与えるSNPの使用によって、母親血漿中の胎児DNAの画分濃度は、増加した精度とともに見積もることができる。複数のSNPの対立遺伝子カウント(n個のSNPの合計)の使用について、胎児DNAの画分濃度(f)は式:
【0121】
を用いて計算され得て、式中、p
iは、情報を与えるSNP
iについての胎児特異的な胎児DNAに対するカウントを表し;q
iは、情報を与えるSNP
iについての母親と胎児に共通する対立遺伝子についてのカウントを表し;nは、情報を与えるSNPの総数を表す。複数のSNPの対立遺伝子カウントの使用は、画分胎児DNA濃度の見積りの精度を増加させることができる。
【0122】
C.両親の明確な遺伝子情報がない画分濃度
胎児と母親の遺伝子型に関するこれまで情報を必要としない母親血漿中の画分胎児DNA濃度を決定するための方法をここに記載する。一態様では、情報を与えるSNPの同定は、母親血漿中のこれらのSNP遺伝子座での異なる対立遺伝子のカウントからなされる。このようにして、方法1000は、以下に記載される態様に基づいて、情報を与えるSNPの決定とともに使用可能である。第1に、可能性の記載は、情報を与えるSNPを同定するために使用されるカットオフの計算の理解を助けるために提供される。
【0123】
一態様では、胎児特異的な対立遺伝子を決定するという可能性はポアソン分布に従う。胎児特異的な対立遺伝子を検出するための可能性(P)は、以下の式:P=1−exp(−f×N/2)を用いて計算可能であり、式中、fは母親血漿試料中の胎児DNAの画分濃度を表し、Nは分析される特定のSNP遺伝子座に例えば、対応する分子の総数を表し;exp()は指数関数を表す。一局面では、Pは期待された分布であると考えられ、これは、多くの試料全体で分離の量を測定に起因する分布ではないためである。他の態様では、他の分布を用いることができる。
【0124】
胎児DNAの画分濃度が5%(妊娠第1三半期について典型的な値)であり、このSNP遺伝子座に対応する100個の分子(母親+胎児)が(50個の2倍体ゲノムに含まれる量に等しい)が分析されると仮定すると、胎児特異的な対立遺伝子(T対立遺伝子)を検出する可能性は1−exp(−0.05×100/2)=0.92である。胎児特異的な対立遺伝子を検出する可能性は、画分胎児DNA濃度、及びSNP遺伝子座について分析される分子とともに増加するであろう。例えば、胎児DNA濃度が10%であり、100個の分子が分析されるとすると、胎児特異的な対立遺伝子を検出する可能性は0.99である。
【0125】
したがって、母親がホモ接合であるSNP遺伝子座で、母親血漿中の母親のものとは異なる対立遺伝子の存在は、SNPが、画分胎児DAN濃度の計算について「情報を与える」ものであることを指示し得る。任意の情報を与えるSNPが見当たらない可能性は、分析される分子数に依存し得る。換言すると、情報を与えるSNPを検出するための任意の所望の確かさについて、所望の精度を得るために分析されることが必要である分子数は、ポアソン確立関数に従って計算され得る。
【0126】
上記分析を用いて、いくつかの態様は、母親の遺伝子型がわからな場合に、遺伝子座が情報を与えるかどうかを決定することができる。いくつかの態様では、母親の血清試料において2つの異なる対立遺伝子が検出される遺伝子座が同定される。例えば、2つの可能な対立遺伝子AとTを有するSNP遺伝子座について、A対立遺伝子とT対立遺伝子はともに母親血漿において検出される。
【0127】
図11は、遺伝子座が本発明の態様に従って情報を与えるものであるかどうかを決定するための方法1100のフローチャートである。一態様では、方法1100は、方法1000の工程1020を実施するために用いることができる。別の態様では、方法1100の一工程は、統計的分布に基づいてカット値を決定することであり、別の工程は、遺伝子座(SNP)が情報を与えるかどうかを決定するためのカットオフ値を用いる。
【0128】
工程1110では、カットオフ値は、特定の遺伝子座で各第1の対立遺伝子の多数の予期されたカウントについて決定される。一実施において、カットオフ値は、母親ゲノムがホモ接合であり、胎児ゲノムがヘテロ接合であるかどうかを予期する。一態様では、カットオフ値は、特定の遺伝子座でのホモ接合性とヘテロ接合性の異なる組み合わせについてカウント数の統計的分布に基づいて決定される。例えば、対立遺伝子頻度分布は、ポアソン分布関数を用いて予期することができる。
【0129】
工程1220では、(例えば、工程1010からの)母親試料の核酸分子の分析に基づいて、第1の対立遺伝子と第2の対立遺伝子がその遺伝子座で検出される。例えば、1セットの断片は、分析される遺伝子座に対してマッピングすることができ、第1の対立遺伝子又は第2の対立遺伝子が検出された。第1の対立遺伝子は、工程1020からの各第1の対立遺伝子の1つに対応することができ、第2の対立遺伝子は、各第2の対立遺伝子の1つに対応することができる。一態様では、2つの異なる対立遺伝子が検出されない場合、遺伝子座が情報を与えるものではなきことが分かる。
【0130】
工程1130では、遺伝子座での各第1の対立遺伝子の多数の実際のカウントが、核酸分子の分析に基づいて決定される。例えば、複数の核酸分子の配列決定結果は、第1の対立遺伝子の遺伝子型を有する断片が遺伝子座に対してマッピングされる回数を決定するためにカウントされ得る。
【0131】
工程1140では、遺伝子座は、実際のカウントの数とカットオフ値との比較に基づいて、第1の遺伝子座として同定される。一局面では、カットオフ値は、3つの可能性:(a)母親がホモ接合であり(AA)、胎児がヘテロ接合である(AT);(b)母親がヘテロ接合であり(AT)、胎児がヘテロ接合である(AT);並びに(c)母親がヘテロ接合であり(AT)、胎児が(AA)又は(TT)についてホモ接合である、の間で区別するために用いることができる。例証のために、以下の例は、シナリオ(c)においてAAである胎児遺伝子型を想定する。しかしながら、計算は、胎児の遺伝子型がTTである場合に同じであろう。情報を与える遺伝子座は可能性(a)を有するであろう。
【0132】
一態様では、胎児は、実際のカウントの数がカットオフ値よりも小さい場合に、第1の遺伝子座の1つとして同定される。別の態様では、低い閾値は、誤ったマッピングが起こらなかったことを確証するために用いることもできる。
【0133】
カットオフを決定するための態様をここに記載する。生理学的に可能な画分胎児DNA濃度(この情報は以前の研究から利用可能である)、及びSNP遺伝子座に対応する分子の総数に基づいて、対立遺伝子カウントの分布が上記の3つの可能なシナリオについて予期され得る。予期される分布に基づいて、カットオフ値は、SNPが「情報を与える」(すなわち、シナリオ(a)」ものであるかどうかを決定するために、母親血漿中に観察された対立遺伝子カウントを解明するために決定され得る。
【0134】
胎児DNAの画分濃度は、典型的には、早期妊娠において5%〜20%の範囲であり、後期妊娠において10%〜35%の範囲である(Lun et al.,Micro fluidics digital PCR reveals a higher than expected fraction of fetal DNA in maternal plasma.Clin Chem 2008;54:1664−72)。このようにして、一態様では、胎児DNAの5%と20%の画分濃度についての対立遺伝子カウントの予期される分布が決定された。
【0135】
図12Aは、推定される画分胎児DNA濃度が20%である3つのシナリオの対立遺伝子T(シナリオ(a)と(c)では少ない量の対立遺伝子)についてのカウントの予期された分布を示す。
図12Bは、推定が5%胎児DNAである3つのシナリオの対立遺伝子T(シナリオ(a)と(c)では少ない量の対立遺伝子)についてのカウントの予期された分布を示す。両者の予期されたモデルでは、総数200個の分子がSNP遺伝子座について分析されることが推定された。
【0136】
カットオフとして少ない量の対立遺伝子(T対立遺伝子)の40カウントの存在を用いて、3つの可能性が統計学的に区別し得る。換言すると、母親血漿において検出された2つの対立遺伝子を有し、かつ総数200個の分子が分析された任意のSNP遺伝子座について、少数対立遺伝子(対立遺伝子の量が少ない)の対立遺伝子頻度が40未満である場合、SNP遺伝子座は「情報を与える」ものと見なし得る。5%と20%の画分胎児DNA濃度について、母親がヘテロ接合(シナリオ(b)と(c))であるSNP由来の「情報を与える」SNP(シナリオ(a))の差異は100%精度であろう。
【0137】
具体的には、検出される分子の総数は異なるSNPについて異なる場合がある。各SNP遺伝子座について、特定の予期される分布曲線は、SNP遺伝子座を覆う母親の血漿試料中に検出される分子の総数を考慮することによって構築することができる。換言すると、SNPが情報を与えるものか否かを決定するためのカウントカットオフは、SNPの中で変化し得て、SNP遺伝子座がカウントされた回数に依存する。
【0138】
以下の表は、配列決定された母親の血漿試料についての母親血漿中の3つのSNP遺伝子座の対立遺伝子カウントを示す。3つのSNPの各々について、2つの異なる対立遺伝子が母親の血漿試料において検出される。これらの3つのSNPに対応する母親血漿中に検出されるカウントの総数は異なる。
【0140】
20%の画分胎児DNA濃度についての少量の対立遺伝子のカウント、及びSNPに対応する分子の異なる総カウントについての予期された分布を
図13A、13B、及び14Bに示す。予期された分布は、想定された20%の胎児DNA濃度を用いて描かれ、これは、妊娠第1期における胎児DNA濃度の高い制限を示すためである。胎児DNA濃度が高くなると、母親が、ヘテロ接合である場合と比較して、母親が多数の対立遺伝子についてホモ接合である少数の対立遺伝子の分布曲線間で、多くの重複が期待されるようになる。したがって、情報を与えるSNPの予期に対して高い胎児DNAを用いて、少数の対立遺伝子カウントについてのカットオフを誘導することはより特異的である。
【0141】
図13Aは、総数が173個の分子、及び20%の画分胎児DNA濃度を有する少量の対立遺伝子のカウントについての予期された分布を示す。一態様では、この分布に基づいて、少量の対立遺伝子のカウントについての40未満のカットオフ基準は、情報を与えるSNPを同定するには適切であり得る。A対立遺伝子についてのカウントが10であるため、SNP遺伝子座の第1は、画分胎児DNA濃度の計算に対して「情報を与える」ものとして見なされる。
【0142】
図13Bは、総数が121個の分子、及び20%の画分胎児DNA濃度を有する少量の対立遺伝子のカウントについての予期された分布を示す。一態様では、この分布に基づいて、少量の対立遺伝子のカウントについての26未満のカットオフ値は、情報を与えるSNPを同定するには適切であり得る。T対立遺伝子についてのカウント数が9であるため、SNP遺伝子座の第2は、画分胎児DNA濃度の計算に対して「情報を与える」ものとして見なされる。
【0143】
図12は、総数が134個の分子、及び20%の画分胎児DNA濃度を有する少量の対立遺伝子のカウントについての予期された分布を示す。一態様では、この分布に基づいて、少量の対立遺伝子のカウントについての25未満のカットオフ値は、情報を与えるSNPを同定するには適切であり得る。T対立遺伝子についてのカウント数が62であるため、SNP遺伝子座の第3は、画分胎児DNA濃度の計算に対して「情報を与えない」ものとして見なされ、その計算に用いられないであろう。
【0144】
一態様では、式f=2×p/(p+q)を用いて、胎児DNAの画分濃度は、SNP1と2についての対立遺伝子カウントにより計算され、組み合わせることができる。結果を以下に示す。
【0146】
D.胎児ゲノムの深度被覆率の決定
画分濃度を得ることに加えて、態様は、工程1010における分析手段(例えば、配列決定)が達成された胎児ゲノムの被覆率を決定することができる。いくつかの態様では、情報を与える遺伝子座は、被覆率を決定するために用いることができる。例えば、上記からの例のいずれかを使用することができる。一態様では、胎児が偏性的ヘテロ接合である遺伝子座を用いることができる。別の態様では、胎児がヘテロ接合であることが決定され、母親がホモ接合である遺伝子座を用いてもよい(例えば、方法1100による)。
【0147】
情報を与える遺伝子座に対してマッピングされた断片は、被覆の比率を決定するために用いることができる。一態様では、各第1の対立遺伝子が配列決定の決定から検出される第1の複数の遺伝子座のうちの遺伝子座の比率が決定される。例えば、胎児が遺伝子座でTAであり、母親がその遺伝子座でAAである場合、対立遺伝子Tは、その遺伝子座が配列決定された場合の配列決定の結果において検出されなければならない。このようにして、生物試料から配列決定された胎児ゲノムの比率は、この比率に基づいて計算され得る。一態様では、胎児特異的な対立遺伝子が観察される第1の遺伝子座の比率は、胎児ゲノムの被覆率として採用され得る。他の態様では、この比率は、遺伝子座がどこにあるかに基づいて修飾され得る。例えば、被覆率は各染色体について決定することができる。別の例として、割合は、第1の遺伝子座がゲノムの良好な表現を形成しない場合の比率よりも小さく見積もることができる。別の例として、その比率が範囲の一端である範囲が提供されてもよい。高い比率、すなわち、100%近くが、胎児ゲノムの完全な被覆率に近いことを意味する一方、大部分の遺伝子疾患は、100%被覆率を大幅に低いものとして、例えば、80%、又は50%、又はそれ未満であると診断され得る。
【0148】
VI.母親と父親のゲノムの以前の情報がない
前のセクションでは、いくつかの態様は、母親のハプロタイプと父親の遺伝子型が知られているとき、胎児(又は胎児のゲノムの一部)の遺伝子マップを決定した。他の態様は、画分胎児DNA濃度は、母親、父親、又は胎児の遺伝子型についての予めの知識なしに、母親の血漿DNAを分析することによって決定することができる。さらに他の態様では、本発明者らは、母親と父親の遺伝子型/ハプロタイプ(単数又は複数)の以前の情報なしに、RHDO分析を用いて、胎児(胎児ゲノムの一部)の遺伝子マップを決定するための方法をここにさらに記載する。
【0149】
一態様では、親が属する集団の参照(例えば、共通又は既知の)ハプロタイプの譲歩を用いる。この情報は、母親と父親のハプロタイプを推定するために用いることができる。例は、この方法の原理を例証するために使用される。このような参照ハプロタイプに関する情報は、例えば、International HapMap Projectのウェブサイト(hapmap.ncbi.nlm.nih.gov/)から得ることができる。
【0150】
例証の一部として、3つの参照ハプロタイプ(
図15Aに示されるHapA、HapB及びHapC)がこの集団に存在するものと想定する。これらの3つのハプロタイプの各々は14個のSNP遺伝子座からなり、各々の遺伝子座について2つの可能な対立遺伝子が存在する。この例では、
図15Bに示されるように、父親は、HapB及びHapCを有する一方、母親はHapA及びHapBを有する。この例は、胎児は母親のHapAと父親のHapCを遺伝すると推定する。したがって、
図15Bに示されるように、胎児はHapAとHapCを有する。
【0151】
図16は、本発明の態様に従って、1セットの参照ハプロタイプが知られているが、親のハプロタイプが知られていない場合、胎児ゲノムの少なくとも一部を決定するための方法1600のフローチャートである。
【0152】
工程1610では、母親試料は、母親がホモ接合であり、胎児がヘテロ接合であるSNPを同定するために分析することができる。この分析は、上記されるように、遺伝子座が情報を与えるものであるかどうかの決定として、類似したように行うことができる。したがって、一態様では、方法1000及び/又は1100を用いることができる。上記した他の態様では、母親と父親のゲノムは、胎児ゲノムマッピングを行うための情報を決定するために分析することができる。
【0153】
図17は、母親試料由来のDNA断片の分析から情報を与える遺伝子座を決定する例を示す。14個の遺伝子座の各々について、各遺伝子座についての2つの対立遺伝子のカウントを決定する。これらの対立遺伝子のカウントは、例えば、限定されないが、リアルタイムPCR、デジタルPCR、大規模並列配列決定を用いて決定され得る。これらの遺伝子座の各々について、2つの異なる対立遺伝子が母親血漿において検出されるであろう。母親がヘテロ接合であるそれらのSNPとは対照的に、2つの対立遺伝子の比率は有意に異なるであろう。胎児特異的な対立遺伝子(胎児が父親から遺伝する対立遺伝子)は、母親の対立遺伝子と比較して、非常に少量であろう。情報を与える遺伝子座1710を
図17に記す。
【0154】
工程1620では、胎児に遺伝された親のハプロタイプの1以上の対立遺伝子が推定される。一態様では、遺伝子座1710の各々を用いて、遺伝された父親のハプロタイプを決定することができる。例えば、胎児が遺伝した父親の対立遺伝子は、胎児特異的な対立遺伝子が母親試料中の母親の対立遺伝子よりも非常に少量であるため、遺伝子座1710について胎児特異的な対立遺伝子として同定され得る。
【0155】
工程1630では、父親の対立遺伝子は、父親から遺伝されたハプロタイプを決定するために参照ハプロタイプと比較される。ある種の態様では、多数の可能な胎児ハプロタイプが推定され得て、各々は独自の可能性を有する。次に、最も可能性のある胎児ハプロタイプの1以上が、その後の分析、又は臨床診断に用いられ得る。
【0156】
図18に示される例では、この集団において3つの可能なハプロタイプ(HapA、HapB及びHapC)が存在する。母親の血漿分析から、4つのSNPは、母親についてはホモ接合であり、胎児についてはヘテロ接合であるとして同定され、このようにして胎児が遺伝する父親の対立遺伝子を表す。これらの4つのSNPの遺伝子型はHapCのパターンと適合する。したがって、胎児は、
図19に示されるように父親からHapCを遺伝した。換言すると、同一のハプロタイプブロック内のSNPの全てについて、胎児が遺伝した父親の対立遺伝子を推定することができる。
【0157】
工程1640では、母親がヘテロ接合である遺伝子座(例えば、SNP)を決定することができる。一態様では、母親試料の分析は、母親がヘテロ接合であるSNPを提供し得る。例えば、これらのSNPの各々で、2つの異なる対立遺伝子は、母親血漿において検出可能である。胎児特異的な対立遺伝子が母親血漿中の全対立遺伝子の小比率だけを分布する、母親がホモ接合であり、胎児がヘテロ接合であるSNPと比較して、2つの対立遺伝子のカウントは、母親がヘテロ接合であるSNPについて類似するであろう。したがって、ハプロタイプブロック内のSNP遺伝子座全てについての完全な母親の遺伝子型は、例えば、
図20に示されるように母親の血漿分析から決定し得た。
【0158】
工程1650では、母親のハプロタイプは、遺伝子座の遺伝子型と関連集団のハプロタイプ情報とを比較することによって、工程1640より母親の遺伝子型から推定される。
図21は、母親のハプロタイプと参照ハプロタイプから母親の遺伝子型を決定するための態様を示す。使用される例では、母親は、第3のSNP遺伝子座のG対立遺伝子に対してホモ接合である。HapAとHapBがこの基準を満たすので、これは、母親が、3つのハプロタイプ組み合わせ、すなわち、HapA/HapA、HapA/HapB又はHapB/HapBの1つを有することを示す。さらに、母親が第1のSNPについてAとCに対してヘテロ接合であるため、本発明者らは、母親がHapA/HapBのハプロタイプ組み合わせを有すると推定することができる。一態様では、1を超える可能性が帰着し得て、各々の可能性は次の工程において試験され得た。上記の分析から、母親のハプロタイプと、胎児が父親から遺伝するハプロタイプが推定された。
図22は、決定された母親のハプロタイプと、父親から遺伝されたハプロタイプを示す。
【0159】
工程1660では、胎児によって遺伝された母親のハプロタイプは、工程1650において同定された母親のハプロタイプ、及び工程1630において同定された父親から遺伝されたハプロタイプから決定される。この情報を用いて、態様は、どの母親のハプロタイプが胎児に移動されるかを決定するためにRHDO分析を用いることができる。RHDO分析は、本明細書に記載される態様のいずれかに従って行うことができる。
【0160】
一態様では、RHDO分析について、母親がヘテロ接合であるSNPは2つのタイプ、すなわち、アルファタイプとベータタイプ(例えば、
図23に示され、上記される)に分類することができる。アルファタイプのSNPは、胎児に移動した父親の対立遺伝子が、HapAに局在した母親の対立遺伝子と同一である遺伝子座を指す。タイプアルファSNPについて、胎児が母親からHapAを遺伝する場合、HapA上の対立遺伝子は母親血漿において過剰に表されるであろう。一方、胎児が母親からHapBを遺伝する場合、2つの母親の対立遺伝子は母親血漿において等しく表されるであろう。
【0161】
ベータタイプのSNPは、胎児に移動した父親の対立遺伝子がHapB上に局在した母親の対立遺伝子と同一である遺伝子座を指す。ベータタイプのSNPについて、胎児は母親からHapBを遺伝する場合、HapB上の対立遺伝子は母親血漿において過剰に表されるであろう。しかしながら、胎児が母親からHapAを遺伝する場合、2つの母親の対立遺伝子は母親血漿において等しく表されるであろう。HapA又はHapB対立遺伝子の潜在的な過剰表現はRHDO分析を用いて決定され得る。
【0162】
いくつかの態様では、母親のハプロタイプと父親の遺伝子型の以前の情報なしに、特定領域上でRHDO分析を適用するために、ハプロタイプブロック内の相対的に高い被覆倍率のSNPを必要とし得て、例えば、SNP遺伝子座に対応する200個の分子が一態様において分析するために必要となる場合がある。この情報は、例えば、限定されないが、リアルタイムPCR、デジタルPCR及び大規模並列配列決定によって得ることができる。一態様では、標的化された配列決定(例えば、標的富化及び大規模並列配列決定による)は、標的化領域内の異なる対立遺伝子の代表的な公平な定量的情報を得るために用いることができる。以下の例は標的化配列決定を示す。したがって、このRHDO分析は、その母親の対立遺伝子/ハプロタイプが、父親の遺伝子型/ハプロタイプに関する以前の情報なしに、胎児に移動するかどうかを決定するために、母親の血漿DNAの標的化配列決定データに適用され得る。
【0163】
VII.デノボ突然変異の検出
いくつかの態様は、胎児が獲得した突然変異を検出することができる。デノボ突然変異は父親又は母親によって担持されないが、例えば、父親若しくは母親又は両親からの配偶子形成中に生じる突然変異である。このような検出は、デノボ突然変異が、多数の遺伝子疾患、例えば、血友病A及び軟骨形成不全症の誘因における重要な役割を果たすため、臨床用途を有する。
【0164】
図24は、妊娠女性の出生前胎児のゲノムにおいてデノボ突然変異を同定するための方法2400を例証するフローチャートである。父親と妊娠女性である母親を持つ胎児、2つのハプロタイプを含む父親ゲノムを有する父親、及び2つのハプロタイプを含む母親ゲノムを有する母親であり、以下を含む方法である。
【0165】
工程2410では、妊娠女性から得られた生物試料由来の複数の核酸分子を配列決定する。試料は母親と胎児の核酸の混合物を含む。
【0166】
工程2420では、ヒトゲノムにおける配列決定された核酸分子の各々の局在が同定される。一態様では、配列のマッピングは、単一末端又は対末端の配列決定によって実施され得る。一局面では、局在を見出すためのヒトゲノムに対するマッピングは、見出される局在のヌクレオチドの各々の正確な合致を必要としない。
【0167】
工程2430では、局在の少なくとも一部の各々について、母親の配列と父親の配列が対象とする局在で決定される。例えば、100個の局在が工程2420において決定される場合、これらの100此の局在での母親と父親のゲノムを決定することができる。一態様では、父親の配列は、上記される参照ハプロタイプを用いるのとは対照的に、父親からの試料より決定される。このようにして、参照ゲノムにはない突然変異がなおも検出され得た。種々の態様では、母親の配列は、例えば、本明細書に記載の方法を用いて、母親のDNAだけを含む試料から得ることができ、又は生物試料から得ることができる。
【0168】
工程2440では、決定された母親又は父親の配列に存在しない複数の核酸分子における第1の配列が同定される。一態様では、第1の配列と決定された母親又は父親の配列との比較は正確な合致を要する。したがって、合致が正確でない場合、第1の配列は、決定された母親又は父親の配列に存在しないものと考えられる。このようにして、デノボ突然変異がちょうど1個のヌクレオチド変化であり得るため、ほんの僅かなデノボ突然変異を同定することができる。別の態様では、非母親及び非父親の配列を示すある種の数のDNA断片は、その配列がデノボ突然変異として見なされるようにするために必要とされる。例えば、3つのDNA断片のカットオフは、配列、すなわち、デノボ突然変異が存在するか否かを決定するために用いることができた。
【0169】
工程2450では、生物試料中の第1の配列の第1の画分濃度が決定される。例えば、第1の配列を示すDNA断片の数は、その遺伝子座から検出される全てのDNA断片の比率として表すことができた。
【0170】
工程2460では、生物試料における胎児核酸の第2の画分濃度は、胎児がその父親から遺伝し、父親ゲノムにおいて存在するが、母親ゲノムに存在しない核酸分子を用いて決定される。このような核酸分子は、父親がホモ接合であり、母親もまたホモ接合であるが、異なる対立遺伝子である遺伝子座で第1の対立遺伝子を含む場合があり、よって、胎児は偏性的ヘテロ接合である。上記される情報を与える遺伝子座は、第2の画分濃度を決定するために用いる核酸を決定するために使用され得る。
【0171】
他の態様では、第2の画分濃度は、他のアプローチ、例えば、PCRアッセイ、デジタルPCRアッセイ又は質量分析に基づくアッセイの使用を用いて、Y染色体、遺伝的多型の一団、すなわち、単一ヌクレオチド多型、又は挿入−欠失多型(Lun FMF et al Clin Chem 2008;54;1554−1672)上で決定され得る。別の代替は、胎児と母親との間で異なるDNAメチル化を示す1以上のゲノム遺伝子座を用いることである(Poon LLM et al.Clin Chem 2002;48:35−41;Chan KCA et al.Clin Chem 2006;52:2211−2218;米国特許第6,927,028号)。
【0172】
一態様では、異なる後成的状況は異なるDNAメチル化パターンによって反映される。異なるDNAメチル化パターンは、RAS関連ドメインファミリー1A(RASSF1A)又はホロカルボキシラーゼシンターゼ(ビオチン−プロプリオニル−コエンザイムA−カルボキシラーゼ(ATP−加水分解))リガーゼ(HLCS)遺伝子を伴うことができる。胎児特異的なDNAメチル化プロフィールを有するDNA断片の量は、特異的にメチル化された遺伝子座から生じる全てのDNA断片の比率として表現可能である。
【0173】
工程2470では、第1の配列は、第1と第2の画分濃度がほぼ同じである場合に、デノボ突然変異として分類される。分析過程における誤差、例えば、配列決定誤差から生じる非母親と非父親の配列は、ランダム事象であり、再現の低い可能性を有する。したがって、試料について測定された画分胎児DNA濃度に類似した量で同じ非母親と父親の配列を示す多数のDNA断片は、配列決定誤差から生じたというよりはむしろ胎児ゲノムに存在するデノボ突然変異である可能性がある。一態様では、カットオフ値は、画分濃度が同じであるかどうかを決定するために使用されてもよい。例えば、濃度が互いに特定の値以内である場合、第1の配列はデノボ突然変異として分類される。種々の態様では、特定の値は5%、10%、又は15%であり得る。
【実施例】
【0174】
I.実施例1
本発明の態様を例証するために、以下の例を分析した。ベータ−サラセミアの出生前診断に対する産科クリニックに訪れたカップルを採用した。父親は、ヒトベータ−グロビン遺伝子のコドン41/42の−CTTTの4塩基対欠失のキャリアーであった。妊娠母親は、ヒトベータ−グロビン遺伝子のヌクレオチド−28でA→G突然変異のキャリアーであった。血液試料を父親と母親から採取した。母親については、血液試料は、妊娠12週で絨毛膜標本採取(CVS)前に採取された。CVS後、一部を実験用に保存した。実験の目的は、ゲノム規模の遺伝子マップを構築するか、又は母親血漿DNAの大規模な並列配列決定による胎児の部分的若しくは完全なゲノム配列を決定することであった。
【0175】
1.親の遺伝子型の決定
DNAは、父親と母親の軟膜、及びCVS試料から抽出された。これらのDNA試料は、Affymetrix Genome−Wide Human SNP Array 6.0システムによる分析に供された。このシステムは、180万の遺伝子マーカーを特徴とし、約900,000個の単一のヌクレオチド多型(SNP)と、コピー数改変体の検出用の約950,000を超えるプローブが含まれる。父親、母親及び胎児(CVS)についての異なる遺伝子型組み合わせを示すSNPの絶対数及び割合を
図25Aの表に示す。
【0176】
Affymetrixシステムはこの実施例において使用されたが、実際には、当業者に知られている任意のゲノタイピングプラットフォームを用いることができた。確かに、ゲノタイピングとは別に、父親と母親の軟膜DNAはまた、全ゲノム基準又は選択されたゲノム領域について配列決定され得る。さらに、父親と母親由来の構造的DNA(例えば、口腔細胞DNA、毛嚢など)の任意の供給源が親の遺伝子型を確立するために用いることができた。
【0177】
CVS試料は、母親血漿分析から推定された胎児遺伝子マップとの比較のための標準を与えるために分析された。さらに、この実験について、CVS試料の遺伝子型又は、RHDO分析のための母親のハプロタイプを構築するために使用することができる。このシナリオでは、このようなハプロタイプ構築目的でのCVS遺伝子型の使用は、例示の目的で使用されただけであった。態様の臨床的応用では、母親ハプロタイプは、例えば、前の子孫、兄弟、親又は母親の他の親戚などのファミリーにおいて他の個人の分析を介して構築することができる。また、対象とする染色体領域の母親ハプロタイプは、当業者に周知な他の方法によって構築することができ、そのいくつかは本明細書に言及されている。
【0178】
選択された態様について、分析されるべきまだ生まれていない胎児の父親のハプロタイプを決定することができた。この情報は、父親と母親がヘテロ接合である染色体領域について相対的ハロタイプ用量について特に有用となり得る。
【0179】
2.母親血漿DNAの大規模な並列配列決定
母親から得られた血漿DNAは、Illumina Genome Analyzerプラットフォームを用いて、大規模な並列配列決定に供された。血漿DNA分子の対合末端配列決定は、各末端で50bpについて配列決定し、したがって全体で分子あたり100bpであった。各配列の2つの末端は、Beijing Genomics Institute at Shenzhen(soap.genomics.org.cn)(Li R et al.Bioinformatics 2009,25(15):1966−7)を用いて、繰り返しの非マスク化されたヒトゲノム(UCSC http://genome.ucsc.eduからダウンロードされたHg18 NCBI.36)に対して整列された。表、
図25Bは、最初の20個のフローセルのアラインメント統計を列挙する。したがって、20個のフローセルを用いて、39.32億を超える読み込みを参照ヒトゲノムに対して整列した。
【0180】
3.画分胎児DNA濃度計算
上述したように、母親血漿試料中の胎児DNAの画分濃度は、配列決定データから計算することができる。1つの方法は、父親と母親がともにヘテロ接合であるが、互いに異なる対立遺伝子について、SNPを分析することである。このようなSNPについて、胎児は、1つの父親により遺伝された対立遺伝子と1つの母親により遺伝された対立遺伝子について偏性のヘテロ接合である。一つの態様では、第5節に記載されている計算法のいずれも使用されてもよい。この実施例では、異なる染色体上の親の遺伝子型形態(すなわち、親がともにヘテロ接合であるが、異なる対立遺伝子についてである)を満たす、異なる多型ゲノム遺伝子座全体の累積データについて実行された。異なる染色体上に位置されたSNPについて計算された胎児DNAの画分濃度は、
図26の最も右のカラムに列挙されている。表から分かるように、異なる染色体上に位置されたSNPについて決定された画分濃度は、互いに非常に密接に相関している。
【0181】
品質管理実験として、母親がホモ接合であり、父親がヘテロ接合であるSNPはまた、軟膜試料のAffymetrix SNP 6.0分析から調査された。DNA配列の十分な深度で、この分析からの分画胎児DNAは、父親と母親がホモ接合であるが、異なる対立遺伝子についてであるSNPについて測定されたものと非常に類似していた。
【0182】
一実施では、画分の胎児DNA濃度の近似−一致がこれらの2つのタイプのSNPから観察された場合、胎児ゲノムの完全な配列決定範囲に近いと結論付けることができた。一局面では、範囲のより小さな深度で、母親がホモ接合であり、父親がヘテロ接合であるSNPについて測定された画分胎児DNA濃度は、父親と母親がともにホモ接合であるが、異なる対立遺伝子についてであるSNPについて測定されたものよりも高かった。このような範囲のより小さな深度で、配列決定の結果から父親固有の対立遺伝子についてであるSNPについての不存在が2つの可能な原因を有することができる:(i)胎児は父親からのこの対立遺伝子を遺伝しなかった;及び/又は(ii)胎児は父親からこの対立遺伝子を遺伝したが、次にこの対立遺伝子は、配列決定の深度が十分でなかったために、配列決定の結果からなくなっていた。
【0183】
4a.胎児ゲノムの割合範囲の計算
また、上述されたように、母親血漿DNAの配列決定によって分析された胎児ゲノムの割合は、父親と母親がともにホモ接合であるが、異なる対立遺伝子についてであるSNPのサブセットでの観察によって決定することができた。このファミリーでは、Affymetrix SNP 6.0アレイ上の45,900個SNPがこのサブセットに属していた。胎児ゲノムの割合範囲は、SNPのこのサブセットのどの割合において、胎児対立遺伝子が配列決定によって検出することができたかを観察するために、血漿DNA配列決定を分析することによって推定することができた。
【0184】
図2Aのプロットは、分析された最初の20個のフローセルについての配列決定データから胎児対立遺伝子が観察され得たこのサブセットにおけるSNPの観察された割合を示す。このようにして、胎児対立遺伝子はこのようなSNPの94%に観察することができた。この程度の配列決定は、39.32億を超える読み込みに対応し、各々は配列の100bpであった。
図27Bのプロットは、フローセルの数の代わりに、読み込みの範囲 対 数を示す。異なる配列決定プラットフォームの処理量の増加に伴って、フローセルの数、又は配列の読み込みのこれらの数若しくは配列の長さを生じさせるのに使用されるか又は必要とされるフローセル又は稼働の数が将来減少することが期待される。
【0185】
いくつかの態様では、複数のSNPが各染色体の領域又は染色体において検出されたので、胎児ゲノムの埴は、正確なゲノムマッピングをなおも提供しながら、94%よりも非常に低くなる可能性があった。例えば、染色体の領域において30個の情報を与えるSNPがあることを想定するが、胎児対立遺伝子は30個のSNPのうちたった20個のSNPについて検出される。しかしながら、染色体の領域は、なおも、20個のSNPを用いて正確に同定される可能性がある。このようにして、一態様では、同等な精度は、94%未満の範囲を伴って観察され得る。
【0186】
4b.胎児がその父親から遺伝された対立遺伝子の遺伝子マップの範囲
この例証的な分析は、父親がヘテロ接合であり、母親がホモ接合であるSNP対立遺伝子に焦点を合わせる。このファミリーでは、Affymetrix SNP 6.0プラットフォーム上の131,037個のSNPはこのカテゴリーに属した。これらのSNPのサブセットは、母親がホモ接合であり、一方、胎児と父親がともにヘテロ接合である65,875個のSNPからなっていた。20個のフローセルを用いて、父親から遺伝された対立遺伝子は、これらのSNPの61,875において観察され得て、93.9%の範囲を指示した。この後者の割合は、前の段落において推定された割合範囲データと十分に一致した。父親から遺伝された対立遺伝子の範囲とマッピング可能な配列読み込みの数とフローセル配列の数との間の相関はそれぞれ
図28Aと
図28Bに示されている。
【0187】
純粋に父親から遺伝された胎児の対立遺伝子を検出するためのこのアプローチの特異性を評価するために、母親が持つのと同じである対立遺伝子を胎児が遺伝した65,162個(すなわち、131,037〜65,875個)のSNPを分析した。このようなSNPについて、母親が持つものとは異なる対立遺伝子の見掛けの検出は偽陽性を表す。このようにして、65,163個のSNPのうち、たった3,225個の偽陽性(4.95%)が、20個のフローセルを分析したときに観察された。これらの偽陽性は、父親と母親のDNAの配列決定エラー又は遺伝子型決定エラー、又は胎児におけるデノボ突然変異の結果であり得る。偽陽性率と配列決定されるフローセルの数との相関を
図29Aに示す。
【0188】
また、偽陽性率は、父親と母親の両方がホモ接合であり、同じ対立遺伝子を有するSNPのサブセットを考慮することによって見積もることができる。特定の遺伝子座での任意の代替の対立遺伝子の存在が偽陽性であると考えられた。これらの偽陽性は、父親若しくは母親のDNAの配列決定エラー又は遺伝子型決定エラー、又は胎児におけるデノボ突然変異の結果であり得る。このサブセットには500,673個のSNPが存在した。20個のフローセルからの配列データを用いて、偽陽性が48,396個のSNP(9.67%)において検出された。偽陽性率と配列決定されるフローセルの数との相関を
図29Bに示す。この偽陽性率は、母親と胎児がホモ接合であり、父親がヘテロ接合であるSNPのサブセットを用いた見積りよりも高かった。これは、SNPの後者のサブセットにおいて、母親血漿における父親から遺伝された対立遺伝子の存在だけが偽陽性であると考えられる一方、前者のサブセットにおいては、父親と母親によって共有される共通の対立遺伝子以外の任意の対立遺伝子が偽陽性結果として考えられるためである。
【0189】
図30は、分析されるフローセルの異なる数に対して胎児特異的なSNPの範囲を示す。父親と母親の両方がホモ接合であるが、異なる対立遺伝子を有するSNPがこの分析に含まれる。X軸は胎児特異的なSNPの倍数範囲であり、Y軸は特定の倍数大衆を有するSNPの割合である。分析されるフローセルの数が増加するとともに、胎児特異的なSNPについて倍数範囲の平均数が増加する。例えば、1つのフローセルが分析された場合、SNPの平均範囲は0.23であった。平均範囲は、20個のフローセルが分析された場合、4.52倍に増加した。
【0190】
5.その母親から遺伝された遺伝子マップの精度
図31は、10個のフローセルからのデータを用いた場合、タイプA分析の精度を示す。セクションII.Bは、タイプAとタイプBの分析(アルファとベータとも呼ばれる)の態様を記載する。精度は、母親から遺伝されたハプロタイプの正しい決定についてである。精度は、各染色体についてそれぞれ存在する。
【0191】
SPRT分析(Zhou W et al.Nat Biotechnol 2001;19:78−81;Karoui NE et al.Statist Med 2006;25:3124−33)に対する1,200の尤度比を用いると、精度は96%〜100%の範囲であった。示されるように、SPRT分類に対するこのような高い尤度比を用いたときでさえ、ゲノム全体で総2,760個のセグメントを分類することができた。この程度の解像度は、大部分の目的にとって十分であり、その場合、減数分裂性組み換えは、発生あたり、染色体アームにつき低い一桁分の1の頻度で起こると考える。さらに、インターレイシングアプローチを用いると、誤分類の全てが妨げられ得ることを見出すことができた(
図31の右側)。上記した通り、インターレイシングアプローチはタイプA分析及びTypeB分析をモジュール散る。
【0192】
図32は、10個のフローセルからのデータを用いた場合、タイプB分析の精度を示す。SPRT分析について1,200の尤度比を用いると、精度は94.1%〜100%の範囲であった。誤分類の全ては、
図31に示したように、インターレイシングアプローチを用いた場合に妨げられた(
図32の右側)。
【0193】
図33は、30個のフローセルからのデータを用いた場合、タイプAの分析の精度を示す。SPRT分析についての1,200の尤度比と「2つの連続ブロック」アルゴリズムを用いると、3,780分類の全部が作製され、ほんの3つ(0.1%)の分類が正しくなかった。
図34は、20個のフローセルからのデータを用いた場合のタイプB分析の精度を示す。SPRTについて1,200の尤度比と「2つの連続ブロック」アルゴリズムを用いると、3,355分類の全部が作製され、ほんの6つ(0.2%)の分類が正しくなかった。これらの実施例では、SPRTは、SNPなどの単数の遺伝子マーカーの全体で行われる。
【0194】
II.ベータ−サラセミアの危険性の出生前決定
一態様では、胎児のベータ−サラセミア(常染色体劣性疾患)を有する危険性を決定するために、胎児が、その父親と母親によって担持された突然変異対立遺伝子を遺伝したかどうかを決定することができる。上記されたこのケースでは、父親は、ヒトベータグロビン遺伝子のコドン41/42の−CTTTの4塩基対欠失のキャリアーである。妊娠女性は、ヒトベータ−グロビン遺伝子のヌクレオチド−28でのA→Gの突然変異のキャリアーであった。
【0195】
胎児が父親のコドン41/42突然変異を遺伝したかどうかを決定するために、最初の10個のフローセルを用いて、母親血漿DNAの配列決定データをこの突然変異について探索した。この突然変異を有する10個の読み込みの全部を見出した(
図35A)。したがって、胎児は、父親の突然変異を遺伝していた。さらに、62個の読み込みは、コドン41/42での野生型配列を含むことが見出された(
図35B)。よって、突然変異を含むこの領域における読み込みの割合は0.1389である。この図は、
図26において決定された画分胎児DNA濃度に非常に近い。一態様では、父親の突然変異の遺伝における胎児の危険性はまた、父親の突然変異に連結された遺伝子多型のその継承を解明することによって決定され得る。
【0196】
一態様では、胎児が母親血漿DNA−28突然変異を遺伝した危険性を決定するために、RHDO分析を行った。このファミリーでは、−28突然変異はハプロタイプIV上に局在し、一方、野生型対立遺伝子はハプロタイプIIIに局在した。タイプAのRHDO分析の結果を
図36に示し、一方、タイプBのRHDO分析の結果を
図37に示す。両タイプの分析において、母親からのハプロタイプIIIの胎児遺伝が推定された。換言すると、胎児は、母親からの野生型対立遺伝子を遺伝した。胎児の最終診断は、父親からのコドン41/42突然変異と、母親からの野生型対立遺伝子を遺伝したことであった。このようにして、胎児は、ベータ−サラセミアのヘテロ接合性キャリアーであり、よって臨床的には健常であるはずである。
【0197】
III.標的富化及び標的化配列
前のセクションで検討したように、分画胎児DNA濃度の見積もりの精度、及び母親血漿DNAの分析から推定された遺伝子マップの解像度は、対象とする遺伝子座の範囲の深度に依存し得る。例えば、本発明者らは、SNPに対応する200個の分子の全体が、母親の遺伝子型の以前の情報なしに、高い精度で画分胎児DNA濃度を決定するために必要とされ得ることを実証した。母親血漿におけるSNPの対立遺伝子カウントは、例えば、限定されないが、リアルタイムPCR、デジタルPCR及び大規模な並列配列決定によって得ることができる。
【0198】
母親血漿DNAの大規模な並列配列決定が全ゲノム全体で数百万のSNPの対立遺伝子カウントを同時に決定することができるため、異なる遺伝子座全体で全ゲノム分析について理想のプラットフォームである。大規模な並列配列決定の基本のフォーマットは、同じ深度で覆われるゲノム内の異なる領域を許容する。しかしながら、無作為な大規模な並列配列決定を用いた高い配列決定深度で特定の対象とする領域を配列決定するために、ゲノムの残りの部分(分析されることが意図されない)は、同程度まで配列決定されなければならない。このようにして、本アプローチは費用が嵩む可能性があった。大規模な並列配列決定アプローチのコストパフォーマンスを改善するために、1つの方法は、配列決定を進める前に、標的領域を富化することである。標的化された配列決定は、液相捕捉(Gnirke A,et al.Solution hybrid selection with ultra−long oligonucleotides for massively parallel targeted sequencing.Nat Biotechnol 2009;27:182−9)、マイクロアレイ捕捉(例えば、NimbleGenプラットフォームを用いる)、又は標的化増幅(Tewhey R,et al.Microdroplet−based PCR enrichment for large−scale targeted sequencing.Nat Biotechnol 2009;27:1025−31)によって行うことができる。
【0199】
標的化配列決定は、例えば、遺伝子結合研究のために、集団遺伝子改変を検出するために初期に適用された。したがって、ゲノム研究における現在の応用は、定量的問題を解決すること(例えば、ゲノタイピング又は突然変異検出)を目的する。しかしながら、非浸襲性の出生前診断目的のために、母親のプラズマDNAにおける標的化配列決定の応用は、定量的考察と関係し、その実行性は不明であった。例えば、標的化配列決定の使用は、母親血漿における胎児及び母親DNAの検出において定量的バイアスを導入することができた。さらに、従来の研究は、胎児DNAが母親DNAよりも短いことを示した(Chan KCA et al.Size distributions of maternal and fetal DNA in maternal plasma.Clin Chem 2004;50:88−92)。また、このサイズの相違は、母親血漿における胎児及び母親のDNAの捕捉の定量的バイアス又は異なる効率を導入することができた。また、効率性について確認していないが、このような断片化されたDNA分子が捕捉され得ることについて確かめていなかった。以下の記載では、本発明者らは、標的化配列決定が、標的富化、続く大規模な並列配列決定によって達成され得る。また、全ゲノム配列決定と比較して、標的富化は、画分胎児DNA濃度を見積もるための効率的な方法であることを示す。
【0200】
A.標的−富化を用いた画分濃度の決定
1.材料及び方法
一人の女子胎児を持つ4人の(M6011、M6028、M6029及びM6043)妊娠女性を採用した。母親の末梢血試料をEDTA血液チューブに回収し、その後、妊娠第3期に選択的帝王切開をし、一方、胎盤試料を選択的帝王切開後に回収した。遠心分離後、末梢血細胞由来のDNAは、Blood Mini Kit(Quiagen)を用いて抽出された。2.4mLの胎盤由来のDNAは、DSP DNA Blood Mini Kit(Quiagen)によって抽出された。母親のゲノムDNAは軟膜から抽出され、胎児のゲノムDNAは胎盤組織から抽出された。妊娠第3期の試料は、例証目的のためだけにこの実験で使用された。妊娠第1期及び第2期の試料を同様に用いることができる。
【0201】
母親及び胎児の遺伝子型は、Genome−Wide Human SNP Array 6.0(Affymetrix)によって決定された。各事例について、5〜30ngの血漿DNAが、クロマチン免疫沈降配列決定試料調製の製造業者のプロトコールに従って、対末端試料調製キット(Illumina)によってDNAライブラリー構築のために用いられた。アダプター連結されたDNAは、直接、更なるサイズ分離せずに、QIAquick PCR精製キット(Qiagen)において提供されるスピンカラムを用いて精製された。次に、アダプター連結されたDNAは、標準的なプライマーを用いた15サイクルのPCRにより増幅された。プライマーはIlluminaからのPCRプライマーはIlluminaからのPE1.0及び2.0であった。DNAライブラリーは、NanoDrop ND−1000分光光度計(NanoDrop Technologies)を用いることによって定量し、サイズ分布について調べるために、DNA1000キット(Agilent)を用いて2100Bioanalyzer上で稼働させた。0.6〜1μgの増幅試料DNAライブラリーは、平均サイズが約290bpである各試料について生じさせた。捕捉ライブラリーをAgilentから得て、ヒトchrX(カタログ番号:5190−1993)上の85%のエクソンをカバーしていた。この試験における4人全ての事例について、各事例の500ngの増幅された血漿DNAライブラリーは、製造業者の説明書に従って、24時間65℃にて捕捉プローブとともにインキュベートされた。ハイブリダイゼーション後、捕捉された標的は、ストレプトアビジン被覆された磁気ビーズ(Dynal DynaMag−2 Invitorgen)を用いることによってビオチン化プローブ/標的ハブリダイズを引き出すことによって選択し、MinElute PCR精製キット(Quiagen)により精製された。最後に、標的化DNAライブラリーは、AgilentのSureSelect GAPEプライマーを用いて12サイクルのPCR増幅によって富化された。PCR産物は、QIAquick PCR精製キット(Quiagen)によって精製された。次に、標的富化とともに又は伴わないで精製されたDNAライブラリーは、Illumina Genome Analyzer IIxを用いたランダム大規模並列配列決定に供された。標準のフローセル上の1つの配列決定レーンを用いて、各DNAライブラリーを並列決定した。
【0202】
2.標的富化なしの胎児DNAの画分濃度
画分胎児DNA濃度は、情報を与えるSNP(すなわち、母親がホモ接合であり、胎児がヘテロ接合であるSNP)の対立遺伝子カウントに基づいて計算され得る。以下の表は、120184、110730、107362及び110321個の情報を与えるSNPが4人の事例について全ゲノム全体で同定され、63、61、69及び65(それぞれ同事例の順番である)が染色体Xの標的化された領域内にあることを示す。標的富化しない場合、画分胎児DNA濃度は、ゲノムの全ての情報を与えるSNPのデータに基づいて、33.4%、31.3%、29.2%及び34.4%であった。
【0203】
【表3】
【0204】
3.標的富化の有無による試料の比較
いくつかの態様では、各塩基あたりの平均時間数を表す配列割合の深度は、特定の領域において配列決定された。この態様では、本発明者らは、標的化された領域内の配列決定された塩基の総数を標的化された領域の長さ(3.05Mb)で割ることによって、標的化された領域の配列深度を計算した。富化キットによってカバーされた領域について、平均配列割合は、非富化試料については0.19倍であり、富化された試料については54.9倍であり、これは、289倍の富化の平均を指示する。この配列決定深度では、標的化領域内のほんの4.0%の胎児特異的な対立遺伝子が標的富化前に検出された(以下の表を参照)。対照的に、それらのうちの95.8%は、標的富化後に検出可能となった(以下の表を参照)。したがって、標的富化は、標的化領域内に胎児特異的対立遺伝子の検出率を大いに増大させた。
【0205】
次に、本発明者らは、富化の有無により、各試料について標的化領域内の全ての情報を与えるSNPの読み込みカウントに基づいて、画分胎児DNA濃度を比較した。標的富化しない場合、胎児特異的な読み込みの数は、4つの試料について0〜6の範囲であった(以下の表を参照)。低配列範囲により、胎児DNA分子の不十分なサンプリングは、画分胎児DNA濃度の正確な見積りを妨げる。標的富化の場合、標的領域内に大多数の胎児特異的対立遺伝子カウント(511〜776)及び共有の対立遺伝子カウント(2570〜3922)を観察した(以下の表を参照)。胎児DNA割合は、非富化試料におけるゲノム全般のデータによって見積もられた胎児DNA割合との35.4%、33.2%、26.1%、及び33.0%一致として計算された(以下の表を参照)。これらの結果は、母親及び胎児のDNA分子が標的領域内に同定に富化されたことを指示した。
【0206】
【表4】
【0207】
B.標的−富化を用いた胎児ゲノムの決定
RHDO法の1つの応用は、母親から遺伝された遺伝病の非侵襲的出生前検出用である。標的富化なしの母親の血漿の大規模並列配列決定を用いて、RHDO分析は、母親の血漿DNAの配列決定深度が約65倍のヒトゲノム範囲である場合に、どの母親のハプロタイプが17個のSNPの平均を有する胎児に移動するかを正確に決定することである。このアプローチのコストパフォーマンスを改善するために、ゲノム内の対象とする特定領域に配列決定を選択的に指向すること、次に、RHDO分析を配列決定に適用することを行うことができる。一例として、本発明者らは、染色体Xの標的化された配列決定及びRHDO分析を用いた概念を示した。しかしながら、標的かされた配列決定及びRHDO分析はまた、全ての染色体、例えば、常染色体に適用可能である。一態様では、上記されるRHDO分析は標的化された態様について使用され得る。
【0208】
一人の女子胎児を持つ5人の(PW226、PW263、PW316、PW370及びPW421)妊娠女性を採用した。母親の末梢血試料をEDTA血液チューブに回収し、その後、妊娠第1期において絨毛膜標本採取した。遠心分離後、末梢血細胞由来
3.2mLの血漿からのDNAは、DSP DNA Blood Mini Kit(Quiagen)によって抽出された。母親のゲノムDNAは軟膜から抽出され、胎児のゲノムDNAは絨毛膜から抽出された。上記した通り、試料を調製し、分析した。次に、各試料は、Illuminaフローセル上の1レーンを用いて無作為に配列決定された。
【0209】
この実施例では、本発明者らは、母親の核酸からの配列決定情報とともに胎児遺伝子型を用いて、染色体Xについて母親のハプロタイプを推定し、母親からどのハプロタイプが遺伝されたかを推定した。母親がヘテロ接合である染色体X上の各SNP(すなわち、情報を与えるSNP)について、胎児によって遺伝された対立遺伝子は母親のハプロタイプ1(HapI)に起因するものとして画定され、一方、胎児に移動しなかった母親の対立遺伝子は、母親のハプロタイプ2(HapII)に起因するものとして画定された。いくつかの態様では、臨床応用について、胎児遺伝子型は事前に利用可能でない場合もあり、母親のハプロタイプは、当業者に周知な方法及び本明細書に記載の方法によって決定又は推定することができる。また、他の染色体、例えば、常染色体は、このような分析において使用可能である。
【0210】
本明細書において上記される5人の事例について、それらの全ては一人の男子胎児を有していた。男子胎児は、父親からの染色体Xではなく、母親からの染色体Xを1つだけ遺伝するので、胎児に移動された母親の染色体Xは母親の血漿において過剰発現された。RHDO分析は、染色体Xのpterからqterまで実施された。染色体Xのpterに近いSNPで開始して、SPRT分析は、HapI又はHapII上の対立遺伝子が母親血漿において統計学的に有意に過剰発現されたかどうか決定することができる。2つのハプロタイプのいずれも統計学的に有意に過剰発現されなかった場合、次のSNPについての対立遺伝子カウントは更なるSPRT分析について組み合わせることができる。追加のSNPは、SPRTプロセスは、統計学的に有意に過剰発現されたハロタイプの1つを同定するまで、分析について組み合わせることができる。次に、分類プロセスを次のSNPで再度開始することができる。
【0211】
図38A及び38Bは、一例として事例PW226についてのSPRT分類結果を示す。この事例において染色体Xについての9個の成功したSPRT分類の全部が存在した。各SPRT分類について、HapI上の対立遺伝子は、母親の血漿試料において過剰発現されたことを示し、これは、胎児が母親からHapIを遺伝したことを指示する。本発明者らは、HapIが胎児に移動した対立遺伝子を含むハプロタイプであると画定したので、全てのこれらのSPRT分類の結果を回収した。
【0212】
5つの事例についてのRHDO分析結果を
図39にまとめた。成功したSPRT分類の数は1〜9の範囲であった。SPRT分類の全てを回収した。より高い画分胎児DNA濃度は、より高い分類の数と関付けられた。これは、胎児SNAの存在による対立遺伝子不均衡が、胎児DNAの分画濃度が高くなる場合に、より容易に検出され得るからである。したがって、より少ないSNPが、成功するRHDO分類に到達するために必要とされ得る。このようにして、画定された染色体領域(単数又は複数)はより多くのRHDOブロックに分割され得る。本発明者らの結果は、RHDO分析が、標的富化後に得られる大規模配列決定データに対して実行され得ることを確実にする。
【0213】
さらに、本発明者らのデータは、標的化されたアプローチが、RHDO分析を実行するよりコストパフォーマンスな方法であることを示した。標的富化しない場合、類似の胎児DNA濃度を含む試料について、約5個のフローセルによる配列決定(すなわち、40個の配列決定レーン)は、
図39に示される試料について到達される平均深度に達するように要求される(
図40)。ここで、本発明者らは、標的富化の場合、たった1つのレーンによる配列決定は、すでに、成功するRHDO分析について約15〜19倍の平均配列決定深度に達することを示す。あるいは、より高倍レベルの配列決定範囲は、標的富化を用いた場合、相対的に少ない追加費用で達成された。より高いレベルの配列決定範囲は、成功するRHDO分類に必要とされるゲノム領域のサイズを効果的に減少させることができ、分析の解像度を改善する。
【0214】
IV.標的−富化
循環胎児DNA分子は、一般には、母親の血漿における母親のDNAよりも短いことが2004年から知られている(Chan KCA et al Clin Chem 2004;50:88−92;Li et al Clin Chem 2004)。しかしながら、この観察の分子基礎は未解決のままであった。本発明者らの現在の研究では、研究の血漿試料において3.931×109個の読み込みを生じさせ、バイオインフォマティックス分析において1塩基ビン(bin)を用いた。各々の配列決定された血漿DNA分子のサイズは、対末端読み込みの末端のゲノム座標から推定された。
【0215】
この研究について、本発明者らは、単一ヌクレオチド多型(SNP)に焦点を合わせ、そこでは、父親と母親はともにホモ接合であるが、異なる対立遺伝子についてである。このようなSNPについて、胎児は必然的にヘテロ接合であった。父親から遺伝された各SNPの対立遺伝子は、胎児特異的マーカーとして用いることができた。胎児(父親から遺伝された胎児特異的対立遺伝子)のサイズ、及び全配列は、全ゲノム(
図41)、及び、個別には各染色体(
図42A〜42C)について決定された。
【0216】
母親の血漿中の胎児及び母親のDNAの間の最も有意な相違は、143bpピークと比較して166bpピークの減少であることを見出した(
図41)。最も豊富な全配列(選択的には母親である)は長さにして16bpであった。父親と母親との間のサイズ分布における最も有意な相違は、胎児DNAが166bp(
図41)の減少を提示し、相対的に顕著なものは143bpピークであることであった。可能性として、後者は、ヌクレオソームから約146bpのコア粒子への約20bpのリンカー断片のトリミングに対応していた(Lewin B,in Gene IX,Jones and Bartlett,Sudbury,2008,pp.757−795)。
【0217】
約143bp以下から、胎児と全DANの分布は、ヌクレアーゼ開裂されたヌクレオソームの10bpの周期的な連想(reminiscent)を示した。これらのデータは、血漿DNA断片がアポトーシス性の酵素処理から誘導されることを示唆する。対照的に、非ヒストン結合のミトコンドリアゲノムに対してマッピングされた読み込みのサイズ分析はこのヌクレオソームパターンを示さなかった(
図41)。これらの結果は、Y染色体と選択された多型遺伝子マーカーを用いて、父親と母親のDNA間の既知のサイズ再について従来知られていない分子説明を与ええ(Chan KCA et al,Clin Chem 2004;50:88−92;Li et al,Clin Chem 2004;50:1002−1011;米国特許出願第20050164241号;米国特許出願第20070202525号)、このようなサイズは全ゲノムの全体に存在することを示す。この相違の最も可能性のある説明は、循環胎児DNA分子が、約20bpのリンカー断片がヌクレオソームからトリミングされているより多くの分子からなることである。
【0218】
これらの観察から、試料が胎児DNAについて富化され得る多くの方法が存在する。一態様では、リンカー断片に選択的に結合する試薬を用いることができる。このような試薬は、母親の血漿中の胎児誘導DNAと比較した場合、母親誘導DNAに選択的に結合することが期待された。このような試薬の一例は抗体である。このような抗体の1つの標的はヒストンH1に結合するものである。ヒストンH1はリンカー断片に結合することが知られている。このような抗体の1つの応用は、負の選択によって、すなわち、リンカー、ヒストンH1含有断片を含む母親の血漿における母親誘導DNAの選択的免疫沈降を介して、胎児DNAの富化の実施に関する。さらに、H1は多数の改変体を有することが知られ、それらのいくつかは発現において組織特異的なバリエーションを示す(Sancho M et al PLoS Genet 2008;4:e1000227)。さらに、これらの改変体は、胎児DNA(胎盤選択的)及び母親DNA(造血選択的(Lui YYN et al,Clin Chem 2002;48:421−427))を識別するために開発され得た。例えば、母親血漿中の胎児誘導DNAについて選択的かつ陽性に選択するために、栄養膜細胞によって選択的に発現されるヒストンH1改変体を標的とすることができる。また、この戦略は、組織特異的、特に栄養膜特異的な発現パターンを示す他のヒストンタンパク質又は他のヌクレオソームタンパク質に提供され得る。
【0219】
母親DNAについて鋭い166bpピークから、胎児DNAの富化の別の可能性は、長さにして166±2であるDNA断片の負の選択用のシステムを設計することである。例えば、キャピラリー電気泳動又は高速液体クロマトグラフィーに基づくシステムは、DNA分子の正確なサイズ測定及び分離を可能にすることができた。負の選択のための別の方法は、配列決定データのバイオインフォマティックス分析中にインシリコでこれを行うことである。
【0220】
血漿中の他のDNA種、例えば、腫瘍DNA(Vlassov VV et al.,Curr Mol Med 2010;10:142−165)、及び移植された臓器DNA(Lo YMD et al,Lancet 1998;351:1329−1330)はまた、母親の血漿中の胎児DNAとこのような特徴を共有することが期待されるため、上記の(1)と(2)に列挙された戦略は、これらのDNA種の富化について用いることができた。
【0221】
一態様によれば、ヌクレオソームのリンカー断片の標的を介して、ヒト血漿又は血清におけるDNA種の異なる富化の方法が提供される。一態様では、この富化は、以下の母親誘導DNA又は造血細胞由来のDNAの1つを除くことによってなされる。別の態様では、標的化は、ヌクレオソームのリンカー断片のタンパク質又は核酸コンポーネントに選択的に結合する試薬(例えば、抗体又は別のタイプのタンパク質)を伴う。別の態様では、標的化試薬は、ヌクレオソームのリンカー断片に結合するヒストンH1又は別のタンパク質に選択的に結合する。別の態様では、標的化試薬は、ヌクレオソームのリンカー断片に結合するヒストンH1又は別のタンパク質の母親又は血液学的な改変体に結合する。一態様では、そのDNAの除去は、免疫沈降又は固体表面への結合によって実施される。
【0222】
別の態様によれば、母親の血漿又は血清における胎児DNAの異なる富化の方法は、(a)ヌクレオソームのリンカー断片の1以上のコンポーネントに結合する抗体の使用;(b)免疫沈降又は固体表面への捕捉による結合された断片の除去;及び(c)胎児DNAの画分濃度の増加を含む未結合画分の回収を含む。
【0223】
本明細書において記載されている任意のソフトウェア・コンポーネント又はソフトウェア関数は、任意の適切なコンピュータ言語、例えばJava、C++又はPerlを使用して、例えば従来の又はオブジェクト指向の技術を使用するプロセッサーによって実行されるソフトウェアコードとして実行され得る。ソフトウェアコードは、記憶及び/又は送信のためのコンピュータ読み取り可能媒体、ランダムアクセスメモリー(RAM)、読み取り専用メモリー(ROM)、磁気媒体、例えばハードドライブ若しくはフロッピーディスク、又は光学媒体、例えばコンパクトディスク(CD)若しくはDVD(デジタル多用途ディスク)、フラッシュメモリーなどを含む好ましい媒体における、一連の指令又はコマンドとして蓄積され得る。コンピュータ読み取り可能媒体は、かかる記憶又は送信装置の任意の組み合わせであり得る。
【0224】
また、このようなプログラムは、コード化され、インターネットを含む種々のプロトコールに適合する有線、光、及び/又は無線ネットワークを経由した送信のために適用されるキャリアー信号を使用して送信され得る。したがって、本発明の態様のコンピュータ読み取り可能媒体は、このようなプログラムでコード化されたデータ信号を使用して作られ得る。プログラムコードでコード化されたコンピュータ読み取り可能媒体は、互換性のあるデバイスとともにパッケージされるか、又は他のデバイスからは分離して(例えばインターネットダウンロードを通じて)提供され得る。任意のこのようなコンピュータ読み取り可能媒体は、単一のコンピュータプログラム製品(例えばハードドライブ若しくは全コンピュータシステム)上に又はその中に装備されてもよく、システム若しくはネットワーク内における異なるコンピュータプログラム製品上若しくはその中に存在してもよい。コンピュータシステムは、ユーザーに本明細書において言及された任意の結果を提供するためのモニター、プリンター、又は他の好ましいディスプレイを含んでもよい。
【0225】
コンピュータシステムの例を
図43に示す。
図43に示されたサブシステムは、システムバス975を通じて相互接続される。更なるサブシステム、例えばプリンター4374、キーボード4378、固定ディスク4379、ディスプレイアダプター4382と連結されたモニター4376、及びその他のものが示される。I/Oコントローラー4371と連結する、周辺機器及び入力/出力(I/O)装置は、当技術分野において既知である任意の数の手段、例えばシリアルポート4377によってコンピュータシステムと接続され得る。例えば、シリアルポート4377又は外部インターフェース4381は、コンピュータ装置をインターネットのような広域ネットワーク、マウス入力装置、又はスキャナーと接続するために使用され得る。システムバス経由の相互接続により、セントラルプロセッサ4373を個々のサブシステムと通信させ、システムメモリー4372又は固定ディスク4379からの指示の実行、及びサブシステム間の情報の交換をさせることが可能である。システムメモリー4372及び/又は固定ディスク4379は、コンピュータ読み取り可能媒体を具現化し得る。本明細書に言及されている値のいずれkは、1つのコンポーネントから別のコンポーネントに出力することができ、ユーザーに出力することができる。
【0226】
コンピュータシステムは、例えば、外部インターフェース4381又は内部インターフェースによってともに連結される、複数の同じコンポーネント又はサブシステムを含むことができる。いくつかの態様では、コンピュータシステム、サブシステム、又は装置はネットワークを介して通信され得る。このような例において、1つのコンピュータがクライアントであり、別のコンピュータがサーバーであると考えることができ、その場合、各々は同じコンピュータシステムの一部であり得る。クライアント及びサーバーは、各々、多数のシステム、サブシステム、又はコンポーネントを含むことができる。
【0227】
特定の態様の特定の詳細は、任意の方法で組み合わせることができ、又は本発明の態様の精神及び範囲から逸脱することなしに、本明細書に示され、又は記載されたものから変更することができる。
【0228】
本発明の例示的態様の上記記載は、例証及び説明の目的のために存在する。記載された明確な形態に本発明を網羅する、又は限定することは意図されておらず、そして多くの変更及び変形は、上記教示の観点において可能である。該態様は、本発明の原理、並びにそれにより他の当業者が本発明を種々の実施形態で本発明を最もよく利用することができるように、意図された特定の使用に好適である種々の変形を有する、その実用的な利用を最もよく説明するために選択かつ記載された。
【0229】
本明細書において引用された全ての出願、特許及び特許出願は、全ての目的のために、それら全体で参照により本明細書に援用される。