特表2024-533114 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ナテラ，　インコーポレイテッドの特許一覧

特表2024-533114非侵襲性出生前検査のための方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-09-12

(54)【発明の名称】非侵襲性出生前検査のための方法

(51)【国際特許分類】

C12Q 1/6844 20180101AFI20240905BHJP

C12N 15/10 20060101ALN20240905BHJP

C12Q 1/6869 20180101ALN20240905BHJP

【ＦＩ】

C12Q1/6844 Z

C12N15/10 100Z

C12Q1/6869 Z

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2024513727

(86)(22)【出願日】2022-08-24

(85)【翻訳文提出日】2024-04-26

(86)【国際出願番号】 US2022041323

(87)【国際公開番号】W WO2023034090

(87)【国際公開日】2023-03-09

(31)【優先権主張番号】63/239,901

(32)【優先日】2021-09-01

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

(71)【出願人】

【識別番号】513156537

【氏名又は名称】ナテラ，インコーポレイテッド

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100117019

【弁理士】

【氏名又は名称】渡辺陽一

(74)【代理人】

【識別番号】100141977

【弁理士】

【氏名又は名称】中島勝

(74)【代理人】

【識別番号】100138210

【弁理士】

【氏名又は名称】池田達則

(72)【発明者】

【氏名】ザチャリーデムコ

(72)【発明者】

【氏名】マシューラビノビッツ

(72)【発明者】

【氏名】ジョージゲメロス

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA19

4B063QQ03

4B063QQ42

4B063QR08

4B063QR42

4B063QR62

4B063QS25

4B063QS34

4B063QX02

(57)【要約】

本開示は、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を特定するのに有用な妊婦の血液サンプルに由来する増幅されたＤＮＡの調製物を調製する方法であって、（ａ）血液サンプルから無細胞ＤＮＡを抽出することと、（ｂ）単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために抽出されたＤＮＡに対して標的化多重増幅を行うことと、（ｃ）増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することであって、２．８％未満の胎児画分及び／又は１つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を示す、決定することとを含む、方法を提供する。
【選択図】なし

【特許請求の範囲】

【請求項1】

早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を特定するのに有用な妊婦の第１の血液サンプル又はその画分に由来する増幅されたＤＮＡの調製物を調製する方法であって、
（ａ）前記第１の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第１の抽出ＤＮＡを得ることと、
（ｂ）増幅されたＤＮＡの第１の調製物を、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために前記第１の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、前記２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、
（ｃ）前記増幅されたＤＮＡの前記第１の調製物を、前記増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、前記配列リードを使用して、前記１つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、２．８％未満の胎児画分及び／又は前記１つ以上の目的の染色体の前記倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法。

【請求項2】

（ｄ）前記妊婦の長期的に収集された第２の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第２の抽出されたＤＮＡを得ることと、
（ｅ）増幅されたＤＮＡの第２の調製物を、単一の反応体積において前記２００～２０，０００個のＳＮＰ遺伝子座を増幅するために前記第２の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、前記２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、
（ｆ）前記増幅されたＤＮＡの前記第２の調製物を、前記増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、前記配列リードを使用して、前記１つ以上の目的の染色体の前記倍数性状態を決定することによって分析することであって、前記第１及び第２の血液サンプルの各々について、２．８％未満の胎児画分及び／又は前記１つ以上の目的の染色体の前記倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を更に示す、分析することとを更に含む、請求項１に記載の方法。

【請求項3】

前記第１及び第２の血液サンプルの各々について、前記１つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも４０％の３７週前の早産、子癇前症、及び／又は胎児発育遅延のリスクを有すると特定することを更に含む、請求項２に記載の方法。

【請求項4】

前記第１及び第２の血液サンプルの各々について、前記１つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも５０％の３７週前の早産、子癇前症、及び／又は胎児発育遅延のリスクを有すると特定することを更に含む、請求項２に記載の方法。

【請求項5】

前記第１及び第２の血液サンプルの各々について、前記１つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも１５％の子癇前症のリスクを有すると特定することを更に含む、請求項２に記載の方法。

【請求項6】

前記第１及び第２の血液サンプルの各々について、前記１つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも２０％の２８週前の早産のリスクを有すると特定することを更に含む、請求項２に記載の方法。

【請求項7】

前記第１及び第２の血液サンプルの各々について、前記１つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも２５％の３４週前の早産のリスクを有すると特定することを更に含む、請求項２に記載の方法。

【請求項8】

前記第１及び第２の血液サンプルの各々について、前記１つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも４０％の３７週前の早産のリスクを有すると特定することを更に含む、請求項２に記載の方法。

【請求項9】

前記第１及び第２の血液サンプルの各々について、前記１つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも１０％の胎児発育遅延のリスクを有すると特定することを更に含む、請求項２に記載の方法。

【請求項10】

前記第１及び第２の血液サンプルの各々について、２．５％未満の胎児画分を有する妊婦を特定することを更に含む、請求項２に記載の方法。

【請求項11】

長期的に収集された第３の血液サンプル又はその画分について工程（ｄ）～（ｆ）を繰り返すことを更に含む、請求項２に記載の方法。

【請求項12】

工程（ａ）が、前記血液サンプルの血漿画分から無細胞ＤＮＡを抽出することを含む、請求項１～１１のいずれか一項に記載の方法。

【請求項13】

工程（ｂ）が、２００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又はユニバーサルプライマー及び２００～２０，０００個の標的特異的プライマーを使用する、２００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む、請求項１～１２のいずれか一項に記載の方法。

【請求項14】

工程（ｂ）が、１，０００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又はユニバーサルプライマー及び１，０００～２０，０００個の標的特異的プライマーを使用する、１，０００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む、請求項１～１２のいずれか一項に記載の方法。

【請求項15】

工程（ｂ）が、５，０００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又はユニバーサルプライマー及び５，０００～２０，０００個の標的特異的プライマーを使用する、５，０００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む、請求項１～１２のいずれか一項に記載の方法。

【請求項16】

工程（ｂ）における前記増幅されたＤＮＡが、各々、前記抽出されたＤＮＡから増幅される１００ｂｐ以下を含む、請求項１～１５のいずれか一項に記載の方法。

【請求項17】

工程（ｂ）における前記増幅されたＤＮＡが、各々、前記抽出されたＤＮＡから増幅される８０ｂｐ以下を含む、請求項１～１５のいずれか一項に記載の方法。

【請求項18】

工程（ｂ）における前記増幅されたＤＮＡが、各々、前記抽出されたＤＮＡから増幅される６０～８０ｂｐを含む、請求項１～１５のいずれか一項に記載の方法。

【請求項19】

工程（ｂ）が、前記標的化多重増幅の後のバーコードＰＣＲを更に含む、請求項１～１８のいずれか一項に記載の方法。

【請求項20】

前記１つ以上の目的の染色体の前記倍数性状態が、前記配列リードに基づいて前記ＳＮＰ遺伝子座で対立遺伝子数を計算することと、前記目的の染色体の異なる可能な倍数性状態に各々関連する複数の倍数性仮説を作成することと、各倍数性仮説について前記目的の染色体上の前記ＳＮＰ遺伝子座での予測される前記対立遺伝子数の結合分布モデルを構築することと、前記結合分布モデル及び前記対立遺伝子数を使用して、前記倍数性仮説の各々の相対確率を決定することと、最大確率を有する前記仮説に対応する前記倍数性状態を選択することによって、前記胎児の前記倍数性状態をコールすることと、によって決定される、請求項１～１９のいずれか一項に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０２１年９月１日に出願された米国仮特許出願第６３／２３９，９０１号の優先権及び利益を主張し、その全体が参照により本明細書に組み込まれる。

【背景技術】

【0002】

異数性リスクを特定するだけでなく、早産、子癇前症、胎児発育遅延、自然流産、及び非生児出生などの他の有害な周産期転帰の高いリスクを有する妊娠を特定することができる非侵襲性出生前検査方法が必要とされている。

【発明の概要】

【0003】

本開示の一態様は、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を特定するのに有用な妊婦の第１の血液サンプル又はその画分に由来する増幅されたＤＮＡの調製物を調製する方法であって、（ａ）第１の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第１の抽出されたＤＮＡを得ることと、（ｂ）増幅されたＤＮＡの第１の調製物を、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために第１の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、（ｃ）増幅されたＤＮＡの第１の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、２．８％未満の胎児画分及び／又は１つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。

【0004】

本開示の別の態様は、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を特定するのに有用な増幅されたＤＮＡの調製物を調製する方法であって、（ａ）妊婦の第１の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第１の抽出されたＤＮＡを得ることと、（ｂ）増幅されたＤＮＡの第１の調製物を、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために第１の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、（ｃ）増幅されたＤＮＡの第１の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することと、（ｄ）妊婦の長期的に収集された第２の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第２の抽出されたＤＮＡを得ることと、（ｅ）増幅されたＤＮＡの第２の調製物を、第２の抽出されたＤＮＡに対して標的化多重増幅を行うことによって調製して、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅して、増幅されたＤＮＡを得ることであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体に位置する、調製することと、（ｆ）増幅されたＤＮＡの第２の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第１及び第２の血液サンプルの各々について、２．８％未満の胎児画分及び／又は１つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。

【0005】

本開示の別の態様は、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を特定するのに有用な増幅されたＤＮＡの調製物を調製する方法であって、（ａ）妊婦の第１の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第１の抽出されたＤＮＡを得ることと、（ｂ）増幅されたＤＮＡの第１の調製物を、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために第１の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、（ｃ）増幅されたＤＮＡの第１の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することと、（ｄ）妊婦の長期的に収集された第２の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第２の抽出されたＤＮＡを得ることと、（ｅ）増幅されたＤＮＡの第２の調製物を、第２の抽出されたＤＮＡに対して標的化多重増幅を行うことによって調製して、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅して、増幅されたＤＮＡを得ることであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体に位置する、調製することと、（ｆ）増幅されたＤＮＡの第２の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第１及び第２の血液サンプルの各々について、２．８％未満、若しくは２．７％未満、若しくは２．６％未満、若しくは２．５％未満、若しくは２．４％未満、若しくは２．３％未満、若しくは２．２％未満、若しくは２．１％未満、若しくは２．０％未満の胎児画分が、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。いくつかの実施形態において、胎児画分は、配列リードを用いて定量される。いくつかの実施形態において、胎児画分は、メチル化ベースの多重ｄｄＰＣＲを用いて定量される。いくつかの実施形態において、胎児画分は、フラグメントの長さ及びフラグメントの数を用いて定量される。

【0006】

本開示の更なる態様は、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を特定するのに有用な増幅されたＤＮＡの調製物を調製する方法であって、（ａ）妊婦の第１の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第１の抽出されたＤＮＡを得ることと、（ｂ）増幅されたＤＮＡの第１の調製物を、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために第１の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、（ｃ）増幅されたＤＮＡの第１の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することと、（ｄ）妊婦の長期的に収集された第２の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第２の抽出されたＤＮＡを得ることと、（ｅ）増幅されたＤＮＡの第２の調製物を、第２の抽出されたＤＮＡに対して標的化多重増幅を行うことによって調製して、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅して、増幅されたＤＮＡを得ることであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体に位置する、調製することと、（ｆ）増幅されたＤＮＡの第２の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。

【発明を実施するための形態】

【0007】

ＰＣＴ／ＵＳ２０１０／０５０８２４として２０１０年９月３０日に出願されたＷＯ２０１１／０４１４８５は、その全体が参照により本明細書に組み込まれる。ＰＣＴ／ＵＳ２０１１／０３７０１８として２０１１年５月１８日に出願されたＷＯ２０１１／１４６６３２は、その全体が参照により本明細書に組み込まれる。ＰＣＴ／ＵＳ２０１１／０６１５０６として２０１１年１１月１８日に出願されたＷＯ２０１２／１０８９２０は、その全体が参照により本明細書に組み込まれる。ＰＣＴ／ＵＳ２０１１／０６６９３８として２０１１年１２月２２日に出願されたＷＯ２０１２／０８８４５６は、その全体が参照により本明細書に組み込まれる。ＰＣＴ／ＵＳ２０１２／０６６３３９として２０１２年１１月２１日に出願されたＷＯ２０１４／０１８０８０は、その全体が参照により本明細書に組み込まれる。ＰＣＴ／ＵＳ２０１３／０５５２０５として２０１３年８月１５日に出願されたＷＯ２０１４／０２８７７８は、その全体が参照により本明細書に組み込まれる。ＰＣＴ／ＵＳ２０１５／０２６９５７として２０１５年４月２１日に出願されたＷＯ２０１５／１６４４３２は、その全体が参照により本明細書に組み込まれる。ＰＣＴ／ＵＳ２０１６／０３１６８６として２０１６年５月１０日に出願されたＷＯ２０１６／１８３１０６は、その全体が参照により本明細書に組み込まれる。ＵＳ１５／１８６，７７４として２０１６年６月２０日に出願されたＵＳ２０１６／０３７１４２８は、その全体が参照により本明細書に組み込まれる。ＵＳ１５／８８７，８６４として２０１８年２月２日に出願されたＵＳ２０１８／０１７３８４５は、その全体が参照により本明細書に組み込まれる。

【0008】

早産、子癇前症、及び／又は胎児発育遅延の高いリスクを有する妊娠を特定するのに有用な妊婦の第１の血液サンプル又はその画分に由来する増幅されたＤＮＡの調製物を調製する方法であって、（ａ）第１の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第１の抽出されたＤＮＡを得ることと、（ｂ）増幅されたＤＮＡの第１の調製物を、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために第１の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、（ｃ）増幅されたＤＮＡの第１の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、第１の血液サンプル又はその画分における胎児画分を定量して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、２．８％未満の胎児画分及び／又は１つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、及び／又は胎児発育遅延の高いリスクを有する妊娠を示す、分析することとを含む、方法が本明細書に開示される。

【0009】

いくつかの実施形態において、本方法は、（ｄ）妊婦の長期的に収集された第２の血液サンプル又はその画分から無細胞ＤＮＡを抽出して、母体無細胞ＤＮＡ及び胎児無細胞ＤＮＡを含む第２の抽出されたＤＮＡを得ることと、（ｅ）増幅されたＤＮＡの第２の調製物を、単一の反応体積において２００～２０，０００個のＳＮＰ遺伝子座を増幅するために第２の抽出されたＤＮＡに対して標的化多重増幅を行って、増幅されたＤＮＡを得ることによって調製することであって、２００～２０，０００個のＳＮＰ遺伝子座が、１つ以上の目的の染色体上に位置する、調製することと、（ｆ）増幅されたＤＮＡの第２の調製物を、増幅されたＤＮＡに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、１つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第１及び第２の血液サンプルの各々について、２．８％未満の胎児画分及び／又は１つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生の高いリスクを有する妊娠を更に示す、分析することとを更に含む。

【0010】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも３０％、又は少なくとも３５％、又は少なくとも４０％、又は少なくとも４５％、又は少なくとも５０％の３７週前の早産、子癇前症、及び／又は胎児発育遅延のリスクを有すると特定することを更に含む。

【0011】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも３０％、又は少なくとも３５％、又は少なくとも４０％、又は少なくとも４５％、又は少なくとも５０％の３７週前の早産、子癇前症、死産、及び／又は胎児発育遅延のリスクを有すると特定することを更に含む。

【0012】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも１２％、又は少なくとも１３％、又は少なくとも１４％、又は少なくとも１５％、又は少なくとも１６％、又は少なくとも１７％、又は少なくとも１８％の子癇前症のリスクを有すると特定することを更に含む。

【0013】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも１０％、又は少なくとも１２％、又は少なくとも１４％、又は少なくとも１６％、又は少なくとも１８％、又は少なくとも２０％、又は少なくとも２２％の２８週前の早産のリスクを有すると特定することを更に含む。

【0014】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも１６％、又は少なくとも１８％、又は少なくとも２０％、又は少なくとも２２％、又は少なくとも２４％、又は少なくとも２６％、又は少なくとも２８％の３４週前の早産のリスクを有すると特定することを更に含む。

【0015】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも２４％、又は少なくとも２８％、又は少なくとも３２％、又は少なくとも３６％、又は少なくとも４０％、又は少なくとも４４％の３７週前の早産のリスクを有すると特定することを更に含む。

【0016】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、１つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも１０％、又は少なくとも１０．５％、又は少なくとも１１％、又は少なくとも１１．５％、又は少なくとも１２％、又は少なくとも１２．５％、又は少なくとも１３％、又は少なくとも１３．５％の胎児発育遅延のリスクを有すると特定することを更に含む。

【0017】

いくつかの実施形態において、胎児画分は、配列リードを用いて定量される。いくつかの実施形態において、胎児画分は、メチル化ベースの多重ｄｄＰＣＲを用いて定量される。いくつかの実施形態において、胎児画分は、フラグメントの長さ及びフラグメントの数を用いて定量される。

【0018】

いくつかの実施形態において、本方法は、第１の血液サンプルについて、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を特定することを含む。いくつかの実施形態において、本方法は、第２の血液サンプルについて、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を特定することを含む。いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を特定することを含む。

【0019】

いくつかの実施形態において、本方法は、第１の血液サンプルについて、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。いくつかの実施形態において、本方法は、第２の血液サンプルについて、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。

【0020】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を、子癇前症の高いリスク（例えば、少なくとも１２％、又は少なくとも１３％、又は少なくとも１４％、又は少なくとも１５％、又は少なくとも１６％、又は少なくとも１７％、又は少なくとも１８％の子癇前症のリスク）を有するものとして特定することを含む。

【0021】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、子癇前症の高いリスク（例えば、少なくとも１２％、又は少なくとも１３％、又は少なくとも１４％、又は少なくとも１５％、又は少なくとも１６％、又は少なくとも１７％、又は少なくとも１８％の子癇前症のリスク）を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。

【0022】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を、２８週前の早産の高いリスク（例えば、少なくとも１０％、又は少なくとも１２％、又は少なくとも１４％、又は少なくとも１６％、又は少なくとも１８％、又は少なくとも２０％、又は少なくとも２２％の２８週前の早産のリスク）を有するものとして特定することを含む。

【0023】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、２８週前の早産の高いリスク（例えば、少なくとも１０％、又は少なくとも１２％、又は少なくとも１４％、又は少なくとも１６％、又は少なくとも１８％、又は少なくとも２０％、又は少なくとも２２％の２８週前の早産のリスク）を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。

【0024】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を、３４週間前の早産の高いリスク（例えば、少なくとも１６％、又は少なくとも１８％、又は少なくとも２０％、又は少なくとも２２％、又は少なくとも２４％、又は少なくとも２６％、又は少なくとも２８％の３４週間前の早産のリスク）を有するものとして特定することを含む。

【0025】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、３４週前の早産の高いリスク（例えば、少なくとも１６％、又は少なくとも１８％、又は少なくとも２０％、又は少なくとも２２％、又は少なくとも２４％、又は少なくとも２６％、又は少なくとも２８％の３４週前の早産のリスク）を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。

【0026】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を、３７週前の早産の高いリスク（例えば、少なくとも２４％、又は少なくとも２８％、又は少なくとも３２％、又は少なくとも３６％、又は少なくとも４０％、又は少なくとも４４％の３７週前の早産のリスク）を有するものとして特定することを含む。

【0027】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、３７週前の早産の高いリスク（例えば、少なくとも２４％、又は少なくとも２８％、又は少なくとも３２％、又は少なくとも３６％、又は少なくとも４０％、又は少なくとも４４％の３７週前の早産のリスク）を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。

【0028】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、２．８％未満、又は２．７％未満、又は２．６％未満、又は２．５％未満、又は２．４％未満、又は２．３％未満、又は２．２％未満、又は２．１％未満、又は２．０％未満の胎児画分を有する妊婦を、胎児発育遅延の高いリスク（例えば、少なくとも１０％、又は少なくとも１０．５％、又は少なくとも１１％、又は少なくとも１１．５％、又は少なくとも１２％、又は少なくとも１２．５％、又は少なくとも１３％、又は少なくとも１３．５％の胎児発育遅延のリスク）を有するものとして特定することを含む。

【0029】

いくつかの実施形態において、本方法は、第１及び第２の血液サンプルの各々について、３パーセンタイル未満、又は２パーセンタイル未満、又は１パーセンタイル未満、又は０．５パーセンタイル未満、又は０．２パーセンタイル未満、又は０．１パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、胎児発育遅延の高いリスク（例えば、少なくとも１０％、又は少なくとも１０．５％、又は少なくとも１１％、又は少なくとも１１．５％、又は少なくとも１２％、又は少なくとも１２．５％、又は少なくとも１３％、又は少なくとも１３．５％の胎児発育遅延のリスク）を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。

【0030】

いくつかの実施形態において、本方法は、異常に高い胎児画分を有するサンプルを特定することを含む。

【0031】

いくつかの実施形態において、本方法は、アルゴリズムの一部としてｃｆＤＮＡフラグメントの詳細を使用して、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生を予測することを含む。いくつかの実施形態において、本方法は、フラグメントの長さを使用して、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生を予測することを含む。いくつかの実施形態において、本方法は、ゲノム内の位置又は開始点及び停止点などのフラグメントの詳細を使用して、早産、子癇前症、胎児発育遅延、自然流産、及び／又は非生児出生を予測することを含む。

【0032】

いくつかの実施形態において、本方法は、長期的に収集された第３、第４、又は更なる血液サンプル又はその画分について工程（ｄ）～（ｆ）を繰り返すことを更に含む。

【0033】

いくつかの実施形態において、工程（ａ）は、血液サンプルの血漿画分から無細胞ＤＮＡを抽出することを含む。いくつかの実施形態において、工程（ａ）は、抽出されたＤＮＡに少なくとも１つのアダプターをライゲーションすることを更に含み、アダプターは、ユニバーサルプライミング配列を含む。いくつかの実施形態において、工程（ａ）は、ユニバーサルプライミング配列に結合する少なくとも１つのプライマーを使用してユニバーサルＰＣＲ増幅を行うことを更に含む。

【0034】

いくつかの実施形態において、工程（ｂ）は、１つの反応混合物において２００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又は１つの反応混合物においてユニバーサルプライマー及び２００～２０，０００の個標的特異的プライマーを使用する、２００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む。いくつかの実施形態において、工程（ｂ）は、１つの反応混合物において５００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又は１つの反応混合物においてユニバーサルプライマー及び５００～２０，０００の標的特異的プライマーを使用する、５００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む。いくつかの実施形態において、工程（ｂ）は、１つの反応混合物において１，０００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又は１つの反応混合物においてユニバーサルプライマー及び１，０００～２０，０００個の標的特異的プライマーを使用する、１，０００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む。いくつかの実施形態において、工程（ｂ）は、１つの反応混合物において２，０００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又は１つの反応混合物においてユニバーサルプライマー及び２，０００～２０，０００の標的特異的プライマーを使用する、２，０００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む。いくつかの実施形態において、工程（ｂ）は、１つの反応混合物において５，０００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又は１つの反応混合物においてユニバーサルプライマー及び５，０００～２０，０００個の標的特異的プライマーを使用する、５，０００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む。いくつかの実施形態において、工程（ｂ）は、１つの反応混合物において１０，０００～２０，０００対の標的特異的ＰＣＲプライマーを使用する、又は１つの反応混合物においてユニバーサルプライマー及び１０，０００～２０，０００の標的特異的プライマーを使用する、１０，０００～２０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む。いくつかの実施形態において、工程（ｂ）は、１つの反応混合物において２０，０００～５０，０００対の標的特異的ＰＣＲプライマーを使用する、又は１つの反応混合物においてユニバーサルプライマー及び２０，０００～５０，０００の標的特異的プライマーを使用する、２０，０００～５０，０００個のＳＮＰ遺伝子座のＰＣＲ増幅を含む。

【0035】

いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、各々、抽出されたＤＮＡから増幅される１００ｂｐ以下を含む。いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、各々、抽出されたＤＮＡから増幅される９０ｂｐ以下を含む。いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、各々、抽出されたＤＮＡから増幅される８０ｂｐ以下を含む。いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、各々、抽出されたＤＮＡから増幅される８０ｂｐ以下を含む。いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、各々、抽出されたＤＮＡから増幅される７０ｂｐ以下を含む。いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、各々、抽出されたＤＮＡから増幅される５０～１００ｂｐを含む。いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、各々、抽出されたＤＮＡから増幅される６０～８０ｂｐを含む。いくつかの実施形態において、工程（ｂ）における増幅されたＤＮＡは、それぞれ、抽出されたＤＮＡから増幅される６５～８０ｂｐを含む。

【0036】

いくつかの実施形態において、工程（ｂ）は、標的化多重増幅の後のバーコードＰＣＲを更に含む。いくつかの実施形態において、バーコードＰＣＲは、サンプル特異的バーコード又はサンプル特異的識別子配列を導入する。いくつかの実施形態において、バーコードＰＣＲは、その後の高スループット配列決定のための配列決定タグを導入する。

【0037】

いくつかの実施形態において、１つ以上の目的の染色体の倍数性状態は、配列リードに基づいてＳＮＰ遺伝子座で対立遺伝子数を計算することと、目的の染色体の異なる可能な倍数性状態に各々関連する複数の倍数性仮説を作成することと、各倍数性仮説について目的の染色体上のＳＮＰ遺伝子座での予測される対立遺伝子数の結合分布モデルを構築することと、結合分布モデル及び対立遺伝子数を使用して、倍数性仮説の各々の相対確率を決定することと、最大確率を有する仮説に対応する倍数性状態を選択することによって、胎児の倍数性状態をコールすることと、によって決定される。

【0038】

一実施形態において、本開示は、ＤＮＡの混合サンプル（すなわち、胎児の母親からのＤＮＡ、及び胎児からのＤＮＡ）から測定される遺伝子型データから、並びに任意選択で、母親から、及び場合によっては父親からの遺伝物質のサンプルから測定される遺伝子型データから、妊娠中の胎児の染色体の倍数性状態を決定するためのエクスビボ方法を提供し、決定は、結合分布モデルを使用して、親遺伝子型データを与えられた異なる可能性のある胎児の倍数性状態についての予測される対立遺伝子分布のセットを作成し、予測される対立遺伝子分布を混合サンプルで測定される実際の対立遺伝子分布と比較し、予測される対立遺伝子分布パターンが観察された対立遺伝子分布パターンと最も近い一致する倍数性状態を選択することによって行われる。一実施形態において、混合サンプルは、母体血液、又は母親の血清若しくは血漿に由来する。一実施形態において、ＤＮＡの混合サンプルは、複数の多型遺伝子座で優先的に濃縮されてもよい。一実施形態において、優先的濃縮は、対立遺伝子バイアスを最小限に抑える方法で行われる。一実施形態において、本開示は、対立遺伝子バイアスが低くなるように、複数の遺伝子座で優先的に濃縮されたＤＮＡの組成物に関する。一実施形態において、対立遺伝子の分布（複数可）は、混合サンプルからのＤＮＡを配列決定することによって測定される。一実施形態において、結合分布モデルは、対立遺伝子が二項式で分布すると仮定する。一実施形態において、予測される結合対立遺伝子分布のセットは、例えば、国際ＨａｐＭａｐコンソーシアムからのデータを使用して、様々なソースからの既存の組換え頻度を考慮しながら、遺伝的に連結された遺伝子座のために作成される。

【0039】

一実施形態において、本開示は、非侵襲性出生前診断（ＮＰＤ）、具体的には、ＤＮＡ混合物上で測定された遺伝子型データ中の複数の多型遺伝子座における対立遺伝子の測定値を観察することによって胎児の異数性の状態を決定する方法を提供し、特定の対立遺伝子の測定値は、異数体の胎児を示すが、他の対立遺伝子の測定値は、正倍数体の胎児を示す。一実施形態において、遺伝子型データは、母体血漿に由来するＤＮＡ混合物を配列決定することによって測定される。一実施形態において、ＤＮＡサンプルは、対立遺伝子分布が計算されている複数の遺伝子座に対応するＤＮＡの分子で優先的に濃縮されてもよい。一実施形態において、母親からの遺伝物質のみ又はほぼのみを含むＤＮＡのサンプル、及び場合によってはまた、父親からの遺伝物質のみ又はほぼのみを含むＤＮＡのサンプルを測定する。一実施形態において、推定される胎児画分と共に、一方又は両方の親の遺伝子測定値を使用して、胎児の異なる可能性のある基礎となる遺伝子状態に対応する複数の予測される対立遺伝子分布を作成し、予測される対立遺伝子分布は、仮説と呼ばれ得る。一実施形態において、母親の遺伝子データは、本質的に排他的又はほぼ排他的である遺伝物質を測定することによって決定されるのではなく、むしろ、母親及び胎児のＤＮＡの混合物を含む母体血漿上で行われた遺伝子測定値から推定される。いくつかの実施形態において、仮説は、１つ以上の染色体での胎児の倍数性を含んでもよく、その染色体のどのセグメントが、どの親からの胎児のどの染色体が遺伝したか、及びそれらの組み合わせを含んでもよい。いくつかの実施形態において、胎児の倍数性状態は、観察された対立遺伝子の測定値を、少なくともいくつかの仮説が異なる倍数性状態に対応する異なる仮説と比較し、観察された対立遺伝子の測定値を考慮して、最も当てはまる可能性が高い仮説に対応する倍数性状態を選択することによって決定される。一実施形態において、この方法は、遺伝子座がホモ接合性であるかヘテロ接合性であるかにかかわらず、いくつか又は全ての測定されたＳＮＰからの対立遺伝子測定データを使用することを伴い、したがって、ヘテロ接合性のみである遺伝子座での対立遺伝子の使用を伴わない。この方法は、遺伝子データが１つの多型遺伝子座のみに関連する状況には適していない可能性がある。この方法は、遺伝子データが、標的染色体についての１０を超える多型遺伝子座又は２０を超える多型遺伝子座のデータを含む場合に特に有利である。この方法は、遺伝子データが、標的染色体について５０を超える多型遺伝子座、標的染色体について１００を超える多型遺伝子座又は２００を超える多型遺伝子座のデータを含む場合に特に有利である。いくつかの実施形態において、遺伝子データは、標的染色体についての５００を超える多型遺伝子座、標的染色体についての１，０００を超える多型遺伝子座、２，０００を超える多型遺伝子座、又は５，０００を超える多型遺伝子座についてのデータを含み得る。

【0040】

一実施形態において、本明細書に開示される方法は、多型遺伝子座のセットからの各多型遺伝子座においてＤＮＡの元のサンプル中に存在する相対的な対立遺伝子頻度を保存する選択的濃縮技術を使用する。いくつかの実施形態において、増幅及び／又は選択的な濃縮技術は、ＰＣＲ（例えば、ライゲーション媒介ＰＣＲ）、ハイブリダイゼーションによるフラグメントの捕捉、分子反転プローブ又は他の環状化プローブを伴っていてもよい。いくつかの実施形態において、増幅又は選択的な濃縮のための方法は、標的配列に正しくハイブリダイゼーションすると、ヌクレオチドプローブの３’末端又は５’末端が少数のヌクレオチドによって対立遺伝子の多型部位から分離されるプローブを用いることを伴っていてもよい。この分離は、対立遺伝子バイアスと呼ばれる１つの対立遺伝子の優先的増幅を減らす。これは、正しくハイブリダイズされたプローブの３’末端又は５’末端が、対立遺伝子の多型部位に直接隣接しているか、又は非常に近い位置にあるプローブを用いることを伴う方法の改善である。一実施形態において、ハイブリダイズする領域が多型部位を含有し得るか、又は確実に含有するプローブは除外される。ハイブリダイゼーション部位にある多型部位は、一部の対立遺伝子において不均等なハイブリダイゼーションを引き起こし、又はハイブリダイゼーションを完全に阻害する場合があり、特定の対立遺伝子の優先的増幅をもたらす場合がある。これらの実施形態は、各多型遺伝子座でサンプルの元々の対立遺伝子頻度をより良好に保存するという点で、標的化増幅及び／又は選択的な濃縮を伴う他の方法の改善であり、サンプルは、単一の個体又は個体の混合からの純粋なゲノムサンプルである

【0041】

一実施形態において、本明細書に開示される方法は、高効率な高度に多重化された標的化ＰＣＲを使用してＤＮＡを増幅し、その後、高スループット配列決定によって、各標的遺伝子座での対立遺伝子頻度を決定する。得られた配列リードのほとんどが標的遺伝子座に対してマッピングするような方法で１つの反応中に約５０個又は１００個より多いＰＣＲプライマーを多重化する能力は、新規であり、非自明である。高度に多重化された標的化ＰＣＲを高効率な方法で行うことを可能にする１つの技術は、互いにハイブリダイズする可能性が低いプライマーを設計することを伴う。ＰＣＲプローブは、典型的にはプライマーと呼ばれ、少なくとも５００、少なくとも１，０００、少なくとも５，０００、少なくとも１０，０００、少なくとも２０，０００、少なくとも５０，０００、又は少なくとも１００，０００の潜在的なプライマー対との間の潜在的に有害な相互作用又はプライマーとサンプルＤＮＡとの間の意図していない相互作用の熱力学的モデルを作成し、次いで、このモデルを用いて、プール中の他の設計と不適合な設計を除外することによって選択される。高度に多重化された標的化ＰＣＲを高効率な方法で行うことを可能にする別の技術は、標的化ＰＣＲに対して、部分的又は完全なネスティング手法を用いることである。これらの手法の１つ又は組み合わせを用いることで、単一のプールにおいて、少なくとも３００、少なくとも８００、少なくとも１，２００、少なくとも４，０００又は少なくとも１０，０００個のプライマーの多重化が可能になり、得られた大部分のＤＮＡを含む増幅ＤＮＡは、配列決定されると、標的遺伝子座にマッピングする。これらの手法の１つ又は組み合わせを用いることで、単一のプールにおいて多数のプライマーの多重化が可能になり、得られた増幅されたＤＮＡは、標的遺伝子座にマッピングする５０％より多い、８０％より多い、９０％より多い、９５％より多い、９８％より多い、又は９９％より多いＤＮＡ分子を含む。

【0042】

一実施形態において、本明細書に開示される方法は、多型遺伝子座における各対立遺伝子の独立した観察の数の定量的尺度をもたらす。これは、２つの対立遺伝子の比率に関する情報を提供するが、いずれかの対立遺伝子の独立した観察の数を定量化しない、マイクロアレイ又は定性的ＰＣＲなどのほとんどの方法とは異なる。独立した観測の数に関する定量的情報を提供する方法では、比率のみが倍数計算に利用され、定量的情報自体は有用ではない。独立した観察の数に関する情報を保持することの重要性を説明するために、２つの対立遺伝子、Ａ及びＢを有するサンプル遺伝子座を考慮する。第１の実験では、２０個のＡ対立遺伝子及び２０個のＢ対立遺伝子が観察され、第２の実験では、２００個のＡ対立遺伝子及び２００個のＢ対立遺伝子が観察される。両方の実験において、比（Ａ／（Ａ＋Ｂ））は、０．５に等しいが、第２の実験は、Ａ又はＢ対立遺伝子の頻度の確実性について第１の情報よりも多くの情報を伝達する。先行技術で既知のいくつかの方法は、個々の対立遺伝子からの対立遺伝子比（チャネル比）（すなわち、ｘ_ｉ／ｙ_ｉ）を平均化又は加算することを伴い、この比を参照染色体と比較するか、又はこの比が特定の状況でどのように振る舞うことが予測されるかに関する規則を使用して、この比を分析する。対立遺伝子の重み付けは、当該技術分野で既知の方法では示唆されておらず、各対立遺伝子についてほぼ同じ量のＰＣＲ産物を確実にすることができ、全ての対立遺伝子が同じように振る舞うべきであると想定されている。そのような方法は、いくつかの欠点を有し、より重要なことは、本開示の別の箇所に記載されているいくつかの改善の使用を排除することである。

【0043】

一実施形態において、本明細書に開示される方法は、減数分裂Ｉ中の不分離、減数分裂ＩＩ中の不分離、及び／又は胎児発達の早期での有糸分裂中の不分離に起因するトリソミーの場合に予測され得る複数の対立遺伝子頻度分布と同様に、ダイソミーで予測される対立遺伝子頻度分布を明示的にモデル化する。これが重要である理由を説明するために、乗換えがなかった場合を想像する：減数分裂中の不分離Ｉは、２つの異なる相同体が一方の親から継承されたトリソミーをもたらし、対照的に、減数分裂ＩＩ中又は胎児発達の早期での有糸分裂中の不分離は、一方の親からの同じ相同体の２つのコピーをもたらす。各シナリオは、遺伝子連鎖のために、各多型遺伝子座で予測される異なる対立遺伝子頻度をもたらし、また、共同で考慮される全ての遺伝子座で異なるであろう。相同体間の遺伝物質の交換をもたらす乗換えは、遺伝パターンをより複雑にし、一実施形態において、本方法は、遺伝子座間の物理的距離に加えて、組換え率情報を使用することによってこれに対応する。一実施形態において、減数分裂Ｉ不分離と、減数分裂ＩＩ不分離又は有糸分裂不分離との区別を改善するために、本発明の方法は、セントロメアからの距離が増加するにつれて乗換えの増加する確率をモデルに組み込む。減数分裂ＩＩ不分離及び有糸分裂不分離は、有糸分裂不分離が、典型的には１つの相同体の同一又はほぼ同一のコピーをもたらすが、減数分裂ＩＩ不分離事象に続いて存在する２つの相同体は、配偶子形成中の１つ以上の乗換えによって異なることが多いという事実によって区別され得る。

【0044】

いくつかの実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値を、考えられる胎児の遺伝的異数性に対応する理論的仮説と比較することを伴い、ヘテロ接合性遺伝子座における対立遺伝子の比率を定量する工程を伴わない。遺伝子座の数が約２０よりも少ない場合、ヘテロ接合性遺伝子座で対立遺伝子の比率を定量することを含む方法して行われる倍数決定、及び観察された対立遺伝子の測定値を、考えられる胎児の遺伝子状態に対応する理論的対立遺伝子分布仮説と比較することを含む方法を使用して行われる倍数決定は、同様の結果をもたらし得る。しかしながら、遺伝子座の数が５０を超える場合、これらの２つの方法は、有意に異なる結果をもたらす可能性が高く、遺伝子座の数が４００を超える場合、１，０００又は２，０００を超える場合、これらの２つの方法は、ますます有意に異なる結果をもたらす可能性が非常に高い。これらの違いは、各対立遺伝子の大きさを独立して測定せずにヘテロ接合性遺伝子座における対立遺伝子の比率を定量化し、比率を凝集又は平均化することを含む方法が、結合分布モデルの使用、結合分析の実行、二項分布モデルの使用、及び／又は他の高度な統計技術を含む技術の使用を排除する一方で、観察された対立遺伝子の測定値を、可能な胎児の遺伝子状態に対応する理論的対立遺伝子分布仮説と比較することを含む方法を使用することが、決定の精度を実質的に高めることができるこれらの技術を使用することができるという事実に起因する。

【0045】

一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、結合分布モデルを使用して、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う。結合分布モデルの使用は、得られる決定が有意に高い精度であるという点で、多型遺伝子座を独立して処理することによってヘテロ接合率を決定する方法とは異なり、著しい改善である。任意の特定の理論に束縛されることなく、それらがより高い精度を有する１つの理由は、結合分布モデルが、ＳＮＰ間の連鎖、及び胎児に成長した胚を形成する配偶子を生じさせた減数分裂中に発生した乗換えの尤度を考慮に入れることであると考えられる。１つ以上の仮説について対立遺伝子測定値の予測分布を作成する場合に連鎖の概念を使用する目的は、連鎖が使用されない場合よりも実態にかなり良好に対応する、予測される対立遺伝子測定値分布の作成を可能にすることである。例えば、互いに近接して位置する２つのＳＮＰ、１及び２が存在し、母親が、１つの相同体上のＳＮＰ１でＡ及びＳＮＰ２でＡであり、相同体２上のＳＮＰ１でＢ及びＳＮＰ２でＢであると仮定する。両方のホモログ上の両方のＳＮＰについて父親がＡであり、胎児ＳＮＰ１についてＢが測定される場合、これは、ホモログ２が胎児に遺伝していることを示し、したがって、ＢがＳＮＰ２で胎児に存在する尤度がはるかに高いことを示す。連鎖を考慮したモデルはこれを予測するが、連鎖を考慮していないモデルは予測しない。代替的に、母親がＳＮＰ１でＡＢであり、近くのＳＮＰ２でＡＢである場合、その位置での母体トリソミーに対応する２つの仮説を使用することができ、１つは、マッチングコピーエラー（減数分裂ＩＩにおける不分離又は胎児発達初期における有糸分裂）を伴い、１つは、非マッチングコピーエラー（減数分裂Ｉにおける不分離）を伴った。マッチングコピーエラートリソミーの場合では、ＳＮＰ１で母親からＡＡが胎児に遺伝した場合、胎児には、ＡＢではなく、ＳＮＰ２で母親からＡＡ又はＢＢのいずれかが遺伝する可能性がはるかに高い。非マッチングコピーエラーの場合では、胎児には、両方のＳＮＰにおいて母親からＡＢが遺伝するであろう。連鎖を考慮した倍数性コールによって作成された対立遺伝子分布仮説は、これらの予測を行い、したがって、連鎖を考慮しない倍数性コールよりも大幅に大きな範囲で実際の対立遺伝子測定に対応する。対立遺伝子比を計算し、それらの対立遺伝子比を凝集することに依存する方法を使用する場合、連鎖アプローチは不可能であることに留意されたい。

【0046】

観察された対立遺伝子の測定値を、可能性のある胎児の遺伝子状態に対応する理論的仮説と比較することを含む方法を使用する倍数決定がより高い精度であると考えられる理由の１つは、配列決定を使用して対立遺伝子を測定する場合、この方法は、総リード数が他の方法よりも低い対立遺伝子からのデータからより多くの情報を収集することができることである。例えば、対立遺伝子の比率を計算及び集約することに依存する方法は、不釣り合いに重み付けされた確率論的ノイズを生成する。例えば、配列決定を使用して対立遺伝子を測定することを伴い、各遺伝子座について５つの配列リードのみが検出された遺伝子座のセットがあった場合を想像する。一実施形態において、対立遺伝子の各々について、データは、仮定された対立遺伝子分布と比較され、配列リード数に従って重み付けされてもよく、したがって、これらの測定値からのデータは、適切に重み付けされ、全体的な決定に組み込まれるであろう。これは、ヘテロ接合性遺伝子座で対立遺伝子の比率を定量することを伴う方法とは対照的であり、この方法は、可能な対立遺伝子比率として、０％、２０％、４０％、６０％、８０％、又は１００％の比率のみを計算することができ、これらのいずれも、予測される対立遺伝子比率に近いものではない。この後者の場合、計算された対立遺伝子の比率は、不十分なリードのために破棄されなければならないか、さもなければ不釣り合いな重み付けを有し、決定に確率論的ノイズを導入し、それによって決定の精度を低下させる。一実施形態において、個々の対立遺伝子の測定値は、独立した測定値として扱われてもよく、同じ遺伝子座における対立遺伝子に行われる測定値の間の関係は、異なる遺伝子座における対立遺伝子に行われる測定値の間の関係と変わらない。

【0047】

一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、ダイソミックであると予測される参照染色体上の観察された対立遺伝子の測定値と任意の測定基準を比較することなく、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う（ＲＣ方法と呼ばれる）。これは、１つ以上の推定されるダイソミック参照染色体に対する疑わしい染色体からのランダムに配列決定されたフラグメントの割合を評価することによって、異数性を検出するショットガン配列決定を使用する方法などの方法に対する著しい改善である。このＲＣ法は、推定されるダイソミック参照染色体が実際にはダイソミックでない場合、誤った結果をもたらす。これは、異数性が単一染色体のトリソミーよりも実質的である場合、又は胎児が三倍体であり、全ての常染色体がトリソミーである場合に起こり得る。女性の三倍体（６９、ＸＸＸ）胎児の場合、実際にはダイソミック染色体はまったく存在しない。本明細書に記載される方法は、参照染色体を必要とせず、女性の三倍体胎児におけるトリソミック染色体を正確に同定することができるであろう。各染色体、仮説、子画分及びノイズレベルについて、参照染色体データ、全体的な子画分の推定、又は固定された参照仮説のいずれもなしに、結合分布モデルが適合され得る。

【0048】

一実施形態において、本明細書に開示される方法は、多型遺伝子座での対立遺伝子分布の観察が、先行技術の方法よりも高い精度で胎児の倍数性状態を決定するためにどのように使用され得るかを示す。一実施形態において、本方法は、標的化配列決定を使用して、複数のＳＮＰにおいて母親－胎児の混合遺伝子型、並びに任意選択で母系及び／又は父系遺伝子型を得て、最初に、異なる仮説の下での様々な予測される対立遺伝子頻度分布を確立し、次いで、母親－胎児の混合物で得られた定量的対立遺伝子情報を観察し、どの仮説がデータに最も適合するかを評価し、データに最も適合する仮説に対応する遺伝子状態は、正しい遺伝子状態と呼ばれる。一実施形態において、本明細書に開示される方法はまた、適合度を使用して、コールされた遺伝子状態が正しい遺伝子状態であるという信頼性を生成する。一実施形態において、本明細書に開示される方法は、異なる親コンテキストを有する遺伝子座について見出される対立遺伝子の分布を分析するアルゴリズムを使用することと、観察された対立遺伝子の分布を、異なる親コンテキスト（異なる親遺伝子型パターン）についての異なる倍数性状態についての予測される対立遺伝子の分布と比較することとを含む。これは、母体－胎児混合サンプル中の各遺伝子座での各対立遺伝子の独立したインスタンスの数の推定を可能にする方法を使用しない方法とは異なるか、又はそれに対する改善である。一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、母親がヘテロ接合性である遺伝子座で測定された観察された対立遺伝子の分布を使用して、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う。これは、母親がヘテロ接合性である遺伝子座で観察された対立遺伝子分布を使用しない方法とは異なるか、又はそれに対する改善であり、これは、ＤＮＡが優先的に濃縮されていないか、又はその特定の標的個体にとって非常に有益であることが知られていない遺伝子座について優先的に濃縮されている場合に、倍数性決定において配列データのセットから約２倍の遺伝子測定データを使用することを可能にし、より正確な決定をもたらすためである。

【0049】

一実施形態において、本明細書に開示される方法は、各遺伝子座での対立遺伝子頻度が、本質的に、多項式（したがって、ＳＮＰが二対立遺伝子である場合、二項的）であると仮定する、結合分布モデルを使用する。いくつかの実施形態において、結合分布モデルは、ベータ二項分布を使用する。配列決定などの測定技術を使用すると、各遺伝子座に存在する各対立遺伝子について定量的尺度が提供される場合、バイノマルモデルを各遺伝子座に適用することができ、対立遺伝子の頻度の基礎となる程度及びその頻度の信頼性を確認することができる。対立遺伝子比から倍数性コールを生成する当該技術分野で既知の方法、又は定量的対立遺伝子情報が破棄される方法では、観察された比における確実性を確認することができない。本方法は、対立遺伝子比率を計算し、それらの比率を集約して倍数性コールを行う方法とは異なるか、又はそれに対する改善である。なぜなら、特定の遺伝子座における対立遺伝子比率を計算し、次いでそれらの比率を集約することを伴う任意の方法は、必然的に、任意の所与の対立遺伝子又は遺伝子座由来のＤＮＡの量の指標である測定された強度又は数値が、ガウス様式で分布することを前提とするからである。本明細書に開示される方法は、対立遺伝子比率を計算することを伴わない。いくつかの実施形態において、本明細書に開示される方法は、複数の遺伝子座での各対立遺伝子の観察の数をモデルに組み込むことを伴っていてもよい。いくつかの実施形態において、本明細書に開示される方法は、対立遺伝子の測定値のガウス分布を仮定する任意のモデルよりも正確であり得る結合二項分布モデルの使用を可能にする、予測分布自体を計算することを伴っていてもよい。遺伝子座の数が増加するにつれて、二項分布モデルがガウス分布よりも有意に正確である尤度が増加する。例えば、２０個未満の遺伝子座が調べられる場合、二項分布モデルが有意に優れている尤度は低い。しかしながら、１００個を超える、又は特に４００個を超える、又は特に１，０００個を超える、又は特に２，０００個を超える遺伝子座が使用される場合、二項分布モデルは、ガウス分布モデルよりも有意に正確であるという非常に高い尤度を有し、それによって、より正確な倍数決定をもたらす。二項分布モデルがガウス分布よりも有意に正確である尤度は、各遺伝子座での観測数が増加するにつれて増加する。例えば、各遺伝子座で１０個未満の異なる配列が観察される場合、二項分布モデルが有意に優れている尤度は低い。しかしながら、５０を超える配列リード、又は特に１００を超える配列リード、又は特に２００を超える配列リード、又は特に３００を超える配列リードが各遺伝子座に対して使用される場合、二項分布モデルは、ガウス分布モデルよりも有意に正確である尤度が非常に高いため、より正確な倍数決定をもたらす。

【0050】

一実施形態において、本明細書に開示される方法は、配列決定を使用して、ＤＮＡサンプル中の各遺伝子座における各対立遺伝子のインスタンスの数を測定する。各配列決定リードは、特定の遺伝子座にマッピングされ、バイナリ配列リードとして扱われ得、代替的に、リード及び／又はマッピングの同一性の確率は、配列リードの一部として組み込まれ得、確率的配列リード、すなわち、所与の遺伝子座にマッピングする配列リードの可能性のある全数又は分数をもたらす。バイナリカウント又はカウントの確率を使用して、測定値の各セットに対して二項分布を使用することが可能であり、カウント数の信頼区間を計算することができる。二項分布を使用するこの能力は、より正確な倍数推定及びより正確な信頼区間を計算することを可能にする。これは、存在する対立遺伝子の量を測定するために強度を使用する方法、例えば、マイクロアレイを使用する方法、又は電気泳動バンド内の蛍光タグ付きＤＮＡの強度を測定するために蛍光リーダーを使用して測定を行う方法とは異なるか、又はそれに対する改善である。

【0051】

一実施形態において、本明細書に開示される方法は、本データセットの態様を使用して、そのデータセットの推定される対立遺伝子頻度分布のパラメータを決定する。これは、現在の予測される対立遺伝子頻度分布、又はおそらく予測される対立遺伝子の比率のパラメータを設定するために、データのトレーニングセット又はデータの以前のセットを利用する方法に対する改善である。これは、各遺伝子サンプルの収集及び測定には異なる条件セットが関与しているため、インスタントデータセットからのデータを使用して、そのサンプルの倍数決定に使用される結合分布モデルのパラメータを決定する方法がより正確になる傾向があるためである。

【0052】

一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、最大尤度技術を使用して、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う。最大尤度技術の使用は、得られる決定が著しく高い精度で行われるという点で、単一仮説拒絶技法を使用する方法とは異なり、著しい改善である。１つの理由は、単一の仮説拒絶技術が、２つではなく１つの測定値分布のみに基づいてカットオフ閾値を設定することであり、これは、閾値が通常最適ではないことを意味する。別の理由は、最大尤度技術が、個々のサンプルの特定の特性に関係なく、全てのサンプルに使用されるカットオフ閾値を決定する代わりに、個々のサンプルごとにカットオフ閾値を最適化することを可能にすることである。別の理由は、最大尤度技術を使用することで、各倍数性コールの信頼度の計算が可能になることである。コールごとに信頼度計算を行うことができるため、どのコールが正確で、どのコールが間違っている可能性が高いかを開業医が知ることができる。いくつかの実施形態において、多種多様な方法が、倍数性コールの精度を高めるために、最大尤度推定技術と組み合わせられてもよい。一実施形態において、最大尤度技術は、米国特許第７，８８８，０１７号に記載の方法と組み合わせて使用されてもよい。一実施形態において、最大尤度技術は、２０１１年１０月にモントリオールで開催された国際ヒト遺伝学会２０１１で提示されるように、標的化ＰＣＲ増幅を使用して混合サンプル中のＤＮＡを増幅し、続いてタンデム診断によって使用されるようなリードカウント法を使用して配列決定及び分析する方法と組み合わせて使用されてもよい。一実施形態において、本明細書に開示される方法は、混合サンプル中のＤＮＡの胎児画分を推定することと、その推定を使用して、倍数性コール及び倍数性コールの信頼度の両方を計算することとを含む。これは、推定された胎児画分を十分な胎児画分のスクリーニングとして使用し、続いて、胎児画分を考慮せず、またそのコールの信頼度計算を生成しない単一の仮説拒絶技法を使用して行われる倍数性コールを使用する方法とは異なることに留意されたい。

【0053】

一実施形態において、本明細書に開示される方法は、各測定値に確率を付加することによって、データがノイズを伴い、エラーを含む傾向を考慮に入れる。最大尤度技術を使用して、確率推定値を添付した測定データを使用して行われた仮説のセットから正しい仮説を選択すると、誤った測定値が割引される尤度が高くなり、正しい測定値が倍数性コールにつながる計算に使用される。より正確には、この方法は、倍数性の決定に誤って測定されるデータの影響を体系的に低減する。これは、全てのデータが等しく正しいと仮定される方法、又は外れデータが倍数性コールにつながる計算から任意に除外される方法に対する改善である。チャネル比測定を使用する既存の方法は、個々のＳＮＰチャネル比を平均化することによって、方法を複数のＳＮＰに拡張することを主張する。ＳＮＰの質及び観測されたリード深度に基づく予測される測定分散によって個々のＳＮＰを重み付けしないことは、得られた統計の精度を低下させ、特に境界線上の場合において、倍数性コールの精度を著しく低下させる。

【0054】

一実施形態において、本明細書に開示される方法は、どのＳＮＰ又は他の多型遺伝子座が胎児にヘテロ接合性であるかの知識を前提としない。この方法は、父系遺伝子型情報が利用できない場合に、倍数性コールを行うことを可能にする。これは、標的化する遺伝子座を適切に選択するために、又は混合された胎児／母体ＤＮＡサンプルに対して行われた遺伝子測定を解釈するために、どのＳＮＰがヘテロ接合であるかの知識を事前に知らなければならない方法に対する改善である。

【0055】

本明細書に記載される方法は、少量のＤＮＡが利用可能であるか、又は胎児ＤＮＡの割合が低いサンプル上で使用される場合、特に有利である。これは、胎児ＤＮＡ及び母体ＤＮＡの混合サンプル中の胎児ＤＮＡの割合が低い場合に、少量のＤＮＡのみが利用可能である場合に生じる対応するより高い対立遺伝子ドロップアウト率及び／又は対応するより高い胎児対立遺伝子ドロップアウト率に起因する。対立遺伝子ドロップアウト率が高く、対立遺伝子の大部分が標的個体について測定されなかったことを意味し、不正確な胎児画分の計算、不正確な倍数性決定をもたらす。本明細書に開示される方法は、ＳＮＰ間の遺伝パターンにおける連鎖を考慮に入れる結合分布モデルを使用してもよいので、有意により正確な倍数性の決定がなされてもよい。本明細書に記載される方法は、混合物中の胎児であるＤＮＡの分子の割合が、４０％未満、３０％未満、２０％未満、１０％未満、８％未満、及び６％未満である場合に、正確な倍数性決定を行うことを可能にする。

【0056】

一実施形態において、個体のＤＮＡが関連する個体のＤＮＡと混合されるときの測定に基づいて、個体の倍数性状態を決定することが可能である。一実施形態において、ＤＮＡの混合物は、母体血漿中に見出される遊離浮遊ＤＮＡであり、これは、既知の核型及び既知の遺伝子型を有する母親由来のＤＮＡを含み得、未知の核型及び未知の遺伝子型を有する胎児のＤＮＡと混合され得る。一方又は両方の親からの既知の遺伝子型情報を使用して、異なる倍数性状態、胎児への各親からの異なる染色体寄与、及び任意選択で、混合物中の異なる胎児ＤＮＡ画分についての混合サンプル中のＤＮＡの複数の潜在的な遺伝子状態を予測することが可能である。各潜在的な組成物は、仮説と呼ばれる場合がある。次いで、胎児の倍数性状態は、実際の測定値を見て、どの潜在的な組成物が観察されたデータを考慮して最も可能性が高いかを決定することによって決定することができる。

【0057】

いくつかの実施形態において、本明細書に開示される方法は、インビトロ受精などの非常に少量のＤＮＡが存在する状況、又は１つ又はいくつかの細胞（典型的には、１０個未満の細胞、２０個未満の細胞又は４０個未満の細胞）が利用可能な法医学的状況において使用することができる。これらの実施形態において、本明細書に開示される方法は、他のＤＮＡに汚染されていないが、少量のＤＮＡをコールすることが非常に困難な少量のＤＮＡから倍数性コールを行うのに役立つ。いくつかの実施形態において、本明細書に開示される方法は、標的ＤＮＡが別の個体のＤＮＡで汚染されている状況において、例えば、出生前診断、父子鑑定、又は受胎産物検査の文脈における母体血液において使用され得る。これらの方法が特に有利であろういくつかの他の状況は、より多くの正常細胞の中に１つ又は少数の細胞のみが存在するがん検査の場合である。これらの方法の一部として使用される遺伝子測定は、ＤＮＡ又はＲＮＡを含む任意のサンプル、例えば、限定されないが、血液、血漿、体液、尿、毛髪、涙、唾液、組織、皮膚、指の爪、割球、胎芽、羊水、絨毛サンプル、糞便、胆汁、リンパ液、子宮頸粘液、精液、又は核酸を含む他の細胞又は物質について行われてもよい。一実施形態において、本明細書に開示される方法は、配列決定、マイクロアレイ、ｑＰＣＲ、デジタルＰＣＲ、又は核酸を測定するために使用される他の方法などの核酸検出方法で実行することができる。何らかの理由でそれが望ましいことが見出された場合、遺伝子座における対立遺伝子数確率の比率を計算することができ、対立遺伝子比率を使用して、本明細書に記載される方法のいくつかと組み合わせて倍数性状態を決定することができるが、その方法に互換性がある場合に限る。いくつかの実施形態において、本明細書に開示される方法は、処理されたサンプル上で行われるＤＮＡ測定から、複数の多型遺伝子座における対立遺伝子比をコンピュータ上で計算することを伴う。いくつかの実施形態において、本明細書に開示される方法は、本開示に記載される他の改善の任意の組み合わせとともに、処理されたサンプル上で行われるＤＮＡ測定から、複数の多型遺伝子座における対立遺伝子比をコンピュータ上で計算することを伴う。

【0058】

非侵襲性出生前診断（ＮＰＤ）
非侵襲性出生前診断のプロセスは、いくつかの工程を伴う。工程のいくつかは、以下：（１）胎児から遺伝物質を得ることと、（２）エクスビボで、混合サンプル中にあってもよい、胎児の遺伝物質を濃縮することと、（３）エクスビボで、遺伝物質を増幅することと、（４）エクスビボで、遺伝物質中の特定の遺伝子座を優先的に濃縮することと、（５）エクスビボで、遺伝物質を測定することと、（６）コンピュータ上で、及びエクスビボで、遺伝子型データを分析することと、を含み得る。これらの６つ及び他の関連する工程を実施するために低減する方法が本明細書に記載される。方法工程の少なくともいくつかは、身体に直接適用されない。一実施形態において、本開示は、身体から単離及び分離された組織及び他の生物学的物質に適用される治療及び診断の方法に関する。方法工程の少なくともいくつかは、コンピュータ上で実行される。

【0059】

本開示のいくつかの実施形態は、臨床医が、赤ちゃんの健康が胎児の遺伝物質の収集によって危険にさらされないように、及び母親が侵襲的手法を受ける必要がないように、非侵襲性様式で母親に妊娠している胎児の遺伝子状態を決定することを可能にする。更に、特定の態様において、本開示は、出生前ケアにおいて広く使用されている、例えば、トリプル検査などの非侵襲的な母親の血清分析物ベースのスクリーニングよりも、高精度で、有意に高い精度で、胎児遺伝子状態を決定することを可能にする。

【0060】

本明細書に開示される方法の高精度は、本明細書に記載されるような、遺伝子型データの分析に対する情報学的アプローチの結果である。近代的な技術の進歩により、高スループット配列決定及び遺伝子型決定アレイなどの方法を使用して、遺伝子サンプルから大量の遺伝子情報を測定する能力がもたらされた。本明細書に開示される方法は、臨床医が利用可能な大量のデータをより大きな利点で利用し、胎児の遺伝子状態のより正確な診断を行うことを可能にする。いくつかの実施形態の詳細を以下に示す。異なる実施形態は、前述の工程の異なる組み合わせを伴っていてもよい。異なる工程の異なる実施形態の様々な組み合わせが、互換的に使用されてもよい。

【0061】

一実施形態において、血液サンプルは、妊娠中の母親から採取され、母体起源のＤＮＡと胎児起源のＤＮＡとの両方の混合物を含有する、母親の血液の血漿中の遊離浮遊ＤＮＡは、単離され、胎児の倍数性状態を決定するために使用される。一実施形態において、本明細書に開示される方法は、濃縮時に対立遺伝子比及び／又は対立遺伝子分布がほぼ一貫したままであるような方法で、多型対立遺伝子に対応するＤＮＡの混合物中のこれらのＤＮＡ配列の優先的濃縮を含む。一実施形態において、本明細書に開示される方法は、得られた分子の非常に高い割合が標的遺伝子座に対応するように、高効率な標的化ＰＣＲベースの増幅を含む。一実施形態において、本明細書に開示される方法は、母体起源のＤＮＡと胎児起源のＤＮＡとの両方を含有するＤＮＡの混合物を配列決定することを伴う。一実施形態において、本明細書に開示される方法は、測定された対立遺伝子分布を使用して、母親に妊娠している胎児の倍数性状態を決定することを伴う。一実施形態において、本明細書に開示される方法は、決定された倍数性状態を臨床医に報告することを伴う。一実施形態において、本明細書に開示される方法は、臨床作用、例えば、絨毛性絨毛サンプリング又は羊水穿刺などのフォローアップ侵襲性試験の実施、トリソミック個体の出生又はトリソミック胎児の選択的終了の準備を含む。

【0062】

遊離浮遊胎児ＤＮＡを含む母体血液のスクリーニング
本明細書に記載される方法を使用して、一定量の他の遺伝物質の存在下で標的の遺伝物質が見出される、小児、胎児、又は他の標的個体の遺伝子型を決定するのを助けてもよい。いくつかの実施形態において、遺伝子型は、１つ又は複数の染色体の倍数性状態を指し得、１つ又は複数の疾患連結対立遺伝子、又はそれらのいくつかの組み合わせを指し得る。本開示において、議論は、胎児ＤＮＡが母体血液中に見出される胎児の遺伝子状態を決定することに焦点を当てているが、本実施例は、本方法が適用され得る可能性のある文脈に限定することを意図していない。加えて、本方法は、標的ＤＮＡの量が非標的ＤＮＡと任意の割合である場合に適用することができ、例えば、標的ＤＮＡは、存在するＤＮＡの０．０００００１～９９．９９９９９９％の任意の場所を占めることができる。加えて、非標的ＤＮＡは、関連する非標的個体（複数可）のいくつか又は全てからの遺伝子データが既知である限り、必ずしも１つの個体、又は関連する個体からのものである必要はない。一実施形態において、本明細書に開示される方法を使用して、胎児ＤＮＡを含有する母体血液からの胎児の遺伝子型データを決定することができる。これはまた、妊婦の子宮内に複数の胎児が存在する場合、又はサンプル内に、例えば、他の既に生まれた兄弟からの他の汚染ＤＮＡが存在し得る場合に使用されてもよい。

【0063】

この技術は、胎児血液細胞が胎盤絨毛を通して母体の循環にアクセスするという現象を利用し得る。通常、非常に少数の胎児細胞のみがこの方法で母体循環に入る（胎児－母体出血のための陽性のＫｌｅｉｈａｕｅｒ－Ｂｅｔｋｅ検査を生成するには不十分である）。胎児細胞は、特定のＤＮＡ配列を探すために様々な技術によって選別及び分析することができるが、侵襲的処置が本質的に有するリスクはない。この技術はまた、問題の胎盤組織が胎児と同じ遺伝子型のＤＮＡを含有する胎盤組織のアポトーシスに続いて、ＤＮＡ放出によって母体循環にアクセスする遊離浮遊胎児ＤＮＡの現象を利用し得る。母体血漿中に見出される遊離浮遊ＤＮＡは、３０～４０％の胎児ＤＮＡの割合で胎児ＤＮＡを含有することが示されている。

【0064】

一実施形態において、血液は、妊婦から採取されてもよい。研究によると、母体血液には、母体起源の遊離浮遊ＤＮＡに加えて、胎児からの少量の遊離浮遊ＤＮＡが含まれていてもよいことが示されている。加えて、核ＤＮＡを典型的に含有しない母体起源の多くの血液細胞に加えて、胎児起源のＤＮＡを含む除核胎児血液細胞も存在し得る。胎児ＤＮＡを単離するか、又は胎児ＤＮＡを濃縮する画分を作製するために、当該技術分野で知られている多くの方法が存在する。例えば、クロマトグラフィーは、胎児ＤＮＡが濃縮される特定の画分を作製することが示されている。

【0065】

相対的に非侵襲性様式で抽出され、かつ母体ＤＮＡへのその割合において、又はその元の比率において濃縮された、細胞性又は遊離浮遊のいずれかの胎児ＤＮＡの量を含有する母体血液、血漿、又は他の流体のサンプルが手元にあるとき、当該サンプル中に見出されるＤＮＡを遺伝子型決定してもよい。いくつかの実施形態において、血液は、静脈、例えば、バシリカ静脈から血液を引き出すために針を使用して採取されてもよい。本明細書に記載される方法を使用して、胎児の遺伝子型データを決定することができる。例えば、それを使用して、１つ以上の染色体での倍数性状態を決定することができ、それを使用して、挿入、欠失、及び転座を含む、１つ又は一連のＳＮＰの同一性を決定することができる。これを使用して、１つ以上の遺伝子型特徴の起源の親を含む、１つ以上のハプロタイプを決定することができる。

【0066】

この方法は、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭアレイプラットフォーム、ＡＦＦＹＭＥＴＲＩＸＧＥＮＥＣＨＩＰ、ＩＬＬＵＭＩＮＡゲノムアナライザ、又はＬＩＦＥＴＥＣＨＮＯＬＧＩＥＳの固体系などの任意の遺伝子型決定及び／又は配列決定方法に使用することができる任意の核酸で機能することに留意されたい。これには、血漿から抽出された遊離浮遊ＤＮＡ、又はその増幅（例えば、全ゲノム増幅、ＰＣＲ）、他の細胞型（例えば、全血からのヒトリンパ球）からのゲノムＤＮＡ、又はその増幅が含まれる。ＤＮＡの調製のために、これらのプラットフォームの１つに適したゲノムＤＮＡを生成する任意の抽出又は精製方法も同様に機能する。この方法は、ＲＮＡのサンプルと同様に十分に機能し得る。一実施形態において、サンプルの保管は、分解を最小限に抑える方法（例えば、凍結下、約－２０Ｃ、又はより低い温度で）で行われてもよい。

【0067】

定義
一塩基多型（ＳＮＰ）は、同じ種の２つのメンバーのゲノム間で異なり得る単一ヌクレオチドを指す。この用語の使用は、各バリアントが生じる頻度のいかなる制限も意味すべきではない。

【0068】

配列は、ＤＮＡ配列又は遺伝子配列を指す。これは、個体におけるＤＮＡ分子又は鎖の一次的な物理的構造を指し得る。これは、そのＤＮＡ分子内に見出されるヌクレオチドの配列、又はＤＮＡ分子に対する相補鎖を指し得る。これは、コンピュータでのその表現としてのＤＮＡ分子に含まれる情報を指し得る。

【0069】

遺伝子座は、個体のＤＮＡ上の特定の目的領域を指し、これはＳＮＰ、可能性のある挿入若しくは欠失の部位、又はいくつかの他の関連する遺伝的変動の部位を指し得る。疾患関連ＳＮＰはまた、疾患関連遺伝子座を指し得る。

【0070】

多型対立遺伝子、別名「多型遺伝子座」は、遺伝子型が所与の種内の個体間で変化する対立遺伝子又は遺伝子座を指す。多型対立遺伝子のいくつかの例としては、一塩基多型、短いタンデム反復、欠失、重複及び反転が挙げられる。

【0071】

多型部位は、個体間で異なる多型領域に見出される特定のヌクレオチドを指す。

【0072】

対立遺伝子は、特定の遺伝子座を占める遺伝子を指す。

【0073】

遺伝子データ、別名「遺伝子型データ」は、１つ以上の個体のゲノムの態様を記述するデータを指す。これは、遺伝子座の１つ又は１セット、部分的又は全体的な配列、部分的又は全体的な染色体、又はゲノム全体を指し得る。これは、１つ又は複数のヌクレオチドの同一性を指し得、これは、一連の連続したヌクレオチド、又はゲノム内の異なる位置からのヌクレオチド、又はそれらの組み合わせを指し得る。遺伝子型データはコンピュータ上であるが、配列中の物理的ヌクレオチドを化学的にコードされた遺伝子データとみなすことも可能である。遺伝子型データは、個体（複数可）「に関する」、個体（複数可）「の」、個体（複数可）「での」、個体（複数可）「からの」又は個体「に関する」と言うことができる。遺伝子型データは、遺伝物質に対してこれらの測定が行われる遺伝子型決定プラットフォームからの出力測定を指し得る。

【0074】

遺伝物質、別名「遺伝子サンプル」は、ＤＮＡ又はＲＮＡを含む１つ以上の個体からの、組織又は血液などの物理的物質を指す。

【0075】

ノイズの多い遺伝子データは、以下のいずれかを有する遺伝子データを指す：対立遺伝子ドロップアウト、不確実な塩基対測定値、不正確な塩基対測定値、欠損した塩基対測定値、挿入若しくは欠失の不確実な測定値、染色体セグメントコピー数の不確実な測定値、偽シグナル、欠損した測定値、他のエラー、又はそれらの組み合わせ。

【0076】

信頼性は、いわゆるＳＮＰ、対立遺伝子、対立遺伝子のセット、倍数性コール、又は染色体セグメントコピーの決定された数が、個体の実際の遺伝子状態を正しく表す統計的尤度を指す。

【0077】

「染色体コピー数コール」又は「コピー数コール」（ＣＮＣ）とも呼ばれる倍数性コールは、細胞内に存在する１つ以上の染色体の量及び／又は染色体同一性を決定する行為を指し得る。

【0078】

異数性は、間違った数の染色体が細胞内に存在する状態を指す。ヒト体細胞の場合、これは、細胞が２２対の常染色体及び１対の性染色体を含有しない場合を指し得る。ヒト配偶子の場合、これは、細胞が２３個の染色体の各々のうちの１つを含有しない場合を指し得る。単一染色体型の場合、これは、２つより多い、又は少ない相同であるが同一でない染色体コピーが存在する場合、又は同じ親に由来する２つの染色体コピーが存在する場合を指し得る。

【0079】

倍数性状態とは、細胞内の１つ以上の染色体の量及び／又は染色体同一性を指す。

【0080】

染色体は、単一染色体コピーを指し得、これは、正常な体細胞内に４６個あるＤＮＡの単一分子を意味し、その例は「母体由来染色体１８」である。染色体はまた、正常なヒト体細胞内に２３個ある染色体型を指し得、その例は「染色体１８」である。

【0081】

染色体同一性は、対象の染色体番号、すなわち染色体型を指し得る。正常なヒトには、２２種類の番号付けされた常染色体型と、２種類の性染色体がある。これはまた、染色体の親起源を指し得る。これはまた、親から遺伝した特定の染色体を指し得る。これはまた、染色体の他の識別特徴を指し得る。

【0082】

遺伝物質の状態又は単に「遺伝子状態」は、ＤＮＡ上の一連のＳＮＰの同一性、遺伝物質の段階的なハプロタイプ、及び挿入、欠失、反復及び変異を含む、ＤＮＡの配列を指し得る。また、１つ以上の染色体、染色体セグメント、又は染色体セグメントのセットの倍数性状態を指し得る。

【0083】

対立遺伝子データは、１つ以上の対立遺伝子のセットに関する遺伝子型データのセットを指す。これは、段階的なハプロタイプのデータを指し得る。これは、ＳＮＰ同一性を指し得、挿入、欠失、反復及び変異を含む、ＤＮＡの配列データを指し得る。これは、各対立遺伝子の親起源を含み得る。

【0084】

対立遺伝子状態とは、１つ以上の対立遺伝子のセットにおける遺伝子の実際の状態を指す。これは、対立遺伝子データによって説明される遺伝子の実際の状態を指し得る。

【0085】

対立遺伝子の比率又は対立遺伝子比率は、サンプル又は個体中に存在する遺伝子座における各対立遺伝子の量間の比率を指す。サンプルが配列決定によって測定された場合、対立遺伝子の比率は、遺伝子座における各対立遺伝子にマッピングする配列リードの比率を指し得る。サンプルが強度ベースの測定方法によって測定された場合、対立遺伝子比率は、測定方法によって推定される、その遺伝子座に存在する各対立遺伝子の量の比率を指し得る。

【0086】

対立遺伝子数は、特定の遺伝子座にマッピングする配列の数を指し、その遺伝子座が多型である場合、対立遺伝子の各々にマッピングする配列の数を指す。各対立遺伝子がバイナリ方式でカウントされる場合、対立遺伝子数は整数となる。対立遺伝子が確率的にカウントされる場合、対立遺伝子数は、分数であってもよい。

【0087】

対立遺伝子数確率は、マッピングの確率と組み合わせて、多型遺伝子座における特定の遺伝子座又は対立遺伝子のセットにマッピングする可能性が高い配列の数を指す。対立遺伝子数は、それぞれのカウントされた配列についてのマッピングの確率がバイナリ（ゼロ又は１）である対立遺伝子数確率と等価であることに留意されたい。いくつかの実施形態において、対立遺伝子数確率は、バイナリであってもよい。いくつかの実施形態において、対立遺伝子数確率は、ＤＮＡ測定値と等しいように設定されてもよい。

【0088】

対立遺伝子分布、又は「対立遺伝子数分布」は、遺伝子座のセット内の各遺伝子座について存在する各対立遺伝子の相対量を指す。対立遺伝子分布は、個体、サンプル、又はサンプルに対して行われる測定のセットを指すことができる。配列決定の文脈において、対立遺伝子分布は、多型遺伝子座のセット内の各対立遺伝子についての特定の対立遺伝子にマッピングするリードの数又は可能性のある数を指す。対立遺伝子の測定値は、確率的に処理されてもよく、すなわち、所与の対立遺伝子が、読み取られた所与の配列に対して存在する尤度は、０と１との間の分数であり、又はそれらは、バイナリ様式で処理されてもよく、すなわち、所与の読み取り値は、特定の対立遺伝子の正確なゼロ又は１つのコピーであるとみなされる。

【0089】

対立遺伝子分布パターンは、異なる親のコンテキストに対する異なる対立遺伝子分布のセットを指す。特定の対立遺伝子分布パターンは、特定の倍数性状態を示し得る。

【0090】

対立遺伝子バイアスは、ヘテロ接合遺伝子座で測定された対立遺伝子の比率が、ＤＮＡの元のサンプルに存在した比率と異なる程度を指す。特定の遺伝子座での対立遺伝子バイアスの程度は、測定時のその遺伝子座で観察された対立遺伝子比率を、その遺伝子座での元のＤＮＡサンプルにおける対立遺伝子の比率で除したものである。対立遺伝子バイアスは、対立遺伝子バイアスの度合いの計算が１未満の値ｘを返す場合、対立遺伝子バイアスの度合いは１／ｘとして再記載され得るように、１より大きいと定義され得る。対立遺伝子バイアスは、増幅バイアス、精製バイアス、又は異なる対立遺伝子に異なる影響を与えるいくつかの他の現象に起因し得る。

【0091】

プライマー、別名「ＰＣＲプローブ」は、ＤＮＡ分子が同一又はほぼ同一であり、プライマーが標的多型遺伝子座にハイブリダイズするように設計された領域を含み、ｍがＰＣＲ増幅を可能にするように設計されたプライミング配列を含む、単一のＤＮＡ分子（ＤＮＡオリゴマー）又はＤＮＡ分子（ＤＮＡオリゴマー）の集合体を指す。プライマーはまた、分子バーコードを含んでいてもよい。プライマーは、個々の分子ごとに異なるランダム領域を含んでいてもよい。

【0092】

ハイブリッド捕捉プローブは、ＰＣＲ又は直接合成などの様々な方法によって生成され、サンプル中の特定の標的ＤＮＡ配列の１つの鎖に相補的であることを意図している、場合によっては修飾された任意の核酸配列を指す。外因性ハイブリッド捕捉プローブを調製したサンプルに添加し、変性－アニールプロセスを通じてハイブリダイゼーションして、外因性－内因性フラグメントの二本鎖を形成してもよい。次いで、これらの二本鎖は、様々な手段によってサンプルから物理的に分離され得る。

【0093】

配列リードは、クローン配列決定方法を用いて測定した、ヌクレオチド塩基の配列を表すデータを指す。クローン配列決定は、単一の、又はクローンの、又はクラスターの１つの元のＤＮＡ分子を表す配列データを生成し得る。配列リードはまた、ヌクレオチドが正しくコールされた可能性を示す配列の各塩基位置に、関連する品質スコアを有し得る。

【0094】

配列リードをマッピングすることは、特定の生物のゲノム配列における配列リードの起点の位置を決定するプロセスである。配列リードの起点の位置は、リード及びゲノム配列のヌクレオチド配列の類似性に基づく。

【0095】

「マッチング染色体異数性」（ＭＣＡ）とも呼ばれるマッチしたコピーエラーは、１つの細胞が２つの同一又はほぼ同一の染色体を含む異数性の状態を指す。この種の異数性は、減数分裂における配偶子の形成中に生じる場合があり、減数分裂非分離エラーと呼ばれる場合がある。この種のエラーは、有糸分裂で発生し得る。マッチングトリソミーは、所与の染色体の３つのコピーが個体に存在し、コピーのうちの２つが同一である場合を指し得る。

【0096】

「ユニーク染色体非整数体」（ＵＣＡ）とも呼ばれるマッチしないコピーエラーは、１つの細胞が同じ親由来の２つの染色体を含有し、相同であり得るが同一ではない異数性の状態を指す。この種の異数性は、減数分裂中に生じる場合があり、減数分裂エラーと呼ばれる場合がある。非マッチングトリソミーは、所与の染色体の３つのコピーが個体に存在し、コピーのうちの２つが同じ親に由来し、かつ相同であるが、同一ではない場合を指し得る。非マッチングトリソミーは、一方の親からの２つの相同な染色体が存在し、染色体のいくつかのセグメントが同一であり、他のセグメントが単に相同である場合を指し得ることに留意されたい。

【0097】

相同染色体は、通常減数分裂中に対合する遺伝子の同じセットを含む染色体コピーを指す。

【0098】

同一染色体は、遺伝子の同じセットを含む染色体コピーを指し、各遺伝子について、それらは、同一又はほぼ同一の対立遺伝子の同じセットを有する。

【0099】

対立遺伝子ドロップアウト（ＡＤＯ）は、所与の対立遺伝子における相同染色体からの塩基対のセット内の塩基対の少なくとも１つが検出されない状況を指す。

【0100】

遺伝子座ドロップアウト（ＬＤＯ）は、所与の対立遺伝子における相同染色体からの塩基対のセット内の両方の塩基対が検出されない状況を指す。

【0101】

ホモ接合性とは、対応する染色体遺伝子座と同様の対立遺伝子を有することを指す。

【0102】

ヘテロ接合性とは、対応する染色体遺伝子座として異なる対立遺伝子を有することを指す。

【0103】

ヘテロ接合率は、所与の遺伝子座にヘテロ接合性対立遺伝子を有する群内の個体の割合を指す。また、ヘテロ接合率は、個体、又はＤＮＡのサンプル中の所与の遺伝子座における対立遺伝子の予測される、又は測定される比率を指し得る。

【0104】

高情報性単一ヌクレオチド多型（ＨＩＳＮＰ）は、胎児が母系遺伝子型に存在しない対立遺伝子を有するＳＮＰを指す。

【0105】

染色体領域は、染色体のセグメント、又は完全な染色体を指す。

【0106】

染色体のセグメントは、１つの塩基対から染色体全体までのサイズの範囲であり得る染色体のセクションを指す。

【0107】

染色体は、完全な染色体、又は染色体のセグメント若しくはセクションのいずれかを指す。

【0108】

コピーは、染色体セグメントのコピー数を指す。これは、染色体セグメントの同一のコピー、又は染色体セグメントの異なるコピーが実質的に類似した遺伝子座のセットを含み、対立遺伝子の１つ以上が異なる、染色体セグメントの非同一の相同コピーを指し得る。Ｍ２コピーエラーなどの異数性のいくつかの場合においては、同一である所与の染色体セグメントのいくつかのコピー及び同一でない同じ染色体セグメントのいくつかのコピーを有することが可能であることに留意されたい。

【0109】

ハプロタイプは、典型的には、同じ染色体上で一緒に遺伝される複数の遺伝子座における対立遺伝子の組み合わせを指す。ハプロタイプは、所与の遺伝子座のセット間で生じた組換えイベントの数に応じて、わずか２個の遺伝子座又は染色体全体を指し得る。ハプロタイプはまた、統計的に関連付けられている単一の染色分体上の一塩基多型（ＳＮＰ）のセットを指し得る。

【0110】

「フェージングデータ」又は「順序化遺伝子データ」とも呼ばれるハプロタイプデータは、二倍体又は多倍体ゲノム中の単一染色体、すなわち、二倍体ゲノム中の染色体の分離された母体又は父体コピーのいずれかからのデータを指す。

【0111】

フェージングは、個々の所与の順序付けられていない二倍体（又は多倍体）遺伝子データのハプロタイプ遺伝子データを決定する行為を指す。これは、１つの染色体上に見出される対立遺伝子のセットについての対立遺伝子における２つの遺伝子のうちのどれが、個体における２つの相同染色体の各々と会合するかを決定する行為を指し得る。

【0112】

フェージングデータは、１つ以上のハプロタイプが決定された遺伝子データを指す。

【0113】

仮説は、所与の染色体のセットでの可能な倍数性状態、又は所与の遺伝子座のセットでの可能な対立遺伝子状態のセットを指す。可能性のセットは、１つ以上の要素を含んでもよい。

【0114】

「倍数性状態仮説」とも呼ばれるコピー数仮説は、個体における染色体のコピー数に関する仮説を指す。これはまた、各染色体の起源の親、及び親の２つの染色体のうちのどの染色体が個体に存在するかを含む、染色体のそれぞれの同一性に関する仮説を指し得る。これはまた、ある場合には、関連する個体からのどの染色体、又は染色体セグメントが、個体からの所与の染色体に遺伝的に対応するかに関する仮説を指し得る。

【0115】

標的個体とは、遺伝子状態が決定されている個体を指す。いくつかの実施形態において、限定された量のＤＮＡのみが、標的個体から利用可能である。いくつかの実施形態において、標的個体は、胎児である。いくつかの実施形態において、２つ以上の標的個体が存在してもよい。いくつかの実施形態において、親の対に由来する各胎児は、標的個体であるとみなされ得る。いくつかの実施形態において、決定される遺伝子データは、１つの対立遺伝子コールのセットである。いくつかの実施形態において、決定される遺伝子データは、倍数性コールである。

【0116】

関連する個体とは、標的個体と遺伝的に関連し、したがってハプロタイプブロックを共有する任意の個体を指す。１つの文脈において、関連する個体は、標的個体の遺伝的親、又は精子、極性体、胚、胎児、若しくは子供などの親に由来する任意の遺伝物質であってもよい。また、兄弟姉妹、親、又は祖父母を指す場合もある。

【0117】

兄弟姉妹とは、遺伝的親が問題の個体と同じである任意の個体を指す。いくつかの実施形態において、これは、出生児、胚若しくは胎児、又は出生時、胚若しくは胎児に由来する１つ以上の細胞を指し得る。兄弟姉妹はまた、精子、極性体、又は任意の他のセットのハプロタイプ遺伝子物質など、親の一方に由来する単倍体個体を指し得る。個体は、それ自体の兄弟姉妹であるとみなされ得る。

【0118】

胎児は、「胎児の」、又は「胎児と遺伝的に類似している胎盤の領域の」ものを指す。妊娠中の女性において、胎盤の一部は胎児と遺伝的に類似しており、母体血液中に見出される遊離浮遊胎児ＤＮＡは、胎児にマッチする遺伝子型を有する胎盤の一部に由来する可能性がある。胎児における染色体の半分の遺伝情報は、胎児の母親から遺伝することに留意されたい。いくつかの実施形態において、胎児細胞に由来するこれらの母体から遺伝した染色体からのＤＮＡは、「母体起源の」ではなく「胎児起源の」ものであるとみなされる。

【0119】

胎児起源のＤＮＡとは、元々遺伝子型が胎児のものと本質的に同等であった細胞の一部であったＤＮＡを指す。

【0120】

母体起源のＤＮＡとは、元々遺伝子型が母親のものと本質的に同等であった細胞の一部であったＤＮＡを指す。

【0121】

子供は、胚、芽球、又は胎児を指し得る。本開示の実施形態において、説明される概念は、出生児、胎児、胚、又はそれからの細胞のセットである個体に等しく良好に適用されることに留意されたい。子供という用語の使用は、単に、子供と呼ばれる個体が親の遺伝的子孫であることを意味する場合がある。

【0122】

親は、個体の遺伝的母親又は父親を指す。個体は、典型的には、２人の親、すなわち母親及び父親を有するが、これは、必ずしも、遺伝的又は染色体キメラのような場合ではないかもしれない。親は個体とみなされ得る。

【0123】

親のコンテキストは、標的の２つの親の一方又は両方の２つの関連する染色体の各々における、所与のＳＮＰの遺伝子状態を指す。

【0124】

所望通りに発育させる（別名「正常に発育させる」）とは、子宮内に生存可能な胚を移植して妊娠をもたらすこと、及び／又は妊娠を継続して出生をもたらすこと、及び／又は生まれた子供に染色体異常がないこと、及び／又は生まれた子供に疾患関連遺伝子などの他の望ましくない遺伝子状態がないことを指す。「所望通りに発育させる」という用語は、親又はヘルスケアファシリテーターによって所望され得る任意のものを包含することを意味する。ある場合に、「所望通りに発育させる」とは、医学研究又は他の目的に有用な生存不可能又は生存可能な胚を指していてもよい。

【0125】

子宮への挿入とは、インビトロ受精の文脈において胚を子宮腔に移植するプロセスを指す。

【0126】

母体血漿とは、妊娠している女性からの血液の血漿部分を指す。

【0127】

臨床的決定は、個人の健康又は生存に影響を及ぼす結果を有する行為を行うかどうかの決定を指す。出生前診断の文脈において、臨床的決定とは、胎児を中絶するか又はしないかの決定を指し得る。臨床的決定はまた、更なる検査を実行すること、望ましくない表現型を緩和するための措置を講じること、又は異常を有する子供の出生に備えるための行為を行うことを指し得る。

【0128】

診断ボックスは、本明細書に開示される方法の１つ又は複数の態様を実行するように設計された機械の１つ又は組み合わせを指す。一実施形態において、診断ボックスは、患者のケアのポイントに配置されてもよい。一実施形態において、診断ボックスは、標的化増幅の後に配列決定を行ってもよい。一実施形態において、診断ボックスは、単独で、又は技術者の助けを借りて機能してもよい。

【0129】

インフォマティクスベースの方法は、大量のデータを理解するために統計に大きく依存する方法を指す。出生前診断の文脈において、これは、例えば分子アレイ又は配列決定からの大量の遺伝子データを仮定して、状態を直接物理的に測定することによってではなく、最も可能性の高い状態を統計的に推測することによって、１つ以上の染色体での倍数性状態又は１つ以上の対立遺伝子での対立遺伝子状態を決定するように設計された方法を指す。本開示の一実施形態において、インフォマティクスベースの技術は、本特許において開示されるものであってもよい。本開示の一実施形態において、これは、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）であってもよい。

【0130】

一次遺伝子データは、遺伝子型決定プラットフォームによって出力されるアナログ強度シグナルを指す。ＳＮＰアレイの文脈では、一次遺伝子データは、任意の遺伝子型コールが行われる前の強度シグナルを指す。配列決定の文脈では、一次遺伝子データは、任意の塩基対の同一性が決定される前に、及び配列がゲノムにマッピングされる前に、シーケンサから出る、クロマトグラムに類似するアナログ測定値を指す。

【0131】

二次遺伝子データは、遺伝子型決定プラットフォームによって出力される処理された遺伝子データを指す。ＳＮＰアレイの文脈では、二次遺伝子データは、ソフトウェアが、所与の対立遺伝子がサンプル中に存在しても存在しなくてもコールした、ＳＮＰアレイリーダーに関連付けられたソフトウェアによって行われた対立遺伝子コールを指す。配列決定の文脈では、二次遺伝子データは、配列の塩基対同一性が決定されていることを指し、場合によっては、配列がゲノムにマッピングされている場合もある。

【0132】

非侵襲性出生前診断（ＮＰＤ）、又は「非侵襲性出生前スクリーニング」（ＮＰＳ）は、母親の血液中に見出される遺伝物質を使用して母親に妊娠している胎児の遺伝子状態を決定する方法を指し、遺伝物質は、母親の静脈内血液を採取することによって得られる。

【0133】

遺伝子座に対応するＤＮＡの優先的濃縮、又は遺伝子座におけるＤＮＡの優先的濃縮とは、遺伝子座に対応する濃縮前ＤＮＡ混合物中のＤＮＡの分子のパーセンテージよりも高い、遺伝子座に対応する濃縮後ＤＮＡ混合物中のＤＮＡの分子のパーセンテージをもたらす任意の方法を指す。この方法は、遺伝子座に対応するＤＮＡ分子の選択的増幅を含んでもよい。この方法は、遺伝子座に対応しないＤＮＡ分子を除去することを含んでもよい。この方法は、方法の組み合わせを含んでもよい。濃縮度は、遺伝子座に対応する濃縮後混合物中のＤＮＡ分子のパーセンテージを、遺伝子座に対応する濃縮前混合物中のＤＮＡ分子のパーセンテージで割ったものとして定義される。優先的濃縮は、複数の遺伝子座で行われてもよい。本開示のいくつかの実施形態において、濃縮度は２０を超える。本開示のいくつかの実施形態において、濃縮度は２００を超える。本開示のいくつかの実施形態において、濃縮度は２，０００を超える。優先的濃縮が複数の遺伝子座で行われる場合、濃縮度は、遺伝子座のセット中の全ての遺伝子座の平均濃縮度を指し得る。

【0134】

増幅は、ＤＮＡの分子のコピー数を増加させる方法を指す。

【0135】

選択的増幅とは、ＤＮＡの特定の分子、又はＤＮＡの特定の領域に対応するＤＮＡの分子のコピー数を増加させる方法を指し得る。また、ＤＮＡの非標的分子又は領域を増加させるよりも、ＤＮＡの特定の標的分子、又はＤＮＡの標的領域のコピー数を増加させる方法を指し得る。選択的増幅は、優先的濃縮方法であり得る。

【0136】

ユニバーサルプライミング配列とは、例えば、ライゲーション、ＰＣＲ、又はライゲーション媒介ＰＣＲによって標的ＤＮＡ分子の集団に付加され得るＤＮＡ配列を指す。標的分子の集団に加えられると、ユニバーサルプライミング配列に特異的なプライマーを使用して、単一の増幅プライマー対を使用して標的集団を増幅することができる。ユニバーサルプライミング配列は、典型的には、標的配列に関連しない。

【0137】

ユニバーサルアダプター、又は「ライゲーションアダプター」若しくは「ライブラリタグ」とは、標的二本鎖ＤＮＡ分子の集団の５’末端及び３’末端に共有結合可能なユニバーサルプライミング配列を含むＤＮＡ分子である。アダプターの添加は、ＰＣＲ増幅が行われ得る標的集団の５’末端及び３’末端にユニバーサルプライミング配列を提供し、単一の増幅プライマー対を使用して、標的集団由来の全ての分子を増幅する。

【0138】

標的化とは、ＤＮＡの混合物中の遺伝子座のセットに対応するＤＮＡの分子を選択的に増幅するか、又は別様に優先的に濃縮するために使用される方法を指す。

【0139】

結合分布モデルは、同じ確率空間上に定義された複数のランダム変数を仮定して、変数の確率がリンクされている場合に、複数のランダム変数の観点から定義されたイベントの確率を定義するモデルを指す。いくつかの実施形態において、変数の確率がリンクされていない縮退事例が使用されてもよい。

【0140】

仮説
本開示の文脈において、仮説は、可能性のある遺伝子状態を指す。これは、可能性のある倍数性状態を指し得る。これは、可能性のたる対立遺伝子状態を指し得る。仮説のセットは、可能性のある遺伝子状態のセット、可能性のある対立遺伝子状態のセット、可能性のある倍数性状態のセット、又はそれらの組み合わせを指し得る。いくつかの実施形態において、仮説のセットは、セットからの１つの仮説が任意の所与の個体の実際の遺伝子状態に対応するように設計されてもよい。いくつかの実施形態において、仮説のセットは、全ての可能性のある遺伝子状態がそのセットからの少なくとも１つの仮説によって説明され得るように設計されてもよい。本開示のいくつかの実施形態において、方法の一態様は、どの仮説が問題の個体の実際の遺伝子状態に対応するかを決定することである。

【0141】

本開示の別の実施形態において、１つの工程は、仮説を作成することを伴う。いくつかの実施形態において、それは、コピー数仮説であってもよい。いくつかの実施形態において、関連する個体の各々からの染色体のどのセグメントが、もしあれば、他の関連する個体のどのセグメントに遺伝的に対応するかに関する仮説を伴っていてもよい。仮説を作成することは、検討中の可能性のある遺伝子状態のセット全体がそれらの変数に包含されるように、変数の限界を設定する行為を指し得る。

【0142】

「複製数仮説」は、「倍数性仮説」又は「倍数性状態仮説」とも呼ばれ、標的個体における所与の染色体コピー、染色体タイプ、又は染色体の切片についての可能性のある倍数性状態に関する仮説を指し得る。また、個体における染色体型のうちの２つ以上の倍数性状態を指し得る。コピー数仮説のセットは、各仮説が個体における異なる可能な倍数性状態に対応する仮説のセットを指し得る。仮説のセットは、可能性のある倍数性状態のセット、可能性のある親ハプロタイプの寄与のセット、混合サンプル中の可能性のある胎児ＤＮＡのパーセンテージのセット、又はそれらの組み合わせに関するものであってもよい。

【0143】

正常な個体は、各親からの各染色体タイプのうちの１つを含む。しかしながら、減数分裂及び有糸分裂における誤差により、個体が、各々の親から所与の染色体タイプを０、１、２、又はそれ以上有することが可能である。実際には、親からの所与の染色体のうちの２つ以上を見ることはまれである。本開示では、いくつかの実施形態は、所与の染色体の０、１、又は２つのコピーが親に由来する可能な仮説のみを考慮する。親に由来する多かれ少なかれ可能性のあるコピーを考慮するのは簡単な拡張である。いくつかの実施形態において、所与の染色体について、９つの可能な仮説がある：母体起源の０、１、又は２つの染色体に関する３つの可能な仮説に、父親起源の０、１、又は２つの可能な仮説を乗じたものである。（ｍ，ｆ）は、ｍが母親から継承された所与の染色体の数であり、ｆが父親から継承された所与の染色体の数であるという仮説を指す。したがって、９つの仮説は（０，０）、（０，１）、（０，２）、（１，０）、（１，１）、（１，２）、（２，０）、（２，１）及び（２，２）である。これらは、Ｈ_００、Ｈ_０１、Ｈ_０２、Ｈ_１０、Ｈ_１２、Ｈ_２０、Ｈ_２１、及びＨ_２２としても書かれてもよい。異なる仮説は、異なる倍数性状態に対応する。例えば、（１，１）は、正常なダイソミック染色体を指し、（２，１）は、母体トリソミーを指し、（０，１）は、父体モノソミーを指す。いくつかの実施形態において、２つの染色体が一方の親から遺伝し、一方の染色体が他方の親から遺伝している場合は、２つの染色体が同一である場合（マッチするコピーエラー）、及び２つの染色体が相同であるが同一ではない場合（マッチしないコピーエラー）の２つの場合に更に分化されてもよい。これらの実施形態において、１６の可能な仮説が存在する。他の仮説のセット、及び異なる数の仮説を使用することが可能であることを理解されたい。

【0144】

本開示のいくつかの実施形態において、倍数性仮説は、他の関連個体由来の染色体が標的個体のゲノム中に見出される染色体に対応するという仮説を指す。いくつかの実施形態において、本方法の鍵は、関連する個体がハプロタイプブロックを共有することが予想され得るという事実であり、関連する個体からの測定された遺伝子データを使用して、標的個体と関連する個体との間でどのハプロタイプブロックが一致するかの知識とともに、標的個体の遺伝子測定値のみを使用するよりも高い信頼性で、標的個体についての正しい遺伝子データを推論することが可能である。したがって、いくつかの実施形態において、倍数性仮説は、染色体の数だけでなく、関連する個体におけるどの染色体が、標的個体における１つ以上の染色体と同一であるか、又はほぼ同一であるかにも関係し得る。

【0145】

仮説のセットが定義されると、アルゴリズムが入力遺伝子データを操作するとき、それらは、検討中の仮説の各々について決定された統計的確率を出力し得る。様々な仮説の確率は、関連する遺伝子データを入力として使用して、様々な仮説の各々について、本開示の他の場所に記載される専門家技術、アルゴリズム、及び／又は方法のうちの１つ以上によって述べられるように、確率が等しい値を数学的に計算することによって決定され得る。

【0146】

複数の技術によって決定されるように、異なる仮説の確率が推定されると、それらを組み合わせることができる。これは、各仮説について、各技術によって決定される確率を乗算することを伴い得る。仮説の確率の積を正規化してもよい。１つの倍数性仮説は、染色体についての１つの可能な倍数性状態を指すことに留意されたい。

【0147】

「確率を組み合わせること」、又は「仮説を組み合わせること」とも呼ばれる、又は専門家の技術の結果を組み合わせることのプロセスは、線形代数の当業者によく知られているべき概念である。確率を組み合わせる１つの可能な方法は、以下の通りである：遺伝子データのセットを与えられた仮説のセットを評価するために専門家の技術を使用する場合、方法の出力は、仮説のセット内の各仮説に１対１の方法で関連付けられる確率のセットである。各々がセット内の仮説のうちの１つに関連付けられている第１の専門家技術によって決定された確率のセットが、各々が同じ仮説のセットに関連付けられている第２の専門家技術によって決定された確率のセットと組み合わされると、確率の２つのセットが乗算される。これは、セット内の各仮説について、２つの専門家の方法によって決定されるように、その仮説に関連する２つの確率が一緒に乗算され、対応する積が出力確率であることを意味する。このプロセスは、任意の数の専門技術に拡張されてもよい。１つの専門技術のみが使用される場合、出力確率は、入力確率と同じである。２つ以上の専門技術が使用される場合、次いで、関連する確率は、同時に乗算されてもよい。積は、仮説のセットにおける仮説の確率が１００％になるように正規化され得る。

【0148】

いくつかの実施形態において、所与の仮説についての組み合わされた確率が、他の仮説のいずれかについての組み合わされた確率よりも大きい場合、その仮説が最も可能性が高いと決定されると考えられ得る。いくつかの実施形態において、仮説は、最も可能性が高いと決定されてもよく、正規化された確率が閾値よりも大きい場合、倍数性状態、又は他の遺伝子状態がコールされてもよい。一実施形態において、これは、その仮説に関連する染色体の数及び同一性が、倍数性状態として呼ばれてもよいことを意味してもよい。一実施形態において、これは、その仮説に関連する対立遺伝子の同一性が対立遺伝子状態と呼ばれてもよいことを意味してもよい。いくつかの実施形態において、閾値は、約５０％～約８０％であってもよい。いくつかの実施形態において、閾値は、約８０％～約９０％であってもよい。いくつかの実施形態において、閾値は、約９０％～約９５％であってもよい。いくつかの実施形態において、閾値は、約９５％～約９９％であってもよい。いくつかの実施形態において、閾値は、約９９％～約９９．９％であってもよい。いくつかの実施形態において、閾値は、約９９．９％を超えてもよい。

【0149】

倍数性仮説は、尤度を提供する方法、アルゴリズム、技術、又はサブルーチンを使用する本発明の例示的な方法の間に作成される。例えば、異数性の有無を決定するための実施形態の特定の例示的な例において、一連の倍数性仮説が、一連のサンプル中の各サンプルについて作成され、各仮説は、サンプルのゲノム中の目的の染色体又は染色体セグメントについての特定のコピー数に関連付けられる。例えば、本明細書に開示されるＱＭＭなどの定量的な非対立遺伝子データを使用する実施形態において、仮説は、ピペッティングのばらつき又は誤差又は他の測定誤差によるサンプル中のＤＮＡの開始量のばらつきなどのサンプルパラメータの推定値を提供することができ、これを使用して、そのサンプル中の目的の染色体又は染色体セグメントのいくつか又は全ての位置での測定値（すなわち、測定された遺伝子データ）を正規化することができ、次いで、検定統計量を、これらの正規化された測定値の分散加重平均として計算することができる。したがって、特定の実施形態において、仮説は、所与の倍数性条件についての分散加重平均検定統計量を提供する。検定統計量の期待値及び分散値は、染色体コピー数仮説の各々の下で計算され、最大尤度推定値のガウスモデルを形成する。例えば、非対立遺伝子定量分析のためのＮＩＰＴ分析における仮説のセットは、染色体１３、１８、及び２１のうちの１つ以上におけるダイソミー又はトリソミーについての分散加重平均検定統計量を提供することができる。目的の染色体又は染色体セグメントを使用してサンプルパラメータを設定することができる本発明の例示的な実施形態において、仮説は、染色体のいくつか又は全てのコピー数、例えば、染色体１３、１８、及び２１に関する結合仮説であり得る。これは、非標的参照染色体を使用しない定量的方法に関して、以下で更に説明される。

【0150】

本開示のいくつかの実施形態において、倍数性仮説は、他の関連個体由来の染色体が標的個体のゲノム中に見出される染色体に対応する仮説を指し得る。いくつかの実施形態は、関連する個体がハプロタイプブロックを共有することが予想され得るという事実であり、関連する個体からの測定された遺伝子データを使用して、標的個体と関連する個体との間でどのハプロタイプブロックが一致するかの知識とともに、標的個体の遺伝子測定値のみを使用するよりも高い信頼性で、標的個体についての正しい遺伝子データを推論することが可能である。したがって、いくつかの実施形態において、倍数性仮説は、染色体の数だけでなく、関連する個体におけるどの染色体が、標的個体における１つ以上の染色体と同一であるか、又はほぼ同一であるかにも関係し得る。

【0151】

対立遺伝子仮説、又は「対立遺伝子状態仮説」は、対立遺伝子のセットの可能な対立遺伝子状態に関する仮説を指し得る。いくつかの実施形態において、使用される技術、アルゴリズム、又は方法は、上述のように、関連個体がハプロタイプブロックを共有し得るという事実を利用し、これは、完全に測定されなかった遺伝子データの再構築を助け得る。対立遺伝子仮説はまた、ある場合には、関連する個体からのどの染色体、又は染色体セグメントが、個体からの所与の染色体に遺伝的に対応するかに関する仮説を指し得る。減数分裂の理論は、個体の各染色体が２つの親のうちの１つから継承されていることを示しており、これは親の染色体のほぼ同一のコピーである。したがって、親のハプロタイプ、すなわち、親の段階的な遺伝子型が知られている場合、子供の遺伝子型も推測され得る（ここでの「子供」という用語は、２つの配偶子、１つは母親から、もう１つは父親から形成された個体を含むことを意味する）。本開示の一実施形態において、対立遺伝子仮説は、目的の染色体又は染色体セグメントでのハプロタイプを含む対立遺伝子のセットでの可能な対立遺伝子状態、並びに関連する個体からのどの染色体が、対立遺伝子のセットを含有する染色体（複数可）に一致し得るかを説明する。

【0152】

仮説のセットが定義されると、アルゴリズムは入力遺伝子データを操作し、検討中の仮説の各々について決定された統計的確率を出力する。例えば、本発明の実施形態において、本方法は、遺伝子データを各仮説についての予測結果と比較することによって確率値を決定し、確率値は、サンプルが、仮説に関連する染色体又は染色体セグメントの特定の数のコピーを有する尤度を示す。

【0153】

様々な仮説の確率は、関連する遺伝子データを入力として使用して、様々な仮説の各々について、本開示の他の場所に記載される専門家技術、アルゴリズム、及び／又は方法のうちの１つ以上によって述べられるように、確率が等しい値を数学的に計算することによって決定することができる。

【0154】

【0155】

「確率を組み合わせること」、又は「仮説を組み合わせること」とも呼ばれる、又は専門家の技術の結果を組み合わせることのプロセスは、線形代数の当業者によく知られているべき概念である。本発明の例示的な方法において、異数性の有無を決定するため、又は各々が確率を提供する染色体のコピー数を決定するために、２つの方法が利用される。特定の例示的な実施形態において、決定の信頼性は、各方法について選択される信頼性を組み合わせることによって増加される。例えば、定量的対立遺伝子解析を実行する第１の方法についての信頼性は、定量的非対立遺伝子解析を実行する第２の方法からの信頼性と組み合わせることができる。

【0156】

尤度が、尤度が第２の方法について決定される方法に対して直交するか、又は無関係の方法で第１の方法によって決定される場合では、尤度を組み合わせることは簡単であり、乗算及び正規化によって行うことができ、又は以下のような式を使用することによって行うことができる。
Ｒ_ｃｏｍｂ＝Ｒ_１Ｒ_２／［Ｒ_１Ｒ_２＋（１－Ｒ_１）（１－Ｒ_２）］

【0157】

式中、Ｒ_ｃｏｍｂは、結合尤度であり、Ｒ_１及びＲ_２は、個々の尤度である。第１の方法と第２の方法が直交していない場合、すなわち、この２つの方法の間に相関関係がある場合にも、数学はより複雑になるかもしれないが、尤度を組み合わせることができる。

【0158】

いくつかの実施形態において、第１の確率及び第２の確率は、確率を組み合わせる工程の前に異なるように加重される。いくつかの実施形態において、第１の確率及び第２の確率は、２つの確率値を組み合わせる工程の目的のために、独立したイベントとみなされる。いくつかの実施形態において、第１の確率及び第２の確率は、２つの確率値を組み合わせる工程の目的のために、依存したイベントとみなされる。いくつかの実施形態において、本方法は、第３の確率値を取得することを更に含み、第３の確率値は、標的のゲノムが、特定の仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示し、第３の確率値は、非遺伝子臨床アッセイである情報に由来する。多くの非遺伝的臨床アッセイは、特定の染色体コピー数又は染色体セグメントコピー数との既知の確率的相関を有する。各仮説について、組み合わされた第１及び第２の確率値を第３の確率値と組み合わせて、標的細胞のゲノムが対象の染色体又は染色体セグメントのコピー数を有する尤度を示す組み合わされた確率値を与えてもよく、その数は、特定の仮説に関連付けられる。そのような非遺伝的臨床アッセイの例としては、頸部半透明性測定が挙げられる。いくつかの実施形態において、非遺伝的臨床アッセイは、ベータ－ヒト絨毛性ゴナドトロピン、妊娠関連血漿タンパク質Ａ、エストリオール、インヒビン－Ａ、及びアルファ－フェトタンパク質の測定からなる群から選択される。

【0159】

理論に限定されないが、以下の開示は、確率を組み合わせる方法を更に教える。確率を組み合わせる１つの可能な方法は、以下の通りである：遺伝子データのセットを与えられた仮説のセットを評価するために専門家の技術を使用する場合、方法の出力は、仮説のセット内の各仮説に１対１の方法で関連付けられる確率のセットである。各々がセット内の仮説のうちの１つに関連付けられている第１の専門家技術によって決定された確率のセットが、各々が同じ仮説のセットに関連付けられている第２の専門家技術によって決定された確率のセットと組み合わされると、確率の２つのセットが乗算される。これは、セット内の各仮説について、２つの専門家の方法によって決定されるように、その仮説に関連する２つの確率が一緒に乗算され、対応する積が出力確率であることを意味する。このプロセスは、任意の数の専門技術に拡張されてもよい。１つの専門技術のみが使用される場合、出力確率は、入力確率と同じである。２つ以上の専門技術が使用される場合、次いで、関連する確率は、同時に乗算されてもよい。積は、仮説のセットにおける仮説の確率が１００％になるように正規化され得る。

【0160】

いくつかの実施形態において、所与の仮説についての組み合わされた確率が、他の仮説のいずれかについての組み合わされた確率よりも大きい場合、その仮説が最も可能性が高いと決定されると考えられ得る。いくつかの実施形態において、仮説は、最も可能性が高いと決定されてもよく、正規化された確率が閾値よりも大きい場合、倍数性状態、又は他の遺伝子状態がコールされてもよい。一実施形態において、これは、その仮説に関連する染色体の数及び同一性が、倍数性状態として呼ばれてもよいことを意味する。一実施形態において、これは、その仮説に関連する対立遺伝子の同一性が対立遺伝子状態と呼ばれることを意味する。いくつかの実施形態において、閾値は、約５０％～約８０％である。いくつかの実施形態において、閾値は、約８０％～約９０％である。いくつかの実施形態において、この閾値は、約９０％～約９５％である。いくつかの実施形態において、この閾値は、約９５％～約９９％である。いくつかの実施形態において、この閾値は、約９９％～約９９．９％である。いくつかの実施形態において、閾値は、９９．９％を超える。他の実施形態において、一組のルールは、組み合わされた確率閾値が設定されているが、異なるシナリオが考慮され得、確率閾値の結果を上書きし得るか、又は組み合わされた確率のコール能力を強化するために使用され得るサンプルの最終リスクコールに使用される。例えば、所与の倍数性仮説の確率に大きな差がある場合、例えば、方法のうちの１つにエラーがあったかどうかを決定するために、更なる分析を行うことができる。

【0161】

本発明のいくつかの実施形態は、より大きな患者セットから患者の部分集合を生成する工程を採用している。患者の元のセットは、分析のための標的細胞及び非標的細胞の供給源として使用される。本発明のいくつかの実施形態において、患者から得られたＤＮＡサンプルは、ＤＮＡシーケンサ上で配列決定されるために、標準的な分子生物学的技術を使用して修飾される。いくつかの実施形態において、この技術は、ＤＮＡ配列決定手順のためのプライミング部位を含有する遺伝子ライブラリを形成することを伴う。いくつかの実施形態において、複数の遺伝子座が、部位特異的増幅のために標的化されてもよい。いくつかの実施形態において、標的遺伝子座は、多型遺伝子座、例えば、一塩基多型である。遺伝子ライブラリの形成を意味する実施形態において、ライブラリは、患者に特異的なＤＮＡ配列、例えば、バーコード化を使用してコードすることができ、それによって、高スループットＤＮＡシーケンサの単一のフローセル（又はフローセル当量）において複数の患者を分析することを可能にする。サンプルはＤＮＡシーケンサフローセル内で一緒に混合されるが、バーコードの配列の決定は、配列決定されたＤＮＡに寄与した患者源の同定を可能にする。

【0162】

当業者であれば、標的ＤＮＡが特定の遺伝子座に対して濃縮されていない本発明のこれらの実施形態において、ゲノム全体が配列決定され得るが、配列の完全なゲノムへの組み立ては、本発明の方法の使用のために必要とされないことを理解するであろう。特定の遺伝子座に関する情報は、全てのゲノム配列決定から容易に決定され得る。

【0163】

本開示の一実施形態において、信頼度は、胎児の倍数性状態の決定の精度に基づいて計算されてもよい。一実施形態において、最大尤度（Ｈ_{ｍａｊｏｒ}）の仮説の信頼度は、（１－Ｈ_{ｍａｊｏｒ}／Σ（全てＨ））として計算されてもよい。仮説の全ての分布が既知である場合、仮説の信頼度を決定することが可能である。親遺伝子型情報が既知であれば、全ての仮説の分布を決定することが可能である。正倍数体胎児についてのデータの予測分布の知識及び異数体胎児についてのデータの予測分布が既知である場合、倍数体決定の信頼度を計算することが可能である。親の遺伝子型データが既知である場合、これらの予測分布を計算することが可能である。一実施形態において、正規の仮説の周り及び異常な仮説の周りの検査統計の分布の知識を使用して、コールの信頼性の両方を決定し、より信頼性の高いコールを行うために閾値を改良し得る。これは、混合物中の胎児ＤＮＡの量及び／又はパーセントが低い場合に特に有用である。Ｚ統計量などの検査統計量が、胎児ＤＮＡの割合が高い場合に最適化された閾値に基づいて作成された閾値を超えないため、実際に異数体である胎児が正倍数体であることが判明する状況を回避するのに役立つ。

【0164】

対立遺伝子及び非対立遺伝子データを組み合わせることによって、目的の染色体又は染色体セグメントのコピー数を決定するための方法
本発明の他の実施形態は、胎児細胞又は腫瘍細胞などの標的細胞のゲノムにおける目的の染色体又は染色体セグメントのコピー数を決定する方法を含む。遺伝子データ、例えば、ＤＮＡ配列データは、１つ以上の標的細胞に由来するＤＮＡ及び１つ以上の非標的細胞に由来するＤＮＡを含むＤＮＡの混合物から得ることができる。この方法は、単一の患者又は患者のセットを用いることができる。遺伝子データは、患者から得られる。遺伝子情報は、複数の遺伝子座で取得される。少なくともいくつかの遺伝子座、及び全ての遺伝子座が多型である可能性がある。標的細胞及び非標的細胞の両方において同じ遺伝子座を分析する。各遺伝子座についていくつかの配列リードが得られる。所与の遺伝子座における各対立遺伝子での配列リード数を定量する。得られた定量データは、標的細胞由来の遺伝子座と非標的細胞ゲノムとの組み合わせから得ることができる。次いで、収集されたデータを、複数のコピー数仮説、すなわち、目的の染色体又は染色体セグメントのコピー数に対して検定される。第１の確率値は、各仮説、すなわち、測定された遺伝子データを考慮して、その仮説が真又は偽のいずれかである確率について計算される。したがって、標的細胞のゲノムが、仮説によって指定された目的の染色体又は染色体セグメントのコピー数を有する尤度が決定される。この第１の確率値は、対立遺伝子データを使用して得られる。第２の確率値は、各仮説、すなわち、測定された遺伝子データを考慮して、その仮説が真又は偽のいずれかである確率について計算される。したがって、標的細胞のゲノムが、仮説によって指定された目的の染色体又は染色体セグメントのコピー数を有する尤度が決定される。この第２の確率値は、非対立遺伝子データを使用して得られる。各仮説について、第１の確率値及び第２の確率値を、例えば、増殖によって組み合わせて、標的細胞のゲノムが、仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示す複合確率を与えることができる。標的細胞のゲノム中の目的の染色体又は染色体セグメントのコピー数は、最大の結合確率を有する仮説に関連する染色体又は染色体セグメントのコピー数を選択することによって決定することができ、目的のサンプル中の染色体又は染色体セグメントのコピー数の決定を行うために使用される。遺伝子データが妊婦の血液から得られた無細胞ＤＮＡから得られるいくつかの実施形態において、仮説は、母親が複数の胎児、例えば双子を身ごもっている状態を含むことができる。

【0165】

したがって、いくつかの実施形態において、遺伝子データは、患者のセットの各メンバーからの遺伝子座のセットで遺伝子データを与えるために、１つ以上の標的細胞に由来し、１つ以上の非標的細胞に由来するＤＮＡを含む混合物を同時に配列決定することによって得られる。いくつかの実施形態において、標的細胞は胎児細胞であり、非標的細胞は胎児の母親由来である。すなわち、非侵襲性出生前診断を対象とするいくつかの実施形態において、標的細胞は胎児細胞であってもよく、非標的細胞は母細胞であってもよい。本発明のいくつかの実施形態において、患者のサブセットを選択するために使用され得る仮説の例は、特定の染色体又は染色体セグメントが二倍体、すなわち、２コピーで存在するという仮説であり得る。分析のための染色体の例としては、そのセグメントを含む染色体１３、１８、２１、Ｘ及びＹが挙げられる。いくつかの実施形態において、コピー数について分析される染色体セグメントは、染色体２２ｑ１１．２、染色体１ｐ３６、染色体１５ｑ１１－ｑ１３、染色体４ｐ１６．３、染色体５ｐ１５．２、染色体１７ｐ１３．３、染色体２２ｑ１３．３、染色体２ｑ３７、染色体３ｑ２９、染色体９ｑ３４、染色体１７ｑ２１．３１、及び染色体の末端からなる群から選択される。

【0166】

いくつかの実施形態において、遺伝子座のセットは、染色体の選択された領域に存在する。いくつかの実施形態において、本方法は、異なる染色体又は染色体セグメントについて独立して行われる。患者のセット内の患者数に課される唯一の上限は、選択された特定のＤＮＡ配列決定技術（その配列決定技術と互換性のある患者多重化技術、例えば、バーコード化技術を含む）のＤＮＡ配列生成能力によって課される。例示的な実施形態において、患者セット内に少なくとも１０人の患者が存在する。いくつかの実施形態において、少なくとも２４人の患者が存在し、他の実施形態において患者セットは、少なくとも４８人の患者が存在し、他の実施形態において、患者セットは、患者セット内の少なくとも９６人の患者である。

【0167】

対立遺伝子及び非対立遺伝子データの組み合わせを使用して試験される仮説を用いて、染色体又は染色体セグメントのコピー数を決定する方法
実施形態は、遺伝子データが、標的細胞に由来するＤＮＡ及び非標的細胞に由来するＤＮＡから得られる、標的細胞のゲノム中の目的の染色体又は染色体セグメントのコピー数を決定する方法を含み、遺伝子データは、（ｉ）複数の多型遺伝子座からの定量的対立遺伝子データ、及び（ｉｉ）複数の多型及び／又は非多型遺伝子座からの定量的非対立遺伝子データを含む。本方法は、各仮説が、標的細胞のゲノム中の染色体又は染色体セグメントの特定のコピー数に関連付けられている複数の仮説を作成する工程を含む。確率値は、仮説ごとに計算され、確率値は、標的細胞のゲノムが、仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示し、第１の確率値は、対立遺伝子データ及び少なくとも１つの第１の遺伝子座から得られる非対立遺伝子データから導出される。例えば、仮説は、対立遺伝子データ及び非対立遺伝子データの両方を組み込むモデルを使用して検証され得、それによって確率値を得る。各計算された確率値を組み合わせて、標的細胞のゲノムが、仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示す複合確率を与えることができる。標的細胞のゲノム中の目的の染色体又は染色体セグメントのコピー数は、最大確率を有する仮説に関連する染色体又は染色体セグメントのコピー数を選択することによって決定される。遺伝子データが妊婦の血液から得られた無細胞ＤＮＡから得られるいくつかの実施形態において、仮説は、母親が複数の胎児、例えば双子を身ごもっている状態を含むことができる。

【0168】

いくつかの実施形態において、各仮説についての確率値は、単一の遺伝子座から得られる対立遺伝子及び非対立遺伝子データから得られる。いくつかの実施形態において、対立遺伝子データは、各仮説に関連する可能性のある対立遺伝子比の分布に基づいてモデル上で試験される。いくつかの実施形態において、各仮説についての確率値は、少なくとも１０００の多型遺伝子座からの遺伝子データについて別個に決定される。いくつかの実施形態において、各仮説の確率値を計算する工程は、（１）非標的細胞由来のＤＮＡを含む得られた遺伝子データに基づいて、各仮説についての標的細胞由来のＤＮＡからの予測される遺伝子データをモデリングする工程と、（２）各仮説について、標的細胞由来のＤＮＡからのモデル化された遺伝子データと、標的細胞由来のＤＮＡから得られた遺伝子データとを比較する工程と、（３）標的細胞由来のＤＮＡからのモデル化された遺伝子データと、標的細胞由来のＤＮＡから得られた遺伝子データとの差に基づいて、各仮説についての確率値を計算する工程とを含む。いくつかの実施形態において、非標的細胞は、標的細胞が由来する個体の親由来であり、予測される遺伝子データのモデリングは、本明細書に開示されるように、メンデル遺伝の規則を使用して標的細胞の予測される遺伝子データを決定し、標的細胞の予測される遺伝子データを調整して、システム内のバイアスを修正することを更に含む。このようなシステムバイアスの例としては、増幅バイアス、配列決定バイアス、処理バイアス、濃縮バイアス、及びそれらの組み合わせが挙げられる。そのようなバイアスの性質は、特定の実施形態の実施のために選択された特異的増幅技術、配列決定技術、処理、濃縮技術などに従って変化し得る。いくつかの実施形態において、標的細胞は、胎児由来であり、予測される遺伝子データは、胎児の親からの遺伝子データ及び胎児からの遺伝子データを含む。いくつかの実施形態において、遺伝子データのモデリングは、各遺伝子座について、その遺伝子座における対立遺伝子測定値の予測分布を予測し、各遺伝子座について、その遺伝子座におけるＤＮＡの予測相対量（リード深度）を予測する工程を含む。いくつかの実施形態において、対立遺伝子測定値の予測分布の予測は、ゲノム上の異なる遺伝子座間の連鎖及び乗換えを考慮に入れることができる。いくつかの実施形態において、予測分布は、二項分布である。

【0169】

定量的非対立遺伝子最大尤度法（「ＱＭＭ」）の例
標的個体における目的の染色体のコピー数を決定するために使用され得る定量的方法の例を、本明細書に提供する。この実施例は、標的染色体（すなわち、目的の染色体）と同じであるが、同様又は同一の方法で処理された他のサンプルで見出される参照染色体を使用した標的染色体データの正規化を伴うことに留意されたい。本方法は、非侵襲性出生前異数性検査の文脈で記載され、標的個体は胎児であり、配列決定されるＤＮＡは、胎児ＤＮＡ、及び場合によっては、例えば、母体血漿中に見出される母体ＤＮＡを含む。非侵襲性出生前異数性検査は、母体血漿中の遊離浮遊胎児ＤＮＡに基づいて、胎児の染色体コピー数を決定しようとする。定量的方法において、染色体コピー数分類は、各染色体にマッピングする配列リード数に基づく。血漿中の胎児画分を推定することを除いて、親遺伝子型又は対立遺伝子情報のいずれも使用されない。この標的化配列決定アプローチにおいて、各標的ＳＮＰ（一塩基多型）における配列リード数は、スライドウィンドウ平均リード深度、又は同様の平均アプローチを使用する傾向がある非標的化配列決定アプローチとは対照的に、有益である。推定される胎児画分に基づいて、最大尤度推定は、モノソミー、ダイソミー、及びトリソミーを含むコピー数仮説のセットに基づいて計算される。この例では、染色体のセグメンタルエラーは考慮されず、同じ染色体上の全ての位置が同じコピー数を有すると仮定される。当業者には、この方法を染色体セグメントコピー数バリアントに適用する方法が明らかであるべきである。また、胎児又は母親のゲノムの非均一なフラグメント化を組み込んでもよく、これは、本明細書では行われない。

【0170】

個々のＳＮＰのモデリング：この方法の基本的な仮定は、ゲノム位置で生成される配列リードの数は、主に、配列決定プロセスに入るその位置のゲノムコピーの数に依存することである。標的化配列決定アプローチは、多重化ＰＣＲに基づいており、これは、配列決定に入るゲノムコピーの数が、元のサンプル中の染色体コピー数と、ＰＣＲ増幅プロセスの詳細の両方によって決定されることを意味する。したがって、この方法は、多重ＰＣＲ及び高スループット配列決定の両方の簡略化されたモデルを必要とする。

【0171】

元のサンプルでは、染色体コピー数の変動によるものを除いて、ゲノムコピーの量が全ての位置で同じであると仮定することができる。しかしながら、ＰＣＲプロセスにおいて、各標的位置は、異なる効率で増幅される。ＫのＰＣＲサイクルの各々について、位置ｉは、因子ａ_ｉによって増幅される。その位置での観察されたリードの数は、ｘ_ｉである。このモデルは、式１のように記述することができ、サンプル因子ｃ_ｓは、サンプルごとに一定であり、サンプルパラメータ、例えば、ＤＮＡの初期量及び配列リードの総数を表す。サンプル特異的増幅因子と考えることができる。染色体コピー数ｎ_ｉは、位置ｉが位置する染色体の倍数性状態又はコピー数である。

【数1】

【0172】

しかしながら、実験条件のわずかな変動は、様々なＰＣＲ標的の増幅効率が完全に一定ではないことを意味する。これは、各標的の増幅効率について、乗算ノイズ項ε_ｉによって表される。したがって、モデルは、式２に拡張される。
ｘ_ｉ＝ｃ_ｓｎ_ｉ（ａ_ｉ∈_ｉ）^ｋ（２）

【0173】

モデルの乗法的な性質上、ログ空間で作業し、次にｌｏｇｘ_ｉの予測及び分散を考慮することが有利である。ログノイズの期待値がゼロであると仮定することができる。これは、ゼロ平均ノイズを想定した場合とはまったく同じではないが、式３に示すように、数学を実行可能にする。
Ｅｌｏｇｘ_ｉ＝ｌｏｇｎ_ｉ＋ｋｌｏｇａ_ｉ
Ｖｌｏｇｘ_ｉ＝ｋ^２Ｖｌｏｇ ∈_ｉ（３）

【0174】

サンプル正規化は、２に等しいコピー数を有することが知られている、仮定されている、又は仮定されている染色体上に位置する位置から測定されたリードを考慮することによって達成することができる。他の参照染色体、例えば染色体１及び２を使用するなどの他のサンプル正規化方法が存在し、これらは、ダイソミックであることが知られている。Ｄは、ダイソミックであると仮定される染色体上に位置する位置ｉの集合であるとする。サンプルノーマライザＴ_ｓは、式４に詳述される、Ｄにおける位置ｉにわたる平均対数カウントとして定義される。これは、各サンプルから直接測定することができるため、更なる計算のために既知の量とみなされる。
Ｔ_ｓ＝Ｅ_ｉ∈_Ｄｌｏｇｘ_ｉ
＝ｌｏｇｃ_ｓ＋ｌｏｇ２＋ｋＥ_ｉ ∈_Ｄｌｏｇａ_ｉ（４）

【0175】

トレーニングデータからモデルを構築する：個々のＳＮＰの効率のためのモデルは、既知の染色体コピー数及び胎児画分を有するトレーニングデータの集合から構築することができる。理想的なケースでは、妊娠していない（正倍数体）女性から血漿を採取するため、胎児画分はゼロであり、異数体は存在しない。この場合、全てのサンプルは、全ての標的のモデルのデータに寄与する。より困難なケースでは、既知の染色体コピー数を有する妊娠血漿を使用し、異数体サンプルをデータセットから除外する。したがって、モデルは依然として、全ての染色体がダイソミーと比較して同じコピー数を有するデータから構築される。

【0176】

ｙ_ｉを、位置ｉにおける対数空間正規化されたリード深度とする。１つは、ｙ_ｉ（５）のサンプルの集合にわたる平均としてβ_ｉを定義し得る。用語β_ｉは、その増幅効率がダイソミー上の位置の平均増幅効率とどのように比較されるかを測定する位置ｉの対数空間増幅モデルである。
ｙ_ｉ＝ｌｏｇｘ_ｉ－Ｔ_ｓ
＝ｋｌｏｇａ_ｉ＋ｋｌｏｇ ∈_ｉ－ｋＥ_ｉ ∈_Ｄｌｏｇａ_ｉ
β_ｉ＝Ｅ_ｓｙ_ｉ
＝ｋｌｏｇａ_ｉ－ｋＥ_ｉ ∈_Ｄｌｏｇａ_ｉ（５）

【0177】

同様に、σ_ｉは、ｙ_ｉのサンプルにわたる標準偏差として定義される。β_ｉの集合とσ_ｉの集合とを組み合わせて、ＳＮＰの集合ｉについての増幅モデル及び分散モデルを形成する。

【0178】

モデルの計算にはいくつかの微妙な点がある。最も重要なのは、モデルは、固定されたプロトコルに供される固定された集合の標的について一定のままではないことに留意することである。

【0179】

モデルは非常に類似しているが、複数の配列決定実行にわたって固定モデルを使用しようとする試みは、低い胎児画分で結果をもたらすのに十分な大きさのバイアスに苦しみ、別々の実験のために別々に訓練することによって排除されてもよい。その結果、いくつかの実施形態において、各配列決定実行がモデリングのために十分な数のサンプルを含むことを確実にすることが重要である。

【0180】

実験内でさえ、典型的には、モデルに適合しないいくつかのサンプルが存在する。これらは、多くの場合、常に、後のセクションでより詳細に議論される遺伝子座ドロップアウトによって説明されるわけではない。異常値サンプルは、汚染レベル、スパイク比（ＤＮＡ開始量の尺度）、胎児画分、又は全体的なリード深度などの品質管理メトリックによって十分に予測されない。サンプルは、増幅モデル及びノイズモデルに関して各ＳＮＰ上の残差ｚを計算することによって適合性について試験される。
ｚ_ｉ＝（ｌｏｇｘ_ｉ－Ｔ_ｓ－β_ｉ）／σ_ｉ（６）

【0181】

更にｌｏｇ

【数2】

は、ゼロ平均ではなくガウスであるという仮定の下では、ｚ_ｉは標準正規分布に従って分布する必要がある。ダイソミー染色体残差Ｚ＝｛ｚ_ｉ：ｉ∈Ｄ｝の集合は、モデル適合のおおよそのメトリックとして分析される。胎児画分又は染色体コピー数にかかわらず、Ｚは標準的な正常値に従って分布する必要がある。コルモゴロフスミルノフ（ＫＳ）検定を使用して、残差の適合性を測定する。モデリングプロセスは、反復的な方法で実装され、各反復は、モデルの再計算を含み、その後、各サンプルのモデル適合のためのＫＳ検査が続く。外れ値サンプルは、メンバーシップが定数セットに収束するまで、各反復でトレーニングセットから削除される。

【0182】

検定統計量の形成及びＳＮＰ相関のモデリング：染色体コピー数分類の検査統計は、染色体上の全ての位置で正規化された測定値を平均化することによって形成することができる。検定統計量の分散を最小限に抑えるために、分散加重平均が選択される。上記で定義された正規化された測定値ｙ_ｉと考慮されたい。未知のコピー数ｎ_ｉを有する染色体上の位置について、ｙ_ｉは、式７に記載される性質を有する。

【数3】

【0183】

Ｓを現在の染色体上の位置の集合とする。染色体検定統計量ｔは、ＳにおけるＳＮＰｉにわたって平均された、ｙ_ｉの分散加重平均として定義される。

【数4】

【0184】

ｔの予測値は、最大尤度推定値のガウスモデルを形成するために、各染色体コピー数仮説の下で計算される。各仮説についてのモデルの分散は、測定値間の相関を考慮していない以前に行われた仮定から一意に従うものではない。ｔ上で観察された分散が、そのモデルが示唆するよりもはるかに高かったため、無相関測定の最も単純な仮定は破棄された。相関についての任意の物理的説明を示唆することなく、ｙ_ｉとｙ_ｊとの共分散がρσ_ｉσ_ｊであり、同じ染色体上の全ての位置ｉとｊとの間の一定の相関係数に対応する単一パラメータ相関モデルが提案される。このモデルは、単一のパラメータを使用して、無相関モデルによって暗示されるものを超えた追加の分散を表す。定数相関モデルを使用するｔの分散は、既知の相関を有する正規分布の合計の分散のための式から直接続く式９に示される。（ガウスノイズの仮定は、全体を通して継続される。）

【数5】

【0185】

各染色体についてのρの最大尤度推定は、｛β_ｉ｝及び｛σ_ｉ｝の推定に続く同じモデリングデータから計算される。

【0186】

染色体コピー数分類は、上記のセクションで開発されたモデリングを利用した以下の工程で構成される。

【0187】

１．モデルの適合を確認する。ダイソミー染色体（１及び２）を使用して、提供されたモデルに関して残差のセットを計算し、ＫＳ検定を使用して、それらを標準正規分布と比較する。得られたｐ値が低すぎる場合、サンプルはモデルに適合しないとみなされ、分類することができない。

【0188】

２．コピー数仮説の生成。供給された胎児画分を使用して、血漿コピー数は、各胎児コピー数仮説に対応して計算される。胎児コピー数仮説｛ｈ_１，ｈ_２，ｈ_３｝＝｛１，２，３｝について、血漿コピー数仮説は、式１０による胎児画分を使用して計算される。血漿コピー数は、仮説に依存する胎児コピー数と、２である母体コピー数との混合物である。
ｎ_ｉ＝ｆｈ_ｉ＋２（１－ｆ）（１０）

【0189】

３．仮説モデリング。検定統計量の予測値は、倍数性仮説に対応するｎ_ｉの値について計算される。これは、式７及び検定統計量の定義に従って行われる。検定統計量の分散モデルは、仮説に依存しない。

【0190】

４．尤度を計算する。検定統計量の値は、現在の染色体について観察される。各仮説のデータ尤度は、対応する正規分布の各々の下での検定統計量の尤度である。次いで、最大尤度推定値を報告するか、又は事前分布を使用して正規化することができる。

【0191】

非標的参照染色体を含まないコピー数分類（「ＱＭＭ」法とも呼ばれる）
上述したように、標的染色体又は染色体セグメントとは異なる参照染色体又は染色体セグメントを用いることなく、染色体又は染色体セグメントのいずれも既知のコピー数を有しないと想定することが可能である。これは、染色体番号仮説に条件付けられる、サンプル正規化Ｔ_ｓ及び線形シフトパラメータα_ｓを推定する代替の方法を必要とする。個々の染色体ごとにコピー数仮説を使用するアプローチとは異なり、この仮説空間は、全ての訓練染色体の結合仮説を含む。

【0192】

一実施形態において、結合仮説を個々の仮説に結び付けるために、以下の技術が使用されてもよい。訓練染色体ｋ∈｛１３，１８，２１｝について、ｐ（Ｄ｜ｈ_ｋ）、ｈ_ｋ∈｛１，２，３｝を、その染色体の個々のコピー数仮説に条件付けられたデータのｐｄｆとする。したがって、例えば、染色体１３の場合、以下のようになる：

【数6】

【0193】

仮説確率、すなわち、Ｐ（ｈ_ｋ＝１）＝Ｐ（ｈ_ｋ＝２）＝Ｐ（ｈ_ｋ＝３）＝１／３について等しい事前を仮定すると、上記のｐｄｆが計算される。Ｐ（Ｄ_１３｜ｈ_１８、ｈ_２１、ｈ_１３）を計算するために、仮説（ｈ_１８，ｈ_２１，ｈ_１３）に対応するＴ_ｓ及びα_ｓ推定値を使用し、分散加重平均検定統計量が計算される。同様に、他の訓練染色体、ｐ（Ｄ｜ｈ_１８）、ｐ（Ｄ｜ｈ_２１）のそれぞれのｐｄｆが計算される。等しい事前確率が仮定されるので、事後確率も計算される。

【数7】

【0194】

これは、訓練染色体の各々について信頼性を提供する正規化工程を表す。

【0195】

次に、残りの染色体の信頼度が計算される。このために、訓練染色体の結合仮説の推定値が得られる。

【数8】

【0196】

次いで、この仮説に対応するＴ_ｓ及びα_ｓの推定値を使用して、各検査染色体についての分散加重平均検査統計量を計算することができる。

【数9】

【0197】

この方法では、一定の相関係数モデルを使用して、特定の染色体のＳＮＰ間相関をモデル化することができる。例えば、特定の染色体ｋについて、ｙ_ｉ及びｙ_ｊの共分散は、上述したように、ρ_ｉσ_ｉσ_ｊである。染色体ＫがＮ_ｋ遺伝子座を有する場合、共分散行列は、以下によって与えられる：

【数10】

【0198】

これは、主対角線

【数11】

を有する行列を表し、非対角線要素は、ρ_ｋσ_ｉσ_ｊである。これは、Ｔ_ｓ及びα_ｓの各々についての最大尤度推定値を決定するためにも使用することができる。

【0199】

定量的対立遺伝子最大尤度法（「ＨＥＴ率」）の例
対立遺伝子最大尤度法を用いて倍数性状態を決定するための方法が本明細書で提供される。この方法は、ＮＩＰＴの文脈で例示されるが、当業者は、それが循環遊離腫瘍細胞の検出に利用され得ることを理解するであろう。以下の説明に加えて、ＨＥＴ率法を実装する方法の詳細な例は、とりわけ、公開された米国特許出願第２０１２／０２７０２１２Ａｌ号及び公開された米国特許出願第２０１１／０２８８７８０Ａｌ号に見出すことができ、これらの全ては参照によりそれらの全体が本明細書に組み込まれる。しかしながら、これらのソースに開示されているＨＥＴ率法は、別々の参照染色体からのデータを利用する。

【0200】

ＮＩＰＴの例では、母体血液から単離された遊離浮遊ＤＮＡ上で測定された配列データを与えられた胎児の倍数性状態であり、遊離浮遊ＤＮＡは、母体起源のいくつかのＤＮＡ、及び胎児／胎盤起源のいくつかのＤＮＡを含む。この例では、胎児の倍数性状態は、対立遺伝子最大尤度法及び分析された混合物中の胎児ＤＮＡの計算された画分を使用して決定される。また、混合物中の胎児ＤＮＡの画分又は胎児ＤＮＡのパーセンテージを測定することができる実施形態についても説明する。いくつかの実施形態において、画分は、胎児ＤＮＡと母体ＤＮＡとの混合物である母体血液サンプル自体に対して行われた遺伝子型決定測定値のみを使用して計算することができる。いくつかの実施形態において、画分は、また、母親の測定された又は他の方法で既知の遺伝子型及び／又は父親の測定された又は他の方法で既知の遺伝子型を使用して計算されてもよい。

【0201】

特定の染色体については、Ｎ個のＳＮＰが存在すると仮定し、その場合：
ＩＬＬＵＭＩＮＡデータからの親遺伝子型は、正しいと仮定される：母ｍ＝（ｍ_１，．．．，ｍ_Ｎ）、父＝（ｆ_１，．．．，ｆ_Ｎ）、式中、ｍ_ｉ、ｆ_ｉ∈（ＡＡ，ＡＢ，ＢＢ）。

【0202】

ＮＲ配列測定値のセットＳ＝（ｓ_１，．．．，ｓ_ｎｒ）。

【0203】

データから最も可能性の高いコピー数を導き出す
考慮される各コピー数仮説Ｈについて、染色体全体のデータｌｏｇ尤度ＬＩＫ（Ｈ）を導出し、ＬＩＫ、すなわち、以下を最大化する最良の仮説を選択する、

【数12】

式中、Ｐ（Ｈ）は、先行知識又は推定からの、仮説の先行確率である。

【0204】

考慮されるコピー数仮説は、以下の通りである：
モノソミー：
●母系Ｈ１０（母親から１コピー）
●父系Ｈ０１（父親からの１コピー）
ダイソミー：Ｈ１１（母親及び父親各々１コピー）
単純なトリソミー、乗換え考慮なし：
●母系：Ｈ２１＿ＭＡＴＣＨＥＤ（母親からの２つの同一のコピー、父親からの１つのコピー）、Ｈ２１＿ＵＮＭＡＴＣＨＥＤ（母親からの両方のコピー、父親からの１つのコピー）
●父系：Ｈ１２＿ＭＡＴＣＨＥＤ（母親からの１つのコピー、父親からの２つのコピー）、Ｈ１２＿ＵＮＭＡＴＣＨＥＤ（母親からの１つのコピー、父親からの両方のコピー）
乗換えを可能にする複合トリソミー（結合分布モデルを使用）：
●母系Ｈ２１（母親から２つのコピー、父親から１つのコピー）、
●父系のＨ１２（母親から１つのコピー、父親から２つのコピー）

【0205】

乗換えがない場合、起点が有糸分裂、減数分裂Ｉ、又は減数分裂ＩＩのいずれであるかにかかわらず、各トリソミーは、マッチするトリソミー又はマッチしないトリソミーのうちの１つになるであろう。乗換えのため、真のトリソミーは２つの組み合わせである。まず、単純な仮説のための仮説尤度を導出する方法が記載されている。次いで、個々のＳＮＰ尤度を乗換えと組み合わせて、複合仮説の仮説尤度を導出する方法が記載される。当初、真の子画分及びベータノイズパラメータ（Ｎ）及び可能なエラー率などの他のパラメータが既知であると仮定される。データから子画分ｃｆを導出する方法もまた、以下で説明される。

【0206】

単純仮説のＬＩＫ（Ｄ｜Ｈ）
単純な仮説Ｈ、ＬＩＫ（Ｄ｜Ｈ）について、染色体全体で仮説Ｈが与えられたデータの対数尤度は、個々のＳＮＰのｌｏｇ尤度の合計として計算される。すなわち、以下の通りである：

【数13】

【0207】

この仮説は、ＳＮＰ間の連鎖を想定しておらず、したがって、結合分布モデルを利用していない。

【0208】

ＳＮＰ当たりのｌｏｇ尤度
特定のＳＮＰｉ上で、ｍ_ｉ＝真の母系遺伝子型、ｆ_ｉ＝真の父系遺伝子型、及びｃｆ＝既知又は導出された子画分を定義する。Ｘ_ｉ＝Ｐ（Ａ｜ｉ，Ｓ）を、配列測定値Ｓを考慮して、ＳＮＰｉ上にＡを有する確率とする。子仮説Ｈを仮定すると、ＳＮＰｉ上で観測されたデータＤの対数尤度は、以下として定義される
Ｐ（Ｄ│ｍ，ｆ，ｃ，Ｈ，ｃｆ，ｉ）＝Ｐ（ＳＭ｜ｍ，ｉ）Ｐ（Ｍ│ｍ，ｉ）Ｐ（ＳＦ｜ｆ，ｉ）Ｐ（Ｆ│ｆ，ｉ）Ｐ（Ｓ│ｍ，ｃ，Ｈ，ｃｆ，ｉ）、
これにより、以下の結果になる：
ＬＩＫ（ｉ，Ｈ）＝ｌｏｇｌｉｋ（ｘ_ｉ│ｍ_ｉ，ｆ_ｉ，Ｈ，ｃｆ）＝Σ_ｃｐ（ｃ│ｍ_ｉ，ｆ_ｉ，Ｈ）＊ｌｏｇｌｉｋ（ｘ_ｉ｜ｍ_ｉ，ｃ，ｃｆ），
●
式中、ｐ（ｃ│ｍ，ｆ，Ｈ）は、親ｍ，ｆが与えられ、仮説Ｈが仮定される場合に、真の子の遺伝子型＝ｃを得る確率であり、これは容易に計算することができる。例えば、Ｈ１１、Ｈ２１マッチ及びＨ２１マッチしないについて、ｐ（ｃ｜ｍ，ｆ，Ｈ）を以下に示す。

【表1】

【0209】

Ｐ（Ｄ｜ｍ，ｆ，ｃ，Ｈ，ｉ，ｃｆ）は、真の母系遺伝子型ｍ、真の父系遺伝子型ｆ、真の子の遺伝子型ｃ、仮説Ｈ、及び子画分ｃｆが与えられた、ＳＮＰｉに関する所与のデータＤの確率である。次のように、母親、父親、及び子供のデータの確率に分けることができる：
Ｐ（Ｄ│ｍ，ｆ，ｃ，Ｈ，ｃｆ，ｉ）＝Ｐ（ＳＭ｜ｍ，ｉ）Ｐ（Ｍ│ｍ，ｉ）Ｐ（ＳＦ｜ｆ，ｉ）Ｐ（Ｆ│ｆ，ｉ）Ｐ（Ｓ│ｍ，ｃ，Ｈ，ｃｆ，ｉ）。

【0210】

ｌｉｋ（ｘｉ｜ｍ，ｃ，ｃｆ）は、仮説Ｈが真である場合にｘ_ｉが従うべきである分布のｐｄｆｘ（ｘ_ｉ）として定義される真の母ｍ、真の子ｃを仮定して、ＳＮＰｉ上で導出確率ｘ_ｉを得る尤度である。具体的には、ＬＩＫ（ｘ_ｉ｜ｍ，ｃ，ｃｆ）＝ｐｄｆｘ（ｘ_ｉ）。

【0211】

Ｓ内のＮＲ配列のＤｉがＳＮＰｉまで並ぶ単純な場合において、Ｘ～（１／Ｄ_ｉ）Ｂｉｎ（ｐ，Ｄ_ｉ）、式中、ｐ＝ｐ（Ａ｜ｍ，ｃ，ｃｆ）＝Ａを得る確率は、この母子混合物について、以下のように計算される。

【数14】

式中、＃Ａ（ｇ）＝遺伝子型ｇにおけるＡの数、ｎ_ｍ＝２は母のソミー（ｓｏｍｙ）であり、ｎ_ｃは子のソミーである（モノソミーの場合は１、ダイソミーの場合は２、トリソミーの場合は３）。最初のｃｆは、例えば、対立遺伝子比率プロットを使用して決定されてもよい。

【0212】

ｃｆ_{ｃｏｒｒｅｃｔ}は、混合物中の子の補正された画分である：

【数15】

【0213】

子供がダイソミーｃｆ_{ｃｏｒｒｅｃｔ}＝ｃｆである場合、しかしながら、この染色体の混合物中の子供のトリソミー画分は、実際には少し高い：

【数16】

【0214】

正確な位置合わせが存在しないより複雑な場合において、Ｘは、ＳＮＰ当たりの可能なＤ_ｉ個の読み取りにわたって積分された二項関数の組み合わせである。

【0215】

結合分布モデルを使用する：複合仮説に対するＬＩＫ（Ｈ）
トリソミーは、通常、乗換えのために純粋にマッチし、マッチしないわけではないため、このセクションでは、複合仮説Ｈ２１（母系トリソミー）及びＨ１２（父系トリソミー）の結果が導出され、マッチするトリソミー及びマッチしないトリソミーを組み合わせて、乗換えの可能性を説明する。

【0216】

トリソミーの場合、乗換えがなかった場合、トリソミーは、単純にマッチするか、又はマッチしないトリソミーとなる。マッチするトリソミーは、子が一方の親から同一の染色体セグメントの２つのコピーを継承する場合である。マッチしないトリソミーは、子が親から各相同染色体セグメントの１つのコピーを継承する場合である。乗換えのために、染色体のいくつかのセグメントは、マッチするトリソミーを有し得、他の部分は、マッチしないトリソミーを有し得る。このセクションでは、対立遺伝子のセットのヘテロ接合率の結合分布モデルを構築する方法について説明する。

【0217】

ＳＮＰｉ上で、ＬＩＫ（ｉ，Ｈｍ）がマッチする仮説Ｈの適合性であり、ＬＩＫ（ｉ，Ｈｕ）がマッチしない仮説Ｈの適合性であり、ｐｃ（ｉ）＝ＳＮＰｉ－１，ｉ間の乗換えの確率であると仮定する。次いで、以下のように全尤度を計算することができる：
ＬＩＫ（Ｈ）＝Σ_Ｓ、ＥＬＩＫ（Ｓ、Ｅ、１：Ｎ）
式中、ＬＩＫ（Ｓ、Ｅ、１：Ｎ）は、ＳＮＰ１：Ｎについて、仮説Ｓで始まり、仮説Ｅで終わる尤度である。Ｓ＝最初のＳＮＰの仮説、Ｅ＝最後のＳＮＰ、Ｓ、Ｅ∈（Ｈｍ，Ｈｕ）の仮説。再帰的には、以下を計算することができる：

【数17】

式中、～Ｅは、他の仮説である（Ｅではない）。具体的には、１：ｉのＳＮＰの尤度に基づいて、１：（ｉ－１）のＳＮＰの尤度を計算することができ、同一の仮説を持ち、乗換え又は反対の仮説を持たず、乗換えにＳＮＰｉの尤度を掛ける。

【0218】

次いで、

【数18】

について、次のように計算する：
ＬＩｋ（Ｓ，Ｅ，１：２）＝ＬＩＫ（２，Ｅ）＋ｌｏｇ（ｅｘｐ（ＬＩＫ（Ｓ，Ｅ，１））＊（１－ｐｃ（２））＋ｅｘｐ（ＬＩＫ（Ｓ，～Ｅ，１））＊ｐｃ（２））
ｉ＝Ｎまで続く。

【0219】

子画分の導出
上記の数式は、既知の子画分を想定しているが、必ずしもそうではない。一実施形態において、選択された染色体上のダイソミーの尤度を最大化することによって、最も尤度の高い子画分を見つけることが可能である。

【0220】

具体的には、ダイソミー仮説について、及び染色体ｃｈｒの子画分について、上記のようなＬＩＫ（ｃｈｒ，Ｈ１１，ｃｆ）＝対数尤度を仮定する。Ｃｓｅｔ内の選択された染色体について（通常１：１６）。その場合、完全な尤度は次の通りである：
●Ｌｉｋ（ｃｆ）＝Σ_{ｃｈｒ∈Ｃｓｅｔ}ＬＩｋ（ｃｈｒ，Ｈ１１，ｃｆ）、及び

【数19】

【0221】

染色体の任意のセットを使用することが可能である。次のように、父系データなしで子画分を導出することも可能である。

【0222】

父系のデータなしでコピー数を導出する
ＳＮＰｉ上の単純仮説対数尤度の式を思い出されたい。

【数20】

【0223】

親ｐ（ｃ│ｍ_ｉ，ｆ_ｉ，Ｈ）を与えられた真の子の確率を決定するには、父系遺伝子型の知識が必要である。父系遺伝子型が不明であるが、このＳＮＰ上のＡ対立遺伝子の集団頻度であるｐＡｉが既知である場合、上記の尤度を以下で近似することが可能である
ＬＩＫ（ｉ，Ｈ）＝ｌｏｇｌｉｋ（ｘ_ｉ│ｍ_ｉ，ｆ_ｉ，Ｈ，ｃｆ）＝Σ_ｃｐ（ｃ│ｍ_ｉ，Ｈ）＊ｌｏｇｌｉｋ（ｘ_ｉ│ｍ_ｉ，ｃ，Ｈ，ｃｆ）
式中、

【数21】

式中、ｐ（ｆ│ｐＡ_ｉ）は、ＳＮＰｉ上のＡの頻度を考慮した、特定の父系遺伝子型の確率である。

【0224】

具体的には、
ｐ（ＡＡ│ｐＡ_ｉ）＝（ｐＡ_ｉ）^２、ｐ（ＡＢ│ｐＡ_ｉ）＝２（ｐＡ_ｉ）＊（１－ｐＡ_ｉ）、ｐ（ＢＢ│ｐＡ_ｉ）＝（１－ｐＡ_ｉ）^２

【0225】

対照染色体又は染色体セグメントを使用しない訓練方法
３つのデータセグメントＤ_１、Ｄ_２、Ｄ_３を有すると仮定する。Ｐ（Ｈ）がセグメントＤ_１上の現在の優先度であると仮定する。Ｐが、分布Ｐ（ｐ）を有するパラメータ（例えば、子画分ｃｆ又はノイズパラメータｎｐ）であると仮定する。次いで、特定の仮説Ｈ（事前のＰ（Ｈ）を伴う）が真である確率は、次の通りである：

【数22】

これにより、以下の結果になる：

【数23】

又は、おおよそ、

【数24】

ここで、用語Ｐ（Ｄ_１｜Ｈ，ｐ）は、以下として書き換えることができる

【数25】

【0226】

したがって、

【数26】

式中、用語Ｐ（ｐ｜Ｄ_２，Ｄ_３）は、セグメントＤ_２及びＤ_３上の「訓練」から得られるパラメータ分布である。Ｐ（ｐ｜Ｄ_１）／Ｐ（ｐ）は、セグメント１についての実際の仮説が何であるかに依存し、不明である場合、削除されてもよい。近似はいくつかの情報を失うが、各ピースは確率スケール上にあり、グリッドポイント確率によってスケーリングされたグリッドポイントごとのコールに適合するため、より安定して直感的になる可能性がある。

【0227】

検査は、目的の染色体（複数可）又は染色体セグメント（複数可）のみで実行できるため、対照染色体又は染色体セグメントを必要としない場合、有意な処理上の利点を得ることができる。一実施形態において、目的の染色体又は染色体セグメント自体が、次いで、所与の仮説の正確さを評価するために使用することができるベースラインを提供する。例えば、以下の式を使用して

【数27】

上記の確率方程式は、以下のように書くこともできる：

【数28】

【0228】

この式では、確率Ｐ（Ｈ｜Ｄ_１，ｐ）は、グリッドポイントごとに得られ、次いで、Ｐ（ｐ，Ｄ_１，Ｄ_２，Ｄ_３）が与えられた最良のパラメータ分布推定によってスケーリングされる。グリッドポイントが固定されると、Ｐ（Ｈ｜Ｄ_１，ｐ）は変化しない。しかしながら、Ｐ（ｐ，Ｄ_１，Ｄ_２，Ｄ_３）について固定仮説が存在しない場合（すなわち、対照染色体又は染色体セグメントが使用されない場合）、Ｐ（Ｈ｜Ｄ_１，Ｄ_２，Ｄ_３）についての最終的な回答は、各セグメント仮説に先行して置かれるものに応じて大きく変化し得る。

【0229】

言い換えれば、全てのデータが与えられたパラメータ分布は、セグメントごとのパラメータ分布の複合であるため、

【数29】

式中、Ｐ（Ｇ）は、パラメータ推定の目的のためにこのセグメント上で事前に使用される仮説である。

【0230】

対照の欠如を説明するために、仮説Ｈについての均一な仮説事前ｆ_{ｐｒｉｏｒ}（Ｈ）が得られる。例えば、これは、上述した対立遺伝子比プロットを用いて子画分を推定することによって得られてもよい。次いで、各グリッドポイントｐについて、仮説の確率を計算する（「グリッドごとのコール」）。
Ｐ（Ｈ│Ｄ_１，ｐ）～Ｐ（Ｄ_１│Ｈ，ｐ）Ｐ（Ｈ）
式中、Ｐ（Ｈ）は、セグメントコールに先行して使用される仮説である。一実施形態において、これは、グリッド空間全体のコールのアイデアを提供するために一度だけ行われる。

【0231】

最初のパスについて、ｆ_{ｐｒｉｏｒ}（Ｈ）は、Ｐ（Ｈ）であるように設定される。次いで、各セグメントのパラメータ分布は、以下を使用して得られる：

【数30】

【0232】

次いで、複合パラメータ分布が得られる：

【数31】

【0233】

次いで、各仮説の（事後の）確率は、グリッドコールごとのパラメータスケーリングを組み合わせることによって得られる：

【数32】

【0234】

これは、セグメントごとの仮説の分布の新しい推定値を提供する。Ｆ_{ｐｒｉｏｒ}（Ｈ）は、新たに導出されたＰ（Ｈ│Ｄ_１，Ｄ_２，Ｄ_３）で更新することができ、プロセス（各グリッドポイントｐについての仮説の確率を計算することから始まる）は、収束するまで繰り返される。

【0235】

収束に達すると、全体的な尤度はもはやかなりの程度まで変化しない。一実施形態において、これは、最適化されるべき関数が、最良の導出された後方Ｐ（Ｈ）及びＰ（ｐ）分布によって最大化されるデータＰ（Ｈ│Ｄ_１，Ｄ_２，Ｄ_３）の尤度である、アニーリング問題として扱われ得る。すなわち、最大化する関数は以下の通りである：
Ｌ（Ｄ）＝Ｐ（Ｄ_１，Ｄ_２，Ｄ_３）～Σ_ＨΣ_ｐＰ（Ｄ│Ｈ，ｐ）Ｐ（Ｈ）Ｐ（ｐ）。

【0236】

次いで、最終確率（すなわち、コール）、子画分、及びノイズパラメータを有する仮説を出力することができる。

【0237】

本開示のある特定の実施形態において、異数性を決定するための本発明の方法は、ＤＮＡのサンプル中の遺伝子座の同じセットを含む２つ以上の異なるハプロタイプの相対比を決定するために使用することができる定量的対立遺伝子方法、技術、又はアルゴリズムを含むことができる。異なるハプロタイプは、１つの個体からの２つの異なる相同染色体、トリソミーの個体からの３つの異なる相同染色体、１つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの３つの異なる相同ハプロタイプ、１つ若しくは２つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの３つ若しくは４つのハプロタイプ、又は他の組み合わせを表すことができる。１つ以上のハプロタイプが既知である場合、又は１つ以上の個体の二倍体遺伝子型が既知である場合、ハプロタイプ間に多型である対立遺伝子のセットを選択することができ、平均対立遺伝子比は、ハプロタイプの各々に一意に由来する対立遺伝子のセットに基づいて決定することができる。

【0238】

しかしながら、そのようなサンプルの直接配列決定は、サンプル内の異なるハプロタイプ間で多型ではない領域についての多くの配列をもたらし、したがって、２つのハプロタイプの割合に関する情報を明らかにしないため、極めて非効率的である。本明細書では、配列決定によって得られる対立遺伝子情報の収率を増加させるために、ゲノム内で多型である可能性がより高いサンプル中のＤＮＡのセグメントを特異的に標的化し、濃縮する方法が記載される。濃縮されたサンプルで測定される対立遺伝子比率が実際のハプロタイプ比率を真に表すためには、標的セグメント内の所与の遺伝子座における他の対立遺伝子と比較して、１つの対立遺伝子の優先的な濃縮がほとんど又はまったくないことが重要であることに留意されたい。多型対立遺伝子を標的化する当該技術分野で既知の現在の方法は、存在する任意の対立遺伝子の少なくともいくつかが検出されることを確実にするように設計される。しかしながら、これらの方法は、元の混合物中に存在する多型対立遺伝子の対立遺伝子比を測定する目的で設計されていない。濃縮サンプル中の様々な対立遺伝子の割合が、元の非増幅サンプル中の対立遺伝子の割合とほぼ同じである、任意の特定の標的濃縮方法が、濃縮サンプルを生成することができることは明らかではない。濃縮方法は、理論的には、そのような目的を達成するように設計され得るが、当業者は、現在の方法には多数の確率論的又は決定論的バイアスが存在することを認識している。本明細書に記載される方法の実施形態において、ゲノム中の所与の遺伝子座に対応するＤＮＡの混合物中に見出される複数の対立遺伝子が増幅されるか、又は対立遺伝子の各々の濃縮度がほぼ同一であるような方法で優先的に濃縮されることを可能にする。別の言い方をすれば、この方法は、全体として混合物中に存在する対立遺伝子の相対量を増加させることを可能にするが、各遺伝子座に対応する対立遺伝子間の比率は、ＤＮＡの元の混合物中と本質的に同じままであることである。本開示の目的のために、比率が本質的に同じままであるために、得られた混合物中の対立遺伝子の比率で割った元の混合物中の対立遺伝子の比率が、０．５～１．５、０．８～１．２、０．９～１．１、０．９５～１．０５、０．９８～１．０２、０．９９～１．０１、０．９９５～１．００５、０．９９８～１．００２、０．９９９～１．００１、又は０．９９９９～１．０００１であることを意味する。

【0239】

対立遺伝子分布
特定の実施形態において、本方法の目的は、いくつかの遊離浮遊胎児ＤＮＡを含有する母体血液サンプルに基づいて、胎児コピー数を検出することである。いくつかの実施形態において、母親のＤＮＡと比較した胎児ＤＮＡの画分は不明である。ＬＩＰＳなどの標的化方法の組み合わせ、続いて配列決定は、各ＳＮＰでの各対立遺伝子に関連する観察された配列のカウントからなるプラットフォーム応答をもたらす。Ａ／Ｔ又はＣ／Ｇのいずれかの可能性のある対立遺伝子のセットは、各ＳＮＰで既知である。一般性を失うことなく、第１の対立遺伝子はＡと標識され、第２の対立遺伝子はＢと標識される。したがって、各ＳＮＰにおける測定値は、Ａ配列の数（Ｎ_Ａ）及びＢ配列の数（Ｎ_Ｂ）からなる。これらは、将来の計算の目的のために、総配列数（ｎ）及び総（ｒ）に対するＡ対立遺伝子の比率に変換される。単一のＳＮＰについての配列カウントは、リード深度と呼ばれる。このデータからのコピー数同定を可能にする基本的な原理は、Ａ配列及びＢ配列の比率が、測定されるＤＮＡに存在するＡ対立遺伝子とＢ対立遺伝子の比率を反映することである。
ｎ＝Ｎ_Ａ＋Ｎ_Ｂ
ｒ＝Ｎ_Ａ／（Ｎ_Ａ＋Ｎ_Ｂ）

【0240】

測定は、最初に、順序付けられていない親遺伝子型に基づいて、同じ親コンテキストからのＳＮＰにわたって集約される。各コンテキストは、合計９つのコンテキストについて、母系遺伝子型及び父系遺伝子型によって定義される。例えば、母系遺伝子型がＡＡであり、父系遺伝子型がＢＢである全てのＳＮＰは、ＡＡ｜ＢＢ文脈のメンバーである。Ａ対立遺伝子は、母系遺伝子型の比率ｒ_ｍ及び父系遺伝子型の比率ｒ_ｆで存在すると定義される。例えば、対立遺伝子Ａは、母親がＡＡである比率ｒ_ｍ＝１、及び父親がＡＢである比率ｒ_ｆ＝０．５で存在する。したがって、各コンテキストは、ｒ_ｍ及びｒ_ｆの値を定義する。子の遺伝子型は、必ずしも親遺伝子型から予測されるわけではないが、多数のＳＮＰにわたって平均化された対立遺伝子比率は、親ＡＢ遺伝子型が等しい割合でＡ及びＢに寄与するという仮定に基づいて予測され得る。

【0241】

ここで、ｎ_ｍは母系コピーの数であり、ｎ_ｒは染色体の父系コピーの数である（ｎ_ｍ，ｎ_ｆ）の形式の子のコピー数仮説を考慮する。小児における対立遺伝子比率ｒ_ｃの予測値（特定の親コンテキストにおけるＳＮＰにわたって平均化される）は、親コンテキストの対立遺伝子比率及び親コピー数に依存する。

【数33】

【0242】

母体及び胎児の血液の混合物では、対立遺伝子のコピーは、母親から直接及び子供からの両方から寄与される。混合物中に存在する子供のＤＮＡの画分がδであると仮定する。次いで、混合物では、所与の文脈におけるＡ対立遺伝子の比率ｒは、母親比率ｒ_ｍ及び子供比率ｒ_ｃの線形組み合わせであり、これは、式１を使用して、母親比率及び父親比率の線形組み合わせに還元され得る。

【数34】

【0243】

式２は、コピー数仮説（ｎ_ｍ，ｎ_ｆ）の関数として、所与の文脈におけるＳＮＰについてのＡ対立遺伝子の予測される比率を予測する。なお、個々のＳＮＰ上の対立遺伝子比率は、これらが、少なくとも一方の親がヘテロ接合性であるランダム割り当てに依存するため、この式によって予測されない。したがって、特定のコンテキスト内の全てのＳＮＰからの配列のセットが組み合わされる。コンテキストがｍ個のＳＮＰを含むと仮定し、ｎ個の配列が各ＳＮＰから生成されることを想起すると、そのコンテキストからのデータは、Ｎ＝ｍｎ個の配列からなる。Ｎ個の配列の各々は、Ａ個の配列の理論率が対立遺伝子比率ｒである独立したランダム試験とみなされる。したがって、Ａ配列の測定された速度

【数35】

は、平均ｒ及び分散σ^２＝ｒ（１－ｒ）／Ｎでガウス分布であることが知られている。

【0244】

理論上の対立遺伝子比は、親コピー数（ｎ_ｍ，ｎ_ｆ）の関数であることを想起されたい。したがって、各仮説ｈは、親コンテキストｉにおけるＳＮＰ

【数36】

についての対立遺伝子比率を予測する。データ尤度は、所与の仮説が観測されたデータを生成する確率として定義される。したがって、仮説ｈの下でのコンテキストｉ

【数37】

からの測定の尤度は、二項分布であり、これは、以下の平均及び分散を有するガウス分布として大きなＮについて近似することができる。平均は、式２に記載されるように、文脈及び仮説によって決定される。

【数38】

【0245】

９つのコンテキストの各々の測定値は、各ＳＮＰ上の独立したノイズの一般的な仮定に起因して、親コピー数を考慮して独立していると仮定される。したがって、特定の染色体からのデータは、１～９の範囲のコンテキストｉからの配列測定値からなる。したがって、全染色体

【数39】

から観察された対立遺伝子比の尤度は、個々の文脈の尤度の産物である。

【数40】

【0246】

パラメータ推定
式２は、親コピー数仮説の関数としての対立遺伝子比を予測するが、子供のＤＮＡの画分も含む。したがって、各染色体のデータ尤度は、

【数41】

に及ぼす影響を通じた関数である。この効果は、表記

【数42】

によって強調表示される。このパラメータは高精度に予測することができないため、データから推定する必要がある。いくつかの異なるアプローチが、パラメータ推定のために使用されてもよい。１つの方法は、検査が実行される開発の段階でコピー数エラーが実行可能でない染色体の測定を伴う。他の方法は、エラーが発生すると予測される染色体のみを測定する。

【0247】

ダイソミーであることが知られているいくつかの染色体を測定する
この方法では、検査を実行するときに発生状態でコピー数エラーが発生しない特定の染色体が測定される。これらの染色体は、トレーニングセットＴと呼ばれる。これらの染色体上のコピー数仮説は、（１，１）である。各染色体が独立していると仮定すると、Ｔにおける全ての染色体ｔからの測定値のデータ尤度は、個々の染色体尤度の積である。子画分δを選択して、ダイソミー仮説に条件付けられたＴの染色体にわたるデータ尤度を最大化することができる。Ｒ_ｔは、染色体ｔ上の全てのコンテキスト

【数43】

からの測定値ｉのセットを表す。次いで、最大尤度推定値δ^＊は、以下を解決する。

【数44】

【0248】

この最適化は、ゼロと１との間に制約された１つの自由度のみを有し、したがって、様々な数値方法を使用して容易に解くことができる。次いで、各染色体上の各仮説の尤度を計算するために、溶液δ^＊を式２に置換することができる。

【0249】

コピー数エラーがある可能性のある染色体のみを測定する
測定される全ての染色体でコピー数エラーが可能である場合、コピー数仮説と並行して胎児画分を推定すると、倍数決定の精度が大幅に増加する。なお、全ての測定された染色体に存在する同じコピー数エラーは、検出が非常に困難であることに留意されたい。例えば、いずれの場合も、父親対立遺伝子と比較して母親対立遺伝子の寄与は、全ての染色体及び文脈にわたって一様に増加するため、所与の小児濃度での全ての染色体上の母体トリソミーは、より低い小児濃度での全ての染色体上のダイソミー上のダイソミーと同じ理論的対立遺伝子比率をもたらすであろう。

【0250】

染色体ｔの限られたセットの分類のための単純なアプローチは、試験される全ての染色体についての仮説の結合セットからなる結合染色体仮説Ｈを考慮することである。染色体仮説がダイソミー、母体トリソミー、及び父体トリソミーからなる場合、考えられる結合仮説の数は、３^Ｔであり、Ｔは、検査された染色体の数である。最大尤度推定δ^＊（Ｈ）は、各結合仮説に条件付けて計算することができる。したがって、結合仮説の尤度は、以下のように計算される：

【数45】

【0251】

結合仮説尤度ｐ（全てのデータ｜Ｈ）は、各結合仮説Ｈについて計算することができ、最大尤度仮説は、子画分のその対応する推定δ^＊（Ｈ）を伴って選択される。

【0252】

性能仕様
親コピー数仮説を区別する能力は、前のセクションで説明したモデルによって決定される。最も一般的なレベルでは、異なる仮説の下での予測される対立遺伝子比の差は、測定の標準偏差と比較して大きくなければならない。ダイソミー及び母体トリソミー、又は仮説ｈ_１＝（１，１）及びｈ_２＝（２，１）を区別する例を考慮する。仮説１は、考慮されている文脈の母親対立遺伝子比ｒ_ｍ及び父親対立遺伝子比ｒ_ｆの関数として、対立遺伝子比ｒ^１及び仮説２は対立遺伝子比ｒ^２を予測する。

【数46】

【0253】

対立遺伝子比率の測定値

【数47】

は、仮説１又は２が真であるかどうかに応じて、平均ｒ^１又は平均ｒ^２のいずれかを有するガウス分布であると予測される。測定された対立遺伝子比の標準偏差は、式３による仮説に同様に依存する。測定値に基づいて仮説１又は２のいずれかを真として同定することが予測できるシナリオでは

【数48】

平均ｒ^１、ｒ^２及び標準偏差σ^１、σ^２は、平均が標準偏差と比較して遠く離れていることを保証する、以下のような関係を満たさなければならない。この基準は、２％のエラー率を表し、偽陰性又は偽陽性のいずれかの２％の確率を意味する。
｜ｒ^１－ｒ^２｜＞２σ^１＋２σ^２

【0254】

仮説１及び２のダイソミー（１，１）及び母体トリソミー（２，１）のコピー数を置き換えると、以下の状態になる：

【数49】

【0255】

本明細書で提供される方法で使用される分析方法の概要
本開示の実施形態の特定の例では、正倍数体であることが知られている親コンテキスト及び染色体を使用して、一組の同時方程式によって、母親からの母体血液中のＤＮＡの割合及び胎児からの母体血液中のＤＮＡの割合を推定することが可能である。これらの同時方程式は、父親に存在する対立遺伝子の知識によって可能になる。特に、父親に存在し、母親に存在しない対立遺伝子は、胎児ＤＮＡの直接測定を提供する。次いで、染色体２１などの特定の目的の染色体を見て、各親のコンテキストにおけるこの染色体上の測定値が、Ｈ_ｍｐなどの特定の仮説と一致しているかどうかを確認してもよく、式中、ｍは母体染色体の数を表し、ｐは父体染色体の数を表し、例えば、Ｈ_１１は正倍数体を表し、Ｈ_２１及びＨ_１２は母体及び父体トリソミーをそれぞれ表す。

【0256】

この方法は、染色体倍数体を検出するための特定の他の方法とは異なり、異数性の決定を行うために、目的の染色体上で観察された対立遺伝子の比率を比較するための基礎として参照染色体を使用しない。

【0257】

本開示は、母体血液中に見出される胎児ＤＮＡから決定された遺伝情報を用いて、１つ以上の染色体において、非侵襲性様式で、妊娠中の胎児の倍数性状態を決定し得る方法を提示する。胎児ＤＮＡは、精製されてもよく、部分的に精製されてもよく、又は精製されていなくてもよく、遺伝子測定は、２つ以上の個体に由来するＤＮＡに対して行われてもよい。インフォマティクスタイプの方法は、対立遺伝子のセットでのバルク遺伝子型測定から、倍数性状態などの標的個体の遺伝子情報を推測することができる。対立遺伝子のセットは、対立遺伝子の様々なサブセットを含み得、１つ以上のサブセットは、標的個体上に見出されるが非標的個体上に見出されない対立遺伝子に対応し得、１つ以上の他のサブセットは、非標的個体上に見出され、標的個体上に見出されない対立遺伝子に対応し得る。本方法は、様々な潜在的な倍数性状態を与えられた対立遺伝子の様々なサブセットについての測定された出力強度の比率を、予測される比率と比較することを伴っていてもよい。プラットフォーム応答が決定されてもよく、システムのバイアスに対する補正が方法に組み込まれてもよい。

【0258】

本方法の主な前提：
－母親からの母体血液中の遺伝物質の予想量は、全ての遺伝子座にわたって一定である。
－胎児からの母体血液中に存在する遺伝物質の予想量は、染色体が正倍数体であると仮定して、全ての遺伝子座にわたって一定である。
－生存しない染色体（１３、１８、２１、Ｘ、Ｙを除く全て）は、胎児内の全ての正倍数体である。一実施形態において、生存しない染色体のうちのいくつかのみが、胎児上で正倍数体である必要がある。

【0259】

一般的な問題の製剤：
ｙ_ｉｊｋ＝ｇ_ｉｊｋ（ｘ_ｉｊｋ）＋ｖ_ｉｊｋと書くことができ、Ｘ_ｉｊｋは対立遺伝子ｋ＝１又は２（１は対立遺伝子Ａを表し、２は対立遺伝子Ｂを表す）上のＤＮＡの量であり、ｊ＝１．．．２３は染色体番号を表し、ｉ＝１．．．Ｎは染色体上の遺伝子座番号を表し、ｇｉｊｋは特定の遺伝子座及び対立遺伝子ｉｊｋのプラットフォーム応答であり、ｖ_ｉｊｋはその遺伝子座及び対立遺伝子の測定上の独立したノイズである。遺伝物質の量は、ｘ_ｉｊｋ＝ａｍ_ｉｊｋ＋Δｃ_ｉｊｋによって与えられ、ａは、母体染色体の各々に存在する遺伝物質の増幅因子（又は漏れ、拡散、増幅などの正味の影響）であり、ｍ_ｉｊｋ（０，１，２のいずれか）は、母体染色体上の特定の対立遺伝子のコピー数であり、Δは、子染色体の各々に存在する遺伝物質の増幅因子であり、ｃ_ｉｊｋは、子染色体上の特定の対立遺伝子のコピー数（０，１，２，３のいずれか）である。第１の簡略化された説明について、ａ及びΔは、遺伝子座及び対立遺伝子から独立している、すなわち、ｉ、ｊ、及びｋから独立していると仮定されることに留意されたい。これにより、以下が得られる。
ｙ_ｉｊｋ＝ｇ_ｉｊｋ（ａｍ_ｉｊｋ＋Δｃ_ｉｊｋ）＋ｖ_ｉｊｋ

【0260】

全遺伝子座にわたって一様であるアフィンモデルを使用したアプローチ：
１つは、アフィンモデルを用いてモデル化することができ、単純化のために、モデルは、各遺伝子座及び対立遺伝子について同じであると仮定するが、アフィンモデルがｉ、ｊ、ｋに依存するときのアプローチを修正する方法は、本開示を読んだ後に理解されるであろう。プラットフォーム応答モデルを
ｇ_ｉｊｋ（ｘ_ｉｊｋ）＝ｂ＋ａｍ_ｉｊｋ＋Δｃ_ｉｊｋと仮定し、
増幅係数ａ及びΔは、一般性を失うことなく使用されており、遺伝物質がない場合のノイズレベルを定義するｙ軸切片ｂが追加されている。目標は、ａ及びΔを推定することである。ｂを独立して推定することも可能であるが、ノイズレベルが遺伝子座にわたっておおよそ一定であると仮定し、ａ及びΔを推定するために親コンテキストに基づく方程式のセットのみを使用する。各遺伝子座での測定は、
ｙ_ｉｊｋ＝ｂ＋ａｍ_ｉｊｋ＋Δｃ_ｉｊｋ＋ｖ_ｉｊｋによって与えられる。

【0261】

ノイズｖ_ｉｊｋが、特定の親コンテキストＴ内の測定値それぞれについてｉ．ｉ．ｄ．であると仮定すると、その親コンテキスト内のシグナルを合計することができる。親コンテキストは、対立遺伝子Ａ及びＢの観点から表され、最初の２つの対立遺伝子は母親を表し、次の２つの対立遺伝子は父親を表す：Ｔ∈｛ＡＡ｜ＢＢ，ＢＢ｜ＡＡ，ＡＢ｜ＡＢ，ＡＡ｜ＡＡ，ＢＢ｜ＢＢ，ＡＡ｜ＡＢ，ＡＢ｜ＡＡ，ＡＢ｜ＢＢ，ＢＢ｜ＡＢ｝。各コンテキストＴについて、親ＤＮＡがそのコンテキストに適合する遺伝子座ｉ、ｊのセットが存在し、これはｉ、ｊ∈Ｔを表す。したがって：

【数50】

【0262】

式中

【数51】

は、親コンテキストＴに準拠する全ての遺伝子座にわたる、又は全てのｉ、ｊεＴにわたるそれぞれの値の平均を表す。平均値又は予測値

【数52】

は、子の倍数性状態に依存する。以下の表は、ｋ＝１（対立遺伝子Ａ）又は２（対立遺伝子Ｂ）及び全ての親コンテキストＴの場合、平均値又は予測値

【数53】

を説明する。子供について異なる仮説、すなわち、正倍数性及び母体トリソミーを仮定して、予測値を計算してもよい。これらの仮説は、表記Ｈ_ｍｆによって示され、式中、ｍは、母親からの染色体の数を指し、ｆは、父親からの染色体の数を指し、例えば、Ｈ_１１は、正倍数体であり、Ｈ_２１は、母体トリソミーである。Ａ及びＢを切り替えることによっていくつかの状態の間に対称性があるが、明確にするために全ての状態が含まれることに留意されたい。

【表2】

【0263】

これで、以下のように、行列形式でキャストできる全ての予測値ｙ_Ｔ、ｋを記述する方程式のセットを書くことができる：
Ｙ＝Ｂ＋Ａ_ＨＰ＋ｖ

【0264】

式中、

【数54】

【数55】

は、推定するパラメータの行列である

【数56】

式中、

【数57】

は、１の１８ｘ１行列であり、

【数58】

は、ノイズ項の１８×１行列であり
Ａ_Ｈは、表内のデータをカプセル化する行列であり、値は、子の倍数性状態に関する仮説Ｈごとに異なる。以下は、倍数性仮説Ｈ_１１及びＨ_２１の行列Ａ_Ｈの例である。

【数59】

【0265】

Ａ及びΔ、又は行列Ｐを推定するために、子サンプル上で正倍数体であると仮定し得る染色体のセットにわたってデータを集約する。これには、試験中の染色体、すなわちｊ＝１３、１８、２１、Ｘ、及びＹを除く全ての染色体ｊ＝１．．．２３が含まれ得る。（注：生存しない染色体上のモザイク異数体を検出するために、個々の染色体上の結果に対して調和検定を適用することもできる。）表記を明確にするために、Ｙ’を、全ての正倍数体性染色体にわたって測定されたＹとして定義し、Ｙ’’を、異数性であり得る、試験中の特定の染色体、例えば、染色体２１にわたって測定されたＹとして定義する。パラメータを推定するために、行列

【数60】

を正倍数体数データに適用する：

【数61】

式中、

【数62】

すなわち、バイアスが除去された測定データである。上記の最小二乗解は、ノイズ行列ｖの各項が同様の分散を有する場合、最大尤度解のみである。これは、各コンテキストＴの平均測定値を計算するために使用される遺伝子座Ｎ’_Ｔの数がコンテキストごとに異なるためである。上記のように、Ｎ_Ｔ’を使用して、正倍数体であることが知られている染色体で使用される遺伝子座の数を指し、Ｃ’を使用して、正倍数体であることが知られている染色体での平均測定のための共分散行列を表す。ノイズ行列ｖの共分散Ｃ’を推定する多くのアプローチが存在し、これは、ｖ～Ｎ（０，Ｃ’）として分布すると仮定することができる。共分散行列を与えると、Ｐの最大尤度推定値は、以下である

【数63】

【0266】

共分散行列を推定するための１つの単純なアプローチは、ｖの全ての項が独立である（すなわち、非対角項がない）と仮定し、ｖの各項の分散が１／Ｎ’_Ｔとしてスケーリングされるように、中心極限定理をコールして、１８×１８行列を見つけることができるようにすることである。

【数64】

【0267】

Ｐ’が推定されたら、これらのパラメータを使用して、染色体２１などの研究中の染色体に関する最も可能性の高い仮説を決定する。言い換えれば、仮説を選択する：

【数65】

【0268】

次いで、Ｈ^＊を見つけた後、Ｈ^＊の決定において有することができる信頼度を推定することができる。例えば、検討中の仮説が２つあるとする：Ｈ_１１（正倍数体）及びＨ_２１（母体トリソミー）。Ｈ^＊＝Ｈ_１１と仮定する。各々の仮説に対応する距離測度を計算する。

【数66】

【0269】

これらの距離測度の二乗は、１８自由度のカイ二乗ランダム変数として大まかに分布していることが示される。Χ１８は、そのような変数の対応する確率密度関数を表す。次いで、以下に従って、各々の仮説の確率ｐＨの比率を見出すことができる：

【数67】

【0270】

次いで、方程式

【数68】

を加算することによって、各仮説の確率を計算し得る。染色体が実際には正倍数体であるという確信度は、

【数69】

によって与えられる。

【0271】

本方法のバリエーション
（１）対立遺伝子Ａ及びＢを表す各チャネル上の異なるバイアスｂについて、上記のアプローチを修正してよい。バイアス行列Ｂは、以下のように再定義される：

【数70】

式中

【数71】

は、１の９ｘ１行列である。上述のように、パラメータｂ_ｅ及びｂ_ｉｂは、先験的な測定に基づいて仮定することができるか、又は行列Ｐに含まれ、積極的に推定することができる（すなわち、そうするために、全てのコンテキストにわたって方程式に十分なランクがある）。

【0272】

（２）一般的な定式化において、ｙ_ｉｊｋ＝ｇ_ｉｊｋ（ａｍ_ｉｊｋ＋Δｃ_ｉｊｋ）＋ｖ_ｉｊｋでは、全ての遺伝子座及び対立遺伝子について関数ｇ_ｉｊｋを直接測定又は較正することができるため、関数（大部分の遺伝子型決定プラットフォームでは単調であると仮定することができる）を反転させることができる。次いで、関数を逆にして、方程式のシステムが線形であるように、遺伝物質の量に関する測定値を再キャストすることができる。すなわち、ｙ’_ｉｊｋ＝ｇ_ｉｊｋ－１（ｙ_ｉｊｋ）＝ａｍ_ｉｊｋ＋Δｃ_ｉｊｋ＋ｖ’_ｉｊｋ。このアプローチは、ｇ_ｉｊｋがアフィン関数であるときに特に良いので、反転はｖ’_ｉｊｋのノイズの増幅又はバイアスを生成しない。

【0273】

（３）修正されたノイズ項ｖ’_ｉｊｋ＝ｇ_ｉｊｋ－１（ｖ_ｉｊｋ）は、関数反転によって増幅又はバイアスされる可能性があるため、上記の方法は、ノイズの観点から最適ではない場合がある。別のアプローチは、動作点の周りの測定値を線形化することである。つまり、ｙ_ｉｊｋ＝ｇ_ｉｊｋ（ａｍ_ｉｊｋ＋Δｃ_ｉｊｋ）＋ｖ_ｉｊｋは次のように再キャストされる：

【数72】

母体血液中の遊離浮遊ＤＮＡの３０％以下が子供由来であると予測され得るので、Δ＜＜ａ、及び拡張は合理的な近似である。代替的に、単調に増加し、第２の導関数が常に負であるＩＬＬＵＭＩＮＡビーズアレイのようなプラットフォーム応答について、

【数73】

に従って線形化推定を改善することができる。得られた方程式の集合は、ニュートン－ラフソン最適化などの方法を使用して、ａ及びΔに対して反復的に解かれ得る。

【0274】

（４）別の一般的なアプローチは、試験染色体（母親＋胎児）上のＤＮＡの総量を測定し、ＤＮＡの量が全ての染色体にわたって一定であるべきであるという仮定に基づいて、他の全ての染色体上のＤＮＡの量と比較することである。これはより単純であるが、子供がどれだけ貢献しているかがわかっているため、信頼限界を有意義に推定することができないという欠点がある。しかしながら、シグナル分散を推定し、信頼限界を生成するために、正倍数体であるべきである他の染色体シグナルにわたる標準偏差を見ることができる。この方法は、子供のＤＮＡにない母体ＤＮＡの測定を含むため、これらの測定はシグナルには何も寄与しないが、ノイズに直接寄与する。加えて、異なる染色体間の増幅バイアスを較正することは不可能である。この最後の点に対処するために、各染色体の平均シグナルレベルを他の全ての染色体の平均シグナルレベルにリンクする回帰関数を見つけ、回帰適合の分散に基づいて重み付けすることによって全ての染色体からのシグナルを組み合わせ、目的の検査染色体が他の染色体によって定義される許容範囲内にあるかどうかを調べることが可能である。

【0275】

データドロップアウトの組み込み
本開示の他の箇所では、Ａを得る確率は、真の母系遺伝子型、真の子の遺伝子型、混合物中の子の画分、及び子コピー数の直接関数であると仮定されている。また、母親又は子の対立遺伝子が脱落する可能性があり、例えば、混合物中に真の子ＡＢを有する代わりに、Ａのみが存在し、その場合、Ａの結合配列測定を得る可能性ははるかに高い。母親のドロップアウト率がＭＤＯであり、子のドロップアウト率がＣＤＯであると仮定する。いくつかの実施形態において、母親のドロップアウト率はゼロであると仮定することができ、子供のドロップアウト率は比較的低いため、実際の結果はドロップアウトによって深刻な影響を受けることはない。それにもかかわらず、それらはここでのアルゴリズムに組み込まれている。他の場所では、ｌｉｋ（ｘ_ｉ│ｍ_ｉ，ｃ，ｃｆ）＝ｐｄｆ_ｘ（ｘ_ｉ）は、真の母ｍ_ｉ、真の子ｃを仮定して、配列測定Ｓが与えられた場合、ＳＮＰｉ上でＡのｘ_ｉ確率を得る尤度として定義されている。母親又は子供にドロップアウトがある場合、入力データは真の母親（ｍ_ｉ）又は子供（ｃ）ではなく、可能性のあるドロップアウトの後の母親（ｍ_ｄ）及び可能性のあるドロップアウトの後の子供（ｃ_ｄ）である。次いで、上記の式を以下のように書き換えることができる：

【数74】

式中、ｐ（ｍ_ｄ│ｍ_ｉ）は、真の母系遺伝子型ｍが与えられた場合の、新しい母系遺伝子型ｍｄの確率であり、ドロップアウト率ｍｄｏが仮定され、ｐ（ｃ_ｄ│ｃ）は、真の子の遺伝子型ｃが与えられた場合の、新しい子の遺伝子型ｃ_ｄの確率であり、ドロップアウト率ＣＤＯが仮定される。ｎＡ_Ｔ＝真の遺伝子型ｃにおけるＡ対立遺伝子の数、ｎＡ_Ｄ＝「ドロップ」遺伝子型ｃ_ｄにおけるＡ対立遺伝子の数、ｎＡ_Ｔ≧ｎＡ_Ｄ、及び同様にｎＢ_Ｔ＝真の遺伝子型ｃにおけるＢ対立遺伝子の数、ｎＢ_Ｄ＝「ドロップ」遺伝子型ｃ_ｄにおけるＢ対立遺伝子の数、ｎＢ_Ｔ＞ｎＢ_Ｄ及びｄ＝ドロップアウト率の場合、次いで

【数75】

【0276】

実験データの１つのセットについて、親遺伝子型、並びに子供が染色体１４及び２１上の母体トリソミーを有する真の子の遺伝子型が測定された。配列決定測定は、子画分、Ｎ個の異なるＳＮＰ、及び総リード数ＮＲの様々な値についてシミュレートされている。このデータから、最も可能性の高い子画分を導出し、既知又は導出された子画分を仮定してコピー数を導出することが可能である。

【0277】

一実施形態において、本明細書に開示される方法を使用して、母体及び胎児の遺伝物質の混合物中の標的配列を有する、母体及び胎児の標的染色体のコピー数を決定することによって、胎児の異数体を決定することができる。この方法は、母体及び胎児の遺伝物質の両方を含有する母体組織を得ることを伴い得る。いくつかの実施形態において、この母体組織は、母体血漿又は母体血液から単離された組織であり得る。この方法はまた、当該母体組織を処理することによって、母体組織から母体及び胎児の遺伝物質の混合物を得ることを伴い得る。この方法は、取得された遺伝物質を複数の反応サンプルに分配し、標的染色体からの標的配列を含む個々の反応サンプルと、標的染色体からの標的配列を含まない個々の反応サンプルとをランダムに提供し、例えば、サンプルに対して高スループット配列決定を実行することを伴い得る。この方法は、当該個々の反応サンプル中に存在するか又は存在しない遺伝物質の標的配列を分析して、反応サンプル中の可能性のある正倍数体胎児染色体の有無を表す第１の数のバイナリ結果と、反応サンプル中のおそらく異数体胎児染色体の有無を表す第２の数のバイナリ結果とを提供することを伴い得る。バイナリ結果の数のいずれかは、例えば、特定の染色体、染色体の特定の領域、特定の遺伝子座又は遺伝子座のセットにマッピングする配列リードをカウントする情報技術によって計算され得る。この方法は、染色体の長さ、染色体の領域の長さ、又はセット中の遺伝子座の数に基づいて、二項イベントの数を正規化することを伴っていてもよい。この方法は、第１の数値を使用して、反応サンプル中のおそらく正倍数体胎児染色体の二値結果の数の予測分布を計算することを伴い得る。この方法は、混合物中に見出される胎児ＤＮＡの第１の数及び予測画分を使用して、例えば、推定異数体胎児染色体のバイナリ結果の数の予測リードカウント分布に、（１＋ｎ／２）（式中、ｎは推定胎児画分）を乗じて、反応サンプル中の推定異数体胎児染色体のバイナリ結果の数の予測分布を計算することを伴い得る。胎児画分は、複数の方法によって推定され得、そのうちのいくつかは、本開示の別の箇所に記載されている。この方法は、最大尤度アプローチを使用して、第２の数が、可能性のある異数体胎児染色体が正倍数体であるか、又は異数体であるかに対応するかどうかを決定することを伴っていてもよい。この方法は、胎児の倍数性状態を、測定データを考慮して正しい尤度が最大であるという仮説に対応する倍数性状態と呼ぶことを伴っていてもよい。

【0278】

ＮＰＤにおける倍数性コールの対立遺伝子比率法の簡易説明
一実施形態において、妊娠中の胎児の倍数性状態は、対立遺伝子比を調べる方法を用いて決定することができる。いくつかの方法は、疑わしい染色体からの数値配列決定出力ＤＮＡ数を参照の正倍数体染色体と比較することによって、胎児の倍数性状態を決定する。その概念とは対照的に、対立遺伝子比率法は、１つの染色体上の異なる親コンテキストの対立遺伝子比率を見ることによって、胎児の倍数性状態を決定する。この方法は、参照染色体を使用する必要はない。例えば、以下の可能な倍数性状態、及び様々な親コンテキストの対立遺伝子比率を想像してみよう：
（注：比率「ｒ」は、以下のように定義される：１／ｒ＝画分母ＤＮＡ／画分胎児ＤＮＡ）

【表3】

*P-U tri＝父親のマッチングトリソミー、P-M tri＝父親のマッチングトリソミー、
この表は、親コンテキストの部分集合のみを表し、可能な倍数性のサブセットは、この方法が区別するように設計されていることに留意されたい。この場合、配列決定データの集合における親コンテキストの集合から、複数の対立遺伝子のA:B比を決定することができる。次いで、各倍数性状態について、及び各r値についていくつかの仮説を述べることができ、各仮説は、異なる親コンテキストについてA:B比率の予測されるパターンを有する。次いで、どの仮説が実験データに最も適合するかを決定することができる。
例えば、上記の親コンテキストのセットを使用し、r=0.2の値を使用すると、以下のようにチャートを書き換えることができる：（例えば、[#reads of allele A/# reads of allele B]を計算することができる。したがって、2+r:rは2+0.2:0.2→2.2:0.2=11になる）

【表4】

【0279】

ここで、異なる親のコンテキストのＡ：Ｂ比率の間の比率を見ることができる。この場合、Ａ：Ｂ_{ＡＡ｜ＢＢ}／Ａ：Ｂ_{ＡＡ｜ＡＢ}は、正倍数体については平均して１１／２１＝０．５２４であり、父系のマッチしないトリソミーについては平均して５．５／１２＝０．４５８であり、父系のマッチするトリソミーについては平均して５．５／４４＝０．１２５であると予測され得る。異なるコンテキスト間のＡ：Ｂ比のプロファイルは、異なる倍数性状態において異なり、プロファイルは、高精度で染色体の倍数性状態を決定することが可能であることができるように十分に区別されるべきである。ｒの計算値は、異なる方法を用いて決定されてもよく、又はこの方法に対する最大尤度アプローチを用いて決定されてもよいことに留意されたい。一実施形態において、本方法は、母系遺伝子型知識を必要とする。一実施形態において、本方法は、父系遺伝子型知識を必要とする。一実施形態において、本方法は、父系遺伝子型の知識を必要としない。一実施形態において、胎児画分及び母体ＤＮＡ対胎児ＤＮＡの比率は、本質的に同等であり、適切な線形代数変換を適用した後に互換的に使用することができる。いくつかの実施形態において、ｒ＝［胎児画分］／［１％胎児画分］。

【0280】

Ｐｈｒｅｄスコアを使用したＳＮＰ分類
Ｐｈｒｅｄスコアｑは、以下のように定義される：Ｐ（間違ったベースコール）＝１０＾（－ｑ／１０）

【0281】

ｘ＝真の遺伝子型の参照比＝参照対立遺伝子の数／総対立遺伝子の数とする。ダイソミーの場合、｛０，０．５，１｝におけるｘは、｛ＭＭ，ＲＭ，ＲＲ｝に対応する。ｚを、｛Ｒ，Ｍ｝中のｚという配列で観察される対立遺伝子とする。ここでは、ｚ＝Ｒを観察する尤度が示され、遺伝子型における参照対立遺伝子の真の比率（すなわち、Ｐ（ｚ＝Ｒ｜ｘ）
Ｐ（ｚ＝Ｒ｜ｘ）＝Ｐ（ｚ＝Ｒ｜ｇｃ，ｘ）Ｐ（ｇｃ）＋Ｐ（ｚ＝Ｒ｜ｂｃ，ｘ）Ｐ（ｂｃ）
式中、ｇｃは、正しいコールの事象であり、ｂｃは、不良コールの事象である。

【0282】

Ｐ（ｇｃ）及びＰ（ｂｃ）は、ｐｈｒｅｄスコアから計算される。Ｐ（ｚ＝Ｒ｜ｇｃ，ｘ）＝ｘ及びＰ（ｚ＝Ｒ｜ｂｃ，ｘ）＝１－ｘであり、プローブが不偏であると仮定する。

【0283】

結果、ｂ＝Ｐ（間違ったベースコール）：Ｐ（ｚ＝Ｒ｜ｘ）＝ｘ（１－ｂ）＋（１－ｘ）＊ｂ

【0284】

参照対立遺伝子測定の確率は、予想通り、ｐｈｒｅｄスコアが改善するにつれて、参照対立遺伝子比率に収束することに留意されたい。

【0285】

各配列が独立して生成され、真の遺伝子型に条件付けられていると仮定すると、同じＳＮＰにおける測定値のセットの尤度は、単に個々の尤度の積である。この方法は、様々なｐｈｒｅｄスコアを説明する。別の実施形態において、配列マッピングの信頼度の変化を考慮することができる。単一ＳＮＰについてのｎ個の配列のセットを考慮すると、尤度の組み合わせは、様々な仮説を表す候補対立遺伝子比率で評価することができる順序ｎの多項式をもたらす。

【0286】

Ｐｈｒｅｄ閾値を使用したＳＮＰ分類
単一のＳＮＰについて多数の配列が利用可能である場合、対立遺伝子比に関する多項式尤度関数は、扱いにくくなる。代替案は、高いｐｈｒｅｄスコアを有するベースコールのみを考慮し、次いで、それらが正確であると仮定することである。各塩基読み取りは、真の対立遺伝子比に従ってＩＩＤベルヌーイであり、尤度関数はガウスである。ｒがデータにおける参照読み取りの比率である場合、ｘ上の尤度関数（真の参照対立遺伝子比）は、平均＝ｒ及び標準偏差＝ｓｑｒｔ（ｒ＊（１－ｒ）／ｎ）を有する。

【0287】

サンプル間のＳＮＰバイアス相関
上記の２つの尤度関数（多項式、ガウス）を使用して、対立遺伝子比率｛１，０．５，０｝を考慮することによって、ＳＮＰをＲＲ、ＲＭ、又はＭＭとして分類することができ、又は対立遺伝子比率の最大尤度推定値を計算することができる。同じＳＮＰが２つの異なるサンプルにおいてＲＭとして分類される場合、対立遺伝子比のＭＬＥ推定値を比較して、一貫した「プローブバイアス」を探すことが可能である。

【0288】

ＤＮＡの起源を決定する前に配列の長さを使用すること
母体ＤＮＡと胎児ＤＮＡとでは配列の長さの分布が異なり、胎児は一般に短いことが報告されている。本開示の一実施形態において、経験的データの形態で従来の知識を使用し、母親（Ｐ（Ｘ｜母体））及び胎児ＤＮＡ（Ｐ（Ｘ｜胎児））の両方の予測される長さの事前分布を構築することが可能である。長さｘの新たな未確認ＤＮＡ配列を考慮すると、所与のＤＮＡ配列が母体ＤＮＡ又は胎児ＤＮＡのいずれかであるという確率を、母体又は胎児のいずれかが与えられたｘの事前尤度に基づいて割り当てることが可能である。特に、Ｐ（ｘ｜母体）＞Ｐ（ｘ｜胎児）の場合、ＤＮＡ配列は、Ｐ（ｘ｜母体）＝Ｐ（ｘ｜母体）／［（Ｐ（ｘ｜母体）＋Ｐ（ｘ｜胎児）］で母体として分類することができ、ｐ（ｘ｜母体）＜ｐ（ｘ｜胎児）の場合、ＤＮＡ配列は、胎児、Ｐ（ｘ｜胎児）＝Ｐ（ｘ｜胎児）／［（Ｐ（ｘ｜母体）＋Ｐ（ｘ｜胎児）］］として分類することができる。本開示の一実施形態において、高い確率を有する母体又は胎児として割り当てることができる配列を考慮することによって、そのサンプルに特異的な母体及び胎児の配列の長さの分布を決定することができ、その後、そのサンプル特異的な分布をそのサンプルの予想サイズ分布として使用することができる。

【0289】

標的細胞のセットにおける平均コピー数を決定するための方法
上記の方法は、標的細胞からのＤＮＡが、１つの標的細胞からのものである、又はそうでなければ、本質的に遺伝的に同一である標的細胞からのものであると仮定する。この仮定は、例えば、標的が胎児であり、胎児からのＤＮＡが、胎盤細胞のいくつかが他の胎盤細胞と遺伝的に異なる複数の細胞に由来する胎盤モザイクの場合には当てはまらない場合がある。例えば、胎児が４７、ＸＸ＋１８又は４７、ＸＹ＋１８である多くの場合、胎盤は、それぞれ、４６、ＸＸ及び４７、ＸＸ＋１８又は４６、ＸＹ及び４７、ＸＹ＋１８の混合物であるモザイクである。

【0290】

別の例は、標的細胞が腫瘍由来であり、非標的細胞が宿主由来の非がん性細胞である、コピー数バリアントによるがんの検出を伴う。がんの特徴はゲノムの不安定性であり、全てではないにしても多くの場合、腫瘍は遺伝的に不均一である。腫瘍組織の小さな生検でさえ、不均一性を示す。がん細胞のゲノムが天然宿主ＤＮＡと異なる方法は、変異とみなされる。これらの変異のいくつかは、必ずしも全てではないが、がんの発がん特性を駆動し得る。液体生検、すなわち、血流中の無細胞ＤＮＡ（ｃｆＤＮＡ）からの腫瘍ＤＮＡの検出の場合、無細胞腫瘍ＤＮＡ（ｃｔＤＮＡ）は、多くの場合不均一であり、腫瘍の細胞のいくつか又は全てを代表する、アポトーシス又は壊死性がん細胞に由来すると考えられる。単一ヌクレオチドバリアント（ＳＮＶ）、コピー数バリアント（ＣＮＶ）、低メチル化、高メチル化、欠失、及び重複とも呼ばれる点変異を含むが、これらに限定されない、がんに見られるいくつかのタイプの変異が存在する。

【0291】

宿主の正常なダイソミーゲノムがベースラインであると考えると、正常細胞及びがん細胞の混合物の分析は、混合物中のベースラインとｃｔＤＮＡの起源細胞のＤＮＡとの平均差を与える。例えば、サンプル中のＤＮＡの１０％が、アッセイによって標的化される染色体の領域にわたって欠失を有する細胞に由来する場合を想像する。定量手法は、この領域に対応するリードの量が、正常サンプルについて予測される量の９５％であると予測されることを示すべきである。これは、標的領域の欠失を有する腫瘍細胞各々における２つの標的染色体領域の１つが欠けているため、この領域にマッピングするＤＮＡの総量は、９０％（正常細胞の場合）＋１／２×１０％（腫瘍細胞の場合）＝９５％である。代替的に、対立遺伝子手法は、ヘテロ接合性遺伝子座での対立遺伝子の比率が平均で１９：２０であることを示すべきである。次に、サンプル中のＤＮＡの１０％が、アッセイによって標的化される染色体の領域の５倍の焦点増幅を有する細胞に由来する場合を想像する。定量手法は、この領域に対応するリードの量が、正常サンプルについて予測される量の１２５％であると予測されることを示すべきである。これは、５倍の焦点増幅を有する腫瘍細胞各々における２つの標的染色体領域の１つが、標的領域にわたって過剰に５倍コピーされるため、この領域にマッピングするＤＮＡの総量は、９０％（正常細胞の場合）＋（２＋５）×１０％（腫瘍細胞の場合）／２＝１２５％である。代替的に、対立遺伝子手法は、ヘテロ接合性遺伝子座での対立遺伝子の比率が平均で２５：２０であることを示すべきである。なお、対立遺伝子手法のみを用いる場合、１０％のｃｔＤＮＡを含むサンプル中の染色体領域にわたる５倍の焦点増幅は、４０％のｃｔＤＮＡを含むサンプル中の同じ領域にわたる欠失と同じであるように見える場合がある。これらの２つの場合では、欠失の場合に過小出現するハプロタイプは、焦点重複を有する場合において、ＣＮＶを含まないハプロタイプであるように見え、欠失の場合において、ＣＮＶを有しないハプロタイプは、焦点重複の場合において、過剰出現するハプロタイプであるように見える。この対立遺伝子手法によって作成される尤度と、定量手法によって作成される尤度とを組み合わせることで、この２つの確率を区別するであろう。

【0292】

親のコンテキスト
親のコンテキストは、標的の２つの親の一方又は両方の２つの関連する染色体の各々における、所与の対立遺伝子の遺伝子状態を指す。一実施形態において、親コンテキストは、標的の対立遺伝子状態を指さず、むしろ、親の対立遺伝子状態を指すことに留意されたい。所与のＳＮＰの親コンテキストは、４つの塩基対、２つの父体及び２つの母体からなり得、それらは、互いに同じであっても異なっていてもよい。典型的には、「ｍ_１ｍ_２｜ｆ_１ｆ_２」と記載され、ｍ_１及びｍ_２は、２つの母系染色体上の所与のＳＮＰの遺伝子状態であり、ｆ_１及びｆ_２は、２つの父系染色体上の所与のＳＮＰの遺伝子状態である。いくつかの実施形態において、親コンテキストは、「ｆ_１ｆ_２｜ｍ_１ｍ_２」として書かれてもよい_。下付き文字「１」及び「２」は、所与の対立遺伝子における、第１及び第２の染色体の遺伝子型を指すことに留意されたい、また、どの染色体が「１」と標識され、どの染色体が「２」と標識されるかの選択は、任意であることに留意されたい。

【0293】

本開示では、Ａ及びＢは、塩基対同一性を一般的に表すために多くの場合使用され、Ａ又はＢは、Ｃ（シトシン）、Ｇ（グアニン）、Ａ（アデニン）又はＴ（チミン）を等しくよく表すことができることに留意されたい。例えば、所与のＳＮＰベースの対立遺伝子において、母系遺伝子型が、１つの染色体上のそのＳＮＰでＴであり、相同染色体上のそのＳＮＰでＧであり、その対立遺伝子での父系遺伝子型が、両方の相同染色体上のそのＳＮＰでＧである場合、標的個体の対立遺伝子は、ＡＢ｜ＢＢの親コンテキストを有すると言うことができ、対立遺伝子は、ＡＢ｜ＡＡの親コンテキストを有すると言うこともできる。理論的には、４つの可能なヌクレオチドのいずれかが所与の対立遺伝子に存在し得、したがって、例えば、母親がＡＴの遺伝子型を有し、父親が所与の対立遺伝子でＧＣの遺伝子型を有することが可能であることに留意されたい。しかしながら、経験的データは、ほとんどの場合、４つの可能な塩基対のうちの２つのみが、所与の対立遺伝子で観察されることを示す。例えば、単一のタンデム反復を使用する場合、２つより多くの親、４つより多く、更には１０つより多くのコンテキストを有することが可能である。本開示では、考察は、所与の対立遺伝子で２つの可能な塩基対のみが観察されると仮定するが、本明細書に開示される実施形態は、この仮定が当てはまらない場合を考慮に入れるように修正されてもよい。

【0294】

「親コンテキスト」とは、同じ親コンテキストを有する標的ＳＮＰのセット又はサブセットを指し得る。例えば、標的個体上の所与の染色体上で１０００の対立遺伝子を測定する場合、コンテキストＡＡ｜ＢＢは、標的の母系遺伝子型がホモ接合性であり、標的の父系遺伝子型がホモ接合性であるが、母系遺伝子型及び父系遺伝子型がその遺伝子座で異なっている１０００の対立遺伝子群内の全ての対立遺伝子のセットを指すことができる。親データがフェーズ化されておらず、したがってＡＢ＝ＢＡである場合、９つの可能な親コンテキストがある。ＡＡ｜ＡＡ、ＡＡ｜ＡＢ、ＡＡ｜ＢＢ、ＡＢ｜ＡＡ、ＡＢ｜ＡＢ、ＡＢ｜ＢＢ、ＢＢ｜ＡＡ、ＢＢ｜ＡＢ、及びＢＢ｜ＢＢ。親データがフェーズ化され、したがってＡＢ≠ＢＡである場合、１６つの異なる可能性のある親コンテキストがある。ＡＡ｜ＡＡ、ＡＡ｜ＡＢ、ＡＡ｜ＢＡ、ＡＡ｜ＢＢ、ＡＢ｜ＡＡ、ＡＢ｜ＡＢ、ＡＢ｜ＢＡ、ＡＢ｜ＢＢ、ＢＡ｜ＡＡ、ＢＡ｜ＡＢ、ＢＡ｜ＢＡ、ＢＡ｜ＢＢ、ＢＢ｜ＡＡ、ＢＢ｜ＡＢ、ＢＢ｜ＢＡ、及びＢＢ｜ＢＢ。性染色体上のいくつかのＳＮＰを除いて、染色体上の全てのＳＮＰ対立遺伝子は、これらの親コンテキストの１つを有する。一方の親についての親コンテキストがヘテロ接合性であるＳＮＰのセットは、ヘテロ接合性コンテキストと呼ばれる場合がある。

【0295】

ＮＰＤにおける親のコンテキストの使用
非侵襲性出生前診断は、例えば妊娠中の母親の採血から、非侵襲的な方法で得られる遺伝物質から胎児の遺伝子状態を決定するために使用することができる重要な技術である。血液を分離し、血漿を単離し、続いて血漿ＤＮＡを単離することができる。サイズ選択を使用して、適切な長さのＤＮＡを単離することができる。ＤＮＡは、遺伝子座のセットで優先的に濃縮され得る。次いで、このＤＮＡは、例えば、遺伝子型決定アレイにハイブリダイゼーションして蛍光を測定することによって、又は高スループットシーケンサ上で配列決定することによって、いくつかの手段によって測定することができる。

【0296】

非侵襲性出生前診断の文脈における胎児の倍数性コールのために配列決定が使用される場合、配列データを使用するいくつかの方法が存在する。配列データを使用することができる最も一般的な方法は、所与の染色体にマッピングするリードの数を単にカウントすることである。例えば、胎児の染色体２１の倍数性状態を決定しようとしているとする。更に、サンプル中のＤＮＡが、胎児起源の１０％ＤＮＡ、及び母体起源の９０％ＤＮＡからなることを想像する。この場合、ダイソミックと予測される染色体上の平均リード数（例えば、染色体３）を調べ、染色体２１上のリード数と比較することができ、リード数は、固有の配列の一部であるその染色体上の塩基対の数に対して調整される。胎児が正倍数体である場合、ゲノムの単位当たりのＤＮＡの量は、全ての位置においてほぼ等しいことが予測される（確率的変動の影響を受ける）。一方、胎児が染色体２１でトリソミックであった場合、染色体２１からの遺伝子単位当たりのＤＮＡは、ゲノム上の他の位置よりもわずかに多いことが予測される。具体的には、混合物中の染色体２１からのＤＮＡが約５％増加すると予測される。配列決定を使用してＤＮＡを測定する場合、固有のセグメントごとに、他の染色体からのものよりも、染色体２１からの約５％多くの固有にマッピング可能なリードが予測される。特定の染色体からのＤＮＡの量の観察は、その染色体に一意にマッピング可能な配列の数を調整した場合、異数体診断の基礎として、特定の閾値よりも高い。異数性を検出するために使用され得る別の方法は、親のコンテキストを考慮に入れることができることを除いて、上記の方法と同様である。

【0297】

どの対立遺伝子を標的化するかを検討するとき、いくつかの親のコンテキストが他のコンテキストよりも有益である尤度が高いことを考慮することができる。例えば、ＡＡ｜ＢＢ及び対称コンテキストＢＢ｜ＡＡは、胎児が母親とは異なる対立遺伝子を有することが知られているため、最も有益なコンテキストである。対称性の理由から、ＡＡ｜ＢＢ及びＢＢ｜ＡＡの両方のコンテキストは、ＡＡ｜ＢＢと呼ばれる場合がある。有益な親コンテキストの別のセットは、ＡＡ｜ＡＢ及びＢＢ｜ＡＢである。これらの場合、胎児は、母親が有さない対立遺伝子を有する可能性が５０％であるからである。対称性の理由から、ＡＡ｜ＡＢ及びＢＢ｜ＡＢの両方のコンテキストは、ＡＡ｜ＡＢと呼ばれる場合がある。これらの場合、胎児は、既知の父系対立遺伝子を有し、その対立遺伝子は、母系ゲノムにも存在するため、有益な親コンテキストの第３のセットは、ＡＢ｜ＡＡ及びＡＢ｜ＢＢである。対称性の理由から、ＡＢ｜ＡＡ及びＡＢ｜ＢＢの両方のコンテキストは、ＡＢ｜ＡＡと呼ばれる場合がある。第４の親コンテキストは、胎児が未知の対立遺伝子状態を有し、対立遺伝子状態が何であれ、母親が同じ対立遺伝子を有するＡＢ｜ＡＢである。５番目の親のコンテキストはＡＡ｜ＡＡであり、母親及び父親は、ヘテロ接合体である。

【0298】

実施形態の異なる実装
標的個体の倍数性状態を決定するための方法が本明細書に開示される。標的個体は、芽球、胚、又は胎児であり得る。本開示のいくつかの実施形態において、標的個体における１つ以上の染色体の倍数性状態を決定するための方法は、本明細書に記載される工程のいずれか、及びそれらの組み合わせを含んでもよい。

【0299】

いくつかの実施形態において、胎児の遺伝子状態を決定するのに使用される遺伝物質の源は、母体血液から単離された有核胎児赤血球などの胎児細胞であってもよい。この方法は、妊娠中の母親から血液サンプルを取得することを伴っていてもよい。本方法は、視覚技術を使用して、特定の色の組み合わせが有核赤血球と一意に関連付けられ、同様の色の組み合わせが母体血液中の任意の他の存在する細胞と関連付けられないという考えに基づいて、胎児赤血球を単離することを伴っていてもよい。有核赤血球に関連する色の組み合わせは、核の周りのヘモグロビンの赤色（その色は、染色によってより明確にされ得る）、及び例えば、青色に染色され得る核物質の色を含んでもよい。母体血液から細胞を単離し、それらをスライド上に広げ、次いで、赤色（ヘモグロビンから）及び青色（核物質から）の両方を見る点を特定することによって、有核赤血球の位置を特定することができる。次いで、マイクロマニピュレータを使用してそれらの有核赤血球を抽出し、遺伝子型決定及び／又は配列決定技術を使用して、それらの細胞における遺伝物質の遺伝子型の態様を測定してもよい。

【0300】

一実施形態において、有核赤血球を、母体ヘモグロビンではなく胎児ヘモグロビンの存在下でのみ蛍光を発するダイで染色することができるため、有核赤血球が母体由来又は胎児由来の曖昧さを取り除くことができる。本開示のいくつかの実施形態は、核物質を染色又は他の方法でマーキングすることを伴っていてもよい。本開示のいくつかの実施形態は、胎児細胞特異的抗体を使用して胎児核物質を特異的にマーキングすることを伴っていてもよい。

【0301】

母体血液から胎児細胞を単離する、又は母体血液から胎児ＤＮＡを単離する、又は母体遺伝物質の存在下で胎児遺伝物質のサンプルを濃縮する多くの他の方法が存在する。これらの方法のいくつかはここに列挙されているが、これは網羅的なリストであることを意図していない。いくつかの適切な技術を、便宜上ここに列挙する：蛍光又は他の方法でタグ付けされた抗体、サイズ排除クロマトグラフィー、磁気又は他の方法で標識された親和性タグ、特定の対立遺伝子における母体細胞と胎児細胞との間の差異メチル化などのエピジェネティック差異、ＣＤ４５／１４枯渇によって成功した密度勾配遠心分離、及びＣＤ４５／１４陰性細胞からのＣＤ７１陽性選択、異なる浸透圧を有する単一又は二重パーコール勾配、又はガラクトース特異的レクチン法を使用すること。

【0302】

本開示の一実施形態において、標的個体は胎児であり、異なる遺伝子型測定は、胎児からの複数のＤＮＡサンプルに対して行われる。本開示のいくつかの実施形態において、胎児ＤＮＡサンプルは、胎児細胞が母体細胞と混合され得る単離された胎児細胞由来である。本開示のいくつかの実施形態において、胎児ＤＮＡサンプルは、胎児ＤＮＡが遊離浮遊母体ＤＮＡと混合され得る遊離浮遊胎児由来である。いくつかの実施形態において、胎児ｄＮＡサンプルは、母体ＤＮＡ及び胎児ＤＮＡの混合物を含有する母体血漿又は母体血液に由来してもよい。いくつかの実施形態において、胎児ＤＮＡは、９９．９：０．１％～９９：１％、９９：１％～９０：１０％、９０：１０％～８０：２０％、８０：２０％～７０：３０％、７０：３０％～５０：５０％、５０：５０％～１０：９０％、又は１０：９０％～１：９９％、１：９９％～０．１：９９．９％の範囲の母体：胎児比率で母体ＤＮＡと混合されてもよい。

【0303】

いくつかの実施形態において、遺伝子サンプルは、調製及び／又は精製されてもよい。このような目的を達成するために、当該技術分野で既知であるいくつかの標準的な手順が存在する。いくつかの実施形態において、サンプルを遠心分離して、様々な層を分離してもよい。いくつかの実施形態において、ＤＮＡは、濾過を用いて単離されてもよい。いくつかの実施形態において、ＤＮＡの調製は、増幅、分離、クロマトグラフィーによる精製、液液分離、単離、優先的濃縮、優先的増幅、標的化増幅、又は当該技術分野で知られているか、又は本明細書に記載されるいくつかの他の技術のいずれかを伴っていてもよい。

【0304】

いくつかの実施形態において、本開示の方法は、ＤＮＡを増幅することを伴っていてもよい。ＤＮＡの増幅、すなわち、少量の遺伝物質を、類似の遺伝子データセットを含むより大量の遺伝物質に変換するプロセスは、限定されないが、ポリメラーゼ連鎖反応（ＰＣＲ）を含む、多種多様な方法によって行うことができる。ＤＮＡを増幅する１つの方法は、全ゲノム増幅（ＷＧＡ）である。ライゲーション媒介ＰＣＲ（ＬＭ－ＰＣＲ）、変性オリゴヌクレオチドプライマーＰＣＲ（ＤＯＰ－ＰＣＲ）及び多重置換増幅（ＭＤＡ）といった、ＷＧＡに利用可能ないくつかの方法が存在する。ＬＭ－ＰＣＲにおいて、アダプターと呼ばれる短いＤＮＡ配列を、ＤＮＡの平滑末端にライゲーションする。これらのアダプターは、ＰＣＲによってＤＮＡを増幅するために使用されるユニバーサル増幅配列を含有する。ＤＯＰ－ＰＣＲにおいて、ユニバーサル増幅配列も含有するランダムプライマーを、アニーリング及びＰＣＲの第１ラウンドで使用する。次いで、第２ラウンドのＰＣＲを使用して、更にユニバーサルプライマー配列を用い、配列を増幅させる。ＭＤＡは、ｐｈｉ－２９ポリメラーゼを使用し、このポリメラーゼは、ＤＮＡを複製し、単一細胞分析に使用されてきた、高度なプロセッシブ非特異性酵素である。単一細胞からの材料の増幅に対する主な制限は、（１）極めて希釈されたＤＮＡ濃度又は極めて少量の反応混合物を使用する必要性、及び（２）ゲノム全体にわたってタンパク質からＤＮＡを確実に解離させることの困難性である。それにもかかわらず、単一細胞全ゲノム増幅は、長年にわたって様々な用途のために成功裏に使用されてきた。他にもＤＮＡサンプルからＤＮＡを増幅する方法が存在する。ＤＮＡ増幅は、ＤＮＡの初期サンプルを、配列のセットにおいて類似するがはるかに大きな量のＤＮＡのサンプルに変換する。ある場合に、増幅は、必要とされないことがある。

【0305】

いくつかの実施形態において、ＤＮＡは、ＷＧＡ又はＭＤＡなどのユニバーサル増幅を用いて増幅されてもよい。いくつかの実施形態において、ＤＮＡは、例えば、標的化ＰＣＲ、又は環状化プローブを使用する標的化増幅によって増幅されてもよい。いくつかの実施形態において、ＤＮＡは、標的化増幅法、又は、ハイブリダイゼーションアプローチによる捕捉などの、所望されないＤＮＡからの完全又は部分的な分離をもたらす方法を使用して、優先的に濃縮されてもよい。いくつかの実施形態において、ＤＮＡは、ユニバーサル増幅法及び優先的濃縮法の組み合わせを使用することによって増幅されてもよい。これらの方法のいくつかのより完全な説明は、本文書の別の箇所に見出すことができる。

【0306】

標的個体及び／又は関連個体の遺伝子データは、これらに限定されないが、遺伝子型決定マイクロアレイ及び高スループット配列決定を含む群から得られるツール及び／又は技術を使用して、適切な遺伝子材料を測定することによって、分子状態から電子状態に変換され得る。いくつかの高スループット配列決定法としては、ＳａｎｇｅｒＤＮＡ配列決定、パイロシーケンシング、ＩＬＬＵＭＩＮＡＳＯＬＥＸＡプラットフォーム、ＩＬＬＵＭＩＮＡのゲノムアナライザ、又はＡＰＰＬＩＥＤＢＩＯＳＹＳＴＥＭの４５４配列決定プラットフォーム、ＨＥＬＩＣＯＳのＴＲＵＥＳＩＮＧＬＥＭＯＬＥＣＵＬＥＳＥＱＵＥＮＣＩＮＧプラットフォーム、ＨＡＬＣＹＯＮＭＯＬＥＣＵＬＡＲの電子顕微鏡配列決定法、又は任意の他の配列決定法が挙げられる。これらの方法は全て、ＤＮＡのサンプルに格納された遺伝子データを、処理される途中のメモリデバイスに典型的に格納される遺伝子データのセットに物理的に変換する。

【0307】

関連する個体の遺伝子データは、これらに限定されないが、個体のバルク二倍体組織、個体からの１つ以上の二倍体細胞、個体からの１つ以上のハプロイド細胞、標的個体からの１つ以上の芽球、個体上に見出される細胞外遺伝物質、母体血液中に見出される個体からの細胞外遺伝物質、母体血液中に見出される個体からの細胞、関連する個体からの（ａ）配偶子（複数可）から生成される１つ以上の胚、そのような胚から得られる１つ以上の芽球、関連する個体上に見出される細胞外遺伝物質、関連する個体に由来することが知られている遺伝物質、及びそれらの組み合わせを含む群から得られる物質を分析することによって測定され得る。

【0308】

いくつかの実施形態において、標的個体の対象の染色体タイプの各々について、少なくとも１つの倍数性状態仮説のセットを作成してもよい。倍数性状態仮説の各々は、標的個体の染色体又は染色体セグメントの１つの可能な倍数性状態を指し得る。仮説のセットは、標的個体の染色体が有すると予想され得る可能性のある倍数性状態のいくつか又は全てを含み得る。考えられる倍数性状態のいくつかは、ヌルソミー、モノソミー、ダイソミー、単親ダイソミー、正倍数体、トリソミー、適合トリソミー、不適合トリソミー、母体トリソミー、父体トリソミー、テトラソミー、バランスの取れた（２：２）テトラソミー、不均衡（３：１）テトラソミー、ペンタソミー、ヘキサソミー、他の異数体、及びそれらの組み合わせを含み得る。これらの異数体状態のいずれかは、不均衡転座、均衡転座、ロバートソン転座、組換え、欠失、挿入、乗換え、及びそれらの組み合わせなどの混合又は部分的な異数体であってもよい。

【0309】

いくつかの実施形態において、決定された倍数性状態の知識を使用して、臨床決定を行ってもよい。この知識は、典型的には、メモリデバイス内の物質の物理的な配置として格納され、次いで、報告に変換され得る。次いで、報告書に対応され得る。例えば、臨床的決定は、妊娠を終了することであってもよく、代替的に、臨床的決定は、妊娠を継続することであってもよい。いくつかの実施形態において、臨床上の決定は、遺伝性障害の表現型の提示の重症度を減らすように設計された介入、又は特別なニーズのある子供のために準備するための関連する工程をとる決定を伴っていてもよい。

【0310】

本開示の一実施形態において、本明細書に記載される方法のいずれかは、複数の標的が同じ標的個体、例えば、同じ妊娠中の母親からの複数の採血に由来することを可能にするように修正されてもよい。これは、複数の遺伝子測定が、標的遺伝子型が決定され得るより多くのデータを提供し得るので、モデルの精度を改善し得る。一実施形態において、一方の標的遺伝子データのセットは、報告された一次データとして機能し、他方のセットは、一次標的遺伝子データをダブルチェックするためのデータとして機能した。一実施形態において、標的個体から採取された遺伝物質から各々測定された複数の遺伝子データのセットが並行して考慮され、したがって、標的遺伝子データの両方のセットは、高精度に測定された親遺伝子データのどのセクションが胎児ゲノムを構成するかを決定するのに役立つ。

【0311】

一実施形態において、本方法は、父子鑑定の目的のために使用されてもよい。例えば、母親からのＳＮＰベースの遺伝子型情報、及び遺伝的な父親であってもよく、又はそうでなくてもよい男性からのＳＮＰベースの遺伝子型情報、及び混合サンプルからの測定された遺伝子型情報を考慮すると、男性の遺伝子型情報が実際に妊娠中の胎児の実際の遺伝的な父親を表しているかどうかを決定することが可能である。これを行う簡単な方法は、母親がＡＡであり、父親がＡＢ又はＢＢである可能性のあるコンテキストを単に見ることである。これらの場合、それぞれ、父親の貢献の半分（ＡＡ｜ＡＢ）又は全て（ＡＡ｜ＢＢ）を見ることが予測され得る。予測されるＡＤＯを考慮すると、観察される胎児ＳＮＰが可能な父親のＳＮＰと相関しているかどうかを決定することは容易である。

【0312】

本開示の一実施形態は、以下の通りであり得る。妊婦の胎児がダウン症に罹患しているかどうか、及び／又は妊婦の胎児が嚢胞性線維症に罹患しているかどうかを知りたがっており、妊婦はこれらの状態のいずれかに罹患している子供を産むことを望まない。医師は妊婦の血液を採取し、ヘモグロビンを１つのマーカーで染色してはっきりと赤く見えるようにし、核物質を別のマーカーで染色してはっきりと青く見えるようにする。医師は、母親の赤血球が典型的には無核であることを知っているが、胎児細胞の高い割合は核を含むため、赤色及び青色の両方を示す細胞を特定することによって、いくつかの有核赤血球を視覚的に単離することができる。医師は、これらの細胞をマイクロマニピュレータでスライドから取り出し、ラボに送り、１０個の個々の細胞を増幅して遺伝子型決定する。遺伝子測定を用いることにより、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、１０個の細胞のうち６個が母体血液細胞であり、１０個の細胞のうち４個が胎児細胞であることを決定することができる。子供が既に妊娠中の母親から出産している場合、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）を使用して、胎児細胞に信頼性の高い対立遺伝子をコールし、それらが出生した子供の細胞と異なることを示すことによって、胎児細胞が出生した子供の細胞と異なることを決定することもできる。この方法は、本開示の父系検査の実施形態と概念が類似していることに留意されたい。胎児細胞から測定された遺伝子データは、単一細胞の遺伝子型決定の困難さに起因して、多くの対立遺伝子ドロップアウトを含む、非常に低品質であり得る。臨床医は、測定された胎児ＤＮＡを、親の信頼性の高いＤＮＡ測定値とともに使用して、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）を使用して胎児のゲノムの態様を高精度に推測することができ、それによって、胎児からの遺伝物質に含まれる遺伝子データを、コンピュータに格納された胎児の予測される遺伝子状態に変換する。臨床医は、胎児の倍数性状態と、目的の複数の疾患関連遺伝子の有無との両方を決定することができる。胎児は正倍数体であり、嚢胞性線維症の担体ではないことが判明し、母親は妊娠を継続することを決定した。

【0313】

本開示の一実施形態において、妊娠中の母親は、彼女の胎児が任意の全染色体異常に罹患しているかどうかを決定したいと考える。妊婦は医者に行き、血液のサンプルを提供し、妊婦及び妊婦の夫は頬の綿棒から自分自身のＤＮＡのサンプルを提供する。実験室の研究者は、親ＤＮＡを増幅するためにＭＤＡプロトコルを使用して親ＤＮＡを遺伝子型決定し、多数のＳＮＰで親の遺伝子データを測定するためにＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭアレイを用いる。その後、研究者は血液を回転させ、血漿を採取し、サイズ排除クロマトグラフィーを使用して遊離浮遊ＤＮＡのサンプルを単離する。代替的に、研究者は、核を有する胎児赤血球を単離するために、胎児ヘモグロビンに特異的なものなどの１つ以上の蛍光抗体を使用する。次いで、研究者は、単離された又は濃縮された胎児遺伝物質を取り、各オリゴヌクレオチドの２つの末端が標的対立遺伝子のいずれかの側の隣接配列に対応するように適切に設計された７０量体オリゴヌクレオチドのライブラリを使用して増幅する。ポリメラーゼ、リガーゼ、及び適切な試薬を添加すると、オリゴヌクレオチドはギャップ充填環化を受け、所望の対立遺伝子を捕捉した。エキソヌクレアーゼを添加し、熱不活性化し、生成物をＰＣＲ増幅のための鋳型として直接使用した。ＰＣＲ産物をＩＬＬＵＭＩＮＡゲノムアナライザで配列決定した。配列リードを、次いで胎児の倍数性状態を予測したＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）方法の入力として使用した。

【0314】

別の実施形態において、妊娠している母親であり、高齢の母親であるカップルは、妊娠中の胎児がダウン症候群、ターナー症候群、プラダーウィリ症候群、又はいくつかの他の全染色体異常を有するかどうかを知りたい。産科医は、母親及び父親から採血する。血液は研究室に送られ、技術者が母体サンプルを遠心分離して血漿とバフィーコートを分離する。バフィーコート及び父系血液サンプル中のＤＮＡは、増幅によって形質転換され、増幅された遺伝物質にコードされた遺伝子データは、高スループットシーケンサ上で遺伝物質を実行して親遺伝子型を測定することによって、分子的に格納された遺伝データから電子的に格納された遺伝データに更に形質転換される。血漿サンプルは、５，０００プレックスの半ネスト標的化ＰＣＲ法を使用して、遺伝子座のセットで優先的に濃縮される。ＤＮＡフラグメントの混合物を、配列決定に適したＤＮＡライブラリに調製する。次いで、ＤＮＡを、高スループット配列決定方法、例えば、ＩＬＬＵＭＩＮＡＧＡＩＩｘゲノムアナライザを使用して配列決定する。配列決定は、ＤＮＡで分子的に符号化された情報を、コンピュータハードウェアで電子的に符号化された情報に変換する。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）などの本開示される実施形態を含む情報学に基づく技術を使用して、胎児の倍数性状態を決定してもよい。これは、コンピュータで、調製されたサンプル上で行われたＤＮＡ測定から、複数の多型遺伝子座での対立遺伝子数の確率を計算することと、コンピュータで、染色体の異なる可能な倍数性状態に各々関連する複数の倍数性仮説を作成することと、コンピュータで、各倍数性仮説についての染色体上の複数の多型遺伝子座での予測される対立遺伝子数の結合分布モデルを構築することと、コンピュータで、結合分布モデル及び調製されたサンプル上で測定された対立遺伝子数を使用して、複数の倍数性仮説の各々の相対確率を決定することと、最大確率を有する仮説に対応する倍数性状態を選択することによって、胎児の倍数性状態をコールすることと、を伴っていてもよい。胎児はダウン症候群であると決定される。報告書が印刷されるか、妊婦の産科医に電子的に送信され、診断書が女性に送信される。女性、夫、医者は座って、選択肢について話し合う。夫婦は、胎児がトリソミー状態に罹患しているという知識に基づいて、妊娠を終了することを決定する。

【0315】

一実施形態において、企業は、母体の採血から妊娠中の胎児の異数性を検出するように設計された診断技術を提供することを決定し得る。彼らの製品には、母親が産科医に血液を採取する可能性がある。産科医はまた、胎児の父親から遺伝子サンプルを収集してもよい。医師は、母体血液から血漿を単離し、血漿からＤＮＡを精製してもよい。医師はまた、母体血液からバフィーコート層を単離し、バフィーコートからＤＮＡを調製してもよい。医師はまた、父系遺伝子サンプルからＤＮＡを調製してもよい。臨床医は、本開示に記載の分子生物学技術を使用して、血漿サンプルに由来するＤＮＡ中のＤＮＡにユニバーサル増幅タグを付加し得る。臨床医は、普遍的にタグ付けされたＤＮＡを増幅してもよい。臨床医は、ハイブリダイゼーションによる捕捉及び標的化ＰＣＲを含むいくつかの技術によってＤＮＡを優先的に濃縮し得る。標的化ＰＣＲは、ネスティング、半ネスティング若しくは半ネスティング、又は血漿由来ＤＮＡの効率的な濃縮をもたらす任意の他のアプローチを含んでもよい。標的化ＰＣＲは、例えば、１つの反応において１０，０００のプライマーと大規模に多重化されてもよく、プライマーは、染色体１３、１８、２１、Ｘ、及びＸとＹの両方に共通であるそれらの遺伝子座上のＳＮＰ、並びに任意選択で他の染色体も標的化する。選択的な濃縮及び／又は増幅は、各々の個々の分子を、異なるタグ、分子バーコード、増幅のためのタグ及び／又は配列決定のためのタグを用いてタグ化することを伴っていてもよい。次いで、臨床医は、血漿サンプル、及び場合によっては、調製された母体ＤＮＡ及び／又は父体ＤＮＡを配列決定してもよい。分子生物学的工程は、全体的に又は部分的に、診断ボックスによって実行されてもよい。配列データは、単一のコンピュータに、又は「クラウド」に見出され得るような別のタイプのコンピューティングプラットフォームに供給されてもよい。コンピューティングプラットフォームは、シーケンサによって行われた測定から、標的多型遺伝子座での対立遺伝子数を計算し得る。コンピューティングプラットフォームは、染色体１３、１８、２１、Ｘ、及びＹの各々について、ヌルソミー、モノソミー、ダイソミー、マッチするトリソミー、及びマッチしないトリソミーに関連する複数の倍数性仮説を作成し得る。コンピューティングプラットフォームは、調べられる５つの染色体の各々についての各倍数性仮説についての染色体上の標的遺伝子座での対立遺伝子数の予測される対立遺伝子数の結合分布モデルを構築し得る。コンピューティングプラットフォームは、結合分布モデル及び血漿サンプルに由来する優先的に濃縮されたＤＮＡについて測定された対立遺伝子数を用いて、倍数性仮説の各々が真である確率を決定し得る。コンピューティングプラットフォームは、最大確率を有するゲルマン仮説に対応する倍数性状態を選択することによって、染色体１３、１８、２１、Ｘ、及びＹの各々について、胎児の倍数性状態をコールし得る。コールされた倍数性状態を含む報告書を作成してもよく、これを産科医に電子的に送信し、出力デバイスで表示し、又は報告書の印刷されたハードコピーを産科医に届けてもよい。産科医は、患者及び任意選択で胎児の父親に通知することができ、どの臨床的選択肢が彼らに開放され、どの選択肢が最も望ましいかを決定することができる。

【0316】

別の実施形態において、妊婦（以下「母親」と称する）は、彼女の胎児（複数可）が任意の遺伝的異常又は他の状態を有するかどうかを知りたいと判断してもよい。妊娠を継続する自信がある前に、重大な異常がないことを確認したい可能性がある。母親は産科医に行き、血液のサンプルを採取されるかもしれない。産科医はまた、彼女の頬から頬の綿棒などの遺伝子サンプルを採取するかもしれない。また、口腔スワブ、精子サンプル、血液サンプルなど、胎児の父親から遺伝子サンプルを採取するかもしれない。父親は、サンプルを臨床医に送ることができる。臨床医は、母体血液サンプル中の遊離浮遊胎児ＤＮＡの画分を濃縮し得る。臨床医は、母体血液サンプル中の除核された胎児血液細胞の画分を濃縮し得る。臨床医は、胎児の遺伝子データを決定するために、本明細書に記載される方法の様々な態様を使用してもよい。その遺伝子データは、胎児の倍数性状態、及び／又は胎児内の１つ又はいくつかの疾患関連対立遺伝子の同一性を含み得る。出生前診断の結果をまとめた報告書が作成されることもある。報告書は、医師に送信又は郵送することができ、医師は母親に胎児の遺伝子状態を伝えることができる。母親は、胎児が１つ以上の染色体、又は遺伝的異常、又は望ましくない状態を有するという事実に基づいて、妊娠を中止することを決定することができる。母親はまた、胎児が大まかな染色体又は遺伝子異常、又は目的の遺伝子疾患を有しないという事実に基づいて妊娠を継続することを決定することができる。

【0317】

別の例は、精子提供者によって人工的に授精され、妊娠している妊婦を伴っていてもよい。母親は、妊娠中の胎児が遺伝子疾患に罹患するリスクを最小限に抑えたい。母親は、血液採取医で採取された血液を有し、本開示に記載の技術を使用して、３つの有核胎児赤血球を単離し、組織サンプルも母親及び遺伝的父親から収集する。胎児及び母親及び父親からの遺伝物質を、適切に増幅し、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭＢＥＡＤＡＲＲＡＹを使用して遺伝子型決定し、本明細書に記載される方法は、高精度に親及び胎児の遺伝子型が清浄化され、位相が決定され、胎児の倍数性コールが行われる。胎児は正倍数体であることがわかり、再構成された胎児遺伝子型から表現型感受性が予測され、報告書が作成され、母親の医師に送られ、どの臨床的決定が最善であるかを決定できる。

【0318】

一実施形態において、母親及び父親の生の遺伝物質は、増幅によって、配列が類似しているが量が多いＤＮＡの量に変換される。次いで、遺伝子型決定方法によって、核酸によってコードされる遺伝子型データは、上記のようなメモリデバイス上に物理的及び／又は電子的に格納され得る遺伝子測定値に変換される。本明細書で詳細に論じられる、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）アルゴリズムを構成する関連するアルゴリズムは、プログラミング言語を使用して、コンピュータプログラムに変換される。次いで、コンピュータハードウェア上でコンピュータプログラムを実行することによって、生の測定データを表すパターンに配置された物理的に符号化されたビット及びバイトである代わりに、それらは、胎児の倍数性状態の高い信頼性決定を表すパターンに変換される。この変換の詳細は、データ自体、及び本明細書に記載される方法を実行するために使用されるコンピュータ言語及びハードウェアシステムに依存する。次に、胎児の高品質の倍数体決定を表すように物理的に構成されたデータは、医療従事者に送信され得る報告書に変換される。この変換は、プリンタ又はコンピュータディスプレイを使用して行われてもよい。報告書は、印刷されたコピー、紙又は他の適切な媒体であってもよく、そうでなければ、電子的なものであってもよい。電子報告書の場合、送信されてもよく、医療従事者がアクセス可能なコンピュータ上の場所にあるメモリデバイスに物理的に格納されてもよく、また、読み取られてもよいように画面に表示されてもよい。スクリーンディスプレイの場合、データは、ディスプレイデバイス上のピクセルの物理的変換を引き起こすことによって、読み取り可能なフォーマットに変換されてもよい。変換は、光子を放出又は吸収する基板の前にあり得るスクリーン上の特定の画素セットの透明度を物理的に変化させる電荷を変更することによって、リン光スクリーンで電子を物理的に発射することによって達成され得る。この変換は、液晶中の分子のナノスケール配向を、例えば、特定のピクセルのセットで、ネマチック相からコレステリス相又は近接相に変更することによって達成されてもよい。この変換は、有意義なパターンに配置された複数の発光ダイオードから作られた特定の画素セットから光子を放出させる電流によって達成され得る。この変換は、情報を表示するために使用される任意の他の方法、例えば、コンピュータ画面、又は情報を送信するいくつかの他の出力デバイス又は方法によって達成されてもよい。次に、医療従事者は、報告内のデータがアクションに変換されるように、報告に基づいてアクションを実行し得る。アクションは、妊娠を継続又は中止することであり得、その場合、遺伝子異常を有する妊娠中の胎児は、非生存の胎児に変換される。本明細書に列挙される変換は、例えば、本開示に概説されるいくつかの工程を通じて、妊娠中の母親及び父親の遺伝物質を、遺伝子異常を有する胎児を中絶することからなる、又は妊娠を継続することからなる医学的決定に変換することができるように、集約されてもよい。代替的に、遺伝子型測定値のセットを、医師が妊娠中の患者を治療するのに役立つ報告に変換することができる。

【0319】

本開示の一実施形態において、本明細書に記載される方法を使用して、宿主母親、すなわち妊娠している女性が、彼女が妊娠している胎児の生物学的母親ではない場合でも、胎児の倍数性状態を決定することができる。本開示の一実施形態において、本明細書に記載の方法を使用して、母体血液サンプルのみを使用し、父系遺伝子サンプルを必要とせずに、胎児の倍数性状態を決定することができる。

【0320】

本明細書に開示される実施形態における数学のいくつかは、異数性の状態の限られた数に関する仮説を立てる。いくつかの場合において、例えば、０、１つ、又は２つの染色体のみが、それぞれの親に由来することが予測される。本開示のいくつかの実施形態において、数学的導出は、本開示の基本的な概念を変更することなく、３つの染色体が一方の親に由来するクアドロソミー、ペンタソミー、ヘキサソミーなどの他の形態の異数体を考慮に入れるように拡張され得る。同時に、より少ない数の倍数性状態、例えば、トリソミー及びダイソミーのみに焦点を当てることが可能である。染色体の非全数を示す倍数決定は、遺伝物質のサンプル中のモザイクを示し得ることに留意されたい。

【0321】

いくつかの実施形態において、遺伝子異常は、ダウン症候群（又は２１トリソミー）、エドワーズ症候群（１８トリソミー）、パトー症候群（１３トリソミー）、ターナー症候群（４５ｘ）、クラインフェルター症候群（２つの染色体を有する男性）、プラダー－ウィリー症候群、及びディジョージ症候群（ＵＰＤ１５）などの異数性の一種である。先行文に列挙されているような先天性障害は、一般的に望ましくなく、胎児が１つ以上の表現型異常に罹患しているという知識は、妊娠を中止するか、特別なニーズのある子供の出産を準備するために必要な予防措置を講じるか、又は染色体異常の重症度を軽減することを意図したいくつかの治療的アプローチを講じることを決定するための基礎を提供し得る。

【0322】

いくつかの実施形態において、本明細書に記載される方法は、非常に早い妊娠期間、例えば、早ければ４週間、早ければ５週間、早ければ６週間、早ければ７週間、早ければ８週間、早ければ９週間、早ければ１０週間、早ければ１１週間、及び早ければ１２週間で使用することができる。

【0323】

宿主に寄生しているがんに由来するＤＮＡは、宿主の血液中に見出すことができることが実証されていることに留意されたい。母体血液中に見出される混合ＤＮＡの測定から遺伝子診断を行うことができるのと同様に、宿主血液中に見出される混合ＤＮＡの測定から同様に遺伝子診断を行うことができる。遺伝的診断には、異数性状態、又は遺伝子変異が含まれ得る。母体血液で行われた測定から胎児の倍数性状態又は遺伝子状態を決定することについて読む本開示のいずれの請求項も、宿主血液での測定からがんの倍数性状態又は遺伝子状態を決定することについても同様によく読むことができる。

【0324】

いくつかの実施形態において、本開示の方法は、がんの倍数性状態を決定することを可能にし、本方法は、宿主からの遺伝物質及びがんからの遺伝物質を含む混合サンプルを得ることと、混合サンプル中のＤＮＡを測定することと、混合サンプル中のがん由来のＤＮＡの画分を計算することと、混合サンプル及び計算された画分に対して行われた測定を使用して、がんの倍数性状態を決定することと、を含む。いくつかの実施形態において、本方法は、がんの倍数性状態の決定に基づいてがん治療剤を投与することを更に含んでもよい。いくつかの実施形態において、本方法は、がんの倍数性状態の決定に基づいてがん治療薬を投与することを更に含み得、がん治療薬は、医薬、生物学的治療薬、及び抗体ベースの治療薬並びにそれらの組み合わせを含む群から採取される。

【0325】

いくつかの実施形態において、本明細書に開示される方法は、インビトロ受精中の胚選択のための着床前遺伝子診断（ＰＧＤ）の文脈において使用され、標的個体は、胚であり、親遺伝子型データは、３日目の胚からの単一若しくは２つの細胞生検又は５日目若しくは６日目の胚からのトロフェクトダーム生検からのデータを配列決定することから、胚についての倍数性決定を行うために使用され得る。ＰＧＤ設定では、子供のＤＮＡのみが測定され、少数の細胞のみが試験され、一般的には１～５個であるが、１０個、２０個又は５０個もの細胞が試験される。次いで、Ａ及びＢ対立遺伝子の開始コピーの総数（ＳＮＰで）は、子の遺伝子型及び細胞の数によってわずかに決定される。ＮＰＤにおいて、開始コピーの数は非常に高く、したがって、ＰＣＲ後の対立遺伝子比率は、開始比率を正確に反映することが予測される。しかしながら、ＰＧＤにおける開始コピーの数が少ないことは、汚染及び不完全なＰＣＲ効率が、ＰＣＲ後の対立遺伝子比率に取るに足りない効果を有することを意味する。この効果は、配列決定後に測定される対立遺伝子比率の分散を予測することにおいて、リード深度よりも重要であり得る。既知の子の遺伝子型を与えられた測定された対立遺伝子比の分布は、ＰＣＲプローブ効率及び汚染の確率に基づいて、ＰＣＲプロセスのモンテカルロシミュレーションによって作成されてもよい。各尤度のある子の遺伝子型の対立遺伝子比率分布を考慮すると、様々な仮説の尤度は、ＮＩＰＤについて記載されているように計算することができる。

【0326】

本明細書に開示される実施形態のいずれかは、デジタル電子回路、集積回路、特別に設計されたＡＳＩＣ（特定用途向け集積回路）、コンピュータハードウェア、ファームウェア、ソフトウェア、又はそれらの組み合わせで実装されてもよい。本明細書に開示される実施形態の装置は、プログラマブルプロセッサによって実行されるために機械可読ストレージデバイスに具体化されるコンピュータプログラム製品に実装され得、本明細書に開示される実施形態の方法工程は、入力データを操作し、出力を生成することによって本明細書に開示される実施形態の機能を実行するための命令のプログラムを実行するプログラマブルプロセッサによって実行され得る。本明細書に開示される実施形態は、記憶システム、少なくとも１つの入力デバイス、及び少なくとも１つの出力デバイスからデータ及び命令を受信し、及びそれらにデータ及び命令を送信するように結合された、特殊又は汎用であり得る少なくとも１つのプログラム可能プロセッサを含むプログラム可能システム上で実行可能及び／又は解釈可能である１つ以上のコンピュータプログラムにおいて有利に実装することができる。各々のコンピュータプログラムは、高度な手続き型又はオブジェクト指向のプログラミング言語で、又は所望される場合、アセンブリ又は機械言語で実装されてもよく、いずれの場合も、言語は、コンパイルされた又は解釈された言語であってもよい。コンピュータプログラムは、スタンドアロンプログラムとして、又はモジュール、コンポーネント、サブルーチン、又はコンピューティング環境での使用に適した他のユニットとしてなど、任意の形態で展開され得る。コンピュータプログラムは、１つのサイトに、又は複数のサイトにわたって分散され、かつ通信ネットワークによって相互接続される１つのコンピュータ又は複数のコンピュータ上で実行されるか又は解釈されるように展開され得る。

【0327】

本明細書で使用されるとき、コンピュータ可読記憶媒体は、（シグナルとは対照的に）物理的若しくは有形の記憶装置を指し、コンピュータ可読命令、データ構造、プログラムモジュール若しくは他のデータなどの情報の有形記憶のための任意の方法若しくは技術において実装される揮発性及び不揮発性、取り外し可能及び取り外し不可能な媒体を含むが、これらに限定されない。コンピュータ可読記憶媒体は、限定されないが、ＲＡＭ、ＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ又は他のソリッドステートメモリ技術、ＣＤ－ＲＯＭ、ＤＶＤ、又は他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置又は他の磁気記憶装置、又は所望の情報又はデータ又は命令を有形に記憶するために使用され得、コンピュータ又はプロセッサによってアクセスされ得る任意の他の物理的又は材料媒体を含む。

【0328】

本明細書に記載される方法のいずれかは、例えば、コンピュータ画面上又は印刷した紙の上などの物理的なフォーマットでのデータの出力を含んでいてもよい。本明細書の他の場所の任意の実施形態の説明では、説明された方法は、医師によって作業され得るフォーマットで作業可能なデータの出力と組み合わせられてもよいことを理解されたい。これに加えて、記載される方法は、臨床的な治療をもたらす臨床決定の実際の実施、又は何の行動も取らないという臨床決定の実施と組み合わせられてもよい。標的個体に関する遺伝子データを決定するための本文書に記載される実施形態のいくつかは、ＩＶＦの文脈において移植するための１つ以上の胚を選択することを決定することと組み合わせられてもよく、任意選択で、胚を前向きな母親の子宮に移植することと組み合わせられてもよい。標的個体に関する遺伝子データを決定するための本文書に記載される実施形態のいくつかは、医療従事者によって、潜在的な染色体異常、又はそれを欠くことの通知と組み合わせられてもよく、任意選択で、出生前診断の文脈において胎児の中絶を行うか、若しくは行わないかの決定と組み合わされてもよい。本明細書に記載される実施形態のいくつかは、作業可能なデータの出力、臨床的な治療をもたらす臨床決定の実施、又は何の行動も取らないという臨床決定の実施と組み合わせられてもよい。

【0329】

標的化濃縮及び配列決定
非侵襲的な出生前対立遺伝子コール又は倍数性コールのための方法の一部としての配列決定に続く、標的遺伝子座のセットでのＤＮＡのサンプルを濃縮するための技術の使用は、いくつかの予期しない利点を付与し得る。本開示のいくつかの実施形態において、本方法は、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（登録商標）（ＰＳ）などの情報学に基づく方法とともに使用するための遺伝子データを測定することを伴う。実施形態のいくつかの最終的な結果は、胚又は胎児の実行可能な遺伝子データである。具体化された方法の一部として、個体及び／又は関連する個体の遺伝子データを測定するために使用され得る多くの方法がある。一実施形態において、標的対立遺伝子のセットの濃度を濃縮するための方法が本明細書に開示され、本方法は、以下の工程：遺伝物質の標的化増幅、遺伝子座特異性オリゴヌクレオチドプローブの添加、特定のＤＮＡ鎖のライゲーション、所望のＤＮＡのセットの単離、反応の望ましくない成分の除去、ハイブリダイゼーションによる特定のＤＮＡ配列の検出、及びＤＮＡ配列決定法による１つ又は複数のＤＮＡ鎖の配列の検出のうちの１つ以上を含む。いくつかの場合において、ＤＮＡ鎖は、標的遺伝物質を指してもよく、いくつかの場合において、それらは、プライマーを指してもよく、いくつかの場合において、それらは、合成された配列、又はそれらの組み合わせを指してもよい。これらの工程は、いくつかの異なる順序で行われてもよい。分子生物学の非常に多様な性質を考慮すると、一般に、どの方法、及びどの工程の組み合わせが、様々な状況で乏しく、良好に、又は最良に実行されるかは明らかではない。

【0330】

例えば、標的化増幅前のＤＮＡのユニバーサル増幅工程は、ボトルネックのリスクを除去し、対立遺伝子バイアスを低減するなど、いくつかの利点を付与し得る。ＤＮＡは、いずれかの側に１つの標的配列の２つの隣接する領域とハイブリダイズすることができるオリゴヌクレオチドプローブを混合してもよい。ハイブリダイゼーションの後、プローブの末端は、ポリメラーゼ、ライゲーションのための手段、及びプローブの環化を可能にする任意の必要な試薬を添加することによって接続され得る。環化後、エキソヌクレアーゼを添加して、非環化遺伝物質を消化し、続いて環化プローブを検出してもよい。ＤＮＡは、いずれかの側に１つの標的配列の２つの隣接する領域とハイブリダイズすることができるＰＣＲプライマーと混合されてもよい。ハイブリダイゼーションの後、プローブの末端は、ポリメラーゼ、ライゲーションのための手段、及びＰＣＲ増幅を完了するために任意の必要な試薬を添加することによって接続され得る。増幅されたＤＮＡ又は非増幅ＤＮＡは、遺伝子座のセットを標的化するハイブリッド捕捉プローブによって標的化されてもよく、ハイブリダイゼーション後、プローブを局在化し、混合物から分離して、標的配列において濃縮されたＤＮＡの混合物を提供してもよい。

【0331】

いくつかの実施形態において、標的遺伝物質の検出は、多重化された方法で行われてもよい。並行して行われ得る遺伝子標的配列の数は、１～１０、１０～１００、１００～１０００、１０００～１万、１万～１０万、１０万～１００万又は１００万～１０００万の範囲であってもよい。先行技術は、最大約５０個又は１００個のプライマーのプールを含む成功した多重化ＰＣＲ反応の開示を含み、それ以上ではないことに留意されたい。１プール当たり１００個を超えるプライマーを多重化する従来の試みは、プライマーダイマー形成などの望ましくない副反応を伴う顕著な問題を生じていた。

【0332】

いくつかの実施形態において、この方法は、単一の細胞、少数の細胞、２～５個の細胞、６～１０個の細胞、１０～２０個の細胞、２０～５０個の細胞、５０～１００個の細胞、１００～１０００個の細胞、又は少量の細胞外ＤＮＡ、例えば、１～１０ピコグラム、１０～１００ピクトグラム、１００ピクトグラム～１ナノグラム、１～１０ナノグラム、１０～１００ナノグラム、又は１００ナノグラム～１マイクログラムを遺伝子型決定するために使用され得る。

【0333】

ある特定の遺伝子座を標的化する方法の使用、続いて対立遺伝子コール又は倍数性コールのための方法の一部としての配列決定は、いくつかの予期しない利点を付与し得る。ＤＮＡが標的化され得るか、又は優先的に濃縮され得るいくつかの方法は、環状化プローブ、連結された反転プローブ（ＬＩＰ、ＭＩＰ）、ＳＵＲＥＳＥＬＥＣＴなどのハイブリダイゼーション方法による捕捉、及び標的化ＰＣＲ又はライゲーション媒介ＰＣＲ増幅戦略を使用することを含む。

【0334】

いくつかの実施形態において、本開示の方法は、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（登録商標）（ＰＳ）などの情報学に基づく方法とともに使用するための遺伝子データを測定することを伴う。ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）は、遺伝子データを操作するための情報学ベースのアプローチであり、その態様は、本明細書に記載されている。実施形態のいくつかの最終的な結果は、胚又は胎児の実用可能な遺伝子データであり、その後、実用可能なデータに基づいて臨床的決定が行われる。ＰＳ法の背後にあるアルゴリズムは、標的個体（多くの場合、胚又は胎児）の測定された遺伝子データ、及び関連個体からの測定された遺伝子データを取り、標的個体の遺伝子状態が知られている精度を高めることができる。一実施形態において、測定された遺伝子データは、出生前の遺伝子診断中に倍数性の決定を行うという文脈において使用される。一実施形態において、測定された遺伝子データは、インビトロ受精中に胚に対して倍数決定又は対立遺伝子コールを行うという文脈において使用される。前述の文脈において、個体及び／又は関連する個体の遺伝子データを測定するために使用され得る多くの方法がある。異なる方法は、いくつかの工程を含み、それらの工程は、多くの場合、遺伝物質の増幅、オリゴヌクレオチドプローブの添加、特定のＤＮＡ鎖のライゲーション、所望のＤＮＡのセットの単離、反応の望ましくない成分の除去、ハイブリダイゼーションによるＤＮＡの特定の配列の検出、ＤＮＡ配列決定方法による１つ又は複数のＤＮＡ鎖の配列の検出を伴う。いくつかの場合において、ＤＮＡ鎖は、標的遺伝物質を指してもよく、いくつかの場合において、それらは、プライマーを指してもよく、いくつかの場合において、それらは、合成された配列、又はそれらの組み合わせを指してもよい。これらの工程は、いくつかの異なる順序で行われてもよい。分子生物学の非常に多様な性質を考慮すると、一般に、どの方法、及びどの工程の組み合わせが、様々な状況で乏しく、良好に、又は最良に実行されるかは明らかではない。

【0335】

理論的には、１つの遺伝子座から１００万をはるかに超える遺伝子座まで、ゲノム内の任意の数の遺伝子座を標的化することが可能であることに留意されたい。ＤＮＡのサンプルが標的化され、次いで配列決定される場合、シーケンサによって読み取られる対立遺伝子のパーセンテージは、サンプル中のそれらの天然存在量に関して濃縮される。濃縮度は、１％（又はそれ以下）から１０倍、１００倍、１０００倍、又は１０００万倍であってもよい。ヒトゲノムには、およそ３０億の塩基対、及び約７５００万の多型遺伝子座を含むヌクレオチドが存在する。標的化される遺伝子座が多いほど、濃縮度が低くなる。標的化される遺伝子座の数が少ないほど、より大きな濃縮度が可能であり、所与の数の配列リードに対してそれらの遺伝子座においてより大きなリード深度が達成され得る。

【0336】

本開示の一実施形態において、標的化又は優先は、ＳＮＰに完全に焦点を合わせ得る。一実施形態において、標的化又は優先は、任意の多型部位に焦点を当てることができる。いくつかの市販の標的化製品が、エクソンを濃縮するために利用可能である。驚くべきことに、対立遺伝子分布に依存するＮＰＤのための方法を使用する場合、排他的にＳＮＰ、又は排他的に多型遺伝子座を標的化することは特に有利である。配列決定を使用するＮＰＤのための公開された方法、例えば、リードカウント分析を伴う米国特許第７，８８８，０１７号もあり、リードカウントは、所与の染色体にマッピングするリードの数をカウントすることに焦点を当て、分析された配列リードは、多型であるゲノムの領域に焦点を当てない。多型対立遺伝子に焦点を当てていないこれらのタイプの方法論は、対立遺伝子のセットの標的化又は優先的な濃縮からそれほど利益を得ることはないであろう。

【0337】

本開示の一実施形態において、ゲノムの多型領域における遺伝子サンプルを濃縮するためにＳＮＰに焦点を当てた標的化方法を使用することが可能である。一実施形態において、少数のＳＮＰ、例えば、１～１００のＳＮＰ、又はより大きな数、例えば、１００～１，０００、１，０００～１０，０００、１０，０００～１００，０００、又は１００，０００を超えるＳＮＰに焦点を当てることが可能である。一実施形態において、生体トリソミー出産と相関する１つ又は少数の染色体、例えば、染色体１３、１８、２１、Ｘ及びＹ、又はそれらのいくつかの組み合わせに焦点を当てることが可能である。一実施形態において、標的ＳＮＰを、例えば１．０１倍と１００倍との間の小さな因子によって、又は例えば１００倍と１，０００，０００倍との間のより大きな因子によって、又は１，０００，０００倍を超えてさえも、濃縮することが可能である。本開示の一実施形態において、ゲノムの多型領域において優先的に濃縮されるＤＮＡのサンプルを作製するために、標的化方法を使用することが可能である。一実施形態において、この方法を使用して、ＤＮＡの混合物が母体ＤＮＡと、また遊離浮遊胎児ＤＮＡとを含む、これらの特徴のいずれかを有するＤＮＡの混合物を作製することが可能である。一実施形態において、この方法を使用して、これらの因子の任意の組み合わせを有するＤＮＡの混合物を作製することが可能である。例えば、本明細書に記載される方法を使用して、母体ＤＮＡ及び胎児ＤＮＡを含み、２００ＳＮＰに対応するＤＮＡが優先的に濃縮されるＤＮＡの混合物を生成してもよく、これらのＤＮＡは全て、染色体１８又は２１のいずれかに位置し、平均１０００倍濃縮されている。別の例では、この方法を使用して、染色体１３、１８、２１、Ｘ及びＹ上に全て又は大部分が位置する１０，０００ＳＮＰで優先的に濃縮され、遺伝子座当たりの平均濃縮が５００倍を超えるＤＮＡの混合物を作製することが可能である。本明細書に記載される標的化方法のいずれかを使用して、特定の遺伝子座において優先的に濃縮されるＤＮＡの混合物を作製することができる。

【0338】

いくつかの実施形態において、本開示の方法は、高スループットＤＮＡシーケンサを使用して混合画分中のＤＮＡを測定することを更に含み、混合画分中のＤＮＡは、１つ以上の染色体からの不均衡な数の配列を含み、１つ以上の染色体は、染色体１３、染色体１８、染色体２１、染色体Ｘ、染色体Ｙ、及びそれらの組み合わせを含む群から採取される。

【0339】

多重ＰＣＲ、ハイブリダイゼーションによる標的化捕捉、及び連結された反転プローブ（ＬＩＰ）の３つの方法が本明細書に記載されており、これらは、胎児の異数性を検出するために、母体血漿サンプルから十分な数の多型遺伝子座から測定値を取得し、分析するために使用されてもよい。これは、標的遺伝子座の選択的濃縮の他の方法を除外することを意味するものではない。他の方法は、方法の本質を変更することなく同様によく使用され得る。それぞれの場合において、アッセイした多型は、一塩基多型（ＳＮＰ）、小さいインデル、又はＳＴＲを含み得る。好ましい方法は、ＳＮＰの使用を伴う。各アプローチは、対立遺伝子頻度データを生成し、各標的遺伝子座についての対立遺伝子頻度データ及び／又はこれらの遺伝子座からの結合対立遺伝子頻度分布を分析して、胎児の倍数性を決定し得る。各アプローチは、限られたソース材料と、母体血漿が母親及び胎児のＤＮＡの混合物で構成されているという事実に起因して、独自の考慮事項を有する。この方法は、より正確な決定を提供するために、他のアプローチと組み合わせられてもよい。一実施形態において、この方法は、米国特許第７，８８８，０１７号に記載されているような配列カウントアプローチと組み合わせてもよい。記載されたアプローチを使用して、母体血漿サンプルから胎児の父性を非侵襲的に検出することもできる。加えて、各アプローチをＤＮＡ又は純粋なＤＮＡサンプルの他の混合物に適用して、異数体染色体の有無を検出したり、分解されたＤＮＡサンプルから多数のＳＮＰを遺伝子型決定したり、セグメンタルコピー数変異（ＣＮＶ）を検出したり、目的の他の遺伝子型状態、又はそれらのいくつかの組み合わせを検出したりすることができる。

【0340】

サンプル中の対立遺伝子分布の正確な測定
現在の配列決定アプローチを使用して、サンプル中の対立遺伝子の分布を推定することができる。そのような方法の１つは、ショットガン配列決定と呼ばれるプールＤＮＡからのランダムサンプリング配列を伴う。配列決定データ中の特定の対立遺伝子の割合は、典型的には非常に低く、単純な統計によって決定することができる。ヒトゲノムは約３０億塩基対を含有する。したがって、使用される配列決定方法が１００ｂｐのリードを行う場合、特定の対立遺伝子は、３０００万の配列リードごとに約１回測定される。

【0341】

一実施形態において、本開示の方法を使用して、その染色体からの遺伝子座の測定された対立遺伝子分布からのＤＮＡのサンプル中に同じ遺伝子座のセットを含有する２つ以上の異なるハプロタイプの有無を決定する。異なるハプロタイプは、１つの個体からの２つの異なる相同染色体、トリソミーの個体からの３つの異なる相同染色体、１つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの３つの異なる相同ハプロタイプ、１つ若しくは２つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの３つ若しくは４つのハプロタイプ、又は他の組み合わせを表すことができる。ハプロタイプ間で多型性である対立遺伝子は、より有益である傾向があるが、母親及び父親が同じ対立遺伝子についてホモ接合性ではない任意の対立遺伝子は、単純なリードカウント分析から入手可能な情報を超える測定された対立遺伝子分布を通じて有用な情報をもたらす。

【0342】

しかしながら、そのようなサンプルのショットガン配列決定は、サンプル内の異なるハプロタイプ間で多型ではない、又は目的ではない染色体についての多くの配列をもたらし、したがって、標的ハプロタイプの割合に関する情報を明らかにしないため、極めて非効率的である。本明細書に記載されるのは、配列決定によって得られる対立遺伝子情報の収率を増加させるために、ゲノム内で多型である可能性がより高いサンプル中のＤＮＡのセグメントを特異的に標的化する、及び／又は優先的に濃縮する方法である。濃縮されたサンプル中の測定された対立遺伝子分布が、標的個体中に存在する実際の量を真に表すためには、標的セグメント中の所与の遺伝子座における他の対立遺伝子と比較して、１つの対立遺伝子の優先的な濃縮がほとんど又はまったくないことが重要であることに留意されたい。多型対立遺伝子を標的化する当該技術分野で既知の現在の方法は、存在する任意の対立遺伝子の少なくともいくつかが検出されることを確実にするように設計される。しかしながら、これらの方法は、元の混合物中に存在する多型対立遺伝子の不偏の対立遺伝子分布を測定する目的で設計されていない。標的濃縮の任意の特定の方法が、測定された対立遺伝子分布が、他の任意の方法よりも元の非増幅サンプル中に存在する対立遺伝子分布を正確に表す濃縮サンプルを生成することができることは明らかではない。多くの濃縮方法が、理論的には、そのような目的を達成することが期待され得るが、当業者は、電流増幅、標的化、及び他の優先的な濃縮方法に多くの確率論的又は決定論的なバイアスが存在することをよく認識している。本明細書に記載される方法の一実施形態は、ゲノム中の所与の遺伝子座に対応するＤＮＡの混合物中に見出される複数の対立遺伝子が増幅されるか、又は対立遺伝子の各々の濃縮度がほぼ同一であるような方法で優先的に濃縮されることを可能にする。別の言い方をすれば、この方法は、全体として混合物中に存在する対立遺伝子の相対量を増加させることを可能にするが、各遺伝子座に対応する対立遺伝子間の比率は、ＤＮＡの元の混合物中と本質的に同じままであることである。先行技術における遺伝子座の優先的な濃縮方法は、１％を超える、２％を超える、５％を超える、更に１０％を超える対立遺伝子バイアスをもたらし得る。この優先的な濃縮は、ハイブリダイゼーションによる捕捉アプローチを使用する場合の捕捉バイアス、又は各サイクルについて小さい場合があるが、２０、３０、又は４０サイクルにわたって複合される場合に大きい場合がある増幅バイアスに起因し得る。本開示の目的のために、比率が本質的に同じままであることは、元の混合物中の対立遺伝子の比率を、得られる混合物中の対立遺伝子の比率で割った値が、０．９５～１．０５、０．９８～１．０２、０．９９～１．０１、０．９９５～１．００５、０．９９８～１．００２、０．９９９～１．００１、又は０．９９９９～１．０００１であることを意味する。ここに提示される対立遺伝子比の計算は、標的個体の倍数性状態の決定に使用され得ず、対立遺伝子バイアスを測定するために使用されるメトリックのみであってもよいことに留意されたい。

【0343】

一実施形態において、混合物が標的遺伝子座のセットで優先的に濃縮されると、それは、クローンサンプル（単一分子から生成されたサンプル、例としては、ＩＬＬＵＭＩＮＡＧＡＩＩｘ、ＩＬＬＵＭＩＮＡＨｉＳｅｑ、ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓＳＯＬｉＤ、５５００ＸＬ）を配列決定する、以前、現在、又は次世代の配列決定器具のいずれか１つを使用して配列決定されてもよい。この比は、標的領域内の特定の対立遺伝子を介して配列決定することによって評価されてもよい。これらの配列決定リードは、対立遺伝子の種類及びそれに応じて決定された異なる対立遺伝子の比率に従って分析及びカウントされてもよい。長さが１～数塩基である変異については、対立遺伝子の検出は、配列決定によって行われ、配列決定リードが、その捕捉された分子の対立遺伝子組成を評価するために、問題の対立遺伝子にまたがることが不可欠である。遺伝子型についてアッセイされる捕捉された分子の総数は、配列決定リードの長さを増加させることによって増加させることができる。全ての分子の完全な配列決定は、濃縮プールで利用可能な最大量のデータの収集を保証する。しかしながら、配列決定は現在高価であり、より少ない数の配列リードを使用して対立遺伝子分布を測定することができる方法は、大きな価値を有するであろう。加えて、読み取り可能な最大長には技術的な制限があり、読み取り長が長くなると精度にも制限がある。最大有用性の対立遺伝子は、長さが１～数塩基であるが、理論的には、配列決定リードの長さより短い任意の対立遺伝子を使用することができる。対立遺伝子の変異は全てのタイプで生じるが、本明細書で提供される実施例は、わずか数個の隣接する塩基対を含有するＳＮＰ又はバリアントに焦点を当てる。セグメントコピー数バリアントなどのより大きなバリアントは、セグメント内部のＳＮＰの全体の集合が複製されるため、多くの場合、これらのより小さなバリアントの集合によって検出することができる。ＳＴＲなどのいくつかの塩基よりも大きいバリアントは特別な考慮を必要とし、いくつかの標的化アプローチは機能するが、他のものは機能しない。

【0344】

ゲノム内の１つ又は複数のバリアント位置を特異的に単離及び濃縮するために使用され得る複数の標的化アプローチが存在する。典型的には、これらは、バリアント配列に隣接する不変配列を利用することに依存する。基質が母体血漿である配列決定の文脈における標的化に関する先行技術がある（例えば、Ｌｉａｏｅｔａｌ．，Ｃｌｉｎ．Ｃｈｅｍ．２０１１；５７（１）：ｐｐ．９２－１０１を参照のこと）。しかしながら、先行技術におけるアプローチは全て、エクソンを標的化する標的化プローブを使用し、ゲノムの多型性領域を標的化することに焦点を当てない。一実施形態において、本開示の方法は、多型性領域に排他的又はほぼ排他的に焦点を当てる標的化プローブを使用することを含む。一実施形態において、本開示の方法は、ＳＮＰに排他的又はほぼ排他的に焦点を当てる標的化プローブを使用することを含む。本開示のいくつかの実施形態において、標的多型性部位は、少なくとも１０％のＳＮＰ、少なくとも２０％のＳＮＰ、少なくとも３０％のＳＮＰ、少なくとも４０％のＳＮＰ、少なくとも５０％のＳＮＰ、少なくとも６０％のＳＮＰ、少なくとも７０％のＳＮＰ、少なくとも８０％のＳＮＰ、少なくとも９０％のＳＮＰ、少なくとも９５％のＳＮＰ、少なくとも９８％のＳＮＰ、少なくとも９９％のＳＮＰ、少なくとも９９．９％のＳＮＰ、又は排他的にＳＮＰからなる。

【0345】

一実施形態において、本開示の方法を使用して、遺伝子型（特定の遺伝子座におけるＤＮＡの塩基組成）及びこれらの遺伝子型の相対割合を、ＤＮＡ分子の混合物から決定することができ、これらのＤＮＡ分子は、１つ又は複数の遺伝子的に異なる個体に由来し得る。一実施形態において、本開示の方法を使用して、多型遺伝子座のセットでの遺伝子型、及びそれらの遺伝子座に存在する異なる対立遺伝子の量の相対比を決定することができる。一実施形態において、多型遺伝子座は、ＳＮＰから完全になることができる。一実施形態において、多型遺伝子座は、ＳＮＰ、単一タンデム反復、及び他の多型を含むことができる。一実施形態において、本開示の方法を使用して、ＤＮＡの混合物中の多型遺伝子座のセットでの対立遺伝子の相対分布を決定することができ、ＤＮＡの混合物は、母親に由来するＤＮＡと、胎児に由来するＤＮＡとを含む。一実施形態において、結合対立遺伝子の分布は、妊婦の血液から単離されたＤＮＡの混合物上で決定することができる。一実施形態において、遺伝子座のセットにおける対立遺伝子分布を使用して、妊娠中の胎児の１つ以上の染色体の倍数性状態を決定することができる。

【0346】

一実施形態において、ＤＮＡ分子の混合物は、１つの個体の複数の細胞から抽出されたＤＮＡに由来し得る。一実施形態において、ＤＮＡが由来する細胞の元のコレクションは、その個体がモザイク（生殖細胞系又は体細胞系）である場合、同じ又は異なる遺伝子型の二倍体又は単倍体細胞の混合物を含んでもよい。一実施形態において、ＤＮＡ分子の混合物はまた、単一細胞から抽出されたＤＮＡに由来し得る。一実施形態において、ＤＮＡ分子の混合物はまた、同じ個体又は異なる個体の２つ以上の細胞の混合物から抽出されたＤＮＡに由来し得る。一実施形態において、ＤＮＡ分子の混合物は、細胞フリーＤＮＡを含むことが知られている血漿などの細胞からすでに遊離している生物学的物質から単離されたＤＮＡに由来し得る。一実施形態において、この生物学的物質は、胎児ＤＮＡが混合物中に存在することが示されている妊娠中の場合と同様に、１つ以上の個体由来のＤＮＡの混合物であってもよい。一実施形態において、生物学的物質は、母体血液中に見出された細胞の混合物からのものであってもよく、細胞のいくつかは胎児起源である。一実施形態において、生物学的物質は、胎児細胞が濃縮された妊娠中の血液由来の細胞であってもよい。

【0347】

環状化プローブ
本開示のいくつかの実施形態は、以前に文献に記載された「連結された反転プローブ」（ＬＩＰ）の使用を伴う。ＬＩＰは、ＤＮＡの環状分子の作製を伴う技術を包含することを意味する一般的な用語であり、プローブは、適切なポリメラーゼ及び／又はリガーゼ、並びに適切な条件、緩衝液及び他の試薬の添加が、標的対立遺伝子にわたるＤＮＡの相補的な反転領域を完成させて、標的対立遺伝子内に見出される情報を捕捉するＤＮＡの環状ループを作製するように、標的対立遺伝子のいずれかの側のＤＮＡの標的領域にハイブリダイズするように設計される。ＬＩＰはまた、予め環化されたプローブ、予め環化されたプローブ、又は環化されたプローブと呼ばれてもよい。ＬＩＰプローブは、５０～５００ヌクレオチド長、及び一実施形態において７０～１００ヌクレオチド長の間の線形ＤＮＡ分子であってもよく、いくつかの実施形態において、本明細書に記載されるよりも長くても短くてもよい。本開示の他の実施形態は、ＬＩＰ技術の異なる化身、例えば、パドロックプローブ及び分子反転プローブ（ＭＩＰ）を含む。

【0348】

配列決定のための特定の位置を標的化する１つの方法は、ＤＮＡポリメラーゼ及びＤＮＡリガーゼの添加が３’末端からの伸長をもたらすように、プローブの３’及び５’末端が、標的領域に隣接する及び標的領域のいずれかの側の位置で反転した様式で標的ＤＮＡにアニールするプローブを合成することであり、標的分子に相補的な一本鎖プローブに塩基を添加し（ギャップフィル）、続いて、新しい３’末端を元のプローブの５’末端にライゲーションし、その後、バックグラウンドＤＮＡから単離することができる環状ＤＮＡ分子をもたらす。プローブ端部は、目的の標的領域に隣接するように設計されている。このアプローチの一態様は、一般にＭＩＰＳと呼ばれ、記入された配列の性質を決定するためにアレイ技術と併せて使用されてきた。対立遺伝子比を測定する文脈におけるＭＩＰの使用に対する１つの欠点は、ハイブリダイゼーション、環化、及び増幅工程が、同じ遺伝子座における異なる対立遺伝子について等しい速度で行われないことである。これは、元の混合物中に存在する実際の対立遺伝子比率を代表しない対立遺伝子比率の測定値をもたらす。

【0349】

一実施形態において、環化プローブは、標的多型遺伝子座の上流にハイブリダイズするように設計されるプローブの領域と、標的多型遺伝子座の下流にハイブリダイズするように設計されるプローブの領域とが、非核酸骨格を介して共有結合的に接続されるように構築される。この骨格は、任意の生体適合性分子又は生体適合性分子の組み合わせであってもよい。可能な生体適合性分子のいくつかの例は、ポリ（エチレングリコール）、ポリカーボネート、ポリウレタン、ポリエチレン、ポリプロピレン、スルホンポリマー、シリコーン、セルロース、フルオロポリマー、アクリル化合物、スチレンブロックコポリマー、及び他のブロックコポリマーである。

【0350】

本開示の一実施形態において、このアプローチは、充填された配列を調べる手段として、配列決定に容易に従うように修正されている。元のサンプルの元の対立遺伝子の割合を保持するためには、少なくとも１つの重要な考慮事項が考慮されなければならない。ギャップフィル領域内の異なる対立遺伝子間の可変位置は、バリアントの差異をもたらすＤＮＡポリメラーゼによる開始バイアスがあり得るため、プローブ結合部位にあまり近すぎてはならない。別の考慮事項は、ギャップ充填領域内のバリアントと相関する追加のバリエーションがプローブ結合部位に存在し得、これが異なる対立遺伝子からの不均等な増幅をもたらし得ることである。本開示の一実施形態において、予め環化されたプローブの３’末端及び５末端は、標的対立遺伝子のバリアント位置（多型部位）から離れた１つ又はいくつかの位置である塩基にハイブリダイズするように設計される。多型部位（ＳＮＰ又はその他）と、予め環化されたプローブの３’末端及び５末端にハイブリダイズするように設計された塩基との間の塩基数は、１塩基であってもよく、２塩基であってもよく、３塩基であってもよく、４塩基であってもよく、５塩基であってもよく、６塩基であってもよく、７～１０塩基であってもよく、１１～１５塩基であってもよく、又は１６～２０塩基、２０～３０塩基対、若しくは３０～６０塩基対であってもよい。順方向および逆方向のプライマーは、多型部位から離れた異なる数の塩基をハイブリダイズするように設計されてもよい。環状化プローブは、現在のＤＮＡ合成技術で大量に生成することができ、非常に大量のプローブを生成し、潜在的にプールすることを可能にし、多くの遺伝子座を同時に調べることができる。これは、３０万を超えるプローブで動作することが報告されている。標的個体のゲノムデータを測定するために使用することができる環状化プローブを含む方法を考察する２つの論文は、以下を含む：Ｐｏｒｒｅｃａｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ，２００７４（１１），ｐｐ．９３１－９３６．、及びＴｕｒｎｅｒｅｔａｌ．，ＮａｔｕｒｅＭｅｔｈｏｄｓ，２００９，６（５），ｐｐ．３１５－３１６。これらの論文に記載の方法は、本明細書に記載の他の方法と組み合わせて使用されてもよい。これらの２つの論文からの方法の特定の工程は、本明細書に記載の他の方法からの他の工程と組み合わせて使用されてもよい。

【0351】

本明細書に開示される方法のいくつかの実施形態において、標的個体の遺伝物質は、任意選択で増幅され、続いて、例えば、ローリングサークル増幅を使用して、環状化前プローブのハイブリダイゼーション、ハイブリダイゼーションされたプローブの２つの端部間の塩基を埋めるためのギャップフィルの実施、環状化プローブを形成するための２つの端部のライゲーション、及び環状化プローブの増幅が行われる。所望の標的対立遺伝子情報が、ＬＩＰシステムなどにおいて、適切に設計されたオリゴ核酸プローブを環化することによって捕捉されると、環化プローブの遺伝子配列を測定して、所望の配列データを得てもよい。一実施形態において、適切に設計されたオリゴヌクレオチドプローブは、標的個体の非増幅遺伝物質上で直接環化され、その後増幅されてもよい。ローリングサークル増幅、ＭＤＡ、又は他の増幅プロトコルを含む、いくつかの増幅手順を使用して、元の遺伝物質又は環化ＬＩＰを増幅してもよいことに留意されたい。異なる方法を使用して、例えば、高スループット配列決定、サンガー配列決定、他の配列決定方法、ハイブリダイゼーションによる捕捉、環化による捕捉、多重ＰＣＲ、他のハイブリダイゼーション方法、及びそれらの組み合わせを使用して、標的ゲノム上の遺伝子情報を測定してもよい。

【0352】

個体の遺伝物質が、上記の方法の１つ又は組み合わせを用いて測定されると、次いで、適切な遺伝子測定とともに、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）方法などの情報学に基づく方法を用いて、個体上の１つ以上の染色体の倍数性状態、及び／又は１つ以上の対立遺伝子、具体的には、目的の疾患又は遺伝子状態と相関する対立遺伝子の遺伝子状態を決定することができる。ＬＩＰの使用は、遺伝子配列の多重捕捉、続いて、配列決定による遺伝子型決定のために報告されていることに留意されたい。しかしながら、単一の細胞、少数の細胞、又は細胞外ＤＮＡに見出される遺伝物質の増幅のためのＬＩＰベースの戦略から生じる配列決定データの使用は、標的個体の倍数性状態を決定する目的で使用されていない。

【0353】

ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭアレイ又はＡＦＦＹＭＥＴＲＩＸ遺伝子チップなどのハイブリダイゼーションアレイによって測定される遺伝子データから個体の倍数性状態を決定するための情報学に基づく方法の適用は、本文書の別の箇所の参照文書に記載されている。しかしながら、本明細書に記載される方法は、文献において以前に記載された方法に対する改善を示す。例えば、高スループット配列決定に続くＬＩＰベースのアプローチは、多重化のためのより良い能力、より良い捕捉特異性、より良い均一性、及び低い対立遺伝子バイアスを有するアプローチに起因して、より良い遺伝子型データを予期せず提供する。より大きな多重化は、より多くの対立遺伝子を標的化することを可能にし、より正確な結果を与える。より良い均一性により、より多くの標的対立遺伝子が測定され、より正確な結果が得られる。対立遺伝子バイアスの割合が低いほど、ミスコールの割合が低くなり、より正確な結果が得られる。より正確な結果は、臨床転帰の改善、及びより良い医療をもたらす。

【0354】

ＬＩＰは、配列決定以外の方法によって遺伝子型決定のためのＤＮＡのサンプル中の特定の遺伝子座を標的化する方法として使用され得ることに留意することが重要である。例えば、ＬＩＰを使用して、ＳＮＰアレイ又は他のＤＮＡ若しくはＲＮＡベースのマイクロアレイを使用して、遺伝子型決定のためのＤＮＡを標的化してもよい。

【0355】

ライゲーション媒介ＰＣＲ
ライゲーション媒介ＰＣＲは、ＤＮＡの混合物中の１つ又は複数の遺伝子座を増幅することによってＤＮＡのサンプルを優先的に濃縮するために使用されるＰＣＲの方法であり、方法は、以下を含む：プライマー対のセットを得ることであって、対の各プライマーが、標的特異的配列及び非標的配列を含有し、標的特異的配列が、多型部位の１つ上流及び１つ下流の標的領域にアニーリングするように設計され、多型部位から０、１、２、３、４、５、６、７、８、９、１０、１１～２０、２１～３０、３１～４０、４１～５０、５１～１００、又は１００超で分離することができる、得ること；上流プライマーの３プライム末端から、それと下流プライマーの５プライム末端との間の一本鎖領域を、標的分子に相補的なヌクレオチドで充填するＤＮＡの重合；上流プライマーの最後の重合塩基を、下流プライマーの隣接する５プライム塩基にライゲーションすること；並びに上流プライマーの５プライム末端及び下流プライマーの３プライム末端に含まれる非標的配列を使用して、重合及びライゲーション分子のみを増幅すること。異なる標的に対するプライマーの対は、同じ反応で混合されてもよい。非標的配列は、重合及びライゲーションに成功したプライマーの全ての対が単一の増幅プライマー対で増幅され得るように、ユニバーサル配列として機能する。

【0356】

ハイブリダイゼーションによる捕捉
標的ゲノム内の特定の配列セットの優先的濃縮は、いくつかの方法で達成することができる。本明細書の他の箇所には、ＬＩＰを使用して配列の特定のセットを標的化することができる方法の説明があるが、これらの用途の全てにおいて、他の標的化及び／又は優先的な濃縮方法を同じ目的のために等しく適切に使用することができる。別の標的化方法の１つの例は、ハイブリダイゼーションによる捕捉アプローチである。ハイブリダイゼーション技術による商業的捕捉のいくつかの例としては、ＡＧＩＬＥＮＴ’ｓＳＵＲＥＳＥＬＥＣＴ及びＩＬＬＵＭＩＮＡ’ｓＴｒｕＳｅｑが挙げられる。ハイブリダイゼーションによる捕捉において、所望の標的化配列に相補的又はほとんど相補的なオリゴヌクレオチドのセットをＤＮＡの混合物にハイブリダイゼーションさせ、次いで混合物から物理的に分離する。所望の配列が標的化オリゴヌクレオチドにハイブリダイゼーションすると、標的化オリゴヌクレオチドを物理的に除去する効果は、標的配列もまた除去することである。ハイブリダイゼーションしたオリゴを除去すると、それらの融解温度を超えるように加熱することができ、増幅することができる。標的化オリゴヌクレオチドを物理的に除去するいくつかの方法は、標的化オリゴを固体支持体、例えば、磁性ビーズ、又はチップに共有結合させることである。標的化オリゴヌクレオチドを物理的に除去する別の方法は、別の分子部分に対して強い親和性を有する分子部分に共有結合することである。このような分子対の一例は、ＳＵＲＥＳＥＬＥＣＴに使用されるようなビオチン及びストレプトアビジンである。したがって、標的配列をビオチン分子に共有結合させることができ、ハイブリダイゼーション後、ストレプトアビジンを付着させた固体支持体を使用して、標的配列にハイブリダイゼーションされるビオチン化オリゴヌクレオチドをプルダウンすることができる。

【0357】

ハイブリッド捕捉は、標的分子に対する目的の標的に相補的なプローブのハイブリダイゼーションを伴う。ハイブリッド捕捉プローブは、元々、標的間の相対的な均一性を有するゲノムの大部分の画分を標的化し、濃縮するように開発された。その出願では、全ての標的が、全ての領域が配列決定によって検出され得るほどの十分な均一性で増幅されることが重要であったが、元のサンプル中の対立遺伝子の割合を保持することは考慮されなかった。捕捉後、サンプル中に存在する対立遺伝子は、捕捉された分子の直接配列決定によって決定することができる。これらの配列決定リードは、対立遺伝子の種類に従って分析及びカウントされてもよい。しかしながら、現在の技術を使用して、捕捉された配列の測定された対立遺伝子分布は、典型的には、元の対立遺伝子分布を表していない。

【0358】

一実施形態において、対立遺伝子の検出は、配列決定によって行われる。多型部位で対立遺伝子同一性を捕捉するためには、その捕捉された分子の対立遺伝子組成を評価するために、配列決定リードが問題の対立遺伝子にまたがることが不可欠である。捕捉分子は、多くの場合、配列決定時に可変長であるため、分子全体が配列決定されない限り、バリアント位置と重複することを保証することはできない。しかしながら、コストの考慮事項、並びに配列決定リードの可能な最大長及び精度に関する技術的制限により、分子全体の配列決定は実行不可能である。一実施形態において、リード長は、約３０塩基～約５０塩基又は約７０塩基に増加させることができ、標的配列内のバリアント位置と重複するリードの数を大幅に増加させることができる。

【0359】

目的の位置を調べるリード数を増やす別の方法は、基礎となる濃縮対立遺伝子にバイアスが生じない限り、プローブの長さを減らすことである。合成されたプローブの長さは、１つの遺伝子座で見出される２つの異なる対立遺伝子にハイブリダイズするように設計された２つのプローブが、元のサンプル中の様々な対立遺伝子とほぼ等しい親和性でハイブリダイズするように十分な長さであるべきである。現在、当該技術分野で既知の方法は、典型的には１２０塩基よりも長いプローブを説明する。現在の実施形態において、対立遺伝子が１つ以上の塩基である場合、捕捉プローブは、約１１０塩基未満、約１００塩基未満、約９０塩基未満、約８０塩基未満、約７０塩基未満、約６０塩基未満、約５０塩基未満、約４０塩基未満、約３０塩基未満、及び約２５塩基未満であってもよく、これは、全ての対立遺伝子からの等しい濃縮を確実にするのに十分である。ハイブリッド捕捉技術を使用して濃縮されるＤＮＡの混合物が、血液、例えば母体血液から単離された遊離浮遊ＤＮＡを含む混合物である場合、ＤＮＡの平均長さは非常に短く、典型的には２００塩基未満である。より短いプローブの使用は、ハイブリッド捕捉プローブが所望のＤＮＡフラグメントを捕捉する可能性を高める。より大きなバリエーションでは、より長いプローブが必要になることもある。一実施形態において、目的のバリエーションは、長さが１つ（ＳＮＰ）から数塩基である。一実施形態において、ゲノム内の標的領域は、ハイブリッド捕捉プローブを使用して優先的に濃縮することができ、ハイブリッド捕捉プローブは、９０塩基未満の長さであり、８０塩基未満、７０塩基未満、６０塩基未満、５０塩基未満、４０塩基未満、３０塩基未満、又は２５塩基未満であり得る。一実施形態において、所望の対立遺伝子が配列決定される可能性を増加させるために、多型対立遺伝子位置に隣接する領域にハイブリダイズするように設計されるプローブの長さを、９０塩基超から約８０塩基、又は約７０塩基、又は約６０塩基、又は約５０塩基、又は約４０塩基、又は約３０塩基、又は約２５塩基まで減少させることができる。

【0360】

捕捉を可能にするために、合成されたプローブと標的分子との間に最小限の重複がある。この合成されたプローブは、この最小限の必要な重複よりも大きくなりながら、できるだけ短くすることができる。多型領域を標的化するためにより短いプローブ長を使用する効果は、標的対立遺伝子領域と重複するより多くの分子が存在することである。元のＤＮＡ分子のフラグメント化の状態は、標的対立遺伝子と重複するリードの数にも影響する。血漿サンプルなどのいくつかのＤＮＡサンプルは、インビボで行われる生物学的プロセスのために既にフラグメント化されている。しかしながら、より長いフラグメントを有するサンプルは、ライブラリ調製及び濃縮を配列決定する前のフラグメント化の恩恵を受ける。プローブ及びフラグメントの両方が短い（約６０～８０ｂｐ）場合、最大特異性は、相対的に少数の配列リードが達成され得、目的の臨界領域と重複することに失敗する。

【0361】

一実施形態において、ハイブリダイゼーション条件は、元のサンプル中に存在する異なる対立遺伝子の捕捉における均一性を最大化するように調整することができる。一実施形態において、ハイブリダイゼーション温度を低下させて、対立遺伝子間のハイブリダイゼーションバイアスの差を最小限に抑える。温度を下げることは、意図しない標的へのプローブのハイブリダイゼーションを増加させる効果を有するため、当該技術分野で既知の方法は、ハイブリダイゼーションのためにより低い温度を使用することを避ける。しかしながら、目標が最大の忠実度で対立遺伝子比を維持することである場合、より低いハイブリダイゼーション温度を使用するアプローチは、現在の技術がこのアプローチから離れているという事実にもかかわらず、最適に正確な対立遺伝子比を提供する。ハイブリダイゼーション温度は、標的領域の実質的な重複を有する標的のみが捕捉されるように、標的と合成プローブとの間のより大きな重複を必要とするように増加させることもできる。本開示のいくつかの実施形態において、ハイブリダイゼーション温度は、通常のハイブリダイゼーション温度から約４０℃、約４５℃、約５０℃、約５５℃、約６０℃、約６５℃、又は約７０℃に低下する。

【0362】

一実施形態において、ハイブリッド捕捉プローブは、多型対立遺伝子に隣接する領域に見出されるＤＮＡに相補的なＤＮＡを有する捕捉プローブの領域が、多型部位に直接隣接しないように設計することができる。代わりに、捕捉プローブは、標的の多型部位に隣接するＤＮＡにハイブリダイズするように設計される捕捉プローブの領域が、１つ又は少数の塩基に等しい長さで、多型部位とファンデルワールス接触するであろう捕捉プローブの部分から分離されるように設計され得る。一実施形態において、ハイブリッド捕捉プローブは、多型対立遺伝子に隣接しているが、それを横断しない領域にハイブリダイズするように設計され、これは、隣接捕捉プローブと呼ばれ得る。隣接する捕捉プローブの長さは、約１２０塩基未満、約１１０塩基未満、約１００塩基未満、約９０塩基未満であり得、約８０塩基未満、約７０塩基未満、約６０塩基未満、約５０塩基未満、約４０塩基未満、約３０塩基未満、及び約２５塩基未満であり得る。隣接捕捉プローブによって標的化されるゲノムの領域は、１、２、３、４、５、６、７、８、９、１０、１１～２０個、又は２０個を超える塩基対によって、多型遺伝子座によって分離されていてもよい。

【0363】

標的化配列捕捉を使用した標的化された捕捉ベースの疾患スクリーニング試験の説明。ＡＧＩＬＥＮＴ（ＳＵＲＥＳＥＬＥＣＴ）、ＲＯＣＨＥ－ＮＩＭＢＬＥＧＥＮ、又はＩＬＬＵＭＩＮＡが現在提供しているようなカスタム標的化配列捕捉。捕捉プローブは、様々な種類の変異の捕捉を確実にするようにカスタム設計することができる。点変異については、点変異と重複する１つ以上のプローブが、変異を捕捉し、配列決定するのに十分であるべきである。

【0364】

小さな挿入又は欠失について、変異と重複する１つ以上のプローブは、変異を含むフラグメントを捕捉し配列決定するのに十分であり得る。ハイブリダイゼーションは、典型的には、参照ゲノム配列に対して設計された、プローブ制限捕捉効率の間では、より低効率であってもよい。変異を含むフラグメントの捕捉を確実にするために、１つは正常対立遺伝子とマッチし、１つは変異対立遺伝子とマッチする２つのプローブを設計することができる。より長いプローブは、ハイブリダイゼーションを強化し得る。複数の重複するプローブは、捕捉を強化し得る。最後に、プローブを、重複していないがすぐ隣接させることで、変異は、正常及び変異対立遺伝子の比較的類似した捕捉効率を可能にし得る。

【0365】

単純タンデム反復（ＳＴＲ）の場合、これらの可変性の高い部位と重複するプローブは、フラグメントを十分に捕捉する可能性は低い。捕捉を強化するために、プローブを可変部位に隣接させることができるが、重複させることはできない。次いで、フラグメントを通常通り配列決定して、ＳＲＴの長さ及び組成を明らかにすることができる。

【0366】

一連の重複するプローブである大規模な欠失の場合、エクソーム捕捉システムで現在使用されている共通のアプローチが機能する場合がある。しかしながら、このアプローチでは、個体がヘテロ接合体であるかどうかを決定することが困難であり得る。捕捉された領域内のＳＮＰを標的化し、評価することは、個体が担体であることを示す領域にわたるヘテロ接合性の喪失を潜在的に明らかにし得る。一実施形態において、潜在的に欠失される領域にわたって非重複又はシングルトンプローブを配置し、ヘテロ接合性の尺度として捕捉されるフラグメントの数を使用することが可能である。個々の虫歯が大きな欠失を有する場合、非欠失（二倍体）参照遺伝子座と比較して、フラグメントの数の半分が捕捉に利用可能であると予測される。したがって、欠失領域から得られるリード数は、正常な二倍体遺伝子座から得られるリード数の約半分であるべきである。潜在的に欠失した領域にわたって複数のシングルトンプローブからの配列決定リードの深さを集約及び平均化することは、シグナルを強化し、診断の信頼性を向上させることができる。ＳＮＰを標的化してヘテロ接合性の喪失を特定し、複数のシングルトンプローブを使用して、その遺伝子座からの基礎となるフラグメントの量の定量的尺度を得る２つのアプローチも組み合わせることができる。これらの戦略のいずれか又は両方は、同じ目的をより良く達成するために、他の戦略と組み合わせられてもよい。

【0367】

男性胎児のｃｆＤＮＡ検出の検査中に、Ｙ染色体フラグメントの存在によって示されるように、同じ試験において捕捉及び配列決定され、母親及び父親が罹患していないＸ連鎖優性変異、又は母親が罹患していない優性変異のいずれかが胎児への高リスクを示す。罹患していない母親における同じ遺伝子内の２つの変異体劣性対立遺伝子の検出は、胎児が父親から変異体対立遺伝子を、及び潜在的に母親から第２の変異体対立遺伝子を遺伝したことを意味する。全ての症例において、羊水穿刺又は絨毛性絨毛サンプリングによるフォローアップ検査が示されてもよい。

【0368】

標的化された捕捉ベースの疾患スクリーニング検査は、異数体のための標的化された捕捉ベースの非侵襲性出生前診断検査と組み合わせることができる。

【0369】

リード深度（ＤＯＲ）の可変性を低下させるいくつかの方法が存在する：例えば、プライマー濃度を増加させることができる方法、より長い標的化増幅プローブを使用することができる方法、又はより多くのＳＴＡサイクル（２５を超える、３０を超える、３５を超える、又は更に４０を超えるなど）を実行することができる方法。

【0370】

標的化ＰＣＲ
いくつかの実施形態において、ＰＣＲを使用して、ゲノムの特定の位置を標的化することができる。血漿サンプルにおいて、元々のＤＮＡは、高度にフラグメント化される（典型的には５００ｂｐ未満、平均長さは２００ｂｐ未満）。ＰＣＲでは、順方向及び逆方向のプライマーの両方が同じフラグメントにアニーリングし、増幅が可能でなければならない。したがって、フラグメントが短い場合、ＰＣＲアッセイは、同様に相対的に短い領域を増幅しなければならない。ＭＩＰＳと同様に、多型位置がポリメラーゼ結合部位に近すぎる場合、異なる対立遺伝子からの増幅におけるバイアスが生じる場合がある。現在、多型領域（ＳＮＰを含有するものなど）を標的化するＰＣＲプライマーは、典型的には、プライマーの３’末端が、１つ又は複数の多型塩基のすぐ横に隣接する塩基にハイブリダイズするように設計される。本開示の一実施形態において、順方向及び逆方向のＰＣＲプライマー両方の３’末端は、標的対立遺伝子のバリアント位置（多型部位）から離れた１つ又はいくつかの位置である塩基にハイブリダイズするように設計される。多型部位（ＳＮＰ又はその他）と、プライマーの３’末端にハイブリダイズするように設計された塩基との間の塩基数は、１塩基であってもよく、２塩基であってもよく、３塩基であってもよく、４塩基であってもよく、５塩基であってもよく、６塩基であってもよく、７～１０塩基であってもよく、１１～１５塩基であってもよく、又は１６～２０塩基であってもよい。順方向および逆方向のプライマーは、多型部位から離れた異なる数の塩基をハイブリダイズするように設計されてもよい。

【0371】

ＰＣＲアッセイは大量に作成することができるが、異なるＰＣＲアッセイ間の相互作用により、約１００アッセイを超えて多重化することが困難である。様々な複雑な分子手法を使用して、多重化のレベルを上げることができるが、依然として、反応当たり１００、おそらく２００、又はおそらく５００より少ないアッセイに限定されるだろう。大量のＤＮＡを含むサンプルは、複数のサブ反応に分けられ、次いで、配列決定前に再び組み合わせることができる。ＤＮＡの全体サンプル又はいくつかの部分集合のいずれかが限定されるサンプルについて、サンプルを分けると、統計的ノイズが入り込むだろう。一実施形態において、少量又は限定された量のＤＮＡとは、１０ｐｇ未満、１０～１００ｐｇ、１００ｐｇ～１ｎｇ、１～１０ｎｇ又は１０～１００ｎｇの量を指していてもよい。なお、この方法は、複数のプールに分けることを伴う他の方法によって、入り込んでしまう統計的ノイズに関連する顕著な問題が生じ得る少量のＤＮＡに特に有用であるが、この方法は、任意の量のＤＮＡのサンプルで実行する場合にバイアスを最小限にするという利点を依然として提供する。これらの状況では、全体的なサンプル量を増やすために、普遍的な前増幅工程を使用してもよい。理想的には、この前増幅工程は、対立遺伝子分布を著しく変化させないものであるべきである。

【0372】

一実施形態において、本開示の方法は、例えば、単一細胞又は体液からのＤＮＡなどの限定されたサンプルからの配列決定又はいくつかの他の遺伝子決定方法による遺伝子型決定のために、多数の標的遺伝子座、具体的には、１，０００～５，０００個の遺伝子座、５，０００～１０，０００個の遺伝子座又は１０，０００個より多い遺伝子座に特異的なＰＣＲ産物を作成することができる。現在、５～１０個より多い標的の多重ＰＣＲ反応を行うことには、大きな課題があり、プライマー副産物（例えばプライマーダイマー）及び他のアーチファクトによって妨害されることが多い。ハイブリダイゼーションプローブを用いるマイクロアレイを用いて標的配列を検出する場合、プライマーダイマー及び他のアーチファクトは、これらが検出されないため、無視される場合がある。しかし、検出方法として配列決定を用いる場合、配列決定リードの大部分は、このようなアーチファクトを配列決定し、サンプル中の所望な標的配列を配列決定しないだろう。１つの反応中、５０又は１００を超える反応を多重化し、その後に配列決定するために使用される先行技術で記載される方法は、典型的には、２０％を超える、多くは５０％を超える、多くの場合には８０％を超える、ある場合には９０％を超える標的ではない配列リードが得られる。

【0373】

一般に、サンプルの複数の（ｎ）個の（５０より多い、１００より多い、５００より多い、又は１，０００より多い）標的の標的化配列決定を行うために、サンプルを、１つの個々の標的を増幅するいくつかの数の並行反応に分けることができる。このことは、ＰＣＲマルチウェルプレートで行うことができ、又は市販のプラットフォーム、例えば、ＦＬＵＩＤＩＧＭＡＣＣＥＳＳＡＲＲＡＹ（微小流体チップ中、サンプル当たり４８の反応）又はＲＡＩＮＤＡＮＣＥＴＥＣＨＮＯＬＯＧＹ製のＤＲＯＰＬＥＴＰＣＲ（１００～数千の標的）で行うことができる。残念ながら、これらを分けてプールする方法は、限定された量のＤＮＡを含むサンプルでは、各ウェル中にゲノムの各領域の１つのコピーが存在することを確実にするための、ゲノムの十分なコピーが存在しないことが多いため、問題がある。これは、多型遺伝子座が標的化され、多型遺伝子座での対立遺伝子の相対的な割合が必要である場合には、分けてプールすることによって入り込む統計的ノイズが、ＤＮＡの元々のサンプル中に存在した対立遺伝子の割合の測定を非常に不正確なものにしてしまうため、特に深刻な問題である。限定された量のＤＮＡしか利用可能ではない場合に適用可能な、多くのＰＣＲ反応を効果的かつ効率的に増幅する方法が本明細書に記載される。一実施形態において、本方法は、単一細胞、体液、ＤＮＡの混合物（例えば、母体血漿中に見出される遊離浮遊ＤＮＡ）、生検、環境及び／又は法医学サンプルの分析に適用可能であろう。

【0374】

一実施形態において、標的化配列決定は、以下の工程のうちの１つ、複数、又は全てを伴ってもよい。ａ）ＤＮＡフラグメントの両端にアダプター配列を有するライブラリを生成し、増幅する。ｂ）ライブラリ増幅後、複数の反応に分割する。ｃ）ＤＮＡフラグメントの両端にアダプター配列を有するライブラリを生成し、任意選択で増幅する。ｄ）１個の標的特異性「フォワード」プライマー及び１個のタグ特異性プライマーを用いて、１０００～１０，０００プレックスの選択された標的の増幅を行う。ｅ）「逆方向」標的特異性プライマーと、第１ラウンドで標的特異性順方向プライマーの一部として導入されたユニバーサルタグに特異的な１個（又は複数）のプライマーとを用い、第２の増幅を行う。ｆ）制限された回数のサイクルについて、選択した標的の１０００プレックス前増幅を行う。ｇ）製品を複数のアリコートに分割し、個々の反応で標的のサブプールを増幅する（例えば、５０～５００プレックス、これはシングルプレックスまで使用することができる）。ｈ）並行サブプール反応のプール生成物。ｉ）これらの増幅の間、プライマーは、生成物が配列決定され得るように、配列決定に適合するタグ（部分又は全長）を有することができる。

【0375】

高度に多重化されたＰＣＲ
血漿から得られるゲノムＤＮＡなどの核酸サンプルから、数百から数千の標的配列（例えば、ＳＮＰ遺伝子座）にわたる標的化増幅を可能にする方法が、本明細書で開示される。増幅されるサンプルは、プライマーダイマー産物を比較的含まず、低い標的遺伝子座での対立遺伝子バイアスを有していてもよい。増幅中又は増幅後に、産物に、配列決定に適合するアダプターが付加される場合、これらの産物の分析は、配列決定によって行うことができる。

【0376】

当該技術分野で既知の方法を用いて高度に多重化されたＰＣＲ増幅を行うと、望ましい増幅産物より過剰な、配列決定には好適でないプライマーダイマー産物が生成する。これらは、これらの産物を形成するプライマーを除外することによって、又はプライマーのｉｎｓｉｌｉｃｏでの選択を行うことによって、経験的に減らすことができる。しかし、アッセイの数が多ければ多いほど、この問題は困難になる。

【0377】

１つの解決策は、５０００倍の反応を、いくつかのこれより少ない倍数の増幅（例えば、１００個の５０倍の反応又は５０個の１００倍の反応）に分けること、又は微小流体を用いること、又は更にサンプルを個々のＰＣＲ反応に分けることである。しかし、妊婦血漿由来の非侵襲的な産前診断など、サンプルＤＮＡが限定されている場合、サンプルを複数の反応に分けることは妨げとなるため、避けるべきである。

【0378】

まず、サンプルの血漿ＤＮＡを全体的に増幅し、次いで、サンプルを、反応当たり更に適度な数の標的配列を含む複数の多重化された標的濃縮反応に分けるための方法が本明細書に記載される。一実施形態において、本開示の方法は、複数の遺伝子座でＤＮＡ混合物を優先的に濃縮するために使用することができ、本方法は、ライブラリ中の分子がＤＮＡフラグメントの両端にライゲーションされたアダプター配列を有するようなＤＮＡの混合物からライブラリを作成し、増幅する工程、増幅したライブラリを複数の反応に分割する工程、１つの標的特異性「順方向」プライマーと１つ又は複数のアダプター特異性ユニバーサル「逆方向」プライマーを用い、選択された標的の第１ラウンドの多重増幅を行う工程のうちの１つ以上を含む。一実施形態において、本開示の方法は、更に、「逆方向」標的特異性プライマーと、第１ラウンドで標的特異性順方向プライマーの一部として導入されたユニバーサルタグに特異的な１個又は複数のプライマーとを用い、第２の増幅を行うことを含む。一実施形態において、本方法は、完全ネスティッド、ヘミネスティッド、セミネスティッド、片側完全ネスティッド、片側ヘミネスティッド又は片側セミネスティッドＰＣＲ手法を伴っていてもよい。一実施形態において、本開示の方法は、複数の遺伝子座でＤＮＡ混合物を優先的に濃縮するために使用され、本方法は、制限された回数のサイクルについて、選択した標的の多重前増幅を行うことと、この産物を複数のアリコートに分割することと、標的のサブプールを個々の反応で増幅することと、並行サブプール反応の産物をプールすることと、を含む。なお、この手法を使用して、５０～５００遺伝子座について、５００～５，０００遺伝子座について、５，０００～５０，０００遺伝子座について、又は更に５０，０００～５００，０００遺伝子座について、低レベルの対立遺伝子バイアスを生じる方法で、標的化増幅を行うことができる。一実施形態において、プライマーは、部分又は全長の配列決定に適合するタグを有する。

【0379】

ワークフローは、（１）血漿ＤＮＡを抽出すること、（２）フラグメントの両端にあるユニバーサルアダプターを用い、フラグメントライブラリを調製すること、（３）アダプターに特異的なユニバーサルプライマーを用い、ライブラリを増幅すること、（４）増幅したサンプル「ライブラリ」を複数のアリコートに分割すること、（５）アリコートについて、多重（例えば、標的当たり１つの標的特異性プライマーとタグ特異性プライマーを用いた約１００反応分、１，０００又は１０，０００反応分）増幅を行うこと、（６）１つのサンプルのアリコートをプールすること、（７）サンプルをバーコード化すること、（８）サンプルを混合し、濃度を調整すること、（９）サンプルを配列決定すること、を含んでいてもよい。本ワークフローは、列挙された工程のうちの１つを含む複数のサブ工程を含んでいてもよい（例えば、ライブラリを調製する工程である工程（２）は、３つの酵素工程（平滑末端化、ｄＡテーリング及びアダプターライゲーション）と３つの精製工程を伴っていてもよい）。ワークフローの工程は、組み合わせ、分割され、又は異なる順序で行われてもよい（例えば、バーコード化とサンプルのプール）。

【0380】

ライブラリの増幅は、短いフラグメントをより効率的に増幅するように偏重される方法で行われてもよい。この方法で、妊婦の循環中で見出される無細胞胎児ＤＮＡ（胎盤由来）として、より短い配列、例えば、モノヌクレオソームＤＮＡフラグメントを優先的に増幅することができる。なお、ＰＣＲアッセイは、タグ、例えば、配列決定タグ（通常、１５～２５塩基の切断された形態）を有していてもよい。多重化の後、サンプルのＰＣＲ多重化物をプールし、次いで、タグを、タグ特異性ＰＣＲ（ライゲーションによっても行うことが可能）によって完結させる（バーコード化を含む）。また、全配列決定タグは、多重化と同じ反応に加えられてもよい。第１のサイクルにおいて、標的は、標的特異性プライマーを用いて増幅されてもよく、その後、タグ特異性プライマーは、ＳＱアダプター配列を完成させるために引き継がれてもよい。ＰＣＲプライマーは、タグを有していなくてもよい。配列決定タグは、ライゲーションによって増幅産物に付けられてもよい。

【0381】

一実施形態において、高度な多重ＰＣＲの後、クローン配列決定による増幅物質の評価は、胎児異数性の検出に使用されてもよい。従来の多重ＰＣＲは、５０個までの遺伝子座を同時に評価するのに対し、本明細書に記載される手法を使用して、５０個を超える遺伝子座を同時に、１００個を超える遺伝子座を同時に、５００個を超える遺伝子座を同時に、１，０００個を超える遺伝子座を同時に、５，０００個を超える遺伝子座を同時に、１０，０００個を超える遺伝子座を同時に、５０，０００個を超える遺伝子座を同時に、１００，０００個を超える遺伝子座を同時に、同時評価をすることが可能である。実験は、単一反応において、非侵襲性の産前異数性診断及び／又は高精度のコピー数コールを行うのに十分に良好な効率及び特異性を有しつつ、１０，０００個まで、１０，０００個を含む、１０，０００個を超える別個の遺伝子座を同時に評価することができることが示される。アッセイは、母体血漿から単離されたｃｆＤＮＡサンプルの全体、その画分、又はｃｆＤＮＡサンプルの更に処理された誘導体を用い、単一反応で組み合わせられてもよい。ｃｆＤＮＡ又は誘導体はまた、複数の並列な多重反応に分割されてもよい。最適なサンプル分割及び多重化は、様々な性能仕様の妥協点を探ることによって決定される。材料の量が限られているため、サンプルを複数の画分に分割すると、サンプリングノイズ、取り扱い時間が導入され、エラーの可能性が高まる場合がある。逆に、更に高度な多重化によって、より多くの誤った増幅が起こり、増幅においてより大きな不平等が生じる場合があり、この両者が試験性能を下げる可能性がある。

【0382】

本明細書に記載される方法の適用における２つの重要な関連する考慮事項は、元々の血漿の量が限られていることと、対立遺伝子頻度又は他の測定値を得るこの材料における元々の分子の数である。元々の分子の数が、特定の値を下回る場合、ランダムサンプリングノイズが顕著になり、試験の制度に影響を及ぼす場合がある。典型的には、標的遺伝子座当たり５００～１０００個の元々の分子に相当するものを含むサンプルに対して測定が行われる場合、非侵襲性の産前異数性診断を行うのに十分な量のデータを得ることができる。別個の測定の数を増やすいくつかの方法が存在する（例えば、サンプルの体積を増やす）。サンプルに適用される各操作も、潜在的に材料の消失を引き起こす可能性がある。様々な操作によって個こる消失を特徴付け、これを避けること、又は必要な場合、試験の性能を低下させ得る消失を避けるために特定の操作の収率を改善することが不可欠である。

【0383】

一実施形態において、元々のｃｆＤＮＡサンプルの全て又は画分を増幅することによって、その後の工程での潜在的な消失を軽減することが可能である。サンプル中の遺伝物質の全てを増幅するための様々な方法が利用可能であり、下流の手順に利用可能な量を増やす。一実施形態において、ライゲーション媒介ＰＣＲ（ＬＭ－ＰＣＲ）のＤＮＡフラグメントは、１つの別個のアダプター、２つの別個のアダプター、又は多くの別個のアダプターのいずれかのライゲーションの後、ＰＣＲによって増幅される。一実施形態において、多重置換増幅（ＭＤＡ）のｐｈｉ－２９ポリメラーゼを使用して、全てのＤＮＡを等温増幅する。ＤＯＰ－ＰＣＲ及び変形例において、ランダムプライミングを使用して、元々の物質のＤＮＡを増幅する。各方法は、ゲノムの全ての表される領域にわたる増幅の均一性、元々のＤＮＡの捕捉及び増幅の効率及びフラグメントの長さの関数としての増幅性能など、特定の特徴を有する。

【0384】

一実施形態において、ＬＭ－ＰＣＲを、３’チロシンを有する単一のヘテロ二本鎖アダプターとともに使用してもよい。ヘテロ二本鎖アダプターは、第１ラウンドのＰＣＲ中に元々のＤＮＡフラグメントの５’及び３’末端で２つの別個の配列に変換され得る単一アダプター分子の使用を可能にする。一実施形態において、増幅されるライブラリを、サイズ分離によって、又はＡＭＰＵＲＥ、ＴＡＳＳなどの製品又は他の同様の方法を用いることによって、分画することが可能である。ライゲーションの前に、サンプルＤＮＡは、平滑末端化されてもよく、次いで、単一のアデノシン塩基を３’末端に付加する。ライゲーションの前に、ＤＮＡは、制限酵素又はいくつかの他の開裂方法を用いて開裂されてもよい。ライゲーション中に、サンプルフラグメントの３’アデノシンと、アダプターの相補性３’チロシンオーバーハングが、ライゲーション効率を高めることができる。ＰＣＲ増幅の伸長工程は、約２００ｂｐ、約３００ｂｐ、約４００ｂｐ、約５００ｂｐ又は約１，０００ｂｐより長いフラグメントからの増幅を減らすために、時間的観点から制限されてもよい。母体血漿中に見出されるより長いＤＮＡは、ほぼ排他的に母体であるため、これにより、１０～５０％の胎児ＤＮＡの濃縮をもたらす場合があり、検査性能が向上し得る。市販のキットによって指定される条件を用いていくつかの反応を実行し、サンプルＤＮＡ分子の１０％より少ないライゲーションが成功した。このための反応条件の一連の最適化は、ライゲーションを約７０％まで改善した。

【0385】

ミニＰＣＲ
従来のＰＣＲアッセイ設計は、別個の胎児分子の顕著な消失を引き起こすが、消失は、ミニＰＣＲアッセイと呼ばれる非常に短いＰＣＲアッセイを設計することによって、大きく減らすことができる。母親の血清中の胎児ｃｆＤＮＡは、高度にフラグメント化され、フラグメントサイズは、平均が１６０ｂｐ、標準偏差が１５ｂｐ、最小サイズが約１００ｂｐ、最大サイズが約２２０ｂｐのほぼＧａｕｓｓｉａｎ方法で分布する。標的多型に関するフラグメントの開始位置と終了位置の分布は、必ずしもランダムではないが、個々の標的にわたって、また、全体的に全ての標的にわたって広く変動し、ある特定の標的遺伝子座の多型部位は、その遺伝子座に由来する様々なフラグメントの最初から最後までの任意の位置を占めていてもよい。なお、ミニＰＣＲという用語は、更なる制限又は限定なく、通常のＰＣＲを同様に指していてもよい。

【0386】

ＰＣＲ中に、増幅は、順方向及び逆方向のプライマー部位を両方とも含むテンプレートＤＮＡフラグメントからしか起こらない。胎児ｃｆＤＮＡフラグメントが短いため、両プライマー部位が存在する尤度、長さＬの胎児フラグメントが順方向及び逆方向のプライマー部位の両方を含む尤度は、そのフラグメントの長さに対するアンプリコンの長さの比率である。理想的な条件下で、アンプリコンが４５、５０、５５、６０、６５又は７０ｂｐであるアッセイは、利用可能なテンプレートフラグメント分子のそれぞれ７２％、６９％、６６％、６３％、５９％又は５６％からの増幅に成功する。アンプリコンの長さは、順方向及び逆方向のプライミング部位の５’末端間の距離である。当該技術分野で知られているものによって典型的に使用されるものよりも短いアンプリコン長は、短い配列リードのみを必要とすることによって、所望な多型遺伝子座のより効率的な測定をもたらし得る。一実施形態において、アンプリコンの実質的な画分は、１００ｂｐ未満、９０ｂｐ未満、８０ｂｐ未満、７０ｂｐ未満、６５ｂｐ未満、６０ｂｐ未満、５５ｂｐ未満、５０ｂｐ未満又は４５ｂｐ未満であるべきである。

【0387】

なお、先行技術で既知の方法において、本明細書で記載されるような短いアッセイは、通常避けられる。これらのアッセイが必要とされず、プライマーの長さ、アニーリング特徴及び順方向プライマーと逆方向プライマーとの間の距離を制限することによって、プライマー設計にかなりの制約を課すためである。

【0388】

また、いずれかのプライマーの３’末端が、多型部位のほぼ１～６塩基内にある場合、偏った増幅の可能性が存在することに留意されたい。初期ポリメラーゼ結合部位でのこの一塩基の差は、１つの対立遺伝子の優先的増幅を引き起こす場合があり、対立遺伝子頻度の観測値を変え、性能を低下させ得る。これらの制約の全ては、特定の遺伝子座を首尾良く増幅するプライマーを特定し、更に、同じ多重反応で適合する多数のプライマーセットを設計するのを非常に困難なものにする。一実施形態において、順方向及び逆方向のインナープライマーの３’末端は、多型部位から上流のＤＮＡ領域にハイブリダイズするように設計され、少数の塩基によって多型部位から分離する。理想的には、塩基の数は、６～１０塩基であってもよいが、同様に、４～１５塩基、３～２０塩基、２～３０塩基又は１～６０塩基であってもよく、実質的に同じ末端を達成し得る。

【0389】

多重ＰＣＲは、全ての標的が増幅される単一ラウンドのＰＣＲを伴っていてもよく、又は１ラウンドのＰＣＲの後、１ラウンド以上のネスティッドＰＣＲ又はネスティッドＰＣＲのいくつかの変形例を伴っていてもよい。ネスティッドＰＣＲは、少なくとも１つの塩基対によって、以前のラウンドで使用されたプライマーに対して内部で結合する１つ以上の新しいプライマーを用いる、その後の１以上のラウンドのＰＣＲ増幅からなる。ネスティッドＰＣＲは、その後の反応において、修正された内部配列を有する従来のものからの増幅産物のみを増幅することによって、誤った増幅標的の数を減らす。誤った増幅標的を減らすことで、特に配列決定において得ることができる有用な測定値の数を改善する。ネスティッドＰＣＲは、典型的には、従来のプライマー結合部位に対して完全に内部にプライマーを設計することを伴い、増幅に必要な最小ＤＮＡセグメントの大きさを必然的に増加させる。ＤＮＡが高度にフラグメント化されるサンプル（例えば、母体血漿ｃｆＤＮＡ）について、アッセイサイズが大きいほど、測定値を得ることができる別個のｃｆＤＮＡ分子の数が減る。一実施形態において、この影響を相殺するために、第２ラウンドのプライマーの片方又は両方が、全アッセイサイズを最小限だけ大きくしつつ、更なる特異性を達成するために内部に数個の塩基を伸長する第１の結合部位と重複する、部分的なネスティッド手法を使用してもよい。

【0390】

一実施形態において、ＰＣＲアッセイの多重プールは、１つ以上の染色体上の潜在的にヘテロ接合性のＳＮＰ又は他の多型若しくは非多型の遺伝子座を増幅するように設計され、これらのアッセイは、単一反応で使用され、ＤＮＡを増幅する。ＰＣＲアッセイの数は、５０～２００ＰＣＲアッセイ、２００～１，０００ＰＣＲアッセイ、１，０００～５，０００ＰＣＲアッセイ又は５，０００～２０，０００ＰＣＲアッセイ（それぞれ、５０～２００反応分、２００～１，０００反応分、１，０００～５，０００反応分、５，０００～２０，０００反応分、２０，０００より多い反応分）であってもよい。一実施形態において、約１０，０００ＰＣＲアッセイ（１０，０００反応分）の多重プールは、染色体Ｘ、Ｙ、１３、１８及び２１及び１又は２上の潜在的にヘテロ接合性のＳＮＰを増幅するように設計され、これらのアッセイは、単一反応で使用され、材料の血漿サンプル、絨毛膜絨毛サンプル、羊水穿刺サンプル、単一細胞又は少数の細胞、他の体液又は組織、がん、又は遺伝物質から得られるｃｆＤＮＡを増幅する。各遺伝子座のＳＮＰ頻度は、クローンによって、又はアンプリコンを配列決定するいくつかの他の方法によって決定されてもよい。対立遺伝子頻度分布又は全てのアッセイの比率の統計分析を使用して、サンプルが、試験に含まれる染色体のうちの１つ以上のトリソミーを含有するかどうかを決定してもよい。別の実施形態において、元々のｃｆＤＮＡサンプルは、２つのサンプルに分割され、並行な５，０００反応分のアッセイが行われる。別の実施形態において、元々のｃｆＤＮＡサンプルは、ｎ個のサンプルに分割され、並行な（約１０，０００／ｎ）反応分のアッセイが行われ、ここで、ｎは、２～１２又は１２～２４又は２４～４８又は４８～９６である。データは、既に記載されているものと同様の方法で収集され、分析される。なお、この方法は、転座、欠失、重複及び他の染色体異常を検出するために、同様に十分に適用可能である。

【0391】

一実施形態において、標的ゲノムに対して相同性を有さないテールも、プライマーのいずれかの３’又は５’末端に付加されてもよい。これらのテールは、その後の操作、手順又は測定を容易にする。一実施形態において、テールの配列は、順方向及び逆方向の標的特異性プライマーと同じであってもよい。一実施形態において、異なるテールが、順方向及び逆方向の標的特異性プライマーのために使用されてもよい。一実施形態において、複数の異なるテールが、異なる遺伝子座又は遺伝子座のセットに使用されてもよい。特定のテールは、全ての遺伝子座間で、又は遺伝子座の部分集合間で共有されてもよい。例えば、現在の配列決定プラットフォームのいずれかによって必要とされる順方向及び逆方向の配列に対応する順方向及び逆方向のテールを用いることで、直接的な配列決定の後、増幅を可能にする。一実施形態において、テールは、他の有用な配列を付加するために使用可能な全ての増幅標的の間で、共通のプライミング部位として使用可能である。いくつかの実施形態において、インナープライマーは、標的多型遺伝子座の上流又は下流のいずれかにハイブリダイズするように設計された領域を含有してもよい。いくつかの実施形態において、プライマーは、分子バーコードを含有してもよい。いくつかの実施形態において、プライマーは、ＰＣＲ増幅を可能にするように設計されたユニバーサルプライミング配列を含有してもよい。

【0392】

一実施形態において、１０，０００反応分のＰＣＲアッセイプールは、順方向及び逆方向のプライマーが、高スループット配列決定装置、例えば、ＩＬＬＵＭＩＮＡから入手可能なＨＩＳＥＱ、ＧＡＩＩＸ又はＭＹＳＥＱによって必要とされる必要な順方向及び逆方向の配列に対応するテールを有するように作成される。これに加えて、アンプリコンに対してヌクレオチドバーコード配列を付加するために、その後のＰＣＲのプライミング部位として使用可能な更なる配列が、配列決定テールに対して５’に含まれ、高スループット配列決定装置の単一レーンにおいて複数サンプルの多重配列決定を可能にする。

【0393】

一実施形態において、１０，０００反応分のＰＣＲアッセイプールは、逆方向プライマーが、高スループット配列決定装置によって必要とされる必要な逆方向配列に対応するテールを有するように作成される。第１の１０，０００反応分のアッセイを用いて増幅した後、その後のＰＣＲ増幅は、全ての標的について部分ネスティッド順方向プライマー（例えば、６塩基ネスティッド）と、第１ラウンドに含まれる逆方向配列決定テールに対応する逆方向プライマーとを含む、別の１０，０００反応分のプールを用いて行われてもよい。たった１つの標的特異性プライマーとユニバーサルプライマーを用いる、この後のラウンドの部分ネスティッド増幅は、アッセイの必要なサイズを制限し、サンプリングノイズを減らすが、誤ったアンプリコンの数を大きく減らす。配列決定タグは、付けられたライゲーションアダプターに、及び／又はＰＣＲプローブの一部として付加されてもよく、その結果、このタグは、最終的なアンプリコンの一部である。

【0394】

胎児画分は、検査の性能に影響を及ぼす。母体血漿に見られるＤＮＡの胎児画分を濃くするいくつかの方法が存在する。胎児画分は、既に記載した、以前に記載したＬＭ－ＰＣＲ方法によって、また、長い母体フラグメントの標的化した除去によって高めることができる。一実施形態において、標的遺伝子座の多重ＰＣＲ増幅の前に、更なる多重ＰＣＲ反応を行い、その後の多重ＰＣＲにおいて標的化される遺伝子座に対応する、長く、更に大きな母体フラグメントを選択的に除去してもよい。更なるプライマーは、無細胞胎児ＤＮＡフラグメントの中に存在すると予測されるものよりも多型からの距離が長い部位をアニーリングするように設計される。これらのプライマーは、標的多型遺伝子座の多重ＰＣＲの前に、１サイクルの多重ＰＣＲで使用されてもよい。これらの遠位のプライマーは、タグ化されたＤＮＡ片の選択的認識を可能にする分子又は部分でタグ化される。一実施形態において、ＤＮＡのこれらの分子は、１サイクルのＰＣＲ後にこれらのプライマーを含む新しく形成した二本鎖ＤＮＡの除去を可能とするビオチン分子を用いて共有結合によって修飾されてもよい。その第１ラウンド中に形成された二本鎖ＤＮＡは、おそらく母体由来である。ハイブリッド材料の除去は、磁気ストレプトアビジンビーズの使用によって達成されてもよい。他にも同様に十分に機能し得る他のタグ化方法が存在する。一実施形態において、サイズ選択方法を使用して、ＤＮＡのより短い鎖（例えば、約８００ｂｐ未満、約５００ｂｐ未満、又は約３００ｂｐ未満）について、サンプルを濃縮してもよい。その後、短いフラグメントの増幅を、通常通りに進めてもよい。

【0395】

本開示に記載のミニＰＣＲ方法は、単一サンプルから、単一反応において数百から数千、又は更に数百万の遺伝子座の高度に多重化された増幅及び分析を可能にする。同時に、増幅したＤＮＡの検出は、多重化されてもよい。数十から数百のサンプルは、バーコードＰＣＲを使用することによって、１つの配列決定レーンにおいて多重化することができる。この多重化された検出は、４９反応分までを首尾良く試験し、かなり高度な多重化が可能である。実際には、このことにより、単一の配列決定ランにおいて、数百のサンプルを数千のＳＮＰで遺伝子型決定することを可能にする。これらのサンプルについて、本方法は、遺伝子型及びヘテロ接合率の決定と、同時にコピー数の決定を可能にし、その両方が、異数性検出の目的のために使用可能である。この方法は、母体血漿中に見出される遊離浮遊ＤＮＡから妊娠中の胎児の異数性を検出するのに特に有用である。この方法は、胎児の性別決定、及び／又は胎児の父性の予測のための方法の一部として使用されてもよい。変異投薬方法の一部として使用可能である。この方法は、任意の量のＤＮＡ又はＲＮＡについて使用されてもよく、標的領域は、ＳＮＰ、他の多型領域、非多型領域、及びこれらの組み合わせであってもよい。

【0396】

いくつかの実施形態において、フラグメント化されたＤＮＡのライゲーション媒介ユニバーサルＰＣＲ増幅が使用されてもよい。ライゲーション媒介ユニバーサルＰＣＲ増幅を使用して、血漿ＤＮＡを増幅させてもよく、次いで、これを複数の並行反応に分割してもよい。これを使用して、短いフラグメントを優先的に増幅し、それによって、胎児画分を高めてもよい。いくつかの実施形態において、ライゲーションによるフラグメントに対するタグの付加は、より短いフラグメントの検出、プライマーのより短い標的配列特異性部分の使用及び／又は非特異的な反応を減らす、より高い温度でのアニーリングを可能にする。

【0397】

本明細書に記載される方法は、ある量のコンタミネーションＤＮＡと混合した標的ＤＮＡのセットが存在するいくつかの目的のために使用されてもよい。いくつかの実施形態において、標的ＤＮＡ及びコンタミネーションＤＮＡは、遺伝的に関連する個体に由来するものであってもよい。例えば、胎児（標的）における遺伝子異常は、胎児（標的）ＤＮＡを含有し、母体の（コンタミネーション）ＤＮＡも含む母体の血漿から検出されてもよい。以上としては、全染色体異常（例えば、異数性）、部分染色体異常（例えば、欠失、重複、逆位、転座）、ポリヌクレオチド多型（例えば、ＳＴＲ）、単一ヌクレオチドバリアント多型及び／又は他の遺伝子異常又は違いが挙げられる。いくつかの実施形態において、標的およびコンタミネーションＤＮＡは、同じ個体に由来していてもよいが、標的及びコンタミネーションＤＮＡは、例えば、がんの場合に、１つ以上の変異によって異なっている。（例えば、Ｈ．Ｍａｍｏｎｅｔａｌ．ＰｒｅｆｅｒｅｎｔｉａｌＡｍｐｌｉｆｉｃａｔｉｏｎｏｆＡｐｏｐｔｏｔｉｃＤＮＡｆｒｏｍＰｌａｓｍａ：ＰｏｔｅｎｔｉａｌｆｏｒＥｎｈａｎｃｉｎｇＤｅｔｅｃｔｉｏｎｏｆＭｉｎｏｒＤＮＡＡｌｔｅｒａｔｉｏｎｓｉｎＣｉｒｃｕｌａｔｉｎｇＤＮＡ．ＣｌｉｎｉｃａｌＣｈｅｍｉｓｔｒｙ５４：９（２００８）を参照のこと。いくつかの実施形態において、ＤＮＡは、細胞培養物（アポトーシス）の上清に見出されてもよい。いくつかの実施形態において、その後のライブラリ調製、増幅及び／又は配列決定のために、生体サンプル（例えば、血液）におけるアポトーシスを誘発することが可能である。この目的を達成するためのいくつかの実行可能なワークフロー及びプロトコルは、本開示の別の箇所に提示されている。

【0398】

いくつかの実施形態において、標的ＤＮＡは、単一細胞に由来していてもよく、標的ゲノムの１個より少ないコピーからなるＤＮＡのサンプルに由来していてもよく、少量のＤＮＡに由来していてもよく、混合起源（例えば、妊娠血漿：胎盤及び母体ＤＮＡ、がん患者の血漿及び腫瘍、健康なＤＮＡとがんＤＮＡの混合、移植など）からのＤＮＡに由来していてもよく、他の体液に由来していてもよく、細胞培養物に由来していてもよく、培養物の上清に由来していてもよく、ＤＮＡの法医学サンプルに由来していてもよく、ＤＮＡの古代のサンプル（例えば、コハクに捕捉された昆虫）に由来していてもよく、ＤＮＡの他のサンプルに由来していてもよく、それらの組み合わせであってもよい。

【0399】

いくつかの実施形態において、短いアンプリコンサイズが使用されてもよい。短いアンプリコンサイズは、フラグメント化されたＤＮＡに特に適している（例えば、Ａ．Ｓｉｋｏｒａ，ｅｔｓｌ．Ｄｅｔｅｃｔｉｏｎｏｆｉｎｃｒｅａｓｅｄａｍｏｕｎｔｓｏｆｃｅｌｌ－ｆｒｅｅｆｅｔａｌＤＮＡｗｉｔｈｓｈｏｒｔＰＣＲａｍｐｌｉｃｏｎｓ．ＣｌｉｎＣｈｅｍ．２０１０Ｊａｎ；５６（１）：１３６－８を参照のこと）。

【0400】

短いアンプリコンサイズの使用は、いくつかの顕著な利益をもたらし得る。短いアンプリコンサイズは、最適化された増幅効率をもたらし得る。短いアンプリコンサイズは、典型的には、より短い産物を産生するため、非特異的なプライミングの機会が少ない。産物が短いほど、クラスターが小さくなり得るので、配列決定フローセル上で、より密にクラスター化させることができる。なお、本明細書に記載される方法は、より長いＰＣＲアンプリコンについても同様に十分に機能し得る。アンプリコンの長さは、必要な場合、例えば、更に大きな配列の伸長物を配列決定するときに、長くなるだろう。ネスティッドＰＣＲプロトコルの最初の工程として１００ｂｐ～２００ｂｐ長のアッセイを用いた、１４６反応分の標的化増幅による実験は、単一セルで、陽性結果を有するゲノムＤＮＡに対して実行された。

【0401】

いくつかの実施形態において、本明細書に記載される方法を使用して、ＳＮＰ、コピー数、ヌクレオチドメチル化、ｍＲＮＡレベル、他の種類のＲＮＡ発現レベル、他の遺伝的及び／又はエピジェネティックな特徴を増幅及び／又は検出してもよい。本明細書に記載されるミニＰＣＲ方法は、次世代配列決定とともに使用されてもよく、マイクロアレイ、デジタルＰＣＲによる計数、リアルタイムＰＣＲ、質量分光計による分析などの他の下流の方法とともに使用されてもよい。

【0402】

いくつかの実施形態において、本明細書に記載のミニＰＣＲ増幅方法は、少数集合の正確な定量化のための方法の一部として使用されてもよい。スパイクキャリブレータを使用した絶対的な定量化に使用されてもよい。非常に深い配列決定を介する変異／マイナー対立遺伝子定量化に使用されてもよく、非常に多重化された態様で実行されてもよい。ヒト、動物、植物又は他の生物における血縁又は祖先の標準的な起源及び同一性の検査に使用されてもよい。法医学検査に使用されてもよい。任意の種類の物質、例えば、羊水及びＣＶＳ、精子、受胎産物（ＰＯＣ）に対する、迅速な遺伝子型決定及びコピー数分析（ＣＮ）に使用してもよい。胚から生検採取されたサンプルに対する遺伝子型決定など、単一細胞分析に使用されてもよい。ミニＰＣＲを使用した標的化配列決定によって、迅速な胚分析（１日未満、１日又は２日の範囲内の生検）に使用してもよい。

【0403】

いくつかの実施形態において、ミニＰＣＲは、腫瘍分析に使用することができる。腫瘍生検は、多くは、健康な細胞及び腫瘍細胞の混合物である。標的化ＰＣＲは、バックグラウンド配列がほぼない状態でのＳＮＰ及び遺伝子座の深い配列決定を可能にする。腫瘍ＤＮＡに対するコピー数とヘテロ接合性の消失の分析に使用されてもよい。当該腫瘍ＤＮＡは、腫瘍患者の多くの異なる体液又は組織中に存在していてもよい。腫瘍再発の検出及び／又は腫瘍スクリーニングに使用されてもよい。種子の品質管理検査に使用されてもよい。飼育又は漁業の目的で使用されてもよい。なお、これらの方法のいずれも、倍数性コールを目的として非多型遺伝子座を標的化することに同様に十分に使用されてもよい。

【0404】

本明細書に開示される方法の基礎となるいくつかの基本的な方法を説明するいくつかの文献としては、以下のものが挙げられる。（１）ＷａｎｇＨＹ，ＬｕｏＭ，ＴｅｒｅｓｈｃｈｅｎｋｏＩＶ，ＦｒｉｋｋｅｒＤＭ，ＣｕｉＸ，ＬｉＪＹ，ＨｕＧ，ＣｈｕＹ，ＡｚａｒｏＭＡ，ＬｉｎＹ，ＳｈｅｎＬ，ＹａｎｇＱ，ＫａｍｂｏｕｒｉｓＭＥ，ＧａｏＲ，ＳｈｉｈＷ，ＬｉＨ．ＧｅｎｏｍｅＲｅｓ．２００５Ｆｅｂ；１５（２）：２７６－８３．ＤｅｐａｒｔｍｅｎｔｏｆＭｏｌｅｃｕｌａｒＧｅｎｅｔｉｃｓ，ＭｉｃｒｏｂｉｏｌｏｇｙａｎｄＩｍｍｕｎｏｌｏｇｙ／ＴｈｅＣａｎｃｅｒＩｎｓｔｉｔｕｔｅｏｆＮｅｗＪｅｒｓｅｙ，ＲｏｂｅｒｔＷｏｏｄＪｏｈｎｓｏｎＭｅｄｉｃａｌＳｃｈｏｏｌ，ＮｅｗＢｒｕｎｓｗｉｃｋ，ＮｅｗＪｅｒｓｅｙ０８９０３，ＵＳＡ．（２）Ｈｉｇｈ－ｔｈｒｏｕｇｈｐｕｔｇｅｎｏｔｙｐｉｎｇｏｆｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍｓｗｉｔｈｈｉｇｈｓｅｎｓｉｔｉｖｉｔｙ．ＬｉＨ，ＷａｎｇＨＹ，ＣｕｉＸ，ＬｕｏＭ，ＨｕＧ，ＧｒｅｅｎａｗａｌｔＤＭ，ＴｅｒｅｓｈｃｈｅｎｋｏＩＶ，ＬｉＪＹ，ＣｈｕＹ，ＧａｏＲ．ＭｅｔｈｏｄｓＭｏｌＢｉｏｌ．２００７；３９６－ＰｕｂＭｅｄＰＭＩＤ：１８０２５６９９．（３）配列決定のための平均９個のアッセイの多重化を含む方法は、以下に記載されている：ＮｅｓｔｅｄＰａｔｃｈＰＣＲｅｎａｂｌｅｓｈｉｇｈｌｙｍｕｌｔｉｐｌｅｘｅｄｍｕｔａｔｉｏｎｄｉｓｃｏｖｅｒｙｉｎｃａｎｄｉｄａｔｅｇｅｎｅｓ．ＶａｒｌｅｙＫＥ，ＭｉｔｒａＲＤ．ＧｅｎｏｍｅＲｅｓ．２００８Ｎｏｖ；１８（１１）：１８４４－５０．Ｅｐｕｂ２００８Ｏｃｔ１０。本明細書に開示される方法は、上述の参考文献よりも大きな桁数の多重化を可能にすることに留意されたい。

【0405】

タンパク質設計
高度に多重化したＰＣＲは、多くは、プライマーダイマー生成などの生産的ではない副反応から得られる非常に高い割合の産物ＤＮＡを生成し得る。一実施形態において、生産的ではない副反応を引き起こす可能性が最も高い特定のプライマーは、プライマーライブラリから除去され、ゲノムにマッピングする増幅されたＤＮＡの割合を大きくするプライマーライブラリを与え得る。問題のあるプライマー、すなわち、ダイマーを安定させる可能性が特に高いプライマーを除去する工程は、予測できないことに、その後の配列決定による分析のための非常に高いＰＣＲ多重化レベルを可能にした。プライマーダイマー及び／又は他の害毒生成物によって性能が著しく低下する配列決定などのシステムにおいて、他の記載の多重化よりも１０倍、５０倍、及び１００倍以上高い多重化が達成されている。これは、プローブベースの検出方法、例えば、マイクロアレイ、ＴａｑＭａｎ、ＰＣＲなどとは対照的であり、過剰なプライマーダイマーは、結果に有意に影響を及ぼさないことを留意されたい。また、当該技術分野における一般的な信念は、配列決定のための多重化ＰＣＲが、同じウェル内で約１００のアッセイに限定されることであることに留意されたい。例えばＦｌｕｉｄｉｇｍ及びＲａｉｎＤａｎｃｅは、１つのサンプルについて並行反応で４８又は１０００のＰＣＲアッセイを実施するためのプラットフォームを提供する。

【0406】

非マッピングプライマーダイマー又は他のプライマー妨害産物の量が最小限にされたライブラリのためのプライマーを選択するいくつかの方法が存在する。経験的なデータは、少数の「悪い」プライマーが、多量の非マッピングプライマーダイマー副反応の原因であることを示す。これらの「悪い」プライマーを除去することで、標的遺伝子座へマッピングする配列リードの割合を高めることができる。「悪い」プライマーを特定するための１つの方法は、標的化された増幅によって増幅されたＤＮＡの配列決定データを見ることであり、最も頻繁に見られるこれらのプライマーダイマーが除去され、ゲノムにマッピングされない副産物ＤＮＡを生じる可能性が顕著に低いプライマーライブラリを与えることができる。様々なプライマーの組み合わせの結合エネルギーを計算することができる公的に利用可能なプログラムも存在し、最も高い結合エネルギーを有するものを除去することで、ゲノムにマッピングされない副産物ＤＮＡを生じる可能性が顕著に低いプライマーライブラリも与えるだろう。

【0407】

多数のプライマーを多重化することで、含まれ得るアッセイにかなりの制約を課す。意図せずに相互作用するアッセイは、偽の増幅産物を生じる。ミニＰＣＲのサイズ制約は、更なる制約を引き起こし得る。一実施形態において、非常に多数の潜在的なＳＮＰ標的（約５００から１００万より多くまで）から開始し、各ＳＮＰを増幅するようにプライマーを設計するように企画することが可能である。プライマーを設計することが可能な場合、ＤＮＡ二本鎖生成のための公開されている熱力学的パラメータを用い、全ての可能なプライマー対間の偽のプライマー二本鎖生成の尤度を評価することによって、偽の産物を生成する可能性があるプライマー対を特定するように企画することが可能である。プライマーの相互作用は、この相互作用に関連するスコアリング関数によってランク付けされてもよく、最も悪い相互作用スコアを有するプライマーは、望ましいプライマー数を満たすまで、除外される。ヘテロ接合性である可能性があるＳＮＰが最も有用である場合、アッセイのリストもランク付けし、最もヘテロ接合性に適合するアッセイを選択することが可能である。高い相互作用スコアを有するプライマーが、プライマーダイマーを形成する可能性が最も高いことが実験で検証されている。高度に多重化すると、全ての偽の相互作用を除外することは可能ではないが、反応全体を支配し、意図した標的からの増幅を大きく制限することがあるため、ｉｎｓｉｌｉｃｏで最も高い相互作用スコアを有するプライマー又はプライマー対を除外することが不可欠である。この手順を行い、１０，０００プライマーまでの複数のプライマーセットを作成した。この手順に起因する改善は、かなりのものであり、全てのＰＣＲ産物によって決定されるような標的産物に対して、最も悪いプライマーが除去されなかった反応からの１０％と比較して、８０％より多く、９０％より多く、９５％より多く、９８％より多く、更に９９％より多くの増幅を可能にする。既に記載したように、部分的なセミネスティッド手法と組み合わせると、アンプリコンの９０％より多く、更に９５％より多くが、標的配列にマッピングされ得る。

【0408】

なお、どのＰＣＲプローブがダイマーを形成する可能性が高いかを決定する他の方法が存在する。一実施形態において、最適化されていないプライマーセットを用いて増幅されたＤＮＡのプールの分析は、問題のあるプライマーを決定するのに十分な場合がある。例えば、分析は、配列決定を用いて行われてもよく、最も多く存在するこれらのダイマーは、ダイマーを形成する可能性が最も高いものであると決定され、除去されてもよい。

【0409】

この方法は、例えば、ＳＮＰ遺伝子型決定、ヘテロ接合率決定、コピー数測定、及び他の標的化配列決定用途へのいくつかの潜在的な用途を有する。一実施形態において、プライマー設計の方法は、本文書の別の箇所に記載のミニＰＣＲ方法と組み合わせて使用されてもよい。いくつかの実施形態において、プライマー設計方法は、大規模多重化ＰＣＲ方法の一部として使用されてもよい。

【0410】

プライマーに対するタグの使用は、プライマーダイマー産物の増幅及び配列決定を減らし得る。タグプライマーを使用して、必要な標的特異性配列を２０未満、１５未満、１２未満、更に１０未満の塩基対まで短くすることができる。これは、標的配列がプライマー結合部位へとフラグメント化される場合、又はプライマー設計へと設計される場合に、予想外の発見となり得る。この方法の利点は、特定の最大アンプリコン長のために設計可能なアッセイの数を増やすことと、プライマー配列の「無情報」配列決定を短くすることを含む。内部タグ化と組み合わせ使用することも可能である（本文書の別の箇所を参照のこと）。

【0411】

一実施形態において、多重標的化ＰＣＲ増幅における非生産的な産物の相対量は、アニーリング温度を上げることによって減らすことができる。標的特異性プライマーと同じタグを用いてライブラリを増幅する場合、アニーリング温度は、タグがプライマー結合に寄与するため、ゲノムＤＮＡと比較して、高くすることができる。いくつかの実施形態において、他の場所で報告されたよりも長いアニーリング時間を使用することとともに、以前に報告されたよりもかなり低いプライマー濃度を使用している。いくつかの実施形態において、アニーリング時間は、１０分間より長く、２０分間より長く、３０分間より長く、６０分間より長く、１２０分間より長く、２４０分間より長く、４８０分間より長く、更に９６０分間より長くてもよい。一実施形態において、より長くアニーリング時間を、以前の報告よりも使用し、より低いプライマー濃度を可能にする。いくつかの実施形態において、プライマー濃度は、５０ｎＭ、２０ｎＭ、１０ｎＭ、５ｎＭ、１ｎＭ程度の低さ、及び１ｕＭ未満である。これにより、驚くべきことに、高度に多重化された反応、例えば、１０００倍反応、２０００倍反応、５０００倍反応、１００００倍反応、２００００倍反応、５００００倍反応及び更に１０００００倍反応について、安定した性能が得られる。一実施形態において、増幅は、長いアニーリング時間を有する１、２、３、４又は５サイクルを使用し、その後、タグ化プライマーを用い、通常の更に長いアニーリング時間を有するＰＣＲサイクルを使用する。

【0412】

標的位置を選択するために、候補プライマー対設計のプールから開始し、プライマー対との間の潜在的に有害な副次的相互作用の熱力学的モデルを作成し、次いで、プール中の他の設計と互換性のない設計を除外するモデルを使用してもよい。

【0413】

標的化ＰＣＲバリアント－ネスティング
ＰＣＲを実施するときに可能な多くのワークフローが存在し、本明細書に開示される方法に典型的ないくつかのワークフローが記載されている。本明細書で概説される工程は、他の可能な工程を除外することを意味しておらず、本明細書に記載される工程のいずれかが本方法が適切に機能するのに必要であることを暗示するものでもない。多数のパラメータの変動又は他の改変は、文献で既知であり、本発明の本質に影響を与えることなく行うことができる。１つの特定の一般化されたワークフローに続いて、いくつかの可能なバリアントが以下に示される。バリアントは、典型的には、可能な二次ＰＣＲ反応、例えば、行われ得る異なるタイプのネスティングを指す（工程３）。バリアントは、本明細書に明示的に記載されているものとは異なる時間に、又は異なる順序で行われてもよいことに留意することが重要である。

【0414】

１．サンプル中のＤＮＡは、付随したライゲーションアダプター（ライブラリタグ又はライゲーションアダプタータグ（ＬＴ）と呼ばれることが多い）を有していてもよく、ライゲーションアダプターは、ユニバーサルプライミング配列を含有し、続いて、ユニバーサル増幅を含む。一実施形態において、このことは、フラグメント化の後に配列決定ライブラリを作成するように設計された標準的なプロトコルを用いて行われてもよい。一実施形態において、ＤＮＡサンプルは、平滑末端であってもよく、次いで、Ａがその３’末端に付加されていてもよい。Ｔオーバーハングを有するＹアダプターを付加し、ライゲーションしてもよい。いくつかの実施形態において、Ａ又はＴオーバーハング以外の他の粘着末端を使用してもよい。いくつかの実施形態において、他のアダプター、例えば、ループ状ライゲーションアダプターを付加してもよい。いくつかの実施形態において、アダプターは、ＰＣＲ増幅のために設計されたタグを有していてもよい。

【0415】

２．特異的標的増幅（ＳＴＡ）：数百から数千から数万、更には数十万の標的の事前増幅は、１つの反応で多重化され得る。ＳＴＡは、典型的には１０～３０サイクルであるが、５～４０サイクル、２～５０サイクル、更には１～１００サイクルであってもよい。プライマーは、例えば、より単純なワークフローのために、又はダイマーの大部分の配列決定を回避するために、テール状であってもよい。典型的には、同じタグを担持する両方のプライマーのダイマーは、効率的に増幅又は配列決定されないことに留意されたい。いくつかの実施形態において、１～１０サイクルのＰＣＲが実施されてもよく、いくつかの実施形態において、１０～２０サイクルのＰＣＲが実施されてもよく、いくつかの実施形態において、２０～３０サイクルのＰＣＲが実施されてもよく、いくつかの実施形態において、３０～４０サイクルのＰＣＲが実施されてもよく、いくつかの実施形態において、４０サイクルを超えるＰＣＲが実施されてもよい。増幅は、線形増幅であり得る。ＰＣＲサイクルの数は、最適なリード深度（ＤＯＲ）プロファイルをもたらすように最適化され得る。異なるＤＯＲプロファイルは、異なる目的のために望ましい場合がある。いくつかの実施形態において、全てのアッセイ間のリードのより均等な分布が望ましく、ＤＯＲがいくつかのアッセイに対して小さすぎる場合、確率論的ノイズは、データがあまりにも有用であるために高すぎる場合があるが、リード深度が大きすぎる場合、各追加リードの限界有用性は、比較的小さい。

【0416】

プライマーテールは、普遍的にタグ化されたライブラリからのフラグメント化されたＤＮＡの検出を改善することができる。ライブラリタグ及びプライマーテールが、相同配列を含有する場合、ハイブリダイゼーションを改善することができ（例えば、融点（Ｔ_Ｍ）を下げる）、プライマー標的配列の一部のみがサンプルＤＮＡプライマーフラグメント中にある場合、プライマーを伸長することができる。いくつかの実施形態において、１３個以上の標的特異性塩基対が使用されてもよい。いくつかの実施形態において、１０～１２個の標的特異性塩基対が使用されてもよい。いくつかの実施形態において、８～９つの標的特異性塩基対が使用されてもよい。いくつかの実施形態において、６～７つの標的特異性塩基対が使用されてもよい。いくつかの実施形態において、ＳＴＡは、事前に増幅されたＤＮＡ、例えば、ＭＤＡ、ＲＣＡ、他の全ゲノム増幅、又はアダプター媒介ユニバーサルＰＣＲ上で行われてもよい。いくつかの実施形態において、ＳＴＡは、特定の配列及び集団が濃縮されているか、又は枯渇しているサンプル、例えば、サイズ選択、標的捕捉、指向性分解によって行われてもよい。

【0417】

３．いくつかの実施形態において、特異性を増加させ、望ましくない生成物を低減するために、二次多重ＰＣＲ又はプライマー伸長反応を行うことが可能である。例えば、完全なネスティング、セミネスティング、ヘミネスティング、及び／又はより小さいアッセイプールの並行反応への細分化は、特異性を増加させるために使用され得る全ての技術である。実験は、サンプルを３つの４００プレックス反応に分割することが、正確に同じプライマーを用いた１つの１，２００プレックス反応よりも高い特異性を有する生成物ＤＮＡをもたらすことを示している。同様に、実験は、サンプルを４つの２，４００プレックス反応に分割することは、正確に同じプライマーを用いた１つの９，６００プレックス反応よりも高い特異性を有する生成物ＤＮＡをもたらすことを示した。一実施形態において、同じ及び反対の方向性の標的特異性及びタグ特異性プライマーを使用することが可能である。

【0418】

４．いくつかの実施形態において、タグ特異的プライマー及び「ユニバーサル増幅」を使用して、ＳＴＡ反応によって生成されるＤＮＡサンプル（希釈、精製、又はそうでなければ）を増幅すること、すなわち、多く又は全ての事前に増幅され、タグ付けされた標的を増幅することが可能である。プライマーは、追加の機能的配列、例えば、バーコード、又は高スループット配列決定プラットフォーム上で配列決定するために必要な完全なアダプター配列を含有し得る。

【0419】

これらの方法は、任意のＤＮＡサンプルの分析に使用されてもよく、ＤＮＡサンプルが特に小さい場合、又はＤＮＡが母体血漿の場合など、複数の個体に由来するＤＮＡサンプルの場合に特に有用である。これらの方法は、単一又は少数の細胞、ゲノムＤＮＡ、血漿ＤＮＡ、増幅血漿ライブラリ、増幅アポトーシス上清ライブラリ、又は混合ＤＮＡの他のサンプルなどのＤＮＡサンプルに使用されてもよい。一実施形態において、これらの方法は、がん又は移植など、異なる遺伝子構成の細胞が単一の個体に存在し得る場合に使用されてもよい。

【0420】

ループ状ライゲーションアダプター
例えば、配列決定のためのライブラリを作製する目的でユニバーサルタグ付きアダプターを追加する場合、アダプターをライゲーションするいくつかの方法が存在する。１つの方法は、サンプルＤＮＡを平滑化し、Ａテーリングを行い、Ｔオーバーハングを有するアダプターでライゲーションすることである。アダプターをライゲーションするいくつかの他の方法が存在する。ライゲーションすることができるいくつかのアダプターも存在する。例えば、Ｙアダプターは、アダプターが、一方の鎖が二本鎖領域を有し、かつ順方向プライマー領域によって特定される領域を有するＤＮＡの２本鎖からなり、他方の鎖が、第１の鎖上の二本鎖領域に相補的な二本鎖領域、及び逆方向プライマーを有する領域によって特定されるＤＮＡの２本鎖からなる場合に使用することができる。二本鎖領域は、アニールされたときに、Ａオーバーハングを有する二本鎖ＤＮＡにライゲーションする目的のために、Ｔオーバーハングを含有してもよい。

【0421】

内部タグ付きプライマー
配列決定を使用して所与の多型遺伝子座に存在する対立遺伝子を決定する場合、配列リードは、典型的には、プライマー結合部位（ａ）の上流から始まり、次いで多型部位（Ｘ）に至る。タグは、典型的には、構成される。１０１は、目的の多型遺伝子座「Ｘ」を有する一本鎖標的ＤＮＡ、及び付加タグ「ｂ」を有するプライマー「ａ」を指す。非特異的ハイブリダイゼーションを回避するために、プライマー結合部位（「ａ」に相補的な標的ＤＮＡの領域）は、典型的には１８～３０ｂｐ長である。配列タグ「ｂ」は、典型的には約２０ｂｐであり、理論的には、これらは、約１５ｂｐよりも長い任意の長さであり得るが、多くの人々は、配列決定プラットフォーム企業によって販売されるプライマー配列を使用する。「ａ」と「Ｘ」との間の距離「ｄ」は、対立遺伝子バイアスを回避するために、少なくとも２ｂｐであってもよい。本明細書に開示される方法又は他の方法を使用して多重ＰＣＲ増幅を実施する場合、過度のプライマープライマー相互作用を回避するために慎重なプライマー設計が必要である場合、「ａ」と「Ｘ」との間の許容距離「ｄ」のウィンドウは、２ｂｐ～１０ｂｐ、２ｂｐ～２０ｂｐ、２ｂｐ～３０ｂｐ、又は２ｂｐ～３０ｂｐより多くてもよい。したがって、プライマー構成を使用する場合、配列リードは、多型遺伝子座を測定するのに十分な長さのリードを得るために最低４０ｂｐでなければならず、「ａ」及び「ｄ」の長さに応じて、配列リードは最大６０又は７５ｂｐである必要があり得る。通常、配列リードが長いほど、所与の数のリードを配列決定するコスト及び時間が高くなり、したがって、必要なリード長を最小限に抑えることは、時間及び費用の両方を節約することができる。加えて、平均して、読み取りの前に読み取られた塩基は、読み取りの後に読み取られた塩基よりも正確に読み取られるため、必要な配列リード長を短くすることも、多型領域の測定の精度を高めることができる。

【0422】

内部タグ付きプライマーと呼ばれる一実施形態において、プライマー結合部位（ａ）は、複数のセグメント（ａ’，ａ’’，ａ’’’…）に分割され、配列タグ（ｂ）は、プライマー結合部位のうちの２つの真ん中にあるＤＮＡのセグメント上にある。この構成は、シーケンサがより短い配列リードを行うことを可能にする。一実施形態において、「＋ａ」は、少なくとも約１８ｂｐであるべきであり、３０、４０、５０、６０、８０、１００又は１００ｂｐを超える長さであり得る。一実施形態において、「ａ」は、少なくとも約６ｂｐであるべきであり、一実施形態において、約８～１６ｂｐである。他の全ての因子が等しい場合、内部タグ付きプライマーを使用すると、必要な配列リードの長さを、少なくとも６ｂｐ、最大８ｂｐ、１０ｂｐ、１２ｂｐ、１５ｂｐ、更には最大２０又は３０ｂｐ短縮することができる。これにより、大幅なコスト、時間、精度の向上を実現できる。

【0423】

ライゲーションアダプター結合領域を有するプライマー
フラグメント化されたＤＮＡの１つの問題は、長さが短いため、多型がＤＮＡ鎖の末端に近い可能性が長い鎖よりも高いことである。多型のＰＣＲ捕捉は、多型の両側に好適な長さのプライマー結合部位を必要とするため、標的多型を有するＤＮＡのかなりの数の鎖は、プライマーと標的結合部位との間の不十分な重複のために見逃される。一実施形態において、標的ＤＮＡは、ライゲーションアダプターを付加することができ、標的プライマーは、設計された結合領域（ａ）の上流に付加されたライゲーションアダプタータグ（ｌｔ）に相補的な領域（ｃｒ）を有することができ、したがって、結合領域がハイブリダイゼーションに通常必要な１８ｂｐよりも短い場合、ライブラリタグに相補的なものよりもプライマー上の領域（ｃｒ）が、ＰＣＲを進めることができる点まで結合エネルギーを増加させることができる。短い結合領域に起因して失われる特異性は、適切に長い標的結合領域を有する他のＰＣＲプライマーによって補うことができることに留意されたい。この実施形態は、直接ＰＣＲ、又はネストＰＣＲ、セミネストＰＣＲ、ヘミネストＰＣＲ、片側ネストＰＣＲ若しくはセミネストＰＣＲ若しくはヘミネストＰＣＲ、又は他のＰＣＲプロトコルなどの本明細書に記載される他の方法のいずれかと組み合わせて使用され得ることに留意されたい。

【0424】

様々な仮説について、観察された対立遺伝子データを予測される対立遺伝子分布と比較することを伴う分析方法と組み合わせて、倍数を決定するために配列決定データを使用する場合、低いリード深度を有する対立遺伝子からの各追加のリードは、高いリード深度を有する対立遺伝子からのリードよりも多くの情報をもたらす。したがって、理想的には、各遺伝子座が同様の数の代表的な配列リードを有する、均一なリード深度（ＤＯＲ）を見たいと思う。したがって、ＤＯＲ分散を最小化することが望ましい。一実施形態において、アニーリング時間を増加させることによって、ＤＯＲの分散係数（これは、ＤＯＲ／平均ＤＯＲの標準偏差として定義されてもよい）を減少させることが可能である。いくつかの実施形態において、アニーリング温度は、２分間を超えてもよく、４分間を超えてもよく、１０分間を超えてもよく、３０分間を超えてもよく、１時間を超えてもよく、又は更に長くてもよい。アニーリングは平衡プロセスであるため、アニーリング時間の増加に伴うＤＯＲ分散の改善に制限はない。一実施形態において、プライマー濃度を増加させることは、ＤＯＲ分散を減少させることができる。

【0425】

プライマーキット
いくつかの実施形態において、本開示に記載される方法を達成するように設計される複数のプライマーを含むキットが製剤化されてもよい。プライマーは、本明細書に開示されるように、外側の順方向及び逆方向のプライマー、内側の順方向及び逆方向のプライマーであってもよく、プライマー設計に関するセクションに開示されるように、キット内の他のプライマーへの低い結合親和性を有するように設計されたプライマーであってもよく、関連するセクションに記載されるように、ハイブリッド捕捉プローブ又は事前に環状化されたプローブであってもよく、又はそれらのいくつかの組み合わせであってもよい。一実施形態において、本明細書に開示される方法とともに使用されるように設計された妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットが製剤化されてもよく、本キットは、複数の内側順方向プライマー及び任意選択で複数の内側逆方向プライマー、並びに任意選択で外側順方向プライマー及び外側逆方向プライマーを含み、各プライマーは、標的染色体、及び任意選択で更なる染色体上の多型部位のうちの１つからすぐ上流及び／又は下流のＤＮＡの領域にハイブリダイズするように設計されている。一実施形態において、プライマーキットは、本文書の別の箇所に記載の診断ボックスと組み合わせて使用されてもよい。

【0426】

ＤＮＡの組成物
胎児に関連するゲノム情報、例えば胎児の倍数性状態を決定するために、胎児及び母体の血液の混合物で測定された配列決定データに対して情報分析を行う場合、対立遺伝子のセットで対立遺伝子の分布を測定することが有利であり得る。残念ながら、多くの場合、母体血液サンプルの血漿中に見出されるＤＮＡ混合物から胎児の倍数性状態を決定しようとするときなど、利用可能なＤＮＡの量は、混合物中の対立遺伝子分布を良好な忠実度で直接測定するのに十分ではない。これらの場合において、ＤＮＡ混合物の増幅は、所望の対立遺伝子分布が良好な忠実度で測定され得るのに十分な数のＤＮＡ分子を提供する。しかしながら、配列決定のためのＤＮＡの増幅に典型的に使用される現在の増幅方法は、多くの場合非常にバイアスがかかっており、多型遺伝子座における両方の対立遺伝子を同じ量増幅しないことを意味する。バイアス増幅は、元の混合物中の対立遺伝子分布とはまったく異なる対立遺伝子分布をもたらし得る。ほとんどの目的のために、多型遺伝子座に存在する対立遺伝子の相対量の高精度な測定は必要ではない。対照的に、本開示の一実施形態において、多型対立遺伝子を特異的に濃縮し、対立遺伝子比を保持する増幅又は濃縮方法が有利である。

【0427】

対立遺伝子バイアスを最小限に抑える方法で、複数の遺伝子座でＤＮＡのサンプルを優先的に濃縮するために使用され得るいくつかの方法が本明細書に記載される。いくつかの例は、環化プローブを使用して、予め環化されたプローブの３’末端及び５’末端が、標的対立遺伝子の多型部位から離れた１つ又はいくつかの位置である塩基にハイブリダイズするように設計されている複数の遺伝子座を標的化することである。別のものは、３’末端ＰＣＲプローブが、標的対立遺伝子の多型部位から離れた１つ又はいくつかの位置である塩基にハイブリダイズするように設計されるＰＣＲプローブを使用することである。もう１つは、スプリットアンドプールアプローチを使用して、優先的に濃縮された遺伝子座が、直接多重化の欠点なしに低い対立遺伝子バイアスで濃縮されるＤＮＡの混合物を作製することである。別のものは、標的の多型部位に隣接するＤＮＡにハイブリダイズするように設計される捕捉プローブの領域が、１つ又は少数の塩基によって多型部位から分離されるように、捕捉プローブが設計されたハイブリッド捕捉アプローチを使用することである。

【0428】

多型遺伝子座のセットで測定された対立遺伝子の分布が個体の倍数性状態を決定するために使用される場合、遺伝子測定のために調製されるとき、ＤＮＡのサンプル中の対立遺伝子の相対量を保存することが望ましい。この調製は、ＷＧＡ増幅、標的化増幅、選択的濃縮技術、ハイブリッド捕捉技術、環化プローブ、又はＤＮＡの量を増幅すること、及び／又は特定の対立遺伝子に対応するＤＮＡ分子の存在を選択的に強化することを意図する他の方法を伴っていてもよい。

【0429】

本開示のいくつかの実施形態において、遺伝子座が最大のマイナー対立遺伝子頻度を有する遺伝子座を標的化するように設計されたＤＮＡプローブのセットが存在する。本開示のいくつかの実施形態において、遺伝子座がそれらの遺伝子座において非常に有益なＳＮＰを有する胎児の最大尤度を有する場所を標的化するように設計されたプローブのセットが存在する。本開示のいくつかの実施形態において、所与の集団サブグループに対してプローブが最適化される遺伝子座を標的化するように設計されたプローブのセットが存在する。本開示のいくつかの実施形態において、集団サブグループの所与の混合物に対してプローブが最適化される遺伝子座を標的化するように設計されたプローブのセットが存在する。本開示のいくつかの実施形態において、異なるマイナー対立遺伝子頻度プロファイルを有する異なる集団サブグループからの所与のペアの親に対してプローブが最適化される遺伝子座を標的化するように設計されるプローブのセットが存在する。本開示のいくつかの実施形態において、胎児起源のＤＮＡ片にアニールされた少なくとも１つの塩基対を含む環化ＤＮＡ鎖が存在する。本開示のいくつかの実施形態において、胎盤起源のＤＮＡ片にアニールされた少なくとも１つの塩基対を含む環化ＤＮＡ鎖が存在する。本開示のいくつかの実施形態において、ヌクレオチドの少なくともいくつかが胎児起源のＤＮＡにアニーリングされている間に環化されたＤＮＡの環化鎖が存在する。本開示のいくつかの実施形態において、ヌクレオチドの少なくともいくつかが胎盤起源のＤＮＡにアニーリングされている間に環化したＤＮＡの環化鎖が存在する。本開示のいくつかの実施形態において、いくつかのプローブが単一のタンデム反復を標的化し、いくつかのプローブが一塩基多型を標的化する、プローブのセットが存在する。いくつかの実施形態において、遺伝子座は、非侵襲性出生前診断の目的のために選択される。いくつかの実施形態において、プローブは、非侵襲性出生前診断の目的のために使用される。いくつかの実施形態において、遺伝子座は、環状化プローブ、ＭＩＰ、ハイブリダイゼーションプローブによる捕捉、ＳＮＰアレイ上のプローブ、又はそれらの組み合わせを含み得る方法を使用して標的化される。いくつかの実施形態において、プローブは、環状化プローブ、ＭＩＰ、ハイブリダイゼーションプローブによる捕捉、ＳＮＰアレイ上のプローブ、又はそれらの組み合わせとして使用される。いくつかの実施形態において、遺伝子座は、非侵襲性出生前診断の目的のために配列決定される。

【0430】

配列の相対的な情報量が、関連する親コンテキストと組み合わせた場合に大きい場合、親コンテキストが既知であるＳＮＰを含む配列リードの数を最大化することは、混合サンプル上の配列リードのセットの情報量を最大化することができることになる。一実施形態において、親コンテキストが既知のＳＮＰを含む配列リードの数は、ｑＰＣＲを使用して特異的配列を優先的に増幅することによって増強されてもよい。一実施形態において、親コンテキストが既知のＳＮＰを含む配列リードの数は、環化プローブ（例えば、ＭＩＰ）を使用して特異的配列を優先的に増幅することによって増強されてもよい。一実施形態において、親コンテキストが既知のＳＮＰを含む配列リードの数は、ハイブリダイゼーション法による捕捉（例えば、ＳＵＲＥＳＥＬＥＣＴ）を使用して特異的配列を優先的に増幅することによって増強されてもよい。親コンテキストが既知であるＳＮＰを含む配列リードの数を増やすために、異なる方法を使用してもよい。一実施形態において、標的化は、伸長ライゲーション、伸長を伴わないライゲーション、ハイブリダイゼーションによる捕捉、又はＰＣＲによって達成されてもよい。

【0431】

フラグメント化されたゲノムＤＮＡのサンプルにおいて、ＤＮＡ配列の画分は、個々の染色体に一意にマッピングされ、他のＤＮＡ配列は、異なる染色体上に見出され得る。血漿中に見出されるＤＮＡは、母体であろうと胎児であろうと、典型的にはフラグメント化されており、多くの場合５００ｂｐ未満の長さであることに留意されたい。典型的なゲノムサンプルでは、マッピング可能な配列の約３．３％が染色体１３にマッピングされ、マッピング可能な配列の２．２％が染色体１８にマッピングされ、マッピング可能な配列の１．３５％が染色体２１にマッピングされ、マッピング可能な配列の４．５％が女性の染色体Ｘにマッピングされ、マッピング可能な配列の２．２５％が（男性の）染色体Ｘにマッピングされ、マッピング可能な配列の０．７３％が（男性の）染色体Ｙにマッピングされる。これらは、胎児の異数体である可能性が最も高い染色体である。また、短い配列の中で、ｄｂＳＮＰに含まれるＳＮＰを使用して、２０個の配列のうち約１個がＳＮＰを含む。多くのＳＮＰが発見されていない可能性があることを考えると、この割合はより高くなり得る。

【0432】

本開示の一実施形態において、標的化方法を使用して、所与の染色体にマッピングするＤＮＡのサンプル中のＤＮＡの画分を、その画分がゲノムサンプルに典型的な上記のパーセンテージを有意に上回るように強化してもよい。本開示の一実施形態において、ＳＮＰを含有する配列の割合がゲノムサンプルの典型的なものよりも有意に大きいように、ＤＮＡのサンプル中のＤＮＡの画分を強化するために標的化方法を使用してもよい。本開示の一実施形態において、標的化方法を使用して、出生前診断の目的のために、母体及び胎児ＤＮＡの混合物中の染色体又は一組のＳＮＰからＤＮＡを標的化してもよい。

【0433】

疑わしい染色体にマッピングするリードの数を数え、それを参照染色体にマッピングするリードの数と比較し、疑わしい染色体上のリードの過剰存在がその染色体における胎児における三重体に対応するという仮定を使用することによって、胎児の異数性を決定するための方法が報告されていることに留意されたい（米国特許第７，８８８，０１７号）。出生前診断のためのこれらの方法は、いかなる種類の標的化も利用せず、出生前診断のための標的化の使用も説明しない。

【0434】

混合サンプルを配列決定する際に標的化アプローチを利用することにより、より少ない配列リードで、ある程度の精度を達成することが可能であり得る。精度は、感度を指し得、特異性を指し得、又はそれらのいくつかの組み合わせを指し得る。所望の精度レベルは、９０％～９５％であってもよく、９５％～９８％であってもよく、９８％～９９％であってもよく、９９％～９９．５％であってもよく、９９．５％～９９．９％であってもよく、９９．９％～９９．９９％であってもよく、９９．９９％～９９．９９９％であってもよく、９９．９９９％～１００％であってもよい。９５％を超える精度レベルは、高精度と呼ばれる場合がある。

【0435】

例えば、Ｇ．Ｊ．Ｗ．Ｌｉａｏｅｔａｌ．ＣｌｉｎｉｃａｌＣｈｅｍｉｓｔｒｙ２０１１；５７（１）ｐｐ．９２－１０１のように、母体ＤＮＡと胎児ＤＮＡとの混合サンプルから胎児の倍数性状態をどのように決定し得るかを実証するいくつかの公開された方法が先行技術に存在する。これらの方法は、各染色体に沿った数千の位置に焦点を当てる。所与の数の配列リードについて、ＤＮＡの混合サンプルから、依然として胎児に対する高精度の倍数測定をもたらしながら、標的化され得る染色体に沿った位置の数は、予想外に低い。本開示の一実施形態において、正確な倍数決定は、標的化する任意の方法、例えば、ｑＰＣＲ、リガンド媒介ＰＣＲ、他のＰＣＲ方法、ハイブリダイゼーションによる捕捉、又はプローブの環化を使用する、標的化配列決定を使用して行うことができ、標的化する必要がある染色体に沿った遺伝子座の数は、５，０００～２，０００遺伝子座であってもよく、２，０００～１，０００遺伝子座であってもよく、１，０００～５００遺伝子座であってもよく、５００～３００遺伝子座であってもよく３００～２００遺伝子座であってもよく、２００～１５０遺伝子座であってもよく、１５０～１００遺伝子座であってもよく、１００～５０遺伝子座であってもよく、５０～２０遺伝子座であってもよく、２０～１０遺伝子座であってもよい。任意選択で、１００～５００遺伝子座であってもよい。高いレベルの精度は、少数の遺伝子座を標的化し、予期せぬ少数の配列リードを実行することによって達成され得る。リード数は、１億～５０００万リードであってもよく、リード数は、５０００万～２０００万リードであってもよく、リード数は、２０００万～１０００万リードであってもよく、リード数は、１０００万～５００万リードであってもよく、リード数は、５００万～２００万リードであってもよく、リード数は、２００万～１００万リードであってもよく、リード数は、１００万～５０万リードであってもよく、リード数は、５０万～２０万リードであってもよく、リード数は、２０万～１０万リードであってもよく、リード数は、１０万～５万リードであってもよく、リード数は、５万～２万リードであってもよく、リード数は、２万～１万リードであってもよく、リード数は、１万未満であってもよい。より多くの量の入力ＤＮＡには、より少ない数のリードが必要である。

【0436】

いくつかの実施形態において、胎児起源のＤＮＡと母体起源のＤＮＡとの混合物を含む組成物が存在し、染色体１３に一意にマッピングする配列の割合は、４％よりも多い、５％よりも多い、６％よりも多い、７％よりも多い、８％よりも多い、９％よりも多い、１０％よりも多い、１２％よりも多い、１５％よりも多い、２０％よりも多い、２５％よりも多い、又は３０％よりも多い。本開示のいくつかの実施形態において、胎児起源のＤＮＡと母体起源のＤＮＡとの混合物を含む組成物が存在し、染色体１８に一意にマッピングする配列の割合は、３％よりも多い、４％よりも多い、５％よりも多い、６％よりも多い、７％よりも多い、８％よりも多い、９％よりも多い、１０％よりも多い、１２％よりも多い、１５％よりも多い、２０％よりも多い、２５％よりも多い、又は３０％よりも多い。本開示のいくつかの実施形態において、胎児起源のＤＮＡと母体起源のＤＮＡとの混合物を含む組成物が存在し、染色体２１に一意にマッピングする配列の割合は、２％よりも多い、３％よりも多い、４％よりも多い、５％よりも多い、６％よりも多い、７％よりも多い、８％よりも多い、９％よりも多い、１０％よりも多い、１２％よりも多い、１５％よりも多い、２０％よりも多い、２５％よりも多い、又は３０％よりも多い。本開示のいくつかの実施形態において、胎児起源のＤＮＡと母体起源のＤＮＡとの混合物を含む組成物が存在し、染色体Ｘに一意にマッピングする配列の割合は、６％よりも多い、７％よりも多い、８％よりも多い、９％よりも多い、１０％よりも多い、１２％よりも多い、１５％よりも多い、２０％よりも多い、２５％よりも多い、又は３０％よりも多い。本開示のいくつかの実施形態において、胎児起源のＤＮＡと母体起源のＤＮＡとの混合物を含む組成物が存在し、染色体Ｙに一意にマッピングする配列の割合は、１％よりも多い、２％よりも多い、３％よりも多い、４％よりも多い、５％よりも多い、６％よりも多い、７％よりも多い、８％よりも多い、９％よりも多い、１０％よりも多い、１２％よりも多い、１５％よりも多い、２０％よりも多い、２５％よりも多い、又は３０％よりも多い。

【0437】

いくつかの実施形態において、胎児起源のＤＮＡと母体起源のＤＮＡとの混合物を含む組成物が記載され、染色体に一意にマッピングされ、少なくとも１つの一塩基多型を含有する配列の割合は、０．２％より多く、０．３％より多く、０．４％より多く、０．５％より多く、０．６％より多く、０．７％より多く、０．８％より多く、０．９％より多く、１％より多く、１．２％より多く、１．４％より多く、１．６％より多く、１．８％より多く、２％より多く、２．５％より多く、３％より多く、４％より多く、５％より多く、６％より多く、７％より多く、８％より多く、９％より多く、１０％より多く、１２％より多く、１５％より多く、又は２０％より多く、染色体は、１３、１８、２１、Ｘ、又はＹ群から取り出される。本開示のいくつかの実施形態において、胎児起源のＤＮＡと母体起源のＤＮＡとの混合物を含む組成物が存在し、染色体に一意にマッピングされ、一組の一塩基多型からの少なくとも１つの一塩基多型を含む配列の割合は、０．１５％超、０．２％超、０．３％超、０．４％超、０．５％超、０．６％超、０．７％超、０．８％超、０．９％超、１％超、１．２％超、１．４％超、１．６％超、１．８％超、２％超、２．５％超、３％超、４％超、５％超、６％超、７％超、８％超、９％超、１０％超、１２％超、１５％超、又は２０％超であり、染色体は、染色体１３、１８、２１、Ｘ及びＹのセットから取り出され、一塩基多型のセットにおける一塩基多型の数は、１～１０、１０～２０、２０～５０、５０～１００、１００～２００、２００～５００、５００～１，０００、１，０００～２，０００、２，０００～５，０００、５，０００～１０，０００、１０，０００～２０，０００、２０，０００～５０，０００及び５０，０００～１００，０００である。

【0438】

理論的には、増幅の各サイクルは、存在するＤＮＡの量を２倍にするが、実際には、増幅の程度は２よりわずかに低い。理論的には、標的化増幅を含む増幅は、ＤＮＡ混合物のバイアスフリー増幅をもたらし、しかしながら、実際には、異なる対立遺伝子は、他の対立遺伝子とは異なる程度に増幅される傾向がある。ＤＮＡが増幅されるとき、対立遺伝子バイアスの程度は典型的には増幅工程の数とともに増加する。いくつかの実施形態において、本明細書に記載される方法は、低レベルの対立遺伝子バイアスを有するＤＮＡを増幅することを伴う。各追加サイクルの対立遺伝子バイアス化合物であるため、全体的なバイアスのｎ乗根を計算することによって、サイクルごとの対立遺伝子バイアスを決定することができ、式中、ｎは、濃縮度の塩基２対数である。いくつかの実施形態において、ＤＮＡの第２の混合物を含む組成物が存在し、ＤＮＡの第２の混合物は、ＤＮＡの第１の混合物から複数の多型遺伝子座において優先的に濃縮され、濃縮度は、少なくとも１０、少なくとも１００、少なくとも１，０００、少なくとも１０，０００、少なくとも１００，０００又は少なくとも１，０００，０００であり、各遺伝子座におけるＤＮＡの第２の混合物中の対立遺伝子の比率は、ＤＮＡの第１の混合物中のその遺伝子座における対立遺伝子の比率と、平均して１，０００％、５００％、２００％、１００％、５０％、２０％、１０％、５％、２％、１％、０．５％、０．２％、０．１％、０．０５％、０．０２％、又は０．０１％未満の因子で異なる。いくつかの実施形態において、ＤＮＡの第２の混合物を含む組成物があり、ＤＮＡの第２の混合物は、ＤＮＡの第１の混合物からの複数の多型遺伝子座で優先的に濃縮されており、複数の多型遺伝子座のサイクル当たりの対立遺伝子バイアスは、平均して１０％、５％、２％、１％、０．５％、０．２％、０．１％、０．０５％、又は０．０２％未満である。いくつかの実施形態において、複数の多型遺伝子座は、少なくとも１０の遺伝子座、少なくとも２０の遺伝子座、少なくとも５０の遺伝子座、少なくとも１００の遺伝子座、少なくとも２００の遺伝子座、少なくとも５００の遺伝子座、少なくとも１，０００の遺伝子座、少なくとも２，０００の遺伝子座、少なくとも５，０００の遺伝子座、少なくとも１０，０００の遺伝子座、少なくとも２０，０００の遺伝子座、又は少なくとも５０，０００の遺伝子座を含む。

【0439】

最大尤度推定値
生物学的現象又は医学的状態の有無を検出するための当該技術分野で既知のほとんどの方法は、単一の仮説否定検査の使用を含み、条件と相関するメトリクスが測定され、メトリクスが所与の閾値の一方にある場合、条件が存在し、メトリクスの一方が閾値の他方にある場合、条件は存在しない。単一仮説否定検定は、ヌル仮説と代替仮説との間を決定するときにのみヌル分布を見る。代替分布を考慮しないと、観察データを考慮した各仮説の尤度を推定することができず、したがって、コールに対する信頼度を計算することができない。したがって、単一仮説拒否検査では、特定のケースに関連する自信を感じることなく、「はい」又は「いいえ」の答えを得ることになる。

【0440】

いくつかの実施形態において、本明細書に開示される方法は、最大尤度法を使用して、生物学的現象又は医学的状態の有無を検出することができる。これは、状態の不在又は存在をコールするための閾値が各症例に対して適切に調整され得るため、単一の仮説否定技術を使用する方法と比較して実質的な改善である。これは、妊娠中の胎児における異数性の有無を、母体血漿中に見出される遊離浮遊ＤＮＡに存在する胎児ＤＮＡと母体ＤＮＡとの混合物から入手可能な遺伝子データから決定することを目的とする診断技術に特に関連する。これは、血漿由来画分における胎児ＤＮＡの画分が変化するにつれて、異数性対異数性をコールするための最適閾値が変化するためである。胎児画分が低下するにつれて、異数性に関連するデータの分布は、正倍数体性に関連するデータの分布にますます類似するようになる。

【0441】

最大尤度推定法は、各仮説に関連付けられた分布を使用して、各仮説に条件付けられたデータの尤度を推定する。次いで、これらの条件付き確率を仮説コール及び信頼度に変換することができる。同様に、最大事後推定法は、最大尤度推定と同じ条件付き確率を使用するが、最良の仮説を選択し、信頼度を決定するときに集団先行値も組み込む。

【0442】

したがって、最大尤度推定（ＭＬＥ）技法、又は密接に関連する最大事後（ＭＡＰ）技法の使用は、２つの利点をもたらし、第１に、それは、正しいコールの確率を増加させ、また、コールごとに信頼度を計算することを可能にする。一実施形態において、最大確率を有する仮説に対応する倍数性状態の選択は、最大尤度推定値又は最大事後推定値を使用して実行される。一実施形態において、妊娠中の胎児の倍数性状態を決定するための方法が開示され、これは、単一の仮説拒絶技法を使用する当該技術分野で現在既知の任意の方法をとり、それがＭＬＥ又はＭＡＰ技法を使用するようにそれを再処方することを伴う。これらの技術を適用することによって著しく改善され得る方法のいくつかの例は、米国特許第８，００８，０１８号、米国特許第７，８８８，０１７号、又は米国特許第７，３３２，２７７号に見出すことができる。

【0443】

一実施形態において、胎児及び母親のゲノムＤＮＡを含む母体血漿サンプル中の胎児の異数性の有無を決定するための方法が記載され、この方法は、母体血漿サンプルを得ることと、高スループットシーケンサで血漿サンプル中に見出されるＤＮＡフラグメントを測定することと、配列を染色体にマッピングし、各染色体にマッピングする配列リードの数を決定することと、血漿サンプル中の胎児ＤＮＡの画分を計算することと、第２の標的染色体が正倍数体である場合に予測される標的染色体の量の予測分布と、染色体が非正倍数体である場合に予測される１つ又は複数の予測分布とを、胎児画分及び正倍数体であると予測される１つ又は複数の参照染色体にマッピングする配列リード数を使用して計算することと、ＭＬＥ又はＭＡＰを使用して、分布のうちのどれが正しい可能性が最も高いかを決定し、それによって、胎児の異数体の有無を示すことと、を含む。一実施形態において、血漿からのＤＮＡを測定することは、大規模に平行なショットガン配列決定を行うことを伴ってもよい。一実施形態において、血漿サンプルからのＤＮＡの測定は、例えば、標的化増幅によって、複数の多型又は非多型遺伝子座において優先的に濃縮されたＤＮＡを配列決定することを伴い得る。複数の遺伝子座は、１つ又は少数の疑わしい異数体染色体と、１つ又は少数の参照染色体とを標的化するように設計され得る。優先的濃縮の目的は、倍数決定に有益な配列リードの数を増やすことである。

【0444】

倍数性コール情報学方法
本明細書で説明されるのは、所与の配列データを与えられた胎児の倍数性状態を決定する方法である。いくつかの実施形態において、この配列データは、高スループットシーケンサで測定されてもよい。いくつかの実施形態において、配列データは、母体血液から単離された遊離浮遊ＤＮＡに由来するＤＮＡ上で測定されてもよく、遊離浮遊ＤＮＡは、母体起源のいくつかのＤＮＡ、及び胎児／胎盤起源のいくつかのＤＮＡを含む。このセクションは、分析された混合物中の胎児ＤＮＡの画分が知られておらず、データから推定されると仮定して、胎児の倍数性状態が決定される本開示の一実施形態を説明する。また、混合物中の胎児ＤＮＡの画分（「胎児画分」）又は胎児ＤＮＡの割合を別の方法によって測定することができ、胎児の倍数性状態を決定することにおいて既知であると仮定される実施形態を説明する。いくつかの実施形態において、胎児画分は、胎児ＤＮＡと母体ＤＮＡとの混合物である母体血液サンプル自体に対して行われた遺伝子型決定測定値のみを使用して計算することができる。いくつかの実施形態において、画分は、また、母親の測定された又は他の方法で既知の遺伝子型及び／又は父親の測定された又は他の方法で既知の遺伝子型を使用して計算されてもよい。別の実施形態において、胎児の倍数性状態は、問題の染色体についての胎児ＤＮＡの計算された画分と、参照染色体についての胎児ＤＮＡの計算された画分とを比較して、ダイソミックと仮定して、単独で決定することができる。

【0445】

好ましい実施形態において、特定の染色体について、以下を有するＮＳＮＰを観察及び分析すると仮定する：
●ＮＲ遊離浮遊ＤＮＡ配列測定値Ｓ＝（ｓ_１，…，ｓ_ＮＲ）のセット。この方法はＳＮＰ測定を利用するため、非多型遺伝子座に対応する全ての配列データを無視することができる。簡略化されたバージョンでは、各ＳＮＰに（Ａ，Ｂ）カウントがあり、Ａ及びＢは、所与の遺伝子座に存在する２つの対立遺伝子に対応し、Ｓは、Ｓ＝（（ａ_１，ｂ_１），…，（ａ_Ｎ，ｂ_Ｎ））として書くことができ、式中、ａ_ｉは、ＳＮＰｉ上のＡカウントであり、ｂ_ｉは、ＳＮＰｉ上のＢカウントであり、Σ_{ｉ＝１：Ｎ}（ａ_ｉ＋ｂ_ｉ）＝ＮＲ
●以下からなる親データ
○ｓＮＰマイクロアレイ又は他の強度ベースの遺伝子型決定プラットフォームからの遺伝子型：母Ｍ＝（ｍ_１，…，ｍ_Ｎ）、父Ｆ＝（ｆ_１，…，ｆ_Ｎ）、式中、ｍ_ｉ、ｆ_ｉ∈（ＡＡ、ＡＢ、ＢＢ）。
○及び／又は配列データ測定：ＮＲＭ母測定ＳＭ＝（ｓｍ_１，…，ｓｍ_ｎｒｍ）、ＮＲＦ父測定ＳＦ＝（ｓｆ_１，…，ｓｆ_ｎｒｆ）。上記の簡略化と同様に、各ＳＮＰに（Ａ，Ｂ）カウントがある場合、ＳＭ＝（（ａｍ_１，ｂｍ_１），…，（ａｍ_Ｎ，ｂｍ_Ｎ）），ＳＦ＝（（ａｆ_１，ｂｆ_１），…，（ａｆ_Ｎ，ｂｆ_Ｎ））

【0446】

集合的に、母、父、子データは、Ｄ＝（Ｍ，Ｆ，ＳＭ，ＳＦ，Ｓ）として示される。親データは所望され、アルゴリズムの精度を高めるが、特に父データは必要ではないことに留意されたい。これは、母親及び／又は父親のデータがない場合でも、非常に正確なコピー数の結果を得ることが可能であることを意味する。

【0447】

考慮される全ての仮説（Ｈ）に対してデータログ尤度ＬＩＫ（Ｄ｜Ｈ）を最大化することによって、最良のコピー数推定（Ｈ^＊）を導出することが可能である。具体的には、結合分布モデル及び調製されたサンプルについて測定された対立遺伝子数を使用して、並びにそれらの相対確率を使用して、以下のように正しい可能性が最も高い仮説を決定するために、倍数性仮説の各々の相対確率を決定することが可能である：

【数76】

【0448】

同様に、データを与えられた事後仮説尤度は、以下のように記述され得る：

【数77】

【0449】

ｐｒｉｏｒｐｒｏｂ（Ｈ）は、モデル設計及び事前知識に基づいて、各仮説Ｈに割り当てられる事前確率である。

【0450】

事前推定値を使用して、事後推定値の最大値を求めることもできる：

【数78】

【0451】

一実施形態において、考慮され得るコピー数仮説は、以下の通りである：
●モノソミー：
○母系Ｈ１０（母親から１つのコピー）
○父系Ｈ０１（父親からの１つのコピー）
●ダイソミー：Ｈ１１（母親及び父親、各々１つのコピー）
●単純なトリソミー、乗換え考慮なし：
○母系：Ｈ２１＿ＭＡＴＣＨＥＤ（母親からの２つの同一のコピー、父親からの１つのコピー）、Ｈ２１＿ＵＮＭＡＴＣＨＥＤ（母親からの両方のコピー、父親からの１つのコピー）
○父系：Ｈ１２＿ＭＡＴＣＨＥＤ（母親からの１つのコピー、父親からの２つのコピー）、Ｈ１２＿ＵＮＭＡＴＣＨＥＤ（母親からの１つのコピー、父親からの両方のコピー）
●乗換えを可能にする複合トリソミー（結合分布モデルを使用）：
○母系Ｈ２１（母親から２つのコピー、父親から１つのコピー）、
○父系のＨ１２（母親から１つのコピー、父親から２つのコピー）

【0452】

他の実施形態において、ヌルソミー（Ｈ００）、単親ダイソミー（Ｈ２０及びＨ０２）、及びテトラソミー（Ｈ０４、Ｈ１３、Ｈ２２、Ｈ３１及びＨ４０）などの他の倍数性状態が考慮され得る。

【0453】

乗換えがない場合、起点が有糸分裂、減数分裂Ｉ、又は減数分裂ＩＩのいずれであるかにかかわらず、各トリソミーは、マッチするトリソミー又はマッチしないトリソミーのうちの１つになるであろう。乗換えのため、真のトリソミーは通常、２つの組み合わせである。まず、単純な仮説のための仮説尤度を導出する方法が記載されている。次いで、個々のＳＮＰ尤度を乗換えと組み合わせて、複合仮説の仮説尤度を導出する方法が記載される。

【0454】

単純仮説のＬＩＫ（Ｄ｜Ｈ）
一実施形態において、ＬＩＫ（Ｄ｜Ｈ）は、以下のように、単純な仮説について決定されてもよい。単純な仮説Ｈ、ＬＩＫ（Ｈ）、すなわち染色体全体における仮説Ｈの対数尤度は、既知又は導出された子画分をｃｆと仮定して、個々のＳＮＰの対数尤度の合計として計算され得る。一実施形態において、ｃｆをデータから導出することが可能である。

【数79】

【0455】

この仮説は、ＳＮＰ間の連鎖を想定しておらず、したがって、結合分布モデルを利用していない。

【0456】

いくつかの実施形態において、対数尤度は、ＳＮＰごとに決定されてもよい。特定のＳＮＰｉでは、胎児倍数性仮説Ｈ及び胎児ＤＮＡの割合ｃｆを仮定して、観察されたデータＤの対数尤度を以下のように定義する：

【数80】

式中、ｍは真の母系遺伝子型である可能性があり、ｆは真の父系遺伝子型である可能性があり、式中、ｍ、ｆ∈｛ＡＡ，ＡＢ，ＢＢ｝、及びｃは、仮説Ｈが与えられた場合、子の遺伝子型である可能性がある。具体的には、モノソミーｃ∈｛Ａ，Ｂ｝について、ダイソミーｃ∈｛ＡＡ，ＡＢ，ＢＢ｝について、トリソミーｃ∈｛ＡＡＡ，ＡＡＢ，ＡＢＢ，ＢＢＢ｝についてである。

【0457】

遺伝子型先行頻度：ｐ（ｍ｜ｉ）は、ｐＡ_ｉで示される、ＳＮＰＩでの既知の集団頻度に基づく、ＳＮＰｉ上の母系遺伝子型ｍの一般的な先行確率である。具体的には
ｐ（ＡＡ│ｐＡ_ｉ）＝（ｐＡ_ｉ）^２、ｐ（ＡＢ│ｐＡ_ｉ）＝２（ｐＡ_ｉ）＊（１－ｐＡ_ｉ）、ｐ（ＢＢ│ｐＡ_ｉ）＝（１－ｐＡ_ｉ）^２

【0458】

父系遺伝子型確率、ｐ（ｆ｜ｉ）は、類似の方法で決定されてもよい。

【0459】

真の子供の確率：ｐ（ｃ│ｍ，ｆ，Ｈ）は、親ｍ、ｆ、及び仮説Ｈを仮定して、真の子供の遺伝子型＝ｃを取得する確率であり、これは簡単に計算できる。例えば、Ｈ１１、Ｈ２１マッチ及びＨ２１マッチしないについて、ｐ（ｃ｜ｍ，ｆ，Ｈ）を以下に示す。

【表5】

【0460】

データの尤度：Ｐ（Ｄ│ｍ，ｆ，ｃ，Ｈ，ｉ，ｃｆ）は、真の母系遺伝子型ｍ、真の父系遺伝子型ｆ、真の子の遺伝子型ｃ、仮説Ｈ、及び子画分ｃｆが与えられた、ＳＮＰｉに関する所与のデータＤの確率である。それは、以下のように、母親、父親、及び子供のデータの確率に分類することができる：
Ｐ（Ｄ│ｍ，ｆ，ｃ，Ｈ，ｃｆ，ｉ）＝Ｐ（ＳＭ｜ｍ，ｉ）Ｐ（Ｍ│ｍ，ｉ）Ｐ（ＳＦ｜ｆ，ｉ）Ｐ（Ｆ│ｆ，ｉ）Ｐ（Ｓ│ｍ，ｃ，Ｈ，ｃｆ，ｉ）

【0461】

母ＳＮＰアレイデータの尤度：ＳＮＰアレイ遺伝子型が正しいと仮定すると、真の遺伝子型ｍと比較したＳＮＰｉにおける母ＳＮＰアレイ遺伝子型データｍ_ｉの確率は、単純である

【数81】

【0462】

母親配列データ尤度：追加のノイズ又はバイアスを伴わない、カウントＳ_ｉ＝（ａｍ_ｉ，ｂｍ_ｉ）の場合、ＳＮＰｉにおける母親配列データの確率は、Ｐ（ＳＭ|ｍ，ｉ）＝Ｐ_Ｘ|ｍ（ａｍ_ｉ）として定義される二項確率であり、ｐ_ｍ（Ａ）を有するＸ|ｍ～Ｂｉｎｏｍ（ｐ_ｍ（Ａ）、ａｍ_ｉ＋ｂｍ_ｉ）は、以下として定義される：

【表6】

【0463】

父データ尤度：父データ尤度に同様の方程式が適用される。

【0464】

親データ、特に父データなしで子の遺伝子型を決定することが可能であることに留意されたい。例えば、父系遺伝子型データＦが利用可能でない場合、Ｐ（Ｆ│ｆ，ｉ）＝１を単に使用してもよい。父配列データＳＦが利用可能でない場合、１つは、Ｐ（ＳＦ｜ｆ，ｉ）＝１を単に使用してもよい。

【0465】

いくつかの実施形態において、本方法は、各倍数性仮説についての染色体上の複数の多型遺伝子座での対立遺伝子数の予測される結合分布モデルを構築することを伴い、そのような終わりを達成する１つの方法が本明細書に記載される。遊離胎児ＤＮＡデータの尤度：Ｐ（Ｓ│ｍ，ｃ，Ｈ，ｃｆ，ｉ）は、真の母系遺伝子型│ｍ、真の子の遺伝子型ｃ、子コピー数仮説Ｈ、及び子画分ｃｆを仮定した、ＳＮＰｉ上の遊離胎児ＤＮＡ配列データの確率である。これは、実際には、ＳＮＰｉμ（ｍ，ｃ，ｃｆ，Ｈ）上のＡ含有量の真の確率を考慮して、ＳＮＰＩ上の配列データＳの確率である。
Ｐ（Ｓ│ｍ，ｃ，Ｈ，ｃｆ，ｉ）＝Ｐ（Ｓ｜μ（ｍ，ｃ，ｃｆ，Ｈ），ｉ）

【0466】

カウントの場合、Ｓ_ｉ＝（ａ_ｉ，ｂ_ｉ）であって、データに余分なノイズ又はバイアスが含まれていない
Ｐ（Ｓ│μ（ｍ，ｃ，ｃｆ，Ｈ）、ｉ）＝Ｐ_ｘ（ａ_ｉ）
式中、Ｘ～Ｂｉｎｏｍ（ｐ（Ａ），ａ_ｉ＋ｂ_ｉ）、ｐ（Ａ）＝μ（ｍ，ｃ，ｃｆ，Ｈ）。ＳＮＰ当たりの正確なアライメント及び（Ａ，Ｂ）カウントが知られていないより複雑な場合において、Ｐ（Ｓ│μ（ｍ，ｃ，ｃｆ，Ｈ），ｉ）は、積分二項の組み合わせである。

【0467】

真のＡ含有率：真の母系遺伝子型＝ｍ、真の子の遺伝子型＝ｃ、及び全体的な子画分＝ｃｆを仮定して、この母子混合物中のＳＮＰｉ上のＡ含有率の真の確率である、μ（ｍ，ｃ，ｃｆ，Ｈ）は、以下として定義される

【数82】

式中、＃Ａ（ｇ）＝遺伝子型ｇにおけるＡの数、ｎ_ｍ＝２は、母親のソミーであり、ｎ_ｃは、仮説Ｈの下での子供の倍数性である（モノソミーの場合は１、ダイソミーの場合は２、トリソミーの場合は３）。

【0468】

結合分布モデルを使用する：複合仮説に対するＬＩＫ（Ｄ｜Ｈ）
いくつかの実施形態において、本方法は、各倍数性仮説についての染色体上の複数の多型遺伝子座での対立遺伝子数の予測される結合分布モデルを構築することを伴い、そのような終わりを達成する１つの方法が本明細書に記載される。多くの場合、トリソミーは、通常、乗換えのために純粋にマッチし、マッチしないわけではないため、このセクションでは、複合仮説Ｈ２１（母系トリソミー）及びＨ１２（父系トリソミー）の結果が導出され、マッチするトリソミー及びマッチしないトリソミーを組み合わせて、乗換えの可能性を説明する。

【0469】

【0470】

ＳＮＰｉ上で、ＬＩＫ（Ｄ｜Ｈｍ，ｉ）がマッチする仮説Ｈ_ｍに対する適合度であり、ＬＩＫ（Ｄ｜Ｈｕ，ｉ）がマッチしない仮説Ｈ_ｕに対する適合度であり、ｐｃ（ｉ）＝ＳＮＰｉ－１とｉとの間の乗換えの確率であると仮定する。次いで、以下のように全尤度を計算することができる：
ＬＩＫ（Ｄ｜Ｈ）＝Σ_ＥＬＩＫ（Ｄ｜Ｅ，１：Ｎ）
式中、ＬＩＫ（Ｄ｜Ｅ，１：Ｎ）は、ＳＮＰ１：Ｎについて、仮説Ｅで終わる尤度である。Ｅ＝最後のＳＮＰの仮説、Ｅ∈（Ｈｍ，Ｈｕ）。再帰的には、以下を計算することができる：
ＬＩＫ（Ｄ｜Ｅ，１：ｉ）＝ＬＩＫ（Ｄ｜Ｅ，ｉ）＋ｌｏｇ（ｅｘｐ（ＬＩＫ（Ｄ｜Ｅ，１：ｉ－１））＊（１－ｐｃ（ｉ））＋ｅｘｐ（ＬＩＫ（Ｄ｜～Ｅ，１：ｉ－１））＊ｐｃ（ｉ））
式中、～Ｅは、Ｅ（Ｅではない）以外の仮説であり、考慮される仮説は、Ｈ_ｍ及びＨ_ｕである。具体的には、１～（ｉ－１）ＳＮＰの尤度に基づいて、１：ｉのＳＮＰの尤度を計算することができ、同一の仮説を持ち、乗換え又は反対の仮説を持たず、乗換えにＳＮＰｉの尤度を掛ける。

【0471】

ＳＮＰ１の場合、ｉ＝１、ＬＩＫ（Ｄ｜Ｅ，１：１）＝ＬＩＫ（Ｄ｜Ｅ，１）。

【0472】

ＳＮＰ２の場合、ｉ＝２、ＬＩＫ（Ｄ｜Ｅ，１：２）＝ＬＩＫ（Ｄ｜Ｅ，２）＋ｌｏｇ（ｅｘｐ（ＬＩＫ（Ｄ｜Ｅ，１））＊（１－ｐｃ（２））＋ｅｘｐ（ＬＩＫ（Ｄ｜～Ｅ，１））＊ｐｃ（２））、
ｉ＝３：Ｎの場合、続く。

【0473】

いくつかの実施形態において、子画分は、決定されてもよい。子画分は、子に由来するＤＮＡの混合物中の配列の割合を指し得る。非侵襲性出生前診断の文脈では、子画分は、胎児に由来する母体血漿中の配列の割合、又は胎児遺伝子型を有する胎盤の一部を指し得る。これは、母体血漿から調製されたＤＮＡのサンプル中の子画分を指し得、胎児のＤＮＡで濃縮され得る。ＤＮＡのサンプル中の子画分を決定する１つの目的は、胎児に対して倍数性コールを行うことができるアルゴリズムでの使用のためであり、したがって、子画分は、非侵襲性出生前診断の目的のために配列決定によって分析されたＤＮＡの任意のサンプルのことを指す。

【0474】

非侵襲性出生前異数性診断の方法の一部である本開示に提示されるアルゴリズムのいくつかは、既知の小児画分を想定しており、これは必ずしもそうではない場合がある。一実施形態において、親データの存在の有無にかかわらず、選択された染色体上のダイソミーの尤度を最大化することによって、最も尤度の高い子画分を見つけることが可能である。

【0475】

具体的には、ダイソミー仮説について、及び染色体ｃｈｒの子画分について、上記のようなＬＩＫ（Ｄ｜Ｈ１１，ｃｆ，ｃｈｒ）＝対数尤度を仮定する。Ｃｓｅｔ内の選択された染色体（通常１：１６）について、正倍数体であると仮定すると、全尤度は、以下の通りである：
ＬＩＫ（ｃｆ）＝Σ_{ｃｈｒ∈Ｃｓｅｔ}Ｌｉｋ（Ｄ｜Ｈ１１，ｃｆ，ｃｈｒ）

【0476】

最も可能性の高い子画分（ｃｆ^＊）は、

【数83】

として導出される。

【0477】

染色体の任意のセットを使用することが可能である。参照染色体上で正倍数体を想定せずに子画分を導出することも可能である。この方法を使用すると、以下のいずれかの状況で子画分を決定することができる：（１）１つは、親に関するアレイデータ及び母体血漿に関するショットガン配列決定データを有する；（２）１つは、親に関するアレイデータ及び母体血漿に関する標的化配列決定データを有する；（３）１つは、親及び母体血漿の両方に関する標的化配列決定データを有する；（４）１つは、母親及び母体血漿画分の両方に関する標的化配列決定データを有する；（５）１つは、母体血漿画分に関する標的化配列決定データを有する；（６）親及び子画分の測定の他の組み合わせを有する。

【0478】

いくつかの実施形態において、情報学的方法は、データドロップアウトを組み込んでもよく、これは、より高い精度の倍数性決定をもたらしてもよい。本開示の他の箇所では、Ａを得る確率は、真の母系遺伝子型、真の子の遺伝子型、混合物中の子の画分、及び子コピー数の直接関数であると仮定されている。また、母親又は子の対立遺伝子が脱落する可能性もあり、例えば、混合物中の真の子ＡＢを測定する代わりに、対立遺伝子Ａにマッピングされた配列のみが測定される場合がある。１つは、ゲノムイルミナデータｄ_ｐｇの親ドロップアウト率、配列データｄ_ｐｓの親ドロップアウト率、及び配列データｄ_ｃｓの子ドロップアウト率を示し得る。いくつかの実施形態において、母親のドロップアウト率はゼロであると仮定することができ、子供のドロップアウト率は比較的低く、この場合、結果はドロップアウトによって深刻な影響を受けることはない。いくつかの実施形態において、対立遺伝子ドロップアウトの可能性は、それらが予測される倍数性コールの有意な効果をもたらすほど十分に大きくてもよい。このような場合、対立遺伝子ドロップアウトは、以下のアルゴリズムに組み込まれている：

【0479】

親ＳＮＰアレイデータドロップアウト：母親のゲノムデータＭについて、ドロップアウト後の遺伝子型がｍ_ｄであると仮定し、次いで、

【数84】

ここで、

【数85】

は前と同じで、Ｐ（ｍ_ｄ｜ｍ）は、ドロップアウト率ｄについて、以下のように定義される真の遺伝子型ｍが与えられた場合の、尤度のあるドロップアウト後の遺伝子型ｍ_ｄの尤度である

【表7】

【0480】

同様の方程式は、父ＳＮＰアレイデータに適用される。

【0481】

親配列データドロップアウト：母系配列データＳＭの場合

【数86】

式中、Ｐ（ｍ_ｄ│ｍ）は、前のセクションで定義され、二項分布からの

【数87】

確率は、親データ尤度セクションで前のように定義される。同様の方程式が、父系配列データに適用される。

【0482】

遊離浮遊ＤＮＡ配列データドロップアウト：

【数88】

式中、Ｐ（Ｓ｜μ（ｍ_ｄ，ｃ_ｄ，ｃｆ，Ｈ），ｉ）は、遊離浮遊データ尤度に関するセクションで定義される。

【0483】

一実施形態において、ｐ（ｍ_ｄ｜ｍ）は、ドロップアウト率ｄ_ｐｓを仮定して、真の母系遺伝子型ｍが与えられた場合の、観察された母系遺伝子型ｍ_ｄの確率であり、ｐ（ｃ_ｄ｜ｃ）は、ドロップアウト率ｄ_ｃｓを仮定して、真の子の遺伝子型ｃが与えられた場合の、観察された子の遺伝子型ｃ_ｄの確率である。ｎＡ_Ｔ＝真の遺伝子型ｃにおけるＡ対立遺伝子の数、ｎＡ_Ｄ＝観察された遺伝子型ｃ_ｄにおけるＡ対立遺伝子の数、ｎＡ_Ｔ≧ｎＡ_Ｄ、及び同様にｎＢ_Ｔ＝真の遺伝子型ｃにおけるＢ対立遺伝子の数、ｎＢ_Ｄ＝観察された遺伝子型ｃ_ｄにおけるＢ対立遺伝子の数、ｎＢ_Ｔ≧ｎＢ_Ｄ及びｄ＝ドロップアウト率の場合、次いで

【数89】

【0484】

一実施形態において、情報学的方法は、ランダムかつ一貫したバイアスを組み込んでもよい。理想的な単語では、配列カウントの数において、ＳＮＰごとの一貫したサンプリングバイアス又はランダムノイズ（二項分布変動に加えて）は存在しない。具体的には、ＳＮＰｉでは、母遺伝子型ｍについて、真の子の遺伝子型ｃ及び子画分ｃｆ、並びにＸ＝ＳＮＰｉ上の（Ａ＋Ｂ）リードの集合におけるＡの数、Ｘは、Ｘ～二項式（ｐ，Ａ＋Ｂ）のように作用し、式中、ｐ＝μ（ｍ，ｃ，ｃｆ，Ｈ）＝Ａ含有量の真の確率。

【0485】

一実施形態において、情報学的方法は、ランダムバイアスを組み込んでもよい。多くの場合のように、このＳＮＰでＡを得る確率がｑに等しくなるように、測定値にバイアスがあると仮定し、これは上記で定義されたｐとは少し異なる。Ｐがｑからどのくらい異なるかは、測定プロセスの精度及び他の因子の数に依存し、ｐから離れたｑの標準偏差によって定量化することができる。一実施形態において、ベータ分布を有するようにｑをモデル化することが可能であり、パラメータα、βは、その分布の平均がｐに中心を置くことに依存し、いくつかの特定の標準偏差がｓである。具体的には、これは、Ｘ｜ｑ～Ｂｉｎ（ｑ，Ｄ_ｉ）、式中、ｑ～Ｂｅｔａ（α，β）を与える。Ｅ（ｑ）＝ｐ、Ｖ（ｑ）＝ｓ^２、パラメータαを設定すると、βはα＝ｐＮ、β＝（１－ｐ）Ｎとして導き出すことができ、式中、

【数90】

【0486】

これは、ベータ二項分布の定義であり、可変パラメータｑを有する二項分布からサンプリングし、ｑは、平均ｐを有するベータ分布に従う。したがって、バイアスのないセットアップでは、ＳＮＰｉ上で、真の母系遺伝子型（ｍ）、ＳＮＰｉ上の所与の母親配列Ａカウント（ａｍ_ｉ）、及びＳＮＰｉ上の母親配列Ｂカウント（ｂｍ_ｉ）を仮定する親配列データ（ＳＭ）確率は、以下のように計算され得る：
Ｐ（ＳＭ｜ｍ，ｉ）＝Ｐ_Ｘ｜ｍ（ａｍ_ｉ）、式中、Ｘ｜ｍ～Ｂｉｎｏｍ（ｐ_ｍ（Ａ），ａｍ_ｉ＋ｂｍ_ｉ）

【0487】

ここで、標準偏差を有するランダムバイアスを含めると、これは以下になる：
Ｘ｜ｍ～ＢｅｔａＢｉｎｏｍ（ｐ_ｍ（Ａ），ａｍ_ｉ＋ｂｍ_ｉ，ｓ）

【0488】

バイアスのない場合、真の母系遺伝子型（ｍ）、真の子の遺伝子型（ｃ）、子画分（ｃｆ）を仮定し、子仮説Ｈを仮定し、ＳＮＰｉ（ａ_ｉ）上の遊離浮遊ＤＮＡ配列Ａカウント及びＳＮＰｉ（ｂ_ｉ）上の遊離浮遊配列Ｂカウントを与えた母体血漿ＤＮＡ配列データ（Ｓ）確率は、以下として計算され得、
Ｐ（Ｓ│ｍ，ｃ，ｃｆ，Ｈ，ｉ）＝Ｐ_ｘ（ａ_ｉ）
式中、Ｘ～Ｂｉｎｏｍ（ｐ（Ａ）、ａ_ｉ＋ｂ_ｉ）、ｐ（Ａ）＝μ（ｍ、ｃ、ｃｆ、Ｈ）。

【0489】

標準偏差ｓを有するランダムバイアスを含む一実施形態において、これは、Ｘ～ＢｅｔａＢｉｎｏｍ（ｐ（Ａ）、ａ_ｉ＋ｂ_ｉ、ｓ）となり、余分な変動の量は、偏差パラメータｓによって、又は等価にＮによって指定される。ｓの値が小さいほど（又はＮの値が大きいほど）、この分布は正規二項分布に近い。曖昧でない文脈ＡＡ｜ＡＡ、ＢＢ｜ＢＢ、ＡＡ｜ＢＢ、ＢＢ｜ＡＡからバイアスの量、すなわち上記の推定Ｎを推定し、上記の確率で推定される

【数91】

の使用を推定することが可能である。データの挙動に応じて、Ｎは、リード深度ａ_ｉ＋ｂ_ｉ、又はａ_ｉ＋ｂ_ｉの関数にかかわらず定数とすることができ、リード深度が大きいほどバイアスが小さくなる。

【0490】

一実施形態において、情報学的方法は、一貫性のあるＳＮＰ当たりのバイアスを組み込んでもよい。配列決定プロセスのアーチファクトのために、いくつかのＳＮＰは、Ａ含有量の真の量にかかわらず、一貫してより低い又はより高いカウントを有し得る。ＳＮＰｉが一貫してＡカウントの数にｗ_ｉパーセントのバイアスを加えると仮定する。いくつかの実施形態において、このバイアスは、同じ条件下で導出されるトレーニングデータのセットから推定され得、親配列データの推定値に追加して戻すことができる：
Ｐ（ＳＭ｜ｍ，ｉ）＝Ｐ_Ｘ｜ｍ（ａｍ_ｉ）、式中、Ｘ｜ｍ～ＢｅｔａＢｉｎｏｍ（ｐ_ｍ（Ａ）＋ｗ_ｉ，ａｍ_ｉ＋ｂｍ_ｉ，ｓ）
遊離浮遊ＤＮＡ配列データ確率推定値を用いて、以下のように推定する：
Ｐ（Ｓ│ｍ，ｃｆ，Ｈ，ｉ）＝Ｐ_ｘ（ａ_ｉ）、式中、Ｘ～ＢｅｔａＢｉｎｏｍ（ｐ（Ａ）＋ｗ_ｉ、ａ_ｉ＋ｂ_ｉ、ｓ）、

【0491】

いくつかの実施形態において、本方法は、追加のノイズ、差分サンプル品質、差分ＳＮＰ品質、及びランダムサンプリングバイアスを特に考慮するように書かれてもよい。この一例をここに挙げる。この方法は、大規模に多重化されたミニＰＣＲプロトコルを使用して生成されたデータの文脈において特に有用であることが示されており、実験７～１３で使用された。この方法は、各々が異なる種類のノイズ及び／又はバイアスを最終モデルに導入するいくつかの工程を含む。

【0492】

（１）母体ＤＮＡ及び胎児ＤＮＡの混合物を含む第１のサンプルが、通常１，０００～４０，０００の範囲のサイズ＝Ｎ_０分子のＤＮＡの元の量を含有すると仮定し、ｐ＝ｔｕｒｅ％ｒｅｆｓ

【0493】

（２）ユニバーサルライゲーションアダプターを用いた増幅では、Ｎ_１分子がサンプリングされていると仮定し、通常はＮ_１～Ｎ_０／２分子であり、サンプリングによりランダムサンプリングバイアスが導入される。増幅されたサンプルは、いくつかの分子Ｎ_２（Ｎ_２＞＞Ｎ_１）を含有してもよい。Ｘ_１は、Ｎ_１個のサンプリングされた分子のうち（ＳＮＰごとに）の参照遺伝子座の量を表し、ｐ_１＝Ｘ_１／Ｎ_１の変動は、プロトコルの残りの部分を通してランダムサンプリングバイアスを導入する。このサンプリングバイアスは、単純な二項分布モデルを使用するのではなく、ベータ二項（ＢＢ）分布を使用することによってモデルに含まれる。ベータ二項分布のパラメータＮは、０＜ｐ＜１のＳＮＰ上で、漏れ及び増幅バイアスを調整した後のトレーニングデータから、サンプルごとに後で推定され得る。漏れは、ＳＮＰが誤って読み取られる傾向である。

【0494】

（３）増幅工程は、任意の対立遺伝子バイアスを増幅し、したがって、可能性のある不均一な増幅のために導入される増幅バイアスを増幅する。ある遺伝子座での１つの対立遺伝子が、その遺伝子座での別の対立遺伝子がｇ倍に増幅されると仮定し、式中、ｆ＝ｇｅ^ｂ、式中、ｂ＝０は、バイアスを示さない。バイアスパラメータｂは、０を中心とし、特定のＳＮＰ上のＢ対立遺伝子とは対照的に、Ａ対立遺伝子がどの程度増幅されるかを示す。パラメータｂは、ＳＮＰからＳＮＰまで異なる場合がある。バイアスパラメータｂは、例えば、トレーニングデータから、ＳＮＰごとに推定されてもよい。

【0495】

（４）配列決定工程は、増幅された分子のサンプルの配列決定を伴う。この工程では、漏れがある可能性があり、漏れは、ＳＮＰが誤って読み取られる状況である。漏れは、任意の数の問題に起因し得、ＳＮＰは、正しい対立遺伝子Ａとしてではなく、その遺伝子座に見出される別の対立遺伝子Ｂとして、又はその遺伝子座に典型的には見出されない対立遺伝子Ｃ又はＤとして読み出され得る。配列決定が、サイズＮ_３の増幅されたサンプルからのいくつかのＤＮＡ分子の配列データを測定すると仮定し、Ｎ_３＜Ｎ_２である。いくつかの実施形態において、Ｎ_３は、２０，０００～１００，０００、１００，０００～５００，０００、５００，０００～４，０００，０００、４，０００，０００～２０，０００，０００、又は２０，０００，０００～１００，０００，０００の範囲内であってもよい。サンプリングされた各分子は、正しく読み取られる確率ｐ_ｇを有し、その場合、対立遺伝子Ａとして正しく現れる。サンプルは、確率１－ｐ_ｇで元の分子と無関係の対立遺伝子として誤って読み取られ、確率ｐ_ｒの対立遺伝子Ａ、確率ｐ_ｍの対立遺伝子Ｂ、又は確率ｐ_ｏの対立遺伝子Ｃ又は対立遺伝子Ｄのように見え、ｐ_ｒ＋ｐ_ｍ＋ｐ_ｏ＝１である。パラメータｐ_ｇ、ｐ_ｒ、ｐ_ｍ、ｐ_ｏは、トレーニングデータからＳＮＰごとに推定される。

【0496】

異なるプロトコルは、異なる量のランダムサンプリング、異なるレベルの増幅、及び異なる漏れバイアスをもたらす、分子生物学的工程の変動を伴う同様の工程を伴い得る。以下のモデルは、これらの場合の各々に等しくよく適用され得る。ＳＮＰごとにサンプリングされるＤＮＡの量のモデルは、以下によって与えられ：
Ｘ_３～ＢｅｔａＢｉｎｏｍｉａｌ（Ｌ（Ｆ（ｐ，ｂ），ｐ_ｒ，ｐ_ｇ）、Ｎ＊Ｈ（ｐ，ｂ））
式中、ｐ＝参照ＤＮＡの真の量、ｂ＝ＳＮＰバイアス当たり、及び上述のように、ｐ_ｇは、正しいリードの確率であり、ｐ_ｒは、リードが誤って読み取られたが、誤ったリードの場合には、正しい対立遺伝子のように偶然に見える確率であり、
Ｆ（ｐ，ｂ）＝ｐｅ^ｂ／（ｐｅ^ｂ＋（１－ｐ））、Ｈ（ｐ，ｂ）＝（ｅ^ｂｐ＋（１－ｐ））^２／ｅ^ｂ、Ｌ（ｐ，ｐ_ｒ，ｐ_ｇ）＝ｐ＊ｐ_ｇ＋ｐ_ｒ＊（１－ｐ_ｇ）。

【0497】

いくつかの実施形態において、本方法は、単純な二項分布の代わりにベータ二項分布を使用する；これは、ランダムサンプリングバイアスを考慮したものである。ベータ二項分布のパラメータＮは、必要に応じてサンプル単位で推定される。バイアス補正Ｆ（ｐ，ｂ）を使用して、ｐだけではなくＨ（ｐ，ｂ）が増幅バイアスを考慮する。バイアスのパラメータｂは、事前にトレーニングデータからＳＮＰごとに推定される。

【0498】

いくつかの実施形態において、本方法は、ｐのみの代わりに、漏れ補正Ｌ（ｐ，ｐ_ｒ，ｐ_ｇ）を使用し、これは、漏れバイアス、すなわち、ＳＮＰ及びサンプル品質の変化を考慮する。いくつかの実施形態において、パラメータｐ_ｇ、ｐ_ｒ、ｐ_ｏは、事前にトレーニングデータからＳＮＰごとに推定される。いくつかの実施形態において、パラメータｐ_ｇ、ｐ_ｒ、ｐ_ｏは、サンプルの品質が変化することを考慮して、その時点のサンプルで更新することができる。

【0499】

本明細書に記載されるモデルは、非常に一般的であり、差動サンプル品質及び差動ＳＮＰ品質の両方を説明することができる。異なるサンプル及びＳＮＰは、いくつかの実施形態が、ＤＮＡの元の量、並びにサンプル及びＳＮＰ品質の関数であるベータ二項分布を使用するという事実によって例示されるように、異なって扱われる。

【0500】

プラットフォームモデリング
血漿中に存在する対立遺伝子比率の予測値がｒである単一のＳＮＰを考慮する（母体及び胎児の遺伝子型に基づく）。対立遺伝子比率の予測値は、母体及び胎児のＤＮＡを組み合わせたＡ対立遺伝子の予測された画分として定義される。母系遺伝子型ｇ_ｍ及び子の遺伝子型ｇ_ｃについて、遺伝子型が対立遺伝子比率としても表されると仮定して、対立遺伝子比率の予測値を式１で示す。
ｒ＝ｆｇ_ｃ＋（１－ｆ）ｇ_ｍ（１）

【0501】

ＳＮＰでの観測は、各対立遺伝子が存在するマッピングされたリードの数ｎ_ａ及びｎ_ｂからなり、これはリード深度ｄを合計する。マッピング及び対立遺伝子の観察が正しいとみなすことができるように、閾値が既にマッピング確率及びｐｈｒｅｄスコアに適用されていると仮定する。Ｐｈｒｅｄスコアは、特定の塩基における特定の測定値が間違っている確率に関連する数値測定値である。塩基が配列決定によって測定された一実施形態において、ｐｈｒｅｄスコアは、コールされた塩基に対応する染料強度と他の塩基の染料強度との比率から計算されてもよい。観察尤度についての最も単純なモデルは、ｄリードの各々が対立遺伝子比率ｒを有する大きなプールから独立して引き出されると仮定する二項分布である。式２は、このモデルを説明する。

【数92】

【0502】

二項モデルは、いくつかの方法で拡張することができる。母体及び胎児の遺伝子型が全てＡ又は全てＢのいずれかである場合、血漿中の対立遺伝子比率の予測値は０又は１となり、二項確率は十分に定義されない。実際には、予期しない対立遺伝子が実際に観察されることがある。一実施形態において、少数の予期しない対立遺伝子を可能にする

【数93】

ために、修正された対立遺伝子比を使用することが可能である。一実施形態において、トレーニングデータを使用して、各ＳＮＰ上に現れる予期しない対立遺伝子の割合をモデル化し、このモデルを使用して、予測される対立遺伝子比を修正することが可能である。対立遺伝子比率の予測値が０又は１でない場合、増幅バイアス又は他の現象のため、観察される対立遺伝子比率は、対立遺伝子比率の予測値に対する十分に高いリード深度で収束しない場合がある。対立遺伝子比率は、次に、対立遺伝子比率の予測値を中心としたベータ分布としてモデル化することができ、二項分布よりも高い分散を有するＰ（ｎ_ａ、ｎ_ｂ｜ｒ）のベータ二項分布につながる。

【0503】

単一のＳＮＰでの応答のためのプラットフォームモデルは、Ｆ（ａ，ｂ，ｇ_ｃ，ｇ_ｍ，ｆ）（３）、又は、母体及び胎児の遺伝子型を考慮して、ｎ_ａ＝ａ及びｎ_ｂ＝ｂを観測する確率として定義され、これはまた、式１を通して胎児画分に依存する。Ｆの機能形態は、二項分布、ベータ二項分布、又は上述のような類似の機能であってもよい。
Ｆ（ａ，ｂ，ｇ_ｃ，ｇ_ｍ，ｆ）＝Ｐ（ｎ_ａ＝ａ，ｎ_ｂ＝ｂ｜ｇ_ｃ，ｇ_ｍ，ｆ）＝Ｐ（ｎ_ａ＝ａ，ｎ_ｂ＝ｂ｜ｒ（ｇ_ｃ，ｇ_ｍ，ｆ））（３）

【0504】

一実施形態において、子画分は、以下のように決定されてもよい。出生前検査のための胎児画分ｆの最大尤度推定値は、父親の情報を使用することなく導出され得る。これは、父親の遺伝子データが利用できない場合、例えば、記録の父親が実際には胎児の遺伝的父親ではない場合に関連し得る。胎児画分は、母系遺伝子型が０又は１であるＳＮＰのセットから推定され、２つの可能な胎児遺伝子型のセットのみをもたらす。Ｓ_０を、母系遺伝子型０を有するＳＮＰのセットとして、及びＳ_１を、母系遺伝子型１を有するＳＮＰのセットとして定義する。Ｓ_０上の可能な胎児遺伝子型は、０及び０．５であり、結果として、可能な対立遺伝子比Ｒ_０（ｆ）＝｛０，ｆ／２｝のセットをもたらす。同様に、Ｒ_１（ｆ）＝｛１－ｆ／２，１｝である。この方法は、母系遺伝子型が０．５であるＳＮＰを含むようにわずかに拡張することができるが、これらのＳＮＰは、可能な対立遺伝子比のセットが大きいため、情報量が少ないであろう。

【0505】

Ｎ_ａ０及びＮ_ｂ０を、Ｓ_０のＳＮＰｓについてはｎ_ａｓ及びｎ_ｂｓ、Ｓ_１についてはＮ_ａ１及びＮ_ｂ１によって同様に形成されるベクトルとして定義する。ｆの最大尤度推定値

【数94】

は、式４によって定義される。

【数95】

【0506】

各ＳＮＰでの対立遺伝子数が、ＳＮＰの血漿対立遺伝子比に独立して条件付けられていると仮定すると、確率は、各セットにおけるＳＮＰ上の生成物として表すことができる（５）。

【数96】

【0507】

ｆへの依存性は、可能な対立遺伝子比Ｒ_０（ｆ）及びＲ_１（ｆ）のセットを通してである。ＳＮＰ確率Ｐ（ｎ_ａｓ，ｎ_ｂｓ｜ｆ）は、ｆに条件付けられた最大尤度遺伝子型を仮定することによって概算することができる。適度に高い胎児画分及びリード深度では、最大尤度遺伝子型の選択は、高い信頼性となるであろう。例えば、１０％の胎児画分及び１０００のリード深度において、母親がゼロ遺伝子型を有するＳＮＰを考慮する。対立遺伝子比率は、０及び５％であり、これは、十分に高いリード深度で容易に区別可能である。推定される子の遺伝子型の式５への置換は、胎児画分推定の完全な式（６）をもたらす。

【数97】

【0508】

胎児画分は［０，１］の範囲でなければならないため、最適化は制約付きの一次元検索によって容易に実装できる。

【0509】

低いリード深度又は高いノイズレベルの存在下では、最大尤度遺伝子型を想定しないことが好ましく、これは人工的に高い信頼性をもたらす可能性がある。別の方法は、各ＳＮＰでの可能性のある遺伝子型を合計することであり、Ｓ_０におけるＳＮＰについてのＰ（ｎ_ａ，ｎ_ｂ｜ｆ）についての以下の式（７）をもたらす。事前確率Ｐ（ｒ）は、Ｒ_０（ｆ）にわたって均一であると仮定することができ、又は集団頻度に基づいていてもよい。群Ｓ_１への拡張は自明である。

【数98】

【0510】

いくつかの実施形態において、確率は、以下のように導出されてもよい。信頼度は、２つの仮説Ｈ_ｔ及びＨ_ｆのデータ尤度から計算することができる。各仮説の尤度は、応答モデル、推定胎児画分、母系遺伝子型、対立遺伝子集団頻度、及び血漿対立遺伝子数に基づいて導き出される。

【0511】

以下の表記を定義する：

【表8】

【0512】

各ＳＮＰでの観察が血漿対立遺伝子比に独立して条件付けられていると仮定すると、父性仮説の尤度は、ＳＮＰ上の尤度の積である。以下の方程式は、単一ＳＮＰの尤度を導き出す。式８は、任意の仮説ｈの尤度の一般式であり、次いで、Ｈ_ｔ及びＨ_ｆの特定の場合に分解される。

【数99】

【0513】

Ｈ_ｔの場合、父親とされる人物は真の父親であり、胎児の遺伝子型は、式９に従って、母系遺伝子型及び父親とされる父系遺伝子型から継承される。

【数100】

【0514】

Ｈ_ｆの場合、父親とされる父親は真の父親ではない。真の父系遺伝子型の最良の推定値は、各ＳＮＰでの集団頻度によって与えられる。したがって、子供の遺伝子型の確率は、式１０のように、既知の母系遺伝子型及び集団の頻度によって決定される。

【数101】

【0515】

正しい父性に関する信頼度Ｃ_ｐは、ベイズ法則（１１）を使用して、２つの尤度のＳＮＰにわたる積から計算される。

【数102】

【0516】

胎児画分パーセントを用いた最大尤度モデル
母親の血清に含まれる遊離浮遊ＤＮＡを測定することによって、又は任意の混合サンプル中の遺伝子型物質を測定することによって、胎児の倍数性状態を決定することは、自明ではない。いくつかの方法が存在し、例えば、胎児が特定の染色体においてトリソミックである場合、母体血液中に見出されるその染色体からのＤＮＡの全量は、参照染色体に対して上昇すると推定されるリードカウント分析を実行する。そのような胎児におけるトリソミーを検出する１つの方法は、例えば、所与の染色体に対応する分析セット内のＳＮＰの数に従って、又は染色体の一意にマッピング可能な部分の数に従って、各染色体に予測されるＤＮＡの量を正規化することである。測定が正規化されると、測定されるＤＮＡの量が特定の閾値を超える任意の染色体は、トリソミックであると決定される。このアプローチは、Ｆａｎ，ｅｔａｌ．ＰＮＡＳ，２００８；１０５（４２）；ｐｐ．１６２６６－１６２７１，、及びＣｈｉｕｅｔａｌ．ＢＭＪ２０１１；３４２：ｃ７４０１にも記載されている。Ｃｈｉｕらの論文では、以下のようにＺスコアを計算することによって、正規化を達成した。
試験症例における染色体２１のパーセンテージのＺスコア＝（（試験症例における染色体２１のパーセンテージ）－（参照対照における染色体２１の平均パーセンテージ））／（参照対照における染色体２１のパーセンテージの標準偏差）。

【0517】

これらの方法は、単一仮説否定法を使用して胎児の倍数性状態を決定する。しかしながら、これらにはいくつかの重大な欠点がある。胎児における倍数性を決定するためのこれらの方法は、サンプル中の胎児ＤＮＡの割合に応じて不変であるため、それらは１つのカットオフ値を使用する；その結果、決定の精度が最適ではなく、混合物中の胎児ＤＮＡの割合が比較的低い場合、最悪の精度を受ける。

【0518】

一実施形態において、本開示の方法を使用して、胎児の倍数性状態を決定することは、サンプル中の胎児ＤＮＡの画分を考慮することを伴う。本開示の別の実施形態において、本方法は、最大尤度推定の使用を伴う。一実施形態において、本開示の方法は、胎児又は胎盤由来のサンプル中のＤＮＡの割合を計算することを伴う。一実施形態において、異数体をコールするための閾値は、計算された胎児ＤＮＡパーセントに基づいて適応調整される。いくつかの実施形態において、ＤＮＡの混合物中の胎児起源のＤＮＡのパーセンテージを推定するための方法は、母親からの遺伝物質及び胎児からの遺伝物質を含む混合サンプルを得ることと、胎児の父親からの遺伝サンプルを得ることと、混合サンプル中のＤＮＡを測定することと、父親サンプル中のＤＮＡを測定することと、混合サンプル、及び父親サンプルのＤＮＡ測定を使用して混合サンプル中の胎児起源のＤＮＡのパーセンテージを計算することとを含む。

【0519】

本開示の一実施形態において、混合物中の胎児ＤＮＡの画分又は胎児ＤＮＡの割合を測定することができる。いくつかの実施形態において、画分は、胎児ＤＮＡと母体ＤＮＡとの混合物である母体血漿サンプル自体に対して行われた遺伝子型決定測定値のみを使用して計算することができる。いくつかの実施形態において、画分は、また、母親の測定された又は他の方法で既知の遺伝子型及び／又は父親の測定された又は他の方法で既知の遺伝子型を使用して計算されてもよい。いくつかの実施形態において、胎児ＤＮＡの割合は、親のコンテキストの知識とともに、母体ＤＮＡと胎児ＤＮＡとの混合物に対してなされる測定値を使用して計算されてもよい。一実施形態において、胎児ＤＮＡの画分は、集団頻度を使用して計算されてもよく、特定の対立遺伝子の測定における確率に基づいてモデルを調整する。

【0520】

【0521】

一実施形態において、本明細書に開示される方法を使用して、母体及び胎児の遺伝物質の混合物中の母体及び胎児の標的染色体のコピー数を決定することによって、胎児の異数体を決定することができる。この方法は、母体及び胎児の遺伝物質の両方を含む母体組織を得ることを伴い得る。いくつかの実施形態において、この母体組織は、母体血漿又は母体血液から単離された組織であり得る。この方法はまた、当該母体組織を処理することによって、母体組織から母体及び胎児の遺伝物質の混合物を得ることを伴い得る。この方法は、取得された遺伝物質を複数の反応サンプルに分配し、標的染色体からの標的配列を含む個々の反応サンプルと、標的染色体からの標的配列を含まない個々の反応サンプルとをランダムに提供し、例えば、サンプルに対して高スループット配列決定を実行することを伴い得る。この方法は、当該個々の反応サンプル中に存在するか又は存在しない遺伝物質の標的配列を分析して、反応サンプル中の可能性のある正倍数体胎児染色体の有無を表す第１の数のバイナリ結果と、反応サンプル中のおそらく異数体胎児染色体の有無を表す第２の数のバイナリ結果とを提供することを伴い得る。バイナリ結果の数のいずれかは、例えば、特定の染色体、染色体の特定の領域、特定の遺伝子座又は遺伝子座のセットにマッピングする配列リードをカウントする情報技術によって計算され得る。この方法は、染色体の長さ、染色体の領域の長さ、又はセット中の遺伝子座の数に基づいて、二項イベントの数を正規化することを伴っていてもよい。この方法は、第１の数値を使用して、反応サンプル中のおそらく正倍数体胎児染色体の二値結果の数の予測分布を計算することを伴い得る。この方法は、混合物中に見出される胎児ＤＮＡの第１の数及び予測画分を使用して、例えば、推定異数体胎児染色体のバイナリ結果の数の予測リードカウント分布に、（１＋ｎ／２）（式中、ｎは推定胎児画分）を乗じて、反応サンプル中の推定異数体胎児染色体のバイナリ結果の数の予測分布を計算することを伴い得る。いくつかの実施形態において、配列リードは、バイナリ結果ではなく、確率的マッピングで処理されてもよく、この方法は、より高い精度をもたらすが、より高い計算能力を必要とする。胎児画分は、複数の方法によって推定され得、そのうちのいくつかは、本開示の別の箇所に記載されている。この方法は、最大尤度アプローチを使用して、第２の数が、可能性のある異数体胎児染色体が正倍数体であるか、又は異数体であるかに対応するかどうかを決定することを伴っていてもよい。この方法は、胎児の倍数性状態を、測定データを考慮して正しい尤度が最大であるという仮説に対応する倍数性状態と呼ぶことを伴っていてもよい。

【0522】

最大尤度モデルの使用を使用して、胎児の倍数性状態を決定する任意の方法の精度を高めることができることに留意されたい。同様に、信頼度は、胎児の倍数性状態を決定する任意の方法について計算され得る。最大尤度モデルの使用は、単一仮説否定技術を使用して倍数決定が行われる任意の方法の精度の改善をもたらすであろう。最大尤度モデルは、正規事例及び異常事例の両方について尤度分布を計算できる任意の方法に使用されてもよい。最大尤度モデルの使用は、倍数性コールの信頼度を計算する能力を意味する。

【0523】

本方法の更なる考察
一実施形態において、本明細書に開示される方法は、多型遺伝子座における各対立遺伝子の独立した観察の数の定量的尺度を利用し、これは、対立遺伝子の比率の計算を伴わない。これは、遺伝子座における２つの対立遺伝子の比に関する情報を提供するが、いずれかの対立遺伝子の独立した観察の数を定量化しない、いくつかのマイクロアレイベースの方法などの方法とは異なる。当該技術分野で既知のいくつかの方法は、独立した観察の数に関する定量的情報を提供することができるが、倍数決定につながる計算は、対立遺伝子比のみを利用し、定量的情報を利用しない。独立した観察の数に関する情報を保持することの重要性を説明するために、２つの対立遺伝子、Ａ及びＢを有するサンプル遺伝子座を考慮する。第１の実験では、２０個のＡ対立遺伝子及び２０個のＢ対立遺伝子が観察され、第２の実験では、２００個のＡ対立遺伝子及び２００個のＢ対立遺伝子が観察される。両方の実験において、比（Ａ／（Ａ＋Ｂ））は、０．５に等しいが、第２の実験は、Ａ又はＢ対立遺伝子の頻度の確実性について第１の情報よりも多くの情報を伝達する。本方法は、対立遺伝子比を利用するのではなく、定量的データを使用して、各多型遺伝子座で最も可能性の高い対立遺伝子頻度をより正確にモデル化する。

【0524】

一実施形態において、本方法は、複数の多型遺伝子座からの測定値を集約するための遺伝子モデルを構築して、トリソミーをダイソミーからより良く区別し、また、トリソミーの種類を決定する。追加的に、本方法は、遺伝子連鎖情報を組み込んで、本方法の精度を強化する。これは、染色体上の全ての多型遺伝子座にわたって対立遺伝子比が平均化される、当該技術分野で既知のいくつかの方法とは対照的である。本明細書に開示される方法は、減数分裂Ｉ中の不分離、減数分裂ＩＩ中の不分離、及び胎児発達の早い段階での有糸分裂中の不分離に起因する対立遺伝子頻度分布並びにトリソミーにおいて予測される対立遺伝子頻度分布を明示的にモデル化する。これが重要である理由を説明するために、乗換えがなかった場合、減数分裂中の不分離Ｉは、２つの異なる相同体が一方の親から継承されたトリソミーをもたらし、減数分裂ＩＩ中又は胎児発達の早期での有糸分裂中の不分離は、一方の親からの同じ相同体の２つのコピーをもたらす。各シナリオは、各多型遺伝子座で異なる予測される対立遺伝子頻度をもたらし、また、共同で考慮される全ての物理的に結合された遺伝子座（すなわち、同じ染色体上の遺伝子座）でも生じる。相同体間の遺伝物質の交換をもたらす乗換えは、遺伝パターンをより複雑にするが、本方法は、遺伝子連鎖情報、すなわち組換え率情報及び遺伝子座間の物理的距離を使用することによってこれに対応する。減数分裂Ｉ不分離と、減数分裂ＩＩ不分離又は有糸分裂不分離とをより良く区別するために、本方法は、セントロメアからの距離が増加するにつれて乗換えの確率が増加することをモデルに組み込む。減数分裂ＩＩ不分離及び有糸分裂不分離は、有糸分裂不分離が、典型的には１つの相同体の同一又はほぼ同一のコピーをもたらすが、減数分裂ＩＩ不分離事象に続いて存在する２つの相同体は、配偶子形成中の１つ以上の乗換えによって異なることが多いという事実によって区別され得る。

【0525】

一実施形態において、本開示の方法は、ダイソミーが想定される場合、親のハプロタイプを決定しない場合がある。一実施形態において、トリソミーの場合、本方法は、血漿が一方の親から２つのコピーを取るという事実を使用することによって、一方又は両方の親のハプロタイプについての決定を行うことができ、親の位相情報は、問題の親からどの２つのコピーが継承されたかに留意することによって決定することができる。具体的には、子は、親の同じコピーのうちの２つ（マッチするトリソミー）又は親の両方のコピー（マッチしないトリソミー）のいずれかを継承することができる。各ＳＮＰにおいて、マッチするトリソミー及びマッチしないトリソミーの尤度を計算することができる。乗換えを考慮した連結モデルを使用しない倍数性コール法は、全ての染色体にわたるマッチする及びマッチしないトリソミーの単純な重み付けされた平均として、トリソミーの全体的な尤度を計算する。しかしながら、分離誤差及び乗換えをもたらす生物学的メカニズムに起因して、トリソミーは、乗換えが生じた場合にのみ、染色体上でマッチするからマッチしない（及びその逆）に変化することができる。本方法は、確率的に乗換えの尤度を考慮し、そうでない方法よりも高い精度の倍数性コールをもたらす。

【0526】

一実施形態において、参照染色体を使用して、子画分及びノイズレベルの量又は確率分布を決定する。一実施形態において、子の画分、ノイズレベル、及び／又は確率分布は、倍数性状態が決定されている染色体から利用可能な遺伝子情報のみを使用して決定される。本方法は、参照染色体なしで、並びに特定の子画分又はノイズレベルを固定することなく機能する。これは、参照染色体からの遺伝子データが、子画分及び染色体の挙動を較正するために必要とされる当該技術分野で既知の方法からの著しい改善及び差別化のポイントである。

【0527】

胎児画分を決定するために参照染色体が必要とされない実施形態において、仮説を決定することは、以下のように行われる。

【数103】

【0528】

参照染色体を有するアルゴリズムでは、典型的には、参照染色体がダイソミーであると仮定し、次いで、（ａ）この仮定及び参照染色体データに基づいて、最も可能性の高い子画分及びランダムノイズレベルＮを固定してもよい：

【数104】

【0529】

次いで以下を低減する
ＬＩＫ（Ｄ｜Ｈ）＝ＬＩＫ（Ｄ｜Ｈ，ｃｆｒ^＊，Ｎ^＊）
又は（ｂ）この仮定及び参照染色体データに基づいて、子画分及びノイズレベル分布を推定する。具体的には、ｃｆｒ及びＮの値を１つだけ固定するのではなく、可能性のあるｃｆｒ、Ｎ値のより広い範囲に確率ｐ（ｃｆｒ，Ｎ）を割り当てる：
ｐ（ｃｆｒ，Ｎ）～ＬＩＫ（Ｄ（参照染色体）｜Ｈ１１，ｃｆｒ，Ｎ）＊ｐｒｉｏｒｐｒｏｂ（ｃｆｒ，Ｎ）
ｐｒｉｏｒｐｒｏｂ（ｃｆｒ，Ｎ）は、事前の知識及び実験によって決定される、特定の子画分及びノイズレベルの事前の確率である。所望な場合、ｃｆｒ、Ｎの範囲にわたって均一なだけである。次いで、以下のように書くことができる：

【数105】

【0530】

上記の両方の方法は、良好な結果をもたらす。

【0531】

いくつかの例では、参照染色体を使用することは、望ましくない、可能でない、又は実行可能でないことに留意されたい。このような場合、染色体ごとに別々に最良の倍数性コールを導出することが可能である。具体的には、

【数106】

ｐ（ｃｆｒ，Ｎ｜Ｈ）は、上記のように決定されてもよく、各染色体については、仮説Ｈを仮定して、ダイソミーを仮定している参照染色体についてだけでなく、別々に決定されてもよい。この方法を使用して、ノイズ及び子画分パラメータの両方を固定したままにするか、パラメータのいずれかを固定するか、又は各染色体及び各仮説について両方のパラメータを確率的な形で維持することが可能である。

【0532】

ＤＮＡの測定は、ノイズ及び／又はエラーが発生しやすく、特に、ＤＮＡの量が少ない場合、又はＤＮＡが汚染ＤＮＡと混合されている場合の測定である。このノイズは、より正確な遺伝子型データ、及びより正確な倍数性コールをもたらす。いくつかの実施形態において、プラットフォームモデリング又はノイズモデリングのいくつかの他の方法を使用して、倍数性決定に対するノイズの有害な影響に対抗してもよい。本方法は、入力ＤＮＡの量、ＤＮＡ品質、及び／又はプロトコル品質に起因するランダムノイズを説明する、両方のチャネルの共同モデルを使用する。

【0533】

これは、遺伝子座における対立遺伝子強度の比率を用いて倍数決定がなされる、当該技術分野で既知のいくつかの方法とは対照的である。この方法は、正確なＳＮＰノイズモデリングを排除する。具体的には、測定値の誤差は、典型的には、測定されたチャネル強度比に特異的に依存せず、モデルの一次元情報を使用するように縮小する。ノイズ、チャネル品質、及びチャネル相互作用の正確なモデリングには、対立遺伝子比を使用してモデル化できない二次元結合モデルが必要である。

【0534】

具体的には、ｆ（ｘ，ｙ）がｒ＝ｘ／ｙである比率ｒに２つのチャネル情報を投影することは、それ自体が正確なチャネルノイズ及びバイアスモデリングに役立たない。特定のＳＮＰ上のノイズは、比率、すなわちノイズ（ｘ，ｙ）≠ｆ（ｘ，ｙ）の関数ではなく、実際には両方のチャネルの結合関数である。例えば、二項モデルでは、測定された比率のノイズは、純粋にｒの関数ではないｒ（１－ｒ）／（ｘ＋ｙ）の分散を有する。任意のチャネルバイアス又はノイズが含まれるそのようなモデルでは、ＳＮＰｉ上で、観察されたチャネルＸ値がｘ＝ａ_ｉＸ＋ｂ_ｉであり、式中、Ｘは真のチャネル値であり、ｂ_ｉは余分なチャネルバイアス及びランダムノイズであると仮定する。同様に、ｙ＝ｃ_ｉＹ＋ｄ_ｉと仮定する。観測された比率ｒ＝ｘ／ｙは、（ａｉＸ＋ｂｉ）／（ｃｉＹ＋ｄｉ）がＸ／Ｙの関数ではないため、真の比率Ｘ／Ｙを正確に予測することも、残余ノイズをモデル化することもできない。

【0535】

本明細書に開示される方法は、測定チャネルの全てのジョイント二項分布を個別に使用してノイズ及びバイアスをモデル化する効果的な方法を説明する。関連する方程式は、ＳＮＰ挙動を効果的に調整するＳＮＰ一貫性バイアス、Ｐ（良い）及びＰ（参照｜悪い）、Ｐ（ｍｕｔ｜悪い）ごとに言及するセクションにおいて、文書の他の場所に見出すことができる。一実施形態において、本開示の方法は、ベータ二項分布を使用し、これは、対立遺伝子比のみに依存するという制限的な慣行を回避し、代わりに、両方のチャネルカウントに基づいて挙動をモデル化する。

【0536】

一実施形態において、本明細書に開示される方法は、利用可能な全ての測定値を使用することによって、母体血漿中に見出される遺伝子データから、妊娠中の胎児の倍数性をコールすることができる。一実施形態において、本明細書に開示される方法は、親コンテキストの部分集合のみからの測定値を使用することによって、母体血漿中に見出される遺伝子データから妊娠中の胎児の倍数性をコールすることができる。当該技術分野で既知のいくつかの方法は、親コンテキストがＡＡ｜ＢＢコンテキストからのものである、すなわち、親が所与の遺伝子座で両方ともホモ接合であるが、異なる対立遺伝子についての測定された遺伝子データのみを使用する。この方法の１つの問題は、小さい割合の多型遺伝子座が、典型的には、１０％未満のＡＡ｜ＢＢコンテキストに由来することである。本明細書に開示される方法の一実施形態において、本方法は、親コンテキストがＡＡ｜ＢＢである遺伝子座において作製された母体血漿の遺伝子測定を使用しない。一実施形態において、本方法は、ＡＡ｜ＡＢ、ＡＢ｜ＡＡ、及びＡＢ｜ＡＢ親コンテキストを有するそれらの多型遺伝子座についてのみ血漿測定を使用する。

【0537】

当該技術分野で既知のいくつかの方法は、両方の親遺伝子型が存在する、ＡＡ／ＢＢコンテキストにおけるＳＮＰからの対立遺伝子比を平均化することを含み、これらのＳＮＰ上の平均対立遺伝子比からの倍数性コールを決定すると主張する。この方法は、差動ＳＮＰ挙動による著しい不正確さに苦しむ。なお、この方法は、両方の親遺伝子型を有することが既知であると仮定する。対照的に、いくつかの実施形態において、本方法は、親のいずれの存在も想定せず、一様なＳＮＰ挙動を想定しない結合チャネル分布モデルを使用する。いくつかの実施形態において、本方法は、異なるＳＮＰ挙動／重み付けを説明する。いくつかの実施形態において、本方法は、親遺伝子型の一方又は両方の知識を必要としない。本方法がこれをどのように達成し得るかの例は、以下の通りである：

【0538】

いくつかの実施形態において、仮説の対数尤度は、ＳＮＰごとに定量されてもよい。特定のＳＮＰｉでは、胎児倍数性仮説Ｈ及び胎児ＤＮＡの割合ｃｆを仮定して、観察されたデータＤの対数尤度を以下のように定義する：

【数107】

式中、ｍは真の母系遺伝子型である可能性があり、ｆは真の父系遺伝子型である可能性があり、式中、ｍ、ｆ∈｛ＡＡ，ＡＢ，ＢＢ｝、及びｃは、仮説Ｈが与えられた場合、子の遺伝子型である可能性がある。具体的には、モノソミーｃ｛Ａ，Ｂ｝について、ダイソミーｃ∈｛ＡＡ，ＡＢ，ＢＢ｝について、トリソミーｃ∈｛ＡＡＡ，ＡＡＢ，ＡＢＢ，ＢＢＢ｝についてである。親遺伝子型データを含めることは、典型的には、より正確な倍数性決定をもたらすが、親の遺伝子型データは、本方法がうまく機能するために必要ではないことに留意されたい。

【0539】

当該技術分野で既知のいくつかの方法は、母親がホモ接合であるが、異なる対立遺伝子が血漿（ＡＡ｜ＡＢ又はＡＡ｜ＢＢのいずれかのコンテキスト）で測定されるＳＮＰからの対立遺伝子比を平均化することを含み、これらのＳＮＰ上の平均対立遺伝子比からの倍数性コールを決定すると主張する。この方法は、父系遺伝子型が利用できない場合を意図している。血漿がホモ接合性で反対側の父ＢＢの存在なしに特定のＳＮＰ上でヘテロ接合性であると主張することがどれほど正確であるかは疑問であることに留意されたい。子供の画分が低い症例では、Ｂ対立遺伝子の存在のように見えるものは、ノイズの存在だけである可能性があり、更に、Ｂが存在しないように見えるものは、胎児測定からの単純な対立遺伝子のドロップアウトである可能性がある。血漿のヘテロ接合度を実際に決定できる場合であっても、この方法では、父系三染色体を区別することはできない。具体的には、母親がＡＡであり、いくつかのＢが血漿中で測定されるＳＮＰについては、父親がＧＧである場合、得られた子の遺伝子型はＡＧＧであり、平均比率は３３％Ａ（子画分＝１００％）をもたらす。しかしながら、父親がＡＧである場合、得られた子供の遺伝子型は、マッチするトリソミーのＡＧＧ（３３％Ａ比率に寄与する）、又はマッチしないトリソミーのＡＡＧ（６６％Ａに向かって平均比率を引き出す）であり得る。多くのトリソミーが乗換えを有する染色体上にあることを考えると、全体的な染色体は、マッチしないトリソミーと全てのマッチしないトリソミーとの間の任意の場所を有し得るため、この比率は、３３～６６％の任意の場所で変化し得る。プレーンダイソミーの場合、比率は約５０％でなければならない。連結モデル又は平均の正確な誤差モデルを使用しないと、この方法は父系トリソミーの多くの症例を見逃すことになる。対照的に、本明細書に開示される方法は、利用可能な遺伝子型情報及び集団頻度に基づいて、各親遺伝子型候補の親遺伝子型確率を割り当て、親遺伝子型を明示的に必要としない。追加的に、本明細書に開示される方法は、親遺伝子型データの有無にかかわらず、トリソミーを検出することができ、連結モデルを使用して、マッチするトリソミーからマッチしないトリソミーへの可能性のある乗換えの点を特定することによって、補償することができる。

【0540】

当該技術分野で既知のいくつかの方法は、母系又は父系遺伝子型が知られていないＳＮＰからの対立遺伝子比を平均化する方法、及びこれらのＳＮＰ上の平均比からの倍数性コールを決定する方法を主張する。しかしながら、これらの目的を達成する方法は開示されていない。本明細書に開示される方法は、そのような状況で正確な倍数性コールを行うことができ、実践への還元は、結合確率最大尤度法を使用し、任意選択で、ＳＮＰノイズ及びバイアスモデル、並びに連結モデルを利用して、本明細書の他の箇所に開示される。

【0541】

当該技術分野で既知のいくつかの方法は、対立遺伝子比を平均化することを伴い、１つ又はいくつかのＳＮＰでの平均対立遺伝子比から倍数性コールを決定すると主張する。しかしながら、このような方法は、連結の概念を利用しない。本明細書に開示される方法は、これらの欠点を有さない。

【0542】

ＤＮＡの起源を決定する前に配列の長さを使用すること
母体ＤＮＡと胎児ＤＮＡとでは配列の長さの分布が異なり、胎児は一般に短いことが報告されている。本開示の一実施形態において、経験的データの形態で従来の知識を使用し、母親（Ｐ（Ｘ｜母体））及び胎児ＤＮＡ（Ｐ（Ｘ｜胎児））の両方の予測される長さの事前分布を構築することが可能である。長さｘの新たな未確認ＤＮＡ配列を考慮すると、所与のＤＮＡ配列が母体ＤＮＡ又は胎児ＤＮＡのいずれかであるという確率を、母体又は胎児のいずれかが与えられたｘの事前尤度に基づいて割り当てることが可能である。具体的には、Ｐ（ｘ｜母体）＞Ｐ（ｘ｜胎児）の場合、ＤＮＡ配列は、Ｐ（ｘ｜母体）＝Ｐ（ｘ｜母体）／［（Ｐ（ｘ｜母体）＋Ｐ（ｘ｜胎児）］で母体として分類することができ、ｐ（ｘ｜母体）＜ｐ（ｘ｜胎児）の場合、ＤＮＡ配列は、胎児、Ｐ（ｘ｜胎児）＝Ｐ（ｘ｜胎児）／［（Ｐ（ｘ｜母体）＋Ｐ（ｘ｜胎児）］］として分類することができる。本開示の一実施形態において、高い確率を有する母体又は胎児として割り当てることができる配列を考慮することによって、そのサンプルに特異的な母体及び胎児の配列の長さの分布を決定することができ、その後、そのサンプル特異的な分布をそのサンプルの予想サイズ分布として使用することができる。

【0543】

配列決定コストを最小限に抑えるための可変リード深度
例えば、Ｃｈｉｕｅｔａｌ．ＢＭＪ２０１１；３４２：ｃ７４０１において、診断に関する多くの臨床試験において、いくつかのパラメータを有するプロトコルが設定され、次いで、同じプロトコルが、試験における各患者について同じパラメータで実行される。遺伝物質を測定する方法として、配列決定を用いて母親に妊娠している胎児の倍数性状態を決定する場合、１つの関連するパラメータは、リード数である。リード数は、シーケンサ上の実際のリード数、意図されたリード数、分数レーン、全レーン、又は全フローセルを指し得る。これらの研究において、リード数は、典型的には、サンプルの全て又はほぼ全てが所望のレベルの精度を達成することを確実にするレベルに設定される。配列決定は、現在、高価な技術であり、マッピング可能な５００万リード当たり約２００ドルのコストがかかり、価格が下がっている間、配列決定ベースの診断が同様のレベルの精度で動作することを可能にするが、リードが少ない方法は、必然的にかなりの量のお金を節約する。

【0544】

二倍体測定の精度は、典型的には、リード数及び混合物中の胎児ＤＮＡの画分を含む多くの要因に依存する。混合物中の胎児ＤＮＡの画分がより高い場合、精度は典型的にはより高い。同時に、リード数が多い場合、精度は典型的にはより高い。倍数性状態が同等の精度で決定され、第１のケースは第２のケースよりも混合物中の胎児ＤＮＡの画分が低く、第１のケースでは第２のケースよりも多くのリードが配列決定された２つのケースを有することが可能である。所与のレベルの精度を達成するために必要なリード数を決定する際のガイドとして、混合物中の胎児ＤＮＡの予測画分を使用することが可能である。

【0545】

本開示の一実施形態において、セット内の異なるサンプルが異なるリード深度に配列決定されるサンプルセットを実行することができ、各サンプル上で実行されるリード数は、各混合物中の胎児ＤＮＡの計算された画分を与えられた所与のレベルの精度を達成するように選択される。本開示の一実施形態において、これは、混合サンプルの測定を行い、混合物中の胎児ＤＮＡの画分を決定することを伴い得る。胎児画分のこの推定は、配列決定で行われてもよく、ＴａｑＭａｎで行われてもよく、ｑＰＣＲで行われてもよく、ＳＮＰアレイで行われてもよく、所与の遺伝子座で異なる対立遺伝子を区別することができる任意の方法で行われてもよい。胎児画分の推定の必要性は、実際の測定データと比較するときに考慮される仮説のセット中の胎児画分の全て又は選択されたセットをカバーする仮説を含むことによって排除され得る。混合物中の画分胎児ＤＮＡが決定された後、各サンプルについてリードされる配列の数を決定してもよい。

【0546】

本開示の一実施形態において、１００人の妊婦は、それぞれのＯＢを訪問し、抗溶解剤及び／又はＤＮＡ酵素を不活性化する何らかのものを含む血液を採血管に採取する。妊婦は各々、唾液サンプルを与える妊娠中の胎児の父親のためのキットを家に持ち帰える。１００組全てのカップルの遺伝物質の両方のセットは実験室に送り返され、母親の血液がスピンダウンされ、血漿と同様にバフィーコートが単離される。血漿は、母体ＤＮＡと胎盤由来ＤＮＡとの混合物を含む。母体バフィーコート及び父体血液は、ＳＮＰアレイを使用して遺伝子型決定され、母体血漿サンプル中のＤＮＡは、ＳＵＲＥＳＥＬＥＣＴハイブリダイゼーションプローブで標的化される。プローブでプルダウンしたＤＮＡを使用して、１００個のタグ付きライブラリを生成し、各母サンプルについて１つずつを生成し、各サンプルは異なるタグでタグ付けされる。各ライブラリから画分を取り出し、それらの画分の各々を一緒に混合し、多重化された方法でＩＬＬＵＭＩＮＡＨＩＳＥＱＤＮＡシーケンサの２つのレーンに添加し、各レーンは、約５０００万のマッピング可能なリードをもたらし、１００の多重化された混合物で約１００万のマッピング可能なリード、又はサンプル当たり約１００万のリードをもたらした。配列リードを使用して、各混合物中の胎児ＤＮＡの画分を決定した。サンプルの５０個は、混合物中に１５％を超える胎児ＤＮＡを有し、１００万リードは、９９．９％の信頼性で胎児の倍数性状態を決定するのに十分であった。

【0547】

残りの混合物のうち、２５個は、１０～１５％の胎児ＤＮＡを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、ＨＩＳＥＱの１つのレーンを走らせて、各サンプルについて追加の２００万リードを生成した。１０～１５％の胎児ＤＮＡを有する各混合物についての配列データの２つのセットを一緒に加え、それらの胎児の倍数性状態を９９．９％の信頼度で決定するのに十分であったサンプル当たり３００万リードをもたらした。

【0548】

残りの混合物のうち、１３個は、６～１０％の胎児ＤＮＡを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、ＨＩＳＥＱの１つのレーンを走らせて、各サンプルについて追加の４００万リードを生成した。６～１０％の胎児ＤＮＡを有する各混合物についての配列データの２つのセットを一緒に加え、それらの胎児の倍数性状態を９９．９％の信頼度で決定するのに十分であった、混合物当たり５００万の合計リードをもたらした。

【0549】

残りの混合物のうち、８つは、４～６％の胎児ＤＮＡを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、ＨＩＳＥＱの１つのレーンを走らせて、各サンプルについて追加の６００万リードを生成した。４～６％の胎児ＤＮＡを有する各混合物についての配列データの２つのセットを一緒に加え、それらの胎児の倍数性状態を９９．９％の信頼度で決定するのに十分であった、混合物当たり７００万の合計リードをもたらした。

【0550】

残りの４つの混合物のうち、それらの全ては、２～４％の胎児ＤＮＡを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、ＨＩＳＥＱの１つのレーンを走らせて、各サンプルについて追加の１２００万リードを生成した。２～４％の胎児ＤＮＡを有する各混合物についての配列データの２つのセットを一緒に加え、それらの胎児の倍数性状態を９９．９％の信頼度で決定するのに十分であった、混合物当たり１３００万の合計リードをもたらした。

【0551】

この方法は、１００サンプルにわたって９９．９％の精度を達成するために、ＨＩＳＥＱ機械上で６レーンの配列決定を必要とした。全てのサンプルについて同じ数の測定が必要であり、全ての倍数決定が９９．９％の精度で行われることを確実にした場合、２５レーンの配列決定が行われ、コールなし率又は４％のエラー率が許容された場合、１４レーンの配列決定で達成された可能性がある。

【0552】

生のジェノタイピングデータの使用
母体血液に見られる胎児のＤＮＡで測定された胎児の遺伝情報を使用してＮＰＤを達成することができるいくつかの方法が存在する。これらの方法のいくつかは、ＳＮＰアレイを使用して胎児ＤＮＡの測定を行うことを含み、いくつかの方法は、非標的化配列決定を含み、いくつかの方法は、標的化配列決定を含む。標的化配列決定は、ＳＮＰを標的化してもよく、ＳＴＲを標的化してもよく、他の多型遺伝子座を標的化してもよく、非多型遺伝子座を標的化してもよく、又はそれらのいくつかの組み合わせを標的化してもよい。これらの方法のいくつかは、測定を行う機械内のセンサから来る強度データから対立遺伝子の同一性をコールする商業的又は独自の対立遺伝子コール元を使用することを伴い得る。例えば、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭシステム又はＡＦＦＹＭＥＴＲＩＸＧＥＮＥＣＨＩＰマイクロアレイシステムは、ＤＮＡの相補的セグメントにハイブリダイゼーションすることができる結合ＤＮＡ配列を有するビーズ又はマイクロチップを含み、ハイブリダイゼーションすると、検出することができるセンサ分子の蛍光特性の変化がある。また、配列決定方法、例えば、ＩＬＬＵＭＩＮＡＳＯＬＥＸＡゲノムシーケンサ又はＡＢＩ固体ゲノムシーケンサもあり、ＤＮＡのフラグメントの遺伝子配列が配列決定され、配列決定される鎖に相補的なＤＮＡの鎖の伸長時に、伸長されたヌクレオチドの同一性は、典型的には、相補的なヌクレオチドに付加される蛍光タグ又はラジオタグを介して検出される。これらの方法の全てにおいて、遺伝子型又は配列決定データは、典型的には、蛍光又は他のシグナル、又はその欠如に基づいて決定される。これらのシステムは、典型的には、蛍光又は他の検出デバイス（一次遺伝子データ）のアナログ出力から特定の対立遺伝子コール（二次遺伝子データ）を行う低レベルのソフトウェアパッケージと組み合わせられる。例えば、ＳＮＰアレイ上の所与の対立遺伝子の場合、ソフトウェアは、例えば、蛍光強度が特定の閾値を上回って又は下回って測定される場合、特定のＳＮＰが存在するか、又は存在しないことをコールする。同様に、シーケンサの出力は、各染料について検出される蛍光レベルを示すクロマトグラムであり、ソフトウェアは、特定の塩基対がＡ又はＴ又はＣ又はＧであることをコールする。高スループットシーケンサは、典型的には、配列決定されたＤＮＡ配列の最も可能性の高い構造を表す、リードと呼ばれる一連のそのような測定を行う。クロマトグラムの直接的なアナログ出力は、本明細書では一次遺伝子データであると定義され、ソフトウェアによって行われた塩基対／ＳＮＰコールは、二次遺伝子データであるとみなされる。一実施形態において、一次データは、遺伝子型決定プラットフォームの未処理の出力である生の強度データを指し、遺伝子型決定プラットフォームは、ＳＮＰアレイ、又は配列決定プラットフォームを指し得る。二次遺伝子データは、対立遺伝子コールが行われた、又は配列データが塩基対に割り当てられた、及び／又は配列リードがゲノムにマッピングされた、処理された遺伝子データを指す。

【0553】

多くのより高いレベルのアプリケーションは、これらの対立遺伝子のコール、ＳＮＰのコール、及び配列リード、すなわち、遺伝子型決定ソフトウェアが生成する二次遺伝子データを利用する。例えば、ＤＮＡＮＥＸＵＳ、ＥＬＡＮＤ又はＭＡＱは、配列決定リードを取り、それらをゲノムにマッピングする。例えば、非侵襲性出生前診断の文脈において、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）などの複雑な情報学は、個体の遺伝子型を決定するために多数のＳＮＰコールを活用し得る。また、着床前遺伝子診断の文脈において、ゲノムにマッピングされる配列リードのセットをとることが可能であり、各染色体、又は染色体のセクションにマッピングされるリードの正規化されたカウントをとることによって、個体の倍数性状態を決定することが可能であり得る。非侵襲性出生前診断の文脈において、母体血漿中に存在するＤＮＡ上で測定された配列リードのセットを取り、それらをゲノムにマッピングすることが可能であり得る。次いで、各染色体又は染色体のセクションにマッピングされたリードの正規化されたカウントを取り、そのデータを使用して個体の倍数性状態を決定し得る。例えば、不釣り合いに多くのリードを有するそれらの染色体は、採血された母体で妊娠している胎児においてトリソミックであると結論付けることが可能であり得る。

【0554】

しかしながら、実際には、測定器の初期出力はアナログシグナルである。特定の塩基対が配列決定ソフトウェアに関連付けられたソフトウェアによってコールされるとき、例えば、ソフトウェアは塩基対をＴと呼んでもよく、実際には、コールは、ソフトウェアが最も可能性が高いと考えているコールである。しかしながら、いくつかの場合において、コールは、低い信頼度であってもよく、例えば、アナログシグナルは、特定の塩基対がＴである可能性がわずか９０％、及びＡである可能性が１０％である可能性があることを示してもよい。別の例では、ＳＮＰアレイリーダーに関連する遺伝子型コールソフトウェアは、ある対立遺伝子をＧとコールし得る。しかしながら、実際には、基礎となるアナログシグナルは、対立遺伝子がＧである可能性が７０％のみであり、対立遺伝子がＴである可能性が３０％であることを示し得る。これらの場合、上位レベルのアプリケーションが、下位レベルのソフトウェアによって行われた遺伝子型コール及び配列コールを使用するとき、それらは、いくつかの情報を失っている。すなわち、遺伝子型決定プラットフォームによって直接測定される一次遺伝子データは、添付のソフトウェアパッケージによって決定される二次遺伝子データよりも乱雑であり得るが、それはより多くの情報を含む。二次遺伝子データ配列をゲノムにマッピングする際、いくつかの塩基が十分な明瞭さで読み取られないか、又はマッピングが明確でないため、多くのリードが捨てられる。一次遺伝子データ配列リードを使用する場合、最初に二次遺伝子データ配列リードに変換されたときに捨てられた可能性があるそれらのリードの全て又は多くを、リードを確率的な方法で処理することによって使用することができる。

【0555】

本開示の一実施形態において、上位レベルのソフトウェアは、下位レベルのソフトウェアによって決定される対立遺伝子コール、ＳＮＰコール、又は配列リードに依存しない。代わりに、上位レベルのソフトウェアは、遺伝子型決定プラットフォームから直接測定されたアナログシグナルに基づいて計算を行う。本開示の一実施形態において、胚／胎児／小児の遺伝子データを再構築する能力が、遺伝子型決定プラットフォームによって測定される一次遺伝子データを直接使用するように設計されるように、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）などの情報学に基づく方法が修正される。本開示の一実施形態において、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）などの情報学に基づく方法は、一次遺伝子データを使用し、二次遺伝子データを使用せずに、対立遺伝子コール、及び／又は染色体コピー数コールを行うことができる。本開示の一実施形態において、全ての遺伝子コール、ＳＮＰコール、配列リード、配列マッピングは、一次遺伝子データを二次遺伝子コールに変換するのではなく、遺伝子型決定プラットフォームによって直接測定される生の強度データを使用することによって、確率論的な方法で処理される。一実施形態において、対立遺伝子数の確率を計算し、各仮説の相対確率を決定する際に使用される調製されたサンプルからのＤＮＡ測定値は、一次遺伝子データを含む。

【0556】

いくつかの実施形態において、本方法は、少なくとも１つの関連個体の遺伝子データを組み込んだ標的個体の遺伝子データの精度を高めることができ、本方法は、標的個体のゲノムに特異的な一次遺伝子データ及び関連個体（複数可）のゲノム（複数可）に特異的な遺伝子データを得ることと、関連個体（複数可）からの染色体が標的個体のゲノム中のそれらのセグメントに対応する可能性のあるセグメントに関する１つ以上の仮説のセットを作成することと、標的個体の一次遺伝子データ及び関連個体（複数可）の遺伝子データを与えられた仮説の各々の確率を決定することと、各仮説に関連する確率を使用して、標的個体の実際の遺伝物質の最も可能性の高い状態を決定することと、を含む。いくつかの実施形態において、本方法は、標的個体のゲノム中の染色体のセグメントのコピー数を決定することができ、本方法は、標的個体のゲノム中に存在する染色体セグメントの多くのコピー数の仮説のセットを作成することと、標的個体からの一次遺伝子データ及び１つ以上の関連個体からの遺伝子情報をデータセットに組み込むことと、データセットに関連付けられるプラットフォーム応答の特性を推定することであって、プラットフォーム応答が１つの実験から別の実験へと変化し得る、推定することと、データセット及びプラットフォーム応答特性を与えられて、各コピー数仮説の条件付き確率を計算することと、最も可能性の高いコピー数の仮説に基づいて染色体セグメントのコピー数を決定することと、を含む。一実施形態において、本開示の方法は、標的個体における少なくとも１つの染色体の倍数性状態を決定することができ、本方法は、標的個体及び１つ以上の関連個体から一次遺伝子データを得ることと、標的個体の染色体の各々についての少なくとも１つの倍数性状態の仮説のセットを作成することと、１つ以上の専門家技術を使用して、使用される各々の専門家技術について、得られた遺伝子データを与えられる、セット内の各々の倍数性状態の仮説についての統計的確率を決定することと、各々の倍数性状態の仮説について、１つ以上の専門家技術によって決定される統計的確率を組み合わせることと、各々の倍数性状態の仮説の組み合わせられた統計的確率に基づいて、標的個体における各々の染色体の倍数性状態を決定することと、を含む。一実施形態において、本開示の方法は、対立遺伝子のセット、標的個体、及び標的個体の一方又は両方の親、及び任意選択で１つ以上の関連個体から対立遺伝子の状態を決定することができ、本方法は、標的個体、及び一方又は両方の親、及び任意の関連する個体から一次遺伝子データを得ることと、標的個体ト、及び一方又は両方の親、及び任意選択で１つ以上の関連個体についての少なくとも１つの対立遺伝子の仮説のセットを作成することであって、仮説が、対立遺伝子のセットにおいて可能な対立遺伝子の状態を記述する、作成することと、得られた遺伝データを用いて、仮説セット内の各対立遺伝子仮説の統計的確率を決定することと、各々の対立遺伝子仮説の統計的確率に基づいて、標的個体、及び一方又は両方の親、及び任意選択で１つ以上の関連個体について対立遺伝子のセット内の各々の対立遺伝子について対立遺伝子の状態を決定することと、を含む。

【0557】

いくつかの実施形態において、混合サンプルの遺伝子データは、配列データを含んでもよく、配列データは、ヒトゲノムに一意にマッピングされなくてもよい。いくつかの実施形態において、混合サンプルの遺伝子データは、配列データを含んでもよく、配列データは、ゲノム内の複数の位置にマッピングされ、各可能なマッピングは、所与のマッピングが正しい確率に関連付けられる。いくつかの実施形態において、配列リードは、ゲノム内の特定の位置に関連すると仮定されない。いくつかの実施形態において、配列リードは、ゲノム内の複数の位置、及びその位置に属する関連する確率に関連する。

【0558】

出生前診断の組み合わせ方法
異数性又は他の遺伝的欠陥の出生前診断又は出生前スクリーニングに使用され得る多くの方法がある。本明細書の他の箇所、及び２００６年１１月２８日に出願された米国実用新案出願第１１／６０３，４０６号、２００８年３月１７日に出願された米国実用新案出願第１２／０７６，３４８号、及びＰＣＴ実用新案出願第ＰＣＴ／Ｓ０９／５２７３０号に記載されている方法は、関連する個体の遺伝子データを使用して、胎児などの標的個体の遺伝子データが知られているか、又は推定される精度を高めるそのような方法の１つである。出生前診断に使用される他の方法は、母体血液中の特定のホルモンのレベルを測定することを含み、これらのホルモンは様々な遺伝的異常と相関している。この例は、トリプル検査と呼ばれ、母体血液中のいくつかの（通常２、３、４、又は５つの）異なるホルモンのレベルを測定する検査である。所与の結果の尤度を決定するために複数の方法が使用される場合、方法のいずれもそれ自体が決定的ではない場合、それらの方法によって与えられた情報を組み合わせて、個々の方法のいずれよりも正確である予測を行うことが可能である。トリプル検査では、３つの異なるホルモンによって与えられる情報を組み合わせることで、個々のホルモンレベルが予測するよりも正確な遺伝子異常の予測を得ることができる。

【0559】

胎児の遺伝子状態、具体的には胎児における遺伝子異常の可能性についてより正確な予測を行う方法であって、それらの予測が様々な方法を使用して行われた胎児における遺伝子異常の予測を組み合わせることを含む、方法が本明細書に開示される。「より正確な」方法とは、所与の偽陽性率でより低い偽陰性率を有する異常を診断するための方法を指し得る。本開示の好ましい実施形態において、予測のうちの１つ以上は、胎児について知られている遺伝子データに基づいて行われ、ここで、遺伝子知識は、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）方法を用いて、すなわち、胎児に関連する個体の遺伝子データを用いて、より高い精度で胎児の遺伝子データを決定した。いくつかの実施形態において、遺伝子データは、胎児の倍数性状態を含んでもよい。いくつかの実施形態において、遺伝子データは、胎児のゲノム上の対立遺伝子コールのセットを指し得る。いくつかの実施形態において、予測のいくつかは、トリプル検査を使用して行われてもよい。いくつかの実施形態において、予測のいくつかは、母体血液中の他のホルモンレベルの測定を使用して行われてもよい。いくつかの実施形態において、診断とみなされる方法によってなされる予測は、スクリーニングとみなされる方法によってなされる予測と組み合わされてもよい。いくつかの実施形態において、本方法は、アルファ－フェトタンパク質（ＡＦＰ）の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、非抱合型エストリオール（ＵＥ_３）の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、ベータヒト絨毛性ゴナドトロピン（ベータ－ｈＣＧ）の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、侵襲性トロホブラスト抗原（ＩＴＡ）の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、インヒビンの母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、妊娠関連血漿タンパク質Ａ（ＰＡＰＰ－Ａ）の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、他のホルモン又は母体血清マーカーの母体血液中レベルを測定することを伴う。いくつかの実施形態において、予測のいくつかは、他の方法を使用して行われてもよい。いくつかの実施形態において、予測のいくつかは、妊娠の約１２週における超音波及び血液検査、並びに約１６週における第２の血液検査を組み合わせたものなどの完全に統合された検査を使用して行われてもよい。いくつかの実施形態において、本方法は、胎児の頸部半透明度（ＮＴ）を測定することを伴う。いくつかの実施形態において、本方法は、予測を行うために前述のホルモンの測定されたレベルを使用することを伴う。いくつかの実施形態において、本方法は、前述の方法の組み合わせを伴う。

【0560】

予測を組み合わせる多くの方法があり、例えば、ホルモン測定値を中央値の倍数（ＭｏＭ）に変換し、次に尤度比（ＬＲ）に変換することができる。同様に、他の測定値は、ＮＴ分布の混合モデルを使用してＬＲに変換され得る。ＮＴのＬＲ及び生化学的マーカーは、年齢及び妊娠に関連するリスクを乗じて、２１トリソミーなどの様々な状態のリスクを導き出すことができる。検出率（ＤＲ）及び偽陽性率（ＦＰＲ）は、所与のリスク閾値を超えるリスクの割合を取ることによって計算することができる。

【0561】

一実施形態において、倍数性状態をコールする方法は、結合分布モデル及び対立遺伝子数確率を使用して決定された状態仮説の各々の相対確率と、リード数分析、ヘテロ接合率の比較、親の遺伝情報が使用される場合にのみ利用可能な統計量、特定の親コンテキストの正規化された遺伝子型シグナルの確率、第１のサンプル又は調製されたサンプルの推定胎児画分を使用して計算される統計量、及びそれらの組み合わせが挙げられるがこれらに限定されない、胎児がトリソミックであることのリスクスコアを決定する他の方法から取り入れた統計技術を用いて計算される各々の倍数性仮説の相対確率を比較することと、を含む。

【0562】

別の方法は、４つの測定されたホルモンレベルを伴う状況を含むことができ、それらのホルモンの周りの確率分布が知られている：正倍数体症例の場合はｐ（ｘ_１，ｘ_２，ｘ_３，ｘ_４｜ｅ）、異数体症例の場合はｐ（ｘ_１，ｘ_２，ｘ_３，ｘ_４｜ａ）。次いで、ＤＮＡ測定値の確率分布を測定することができ、正倍数体及び異数体の場合はそれぞれｇ（ｙ｜ｅ）及びｇ（ｙ｜ａ）を測定することができる。正倍数体／異数体という仮定で、これらが独立であると仮定すると、ｐ（ｘ_１，ｘ_２，ｘ_３，ｘ_４｜ａ）ｇ（ｙ｜ａ）及びｐ（ｘ_１，ｘ_２，ｘ_３，ｘ_４｜ｅ）ｇ（ｙ｜ｅ）として組み合わされ、次いで母体年齢を与えられた前のｐ（ａ）及びｐ（ｅ）を各々乗算することができる。次いで、最も高いものを選択することができる。

【0563】

一実施形態において、ｇ（ｙ｜ａ又はｅ）上の分布がガウスであると仮定するために中心極限定理を呼び起こし、複数のサンプルを見ることによって平均及び標準偏差を測定することが可能である。別の実施形態において、転帰が与えられると、それらが独立しておらず、結合分布ｐ（ｘ_１，ｘ_２，ｘ_３，ｘ_４｜ａ又はｅ）を推定するのに十分なサンプルを収集すると仮定することができる。

【0564】

一実施形態において、標的個体の倍数性状態は、確率が最大である仮説に関連付けられる倍数性状態であると決定される。場合によっては、１つの仮説は、９０％より大きい正規化された複合確率を有する。各仮説は、倍数性状態の１つ又は一組に関連付けられ、正規化された複合確率が９０％より大きいか、又は５０％、８０％、９５％、９８％、９９％又は９９．９％などのいくつかの他の閾値が、決定された倍数性状態として仮説をコールするために必要とされる閾値として選択されてもよい。

【0565】

母体血中の以前の妊娠からの子供からのＤＮＡ
非侵襲性出生前診断の１つの困難は、現在の妊娠からの胎児細胞を以前の妊娠からの胎児細胞から区別することである。以前の妊娠からの遺伝物質はしばらくすると消えるという説もあるが、決定的な証拠は示されていない。本開示の一実施形態において、父系起源の母体血液（すなわち、胎児が父親から継承したＤＮＡ）に存在する胎児ＤＮＡを、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）（ＰＳ）方法、及び父系ゲノムの知識を用いて決定することが可能である。この方法は、段階的な親の遺伝情報を利用してもよい。祖父母の遺伝子データ（祖父母からの精子からの測定された遺伝子データなど）、又は他の生まれた子供からの遺伝子データ、又は流産のサンプルを使用して、非段階的な遺伝子型情報から親の遺伝子型を位相することが可能である。また、ＨａｐＭａｐベースの位相決定、又は父系細胞のハプロタイピングによって、非段階的な遺伝情報を位相決定することもできる。染色体が密な束である場合、有糸分裂期にある細胞を停止させることと、微小流体を使用して、別個のウェルに別個の染色体を入れることとによって、ハプロタイピングの成功は実証されている。別の実施形態において、段階的な親ハプロタイプデータを使用して、父親からの２つ以上のホモログの存在を検出することが可能であり、２つ以上の子供からの遺伝物質が血液中に存在することを意味する。胎児において正倍数であると予測される染色体に着目することにより、胎児がトリソミーに罹患していた可能性を排除することができる。また、胎児ＤＮＡが現在の父親からのものでないかどうかを決定することが可能であり、その場合、遺伝子異常を予測するためにトリプル検査などの他の方法を使用することができる。

【0566】

採血以外の方法を介して利用可能な胎児遺伝物質の他の供給源が存在し得る。母体血液中で利用可能な胎児遺伝物質の場合、２つの主なカテゴリーが存在する：（１）全胎児細胞、例えば、有核胎児赤血球又は赤血球、及び（２）遊離浮遊胎児ＤＮＡ。全胎児細胞の場合、胎児細胞が母体血液中に長期間持続することができるため、子供又は以前の妊娠からの胎児からのＤＮＡを含む妊婦から細胞を単離することが可能であるといういくつかの証拠がある。また、遊離浮遊胎児ＤＮＡが数週間以内に系から除去されるという証拠もある。１つの課題は、その遺伝物質が細胞に含まれる個体の同一性を決定する方法、すなわち、測定された遺伝物質が、以前の妊娠からの胎児からのものではないことを確実にすることである。本開示の一実施形態において、母親の遺伝物質の知識を使用して、問題の遺伝物質が母親の遺伝物質ではないことを確実にすることができる。この目的を達成するためのいくつかの方法が存在し、これには、本文書又は本文書で言及されている特許のいずれかに記載されている、ＰＡＲＥＮＴＡＬＳＵＰＰＯＲＴ（商標）などの情報学に基づく方法が含まれる。

【0567】

本開示の一実施形態において、妊娠中の母親から採取された血液は、遊離浮遊胎児ＤＮＡを含む画分、及び有核赤血球を含む画分に分離されてもよい。遊離浮遊ＤＮＡは、任意選択で濃縮されてもよく、ＤＮＡの遺伝子型情報は、測定されてもよい。遊離浮遊ＤＮＡからの測定された遺伝子型情報から、母系遺伝子型の知識を使用して、胎児遺伝子型の態様を決定してもよい。これらの態様は、倍数性状態、及び／又は対立遺伝子同一性のセットを指し得る。次いで、個々の有核赤血球は、本文書の別の箇所に記載されている方法、及び他の参照対象特許、特に、本文書の第１のセクションに記載されているものを使用して遺伝子型決定され得る。母体ゲノムの知識は、任意の所与の単一の血液細胞が遺伝的に母体であるかどうかを決定することを可能にする。上記のように決定された胎児遺伝子型の態様は、単一の血液細胞が、現在妊娠している胎児に遺伝的に由来するかどうかを決定することを可能にする。本質的に、本開示のこの態様は、母親の遺伝的知識、及びおそらく父親などの他の関連個体からの遺伝情報、並びに母体血液中に見出される遊離浮遊ＤＮＡからの測定された遺伝情報を使用して、母体血液中に見出される単離された有核細胞が、（ａ）遺伝的に母親であるか、（ｂ）遺伝的に現在妊娠中の胎児からであるか、又は（ｃ）遺伝的に以前の妊娠からの胎児からであるかを決定することを可能にする。

【0568】

出生前の性染色体異数性の決定
当該技術分野で既知の方法では、母親の血液から妊娠中の胎児の性別を決定しようとする人々は、胎児遊離浮遊ＤＮＡ（ｆｆｆＤＮＡ）が母親の血漿中に存在するという事実を使用している。母体血漿中のＹ特異的遺伝子座を検出することができる場合、これは妊娠中の胎児が男性であることを意味する。しかしながら、いくつかの場合では、ｆｆｆＤＮＡの量が低すぎて、男性の胎児の場合にＹ特異的遺伝子座が検出されることを確実にすることができないため、血漿中のＹ特異的遺伝子座の検出の欠如は、先行技術で既知の方法を使用する場合、妊娠中の胎児が必ずしも女性であることを保証するものではない。

【0569】

本明細書に提示されるのは、Ｙ特異的核酸、すなわち、もっぱら父系に由来する遺伝子座に由来するＤＮＡの測定を必要としない新規の方法である。先に開示されたＰａｒｅｎｔａｌＳｕｐｐｏｒｔ方法は、乗換え頻度データ、親遺伝子型データ、及び情報技術を使用して、妊娠中の胎児の倍数性状態を決定する。胎児の性別は、単に性染色体における胎児の倍数性状態である。ＸＸである子供は、女性であり、ＸＹは、男性である。本明細書に記載される方法はまた、胎児の倍数性状態を決定することが可能である。雌雄鑑別は、性染色体の倍数決定と事実上同義であることに留意されたい。雌雄鑑別の場合、子供が正倍数体であるという仮定が多くの場合なされるため、可能性のある仮説が少なくなる。

【0570】

本明細書に開示される方法は、Ｘ染色体及びＹ染色体の両方に共通する遺伝子座を調べて、胎児に存在する胎児ＤＮＡの予想量の観点からベースラインを作成することを伴う。次いで、Ｘ染色体にのみ特異的であるそれらの領域を調べて、胎児が女性であるか男性であるかを決定することができる。男性の場合、Ｘ及びＹの両方に特異的な遺伝子座よりも、Ｘ染色体に特異的な遺伝子座からの胎児ＤＮＡが少ないことが期待される。対照的に、女性胎児では、これらの群の各々のＤＮＡの量が同じであることを期待する。問題のＤＮＡは、サンプル上に存在するＤＮＡの量を定量化することができる任意の技術、例えば、ｑＰＣＲ、ＳＮＰアレイ、遺伝子型決定アレイ、又は配列決定によって測定することができる。排他的に個体からのＤＮＡについて、以下のようなことが予想される：

【表9】

【0571】

母体ＤＮＡと混合された胎児ＤＮＡの場合、混合物中の胎児ＤＮＡの画分がＦであり、混合物中の母体ＤＮＡの画分がＭである場合、Ｆ＋Ｍ＝１００％となるように、以下のようなことが予想される：

【表10】

【0572】

Ｆ及びＭが既知である場合、予測される比率を計算することができ、観測されるデータを予測されるデータと比較することができる。Ｍ及びＦが知られていない場合、閾値を履歴データに基づいて選択することができる。いずれの場合も、Ｘ及びＹの両方に特異的な遺伝子座でのＤＮＡの測定量をベースラインとして使用することができ、胎児の性別の試験は、Ｘ染色体のみに特異的な遺伝子座で観察されるＤＮＡの量に基づくことができる。その量がベースラインよりも１／２Ｆにほぼ等しい量、又はそれを所定の閾値を下回らせる量だけ低い場合、胎児は男性であると決定され、その量がベースラインにほぼ等しい場合、又はそれを所定の閾値を下回らせる量だけ低い場合、胎児は女性であると決定される。

【0573】

別の実施形態において、多くの場合Ｚ染色体と呼ばれるＸ染色体及びＹ染色体の両方に共通であるそれらの遺伝子座のみを見ることができる。Ｚ染色体上の遺伝子座の部分集合は、典型的には、Ｘ染色体上では常にＡであり、Ｙ染色体上では常にＢである。Ｚ染色体からのＳＮＰがＢ遺伝子型を有することが判明した場合、胎児は男性と呼ばれ、Ｚ染色体からのＳＮＰがＡ遺伝子型のみを有することが判明した場合、胎児は女性と呼ばれる。別の実施形態において、Ｘ染色体上にのみ見出される遺伝子座を見ることができる。ＡＡ｜Ｂなどの文脈は、Ｂの存在が、胎児が父親からのＸ染色体を有することを示すため、特に有益である。ＡＢ｜Ｂなどの文脈も有益であり、女性胎児の場合、男性胎児と比較してＢは半分の頻度しか存在しないことが予測される。別の実施形態において、Ａ及びＢ対立遺伝子の両方がＸ及びＹ染色体上に存在し、どのＳＮＰが父系Ｙ染色体由来であり、どのＳＮＰが父系Ｘ染色体由来であるかが知られているＺ染色体上のＳＮＰを見ることができる。

【0574】

一実施形態において、染色体Ｙによって共有される相同非再結合（ＨＮＲ）領域と染色体Ｘとの間で変化することが知られている単一ヌクレオチド位置を増幅することが可能である。このＨＮＲ領域内の配列は、Ｘ染色体とＹ染色体との間でほぼ同一である。この同一の領域内には、Ｘ染色体間及び集団内のＹ染色体間で不変であるが、Ｘ染色体とＹ染色体との間で異なる単一ヌクレオチド位置がある。各ＰＣＲアッセイは、Ｘ染色体及びＹ染色体の両方に存在する遺伝子座から配列を増幅することができる。各増幅された配列内には、配列決定又はいくつかの他の方法を使用して検出することができる単一の塩基があるであろう。

【0575】

ｎ個の実施形態において、胎児の性別は、母体血漿中に見出される胎児遊離浮遊ＤＮＡから決定することができ、本方法は、以下の工程のいくつか又は全てを含む：１）デザインＰＣＲ（通常又はミニＰＣＲのいずれか、必要に応じて多重化を加える）プライマーは、ＨＮＲ領域内のＸ／Ｙバリアント単一ヌクレオチド位置を増幅し、２）母体血漿を取得し、３）ＨＮＲＸ／ＹＰＣＲアッセイを使用して母体血漿から標的をＰＣＲ増幅し、４）アンプリコンを配列決定し、５）増幅配列のうちの１つ以上内のＹ対立遺伝子の存在について配列データを調べる。１つ以上の存在は、男性胎児を示す。全てのアンプリコンから全てのＹ対立遺伝子が欠如していることは、女性の胎児を示す。

【0576】

一実施形態において、標的化配列決定を使用して、母体血漿中のＤＮＡ及び／又は親の遺伝子型を測定することができる。一実施形態において、明らかに父系由来のＤＮＡに由来する全ての配列を無視することができる。例えば、コンテキストＡＡ｜ＡＢにおいて、Ａ配列の数をカウントし、全てのＢ配列を無視することができる。上記アルゴリズムのヘテロ接合率を決定するために、観察されたＡ配列の数を、所与のプローブについての予測される全配列の数と比較することができる。サンプルごとに、各プローブの予測される配列数を計算することができる多くの方法がある。一実施形態において、履歴データを使用して、全ての配列リードのどの画分が各々の特定のプローブに属するかを決定し、次いで、この経験的画分を、配列リードの総数と組み合わせて使用して、各々のプローブにおける配列の数を推定することが可能である。別のアプローチは、いくつかの既知のホモ接合性対立遺伝子を標的化し、次に履歴データを使用して、各プローブにおけるリード数を既知のホモ接合性対立遺伝子におけるリード数と関連付けることであり得る。次いで、各サンプルについて、ホモ接合対立遺伝子でのリード数を測定し、次いで、この測定値を、経験的に導出された関係性とともに使用して、各プローブでの配列リード数を推定することができる。

【0577】

いくつかの実施形態において、複数の方法によってなされる予測を組み合わせることによって、胎児の性別を決定することが可能である。いくつかの実施形態において、複数の方法は、本開示に記載される方法から取得される。いくつかの実施形態において、複数の方法のうちの少なくとも１つは、本開示に記載される方法から取得される。

【0578】

いくつかの実施形態において、本明細書に記載の方法を使用して、妊娠中の胎児の倍数性状態を決定することができる。一実施形態において、倍数性コール方法は、Ｘ染色体に特異的であるか、又はＸ及びＹ染色体の両方に共通の遺伝子座を使用するが、Ｙ特異的遺伝子座を利用しない。一実施形態において、倍数性コール方法は、Ｘ染色体に特異的な遺伝子座、Ｘ及びＹ染色体の両方に共通の遺伝子座、並びにＹ染色体に特異的な遺伝子座のうちの１つ以上を使用する。性染色体の比率が、例えば、４５、Ｘ（ターナー症候群）、４６、ＸＸ（正常な女性）及び４７，ＸＸＸ（トリソミーＸ）と同様である一実施形態において、分化は、様々な仮説に従って、対立遺伝子の分布を予測される対立遺伝子の分布と比較することによって達成することができる。別の実施形態において、これは、性染色体についての配列リードの相対数を、正倍数体であると仮定される１つ又は複数の参照染色体と比較することによって達成することができる。また、これらの方法を拡張して、異数体症例を含むことができることに留意されたい。

【0579】

単一遺伝子疾患スクリーニング
一実施形態において、胎児の倍数性状態を決定するための方法は、単一遺伝子障害についての同時試験を可能にするように拡張されてもよい。単一遺伝子疾患の診断は、異数体検査に使用されるのと同じ標的化アプローチを活用し、追加の特定の標的を必要とする。一実施形態において、単一遺伝子ＮＰＤの診断は、連鎖解析によるものである。多くの場合、母体ＤＮＡの存在により、胎児が母体の変異を継承しているかどうかを決定することが事実上不可能になるため、ｃｆＤＮＡサンプルの直接検査は信頼できない。独自の父系由来対立遺伝子の検出はそれほど困難ではないが、疾患が優性であり、父親によって運ばれる場合にのみ完全に有益であり、アプローチの有用性を制限する。一実施形態において、本方法は、ＰＣＲ又は関連する増幅アプローチを伴う。

【0580】

いくつかの実施形態において、本方法は、第一級の親戚からの情報を使用して、異常な対立遺伝子を、親において非常に密接に連結されたＳＮＰを囲んで段階的に進行させることを伴う。次いで、これらのＳＮＰから得られた標的化配列決定データ上でＰａｒｅｎｔａｌＳｕｐｐｏｒｔを実行して、正常又は異常なホモログが両方の親から胎児によって継承されたかを決定してもよい。ＳＮＰが十分に連結している限り、胎児の遺伝子型の遺伝は非常に確実に決定することができる。いくつかの実施形態において、本方法は、（ａ）異数性検査のために、特定の一般的な疾患のセットに密に隣接するＳＮＰ遺伝子座のセットを本発明の多重プールに追加することと、（ｂ）これらの追加されたＳＮＰからの対立遺伝子を、様々な親戚からの遺伝子データに基づいて、正常及び異常対立遺伝子で確実に位相決定することと、（ｃ）疾患遺伝子座を囲む領域内の遺伝的母系及び父系相同体上の胎児二重型又は位相ＳＮＰ対立遺伝子のセットを再構築して、胎児遺伝子型を決定することと、を含む。いくつかの実施形態において、疾患連結遺伝子座に密接に連結された追加のプローブが、異数性試験に使用されている多型遺伝子座のセットに追加される。

【0581】

サンプルが母体ＤＮＡ及び胎児ＤＮＡの混合物であるため、胎児二倍型の再構築は困難である。いくつかの実施形態において、本方法は、ＳＮＰ及び疾患対立遺伝子の相対的情報を組み込み、次いで、ＳＮＰの物理的距離及び位置特異的組換え尤度からの組換えデータ及び母体血漿の遺伝子測定から観察されるデータを考慮して、胎児の最も尤度の高い遺伝子型を得る。

【0582】

一実施形態において、疾患連結遺伝子座当たりの追加のプローブの数は、標的多型遺伝子座のセットに含まれ、疾患連結遺伝子座当たりの追加のプローブの数は、４～１０、１１～２０、２１～４０、４１～６０、６１～８０、又はそれらの組み合わせであってもよい。

【0583】

サンプル中のＤＮＡ分子の数を決定すること。
第１ラウンドのＤＮＡ増幅中に、サンプル中の各元のＤＮＡ分子について一意に特定された分子を生成することによって、サンプル中のＤＮＡ分子の数を決定する方法が本明細書に記載される。単一の分子又はクローン配列決定方法が続く、上記末端を達成するための手順が本明細書に記載される。

【0584】

このアプローチは、１つ以上の特定の遺伝子座を標的化し、各標的遺伝子座からのタグ付き分子の大部分又は全てが独自のタグを有し、クローン又は単一分子配列決定を使用してこのバーコードの配列決定時に互いに区別され得るような方法で、元の分子のタグ付きコピーを生成することを伴う。各一意の配列決定されたバーコードは、元のサンプル中の一意の分子を表す。同時に、配列決定データを使用して、分子が由来する遺伝子座を確認する。この情報を使用して、各遺伝子座についての元のサンプル中の固有の分子の数を決定することができる。

【0585】

この方法は、元のサンプル中の分子数の定量的評価が必要な任意の用途に使用することができる。更に、１つ以上の標的の独自の分子の数は、相対コピー数、対立遺伝子分布、又は対立遺伝子比を決定するために、１つ以上の他の標的に対する独自の分子の数に関連し得る。代替的に、様々な標的から検出されたコピーの数は、元の標的のコピーの最も可能性の高い数を同定するために、分布によってモデル化することができる。用途としては、限定されないが、デュシェンヌ筋ジストロフィーの担体に見られるものなどの挿入及び欠失の検出、コピー数バリアントで観察されるものなどの染色体の欠失又は重複セグメントの定量化、生まれた個体からのサンプルの染色体コピー数、胚又は胎児などの生まれていない個体からのサンプルの染色体コピー数が挙げられる。

【0586】

本方法は、配列による標的化に含まれるバリエーションの同時評価と組み合わせることができる。これを使用して、元のサンプル中の各対立遺伝子を表す分子の数を決定することができる。このコピー数法は、ＳＮＰ又は他の配列バリエーションの評価と組み合わせて、生まれた個体及び生まれていない個体の染色体コピー数、短い配列バリエーションを有するが、ＰＣＲが脊髄筋萎縮の担体検出などの複数の標的領域から増幅し得る遺伝子座からのコピーの識別及び定量化、母体血漿から得られた遊離浮遊ＤＮＡからの胎児異数性の検出など、異なる個体の混合物からなるサンプルからの分子の異なる供給源のコピー数の決定を決定することができる。

【0587】

一実施形態において、単一の標的遺伝子座に関する方法は、以下の工程のうちの１つ以上を含み得る：（１）特定の遺伝子座のＰＣＲ増幅のための標準的なオリゴマー対を設計すること。（２）合成中に、標的遺伝子座又はゲノムに無相補性又は最小限の相補性を有する特定の塩基の配列を、標的特異的オリゴマーのうちの１つの５’末端に付加すること。テールと呼ばれるこの配列は、その後の増幅に使用される既知の配列であり、その後にランダムなヌクレオチドの配列が続く。これらのランダムヌクレオチドは、ランダム領域を含む。ランダム領域は、各プローブ分子間で確率的に異なる核酸のランダムに生成された配列を含む。したがって、合成後、テールオリゴマープールは、既知の配列に続いて分子間で異なる未知の配列、続いて標的特異的配列から始まるオリゴマーの集合からなる。（３）テールオリゴマーのみを用いた１ラウンドの増幅（変性、アニーリング、伸長）を行うこと。（４）エキソヌクレアーゼを反応に添加し、ＰＣＲ反応を効果的に停止させ、反応を適切な温度でインキュベートして、テンプルにアニールせず、伸長して二本鎖生成物を形成した前方一本鎖オリゴを除去すること。（５）反応物を高温でインキュベートしてエキソヌクレアーゼを変性させ、その活性を除去すること。（６）反応に、第１の反応で使用されるオリゴマーのテールに相補的な新しいオリゴヌクレオチドを、他の標的特異的オリゴマーとともに添加して、第１ラウンドのＰＣＲで生成された生成物のＰＣＲ増幅を可能にすること。（７）増幅を継続して、下流のクローン配列決定のための十分な生成物を生成すること。（８）配列にまたがるのに十分な数の塩基まで、多数の方法、例えば、クローン配列決定によって、増幅ＰＣＲ産物を測定すること。

【0588】

一実施形態において、本開示の方法は、複数の遺伝子座を並行的又は他の方法で標的化することを含む。異なる標的遺伝子座へのプライマーを独立して生成し、混合して、多重ＰＣＲプールを作成することができる。一実施形態において、元のサンプルは、サブプールに分割されてもよく、異なる遺伝子座は、組換え及び配列決定される前に、各サブプールにおいて標的化されてもよい。一実施形態において、タグ付け工程及びいくつかの増幅サイクルは、プールが細分化される前に実行されてもよく、分割前の全ての標的の効率的な標的化を確実にし、細分化されたプール内のより小さいセットのプライマーを使用して増幅を継続することによって後続の増幅を改善する。

【0589】

この技術が特に有用であろう出願の一例は、所与の遺伝子座における対立遺伝子の比率又はいくつかの遺伝子座における対立遺伝子の分布を使用して、胎児に存在する染色体のコピー数を決定するのを助けることができる、非侵襲性出生前異数性診断である。この文脈において、様々な対立遺伝子の相対量を維持しながら、初期サンプル中に存在するＤＮＡを増幅することが望ましい。いくつかの状況において、特に、非常に少量のＤＮＡ、例えば、ゲノムの５，０００コピー未満、ゲノムの１，０００コピー未満、ゲノムの５００コピー未満、及びゲノムの１００コピー未満が存在する場合、ボトルネックと呼ばれる現象に遭遇する可能性がある。これは、初期サンプル中に任意の所与の対立遺伝子の少数のコピーが存在する場合であり、増幅バイアスは、ＤＮＡの初期混合物中とは有意に異なる対立遺伝子の比率を有するＤＮＡの増幅プールをもたらし得る。標準的なＰＣＲ増幅の前に、ＤＮＡの各鎖に独自又はほぼ独自のバーコードのセットを適用することによって、同じ元の分子に由来する配列決定されたＤＮＡのｎ個の同一の分子のセットからｎ－１個のＤＮＡのコピーを除外することが可能である。

【0590】

例えば、個体のゲノムにおけるヘテロ接合性ＳＮＰ、及び各対立遺伝子の１０個の分子がＤＮＡの元のサンプルに存在する個体からのＤＮＡの混合物を想像する。増幅後、その遺伝子座に対応するＤＮＡの１００，０００個の分子があってもよい。確率的プロセスのために、ＤＮＡの比率は、１：２～２：１のいずれかの場所であり得るが、元の分子の各々が独自のタグでタグ付けされたため、増幅されたプール中のＤＮＡが、各対立遺伝子からのＤＮＡの正確な１０の分子に由来することを決定することが可能である。したがって、この方法は、このアプローチを使用しない方法よりも、各対立遺伝子の相対量のより正確な測定を与えるであろう。対立遺伝子バイアスの相対量を最小化することが望ましい方法については、この方法は、より正確なデータを提供する。

【0591】

配列決定されたフラグメントの標的遺伝子座への会合は、いくつかの方法で達成することができる。一実施形態において、分子バーコードにまたがるのに十分な長さの配列が、標的遺伝子座の明確な同定を可能にするのに十分な数の標的化配列に対応する独自の塩基とともに、標的フラグメントから得られる。別の実施形態において、ランダムに生成された分子バーコードを含む分子バーコードプライマーはまた、それが会合する標的を同定する遺伝子座特異的バーコード（遺伝子座バーコード）を含むことができる。この遺伝子座のバーコードは、個々の標的ごとの全ての分子バーコードプライマー間で同一であり、したがって、得られる全ての増幅子は同一であるが、他の全ての標的とは異なる。一実施形態において、本明細書に記載のタグ付け方法は、片側ネストプロトコルと組み合わせられてもよい。

【0592】

一実施形態において、分子バーコード化プライマーの設計及び生成は、以下のように実践するために還元されてもよい：分子バーコード化プライマーは、標的配列に相補的ではない配列、続いてランダムな分子バーコード領域、続いて標的特異的配列から構成されてもよい。分子バーコードの配列５’は、子配列ＰＣＲ増幅に使用されてもよく、配列決定のためのライブラリへの増幅子の変換に有用な配列を含んでもよい。ランダム分子バーコード配列は、多数の方法で生成することができる。好ましい方法は、バーコード領域の合成中の反応に４つの塩基全てを含むような方法で、分子タグ付けプライマーを合成する。塩基の全て又は様々な組み合わせは、ＩＵＰＡＣＤＮＡ曖昧性コードを使用して指定され得る。このようにして、分子の合成コレクションは、分子バーコード領域内の配列のランダム混合物を含む。バーコード領域の長さは、固有のバーコードを含むプライマーの数を決定する。一意の配列の数は、Ｎ^Ｌとしてバーコード領域の長さに関連し、式中、Ｎは、塩基の数、典型的には４であり、Ｌは、バーコードの長さである。５つの塩基のバーコードは、最大１０２４個の一意の配列をもたらすことができ、８つの塩基のバーコードは、６５５３６個の一意のバーコードをもたらすことができる。一実施形態において、ＤＮＡは、配列決定方法によって測定することができ、配列データは、単一分子の配列を表す。これには、単一分子が直接配列決定される方法、又は単一分子が増幅されて配列決定装置によって検出可能なクローンを形成するが、依然として単一分子を表す方法（本明細書ではクローン配列決定と呼ばれる）が含まれ得る。

【0593】

更なる実施形態
いくつかの実施形態において、妊娠中の胎児における染色体の決定された倍数性状態を開示する報告を生成するための方法が本明細書に開示され、この方法は、胎児の母親からＤＮＡ、胎児のＤＮＡを含む第１のサンプルを得ることと、胎児の一方又は両方の親から遺伝子型データを得ることと、調製されたサンプルを得るためにＤＮＡを単離することによって第１のサンプルを調製することと、複数の多型遺伝子座で調製されたサンプル中のＤＮＡを測定することと、コンピュータ上で、調製されたサンプルについて行われたＤＮＡ測定からの複数の多型遺伝子座における対立遺伝子数又は対立遺伝子数の確率を計算することと、コンピュータ上で、染色体の異なる可能な倍数性状態についての染色体上の複数の多型遺伝子座における対立遺伝子数の予測される確率に関する複数の倍数性仮説を作成することと、コンピュータ上で、１つ又は両方の胎児の親から遺伝子型データを用いて、染色体上の各多型遺伝子座の対立遺伝子数の結合分布モデルを構築することと、コンピュータ上で、結合分布モデル及び調製されたサンプルについて計算された対立遺伝子数確率を用いて倍数性仮説の各々の相対確率を決定することと、最大確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールすることと、決定された倍数性状態を開示する報告を生成することと、を含む。

【0594】

いくつかの実施形態において、本方法は、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性状態を決定するために使用され、本方法は、調製された各サンプル中の胎児起源のＤＮＡの割合を決定することを更に含み、調製されたサンプル中のＤＮＡを測定する工程は、調製された各サンプル中のいくつかのＤＮＡ分子を配列決定することによって行われ、より多くのＤＮＡ分子が、より多くの画分の胎児ＤＮＡを有するそれらの調製されたサンプルよりも少ない画分の胎児ＤＮＡを有するそれらの調製されたサンプルから配列決定される。

【0595】

いくつかの実施形態において、本方法は、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性状態を決定するために使用され、調製されたサンプル中のＤＮＡの測定が、各々の胎児について、調製されたＤＮＡのサンプルの第１の画分を配列決定して第１の測定値のセットを与えることによって行われ、本方法は、胎児の各々について、ＤＮＡ測定値の第１のセットが与えられた場合に、倍数性仮説の各々について第１の相対的確率決定を行うことと、それらの胎児から調製されたサンプルの第２の画分を再配列することであって、倍数性仮説の各々について、第１の相対確率決定が、異数性胎児に対応する倍数性仮説が、有意であるが決定的でない確率を有することを示し、第２の測定値のセットを与える、再配列することと、第２の測定のセット、及び任意選択で第１の測定のセットを使用して、胎児についての倍数体仮説について第２の相対確率決定を行うことと、第２の相対確率決定により決定された最大の確率を有する仮説に対応する倍数性状態を選択することによって、第２のサンプルが再配列決定された胎児の倍数性状態をコールすることと、を更に含む。

【0596】

いくつかの実施形態において、物質の組成物は開示され、物質の組成物は優先的に濃縮されたＤＮＡのサンプルを含み、優先的に濃縮されたＤＮＡのサンプルが、ＤＮＡの第１のサンプルからの複数の多型遺伝子座において優先的に濃縮され、ＤＮＡの第１のサンプルが、母体ＤＮＡ及び母体血漿に由来する胎児ＤＮＡの混合物からなり、濃縮度は、少なくとも２倍であり、第１のサンプルと優先的に濃縮されたサンプルとの間の対立遺伝子バイアスは、平均して、２％未満、１％未満、０．５％未満、０．２％未満、０．１％未満、０．０５％未満、０．０２％未満、及び０．０１％未満からなる群から選択される。いくつかの実施形態において、そのような優先的に濃縮されたＤＮＡのサンプルを作製する方法が開示される。

【0597】

いくつかの実施形態において、胎児及び母体ゲノムＤＮＡを含む母体組織サンプル中の胎児異数性の存在又は非存在を決定するための方法が開示され、本方法は、（ａ）当該母体組織サンプルから胎児及び母体ゲノムＤＮＡの混合物を得ることと、（ｂ）複数の多型対立遺伝子において胎児及び母体ＤＮＡの混合物を選択的に濃縮することと、（ｃ）工程ａの胎児及び母体ゲノムＤＮＡの混合物から選択的に濃縮されたフラグメントを分配して、単一のゲノムＤＮＡ分子又は単一のゲノムＤＮＡ分子の増幅産物を含む反応サンプルを提供することと、（ｄ）工程ｃ）の反応サンプル中のゲノムＤＮＡの選択的に濃縮されたフラグメントの大規模に平行なＤＮＡ配列決定を行い、当該選択的に濃縮されたフラグメントの配列を決定することと、（ｅ）工程ｄ）で得られた配列が属する染色体を同定することと、（ｆ）工程ｄ）のデータを分析して、ｉ）母体及び胎児の両方で２倍体であると推定される少なくとも１つの第１の標的染色体に属する工程ｄ）からのゲノムＤＮＡのフラグメントの数、及びｉｉ）胎児の２倍体であると推定される第２の標的染色体に属する工程ｄ）からのゲノムＤＮＡのフラグメントの数を決定することと、（ｇ）工程ｆ）パートｉ）で決定された数を使用して、第２の標的染色体が２倍体の場合、第２の標的染色体について、工程ｄ）に由来するゲノムＤＮＡのフラグメントの数の予測分布を計算することと、（ｈ）工程ｆ）パートｉ）である第１の数及び工程ｂ）の混合物中に見出される胎児ＤＮＡの予測画分を使用して、第２の標的染色体が異数体である場合、第２の標的染色体について、工程ｄ）からのゲノムＤＮＡのフラグメントの数の予測分布を計算することと、（ｉ）最大尤度又は最大事後アプローチを使用して、工程ｆ）パートｉｉ）で決定されたゲノムＤＮＡのフラグメントの数が、工程ｇ）で計算された分布又は工程ｈ）で計算した分布の一部であるかどうかを決定し、それによって胎児の異数性の有無を示すことと、を含む。

【実施例】

【0598】

実施例１
Ｐｅｒｇａｍｅｎｔｅｔａｌ．，Ｏｂｓｔｅｔｒｉｃｓ＆Ｇｙｎｅｃｏｌｏｇｙ１２４：２１０－２１８（２０１４）に記載されるＳＮＰベースのＮＩＰＴ検査は、その全体が参照により本明細書に組み込まれる。Ｄａｒｅｔａｌ．，ＡｍｅｒｉｃａｎＪｏｕｒｎａｌｏｆＯｂｓｔｅｔｒｉｃｓ＆Ｇｙｎｅｃｏｌｏｇｙ１：ｅ１－ｅ１７（２０１４）に記載されるＳＮＰベースのＮＩＰＴ検査は、その全体が参照により本明細書に組み込まれる。Ｒｙａｎｅｔａｌ．，ＦｅｔａｌＤｉａｇｎ．Ｔｈｅｒ．４０：２１９－２２３（２０１６）に記載されるＳＮＰベースのＮＩＰＴ検査は、その全体が参照により本明細書に組み込まれる。

【0599】

実施例２
無細胞ＤＮＡ（ｃｆＤＮＡ）を用いた非侵襲的な出生前検査は、妊娠中の異数性スクリーニングにますます使用されている。この試験は、２１トリソミーの検出に対して非常に高い感度及び特異性を示すが、ｃｆＤＮＡスクリーニング試験の割合は、結果を報告しない。

【0600】

検査失敗の最も一般的な理由は、不適切な胎児ｃｆＤＮＡである（例えば、不適切な胎児ｃｆＤＮＡは、部分分解又はバイアス表現などによる低胎児画分ＤＮＡ及び低品質ＤＮＡを包含する）が、これは、配列決定結果が解釈不可能又は妥当でない場合にも発生する可能性がある。胎児ｃｆＤＮＡは、主に胎盤トロホブラストのアポトーシスから生じる。胎児画分（ＦＦ）と呼ばれる胎児ｃｆＤＮＡの画分は、胎盤の成長及び機能を反映する。小さな胎盤又は不良な胎盤機能が、異数性及びいくつかの有害な周産期転帰に関連している可能性があることはよく知られている。これが妊娠初期の胎児ｃｆＤＮＡの少ない量に反映されているかどうかは仮定されているが、データは比較的限られている。いくつかの研究は、胎児画分（ＦＦ）及び染色体異常及び他の有害な周産期転帰との間の関連性を報告している。しかしながら、そのような研究は、小さいサンプル数及び全ての転帰の不完全なフォローアップによって制限されている。

【0601】

胎児画分は、より低い胎児画分が異数体と正倍数体胎児を区別することをより困難にするため、重要な品質指標である。異なる研究室は異なる分析技術を用いるが、胎児の遺伝子型又は倍数性状態は、胎児のｃｆＤＮＡの割合が低い場合には、より見分けることが困難である。このため、専門家協会は、実験室が胎児画分を報告することを推奨し、不十分な胎児ｃｆＤＮＡが存在する場合、多くは結果を報告しない。

【0602】

したがって、この研究の主な目的は、完全な遺伝的及び産科的転帰を有する患者の大規模なコホートにおけるｃｆＤＮＡスクリーニングに関する報告不可能な結果を伴う妊娠の転帰を決定することであった。追加的に、コールなし結果を最小限に抑えるように設計されたアルゴリズムの結果を評価した。

【0603】

方法
これは、２２ｑ１１．２欠失症候群に対するｃｆＤＮＡスクリーニングの多施設前向き観察研究の二次解析であった。参加施設でトリソミー１３、１８、及び２１、並びに２２ｑ欠失症候群についてスクリーニングされた全ての女性は、適格であった。登録された患者は、妊娠転帰データの収集及び新生児遺伝子検査に同意し、参加者全員が書面による同意を提供した。染色体マイクロアレイ、核型、又は他の確認的診断検査は、全ての胎児又は新生児で行われ、周産期及び産科の転帰は、全ての妊娠において得られた。参加者は、米国、ヨーロッパ、及びオーストラリアの６か国の２１の施設で登録された。この試験は、各施設の治験審査委員会又は倫理委員会によって承認された。

【0604】

参加者。適格な女性は、異数性及び２２ｑ１１．２欠失症候群のスクリーニングを要請し、受け、１８歳以上、妊娠９週間以上、単胎妊娠し、治験施設関連病院での分娩を計画していた。女性は、登録前にｃｆＤＮＡ結果を受けた場合、臓器移植の病歴がある場合、卵子提供を使用して妊娠した場合、双子がいなくなった場合、又は新生児サンプルを提供したくない、又は提供できない場合に除外された。胎児異常の異数性又は超音波検査検出のための血清スクリーニングを受けた女性は、組み入れ対象とした。参加者は、登録に対する報酬を受け取らなかった。ＣｆＤＮＡスクリーニングの結果は、臨床ケアの一部として提供者及び患者によって利用された。

【0605】

収集された変数には、母体及び産科の特徴、報告不可能な結果の理由、胎児画分、遺伝的転帰、及び子癇前症、早産、及び胎児発育遅延を含む周産期転帰、並びに生児出生の全体的な割合が含まれた。

【0606】

曝露。第１又は第２のｃｆＤＮＡスクリーニング試験で異数性について報告不可能な結果を有する患者を、報告された結果を有する患者と比較した。異数性の結果を有するが、２２ｑ１１．２欠失症候群のリスクが報告可能でなかった患者は、提供された結果群に含まれた。

【0607】

手順。ＣｆＤＮＡの分析は、出願人によって行われた。結果が得られなかった症例では、患者をローカルプロトコルに従って管理した。検査室では、最初の報告不可能な結果のほとんどの患者で再検査を行うことを推奨している。サブセットでは、検査室アルゴリズムは、再検が成功する可能性が低いことを示しているため、再検は推奨されない。報告不可能な結果の異なる原因の意味はよく知られておらず、患者は検査室の推奨にかかわらず再検査を拒否又は要求する可能性があるため、最初及び２番目の報告不可能な結果を有する患者における再検査のパフォーマンス及び結果に従って患者を分析した。また、総群の転帰を報告したが、１又は２回の報告不可能な検査の結果は得られなかった。他のサブ群の転帰は、表５に含まれる。

【0608】

登録中、ｃｆＤＮＡラボラトリープロトコルを１回修正した。両方の期間の結果を組み合わせて分析した（元のアルゴリズム）。登録が完了した後、検査室は、検出を改善し、報告不可能な結果の率を低下させるために、第３の更新されたアルゴリズムを開発した。この更新されたプロトコルは、転帰を盲検化して評価され、この分析からの結果は、二次転帰として提示される。

【0609】

遺伝的転帰は、胎児（絨毛性絨毛サンプリング、羊水穿刺、又は受胎産物）又は乳児（臍帯血、口腔スワブ、又は新生児血液斑点）サンプルを分析することによって評価した。全ての場合について、事前の出生前診断遺伝子検査にかかわらず、染色体マイクロアレイ分析（ＣＭＡ）のために、妊娠終了時にサンプルを要求した。出生後ＣＭＡは、臨床結果又は他の検査結果に盲目であった独立した検査室（ＣｅｎｔｅｒｆｏｒＡｐｐｌｉｅｄＧｅｎｏｍｉｃｓ，Ｃｈｉｌｄｒｅｎ’ｓＨｏｓｐｉｔａｌｏｆＰｈｉｌａｄｅｌｐｈｉａ，ＰＡ）によって行われた。出生後ＣＭＡ確認が利用できなかった場合、出生前診断検査の結果（利用可能な場合）を遺伝子確認に使用した。

【0610】

確認的なＣＭＡ分析のために、ＤＮＡは、新生児の臍帯血、口腔塗抹標本、又は乾燥した血液斑点から調製した。異数体及び２２ｑ１１．２ＤＳを含むコピー数バリアントを、Ｉｌｌｕｍｉｎａ（ＳａｎＤｉｅｇｏ，ＣＡ，ＵＳＡ）ＳＮＰベースのＩｎｆｉｎｉｕｍＧｌｏｂａｌＳｃｒｅｅｎｉｎｇアレイ（ＧＳＡ）プラットフォームを使用して同定した。品質保証の目的のために、２つのサンプル中のＳＮＰ間のアライメントを使用して、ｃｆＤＮＡ結果及び新生児サンプルが正しくペアリングされたことを確認するための調和検定を開発した。ペアリングすることができなかったサンプルはいずれも除外された。

【0611】

転帰。この解析の主要転帰は、ｃｆＤＮＡスクリーニングで報告不可能な結果を有する患者における、異数性、妊娠＜２８週、＜３４週、及び＜３７週の早産、子癇前症、並びに胎児発育遅延を含む、有害な周産期転帰のリスクであった。第１及び第２の報告不可能な結果の後に、群を比較した。異数性は、早産又はＳＧＡと関連し得るため、有害な周産期転帰の割合は、正倍数体胎児を有する患者の部分集合において、並びにコホート全体において評価された。

【0612】

子癇前症の診断には、高血圧及びタンパク質尿、又は以前の正常血圧の女性における妊娠２０週後又は産後の高血圧及びタンパク質尿の有無にかかわらずの他の有意な終末器官機能障害の新たな発症が含まれ、患者をケアする照会提供者は、各施設で子癇前症と診断された。早産転帰には、妊娠＜２８週、３４週、及び＜３７週時の自然分娩又は適応分娩が含まれた。胎児発育遅延（ＳＧＡ）は、妊娠期間のための乳児出生体重＜１０％ｉｌｅとして定義された。我々はまた、子癇前症、ＰＴＢ＜３７週、ＳＧＡ出産、又は死産を含む複合的な周産期転帰の率を評価した。

【0613】

また、母体年齢、未産、妊娠期間、ＢＭＩ、人種、補助生殖を伴う受胎、及び喫煙状態（妊娠中に喫煙しなかった場合と喫煙した場合）に関して、報告されたｃｆＤＮＡスクリーニング結果を有する女性の特徴と報告不可能な検査結果を比較した。更に、診断検査（羊水穿刺又は絨毛性絨毛サンプリング）の使用、胎児画分、及び胎児異常の存在を含む妊娠因子を比較した。

【0614】

多変数解析を実施し、報告不可能な結果又は胎児画分に関連することが知られている変数を調整した。

【0615】

統計分析。主要研究は、２２ｑ１１．２欠失症候群の出生率に基づいて、１０，０００人の参加者の初期計画サンプル数を有した。治験中、２２ｑ１１．２ＤＳの有病率が低下する可能性があることが懸念され、サンプル数を２０，０００に増加した。ＣｆＤＮＡ検査、妊娠転帰データ、及び胎児又は新生児の遺伝子確認検査を受けた全ての参加者は、この二次分析の対象となった。連続変数を、ウィルコクソン検定を使用して比較し、カイ二乗検定又はフィッシャーの正確検定を使用して分類変数を比較した。マクネマーの検定を、交絡因子を制御する多変数解析の対合解析及びロジスティック回帰に使用した。

【0616】

アルゴリズム。アルゴリズムの観点から、低リスクディープニューラルネットワーク（ＬＲ－ＤＮＮ）を使用したコールなし率の低下を観測した。ディープラーニングは、ノイズをモデル化し、より良好な特異性を達成するだけでなく、ノーコール率を低下させるために使用される。ディープ混合エキスパート（ＭｏＥ）タイプのニューラルネットワークのアンサンブルを採用し、複数の独立したネットワークを使用して、標的化配列決定データの異なる固有の特徴をモデル化し、結果を確率スコアに組み合わせる。各症例の異数性仮説は、排除される前に、アンサンブルから少なくとも３つの個々のＭｏＥニューラルネットワークを介してフィルタリングされる。ネットワークは、現在のパノラマアルゴリズムによってコールされ、場合によっては臨床フォローアップで確認され、自己教師あり学習（ｓｅｌｆ－ｓｕｐｅｒｖｉｓｅｄｔｒａｉｎｉｎｇ）と混合された、母親及び胎児のｃｆＤＮＡサンプルの配列決定された混合物に関する様々な訓練戦略を使用して訓練される。この訓練戦略は、アンサンブル内の分類子間のサンプルの真の状態を考慮すると、相関を低減し、したがって、そのようなフィルタリングアンサンブルによって必要とされる非常に高い感度に到達することができる。

【0617】

また、高リスク２２ｑディープニューラルネットワークを用いた２２ｑの高リスク症例の同定にも改善が見られた。この場合、ディープラーニングを使用してノイズをモデル化し、より良い感度を実現する。２２ｑの欠失を検出するために、標的化配列決定データの固有の特徴をモデル化するために複数の独立したネットワークを使用し、結果を確率スコアに組み合わせる、ディープ混合エキスパートニューラルネットワークを採用する。ネットワークは、ＳＮＰ間の連結を利用して、より信頼性の高いコールを提供することを学ぶ。ネットワークは、Ａ～Ｄ領域における大規模及び中規模の欠失、並びにＣ～Ｄサブ領域における約０．５Ｍｂまでの小さな欠失をコールするように訓練される。訓練アルゴリズムは、自己監督され、母親及び胎児のｃｆＤＮＡサンプルの配列決定された混合物を活用する。

【0618】

続いて、Ｈｅｔｒａｔｅｖ３．２及びＱＭＭ２２ｑを使用して、それぞれ、異数体領域の全体的なコールなし率を改善し、ＤｉＧｅｏｒｇｅ領域のＰＰＶを改善した。Ｈｅｔｒａｔｅｖ３．２では、以下のような変更が導入された：ＳＮＰ連結機能の導入は、ＤｉＧｅｏｒｇｅセグメントなどのＳＮＰが密接に相関するセグメントに大きな影響を与え、その結果、感度及び特異性が改善される。観察された配列データのより正確なモデリング並びに改善された感度及び特異性をもたらす、サンプル数に基づいて精製されるＳＮＰ特異的確率モデルの導入。

【0619】

ＱＭＭ２２ｑアルゴリズムは、パノラマＱＭＭと同じ原理で動作する。すなわち、コアでは、検査領域上の定量的シグナルと他の領域上のシグナルとの比較を可能にするモデルを構築する。パノラマＱＭＭは、染色体１３、１８、及び２１、並びにＤｉＧｅｏｒｇｅ（２２ｑ）に関連するマイクロ欠失をカバーする約１０，０００個のＳＮＰのパネル上で実行される。パネル内の包含のために選択するＳＮＰがより少ない２２ｑ領域について、全てのＳＮＰが同様の増幅子特性を有することを確実にすることは困難である。２２ｑ上のＳＮＰについての増幅子特性が他の染色体と比較して大きい変動は、パネル全体を含むときに定量的モデル適合が不十分であることをもたらす。これに対処するために、２つの定量的モデルを構築する。染色体、パノラマＱＭＭと呼ばれる２２ｑを除くパネル用の１つ。ＳＮＰのトリミングされたセットのための他のモデル、約４，０００、２２ｑ及び他の領域をカバーする類似の増幅子特性を有する。このトリミングされた定量モデルを使用して、２２ｑ、ＱＭＭ２２ｑをコールする。

【0620】

結果
試験参加者。２０１５年４月から２０１９年１月までに、２１施設から２５，８９２人の女性がスクリーニングを受け、２０，８８７人が登録された。全体では、５４．８％が米国で、４５．２％がヨーロッパ又はオーストラリアで登録されている。登録された参加者のうち、１１１６人（５．３％）が追跡不能となり、妊娠転帰は不明であり、９４名（０．５％）が脱落した。全ての除外の後、研究コホートには、ｃｆＤＮＡ、胎児又は新生児の遺伝子確認検査、及び妊娠転帰に関するデータを有する１９，６７７人（９４．２％）の参加者が含まれた。

【0621】

登録時の平均母体年齢及び妊娠期間は、それぞれ３３．６歳及び１３．３週であり、参加者の４４％が未産であった（表１）。全体として、１０３人（０．６％）は、超音波で胎児異常を検出した後に、９４人（０．５％）は、嚢胞性湿腫又は３ｍｍ以上の頸部半透明性（ＮＴ）の診断後に、６１６人（３．４％）は、異数性のための血清分析物スクリーニングの高リスク結果に続いてｃｆＤＮＡを有した。

【0622】

主要及び二次転帰。６７９人の患者、すなわち３．４％が、最初のｃｆＤＮＡ採取で報告不可能な結果を有した。これらのうち、２２５人（３３．１％）は胎児画分が低く、カットオフは２．８％であった。いくつかの場合では、ＦＦを測定することができなかったため、同様の数は、ＦＦ２＞．８％（ｎ＝２１７、３２．０％）又はＦＦが報告されていない（ｎ＝２３７、３３．１％）と解釈不可能な配列決定結果のために報告不可能であった。報告不可能な結果を有する６７９人の患者のうち、４７０人は、再採取及び試験の２回目の検査を試み、このうちの１２４人（１８．３％）は、２回目の報告不可能な検査を有した。２０９人の患者において、再採取は得られなかった、これは、１回又は２回の検査試行のいずれかの後に報告可能な結果が得られない合計３３３人（１．７％）の患者を残した。

【0623】

報告不可能な検査を有する患者は、コホート全体と比較して、同様の母体年齢（３３．６対３３．５歳、ｐ＝０．９７）を有し（４３．４％対４７．２％、ｐ＝．０５４）、平均妊娠期間はより高かった（１４．４対１３．３週、ｐ＜．００１）。ＢＭＩは、特に２つのそのような検査（２６．３対３１．４対３４．４ｋｇ／ｍ^２、ｐ＜．００１）で、報告不可能な検査で高かった。胎児画分は、報告不可能な群で低く、特に、平均ＦＦが２．７％であった２つの報告不可能な検査を行った群で低かった。ＩＶＦ及び喫煙の割合は、群間で相違しなかった。（表２）

【0624】

出生前又は出生後の診断試験によって確認されたように、コホート全体に１３３のトリソミーがあった。これには、２１トリソミーの１００症例、１８トリソミーの１８症例、１３トリソミーの１５症例が含まれた。最初の採取で報告不可能な結果の割合は、トリソミーによって異なり、２１トリソミーで３％（３／１００）、１８トリソミーで１１％（２／１８）、１３トリソミーで３３％（５／１５）であった（ｐ＜．００１）。全体として、トリソミーに罹患した１０例（７．５％）の妊娠において、ｃｆＤＮＡスクリーニングは、最初の採取では、報告不可能であった。これらの患者のうちの４人は、第２の検査を提出した。２１トリソミーのうちの１つの症例は、高リスクとして生じ、１８トリソミーのうちの１つの症例は、低リスクとして生じ、他の２つの症例は、再び報告不可能であった。結果が報告不可能な結果を有する患者の１．６％（１０／６１３、ｐ＝０．０１３）と比較して、コホート内の結果の症例における異数性の割合は、０．７％（１２３／１７，８８４）であった。

【0625】

異数体を有する症例を除外した後、＜２８週、＜３４週、及び＜３７週の早産率、子癇前症、及びＳＧＡは、全て、報告不可能試験を有する患者において有意に増加した。（表３）。妊娠＜３４週の全早産率は、正常な結果を有する患者で３．１％であり、第１の試験で１０．５％、第２の非報告試験で１７．９％に増加した（ｐ＜．００１）。子癇前症は、報告不可能な検査でも増加し、１回及び２回の報告不可能な検査でそれぞれ４．０％から８．６％及び１５．３％に増加した（ｐ＜．００１）。複合的な周産期転帰の割合は、結果の症例において１８．３％であったのに対し、第１の採取上でのコールなしでの３１．１％、及び第２のノーコール検査後の４３．４％であった。全ての妊娠の転帰を評価し、選択的終了を含む場合、生児出生率は、１回目及び２回目の投与後に結果が得られなかった患者と比較して、報告可能な結果を有する患者で有意に高かった（それぞれ９７．５％対９２．１％、８７．１％）。２回目の採取が低リスク結果を提供した患者では、生児出生率は９７．５％であり、初期の低リスク結果を有する患者の率と同様であった。

【0626】

ＢＭＩ及び妊娠期間を調整する場合、任意の異数体のオッズ比（ａＯＲ）は、最初のノーコール後に２．２（１．１、４．５）であり、２回目のノーコール後に２．６（０．６、１０．７）であった。ＰＴＢ＜３４週間の妊娠のａＯＲは、２．７（９５％ＣＩ：２．０、３．５）であり、子癇前症のａＯＲは、１．４（９５％ＣＩ１．０、１．９）であり、ＳＧＡのａＯＲは、１．４（９５％ＣＩ：１．１、１．８）であった。第２の報告不可能な結果後の調整されたオッズ比は、早産＜３４週（４．２、９５％ＣＩ２．６、６．８）、及び子癇前症（２．１、９５％ＣＩ１．２，３．７）について更に増加したが、ＳＧＡ（１．４、９５％ＣＩ０．８，２．７）については増加しなかった。生児出生の確率は、コホート全体よりも低く、１回の報告不可能な検査後に０．３０（９５％ＣＩ０．２２～０．４０）、２回の報告後に０．２０（９５％ＣＩ０．１１、０．３５）のａＯＲであった。最後に、通話結果がない理由に基づいて転帰を比較し、ＦＦ２．８％、＞２．８％、又はＦＦが測定されていない患者において、異数性又は有害な周産期転帰の割合に差は見られなかった。（表５）

【0627】

更新されたアルゴリズムを確認遺伝子検査を行った１８，９７５例に適用し、コールなし率を１．５％に低下させた（Ｎ＝２７３）。このうち、１９５人が再採取を行い、２７人が２回目のコールなし結果を得た。ＰＴＢ＜３７週の割合は、最初の採取で結果が得られた患者では７．６％であり、最初の採取でコールなしの患者では１７．４％であり、２回目の採取でコールなしの患者では４４．４％であった（ｐ＜．００１）。子癇前症の割合は、これらの同じ群で４．１％から６．６％に１８．５％に同様に増加したが、複合転帰は１７．４％、２８．４％、５１．９％であり、０、１、及び２のコールなしの結果であった。（表６）

【0628】

考察
これらの知見は、ｃｆＤＮＡスクリーニング上の報告不可能な結果を有する患者が、異数体並びに早産、子癇前症、及び妊娠中の小さい出産を含む多くの有害転帰のリスクが高いことを実証する。異数体を有する妊娠の７．５％が、最初の採取で報告不可能な結果を有し、報告不可能なｃｆＤＮＡ検査が異数体のリスクを２倍以上にしたことを見出した。これらの妊娠はまた、有害な周産期転帰のリスクが上昇しており、これは再採取が再び報告不可能になったときに更に上昇した。有害な周産期転帰のリスクは、多重体妊娠でリスクが上昇したため、非正倍数体の増加率によって説明されなかった。

【0629】

いくつかの先行研究は、報告不可能な検査、胎児画分、及び異数体の関連性を調査しており、いくつかは、報告不可能なｃｆＤＮＡスクリーニング検査を有する患者におけるトリソミーのリスクの増加を報告している。Ｒｅｖｅｌｌｏｅｔａｌ．は、大規模なコホートについて報告し、報告不可能な検査を有する者は、１３及び１８トリソミーの増加率を有し、これは、より低いＦＦと関連していたことに留意した。結果を報告することができないことをもたらす低い胎児画分も、三倍体で報告されている。コホートでは、同様に、コールなし率は、１３トリソミー及び１８トリソミーで最も高いことが見出された。２１トリソミーではコールなし率は上昇しなかったが、２１トリソミーの設定ではコールなしの症例は３例であった。このリスクに対応して、ＡＣＭＧ、ＡＣＯＧ、及びＳＭＦＭなどの専門家団体は、報告不可能なｃｆＤＮＡ検査を有する患者に、遺伝子カウンセリング及び診断検査を含む更なる評価の選択肢を提供することを推奨する。データは、これらの推奨事項を裏付けている。

【0630】

多くの有害な周産期転帰は、異常な胎盤発達によって媒介される根底にある病因を共有し、胎盤形成障害は、広範囲の妊娠合併症に存在する。以前の研究者は、妊娠の高血圧障害又は胎盤形成障害によって媒介される他の合併症を発症する女性では、母親の血清中のｃｆＤＮＡレベルが変更される可能性があると仮定している。しかしながら、以前の研究では、低い胎児画分と子癇前症との関連が報告されているものもあれば、高い胎児画分との関連が報告されているものもあり、有意な関係は報告されていないものもある。低ＦＦはまた、既存の母体高血圧に関連しており、これらの患者は子癇前症の高いリスクを有する。何らかの原因による報告不可能なｃｆＤＮＡスクリーニング検査を評価した研究は少ない。そのような研究は、主に報告不可能な結果に関連する母体の特徴に焦点を当てているが、大規模なコホートでは周産期転帰を評価していない。

【0631】

Ｂｅｎｄｅｒｅｔａｌ．は、２７０１人の妊婦を対象としたレトロスペクティブコホート研究を実施し、妊娠第１期の胎児画分は、妊娠の高血圧障害と診断された女性において有意に低かったが、これは、妊娠期間によっていくぶん変化し、母体年齢、人種、体格指数、及び慢性高血圧を調整した後、もはや統計的に有意ではなかったことを見出した。Ｒｏｌｎｉｋｅｔａｌ．は、妊娠３４週前に分娩を必要とする子癇前症患者２０人、妊娠３４週時の子癇前症患者２０人、及び正常血圧対照２００人の症例対照研究において胎児画分を評価し、同様に、ＢＭＩ及び採取時の妊娠期間を調整した後、妊娠１１～１３週時の胎児画分と子癇前症との間に有意な関連は見られなかった。いくつかの他の研究者は、同様の知見を報告しているが、他の研究者は、妊娠第１期のｃｆＤＮＡレベルの上昇とその後の子癇前症の発症との間に有意な関連性を見出している。Ｇｅｒｓｏｎｅｔａｌ．は、低ＦＦといくつかの胎盤媒介性疾患との関連を研究し、ＦＦと子癇前症との関係を見出したが、早産又は妊娠年齢の小さいものではなかった。これらの以前の研究は、一般に、少数の症例によって制限された単一センター報告であり、ほとんどが重要な交絡因子を測定及び制御する機会が限られた症例対照研究であった。妊娠転帰に関する包括的な前向きデータ収集を含む大規模な多施設研究として、この研究は、報告不可能なｃｆＤＮＡスクリーニング結果の重要性の理解に不可欠な貢献を提供する。

【表11】