IP Force 特許公報掲載プロジェクト 2022.1.31 β版

知財求人 - 知財ポータルサイト「IP Force」

▶ ナテラ, インコーポレイテッドの特許一覧

<>
< >
(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2024-09-12
(54)【発明の名称】非侵襲性出生前検査のための方法
(51)【国際特許分類】
   C12Q 1/6844 20180101AFI20240905BHJP
   C12N 15/10 20060101ALN20240905BHJP
   C12Q 1/6869 20180101ALN20240905BHJP
【FI】
C12Q1/6844 Z
C12N15/10 100Z
C12Q1/6869 Z
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024513727
(86)(22)【出願日】2022-08-24
(85)【翻訳文提出日】2024-04-26
(86)【国際出願番号】 US2022041323
(87)【国際公開番号】W WO2023034090
(87)【国際公開日】2023-03-09
(31)【優先権主張番号】63/239,901
(32)【優先日】2021-09-01
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
(71)【出願人】
【識別番号】513156537
【氏名又は名称】ナテラ, インコーポレイテッド
(74)【代理人】
【識別番号】100099759
【弁理士】
【氏名又は名称】青木 篤
(74)【代理人】
【識別番号】100123582
【弁理士】
【氏名又は名称】三橋 真二
(74)【代理人】
【識別番号】100117019
【弁理士】
【氏名又は名称】渡辺 陽一
(74)【代理人】
【識別番号】100141977
【弁理士】
【氏名又は名称】中島 勝
(74)【代理人】
【識別番号】100138210
【弁理士】
【氏名又は名称】池田 達則
(72)【発明者】
【氏名】ザチャリー デムコ
(72)【発明者】
【氏名】マシュー ラビノビッツ
(72)【発明者】
【氏名】ジョージ ゲメロス
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA19
4B063QQ03
4B063QQ42
4B063QR08
4B063QR42
4B063QR62
4B063QS25
4B063QS34
4B063QX02
(57)【要約】
本開示は、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を特定するのに有用な妊婦の血液サンプルに由来する増幅されたDNAの調製物を調製する方法であって、(a)血液サンプルから無細胞DNAを抽出することと、(b)単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために抽出されたDNAに対して標的化多重増幅を行うことと、(c)増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することであって、2.8%未満の胎児画分及び/又は1つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を示す、決定することとを含む、方法を提供する。
【選択図】なし
【特許請求の範囲】
【請求項1】
早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を特定するのに有用な妊婦の第1の血液サンプル又はその画分に由来する増幅されたDNAの調製物を調製する方法であって、
(a)前記第1の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第1の抽出DNAを得ることと、
(b)増幅されたDNAの第1の調製物を、単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために前記第1の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、前記200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、
(c)前記増幅されたDNAの前記第1の調製物を、前記増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、前記配列リードを使用して、前記1つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、2.8%未満の胎児画分及び/又は前記1つ以上の目的の染色体の前記倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法。
【請求項2】
(d)前記妊婦の長期的に収集された第2の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第2の抽出されたDNAを得ることと、
(e)増幅されたDNAの第2の調製物を、単一の反応体積において前記200~20,000個のSNP遺伝子座を増幅するために前記第2の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、前記200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、
(f)前記増幅されたDNAの前記第2の調製物を、前記増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、前記配列リードを使用して、前記1つ以上の目的の染色体の前記倍数性状態を決定することによって分析することであって、前記第1及び第2の血液サンプルの各々について、2.8%未満の胎児画分及び/又は前記1つ以上の目的の染色体の前記倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を更に示す、分析することとを更に含む、請求項1に記載の方法。
【請求項3】
前記第1及び第2の血液サンプルの各々について、前記1つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも40%の37週前の早産、子癇前症、及び/又は胎児発育遅延のリスクを有すると特定することを更に含む、請求項2に記載の方法。
【請求項4】
前記第1及び第2の血液サンプルの各々について、前記1つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも50%の37週前の早産、子癇前症、及び/又は胎児発育遅延のリスクを有すると特定することを更に含む、請求項2に記載の方法。
【請求項5】
前記第1及び第2の血液サンプルの各々について、前記1つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも15%の子癇前症のリスクを有すると特定することを更に含む、請求項2に記載の方法。
【請求項6】
前記第1及び第2の血液サンプルの各々について、前記1つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも20%の28週前の早産のリスクを有すると特定することを更に含む、請求項2に記載の方法。
【請求項7】
前記第1及び第2の血液サンプルの各々について、前記1つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも25%の34週前の早産のリスクを有すると特定することを更に含む、請求項2に記載の方法。
【請求項8】
前記第1及び第2の血液サンプルの各々について、前記1つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも40%の37週前の早産のリスクを有すると特定することを更に含む、請求項2に記載の方法。
【請求項9】
前記第1及び第2の血液サンプルの各々について、前記1つ以上の目的の染色体の前記倍数性状態のコールなしの妊婦を、少なくとも10%の胎児発育遅延のリスクを有すると特定することを更に含む、請求項2に記載の方法。
【請求項10】
前記第1及び第2の血液サンプルの各々について、2.5%未満の胎児画分を有する妊婦を特定することを更に含む、請求項2に記載の方法。
【請求項11】
長期的に収集された第3の血液サンプル又はその画分について工程(d)~(f)を繰り返すことを更に含む、請求項2に記載の方法。
【請求項12】
工程(a)が、前記血液サンプルの血漿画分から無細胞DNAを抽出することを含む、請求項1~11のいずれか一項に記載の方法。
【請求項13】
工程(b)が、200~20,000対の標的特異的PCRプライマーを使用する、又はユニバーサルプライマー及び200~20,000個の標的特異的プライマーを使用する、200~20,000個のSNP遺伝子座のPCR増幅を含む、請求項1~12のいずれか一項に記載の方法。
【請求項14】
工程(b)が、1,000~20,000対の標的特異的PCRプライマーを使用する、又はユニバーサルプライマー及び1,000~20,000個の標的特異的プライマーを使用する、1,000~20,000個のSNP遺伝子座のPCR増幅を含む、請求項1~12のいずれか一項に記載の方法。
【請求項15】
工程(b)が、5,000~20,000対の標的特異的PCRプライマーを使用する、又はユニバーサルプライマー及び5,000~20,000個の標的特異的プライマーを使用する、5,000~20,000個のSNP遺伝子座のPCR増幅を含む、請求項1~12のいずれか一項に記載の方法。
【請求項16】
工程(b)における前記増幅されたDNAが、各々、前記抽出されたDNAから増幅される100bp以下を含む、請求項1~15のいずれか一項に記載の方法。
【請求項17】
工程(b)における前記増幅されたDNAが、各々、前記抽出されたDNAから増幅される80bp以下を含む、請求項1~15のいずれか一項に記載の方法。
【請求項18】
工程(b)における前記増幅されたDNAが、各々、前記抽出されたDNAから増幅される60~80bpを含む、請求項1~15のいずれか一項に記載の方法。
【請求項19】
工程(b)が、前記標的化多重増幅の後のバーコードPCRを更に含む、請求項1~18のいずれか一項に記載の方法。
【請求項20】
前記1つ以上の目的の染色体の前記倍数性状態が、前記配列リードに基づいて前記SNP遺伝子座で対立遺伝子数を計算することと、前記目的の染色体の異なる可能な倍数性状態に各々関連する複数の倍数性仮説を作成することと、各倍数性仮説について前記目的の染色体上の前記SNP遺伝子座での予測される前記対立遺伝子数の結合分布モデルを構築することと、前記結合分布モデル及び前記対立遺伝子数を使用して、前記倍数性仮説の各々の相対確率を決定することと、最大確率を有する前記仮説に対応する前記倍数性状態を選択することによって、前記胎児の前記倍数性状態をコールすることと、によって決定される、請求項1~19のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、2021年9月1日に出願された米国仮特許出願第63/239,901号の優先権及び利益を主張し、その全体が参照により本明細書に組み込まれる。
【背景技術】
【0002】
異数性リスクを特定するだけでなく、早産、子癇前症、胎児発育遅延、自然流産、及び非生児出生などの他の有害な周産期転帰の高いリスクを有する妊娠を特定することができる非侵襲性出生前検査方法が必要とされている。
【発明の概要】
【0003】
本開示の一態様は、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を特定するのに有用な妊婦の第1の血液サンプル又はその画分に由来する増幅されたDNAの調製物を調製する方法であって、(a)第1の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第1の抽出されたDNAを得ることと、(b)増幅されたDNAの第1の調製物を、単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために第1の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、(c)増幅されたDNAの第1の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、2.8%未満の胎児画分及び/又は1つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。
【0004】
本開示の別の態様は、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を特定するのに有用な増幅されたDNAの調製物を調製する方法であって、(a)妊婦の第1の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第1の抽出されたDNAを得ることと、(b)増幅されたDNAの第1の調製物を、単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために第1の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、(c)増幅されたDNAの第1の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することと、(d)妊婦の長期的に収集された第2の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第2の抽出されたDNAを得ることと、(e)増幅されたDNAの第2の調製物を、第2の抽出されたDNAに対して標的化多重増幅を行うことによって調製して、単一の反応体積において200~20,000個のSNP遺伝子座を増幅して、増幅されたDNAを得ることであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体に位置する、調製することと、(f)増幅されたDNAの第2の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第1及び第2の血液サンプルの各々について、2.8%未満の胎児画分及び/又は1つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。
【0005】
本開示の別の態様は、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を特定するのに有用な増幅されたDNAの調製物を調製する方法であって、(a)妊婦の第1の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第1の抽出されたDNAを得ることと、(b)増幅されたDNAの第1の調製物を、単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために第1の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、(c)増幅されたDNAの第1の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することと、(d)妊婦の長期的に収集された第2の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第2の抽出されたDNAを得ることと、(e)増幅されたDNAの第2の調製物を、第2の抽出されたDNAに対して標的化多重増幅を行うことによって調製して、単一の反応体積において200~20,000個のSNP遺伝子座を増幅して、増幅されたDNAを得ることであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体に位置する、調製することと、(f)増幅されたDNAの第2の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第1及び第2の血液サンプルの各々について、2.8%未満、若しくは2.7%未満、若しくは2.6%未満、若しくは2.5%未満、若しくは2.4%未満、若しくは2.3%未満、若しくは2.2%未満、若しくは2.1%未満、若しくは2.0%未満の胎児画分が、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。いくつかの実施形態において、胎児画分は、配列リードを用いて定量される。いくつかの実施形態において、胎児画分は、メチル化ベースの多重ddPCRを用いて定量される。いくつかの実施形態において、胎児画分は、フラグメントの長さ及びフラグメントの数を用いて定量される。
【0006】
本開示の更なる態様は、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を特定するのに有用な増幅されたDNAの調製物を調製する方法であって、(a)妊婦の第1の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第1の抽出されたDNAを得ることと、(b)増幅されたDNAの第1の調製物を、単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために第1の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、(c)増幅されたDNAの第1の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することと、(d)妊婦の長期的に収集された第2の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第2の抽出されたDNAを得ることと、(e)増幅されたDNAの第2の調製物を、第2の抽出されたDNAに対して標的化多重増幅を行うことによって調製して、単一の反応体積において200~20,000個のSNP遺伝子座を増幅して、増幅されたDNAを得ることであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体に位置する、調製することと、(f)増幅されたDNAの第2の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を示す、分析することとを含む、方法に関する。
【発明を実施するための形態】
【0007】
PCT/US2010/050824として2010年9月30日に出願されたWO2011/041485は、その全体が参照により本明細書に組み込まれる。PCT/US2011/037018として2011年5月18日に出願されたWO2011/146632は、その全体が参照により本明細書に組み込まれる。PCT/US2011/061506として2011年11月18日に出願されたWO2012/108920は、その全体が参照により本明細書に組み込まれる。PCT/US2011/066938として2011年12月22日に出願されたWO2012/088456は、その全体が参照により本明細書に組み込まれる。PCT/US2012/066339として2012年11月21日に出願されたWO2014/018080は、その全体が参照により本明細書に組み込まれる。PCT/US2013/055205として2013年8月15日に出願されたWO2014/028778は、その全体が参照により本明細書に組み込まれる。PCT/US2015/026957として2015年4月21日に出願されたWO2015/164432は、その全体が参照により本明細書に組み込まれる。PCT/US2016/031686として2016年5月10日に出願されたWO2016/183106は、その全体が参照により本明細書に組み込まれる。US15/186,774として2016年6月20日に出願されたUS2016/0371428は、その全体が参照により本明細書に組み込まれる。US15/887,864として2018年2月2日に出願されたUS2018/0173845は、その全体が参照により本明細書に組み込まれる。
【0008】
早産、子癇前症、及び/又は胎児発育遅延の高いリスクを有する妊娠を特定するのに有用な妊婦の第1の血液サンプル又はその画分に由来する増幅されたDNAの調製物を調製する方法であって、(a)第1の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第1の抽出されたDNAを得ることと、(b)増幅されたDNAの第1の調製物を、単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために第1の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、(c)増幅されたDNAの第1の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、第1の血液サンプル又はその画分における胎児画分を定量して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、2.8%未満の胎児画分及び/又は1つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、及び/又は胎児発育遅延の高いリスクを有する妊娠を示す、分析することとを含む、方法が本明細書に開示される。
【0009】
いくつかの実施形態において、本方法は、(d)妊婦の長期的に収集された第2の血液サンプル又はその画分から無細胞DNAを抽出して、母体無細胞DNA及び胎児無細胞DNAを含む第2の抽出されたDNAを得ることと、(e)増幅されたDNAの第2の調製物を、単一の反応体積において200~20,000個のSNP遺伝子座を増幅するために第2の抽出されたDNAに対して標的化多重増幅を行って、増幅されたDNAを得ることによって調製することであって、200~20,000個のSNP遺伝子座が、1つ以上の目的の染色体上に位置する、調製することと、(f)増幅されたDNAの第2の調製物を、増幅されたDNAに対して高スループット配列決定を行って、配列リードを得、配列リードを使用して、1つ以上の目的の染色体の倍数性状態を決定することによって分析することであって、第1及び第2の血液サンプルの各々について、2.8%未満の胎児画分及び/又は1つ以上の目的の染色体の倍数性状態のコールなしが、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生の高いリスクを有する妊娠を更に示す、分析することとを更に含む。
【0010】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも30%、又は少なくとも35%、又は少なくとも40%、又は少なくとも45%、又は少なくとも50%の37週前の早産、子癇前症、及び/又は胎児発育遅延のリスクを有すると特定することを更に含む。
【0011】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも30%、又は少なくとも35%、又は少なくとも40%、又は少なくとも45%、又は少なくとも50%の37週前の早産、子癇前症、死産、及び/又は胎児発育遅延のリスクを有すると特定することを更に含む。
【0012】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも12%、又は少なくとも13%、又は少なくとも14%、又は少なくとも15%、又は少なくとも16%、又は少なくとも17%、又は少なくとも18%の子癇前症のリスクを有すると特定することを更に含む。
【0013】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも10%、又は少なくとも12%、又は少なくとも14%、又は少なくとも16%、又は少なくとも18%、又は少なくとも20%、又は少なくとも22%の28週前の早産のリスクを有すると特定することを更に含む。
【0014】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも16%、又は少なくとも18%、又は少なくとも20%、又は少なくとも22%、又は少なくとも24%、又は少なくとも26%、又は少なくとも28%の34週前の早産のリスクを有すると特定することを更に含む。
【0015】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも24%、又は少なくとも28%、又は少なくとも32%、又は少なくとも36%、又は少なくとも40%、又は少なくとも44%の37週前の早産のリスクを有すると特定することを更に含む。
【0016】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、1つ以上の目的の染色体の倍数性状態のコールなしの妊婦を、少なくとも10%、又は少なくとも10.5%、又は少なくとも11%、又は少なくとも11.5%、又は少なくとも12%、又は少なくとも12.5%、又は少なくとも13%、又は少なくとも13.5%の胎児発育遅延のリスクを有すると特定することを更に含む。
【0017】
いくつかの実施形態において、胎児画分は、配列リードを用いて定量される。いくつかの実施形態において、胎児画分は、メチル化ベースの多重ddPCRを用いて定量される。いくつかの実施形態において、胎児画分は、フラグメントの長さ及びフラグメントの数を用いて定量される。
【0018】
いくつかの実施形態において、本方法は、第1の血液サンプルについて、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を特定することを含む。いくつかの実施形態において、本方法は、第2の血液サンプルについて、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を特定することを含む。いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を特定することを含む。
【0019】
いくつかの実施形態において、本方法は、第1の血液サンプルについて、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。いくつかの実施形態において、本方法は、第2の血液サンプルについて、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。
【0020】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を、子癇前症の高いリスク(例えば、少なくとも12%、又は少なくとも13%、又は少なくとも14%、又は少なくとも15%、又は少なくとも16%、又は少なくとも17%、又は少なくとも18%の子癇前症のリスク)を有するものとして特定することを含む。
【0021】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、子癇前症の高いリスク(例えば、少なくとも12%、又は少なくとも13%、又は少なくとも14%、又は少なくとも15%、又は少なくとも16%、又は少なくとも17%、又は少なくとも18%の子癇前症のリスク)を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。
【0022】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を、28週前の早産の高いリスク(例えば、少なくとも10%、又は少なくとも12%、又は少なくとも14%、又は少なくとも16%、又は少なくとも18%、又は少なくとも20%、又は少なくとも22%の28週前の早産のリスク)を有するものとして特定することを含む。
【0023】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、28週前の早産の高いリスク(例えば、少なくとも10%、又は少なくとも12%、又は少なくとも14%、又は少なくとも16%、又は少なくとも18%、又は少なくとも20%、又は少なくとも22%の28週前の早産のリスク)を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。
【0024】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を、34週間前の早産の高いリスク(例えば、少なくとも16%、又は少なくとも18%、又は少なくとも20%、又は少なくとも22%、又は少なくとも24%、又は少なくとも26%、又は少なくとも28%の34週間前の早産のリスク)を有するものとして特定することを含む。
【0025】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、34週前の早産の高いリスク(例えば、少なくとも16%、又は少なくとも18%、又は少なくとも20%、又は少なくとも22%、又は少なくとも24%、又は少なくとも26%、又は少なくとも28%の34週前の早産のリスク)を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。
【0026】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を、37週前の早産の高いリスク(例えば、少なくとも24%、又は少なくとも28%、又は少なくとも32%、又は少なくとも36%、又は少なくとも40%、又は少なくとも44%の37週前の早産のリスク)を有するものとして特定することを含む。
【0027】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、37週前の早産の高いリスク(例えば、少なくとも24%、又は少なくとも28%、又は少なくとも32%、又は少なくとも36%、又は少なくとも40%、又は少なくとも44%の37週前の早産のリスク)を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。
【0028】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、2.8%未満、又は2.7%未満、又は2.6%未満、又は2.5%未満、又は2.4%未満、又は2.3%未満、又は2.2%未満、又は2.1%未満、又は2.0%未満の胎児画分を有する妊婦を、胎児発育遅延の高いリスク(例えば、少なくとも10%、又は少なくとも10.5%、又は少なくとも11%、又は少なくとも11.5%、又は少なくとも12%、又は少なくとも12.5%、又は少なくとも13%、又は少なくとも13.5%の胎児発育遅延のリスク)を有するものとして特定することを含む。
【0029】
いくつかの実施形態において、本方法は、第1及び第2の血液サンプルの各々について、3パーセンタイル未満、又は2パーセンタイル未満、又は1パーセンタイル未満、又は0.5パーセンタイル未満、又は0.2パーセンタイル未満、又は0.1パーセンタイル未満の胎児画分のパーセンタイルを有する妊婦を、胎児発育遅延の高いリスク(例えば、少なくとも10%、又は少なくとも10.5%、又は少なくとも11%、又は少なくとも11.5%、又は少なくとも12%、又は少なくとも12.5%、又は少なくとも13%、又は少なくとも13.5%の胎児発育遅延のリスク)を有するものとして特定することを含み、任意選択で、母体重量及び妊娠期間について調整される。
【0030】
いくつかの実施形態において、本方法は、異常に高い胎児画分を有するサンプルを特定することを含む。
【0031】
いくつかの実施形態において、本方法は、アルゴリズムの一部としてcfDNAフラグメントの詳細を使用して、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生を予測することを含む。いくつかの実施形態において、本方法は、フラグメントの長さを使用して、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生を予測することを含む。いくつかの実施形態において、本方法は、ゲノム内の位置又は開始点及び停止点などのフラグメントの詳細を使用して、早産、子癇前症、胎児発育遅延、自然流産、及び/又は非生児出生を予測することを含む。
【0032】
いくつかの実施形態において、本方法は、長期的に収集された第3、第4、又は更なる血液サンプル又はその画分について工程(d)~(f)を繰り返すことを更に含む。
【0033】
いくつかの実施形態において、工程(a)は、血液サンプルの血漿画分から無細胞DNAを抽出することを含む。いくつかの実施形態において、工程(a)は、抽出されたDNAに少なくとも1つのアダプターをライゲーションすることを更に含み、アダプターは、ユニバーサルプライミング配列を含む。いくつかの実施形態において、工程(a)は、ユニバーサルプライミング配列に結合する少なくとも1つのプライマーを使用してユニバーサルPCR増幅を行うことを更に含む。
【0034】
いくつかの実施形態において、工程(b)は、1つの反応混合物において200~20,000対の標的特異的PCRプライマーを使用する、又は1つの反応混合物においてユニバーサルプライマー及び200~20,000の個標的特異的プライマーを使用する、200~20,000個のSNP遺伝子座のPCR増幅を含む。いくつかの実施形態において、工程(b)は、1つの反応混合物において500~20,000対の標的特異的PCRプライマーを使用する、又は1つの反応混合物においてユニバーサルプライマー及び500~20,000の標的特異的プライマーを使用する、500~20,000個のSNP遺伝子座のPCR増幅を含む。いくつかの実施形態において、工程(b)は、1つの反応混合物において1,000~20,000対の標的特異的PCRプライマーを使用する、又は1つの反応混合物においてユニバーサルプライマー及び1,000~20,000個の標的特異的プライマーを使用する、1,000~20,000個のSNP遺伝子座のPCR増幅を含む。いくつかの実施形態において、工程(b)は、1つの反応混合物において2,000~20,000対の標的特異的PCRプライマーを使用する、又は1つの反応混合物においてユニバーサルプライマー及び2,000~20,000の標的特異的プライマーを使用する、2,000~20,000個のSNP遺伝子座のPCR増幅を含む。いくつかの実施形態において、工程(b)は、1つの反応混合物において5,000~20,000対の標的特異的PCRプライマーを使用する、又は1つの反応混合物においてユニバーサルプライマー及び5,000~20,000個の標的特異的プライマーを使用する、5,000~20,000個のSNP遺伝子座のPCR増幅を含む。いくつかの実施形態において、工程(b)は、1つの反応混合物において10,000~20,000対の標的特異的PCRプライマーを使用する、又は1つの反応混合物においてユニバーサルプライマー及び10,000~20,000の標的特異的プライマーを使用する、10,000~20,000個のSNP遺伝子座のPCR増幅を含む。いくつかの実施形態において、工程(b)は、1つの反応混合物において20,000~50,000対の標的特異的PCRプライマーを使用する、又は1つの反応混合物においてユニバーサルプライマー及び20,000~50,000の標的特異的プライマーを使用する、20,000~50,000個のSNP遺伝子座のPCR増幅を含む。
【0035】
いくつかの実施形態において、工程(b)における増幅されたDNAは、各々、抽出されたDNAから増幅される100bp以下を含む。いくつかの実施形態において、工程(b)における増幅されたDNAは、各々、抽出されたDNAから増幅される90bp以下を含む。いくつかの実施形態において、工程(b)における増幅されたDNAは、各々、抽出されたDNAから増幅される80bp以下を含む。いくつかの実施形態において、工程(b)における増幅されたDNAは、各々、抽出されたDNAから増幅される80bp以下を含む。いくつかの実施形態において、工程(b)における増幅されたDNAは、各々、抽出されたDNAから増幅される70bp以下を含む。いくつかの実施形態において、工程(b)における増幅されたDNAは、各々、抽出されたDNAから増幅される50~100bpを含む。いくつかの実施形態において、工程(b)における増幅されたDNAは、各々、抽出されたDNAから増幅される60~80bpを含む。いくつかの実施形態において、工程(b)における増幅されたDNAは、それぞれ、抽出されたDNAから増幅される65~80bpを含む。
【0036】
いくつかの実施形態において、工程(b)は、標的化多重増幅の後のバーコードPCRを更に含む。いくつかの実施形態において、バーコードPCRは、サンプル特異的バーコード又はサンプル特異的識別子配列を導入する。いくつかの実施形態において、バーコードPCRは、その後の高スループット配列決定のための配列決定タグを導入する。
【0037】
いくつかの実施形態において、1つ以上の目的の染色体の倍数性状態は、配列リードに基づいてSNP遺伝子座で対立遺伝子数を計算することと、目的の染色体の異なる可能な倍数性状態に各々関連する複数の倍数性仮説を作成することと、各倍数性仮説について目的の染色体上のSNP遺伝子座での予測される対立遺伝子数の結合分布モデルを構築することと、結合分布モデル及び対立遺伝子数を使用して、倍数性仮説の各々の相対確率を決定することと、最大確率を有する仮説に対応する倍数性状態を選択することによって、胎児の倍数性状態をコールすることと、によって決定される。
【0038】
一実施形態において、本開示は、DNAの混合サンプル(すなわち、胎児の母親からのDNA、及び胎児からのDNA)から測定される遺伝子型データから、並びに任意選択で、母親から、及び場合によっては父親からの遺伝物質のサンプルから測定される遺伝子型データから、妊娠中の胎児の染色体の倍数性状態を決定するためのエクスビボ方法を提供し、決定は、結合分布モデルを使用して、親遺伝子型データを与えられた異なる可能性のある胎児の倍数性状態についての予測される対立遺伝子分布のセットを作成し、予測される対立遺伝子分布を混合サンプルで測定される実際の対立遺伝子分布と比較し、予測される対立遺伝子分布パターンが観察された対立遺伝子分布パターンと最も近い一致する倍数性状態を選択することによって行われる。一実施形態において、混合サンプルは、母体血液、又は母親の血清若しくは血漿に由来する。一実施形態において、DNAの混合サンプルは、複数の多型遺伝子座で優先的に濃縮されてもよい。一実施形態において、優先的濃縮は、対立遺伝子バイアスを最小限に抑える方法で行われる。一実施形態において、本開示は、対立遺伝子バイアスが低くなるように、複数の遺伝子座で優先的に濃縮されたDNAの組成物に関する。一実施形態において、対立遺伝子の分布(複数可)は、混合サンプルからのDNAを配列決定することによって測定される。一実施形態において、結合分布モデルは、対立遺伝子が二項式で分布すると仮定する。一実施形態において、予測される結合対立遺伝子分布のセットは、例えば、国際HapMapコンソーシアムからのデータを使用して、様々なソースからの既存の組換え頻度を考慮しながら、遺伝的に連結された遺伝子座のために作成される。
【0039】
一実施形態において、本開示は、非侵襲性出生前診断(NPD)、具体的には、DNA混合物上で測定された遺伝子型データ中の複数の多型遺伝子座における対立遺伝子の測定値を観察することによって胎児の異数性の状態を決定する方法を提供し、特定の対立遺伝子の測定値は、異数体の胎児を示すが、他の対立遺伝子の測定値は、正倍数体の胎児を示す。一実施形態において、遺伝子型データは、母体血漿に由来するDNA混合物を配列決定することによって測定される。一実施形態において、DNAサンプルは、対立遺伝子分布が計算されている複数の遺伝子座に対応するDNAの分子で優先的に濃縮されてもよい。一実施形態において、母親からの遺伝物質のみ又はほぼのみを含むDNAのサンプル、及び場合によってはまた、父親からの遺伝物質のみ又はほぼのみを含むDNAのサンプルを測定する。一実施形態において、推定される胎児画分と共に、一方又は両方の親の遺伝子測定値を使用して、胎児の異なる可能性のある基礎となる遺伝子状態に対応する複数の予測される対立遺伝子分布を作成し、予測される対立遺伝子分布は、仮説と呼ばれ得る。一実施形態において、母親の遺伝子データは、本質的に排他的又はほぼ排他的である遺伝物質を測定することによって決定されるのではなく、むしろ、母親及び胎児のDNAの混合物を含む母体血漿上で行われた遺伝子測定値から推定される。いくつかの実施形態において、仮説は、1つ以上の染色体での胎児の倍数性を含んでもよく、その染色体のどのセグメントが、どの親からの胎児のどの染色体が遺伝したか、及びそれらの組み合わせを含んでもよい。いくつかの実施形態において、胎児の倍数性状態は、観察された対立遺伝子の測定値を、少なくともいくつかの仮説が異なる倍数性状態に対応する異なる仮説と比較し、観察された対立遺伝子の測定値を考慮して、最も当てはまる可能性が高い仮説に対応する倍数性状態を選択することによって決定される。一実施形態において、この方法は、遺伝子座がホモ接合性であるかヘテロ接合性であるかにかかわらず、いくつか又は全ての測定されたSNPからの対立遺伝子測定データを使用することを伴い、したがって、ヘテロ接合性のみである遺伝子座での対立遺伝子の使用を伴わない。この方法は、遺伝子データが1つの多型遺伝子座のみに関連する状況には適していない可能性がある。この方法は、遺伝子データが、標的染色体についての10を超える多型遺伝子座又は20を超える多型遺伝子座のデータを含む場合に特に有利である。この方法は、遺伝子データが、標的染色体について50を超える多型遺伝子座、標的染色体について100を超える多型遺伝子座又は200を超える多型遺伝子座のデータを含む場合に特に有利である。いくつかの実施形態において、遺伝子データは、標的染色体についての500を超える多型遺伝子座、標的染色体についての1,000を超える多型遺伝子座、2,000を超える多型遺伝子座、又は5,000を超える多型遺伝子座についてのデータを含み得る。
【0040】
一実施形態において、本明細書に開示される方法は、多型遺伝子座のセットからの各多型遺伝子座においてDNAの元のサンプル中に存在する相対的な対立遺伝子頻度を保存する選択的濃縮技術を使用する。いくつかの実施形態において、増幅及び/又は選択的な濃縮技術は、PCR(例えば、ライゲーション媒介PCR)、ハイブリダイゼーションによるフラグメントの捕捉、分子反転プローブ又は他の環状化プローブを伴っていてもよい。いくつかの実施形態において、増幅又は選択的な濃縮のための方法は、標的配列に正しくハイブリダイゼーションすると、ヌクレオチドプローブの3’末端又は5’末端が少数のヌクレオチドによって対立遺伝子の多型部位から分離されるプローブを用いることを伴っていてもよい。この分離は、対立遺伝子バイアスと呼ばれる1つの対立遺伝子の優先的増幅を減らす。これは、正しくハイブリダイズされたプローブの3’末端又は5’末端が、対立遺伝子の多型部位に直接隣接しているか、又は非常に近い位置にあるプローブを用いることを伴う方法の改善である。一実施形態において、ハイブリダイズする領域が多型部位を含有し得るか、又は確実に含有するプローブは除外される。ハイブリダイゼーション部位にある多型部位は、一部の対立遺伝子において不均等なハイブリダイゼーションを引き起こし、又はハイブリダイゼーションを完全に阻害する場合があり、特定の対立遺伝子の優先的増幅をもたらす場合がある。これらの実施形態は、各多型遺伝子座でサンプルの元々の対立遺伝子頻度をより良好に保存するという点で、標的化増幅及び/又は選択的な濃縮を伴う他の方法の改善であり、サンプルは、単一の個体又は個体の混合からの純粋なゲノムサンプルである
【0041】
一実施形態において、本明細書に開示される方法は、高効率な高度に多重化された標的化PCRを使用してDNAを増幅し、その後、高スループット配列決定によって、各標的遺伝子座での対立遺伝子頻度を決定する。得られた配列リードのほとんどが標的遺伝子座に対してマッピングするような方法で1つの反応中に約50個又は100個より多いPCRプライマーを多重化する能力は、新規であり、非自明である。高度に多重化された標的化PCRを高効率な方法で行うことを可能にする1つの技術は、互いにハイブリダイズする可能性が低いプライマーを設計することを伴う。PCRプローブは、典型的にはプライマーと呼ばれ、少なくとも500、少なくとも1,000、少なくとも5,000、少なくとも10,000、少なくとも20,000、少なくとも50,000、又は少なくとも100,000の潜在的なプライマー対との間の潜在的に有害な相互作用又はプライマーとサンプルDNAとの間の意図していない相互作用の熱力学的モデルを作成し、次いで、このモデルを用いて、プール中の他の設計と不適合な設計を除外することによって選択される。高度に多重化された標的化PCRを高効率な方法で行うことを可能にする別の技術は、標的化PCRに対して、部分的又は完全なネスティング手法を用いることである。これらの手法の1つ又は組み合わせを用いることで、単一のプールにおいて、少なくとも300、少なくとも800、少なくとも1,200、少なくとも4,000又は少なくとも10,000個のプライマーの多重化が可能になり、得られた大部分のDNAを含む増幅DNAは、配列決定されると、標的遺伝子座にマッピングする。これらの手法の1つ又は組み合わせを用いることで、単一のプールにおいて多数のプライマーの多重化が可能になり、得られた増幅されたDNAは、標的遺伝子座にマッピングする50%より多い、80%より多い、90%より多い、95%より多い、98%より多い、又は99%より多いDNA分子を含む。
【0042】
一実施形態において、本明細書に開示される方法は、多型遺伝子座における各対立遺伝子の独立した観察の数の定量的尺度をもたらす。これは、2つの対立遺伝子の比率に関する情報を提供するが、いずれかの対立遺伝子の独立した観察の数を定量化しない、マイクロアレイ又は定性的PCRなどのほとんどの方法とは異なる。独立した観測の数に関する定量的情報を提供する方法では、比率のみが倍数計算に利用され、定量的情報自体は有用ではない。独立した観察の数に関する情報を保持することの重要性を説明するために、2つの対立遺伝子、A及びBを有するサンプル遺伝子座を考慮する。第1の実験では、20個のA対立遺伝子及び20個のB対立遺伝子が観察され、第2の実験では、200個のA対立遺伝子及び200個のB対立遺伝子が観察される。両方の実験において、比(A/(A+B))は、0.5に等しいが、第2の実験は、A又はB対立遺伝子の頻度の確実性について第1の情報よりも多くの情報を伝達する。先行技術で既知のいくつかの方法は、個々の対立遺伝子からの対立遺伝子比(チャネル比)(すなわち、x/y)を平均化又は加算することを伴い、この比を参照染色体と比較するか、又はこの比が特定の状況でどのように振る舞うことが予測されるかに関する規則を使用して、この比を分析する。対立遺伝子の重み付けは、当該技術分野で既知の方法では示唆されておらず、各対立遺伝子についてほぼ同じ量のPCR産物を確実にすることができ、全ての対立遺伝子が同じように振る舞うべきであると想定されている。そのような方法は、いくつかの欠点を有し、より重要なことは、本開示の別の箇所に記載されているいくつかの改善の使用を排除することである。
【0043】
一実施形態において、本明細書に開示される方法は、減数分裂I中の不分離、減数分裂II中の不分離、及び/又は胎児発達の早期での有糸分裂中の不分離に起因するトリソミーの場合に予測され得る複数の対立遺伝子頻度分布と同様に、ダイソミーで予測される対立遺伝子頻度分布を明示的にモデル化する。これが重要である理由を説明するために、乗換えがなかった場合を想像する:減数分裂中の不分離Iは、2つの異なる相同体が一方の親から継承されたトリソミーをもたらし、対照的に、減数分裂II中又は胎児発達の早期での有糸分裂中の不分離は、一方の親からの同じ相同体の2つのコピーをもたらす。各シナリオは、遺伝子連鎖のために、各多型遺伝子座で予測される異なる対立遺伝子頻度をもたらし、また、共同で考慮される全ての遺伝子座で異なるであろう。相同体間の遺伝物質の交換をもたらす乗換えは、遺伝パターンをより複雑にし、一実施形態において、本方法は、遺伝子座間の物理的距離に加えて、組換え率情報を使用することによってこれに対応する。一実施形態において、減数分裂I不分離と、減数分裂II不分離又は有糸分裂不分離との区別を改善するために、本発明の方法は、セントロメアからの距離が増加するにつれて乗換えの増加する確率をモデルに組み込む。減数分裂II不分離及び有糸分裂不分離は、有糸分裂不分離が、典型的には1つの相同体の同一又はほぼ同一のコピーをもたらすが、減数分裂II不分離事象に続いて存在する2つの相同体は、配偶子形成中の1つ以上の乗換えによって異なることが多いという事実によって区別され得る。
【0044】
いくつかの実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値を、考えられる胎児の遺伝的異数性に対応する理論的仮説と比較することを伴い、ヘテロ接合性遺伝子座における対立遺伝子の比率を定量する工程を伴わない。遺伝子座の数が約20よりも少ない場合、ヘテロ接合性遺伝子座で対立遺伝子の比率を定量することを含む方法して行われる倍数決定、及び観察された対立遺伝子の測定値を、考えられる胎児の遺伝子状態に対応する理論的対立遺伝子分布仮説と比較することを含む方法を使用して行われる倍数決定は、同様の結果をもたらし得る。しかしながら、遺伝子座の数が50を超える場合、これらの2つの方法は、有意に異なる結果をもたらす可能性が高く、遺伝子座の数が400を超える場合、1,000又は2,000を超える場合、これらの2つの方法は、ますます有意に異なる結果をもたらす可能性が非常に高い。これらの違いは、各対立遺伝子の大きさを独立して測定せずにヘテロ接合性遺伝子座における対立遺伝子の比率を定量化し、比率を凝集又は平均化することを含む方法が、結合分布モデルの使用、結合分析の実行、二項分布モデルの使用、及び/又は他の高度な統計技術を含む技術の使用を排除する一方で、観察された対立遺伝子の測定値を、可能な胎児の遺伝子状態に対応する理論的対立遺伝子分布仮説と比較することを含む方法を使用することが、決定の精度を実質的に高めることができるこれらの技術を使用することができるという事実に起因する。
【0045】
一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、結合分布モデルを使用して、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う。結合分布モデルの使用は、得られる決定が有意に高い精度であるという点で、多型遺伝子座を独立して処理することによってヘテロ接合率を決定する方法とは異なり、著しい改善である。任意の特定の理論に束縛されることなく、それらがより高い精度を有する1つの理由は、結合分布モデルが、SNP間の連鎖、及び胎児に成長した胚を形成する配偶子を生じさせた減数分裂中に発生した乗換えの尤度を考慮に入れることであると考えられる。1つ以上の仮説について対立遺伝子測定値の予測分布を作成する場合に連鎖の概念を使用する目的は、連鎖が使用されない場合よりも実態にかなり良好に対応する、予測される対立遺伝子測定値分布の作成を可能にすることである。例えば、互いに近接して位置する2つのSNP、1及び2が存在し、母親が、1つの相同体上のSNP1でA及びSNP2でAであり、相同体2上のSNP1でB及びSNP2でBであると仮定する。両方のホモログ上の両方のSNPについて父親がAであり、胎児SNP1についてBが測定される場合、これは、ホモログ2が胎児に遺伝していることを示し、したがって、BがSNP2で胎児に存在する尤度がはるかに高いことを示す。連鎖を考慮したモデルはこれを予測するが、連鎖を考慮していないモデルは予測しない。代替的に、母親がSNP1でABであり、近くのSNP2でABである場合、その位置での母体トリソミーに対応する2つの仮説を使用することができ、1つは、マッチングコピーエラー(減数分裂IIにおける不分離又は胎児発達初期における有糸分裂)を伴い、1つは、非マッチングコピーエラー(減数分裂Iにおける不分離)を伴った。マッチングコピーエラートリソミーの場合では、SNP1で母親からAAが胎児に遺伝した場合、胎児には、ABではなく、SNP2で母親からAA又はBBのいずれかが遺伝する可能性がはるかに高い。非マッチングコピーエラーの場合では、胎児には、両方のSNPにおいて母親からABが遺伝するであろう。連鎖を考慮した倍数性コールによって作成された対立遺伝子分布仮説は、これらの予測を行い、したがって、連鎖を考慮しない倍数性コールよりも大幅に大きな範囲で実際の対立遺伝子測定に対応する。対立遺伝子比を計算し、それらの対立遺伝子比を凝集することに依存する方法を使用する場合、連鎖アプローチは不可能であることに留意されたい。
【0046】
観察された対立遺伝子の測定値を、可能性のある胎児の遺伝子状態に対応する理論的仮説と比較することを含む方法を使用する倍数決定がより高い精度であると考えられる理由の1つは、配列決定を使用して対立遺伝子を測定する場合、この方法は、総リード数が他の方法よりも低い対立遺伝子からのデータからより多くの情報を収集することができることである。例えば、対立遺伝子の比率を計算及び集約することに依存する方法は、不釣り合いに重み付けされた確率論的ノイズを生成する。例えば、配列決定を使用して対立遺伝子を測定することを伴い、各遺伝子座について5つの配列リードのみが検出された遺伝子座のセットがあった場合を想像する。一実施形態において、対立遺伝子の各々について、データは、仮定された対立遺伝子分布と比較され、配列リード数に従って重み付けされてもよく、したがって、これらの測定値からのデータは、適切に重み付けされ、全体的な決定に組み込まれるであろう。これは、ヘテロ接合性遺伝子座で対立遺伝子の比率を定量することを伴う方法とは対照的であり、この方法は、可能な対立遺伝子比率として、0%、20%、40%、60%、80%、又は100%の比率のみを計算することができ、これらのいずれも、予測される対立遺伝子比率に近いものではない。この後者の場合、計算された対立遺伝子の比率は、不十分なリードのために破棄されなければならないか、さもなければ不釣り合いな重み付けを有し、決定に確率論的ノイズを導入し、それによって決定の精度を低下させる。一実施形態において、個々の対立遺伝子の測定値は、独立した測定値として扱われてもよく、同じ遺伝子座における対立遺伝子に行われる測定値の間の関係は、異なる遺伝子座における対立遺伝子に行われる測定値の間の関係と変わらない。
【0047】
一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、ダイソミックであると予測される参照染色体上の観察された対立遺伝子の測定値と任意の測定基準を比較することなく、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う(RC方法と呼ばれる)。これは、1つ以上の推定されるダイソミック参照染色体に対する疑わしい染色体からのランダムに配列決定されたフラグメントの割合を評価することによって、異数性を検出するショットガン配列決定を使用する方法などの方法に対する著しい改善である。このRC法は、推定されるダイソミック参照染色体が実際にはダイソミックでない場合、誤った結果をもたらす。これは、異数性が単一染色体のトリソミーよりも実質的である場合、又は胎児が三倍体であり、全ての常染色体がトリソミーである場合に起こり得る。女性の三倍体(69、XXX)胎児の場合、実際にはダイソミック染色体はまったく存在しない。本明細書に記載される方法は、参照染色体を必要とせず、女性の三倍体胎児におけるトリソミック染色体を正確に同定することができるであろう。各染色体、仮説、子画分及びノイズレベルについて、参照染色体データ、全体的な子画分の推定、又は固定された参照仮説のいずれもなしに、結合分布モデルが適合され得る。
【0048】
一実施形態において、本明細書に開示される方法は、多型遺伝子座での対立遺伝子分布の観察が、先行技術の方法よりも高い精度で胎児の倍数性状態を決定するためにどのように使用され得るかを示す。一実施形態において、本方法は、標的化配列決定を使用して、複数のSNPにおいて母親-胎児の混合遺伝子型、並びに任意選択で母系及び/又は父系遺伝子型を得て、最初に、異なる仮説の下での様々な予測される対立遺伝子頻度分布を確立し、次いで、母親-胎児の混合物で得られた定量的対立遺伝子情報を観察し、どの仮説がデータに最も適合するかを評価し、データに最も適合する仮説に対応する遺伝子状態は、正しい遺伝子状態と呼ばれる。一実施形態において、本明細書に開示される方法はまた、適合度を使用して、コールされた遺伝子状態が正しい遺伝子状態であるという信頼性を生成する。一実施形態において、本明細書に開示される方法は、異なる親コンテキストを有する遺伝子座について見出される対立遺伝子の分布を分析するアルゴリズムを使用することと、観察された対立遺伝子の分布を、異なる親コンテキスト(異なる親遺伝子型パターン)についての異なる倍数性状態についての予測される対立遺伝子の分布と比較することとを含む。これは、母体-胎児混合サンプル中の各遺伝子座での各対立遺伝子の独立したインスタンスの数の推定を可能にする方法を使用しない方法とは異なるか、又はそれに対する改善である。一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、母親がヘテロ接合性である遺伝子座で測定された観察された対立遺伝子の分布を使用して、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う。これは、母親がヘテロ接合性である遺伝子座で観察された対立遺伝子分布を使用しない方法とは異なるか、又はそれに対する改善であり、これは、DNAが優先的に濃縮されていないか、又はその特定の標的個体にとって非常に有益であることが知られていない遺伝子座について優先的に濃縮されている場合に、倍数性決定において配列データのセットから約2倍の遺伝子測定データを使用することを可能にし、より正確な決定をもたらすためである。
【0049】
一実施形態において、本明細書に開示される方法は、各遺伝子座での対立遺伝子頻度が、本質的に、多項式(したがって、SNPが二対立遺伝子である場合、二項的)であると仮定する、結合分布モデルを使用する。いくつかの実施形態において、結合分布モデルは、ベータ二項分布を使用する。配列決定などの測定技術を使用すると、各遺伝子座に存在する各対立遺伝子について定量的尺度が提供される場合、バイノマルモデルを各遺伝子座に適用することができ、対立遺伝子の頻度の基礎となる程度及びその頻度の信頼性を確認することができる。対立遺伝子比から倍数性コールを生成する当該技術分野で既知の方法、又は定量的対立遺伝子情報が破棄される方法では、観察された比における確実性を確認することができない。本方法は、対立遺伝子比率を計算し、それらの比率を集約して倍数性コールを行う方法とは異なるか、又はそれに対する改善である。なぜなら、特定の遺伝子座における対立遺伝子比率を計算し、次いでそれらの比率を集約することを伴う任意の方法は、必然的に、任意の所与の対立遺伝子又は遺伝子座由来のDNAの量の指標である測定された強度又は数値が、ガウス様式で分布することを前提とするからである。本明細書に開示される方法は、対立遺伝子比率を計算することを伴わない。いくつかの実施形態において、本明細書に開示される方法は、複数の遺伝子座での各対立遺伝子の観察の数をモデルに組み込むことを伴っていてもよい。いくつかの実施形態において、本明細書に開示される方法は、対立遺伝子の測定値のガウス分布を仮定する任意のモデルよりも正確であり得る結合二項分布モデルの使用を可能にする、予測分布自体を計算することを伴っていてもよい。遺伝子座の数が増加するにつれて、二項分布モデルがガウス分布よりも有意に正確である尤度が増加する。例えば、20個未満の遺伝子座が調べられる場合、二項分布モデルが有意に優れている尤度は低い。しかしながら、100個を超える、又は特に400個を超える、又は特に1,000個を超える、又は特に2,000個を超える遺伝子座が使用される場合、二項分布モデルは、ガウス分布モデルよりも有意に正確であるという非常に高い尤度を有し、それによって、より正確な倍数決定をもたらす。二項分布モデルがガウス分布よりも有意に正確である尤度は、各遺伝子座での観測数が増加するにつれて増加する。例えば、各遺伝子座で10個未満の異なる配列が観察される場合、二項分布モデルが有意に優れている尤度は低い。しかしながら、50を超える配列リード、又は特に100を超える配列リード、又は特に200を超える配列リード、又は特に300を超える配列リードが各遺伝子座に対して使用される場合、二項分布モデルは、ガウス分布モデルよりも有意に正確である尤度が非常に高いため、より正確な倍数決定をもたらす。
【0050】
一実施形態において、本明細書に開示される方法は、配列決定を使用して、DNAサンプル中の各遺伝子座における各対立遺伝子のインスタンスの数を測定する。各配列決定リードは、特定の遺伝子座にマッピングされ、バイナリ配列リードとして扱われ得、代替的に、リード及び/又はマッピングの同一性の確率は、配列リードの一部として組み込まれ得、確率的配列リード、すなわち、所与の遺伝子座にマッピングする配列リードの可能性のある全数又は分数をもたらす。バイナリカウント又はカウントの確率を使用して、測定値の各セットに対して二項分布を使用することが可能であり、カウント数の信頼区間を計算することができる。二項分布を使用するこの能力は、より正確な倍数推定及びより正確な信頼区間を計算することを可能にする。これは、存在する対立遺伝子の量を測定するために強度を使用する方法、例えば、マイクロアレイを使用する方法、又は電気泳動バンド内の蛍光タグ付きDNAの強度を測定するために蛍光リーダーを使用して測定を行う方法とは異なるか、又はそれに対する改善である。
【0051】
一実施形態において、本明細書に開示される方法は、本データセットの態様を使用して、そのデータセットの推定される対立遺伝子頻度分布のパラメータを決定する。これは、現在の予測される対立遺伝子頻度分布、又はおそらく予測される対立遺伝子の比率のパラメータを設定するために、データのトレーニングセット又はデータの以前のセットを利用する方法に対する改善である。これは、各遺伝子サンプルの収集及び測定には異なる条件セットが関与しているため、インスタントデータセットからのデータを使用して、そのサンプルの倍数決定に使用される結合分布モデルのパラメータを決定する方法がより正確になる傾向があるためである。
【0052】
一実施形態において、本明細書に開示される方法は、観察された対立遺伝子の測定値の分布が、最大尤度技術を使用して、正倍数体又は異数体の胎児を示すかどうかを決定することを伴う。最大尤度技術の使用は、得られる決定が著しく高い精度で行われるという点で、単一仮説拒絶技法を使用する方法とは異なり、著しい改善である。1つの理由は、単一の仮説拒絶技術が、2つではなく1つの測定値分布のみに基づいてカットオフ閾値を設定することであり、これは、閾値が通常最適ではないことを意味する。別の理由は、最大尤度技術が、個々のサンプルの特定の特性に関係なく、全てのサンプルに使用されるカットオフ閾値を決定する代わりに、個々のサンプルごとにカットオフ閾値を最適化することを可能にすることである。別の理由は、最大尤度技術を使用することで、各倍数性コールの信頼度の計算が可能になることである。コールごとに信頼度計算を行うことができるため、どのコールが正確で、どのコールが間違っている可能性が高いかを開業医が知ることができる。いくつかの実施形態において、多種多様な方法が、倍数性コールの精度を高めるために、最大尤度推定技術と組み合わせられてもよい。一実施形態において、最大尤度技術は、米国特許第7,888,017号に記載の方法と組み合わせて使用されてもよい。一実施形態において、最大尤度技術は、2011年10月にモントリオールで開催された国際ヒト遺伝学会2011で提示されるように、標的化PCR増幅を使用して混合サンプル中のDNAを増幅し、続いてタンデム診断によって使用されるようなリードカウント法を使用して配列決定及び分析する方法と組み合わせて使用されてもよい。一実施形態において、本明細書に開示される方法は、混合サンプル中のDNAの胎児画分を推定することと、その推定を使用して、倍数性コール及び倍数性コールの信頼度の両方を計算することとを含む。これは、推定された胎児画分を十分な胎児画分のスクリーニングとして使用し、続いて、胎児画分を考慮せず、またそのコールの信頼度計算を生成しない単一の仮説拒絶技法を使用して行われる倍数性コールを使用する方法とは異なることに留意されたい。
【0053】
一実施形態において、本明細書に開示される方法は、各測定値に確率を付加することによって、データがノイズを伴い、エラーを含む傾向を考慮に入れる。最大尤度技術を使用して、確率推定値を添付した測定データを使用して行われた仮説のセットから正しい仮説を選択すると、誤った測定値が割引される尤度が高くなり、正しい測定値が倍数性コールにつながる計算に使用される。より正確には、この方法は、倍数性の決定に誤って測定されるデータの影響を体系的に低減する。これは、全てのデータが等しく正しいと仮定される方法、又は外れデータが倍数性コールにつながる計算から任意に除外される方法に対する改善である。チャネル比測定を使用する既存の方法は、個々のSNPチャネル比を平均化することによって、方法を複数のSNPに拡張することを主張する。SNPの質及び観測されたリード深度に基づく予測される測定分散によって個々のSNPを重み付けしないことは、得られた統計の精度を低下させ、特に境界線上の場合において、倍数性コールの精度を著しく低下させる。
【0054】
一実施形態において、本明細書に開示される方法は、どのSNP又は他の多型遺伝子座が胎児にヘテロ接合性であるかの知識を前提としない。この方法は、父系遺伝子型情報が利用できない場合に、倍数性コールを行うことを可能にする。これは、標的化する遺伝子座を適切に選択するために、又は混合された胎児/母体DNAサンプルに対して行われた遺伝子測定を解釈するために、どのSNPがヘテロ接合であるかの知識を事前に知らなければならない方法に対する改善である。
【0055】
本明細書に記載される方法は、少量のDNAが利用可能であるか、又は胎児DNAの割合が低いサンプル上で使用される場合、特に有利である。これは、胎児DNA及び母体DNAの混合サンプル中の胎児DNAの割合が低い場合に、少量のDNAのみが利用可能である場合に生じる対応するより高い対立遺伝子ドロップアウト率及び/又は対応するより高い胎児対立遺伝子ドロップアウト率に起因する。対立遺伝子ドロップアウト率が高く、対立遺伝子の大部分が標的個体について測定されなかったことを意味し、不正確な胎児画分の計算、不正確な倍数性決定をもたらす。本明細書に開示される方法は、SNP間の遺伝パターンにおける連鎖を考慮に入れる結合分布モデルを使用してもよいので、有意により正確な倍数性の決定がなされてもよい。本明細書に記載される方法は、混合物中の胎児であるDNAの分子の割合が、40%未満、30%未満、20%未満、10%未満、8%未満、及び6%未満である場合に、正確な倍数性決定を行うことを可能にする。
【0056】
一実施形態において、個体のDNAが関連する個体のDNAと混合されるときの測定に基づいて、個体の倍数性状態を決定することが可能である。一実施形態において、DNAの混合物は、母体血漿中に見出される遊離浮遊DNAであり、これは、既知の核型及び既知の遺伝子型を有する母親由来のDNAを含み得、未知の核型及び未知の遺伝子型を有する胎児のDNAと混合され得る。一方又は両方の親からの既知の遺伝子型情報を使用して、異なる倍数性状態、胎児への各親からの異なる染色体寄与、及び任意選択で、混合物中の異なる胎児DNA画分についての混合サンプル中のDNAの複数の潜在的な遺伝子状態を予測することが可能である。各潜在的な組成物は、仮説と呼ばれる場合がある。次いで、胎児の倍数性状態は、実際の測定値を見て、どの潜在的な組成物が観察されたデータを考慮して最も可能性が高いかを決定することによって決定することができる。
【0057】
いくつかの実施形態において、本明細書に開示される方法は、インビトロ受精などの非常に少量のDNAが存在する状況、又は1つ又はいくつかの細胞(典型的には、10個未満の細胞、20個未満の細胞又は40個未満の細胞)が利用可能な法医学的状況において使用することができる。これらの実施形態において、本明細書に開示される方法は、他のDNAに汚染されていないが、少量のDNAをコールすることが非常に困難な少量のDNAから倍数性コールを行うのに役立つ。いくつかの実施形態において、本明細書に開示される方法は、標的DNAが別の個体のDNAで汚染されている状況において、例えば、出生前診断、父子鑑定、又は受胎産物検査の文脈における母体血液において使用され得る。これらの方法が特に有利であろういくつかの他の状況は、より多くの正常細胞の中に1つ又は少数の細胞のみが存在するがん検査の場合である。これらの方法の一部として使用される遺伝子測定は、DNA又はRNAを含む任意のサンプル、例えば、限定されないが、血液、血漿、体液、尿、毛髪、涙、唾液、組織、皮膚、指の爪、割球、胎芽、羊水、絨毛サンプル、糞便、胆汁、リンパ液、子宮頸粘液、精液、又は核酸を含む他の細胞又は物質について行われてもよい。一実施形態において、本明細書に開示される方法は、配列決定、マイクロアレイ、qPCR、デジタルPCR、又は核酸を測定するために使用される他の方法などの核酸検出方法で実行することができる。何らかの理由でそれが望ましいことが見出された場合、遺伝子座における対立遺伝子数確率の比率を計算することができ、対立遺伝子比率を使用して、本明細書に記載される方法のいくつかと組み合わせて倍数性状態を決定することができるが、その方法に互換性がある場合に限る。いくつかの実施形態において、本明細書に開示される方法は、処理されたサンプル上で行われるDNA測定から、複数の多型遺伝子座における対立遺伝子比をコンピュータ上で計算することを伴う。いくつかの実施形態において、本明細書に開示される方法は、本開示に記載される他の改善の任意の組み合わせとともに、処理されたサンプル上で行われるDNA測定から、複数の多型遺伝子座における対立遺伝子比をコンピュータ上で計算することを伴う。
【0058】
非侵襲性出生前診断(NPD)
非侵襲性出生前診断のプロセスは、いくつかの工程を伴う。工程のいくつかは、以下:(1)胎児から遺伝物質を得ることと、(2)エクスビボで、混合サンプル中にあってもよい、胎児の遺伝物質を濃縮することと、(3)エクスビボで、遺伝物質を増幅することと、(4)エクスビボで、遺伝物質中の特定の遺伝子座を優先的に濃縮することと、(5)エクスビボで、遺伝物質を測定することと、(6)コンピュータ上で、及びエクスビボで、遺伝子型データを分析することと、を含み得る。これらの6つ及び他の関連する工程を実施するために低減する方法が本明細書に記載される。方法工程の少なくともいくつかは、身体に直接適用されない。一実施形態において、本開示は、身体から単離及び分離された組織及び他の生物学的物質に適用される治療及び診断の方法に関する。方法工程の少なくともいくつかは、コンピュータ上で実行される。
【0059】
本開示のいくつかの実施形態は、臨床医が、赤ちゃんの健康が胎児の遺伝物質の収集によって危険にさらされないように、及び母親が侵襲的手法を受ける必要がないように、非侵襲性様式で母親に妊娠している胎児の遺伝子状態を決定することを可能にする。更に、特定の態様において、本開示は、出生前ケアにおいて広く使用されている、例えば、トリプル検査などの非侵襲的な母親の血清分析物ベースのスクリーニングよりも、高精度で、有意に高い精度で、胎児遺伝子状態を決定することを可能にする。
【0060】
本明細書に開示される方法の高精度は、本明細書に記載されるような、遺伝子型データの分析に対する情報学的アプローチの結果である。近代的な技術の進歩により、高スループット配列決定及び遺伝子型決定アレイなどの方法を使用して、遺伝子サンプルから大量の遺伝子情報を測定する能力がもたらされた。本明細書に開示される方法は、臨床医が利用可能な大量のデータをより大きな利点で利用し、胎児の遺伝子状態のより正確な診断を行うことを可能にする。いくつかの実施形態の詳細を以下に示す。異なる実施形態は、前述の工程の異なる組み合わせを伴っていてもよい。異なる工程の異なる実施形態の様々な組み合わせが、互換的に使用されてもよい。
【0061】
一実施形態において、血液サンプルは、妊娠中の母親から採取され、母体起源のDNAと胎児起源のDNAとの両方の混合物を含有する、母親の血液の血漿中の遊離浮遊DNAは、単離され、胎児の倍数性状態を決定するために使用される。一実施形態において、本明細書に開示される方法は、濃縮時に対立遺伝子比及び/又は対立遺伝子分布がほぼ一貫したままであるような方法で、多型対立遺伝子に対応するDNAの混合物中のこれらのDNA配列の優先的濃縮を含む。一実施形態において、本明細書に開示される方法は、得られた分子の非常に高い割合が標的遺伝子座に対応するように、高効率な標的化PCRベースの増幅を含む。一実施形態において、本明細書に開示される方法は、母体起源のDNAと胎児起源のDNAとの両方を含有するDNAの混合物を配列決定することを伴う。一実施形態において、本明細書に開示される方法は、測定された対立遺伝子分布を使用して、母親に妊娠している胎児の倍数性状態を決定することを伴う。一実施形態において、本明細書に開示される方法は、決定された倍数性状態を臨床医に報告することを伴う。一実施形態において、本明細書に開示される方法は、臨床作用、例えば、絨毛性絨毛サンプリング又は羊水穿刺などのフォローアップ侵襲性試験の実施、トリソミック個体の出生又はトリソミック胎児の選択的終了の準備を含む。
【0062】
遊離浮遊胎児DNAを含む母体血液のスクリーニング
本明細書に記載される方法を使用して、一定量の他の遺伝物質の存在下で標的の遺伝物質が見出される、小児、胎児、又は他の標的個体の遺伝子型を決定するのを助けてもよい。いくつかの実施形態において、遺伝子型は、1つ又は複数の染色体の倍数性状態を指し得、1つ又は複数の疾患連結対立遺伝子、又はそれらのいくつかの組み合わせを指し得る。本開示において、議論は、胎児DNAが母体血液中に見出される胎児の遺伝子状態を決定することに焦点を当てているが、本実施例は、本方法が適用され得る可能性のある文脈に限定することを意図していない。加えて、本方法は、標的DNAの量が非標的DNAと任意の割合である場合に適用することができ、例えば、標的DNAは、存在するDNAの0.000001~99.999999%の任意の場所を占めることができる。加えて、非標的DNAは、関連する非標的個体(複数可)のいくつか又は全てからの遺伝子データが既知である限り、必ずしも1つの個体、又は関連する個体からのものである必要はない。一実施形態において、本明細書に開示される方法を使用して、胎児DNAを含有する母体血液からの胎児の遺伝子型データを決定することができる。これはまた、妊婦の子宮内に複数の胎児が存在する場合、又はサンプル内に、例えば、他の既に生まれた兄弟からの他の汚染DNAが存在し得る場合に使用されてもよい。
【0063】
この技術は、胎児血液細胞が胎盤絨毛を通して母体の循環にアクセスするという現象を利用し得る。通常、非常に少数の胎児細胞のみがこの方法で母体循環に入る(胎児-母体出血のための陽性のKleihauer-Betke検査を生成するには不十分である)。胎児細胞は、特定のDNA配列を探すために様々な技術によって選別及び分析することができるが、侵襲的処置が本質的に有するリスクはない。この技術はまた、問題の胎盤組織が胎児と同じ遺伝子型のDNAを含有する胎盤組織のアポトーシスに続いて、DNA放出によって母体循環にアクセスする遊離浮遊胎児DNAの現象を利用し得る。母体血漿中に見出される遊離浮遊DNAは、30~40%の胎児DNAの割合で胎児DNAを含有することが示されている。
【0064】
一実施形態において、血液は、妊婦から採取されてもよい。研究によると、母体血液には、母体起源の遊離浮遊DNAに加えて、胎児からの少量の遊離浮遊DNAが含まれていてもよいことが示されている。加えて、核DNAを典型的に含有しない母体起源の多くの血液細胞に加えて、胎児起源のDNAを含む除核胎児血液細胞も存在し得る。胎児DNAを単離するか、又は胎児DNAを濃縮する画分を作製するために、当該技術分野で知られている多くの方法が存在する。例えば、クロマトグラフィーは、胎児DNAが濃縮される特定の画分を作製することが示されている。
【0065】
相対的に非侵襲性様式で抽出され、かつ母体DNAへのその割合において、又はその元の比率において濃縮された、細胞性又は遊離浮遊のいずれかの胎児DNAの量を含有する母体血液、血漿、又は他の流体のサンプルが手元にあるとき、当該サンプル中に見出されるDNAを遺伝子型決定してもよい。いくつかの実施形態において、血液は、静脈、例えば、バシリカ静脈から血液を引き出すために針を使用して採取されてもよい。本明細書に記載される方法を使用して、胎児の遺伝子型データを決定することができる。例えば、それを使用して、1つ以上の染色体での倍数性状態を決定することができ、それを使用して、挿入、欠失、及び転座を含む、1つ又は一連のSNPの同一性を決定することができる。これを使用して、1つ以上の遺伝子型特徴の起源の親を含む、1つ以上のハプロタイプを決定することができる。
【0066】
この方法は、ILLUMINA INFINIUMアレイプラットフォーム、AFFYMETRIX GENECHIP、ILLUMINAゲノムアナライザ、又はLIFE TECHNOLGIESの固体系などの任意の遺伝子型決定及び/又は配列決定方法に使用することができる任意の核酸で機能することに留意されたい。これには、血漿から抽出された遊離浮遊DNA、又はその増幅(例えば、全ゲノム増幅、PCR)、他の細胞型(例えば、全血からのヒトリンパ球)からのゲノムDNA、又はその増幅が含まれる。DNAの調製のために、これらのプラットフォームの1つに適したゲノムDNAを生成する任意の抽出又は精製方法も同様に機能する。この方法は、RNAのサンプルと同様に十分に機能し得る。一実施形態において、サンプルの保管は、分解を最小限に抑える方法(例えば、凍結下、約-20C、又はより低い温度で)で行われてもよい。
【0067】
定義
一塩基多型(SNP)は、同じ種の2つのメンバーのゲノム間で異なり得る単一ヌクレオチドを指す。この用語の使用は、各バリアントが生じる頻度のいかなる制限も意味すべきではない。
【0068】
配列は、DNA配列又は遺伝子配列を指す。これは、個体におけるDNA分子又は鎖の一次的な物理的構造を指し得る。これは、そのDNA分子内に見出されるヌクレオチドの配列、又はDNA分子に対する相補鎖を指し得る。これは、コンピュータでのその表現としてのDNA分子に含まれる情報を指し得る。
【0069】
遺伝子座は、個体のDNA上の特定の目的領域を指し、これはSNP、可能性のある挿入若しくは欠失の部位、又はいくつかの他の関連する遺伝的変動の部位を指し得る。疾患関連SNPはまた、疾患関連遺伝子座を指し得る。
【0070】
多型対立遺伝子、別名「多型遺伝子座」は、遺伝子型が所与の種内の個体間で変化する対立遺伝子又は遺伝子座を指す。多型対立遺伝子のいくつかの例としては、一塩基多型、短いタンデム反復、欠失、重複及び反転が挙げられる。
【0071】
多型部位は、個体間で異なる多型領域に見出される特定のヌクレオチドを指す。
【0072】
対立遺伝子は、特定の遺伝子座を占める遺伝子を指す。
【0073】
遺伝子データ、別名「遺伝子型データ」は、1つ以上の個体のゲノムの態様を記述するデータを指す。これは、遺伝子座の1つ又は1セット、部分的又は全体的な配列、部分的又は全体的な染色体、又はゲノム全体を指し得る。これは、1つ又は複数のヌクレオチドの同一性を指し得、これは、一連の連続したヌクレオチド、又はゲノム内の異なる位置からのヌクレオチド、又はそれらの組み合わせを指し得る。遺伝子型データはコンピュータ上であるが、配列中の物理的ヌクレオチドを化学的にコードされた遺伝子データとみなすことも可能である。遺伝子型データは、個体(複数可)「に関する」、個体(複数可)「の」、個体(複数可)「での」、個体(複数可)「からの」又は個体「に関する」と言うことができる。遺伝子型データは、遺伝物質に対してこれらの測定が行われる遺伝子型決定プラットフォームからの出力測定を指し得る。
【0074】
遺伝物質、別名「遺伝子サンプル」は、DNA又はRNAを含む1つ以上の個体からの、組織又は血液などの物理的物質を指す。
【0075】
ノイズの多い遺伝子データは、以下のいずれかを有する遺伝子データを指す:対立遺伝子ドロップアウト、不確実な塩基対測定値、不正確な塩基対測定値、欠損した塩基対測定値、挿入若しくは欠失の不確実な測定値、染色体セグメントコピー数の不確実な測定値、偽シグナル、欠損した測定値、他のエラー、又はそれらの組み合わせ。
【0076】
信頼性は、いわゆるSNP、対立遺伝子、対立遺伝子のセット、倍数性コール、又は染色体セグメントコピーの決定された数が、個体の実際の遺伝子状態を正しく表す統計的尤度を指す。
【0077】
「染色体コピー数コール」又は「コピー数コール」(CNC)とも呼ばれる倍数性コールは、細胞内に存在する1つ以上の染色体の量及び/又は染色体同一性を決定する行為を指し得る。
【0078】
異数性は、間違った数の染色体が細胞内に存在する状態を指す。ヒト体細胞の場合、これは、細胞が22対の常染色体及び1対の性染色体を含有しない場合を指し得る。ヒト配偶子の場合、これは、細胞が23個の染色体の各々のうちの1つを含有しない場合を指し得る。単一染色体型の場合、これは、2つより多い、又は少ない相同であるが同一でない染色体コピーが存在する場合、又は同じ親に由来する2つの染色体コピーが存在する場合を指し得る。
【0079】
倍数性状態とは、細胞内の1つ以上の染色体の量及び/又は染色体同一性を指す。
【0080】
染色体は、単一染色体コピーを指し得、これは、正常な体細胞内に46個あるDNAの単一分子を意味し、その例は「母体由来染色体18」である。染色体はまた、正常なヒト体細胞内に23個ある染色体型を指し得、その例は「染色体18」である。
【0081】
染色体同一性は、対象の染色体番号、すなわち染色体型を指し得る。正常なヒトには、22種類の番号付けされた常染色体型と、2種類の性染色体がある。これはまた、染色体の親起源を指し得る。これはまた、親から遺伝した特定の染色体を指し得る。これはまた、染色体の他の識別特徴を指し得る。
【0082】
遺伝物質の状態又は単に「遺伝子状態」は、DNA上の一連のSNPの同一性、遺伝物質の段階的なハプロタイプ、及び挿入、欠失、反復及び変異を含む、DNAの配列を指し得る。また、1つ以上の染色体、染色体セグメント、又は染色体セグメントのセットの倍数性状態を指し得る。
【0083】
対立遺伝子データは、1つ以上の対立遺伝子のセットに関する遺伝子型データのセットを指す。これは、段階的なハプロタイプのデータを指し得る。これは、SNP同一性を指し得、挿入、欠失、反復及び変異を含む、DNAの配列データを指し得る。これは、各対立遺伝子の親起源を含み得る。
【0084】
対立遺伝子状態とは、1つ以上の対立遺伝子のセットにおける遺伝子の実際の状態を指す。これは、対立遺伝子データによって説明される遺伝子の実際の状態を指し得る。
【0085】
対立遺伝子の比率又は対立遺伝子比率は、サンプル又は個体中に存在する遺伝子座における各対立遺伝子の量間の比率を指す。サンプルが配列決定によって測定された場合、対立遺伝子の比率は、遺伝子座における各対立遺伝子にマッピングする配列リードの比率を指し得る。サンプルが強度ベースの測定方法によって測定された場合、対立遺伝子比率は、測定方法によって推定される、その遺伝子座に存在する各対立遺伝子の量の比率を指し得る。
【0086】
対立遺伝子数は、特定の遺伝子座にマッピングする配列の数を指し、その遺伝子座が多型である場合、対立遺伝子の各々にマッピングする配列の数を指す。各対立遺伝子がバイナリ方式でカウントされる場合、対立遺伝子数は整数となる。対立遺伝子が確率的にカウントされる場合、対立遺伝子数は、分数であってもよい。
【0087】
対立遺伝子数確率は、マッピングの確率と組み合わせて、多型遺伝子座における特定の遺伝子座又は対立遺伝子のセットにマッピングする可能性が高い配列の数を指す。対立遺伝子数は、それぞれのカウントされた配列についてのマッピングの確率がバイナリ(ゼロ又は1)である対立遺伝子数確率と等価であることに留意されたい。いくつかの実施形態において、対立遺伝子数確率は、バイナリであってもよい。いくつかの実施形態において、対立遺伝子数確率は、DNA測定値と等しいように設定されてもよい。
【0088】
対立遺伝子分布、又は「対立遺伝子数分布」は、遺伝子座のセット内の各遺伝子座について存在する各対立遺伝子の相対量を指す。対立遺伝子分布は、個体、サンプル、又はサンプルに対して行われる測定のセットを指すことができる。配列決定の文脈において、対立遺伝子分布は、多型遺伝子座のセット内の各対立遺伝子についての特定の対立遺伝子にマッピングするリードの数又は可能性のある数を指す。対立遺伝子の測定値は、確率的に処理されてもよく、すなわち、所与の対立遺伝子が、読み取られた所与の配列に対して存在する尤度は、0と1との間の分数であり、又はそれらは、バイナリ様式で処理されてもよく、すなわち、所与の読み取り値は、特定の対立遺伝子の正確なゼロ又は1つのコピーであるとみなされる。
【0089】
対立遺伝子分布パターンは、異なる親のコンテキストに対する異なる対立遺伝子分布のセットを指す。特定の対立遺伝子分布パターンは、特定の倍数性状態を示し得る。
【0090】
対立遺伝子バイアスは、ヘテロ接合遺伝子座で測定された対立遺伝子の比率が、DNAの元のサンプルに存在した比率と異なる程度を指す。特定の遺伝子座での対立遺伝子バイアスの程度は、測定時のその遺伝子座で観察された対立遺伝子比率を、その遺伝子座での元のDNAサンプルにおける対立遺伝子の比率で除したものである。対立遺伝子バイアスは、対立遺伝子バイアスの度合いの計算が1未満の値xを返す場合、対立遺伝子バイアスの度合いは1/xとして再記載され得るように、1より大きいと定義され得る。対立遺伝子バイアスは、増幅バイアス、精製バイアス、又は異なる対立遺伝子に異なる影響を与えるいくつかの他の現象に起因し得る。
【0091】
プライマー、別名「PCRプローブ」は、DNA分子が同一又はほぼ同一であり、プライマーが標的多型遺伝子座にハイブリダイズするように設計された領域を含み、mがPCR増幅を可能にするように設計されたプライミング配列を含む、単一のDNA分子(DNAオリゴマー)又はDNA分子(DNAオリゴマー)の集合体を指す。プライマーはまた、分子バーコードを含んでいてもよい。プライマーは、個々の分子ごとに異なるランダム領域を含んでいてもよい。
【0092】
ハイブリッド捕捉プローブは、PCR又は直接合成などの様々な方法によって生成され、サンプル中の特定の標的DNA配列の1つの鎖に相補的であることを意図している、場合によっては修飾された任意の核酸配列を指す。外因性ハイブリッド捕捉プローブを調製したサンプルに添加し、変性-アニールプロセスを通じてハイブリダイゼーションして、外因性-内因性フラグメントの二本鎖を形成してもよい。次いで、これらの二本鎖は、様々な手段によってサンプルから物理的に分離され得る。
【0093】
配列リードは、クローン配列決定方法を用いて測定した、ヌクレオチド塩基の配列を表すデータを指す。クローン配列決定は、単一の、又はクローンの、又はクラスターの1つの元のDNA分子を表す配列データを生成し得る。配列リードはまた、ヌクレオチドが正しくコールされた可能性を示す配列の各塩基位置に、関連する品質スコアを有し得る。
【0094】
配列リードをマッピングすることは、特定の生物のゲノム配列における配列リードの起点の位置を決定するプロセスである。配列リードの起点の位置は、リード及びゲノム配列のヌクレオチド配列の類似性に基づく。
【0095】
「マッチング染色体異数性」(MCA)とも呼ばれるマッチしたコピーエラーは、1つの細胞が2つの同一又はほぼ同一の染色体を含む異数性の状態を指す。この種の異数性は、減数分裂における配偶子の形成中に生じる場合があり、減数分裂非分離エラーと呼ばれる場合がある。この種のエラーは、有糸分裂で発生し得る。マッチングトリソミーは、所与の染色体の3つのコピーが個体に存在し、コピーのうちの2つが同一である場合を指し得る。
【0096】
「ユニーク染色体非整数体」(UCA)とも呼ばれるマッチしないコピーエラーは、1つの細胞が同じ親由来の2つの染色体を含有し、相同であり得るが同一ではない異数性の状態を指す。この種の異数性は、減数分裂中に生じる場合があり、減数分裂エラーと呼ばれる場合がある。非マッチングトリソミーは、所与の染色体の3つのコピーが個体に存在し、コピーのうちの2つが同じ親に由来し、かつ相同であるが、同一ではない場合を指し得る。非マッチングトリソミーは、一方の親からの2つの相同な染色体が存在し、染色体のいくつかのセグメントが同一であり、他のセグメントが単に相同である場合を指し得ることに留意されたい。
【0097】
相同染色体は、通常減数分裂中に対合する遺伝子の同じセットを含む染色体コピーを指す。
【0098】
同一染色体は、遺伝子の同じセットを含む染色体コピーを指し、各遺伝子について、それらは、同一又はほぼ同一の対立遺伝子の同じセットを有する。
【0099】
対立遺伝子ドロップアウト(ADO)は、所与の対立遺伝子における相同染色体からの塩基対のセット内の塩基対の少なくとも1つが検出されない状況を指す。
【0100】
遺伝子座ドロップアウト(LDO)は、所与の対立遺伝子における相同染色体からの塩基対のセット内の両方の塩基対が検出されない状況を指す。
【0101】
ホモ接合性とは、対応する染色体遺伝子座と同様の対立遺伝子を有することを指す。
【0102】
ヘテロ接合性とは、対応する染色体遺伝子座として異なる対立遺伝子を有することを指す。
【0103】
ヘテロ接合率は、所与の遺伝子座にヘテロ接合性対立遺伝子を有する群内の個体の割合を指す。また、ヘテロ接合率は、個体、又はDNAのサンプル中の所与の遺伝子座における対立遺伝子の予測される、又は測定される比率を指し得る。
【0104】
高情報性単一ヌクレオチド多型(HISNP)は、胎児が母系遺伝子型に存在しない対立遺伝子を有するSNPを指す。
【0105】
染色体領域は、染色体のセグメント、又は完全な染色体を指す。
【0106】
染色体のセグメントは、1つの塩基対から染色体全体までのサイズの範囲であり得る染色体のセクションを指す。
【0107】
染色体は、完全な染色体、又は染色体のセグメント若しくはセクションのいずれかを指す。
【0108】
コピーは、染色体セグメントのコピー数を指す。これは、染色体セグメントの同一のコピー、又は染色体セグメントの異なるコピーが実質的に類似した遺伝子座のセットを含み、対立遺伝子の1つ以上が異なる、染色体セグメントの非同一の相同コピーを指し得る。M2コピーエラーなどの異数性のいくつかの場合においては、同一である所与の染色体セグメントのいくつかのコピー及び同一でない同じ染色体セグメントのいくつかのコピーを有することが可能であることに留意されたい。
【0109】
ハプロタイプは、典型的には、同じ染色体上で一緒に遺伝される複数の遺伝子座における対立遺伝子の組み合わせを指す。ハプロタイプは、所与の遺伝子座のセット間で生じた組換えイベントの数に応じて、わずか2個の遺伝子座又は染色体全体を指し得る。ハプロタイプはまた、統計的に関連付けられている単一の染色分体上の一塩基多型(SNP)のセットを指し得る。
【0110】
「フェージングデータ」又は「順序化遺伝子データ」とも呼ばれるハプロタイプデータは、二倍体又は多倍体ゲノム中の単一染色体、すなわち、二倍体ゲノム中の染色体の分離された母体又は父体コピーのいずれかからのデータを指す。
【0111】
フェージングは、個々の所与の順序付けられていない二倍体(又は多倍体)遺伝子データのハプロタイプ遺伝子データを決定する行為を指す。これは、1つの染色体上に見出される対立遺伝子のセットについての対立遺伝子における2つの遺伝子のうちのどれが、個体における2つの相同染色体の各々と会合するかを決定する行為を指し得る。
【0112】
フェージングデータは、1つ以上のハプロタイプが決定された遺伝子データを指す。
【0113】
仮説は、所与の染色体のセットでの可能な倍数性状態、又は所与の遺伝子座のセットでの可能な対立遺伝子状態のセットを指す。可能性のセットは、1つ以上の要素を含んでもよい。
【0114】
「倍数性状態仮説」とも呼ばれるコピー数仮説は、個体における染色体のコピー数に関する仮説を指す。これはまた、各染色体の起源の親、及び親の2つの染色体のうちのどの染色体が個体に存在するかを含む、染色体のそれぞれの同一性に関する仮説を指し得る。これはまた、ある場合には、関連する個体からのどの染色体、又は染色体セグメントが、個体からの所与の染色体に遺伝的に対応するかに関する仮説を指し得る。
【0115】
標的個体とは、遺伝子状態が決定されている個体を指す。いくつかの実施形態において、限定された量のDNAのみが、標的個体から利用可能である。いくつかの実施形態において、標的個体は、胎児である。いくつかの実施形態において、2つ以上の標的個体が存在してもよい。いくつかの実施形態において、親の対に由来する各胎児は、標的個体であるとみなされ得る。いくつかの実施形態において、決定される遺伝子データは、1つの対立遺伝子コールのセットである。いくつかの実施形態において、決定される遺伝子データは、倍数性コールである。
【0116】
関連する個体とは、標的個体と遺伝的に関連し、したがってハプロタイプブロックを共有する任意の個体を指す。1つの文脈において、関連する個体は、標的個体の遺伝的親、又は精子、極性体、胚、胎児、若しくは子供などの親に由来する任意の遺伝物質であってもよい。また、兄弟姉妹、親、又は祖父母を指す場合もある。
【0117】
兄弟姉妹とは、遺伝的親が問題の個体と同じである任意の個体を指す。いくつかの実施形態において、これは、出生児、胚若しくは胎児、又は出生時、胚若しくは胎児に由来する1つ以上の細胞を指し得る。兄弟姉妹はまた、精子、極性体、又は任意の他のセットのハプロタイプ遺伝子物質など、親の一方に由来する単倍体個体を指し得る。個体は、それ自体の兄弟姉妹であるとみなされ得る。
【0118】
胎児は、「胎児の」、又は「胎児と遺伝的に類似している胎盤の領域の」ものを指す。妊娠中の女性において、胎盤の一部は胎児と遺伝的に類似しており、母体血液中に見出される遊離浮遊胎児DNAは、胎児にマッチする遺伝子型を有する胎盤の一部に由来する可能性がある。胎児における染色体の半分の遺伝情報は、胎児の母親から遺伝することに留意されたい。いくつかの実施形態において、胎児細胞に由来するこれらの母体から遺伝した染色体からのDNAは、「母体起源の」ではなく「胎児起源の」ものであるとみなされる。
【0119】
胎児起源のDNAとは、元々遺伝子型が胎児のものと本質的に同等であった細胞の一部であったDNAを指す。
【0120】
母体起源のDNAとは、元々遺伝子型が母親のものと本質的に同等であった細胞の一部であったDNAを指す。
【0121】
子供は、胚、芽球、又は胎児を指し得る。本開示の実施形態において、説明される概念は、出生児、胎児、胚、又はそれからの細胞のセットである個体に等しく良好に適用されることに留意されたい。子供という用語の使用は、単に、子供と呼ばれる個体が親の遺伝的子孫であることを意味する場合がある。
【0122】
親は、個体の遺伝的母親又は父親を指す。個体は、典型的には、2人の親、すなわち母親及び父親を有するが、これは、必ずしも、遺伝的又は染色体キメラのような場合ではないかもしれない。親は個体とみなされ得る。
【0123】
親のコンテキストは、標的の2つの親の一方又は両方の2つの関連する染色体の各々における、所与のSNPの遺伝子状態を指す。
【0124】
所望通りに発育させる(別名「正常に発育させる」)とは、子宮内に生存可能な胚を移植して妊娠をもたらすこと、及び/又は妊娠を継続して出生をもたらすこと、及び/又は生まれた子供に染色体異常がないこと、及び/又は生まれた子供に疾患関連遺伝子などの他の望ましくない遺伝子状態がないことを指す。「所望通りに発育させる」という用語は、親又はヘルスケアファシリテーターによって所望され得る任意のものを包含することを意味する。ある場合に、「所望通りに発育させる」とは、医学研究又は他の目的に有用な生存不可能又は生存可能な胚を指していてもよい。
【0125】
子宮への挿入とは、インビトロ受精の文脈において胚を子宮腔に移植するプロセスを指す。
【0126】
母体血漿とは、妊娠している女性からの血液の血漿部分を指す。
【0127】
臨床的決定は、個人の健康又は生存に影響を及ぼす結果を有する行為を行うかどうかの決定を指す。出生前診断の文脈において、臨床的決定とは、胎児を中絶するか又はしないかの決定を指し得る。臨床的決定はまた、更なる検査を実行すること、望ましくない表現型を緩和するための措置を講じること、又は異常を有する子供の出生に備えるための行為を行うことを指し得る。
【0128】
診断ボックスは、本明細書に開示される方法の1つ又は複数の態様を実行するように設計された機械の1つ又は組み合わせを指す。一実施形態において、診断ボックスは、患者のケアのポイントに配置されてもよい。一実施形態において、診断ボックスは、標的化増幅の後に配列決定を行ってもよい。一実施形態において、診断ボックスは、単独で、又は技術者の助けを借りて機能してもよい。
【0129】
インフォマティクスベースの方法は、大量のデータを理解するために統計に大きく依存する方法を指す。出生前診断の文脈において、これは、例えば分子アレイ又は配列決定からの大量の遺伝子データを仮定して、状態を直接物理的に測定することによってではなく、最も可能性の高い状態を統計的に推測することによって、1つ以上の染色体での倍数性状態又は1つ以上の対立遺伝子での対立遺伝子状態を決定するように設計された方法を指す。本開示の一実施形態において、インフォマティクスベースの技術は、本特許において開示されるものであってもよい。本開示の一実施形態において、これは、PARENTAL SUPPORT(商標)であってもよい。
【0130】
一次遺伝子データは、遺伝子型決定プラットフォームによって出力されるアナログ強度シグナルを指す。SNPアレイの文脈では、一次遺伝子データは、任意の遺伝子型コールが行われる前の強度シグナルを指す。配列決定の文脈では、一次遺伝子データは、任意の塩基対の同一性が決定される前に、及び配列がゲノムにマッピングされる前に、シーケンサから出る、クロマトグラムに類似するアナログ測定値を指す。
【0131】
二次遺伝子データは、遺伝子型決定プラットフォームによって出力される処理された遺伝子データを指す。SNPアレイの文脈では、二次遺伝子データは、ソフトウェアが、所与の対立遺伝子がサンプル中に存在しても存在しなくてもコールした、SNPアレイリーダーに関連付けられたソフトウェアによって行われた対立遺伝子コールを指す。配列決定の文脈では、二次遺伝子データは、配列の塩基対同一性が決定されていることを指し、場合によっては、配列がゲノムにマッピングされている場合もある。
【0132】
非侵襲性出生前診断(NPD)、又は「非侵襲性出生前スクリーニング」(NPS)は、母親の血液中に見出される遺伝物質を使用して母親に妊娠している胎児の遺伝子状態を決定する方法を指し、遺伝物質は、母親の静脈内血液を採取することによって得られる。
【0133】
遺伝子座に対応するDNAの優先的濃縮、又は遺伝子座におけるDNAの優先的濃縮とは、遺伝子座に対応する濃縮前DNA混合物中のDNAの分子のパーセンテージよりも高い、遺伝子座に対応する濃縮後DNA混合物中のDNAの分子のパーセンテージをもたらす任意の方法を指す。この方法は、遺伝子座に対応するDNA分子の選択的増幅を含んでもよい。この方法は、遺伝子座に対応しないDNA分子を除去することを含んでもよい。この方法は、方法の組み合わせを含んでもよい。濃縮度は、遺伝子座に対応する濃縮後混合物中のDNA分子のパーセンテージを、遺伝子座に対応する濃縮前混合物中のDNA分子のパーセンテージで割ったものとして定義される。優先的濃縮は、複数の遺伝子座で行われてもよい。本開示のいくつかの実施形態において、濃縮度は20を超える。本開示のいくつかの実施形態において、濃縮度は200を超える。本開示のいくつかの実施形態において、濃縮度は2,000を超える。優先的濃縮が複数の遺伝子座で行われる場合、濃縮度は、遺伝子座のセット中の全ての遺伝子座の平均濃縮度を指し得る。
【0134】
増幅は、DNAの分子のコピー数を増加させる方法を指す。
【0135】
選択的増幅とは、DNAの特定の分子、又はDNAの特定の領域に対応するDNAの分子のコピー数を増加させる方法を指し得る。また、DNAの非標的分子又は領域を増加させるよりも、DNAの特定の標的分子、又はDNAの標的領域のコピー数を増加させる方法を指し得る。選択的増幅は、優先的濃縮方法であり得る。
【0136】
ユニバーサルプライミング配列とは、例えば、ライゲーション、PCR、又はライゲーション媒介PCRによって標的DNA分子の集団に付加され得るDNA配列を指す。標的分子の集団に加えられると、ユニバーサルプライミング配列に特異的なプライマーを使用して、単一の増幅プライマー対を使用して標的集団を増幅することができる。ユニバーサルプライミング配列は、典型的には、標的配列に関連しない。
【0137】
ユニバーサルアダプター、又は「ライゲーションアダプター」若しくは「ライブラリタグ」とは、標的二本鎖DNA分子の集団の5’末端及び3’末端に共有結合可能なユニバーサルプライミング配列を含むDNA分子である。アダプターの添加は、PCR増幅が行われ得る標的集団の5’末端及び3’末端にユニバーサルプライミング配列を提供し、単一の増幅プライマー対を使用して、標的集団由来の全ての分子を増幅する。
【0138】
標的化とは、DNAの混合物中の遺伝子座のセットに対応するDNAの分子を選択的に増幅するか、又は別様に優先的に濃縮するために使用される方法を指す。
【0139】
結合分布モデルは、同じ確率空間上に定義された複数のランダム変数を仮定して、変数の確率がリンクされている場合に、複数のランダム変数の観点から定義されたイベントの確率を定義するモデルを指す。いくつかの実施形態において、変数の確率がリンクされていない縮退事例が使用されてもよい。
【0140】
仮説
本開示の文脈において、仮説は、可能性のある遺伝子状態を指す。これは、可能性のある倍数性状態を指し得る。これは、可能性のたる対立遺伝子状態を指し得る。仮説のセットは、可能性のある遺伝子状態のセット、可能性のある対立遺伝子状態のセット、可能性のある倍数性状態のセット、又はそれらの組み合わせを指し得る。いくつかの実施形態において、仮説のセットは、セットからの1つの仮説が任意の所与の個体の実際の遺伝子状態に対応するように設計されてもよい。いくつかの実施形態において、仮説のセットは、全ての可能性のある遺伝子状態がそのセットからの少なくとも1つの仮説によって説明され得るように設計されてもよい。本開示のいくつかの実施形態において、方法の一態様は、どの仮説が問題の個体の実際の遺伝子状態に対応するかを決定することである。
【0141】
本開示の別の実施形態において、1つの工程は、仮説を作成することを伴う。いくつかの実施形態において、それは、コピー数仮説であってもよい。いくつかの実施形態において、関連する個体の各々からの染色体のどのセグメントが、もしあれば、他の関連する個体のどのセグメントに遺伝的に対応するかに関する仮説を伴っていてもよい。仮説を作成することは、検討中の可能性のある遺伝子状態のセット全体がそれらの変数に包含されるように、変数の限界を設定する行為を指し得る。
【0142】
「複製数仮説」は、「倍数性仮説」又は「倍数性状態仮説」とも呼ばれ、標的個体における所与の染色体コピー、染色体タイプ、又は染色体の切片についての可能性のある倍数性状態に関する仮説を指し得る。また、個体における染色体型のうちの2つ以上の倍数性状態を指し得る。コピー数仮説のセットは、各仮説が個体における異なる可能な倍数性状態に対応する仮説のセットを指し得る。仮説のセットは、可能性のある倍数性状態のセット、可能性のある親ハプロタイプの寄与のセット、混合サンプル中の可能性のある胎児DNAのパーセンテージのセット、又はそれらの組み合わせに関するものであってもよい。
【0143】
正常な個体は、各親からの各染色体タイプのうちの1つを含む。しかしながら、減数分裂及び有糸分裂における誤差により、個体が、各々の親から所与の染色体タイプを0、1、2、又はそれ以上有することが可能である。実際には、親からの所与の染色体のうちの2つ以上を見ることはまれである。本開示では、いくつかの実施形態は、所与の染色体の0、1、又は2つのコピーが親に由来する可能な仮説のみを考慮する。親に由来する多かれ少なかれ可能性のあるコピーを考慮するのは簡単な拡張である。いくつかの実施形態において、所与の染色体について、9つの可能な仮説がある:母体起源の0、1、又は2つの染色体に関する3つの可能な仮説に、父親起源の0、1、又は2つの可能な仮説を乗じたものである。(m,f)は、mが母親から継承された所与の染色体の数であり、fが父親から継承された所与の染色体の数であるという仮説を指す。したがって、9つの仮説は(0,0)、(0,1)、(0,2)、(1,0)、(1,1)、(1,2)、(2,0)、(2,1)及び(2,2)である。これらは、H00、H01、H02、H10、H12、H20、H21、及びH22としても書かれてもよい。異なる仮説は、異なる倍数性状態に対応する。例えば、(1,1)は、正常なダイソミック染色体を指し、(2,1)は、母体トリソミーを指し、(0,1)は、父体モノソミーを指す。いくつかの実施形態において、2つの染色体が一方の親から遺伝し、一方の染色体が他方の親から遺伝している場合は、2つの染色体が同一である場合(マッチするコピーエラー)、及び2つの染色体が相同であるが同一ではない場合(マッチしないコピーエラー)の2つの場合に更に分化されてもよい。これらの実施形態において、16の可能な仮説が存在する。他の仮説のセット、及び異なる数の仮説を使用することが可能であることを理解されたい。
【0144】
本開示のいくつかの実施形態において、倍数性仮説は、他の関連個体由来の染色体が標的個体のゲノム中に見出される染色体に対応するという仮説を指す。いくつかの実施形態において、本方法の鍵は、関連する個体がハプロタイプブロックを共有することが予想され得るという事実であり、関連する個体からの測定された遺伝子データを使用して、標的個体と関連する個体との間でどのハプロタイプブロックが一致するかの知識とともに、標的個体の遺伝子測定値のみを使用するよりも高い信頼性で、標的個体についての正しい遺伝子データを推論することが可能である。したがって、いくつかの実施形態において、倍数性仮説は、染色体の数だけでなく、関連する個体におけるどの染色体が、標的個体における1つ以上の染色体と同一であるか、又はほぼ同一であるかにも関係し得る。
【0145】
仮説のセットが定義されると、アルゴリズムが入力遺伝子データを操作するとき、それらは、検討中の仮説の各々について決定された統計的確率を出力し得る。様々な仮説の確率は、関連する遺伝子データを入力として使用して、様々な仮説の各々について、本開示の他の場所に記載される専門家技術、アルゴリズム、及び/又は方法のうちの1つ以上によって述べられるように、確率が等しい値を数学的に計算することによって決定され得る。
【0146】
複数の技術によって決定されるように、異なる仮説の確率が推定されると、それらを組み合わせることができる。これは、各仮説について、各技術によって決定される確率を乗算することを伴い得る。仮説の確率の積を正規化してもよい。1つの倍数性仮説は、染色体についての1つの可能な倍数性状態を指すことに留意されたい。
【0147】
「確率を組み合わせること」、又は「仮説を組み合わせること」とも呼ばれる、又は専門家の技術の結果を組み合わせることのプロセスは、線形代数の当業者によく知られているべき概念である。確率を組み合わせる1つの可能な方法は、以下の通りである:遺伝子データのセットを与えられた仮説のセットを評価するために専門家の技術を使用する場合、方法の出力は、仮説のセット内の各仮説に1対1の方法で関連付けられる確率のセットである。各々がセット内の仮説のうちの1つに関連付けられている第1の専門家技術によって決定された確率のセットが、各々が同じ仮説のセットに関連付けられている第2の専門家技術によって決定された確率のセットと組み合わされると、確率の2つのセットが乗算される。これは、セット内の各仮説について、2つの専門家の方法によって決定されるように、その仮説に関連する2つの確率が一緒に乗算され、対応する積が出力確率であることを意味する。このプロセスは、任意の数の専門技術に拡張されてもよい。1つの専門技術のみが使用される場合、出力確率は、入力確率と同じである。2つ以上の専門技術が使用される場合、次いで、関連する確率は、同時に乗算されてもよい。積は、仮説のセットにおける仮説の確率が100%になるように正規化され得る。
【0148】
いくつかの実施形態において、所与の仮説についての組み合わされた確率が、他の仮説のいずれかについての組み合わされた確率よりも大きい場合、その仮説が最も可能性が高いと決定されると考えられ得る。いくつかの実施形態において、仮説は、最も可能性が高いと決定されてもよく、正規化された確率が閾値よりも大きい場合、倍数性状態、又は他の遺伝子状態がコールされてもよい。一実施形態において、これは、その仮説に関連する染色体の数及び同一性が、倍数性状態として呼ばれてもよいことを意味してもよい。一実施形態において、これは、その仮説に関連する対立遺伝子の同一性が対立遺伝子状態と呼ばれてもよいことを意味してもよい。いくつかの実施形態において、閾値は、約50%~約80%であってもよい。いくつかの実施形態において、閾値は、約80%~約90%であってもよい。いくつかの実施形態において、閾値は、約90%~約95%であってもよい。いくつかの実施形態において、閾値は、約95%~約99%であってもよい。いくつかの実施形態において、閾値は、約99%~約99.9%であってもよい。いくつかの実施形態において、閾値は、約99.9%を超えてもよい。
【0149】
倍数性仮説は、尤度を提供する方法、アルゴリズム、技術、又はサブルーチンを使用する本発明の例示的な方法の間に作成される。例えば、異数性の有無を決定するための実施形態の特定の例示的な例において、一連の倍数性仮説が、一連のサンプル中の各サンプルについて作成され、各仮説は、サンプルのゲノム中の目的の染色体又は染色体セグメントについての特定のコピー数に関連付けられる。例えば、本明細書に開示されるQMMなどの定量的な非対立遺伝子データを使用する実施形態において、仮説は、ピペッティングのばらつき又は誤差又は他の測定誤差によるサンプル中のDNAの開始量のばらつきなどのサンプルパラメータの推定値を提供することができ、これを使用して、そのサンプル中の目的の染色体又は染色体セグメントのいくつか又は全ての位置での測定値(すなわち、測定された遺伝子データ)を正規化することができ、次いで、検定統計量を、これらの正規化された測定値の分散加重平均として計算することができる。したがって、特定の実施形態において、仮説は、所与の倍数性条件についての分散加重平均検定統計量を提供する。検定統計量の期待値及び分散値は、染色体コピー数仮説の各々の下で計算され、最大尤度推定値のガウスモデルを形成する。例えば、非対立遺伝子定量分析のためのNIPT分析における仮説のセットは、染色体13、18、及び21のうちの1つ以上におけるダイソミー又はトリソミーについての分散加重平均検定統計量を提供することができる。目的の染色体又は染色体セグメントを使用してサンプルパラメータを設定することができる本発明の例示的な実施形態において、仮説は、染色体のいくつか又は全てのコピー数、例えば、染色体13、18、及び21に関する結合仮説であり得る。これは、非標的参照染色体を使用しない定量的方法に関して、以下で更に説明される。
【0150】
本開示のいくつかの実施形態において、倍数性仮説は、他の関連個体由来の染色体が標的個体のゲノム中に見出される染色体に対応する仮説を指し得る。いくつかの実施形態は、関連する個体がハプロタイプブロックを共有することが予想され得るという事実であり、関連する個体からの測定された遺伝子データを使用して、標的個体と関連する個体との間でどのハプロタイプブロックが一致するかの知識とともに、標的個体の遺伝子測定値のみを使用するよりも高い信頼性で、標的個体についての正しい遺伝子データを推論することが可能である。したがって、いくつかの実施形態において、倍数性仮説は、染色体の数だけでなく、関連する個体におけるどの染色体が、標的個体における1つ以上の染色体と同一であるか、又はほぼ同一であるかにも関係し得る。
【0151】
対立遺伝子仮説、又は「対立遺伝子状態仮説」は、対立遺伝子のセットの可能な対立遺伝子状態に関する仮説を指し得る。いくつかの実施形態において、使用される技術、アルゴリズム、又は方法は、上述のように、関連個体がハプロタイプブロックを共有し得るという事実を利用し、これは、完全に測定されなかった遺伝子データの再構築を助け得る。対立遺伝子仮説はまた、ある場合には、関連する個体からのどの染色体、又は染色体セグメントが、個体からの所与の染色体に遺伝的に対応するかに関する仮説を指し得る。減数分裂の理論は、個体の各染色体が2つの親のうちの1つから継承されていることを示しており、これは親の染色体のほぼ同一のコピーである。したがって、親のハプロタイプ、すなわち、親の段階的な遺伝子型が知られている場合、子供の遺伝子型も推測され得る(ここでの「子供」という用語は、2つの配偶子、1つは母親から、もう1つは父親から形成された個体を含むことを意味する)。本開示の一実施形態において、対立遺伝子仮説は、目的の染色体又は染色体セグメントでのハプロタイプを含む対立遺伝子のセットでの可能な対立遺伝子状態、並びに関連する個体からのどの染色体が、対立遺伝子のセットを含有する染色体(複数可)に一致し得るかを説明する。
【0152】
仮説のセットが定義されると、アルゴリズムは入力遺伝子データを操作し、検討中の仮説の各々について決定された統計的確率を出力する。例えば、本発明の実施形態において、本方法は、遺伝子データを各仮説についての予測結果と比較することによって確率値を決定し、確率値は、サンプルが、仮説に関連する染色体又は染色体セグメントの特定の数のコピーを有する尤度を示す。
【0153】
様々な仮説の確率は、関連する遺伝子データを入力として使用して、様々な仮説の各々について、本開示の他の場所に記載される専門家技術、アルゴリズム、及び/又は方法のうちの1つ以上によって述べられるように、確率が等しい値を数学的に計算することによって決定することができる。
【0154】
複数の技術によって決定されるように、異なる仮説の確率が推定されると、それらを組み合わせることができる。これは、各仮説について、各技術によって決定される確率を乗算することを伴い得る。仮説の確率の積を正規化してもよい。1つの倍数性仮説は、染色体についての1つの可能な倍数性状態を指すことに留意されたい。
【0155】
「確率を組み合わせること」、又は「仮説を組み合わせること」とも呼ばれる、又は専門家の技術の結果を組み合わせることのプロセスは、線形代数の当業者によく知られているべき概念である。本発明の例示的な方法において、異数性の有無を決定するため、又は各々が確率を提供する染色体のコピー数を決定するために、2つの方法が利用される。特定の例示的な実施形態において、決定の信頼性は、各方法について選択される信頼性を組み合わせることによって増加される。例えば、定量的対立遺伝子解析を実行する第1の方法についての信頼性は、定量的非対立遺伝子解析を実行する第2の方法からの信頼性と組み合わせることができる。
【0156】
尤度が、尤度が第2の方法について決定される方法に対して直交するか、又は無関係の方法で第1の方法によって決定される場合では、尤度を組み合わせることは簡単であり、乗算及び正規化によって行うことができ、又は以下のような式を使用することによって行うことができる。
comb=R/[R+(1-R)(1-R)]
【0157】
式中、Rcombは、結合尤度であり、R及びRは、個々の尤度である。第1の方法と第2の方法が直交していない場合、すなわち、この2つの方法の間に相関関係がある場合にも、数学はより複雑になるかもしれないが、尤度を組み合わせることができる。
【0158】
いくつかの実施形態において、第1の確率及び第2の確率は、確率を組み合わせる工程の前に異なるように加重される。いくつかの実施形態において、第1の確率及び第2の確率は、2つの確率値を組み合わせる工程の目的のために、独立したイベントとみなされる。いくつかの実施形態において、第1の確率及び第2の確率は、2つの確率値を組み合わせる工程の目的のために、依存したイベントとみなされる。いくつかの実施形態において、本方法は、第3の確率値を取得することを更に含み、第3の確率値は、標的のゲノムが、特定の仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示し、第3の確率値は、非遺伝子臨床アッセイである情報に由来する。多くの非遺伝的臨床アッセイは、特定の染色体コピー数又は染色体セグメントコピー数との既知の確率的相関を有する。各仮説について、組み合わされた第1及び第2の確率値を第3の確率値と組み合わせて、標的細胞のゲノムが対象の染色体又は染色体セグメントのコピー数を有する尤度を示す組み合わされた確率値を与えてもよく、その数は、特定の仮説に関連付けられる。そのような非遺伝的臨床アッセイの例としては、頸部半透明性測定が挙げられる。いくつかの実施形態において、非遺伝的臨床アッセイは、ベータ-ヒト絨毛性ゴナドトロピン、妊娠関連血漿タンパク質A、エストリオール、インヒビン-A、及びアルファ-フェトタンパク質の測定からなる群から選択される。
【0159】
理論に限定されないが、以下の開示は、確率を組み合わせる方法を更に教える。確率を組み合わせる1つの可能な方法は、以下の通りである:遺伝子データのセットを与えられた仮説のセットを評価するために専門家の技術を使用する場合、方法の出力は、仮説のセット内の各仮説に1対1の方法で関連付けられる確率のセットである。各々がセット内の仮説のうちの1つに関連付けられている第1の専門家技術によって決定された確率のセットが、各々が同じ仮説のセットに関連付けられている第2の専門家技術によって決定された確率のセットと組み合わされると、確率の2つのセットが乗算される。これは、セット内の各仮説について、2つの専門家の方法によって決定されるように、その仮説に関連する2つの確率が一緒に乗算され、対応する積が出力確率であることを意味する。このプロセスは、任意の数の専門技術に拡張されてもよい。1つの専門技術のみが使用される場合、出力確率は、入力確率と同じである。2つ以上の専門技術が使用される場合、次いで、関連する確率は、同時に乗算されてもよい。積は、仮説のセットにおける仮説の確率が100%になるように正規化され得る。
【0160】
いくつかの実施形態において、所与の仮説についての組み合わされた確率が、他の仮説のいずれかについての組み合わされた確率よりも大きい場合、その仮説が最も可能性が高いと決定されると考えられ得る。いくつかの実施形態において、仮説は、最も可能性が高いと決定されてもよく、正規化された確率が閾値よりも大きい場合、倍数性状態、又は他の遺伝子状態がコールされてもよい。一実施形態において、これは、その仮説に関連する染色体の数及び同一性が、倍数性状態として呼ばれてもよいことを意味する。一実施形態において、これは、その仮説に関連する対立遺伝子の同一性が対立遺伝子状態と呼ばれることを意味する。いくつかの実施形態において、閾値は、約50%~約80%である。いくつかの実施形態において、閾値は、約80%~約90%である。いくつかの実施形態において、この閾値は、約90%~約95%である。いくつかの実施形態において、この閾値は、約95%~約99%である。いくつかの実施形態において、この閾値は、約99%~約99.9%である。いくつかの実施形態において、閾値は、99.9%を超える。他の実施形態において、一組のルールは、組み合わされた確率閾値が設定されているが、異なるシナリオが考慮され得、確率閾値の結果を上書きし得るか、又は組み合わされた確率のコール能力を強化するために使用され得るサンプルの最終リスクコールに使用される。例えば、所与の倍数性仮説の確率に大きな差がある場合、例えば、方法のうちの1つにエラーがあったかどうかを決定するために、更なる分析を行うことができる。
【0161】
本発明のいくつかの実施形態は、より大きな患者セットから患者の部分集合を生成する工程を採用している。患者の元のセットは、分析のための標的細胞及び非標的細胞の供給源として使用される。本発明のいくつかの実施形態において、患者から得られたDNAサンプルは、DNAシーケンサ上で配列決定されるために、標準的な分子生物学的技術を使用して修飾される。いくつかの実施形態において、この技術は、DNA配列決定手順のためのプライミング部位を含有する遺伝子ライブラリを形成することを伴う。いくつかの実施形態において、複数の遺伝子座が、部位特異的増幅のために標的化されてもよい。いくつかの実施形態において、標的遺伝子座は、多型遺伝子座、例えば、一塩基多型である。遺伝子ライブラリの形成を意味する実施形態において、ライブラリは、患者に特異的なDNA配列、例えば、バーコード化を使用してコードすることができ、それによって、高スループットDNAシーケンサの単一のフローセル(又はフローセル当量)において複数の患者を分析することを可能にする。サンプルはDNAシーケンサフローセル内で一緒に混合されるが、バーコードの配列の決定は、配列決定されたDNAに寄与した患者源の同定を可能にする。
【0162】
当業者であれば、標的DNAが特定の遺伝子座に対して濃縮されていない本発明のこれらの実施形態において、ゲノム全体が配列決定され得るが、配列の完全なゲノムへの組み立ては、本発明の方法の使用のために必要とされないことを理解するであろう。特定の遺伝子座に関する情報は、全てのゲノム配列決定から容易に決定され得る。
【0163】
本開示の一実施形態において、信頼度は、胎児の倍数性状態の決定の精度に基づいて計算されてもよい。一実施形態において、最大尤度(Hmajor)の仮説の信頼度は、(1-Hmajor/Σ(全てH))として計算されてもよい。仮説の全ての分布が既知である場合、仮説の信頼度を決定することが可能である。親遺伝子型情報が既知であれば、全ての仮説の分布を決定することが可能である。正倍数体胎児についてのデータの予測分布の知識及び異数体胎児についてのデータの予測分布が既知である場合、倍数体決定の信頼度を計算することが可能である。親の遺伝子型データが既知である場合、これらの予測分布を計算することが可能である。一実施形態において、正規の仮説の周り及び異常な仮説の周りの検査統計の分布の知識を使用して、コールの信頼性の両方を決定し、より信頼性の高いコールを行うために閾値を改良し得る。これは、混合物中の胎児DNAの量及び/又はパーセントが低い場合に特に有用である。Z統計量などの検査統計量が、胎児DNAの割合が高い場合に最適化された閾値に基づいて作成された閾値を超えないため、実際に異数体である胎児が正倍数体であることが判明する状況を回避するのに役立つ。
【0164】
対立遺伝子及び非対立遺伝子データを組み合わせることによって、目的の染色体又は染色体セグメントのコピー数を決定するための方法
本発明の他の実施形態は、胎児細胞又は腫瘍細胞などの標的細胞のゲノムにおける目的の染色体又は染色体セグメントのコピー数を決定する方法を含む。遺伝子データ、例えば、DNA配列データは、1つ以上の標的細胞に由来するDNA及び1つ以上の非標的細胞に由来するDNAを含むDNAの混合物から得ることができる。この方法は、単一の患者又は患者のセットを用いることができる。遺伝子データは、患者から得られる。遺伝子情報は、複数の遺伝子座で取得される。少なくともいくつかの遺伝子座、及び全ての遺伝子座が多型である可能性がある。標的細胞及び非標的細胞の両方において同じ遺伝子座を分析する。各遺伝子座についていくつかの配列リードが得られる。所与の遺伝子座における各対立遺伝子での配列リード数を定量する。得られた定量データは、標的細胞由来の遺伝子座と非標的細胞ゲノムとの組み合わせから得ることができる。次いで、収集されたデータを、複数のコピー数仮説、すなわち、目的の染色体又は染色体セグメントのコピー数に対して検定される。第1の確率値は、各仮説、すなわち、測定された遺伝子データを考慮して、その仮説が真又は偽のいずれかである確率について計算される。したがって、標的細胞のゲノムが、仮説によって指定された目的の染色体又は染色体セグメントのコピー数を有する尤度が決定される。この第1の確率値は、対立遺伝子データを使用して得られる。第2の確率値は、各仮説、すなわち、測定された遺伝子データを考慮して、その仮説が真又は偽のいずれかである確率について計算される。したがって、標的細胞のゲノムが、仮説によって指定された目的の染色体又は染色体セグメントのコピー数を有する尤度が決定される。この第2の確率値は、非対立遺伝子データを使用して得られる。各仮説について、第1の確率値及び第2の確率値を、例えば、増殖によって組み合わせて、標的細胞のゲノムが、仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示す複合確率を与えることができる。標的細胞のゲノム中の目的の染色体又は染色体セグメントのコピー数は、最大の結合確率を有する仮説に関連する染色体又は染色体セグメントのコピー数を選択することによって決定することができ、目的のサンプル中の染色体又は染色体セグメントのコピー数の決定を行うために使用される。遺伝子データが妊婦の血液から得られた無細胞DNAから得られるいくつかの実施形態において、仮説は、母親が複数の胎児、例えば双子を身ごもっている状態を含むことができる。
【0165】
したがって、いくつかの実施形態において、遺伝子データは、患者のセットの各メンバーからの遺伝子座のセットで遺伝子データを与えるために、1つ以上の標的細胞に由来し、1つ以上の非標的細胞に由来するDNAを含む混合物を同時に配列決定することによって得られる。いくつかの実施形態において、標的細胞は胎児細胞であり、非標的細胞は胎児の母親由来である。すなわち、非侵襲性出生前診断を対象とするいくつかの実施形態において、標的細胞は胎児細胞であってもよく、非標的細胞は母細胞であってもよい。本発明のいくつかの実施形態において、患者のサブセットを選択するために使用され得る仮説の例は、特定の染色体又は染色体セグメントが二倍体、すなわち、2コピーで存在するという仮説であり得る。分析のための染色体の例としては、そのセグメントを含む染色体13、18、21、X及びYが挙げられる。いくつかの実施形態において、コピー数について分析される染色体セグメントは、染色体22q11.2、染色体1p36、染色体15q11-q13、染色体4p16.3、染色体5p15.2、染色体17p13.3、染色体22q13.3、染色体2q37、染色体3q29、染色体9q34、染色体17q21.31、及び染色体の末端からなる群から選択される。
【0166】
いくつかの実施形態において、遺伝子座のセットは、染色体の選択された領域に存在する。いくつかの実施形態において、本方法は、異なる染色体又は染色体セグメントについて独立して行われる。患者のセット内の患者数に課される唯一の上限は、選択された特定のDNA配列決定技術(その配列決定技術と互換性のある患者多重化技術、例えば、バーコード化技術を含む)のDNA配列生成能力によって課される。例示的な実施形態において、患者セット内に少なくとも10人の患者が存在する。いくつかの実施形態において、少なくとも24人の患者が存在し、他の実施形態において患者セットは、少なくとも48人の患者が存在し、他の実施形態において、患者セットは、患者セット内の少なくとも96人の患者である。
【0167】
対立遺伝子及び非対立遺伝子データの組み合わせを使用して試験される仮説を用いて、染色体又は染色体セグメントのコピー数を決定する方法
実施形態は、遺伝子データが、標的細胞に由来するDNA及び非標的細胞に由来するDNAから得られる、標的細胞のゲノム中の目的の染色体又は染色体セグメントのコピー数を決定する方法を含み、遺伝子データは、(i)複数の多型遺伝子座からの定量的対立遺伝子データ、及び(ii)複数の多型及び/又は非多型遺伝子座からの定量的非対立遺伝子データを含む。本方法は、各仮説が、標的細胞のゲノム中の染色体又は染色体セグメントの特定のコピー数に関連付けられている複数の仮説を作成する工程を含む。確率値は、仮説ごとに計算され、確率値は、標的細胞のゲノムが、仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示し、第1の確率値は、対立遺伝子データ及び少なくとも1つの第1の遺伝子座から得られる非対立遺伝子データから導出される。例えば、仮説は、対立遺伝子データ及び非対立遺伝子データの両方を組み込むモデルを使用して検証され得、それによって確率値を得る。各計算された確率値を組み合わせて、標的細胞のゲノムが、仮説に関連する染色体又は染色体セグメントのコピー数を有する尤度を示す複合確率を与えることができる。標的細胞のゲノム中の目的の染色体又は染色体セグメントのコピー数は、最大確率を有する仮説に関連する染色体又は染色体セグメントのコピー数を選択することによって決定される。遺伝子データが妊婦の血液から得られた無細胞DNAから得られるいくつかの実施形態において、仮説は、母親が複数の胎児、例えば双子を身ごもっている状態を含むことができる。
【0168】
いくつかの実施形態において、各仮説についての確率値は、単一の遺伝子座から得られる対立遺伝子及び非対立遺伝子データから得られる。いくつかの実施形態において、対立遺伝子データは、各仮説に関連する可能性のある対立遺伝子比の分布に基づいてモデル上で試験される。いくつかの実施形態において、各仮説についての確率値は、少なくとも1000の多型遺伝子座からの遺伝子データについて別個に決定される。いくつかの実施形態において、各仮説の確率値を計算する工程は、(1)非標的細胞由来のDNAを含む得られた遺伝子データに基づいて、各仮説についての標的細胞由来のDNAからの予測される遺伝子データをモデリングする工程と、(2)各仮説について、標的細胞由来のDNAからのモデル化された遺伝子データと、標的細胞由来のDNAから得られた遺伝子データとを比較する工程と、(3)標的細胞由来のDNAからのモデル化された遺伝子データと、標的細胞由来のDNAから得られた遺伝子データとの差に基づいて、各仮説についての確率値を計算する工程とを含む。いくつかの実施形態において、非標的細胞は、標的細胞が由来する個体の親由来であり、予測される遺伝子データのモデリングは、本明細書に開示されるように、メンデル遺伝の規則を使用して標的細胞の予測される遺伝子データを決定し、標的細胞の予測される遺伝子データを調整して、システム内のバイアスを修正することを更に含む。このようなシステムバイアスの例としては、増幅バイアス、配列決定バイアス、処理バイアス、濃縮バイアス、及びそれらの組み合わせが挙げられる。そのようなバイアスの性質は、特定の実施形態の実施のために選択された特異的増幅技術、配列決定技術、処理、濃縮技術などに従って変化し得る。いくつかの実施形態において、標的細胞は、胎児由来であり、予測される遺伝子データは、胎児の親からの遺伝子データ及び胎児からの遺伝子データを含む。いくつかの実施形態において、遺伝子データのモデリングは、各遺伝子座について、その遺伝子座における対立遺伝子測定値の予測分布を予測し、各遺伝子座について、その遺伝子座におけるDNAの予測相対量(リード深度)を予測する工程を含む。いくつかの実施形態において、対立遺伝子測定値の予測分布の予測は、ゲノム上の異なる遺伝子座間の連鎖及び乗換えを考慮に入れることができる。いくつかの実施形態において、予測分布は、二項分布である。
【0169】
定量的非対立遺伝子最大尤度法(「QMM」)の例
標的個体における目的の染色体のコピー数を決定するために使用され得る定量的方法の例を、本明細書に提供する。この実施例は、標的染色体(すなわち、目的の染色体)と同じであるが、同様又は同一の方法で処理された他のサンプルで見出される参照染色体を使用した標的染色体データの正規化を伴うことに留意されたい。本方法は、非侵襲性出生前異数性検査の文脈で記載され、標的個体は胎児であり、配列決定されるDNAは、胎児DNA、及び場合によっては、例えば、母体血漿中に見出される母体DNAを含む。非侵襲性出生前異数性検査は、母体血漿中の遊離浮遊胎児DNAに基づいて、胎児の染色体コピー数を決定しようとする。定量的方法において、染色体コピー数分類は、各染色体にマッピングする配列リード数に基づく。血漿中の胎児画分を推定することを除いて、親遺伝子型又は対立遺伝子情報のいずれも使用されない。この標的化配列決定アプローチにおいて、各標的SNP(一塩基多型)における配列リード数は、スライドウィンドウ平均リード深度、又は同様の平均アプローチを使用する傾向がある非標的化配列決定アプローチとは対照的に、有益である。推定される胎児画分に基づいて、最大尤度推定は、モノソミー、ダイソミー、及びトリソミーを含むコピー数仮説のセットに基づいて計算される。この例では、染色体のセグメンタルエラーは考慮されず、同じ染色体上の全ての位置が同じコピー数を有すると仮定される。当業者には、この方法を染色体セグメントコピー数バリアントに適用する方法が明らかであるべきである。また、胎児又は母親のゲノムの非均一なフラグメント化を組み込んでもよく、これは、本明細書では行われない。
【0170】
個々のSNPのモデリング:この方法の基本的な仮定は、ゲノム位置で生成される配列リードの数は、主に、配列決定プロセスに入るその位置のゲノムコピーの数に依存することである。標的化配列決定アプローチは、多重化PCRに基づいており、これは、配列決定に入るゲノムコピーの数が、元のサンプル中の染色体コピー数と、PCR増幅プロセスの詳細の両方によって決定されることを意味する。したがって、この方法は、多重PCR及び高スループット配列決定の両方の簡略化されたモデルを必要とする。
【0171】
元のサンプルでは、染色体コピー数の変動によるものを除いて、ゲノムコピーの量が全ての位置で同じであると仮定することができる。しかしながら、PCRプロセスにおいて、各標的位置は、異なる効率で増幅される。KのPCRサイクルの各々について、位置iは、因子aによって増幅される。その位置での観察されたリードの数は、xである。このモデルは、式1のように記述することができ、サンプル因子cは、サンプルごとに一定であり、サンプルパラメータ、例えば、DNAの初期量及び配列リードの総数を表す。サンプル特異的増幅因子と考えることができる。染色体コピー数nは、位置iが位置する染色体の倍数性状態又はコピー数である。
【数1】
【0172】
しかしながら、実験条件のわずかな変動は、様々なPCR標的の増幅効率が完全に一定ではないことを意味する。これは、各標的の増幅効率について、乗算ノイズ項εによって表される。したがって、モデルは、式2に拡張される。
=c(a (2)
【0173】
モデルの乗法的な性質上、ログ空間で作業し、次にlogxの予測及び分散を考慮することが有利である。ログノイズの期待値がゼロであると仮定することができる。これは、ゼロ平均ノイズを想定した場合とはまったく同じではないが、式3に示すように、数学を実行可能にする。
E log x=log n+k log a
V log x=k V log ∈ (3)
【0174】
サンプル正規化は、2に等しいコピー数を有することが知られている、仮定されている、又は仮定されている染色体上に位置する位置から測定されたリードを考慮することによって達成することができる。他の参照染色体、例えば染色体1及び2を使用するなどの他のサンプル正規化方法が存在し、これらは、ダイソミックであることが知られている。Dは、ダイソミックであると仮定される染色体上に位置する位置iの集合であるとする。サンプルノーマライザTは、式4に詳述される、Dにおける位置iにわたる平均対数カウントとして定義される。これは、各サンプルから直接測定することができるため、更なる計算のために既知の量とみなされる。
=E log x
=log c+log 2+k E log a (4)
【0175】
トレーニングデータからモデルを構築する:個々のSNPの効率のためのモデルは、既知の染色体コピー数及び胎児画分を有するトレーニングデータの集合から構築することができる。理想的なケースでは、妊娠していない(正倍数体)女性から血漿を採取するため、胎児画分はゼロであり、異数体は存在しない。この場合、全てのサンプルは、全ての標的のモデルのデータに寄与する。より困難なケースでは、既知の染色体コピー数を有する妊娠血漿を使用し、異数体サンプルをデータセットから除外する。したがって、モデルは依然として、全ての染色体がダイソミーと比較して同じコピー数を有するデータから構築される。
【0176】
を、位置iにおける対数空間正規化されたリード深度とする。1つは、y(5)のサンプルの集合にわたる平均としてβを定義し得る。用語βは、その増幅効率がダイソミー上の位置の平均増幅効率とどのように比較されるかを測定する位置iの対数空間増幅モデルである。
=log x-T
=k log a+k log ∈-k E log a
β=E
=k log a-k E log a (5)
【0177】
同様に、σは、yのサンプルにわたる標準偏差として定義される。βの集合とσの集合とを組み合わせて、SNPの集合iについての増幅モデル及び分散モデルを形成する。
【0178】
モデルの計算にはいくつかの微妙な点がある。最も重要なのは、モデルは、固定されたプロトコルに供される固定された集合の標的について一定のままではないことに留意することである。
【0179】
モデルは非常に類似しているが、複数の配列決定実行にわたって固定モデルを使用しようとする試みは、低い胎児画分で結果をもたらすのに十分な大きさのバイアスに苦しみ、別々の実験のために別々に訓練することによって排除されてもよい。その結果、いくつかの実施形態において、各配列決定実行がモデリングのために十分な数のサンプルを含むことを確実にすることが重要である。
【0180】
実験内でさえ、典型的には、モデルに適合しないいくつかのサンプルが存在する。これらは、多くの場合、常に、後のセクションでより詳細に議論される遺伝子座ドロップアウトによって説明されるわけではない。異常値サンプルは、汚染レベル、スパイク比(DNA開始量の尺度)、胎児画分、又は全体的なリード深度などの品質管理メトリックによって十分に予測されない。サンプルは、増幅モデル及びノイズモデルに関して各SNP上の残差zを計算することによって適合性について試験される。
=(log x-T-β)/σ (6)
【0181】
更にlog
【数2】
は、ゼロ平均ではなくガウスであるという仮定の下では、zは標準正規分布に従って分布する必要がある。ダイソミー染色体残差Z={z:i∈D}の集合は、モデル適合のおおよそのメトリックとして分析される。胎児画分又は染色体コピー数にかかわらず、Zは標準的な正常値に従って分布する必要がある。コルモゴロフスミルノフ(KS)検定を使用して、残差の適合性を測定する。モデリングプロセスは、反復的な方法で実装され、各反復は、モデルの再計算を含み、その後、各サンプルのモデル適合のためのKS検査が続く。外れ値サンプルは、メンバーシップが定数セットに収束するまで、各反復でトレーニングセットから削除される。
【0182】
検定統計量の形成及びSNP相関のモデリング:染色体コピー数分類の検査統計は、染色体上の全ての位置で正規化された測定値を平均化することによって形成することができる。検定統計量の分散を最小限に抑えるために、分散加重平均が選択される。上記で定義された正規化された測定値yと考慮されたい。未知のコピー数nを有する染色体上の位置について、yは、式7に記載される性質を有する。
【数3】
【0183】
Sを現在の染色体上の位置の集合とする。染色体検定統計量tは、SにおけるSNP iにわたって平均された、yの分散加重平均として定義される。
【数4】
【0184】
tの予測値は、最大尤度推定値のガウスモデルを形成するために、各染色体コピー数仮説の下で計算される。各仮説についてのモデルの分散は、測定値間の相関を考慮していない以前に行われた仮定から一意に従うものではない。t上で観察された分散が、そのモデルが示唆するよりもはるかに高かったため、無相関測定の最も単純な仮定は破棄された。相関についての任意の物理的説明を示唆することなく、yとyとの共分散がρσσであり、同じ染色体上の全ての位置iとjとの間の一定の相関係数に対応する単一パラメータ相関モデルが提案される。このモデルは、単一のパラメータを使用して、無相関モデルによって暗示されるものを超えた追加の分散を表す。定数相関モデルを使用するtの分散は、既知の相関を有する正規分布の合計の分散のための式から直接続く式9に示される。(ガウスノイズの仮定は、全体を通して継続される。)
【数5】
【0185】
各染色体についてのρの最大尤度推定は、{β}及び{σ}の推定に続く同じモデリングデータから計算される。
【0186】
染色体コピー数分類は、上記のセクションで開発されたモデリングを利用した以下の工程で構成される。
【0187】
1.モデルの適合を確認する。ダイソミー染色体(1及び2)を使用して、提供されたモデルに関して残差のセットを計算し、KS検定を使用して、それらを標準正規分布と比較する。得られたp値が低すぎる場合、サンプルはモデルに適合しないとみなされ、分類することができない。
【0188】
2.コピー数仮説の生成。供給された胎児画分を使用して、血漿コピー数は、各胎児コピー数仮説に対応して計算される。胎児コピー数仮説{h,h,h}={1,2,3}について、血漿コピー数仮説は、式10による胎児画分を使用して計算される。血漿コピー数は、仮説に依存する胎児コピー数と、2である母体コピー数との混合物である。
=fh+2(1-f)(10)
【0189】
3.仮説モデリング。検定統計量の予測値は、倍数性仮説に対応するnの値について計算される。これは、式7及び検定統計量の定義に従って行われる。検定統計量の分散モデルは、仮説に依存しない。
【0190】
4.尤度を計算する。検定統計量の値は、現在の染色体について観察される。各仮説のデータ尤度は、対応する正規分布の各々の下での検定統計量の尤度である。次いで、最大尤度推定値を報告するか、又は事前分布を使用して正規化することができる。
【0191】
非標的参照染色体を含まないコピー数分類(「QMM」法とも呼ばれる)
上述したように、標的染色体又は染色体セグメントとは異なる参照染色体又は染色体セグメントを用いることなく、染色体又は染色体セグメントのいずれも既知のコピー数を有しないと想定することが可能である。これは、染色体番号仮説に条件付けられる、サンプル正規化T及び線形シフトパラメータαを推定する代替の方法を必要とする。個々の染色体ごとにコピー数仮説を使用するアプローチとは異なり、この仮説空間は、全ての訓練染色体の結合仮説を含む。
【0192】
一実施形態において、結合仮説を個々の仮説に結び付けるために、以下の技術が使用されてもよい。訓練染色体k∈{13,18,21}について、p(D|h)、h∈{1,2,3}を、その染色体の個々のコピー数仮説に条件付けられたデータのpdfとする。したがって、例えば、染色体13の場合、以下のようになる:
【数6】
【0193】
仮説確率、すなわち、P(h=1)=P(h=2)=P(h=3)=1/3について等しい事前を仮定すると、上記のpdfが計算される。P(D13|h18、h21、h13)を計算するために、仮説(h18,h21,h13)に対応するT及びα推定値を使用し、分散加重平均検定統計量が計算される。同様に、他の訓練染色体、p(D|h18)、p(D|h21)のそれぞれのpdfが計算される。等しい事前確率が仮定されるので、事後確率も計算される。
【数7】
【0194】
これは、訓練染色体の各々について信頼性を提供する正規化工程を表す。
【0195】
次に、残りの染色体の信頼度が計算される。このために、訓練染色体の結合仮説の推定値が得られる。
【数8】
【0196】
次いで、この仮説に対応するT及びαの推定値を使用して、各検査染色体についての分散加重平均検査統計量を計算することができる。
【数9】
【0197】
この方法では、一定の相関係数モデルを使用して、特定の染色体のSNP間相関をモデル化することができる。例えば、特定の染色体kについて、y及びyの共分散は、上述したように、ρσσである。染色体KがN遺伝子座を有する場合、共分散行列は、以下によって与えられる:
【数10】
【0198】
これは、主対角線
【数11】
を有する行列を表し、非対角線要素は、ρσσである。これは、T及びαの各々についての最大尤度推定値を決定するためにも使用することができる。
【0199】
定量的対立遺伝子最大尤度法(「HET率」)の例
対立遺伝子最大尤度法を用いて倍数性状態を決定するための方法が本明細書で提供される。この方法は、NIPTの文脈で例示されるが、当業者は、それが循環遊離腫瘍細胞の検出に利用され得ることを理解するであろう。以下の説明に加えて、HET率法を実装する方法の詳細な例は、とりわけ、公開された米国特許出願第2012/0270212Al号及び公開された米国特許出願第2011/0288780Al号に見出すことができ、これらの全ては参照によりそれらの全体が本明細書に組み込まれる。しかしながら、これらのソースに開示されているHET率法は、別々の参照染色体からのデータを利用する。
【0200】
NIPTの例では、母体血液から単離された遊離浮遊DNA上で測定された配列データを与えられた胎児の倍数性状態であり、遊離浮遊DNAは、母体起源のいくつかのDNA、及び胎児/胎盤起源のいくつかのDNAを含む。この例では、胎児の倍数性状態は、対立遺伝子最大尤度法及び分析された混合物中の胎児DNAの計算された画分を使用して決定される。また、混合物中の胎児DNAの画分又は胎児DNAのパーセンテージを測定することができる実施形態についても説明する。いくつかの実施形態において、画分は、胎児DNAと母体DNAとの混合物である母体血液サンプル自体に対して行われた遺伝子型決定測定値のみを使用して計算することができる。いくつかの実施形態において、画分は、また、母親の測定された又は他の方法で既知の遺伝子型及び/又は父親の測定された又は他の方法で既知の遺伝子型を使用して計算されてもよい。
【0201】
特定の染色体については、N個のSNPが存在すると仮定し、その場合:
ILLUMINAデータからの親遺伝子型は、正しいと仮定される:母m=(m,...,m)、父=(f,...,f)、式中、m、f∈(AA,AB,BB)。
【0202】
NR配列測定値のセットS=(s,...,snr)。
【0203】
データから最も可能性の高いコピー数を導き出す
考慮される各コピー数仮説Hについて、染色体全体のデータlog尤度LIK(H)を導出し、LIK、すなわち、以下を最大化する最良の仮説を選択する、
【数12】
式中、P(H)は、先行知識又は推定からの、仮説の先行確率である。
【0204】
考慮されるコピー数仮説は、以下の通りである:
モノソミー:
●母系H10(母親から1コピー)
●父系H01(父親からの1コピー)
ダイソミー:H11(母親及び父親各々1コピー)
単純なトリソミー、乗換え考慮なし:
●母系:H21_MATCHED(母親からの2つの同一のコピー、父親からの1つのコピー)、H21_UNMATCHED(母親からの両方のコピー、父親からの1つのコピー)
●父系:H12_MATCHED(母親からの1つのコピー、父親からの2つのコピー)、H12_UNMATCHED(母親からの1つのコピー、父親からの両方のコピー)
乗換えを可能にする複合トリソミー(結合分布モデルを使用):
●母系H21(母親から2つのコピー、父親から1つのコピー)、
●父系のH12(母親から1つのコピー、父親から2つのコピー)
【0205】
乗換えがない場合、起点が有糸分裂、減数分裂I、又は減数分裂IIのいずれであるかにかかわらず、各トリソミーは、マッチするトリソミー又はマッチしないトリソミーのうちの1つになるであろう。乗換えのため、真のトリソミーは2つの組み合わせである。まず、単純な仮説のための仮説尤度を導出する方法が記載されている。次いで、個々のSNP尤度を乗換えと組み合わせて、複合仮説の仮説尤度を導出する方法が記載される。当初、真の子画分及びベータノイズパラメータ(N)及び可能なエラー率などの他のパラメータが既知であると仮定される。データから子画分cfを導出する方法もまた、以下で説明される。
【0206】
単純仮説のLIK(D|H)
単純な仮説H、LIK(D|H)について、染色体全体で仮説Hが与えられたデータの対数尤度は、個々のSNPのlog尤度の合計として計算される。すなわち、以下の通りである:
【数13】
【0207】
この仮説は、SNP間の連鎖を想定しておらず、したがって、結合分布モデルを利用していない。
【0208】
SNP当たりのlog尤度
特定のSNPi上で、m=真の母系遺伝子型、f=真の父系遺伝子型、及びcf=既知又は導出された子画分を定義する。X=P(A|i,S)を、配列測定値Sを考慮して、SNPi上にAを有する確率とする。子仮説Hを仮定すると、SNPi上で観測されたデータDの対数尤度は、以下として定義される
P(D│m,f,c,H,cf,i)=P(SM|m,i)P(M│m,i)P(SF|f,i)P(F│f,i)P(S│m,c,H,cf,i)、
これにより、以下の結果になる:
LIK(i,H)=loglik(x│m,f,H,cf)=Σp(c│m,f,H)*loglik(x|m,c,cf),

式中、p(c│m,f,H)は、親m,fが与えられ、仮説Hが仮定される場合に、真の子の遺伝子型=cを得る確率であり、これは容易に計算することができる。例えば、H11、H21マッチ及びH21マッチしないについて、p(c|m,f,H)を以下に示す。
【表1】
【0209】
P(D|m,f,c,H,i,cf)は、真の母系遺伝子型m、真の父系遺伝子型f、真の子の遺伝子型c、仮説H、及び子画分cfが与えられた、SNPiに関する所与のデータDの確率である。次のように、母親、父親、及び子供のデータの確率に分けることができる:
P(D│m,f,c,H,cf,i)=P(SM|m,i)P(M│m,i)P(SF|f,i)P(F│f,i)P(S│m,c,H,cf,i)。
【0210】
lik(xi|m,c,cf)は、仮説Hが真である場合にxが従うべきである分布のpdfx(x)として定義される真の母m、真の子cを仮定して、SNPi上で導出確率xを得る尤度である。具体的には、LIK(x|m,c,cf)=pdfx(x)。
【0211】
S内のNR配列のDiがSNPiまで並ぶ単純な場合において、X~(1/D)Bin(p,D)、式中、p=p(A|m,c,cf)=Aを得る確率は、この母子混合物について、以下のように計算される。
【数14】
式中、#A(g)=遺伝子型gにおけるAの数、n=2は母のソミー(somy)であり、nは子のソミーである(モノソミーの場合は1、ダイソミーの場合は2、トリソミーの場合は3)。最初のcfは、例えば、対立遺伝子比率プロットを使用して決定されてもよい。
【0212】
cfcorrectは、混合物中の子の補正された画分である:
【数15】
【0213】
子供がダイソミーcfcorrect=cfである場合、しかしながら、この染色体の混合物中の子供のトリソミー画分は、実際には少し高い:
【数16】
【0214】
正確な位置合わせが存在しないより複雑な場合において、Xは、SNP当たりの可能なD個の読み取りにわたって積分された二項関数の組み合わせである。
【0215】
結合分布モデルを使用する:複合仮説に対するLIK(H)
トリソミーは、通常、乗換えのために純粋にマッチし、マッチしないわけではないため、このセクションでは、複合仮説H21(母系トリソミー)及びH12(父系トリソミー)の結果が導出され、マッチするトリソミー及びマッチしないトリソミーを組み合わせて、乗換えの可能性を説明する。
【0216】
トリソミーの場合、乗換えがなかった場合、トリソミーは、単純にマッチするか、又はマッチしないトリソミーとなる。マッチするトリソミーは、子が一方の親から同一の染色体セグメントの2つのコピーを継承する場合である。マッチしないトリソミーは、子が親から各相同染色体セグメントの1つのコピーを継承する場合である。乗換えのために、染色体のいくつかのセグメントは、マッチするトリソミーを有し得、他の部分は、マッチしないトリソミーを有し得る。このセクションでは、対立遺伝子のセットのヘテロ接合率の結合分布モデルを構築する方法について説明する。
【0217】
SNPi上で、LIK(i,Hm)がマッチする仮説Hの適合性であり、LIK(i,Hu)がマッチしない仮説Hの適合性であり、pc(i)=SNPi-1,i間の乗換えの確率であると仮定する。次いで、以下のように全尤度を計算することができる:
LIK(H)=ΣS、ELIK(S、E、1:N)
式中、LIK(S、E、1:N)は、SNP1:Nについて、仮説Sで始まり、仮説Eで終わる尤度である。S=最初のSNPの仮説、E=最後のSNP、S、E∈(Hm,Hu)の仮説。再帰的には、以下を計算することができる:
【数17】
式中、~Eは、他の仮説である(Eではない)。具体的には、1:iのSNPの尤度に基づいて、1:(i-1)のSNPの尤度を計算することができ、同一の仮説を持ち、乗換え又は反対の仮説を持たず、乗換えにSNPiの尤度を掛ける。
【0218】
次いで、
【数18】
について、次のように計算する:
LIk(S,E,1:2)=LIK(2,E)+log(exp(LIK(S,E,1))*(1-pc(2))+exp(LIK(S,~E,1))*pc(2))
i=Nまで続く。
【0219】
子画分の導出
上記の数式は、既知の子画分を想定しているが、必ずしもそうではない。一実施形態において、選択された染色体上のダイソミーの尤度を最大化することによって、最も尤度の高い子画分を見つけることが可能である。
【0220】
具体的には、ダイソミー仮説について、及び染色体chrの子画分について、上記のようなLIK(chr,H11,cf)=対数尤度を仮定する。Cset内の選択された染色体について(通常1:16)。その場合、完全な尤度は次の通りである:
●Lik(cf)=Σchr∈CsetLIk(chr,H11,cf)、及び
【数19】
【0221】
染色体の任意のセットを使用することが可能である。次のように、父系データなしで子画分を導出することも可能である。
【0222】
父系のデータなしでコピー数を導出する
SNPi上の単純仮説対数尤度の式を思い出されたい。
【数20】
【0223】
親p(c│m,f,H)を与えられた真の子の確率を決定するには、父系遺伝子型の知識が必要である。父系遺伝子型が不明であるが、このSNP上のA対立遺伝子の集団頻度であるpAiが既知である場合、上記の尤度を以下で近似することが可能である
LIK(i,H)=loglik(x│m,f,H,cf)=Σp(c│m,H)*loglik(x│m,c,H,cf)
式中、
【数21】
式中、p(f│pA)は、SNPi上のAの頻度を考慮した、特定の父系遺伝子型の確率である。
【0224】
具体的には、
p(AA│pA)=(pA、p(AB│pA)=2(pA)*(1-pA)、p(BB│pA)=(1-pA
【0225】
対照染色体又は染色体セグメントを使用しない訓練方法
3つのデータセグメントD、D、Dを有すると仮定する。P(H)がセグメントD上の現在の優先度であると仮定する。Pが、分布P(p)を有するパラメータ(例えば、子画分cf又はノイズパラメータnp)であると仮定する。次いで、特定の仮説H(事前のP(H)を伴う)が真である確率は、次の通りである:
【数22】
これにより、以下の結果になる:
【数23】
又は、おおよそ、
【数24】
ここで、用語P(D|H,p)は、以下として書き換えることができる
【数25】
【0226】
したがって、
【数26】
式中、用語P(p|D,D)は、セグメントD及びD上の「訓練」から得られるパラメータ分布である。P(p|D)/P(p)は、セグメント1についての実際の仮説が何であるかに依存し、不明である場合、削除されてもよい。近似はいくつかの情報を失うが、各ピースは確率スケール上にあり、グリッドポイント確率によってスケーリングされたグリッドポイントごとのコールに適合するため、より安定して直感的になる可能性がある。
【0227】
検査は、目的の染色体(複数可)又は染色体セグメント(複数可)のみで実行できるため、対照染色体又は染色体セグメントを必要としない場合、有意な処理上の利点を得ることができる。一実施形態において、目的の染色体又は染色体セグメント自体が、次いで、所与の仮説の正確さを評価するために使用することができるベースラインを提供する。例えば、以下の式を使用して
【数27】
上記の確率方程式は、以下のように書くこともできる:
【数28】
【0228】
この式では、確率P(H|D,p)は、グリッドポイントごとに得られ、次いで、P(p,D,D,D)が与えられた最良のパラメータ分布推定によってスケーリングされる。グリッドポイントが固定されると、P(H|D,p)は変化しない。しかしながら、P(p,D,D,D)について固定仮説が存在しない場合(すなわち、対照染色体又は染色体セグメントが使用されない場合)、P(H|D,D,D)についての最終的な回答は、各セグメント仮説に先行して置かれるものに応じて大きく変化し得る。
【0229】
言い換えれば、全てのデータが与えられたパラメータ分布は、セグメントごとのパラメータ分布の複合であるため、
【数29】
式中、P(G)は、パラメータ推定の目的のためにこのセグメント上で事前に使用される仮説である。
【0230】
対照の欠如を説明するために、仮説Hについての均一な仮説事前fprior(H)が得られる。例えば、これは、上述した対立遺伝子比プロットを用いて子画分を推定することによって得られてもよい。次いで、各グリッドポイントpについて、仮説の確率を計算する(「グリッドごとのコール」)。
P(H│D,p)~P(D│H,p)P(H)
式中、P(H)は、セグメントコールに先行して使用される仮説である。一実施形態において、これは、グリッド空間全体のコールのアイデアを提供するために一度だけ行われる。
【0231】
最初のパスについて、fprior(H)は、P(H)であるように設定される。次いで、各セグメントのパラメータ分布は、以下を使用して得られる:
【数30】
【0232】
次いで、複合パラメータ分布が得られる:
【数31】
【0233】
次いで、各仮説の(事後の)確率は、グリッドコールごとのパラメータスケーリングを組み合わせることによって得られる:
【数32】
【0234】
これは、セグメントごとの仮説の分布の新しい推定値を提供する。Fprior(H)は、新たに導出されたP(H│D,D,D)で更新することができ、プロセス(各グリッドポイントpについての仮説の確率を計算することから始まる)は、収束するまで繰り返される。
【0235】
収束に達すると、全体的な尤度はもはやかなりの程度まで変化しない。一実施形態において、これは、最適化されるべき関数が、最良の導出された後方P(H)及びP(p)分布によって最大化されるデータP(H│D,D,D)の尤度である、アニーリング問題として扱われ得る。すなわち、最大化する関数は以下の通りである:
L(D)=P(D,D,D)~ΣΣP(D│H,p)P(H)P(p)。
【0236】
次いで、最終確率(すなわち、コール)、子画分、及びノイズパラメータを有する仮説を出力することができる。
【0237】
本開示のある特定の実施形態において、異数性を決定するための本発明の方法は、DNAのサンプル中の遺伝子座の同じセットを含む2つ以上の異なるハプロタイプの相対比を決定するために使用することができる定量的対立遺伝子方法、技術、又はアルゴリズムを含むことができる。異なるハプロタイプは、1つの個体からの2つの異なる相同染色体、トリソミーの個体からの3つの異なる相同染色体、1つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの3つの異なる相同ハプロタイプ、1つ若しくは2つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの3つ若しくは4つのハプロタイプ、又は他の組み合わせを表すことができる。1つ以上のハプロタイプが既知である場合、又は1つ以上の個体の二倍体遺伝子型が既知である場合、ハプロタイプ間に多型である対立遺伝子のセットを選択することができ、平均対立遺伝子比は、ハプロタイプの各々に一意に由来する対立遺伝子のセットに基づいて決定することができる。
【0238】
しかしながら、そのようなサンプルの直接配列決定は、サンプル内の異なるハプロタイプ間で多型ではない領域についての多くの配列をもたらし、したがって、2つのハプロタイプの割合に関する情報を明らかにしないため、極めて非効率的である。本明細書では、配列決定によって得られる対立遺伝子情報の収率を増加させるために、ゲノム内で多型である可能性がより高いサンプル中のDNAのセグメントを特異的に標的化し、濃縮する方法が記載される。濃縮されたサンプルで測定される対立遺伝子比率が実際のハプロタイプ比率を真に表すためには、標的セグメント内の所与の遺伝子座における他の対立遺伝子と比較して、1つの対立遺伝子の優先的な濃縮がほとんど又はまったくないことが重要であることに留意されたい。多型対立遺伝子を標的化する当該技術分野で既知の現在の方法は、存在する任意の対立遺伝子の少なくともいくつかが検出されることを確実にするように設計される。しかしながら、これらの方法は、元の混合物中に存在する多型対立遺伝子の対立遺伝子比を測定する目的で設計されていない。濃縮サンプル中の様々な対立遺伝子の割合が、元の非増幅サンプル中の対立遺伝子の割合とほぼ同じである、任意の特定の標的濃縮方法が、濃縮サンプルを生成することができることは明らかではない。濃縮方法は、理論的には、そのような目的を達成するように設計され得るが、当業者は、現在の方法には多数の確率論的又は決定論的バイアスが存在することを認識している。本明細書に記載される方法の実施形態において、ゲノム中の所与の遺伝子座に対応するDNAの混合物中に見出される複数の対立遺伝子が増幅されるか、又は対立遺伝子の各々の濃縮度がほぼ同一であるような方法で優先的に濃縮されることを可能にする。別の言い方をすれば、この方法は、全体として混合物中に存在する対立遺伝子の相対量を増加させることを可能にするが、各遺伝子座に対応する対立遺伝子間の比率は、DNAの元の混合物中と本質的に同じままであることである。本開示の目的のために、比率が本質的に同じままであるために、得られた混合物中の対立遺伝子の比率で割った元の混合物中の対立遺伝子の比率が、0.5~1.5、0.8~1.2、0.9~1.1、0.95~1.05、0.98~1.02、0.99~1.01、0.995~1.005、0.998~1.002、0.999~1.001、又は0.9999~1.0001であることを意味する。
【0239】
対立遺伝子分布
特定の実施形態において、本方法の目的は、いくつかの遊離浮遊胎児DNAを含有する母体血液サンプルに基づいて、胎児コピー数を検出することである。いくつかの実施形態において、母親のDNAと比較した胎児DNAの画分は不明である。LIPSなどの標的化方法の組み合わせ、続いて配列決定は、各SNPでの各対立遺伝子に関連する観察された配列のカウントからなるプラットフォーム応答をもたらす。A/T又はC/Gのいずれかの可能性のある対立遺伝子のセットは、各SNPで既知である。一般性を失うことなく、第1の対立遺伝子はAと標識され、第2の対立遺伝子はBと標識される。したがって、各SNPにおける測定値は、A配列の数(N)及びB配列の数(N)からなる。これらは、将来の計算の目的のために、総配列数(n)及び総(r)に対するA対立遺伝子の比率に変換される。単一のSNPについての配列カウントは、リード深度と呼ばれる。このデータからのコピー数同定を可能にする基本的な原理は、A配列及びB配列の比率が、測定されるDNAに存在するA対立遺伝子とB対立遺伝子の比率を反映することである。
n=N+N
r=N/(N+N
【0240】
測定は、最初に、順序付けられていない親遺伝子型に基づいて、同じ親コンテキストからのSNPにわたって集約される。各コンテキストは、合計9つのコンテキストについて、母系遺伝子型及び父系遺伝子型によって定義される。例えば、母系遺伝子型がAAであり、父系遺伝子型がBBである全てのSNPは、AA|BB文脈のメンバーである。A対立遺伝子は、母系遺伝子型の比率r及び父系遺伝子型の比率rで存在すると定義される。例えば、対立遺伝子Aは、母親がAAである比率r=1、及び父親がABである比率r=0.5で存在する。したがって、各コンテキストは、r及びrの値を定義する。子の遺伝子型は、必ずしも親遺伝子型から予測されるわけではないが、多数のSNPにわたって平均化された対立遺伝子比率は、親AB遺伝子型が等しい割合でA及びBに寄与するという仮定に基づいて予測され得る。
【0241】
ここで、nは母系コピーの数であり、nは染色体の父系コピーの数である(n,n)の形式の子のコピー数仮説を考慮する。小児における対立遺伝子比率rの予測値(特定の親コンテキストにおけるSNPにわたって平均化される)は、親コンテキストの対立遺伝子比率及び親コピー数に依存する。
【数33】
【0242】
母体及び胎児の血液の混合物では、対立遺伝子のコピーは、母親から直接及び子供からの両方から寄与される。混合物中に存在する子供のDNAの画分がδであると仮定する。次いで、混合物では、所与の文脈におけるA対立遺伝子の比率rは、母親比率r及び子供比率rの線形組み合わせであり、これは、式1を使用して、母親比率及び父親比率の線形組み合わせに還元され得る。
【数34】
【0243】
式2は、コピー数仮説(n,n)の関数として、所与の文脈におけるSNPについてのA対立遺伝子の予測される比率を予測する。なお、個々のSNP上の対立遺伝子比率は、これらが、少なくとも一方の親がヘテロ接合性であるランダム割り当てに依存するため、この式によって予測されない。したがって、特定のコンテキスト内の全てのSNPからの配列のセットが組み合わされる。コンテキストがm個のSNPを含むと仮定し、n個の配列が各SNPから生成されることを想起すると、そのコンテキストからのデータは、N=mn個の配列からなる。N個の配列の各々は、A個の配列の理論率が対立遺伝子比率rである独立したランダム試験とみなされる。したがって、A配列の測定された速度
【数35】
は、平均r及び分散σ=r(1-r)/Nでガウス分布であることが知られている。
【0244】
理論上の対立遺伝子比は、親コピー数(n,n)の関数であることを想起されたい。したがって、各仮説hは、親コンテキストiにおけるSNP
【数36】
についての対立遺伝子比率を予測する。データ尤度は、所与の仮説が観測されたデータを生成する確率として定義される。したがって、仮説hの下でのコンテキストi
【数37】
からの測定の尤度は、二項分布であり、これは、以下の平均及び分散を有するガウス分布として大きなNについて近似することができる。平均は、式2に記載されるように、文脈及び仮説によって決定される。
【数38】
【0245】
9つのコンテキストの各々の測定値は、各SNP上の独立したノイズの一般的な仮定に起因して、親コピー数を考慮して独立していると仮定される。したがって、特定の染色体からのデータは、1~9の範囲のコンテキストiからの配列測定値からなる。したがって、全染色体
【数39】
から観察された対立遺伝子比の尤度は、個々の文脈の尤度の産物である。
【数40】
【0246】
パラメータ推定
式2は、親コピー数仮説の関数としての対立遺伝子比を予測するが、子供のDNAの画分も含む。したがって、各染色体のデータ尤度は、
【数41】
に及ぼす影響を通じた関数である。この効果は、表記
【数42】
によって強調表示される。このパラメータは高精度に予測することができないため、データから推定する必要がある。いくつかの異なるアプローチが、パラメータ推定のために使用されてもよい。1つの方法は、検査が実行される開発の段階でコピー数エラーが実行可能でない染色体の測定を伴う。他の方法は、エラーが発生すると予測される染色体のみを測定する。
【0247】
ダイソミーであることが知られているいくつかの染色体を測定する
この方法では、検査を実行するときに発生状態でコピー数エラーが発生しない特定の染色体が測定される。これらの染色体は、トレーニングセットTと呼ばれる。これらの染色体上のコピー数仮説は、(1,1)である。各染色体が独立していると仮定すると、Tにおける全ての染色体tからの測定値のデータ尤度は、個々の染色体尤度の積である。子画分δを選択して、ダイソミー仮説に条件付けられたTの染色体にわたるデータ尤度を最大化することができる。Rは、染色体t上の全てのコンテキスト
【数43】
からの測定値iのセットを表す。次いで、最大尤度推定値δは、以下を解決する。
【数44】
【0248】
この最適化は、ゼロと1との間に制約された1つの自由度のみを有し、したがって、様々な数値方法を使用して容易に解くことができる。次いで、各染色体上の各仮説の尤度を計算するために、溶液δを式2に置換することができる。
【0249】
コピー数エラーがある可能性のある染色体のみを測定する
測定される全ての染色体でコピー数エラーが可能である場合、コピー数仮説と並行して胎児画分を推定すると、倍数決定の精度が大幅に増加する。なお、全ての測定された染色体に存在する同じコピー数エラーは、検出が非常に困難であることに留意されたい。例えば、いずれの場合も、父親対立遺伝子と比較して母親対立遺伝子の寄与は、全ての染色体及び文脈にわたって一様に増加するため、所与の小児濃度での全ての染色体上の母体トリソミーは、より低い小児濃度での全ての染色体上のダイソミー上のダイソミーと同じ理論的対立遺伝子比率をもたらすであろう。
【0250】
染色体tの限られたセットの分類のための単純なアプローチは、試験される全ての染色体についての仮説の結合セットからなる結合染色体仮説Hを考慮することである。染色体仮説がダイソミー、母体トリソミー、及び父体トリソミーからなる場合、考えられる結合仮説の数は、3であり、Tは、検査された染色体の数である。最大尤度推定δ(H)は、各結合仮説に条件付けて計算することができる。したがって、結合仮説の尤度は、以下のように計算される:
【数45】
【0251】
結合仮説尤度p(全てのデータ|H)は、各結合仮説Hについて計算することができ、最大尤度仮説は、子画分のその対応する推定δ*(H)を伴って選択される。
【0252】
性能仕様
親コピー数仮説を区別する能力は、前のセクションで説明したモデルによって決定される。最も一般的なレベルでは、異なる仮説の下での予測される対立遺伝子比の差は、測定の標準偏差と比較して大きくなければならない。ダイソミー及び母体トリソミー、又は仮説h=(1,1)及びh=(2,1)を区別する例を考慮する。仮説1は、考慮されている文脈の母親対立遺伝子比r及び父親対立遺伝子比rの関数として、対立遺伝子比r及び仮説2は対立遺伝子比rを予測する。
【数46】
【0253】
対立遺伝子比率の測定値
【数47】
は、仮説1又は2が真であるかどうかに応じて、平均r又は平均rのいずれかを有するガウス分布であると予測される。測定された対立遺伝子比の標準偏差は、式3による仮説に同様に依存する。測定値に基づいて仮説1又は2のいずれかを真として同定することが予測できるシナリオでは
【数48】
平均r、r及び標準偏差σ、σは、平均が標準偏差と比較して遠く離れていることを保証する、以下のような関係を満たさなければならない。この基準は、2%のエラー率を表し、偽陰性又は偽陽性のいずれかの2%の確率を意味する。
|r-r|>2σ+2σ
【0254】
仮説1及び2のダイソミー(1,1)及び母体トリソミー(2,1)のコピー数を置き換えると、以下の状態になる:
【数49】
【0255】
本明細書で提供される方法で使用される分析方法の概要
本開示の実施形態の特定の例では、正倍数体であることが知られている親コンテキスト及び染色体を使用して、一組の同時方程式によって、母親からの母体血液中のDNAの割合及び胎児からの母体血液中のDNAの割合を推定することが可能である。これらの同時方程式は、父親に存在する対立遺伝子の知識によって可能になる。特に、父親に存在し、母親に存在しない対立遺伝子は、胎児DNAの直接測定を提供する。次いで、染色体21などの特定の目的の染色体を見て、各親のコンテキストにおけるこの染色体上の測定値が、Hmpなどの特定の仮説と一致しているかどうかを確認してもよく、式中、mは母体染色体の数を表し、pは父体染色体の数を表し、例えば、H11は正倍数体を表し、H21及びH12は母体及び父体トリソミーをそれぞれ表す。
【0256】
この方法は、染色体倍数体を検出するための特定の他の方法とは異なり、異数性の決定を行うために、目的の染色体上で観察された対立遺伝子の比率を比較するための基礎として参照染色体を使用しない。
【0257】
本開示は、母体血液中に見出される胎児DNAから決定された遺伝情報を用いて、1つ以上の染色体において、非侵襲性様式で、妊娠中の胎児の倍数性状態を決定し得る方法を提示する。胎児DNAは、精製されてもよく、部分的に精製されてもよく、又は精製されていなくてもよく、遺伝子測定は、2つ以上の個体に由来するDNAに対して行われてもよい。インフォマティクスタイプの方法は、対立遺伝子のセットでのバルク遺伝子型測定から、倍数性状態などの標的個体の遺伝子情報を推測することができる。対立遺伝子のセットは、対立遺伝子の様々なサブセットを含み得、1つ以上のサブセットは、標的個体上に見出されるが非標的個体上に見出されない対立遺伝子に対応し得、1つ以上の他のサブセットは、非標的個体上に見出され、標的個体上に見出されない対立遺伝子に対応し得る。本方法は、様々な潜在的な倍数性状態を与えられた対立遺伝子の様々なサブセットについての測定された出力強度の比率を、予測される比率と比較することを伴っていてもよい。プラットフォーム応答が決定されてもよく、システムのバイアスに対する補正が方法に組み込まれてもよい。
【0258】
本方法の主な前提:
-母親からの母体血液中の遺伝物質の予想量は、全ての遺伝子座にわたって一定である。
-胎児からの母体血液中に存在する遺伝物質の予想量は、染色体が正倍数体であると仮定して、全ての遺伝子座にわたって一定である。
-生存しない染色体(13、18、21、X、Yを除く全て)は、胎児内の全ての正倍数体である。一実施形態において、生存しない染色体のうちのいくつかのみが、胎児上で正倍数体である必要がある。
【0259】
一般的な問題の製剤:
ijk=gijk(xijk)+vijkと書くことができ、Xijkは対立遺伝子k=1又は2(1は対立遺伝子Aを表し、2は対立遺伝子Bを表す)上のDNAの量であり、j=1...23は染色体番号を表し、i=1...Nは染色体上の遺伝子座番号を表し、gijkは特定の遺伝子座及び対立遺伝子ijkのプラットフォーム応答であり、vijkはその遺伝子座及び対立遺伝子の測定上の独立したノイズである。遺伝物質の量は、xijk=amijk+Δcijkによって与えられ、aは、母体染色体の各々に存在する遺伝物質の増幅因子(又は漏れ、拡散、増幅などの正味の影響)であり、mijk(0,1,2のいずれか)は、母体染色体上の特定の対立遺伝子のコピー数であり、Δは、子染色体の各々に存在する遺伝物質の増幅因子であり、cijkは、子染色体上の特定の対立遺伝子のコピー数(0,1,2,3のいずれか)である。第1の簡略化された説明について、a及びΔは、遺伝子座及び対立遺伝子から独立している、すなわち、i、j、及びkから独立していると仮定されることに留意されたい。これにより、以下が得られる。
ijk=gijk(amijk+Δcijk)+vijk
【0260】
全遺伝子座にわたって一様であるアフィンモデルを使用したアプローチ:
1つは、アフィンモデルを用いてモデル化することができ、単純化のために、モデルは、各遺伝子座及び対立遺伝子について同じであると仮定するが、アフィンモデルがi、j、kに依存するときのアプローチを修正する方法は、本開示を読んだ後に理解されるであろう。プラットフォーム応答モデルを
ijk(xijk)=b+amijk+Δcijkと仮定し、
増幅係数a及びΔは、一般性を失うことなく使用されており、遺伝物質がない場合のノイズレベルを定義するy軸切片bが追加されている。目標は、a及びΔを推定することである。bを独立して推定することも可能であるが、ノイズレベルが遺伝子座にわたっておおよそ一定であると仮定し、a及びΔを推定するために親コンテキストに基づく方程式のセットのみを使用する。各遺伝子座での測定は、
ijk=b+amijk+Δcijk+vijkによって与えられる。
【0261】
ノイズvijkが、特定の親コンテキストT内の測定値それぞれについてi.i.d.であると仮定すると、その親コンテキスト内のシグナルを合計することができる。親コンテキストは、対立遺伝子A及びBの観点から表され、最初の2つの対立遺伝子は母親を表し、次の2つの対立遺伝子は父親を表す:T∈{AA|BB,BB|AA,AB|AB,AA|AA,BB|BB,AA|AB,AB|AA,AB|BB,BB|AB}。各コンテキストTについて、親DNAがそのコンテキストに適合する遺伝子座i、jのセットが存在し、これはi、j∈Tを表す。したがって:
【数50】
【0262】
式中
【数51】
は、親コンテキストTに準拠する全ての遺伝子座にわたる、又は全てのi、jεTにわたるそれぞれの値の平均を表す。平均値又は予測値
【数52】
は、子の倍数性状態に依存する。以下の表は、k=1(対立遺伝子A)又は2(対立遺伝子B)及び全ての親コンテキストTの場合、平均値又は予測値
【数53】
を説明する。子供について異なる仮説、すなわち、正倍数性及び母体トリソミーを仮定して、予測値を計算してもよい。これらの仮説は、表記Hmfによって示され、式中、mは、母親からの染色体の数を指し、fは、父親からの染色体の数を指し、例えば、H11は、正倍数体であり、H21は、母体トリソミーである。A及びBを切り替えることによっていくつかの状態の間に対称性があるが、明確にするために全ての状態が含まれることに留意されたい。
【表2】
【0263】
これで、以下のように、行列形式でキャストできる全ての予測値yT、kを記述する方程式のセットを書くことができる:
Y=B+AP+v
【0264】
式中、
【数54】
【数55】
は、推定するパラメータの行列である
【数56】
式中、
【数57】
は、1の18x1行列であり、
【数58】
は、ノイズ項の18×1行列であり
は、表内のデータをカプセル化する行列であり、値は、子の倍数性状態に関する仮説Hごとに異なる。以下は、倍数性仮説H11及びH21の行列Aの例である。
【数59】
【0265】
A及びΔ、又は行列Pを推定するために、子サンプル上で正倍数体であると仮定し得る染色体のセットにわたってデータを集約する。これには、試験中の染色体、すなわちj=13、18、21、X、及びYを除く全ての染色体j=1...23が含まれ得る。(注:生存しない染色体上のモザイク異数体を検出するために、個々の染色体上の結果に対して調和検定を適用することもできる。)表記を明確にするために、Y’を、全ての正倍数体性染色体にわたって測定されたYとして定義し、Y’’を、異数性であり得る、試験中の特定の染色体、例えば、染色体21にわたって測定されたYとして定義する。パラメータを推定するために、行列
【数60】
を正倍数体数データに適用する:
【数61】
式中、
【数62】
すなわち、バイアスが除去された測定データである。上記の最小二乗解は、ノイズ行列vの各項が同様の分散を有する場合、最大尤度解のみである。これは、各コンテキストTの平均測定値を計算するために使用される遺伝子座N’の数がコンテキストごとに異なるためである。上記のように、N’を使用して、正倍数体であることが知られている染色体で使用される遺伝子座の数を指し、C’を使用して、正倍数体であることが知られている染色体での平均測定のための共分散行列を表す。ノイズ行列vの共分散C’を推定する多くのアプローチが存在し、これは、v~N(0,C’)として分布すると仮定することができる。共分散行列を与えると、Pの最大尤度推定値は、以下である
【数63】
【0266】
共分散行列を推定するための1つの単純なアプローチは、vの全ての項が独立である(すなわち、非対角項がない)と仮定し、vの各項の分散が1/N’としてスケーリングされるように、中心極限定理をコールして、18×18行列を見つけることができるようにすることである。
【数64】
【0267】
P’が推定されたら、これらのパラメータを使用して、染色体21などの研究中の染色体に関する最も可能性の高い仮説を決定する。言い換えれば、仮説を選択する:
【数65】
【0268】
次いで、Hを見つけた後、Hの決定において有することができる信頼度を推定することができる。例えば、検討中の仮説が2つあるとする:H11(正倍数体)及びH21(母体トリソミー)。H=H11と仮定する。各々の仮説に対応する距離測度を計算する。
【数66】
【0269】
これらの距離測度の二乗は、18自由度のカイ二乗ランダム変数として大まかに分布していることが示される。Χ18は、そのような変数の対応する確率密度関数を表す。次いで、以下に従って、各々の仮説の確率pHの比率を見出すことができる:
【数67】
【0270】
次いで、方程式
【数68】
を加算することによって、各仮説の確率を計算し得る。染色体が実際には正倍数体であるという確信度は、
【数69】
によって与えられる。
【0271】
本方法のバリエーション
(1)対立遺伝子A及びBを表す各チャネル上の異なるバイアスbについて、上記のアプローチを修正してよい。バイアス行列Bは、以下のように再定義される:
【数70】
式中
【数71】
は、1の9x1行列である。上述のように、パラメータb及びbibは、先験的な測定に基づいて仮定することができるか、又は行列Pに含まれ、積極的に推定することができる(すなわち、そうするために、全てのコンテキストにわたって方程式に十分なランクがある)。
【0272】
(2)一般的な定式化において、yijk=gijk(amijk+Δcijk)+vijkでは、全ての遺伝子座及び対立遺伝子について関数gijkを直接測定又は較正することができるため、関数(大部分の遺伝子型決定プラットフォームでは単調であると仮定することができる)を反転させることができる。次いで、関数を逆にして、方程式のシステムが線形であるように、遺伝物質の量に関する測定値を再キャストすることができる。すなわち、y’ijk=gijk-1(yijk)=amijk+Δcijk+v’ijk。このアプローチは、gijkがアフィン関数であるときに特に良いので、反転はv’ijkのノイズの増幅又はバイアスを生成しない。
【0273】
(3)修正されたノイズ項v’ijk=gijk-1(vijk)は、関数反転によって増幅又はバイアスされる可能性があるため、上記の方法は、ノイズの観点から最適ではない場合がある。別のアプローチは、動作点の周りの測定値を線形化することである。つまり、yijk=gijk(amijk+Δcijk)+vijkは次のように再キャストされる:
【数72】
母体血液中の遊離浮遊DNAの30%以下が子供由来であると予測され得るので、Δ<<a、及び拡張は合理的な近似である。代替的に、単調に増加し、第2の導関数が常に負であるILLUMINAビーズアレイのようなプラットフォーム応答について、
【数73】
に従って線形化推定を改善することができる。得られた方程式の集合は、ニュートン-ラフソン最適化などの方法を使用して、a及びΔに対して反復的に解かれ得る。
【0274】
(4)別の一般的なアプローチは、試験染色体(母親+胎児)上のDNAの総量を測定し、DNAの量が全ての染色体にわたって一定であるべきであるという仮定に基づいて、他の全ての染色体上のDNAの量と比較することである。これはより単純であるが、子供がどれだけ貢献しているかがわかっているため、信頼限界を有意義に推定することができないという欠点がある。しかしながら、シグナル分散を推定し、信頼限界を生成するために、正倍数体であるべきである他の染色体シグナルにわたる標準偏差を見ることができる。この方法は、子供のDNAにない母体DNAの測定を含むため、これらの測定はシグナルには何も寄与しないが、ノイズに直接寄与する。加えて、異なる染色体間の増幅バイアスを較正することは不可能である。この最後の点に対処するために、各染色体の平均シグナルレベルを他の全ての染色体の平均シグナルレベルにリンクする回帰関数を見つけ、回帰適合の分散に基づいて重み付けすることによって全ての染色体からのシグナルを組み合わせ、目的の検査染色体が他の染色体によって定義される許容範囲内にあるかどうかを調べることが可能である。
【0275】
データドロップアウトの組み込み
本開示の他の箇所では、Aを得る確率は、真の母系遺伝子型、真の子の遺伝子型、混合物中の子の画分、及び子コピー数の直接関数であると仮定されている。また、母親又は子の対立遺伝子が脱落する可能性があり、例えば、混合物中に真の子ABを有する代わりに、Aのみが存在し、その場合、Aの結合配列測定を得る可能性ははるかに高い。母親のドロップアウト率がMDOであり、子のドロップアウト率がCDOであると仮定する。いくつかの実施形態において、母親のドロップアウト率はゼロであると仮定することができ、子供のドロップアウト率は比較的低いため、実際の結果はドロップアウトによって深刻な影響を受けることはない。それにもかかわらず、それらはここでのアルゴリズムに組み込まれている。他の場所では、lik(x│m,c,cf)=pdf(x)は、真の母m、真の子cを仮定して、配列測定Sが与えられた場合、SNPi上でAのx確率を得る尤度として定義されている。母親又は子供にドロップアウトがある場合、入力データは真の母親(m)又は子供(c)ではなく、可能性のあるドロップアウトの後の母親(m)及び可能性のあるドロップアウトの後の子供(c)である。次いで、上記の式を以下のように書き換えることができる:
【数74】
式中、p(m│m)は、真の母系遺伝子型mが与えられた場合の、新しい母系遺伝子型mdの確率であり、ドロップアウト率mdoが仮定され、p(c│c)は、真の子の遺伝子型cが与えられた場合の、新しい子の遺伝子型cの確率であり、ドロップアウト率CDOが仮定される。nA=真の遺伝子型cにおけるA対立遺伝子の数、nA=「ドロップ」遺伝子型cにおけるA対立遺伝子の数、nA≧nA、及び同様にnB=真の遺伝子型cにおけるB対立遺伝子の数、nB=「ドロップ」遺伝子型cにおけるB対立遺伝子の数、nB>nB及びd=ドロップアウト率の場合、次いで
【数75】
【0276】
実験データの1つのセットについて、親遺伝子型、並びに子供が染色体14及び21上の母体トリソミーを有する真の子の遺伝子型が測定された。配列決定測定は、子画分、N個の異なるSNP、及び総リード数NRの様々な値についてシミュレートされている。このデータから、最も可能性の高い子画分を導出し、既知又は導出された子画分を仮定してコピー数を導出することが可能である。
【0277】
一実施形態において、本明細書に開示される方法を使用して、母体及び胎児の遺伝物質の混合物中の標的配列を有する、母体及び胎児の標的染色体のコピー数を決定することによって、胎児の異数体を決定することができる。この方法は、母体及び胎児の遺伝物質の両方を含有する母体組織を得ることを伴い得る。いくつかの実施形態において、この母体組織は、母体血漿又は母体血液から単離された組織であり得る。この方法はまた、当該母体組織を処理することによって、母体組織から母体及び胎児の遺伝物質の混合物を得ることを伴い得る。この方法は、取得された遺伝物質を複数の反応サンプルに分配し、標的染色体からの標的配列を含む個々の反応サンプルと、標的染色体からの標的配列を含まない個々の反応サンプルとをランダムに提供し、例えば、サンプルに対して高スループット配列決定を実行することを伴い得る。この方法は、当該個々の反応サンプル中に存在するか又は存在しない遺伝物質の標的配列を分析して、反応サンプル中の可能性のある正倍数体胎児染色体の有無を表す第1の数のバイナリ結果と、反応サンプル中のおそらく異数体胎児染色体の有無を表す第2の数のバイナリ結果とを提供することを伴い得る。バイナリ結果の数のいずれかは、例えば、特定の染色体、染色体の特定の領域、特定の遺伝子座又は遺伝子座のセットにマッピングする配列リードをカウントする情報技術によって計算され得る。この方法は、染色体の長さ、染色体の領域の長さ、又はセット中の遺伝子座の数に基づいて、二項イベントの数を正規化することを伴っていてもよい。この方法は、第1の数値を使用して、反応サンプル中のおそらく正倍数体胎児染色体の二値結果の数の予測分布を計算することを伴い得る。この方法は、混合物中に見出される胎児DNAの第1の数及び予測画分を使用して、例えば、推定異数体胎児染色体のバイナリ結果の数の予測リードカウント分布に、(1+n/2)(式中、nは推定胎児画分)を乗じて、反応サンプル中の推定異数体胎児染色体のバイナリ結果の数の予測分布を計算することを伴い得る。胎児画分は、複数の方法によって推定され得、そのうちのいくつかは、本開示の別の箇所に記載されている。この方法は、最大尤度アプローチを使用して、第2の数が、可能性のある異数体胎児染色体が正倍数体であるか、又は異数体であるかに対応するかどうかを決定することを伴っていてもよい。この方法は、胎児の倍数性状態を、測定データを考慮して正しい尤度が最大であるという仮説に対応する倍数性状態と呼ぶことを伴っていてもよい。
【0278】
NPDにおける倍数性コールの対立遺伝子比率法の簡易説明
一実施形態において、妊娠中の胎児の倍数性状態は、対立遺伝子比を調べる方法を用いて決定することができる。いくつかの方法は、疑わしい染色体からの数値配列決定出力DNA数を参照の正倍数体染色体と比較することによって、胎児の倍数性状態を決定する。その概念とは対照的に、対立遺伝子比率法は、1つの染色体上の異なる親コンテキストの対立遺伝子比率を見ることによって、胎児の倍数性状態を決定する。この方法は、参照染色体を使用する必要はない。例えば、以下の可能な倍数性状態、及び様々な親コンテキストの対立遺伝子比率を想像してみよう:
(注:比率「r」は、以下のように定義される:1/r=画分母DNA/画分胎児DNA)
【表3】
*P-U tri=父親のマッチングトリソミー、P-M tri=父親のマッチングトリソミー、
この表は、親コンテキストの部分集合のみを表し、可能な倍数性のサブセットは、この方法が区別するように設計されていることに留意されたい。この場合、配列決定データの集合における親コンテキストの集合から、複数の対立遺伝子のA:B比を決定することができる。次いで、各倍数性状態について、及び各r値についていくつかの仮説を述べることができ、各仮説は、異なる親コンテキストについてA:B比率の予測されるパターンを有する。次いで、どの仮説が実験データに最も適合するかを決定することができる。
例えば、上記の親コンテキストのセットを使用し、r=0.2の値を使用すると、以下のようにチャートを書き換えることができる:(例えば、[#reads of allele A/# reads of allele B]を計算することができる。したがって、2+r:rは2+0.2:0.2→2.2:0.2=11になる)
【表4】
【0279】
ここで、異なる親のコンテキストのA:B比率の間の比率を見ることができる。この場合、A:BAA|BB/A:BAA|ABは、正倍数体については平均して11/21=0.524であり、父系のマッチしないトリソミーについては平均して5.5/12=0.458であり、父系のマッチするトリソミーについては平均して5.5/44=0.125であると予測され得る。異なるコンテキスト間のA:B比のプロファイルは、異なる倍数性状態において異なり、プロファイルは、高精度で染色体の倍数性状態を決定することが可能であることができるように十分に区別されるべきである。rの計算値は、異なる方法を用いて決定されてもよく、又はこの方法に対する最大尤度アプローチを用いて決定されてもよいことに留意されたい。一実施形態において、本方法は、母系遺伝子型知識を必要とする。一実施形態において、本方法は、父系遺伝子型知識を必要とする。一実施形態において、本方法は、父系遺伝子型の知識を必要としない。一実施形態において、胎児画分及び母体DNA対胎児DNAの比率は、本質的に同等であり、適切な線形代数変換を適用した後に互換的に使用することができる。いくつかの実施形態において、r=[胎児画分]/[1%胎児画分]。
【0280】
Phredスコアを使用したSNP分類
Phredスコアqは、以下のように定義される:P(間違ったベースコール)=10^(-q/10)
【0281】
x=真の遺伝子型の参照比=参照対立遺伝子の数/総対立遺伝子の数とする。ダイソミーの場合、{0,0.5,1}におけるxは、{MM,RM,RR}に対応する。zを、{R,M}中のzという配列で観察される対立遺伝子とする。ここでは、z=Rを観察する尤度が示され、遺伝子型における参照対立遺伝子の真の比率(すなわち、P(z=R|x)
P(z=R|x)=P(z=R|gc,x)P(gc)+P(z=R|bc,x)P(bc)
式中、gcは、正しいコールの事象であり、bcは、不良コールの事象である。
【0282】
P(gc)及びP(bc)は、phredスコアから計算される。P(z=R|gc,x)=x及びP(z=R|bc,x)=1-xであり、プローブが不偏であると仮定する。
【0283】
結果、b=P(間違ったベースコール):P(z=R|x)=x(1-b)+(1-x)*b
【0284】
参照対立遺伝子測定の確率は、予想通り、phredスコアが改善するにつれて、参照対立遺伝子比率に収束することに留意されたい。
【0285】
各配列が独立して生成され、真の遺伝子型に条件付けられていると仮定すると、同じSNPにおける測定値のセットの尤度は、単に個々の尤度の積である。この方法は、様々なphredスコアを説明する。別の実施形態において、配列マッピングの信頼度の変化を考慮することができる。単一SNPについてのn個の配列のセットを考慮すると、尤度の組み合わせは、様々な仮説を表す候補対立遺伝子比率で評価することができる順序nの多項式をもたらす。
【0286】
Phred閾値を使用したSNP分類
単一のSNPについて多数の配列が利用可能である場合、対立遺伝子比に関する多項式尤度関数は、扱いにくくなる。代替案は、高いphredスコアを有するベースコールのみを考慮し、次いで、それらが正確であると仮定することである。各塩基読み取りは、真の対立遺伝子比に従ってIIDベルヌーイであり、尤度関数はガウスである。rがデータにおける参照読み取りの比率である場合、x上の尤度関数(真の参照対立遺伝子比)は、平均=r及び標準偏差=sqrt(r*(1-r)/n)を有する。
【0287】
サンプル間のSNPバイアス相関
上記の2つの尤度関数(多項式、ガウス)を使用して、対立遺伝子比率{1,0.5,0}を考慮することによって、SNPをRR、RM、又はMMとして分類することができ、又は対立遺伝子比率の最大尤度推定値を計算することができる。同じSNPが2つの異なるサンプルにおいてRMとして分類される場合、対立遺伝子比のMLE推定値を比較して、一貫した「プローブバイアス」を探すことが可能である。
【0288】
DNAの起源を決定する前に配列の長さを使用すること
母体DNAと胎児DNAとでは配列の長さの分布が異なり、胎児は一般に短いことが報告されている。本開示の一実施形態において、経験的データの形態で従来の知識を使用し、母親(P(X|母体))及び胎児DNA(P(X|胎児))の両方の予測される長さの事前分布を構築することが可能である。長さxの新たな未確認DNA配列を考慮すると、所与のDNA配列が母体DNA又は胎児DNAのいずれかであるという確率を、母体又は胎児のいずれかが与えられたxの事前尤度に基づいて割り当てることが可能である。特に、P(x|母体)>P(x|胎児)の場合、DNA配列は、P(x|母体)=P(x|母体)/[(P(x|母体)+P(x|胎児)]で母体として分類することができ、p(x|母体)<p(x|胎児)の場合、DNA配列は、胎児、P(x|胎児)=P(x|胎児)/[(P(x|母体)+P(x|胎児)]]として分類することができる。本開示の一実施形態において、高い確率を有する母体又は胎児として割り当てることができる配列を考慮することによって、そのサンプルに特異的な母体及び胎児の配列の長さの分布を決定することができ、その後、そのサンプル特異的な分布をそのサンプルの予想サイズ分布として使用することができる。
【0289】
標的細胞のセットにおける平均コピー数を決定するための方法
上記の方法は、標的細胞からのDNAが、1つの標的細胞からのものである、又はそうでなければ、本質的に遺伝的に同一である標的細胞からのものであると仮定する。この仮定は、例えば、標的が胎児であり、胎児からのDNAが、胎盤細胞のいくつかが他の胎盤細胞と遺伝的に異なる複数の細胞に由来する胎盤モザイクの場合には当てはまらない場合がある。例えば、胎児が47、XX+18又は47、XY+18である多くの場合、胎盤は、それぞれ、46、XX及び47、XX+18又は46、XY及び47、XY+18の混合物であるモザイクである。
【0290】
別の例は、標的細胞が腫瘍由来であり、非標的細胞が宿主由来の非がん性細胞である、コピー数バリアントによるがんの検出を伴う。がんの特徴はゲノムの不安定性であり、全てではないにしても多くの場合、腫瘍は遺伝的に不均一である。腫瘍組織の小さな生検でさえ、不均一性を示す。がん細胞のゲノムが天然宿主DNAと異なる方法は、変異とみなされる。これらの変異のいくつかは、必ずしも全てではないが、がんの発がん特性を駆動し得る。液体生検、すなわち、血流中の無細胞DNA(cfDNA)からの腫瘍DNAの検出の場合、無細胞腫瘍DNA(ctDNA)は、多くの場合不均一であり、腫瘍の細胞のいくつか又は全てを代表する、アポトーシス又は壊死性がん細胞に由来すると考えられる。単一ヌクレオチドバリアント(SNV)、コピー数バリアント(CNV)、低メチル化、高メチル化、欠失、及び重複とも呼ばれる点変異を含むが、これらに限定されない、がんに見られるいくつかのタイプの変異が存在する。
【0291】
宿主の正常なダイソミーゲノムがベースラインであると考えると、正常細胞及びがん細胞の混合物の分析は、混合物中のベースラインとctDNAの起源細胞のDNAとの平均差を与える。例えば、サンプル中のDNAの10%が、アッセイによって標的化される染色体の領域にわたって欠失を有する細胞に由来する場合を想像する。定量手法は、この領域に対応するリードの量が、正常サンプルについて予測される量の95%であると予測されることを示すべきである。これは、標的領域の欠失を有する腫瘍細胞各々における2つの標的染色体領域の1つが欠けているため、この領域にマッピングするDNAの総量は、90%(正常細胞の場合)+1/2×10%(腫瘍細胞の場合)=95%である。代替的に、対立遺伝子手法は、ヘテロ接合性遺伝子座での対立遺伝子の比率が平均で19:20であることを示すべきである。次に、サンプル中のDNAの10%が、アッセイによって標的化される染色体の領域の5倍の焦点増幅を有する細胞に由来する場合を想像する。定量手法は、この領域に対応するリードの量が、正常サンプルについて予測される量の125%であると予測されることを示すべきである。これは、5倍の焦点増幅を有する腫瘍細胞各々における2つの標的染色体領域の1つが、標的領域にわたって過剰に5倍コピーされるため、この領域にマッピングするDNAの総量は、90%(正常細胞の場合)+(2+5)×10%(腫瘍細胞の場合)/2=125%である。代替的に、対立遺伝子手法は、ヘテロ接合性遺伝子座での対立遺伝子の比率が平均で25:20であることを示すべきである。なお、対立遺伝子手法のみを用いる場合、10%のctDNAを含むサンプル中の染色体領域にわたる5倍の焦点増幅は、40%のctDNAを含むサンプル中の同じ領域にわたる欠失と同じであるように見える場合がある。これらの2つの場合では、欠失の場合に過小出現するハプロタイプは、焦点重複を有する場合において、CNVを含まないハプロタイプであるように見え、欠失の場合において、CNVを有しないハプロタイプは、焦点重複の場合において、過剰出現するハプロタイプであるように見える。この対立遺伝子手法によって作成される尤度と、定量手法によって作成される尤度とを組み合わせることで、この2つの確率を区別するであろう。
【0292】
親のコンテキスト
親のコンテキストは、標的の2つの親の一方又は両方の2つの関連する染色体の各々における、所与の対立遺伝子の遺伝子状態を指す。一実施形態において、親コンテキストは、標的の対立遺伝子状態を指さず、むしろ、親の対立遺伝子状態を指すことに留意されたい。所与のSNPの親コンテキストは、4つの塩基対、2つの父体及び2つの母体からなり得、それらは、互いに同じであっても異なっていてもよい。典型的には、「m|f」と記載され、m及びmは、2つの母系染色体上の所与のSNPの遺伝子状態であり、f及びfは、2つの父系染色体上の所与のSNPの遺伝子状態である。いくつかの実施形態において、親コンテキストは、「f|m」として書かれてもよい下付き文字「1」及び「2」は、所与の対立遺伝子における、第1及び第2の染色体の遺伝子型を指すことに留意されたい、また、どの染色体が「1」と標識され、どの染色体が「2」と標識されるかの選択は、任意であることに留意されたい。
【0293】
本開示では、A及びBは、塩基対同一性を一般的に表すために多くの場合使用され、A又はBは、C(シトシン)、G(グアニン)、A(アデニン)又はT(チミン)を等しくよく表すことができることに留意されたい。例えば、所与のSNPベースの対立遺伝子において、母系遺伝子型が、1つの染色体上のそのSNPでTであり、相同染色体上のそのSNPでGであり、その対立遺伝子での父系遺伝子型が、両方の相同染色体上のそのSNPでGである場合、標的個体の対立遺伝子は、AB|BBの親コンテキストを有すると言うことができ、対立遺伝子は、AB|AAの親コンテキストを有すると言うこともできる。理論的には、4つの可能なヌクレオチドのいずれかが所与の対立遺伝子に存在し得、したがって、例えば、母親がATの遺伝子型を有し、父親が所与の対立遺伝子でGCの遺伝子型を有することが可能であることに留意されたい。しかしながら、経験的データは、ほとんどの場合、4つの可能な塩基対のうちの2つのみが、所与の対立遺伝子で観察されることを示す。例えば、単一のタンデム反復を使用する場合、2つより多くの親、4つより多く、更には10つより多くのコンテキストを有することが可能である。本開示では、考察は、所与の対立遺伝子で2つの可能な塩基対のみが観察されると仮定するが、本明細書に開示される実施形態は、この仮定が当てはまらない場合を考慮に入れるように修正されてもよい。
【0294】
「親コンテキスト」とは、同じ親コンテキストを有する標的SNPのセット又はサブセットを指し得る。例えば、標的個体上の所与の染色体上で1000の対立遺伝子を測定する場合、コンテキストAA|BBは、標的の母系遺伝子型がホモ接合性であり、標的の父系遺伝子型がホモ接合性であるが、母系遺伝子型及び父系遺伝子型がその遺伝子座で異なっている1000の対立遺伝子群内の全ての対立遺伝子のセットを指すことができる。親データがフェーズ化されておらず、したがってAB=BAである場合、9つの可能な親コンテキストがある。AA|AA、AA|AB、AA|BB、AB|AA、AB|AB、AB|BB、BB|AA、BB|AB、及びBB|BB。親データがフェーズ化され、したがってAB≠BAである場合、16つの異なる可能性のある親コンテキストがある。AA|AA、AA|AB、AA|BA、AA|BB、AB|AA、AB|AB、AB|BA、AB|BB、BA|AA、BA|AB、BA|BA、BA|BB、BB|AA、BB|AB、BB|BA、及びBB|BB。性染色体上のいくつかのSNPを除いて、染色体上の全てのSNP対立遺伝子は、これらの親コンテキストの1つを有する。一方の親についての親コンテキストがヘテロ接合性であるSNPのセットは、ヘテロ接合性コンテキストと呼ばれる場合がある。
【0295】
NPDにおける親のコンテキストの使用
非侵襲性出生前診断は、例えば妊娠中の母親の採血から、非侵襲的な方法で得られる遺伝物質から胎児の遺伝子状態を決定するために使用することができる重要な技術である。血液を分離し、血漿を単離し、続いて血漿DNAを単離することができる。サイズ選択を使用して、適切な長さのDNAを単離することができる。DNAは、遺伝子座のセットで優先的に濃縮され得る。次いで、このDNAは、例えば、遺伝子型決定アレイにハイブリダイゼーションして蛍光を測定することによって、又は高スループットシーケンサ上で配列決定することによって、いくつかの手段によって測定することができる。
【0296】
非侵襲性出生前診断の文脈における胎児の倍数性コールのために配列決定が使用される場合、配列データを使用するいくつかの方法が存在する。配列データを使用することができる最も一般的な方法は、所与の染色体にマッピングするリードの数を単にカウントすることである。例えば、胎児の染色体21の倍数性状態を決定しようとしているとする。更に、サンプル中のDNAが、胎児起源の10%DNA、及び母体起源の90%DNAからなることを想像する。この場合、ダイソミックと予測される染色体上の平均リード数(例えば、染色体3)を調べ、染色体21上のリード数と比較することができ、リード数は、固有の配列の一部であるその染色体上の塩基対の数に対して調整される。胎児が正倍数体である場合、ゲノムの単位当たりのDNAの量は、全ての位置においてほぼ等しいことが予測される(確率的変動の影響を受ける)。一方、胎児が染色体21でトリソミックであった場合、染色体21からの遺伝子単位当たりのDNAは、ゲノム上の他の位置よりもわずかに多いことが予測される。具体的には、混合物中の染色体21からのDNAが約5%増加すると予測される。配列決定を使用してDNAを測定する場合、固有のセグメントごとに、他の染色体からのものよりも、染色体21からの約5%多くの固有にマッピング可能なリードが予測される。特定の染色体からのDNAの量の観察は、その染色体に一意にマッピング可能な配列の数を調整した場合、異数体診断の基礎として、特定の閾値よりも高い。異数性を検出するために使用され得る別の方法は、親のコンテキストを考慮に入れることができることを除いて、上記の方法と同様である。
【0297】
どの対立遺伝子を標的化するかを検討するとき、いくつかの親のコンテキストが他のコンテキストよりも有益である尤度が高いことを考慮することができる。例えば、AA|BB及び対称コンテキストBB|AAは、胎児が母親とは異なる対立遺伝子を有することが知られているため、最も有益なコンテキストである。対称性の理由から、AA|BB及びBB|AAの両方のコンテキストは、AA|BBと呼ばれる場合がある。有益な親コンテキストの別のセットは、AA|AB及びBB|ABである。これらの場合、胎児は、母親が有さない対立遺伝子を有する可能性が50%であるからである。対称性の理由から、AA|AB及びBB|ABの両方のコンテキストは、AA|ABと呼ばれる場合がある。これらの場合、胎児は、既知の父系対立遺伝子を有し、その対立遺伝子は、母系ゲノムにも存在するため、有益な親コンテキストの第3のセットは、AB|AA及びAB|BBである。対称性の理由から、AB|AA及びAB|BBの両方のコンテキストは、AB|AAと呼ばれる場合がある。第4の親コンテキストは、胎児が未知の対立遺伝子状態を有し、対立遺伝子状態が何であれ、母親が同じ対立遺伝子を有するAB|ABである。5番目の親のコンテキストはAA|AAであり、母親及び父親は、ヘテロ接合体である。
【0298】
実施形態の異なる実装
標的個体の倍数性状態を決定するための方法が本明細書に開示される。標的個体は、芽球、胚、又は胎児であり得る。本開示のいくつかの実施形態において、標的個体における1つ以上の染色体の倍数性状態を決定するための方法は、本明細書に記載される工程のいずれか、及びそれらの組み合わせを含んでもよい。
【0299】
いくつかの実施形態において、胎児の遺伝子状態を決定するのに使用される遺伝物質の源は、母体血液から単離された有核胎児赤血球などの胎児細胞であってもよい。この方法は、妊娠中の母親から血液サンプルを取得することを伴っていてもよい。本方法は、視覚技術を使用して、特定の色の組み合わせが有核赤血球と一意に関連付けられ、同様の色の組み合わせが母体血液中の任意の他の存在する細胞と関連付けられないという考えに基づいて、胎児赤血球を単離することを伴っていてもよい。有核赤血球に関連する色の組み合わせは、核の周りのヘモグロビンの赤色(その色は、染色によってより明確にされ得る)、及び例えば、青色に染色され得る核物質の色を含んでもよい。母体血液から細胞を単離し、それらをスライド上に広げ、次いで、赤色(ヘモグロビンから)及び青色(核物質から)の両方を見る点を特定することによって、有核赤血球の位置を特定することができる。次いで、マイクロマニピュレータを使用してそれらの有核赤血球を抽出し、遺伝子型決定及び/又は配列決定技術を使用して、それらの細胞における遺伝物質の遺伝子型の態様を測定してもよい。
【0300】
一実施形態において、有核赤血球を、母体ヘモグロビンではなく胎児ヘモグロビンの存在下でのみ蛍光を発するダイで染色することができるため、有核赤血球が母体由来又は胎児由来の曖昧さを取り除くことができる。本開示のいくつかの実施形態は、核物質を染色又は他の方法でマーキングすることを伴っていてもよい。本開示のいくつかの実施形態は、胎児細胞特異的抗体を使用して胎児核物質を特異的にマーキングすることを伴っていてもよい。
【0301】
母体血液から胎児細胞を単離する、又は母体血液から胎児DNAを単離する、又は母体遺伝物質の存在下で胎児遺伝物質のサンプルを濃縮する多くの他の方法が存在する。これらの方法のいくつかはここに列挙されているが、これは網羅的なリストであることを意図していない。いくつかの適切な技術を、便宜上ここに列挙する:蛍光又は他の方法でタグ付けされた抗体、サイズ排除クロマトグラフィー、磁気又は他の方法で標識された親和性タグ、特定の対立遺伝子における母体細胞と胎児細胞との間の差異メチル化などのエピジェネティック差異、CD45/14枯渇によって成功した密度勾配遠心分離、及びCD45/14陰性細胞からのCD71陽性選択、異なる浸透圧を有する単一又は二重パーコール勾配、又はガラクトース特異的レクチン法を使用すること。
【0302】
本開示の一実施形態において、標的個体は胎児であり、異なる遺伝子型測定は、胎児からの複数のDNAサンプルに対して行われる。本開示のいくつかの実施形態において、胎児DNAサンプルは、胎児細胞が母体細胞と混合され得る単離された胎児細胞由来である。本開示のいくつかの実施形態において、胎児DNAサンプルは、胎児DNAが遊離浮遊母体DNAと混合され得る遊離浮遊胎児由来である。いくつかの実施形態において、胎児dNAサンプルは、母体DNA及び胎児DNAの混合物を含有する母体血漿又は母体血液に由来してもよい。いくつかの実施形態において、胎児DNAは、99.9:0.1%~99:1%、99:1%~90:10%、90:10%~80:20%、80:20%~70:30%、70:30%~50:50%、50:50%~10:90%、又は10:90%~1:99%、1:99%~0.1:99.9%の範囲の母体:胎児比率で母体DNAと混合されてもよい。
【0303】
いくつかの実施形態において、遺伝子サンプルは、調製及び/又は精製されてもよい。このような目的を達成するために、当該技術分野で既知であるいくつかの標準的な手順が存在する。いくつかの実施形態において、サンプルを遠心分離して、様々な層を分離してもよい。いくつかの実施形態において、DNAは、濾過を用いて単離されてもよい。いくつかの実施形態において、DNAの調製は、増幅、分離、クロマトグラフィーによる精製、液液分離、単離、優先的濃縮、優先的増幅、標的化増幅、又は当該技術分野で知られているか、又は本明細書に記載されるいくつかの他の技術のいずれかを伴っていてもよい。
【0304】
いくつかの実施形態において、本開示の方法は、DNAを増幅することを伴っていてもよい。DNAの増幅、すなわち、少量の遺伝物質を、類似の遺伝子データセットを含むより大量の遺伝物質に変換するプロセスは、限定されないが、ポリメラーゼ連鎖反応(PCR)を含む、多種多様な方法によって行うことができる。DNAを増幅する1つの方法は、全ゲノム増幅(WGA)である。ライゲーション媒介PCR(LM-PCR)、変性オリゴヌクレオチドプライマーPCR(DOP-PCR)及び多重置換増幅(MDA)といった、WGAに利用可能ないくつかの方法が存在する。LM-PCRにおいて、アダプターと呼ばれる短いDNA配列を、DNAの平滑末端にライゲーションする。これらのアダプターは、PCRによってDNAを増幅するために使用されるユニバーサル増幅配列を含有する。DOP-PCRにおいて、ユニバーサル増幅配列も含有するランダムプライマーを、アニーリング及びPCRの第1ラウンドで使用する。次いで、第2ラウンドのPCRを使用して、更にユニバーサルプライマー配列を用い、配列を増幅させる。MDAは、phi-29ポリメラーゼを使用し、このポリメラーゼは、DNAを複製し、単一細胞分析に使用されてきた、高度なプロセッシブ非特異性酵素である。単一細胞からの材料の増幅に対する主な制限は、(1)極めて希釈されたDNA濃度又は極めて少量の反応混合物を使用する必要性、及び(2)ゲノム全体にわたってタンパク質からDNAを確実に解離させることの困難性である。それにもかかわらず、単一細胞全ゲノム増幅は、長年にわたって様々な用途のために成功裏に使用されてきた。他にもDNAサンプルからDNAを増幅する方法が存在する。DNA増幅は、DNAの初期サンプルを、配列のセットにおいて類似するがはるかに大きな量のDNAのサンプルに変換する。ある場合に、増幅は、必要とされないことがある。
【0305】
いくつかの実施形態において、DNAは、WGA又はMDAなどのユニバーサル増幅を用いて増幅されてもよい。いくつかの実施形態において、DNAは、例えば、標的化PCR、又は環状化プローブを使用する標的化増幅によって増幅されてもよい。いくつかの実施形態において、DNAは、標的化増幅法、又は、ハイブリダイゼーションアプローチによる捕捉などの、所望されないDNAからの完全又は部分的な分離をもたらす方法を使用して、優先的に濃縮されてもよい。いくつかの実施形態において、DNAは、ユニバーサル増幅法及び優先的濃縮法の組み合わせを使用することによって増幅されてもよい。これらの方法のいくつかのより完全な説明は、本文書の別の箇所に見出すことができる。
【0306】
標的個体及び/又は関連個体の遺伝子データは、これらに限定されないが、遺伝子型決定マイクロアレイ及び高スループット配列決定を含む群から得られるツール及び/又は技術を使用して、適切な遺伝子材料を測定することによって、分子状態から電子状態に変換され得る。いくつかの高スループット配列決定法としては、Sanger DNA配列決定、パイロシーケンシング、ILLUMINA SOLEXAプラットフォーム、ILLUMINAのゲノムアナライザ、又はAPPLIED BIOSYSTEMの454配列決定プラットフォーム、HELICOSのTRUE SINGLE MOLECULE SEQUENCINGプラットフォーム、HALCYON MOLECULARの電子顕微鏡配列決定法、又は任意の他の配列決定法が挙げられる。これらの方法は全て、DNAのサンプルに格納された遺伝子データを、処理される途中のメモリデバイスに典型的に格納される遺伝子データのセットに物理的に変換する。
【0307】
関連する個体の遺伝子データは、これらに限定されないが、個体のバルク二倍体組織、個体からの1つ以上の二倍体細胞、個体からの1つ以上のハプロイド細胞、標的個体からの1つ以上の芽球、個体上に見出される細胞外遺伝物質、母体血液中に見出される個体からの細胞外遺伝物質、母体血液中に見出される個体からの細胞、関連する個体からの(a)配偶子(複数可)から生成される1つ以上の胚、そのような胚から得られる1つ以上の芽球、関連する個体上に見出される細胞外遺伝物質、関連する個体に由来することが知られている遺伝物質、及びそれらの組み合わせを含む群から得られる物質を分析することによって測定され得る。
【0308】
いくつかの実施形態において、標的個体の対象の染色体タイプの各々について、少なくとも1つの倍数性状態仮説のセットを作成してもよい。倍数性状態仮説の各々は、標的個体の染色体又は染色体セグメントの1つの可能な倍数性状態を指し得る。仮説のセットは、標的個体の染色体が有すると予想され得る可能性のある倍数性状態のいくつか又は全てを含み得る。考えられる倍数性状態のいくつかは、ヌルソミー、モノソミー、ダイソミー、単親ダイソミー、正倍数体、トリソミー、適合トリソミー、不適合トリソミー、母体トリソミー、父体トリソミー、テトラソミー、バランスの取れた(2:2)テトラソミー、不均衡(3:1)テトラソミー、ペンタソミー、ヘキサソミー、他の異数体、及びそれらの組み合わせを含み得る。これらの異数体状態のいずれかは、不均衡転座、均衡転座、ロバートソン転座、組換え、欠失、挿入、乗換え、及びそれらの組み合わせなどの混合又は部分的な異数体であってもよい。
【0309】
いくつかの実施形態において、決定された倍数性状態の知識を使用して、臨床決定を行ってもよい。この知識は、典型的には、メモリデバイス内の物質の物理的な配置として格納され、次いで、報告に変換され得る。次いで、報告書に対応され得る。例えば、臨床的決定は、妊娠を終了することであってもよく、代替的に、臨床的決定は、妊娠を継続することであってもよい。いくつかの実施形態において、臨床上の決定は、遺伝性障害の表現型の提示の重症度を減らすように設計された介入、又は特別なニーズのある子供のために準備するための関連する工程をとる決定を伴っていてもよい。
【0310】
本開示の一実施形態において、本明細書に記載される方法のいずれかは、複数の標的が同じ標的個体、例えば、同じ妊娠中の母親からの複数の採血に由来することを可能にするように修正されてもよい。これは、複数の遺伝子測定が、標的遺伝子型が決定され得るより多くのデータを提供し得るので、モデルの精度を改善し得る。一実施形態において、一方の標的遺伝子データのセットは、報告された一次データとして機能し、他方のセットは、一次標的遺伝子データをダブルチェックするためのデータとして機能した。一実施形態において、標的個体から採取された遺伝物質から各々測定された複数の遺伝子データのセットが並行して考慮され、したがって、標的遺伝子データの両方のセットは、高精度に測定された親遺伝子データのどのセクションが胎児ゲノムを構成するかを決定するのに役立つ。
【0311】
一実施形態において、本方法は、父子鑑定の目的のために使用されてもよい。例えば、母親からのSNPベースの遺伝子型情報、及び遺伝的な父親であってもよく、又はそうでなくてもよい男性からのSNPベースの遺伝子型情報、及び混合サンプルからの測定された遺伝子型情報を考慮すると、男性の遺伝子型情報が実際に妊娠中の胎児の実際の遺伝的な父親を表しているかどうかを決定することが可能である。これを行う簡単な方法は、母親がAAであり、父親がAB又はBBである可能性のあるコンテキストを単に見ることである。これらの場合、それぞれ、父親の貢献の半分(AA|AB)又は全て(AA|BB)を見ることが予測され得る。予測されるADOを考慮すると、観察される胎児SNPが可能な父親のSNPと相関しているかどうかを決定することは容易である。
【0312】
本開示の一実施形態は、以下の通りであり得る。妊婦の胎児がダウン症に罹患しているかどうか、及び/又は妊婦の胎児が嚢胞性線維症に罹患しているかどうかを知りたがっており、妊婦はこれらの状態のいずれかに罹患している子供を産むことを望まない。医師は妊婦の血液を採取し、ヘモグロビンを1つのマーカーで染色してはっきりと赤く見えるようにし、核物質を別のマーカーで染色してはっきりと青く見えるようにする。医師は、母親の赤血球が典型的には無核であることを知っているが、胎児細胞の高い割合は核を含むため、赤色及び青色の両方を示す細胞を特定することによって、いくつかの有核赤血球を視覚的に単離することができる。医師は、これらの細胞をマイクロマニピュレータでスライドから取り出し、ラボに送り、10個の個々の細胞を増幅して遺伝子型決定する。遺伝子測定を用いることにより、PARENTAL SUPPORT(商標)は、10個の細胞のうち6個が母体血液細胞であり、10個の細胞のうち4個が胎児細胞であることを決定することができる。子供が既に妊娠中の母親から出産している場合、PARENTAL SUPPORT(商標)を使用して、胎児細胞に信頼性の高い対立遺伝子をコールし、それらが出生した子供の細胞と異なることを示すことによって、胎児細胞が出生した子供の細胞と異なることを決定することもできる。この方法は、本開示の父系検査の実施形態と概念が類似していることに留意されたい。胎児細胞から測定された遺伝子データは、単一細胞の遺伝子型決定の困難さに起因して、多くの対立遺伝子ドロップアウトを含む、非常に低品質であり得る。臨床医は、測定された胎児DNAを、親の信頼性の高いDNA測定値とともに使用して、PARENTAL SUPPORT(商標)を使用して胎児のゲノムの態様を高精度に推測することができ、それによって、胎児からの遺伝物質に含まれる遺伝子データを、コンピュータに格納された胎児の予測される遺伝子状態に変換する。臨床医は、胎児の倍数性状態と、目的の複数の疾患関連遺伝子の有無との両方を決定することができる。胎児は正倍数体であり、嚢胞性線維症の担体ではないことが判明し、母親は妊娠を継続することを決定した。
【0313】
本開示の一実施形態において、妊娠中の母親は、彼女の胎児が任意の全染色体異常に罹患しているかどうかを決定したいと考える。妊婦は医者に行き、血液のサンプルを提供し、妊婦及び妊婦の夫は頬の綿棒から自分自身のDNAのサンプルを提供する。実験室の研究者は、親DNAを増幅するためにMDAプロトコルを使用して親DNAを遺伝子型決定し、多数のSNPで親の遺伝子データを測定するためにILLUMINA INFINIUMアレイを用いる。その後、研究者は血液を回転させ、血漿を採取し、サイズ排除クロマトグラフィーを使用して遊離浮遊DNAのサンプルを単離する。代替的に、研究者は、核を有する胎児赤血球を単離するために、胎児ヘモグロビンに特異的なものなどの1つ以上の蛍光抗体を使用する。次いで、研究者は、単離された又は濃縮された胎児遺伝物質を取り、各オリゴヌクレオチドの2つの末端が標的対立遺伝子のいずれかの側の隣接配列に対応するように適切に設計された70量体オリゴヌクレオチドのライブラリを使用して増幅する。ポリメラーゼ、リガーゼ、及び適切な試薬を添加すると、オリゴヌクレオチドはギャップ充填環化を受け、所望の対立遺伝子を捕捉した。エキソヌクレアーゼを添加し、熱不活性化し、生成物をPCR増幅のための鋳型として直接使用した。PCR産物をILLUMINAゲノムアナライザで配列決定した。配列リードを、次いで胎児の倍数性状態を予測したPARENTAL SUPPORT(商標)方法の入力として使用した。
【0314】
別の実施形態において、妊娠している母親であり、高齢の母親であるカップルは、妊娠中の胎児がダウン症候群、ターナー症候群、プラダーウィリ症候群、又はいくつかの他の全染色体異常を有するかどうかを知りたい。産科医は、母親及び父親から採血する。血液は研究室に送られ、技術者が母体サンプルを遠心分離して血漿とバフィーコートを分離する。バフィーコート及び父系血液サンプル中のDNAは、増幅によって形質転換され、増幅された遺伝物質にコードされた遺伝子データは、高スループットシーケンサ上で遺伝物質を実行して親遺伝子型を測定することによって、分子的に格納された遺伝データから電子的に格納された遺伝データに更に形質転換される。血漿サンプルは、5,000プレックスの半ネスト標的化PCR法を使用して、遺伝子座のセットで優先的に濃縮される。DNAフラグメントの混合物を、配列決定に適したDNAライブラリに調製する。次いで、DNAを、高スループット配列決定方法、例えば、ILLUMINA GAIIxゲノムアナライザを使用して配列決定する。配列決定は、DNAで分子的に符号化された情報を、コンピュータハードウェアで電子的に符号化された情報に変換する。PARENTAL SUPPORT(商標)などの本開示される実施形態を含む情報学に基づく技術を使用して、胎児の倍数性状態を決定してもよい。これは、コンピュータで、調製されたサンプル上で行われたDNA測定から、複数の多型遺伝子座での対立遺伝子数の確率を計算することと、コンピュータで、染色体の異なる可能な倍数性状態に各々関連する複数の倍数性仮説を作成することと、コンピュータで、各倍数性仮説についての染色体上の複数の多型遺伝子座での予測される対立遺伝子数の結合分布モデルを構築することと、コンピュータで、結合分布モデル及び調製されたサンプル上で測定された対立遺伝子数を使用して、複数の倍数性仮説の各々の相対確率を決定することと、最大確率を有する仮説に対応する倍数性状態を選択することによって、胎児の倍数性状態をコールすることと、を伴っていてもよい。胎児はダウン症候群であると決定される。報告書が印刷されるか、妊婦の産科医に電子的に送信され、診断書が女性に送信される。女性、夫、医者は座って、選択肢について話し合う。夫婦は、胎児がトリソミー状態に罹患しているという知識に基づいて、妊娠を終了することを決定する。
【0315】
一実施形態において、企業は、母体の採血から妊娠中の胎児の異数性を検出するように設計された診断技術を提供することを決定し得る。彼らの製品には、母親が産科医に血液を採取する可能性がある。産科医はまた、胎児の父親から遺伝子サンプルを収集してもよい。医師は、母体血液から血漿を単離し、血漿からDNAを精製してもよい。医師はまた、母体血液からバフィーコート層を単離し、バフィーコートからDNAを調製してもよい。医師はまた、父系遺伝子サンプルからDNAを調製してもよい。臨床医は、本開示に記載の分子生物学技術を使用して、血漿サンプルに由来するDNA中のDNAにユニバーサル増幅タグを付加し得る。臨床医は、普遍的にタグ付けされたDNAを増幅してもよい。臨床医は、ハイブリダイゼーションによる捕捉及び標的化PCRを含むいくつかの技術によってDNAを優先的に濃縮し得る。標的化PCRは、ネスティング、半ネスティング若しくは半ネスティング、又は血漿由来DNAの効率的な濃縮をもたらす任意の他のアプローチを含んでもよい。標的化PCRは、例えば、1つの反応において10,000のプライマーと大規模に多重化されてもよく、プライマーは、染色体13、18、21、X、及びXとYの両方に共通であるそれらの遺伝子座上のSNP、並びに任意選択で他の染色体も標的化する。選択的な濃縮及び/又は増幅は、各々の個々の分子を、異なるタグ、分子バーコード、増幅のためのタグ及び/又は配列決定のためのタグを用いてタグ化することを伴っていてもよい。次いで、臨床医は、血漿サンプル、及び場合によっては、調製された母体DNA及び/又は父体DNAを配列決定してもよい。分子生物学的工程は、全体的に又は部分的に、診断ボックスによって実行されてもよい。配列データは、単一のコンピュータに、又は「クラウド」に見出され得るような別のタイプのコンピューティングプラットフォームに供給されてもよい。コンピューティングプラットフォームは、シーケンサによって行われた測定から、標的多型遺伝子座での対立遺伝子数を計算し得る。コンピューティングプラットフォームは、染色体13、18、21、X、及びYの各々について、ヌルソミー、モノソミー、ダイソミー、マッチするトリソミー、及びマッチしないトリソミーに関連する複数の倍数性仮説を作成し得る。コンピューティングプラットフォームは、調べられる5つの染色体の各々についての各倍数性仮説についての染色体上の標的遺伝子座での対立遺伝子数の予測される対立遺伝子数の結合分布モデルを構築し得る。コンピューティングプラットフォームは、結合分布モデル及び血漿サンプルに由来する優先的に濃縮されたDNAについて測定された対立遺伝子数を用いて、倍数性仮説の各々が真である確率を決定し得る。コンピューティングプラットフォームは、最大確率を有するゲルマン仮説に対応する倍数性状態を選択することによって、染色体13、18、21、X、及びYの各々について、胎児の倍数性状態をコールし得る。コールされた倍数性状態を含む報告書を作成してもよく、これを産科医に電子的に送信し、出力デバイスで表示し、又は報告書の印刷されたハードコピーを産科医に届けてもよい。産科医は、患者及び任意選択で胎児の父親に通知することができ、どの臨床的選択肢が彼らに開放され、どの選択肢が最も望ましいかを決定することができる。
【0316】
別の実施形態において、妊婦(以下「母親」と称する)は、彼女の胎児(複数可)が任意の遺伝的異常又は他の状態を有するかどうかを知りたいと判断してもよい。妊娠を継続する自信がある前に、重大な異常がないことを確認したい可能性がある。母親は産科医に行き、血液のサンプルを採取されるかもしれない。産科医はまた、彼女の頬から頬の綿棒などの遺伝子サンプルを採取するかもしれない。また、口腔スワブ、精子サンプル、血液サンプルなど、胎児の父親から遺伝子サンプルを採取するかもしれない。父親は、サンプルを臨床医に送ることができる。臨床医は、母体血液サンプル中の遊離浮遊胎児DNAの画分を濃縮し得る。臨床医は、母体血液サンプル中の除核された胎児血液細胞の画分を濃縮し得る。臨床医は、胎児の遺伝子データを決定するために、本明細書に記載される方法の様々な態様を使用してもよい。その遺伝子データは、胎児の倍数性状態、及び/又は胎児内の1つ又はいくつかの疾患関連対立遺伝子の同一性を含み得る。出生前診断の結果をまとめた報告書が作成されることもある。報告書は、医師に送信又は郵送することができ、医師は母親に胎児の遺伝子状態を伝えることができる。母親は、胎児が1つ以上の染色体、又は遺伝的異常、又は望ましくない状態を有するという事実に基づいて、妊娠を中止することを決定することができる。母親はまた、胎児が大まかな染色体又は遺伝子異常、又は目的の遺伝子疾患を有しないという事実に基づいて妊娠を継続することを決定することができる。
【0317】
別の例は、精子提供者によって人工的に授精され、妊娠している妊婦を伴っていてもよい。母親は、妊娠中の胎児が遺伝子疾患に罹患するリスクを最小限に抑えたい。母親は、血液採取医で採取された血液を有し、本開示に記載の技術を使用して、3つの有核胎児赤血球を単離し、組織サンプルも母親及び遺伝的父親から収集する。胎児及び母親及び父親からの遺伝物質を、適切に増幅し、ILLUMINA INFINIUM BEADARRAYを使用して遺伝子型決定し、本明細書に記載される方法は、高精度に親及び胎児の遺伝子型が清浄化され、位相が決定され、胎児の倍数性コールが行われる。胎児は正倍数体であることがわかり、再構成された胎児遺伝子型から表現型感受性が予測され、報告書が作成され、母親の医師に送られ、どの臨床的決定が最善であるかを決定できる。
【0318】
一実施形態において、母親及び父親の生の遺伝物質は、増幅によって、配列が類似しているが量が多いDNAの量に変換される。次いで、遺伝子型決定方法によって、核酸によってコードされる遺伝子型データは、上記のようなメモリデバイス上に物理的及び/又は電子的に格納され得る遺伝子測定値に変換される。本明細書で詳細に論じられる、PARENTAL SUPPORT(商標)アルゴリズムを構成する関連するアルゴリズムは、プログラミング言語を使用して、コンピュータプログラムに変換される。次いで、コンピュータハードウェア上でコンピュータプログラムを実行することによって、生の測定データを表すパターンに配置された物理的に符号化されたビット及びバイトである代わりに、それらは、胎児の倍数性状態の高い信頼性決定を表すパターンに変換される。この変換の詳細は、データ自体、及び本明細書に記載される方法を実行するために使用されるコンピュータ言語及びハードウェアシステムに依存する。次に、胎児の高品質の倍数体決定を表すように物理的に構成されたデータは、医療従事者に送信され得る報告書に変換される。この変換は、プリンタ又はコンピュータディスプレイを使用して行われてもよい。報告書は、印刷されたコピー、紙又は他の適切な媒体であってもよく、そうでなければ、電子的なものであってもよい。電子報告書の場合、送信されてもよく、医療従事者がアクセス可能なコンピュータ上の場所にあるメモリデバイスに物理的に格納されてもよく、また、読み取られてもよいように画面に表示されてもよい。スクリーンディスプレイの場合、データは、ディスプレイデバイス上のピクセルの物理的変換を引き起こすことによって、読み取り可能なフォーマットに変換されてもよい。変換は、光子を放出又は吸収する基板の前にあり得るスクリーン上の特定の画素セットの透明度を物理的に変化させる電荷を変更することによって、リン光スクリーンで電子を物理的に発射することによって達成され得る。この変換は、液晶中の分子のナノスケール配向を、例えば、特定のピクセルのセットで、ネマチック相からコレステリス相又は近接相に変更することによって達成されてもよい。この変換は、有意義なパターンに配置された複数の発光ダイオードから作られた特定の画素セットから光子を放出させる電流によって達成され得る。この変換は、情報を表示するために使用される任意の他の方法、例えば、コンピュータ画面、又は情報を送信するいくつかの他の出力デバイス又は方法によって達成されてもよい。次に、医療従事者は、報告内のデータがアクションに変換されるように、報告に基づいてアクションを実行し得る。アクションは、妊娠を継続又は中止することであり得、その場合、遺伝子異常を有する妊娠中の胎児は、非生存の胎児に変換される。本明細書に列挙される変換は、例えば、本開示に概説されるいくつかの工程を通じて、妊娠中の母親及び父親の遺伝物質を、遺伝子異常を有する胎児を中絶することからなる、又は妊娠を継続することからなる医学的決定に変換することができるように、集約されてもよい。代替的に、遺伝子型測定値のセットを、医師が妊娠中の患者を治療するのに役立つ報告に変換することができる。
【0319】
本開示の一実施形態において、本明細書に記載される方法を使用して、宿主母親、すなわち妊娠している女性が、彼女が妊娠している胎児の生物学的母親ではない場合でも、胎児の倍数性状態を決定することができる。本開示の一実施形態において、本明細書に記載の方法を使用して、母体血液サンプルのみを使用し、父系遺伝子サンプルを必要とせずに、胎児の倍数性状態を決定することができる。
【0320】
本明細書に開示される実施形態における数学のいくつかは、異数性の状態の限られた数に関する仮説を立てる。いくつかの場合において、例えば、0、1つ、又は2つの染色体のみが、それぞれの親に由来することが予測される。本開示のいくつかの実施形態において、数学的導出は、本開示の基本的な概念を変更することなく、3つの染色体が一方の親に由来するクアドロソミー、ペンタソミー、ヘキサソミーなどの他の形態の異数体を考慮に入れるように拡張され得る。同時に、より少ない数の倍数性状態、例えば、トリソミー及びダイソミーのみに焦点を当てることが可能である。染色体の非全数を示す倍数決定は、遺伝物質のサンプル中のモザイクを示し得ることに留意されたい。
【0321】
いくつかの実施形態において、遺伝子異常は、ダウン症候群(又は21トリソミー)、エドワーズ症候群(18トリソミー)、パトー症候群(13トリソミー)、ターナー症候群(45x)、クラインフェルター症候群(2つの染色体を有する男性)、プラダー-ウィリー症候群、及びディジョージ症候群(UPD15)などの異数性の一種である。先行文に列挙されているような先天性障害は、一般的に望ましくなく、胎児が1つ以上の表現型異常に罹患しているという知識は、妊娠を中止するか、特別なニーズのある子供の出産を準備するために必要な予防措置を講じるか、又は染色体異常の重症度を軽減することを意図したいくつかの治療的アプローチを講じることを決定するための基礎を提供し得る。
【0322】
いくつかの実施形態において、本明細書に記載される方法は、非常に早い妊娠期間、例えば、早ければ4週間、早ければ5週間、早ければ6週間、早ければ7週間、早ければ8週間、早ければ9週間、早ければ10週間、早ければ11週間、及び早ければ12週間で使用することができる。
【0323】
宿主に寄生しているがんに由来するDNAは、宿主の血液中に見出すことができることが実証されていることに留意されたい。母体血液中に見出される混合DNAの測定から遺伝子診断を行うことができるのと同様に、宿主血液中に見出される混合DNAの測定から同様に遺伝子診断を行うことができる。遺伝的診断には、異数性状態、又は遺伝子変異が含まれ得る。母体血液で行われた測定から胎児の倍数性状態又は遺伝子状態を決定することについて読む本開示のいずれの請求項も、宿主血液での測定からがんの倍数性状態又は遺伝子状態を決定することについても同様によく読むことができる。
【0324】
いくつかの実施形態において、本開示の方法は、がんの倍数性状態を決定することを可能にし、本方法は、宿主からの遺伝物質及びがんからの遺伝物質を含む混合サンプルを得ることと、混合サンプル中のDNAを測定することと、混合サンプル中のがん由来のDNAの画分を計算することと、混合サンプル及び計算された画分に対して行われた測定を使用して、がんの倍数性状態を決定することと、を含む。いくつかの実施形態において、本方法は、がんの倍数性状態の決定に基づいてがん治療剤を投与することを更に含んでもよい。いくつかの実施形態において、本方法は、がんの倍数性状態の決定に基づいてがん治療薬を投与することを更に含み得、がん治療薬は、医薬、生物学的治療薬、及び抗体ベースの治療薬並びにそれらの組み合わせを含む群から採取される。
【0325】
いくつかの実施形態において、本明細書に開示される方法は、インビトロ受精中の胚選択のための着床前遺伝子診断(PGD)の文脈において使用され、標的個体は、胚であり、親遺伝子型データは、3日目の胚からの単一若しくは2つの細胞生検又は5日目若しくは6日目の胚からのトロフェクトダーム生検からのデータを配列決定することから、胚についての倍数性決定を行うために使用され得る。PGD設定では、子供のDNAのみが測定され、少数の細胞のみが試験され、一般的には1~5個であるが、10個、20個又は50個もの細胞が試験される。次いで、A及びB対立遺伝子の開始コピーの総数(SNPで)は、子の遺伝子型及び細胞の数によってわずかに決定される。NPDにおいて、開始コピーの数は非常に高く、したがって、PCR後の対立遺伝子比率は、開始比率を正確に反映することが予測される。しかしながら、PGDにおける開始コピーの数が少ないことは、汚染及び不完全なPCR効率が、PCR後の対立遺伝子比率に取るに足りない効果を有することを意味する。この効果は、配列決定後に測定される対立遺伝子比率の分散を予測することにおいて、リード深度よりも重要であり得る。既知の子の遺伝子型を与えられた測定された対立遺伝子比の分布は、PCRプローブ効率及び汚染の確率に基づいて、PCRプロセスのモンテカルロシミュレーションによって作成されてもよい。各尤度のある子の遺伝子型の対立遺伝子比率分布を考慮すると、様々な仮説の尤度は、NIPDについて記載されているように計算することができる。
【0326】
本明細書に開示される実施形態のいずれかは、デジタル電子回路、集積回路、特別に設計されたASIC(特定用途向け集積回路)、コンピュータハードウェア、ファームウェア、ソフトウェア、又はそれらの組み合わせで実装されてもよい。本明細書に開示される実施形態の装置は、プログラマブルプロセッサによって実行されるために機械可読ストレージデバイスに具体化されるコンピュータプログラム製品に実装され得、本明細書に開示される実施形態の方法工程は、入力データを操作し、出力を生成することによって本明細書に開示される実施形態の機能を実行するための命令のプログラムを実行するプログラマブルプロセッサによって実行され得る。本明細書に開示される実施形態は、記憶システム、少なくとも1つの入力デバイス、及び少なくとも1つの出力デバイスからデータ及び命令を受信し、及びそれらにデータ及び命令を送信するように結合された、特殊又は汎用であり得る少なくとも1つのプログラム可能プロセッサを含むプログラム可能システム上で実行可能及び/又は解釈可能である1つ以上のコンピュータプログラムにおいて有利に実装することができる。各々のコンピュータプログラムは、高度な手続き型又はオブジェクト指向のプログラミング言語で、又は所望される場合、アセンブリ又は機械言語で実装されてもよく、いずれの場合も、言語は、コンパイルされた又は解釈された言語であってもよい。コンピュータプログラムは、スタンドアロンプログラムとして、又はモジュール、コンポーネント、サブルーチン、又はコンピューティング環境での使用に適した他のユニットとしてなど、任意の形態で展開され得る。コンピュータプログラムは、1つのサイトに、又は複数のサイトにわたって分散され、かつ通信ネットワークによって相互接続される1つのコンピュータ又は複数のコンピュータ上で実行されるか又は解釈されるように展開され得る。
【0327】
本明細書で使用されるとき、コンピュータ可読記憶媒体は、(シグナルとは対照的に)物理的若しくは有形の記憶装置を指し、コンピュータ可読命令、データ構造、プログラムモジュール若しくは他のデータなどの情報の有形記憶のための任意の方法若しくは技術において実装される揮発性及び不揮発性、取り外し可能及び取り外し不可能な媒体を含むが、これらに限定されない。コンピュータ可読記憶媒体は、限定されないが、RAM、ROM、EPROM、EEPROM、フラッシュメモリ又は他のソリッドステートメモリ技術、CD-ROM、DVD、又は他の光学記憶装置、磁気カセット、磁気テープ、磁気ディスク記憶装置又は他の磁気記憶装置、又は所望の情報又はデータ又は命令を有形に記憶するために使用され得、コンピュータ又はプロセッサによってアクセスされ得る任意の他の物理的又は材料媒体を含む。
【0328】
本明細書に記載される方法のいずれかは、例えば、コンピュータ画面上又は印刷した紙の上などの物理的なフォーマットでのデータの出力を含んでいてもよい。本明細書の他の場所の任意の実施形態の説明では、説明された方法は、医師によって作業され得るフォーマットで作業可能なデータの出力と組み合わせられてもよいことを理解されたい。これに加えて、記載される方法は、臨床的な治療をもたらす臨床決定の実際の実施、又は何の行動も取らないという臨床決定の実施と組み合わせられてもよい。標的個体に関する遺伝子データを決定するための本文書に記載される実施形態のいくつかは、IVFの文脈において移植するための1つ以上の胚を選択することを決定することと組み合わせられてもよく、任意選択で、胚を前向きな母親の子宮に移植することと組み合わせられてもよい。標的個体に関する遺伝子データを決定するための本文書に記載される実施形態のいくつかは、医療従事者によって、潜在的な染色体異常、又はそれを欠くことの通知と組み合わせられてもよく、任意選択で、出生前診断の文脈において胎児の中絶を行うか、若しくは行わないかの決定と組み合わされてもよい。本明細書に記載される実施形態のいくつかは、作業可能なデータの出力、臨床的な治療をもたらす臨床決定の実施、又は何の行動も取らないという臨床決定の実施と組み合わせられてもよい。
【0329】
標的化濃縮及び配列決定
非侵襲的な出生前対立遺伝子コール又は倍数性コールのための方法の一部としての配列決定に続く、標的遺伝子座のセットでのDNAのサンプルを濃縮するための技術の使用は、いくつかの予期しない利点を付与し得る。本開示のいくつかの実施形態において、本方法は、PARENTAL SUPPORT(登録商標)(PS)などの情報学に基づく方法とともに使用するための遺伝子データを測定することを伴う。実施形態のいくつかの最終的な結果は、胚又は胎児の実行可能な遺伝子データである。具体化された方法の一部として、個体及び/又は関連する個体の遺伝子データを測定するために使用され得る多くの方法がある。一実施形態において、標的対立遺伝子のセットの濃度を濃縮するための方法が本明細書に開示され、本方法は、以下の工程:遺伝物質の標的化増幅、遺伝子座特異性オリゴヌクレオチドプローブの添加、特定のDNA鎖のライゲーション、所望のDNAのセットの単離、反応の望ましくない成分の除去、ハイブリダイゼーションによる特定のDNA配列の検出、及びDNA配列決定法による1つ又は複数のDNA鎖の配列の検出のうちの1つ以上を含む。いくつかの場合において、DNA鎖は、標的遺伝物質を指してもよく、いくつかの場合において、それらは、プライマーを指してもよく、いくつかの場合において、それらは、合成された配列、又はそれらの組み合わせを指してもよい。これらの工程は、いくつかの異なる順序で行われてもよい。分子生物学の非常に多様な性質を考慮すると、一般に、どの方法、及びどの工程の組み合わせが、様々な状況で乏しく、良好に、又は最良に実行されるかは明らかではない。
【0330】
例えば、標的化増幅前のDNAのユニバーサル増幅工程は、ボトルネックのリスクを除去し、対立遺伝子バイアスを低減するなど、いくつかの利点を付与し得る。DNAは、いずれかの側に1つの標的配列の2つの隣接する領域とハイブリダイズすることができるオリゴヌクレオチドプローブを混合してもよい。ハイブリダイゼーションの後、プローブの末端は、ポリメラーゼ、ライゲーションのための手段、及びプローブの環化を可能にする任意の必要な試薬を添加することによって接続され得る。環化後、エキソヌクレアーゼを添加して、非環化遺伝物質を消化し、続いて環化プローブを検出してもよい。DNAは、いずれかの側に1つの標的配列の2つの隣接する領域とハイブリダイズすることができるPCRプライマーと混合されてもよい。ハイブリダイゼーションの後、プローブの末端は、ポリメラーゼ、ライゲーションのための手段、及びPCR増幅を完了するために任意の必要な試薬を添加することによって接続され得る。増幅されたDNA又は非増幅DNAは、遺伝子座のセットを標的化するハイブリッド捕捉プローブによって標的化されてもよく、ハイブリダイゼーション後、プローブを局在化し、混合物から分離して、標的配列において濃縮されたDNAの混合物を提供してもよい。
【0331】
いくつかの実施形態において、標的遺伝物質の検出は、多重化された方法で行われてもよい。並行して行われ得る遺伝子標的配列の数は、1~10、10~100、100~1000、1000~1万、1万~10万、10万~100万又は100万~1000万の範囲であってもよい。先行技術は、最大約50個又は100個のプライマーのプールを含む成功した多重化PCR反応の開示を含み、それ以上ではないことに留意されたい。1プール当たり100個を超えるプライマーを多重化する従来の試みは、プライマーダイマー形成などの望ましくない副反応を伴う顕著な問題を生じていた。
【0332】
いくつかの実施形態において、この方法は、単一の細胞、少数の細胞、2~5個の細胞、6~10個の細胞、10~20個の細胞、20~50個の細胞、50~100個の細胞、100~1000個の細胞、又は少量の細胞外DNA、例えば、1~10ピコグラム、10~100ピクトグラム、100ピクトグラム~1ナノグラム、1~10ナノグラム、10~100ナノグラム、又は100ナノグラム~1マイクログラムを遺伝子型決定するために使用され得る。
【0333】
ある特定の遺伝子座を標的化する方法の使用、続いて対立遺伝子コール又は倍数性コールのための方法の一部としての配列決定は、いくつかの予期しない利点を付与し得る。DNAが標的化され得るか、又は優先的に濃縮され得るいくつかの方法は、環状化プローブ、連結された反転プローブ(LIP、MIP)、SURESELECTなどのハイブリダイゼーション方法による捕捉、及び標的化PCR又はライゲーション媒介PCR増幅戦略を使用することを含む。
【0334】
いくつかの実施形態において、本開示の方法は、PARENTAL SUPPORT(登録商標)(PS)などの情報学に基づく方法とともに使用するための遺伝子データを測定することを伴う。PARENTAL SUPPORT(商標)は、遺伝子データを操作するための情報学ベースのアプローチであり、その態様は、本明細書に記載されている。実施形態のいくつかの最終的な結果は、胚又は胎児の実用可能な遺伝子データであり、その後、実用可能なデータに基づいて臨床的決定が行われる。PS法の背後にあるアルゴリズムは、標的個体(多くの場合、胚又は胎児)の測定された遺伝子データ、及び関連個体からの測定された遺伝子データを取り、標的個体の遺伝子状態が知られている精度を高めることができる。一実施形態において、測定された遺伝子データは、出生前の遺伝子診断中に倍数性の決定を行うという文脈において使用される。一実施形態において、測定された遺伝子データは、インビトロ受精中に胚に対して倍数決定又は対立遺伝子コールを行うという文脈において使用される。前述の文脈において、個体及び/又は関連する個体の遺伝子データを測定するために使用され得る多くの方法がある。異なる方法は、いくつかの工程を含み、それらの工程は、多くの場合、遺伝物質の増幅、オリゴヌクレオチドプローブの添加、特定のDNA鎖のライゲーション、所望のDNAのセットの単離、反応の望ましくない成分の除去、ハイブリダイゼーションによるDNAの特定の配列の検出、DNA配列決定方法による1つ又は複数のDNA鎖の配列の検出を伴う。いくつかの場合において、DNA鎖は、標的遺伝物質を指してもよく、いくつかの場合において、それらは、プライマーを指してもよく、いくつかの場合において、それらは、合成された配列、又はそれらの組み合わせを指してもよい。これらの工程は、いくつかの異なる順序で行われてもよい。分子生物学の非常に多様な性質を考慮すると、一般に、どの方法、及びどの工程の組み合わせが、様々な状況で乏しく、良好に、又は最良に実行されるかは明らかではない。
【0335】
理論的には、1つの遺伝子座から100万をはるかに超える遺伝子座まで、ゲノム内の任意の数の遺伝子座を標的化することが可能であることに留意されたい。DNAのサンプルが標的化され、次いで配列決定される場合、シーケンサによって読み取られる対立遺伝子のパーセンテージは、サンプル中のそれらの天然存在量に関して濃縮される。濃縮度は、1%(又はそれ以下)から10倍、100倍、1000倍、又は1000万倍であってもよい。ヒトゲノムには、およそ30億の塩基対、及び約7500万の多型遺伝子座を含むヌクレオチドが存在する。標的化される遺伝子座が多いほど、濃縮度が低くなる。標的化される遺伝子座の数が少ないほど、より大きな濃縮度が可能であり、所与の数の配列リードに対してそれらの遺伝子座においてより大きなリード深度が達成され得る。
【0336】
本開示の一実施形態において、標的化又は優先は、SNPに完全に焦点を合わせ得る。一実施形態において、標的化又は優先は、任意の多型部位に焦点を当てることができる。いくつかの市販の標的化製品が、エクソンを濃縮するために利用可能である。驚くべきことに、対立遺伝子分布に依存するNPDのための方法を使用する場合、排他的にSNP、又は排他的に多型遺伝子座を標的化することは特に有利である。配列決定を使用するNPDのための公開された方法、例えば、リードカウント分析を伴う米国特許第7,888,017号もあり、リードカウントは、所与の染色体にマッピングするリードの数をカウントすることに焦点を当て、分析された配列リードは、多型であるゲノムの領域に焦点を当てない。多型対立遺伝子に焦点を当てていないこれらのタイプの方法論は、対立遺伝子のセットの標的化又は優先的な濃縮からそれほど利益を得ることはないであろう。
【0337】
本開示の一実施形態において、ゲノムの多型領域における遺伝子サンプルを濃縮するためにSNPに焦点を当てた標的化方法を使用することが可能である。一実施形態において、少数のSNP、例えば、1~100のSNP、又はより大きな数、例えば、100~1,000、1,000~10,000、10,000~100,000、又は100,000を超えるSNPに焦点を当てることが可能である。一実施形態において、生体トリソミー出産と相関する1つ又は少数の染色体、例えば、染色体13、18、21、X及びY、又はそれらのいくつかの組み合わせに焦点を当てることが可能である。一実施形態において、標的SNPを、例えば1.01倍と100倍との間の小さな因子によって、又は例えば100倍と1,000,000倍との間のより大きな因子によって、又は1,000,000倍を超えてさえも、濃縮することが可能である。本開示の一実施形態において、ゲノムの多型領域において優先的に濃縮されるDNAのサンプルを作製するために、標的化方法を使用することが可能である。一実施形態において、この方法を使用して、DNAの混合物が母体DNAと、また遊離浮遊胎児DNAとを含む、これらの特徴のいずれかを有するDNAの混合物を作製することが可能である。一実施形態において、この方法を使用して、これらの因子の任意の組み合わせを有するDNAの混合物を作製することが可能である。例えば、本明細書に記載される方法を使用して、母体DNA及び胎児DNAを含み、200SNPに対応するDNAが優先的に濃縮されるDNAの混合物を生成してもよく、これらのDNAは全て、染色体18又は21のいずれかに位置し、平均1000倍濃縮されている。別の例では、この方法を使用して、染色体13、18、21、X及びY上に全て又は大部分が位置する10,000SNPで優先的に濃縮され、遺伝子座当たりの平均濃縮が500倍を超えるDNAの混合物を作製することが可能である。本明細書に記載される標的化方法のいずれかを使用して、特定の遺伝子座において優先的に濃縮されるDNAの混合物を作製することができる。
【0338】
いくつかの実施形態において、本開示の方法は、高スループットDNAシーケンサを使用して混合画分中のDNAを測定することを更に含み、混合画分中のDNAは、1つ以上の染色体からの不均衡な数の配列を含み、1つ以上の染色体は、染色体13、染色体18、染色体21、染色体X、染色体Y、及びそれらの組み合わせを含む群から採取される。
【0339】
多重PCR、ハイブリダイゼーションによる標的化捕捉、及び連結された反転プローブ(LIP)の3つの方法が本明細書に記載されており、これらは、胎児の異数性を検出するために、母体血漿サンプルから十分な数の多型遺伝子座から測定値を取得し、分析するために使用されてもよい。これは、標的遺伝子座の選択的濃縮の他の方法を除外することを意味するものではない。他の方法は、方法の本質を変更することなく同様によく使用され得る。それぞれの場合において、アッセイした多型は、一塩基多型(SNP)、小さいインデル、又はSTRを含み得る。好ましい方法は、SNPの使用を伴う。各アプローチは、対立遺伝子頻度データを生成し、各標的遺伝子座についての対立遺伝子頻度データ及び/又はこれらの遺伝子座からの結合対立遺伝子頻度分布を分析して、胎児の倍数性を決定し得る。各アプローチは、限られたソース材料と、母体血漿が母親及び胎児のDNAの混合物で構成されているという事実に起因して、独自の考慮事項を有する。この方法は、より正確な決定を提供するために、他のアプローチと組み合わせられてもよい。一実施形態において、この方法は、米国特許第7,888,017号に記載されているような配列カウントアプローチと組み合わせてもよい。記載されたアプローチを使用して、母体血漿サンプルから胎児の父性を非侵襲的に検出することもできる。加えて、各アプローチをDNA又は純粋なDNAサンプルの他の混合物に適用して、異数体染色体の有無を検出したり、分解されたDNAサンプルから多数のSNPを遺伝子型決定したり、セグメンタルコピー数変異(CNV)を検出したり、目的の他の遺伝子型状態、又はそれらのいくつかの組み合わせを検出したりすることができる。
【0340】
サンプル中の対立遺伝子分布の正確な測定
現在の配列決定アプローチを使用して、サンプル中の対立遺伝子の分布を推定することができる。そのような方法の1つは、ショットガン配列決定と呼ばれるプールDNAからのランダムサンプリング配列を伴う。配列決定データ中の特定の対立遺伝子の割合は、典型的には非常に低く、単純な統計によって決定することができる。ヒトゲノムは約30億塩基対を含有する。したがって、使用される配列決定方法が100bpのリードを行う場合、特定の対立遺伝子は、3000万の配列リードごとに約1回測定される。
【0341】
一実施形態において、本開示の方法を使用して、その染色体からの遺伝子座の測定された対立遺伝子分布からのDNAのサンプル中に同じ遺伝子座のセットを含有する2つ以上の異なるハプロタイプの有無を決定する。異なるハプロタイプは、1つの個体からの2つの異なる相同染色体、トリソミーの個体からの3つの異なる相同染色体、1つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの3つの異なる相同ハプロタイプ、1つ若しくは2つのハプロタイプが母親と胎児との間で共有される母親及び胎児からの3つ若しくは4つのハプロタイプ、又は他の組み合わせを表すことができる。ハプロタイプ間で多型性である対立遺伝子は、より有益である傾向があるが、母親及び父親が同じ対立遺伝子についてホモ接合性ではない任意の対立遺伝子は、単純なリードカウント分析から入手可能な情報を超える測定された対立遺伝子分布を通じて有用な情報をもたらす。
【0342】
しかしながら、そのようなサンプルのショットガン配列決定は、サンプル内の異なるハプロタイプ間で多型ではない、又は目的ではない染色体についての多くの配列をもたらし、したがって、標的ハプロタイプの割合に関する情報を明らかにしないため、極めて非効率的である。本明細書に記載されるのは、配列決定によって得られる対立遺伝子情報の収率を増加させるために、ゲノム内で多型である可能性がより高いサンプル中のDNAのセグメントを特異的に標的化する、及び/又は優先的に濃縮する方法である。濃縮されたサンプル中の測定された対立遺伝子分布が、標的個体中に存在する実際の量を真に表すためには、標的セグメント中の所与の遺伝子座における他の対立遺伝子と比較して、1つの対立遺伝子の優先的な濃縮がほとんど又はまったくないことが重要であることに留意されたい。多型対立遺伝子を標的化する当該技術分野で既知の現在の方法は、存在する任意の対立遺伝子の少なくともいくつかが検出されることを確実にするように設計される。しかしながら、これらの方法は、元の混合物中に存在する多型対立遺伝子の不偏の対立遺伝子分布を測定する目的で設計されていない。標的濃縮の任意の特定の方法が、測定された対立遺伝子分布が、他の任意の方法よりも元の非増幅サンプル中に存在する対立遺伝子分布を正確に表す濃縮サンプルを生成することができることは明らかではない。多くの濃縮方法が、理論的には、そのような目的を達成することが期待され得るが、当業者は、電流増幅、標的化、及び他の優先的な濃縮方法に多くの確率論的又は決定論的なバイアスが存在することをよく認識している。本明細書に記載される方法の一実施形態は、ゲノム中の所与の遺伝子座に対応するDNAの混合物中に見出される複数の対立遺伝子が増幅されるか、又は対立遺伝子の各々の濃縮度がほぼ同一であるような方法で優先的に濃縮されることを可能にする。別の言い方をすれば、この方法は、全体として混合物中に存在する対立遺伝子の相対量を増加させることを可能にするが、各遺伝子座に対応する対立遺伝子間の比率は、DNAの元の混合物中と本質的に同じままであることである。先行技術における遺伝子座の優先的な濃縮方法は、1%を超える、2%を超える、5%を超える、更に10%を超える対立遺伝子バイアスをもたらし得る。この優先的な濃縮は、ハイブリダイゼーションによる捕捉アプローチを使用する場合の捕捉バイアス、又は各サイクルについて小さい場合があるが、20、30、又は40サイクルにわたって複合される場合に大きい場合がある増幅バイアスに起因し得る。本開示の目的のために、比率が本質的に同じままであることは、元の混合物中の対立遺伝子の比率を、得られる混合物中の対立遺伝子の比率で割った値が、0.95~1.05、0.98~1.02、0.99~1.01、0.995~1.005、0.998~1.002、0.999~1.001、又は0.9999~1.0001であることを意味する。ここに提示される対立遺伝子比の計算は、標的個体の倍数性状態の決定に使用され得ず、対立遺伝子バイアスを測定するために使用されるメトリックのみであってもよいことに留意されたい。
【0343】
一実施形態において、混合物が標的遺伝子座のセットで優先的に濃縮されると、それは、クローンサンプル(単一分子から生成されたサンプル、例としては、ILLUMINA GAIIx、ILLUMINA HiSeq、Life Technologies SOLiD、5500XL)を配列決定する、以前、現在、又は次世代の配列決定器具のいずれか1つを使用して配列決定されてもよい。この比は、標的領域内の特定の対立遺伝子を介して配列決定することによって評価されてもよい。これらの配列決定リードは、対立遺伝子の種類及びそれに応じて決定された異なる対立遺伝子の比率に従って分析及びカウントされてもよい。長さが1~数塩基である変異については、対立遺伝子の検出は、配列決定によって行われ、配列決定リードが、その捕捉された分子の対立遺伝子組成を評価するために、問題の対立遺伝子にまたがることが不可欠である。遺伝子型についてアッセイされる捕捉された分子の総数は、配列決定リードの長さを増加させることによって増加させることができる。全ての分子の完全な配列決定は、濃縮プールで利用可能な最大量のデータの収集を保証する。しかしながら、配列決定は現在高価であり、より少ない数の配列リードを使用して対立遺伝子分布を測定することができる方法は、大きな価値を有するであろう。加えて、読み取り可能な最大長には技術的な制限があり、読み取り長が長くなると精度にも制限がある。最大有用性の対立遺伝子は、長さが1~数塩基であるが、理論的には、配列決定リードの長さより短い任意の対立遺伝子を使用することができる。対立遺伝子の変異は全てのタイプで生じるが、本明細書で提供される実施例は、わずか数個の隣接する塩基対を含有するSNP又はバリアントに焦点を当てる。セグメントコピー数バリアントなどのより大きなバリアントは、セグメント内部のSNPの全体の集合が複製されるため、多くの場合、これらのより小さなバリアントの集合によって検出することができる。STRなどのいくつかの塩基よりも大きいバリアントは特別な考慮を必要とし、いくつかの標的化アプローチは機能するが、他のものは機能しない。
【0344】
ゲノム内の1つ又は複数のバリアント位置を特異的に単離及び濃縮するために使用され得る複数の標的化アプローチが存在する。典型的には、これらは、バリアント配列に隣接する不変配列を利用することに依存する。基質が母体血漿である配列決定の文脈における標的化に関する先行技術がある(例えば、Liao et al.,Clin.Chem.2011;57(1):pp.92-101を参照のこと)。しかしながら、先行技術におけるアプローチは全て、エクソンを標的化する標的化プローブを使用し、ゲノムの多型性領域を標的化することに焦点を当てない。一実施形態において、本開示の方法は、多型性領域に排他的又はほぼ排他的に焦点を当てる標的化プローブを使用することを含む。一実施形態において、本開示の方法は、SNPに排他的又はほぼ排他的に焦点を当てる標的化プローブを使用することを含む。本開示のいくつかの実施形態において、標的多型性部位は、少なくとも10%のSNP、少なくとも20%のSNP、少なくとも30%のSNP、少なくとも40%のSNP、少なくとも50%のSNP、少なくとも60%のSNP、少なくとも70%のSNP、少なくとも80%のSNP、少なくとも90%のSNP、少なくとも95%のSNP、少なくとも98%のSNP、少なくとも99%のSNP、少なくとも99.9%のSNP、又は排他的にSNPからなる。
【0345】
一実施形態において、本開示の方法を使用して、遺伝子型(特定の遺伝子座におけるDNAの塩基組成)及びこれらの遺伝子型の相対割合を、DNA分子の混合物から決定することができ、これらのDNA分子は、1つ又は複数の遺伝子的に異なる個体に由来し得る。一実施形態において、本開示の方法を使用して、多型遺伝子座のセットでの遺伝子型、及びそれらの遺伝子座に存在する異なる対立遺伝子の量の相対比を決定することができる。一実施形態において、多型遺伝子座は、SNPから完全になることができる。一実施形態において、多型遺伝子座は、SNP、単一タンデム反復、及び他の多型を含むことができる。一実施形態において、本開示の方法を使用して、DNAの混合物中の多型遺伝子座のセットでの対立遺伝子の相対分布を決定することができ、DNAの混合物は、母親に由来するDNAと、胎児に由来するDNAとを含む。一実施形態において、結合対立遺伝子の分布は、妊婦の血液から単離されたDNAの混合物上で決定することができる。一実施形態において、遺伝子座のセットにおける対立遺伝子分布を使用して、妊娠中の胎児の1つ以上の染色体の倍数性状態を決定することができる。
【0346】
一実施形態において、DNA分子の混合物は、1つの個体の複数の細胞から抽出されたDNAに由来し得る。一実施形態において、DNAが由来する細胞の元のコレクションは、その個体がモザイク(生殖細胞系又は体細胞系)である場合、同じ又は異なる遺伝子型の二倍体又は単倍体細胞の混合物を含んでもよい。一実施形態において、DNA分子の混合物はまた、単一細胞から抽出されたDNAに由来し得る。一実施形態において、DNA分子の混合物はまた、同じ個体又は異なる個体の2つ以上の細胞の混合物から抽出されたDNAに由来し得る。一実施形態において、DNA分子の混合物は、細胞フリーDNAを含むことが知られている血漿などの細胞からすでに遊離している生物学的物質から単離されたDNAに由来し得る。一実施形態において、この生物学的物質は、胎児DNAが混合物中に存在することが示されている妊娠中の場合と同様に、1つ以上の個体由来のDNAの混合物であってもよい。一実施形態において、生物学的物質は、母体血液中に見出された細胞の混合物からのものであってもよく、細胞のいくつかは胎児起源である。一実施形態において、生物学的物質は、胎児細胞が濃縮された妊娠中の血液由来の細胞であってもよい。
【0347】
環状化プローブ
本開示のいくつかの実施形態は、以前に文献に記載された「連結された反転プローブ」(LIP)の使用を伴う。LIPは、DNAの環状分子の作製を伴う技術を包含することを意味する一般的な用語であり、プローブは、適切なポリメラーゼ及び/又はリガーゼ、並びに適切な条件、緩衝液及び他の試薬の添加が、標的対立遺伝子にわたるDNAの相補的な反転領域を完成させて、標的対立遺伝子内に見出される情報を捕捉するDNAの環状ループを作製するように、標的対立遺伝子のいずれかの側のDNAの標的領域にハイブリダイズするように設計される。LIPはまた、予め環化されたプローブ、予め環化されたプローブ、又は環化されたプローブと呼ばれてもよい。LIPプローブは、50~500ヌクレオチド長、及び一実施形態において70~100ヌクレオチド長の間の線形DNA分子であってもよく、いくつかの実施形態において、本明細書に記載されるよりも長くても短くてもよい。本開示の他の実施形態は、LIP技術の異なる化身、例えば、パドロックプローブ及び分子反転プローブ(MIP)を含む。
【0348】
配列決定のための特定の位置を標的化する1つの方法は、DNAポリメラーゼ及びDNAリガーゼの添加が3’末端からの伸長をもたらすように、プローブの3’及び5’末端が、標的領域に隣接する及び標的領域のいずれかの側の位置で反転した様式で標的DNAにアニールするプローブを合成することであり、標的分子に相補的な一本鎖プローブに塩基を添加し(ギャップフィル)、続いて、新しい3’末端を元のプローブの5’末端にライゲーションし、その後、バックグラウンドDNAから単離することができる環状DNA分子をもたらす。プローブ端部は、目的の標的領域に隣接するように設計されている。このアプローチの一態様は、一般にMIPSと呼ばれ、記入された配列の性質を決定するためにアレイ技術と併せて使用されてきた。対立遺伝子比を測定する文脈におけるMIPの使用に対する1つの欠点は、ハイブリダイゼーション、環化、及び増幅工程が、同じ遺伝子座における異なる対立遺伝子について等しい速度で行われないことである。これは、元の混合物中に存在する実際の対立遺伝子比率を代表しない対立遺伝子比率の測定値をもたらす。
【0349】
一実施形態において、環化プローブは、標的多型遺伝子座の上流にハイブリダイズするように設計されるプローブの領域と、標的多型遺伝子座の下流にハイブリダイズするように設計されるプローブの領域とが、非核酸骨格を介して共有結合的に接続されるように構築される。この骨格は、任意の生体適合性分子又は生体適合性分子の組み合わせであってもよい。可能な生体適合性分子のいくつかの例は、ポリ(エチレングリコール)、ポリカーボネート、ポリウレタン、ポリエチレン、ポリプロピレン、スルホンポリマー、シリコーン、セルロース、フルオロポリマー、アクリル化合物、スチレンブロックコポリマー、及び他のブロックコポリマーである。
【0350】
本開示の一実施形態において、このアプローチは、充填された配列を調べる手段として、配列決定に容易に従うように修正されている。元のサンプルの元の対立遺伝子の割合を保持するためには、少なくとも1つの重要な考慮事項が考慮されなければならない。ギャップフィル領域内の異なる対立遺伝子間の可変位置は、バリアントの差異をもたらすDNAポリメラーゼによる開始バイアスがあり得るため、プローブ結合部位にあまり近すぎてはならない。別の考慮事項は、ギャップ充填領域内のバリアントと相関する追加のバリエーションがプローブ結合部位に存在し得、これが異なる対立遺伝子からの不均等な増幅をもたらし得ることである。本開示の一実施形態において、予め環化されたプローブの3’末端及び5末端は、標的対立遺伝子のバリアント位置(多型部位)から離れた1つ又はいくつかの位置である塩基にハイブリダイズするように設計される。多型部位(SNP又はその他)と、予め環化されたプローブの3’末端及び5末端にハイブリダイズするように設計された塩基との間の塩基数は、1塩基であってもよく、2塩基であってもよく、3塩基であってもよく、4塩基であってもよく、5塩基であってもよく、6塩基であってもよく、7~10塩基であってもよく、11~15塩基であってもよく、又は16~20塩基、20~30塩基対、若しくは30~60塩基対であってもよい。順方向および逆方向のプライマーは、多型部位から離れた異なる数の塩基をハイブリダイズするように設計されてもよい。環状化プローブは、現在のDNA合成技術で大量に生成することができ、非常に大量のプローブを生成し、潜在的にプールすることを可能にし、多くの遺伝子座を同時に調べることができる。これは、30万を超えるプローブで動作することが報告されている。標的個体のゲノムデータを測定するために使用することができる環状化プローブを含む方法を考察する2つの論文は、以下を含む:Porreca et al.,Nature Methods,2007 4(11),pp.931-936.、及びTurner et al.,Nature Methods,2009,6(5),pp.315-316。これらの論文に記載の方法は、本明細書に記載の他の方法と組み合わせて使用されてもよい。これらの2つの論文からの方法の特定の工程は、本明細書に記載の他の方法からの他の工程と組み合わせて使用されてもよい。
【0351】
本明細書に開示される方法のいくつかの実施形態において、標的個体の遺伝物質は、任意選択で増幅され、続いて、例えば、ローリングサークル増幅を使用して、環状化前プローブのハイブリダイゼーション、ハイブリダイゼーションされたプローブの2つの端部間の塩基を埋めるためのギャップフィルの実施、環状化プローブを形成するための2つの端部のライゲーション、及び環状化プローブの増幅が行われる。所望の標的対立遺伝子情報が、LIPシステムなどにおいて、適切に設計されたオリゴ核酸プローブを環化することによって捕捉されると、環化プローブの遺伝子配列を測定して、所望の配列データを得てもよい。一実施形態において、適切に設計されたオリゴヌクレオチドプローブは、標的個体の非増幅遺伝物質上で直接環化され、その後増幅されてもよい。ローリングサークル増幅、MDA、又は他の増幅プロトコルを含む、いくつかの増幅手順を使用して、元の遺伝物質又は環化LIPを増幅してもよいことに留意されたい。異なる方法を使用して、例えば、高スループット配列決定、サンガー配列決定、他の配列決定方法、ハイブリダイゼーションによる捕捉、環化による捕捉、多重PCR、他のハイブリダイゼーション方法、及びそれらの組み合わせを使用して、標的ゲノム上の遺伝子情報を測定してもよい。
【0352】
個体の遺伝物質が、上記の方法の1つ又は組み合わせを用いて測定されると、次いで、適切な遺伝子測定とともに、PARENTAL SUPPORT(商標)方法などの情報学に基づく方法を用いて、個体上の1つ以上の染色体の倍数性状態、及び/又は1つ以上の対立遺伝子、具体的には、目的の疾患又は遺伝子状態と相関する対立遺伝子の遺伝子状態を決定することができる。LIPの使用は、遺伝子配列の多重捕捉、続いて、配列決定による遺伝子型決定のために報告されていることに留意されたい。しかしながら、単一の細胞、少数の細胞、又は細胞外DNAに見出される遺伝物質の増幅のためのLIPベースの戦略から生じる配列決定データの使用は、標的個体の倍数性状態を決定する目的で使用されていない。
【0353】
ILLUMINA INFINIUMアレイ又はAFFYMETRIX遺伝子チップなどのハイブリダイゼーションアレイによって測定される遺伝子データから個体の倍数性状態を決定するための情報学に基づく方法の適用は、本文書の別の箇所の参照文書に記載されている。しかしながら、本明細書に記載される方法は、文献において以前に記載された方法に対する改善を示す。例えば、高スループット配列決定に続くLIPベースのアプローチは、多重化のためのより良い能力、より良い捕捉特異性、より良い均一性、及び低い対立遺伝子バイアスを有するアプローチに起因して、より良い遺伝子型データを予期せず提供する。より大きな多重化は、より多くの対立遺伝子を標的化することを可能にし、より正確な結果を与える。より良い均一性により、より多くの標的対立遺伝子が測定され、より正確な結果が得られる。対立遺伝子バイアスの割合が低いほど、ミスコールの割合が低くなり、より正確な結果が得られる。より正確な結果は、臨床転帰の改善、及びより良い医療をもたらす。
【0354】
LIPは、配列決定以外の方法によって遺伝子型決定のためのDNAのサンプル中の特定の遺伝子座を標的化する方法として使用され得ることに留意することが重要である。例えば、LIPを使用して、SNPアレイ又は他のDNA若しくはRNAベースのマイクロアレイを使用して、遺伝子型決定のためのDNAを標的化してもよい。
【0355】
ライゲーション媒介PCR
ライゲーション媒介PCRは、DNAの混合物中の1つ又は複数の遺伝子座を増幅することによってDNAのサンプルを優先的に濃縮するために使用されるPCRの方法であり、方法は、以下を含む:プライマー対のセットを得ることであって、対の各プライマーが、標的特異的配列及び非標的配列を含有し、標的特異的配列が、多型部位の1つ上流及び1つ下流の標的領域にアニーリングするように設計され、多型部位から0、1、2、3、4、5、6、7、8、9、10、11~20、21~30、31~40、41~50、51~100、又は100超で分離することができる、得ること;上流プライマーの3プライム末端から、それと下流プライマーの5プライム末端との間の一本鎖領域を、標的分子に相補的なヌクレオチドで充填するDNAの重合;上流プライマーの最後の重合塩基を、下流プライマーの隣接する5プライム塩基にライゲーションすること;並びに上流プライマーの5プライム末端及び下流プライマーの3プライム末端に含まれる非標的配列を使用して、重合及びライゲーション分子のみを増幅すること。異なる標的に対するプライマーの対は、同じ反応で混合されてもよい。非標的配列は、重合及びライゲーションに成功したプライマーの全ての対が単一の増幅プライマー対で増幅され得るように、ユニバーサル配列として機能する。
【0356】
ハイブリダイゼーションによる捕捉
標的ゲノム内の特定の配列セットの優先的濃縮は、いくつかの方法で達成することができる。本明細書の他の箇所には、LIPを使用して配列の特定のセットを標的化することができる方法の説明があるが、これらの用途の全てにおいて、他の標的化及び/又は優先的な濃縮方法を同じ目的のために等しく適切に使用することができる。別の標的化方法の1つの例は、ハイブリダイゼーションによる捕捉アプローチである。ハイブリダイゼーション技術による商業的捕捉のいくつかの例としては、AGILENT’s SURE SELECT及びILLUMINA’s TruSeqが挙げられる。ハイブリダイゼーションによる捕捉において、所望の標的化配列に相補的又はほとんど相補的なオリゴヌクレオチドのセットをDNAの混合物にハイブリダイゼーションさせ、次いで混合物から物理的に分離する。所望の配列が標的化オリゴヌクレオチドにハイブリダイゼーションすると、標的化オリゴヌクレオチドを物理的に除去する効果は、標的配列もまた除去することである。ハイブリダイゼーションしたオリゴを除去すると、それらの融解温度を超えるように加熱することができ、増幅することができる。標的化オリゴヌクレオチドを物理的に除去するいくつかの方法は、標的化オリゴを固体支持体、例えば、磁性ビーズ、又はチップに共有結合させることである。標的化オリゴヌクレオチドを物理的に除去する別の方法は、別の分子部分に対して強い親和性を有する分子部分に共有結合することである。このような分子対の一例は、SURE SELECTに使用されるようなビオチン及びストレプトアビジンである。したがって、標的配列をビオチン分子に共有結合させることができ、ハイブリダイゼーション後、ストレプトアビジンを付着させた固体支持体を使用して、標的配列にハイブリダイゼーションされるビオチン化オリゴヌクレオチドをプルダウンすることができる。
【0357】
ハイブリッド捕捉は、標的分子に対する目的の標的に相補的なプローブのハイブリダイゼーションを伴う。ハイブリッド捕捉プローブは、元々、標的間の相対的な均一性を有するゲノムの大部分の画分を標的化し、濃縮するように開発された。その出願では、全ての標的が、全ての領域が配列決定によって検出され得るほどの十分な均一性で増幅されることが重要であったが、元のサンプル中の対立遺伝子の割合を保持することは考慮されなかった。捕捉後、サンプル中に存在する対立遺伝子は、捕捉された分子の直接配列決定によって決定することができる。これらの配列決定リードは、対立遺伝子の種類に従って分析及びカウントされてもよい。しかしながら、現在の技術を使用して、捕捉された配列の測定された対立遺伝子分布は、典型的には、元の対立遺伝子分布を表していない。
【0358】
一実施形態において、対立遺伝子の検出は、配列決定によって行われる。多型部位で対立遺伝子同一性を捕捉するためには、その捕捉された分子の対立遺伝子組成を評価するために、配列決定リードが問題の対立遺伝子にまたがることが不可欠である。捕捉分子は、多くの場合、配列決定時に可変長であるため、分子全体が配列決定されない限り、バリアント位置と重複することを保証することはできない。しかしながら、コストの考慮事項、並びに配列決定リードの可能な最大長及び精度に関する技術的制限により、分子全体の配列決定は実行不可能である。一実施形態において、リード長は、約30塩基~約50塩基又は約70塩基に増加させることができ、標的配列内のバリアント位置と重複するリードの数を大幅に増加させることができる。
【0359】
目的の位置を調べるリード数を増やす別の方法は、基礎となる濃縮対立遺伝子にバイアスが生じない限り、プローブの長さを減らすことである。合成されたプローブの長さは、1つの遺伝子座で見出される2つの異なる対立遺伝子にハイブリダイズするように設計された2つのプローブが、元のサンプル中の様々な対立遺伝子とほぼ等しい親和性でハイブリダイズするように十分な長さであるべきである。現在、当該技術分野で既知の方法は、典型的には120塩基よりも長いプローブを説明する。現在の実施形態において、対立遺伝子が1つ以上の塩基である場合、捕捉プローブは、約110塩基未満、約100塩基未満、約90塩基未満、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、及び約25塩基未満であってもよく、これは、全ての対立遺伝子からの等しい濃縮を確実にするのに十分である。ハイブリッド捕捉技術を使用して濃縮されるDNAの混合物が、血液、例えば母体血液から単離された遊離浮遊DNAを含む混合物である場合、DNAの平均長さは非常に短く、典型的には200塩基未満である。より短いプローブの使用は、ハイブリッド捕捉プローブが所望のDNAフラグメントを捕捉する可能性を高める。より大きなバリエーションでは、より長いプローブが必要になることもある。一実施形態において、目的のバリエーションは、長さが1つ(SNP)から数塩基である。一実施形態において、ゲノム内の標的領域は、ハイブリッド捕捉プローブを使用して優先的に濃縮することができ、ハイブリッド捕捉プローブは、90塩基未満の長さであり、80塩基未満、70塩基未満、60塩基未満、50塩基未満、40塩基未満、30塩基未満、又は25塩基未満であり得る。一実施形態において、所望の対立遺伝子が配列決定される可能性を増加させるために、多型対立遺伝子位置に隣接する領域にハイブリダイズするように設計されるプローブの長さを、90塩基超から約80塩基、又は約70塩基、又は約60塩基、又は約50塩基、又は約40塩基、又は約30塩基、又は約25塩基まで減少させることができる。
【0360】
捕捉を可能にするために、合成されたプローブと標的分子との間に最小限の重複がある。この合成されたプローブは、この最小限の必要な重複よりも大きくなりながら、できるだけ短くすることができる。多型領域を標的化するためにより短いプローブ長を使用する効果は、標的対立遺伝子領域と重複するより多くの分子が存在することである。元のDNA分子のフラグメント化の状態は、標的対立遺伝子と重複するリードの数にも影響する。血漿サンプルなどのいくつかのDNAサンプルは、インビボで行われる生物学的プロセスのために既にフラグメント化されている。しかしながら、より長いフラグメントを有するサンプルは、ライブラリ調製及び濃縮を配列決定する前のフラグメント化の恩恵を受ける。プローブ及びフラグメントの両方が短い(約60~80bp)場合、最大特異性は、相対的に少数の配列リードが達成され得、目的の臨界領域と重複することに失敗する。
【0361】
一実施形態において、ハイブリダイゼーション条件は、元のサンプル中に存在する異なる対立遺伝子の捕捉における均一性を最大化するように調整することができる。一実施形態において、ハイブリダイゼーション温度を低下させて、対立遺伝子間のハイブリダイゼーションバイアスの差を最小限に抑える。温度を下げることは、意図しない標的へのプローブのハイブリダイゼーションを増加させる効果を有するため、当該技術分野で既知の方法は、ハイブリダイゼーションのためにより低い温度を使用することを避ける。しかしながら、目標が最大の忠実度で対立遺伝子比を維持することである場合、より低いハイブリダイゼーション温度を使用するアプローチは、現在の技術がこのアプローチから離れているという事実にもかかわらず、最適に正確な対立遺伝子比を提供する。ハイブリダイゼーション温度は、標的領域の実質的な重複を有する標的のみが捕捉されるように、標的と合成プローブとの間のより大きな重複を必要とするように増加させることもできる。本開示のいくつかの実施形態において、ハイブリダイゼーション温度は、通常のハイブリダイゼーション温度から約40℃、約45℃、約50℃、約55℃、約60℃、約65℃、又は約70℃に低下する。
【0362】
一実施形態において、ハイブリッド捕捉プローブは、多型対立遺伝子に隣接する領域に見出されるDNAに相補的なDNAを有する捕捉プローブの領域が、多型部位に直接隣接しないように設計することができる。代わりに、捕捉プローブは、標的の多型部位に隣接するDNAにハイブリダイズするように設計される捕捉プローブの領域が、1つ又は少数の塩基に等しい長さで、多型部位とファンデルワールス接触するであろう捕捉プローブの部分から分離されるように設計され得る。一実施形態において、ハイブリッド捕捉プローブは、多型対立遺伝子に隣接しているが、それを横断しない領域にハイブリダイズするように設計され、これは、隣接捕捉プローブと呼ばれ得る。隣接する捕捉プローブの長さは、約120塩基未満、約110塩基未満、約100塩基未満、約90塩基未満であり得、約80塩基未満、約70塩基未満、約60塩基未満、約50塩基未満、約40塩基未満、約30塩基未満、及び約25塩基未満であり得る。隣接捕捉プローブによって標的化されるゲノムの領域は、1、2、3、4、5、6、7、8、9、10、11~20個、又は20個を超える塩基対によって、多型遺伝子座によって分離されていてもよい。
【0363】
標的化配列捕捉を使用した標的化された捕捉ベースの疾患スクリーニング試験の説明。AGILENT(SURE SELECT)、ROCHE-NIMBLEGEN、又はILLUMINAが現在提供しているようなカスタム標的化配列捕捉。捕捉プローブは、様々な種類の変異の捕捉を確実にするようにカスタム設計することができる。点変異については、点変異と重複する1つ以上のプローブが、変異を捕捉し、配列決定するのに十分であるべきである。
【0364】
小さな挿入又は欠失について、変異と重複する1つ以上のプローブは、変異を含むフラグメントを捕捉し配列決定するのに十分であり得る。ハイブリダイゼーションは、典型的には、参照ゲノム配列に対して設計された、プローブ制限捕捉効率の間では、より低効率であってもよい。変異を含むフラグメントの捕捉を確実にするために、1つは正常対立遺伝子とマッチし、1つは変異対立遺伝子とマッチする2つのプローブを設計することができる。より長いプローブは、ハイブリダイゼーションを強化し得る。複数の重複するプローブは、捕捉を強化し得る。最後に、プローブを、重複していないがすぐ隣接させることで、変異は、正常及び変異対立遺伝子の比較的類似した捕捉効率を可能にし得る。
【0365】
単純タンデム反復(STR)の場合、これらの可変性の高い部位と重複するプローブは、フラグメントを十分に捕捉する可能性は低い。捕捉を強化するために、プローブを可変部位に隣接させることができるが、重複させることはできない。次いで、フラグメントを通常通り配列決定して、SRTの長さ及び組成を明らかにすることができる。
【0366】
一連の重複するプローブである大規模な欠失の場合、エクソーム捕捉システムで現在使用されている共通のアプローチが機能する場合がある。しかしながら、このアプローチでは、個体がヘテロ接合体であるかどうかを決定することが困難であり得る。捕捉された領域内のSNPを標的化し、評価することは、個体が担体であることを示す領域にわたるヘテロ接合性の喪失を潜在的に明らかにし得る。一実施形態において、潜在的に欠失される領域にわたって非重複又はシングルトンプローブを配置し、ヘテロ接合性の尺度として捕捉されるフラグメントの数を使用することが可能である。個々の虫歯が大きな欠失を有する場合、非欠失(二倍体)参照遺伝子座と比較して、フラグメントの数の半分が捕捉に利用可能であると予測される。したがって、欠失領域から得られるリード数は、正常な二倍体遺伝子座から得られるリード数の約半分であるべきである。潜在的に欠失した領域にわたって複数のシングルトンプローブからの配列決定リードの深さを集約及び平均化することは、シグナルを強化し、診断の信頼性を向上させることができる。SNPを標的化してヘテロ接合性の喪失を特定し、複数のシングルトンプローブを使用して、その遺伝子座からの基礎となるフラグメントの量の定量的尺度を得る2つのアプローチも組み合わせることができる。これらの戦略のいずれか又は両方は、同じ目的をより良く達成するために、他の戦略と組み合わせられてもよい。
【0367】
男性胎児のcfDNA検出の検査中に、Y染色体フラグメントの存在によって示されるように、同じ試験において捕捉及び配列決定され、母親及び父親が罹患していないX連鎖優性変異、又は母親が罹患していない優性変異のいずれかが胎児への高リスクを示す。罹患していない母親における同じ遺伝子内の2つの変異体劣性対立遺伝子の検出は、胎児が父親から変異体対立遺伝子を、及び潜在的に母親から第2の変異体対立遺伝子を遺伝したことを意味する。全ての症例において、羊水穿刺又は絨毛性絨毛サンプリングによるフォローアップ検査が示されてもよい。
【0368】
標的化された捕捉ベースの疾患スクリーニング検査は、異数体のための標的化された捕捉ベースの非侵襲性出生前診断検査と組み合わせることができる。
【0369】
リード深度(DOR)の可変性を低下させるいくつかの方法が存在する:例えば、プライマー濃度を増加させることができる方法、より長い標的化増幅プローブを使用することができる方法、又はより多くのSTAサイクル(25を超える、30を超える、35を超える、又は更に40を超えるなど)を実行することができる方法。
【0370】
標的化PCR
いくつかの実施形態において、PCRを使用して、ゲノムの特定の位置を標的化することができる。血漿サンプルにおいて、元々のDNAは、高度にフラグメント化される(典型的には500bp未満、平均長さは200bp未満)。PCRでは、順方向及び逆方向のプライマーの両方が同じフラグメントにアニーリングし、増幅が可能でなければならない。したがって、フラグメントが短い場合、PCRアッセイは、同様に相対的に短い領域を増幅しなければならない。MIPSと同様に、多型位置がポリメラーゼ結合部位に近すぎる場合、異なる対立遺伝子からの増幅におけるバイアスが生じる場合がある。現在、多型領域(SNPを含有するものなど)を標的化するPCRプライマーは、典型的には、プライマーの3’末端が、1つ又は複数の多型塩基のすぐ横に隣接する塩基にハイブリダイズするように設計される。本開示の一実施形態において、順方向及び逆方向のPCRプライマー両方の3’末端は、標的対立遺伝子のバリアント位置(多型部位)から離れた1つ又はいくつかの位置である塩基にハイブリダイズするように設計される。多型部位(SNP又はその他)と、プライマーの3’末端にハイブリダイズするように設計された塩基との間の塩基数は、1塩基であってもよく、2塩基であってもよく、3塩基であってもよく、4塩基であってもよく、5塩基であってもよく、6塩基であってもよく、7~10塩基であってもよく、11~15塩基であってもよく、又は16~20塩基であってもよい。順方向および逆方向のプライマーは、多型部位から離れた異なる数の塩基をハイブリダイズするように設計されてもよい。
【0371】
PCRアッセイは大量に作成することができるが、異なるPCRアッセイ間の相互作用により、約100アッセイを超えて多重化することが困難である。様々な複雑な分子手法を使用して、多重化のレベルを上げることができるが、依然として、反応当たり100、おそらく200、又はおそらく500より少ないアッセイに限定されるだろう。大量のDNAを含むサンプルは、複数のサブ反応に分けられ、次いで、配列決定前に再び組み合わせることができる。DNAの全体サンプル又はいくつかの部分集合のいずれかが限定されるサンプルについて、サンプルを分けると、統計的ノイズが入り込むだろう。一実施形態において、少量又は限定された量のDNAとは、10pg未満、10~100pg、100pg~1ng、1~10ng又は10~100ngの量を指していてもよい。なお、この方法は、複数のプールに分けることを伴う他の方法によって、入り込んでしまう統計的ノイズに関連する顕著な問題が生じ得る少量のDNAに特に有用であるが、この方法は、任意の量のDNAのサンプルで実行する場合にバイアスを最小限にするという利点を依然として提供する。これらの状況では、全体的なサンプル量を増やすために、普遍的な前増幅工程を使用してもよい。理想的には、この前増幅工程は、対立遺伝子分布を著しく変化させないものであるべきである。
【0372】
一実施形態において、本開示の方法は、例えば、単一細胞又は体液からのDNAなどの限定されたサンプルからの配列決定又はいくつかの他の遺伝子決定方法による遺伝子型決定のために、多数の標的遺伝子座、具体的には、1,000~5,000個の遺伝子座、5,000~10,000個の遺伝子座又は10,000個より多い遺伝子座に特異的なPCR産物を作成することができる。現在、5~10個より多い標的の多重PCR反応を行うことには、大きな課題があり、プライマー副産物(例えばプライマーダイマー)及び他のアーチファクトによって妨害されることが多い。ハイブリダイゼーションプローブを用いるマイクロアレイを用いて標的配列を検出する場合、プライマーダイマー及び他のアーチファクトは、これらが検出されないため、無視される場合がある。しかし、検出方法として配列決定を用いる場合、配列決定リードの大部分は、このようなアーチファクトを配列決定し、サンプル中の所望な標的配列を配列決定しないだろう。1つの反応中、50又は100を超える反応を多重化し、その後に配列決定するために使用される先行技術で記載される方法は、典型的には、20%を超える、多くは50%を超える、多くの場合には80%を超える、ある場合には90%を超える標的ではない配列リードが得られる。
【0373】
一般に、サンプルの複数の(n)個の(50より多い、100より多い、500より多い、又は1,000より多い)標的の標的化配列決定を行うために、サンプルを、1つの個々の標的を増幅するいくつかの数の並行反応に分けることができる。このことは、PCRマルチウェルプレートで行うことができ、又は市販のプラットフォーム、例えば、FLUIDIGM ACCESS ARRAY(微小流体チップ中、サンプル当たり48の反応)又はRAIN DANCE TECHNOLOGY製のDROPLET PCR(100~数千の標的)で行うことができる。残念ながら、これらを分けてプールする方法は、限定された量のDNAを含むサンプルでは、各ウェル中にゲノムの各領域の1つのコピーが存在することを確実にするための、ゲノムの十分なコピーが存在しないことが多いため、問題がある。これは、多型遺伝子座が標的化され、多型遺伝子座での対立遺伝子の相対的な割合が必要である場合には、分けてプールすることによって入り込む統計的ノイズが、DNAの元々のサンプル中に存在した対立遺伝子の割合の測定を非常に不正確なものにしてしまうため、特に深刻な問題である。限定された量のDNAしか利用可能ではない場合に適用可能な、多くのPCR反応を効果的かつ効率的に増幅する方法が本明細書に記載される。一実施形態において、本方法は、単一細胞、体液、DNAの混合物(例えば、母体血漿中に見出される遊離浮遊DNA)、生検、環境及び/又は法医学サンプルの分析に適用可能であろう。
【0374】
一実施形態において、標的化配列決定は、以下の工程のうちの1つ、複数、又は全てを伴ってもよい。a)DNAフラグメントの両端にアダプター配列を有するライブラリを生成し、増幅する。b)ライブラリ増幅後、複数の反応に分割する。c)DNAフラグメントの両端にアダプター配列を有するライブラリを生成し、任意選択で増幅する。d)1個の標的特異性「フォワード」プライマー及び1個のタグ特異性プライマーを用いて、1000~10,000プレックスの選択された標的の増幅を行う。e)「逆方向」標的特異性プライマーと、第1ラウンドで標的特異性順方向プライマーの一部として導入されたユニバーサルタグに特異的な1個(又は複数)のプライマーとを用い、第2の増幅を行う。f)制限された回数のサイクルについて、選択した標的の1000プレックス前増幅を行う。g)製品を複数のアリコートに分割し、個々の反応で標的のサブプールを増幅する(例えば、50~500プレックス、これはシングルプレックスまで使用することができる)。h)並行サブプール反応のプール生成物。i)これらの増幅の間、プライマーは、生成物が配列決定され得るように、配列決定に適合するタグ(部分又は全長)を有することができる。
【0375】
高度に多重化されたPCR
血漿から得られるゲノムDNAなどの核酸サンプルから、数百から数千の標的配列(例えば、SNP遺伝子座)にわたる標的化増幅を可能にする方法が、本明細書で開示される。増幅されるサンプルは、プライマーダイマー産物を比較的含まず、低い標的遺伝子座での対立遺伝子バイアスを有していてもよい。増幅中又は増幅後に、産物に、配列決定に適合するアダプターが付加される場合、これらの産物の分析は、配列決定によって行うことができる。
【0376】
当該技術分野で既知の方法を用いて高度に多重化されたPCR増幅を行うと、望ましい増幅産物より過剰な、配列決定には好適でないプライマーダイマー産物が生成する。これらは、これらの産物を形成するプライマーを除外することによって、又はプライマーのin silicoでの選択を行うことによって、経験的に減らすことができる。しかし、アッセイの数が多ければ多いほど、この問題は困難になる。
【0377】
1つの解決策は、5000倍の反応を、いくつかのこれより少ない倍数の増幅(例えば、100個の50倍の反応又は50個の100倍の反応)に分けること、又は微小流体を用いること、又は更にサンプルを個々のPCR反応に分けることである。しかし、妊婦血漿由来の非侵襲的な産前診断など、サンプルDNAが限定されている場合、サンプルを複数の反応に分けることは妨げとなるため、避けるべきである。
【0378】
まず、サンプルの血漿DNAを全体的に増幅し、次いで、サンプルを、反応当たり更に適度な数の標的配列を含む複数の多重化された標的濃縮反応に分けるための方法が本明細書に記載される。一実施形態において、本開示の方法は、複数の遺伝子座でDNA混合物を優先的に濃縮するために使用することができ、本方法は、ライブラリ中の分子がDNAフラグメントの両端にライゲーションされたアダプター配列を有するようなDNAの混合物からライブラリを作成し、増幅する工程、増幅したライブラリを複数の反応に分割する工程、1つの標的特異性「順方向」プライマーと1つ又は複数のアダプター特異性ユニバーサル「逆方向」プライマーを用い、選択された標的の第1ラウンドの多重増幅を行う工程のうちの1つ以上を含む。一実施形態において、本開示の方法は、更に、「逆方向」標的特異性プライマーと、第1ラウンドで標的特異性順方向プライマーの一部として導入されたユニバーサルタグに特異的な1個又は複数のプライマーとを用い、第2の増幅を行うことを含む。一実施形態において、本方法は、完全ネスティッド、ヘミネスティッド、セミネスティッド、片側完全ネスティッド、片側ヘミネスティッド又は片側セミネスティッドPCR手法を伴っていてもよい。一実施形態において、本開示の方法は、複数の遺伝子座でDNA混合物を優先的に濃縮するために使用され、本方法は、制限された回数のサイクルについて、選択した標的の多重前増幅を行うことと、この産物を複数のアリコートに分割することと、標的のサブプールを個々の反応で増幅することと、並行サブプール反応の産物をプールすることと、を含む。なお、この手法を使用して、50~500遺伝子座について、500~5,000遺伝子座について、5,000~50,000遺伝子座について、又は更に50,000~500,000遺伝子座について、低レベルの対立遺伝子バイアスを生じる方法で、標的化増幅を行うことができる。一実施形態において、プライマーは、部分又は全長の配列決定に適合するタグを有する。
【0379】
ワークフローは、(1)血漿DNAを抽出すること、(2)フラグメントの両端にあるユニバーサルアダプターを用い、フラグメントライブラリを調製すること、(3)アダプターに特異的なユニバーサルプライマーを用い、ライブラリを増幅すること、(4)増幅したサンプル「ライブラリ」を複数のアリコートに分割すること、(5)アリコートについて、多重(例えば、標的当たり1つの標的特異性プライマーとタグ特異性プライマーを用いた約100反応分、1,000又は10,000反応分)増幅を行うこと、(6)1つのサンプルのアリコートをプールすること、(7)サンプルをバーコード化すること、(8)サンプルを混合し、濃度を調整すること、(9)サンプルを配列決定すること、を含んでいてもよい。本ワークフローは、列挙された工程のうちの1つを含む複数のサブ工程を含んでいてもよい(例えば、ライブラリを調製する工程である工程(2)は、3つの酵素工程(平滑末端化、dAテーリング及びアダプターライゲーション)と3つの精製工程を伴っていてもよい)。ワークフローの工程は、組み合わせ、分割され、又は異なる順序で行われてもよい(例えば、バーコード化とサンプルのプール)。
【0380】
ライブラリの増幅は、短いフラグメントをより効率的に増幅するように偏重される方法で行われてもよい。この方法で、妊婦の循環中で見出される無細胞胎児DNA(胎盤由来)として、より短い配列、例えば、モノヌクレオソームDNAフラグメントを優先的に増幅することができる。なお、PCRアッセイは、タグ、例えば、配列決定タグ(通常、15~25塩基の切断された形態)を有していてもよい。多重化の後、サンプルのPCR多重化物をプールし、次いで、タグを、タグ特異性PCR(ライゲーションによっても行うことが可能)によって完結させる(バーコード化を含む)。また、全配列決定タグは、多重化と同じ反応に加えられてもよい。第1のサイクルにおいて、標的は、標的特異性プライマーを用いて増幅されてもよく、その後、タグ特異性プライマーは、SQアダプター配列を完成させるために引き継がれてもよい。PCRプライマーは、タグを有していなくてもよい。配列決定タグは、ライゲーションによって増幅産物に付けられてもよい。
【0381】
一実施形態において、高度な多重PCRの後、クローン配列決定による増幅物質の評価は、胎児異数性の検出に使用されてもよい。従来の多重PCRは、50個までの遺伝子座を同時に評価するのに対し、本明細書に記載される手法を使用して、50個を超える遺伝子座を同時に、100個を超える遺伝子座を同時に、500個を超える遺伝子座を同時に、1,000個を超える遺伝子座を同時に、5,000個を超える遺伝子座を同時に、10,000個を超える遺伝子座を同時に、50,000個を超える遺伝子座を同時に、100,000個を超える遺伝子座を同時に、同時評価をすることが可能である。実験は、単一反応において、非侵襲性の産前異数性診断及び/又は高精度のコピー数コールを行うのに十分に良好な効率及び特異性を有しつつ、10,000個まで、10,000個を含む、10,000個を超える別個の遺伝子座を同時に評価することができることが示される。アッセイは、母体血漿から単離されたcfDNAサンプルの全体、その画分、又はcfDNAサンプルの更に処理された誘導体を用い、単一反応で組み合わせられてもよい。cfDNA又は誘導体はまた、複数の並列な多重反応に分割されてもよい。最適なサンプル分割及び多重化は、様々な性能仕様の妥協点を探ることによって決定される。材料の量が限られているため、サンプルを複数の画分に分割すると、サンプリングノイズ、取り扱い時間が導入され、エラーの可能性が高まる場合がある。逆に、更に高度な多重化によって、より多くの誤った増幅が起こり、増幅においてより大きな不平等が生じる場合があり、この両者が試験性能を下げる可能性がある。
【0382】
本明細書に記載される方法の適用における2つの重要な関連する考慮事項は、元々の血漿の量が限られていることと、対立遺伝子頻度又は他の測定値を得るこの材料における元々の分子の数である。元々の分子の数が、特定の値を下回る場合、ランダムサンプリングノイズが顕著になり、試験の制度に影響を及ぼす場合がある。典型的には、標的遺伝子座当たり500~1000個の元々の分子に相当するものを含むサンプルに対して測定が行われる場合、非侵襲性の産前異数性診断を行うのに十分な量のデータを得ることができる。別個の測定の数を増やすいくつかの方法が存在する(例えば、サンプルの体積を増やす)。サンプルに適用される各操作も、潜在的に材料の消失を引き起こす可能性がある。様々な操作によって個こる消失を特徴付け、これを避けること、又は必要な場合、試験の性能を低下させ得る消失を避けるために特定の操作の収率を改善することが不可欠である。
【0383】
一実施形態において、元々のcfDNAサンプルの全て又は画分を増幅することによって、その後の工程での潜在的な消失を軽減することが可能である。サンプル中の遺伝物質の全てを増幅するための様々な方法が利用可能であり、下流の手順に利用可能な量を増やす。一実施形態において、ライゲーション媒介PCR(LM-PCR)のDNAフラグメントは、1つの別個のアダプター、2つの別個のアダプター、又は多くの別個のアダプターのいずれかのライゲーションの後、PCRによって増幅される。一実施形態において、多重置換増幅(MDA)のphi-29ポリメラーゼを使用して、全てのDNAを等温増幅する。DOP-PCR及び変形例において、ランダムプライミングを使用して、元々の物質のDNAを増幅する。各方法は、ゲノムの全ての表される領域にわたる増幅の均一性、元々のDNAの捕捉及び増幅の効率及びフラグメントの長さの関数としての増幅性能など、特定の特徴を有する。
【0384】
一実施形態において、LM-PCRを、3’チロシンを有する単一のヘテロ二本鎖アダプターとともに使用してもよい。ヘテロ二本鎖アダプターは、第1ラウンドのPCR中に元々のDNAフラグメントの5’及び3’末端で2つの別個の配列に変換され得る単一アダプター分子の使用を可能にする。一実施形態において、増幅されるライブラリを、サイズ分離によって、又はAMPURE、TASSなどの製品又は他の同様の方法を用いることによって、分画することが可能である。ライゲーションの前に、サンプルDNAは、平滑末端化されてもよく、次いで、単一のアデノシン塩基を3’末端に付加する。ライゲーションの前に、DNAは、制限酵素又はいくつかの他の開裂方法を用いて開裂されてもよい。ライゲーション中に、サンプルフラグメントの3’アデノシンと、アダプターの相補性3’チロシンオーバーハングが、ライゲーション効率を高めることができる。PCR増幅の伸長工程は、約200bp、約300bp、約400bp、約500bp又は約1,000bpより長いフラグメントからの増幅を減らすために、時間的観点から制限されてもよい。母体血漿中に見出されるより長いDNAは、ほぼ排他的に母体であるため、これにより、10~50%の胎児DNAの濃縮をもたらす場合があり、検査性能が向上し得る。市販のキットによって指定される条件を用いていくつかの反応を実行し、サンプルDNA分子の10%より少ないライゲーションが成功した。このための反応条件の一連の最適化は、ライゲーションを約70%まで改善した。
【0385】
ミニPCR
従来のPCRアッセイ設計は、別個の胎児分子の顕著な消失を引き起こすが、消失は、ミニPCRアッセイと呼ばれる非常に短いPCRアッセイを設計することによって、大きく減らすことができる。母親の血清中の胎児cfDNAは、高度にフラグメント化され、フラグメントサイズは、平均が160bp、標準偏差が15bp、最小サイズが約100bp、最大サイズが約220bpのほぼGaussian方法で分布する。標的多型に関するフラグメントの開始位置と終了位置の分布は、必ずしもランダムではないが、個々の標的にわたって、また、全体的に全ての標的にわたって広く変動し、ある特定の標的遺伝子座の多型部位は、その遺伝子座に由来する様々なフラグメントの最初から最後までの任意の位置を占めていてもよい。なお、ミニPCRという用語は、更なる制限又は限定なく、通常のPCRを同様に指していてもよい。
【0386】
PCR中に、増幅は、順方向及び逆方向のプライマー部位を両方とも含むテンプレートDNAフラグメントからしか起こらない。胎児cfDNAフラグメントが短いため、両プライマー部位が存在する尤度、長さLの胎児フラグメントが順方向及び逆方向のプライマー部位の両方を含む尤度は、そのフラグメントの長さに対するアンプリコンの長さの比率である。理想的な条件下で、アンプリコンが45、50、55、60、65又は70bpであるアッセイは、利用可能なテンプレートフラグメント分子のそれぞれ72%、69%、66%、63%、59%又は56%からの増幅に成功する。アンプリコンの長さは、順方向及び逆方向のプライミング部位の5’末端間の距離である。当該技術分野で知られているものによって典型的に使用されるものよりも短いアンプリコン長は、短い配列リードのみを必要とすることによって、所望な多型遺伝子座のより効率的な測定をもたらし得る。一実施形態において、アンプリコンの実質的な画分は、100bp未満、90bp未満、80bp未満、70bp未満、65bp未満、60bp未満、55bp未満、50bp未満又は45bp未満であるべきである。
【0387】
なお、先行技術で既知の方法において、本明細書で記載されるような短いアッセイは、通常避けられる。これらのアッセイが必要とされず、プライマーの長さ、アニーリング特徴及び順方向プライマーと逆方向プライマーとの間の距離を制限することによって、プライマー設計にかなりの制約を課すためである。
【0388】
また、いずれかのプライマーの3’末端が、多型部位のほぼ1~6塩基内にある場合、偏った増幅の可能性が存在することに留意されたい。初期ポリメラーゼ結合部位でのこの一塩基の差は、1つの対立遺伝子の優先的増幅を引き起こす場合があり、対立遺伝子頻度の観測値を変え、性能を低下させ得る。これらの制約の全ては、特定の遺伝子座を首尾良く増幅するプライマーを特定し、更に、同じ多重反応で適合する多数のプライマーセットを設計するのを非常に困難なものにする。一実施形態において、順方向及び逆方向のインナープライマーの3’末端は、多型部位から上流のDNA領域にハイブリダイズするように設計され、少数の塩基によって多型部位から分離する。理想的には、塩基の数は、6~10塩基であってもよいが、同様に、4~15塩基、3~20塩基、2~30塩基又は1~60塩基であってもよく、実質的に同じ末端を達成し得る。
【0389】
多重PCRは、全ての標的が増幅される単一ラウンドのPCRを伴っていてもよく、又は1ラウンドのPCRの後、1ラウンド以上のネスティッドPCR又はネスティッドPCRのいくつかの変形例を伴っていてもよい。ネスティッドPCRは、少なくとも1つの塩基対によって、以前のラウンドで使用されたプライマーに対して内部で結合する1つ以上の新しいプライマーを用いる、その後の1以上のラウンドのPCR増幅からなる。ネスティッドPCRは、その後の反応において、修正された内部配列を有する従来のものからの増幅産物のみを増幅することによって、誤った増幅標的の数を減らす。誤った増幅標的を減らすことで、特に配列決定において得ることができる有用な測定値の数を改善する。ネスティッドPCRは、典型的には、従来のプライマー結合部位に対して完全に内部にプライマーを設計することを伴い、増幅に必要な最小DNAセグメントの大きさを必然的に増加させる。DNAが高度にフラグメント化されるサンプル(例えば、母体血漿cfDNA)について、アッセイサイズが大きいほど、測定値を得ることができる別個のcfDNA分子の数が減る。一実施形態において、この影響を相殺するために、第2ラウンドのプライマーの片方又は両方が、全アッセイサイズを最小限だけ大きくしつつ、更なる特異性を達成するために内部に数個の塩基を伸長する第1の結合部位と重複する、部分的なネスティッド手法を使用してもよい。
【0390】
一実施形態において、PCRアッセイの多重プールは、1つ以上の染色体上の潜在的にヘテロ接合性のSNP又は他の多型若しくは非多型の遺伝子座を増幅するように設計され、これらのアッセイは、単一反応で使用され、DNAを増幅する。PCRアッセイの数は、50~200PCRアッセイ、200~1,000PCRアッセイ、1,000~5,000PCRアッセイ又は5,000~20,000PCRアッセイ(それぞれ、50~200反応分、200~1,000反応分、1,000~5,000反応分、5,000~20,000反応分、20,000より多い反応分)であってもよい。一実施形態において、約10,000PCRアッセイ(10,000反応分)の多重プールは、染色体X、Y、13、18及び21及び1又は2上の潜在的にヘテロ接合性のSNPを増幅するように設計され、これらのアッセイは、単一反応で使用され、材料の血漿サンプル、絨毛膜絨毛サンプル、羊水穿刺サンプル、単一細胞又は少数の細胞、他の体液又は組織、がん、又は遺伝物質から得られるcfDNAを増幅する。各遺伝子座のSNP頻度は、クローンによって、又はアンプリコンを配列決定するいくつかの他の方法によって決定されてもよい。対立遺伝子頻度分布又は全てのアッセイの比率の統計分析を使用して、サンプルが、試験に含まれる染色体のうちの1つ以上のトリソミーを含有するかどうかを決定してもよい。別の実施形態において、元々のcfDNAサンプルは、2つのサンプルに分割され、並行な5,000反応分のアッセイが行われる。別の実施形態において、元々のcfDNAサンプルは、n個のサンプルに分割され、並行な(約10,000/n)反応分のアッセイが行われ、ここで、nは、2~12又は12~24又は24~48又は48~96である。データは、既に記載されているものと同様の方法で収集され、分析される。なお、この方法は、転座、欠失、重複及び他の染色体異常を検出するために、同様に十分に適用可能である。
【0391】
一実施形態において、標的ゲノムに対して相同性を有さないテールも、プライマーのいずれかの3’又は5’末端に付加されてもよい。これらのテールは、その後の操作、手順又は測定を容易にする。一実施形態において、テールの配列は、順方向及び逆方向の標的特異性プライマーと同じであってもよい。一実施形態において、異なるテールが、順方向及び逆方向の標的特異性プライマーのために使用されてもよい。一実施形態において、複数の異なるテールが、異なる遺伝子座又は遺伝子座のセットに使用されてもよい。特定のテールは、全ての遺伝子座間で、又は遺伝子座の部分集合間で共有されてもよい。例えば、現在の配列決定プラットフォームのいずれかによって必要とされる順方向及び逆方向の配列に対応する順方向及び逆方向のテールを用いることで、直接的な配列決定の後、増幅を可能にする。一実施形態において、テールは、他の有用な配列を付加するために使用可能な全ての増幅標的の間で、共通のプライミング部位として使用可能である。いくつかの実施形態において、インナープライマーは、標的多型遺伝子座の上流又は下流のいずれかにハイブリダイズするように設計された領域を含有してもよい。いくつかの実施形態において、プライマーは、分子バーコードを含有してもよい。いくつかの実施形態において、プライマーは、PCR増幅を可能にするように設計されたユニバーサルプライミング配列を含有してもよい。
【0392】
一実施形態において、10,000反応分のPCRアッセイプールは、順方向及び逆方向のプライマーが、高スループット配列決定装置、例えば、ILLUMINAから入手可能なHISEQ、GAIIX又はMYSEQによって必要とされる必要な順方向及び逆方向の配列に対応するテールを有するように作成される。これに加えて、アンプリコンに対してヌクレオチドバーコード配列を付加するために、その後のPCRのプライミング部位として使用可能な更なる配列が、配列決定テールに対して5’に含まれ、高スループット配列決定装置の単一レーンにおいて複数サンプルの多重配列決定を可能にする。
【0393】
一実施形態において、10,000反応分のPCRアッセイプールは、逆方向プライマーが、高スループット配列決定装置によって必要とされる必要な逆方向配列に対応するテールを有するように作成される。第1の10,000反応分のアッセイを用いて増幅した後、その後のPCR増幅は、全ての標的について部分ネスティッド順方向プライマー(例えば、6塩基ネスティッド)と、第1ラウンドに含まれる逆方向配列決定テールに対応する逆方向プライマーとを含む、別の10,000反応分のプールを用いて行われてもよい。たった1つの標的特異性プライマーとユニバーサルプライマーを用いる、この後のラウンドの部分ネスティッド増幅は、アッセイの必要なサイズを制限し、サンプリングノイズを減らすが、誤ったアンプリコンの数を大きく減らす。配列決定タグは、付けられたライゲーションアダプターに、及び/又はPCRプローブの一部として付加されてもよく、その結果、このタグは、最終的なアンプリコンの一部である。
【0394】
胎児画分は、検査の性能に影響を及ぼす。母体血漿に見られるDNAの胎児画分を濃くするいくつかの方法が存在する。胎児画分は、既に記載した、以前に記載したLM-PCR方法によって、また、長い母体フラグメントの標的化した除去によって高めることができる。一実施形態において、標的遺伝子座の多重PCR増幅の前に、更なる多重PCR反応を行い、その後の多重PCRにおいて標的化される遺伝子座に対応する、長く、更に大きな母体フラグメントを選択的に除去してもよい。更なるプライマーは、無細胞胎児DNAフラグメントの中に存在すると予測されるものよりも多型からの距離が長い部位をアニーリングするように設計される。これらのプライマーは、標的多型遺伝子座の多重PCRの前に、1サイクルの多重PCRで使用されてもよい。これらの遠位のプライマーは、タグ化されたDNA片の選択的認識を可能にする分子又は部分でタグ化される。一実施形態において、DNAのこれらの分子は、1サイクルのPCR後にこれらのプライマーを含む新しく形成した二本鎖DNAの除去を可能とするビオチン分子を用いて共有結合によって修飾されてもよい。その第1ラウンド中に形成された二本鎖DNAは、おそらく母体由来である。ハイブリッド材料の除去は、磁気ストレプトアビジンビーズの使用によって達成されてもよい。他にも同様に十分に機能し得る他のタグ化方法が存在する。一実施形態において、サイズ選択方法を使用して、DNAのより短い鎖(例えば、約800bp未満、約500bp未満、又は約300bp未満)について、サンプルを濃縮してもよい。その後、短いフラグメントの増幅を、通常通りに進めてもよい。
【0395】
本開示に記載のミニPCR方法は、単一サンプルから、単一反応において数百から数千、又は更に数百万の遺伝子座の高度に多重化された増幅及び分析を可能にする。同時に、増幅したDNAの検出は、多重化されてもよい。数十から数百のサンプルは、バーコードPCRを使用することによって、1つの配列決定レーンにおいて多重化することができる。この多重化された検出は、49反応分までを首尾良く試験し、かなり高度な多重化が可能である。実際には、このことにより、単一の配列決定ランにおいて、数百のサンプルを数千のSNPで遺伝子型決定することを可能にする。これらのサンプルについて、本方法は、遺伝子型及びヘテロ接合率の決定と、同時にコピー数の決定を可能にし、その両方が、異数性検出の目的のために使用可能である。この方法は、母体血漿中に見出される遊離浮遊DNAから妊娠中の胎児の異数性を検出するのに特に有用である。この方法は、胎児の性別決定、及び/又は胎児の父性の予測のための方法の一部として使用されてもよい。変異投薬方法の一部として使用可能である。この方法は、任意の量のDNA又はRNAについて使用されてもよく、標的領域は、SNP、他の多型領域、非多型領域、及びこれらの組み合わせであってもよい。
【0396】
いくつかの実施形態において、フラグメント化されたDNAのライゲーション媒介ユニバーサルPCR増幅が使用されてもよい。ライゲーション媒介ユニバーサルPCR増幅を使用して、血漿DNAを増幅させてもよく、次いで、これを複数の並行反応に分割してもよい。これを使用して、短いフラグメントを優先的に増幅し、それによって、胎児画分を高めてもよい。いくつかの実施形態において、ライゲーションによるフラグメントに対するタグの付加は、より短いフラグメントの検出、プライマーのより短い標的配列特異性部分の使用及び/又は非特異的な反応を減らす、より高い温度でのアニーリングを可能にする。
【0397】
本明細書に記載される方法は、ある量のコンタミネーションDNAと混合した標的DNAのセットが存在するいくつかの目的のために使用されてもよい。いくつかの実施形態において、標的DNA及びコンタミネーションDNAは、遺伝的に関連する個体に由来するものであってもよい。例えば、胎児(標的)における遺伝子異常は、胎児(標的)DNAを含有し、母体の(コンタミネーション)DNAも含む母体の血漿から検出されてもよい。以上としては、全染色体異常(例えば、異数性)、部分染色体異常(例えば、欠失、重複、逆位、転座)、ポリヌクレオチド多型(例えば、STR)、単一ヌクレオチドバリアント多型及び/又は他の遺伝子異常又は違いが挙げられる。いくつかの実施形態において、標的およびコンタミネーションDNAは、同じ個体に由来していてもよいが、標的及びコンタミネーションDNAは、例えば、がんの場合に、1つ以上の変異によって異なっている。(例えば、H.Mamon et al.Preferential Amplification of Apoptotic DNA from Plasma:Potential for Enhancing Detection of Minor DNA Alterations in Circulating DNA.Clinical Chemistry 54:9(2008)を参照のこと。いくつかの実施形態において、DNAは、細胞培養物(アポトーシス)の上清に見出されてもよい。いくつかの実施形態において、その後のライブラリ調製、増幅及び/又は配列決定のために、生体サンプル(例えば、血液)におけるアポトーシスを誘発することが可能である。この目的を達成するためのいくつかの実行可能なワークフロー及びプロトコルは、本開示の別の箇所に提示されている。
【0398】
いくつかの実施形態において、標的DNAは、単一細胞に由来していてもよく、標的ゲノムの1個より少ないコピーからなるDNAのサンプルに由来していてもよく、少量のDNAに由来していてもよく、混合起源(例えば、妊娠血漿:胎盤及び母体DNA、がん患者の血漿及び腫瘍、健康なDNAとがんDNAの混合、移植など)からのDNAに由来していてもよく、他の体液に由来していてもよく、細胞培養物に由来していてもよく、培養物の上清に由来していてもよく、DNAの法医学サンプルに由来していてもよく、DNAの古代のサンプル(例えば、コハクに捕捉された昆虫)に由来していてもよく、DNAの他のサンプルに由来していてもよく、それらの組み合わせであってもよい。
【0399】
いくつかの実施形態において、短いアンプリコンサイズが使用されてもよい。短いアンプリコンサイズは、フラグメント化されたDNAに特に適している(例えば、A.Sikora,et sl.Detection of increased amounts of cell-free fetal DNA with short PCR amplicons.Clin Chem.2010 Jan;56(1):136-8を参照のこと)。
【0400】
短いアンプリコンサイズの使用は、いくつかの顕著な利益をもたらし得る。短いアンプリコンサイズは、最適化された増幅効率をもたらし得る。短いアンプリコンサイズは、典型的には、より短い産物を産生するため、非特異的なプライミングの機会が少ない。産物が短いほど、クラスターが小さくなり得るので、配列決定フローセル上で、より密にクラスター化させることができる。なお、本明細書に記載される方法は、より長いPCRアンプリコンについても同様に十分に機能し得る。アンプリコンの長さは、必要な場合、例えば、更に大きな配列の伸長物を配列決定するときに、長くなるだろう。ネスティッドPCRプロトコルの最初の工程として100bp~200bp長のアッセイを用いた、146反応分の標的化増幅による実験は、単一セルで、陽性結果を有するゲノムDNAに対して実行された。
【0401】
いくつかの実施形態において、本明細書に記載される方法を使用して、SNP、コピー数、ヌクレオチドメチル化、mRNAレベル、他の種類のRNA発現レベル、他の遺伝的及び/又はエピジェネティックな特徴を増幅及び/又は検出してもよい。本明細書に記載されるミニPCR方法は、次世代配列決定とともに使用されてもよく、マイクロアレイ、デジタルPCRによる計数、リアルタイムPCR、質量分光計による分析などの他の下流の方法とともに使用されてもよい。
【0402】
いくつかの実施形態において、本明細書に記載のミニPCR増幅方法は、少数集合の正確な定量化のための方法の一部として使用されてもよい。スパイクキャリブレータを使用した絶対的な定量化に使用されてもよい。非常に深い配列決定を介する変異/マイナー対立遺伝子定量化に使用されてもよく、非常に多重化された態様で実行されてもよい。ヒト、動物、植物又は他の生物における血縁又は祖先の標準的な起源及び同一性の検査に使用されてもよい。法医学検査に使用されてもよい。任意の種類の物質、例えば、羊水及びCVS、精子、受胎産物(POC)に対する、迅速な遺伝子型決定及びコピー数分析(CN)に使用してもよい。胚から生検採取されたサンプルに対する遺伝子型決定など、単一細胞分析に使用されてもよい。ミニPCRを使用した標的化配列決定によって、迅速な胚分析(1日未満、1日又は2日の範囲内の生検)に使用してもよい。
【0403】
いくつかの実施形態において、ミニPCRは、腫瘍分析に使用することができる。腫瘍生検は、多くは、健康な細胞及び腫瘍細胞の混合物である。標的化PCRは、バックグラウンド配列がほぼない状態でのSNP及び遺伝子座の深い配列決定を可能にする。腫瘍DNAに対するコピー数とヘテロ接合性の消失の分析に使用されてもよい。当該腫瘍DNAは、腫瘍患者の多くの異なる体液又は組織中に存在していてもよい。腫瘍再発の検出及び/又は腫瘍スクリーニングに使用されてもよい。種子の品質管理検査に使用されてもよい。飼育又は漁業の目的で使用されてもよい。なお、これらの方法のいずれも、倍数性コールを目的として非多型遺伝子座を標的化することに同様に十分に使用されてもよい。
【0404】
本明細書に開示される方法の基礎となるいくつかの基本的な方法を説明するいくつかの文献としては、以下のものが挙げられる。(1)Wang HY,Luo M,Tereshchenko IV,Frikker DM,Cui X,Li JY,Hu G,Chu Y,Azaro MA,Lin Y,Shen L,Yang Q,Kambouris ME,Gao R,Shih W,Li H. Genome Res.2005 Feb;15(2):276-83.Department of Molecular Genetics,Microbiology and Immunology/The Cancer Institute of New Jersey,Robert Wood Johnson Medical School,New Brunswick,New Jersey 08903,USA.(2)High-throughput genotyping of single nucleotide polymorphisms with high sensitivity.Li H,Wang HY,Cui X,Luo M,Hu G,Greenawalt DM,Tereshchenko IV,Li JY,Chu Y,Gao R.Methods Mol Biol.2007;396-PubMed PMID:18025699.(3)配列決定のための平均9個のアッセイの多重化を含む方法は、以下に記載されている:Nested Patch PCR enables highly multiplexed mutation discovery in candidate genes.Varley KE,Mitra RD. Genome Res.2008 Nov;18(11):1844-50.Epub 2008 Oct 10。本明細書に開示される方法は、上述の参考文献よりも大きな桁数の多重化を可能にすることに留意されたい。
【0405】
タンパク質設計
高度に多重化したPCRは、多くは、プライマーダイマー生成などの生産的ではない副反応から得られる非常に高い割合の産物DNAを生成し得る。一実施形態において、生産的ではない副反応を引き起こす可能性が最も高い特定のプライマーは、プライマーライブラリから除去され、ゲノムにマッピングする増幅されたDNAの割合を大きくするプライマーライブラリを与え得る。問題のあるプライマー、すなわち、ダイマーを安定させる可能性が特に高いプライマーを除去する工程は、予測できないことに、その後の配列決定による分析のための非常に高いPCR多重化レベルを可能にした。プライマーダイマー及び/又は他の害毒生成物によって性能が著しく低下する配列決定などのシステムにおいて、他の記載の多重化よりも10倍、50倍、及び100倍以上高い多重化が達成されている。これは、プローブベースの検出方法、例えば、マイクロアレイ、TaqMan、PCRなどとは対照的であり、過剰なプライマーダイマーは、結果に有意に影響を及ぼさないことを留意されたい。また、当該技術分野における一般的な信念は、配列決定のための多重化PCRが、同じウェル内で約100のアッセイに限定されることであることに留意されたい。例えばFluidigm及びRain Danceは、1つのサンプルについて並行反応で48又は1000のPCRアッセイを実施するためのプラットフォームを提供する。
【0406】
非マッピングプライマーダイマー又は他のプライマー妨害産物の量が最小限にされたライブラリのためのプライマーを選択するいくつかの方法が存在する。経験的なデータは、少数の「悪い」プライマーが、多量の非マッピングプライマーダイマー副反応の原因であることを示す。これらの「悪い」プライマーを除去することで、標的遺伝子座へマッピングする配列リードの割合を高めることができる。「悪い」プライマーを特定するための1つの方法は、標的化された増幅によって増幅されたDNAの配列決定データを見ることであり、最も頻繁に見られるこれらのプライマーダイマーが除去され、ゲノムにマッピングされない副産物DNAを生じる可能性が顕著に低いプライマーライブラリを与えることができる。様々なプライマーの組み合わせの結合エネルギーを計算することができる公的に利用可能なプログラムも存在し、最も高い結合エネルギーを有するものを除去することで、ゲノムにマッピングされない副産物DNAを生じる可能性が顕著に低いプライマーライブラリも与えるだろう。
【0407】
多数のプライマーを多重化することで、含まれ得るアッセイにかなりの制約を課す。意図せずに相互作用するアッセイは、偽の増幅産物を生じる。ミニPCRのサイズ制約は、更なる制約を引き起こし得る。一実施形態において、非常に多数の潜在的なSNP標的(約500から100万より多くまで)から開始し、各SNPを増幅するようにプライマーを設計するように企画することが可能である。プライマーを設計することが可能な場合、DNA二本鎖生成のための公開されている熱力学的パラメータを用い、全ての可能なプライマー対間の偽のプライマー二本鎖生成の尤度を評価することによって、偽の産物を生成する可能性があるプライマー対を特定するように企画することが可能である。プライマーの相互作用は、この相互作用に関連するスコアリング関数によってランク付けされてもよく、最も悪い相互作用スコアを有するプライマーは、望ましいプライマー数を満たすまで、除外される。ヘテロ接合性である可能性があるSNPが最も有用である場合、アッセイのリストもランク付けし、最もヘテロ接合性に適合するアッセイを選択することが可能である。高い相互作用スコアを有するプライマーが、プライマーダイマーを形成する可能性が最も高いことが実験で検証されている。高度に多重化すると、全ての偽の相互作用を除外することは可能ではないが、反応全体を支配し、意図した標的からの増幅を大きく制限することがあるため、in silicoで最も高い相互作用スコアを有するプライマー又はプライマー対を除外することが不可欠である。この手順を行い、10,000プライマーまでの複数のプライマーセットを作成した。この手順に起因する改善は、かなりのものであり、全てのPCR産物によって決定されるような標的産物に対して、最も悪いプライマーが除去されなかった反応からの10%と比較して、80%より多く、90%より多く、95%より多く、98%より多く、更に99%より多くの増幅を可能にする。既に記載したように、部分的なセミネスティッド手法と組み合わせると、アンプリコンの90%より多く、更に95%より多くが、標的配列にマッピングされ得る。
【0408】
なお、どのPCRプローブがダイマーを形成する可能性が高いかを決定する他の方法が存在する。一実施形態において、最適化されていないプライマーセットを用いて増幅されたDNAのプールの分析は、問題のあるプライマーを決定するのに十分な場合がある。例えば、分析は、配列決定を用いて行われてもよく、最も多く存在するこれらのダイマーは、ダイマーを形成する可能性が最も高いものであると決定され、除去されてもよい。
【0409】
この方法は、例えば、SNP遺伝子型決定、ヘテロ接合率決定、コピー数測定、及び他の標的化配列決定用途へのいくつかの潜在的な用途を有する。一実施形態において、プライマー設計の方法は、本文書の別の箇所に記載のミニPCR方法と組み合わせて使用されてもよい。いくつかの実施形態において、プライマー設計方法は、大規模多重化PCR方法の一部として使用されてもよい。
【0410】
プライマーに対するタグの使用は、プライマーダイマー産物の増幅及び配列決定を減らし得る。タグプライマーを使用して、必要な標的特異性配列を20未満、15未満、12未満、更に10未満の塩基対まで短くすることができる。これは、標的配列がプライマー結合部位へとフラグメント化される場合、又はプライマー設計へと設計される場合に、予想外の発見となり得る。この方法の利点は、特定の最大アンプリコン長のために設計可能なアッセイの数を増やすことと、プライマー配列の「無情報」配列決定を短くすることを含む。内部タグ化と組み合わせ使用することも可能である(本文書の別の箇所を参照のこと)。
【0411】
一実施形態において、多重標的化PCR増幅における非生産的な産物の相対量は、アニーリング温度を上げることによって減らすことができる。標的特異性プライマーと同じタグを用いてライブラリを増幅する場合、アニーリング温度は、タグがプライマー結合に寄与するため、ゲノムDNAと比較して、高くすることができる。いくつかの実施形態において、他の場所で報告されたよりも長いアニーリング時間を使用することとともに、以前に報告されたよりもかなり低いプライマー濃度を使用している。いくつかの実施形態において、アニーリング時間は、10分間より長く、20分間より長く、30分間より長く、60分間より長く、120分間より長く、240分間より長く、480分間より長く、更に960分間より長くてもよい。一実施形態において、より長くアニーリング時間を、以前の報告よりも使用し、より低いプライマー濃度を可能にする。いくつかの実施形態において、プライマー濃度は、50nM、20nM、10nM、5nM、1nM程度の低さ、及び1uM未満である。これにより、驚くべきことに、高度に多重化された反応、例えば、1000倍反応、2000倍反応、5000倍反応、10000倍反応、20000倍反応、50000倍反応及び更に100000倍反応について、安定した性能が得られる。一実施形態において、増幅は、長いアニーリング時間を有する1、2、3、4又は5サイクルを使用し、その後、タグ化プライマーを用い、通常の更に長いアニーリング時間を有するPCRサイクルを使用する。
【0412】
標的位置を選択するために、候補プライマー対設計のプールから開始し、プライマー対との間の潜在的に有害な副次的相互作用の熱力学的モデルを作成し、次いで、プール中の他の設計と互換性のない設計を除外するモデルを使用してもよい。
【0413】
標的化PCRバリアント-ネスティング
PCRを実施するときに可能な多くのワークフローが存在し、本明細書に開示される方法に典型的ないくつかのワークフローが記載されている。本明細書で概説される工程は、他の可能な工程を除外することを意味しておらず、本明細書に記載される工程のいずれかが本方法が適切に機能するのに必要であることを暗示するものでもない。多数のパラメータの変動又は他の改変は、文献で既知であり、本発明の本質に影響を与えることなく行うことができる。1つの特定の一般化されたワークフローに続いて、いくつかの可能なバリアントが以下に示される。バリアントは、典型的には、可能な二次PCR反応、例えば、行われ得る異なるタイプのネスティングを指す(工程3)。バリアントは、本明細書に明示的に記載されているものとは異なる時間に、又は異なる順序で行われてもよいことに留意することが重要である。
【0414】
1.サンプル中のDNAは、付随したライゲーションアダプター(ライブラリタグ又はライゲーションアダプタータグ(LT)と呼ばれることが多い)を有していてもよく、ライゲーションアダプターは、ユニバーサルプライミング配列を含有し、続いて、ユニバーサル増幅を含む。一実施形態において、このことは、フラグメント化の後に配列決定ライブラリを作成するように設計された標準的なプロトコルを用いて行われてもよい。一実施形態において、DNAサンプルは、平滑末端であってもよく、次いで、Aがその3’末端に付加されていてもよい。Tオーバーハングを有するYアダプターを付加し、ライゲーションしてもよい。いくつかの実施形態において、A又はTオーバーハング以外の他の粘着末端を使用してもよい。いくつかの実施形態において、他のアダプター、例えば、ループ状ライゲーションアダプターを付加してもよい。いくつかの実施形態において、アダプターは、PCR増幅のために設計されたタグを有していてもよい。
【0415】
2.特異的標的増幅(STA):数百から数千から数万、更には数十万の標的の事前増幅は、1つの反応で多重化され得る。STAは、典型的には10~30サイクルであるが、5~40サイクル、2~50サイクル、更には1~100サイクルであってもよい。プライマーは、例えば、より単純なワークフローのために、又はダイマーの大部分の配列決定を回避するために、テール状であってもよい。典型的には、同じタグを担持する両方のプライマーのダイマーは、効率的に増幅又は配列決定されないことに留意されたい。いくつかの実施形態において、1~10サイクルのPCRが実施されてもよく、いくつかの実施形態において、10~20サイクルのPCRが実施されてもよく、いくつかの実施形態において、20~30サイクルのPCRが実施されてもよく、いくつかの実施形態において、30~40サイクルのPCRが実施されてもよく、いくつかの実施形態において、40サイクルを超えるPCRが実施されてもよい。増幅は、線形増幅であり得る。PCRサイクルの数は、最適なリード深度(DOR)プロファイルをもたらすように最適化され得る。異なるDORプロファイルは、異なる目的のために望ましい場合がある。いくつかの実施形態において、全てのアッセイ間のリードのより均等な分布が望ましく、DORがいくつかのアッセイに対して小さすぎる場合、確率論的ノイズは、データがあまりにも有用であるために高すぎる場合があるが、リード深度が大きすぎる場合、各追加リードの限界有用性は、比較的小さい。
【0416】
プライマーテールは、普遍的にタグ化されたライブラリからのフラグメント化されたDNAの検出を改善することができる。ライブラリタグ及びプライマーテールが、相同配列を含有する場合、ハイブリダイゼーションを改善することができ(例えば、融点(T)を下げる)、プライマー標的配列の一部のみがサンプルDNAプライマーフラグメント中にある場合、プライマーを伸長することができる。いくつかの実施形態において、13個以上の標的特異性塩基対が使用されてもよい。いくつかの実施形態において、10~12個の標的特異性塩基対が使用されてもよい。いくつかの実施形態において、8~9つの標的特異性塩基対が使用されてもよい。いくつかの実施形態において、6~7つの標的特異性塩基対が使用されてもよい。いくつかの実施形態において、STAは、事前に増幅されたDNA、例えば、MDA、RCA、他の全ゲノム増幅、又はアダプター媒介ユニバーサルPCR上で行われてもよい。いくつかの実施形態において、STAは、特定の配列及び集団が濃縮されているか、又は枯渇しているサンプル、例えば、サイズ選択、標的捕捉、指向性分解によって行われてもよい。
【0417】
3.いくつかの実施形態において、特異性を増加させ、望ましくない生成物を低減するために、二次多重PCR又はプライマー伸長反応を行うことが可能である。例えば、完全なネスティング、セミネスティング、ヘミネスティング、及び/又はより小さいアッセイプールの並行反応への細分化は、特異性を増加させるために使用され得る全ての技術である。実験は、サンプルを3つの400プレックス反応に分割することが、正確に同じプライマーを用いた1つの1,200プレックス反応よりも高い特異性を有する生成物DNAをもたらすことを示している。同様に、実験は、サンプルを4つの2,400プレックス反応に分割することは、正確に同じプライマーを用いた1つの9,600プレックス反応よりも高い特異性を有する生成物DNAをもたらすことを示した。一実施形態において、同じ及び反対の方向性の標的特異性及びタグ特異性プライマーを使用することが可能である。
【0418】
4.いくつかの実施形態において、タグ特異的プライマー及び「ユニバーサル増幅」を使用して、STA反応によって生成されるDNAサンプル(希釈、精製、又はそうでなければ)を増幅すること、すなわち、多く又は全ての事前に増幅され、タグ付けされた標的を増幅することが可能である。プライマーは、追加の機能的配列、例えば、バーコード、又は高スループット配列決定プラットフォーム上で配列決定するために必要な完全なアダプター配列を含有し得る。
【0419】
これらの方法は、任意のDNAサンプルの分析に使用されてもよく、DNAサンプルが特に小さい場合、又はDNAが母体血漿の場合など、複数の個体に由来するDNAサンプルの場合に特に有用である。これらの方法は、単一又は少数の細胞、ゲノムDNA、血漿DNA、増幅血漿ライブラリ、増幅アポトーシス上清ライブラリ、又は混合DNAの他のサンプルなどのDNAサンプルに使用されてもよい。一実施形態において、これらの方法は、がん又は移植など、異なる遺伝子構成の細胞が単一の個体に存在し得る場合に使用されてもよい。
【0420】
ループ状ライゲーションアダプター
例えば、配列決定のためのライブラリを作製する目的でユニバーサルタグ付きアダプターを追加する場合、アダプターをライゲーションするいくつかの方法が存在する。1つの方法は、サンプルDNAを平滑化し、Aテーリングを行い、Tオーバーハングを有するアダプターでライゲーションすることである。アダプターをライゲーションするいくつかの他の方法が存在する。ライゲーションすることができるいくつかのアダプターも存在する。例えば、Yアダプターは、アダプターが、一方の鎖が二本鎖領域を有し、かつ順方向プライマー領域によって特定される領域を有するDNAの2本鎖からなり、他方の鎖が、第1の鎖上の二本鎖領域に相補的な二本鎖領域、及び逆方向プライマーを有する領域によって特定されるDNAの2本鎖からなる場合に使用することができる。二本鎖領域は、アニールされたときに、Aオーバーハングを有する二本鎖DNAにライゲーションする目的のために、Tオーバーハングを含有してもよい。
【0421】
内部タグ付きプライマー
配列決定を使用して所与の多型遺伝子座に存在する対立遺伝子を決定する場合、配列リードは、典型的には、プライマー結合部位(a)の上流から始まり、次いで多型部位(X)に至る。タグは、典型的には、構成される。101は、目的の多型遺伝子座「X」を有する一本鎖標的DNA、及び付加タグ「b」を有するプライマー「a」を指す。非特異的ハイブリダイゼーションを回避するために、プライマー結合部位(「a」に相補的な標的DNAの領域)は、典型的には18~30bp長である。配列タグ「b」は、典型的には約20bpであり、理論的には、これらは、約15bpよりも長い任意の長さであり得るが、多くの人々は、配列決定プラットフォーム企業によって販売されるプライマー配列を使用する。「a」と「X」との間の距離「d」は、対立遺伝子バイアスを回避するために、少なくとも2bpであってもよい。本明細書に開示される方法又は他の方法を使用して多重PCR増幅を実施する場合、過度のプライマープライマー相互作用を回避するために慎重なプライマー設計が必要である場合、「a」と「X」との間の許容距離「d」のウィンドウは、2bp~10bp、2bp~20bp、2bp~30bp、又は2bp~30bpより多くてもよい。したがって、プライマー構成を使用する場合、配列リードは、多型遺伝子座を測定するのに十分な長さのリードを得るために最低40bpでなければならず、「a」及び「d」の長さに応じて、配列リードは最大60又は75bpである必要があり得る。通常、配列リードが長いほど、所与の数のリードを配列決定するコスト及び時間が高くなり、したがって、必要なリード長を最小限に抑えることは、時間及び費用の両方を節約することができる。加えて、平均して、読み取りの前に読み取られた塩基は、読み取りの後に読み取られた塩基よりも正確に読み取られるため、必要な配列リード長を短くすることも、多型領域の測定の精度を高めることができる。
【0422】
内部タグ付きプライマーと呼ばれる一実施形態において、プライマー結合部位(a)は、複数のセグメント(a’,a’’,a’’’…)に分割され、配列タグ(b)は、プライマー結合部位のうちの2つの真ん中にあるDNAのセグメント上にある。この構成は、シーケンサがより短い配列リードを行うことを可能にする。一実施形態において、「+a」は、少なくとも約18bpであるべきであり、30、40、50、60、80、100又は100bpを超える長さであり得る。一実施形態において、「a」は、少なくとも約6bpであるべきであり、一実施形態において、約8~16bpである。他の全ての因子が等しい場合、内部タグ付きプライマーを使用すると、必要な配列リードの長さを、少なくとも6bp、最大8bp、10bp、12bp、15bp、更には最大20又は30bp短縮することができる。これにより、大幅なコスト、時間、精度の向上を実現できる。
【0423】
ライゲーションアダプター結合領域を有するプライマー
フラグメント化されたDNAの1つの問題は、長さが短いため、多型がDNA鎖の末端に近い可能性が長い鎖よりも高いことである。多型のPCR捕捉は、多型の両側に好適な長さのプライマー結合部位を必要とするため、標的多型を有するDNAのかなりの数の鎖は、プライマーと標的結合部位との間の不十分な重複のために見逃される。一実施形態において、標的DNAは、ライゲーションアダプターを付加することができ、標的プライマーは、設計された結合領域(a)の上流に付加されたライゲーションアダプタータグ(lt)に相補的な領域(cr)を有することができ、したがって、結合領域がハイブリダイゼーションに通常必要な18bpよりも短い場合、ライブラリタグに相補的なものよりもプライマー上の領域(cr)が、PCRを進めることができる点まで結合エネルギーを増加させることができる。短い結合領域に起因して失われる特異性は、適切に長い標的結合領域を有する他のPCRプライマーによって補うことができることに留意されたい。この実施形態は、直接PCR、又はネストPCR、セミネストPCR、ヘミネストPCR、片側ネストPCR若しくはセミネストPCR若しくはヘミネストPCR、又は他のPCRプロトコルなどの本明細書に記載される他の方法のいずれかと組み合わせて使用され得ることに留意されたい。
【0424】
様々な仮説について、観察された対立遺伝子データを予測される対立遺伝子分布と比較することを伴う分析方法と組み合わせて、倍数を決定するために配列決定データを使用する場合、低いリード深度を有する対立遺伝子からの各追加のリードは、高いリード深度を有する対立遺伝子からのリードよりも多くの情報をもたらす。したがって、理想的には、各遺伝子座が同様の数の代表的な配列リードを有する、均一なリード深度(DOR)を見たいと思う。したがって、DOR分散を最小化することが望ましい。一実施形態において、アニーリング時間を増加させることによって、DORの分散係数(これは、DOR/平均DORの標準偏差として定義されてもよい)を減少させることが可能である。いくつかの実施形態において、アニーリング温度は、2分間を超えてもよく、4分間を超えてもよく、10分間を超えてもよく、30分間を超えてもよく、1時間を超えてもよく、又は更に長くてもよい。アニーリングは平衡プロセスであるため、アニーリング時間の増加に伴うDOR分散の改善に制限はない。一実施形態において、プライマー濃度を増加させることは、DOR分散を減少させることができる。
【0425】
プライマーキット
いくつかの実施形態において、本開示に記載される方法を達成するように設計される複数のプライマーを含むキットが製剤化されてもよい。プライマーは、本明細書に開示されるように、外側の順方向及び逆方向のプライマー、内側の順方向及び逆方向のプライマーであってもよく、プライマー設計に関するセクションに開示されるように、キット内の他のプライマーへの低い結合親和性を有するように設計されたプライマーであってもよく、関連するセクションに記載されるように、ハイブリッド捕捉プローブ又は事前に環状化されたプローブであってもよく、又はそれらのいくつかの組み合わせであってもよい。一実施形態において、本明細書に開示される方法とともに使用されるように設計された妊娠中の胎児における標的染色体の倍数性状態を決定するためのキットが製剤化されてもよく、本キットは、複数の内側順方向プライマー及び任意選択で複数の内側逆方向プライマー、並びに任意選択で外側順方向プライマー及び外側逆方向プライマーを含み、各プライマーは、標的染色体、及び任意選択で更なる染色体上の多型部位のうちの1つからすぐ上流及び/又は下流のDNAの領域にハイブリダイズするように設計されている。一実施形態において、プライマーキットは、本文書の別の箇所に記載の診断ボックスと組み合わせて使用されてもよい。
【0426】
DNAの組成物
胎児に関連するゲノム情報、例えば胎児の倍数性状態を決定するために、胎児及び母体の血液の混合物で測定された配列決定データに対して情報分析を行う場合、対立遺伝子のセットで対立遺伝子の分布を測定することが有利であり得る。残念ながら、多くの場合、母体血液サンプルの血漿中に見出されるDNA混合物から胎児の倍数性状態を決定しようとするときなど、利用可能なDNAの量は、混合物中の対立遺伝子分布を良好な忠実度で直接測定するのに十分ではない。これらの場合において、DNA混合物の増幅は、所望の対立遺伝子分布が良好な忠実度で測定され得るのに十分な数のDNA分子を提供する。しかしながら、配列決定のためのDNAの増幅に典型的に使用される現在の増幅方法は、多くの場合非常にバイアスがかかっており、多型遺伝子座における両方の対立遺伝子を同じ量増幅しないことを意味する。バイアス増幅は、元の混合物中の対立遺伝子分布とはまったく異なる対立遺伝子分布をもたらし得る。ほとんどの目的のために、多型遺伝子座に存在する対立遺伝子の相対量の高精度な測定は必要ではない。対照的に、本開示の一実施形態において、多型対立遺伝子を特異的に濃縮し、対立遺伝子比を保持する増幅又は濃縮方法が有利である。
【0427】
対立遺伝子バイアスを最小限に抑える方法で、複数の遺伝子座でDNAのサンプルを優先的に濃縮するために使用され得るいくつかの方法が本明細書に記載される。いくつかの例は、環化プローブを使用して、予め環化されたプローブの3’末端及び5’末端が、標的対立遺伝子の多型部位から離れた1つ又はいくつかの位置である塩基にハイブリダイズするように設計されている複数の遺伝子座を標的化することである。別のものは、3’末端PCRプローブが、標的対立遺伝子の多型部位から離れた1つ又はいくつかの位置である塩基にハイブリダイズするように設計されるPCRプローブを使用することである。もう1つは、スプリットアンドプールアプローチを使用して、優先的に濃縮された遺伝子座が、直接多重化の欠点なしに低い対立遺伝子バイアスで濃縮されるDNAの混合物を作製することである。別のものは、標的の多型部位に隣接するDNAにハイブリダイズするように設計される捕捉プローブの領域が、1つ又は少数の塩基によって多型部位から分離されるように、捕捉プローブが設計されたハイブリッド捕捉アプローチを使用することである。
【0428】
多型遺伝子座のセットで測定された対立遺伝子の分布が個体の倍数性状態を決定するために使用される場合、遺伝子測定のために調製されるとき、DNAのサンプル中の対立遺伝子の相対量を保存することが望ましい。この調製は、WGA増幅、標的化増幅、選択的濃縮技術、ハイブリッド捕捉技術、環化プローブ、又はDNAの量を増幅すること、及び/又は特定の対立遺伝子に対応するDNA分子の存在を選択的に強化することを意図する他の方法を伴っていてもよい。
【0429】
本開示のいくつかの実施形態において、遺伝子座が最大のマイナー対立遺伝子頻度を有する遺伝子座を標的化するように設計されたDNAプローブのセットが存在する。本開示のいくつかの実施形態において、遺伝子座がそれらの遺伝子座において非常に有益なSNPを有する胎児の最大尤度を有する場所を標的化するように設計されたプローブのセットが存在する。本開示のいくつかの実施形態において、所与の集団サブグループに対してプローブが最適化される遺伝子座を標的化するように設計されたプローブのセットが存在する。本開示のいくつかの実施形態において、集団サブグループの所与の混合物に対してプローブが最適化される遺伝子座を標的化するように設計されたプローブのセットが存在する。本開示のいくつかの実施形態において、異なるマイナー対立遺伝子頻度プロファイルを有する異なる集団サブグループからの所与のペアの親に対してプローブが最適化される遺伝子座を標的化するように設計されるプローブのセットが存在する。本開示のいくつかの実施形態において、胎児起源のDNA片にアニールされた少なくとも1つの塩基対を含む環化DNA鎖が存在する。本開示のいくつかの実施形態において、胎盤起源のDNA片にアニールされた少なくとも1つの塩基対を含む環化DNA鎖が存在する。本開示のいくつかの実施形態において、ヌクレオチドの少なくともいくつかが胎児起源のDNAにアニーリングされている間に環化されたDNAの環化鎖が存在する。本開示のいくつかの実施形態において、ヌクレオチドの少なくともいくつかが胎盤起源のDNAにアニーリングされている間に環化したDNAの環化鎖が存在する。本開示のいくつかの実施形態において、いくつかのプローブが単一のタンデム反復を標的化し、いくつかのプローブが一塩基多型を標的化する、プローブのセットが存在する。いくつかの実施形態において、遺伝子座は、非侵襲性出生前診断の目的のために選択される。いくつかの実施形態において、プローブは、非侵襲性出生前診断の目的のために使用される。いくつかの実施形態において、遺伝子座は、環状化プローブ、MIP、ハイブリダイゼーションプローブによる捕捉、SNPアレイ上のプローブ、又はそれらの組み合わせを含み得る方法を使用して標的化される。いくつかの実施形態において、プローブは、環状化プローブ、MIP、ハイブリダイゼーションプローブによる捕捉、SNPアレイ上のプローブ、又はそれらの組み合わせとして使用される。いくつかの実施形態において、遺伝子座は、非侵襲性出生前診断の目的のために配列決定される。
【0430】
配列の相対的な情報量が、関連する親コンテキストと組み合わせた場合に大きい場合、親コンテキストが既知であるSNPを含む配列リードの数を最大化することは、混合サンプル上の配列リードのセットの情報量を最大化することができることになる。一実施形態において、親コンテキストが既知のSNPを含む配列リードの数は、qPCRを使用して特異的配列を優先的に増幅することによって増強されてもよい。一実施形態において、親コンテキストが既知のSNPを含む配列リードの数は、環化プローブ(例えば、MIP)を使用して特異的配列を優先的に増幅することによって増強されてもよい。一実施形態において、親コンテキストが既知のSNPを含む配列リードの数は、ハイブリダイゼーション法による捕捉(例えば、SURESELECT)を使用して特異的配列を優先的に増幅することによって増強されてもよい。親コンテキストが既知であるSNPを含む配列リードの数を増やすために、異なる方法を使用してもよい。一実施形態において、標的化は、伸長ライゲーション、伸長を伴わないライゲーション、ハイブリダイゼーションによる捕捉、又はPCRによって達成されてもよい。
【0431】
フラグメント化されたゲノムDNAのサンプルにおいて、DNA配列の画分は、個々の染色体に一意にマッピングされ、他のDNA配列は、異なる染色体上に見出され得る。血漿中に見出されるDNAは、母体であろうと胎児であろうと、典型的にはフラグメント化されており、多くの場合500bp未満の長さであることに留意されたい。典型的なゲノムサンプルでは、マッピング可能な配列の約3.3%が染色体13にマッピングされ、マッピング可能な配列の2.2%が染色体18にマッピングされ、マッピング可能な配列の1.35%が染色体21にマッピングされ、マッピング可能な配列の4.5%が女性の染色体Xにマッピングされ、マッピング可能な配列の2.25%が(男性の)染色体Xにマッピングされ、マッピング可能な配列の0.73%が(男性の)染色体Yにマッピングされる。これらは、胎児の異数体である可能性が最も高い染色体である。また、短い配列の中で、dbSNPに含まれるSNPを使用して、20個の配列のうち約1個がSNPを含む。多くのSNPが発見されていない可能性があることを考えると、この割合はより高くなり得る。
【0432】
本開示の一実施形態において、標的化方法を使用して、所与の染色体にマッピングするDNAのサンプル中のDNAの画分を、その画分がゲノムサンプルに典型的な上記のパーセンテージを有意に上回るように強化してもよい。本開示の一実施形態において、SNPを含有する配列の割合がゲノムサンプルの典型的なものよりも有意に大きいように、DNAのサンプル中のDNAの画分を強化するために標的化方法を使用してもよい。本開示の一実施形態において、標的化方法を使用して、出生前診断の目的のために、母体及び胎児DNAの混合物中の染色体又は一組のSNPからDNAを標的化してもよい。
【0433】
疑わしい染色体にマッピングするリードの数を数え、それを参照染色体にマッピングするリードの数と比較し、疑わしい染色体上のリードの過剰存在がその染色体における胎児における三重体に対応するという仮定を使用することによって、胎児の異数性を決定するための方法が報告されていることに留意されたい(米国特許第7,888,017号)。出生前診断のためのこれらの方法は、いかなる種類の標的化も利用せず、出生前診断のための標的化の使用も説明しない。
【0434】
混合サンプルを配列決定する際に標的化アプローチを利用することにより、より少ない配列リードで、ある程度の精度を達成することが可能であり得る。精度は、感度を指し得、特異性を指し得、又はそれらのいくつかの組み合わせを指し得る。所望の精度レベルは、90%~95%であってもよく、95%~98%であってもよく、98%~99%であってもよく、99%~99.5%であってもよく、99.5%~99.9%であってもよく、99.9%~99.99%であってもよく、99.99%~99.999%であってもよく、99.999%~100%であってもよい。95%を超える精度レベルは、高精度と呼ばれる場合がある。
【0435】
例えば、G.J.W.Liao et al.Clinical Chemistry 2011;57(1)pp.92-101のように、母体DNAと胎児DNAとの混合サンプルから胎児の倍数性状態をどのように決定し得るかを実証するいくつかの公開された方法が先行技術に存在する。これらの方法は、各染色体に沿った数千の位置に焦点を当てる。所与の数の配列リードについて、DNAの混合サンプルから、依然として胎児に対する高精度の倍数測定をもたらしながら、標的化され得る染色体に沿った位置の数は、予想外に低い。本開示の一実施形態において、正確な倍数決定は、標的化する任意の方法、例えば、qPCR、リガンド媒介PCR、他のPCR方法、ハイブリダイゼーションによる捕捉、又はプローブの環化を使用する、標的化配列決定を使用して行うことができ、標的化する必要がある染色体に沿った遺伝子座の数は、5,000~2,000遺伝子座であってもよく、2,000~1,000遺伝子座であってもよく、1,000~500遺伝子座であってもよく、500~300遺伝子座であってもよく300~200遺伝子座であってもよく、200~150遺伝子座であってもよく、150~100遺伝子座であってもよく、100~50遺伝子座であってもよく、50~20遺伝子座であってもよく、20~10遺伝子座であってもよい。任意選択で、100~500遺伝子座であってもよい。高いレベルの精度は、少数の遺伝子座を標的化し、予期せぬ少数の配列リードを実行することによって達成され得る。リード数は、1億~5000万リードであってもよく、リード数は、5000万~2000万リードであってもよく、リード数は、2000万~1000万リードであってもよく、リード数は、1000万~500万リードであってもよく、リード数は、500万~200万リードであってもよく、リード数は、200万~100万リードであってもよく、リード数は、100万~50万リードであってもよく、リード数は、50万~20万リードであってもよく、リード数は、20万~10万リードであってもよく、リード数は、10万~5万リードであってもよく、リード数は、5万~2万リードであってもよく、リード数は、2万~1万リードであってもよく、リード数は、1万未満であってもよい。より多くの量の入力DNAには、より少ない数のリードが必要である。
【0436】
いくつかの実施形態において、胎児起源のDNAと母体起源のDNAとの混合物を含む組成物が存在し、染色体13に一意にマッピングする配列の割合は、4%よりも多い、5%よりも多い、6%よりも多い、7%よりも多い、8%よりも多い、9%よりも多い、10%よりも多い、12%よりも多い、15%よりも多い、20%よりも多い、25%よりも多い、又は30%よりも多い。本開示のいくつかの実施形態において、胎児起源のDNAと母体起源のDNAとの混合物を含む組成物が存在し、染色体18に一意にマッピングする配列の割合は、3%よりも多い、4%よりも多い、5%よりも多い、6%よりも多い、7%よりも多い、8%よりも多い、9%よりも多い、10%よりも多い、12%よりも多い、15%よりも多い、20%よりも多い、25%よりも多い、又は30%よりも多い。本開示のいくつかの実施形態において、胎児起源のDNAと母体起源のDNAとの混合物を含む組成物が存在し、染色体21に一意にマッピングする配列の割合は、2%よりも多い、3%よりも多い、4%よりも多い、5%よりも多い、6%よりも多い、7%よりも多い、8%よりも多い、9%よりも多い、10%よりも多い、12%よりも多い、15%よりも多い、20%よりも多い、25%よりも多い、又は30%よりも多い。本開示のいくつかの実施形態において、胎児起源のDNAと母体起源のDNAとの混合物を含む組成物が存在し、染色体Xに一意にマッピングする配列の割合は、6%よりも多い、7%よりも多い、8%よりも多い、9%よりも多い、10%よりも多い、12%よりも多い、15%よりも多い、20%よりも多い、25%よりも多い、又は30%よりも多い。本開示のいくつかの実施形態において、胎児起源のDNAと母体起源のDNAとの混合物を含む組成物が存在し、染色体Yに一意にマッピングする配列の割合は、1%よりも多い、2%よりも多い、3%よりも多い、4%よりも多い、5%よりも多い、6%よりも多い、7%よりも多い、8%よりも多い、9%よりも多い、10%よりも多い、12%よりも多い、15%よりも多い、20%よりも多い、25%よりも多い、又は30%よりも多い。
【0437】
いくつかの実施形態において、胎児起源のDNAと母体起源のDNAとの混合物を含む組成物が記載され、染色体に一意にマッピングされ、少なくとも1つの一塩基多型を含有する配列の割合は、0.2%より多く、0.3%より多く、0.4%より多く、0.5%より多く、0.6%より多く、0.7%より多く、0.8%より多く、0.9%より多く、1%より多く、1.2%より多く、1.4%より多く、1.6%より多く、1.8%より多く、2%より多く、2.5%より多く、3%より多く、4%より多く、5%より多く、6%より多く、7%より多く、8%より多く、9%より多く、10%より多く、12%より多く、15%より多く、又は20%より多く、染色体は、13、18、21、X、又はY群から取り出される。本開示のいくつかの実施形態において、胎児起源のDNAと母体起源のDNAとの混合物を含む組成物が存在し、染色体に一意にマッピングされ、一組の一塩基多型からの少なくとも1つの一塩基多型を含む配列の割合は、0.15%超、0.2%超、0.3%超、0.4%超、0.5%超、0.6%超、0.7%超、0.8%超、0.9%超、1%超、1.2%超、1.4%超、1.6%超、1.8%超、2%超、2.5%超、3%超、4%超、5%超、6%超、7%超、8%超、9%超、10%超、12%超、15%超、又は20%超であり、染色体は、染色体13、18、21、X及びYのセットから取り出され、一塩基多型のセットにおける一塩基多型の数は、1~10、10~20、20~50、50~100、100~200、200~500、500~1,000、1,000~2,000、2,000~5,000、5,000~10,000、10,000~20,000、20,000~50,000及び50,000~100,000である。
【0438】
理論的には、増幅の各サイクルは、存在するDNAの量を2倍にするが、実際には、増幅の程度は2よりわずかに低い。理論的には、標的化増幅を含む増幅は、DNA混合物のバイアスフリー増幅をもたらし、しかしながら、実際には、異なる対立遺伝子は、他の対立遺伝子とは異なる程度に増幅される傾向がある。DNAが増幅されるとき、対立遺伝子バイアスの程度は典型的には増幅工程の数とともに増加する。いくつかの実施形態において、本明細書に記載される方法は、低レベルの対立遺伝子バイアスを有するDNAを増幅することを伴う。各追加サイクルの対立遺伝子バイアス化合物であるため、全体的なバイアスのn乗根を計算することによって、サイクルごとの対立遺伝子バイアスを決定することができ、式中、nは、濃縮度の塩基2対数である。いくつかの実施形態において、DNAの第2の混合物を含む組成物が存在し、DNAの第2の混合物は、DNAの第1の混合物から複数の多型遺伝子座において優先的に濃縮され、濃縮度は、少なくとも10、少なくとも100、少なくとも1,000、少なくとも10,000、少なくとも100,000又は少なくとも1,000,000であり、各遺伝子座におけるDNAの第2の混合物中の対立遺伝子の比率は、DNAの第1の混合物中のその遺伝子座における対立遺伝子の比率と、平均して1,000%、500%、200%、100%、50%、20%、10%、5%、2%、1%、0.5%、0.2%、0.1%、0.05%、0.02%、又は0.01%未満の因子で異なる。いくつかの実施形態において、DNAの第2の混合物を含む組成物があり、DNAの第2の混合物は、DNAの第1の混合物からの複数の多型遺伝子座で優先的に濃縮されており、複数の多型遺伝子座のサイクル当たりの対立遺伝子バイアスは、平均して10%、5%、2%、1%、0.5%、0.2%、0.1%、0.05%、又は0.02%未満である。いくつかの実施形態において、複数の多型遺伝子座は、少なくとも10の遺伝子座、少なくとも20の遺伝子座、少なくとも50の遺伝子座、少なくとも100の遺伝子座、少なくとも200の遺伝子座、少なくとも500の遺伝子座、少なくとも1,000の遺伝子座、少なくとも2,000の遺伝子座、少なくとも5,000の遺伝子座、少なくとも10,000の遺伝子座、少なくとも20,000の遺伝子座、又は少なくとも50,000の遺伝子座を含む。
【0439】
最大尤度推定値
生物学的現象又は医学的状態の有無を検出するための当該技術分野で既知のほとんどの方法は、単一の仮説否定検査の使用を含み、条件と相関するメトリクスが測定され、メトリクスが所与の閾値の一方にある場合、条件が存在し、メトリクスの一方が閾値の他方にある場合、条件は存在しない。単一仮説否定検定は、ヌル仮説と代替仮説との間を決定するときにのみヌル分布を見る。代替分布を考慮しないと、観察データを考慮した各仮説の尤度を推定することができず、したがって、コールに対する信頼度を計算することができない。したがって、単一仮説拒否検査では、特定のケースに関連する自信を感じることなく、「はい」又は「いいえ」の答えを得ることになる。
【0440】
いくつかの実施形態において、本明細書に開示される方法は、最大尤度法を使用して、生物学的現象又は医学的状態の有無を検出することができる。これは、状態の不在又は存在をコールするための閾値が各症例に対して適切に調整され得るため、単一の仮説否定技術を使用する方法と比較して実質的な改善である。これは、妊娠中の胎児における異数性の有無を、母体血漿中に見出される遊離浮遊DNAに存在する胎児DNAと母体DNAとの混合物から入手可能な遺伝子データから決定することを目的とする診断技術に特に関連する。これは、血漿由来画分における胎児DNAの画分が変化するにつれて、異数性対異数性をコールするための最適閾値が変化するためである。胎児画分が低下するにつれて、異数性に関連するデータの分布は、正倍数体性に関連するデータの分布にますます類似するようになる。
【0441】
最大尤度推定法は、各仮説に関連付けられた分布を使用して、各仮説に条件付けられたデータの尤度を推定する。次いで、これらの条件付き確率を仮説コール及び信頼度に変換することができる。同様に、最大事後推定法は、最大尤度推定と同じ条件付き確率を使用するが、最良の仮説を選択し、信頼度を決定するときに集団先行値も組み込む。
【0442】
したがって、最大尤度推定(MLE)技法、又は密接に関連する最大事後(MAP)技法の使用は、2つの利点をもたらし、第1に、それは、正しいコールの確率を増加させ、また、コールごとに信頼度を計算することを可能にする。一実施形態において、最大確率を有する仮説に対応する倍数性状態の選択は、最大尤度推定値又は最大事後推定値を使用して実行される。一実施形態において、妊娠中の胎児の倍数性状態を決定するための方法が開示され、これは、単一の仮説拒絶技法を使用する当該技術分野で現在既知の任意の方法をとり、それがMLE又はMAP技法を使用するようにそれを再処方することを伴う。これらの技術を適用することによって著しく改善され得る方法のいくつかの例は、米国特許第8,008,018号、米国特許第7,888,017号、又は米国特許第7,332,277号に見出すことができる。
【0443】
一実施形態において、胎児及び母親のゲノムDNAを含む母体血漿サンプル中の胎児の異数性の有無を決定するための方法が記載され、この方法は、母体血漿サンプルを得ることと、高スループットシーケンサで血漿サンプル中に見出されるDNAフラグメントを測定することと、配列を染色体にマッピングし、各染色体にマッピングする配列リードの数を決定することと、血漿サンプル中の胎児DNAの画分を計算することと、第2の標的染色体が正倍数体である場合に予測される標的染色体の量の予測分布と、染色体が非正倍数体である場合に予測される1つ又は複数の予測分布とを、胎児画分及び正倍数体であると予測される1つ又は複数の参照染色体にマッピングする配列リード数を使用して計算することと、MLE又はMAPを使用して、分布のうちのどれが正しい可能性が最も高いかを決定し、それによって、胎児の異数体の有無を示すことと、を含む。一実施形態において、血漿からのDNAを測定することは、大規模に平行なショットガン配列決定を行うことを伴ってもよい。一実施形態において、血漿サンプルからのDNAの測定は、例えば、標的化増幅によって、複数の多型又は非多型遺伝子座において優先的に濃縮されたDNAを配列決定することを伴い得る。複数の遺伝子座は、1つ又は少数の疑わしい異数体染色体と、1つ又は少数の参照染色体とを標的化するように設計され得る。優先的濃縮の目的は、倍数決定に有益な配列リードの数を増やすことである。
【0444】
倍数性コール情報学方法
本明細書で説明されるのは、所与の配列データを与えられた胎児の倍数性状態を決定する方法である。いくつかの実施形態において、この配列データは、高スループットシーケンサで測定されてもよい。いくつかの実施形態において、配列データは、母体血液から単離された遊離浮遊DNAに由来するDNA上で測定されてもよく、遊離浮遊DNAは、母体起源のいくつかのDNA、及び胎児/胎盤起源のいくつかのDNAを含む。このセクションは、分析された混合物中の胎児DNAの画分が知られておらず、データから推定されると仮定して、胎児の倍数性状態が決定される本開示の一実施形態を説明する。また、混合物中の胎児DNAの画分(「胎児画分」)又は胎児DNAの割合を別の方法によって測定することができ、胎児の倍数性状態を決定することにおいて既知であると仮定される実施形態を説明する。いくつかの実施形態において、胎児画分は、胎児DNAと母体DNAとの混合物である母体血液サンプル自体に対して行われた遺伝子型決定測定値のみを使用して計算することができる。いくつかの実施形態において、画分は、また、母親の測定された又は他の方法で既知の遺伝子型及び/又は父親の測定された又は他の方法で既知の遺伝子型を使用して計算されてもよい。別の実施形態において、胎児の倍数性状態は、問題の染色体についての胎児DNAの計算された画分と、参照染色体についての胎児DNAの計算された画分とを比較して、ダイソミックと仮定して、単独で決定することができる。
【0445】
好ましい実施形態において、特定の染色体について、以下を有するN SNPを観察及び分析すると仮定する:
●NR遊離浮遊DNA配列測定値S=(s,…,sNR)のセット。この方法はSNP測定を利用するため、非多型遺伝子座に対応する全ての配列データを無視することができる。簡略化されたバージョンでは、各SNPに(A,B)カウントがあり、A及びBは、所与の遺伝子座に存在する2つの対立遺伝子に対応し、Sは、S=((a,b),…,(a,b))として書くことができ、式中、aは、SNPi上のAカウントであり、bは、SNPi上のBカウントであり、Σi=1:N(a+b)=NR
●以下からなる親データ
○sNPマイクロアレイ又は他の強度ベースの遺伝子型決定プラットフォームからの遺伝子型:母M=(m,…,m)、父F=(f,…,f)、式中、m、f∈(AA、AB、BB)。
○及び/又は配列データ測定:NRM母測定SM=(sm,…,smnrm)、NRF父測定SF=(sf,…,sfnrf)。上記の簡略化と同様に、各SNPに(A,B)カウントがある場合、SM=((am1,bm),…,(am,bm)),SF=((af,bf),…,(af,bf))
【0446】
集合的に、母、父、子データは、D=(M,F,SM,SF,S)として示される。親データは所望され、アルゴリズムの精度を高めるが、特に父データは必要ではないことに留意されたい。これは、母親及び/又は父親のデータがない場合でも、非常に正確なコピー数の結果を得ることが可能であることを意味する。
【0447】
考慮される全ての仮説(H)に対してデータログ尤度LIK(D|H)を最大化することによって、最良のコピー数推定(H)を導出することが可能である。具体的には、結合分布モデル及び調製されたサンプルについて測定された対立遺伝子数を使用して、並びにそれらの相対確率を使用して、以下のように正しい可能性が最も高い仮説を決定するために、倍数性仮説の各々の相対確率を決定することが可能である:
【数76】
【0448】
同様に、データを与えられた事後仮説尤度は、以下のように記述され得る:
【数77】
【0449】
priorprob(H)は、モデル設計及び事前知識に基づいて、各仮説Hに割り当てられる事前確率である。
【0450】
事前推定値を使用して、事後推定値の最大値を求めることもできる:
【数78】
【0451】
一実施形態において、考慮され得るコピー数仮説は、以下の通りである:
●モノソミー:
○母系H10(母親から1つのコピー)
○父系H01(父親からの1つのコピー)
●ダイソミー:H11(母親及び父親、各々1つのコピー)
●単純なトリソミー、乗換え考慮なし:
○母系:H21_MATCHED(母親からの2つの同一のコピー、父親からの1つのコピー)、H21_UNMATCHED(母親からの両方のコピー、父親からの1つのコピー)
○父系:H12_MATCHED(母親からの1つのコピー、父親からの2つのコピー)、H12_UNMATCHED(母親からの1つのコピー、父親からの両方のコピー)
●乗換えを可能にする複合トリソミー(結合分布モデルを使用):
○母系H21(母親から2つのコピー、父親から1つのコピー)、
○父系のH12(母親から1つのコピー、父親から2つのコピー)
【0452】
他の実施形態において、ヌルソミー(H00)、単親ダイソミー(H20及びH02)、及びテトラソミー(H04、H13、H22、H31及びH40)などの他の倍数性状態が考慮され得る。
【0453】
乗換えがない場合、起点が有糸分裂、減数分裂I、又は減数分裂IIのいずれであるかにかかわらず、各トリソミーは、マッチするトリソミー又はマッチしないトリソミーのうちの1つになるであろう。乗換えのため、真のトリソミーは通常、2つの組み合わせである。まず、単純な仮説のための仮説尤度を導出する方法が記載されている。次いで、個々のSNP尤度を乗換えと組み合わせて、複合仮説の仮説尤度を導出する方法が記載される。
【0454】
単純仮説のLIK(D|H)
一実施形態において、LIK(D|H)は、以下のように、単純な仮説について決定されてもよい。単純な仮説H、LIK(H)、すなわち染色体全体における仮説Hの対数尤度は、既知又は導出された子画分をcfと仮定して、個々のSNPの対数尤度の合計として計算され得る。一実施形態において、cfをデータから導出することが可能である。
【数79】
【0455】
この仮説は、SNP間の連鎖を想定しておらず、したがって、結合分布モデルを利用していない。
【0456】
いくつかの実施形態において、対数尤度は、SNPごとに決定されてもよい。特定のSNPiでは、胎児倍数性仮説H及び胎児DNAの割合cfを仮定して、観察されたデータDの対数尤度を以下のように定義する:
【数80】
式中、mは真の母系遺伝子型である可能性があり、fは真の父系遺伝子型である可能性があり、式中、m、f∈{AA,AB,BB}、及びcは、仮説Hが与えられた場合、子の遺伝子型である可能性がある。具体的には、モノソミーc∈{A,B}について、ダイソミーc∈{AA,AB,BB}について、トリソミーc∈{AAA,AAB,ABB,BBB}についてである。
【0457】
遺伝子型先行頻度:p(m|i)は、pAで示される、SNPIでの既知の集団頻度に基づく、SNPi上の母系遺伝子型mの一般的な先行確率である。具体的には
p(AA│pA)=(pA、p(AB│pA)=2(pA)*(1-pA)、p(BB│pA)=(1-pA
【0458】
父系遺伝子型確率、p(f|i)は、類似の方法で決定されてもよい。
【0459】
真の子供の確率:p(c│m,f,H)は、親m、f、及び仮説Hを仮定して、真の子供の遺伝子型=cを取得する確率であり、これは簡単に計算できる。例えば、H11、H21マッチ及びH21マッチしないについて、p(c|m,f,H)を以下に示す。
【表5】
【0460】
データの尤度:P(D│m,f,c,H,i,cf)は、真の母系遺伝子型m、真の父系遺伝子型f、真の子の遺伝子型c、仮説H、及び子画分cfが与えられた、SNPiに関する所与のデータDの確率である。それは、以下のように、母親、父親、及び子供のデータの確率に分類することができる:
P(D│m,f,c,H,cf,i)=P(SM|m,i)P(M│m,i)P(SF|f,i)P(F│f,i)P(S│m,c,H,cf,i)
【0461】
母SNPアレイデータの尤度:SNPアレイ遺伝子型が正しいと仮定すると、真の遺伝子型mと比較したSNPiにおける母SNPアレイ遺伝子型データmの確率は、単純である
【数81】
【0462】
母親配列データ尤度:追加のノイズ又はバイアスを伴わない、カウントS=(am,bm)の場合、SNPiにおける母親配列データの確率は、P(SM|m,i)=PX|m(am)として定義される二項確率であり、p(A)を有するX|m~Binom(p(A)、am+bm)は、以下として定義される:
【表6】
【0463】
父データ尤度:父データ尤度に同様の方程式が適用される。
【0464】
親データ、特に父データなしで子の遺伝子型を決定することが可能であることに留意されたい。例えば、父系遺伝子型データFが利用可能でない場合、P(F│f,i)=1を単に使用してもよい。父配列データSFが利用可能でない場合、1つは、P(SF|f,i)=1を単に使用してもよい。
【0465】
いくつかの実施形態において、本方法は、各倍数性仮説についての染色体上の複数の多型遺伝子座での対立遺伝子数の予測される結合分布モデルを構築することを伴い、そのような終わりを達成する1つの方法が本明細書に記載される。遊離胎児DNAデータの尤度:P(S│m,c,H,cf,i)は、真の母系遺伝子型│m、真の子の遺伝子型c、子コピー数仮説H、及び子画分cfを仮定した、SNPi上の遊離胎児DNA配列データの確率である。これは、実際には、SNPiμ(m,c,cf,H)上のA含有量の真の確率を考慮して、SNPI上の配列データSの確率である。
P(S│m,c,H,cf,i)=P(S|μ(m,c,cf,H),i)
【0466】
カウントの場合、S=(a,b)であって、データに余分なノイズ又はバイアスが含まれていない
P(S│μ(m,c,cf,H)、i)=P(a
式中、X~Binom(p(A),a+b)、p(A)=μ(m,c,cf,H)。SNP当たりの正確なアライメント及び(A,B)カウントが知られていないより複雑な場合において、P(S│μ(m,c,cf,H),i)は、積分二項の組み合わせである。
【0467】
真のA含有率:真の母系遺伝子型=m、真の子の遺伝子型=c、及び全体的な子画分=cfを仮定して、この母子混合物中のSNPi上のA含有率の真の確率である、μ(m,c,cf,H)は、以下として定義される
【数82】
式中、#A(g)=遺伝子型gにおけるAの数、n=2は、母親のソミーであり、nは、仮説Hの下での子供の倍数性である(モノソミーの場合は1、ダイソミーの場合は2、トリソミーの場合は3)。
【0468】
結合分布モデルを使用する:複合仮説に対するLIK(D|H)
いくつかの実施形態において、本方法は、各倍数性仮説についての染色体上の複数の多型遺伝子座での対立遺伝子数の予測される結合分布モデルを構築することを伴い、そのような終わりを達成する1つの方法が本明細書に記載される。多くの場合、トリソミーは、通常、乗換えのために純粋にマッチし、マッチしないわけではないため、このセクションでは、複合仮説H21(母系トリソミー)及びH12(父系トリソミー)の結果が導出され、マッチするトリソミー及びマッチしないトリソミーを組み合わせて、乗換えの可能性を説明する。
【0469】
トリソミーの場合、乗換えがなかった場合、トリソミーは、単純にマッチするか、又はマッチしないトリソミーとなる。マッチするトリソミーは、子が一方の親から同一の染色体セグメントの2つのコピーを継承する場合である。マッチしないトリソミーは、子が親から各相同染色体セグメントの1つのコピーを継承する場合である。乗換えのために、染色体のいくつかのセグメントは、マッチするトリソミーを有し得、他の部分は、マッチしないトリソミーを有し得る。このセクションでは、対立遺伝子のセットのヘテロ接合率の結合分布モデルを構築する方法、すなわち、1つ以上の仮説のいくつかの遺伝子座での対立遺伝子数の予測について説明する。
【0470】
SNPi上で、LIK(D|Hm,i)がマッチする仮説Hに対する適合度であり、LIK(D|Hu,i)がマッチしない仮説Hに対する適合度であり、pc(i)=SNPi-1とiとの間の乗換えの確率であると仮定する。次いで、以下のように全尤度を計算することができる:
LIK(D|H)=ΣLIK(D|E,1:N)
式中、LIK(D|E,1:N)は、SNP1:Nについて、仮説Eで終わる尤度である。E=最後のSNPの仮説、E∈(Hm,Hu)。再帰的には、以下を計算することができる:
LIK(D|E,1:i)=LIK(D|E,i)+log(exp(LIK(D|E,1:i-1))*(1-pc(i))+exp(LIK(D|~E,1:i-1))*pc(i))
式中、~Eは、E(Eではない)以外の仮説であり、考慮される仮説は、H及びHである。具体的には、1~(i-1)SNPの尤度に基づいて、1:iのSNPの尤度を計算することができ、同一の仮説を持ち、乗換え又は反対の仮説を持たず、乗換えにSNPiの尤度を掛ける。
【0471】
SNP1の場合、i=1、LIK(D|E,1:1)=LIK(D|E,1)。
【0472】
SNP2の場合、i=2、LIK(D|E,1:2)=LIK(D|E,2)+log(exp(LIK(D|E,1))*(1-pc(2))+exp(LIK(D|~E,1))*pc(2))、
i=3:Nの場合、続く。
【0473】
いくつかの実施形態において、子画分は、決定されてもよい。子画分は、子に由来するDNAの混合物中の配列の割合を指し得る。非侵襲性出生前診断の文脈では、子画分は、胎児に由来する母体血漿中の配列の割合、又は胎児遺伝子型を有する胎盤の一部を指し得る。これは、母体血漿から調製されたDNAのサンプル中の子画分を指し得、胎児のDNAで濃縮され得る。DNAのサンプル中の子画分を決定する1つの目的は、胎児に対して倍数性コールを行うことができるアルゴリズムでの使用のためであり、したがって、子画分は、非侵襲性出生前診断の目的のために配列決定によって分析されたDNAの任意のサンプルのことを指す。
【0474】
非侵襲性出生前異数性診断の方法の一部である本開示に提示されるアルゴリズムのいくつかは、既知の小児画分を想定しており、これは必ずしもそうではない場合がある。一実施形態において、親データの存在の有無にかかわらず、選択された染色体上のダイソミーの尤度を最大化することによって、最も尤度の高い子画分を見つけることが可能である。
【0475】
具体的には、ダイソミー仮説について、及び染色体chrの子画分について、上記のようなLIK(D|H11,cf,chr)=対数尤度を仮定する。Cset内の選択された染色体(通常1:16)について、正倍数体であると仮定すると、全尤度は、以下の通りである:
LIK(cf)=Σchr∈CsetLik(D|H11,cf,chr)
【0476】
最も可能性の高い子画分(cf)は、
【数83】
として導出される。
【0477】
染色体の任意のセットを使用することが可能である。参照染色体上で正倍数体を想定せずに子画分を導出することも可能である。この方法を使用すると、以下のいずれかの状況で子画分を決定することができる:(1)1つは、親に関するアレイデータ及び母体血漿に関するショットガン配列決定データを有する;(2)1つは、親に関するアレイデータ及び母体血漿に関する標的化配列決定データを有する;(3)1つは、親及び母体血漿の両方に関する標的化配列決定データを有する;(4)1つは、母親及び母体血漿画分の両方に関する標的化配列決定データを有する;(5)1つは、母体血漿画分に関する標的化配列決定データを有する;(6)親及び子画分の測定の他の組み合わせを有する。
【0478】
いくつかの実施形態において、情報学的方法は、データドロップアウトを組み込んでもよく、これは、より高い精度の倍数性決定をもたらしてもよい。本開示の他の箇所では、Aを得る確率は、真の母系遺伝子型、真の子の遺伝子型、混合物中の子の画分、及び子コピー数の直接関数であると仮定されている。また、母親又は子の対立遺伝子が脱落する可能性もあり、例えば、混合物中の真の子ABを測定する代わりに、対立遺伝子Aにマッピングされた配列のみが測定される場合がある。1つは、ゲノムイルミナデータdpgの親ドロップアウト率、配列データdpsの親ドロップアウト率、及び配列データdcsの子ドロップアウト率を示し得る。いくつかの実施形態において、母親のドロップアウト率はゼロであると仮定することができ、子供のドロップアウト率は比較的低く、この場合、結果はドロップアウトによって深刻な影響を受けることはない。いくつかの実施形態において、対立遺伝子ドロップアウトの可能性は、それらが予測される倍数性コールの有意な効果をもたらすほど十分に大きくてもよい。このような場合、対立遺伝子ドロップアウトは、以下のアルゴリズムに組み込まれている:
【0479】
親SNPアレイデータドロップアウト:母親のゲノムデータMについて、ドロップアウト後の遺伝子型がmであると仮定し、次いで、
【数84】
ここで、
【数85】
は前と同じで、P(m|m)は、ドロップアウト率dについて、以下のように定義される真の遺伝子型mが与えられた場合の、尤度のあるドロップアウト後の遺伝子型mの尤度である
【表7】
【0480】
同様の方程式は、父SNPアレイデータに適用される。
【0481】
親配列データドロップアウト:母系配列データSMの場合
【数86】
式中、P(m│m)は、前のセクションで定義され、二項分布からの
【数87】
確率は、親データ尤度セクションで前のように定義される。同様の方程式が、父系配列データに適用される。
【0482】
遊離浮遊DNA配列データドロップアウト:
【数88】
式中、P(S|μ(m,c,cf,H),i)は、遊離浮遊データ尤度に関するセクションで定義される。
【0483】
一実施形態において、p(m|m)は、ドロップアウト率dpsを仮定して、真の母系遺伝子型mが与えられた場合の、観察された母系遺伝子型mの確率であり、p(c|c)は、ドロップアウト率dcsを仮定して、真の子の遺伝子型cが与えられた場合の、観察された子の遺伝子型cの確率である。nA=真の遺伝子型cにおけるA対立遺伝子の数、nA=観察された遺伝子型cにおけるA対立遺伝子の数、nA≧nA、及び同様にnB=真の遺伝子型cにおけるB対立遺伝子の数、nB=観察された遺伝子型cにおけるB対立遺伝子の数、nB≧nB及びd=ドロップアウト率の場合、次いで
【数89】
【0484】
一実施形態において、情報学的方法は、ランダムかつ一貫したバイアスを組み込んでもよい。理想的な単語では、配列カウントの数において、SNPごとの一貫したサンプリングバイアス又はランダムノイズ(二項分布変動に加えて)は存在しない。具体的には、SNPiでは、母遺伝子型mについて、真の子の遺伝子型c及び子画分cf、並びにX=SNPi上の(A+B)リードの集合におけるAの数、Xは、X~二項式(p,A+B)のように作用し、式中、p=μ(m,c,cf,H)=A含有量の真の確率。
【0485】
一実施形態において、情報学的方法は、ランダムバイアスを組み込んでもよい。多くの場合のように、このSNPでAを得る確率がqに等しくなるように、測定値にバイアスがあると仮定し、これは上記で定義されたpとは少し異なる。Pがqからどのくらい異なるかは、測定プロセスの精度及び他の因子の数に依存し、pから離れたqの標準偏差によって定量化することができる。一実施形態において、ベータ分布を有するようにqをモデル化することが可能であり、パラメータα、βは、その分布の平均がpに中心を置くことに依存し、いくつかの特定の標準偏差がsである。具体的には、これは、X|q~Bin(q,D)、式中、q~Beta(α,β)を与える。E(q)=p、V(q)=s、パラメータαを設定すると、βはα=pN、β=(1-p)Nとして導き出すことができ、式中、
【数90】
【0486】
これは、ベータ二項分布の定義であり、可変パラメータqを有する二項分布からサンプリングし、qは、平均pを有するベータ分布に従う。したがって、バイアスのないセットアップでは、SNPi上で、真の母系遺伝子型(m)、SNPi上の所与の母親配列Aカウント(am)、及びSNPi上の母親配列Bカウント(bm)を仮定する親配列データ(SM)確率は、以下のように計算され得る:
P(SM|m,i)=PX|m(am)、式中、X|m~Binom(p(A),am+bm
【0487】
ここで、標準偏差を有するランダムバイアスを含めると、これは以下になる:
X|m~BetaBinom(p(A),am+bm,s)
【0488】
バイアスのない場合、真の母系遺伝子型(m)、真の子の遺伝子型(c)、子画分(cf)を仮定し、子仮説Hを仮定し、SNPi(a)上の遊離浮遊DNA配列Aカウント及びSNPi(b)上の遊離浮遊配列Bカウントを与えた母体血漿DNA配列データ(S)確率は、以下として計算され得、
P(S│m,c,cf,H,i)=P(a
式中、X~Binom(p(A)、a+b)、p(A)=μ(m、c、cf、H)。
【0489】
標準偏差sを有するランダムバイアスを含む一実施形態において、これは、X~BetaBinom(p(A)、a+b、s)となり、余分な変動の量は、偏差パラメータsによって、又は等価にNによって指定される。sの値が小さいほど(又はNの値が大きいほど)、この分布は正規二項分布に近い。曖昧でない文脈AA|AA、BB|BB、AA|BB、BB|AAからバイアスの量、すなわち上記の推定Nを推定し、上記の確率で推定される
【数91】
の使用を推定することが可能である。データの挙動に応じて、Nは、リード深度a+b、又はa+bの関数にかかわらず定数とすることができ、リード深度が大きいほどバイアスが小さくなる。
【0490】
一実施形態において、情報学的方法は、一貫性のあるSNP当たりのバイアスを組み込んでもよい。配列決定プロセスのアーチファクトのために、いくつかのSNPは、A含有量の真の量にかかわらず、一貫してより低い又はより高いカウントを有し得る。SNPiが一貫してAカウントの数にwパーセントのバイアスを加えると仮定する。いくつかの実施形態において、このバイアスは、同じ条件下で導出されるトレーニングデータのセットから推定され得、親配列データの推定値に追加して戻すことができる:
P(SM|m,i)=PX|m(am)、式中、X|m~BetaBinom(p(A)+w,am+bm,s)
遊離浮遊DNA配列データ確率推定値を用いて、以下のように推定する:
P(S│m,cf,H,i)=P(a)、式中、X~BetaBinom(p(A)+w、a+b、s)、
【0491】
いくつかの実施形態において、本方法は、追加のノイズ、差分サンプル品質、差分SNP品質、及びランダムサンプリングバイアスを特に考慮するように書かれてもよい。この一例をここに挙げる。この方法は、大規模に多重化されたミニPCRプロトコルを使用して生成されたデータの文脈において特に有用であることが示されており、実験7~13で使用された。この方法は、各々が異なる種類のノイズ及び/又はバイアスを最終モデルに導入するいくつかの工程を含む。
【0492】
(1)母体DNA及び胎児DNAの混合物を含む第1のサンプルが、通常1,000~40,000の範囲のサイズ=N分子のDNAの元の量を含有すると仮定し、p=ture%refs
【0493】
(2)ユニバーサルライゲーションアダプターを用いた増幅では、N分子がサンプリングされていると仮定し、通常はN~N/2分子であり、サンプリングによりランダムサンプリングバイアスが導入される。増幅されたサンプルは、いくつかの分子N(N>>N)を含有してもよい。Xは、N個のサンプリングされた分子のうち(SNPごとに)の参照遺伝子座の量を表し、p=X/Nの変動は、プロトコルの残りの部分を通してランダムサンプリングバイアスを導入する。このサンプリングバイアスは、単純な二項分布モデルを使用するのではなく、ベータ二項(BB)分布を使用することによってモデルに含まれる。ベータ二項分布のパラメータNは、0<p<1のSNP上で、漏れ及び増幅バイアスを調整した後のトレーニングデータから、サンプルごとに後で推定され得る。漏れは、SNPが誤って読み取られる傾向である。
【0494】
(3)増幅工程は、任意の対立遺伝子バイアスを増幅し、したがって、可能性のある不均一な増幅のために導入される増幅バイアスを増幅する。ある遺伝子座での1つの対立遺伝子が、その遺伝子座での別の対立遺伝子がg倍に増幅されると仮定し、式中、f=ge、式中、b=0は、バイアスを示さない。バイアスパラメータbは、0を中心とし、特定のSNP上のB対立遺伝子とは対照的に、A対立遺伝子がどの程度増幅されるかを示す。パラメータbは、SNPからSNPまで異なる場合がある。バイアスパラメータbは、例えば、トレーニングデータから、SNPごとに推定されてもよい。
【0495】
(4)配列決定工程は、増幅された分子のサンプルの配列決定を伴う。この工程では、漏れがある可能性があり、漏れは、SNPが誤って読み取られる状況である。漏れは、任意の数の問題に起因し得、SNPは、正しい対立遺伝子Aとしてではなく、その遺伝子座に見出される別の対立遺伝子Bとして、又はその遺伝子座に典型的には見出されない対立遺伝子C又はDとして読み出され得る。配列決定が、サイズNの増幅されたサンプルからのいくつかのDNA分子の配列データを測定すると仮定し、N<Nである。いくつかの実施形態において、Nは、20,000~100,000、100,000~500,000、500,000~4,000,000、4,000,000~20,000,000、又は20,000,000~100,000,000の範囲内であってもよい。サンプリングされた各分子は、正しく読み取られる確率pを有し、その場合、対立遺伝子Aとして正しく現れる。サンプルは、確率1-pで元の分子と無関係の対立遺伝子として誤って読み取られ、確率pの対立遺伝子A、確率pの対立遺伝子B、又は確率pの対立遺伝子C又は対立遺伝子Dのように見え、p+p+p=1である。パラメータp、p、p、pは、トレーニングデータからSNPごとに推定される。
【0496】
異なるプロトコルは、異なる量のランダムサンプリング、異なるレベルの増幅、及び異なる漏れバイアスをもたらす、分子生物学的工程の変動を伴う同様の工程を伴い得る。以下のモデルは、これらの場合の各々に等しくよく適用され得る。SNPごとにサンプリングされるDNAの量のモデルは、以下によって与えられ:
~BetaBinomial(L(F(p,b),p,p)、N*H(p,b))
式中、p=参照DNAの真の量、b=SNPバイアス当たり、及び上述のように、pは、正しいリードの確率であり、pは、リードが誤って読み取られたが、誤ったリードの場合には、正しい対立遺伝子のように偶然に見える確率であり、
F(p,b)=pe/(pe+(1-p))、H(p,b)=(ep+(1-p))/e、L(p,p,p)=p*p+p*(1-p)。
【0497】
いくつかの実施形態において、本方法は、単純な二項分布の代わりにベータ二項分布を使用する;これは、ランダムサンプリングバイアスを考慮したものである。ベータ二項分布のパラメータNは、必要に応じてサンプル単位で推定される。バイアス補正F(p,b)を使用して、pだけではなくH(p,b)が増幅バイアスを考慮する。バイアスのパラメータbは、事前にトレーニングデータからSNPごとに推定される。
【0498】
いくつかの実施形態において、本方法は、pのみの代わりに、漏れ補正L(p,p,p)を使用し、これは、漏れバイアス、すなわち、SNP及びサンプル品質の変化を考慮する。いくつかの実施形態において、パラメータp、p、pは、事前にトレーニングデータからSNPごとに推定される。いくつかの実施形態において、パラメータp、p、pは、サンプルの品質が変化することを考慮して、その時点のサンプルで更新することができる。
【0499】
本明細書に記載されるモデルは、非常に一般的であり、差動サンプル品質及び差動SNP品質の両方を説明することができる。異なるサンプル及びSNPは、いくつかの実施形態が、DNAの元の量、並びにサンプル及びSNP品質の関数であるベータ二項分布を使用するという事実によって例示されるように、異なって扱われる。
【0500】
プラットフォームモデリング
血漿中に存在する対立遺伝子比率の予測値がrである単一のSNPを考慮する(母体及び胎児の遺伝子型に基づく)。対立遺伝子比率の予測値は、母体及び胎児のDNAを組み合わせたA対立遺伝子の予測された画分として定義される。母系遺伝子型g及び子の遺伝子型gについて、遺伝子型が対立遺伝子比率としても表されると仮定して、対立遺伝子比率の予測値を式1で示す。
r=fg+(1-f)g(1)
【0501】
SNPでの観測は、各対立遺伝子が存在するマッピングされたリードの数n及びnからなり、これはリード深度dを合計する。マッピング及び対立遺伝子の観察が正しいとみなすことができるように、閾値が既にマッピング確率及びphredスコアに適用されていると仮定する。Phredスコアは、特定の塩基における特定の測定値が間違っている確率に関連する数値測定値である。塩基が配列決定によって測定された一実施形態において、phredスコアは、コールされた塩基に対応する染料強度と他の塩基の染料強度との比率から計算されてもよい。観察尤度についての最も単純なモデルは、dリードの各々が対立遺伝子比率rを有する大きなプールから独立して引き出されると仮定する二項分布である。式2は、このモデルを説明する。
【数92】
【0502】
二項モデルは、いくつかの方法で拡張することができる。母体及び胎児の遺伝子型が全てA又は全てBのいずれかである場合、血漿中の対立遺伝子比率の予測値は0又は1となり、二項確率は十分に定義されない。実際には、予期しない対立遺伝子が実際に観察されることがある。一実施形態において、少数の予期しない対立遺伝子を可能にする
【数93】
ために、修正された対立遺伝子比を使用することが可能である。一実施形態において、トレーニングデータを使用して、各SNP上に現れる予期しない対立遺伝子の割合をモデル化し、このモデルを使用して、予測される対立遺伝子比を修正することが可能である。対立遺伝子比率の予測値が0又は1でない場合、増幅バイアス又は他の現象のため、観察される対立遺伝子比率は、対立遺伝子比率の予測値に対する十分に高いリード深度で収束しない場合がある。対立遺伝子比率は、次に、対立遺伝子比率の予測値を中心としたベータ分布としてモデル化することができ、二項分布よりも高い分散を有するP(n、n|r)のベータ二項分布につながる。
【0503】
単一のSNPでの応答のためのプラットフォームモデルは、F(a,b,g,g,f)(3)、又は、母体及び胎児の遺伝子型を考慮して、n=a及びn=bを観測する確率として定義され、これはまた、式1を通して胎児画分に依存する。Fの機能形態は、二項分布、ベータ二項分布、又は上述のような類似の機能であってもよい。
F(a,b,g,g,f)=P(n=a,n=b|g,g,f)=P(n=a,n=b|r(g,g,f))(3)
【0504】
一実施形態において、子画分は、以下のように決定されてもよい。出生前検査のための胎児画分fの最大尤度推定値は、父親の情報を使用することなく導出され得る。これは、父親の遺伝子データが利用できない場合、例えば、記録の父親が実際には胎児の遺伝的父親ではない場合に関連し得る。胎児画分は、母系遺伝子型が0又は1であるSNPのセットから推定され、2つの可能な胎児遺伝子型のセットのみをもたらす。Sを、母系遺伝子型0を有するSNPのセットとして、及びSを、母系遺伝子型1を有するSNPのセットとして定義する。S上の可能な胎児遺伝子型は、0及び0.5であり、結果として、可能な対立遺伝子比R(f)={0,f/2}のセットをもたらす。同様に、R(f)={1-f/2,1}である。この方法は、母系遺伝子型が0.5であるSNPを含むようにわずかに拡張することができるが、これらのSNPは、可能な対立遺伝子比のセットが大きいため、情報量が少ないであろう。
【0505】
a0及びNb0を、SのSNPsについてはnas及びnbs、SについてはNa1及びNb1によって同様に形成されるベクトルとして定義する。fの最大尤度推定値
【数94】
は、式4によって定義される。
【数95】
【0506】
各SNPでの対立遺伝子数が、SNPの血漿対立遺伝子比に独立して条件付けられていると仮定すると、確率は、各セットにおけるSNP上の生成物として表すことができる(5)。
【数96】
【0507】
fへの依存性は、可能な対立遺伝子比R(f)及びR(f)のセットを通してである。SNP確率P(nas,nbs|f)は、fに条件付けられた最大尤度遺伝子型を仮定することによって概算することができる。適度に高い胎児画分及びリード深度では、最大尤度遺伝子型の選択は、高い信頼性となるであろう。例えば、10%の胎児画分及び1000のリード深度において、母親がゼロ遺伝子型を有するSNPを考慮する。対立遺伝子比率は、0及び5%であり、これは、十分に高いリード深度で容易に区別可能である。推定される子の遺伝子型の式5への置換は、胎児画分推定の完全な式(6)をもたらす。
【数97】
【0508】
胎児画分は[0,1]の範囲でなければならないため、最適化は制約付きの一次元検索によって容易に実装できる。
【0509】
低いリード深度又は高いノイズレベルの存在下では、最大尤度遺伝子型を想定しないことが好ましく、これは人工的に高い信頼性をもたらす可能性がある。別の方法は、各SNPでの可能性のある遺伝子型を合計することであり、SにおけるSNPについてのP(n,n|f)についての以下の式(7)をもたらす。事前確率P(r)は、R(f)にわたって均一であると仮定することができ、又は集団頻度に基づいていてもよい。群Sへの拡張は自明である。
【数98】
【0510】
いくつかの実施形態において、確率は、以下のように導出されてもよい。信頼度は、2つの仮説H及びHのデータ尤度から計算することができる。各仮説の尤度は、応答モデル、推定胎児画分、母系遺伝子型、対立遺伝子集団頻度、及び血漿対立遺伝子数に基づいて導き出される。
【0511】
以下の表記を定義する:
【表8】
【0512】
各SNPでの観察が血漿対立遺伝子比に独立して条件付けられていると仮定すると、父性仮説の尤度は、SNP上の尤度の積である。以下の方程式は、単一SNPの尤度を導き出す。式8は、任意の仮説hの尤度の一般式であり、次いで、H及びHの特定の場合に分解される。
【数99】
【0513】
の場合、父親とされる人物は真の父親であり、胎児の遺伝子型は、式9に従って、母系遺伝子型及び父親とされる父系遺伝子型から継承される。
【数100】
【0514】
の場合、父親とされる父親は真の父親ではない。真の父系遺伝子型の最良の推定値は、各SNPでの集団頻度によって与えられる。したがって、子供の遺伝子型の確率は、式10のように、既知の母系遺伝子型及び集団の頻度によって決定される。
【数101】
【0515】
正しい父性に関する信頼度Cは、ベイズ法則(11)を使用して、2つの尤度のSNPにわたる積から計算される。
【数102】
【0516】
胎児画分パーセントを用いた最大尤度モデル
母親の血清に含まれる遊離浮遊DNAを測定することによって、又は任意の混合サンプル中の遺伝子型物質を測定することによって、胎児の倍数性状態を決定することは、自明ではない。いくつかの方法が存在し、例えば、胎児が特定の染色体においてトリソミックである場合、母体血液中に見出されるその染色体からのDNAの全量は、参照染色体に対して上昇すると推定されるリードカウント分析を実行する。そのような胎児におけるトリソミーを検出する1つの方法は、例えば、所与の染色体に対応する分析セット内のSNPの数に従って、又は染色体の一意にマッピング可能な部分の数に従って、各染色体に予測されるDNAの量を正規化することである。測定が正規化されると、測定されるDNAの量が特定の閾値を超える任意の染色体は、トリソミックであると決定される。このアプローチは、Fan,et al.PNAS,2008;105(42);pp.16266-16271,、及びChiu et al.BMJ 2011;342:c7401にも記載されている。Chiuらの論文では、以下のようにZスコアを計算することによって、正規化を達成した。
試験症例における染色体21のパーセンテージのZスコア=((試験症例における染色体21のパーセンテージ)-(参照対照における染色体21の平均パーセンテージ))/(参照対照における染色体21のパーセンテージの標準偏差)。
【0517】
これらの方法は、単一仮説否定法を使用して胎児の倍数性状態を決定する。しかしながら、これらにはいくつかの重大な欠点がある。胎児における倍数性を決定するためのこれらの方法は、サンプル中の胎児DNAの割合に応じて不変であるため、それらは1つのカットオフ値を使用する;その結果、決定の精度が最適ではなく、混合物中の胎児DNAの割合が比較的低い場合、最悪の精度を受ける。
【0518】
一実施形態において、本開示の方法を使用して、胎児の倍数性状態を決定することは、サンプル中の胎児DNAの画分を考慮することを伴う。本開示の別の実施形態において、本方法は、最大尤度推定の使用を伴う。一実施形態において、本開示の方法は、胎児又は胎盤由来のサンプル中のDNAの割合を計算することを伴う。一実施形態において、異数体をコールするための閾値は、計算された胎児DNAパーセントに基づいて適応調整される。いくつかの実施形態において、DNAの混合物中の胎児起源のDNAのパーセンテージを推定するための方法は、母親からの遺伝物質及び胎児からの遺伝物質を含む混合サンプルを得ることと、胎児の父親からの遺伝サンプルを得ることと、混合サンプル中のDNAを測定することと、父親サンプル中のDNAを測定することと、混合サンプル、及び父親サンプルのDNA測定を使用して混合サンプル中の胎児起源のDNAのパーセンテージを計算することとを含む。
【0519】
本開示の一実施形態において、混合物中の胎児DNAの画分又は胎児DNAの割合を測定することができる。いくつかの実施形態において、画分は、胎児DNAと母体DNAとの混合物である母体血漿サンプル自体に対して行われた遺伝子型決定測定値のみを使用して計算することができる。いくつかの実施形態において、画分は、また、母親の測定された又は他の方法で既知の遺伝子型及び/又は父親の測定された又は他の方法で既知の遺伝子型を使用して計算されてもよい。いくつかの実施形態において、胎児DNAの割合は、親のコンテキストの知識とともに、母体DNAと胎児DNAとの混合物に対してなされる測定値を使用して計算されてもよい。一実施形態において、胎児DNAの画分は、集団頻度を使用して計算されてもよく、特定の対立遺伝子の測定における確率に基づいてモデルを調整する。
【0520】
本開示の一実施形態において、信頼度は、胎児の倍数性状態の決定の精度に基づいて計算されてもよい。一実施形態において、最大尤度(Hmajor)の仮説の信頼度は、(1-Hmajor/Σ(全てH))として計算されてもよい。仮説の全ての分布が既知である場合、仮説の信頼度を決定することが可能である。親遺伝子型情報が既知であれば、全ての仮説の分布を決定することが可能である。正倍数体胎児についてのデータの予測分布の知識及び異数体胎児についてのデータの予測分布が既知である場合、倍数体決定の信頼度を計算することが可能である。親の遺伝子型データが既知である場合、これらの予測分布を計算することが可能である。一実施形態において、正規の仮説の周り及び異常な仮説の周りの検査統計の分布の知識を使用して、コールの信頼性の両方を決定し、より信頼性の高いコールを行うために閾値を改良し得る。これは、混合物中の胎児DNAの量及び/又はパーセントが低い場合に特に有用である。Z統計量などの検査統計量が、胎児DNAの割合が高い場合に最適化された閾値に基づいて作成された閾値を超えないため、実際に異数体である胎児が正倍数体であることが判明する状況を回避するのに役立つ。
【0521】
一実施形態において、本明細書に開示される方法を使用して、母体及び胎児の遺伝物質の混合物中の母体及び胎児の標的染色体のコピー数を決定することによって、胎児の異数体を決定することができる。この方法は、母体及び胎児の遺伝物質の両方を含む母体組織を得ることを伴い得る。いくつかの実施形態において、この母体組織は、母体血漿又は母体血液から単離された組織であり得る。この方法はまた、当該母体組織を処理することによって、母体組織から母体及び胎児の遺伝物質の混合物を得ることを伴い得る。この方法は、取得された遺伝物質を複数の反応サンプルに分配し、標的染色体からの標的配列を含む個々の反応サンプルと、標的染色体からの標的配列を含まない個々の反応サンプルとをランダムに提供し、例えば、サンプルに対して高スループット配列決定を実行することを伴い得る。この方法は、当該個々の反応サンプル中に存在するか又は存在しない遺伝物質の標的配列を分析して、反応サンプル中の可能性のある正倍数体胎児染色体の有無を表す第1の数のバイナリ結果と、反応サンプル中のおそらく異数体胎児染色体の有無を表す第2の数のバイナリ結果とを提供することを伴い得る。バイナリ結果の数のいずれかは、例えば、特定の染色体、染色体の特定の領域、特定の遺伝子座又は遺伝子座のセットにマッピングする配列リードをカウントする情報技術によって計算され得る。この方法は、染色体の長さ、染色体の領域の長さ、又はセット中の遺伝子座の数に基づいて、二項イベントの数を正規化することを伴っていてもよい。この方法は、第1の数値を使用して、反応サンプル中のおそらく正倍数体胎児染色体の二値結果の数の予測分布を計算することを伴い得る。この方法は、混合物中に見出される胎児DNAの第1の数及び予測画分を使用して、例えば、推定異数体胎児染色体のバイナリ結果の数の予測リードカウント分布に、(1+n/2)(式中、nは推定胎児画分)を乗じて、反応サンプル中の推定異数体胎児染色体のバイナリ結果の数の予測分布を計算することを伴い得る。いくつかの実施形態において、配列リードは、バイナリ結果ではなく、確率的マッピングで処理されてもよく、この方法は、より高い精度をもたらすが、より高い計算能力を必要とする。胎児画分は、複数の方法によって推定され得、そのうちのいくつかは、本開示の別の箇所に記載されている。この方法は、最大尤度アプローチを使用して、第2の数が、可能性のある異数体胎児染色体が正倍数体であるか、又は異数体であるかに対応するかどうかを決定することを伴っていてもよい。この方法は、胎児の倍数性状態を、測定データを考慮して正しい尤度が最大であるという仮説に対応する倍数性状態と呼ぶことを伴っていてもよい。
【0522】
最大尤度モデルの使用を使用して、胎児の倍数性状態を決定する任意の方法の精度を高めることができることに留意されたい。同様に、信頼度は、胎児の倍数性状態を決定する任意の方法について計算され得る。最大尤度モデルの使用は、単一仮説否定技術を使用して倍数決定が行われる任意の方法の精度の改善をもたらすであろう。最大尤度モデルは、正規事例及び異常事例の両方について尤度分布を計算できる任意の方法に使用されてもよい。最大尤度モデルの使用は、倍数性コールの信頼度を計算する能力を意味する。
【0523】
本方法の更なる考察
一実施形態において、本明細書に開示される方法は、多型遺伝子座における各対立遺伝子の独立した観察の数の定量的尺度を利用し、これは、対立遺伝子の比率の計算を伴わない。これは、遺伝子座における2つの対立遺伝子の比に関する情報を提供するが、いずれかの対立遺伝子の独立した観察の数を定量化しない、いくつかのマイクロアレイベースの方法などの方法とは異なる。当該技術分野で既知のいくつかの方法は、独立した観察の数に関する定量的情報を提供することができるが、倍数決定につながる計算は、対立遺伝子比のみを利用し、定量的情報を利用しない。独立した観察の数に関する情報を保持することの重要性を説明するために、2つの対立遺伝子、A及びBを有するサンプル遺伝子座を考慮する。第1の実験では、20個のA対立遺伝子及び20個のB対立遺伝子が観察され、第2の実験では、200個のA対立遺伝子及び200個のB対立遺伝子が観察される。両方の実験において、比(A/(A+B))は、0.5に等しいが、第2の実験は、A又はB対立遺伝子の頻度の確実性について第1の情報よりも多くの情報を伝達する。本方法は、対立遺伝子比を利用するのではなく、定量的データを使用して、各多型遺伝子座で最も可能性の高い対立遺伝子頻度をより正確にモデル化する。
【0524】
一実施形態において、本方法は、複数の多型遺伝子座からの測定値を集約するための遺伝子モデルを構築して、トリソミーをダイソミーからより良く区別し、また、トリソミーの種類を決定する。追加的に、本方法は、遺伝子連鎖情報を組み込んで、本方法の精度を強化する。これは、染色体上の全ての多型遺伝子座にわたって対立遺伝子比が平均化される、当該技術分野で既知のいくつかの方法とは対照的である。本明細書に開示される方法は、減数分裂I中の不分離、減数分裂II中の不分離、及び胎児発達の早い段階での有糸分裂中の不分離に起因する対立遺伝子頻度分布並びにトリソミーにおいて予測される対立遺伝子頻度分布を明示的にモデル化する。これが重要である理由を説明するために、乗換えがなかった場合、減数分裂中の不分離Iは、2つの異なる相同体が一方の親から継承されたトリソミーをもたらし、減数分裂II中又は胎児発達の早期での有糸分裂中の不分離は、一方の親からの同じ相同体の2つのコピーをもたらす。各シナリオは、各多型遺伝子座で異なる予測される対立遺伝子頻度をもたらし、また、共同で考慮される全ての物理的に結合された遺伝子座(すなわち、同じ染色体上の遺伝子座)でも生じる。相同体間の遺伝物質の交換をもたらす乗換えは、遺伝パターンをより複雑にするが、本方法は、遺伝子連鎖情報、すなわち組換え率情報及び遺伝子座間の物理的距離を使用することによってこれに対応する。減数分裂I不分離と、減数分裂II不分離又は有糸分裂不分離とをより良く区別するために、本方法は、セントロメアからの距離が増加するにつれて乗換えの確率が増加することをモデルに組み込む。減数分裂II不分離及び有糸分裂不分離は、有糸分裂不分離が、典型的には1つの相同体の同一又はほぼ同一のコピーをもたらすが、減数分裂II不分離事象に続いて存在する2つの相同体は、配偶子形成中の1つ以上の乗換えによって異なることが多いという事実によって区別され得る。
【0525】
一実施形態において、本開示の方法は、ダイソミーが想定される場合、親のハプロタイプを決定しない場合がある。一実施形態において、トリソミーの場合、本方法は、血漿が一方の親から2つのコピーを取るという事実を使用することによって、一方又は両方の親のハプロタイプについての決定を行うことができ、親の位相情報は、問題の親からどの2つのコピーが継承されたかに留意することによって決定することができる。具体的には、子は、親の同じコピーのうちの2つ(マッチするトリソミー)又は親の両方のコピー(マッチしないトリソミー)のいずれかを継承することができる。各SNPにおいて、マッチするトリソミー及びマッチしないトリソミーの尤度を計算することができる。乗換えを考慮した連結モデルを使用しない倍数性コール法は、全ての染色体にわたるマッチする及びマッチしないトリソミーの単純な重み付けされた平均として、トリソミーの全体的な尤度を計算する。しかしながら、分離誤差及び乗換えをもたらす生物学的メカニズムに起因して、トリソミーは、乗換えが生じた場合にのみ、染色体上でマッチするからマッチしない(及びその逆)に変化することができる。本方法は、確率的に乗換えの尤度を考慮し、そうでない方法よりも高い精度の倍数性コールをもたらす。
【0526】
一実施形態において、参照染色体を使用して、子画分及びノイズレベルの量又は確率分布を決定する。一実施形態において、子の画分、ノイズレベル、及び/又は確率分布は、倍数性状態が決定されている染色体から利用可能な遺伝子情報のみを使用して決定される。本方法は、参照染色体なしで、並びに特定の子画分又はノイズレベルを固定することなく機能する。これは、参照染色体からの遺伝子データが、子画分及び染色体の挙動を較正するために必要とされる当該技術分野で既知の方法からの著しい改善及び差別化のポイントである。
【0527】
胎児画分を決定するために参照染色体が必要とされない実施形態において、仮説を決定することは、以下のように行われる。
【数103】
【0528】
参照染色体を有するアルゴリズムでは、典型的には、参照染色体がダイソミーであると仮定し、次いで、(a)この仮定及び参照染色体データに基づいて、最も可能性の高い子画分及びランダムノイズレベルNを固定してもよい:
【数104】
【0529】
次いで以下を低減する
LIK(D|H)=LIK(D|H,cfr,N
又は(b)この仮定及び参照染色体データに基づいて、子画分及びノイズレベル分布を推定する。具体的には、cfr及びNの値を1つだけ固定するのではなく、可能性のあるcfr、N値のより広い範囲に確率p(cfr,N)を割り当てる:
p(cfr,N)~LIK(D(参照染色体)|H11,cfr,N)*priorprob(cfr,N)
priorprob(cfr,N)は、事前の知識及び実験によって決定される、特定の子画分及びノイズレベルの事前の確率である。所望な場合、cfr、Nの範囲にわたって均一なだけである。次いで、以下のように書くことができる:
【数105】
【0530】
上記の両方の方法は、良好な結果をもたらす。
【0531】
いくつかの例では、参照染色体を使用することは、望ましくない、可能でない、又は実行可能でないことに留意されたい。このような場合、染色体ごとに別々に最良の倍数性コールを導出することが可能である。具体的には、
【数106】
p(cfr,N|H)は、上記のように決定されてもよく、各染色体については、仮説Hを仮定して、ダイソミーを仮定している参照染色体についてだけでなく、別々に決定されてもよい。この方法を使用して、ノイズ及び子画分パラメータの両方を固定したままにするか、パラメータのいずれかを固定するか、又は各染色体及び各仮説について両方のパラメータを確率的な形で維持することが可能である。
【0532】
DNAの測定は、ノイズ及び/又はエラーが発生しやすく、特に、DNAの量が少ない場合、又はDNAが汚染DNAと混合されている場合の測定である。このノイズは、より正確な遺伝子型データ、及びより正確な倍数性コールをもたらす。いくつかの実施形態において、プラットフォームモデリング又はノイズモデリングのいくつかの他の方法を使用して、倍数性決定に対するノイズの有害な影響に対抗してもよい。本方法は、入力DNAの量、DNA品質、及び/又はプロトコル品質に起因するランダムノイズを説明する、両方のチャネルの共同モデルを使用する。
【0533】
これは、遺伝子座における対立遺伝子強度の比率を用いて倍数決定がなされる、当該技術分野で既知のいくつかの方法とは対照的である。この方法は、正確なSNPノイズモデリングを排除する。具体的には、測定値の誤差は、典型的には、測定されたチャネル強度比に特異的に依存せず、モデルの一次元情報を使用するように縮小する。ノイズ、チャネル品質、及びチャネル相互作用の正確なモデリングには、対立遺伝子比を使用してモデル化できない二次元結合モデルが必要である。
【0534】
具体的には、f(x,y)がr=x/yである比率rに2つのチャネル情報を投影することは、それ自体が正確なチャネルノイズ及びバイアスモデリングに役立たない。特定のSNP上のノイズは、比率、すなわちノイズ(x,y)≠f(x,y)の関数ではなく、実際には両方のチャネルの結合関数である。例えば、二項モデルでは、測定された比率のノイズは、純粋にrの関数ではないr(1-r)/(x+y)の分散を有する。任意のチャネルバイアス又はノイズが含まれるそのようなモデルでは、SNPi上で、観察されたチャネルX値がx=aX+bであり、式中、Xは真のチャネル値であり、bは余分なチャネルバイアス及びランダムノイズであると仮定する。同様に、y=cY+dと仮定する。観測された比率r=x/yは、(aiX+bi)/(ciY+di)がX/Yの関数ではないため、真の比率X/Yを正確に予測することも、残余ノイズをモデル化することもできない。
【0535】
本明細書に開示される方法は、測定チャネルの全てのジョイント二項分布を個別に使用してノイズ及びバイアスをモデル化する効果的な方法を説明する。関連する方程式は、SNP挙動を効果的に調整するSNP一貫性バイアス、P(良い)及びP(参照|悪い)、P(mut|悪い)ごとに言及するセクションにおいて、文書の他の場所に見出すことができる。一実施形態において、本開示の方法は、ベータ二項分布を使用し、これは、対立遺伝子比のみに依存するという制限的な慣行を回避し、代わりに、両方のチャネルカウントに基づいて挙動をモデル化する。
【0536】
一実施形態において、本明細書に開示される方法は、利用可能な全ての測定値を使用することによって、母体血漿中に見出される遺伝子データから、妊娠中の胎児の倍数性をコールすることができる。一実施形態において、本明細書に開示される方法は、親コンテキストの部分集合のみからの測定値を使用することによって、母体血漿中に見出される遺伝子データから妊娠中の胎児の倍数性をコールすることができる。当該技術分野で既知のいくつかの方法は、親コンテキストがAA|BBコンテキストからのものである、すなわち、親が所与の遺伝子座で両方ともホモ接合であるが、異なる対立遺伝子についての測定された遺伝子データのみを使用する。この方法の1つの問題は、小さい割合の多型遺伝子座が、典型的には、10%未満のAA|BBコンテキストに由来することである。本明細書に開示される方法の一実施形態において、本方法は、親コンテキストがAA|BBである遺伝子座において作製された母体血漿の遺伝子測定を使用しない。一実施形態において、本方法は、AA|AB、AB|AA、及びAB|AB親コンテキストを有するそれらの多型遺伝子座についてのみ血漿測定を使用する。
【0537】
当該技術分野で既知のいくつかの方法は、両方の親遺伝子型が存在する、AA/BBコンテキストにおけるSNPからの対立遺伝子比を平均化することを含み、これらのSNP上の平均対立遺伝子比からの倍数性コールを決定すると主張する。この方法は、差動SNP挙動による著しい不正確さに苦しむ。なお、この方法は、両方の親遺伝子型を有することが既知であると仮定する。対照的に、いくつかの実施形態において、本方法は、親のいずれの存在も想定せず、一様なSNP挙動を想定しない結合チャネル分布モデルを使用する。いくつかの実施形態において、本方法は、異なるSNP挙動/重み付けを説明する。いくつかの実施形態において、本方法は、親遺伝子型の一方又は両方の知識を必要としない。本方法がこれをどのように達成し得るかの例は、以下の通りである:
【0538】
いくつかの実施形態において、仮説の対数尤度は、SNPごとに定量されてもよい。特定のSNPiでは、胎児倍数性仮説H及び胎児DNAの割合cfを仮定して、観察されたデータDの対数尤度を以下のように定義する:
【数107】
式中、mは真の母系遺伝子型である可能性があり、fは真の父系遺伝子型である可能性があり、式中、m、f∈{AA,AB,BB}、及びcは、仮説Hが与えられた場合、子の遺伝子型である可能性がある。具体的には、モノソミーc{A,B}について、ダイソミーc∈{AA,AB,BB}について、トリソミーc∈{AAA,AAB,ABB,BBB}についてである。親遺伝子型データを含めることは、典型的には、より正確な倍数性決定をもたらすが、親の遺伝子型データは、本方法がうまく機能するために必要ではないことに留意されたい。
【0539】
当該技術分野で既知のいくつかの方法は、母親がホモ接合であるが、異なる対立遺伝子が血漿(AA|AB又はAA|BBのいずれかのコンテキスト)で測定されるSNPからの対立遺伝子比を平均化することを含み、これらのSNP上の平均対立遺伝子比からの倍数性コールを決定すると主張する。この方法は、父系遺伝子型が利用できない場合を意図している。血漿がホモ接合性で反対側の父BBの存在なしに特定のSNP上でヘテロ接合性であると主張することがどれほど正確であるかは疑問であることに留意されたい。子供の画分が低い症例では、B対立遺伝子の存在のように見えるものは、ノイズの存在だけである可能性があり、更に、Bが存在しないように見えるものは、胎児測定からの単純な対立遺伝子のドロップアウトである可能性がある。血漿のヘテロ接合度を実際に決定できる場合であっても、この方法では、父系三染色体を区別することはできない。具体的には、母親がAAであり、いくつかのBが血漿中で測定されるSNPについては、父親がGGである場合、得られた子の遺伝子型はAGGであり、平均比率は33%A(子画分=100%)をもたらす。しかしながら、父親がAGである場合、得られた子供の遺伝子型は、マッチするトリソミーのAGG(33%A比率に寄与する)、又はマッチしないトリソミーのAAG(66%Aに向かって平均比率を引き出す)であり得る。多くのトリソミーが乗換えを有する染色体上にあることを考えると、全体的な染色体は、マッチしないトリソミーと全てのマッチしないトリソミーとの間の任意の場所を有し得るため、この比率は、33~66%の任意の場所で変化し得る。プレーンダイソミーの場合、比率は約50%でなければならない。連結モデル又は平均の正確な誤差モデルを使用しないと、この方法は父系トリソミーの多くの症例を見逃すことになる。対照的に、本明細書に開示される方法は、利用可能な遺伝子型情報及び集団頻度に基づいて、各親遺伝子型候補の親遺伝子型確率を割り当て、親遺伝子型を明示的に必要としない。追加的に、本明細書に開示される方法は、親遺伝子型データの有無にかかわらず、トリソミーを検出することができ、連結モデルを使用して、マッチするトリソミーからマッチしないトリソミーへの可能性のある乗換えの点を特定することによって、補償することができる。
【0540】
当該技術分野で既知のいくつかの方法は、母系又は父系遺伝子型が知られていないSNPからの対立遺伝子比を平均化する方法、及びこれらのSNP上の平均比からの倍数性コールを決定する方法を主張する。しかしながら、これらの目的を達成する方法は開示されていない。本明細書に開示される方法は、そのような状況で正確な倍数性コールを行うことができ、実践への還元は、結合確率最大尤度法を使用し、任意選択で、SNPノイズ及びバイアスモデル、並びに連結モデルを利用して、本明細書の他の箇所に開示される。
【0541】
当該技術分野で既知のいくつかの方法は、対立遺伝子比を平均化することを伴い、1つ又はいくつかのSNPでの平均対立遺伝子比から倍数性コールを決定すると主張する。しかしながら、このような方法は、連結の概念を利用しない。本明細書に開示される方法は、これらの欠点を有さない。
【0542】
DNAの起源を決定する前に配列の長さを使用すること
母体DNAと胎児DNAとでは配列の長さの分布が異なり、胎児は一般に短いことが報告されている。本開示の一実施形態において、経験的データの形態で従来の知識を使用し、母親(P(X|母体))及び胎児DNA(P(X|胎児))の両方の予測される長さの事前分布を構築することが可能である。長さxの新たな未確認DNA配列を考慮すると、所与のDNA配列が母体DNA又は胎児DNAのいずれかであるという確率を、母体又は胎児のいずれかが与えられたxの事前尤度に基づいて割り当てることが可能である。具体的には、P(x|母体)>P(x|胎児)の場合、DNA配列は、P(x|母体)=P(x|母体)/[(P(x|母体)+P(x|胎児)]で母体として分類することができ、p(x|母体)<p(x|胎児)の場合、DNA配列は、胎児、P(x|胎児)=P(x|胎児)/[(P(x|母体)+P(x|胎児)]]として分類することができる。本開示の一実施形態において、高い確率を有する母体又は胎児として割り当てることができる配列を考慮することによって、そのサンプルに特異的な母体及び胎児の配列の長さの分布を決定することができ、その後、そのサンプル特異的な分布をそのサンプルの予想サイズ分布として使用することができる。
【0543】
配列決定コストを最小限に抑えるための可変リード深度
例えば、Chiu et al.BMJ 2011;342:c7401において、診断に関する多くの臨床試験において、いくつかのパラメータを有するプロトコルが設定され、次いで、同じプロトコルが、試験における各患者について同じパラメータで実行される。遺伝物質を測定する方法として、配列決定を用いて母親に妊娠している胎児の倍数性状態を決定する場合、1つの関連するパラメータは、リード数である。リード数は、シーケンサ上の実際のリード数、意図されたリード数、分数レーン、全レーン、又は全フローセルを指し得る。これらの研究において、リード数は、典型的には、サンプルの全て又はほぼ全てが所望のレベルの精度を達成することを確実にするレベルに設定される。配列決定は、現在、高価な技術であり、マッピング可能な500万リード当たり約200ドルのコストがかかり、価格が下がっている間、配列決定ベースの診断が同様のレベルの精度で動作することを可能にするが、リードが少ない方法は、必然的にかなりの量のお金を節約する。
【0544】
二倍体測定の精度は、典型的には、リード数及び混合物中の胎児DNAの画分を含む多くの要因に依存する。混合物中の胎児DNAの画分がより高い場合、精度は典型的にはより高い。同時に、リード数が多い場合、精度は典型的にはより高い。倍数性状態が同等の精度で決定され、第1のケースは第2のケースよりも混合物中の胎児DNAの画分が低く、第1のケースでは第2のケースよりも多くのリードが配列決定された2つのケースを有することが可能である。所与のレベルの精度を達成するために必要なリード数を決定する際のガイドとして、混合物中の胎児DNAの予測画分を使用することが可能である。
【0545】
本開示の一実施形態において、セット内の異なるサンプルが異なるリード深度に配列決定されるサンプルセットを実行することができ、各サンプル上で実行されるリード数は、各混合物中の胎児DNAの計算された画分を与えられた所与のレベルの精度を達成するように選択される。本開示の一実施形態において、これは、混合サンプルの測定を行い、混合物中の胎児DNAの画分を決定することを伴い得る。胎児画分のこの推定は、配列決定で行われてもよく、TaqManで行われてもよく、qPCRで行われてもよく、SNPアレイで行われてもよく、所与の遺伝子座で異なる対立遺伝子を区別することができる任意の方法で行われてもよい。胎児画分の推定の必要性は、実際の測定データと比較するときに考慮される仮説のセット中の胎児画分の全て又は選択されたセットをカバーする仮説を含むことによって排除され得る。混合物中の画分胎児DNAが決定された後、各サンプルについてリードされる配列の数を決定してもよい。
【0546】
本開示の一実施形態において、100人の妊婦は、それぞれのOBを訪問し、抗溶解剤及び/又はDNA酵素を不活性化する何らかのものを含む血液を採血管に採取する。妊婦は各々、唾液サンプルを与える妊娠中の胎児の父親のためのキットを家に持ち帰える。100組全てのカップルの遺伝物質の両方のセットは実験室に送り返され、母親の血液がスピンダウンされ、血漿と同様にバフィーコートが単離される。血漿は、母体DNAと胎盤由来DNAとの混合物を含む。母体バフィーコート及び父体血液は、SNPアレイを使用して遺伝子型決定され、母体血漿サンプル中のDNAは、SURESELECTハイブリダイゼーションプローブで標的化される。プローブでプルダウンしたDNAを使用して、100個のタグ付きライブラリを生成し、各母サンプルについて1つずつを生成し、各サンプルは異なるタグでタグ付けされる。各ライブラリから画分を取り出し、それらの画分の各々を一緒に混合し、多重化された方法でILLUMINA HISEQ DNAシーケンサの2つのレーンに添加し、各レーンは、約5000万のマッピング可能なリードをもたらし、100の多重化された混合物で約100万のマッピング可能なリード、又はサンプル当たり約100万のリードをもたらした。配列リードを使用して、各混合物中の胎児DNAの画分を決定した。サンプルの50個は、混合物中に15%を超える胎児DNAを有し、100万リードは、99.9%の信頼性で胎児の倍数性状態を決定するのに十分であった。
【0547】
残りの混合物のうち、25個は、10~15%の胎児DNAを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、HISEQの1つのレーンを走らせて、各サンプルについて追加の200万リードを生成した。10~15%の胎児DNAを有する各混合物についての配列データの2つのセットを一緒に加え、それらの胎児の倍数性状態を99.9%の信頼度で決定するのに十分であったサンプル当たり300万リードをもたらした。
【0548】
残りの混合物のうち、13個は、6~10%の胎児DNAを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、HISEQの1つのレーンを走らせて、各サンプルについて追加の400万リードを生成した。6~10%の胎児DNAを有する各混合物についての配列データの2つのセットを一緒に加え、それらの胎児の倍数性状態を99.9%の信頼度で決定するのに十分であった、混合物当たり500万の合計リードをもたらした。
【0549】
残りの混合物のうち、8つは、4~6%の胎児DNAを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、HISEQの1つのレーンを走らせて、各サンプルについて追加の600万リードを生成した。4~6%の胎児DNAを有する各混合物についての配列データの2つのセットを一緒に加え、それらの胎児の倍数性状態を99.9%の信頼度で決定するのに十分であった、混合物当たり700万の合計リードをもたらした。
【0550】
残りの4つの混合物のうち、それらの全ては、2~4%の胎児DNAを有し、これらの混合物から調製された関連するライブラリの各々の画分を多重化し、HISEQの1つのレーンを走らせて、各サンプルについて追加の1200万リードを生成した。2~4%の胎児DNAを有する各混合物についての配列データの2つのセットを一緒に加え、それらの胎児の倍数性状態を99.9%の信頼度で決定するのに十分であった、混合物当たり1300万の合計リードをもたらした。
【0551】
この方法は、100サンプルにわたって99.9%の精度を達成するために、HISEQ機械上で6レーンの配列決定を必要とした。全てのサンプルについて同じ数の測定が必要であり、全ての倍数決定が99.9%の精度で行われることを確実にした場合、25レーンの配列決定が行われ、コールなし率又は4%のエラー率が許容された場合、14レーンの配列決定で達成された可能性がある。
【0552】
生のジェノタイピングデータの使用
母体血液に見られる胎児のDNAで測定された胎児の遺伝情報を使用してNPDを達成することができるいくつかの方法が存在する。これらの方法のいくつかは、SNPアレイを使用して胎児DNAの測定を行うことを含み、いくつかの方法は、非標的化配列決定を含み、いくつかの方法は、標的化配列決定を含む。標的化配列決定は、SNPを標的化してもよく、STRを標的化してもよく、他の多型遺伝子座を標的化してもよく、非多型遺伝子座を標的化してもよく、又はそれらのいくつかの組み合わせを標的化してもよい。これらの方法のいくつかは、測定を行う機械内のセンサから来る強度データから対立遺伝子の同一性をコールする商業的又は独自の対立遺伝子コール元を使用することを伴い得る。例えば、ILLUMINA INFINIUMシステム又はAFFYMETRIX GENECHIPマイクロアレイシステムは、DNAの相補的セグメントにハイブリダイゼーションすることができる結合DNA配列を有するビーズ又はマイクロチップを含み、ハイブリダイゼーションすると、検出することができるセンサ分子の蛍光特性の変化がある。また、配列決定方法、例えば、ILLUMINA SOLEXAゲノムシーケンサ又はABI固体ゲノムシーケンサもあり、DNAのフラグメントの遺伝子配列が配列決定され、配列決定される鎖に相補的なDNAの鎖の伸長時に、伸長されたヌクレオチドの同一性は、典型的には、相補的なヌクレオチドに付加される蛍光タグ又はラジオタグを介して検出される。これらの方法の全てにおいて、遺伝子型又は配列決定データは、典型的には、蛍光又は他のシグナル、又はその欠如に基づいて決定される。これらのシステムは、典型的には、蛍光又は他の検出デバイス(一次遺伝子データ)のアナログ出力から特定の対立遺伝子コール(二次遺伝子データ)を行う低レベルのソフトウェアパッケージと組み合わせられる。例えば、SNPアレイ上の所与の対立遺伝子の場合、ソフトウェアは、例えば、蛍光強度が特定の閾値を上回って又は下回って測定される場合、特定のSNPが存在するか、又は存在しないことをコールする。同様に、シーケンサの出力は、各染料について検出される蛍光レベルを示すクロマトグラムであり、ソフトウェアは、特定の塩基対がA又はT又はC又はGであることをコールする。高スループットシーケンサは、典型的には、配列決定されたDNA配列の最も可能性の高い構造を表す、リードと呼ばれる一連のそのような測定を行う。クロマトグラムの直接的なアナログ出力は、本明細書では一次遺伝子データであると定義され、ソフトウェアによって行われた塩基対/SNPコールは、二次遺伝子データであるとみなされる。一実施形態において、一次データは、遺伝子型決定プラットフォームの未処理の出力である生の強度データを指し、遺伝子型決定プラットフォームは、SNPアレイ、又は配列決定プラットフォームを指し得る。二次遺伝子データは、対立遺伝子コールが行われた、又は配列データが塩基対に割り当てられた、及び/又は配列リードがゲノムにマッピングされた、処理された遺伝子データを指す。
【0553】
多くのより高いレベルのアプリケーションは、これらの対立遺伝子のコール、SNPのコール、及び配列リード、すなわち、遺伝子型決定ソフトウェアが生成する二次遺伝子データを利用する。例えば、DNA NEXUS、ELAND又はMAQは、配列決定リードを取り、それらをゲノムにマッピングする。例えば、非侵襲性出生前診断の文脈において、PARENTAL SUPPORT(商標)などの複雑な情報学は、個体の遺伝子型を決定するために多数のSNPコールを活用し得る。また、着床前遺伝子診断の文脈において、ゲノムにマッピングされる配列リードのセットをとることが可能であり、各染色体、又は染色体のセクションにマッピングされるリードの正規化されたカウントをとることによって、個体の倍数性状態を決定することが可能であり得る。非侵襲性出生前診断の文脈において、母体血漿中に存在するDNA上で測定された配列リードのセットを取り、それらをゲノムにマッピングすることが可能であり得る。次いで、各染色体又は染色体のセクションにマッピングされたリードの正規化されたカウントを取り、そのデータを使用して個体の倍数性状態を決定し得る。例えば、不釣り合いに多くのリードを有するそれらの染色体は、採血された母体で妊娠している胎児においてトリソミックであると結論付けることが可能であり得る。
【0554】
しかしながら、実際には、測定器の初期出力はアナログシグナルである。特定の塩基対が配列決定ソフトウェアに関連付けられたソフトウェアによってコールされるとき、例えば、ソフトウェアは塩基対をTと呼んでもよく、実際には、コールは、ソフトウェアが最も可能性が高いと考えているコールである。しかしながら、いくつかの場合において、コールは、低い信頼度であってもよく、例えば、アナログシグナルは、特定の塩基対がTである可能性がわずか90%、及びAである可能性が10%である可能性があることを示してもよい。別の例では、SNPアレイリーダーに関連する遺伝子型コールソフトウェアは、ある対立遺伝子をGとコールし得る。しかしながら、実際には、基礎となるアナログシグナルは、対立遺伝子がGである可能性が70%のみであり、対立遺伝子がTである可能性が30%であることを示し得る。これらの場合、上位レベルのアプリケーションが、下位レベルのソフトウェアによって行われた遺伝子型コール及び配列コールを使用するとき、それらは、いくつかの情報を失っている。すなわち、遺伝子型決定プラットフォームによって直接測定される一次遺伝子データは、添付のソフトウェアパッケージによって決定される二次遺伝子データよりも乱雑であり得るが、それはより多くの情報を含む。二次遺伝子データ配列をゲノムにマッピングする際、いくつかの塩基が十分な明瞭さで読み取られないか、又はマッピングが明確でないため、多くのリードが捨てられる。一次遺伝子データ配列リードを使用する場合、最初に二次遺伝子データ配列リードに変換されたときに捨てられた可能性があるそれらのリードの全て又は多くを、リードを確率的な方法で処理することによって使用することができる。
【0555】
本開示の一実施形態において、上位レベルのソフトウェアは、下位レベルのソフトウェアによって決定される対立遺伝子コール、SNPコール、又は配列リードに依存しない。代わりに、上位レベルのソフトウェアは、遺伝子型決定プラットフォームから直接測定されたアナログシグナルに基づいて計算を行う。本開示の一実施形態において、胚/胎児/小児の遺伝子データを再構築する能力が、遺伝子型決定プラットフォームによって測定される一次遺伝子データを直接使用するように設計されるように、PARENTAL SUPPORT(商標)などの情報学に基づく方法が修正される。本開示の一実施形態において、PARENTAL SUPPORT(商標)などの情報学に基づく方法は、一次遺伝子データを使用し、二次遺伝子データを使用せずに、対立遺伝子コール、及び/又は染色体コピー数コールを行うことができる。本開示の一実施形態において、全ての遺伝子コール、SNPコール、配列リード、配列マッピングは、一次遺伝子データを二次遺伝子コールに変換するのではなく、遺伝子型決定プラットフォームによって直接測定される生の強度データを使用することによって、確率論的な方法で処理される。一実施形態において、対立遺伝子数の確率を計算し、各仮説の相対確率を決定する際に使用される調製されたサンプルからのDNA測定値は、一次遺伝子データを含む。
【0556】
いくつかの実施形態において、本方法は、少なくとも1つの関連個体の遺伝子データを組み込んだ標的個体の遺伝子データの精度を高めることができ、本方法は、標的個体のゲノムに特異的な一次遺伝子データ及び関連個体(複数可)のゲノム(複数可)に特異的な遺伝子データを得ることと、関連個体(複数可)からの染色体が標的個体のゲノム中のそれらのセグメントに対応する可能性のあるセグメントに関する1つ以上の仮説のセットを作成することと、標的個体の一次遺伝子データ及び関連個体(複数可)の遺伝子データを与えられた仮説の各々の確率を決定することと、各仮説に関連する確率を使用して、標的個体の実際の遺伝物質の最も可能性の高い状態を決定することと、を含む。いくつかの実施形態において、本方法は、標的個体のゲノム中の染色体のセグメントのコピー数を決定することができ、本方法は、標的個体のゲノム中に存在する染色体セグメントの多くのコピー数の仮説のセットを作成することと、標的個体からの一次遺伝子データ及び1つ以上の関連個体からの遺伝子情報をデータセットに組み込むことと、データセットに関連付けられるプラットフォーム応答の特性を推定することであって、プラットフォーム応答が1つの実験から別の実験へと変化し得る、推定することと、データセット及びプラットフォーム応答特性を与えられて、各コピー数仮説の条件付き確率を計算することと、最も可能性の高いコピー数の仮説に基づいて染色体セグメントのコピー数を決定することと、を含む。一実施形態において、本開示の方法は、標的個体における少なくとも1つの染色体の倍数性状態を決定することができ、本方法は、標的個体及び1つ以上の関連個体から一次遺伝子データを得ることと、標的個体の染色体の各々についての少なくとも1つの倍数性状態の仮説のセットを作成することと、1つ以上の専門家技術を使用して、使用される各々の専門家技術について、得られた遺伝子データを与えられる、セット内の各々の倍数性状態の仮説についての統計的確率を決定することと、各々の倍数性状態の仮説について、1つ以上の専門家技術によって決定される統計的確率を組み合わせることと、各々の倍数性状態の仮説の組み合わせられた統計的確率に基づいて、標的個体における各々の染色体の倍数性状態を決定することと、を含む。一実施形態において、本開示の方法は、対立遺伝子のセット、標的個体、及び標的個体の一方又は両方の親、及び任意選択で1つ以上の関連個体から対立遺伝子の状態を決定することができ、本方法は、標的個体、及び一方又は両方の親、及び任意の関連する個体から一次遺伝子データを得ることと、標的個体ト、及び一方又は両方の親、及び任意選択で1つ以上の関連個体についての少なくとも1つの対立遺伝子の仮説のセットを作成することであって、仮説が、対立遺伝子のセットにおいて可能な対立遺伝子の状態を記述する、作成することと、得られた遺伝データを用いて、仮説セット内の各対立遺伝子仮説の統計的確率を決定することと、各々の対立遺伝子仮説の統計的確率に基づいて、標的個体、及び一方又は両方の親、及び任意選択で1つ以上の関連個体について対立遺伝子のセット内の各々の対立遺伝子について対立遺伝子の状態を決定することと、を含む。
【0557】
いくつかの実施形態において、混合サンプルの遺伝子データは、配列データを含んでもよく、配列データは、ヒトゲノムに一意にマッピングされなくてもよい。いくつかの実施形態において、混合サンプルの遺伝子データは、配列データを含んでもよく、配列データは、ゲノム内の複数の位置にマッピングされ、各可能なマッピングは、所与のマッピングが正しい確率に関連付けられる。いくつかの実施形態において、配列リードは、ゲノム内の特定の位置に関連すると仮定されない。いくつかの実施形態において、配列リードは、ゲノム内の複数の位置、及びその位置に属する関連する確率に関連する。
【0558】
出生前診断の組み合わせ方法
異数性又は他の遺伝的欠陥の出生前診断又は出生前スクリーニングに使用され得る多くの方法がある。本明細書の他の箇所、及び2006年11月28日に出願された米国実用新案出願第11/603,406号、2008年3月17日に出願された米国実用新案出願第12/076,348号、及びPCT実用新案出願第PCT/S09/52730号に記載されている方法は、関連する個体の遺伝子データを使用して、胎児などの標的個体の遺伝子データが知られているか、又は推定される精度を高めるそのような方法の1つである。出生前診断に使用される他の方法は、母体血液中の特定のホルモンのレベルを測定することを含み、これらのホルモンは様々な遺伝的異常と相関している。この例は、トリプル検査と呼ばれ、母体血液中のいくつかの(通常2、3、4、又は5つの)異なるホルモンのレベルを測定する検査である。所与の結果の尤度を決定するために複数の方法が使用される場合、方法のいずれもそれ自体が決定的ではない場合、それらの方法によって与えられた情報を組み合わせて、個々の方法のいずれよりも正確である予測を行うことが可能である。トリプル検査では、3つの異なるホルモンによって与えられる情報を組み合わせることで、個々のホルモンレベルが予測するよりも正確な遺伝子異常の予測を得ることができる。
【0559】
胎児の遺伝子状態、具体的には胎児における遺伝子異常の可能性についてより正確な予測を行う方法であって、それらの予測が様々な方法を使用して行われた胎児における遺伝子異常の予測を組み合わせることを含む、方法が本明細書に開示される。「より正確な」方法とは、所与の偽陽性率でより低い偽陰性率を有する異常を診断するための方法を指し得る。本開示の好ましい実施形態において、予測のうちの1つ以上は、胎児について知られている遺伝子データに基づいて行われ、ここで、遺伝子知識は、PARENTAL SUPPORT(商標)方法を用いて、すなわち、胎児に関連する個体の遺伝子データを用いて、より高い精度で胎児の遺伝子データを決定した。いくつかの実施形態において、遺伝子データは、胎児の倍数性状態を含んでもよい。いくつかの実施形態において、遺伝子データは、胎児のゲノム上の対立遺伝子コールのセットを指し得る。いくつかの実施形態において、予測のいくつかは、トリプル検査を使用して行われてもよい。いくつかの実施形態において、予測のいくつかは、母体血液中の他のホルモンレベルの測定を使用して行われてもよい。いくつかの実施形態において、診断とみなされる方法によってなされる予測は、スクリーニングとみなされる方法によってなされる予測と組み合わされてもよい。いくつかの実施形態において、本方法は、アルファ-フェトタンパク質(AFP)の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、非抱合型エストリオール(UE)の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、ベータヒト絨毛性ゴナドトロピン(ベータ-hCG)の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、侵襲性トロホブラスト抗原(ITA)の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、インヒビンの母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、妊娠関連血漿タンパク質A(PAPP-A)の母体血液中レベルを測定することを伴う。いくつかの実施形態において、本方法は、他のホルモン又は母体血清マーカーの母体血液中レベルを測定することを伴う。いくつかの実施形態において、予測のいくつかは、他の方法を使用して行われてもよい。いくつかの実施形態において、予測のいくつかは、妊娠の約12週における超音波及び血液検査、並びに約16週における第2の血液検査を組み合わせたものなどの完全に統合された検査を使用して行われてもよい。いくつかの実施形態において、本方法は、胎児の頸部半透明度(NT)を測定することを伴う。いくつかの実施形態において、本方法は、予測を行うために前述のホルモンの測定されたレベルを使用することを伴う。いくつかの実施形態において、本方法は、前述の方法の組み合わせを伴う。
【0560】
予測を組み合わせる多くの方法があり、例えば、ホルモン測定値を中央値の倍数(MoM)に変換し、次に尤度比(LR)に変換することができる。同様に、他の測定値は、NT分布の混合モデルを使用してLRに変換され得る。NTのLR及び生化学的マーカーは、年齢及び妊娠に関連するリスクを乗じて、21トリソミーなどの様々な状態のリスクを導き出すことができる。検出率(DR)及び偽陽性率(FPR)は、所与のリスク閾値を超えるリスクの割合を取ることによって計算することができる。
【0561】
一実施形態において、倍数性状態をコールする方法は、結合分布モデル及び対立遺伝子数確率を使用して決定された状態仮説の各々の相対確率と、リード数分析、ヘテロ接合率の比較、親の遺伝情報が使用される場合にのみ利用可能な統計量、特定の親コンテキストの正規化された遺伝子型シグナルの確率、第1のサンプル又は調製されたサンプルの推定胎児画分を使用して計算される統計量、及びそれらの組み合わせが挙げられるがこれらに限定されない、胎児がトリソミックであることのリスクスコアを決定する他の方法から取り入れた統計技術を用いて計算される各々の倍数性仮説の相対確率を比較することと、を含む。
【0562】
別の方法は、4つの測定されたホルモンレベルを伴う状況を含むことができ、それらのホルモンの周りの確率分布が知られている:正倍数体症例の場合はp(x,x,x,x|e)、異数体症例の場合はp(x,x,x,x|a)。次いで、DNA測定値の確率分布を測定することができ、正倍数体及び異数体の場合はそれぞれg(y|e)及びg(y|a)を測定することができる。正倍数体/異数体という仮定で、これらが独立であると仮定すると、p(x,x,x,x|a)g(y|a)及びp(x,x,x,x|e)g(y|e)として組み合わされ、次いで母体年齢を与えられた前のp(a)及びp(e)を各々乗算することができる。次いで、最も高いものを選択することができる。
【0563】
一実施形態において、g(y|a又はe)上の分布がガウスであると仮定するために中心極限定理を呼び起こし、複数のサンプルを見ることによって平均及び標準偏差を測定することが可能である。別の実施形態において、転帰が与えられると、それらが独立しておらず、結合分布p(x,x,x,x|a又はe)を推定するのに十分なサンプルを収集すると仮定することができる。
【0564】
一実施形態において、標的個体の倍数性状態は、確率が最大である仮説に関連付けられる倍数性状態であると決定される。場合によっては、1つの仮説は、90%より大きい正規化された複合確率を有する。各仮説は、倍数性状態の1つ又は一組に関連付けられ、正規化された複合確率が90%より大きいか、又は50%、80%、95%、98%、99%又は99.9%などのいくつかの他の閾値が、決定された倍数性状態として仮説をコールするために必要とされる閾値として選択されてもよい。
【0565】
母体血中の以前の妊娠からの子供からのDNA
非侵襲性出生前診断の1つの困難は、現在の妊娠からの胎児細胞を以前の妊娠からの胎児細胞から区別することである。以前の妊娠からの遺伝物質はしばらくすると消えるという説もあるが、決定的な証拠は示されていない。本開示の一実施形態において、父系起源の母体血液(すなわち、胎児が父親から継承したDNA)に存在する胎児DNAを、PARENTAL SUPPORT(商標)(PS)方法、及び父系ゲノムの知識を用いて決定することが可能である。この方法は、段階的な親の遺伝情報を利用してもよい。祖父母の遺伝子データ(祖父母からの精子からの測定された遺伝子データなど)、又は他の生まれた子供からの遺伝子データ、又は流産のサンプルを使用して、非段階的な遺伝子型情報から親の遺伝子型を位相することが可能である。また、HapMapベースの位相決定、又は父系細胞のハプロタイピングによって、非段階的な遺伝情報を位相決定することもできる。染色体が密な束である場合、有糸分裂期にある細胞を停止させることと、微小流体を使用して、別個のウェルに別個の染色体を入れることとによって、ハプロタイピングの成功は実証されている。別の実施形態において、段階的な親ハプロタイプデータを使用して、父親からの2つ以上のホモログの存在を検出することが可能であり、2つ以上の子供からの遺伝物質が血液中に存在することを意味する。胎児において正倍数であると予測される染色体に着目することにより、胎児がトリソミーに罹患していた可能性を排除することができる。また、胎児DNAが現在の父親からのものでないかどうかを決定することが可能であり、その場合、遺伝子異常を予測するためにトリプル検査などの他の方法を使用することができる。
【0566】
採血以外の方法を介して利用可能な胎児遺伝物質の他の供給源が存在し得る。母体血液中で利用可能な胎児遺伝物質の場合、2つの主なカテゴリーが存在する:(1)全胎児細胞、例えば、有核胎児赤血球又は赤血球、及び(2)遊離浮遊胎児DNA。全胎児細胞の場合、胎児細胞が母体血液中に長期間持続することができるため、子供又は以前の妊娠からの胎児からのDNAを含む妊婦から細胞を単離することが可能であるといういくつかの証拠がある。また、遊離浮遊胎児DNAが数週間以内に系から除去されるという証拠もある。1つの課題は、その遺伝物質が細胞に含まれる個体の同一性を決定する方法、すなわち、測定された遺伝物質が、以前の妊娠からの胎児からのものではないことを確実にすることである。本開示の一実施形態において、母親の遺伝物質の知識を使用して、問題の遺伝物質が母親の遺伝物質ではないことを確実にすることができる。この目的を達成するためのいくつかの方法が存在し、これには、本文書又は本文書で言及されている特許のいずれかに記載されている、PARENTAL SUPPORT(商標)などの情報学に基づく方法が含まれる。
【0567】
本開示の一実施形態において、妊娠中の母親から採取された血液は、遊離浮遊胎児DNAを含む画分、及び有核赤血球を含む画分に分離されてもよい。遊離浮遊DNAは、任意選択で濃縮されてもよく、DNAの遺伝子型情報は、測定されてもよい。遊離浮遊DNAからの測定された遺伝子型情報から、母系遺伝子型の知識を使用して、胎児遺伝子型の態様を決定してもよい。これらの態様は、倍数性状態、及び/又は対立遺伝子同一性のセットを指し得る。次いで、個々の有核赤血球は、本文書の別の箇所に記載されている方法、及び他の参照対象特許、特に、本文書の第1のセクションに記載されているものを使用して遺伝子型決定され得る。母体ゲノムの知識は、任意の所与の単一の血液細胞が遺伝的に母体であるかどうかを決定することを可能にする。上記のように決定された胎児遺伝子型の態様は、単一の血液細胞が、現在妊娠している胎児に遺伝的に由来するかどうかを決定することを可能にする。本質的に、本開示のこの態様は、母親の遺伝的知識、及びおそらく父親などの他の関連個体からの遺伝情報、並びに母体血液中に見出される遊離浮遊DNAからの測定された遺伝情報を使用して、母体血液中に見出される単離された有核細胞が、(a)遺伝的に母親であるか、(b)遺伝的に現在妊娠中の胎児からであるか、又は(c)遺伝的に以前の妊娠からの胎児からであるかを決定することを可能にする。
【0568】
出生前の性染色体異数性の決定
当該技術分野で既知の方法では、母親の血液から妊娠中の胎児の性別を決定しようとする人々は、胎児遊離浮遊DNA(fffDNA)が母親の血漿中に存在するという事実を使用している。母体血漿中のY特異的遺伝子座を検出することができる場合、これは妊娠中の胎児が男性であることを意味する。しかしながら、いくつかの場合では、fffDNAの量が低すぎて、男性の胎児の場合にY特異的遺伝子座が検出されることを確実にすることができないため、血漿中のY特異的遺伝子座の検出の欠如は、先行技術で既知の方法を使用する場合、妊娠中の胎児が必ずしも女性であることを保証するものではない。
【0569】
本明細書に提示されるのは、Y特異的核酸、すなわち、もっぱら父系に由来する遺伝子座に由来するDNAの測定を必要としない新規の方法である。先に開示されたParental Support方法は、乗換え頻度データ、親遺伝子型データ、及び情報技術を使用して、妊娠中の胎児の倍数性状態を決定する。胎児の性別は、単に性染色体における胎児の倍数性状態である。XXである子供は、女性であり、XYは、男性である。本明細書に記載される方法はまた、胎児の倍数性状態を決定することが可能である。雌雄鑑別は、性染色体の倍数決定と事実上同義であることに留意されたい。雌雄鑑別の場合、子供が正倍数体であるという仮定が多くの場合なされるため、可能性のある仮説が少なくなる。
【0570】
本明細書に開示される方法は、X染色体及びY染色体の両方に共通する遺伝子座を調べて、胎児に存在する胎児DNAの予想量の観点からベースラインを作成することを伴う。次いで、X染色体にのみ特異的であるそれらの領域を調べて、胎児が女性であるか男性であるかを決定することができる。男性の場合、X及びYの両方に特異的な遺伝子座よりも、X染色体に特異的な遺伝子座からの胎児DNAが少ないことが期待される。対照的に、女性胎児では、これらの群の各々のDNAの量が同じであることを期待する。問題のDNAは、サンプル上に存在するDNAの量を定量化することができる任意の技術、例えば、qPCR、SNPアレイ、遺伝子型決定アレイ、又は配列決定によって測定することができる。排他的に個体からのDNAについて、以下のようなことが予想される:
【表9】
【0571】
母体DNAと混合された胎児DNAの場合、混合物中の胎児DNAの画分がFであり、混合物中の母体DNAの画分がMである場合、F+M=100%となるように、以下のようなことが予想される:
【表10】
【0572】
F及びMが既知である場合、予測される比率を計算することができ、観測されるデータを予測されるデータと比較することができる。M及びFが知られていない場合、閾値を履歴データに基づいて選択することができる。いずれの場合も、X及びYの両方に特異的な遺伝子座でのDNAの測定量をベースラインとして使用することができ、胎児の性別の試験は、X染色体のみに特異的な遺伝子座で観察されるDNAの量に基づくことができる。その量がベースラインよりも1/2Fにほぼ等しい量、又はそれを所定の閾値を下回らせる量だけ低い場合、胎児は男性であると決定され、その量がベースラインにほぼ等しい場合、又はそれを所定の閾値を下回らせる量だけ低い場合、胎児は女性であると決定される。
【0573】
別の実施形態において、多くの場合Z染色体と呼ばれるX染色体及びY染色体の両方に共通であるそれらの遺伝子座のみを見ることができる。Z染色体上の遺伝子座の部分集合は、典型的には、X染色体上では常にAであり、Y染色体上では常にBである。Z染色体からのSNPがB遺伝子型を有することが判明した場合、胎児は男性と呼ばれ、Z染色体からのSNPがA遺伝子型のみを有することが判明した場合、胎児は女性と呼ばれる。別の実施形態において、X染色体上にのみ見出される遺伝子座を見ることができる。AA|Bなどの文脈は、Bの存在が、胎児が父親からのX染色体を有することを示すため、特に有益である。AB|Bなどの文脈も有益であり、女性胎児の場合、男性胎児と比較してBは半分の頻度しか存在しないことが予測される。別の実施形態において、A及びB対立遺伝子の両方がX及びY染色体上に存在し、どのSNPが父系Y染色体由来であり、どのSNPが父系X染色体由来であるかが知られているZ染色体上のSNPを見ることができる。
【0574】
一実施形態において、染色体Yによって共有される相同非再結合(HNR)領域と染色体Xとの間で変化することが知られている単一ヌクレオチド位置を増幅することが可能である。このHNR領域内の配列は、X染色体とY染色体との間でほぼ同一である。この同一の領域内には、X染色体間及び集団内のY染色体間で不変であるが、X染色体とY染色体との間で異なる単一ヌクレオチド位置がある。各PCRアッセイは、X染色体及びY染色体の両方に存在する遺伝子座から配列を増幅することができる。各増幅された配列内には、配列決定又はいくつかの他の方法を使用して検出することができる単一の塩基があるであろう。
【0575】
n個の実施形態において、胎児の性別は、母体血漿中に見出される胎児遊離浮遊DNAから決定することができ、本方法は、以下の工程のいくつか又は全てを含む:1)デザインPCR(通常又はミニPCRのいずれか、必要に応じて多重化を加える)プライマーは、HNR領域内のX/Yバリアント単一ヌクレオチド位置を増幅し、2)母体血漿を取得し、3)HNR X/Y PCRアッセイを使用して母体血漿から標的をPCR増幅し、4)アンプリコンを配列決定し、5)増幅配列のうちの1つ以上内のY対立遺伝子の存在について配列データを調べる。1つ以上の存在は、男性胎児を示す。全てのアンプリコンから全てのY対立遺伝子が欠如していることは、女性の胎児を示す。
【0576】
一実施形態において、標的化配列決定を使用して、母体血漿中のDNA及び/又は親の遺伝子型を測定することができる。一実施形態において、明らかに父系由来のDNAに由来する全ての配列を無視することができる。例えば、コンテキストAA|ABにおいて、A配列の数をカウントし、全てのB配列を無視することができる。上記アルゴリズムのヘテロ接合率を決定するために、観察されたA配列の数を、所与のプローブについての予測される全配列の数と比較することができる。サンプルごとに、各プローブの予測される配列数を計算することができる多くの方法がある。一実施形態において、履歴データを使用して、全ての配列リードのどの画分が各々の特定のプローブに属するかを決定し、次いで、この経験的画分を、配列リードの総数と組み合わせて使用して、各々のプローブにおける配列の数を推定することが可能である。別のアプローチは、いくつかの既知のホモ接合性対立遺伝子を標的化し、次に履歴データを使用して、各プローブにおけるリード数を既知のホモ接合性対立遺伝子におけるリード数と関連付けることであり得る。次いで、各サンプルについて、ホモ接合対立遺伝子でのリード数を測定し、次いで、この測定値を、経験的に導出された関係性とともに使用して、各プローブでの配列リード数を推定することができる。
【0577】
いくつかの実施形態において、複数の方法によってなされる予測を組み合わせることによって、胎児の性別を決定することが可能である。いくつかの実施形態において、複数の方法は、本開示に記載される方法から取得される。いくつかの実施形態において、複数の方法のうちの少なくとも1つは、本開示に記載される方法から取得される。
【0578】
いくつかの実施形態において、本明細書に記載の方法を使用して、妊娠中の胎児の倍数性状態を決定することができる。一実施形態において、倍数性コール方法は、X染色体に特異的であるか、又はX及びY染色体の両方に共通の遺伝子座を使用するが、Y特異的遺伝子座を利用しない。一実施形態において、倍数性コール方法は、X染色体に特異的な遺伝子座、X及びY染色体の両方に共通の遺伝子座、並びにY染色体に特異的な遺伝子座のうちの1つ以上を使用する。性染色体の比率が、例えば、45、X(ターナー症候群)、46、XX(正常な女性)及び47,XXX(トリソミーX)と同様である一実施形態において、分化は、様々な仮説に従って、対立遺伝子の分布を予測される対立遺伝子の分布と比較することによって達成することができる。別の実施形態において、これは、性染色体についての配列リードの相対数を、正倍数体であると仮定される1つ又は複数の参照染色体と比較することによって達成することができる。また、これらの方法を拡張して、異数体症例を含むことができることに留意されたい。
【0579】
単一遺伝子疾患スクリーニング
一実施形態において、胎児の倍数性状態を決定するための方法は、単一遺伝子障害についての同時試験を可能にするように拡張されてもよい。単一遺伝子疾患の診断は、異数体検査に使用されるのと同じ標的化アプローチを活用し、追加の特定の標的を必要とする。一実施形態において、単一遺伝子NPDの診断は、連鎖解析によるものである。多くの場合、母体DNAの存在により、胎児が母体の変異を継承しているかどうかを決定することが事実上不可能になるため、cfDNAサンプルの直接検査は信頼できない。独自の父系由来対立遺伝子の検出はそれほど困難ではないが、疾患が優性であり、父親によって運ばれる場合にのみ完全に有益であり、アプローチの有用性を制限する。一実施形態において、本方法は、PCR又は関連する増幅アプローチを伴う。
【0580】
いくつかの実施形態において、本方法は、第一級の親戚からの情報を使用して、異常な対立遺伝子を、親において非常に密接に連結されたSNPを囲んで段階的に進行させることを伴う。次いで、これらのSNPから得られた標的化配列決定データ上でParental Supportを実行して、正常又は異常なホモログが両方の親から胎児によって継承されたかを決定してもよい。SNPが十分に連結している限り、胎児の遺伝子型の遺伝は非常に確実に決定することができる。いくつかの実施形態において、本方法は、(a)異数性検査のために、特定の一般的な疾患のセットに密に隣接するSNP遺伝子座のセットを本発明の多重プールに追加することと、(b)これらの追加されたSNPからの対立遺伝子を、様々な親戚からの遺伝子データに基づいて、正常及び異常対立遺伝子で確実に位相決定することと、(c)疾患遺伝子座を囲む領域内の遺伝的母系及び父系相同体上の胎児二重型又は位相SNP対立遺伝子のセットを再構築して、胎児遺伝子型を決定することと、を含む。いくつかの実施形態において、疾患連結遺伝子座に密接に連結された追加のプローブが、異数性試験に使用されている多型遺伝子座のセットに追加される。
【0581】
サンプルが母体DNA及び胎児DNAの混合物であるため、胎児二倍型の再構築は困難である。いくつかの実施形態において、本方法は、SNP及び疾患対立遺伝子の相対的情報を組み込み、次いで、SNPの物理的距離及び位置特異的組換え尤度からの組換えデータ及び母体血漿の遺伝子測定から観察されるデータを考慮して、胎児の最も尤度の高い遺伝子型を得る。
【0582】
一実施形態において、疾患連結遺伝子座当たりの追加のプローブの数は、標的多型遺伝子座のセットに含まれ、疾患連結遺伝子座当たりの追加のプローブの数は、4~10、11~20、21~40、41~60、61~80、又はそれらの組み合わせであってもよい。
【0583】
サンプル中のDNA分子の数を決定すること。
第1ラウンドのDNA増幅中に、サンプル中の各元のDNA分子について一意に特定された分子を生成することによって、サンプル中のDNA分子の数を決定する方法が本明細書に記載される。単一の分子又はクローン配列決定方法が続く、上記末端を達成するための手順が本明細書に記載される。
【0584】
このアプローチは、1つ以上の特定の遺伝子座を標的化し、各標的遺伝子座からのタグ付き分子の大部分又は全てが独自のタグを有し、クローン又は単一分子配列決定を使用してこのバーコードの配列決定時に互いに区別され得るような方法で、元の分子のタグ付きコピーを生成することを伴う。各一意の配列決定されたバーコードは、元のサンプル中の一意の分子を表す。同時に、配列決定データを使用して、分子が由来する遺伝子座を確認する。この情報を使用して、各遺伝子座についての元のサンプル中の固有の分子の数を決定することができる。
【0585】
この方法は、元のサンプル中の分子数の定量的評価が必要な任意の用途に使用することができる。更に、1つ以上の標的の独自の分子の数は、相対コピー数、対立遺伝子分布、又は対立遺伝子比を決定するために、1つ以上の他の標的に対する独自の分子の数に関連し得る。代替的に、様々な標的から検出されたコピーの数は、元の標的のコピーの最も可能性の高い数を同定するために、分布によってモデル化することができる。用途としては、限定されないが、デュシェンヌ筋ジストロフィーの担体に見られるものなどの挿入及び欠失の検出、コピー数バリアントで観察されるものなどの染色体の欠失又は重複セグメントの定量化、生まれた個体からのサンプルの染色体コピー数、胚又は胎児などの生まれていない個体からのサンプルの染色体コピー数が挙げられる。
【0586】
本方法は、配列による標的化に含まれるバリエーションの同時評価と組み合わせることができる。これを使用して、元のサンプル中の各対立遺伝子を表す分子の数を決定することができる。このコピー数法は、SNP又は他の配列バリエーションの評価と組み合わせて、生まれた個体及び生まれていない個体の染色体コピー数、短い配列バリエーションを有するが、PCRが脊髄筋萎縮の担体検出などの複数の標的領域から増幅し得る遺伝子座からのコピーの識別及び定量化、母体血漿から得られた遊離浮遊DNAからの胎児異数性の検出など、異なる個体の混合物からなるサンプルからの分子の異なる供給源のコピー数の決定を決定することができる。
【0587】
一実施形態において、単一の標的遺伝子座に関する方法は、以下の工程のうちの1つ以上を含み得る:(1)特定の遺伝子座のPCR増幅のための標準的なオリゴマー対を設計すること。(2)合成中に、標的遺伝子座又はゲノムに無相補性又は最小限の相補性を有する特定の塩基の配列を、標的特異的オリゴマーのうちの1つの5’末端に付加すること。テールと呼ばれるこの配列は、その後の増幅に使用される既知の配列であり、その後にランダムなヌクレオチドの配列が続く。これらのランダムヌクレオチドは、ランダム領域を含む。ランダム領域は、各プローブ分子間で確率的に異なる核酸のランダムに生成された配列を含む。したがって、合成後、テールオリゴマープールは、既知の配列に続いて分子間で異なる未知の配列、続いて標的特異的配列から始まるオリゴマーの集合からなる。(3)テールオリゴマーのみを用いた1ラウンドの増幅(変性、アニーリング、伸長)を行うこと。(4)エキソヌクレアーゼを反応に添加し、PCR反応を効果的に停止させ、反応を適切な温度でインキュベートして、テンプルにアニールせず、伸長して二本鎖生成物を形成した前方一本鎖オリゴを除去すること。(5)反応物を高温でインキュベートしてエキソヌクレアーゼを変性させ、その活性を除去すること。(6)反応に、第1の反応で使用されるオリゴマーのテールに相補的な新しいオリゴヌクレオチドを、他の標的特異的オリゴマーとともに添加して、第1ラウンドのPCRで生成された生成物のPCR増幅を可能にすること。(7)増幅を継続して、下流のクローン配列決定のための十分な生成物を生成すること。(8)配列にまたがるのに十分な数の塩基まで、多数の方法、例えば、クローン配列決定によって、増幅PCR産物を測定すること。
【0588】
一実施形態において、本開示の方法は、複数の遺伝子座を並行的又は他の方法で標的化することを含む。異なる標的遺伝子座へのプライマーを独立して生成し、混合して、多重PCRプールを作成することができる。一実施形態において、元のサンプルは、サブプールに分割されてもよく、異なる遺伝子座は、組換え及び配列決定される前に、各サブプールにおいて標的化されてもよい。一実施形態において、タグ付け工程及びいくつかの増幅サイクルは、プールが細分化される前に実行されてもよく、分割前の全ての標的の効率的な標的化を確実にし、細分化されたプール内のより小さいセットのプライマーを使用して増幅を継続することによって後続の増幅を改善する。
【0589】
この技術が特に有用であろう出願の一例は、所与の遺伝子座における対立遺伝子の比率又はいくつかの遺伝子座における対立遺伝子の分布を使用して、胎児に存在する染色体のコピー数を決定するのを助けることができる、非侵襲性出生前異数性診断である。この文脈において、様々な対立遺伝子の相対量を維持しながら、初期サンプル中に存在するDNAを増幅することが望ましい。いくつかの状況において、特に、非常に少量のDNA、例えば、ゲノムの5,000コピー未満、ゲノムの1,000コピー未満、ゲノムの500コピー未満、及びゲノムの100コピー未満が存在する場合、ボトルネックと呼ばれる現象に遭遇する可能性がある。これは、初期サンプル中に任意の所与の対立遺伝子の少数のコピーが存在する場合であり、増幅バイアスは、DNAの初期混合物中とは有意に異なる対立遺伝子の比率を有するDNAの増幅プールをもたらし得る。標準的なPCR増幅の前に、DNAの各鎖に独自又はほぼ独自のバーコードのセットを適用することによって、同じ元の分子に由来する配列決定されたDNAのn個の同一の分子のセットからn-1個のDNAのコピーを除外することが可能である。
【0590】
例えば、個体のゲノムにおけるヘテロ接合性SNP、及び各対立遺伝子の10個の分子がDNAの元のサンプルに存在する個体からのDNAの混合物を想像する。増幅後、その遺伝子座に対応するDNAの100,000個の分子があってもよい。確率的プロセスのために、DNAの比率は、1:2~2:1のいずれかの場所であり得るが、元の分子の各々が独自のタグでタグ付けされたため、増幅されたプール中のDNAが、各対立遺伝子からのDNAの正確な10の分子に由来することを決定することが可能である。したがって、この方法は、このアプローチを使用しない方法よりも、各対立遺伝子の相対量のより正確な測定を与えるであろう。対立遺伝子バイアスの相対量を最小化することが望ましい方法については、この方法は、より正確なデータを提供する。
【0591】
配列決定されたフラグメントの標的遺伝子座への会合は、いくつかの方法で達成することができる。一実施形態において、分子バーコードにまたがるのに十分な長さの配列が、標的遺伝子座の明確な同定を可能にするのに十分な数の標的化配列に対応する独自の塩基とともに、標的フラグメントから得られる。別の実施形態において、ランダムに生成された分子バーコードを含む分子バーコードプライマーはまた、それが会合する標的を同定する遺伝子座特異的バーコード(遺伝子座バーコード)を含むことができる。この遺伝子座のバーコードは、個々の標的ごとの全ての分子バーコードプライマー間で同一であり、したがって、得られる全ての増幅子は同一であるが、他の全ての標的とは異なる。一実施形態において、本明細書に記載のタグ付け方法は、片側ネストプロトコルと組み合わせられてもよい。
【0592】
一実施形態において、分子バーコード化プライマーの設計及び生成は、以下のように実践するために還元されてもよい:分子バーコード化プライマーは、標的配列に相補的ではない配列、続いてランダムな分子バーコード領域、続いて標的特異的配列から構成されてもよい。分子バーコードの配列5’は、子配列PCR増幅に使用されてもよく、配列決定のためのライブラリへの増幅子の変換に有用な配列を含んでもよい。ランダム分子バーコード配列は、多数の方法で生成することができる。好ましい方法は、バーコード領域の合成中の反応に4つの塩基全てを含むような方法で、分子タグ付けプライマーを合成する。塩基の全て又は様々な組み合わせは、IUPAC DNA曖昧性コードを使用して指定され得る。このようにして、分子の合成コレクションは、分子バーコード領域内の配列のランダム混合物を含む。バーコード領域の長さは、固有のバーコードを含むプライマーの数を決定する。一意の配列の数は、Nとしてバーコード領域の長さに関連し、式中、Nは、塩基の数、典型的には4であり、Lは、バーコードの長さである。5つの塩基のバーコードは、最大1024個の一意の配列をもたらすことができ、8つの塩基のバーコードは、65536個の一意のバーコードをもたらすことができる。一実施形態において、DNAは、配列決定方法によって測定することができ、配列データは、単一分子の配列を表す。これには、単一分子が直接配列決定される方法、又は単一分子が増幅されて配列決定装置によって検出可能なクローンを形成するが、依然として単一分子を表す方法(本明細書ではクローン配列決定と呼ばれる)が含まれ得る。
【0593】
更なる実施形態
いくつかの実施形態において、妊娠中の胎児における染色体の決定された倍数性状態を開示する報告を生成するための方法が本明細書に開示され、この方法は、胎児の母親からDNA、胎児のDNAを含む第1のサンプルを得ることと、胎児の一方又は両方の親から遺伝子型データを得ることと、調製されたサンプルを得るためにDNAを単離することによって第1のサンプルを調製することと、複数の多型遺伝子座で調製されたサンプル中のDNAを測定することと、コンピュータ上で、調製されたサンプルについて行われたDNA測定からの複数の多型遺伝子座における対立遺伝子数又は対立遺伝子数の確率を計算することと、コンピュータ上で、染色体の異なる可能な倍数性状態についての染色体上の複数の多型遺伝子座における対立遺伝子数の予測される確率に関する複数の倍数性仮説を作成することと、コンピュータ上で、1つ又は両方の胎児の親から遺伝子型データを用いて、染色体上の各多型遺伝子座の対立遺伝子数の結合分布モデルを構築することと、コンピュータ上で、結合分布モデル及び調製されたサンプルについて計算された対立遺伝子数確率を用いて倍数性仮説の各々の相対確率を決定することと、最大確率を有する仮説に対応する倍数性状態を選択することによって胎児の倍数性状態をコールすることと、決定された倍数性状態を開示する報告を生成することと、を含む。
【0594】
いくつかの実施形態において、本方法は、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性状態を決定するために使用され、本方法は、調製された各サンプル中の胎児起源のDNAの割合を決定することを更に含み、調製されたサンプル中のDNAを測定する工程は、調製された各サンプル中のいくつかのDNA分子を配列決定することによって行われ、より多くのDNA分子が、より多くの画分の胎児DNAを有するそれらの調製されたサンプルよりも少ない画分の胎児DNAを有するそれらの調製されたサンプルから配列決定される。
【0595】
いくつかの実施形態において、本方法は、複数のそれぞれの母親における複数の妊娠中の胎児の倍数性状態を決定するために使用され、調製されたサンプル中のDNAの測定が、各々の胎児について、調製されたDNAのサンプルの第1の画分を配列決定して第1の測定値のセットを与えることによって行われ、本方法は、胎児の各々について、DNA測定値の第1のセットが与えられた場合に、倍数性仮説の各々について第1の相対的確率決定を行うことと、それらの胎児から調製されたサンプルの第2の画分を再配列することであって、倍数性仮説の各々について、第1の相対確率決定が、異数性胎児に対応する倍数性仮説が、有意であるが決定的でない確率を有することを示し、第2の測定値のセットを与える、再配列することと、第2の測定のセット、及び任意選択で第1の測定のセットを使用して、胎児についての倍数体仮説について第2の相対確率決定を行うことと、第2の相対確率決定により決定された最大の確率を有する仮説に対応する倍数性状態を選択することによって、第2のサンプルが再配列決定された胎児の倍数性状態をコールすることと、を更に含む。
【0596】
いくつかの実施形態において、物質の組成物は開示され、物質の組成物は優先的に濃縮されたDNAのサンプルを含み、優先的に濃縮されたDNAのサンプルが、DNAの第1のサンプルからの複数の多型遺伝子座において優先的に濃縮され、DNAの第1のサンプルが、母体DNA及び母体血漿に由来する胎児DNAの混合物からなり、濃縮度は、少なくとも2倍であり、第1のサンプルと優先的に濃縮されたサンプルとの間の対立遺伝子バイアスは、平均して、2%未満、1%未満、0.5%未満、0.2%未満、0.1%未満、0.05%未満、0.02%未満、及び0.01%未満からなる群から選択される。いくつかの実施形態において、そのような優先的に濃縮されたDNAのサンプルを作製する方法が開示される。
【0597】
いくつかの実施形態において、胎児及び母体ゲノムDNAを含む母体組織サンプル中の胎児異数性の存在又は非存在を決定するための方法が開示され、本方法は、(a)当該母体組織サンプルから胎児及び母体ゲノムDNAの混合物を得ることと、(b)複数の多型対立遺伝子において胎児及び母体DNAの混合物を選択的に濃縮することと、(c)工程aの胎児及び母体ゲノムDNAの混合物から選択的に濃縮されたフラグメントを分配して、単一のゲノムDNA分子又は単一のゲノムDNA分子の増幅産物を含む反応サンプルを提供することと、(d)工程c)の反応サンプル中のゲノムDNAの選択的に濃縮されたフラグメントの大規模に平行なDNA配列決定を行い、当該選択的に濃縮されたフラグメントの配列を決定することと、(e)工程d)で得られた配列が属する染色体を同定することと、(f)工程d)のデータを分析して、i)母体及び胎児の両方で2倍体であると推定される少なくとも1つの第1の標的染色体に属する工程d)からのゲノムDNAのフラグメントの数、及びii)胎児の2倍体であると推定される第2の標的染色体に属する工程d)からのゲノムDNAのフラグメントの数を決定することと、(g)工程f)パートi)で決定された数を使用して、第2の標的染色体が2倍体の場合、第2の標的染色体について、工程d)に由来するゲノムDNAのフラグメントの数の予測分布を計算することと、(h)工程f)パートi)である第1の数及び工程b)の混合物中に見出される胎児DNAの予測画分を使用して、第2の標的染色体が異数体である場合、第2の標的染色体について、工程d)からのゲノムDNAのフラグメントの数の予測分布を計算することと、(i)最大尤度又は最大事後アプローチを使用して、工程f)パートii)で決定されたゲノムDNAのフラグメントの数が、工程g)で計算された分布又は工程h)で計算した分布の一部であるかどうかを決定し、それによって胎児の異数性の有無を示すことと、を含む。
【実施例
【0598】
実施例1
Pergament et al.,Obstetrics & Gynecology124:210-218(2014)に記載されるSNPベースのNIPT検査は、その全体が参照により本明細書に組み込まれる。Dar et al.,American Journal of Obstetrics & Gynecology1:e1-e17(2014)に記載されるSNPベースのNIPT検査は、その全体が参照により本明細書に組み込まれる。Ryan et al.,Fetal Diagn.Ther.40:219-223(2016)に記載されるSNPベースのNIPT検査は、その全体が参照により本明細書に組み込まれる。
【0599】
実施例2
無細胞DNA(cfDNA)を用いた非侵襲的な出生前検査は、妊娠中の異数性スクリーニングにますます使用されている。この試験は、21トリソミーの検出に対して非常に高い感度及び特異性を示すが、cfDNAスクリーニング試験の割合は、結果を報告しない。
【0600】
検査失敗の最も一般的な理由は、不適切な胎児cfDNAである(例えば、不適切な胎児cfDNAは、部分分解又はバイアス表現などによる低胎児画分DNA及び低品質DNAを包含する)が、これは、配列決定結果が解釈不可能又は妥当でない場合にも発生する可能性がある。胎児cfDNAは、主に胎盤トロホブラストのアポトーシスから生じる。胎児画分(FF)と呼ばれる胎児cfDNAの画分は、胎盤の成長及び機能を反映する。小さな胎盤又は不良な胎盤機能が、異数性及びいくつかの有害な周産期転帰に関連している可能性があることはよく知られている。これが妊娠初期の胎児cfDNAの少ない量に反映されているかどうかは仮定されているが、データは比較的限られている。いくつかの研究は、胎児画分(FF)及び染色体異常及び他の有害な周産期転帰との間の関連性を報告している。しかしながら、そのような研究は、小さいサンプル数及び全ての転帰の不完全なフォローアップによって制限されている。
【0601】
胎児画分は、より低い胎児画分が異数体と正倍数体胎児を区別することをより困難にするため、重要な品質指標である。異なる研究室は異なる分析技術を用いるが、胎児の遺伝子型又は倍数性状態は、胎児のcfDNAの割合が低い場合には、より見分けることが困難である。このため、専門家協会は、実験室が胎児画分を報告することを推奨し、不十分な胎児cfDNAが存在する場合、多くは結果を報告しない。
【0602】
したがって、この研究の主な目的は、完全な遺伝的及び産科的転帰を有する患者の大規模なコホートにおけるcfDNAスクリーニングに関する報告不可能な結果を伴う妊娠の転帰を決定することであった。追加的に、コールなし結果を最小限に抑えるように設計されたアルゴリズムの結果を評価した。
【0603】
方法
これは、22q11.2欠失症候群に対するcfDNAスクリーニングの多施設前向き観察研究の二次解析であった。参加施設でトリソミー13、18、及び21、並びに22q欠失症候群についてスクリーニングされた全ての女性は、適格であった。登録された患者は、妊娠転帰データの収集及び新生児遺伝子検査に同意し、参加者全員が書面による同意を提供した。染色体マイクロアレイ、核型、又は他の確認的診断検査は、全ての胎児又は新生児で行われ、周産期及び産科の転帰は、全ての妊娠において得られた。参加者は、米国、ヨーロッパ、及びオーストラリアの6か国の21の施設で登録された。この試験は、各施設の治験審査委員会又は倫理委員会によって承認された。
【0604】
参加者。適格な女性は、異数性及び22q11.2欠失症候群のスクリーニングを要請し、受け、18歳以上、妊娠9週間以上、単胎妊娠し、治験施設関連病院での分娩を計画していた。女性は、登録前にcfDNA結果を受けた場合、臓器移植の病歴がある場合、卵子提供を使用して妊娠した場合、双子がいなくなった場合、又は新生児サンプルを提供したくない、又は提供できない場合に除外された。胎児異常の異数性又は超音波検査検出のための血清スクリーニングを受けた女性は、組み入れ対象とした。参加者は、登録に対する報酬を受け取らなかった。CfDNAスクリーニングの結果は、臨床ケアの一部として提供者及び患者によって利用された。
【0605】
収集された変数には、母体及び産科の特徴、報告不可能な結果の理由、胎児画分、遺伝的転帰、及び子癇前症、早産、及び胎児発育遅延を含む周産期転帰、並びに生児出生の全体的な割合が含まれた。
【0606】
曝露。第1又は第2のcfDNAスクリーニング試験で異数性について報告不可能な結果を有する患者を、報告された結果を有する患者と比較した。異数性の結果を有するが、22q11.2欠失症候群のリスクが報告可能でなかった患者は、提供された結果群に含まれた。
【0607】
手順。CfDNAの分析は、出願人によって行われた。結果が得られなかった症例では、患者をローカルプロトコルに従って管理した。検査室では、最初の報告不可能な結果のほとんどの患者で再検査を行うことを推奨している。サブセットでは、検査室アルゴリズムは、再検が成功する可能性が低いことを示しているため、再検は推奨されない。報告不可能な結果の異なる原因の意味はよく知られておらず、患者は検査室の推奨にかかわらず再検査を拒否又は要求する可能性があるため、最初及び2番目の報告不可能な結果を有する患者における再検査のパフォーマンス及び結果に従って患者を分析した。また、総群の転帰を報告したが、1又は2回の報告不可能な検査の結果は得られなかった。他のサブ群の転帰は、表5に含まれる。
【0608】
登録中、cfDNAラボラトリープロトコルを1回修正した。両方の期間の結果を組み合わせて分析した(元のアルゴリズム)。登録が完了した後、検査室は、検出を改善し、報告不可能な結果の率を低下させるために、第3の更新されたアルゴリズムを開発した。この更新されたプロトコルは、転帰を盲検化して評価され、この分析からの結果は、二次転帰として提示される。
【0609】
遺伝的転帰は、胎児(絨毛性絨毛サンプリング、羊水穿刺、又は受胎産物)又は乳児(臍帯血、口腔スワブ、又は新生児血液斑点)サンプルを分析することによって評価した。全ての場合について、事前の出生前診断遺伝子検査にかかわらず、染色体マイクロアレイ分析(CMA)のために、妊娠終了時にサンプルを要求した。出生後CMAは、臨床結果又は他の検査結果に盲目であった独立した検査室(Center for Applied Genomics,Children’s Hospital of Philadelphia,PA)によって行われた。出生後CMA確認が利用できなかった場合、出生前診断検査の結果(利用可能な場合)を遺伝子確認に使用した。
【0610】
確認的なCMA分析のために、DNAは、新生児の臍帯血、口腔塗抹標本、又は乾燥した血液斑点から調製した。異数体及び22q11.2DSを含むコピー数バリアントを、Illumina(San Diego,CA,USA)SNPベースのInfinium Global Screeningアレイ(GSA)プラットフォームを使用して同定した。品質保証の目的のために、2つのサンプル中のSNP間のアライメントを使用して、cfDNA結果及び新生児サンプルが正しくペアリングされたことを確認するための調和検定を開発した。ペアリングすることができなかったサンプルはいずれも除外された。
【0611】
転帰。この解析の主要転帰は、cfDNAスクリーニングで報告不可能な結果を有する患者における、異数性、妊娠<28週、<34週、及び<37週の早産、子癇前症、並びに胎児発育遅延を含む、有害な周産期転帰のリスクであった。第1及び第2の報告不可能な結果の後に、群を比較した。異数性は、早産又はSGAと関連し得るため、有害な周産期転帰の割合は、正倍数体胎児を有する患者の部分集合において、並びにコホート全体において評価された。
【0612】
子癇前症の診断には、高血圧及びタンパク質尿、又は以前の正常血圧の女性における妊娠20週後又は産後の高血圧及びタンパク質尿の有無にかかわらずの他の有意な終末器官機能障害の新たな発症が含まれ、患者をケアする照会提供者は、各施設で子癇前症と診断された。早産転帰には、妊娠<28週、34週、及び<37週時の自然分娩又は適応分娩が含まれた。胎児発育遅延(SGA)は、妊娠期間のための乳児出生体重<10%ileとして定義された。我々はまた、子癇前症、PTB<37週、SGA出産、又は死産を含む複合的な周産期転帰の率を評価した。
【0613】
また、母体年齢、未産、妊娠期間、BMI、人種、補助生殖を伴う受胎、及び喫煙状態(妊娠中に喫煙しなかった場合と喫煙した場合)に関して、報告されたcfDNAスクリーニング結果を有する女性の特徴と報告不可能な検査結果を比較した。更に、診断検査(羊水穿刺又は絨毛性絨毛サンプリング)の使用、胎児画分、及び胎児異常の存在を含む妊娠因子を比較した。
【0614】
多変数解析を実施し、報告不可能な結果又は胎児画分に関連することが知られている変数を調整した。
【0615】
統計分析。主要研究は、22q11.2欠失症候群の出生率に基づいて、10,000人の参加者の初期計画サンプル数を有した。治験中、22q11.2DSの有病率が低下する可能性があることが懸念され、サンプル数を20,000に増加した。CfDNA検査、妊娠転帰データ、及び胎児又は新生児の遺伝子確認検査を受けた全ての参加者は、この二次分析の対象となった。連続変数を、ウィルコクソン検定を使用して比較し、カイ二乗検定又はフィッシャーの正確検定を使用して分類変数を比較した。マクネマーの検定を、交絡因子を制御する多変数解析の対合解析及びロジスティック回帰に使用した。
【0616】
アルゴリズム。アルゴリズムの観点から、低リスクディープニューラルネットワーク(LR-DNN)を使用したコールなし率の低下を観測した。ディープラーニングは、ノイズをモデル化し、より良好な特異性を達成するだけでなく、ノーコール率を低下させるために使用される。ディープ混合エキスパート(MoE)タイプのニューラルネットワークのアンサンブルを採用し、複数の独立したネットワークを使用して、標的化配列決定データの異なる固有の特徴をモデル化し、結果を確率スコアに組み合わせる。各症例の異数性仮説は、排除される前に、アンサンブルから少なくとも3つの個々のMoEニューラルネットワークを介してフィルタリングされる。ネットワークは、現在のパノラマアルゴリズムによってコールされ、場合によっては臨床フォローアップで確認され、自己教師あり学習(self-supervised training)と混合された、母親及び胎児のcfDNAサンプルの配列決定された混合物に関する様々な訓練戦略を使用して訓練される。この訓練戦略は、アンサンブル内の分類子間のサンプルの真の状態を考慮すると、相関を低減し、したがって、そのようなフィルタリングアンサンブルによって必要とされる非常に高い感度に到達することができる。
【0617】
また、高リスク22qディープニューラルネットワークを用いた22qの高リスク症例の同定にも改善が見られた。この場合、ディープラーニングを使用してノイズをモデル化し、より良い感度を実現する。22qの欠失を検出するために、標的化配列決定データの固有の特徴をモデル化するために複数の独立したネットワークを使用し、結果を確率スコアに組み合わせる、ディープ混合エキスパートニューラルネットワークを採用する。ネットワークは、SNP間の連結を利用して、より信頼性の高いコールを提供することを学ぶ。ネットワークは、A~D領域における大規模及び中規模の欠失、並びにC~Dサブ領域における約0.5Mbまでの小さな欠失をコールするように訓練される。訓練アルゴリズムは、自己監督され、母親及び胎児のcfDNAサンプルの配列決定された混合物を活用する。
【0618】
続いて、Hetrate v3.2及びQMM22qを使用して、それぞれ、異数体領域の全体的なコールなし率を改善し、DiGeorge領域のPPVを改善した。Hetrate v3.2では、以下のような変更が導入された:SNP連結機能の導入は、DiGeorgeセグメントなどのSNPが密接に相関するセグメントに大きな影響を与え、その結果、感度及び特異性が改善される。観察された配列データのより正確なモデリング並びに改善された感度及び特異性をもたらす、サンプル数に基づいて精製されるSNP特異的確率モデルの導入。
【0619】
QMM22qアルゴリズムは、パノラマQMMと同じ原理で動作する。すなわち、コアでは、検査領域上の定量的シグナルと他の領域上のシグナルとの比較を可能にするモデルを構築する。パノラマQMMは、染色体13、18、及び21、並びにDiGeorge(22q)に関連するマイクロ欠失をカバーする約10,000個のSNPのパネル上で実行される。パネル内の包含のために選択するSNPがより少ない22q領域について、全てのSNPが同様の増幅子特性を有することを確実にすることは困難である。22q上のSNPについての増幅子特性が他の染色体と比較して大きい変動は、パネル全体を含むときに定量的モデル適合が不十分であることをもたらす。これに対処するために、2つの定量的モデルを構築する。染色体、パノラマQMMと呼ばれる22qを除くパネル用の1つ。SNPのトリミングされたセットのための他のモデル、約4,000、22q及び他の領域をカバーする類似の増幅子特性を有する。このトリミングされた定量モデルを使用して、22q、QMM22qをコールする。
【0620】
結果
試験参加者。2015年4月から2019年1月までに、21施設から25,892人の女性がスクリーニングを受け、20,887人が登録された。全体では、54.8%が米国で、45.2%がヨーロッパ又はオーストラリアで登録されている。登録された参加者のうち、1116人(5.3%)が追跡不能となり、妊娠転帰は不明であり、94名(0.5%)が脱落した。全ての除外の後、研究コホートには、cfDNA、胎児又は新生児の遺伝子確認検査、及び妊娠転帰に関するデータを有する19,677人(94.2%)の参加者が含まれた。
【0621】
登録時の平均母体年齢及び妊娠期間は、それぞれ33.6歳及び13.3週であり、参加者の44%が未産であった(表1)。全体として、103人(0.6%)は、超音波で胎児異常を検出した後に、94人(0.5%)は、嚢胞性湿腫又は3mm以上の頸部半透明性(NT)の診断後に、616人(3.4%)は、異数性のための血清分析物スクリーニングの高リスク結果に続いてcfDNAを有した。
【0622】
主要及び二次転帰。679人の患者、すなわち3.4%が、最初のcfDNA採取で報告不可能な結果を有した。これらのうち、225人(33.1%)は胎児画分が低く、カットオフは2.8%であった。いくつかの場合では、FFを測定することができなかったため、同様の数は、FF2>.8%(n=217、32.0%)又はFFが報告されていない(n=237、33.1%)と解釈不可能な配列決定結果のために報告不可能であった。報告不可能な結果を有する679人の患者のうち、470人は、再採取及び試験の2回目の検査を試み、このうちの124人(18.3%)は、2回目の報告不可能な検査を有した。209人の患者において、再採取は得られなかった、これは、1回又は2回の検査試行のいずれかの後に報告可能な結果が得られない合計333人(1.7%)の患者を残した。
【0623】
報告不可能な検査を有する患者は、コホート全体と比較して、同様の母体年齢(33.6対33.5歳、p=0.97)を有し(43.4%対47.2%、p=.054)、平均妊娠期間はより高かった(14.4対13.3週、p<.001)。BMIは、特に2つのそのような検査(26.3対31.4対34.4kg/m、p<.001)で、報告不可能な検査で高かった。胎児画分は、報告不可能な群で低く、特に、平均FFが2.7%であった2つの報告不可能な検査を行った群で低かった。IVF及び喫煙の割合は、群間で相違しなかった。(表2)
【0624】
出生前又は出生後の診断試験によって確認されたように、コホート全体に133のトリソミーがあった。これには、21トリソミーの100症例、18トリソミーの18症例、13トリソミーの15症例が含まれた。最初の採取で報告不可能な結果の割合は、トリソミーによって異なり、21トリソミーで3%(3/100)、18トリソミーで11%(2/18)、13トリソミーで33%(5/15)であった(p<.001)。全体として、トリソミーに罹患した10例(7.5%)の妊娠において、cfDNAスクリーニングは、最初の採取では、報告不可能であった。これらの患者のうちの4人は、第2の検査を提出した。21トリソミーのうちの1つの症例は、高リスクとして生じ、18トリソミーのうちの1つの症例は、低リスクとして生じ、他の2つの症例は、再び報告不可能であった。結果が報告不可能な結果を有する患者の1.6%(10/613、p=0.013)と比較して、コホート内の結果の症例における異数性の割合は、0.7%(123/17,884)であった。
【0625】
異数体を有する症例を除外した後、<28週、<34週、及び<37週の早産率、子癇前症、及びSGAは、全て、報告不可能試験を有する患者において有意に増加した。(表3)。妊娠<34週の全早産率は、正常な結果を有する患者で3.1%であり、第1の試験で10.5%、第2の非報告試験で17.9%に増加した(p<.001)。子癇前症は、報告不可能な検査でも増加し、1回及び2回の報告不可能な検査でそれぞれ4.0%から8.6%及び15.3%に増加した(p<.001)。複合的な周産期転帰の割合は、結果の症例において18.3%であったのに対し、第1の採取上でのコールなしでの31.1%、及び第2のノーコール検査後の43.4%であった。全ての妊娠の転帰を評価し、選択的終了を含む場合、生児出生率は、1回目及び2回目の投与後に結果が得られなかった患者と比較して、報告可能な結果を有する患者で有意に高かった(それぞれ97.5%対92.1%、87.1%)。2回目の採取が低リスク結果を提供した患者では、生児出生率は97.5%であり、初期の低リスク結果を有する患者の率と同様であった。
【0626】
BMI及び妊娠期間を調整する場合、任意の異数体のオッズ比(aOR)は、最初のノーコール後に2.2(1.1、4.5)であり、2回目のノーコール後に2.6(0.6、10.7)であった。PTB<34週間の妊娠のaORは、2.7(95%CI:2.0、3.5)であり、子癇前症のaORは、1.4(95%CI1.0、1.9)であり、SGAのaORは、1.4(95%CI:1.1、1.8)であった。第2の報告不可能な結果後の調整されたオッズ比は、早産<34週(4.2、95%CI 2.6、6.8)、及び子癇前症(2.1、95%CI 1.2,3.7)について更に増加したが、SGA(1.4、95%CI 0.8,2.7)については増加しなかった。生児出生の確率は、コホート全体よりも低く、1回の報告不可能な検査後に0.30(95%CI0.22~0.40)、2回の報告後に0.20(95%CI0.11、0.35)のaORであった。最後に、通話結果がない理由に基づいて転帰を比較し、FF2.8%、>2.8%、又はFFが測定されていない患者において、異数性又は有害な周産期転帰の割合に差は見られなかった。(表5)
【0627】
更新されたアルゴリズムを確認遺伝子検査を行った18,975例に適用し、コールなし率を1.5%に低下させた(N=273)。このうち、195人が再採取を行い、27人が2回目のコールなし結果を得た。PTB<37週の割合は、最初の採取で結果が得られた患者では7.6%であり、最初の採取でコールなしの患者では17.4%であり、2回目の採取でコールなしの患者では44.4%であった(p<.001)。子癇前症の割合は、これらの同じ群で4.1%から6.6%に18.5%に同様に増加したが、複合転帰は17.4%、28.4%、51.9%であり、0、1、及び2のコールなしの結果であった。(表6)
【0628】
考察
これらの知見は、cfDNAスクリーニング上の報告不可能な結果を有する患者が、異数体並びに早産、子癇前症、及び妊娠中の小さい出産を含む多くの有害転帰のリスクが高いことを実証する。異数体を有する妊娠の7.5%が、最初の採取で報告不可能な結果を有し、報告不可能なcfDNA検査が異数体のリスクを2倍以上にしたことを見出した。これらの妊娠はまた、有害な周産期転帰のリスクが上昇しており、これは再採取が再び報告不可能になったときに更に上昇した。有害な周産期転帰のリスクは、多重体妊娠でリスクが上昇したため、非正倍数体の増加率によって説明されなかった。
【0629】
いくつかの先行研究は、報告不可能な検査、胎児画分、及び異数体の関連性を調査しており、いくつかは、報告不可能なcfDNAスクリーニング検査を有する患者におけるトリソミーのリスクの増加を報告している。Revello et al.は、大規模なコホートについて報告し、報告不可能な検査を有する者は、13及び18トリソミーの増加率を有し、これは、より低いFFと関連していたことに留意した。結果を報告することができないことをもたらす低い胎児画分も、三倍体で報告されている。コホートでは、同様に、コールなし率は、13トリソミー及び18トリソミーで最も高いことが見出された。21トリソミーではコールなし率は上昇しなかったが、21トリソミーの設定ではコールなしの症例は3例であった。このリスクに対応して、ACMG、ACOG、及びSMFMなどの専門家団体は、報告不可能なcfDNA検査を有する患者に、遺伝子カウンセリング及び診断検査を含む更なる評価の選択肢を提供することを推奨する。データは、これらの推奨事項を裏付けている。
【0630】
多くの有害な周産期転帰は、異常な胎盤発達によって媒介される根底にある病因を共有し、胎盤形成障害は、広範囲の妊娠合併症に存在する。以前の研究者は、妊娠の高血圧障害又は胎盤形成障害によって媒介される他の合併症を発症する女性では、母親の血清中のcfDNAレベルが変更される可能性があると仮定している。しかしながら、以前の研究では、低い胎児画分と子癇前症との関連が報告されているものもあれば、高い胎児画分との関連が報告されているものもあり、有意な関係は報告されていないものもある。低FFはまた、既存の母体高血圧に関連しており、これらの患者は子癇前症の高いリスクを有する。何らかの原因による報告不可能なcfDNAスクリーニング検査を評価した研究は少ない。そのような研究は、主に報告不可能な結果に関連する母体の特徴に焦点を当てているが、大規模なコホートでは周産期転帰を評価していない。
【0631】
Bender et al.は、2701人の妊婦を対象としたレトロスペクティブコホート研究を実施し、妊娠第1期の胎児画分は、妊娠の高血圧障害と診断された女性において有意に低かったが、これは、妊娠期間によっていくぶん変化し、母体年齢、人種、体格指数、及び慢性高血圧を調整した後、もはや統計的に有意ではなかったことを見出した。Rolnik et al.は、妊娠34週前に分娩を必要とする子癇前症患者20人、妊娠34週時の子癇前症患者20人、及び正常血圧対照200人の症例対照研究において胎児画分を評価し、同様に、BMI及び採取時の妊娠期間を調整した後、妊娠11~13週時の胎児画分と子癇前症との間に有意な関連は見られなかった。いくつかの他の研究者は、同様の知見を報告しているが、他の研究者は、妊娠第1期のcfDNAレベルの上昇とその後の子癇前症の発症との間に有意な関連性を見出している。Gerson et al.は、低FFといくつかの胎盤媒介性疾患との関連を研究し、FFと子癇前症との関係を見出したが、早産又は妊娠年齢の小さいものではなかった。これらの以前の研究は、一般に、少数の症例によって制限された単一センター報告であり、ほとんどが重要な交絡因子を測定及び制御する機会が限られた症例対照研究であった。妊娠転帰に関する包括的な前向きデータ収集を含む大規模な多施設研究として、この研究は、報告不可能なcfDNAスクリーニング結果の重要性の理解に不可欠な貢献を提供する。
【表11】
†データは、平均(SD)又は番号/合計番号(%)である。*参加者によって報告された人種及び民族。参加者が情報を報告しなかった場合、医療記録からの情報を使用した。
【表12-1】
【表12-2】
†データは平均(SD)又はN(%)である。*1回又は2回の採取を行った患者を含む、結果が得られなかった全ての患者。**結果が得られなかった2回の採取を行った患者を含む。
【表13-1】
【表13-2】
†データは平均(SD)又はN(%)である。*1回又は2回の採取を行った患者を含む、結果が得られなかった全ての患者。**結果が得られなかった2回の採取を行った患者を含む。
【表14】
【表15】
【表16-1】
【表16-2】
†データは平均(SD)又はN(%)である。*1回又は2回の採取を行った患者を含む、結果が得られなかった全ての患者。**結果が得られなかった2回の採取を行った患者を含む。
* * * *
【国際調査報告】