(19)【発行国】日本国特許庁(JP)
(12)【公報種別】公表特許公報(A)
(11)【公表番号】
(43)【公表日】2025-02-12
(54)【発明の名称】非侵襲的出生前試料調製、並びに関連する方法及び使用
(51)【国際特許分類】
C12N 15/10 20060101AFI20250204BHJP
C12Q 1/6883 20180101ALI20250204BHJP
C12Q 1/6806 20180101ALI20250204BHJP
C40B 40/06 20060101ALI20250204BHJP
【FI】
C12N15/10 100Z
C12Q1/6883 Z
C12Q1/6806 Z
C40B40/06
【審査請求】未請求
【予備審査請求】未請求
(21)【出願番号】P 2024541158
(86)(22)【出願日】2023-01-10
(85)【翻訳文提出日】2024-07-09
(86)【国際出願番号】 US2023010496
(87)【国際公開番号】W WO2023137021
(87)【国際公開日】2023-07-20
(32)【優先日】2022-01-11
(33)【優先権主張国・地域又は機関】US
(32)【優先日】2022-07-01
(33)【優先権主張国・地域又は機関】US
(81)【指定国・地域】
【公序良俗違反の表示】
(特許庁注:以下のものは登録商標)
(71)【出願人】
【識別番号】515015023
【氏名又は名称】ミリアド・ウィメンズ・ヘルス・インコーポレーテッド
(74)【代理人】
【識別番号】110002572
【氏名又は名称】弁理士法人平木国際特許事務所
(72)【発明者】
【氏名】マジー,デイル
(72)【発明者】
【氏名】グールド,ジュヌビエーブ
(72)【発明者】
【氏名】ワン,ジェシァオ
(72)【発明者】
【氏名】バッティー,クリストファー ジェイ.
(72)【発明者】
【氏名】ペイテル,ラヴィ
(72)【発明者】
【氏名】ガネシュ,サンギタ
(72)【発明者】
【氏名】トレティン,カイル
【テーマコード(参考)】
4B063
【Fターム(参考)】
4B063QA08
4B063QA19
4B063QA20
4B063QQ03
4B063QQ42
4B063QQ52
4B063QR08
4B063QR55
4B063QR62
4B063QS10
4B063QS16
4B063QS25
4B063QS34
4B063QX10
(57)【要約】
本開示は、妊娠中の母親又は妊婦からの無細胞DNA試料を調製する方法、及びそのような試料の分析の関連する方法に関する。
【選択図】
図1
【特許請求の範囲】
【請求項1】
富化された胎児画分を含む生物学的試料を調製する方法であって、
(a-1)妊婦から無細胞DNA(cfDNA)を含む生物学的試料を得ることと、
(b-1)前記生物学的試料からcfDNAを抽出することと、
(c-1)cfDNA断片のライブラリを調製して、cfDNAライブラリを得ることと、
(d-1)前記cfDNAライブラリ内の前記cfDNA断片をサイズによって分離して、約150ヌクレオチド長未満、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、約180ヌクレオチド長、約185ヌクレオチド長、約190ヌクレオチド長、約195ヌクレオチド長、若しくは約200ヌクレオチド長であるcfDNA断片のみを保持することと、
(e-1)保持されたcfDNA断片を配列決定して、第1の配列ライブラリを得ることと、
(f-1)リード長長に基づいて、前記第1の配列ライブラリの少なくとも2つのウィンドウに存在する、(i)無細胞胎児DNA(cffDNA)の配列、及び(ii)無細胞母体DNA(cfmDNA)の配列を同定することと、
(g-1)前記配列ライブラリの前記少なくとも2つのウィンドウの各々から前記cffDNAの配列を単離し、それによって、少なくとも2つの胎児画分富化配列ライブラリを得ることと、を含むか、
又は
(a-2)妊婦から無細胞DNA(cfDNA)を含む生物学的試料を得ることと、
(b-2)前記生物学的試料からcfDNAを抽出することと、
(c-2)(b-2)からの前記抽出された試料中のcfDNA断片を分離して、約150ヌクレオチド長未満、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、約180ヌクレオチド長、約185ヌクレオチド長、約190ヌクレオチド長、約195ヌクレオチド長、若しくは約200ヌクレオチド長であるcfDNA断片のみを保持することと、
(d-2)(c-2)からの分離したcfDNA断片からcfDNAライブラリを調製することと、
(e-2)前記cfDNAライブラリを配列決定して、第1の配列ライブラリを得ることと、
(f-2)リード長長に基づいて、前記第1の配列ライブラリの少なくとも2つのウィンドウに存在する、(i)無細胞胎児DNA(cffDNA)の配列、及び(ii)無細胞母体DNA(cfmDNA)の配列を同定することと、
(g-2)前記配列ライブラリの前記少なくとも2つのウィンドウの各々から前記cffDNAの配列を単離し、それによって、少なくとも2つの胎児画分富化配列ライブラリを得ることと、を含む、方法。
【請求項2】
前記cfDNA断片を分離することが、前記生物学的試料中の前記胎児画分を約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、又は約2.0倍富化する、請求項1に記載の方法。
【請求項3】
前記第1の配列ライブラリの前記少なくとも2つのウィンドウから前記cffDNAの配列を単離することが、前記生物学的試料中の前記胎児画分を約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、約2.0倍、約2.1倍、約2.2倍、約2.3倍、約2.4倍、約2.5倍、約2.6倍、約2.7倍、約2.8倍、約2.9倍、約3.0倍、約3.1倍、約3.2倍、約3.3倍、約3.4倍、又は約3.5倍富化する、請求項1又は2に記載の方法。
【請求項4】
前記cfDNA断片を分離することが、電気泳動を含む、請求項1~3のいずれか一項に記載の方法。
【請求項5】
前記第1の配列ライブラリの少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個のウィンドウを評価して、cffDNA配列を同定及び単離し、それによって、それぞれ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個の胎児画分富化配列ライブラリを得る、請求項1~4のいずれか一項に記載の方法。
【請求項6】
前記第1の配列ライブラリ内のcffDNA及びcfmDNAの配列リードを参照ゲノムと比較することによって、cffDNAを同定し、cfmDNAから分離すること、第1のライブラリからの配列リードを逆多重化すること(demultiplexing)、前記第1の配列ライブラリから重複配列を除去すること、又はそれらの組み合わせを更に含む、請求項1~5のいずれか一項に記載の方法。
【請求項7】
1つ以上の遺伝子変異の存在について、前記少なくとも2つの胎児画分富化配列ライブラリを評価することを更に含む、請求項1~6のいずれか一項に記載の方法。
【請求項8】
前記1つ以上の遺伝子変異が、21-ヒドロキシラーゼ欠乏症、ABCC8関連高インスリン症、ARSACS、軟骨無形成症、1色覚、アデノシン一リン酸デアミナーゼ1、ニューロノパチーを伴う脳梁欠損症、アルカプトン尿症、アルファ-1-アンチトリプシン欠乏症、アルファ-マンノシドーシス、アルファ-サルコグリカノパチー、アルファ-サラセミア、アンジオテンシンII受容体I型アルツハイマー、アポリポタンパク質E遺伝子型アルツハイマー、アルギニノスクシン酸尿症、アスパルチルグリコサミン尿症、ビタミンE欠乏症を伴う運動失調症、毛細血管拡張性運動失調症、自己免疫多内分泌腺症候群1型、BRCA1遺伝性乳がん/卵巣がん、BRCA2遺伝性乳がん/卵巣がん、バルデ-ビードル症候群、Best卵黄状黄斑ジストロフィー、ベータ-サルコグリカノパチー、ベータ-サラセミア、ビオチニダーゼ欠乏症、ブラウ症候群、ブルーム症候群、CFTR関連障害、CLN3関連神経セロイド-リポフスチン症、CLN5関連神経セロイド-リポフスチン症、CLN8関連神経セロイド-リポフスチン症、カナバン病、カルニチンパルミトイルトランスフェラーゼIA欠乏症、カルニチンパルミトイルトランスフェラーゼII欠乏症、軟骨毛髪低形成症、海綿状血管奇形、脈絡膜血症、コーエン症候群、先天性白内障、顔面異形症、及び神経障害、先天性グリコシル化異常症Ia型、先天性グリコシル化異常症Ib型、先天性フィンランド型ネフローゼ症候群、クローン病、シスチン症、DFNA9(COCH)、糖尿病及び聴力損失、早期発症性一次性ジストニア(DYTI)、Herlitz-Pearson型接合部表皮水疱症、FANCC関連ファンコニ貧血、FGFR1関連頭蓋縫合早期癒合症、FGFR2関連頭蓋縫合早期癒合症、FGFR3関連頭蓋縫合早期癒合症、第V因子Leiden血栓性素因、第V R2因子変異血栓性素因、第XI因子欠乏症、第XIII因子欠乏症、家族性腺腫性ポリポーシス、家族性自律神経障害、家族性高コレステロール血症B型、家族性地中海熱、遊離シアル酸蓄積障害、パーキンソニズム-17を伴う前頭側頭型認知症、フマラーゼ欠乏症、GJB2関連DFNA3非症候群性聴力損失及び難聴、GJB2関連DFNB1非症候群性聴力損失及び難聴、GNE関連ミオパチー、ガラクトース血症、ゴーシェ病、グルコース-6-リン酸脱水素酵素欠乏症、グルタル酸血症1型、糖原病1a型、糖原病Ib型、糖原病II型、糖原病III型、糖原病V型、グレイシル症候群、HFE関連遺伝性ヘモクロマトーシス、ハルダーAIM、ヘモグロビンSベータ-サラセミア、遺伝性フルクトース不耐症、遺伝性膵炎、遺伝性チミン-ウラシル尿症、ヘキソサミニダーゼA欠乏症、有汗性外胚葉異形成症2、シスタチオニンベータ合成酵素欠乏症によって引き起こされるホモシスチン尿症、高カリウム性周期性四肢麻痺1型、高オルニチン血症-高アンモニア血症-ホモシトリン血症症候群、原発性1型高シュウ酸尿症、原発性2型高シュウ酸尿症、軟骨低形成症、低カリウム血性周期性四肢麻痺1型、低カリウム血性周期性四肢麻痺2型、低ホスファターゼ症、乳児型ミオパチー及び乳酸アシドーシス(致死的及び非致死的形態)、イソ吉草酸血症、クラッベ病、LGMD2I、レーベル遺伝性視神経障害、フランス-カナダ型リー脳症、長鎖3-ヒドロキシアシル-CoAデヒドロゲナーゼ欠乏症、MELAS、MERRF、MTHFR欠乏症、MTHFR熱不安定性バリアント、MTRNR1関連聴力損失及び難聴、MTTS1関連聴力損失及び難聴、MYH関連ポリポーシス、メープルシロップ尿症1A型、メープルシロップ尿症1B型、McCune-Albright症候群、中鎖アシル-コエンザイムA脱水素酵素欠乏症、皮質下嚢胞を伴う大頭型白質脳症、異染性白質ジストロフィー、ミトコンドリア心筋症、ミトコンドリアDNA関連リー脳症及びNARP、ムコリピドーシスIV型、ムコ多糖症I型、ムコ多糖症IIIA型、ムコ多糖症VII型、多発性内分泌腫瘍症2型、筋・眼・脳病、神経学的表現型ネマリンミオパチー、スフィンゴミエリナーゼ欠乏症に起因するニーマン-ピック病、ニーマン-ピック病C1型、ナイミーヘン染色体不安定症候群、PPT1-関連神経セロイド-リポフスチン症、PROP1関連下垂体ホルモン欠乏症、パリスター-ホール症候群、先天性パラミオトニア、ペンドレッド症候群、ペルオキシソーム二頭酵素欠乏症、広範性発達障害、フェニルアラニンヒドロキシラーゼ欠乏症、プラスミノーゲン活性化抑制因子1、常染色体劣性多発性嚢胞腎、プロトロンビンG20210A血栓性素因、偽性ビタミンD欠乏性くる病、濃化異骨症、常染色体劣性網膜色素変性症Bothnia型、レット症候群、点状軟骨異形成症1型、短鎖アシル-CoAデヒドロゲナーゼ欠乏症、シュワッハマン-ダイアモンド症候群、シェーグレン-ラルソン症候群、スミス-レムリ-オピッツ症候群、痙性対麻痺13、硫酸トランスポータ関連骨異形成症、TFR2関連遺伝性ヘモクロマトーシス、TPP1関連神経セロイド-リポフスチン症、タナトフォリック骨異形成症、トランスサイレチンアミロイドーシス、三頭酵素(Trifunctional Protein)欠乏症、チロシン-ヒドロキシラーゼ欠乏症DRD、高チロシン血症1型、ウィルソン病、X連鎖若年網膜分離症、嚢胞性線維症、脊髄性筋萎縮症(SMA)、異常ヘモグロビン症、並びにツェルウェガー症候群スペクトラムから選択される少なくとも1つの状態を引き起こす、請求項7に記載の方法。
【請求項9】
染色体異数性の存在について、cfDNAを含む前記生物学的試料を評価することを更に含む、請求項1~8のいずれか一項に記載の方法。
【請求項10】
前記染色体異数性が、モノソミー、トリソミー、テトラソミー、ペンタソミー、微細欠失、微細重複(micoduplication)、並びにモノソミー、トリソミー、テトラソミー、及びペンタソミーのモザイクバージョンから選択される、請求項9に記載の方法。
【請求項11】
単一の母体試料中の染色体異数性の存在又は不在、及び少なくとも1つの遺伝子バリアントの存在又は不在を並行検出する方法であって、
(i)妊婦から生物学的試料を得ることであって、前記生物学的試料が、無細胞DNA(cfDNA)を含む、得ることと、
(ii)cfDNAライブラリを調製することと、
(iii)前記cfDNAライブラリを配列決定して、配列ライブラリを生成することと、
(iv)前記単一の母体試料中の前記染色体異数性の存在又は不在、及び前記少なくとも1つの遺伝子バリアントの存在又は不在を検出することと、を含み、
(a)前記cfDNAライブラリを富化して、胎児画分を増加させるか、(b)前記配列ライブラリを富化して、胎児画分を増加させるか、又は(c)それらの組み合わせを行い、それによって、前記単一の母体試料の前記胎児画分を、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、又は少なくとも1.5倍増加させた後に、前記単一の母体試料中の前記染色体異数性の存在又は不在、及び前記少なくとも1つの遺伝子バリアントの存在又は不在を検出する、方法。
【請求項12】
前記生物学的試料が、血液又は血漿である、請求項11に記載の方法。
【請求項13】
前記cfDNAライブラリを富化して、前記胎児画分を増加させ、前記配列ライブラリを富化して、前記胎児画分を増加させる、請求項11又は12に記載の方法。
【請求項14】
前記cfDNAライブラリの前記胎児画分を富化することが、約150ヌクレオチド長、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、又は約180ヌクレオチド長よりも大きい、任意のDNA断片を前記cfDNAライブラリから除去することを含む、請求項11~13のいずれか一項に記載の方法。
【請求項15】
前記cfDNAライブラリから前記DNA断片を除去することが、電気泳動を含む、請求項14に記載の方法。
【請求項16】
前記配列ライブラリの前記胎児画分を富化することが、前記配列ライブラリの少なくとも2つのウィンドウにおける配列のリード長に基づくサイズ排除を含み、それによって、少なくとも2つの胎児画分富化配列ライブラリを得る、請求項11~15のいずれか一項に記載の方法。
【請求項17】
前記第1の配列ライブラリの少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個のウィンドウを評価して、cffDNA配列を同定及び単離し、それによって、それぞれ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個の胎児画分富化配列ライブラリを得る、請求項16に記載の方法。
【請求項18】
前記配列ライブラリの前記少なくとも2つのウィンドウが、(i)0~145ヌクレオチドである配列、(ii)0~150ヌクレオチドである配列、(iii)0~155ヌクレオチド、(iv)0~160ヌクレオチド、(v)0~165ヌクレオチド、(vi)0~168ヌクレオチド、(vii)0~170ヌクレオチド、(viii)0~175ヌクレオチド、(ix)0~180ヌクレオチド、(x)0~185ヌクレオチド、(xi)0~190ヌクレオチド、(xii)0~195ヌクレオチド、(xiii)0~200ヌクレオチド、及び(xiv)非ゲート型から選択される、請求項16又は17に記載の方法。
【請求項19】
前記配列ライブラリの前記胎児画分を富化することが、前記第1の配列ライブラリ内のcffDNA及びcfmDNAの配列リードを参照ゲノムと比較することによって、cffDNAを同定し、cfmDNAから分離すること、第1のライブラリからの配列リードを逆多重化すること、前記第1の配列ライブラリから重複配列を除去すること、又はそれらの組み合わせを更に含む、請求項16~18のいずれか一項に記載の方法。
【請求項20】
前記少なくとも1つの遺伝子バリアントの存在又は不在を検出することが、前記少なくとも2つの胎児画分富化配列ライブラリの各々において、前記少なくとも1つの遺伝子バリアントをコードする、前記試料中の各対立遺伝子の対立遺伝子バランスを決定することと、前記少なくとも2つの胎児画分富化配列ライブラリの各々における前記対立遺伝子バランスに基づく各対立遺伝子についての対立遺伝子バランストラジェクトリー、前記少なくとも2つの胎児画分富化配列ライブラリの深さに基づく深さトラジェクトリー、又は対立遺伝子バランストラジェクトリーと深さトラジェクトリーとの組み合わせを生成することと、を含む、請求項11~19のいずれか一項に記載の方法。
【請求項21】
前記染色体異数性の存在又は不在を検出することが、前記配列ライブラリにおける対象となる染色体に対応する少なくとも1つの配列の配列深さを分析することを含む、請求項11~20のいずれか一項に記載の方法。
【請求項22】
前記対象となる染色体に対応する前記少なくとも1つの配列の前記配列深さを、前記対象となる染色体の予想される深さのモデルに適合させる、請求項21に記載の方法。
【請求項23】
前記配列深さが、以下の式を用いて計算され、
【数1】
式中、
d
pが、妊娠深さであり、
fが、胎児画分であり、
c
mが、母体コピー数であり、
d
bが、バックグラウンド深さであり、
c
fが、胎児コピー数である、請求項21又は22に記載の方法。
【請求項24】
前記配列深さを正規化して、GC-バイアス、試料バックグラウンド、ハイブリダイゼーションプローブ捕捉、又はそれらの組み合わせを制御する、請求項21~23のいずれか一項に記載の方法。
【請求項25】
前記方法が、モノソミー、トリソミー、テトラソミー、ポリソミーX、ポリソミーY、微細欠失、微細重複、ペンタソミー、及びそれらの組み合わせから選択される前記染色体異数性の存在又は不在を検出することを含む、請求項11~24のいずれか一項に記載の方法。
【請求項26】
前記少なくとも1つの遺伝子バリアントが、21-ヒドロキシラーゼ欠乏症、ABCC8関連高インスリン症、ARSACS、軟骨無形成症、1色覚、アデノシン一リン酸デアミナーゼ1、ニューロノパチーを伴う脳梁欠損症、アルカプトン尿症、アルファ-1-アンチトリプシン欠乏症、アルファ-マンノシドーシス、アルファ-サルコグリカノパチー、アルファ-サラセミア、アンジオテンシンII受容体I型アルツハイマー、アポリポタンパク質E遺伝子型アルツハイマー、アルギニノスクシン酸尿症、アスパルチルグリコサミン尿症、ビタミンE欠乏症を伴う運動失調症、毛細血管拡張性運動失調症、自己免疫多内分泌腺症候群1型、BRCA1遺伝性乳がん/卵巣がん、BRCA2遺伝性乳がん/卵巣がん、バルデ-ビードル症候群、Best卵黄状黄斑ジストロフィー、ベータ-サルコグリカノパチー、ベータ-サラセミア、ビオチニダーゼ欠乏症、ブラウ症候群、ブルーム症候群、CFTR関連障害、CLN3関連神経セロイド-リポフスチン症、CLN5関連神経セロイド-リポフスチン症、CLN8関連神経セロイド-リポフスチン症、カナバン病、カルニチンパルミトイルトランスフェラーゼIA欠乏症、カルニチンパルミトイルトランスフェラーゼII欠乏症、軟骨毛髪低形成症、海綿状血管奇形、脈絡膜血症、コーエン症候群、先天性白内障、顔面異形症、及び神経障害、先天性グリコシル化異常症Ia型、先天性グリコシル化異常症Ib型、先天性フィンランド型ネフローゼ症候群、クローン病、シスチン症、DFNA9(COCH)、糖尿病及び聴力損失、早期発症性一次性ジストニア(DYTI)、Herlitz-Pearson型接合部表皮水疱症、FANCC関連ファンコニ貧血、FGFR1関連頭蓋縫合早期癒合症、FGFR2関連頭蓋縫合早期癒合症、FGFR3関連頭蓋縫合早期癒合症、第V因子Leiden血栓性素因、第V R2因子変異血栓性素因、第XI因子欠乏症、第XIII因子欠乏症、家族性腺腫性ポリポーシス、家族性自律神経障害、家族性高コレステロール血症B型、家族性地中海熱、遊離シアル酸蓄積障害、パーキンソニズム-17を伴う前頭側頭型認知症、フマラーゼ欠乏症、GJB2関連DFNA3非症候群性聴力損失及び難聴、GJB2関連DFNB1非症候群性聴力損失及び難聴、GNE関連ミオパチー、ガラクトース血症、ゴーシェ病、グルコース-6-リン酸脱水素酵素欠乏症、グルタル酸血症1型、糖原病1a型、糖原病Ib型、糖原病II型、糖原病III型、糖原病V型、グレイシル症候群、HFE関連遺伝性ヘモクロマトーシス、ハルダーAIM、ヘモグロビンSベータ-サラセミア、遺伝性フルクトース不耐症、遺伝性膵炎、遺伝性チミン-ウラシル尿症、ヘキソサミニダーゼA欠乏症、有汗性外胚葉異形成症2、シスタチオニンベータ合成酵素欠乏症によって引き起こされるホモシスチン尿症、高カリウム性周期性四肢麻痺1型、高オルニチン血症-高アンモニア血症-ホモシトリン血症症候群、原発性1型高シュウ酸尿症、原発性2型高シュウ酸尿症、軟骨低形成症、低カリウム血性周期性四肢麻痺1型、低カリウム血性周期性四肢麻痺2型、低ホスファターゼ症、乳児型ミオパチー及び乳酸アシドーシス(致死的及び非致死的形態)、イソ吉草酸血症、クラッベ病、LGMD2I、レーベル遺伝性視神経障害、フランス-カナダ型リー脳症、長鎖3-ヒドロキシアシル-CoAデヒドロゲナーゼ欠乏症、MELAS、MERRF、MTHFR欠乏症、MTHFR熱不安定性バリアント、MTRNR1関連聴力損失及び難聴、MTTS1関連聴力損失及び難聴、MYH関連ポリポーシス、メープルシロップ尿症1A型、メープルシロップ尿症1B型、McCune-Albright症候群、中鎖アシル-コエンザイムA脱水素酵素欠乏症、皮質下嚢胞を伴う大頭型白質脳症、異染性白質ジストロフィー、ミトコンドリア心筋症、ミトコンドリアDNA関連リー脳症及びNARP、ムコリピドーシスIV型、ムコ多糖症I型、ムコ多糖症IIIA型、ムコ多糖症VII型、多発性内分泌腫瘍症2型、筋・眼・脳病、神経学的表現型ネマリンミオパチー、スフィンゴミエリナーゼ欠乏症に起因するニーマン-ピック病、ニーマン-ピック病C1型、ナイミーヘン染色体不安定症候群、PPT1-関連神経セロイド-リポフスチン症、PROP1関連下垂体ホルモン欠乏症、パリスター-ホール症候群、先天性パラミオトニア、ペンドレッド症候群、ペルオキシソーム二頭酵素欠乏症、広範性発達障害、フェニルアラニンヒドロキシラーゼ欠乏症、プラスミノーゲン活性化抑制因子1、常染色体劣性多発性嚢胞腎、プロトロンビンG20210A血栓性素因、偽性ビタミンD欠乏性くる病、濃化異骨症、常染色体劣性網膜色素変性症Bothnia型、レット症候群、点状軟骨異形成症1型、短鎖アシル-CoAデヒドロゲナーゼ欠乏症、シュワッハマン-ダイアモンド症候群、シェーグレン-ラルソン症候群、スミス-レムリ-オピッツ症候群、痙性対麻痺13、硫酸トランスポータ関連骨異形成症、TFR2関連遺伝性ヘモクロマトーシス、TPP1関連神経セロイド-リポフスチン症、タナトフォリック骨異形成症、トランスサイレチンアミロイドーシス、三頭酵素欠乏症、チロシン-ヒドロキシラーゼ欠乏症DRD、高チロシン血症1型、ウィルソン病、X連鎖若年網膜分離症、嚢胞性線維症、脊髄性筋萎縮症(SMA)、異常ヘモグロビン症、並びにツェルウェガー症候群スペクトラムから選択される疾患に関連付けられる、請求項11~24のいずれか一項に記載の方法。
【請求項27】
無細胞胎児DNA(cffDNA)について生物学的試料を富化する方法であって、妊婦から無細胞DNA(cfDNA)を含む生物学的試料を得ることであって、前記cfDNAが、cffDNA及び無細胞母体DNA(cfmDNA)を含む、得ることと、前記生物学的試料から前記cfDNAを抽出することと、抽出されたcfDNAにサイズ排除プロセスを施すことと、を含み、前記サイズ排除プロセスが、約150ヌクレオチド長、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、又は約180ヌクレオチド長のカットオフサイズを有し、それによって、cffDNAが富化された試料が生成される、方法。
【請求項28】
無細胞DNA(cfDNA)のインシリコ処理の方法であって、無細胞胎児(cffDNA)及び無細胞母体DNA(cfmDNA)を含むcfDNA試料を配列決定して、配列ライブラリを調製することと、リード長に基づく分析を実施することであって、対象となる核酸配列の対立遺伝子バランスが、前記配列ライブラリの少なくとも2つのウィンドウに確立される、実施することと、前記少なくとも2つのウィンドウの前記対立遺伝子バランスに基づいてトラジェクトリーを確立することと、を含む、方法。
【請求項29】
非侵襲的出生前スクリーニング(NIPS)における余分な遺伝子材料からのバックグラウンドノイズを低減する方法であって、
(i)妊婦から生物学的試料を得ることであって、前記生物学的試料が、無細胞DNA(cfDNA)を含む、得ることと、
(ii)NIPSに使用された前記cfDNAを処理することであって、処理することが、無細胞胎児DNA(cffDNA)について前記生物学的試料を富化すること、前記cfDNAのインシリコ処理、又はそれらの組み合わせを含む、処理することと、を含む、方法。
【請求項30】
処理することが、無細胞胎児DNA(cffDNA)について前記生物学的試料を富化すること、及び前記cfDNAのインシリコ処理の両方を含む、請求項29に記載の方法。
【請求項31】
無細胞胎児DNA(cffDNA)について前記生物学的試料を前記富化することが、請求項27に記載の方法を含む、請求項29又は30に記載の方法。
【請求項32】
前記cfDNAの前記インシリコ処理が、請求項28に記載の方法を含む、請求項29~31のいずれか一項に記載の方法。
【請求項33】
GC-バイアス、試料バックグラウンド、ハイブリダイゼーションプローブ捕捉、又はそれらの組み合わせを制御するための正規化を更に含む、請求項29~32のいずれか一項に記載の方法。
【発明の詳細な説明】
【技術分野】
【0001】
関連出願の相互参照
本出願は、各出願の全内容が参照により本明細書に組み込まれる、2022年1月11日に出願された米国仮出願第63/298,593号及び2022年7月1日に出願された米国仮出願第63/357,915号の優先権の利益を主張する。
【0002】
本明細書に記載されるのは、妊娠中の母親から試料を調製する方法、及びそのような試料の分析の関連する方法である。
【背景技術】
【0003】
本技術の背景の以下の説明は、単に本技術を理解する際の補助として提供され、本技術の先行技術を説明又は構成するとは認められていない。
【0004】
非侵襲的出生前スクリーニング(NIPS)は、妊娠中の母親のためのヘルスケアの日常的な構成要素となってきた。NIPSは、染色体異数性(例えば、ダウン症候群など)についてのスクリーニング、及び母親又は胎児における他の遺伝子異常についてのスクリーニングの両方を含み得る。多くのそのようなスクリーニングは、無細胞DNA(cfDNA)を利用するが、しかしながら、cfDNAの利用は、母体血漿中のcfDNAのわずかのみの部分が胎児に由来するので、いくつかの困難を被る。
【0005】
追加的に、ある特定の遺伝する状態についての出生前スクリーニングは、従来、母親及び父親の両方からDNA試料を得ることを必要としてきた。例えば、染色体異数性及び様々な遺伝的状態を検出するための従来のアプローチは、胎児の母親及び父親の両方からのゲノムDNA(gDNA)の試料、並びに母親からのcfDNAの試料を得ることが必要であった。したがって、そのような試験は、少なくとも3つの試料を必要とし、それらの各々は、異なる様式で処理及び評価され得る。
【発明の概要】
【0006】
本開示は、染色体異数性及び他の遺伝子バリアント/変異体の両方についてのNIPSを、単一の母体試料のみを用いて並行して実施することができるように、母体試料の胎児画分を選択的に富化する方法を提供することによって、これらの困難に対処する。
【0007】
[概要]
本開示は、一般に、病原性SNP、INDEL、及び単一遺伝子コピー数変異などの染色体異数性及び他の遺伝子変異についての、単一の試料からの新規の試料調製及び並行スクリーニングを対象とする。これらの組成物及びプロセスは、全てが、従来の出生前スクリーニング分析と比較して、複雑さがより低く、必要な時間がより少ない状態で、必要な分析を合理化及び簡素化し、より少ない試料を利用し、バックグラウンドノイズを低減することによって、非侵襲的出生前スクリーニング(NIPS)を改善する。
【0008】
一態様では、本開示は、富化された胎児画分を含む生物学的試料を調製する方法であって、
(a-1)妊婦から無細胞DNA(cfDNA)を含む生物学的試料を得ることと、
(b-1)生物学的試料からcfDNAを抽出することと、
(c-1)cfDNA断片のライブラリを調製して、cfDNAライブラリを得ることと、
(d-1)cfDNAライブラリ内のcfDNA断片をサイズによって分離して、約150ヌクレオチド長未満、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、約180ヌクレオチド長、約185ヌクレオチド長、約190ヌクレオチド長、約195ヌクレオチド長、若しくは約200ヌクレオチド長であるcfDNA断片のみを保持することと、
(e-1)保持されたcfDNA断片を配列決定して、第1の配列ライブラリを得ることと、
(f-1)リード長長に基づいて、第1の配列ライブラリの少なくとも2つのウィンドウに存在する、(i)無細胞胎児DNA(cffDNA)の配列、及び(ii)無細胞母体DNA(cfmDNA)の配列を同定することと、
(g-1)配列ライブラリの少なくとも2つのウィンドウの各々からcffDNAの配列を単離し、それによって、少なくとも2つの胎児画分富化配列ライブラリを得ることと、を含むか、
又は
(a-2)妊婦から無細胞DNA(cfDNA)を含む生物学的試料を得ることと、
(b-2)生物学的試料からcfDNAを抽出することと、
(c-2)(b-2)からの抽出された試料中のcfDNA断片を分離して、約150ヌクレオチド長未満、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、約180ヌクレオチド長、約185ヌクレオチド長、約190ヌクレオチド長、約195ヌクレオチド長、若しくは約200ヌクレオチド長であるcfDNA断片のみを保持することと、
(d-2)(c-2)からの分離したcfDNA断片からcfDNAライブラリを調製することと、
(e-2)cfDNAライブラリを配列決定して、第1の配列ライブラリを得ることと、
(f-2)リード長長に基づいて、第1の配列ライブラリの少なくとも2つのウィンドウに存在する、(i)無細胞胎児DNA(cffDNA)の配列、及び(ii)無細胞母体DNA(cfmDNA)の配列を同定することと、
(g-2)配列ライブラリの少なくとも2つのウィンドウの各々からcffDNAの配列を単離し、それによって、少なくとも2つの胎児画分富化配列ライブラリを得ることと、を含む、方法を提供する。
【0009】
いくつかの実施形態では、cfDNA断片を分離することは、生物学的試料中の胎児画分を約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、又は約2.0倍富化する。
【0010】
いくつかの実施形態では、第1の配列ライブラリの少なくとも2つのウィンドウからcffDNAの配列を単離することは、生物学的試料中の胎児画分を約1.1倍、約1.2倍、約1.3倍、約1.4倍、約1.5倍、約1.6倍、約1.7倍、約1.8倍、約1.9倍、約2.0倍、約2.1倍、約2.2倍、約2.3倍、約2.4倍、約2.5倍、約2.6倍、約2.7倍、約2.8倍、約2.9倍、約3.0倍、約3.1倍、約3.2倍、約3.3倍、約3.4倍、又は約3.5倍富化する。
【0011】
いくつかの実施形態では、cfDNA断片を分離することは、電気泳動を含む。
【0012】
いくつかの実施形態では、第1の配列ライブラリの少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個のウィンドウを評価して、cffDNA配列を同定及び単離し、それによって、それぞれ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個の胎児画分富化配列ライブラリを得る。
【0013】
いくつかの実施形態では、方法は、第1の配列ライブラリ内のcffDNA及びcfmDNAの配列リードを参照ゲノムと比較することによって、cffDNAを同定し、cfmDNAから分離すること、第1のライブラリからの配列リードを逆多重化すること(demultiplexing)、第1の配列ライブラリから重複配列を除去すること、又はそれらの組み合わせを更に含み得る。
【0014】
いくつかの実施形態では、方法は、1つ以上の遺伝子変異の存在について、少なくとも2つの胎児画分富化配列ライブラリを評価することを更に含み得る。いくつかの実施形態では、1つ以上の遺伝子変異は、21-ヒドロキシラーゼ欠乏症、ABCC8関連高インスリン症、ARSACS、軟骨無形成症、1色覚、アデノシン一リン酸デアミナーゼ1、ニューロノパチー(neuronopathy)を伴う脳梁欠損症、アルカプトン尿症、アルファ-1-アンチトリプシン欠乏症、アルファ-マンノシドーシス、アルファ-サルコグリカノパチー、アルファ-サラセミア、アンジオテンシンII受容体I型アルツハイマー、アポリポタンパク質E遺伝子型アルツハイマー、アルギニノスクシン酸尿症、アスパルチルグリコサミン尿症、ビタミンE欠乏症を伴う運動失調症、毛細血管拡張性運動失調症、自己免疫多内分泌腺症候群1型、BRCA1遺伝性乳がん/卵巣がん、BRCA2遺伝性乳がん/卵巣がん、バルデ-ビードル症候群、Best卵黄状黄斑ジストロフィー、ベータ-サルコグリカノパチー、ベータ-サラセミア、ビオチニダーゼ欠乏症、ブラウ症候群、ブルーム症候群、CFTR関連障害、CLN3関連神経セロイド-リポフスチン症、CLN5関連神経セロイド-リポフスチン症、CLN8関連神経セロイド-リポフスチン症、カナバン病、カルニチンパルミトイルトランスフェラーゼIA欠乏症、カルニチンパルミトイルトランスフェラーゼII欠乏症、軟骨毛髪低形成症、海綿状血管奇形、脈絡膜血症、コーエン症候群、先天性白内障、顔面異形症、及び神経障害、先天性グリコシル化異常症Ia型、先天性グリコシル化異常症Ib型、先天性フィンランド型ネフローゼ症候群、クローン病、シスチン症、DFNA9(COCH)、糖尿病及び聴力損失、早期発症性一次性ジストニア(DYTI)、Herlitz-Pearson型接合部表皮水疱症、FANCC関連ファンコニ貧血、FGFR1関連頭蓋縫合早期癒合症、FGFR2関連頭蓋縫合早期癒合症、FGFR3関連頭蓋縫合早期癒合症、第V因子Leiden血栓性素因、第V R2因子変異(Factor V R2 Mutation)血栓性素因、第XI因子欠乏症、第XIII因子欠乏症、家族性腺腫性ポリポーシス、家族性自律神経障害、家族性高コレステロール血症B型、家族性地中海熱、遊離シアル酸蓄積障害、パーキンソニズム-17を伴う前頭側頭型認知症、フマラーゼ欠乏症、GJB2関連DFNA3非症候群性聴力損失及び難聴、GJB2関連DFNB1非症候群性聴力損失及び難聴、GNE関連ミオパチー、ガラクトース血症、ゴーシェ病、グルコース-6-リン酸脱水素酵素欠乏症、グルタル酸血症1型、糖原病1a型、糖原病Ib型、糖原病II型、糖原病III型、糖原病V型、グレイシル症候群、HFE関連遺伝性ヘモクロマトーシス、ハルダーAIM(Halder AIM)、ヘモグロビンSベータ-サラセミア、遺伝性フルクトース不耐症、遺伝性膵炎、遺伝性チミン-ウラシル尿症、ヘキソサミニダーゼA欠乏症、有汗性外胚葉異形成症2、シスタチオニンベータ合成酵素欠乏症によって引き起こされるホモシスチン尿症、高カリウム性周期性四肢麻痺1型、高オルニチン血症-高アンモニア血症-ホモシトリン血症症候群、原発性1型高シュウ酸尿症、原発性2型高シュウ酸尿症、軟骨低形成症、低カリウム血性周期性四肢麻痺1型、低カリウム血性周期性四肢麻痺2型、低ホスファターゼ症、乳児型ミオパチー及び乳酸アシドーシス(致死的及び非致死的形態)、イソ吉草酸血症(Isovaleric Acidemias)、クラッベ病、LGMD2I、レーベル遺伝性視神経障害、フランス-カナダ型リー脳症、長鎖3-ヒドロキシアシル-CoAデヒドロゲナーゼ欠乏症、MELAS、MERRF、MTHFR欠乏症、MTHFR熱不安定性バリアント、MTRNR1関連聴力損失及び難聴、MTTS1関連聴力損失及び難聴、MYH関連ポリポーシス、メープルシロップ尿症1A型、メープルシロップ尿症1B型、McCune-Albright症候群、中鎖アシル-コエンザイムA脱水素酵素欠乏症、皮質下嚢胞を伴う大頭型白質脳症、異染性白質ジストロフィー、ミトコンドリア心筋症、ミトコンドリアDNA関連リー脳症及びNARP、ムコリピドーシスIV型、ムコ多糖症I型、ムコ多糖症IIIA型、ムコ多糖症VII型、多発性内分泌腫瘍症2型、筋・眼・脳病(Muscle-Eye-Brain Disease)、神経学的表現型ネマリンミオパチー、スフィンゴミエリナーゼ欠乏症に起因するニーマン-ピック病、ニーマン-ピック病C1型、ナイミーヘン染色体不安定症候群、PPT1-関連神経セロイド-リポフスチン症、PROP1関連下垂体ホルモン欠乏症、パリスター-ホール症候群、先天性パラミオトニア、ペンドレッド症候群、ペルオキシソーム二頭酵素欠乏症、広範性発達障害、フェニルアラニンヒドロキシラーゼ欠乏症、プラスミノーゲン活性化抑制因子1、常染色体劣性多発性嚢胞腎、プロトロンビンG20210A血栓性素因、偽性ビタミンD欠乏性くる病、濃化異骨症、常染色体劣性網膜色素変性症Bothnia型、レット症候群、点状軟骨異形成症1型、短鎖アシル-CoAデヒドロゲナーゼ欠乏症、シュワッハマン-ダイアモンド症候群、シェーグレン-ラルソン症候群、スミス-レムリ-オピッツ症候群、痙性対麻痺13、硫酸トランスポータ関連骨異形成症、TFR2関連遺伝性ヘモクロマトーシス、TPP1関連神経セロイド-リポフスチン症、タナトフォリック骨異形成症、トランスサイレチンアミロイドーシス、三頭酵素(Trifunctional Protein)欠乏症、チロシン-ヒドロキシラーゼ欠乏症DRD、高チロシン血症1型、ウィルソン病、X連鎖若年網膜分離症、嚢胞性線維症、脊髄性筋萎縮症(SMA)、異常ヘモグロビン症、並びにツェルウェガー症候群スペクトラムから選択される少なくとも1つの状態を引き起こす。
【0015】
いくつかの実施形態では、方法は、染色体異数性の存在について、cfDNAを含む生物学的試料を評価することを更に含み得る。いくつかの実施形態では、染色体異数性は、モノソミー、トリソミー、テトラソミー、ペンタソミー、微細欠失、微細重複(micoduplication)、並びにモノソミー、トリソミー、テトラソミー、及びペンタソミーのモザイクバージョンから選択される。
【0016】
別の態様では、本開示は、単一の母体試料中の染色体異数性の存在又は不在、及び少なくとも1つの遺伝子バリアントの存在又は不在を並行検出する方法であって、
(i)妊婦から生物学的試料を得ることであって、生物学的試料が、無細胞DNA(cfDNA)を含む、得ることと、
(ii)cfDNAライブラリを調製することと、
(iii)cfDNAライブラリを配列決定して、配列ライブラリを生成することと、
(iv)単一の母体試料中の染色体異数性の存在又は不在、及び少なくとも1つの遺伝子バリアントの存在又は不在を検出することと、を含み、
(a)cfDNAライブラリを富化して、胎児画分を増加させるか、(b)配列ライブラリを富化して、胎児画分を増加させるか、又は(c)それらの組み合わせを行い、それによって、単一の母体試料の胎児画分を、少なくとも1.1倍、少なくとも1.2倍、少なくとも1.3倍、少なくとも1.4倍、又は少なくとも1.5倍増加させた後に、単一の母体試料中の染色体異数性の存在又は不在、及び少なくとも1つの遺伝子バリアントの存在又は不在を検出する、方法を提供する。
【0017】
いくつかの実施形態では、生物学的試料は、血液、血清、又は血漿である。
【0018】
いくつかの実施形態では、cfDNAライブラリを富化して、胎児画分を増加させ、配列ライブラリを富化して、胎児画分を増加させる。
【0019】
いくつかの実施形態では、cfDNAライブラリの胎児画分を富化することは、約150ヌクレオチド長、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、又は約180ヌクレオチド長よりも大きい、任意のDNA断片をcfDNAライブラリから除去することを含む。いくつかの実施形態では、cfDNAライブラリからDNA断片を除去することは、電気泳動を含む。
【0020】
いくつかの実施形態では、配列ライブラリの胎児画分を富化することは、配列ライブラリの少なくとも2つのウィンドウにおける配列のリード長に基づくサイズ排除を含み、それによって、少なくとも2つの胎児画分富化配列ライブラリを得る。いくつかの実施形態では、第1の配列ライブラリの少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個のウィンドウを評価して、cffDNA配列を同定及び単離し、それによって、それぞれ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個の胎児画分富化配列ライブラリを得る。いくつかの実施形態では、配列ライブラリの少なくとも2つのウィンドウは、(i)0~145ヌクレオチドである配列、(ii)0~150ヌクレオチドである配列、(iii)0~155ヌクレオチド、(iv)0~160ヌクレオチド、(v)0~165ヌクレオチド、(vi)0~168ヌクレオチド、(vii)0~170ヌクレオチド、(viii)0~175ヌクレオチド、(ix)0~180ヌクレオチド、(x)0~185ヌクレオチド、(xi)0~190ヌクレオチド、(xii)0~195ヌクレオチド、(xiii)0~200ヌクレオチド、及び(xiv)非ゲート型から選択される。
【0021】
いくつかの実施形態では、配列ライブラリの胎児画分を富化することは、第1の配列ライブラリ内のcffDNA及びcfmDNAの配列リードを参照ゲノムと比較することによって、cffDNAを同定し、cfmDNAから分離すること、第1のライブラリからの配列リードを逆多重化すること、第1の配列ライブラリから重複配列を除去すること、又はそれらの組み合わせを更に含む。
【0022】
いくつかの実施形態では、少なくとも1つの遺伝子バリアントの存在又は不在を検出することは、少なくとも2つの胎児画分富化配列ライブラリの各々において、少なくとも1つの遺伝子バリアントをコードする、試料中の各対立遺伝子の対立遺伝子バランスを決定することと、少なくとも2つの胎児画分富化配列ライブラリの各々における対立遺伝子バランスに基づく各対立遺伝子についての対立遺伝子バランストラジェクトリー、少なくとも2つの胎児画分富化配列ライブラリの深さに基づく深さトラジェクトリー、又は対立遺伝子バランストラジェクトリーと深さトラジェクトリーとの組み合わせを生成することと、を含む。
【0023】
いくつかの実施形態では、染色体異数性の存在又は不在を検出することは、配列ライブラリにおける対象となる染色体に対応する少なくとも1つの配列の配列深さを分析することを含む。いくつかの実施形態では、対象となる染色体に対応する少なくとも1つの配列の配列深さを、対象となる染色体の予想される深さのモデルに適合させる。いくつかの実施形態では、配列深さは、以下の式を用いて計算され、
【数1】
式中、
d
pが、妊娠深さであり、
fが、胎児画分であり、
c
mが、母体コピー数であり、
d
bが、バックグラウンド深さであり、
c
fが、胎児コピー数である。
【0024】
いくつかの実施形態では、配列深さを正規化して、GC-バイアス、試料バックグラウンド、ハイブリダイゼーションプローブ捕捉、又はそれらの組み合わせを制御する。
【0025】
いくつかの実施形態では、方法は、モノソミー、トリソミー、テトラソミー、ポリソミーX、ポリソミーY、微細欠失、微細重複、ペンタソミー、及びそれらの組み合わせから選択される染色体異数性の存在又は不在を検出することを含む。
【0026】
いくつかの実施形態では、少なくとも1つの遺伝子バリアントは、21-ヒドロキシラーゼ欠乏症、ABCC8関連高インスリン症、ARSACS、軟骨無形成症、1色覚、アデノシン一リン酸デアミナーゼ1、ニューロノパチーを伴う脳梁欠損症、アルカプトン尿症、アルファ-1-アンチトリプシン欠乏症、アルファ-マンノシドーシス、アルファ-サルコグリカノパチー、アルファ-サラセミア、アンジオテンシンII受容体I型アルツハイマー、アポリポタンパク質E遺伝子型アルツハイマー、アルギニノスクシン酸尿症、アスパルチルグリコサミン尿症、ビタミンE欠乏症を伴う運動失調症、毛細血管拡張性運動失調症、自己免疫多内分泌腺症候群1型、BRCA1遺伝性乳がん/卵巣がん、BRCA2遺伝性乳がん/卵巣がん、バルデ-ビードル症候群、Best卵黄状黄斑ジストロフィー、ベータ-サルコグリカノパチー、ベータ-サラセミア、ビオチニダーゼ欠乏症、ブラウ症候群、ブルーム症候群、CFTR関連障害、CLN3関連神経セロイド-リポフスチン症、CLN5関連神経セロイド-リポフスチン症、CLN8関連神経セロイド-リポフスチン症、カナバン病、カルニチンパルミトイルトランスフェラーゼIA欠乏症、カルニチンパルミトイルトランスフェラーゼII欠乏症、軟骨毛髪低形成症、海綿状血管奇形、脈絡膜血症、コーエン症候群、先天性白内障、顔面異形症、及び神経障害、先天性グリコシル化異常症Ia型、先天性グリコシル化異常症Ib型、先天性フィンランド型ネフローゼ症候群、クローン病、シスチン症、DFNA9(COCH)、糖尿病及び聴力損失、早期発症性一次性ジストニア(DYTI)、Herlitz-Pearson型接合部表皮水疱症、FANCC関連ファンコニ貧血、FGFR1関連頭蓋縫合早期癒合症、FGFR2関連頭蓋縫合早期癒合症、FGFR3関連頭蓋縫合早期癒合症、第V因子Leiden血栓性素因、第V R2因子変異血栓性素因、第XI因子欠乏症、第XIII因子欠乏症、家族性腺腫性ポリポーシス、家族性自律神経障害、家族性高コレステロール血症B型、家族性地中海熱、遊離シアル酸蓄積障害、パーキンソニズム-17を伴う前頭側頭型認知症、フマラーゼ欠乏症、GJB2関連DFNA3非症候群性聴力損失及び難聴、GJB2関連DFNB1非症候群性聴力損失及び難聴、GNE関連ミオパチー、ガラクトース血症、ゴーシェ病、グルコース-6-リン酸脱水素酵素欠乏症、グルタル酸血症1型、糖原病1a型、糖原病Ib型、糖原病II型、糖原病III型、糖原病V型、グレイシル症候群、HFE関連遺伝性ヘモクロマトーシス、ハルダーAIM、ヘモグロビンSベータ-サラセミア、遺伝性フルクトース不耐症、遺伝性膵炎、遺伝性チミン-ウラシル尿症、ヘキソサミニダーゼA欠乏症、有汗性外胚葉異形成症2、シスタチオニンベータ合成酵素欠乏症によって引き起こされるホモシスチン尿症、高カリウム性周期性四肢麻痺1型、高オルニチン血症-高アンモニア血症-ホモシトリン血症症候群、原発性1型高シュウ酸尿症、原発性2型高シュウ酸尿症、軟骨低形成症、低カリウム血性周期性四肢麻痺1型、低カリウム血性周期性四肢麻痺2型、低ホスファターゼ症、乳児型ミオパチー及び乳酸アシドーシス(致死的及び非致死的形態)、イソ吉草酸血症、クラッベ病、LGMD2I、レーベル遺伝性視神経障害、フランス-カナダ型リー脳症、長鎖3-ヒドロキシアシル-CoAデヒドロゲナーゼ欠乏症、MELAS、MERRF、MTHFR欠乏症、MTHFR熱不安定性バリアント、MTRNR1関連聴力損失及び難聴、MTTS1関連聴力損失及び難聴、MYH関連ポリポーシス、メープルシロップ尿症1A型、メープルシロップ尿症1B型、McCune-Albright症候群、中鎖アシル-コエンザイムA脱水素酵素欠乏症、皮質下嚢胞を伴う大頭型白質脳症、異染性白質ジストロフィー、ミトコンドリア心筋症、ミトコンドリアDNA関連リー脳症及びNARP、ムコリピドーシスIV型、ムコ多糖症I型、ムコ多糖症IIIA型、ムコ多糖症VII型、多発性内分泌腫瘍症2型、筋・眼・脳病、神経学的表現型ネマリンミオパチー、スフィンゴミエリナーゼ欠乏症に起因するニーマン-ピック病、ニーマン-ピック病C1型、ナイミーヘン染色体不安定症候群、PPT1-関連神経セロイド-リポフスチン症、PROP1関連下垂体ホルモン欠乏症、パリスター-ホール症候群、先天性パラミオトニア、ペンドレッド症候群、ペルオキシソーム二頭酵素欠乏症、広範性発達障害、フェニルアラニンヒドロキシラーゼ欠乏症、プラスミノーゲン活性化抑制因子1、常染色体劣性多発性嚢胞腎、プロトロンビンG20210A血栓性素因、偽性ビタミンD欠乏性くる病、濃化異骨症、常染色体劣性網膜色素変性症Bothnia型、レット症候群、点状軟骨異形成症1型、短鎖アシル-CoAデヒドロゲナーゼ欠乏症、シュワッハマン-ダイアモンド症候群、シェーグレン-ラルソン症候群、スミス-レムリ-オピッツ症候群、痙性対麻痺13、硫酸トランスポータ関連骨異形成症、TFR2関連遺伝性ヘモクロマトーシス、TPP1関連神経セロイド-リポフスチン症、タナトフォリック骨異形成症、トランスサイレチンアミロイドーシス、三頭酵素欠乏症、チロシン-ヒドロキシラーゼ欠乏症DRD、高チロシン血症1型、ウィルソン病、X連鎖若年網膜分離症、嚢胞性線維症、脊髄性筋萎縮症(SMA)、異常ヘモグロビン症、並びにツェルウェガー症候群スペクトラムから選択される疾患に関連付けられる。
【0027】
別の態様では、本開示は、無細胞胎児DNA(cffDNA)について生物学的試料を富化する方法であって、妊婦から無細胞DNA(cfDNA)を含む生物学的試料を得ることであって、cfDNAが、cffDNA及び無細胞母体DNA(cfmDNA)を含む、得ることと、生物学的試料からcfDNAを抽出することと、抽出されたcfDNAにサイズ排除プロセスを施すことと、を含み、サイズ排除プロセスが、約150ヌクレオチド長、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、又は約180ヌクレオチド長のカットオフサイズを有し、それによって、cffDNAが富化された試料が、生成される、方法を提供する。
【0028】
別の態様では、本開示は、無細胞DNA(cfDNA)のインシリコ処理の方法であって、無細胞胎児(cffDNA)及び無細胞母体DNA(cfmDNA)を含むcfDNA試料を配列決定して、配列ライブラリを調製することと、リード長に基づく分析を実施することであって、対象となる核酸配列の対立遺伝子バランスが、配列ライブラリの少なくとも2つのウィンドウに確立される、実施することと、少なくとも2つのウィンドウの対立遺伝子バランスに基づいてトラジェクトリーを確立することと、を含む、方法を提供する。
【0029】
別の態様では、本開示は、非侵襲的出生前スクリーニング(NIPS)における余分な遺伝子材料からのバックグラウンドノイズを低減する方法であって、
(i)妊婦から生物学的試料を得ることであって、生物学的試料が、無細胞DNA(cfDNA)を含む、得ることと、
(ii)NIPSに使用されたcfDNAを処理することであって、処理することが、無細胞胎児DNA(cffDNA)について生物学的試料を富化すること、cfDNAのインシリコ処理、又はそれらの組み合わせを含む、処理することと、を含む、方法を提供する。
【0030】
いくつかの実施形態では、処理することは、無細胞胎児DNA(cffDNA)について生物学的試料を富化すること、及びcfDNAのインシリコ処理の両方を含む。
【0031】
いくつかの実施形態では、無細胞胎児DNA(cffDNA)について生物学的試料を富化することは、本明細書に開示の無細胞胎児DNA(cffDNA)について生物学的試料を富化する方法のうちのいずれか1つを含む。
【0032】
いくつかの実施形態では、cfDNAのインシリコ処理は、本明細書に開示の無細胞DNA(cfDNA)のインシリコ処理の方法のうちのいずれか1つを含む。
【0033】
いくつかの実施形態では、方法は、GC-バイアス、試料バックグラウンド、ハイブリダイゼーションプローブ捕捉、又はそれらの組み合わせを制御するための正規化を更に含み得る。
【0034】
以下の詳細な説明は、例示的かつ説明的であるが、限定することを意図するものではない。
【図面の簡単な説明】
【0035】
【
図1】従来のサイズ排除技法を、より許容性があり、より多くのcffDNAを保持する、開示のサイズ排除方法と比較する図を提供する。
【
図2】移動ウィンドウ分析に依存して、胎児及び母体のcfDNAの量が変化する、対立遺伝子バランスの変化を密接に観察する、開示のインシリコ富化の方法の視覚化を提供する。
【
図3】開示の移動ウィンドウ分析から観察される、対立遺伝子バランスを視覚化する2つの方式を示す。
【
図4】開示の方法及びシステムの一実施形態の例示的な計算フローの概要を示す。
【
図5】どのように深さ呼び出しを使用して、染色体異数性の存在を確立することができるかのいくつかの視覚的表現を示す。上部パネルは、従来の核型を、正常な妊娠及び胎児がトリソミー21を有する妊娠における染色体21の深さリードと比較する。中央パネルは、トリソミーが観察される場合に予想される、深さのシフトの種類を表す。下部パネルは、様々な倍数性を表す4つの既知のコピー数(CN)曲線(例えば、CN=1、CN=2、CN=3、及びCN=4)の予想される適合を示し、影付き領域が、トリソミーを含む試料からのリードの深さが予想される適合曲線内にどのように適合するかを示す。
【
図6】1)GCバイアス、2)試料バックグラウンド、及び3)ハイブリダイゼーションプローブ捕捉によって引き起こされる変動を制御する3重の正規化を用いることによって達成することができる、データプロットの例示的な改善を示す。
【
図7】異なる適合試料を用いる、いくつかの染色体について予想される適合曲線に対する深さリードの適合を示す。各プロットにおける影付き領域は、示された染色体の所与の試料の深さを表す。各プロットによる左から右への適合曲線は、モデルに適合する1、2、又は3つの染色体について予想される適合である。
【
図8】母親が遺伝子の1つのコピーを有し、胎児がゼロ個のコピーを有する遺伝子(SMN2)の深さトラジェクトリープロットを示す。
【発明を実施するための形態】
【0036】
本明細書に開示の試料調製及び方法は、一般に、生物学的母親から生物学的試料(例えば、血液又は他のDNA含有試料)を収集して、次いで、非侵襲的出生前スクリーニングを通じた染色体異数性及び遺伝子変異の並行検出(例えば、劣性サーベイランス手順)などのスクリーニングを実行する、新規のプロセスを対象とする。すなわち、本開示は、1つのみの個体、すなわち、生物学的母親からの試料を使用して、2組の検出可能な遺伝的状態を発見するための、単一の(例えば、並行)試験(例えば、染色体異数性及び遺伝子バリアントスクリーニング)を提供する。生物学的父親を関与させることなく、これらの2つのサーベイランス試験を単一の試験に組み合わせることは、多くの場合、父親の試料を必要とし、染色体異数性のスクリーニング及び遺伝子バリアントスクリーニングが別々に実施される従来の試験及び方法を上回る効率及び利便性を提供する。更に、試料調製は、感度、特異性を改善し、様々な原因となる遺伝子バリアントの検出に不必要な余分な遺伝子材料からのノイズを最小限に抑えることができる。
【0037】
本開示による実施形態は、以下により完全に説明される。しかしながら、本開示の態様は、異なる形態で具体化されてもよく、本明細書に記載される実施形態に限定されるものとして解釈されるべきではない。むしろ、これらの実施形態は、本開示が詳細かつ完全であり、本発明の範囲を当業者に完全に伝達するように提供される。本明細書の説明に使用される用語は、単に特定の実施形態を記載する目的のためであり、本発明を制限することを意図しない。
【0038】
別段に明示的に指示されない限り、全ての特定の実施形態、特徴、及び用語は、列挙された実施形態、特徴、又は用語、及びそれらの等価物の両方を含むことを意図する。
【0039】
I.定義
本明細書で使用される場合、単数形「a」、「an」、及び「the」は、単数形のみを指定するように明示的に記載されない限り、単数形及び複数形の両方を指定する。
【0040】
本明細書で使用される場合、「約」という用語は、記載された数値及び+/-10%の範囲の両方を包含する相対的な用語として理解されるものである。例えば、「約10」という語句は、「10」及び「9~11」の両方を意味すると理解されるべきである。
【0041】
また、本明細書で使用される場合、「及び/又は」は、関連付けられ列挙された項目のうちの1つ以上の任意及び全ての可能な組み合わせ、並びに代替的に(「又は」)解釈される場合の組み合わせの欠如を指し、かつ包含する。
【0042】
本明細書で使用される場合、「任意選択の」又は「任意選択で」は、その後記載される事象又は状況が生じ得るか又は生じ得ないことを意味し、この記載は、当該事象又は状況が生じる例及び生じない例を含む。
【0043】
本明細書で使用される場合、「DNA結合粒子」は、cfDNA断片などのDNA断片と相互作用するか、又はそれらと相互作用するように修飾された、任意の従来の固相材料を指す。固相相材料は、例えば、反応溶液中で直接的又は間接的のいずれかでDNAと相互作用する任意の種類の不溶性、通常は硬質材料、マトリックス、又は固定相材料である。ある特定の例示的な実施形態では、DNA結合粒子は、ビーズである。
【0044】
本明細書で使用される場合、「ビーズ」は、任意の都合のよいサイズの固相粒子を指し、不規則又は規則的な形状を有し得る。ある特定の例示的な実施形態では、ビーズの表面は、直接的及び/又は間接的のいずれかでDNAに結合するように修飾されている。例えば、ビーズは、シラノール基、カルボン酸基、又はビーズとDNAとの直接的及び/又は相互作用を容易にする他の基を含み得る。ある特定の例示的な実施形態では、シリカビーズ(及びゲル)は、一級アミン、チオール、スルフヒドリル、プロピル、オクチル、並びに他の誘導体を、シリカに結合したヒドロキシル基(シラノール)に付加することによって官能化され得る。ビーズは、セルロース、セルロース誘導体、アクリル樹脂、ガラス、シリカゲル、ポリスチレン、ゼラチン、ポリビニルピロリドン、ビニルとアクリルアミド、ジビニルベンゼンと架橋したポリスチレンなどの共重合体、ポリアクリルアミド、ラテックスゲル、ポリスチレン、デキストラン、ゴム、シリコン、プラスチック、ニトロセルロース、天然スポンジ、シリカゲル、多孔性ガラス(controlled pore glass)(CPG)、金属、架橋デキストラン(例えば、Sephadex(登録商標))、アガロースゲル(Sepharose(登録商標))、及び当業者に既知の他の固相ビーズ支持体を含む、任意の数の既知の材料から製造され得る。ある特定の例示的な実施形態では、ビーズは、従来のカラムクロマトグラフィーで使用することができるカラムを形成するように一緒に充填され得る。
【0045】
本明細書で使用される場合、「遺伝子バリアント」という用語は、本明細書に記載のスクリーニング、呼び出し、又はプロセスに関して使用される場合、非病原性又は野生型の遺伝子配列と見なされるものからの変化を指す。したがって、「遺伝子バリアント」という用語は、病原性単一ヌクレオチド多型(SNP)、対象のゲノム内の塩基の挿入又は欠失(INDEL)、置換変異、単一遺伝子コピー数変異などを含む。追加的に、本明細書で使用される「遺伝子バリアント」という用語は、染色体異数性とは別個であり、「遺伝子バリアント」という用語は、欠損又は余分な染色体に関連しないことが留意されるべきである。むしろ、「遺伝子バリアント」という用語は、染色体異常ではなく、対象のゲノム配列の特徴又は変化(病原性又はそれ以外のもの)に関すると理解されるものである。
【0046】
本明細書で使用される場合、「cfDNAライブラリ」又は「核酸ライブラリ」という用語は、核酸のコレクション、例えば、生物学的試料に由来する無細胞核酸のコレクションを指すために互換的に使用され得る。いくつかの実施形態では、cfDNAライブラリ又は核酸ライブラリは、試料中の核酸を増幅することによって、又はPCRフリーに基づく方法を使用してライブラリを調製することによって生成される。いくつかの実施形態では、cfDNAライブラリ又は核酸ライブラリは、以下に詳述されるように、試料内の特定の標的断片を増幅することによって生成される。いくつかの実施形態では、cfDNAライブラリ又は核酸ライブラリ内の核酸の一部分又は全ては、アダプター配列を含む。アダプター配列は、一方又は両方の末端に位置し得る。アダプター配列は、例えば、配列決定方法(例えば、NGS方法)に、増幅に、逆転写に、又はベクターへのクローニングに有用であり得る。
【0047】
cfDNAライブラリ又は核酸ライブラリは、標的核酸配列(例えば、疾患に関連付けられる遺伝子バリアントを検出することができる核酸配列)、参照核酸配列、又はそれらの組み合わせを含み得る、核酸断片のコレクションを含み得る。いくつかの実施形態では、同じ対象からの2つ以上のcfDNA又は核酸ライブラリが組み合わせられ得る。
【0048】
本明細書で使用される場合、「配列ライブラリ」は、例えば、次世代配列決定又はNGSなどの大規模な並行方法を使用して、cfDNAライブラリ又は核酸ライブラリを配列決定することによって調製された核酸配列のコレクションである。NGSは、一般に、クローン増幅され、かつ単一の核酸分子の大規模な並行配列決定を可能にする配列決定方法を指し、配列決定中に、単一の試料又は複数の異なる試料からの複数の、例えば、数百万の核酸断片が一斉に配列決定される。NGSの非限定的な例としては、合成による配列決定、ライゲーションによる配列決定、リアルタイム配列決定、及びナノポア配列決定が挙げられる。
【0049】
II.試料調製
無細胞DNA(cfDNA)は、特性(例えば、サイズ、配列、存在量)並びに元となる組織(例えば、母体対胎児)が変動する、DNAの混合物である。例えば、妊婦から得られたcfDNAは、母体及び胎児の両方が元となるDNAを含有する。所与の母体血漿試料中のcfDNAを利用する場合のNIPS感度の基礎となる駆動因子は、胎児画分(FF)である。胎児画分は、胎児からのものであるか、又は無細胞胎児DNA(cffDNA)に由来する、全無細胞DNAの部分を含む。ほとんどの試料では、FF値は、1%~30%の間であるが、多くの場合、その量は、更に低くなり得る。
【0050】
本開示は、NIPSを実施する場合の感度、特異性を改善し、ノイズを最小限に抑えるために使用することができる、妊婦(すなわち、妊娠中の母親又は生物学的母親)からの試料調製物及び試料を調製する方法を提供する。特に、試料調製は、妊婦から得られたcfDNA試料の物理的処理、妊婦から得られたcfDNA試料から生成された配列決定リードのインシリコ処理、又はそれらの組み合わせに依存し得る。
【0051】
A.胎児画分の物理的富化
本開示の方法によって妊婦から得られたcfDNA試料(例えば、血液)の物理的処理は、cfDNA試料の胎児画分を最大3倍まで富化することができる。特に、胎児無細胞DNA断片の大部分を保持し、大きな無細胞母体DNA断片の一部を除去するサイズカットオフを使用するサイズ選択によって、胎児画分を試料中で富化することができる。例えば、カットオフは、約150ヌクレオチド長未満、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、又は約180ヌクレオチド長であるcfDNA断片を保持するように設定され得る。
【0052】
いくつかの実施形態では、方法は、75ヌクレオチド以下、80ヌクレオチド以下、85ヌクレオチド以下、90ヌクレオチド以下、95ヌクレオチド以下、100ヌクレオチド以下、105ヌクレオチド以下、110ヌクレオチド以下、115ヌクレオチド以下、120ヌクレオチド以下、125ヌクレオチド以下、130ヌクレオチド以下、135ヌクレオチド以下、140ヌクレオチド以下、145ヌクレオチド以下、150ヌクレオチド以下、155ヌクレオチド以下、160ヌクレオチド以下、165ヌクレオチド以下、170ヌクレオチド以下、175ヌクレオチド以下、180ヌクレオチド以下、195ヌクレオチド以下、200ヌクレオチド以下、205ヌクレオチド以下、206ヌクレオチド以下、210ヌクレオチド以下、215ヌクレオチド以下、220ヌクレオチド以下、225ヌクレオチド以下、230ヌクレオチド以下、235ヌクレオチド以下、240ヌクレオチド以下、245ヌクレオチド以下、250ヌクレオチド以下、255ヌクレオチド以下、260ヌクレオチド以下、265ヌクレオチド以下、270ヌクレオチド以下、275ヌクレオチド以下、280ヌクレオチド以下、285ヌクレオチド以下、290ヌクレオチド以下、295ヌクレオチド以下、300ヌクレオチド以下、305ヌクレオチド以下、310ヌクレオチド以下、311ヌクレオチド以下、315ヌクレオチド以下、320ヌクレオチド以下、又は325ヌクレオチド以下である断片を選択及び単離するために使用され得る。いくつかの実施形態では、標的サイズは、125ヌクレオチド以下、130ヌクレオチド以下、135ヌクレオチド以下、140ヌクレオチド以下、145ヌクレオチド以下、150ヌクレオチド以下、155ヌクレオチド以下、160ヌクレオチド以下、165ヌクレオチド以下、170ヌクレオチド以下、175ヌクレオチド以下、180ヌクレオチド以下、195ヌクレオチド以下、又は200ヌクレオチド以下であり得る。正確なカットオフ又は標的サイズにかかわらず、プロセスの目的は、ほとんど又は全く損失することなくcffDNAを保持し、cfmDNAを最小限に抑えるか、又は枯渇させることである。
【0053】
この種類のサイズに基づく排除は、電気泳動(例えば、ゲル電気泳動又はキャピラリー電気泳動)、及び例えば、ビーズ(例えば、AMPURE(商標)ビーズ)などのDNA結合粒子を利用し得る他の既知の方法を使用して、実施され得る。一実施形態では、所望の断片長の回収の前に、核酸電気泳動分離が使用される。様々な既知の電気泳動プロセスが、この目的のために使用され得るが、一実施形態では、高スループット核酸サイズ選択のためにRanger Technology(商標)を備えたNIMBUS Select(商標)ワークステーションが使用され得る。断片サイズ選択のための他の戦略としては、「範囲」モードについて製造業者の指示に従って、アガロースカセット(BluePippin、Sage Science)での電気泳動が挙げられる。溶出されたDNAの所望の標的サイズが得られるまで、短い断片をゲルから溶出させる。なお他の方法としては、限定されないが、抗体コーティングされたスピンカラムなどの固体支持体捕捉(例えば、親和性カラム)、同期(又は非同期)抗力変化係数サイズ選択(SCODA)、(例えば、カルボキシル化磁性ビーズを使用する)固相可逆的固定化サイズ選択、親和性クロマトグラフィープロセス、又は変動する長さのアンプリコン及びマイクロチップ分離を用いるPCR増幅の組み合わせが挙げられる。
【0054】
開示のサイズに基づく排除方法は、cfDNA試料中の胎児画分を少なくとも1.1倍、1.2倍 1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.25倍、3.5倍、3.75倍、4倍、4.25倍、4.5倍、4.75倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、15倍、20倍、25倍以上富化することができる。
【0055】
したがって、本開示は、妊婦から得られたDNA試料中の胎児画分を富化するための、無細胞胎児DNA(cffDNA)のサイズ選択の方法であって、cffDNA及び無細胞母体DNA(cfmDNA)を含む無細胞DNA(cfDNA)試料にサイズ排除プロセスを施すことを含む、方法を提供する。
【0056】
B.胎児画分のインシリコ富化
追加的に、本開示は、cfDNA試料の胎児画分を更に富化することが更に可能である、妊婦から得られたcfDNA試料(例えば、血液、血漿、血清)のインシリコ富化を提供する。特に、開示のインシリコ富化は、リード長に基づくサイズ分析を含む。本開示の目的では、「リード長に基づくサイズ分析」は、ウィンドウの範囲からトラジェクトリーを確立するインシリコプロセスであり、リードデータを配列決定するために適用される。確立されたトラジェクトリーは、一組のFFレベルにわたって観察された対立遺伝子バランス(AB)に基づく。したがって、FFレベルは、異なるウィンドウからインシリコサイズ選択を介して決定され、したがって、母体DNAと胎児DNAと(それぞれ、cfmDNA及びcffDNA)を区別することを可能にする。例えば、トラジェクトリーは、10%FFで55%のAB、15%FFで60%のAB、及び20%FFで65%のABを示すことができる。これは、FFが増加するにつれてABが増加するので、上向き勾配トラジェクトリーである。そのようなトラジェクトリーの勾配及びオフセット(又はインターセプト)の両方が有用である。例えば、cfmDNAが所与のウィンドウによって主に選択される場合、FFが可能な限り低いので、生じるABは、ほとんどが母親の遺伝子型を反映する。より多くのFFが、より小さい断片を有するウィンドウによって拾われるので、ABにおける偏向は、胎児遺伝子型を示す。結果として、インターセプトが約50%(バリアントでは、母親がヘテロ接合型であることを意味する)である場合、負の勾配を有するトラジェクトリーは、胎児が特定の母体バリアントを継承していないことを示唆する。
【0057】
cfDNA試料中の対立遺伝子バランスを理解することは、所望の試料画分(例えば、染色体異数性及び遺伝子バリアント分析ではFF、又はキャリア分析では母体画分)に焦点を当てる能力を改善する。いくつかの実施形態では、インビトロでの中程度のサイズ選択(すなわち、物理的処理/サイズ排除)、続いてサイズに基づく移動ウィンドウ分析は、最良の結果を提供し得る。
【0058】
配列ライブラリが調製されると、配列ライブラリの胎児画分は、インシリコ移動ウィンドウ分析を使用して更に処理又は富化され得る。開示の方法の目的では、「ウィンドウ」は、配列の特定のサイズ範囲を含む配列ライブラリの選択又はサブセクションである。例えば、「ウィンドウ」は、0~145ヌクレオチド、0~150ヌクレオチド、0~155ヌクレオチド、0~160ヌクレオチド、0~165ヌクレオチド、0~170ヌクレオチド、0~175ヌクレオチド、0~180ヌクレオチド、0~185ヌクレオチド、0~190ヌクレオチド、0~195ヌクレオチド、0~200ヌクレオチド、0~205ヌクレオチド、0~210ヌクレオチド、0~215ヌクレオチド、0~220ヌクレオチド、0~225ヌクレオチド、25~145ヌクレオチド、25~150ヌクレオチド、25~155ヌクレオチド、25~160ヌクレオチド、25~165ヌクレオチド、25~170ヌクレオチド、25~175ヌクレオチド、25~180ヌクレオチド、25~185ヌクレオチド、25~190ヌクレオチド、25~195ヌクレオチド、25~200ヌクレオチド、25~205ヌクレオチド、25~210ヌクレオチド、25~215ヌクレオチド、25~220ヌクレオチド、25~225ヌクレオチド、50~145ヌクレオチド、50~150ヌクレオチド、50~155ヌクレオチド、50~160ヌクレオチド、50~165ヌクレオチド、50~170ヌクレオチド、50~175ヌクレオチド、50~180ヌクレオチド、50~185ヌクレオチド、50~190ヌクレオチド、50~195ヌクレオチド、50~200ヌクレオチド、50~205ヌクレオチド、50~210ヌクレオチド、50~215ヌクレオチド、50~220ヌクレオチド、50~225ヌクレオチド、75~145ヌクレオチド、75~150ヌクレオチド、75~155ヌクレオチド、75~160ヌクレオチド、75~165ヌクレオチド、75~170ヌクレオチド、75~175ヌクレオチド、75~180ヌクレオチド、75~185ヌクレオチド、75~190ヌクレオチド、75~195ヌクレオチド、75~200ヌクレオチド、75~205ヌクレオチド、75~210ヌクレオチド、75~215ヌクレオチド、75~220ヌクレオチド、75~225ヌクレオチド、100~145ヌクレオチド、100~150ヌクレオチド、100~155ヌクレオチド、100~160ヌクレオチド、100~165ヌクレオチド、100~170ヌクレオチド、100~175ヌクレオチド、100~180ヌクレオチド、100~185ヌクレオチド、100~190ヌクレオチド、100~195ヌクレオチド、100~200ヌクレオチド、100~205ヌクレオチド、100~210ヌクレオチド、100~215ヌクレオチド、100~220ヌクレオチド、100~225ヌクレオチド、又はその間の任意の範囲である、配列ライブラリ内の配列の全てを包含し得る。ウィンドウは、特定の最大値及び最小値が設定されていない場合、「非ゲート型」と見なされ得、代わりにウィンドウは、配列ライブラリ全体を含む。
図2は、配列ライブラリ内の配列が4つのウィンドウに分割される例を示す。
【0059】
したがって、インシリコ富化の開示の方法は、配列ライブラリの少なくとも2つのウィンドウにおける配列のリード長に基づくサイズ排除を含み得、それによって、少なくとも2つの胎児画分富化配列ライブラリを得る。いくつかの実施形態では、3つ、4つ、5つ、6つ、7つ、8つ、9つ、10個、又はそれ以上のウィンドウが評価され得る。いくつかの実施形態では、少なくとも5つ、少なくとも6つ、少なくとも7つ、又は少なくとも8つのウィンドウが評価され得る。いくつかの実施形態では、ウィンドウは、同じサイズである(例えば、各ウィンドウは、0~100、5~105、10~110などのヌクレオチドの設定範囲を包含する)。いくつかの実施形態では、ウィンドウは、異なるサイズである。例えば、最小値が同じままでありながら、各追加ウィンドウのサイズが増加され得る(例えば、0~145、0~150、0~155、0~160、0~165、0~170などのサイズカットオフを有する1組のウィンドウ)。各ウィンドウにおける対立遺伝子バランスを比較することは、様々な胎児画分富化配列ライブラリ間の対立遺伝子バランストラジェクトリーの計算を可能にする。トラジェクトリーは、任意の所与の対象となる遺伝子配列の対立遺伝子バランスのパーセンテージの観察ウィンドウにわたる変化である。対立遺伝子バランストラジェクトリーは、各観察ウィンドウにおける対立遺伝子バランスの勾配として計算することができ、
図3に示されるように、いくつかの方式で視覚化することができる。
【0060】
更に、cfmDNA配列のライブラリは、100~200ヌクレオチド、105~200ヌクレオチド、110~200ヌクレオチド、115~200ヌクレオチド、120~200ヌクレオチド、125~200ヌクレオチド、130~200ヌクレオチド、135~200ヌクレオチド、140~200ヌクレオチド、140~200ヌクレオチド、145~200ヌクレオチド、150~200ヌクレオチド、155~200ヌクレオチド、160~200ヌクレオチド、165~200ヌクレオチド、170~200ヌクレオチド、若しくは175~200ヌクレオチドなどの2つの断片サイズ間、又はその間の任意のサイズ範囲の焦点分析によって富化することができる。いくつかの実施形態では、富化のために選択されるサイズ範囲は、約155~約200ヌクレオチドであり得る。
【0061】
いくつかの実施形態では、配列ライブラリの少なくとも2つのウィンドウは、(i)0~145ヌクレオチドである配列、(ii)0~150ヌクレオチドである配列、(iii)0~155ヌクレオチド、(iv)0~160ヌクレオチド、(v)0~165ヌクレオチド、(vi)0~168ヌクレオチド、(vii)0~170ヌクレオチド、(viii)0~175ヌクレオチド、(ix)0~180ヌクレオチド、(x)0~185ヌクレオチド、(xi)0~190ヌクレオチド、(xii)0~195ヌクレオチド、(xiii)0~200ヌクレオチド、及び(xiv)非ゲート型から選択される。いくつかの実施形態では、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個のウィンドウは、(i)0~145ヌクレオチドである配列、(ii)0~150ヌクレオチドである配列、(iii)0~155ヌクレオチド、(iv)0~160ヌクレオチド、(v)0~165ヌクレオチド、(vi)0~168ヌクレオチド、(vii)0~170ヌクレオチド、(viii)0~175ヌクレオチド、(ix)0~180ヌクレオチド、(x)0~185ヌクレオチド、(xi)0~190ヌクレオチド、(xii)0~195ヌクレオチド、(xiii)0~200ヌクレオチド、及び(xiv)非ゲート型から選択される。
【0062】
また、インシリコ配列ライブラリの胎児画分を富化することは、第1の配列ライブラリ内のcffDNA及びcfmDNAの配列リードを参照ゲノムと比較することによって、cffDNAを同定し、cfmDNAから分離すること、第1のライブラリからの配列リードを逆多重化すること、第1の配列ライブラリから重複配列を除去すること、又はそれらの組み合わせを更に含む。
【0063】
例えば、試料調製は、インシリコバイナリアライメント処理を含み得、短い配列決定リード間の重複を使用することによって、収集されたDNA試料が計算によって再構築することができる。配列決定リードをアラインメントさせることが可能である参照ゲノムが利用可能である場合、ゲノムの再構築を容易にすることができる。ファイルに格納された短いリードを参照ゲノムにマッピングするために、配列アラインメントツールが使用され得る。その後、特定の遺伝子配列を同定及び単離して、例えば、特定の染色体異数性及び/又は遺伝子バリアントの同定を対象とし得るフォローアップ分析に情報を提供するために、深さ及びバリアント処理が使用され得る。この方式で、非常に限られた量の最初に収集されたcfDNAを用いて、収集されたDNAの特定の部分を描写し、特定のアッセイ検出と共に使用するために組み立てることができる。
【0064】
収集されたDNA試料は、短い配列決定リード間の重複を使用することによって計算によって再構築することができる。したがって、DNA試料は、デマルチプレクサ(例えば、デマックス(demux))を使用して、最初のパスで描写され得、特定のスクリーニング(例えば、キャリア、出生前など)の評価に必要であり得る独自の分子識別子の決定を可能にする。独自の分子識別子(UMI)(時折、分子バーコード(MBC)と呼ばれる)は、特定のスクリーニングの対象となり得る所望のDNA分子を同定するための配列決定ライブラリ調製プロトコル中に、DNA断片に付加される短い配列(例えば、タグ)である。これらのタグは、任意の増幅の前に付加され、増幅によって導入される誤差及び定量的バイアスを低減するために使用することができる。
【0065】
タグ付けされると、アラインメント処理を使用して、特定のタグ付けされたDNA配列を最初にアラインメントさせて、所望のDNA配列を互いから描写することができる。次いで、重複低減(例えば、「重複排除(deduping)」)は、任意の誤った同定及び/又はミスアライメントをクリーンアップすることができ、対になった末端リードの重複部分のコンセンサス配列を保持することを含み得る。その後、再アラインメントプロセスを実施して、所望のDNA配列とタグ付けされたDNA配列との間のより堅牢な描写を生成することができる。
【0066】
その後のスクリーニングの対象となるか、又はその後のスクリーニングに望ましいものである、特定の核酸配列を単離するために、増幅が使用され得る。例えば、シリコ増幅は、所与の組のプライマー(プローブ)を使用して理論的なポリメラーゼ連鎖反応(PCR)結果を計算して、配列決定されたDNA試料からDNA配列を増幅するための計算ツールを使用して、達成することができる。増幅後、配列の開始部及び末端に存在する部分的な(例えば、不完全な)配列を除去する(例えば、トリミングする)ことによって、特定のリード配列の質を改善することができる。これを達成するための1つの例示的であるが非限定的な方法は、ペアエンド(PE)トリミングと呼ばれ、これは、部分的な配列を同定及び除去するために、(順方向リード及び逆方向リードの)2つの入力ファイル及び(順方向の対、順方向の不対、逆方向の対及び逆方向の不対リードの)4つの出力ファイルを含み得る。有用なDNA試料の再構築が容易になり得、すぐに使用できるファイルに格納することができる。更に、ファイルは、(ヌクレオチドの数の観点での)断片の長さに関して異なるビンへと描写され得る。
【0067】
深さ及びバリアント処理の一部として、特定の染色体異数性及び/又は原因となる遺伝子バリアントを対象とするフォローアップ分析に情報を提供するために、ファイルに格納された特定の遺伝子配列が同定及び単離され得る。このファイルは、最初に収集された試料のバイアスを軽減するために、特定の手順の間で使用され得る。前述のインシリコステップ及び計算による調製は、所与の試験又はスクリーニングの特定の目的では、特定のDNA配列のDNA試料を最適化することができる。
【0068】
開示のインシリコ処理は、cfDNA試料中の胎児画分を少なくとも1.1倍、1.2倍 1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.25倍、3.5倍、3.75倍、4倍、4.25倍、4.5倍、5.75倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、15倍、20倍、25倍以上富化することができる。
【0069】
代替的に、望ましい場合、開示のインシリコ処理は、より大きな断片を選択することによって、試料の母体画分を富化するためにも使用され得る。いくつかの実施形態では、開示のインシリコ処理は、cfDNA試料中の母体画分を少なくとも1.1倍、1.2倍 1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.25倍、3.5倍、3.75倍、4倍、4.25倍、4.5倍、5.75倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、15倍、20倍、25倍以上富化することができる。
【0070】
したがって、本開示は、cffDNAのインシリコ選別及び富化の方法であって、cffDNA及び無細胞DNA母体(cfmDNA)を含む無細胞DNA(cfDNA)試料を配列決定することと、リード長に基づくサイズ分析を実施することと、を含み、サイズに基づく移動ウィンドウを使用して、cfmDNAとcffDNAとの間の対立遺伝子バランスに基づいてトラジェクトリーを確立して、所与の試料中のcfmDNA又はcffDNAの遺伝子型を解明する、方法を提供する。いくつかの実施形態では、そのような方法は、cffDNA及びcfmDNAの配列リードを参照ゲノムと比較することによって、cffDNAを同定し、cfmDNAから分離することと、配列リードを逆多重化することと、重複配列を除去することと、を更に含み得る。
【0071】
C.物理的富化とインシリコ富化との組み合わせ
所与の試料の胎児画分を富化するための前述の試料調製の方法は、個々に又は組み合わせて実施することができる。物理的富化又はインシリコ富化のいずれかの前に、全cfDNAは、従来の手段によって母体試料(例えば、血液、血漿、血清)から単離され得る。例えば、全cfDNAは、APOSTLE(商標)Cell-Free DNA Extractionキットを使用して試料から得られた清澄された血漿から抽出することができる。限定されないが、Molzym GmbH&Co KG(Bremen,DE)、Qiagen(Hilden,DE)、Macherey-Nagel(Dueren,DE)、Roche(Basel,CH)、及びSigma(Deisenhofen,DE)製のキットを含む、cfDNA抽出のための他の既知の方法及び市販のキットも使用することができる。
【0072】
物理的富化及びインシリコ富化の後、更なる試験、スクリーニング、又は分析に使用される胎児画分は、DNA試料の2%、3%、4%、5%、6%、7%、8%、9%、10%、11%、12%、13%、14%、16%、17%、18%、19%、20%、21%、22%、23%、24%、25%、26%、27%、28%、29%、30%、31%、32%、33%、34%、35%、36%、37%、38%、39%、40%、41%、42%、43%、44%、45%、46%、47%、48%、49%、50%、51%、52%、53%、54%、55%、56%、57%、58%、59%、60%、61%、62%、63%、64%、65%、66%、67%、68%、69%、70%、71%、72%、73%、74%、75%、76%、77%、78%、79%、80%、85%、90%、95%、99%、又は100%であり得る。追加的又は代替的に、物理的富化及びインシリコ富化後、胎児画分は、約5%~100%、約5%~約95%、約5%~約90%、約5%~約85%、約5%~約80%、約5%~約75%、約10%~100%、約10%~約95%、約10%~約90%、約10%~約85%、約10%~約80%、約10%~約75%、約15%~100%、約15%~約95%、約15%~約90%、約15%~約85%、約15%~約80%、約15%~約75%、約20%~100%、約20%~約95%、約20%~約90%、約20%~約85%、約20%~約80%、約20%~約75%、約25%~100%、約25%~約95%、約25%~約90%、約25%~約85%、約25%~約80%、約25%~約75%、約30%~100%、約30%~約95%、約30%~約90%、約30%~約85%、約30%~約80%、約30%~約75%、約35%~100%、約35%~約95%、約35%~約90%、約35%~約85%、約35%~約80%、約35%~約75%、約40%~100%、約40%~約95%、約40%~約90%、約40%~約85%、約40%~約80%、約40%~約75%、約45%~100%、約45%~約95%、約45%~約90%、約45%~約85%、約45%~約80%、約45%~約75%、約50%~100%、約50%~約95%、約50%~約90%、約50%~約85%、約50%~約80%、及び約50%~約75%であり得る。
【0073】
したがって、本開示は、富化された胎児画分を含む無細胞DNA試料を調製する方法であって、無細胞胎児DNA(cffDNA)を保持し、無細胞母体DNA(cfmDNA)を除去するためにサイズ排除を使用してcfDNA試料を処理すること、cffDNAを同定し、cfmDNAから単離するためのインシリコ処理、又はそれらの組み合わせを含む、方法を提供する。
【0074】
III.並行スクリーニングの方法
本開示は、胎児の生物学的母親からの単一の生物学的試料(例えば、血液、血漿、血清)のみを利用して、胎児における染色体異数性及び遺伝子バリアントを評価又はスクリーニングする方法を提供する。従来、染色体異数性の試験及び遺伝子バリアントの試験は別々に実施され、複数の試料を必要とした。実際、ある特定の状態についてのスクリーニングは、生物学的試料を生物学的父親からも同様に得ることを更に必要としていた。開示の方法は、これらの問題を克服し、従来の非侵襲的出生前スクリーニング(NIPS)を改善する新しい有用な方法を提供するように機能する。
【0075】
開示の方法は、生物学的母親からの同じ単一のcfDNA試料を利用する2つの並行スクリーニング:染色体異数性を検出するための第1のスクリーニング及び遺伝子バリアントを検出するための第2のスクリーニングを含み得る。
【0076】
第1のスクリーニングでは、胎児画分を最適化して、染色体異数性状態の存在又は不在を評価するために、収集された試料の特定のサブセクション(例えば、より小さいcfDNA断片のサブセクション)が使用され得る。染色体異数性の存在又は不在は、母体及び胎児のDNAを区別することを可能にするトラジェクトリーを決定することによって確立することができる。この方式で、開示のスクリーニングは、胎児の染色体異数性及び母体の染色体異数性を同時に評価することができ、これは、以前は不可能であった。第1のスクリーニングは、追加的又は代替的に、所与の試料中に染色体異数性が存在するか又は不在であるかを決定するために、配列決定深さに依存し得る。
【0077】
第2のスクリーニングでは、胎児画分を最適化し、余分な遺伝子材料からのノイズを最小限に抑えるために、収集された試料の特定のサブセクション(例えば、より小さいcfDNA断片のサブセクション)が使用され得る。次いで、サブセクションは、例えば、トラジェクトリーを確立して、余分な試料材料から関連する試料材料を描写することによって、様々な遺伝子バリアントを検出するために使用され得る。各スクリーニングでは、無細胞母体DNA(cfmDNA)対無細胞胎児cffDNAの適切な比を含む遺伝子試料の最適なswathを使用することによって、一方のアプローチ又は他方に向けて並行スクリーニングの個々の焦点を調整することに頼る必要を伴わずに、既知の染色体異数性及び遺伝子バリアントの存在又は不在の合理的な確実性によって、検出が可能になる。
【0078】
方法は、他の生物学的試料(例えば、血漿、血清など)が企図されるが、典型的には採血を通じて、生物学的母親から試料を収集することから開始され得る。この試料は、無細胞DNA(cfDNA)を含む。cfDNAは、循環腫瘍DNA(ctDNA)、無細胞ミトコンドリアDNA(cf mtDNA)、無細胞母体DNA(cfmDNA)、及び無細胞胎児DNA(cffDNA)を含む、自由に循環する様々なDNAを含み得る。対象が妊娠中の母親であるので、ある特定のレベルの胎児DNAも、cfDNA試料中に存在するであろう。更に、特定の遺伝子配列に適した標的DNA捕捉も実施され得る。したがって、cfDNA並びに標的捕捉の両方の態様は、開示の方法の目的に用いられ得る。
【0079】
一態様では、本開示は、単一の母体試料中の染色体異数性及び少なくとも1つの遺伝子バリアントの存在又は不在を並行検出する方法であって、(i)妊婦から生物学的試料を得ることであって、生物学的試料が、無細胞DNA(cfDNA)を含む、得ることと、(ii)(例えば、cfDNA断片の標的集団を増幅することによって)cfDNAライブラリを調製することと、(iii)cfDNAライブラリを配列決定して、配列ライブラリを調製することと、(iv)単一の母体試料中の染色体異数性及び少なくとも1つの遺伝子バリアントの存在又は不在を検出することと、を含み、
(a)cfDNAライブラリを富化して、胎児画分を増加させるか、(b)配列ライブラリを富化して、胎児画分を増加させるか、又は(c)それらの組み合わせを行い、それによって、単一の母体試料の胎児画分を、少なくとも1.5倍増加させた後に、単一の母体試料中の染色体異数性及び少なくとも1つの遺伝子バリアントの存在又は不在を検出する、方法を提供する。いくつかの実施形態では、両方のcfDNAライブラリを富化して、胎児画分を増加させ、配列ライブラリを富化して、胎児画分を増加させる。以下のセクションは、富化の各形態の関連するプロセスについての更なる詳細を提供する。
【0080】
(i).生物学的試料:
開示の方法の目的では、生物学的試料は、cffDNAを含むcfDNAを含有する必要がある。開示の方法で使用するために生物学的母親から得られ得る試料の例としては、限定されないが、血液、血清、及び血漿が挙げられる。
【0081】
いくつかの実施形態では、核酸抽出は、試料中のcfDNAの増幅及びcfDNAライブラリ又は複数のcfDNAライブラリの調製の前に実施されるであろう。核酸抽出のための様々なプロトコルが、本技術の方法で使用され得る。市販の核酸精製キットの例としては、Apostle MiniMax Kit、Molzym GmbH&Co KG(Bremen,DE)、Qiagen(Hilden,DE)、Macherey-Nagel(Dueren,DE)、Roche(Basel,CH)、又はSigma(Deisenhofen,DE)が挙げられる。ポリスチレンビーズなどの支持体材料としての使用に基づく核酸精製のための他のシステムも使用され得る。QIAsymphony(登録商標)、Hamilton(登録商標)自動化、又はBiorobot(登録商標)EZ1(商標)自動化システムなどの自動化DNA抽出プラットフォームも使用され得る。
【0082】
(ii).cfDNAライブラリ調製
cfDNAライブラリ調製は、増幅の既知の方法(例えば、xGen Prism Library Prepキット(IDT(商標)))、並びにIlluminaによって製造されたCOLLIBRI(商標)、NEBNEXT(登録商標)、及びTRUSEQ(商標)キット、Rocheによって製造されたKAPA(商標)HyperPrepキット、並びにMG Techによって製造されたMGIEasyキットなどのライブラリ調製のPCRフリー方法を使用して実施することができる。任意選択で、cfDNAライブラリの調製は、末端修復のステップを含み得る。cfDNAは、所与の核酸配列の末端に対する他の損傷のオーバーハングを含み得、末端修復は、そのような損傷又は剪断されたDNAを、平滑末端分子へと変換することができ、平滑末端分子は、アダプター、タグ、又はバーコードに、より容易にライゲーションされる。試料からの核酸配列にアダプターを結合させるために、1つ以上のライゲーション反応が実装され得る。プライマーがアニールすることができる均一な配列を提供することによって増幅を促進すること、及び対象となる配列を分離することの両方に、アダプターが使用される。アダプターは、(電気泳動を介した分離及び単離を可能にするための)独自の長さ、独自の配列であり得るか、又は増幅後の標的核酸配列の単離を補助するための他の特徴を含み得る。
【0083】
所与の核酸試料の配列決定又は分析に先立って増幅されたライブラリを生成するために、PCRに基づく方法が一般的に使用されるが、しかしながら、PCRは必要とされず、当業者は、ライブラリ調製のPCRフリー方法も同様に知っているであろう。ライブラリ調製物(例えば、KAPA(商標)HiFi HotStart ReadyMix)の核酸増幅部分には、市販の試薬及びポリメラーゼを利用する様々なPCR方法が利用され得る。
【0084】
cfDNAライブラリは、本明細書に記載の、又は当業者に既知のアプローチのうちのいずれかを使用して、母体試料から調製することができる。任意選択で、AMPUREビーズを使用するライブラリ内の増幅された断片の単離などの既知の方法、又は試料からの塩、不要な巨大分子、及び他の破片の除去を可能にする他の同様の方法を使用して、cfDNAライブラリを洗浄してもよい。
【0085】
cfDNAライブラリの配列決定の前に、胎児画分は、本明細書に記載のように富化され得る。追加的又は代替的に、胎児画分は、cfDNAライブラリの調製の前に母体試料を富化してもよい。簡潔には、cfDNAライブラリ又は母体試料の胎児画分を富化することは、試料の物理的処理であり、これは、約150ヌクレオチド長、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、約180ヌクレオチド長、約185ヌクレオチド長、約190ヌクレオチド長、約195ヌクレオチド長、又は約200ヌクレオチド長よりも大きい、任意のDNA断片をcfDNAライブラリから除去することを含み得る。
【0086】
この種類のサイズに基づく排除は、電気泳動(例えば、ゲル電気泳動又はキャピラリー電気泳動)、及び例えば、ビーズ(例えば、AMPURE(商標)ビーズ)などのDNA結合粒子を利用し得る他の既知の方法を使用して、実施され得る。一実施形態では、所望の断片長の回収の前に、核酸電気泳動分離が使用される。この目的では、様々な既知の電気泳動プロセスが使用され得る。例えば、一実施形態では、高スループット核酸サイズ選択のために、Ranger Technology(商標)を備えたNIMBUS Select(商標)ワークステーションが使用され得る。別の実施形態では、BluePippin電気泳動システムが使用され得る。
【0087】
サイズに基づく排除の以前の方法が、cfDNAライブラリの胎児画分を富化するために使用されてきたが、それらの以前の方法とは異なり、本発明者らは、本明細書に記載のように、より高いカットオフ値を使用することは、更なるインシリコ選択と組み合わせるとノイズ低減を改善することができることを発見した。簡潔には、理論に拘束されないが、より許容的なサイズ選択を介してより多くの総数のcffDNA分子を保持することが理由で、ノイズは低減され得る。従来、より低いカットオフ値を使用することは、より多くの母体cfDNAを排除するので、より優れていると考えられていた。
図1は、従来のアプローチと比較した開示のサイズ排除プロセスの比較を示す。
図1に示されるように、これらのより制限的な従来の方法は、わずかでない量のcffDNAも廃棄していた。したがって、より「許容的な」サイズ排除技法を更なるインシリコ富化と組み合わせる開示のアプローチは、出生前スクリーニングの分野における重要な問題である、所与の試料内で貴重なものとして限定的な供給物であり得るcffDNAを不注意又は不必要に廃棄することなく、胎児画分の富化に具体的に対処する改善策である。
【0088】
開示のサイズに基づく排除方法は、cfDNA試料中の胎児画分を少なくとも1.1倍、1.2倍 1.25倍、1.5倍、1.75倍、2倍、2.25倍、2.5倍、2.75倍、3倍、3.25倍、3.5倍、3.75倍、4倍、4.25倍、4.5倍、5.75倍、5倍、5.5倍、6倍、6.5倍、7倍、7.5倍、8倍、8.5倍、9倍、9.5倍、10倍、15倍、20倍、25倍以上富化することができる。
【0089】
(iii).核酸ライブラリの配列決定
胎児画分を富化することができる核酸ライブラリは、既知の配列決定方法(例えば、NovaSeqシーケンサー及びフローセル、Illuminaシーケンサー、パイロ配列決定、可逆的色素ターミネータ配列決定、SOLiD配列決定、イオン半導体配列決定、Helioscope単一分子配列決定、Ion Torrent(商標)(Life Technologies、Carlsbad,CA)アンプリコン配列決定システム、454(商標)GS FLX(商標)配列決定システム、SMRT(商標)配列決定など)を使用して配列決定することができる。いくつかの実施形態では、核酸ライブラリ内のcfDNA断片は、両端から(すなわち、ペアエンドモード)配列決定される。いくつかの実施形態では、核酸ライブラリ内のcfDNA断片は、片端(すなわち、シングルエンドモード)で配列決定される。いくつかの実施形態では、核酸ライブラリ内のcfDNA断片は、ハイブリッド捕捉などの標的捕捉方法を使用して単離又は結合され得る。各断片の両端からの配列決定は、断片の長さを決定することを可能にする。いくつかの実施形態では、生じた配列を使用して、cfDNA断片をマッピングすることができる。
【0090】
いくつかの実施形態では、開示の方法は、標的捕捉方法を利用して、対象となる特定の断片のみを配列決定することができる。対象となる断片は、例えば、遺伝的疾患、状態、若しくは形質(すなわち、対象となる遺伝子バリアント)に関連する遺伝子をコードするcfDNA、又は特定の染色体に対応するcfDNAに対応し得る。
【0091】
核酸ライブラリ内のcfDNA断片が配列決定されると、配列ライブラリの胎児画分は、本明細書に記載のインシリコ移動ウィンドウ分析を使用して更に富化され得る。開示の方法の目的では、「ウィンドウ」は、配列の特定のサイズ範囲を含む配列ライブラリの選択又はサブセクションである。例えば、「ウィンドウ」は、0~145ヌクレオチド、0~150ヌクレオチド、0~155ヌクレオチド、0~160ヌクレオチド、0~165ヌクレオチド、0~170ヌクレオチド、0~175ヌクレオチド、0~180ヌクレオチド、0~185ヌクレオチド、0~190ヌクレオチド、0~195ヌクレオチド、0~200ヌクレオチド、25~145ヌクレオチド、25~150ヌクレオチド、25~155ヌクレオチド、25~160ヌクレオチド、25~165ヌクレオチド、25~170ヌクレオチド、25~175ヌクレオチド、25~180ヌクレオチド、25~185ヌクレオチド、25~190ヌクレオチド、25~195ヌクレオチド、25~200ヌクレオチド、50~145ヌクレオチド、50~150ヌクレオチド、50~155ヌクレオチド、50~160ヌクレオチド、50~165ヌクレオチド、50~170ヌクレオチド、50~175ヌクレオチド、50~180ヌクレオチド、50~185ヌクレオチド、50~190ヌクレオチド、50~195ヌクレオチド、50~200ヌクレオチド、75~145ヌクレオチド、75~150ヌクレオチド、75~155ヌクレオチド、75~160ヌクレオチド、75~165ヌクレオチド、75~170ヌクレオチド、75~175ヌクレオチド、75~180ヌクレオチド、75~185ヌクレオチド、75~190ヌクレオチド、75~195ヌクレオチド、75~200ヌクレオチド、100~145ヌクレオチド、100~150ヌクレオチド、100~155ヌクレオチド、100~160ヌクレオチド、100~165ヌクレオチド、100~170ヌクレオチド、100~175ヌクレオチド、100~180ヌクレオチド、100~185ヌクレオチド、100~190ヌクレオチド、100~195ヌクレオチド、100~200ヌクレオチド、又はその間の任意の範囲である、配列ライブラリ内の配列の全てを包含し得る。いくつかの実施形態では、開示の方法は、0~145ヌクレオチド、0~146ヌクレオチド、0~147ヌクレオチド、0~148ヌクレオチド、0~149ヌクレオチド、0~150ヌクレオチド、0~151ヌクレオチド、0~152ヌクレオチド、0~153ヌクレオチド、0~154ヌクレオチド、0~155ヌクレオチド、0~156ヌクレオチド、-157ヌクレオチド、0~158ヌクレオチド、0~159ヌクレオチド、0~160ヌクレオチド、0~161ヌクレオチド、0~162ヌクレオチド、0~163ヌクレオチド、0~164ヌクレオチド、0~165ヌクレオチド、0~166ヌクレオチド、0~167ヌクレオチド、0~168ヌクレオチド、0~169ヌクレオチド、0~170ヌクレオチド、0~171ヌクレオチド、0~172ヌクレオチド、0~173ヌクレオチド、0~174ヌクレオチド、0~175ヌクレオチド、0~176ヌクレオチド、0~177ヌクレオチド、0~178ヌクレオチド、0~179ヌクレオチド、0~180ヌクレオチド、0~181ヌクレオチド、0~182ヌクレオチド、0~183ヌクレオチド、0~184ヌクレオチド、0~185ヌクレオチド、0~186ヌクレオチド、0~187ヌクレオチド、0~188ヌクレオチド、0~189ヌクレオチド、0~190ヌクレオチド、0~191ヌクレオチド、0~192ヌクレオチド、0~193ヌクレオチド、0~194ヌクレオチド、0~195ヌクレオチド、0~196ヌクレオチド、0~197ヌクレオチド、0~198ヌクレオチド、0~199ヌクレオチド、0~200ヌクレオチド、5~145ヌクレオチド、5~146ヌクレオチド、5~147ヌクレオチド、5~148ヌクレオチド、5~149ヌクレオチド、5~150ヌクレオチド、5~151ヌクレオチド、5~152ヌクレオチド、5~153ヌクレオチド、5~154ヌクレオチド、5~155ヌクレオチド、5~156ヌクレオチド、-157ヌクレオチド、5~158ヌクレオチド、5~159ヌクレオチド、5~160ヌクレオチド、5~161ヌクレオチド、5~162ヌクレオチド、5~163ヌクレオチド、5~164ヌクレオチド、5~165ヌクレオチド、5~166ヌクレオチド、5~167ヌクレオチド、5~168ヌクレオチド、5~169ヌクレオチド、5~170ヌクレオチド、5~171ヌクレオチド、5~172ヌクレオチド、5~173ヌクレオチド、5~174ヌクレオチド、5~175ヌクレオチド、5~176ヌクレオチド、5~177ヌクレオチド、5~178ヌクレオチド、5~179ヌクレオチド、5~180ヌクレオチド、5~181ヌクレオチド、5~182ヌクレオチド、5~183ヌクレオチド、5~184ヌクレオチド、5~185ヌクレオチド、5~186ヌクレオチド、5~187ヌクレオチド、5~188ヌクレオチド、5~189ヌクレオチド、5~190ヌクレオチド、5~191ヌクレオチド、5~192ヌクレオチド、5~193ヌクレオチド、5~194ヌクレオチド、5~195ヌクレオチド、5~196ヌクレオチド、5~197ヌクレオチド、5~198ヌクレオチド、5~199ヌクレオチド、5~200ヌクレオチド、10~145ヌクレオチド、10~146ヌクレオチド、10~147ヌクレオチド、10~148ヌクレオチド、10~149ヌクレオチド、10~150ヌクレオチド、10~151ヌクレオチド、10~152ヌクレオチド、10~153ヌクレオチド、10~154ヌクレオチド、10~155ヌクレオチド、10~156ヌクレオチド、-157ヌクレオチド、10~158ヌクレオチド、10~159ヌクレオチド、10~160ヌクレオチド、10~161ヌクレオチド、10~162ヌクレオチド、10~163ヌクレオチド、10~164ヌクレオチド、10~165ヌクレオチド、10~166ヌクレオチド、10~167ヌクレオチド、10~168ヌクレオチド、10~169ヌクレオチド、10~170ヌクレオチド、10~171ヌクレオチド、10~172ヌクレオチド、10~173ヌクレオチド、10~174ヌクレオチド、10~175ヌクレオチド、10~176ヌクレオチド、10~177ヌクレオチド、10~178ヌクレオチド、10~179ヌクレオチド、10~180ヌクレオチド、10~181ヌクレオチド、10~182ヌクレオチド、10~183ヌクレオチド、10~184ヌクレオチド、10~185ヌクレオチド、10~186ヌクレオチド、10~187ヌクレオチド、10~188ヌクレオチド、10~189ヌクレオチド、10~190ヌクレオチド、10~191ヌクレオチド、10~192ヌクレオチド、10~193ヌクレオチド、10~194ヌクレオチド、10~195ヌクレオチド、10~196ヌクレオチド、10~197ヌクレオチド、10~198ヌクレオチド、10~199ヌクレオチド、10~200ヌクレオチド、15~145ヌクレオチド、15~146ヌクレオチド、15~147ヌクレオチド、15~148ヌクレオチド、15~149ヌクレオチド、15~150ヌクレオチド、15~151ヌクレオチド、15~152ヌクレオチド、15~153ヌクレオチド、15~154ヌクレオチド、15~155ヌクレオチド、15~156ヌクレオチド、-157ヌクレオチド、15~158ヌクレオチド、15~159ヌクレオチド、15~160ヌクレオチド、15~161ヌクレオチド、15~162ヌクレオチド、15~163ヌクレオチド、15~164ヌクレオチド、15~165ヌクレオチド、15~166ヌクレオチド、15~167ヌクレオチド、15~168ヌクレオチド、15~169ヌクレオチド、15~170ヌクレオチド、15~171ヌクレオチド、15~172ヌクレオチド、15~173ヌクレオチド、15~174ヌクレオチド、15~175ヌクレオチド、15~176ヌクレオチド、15~177ヌクレオチド、15~178ヌクレオチド、15~179ヌクレオチド、15~180ヌクレオチド、15~181ヌクレオチド、15~182ヌクレオチド、15~183ヌクレオチド、15~184ヌクレオチド、15~185ヌクレオチド、15~186ヌクレオチド、15~187ヌクレオチド、15~188ヌクレオチド、15~189ヌクレオチド、15~190ヌクレオチド、15~191ヌクレオチド、15~192ヌクレオチド、15~193ヌクレオチド、15~194ヌクレオチド、15~195ヌクレオチド、15~196ヌクレオチド、15~197ヌクレオチド、15~198ヌクレオチド、15~199ヌクレオチド、15~200ヌクレオチド、又はその間の任意の範囲から選択される2つ以上(例えば、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、又は10個以上)のサイズ範囲の断片を包含する2つ以上(例えば、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、又は10個以上)のウィンドウを利用し得る。いくつかの実施形態では、開示の方法は、0~約145ヌクレオチド、0~約150ヌクレオチド、0~約155ヌクレオチド、0~約160ヌクレオチド、0~約165ヌクレオチド、0~約168ヌクレオチド、0~約175ヌクレオチド、及び0~約190ヌクレオチドを含むサイズ範囲を含む少なくとも8つのウィンドウを利用し得る。いくつかの実施形態では、開示の方法は、サイズ範囲0~145ヌクレオチド、0~150ヌクレオチド、0~155ヌクレオチド、0~160ヌクレオチド、0~165ヌクレオチド、0~168ヌクレオチド、0~175ヌクレオチド、及び0~190ヌクレオチドを含む8つのウィンドウを利用し得る。
【0092】
いくつかの実施形態では、開示の方法は、約20~約145ヌクレオチド、約20~約150ヌクレオチド、約20~約155ヌクレオチド、約20~約160ヌクレオチド、約20~約165ヌクレオチド、約20~約170ヌクレオチド、約20~約175ヌクレオチド、約20~約180ヌクレオチド、約20~約185ヌクレオチド、約20~約190ヌクレオチド、約20~約195ヌクレオチド、約20~約200ヌクレオチド、約25~約145ヌクレオチド、約25~約150ヌクレオチド、約25~約155ヌクレオチド、約25~約160ヌクレオチド、約25~約165ヌクレオチド、約25~約170ヌクレオチド、約25~約175ヌクレオチド、約25~約180ヌクレオチド、約25~約185ヌクレオチド、約25~約190ヌクレオチド、約25~約195ヌクレオチド、約25~約200ヌクレオチド、約50~約145ヌクレオチド、約50~約150ヌクレオチド、約50~約155ヌクレオチド、約50~約160ヌクレオチド、約50~約165ヌクレオチド、約50~約170ヌクレオチド、約50~約175ヌクレオチド、約50~約180ヌクレオチド、約50~約185ヌクレオチド、約50~約190ヌクレオチド、約50~約195ヌクレオチド、約50~約200ヌクレオチド、約75~約145ヌクレオチド、約75~約150ヌクレオチド、約75~約155ヌクレオチド、約75~約160ヌクレオチド、約75~約165ヌクレオチド、約75~約170ヌクレオチド、約75~約175ヌクレオチド、約75~約180ヌクレオチド、約75~約185ヌクレオチド、約75~約190ヌクレオチド、約75~約195ヌクレオチド、約75~約200ヌクレオチド、約100~約145ヌクレオチド、約100~約150ヌクレオチド、約100~約155ヌクレオチド、約100~約160ヌクレオチド、約100~約165ヌクレオチド、約100~約170ヌクレオチド、約100~約175ヌクレオチド、約100~約180ヌクレオチド、約100~約185ヌクレオチド、約100~約190ヌクレオチド、約100~約195ヌクレオチド、約100~約200ヌクレオチド、又はその間の任意の範囲から選択される2つ以上(例えば、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、又は10個以上)のサイズ範囲の断片を包含する2つ以上(例えば、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、又は10個以上)のウィンドウを利用し得る。
【0093】
開示の方法の目的では、その後の分析及びトラジェクトリー計算に使用されるウィンドウは、異なるサイズであり得る(すなわち、各ウィンドウは、0~145、0~150、0~155などの異なる範囲の断片サイズを包含する)か、又はウィンドウは、同じサイズであり得る(すなわち、各ウィンドウは、異なる断片を包含するが、0~145、5~150、10~155などの設定サイズ範囲にわたる)。ウィンドウは、特定の最大値及び最小値が設定されていない場合、「非ゲート型」と見なされ得、代わりにウィンドウは、配列ライブラリ全体を含む。
図2は、どのように配列ライブラリ内の配列を6つの異なるウィンドウに分割することができるかの例を示す。
【0094】
上述のように、配列ライブラリの胎児画分を富化することは、インシリコ富化の形態であり、これは、配列ライブラリの少なくとも2つのウィンドウにおける配列のリード長に基づくサイズ排除を含み得、それによって、少なくとも2つの胎児画分富化配列ライブラリを得る。各ウィンドウにおける対立遺伝子バランスを比較することは、様々な胎児画分富化配列ライブラリ間の対立遺伝子バランストラジェクトリーの計算を可能にする。対立遺伝子バランストラジェクトリーは、任意の所与の対象となる遺伝子配列の対立遺伝子バランスのパーセンテージの観察ウィンドウにわたる変化である。対立遺伝子バランストラジェクトリーは、各観察ウィンドウにおける対立遺伝子バランスの勾配として計算することができ、
図3に示されるように、いくつかの方式で視覚化することができる。例えば、
図3の上部パネルの帯状パターンは、複数の観察ウィンドウにわたる対立遺伝子バランスの発散を示すか、又は対立遺伝子バランストラジェクトリーは、ガウス混合モデル(GMM)として視覚化することができる。各ウィンドウ(例えば、0~145、0~150、0~155など)は、他のウィンドウとは別個である関連付けられる胎児画分を有し、この胎児画分値は、
図3(上部パネル)に示されるように、トラジェクトリープロットのX軸として機能することができることが理解されるべきである。言い換えれば、
図3(上部パネル)に示されるトラジェクトリープロットの種類は、X軸(すなわち、胎児画分軸)に沿った点が、異なるウィンドウの選択によって提供される、胎児画分に対する対立遺伝子バランスの視覚化を提供する。
【0095】
対立遺伝子バランスデータがどのように視覚化されるかにかかわらず、cfDNA配列ライブラリ内のヘテロ接合型及びホモ接合型変異、又は対象となるマーカを同定するために利用することができる。例えば、対立遺伝子バランスは、y軸が、特定の遺伝子又は対象となる核酸配列の所与の対立遺伝子を有する試料中のcfDNAのパーセンテージ(例えば、0%、10%、20%、30%、40%、50%、60%)を表示し、x軸が、野生型配列、又は特定の疾患、状態、若しくは形質(例えば、嚢胞性線維症に関連付けられるCFTR遺伝子内の異なる既知の変異)に関連付けられる変異/バリアントに対応する対象となる遺伝子若しくは核酸の異なる変化を表示する、帯状パターンプロットに変換することができる。
【0096】
例として、20%の胎児画分を有する試料又はウィンドウでは、y軸上の10%の帯が、生物学的父親のDNAからのキャリアである胎児に対応することを示し得る(又は、いくつかの例では、胎児における新規変異を表し得る)。このウィンドウ内のy軸上の40%の帯は、対象となる遺伝子又は配列における変異/バリアントについて陰性(すなわち、ホモ接合型参照)である胎児に対応する。y軸上の50%の帯は、生物学的母親のDNAからのキャリアである胎児に対応するか、又は母親と父親の両方が同じ変異/バリアント(すなわち、alt対立遺伝子)を担持する場合、胎児が父親のalt対立遺伝子及び母親の参照対立遺伝子を有する可能性がある。したがって、50%の帯は、胎児及び母親が、各々1つのalt対立遺伝子を有することを示し得る。y軸上の60%の帯は、対象となる遺伝子又は配列における変異/バリアントについてホモ接合型altである(すなわち、胎児が陽性である)胎児に対応する。したがって、配列ライブラリ(すなわち、複数の胎児画分富化配列ライブラリ)の複数のウィンドウにわたる対立遺伝子バランスを分析することは、任意の追加の試料を必要とすることなく、cfDNAを含む母体試料から遺伝子バリアント/変異の不在の存在を確立するための新しい有用な方式を提供する。更に、移動ウィンドウ分析によって提供される富化の結果として、ノイズ及びバックグラウンドが顕著に低減され、これによって、非常に少量のcffDNA(例えば、全cfDNAの5%未満)を有する試料であっても、堅牢な検出が可能になる。追加的に、ウィンドウ又は試料が、20%の胎児画分を有さない場合、前述の帯は、シフト又は移動する場合があり、それぞれ、10%、40%、50%、及び60%で正確ではない場合があることが留意されるべきである。
【0097】
対立遺伝子バランストラジェクトリーを決定するために、少なくとも2つのウィンドウが必要であるが、開示の方法の目的で評価することができるウィンドウの数は、特に限定されず、複数の追加のウィンドウを含むことができる。したがって、いくつかの実施形態では、第1の配列ライブラリの少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個のウィンドウを評価し、それによって、それぞれ、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個の胎児画分富化配列ライブラリを得、その胎児画分富化配列ライブラリから、cffDNA配列が同定及び単離され得る。いくつかの実施形態では、配列ライブラリの少なくとも2つのウィンドウは、(i)0~145ヌクレオチドである配列、(ii)0~150ヌクレオチドである配列、(iii)0~155ヌクレオチド、(iv)0~160ヌクレオチド、(v)0~165ヌクレオチド、(vi)0~170ヌクレオチド、(vii)0~175ヌクレオチド、(viii)0~180ヌクレオチド、(ix)0~190ヌクレオチド、(x)0~195ヌクレオチド、(xi)0~200ヌクレオチド、及び(xii)非ゲート型から選択される。いくつかの実施形態では、少なくとも3つ、少なくとも4つ、少なくとも5つ、少なくとも6つ、少なくとも7つ、少なくとも8つ、少なくとも9つ、又は少なくとも10個のウィンドウは、(i)0~145ヌクレオチドである配列、(ii)0~150ヌクレオチドである配列、(iii)0~155ヌクレオチド、(iv)0~160ヌクレオチド、(v)0~165ヌクレオチド、(vi)0~170ヌクレオチド、(vii)0~175ヌクレオチド、(viii)0~180ヌクレオチド、(ix)0~190ヌクレオチド、(x)0~195ヌクレオチド、(xi)0~200ヌクレオチド、及び(xii)非ゲート型から選択される。
【0098】
図4は、配列ライブラリ内の胎児画分のインシリコ富化のプロセス、次いで、本明細書では「呼び出し元」とも称され得るバイオインフォマティクスアルゴリズム及び後処理を使用して、単一の試料から並行して染色体異数性及び遺伝子バリアントを同定することの1つの例示的な実施形態の概要を提供する。
【0099】
A.試料処理及び計算パイプライン
一般に、染色体異数性及び遺伝子バリアントの並行評価の開示の方法を実施するための試料処理ステップは、上のセクションII(「試料調製」)に記載のように実施することができる。更なる特徴については、ここで展開する。
【0100】
開示の方法は、配列ライブラリからの配列データを有用な出力に変換する計算パイプラインを含み得、これは、染色体異数性又は任意の遺伝子バリアントがcffDNAに存在するかどうかの決定を含む。任意選択で、提供され得る追加の有用な出力としては、限定されないが、胎児性別の決定及び他の基本的な胎児統計が挙げられる。
【0101】
計算パイプラインは、収集されたDNA試料が短い配列決定リードを使用して計算によって再構築され得る、バイナリアライメントマップ(BAM)処理を含み得る。配列決定リードをアラインメントさせることが可能である参照ゲノムが利用可能である場合、ゲノムの再構築を容易にすることができる。ファイルに格納された短いリードを参照ゲノムにマッピングするために、配列アラインメントツールが使用され得る。これによって、BAMファイルが生成され、特定の遺伝子配列が、次のステップで扱われ得る。
【0102】
計算パイプラインはまた、深さ及びバリアント処理を含み得、深さ及びバリアント処理の間に、特定の染色体異数性及び/又は遺伝子バリアントを対象とするフォローアップ分析に情報を提供するために特定の遺伝子配列が同定及び単離され得る。収集された最初のDNAの量に基づいて、収集されたDNAの特定の部分が描写され得、任意選択で、対象となる特定の配列の分析及び検出と共に使用するために組み立てられ得る。深さ及びバリアント処理ステップで描写されると、特定の呼び出し元及び後処理を使用して、染色体異数性、遺伝子バリアント、及び任意の他の出力に関する出力情報を同定し、結果レポートに組み立てることができる。結果は、一般に、母親、父親、妊娠を監督する医師(すなわち、母親の産婦人科医)、又はそれらの組み合わせに報告、送達、又は伝達される。
【0103】
BAMファイルにおけるDNA試料の深さは、特定のバイオインフォマティクスアルゴリズム(すなわち、「呼び出し手順」;以下に記載)を使用して評価することができる。使用される呼び出し元は、対象となる染色体異数性及び遺伝子バリアントの両方の存在又は不在を決定することができる。すなわち、これらの2つの目標は、同じ調製され処理されたBAMファイルを使用して、一緒に(例えば、並行した様式で)達成することができる。したがって、染色体異数性は、染色体異数性呼び出し元プログラムを使用して検出され得るが、他の遺伝子バリアントは、専用の呼び出し元プログラムを使用して並行して実行され得る。これらの計算ステップの特定の態様は、以下でより詳細に考察する。
【0104】
上述の本開示は、モジュール様式で又は統合された様式で、コンピュータソフトウェアを使用して制御ロジックの形態で実装することができることが理解されるべきである。本明細書で提供される開示及び教示に基づいて、当業者は、ハードウェア、並びにハードウェアとソフトウェアとの組み合わせを使用して、本開示を実装するための他の方式及び/又は方法を知り、理解するであろう。
【0105】
本出願に記載のソフトウェアコンポーネント、プロセス、又は機能のうちのいずれかは、例えば、従来の技法又はオブジェクト指向技法を使用して、例えば、Python、R、アセンブリ言語Java、JavaScript、C、C++、又はPerlなどの任意の好適なコンピュータ言語を使用して、プロセッサによって実行されるソフトウェアコードとして実装され得る。ソフトウェアコードは、一連の命令、又はコマンドとして、ランダムアクセスメモリ(RAM)、読み取り専用メモリ(ROM)、ハードドライブ若しくはフロッピーディスクなどの磁気媒体、又はCD-ROMなどの光学媒体などのコンピュータ可読媒体に格納され得る。任意のそのようなコンピュータ可読媒体は、単一の計算装置上又は単一の計算装置内に存在し得、システム又はネットワーク内の異なる計算装置上又は異なる計算装置内に存在し得る。
【0106】
B.染色体異数性の検出
本開示の目的では、開示の方法を使用して評価又は検出され得る染色体異数性としては、限定されないが、モノソミー(例えば、ターナー症候群)、トリソミー(例えば、ダウン症候群、エドワーズ症候群、パトウ症候群、トリソミー13、トリソミー、18、トリソミー21)、テトラソミー、ポリソミーX及び/又はY、微細欠失及び微細重複(染色体22q11.2欠失症候群など)、並びにペンタソミーが挙げられる。
【0107】
本開示は、単独で、又は配列決定深さに依存して、所与の試料中に染色体異数性が存在するか又は不在であるかを決定する、対象となる遺伝子バリアント/変異と並行してのいずれかで、染色体異数性を検出するためのシステム及び方法を提供する。本開示の目的では、「深さ」は、対象となる部位と重複する、配列決定によって得られるリードの数対ライブラリのサイズ、又は各塩基がライブラリ内で測定される平均回数の比として定義される。
【0108】
母体cfDNA試料から調製される任意の所与のライブラリで観察される深さは、胎児画分、母体コピー数、及び胎児コピー数と相関する。染色体異数性(例えば、トリソミー)が存在する場合、標的染色体における深さは、定義された、予測可能な方式で23個の染色体を有する試料とは異なるはずである。例えば、トリソミーでは、標的染色体(例えば、染色体21)における深さは、バックグラウンドと比較して増加するであろう。
図5は、この措置の基礎となる原理を図示する。
【0109】
一般に、胎児cfDNAの一部の画分(例えば、胎児画分)を含む母体試料内で染色体異数性(胎児の染色体異数性であるか、又は母体の染色体異数性であるかにかかわらず)を検出する場合、染色体異数性の存在は、既知の非染色体異数性領域又は染色体と比較して、検出可能な染色体異数性領域又は染色体異数性染色体のシフトに基づいて同定することができる。すなわち、実際の胎児画分に応じて、各断片の分析(例えば、以下の式1)は、cfDNA密度に対するcfDNA妊娠深さのプロット可能な結果をもたらすであろう。このシフトは、
図5の中央パネルに示されるように、統計的に計算することができるか又は可視化することができ、バックグラウンド深さが、染色体異数性を有さない試料の比較体又は集合体を表し、シフトした標的深さが、トリソミーを含む試料を表し、したがって、胎児における染色体異数性の存在を示す(妊娠中の母親が当該染色体異数性を呈さないと仮定する)。この偏差は、正規化された分布曲線を使用して検出可能であり、本明細書に記載の富化プロセスを介して試料の胎児画分が増加するにつれて、より顕著になるであろう。
【0110】
いくつかの実施形態では、深さ呼び出しプロット(
図5の下部パネルに示される)を使用して、シフトを視覚化及び定量化することができる。
図5の下部パネルに示されるように、所与の試料の深さ(すなわち、影付き領域)は、4つの既知のコピー数(CN)曲線(例えば、CN=1、CN=2、CN=3、及びCN=4のうちの1つ内に適合すると決定することができる。この例示的な図において、影付き分布は、CN=3曲線内に適合し、したがって、3つの染色体のコピーを有する染色体異数性(すなわち、トリソミー)の存在を示す。様々な処理ステップが、分析中に分布プロット結果を向上し、データにおけるノイズを抑制するために用いられ得る。
【0111】
いくつかの実施形態では、染色体異数性の存在又は不在を検出することは、深さトラジェクトリーを計算することを含み得る。深さトラジェクトリーは、対象となる任意の所与の遺伝子配列についてのリード深さの観察ウィンドウにわたる変化である。深さトラジェクトリーは、観察ウィンドウにわたって胎児画分に対する深さの勾配として計算することができ、
図8に示されるように、いくつかの方式で視覚化することができる。胎児画分が増加するが減少する深さトラジェクトリーは、胎児が、母親よりも少ない遺伝子(又は染色体)のコピーを有することを示すであろう。胎児画分が増加しながら一定のままである深さトラジェクトリーは、胎児及び母親が、同じコピー数の遺伝子(又は染色体)を有することを示すであろう。そして、胎児画分が増加しながら増加する深さトラジェクトリーは、胎児が、母親よりも多くの遺伝子(又は染色体)のコピーを有することを示すであろう。深さトラジェクトリーは、染色体異数性の存在又は不在を検出する目的で染色体数を決定するのに有用でありながらまた、深さトラジェクトリーは、コピー数異常などのある特定の遺伝子バリアントの存在又は不在を検出するためにも使用することができることが留意されるべきである。
【0112】
任意の所与の試料の染色体深さの分析中に、GC-バイアスを説明し、正規化することが必要であり得る。GC含有量(又はグアニン-シトシン含有量)は、(アデニン及びチミンも含む、4つの異なるものの可能性から)グアニン又はシトシンのいずれかであるDNA分子上の窒素含有塩基のパーセンテージである。高いGC含有量は、結果を歪め、高レベルのノイズをもたらし得る。例えば、
図5Cの文脈では、ノイズの増加は、データ帯の幅及び対応するコピー数仮説(黒線)を広げ、これらの分布が広くなるにつれて、真のコピー数レベルを正確に解釈することがより困難になるであろう。正しい正規化は、高ノイズ試料における深さの不一致を低減し、それによって、GCバイアスの影響を低減し、染色体異数性呼び出しを改善する。
【0113】
更に、
図6に示されるように、1)GCバイアス、2)試料バックグラウンド、及び3)ハイブリダイゼーションプローブ捕捉(適切な場合、すなわち、ハイブリッドプローブを利用する実施形態では)によって引き起こされる変動の3重の正規化制御をサンプリングデータにわたって用いて、サンプリングデータの分布プロットを改善することができる。
図6に提供されるように、分布プロットの上部の組は、正規化を用いないそのままの深さデータを示し、分布プロットの中央の組は、GCバイアス正規化を用いた後の改善された分布プロットを示し、分布プロットの下部の組は、第2の(試料バックグラウンド)及び第3の(ハイブリダイゼーションプローブ捕捉)正規化データ処理ステップを達成した後、更により改善される。したがって、3重の正規化制御は、サンプリングデータの分布プロットを改善することができ、ある特定の開示の実施形態又はある特定の試料に有用であり得る。正規化されると、これらの分布プロットは、
図7に図示されるように、存在又は不在染色体異数性についての結論を導き出すためにモデルの予想値と比較することができる。
【0114】
図7は、正規化された深さの図が、組み立てられ、任意選択で正規化された試料分布を解読するために使用することができる、染色体異数性の発生のモデル予想に適合することを示す。深さ適合モデルは、実際に組み立てられ、任意選択で正規化された分布が組み立てられた既知のモデルのうちの1つ以上と一致するかどうかを解読する比較ステップで使用するために、従来の既知の染色体異数性分布を使用して組み立てることができる。
図7に示されるように、灰色で示される正規化された深さ分布は、染色体13、18、21、及びXについて1つ、2つ、又は3つのコピー(その順序で、左から右へ)を反映する既知の分布曲線に対して設定することができる。特定の曲線適合は、最も可能性の高い胎児コピー数を選択する最大尤度を使用して決定することができる。最大尤度適合は、特定の呼び出しに対する一致をもたらすので、分析された試料内の染色体異数性の存在又は不在に関して結論を導き出すことができる。
【0115】
染色体異数性が試料において存在する場合に観察されるであろう深さにおける予測差に基づいて、染色体異数性呼び出し元は、正規分布上で染色体異数性の最も高い尤度を生成する母体及び胎児のコピー数の組を選択するように設計することができる。この目的では、所与の染色体異数性の深さを決定するために、以下の等式を開発した:
【数2】
式中、
d
pが、血漿深さであり、
fが、胎児画分であり、
c
mが、母体コピー数であり、
d
bが、バックグラウンド深さであり、
c
fが、胎児コピー数である
【0116】
この呼び出し元は、常染色体及び性染色体の染色体異数性、並びに胎児性別呼び出し値を検出するために非常に高い感度及び特異性の両方を示した。以下の実施例は、染色体異数性呼び出し元の性能に関する更なる詳細を提供する。
【0117】
本明細書に開示のスクリーニングの完了後、医師は、妊娠の健康に関する更なる洞察を提供するために更により多くの付番された染色体対を分析する、拡張染色体異数性分析(EAA)などの更なる評価を行うことを選択することができる。したがって、いくつかの実施形態では、染色体異数性の存在又は不在を決定する開示の方法は、EAAを更に含み得る。
【0118】
C.遺伝子バリアントの検出
一般に、開示の方法の一部として検出される遺伝子バリアント(例えば、遺伝子変異)は、特定の遺伝子によるか又は遺伝する疾患、状態、又は形質に関連付けられる遺伝子バリアント、マーカ、又は変異である。遺伝子バリアントとしては、単一ヌクレオチド変異(SNV)、病原性又は非病原性単一ヌクレオチド多型(SNP)、挿入及び欠失(インデル)、置換変異、又は単一遺伝子コピー数バリアントを挙げることができる。
【0119】
遺伝子バリアントは、2つ以上の疾患、状態、又は形質に関連付けられ得る。遺伝子バリアントは、野生型(すなわち、非変異又は疾患若しくは状態に非関連)の遺伝子又は遺伝子座間の少なくとも約1、2、3、4、5、6、7、8、9、10、20、30、40、50個以上の配列差などの、ポリヌクレオチドにおけるバリアントとして現れ得る。開示の方法を使用して検出することができる遺伝子バリアントの種類の非限定的な例としては、限定されないが、単一ヌクレオチド多型(SNP)、欠失/挿入多型(DIP)、微細コピー数バリアント(CNV)、短いタンデム反復(STR)、制限断片長多型(RFLP)、単一配列反復(SSR)、可変数のタンデム反復、(VNTR)、ランダム増幅多型DNA(RAPD)、増幅断片長多型、レトロトランスポゾンに基づく挿入多型、配列特異的増幅多型、及び遺伝性エピジェネティック修飾(例えば、DNAメチル化)が挙げられる。
【0120】
開示の方法の目的では、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、125、150、175、200、225、250、275、300、325、350、375、400、425、450、475、500、525、550、575、600、625、650、675、700、725、750、775、800、825、850、875、900、925、950、975、又は1000個以上の異なる遺伝子バリアントの存在又は不在が検出され得、染色体異数性の存在又は不在の検出と並行する単一のアッセイである。いくつかの実施形態では、方法は、少なくとも1、2、3、4、5、6、7、8、9、10、15、20、25、30、35、40、45、50、55、60、65、70、75、80、85、90、95、100、105、110、115、120、125、130、135、140、145、150、155、160、165、170、175、180、185、190、195、又は200個以上の疾患、状態、又は形質に関連付けられる遺伝子バリアントの存在又は不在を並行して検出することができる。
【0121】
一般に、開示の方法によって検出される種類の遺伝子バリアントの存在は、疾患、状態、又は形質を有するか、又は発症するリスクの、約1%、5%、10%、15%、20%、25%、30%、40%、50%、60%、70%、80%、90%、100%、200%、300%、400%、500%、又はそれ以上、約それ未満、又は約それ超の増加に関連付けられる。いくつかの実施形態では、遺伝子バリアントの存在は、疾患、状態、又は形質を有するか又は発症するリスクを、約1倍、2倍、3倍、4倍、5倍、6倍、7倍、8倍、9倍、10倍、25倍、50倍、100倍、500倍、1000倍、10000倍、又はそれ以上、約それ未満、又は約それ超増加させる。いくつかの実施形態では、遺伝子バリアントの存在は、約、又は約未満、約0.1、0.05、10-3、10-4、10-5、10-6、10-7、10-8、10-9、10-10、10-11、10-12、10-13、10-14、10-15、又はより小さいp値を有する増加などの、任意の統計的に有意な量で疾患、状態、又は形質を有するか又は発症するリスクを増加させる。
【0122】
本開示の目的では、遺伝子バリアントの存在又は非存在を決定することによって評価又は検出され得る遺伝的疾患としては、限定されないが、21-ヒドロキシラーゼ欠乏症、ABCC8関連高インスリン症、ARSACS、軟骨無形成症、1色覚、アデノシン一リン酸デアミナーゼ1、ニューロノパチーを伴う脳梁欠損症、アルカプトン尿症、アルファ-1-アンチトリプシン欠乏症、アルファ-マンノシドーシス、アルファ-サルコグリカノパチー、アルファ-サラセミア、アンジオテンシンII受容体I型アルツハイマー、アポリポタンパク質E遺伝子型アルツハイマー、アルギニノスクシン酸尿症、アスパルチルグリコサミン尿症、ビタミンE欠乏症を伴う運動失調症、毛細血管拡張性運動失調症、自己免疫多内分泌腺症候群1型、BRCA1遺伝性乳がん/卵巣がん、BRCA2遺伝性乳がん/卵巣がん、バルデ-ビードル症候群、Best卵黄状黄斑ジストロフィー、ベータ-サルコグリカノパチー、ベータ-サラセミア、ビオチニダーゼ欠乏症、ブラウ症候群、ブルーム症候群、CFTR関連障害、CLN3関連神経セロイド-リポフスチン症、CLN5関連神経セロイド-リポフスチン症、CLN8関連神経セロイド-リポフスチン症、カナバン病、カルニチンパルミトイルトランスフェラーゼIA欠乏症、カルニチンパルミトイルトランスフェラーゼII欠乏症、軟骨毛髪低形成症、海綿状血管奇形、脈絡膜血症、コーエン症候群、先天性白内障、顔面異形症、及び神経障害、先天性グリコシル化異常症Ia型、先天性グリコシル化異常症Ib型、先天性フィンランド型ネフローゼ症候群、クローン病、シスチン症、DFNA9(COCH)、糖尿病及び聴力損失、早期発症性一次性ジストニア(DYTI)、Herlitz-Pearson型接合部表皮水疱症、FANCC関連ファンコニ貧血、FGFR1関連頭蓋縫合早期癒合症、FGFR2関連頭蓋縫合早期癒合症、FGFR3関連頭蓋縫合早期癒合症、第V因子Leiden血栓性素因、第V R2因子変異血栓性素因、第XI因子欠乏症、第XIII因子欠乏症、家族性腺腫性ポリポーシス、家族性自律神経障害、家族性高コレステロール血症B型、家族性地中海熱、遊離シアル酸蓄積障害、パーキンソニズム-17を伴う前頭側頭型認知症、フマラーゼ欠乏症、GJB2関連DFNA3非症候群性聴力損失及び難聴、GJB2関連DFNB1非症候群性聴力損失及び難聴、GNE関連ミオパチー、ガラクトース血症、ゴーシェ病、グルコース-6-リン酸脱水素酵素欠乏症、グルタル酸血症1型、糖原病1a型、糖原病Ib型、糖原病II型、糖原病III型、糖原病V型、グレイシル症候群、HFE関連遺伝性ヘモクロマトーシス、ハルダーAIM、ヘモグロビンSベータ-サラセミア、遺伝性フルクトース不耐症、遺伝性膵炎、遺伝性チミン-ウラシル尿症、ヘキソサミニダーゼA欠乏症、有汗性外胚葉異形成症2、シスタチオニンベータ合成酵素欠乏症によって引き起こされるホモシスチン尿症、高カリウム性周期性四肢麻痺1型、高オルニチン血症-高アンモニア血症-ホモシトリン血症症候群、原発性1型高シュウ酸尿症、原発性2型高シュウ酸尿症、軟骨低形成症、低カリウム血性周期性四肢麻痺1型、低カリウム血性周期性四肢麻痺2型、低ホスファターゼ症、乳児型ミオパチー及び乳酸アシドーシス(致死的及び非致死的形態)、イソ吉草酸血症、クラッベ病、LGMD2I、レーベル遺伝性視神経障害、フランス-カナダ型リー脳症、長鎖3-ヒドロキシアシル-CoAデヒドロゲナーゼ欠乏症、MELAS、MERRF、MTHFR欠乏症、MTHFR熱不安定性バリアント、MTRNR1関連聴力損失及び難聴、MTTS1関連聴力損失及び難聴、MYH関連ポリポーシス、メープルシロップ尿症1A型、メープルシロップ尿症1B型、McCune-Albright症候群、中鎖アシル-コエンザイムA脱水素酵素欠乏症、皮質下嚢胞を伴う大頭型白質脳症、異染性白質ジストロフィー、ミトコンドリア心筋症、ミトコンドリアDNA関連リー脳症及びNARP、ムコリピドーシスIV型、ムコ多糖症I型、ムコ多糖症IIIA型、ムコ多糖症VII型、多発性内分泌腫瘍症2型、筋・眼・脳病、神経学的表現型ネマリンミオパチー、スフィンゴミエリナーゼ欠乏症に起因するニーマン-ピック病、ニーマン-ピック病C1型、ナイミーヘン染色体不安定症候群、PPT1-関連神経セロイド-リポフスチン症、PROP1関連下垂体ホルモン欠乏症、パリスター-ホール症候群、先天性パラミオトニア、ペンドレッド症候群、ペルオキシソーム二頭酵素欠乏症、広範性発達障害、フェニルアラニンヒドロキシラーゼ欠乏症、プラスミノーゲン活性化抑制因子1、常染色体劣性多発性嚢胞腎、プロトロンビンG20210A血栓性素因、偽性ビタミンD欠乏性くる病、濃化異骨症、常染色体劣性網膜色素変性症Bothnia型、レット症候群、点状軟骨異形成症1型、短鎖アシル-CoAデヒドロゲナーゼ欠乏症、シュワッハマン-ダイアモンド症候群、シェーグレン-ラルソン症候群、スミス-レムリ-オピッツ症候群、痙性対麻痺13、硫酸トランスポータ関連骨異形成症、TFR2関連遺伝性ヘモクロマトーシス、TPP1関連神経セロイド-リポフスチン症、タナトフォリック骨異形成症、トランスサイレチンアミロイドーシス、三頭酵素欠乏症、チロシン-ヒドロキシラーゼ欠乏症DRD、高チロシン血症1型、ウィルソン病、X連鎖若年網膜分離症、嚢胞性線維症、脊髄性筋萎縮症(SMA)、異常ヘモグロビン症、並びにツェルウェガー症候群スペクトラムが挙げられる。
【0123】
開示の方法の目的では、遺伝子バリアントの同定又は検出を、本明細書に記載のインシリコ移動ウィンドウ分析を使用して実施して、分析したウィンドウにわたる対立遺伝子バランス(SNP、Indel、又は他の点変異に関与する遺伝子バリアントを評価する場合)に基づいて、又は深さ(コピー数変化に関与する遺伝子バリアントを評価する場合)に基づいて、トラジェクトリーを確立することができる。この分析は、劣性の状態、形質、又は疾患を検出するのに特に有用であり得る。上述のように、このプロセスは、配列ライブラリの少なくとも2つのウィンドウにおける配列のリード長に基づくサイズ排除を含み得、それによって、少なくとも2つの胎児画分富化配列ライブラリを得る。各ウィンドウにおける対立遺伝子バランスを比較することは、様々な胎児画分富化配列ライブラリ間の対立遺伝子バランストラジェクトリーの計算を可能にする。対立遺伝子バランストラジェクトリーは、任意の所与の対象となる遺伝子配列の対立遺伝子バランスのパーセンテージの観察ウィンドウにわたる変化である。対立遺伝子バランストラジェクトリーは、観察ウィンドウにわたる対立遺伝子バランス対胎児画分の勾配として計算することができ、
図3に示されるように、いくつかの方式で視覚化することができる。
【0124】
対立遺伝子バランストラジェクトリーを利用して、cfDNAライブラリ内のヘテロ接合型及びホモ接合型変異を同定することができる。例えば、トラジェクトリーにおける単一の点は、所与のウィンドウにおける対立遺伝子バランスに基づいており、y軸が、特定の遺伝子又は対象となる核酸配列の所与の対立遺伝子を有する試料中のcfDNAのパーセンテージ(例えば、0%、10%、20%、30%、40%、50%、60%)を表示し、x軸が、野生型配列、又は特定の疾患、状態、若しくは形質(例えば、嚢胞性線維症に関連付けられるCFTR遺伝子内の異なる既知の変異)に関連付けられる変異/バリアントに対応する対象となる遺伝子若しくは核酸の異なる対立遺伝子(すなわち、参照対立遺伝子又はalt対立遺伝子)を表示する、帯状パターンプロットに変換することができる。ウィンドウ又は試料中の胎児画分が、例えば、20%であった場合、y軸上の10%の帯は、生物学的父親のDNAからのキャリア又は胎児における新規変異である胎児に対応する。y軸上の40%の帯は、対象となる遺伝子又は配列の変異/バリアントについて陰性(すなわち、ホモ接合型参照)であり、母親がヘテロ接合型(すなわち、キャリア)である胎児に対応する。y軸上の50%の帯は、生物学的母親のDNAからのキャリアである胎児に対応するか、又は母親が父親の両方が、同じalt対立遺伝子を有するキャリアである場合、生物学的父親のDNAのキャリアである胎児に対応する。y軸上の60%の帯は、対象となる遺伝子又は配列における変異/バリアントについてホモ接合型陽性である胎児に対応する。上述したように、上に論じられる帯(すなわち、10%、40%、50%、及び60%)は固定されておらず、それらの位置は、胎児画分に基づいて変動するであろう。例えば、胎児画分が、代わりに(上の例では20%とは対照的に)10%であった場合、帯の値は、それぞれ、10%、40%、50%、及び60%から5%、45%、50%、及び55%に変化する。
【0125】
対立遺伝子バランストラジェクトリーは、観察ウィンドウの各々からのこの静的情報を組み込み、必然的に異なる胎児画分を有するであろう。したがって、トラジェクトリーは、上述の20%胎児画分を含むウィンドウ、10%胎児画分を含む第2のウィンドウ、及び任意選択で、変動する胎児画分を含む1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、又は10個以上のウィンドウに依存し得る。
【0126】
追加的又は代替的に、対象となる遺伝子バリアントの特定の呼び出し元は、(染色体異数性に関して上述の)コピー数の評価、深さ分析、又は当該技術分野で既知の他の形態の検出に依存し得る。例えば、深さトラジェクトリーを使用して、特定の遺伝的疾患に全て関連付けられるSMA1、RHD、HBA1、及びHBA2のコピー数バリアントなどのコピー数バリアントの存在又は不在を検出することができる。いくつかの実施形態では、深さトラジェクトリーは、負の勾配(胎児におけるより少ないコピーを示す)、ほぼ平坦な勾配(胎児と母親との間の同じコピー数を示す)、又は正の勾配(胎児におけるより多くのコピーを示す)を有し得、そのような勾配は、変動する胎児画分を含む1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、又は10個以上のウィンドウに基づき得る。
【0127】
いくつかの実施形態では、ある特定の状態の呼び出し元は、「diffbase」の存在又は不在の検出に依存し得る。いくつかの実施形態では、ある特定の状態の呼び出し元は、野生型配列からの置換(例えば、SNV)の存在又は不在の検出に依存し得る。いくつかの実施形態では、ある特定の状態の呼び出し元は、単一ヌクレオチド多型(SNP)の存在又は不在の検出に依存し得る。いくつかの実施形態では、ある特定の状態の呼び出し元は、1つ以上の挿入又は欠失(INDEL)の存在又は不在の検出に依存し得る。複数のSNV、diffbase、SNP、又はそれらの組み合わせが、所与の状態に関連付けられる場合、たとえ少数のSNV、diffbase、SNP、INDEL、又はそれらの組み合わせ(例えば、<3、<4、<5、<6、<7、<8、<9、<10、<11、<12、<13、<14、<15)にわたって検出シグナルをプール又はマージすることは、遺伝子型間の改善された分離を提供することができる。したがって、いくつかの実施形態では、ある特定の状態の呼び出し元は、1つ、2つ、3つ、4つ、5つ、6つ、7つ、8つ、9つ、又は10個、11個、12個、13個、14個、又は15個以上のSNV、diffbase、SNP、INDEL、又はそれらの組み合わせの存在又は不在の検出に依存し得る。
【0128】
例えば、アルファサラセミアの検出において、開示の方法は、状態の最も一般的な原因であるHBA1及びHBA2の二重シス変異の存在又は不在を検出する呼び出し元を利用し得る。したがって、呼び出し元は、例えば、二重欠失領域などの対象となる領域における複数のプローブから得られたコンセンサスコピー数信号を検出することができる。
【0129】
したがって、開示の方法の利用は、単一の試料を用いて、かつ染色体異数性の検出と並行して、対象となる遺伝子バリアントを呼び出すことを可能にする。実際、この方法は、対象となる所与の遺伝子バリアントについて、胎児がホモ接合型であるかヘテロ接合型であるかを同定することさえできる。更に、母親と父親が異なるalt対立遺伝子を有するいくつかの実施形態では、胎児が、母親、父親、又は両方から特定のバリアントを得たかどうかを決定することができる。これは、母体試料から遺伝子バリアント/変異の不在の存在を確立するための新しい有用な方式である。
【0130】
D.ノイズの低減
上に説明され、実施例に更に示されるように、開示の方法及びシステムは、cfDNAデータにおけるノイズを顕著に低減することができ、遺伝子バリアント及び染色体異数性を検出するために使用されるアッセイの性能を改善する。妊婦から得られたほとんどの生物学的試料中のcffDNAのレベルの低さに起因して、従来の処理及び検出方法からの高レベルのバックグラウンドノイズは、試料を使用不能、解釈不能、又はその両方にし得る。したがって、ノイズ低減の開示の方法は、従来の非侵襲的出生前スクリーニング(NIPS)を改善する新しい有用な方法を表す。
【0131】
追加的に、本開示は、非侵襲的出生前スクリーニング(NIPS)において余分な遺伝子材料からのバックグラウンドノイズを低減する方法であって、(i)妊婦から生物学的試料を得ることであって、生物学的試料が、無細胞DNA(cfDNA)を含む、得ることと、(ii)NIPSに使用されたcfDNAを処理することであって、処理することが、無細胞胎児DNA(cffDNA)について生物学的試料を富化すること、cfDNAのインシリコ処理、又はそれらの組み合わせを含む、処理することと、を含む、方法を提供する。
【0132】
いくつかの実施形態では、ノイズを低減する方法は、無細胞胎児DNA(cffDNA)について生物学的試料を富化することと、cfDNAのインシリコ処理の両方を含む。
【0133】
ノイズを低減する目的では、cffDNAについての生物学的試料の富化は、胎児画分の物理的単離又は富化の開示の方法のうちのいずれかを含み得る。例えば、いくつかの実施形態では、cffDNAについて生物学的試料を富化することは、妊婦から無細胞DNA(cfDNA)を含む生物学的試料を得ることであって、cfDNAが、cffDNA及び無細胞母体DNA(cfmDNA)を含む、得ることと、生物学的試料からcfDNAを抽出することと、抽出されたcfDNAにサイズ排除プロセスを施すことと、を含み得、サイズ排除プロセスが、約150ヌクレオチド長、約155ヌクレオチド長、約160ヌクレオチド長、約165ヌクレオチド長、約170ヌクレオチド長、約175ヌクレオチド長、又は約180ヌクレオチド長のカットオフサイズを有し、それによって、cffDNAが富化された核酸が、生成される。
【0134】
同様に、ノイズを低減する目的では、インシリコ処理は、試料の胎児画分に遺伝子バリアント又は染色体異数性の任意の分析に焦点を当てるために、配列ライブラリ又は配列ライブラリデータの分析の開示の方法のうちのいずれかを含み得る。例えば、いくつかの実施形態では、インシリコ処理は、無細胞胎児(cffDNA)及び無細胞母体DNA(cfmDNA)を含むcfDNA試料を配列決定して、配列ライブラリを調製することと、リード長に基づく分析を実施することであって、対象となる核酸配列の対立遺伝子バランスが、配列ライブラリの少なくとも2つのウィンドウに確立される、実施することと、少なくとも2つのウィンドウの対立遺伝子バランスに基づいてトラジェクトリーを確立することと、を含み得、トラジェクトリーが、対象となる核酸配列を含む試料中に存在する対立遺伝子のパーセンテージを示す。
【0135】
ノイズ低減は、GC-バイアス、試料バックグラウンド、ハイブリダイゼーションプローブ捕捉、又はそれらの組み合わせを制御するための正規化を更に含み得る。一般に、正規化は、「中央値正規化」であり得る。言い換えれば、プローブリード深さは、同様のGC含有量を有するプローブにわたる中央値によって除算され得、次いで、母親及び胎児における推定コピー数2を有する試料及びプローブにわたって四分位平均によって除算され得る。
【0136】
バリアントを含有するDNA断片及び重複捕捉プローブは、効率的に捕捉されず、変異型対立遺伝子の対立遺伝子バランスを減少させるので、ハイブリダイゼーションプローブ捕捉に問題が生じ得る。しかしながら、捕捉バイアスは、多くの場合再現可能であり、そのような場合には、それを学習し、以下の式を使用して補正することができる:
【数3】
【0137】
ハイブリダイゼーションプローブ捕捉のための補正及び正規化は、より一般的にはバリアント呼び出しを助けることができるが、正しいインデル呼び出しを確実にするのに特に有用である。
【0138】
以下の実施例は、開示の試料調製及び方法を例示するために与えられる。しかしながら、本発明は、これらの実施例に記載の特定の実施形態又は詳細に限定されるものではないことが理解されるべきである。
【実施例】
【0139】
実施例1-染色体異数性呼び出し元の性能
開示の染色体異数性呼び出し元は、上述の配列リード深さに基づく。このアプローチの実現可能性を確立するために、110個の実現可能性試料を分析し、標準的に許容される染色体異数性検出システム(Myriad PREQUEL(商標)Prenatal Screen)に対して比較した。試料中の検出可能な染色体異数性及び各々の対照呼び出しを、以下の表に示す:
【表1】
【0140】
開示の深さに基づく分析方法は、以下の結果を提供した:
●常染色体+22qでは
○感度=100%(CI:89.95~100%)
○特異性=99.75%(CI:98.59~99.96%)
○1回の偽陽性モザイクモノソミー21呼び出し
●性染色体異数性では
○感度=100%(CI:63.06~100%)
○特異性=100%(CI:96.41~100%)
●胎児性別呼び出し
○対照試験と100%一致
【0141】
110個の試料のうち1つの試料のみが、低い深さ(0.9%の再実行率)で失敗した。
【0142】
実施例2-SNV/Indel(すなわち、遺伝子バリアント)呼び出し元の性能
本明細書に開示のSNV/インデル呼び出し元システムの性能を検証するために、5つの出生前対からの15(15)個の人工(contrived)混合物を使用した。単独で、及び集団内で高い変動性を有することが知られている一組のSNV(すなわち、dbSNP)と組み合わせて、対象となる遺伝子領域(ROI)の感度及び特異性を以下の表に示す:
【表2】
【0143】
この最初の性能は、本明細書に記載の物理的富化プロセスを使用せずに確立した。胎児画分を富化し、バリアントフィルタパラメータを最適化することは、性能を更に改善するであろうと予想される。
【0144】
追加的に、開示の単一遺伝子SNV/インデル呼び出し元は、5.8~16%のFFを有する5つの独自のcfDNA試料の性能要件を満たした。結果を以下の表に示す。
【表3】
【0145】
この性能評価では、物理的サイズ排除に基づく富化及びバイアス補正の両方を両方とも実装した場合、最良の性能が観察された。
【0146】
実施例3-SMA呼び出し元性能分析
脊髄性筋萎縮症(SMA)は、出生前スクリーニングに一般的に含まれる遺伝子的に遺伝する状態である。しかしながら、SMN1とSMN2遺伝子との間の高い程度の相同性に起因して、SMA呼び出しは困難である。これらの遺伝子は、ごくわずかな位置(最も顕著にはエクソン7)で異なり、SMAキャリア/罹患状態は、SMN1コピー数にのみ依存する。
【0147】
開示のシステムは、正しい呼び出しを確実にするために、複数の塩基(最大44のdiffbase)の存在又は不在を評価した。以下の表に示されるように、SMA呼び出し元は、非常に正確であり、感度が高く、特異的であった。
【表4】
【0148】
この評価の目的では、キャリア胎児は、健康と見なされた。
【0149】
実施例4-アルファサラセミア呼び出し元性能分析
アルファサラセミアは、ヘモグロビンの産生を低減する血液障害である。これは、出生前スクリーニングに一般的に含まれる遺伝子的に遺伝する状態である。開示のシステムは、状態の最も一般的な原因であるHBA1及びHBA2の二重シス変異の存在又は不在を評価した。より具体的には、コンセンサスコピー数シグナルは、二重欠失領域における複数のプローブから得られた。以下の表に示されるように、アルファサラセミア呼び出し元は、非常に正確であり、感度が高く、特異的であった。
【表5】
【0150】
この評価の目的では、キャリア胎児は、健康と見なされた。
【0151】
実施例5-RhD呼び出し元性能分析
妊婦がD(-)であり、胎児がD(+)である場合、母体血液が胎児血液に曝露されると、溶血性疾患が生じ得る。この状態は、一般的に出生前スクリーニングに含まれる。RhD(-)の最も一般的な原因は、RHDの全遺伝子欠失である。したがって、コピー数を評価するために、221個の信頼できるdiffbaseに基づいて呼び出し元を開発した。以下の表に示されるように、RhD呼び出し元は、非常に正確であり、感度が高く、特異的であった。
【表6】
【0152】
*****
本明細書に記載の全ての特許及び刊行物は、本開示が属する技術分野の当業者のレベルを示すものである。全ての特許及び刊行物は、各個々の刊行物が、参照により組み込まれることが具体的かつ個々に示された場合と同じ程度まで、本明細書において参照により組み込まれる。
【0153】
本技術は、本出願に記載される特定の実施形態に関して限定されるものではなく、これは本技術の個々の態様の単一の例示として意図される。当業者に明白であろうように、本技術の多くの修飾及び変形は、その趣旨及び範囲から逸脱することなく行うことができる。本明細書に列挙されるものに加えて、本技術の範囲内の機能的に等価な方法及び装置は、前述の説明から当業者には明白であろう。そのような修飾及び変形は、本技術の範囲内に入ることが意図される。本技術は、特定の方法、試薬、化合物、組成物、又はシステムに限定されず、これらは、無論、変動し得ることが理解されるものである。本明細書で使用される用語は、特定の実施形態を説明することのみを目的とし、限定することが意図されないことも理解されるものである。
【国際調査報告】