特許7467118 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ナテラ，　インコーポレイテッドの特許一覧

特許7467118核酸分子を同定するための組成物と方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】

(24)【登録日】2024-04-05

(45)【発行日】2024-04-15

(54)【発明の名称】核酸分子を同定するための組成物と方法

(51)【国際特許分類】

C12Q 1/6869 20180101AFI20240408BHJP

C12Q 1/6855 20180101ALI20240408BHJP

C12N 15/09 20060101ALI20240408BHJP

C40B 50/06 20060101ALN20240408BHJP

【ＦＩ】

C12Q1/6869 Z ZNA

C12Q1/6855 Z

C12N15/09 Z

C40B50/06

【請求項の数】 28

(21)【出願番号】P 2019530775

(86)(22)【出願日】2017-12-06

(65)【公表番号】

(43)【公表日】2019-12-19

(86)【国際出願番号】 US2017064899

(87)【国際公開番号】W WO2018106798

(87)【国際公開日】2018-06-14

【審査請求日】2020-09-17

(31)【優先権主張番号】15/372,279

(32)【優先日】2016-12-07

(33)【優先権主張国・地域又は機関】US

(73)【特許権者】

【識別番号】513156537

【氏名又は名称】ナテラ，インコーポレイテッド

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100117019

【弁理士】

【氏名又は名称】渡辺陽一

(74)【代理人】

【識別番号】100141977

【弁理士】

【氏名又は名称】中島勝

(74)【代理人】

【識別番号】100150810

【弁理士】

【氏名又は名称】武居良太郎

(74)【代理人】

【識別番号】100138210

【弁理士】

【氏名又は名称】池田達則

(72)【発明者】

【氏名】ベルンハルトジンマーマン

(72)【発明者】

【氏名】ライアンスウェナートン

(72)【発明者】

【氏名】マシューラビノビッツ

(72)【発明者】

【氏名】スティルミルシグルヨンソン

(72)【発明者】

【氏名】ジョージゲメロス

(72)【発明者】

【氏名】アプラティムギャンガリー

(72)【発明者】

【氏名】ヒマンシュセシ

【審査官】小倉梢

(56)【参考文献】

【文献】特表２０１５－５３５６８１（ＪＰ，Ａ）

【文献】Nat. Biotechnol.，2016年05月，Vol. 34, No. 5，p. 547-555

【文献】Nat. Med.，2014年，Vol. 20, No. 12，p. 1479-1484

【文献】Blood，2016年12月02日，Vol. 128, No. 22:5251

【文献】Proc. Natl. Acad. Sci. USA，2012年，Vol. 109，p. 14508-14513

【文献】Nat. Protoc.，2014年，Vol. 9，p. 2586-2606

(58)【調査した分野】(Int.Cl.，ＤＢ名)

Ｃ１２Ｑ１／００－１／７０

Ｃ１２Ｎ１５／００－１５／９０

ＪＳＴＰｌｕｓ／ＪＭＥＤＰｌｕｓ／ＪＳＴ７５８０（ＪＤｒｅａｍＩＩＩ）

ＣＡｐｌｕｓ／ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

(57)【特許請求の範囲】

【請求項1】

試料核酸分子の集団を配列決定する方法であって、前記試料核酸分子の集団は、血液試料からの循環性無細胞ＤＮＡに由来し、前記方法は、以下の工程：
試料核酸分子の集団と分子指標タグ（ＭＩＴ）のセットとを含む反応混合物を形成する工程であって、ここで前記ＭＩＴは核酸分子であり、ＭＩＴのセット中の異なるＭＩＴの数は１０～１，０００であり、試料核酸分子の集団中の試料核酸分子の総数と、ＭＩＴのセット中のＭＩＴの多様性の比は、少なくとも１，０００：１であり、前記ＭＩＴが４～８ヌクレオチドの長さであり、前記ＭＩＴのセット中の各ＭＩＴの配列が、前記セット中の他の全てのＭＩＴ配列と少なくとも２ヌクレオチド異なり、前記試料核酸分子の集団が哺乳動物試料に由来し、ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの多様性は、哺乳動物試料の供給源である哺乳動物のゲノムの複数の標的遺伝子座の各標的遺伝子座に及ぶ試料核酸分子の総数を超える、上記工程；
ＭＩＴのセットからの少なくとも１種のＭＩＴを、試料核酸分子の少なくとも５０％の試料核酸分子に結合させて、タグ付き核酸分子の集団を形成する工程であって、ここで前記タグ付き核酸分子はそれぞれ、５’末端における少なくとも１種のＭＩＴ及び３’末端における少なくとも１種のＭＩＴに結合した試料核酸セグメントを含み、そして前記タグ付き核酸分子の集団はＭＩＴのセットの各ＭＩＴの少なくとも１つのコピーを含む上記工程；
片側ＰＣＲを使用して、標的試料核酸分子を含むタグ付き核酸分子を濃縮する工程；
タグ付き核酸分子の濃縮された集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；及び、
タグ付き核酸分子のライブラリー中のタグ付き核酸分子の結合されたＭＩＴの配列と試料核酸セグメントの少なくとも一部の配列を決定し、これにより、試料核酸分子の集団を配列決定する工程、を含む方法。

【請求項2】

各タグ付き核酸分子上の少なくとも１種のＭＩＴの配列を使用して、タグ付き核酸分子を生じさせた個々の試料核酸分子を同定する工程をさらに含む、請求項１に記載の方法。

【請求項3】

前記個々の試料核酸分子を同定する前に、前記試料核酸セグメントのうちの少なくとも１つの前記決定された配列を、前記試料の供給源のゲノム内の位置にマッピングする工程と、マッピングされたゲノム位置を少なくとも１種のＭＩＴの配列と共に使用して、タグ付き核酸分子を生じさせる個々の試料核酸分子を同定する工程とをさらに含む、請求項２に記載の方法。

【請求項4】

２種のＭＩＴが各試料核酸セグメントに結合しており、反応混合物中のＭＩＴ分子の総数は試料核酸分子の総数より少なくとも２倍多く、前記ＭＩＴは少なくとも２種の異なる試料核酸分子に結合してタグ付き核酸分子の集団を形成する、請求項１に記載の方法。

【請求項5】

前記ＭＩＴが２本鎖核酸分子である、請求項１に記載の方法。

【請求項6】

各ＭＩＴがＹアダプター核酸分子のセットのＹアダプター核酸分子の一部を含み、前記セットの各Ｙアダプターは、塩基対合した２本鎖ポリヌクレオチドセグメント及び少なくとも１種の塩基対合していない１本鎖ポリヌクレオチドセグメントを含み、前記ＭＩＴ配列以外の前記セット中の各Ｙアダプター核酸分子の配列が同一であり、そして前記ＭＩＴが、前記塩基対合２本鎖ポリヌクレオチドの一部である２本鎖配列である、請求項５に記載の方法。

【請求項7】

前記２本鎖ポリヌクレオチドセグメントが５～２５ヌクレオチドの長さであり、ＭＩＴを含まず、そして１本鎖ポリヌクレオチドセグメントが５～２５ヌクレオチドの長さである、請求項６に記載の方法。

【請求項8】

前記反応混合物中のＭＩＴ分子の総数が、前記反応混合物中の試料核酸分子の総数より多く、前記少なくとも１種のＭＩＴの結合は連結反応によって行われ、前記方法は、前記配列を決定し、ハイブリッド捕捉を使用して標的試料核酸分子を含むタグ付き核酸分子を濃縮することをさらに含み、そして前記方法は、ハイブリッド捕捉後かつ配列を決定する前に、タグ付き核酸分子のライブラリーを固体支持体又は複数の固体支持体上にクローン増幅することをさらに含み、配列の決定は高スループット配列決定法を使用して行われる、請求項１に記載の方法。

【請求項9】

前記同定する工程は、前記決定された配列を使用してタグ付き核酸分子のライブラリー中の対になったＭＩＴ核酸セグメントファミリーを同定することを含み、対になったＭＩＴ核酸セグメントファミリーの各メンバー上の前記少なくとも１種のＭＩＴは同一であるか又は相補的であり、ＭＩＴ核酸セグメントファミリーの各メンバーの核酸セグメントは、試料核酸分子の集団の供給源のゲノム上の同じ座標にマッピングされ、そして対になったＭＩＴ核酸セグメントの各メンバーは、同じ個々の試料核酸分子から生成され、これにより、同じ個々の試料核酸分子から生じた増幅核酸分子が同定される、請求項２に記載の方法。

【請求項10】

試料核酸分子の集団がヒト血液又はその画分の試料に由来し、前記試料核酸分子の少なくとも一部が、目的の１つ又はそれ以上の染色体又は染色体セグメント由来の複数の標的遺伝子座のうちの少なくとも１つの標的遺伝子座を含む、請求項２に記載の方法であって、前記方法は、
前記同定された試料核酸分子を使用して、各標的遺伝子座を含む試料核酸分子の数を数えることにより、各標的遺伝子座についてＤＮＡの量を測定する工程；及び
コンピュータ上で、試料核酸分子中の各標的遺伝子座におけるＤＮＡの量を使用して、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する工程をさらに含む、上記方法。

【請求項11】

前記試料が０．５ｍｌ以下の血漿を含む、請求項１０に記載の方法。

【請求項12】

試料核酸分子の集団が循環性無細胞ヒトＤＮＡを含む試料に由来し、ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの多様性が、ヒトゲノム内の各標的遺伝子座に及ぶ試料核酸分子の総数を超え、反応混合物中のＭＩＴ分子の総数が、反応混合物中の試料核酸分子の総数より少なくとも２倍大きい、請求項１に記載の方法。

【請求項13】

高スループット配列決定法のための試料調製からの増幅エラーを同定するための、又は試料由来のタグ付き核酸分子の集団の高スループット配列決定反応における塩基呼び出しエラーを同定するための方法であって、以下の工程：
試料核酸分子の集団と分子指標タグ（ＭＩＴ）のセットとを含む反応混合物を形成する工程であって、ここで、前記試料核酸分子の集団は、血液試料からの循環性無細胞ＤＮＡに由来し、ＭＩＴは２本鎖核酸分子であり、ＭＩＴのセット中の異なるＭＩＴの数は、１０～１，０００であり、及び試料核酸分子の集団中の試料核酸分子の総数とＭＩＴのセット中のＭＩＴの多様性の比は、１，０００：１を超え、前記ＭＩＴが４～８ヌクレオチドの長さであり、前記ＭＩＴのセット中の各ＭＩＴの配列が、前記セット中の他の全てのＭＩＴ配列と少なくとも２ヌクレオチド異なり、前記試料核酸分子の集団が哺乳動物試料に由来し、ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの多様性は、哺乳動物試料の供給源である哺乳動物のゲノムの複数の標的遺伝子座の各標的遺伝子座に及ぶ試料核酸分子の総数を超える、上記工程；
ＭＩＴのセットからの少なくとも１種のＭＩＴを試料核酸分子の集団の少なくとも１種の試料核酸分子の試料核酸分子に結合させて、タグ付き核酸分子の集団を形成する工程であって、ここで前記タグ付き核酸分子はそれぞれ、５’末端における少なくとも１種のＭＩＴ及び３’末端における少なくとも１種のＭＩＴに結合した試料核酸セグメントを含み、そして前記タグ付き核酸分子の集団は、ＭＩＴのセット中の各ＭＩＴの少なくとも１つのコピーを含む上記工程；
片側ＰＣＲを使用して、標的試料核酸分子を含むタグ付き核酸分子を濃縮する工程；
前記タグ付き核酸分子の濃縮された集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；
高スループット配列決定法を使用して、前記タグ付き核酸分子のライブラリー中のタグ付き核酸分子の、結合ＭＩＴの配列と試料核酸セグメントの少なくとも一部の配列を決定する工程であって、ここで、各タグ付き核酸分子上の少なくとも１種のＭＩＴの配列は、前記タグ付き核酸分子を生じた個々の試料核酸分子を特定する上記工程；及び
同じ初期試料核酸分子に由来するタグ付き核酸分子の２５％未満に見出されるヌクレオチド配列を有する核酸セグメントを同定することにより、増幅エラーを有するタグ付き核酸分子を同定する工程、を含む方法。

【請求項14】

前記試料が、長さが５０ヌクレオチドを超えかつ５００ヌクレオチド以下であるゲノムＤＮＡの断片を含む、請求項１３に記載の方法。

【請求項15】

２種のＭＩＴが各試料核酸セグメントに結合しており、反応混合物中のＭＩＴ分子の総数が試料核酸分子の総数より少なくとも２倍多く、及び前記セット中のＭＩＴは少なくとも２種の異なる試料核酸分子に結合してタグ付き核酸分子の集団を形成する、請求項１３に記載の方法。

【請求項16】

各ＭＩＴがＹアダプター核酸分子のセットのＹアダプター核酸分子の一部を含み、前記セットの各Ｙアダプターが、塩基対合した２本鎖ポリヌクレオチドセグメントと少なくとも１種の塩基対合していない１本鎖ポリヌクレオチドセグメントとを含み、前記ＭＩＴ配列以外の、セット中の各Ｙアダプター核酸分子の配列が同一であり、そしてＭＩＴが、前記塩基対合した２本鎖ポリヌクレオチドセグメントの一部である２本鎖配列である、請求項１３に記載の方法。

【請求項17】

前記２本鎖ポリヌクレオチドセグメントが５～２５ヌクレオチドの長さであり、ＭＩＴを含まず、そして１本鎖ポリヌクレオチドセグメントが５～２５ヌクレオチドの長さである、請求項１６に記載の方法。

【請求項18】

標的個体からの又は標的個体の母親からの血液又はその画分の試料中の、標的個体からの目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する方法であって、以下の工程：
試料核酸分子の集団を核酸分子指標タグ（ＭＩＴ）のセットと反応させることにより、タグ付き核酸分子の集団を形成する工程であって、ここで、前記試料核酸分子の集団は、血液試料からの循環性無細胞ＤＮＡに由来し、前記ＭＩＴのセット中の異なるＭＩＴの数は１０～１，０００であり、前記試料核酸分子の集団中の試料核酸分子の総数と前記ＭＩＴのセット中のＭＩＴの多様性の比は、１，０００：１よりも大きく、前記ＭＩＴが４～８ヌクレオチドの長さであり、前記ＭＩＴのセット中の各ＭＩＴの配列が、前記セット中の他の全てのＭＩＴ配列と少なくとも２ヌクレオチド異なり、前記試料核酸分子の集団が哺乳動物試料に由来し、ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの多様性は、哺乳動物試料の供給源である哺乳動物のゲノムの複数の標的遺伝子座の各標的遺伝子座に及ぶ試料核酸分子の総数を超え、前記試料核酸分子の少なくともいくつかは、目的の染色体又は染色体セグメント上の複数の標的遺伝子座のうちの１つ又はそれ以上の標的遺伝子座を含み、前記タグ付き核酸分子はそれぞれ、５’末端における少なくとも１種のＭＩＴ及び３’末端における少なくとも１種のＭＩＴに結合した試料核酸セグメントを含み、そして前記試料は、１．０ｍｌ以下の血液又は１．０ｍｌ以下の血液に由来する血液の画分である工程；
片側ＰＣＲを使用して、標的試料核酸分子を含むタグ付き核酸分子を濃縮する工程；
タグ付き核酸分子の集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；
タグ付き核酸分子のライブラリー中のタグ付き核酸分子の結合ＭＩＴの配列及び試料核酸セグメントの少なくとも一部の配列を決定して、タグ付き核酸を生じた試料核酸分子の同一性を決定する工程；
決定された同一性を使用して、各標的遺伝子座を含む試料核酸分子の数を数えることにより、各標的遺伝子座についてＤＮＡの量を測定する工程；及び
コンピュータ上で、前記試料核酸分子中の各標的遺伝子座におけるＤＮＡの量を使用して、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する工程、を含む方法。

【請求項19】

標的遺伝子座の数及び試料の容量が、コピー数を決定するための所望の感度及び所望の特異性を達成し得る全標的遺伝子座に対する有効量を提供する、請求項１８に記載の方法。

【請求項20】

複数の標的遺伝子座が１，０００の標的遺伝子座を含み、前記試料が１．０ｍｌ以下の血漿を含む、請求項１９に記載の方法。

【請求項21】

反応混合物中のＭＩＴ分子の総数が前記反応混合物中の試料核酸分子の総数よりも多く、前記タグ付き核酸分子の集団が連結反応を使用して形成され、試料中の前記全標的遺伝子座は、所望の特異性及び所望の感度を満たすのに必要な全標的遺伝子座の数より少なくとも４倍大きい請求項１９に記載の方法。

【請求項22】

標的遺伝子座の数及び試料の容量が試料中に少なくとも５００，０００の全標的遺伝子座を提供し、ＭＩＴのセットが少なくとも３２のＭＩＴを含み、試料が母親由来であり、かつ母体核酸と比較して少なくとも３％の胎児核酸を含み、そして所望の特異性が９９％であり、所望の感度が９９％である、請求項１９に記載の方法。

【請求項23】

前記試料が０．５ｍｌ以下の血液であるか、又は前記試料が０．５ｍｌ以下の血液に由来する血液の画分である、請求項２２に記載の方法。

【請求項24】

長さが１０～１，０００ヌクレオチドの少なくとも５００，０００，０００の試料核酸分子の集団、ここで、前記試料核酸分子の集団は、血液試料からの循環性無細胞ＤＮＡに由来する；
長さが４から８ヌクレオチドの１０～１，０００の分子指標タグ（ＭＩＴ）のセット；及び
リガーゼ、を含む反応混合物であって、
ここで、ＭＩＴは前記試料核酸分子とは別の核酸分子であり、
前記反応混合物中の試料核酸分子の総数と前記反応混合物中のＭＩＴのセット中のＭＩＴの多様性の比は、少なくとも１０，０００：１であり、前記試料核酸分子の集団が哺乳動物試料に由来し、ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの多様性は、哺乳動物試料の供給源である哺乳動物のゲノムの複数の標的遺伝子座の各標的遺伝子座に及ぶ試料核酸分子の総数を超える、
前記ＭＩＴのセット中の各ＭＩＴの配列は、前記セット中の他の全てのＭＩＴ配列と少なくとも２ヌクレオチド異なり、そして
前記反応混合物は各ＭＩＴの少なくとも２つのコピーを含む、上記反応混合物。

【請求項25】

各ＭＩＴが２本鎖核酸アダプター分子の少なくとも一部を含む、請求項２４に記載の反応混合物。

【請求項26】

各ＭＩＴは、Ｙアダプター核酸分子のセットのＹアダプター核酸分子の一部を含み、前記セットの各Ｙアダプターは、塩基対合した２本鎖ポリヌクレオチドセグメント及び少なくとも１つの塩基対合していない１本鎖ポリヌクレオチドセグメントを含み、前記ＭＩＴ配列以外の前記セット中の各Ｙアダプター核酸分子の配列は同一であり、そして前記ＭＩＴは塩基対合した２本鎖ポリヌクレオチドセグメントの一部である２本鎖配列である、請求項２４に記載の反応混合物。

【請求項27】

前記２本鎖ポリヌクレオチドセグメントが５～２５ヌクレオチドの長さであり、ＭＩＴを含まず、そして１本鎖ポリヌクレオチドセグメントが５～２５ヌクレオチドの長さである、請求項２６に記載の反応混合物。

【請求項28】

前記反応混合物が循環性無細胞ヒトＤＮＡを含み、前記ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの数が、前記ヒトゲノム中の標的遺伝子座に及ぶ反応混合物中の試料核酸分子の総数を超え、前記反応混合物中のＭＩＴ分子の総数が、前記反応混合物中の試料核酸分子の総数より少なくとも２倍大きい、請求項２６に記載の反応混合物。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０１６年１２月７日に出願された米国特許出願第１５／３７２，２７９号の利益を主張し、前記出願は参照によりその全体が本明細書に取り込まれる。

【0002】

配列リスト
本出願は、ＡＳＣＩＩフォーマットで電子的に提出されている配列リストを含み、参照によりその全体が本明細書に取り込まれる。２０１７年１１月１４日に作製された前記ＡＳＣＩＩコピーは、Ｎ＿０１８＿ＷＯ＿０１＿ＳＬ．ｔｘｔという名前で、サイズは５，０６９バイトである。

【0003】

発明の分野
開示された本開示は、一般的に核酸を分析するための方法に関する。

【背景技術】

【0004】

次世代配列決定法は、配列決定法のスループットを大幅に向上させ、そして癌診断の改善及びダウン症候群などの障害のための非侵襲的出生前試験などの重要な現実的意味を有する配列決定法の新しい用途をもたらした。次世代配列決定法を実行するためのさまざまな技術があり、それぞれが特定のタイプのエラーに関連付けられている。さらに、これらの方法は、試料調製中に発生するエラーなどのエラーの一般的な原因を共有している。

【0005】

次世代配列決定法のための試料調製は、典型的には多数の増幅工程を含み、その各々がエラーを生じる。高スループット配列決定法のための試料調製において使用されるＰＣＲのような増幅反応は、配列決定されるライブラリーを生成するための試料中の最初の核酸の増幅、典型的には固体支持体へのライブラリーのクローン増幅、及び試料識別バーコードなどの追加情報又は機能を追加する追加の増幅反応を含み得る。増幅反応のいずれかの間にエラーが導入され、例えば増幅に使用されるポリメラーゼによる塩基の組み込み間違いにより導入され得る。特にＳＮＰ又は変異が低頻度で存在する場合、試料調製中に導入されたこれらのエラー及び配列決定反応中に発生したエラーを、実際の及び有益なＳＮＰと又は初期試料中に存在する変異と区別することは困難であり得る。さらに、各ヌクレオチドでの塩基呼び出しが、通常は低いシグナル強度及び／又は周囲の核酸配列により引き起こされるエラーを導入する可能性もある。

【0006】

試料調製によって引き起こされるエラーを特定するためのいくつかの既知の方法がある。１つの方法は、試料核酸セグメントが同じ分子から又は同じ核酸分子の異なるコピーから複数回読み取られるように、より大きな配列決定深度を得ることである。これらの複数のリード（read）を整列させ、コンセンサス配列を生成することができる。しかし核酸分子の集団における低頻度のＳＮＰ又は突然変異は、増幅又は塩基呼び出しの間に導入されたエラーと同様に見えるであろう。これらのエラーを同定するための別の方法は、配列決定される前に各核酸分子が独特の識別子を組み込むように核酸分子をタグ付けすることを含む。同一にタグ付きされた核酸分子からの配列決定結果はプールされ、そしてこれらのプールされた結果からのコンセンサス配列は、試料からの核酸の真の配列である可能性が高い。同一にタグ付けされた核酸分子のいくつかが異なる配列を有する場合、増幅エラーを同定することができる。

【0007】

これらの従来の方法にもかかわらず、特に哺乳動物ｃＤＮＡ又は循環性ＤＮＡ試料などのゲノム試料を含む複雑な試料を分析するために、非常に有効で容易に製造可能な核酸分子をタグ付けする方法のためのパラメーターの有利な組み合わせを発見する必要がある。多くの従来技術の方法は、多数の独特の識別子の生成を必要とし、またより長い独特の識別子に対する必要性ももたらし得る。そのような方法における反応混合物は、試料核酸分子に対して大過剰の独特の識別子が存在するように設計されている。そのような独特の識別子のライブラリーを作製するための高コストに加えて、独特の識別子の長さを増加させることは、ほとんどの次世代配列決定機のすでに制限された読み取り長で読み取ることができる試料核酸配列の量を減少させる。予言的にすぎないこともある他の従来技術の開示では、目的領域のコピー数に対する識別子の多様性又は任意の２つの識別子の多様性、試料核酸分子の総数に対する識別子の多様性、及び試料核酸分子の総数に対する識別子の総数などの組合せについては、パラメータの詳細な組合せは存在しない。これは、哺乳動物の血液中の循環性遊離ＤＮＡなどの断片化ゲノム試料を含む、ｃＤＮＡ又はゲノム試料などの複雑で自然から単離された試料に特に当てはまる。

【発明の概要】

【発明が解決しようとする課題】

【0008】

低コストのタグ付け方法、及び自然から分離された複雑な試料をタグ付けするための重要なパラメータの組み合わせの特定に対する必要性が依然として存在する。そのような方法は、例えば、特に複雑で臨床的に重要な試料の分析において高スループット配列決定法ワークフローにおいて使用されるときに、増幅及び塩基呼び出しエラーを検出するために有益となるであろう。

【0009】

（発明の概要）
本開示は、試料核酸分子の集団の増幅後に、個々の試料核酸から生じる増幅生成物を同定するために、分子指標タグ（「ＭＩＴ」）を使用して核酸分子をタグ付けするための、改良された方法及び組成物を提供する。さらに、試料核酸分子の配列を決定し、試料調製又は塩基呼び出しの間に生じたエラーを同定し、そして染色体又は染色体セグメントのコピー数を決定するために、ＭＩＴを使用する方法が本明細書で提供される。さらに、試料核酸分子とＭＩＴの反応混合物を含む組成物と、タグ付き核酸分子の集団と、ＭＩＴのライブラリーと、ＭＩＴを使用してタグ付き核酸分子を生成するためのキットとが本明細書に提供される。従って本開示は、試料調製及び塩基呼び出しの間に、特に高スループット配列決定ワークフローの間に導入されるエラーを、出発試料中の核酸分子中に存在する実際の差異から区別するための方法及び組成物を提供する。

【0010】

従って１つの態様において、以下の工程を含む、試料核酸分子の集団を配列決定するための方法が本明細書で提供される：
試料核酸分子の集団と分子指標タグ（ＭＩＴ）のセットとを含む反応混合物を形成する工程であって、ここで前記ＭＩＴは核酸分子であり、ＭＩＴのセット中の異なるＭＩＴの数は１０～１，０００であり、試料核酸分子の集団中の試料核酸分子の総数と、ＭＩＴのセット中のＭＩＴの多様性の比又はＭＩＴのセット中の任意の２種のＭＩＴの多様性の比は、少なくとも５００：１、１，０００：１、１０，０００：１、又は１００，０００：１である上記工程；
ＭＩＴのセットからの少なくとも１種のＭＩＴを、試料核酸分子の少なくとも５０％の試料核酸セグメントに結合させて、タグ付き核酸分子の集団を生成する工程であって、ここで前記少なくとも１種のＭＩＴは、各タグ付き核酸分子上の試料核酸セグメントに対して５’及び／又は３’に位置し、前記タグ付き核酸分子の集団はＭＩＴのセットの各ＭＩＴの少なくとも１つのコピーを含む上記工程；
タグ付き核酸分子の集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；及び、
タグ付き核酸分子のライブラリー中のタグ付き核酸分子の結合されたＭＩＴの配列と試料核酸セグメントの少なくとも一部の配列を決定し、こうして試料核酸分子の集団を配列決定する工程。反応混合物中のＭＩＴ分子の総数は、典型的には反応混合物中の試料核酸分子の総数よりも大きい。

【0011】

いくつかの実施態様において本方法は、各タグ付き核酸分子上の少なくとも１種のＭＩＴの配列を使用してタグ付き核酸分子を生じさせた個々の試料核酸分子を同定する工程を含むことができる。いくつかの実施態様において本方法は、個々の試料核酸分子を同定する前に、試料核酸セグメントの少なくとも１つの決定された配列を、試料が由来する供給源のゲノム内の位置にマッピングする工程と、マッピングされたゲノム位置を少なくとも１種のＭＩＴの配列と共に使用して、タグ付き核酸分子を生じさせる個々の試料核酸分子を同定する工程とをさらに含むことができる。さらに、そのような実施態様において、核酸セグメント内の又は核酸セグメントの対立遺伝子内の突然変異を同定することができる。

【0012】

いくつかの実施態様において、前記試料はヒト試料などの哺乳動物試料でもよく、そして試料は例えば血液試料であり得る。ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの多様性は、哺乳動物試料の供給源である哺乳動物のゲノムの複数の標的遺伝子座の各標的遺伝子座に及ぶ試料核酸分子の総数を超えることができる。

【0013】

いくつかの実施態様において、前記ＭＩＴは連結反応中に結合することができる。いくつかの実施態様において、タグ付き核酸分子はハイブリッド捕捉を使用して濃縮することができる。いくつかの実施態様において、濃縮されたタグ付き核酸分子は、配列が高スループット配列決定法を使用して決定される前に、固体支持体又は複数の固体支持体上にクローン的に増幅され得る。

【0014】

いくつかの実施態様において本方法は、試料核酸の少なくともいくつかが、目的の染色体又は染色体セグメントからの複数の標的遺伝子座のうちの少なくとも１つの標的遺伝子座を含む試料を使用することを含むことができる。いくつかの実施態様において本方法は、同定された試料核酸分子を使用して、各標的遺伝子座を含む試料核酸分子の数を数えることにより、各標的遺伝子座についてＤＮＡの量を測定する工程、及び、コンピュータ上で試料核酸分子中の各標的遺伝子座におけるＤＮＡの量を使用して、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する工程を、さらに含むことができる。

【0015】

いくつかの実施態様において、前記試料は、循環性腫瘍ＤＮＡを含む循環性無細胞ヒトＤＮＡを含むことができ、ＭＩＴのセット中の任意の２種のＭＩＴの組合せの多様性は、ヒトゲノム中の標的遺伝子座に及ぶ循環性無細胞ＤＮＡ断片又は試料核酸分子の総数を超える。

【0016】

別の態様において、高スループット配列決定法のための試料調製から増幅エラーを同定するための、又は試料由来のタグ付き核酸分子の集団の高スループット配列決定反応における塩基呼び出しエラーを同定するための方法が提供され、この方法は以下の工程を含む：
試料核酸分子の集団と分子指標タグ（ＭＩＴ）のセットとを含む反応混合物を形成する工程であって、ここでＭＩＴは２本鎖核酸分子であり、ＭＩＴのセット中の異なるＭＩＴの数は、１０～１００、２５０、５００、１，０００、２，０００、２，５００、又は５，０００であり、及び試料核酸分子の集団中の試料核酸分子の総数とＭＩＴのセット中のＭＩＴの多様性の比は、５００：１、１，０００：１、１０，０００：１、又は１００，０００：１を超える上記工程；
ＭＩＴのセットからの少なくとも１種のＭＩＴを試料核酸分子の集団の少なくとも１種の試料核酸分子の試料核酸セグメントに結合させて、タグ付き核酸分子の集団を生成する工程であって、ここで前記少なくとも１種のＭＩＴは、各タグ付き核酸分子上の試料核酸セグメントに対して５’及び／又は３’に位置し、そして前記タグ付き核酸分子の集団は、ＭＩＴのセット中の各ＭＩＴの少なくとも１つのコピーを含む上記工程；
前記タグ付き核酸分子の集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；
高スループット配列決定法を使用して、前記タグ付き核酸分子のライブラリー中のタグ付き核酸分子の、結合ＭＩＴの配列と試料核酸セグメントの少なくとも一部の配列を決定する工程であって、ここで、各タグ付き核酸分子上の少なくとも１種のＭＩＴの配列は、前記タグ付き核酸分子を生じた個々の試料核酸分子を特定する上記工程；及び
同じ初期試料核酸分子に由来するタグ付き核酸分子の２５％未満に見出されるヌクレオチド配列を有する核酸セグメントを同定することにより、増幅エラーを有するタグ付き核酸分子を同定する工程。前記反応混合物中のＭＩＴ分子の総数は、典型的には反応混合物中の試料核酸分子の総数よりも大きい。

【0017】

いくつかの実施態様において本方法は、長さが２０ヌクレオチドを超えかつ１，０００ヌクレオチド以下であるか、又は５０ヌクレオチドを超えかつ５００ヌクレオチド以下であるゲノムＤＮＡの断片を有する試料をさらに含むことができ、ここで、ＭＩＴのセット中の任意の２種のＭＩＴの組み合わせの多様性は、ゲノム中の標的遺伝子座に及ぶＤＮＡ断片又は試料核酸分子の総数を超える。いくつかの実施態様において本方法は、例えば母親の血液試料に対して使用することができ、ここで、コピー数の決定は非侵襲的出生前試験のためのものである。いくつかの実施態様において本方法は、癌に罹患しているか又は癌に罹患していると疑われる個体からの血液試料に対して使用することができる。

【0018】

別の態様において、標的個体からの又は標的個体の母親からの血液又はその画分の試料中の、標的個体からの目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する方法が本明細書で提供され、この方法は以下の工程を含む：
試料核酸分子の集団を核酸分子指標タグ（ＭＩＴ）のセットと反応させることにより、タグ付き核酸分子の集団を生成する工程であって、ここで、前記ＭＩＴのセット中の異なるＭＩＴの数は、１０～１０，０００又は１０～１，０００であり、前記試料核酸分子の集団中の試料核酸分子の総数と前記ＭＩＴのセット中のＭＩＴの多様性の比は、５００：１、１，０００：１、１０，０００：１、又は１００，０００：１よりも大きく、前記試料核酸分子の少なくともいくつかは、目的の染色体又は染色体セグメント上の複数の標的遺伝子座のうちの１つ又はそれ以上の標的遺伝子座を含み、そして前記試料は、１．０ｍｌ以下の血液又は１．０ｍｌ以下の血液に由来する血液の画分である工程；
濃縮されたタグ付き核酸分子の集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；
タグ付き核酸分子のライブラリー中のタグ付き核酸分子の結合ＭＩＴの配列及び試料核酸セグメントの少なくとも一部の配列を決定して、タグ付き核酸を生じた試料核酸分子の同一性を決定する工程；
決定された同一性を使用して、各標的遺伝子座を含む試料核酸分子の数を数えることにより、各標的遺伝子座についてＤＮＡの量を測定する工程；及び、
コンピュータ上で、前記試料核酸分子中の各標的遺伝子座におけるＤＮＡの量を使用して、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する工程。反応混合物中のＭＩＴ分子の総数は、典型的には反応混合物中の試料核酸分子の総数よりも大きい。

【0019】

いくつかの実施態様において、標的遺伝子座の数及び試料の容量は、コピー数決定のための所望の感度と特異性を達成するための有効量の全標的遺伝子座を提供する。いくつかの実施態様において本方法は、標的遺伝子座の数及び標的遺伝子座に及ぶ試料核酸分子の総数を使用して、コピー数決定のための所望の感度と特異性を達成するための有効量の全配列決定リードを提供する工程をさらに含み得る。いくつかの実施態様において、これは少なくとも１０、２５、５０、１００、２５０、５００、１，０００、１，５００、２，０００、２，５００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１，００００、１５，０００、２，００００、２５，０００、３０，０００、４０，０００、又は５０，０００の標的遺伝子座であり得る。いくつかの実施態様において本方法は、試料中に少なくとも１０，０００、１００，０００、５００，０００、又は１，０００，０００の全標的遺伝子座を含むことができ、ここで、ＭＩＴのセットは少なくとも２５、３０、３２、５０、６４、１００、２００、２５０、５００、又は１，０００のＭＩＴを含み、ここで、試料は母親からのものであり、母親の核酸と比較して少なくとも１％、２％、３％、４％、又は５％の胎児核酸を含み、所望の特異性は９５％、９６％、９７％、９８％、又は９９％であり、所望の感度は９５％、９６％、９７％、９８％、又は９９％である。

【0020】

いくつかの実施態様において本方法は、タグ付き核酸分子の集団を生成するための連結反応を含むことができ、ここでタグ付き核酸分子の集団は増幅前にハイブリッド捕捉を使用して濃縮され、試料中の全標的遺伝子座の数は、所望の特異性及び所望の感度を満たすのに必要な全標的遺伝子座の数より少なくとも４、５、６、７、８、９、１０、１５、又は２０倍大きい。

【0021】

いくつかの実施態様において本方法は、各標的遺伝子座におけるＤＮＡの量を使用して、目的の１つ又はそれ以上の染色体又は染色体セグメントについてのコピー数仮説のセットから各コピー数仮説の確率を決定し、最も高い確率のコピー数仮説を選択する工程をさらに含むことができる。

【0022】

いくつかの実施態様において本方法は、試料核酸分子上で二染色体性であると予想される１つ又はそれ以上の染色体又は染色体セグメントからの複数の二染色体性遺伝子座を使用して、複数の標的遺伝子座におけるＤＮＡの量を二染色体性遺伝子座におけるＤＮＡの量と比較することにより、各コピー数仮説の確率を決定する工程を含み得る。

【0023】

いくつかの実施態様において本方法は、コピー数の決定が非侵襲的出生前検査のためのものである母親の血液試料に使用することができる。いくつかの実施態様において本方法は、癌に罹患している又は癌に罹患していると疑われる個体からの血液試料に対して使用することができる。

【0024】

本明細書に提供される別の態様は、以下を含む反応混合物である：長さが１０、２０、２５、５０、又は１００と２００、２５０、５００、１，０００、２，０００、又は２，５００ヌクレオチドとの間の、少なくとも１００，０００、２００，０００、２５０，０００、５００，０００、又は１，０００，０００の試料核酸分子の集団；範囲の下端の３、４、５、６、又は７ヌクレオチドの長さと、範囲の上端の８、９、１０、１１、１２、１５、又は２０ヌクレオチドの長さとの間の、１０と１００、２００、２５０、５００、１，０００、又は１０，０００との間の分子指標タグ（ＭＩＴ）のセット；及び、リガーゼ、ここで、ＭＩＴは試料核酸分子から分離した核酸分子であり、反応混合物中のＭＩＴ分子の総数は、反応混合物中の試料核酸分子の総数よりも多く、反応混合物中の試料核酸分子の総数と反応混合物中のＭＩＴのセット中のＭＩＴの多様性の比は、少なくとも１，０００：１、１０，０００：１、又は１００，０００：１であり、ＭＩＴのセット中の各ＭＩＴの配列は、そのセット中の他の全てのＭＩＴ配列とは少なくとも２ヌクレオチド異なり、そして、反応混合物は各ＭＩＴの少なくとも２つのコピーを含む。

【0025】

別の態様において本開示は、標的個体からの血液又はその画分の試料中の目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する方法であって、以下の工程を含む方法が提供される：
試料由来の試料核酸分子の集団と少なくとも３２の分子指標タグ（ＭＩＴ）のセットとを含む反応混合物を生成する工程であって、ＭＩＴのセット中の各ＭＩＴは異なる核酸配列を含む２本鎖核酸分子であり、試料は１．０ｍｌ以下の血液に由来し、試料核酸分子の集団中の試料核酸分子の総数とＭＩＴのセット中のＭＩＴの多様性の比は１，０００：１より大きく、そして試料核酸分子の少なくともいくつかは、目的の染色体又は染色体セグメント上に少なくとも１，０００の標的遺伝子座のうちの１つ又はそれ以上の標的遺伝子座を含む上記工程；
ＭＩＴのセットからの少なくとも２種のＭＩＴを試料核酸分子の集団の各試料核酸分子の試料核酸セグメントに結合させて、タグ付き核酸分子の集団を生成する工程であって、少なくとも２種のＭＩＴのそれぞれは、各タグ付き核酸分子上の試料核酸セグメントに対して５’及び／又は３’に位置し、そしてタグ付き核酸分子の集団は、ＭＩＴのセットの各ＭＩＴの少なくとも１種のコピーを含む上記工程；
タグ付き核酸分子の集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；
タグ付き核酸分子のライブラリー中のタグ付き核酸分子の結合されたＭＩＴの配列及び試料核酸セグメントの少なくとも一部の配列を決定する工程であって、各タグ付き核酸分子上の結合されたＭＩＴの配列及び核酸セグメントの少なくとも一部の配列を使用して、同じ対になったＭＩＴ核酸セグメントファミリーに属するタグ付き核酸分子を同定し、対になったＭＩＴ核酸セグメントファミリーの各メンバー上の少なくとも２種のＭＩＴは同一であるか又は相補的であり、ＭＩＴ核酸セグメントファミリーの各メンバーの核酸分子セグメントは、試料核酸分子の集団の供給源のゲノム上の同じ座標にマッピングされ、そして、試料核酸分子の少なくとも２５％は、その配列が決定されるタグ付き核酸分子のライブラリー中に表される上記工程；
試料核酸分子について、各標的遺伝子座に及ぶＭＩＴ核酸セグメントファミリーの数を数えることにより、各標的遺伝子座のＤＮＡ量を決定する工程；及び
試料核酸分子中の各標的遺伝子座におけるＤＮＡ量を使用して、コンピュータ上で、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する工程。反応混合物中のＭＩＴ分子の総数は、典型的には反応混合物中の試料核酸分子の総数よりも大きい。ＭＩＴ核酸セグメントファミリーは、核酸セグメントに対する同じ相対位置、ならびに同じ断片末端位置及び同じ配列方向（ヒトゲノムに対して正又は負）で、同一のＭＩＴを共有する。ＭＩＴライブラリー調製プロセスに入った各試料核酸分子は、２つのファミリー（１つを正又は負の配向のそれぞれにマッピングすることができる）を生成することができる。ＭＩＴ核酸セグメントファミリーが、同じ核酸セグメントに対して同じ相対位置及び相補的断片末端位置に相補的ＭＩＴを含む場合、２種のＭＩＴ核酸セグメントファミリーを対にすることができ、一方は正の配向を有し、他方は負の配向を有する。いくつかの実施態様において、対になったＭＩＴ核酸セグメントファミリーを使用して、試料核酸分子中の配列の違いの存在を確認することができる。

【0026】

いくつかの実施態様において本方法は、１つ又はそれ以上の染色体又は染色体セグメント上の１つ又はそれ以上の標的遺伝子座について、単一ヌクレオチド多型遺伝子座を分析することをさらに含むことができる。さらなる実施態様において、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する前に、各遺伝子座に異なる対立遺伝子を含む試料核酸分子の比率を、各遺伝子座に各対立遺伝子を含むＭＩＴ核酸セグメントファミリーの数を数えることによって推定することができ、各遺伝子座に異なる対立遺伝子を含む試料核酸分子の推定比を使用して、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定することができる。

【0027】

いくつかの実施態様において本方法は、循環性無細胞ヒトＤＮＡの試料を含むことができ、ここで、前記ＭＩＴのセット中の任意の２種のＭＩＴの可能な組み合わせの多様性が、ヒトゲノム中の１つ又はそれ以上の標的遺伝子座に及ぶ反応混合物中の循環性無細胞ＤＮＡ断片又は試料核酸分子の数を超える。

【0028】

いくつかの実施態様において本方法は、二染色体性であると予想される染色体又は染色体セグメント上の複数の二染色体性遺伝子座を分析することをさらに含むことができ、ここで前記方法は、試料核酸分子について、各二染色体性遺伝子座に及ぶＭＩＴ核酸セグメントファミリーの数を数えることにより、各二染色体性遺伝子座についてＤＮＡ量を決定することをさらに含み、及び目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定することは、各標的遺伝子座についてＤＮＡ量及び各二染色体性遺伝子座についてＤＮＡ量を使用する。

【0029】

いくつかの実施態様において本方法は、コンピュータ上で、目的の染色体又は染色体セグメントの異なる可能な倍数性状態にそれぞれ関連する複数の倍数性仮説を作製することと、コンピュータ上で、各標的遺伝子座についてＤＮＡ量を使用して、各倍数性仮説の相対確率を決定して、最大の確率で仮説に対応する倍数性状態を選択することにより個体のコピー数を特定することをさらに含み得る。

【0030】

いくつかの実施態様において本方法は、コピー数の決定が非侵襲的出生前試験のためのものである母体試料に対して使用することができる。いくつかの実施態様において本方法は、癌に罹患しているか又は癌に罹患していると疑われる個体からの試料に対して使用することができる。

【0031】

別の態様において、標的個体からの血液又はその画分の試料中の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する方法が本明細書で提供され、この方法は以下の工程を含む：
試料核酸分子の集団と分子指標タグ（ＭＩＴ）のセットとを反応させることにより、タグ付き核酸分子の集団を生成する工程であって、ここで、試料は２．５、２．０、１．０、又は０．５ｍｌ以下であり、ＭＩＴのセット中の異なるＭＩＴの数は、１０～１００、２００、２５０、５００、１，０００、２，０００、２，５００、５，０００、又は１０，０００の間であり、試料核酸分子の集団中の試料核酸分子の総数とＭＩＴのセット中のＭＩＴの多様性の比は、少なくとも１００：１、５００：１、１，０００：１、１０，０００：１、又は１００，０００：１であり、各タグ付け核酸分子は、核酸分子の集団からの核酸セグメントに対して、５’及び３’に位置する１又は２種のＭＩＴ、例えばそれぞれ５’及び３’に位置する２種のＭＩＴを含み、試料核酸分子の一部は、目的の染色体又は染色体セグメント上の複数の遺伝子座のうちの１つ又はそれ以上の標的遺伝子座を含む上記工程；
タグ付き核酸分子の集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程；
タグ付き核酸分子のライブラリー中の、タグ付き核酸分子の結合ＭＩＴの配列及び試料核酸セグメントの少なくとも一部の配列を決定する工程、例えば少なくとも１０、２０、３０、４０、５０、６０、７０、８０、９０、又は９５％、又は１００％の配列を決定する工程であって、各タグ付き核酸分子上の結合ＭＩＴの配列及び核酸セグメントの少なくとも一部の配列を使用して、同じ対になったＭＩＴ核酸セグメントファミリーに属するタグ付き核酸分子を同定し、対になったＭＩＴ核酸セグメントファミリーの各メンバー上の少なくとも２種のＭＩＴは同一又は相補的であり、及びＭＩＴ核酸セグメントファミリーの各メンバーの核酸分子セグメントは試料核酸分子の集団の供給源のゲノム上の同じ座標にマッピングされる上記工程；
試料核酸分子について、各標的遺伝子座に及ぶＭＩＴ核酸セグメントファミリーの数を数えることにより、各標的遺伝子座についてＤＮＡ量を決定する工程：そして
コンピュータ上で、試料核酸分子中の各標的遺伝子座におけるＤＮＡ量を使用して、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する工程。
反応混合物中のＭＩＴ分子の総数は、典型的には、反応混合物中の試料核酸分子の総数よりも大きい。

【0032】

いくつかの実施態様において本方法は、コンピュータ上で、目的の染色体又は染色体セグメントの異なる可能な倍数性状態にそれぞれ関連する複数の倍数性仮説を作製する工程と、コンピュータ上で、各標的遺伝子座についてＤＮＡ量を使用して各倍数性仮説の相対確率を決定して、最大の確率で仮説に対応する倍数性状態を選択することによって個体のコピー数を特定する工程をさらに含み得る。

【0033】

【0034】

別の態様において、長さが１０～１，０００ヌクレオチドの５００，０００，０００～１，０００，０００，０００，０００の間の試料核酸分子の集団と、長さが４～８ヌクレオチドの１０～１，０００分子指標タグ（ＭＩＴ）のセットと、リガーゼとを含む反応混合物が本明細書に提供され、ここで、ＭＩＴは核酸分子であり、前記反応混合物中の試料核酸分子の総数とＭＩＴのセット中のＭＩＴの多様性の比は１，０００：１～１，０００，０００：１であり、前記ＭＩＴのセット中の各ＭＩＴの配列は、前記セット中の他の全てのＭＩＴ配列と少なくとも２ヌクレオチド異なり、そして、そのセットは各ＭＩＴの少なくとも２つのコピーを含む。

【0035】

いくつかの実施態様において本方法は、インビトロで増幅されていない試料核酸分子を使用することをさらに含み得る。いくつかの実施態様において本方法は、コピー数の決定が非侵襲的出生前試験のためのものである母体試料に対して使用することができる。いくつかの実施態様において本方法は、癌に罹患しているか又は癌に罹患していると疑われる個体からの試料に対して使用することができる。

【0036】

別の態様において、以下を含む反応混合物が本明細書に提供される：５００，０００，０００～５，０００，０００，０００，０００の試料核酸分子の集団；及び試料核酸分子の内部配列に結合するように設計された配列を有するプライマーのセット、ここで、プライマーは１０～５００のＭＩＴのセットからの分子指標タグ（ＭＩＴ）をさらに含み、ＭＩＴは、長さが４～８ヌクレオチドの核酸分子であり、反応混合物中の試料核酸分子の多様性と反応混合物中のＭＩＴのセット中のＭＩＴの多様性の比は、１０，０００：１～１，０００，０００：１であり、そしてＭＩＴのセット中のＭＩＴのそれぞれの配列は、そのセット中の他の全てのＭＩＴ配列とは少なくとも２ヌクレオチド異なる。

【0037】

いくつかの態様において本方法は、試料核酸分子の総数よりも多くのプライマーを反応混合物中に有することをさらに含み得る。

【0038】

別の態様において、長さが１０～１，０００ヌクレオチドの５００，０００，０００～５，０００，０００，０００，０００の異なるタグ付き核酸分子を含むタグ付き核酸分子の集団が本明細書に提供され、ここでタグ付き核酸分子のそれぞれは、試料核酸セグメントに対して５’及び／又は３’に位置する少なくとも１種の分子指標タグ（ＭＩＴ）を含み、前記少なくとも１種のＭＩＴは、長さがそれぞれ４～２０ヌクレオチドの１０～５００の異なるＭＩＴのセットのメンバーであり、タグ付き核酸分子の集団は、ＭＩＴのセットの各メンバーを含み、集団の少なくとも２つのタグ付き核酸分子は、少なくとも１つの同一のＭＩＴと、５０％以上異なる試料核酸セグメントとを含み、集団中の試料核酸セグメントの数とＭＩＴの数との比は、１，０００：１～１，０００，０００，０００：１である。

【0039】

いくつかの実施態様において、タグ付き核酸分子の集団は、ポリメラーゼ又はリガーゼをさらに含む反応混合物の一部であり得る。様々な実施態様において、核酸分子の集団を使用してライブラリーを作製することができ、ここでライブラリーは、範囲の下端の、核酸分子の集団のいくつか又は全ての１、２、３、４、５、６、７、８、９、１０、２５、５０、１００、２５０、５００、及び１，０００コピーから、範囲の上端の、核酸分子の集団のいくつか又は全ての３、４、５、６、７、８、９、１０、２５、５０、１００、２５０、５００、１，０００、２，５００、５，０００、及び１０，０００コピーまでを含む。いくつかの態様において、ライブラリーは、同一の配列を有するＭＩＴと、範囲の下端の５０％、６０％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、及び９９．９の同一性から、範囲の上端の６０％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、及び１００％まで同一性である試料核酸セグメントとを有する、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、２５、５０、１００、２５０、５００、又は１，０００のタグ付き核酸分子を含むことができる。様々な実施態様において、ライブラリーは、同一の配列を有するＭＩＴと、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０、又は２５ヌクレオチドの差を有する試料核酸セグメントとを有する、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、２５、５０、１００、２５０、５００、又は１，０００のタグ付き核酸分子を含むことができる。いくつかの実施態様において、核酸分子のライブラリーは、固体支持体又は複数の固体支持体上にクローン的に増幅され得る。

【0040】

別の態様において、タグ付き核酸分子の集団が本明細書で提供され、この集団は、少なくとも１種の分子指標タグ（ＭＩＴ）を、長さが５０～５００ヌクレオチドの試料核酸セグメントを含む５００，０００，０００～５，０００，０００，０００，０００の試料核酸分子の集団に結合させて、試料核酸セグメントに対して５’及び／又は３’に位置する少なくとも１種のＭＩＴを含むタグ付き核酸分子を形成することを含む方法により形成され、ここでＭＩＴは核酸分子であり、ＭＩＴはそれぞれ長さが４～２０ヌクレオチドの１０～５００の異なるＭＩＴのセットのメンバーであり、タグ付き核酸分子の集団はＭＩＴのセットの各メンバーを含み、集団の少なくとも２つのタグ付き核酸分子は、少なくとも１つの同一のＭＩＴと５０％超の差がある試料核酸セグメントとを含み、そして、集団中の試料核酸分子セグメントの多様性とＭＩＴのセット中のＭＩＴの多様性の比は、１，０００：１～１，０００，０００，０００：１である。

【0041】

別の態様において、リガーゼを含む第１の容器と分子指標タグ（ＭＩＴ）のセットを含む第２の容器とが本明細書で提供され、ここで、ＭＩＴのセット中の各ＭＩＴは、Ｙアダプター核酸分子のセットのＹアダプター核酸分子の一部を含み、前記セットの各Ｙアダプターは、塩基対合した２本鎖ポリヌクレオチドセグメント及び少なくとも１つの塩基対合していない１本鎖ポリヌクレオチドセグメントを含み、ＭＩＴ配列以外の前記セット中のＹアダプター核酸分子のそれぞれの配列は同一であり、ＭＩＴは、塩基対合した２本鎖ポリヌクレオチドセグメントの一部である２本鎖配列であり、ＭＩＴのセットは１０～５００のＭＩＴを含み、ＭＩＴは４～８ヌクレオチドの長さであり、ＭＩＴのセット中のＭＩＴのそれぞれの配列は、そのセット中の他の全てのＭＩＴ配列とは少なくとも２ヌクレオチド異なる。本キットはさらにポリメラーゼを含むことができる。

【0042】

本明細書に開示されるいくつかの実施態様において、本開示は反応混合物を提供し、ここで、試料核酸分子の集団を適切な条件下でＭＩＴのセットと組み合わされて、ＭＩＴを核酸分子又は核酸分子の核酸セグメントに結合され、タグ付き核酸分子の集団が生成されている。本明細書に開示されるいくつかの実施態様において、タグ付き核酸分子の集団は、例えば高スループット配列決定用試料調製ワークフローの一部であり得る増幅によって処理して、高スループット配列決定などの下流の分析に使用することができる。ＭＩＴは直接連結を介して、又はＰＣＲプライマーなどの増幅の一部として結合させることができる。典型的には、ＭＩＴはプライマーの配列特異的結合領域に対して５’にあるが、プライマーは、ユニバーサル結合領域と配列特異的結合領域の間にあるように設計することができるか、又はＭＩＴは配列特異的結合領域の内部にあり、試料核酸分子とのハイブリダイゼーションの際にループを形成する。いくつかの実施態様においてＭＩＴは前進プライマー上に存在して、プライマーを用いた増幅により、標的遺伝子座に対して５’にＭＩＴを有するタグ付き核酸分子を生成するようにすることができる。いくつかの実施態様においてＭＩＴは逆進プライマー上に存在して、プライマーを用いた増幅により、標的遺伝子座に対して３’にＭＩＴを有するタグ付き核酸分子を生成するようにすることができる。いくつかの実施態様においてＭＩＴは、前進プライマー及び逆進プライマーの両方の上に存在して、プライマーを用いた増幅により、標的遺伝子座に対して５’及び３’の両方にＭＩＴを有するタグ付き核酸分子を生成するようにすることができる。

【0043】

本明細書に開示されるいくつかの実施態様において、ＭＩＴは１本鎖又は２本鎖核酸分子であり得る。いくつかの実施態様において、ＭＩＴの配列はＭＩＴのセット中の他の全てのＭＩＴの配列と、少なくとも１、２、３、４、５、６、７、８、９、又は１０ヌクレオチドだけ異なり得る。いくつかの実施態様において、ＭＩＴのセット中のＭＩＴは典型的には同じ長さである。他の実施態様において、ＭＩＴのセット中のＭＩＴは異なる長さである。本明細書に開示される実施態様のいずれにおいても、ＭＩＴの長さは、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、又は３０ヌクレオチドの長さである。

【0044】

いくつかの実施態様においてＭＩＴは、Ｙアダプター、又は１本鎖オリゴヌクレオチド、又は２本鎖核酸の少なくとも一部、例えば２本鎖アダプターであり得る。いくつかの実施態様においてＭＩＴは、Ｙアダプター核酸分子のセットのＹアダプター核酸分子の一部でもよく、そのセットの各Ｙアダプターは、塩基対合した２本鎖ポリヌクレオチドセグメント及び少なくとも１つの塩基対合していない１本鎖ポリヌクレオチドセグメントを含み、ＭＩＴ配列以外のそのセット中の各Ｙアダプター核酸分子の配列は同一であり、そしてＭＩＴは、塩基対合した２本鎖ポリヌクレオチドセグメントの一部である２本鎖配列である。いくつかの実施態様において、２本鎖ポリヌクレオチドセグメントは、範囲の下端の５、１０、１５、及び２０ヌクレオチドの長さと、範囲の上端の１０、１５、２０、２５、３０、３５、４０、４５、及び５０ヌクレオチドの長さとの間であり、ＭＩＴを含まず、そして１本鎖ポリヌクレオチドセグメントは、範囲の下端の５、１０、１５、及び２０ヌクレオチドの長さと、範囲の上端の１０、１５、２０、２５、３０、３５、４０、４５、及び５０ヌクレオチドの長さとの間であり得る。いくつかの実施態様においてＭＩＴは、範囲の下端の３、４、５、６、７、８、９、１０、又は１５ヌクレオチドの長さと、範囲の上端の５、６、７、８、９、１０、１５、２０、２５、又は３０ヌクレオチドの長さとの間であり得る。本明細書に開示されるいくつかの実施態様において、ＭＩＴは、試料核酸分子、ユニバーサルプライマー結合配列、及び／又はアダプター配列、特に高スループット配列決定法に有用なアダプター配列に結合するように設計された配列をさらに含むオリゴヌクレオチドの一部であり得る。いくつかの実施態様において、オリゴヌクレオチドの全長は、範囲の下端の１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、又は１００ヌクレオチドの長さと、範囲の上端の２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、又は１００ヌクレオチドの長さとの間であり得る。いくつかの実施態様において、１つ又はそれ以上のＭＩＴは試料核酸分子に結合することができる。例えばいくつかの態様において、少なくとも１、２、３、４、５、６、７、８、９、又は１０のＭＩＴが試料核酸分子に結合することができる。本明細書に開示されるいくつかの実施態様において、ＭＩＴは、試料核酸分子の一部又は全部であり得る試料核酸セグメントに対して５’及び／又は３’に結合することができる。いくつかの実施態様において、２種のＭＩＴを個々の試料核酸分子、例えば各試料核酸分子に結合させることができ、各タグ付き核酸分子は、核酸分子の集団からの核酸セグメントに対してそれぞれ５’及び３’に位置する２種のＭＩＴを含む。

【0045】

本明細書に開示されるいくつかの実施態様において試料核酸分子は、任意の他のインビトロ増幅を行う前に、反応混合物中で使用することができる。いくつかの実施態様において、核酸分子の集団中の試料核酸分子の総数は、範囲の下端の１００、２５０、５００、１，０００、２，５００、５，０００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００、５００，０００、１×１０⁶、２．５×１０⁶、５×１０⁶、１×１０⁷、１×１０⁸、１×１０⁹、及び１×１０¹⁰の試料核酸分子と、範囲の上端の５００、１，０００、２，５００、５，０００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００、５００，０００、１×１０⁶、２．５×１０⁶、５×１０⁶、１×１０⁷、１×１０⁸、１×１０⁹、１×１０¹⁰、１×１０¹¹、及び１×１０¹²の試料核酸分子との間であり得る。本明細書に開示されるいくつかの実施態様において、反応混合物中の試料核酸分子の総数は、ＭＩＴのセット中のＭＩＴの多様性よりも大きくてもよい。例えば、試料核酸分子の総数とＭＩＴのセット中のＭＩＴの多様性の比は、少なくとも２：１、１０：１、１００：１、１，０００：１、５，０００：１、１０，０００：１、２５，０００：１、５０，０００：１、１００，０００：１、２５０，０００：１、５００，０００：１、１，０００，０００：１、５，０００，０００：１、１０，０００，０００：１、１×１０⁸：１、１×１０⁹：１、１×１０¹⁰：１、又はそれ以上であり得る。いくつかの実施態様において、結合ＭＩＴの可能な組み合わせの多様性は、標的遺伝子座に及ぶ反応混合物中の試料核酸分子の総数よりも大きくてもよい。例えば、結合ＭＩＴの可能な組み合わせの多様性（例えば、試料核酸分子に結合したＭＩＴの数応じた２、３、４、５などの任意の組み合わせ）と標的遺伝子座に及ぶ試料核酸分子の総数の比は、少なくとも１．０：１、１．１：１、１．５：１、２：１、３：１、４：１、５：１、６：１、７：１、８：１、９：１、１０：１、１５：１、２０：１、２５：１、５０：１、１００：１、５００：１、又は１，０００：１であり得る。いくつかの実施態様においてＭＩＴのセット中のＭＩＴは、少なくとも２、３、４、５、６、７、８、９、１０、２５、５０、１００、２５０、５００、１，０００、２，５００、５，０００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００、５００，０００、１×１０⁶、２．５×１０⁶、５×１０⁶、１×１０⁷、１×１０⁸、１×１０⁹、１×１０¹⁰、１×１０¹¹、又は１×１０¹²の異なる試料核酸分子に結合して、タグ付き核酸分子の集団を生成することができる。

【0046】

本明細書に開示されるいくつかの実施態様において、少なくとも１、２、３、４、５、６、７、８、９、１０、２５、５０、１００、２５０、５００、１，０００、２，５００、５，０００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００、５００，０００、１×１０⁶、２．５×１０⁶、５×１０⁶、１×１０⁷、１×１０⁸、１×１０⁹、１×１０¹⁰、１×１０¹¹、及び１×１０¹²の試料核酸分子は、反応混合物中に結合ＭＩＴを有することができる。いくつかの実施態様において、反応混合物中の少なくとも１％、２％、３％、４％、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％の試料核酸分子は、結合ＭＩＴを有することができる。

【0047】

本明細書に開示されるいくつかの実施態様において、反応混合物は、試料核酸分子よりも多くのＭＩＴ分子を含み得る。例えばいくつかの実施態様において、反応混合物中のＭＩＴ分子の総数は、反応混合物中の試料核酸分子の総数の少なくとも２、３、４、５、６、７、８、９、又は１０倍であり得る。ある点でこの倍数差は、付加されるＭＩＴの数に依存する。例えば、２つのＭＩＴが結合される場合、反応混合物中のＭＩＴ分子の総数は、反応混合物中の試料核酸分子の総数よりも少なくとも２倍多くなり得る。３種のＭＩＴが結合される場合、反応混合物中のＭＩＴ分子の総数は、反応混合物中の試料核酸分子の総数よりも少なくとも３倍多くなり得る、などである。いくつかの実施態様において、反応混合物中の同一配列を有するＭＩＴの総数と反応混合物中の核酸分子の総数の比は、範囲の下端の０．１：１、０．２：１、０．３：１、０．４：１、０．５：１、１：１、１．５：１、２：１と、範囲の上端の０．３：１、０．４：１、０．５：１、１：１、１．５：１、２：１、３：１、４：１、５：１、６：１、７：１、８：１、９：１、及び１０：１との間であり得る。

【0048】

いくつかの実施態様において、タグ付き核酸分子の集団中の結合ＭＩＴ及び核酸セグメントの配列は、配列決定法、特に高スループット配列決定法によって決定することができる。いくつかの実施態様において、タグ付き核酸分子は、配列決定のために、特に固体支持体又は複数の固体支持体上でクローン的に増幅することができる。いくつかの実施態様において、タグ付き核酸分子上のＭＩＴの決定された配列を使用して、特に本明細書に開示された核酸セグメントの末端又は断片特異的挿入体末端の配列を使用して、タグ付き核酸分子が由来する試料核酸分子を同定することができる。いくつかの実施態様において、タグ付き核酸分子上の核酸セグメントの決定された配列を使用して、タグ付き核酸分子が由来する試料核酸分子の同定を助けることができる。いくつかの実施態様において、核酸セグメントの決定された配列は、試料核酸分子の供給源のゲノム内の位置にマッピングすることができ、この情報は同定を助けるために使用することができる。

【0049】

いくつかの実施態様において、範囲の下端の１００、２５０、５００、１，０００、２，５００、５，０００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００、５００，０００、１×１０⁶、２．５×１０⁶、５×１０⁶、１×１０⁷、１×１０⁸、１×１０⁹、及び１×１０¹⁰のタグ付き核酸と、範囲の上端の５００、１，０００、２，５００、５，０００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００、５００，０００、１ｘ１０⁶、２．５ｘ１０⁶、５ｘ１０⁶、１ｘ１０⁷、１ｘ１０⁸、１ｘ１０⁹、１ｘ１０¹⁰、１ｘ１０¹¹、１ｘ１０¹²との間のタグ付き核酸分子を同定することができる。いくつかの実施態様において、１つの試料核酸分子の２つの鎖に由来するタグ付き核酸分子を同定し、それを使用して、対になったＭＩＴファミリーを生成することができる。典型的には１本鎖核酸分子が配列決定される下流の配列決定反応において、ＭＩＴファミリーは、同一の又は相補的なＭＩＴ配列を有するタグ付き核酸分子を同定することにより、同定することができる。これらの実施態様において、対になったＭＩＴファミリーを使用して、試料核酸分子中の配列の違いの存在を確認することができる。いくつかのさらなる実施態様において、核酸セグメントの決定された配列を使用して、相補的又は同一のＭＩＴ及び核酸セグメント配列を有する対になったＭＩＴ核酸セグメントファミリーを生成することができる。これらの実施態様において、対になったＭＩＴ核酸セグメントファミリーを使用して、試料核酸分子中の配列の違いの存在を確認することができる。

【0050】

いくつかの実施態様において、特定の標的遺伝子座を有するタグ付き核酸分子を濃縮することができる。いくつかの実施態様において、片側又は両側ＰＣＲを使用して、１つ又はそれ以上の染色体上のこれらの標的遺伝子座を濃縮することができる。いくつかの実施態様において、ハイブリッド捕捉を使用することができる。いくつかの実施態様において、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、５０、１００、２５０、５００、１，０００、２，５００、５，０００、１０，０００、１５，０００、又は２０，０００の標的遺伝子座と、範囲の上端の５、６、７、８、９、１０、１５、２０、２５、５０、１００、２５０、５００、１，０００、２，５００、５，０００、１０，０００、１５，０００、２０，０００、２５，０００、５０，０００、１００，０００、及び２５０，０００の標的遺伝子座との間を濃縮の標的とすることができる。いくつかの実施態様において、標的遺伝子座は、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、及び１００ヌクレオチドの長さと、範囲の上端の１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、５００、及び１，０００ヌクレオチドの長さとの間であり得る。いくつかの実施態様において、異なる試料核酸分子上の標的遺伝子座は、少なくとも５０％、６０％、７０％、８０％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％同一であるか、又は少なくとも５０％、６０％、７０％、８０％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％の配列同一性を共有することができる。

【0051】

本明細書に開示されるいくつかの実施態様において、試料は哺乳動物由来であり得る。いくつかの実施態様において、試料はヒト由来、特にヒト血液又はその画分の試料由来であり得る。開示された実施態様のいずれにおいても、試料は、０．１、０．２、０．２５、０．５、１、１．２５、１．５、１．７５、２、２．５、３、３．５、４、４．５、又は５ｍｌ未満の血液又は血漿であり得る。本明細書に開示されるいくつかの実施態様において、試料は循環性無細胞ヒトＤＮＡを含み得る。いくつかの実施態様において、循環性無細胞ヒトＤＮＡを含む試料は、母親由来でもよく、そして母親及び胎児のＤＮＡを含み得る。いくつかの実施態様において、試料は、循環性無細胞ヒトＤＮＡを含む試料は、癌を有するか又は癌を有することが疑われる人からの血液試料でもよく、そして正常及び腫瘍ＤＮＡを含み得る。

【0052】

本開示の他の特徴及び利点は、以下の詳細な説明及び特許請求の範囲から明らかとなろう。

【図面の簡単な説明】

【0053】

【図1】連結を用いた核酸分子又は核酸セグメントへの２つのＭＩＴの結合を示す概略図である。出現の順に、それぞれ配列番号１～２、２、２、１、３～４、４、及び３を開示する。

【図2】ＭＩＴ配列を含有するプライマーを用いたＰＣＲを使用する、核酸分子又は核酸セグメントへの２つのＭＩＴの取り込みを示す概略図である。出現の順に、それぞれ配列番号５～６、６、５、７～８、８、７、及び９～１４を開示する。

【図3】本明細書で提供される異なる例示的方法によって作成されたアンプリコンの構造を示す。片面ＳＴＡＲの後に生成されたアンプリコン（図３Ａ）は片側にＭＩＴを有し、ＭＩＴの最初の塩基は、片面ＳＴＡＲがどのように行われるかに応じたリード（Read）１又はリード２の最初の塩基である。図３Ａでは、ＭＩＴの最初の塩基はリード１の最初の塩基であろう。ハイブリッド捕捉後に生成されたアンプリコン（図３Ｂ）は、アンプリコンの両側にＭＩＴを有し、リード１の最初の塩基はＭＩＴ１の最初の塩基であり、リード２の最初の塩基はＭＩＴの最初の塩基である。

【図4】ＭＩＴを用いた配列決定実験の結果を示す表である。

【図5】３つの異なる実験における２つの試料の、平均エラー率及び対になったＭＩＴ核酸セグメントファミリーの平均エラー率を示す棒グラフである（図４からのデータ）。

【0054】

上記に特定された図は、限定としてではなく例示として提供されている。

【0055】

（発明の詳細な説明）
本開示は、本明細書中で分子指標タグ（ＭＩＴ）と呼ばれるオリゴヌクレオチドタグを含む方法及び組成物に関し、このタグは、配列決定反応のための試料処理後に、核酸分子の集団から個々の試料核酸分子（すなわち集団のメンバー）を同定するために、試料由来の核酸分子の集団に結合される。いくつかの実施態様において配列決定反応は、試料核酸分子に由来するタグ付き核酸分子に対して行われる高スループット配列決定反応である。独特の識別子に関し、試料中の試料核酸分子の数よりも大きい独特の識別子の多様性を有して、各試料核酸分子を独特の識別子でタグ付けすることを教示する先行技術の方法とは異なり、本開示は典型的には、ＭＩＴのセット中のＭＩＴの多様性よりも多くの試料核酸分子を含む。実際、本明細書の方法及び組成物は、ＭＩＴのセット中の各異なるＭＩＴについて１，０００超、１×１０⁶超、１×１０⁹超、又はさらにそれ以上の出発分子を含むことができる。それでもなおこの方法は、増幅後にタグ付き核酸分子を生じさせる個々の試料核酸分子を同定することができる。

【0056】

本明細書の方法及び組成物において、ＭＩＴのセットの多様性は、有利には標的遺伝子座に及ぶ試料核酸分子の総数よりも小さいが、ＭＩＴのセットを使用した結合ＭＩＴの可能な組み合わせの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数よりも大きい。典型的には、ＭＩＴのセットの同定能力を向上させるために、少なくとも２種のＭＩＴが試料核酸分子に結合されてタグ付き核酸分子を形成する。配列決定読み取りから決定された結合ＭＩＴの配列を使用して、配列決定反応のための試料調製中に、異なる固体支持体又は固体支持体の異なる領域に結合した同じ試料核酸分子のクローン的に増幅した同一コピーを同定することができる。タグ付き核酸分子の配列を編集し、比較し、そして使用して、増幅中に生じたヌクレオチド変異を、最初の試料核酸分子中に存在していたヌクレオチドの差異から区別することができる。

【0057】

本開示におけるＭＩＴのセットは、典型的には試料核酸分子の総数よりも小さい多様性を有するが、多くの従来の方法は、独特の識別子の多様性が試料核酸分子の総数よりも大きい「独特の識別子」のセットを利用した。しかし本開示のＭＩＴは、標的遺伝子座に及ぶ試料核酸分子の総数よりも大きいＭＩＴのセットを使用して、結合ＭＩＴの可能な組み合わせの多様性を含むことにより、十分な追跡力を保持する。本開示のＭＩＴのセットにこのより小さい多様性は、追跡タグのセットを生成及び／又は取得することに関連するコスト及び製造の複雑さを著しく低減する。反応混合物中のＭＩＴ分子の総数は典型的には試料核酸分子の総数より大きいが、ＭＩＴのセットの多様性は試料核酸分子の総数よりはるかに小さく、これが従来技術の方法よりも、実質的にコストを下げ製造を単純にする。従ってＭＩＴのセットは、範囲の下端の３、４、５、１０、２５、５０、又は１００という小さい異なるＭＩＴと、範囲の上端の１０、２５、５０、１００、２００、２５０、及び１，０００のＭＩＴの多様性との間の多様性を含むことができる。従って本開示では、ＭＩＴのこの比較的低い多様性は、試料核酸分子の総数よりもはるかに小さいＭＩＴの多様性をもたらし、これは、全試料核酸分子よりも大きい反応混合物中のＭＩＴの総数、及び標的遺伝子座に及ぶ試料核酸分子の数よりもＭＩＴのセットの任意の２種のＭＩＴの可能な組み合わせにおいて、より大きな多様性と組合せると、及び標的遺伝子座に及ぶ試料核酸分子の数より大きいＭＩＴのセットの任意の２種のＭＩＴの可能な組合せの大きい多様性と組合せると、費用効率が高く、自然から単離された複雑な試料で非常に有効である特に有利な実施態様を提供する。さらに、配列決定された核酸分子をゲノムにマッピングすることにより、参照ゲノムと比較して、より単純な分析及び試料核酸分子の配列に関する同定情報などのさらなる利点が提供される。

【0058】

例示的方法の簡単な説明
従って１つの態様において、試料核酸分子の集団から個々の試料核酸分子を同定するために配列決定を使用することを場合によりさらに含み得る、試料核酸分子の集団を配列決定する方法が本明細書で提供される。いくつかの実施態様において、核酸分子の集団は、ＭＩＴを結合する前にインビトロで増幅されておらず、１×１０⁸～１×１０¹³、又はいくつかの実施態様において１×１０⁹～１×１０¹²、又は１×１０¹⁰～１×１０¹²の試料核酸分子を含み得る。いくつかの実施態様において本方法は、核酸分子の集団及びＭＩＴのセットを含む反応混合物を形成することを含み、ここで、核酸分子の集団中の核酸分子の総数はＭＩＴのセット中のＭＩＴの多様性より大きく、少なくとも３種のＭＩＴがそのセット内にある。いくつかの実施態様において、ＭＩＴのセットを使用した結合ＭＩＴの可能な組み合わせの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数よりも多く、集団中の試料核酸分子の総数よりも小さい。いくつかの実施態様において、ＭＩＴのセットの多様性は、異なる配列を有する１０～５００のＭＩＴを含み得る。本明細書の特定の方法及び組成物において、試料中の核酸分子の集団中の核酸分子の総数とセット中のＭＩＴの多様性の比は、１，０００：１～１，０００，０００，０００：１であり得る。ＭＩＴのセットを使用した結合ＭＩＴの可能な組み合わせの多様性と標的遺伝子座に及ぶ試料核酸分子の総数との比は、１．０１：１～１０：１であり得る。本明細書でさらに詳細に論じるように、ＭＩＴは典型的には、少なくとも部分的に４～２０ヌクレオチド長のオリゴヌクレオチドから構成される。ＭＩＴのセットは、そのセット中の全てのＭＩＴの配列が、少なくとも２、３、４、又は５ヌクレオチドだけ互いに異なるように設計することができる。

【0059】

本明細書で提供されるいくつかの実施態様において、ＭＩＴのセットからの少なくとも１種（例えば２種）のＭＩＴが、核酸分子の集団の各核酸分子に又は各核酸分子のセグメントに結合されてタグ付き核酸分子の集団を生成する。本明細書でさらに考察されるように、ＭＩＴは様々な構成で試料核酸分子に結合させることができる。例えば、結合後、１種のＭＩＴはタグ付き核酸分子の５’末端に、又はタグ付き核酸分子のいくつかの、ほとんどの、又は典型的にはそれぞれの試料核酸セグメントに対して５’に位置するか、及び／又は別のＭＩＴは、タグ付き核酸分子のいくつかの、ほとんどの、又は典型的にはそれぞれの試料核酸セグメントに対して３’に位置することができる。他の実施態様において、少なくとも２種のＭＩＴは、タグ付き核酸分子の試料核酸セグメントに対して５’及び／又は３’に、又は各タグ付き核酸分子のいくつかの、ほとんどの、又は典型的にはそれぞれの試料核酸セグメントに対して５’及び／又は３’に位置する。結合前に又は別々の反応を行うことにより、同じポリヌクレオチドセグメント上に２種のＭＩＴを含めることにより、２種のＭＩＴを５’又は３’又付加することができる。例えば、試料核酸分子内の特定の配列に結合し、そして２種のＭＩＴをコードする配列特異的領域に対して５’の領域を含むプライマーを使用して、ＰＣＲは行うすることができる。いくつかの実施態様において、ＭＩＴのセットの各ＭＩＴの少なくとも１つのコピーが試料核酸分子に結合され、少なくとも１種のＭＩＴの２つのコピーのそれぞれが異なる試料核酸分子に結合され、及び／又は同じ又は実質的に同じ配列を有する少なくとも２つの核酸分子が、少なくとも１つの異なる結合ＭＩＴを有する。当業者は、ＭＩＴを核酸分子の集団の核酸分子に結合させるための方法を特定するであろう。例えばＭＩＴは、連結を介して結合させるか、又はＰＣＲプライマーの内部配列結合部位に対して５’に付加させて、本明細書でより詳細に考察されるようにＰＣＲ反応中に結合させることができる。

【0060】

ＭＩＴが試料核酸に結合してタグ付き核酸分子を形成した後又は形成している時、タグ付き核酸分子の集団は典型的には増幅されてタグ付き核酸分子のライブラリーを作製する。高スループット配列決定法ワークフローに特に関連するものを含むライブラリーを作製するための増幅方法は、当該分野において公知である。例えば、そのような増幅はＰＣＲに基づくライブラリー調製であり得る。これらの方法はさらに、ＰＣＲ又は別の増幅方法（等温法など）を使用して、タグ付き核酸分子のライブラリーを１つ又はそれ以上の固体支持体上にクローン増幅することを含み得る。高スループット配列決定用試料調製ワークフローにおいて、固体支持体上にクローン増幅ライブラリーを作製するための方法は当該分野において公知である。試料核酸分子の集団のサブセットが増幅される多重増幅反応などの追加の増幅工程も、本明細書に提供される試料核酸を同定するための方法にも含めることができる。

【0061】

本明細書で提供される方法のいくつかの実施態様において、ＭＩＴのヌクレオチド配列、及びタグ付き核酸分子のライブラリー中のタグ付き核酸分子のいくつか、ほとんど、又は全て（例えば、少なくとも２、３、４、５、６、７、８、９、１０、２０、２５、５０、７５、１００、１５０、２００、２５０、５００、１，０００、２，５００、５，０００、１０，０００、１５，０００、２０，０００、２５，０００、５０，０００、１００，０００、１，０００，０００、５，０００，０００、１０，０００，０００、２５，０００，０００、５０，０００，０００、１００，０００，０００、２５０，０００，０００、５００，０００，０００、１×１０⁹、１×１０¹⁰、１×１０¹¹、１×１０¹²、又は１×１０¹³のタグ付き核酸分子、又は範囲の下端の１０、２０、２５、３０、４０、５０、６０、７０、８０、もしくは９０％のタグ付き核酸分子と、範囲の上端の２０、２５、３０、４０、５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、及び１００％のタグ付き核酸分子との間）の試料核酸分子セグメントの少なくとも一部のヌクレオチド配列が決定される。タグ付き核酸分子のクローン増幅コピー上の第１のＭＩＴ及び任意に第２のＭＩＴ又はそれ以上のＭＩＴの配列を使用して、ライブラリー中のクローン増幅したタグ付き核酸分子を生じさせる個々の試料核酸分子を同定することができる。

【0062】

いくつかの実施態様において、同じ第１のＭＩＴ及び場合によっては同じ第２のＭＩＴを共有するタグ付き核酸分子から決定された配列を使用して、試料核酸分子中の標的遺伝子座における真の配列差異から増幅エラーを区別することにより、増幅エラーを同定することができる。例えば、いくつかの態様においてＭＩＴのセットは、例えばＹアダプターなどの部分的又は完全に２本鎖のアダプターの一部であり得る２本鎖ＭＩＴである。これらの実施態様において、全ての出発分子について、Ｙアダプター調製物は２つの娘分子型（１つは＋方向、１つは－方向）を生成する。試料分子中の真の突然変異は、ＭＩＴが２本鎖アダプター又はその一部であるこれらの実施態様において、同じ２種のＭＩＴと対をなった両方の娘分子を有するはずである。さらに、タグ付き核酸分子の配列が決定され、そして配列上のＭＩＴによってＭＩＴ核酸セグメントファミリーにまとめられる場合、ＭＩＴ配列及び場合により２本鎖ＭＩＴに対するその相補体を考慮し、そして場合により核酸セグメントの少なくとも一部を考慮すると、タグ付き核酸分子を生じさせる出発分子が突然変異を有する場合、２本鎖ＭＩＴ実施態様中のＭＩＴ核酸セグメントファミリー中のほとんどそして典型的には少なくとも７５％の核酸セグメントは、突然変異を含むであろう。増幅（例えばＰＣＲ）エラーの場合、最悪のシナリオは、エラーが１回目のＰＣＲのサイクル１で発生することである。これらの実施態様において、増幅エラーは、最終生成物の２５％が誤差を含むことを引き起こす（さらに任意の追加の累積誤差を含むが、これは＜１％のはずである）。従っていくつかの実施態様において、例えばＭＩＴ核酸セグメントファミリーが特定の突然変異又は多型対立遺伝子について少なくとも７５％のリードを含む場合、その突然変異又は多型対立遺伝子は、タグ付き核酸分子を生じた試料核酸分子に真に存在すると結論付けることができる。試料調製プロセスにおいてエラーが遅く発生するほど、ＭＩＴによって対になったＭＩＴ核酸セグメントファミリーにグループ化された（すなわち、バケット化された）配列決定リードのセットにおけるエラーを含む配列リードの割合が低下する。例えば、ライブラリー調製物増幅における誤りは、標的化多重増幅のようなワークフローにおけるその後の増幅工程におけるエラーよりも、対になったＭＩＴ核酸セグメントファミリーにおけるエラーを有するより高い割合の配列をもたらすであろう。配列決定ワークフローにおける最終的なクローン増幅におけるエラーは、そのエラーを含む対になったＭＩＴ核酸セグメントファミリーにおいて最も低い割合の核酸分子を作り出す。

【0063】

本明細書に提供される方法、特に試料核酸分子の複数の増幅コピーを使用して試料核酸分子の又は特に複数の試料核酸分子の配列を決定する方法を実施するために、任意の配列決定法を使用することができる。さらに、試料核酸セグメント及び異なるＭＩＴタグについて実質的に同じ（例えば、少なくとも６０％、７０％、７５％、８０％、８５％、９０％、９５、９６、９７、９８、又は９９％同一の）配列を生じるタグ付き核酸分子を比較して、試料核酸分子の集団における配列の多様性を決定し、そしてたとえ低い対立遺伝子頻度であっても、試料調製中に生じるエラーから真の変異体又は突然変異を区別することができる。本開示の方法の実施態様は、試料核酸分子の集団を配列決定するための方法を含む。そのような方法は、特に高スループット配列決定方法に特に有効である。そのような方法は、本明細書においてより詳細に考察されている。

【0064】

上記及び本明細書に開示された方法は、本開示を考慮して当業者が認識するであろう多くの目的のために使用することができる。例えば本方法は、試料中の核酸分子の集団の核酸配列を決定するために、タグ付き核酸分子を生じた試料核酸分子を同定するために、試料核酸分子の集団から試料核酸分子を同定するために、増幅エラーを同定するために、増幅バイアスを測定するために、そしてポリメラーゼの突然変異率を特徴付けるために使用することができる。さらなる用途は当業者に明らかであろう。これらの方法において、タグ付き核酸セグメントの配列を決定した後、実質的に同じ核酸セグメント配列と同じ２種のＭＩＴタグを有する核酸セグメント、又は実質的に同じか又は同じ核酸配列セグメント配列と少なくとも１種の異なるＭＩＴタグを有する核酸セグメントは、比較及びさらなる分析に使用することができる。

【0065】

試料とライブラリーの調製
本明細書で提供される様々な実施態様において、試料は天然又は非天然の供給源由来であり得る。いくつかの実施態様において、試料中の核酸分子は、生物又は細胞に由来してもよい。任意の核酸分子を使用することができ、例えば試料は、生物又は細胞由来の全ゲノムの一部をカバーするゲノムＤＮＡ、ｍＲＮＡ、又はｍｉＲＮＡを含み得る。ある点では、試料中の全ゲノム又はＤＮＡ配列の全長を核酸分子の平均サイズで割ったものを使用して、試料中の核酸分子の数を決定し、全ゲノム又は全ＤＮＡ配列を表すことができる。さらなる点において、この数を使用して、試料中の標的遺伝子座に及ぶ核酸分子の数を決定することができる。遺伝子座は、単一のヌクレオチド又は１～１，０００、１０，０００、１００，０００、１００万、又はそれ以上のヌクレオチドのセグメントを含むことができる。非限定的な例として遺伝子座は、単一ヌクレオチド多型、イントロン、又はエクソンでもよい。いくつかの実施態様において、遺伝子座は挿入、欠失、又は転位を含み得る。いくつかの実施態様において、試料は血液、血清、又は血漿試料を含み得る。いくつかの実施態様において、試料は、血液、血清、又は血漿中に浮遊性ＤＮＡ（例えば、循環性無細胞腫瘍ＤＮＡ又は循環性無細胞胎児ＤＮＡ）を含み得る。これらの実施態様において、試料は、典型的には哺乳動物又はヒトなどの動物由来であり、典型的には長さ約１６０ヌクレオチドの長さの断片で存在する。いくつかの実施態様において、浮遊性ＤＮＡは、遠心分離による細胞破片及び血小板の除去後に、ＥＤＴＡ－２Ｎａ管を使用して血液から単離される。血漿試料は、例えばQIAamp DNA Mini Kit（Qiagen, Hilden, Germany）を使用してＤＮＡが抽出されるまで－８０°Ｃで保存することができる（例えばHamakawa et al., Br J Cancer. 2015; 112:352-356）。しかし試料は他の供給源に由来してもよく、そしていかなる生物由来の核酸分子もこの方法に使用することができる。いくつかの実施態様において、細菌及び／又はウイルスに由来するＤＮＡを使用して、特に環境及び生物多様性サンプリングなどの混合集団内の真の配列変異体を分析することができる。

【0066】

本明細書に開示されるいくつかの実施態様は、典型的には、生きた細胞内で及び生きた細胞によって生成された試料核酸分子を使用して行われる。そのような核酸分子は典型的には、ＭＩＴが結合する前に、いかなるインビトロ増幅もせずに、細胞又は体液などの天然の供給源から直接単離される。従って試料核酸分子は、ＭＩＴを結合させるために反応混合物中で直接使用される。これは、試料核酸分子がタグ付けされる前の増幅エラーの潜在的な導入を回避する。これは次に実際の配列変異体を増幅エラーから区別する能力を改善する。しかし、いくつかの実施態様において、試料核酸分子はＭＩＴを結合する前に増幅することができる。ＭＩＴを結合する前に増幅が必要な場合に使用するための最良の方法は、当業者には理解されよう。例えば、プルーフリーディング能力を有する高忠実度ポリメラーゼを増幅に使用して、核酸分子がＭＩＴを結合する前に生じ得る増幅エラーの数の減少を助けることができる。さらに、小さい数（例えば、範囲の下端の２、３、４、及び５サイクルと、範囲の上端の３、４、５、６、７、８、９、又は１０サイクルとの間）の増幅サイクルを使用することができる。

【0067】

いくつかの実施態様において、試料中の核酸分子はＭＩＴでタグ付けされる前に、任意の選択された長さの核酸分子を生成するために断片化することができる。当業者であれば、本明細書でさらに詳細に考察されるように、そのような断片化を実行する方法及び選択される長さを認識するであろう。例えば核酸の断片化は、超音波処理などの物理的方法、ＤＮａｓｅＩもしくは制限エンドヌクレアーゼによる消化などの酵素的方法、又は二価金属カチオンの存在下で熱を加えるなどの化学的方法を使用して行うことができる。本明細書でより詳細に考察されるように、断片化は、選択されたサイズ範囲の核酸分子が残されるように実施することができる。他の実施態様において、核酸分子は、当該分野で公知の方法を使用して特定のサイズ範囲を選択することができる。

【0068】

断片化後、試料核酸分子は、さらなるライブラリー調製の前に修復される必要がある５’及び／又は３’オーバーハングを有することがある。いくつかの実施態様において、ＭＩＴ又は他のタグを結合する前に、当該分野において公知の方法を使用して、５’及び３’オーバーハングを有する試料核酸分子を修復し平滑末端試料核酸分子を生成することができる。例えば、適切な緩衝液中で、クレノウラージ断片ポリメラーゼのポリメラーゼ活性及びエキソヌクレアーゼ活性を使用して、核酸分子上の５’オーバーハングを埋めそして３’オーバーハングを除去することができる。いくつかの実施態様において、当業者が理解するポリヌクレオチドキナーゼ（ＰＮＫ）及び反応条件を使用して、修復された核酸分子の５’末端にリン酸塩を付加することができる。さらなる実施態様において、単一ヌクレオチド又は複数のヌクレオチドを２本鎖分子の一方の鎖に付加して「粘着末端」を生成することができる。例えば、アデノシン（Ａ）を核酸分子の３’末端に付加することができる（Ａテーリング）。いくつかの実施態様において、Ａオーバーハング以外の他の粘着末端を使用することができる。いくつかの実施態様において、他のアダプター、例えばループ状の連結アダプターを加えることができる。本明細書に開示された実施態様のいずれにおいても、これらの修正のどれも実行できないか、又は全てか又は任意の組み合わせを実行することができる。

【0069】

以後の配列決定のための核酸分子のライブラリーを作製するために、多くのキット及び方法が当該分野において公知である。小さい核酸断片、特に循環性無細胞ＤＮＡからライブラリーを調製するために特に改変されたキットは、本明細書に提供される方法を実施するのに有用であり得る。例えば、NEXTflex Cell Freeキット（Bioo Scientific, Austin, TX）又は Natera Library Prepキット（Natera, San Carlos, CA）。そのようなキットは典型的には、本明細書に提供される方法の増幅及び配列決定工程用にカスタマイズされたアダプターを含むように改変されるだろう。アダプター連結もまた、Agilent SureSelect キット（Agilent, Santa Clara, CA）に見出される連結キットのような市販のキットを使用して実施することができる。

【0070】

試料核酸分子は、ホスホジエステル結合を介して結合した天然又は非天然のリボヌクレオチド又はデオキシリボヌクレオチドからなる。さらに、試料核酸分子は配列決定の標的である核酸セグメントからなる。試料核酸分子は、少なくとも２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、又は１，０００ヌクレオチドの長さである核酸セグメントであり得るか又はこれを含み得る。本明細書に開示される実施態様のいずれにおいても、試料核酸分子又は核酸セグメントは、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、及び５００ヌクレオチドの長さと、範囲の上端の１０、１１、１２、１３、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、５００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、及び１０，０００ヌクレオチドの長さとの間であり得る。いくつかの態様において、核酸分子は、ゲノムＤＮＡの断片であることができ、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、及び５００ヌクレオチドの長さと、範囲の上端の１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、５００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、及び１０，０００ヌクレオチドの長さとの間であり得る。明確にするために、生体組織、体液、又は培養細胞から最初に単離された核酸は、本明細書の方法を使用して処理された試料核酸分子よりはるかに長い場合がある。本明細書で考察されるように、例えば、そのような最初に単離された核酸分子は、本明細書の方法で使用される前に、断片化されて核酸セグメントを生成することができる。いくつかの実施態様において、核酸分子及び核酸セグメントは同一であり得る。試料核酸分子又は試料核酸セグメントは、照会されている１つ又はそれ以上のヌクレオチド、特に単一ヌクレオチド多型又は単一ヌクレオチド変異種を含む標的遺伝子座を含むことができる。開示された実施態様のいずれにおいても、標的遺伝子座は、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、又は１，０００ヌクレオチドの長さで、試料核酸分子及び／又は試料核酸セグメントの一部又は全体を含むことができる。他の実施態様において標的遺伝子座は、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、及び５００ヌクレオチドの長さと、範囲の上端の１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、５００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、及び１０，０００ヌクレオチドの長さとの間であり得る。いくつかの実施態様において、異なる試料核酸分子上の標的遺伝子座は、少なくとも５０％、６０％、７０％、８０％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％同一であり得る。いくつかの実施態様において、異なる試料核酸分子上の標的遺伝子座は、少なくとも５０％、６０％、７０％、８０％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％の配列同一性を共有することができる。

【0071】

いくつかの実施態様において、試料核酸分子全体は試料核酸セグメントである。例えば、ＭＩＴが試料核酸分子の末端に直接連結されるか、又は試料核酸分子の末端に連結された核酸に連結されるか、又は試料核酸セグメントの末端の配列に結合するプライマーの、又はそこに付加されるユニバーサルアダプターなどのアダプターの、一部として連結される特定の実施態様において、本明細書仁尾さらに考察されるように、核酸分子全体は試料核酸セグメントであり得る。他の実施態様、例えばＭＩＴが、試料核酸分子の末端の内部の結合部位を標的とするプライマーの一部として試料核酸分子に結合している特定の実施態様において、試料核酸分子の一部は、下流の配列決定で標的とされる試料核酸セグメントであり得る。例えば、試料核酸分子の少なくとも５０％、６０％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は１００％は核酸セグメントであり得る。

【0072】

いくつかの実施態様において、試料核酸分子は天然の供給源から単離された核酸の混合物であり、いくつかの試料核酸分子は同一の配列を有し、範囲の下端の２０、２５、５０、７５、１００、１２５、１５０、２００、２５０ヌクレオチドから、範囲の上端の５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、又は５００ヌクレオチドにわたって、いくつかの試料核酸分子は、少なくとも５０％、６０％、７０％、８０％、９０％、９５％、９８％、又は９９％の配列同一性を有し、及びいくつかは５０％、４０％、３０％、２０％、１０％、又は５％未満の配列同一性を有する。このような試料核酸分子は、ある配列を別の配列よりも濃縮することなく、ヒトなどの哺乳動物の組織又は体液から単離された核酸試料であり得る。他の実施態様において、標的配列、例えば目的の遺伝子由来のものは、本明細書に提供される方法を実施する前に濃縮することができる。

【0073】

特定の実施態様において、核酸分子の集団中の試料核酸分子のうちのいくつか又は全ては、同一の又は実質的に同一の核酸セグメントを有することができる。核酸セグメントの配列が少なくとも９０％の配列同一性を共有する場合、核酸分子は実質的に同一であると言える。ある例示的な実施例では、試料核酸分子は、範囲の下端の２０、２５、５０、７５、１００、１２５、１５０、２００、２５０ヌクレオチドから、範囲の上端の５０、７５、１００、１２５、１５０、２００、２５０、３００、４００、又は５００ヌクレオチドにわたって、９０％、９１％、９２％、９３％、９４％、９５％、９６％、９７％、９８％、９９％、又は９９．９％の配列同一性を有する核酸セグメントを共有することができる。本明細書で提供される方法は、試料中で少なくとも９０％、９５％、９６％、９７％、９８％、９９％、さらには１００％の配列同一性を共有する試料核酸分子を区別するのに有効である。

【0074】

いくつかの実施態様において、結合ＭＩＴに隣接する核酸セグメントの５’末端及び３’末端を使用して、試料核酸分子を同定及び区別するのを助けることができる。本明細書では、これらの配列は断片特異的挿入体末端と呼ばれる。本明細書の他の箇所で考察されるようにＭＩＴを結合させた後、ＭＩＴと断片特異的挿入体末端との組み合わせは、試料核酸分子を一意に識別することができる。これは、２種の異なる試料核酸分子が同じ配向で同一の断片特異的挿入体末端と同じ結合ＭＩＴを有する確率が極めて低くなるように、ＭＩＴと試料核酸分子との十分に高い比を選択することができるためである。例えば、１、０．５、０．１、０．０５、０．０１、０．００５、０．００１以下の確率である。例えば、ＭＩＴのみを使用して２００のＭＩＴのセットから各試料核酸分子を同定することは、識別子の４０，０００（２００×２００）の可能な組み合わせを与える。断片特異的な挿入体末端を使用して提供される追加の情報を使用して、可能な組み合わせの数は急速に増加し得る。例えば、核酸分子の同定において５’及び３’断片特異的挿入体末端からの２つのヌクレオチドを含むことは、各ヌクレオチドがジヌクレオチド配列中に等しく存在しそうな場合、４０，０００の可能な組み合わせを１０，２４０，０００の可能な組み合わせに増加させる。断片特異的挿入体末端の長さは、本明細書に提供される方法で使用されるとき、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、及び３０ヌクレオチドと、範囲の上端の３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、及び５０ヌクレオチドとの間であり得る。いくつかの態様において、試料核酸分子を同定するためにＭＩＴと組み合わせて用いられる断片特異的末端は、１、２、３、又は４ヌクレオチドの長さである。

【0075】

さらなる実施態様において、断片特異的挿入体末端の決定された配列を使用して、核酸分子の各末端を、試料が単離された生物のゲノム内の特定の位置（すなわちゲノム座標）にマッピングすることができる。マッピングされた位置は、タグ付き核酸分子のそれぞれについて別の識別子を提供する。各末端をマッピングすることは、各タグ付き核酸分子に利用可能な識別子の数を大幅に増加させる。これらの実施態様において、核酸分子の各末端のマッピングされた位置をＭＩＴと組み合わせて使用して、タグ付き核酸分子を生じさせる個々の試料核酸分子を同定することができる。例えば、モノヌクレオソーム循環性無細胞ＤＮＡ（ｃｆＤＮＡ）中の所定の標的塩基について、５’断片末端は約０～１９９塩基上流のどこかであり得る。同様に、３’断片末端は、０～１９９塩基下流であり得る。理論的には、これにより４０，０００の可能な最終的な組み合わせが得られるであろう。実際には、ほとんどの分子は全長が１００～２００塩基であるため、可能な組み合わせの総数は約１５，０００になる（最大値、ただし全ての組み合わせが同じ確率で発生するわけではない）。これは、４０，０００のＭＩＴ組合せｘ１５，０００の可能な断片末端＝６００，０００，０００の可能な末端組合せを意味する。さらに、核酸セグメントがゲノムにマッピングされる場合、そのセグメント又はそのセグメントの対立遺伝子における突然変異を同定することができる。

【0076】

試料核酸分子の総数は、試料供給源及び調製、ならびに方法の必要性に応じて大きく変動し得る。例えば、全試料核酸分子は、範囲の下端の１×１０¹⁰、２×１０¹⁰、２．５×１０¹⁰、５×１０¹⁰、及び１×１０¹¹と、範囲の上端の５×１０¹⁰、１×１０¹¹、２×１０¹¹、２．５×１０¹¹、５×１０¹¹、１×１０¹²、２×１０¹²、２．５×１０¹²、５×１０¹²、及び１×１０¹³の核酸分子との間であり得る。例えば、モノヌクレオソームｃｆＤＮＡは高度に可変性の断片化パターンを有する約１００～２００ｂｐの核酸断片であるため、ヒト循環性無細胞ＤＮＡからのゲノムの１０，０００コピーは、２×１０¹¹の全試料核酸分子からなり得る（３，０００，０００，０００ｂｐ／ゲノムコピー×１０，０００ゲノムコピー／１５０ｂｐ／試料核酸分子＝２×１０¹¹の試料核酸分子）。

【0077】

本明細書で提供されるいくつかの実施態様において、試料核酸分子の総数は、範囲の下端の５０、１００、２００、２５０、５００、７５０、１，０００、２，０００、２，５００、５，０００、及び１０，０００コピーのヒトゲノムから、範囲の上端の１，０００、２，０００、２，５００、５，０００、１０，０００、２０，０００、２５，０００、５０，０００、及び１００，０００コピーのヒトゲノムまでを含むことができる。他の実施態様において、試料核酸分子の総数は、範囲の下端の１、２、２．５、３、４、又は５ｎＭの２００ヌクレオチドから、範囲の上端の２．５、３、４、５、１０、２０、又は２５ｎＭまでのｃｆＤＮＡ中の、１００～５００ヌクレオチドの長さ、例えば２００ヌクレオチドの核酸分子の数である。

【0078】

核酸分子のセット又は集団の多様性は、そのセット又は集団中の核酸分子の中の独特の配列の数である。試料核酸分子の多様性は、試料核酸分子間の独特の配列の数である。試料中の核酸分子が増幅に供されていない場合でさえも、試料中に同一の又はほぼ同一の核酸配列を２コピー以上有することは一般的である。現在の核酸試料調製及びＤＮＡ単離手順は、典型的には試料中のあらゆる核酸分子の多数のコピーをもたらす。

【0079】

本明細書中に開示される実施態様のいずれにおいても、集団中の試料核酸分子のヌクレオチド配列の多様性は、範囲の下端の１００、１，０００、１０，０００、１×１０⁵、１×１０⁶、及び１×１０⁷の異なる核酸配列と、範囲の上端の１×１０⁵、１×１０⁶、１×１０⁷、１×１０⁸、１×１０⁹、及び１×１０¹⁰の異なるヌクレオチド配列との間であり得る。いくつかの実施態様において、試料核酸分子の集団中のヌクレオチド配列の多様性は、範囲の下端の１×１０⁶、５×１０⁶、及び１×１０⁷の異なる核酸配列と、範囲の上端の１×１０⁷、１×１０⁸、１×１０⁹、及び１×１０¹⁰の異なるヌクレオチド配列との間である。

【0080】

ヒトｃｆＤＮＡ試料については、ヒトゲノムには約３０億のヌクレオチドがあり、核酸断片サイズは約１５０ヌクレオチドであり、そして断片化パターンはランダムではないが固定されてもいないため、ヒトｃｆＤＮＡ試料中には約２，０００万（３０億／１５０）～約３０億の異なる核酸断片がある。従っていくつかの態様において、試料は、例えば精製試料、又は血清もしくは血漿試料などのヒトｃｆＤＮＡ試料であり、試料の多様性は２，０００万～３０億である。

【0081】

本開示の特定の実施態様において、試料核酸分子はほぼ同じ長さであり得る。例えば試料核酸分子は、例えば循環性無細胞ＤＮＡ試料については約２００ヌクレオチド、又は循環性無細胞ＤＮＡを含む血液、血清、血漿試料などの特定の試料では、範囲の下端の５０、７５、１００、１２５、又は１５０ヌクレオチドと、範囲の上端の１５０、２００、２５０、又は３００ヌクレオチドの間の長さであり得る。

【0082】

他の実施態様において、試料核酸分子は、異なる範囲の開始長さであり得る。断片化を伴う又は伴わない試料核酸分子の長さは、その後の方法工程に適切な任意のサイズであり得る。例えば試料核酸分子は、下端の少なくとも１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、１，２５０、１，５００、１，７５０、２，０００、２，５００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００ヌクレオチドと、上端の１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、１，２５０、１，５００、１７５０、２，０００、２，５００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１１，０００、１２，０００、１３，０００、１４，０００、１５，０００、１６，０００、１７，０００、１８，０００、１９，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、及び１００，０００ヌクレオチドとの間であり得る。

【0083】

ある点において、試料核酸セグメント分子の開始長さの選択されたサイズ範囲は結合方法に依存する。ＰＣＲが使用される場合、２つのプライマーが同じ核酸分子に結合する可能性が高まるため、より長い範囲の核酸分子長が選択される。特に核酸セグメントの外側に結合するユニバーサルプライマーを使用してＰＣＲが実施される場合、より短い範囲の核酸分子長は、方法の後の工程でＰＣＲにより作製されるアンプリコンの長さを短縮するため、連結が使用される場合、より短い範囲の核酸分子長が選択される。従って、ＭＩＴを結合するために連結を使用するとき、試料核酸分子は一般に、ＭＩＴを結合するためにＰＣＲを使用するときよりも短いであろう。例えばいくつかの実施態様において、試料核酸分子は、下端の１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２２５、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、及び１，０００ヌクレオチドと、上端の１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２２５、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、１，１００、１，２００、１，３００、１，４００、１，５００、１，６００、１，７００、１，８００、１，９００、２，０００、２，５００、３，０００、４，０００、５，０００、６，０００、７，０００、９，０００、及び１０，０００ヌクレオチドとの間であり、ＭＩＴは連結によって結合される。特定の実施態様において試料核酸分子は、下端の５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２２５、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、１，１００、１，２００、１，３００、１，４００、１，５００、１，６００、１，７００、１，８００、１，９００、２，０００、２，５００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００ヌクレオチドと、上端の１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２２５、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、１，１００、１，２００、１，３００、１，４００、１，５００、１，６００、１，７００、１，８００、１，９００、２，０００、２，５００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１１，０００、１２，０００、１３，０００、１４，０００、１５，０００、１６，０００、１７，０００、１８，０００、１９，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、及び１００，０００のヌクレオチドとの間であり、ＭＩＴはＰＣＲによって結合される。

【0084】

いくつかの態様において、試料中の核酸分子は機械を使用して合成することができる。いくつかの実施態様において、核酸分子は生きた細胞によって生成される。いくつかの実施態様において、生きた細胞によって生成された核酸分子と機械を使用して合成された核酸分子とを組み合わせ、試料核酸分子として使用することができる。この組み合わせは定量目的には有益となり得る。いくつかの態様において、試料核酸分子はインビトロで増幅されていない。

【0085】

ＭＩＴとＭＩＴ反応混合物
本明細書に提供される方法においてＭＩＴを試料核酸分子又は核酸セグメントに結合させる工程は、典型的には反応混合物を形成することを含む。そのような方法中に形成された反応混合物は、それ自体が本開示の特有の態様であり得る。本明細書に提供される反応混合物は、本明細書に詳細に開示されるように試料核酸分子を含み、及び本明細書に詳細に開示されるようにＭＩＴのセットを含むことができ、ここで、試料中の核酸分子の総数はＭＩＴのセット中のＭＩＴの多様性より大きい。いくつかの実施態様において、試料中の核酸分子の総数はまた、結合ＭＩＴの可能な組み合わせの多様性よりも大きい。

【0086】

本明細書に開示されるいくつかの実施態様において、試料核酸分子の総数と、ＭＩＴのセット中のＭＩＴの多様性と比の、又はＭＩＴのセットを使用する結合ＭＩＴの可能な組み合わせの多様性の比は、範囲の下端の１０：１、２０：１、３０：１、４０：１、５０：１、６０：１、７０：１、８０：１、９０：１、１００：１２００：１、３００：１、４００：１５００：１、６００：１、７００：１、８００：１、９００：１、１，０００：１、２，０００：１、３，０００：１、４，０００：１、５，０００：１、６，０００：１、７，０００：１、８，０００：１、９，０００：１、１０，０００：１、１５，０００：１、２０，０００：１、２５，０００：１、３０，０００：１、５０，０００：１、６０，０００：１、７０，０００：１、８０，０００：１、９０，０００：１１００，０００：１、２００，０００：１、３００，０００：１、５００，０００：１、６００，０００：１、７００，０００：１、８００，０００：１、９００，０００：１、及び１，０００，０００：１と、範囲の上端の１００：１、２００：１、３００：１、４００：１、５００：１、６００：１、７００：１、８００：１、９００：１、１，０００：１、２，０００：１、３，０００：１、４，０００：１、５，０００：１、６，０００：１、７，０００：１、８，０００：１、９，０００：１、１０，０００：１、１５，０００：１、２０，０００：１、２５，０００：１、３０，０００：１、４０，０００：１、５０，０００：１、６０，０００：１、７０，０００：１、８０，０００：１、９０，０００：１、１００，０００：１、２００，０００：１、３００，０００：１、４００，０００：１、５００，０００：１、６００，０００：１、７００，０００：１、８００，０００：１、９００，０００：１、１，０００，０００：１、２，０００，０００：１、３，０００，０００：１、４，０００，０００：１、５，０００，０００：１、６，０００，０００：１、７，０００，０００：１、８，０００，０００：１、９，０００，０００：１、１０，０００，０００：１、５０，０００，０００：１、１００，０００，０００：１、及び１，０００，０００，０００：１との間であり得る。

【0087】

いくつかの実施態様において、試料はヒトｃｆＤＮＡ試料である。そのような方法では、本明細書に開示されるように、多様性は約２，０００万から約３０億である。これらの実施態様において、試料核酸分子の総数とＭＩＴのセットの多様性の比は、範囲の下端の１００，０００：１、１×１０⁶：１、１×１０⁷：１、２×１０⁷：１、及び２．５×１０⁷：１と、範囲の上端の２ｘ１０⁷：１、２．５ｘ１０⁷：１、５ｘ１０⁷：１、１ｘ１０⁸：１、２．５ｘ１０⁸：１、５ｘ１０⁸：１、及び１ｘ１０⁹：１との間であり得る。

【0088】

いくつかの実施態様において、ＭＩＴのセットを使用した結合ＭＩＴの可能な組み合わせの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数より大きいことが好ましい。例えば、各ゲノムにつき約１５，０００，０００の断片が存在するように、全てが２００ｂｐ断片に断片化されているヒトゲノムの１００コピーが存在する場合、ＭＩＴの可能な組み合わせの多様性は１００（各標的遺伝子座のコピーの数）より大きいが、１，５００，０００，０００（核酸分子の総数）より小さいことが好ましい。例えば、２００、３００、４００、５００、６００、７００、８００、９００、又は１，０００の可能な結合ＭＩＴの組み合わせなど、ＭＩＴの可能な組み合わせの多様性は１００を超えるが１，５００，０００，０００をはるかに下回ることが好ましい。ＭＩＴのセット中のＭＩＴの多様性は核酸分子の総数より小さいが、反応混合物中のＭＩＴの総数は反応混合物中の核酸分子又は核酸分子セグメントの総数を超えている。例えば、１，５００，０００，０００の総核酸分子又は核酸分子セグメントがある場合、反応混合物中には１，５００，０００，０００を超える総ＭＩＴ分子があるであろう。いくつかの実施態様において、ＭＩＴのセット中のＭＩＴの多様性の比は、標的遺伝子座に及ぶ試料中の核酸分子の数よりも低くてもよく、一方ＭＩＴのセットを使用する結合ＭＩＴの可能な組み合わせの多様性は、標的遺伝子座に及ぶ試料中の核酸分子の数よりも多くてもよい。例えば、標的遺伝子座に及ぶ試料中の核酸分子の数とＭＩＴのセット中のＭＩＴの多様性の比は、少なくとも１０：１、２５：１、５０：１、１００：１、１２５：１、１５０：１、又は２００：１でもよく、及びＭＩＴのセットを使用した結合ＭＩＴの可能な組み合わせの多様性と、標的遺伝子座に及ぶ試料中の核酸分子の数との比は、少なくとも１．０１：１、１．１：１、２：１、３：１、４：１、５：１、６：１、７：１、８：１、９：１、１０：１、２０：１、２５：１、５０：１、１００：１、２５０：１、５００：１、又は１，０００：１でもよい。

【0089】

典型的には、ＭＩＴのセット中のＭＩＴの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数よりも小さいが、結合ＭＩＴの可能な組み合わせの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数よりも大きい。２種のＭＩＴが試料核酸分子に結合している実施態様において、ＭＩＴのセット中のＭＩＴの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数より小さいが、標的遺伝子座に及ぶ試料核酸分子の総数の平方根より大きい。いくつかの実施態様においてＭＩＴの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数より小さいが、標的遺伝子座に及ぶ試料核酸分子の総数の平方根より１、２、３、４、又は５大きい。従って、ＭＩＴの多様性は標的遺伝子座に及ぶ試料核酸分子の総数より小さいが、任意の２種のＭＩＴの組み合わせの総数は、標的遺伝子座に及ぶ試料核酸分子の総数より大きい。セット中のＭＩＴの多様性は典型的には、各標的遺伝子座の少なくとも１００コピーを有する試料中の標的遺伝子座に及ぶ試料核酸分子の数の半分未満である。いくつかの実施態様において、セット中のＭＩＴの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数の平方根より少なくとも１、２、３、４、又は５以上より大きくなり得るが、標的遺伝子座に及ぶ試料核酸分子の総数の１／５、１／１０、１／２０、１／５０、又は１／１００未満であり得る。標的遺伝子座に及ぶ２，０００～１，０００，０００の試料核酸分子を有する試料については、そのセット中のＭＩＴの数は１，０００を超えない。例えば試料が、標的遺伝子座に及ぶ１０，０００の試料核酸分子を有するように、循環性無細胞ＤＮＡ試料などのゲノムＤＮＡ試料中に１０，０００コピーのゲノムを有する試料では、ＭＩＴの多様性は、１０１～１，０００、又は１０１～５００、又は１０１～２５０であり得る。いくつかの実施態様において、ＭＩＴのセットにおけるＭＩＴの多様性は、標的遺伝子座に及ぶ試料核酸分子の総数の平方根と、標的遺伝子座に及ぶ試料核酸分子の総数より１、１０、２５、５０、１００、１２５、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、又は１，０００小さい数との間である。いくつかの実施態様においてＭＩＴのセット中のＭＩＴの多様性は、範囲の下端の標的遺伝子座に及ぶ試料核酸分子の数の０．０１％、０．０５％、０．１％、０．５％、１％、２％、３％、４％、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、及び８０％と、範囲の上端の標的遺伝子座に及ぶ試料核酸分子の数の１％、２％、３％、４％、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、及び９９％との間であり得る。

【0090】

いくつかの実施態様において、反応混合物中のＭＩＴの総数と反応混合物中の試料核酸分子の総数との比は、範囲の下端の１．０１、１．１：１、２：１、３：１、４：１、５：１、６：１、７：１、８：１、９：１、１０：１、２５：１５０：１、１００：１、２００：１、３００：１、４００：１、５００：１、６００：１、７００：１、８００：１、９００：１、１，０００：１、２，０００：１、３，０００：１、４，０００：１、５，０００：１、６，０００：１、７，０００：１、８，０００：１、９，０００：１、１０，０００：１と、範囲の上端の２５：１５０：１、１００：１、２００：１、３００：１、４００：１、５００：１、６００：１、７００：１、８００：１、９００：１、１，０００：１、２，０００：１、３，０００：１、４，０００：１、５，０００：１、６，０００：１、７，０００：１、８，０００：１、９，０００：１、１０，０００：１、１５，０００：１、２０，０００：１、２５，０００：１、３０，０００：１、４０，０００：１、及び５０，０００：１との間であり得る。いくつかの実施態様において、反応混合物中のＭＩＴの総数は、反応混合物中の試料核酸分子の総数の少なくとも５０％、６０％、７０％、８０％、９０％、９５％、９６％、９７％、９８％、９９％、又は９９．９％である。他の実施態様において、反応混合物中のＭＩＴの総数と反応混合物中の試料核酸分子の総数との比は、各試料核酸分子が適切な数の結合ＭＩＴを有するのに少なくとも十分なＭＩＴでもよく、すなわち、２種のＭＩＴが結合している場合２：１、３種のＭＩＴの場合３：１、４種のＭＩＴの場合４：１、５種のＭＩＴの場合５：１、６種のＭＩＴの場合６：１、７種のＭＩＴの場合７：１、８種のＭＩＴの場合８：１、９種のＭＩＴの場合９：１、１０種のＭＩＴの場合１０：１である。

【0091】

いくつかの実施態様において、反応混合物中の同一配列を有するＭＩＴの総数と反応混合物中の核酸セグメントの総数との比は、範囲の下端の０．１：１、０．２：１、０．３：１、０．４：１、０．５：１、０．６：１、０．７：１、０．８：１、０．９：１、１：１、１．１：１、１．２：１、１．３：１、１．４：１、１．５：１、１．６：１、１．７：１、１．８：１、１．９：１、２：１、２．２５：１、２．５：１、２．７５：１、３：１、３．５：１、４：１、４．５：１、及び５：１と、範囲の上端の０．５：１、０．６：１、０．７：１、０．８：１、０．９：１、１：１、１．１：１、１．２：１、１．３：１、１．４：１、１．５：１、１．６：１、１．７：１、１．８：１、１．９：１、２：１、２．２５：１、２．５：１、２．７５：１、３：１、３．５：１、４：１、４．５：１、５：１、６：１、７：１、８：１、９：１、１０：１、２０：１、３０：１、４０：１、５０：１、６０：１、７０：１、８０：１、９０：１、及び１００：１との間であり得る。

【0092】

ＭＩＴのセットは、例えば少なくとも３種のＭＩＴ又は１０～５００種のＭＩＴを含むことができる。いくつかの実施態様において本明細書で考察されるように、試料由来の核酸分子は、増幅することなく結合反応混合物に直接添加される。これらの試料核酸分子は、本明細書に開示されるように、生きた細胞又は生物などの供給源から精製することができ、その後、核酸分子を増幅することなくＭＩＴを結合させることができる。いくつかの態様において、試料核酸分子又は核酸セグメントは、ＭＩＴを結合する前に増幅することができる。本明細書で論じるように、いくつかの実施態様において、試料由来の核酸分子を断片化して試料核酸セグメントを生成することができる。いくつかの実施態様において、ＭＩＴが結合する前に、他のオリゴヌクレオチド配列を試料核酸分子の末端に結合（例えば連結）することができる。

【0093】

本明細書に開示されるいくつかの実施態様において、反応混合物中の標的遺伝子座を含む試料核酸分子、核酸セグメント、又は断片とＭＩＴとの比は、範囲の下端の１．０１：１、１．０５、１．１：１、１．２：１１．３：１、１．４：１、１．５：１、１．６：１、１．７：１、１．８：１、１．９：１、２：１、２．５：１、３：１、４：１、５：１、６：１、７：１、８：１、９：１、１０：１、１５：１、２０：１、２５：１、３０：１、３５：１、４０：１、４５：１、及び５０：１と、範囲の上端の５：１、６：１、７：１、８：１、９：１、１０：１、１５：１、２０：１、２５：１、３０：１、３５：１、４０：１、４５：１、５０：１６０：１、７０：１、８０：１、９０：１、１００：１、１２５：１、１５０：１、１７５：１、２００：１、３００：１、４００：１、及び５００：１との間であり得る。例えば、いくつかの実施態様において、反応混合物中の特定の標的遺伝子座を有する試料核酸分子、核酸セグメント、又は断片とＭＩＴとの比は、下端の５：１、６：１、７：１、８：１、９：１、１０：１、１５：１、２０：１、２５：１、３０：１、３５：１、４０：１、４５：１、５０：１と、上端の２０：１、２５：１、３０：１、３５：１、４０：１、４５：１、５０：１、６０：１、７０：１、８０：１、９０：１、１００：１、２００：１との間である。いくつかの実施態様において、反応混合物中の試料核酸分子又は核酸セグメントとＭＩＴとの比は、下端の２５：１、３０：１、３５：１、４０：１、４５：１、５０：１と、上端の５０：１６０：１、７０：１、８０：１、９０：１、１００：１の間であり得る。いくつかの実施態様において、結合ＭＩＴの可能な組み合わせの多様性は、標的遺伝子座に及ぶ試料核酸分子、核酸セグメント、又は断片の数よりも大きくてもよい。例えばいくつかの実施態様において、結合ＭＩＴの可能な組み合わせの多様性と、標的遺伝子座に及ぶ試料核酸分子、核酸セグメント、又は断片の数との比は、少なくとも１．０１、１．１：１、２：１、３：１、４：１、５：１、６：１、７：１、８：１、９：１、１０：１、２０：１、２５：１、５０：１、１００：１、２５０：１、５００：１、又は１，０００：１であり得る。

【0094】

本明細書で提供されるように、核酸分子をＭＩＴでタグ付けする（すなわち、核酸分子をＭＩＴに結合させる）ための反応混合物は、試料核酸分子の集団及びＭＩＴのセットに加えて追加の試薬を含み得る。例えば、タグ付けのための反応混合物は、適切なｐＨの適切な緩衝液を含むリガーゼ又はポリメラーゼ、ＡＴＰ依存性リガーゼ用のアデノシン三リン酸（ＡＴＰ）、ＮＡＤ依存性リガーゼ用のニコチンアミドアデニンジヌクレオチド、ポリメラーゼ用のデオキシヌクレオシド三リン酸（ｄＮＴＰ）、及び場合により、ポリエチレングリコールのような分子密集剤を含むことができる。特定の実施態様において、反応混合物は、試料核酸分子の集団、ＭＩＴのセット、及びポリメラーゼ又はリガーゼを含むことができ、ここで反応混合物中の特定の標的遺伝子座を有する試料核酸分子、核酸セグメント、又は断片の数とＭＩＴの数との比は、本明細書に開示される比率のいずれか、例えば２：１～１００：１、又は１０：１～１００：１、又は２５：１～７５：１、又は４０：１～６０：１、又は４５：１～５５：１、又は４９：１～５１：１であり得る。

【0095】

本明細書に開示されるいくつかの実施態様において、ＭＩＴのセット中の異なるＭＩＴの数（すなわち多様性）は、下端の、異なる配列を有する３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、１，５００、２，０００、２，５００、及び３，０００のＭＩＴと、上端の、異なる配列を有する４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、及び５，０００のＭＩＴとの間であり得る。例えば、ＭＩＴのセット中の異なるＭＩＴの多様性は、下端の２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、及び１００の異なるＭＩＴ配列と、上端の５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、及び３００の異なるＭＩＴ配列との間であり得る。いくつかの実施態様において、ＭＩＴのセット中の異なるＭＩＴの多様性は、下端の５０、６０、７０、８０、９０、１００、１２５、及び１５０の異なるＭＩＴ配列と、上端の１００、１２５、１５０、１７５、２００、及び２５０の異なるＭＩＴ配列との間であり得る。いくつかの実施態様において、ＭＩＴのセット中の異なるＭＩＴの多様性は、３～１，０００、又は１０～５００、又は５０～２５０の異なるＭＩＴ配列であり得る。いくつかの実施態様において、ＭＩＴのセットを使用した結合ＭＩＴの可能な組み合わせの多様性は、範囲の下端の結合ＭＩＴの４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、７５、１００、１５０、２００、２５０、３００、４００、５００、ａｎｄ１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、２５０，０００、５００，０００、１，０００，０００の可能な組合せと、範囲の上端の結合ＭＩＴの１０、１５、２０、２５、３０、４０、５０、７５、１００、１５０、２００、２５０、３００、４００、５００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、２５０，０００、５００，０００、１，０００，０００、２，０００，０００、３，０００，０００、４，０００，０００、５，０００，０００、６，０００，０００、７，０００，０００、８，０００，０００、９，０００，０００、及び１０，０００，０００の可能な組合せとの間であり得る。

【0096】

ＭＩＴのセット中のＭＩＴは、典型的には全て同じ長さである。例えばいくつかの実施態様において、ＭＩＴは、下端の２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、及び２０ヌクレオチドと、上端の４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、及び３０ヌクレオチドとの間であり得る。特定の実施態様においてＭＩＴは、下端の３、４、５、６、７、又は８ヌクレオチドから上端の５、６、７、８、９、１０、又は１１ヌクレオチドまでの任意の長さである。いくつかの実施態様においてＭＩＴの長さは、下端の４、５、又は６ヌクレオチドから上端の５、６、又は７ヌクレオチドまでの任意の長さであり得る。いくつかの実施態様において、ＭＩＴの長さは５、６、又は７ヌクレオチドである。

【0097】

理解されるように、ＭＩＴのセットは、典型的にはセットの各ＭＩＴメンバーの多くの同一のコピーを含む。いくつかの実施態様においてＭＩＴのセットは、標的遺伝子座に及ぶ試料核酸分子の総数より、範囲の下端の１０、２０、２５、３０、４０、５０、１００、５００、１，０００、１０，０００、５０，０００、及び１００，０００倍多いコピーから、範囲の上端の１００、５００、１，０００、１０，０００、５０，０００、１００，０００、２５０，０００、５００，０００、及び１，０００，０００倍多いコピーまでを含む。例えば、血漿から単離されたヒト循環性無細胞ＤＮＡ試料中には、例えばゲノムの任意の標的遺伝子座に及ぶ１，０００～１００，０００の循環性断片を含む量のＤＮＡ断片が存在し得る。特定の実施態様において、ＭＩＴのセット中の全ての独特のＭＩＴの１／１０、１／４、１／２、又は３／４以下のある所定のＭＩＴのコピーがある。セットのメンバー間で、任意の配列と残りの配列との間に１、２、３、４、５、６、７、８、９、又は１０の差があってもよい。いくつかの実施態様においてセット中の各ＭＩＴの配列は、少なくとも１、２、３、４、５、６、７、８、９、又は１０ヌクレオチドだけ他の全てのＭＩＴと異なる。ＭＩＴを誤って識別する可能性を減らすために、ＭＩＴのセット中の全てのＭＩＴ間のハミング（Hamming）距離を考慮に入れるなど、当業者が認識するであろう方法を使用してＭＩＴのセットを設計することができる。ハミング距離は、１つのストリング又はヌクレオチド配列を別のものに変更するのに必要な最小の置換数を測定する。ここでハミング距離は、あるセット中の１種のＭＩＴ配列を、同じセットからの別のＭＩＴ配列に変換するのに必要とされる最小数の増幅エラーを測定する。特定の実施態様において、ＭＩＴのセットの異なるＭＩＴは、互いの間に１、２、３、４、５、６、７、８、９、又は１０未満のハミング距離を有する。

【0098】

特定の実施態様において、本明細書に提供されるような単離されたＭＩＴのセットは本開示の１つの実施態様である。単離されたＭＩＴのセットは、１本鎖、又は部分的もしくは完全に２本鎖の核酸分子のセットでもよく、各ＭＩＴはそのセットの核酸分子の一部又は全体である。特定の例において、それぞれが異なるＭＩＴを含むＹアダプター（すなわち、部分的に２本鎖）核酸のセットが本明細書に提供される。Ｙアダプター核酸のセットは、ＭＩＴ部分を除いてそれぞれ同一であり得る。同じＹアダプタＭＩＴの複数のコピーをセットに含めることができる。そのセットは、ＭＩＴのセットについて、本明細書に開示されているような数と多様性の核酸分子を有することができる。非限定的な例としてこのセットは、５０～５００のＭＩＴ含有Ｙアダプターの２、５、１０、又は１００コピーを含むことができ、各ＭＩＴセグメントの長さは４～８核酸であり、各ＭＩＴセグメントは他のＭＩＴセグメントとは少なくとも２ヌクレオチド異なるが、ＭＩＴ配列以外の同一の配列を含む。ＹアダプターのセットのＹアダプター部分に関するさらなる詳細が本明細書に提供される。

【0099】

他の実施態様において、ＭＩＴのセット及び試料核酸分子の集団を含む反応混合物は、本開示の１つの実施態様である。さらに、そのような組成物は、本明細書に提供される多数の方法及び他の組成物の一部であり得る。例えばさらなる実施態様において、反応混合物は、ポリメラーゼ又はリガーゼ、適切な緩衝液、及び本明細書でより詳細に考察される補助成分を含み得る。これらの実施態様のいずれについても、ＭＩＴのセットは、範囲の下端の２５、５０、１００、２００、２５０、３００、４００、５００、又は１，０００のＭＩＴから、範囲の上端の１００、２００、２５０、３００、４００、５００、１，０００、１，５００、２，０００、２，５００、５，０００、１０，０００、又は２５，０００のＭＩＴまでを含むことができる。例えば、いくつかの実施態様において、反応混合物は１０～５００のＭＩＴのセットを含む。

【0100】

ＭＩＴの結合
本明細書でより詳細に考察される分子指標タグ（ＭＩＴ）は、当業者が認識する方法を使用して反応混合物中の試料核酸分子に結合させることができる。いくつかの実施態様において、ＭＩＴは、単独で、すなわち追加のオリゴヌクレオチド配列なしで結合することができる。いくつかの実施態様において、ＭＩＴは、本明細書でより詳細に考察されるように他のヌクレオチド配列をさらに含み得るより大きなオリゴヌクレオチドの一部であり得る。例えばこのオリゴヌクレオチドはまた、核酸セグメントに特異的なプライマー又はユニバーサルプライマー結合部位、Ｙアダプターなどの配列決定アダプター、ライブラリータグ、連結アダプタータグなどのアダプター、及びこれらの組み合わせも含み得る。当業者は、配列決定、特に高スループット配列決定に有用なタグ付き核酸分子を生成するために、様々なタグをオリゴヌクレオチドに組み込む方法を認識するであろう。本開示のＭＩＴは、核酸分子の多様性が小さいため、それらがＹアダプター及び／又はユニバーサル配列などの追加の配列と共により容易に使用され、従って、アダプター上の追加の配列とより容易に組み合わせて、より小さい従ってより費用効果の高いＭＩＴ含有アダプターのセットを生み出すことができるという点で有利である。

【0101】

いくつかの実施態様において、ＭＩＴは、タグ付き核酸分子中で、１種のＭＩＴが試料核酸セグメントに対して５’にあり、１種のＭＩＴが試料核酸セグメントに対して３’にあるように結合される。例えば、いくつかの実施態様において、ＭＩＴは、連結を使用して試料核酸分子の５’末端及び３’末端に直接結合することができる。本明細書に開示されるいくつかの実施態様において、連結は典型的には、適切な緩衝液、イオン、及び適切なｐＨとの反応混合物の形成を含み、この中で、試料核酸分子の集団、ＭＩＴのセット、アデノシン三リン酸、及びリガーゼが組み合わされる。当業者は、反応混合物及び使用に利用可能な様々なリガーゼを形成する方法を理解するであろう。いくつかの実施態様において、核酸分子は３’アデノシンオーバーハングを有することができ、ＭＩＴは、例えば５’チミジンに直接隣接するような５’チミジンオーバーハングを有する２本鎖オリゴヌクレオチド上に位置することができる。

【0102】

さらなる実施態様において、本明細書に提供されるＭＩＴは、それらが試料核酸分子に連結される前に、Ｙアダプターの一部として含まれ得る。Ｙアダプターは当該分野において公知であり、例えば、高スループット配列決定法の前に、核酸分子の２つの末端により効果的にプライマー結合配列を提供するために使用される。Ｙアダプターは第１のオリゴヌクレオチドと第２のオリゴヌクレオチドをアニーリングすることによって形成され、ここで、第１のオリゴヌクレオチドの５’セグメントと第２のオリゴヌクレオチドの３’セグメントは相補的であり、第１のオリゴヌクレオチドの３’セグメントと第２のオリゴヌクレオチドの５’セグメントは相補的ではない。いくつかの実施態様において、Ｙアダプターは、塩基対合した２本鎖ポリヌクレオチドセグメントと、連結部位に対して遠位の塩基対合していない１本鎖ポリヌクレオチドセグメントとを含む。２本鎖ポリヌクレオチドセグメントは、範囲の下端の３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、又は２０ヌクレオチドの長さと、範囲の上端の４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、及び３０ヌクレオチドの長さとの間であり得る。第１及び第２のオリゴヌクレオチド上の１本鎖ポリヌクレオチドセグメントは、範囲の下端の３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、又は２０ヌクレオチドの長さと、範囲の上端の４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、及び３０ヌクレオチドの長さとの間であり得る。これらの実施態様において、ＭＩＴは、典型的にはＹアダプターの末端に付加された２本鎖配列であり、これらは、配列決定される試料核酸セグメントに連結される。例示的なＹアダプターを図１に示す。いくつかの態様において、第１及び第２のオリゴヌクレオチドの非相補的セグメントは異なる長さであり得る。

【0103】

いくつかの実施態様において、連結によって結合された２本鎖ＭＩＴは、試料核酸分子の両方の鎖に同じＭＩＴを有するであろう。ある点では、これら２本の鎖から得られたタグ付き核酸分子は同定され、そして対になったＭＩＴファミリーを生成するために使用されるであろう。１本鎖核酸が典型的には配列決定される下流の配列決定反応において、ＭＩＴファミリーは、同一の又は相補的なＭＩＴ配列を有するタグ付き核酸分子を同定することによって同定され得る。これらの実施態様において、対になったＭＩＴファミリーを使用して、本明細書で考察されるように初期試料核酸分子中の配列の違いの存在を確認することができる。

【0104】

図２に示すように、いくつかの実施態様においてＭＩＴは、試料核酸セグメント中の配列に結合する前進及び／又は逆進ＰＣＲプライマーの５’に組み込まれることにより、試料核酸セグメントに結合することができる。いくつかの実施態様において、ＭＩＴは、試料核酸分子にあらかじめ結合したユニバーサルプライマー結合配列に結合するユニバーサル前進及び／又は逆進ＰＣＲプライマーに組み込むことができる。いくつかの実施態様においてＭＩＴは、５’ＭＩＴ配列を有するユニバーサル前進又は逆進プライマーと、５’ＭＩＴ配列を有する試料核酸セグメント中の内部結合配列に結合する前進又は逆進ＰＣＲプライマーとの組み合わせを使用して結合させることができる。２サイクルのＰＣＲの後、組み込まれたＭＩＴ配列を有する前進プライマー及び逆進プライマーの両方を使用して増幅された試料核酸分子は、タグ付き核酸分子のそれぞれで、試料核酸セグメントの５’に及び試料核酸セグメントの３’に結合したＭＩＴを有する。いくつかの実施態様において、ＰＣＲは、結合工程において２、３、４、５、６、７、８、９、又は１０サイクルにわたって行われる。

【0105】

本明細書に開示されるいくつかの実施態様において、各タグ付け核酸分子上の２種のＭＩＴは、両方のＭＩＴが試料核酸セグメントに対して５’にあるように、又は両方のＭＩＴが試料核酸セグメントに対して３’にあるように、同様の技法を使用して結合することができる。例えば、２種のＭＩＴを同じオリゴヌクレオチドに組み込んで、試料核酸分子の一端に連結することができるか、あるいは２種のＭＩＴを前進又は逆進プライマー上に存在して、対になった逆進又は前進プライマーはゼロＭＩＴを有することができる。他の実施態様において、核酸セグメントに対して５’及び／又は３’の位置に結合したＭＩＴの任意の組み合わせと、３つ以上のＭＩＴを結合することができる。

【0106】

本明細書中で考察されるように、他の配列は、ＭＩＴの前、後、最中、又はそれと共に試料核酸分子に結合され得る。例えば、しばしばライブラリータグ又は連結アダプタータグ（ＬＴ）と呼ばれる連結アダプターは、その後のユニバーサル増幅工程で使用されるユニバーサルプライマー結合配列を伴って又は伴わずに付加される。いくつかの実施態様において、ＭＩＴ及び他の配列を含むオリゴヌクレオチドの長さは、範囲の下端の５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、２９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、及び１００ヌクレオチドと、範囲の上端の１０、１１、１２、１３、１４、１５、１６、１７、１８、２９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、及び２００ヌクレオチドとの間であり得る。ある点において、ＭＩＴ配列中のヌクレオチド数は、ＭＩＴを含むオリゴヌクレオチドの全配列中のヌクレオチド数の百分率であり得る。例えば、いくつかの実施態様において、ＭＩＴは試料核酸分子に連結されているオリゴヌクレオチドの全ヌクレオチドの、最大で２％、３％、４％、５％、６％、７％、８％、９％、１０％、１１％、１２％、１３％、１４％、１５％、１６％、１７％、１８％、１９％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、又は１００％であり得る。

【0107】

連結又はＰＣＲ反応によってＭＩＴを試料核酸分子に結合させた後、以後の方法工程に影響を及ぼし得る望ましくない成分を除去するために反応混合物を一掃することが必要であり得る。いくつかの態様において、試料核酸分子はプライマー又はリガーゼから精製することができる。他の実施態様において、タンパク質及びプライマーは、当該分野において公知の方法を使用してプロテアーゼ及びエキソヌクレアーゼを用いて消化することができる。

【0108】

ＭＩＴを試料核酸分子に結合させた後、タグ付き核酸分子の集団が生成され、それ自体が本開示の実施態様を形成する。いくつかの実施態様において、タグ付き核酸分子のサイズ範囲は、範囲の下端の１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、１２５、１５０、１７５、２００、２５０、３００、４００、及び５００ヌクレオチドと、範囲の上端１００、１２５、１５０、１７５、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、２，０００、３，０００、４，０００、及び５，０００のヌクレオチドとの間であり得る。

【0109】

タグ付き核酸分子のそのような集団は、範囲の下端の５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２２５、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、５０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、１，２５０，０００、１，５００，０００、２，０００，０００、２，５００，０００、３，０００，０００、４，０００，０００、５，０００，０００、１０，０００，０００、２０，０００，０００、３０，０００，０００、４０，００，０００、５０，０００，０００、５０，０００，０００、１００，０００，０００、２００，０００，０００、３００，０００，０００、４００，０００，０００、５００，０００，０００、６００，０００，０００、７００，０００，０００、８００，０００，０００、９００，０００，０００、及び１，０００，０００，０００のタグ付き核酸分子から、範囲の上端の１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、５０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、１，２５０，０００、１，５００，０００、２，０００，０００、２，５００，０００、３，０００，０００、４，０００，０００、５，０００，０００、６，０００，０００、７，０００，０００、８，０００，０００、９，０００，０００、１０，０００，０００、２０，０００，０００、３０，０００，０００、４０，００，０００、５０，０００，０００、１００，０００，０００、２００，０００，０００、３００，０００，０００、４００，０００，０００、５００，０００，０００、６００，０００，０００、７００，０００，０００、８００，０００，０００、９００，０００，０００、１，０００，０００，０００、２，０００，０００，０００、３，０００，０００，０００、４，０００，０００，０００、５，０００，０００，０００、６，０００，０００，０００、７，０００，０００，０００、８，０００，０００，０００、９，０００，０００，０００、及び１０，０００，０００，０００のタグ付き核酸分子までを含むことができる。いくつかの実施態様において、タグ付き核酸分子の集団は、範囲の下端の１００，０００，０００、２００，０００，０００、３００，０００，０００、４００，０００，０００、５００，０００，０００、６００，０００，０００、７００，０００，０００、８００，０００，０００、９００，０００，０００、及び１，０００，０００，０００のタグ付き核酸分子から、範囲の上端の５００，０００，０００、６００，０００，０００、７００，０００，０００、８００，０００，０００、９００，０００，０００、１，０００，０００，０００、２，０００，０００，０００、３，０００，０００，０００、４，０００，０００，０００、５，０００，０００，０００のタグ付き核酸分子までを含むことができる。

【0110】

ある点では、試料核酸分子の集団中のある割合の全試料核酸分子が、ＭＩＴを結合していることを目標とすることができる。いくつかの実施態様において、試料核酸分子の少なくとも１％、２％、３％、４％、５％、６％、７％、８％、９％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は９９．９％が、ＭＩＴを結合していることを目標とすることができる。他の点では、集団中のある割合の試料核酸分子はＭＩＴをうまく結合させることができる。本明細書に開示される実施態様のいずれにおいても、試料核酸分子の少なくとも１％、２％、３％、４％、５％、６％、７％、８％、９％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は９９．９％が、うまく結合されたＭＩＴを有して、タグ付き核酸分子の集団を生成することができる。本明細書に開示された実施態様のいずれにおいても、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、７５、１００、２００、３００、５００６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、又は５０，０００の試料核酸分子が、ＭＩＴをうまく結合させて、タグ付き核酸分子の集団を生成することができる。

【0111】

本明細書に開示されるいくつかの実施態様において、ＭＩＴは、ホスホジエステル結合を介して結合したリボヌクレオチド又はデオキシリボヌクレオチドのオリゴヌクレオチド配列であり得る。本明細書に開示されるヌクレオチドは、リボヌクレオチド及びデオキシリボヌクレオチドの両方を指すことができ、そして当業者はどちらの形態が特定の用途に関連するかを認識するであろう。特定の実施態様において、ヌクレオチドは、アデノシン、シチジン、グアノシン、ウリジン、５－メチルウリジン、デオキシアデノシン、デオキシシチジン、デオキシグアノシン、デオキシチミジン、及びデオキシウリジンからなる天然ヌクレオチドの群から選択することができる。いくつかの実施態様において、ＭＩＴは非天然ヌクレオチドであり得る。非天然ヌクレオチドは、以下を含み得る：例えば、ｄ５ＳＩＣＳ及びｄＮａＭなどの互いに結合するヌクレオチドのセット；金属配位塩基、例えば銀イオンを有する２，６－ビス（エチルチオメチル）ピリジン（ＳＰｙ）及び銅イオンを有する単座ピリジン（Ｐｙ）；２つ以上の又は任意の他の塩基と対合することができるユニバーサル塩基、例えば２’－デオキシイノシン誘導体、ニトロアゾール類似体、及び疎水性芳香族非水素結合塩基；及び、拡大塩基を有するｘＤＮＡ核酸塩基。特定の実施態様において、オリゴヌクレオチド配列は予め決定することができるが、他の実施態様において、オリゴヌクレオチド配列は縮重し得る。

【0112】

いくつかの実施態様において、ＭＩＴは、核酸塩基に結合している天然の糖リボース及び／又はデオキシリボース間にホスホジエステル結合を含む。いくつかの実施態様において、非天然結合を使用することができる。これらの結合は、例えば、ホスホロチオエート、ボラノホスフェート、ホスホネート、及びトリアゾール結合を含む。いくつかの実施態様において、非天然の結合及び／又はホスホジエステル結合の組み合わせを使用することができる。いくつかの実施態様において、糖骨格がペプチド結合によって連結された反復Ｎ－（２－アミノエチル）－グリシン単位から、代わりに作製されるペプチド核酸を使用することができる。本明細書に開示される実施態様のいずれにおいても、非天然糖をリボース又はデオキシリボース糖の代わりに使用することができる。例えば、トレオースを使用して、α－（Ｌ）－トレオフラノシル－（３’－２’）核酸（ＴＮＡ）を生成することができる。他の結合タイプ及び糖は当業者に明らかであり、本明細書に開示される実施態様のいずれにも使用され得る。

【0113】

いくつかの実施態様において、糖の原子間に余分な結合を有するヌクレオチドを使用することができる。例えば、架橋又はロック核酸をＭＩＴに使用することができる。これらの核酸は、リボース糖の２’位と４’位との結合を含む。

【0114】

特定の実施態様において、ＭＩＴの配列に組み込まれたヌクレオチドに反応性リンカーを付加することができる。後に、反応性リンカーは、反応が起こるのに適切な条件下で適切にタグ付けされた分子と混合することができる。例えば、スクシンイミジルエステルなどの反応性脱離基に結合した分子と反応することができるアミノアリルヌクレオチドを付加することができ、マレイミドなどの反応性脱離基に結合した分子と反応することができるチオール含有ヌクレオチドを付加することができる。他の実施態様において、ストレプトアビジンタグ付き分子に結合することができるＭＩＴの配列で、ビオチン結合ヌクレオチドを使用することができる。

【0115】

天然ヌクレオチド、非天然ヌクレオチド、ホスホジエステル結合、非天然結合、天然糖、非天然糖、ペプチド核酸、架橋核酸、ロック核酸、及び反応性リンカーを付加したヌクレオチドの様々な組み合わせは、当業者によって認識され、本明細書に開示される実施態様のいずれかにおいてＭＩＴを形成するために使用され得る。

【0116】

タグ付き核酸分子の増幅
いくつかの実施態様において、本開示の方法は、タグ付き核酸分子の配列を決定する前に、タグ付き核酸分子を増幅することを含む。典型的には、当該分野で知られているように、高スループット配列決定のための試料調製中に複数回の増幅が行われる。これらの増幅工程は全て、一般にＭＩＴが核酸分子に結合された後に行われるが、試料核酸分子の増幅は、いくつかの実施態様においてＭＩＴ結合の前に行われてもよい。特定の実施態様において、ＭＩＴが試料核酸分子の試料核酸セグメントに結合した後、少なくとも１、２、３、４、５、又は６回の増幅反応が行われる。高スループット配列決定法では、例えば増幅反応は、試料中の最初の核酸を増幅して配列決定すべきライブラリーを生成し、典型的には固体支持体上でライブラリーをクローン増幅し、そして追加の増幅反応により、試料識別バーコードなどの追加の情報又は機能を付加することを含み得る。後述するように、バーコードは、増幅過程中に及び標的濃縮の前及び／又は後にいつでも加えることができる。タグ付けされた試料核酸分子は、一方又は両方の末端に１つ又はそれ以上のバーコードを有することができる。各増幅反応は典型的には、温度サイクリング又は等温増幅中に起きるような天然の生化学反応サイクルのいずれかによる複数のサイクル（例えば、サイクル数が範囲の下端の２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、又は２０回から、範囲の上端の５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、７５、又は１００回まで）の増幅を含む。いくつかの例において、本明細書に提供される実施態様のいずれの方法も、少なくとも１０、１５、２０、２５、又は３０サイクル（例えば、ＰＣＲ増幅における熱サイクル）の増幅が行われる増幅工程を含み得る。

【0117】

いくつかの実施態様において、ＭＩＴを結合させた後、あらかじめ結合されたユニバーサル増幅プライマー結合配列に結合するユニバーサルプライマーを使用してタグ付き核酸分子を増幅して、試料核酸分子のライブラリーを生成することができる。核酸分子のライブラリー中の特定の標的核酸は、例えばマルチプレックスＰＣＲ、特に片側ＰＣＲを通して、又はハイブリッド捕捉を通して濃縮することができる。濃縮工程の後に別の普遍的な増幅反応を続けることができる。標的化増幅工程があるかどうかにかかわらず、任意のバーコード増幅反応を使用して、別々の試料又はサブプール由来の試料核酸分子から生じたタグ付き核酸分子をバーコード化して、複数の反応混合物又はサブプールからの生成物をプールすることができる。知られているように、そのようなバーコードは、タグ付き核酸分子が生成された試料を同定することを可能にする。これは、複数の出発試料を同定するために使用することができ、標識の後に試料核酸分子を分割してタグの組み合わせの総数を増加させる場合に有用であり得る。そのようなバーコードは、それらが個々の試料核酸分子を同定するのではなく、むしろそれらが、試料の混合物中で生じた核酸分子から試料を同定するため、本開示のＭＩＴとは異なる。タグ付き核酸分子又は増幅されたタグ付き核酸分子は、典型的には１つ又はそれ以上の固体支持体上にテンプレート化されており、クローン増幅されるか又はテンプレート増幅反応中にクローン増幅を実施し得る。注目すべきことは、プロセス中の任意の増幅工程において増幅エラーが導入され得ることである。本明細書に開示されている方法を使用して、どの増幅段階でエラーが発生するのか、又はエラーがその後の配列決定反応中に発生するのかを特定することが可能である。例えば、試料が複数のＰＣＲ中に分割され、各ＰＣＲが新しい異なるＭＩＴを追加する場合、特定のＰＣＲ工程でエラーが発生したかどうかを判断することが可能である。

【0118】

いくつかの実施態様において、試料核酸分子は、ＭＩＴが結合する前には変化していない；ＭＩＴを結合させた後、タグ付き核酸分子をユニバーサルプライマーを使用して増幅して、タグ付き核酸分子のライブラリー又は集団を作製する；増幅されたタグ付き核酸分子のライブラリーは、マルチプレックスＰＣＲ（例えば、片側マルチプレックスＰＣＲ）を介して標的濃縮を受ける；濃縮されたタグ付き核酸分子は任意のバーコード増幅工程を経る；１つ又はそれ以上の固体支持体上へのクローン増幅が行われる；タグ付き核酸分子の配列が決定される；そして、試料核酸分子は、結合したＭＩＴの決定された配列を使用して同定される。

【0119】

本明細書に開示される実施態様のいずれにおいても、これらの増幅工程は、熱サイクリングを用いたＰＣＲ増幅又はリコンビナーゼポリメラーゼ増幅などの等温増幅などの当該分野で周知の方法を使用して実施することができる。本明細書に開示された増幅工程のいずれにおいても、当業者は等温増幅のために前記方法をどのように適合させるかを理解するであろう。

【0120】

いくつかの実施態様において、タグ付き核酸分子を使用して、配列決定、特に高スループット配列決定のためのライブラリーを作製することができる。典型的にはタグ付き核酸分子は、本明細書の他の箇所で考察されるように、タグ付き核酸分子に組み込まれているユニバーサルプライマー結合配列に結合するユニバーサルプライマーを使用して増幅される。いくつかの実施態様において、ユニバーサル増幅は複数サイクル行われ、例えば、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、及び２０サイクルと、範囲の上端の２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、及び５０サイクルとの間で行われる。いくつかの実施態様において、増幅は、タグ付き核酸分子のそれぞれがコピーされて、範囲の下端の２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、５０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、１，２５０，０００、１，５００，０００、２，０００，０００、２，５００，０００、３，０００，０００、４，０００，０００、５，０００，０００、１０，０００，０００、２０，０００，０００、３０，０００，０００、４０，００，０００、及び５０，０００，０００コピーから、範囲の上端の５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、５０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、１，２５０，０００、１，５００，０００、２，０００，０００、２，５００，０００、３，０００，０００、４，０００，０００、５，０００，０００、６，０００，０００、７，０００，０００、８，０００，０００、９，０００，０００、１０，０００，０００、２０，０００，０００、３０，０００，０００、４０，００，０００、５０，０００，０００、１００，０００，０００、２００，０００，０００、３００，０００，０００、４００，０００，０００、５００，０００，０００、６００，０００，０００、７００，０００，０００、８００，０００，０００、９００，０００，０００、及び１，０００，０００，０００コピーまでを生成するように行われる。

【0121】

標的の濃縮
本開示の方法は、特定の実施態様において、試料核酸分子の配列を決定する工程の前に標的濃縮工程を含むことができる。いくつかの実施態様において標的濃縮は、多重ＰＣＲ反応、特に片側ＰＣＲ反応を使用して行われる。これらの実施態様において、ユニバーサルプライマー及び標的試料核酸セグメントの内部配列に結合する複数の標的特異的プライマーが使用されて、ユニバーサルプライマー結合配列と標的特異的の両方を使用して、タグ付き核酸分子からアンプリコンを生成するが、これらの配列のいずれか又は両方を欠くタグ付き核酸分子からはアンプリコンは生成されない。いくつかの実施態様において、ユニバーサルプライマーは、ＤＮＡの一方の鎖の５’ユニバーサルプライマー結合部位に結合することができ、標的特異的プライマーは、相補的ＤＮＡのもう一方の鎖の上のユニバーサルプライマー結合部位に対して３’の核酸セグメント内のＤＮＡ鎖の相補体に結合することができる。結合方向は逆にすることができ、ユニバーサルプライマーが一方の鎖の３’ユニバーサルプライマー結合部位に結合して、標的特異的プライマーが、相補的ＤＮＡのもう一方の鎖上のユニバーサルプライマー結合部位の５’の核酸セグメント内のＤＮＡ鎖の相補体に結合することができる。

【0122】

本開示のいくつかの実施態様において、ＤＮＡを優先的に濃縮することは、所望の配列を標的とする複数のハイブリッド捕捉プローブを得ること、ハイブリッド捕捉プローブを試料中のＤＮＡにハイブリダイズすること、及びＤＮＡの試料からハイブリダイズしていないＤＮＡの一部又は全部を物理的に除去することを含む。従って、標的化タグ付き核酸分子に相補的な配列を固体支持体に結合させ、標的化タグ付き核酸分子が相補配列にアニーリングし、非標的化タグ付き核酸分子がアニーリングしないような条件下でタグ付き核酸分子を加える。非標的化タグ付き核酸分子を除去した後、反応条件を調整して、標的化タグ付き核酸分子が固体支持体から解離して単離できるようにすることができる。いくつかの実施態様において、増幅工程は、ユニバーサル増幅プライマーを用いたハイブリッド捕捉の後に実施することができる。

【0123】

ハイブリッド捕捉プローブは、ＰＣＲ又は直接合成などの様々な方法によって生成されるおそらく修飾されている任意の核酸配列を指し、試料中の特定の標的ＤＮＡ配列の１つの鎖に相補的であることが意図される。調製された試料に外因性ハイブリッド捕捉プローブを添加し、変性－再アニーリングプロセスを通してハイブリダイズさせて、外因性－内因性断片の２本鎖を形成することができる。次にこれらの２本鎖は、様々な手段によって試料から物理的に分離することができる。ハイブリッド捕捉プローブは、もともと標的間の相対的均一性を使用してゲノムの大部分を標的化及び濃縮するために開発された。その用途において、全ての標的遺伝子座が配列決定により検出され得るように、全ての標的が十分な均一性で増幅されることが重要であった。しかし、元の試料中の対立遺伝子の割合を維持することについては何も考慮されていなかった。捕捉後、試料中に存在する対立遺伝子は、捕捉分子の直接配列決定により決定することができる。これらの配列決定リードは、対立遺伝子のタイプに従って分析及び計数することができる。

【0124】

本明細書で考察されるように、いくつかの実施態様における本開示の方法は、片側多重ＰＣＲ法を含む。そのような方法では、１つ又はそれ以上の末端に１つ又はそれ以上のアダプターを有するタグ付き核酸分子を使用することができる。片面ＰＣＲは２段階で行うことができる。例えば、第１の片面ＰＣＲは、標的化タグ付き核酸分子に対して、各標的化タグ付き核酸分子に特異的な複数の前進プライマー、及び全てのタグ付き核酸分子上の連結アダプター上に存在するユニバーサルプライマー結合部位に結合する逆進プライマーを使用して、実施することができる。次に、第１の片面ＰＣＲの生成物に対して第２の片面ＰＣＲを、各標的化タグ付き核酸分子に特異的な複数の前進プライマーと、最初の片面ＰＣＲ反応に使用されたユニバーサルプライマー結合部位からの同じか又は異なるユニバーサルプライマー結合部位に結合する逆進プライマーとを使用して、実施することができる。

【0125】

いくつかの実施態様において、タグ付き核酸分子は、１回又は２回の反応で、クローン増幅を介して１つ又はそれ以上の固体支持体上でテンプレート化を受ける。テンプレート化及び／又はクローン増幅の実施のための方法は当該分野で公知であり、分析に使用される配列決定方法に依存する。当業者は、クローン増幅を実施するために使用する方法を認識するであろう。

【0126】

増幅反応混合物
いくつかの実施態様において、核酸分子を増幅することは、増幅反応混合物を形成することを含むことができる。本開示に有用な増幅反応混合物は、特にＰＣＲ増幅のために、当該分野において公知の成分を含み得る。例えば、反応混合物は、典型的にはヌクレオチド三リン酸などのヌクレオチドの供給源、ポリメラーゼ、マグネシウム、及びプライマー、ならびに任意選択で１つ又はそれ以上のタグ付き核酸分子を含む。特定の実施態様における反応混合物は、ポリメラーゼ、ヌクレオチド三リン酸、タグ付き核酸分子、ならびに前進及び／又は逆進プライマーのセットを組み合わせることによって形成される。従って、特定の実施態様において、タグ付き核酸分子の集団及びプライマーのプールを含む反応混合物が本明細書で提供され、それらの少なくともいくつかは、タグ付き核酸分子の集団内のタグ付き核酸分子に結合する。ＭＩＴ配列に加えて、タグ付き核酸分子は、例えば配列決定反応及び／又はユニバーサル増幅反応のための結合プライマーのためのアダプター配列を含み得る。いくつかの実施態様において、タグ付き核酸配列を増幅するための前進及び逆進プライマーは、全てのタグ付き核酸配列が増幅されるように、タグ付き核酸分子に結合しているユニバーサルプライマー結合配列に結合するように設計することができる。いくつかの実施態様において、前進及び逆進プライマーは、一方がユニバーサルプライマー結合配列に結合し、例えば片側ＰＣＲにおけるように、他方が試料核酸セグメント内の標的特異的配列に結合するように設計することができる。他の実施態様において、前進及び逆進プライマーは両方とも、例えば両側ＰＣＲにおけるように、試料核酸セグメントの配列内の標的特異的配列に結合するように設計することができる。

【0127】

本明細書に開示される実施態様のいずれにおいても、反応混合物は、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、５５、６０、６５、７０、７５、８０、８５、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、２００、２２５、２５０、３００、３５０、４００、４５０、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、５０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、１，２５０，０００、１，５００，０００、２，０００，０００、２，５００，０００、３，０００，０００、４，０００，０００、５，０００，０００、１０，０００，０００、２０，０００，０００、３０，０００，０００、４０，００，０００、５０，０００，０００、１００，０００，０００、２００，０００，０００、３００，０００，０００、４００，０００，０００、５００，０００，０００、６００，０００，０００、７００，０００，０００、８００，０００，０００、９００，０００，０００、ａｎｄ１，０００，０００，０００のタグ付き核酸分子から、範囲の上端の３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、３０，０００、４０，０００、５０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、１，２５０，０００、１，５００，０００、２，０００，０００、２，５００，０００、３，０００，０００、４，０００，０００、５，０００，０００、６，０００，０００、７，０００，０００、８，０００，０００、９，０００，０００、１０，０００，０００、２０，０００，０００、３０，０００，０００、４０，００，０００、５０，０００，０００、１００，０００，０００、２００，０００，０００、３００，０００，０００、４００，０００，０００、５００，０００，０００、６００，０００，０００、７００，０００，０００、８００，０００，０００、９００，０００，０００、１，０００，０００，０００、２，０００，０００，０００、３，０００，０００，０００、４，０００，０００，０００、５，０００，０００，０００、６，０００，０００，０００、７，０００，０００，０００、８，０００，０００，０００、９，０００，０００，０００、及び１０，０００，０００，０００のタグ付き核酸分子までを含むことができる。いくつかの実施態様において、反応混合物は、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、ａｎｄ１０，０００コピーの各タグ付き核酸分子から、範囲の上端の２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００、３０，０００、４０，０００、５０，０００、及び１００，０００コピーの各タグ付き核酸分子までを含むことができる。

【0128】

本明細書に開示される実施態様のいずれにおいても、少なくとも１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は９９．９％のタグ付き核酸分子がうまく増幅され、ここで成功した増幅は、少なくとも８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％の効率を有するＰＣＲとして定義される。

【0129】

さらなる実施態様において、反応混合物は、それぞれ長さが５０～５００ヌクレオチドであり、１０～１００，０００の異なる試料核酸セグメントを有する１００～１，０００，０００のタグ付き核酸分子の集団、及びそれぞれ４～２０ヌクレオチドの長さである１０～５００のＭＩＴのＭＩＴのセットを含むことができ、ここで、試料核酸セグメントの数と集団中のＭＩＴの数との比は２：１～１００：１である。特定の実施態様において、ＭＩＴのセットの各メンバーは、集団の少なくとも１つのタグ付き核酸分子に結合している。特定の実施態様において、集団の少なくとも２つのタグ付き核酸分子は、少なくとも１つの同一のＭＩＴと５０％を超える差がある試料核酸セグメントとを含む。いくつかの実施態様において、反応混合物はポリメラーゼ又はリガーゼを含み得る。

【0130】

いくつかの実施態様において、反応混合物は、範囲の下端の２５、５０、１００、２００、２５０、３００、４００、５００、１，０００、２、５００、５，０００、１０，０００、２０，０００、２５，０００、又は５０，０００のプライマー又はプライマー対から、範囲の上端の２００、２５０、３００、４００、５００、１，０００、２，５００、５，０００、１０，０００、２０，０００、２５，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、１２５，０００、１５０，０００、２００，０００、２５０，０００、３００，０００、４，０００、又は５００，０００のプライマー又はプライマー対までを含む、プライマーのセット、ライブラリー、又はプライマーのプールを含むことができ、それぞれは、複数のタグ付き核酸分子の１つ又はそれ以上の中に位置するプライマー結合配列に結合する。

【0131】

いくつかの実施態様において、配列決定に有用である核酸分子のライブラリーが形成される。いくつかの実施態様において、このライブラリーは、範囲の下端の、各タグ付き核酸分子の１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、及び１，０００コピーから、範囲の上端の、各タグ付き核酸分子の２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、及び１０，０００コピーまでを含むことができる。

【0132】

いくつかの実施態様において、核酸分子のライブラリーは、核酸セグメントの５’末端に同一の結合した第１ＭＩＴを有し、核酸セグメントの３’末端に同一の結合した第２のＭＩＴを有し、少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、又は２０ヌクレオチドの違いを有する試料核酸セグメントとを含む、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、１００、１５０、２００、２５０、３００、４００、５００、６００、７００、８００、９００、及び１，０００のタグ付き核酸分子を含むことができる。

【0133】

いくつかの態様において、核酸分子のライブラリーは、１つの固体支持体又は複数の固体支持体上にタグ付き核酸分子のそれぞれの複数のクローン集団を含みうる。

【0134】

いくつかの実施態様において、プルーフリーディング活性を有するポリメラーゼ、プルーフリーディング活性を有さない（又は無視できる）ポリメラーゼ、又はプルーフリーディング活性を有するポリメラーゼとプルーフリーディング活性を有さない（又は無視できる）ポリメラーゼとの混合物が、本明細書の増幅反応混合物に含まれる。いくつかの実施態様において、ホットスタートポリメラーゼ、非ホットスタートポリメラーゼ、又はホットスタートポリメラーゼと非ホットスタートポリメラーゼの混合物が使用される。いくつかの実施態様において、HotStar Taq DNAポリメラーゼが使用される（例えば、Qiagen, Hilden, Germanyを参照されたい）。いくつかの実施態様において、AmpliTaq Gold（登録商標）ＤＮＡポリメラーゼが使用される（Thermo Fisher, Carlsbad, CA）。いくつかの態様において、反応混合物中に過剰の鋳型があるとき及び長い生成物を増幅するときに、効率的なＰＣＲ増幅を提供する高忠実度ポリメラーゼであるPrimeSTAR GXL ＤＮＡポリメラーゼが使用される（Takara Clontech, Mountain View, CA）。いくつかの態様において、KAPA Taq ＤＮＡポリメラーゼ又はKAPA Taq HotStart ＤＮＡポリメラーゼが使用される；これらは、好熱性細菌Thermus aquaticusの単一サブユニットである野生型ＴａｑＤＮＡポリメラーゼに基づいており、５’－３’ポリメラーゼ及び５’－３’エキソヌクレアーゼ活性を有するが、３’－５’エキソヌクレアーゼ（プルーフリーディング）活性はない（Kapa Biosystems, Wilmington, MA）。いくつかの実施態様において、ＰｆｕＤＮＡポリメラーゼが使用される；これは、超好熱性古細菌Pyrococcus furiosusからの熱安定性の高いＤＮＡポリメラーゼである。Ｐｆｕは、ヌクレオチドの５’→３’方向の２本鎖ＤＮＡへの鋳型依存性重合を触媒し、またポリメラーゼがヌクレオチド組み込みエラーを修正することを可能にする３’→５’エキソヌクレアーゼ（プルーフリーディング）活性を示す。これは５’→３’エキソヌクレアーゼ活性を有さない（Thermo Fisher Scientific, Waltham, MA）。いくつかの実施態様において、Klentaq 1が使用される。これは、エキソヌクレアーゼ活性もエンドヌクレアーゼ活性も有さないＴａｑＤＮＡポリメラーゼのクレノウ断片類似体である（DNA Polymerase Technology, St. Louis, MO）。いくつかの実施態様において、ポリメラーゼは、Phusion High-Fidelity ＤＮＡポリメラーゼ又はPhusion Hot Start Flex ＤＮＡポリメラーゼなどのPhusion ＤＮＡポリメラーゼ（New England BioLabs, Ipswich, MA）である。いくつかの実施態様において、ポリメラーゼは、Ｑ５（登録商標）High-Fidelity ＤＮＡポリメラーゼ又はＱ５（登録商標）Hot Start High-Fidelity ＤＮＡポリメラーゼ（New England BioLabs）などのＱ５（登録商標）ＤＮＡポリメラーゼである。いくつかの実施態様において、ポリメラーゼはＴ４ＤＮＡポリメラーゼ（New England BioLabs）である。

【0135】

いくつかの実施態様において、５～１００、１００～２００、２００～３００、３００～４００、４００～５００、又は５００～６００単位／ｍＬ（包括的）などの、５～６００単位／ｍＬ（反応容量１ｍＬあたりの単位）のポリメラーゼが使用される。

【0136】

ＰＣＲ法
いくつかの実施態様において、ＰＣＲ熱サイクリングの前に重合を低減又は防止するためにホットスタートＰＣＲが使用される。例示的なホットスタートＰＣＲ法は、反応混合物がより高い温度に達するまで、ＤＮＡポリメラーゼの初期阻害又は反応成分反応物の物理的分離を含む。いくつかの実施態様において、マグネシウムの徐放が使用される。ＤＮＡポリメラーゼは活性のためにマグネシウムイオンを必要とし、従ってマグネシウムは化合物に結合することによって反応物から化学的に分離され、そして高温でのみ溶液中に放出される。いくつかの実施態様において、阻害剤の非共有結合が使用される。この方法では、ペプチド、抗体、又はアプタマーを低温で酵素に非共有結合されて、その活性を阻害することができる。高温でインキュベートした後、阻害剤が放出されて反応が始まる。いくつかの実施態様において、低温でほとんど活性を示さない修飾ＤＮＡポリメラーゼなどの低温感受性Ｔａｑポリメラーゼが使用される。いくつかの実施態様において、化学修飾が用いられる。この方法では、分子はＤＮＡポリメラーゼの活性部位のアミノ酸の側鎖に共有結合される。分子は、反応混合物を高温でインキュベートすることによって酵素から放出される。分子が放出されると、酵素は活性化される。

【0137】

いくつかの実施態様において、テンプレート核酸（ＲＮＡ又はＤＮＡ試料など）の量は、２０～５，０００ｎｇであり、例えば２０～２００ｎｇ、２００～４００。４００～６００。６００～１，０００、１，０００～１，５００、又は２，０００～３，０００ｎｇ（包括的）である。

【0138】

ＰＣＲを実施するための方法は当該分野において公知である。そのような方法は、典型的には、変性工程、アニーリング工程、及び伸長工程（これはアニーリング工程と同じでも異なっていてもよい）のサイクルを含む。

【0139】

例示的な条件のセットは、セミネステッドＰＣＲアプローチを含む。第１のＰＣＲ反応は、２×Qiagen MM最終濃度、ライブラリー中の１．８７５ｎＭの各プライマー（外側の前進プライマー及び逆進プライマー）、ならびにＤＮＡ鋳型を含む２０μｌの反応容量を使用する。熱サイクリングパラメータは、９５°Ｃで１０分間；９６°Ｃで３０秒間、６５°Ｃで１分間、５８°Ｃで６分間、６０°Ｃで８分間、６５°Ｃで４分間、及び７２°Ｃで３０秒間を２５サイクル；その後、７２°Ｃで２分間を含み、次に４°Ｃで保持する。次に、１：２００に希釈した２μｌの得られた生成物を、第２のＰＣＲ反応における投入物として使用する。この反応は、１×Qiagen MM最終濃度、２０ｎＭの各内側の前進プライマー、及び１μＭの逆進プライマータグを有する１０μｌの反応容量を使用する。熱サイクリングパラメータは、９５°Ｃで１０分間；９５°Ｃで３０秒間、６５°Ｃで１分間、６０°Ｃで５分間、６５°Ｃで５分間、そして７２°Ｃで３０秒間を１５サイクル；その後、７２°Ｃで２分間を含み、次に後４°Ｃで保持する。本明細書で考察されるように、アニーリング温度は、本明細書で考察されるように、場合によりプライマーのいくつか又は全ての融解温度より高くてもよい（２０１５年１０月２０日に出願された米国特許出願第１４／９１８，５４４号明細書を参照のこと、これは参照することによりその全体が本明細書に組み込まれる）。

【0140】

融解温度（Ｔ_m）は、オリゴヌクレオチド（プライマーなど）とその完全相補体とのＤＮＡ２本鎖の半分（５０％）が解離して１本鎖ＤＮＡになる温度である。アニーリング温度（Ｔ_A）は、ＰＣＲプロトコールを実行する温度である。従来の方法では、これは通常使用されるプライマーの最低Ｔ_mより５°Ｃ低いため、ほぼ全ての可能な２本鎖が形成される（本質的に全てのプライマー分子が鋳型核酸に結合する）。これは非常に効率的であるが、低温では非特異的反応が起こりやすくなる。低すぎるＴ_Aを有することの１つの結果は、内部一塩基ミスマッチ又は部分的アニーリングが許容され得るため、プライマーが真の標的以外の配列にアニーリングし得ることである。本開示のいくつかの実施態様ではＴ_Aは（Ｔ_m）よりも高く、所定の瞬間に、ごく一部の標的のみがプライマーをアニーリングしている（約１～５％など）。これらが伸長すると、これらはアニーリングする及び解離するプライマーと標的の平衡から除かれ（伸長がＴ_mを７０°Ｃを超えるまで急速に上昇させるため）、そして標的の新しい約１～５％がプライマーを有する。従って、アニーリングのために反応に長い時間を与えることにより、サイクル当たり約１００％の標的コピーを得ることができる。

【0141】

様々な実施態様において、アニーリング温度の範囲は、範囲の下端の１°Ｃ、２°Ｃ、３°Ｃ、４°Ｃ、５°Ｃ、６°Ｃ、７°Ｃ、８°Ｃ、９°Ｃ、１０°Ｃ、１１°Ｃ、１２°Ｃ、及び１３°Ｃから、範囲の上端の２°Ｃ、３°Ｃ、４°Ｃ、５°Ｃ、６°Ｃ、７°Ｃ、８°Ｃ、９°Ｃ、１０°Ｃ、１１°Ｃ、１２°Ｃ、１３°Ｃ、及び１５°Ｃまでであり、同一でないプライマーの少なくとも２５、５０、６０、７０、７５、８０、９０、９５、又は１００％の融解温度（例えば、経験的に測定又は計算されたＴ_m）よりも高い。様々な実施態様において、アニーリング温度は１°Ｃ～１５°Ｃ（例えば１°Ｃ～１０°Ｃ、１°Ｃ～５°Ｃ、１°Ｃ～３°Ｃ、３°Ｃ～５°Ｃ、５°Ｃ～１０°Ｃ、５°Ｃ～８°Ｃ、８°Ｃ～１０°Ｃ、１０°Ｃ～１２°Ｃ、又は１２°Ｃ～１５°Ｃ、包括的）であり、少なくとも２５；５０；７５；１００；３００；５００；７５０；１，０００；２，０００；５，０００；７，５００；１０，０００；１５，０００；１９，０００；２０，０００；２５，０００；２７，０００；２８，０００；３０，０００；４０，０００；５０，０００；７５，０００；１００，０００；又は全ての同一でないプライマーの融解温度（例えば、実験的に測定又は計算されたＴ_mなど）より高い。様々な実施態様において、アニーリング温度は、１～１５°Ｃ（例えば、１°Ｃ～１０°Ｃ、１°Ｃ～５°Ｃ、１°Ｃ～３°Ｃ、３°Ｃ～５°Ｃ、３°Ｃ～８°Ｃ、５°Ｃ～１０°Ｃ、５°Ｃ～８°Ｃ、８°Ｃ～１０°Ｃ、１０°Ｃ～１２°Ｃ、又は１２°Ｃ～１５°Ｃ、包括的）であり、少なくとも２５％、５０％、６０％、７０％、７５％、８０％、９０％、９５％、又は全ての同一でないプライマーの融解温度（例えば、経験的に測定又は計算されたＴ_m）よりも高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、５～１８０分、例えば１５～１２０分、１５～６０分、１５～４５分、又は２０～６０分（包括的）である。

【0142】

ＰＣＲ中の熱サイクリングに加えて、等温増幅は核酸分子を増幅するための手段として認識されている。本明細書中に開示されるＰＣＲ方法のいずれにおいても、当業者はこの方法と共に使用するために方法をどのように適合させるかを理解するであろう。例えば、いくつかの実施態様において、反応混合物はタグ付き核酸分子、プライマーのプール、ヌクレオチド三リン酸、マグネシウム、及び等温ポリメラーゼを含むことができる。等温増幅を行うために利用可能ないくつかの等温ポリメラーゼがある。これらは、Bst ＤＮＡポリメラーゼ、完全長；Bst ＤＮＡポリメラーゼ、ラージ断片；Bst 2.0 ＤＮＡポリメラーゼ；Bst 2.0 armStart ＤＮＡポリメラーゼ；及びBst 3.0 ＤＮＡポリメラーゼ（全てNew England Biolabsから入手可能）を含む。使用されるポリメラーゼは、等温増幅の方法に依存し得る。いくつかのタイプの等温増幅が利用可能であり、リコンビナーゼポリメラーゼ増幅（ＲＰＡ）、ループ介在等温増幅（ＬＡＭＰ）、鎖置換増幅（ＳＤＡ）、ヘリカーゼ依存性増幅（ＨＤＡ）、ニッキング酵素増幅反応（ＮＥＡＲ）、及びテンプレートウォーキングが含まれる。

【0143】

タグ付き核酸分子の配列決定
いくつかの実施態様において、タグ付き核酸分子の配列は、当該分野において公知の方法、特に高スループット配列決定法によって直接決定される。より典型的には、タグ付き核酸分子の配列は、高スループット配列決定法のための試料調製中に行われる１回以上の増幅ラウンドの後に決定される。このような増幅は、典型的にはライブラリー調製、クローン増幅、及び試料バーコードなどのさらなる配列又は機能を試料核酸分子に付加するための増幅を含む。高スループット配列決定法の試料調製中に、タグ付き核酸分子は典型的には１つ又はそれ以上の固体支持体上でクローン的に増幅される。次にこれらのモノクローナル又は実質的にモノクローナルのコロニーは配列決定反応に供される。さらに、次世代配列決定法の試料調製は、典型的にはライブラリー調製後及びクローン増幅前の標的化増幅反応を含み得る。このような標的化増幅は多重増幅反応であり得る。

【0144】

本明細書に開示されている実施態様のいずれにおいても、方法及び組成物を使用して、試料核酸分子中の真の配列変異に対する増幅エラーを同定することができる。本開示は、増幅エラーの可能性のある原因をさらに識別することができ、そして最初の試料核酸分子の最も可能性の高い真の配列をさらに同定することができる。

【0145】

本明細書で提供される方法のいくつかの実施態様において、少なくとも１つのタグ付き核酸分子の、少なくとも一部の配列及びいくつかの実施態様において全配列が決定される。核酸分子の配列を決定するための方法は当該分野において公知である。当該分野で公知の任意の配列決定方法、例えば、Sanger配列決定法、ピロ配列決定法、可逆的ダイターミネーター配列決定法、連結による配列決定法、又はハイブリダイゼーションによる配列決定法は、そのような配列決定に使用され得る。いくつかの実施態様において、特に限定されるものではないが、Solexa（Illumina）、Genome Analyzer IIx（Illumina）、MiSeq（Illumina）、HiSeq（Illumina）、454 （Roche）、SOLiD（Life Technologies）、Ion Torrent（Life Technologies、Carlsbad, CA）、GS FLX +（Roche）、True Single Molecule Sequencing platform （Helicos）, 電子顕微鏡配列決定法（Halcyon Molecular）などの高スループット次世代（超並列）配列決定法技術を使用することができ、又は本明細書で提供される方法によって生成されたタグ付き核酸分子を配列決定するために他の配列決定方法を使用することができる。いくつかの実施態様において、任意の高スループット、超並列配列決定法を使用することができ、そして当業者は、開示された方法を調整して適切なＭＩＴ結合を達成する方法を理解するであろう。従って、例えば合成による配列決定又は連結による配列決定、高スループット反応を使用することができる。さらに、シーケンサーは、蛍光シグナル又は水素イオンのようなイオンであり得る、配列決定反応中に発生したシグナルを検出することができる。これらの方法は全て、ＤＮＡの試料に格納されている遺伝子データを物理的に遺伝子データのセットに変換し、これは典型的には処理されるまでメモリ装置に格納される。

【0146】

試料核酸分子の同定
タグ付き核酸分子の配列を決定する工程は、試料核酸分子、試料核酸セグメント、又は標的遺伝子座の少なくとも一部の配列、及び試料核酸セグメントに結合したままであるタグの配列（ＭＩＴの配列を含む）を決定することを含む。いくつかの実施態様において、同じ最初のタグ付き核酸分子に由来するタグ付き核酸分子のコピーは、タグ付き核酸分子に結合したＭＩＴ配列を比較することによって同定することができる。同じ初期タグ付き核酸分子に由来するコピーは、試料核酸セグメントに対して同じ位置に結合した同じＭＩＴを有するであろう。いくつかの実施態様において、断片特異的挿入体末端は生物のゲノム内の特定の位置にマッピングされ、これらのマッピングされた位置又は本明細書で考察されるような断片特異的挿入体末端自体の配列は、ＭＩＴの配列と共に使用されて、コピーが由来する最初のタグ付き核酸分子が同定される。いくつかの実施態様において、相補的ＭＩＴ及び相補的核酸セグメント配列を含むタグ付き核酸分子、すなわち、同じ核酸分子に由来し試料核酸分子のプラス鎖及びマイナス鎖を表すタグ付き核酸分子が同定され、対になる。いくつかの実施態様において、対になったＭＩＴファミリーは、元の配列中の差異を証明するために使用される。配列におけるいかなる変化も、試料核酸分子に由来するタグ付き核酸分子の全てのコピーに存在するはずである。この情報は、試料のプラス鎖及びマイナス鎖に由来するタグ付き核酸分子の配列が試料核酸分子の配列の違いを表し、試料調製中に導入された変化でも又は配列決定中の塩基呼び出しエラーでもないというさらなる確信を提供する。

【0147】

いくつかの実施態様において、さらなる分析に有益な２つの主要な種類のタグ付き核酸分子が生成される：同じ位置に同一の結合ＭＩＴを有し、かつ実質的に同じ試料核酸セグメント配列を有するタグ付き核酸分子、そして異なる結合ＭＩＴを有し、かつ実質的に同じ試料核酸セグメント配列を有するタグ付き核酸分子。本明細書で詳細に考察されるように、同じ位置に同一の結合ＭＩＴを有し、かつ実質的に同じ試料核酸セグメント配列を有するタグ付き核酸分子を使用して、増幅エラーを同定することができ、結合ＭＩＴ間に少なくとも１つの相違を有し、かつ実質的に同じ試料核酸セグメント配列を有するタグ付き核酸分子を使用して、真の配列変異体を同定することができる。

【0148】

ＭＩＴが結合した後、同じ相対位置に同一のＭＩＴを有するタグ付き核酸分子の配列を、実質的に同じ試料核酸配列と比較することにより、増幅エラーを同定することができる。初期試料核酸分子の両方の鎖が同じ１つ又はそれ以上のＭＩＴでタグ付けされている場合、相補的ＭＩＴと核酸セグメント配列とを有する対になったＭＩＴ核酸セグメントファミリーを同定することが可能である。これらの対になったＭＩＴ核酸セグメントファミリーを使用して、配列変異が試料核酸分子の両方の鎖に存在していたという確信を高めることができる。試料核酸分子に由来するタグ付き核酸分子がそれらの配列に相違を示す場合、それは試料核酸分子にミスマッチが存在したか、又は増幅又は塩基呼び出し中にエラーが導入されたかのいずれかである。配列の相違を有する対になったＭＩＴ核酸セグメントファミリーからの配列は、典型的にはさらなる分析が行われる前に廃棄されるであろう。しかし、配列の相違を有するこれらの対になったＭＩＴ核酸セグメントファミリーは、試料核酸分子中のミスマッチを同定するために使用され得る。

【0149】

核酸セグメントの配列に１つ又はそれ以上の変化を導入する増幅エラーは、最初のタグ付き核酸分子に由来する全てのコピー中に存在するのではないであろう。増幅の第１ラウンドにエラーが導入されるならば、最初のタグ付き核酸分子の両方の鎖に由来する最大２５％のコピーは核酸セグメントの配列にエラーを有するであろう。完全な効率で増幅が進行する場合、特定のエラーを有するコピーの割合は、増幅の各ラウンド毎に半分になり、すなわち２回目のラウンドでエラーが導入されると、最初のタグ付き核酸分子由来のコピーの１２．５％がエラーを有し、３回目の増幅中にエラーが導入された場合、最初のタグ付き核酸分子由来のコピーの６．２５％がエラーを有することになる。この知識を使用して、増幅エラーがいつ生じたかを同定又は推定することができる；ＭＩＴが結合された後に複数の増幅が起こる実施態様では、その段階で増幅エラーが導入されたことを含む。本明細書に開示された実施態様のいずれにおいても、試料核酸セグメント内に増幅エラーが存在する場合、本明細書に詳述された方法を使用して、最初の試料核酸分子の最も可能性の高い配列を決定することができる。例えば最もありそうな配列は、最も一般的な配列としての最初のタグ付き核酸分子のコピーのプールから決定され得る。いくつかの実施態様において、最も可能性の高い配列決定する場合、例えば、正常細胞又は罹患細胞中の特定の染色体部位における既知の突然変異率、又は特定の単一ヌクレオチド多型の集団頻度などの事前確率を使用することができる。

【0150】

異なるＭＩＴ及び実質的に同じ核酸セグメント配列を有する２つ以上のタグ付き核酸分子において同一の増幅エラーを有する可能性は非常に低く、従って、同じ相対位置に実質的に同じ配列及び同一のＭＩＴを有するタグ付き核酸分子上の同一配列変異体は、同じ分子に由来しており、独立して生じたものではないと見なされる。

【0151】

１つの最初のタグ付き核酸分子に由来する全てのコピーは変異位置に同じ配列を有し、及び実質的に同じ試料核酸セグメント配列及びＭＩＴの差異を有するタグ付き核酸分子のコピーの少なくとも１つのプールは、同じ変異体位置において異なる配列を有するため、試料核酸セグメント中に存在する真の配列変異を同定することができ、ここで、ＭＩＴの差異は、ＭＩＴのセットからの少なくとも１つの異なる結合ＭＩＴであるか、又は同一のＭＩＴの異なる相対位置のいずれかであり得る。

【0152】

本明細書に開示される実施態様のいずれにおいても、配列変化を伴う同じ初期タグ付き核酸分子に由来するコピーの割合が、５０％、４５％、４０％、３５％、３０％、２５％、２０％、１５％、１０％、９％、８％、７％、６％、５％、４％、３％、２％、又は１％未満である場合、配列差異は増幅エラーと呼ぶことができる。特定の実施態様において、結合ＭＩＴが同一で相対位置が同一である場合、及び試料核酸セグメント配列が実質的に同じである場合、コピーは同じ初期タグ付き核酸分子に由来すると言える。本明細書に開示された実施態様のいずれにおいても、配列が、実質的に同じ試料核酸セグメントを有する少なくとも２種のタグ付き核酸分子で異なり、実質的に同じ試料核酸セグメントを有する少なくとも２種のタグ付き核酸分子のそれぞれに由来するコピーのプールが、各プール内で少なくとも７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％同一であり、各プールが、試料核酸セグメントに対して異なる位置に少なくとも１つの異なるＭＩＴを及び／又はＭＩＴを有することによって同定される場合、配列変化は初期タグ付き核酸分子における真の配列変異体と呼ぶことができる。

【0153】

いくつかの実施態様において、タグ付き核酸分子の配列を使用して、範囲の下端の１％、２％、３％、４％、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、又は９９．９％の試料核酸分子から、範囲の上端の２％、３％、４％、５％、１０％、１５％、２０％、２５％、３０％、３５％、４０％、４５％、５０％、５５％、６０％、６５％、７０％、７５％、８０％、８５％、９０％、９５％、９６％、９７％、９８％、９９％、９９．９％、又は１００％の試料核酸分子までを同定することができる。

【0154】

いくつかの実施態様において、各試料核酸分子について本方法を使用して、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、５０、７５、１００、２５０、５００、１，０００、２，０００、３，０００、４，０００、５，０００、１０，０００、１５，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、１００，０００の増幅エラーから、範囲の上端の５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、２５０、５００、１，０００、２，０００、３，０００、４，０００、５，０００、１０，０００、１５，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、及び１，０００，０００の増幅エラーまでを同定することができる。いくつかの実施態様において、各試料核酸分子について本方法を使用して、試料核酸分子中の範囲の下端の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、５０、７５、１００、２５０、５００、１，０００、２，０００、３，０００、４，０００、５，０００、１０，０００、１５，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、及び１００，０００の真の配列変異体から、試料核酸分子中の範囲の上端の２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、３０、３５、４０、４５、５０、７５、１００、２５０、５００、１，０００、２，０００、３，０００、４，０００、５，０００、１０，０００、１５，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００の真の配列変異体までを同定することができる。

【0155】

本明細書に開示された実施態様の他の用途は、方法をどのように適合させるかを理解する当業者には明らかであろう。例えば、本方法は、増幅バイアス、特に増幅エラー導入後の特定の核酸分子の増幅バイアスの変化を測定するために使用することができる。この方法はまた、ポリメラーゼの突然変異率を特徴付けるためにも使用し得る。試料を分割し、反応混合物をバーコード化することにより、異なるポリメラーゼの突然変異率を同時に特徴付けることが可能である。

【0156】

ＭＩＴ用キット
本明細書に開示される様々な実施態様において使用される構成要素のいずれも、キットに組み立てることができる。キットは、本明細書に開示されるＭＩＴのセットのいずれかを収容する容器を含み得る。ＭＩＴは、範囲の下端の２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、及び１５ヌクレオチドの長さから、範囲の上端の５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２５、及び３０ヌクレオチドの長さまでであり得る。ＭＩＴは２本鎖核酸アダプターであり得る。これらのアダプターは、塩基対合２本鎖ポリヌクレオチドセグメントと少なくとも１つの非塩基対合１本鎖ポリヌクレオチドセグメントとを有する、Ｙアダプター核酸分子の一部をさらに含み得る。これらのＹアダプターは、ＭＩＴの配列以外に同一の配列を含み得る。Ｙアダプターの２本鎖ポリヌクレオチドセグメントは、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１５、２０、及び２５ヌクレオチドの長さから、範囲の上端の５、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、及び１００ヌクレオチドの長さまでであり得る。Ｙアダプターの１本鎖ポリヌクレオチドセグメントは、範囲の下端の１、２、３、４、５、６、７、８、９、１０、１５、２０、及び２５ヌクレオチドの長さから、範囲の上端の５、１０、１５、２０、２５、３０、３５、４０、４５、５０、６０、７０、８０、９０、及び１００ヌクレオチドの長さまでであり得る。

【0157】

本明細書に開示される実施態様のいずれにおいても、ＭＩＴは、ユニバーサルプライマー結合配列を含むポリヌクレオチドセグメントの一部であり得る。いくつかの実施態様において、ＭＩＴは、ユニバーサルプライマー結合配列に対して５’に位置し得る。いくつかの実施態様において、ポリヌクレオチドセグメントがＤＮＡに結合したときに、ＭＩＴの配列が非塩基対合ループを形成するように、ＭＩＴをユニバーサルプライマー結合配列内に配置することができる。本明細書に開示される実施態様のいずれにおいても、キットは、試料核酸分子、核酸セグメント、又は標的遺伝子座の内部配列に結合するように設計された試料特異的プライマーのセットを含み得る。いくつかの実施態様において、ＭＩＴは、試料特異的プライマー配列をさらに含むポリヌクレオチドの一部であり得る。これらの実施態様において、ポリヌクレオチドセグメントがＤＮＡに結合したときにＭＩＴの配列が非塩基対合ループを形成するように、ＭＩＴを試料特異的プライマー配列の５’に配置するか、又はＭＩＴを試料特異的プライマー配列内に配置することができる。いくつかの態様において、試料特異的プライマーのセットは、各標的遺伝子座についての前進及び逆進プライマーを含み得る。いくつかの実施態様において、試料特異的プライマーのセットは、前進又は逆進プライマーでもよく、ユニバーサルプライマーのセットは、それぞれ逆進又は前進プライマーとして使用することができる。

【0158】

本明細書に開示される実施態様のいずれにおいても、キットは、１つ又はそれ以上の固定化基材上に１本鎖オリゴヌクレオチドを含み得る。いくつかの実施態様において、ハイブリッド捕捉を実行し、未結合核酸分子を除去することにより、１つ又はそれ以上の固定化基材上の１本鎖オリゴヌクレオチドを使用して、特定の配列について試料を濃縮することができる。本明細書に開示される実施態様のいずれにおいても、キットは、細胞溶解緩衝液を収容する容器、細胞溶解を実行するための管、及び／又は試料からＤＮＡを精製するための管を含むことができる。いくつかの実施態様において、細胞溶解緩衝液、１つ及び／又はそれ以上の管は、循環性無細胞胎児ＤＮＡ及び循環性無細胞腫瘍を含む血液試料中に見られる循環性無細胞ＤＮＡなどの特定の種類の細胞又は試料用に設計できる。

【0159】

本明細書に開示されるキットのいずれも、以下のいずれかを含む増幅反応混合物を含み得る：反応緩衝液、ｄＮＴＰ、及びポリメラーゼ。いくつかの態様において、キットは連結緩衝液及びリガーゼを含み得る。本明細書に開示される実施態様のいずれにおいても、キットは、タグ付き核酸分子を１つ又はそれ以上の固体支持体上にクローン増幅するための手段を含むこともできる。当業者は、本明細書の様々な方法のためのそのようなキットの使用を可能にするために、どの成分をキットに含めるべきかを理解するであろう。

【0160】

目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数の決定
いくつかの実施態様において、ＭＩＴを使用して個々の試料核酸分子を同定するために本明細書で提供される方法は、試料中の目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する方法の一部として使用され得る。実施例３に提供される数学的証拠によって証明されるように、試料中の目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定するための方法の一部として、個々の試料核酸分子を同定するためのＭＩＴを含む方法を使用することにより、大幅なコスト節約と試料節約を達成することができる。例えば、実施例１に示された個々の試料核酸分子を同定するためのＭＩＴの使用で得られたノイズの減少及び精度の向上に基づいて、わずか１００μｌの血漿を使用して、許容し得る信頼性のある結果を得ることができる。さらに、許容し得る信頼性のある結果は、わずか１，７８０，０００の配列決定法読み取りで達成することができる。従って、現在の方法における２つの重要な制限、すなわち試料量とコストとを克服することができる。

【0161】

本開示は、他の分野の中でも、本明細書中に開示されるように、試料中の目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数の決定において有用である。本開示の方法における使用に適合させることができる目的の染色体又は染色体セグメントの数を決定するための方法には、例えば２０１２年３月２９日に出願された米国特許出願第１３／４９９，０８６号；２０１５年４月２１日に出願された米国特許出願第１４／６９２，７０３号；２０１５年１０月７日に出願された米国特許出願第１４／８７７，９２５号；２０１５年１０月２０日に出願された米国特許出願第１４／９１８，５４４号；“母体血から得られた無細胞ＤＮＡの非侵襲的出生前検出と選択的分析：２１トリソミーと１８トリソミーの評価”（Sparks et al. April 2012. American Journal of Obstetrics and Gynecology. 206(4):319.e1-9）；「大幅に多重化したＰＣＲ法を用いた乳癌患者からの無細胞ＤＮＡ中のクローン及びサブクローンのコピー数変異体の検出」（Kirkizlar et al. October 2015. Translation Oncology. 8(5):407-416）に開示されたものが含まれる。これらはそれぞれ参照によりその全体が本明細書に組み込まれる。

【0162】

ＭＩＴを使用すると、許容し得る信頼性のある結果を得るために、より少ない試料量の血液又はその画分が必要とされる場合がある。いくつかの実施態様において血液の試料は、非侵襲的出生前試験に使用するための母体血液試料であり得る。これにより、患者への影響を低減することができ、試料調製のコストを減らすことができる。本明細書に開示される実施態様のいずれにおいても、試料の容量は、範囲の下端の０．０１、０．０２、０．０３、０．０４、０．０５、０．０６、０．０７、０．０８、０．０９、０．１、０．１２５、０．１５、０．１７５、０．２、０．２５、０．３、０．３５、０．４、０．４５、及び０．５ｍｌから、範囲の上端の０．０５、０．０６、０．０７、０．０８、０．０９、０．１、０．１２５、０．１５、０．１７５、０．２、０．２５、０．３、０．３５、０．４、０．４５、０．５、０．６、０．７、０．８、０．９、１、１．２５、１．５、１．７５、２、２．５、３、３．５、４、４．５、及び５ｍｌまでであり得る。いくつかの実施態様において、試料容量は、範囲の下端の０．１、０．１２５、０．１５、０．１７５、０．２、０．２５、０．３、０．３５、０．４、０．４５、及び０．５ｍｌから、範囲の上端の０．２５、０．３、０．３５、０．４、０．４５、０．５、０．６、０．７、０．８、０．９、１、１．２５、１．５、１．７５、２、２．５、及び３ｍｌまでであり得る。

【0163】

本明細書に開示される実施態様のいずれにおいても、試料は、胎児及び胎児の母親からの循環性無細胞ＤＮＡを含む母体血液試料であり得る。いくつかの実施態様において、これらの試料は、非侵襲的出生前試験を実施するために使用される。他の実施態様において試料は、癌に罹患しているか又は癌に罹患している疑いのある人からの血液試料であり得る。いくつかの実施態様において、循環性無細胞ＤＮＡは、範囲の下端の５０、６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、及び１５０ヌクレオチドの長さから、範囲の上端の６０、７０、８０、９０、１００、１１０、１２０、１３０、１４０、１５０、１６０、１７０、１８０、１９０、及び２００ヌクレオチドの長さまでのＤＮＡ断片を含むことができる。

【0164】

いくつかの実施態様において、目的の任意の１以上の染色体セグメントの長さは、範囲の下端の１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、２５，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、及び１００，０００ヌクレオチドの長さから、範囲の上端の５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、１５，０００、２０，０００、２５，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、１，０００，０００、２，０００，０００、３，０００，０００、４，０００，０００、５，０００，０００、６，０００，０００、７，０００，０００、８，０００，０００、９，０００，０００、１０，０００，０００、１５，０００，０００、２０，０００，０００、２５，０００，０００、３０，０００，０００、４０，０００，０００、５０，０００，０００、６０，０００，０００、７０，０００，０００、８０，０００，０００、９０，０００，０００、１００，０００，０００、１２５，０００，０００、１５０，０００，０００、１７５，０００，０００、２００，０００，０００、２５０，０００，０００、及び３００，０００，０００ヌクレオチドの長さまでであり得る。

【0165】

１つの態様において本開示は、試料中の目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定するための方法を特徴とする。いくつかの実施態様において、血液又はその画分の試料中の１つ又はそれ以上の目的の染色体又は染色体セグメントのコピー数を決定する方法は、
試料核酸分子と分子指標タグ（ＭＩＴ）のセットとの反応混合物を形成してタグ付き核酸分子の集団を生成する工程であって、ここで、試料核酸分子の少なくともいくつかは、目的の染色体又は染色体セグメント上の複数の標的遺伝子座のうちの１つ又はそれ以上の標的遺伝子座を含む上記工程と；
タグ付き核酸分子の集団を増幅して、タグ付き核酸分子のライブラリーを作製する工程と；
タグ付き核酸分子のライブラリー中のタグ付き核酸分子の結合したＭＩＴの配列及び試料核酸セグメントの少なくとも一部の配列を決定して、タグ付き核酸を生じた試料核酸分子の同一性を決定する工程と；
決定された同一性を使用して、各標的遺伝子座を含む試料核酸分子の数を数えることにより、各標的遺伝子座についてＤＮＡの量を測定する工程と；
試料核酸分子中の各標的遺伝子座におけるＤＮＡの量を使用して、コンピュータ上で、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定する工程であって、ここで、標的遺伝子座の数及び試料の容量は、コピー数決定のための所望の感度及び所望の特異性を達成するのに有効な量の全標的遺伝子座を提供する上記工程と、を含む。
全標的遺伝子座Ｔ_Lは、試料中の各標的遺伝子座に及ぶ試料核酸分子の総数Ｃと、試料中の標的遺伝子座の数Ｌとの積として定義することができ、Ｔ_L＝Ｃ×Ｌである。有効量Ｅ_Aは、目標感度及び特異性について特定の数の全標的遺伝子座を得るのに必要な量として定義することができる。いくつかの実施態様において、全標的遺伝子座の数は、範囲の下端の１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００、３０，０００、４０，０００、５０，０００、７５，０００、及び１００，０００の全標的遺伝子座から、範囲の上端の５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、２００，０００、３００，０００、４００，０００、５００，０００、６００，０００、７００，０００、８００，０００、９００，０００、１，０００，０００、２，０００，０００、３，０００，０００、４，０００，０００、５，０００，０００、６，０００，０００、７，０００，０００、８，０００，０００、９，０００，０００、及び１０，０００，０００の全標的遺伝子座までであり得る。有効量は、試料調製効率及び混合試料中のＤＮＡの割合、例えば母体血液試料中の胎児の割合を考慮することができる。実施例３の表１及び３は、本開示の異なる方法について目標感度及び特異性を得るために必要とされる全標的遺伝子座と同じである配列決定リードの総数を示す。いくつかの実施態様において、試料核酸分子の集団中の試料核酸分子の総数は、ＭＩＴのセット中のＭＩＴの多様性よりも大きい。さらなる態様において、試料は２つの遺伝的に異なるゲノムの混合物を含む。例えば混合物は、循環性無細胞腫瘍ＤＮＡ及び正常ＤＮＡ、又は母体ＤＮＡ及び胎児ＤＮＡを含む血液又は血漿試料であり得る。

【0166】

本明細書中の実施例３は、異なるパーセント混合物で特定レベルの特異性及び感度を達成するために必要な配列決定リード又は全標的遺伝子座の総数を特定する表を提供し（「試料中のＧ２の割合」）、これは、例えば癌対正常ＤＮＡの割合、又は胎児対母体ＤＮＡの割合であり得る。全標的遺伝子座は、染色体又は染色体セグメントの標的遺伝子座の数に、試料容量によって提供される標的遺伝子座の半数体コピーの数を掛けることによって特定される。例えば、実施例３に示されるように、非対立遺伝子法を使用して４％の胎児ＤＮＡ又は循環性無細胞ＤＮＡにおいて９９％の感度及び特異性を達成するためには、１１０，４１４の全標的遺伝子座が必要である。これは、０．５ｍｌの血漿と、複数の少なくとも１，０００の遺伝子座と、及び少なくとも３２のＭＩＴのセットを使用して初期全標的遺伝子座の少なくとも２５％を保持する試料調製方法とを使用して、達成することができる。従って、この例では、有効量は少なくとも１，０００の遺伝子座と少なくとも０．５ｍｌの血漿である。

【0167】

いくつかの実施態様において、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定することは、複数の標的遺伝子座におけるＤＮＡの量を、二染色体性であることが予測される１つ又はそれ以上の染色体又は染色体セグメント上の複数の二染色体性遺伝子座におけるＤＮＡの量と比較することを含み得る。複数の二染色体性遺伝子座におけるＤＮＡの量は、複数の標的遺伝子座と同じ方法で決定することができ、すなわち、タグ付き核酸分子のライブラリー中のタグ付き核酸分子の結合ＭＩＴの配列及び試料核酸セグメントの少なくとも一部の配列を決定し、決定された配列を使用して、タグ付き核酸分子を生じた試料核酸分子の同一性を決定し、決定された同一性を使用して、各標的遺伝子座を含む試料核酸分子の数を数えることにより、各標的遺伝子座のＤＮＡの量を測定する、ことにより決定され得る。いくつかの実施態様において、二染色体性であると予想される１つ又はそれ以上の染色体又は染色体セグメント上の複数の二染色体性遺伝子座はＳＮＰ遺伝子座であり得る。

【0168】

本明細書に開示される実施態様のいずれかにおいても、複数の標的遺伝子座における遺伝子座の数は、範囲の下端の１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、及び５，０００遺伝子座から、範囲の上端の５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、及び１００，０００遺伝子座までであり得る。いくつかの実施態様において、標的遺伝子座の数は、少なくとも１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、又は１０，０００遺伝子座である。本明細書に開示される実施態様のいずれにおいても、複数の二染色体性遺伝子座における遺伝子座の数は、範囲の下端の１０、２０、３０、４０、５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、及び５，０００遺伝子座から、範囲の上端の５０、６０、７０、８０、９０、１００、２００、３００、４００、５００、６００、７００、８００、９００、１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、１０，０００、２０，０００、３０，０００、４０，０００、５０，０００、６０，０００、７０，０００、８０，０００、９０，０００、及び１００，０００遺伝子座までであり得る。いくつかの実施態様において、二染色体性遺伝子座の数は、少なくとも１，０００、２，０００、３，０００、４，０００、５，０００、６，０００、７，０００、８，０００、９，０００、又は１０，０００遺伝子座である。

【0169】

様々な実施態様において、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数に関する仮説のセットを生成して、測定されたＤＮＡ量を、各特定の仮説に基づいて予想されたＤＮＡ量と比較することができる。本開示の文脈において、仮説は、目的の染色体又は染色体セグメントのコピー数を指すことができる。これは可能性のある倍数性状態を指してもよい。これは、可能な対立遺伝子状態又は対立遺伝子不均衡を指してもよい。いくつかの実施態様において仮説のセットは、そのセットからの１つの仮説がある所定の個体の実際の遺伝的状態に対応するように設計され得る。いくつかの実施態様において仮説のセットは、可能性のある全ての遺伝的状態がそのセットからの少なくとも１つの仮説によって説明できるように設計され得る。本開示のいくつかの実施態様において本方法は、どの仮説が問題の個体の実際の遺伝的状態に対応するかを決定することができる。いくつかの実施態様において仮説のセットは、起こり得る遺伝的状態に加えて、胎児割合の仮説を含み得る。いくつかの実施態様において仮説のセットは、起こり得る遺伝的状態に加えて、平均的な対立遺伝子不均衡の仮説を含み得る。

【0170】

いくつかの実施態様において、同時分布モデルを使用して各仮説の相対確率を決定することができる。同時分布モデルは、同じ確率空間上で定義された複数の確率変数が与えられた場合に、複数の確率変数に関して定義された事象の確率を定義するモデルであり、変数の確率がリンクされている。いくつかの実施態様において、変数の確率がリンクされていない縮重の場合を使用してもよい。本開示の様々な実施態様において、試料中の１つ又はそれ以上の目的の染色体又は染色体セグメントのコピー数を決定することはまた、同時分布モデルを使用して決定された各倍数性仮説の相対確率を、読み取り数分析、ヘテロ接合性率の比較、特定の親状況に対して標準化された遺伝子型シグナルの確率、及びこれらの組み合わせからなる群から得られた統計的手法を使用して計算される各倍数性仮説の相対確率と、組み合わせることを含む。様々な実施態様において、同時分布は、各倍数性仮説の相対確率を各胎児割合仮説の相対確率とを組み合わせることができる。本開示のいくつかの実施態様において、各仮説の相対確率を決定することは、試料中のＤＮＡの推定割合を利用することができる。様々な実施態様において、同時分布は、各倍数性仮説の相対確率を各対立遺伝子不均衡仮説の相対確率と組み合わせることができる。いくつかの実施態様において、目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定することは、最大確率の仮説を選択することを含み、これは、最尤推定法又は最大事後技法を使用して実行される。

【0171】

最尤法及び最大事後推定
生物学的現象又は医学的状態の存在又は非存在を検出するための当該分野において公知のほとんどの方法は、単一仮説棄却検定の使用を含み、ここでは、状態と相関する計量値が測定され、計量値がある閾値の片側にある場合、その状態が存在し、計量値が閾値の反対側にある場合は、その状態が存在しない。単一仮説棄却検定では、帰無仮説と対立仮説で決定を行うときに帰無仮説のみを調べる。代替分布を考慮しないと、観察データが与えられたときに各仮説の尤度を推定することはできず、従って呼び出しに対する信頼度を計算することはできない。従って単一仮説棄却検定では、特定のケースに関連する感情無しで、「はい」又は「いいえ」の答えを得る。

【0172】

いくつかの実施態様において、本明細書に開示されている方法は、最尤法を使用して生物学的現象又は医学的状態の有無を検出することができる。これは、状態の不在又は存在を呼び出すための閾値を各場合に応じて適切に調整することができるため、単一仮説棄却法を使用する方法に対する実質的な改善である。これは、母体血漿中に見られる自由浮遊性ＤＮＡ中に存在する胎児及び母体ＤＮＡの混合物から得られる遺伝データから、妊娠中の胎児における異数性の有無を決定することを目的とする診断技術にとって特に重要である。これは、血漿由来画分中の胎児ＤＮＡの割合が変化するにつれて、異数性（aneuploidy）対正倍数性（euploidy）を呼び出すための最適閾値が変化するためである。胎児割合が低下するにつれて、異数性に関連するデータの分布は、正倍数性に関連するデータの分布とますます類似してくる。

【0173】

最尤推定法は、各仮説に関連する分布を使用して、各仮説に基づいて調整されたデータの尤度を推定する。次にこれらの条件付き確率は、仮説の呼び出しと信頼度に変換することができる。同様に最大事後推定法では、最尤推定値と同じ条件付き確率が使用されるが、最良の仮説を選択して信頼度を決定する際に母集団の事前確率も組み込まれる。従って、最尤推定（ＭＬＥ）技法又は密接に関連した最大事後確率（ＭＡＰ）技法の使用は２つの利点を与え、最初にこれは正しい呼び出しの可能性を高め、これはまた各呼び出しについて信頼度を計算することを可能にする。

【0174】

試料核酸分子の数を決定するための例示的方法
２種のＭＩＴを組み込むことによって各試料核酸分子からタグ付き核酸分子を生成することにより試料中のＤＮＡ分子の数を決定するための方法が、本明細書に開示される。上記の目的を達成するための手順、続いて単一分子又はクローン配列決定法が本明細書で開示される。

【0175】

本明細書に詳述するように、このアプローチは、各遺伝子座からのタグ付き核酸分子のほとんど又は全てが、異なる組合せのＭＩＴを有し、クローン又は単一分子配列決定を使用してＭＩＴの配列決定により同定できるように、タグ付き核酸分子を生成することを伴う。この同定は、核酸セグメントのマッピングされた位置を任意選択的に使用することができる。ＭＩＴと核酸セグメントとの各組み合わせは、異なる試料核酸分子を表す。この情報を使用して、各遺伝子座について元の試料中の個々の試料核酸分子の数を決定することができる。

【0176】

この方法は、試料核酸分子の数の定量的評価が必要とされる任意の用途に使用することができる。さらに、１つ又はそれ以上の標的遺伝子座からの個々の核酸分子の数は、相対コピー数、コピー数変動、対立遺伝子分布、対立遺伝子比、対立遺伝子不均衡、又は平均的な対立遺伝子の不均衡を決定するための、１つ又はそれ以上の二染色体性遺伝子座からの個々の核酸分子の数に関連し得る。あるいは、様々な標的から検出されたコピー数は、標的遺伝子座の最も可能性の高いコピー数を同定するために、分布によってモデル化することができる。用途としては、特に限定されるものではないが、デュシェンヌ型筋ジストロフィーの保有者に見られるものなどの挿入及び欠失の検出；コピー数変異体において観察されるもののような染色体の欠失又は重複セグメントの定量；出生個体由来の試料の染色体コピー数の決定；及び、胚又は胎児のようなまだ生まれない子からの試料の染色体コピー数の決定が含まれる。

【0177】

この方法は、決定された配列に含まれる変異の同時評価と組み合わせることができる。これを使用して、元の試料中の各対立遺伝子である試料核酸分子の数を決定することができる。このコピー数法を、生まれたか又は生まれていない個体からの目的の染色体又は染色体セグメントのコピー数を決定するためのＳＮＰ又は他の配列変異の評価；短い配列変異を有するが、脊髄性筋萎縮症のキャリア検出におけるように複数の標的遺伝子座からＰＣＲが増幅し得る遺伝子座からのコピーの識別及び定量；及び母体血漿から得られた自由浮遊性ＤＮＡからの胎児異数性の検出におけるような、異なる個体の混合物からなる試料からの、異なる供給源の核酸分子のコピー数の決定、と組み合わせることができる。

【0178】

本明細書に開示される実施態様のいずれにおいても、前記方法は、以下の工程のうちの１つ又はそれ以上を含み得る：（１）ＭＩＴを有するＹアダプター核酸分子を連結によって試料核酸分子の集団に結合する工程；（２）１回以上の増幅を行う工程；（３）標的遺伝子座を濃縮するためにハイブリッド捕捉を使用する工程；（４）増幅されたＰＣＲ生成物を、多数の方法、例えばクローン配列決定により、配列に及ぶのに十分な数の塩基まで測定する工程。

【0179】

本明細書に開示される実施態様のいずれにおいても、単一の標的遺伝子座に関する本方法は、以下の工程のうちの１つ又はそれ以上を含み得る：（１）特定の遺伝子座の増幅のためのオリゴマーの標準対を設計する工程。（２）合成中に、標的遺伝子座又はゲノムに対して全く相補性を有さないか又は最小限の相補性を有する特定の塩基の配列を、両方の標的特異的ＰＣＲプライマーの５’末端に付加する工程。テールと呼ばれるこの配列は、その後の増幅に使用される既知の配列であり、後にＭＩＴが続く。結果として、合成後、テールＰＣＲプライマープールは、既知の配列で始まり、続いてＭＩＴ、続いて標的特異的配列があるオリゴマーの集合からなるであろう。（３）テールオリゴマーのみを使用して１ラウンドの増幅（変性、アニーリング、伸長）を行う工程。（４）反応物にエキソヌクレアーゼを添加し、効果的にＰＣＲ反応を停止させ、適切な温度で反応物をインキュベートして、テンプレートにアニーリングしなかった前進１本鎖オリゴを除去して、伸長させて２本鎖生成物を形成する工程。（５）反応物を高温でインキュベートして、エキソヌクレアーゼを変性させ、その活性を排除する工程。（６）反応物に、他の標的特異的オリゴマーと共に最初の反応で使用したオリゴマーのテイルに相補的な新しいオリゴヌクレオチドを加えて、最初のラウンドのＰＣＲで生成した生成物のＰＣＲ増幅を可能にする工程。（７）下流のクローン配列決定に十分な生成物を生成するために増幅を継続する工程。（８）多数の方法、例えばクローン配列決定により、増幅されたＰＣＲ生成物を、配列に及ぶのに十分な塩基数まで測定する工程。

【0180】

いくつかの実施態様において、ＭＩＴを有するプライマーの設計及び生成は、以下のようにまとめることができる：ＭＩＴを有するプライマーは、標的配列と相補的ではない配列と、それに続くＭＩＴを有する領域と、それに続く標的特異的配列とからなる。ＭＩＴの５’の配列はその後のＰＣＲ増幅に使用することができ、そして配列決定のためにアンプリコンをライブラリーに変換するのに有用な配列を含み得る。いくつかの実施態様においてＤＮＡは、配列データが単一分子の配列を表す配列決定法によって測定することができる。これは、単一分子を直接配列決定する方法、又は単一分子を増幅して配列決定機器によって検出可能なクローンを形成する方法を含むことができるが、これはそれでも単一分子であり、本明細書ではクローン配列決定と呼ばれる。

【0181】

いくつかの実施態様において本開示の方法は、並行しているか又はそうではない複数の遺伝子座を標的とすることを含む。異なる標的遺伝子座に対するプライマーを独立して作製し、混合して多重ＰＣＲプールを作製することができる。いくつかの実施態様において、元の試料をサブプールに分割し、各サブプールで異なる遺伝子座を標的にして、次に組み換えを行い配列決定を行うことができる。いくつかの実施態様において、タグ付け工程及びいくつかの増幅サイクルを行った後、プールを細分して全ての標的の効率的な標的化を確実にしてから分割し、細分したプール中のより小さいプライマーのセットを使用して増幅を継続することにより、以後の増幅を改善することができる。

【0182】

例えば、個体のゲノム中のヘテロ接合性ＳＮＰ、及び各対立遺伝子の１０の試料核酸分子が元のＤＮＡ試料中に存在する個体からのＤＮＡの混合物を想像されたい。ＭＩＴの組み込み及び増幅の後、その遺伝子座に対応する１００，０００のタグ付き核酸分子があり得る。確率的プロセスのために、ＤＮＡの比率は１：２から２：１のいずれかであり得るが、各試料核酸分子はＭＩＴでタグ付けされているため、増幅プール中のＤＮＡが、各対立遺伝子からの正確に１０の試料核酸分子に由来すると決定することが可能であろう。従ってこの方法は、このアプローチを使用しない方法よりも、各対立遺伝子の相対量のより正確な尺度を与えるだろう。対立遺伝子バイアスの相対量を最小にすることが望ましい方法については、この方法はより正確なデータを提供するであろう。

【0183】

標的遺伝子座への配列決定された断片の関連付けは、いくつかの方法で達成することができる。いくつかの実施態様において、ＭＩＴならびに標的配列に対応する十分な数の独特の塩基に及ぶ十分な長さの配列が、標的化断片から得られ、標的遺伝子座の明確な同定が可能になる。他の実施態様において、ＭＩＴを含むＭＩＴプライマーはまた、それが関連する標的を特定する遺伝子座特異的バーコード（遺伝子座バーコード）も含み得る。この遺伝子座バーコードは、各個々の標的遺伝子座についての全てのＭＩＴプライマーで同一であり、従って結果として得られる全てのアンプリコンで同一であるが、他の全ての遺伝子座とは異なるであろう。いくつかの実施態様において、本明細書に開示されているタグ付け方法は、片側ネスティングプロトコールと組み合わせることができる。

【0184】

ＭＩＴがコピー数を決定するのに特に有用であると思われる用途の一例は、非侵襲的出生前異数性診断であり、ここでは、１つ又は複数の標的遺伝子座のＤＮＡ量を使用して、胎児における目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定するのを助けることができる。これに関連して、種々の対立遺伝子の相対量を維持しながら、初期試料中に存在するＤＮＡを増幅することが望ましい。状況によっては、特に非常に少量のＤＮＡしか存在しない場合、たとえば５，０００コピー未満のゲノム、１，０００コピー未満のゲノム、５００コピー未満のゲノム、及び１００コピー未満のゲノムでは、ボトルネックと呼ばれる現象が発生する可能性がある。これは、初期試料中にある所定の対立遺伝子の少数のコピーが存在する場所であり、増幅バイアスは、初期のＤＮＡ混合物中とは著しく異なる比率の対立遺伝子を有するＤＮＡの増幅プールをもたらし得る。標準的なＰＣＲ増幅の前に各ＤＮＡ鎖上でＭＩＴを使用することにより、同じ試料核酸分子に由来するライブラリー中のｎ個の同一配列のタグ付き核酸分子のセットからｎ－１コピーのＤＮＡを排除することが可能である。このようにして、いかなる対立遺伝子バイアス又は増幅バイアスもさらなる分析から除外することができる。本開示の様々な実施態様において本方法は、妊娠４～５週、妊娠５～６週間。妊娠６～７週間、妊娠７～８週間、妊娠８～９週間、妊娠９～１０週間、妊娠期１０～１２週間、妊娠１２～１４週間、妊娠１４～２０週間、妊娠２０～４０週間、妊娠初期、妊娠中期、妊娠後期の胎児、又はこれらの組合せについて実施することができる。

【0185】

ＭＩＴがコピー数又は平均対立遺伝子不均衡を決定するのに特に有用である別の用途は、１つの遺伝子座又は複数の遺伝子座における遺伝物質の量を使用してコピー数の変動又は平均対立遺伝子不均衡を決定するのを助けることができる非侵襲性癌診断である。コピー数変異決定などの異数性決定についての対立遺伝子の不均衡は、遺伝子座についての対立遺伝子の頻度間の差を指す。これは相同体のコピー数の差の推定値である。対立遺伝子の不均衡は、対立遺伝子の完全な喪失、又は一方の対立遺伝子の他方の対立遺伝子に対するコピー数の増加から生じ得る。対立遺伝子の不均衡は、所定の遺伝子座で構成的にヘテロ接合性である個体由来の体液又は細胞中の一方の対立遺伝子の他方の対立遺伝子に対する割合を測定することによって検出することができる。（Mei et al, Genome Res, 10:1126-37 (2000)）。「Ａ」及び「Ｂ」と任意に指定された対立遺伝子を有する二形性ＳＮＰについて、Ａ対立遺伝子の対立遺伝子比はｎＡ／（ｎＡ＋ｎＢ）であり、ここでｎＡ及びｎＢはそれぞれ対立遺伝子Ａ及びＢの配列決定リードの数である。対立遺伝子の不均衡は、生殖系においてヘテロ接合性である遺伝子座についてのＡとＢの対立遺伝子比の差である。この定義はＳＮＶの定義と類似しており、ここで異常なＤＮＡの割合は、典型的には変異型対立遺伝子頻度、すなわちｎｍ／（ｎｍ＋ｎｒ）を使用して測定され、ここでｎｍとｎｒは、それぞれ変異型対立遺伝子と参照対立遺伝子の配列リードの数である。従って、ＣＮＶについての異常ＤＮＡの割合は、｜（Ｈ１－Ｈ２）｜／（Ｈ１＋Ｈ２）として定義される平均対立遺伝子不均衡（ＡＡＩ）によって測定することができ、ここでＨｉは試料中の相同体ｉの平均コピー数であり、Ｈｉ／（Ｈ１＋Ｈ２）は、相同体ｉの存在量割合、又は相同体比である。最大相同体比は、より豊富な相同体の相同体比である。

【0186】

試料中の対立遺伝子分布の正確な測定
現在の配列決定アプローチを使用して、試料中の対立遺伝子の分布を推定することができる。そのような方法の１つは、ショットガン配列決定と呼ばれるプールＤＮＡから配列を無作為にサンプリングすることを含む。配列決定データ中の特定の対立遺伝子の比率は、典型的には非常に低く、単純な統計により決定され得る。ヒトゲノムは約３０億の塩基対を含む。そのため、使用した配列決定法が１００ｂｐのリードを作製する場合、３，０００万回の配列読み取り毎に特定の対立遺伝子が約１回測定される。

【0187】

いくつかの実施態様において本開示の方法は、染色体由来の遺伝子座の測定された対立遺伝子分布から、ＤＮＡの試料中の同じ遺伝子座のセットを含む２つ以上の異なるハプロタイプの有無を決定するために使用される。異なるハプロタイプは、１つの供給源由来の２つの異なる相同染色体、１つ供給源由来の３つの異なる相同染色体、２つの遺伝的に異なるゲノムの混合物を含む試料中の３つの異なる相同ハプロタイプ（ここでハプロタイプの１つは遺伝的に異なるゲノム間で共有される）、２つの遺伝的に異なるゲノムの混合物を含む試料中の３つ又は４つのハプロタイプ（ここで、１つ又は２つのハプロタイプは遺伝的に異なるゲノム間で共有される）、又は他の組み合わせであり得る。ハプロタイプ間で多型である対立遺伝子はより有益な傾向があるが、遺伝的に異なるゲノムが両方とも同じ対立遺伝子についてホモ接合ではない任意の対立遺伝子は、単純なリード数分析から得られる情報を超えて、測定された対立遺伝子分布を通して有用な情報をもたらす。

【0188】

しかし、そのような試料のショットガン配列決定法は、試料中の異なるハプロタイプ間で多型ではない遺伝子座からの多くの配列の読み取り、又は関係のない染色体の読み取りをもたらすため極めて非効率的であり、従って標的ハプロタイプの割合に関する情報はない。本明細書中に開示されるのは、ゲノム中で多型である可能性がより高い試料中のＤＮＡのセグメントを特異的に標的化及び／又は優先的に濃縮して、配列決定によって得られる対立遺伝子情報の収率を高める方法である。濃縮試料中の測定された対立遺伝子分布が標的個体中に存在する実際の量を真に表すためには、標的セグメント中の所定の遺伝子座における他の対立遺伝子と比較して、一方の対立遺伝子の優先的濃縮がほとんどないか全くないことが重要である。多型対立遺伝子を標的とするための当該分野で公知の現在の方法は、存在する任意の対立遺伝子の少なくともいくつかが確実に検出されるように設計されている。しかし、これらの方法は、元の混合物中に存在する多型対立遺伝子の偏りのない対立遺伝子分布を測定する目的では設計されていなかった。特定の標的濃縮法が濃縮試料を生成することを予測することは困難であり、ここで測定された対立遺伝子分布は、元の増幅されていない試料中に存在する対立遺伝子分布を他の方法よりも正確に表す。理論的には、そのような目的を達成するために多くの濃縮方法が予想されるが、現在の増幅、ターゲッティング、及び他の優先的濃縮方法にはかなりの確率的偏りがある。本明細書に開示される方法の１つの実施態様は、ゲノム中の所定の遺伝子座に対応するＤＮＡの混合物中に見出される複数の対立遺伝子が増幅され、又は各対立遺伝子の濃縮度がほぼ等しくなるように優先的に濃縮することを可能にする。別の言い方をすれば、この方法により混合物全体に存在する対立遺伝子の相対量を増加させることができる一方で、各遺伝子座に対応する対立遺伝子間の比率はそれらが元のＤＮＡ混合物に存在するのと同じままである。いくつかの報告された方法では、遺伝子座の優先的な濃縮は、１％を、２％を、５％を、さらには１０％を超える対立遺伝子バイアスをもたらし得る。この優先的な濃縮は、ハイブリッド捕捉アプローチを使用するときの捕捉バイアス、又は各サイクルに対して小さくんり得る増幅バイアスであるが、２０、３０、又は４０サイクルにわたって配合すると大きくなり得る。本開示の目的のために、比率が本質的に同じままであるということは、元の混合物中の対立遺伝子の比率を得られた混合物中の対立遺伝子の比率で割った値が、０．９５～１．０５、０．９８～１．０２、０．９９～１．０、０．９９５～１．００５、０．９９８～１．００２、０．９９９～１．００１、又は０．９９９９～１．０００１であることを意味する。本明細書に提示される対立遺伝子比の計算は、標的個体の倍数性状態の決定において使用され得ず、そして対立遺伝子バイアスを測定するための計量値として使用され得るだけであることに留意されたい。本明細書に開示される方法を使用して試料核酸分子の数を具体的に計数することができるため、ＭＩＴを使用して、捕捉バイアス、増幅バイアス、及び対立遺伝子バイアスによるエラーを除去することができる。

【0189】

いくつかの実施態様において、いったん混合物が標的遺伝子座のセットで優先的に濃縮されると、本明細書でより詳細に考察されるように、以前の、現在の、又は次世代の配列決定機器のいずれかを使用して配列決定することができる。比率は、目的の染色体又は染色体セグメント内の特定の対立遺伝子を介して配列決定することによって評価することができる。これらの配列決定リードは、対立遺伝子の種類及びそれに従って決定された異なる対立遺伝子の比率に従って分析及び計数することができる。長さが１～数塩基の変種では、対立遺伝子の検出は配列決定によって行われ、その捕捉分子の対立遺伝子組成を評価するためには、配列決定リードが問題の対立遺伝子に及ぶことが不可欠である。遺伝子型について測定された捕捉核酸分子の総数は、配列決定リードの長さを延長することによって増加させることができる。全てのタグ付き核酸分子の完全な配列決定は、濃縮プールにおいて利用可能な最大量のデータの採取を保証するだろう。しかし、配列決定は現在高価であり、そしてより少ない数の配列リードを使用して対立遺伝子分布を測定することができる方法は大きな価値を有するであろう。さらに、リードの最大長には技術的な制限があり、リード長が長くなるにつれて精度の制限もある。最も有用な対立遺伝子は、長さが１～数塩基であるが、理論的には、配列決定リードの長さより短い任意の対立遺伝子を使用することができる。セグメントコピー数変異体のようなより大きな変異体は、セグメント内部のＳＮＰの全コレクションが重複しているため、多くの場合これらの小さな変異体の集合体によって検出することができる。ＳＴＲのような数塩基より大きい変異体は特別な考慮を必要とし、そして標的化アプローチがうまくいく場合も、そうではない場合もある。

【0190】

ゲノム中の１つ又はそれ以上の変異体位置を特異的に単離及び濃縮するために使用できる複数の標的化アプローチがある。典型的にはこれらは、変異体配列に隣接する不変配列を利用することに依存している。基質が母体血漿である場合の配列決定の文脈における標的化に関連する他の研究者による報告がある（例えば、Liao et al., Clin. Chem. 2011; 57(1): pp. 92-101を参照）。しかし、これらのアプローチはエクソンを標的とする標的プローブを使用し、ゲノムの多型遺伝子座を標的とすることに焦点を合わせていない。様々な実施態様において本開示の方法は、排他的又はほぼ排他的に多型遺伝子座に焦点を合わせる標的化プローブを使用することを含む。いくつかの実施態様において本開示の方法は、排他的又はほぼ排他的にＳＮＰに焦点を合わせる標的化プローブを使用することを含む。本開示のいくつかの実施態様において、標的化多型部位は、少なくとも１０％のＳＮＰ、少なくとも２０％のＳＮＰ、少なくとも３０％のＳＮＰ、少なくとも４０％のＳＮＰ、少なくとも５０％のＳＮＰ、少なくとも６０％のＳＮＰ、少なくとも７０％のＳＮＰ、少なくとも８０％のＳＮＰ、少なくとも９０％のＳＮＰ、少なくとも９５％のＳＮＰ、少なくとも９８％のＳＮＰ、少なくとも９９％のＳＮＰ、少なくとも９９．９％のＳＮＰ、又はもっぱらＳＮＰからなる。

【0191】

いくつかの実施態様において本開示の方法は、ＤＮＡ分子の混合物から遺伝子型（特定の遺伝子座におけるＤＮＡの塩基組成）及びそれらの遺伝子型の相対比率を決定するために使用することができ、ここで、これらのＤＮＡ分子は、１つ又はそれ以上の遺伝的に異なるゲノムに由来することがある。いくつかの実施態様において本開示の方法は、多型遺伝子座のセットにおける遺伝子型、及びそれらの遺伝子座に存在する異なる対立遺伝子の量の相対比を決定するために使用され得る。いくつかの実施態様において、多型遺伝子座は完全にＳＮＰからなり得る。いくつかの実施態様において、多型遺伝子座は、ＳＮＰ、単一タンデム反復、及び他の多型を含み得る。いくつかの実施態様において本開示の方法は、ＤＮＡ混合物中の多型遺伝子座のセットにおける対立遺伝子の相対分布を決定するために使用することができ、ここでＤＮＡ混合物は個体及び個体内で増殖する腫瘍に由来するＤＮＡを含む。

【0192】

いくつかの実施態様においてＤＮＡ分子の混合物は、１つの個体の複数の細胞から抽出されたＤＮＡに由来し得る。いくつかの実施態様において、ＤＮＡが由来する元の細胞の集合は、その個体がモザイク（生殖細胞系又は体細胞系）である場合、同じか又は異なる遺伝子型の二倍体又は半数体細胞の混合物を含み得る。いくつかの実施態様において核酸分子の混合物はまた、単一細胞から抽出されたＤＮＡに由来し得る。いくつかの実施態様において、ＤＮＡ分子の混合物はまた、同じ個体の又は異なる個体の２つ以上の細胞の混合物から抽出されたＤＮＡからも誘導され得る。いくつかの実施態様においてＤＮＡ分子の混合物は、血漿中に存在するような無細胞ＤＮＡから誘導することができる。いくつかの実施態様において、胎児ＤＮＡが混合物中又は癌中に存在することが示されている妊娠中の場合のように、腫瘍ＤＮＡが血漿中に存在するとき、この生物学的材料は１つ以上の個体からのＤＮＡの混合物であり得る。いくつかの実施態様においてこの生物学的材料は、母体血中に見出される細胞の混合物由来でもよく、ここで、細胞のいくつかは胎児起源である。いくつかの実施態様においてこの生物学的材料は、胎児細胞に富んでいる妊婦の血液由来の細胞であり得る。

【0193】

目的の１つ又はそれ以上の染色体又は染色体セグメントのコピー数を決定するために使用されるアルゴリズムは、親遺伝子型及び交叉頻度データ（ＨａｐＭａｐデータベースからのデータなど）を考慮して、非常に多数の可能な胎児倍数性状態について及び様々な胎児ｃｆＤＮＡ画分について、標的遺伝子座について予測される対立遺伝子分布を計算することができる。対立遺伝子比に基づく方法とは異なり、これは連鎖不均衡を考慮し、非ガウスデータモデルを使用して、観察されたプラットフォーム特性及び増幅バイアスが与えられ多場合の、ＳＮＰでの対立遺伝子測定値の予測される分布を記述することもできる。次にアルゴリズムは、さまざまな予測された対立遺伝子分布を試料で測定された実際の対立遺伝子分布と比較し、配列決定データに基づいて各仮説（さまざまな可能な交叉分析に基づいて多数の仮説があるモノソミー、ジノソミー、又はトリノソミー）の尤度を計算することができる。アルゴリズムは、個々のモノソミー、ジノソミー、又はトリノソミー仮説の尤度を合計し、最大の総尤度を有する仮説をコピー数と胎児割合として呼び出す。試料中の平均対立遺伝子不均衡を決定するために同様のアルゴリズムを使用することができ、そして当業者は方法をどのように変更するかを理解するであろう。

【0194】

以下の例は、本明細書に提供される実施態様の使用方法の完全な開示及び説明を当業者に提供するために提示されるものであり、本開示の範囲を限定することも、以下の実施例が全ての又は唯一の実施された実験であることを表すことも意図するものではない。使用される数字（例えば、量、温度など）に関して正確さを確実にするための努力がなされているが、いくつかの実験誤差及び偏差は考慮されるべきである。特に別の指定がなければ、部は容量部であり、温度は摂氏度である。記載されている方法における変形は、実施例が例示することを意図している基本的な態様を変えることなく実施できることを理解されたい。

【実施例】

【0195】

実施例１
試料核酸分子を同定するための例示的ワークフロー
高スループット配列決定法ワークフローにおいて試料核酸分子の増幅後に、試料核酸分子を同定するための方法の例が本明細書に提供される。そのような方法を使用して作製される非限定的な例示的アンプリコンの構造を図３に示す。核酸源のセットは、天然の供給源から核酸を単離することによって調製される。例えば循環性無細胞ＤＮＡは、既知の方法を使用して標的患者からの血液又はその画分の試料から単離することができる。血液中の試料核酸のいくつかは、１つ又はそれ以上の標的部位を含み得る。試料核酸分子は、クレノウラージ断片を用いた平滑末端修復反応において全てのオーバーハングが除去されるように処理され、全ての５’末端がリン酸化されることを確実にするためにポリヌクレオチドキナーゼが用いられる。クレノウ断片（エキソ）を使用して平滑末端を修復した試料核酸分子に３’アデノシン残基を付加して、連結効率を高める。６ヌクレオチドの長さで、それぞれが他の全てのＭＩＴと少なくとも２塩基の相違を有する２０６のＭＩＴのセットは、図１に例示されるように、標準的な高スループット配列決定Ｙアダプターの３’Ｔオーバーハングに隣接する２本鎖ポリヌクレオチド配列に含まれるように設計される。次に、それぞれが異なるＭＩＴを含むＹアダプターのセットを、連結反応においてリガーゼを使用して各試料核酸分子の両端に連結して、タグ付き核酸分子の集団を生成する。連結反応のために、１０，０００の試料核酸分子を２０６のＭＩＴ含有Ｙアダプターのライブラリーでタグ付けする。得られたタグ付き核酸分子の集団は、図１に示すように、試料核酸分子の両端に連結したＭＩＴを有するＹアダプターを含み、その結果、ＭＩＴは、タグ付き核酸分子の挿入体とも呼ばれる試料核酸セグメントの末端に連結される。

【0196】

次に、Ｙアダプター上のプライマー結合部位に結合するユニバーサルプライマーを使用してタグ付き核酸分子の集団を増幅することにより、タグ付き核酸分子のライブラリーを調製する。次に、標的濃縮工程を実施して、標的ＳＮＰを有する試料核酸セグメントを含むタグ付き核酸分子を単離及び増幅する。標的濃縮は、片側ＰＣＲ反応又はハイブリッド捕捉を使用して実施することができる。これらの標的濃縮反応のいずれも、標的ＳＮＰを含む試料核酸セグメントに特異的なプライマー（片側ＰＣＲ）又はプローブ（ハイブリッド捕捉）の集団を用いた多重反応であり得る。次に、各患者試料について異なるバーコード配列、ならびにクローン増幅及び配列決定プライマー結合配列（図３のＲタグ及びＦタグ）を含むユニバーサルプライマーを使用して、１つ又はそれ以上のさらなるＰＣＲ反応を実施する。得られた増幅されたタグ付き核酸分子の構造を図３に概略的に示す。

【0197】

増幅されたタグ付き核酸分子は、次に１つの増幅反応中に付加されたユニバーサル配列を使用して、固体支持体上でクローン的に増幅される。クローン的に増幅されたタグ付き核酸分子の配列は、次にIllumina配列決定装置のような高スループット配列決定装置で決定される。片面ＰＣＲを使用して濃縮されたタグ付き核酸分子については、試料核酸セグメントの右側のＭＩＴ（すなわち挿入物）は、配列決定リードのうちの１つによって読まれる最初の塩基である。ハイブリッド捕捉を使用して濃縮されたタグ付き核酸分子については、１種のＭＩＴが試料核酸セグメント（すなわち挿入物）の両側に残り、そして試料核酸セグメントの一端上の最初の連結ＭＩＴの最初の塩基が、第１のリードで読み込まれる最初の塩基であり、試料核酸セグメントの他方の末端にある及び第２の連結ＭＩＴは、第２のリードで読み込まれる最初の塩基である。次に、得られた配列決定リードが分析される。断片特異的挿入体末端の配列を使用して、核酸セグメントの各末端の位置が生物のゲノム内の特定の位置にマッピングされ、これらの位置は各タグ付き核酸分子を同定するためにＭＩＴと組み合わせて使用することができる。次にこの情報は、市販のソフトウェアパッケージを使用して分析され、このソフトウェアは、試料核酸分子における真の配列の違いを、試料調製増幅反応のいずれかで導入されたエラーから区別するようにプログラムされている。

【0198】

実施例２
試料核酸分子に対するＭＩＴを使用するエラー率の減少
高スループット配列決定用試料調製ワークフローにおいて増幅エラーを同定するためにＭＩＴを使用することによって提供されるエラー率の減少を証明する例が、本明細書に提供される。各実験において、５８μｌ（最終濃度５．７５ｎＭ）中にヒトゲノムの１０，０００の投入コピー（１０，０００コピー×（３，０００，０００，０００ｂｐ／ゲノム）／（１５０ｂｐ／核酸分子）＝２×１０¹¹全試料核酸分子）を含む２×１０¹¹全試料核酸分子を有する２つの独立したＤＮＡ試料を使用して、本明細書に開示されたように５’末端にＭＩＴ及び３’末端にＭＩＴを有するタグ付き核酸分子のライブラリーを作製する、３つの実験を実施した。この実験のために、０．５～２μＭの濃度の１９６のＭＩＴのセットを使用して、反応混合物中のＭＩＴの総数と反応混合物中の試料核酸分子の総数との比が約８５：１～約３５０：１になるようにした。示されたように２×１０¹¹の全試料核酸分子を有する試料に対して、１９６のＭＩＴのみ、又は２種のＭＩＴの約４０，０００の組み合わせが使用された。

【0199】

各実験において、市販のキットを使用してハイブリッド捕捉を行うことにより、ＴＰ５３エクソンを含むタグ付き核酸分子についてライブラリーを濃縮した。次に、濃縮されたライブラリーを、あらかじめタグ付き核酸分子に組み込まれていたユニバーサルプライマー結合配列に結合することができるユニバーサルプライマーを用いたＰＣＲによって増幅した。ユニバーサルプライマーには、各試料で異なるバーコード配列と、Illumina HiSeq 2500上の配列決定を可能にする追加の配列とが含まれていた。次に各実験で試料をプールし、HiSeq 2500で１５０サイクルの高速モードでそれぞれ順方向と逆方向読み取りで、ペアエンド配列決定を行った。

【0200】

市販のソフトウェアを使用して、配列決定データを逆多重化した。各配列決定リードから、ＭＩＴ＋Ｔオーバーハングの長さ（これらの実験では合計７ヌクレオチド）の塩基に関するデータを読み取りの開始からトリミングして記録した。次に残りのトリミングされたリードを一緒にし、ヒトゲノムにマッピングした。各リードについての断片末端位置を記録した。標的遺伝子座（ＴＰ５３エキソン）をカバーする少なくとも１つの塩基を有する全てのリードは、標的上のリードと考えられた。リードの平均深度は、標的遺伝子座にわたる塩基ごとのレベルで計算された。平均エラー率（百分率として表される）は、参照ゲノム（ＧＲＣｈ３７）に対応しなかった標的遺伝子座を横切る全ての塩基コールを数え、そしてこれらを標的遺伝子座を横切る総塩基コールで割ることにより計算した。次に、標的遺伝子座における各塩基位置について、配列決定データをＭＩＴファミリーにグループ分けし、ここで各ＭＩＴファミリーは、分析された塩基位置に対して同じ相対位置で、ならびに同じ断片末端位置及び同じ配列決定方向（ヒトゲノムに対して正又は負）で同一のＭＩＴを共有した。これらのファミリーのそれぞれは、ＭＩＴライブラリー調製プロセスに入った同じ試料核酸分子のクローン増幅である可能性が高い分子のグループであった。ＭＩＴライブラリー調製プロセスに入った各試料核酸分子は２つのファミリーを生成したはずであり、正及び負のゲノム配向のそれぞれに１つをマッピングしたものである。次に、一方が正の配向で他方が負の配向の２種のＭＩＴファミリーを使用して、対になったＭＩＴ核酸セグメントファミリーを生成し、ここで各ファミリーは、分析された塩基位置及び相補断片末端位置に対して同じ相対位置で相補的ＭＩＴを含有した。これらの対になったＭＩＴファミリーは、ＭＩＴライブラリー調製プロセスに入った同じ試料核酸分子のクローン増幅である可能性がさらに高い配列決定された分子のグループであった。次に、参照ゲノム（ＧＲＣｈ３７）に対応しなかった標的遺伝子座を横切る全ての対になったＭＩＴ核酸セグメントファミリー内の全ての塩基コールを計数し、これらを、標的遺伝子座を横切る全ての対になったＭＩＴファミリー内の全塩基コールで割ることにより、平均エラー率（百分率として表される）を算出した。

【0201】

図４は３つの実験の結果を示す。各試料は、半数体ヒトゲノムの１０，０００の投入コピーを表す３３ｎｇのＤＮＡを含んでいた。これらの実験からの配列決定データは、試料あたり４４０万～１０７０万のマッピングされたリードと試料あたり３００万～７８０万の標的上リードをもたらした。マッピングされたリードに対する標的上リードの割合は、６８％～７４％の範囲であった。標的遺伝子座を横切るリードの平均深度は、約９８，０００～約２４４，０００のリード深度の範囲であった。全てのデータが含まれると、平均エラー率は０．１５％～０．２６％の範囲であった。対になったＭＩＴ核酸セグメントファミリーのみからのデータを使用して計算された平均エラー率は、０．００３６％～０．００６７％の範囲であった。各実験における２つの試料の平均平均エラー率及び対になったＭＩＴ核酸セグメントファミリーのエラー率は、対になったＭＩＴ核酸セグメントファミリーを使用した場合にエラー率の劇的な減少を示す（図５）。ここで観察された残留誤差は、単一ヌクレオチド多型の位置が除外されなかったため、試料中の単一ヌクレオチド多型による可能性が高い。対になったＭＩＴ核酸セグメントファミリーのエラー率は、それらの元のエラー率より２３～７３倍低かった。特に、実験Ａと比較してより高い元のエラー率を有した実験Ｂ及びＣは、対になったＭＩＴファミリーを使用して計算したときにエラー率のより大きな減少を経験した。これらの結果は、エラーを除去するためのＭＩＴの有用性を示している。

【0202】

実施例３
ＭＩＴを使用してコピー数を決定するための少ない試料量を示す数学的分析
この実施例は、ＭＩＴを使用するコピー数決定について所望の感度及び所望の特異性を達成するために有効量の全標的遺伝子座を提供する標的遺伝子座の数及び血漿試料容量の分析を提供する。２つのゲノムであるＧ１及びＧ２の混合物を有する試料において、目的の染色体又は染色体セグメントのコピー数を、ゲノムのうちの１つについて決定することができる。Ｇ１及びＧ２は目的の染色体の様々なコピー数、例えば染色体のセット中の各染色体の２つのコピー、別のセットの１つのコピーなどを有することができる。Ｇ２が、既知のコピー数（典型的には、２染色体性であると予想される１つ又はそれ以上の染色体又は染色体セグメント）を有するゲノム上に１つ以上の参照染色体又は染色体セグメントを有し、及び未知のコピー数（可能なコピー数は既知であると仮定されるが）を有するゲノム上に１つ又はそれ以上の目的の染色体又は染色体セグメントを有すると仮定する。真のコピー数が未知である目的の染色体又は染色体セグメントのＧ２のコピー数を推定することができる（可能なコピー数のセットが知られている場合）。参照染色体又は染色体セグメント及び目的の染色体又は染色体セグメントの両方の上の、Ｇ１のコピー数は知られていることに留意されたい。測定技術は、核酸分子を捕捉し、それが１つ又はそれ以上の参照染色体もしくは染色体セグメント、又は１つ又はそれ以上の目的の染色体もしくは染色体セグメントに属するかどうかを同定することとしてモデル化され、ここにエラーの可能性がある。

【0203】

試料が有限数の核酸分子を含むと仮定すると、１つ又はそれ以上の参照染色体又は染色体セグメント及び１つ又はそれ以上の目的の染色体又は染色体セグメントに属する試料中の、核酸分子の数の正確な推定値が得られるまで、試料核酸分子をサンプリングすることができる。試料中のＧ２の割合の推定値を使用して、１つ又はそれ以上の目的の染色体又は染色体セグメントにおけるＧ２の異なるコピー数仮説についての検定統計量を、以下に示すように計算することができる。

【0204】

方法１定量的非対立遺伝子法
この方法では、試料核酸分子の数が、１つ又はそれ以上の参照染色体又は染色体セグメントと１つ又はそれ以上の目的の染色体又は染色体セグメントに対して比較される。タグ付き核酸分子が配列決定されると、１つ又はそれ以上の参照染色体又は染色体セグメント及び１つ又はそれ以上の目的の染色体又は染色体セグメントから、タグ付き核酸分子を配列決定する等しい確率があると仮定する。この確率をｐで表し、ｐ＝０．５である。使用可能な検定統計量の例は、１つ又はそれ以上の目的の染色体又は染色体セグメントからの核酸分子の数（ｎ_t）と観察された核酸分子の総数（ｎ）との比率である。

【0205】

Ｔ＝ｎ_t／ｎ

【0206】

ｎ＞２０の場合、Ｔの分布は、ｐ＝０．５に対して分散（ｐ（１－ｐ））／ｎ＝０．２５／ｎの正規分布で近似できる。分布の平均は、検定されているＧ２のコピー数仮説に依存し、そしてより多くの観察結果を得ることによって（すなわち、分散を小さくすることによって）、結果の精度を高めることができる。これにより、特定の感度と特異性を実現する推定量を作製できる。

【0207】

Ｇ２が試料混合物の４％を表す（そしてＧ１は混合物の９６％である）と仮定する。さらにＧ１が、参照染色体又は染色体セグメント及び目的の染色体又は染色体セグメントの両方に各遺伝子座の２つのコピーを有すると仮定する。また、Ｇ２が１つ又はそれ以上の参照染色体又は染色体セグメント中に各遺伝子座の２つのコピーを有すると仮定する。２つの仮説を考えたい：Ｈ２、ここで、Ｇ２は目的の染色体又は染色体セグメント内に各遺伝子座の２つのコピーを持ち、及びＨ３、ここで、Ｇ２は目的の染色体又は染色体セグメント内に各遺伝子座の３つのコピーを持つ。上記のように、正規分布を使用して上記の検定統計量の分布を推定できる。Ｇ１及びＧ２の両方のコピー数が、参照染色体又は染色体セグメント及び目的の染色体又は染色体セグメントの両方の上で同一であるため、Ｈ２についての検定統計量の平均は０．５である。Ｈ３の検定統計量の平均は、次のとおりである：

【0208】

（（１－４％）／２＋３／４×４％）／（１／２＋１／２×（１－４％）＋３／４×４％）＝０．５０４９５

【0209】

平均μと分散σ²を有する正規分布を表すために、Ｎ（μ、σ²）の通常の表記法を使用する。従って、２つの仮説に対する検定統計量の分布は次のとおりである。

【0210】

Ｈ２：Ｎ（０．５、０．２５／ｎ）

【0211】

Ｈ３：Ｎ（０．５０４９５、０．２５／ｎ）

【0212】

この情報を使用して、特定の感度と特異度を達成するために必要なｎを計算できる。感度と特異度を９９％にしたいと仮定すると、平均０、分散１の正規分布Ｘが与えられると、Ｐｒｏｂ（Ｘ＜－２．３２６）＝１％になる。従って、以下

【0213】

（（０．５－０．５０５）／２）／（０．５／√ｎ）＜－２．３２６

【0214】

について解いて、ｎ＞２２０，８２７を得る。従って各染色体または染色体セグメントにつき約１１０，４１４の観察が必要である。ある範囲の混合物割合および目標感度と特異性について、１つ又はそれ以上の参照染色体または染色体セグメント、および１つ又はそれ以上の目的の染色体または染色体セグメントのそれぞれに必要な観察回数については、表１を参照されたい。

【表1】

【0215】

方法２対立遺伝子比の使用
方法１で説明した定量的アプローチと同様に、既知のＳＮＰでヘテロ接合率を調べる分子ベースの方法を使用できる。このアプローチでは、１つ又はそれ以上の目的の染色体又は染色体セグメント上のＳＮＰについて、Ａ又はＢの対立遺伝子値をとることができるの検定統計量は、参照対立遺伝子の観察された比率となる。特に、所定のＳＮＰについて、Ａ及びＢがそれぞれＡ及びＢ対立遺伝子を有する観察された分子の数を示すとする。こうしてヘテロ接合率を定義することができる。

【0216】

Ｈ＝ＡＡ＋Ｂ

【0217】

及びＳＮＰの分子数は

【0218】

Ｎ＝Ａ＋Ｂ。

【0219】

目的のＳＮＰにおいて、Ａ₁及びＡ₂がそれぞれゲノムＧ１及びＧ２中のＡ対立遺伝子の数を示すとする。同様に、Ｂ₁及びＢ₂はそれぞれ、目的のＳＮＰにおけるゲノムＧ１及びＧ２中のＢ対立遺伝子の数を示す。Ａの分布は二項分布で、そのパラメータはＡ₁、Ａ₂、Ｂ₁、Ｂ₂、Ｎの関数である。Ａ₁とＢ₁は既知であり、Ａ₂とＢ₂を推定したいとする。これを行うには、Ａ₂及びＢ₂の全ての可能な値について、観察されたヘテロ接合率Ｈの確率を計算し、観察されたＨからベイズ（Bayes）ルールを使用してＡ₂及びＢ₂の確率を計算する。例えば、Ｇ２が試料混合物の４％であるとする（従って、Ｇ１は混合物の９６％である）。さらに、Ｇ１が、参照染色体又は染色体セグメント及び目的の染色体又は染色体セグメント中で、各遺伝子座の２つのコピーを有すると仮定する。２つ又は３つのコピーを持つＧ２の２つの仮説を考えたい。これら２つの仮説をそれぞれＨ２（Ｇ２は２つのコピーを有する）及びＨ３（Ｇ２は３つのコピーを有する）で示す。これらの仮定の下で、各仮説に対する二項パラメータｐとＡ₁、Ａ₂、Ｂ₁、Ｂ₂の値は次のように算出される。

【0220】

ｐ＝（０．９６×Ａ₁＋０．０４×Ａ₂）／（０．９６×Ａ₁＋０．０４×Ａ₂＋０．９６×Ｂ₁＋０．０４×Ｂ₂）。

【0221】

これにより、ｐについて以下の値が得られる（表２）。

【表2】

【0222】

我々はさらに、Ａがｂｉｎｏ（ｐ．Ｎ）に分布し、Ｈが平均ｐと分散ｐ（１－ｐ）／Ｎの正規分布をもつことを知っている。核酸分子の数が増加するにつれて、分布の分散は減少し、様々な仮説はより容易に区別され得る。たとえば、（Ａ₁＝１、Ｂ₁＝１）で、Ｈ２とＨ３を区別したいとする。簡単にするために、この問題を（Ａ₂＝１、Ｂ₂＝１）と（Ａ₂＝２、Ｂ₁＝１）とを区別することに減縮する。上記開発モデルは、特定の特異性及び感度を達成するのに必要な最小数の核酸分子を計算するために使用され得る（表３）。

【表3】

【0223】

実用的な意味
上記で分析した方法ならびに試料調製とライブラリー調製の効率を使用して、特定の感度及び特異性について、特定の数の独特の配列決定リードを得るのに必要な試料の量を計算することが可能である。例示的なワークフローは、試料採取→試料調製→ライブラリー調製→ハイブリッド捕捉→バーコード化→配列決定であろう。このワークフローに基づいて、各工程の効率に関するいくつかの仮定を前提として、逆方向に作業して試料要件を決定することが可能である。この例では、バーコード工程は大きな影響を与えないと想定される。染色体又は染色体セグメントからのＮ個の独特の配列決定リードが必要とされる場合、好ましいアプローチは核酸分子を徹底的に配列決定することである。「クーポンコレクターの問題（Coupon Collector’s Problem）」に基づく結果（例えば、Dawkins, Brian (1991), "Siobhan's problem: the coupon collector revisited", The American Statistician, 45 (1): 76-82を参照）を、全ての核酸分子を配列決定する特定の確率を有するために、どれだけの配列リードが必要であるかについての指針として使用することができる。下の表を参照されたい。例えば、配列決定すべき１，０００の独特のタグ付き核酸分子がある場合、全ての核酸分子を観察する９９％の確率を有するためには、約１２倍のリード深度が必要である。この推定は、各配列リードが、１，０００のタグ付き核酸分子のうちのいずれかである可能性が等しいと仮定する。そうでない場合、計算された係数１２は経験的に測定されたものと置き換えることができる。ライブラリー調製及びハイブリッド捕捉工程中に、血管内に存在する試料核酸分子のいくらかは失われる。これらの過程で７５％の分子が失われる（すなわち、２５％の試料核酸分子が保持される）と仮定すると、バーコード化のために十分なタグ付き核酸分子が残っていることを確かめるために、元の試料中により多くの核酸分子が必要とされる。ここで二項分布を使用して、ライブラリー及びハイブリッド捕捉工程の後に、ある確率で特定の数の核酸分子を有するのに必要な試料中の核酸分子の数を推定することができる。

【0224】

上記の推論に基づいて、方法１を使用して、４％のＧ２との混合物中の１％の感度及び特異性のために、参照染色体又は染色体セグメント及び目的の染色体又は染色体セグメントの両方に約１１０，０００の配列決定リードが必要である（表１）。ライブラリー調製工程とハイブリッド捕捉工程の組み合わせが２５％の全体効率を有する場合、試料中に１１０，０００を超える開始コピーが必要とされる。単純な二項モデルを使用すると、バーコード化及びその後の配列決定に利用可能な少なくとも１１０，０００の核酸分子を有する可能性が９９％を超えるようにするために、少なくとも４４３，０００の試料核酸分子が必要とされる。ライブラリー調製が４４３，０００の核酸分子で始まると仮定すると、ライブラリー調製及びハイブリッド捕捉工程の後に、予想される試料核酸分子数は１１０，０００～１１１，４００分子の範囲内にあるであろう。全ての元の分子の測定を確実にするために、より大きい数、すなわち１１１，４００の核酸分子をさらなる計算に使用することができる。核酸分子を測定する際のばらつきのために、全ての１１１，４００の核酸分子を測定する高い確率を有するためには、実質的により多くの測定が必要とされる。例えば、全てのタグ付き核酸分子を９９％の確率で配列決定するためには、１６倍の数の核酸分子を配列決定することが必要である。従って、各染色体又は染色体セグメントには約１，７８０，０００のリードが必要である。この推定値は、読み取られた各配列が１１１，４００のタグ付き核酸分子のうちのいずれか１つである可能性が等しいと仮定する。そうでない場合は、計算された係数１６を経験的に測定されたものと置き換えることができる。

【0225】

試料に関しては前述のように、前述の性能を達成するために約４４３，０００の全試料核酸分子が必要とされる。必要な１１１，４００の配列決定リードは、各染色体又は染色体セグメント中の複数の遺伝子座を測定することによって達成することができる。例えば、１，０００の異なる遺伝子座で核酸分子を測定する場合、各遺伝子座から平均約１１２の独特の核酸分子が配列決定に必要とされ、出発試料中に平均約４４３の独特の核酸分子が必要であることになる。基礎となる試料タイプがヒト由来の血漿試料である場合、これは血漿１ｍｌあたり１，２００～１，８００の単一半数体コピーのゲノムを含む。さらに、平均して１ｍｌの血液試料は約０．５ｍｌの血漿を含む。従って、これらの制約を考慮すると、目的の染色体又は染色体セグメントのコピー数を決定するためには、１ｍｌの血液（０．５ｍｌの血漿及び各遺伝子座から６００～９００の独特の核酸分子）で十分なはずである。

【0226】

ここでＭＩＴを使用して、個々の試料核酸分子を計数し、そして他の定量的方法に関連する分散を減らすことができる。個々の試料核酸分子の計数を単純化するために、遺伝子座からの各試料核酸分子（すなわち、４４３の核酸分子のそれぞれ）は、結合ＭＩＴの異なる組み合わせを有するはずである。各核酸分子に２種のＭＩＴが結合されていると仮定すると、結合されたＭＩＴの可能な組み合わせの数はＮ²であり、ここでＮはそのセット中のＭＩＴの数である。各遺伝子座の約４４３のコピーがあるため、Ｎ²は４４３より大きくなければならない。ある程度の余裕があると有益であるため、Ｎ²＝１，０００の場合、Ｎは約３２になるであろう。試料核酸分子を同定するために、ＭＩＴの配列と組み合わせて、核酸セグメントの正確な開始及び終了ゲノム座標を使用することもできる。

【0227】

当業者は、本開示の範囲及び精神の範囲内で、多くの修正態様及び他の実施態様を考案することができる。実際、当業者は、記載された材料、方法、図面、実験、実施例、及び実施態様における変形を、本開示の基本的な態様を変更することなく実施することができる。開示された実施態様のいずれも、他の開示された実施態様と組み合わせて使用することができる。本明細書における全ての見出しは読者の便宜のためのものであり、決して本開示を限定するものではない。

【図1】

【図2】

【図3】

【図4】

【図5】

【配列表】

0007467118000001.app

知財求人

知財求人お知らせサービス

知財のニュースを調べる
- 知財ニュース
- 知財周辺ニュース
企業の特許を調べる
知財のセミナーを調べる
知財,特許事務所への求職・転職
特許事務所をさがす
弁理士試験を受ける
- 年の弁理士試験情報
- 弁理士試験の合格率など統計
知財の法律をしらべる
期限日をしらべる
- 今日に対して意見書・補正書の期限
- 今日に対して審査請求期限日
知財の判決をしらべる
コンテンツ・リンク
運営会社
プレスの皆様へ
- お問い合わせ
ユーザーの皆様
- お問い合わせ・フィードバック
広告掲載を希望の皆様へ
- 広告掲載について
- 求人広告の掲載について

IP Force 特許公報掲載プロジェクト 2022.1.31 β版