特表2022-516307 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ウィリアム　マーシュ　ライス　ユニバーシティの特許一覧

特表2022-516307多重コピー数変異検出および対立遺伝子比定量化のための定量的アンプリコン配列決定

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2022-02-25

(54)【発明の名称】多重コピー数変異検出および対立遺伝子比定量化のための定量的アンプリコン配列決定

(51)【国際特許分類】

C12Q 1/6844 20180101AFI20220217BHJP

C12Q 1/6869 20180101ALI20220217BHJP

C12Q 1/6855 20180101ALI20220217BHJP

【ＦＩ】

C12Q1/6844 Z ZNA

C12Q1/6869 Z

C12Q1/6855 Z

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2021538955

(86)(22)【出願日】2020-01-02

(85)【翻訳文提出日】2021-08-16

(86)【国際出願番号】 US2020012089

(87)【国際公開番号】W WO2020142631

(87)【国際公開日】2020-07-09

(31)【優先権主張番号】62/788,375

(32)【優先日】2019-01-04

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＭＡＴＬＡＢ

(71)【出願人】

【識別番号】510166102

【氏名又は名称】ウィリアムマーシュライスユニバーシティ

【氏名又は名称原語表記】ＷＩＬＬＩＡＭＭＡＲＳＨＲＩＣＥＵＮＩＶＥＲＳＩＴＹ

【住所又は居所原語表記】６１００ＭａｉｎＳｔｒｅｅｔ，Ｈｏｕｓｔｏｎ，ＴＸ７７００５，ＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ

(74)【代理人】

【識別番号】100102978

【弁理士】

【氏名又は名称】清水初志

(74)【代理人】

【識別番号】100102118

【弁理士】

【氏名又は名称】春名雅夫

(74)【代理人】

【識別番号】100160923

【弁理士】

【氏名又は名称】山口裕孝

(74)【代理人】

【識別番号】100119507

【弁理士】

【氏名又は名称】刑部俊

(74)【代理人】

【識別番号】100142929

【弁理士】

【氏名又は名称】井上隆一

(74)【代理人】

【識別番号】100148699

【弁理士】

【氏名又は名称】佐藤利光

(74)【代理人】

【識別番号】100128048

【弁理士】

【氏名又は名称】新見浩一

(74)【代理人】

【識別番号】100129506

【弁理士】

【氏名又は名称】小林智彦

(74)【代理人】

【識別番号】100205707

【弁理士】

【氏名又は名称】小寺秀紀

(74)【代理人】

【識別番号】100114340

【弁理士】

【氏名又は名称】大関雅人

(74)【代理人】

【識別番号】100121072

【弁理士】

【氏名又は名称】川本和弥

(72)【発明者】

【氏名】チャンデイビッド

(72)【発明者】

【氏名】ダイペン

(72)【発明者】

【氏名】ウールオジア

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA01

4B063QA18

4B063QQ42

4B063QR08

4B063QR62

4B063QS25

4B063QS34

4B063QX02

(57)【要約】

ＤＮＡ試料におけるターゲティングされたゲノム遺伝子座の各鎖をポリメラーゼ連鎖反応によりオリゴヌクレオチドバーコード配列で標識して、ハイスループット配列決定のためのゲノム領域を増幅させるための、定量的アンプリコン配列決定の方法が、本明細書で提供される。本方法は、各遺伝子の過剰コピーの頻度を定量化することによって、一連の関心対象の遺伝子におけるコピー数変異（ＣＮＶ）の同時検出のために使用することができる。さらに、これらの方法は、多重ＰＣＲを使用した、ターゲティングされたゲノム遺伝子座についての異なる遺伝的同一性の対立遺伝子比の定量化を提供する。さらに、これらの方法は、変異の検出および変異体対立遺伝子頻度の定量化を提供する。
【選択図】図１

【特許請求の範囲】

【請求項1】

ハイスループット配列決定のためにゲノムＤＮＡのターゲティングされた領域を調製するための方法であって、
（ａ）ゲノムＤＮＡ試料を得ることと、
（ｂ）（ｉ）５’から３’に向かって、第１の領域、０～５０ヌクレオチドの長さを有する第２の領域、少なくとも４個の縮重ヌクレオチドを含む第３の領域、および第１の標的ゲノムＤＮＡ領域に相補的である配列を含む第４の領域を含む、第１のオリゴヌクレオチド、ならびに
（ｉｉ）５’から３’に向かって、第５の領域、０～５０ヌクレオチドの長さを有する第６の領域、および第２の標的ゲノムＤＮＡ領域に相補的である配列を含む第７の領域を含む、第２のオリゴヌクレオチド
を使用して、２サイクルのＰＣＲを実行することによって前記ゲノムＤＮＡ試料の少なくとも一部を増幅させることと、
（ｃ）ステップ（ｂ）で使用されるアニーリング温度よりも０～１０℃高いアニーリング温度で、かつ
（ｉ）前記第１の領域の少なくとも一部の逆相補体にハイブリダイズすることができる配列を含む第３のオリゴヌクレオチド、および
（ｉｉ）前記第５の領域の少なくとも一部の逆相補体にハイブリダイズすることができる配列を含む第４のオリゴヌクレオチド
を使用して、少なくとも３サイクルのＰＣＲを実行することによって、ステップ（ｂ）の生成物を増幅させることと、
（ｄ）５’から３’に向かって、第８の領域、０～５０ヌクレオチドの長さを有する第９の領域、および第３の標的ゲノムＤＮＡ領域に相補的である配列を含む第１０の領域を含む、第５のオリゴヌクレオチド
を使用して、少なくとも１サイクルのＰＣＲを実行することによって、ステップ（ｃ）の生成物を増幅させることと
を含み、前記第３の標的ゲノムＤＮＡ領域は、前記第２の標的ゲノムＤＮＡ領域よりも、前記第１の標的ゲノムＤＮＡ領域に少なくとも１ヌクレオチド近い、前記方法。

【請求項2】

ハイスループット配列決定のためにゲノムＤＮＡの１～１０，０００個のターゲティングされた領域を調製するための方法である、請求項１に記載の方法。

【請求項3】

前記第３の領域は、固有分子識別子（ＵＭＩ）である、請求項１または２に記載の方法。

【請求項4】

前記第３の標的ゲノムＤＮＡ領域は、前記第２の標的ゲノムＤＮＡ領域よりも、前記第１の標的ゲノムＤＮＡ領域に１～１０塩基近い、請求項１～３のいずれか一項に記載の方法。

【請求項5】

前記第１の領域および前記第８の領域は、ユニバーサルプライマー結合部位である、請求項１～４のいずれか一項に記載の方法。

【請求項6】

前記第１の領域および前記第８の領域は、完全または部分的なＮＧＳアダプター配列を含む、請求項１～５のいずれか一項に記載の方法。

【請求項7】

前記第５の領域は、ヒトゲノム中に認めることができない配列を含む、請求項１～６のいずれか一項に記載の方法。

【請求項8】

前記第５の領域は、ＮＧＳアダプター配列と異なる配列を含む、請求項１～７のいずれか一項に記載の方法。

【請求項9】

前記第１の領域および前記第５の領域の融解温度は、前記第４の領域および前記第７の領域の融解温度よりも０～１０℃高い、請求項１～８のいずれか一項に記載の方法。

【請求項10】

前記第３の領域における前記縮重ヌクレオチドは、各々独立して、Ａ、Ｔ、またはＣのうちの１つである、請求項１～９のいずれか一項に記載の方法。

【請求項11】

前記第３の領域における前記縮重ヌクレオチドのいずれも、Ｇではない、請求項１～１０のいずれか一項に記載の方法。

【請求項12】

各々が固有の第３の領域を有する第１のオリゴヌクレオチドの集団がある、請求項１～１１のいずれか一項に記載の方法。

【請求項13】

前記ステップ（ｃ）の生成物を精製することをさらに含む、請求項１～１２のいずれか一項に記載の方法。

【請求項14】

精製することは、ＳＰＲＩ精製またはカラム精製を含む、請求項１３に記載の方法。

【請求項15】

前記ステップ（ｄ）の生成物を精製することをさらに含む、請求項１～１４のいずれか一項に記載の方法。

【請求項16】

精製することは、ＳＰＲＩ精製またはカラム精製を含む、請求項１５に記載の方法。

【請求項17】

（ｅ）前記ステップ（ｄ）の生成物を、前記第１の領域および前記第８の領域にハイブリダイズするプライマーを使用したＰＣＲによって増幅させることであって、前記プライマーは次世代配列決定のためのインデックス配列を含む、こと
をさらに含む、請求項１～１６のいずれか一項に記載の方法。

【請求項18】

前記ステップ（ｅ）の生成物を精製することをさらに含む、請求項１７に記載の方法。

【請求項19】

精製することは、ＳＰＲＩ精製またはカラム精製を含む、請求項１８に記載の方法。

【請求項20】

（ｆ）前記ステップ（ｅ）の生成のハイスループットＤＮＡ配列決定を実行すること
をさらに含む、請求項１７～１９のいずれか一項に記載の方法。

【請求項21】

ハイスループットＤＮＡ配列決定は、次世代配列決定を含む、請求項２０に記載の方法。

【請求項22】

前記第１の標的ゲノムＤＮＡ領域および前記第２の標的ゲノムＤＮＡ領域は、前記ゲノムＤＮＡの向かい合う鎖上にある、請求項１～２１のいずれか一項に記載の方法。

【請求項23】

前記第１の標的ゲノムＤＮＡ領域および前記第２の標的ゲノムＤＮＡ領域は、４０ヌクレオチド～５００ヌクレオチド離れている、請求項１～２２のいずれか一項に記載の方法。

【請求項24】

ステップ（ｂ）は、約３０分の伸長時間を含む、請求項１～２３のいずれか一項に記載の方法。

【請求項25】

ステップ（ｃ）は、約３０秒の伸長時間を含む、請求項１～２４のいずれか一項に記載の方法。

【請求項26】

ステップ（ｄ）は、約３０分の伸長時間を含む、請求項１～２５のいずれか一項に記載の方法。

【請求項27】

少なくとも１つの標的遺伝子の過剰コピーの頻度（ＦＥＣ）を定量化するための方法であって、
（ａ）ゲノムＤＮＡ試料を得ることと、
（ｂ）請求項１～２６のいずれか一項に記載の方法に従ってハイスループット配列決定のために前記ゲノムＤＮＡを調製することであって、前記第４の領域、前記第７の領域、および前記第１０の領域の前記配列が、前記少なくとも１つの標的遺伝子にハイブリダイズする、ことと、
（ｃ）請求項２０に記載の方法に従ってハイスループット配列決定を実行することと、
（ｄ）ステップ（ｃ）で得られる配列情報に基づいて、前記少なくとも１つの標的遺伝子について前記ＦＥＣを計算することと
を含む、前記方法。

【請求項28】

前記方法は、一連の標的遺伝子について前記ＦＥＣを定量化するための方法であり、前記一連の標的遺伝子は、２～１０００個の標的遺伝子を含む、請求項２７に記載の方法。

【請求項29】

ステップ（ｂ）は、第１のオリゴヌクレオチドの集団、第２のオリゴヌクレオチドの集団、および第５のオリゴヌクレオチドの集団を使用して実行され、前記第１、第２、および第５のオリゴヌクレオチドの集団の各々の一部は、前記一連の標的遺伝子のうちの１つに相補的である第４、第７、および第１０の領域をそれぞれ含む、請求項２７または２８に記載の方法。

【請求項30】

前記第４、第７、および第１０の領域の各々が、ヒトゲノム中に一度だけ認められる配列を含む、請求項２７～２９のいずれか一項に記載の方法。

【請求項31】

１つの標的遺伝子にハイブリダイズする各第１のオリゴヌクレオチドが、同じ標的遺伝子にハイブリダイズする各他の第１のオリゴヌクレオチドと比較して固有の第３の領域を有する、請求項２７～３０のいずれか一項に記載の方法。

【請求項32】

ステップ（ｂ）は、参照遺伝子に相補的である第４、第７、および第１０の領域をそれぞれ含む第１のオリゴヌクレオチド、第２のオリゴヌクレオチド、および第５のオリゴヌクレオチドを使用して実行される、請求項２７～３１のいずれか一項に記載の方法。

【請求項33】

ステップ（ｂ）は、ハイスループット配列決定のために各標的遺伝子または参照遺伝子の一部を調製し、前記一部は、４０ヌクレオチド～５００ヌクレオチド長である、請求項２７～３２のいずれか一項に記載の方法。

【請求項34】

ＦＥＣは、以下：

【数1】

として定義される、請求項２７～３３のいずれか一項に記載の方法。

【請求項35】

ステップ（ｄ）は、
（ｉ）ＮＧＳリードを各標的遺伝子の前記ターゲティングされた部分とアラインメントして、前記ＮＧＳリードを、それらがアラインメントする遺伝子座に基づいてサブグループにグループ化することと、
（ｉｉ）同じＵＭＩ配列を担持する全てのＮＧＳリードが１つのＵＭＩファミリーとしてグループ化されるように、各遺伝子座での前記ＮＧＳリードを、それらのＵＭＩ配列に基づいて分類することと、
（ｉｉｉ）ＰＣＲエラーまたはＮＧＳエラーから生じるＵＭＩファミリーを取り除くことと、
（ｉｖ）各遺伝子座での固有のＵＭＩ配列の数を計数することと、
（ｖ）各標的遺伝子および参照遺伝子における各遺伝子座について、前記固有のＵＭＩ配列の数に基づいて前記ＦＥＣを計算することと
を含む、請求項２７～３４のいずれか一項に記載の方法。

【請求項36】

ステップ（ｄ）（ｉｉｉ）は、前記ＵＭＩ縮重塩基設計に適合しないＵＭＩ配列を取り除くことを含む、請求項３５に記載の方法。

【請求項37】

ステップ（ｄ）（ｉｉｉ）は、Ｆｍｉｎよりも小さいＵＭＩファミリーサイズを有するＵＭＩファミリーを取り除くことを含み、前記ＵＭＩファミリーサイズは、前記同じＵＭＩを担持する前記リードの数であり、Ｆｍｉｎは、２～２０である、請求項３５または３６に記載の方法。

【請求項38】

ステップ（ｄ）（ｉｖ）は、より大きいファミリーサイズを有する別のＵＭＩ配列と１または２個の塩基のみが異なるＵＭＩ配列を取り除くことを含む、請求項３５～３７のいずれか一項に記載の方法。

【請求項39】

ＦＥＣは、以下：

【数2】

として定義され、式中、

【数3】

は、前記標的遺伝子座の全てまたは一部についての固有ＵＭＩ数の合計であり、uは、考慮する遺伝子座の数であり、uは、前記標的遺伝子における前記遺伝子座の全数以下であり、

【数4】

は、参照遺伝子座の全てまたは一部についての固有ＵＭＩ数の合計であり、vは、１つの参照について考慮する遺伝子座の数であり、vは、前記参照における遺伝子座の全数以下であり、wは、考慮する参照の数であり、wは前記参照の全数以下であり、kは、実験的な較正によって決定される、請求項２７～３８のいずれか一項に記載の方法。

【請求項40】

前記ＦＥＣを使用して、前記標的遺伝子のコピー数変異（ＣＮＶ）状態を特定する、請求項２７～３９のいずれか一項に記載の方法。

【請求項41】

少なくとも１つの標的ゲノム遺伝子座について異なる遺伝的同一性の対立遺伝子比を定量化するための方法であって、
（ａ）ゲノムＤＮＡ試料を得ることと、
（ｂ）請求項１～２６のいずれか一項に記載の方法に従ってハイスループット配列決定のために前記ゲノムＤＮＡを調製することであって、前記第４の領域、前記第７の領域、および前記第１０の領域の前記配列は、前記少なくとも１つの標的ゲノム遺伝子座付近で前記ゲノムＤＮＡにハイブリダイズする、ことと、
（ｃ）請求項２０に記載の方法に従ってハイスループット配列決定を実行することと、
（ｄ）ステップ（ｃ）で得られた配列決定情報に基づいて前記少なくとも１つの標的ゲノム遺伝子座について異なる遺伝的同一性の対立遺伝子比を計算することと
を含む、前記方法。

【請求項42】

前記方法は、一連の標的ゲノム遺伝子座について異なる遺伝的同一性の前記対立遺伝子比を定量化するための方法であり、前記一連の標的ゲノム遺伝子座は、２～１０，０００個の標的ゲノム遺伝子座を含む、請求項４１に記載の方法。

【請求項43】

ステップ（ｂ）は、第１のオリゴヌクレオチドの集団、第２のオリゴヌクレオチドの集団、および第５のオリゴヌクレオチドの集団を使用して実行され、前記第１、第２、および第５のオリゴヌクレオチドの集団の各々の一部は、前記一連の標的ゲノム遺伝子座の少なくとも１つの付近で前記ゲノムＤＮＡに相補的である第４、第７、および第１０の領域をそれぞれ含む、請求項４１または４２に記載の方法。

【請求項44】

前記第４、第７、および第１０の領域の各々は、ステップ（ｂ）の条件下で、前記ゲノムＤＮＡの非標的領域とハイブリダイズすることができない配列を含む、請求項４１～４３のいずれか一項に記載の方法。

【請求項45】

１つの標的ゲノム遺伝子座の付近で前記ゲノムＤＮＡにハイブリダイズする各第１のオリゴヌクレオチドは、同じ標的ゲノム遺伝子座の付近で前記ゲノムＤＮＡにハイブリダイズする各他の第１のオリゴヌクレオチドと比べて固有の第３の領域を有する、請求項４１～４４のいずれか一項に記載の方法。

【請求項46】

各標的ゲノム遺伝子座は、４０ヌクレオチド～５００ヌクレオチド長である、請求項４１～４５のいずれか一項に記載の方法。

【請求項47】

ステップ（ｄ）は、
（ｉ）ＮＧＳリードを前記ターゲティングされたゲノム遺伝子座とアラインメントして、前記ＮＧＳリードを、それらがアラインメントする前記遺伝子座に基づいてサブグループにグループ化することと、
（ｉｉ）前記同じＵＭＩ配列を担持する全てのＮＧＳリードが１つのＵＭＩファミリーとしてグループ化されるように、各遺伝子座での前記ＮＧＳリードを、それらのＵＭＩ配列に基づいて分類することと、
（ｉｉｉ）ＰＣＲエラーまたはＮＧＳエラーから生じるＵＭＩファミリーを取り除くことと、
（ｉｖ）前記遺伝的同一性を各残存ＵＭＩファミリーについて求めることと、
（ｖ）前記固有ＵＭＩ配列の数を各遺伝子座で計数することと、
（ｖｉ）前記対立遺伝子比を計算することと
を含む、請求項４１～４６のいずれか一項に記載の方法。

【請求項48】

ステップ（ｄ）（ｉｉｉ）は、前記ＵＭＩ縮重塩基設計に適合しないＵＭＩ配列を取り除くことを含む、請求項４７に記載の方法。

【請求項49】

ステップ（ｄ）（ｉｉｉ）は、Ｆｍｉｎよりも小さいＵＭＩファミリーサイズを有するＵＭＩファミリーを取り除くことを含み、前記ＵＭＩファミリーサイズは、同じＵＭＩを担持する前記リードの数であり、Ｆｍｉｎは、２～２０である、請求項４７または４８に記載の方法。

【請求項50】

ステップ（ｄ）（ｉｉｉ）は、より大きいファミリーサイズを有する別のＵＭＩ配列と１または２個の塩基のみが異なるＵＭＩ配列を取り除くことを含む、請求項４７～４９のいずれか一項に記載の方法。

【請求項51】

ステップ（ｄ）（ｉｖ）は、ＵＭＩファミリーにおける前記リードの少なくとも７０％が関心対象の遺伝的遺伝子座において同じである場合にのみ前記遺伝的同一性を求めることを含む、請求項４７～５０のいずれか一項に記載の方法。

【請求項52】

前記対立遺伝子比は、Ｒ_{対立遺伝子}＝Ｎ_１／Ｎ_２として定義され、式中、Ｎ_１は第１の遺伝的同一性についての固有ＵＭＩ数であり、Ｎ_２は、前記第２の遺伝的同一性についての固有ＵＭＩ数である、請求項４１～５１のいずれか一項に記載の方法。

【請求項53】

ステップ（ｄ）（ｉｖ）は、各ＵＭＩファミリーの共通配列を特定することを含む、請求項４７～５１のいずれか一項に記載の方法。

【請求項54】

前記共通配列は、前記ＵＭＩファミリーにおいて最も高い回数で現れる配列である、請求項５３に記載の方法。

【請求項55】

前記遺伝子座について前記共通配列を野生型配列と比較し、それによって前記共通配列における変異を特定することをさらに含む、請求項５３または５４に記載の方法。

【請求項56】

前記特定された変異の変異体対立遺伝子頻度（ＶＡＦ）を計算することをさらに含む、請求項５５に記載の方法。

【請求項57】

前記特定された変異の前記ＶＡＦは、前記変異を有するＵＭＩファミリーの数／ＵＭＩファミリーの全数、として定義される、請求項５６に記載の方法。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の参照
本出願は、２０１９年１月４日出願された、米国特許仮出願第６２／７８８，３７５号の優先権を主張し、その内容全体が参照により本明細書に組み込まれる。

【0002】

連邦政府による資金提供を受けた研究開発の記載
本発明は、アメリカ国立衛生研究所によって認可された助成金番号Ｒ０１ＨＧ００８７５２のもとで、政府の支援によってなされた。政府は本発明に特定の権利を有する。

【0003】

配列表の参照
本出願は配列表を含み、これはＥＦＳ－Ｗｅｂを介したＡＳＣＩＩ形式で提示されており、その全体が参照により本明細書に組み込まれる。２０１９年１１月２６日に作成された当該ＡＳＣＩＩコピーは、ＲＩＣＥＰ００５８ＷＯ＿ＳＴ２５．ｔｘｔと名付けられており、サイズが１４５．６キロバイトである。

【0004】

１．分野
本発明は、全般的には、分子生物学および医学の分野に関する。より具体的には、多重化コピー数変異検出および定量的アンプリコン配列決定を使用した対立遺伝子割当定量化のための組成物および方法に関する。

【背景技術】

【0005】

２．関連技術の記載
コピー数変異（ＣＮＶ）は、癌形成および進行に関与する重要な癌バイオマーカーである。それらは腫瘍の著しい割合で存在し、癌タイプに応じて３％～９８％である。多くのＣＮＶは、ターゲティング療法に感受性または抵抗性を付与し、例えば、ＭＥＴ増幅は非小細胞肺癌においてＭＥＴＴＫＩに対する感受性の増加を付与し、ＰＴＥＮ欠失はメラノーマにおいてＢＲＡＦ阻害剤抵抗性を付与する。腫瘍試料では、特定遺伝子のＣＮＶは、腫瘍の不均一性および正常細胞混入に起因して、細胞の小さい割合（＜１０％）でのみ存在し得る。

【0006】

変異およびインデルと異なり、ＣＮＶは、固有の配列ではなく、そのため、ＣＮＶの検出は正確な定量化を必要とする。この定量化は、ＤＮＡ分子のサンプリングにおける偶然性によって困難である。例えば、遺伝子座当たり１２００分子（すなわち、６００個の正常細胞からの１２００半数体ゲノムコピー、４ｎｇのゲノムＤＮＡ）の標準偏差（σ）は、ポアソン分布：

【数1】

によって推定することができ、分子数の３％に対応する。この場合、１％の過剰コピーを検出することは可能ではない。理論的には、入力分子の数を増加させるか、またはより多くの遺伝子座を分析することが、同様に変動を低下させることができ、σは

【数2】

として推定することができる。ゲノムコピー数または遺伝子座数が×１００増加すると、σは０．３％まで減少し、１％の過剰コピーは検出可能であろう。

【0007】

分子診断におけるＣＮＶ検出のための現在の標準法は、ｉｎｓｉｔｕハイブリダイゼーション（ＩＳＨ）であり、少数の細胞の観察に基づいてＣＮＶ状態を決定することができる。しかしながら、ＩＳＨ技術は、多数のゲノム領域の同時分析を実行する能力を欠いており、蛍光および明視野顕微鏡の両方で区別可能な色調の数が限定されていることに起因する。さらに、ＩＳＨは、特殊な検査室によって実行されることを必要とする複雑な工程であり、それが広く採用されることを妨げている。

【0008】

ＣＮＶ検出のための別の方法は、液滴デジタルＰＣＲ（ｄｄＰＣＲ）であり、それはＤＮＡ分子の絶対的定量化のためのＰＣＲをベースとした方法である。しかしながら、ＣＮＶにおけるその検出限度（ＬｏＤ）は、多くの反復実験を伴う約２０％過剰コピーである。ＩＳＨと同様に、ｄｄＰＣＲもまた、蛍光チャネルの限定された数に起因して多重化することができないことに悩まされている。アレイ比較ゲノムハイブリダイゼーションおよびＳＮＰアレイを含むマイクロアレイをベースとした方法は、多くのＣＮＶおよび異数性のスクリーニングのために使用される高度に多重化された方法である。しかしながら、それらは＜４０ｋｂの小さいＣＮＶまたは＜３０％過剰コピーの低頻度ＣＮＶを検出するには優れていない。

【0009】

次世代配列決定（ＮＧＳ）は、過去１０年にわたって急速に費用を低下させていることが示されているハイスループット技術である。ＮＧＳは、癌分子診断の分野において一般的である。＜０．１％変異体対立遺伝子頻度のＬｏＤを有する高度に多重化した変異検出は、ＮＧＳプラットホームで達成され、商業化されている。しかしながら、ＣＮＶ検出のためのＮＧＳ法の現在のＬｏＤは、優れたものではなく、全エクソーム配列（ＷＥＳ）は約３０％過剰コピーのレベルでＣＮＶ発見のために使用されているが、高価であり、より低いＬｏＤを達成するには、より多くのＮＧＳリード（費用の比例した増加を伴う）さえ必要とする。ＦｏｕｎｄａｔｉｏｎＯｎｅ市販パネルなどのより小さいハイブリッド－キャプチャーパネルは、約３０％の過剰コピーのＬｏＤを、より低い費用で達成することができる。

【0010】

診断用のＮＧＳパネルでは、標的豊富化が、関連しないゲノム領域で浪費されるＮＧＳリードを低下させるために必要である。標的豊富化のための２つの一般的な方法は、ハイブリッド－キャプチャーおよび多重ＰＣＲである。現在のＮＧＳをベースとしたＣＮＶパネルはほとんどがハイブリッド－キャプチャーをベースとしており、標的領域がビオチン化核酸プローブによって捕捉され、ストレプトアビジン磁性ビーズを使用してゲノムの残りから分離されることを意味する。ハイブリッド－キャプチャーパネルは、パネルサイズが小さい場合に低い的中率を有し、そのため、ほとんどのパネルは＞１００ｋｂ（すなわち、＞１０００プローブまたは遺伝子座）であり、これはビーズ表面、プローブ、および捕捉された標的における望ましくないＤＮＡの非特異的結合に起因する。遺伝子座の大きい数によって、ハイブリッド－キャプチャーパネルの適用範囲は、均一ではなく、９５％および５％パーセンタイルの遺伝子座が少なくとも３０倍異なり、定量化にバイアスの別の層を導入する。ハイブリッド－キャプチャーパネルはまた、不完全な端修復および連結によって生じる低い変換率（すなわち、配列決定された入力分子の割合）、バイアス化したサンプリング処理を生じ、変動に関与する。

【発明の概要】

【0011】

ＤＮＡ試料におけるターゲティングされたゲノム遺伝子座の各鎖を、ポリメラーゼ連鎖反応によってオリゴヌクレオチドバーコード配列で標識して、ハイスループット配列決定のためのゲノム領域を増幅させるための、定量的アンプリコン配列決定の方法が本明細書で提供される。本方法は、各遺伝子の過剰コピーの頻度を定量化することによって、一連の関心対象の遺伝子におけるコピー数変異（ＣＮＶ）の同時検出のために使用することができる。さらに、これらの方法は、多重ＰＣＲを使用した、ターゲティングされたゲノム遺伝子座についての異なる遺伝的同一性の対立遺伝子比の定量化を提供する。

【0012】

一実施形態において、ハイスループット配列決定のためにゲノムＤＮＡのターゲティングされた領域を調製するための方法が本明細書で提供され、本方法は、（ａ）ゲノムＤＮＡ試料を得ることと、（ｂ）（ｉ）５’から３’に向かって、第１の領域、０～５０ヌクレオチド（例えば、０、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、または５０ヌクレオチド）の長さを有する第２の領域、少なくとも４個の縮重ヌクレオチド（例えば、４、５、６、７、８、９、１０、１１、または１２個の縮重ヌクレオチド）を含む第３の領域、および第１の標的ゲノムＤＮＡ領域に相補的である配列を含む第４の領域を含む、第１のオリゴヌクレオチド、ならびに（ｉｉ）５’から３’に向かって、第５の領域、０～５０ヌクレオチド（例えば、０、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、または５０ヌクレオチド）の長さを有する第６の領域、および第２の標的ゲノムＤＮＡ領域に相補的である配列を含む第７の領域を含む、第２のオリゴヌクレオチドを使用して２サイクルのＰＣＲを実行することによって、ゲノムＤＮＡ試料の少なくとも一部を増幅させることと、（ｃ）ステップ（ｂ）で使用されるアニーリング温度よりも０～１０℃（例えば、１～１０、２～１０、３～１０、４～１０、５～１０、１～９、１～８、１～７、１～６、１～５、２～９、２～８、２～７℃、またはそこに引き出すことができる任意の範囲もしくは値）高いアニーリング温度で、かつ（ｉ）第１の領域の少なくとも一部の逆相補体とハイブリダイズすることができる配列を含む第３のオリゴヌクレオチド、および（ｉｉ）第５の領域の少なくとも一部の逆相補体にハイブリダイズすることができる配列を含む第４のオリゴヌクレオチドを使用して、少なくとも３サイクルのＰＣＲを実行することによってステップ（ｂ）の生成物を増幅させることと、（ｄ）５’から３’に向かって、第８の領域、０～５０ヌクレオチド（例えば、０、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３１、３２、３３、３４、３５、３６、３７、３８、３９、４０、４１、４２、４３、４４、４５、４６、４７、４８、４９、または５０ヌクレオチド）の長さを有する第９の領域、および第３の標的ゲノムＤＮＡ領域に相補的である配列を含む第１０の領域を含む、第５のオリゴヌクレオチドを使用して、少なくとも１サイクルのＰＣＲを実行することによってステップ（ｃ）の生成物を増幅させることと、を含み、第３の標的ゲノムＤＮＡ領域は、第２の標的ゲノムＤＮＡ領域よりも、第１の標的ゲノムＤＮＡに少なくとも１ヌクレオチド近い。

【0013】

いくつかの態様において、方法は、ハイスループット配列決定のためにゲノムＤＮＡの１～１０，０００個のターゲティングされた領域（例えば、少なくとも１、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、２５０、５００、７５０、１，０００、２，０００、３，０００、４，０００、もしくは５，０００個、および最大で１０，０００、９，０００、８，０００、７，０００、６，０００、５，０００、４，０００、３，０００、２，０００、１，０００、７５０、５００、２５０、１００、７５、もしくは５０個のターゲティングされた領域、またはそこに引き出すことができる任意の範囲または値）を調製するための方法である。いくつかの態様において、第３の領域は、固有分子識別子（ＵＭＩ）である。いくつかの態様において、第３の標的ゲノムＤＮＡ領域は、第２の標的ゲノムＤＮＡ領域よりも、第１の標的ゲノムＤＮＡ領域に１～１０（例えば、１、２、３、４、５、６、７、８、９、または１０）塩基近い。いくつかの態様において、第１の領域および第８の領域は、ユニバーサルプライマー結合部位である。いくつかの態様において、第１の領域および第８の領域は、完全または部分的なＮＧＳアダプター配列である。いくつかの態様において、第５の領域は、ヒトゲノム中に認めることができない配列を含む。いくつかの態様において、第５の領域は、ＮＧＳアダプター配列とは異なる配列を含む。いくつかの態様において、第１の領域および第５の領域の融解温度は、第４の領域および第７の領域の融解温度よりも０～１０℃（例えば、１～１０、２～１０、３～１０、４～１０、５～１０、１～９、１～８、１～７、１～６、１～５、２～９、２～８、２～７℃、またはそこに引き出される任意の範囲もしくは値）高い。いくつかの態様において、第３の領域における縮重ヌクレオチドは、各々独立して、Ａ、Ｔ、またはＣのうちの１つである。いくつかの態様において、第３の領域における縮重ヌクレオチドにＧはない。いくつかの態様において、各々が固有の第３の領域を有する第１のオリゴヌクレオチドの集団がある。

【0014】

いくつかの態様において、本方法は、ステップ（ｃ）の生成物を精製することをさらに含む。いくつかの態様において、精製することは、ＳＰＲＩ精製またはカラム精製を含む。いくつかの態様において、本方法は、ステップ（ｄ）の生成物を精製することをさらに含む。いくつかの態様において、精製することは、ＳＰＲＩ精製またはカラム精製を含む。いくつかの態様において、本方法は、（ｅ）ステップ（ｄ）の生成物を、第１の領域および第８の領域にハイブリダイズするプライマーを使用したＰＣＲによって増幅させることであって、プライマーが、次世代配列決定のためのインデックス配列を含む、ことを、さらに含む。いくつかの態様において、本方法は、ステップ（ｅ）の生成物を精製することをさらに含む。いくつかの態様において、精製することは、ＳＰＲＩ精製またはカラム精製を含む。いくつかの態様において、本方法は、ステップ（ｅ）の生成のハイスループットＤＮＡ配列決定を実行する（ｆ）をさらに含む。いくつかの態様において、ハイスループットＤＮＡ配列決定は、次世代配列決定を含む。

【0015】

いくつかの態様において、第１の標的ゲノムＤＮＡ領域および第２の標的ゲノムＤＮＡ領域は、ゲノムＤＮＡの向かい合う鎖上にある。いくつかの態様において、第１の標的ゲノムＤＮＡ領域および第２の標的ゲノムＤＮＡ領域は、４０ヌクレオチド～５００ヌクレオチド（例えば４０、４５、５０、５５、６０、６５、７０、７５、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、もしくは５００ヌクレオチド、またはそこに引き出される任意の範囲および値）離れている。いくつかの態様において、ステップ（ｂ）は、約３０分（例えば、２７、２８、２９、３０、３１、３２、または３３分）の伸長時間を含む。いくつかの態様において、ステップ（ｃ）は、約３０秒（例えば、２７、２８、２９、３０、３１、３２、または３３秒）の伸長時間を含む。いくつかの態様において、ステップ（ｄ）は、約３０分（例えば、２７、２８、２９、３０、３１、３２、または３３分）の伸長時間を含む。

【0016】

いくつかの実施形態において、少なくとも１つの標的遺伝子の過剰コピーの頻度（ＦＥＣ）を定量化するための方法が本明細書で提供され、本方法は、（ａ）ゲノムＤＮＡ試料を得ることと、（ｂ）本実施形態のうちのいずれか１つの方法に従ってハイスループット配列決定のためにゲノムＤＮＡを調製することであって、第４の領域、第７の領域、および第１０の領域の配列は、少なくとも1つの標的遺伝子にハイブリダイズする、ことと、（ｃ）本実施形態のうちのいずれか１つの方法に従ってハイスループット配列決定を実行することと、（ｄ）ステップ（ｃ）で得られる配列決定情報に基づいて少なくとも１つの標的遺伝子についてＦＥＣを計算することと、を含む。

【0017】

いくつかの態様において、本方法は、一連の標的遺伝子についてＦＥＣを定量化するための方法であり、一連の標的遺伝子は、２～１０００個の標的遺伝子（例えば、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、２５０、５００、もしくは７５０個、および最大で１，０００、９００、８００、７５０、７００、６５０、６００、５５０、５００、４５０、４００、３５０、３００、２５０、２００、１５０、１００、７５、５０、２５、２０、１５、１０、９、８、７、６、５、４、もしくは３個のターゲティングされた領域、またはそこに引き出される任意の範囲および値）を含む。いくつかの態様において、ステップ（ｂ）は、第１のオリゴヌクレオチドの集団、第２のオリゴヌクレオチドの集団、および第５のオリゴヌクレオチドの集団を使用して実行され、第１、第２、および第５のオリゴヌクレオチドの集団の各々の一部は、一連の標的遺伝子のうちの１つに相補的である第４、第７、および第１０の領域をそれぞれ含む。いくつかの態様において、第４、第７、および第１０の領域の各々は、ヒトゲノム中に一度のみ認められる配列を含む。いくつかの態様において、１つの標的遺伝子にハイブリダイズする各第１のオリゴヌクレオチドは、同じ標的遺伝子にハイブリダイズする各他の第１のオリゴヌクレオチドと比較して固有の第３の領域を有する。いくつかの態様において、ステップ（ｂ）は、参照遺伝子に相補的である第４、第７、および第１０の領域をそれぞれ含む、第１のオリゴヌクレオチド、第２のオリゴヌクレオチド、および第５のヌクレオチドを使用して実行される。いくつかの態様において、ステップ（ｂ）は、ハイスループット配列決定のための各標的遺伝子または参照遺伝子の一部を調製し、一部は、４０ヌクレオチド～５００ヌクレオチド（例えば、４０、４５、５０、５５、６０、６５、７０、７５、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、もしくは５００ヌクレオチド、またはそこに引き出される任意の範囲および値）長である。いくつかの態様において、ＦＥＣは以下：

【数3】

として定義される。

【0018】

いくつかの態様において、ステップ（ｄ）は、（ｉ）ＮＧＳリードを各標的遺伝子のターゲティングされた部分とアラインメントして、ＮＧＳリードをそれらがアラインメントする遺伝子座に基づいてサブグループにグループ化することと、（ｉｉ）同じＵＭＩ配列を担持する全てのＮＧＳリードが１つのＵＭＩファミリーとしてグループ化されるように、各遺伝子座でのＮＧＳリードを、それらのＵＭＩ配列に基づいて分類することと、（ｉｉｉ）ＰＣＲエラーまたはＮＧＳエラーから生じるＵＭＩファミリーを取り除くことと、（ｉｖ）各遺伝子座での固有ＵＭＩ配列の数を計数することと、（ｖ）各標的遺伝子および参照遺伝子における各遺伝子座での固有ＵＭＩの数に基づいてＦＥＣを計算することと、を含む。いくつかの態様において、ステップ（ｄ）（ｉｉｉ）は、ＵＭＩ縮重塩基設計に適合しないＵＭＩ配列を取り除くことを含む。いくつかの態様において、ステップ（ｄ）（ｉｉｉ）は、Ｆｍｉｎよりも小さいＵＭＩファミリーサイズを有するＵＭＩファミリーを取り除くことを含み、ＵＭＩファミリーサイズは、同じＵＭＩを担持するリードの数であり、Ｆｍｉｎは、２～２０（例えば、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、または２０）である。いくつかの態様において、ステップ（ｄ）（ｉｖ）は、より大きいファミリーサイズを有する別のＵＭＩ配列と１または２個の塩基のみが異なるＵＭＩ配列を取り除くことを含む。

【0019】

いくつかの態様において、ＦＥＣは以下：

【数4】

として定義され、式中、

【数5】

は、標的遺伝子座の全てまたは一部についての固有ＵＭＩ数の合計であり、uは、考慮する遺伝子座の数であり、uは、標的遺伝子における遺伝子座の全数以下であり、

【数6】

は、参照遺伝子座の全てまたは一部についての固有ＵＭＩ数の合計であり、vは、１つの参照について考慮する遺伝子座の数であり、vは、参照における遺伝子座の全数以下であり、wは、考慮する参照の数であり、wは参照の全数以下であり、kは、実験的較正によって決定される。いくつかの態様において、ＦＥＣを使用して、標的遺伝子のコピー数変異（ＣＮＶ）状態を特定する。

【0020】

一実施形態において、少なくとも１つの標的ゲノム遺伝子座について異なる遺伝的同一性の対立遺伝子比を定量化するための方法が本明細書で提供され、本方法は、（ａ）ゲノムＤＮＡ試料を得ることと、（ｂ）本実施形態のうちのいずれか１つの方法に従ってハイスループット配列決定のためにゲノムＤＮＡを調製することであって、第４の領域、第７の領域、および第１０の領域の配列は、少なくとも１つの標的遺伝子の付近でゲノムＤＮＡにハイブリダイズする、ことと、（ｃ）本実施形態のうちのいずれか１つの方法に従ってハイスループット配列決定を実行することと、（ｄ）ステップ（ｃ）で得られる配列決定情報に基づいて、少なくとも１つの標的ゲノム遺伝子座について異なる遺伝的同一性の対立遺伝子比を計算することと、を含む。

【0021】

いくつかの態様において、本方法は、一連の標的ゲノム遺伝子座について異なる遺伝的同一性の対立遺伝子比を特定するための方法であり、一連の標的ゲノム遺伝子座は、２～１０，０００個の標的ゲノム遺伝子座（例えば、少なくとも、２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、２５０、５００、７５０、１，０００、２，０００、３，０００、４，０００、もしくは５，０００個、および最大で１０，０００、９，０００、８，０００、７，０００、６，０００、５，０００、４，０００、３，０００、２，０００、１，０００、７５０、５００、２５０、１００、７５、もしくは５０個の標的ゲノム遺伝子座、またはそこに引き出される任意の範囲もしくは値）を含む。いくつかの態様において、ステップ（ｂ）は、第一のオリゴヌクレオチドの集団、第２のオリゴヌクレオチドの集団、および第５のオリゴヌクレオチドの集団を使用して実行され、第１、第２、および第５のオリゴヌクレオチドの集団の各々の一部は、一連の標的ゲノム遺伝子座の少なくとも１つの付近でゲノムＤＮＡに相補的である第４、第７、および第１０の領域をそれぞれ含む。いくつかの態様において、第４、第７、および第１０の領域の各々は、ステップ（ｂ）の条件下で、ゲノムＤＮＡの非標的領域にハイブリダイズすることができない配列を含む。いくつかの態様において、１つの標的ゲノム遺伝子座の付近でゲノムＤＮＡにハイブリダイズする各第１のオリゴヌクレオチドは、同じ標的ゲノム遺伝子座の付近でゲノムＤＮＡにハイブリダイズする各他の第１のオリゴヌクレオチドと比べて固有の第３の領域を有する。いくつかの態様において、各標的ゲノム遺伝子座は、４０ヌクレオチド～５００ヌクレオチド（例えば、４０、４５、５０、５５、６０、６５、７０、７５、８０、９０、１００、１２５、１５０、１７５、２００、２２５、２５０、２７５、３００、３２５、３５０、３７５、４００、４２５、４５０、４７５、もしくは５００ヌクレオチド、またはそこに引き出される任意の範囲および値）長である。

【0022】

いくつかの態様において、ステップ（ｄ）は、（ｉ）ＮＧＳリードをターゲティングされたゲノム遺伝子座とアラインメントして、ＮＧＳリードをそれらがアラインメントする遺伝子座に基づいてサブグループにグループ化することと、（ｉｉ）同じＵＭＩ配列を担持する全てのＮＧＳリードが１つのＵＭＩファミリーとしてグループ化されるように、各遺伝子座でのＮＧＳリードを、それらのＵＭＩ配列に基づいて分類することと、（ｉｉｉ）ＰＣＲエラーまたはＮＧＳエラーから生じるＵＭＩファミリーを取り除くことと、（ｉｖ）遺伝的同一性を各残存ＵＭＩファミリーについて求めることと、（ｖ）固有ＵＭＩ配列の数を各遺伝子座で計数することと、（ｖｉ）対立遺伝子比を計算することと、を含む。いくつかの態様において、ステップ（ｄ）（ｉｉｉ）は、ＵＭＩ縮重塩基設計に適合しないＵＭＩ配列を取り除くことを含む。いくつかの態様において、ステップ（ｄ）（ｉｉｉ）は、Ｆｍｉｎよりも小さいＵＭＩファミリーサイズを有するＵＭＩファミリーを取り除くことを含み、ＵＭＩファミリーサイズは、同じＵＭＩを担持するリードの数であり、Ｆｍｉｎは、２～２０（例えば、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、または２０）である。いくつかの態様において、ステップ（ｄ）（ｉｉｉ）は、より大きいファミリーサイズを有する別のＵＭＩ配列と１または２個の塩基のみが異なるＵＭＩ配列を取り除くことを含む。いくつかの態様において、ステップ（ｄ）（ｉｖ）は、ＵＭＩファミリーにおける少なくとも７０％（例えば、７０％、７５％、８０％、８５％、９０％、９５％、または９８％）のリードが関心対象の遺伝的遺伝子座において同じである場合にのみ遺伝的同一性を求めることを含む。いくつかの態様において、対立遺伝子比は、Ｒ_{対立遺伝子}＝Ｎ_１／Ｎ_２として定義され、式中、Ｎ_１は、第１の遺伝的同一性についての固有ＵＭＩ数であり、Ｎ_２は、第２の遺伝的同一性についての固有ＵＭＩ数である。

【0023】

いくつかの態様において、ステップ（ｄ）（ｉｖ）は、各ＵＭＩファミリーの共通配列を特定することを含む。いくつかの態様において、共通配列は、ＵＭＩファミリーにおいて最も大きい回数で現れる配列である。いくつかの態様において、その遺伝子座について共通配列を野生型配列と比較し、それによって共通配列における変異を特定することをさらに含む。いくつかの態様において、本方法は、特定された変異の変異体対立遺伝子頻度（ＶＡＦ）を計算することをさらに含む。いくつかの態様において、特定された変異のＶＡＦは、変異を有するＵＭＩファミリーの数／ＵＭＩファミリーの全数として定義される。

【0024】

本明細書で使用される場合、指定された構成要素に関して「本質的に含まない」は、指定された構成要素のいずれも、組成物に意図的に配合されていないか、および／または混入物質として、もしくは痕跡量のみが存在することを意味するために本明細書で使用される。したがって、ある組成物の意図しない混入から生じる指定された構成要素の合計量は、０．０５％より十分に低く、好ましくは、０．０１％より低い。最も好ましいのは、具体的な構成成分の量が標準的な分析方法を用いて分析できない組成物である。

【0025】

本明細書で使用されるとき、「１つの（ａ）」または「１つの（ａｎ）」は１つ以上を意味してもよい。特許請求の範囲で使用される場合、「～を含む」との用語と組み合わせて使用される場合、「１つの（ａ）」または「１つの（ａｎ）」といった用語は、１つ、または１つより多くを意味していてもよい。

【0026】

特許請求の範囲における用語「または」の使用は、本開示が代替のみおよび「および／または」を指す定義を支持するけれども、代替のみを指すまたは代替が相互に排他的であることを指すように明白に指示されない限り、「および／または」を意味するように使用される。本明細書で使用されるとき、「別の」は少なくとも第２以上を意味してもよい。

【0027】

本出願の全体を通して、用語「約」は、値が、値を決定するのに採用される装置、方法に関する誤差の固有の変動、または試験対象間に存在する変動を含むことを示すのに使用される。

【0028】

本発明の他の目的、特徴および利点は、以下の詳細な説明から明らかになるだろう。しかしながら、本発明の趣旨と範囲の中にある種々の変更および改変がこの詳細な記載から当業者に明らかになるので、詳細な記載および具体的な実施例は、本発明の好ましい実施形態を示しながら、説明目的のみで提供されることが理解されるべきである。

【図面の簡単な説明】

【0029】

添付の図面は、本明細書の一部を形成し、本発明の特定の態様をさらに示すために含まれている。本発明は、本明細書に提示する具体的な実施形態の詳細な説明と組み合わせて、これら１つ以上の図面を参照することによって、よりよく理解されるだろう。

【0030】

（図１）ＱＡＳｅｑプライマー設計および実験ワークフローの図式。各プライマーセットは、３つの異なるオリゴ：特異的フォワードプライマー（ＳｆＰ）、特異的リバースプライマーＡ（ＳｒＰＡ）、および特異的リバースプライマーＢ（ＳｒＰＢ）を含む。各ＱＡＳｅｑパネルは、１つのユニバーサルフォワードプライマー（ＵｆＰ）および１つのユニバーサルリバースプライマー（ＵｒＰ）のみが必要である。ＵｆＰまたはＵｒＰにおける領域１または領域５の５’端に追加の塩基が存在し得る。１つの推奨されるワークフローでは、ＤＮＡ試料は最初に、ＳｆＰ、ＳｒＰＡ、ＤＮＡポリメラーゼ、ｄＮＴＰ、およびＰＣＲ緩衝液の全てと混合される。２サイクルの長伸長ＰＣＲが、全ての標的遺伝子座でＵＭＩの付加のために実行される。次いで、同じ元分子への複数のＵＭＩの付加を防ぎながら分子を増幅させるため、アニーリング温度は、ＵｆＰおよびＵｒＰ（短伸長、約３０秒）を使用する約７サイクルについてＰＣＲ増幅温度で約８℃上昇させ、ＵｆＰおよびＵｒＰの反応への添加は、サーモサイクラーでの開口チューブステップであることに注意する。ＳＰＲＩ磁性ビーズまたはカラムを使用した精製後、ＳｒＰＢプライマー、ＤＮＡポリメラーゼ、ｄＮＴＰ、およびＰＣＲ緩衝液をアダプター置換のためにＰＣＲ生成物と混合し、２サイクルの長伸長（約３０分）後、ＮＧＳアダプターが、プライマーダイマーまたは非特異的生成物ではなく、正しいＰＣＲ生成物にのみ付加される。ＳＰＲＩ磁性ビーズまたはカラムを使用した別の精製後、標準ＮＧＳインデックスＰＣＲを実行して、ライブラリーを正規化してＩｌｌｕｍｉｎａシークエンサーにロードする。
（図２）ＵＭＩ交差結合エネルギーのシミュレーション。ＵＭＩとして（Ｎ）_２０または（ＳＷＷ）_６ＳＷの代わりに（Ｈ）_２０を使用して、配列は、平均交差結合エネルギーを低下させ、わずかなプライマー－ダイマー相互作用を示す。ここで、５００例のシミュレーションを各ＵＭＩパターンについて実行し、各シミュレーションで、パターンと一致している２つの配列がランダムに生じ、これらの配列間の交差結合ΔＧ°を、６０℃および０．１８ＭＫ^＋を想定して計算した。
（図３Ａ～Ｂ）プライマーとＵＭＩの間のスペーサはＰＣＲバイアスを低減する。（図３Ａ）プライマーとＵＭＩの間のスペーサの重要性を評価するためのワークフロー。スペーサを有さない（セット１）、フォワードプライマーとＵＭＩの間に５ｎｔスペーサおよびリバースプライマーとＵＭＩの間に５ｎｔスペーサを有する（セット２）、またはフォワードプライマーとＵＭＩの間に１２ｎｔスペーサおよびリバースプライマーとＵＭＩの間に１１ｎｔスペーサを有する（セット３）、３セットのプライマーを使用して、インプット分子を別々に増幅させた。ＩｌｌｕｍｉｎａＭｉＳｅｑによるＮＧＳ分析の前にインデックスを付加させた。（図３Ｂ）３セットのプライマーにおける実験的ＵＭＩファミリーサイズ分布ヒストグラム。ＵＭＩ設計パターンと一致しなかったＵＭＩ配列を取り除いた。
（図４Ａ～Ｂ）ＣＮＶにおけるＵＭＩベースの絶対定量化のためのデータ分析。（図４Ａ）ＣＮＶ検出におけるデータ分析ワークフロー。ＦＡＳＴＱアウトプットファイルにおけるＮＧＳリードを分析して、結果としてＣＮＶ状態を得る。標的遺伝子のＦＥＣは、

【数7】

として計算され、式中、

【数8】

は標的遺伝子座の全てまたは一部についての固有ＵＭＩ数の合計であり、uは考慮される遺伝子座の数であり、

【数9】

は、参照遺伝子座の全てまたは一部についての固有ＵＭＩ数の合計であり、vは、１つの参照について考慮する遺伝子座の数であり、wは、考慮する参照の数であり、kは、実験的な較正によって決定される。ＣＮＶ状態は、ＦＥＣに基づいて決定される。（図４Ｂ）データ分析におけるＵＭＩファミリーサイズおよび固有ＵＭＩ数の定義：ＵＭＩファミリーサイズは、同じＵＭＩ配列を担持するリードの数であり、固有のＵＭＩ数は、１つの遺伝子座での異なるＵＭＩの全数である。
（図５）実験的ＵＭＩファミリーサイズ分布の例。同じＮＧＳライブラリーにおける１０個のＥＲＢＢ２および１０個の参照アンプリコンの例示的なＵＭＩファミリーサイズ分布２０プレックスＱＡＳｅｑ実験のための鋳型インプットとして正常な細胞株ｇＤＮＡＮＡ１８５６２（Ｃｏｒｉｅｌｌから購入）を使用し、インプット試料は２５００半数体ゲノムコピーを含む。調製したＮＧＳライブラリーを、１５０万リードを使用して、ＩｌｌｕｍｉｎａＭｉＳｅｑＲｅａｇｅｎｔＫｉｔｖ３（１５０サイクル）によって配列決定した。許容および破棄されたＵＭＩの割合が円グラフとして示される。全てのＵＭＩの中で、約２０％がＰＣＲまたは配列決定エラーによって破棄され（すなわち、Ｇ塩基がポリ（Ｈ）ＵＭＩ中に認められる）、約４０％が小さいファミリーサイズ（≦３）のために破棄される。
（図６）異なる遺伝子座についての実験的固有ＵＭＩ数の例。図５に示されるデータに対応する、各遺伝子座の例示的な固有ＵＭＩ数。白色バーはＥＲＢＢ２アンプリコンであり、灰色バーは参照アンプリコンである。インプット試料は、２５００半数体ゲノムコピーを含む。調製したＮＧＳライブラリーを、１５０万リードを使用して、ＩｌｌｕｍｉｎａＭｉＳｅｑＲｅａｇｅｎｔＫｉｔｖ３（１５０サイクル）によって配列決定した。
（図７）正常細胞株ｇＤＮＡＮＡ１８５６２での実験的較正結果およびシミュレートした理論的標準偏差限度。ＣＮＶ比の標準偏差（σ_ＣＮＶ比）は、インプット分子数に対してプロットされる。ＬｏＤは、３σ_ＣＮＶ比として見積もられ得る。異なるインプット量（７５、２５０、７５０、および２５００半数体ゲノムコピー）について５回繰り返して実験を実行した。実験結果は×印としてプロットした。シミュレーションは、サンプリングした分子数のポアソン分布を想定して実行した。シミュレートしたσ_ＣＮＶ比（破線としてプロット）は、サンプリングの偶然性による理論的下限である。
（図８Ａ～Ｃ）ＦＦＰＥ試料でのＣＮＶ検出の実験的結果の例。同じ腫瘍からの２つの肺癌ＦＦＰＥスライドを試験し、ＥＲＢＢ２ＣＮＶは生じないようだった。インプット抽出ＤＮＡ試料は、各ＮＧＳライブラリーについて２５００半数体ゲノムコピーを含む。調製したＮＧＳライブラリーを、１５０万リードを使用して、ＩｌｌｕｍｉｎａＭｉＳｅｑＲｅａｇｅｎｔＫｉｔｖ３（１５０サイクル）によって配列決定した。（図８Ａ）ＵＭＩファミリーサイズの例示的な分布が、アンプリコンＥＲＢＢ２＿１および参照＿１についてプロットされ、許容および破棄されたＵＭＩの割合が円グラフとして示される。（図８Ｂ）各アンプリコン領域についての例示的な固有ＵＭＩ数。白色バーはＥＲＢＢ２アンプリコンであり、灰色バーは参照アンプリコンである。（図８Ｃ）ＣＮＶ比が、同じ肺癌腫瘍からの２つＦＦＰＥスライドについてプロットされる。ＥＲＢＢ２のＣＮＶは、先の較正データに基づいたＱＡＳｅｑを使用して、これらのＦＦＰＥスライドで検出されない。平均およびＬｏＤ＝３σ_ＣＮＶ比は、７５０ゲノムコピーインプット細胞株ｇＤＮＡライブラリーのデータに基づいて計算され（図７を参照）、ＦＦＰＥ試料と同様な固有ＵＭＩ数を有する。
（図９Ａ～Ｅ）一次実験ワークフローを使用したプライマーダイマー低下。（図９Ａ）試験している最も単純なフローは、ワンポット反応だった。ＵＭＩ添加後、プライマーをサーモサイクラーで開口チューブステップとして反応物に直接的に添加し、インデックスＰＣＲ（すなわち、ユニバーサルＰＣＲ）をその後に実行した。的中率はこのワークフローでは低く（０．５％）、標的外ＮＧＳリードはほとんどプライマーダイマーだった。（図９Ｂ）ＳＰＲＩ精製ステップを６サイクルのユニバーサルＰＣＲ後に添加して、プライマーダイマーを低減させた。的中率は２０％に改善された。（図９Ｃ）アガロースゲルを使用したサイズ選択ステップをインデックスＰＣＲ後に加えてプライマーダイマーをさらに低減させた。的中率は図９Ｂと比較して改善したが、それでも５０％よりも低かった。（図９Ｄ）ユニバーサルＰＣＲ後にアダプター置換および精製の両方を含む一次実験ワークフローは、６６％の高い平均的中率を有する。（図９Ｅ）ワークフロー図９Ａ～Ｄにおけるプライマーダイマーの源。
（図１０Ａ～Ｃ）ＮＧＳインデックスＰＣＲを必要としない例示的なワークフロー。（図１０Ａ）インデックスおよびＰ５配列が、ＵｆＰの５’に付加され、他のインデックスおよびＰ７配列がＳｒＰＢの５’に付加される。アダプター置換から得られるアンプリコンは、Ｐ５、Ｐ７、および二重インデックスを含み、そのため、配列決定のために準備できている。（図１０Ｂ）インデックスおよびＰ７配列がＳｒＰＢの５’に付加され、インデックスプライマーがアダプター置換ステップでＳｒＰＢとともに付加される。アンプリコンは、配列決定のために準備できている。（図１０Ｃ）インデックスおよびＰ５配列がＳｆＰの５’に付加され、Ｐ５配列を担持するプライマーがユニバーサルＰＣＲステップでＵｆＰとして使用される。他のインデックスおよびＰ７配列が、ＳｒＰＢの５’に付加される。アンプリコンは、配列決定のために準備できている。
（図１１）ＱＡＳｅｑプライマーの設計およびワークフローの変形。各プライマーセットは、３つの異なるオリゴ：特異的フォワードプライマー（ＳｆＰ）、特異的リバースプライマーＡ（ＳｒＰＡ）、および特異的リバースプライマーＢ（ＳｒＰＢ）を含む。元の設計と比較して、ＳｒＰＡのみが鋳型結合領域を必要とし、ユニバーサルリバースプライマー（ＵｒＰ）は必要ではない。各ＱＡＳｅｑパネルのみがユニバーサルフォワードプライマー（ＵｆＰ）を必要とし、ＵｆＰにおける領域１の５’端で追加の塩基が存在し得る。元の実験ワークフローと比較して、より多くのサイクルのＰＣＲがユニバーサルＰＣＲステップで必要とされ、≧１０サイクルが推奨される。
（図１２Ａ～Ｂ）ＱＡＳｅｑをベースとした対立遺伝子比定量化のためのデータ分析。（図１２Ａ）対立遺伝子比定量化のためのデータ分析ワークフローＦＡＳＴＱアウトプットファイルにおけるＮＧＳリードを分析して、異なる遺伝的同一性間の対立遺伝子比を得る。各ターゲティングされた遺伝子座における対立遺伝子比は、Ｒ_{対立遺伝子}＝Ｎ_１／Ｎ_２として計算され、式中、Ｎ_１は、第１の遺伝的同一性についての固有ＵＭＩ数であり、Ｎ_２は、第２の遺伝的同一性についての固有ＵＭＩ数である。（図１２Ｂ）多数決に基づいて各ＵＭＩファミリーについて求める遺伝的同一性。
（図１３）負荷臨床ＦＦＰＥ試料におけるＣＮＶ検出の実験的結果の例。２つの既に特徴付けられたＦＦＰＥＤＮＡ試料（１つの「正常」試料および１つの「ＥＲＢＢ２増幅した異常」試料）を混合して、２．５％、５％、および１０％ＥＲＢＢ２ＦＥＣ試料を得た。「正常」試料は、０％のＥＲＢＢ２ＦＥＣを有し、「ＥＲＢＢ２増幅した異常」試料は、７８％のＥＲＢＢ２ＦＥＣを有する。実験的な正規化ＦＥＣ値は、予測されるＥＲＢＢ２ＦＥＣに対してプロットした。「正常」試料は、５回繰り返して試験し、１００プレックスＣＮＶパネルのＬｏＤは、「正常」試料の３標準偏差として推定した。２．５％、５％、および１０％ＥＲＢＢ２ＦＥＣ試料におけるＣＮＶは良好に検出されたが、これらの計算されたＦＥＣは３標準偏差範囲の外側だったためである。
（図１４）ＱＡＳｅｑを使用した変異定量化に関するバイオインフォマティクスワークフロー。変異定量化に関するデータ処理ワークフローのまとめが示される。
（図１５）１７９プレックス包括パネルで観察された分子数。インプットは、８．３ｎｇ（５０００個の予測された分子数）の１００％ＭｕｌｔｉｐｌｅｘＩＷｉｌｄＴｙｐｅｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄ（ＨｏｒｉｚｏｎＤｉｓｃｏｖｅｒｙ）だった。変換率は、６２％の平均を有し、プレックスの９７％は＞１０％の変換率を有する。
（図１６）１７９プレックス包括パネルにおけるエラー率。インプットは、８．３ｎｇの１００％ＭｕｌｔｉｐｌｅｘＩＷｉｌｄＴｙｐｅｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄ（ＨｏｒｉｚｏｎＤｉｓｃｏｖｅｒｙ）であり、同じ試料を３回繰り返して試験した。３８４０個の異なる遺伝子座におけるエラー率（ＵＭＩを使用したエラー補正後）をプロットした。最大のエラー率は、０．２３％、０．２０％、および０．２３％であり、平均エラー率は、３回繰り返して０．００６％、０．００５％、および０．００５％だった。
（図１７）１７９プレックス包括パネルにおける変異定量化結果。使用した試料は、３回繰り返して試験した０．３％ｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄ（ＨｏｒｉｚｏｎＤｉｓｃｏｖｅｒｙからの０．１％ＭｕｌｔｉｐｌｅｘＩｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄおよび１％ＭｕｌｔｉｐｌｅｘＩｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄを混合して調製した）だった。６個の変異の実験的ＶＡＦは、予想されたＶＡＦと全般的に一致し、差は、変異分子の少数（≦９）をサンプリングする際の偶発性にほとんど起因した。

【発明を実施するための形態】

【0031】

詳細な説明
元のＤＮＡ試料におけるターゲティングされたゲノム遺伝子座の各鎖をポリメラーゼ連鎖反応によりオリゴヌクレオチドバーコード配列で標識して、ハイスループット配列決定のためのゲノム領域を増幅させるための、定量的アンプリコン配列決定の方法が本明細書で提供される。また、各遺伝子の過剰コピーの頻度を定量化することによって、一連の関心対象の遺伝子におけるコピー数変異（ＣＮＶ）の同時検出を可能にする方法が、本明細書で提供される。多重ＰＣＲを使用した、ターゲティングされたゲノム遺伝子座についての異なる遺伝的同一性の対立遺伝子比の定量化もまた、本開示の方法によって提供される。これらの方法は、腫瘍試料における関心対象の遺伝子におけるＣＮＶの検出に適用することができ、ターゲティング療法の選択を誘導し、癌形成および進行の理解に役立つ。

【0032】

単一遺伝子疾患の出生前診断における現在の標準的な方法は、侵襲的で危険性のある絨毛生研または羊水穿刺から得られる胎児の遺伝子材料を配列決定することである。単一遺伝子疾患の非侵襲性出生前遺伝学的検査（ＮＩＰＴ）は、母体血漿における胎児由来細胞フリーＤＮＡ（ｃｆＤＮＡ）の循環に基づいている。バックグランドの母体ＤＮＡの存在によって、特に、母体ＤＮＡが関心対象の遺伝子座でヘテロ接合である場合、胎児のｃｆＤＮＡから生じる対立遺伝子比変化を確信して検出することは困難になる。液滴デジタルＰＣＲ（ｄｄＰＣＲ）を使用して、ＮＩＰＴにおいて疾患原因変異を担持する変異体対立遺伝子と野生型対立遺伝子との間の対立遺伝子比を定量化している（Ｌｕｎｅｔａｌ．，２００８）が、実際の実行可能性は、技術の正確性および信頼性によって限定されている。ＱＡＳｅｑは、元のインプット分子の各鎖に、固有分子識別子を付加することによってＤＮＡ分子の絶対的定量化を可能にし、ＮＩＰＴにおける対立遺伝子比定量化に適用することができる。そのため、ＱＡＳｅｑは対立遺伝子比定量化のためにも使用することができる。対立遺伝子比定量化は、ＤＮＡ分子の比を異なる遺伝的同一性によって定量化することを目的とする。正確な対立遺伝子比定量化は、βサラセミアおよび嚢胞性線維症などの単一遺伝子疾患のＮＩＰＴに対する手がかりである。

【0033】

Ｉ．ＣＮＶの過剰コピーの頻度
ゲノムＤＮＡ試料におけるＣＮＶの過剰コピーの頻度（ＦＥＣ）は、以下：

【数10】

として定義される。ＦＥＣの正の値は、試料における標的ゲノム領域の増幅を示し、ＦＥＣの負の値は、試料における標的ゲノム領域の欠失を示す。

【0034】

ＱＡＳｅｑを使用してＦＥＣを定量化することができるが、それは腫瘍組織試料におけるＣＮＶを含む細胞の割合に関する情報を提供しない。例えば、腫瘍試料中の１％の細胞が４コピーのＥＲＢＢ２を含み、残りの９９％の細胞が２コピーを含む場合、ＦＥＣは１％であり、腫瘍試料中の０．５％の細胞が６コピーのＥＲＢＢ２を含み、残りの９９．５％の細胞が２コピーを含む場合、ＦＥＣはまだ１％である。さらに、ＱＡＳｅｑは、過剰コピーのゲノム位置に関する情報を提供しない。

【0035】

ＩＩ．多重ＰＣＲパネル設計
ＱＡＳｅｑ多重ＰＣＲパネルでは、１つの標的遺伝子は、Ｍ（Ｍ＝１～１０００）セットのプライマーを必要とし、各々は標的遺伝子領域における非重複小領域（４０ｎｔ～５００ｎｔ、通常≦２００ｎｔ）を増幅させる。パネルが複数の標的遺伝子を有する場合、各遺伝子で使用されるプライマーセットの数は同様である（約Ｍ）。パネルはまた、参照ゲノム領域を増幅させるプライマーセットの同様な数（約Ｍ）を含む。参照遺伝子座は、負荷されるゲノムＤＮＡ（ｇＤＮＡ）の量における内部標準として働き、それによって試料中のＤＮＡ濃度の正確な定量化を必要としない。少なくとも１つの参照プライマーセットが各パネルで使用され得る。標的遺伝子における入力分子または遺伝子座の数を増加させると、ランダムサンプリングにおける変異をともに減少させることができるため、遺伝子あたり大きい数のプライマーセットを使用して、より少ない量のＤＮＡを含む試料タイプについてＬｏＤを改善することができ、参照プライマーセットの数はこの場合、比例して増加させることが必要である。

【0036】

各プライマーセットは、３つの異なるオリゴ：特異的フォワードプライマー（ＳｆＰ）、特異的リバースプライマーＡ（ＳｒＰＡ）、および特異的リバースプライマーＢ（ＳｒＰＢ）を含む（図１を参照）。ＳｆＰは、５’から３’に向かって、領域１、２、３、および４を含む。領域４は、鋳型結合領域であり、領域３は、ＵＭＩ領域であり、領域１は、完全または部分的なＮＧＳアダプターであり、領域２は、ＵＭＩの均一な増幅のために付加される任意選択的なスペーサ領域（典型的には０～１５ｎｔ）である。ＳｒＰＡは、５’から３’に向かって、領域５、６、および７を含む。領域７は、鋳型結合領域であり、領域５は、ユニバーサル増幅のためのカスタムアダプター（すなわち、ＮＧＳアダプターと異なり、ヒトゲノム中に認められない配列）であり、領域６は、異なる遺伝子座の均一な増幅のために付加される任意選択的なスペーサ領域（典型的には０～１５ｎｔ）である。ＳｒＰＢは、５’～３’に、領域８、９、および１０を含む。領域１０は、鋳型結合領域であり、その３’端は、領域７より、領域４に少なくとも１塩基近く、領域８は、完全または部分的なＮＧＳアダプターであり、領域９は、異なる遺伝子座の均一な増幅のために付加される任意選択的なスペーサ領域（典型的には０～１５ｎｔ）である。各ＱＡＳｅｑパネルは、１つのユニバーサルフォワードプライマー（ＵｆＰ）および１つのユニバーサルリバースプライマー（ＵｒＰ）のみが必要である。ＵｆＰは領域１を含み、ＵｒＰは領域５を含み、ＵｆＰまたはＵｒＰにおける領域１または領域５の５’端に追加の塩基が存在し得る。鋳型結合領域４、７、および１０の融解温度（Ｔｍ）は、ＰＣＲアニーリング温度とほぼ同じであり、ＵｆＰおよびＵｒＰのＴｍは、実験的なＰＣＲ条件において領域４、７、および１０よりも低くない。

【0037】

プライマーを設計するとき、有意に少ない対立遺伝子頻度（ＭＡＦ）を有する一塩基多型（ＳＮＰ）は、プライマー結合領域において避けられるべきであり、そうすることで、プライマーの結合親和性が、異なる患者試料におけるヌクレオチド配列変異によって影響される可能性がないであろう。さらに、プライマーが非標的領域の非特異的増幅を起こしやすい傾向がないことを確実にするために、全ヒトゲノムヌクレオチド配列は検索されるべきである。

【0038】

腫瘍試料のホルマリン固定パラフィン包理（ＦＦＰＥ）した標本におけるＥＲＢＢ２のＣＮＶをターゲティングした例示的なパネルでは、各々が６０～７０ｎｔアンプリコンを増幅させる１０セットのプライマーが、ＥＲＢＢ２遺伝子領域において設計された。さらに、１０セットの参照プライマーが設計され、各々が異なる染色体からの異なるハウスキーピング遺伝子における領域を増幅させる（表１）。プライマーは、Ｍａｔｌａｂコードを使用して自動的に設計され、上記設計原則を満たしながら、プライマー相互作用を最小限にする。さらに、集団において＞０．２％ＭＡＦを有する非病原性ＳＮＰが回避された。オンラインツールであるＰｒｉｍｅｒ－ＢＬＡＳＴを使用して、各プライマーセットのみがヒトゲノムにおける１つのアンプリコンを有することを確実にした。プライマー配列は、表２に示される。

【0039】

（表１）アンプリコンの位置

【0040】

（表２）例示的なＱＡＳｅｑパネルにおけるプライマー配列

【0041】

（表３）１７９プレックス広範プレートにおけるプライマー配列

【0042】

ＩＩＩ．ＵＭＩ設計
ＮＧＳライブラリー調製プロセスにおいて、ＰＣＲ増幅ステップは定量化変動を有意に増加し得え、元の分子数における小さい変化を識別することを困難にする。ＵＭＩ技術を使用して、ＰＣＲバイアスを低下させて、元のＤＮＡ分子の絶対的定量化を達成し得る。ＵＭＩの概念は、全ての元のＤＮＡ分子に異なるＤＮＡ配列を「バーコード」として与えることであり、それによって各ＮＧＳリードの起源をバーコード配列に基づいて追跡することができる。十分なＮＧＳリードを得ると、ＮＧＳアウトプット中に認められる固有のＵＭＩの数は、元のＤＮＡ分子の数を反映することができる。以前、ＵＭＩ技術は、低頻度変異のＮＧＳをベースとした検出におけるエラー補正のために主に使用された。それはまた、定量化にも応用されている。各元分子を固有に標識することは、非常に多くの異なるＵＭＩ配列を使用することによって達成され、例えば、１００，０００個の元分子について１０^９個の異なるＵＭＩ配列を使用することは、反復するＵＭＩを担持する＜０．００６％の分子を生じる。

【0043】

ポリ（Ｎ）（すなわち、各位置でＡ、Ｔ、Ｃ、またはＧの混合）などの縮重塩基を含むＤＮＡ配列は、しばしばＵＭＩ配列として使用される。ＱＡＳｅｑでは、ポリ（Ｈ）（Ａ、Ｔ、またはＣ）がＵＭＩとして使用されるが、それは、ポリ（Ｎ）またはＳ（ＣまたはＧ）およびＷ（ＡまたはＴ）塩基の混合と比べて弱い交差結合エネルギーを有するためであり、シミュレーションによって示される（図２）。（Ｈ）_２０は、３．５×１０^９個の異なる配列を含み、インプットとして１００，０００個の分子について十分であり、（Ｈ）_１５は１．４×１０^７個の異なる配列を含み、インプットとして６，０００個の分子について十分である。

【0044】

ＩＶ．ＰＣＲバイアスを低減するスペーサ
ＰＣＲ効率は、異なる配列を有するアンプリコンで変動する。ＵＭＩは多くの異なる配列からなるため、プライマーと可変的なＵＭＩ領域との間のスペーサを使用して、より均一なＰＣＲ効率を達成し得る。

【0045】

ＮＧＳを実行して、ＰＣＲバイアスにおけるスペーサの影響を評価した（図３Ａ）。鋳型分子は、増幅のために５’端および３’端に２つのアダプターを有し、ＵＭＩ領域は、中間で（Ｄ）_１５からなる。スペーサを有さない（セット１）、フォワードプライマーとＵＭＩの間に５ｎｔスペーサおよびリバースプライマーとＵＭＩの間に５ｎｔスペーサを有する（セット２）、またはフォワードプライマーとＵＭＩの間に１２ｎｔスペーサおよびリバースプライマーとＵＭＩの間に１１ｎｔスペーサを有する（セット３）、３セットのプライマーを使用して、鋳型を別々に増幅させた。インデックスは、ＰＣＲを介してＮＧＳ分析前に付加された。（Ｄ）_１５は、１．４×１０^７個の異なる配列を含む。インプット鋳型分子数は、可能な配列数よりもかなり少ないため、各固有のＵＭＩ配列のみが増幅前に１コピーを有する。同じＵＭＩを担持する全てのＮＧＳリードが、同じ分子からおそらく派生される。そのため、ＵＭＩファミリーサイズ（すなわち、同じＵＭＩを担持するリードの数）は、ＰＣＲ効率の指標である。

【0046】

ＵＭＩファミリーサイズ分布を、ＰＣＲバイアスにおけるスペーサの有意性を評価するために比較した（図３Ｂ）。プライマーとＵＭＩの間のスペーサが長いほど、より均一な分布が観察された。プライマーセット３では、スペーサ長は両端で１０ｎｔよりも長く、有意に改善された分布が達成された。

【0047】

Ｖ．ＱＡＳｅｑワークフロー
ＱＡＳｅｑＮＧＳライブラリー調製ワークフローの概略が図１に示される。最初に、ＤＮＡ試料を、ＳｆＰ、ＳｒＰＡ、ＤＮＡポリメラーゼ、ｄＮＴＰ、およびＰＣＲ緩衝液と混合する。２サイクルの長伸長（約３０分）ＰＣＲを、全ての標的遺伝子座でのＵＭＩ付加のために実行する。その後で、１つのＤＮＡ分子における各鎖は、異なるＵＭＩを担持するであろう。次に、同じ元分子への複数のＵＭＩの付加を防ぎながら分子を増幅させるため、アニーリング温度を８℃上昇させ、増幅を、ＵｆＰおよびＵｒＰを使用して、短伸長（約３０秒）で、少なくとも２サイクル（例えば、約７サイクル）について実行する。反応物へのＵｆＰおよびＵｒＰの添加は、サーモサイクラーでのチューブ開口ステップである。ＳＰＲＩ磁性ビーズまたはカラムを使用した精製後、ＳｒＰＢプライマー、ＤＮＡポリメラーゼ、ｄＮＴＰ、およびＰＣＲ緩衝液をアダプター置換のためにＰＣＲ生成物と混合し、少なくとも１サイクル（例えば、２サイクル）の長伸長（約３０分）後、ＮＧＳアダプターが、プライマーダイマーまたは非特異的生成物ではなく、正しいＰＣＲ生成物にのみ付加される。ＳＰＲＩ磁性ビーズまたはカラムを使用した別の精製簿、標準ＮＧＳインデックスＰＣＲを実行して、ライブラリーを正規化してＩｌｌｕｍｉｎａシークエンサーにロードする。

【0048】

全てのタイプのＤＮＡポリメラーゼおよびＰＣＲスーパーミックスを使用することができる。使用される特異的ポリメラーゼのための標準的なアニーリング、伸長、および変性温度に従うべきである（アニーリング温度を上昇させるユニバーサルＰＣＲを除く）。

【0049】

ＶＩ．代替のＱＡＳｅｑワークフロー
ワークフローは、２サイクルのＰＣＲを使用して、ＵＭＩを付加するためにＳｆＰおよびＳｒＰＢを使用し、次いで、インデックスＰＣＲ用のインデックスプライマーを直接的に添加して実行され得る。これを試験するため、ＳｆＰとＳｒＰＢの２０セットを同じ反応に使用した。本方法の実験的な的中率は、非常に低く（０．５％）、そのため、本方法は診断のためのＮＧＳアッセイに有用ではあり得ない（図９Ａ）。オフターゲットＮＧＳリードは、ほとんどがプライマーダイマーだった。第２の代替ワークフローでは、ユニバーサルＰＣＲは、６サイクルのユニバーサルＰＣＲのためのＵｆＰおよびＵｒｐを使用して実行され、これには精製ステップが続く。これらの追加のステップは、異なるライブラリーについて的中率を１２～２８％（平均的中率＝２０％）に改善した（図９Ｂ）。第２の代替ワークフローに基づいた第３の代替ワークフローを試験した。これでは、アガロースゲルを使用したサイズ選択ステップをインデックスＰＣＲ後に加えて、さらにプライマーダイマーを低減させた。実験的な平均的中率は４２％に改善したが、まだ５０％よりも低かった（図９Ｃ）。プライマーダイマー低下は、最初の実験ワークフローを使用して達成され、両方のアダプター置換およびユニバーサルＰＣＲ後の精製を含み、６６％の高い平均的中率をもたらす（図９Ｄ）。上記ワークフローにおけるプライマーダイマーの１つの源が、図９Ｅに示される。ＳｆＰの３’部分がＳｆＰＢに結合するか、またはＳｆＰＢの３’部分がＳｆＰに結合する場合、５’および３’端の両方にユニバーサル領域を有するダイマー鎖が生じ得、そのためユニバーサルまたはインデックスＰＣＲステップで増幅され得る。

【0050】

最初のワークフローは、インデックス配列およびシークエンサーのＰ５／Ｐ７配列をアンプリコンの末端に付加する最終インデックスステップを含むが、しかしＵＭＩ付加、ユニバーサルＰＣＲ、またはアダプター置換ステップの際に上記配列を加え、そのためインデックスＰＣＲステップを必要としない、代替ワークフローがある。図１０Ａ～Ｃは、３つの例を示す。第一に、インデックスおよびＰ５配列がＵｆＰの５’に付加され、他のインデックスおよびＰ７配列がＳｒＰＢの５’に付加される。アダプター置換から得られるアンプリコンは、Ｐ５、Ｐ７、および二重インデックスを含み、そのため、配列決定のために用意できている（図１０Ａ）。第二に、インデックスおよびＰ７配列がＳｒＰＢの５’に付加され、この修飾ＳｒＰＢは、アダプター置換ステップで正常なＰ５インデックスプライマーと混合される（図１０Ｂ）。第三に、インデックスおよびＰ５配列はＳｆＰの５’に付加され、Ｐ５配列を担持するプライマーは、ユニバーサルＰＣＲステップにおいてＵｆＰとして使用される。他のインデックスおよびＰ７配列が、ＳｒＰＢの５’に付加される（図１０Ｃ）。

【0051】

代替ＱＡＳｅｑプライマー設計およびワークフローが、図１１に示される。各プライマーセットは３つの異なるオリゴ：特異的フォワードプライマー（ＳｆＰ）、特異的リバースプライマーＡ（ＳｒＰＡ）、および特異的リバースプライマーＢ（ＳｒＰＢ）を含む。ＳｆＰは、５’から３’に向かって、領域１、２、３、および４を含む。領域４は、鋳型結合領域であり、領域３は、ＵＭＩ領域であり、領域１は、完全または部分的なＮＧＳアダプターであり、領域２は、ＵＭＩの均一増幅のために付加される任意選択的なスペーサ領域（０～１５ｎｔ）である。ＳｒＰＡは、領域５を含み、これは鋳型結合領域である。ＳｒＰＢは、５’から３’に向かって、領域６、７、および８を含む。領域８は、鋳型結合領域であり、その３’端は、領域５より、領域４に少なくとも１塩基近く、領域６は、完全または部分的なＮＧＳアダプターであり、領域７は、異なる遺伝子座の均一な増幅のために付加される任意選択的なスペーサ領域（０～１５ｎｔ）である。各ＱＡＳｅｑパネルは、領域１を含む、１つのユニバーサルフォワードプライマー（ＵｆＰ）のみを必要とし、ＵｆＰにおける領域１の５’末端で追加の塩基が存在し得る鋳型結合領域４、５、および８の融解温度（Ｔｍ）は、ＰＣＲアニーリング温度とほぼ同じであり、ＵｆＰのＴｍは、実験的ＰＣＲ条件で領域４、５、および８よりも低くない。元の設計と比較して、ＳｒＰＡのみが鋳型結合領域を必要とし、ユニバーサルリバースプライマー（ＵｒＰ）は必要ではない。実験ワークフローにおいて、より多いサイクルのＰＣＲ（例えば、少なくとも１０サイクル）が、この代替プライマー設計下でユニバーサルＰＣＲステップに必要とされる。

【0052】

ＶＩＩ．データ分析ワークフロー
ＣＮＶ検出のためのデータ分析ワークフローの概略が図４Ａに示される。最初に、生ＮＧＳデータをアンプリコン領域にアラインメントし、任意選択的なアダプタートリミングをアラインメント前に実行することができる。非アラインメントリードを破棄し、アラインメントリードをそれらがアラインメントする遺伝子座によってグループ化される。

【0053】

そして、同じ遺伝子座にアラインメントされた全てのリードを、ＵＭＩ配列によってさらに割り当て、すなわち、同じＵＭＩを担持するリードを１つのＵＭＩファミリーとしてグループ化する。ＵＭＩファミリーサイズは、同じＵＭＩを担持するリードの数であり、固有ＵＭＩ数は、１つの遺伝子座での異なるＵＭＩ配列の全数である（図４Ｂ）。次いで、ＰＣＲまたはＮＧＳエラーの結果の可能性がある全ての固有ＵＭＩファミリーが、取り除かれる。例えば、設計されたＵＭＩパターン（例えば、ポリ（Ｈ）ＵＭＩ配列中に認められるＧ塩基）と一致しないＵＭＩ配列は、エラーであり、取り除かれるべきである。さらに、２つのＵＭＩ配列が１～２個の塩基のみで異なる場合、小さいＵＭＩファミリーサイズを有する１つが他から変異された可能性があり、そのため、任意選択的に取り除かれ得る。ＵＭＩエラーの除去後、ファミリーサイズ＜Ｆ_ｍｉｎを有するＵＭＩファミリーも取り除かれる。Ｆ_ｍｉｎは、ＵＭＩファミリーサイズの分布に基づいて決定され、Ｆ_ｍｉｎ＝４が使用される最も多い例であり得る。ＵＭＩ除去後の固有ＵＭＩ数（Ｎ）は、次のステップで使用される。

【0054】

標的遺伝子のＦＥＣは以下：

【数11】

として計算され得、式中、

【数12】

【数13】

は、参照遺伝子座の全てまたは一部についての固有ＵＭＩ数の合計であり、vは、１つの参照について考慮する遺伝子座の数であり、vは、参照における遺伝子座の全数以下であり、wは、考慮する参照の数であり、wは、参照の全数以下であり、kは、実験による較正によって決定される。臨床試料でＱＡＳｅｑパネルを試験する前に、較正実験を、標的遺伝子の十分に特徴付けされたＣＮＶを有するＤＮＡ試料で実行した。ｄｄＰＣＲによって特徴付けられたＣＮＶ状態を有する正常細胞株および腫瘍細胞株から抽出されたｇＤＮＡを、較正のために使用することができる。正常較正試料のＦＥＣは０であるべきである。アッセイのＬｏＤはまた、較正実験によっても決定され、ＬｏＤはアッセイによって検出可能である過剰コピーの最小頻度である。臨床試料を試験して、関心対象の遺伝子におけるＦＥＣを使用してＣＮＶ状態を推測し、ＦＥＣ＞ＬｏＤの場合、試料は標的遺伝子の特定の増幅を含むと推測され、ＦＥＣ≦ＬｏＤの場合、試料は標的遺伝子の欠失を含むと推測される。

【0055】

ＶＩＩＩ．対立遺伝子比定量化
ＱＡＳｅｑを適用して、１～１０，０００個のゲノム遺伝子座について異なる遺伝的同一性の対立遺伝子比を、多重ＰＣＲを使用して定量化することができる。ターゲティングされたゲノム遺伝子座のための多重ＰＣＲパネル設計、およびＰＣＲによってターゲティングされたゲノム遺伝子座の各鎖をオリゴヌクレオチドバーコード配列で標識するための実験的ワークフロー、それに続くハイスループット配列決定のためのゲノム領域の増幅は、ＣＮＶ検出と同様である。

【0056】

対立遺伝子比定量化のためのデータ分析ワークフローの概略が、図１２Ａに示される。最初に、生ＮＧＳデータをアンプリコン領域にアラインメントし、任意選択的なアダプタートリミングをアラインメント前に実行することができる。非アラインメントリードを破棄し、アラインメントリードをそれらがアラインメントする遺伝子座によってグループ化される。各遺伝子座では、ＮＧＳリードはＵＭＩによって割り当てられ、同じＵＭＩ配列を担持する全てのＮＧＳリードは１つのＵＭＩファミリーとしてグループ化する。ＵＭＩにおけるエラーを有する固有ＵＭＩファミリーは、ＰＣＲまたはＮＧＳエラーの結果である可能性があり、データ分析ワークフローセクションに記載されるように、取り除かれる。

【0057】

各残存ＵＭＩファミリーにおける遺伝的同一性（野生型または変異）は、多数決に基づいて求められ、遺伝的同一性は同じＵＭＩファミリーにおける少なくとも７０％のメンバー（リード）によって裏付けられる必要がある。図１２Ｂにおける例のように、ＵＭＩファミリーサイズ＝７を有するＵＭＩファミリーでは、７リード全てが同じＵＭＩ配列を共有する（２Ｄバーコードによって示される）。関心対象の遺伝子座での遺伝的同一性は、６リードで「Ａ」、１リードで「Ｇ」である。ＵＭＩファミリーにおける７０％超のリードが「Ａ」を裏付けるため、このＵＭＩファミリーでの遺伝的同一性は、「Ａ」と呼ばれる。「Ｇ」に対応する１リードは、ＰＣＲまたはＮＧＳエラーの結果である。１つの共通遺伝的同一性を裏付ける７０％超のリードを有さないＵＭＩは、破棄される。

【0058】

次に、固有のＵＭＩ数Ｎ（１つの遺伝子座での異なるＵＭＩ配列の総数）は、ターゲティングされた遺伝子座で各異なる遺伝的同一性について計数され、Ｎは元の鎖の数を示す。標的遺伝子座の対立遺伝子比は、Ｒ_{対立遺伝子}＝Ｎ_１／Ｎ_２として計算され、式中、Ｎ_１は、第１の遺伝的同一性についての固有ＵＭＩ数であり、Ｎ_２は、第２の遺伝的同一性についての固有ＵＭＩ数である。

【0059】

ＩＸ．定義
本明細書で使用される「増幅」は、１つのヌクレオチド配列または複数の配列のコピー数を増加させるための任意のインビトロプロセスを指す。核酸増幅は、ヌクレオチドのＤＮＡまたはＲＮＡへの組み込みをもたらす。本明細書で使用される場合、１つの増幅反応は、多くの回数のＤＮＡ複製からなり得る。例えば、１つのＰＣＲ反応は、３０～１００「サイクル」の変性および複製からなり得る。

【0060】

「ポリメラーゼ連鎖反応」、または「ＰＣＲ」は、ＤＮＡの相補鎖の同時的なプライマー伸長による特定のＤＮＡ配列のインビトロ増幅のための反応を意味する。言い換えると、ＰＣＲは、プライマー結合部位によって隣接される標的核酸の複数のコピーまたは複製のための反応であり、かかる反応は、（ｉ）標的核酸を変性させるステップと、（ｉｉ）プライマーをプライマー結合部位にアニーリングさせるステップと、（ｉｉｉ）プライマーを核酸ポリメラーゼによってヌクレオシド三リン酸の存在中で伸長させるステップと、の１回以上の反復を含む。通常、反応は、サーマルサイクラー装置において各ステップに最適化された異なる温度によってサイクル化される。特定の温度、各ステップでの期間、およびステップ間の変動率は、当技術分野の当業者に周知である多くの要因に依存し、例えば、参照：ＭｃＰｈｅｒｓｏｎｅｔａｌ．，ｅｄｉｔｏｒｓ，ＰＣＲ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈおよびＰＣＲ２：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ（ＩＲＬＰｒｅｓｓ，Ｏｘｆｏｒｄ，それぞれ１９９１年および１９９５年）によって例示される。

【0061】

「プライマー」は、ポリヌクレオチド鋳型と二本鎖を形成する際に、核酸合成の開始点として作用することができ、鋳型に沿ってその３’末端から伸長され得、それによって伸長した二本鎖が形成される、天然または合成いずれかのオリゴヌクレオチドを指す。伸長プロセスの際に添加されるヌクレオチドの配列は、鋳型ポリヌクレオチドの配列によって決定される。通常、プライマーはＤＮＡポリメラーゼによって伸長される。プライマーは一般に、プライマー伸長生成物の合成におけるその使用に適合性のある長さのものであり、通常、長さが８～１００ヌクレオチドの範囲、例えば、１０～７５、１５～６０、１５～４０、１８～３０、２０～４０、２１～５０、２２～４５、２５～４０などであり、より一般的には、１８～４０、２０～３５、２１～３０ヌクレオチド長の範囲、および記載された範囲の間の任意の長さであるである。典型的なプライマーは、１５～４５、１８～４０、２０～３０、２１～２５などの１０～５０ヌクレオチド長の任意の範囲にあり、記載された範囲の間の任意の長さであることができる。いくつかの実施形態において、プライマーは、約１０、１２、１５、２０、２１、２２、２３、２４、２５、２６、２７、２８、２９、３０、３５、４０、４５、５０、５５、６０、６５、または７０ヌクレオチドの長さを通常超えない。

【0062】

本明細書で使用される「組み込むこと」は、核酸ポリマーの一部になることを意味する。

【0063】

本明細書で使用される「外因的操作の非存在において」という用語は、核酸分子が改変されている溶液を変更することなく核酸分子の改変が存在していることを指す。特定の実施形態において、それはヒトの手が存在することなく、または緩衝液状態としても言及され得る、溶液状態を変化させる機械が存在することなく生じる。しかしながら、温度における変化は、改変の際に生じ得る。

【0064】

「ヌクレオシド」は、塩基－糖組み合わせ、すなわち、リン酸を欠くヌクレオチドである。用語ヌクレオシドおよびヌクレオチドの使用において特定の互換性のあることが、当技術分野で認識される。例えば、ヌクレオチドデオキシウリジン三リン酸であるｄＵＴＰは、デオキシリボヌクレオシド三リン酸である。ＤＮＡへの組み込み後、それはＤＮＡモノマーとして機能し、形式上、デオキシウリジル酸、すなわち、ｄＵＭＰまたはデオキシウリジンモノリン酸である。ｄＵＴＰをＤＮＡに組み込んでも、得られるＤＮＡにはｄＵＴＰ部分がないと言い得る。同様に、デオキシウリジンをＤＮＡに組み込んでも、それは基質分子の一部のみであると言い得る。

【0065】

本明細書で使用される「ヌクレオチド」は、塩基－糖－リン酸組み合わせを指す。ヌクレオチドは、核酸ポリマーの、すなわち、ＤＮＡおよびＲＮＡのモノマー単位である。本用語には、ｒＡＴＰ、ｒＣＴＰ、ｒＧＴＰ、またはｒＵＴＰなどのリボヌクレオチド三リン酸、およびｄＡＴＰ、ｄＣＴＰ、ｄＵＴＰ、ｄＧＴＰ、またはｄＴＴＰなどのデオキシリボヌクレオチド三リン酸が含まれる。

【0066】

「核酸」または「ポリヌクレオチド」という用語は、一般に、ＤＮＡ、ＲＮＡ、ＤＮＡ－ＲＮＡキメラ、またはそれらの誘導体もしくはアナログの少なくとも１つの分子もしくは鎖を指し、例えば、ＤＮＡ（例えば、アデニン「Ａ」、グアニン「Ｇ」、チミン「Ｔ］、およびシトシン「Ｃ」）またはＲＮＡ（例えば、Ａ、Ｇ、ウラシル「Ｕ」、およびＣ）中に認められる天然由来プリンまたはピリミジン塩基などの少なくとも１つの核酸塩基が含まれる。「核酸」という用語は、「オリゴヌクレオチド」および「ポリヌクレオチド」という用語を包含する。本明細書で使用される「オリゴヌクレオチド」は、当技術分野の２つの用語である「オリゴヌクレオチド」および「ポリヌクレオチド」を、まとめて、互換的に指す。オリゴヌクレオチドおよびポリヌクレオチドは、当技術分野の異なる用語であるが、それらの間に正確な分割線はなく、それらは本明細書において互換的に使用されることに留意する。「アダプター」という用語もまた、「オリゴヌクレオチド」および「ポリヌクレオチド」という用語と互換的に使用され得る。さらに、「アダプター」という用語は、線形アダプター（一本鎖または二本鎖のいずれか）またはステムループアダプターを示すことができる。これらの定義は、一般に、少なくとも１つの一本鎖分子を指すが、特定の実施形態において、少なくとも１つの一本鎖分子に部分的、実質的、または完全に相補的である少なくとも１つの追加の鎖も包含する。そのため、核酸は、分子の鎖を含んでいる特定の配列の１つ以上の相補的鎖または「相補体」を含む、少なくとも１つの二本鎖分子または少なくとも１つの三重鎖分子を包含し得る。本明細書で使用される場合、一本鎖核酸は接頭辞「ｓｓ」によって、二本鎖核酸は接頭辞「ｄｓ］によって、三本鎖核酸は接頭辞「ｔｓ」によって、表され得る。

【0067】

「核酸分子」または「核酸標的分子」は、標準の基本的な塩基、過修飾塩基、非天然塩基、もしくはそれらの塩基の任意の組み合わせを含む任意の一本鎖または二本鎖核酸分子を指す。例えば限定されることなく、核酸分子は、４つの標準ＤＮＡ塩基－アデニン、シトシン、グアニン、およびチミン、ならびに／または４つの標準ＲＮＡ塩基－アデニン、シトシン、グアニン、およびウラシル、を含む。ウラシルは、ヌクレオシドが２’－デオキシリボース基を含む場合、チミンで置換することができる。核酸分子は、ＲＮＡからＤＮＡに、そしてＤＮＡからＲＮＡに変換され得る。例えば、限定されることなく、ｍＲＮＡは、逆転写酵素を使用して相補的ＤＮＡ（ｃＤＮＡ）に生成され得、ＤＮＡは、ＲＮＡポリメラーゼを使用してＲＮＡに生成され得る。核酸分子は、生物学的または合成的な起源であることができる。核酸分子の例には、ゲノムＤＮＡ、ｃＤＮＡ、ＲＮＡ、ＤＮＡ／ＲＮＡハイブリッド、増幅したＤＮＡ、既存核酸ライブラリーなどが含まれる。核酸は、ヒト試料から得られ得、血液、血清、血漿、脳脊髄液、頬掻把、生検、精液、尿、糞便、唾液、汗などが挙げられる。核酸分子は、修復処置および断片化処置などの様々な処置に供され得る。断片化処置には、機械的、音波、および流体力学的な剪断が含まれる。修復処置には、伸長および／または連結を介したニック修復、平滑末端を生じる平滑化、損傷した塩基の除去、例えば、脱アミノ化、誘導体化、脱塩基性、または交差結合化ヌクレオチドなどが含まれる。興味対象の核酸分子はまた、化学的修飾（例えば、重亜硫酸塩変換、メチル化／脱メチル化）、伸長、増幅（例えば、ＰＣＲ、等温など）などに供され得る。

【0068】

「相補的」または「相補体」である核酸は、標準的なワトソン－クリック、フーグスティンもしくは非フーグスティン結合相補性規則に従って塩基対形成することができるものである。本明細書で使用される場合、「相補的」または「相補体」という用語は、上記と同じヌクレオチド比較によって評価され得るとき、実質的に相補的である核酸を指し得る。「実質的に相補的」という用語は、少なくとも１つの配列の連続した核酸塩基、または１つ以上の核酸塩基部分が分子に存在しない場合に半連続的な核酸塩基を含み、たとえ全てに満たない核酸塩基が対応する核酸塩基と塩基対を形成しない場合でさえ、少なくとも１つの核酸鎖または二本鎖にハイブリダイズすることができる、核酸を指す。特定の実施形態において、「実質的に相補的」核酸は、核酸配列の約７０％、約７１％、約７２％、約７３％、約７４％、約７５％、約７６％、約７７％、約７７％、約７８％、約７９％、約８０％、約８１％、約８２％、約８３％、約８４％、約８５％、約８６％、約８７％、約８８％、約８９％、約９０％、約９１％、約９２％、約９３％、約９４％、約９５％、約９６％、約９７％、約９８％、約９９％、約１００％、およびそれらの任意の範囲が、ハイブリダイゼーションの間に少なくとも１つの一本鎖または二本鎖核酸と塩基対を形成することができる、少なくとも１つの配列を含む。特定の実施形態において、「実質的に相補的」という用語は、ストリンジェントな条件で少なくとも１つの核酸鎖または二本鎖とハイブリダイズし得る少なくとも１つの核酸を指す。特定の実施形態において、「部分的に相補的」核酸は、低いストリンジェントな条件で少なくとも１つの一本鎖または二本鎖核酸にハイブリダイズし得る少なくとも１つの配列を含むか、または核酸塩基配列の約７０％未満がハイブリダイゼーションの間に少なくとも１つの一本鎖または二本鎖核酸分子と塩基対形成することができる少なくとも１つの配列を含む。

【0069】

「非相補的」という用語は、特定の水素結合を通して少なくとも１つのワトソン－クリック塩基対を形成する能力を欠いている核酸配列を指す。

【0070】

本明細書で使用される「縮重」という用語は、同一性が所定の配列の反対として、ヌクレオチドの様々な選択から選択することができる、ヌクレオチドまたは一連のヌクレオチドを指す。特定の実施形態において、２つ以上の異なるヌクレオシドからの選択があり得る。さらなる特定の実施形態において、１つの特定の位置でのヌクレオチドの選択は、プリンのみ、ピリミジンのみ、または非対形成プリンおよびピリミジンからの選択を含む。

【0071】

「試料」は、関心対象の核酸を含有する新鮮または保存された生物学的試料または合成的に生成された供給源から得られるか、または単離される材料を意味する。試料には、少なくとも１つの細胞、胎児細胞、細胞培養、組織標本、血液、血清、血漿、唾液、尿、涙、膣分泌物、汗、リンパ液、脳脊髄液、粘膜分泌物、腹腔液、腹水、糞便、体滲出液、臍帯血、絨毛膜絨毛、羊水、胚組織、多細胞胚、溶解物、抽出物、溶液、または関心対象の免疫核酸を含むことが疑われる反応混合物が含まれる。試料はまた、非ヒト霊長類、げっ歯類、他の哺乳動物、他の動物、植物、真菌、細菌、およびウイルスなどのヒト以外の供給源も含むことができる。

【0072】

ヌクレオチド配列に関連して本明細書で使用される場合、「実質的に知られている」とは、増幅を含む核酸分子の調製を可能にするのに十分な配列情報を有することを指す。これは典型的には約１００％であるが、いくつかの実施形態において、アダプター配列のいくつかの部分はランダムまたは縮重である。そのため、特定の実施形態において、実質的に知られているは、約５０％～約１００％、約６０％～約１００％、約７０％～約１００％、約８０％～約１００％、約９０％～約１００％、約９５％～約１００％、約９７％～約１００％、約９８％～約１００％、または約９９％～約１００％を指す。

【0073】

Ｘ．標的核酸のさらなる処理
Ａ．ＤＮＡの増幅
多くの鋳型依存性プロセスが、所与の鋳型試料に存在する核酸を増幅するために利用可能である。最も知られている増幅方法の１つは、ポリメラーゼ連鎖反応（ＰＣＲ（商標）も呼ばれる）であり、米国特許第４，６８３，１９５号、第４，６８３，２０２号、および第４，８００，１５９号、ならびにＩｎｎｉｓｅｔａｌ．，１９９０に詳細に記載されており、その各々が参照によって本明細書にその全体が組み込まれる。簡単に説明すると、鋳型ＤＮＡの２つの領域（各鎖について１つ）に相補的である２つの合成オリゴヌクレオチドプライマーを、過剰なデオキシヌクレオチド（ｄＮＴＰ）および例えば、Ｔａｑ（Ｔｈｅｒｍｕｓａｑｕａｔｉｃｕｓ）ＤＮＡポリメラーゼなどの熱安定性ポリメラーゼの存在において、鋳型ＤＮＡ（純粋である必要はない）を添加する。一連の温度サイクル（典型的には３０～３５）において、標的ＤＮＡは繰り返して、変性され（約９０℃）、プライマーおよびプライマーから伸長（７２℃）した娘鎖にアニーリング（一般的に５０～６０℃で）される。娘鎖が生成されると、それらはその後に続くサイクルで鋳型として作用する。そのため、２つのプライマー間の鋳型領域は、直線的よりもむしろ指数関数的に増幅する。

【0074】

Ｂ．ＤＮＡの配列決定
方法は、アダプター結合フラグメントのライブラリーを配列決定するためにも提供される。当業者に知られている核酸を配列決定するための任意の技術を、本開示の方法に使用することができる。ＤＮＡ配列決定技術には、標識したターミネーターまたはプライマーおよびスラブまたはキャピラリーにおけるゲル分離使用を使用した古典的なジデオキシ配列決定反応（サンガー法）、可逆的に終結した標識ヌクレオチドを使用した合成による配列決定、パイロ配列決定、４５４配列決定、標識オリゴヌクレオチドプローブのライブラリーとの対立遺伝子特異的ハイブリダイゼーション、連結が続く標識クローンのライブラリーとの対立遺伝子特異的ハイブリダイゼーションを使用した合成による配列決定、重合化ステップ中の標識ヌクレオチドの組み込みのリアルタイムモニタリング、ならびにＳＯＬｉＤ配列決定が含まれる。

【0075】

核酸ライブラリーは、Ｎｅｘｔｅｒａ（商標）ＤＮＡ試料調製キットなどのＩｌｌｕｍｉｎａ配列決定と互換性のある方法によって作成され得、Ｉｌｌｕｍｉｎａ次世代配列決定ライブラリー調製物を作成するための追加の方法は、例えば、Ｏｙｏｌａｅｔａｌ．（２０１２）に記載されている。他の実施形態において、核酸ライブラリーは、ＳＯＬｉＤ（商標）またはＩｏｎＴｏｒｒｅｎｔ配列決定法（例えば、ＳＯＬｉＤ（登録商標）ＦｒａｇｍｅｎｔＬｉｂｒａｒｙＣｏｎｓｔｒｕｃｔｉｏｎＫｉｔ、ＳＯＬｉＤ（登録商標）Ｍａｔｅ－ＰａｉｒｅｄＬｉｂｒａｒｙＣｏｎｓｔｒｕｃｔｉｏｎＫｉｔ、ＳＯＬｉＤ（登録商標）ＣｈＩＰ－ＳｅｑＫｉｔ、ＳＯＬｉＤ（登録商標）ＴｏｔａｌＲＮＡ－ＳｅｑＫｉｔ、ＳＯＬｉＤ（登録商標）ＳＡＧＥ（商標）Ｋｉｔ、Ａｍｂｉｏｎ（登録商標）ＲＮＡ－ＳｅｑＬｉｂｒａｒｙＣｏｎｓｔｒｕｃｔｉｏｎＫｉｔなど）と互換性のある方法によって作成される。次世代配列決定法のための追加の方法は、本発明の実施形態で使用され得るライブラリー構築のための様々な方法を含み、例えば、Ｐａｒｅｅｋ（２０１１）およびＴｈｕｄｉ（２０１２）に記載されている。

【0076】

特定の態様において、本開示の方法で使用される配列決定技術には、ＨｉＳｅｑ（商標）システム（例えば、ＨｉＳｅｑ（商標）２０００およびＨｉＳｅｑ（商標）１０００）、ＮｅｘｔＳｅｑ（商標）５００、およびＩｌｌｕｍｉｎａ，Ｉｎｃ．のＭｉＳｅｑ（商標）システムが含まれる。ＨｉＳｅｑ（商標）システムは、ランダムに断片化されたゲノムＤＮＡの平面的な光学的に透明な表面への付着、および固相増幅を使用して、各々が平方センチメートル当たり約１，０００コピーの鋳型を含有する数百万のクラスターによる高密度配列決定フローセルを作成する、数百万の断片の大量並列配列決定に基づいている。これらの鋳型は、合成による４色ＤＮＡ配列決定技術を使用して配列決定される。ＭｉＳｅｑ（商標）システムは、Ｉｌｌｕｍｉｎａの可逆的ターミネーターベースの合成による配列決定であるＴｒｕＳｅｑ（商標）を使用する。

【0077】

本開示の方法で使用することができるＤＮＡ配列決定技術の別の例は、４５４配列決定（Ｒｏｃｈｅ）（Ｍａｒｇｕｌｉｅｓｅｔａｌ．，２００５）である。４５４配列決定には２つのステップが含まれる。第１のステップでは、ＤＮＡは約３００～８００塩基対のフラグメントに剪断され、フラグメントは平滑末端化される。そして、オリゴヌクレオチドアダプターをフラグメントの末端に連結させる。アダプターは、増幅およびフラグメントの配列決定のためのプライマーとして機能する。フラグメントは、５’－ビオチンタグを含有する、例えば、アダプターＢを使用して、ＤＮＡ捕捉ビーズ、例えば、ストレプトアビジンコーティングビーズに結合させることができる。ビーズに結合したフラグメントは、油－水エマルションの液滴内でＰＣＲ増幅される。結果は、各ビーズにおける複数コピーのクローン的に増幅したＤＮＡフラグメントである。第２のステップでは、ビーズはウェル（ピコリットルサイズ）中で捕捉される。パイロ配列決定は、並行して各ＤＮＡフラグメントに実行される。１つ以上のヌクレオチドの付加は、配列決定装置におけるＣＣＤカメラによって記録される光シグナルを生じる。シグナル強度は、組み込まれたヌクレオチドの数に比例する。

【0078】

本開示の方法で使用することができるＤＮＡ配列決定技術の別の例は、ＳＯＬｉＤ技術（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ．）である。ＳＯＬｉＤ配列決定技術では、ゲノムＤＮＡはフラグメントに剪断され、アダプターがフラグメントの５’および３’端に結合されてフラグメントライブラリーを生じる。あるいは、アダプターをフラグメントの５’および３’端に連結させることと、フラグメントを環状化させることと、環状化フラグメントを消化して内部アダプターを生じさせることと、アダプターを得られるフラグメントの５’および３’末端に結合させて対形成したライブラリーを生じることと、によって内部アダプターを導入することができる。次いで、クローンビーズ集団を、ビーズ、プライマー、鋳型、およびＰＣＲ成分を含有するマイクロリアクター内で調製する。ＰＣＲ後、鋳型を変性させて、ビーズを豊富化させて伸長した鋳型を有するビーズを分離する。選択されたビーズでの鋳型は、ガラススライドへの結合を可能にする３’修飾に供される。

【0079】

本開示の方法で使用することがＤＮＡ配列決定技術の別の例は、ＩｏｎＴｏｒｒｅｎｔシステム（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ，Ｉｎｃ．）である。ＩｏｎＴｏｒｒｅｎｔは、高密度アレイのマイクロ機械化ウェルを使用して、この生化学的プロセスを大量の並行方式で実行する。各ウェルは、異なるＤＮＡ鋳型を保持する。ウェルの下はイオン感受性層であり、その下は特許権のあるＩｏｎセンサーである。ヌクレオチド、例えばＣが、ＤＮＡ鋳型に添加されて、次いでＤＮＡの鎖に組み込まれる場合、水素イオンが放出される。そのイオンからの電荷は、溶液のｐＨを変化させ、特許権のあるイオンセンサーによって検出することができる。シークエンサーは塩基を求め、化学的情報からデジタル情報に直接的に進む。ＩｏｎＰｅｒｓｏｎａｌＧｅｎｏｍｅＭａｃｈｉｎｅ（ＰＧＭ（商標））シークエンサーは、チップを次々とヌクレオチドによって連続して満たす。チップを満たす次のヌクレオチドが適合しない場合、電流変化が記録されず、塩基は求められない。ＤＮＡ鎖に２つの同一塩基がある場合、電圧は倍化し、チップは求められた２つの同一の塩基を記録する。これは直接的な検出－スキャンなし、カメラなし、光なし－であり、各ヌクレオチド組み込みは数秒で記録される。

【0080】

本開示の方法で使用することが配列決定技術の別の例には、ＰａｃｉｆｉｃＢｉｏｓｃｉｅｎｃｅｓの一分子、リアルタイム（ＳＭＲＴ（商標））技術が含まれる。ＳＭＲＴ（商標）では、４つのＤＮＡ塩基の各々は、４つの異なる蛍光色素のうちの１つに結合される。これらの色素はホスホ結合される。単一ＤＮＡポリメラーゼは、ゼロモード導波管（ＺＭＷ）の底で、鋳型一本鎖ＤＮＡの一分子によって固定化される。ＺＭＷは、ＺＭＷの中で、そしてそこから急速（数マイクロ秒）に拡散する蛍光ヌクレオチドのバックグランドに対して、ＤＮＡポリメラーゼによる１ヌクレオチドの組み込みの観察を可能にする封じ込め構造である。ヌクレオチドを成長する鎖に組み込むのに数マイクロ秒かかる。この時間の際、蛍光標識は励起されて蛍光シグナルを生じ、蛍光タグが切断される。対応する色素の蛍光の検出は、どの塩基が組み込まれたかを示す。プロセスは繰り返される。

【0081】

さらなる配列決定プラットホームには、ＣＧＡプラットホーム（ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓ）が含まれる。ＣＧＡ技術は環状ＤＮＡライブラリーの調製およびローリングサークル増幅（ＲＣＡ）に基づいて、固相支持体に整列されるＤＮＡナノボールを生じる（Ｄｒｍａｎａｃｅｔａｌ．、２００９）。ＣｏｍｐｌｅｔｅＧｅｎｏｍｉｃｓのＣＧＡプラットホームは、配列決定のために組み合わせプローブアンカー連結（ｃＰＡＬ）と呼ばれる新規戦略を使用する。プロセスは、アンカー分子と、固有アダプターのうちの１つとの間のハイブリダイゼーションによって開始される。４つの縮重９マーオリゴヌクレオチドが、プローブの第１の位置で特定のヌクレオチド（Ａ、Ｃ、Ｇ、またはＴ）に対応する特定のフルオロフォアによって標識される。配列決定は、正しくマッチングするプローブが鋳型にハイブリダイズして、Ｔ４ＤＮＡリガーゼを使用してアンカーに連結される反応で生じる。連結した生成物の画像化後、連結したアンカー－プローブ分子が変性される。ハイブリダイゼーション、連結、画像化、および変性のプロセスが、既知の塩基をｎ＋１、ｎ＋２、ｎ＋３、およびｎ＋４の位置で含有する新規セットの蛍光標識９マープローブを使用して、５回繰り返される。

【0082】

ＸＩ．キット
本明細書の技術には、ＤＮＡ試料におけるコピー数変異または対立遺伝子頻度を分析するためのキットが含まれる。「キット」は、物理的構成要素の組み合わせを指す。例えば、キットは、例えば、核酸プライマー、酵素、反応緩衝液、説明書、および本明細書に記載される技術を実行するために有用である他の要素などの１つ以上の構成要素を含み得る。これらの物理的要素は、本発明を実行するために適した任意の方法で配置することができる。

【0083】

キットの構成要素は、水性媒体中または凍結乾燥した形態のいずれかでパッキングされ得る。キットの容器手段は、一般に、少なくとも１つのバイアル、テストチューブ、フラスコ、ボトル、シリンジ、または他の容器手段を含み、その中に構成要素が配置され、好ましくは、適切に小分けされる（例えば、マイクロタイタープレートのウェルに小分けされる）。キットに１つを超える構成要素がある場合、キットまた、一般に、追加の構成要素が別々に配置され得る第２、第３、または他の追加の容器も含む。しかしながら、構成要素の様々な組み合わせが、単一バイアル中に含まれ得る。本発明のキットはまた、典型的には、核酸を含むための手段、および市販のための密閉した封じ込めで任意の他の試薬容器も含む。かかる容器は、所望のバイアルが保持される射出または吹き込み成型したプラスチック容器を含み得る。キットはまた、キット構成要素を使用するため、その上、キットに含まれない任意の他の試薬の使用のための説明書を含む。説明書は、実行することができる変化を含み得る。

【実施例】

【0084】

ＸＩＩ．実施例
以下の実施例は、本発明の好ましい実施形態を示すために含まれる。後に続く実施例で開示した技術は、発明者により発見された技術が、本発明の実施に際して十分機能することを示し、それ故、その実施のための好ましい方式を構成すると考えることができるということが、当業者により理解されなければならない。しかしながら、当業者は、本開示の観点で、開示される具体的な実施形態において、本発明の趣旨および範囲から逸脱することなく、同じまたは同様の結果が依然として得られる多くの変更をなし得ることを理解するべきである。

【0085】

実施例１－較正結果
ＥＲＢＢ２ＱＡＳｅｑパネルの例示的な較正実験は、ＥＲＢＢ２増幅を含まないであろう、正常細胞株ｇＤＮＡ試料ＮＡ１８５６２で実行して、定量化変動性および可能性のあるＬｏＤを分析した。ワークフローは、「ＱＡＳｅｑワークフロー」セクションに記載の通りだった。Ｔａｑポリメラーゼを、全てのＰＣＲステップで使用した。変性は９５℃で実行し、アニーリング／伸長は６０℃（アニーリング／伸長が６８℃で実行されたユニバーサルＰＣＲステップは除く）で実行した。結合されたＵＭＩを有する全ての元の分子は、ＮＧＳアウトプットに存在する必要があるため、１５リードを各分子／ＵＭＩのために確保した。２５００半数体ゲノムコピーのインプットおよび２０アンプリコンパネルのため、必要とされる全リードは、約２×２５００×２０×１５＝１，５００，０００である。１つのＤＮＡ二本鎖における各々の鎖は、このワークフローでは異なるＵＭＩを担持し、そのため２５００半数体ゲノムコピー＝５０００分子数＝８．３ｎｇのｇＤＮＡであることに留意する。この実験は、ＩｌｌｕｍｉｎａＭｉＳｅｑ装置で実行された。

【0086】

正確な鎖のマッチングを使用してＮＧＳリードをアンプリコン配列とアラインメントさせ、アラインメント率は異なるライブラリーで５０％～７０％だった。次いで、ＵＭＩファミリーサイズおよび固有ＵＭＩ数が分析された。ＵＭＩファミリーサイズの分布は、最も多い遺伝子座において約２０でピークだった（図５）。明らかなＰＣＲエラー（すなわち、ポリ（Ｈ）ＵＭＩ配列で認められるＧ塩基）を含むＵＭＩファミリーおよびファミリーサイズ＜４を有するＵＭＩが取り除かれた（図５）。ＵＭＩ結合率が完全である場合、固有ＵＭＩ数は、試料における元の分子数と等しくあるべきである。２５００半数体ゲノムコピー（５０００分子）のインプットでは、６３２～３０６５の固有ＵＭＩ数が遺伝子座に応じて得られた（図６）。

【0087】

このアッセイのＬｏＤを推定するため、ライブラリーを４つの異なるＤＮＡインプット：７５、２５０、７５０、および２５００半数体ゲノムコピーのために調製し、各条件を５回繰り返した。試料のＣＮＶ比を「データ分析ワークフロー」セクションに記載のように計算した。５回繰り返しにわたるＣＮＶ比の標準偏差（σ_ＣＮＶ比）を使用して、定量化変動性を評価し、アッセイのＬｏＤは、３σ_ＣＮＶ比として推定することができる。シミュレーションも実行して理論的σ_ＣＮＶ比を計算した。インプット分子数が増加する場合、σ_ＣＮＶ比およびＬｏＤが低下することに留意する。σ_ＣＮＶ比は、理論値よりも高く（図７）、ＵＭＩ結合バイアスおよび増幅バイアスを排除することができないためと予測された。現在の最善のσ_ＣＮＶ比は、２５００半数体ゲノムコピーで１％であり、控え目にみて、全ての４データポイントに基づいた線形近似を使用し、σ_ＣＮＶ比＝２％が得られ、したがって、推定されたＬｏＤは、約６％の過剰コピーだった。５０，０００半数体ゲノムコピーインプットまでの外挿に基づいて、可能性のあるσ_ＣＮＶ比は０．３％であり、ＬｏＤは約１％だった。ＬｏＤを評価する別の方法は、過剰コピーの異なる頻度を含む一連の較正試料を試験することによるものであり、過剰コピーの最も低い検出可能な頻度がＬｏＤである。

【0088】

実施例２－ＦＦＰＥ試料におけるＣＮＶ検出結果
２つのＦＦＰＥスライドを、「多重ＰＣＲパネル設計」セクションおよび実施例１に記載される例示的なＥＲＢＢ２パネルを使用して分析した。ＦＦＰＥスライド（Ａｓｔｅｒａｎｄから購入）は、ＥＲＢＢ２ＣＮＶを含むことが予測されない、同じ肺癌腫瘍から得られた。最初に、ＤＮＡを、ＱＩＡａｍｐＤＮＡＦＦＰＥＴｉｓｓｕｅＫｉｔ（Ｑｉａｇｅｎ）を使用して抽出し、試料当たり＞６μｇのＤＮＡを得た。ライブラリーを、実施例１に記載されるのと同じ方法を使用して調製した。８．３ｎｇの抽出ＤＮＡを各ライブラリーに使用し、それは２５００半数体ゲノムコピーおよび５０００分子インプットに相当する。各ライブラリーで確保されたＮＧＳリードの数（１，５００，０００リード）は、２５００半数体ゲノムコピーインプット細胞株ｇＤＮＡライブラリーと同じだった。

【0089】

データ分析は、実施例１に記載されるのと同じ方法を使用して実行した。細胞株ｇＤＮＡライブラリーと同様なＵＭＩファミリーサイズ分布のパターンが得られた（図８Ａ）固有ＵＭＩ数は、２５００半数体ゲノムコピーインプットを有する細胞株ｇＤＮＡライブラリーよりも小さかった。ＦＦＰＥ試料のＵＭＩ結合収量は、平均で細胞株ｇＤＮＡのものの約１／４であり、３００％超のＦＦＰＥＤＮＡが、細胞株ｇＤＮＡ試料と同じＬｏＤを達成するためにロードされる必要があることを示す（図８Ｂ）。

【0090】

ＦＦＰＥ試料の計算されたＣＮＶ比が図８Ｃに示される。このアッセイの推測されたＬｏＤ＝１５％は、７５０半数体ゲノムコピーインプット細胞株ｇＤＮＡでの較正結果に基づいており、ＦＦＰＥライブラリーと同様な固有ＵＭＩ数を有する。本結果に基づき、ＥＲＢＢ２のＣＮＶは、これらのＦＦＰＥスライドで検出されなかった。ＬｏＤは、インプット分子数が増加すると減少するため、２５００半数体ゲノムコピーインプット細胞株ｇＤＮＡでの較正結果に基づいて、６％のＬｏＤを達成することができる。

【0091】

実施例３－負荷した臨床ＦＦＰＥ試料におけるＣＮＶ定量化結果
１００プレックスＱＡＳｅｑパネルを使用して、乳癌ＦＦＰＥ試料におけるＥＲＢＢ２の倍数性を定量化した。５０プレックスは、ＥＲＢＢ２遺伝子領域（プライマー配列について表３を参照する、プライマー名はそこで「ＥＲＢＢ２」を有する）についてであり、５０プレックスは、参照として第１７染色体の短腕（プライマー配列について表３を参照する、プライマー名はそこで「Ｒｅｆ」を有する）についてだった。

【0092】

２つの既に特徴付けられたＦＦＰＥＤＮＡ試料（１つの「正常」試料および１つの「ＥＲＢＢ２増幅した異常」試料）を混合して、２．５％、５％、および１０％ＥＲＢＢ２ＦＥＣ試料を得た。「正常」試料ＤＮＡは、ＦＦＰＥ肺癌試料（Ａｓｔｅｒａｎｄから購入）から抽出し、これはＥＲＢＢ２増幅を有さないべきであり（ＦＥＣ＝０％）、「ＥＲＢＢ２増幅した異常」試料ＤＮＡは、ＦＦＰＥ乳癌試料（ＯｒｉＧｅｎｅから購入）から抽出し、７８％のＥＲＢＢ２ＦＥＣを有する。試料インプットは、ライブラリー当たり８．３ｎｇのＤＮＡ（ｑＰＣＲによって定量した）だった。「正常」試料を、別々に各々８．３ｎｇのＤＮＡインプットで調製した５回繰り返したＮＧＳライブラリーによって試験した。実験的に正規化したＦＥＣ値が、図１３に示される。正規化ＦＥＣは、以下のように計算した。
正規化ＦＥＣ_試料＝（１＋ＦＥＣ_試料）／（１＋ＦＥＣ_正常試料）－１

【0093】

ＦＥＣ_正常試料は、５回繰り返しの平均だった。ＣＮＶのＬｏＤは、以下のように推定した。
ＦＥＣ_ＬｏＤ＝３×σ_正常試料／（１＋ＦＥＣ_正常試料）＝０．８５％

【0094】

ここで、σ_正常試料は、５回繰り返しの標準偏差だった。ＣＮＶは、２．５％、５％、および１０％ＥＲＢＢ２ＦＥＣ試料で良好に検出されたが、それはそれらの計算したＦＥＣが３標準偏差範囲外であるためである（図１３を参照）。ＥＲＢＢ２の実験的に正規化したＦＥＣは、予測された値と十分相関する。

【0095】

実施例４－変異およびＣＮＶ定量化のための包括パネル
提供される方法（ＱＡＳｅｑ）は、ＣＮＶ定量化のためだけではなく、ＮＧＳエラー補正および変異定量化のためにも使用することができる。各ＱＡＳｅｑアンプリコンでは、ｆＰの３’とｒＰｉｎの３’の間の領域が変異検出領域（ＭＤＲ）であり、ＭＤＲにおける任意の小さい変異（５００ｂｐよりも小さい塩基置換、欠失、および挿入を含む）を、０．１％～０．３％のＬｏＤで検出することができる。これは、変異検出のための標準的な非ＵＭＩＮＧＳよりも非常に優れており、約１％のＬｏＤを有する。

【0096】

１７９プレックス包括パネルを開発し、乳癌試料における変異およびＣＮＶ定量化の両方について試験した。プレックスは全て、前のセクションに記載される３つのプライマー：ｆＰ（ｆＰ（別名ＳｆＰ）、ｒＰｉｎ（別名ＳｒＰＢ）、およびｒＰｏｕｔ（別名ＳｒＰＡ）を含む。９５プライマーセットをＣＮＶ定量化のために単独で使用し、遺伝子ＥＲＢＢ２に４５セット、および参照として第１７染色体の短腕に５０セットを含んだ。ＥＲＢＢ２遺伝子における５プライマーセットを、ＣＮＶおよび変異の定量化の両方のために使用した。別の７９プライマーセットを、変異定量化のみのために使用した。ＵｆＰおよびＵｒＰは、ユニバーサル増幅のために使用した（配列について表３を参照）。

【0097】

ＣＮＶ定量化を前のセクションに記載されたのと同じ方法で行った。変異定量化に関するデータ処理ワークフローを図１４にまとめる。任意選択的なアダプタートリミング後、ＮＧＳリードをアンプリコン配列とアラインメントさせた。各遺伝子座で、リードはＵＭＩファミリーに割り当てられ、ＵＭＩ配列にエラーを有するＵＭＩファミリーを取り除き、小さいＵＭＩファミリーサイズ（≦３）を有するＵＭＩファミリーも取り除いた。次いで、通常、ＵＭＩファミリーにおける最大回数を表すＭＤＲ配列である、各ＵＭＩファミリーの共通ＭＤＲ配列を見出した。最後のステップは、共通配列を野生型ＭＤＲ配列と比較すること、および初めから変異コーリングを実行することだった。１つの変異のＶＡＦは、以下のように計算することができる。ＶＡＦ＝変異を有するＵＭＩファミリーの数／ＵＭＩファミリーの全数

【0098】

この１７９プレックスパネルを、ＨｏｒｉｚｏｎＤｉｓｃｏｖｅｒｙのＭｕｌｔｉｐｌｅｘＩｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄＳｅｔで試験した。３回繰り返したＷｉｌｄＴｙｐｅｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄのＮＧＳライブラリー、および３回繰り返した０．３％ｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄ（０．１％ｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄおよび１％ｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄを混合して調製した）を試験した。試料インプットは、ライブラリー当たり８．３ｎｇのＤＮＡ（ｑＰＣＲによって定量した）だった。

【0099】

全的中率は、全てのライブラリーについて５０％よりも大きく（すなわち、＞５０％のＮＧＳリードがアンプリコンとアラインメントされ得る）、変換率（すなわち、配列決定されたインプット分子の割合）は６２％の平均を有し、プレックスの９７％は、＞１０％変換率を有する（図１５を参照）。ＵＭＩ補正後のエラー率は、異なるヌクレオチド位置で変化し、３回繰り返したＨｏｒｉｚｏｎＤｉｓｃｏｖｅｒｙＭｕｌｔｉｐｌｅｘＩＷｉｌｄＴｙｐｅｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄのライブラリーでは、最大エラー率は、０．２３％、０．２０％、および０．２３％であり、平均エラー率は、０．００６％、０．００５％、および０．００５％だった（図１６を参照）。変異定量化キャピラリーを、０．３％ｃｆＤＮＡＲｅｆｅｒｅｎｃｅＳｔａｎｄａｒｄを使用して検証した。６変異の実験的ＶＡＦは、全般的に予測されたＶＡＦと一致し、差は、変異分子の小さい数（≦９）のサンプリングにおける偶発性にほとんど起因した（図１７を参照）。

【0100】

本明細書に開示され、特許請求される全ての方法は、本開示の観点で過度な実験を行うことなく、なされ、実行されてもよい。本発明の組成物および方法は、好ましい実施形態の観点で記載されてきたが、本発明の概念、趣旨および範囲を逸脱することなく、本明細書に記載の方法、工程または工程の順序に変化が加えられてもよいことは当業者には明らかであろう。より具体的には、化学的および生理学的に関連する特定の作用物質を、同じ結果または同様の結果が達成されつつ、本明細書に記載される作用物質に交換されてもよいことは明らかであろう。当業者に明らかな全てのこのような同様の代替物および改変は、添付の特許請求の範囲に定義されるような本発明の趣旨、範囲および概念の範囲内であると考えられる。

【0101】

参考文献
以下の参考文献は、本明細書に示されるものに対して補助的に例示的な手順または他の詳細を与える程度まで、本明細書に参照により組み込まれる。