2024-516150 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

2024-516150腫瘍成長の速度を決定するための方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1A
1B
1C
1D
2A
2B
2C
3A
3B
3C
3D
4
5A-1
5A-2
5B
6A
6B
6C
6D
7A
7B
7C
7D
7E
7F
8A
8B
9A
9B
10A
10B
10C
11A
11B
11C
11D

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】公表特許公報(A)

(11)【公表番号】

(43)【公表日】2024-04-12

(54)【発明の名称】腫瘍成長の速度を決定するための方法

(51)【国際特許分類】

C12Q 1/6851 20180101AFI20240405BHJP

C12Q 1/6827 20180101ALI20240405BHJP

【ＦＩ】

C12Q1/6851 Z

C12Q1/6827 Z

【審査請求】未請求

【予備審査請求】未請求

(21)【出願番号】P 2023564419

(86)(22)【出願日】2022-04-19

(85)【翻訳文提出日】2023-12-19

(86)【国際出願番号】 US2022025356

(87)【国際公開番号】W WO2022225933

(87)【国際公開日】2022-10-27

(31)【優先権主張番号】63/178,349

(32)【優先日】2021-04-22

(33)【優先権主張国・地域又は機関】US

(81)【指定国・地域】

【公序良俗違反の表示】

（特許庁注：以下のものは登録商標）

１．ＳＷＩＦＴ

(71)【出願人】

【識別番号】513156537

【氏名又は名称】ナテラ，インコーポレイテッド

(74)【代理人】

【識別番号】100099759

【弁理士】

【氏名又は名称】青木篤

(74)【代理人】

【識別番号】100123582

【弁理士】

【氏名又は名称】三橋真二

(74)【代理人】

【識別番号】100117019

【弁理士】

【氏名又は名称】渡辺陽一

(74)【代理人】

【識別番号】100141977

【弁理士】

【氏名又は名称】中島勝

(74)【代理人】

【識別番号】100138210

【弁理士】

【氏名又は名称】池田達則

(74)【代理人】

【識別番号】100134784

【弁理士】

【氏名又は名称】中村和美

(72)【発明者】

【氏名】シャーマ，シュルティ

(72)【発明者】

【氏名】ジマーマン，ベルンハルト

(72)【発明者】

【氏名】セチ，ヒマンシュ

(72)【発明者】

【氏名】アレシン，アレクセイ

(72)【発明者】

【氏名】シェグロワ，スヴェトラーナ

【テーマコード（参考）】

4B063

【Ｆターム（参考）】

4B063QA01

4B063QA13

4B063QA19

4B063QQ02

4B063QQ08

4B063QQ42

4B063QQ52

4B063QR32

4B063QR35

4B063QR55

4B063QR62

4B063QR72

4B063QR77

4B063QS24

4B063QS34

4B063QS36

4B063QX01

(57)【要約】

本発明は、（ａ）がん患者の生体サンプルから単離された核酸を配列決定して、患者特異的がん変異を特定することと、（ｂ）多重増幅反応を行って、第１の液体生検サンプルから単離されたｃｆＤＮＡからの標的遺伝子座を増幅することであって、各標的遺伝子座が、少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第１の液体生検サンプル中のｃｔＤＮＡの量を定量化すること、を行うことによって、がん患者から収集された第１の液体生検サンプル中のｃｔＤＮＡの量を定量化することと、（ｃ）多重増幅反応を行って、第２の液体生検サンプルから単離されたｃｆＤＮＡからの標的遺伝子座を増幅することであって、各標的遺伝子座が、少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第２の液体生検サンプル中のｃｔＤＮＡの量を定量化すること、を行うことによって、がん患者から収集された第２の液体生検サンプル中のｃｔＤＮＡの量を定量化することと、（ｄ）第１の液体生検サンプルと第２の液体生検サンプルとの間のｃｔＤＮＡの成長速度を決定することと、を含む、ｃｔＤＮＡの成長速度を決定するための方法を提供する。
【選択図】図１Ａ－Ｄ

【特許請求の範囲】

【請求項1】

循環腫瘍ＤＮＡの成長速度を決定するための方法であって、
（ａ）がん患者の生体サンプルから単離された核酸を配列決定して、複数の患者特異的がん変異を特定することと、
（ｂ）手術、第一選択の化学療法、アジュバント療法、及び／又はネオアジュバント療法の後に前記がん患者から収集された第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、前記第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、前記定量化が、多重増幅反応を行って、前記第１の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、前記標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び前記増幅された標的遺伝子座を配列決定して、前記患者特異的がん変異を特定し、前記第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、
（ｃ）前記第１の液体生検サンプルの後に前記がん患者から収集された第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、前記第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、前記定量化が、多重増幅反応を行って、前記第２の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、前記標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び前記増幅された標的遺伝子座を配列決定して、前記患者特異的がん変異を特定し、前記第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、
（ｄ）前記第１の液体生検サンプルと前記第２の液体生検サンプルとの間の前記循環腫瘍ＤＮＡの成長速度を決定することと、を含む、方法。

【請求項2】

前記がんが、固形腫瘍であり、前記生体サンプルが、腫瘍組織生検サンプルである、請求項１に記載の方法。

【請求項3】

前記がんが、固形腫瘍又は血液がんであり、前記生体サンプルが、骨髄、血液、血清、血漿、又は尿サンプルである、請求項１に記載の方法。

【請求項4】

工程（ａ）が、前記核酸の全エクソーム配列決定又は全ゲノム配列決定を含む、請求項１～３のいずれか一項に記載の方法。

【請求項5】

工程（ａ）が、がん関連ゲノム遺伝子座のパネルで濃縮されている前記核酸の標的化配列決定を含み、任意選択的に、前記濃縮が、ハイブリッド捕捉又は標的化された増幅を含む、請求項１～３のいずれか一項に記載の方法。

【請求項6】

前記第１の液体生検サンプルが、手術、第一選択の化学療法、アジュバント療法、又はネオアジュバント療法の約２～１２週間後に前記患者から収集される、請求項１～５のいずれか一項に記載の方法。

【請求項7】

前記第１の液体生検サンプルが、手術、第一選択の化学療法、アジュバント療法、又はネオアジュバント療法の約４～８週間後に前記患者から収集される、請求項１～６のいずれか一項に記載の方法。

【請求項8】

前記第１の液体生検サンプルが、アジュバント化学療法（ＡＣＴ）の後に前記患者から収集される、請求項１～７のいずれか一項に記載の方法。

【請求項9】

前記第２の液体生検サンプルが、前記第１の液体生検サンプルの約２～１２週間後に前記患者から収集される、請求項１～８のいずれか一項に記載の方法。

【請求項10】

前記第２の液体生検サンプルが、前記第１の液体生検サンプルの約４～８週間後に前記患者から収集される、請求項１～９のいずれか一項に記載の方法。

【請求項11】

前記患者特異的がん変異が、少なくとも１つの体細胞変異を含む、請求項１～１０のいずれか一項に記載の方法。

【請求項12】

前記患者特異的がん変異が、少なくとも１つの単一ヌクレオチドバリアント（ＳＮＶ）を含む、請求項１～１１のいずれか一項に記載の方法。

【請求項13】

前記患者特異的がん変異が、少なくとも１つのマルチヌクレオチドバリアント（ＭＮＶ）、インデル、遺伝子融合、又は構造バリアントを含む、請求項１～１２のいずれか一項に記載の方法。

【請求項14】

前記複数の標的遺伝子座は、各々が少なくとも１つの患者特異的がん変異に広がる、少なくとも８つ又は少なくとも１６個の標的遺伝子座を含む、請求項１～１３のいずれか一項に記載の方法。

【請求項15】

前記がんが、乳がん、膀胱がん、大腸がん、又は肺がんである、請求項１～１４のいずれか一項に記載の方法。

【請求項16】

前記がんが、腹部若しくは腹壁、副腎、肛門、虫垂、膀胱、骨、脳、乳房、頸部、胸壁、結腸、横隔膜、十二指腸、耳、子宮内膜、食道、卵管、胆嚢、胃食道接合部、頭頸部、腎臓、喉頭、肝臓、肺、リンパ節、悪性滲出液、縦隔、鼻腔、大網、卵巣、膵臓、膵胆管、耳下腺、骨盤、陰茎、心膜、腹膜、胸膜、前立腺、直腸、唾液腺、皮膚、小腸、軟部組織、脾臓、胃、甲状腺、舌、気管、尿管、子宮、膣、外陰、若しくはホイップル切除のがん又は腫瘍である、請求項１～１４のいずれか一項に記載の方法。

【請求項17】

前記患者を、速い腫瘍成長速度又は遅い腫瘍成長速度を有するものとして特定することを更に含む、請求項１～１６のいずれか一項に記載の方法。

【請求項18】

前記第２の液体生検サンプルの後に前記がん患者から長期的に収集された第３の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、前記定量化が、多重増幅反応を行って、前記第３の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、前記標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び前記増幅された標的遺伝子座を配列決定して、前記患者特異的がん変異を特定し、前記第３の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、前記第１の液体生検サンプルと、前記第２の液体生検サンプルと、前記第３の液体生検サンプルとの間の前記循環腫瘍ＤＮＡの成長速度を決定することと、を更に含む、請求項１～１７のいずれか一項に記載の方法。

【請求項19】

循環腫瘍ＤＮＡの成長速度を決定するための方法であって、
（ａ）がん患者の腫瘍組織生検サンプルから単離された核酸を配列決定して、単一ヌクレオチドバリアント（ＳＮＶ）を含む複数の患者特異的がん変異を特定することと、
（ｂ）アジュバント化学療法の後に前記がん患者から収集された第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、前記第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、前記定量化が、多重増幅反応を行って、前記第１の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、前記標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び前記増幅された標的遺伝子座を配列決定して、前記患者特異的がん変異を特定し、前記第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、
（ｃ）前記第１の液体生検サンプルの後に前記がん患者から収集された第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、前記第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、前記定量化が、多重増幅反応を行って、前記第２の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、前記標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び前記増幅された標的遺伝子座を配列決定して、前記患者特異的がん変異を特定し、前記第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、
（ｄ）前記第１の液体生検サンプルと前記第２の液体生検サンプルとの間の前記循環腫瘍ＤＮＡの成長速度を決定することと、を含む、方法。

【請求項20】

循環腫瘍ＤＮＡの成長速度を決定するための方法であって、
（ａ）がん患者の腫瘍組織生検サンプルから単離された核酸を配列決定して、単一ヌクレオチドバリアント（ＳＮＶ）を含む複数の患者特異的がん変異を特定することであって、前記がんが、乳がん、膀胱がん、大腸がん、又は肺がんである、特定することと、
（ｂ）アジュバント化学療法の後に前記がん患者から収集された第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、前記第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、前記定量化が、多重増幅反応を行って、前記第１の液体生検サンプルから単離された無細胞ＤＮＡからの少なくとも１６個の標的遺伝子座を増幅することであって、前記標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び前記増幅された標的遺伝子座を配列決定して、前記患者特異的がん変異を特定し、前記第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、
（ｃ）前記第１の液体生検サンプルの後に前記がん患者から収集された第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、前記第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、前記定量化が、多重増幅反応を行って、前記第２の液体生検サンプルから単離された無細胞ＤＮＡからの少なくとも１６個の標的遺伝子座を増幅することであって、前記標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び前記増幅された標的遺伝子座を配列決定して、前記患者特異的がん変異を特定し、前記第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、
（ｄ）前記第１の液体生検サンプルと前記第２の液体生検サンプルとの間の前記循環腫瘍ＤＮＡの成長速度を決定することと、を含む、方法。

【発明の詳細な説明】

【技術分野】

【0001】

関連出願の相互参照
本出願は、２０２１年４月２２日に出願された米国仮出願第６３／１７８，３４９号の利益を主張するものであり、これは、参照によりその全体が本明細書に組み込まれる。

【背景技術】

【0002】

がんの早期再発又は転移の検出は、従来から、画像診断及び組織生検に依存してきた。腫瘍組織の生検は侵襲的であり、転移又は手術合併症に潜在的に寄与するリスクを伴うが、画像診断に基づく検出は、早期における再発又は転移を検出するのに十分に感受性ではない。がんの再発又は転移を検出するためには、より良好でより少ない侵襲的な方法、特に、腫瘍成長の速度を決定することができる非侵襲的な方法が必要である。

【発明の概要】

【0003】

一態様において、本開示は、循環腫瘍ＤＮＡの成長速度を決定するための方法であって、（ａ）がん患者の生体サンプルから単離された核酸を配列決定して、複数の患者特異的がん変異を特定することと、（ｂ）手術、第一選択の化学療法、アジュバント療法、及び／又はネオアジュバント療法の後にがん患者から収集された第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第１の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、少なくとも１つの特定された患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｃ）第１の液体生検サンプルの後にがん患者から長期的に収集された第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第２の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第２の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、少なくとも１つの特定された患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｄ）第１の液体生検サンプルと第２の液体生検サンプルとの間の循環腫瘍ＤＮＡの成長速度を決定することと、を含む、方法に関する。

【0004】

いくつかの実施形態において、がんは、固形腫瘍であり、生体サンプルは、腫瘍組織生検サンプルである。

【0005】

いくつかの実施形態において、がんは、固形腫瘍又は血液がんであり、生体サンプルは、骨髄、血液、血清、血漿、又は尿サンプルである。

【0006】

いくつかの実施形態において、工程（ａ）は、核酸の全エクソーム配列決定を含む。いくつかの実施形態において、工程（ａ）は、核酸の全ゲノム配列決定を含む。

【0007】

いくつかの実施形態において、工程（ａ）は、がん関連ゲノム遺伝子座のパネルで濃縮されている核酸の標的化配列決定を含む。いくつかの実施形態において、濃縮は、ハイブリッド捕捉を含む。いくつかの実施形態において、濃縮は、標的化された増幅を含む。

【0008】

いくつかの実施形態において、患者は、第１の液体生検サンプルの回収前に、手術で治療されている。いくつかの実施形態において、患者は、第１の液体生検サンプルの回収前に、化学療法で治療されている。いくつかの実施形態において、患者は、第１の液体生検サンプルの回収前に、アジュバント又はネオアジュバントで治療されている。いくつかの実施形態において、患者は、第１の液体生検サンプルの回収前に、放射線療法で治療されている。

【0009】

いくつかの実施形態において、第１の液体生検サンプルは、手術、第一選択の化学療法、アジュバント療法、及び／又はネオアジュバント療法の約２～１２週間後に患者から収集される。いくつかの実施形態において、第１の液体生検サンプルは、手術、第一選択の化学療法、アジュバント療法、及び／又はネオアジュバント療法の約４～８週間後に患者から収集される。いくつかの実施形態において、第１の液体生検サンプルは、手術の約２、３、４、５、６、７、８、９、１０、１１、又は１２週間後に患者から収集される。いくつかの実施形態において、第１の液体生検サンプルは、第一選択の化学療法の約２、３、４、５、６、７、８、９、１０、１１、又は１２週間後に患者から収集される。いくつかの実施形態において、第１の液体生検サンプルは、アジュバント又はネオアジュバント療法の約２、３、４、５、６、７、８、９、１０、１１、又は１２週間後に患者から収集される。いくつかの実施形態において、第１の液体生検サンプルは、アジュバント化学療法（ＡＣＴ）の約２、３、４、５、６、７、８、９、１０、１１、又は１２週間後に患者から収集される。

【0010】

いくつかの実施形態において、第２の液体生検サンプルは、第１の液体生検サンプルの約２～１２週間後に患者から収集される。いくつかの実施形態において、第２の液体生検サンプルは、第１の液体生検サンプルの約４～８週間後に患者から収集される。いくつかの実施形態において、第２の液体生検サンプルは、第１の液体生検サンプルの約２、３、４、５、６、７、８、９、１０、１１、又は１２週間後に患者から収集される。

【0011】

いくつかの実施形態において、患者特異的がん変異は、１つ以上の体細胞変異を含む。

【0012】

いくつかの実施形態において、患者特異的がん変異は、１つ以上の単一ヌクレオチドバリアント（ＳＮＶ）、１つ以上のマルチヌクレオチドバリアント（ＭＮＶ）、１つ以上のインデル、１つ以上の遺伝子融合、１つ以上の構造バリアント、又はこれらの組み合わせを含む。

【0013】

いくつかの実施形態において、複数の標的遺伝子座は、各々が少なくとも１つの患者特異的がん変異に広がる、少なくとも４つの標的遺伝子座を含む。いくつかの実施形態において、複数の標的遺伝子座は、各々が少なくとも１つの患者特異的がん変異に広がる、少なくとも８つの標的遺伝子座を含む。いくつかの実施形態において、複数の標的遺伝子座は、各々が少なくとも１つの患者特異的がん変異に広がる、少なくとも１２の標的遺伝子座を含む。いくつかの実施形態において、複数の標的遺伝子座は、各々が少なくとも１つの患者特異的がん変異に広がる、少なくとも１６の標的遺伝子座を含む。

【0014】

いくつかの実施形態において、がんは、乳がんである。いくつかの実施形態において、がんは、膀胱がんである。いくつかの実施形態において、がんは、大腸がんである。いくつかの実施形態において、がんは、肺がんである。

【0015】

いくつかの実施形態において、がんは、腹部若しくは腹壁、副腎、肛門、虫垂、膀胱、骨、脳、乳房、頸部、胸壁、結腸、横隔膜、十二指腸、耳、子宮内膜、食道、卵管、胆嚢、胃食道接合部、頭頸部、腎臓、喉頭、肝臓、肺、リンパ節、悪性滲出液、縦隔、鼻腔、大網、卵巣、膵臓、膵胆管、耳下腺、骨盤、陰茎、心膜、腹膜、胸膜、前立腺、直腸、唾液腺、皮膚、小腸、軟部組織、脾臓、胃、甲状腺、舌、気管、尿管、子宮、膣、外陰、又はホイップル切除のがん又は腫瘍である。

【0016】

いくつかの実施形態において、がんは、急性リンパ芽球性白血病、急性骨髄性白血病、副腎皮質がん腫、ＡＩＤＳ関連がん、ＡＩＤＳ関連リンパ腫、肛門がん、虫垂がん、星細胞腫、非定型奇形腫様／ラブドイド腫瘍、基底細胞がん腫、脳幹グリオーマ、脳腫瘍（脳幹グリオーマ、中枢神経系非定型奇形腫様／ラブドイド腫瘍、中枢神経系胚芽腫、星細胞腫、頭蓋咽頭腫、上衣芽腫、上衣腫、髄芽腫、髄上皮腫、中間型松果体実質腫瘍、テント上原始神経外胚葉性腫瘍、及び松果体芽腫を含む）、気管支腫瘍、バーキットリンパ腫、原発部位不明がん、カルチノイド腫瘍、原発部位不明がん腫、中枢神経系非定型奇形腫様／ラブドイド腫瘍、中枢神経系胚芽腫、子宮頸がん、小児がん、脊索腫、慢性リンパ球性白血病、慢性骨髄性白血病、慢性骨髄増殖性疾患、結腸がん、頭蓋咽頭腫、皮膚Ｔ細胞リンパ腫、内分泌膵島細胞腫瘍、子宮内膜がん、上衣芽腫、上衣腫、食道がん、鼻腔神経芽細胞腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管がん、胆嚢がん、胃（ｇａｓｔｒｉｃ）（胃（ｓｔｏｍａｃｈ））がん、消化管カルチノイド腫瘍、消化管間質細胞腫瘍、消化管間質腫瘍（ＧＩＳＴ）、妊娠性絨毛性腫瘍、グリオーマ、有毛細胞白血病、頭頸部がん、心臓がん、ホジキンリンパ腫、下咽頭がん、眼内黒色腫、膵島腫瘍、カポジ肉腫、腎臓がん、ランゲルハンス細胞組織球症、喉頭がん、口唇がん、肝臓がん、悪性線維性組織球腫骨がん、髄芽腫、髄上皮種、黒色腫、メルケル細胞がん腫、メルケル細胞皮膚がん腫、中皮腫、原発不明の転移性扁平上皮頸部がん、口腔がん、多発性内分泌腫瘍症候群、多発性骨髄腫、多発性骨髄腫／形質細胞新生物、菌状息肉腫、骨髄異形成症候群、骨髄増殖性新生物、鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、非黒色腫皮膚がん、非小細胞肺がん、口がん、口腔がん、口腔咽がん、骨肉腫、他の脳及び脊髄の腫瘍、卵巣がん、卵巣上皮がん、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、膵臓がん、乳頭腫症、副鼻腔がん、副甲状腺がん、骨盤がん、陰茎がん、咽頭がん、中間型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍／多発性骨髄腫、胸膜肺芽腫、原発性中枢神経系（ＣＮＳ）リンパ腫、原発性肝細胞肝がん、前立腺がん、直腸がん、腎臓がん、腎細胞（腎臓）がん、腎細胞がん、気道がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、セザリー症候群、小細胞肺がん、小腸がん、軟部組織肉腫、扁平上皮がん、扁平上皮頸部がん、胃（胃）がん、テント上原始神経外胚葉性腫瘍、Ｔ細胞リンパ腫、精巣がん、咽喉がん、胸腺がん、胸腺腫、甲状腺がん、移行上皮がん、腎盂及び尿管の移行上皮がん、絨毛性腫瘍、尿管がん、尿道がん、子宮がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、又はウィルムス腫瘍から選択される。

【0017】

いくつかの実施形態において、本方法は、患者を、速い腫瘍成長速度又は遅い腫瘍成長速度を有するものとして特定することを更に含む。いくつかの実施形態において、対数線形回帰は、再発又は介入の前の時間の関数としてのｃｔＤＮＡレベルに基づいて、各患者にフィッティングされる。ｃｔＤＮＡ成長速度は、回帰線の傾きから推定される。傾きのヒストグラムは、双峰分布に相関関係がある。分布内の２つのモード間の局所最小を特定するために、実数値関数は、最小帯域幅によるカーネル平滑化を使用して推定され、２モーダル推定を与える。局所最小は、関数に対して局所極値についての二次微分検定を適用することによって決定される。

【0018】

いくつかの実施形態において、本方法は、第２の液体生検サンプルの後にがん患者から長期的に収集された第３の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、定量化が、多重増幅反応を行って、第３の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第３の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、第１の液体生検サンプルと、第２の液体生検サンプルと、第３の液体生検サンプルとの間の循環腫瘍ＤＮＡの成長速度を決定することと、を更に含む。

【0019】

別の態様において、本開示は、循環腫瘍ＤＮＡの成長速度を決定するための方法であって、（ａ）がん患者の腫瘍組織生検サンプルから単離された核酸を配列決定して、単一ヌクレオチドバリアント（ＳＮＶ）を含む複数の患者特異的がん変異を特定することと、（ｂ）アジュバント化学療法の後にがん患者から収集された第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第１の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｃ）第１の液体生検サンプルの後にがん患者から収集された第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第２の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｄ）第１の液体生検サンプルと第２の液体生検サンプルとの間の循環腫瘍ＤＮＡの成長速度を決定することと、を含む、方法に関する。

【0020】

一態様において、本開示は、循環腫瘍ＤＮＡの成長速度を決定するための方法であって、（ａ）がん患者の腫瘍組織生検サンプルから単離された核酸を配列決定して、単一ヌクレオチドバリアント（ＳＮＶ）を含む複数の患者特異的がん変異を特定することであって、がんが、乳がん、膀胱がん、大腸がん、又は肺がんである、特定することと、（ｂ）アジュバント化学療法の後にがん患者から収集された第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第１の液体生検サンプルから単離された無細胞ＤＮＡからの少なくとも１６個の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｃ）第１の液体生検サンプルの後にがん患者から収集された第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第２の液体生検サンプルから単離された無細胞ＤＮＡからの少なくとも１６個の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つの患者特異的がん変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、患者特異的がん変異を特定し、第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｄ）第１の液体生検サンプルと第２の液体生検サンプルとの間の循環腫瘍ＤＮＡの成長速度を決定することと、を含む、方法に関する。

【0021】

ここに開示される実施形態は、添付の図面を参照しつつ更に説明され、同様の構造は、いくつかの図面全体で同様の数字によって参照される。示される図面は、必ずしも縮尺どおりではなく、その代わりに、ここに開示される実施形態の原理を説明する際に一般的に強調される。

【図面の簡単な説明】

【0022】

【図1A】全てのサンプルからのｃｔＤＮＡ成長の速度。（サンプルは、ＡＣＴの終了の１４日前に採取されたサンプルを許可する、ＡＣＴの終了時、又は後のＡＣＴの終了時の全てのサンプル、再発時の介入前のサンプルを含み、連続した陽性サンプルのみを考慮する）。

【図1B】全ての個々の患者の線形回帰（対数変換されたデータ）。

【図1C】傾きのヒストグラム。傾きは、各回帰について計算される。注意：反転Ｘ軸による再発までのｃｔＤＮＡレベルの増加がある場合、傾きは負である。依然として対数変換されたデータに基づいている。最小の密度グラフは、ｃｔＤＮＡにおける遅い上昇及び速い上昇で群を分割する（１．６９での例示的なカットオフ）。

【図1D】遅い上昇及び速い上昇に基づいて有色された線形回帰線。傾きは－１で乗算することによって反転され、次いで、非対数軸に変換される。速い上昇の平均のスロップは２．２６（ｓｅ＋／－０．３０）であり、一方、遅い上昇の平均の傾きは１．２６（ｓｅ＋／－０．１５）である（ウィルコクソン検定、ｐ＜２．２ｅ－１６）。

【図2A】最初の２つのｃｔＤＮＡ陽性サンプルからのｃｔＤＮＡ成長の速度。

【図2B】傾きのヒストグラム。最小の密度グラフは、ｃｔＤＮＡにおける遅い上昇及び速い上昇で群を分割する（１．６９での例示的なカットオフ）。

【図2C】遅い上昇及び速い上昇に基づいて有色された線形回帰線。傾きの全データ対２つのサンプルの比較：差の平均：０．０３８（ＣＩ９５％－０．０１８；０．０９４、ｐ＝０．１６、対応のあるｔ検定）。二分されたデータ（速い、遅い）。マクネマー検定、ｐ値＝０．４７９。Ｃｏｈｅｎｋａｐｐａ：０．７５［０．４４；１］。

【図3A】遅い成長の再発を伴う患者対速い成長の再発を伴う患者の全生存率。

【図3B】ｃｔＤＮＡなしの患者対遅い成長の再発及び速い成長の再発を伴う患者の全生存率。

【図3C】遅い成長の再発を伴う患者対速い成長の再発を伴う患者のＣＲＣ特異的生存率。

【図3D】ｃｔＤＮＡなしの患者対遅い成長の再発及び速い成長の再発を伴う患者のＣＲＣ特異的生存率。

【図4】速い群対遅い群における変異量。患者が、ｃｔＤＮＡ成長の速度に基づいて細分化され得、速く成長するｃｔＤＮＡレベルを有する患者が、最も悪い予後を有し、より大きな変異負荷を有する腫瘍が、より速く成長するｃｔＤＮＡレベルを引き起こし得、かつｃｔＤＮＡ成長速度が、臨床使用を容易にする２つのサンプルのみによって推定され得ることを結論付けることができる。

【図5A】サブ分析における患者の包含。各分析によって回答された臨床質問を示したサブ分析における患者の包含のコンソート図。臨床質問を１～７に番号付けした。

【図5B】サブ分析における患者の包含。各サブ分析に含まれる血漿サンプルの概要。番号付けされたバーは、図５Ａで示される番号付けされた臨床質問に対応する。ＡＣＴ＝アジュバント化学療法、ＣＲＣ＝大腸がん、ｃｔＤＮＡ＝循環腫瘍ＤＮＡ、ＯＳ＝全生存率、ＯＰ後＝手術後血液サンプル、ＡＣＴ後＝アジュバント化学療法後血液サンプル、ＲＦＳ＝無再発生存率、ＴＴＲ＝再発までの時間。

【図6A】手術後の循環腫瘍ＤＮＡの検出。手術後２ヶ月以内に採取された血液サンプル中のｃｔＤＮＡ検出のために層別化された無再発生存率のカプラン－マイヤープロット。ｃｔＤＮＡ陽性及びｃｔＤＮＡ陰性患者における再発率を示す。

【図6B】手術後の循環腫瘍ＤＮＡの検出。放射線学的再発を伴う患者又はこの時点でｃｔＤＮＡ陽性であった患者における、手術後４週間以内に収集された術後血漿サンプル中の無細胞ＤＮＡのレベル。分析を、ｃｔＤＮＡの検出によって層別化した。対数変換されたｃｆＤＮＡレベルを、スチューデントのｔ検定によって比較した。

【図6C】手術後の循環腫瘍ＤＮＡの検出。その後のサンプル中にｃｔＤＮＡを検出した、最初にｃｔＤＮＡ陰性である患者の割合。この分析では、手術直後に検出可能なｃｔＤＮＡがなく、手術後２ヶ月を超えて収集されたサンプルを有する再発患者を含んだ（ｎ＝１５）。

【図6D】手術後の循環腫瘍ＤＮＡの検出。手術の２ヶ月以内に採取されたｃｔＤＮＡ陽性サンプル中のｃｆＤＮＡレベルと比較して、最初にｃｔＤＮＡ陰性であった患者について観察された第１のｃｔＤＮＡ陽性血漿サンプル中のｃｆＤＮＡレベル。対数変換されたｃｆＤＮＡレベルを、スチューデントのｔ検定によって比較した。

【図7A】治療終了後のＡＣＴ効果及び再発リスクの評価のためにｃｔＤＮＡを使用する。手術後２ヶ月以内にｃｔＤＮＡ陽性であり、ＡＣＴを受けた患者におけるｃｔＤＮＡについて分析された血液サンプルの概要。再発状態及び患者がＡＣＴによってｃｔＤＮＡについて除去されたかどうかに従って、患者をグループ分けした。

【図7B】治療終了後のＡＣＴ効果及び再発リスクの評価のためにｃｔＤＮＡを使用する。将来の再発のために層別化されたＡＣＴの開始前のｃｔＤＮＡレベルの比較。対数変換されたレベルを、スチューデントのｔ検定を使用して比較した。

【図7C】治療終了後のＡＣＴ効果及び再発リスクの評価のためにｃｔＤＮＡを使用する。ＡＣＴ前、ＡＣＴ中、ＡＣＴ直後、及び再発時又はフォローアップ終了時のｃｔＤＮＡレベル（エンドポイント）。

【図7D】治療終了後のＡＣＴ効果及び再発リスクの評価のためにｃｔＤＮＡを使用する。ＡＣＴの終了後３ヶ月以内に採取された血液サンプル中のｃｔＤＮＡ検出のために層別化された無再発生存率のカプラン－マイヤープロット。ｃｔＤＮＡ陽性及びｃｔＤＮＡ陰性患者における再発率を示す。

【図7E】治療終了後のＡＣＴ効果及び再発リスクの評価のためにｃｔＤＮＡを使用する。決定的な療法の終了後に連続的に収集された血漿サンプルを用いるｃｔＤＮＡ陽性再発患者におけるｃｔＤＮＡ及びＣＴ画像診断についての再発検出までの時間。リードタイム（ＬＴ）は、１）決定的な療法の終了後のｃｔＤＮＡ検出（濃い青色のドット）対放射線学的再発、及び２）任意の時間におけるｃｔＤＮＡ検出（明るい青色のドット及び濃い青色のドット）対放射線学的再発について計算した。ｃｔＤＮＡ検出までの時間と放射線学的再発までの時間との間の全体的な差（ＯＤ）を全ての患者について計算した。

【図7F】治療終了後のＡＣＴ効果及び再発リスクの評価のためにｃｔＤＮＡを使用する。ｃｔＤＮＡレベルの指数関数的な増加が、決定的な治療の終了後の再発患者について観測された。各患者についての生のｃｔＤＮＡ測定値を、固有の色で示す（左）。遅く成長するｃｔＤＮＡレベル及び速く成長するｃｔＤＮＡレベルの回帰線（右）。

【図8A】ＳｉｇｎａｔｅｒａによるｃｆＤＮＡ配列決定のための品質管理メトリック。ＮＧＳライブラリについてのＤＮＡインプット。インプットは６６ｎｇに上限した。

【図8B】ＳｉｇｎａｔｅｒａによるｃｆＤＮＡ配列決定のための品質管理メトリック。血漿サンプル中の各アンプリコンについてのリード深度（ＤｏＲ）。ＤｏＲ＜５０００を有するアンプリコンは、失敗したものとして計数し、更なる分析から除外した。

【図9A】再発患者３０２の同時腫瘍。３つの同時原発性腫瘍における重複変異のベン図（上部パネル）。共有された変異数及び固有の変異数は、各腫瘍について注釈が付けられている。各原発性腫瘍に基づいて設計された固有のアッセイの数は、下部パネルに与えられる。

【図9B】再発患者３０２の同時腫瘍。大腸における３つの同時腫瘍の図解である。表は、時間の経過とともに、特定の同時腫瘍に対応するＳｉｇｎａｔｅｒａアッセイの各プールで検出されたｃｔＤＮＡ分子の数を示す。

【図10A】ｃｔＤＮＡ及びＣＥＡの長期的モニタリング。決定的な治療の終了後に収集された連続血液サンプル中のｃｔＤＮＡ検出のために層別化された無再発生存率のカプラン－マイヤープロット。決定的な治療の終了後に採取された任意のサンプルがｃｔＤＮＡ陽性であった場合、患者をｃｔＤＮＡ陽性として分類した。ｃｔＤＮＡ陽性及びｃｔＤＮＡ陰性患者における再発率を示す。

【図10B】ｃｔＤＮＡ及びＣＥＡの長期的モニタリング。決定的な治療の終了後に収集された連続血液サンプル中のＣＥＡ上昇のために層別化された無再発生存率のカプラン－マイヤープロット。決定的な治療の終了後に採取された任意のサンプルがＣＥＡレベルの上昇を示した場合、患者をＣＥＡ陽性として分類した。ＣＥＡ陽性及びｃｔＤＮＡ陰性患者における再発率を示す。

【図10C】ｃｔＤＮＡ及びＣＥＡの長期的モニタリング。決定的な療法の終了後に連続的に収集された血漿サンプルを用いるＣＥＡ陽性再発患者におけるＣＥＡ及びＣＴ画像診断についての再発検出までの時間。リードタイム（ＬＴ）は、１）決定的な療法の終了後のＣＥＡ検出対放射線学的再発、及び２）任意の時間におけるＣＥＡ検出対放射線学的再発について計算した。ＣＥＡ検出までの時間と放射線学的再発までの時間との間の全体的な差（ＯＤ）を全ての患者について計算した。

【図11A】再発前のｃｔＤＮＡレベルの変化。連続したｃｔＤＮＡ陽性サンプル中の対数変換されたｃｔＤＮＡレベル（図７Ｆ）における線形回帰の傾きのヒストグラム。密度関数の最小によって決定される、遅く成長するｃｔＤＮＡレベルと速く成長するｃｔＤＮＡレベルとの間のカットオフ（太い黒い線）。

【図11B】再発前のｃｔＤＮＡレベルの変化。最初の２つの連続したｃｔＤＮＡ陽性サンプルにおける線形回帰。回帰は、１．６９の傾きカットオフに基づいて分類されている。

【図11C】再発前のｃｔＤＮＡレベルの変化。連続した陽性ｃｔＤＮＡ測定値を有する再発患者における３年間の全生存率のカプラン－マイヤー曲線。患者は、ｃｔＤＮＡレベルの速度（遅い及び速い）によって層別化されている。長期的分析からの再発していない患者を対照群として含めた。

【図11D】再発前のｃｔＤＮＡレベルの変化。介入又はフォローアップ終了前に２つの連続した陽性ｃｔＤＮＡサンプルを有しない再発患者の群（他の再発）を追加した、Ｃと同様のカプラン－マイヤープロット。

【発明を実施するための形態】

【0023】

Ｉ．概要
本明細書で提供される方法及び組成物は、がんの検出、診断、ステージ決定、スクリーニング、治療、及び管理を改善する。一態様において、本開示は、循環腫瘍ＤＮＡの成長速度を決定するための方法であって、（ａ）がん患者の生体サンプルから単離された核酸を配列決定して、複数のがん特異的変異を特定することと、（ｂ）手術、第一選択の化学療法、及び／又はアジュバント化学療法の後にがん患者から収集された第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第１の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第１の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、少なくとも１つの特定されたがん特異的変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、がん特異的変異を特定し、第１の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｃ）第１の液体生検サンプルの後にがん患者から長期的に収集された第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、第２の液体生検サンプルが、血液、血清、血漿又は尿のサンプルであり、定量化が、多重増幅反応を行って、第２の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、少なくとも１つの特定されたがん特異的変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、がん特異的変異を特定し、第２の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、（ｄ）第１の液体生検サンプルと第２の液体生検サンプルとの間の循環腫瘍ＤＮＡの成長速度を決定することと、を含む、方法に関する。

【0024】

いくつかの実施形態において、本方法は、患者を、速い腫瘍成長速度又は遅い腫瘍成長速度を有するものとして特定することを更に含む。いくつかの実施形態において、対数線形回帰は、再発又は介入の前の時間の関数としてのｃｔＤＮＡレベルに基づいて、各患者に適合される。ｃｔＤＮＡ成長速度は、回帰線の傾きから推定される。傾きのヒストグラムは、双峰分布に相関関係がある。分布内の２つのモード間の局所最小を特定するために、実数値関数は、最小帯域幅によるカーネル平滑化を使用して推定され、２モーダル推定を与える。局所最小は、関数に対して局所極値についての二次微分検定を適用することによって決定される。

【0025】

いくつかの実施形態において、本方法は、第２の液体生検サンプルの後にがん患者から長期的に収集された第３の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化することであって、定量化が、多重増幅反応を行って、第３の液体生検サンプルから単離された無細胞ＤＮＡからの複数の標的遺伝子座を増幅することであって、標的遺伝子座の各々が、工程（ａ）で特定された少なくとも１つのがん特異的変異に広がる、増幅すること、及び増幅された標的遺伝子座を配列決定して、がん特異的変異を特定し、第３の液体生検サンプル中の循環腫瘍ＤＮＡの量を定量化すること、を含む、定量化することと、第１の液体生検サンプルと、第２の液体生検サンプルと、第３の液体生検サンプルとの間の循環腫瘍ＤＮＡの成長速度を決定することと、を更に含む。いくつかの実施形態において、多重増幅反応は、各々が少なくとも１つのがん特異的変異に広がる、１～１００個の標的遺伝子座、又は１～２０個の標的遺伝子座、又は１～１０個の標的遺伝子座、又は１０～２０個の標的遺伝子座、又は２０～５０個の標的遺伝子座を標的とする。

【0026】

本明細書に提供される方法は、例示的な実施形態において、循環流体、特に、無細胞ＤＮＡ及び／又は循環腫瘍ＤＮＡにおいて単一ヌクレオチドバリアント変異（ＳＮＶ）を分析する。本方法は、少しでも有効であれば腫瘍サンプルを利用することが必要とされる複数の試験と比べて、単一の試験において、サブクローン変異だけではなく、腫瘍及びクローンにおいて見出される変異の多くを特定するという利点を提供する。本方法及び本組成物は、それ自体で有用であり得るか、又は本方法及び本組成物は、がんの検出、診断、ステージ決定、スクリーニング、治療、及び管理のための他の方法とともに使用される場合に有用であり得、例えば、これらの他の方法の結果を裏付け、より信頼性が高いかつ／又は決定的な結果を提供するのに役立つ。

【0027】

したがって、一実施形態において、個体、例えば、本明細書で提供されるｃｔＤＮＡ増幅／配列決定ワークフローを使用して、がん（例えば、肺がん、乳がん、膀胱がん、又は大腸がん）を有するか、又は有することが疑われる個体からのｃｔＤＮＡサンプル中に存在するがん特異的変異を決定することによって、がん中に存在するがん特異的変異（例えば、ＳＮＶ、ＭＮＶ、インデル、又は遺伝子融合）を決定するための方法が本明細書で提供される。いくつかの実施形態において、本方法は、がんの早期再発又は転移を有する患者の少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、少なくとも８５％、少なくとも９０％、少なくとも９５、少なくとも９８％、又は少なくとも９９％において、少なくとも１つのがん特異的変異を検出する。

【0028】

いくつかの実施形態において、本明細書に記載される方法は、画像診断及び／又は十分に確立されたバイオマーカーによって検出可能ながんの再発又は転移の臨床的決定の少なくとも３０日前、少なくとも６０日前、少なくとも１００日前、少なくとも１５０日前、少なくとも２００日前、少なくとも２５０日前、又は少なくとも３００日前に、がんの早期再発又は転移を有する患者において患者特異的がん関連変異を検出することができる。例示的な画像診断方法としては、Ｘ線、磁気共鳴画像診断（ＭＲＩ）、ポジトロン放出断層撮影（ＰＥＴ）、核医学スキャン、コンピュータ断層撮影（ＣＴ）画像診断、マンモグラム、又は超音波が挙げられる。がんを診断するための画像診断方法としては、顕微鏡検査及び生体サンプルの組織学的染色による検査が挙げられ得る。いくつかの実施形態において、本明細書に記載される方法は、ＣＡ１５－３レベルの上昇の少なくとも３０日前、少なくとも６０日前、少なくとも１００日前、少なくとも１５０日前、少なくとも２００日前、少なくとも２５０日前、又は少なくとも３００日前に、乳がんの早期再発又は転移を有する患者において患者特異的乳がん関連変異を検出することができる。

【0029】

いくつかの実施形態において、本明細書に記載される方法は、１個以上又は２個以上の患者特異的がん関連変異が、所定の信頼閾値（例えば、０．９５、０．９６、０．９７、０．９８又は０．９９）を超えて検出される場合、がんの早期再発又は転移の検出において少なくとも９５％、少なくとも９８％、少なくとも９９％、少なくとも９９．５％、少なくとも９９．８％、又は少なくとも９９．９％の特異性を有する。いくつかの実施形態において、本方法は、がんの早期再発又は転移を有する患者の少なくとも６０％、少なくとも６５％、少なくとも７０％、少なくとも７５％、少なくとも８０％、又は少なくとも８５％、又は少なくとも９０％、又は少なくとも９５、又は少なくとも９８％、又は少なくとも９９％において、少なくとも１つのがん特異的変異を検出する。

【0030】

ＩＩ．サンプル収集
本明細書に開示される方法は、患者における多種多様ながんをモニタリング又は検出するために使用されることが企図される。当業者は、本明細書に記載されるように、異なる種類のがんが異なる種類のサンプルの収集を必要とすることを理解するであろう。

【0031】

いくつかの実施形態において、がんは、固形腫瘍であり、生体サンプルは、腫瘍生検サンプルである。生検を行うことは、一般に、腫瘍などの疾患細胞又は組織を含むことが疑われるものからの少量の組織を除去するために鋭利なツールを使用することを伴う。針生検、ＣＴガイド下生検、超音波ガイド下生検、骨生検、骨髄生検、肝生検、腎生検、吸引生検、前立腺生検、皮膚生検、腹腔鏡生検などの外科生検などの、多くの異なる種類の生検が存在する。いくつかの実施形態において、生体サンプルは、液体生検によって得られる。いくつかの実施形態において、生体サンプルは、血液、血清、血漿、又は尿サンプルである。更に、生体液サンプルは、限定されないが、血液、血清、血漿、骨髄、尿硝子体、痰、涙、汗、唾液、精液、粘膜排泄物、粘液、脊髄液、羊水、リンパ液などが挙げられる、無細胞ＤＮＡを含有する様々な動物液から抽出されてもよい。無細胞ＤＮＡは、（妊娠中の被験体から採取された流体を介して）胎児由来であってもよく、又は被験体自体の組織に由来してもよい。

【0032】

いくつかの実施形態において、がんは、血液がんであり、生体サンプルは、液体サンプルである。いくつかの実施形態において、がんは、血液がんであり、生体サンプルは、血液、血清、血漿、又は骨髄サンプルである。いくつかの実施形態において、がん由来のＤＮＡ及び一致した正常ＤＮＡの両方は、血漿及びバフィーコートを単離及び分離することによって血液サンプルから得られる。バフィーコートから得られたＤＮＡは、血漿画分から得られた循環腫瘍ＤＮＡに一致した正常ＤＮＡとして機能し得る。

【0033】

いくつかの実施形態において、本開示の方法は、患者から複数の液体生検サンプルを長期的に収集することを更に含む。いくつかの実施形態において、液体生検サンプルは、患者ががんの治療を受けた後に患者から得られる。いくつかの実施形態において、液体生検サンプルは、血液、血清、血漿、又は尿サンプルである。

【0034】

本明細書で提供される方法は、特定の実施形態において、特に、ＤＮＡフラグメント、特に、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）において見出される腫瘍ＤＮＡフラグメントを増幅させるように適合される。このようなフラグメントは、典型的には、約１６０ヌクレオチド長である。

【0035】

無細胞核酸（ｃｆＮＡ）、例えば、ｃｆＤＮＡは、アポトーシス、壊死、オートファジー及びネクロトーシスなどの細胞死の様々な形態を介して循環中に放出され得ることが当該技術分野で既知である。ｃｆＤＮＡは、フラグメント化され、フラグメントのサイズ分布は、１５０～３５０ｂｐから１００００ｂｐを超えるものまで様々である。（Ｋａｌｎｉｎａｅｔａｌ．ＷｏｒｌｄＪＧａｓｔｒｏｅｎｔｅｒｏｌ．２０１５Ｎｏｖ７；２１（４１）：１１６３６－１１６５３を参照されたい）。例えば、肝細胞がん腫（ＨＣＣ）患者における血漿ＤＮＡフラグメントのサイズ分布は、１００～２２０ｂｐ長の範囲に広がっており、頻度数におけるピークは、約１６６ｂｐであり、フラグメント中の最も高い腫瘍ＤＮＡ濃度は、１５０～１８０ｂｐ長である（Ｊｉａｎｇｅｔａｌ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１１２：Ｅ１３１７－Ｅ１３２５を参照されたい）。

【0036】

例示的な実施形態において、細胞片及び血小板を遠心分離によって除去した後、循環腫瘍ＤＮＡ（ｃｔＤＮＡ）を、ＥＤＴＡ－２Ｎａ管を用いて血液から単離する。ＤＮＡを、例えばＱＩＡａｍｐＤＮＡＭｉｎｉＫｉｔ（Ｑｉａｇｅｎ、Ｈｉｌｄｅｎ，Ｇｅｒｍａｎｙ）を使用して抽出するまで、血漿サンプルを－８０℃で保存してもよい（例えば、Ｈａｍａｋａｗａｅｔａｌ．，ＢｒＪＣａｎｃｅｒ．２０１５；１１２：３５２－３５６）。Ｈａｍａｋａｖａらは、全サンプルの抽出された無細胞ＤＮＡの濃度の中央値が、血漿１ｍｌ当たり４３．１ｎｇ（範囲９．５～１３３８ｎｇ／ｍｌ）であり、変異体画分範囲が０．００１～７７．８％であり、中央値が０．９０％であることを報告した。

【0037】

特定の例示的な実施形態において、サンプルは、腫瘍である。本明細書の教示を考えると、腫瘍から核酸を単離する方法及びこのようなＤＮＡサンプルから核酸ライブラリを作成する方法は、当該技術分野で既知である。更に、本明細書の教示を考えると、当業者は、ｃｔＤＮＡサンプルに加えてＤＮＡが遊離状態で浮遊している他の液体サンプルなどの他のサンプルから、本明細書の方法に適した核酸ライブラリをどのように作成するかを認識するだろう。

【0038】

ＩＩＩ．がん特異的変異の特定
サンプルを収集した後、標的化配列決定又は全エクソーム配列決定（ＷＥＳ）を、分析されるがんの種類に従って、固形腫瘍又は液体生検サンプルから得られた循環腫瘍ＤＮＡ、無細胞ＤＮＡ又は細胞ＤＮＡ、及び上記のように一致した正常組織又は細胞で行ってもよい。腫瘍細胞又はがん細胞からの配列を、正常組織又は細胞からの配列と比較することにより、がん特異的変異の特定が可能になる。患者のために個別化されたがん特異的変異の特定に続いて、患者におけるがんは、個別化されたがん特異的変異を使用することによって検出又はモニタリングされてもよい。がん治療の前、間、及び後の個別化されたがん特異的変異の検出は、がんの再発（ｒｅｌａｐｓｅ）、再発（ｒｅｃｕｒｒｅｎｃｅ）、又は転移の指標であり得る。

【0039】

いくつかの実施形態において、がん特異的変異は、１つ以上の体細胞変異を含む。体細胞変異は、例えば、患者の非がん細胞から単離された核酸を配列決定して、１つ以上の非がん特異的生殖細胞変異を特定することによって生殖細胞変異と区別することができ、核酸は、がん関連ゲノム遺伝子座のパネルで濃縮されている。いくつかの実施形態において、非がん細胞は、患者の血液サンプル中のバフィーコートから得られる。生殖細胞変異は、まず、バフィーコートから得られた非がんＤＮＡ上で、第１の患者特異的アッセイのために選択された多数の標的を実行し、次いで、第２の患者特異的アッセイのためにがん特異的バリアントを選択することによって、フィルタリングすることができる。

【0040】

いくつかの実施形態において、本開示の方法は、１つ以上の非がん特異的生殖細胞変異を特定するために、２つの長期的に収集される液体生検サンプルから調製される増幅されたＤＮＡの配列を比較することを更に含む。生殖細胞変異は、連続した生体サンプル中で約５０％のバリアント対立遺伝子頻度（ＶＡＦ）を有する。ｃｔＤＮＡのレベルが非常に高い、いくつかの実施形態において、バリアントの領域のコピー数は、生殖細胞変異を決定し、それらをフィルタリングするために考慮されなければならない場合がある。

【0041】

いくつかの実施形態において、生殖細胞変異は、血漿サンプルからの無細胞ＤＮＡを長いＤＮＡ画分及び短いＤＮＡ画分に分離することによって決定されてもよく、特注の（個別化された又は患者特異的）アッセイを用いて両方の画分を分析してもよい。腫瘍特異的バリアントは、より短いＤＮＡ画分を有するサンプルにおいてより高いバリアント対立遺伝子頻度を有することが予想される。あるいは、いくつかの実施形態において、より短いフラグメントは、濃縮されてもよく、生殖細胞変異は、濃縮されたサンプル中の変異についてのバリアント対立遺伝子頻度を元のサンプルと比較することによって特定されてもよい。

【0042】

いくつかの実施形態において、本開示の方法は、１つ以上の非がん特異的生殖細胞変異を特定するために、生体サンプルから単離された核酸の配列を生殖細胞変異データベースと比較することを更に含む。

【0043】

患者のがん特異的変異を特定すると、多重ＰＣＲを行って、患者の液体生検サンプルから単離された無細胞ＤＮＡから複数の標的遺伝子座を増幅し、増幅されたＤＮＡを得る。いくつかの実施形態において、多重増幅は、各々が少なくとも１つのがん特異的変異に広がる、１～１００個の標的遺伝子座、又は１～２０個の標的遺伝子座、又は１～１０個の標的遺伝子座、又は１０～２０個の標的遺伝子座、又は２０～５０個の標的遺伝子座を標的とする。いくつかの実施形態において、多重増幅は、少なくとも１つのがん特異的変異に広がる、１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、又は２０の標的遺伝子座を標的とする。

【0044】

一態様において、がん特異的変異は、液体サンプル又は固形腫瘍サンプルから得られたＤＮＡ上で全エクソーム配列決定（ＷＥＳ）を行い、正常組織の全エクソーム配列決定と比較することによって特定される。いくつかの実施形態において、全エクソーム配列決定は、固形腫瘍及び一致した正常組織から得られた細胞ＤＮＡ上で行われる。いくつかの実施形態において、全エクソーム配列決定は、血液又は血漿などの液体生検サンプルからの無細胞ＤＮＡ上で行われる。いくつかの実施形態において、ＷＥＳは、がん特異的血液がん変異を特定するために、血液がんに罹患している患者からの血液サンプルから得られた無細胞ＤＮＡ又は細胞ＤＮＡ上で行われる。血液がん又は固形腫瘍から得られたＤＮＡの配列決定データを、正常な一致した組織から得られたＤＮＡと比較することによって、がん特異的変異を特定し、患者のがんの臨床進行中にがんをモニタリング又は検出するために使用することができる。

【0045】

本明細書で使用される「全エクソーム配列決定」は、エクソームとしても知られるゲノム内の遺伝子の全てのタンパク質コード領域の配列決定を指す。したがって、全エクソーム配列決定は、配列決定前にエクソームとして知られるＤＮＡコードタンパク質の部分集合を単離する工程を最初に伴い得る。この最初の工程は、単離されたエクソンへの捕捉技術、すなわち、本明細書の別の箇所に記載されるアレイベースの捕捉又は溶液中捕捉によって行われてもよい。

【0046】

別の態様において、がん特異的変異は、患者から得られた生体サンプルに由来する核酸の標的化配列決定によって特定される。生体サンプルは、上記のように、固形腫瘍生検によって、又は液体生検によって得られてもよい。がん性核酸は、固形腫瘍から得られた細胞ＤＮＡ、上記のように任意の液体サンプルから得られた無細胞ＤＮＡ若しくは循環ＤＮＡであってもよく、又はがん性ＤＮＡは、血液がんに罹患している患者の血液サンプルから得られた無細胞ＤＮＡ若しくは細胞ＤＮＡであってもよい。正常な一致したＤＮＡは、患者からの非がん性細胞又は組織から得られた細胞ＤＮＡであってもよい。

【0047】

本開示のいくつかの実施形態において、標的化配列決定は、がん関連遺伝子又はゲノム遺伝子座のパネルにおいて患者から得られた核酸を濃縮して、患者特異的腫瘍又はがん細胞変異の特定に必要な標的遺伝子座又は核酸塩基の数を減らすことによって行われる。いくつかの実施形態において、標的化配列決定は、がん関連遺伝子のパネル（例えば、ＦｏｕｎｄａｔｉｏｎＭｅｄｉｃｉｎｅからのＦｏｕｎｄａｔｉｏｎＯｎｅ（商標）パネル）において患者の固形腫瘍生検サンプルから得られた核酸（例えば、細胞ＤＮＡ）を濃縮することを含む。いくつかの実施形態において、標的化配列決定は、がん関連遺伝子のパネル（例えば、ＧｕａｒｄａｎｔＨｅａｌｔｈからのＧｕａｒｄａｎｔ３６０（商標）パネル）において患者の血液、血漿、血清又は尿のサンプルから得られた核酸（例えば、ｃｆＤＮＡ）を濃縮することによって行われる。

【0048】

いくつかの実施形態において、パネルは、２，０００以下のがん関連遺伝子若しくはゲノム遺伝子座、又は１，０００以下のがん関連遺伝子若しくはゲノム遺伝子座、又は５００以下のがん関連遺伝子若しくはゲノム遺伝子座、又は１００～１，０００のがん関連遺伝子若しくはゲノム遺伝子座、又は２００～５００のがん関連遺伝子若しくはゲノム遺伝子座を含む。いくつかの実施形態において、パネルは、約１００～約３００のがん関連遺伝子又はゲノム遺伝子座、約３００～約４５０のがん関連遺伝子又はゲノム遺伝子座、約２００～約３５０のがん関連遺伝子又はゲノム遺伝子座、約５００～約１０００のがん関連遺伝子又はゲノム遺伝子座、約１０００～約１５００のがん関連遺伝子又はゲノム遺伝子座、約１５００～約２０００のがん関連遺伝子又はゲノム遺伝子座、約１６５０～約２０００のがん関連遺伝子又はゲノム遺伝子座を含む。いくつかの実施形態において、パネルは、約１００、１５０、２００、２５０、３００、３５０、４００、４５０、５００、７５０、１０００、１５００、１８５０、又は２０００からのがん関連遺伝子又はゲノム遺伝子座を含む。

【0049】

いくつかの実施形態において、患者から得られた第１の生体サンプルから単離された核酸の配列決定は、ＤＮＡ配列の５，０００，０００塩基以下、又はＤＮＡ配列の４，０００，０００塩基以下、又はＤＮＡ配列の３，０００，０００塩基以下、又はＤＮＡ配列の２，０００，０００塩基以下、又はＤＮＡ配列の５００，０００～２，０００，０００塩基、又はＤＮＡ配列の１，０００，０００～１，５００，０００塩基を生成する。本明細書で使用される場合、「がん関連ゲノム遺伝子座」という用語は、患者におけるがんをモニタリング又は検出するのに有用であると決定された任意のゲノム遺伝子座を指す。がん関連ゲノム遺伝子座は、（ｉ）がんの転移の可能性、特定の臓器への転移の可能性、再発のリスク、及び／又は腫瘍の経過、（ｉｉ）腫瘍ステージ、（ｉｉｉ）がんの治療が存在しない患者の予後、（ｉｖ）治療（例えば、化学療法、放射線療法、腫瘍を切除する手術など）に対する患者応答（例えば、腫瘍縮小又は無増悪生存率）の予後、（ｖ）現在及び／又は過去の治療に対する実際の患者応答の診断、（ｖｉ）患者のための好ましい治療の経過の決定、（ｖｉｉ）治療（一般的な治療又はいくつかの特定の治療のいずれか）後の患者再発についての予後、（ｖｉｉｉ）患者の平均余命の予後（例えば、全生存率についての予後）などに関連し得る。

【0050】

したがって、いくつかの実施形態において、がん関連ゲノム遺伝子座は、急速に増殖する（したがって、より攻撃的な）がん細胞を伴う。患者におけるこのようながんは、しばしば、患者が治療後に再発する可能性が増加することを意味する（例えば、治療によって死滅又は除去されないがん細胞が、迅速に成長する）。このようながんはまた、患者が、より急速な進行のためにがんの進行の可能性が増加することを意味し得る（例えば、急速に増殖する細胞が、任意の腫瘍を急速に成長させ、毒性を増大させ、及び／又は転移させる）。このようながんはまた、患者が比較的により積極的な治療を必要とし得ることを意味し得る。したがって、いくつかの実施形態において、本発明は、少なくとも２つ以上のがん関連ゲノム遺伝子座を含む遺伝子パネルの状態を決定することを含む、がんを分類する方法を提供し、異常な状態は、再発又は進行の可能性の増加を示す。

【0051】

いくつかの実施形態において、がん関連ゲノム遺伝子座のパネルは、エクソン、イントロン、遺伝子調節領域、非コードＲＮＡ、再配列遺伝子を含む。いくつかの実施形態において、がん特異的変異は、１つ以上の単一ヌクレオチドバリアント（ＳＮＶ）、１つ以上のマルチヌクレオチドバリアント（ＭＮＶ）、１つ以上のコピー数バリアント（ＣＮＶ）、１つ以上のインデル、１つ以上の遺伝子融合、１つ以上の構造バリアント、又はこれらの組み合わせを含む。

【0052】

いくつかの実施形態において、がん関連ゲノム遺伝子座のパネルは、単一ヌクレオチドの変化から１キロ塩基（ｋｂ）を超えるゲノム領域の変化までの任意のサイズの任意のゲノム変化を含む。「インデル」という用語は、ゲノム内の核酸の挿入及び欠失の両方を指す。本明細書で使用される場合、「構造バリアント」という用語は、１キロ塩基（ｋｂ）を超えるＤＮＡセグメントを伴う欠失又は挿入などのゲノム変化を指し、顕微鏡的又は超顕微鏡的のいずれかであり得る。「遺伝子融合」という用語は、ゲノム内のＤＮＡの挿入及び／又は欠失によって引き起こされる２つの異なるゲノム遺伝子座の融合をもたらす任意のゲノム変化を指す。遺伝子融合によって引き起こされる得られるゲノム変化は、任意のサイズのＤＮＡセグメントを伴い得る。

【0053】

非コードＲＮＡ（ｎｃＲＮＡ）は、ＤＮＡから転写されるがタンパク質に翻訳されない機能的ＲＮＡ分子である。エピジェネティックに関連するｎｃＲＮＡとしては、ｍｉＲＮＡ、ｓｉＲＮＡ、ｐｉＲＮＡ、及びｌｎｃＲＮＡが挙げられる。一般に、ｎｃＲＮＡは、転写レベル及び転写後レベルで遺伝子発現を調節するように機能する。エピジェネティックなプロセスに関与しているように見えるそれらのｎｃＲＮＡは、２つの主要な群、短いｎｃＲＮＡ（＜３０ｎｔ）及び長いｎｃＲＮＡ（＞２００ｎｔ）に分割され得る。短い非コードＲＮＡの３つの主要なクラスは、マイクロＲＮＡ（ｍｉＲＮＡ）、短い干渉ＲＮＡ（ｓｉＲＮＡ）、及びｐｉｗｉ相互作用ＲＮＡ（ｐｉＲＮＡ）である。両方の主要なグループは、ヘテロクロマチン形成、ヒストン修飾、ＤＮＡメチル化標的化、及び遺伝子サイレンシングにおいて役割を果たすことが示されている。

【0054】

いくつかの実施形態において、がん関連ゲノム遺伝子座のパネルは、周知のがん遺伝子（ｃａｎｃｅｒｇｅｎｅｓ）、がん遺伝子（ｏｎｃｏｇｅｎｅ）、又はがん細胞若しくは腫瘍組織において変化したと報告される任意の遺伝子のリスト又はセットを含む。がん関連遺伝子は、がん（例えば、乳がん、膀胱がん、又は大腸がん）についてのリスクの変化又はがんについての予後の変化に関連する遺伝子を指す。がんを促進する例示的ながん関連遺伝子としては、がん遺伝子、細胞増殖、浸潤又は転移を促進する遺伝子、アポトーシスを阻害する遺伝子、及び血管新生促進遺伝子が挙げられる。がんを阻害するがん関連遺伝子としては、限定されないが、腫瘍抑制遺伝子、細胞増殖、浸潤又は転移を阻害する遺伝子、アポトーシスを促進する遺伝子、及び抗血管新生遺伝子が挙げられる。

【0055】

いくつかの実施形態において、パネルのがん関連ゲノム遺伝子座は、ＡＫＴ１（１４ｑ３２．３３、ＡＬＫ（２ｐ２３．２－２３．１）、ＡＰＣ（５ｑ２２．２）、ＡＲ（Ｘｑ１２）、ＡＲＡＦ（Ｘｐ１１．３）、ＡＲＩＤ１Ａ（１ｐ３６．１１）、ＡＴＭ（１１ｑ２２．３）、ＢＲＡＦ（７ｑ３４）、ＢＲＣＡ１（１７ｑ２１．３１）、ＢＲＣＡ２（１３ｑ１３．１）、ＣＣＮＤ１（１１ｑ１３．３）、ＣＣＮＤ２（１２ｐ１３．３２）、ＣＣＮＥ１（１９ｑ１２）、ＣＤＨ１（１６ｑ２２．１）、ＣＤＫ４（１２ｑ１４．１）、ＣＤＫ６（７ｑ２１．２）、ＣＤＫＮ２Ａ（９ｐ２１．３）、ＣＴＮＮＢ１（３ｐ２２．１）、ＤＤＲ２（１ｑ２３．３）、ＥＧＦＲ（７ｐ１１．２）、ＥＲＢＢ２（１７ｑ１２）、ＥＳＲ１（６ｑ２５．１－２５．２）、ＥＺＨ２（７ｑ３６．１）、ＦＢＸＷ７（４ｑ３１．３）、ＦＧＦＲ１（８ｐ１１．２３）、ＦＧＦＲ２（１０ｑ２６．１３）、ＦＧＦＲ３（４ｐ１６．３）、ＧＡＴＡ３（１０ｐ１４）、ＧＮＡ１１（１９ｐ１３．３）、ＧＮＡＱ（９ｑ２１．２）、ＧＮＡＳ（２０ｑ１３．３２）、ＨＮＦ１Ａ（１２ｑ２４．３１）、ＨＲＡＳ（１１ｐ１５．５）、ＩＤＨ１（２ｑ３４）、ＩＤＨ２（１５ｑ２６．１）、ＪＡＫ２（９ｐ２４．１）、ＪＡＫ３（１９ｐ１３．１１）、ＫＩＴ（４ｑ１２）、ＫＲＡＳ（１２ｐ１２．１）、ＭＡＰ２Ｋ１（１５ｑ２２．３１）、ＭＡＰ２Ｋ２（１９ｐ１３．３）、ＭＡＰＫ１（２２ｑ１１．２２）、ＭＡＰＫ３（１６ｐ１１．２）、ＭＥＴ（７ｑ３１．２）、ＭＬＨ１（３ｐ２２．２）、ＭＰＬ（１ｐ３４．２）、ＭＴＯＲ（１ｐ３６．２２）、ＭＹＣ（８ｑ２４．２１）、ＮＦ１（１７ｑ１１．２）、ＮＦＥ２Ｌ２（２ｑ３１．２）、ＮＯＴＣＨ１（９ｑ３４．３）、ＮＰＭ１（５ｑ３５．１）、ＮＲＡＳ（１ｐ１３．２）、ＮＴＲＫ１（１ｑ２３．１）、ＮＴＲＫ３（１５ｑ２５．３）、ＰＤＧＦＲＡ（４ｑ１２）、ＰＩＫ３ＣＡ（３ｑ２６．３２）、ＰＴＥＮ（１０ｑ２３．３１）、ＰＴＰＮ１１（１２ｑ２４．１３）、ＲＡＦ１（３ｐ２５．２）、ＲＢ１（１３ｑ１４．２）、ＲＥＴ（１０ｑ１１．２１）、ＲＨＥＢ（７ｑ３６．１）、ＲＨＯＡ（３ｐ２１．３１）、ＲＩＴ１（１ｑ２２）、ＲＯＳ１（６ｑ２２．１）、ＳＭＡＤ４（１８ｑ２１．２）、ＳＭＯ（７ｑ３２．１）、ＳＴＫ１１（１９ｐ１３．３）、ＴＥＲＴ（５ｐ１５．３３）、ＴＰ５３（１７ｐ１３．１）、ＴＳＣ１（９ｑ３４．１３）、及び／又はＶＨＬ（３ｐ２５．３）を含む。変異検出方法の実施形態は、標的となる遺伝子の領域を選択することから始まる。既知の変異を有する領域を使用して、変異を増幅させ、検出するためのｍＰＣＲ－ＮＧＳのためのプライマーを開発する。

【0056】

本明細書で提供される方法を使用して、実質的に任意の種類の変異、特に、がんに関連することが知られている変異を検出することができ、最も特定的には、本明細書で提供される方法は、変異、特に、がんに関連する単一ヌクレオチドバリアント（ＳＮＶ）、コピー数多型（ＣＮＶ）、インデル、若しくは遺伝子融合、又は再配列を対象とする。例示的なＳＮＶは、以下の遺伝子のうちの１つ以上であってもよい。ＥＧＦＲ、ＦＧＦＲ１、ＦＧＦＲ２、ＡＬＫ、ＭＥＴ、ＲＯＳ１、ＮＴＲＫ１、ＲＥＴ、ＨＥＲ２、ＤＤＲ２、ＰＤＧＦＲＡ、ＫＲＡＳ、ＮＦ１、ＢＲＡＦ、ＰＩＫ３ＣＡ、ＭＥＫ１、ＮＯＴＣＨ１、ＭＬＬ２、ＥＺＨ２、ＴＥＴ２、ＤＮＭＴ３Ａ、ＳＯＸ２、ＭＹＣ、ＫＥＡＰ１、ＣＤＫＮ２Ａ、ＮＲＧ１、ＴＰ５３、ＬＫＢ１及びＰＴＥＮ、これらは、様々な肺がんサンプルにおいて、変異しているか、又はコピー数が増加しているか、又は他の遺伝子に融合しているか、及びこれらの組み合わせであることが特定されている（Ｎｏｎ－ｓｍａｌｌ－ｃｅｌｌｌｕｎｇｃａｎｃｅｒｓ：ａｈｅｔｅｒｏｇｅｎｅｏｕｓｓｅｔｏｆｄｉｓｅａｓｅｓ．Ｃｈｅｎｅｔａｌ．Ｎａｔ．Ｒｅｖ．Ｃａｎｃｅｒ．２０１４Ａｕｇ１４（８）：５３５－５５１）。別の例では、遺伝子のリストは、上に列挙されたものであり、ＳＮＶは、例えば、Ｃｈｅｎらの参考文献で報告されている。

【0057】

潜在的ながん関連ゲノム遺伝子座の例示的な実施形態は、（例えば、ＳＮＶ、ＣＮＶ、及びインデルの検出において）以下の遺伝子のエキソニック領域を含む：ＡＢＬ１ＡＣＶＲ１ＢＡＫＴ１ＡＫＴ２ＡＫＴ３ＡＬＫＡＬＯＸ１２ＢＡＭＥＲ１（ＦＡＭ１２３Ｂ）ＡＰＣＡＲＡＲＡＦＡＲＦＲＰ１ＡＲＩＤ１ＡＡＳＸＬ１ＡＴＭＡＴＲＡＴＲＸＡＵＲＫＡＡＵＲＫＢＡＸＩＮ１ＡＸＬＢＡＰ１ＢＡＲＤ１ＢＣＬ２ＢＣＬ２Ｌ１ＢＣＬ２Ｌ２ＢＣＬ６ＢＣＯＲＢＣＯＲＬ１ＢＲＡＦＢＲＣＡ１ＢＲＣＡ２ＢＲＤ４ＢＲＩＰ１ＢＴＧ１ＢＴＧ２ＢＴＫＣ１１ｏｒｆ３０（ＥＭＳＹ）ＣＡＬＲＣＡＲＤ１１ＣＡＳＰ８ＣＢＦＢＣＢＬＣＣＮＤ１ＣＣＮＤ２ＣＣＮＤ３ＣＣＮＥ１ＣＤ２２ＣＤ２７４（ＰＤ－Ｌ１）ＣＤ７０ＣＤ７９ＡＣＤ７９ＢＣＤＣ７３ＣＤＨ１ＣＤＫ１２ＣＤＫ４ＣＤＫ６ＣＤＫ８ＣＤＫＮ１ＡＣＤＫＮ１ＢＣＤＫＮ２ＡＣＤＫＮ２ＢＣＤＫＮ２ＣＣＥＢＰＡＣＨＥＫ１ＣＨＥＫ２ＣＩＣＣＲＥＢＢＰＣＲＫＬＣＳＦ１ＲＣＳＦ３ＲＣＴＣＦＣＴＮＮＡ１ＣＴＮＮＢ１ＣＵＬ３ＣＵＬ４ＡＣＸＣＲ４ＣＹＰ１７Ａ１ＤＡＸＸＤＤＲ１ＤＤＲ２ＤＩＳ３ＤＮＭＴ３ＡＤＯＴ１ＬＥＥＤＥＧＦＲＥＰ３００ＥＰＨＡ３ＥＰＨＢ１ＥＰＨＢ４ＥＲＢＢ２ＥＲＢＢ３ＥＲＢＢ４ＥＲＣＣ４ＥＲＧＥＲＲＦＩ１ＥＳＲ１ＥＺＨ２ＦＡＭ４６ＣＦＡＮＣＡＦＡＮＣＣＦＡＮＣＧＦＡＮＣＬＦＡＳＦＢＸＷ７ＦＧＦ１０ＦＧＦ１２ＦＧＦ１４ＦＧＦ１９ＦＧＦ２３ＦＧＦ３ＦＧＦ４ＦＧＦ６ＦＧＦＲ１ＦＧＦＲ２ＦＧＦＲ３ＦＧＦＲ４ＦＨＦＬＣＮＦＬＴ１ＦＬＴ３ＦＯＸＬ２ＦＵＢＰ１ＧＡＢＲＡ６ＧＡＴＡ３ＧＡＴＡ４ＧＡＴＡ６ＧＩＤ４（Ｃ１７ｏｒｆ３９）ＧＮＡ１１ＧＮＡ１３ＧＮＡＱＧＮＡＳＧＲＭ３ＧＳＫ３ＢＨ３Ｆ３ＡＨＤＡＣ１ＨＧＦＨＮＦ１ＡＨＲＡＳＨＳＤ３Ｂ１ＩＤ３ＩＤＨ１ＩＤＨ２ＩＧＦ１ＲＩＫＢＫＥＩＫＺＦ１ＩＮＰＰ４ＢＩＲＦ２ＩＲＦ４ＩＲＳ２ＪＡＫ１ＪＡＫ２ＪＡＫ３ＪＵＮＫＤＭ５ＡＫＤＭ５ＣＫＤＭ６ＡＫＤＲＫＥＡＰ１ＫＥＬＫＩＴＫＬＨＬ６ＫＭＴ２Ａ（ＭＬＬ）ＫＭＴ２Ｄ（ＭＬＬ２）ＫＲＡＳＬＴＫＬＹＮＭＡＦＭＡＰ２Ｋ１（ＭＥＫ１）ＭＡＰ２Ｋ２（ＭＥＫ２）ＭＡＰ２Ｋ４ＭＡＰ３Ｋ１ＭＡＰ３Ｋ１３ＭＡＰＫ１ＭＣＬ１ＭＤＭ２ＭＤＭ４ＭＥＤ１２ＭＥＦ２ＢＭＥＮ１ＭＥＲＴＫＭＥＴＭＩＴＦＭＫＮＫ１ＭＬＨ１ＭＰＬＭＲＥ１１ＡＭＳＨ２ＭＳＨ３ＭＳＨ６ＭＳＴ１ＲＭＴＡＰＭＴＯＲＭＵＴＹＨＭＹＣＭＹＣＬ（ＭＹＣＬ１）ＭＹＣＮＭＹＤ８８ＮＢＮＮＦ１ＮＦ２ＮＦＥ２Ｌ２ＮＦＫＢＩＡＮＫＸ２－１ＮＯＴＣＨ１ＮＯＴＣＨ２ＮＯＴＣＨ３ＮＰＭ１ＮＲＡＳＮＴ５Ｃ２ＮＴＲＫ１ＮＴＲＫ２ＮＴＲＫ３Ｐ２ＲＹ８ＰＡＬＢ２ＰＡＲＫ２ＰＡＲＰ１ＰＡＲＰ２ＰＡＲＰ３ＰＡＸ５ＰＢＲＭ１ＰＤＣＤ１（ＰＤ－１）ＰＤＣＤ１ＬＧ２（ＰＤ－Ｌ２）ＰＤＧＦＲＡＰＤＧＦＲＢＰＤＫ１ＰＩＫ３Ｃ２ＢＰＩＫ３Ｃ２ＧＰＩＫ３ＣＡＰＩＫ３ＣＢＰＩＫ３Ｒ１ＰＩＭ１ＰＭＳ２ＰＯＬＤ１ＰＯＬＥＰＰＡＲＧＰＰＰ２Ｒ１ＡＰＰＰ２Ｒ２ＡＰＲＤＭ１ＰＲＫＡＲ１ＡＰＲＫＣＩＰＴＣＨ１ＰＴＥＮＰＴＰＮ１１ＰＴＰＲＯＱＫＩＲＡＣ１ＲＡＤ２１ＲＡＤ５１ＲＡＤ５１ＢＲＡＤ５１ＣＲＡＤ５１ＤＲＡＤ５２ＲＡＤ５４ＬＲＡＦ１ＲＡＲＡＲＢ１ＲＢＭ１０ＲＥＬＲＥＴＲＩＣＴＯＲＲＮＦ４３ＲＯＳ１ＲＰＴＯＲＳＤＨＡＳＤＨＢＳＤＨＣＳＤＨＤＳＥＴＤ２ＳＦ３Ｂ１ＳＧＫ１ＳＭＡＤ２ＳＭＡＤ４ＳＭＡＲＣＡ４ＳＭＡＲＣＢ１ＳＭＯＳＮＣＡＩＰＳＯＣＳ１ＳＯＸ２ＳＯＸ９ＳＰＥＮＳＰＯＰＳＲＣＳＴＡＧ２ＳＴＡＴ３ＳＴＫ１１ＳＵＦＵＳＹＫＴＢＸ３ＴＥＫＴＥＴ２ＴＧＦＢＲ２ＴＩＰＡＲＰＴＮＦＡＩＰ３ＴＮＦＲＳＦ１４ＴＰ５３ＴＳＣ１ＴＳＣ２ＴＹＲＯ３Ｕ２ＡＦ１ＶＥＧＦＡＶＨＬＷＨＳＣ１（ＭＭＳＥＴ）ＷＨＳＣ１Ｌ１ＷＴ１ＸＰＯ１ＸＲＣＣ２ＺＮＦ２１７ＺＮＦ７０３。また、潜在的ながん関連ゲノム遺伝子座の例示的な実施形態は、（例えば、遺伝子融合又は再配列の検出において）以下の遺伝子のイントロニック領域、プロモーター領域、及び非コードＲＮＡ配列を含む：ＡＬＫＢＣＬ２ＢＣＲＢＲＡＦＢＲＣＡ１ＢＲＣＡ２ＣＤ７４ＥＧＦＲＥＴＶ４ＥＴＶ５ＥＴＶ６ＥＷＳＲ１ＥＺＲＦＧＦＲ１ＦＧＦＲ２ＦＧＦＲ３ＫＩＴＫＭＴ２Ａ（ＭＬＬ）ＭＳＨ２ＭＹＢＭＹＣＮＯＴＣＨ２ＮＴＲＫ１ＮＴＲＫ２ＮＵＴＭ１ＰＤＧＦＲＡＲＡＦ１ＲＡＲＡＲＥＴＲＯＳ１ＲＳＰＯ２ＳＤＣ４ＳＬＣ３４Ａ２ＴＥＲＣＴＥＲＴＴＭＰＲＳＳ２。

【0058】

ＩＶ．がん関連遺伝子のパネルでの核酸についての濃縮、又は全エクソーム配列決定のためのエキソニックゲノムＤＮＡの単離の方法
標的濃縮方法は、ハイブリッド捕捉又は標的化ＰＣＲなどの濃縮方法によって、配列決定する前にＤＮＡサンプルから目的のゲノム領域を選択的に捕捉することを可能にする。目的のゲノム領域は、上に記載したがん関連ゲノム遺伝子座などのゲノム遺伝子座の任意の部分集合であってもよく、又は全エクソーム配列決定（ＷＥＳ）のためのサンプルを調製するためのゲノムの全てのエキソニック領域であってもよい。

【0059】

一般に、ハイブリッド捕捉は、目的のゲノムＤＮＡ配列への相補性によって結合することができるオリゴヌクレオチド配列を設計することを伴う。オリゴヌクレオチドは、オリゴヌクレオチドに結合したゲノム配列を非結合ゲノム配列から分離することを可能にする、固体表面又はビーズに結合する。非結合ゲノムＤＮＡ配列は、次いで、洗い流してもよく、目的のゲノム配列は、更なる処理及び／又は増幅のために固体表面又はビーズに結合したままである。いくつかの実施形態において、がん関連ゲノム遺伝子座のパネルは、アレイベースのハイブリッド捕捉法又は溶液内ハイブリッド捕捉法などのハイブリッド捕捉によって濃縮される。

【0060】

いくつかの実施形態において、標的濃縮は、アレイベースのハイブリッド捕捉法であってもよい。いくつかの実施形態において、アレイベースのハイブリッド捕捉法は、ヒトゲノムからの一本鎖オリゴヌクレオチド配列を固定して、マイクロアレイチップの表面又は表面に固定された目的の領域をタイル化することによって、マイクロアレイを設計することを伴い得る。ゲノムＤＮＡは、二本鎖フラグメントを形成するために剪断される。フラグメントは、平滑末端を生成するために末端修復を受け、ユニバーサルプライミング配列を有するアダプターが付加される。これらのフラグメントは、マイクロアレイチップ又は表面上のオリゴにハイブリダイズされる。ハイブリダイズされていないフラグメントは洗い流して、所望のフラグメントを溶出する。フラグメントは、次いで、ポリメラーゼ連鎖反応を使用して増幅される。アレイベースのハイブリッド捕捉に使用されるマイクロアレイは、ＲｏｃｈｅＮｉｍｂｌｅｇｅｎ（商標）アレイ、又はＡｇｉｌｅｎｔ（商標）捕捉アレイ、又は標的配列のハイブリッド捕捉に使用することができる同様の比較ゲノムハイブリダイゼーションアレイであり得る。いくつかの実施形態において、がん関連ゲノム遺伝子座のパネルは、ハイブリッド捕捉によって濃縮される。他の実施形態において、標的濃縮戦略は、溶液中捕捉戦略であってもよい。溶液中捕捉を使用して目的のゲノム領域を捕捉するために、カスタムオリゴヌクレオチド（プローブ）のプールを合成し、フラグメント化されたゲノムＤＮＡサンプルに溶液中でハイブリダイズする。プローブ（ビーズで標識された）を、目的のゲノム領域に選択的にハイブリダイズし、その後、ビーズ（ここでは目的のＤＮＡフラグメントを含む）をプルダウンし、洗浄して、過剰な物質を除去することができる。次いで、ビーズを除去し、ゲノムフラグメントを配列決定して、目的のゲノム領域（例えば、エクソン、イントロン、プロモーター領域若しくは他の遺伝子調節領域、又は非コードＲＮＡ配列）の選択的ＤＮＡ配列決定を可能にすることができる。

【0061】

ハイブリッド捕捉とは対照的に、溶液中捕捉は、必要とされるテンプレートの量を上回る、目的の領域を標的とする過剰なプローブが存在する。最適な標的サイズは約３．５メガ塩基であり、標的領域の優れた配列カバレッジをもたらす。好ましい方法は、目的の領域における塩基対の数、標的におけるリードについての需要、社内の機器などを含むいくつかの要因に依存する。

【0062】

あるいは、がん関連ゲノム遺伝子座は、標的化された増幅によって濃縮することができる。ゲノム遺伝子座の標的化された増幅は、特異的領域を標的とするように設計されたプライマーを用いて行われるマルチプレックスＰＣＲによって達成されてもよい。複数の所望の標的のマルチプレックスＰＣＲを行うためのプロトコルは、本明細書の他の場所に詳細に記載される。

【0063】

Ｖ．がん
「がん」及び「がん性」という用語は、典型的には制御されない細胞増殖を特徴とする、動物における生理学的状態を指すか、又はこれを説明する。「腫瘍」は、１つ以上のがん性細胞を含む。いくつかの主要な種類のがんが存在する。がん腫は、皮膚内、又は内臓の輪郭を形成するか、又は内臓を覆う組織内で始まるがんである。肉腫は、骨、軟骨、脂肪、筋肉、血管、又は他の結合組織若しくは支持組織から始まるがんである。白血病は、骨髄などの血液形成組織内で始まり、大量の異常な血球が産生され、血液に入り込むがんである。リンパ腫及び多発性骨髄腫は、免疫系の細胞内で始まるがんである。中枢神経系のがんは、脳及び脊髄の組織内で始まるがんである。

【0064】

【0065】

いくつかの実施形態において、がんは、肺がん、乳がん、膀胱がん又は大腸がんである。

【0066】

いくつかの実施形態において、がんは、急性リンパ芽球性白血病、急性骨髄性白血病、副腎皮質がん腫、ＡＩＤＳ関連がん、ＡＩＤＳ関連リンパ腫、肛門がん、虫垂がん、星細胞腫、非定型奇形腫様／ラブドイド腫瘍、基底細胞がん腫、膀胱がん、脳幹グリオーマ、脳腫瘍（脳幹グリオーマ、中枢神経系非定型奇形腫様／ラブドイド腫瘍、中枢神経系胚芽腫、星細胞腫、頭蓋咽頭腫、上衣芽腫、上衣腫、髄芽腫、髄上皮腫、中間型松果体実質腫瘍、テント上原始神経外胚葉性腫瘍、及び松果体芽腫を含む）、乳がん、気管支腫瘍、バーキットリンパ腫、原発部位不明がん、カルチノイド腫瘍、原発部位不明がん腫、中枢神経系非定型奇形腫様／ラブドイド腫瘍、中枢神経系胚芽腫、子宮頸がん、小児がん、脊索腫、慢性リンパ球性白血病、慢性骨髄性白血病、慢性骨髄増殖性疾患、結腸がん、大腸がん、頭蓋咽頭腫、皮膚Ｔ細胞リンパ腫、内分泌膵島細胞腫瘍、子宮内膜がん、上衣芽腫、上衣腫、食道がん、鼻腔神経芽細胞腫、ユーイング肉腫、頭蓋外胚細胞腫瘍、性腺外胚細胞腫瘍、肝外胆管がん、胆嚢がん、胃（胃）がん、消化管カルチノイド腫瘍、消化管間質細胞腫瘍、消化管間質腫瘍（ＧＩＳＴ）、妊娠性絨毛性腫瘍、グリオーマ、有毛細胞白血病、頭頸部がん、心臓がん、ホジキンリンパ腫、下咽頭がん、眼内黒色腫、膵島腫瘍、カポジ肉腫、腎臓がん、ランゲルハンス細胞組織球症、喉頭がん、口唇がん、肝臓がん、悪性線維性組織球腫骨がん、髄芽腫、髄上皮種、黒色腫、メルケル細胞がん腫、メルケル細胞皮膚がん腫、中皮腫、原発不明の転移性扁平上皮頸部がん、口腔がん、多発性内分泌腫瘍症候群、多発性骨髄腫、多発性骨髄腫／形質細胞新生物、菌状息肉腫、骨髄異形成症候群、骨髄増殖性新生物、鼻腔がん、鼻咽頭がん、神経芽細胞腫、非ホジキンリンパ腫、非黒色腫皮膚がん、非小細胞肺がん、口がん、口腔がん、口腔咽がん、骨肉腫、他の脳及び脊髄の腫瘍、卵巣がん、卵巣上皮がん、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、膵臓がん、乳頭腫症、副鼻腔がん、副甲状腺がん、骨盤がん、陰茎がん、咽頭がん、中間型松果体実質腫瘍、松果体芽腫、下垂体腫瘍、形質細胞腫瘍／多発性骨髄腫、胸膜肺芽腫、原発性中枢神経系（ＣＮＳ）リンパ腫、原発性肝細胞肝がん、前立腺がん、直腸がん、腎臓がん、腎細胞（腎臓）がん、腎細胞がん、気道がん、網膜芽細胞腫、横紋筋肉腫、唾液腺がん、セザリー症候群、小細胞肺がん、小腸がん、軟部組織肉腫、扁平上皮がん、扁平上皮頸部がん、胃（胃）がん、テント上原始神経外胚葉性腫瘍、Ｔ細胞リンパ腫、精巣がん、咽喉がん、胸腺がん、胸腺腫、甲状腺がん、移行上皮がん、腎盂及び尿管の移行上皮がん、絨毛性腫瘍、尿管がん、尿道がん、子宮がん、子宮肉腫、膣がん、外陰がん、ワルデンシュトレームマクログロブリン血症、又はウィルムス腫瘍を含む。

【0067】

別の実施形態において、個体、例えば、がんを有することが疑われる個体からの血液のサンプル又はその画分においてがんを検出する方法であって、本明細書で提供されるｃｔＤＮＡＳＮＶ増幅／配列決定ワークフローを使用してｃｔＤＮＡサンプル中に存在する単一ヌクレオチドバリアントを決定することによって、サンプル中に存在する単一ヌクレオチドバリアントを決定することを含む、方法が本明細書で提供される。複数の単一ヌクレオチド遺伝子座において、サンプル中に範囲の下限で１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、又は１５個のＳＮＶ、及び範囲の上限で２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、１６、１７、１８、１９、２０、２１、２２、２３、２４、２５、３０、４０、又は５０個のＳＮＶが存在することが、がんの存在の指標である。

【0068】

別の実施形態において、個体の腫瘍中のクローン単一ヌクレオチドバリアント（ＳＮＶ）を検出するための方法が本明細書に提供される。本方法は、例えば、実施例において本明細書に提供されるようなｃｔＤＮＡ増幅／配列決定ワークフローを行うことと、一連のアンプリコンの複数のコピーの配列に基づき、それぞれのＳＮＶ遺伝子座のバリアント対立遺伝子頻度を決定することと、を含む。複数の単一ヌクレオチドバリアント遺伝子座の他の単一ヌクレオチドバリアントと比較して相対的に高い対立遺伝子頻度は、腫瘍におけるクローン単一ヌクレオチドバリアントの指標である。バリアント対立遺伝子頻度は、配列決定の当該技術分野でよく知られている。

【0069】

特定の実施形態において、本方法は、治療プラン、療法を決定すること、及び／又は１つ以上のクローン単一ヌクレオチドバリアントを標的とする化合物を個体に投与することを更に含む。特定の例では、サブクローン及び／又は他のクローンのＳＮＶは、療法によって標的とされない。特定の療法及び関連する変異は、本明細書の他の章で提供され、当該技術分野で既知である。したがって、特定の例では、本方法は、個体に化合物を投与することを更に含み、化合物は、決定された単一ヌクレオチドバリアントのうちの１つ以上を有するがんの治療に特異的に有効であることが知られている。

【0070】

この実施形態の特定の態様において、０．２５％、０．５％、０．７５％、１．０％、５％又は１０％を超えるバリアント対立遺伝子頻度は、クローン単一ヌクレオチドバリアントの指標である。

【0071】

この実施形態の特定の例では、がんは、ステージ１ａ、１ｂ又は２ａの乳がん、膀胱がん又は大腸がんである。この実施形態の特定の例では、がんは、ステージ１ａ又は１ｂの乳がん、膀胱がん又は大腸がんである。この実施形態の特定の例では、個体は、手術を受けない。この実施形態の特定の例では、個体は、生検を受けない。

【0072】

この実施形態のいくつかの例では、クローンＳＮＶは、特定されるか、又は直接腫瘍試験などの他の試験が、任意のＳＮＶについて、可変対立遺伝子頻度が、決定された他の単一ヌクレオチドバリアントの少なくとも４分の１、３分の１、半分又は４分の３より大きい試験で、試験中のＳＮＶがクローンＳＮＶであることを示唆する場合には更に特定される。

【0073】

いくつかの実施形態において、ｃｔＤＮＡにおいてＳＮＶを検出する本明細書の方法は、腫瘍からのＤＮＡの直接分析の代わりに使用されてもよい。

【0074】

本明細書で提供される方法の実施形態のいずれかの特定の例では、標的化された増幅が個体からのｃｔＤＮＡで行われる前に、データが、個体からの腫瘍中に見出されるＳＮＶについて提供される。したがって、これらの実施形態において、ＳＮＶ増幅／配列決定反応は、個体からの１つ以上の腫瘍サンプルに対して行われる。この方法では、本明細書で提供されるｃｔＤＮＡＳＮＶ増幅／配列決定反応は、クローン及びサブクローン変異の液体生検を提供するため、依然として有利である。更に、本明細書に提供されるように、クローン変異は、あるＳＮＶについて、高いＶＡＦ割合、例えば、個体からのｃｔＤＮＡサンプルにおいて１、２、３、４、５、６、７、８、９、１０％より大きなＶＡＦが決定される場合、がんを有する個体において、より明確に特定され得る。

【0075】

特定の実施形態において、本明細書に提供される方法は、がんを有する個体からの循環遊離核酸からのｃｔＤＮＡをどのようにして単離し、分析するかを決定するために使用することができる。まず、がんが、乳がん、膀胱がん又は大腸がんであるかを決定する。がんが乳がん、膀胱がん又は大腸がんである場合、個体から循環遊離核酸が単離される。本方法は、いくつかの例では、がんのステージを決定することを更に含む。

【0076】

いくつかの方法では、本発明の組成物及び／又は固体支持体が本明細書で提供される。ユニバーサルアダプターを含む循環腫瘍核酸フラグメントを含む組成物であって、循環腫瘍核酸は、乳がん、膀胱がん又は大腸がんに由来するものであった、組成物。

【0077】

いくつかの実施形態において、ユニバーサルアダプターを含む循環腫瘍核酸フラグメントを含み、循環腫瘍核酸が、がんを有する個体の血液のサンプル又はその画分に由来するものであった、本発明の組成物が本明細書で提供される。これらの方法は、典型的には、ユニバーサルアダプターを含むｃｔＤＮＡフラグメントの形成を含む。更に、このような方法は、典型的には、複数の核酸のクローン集合を含み、クローン集合が、循環遊離核酸のサンプルから作成されたアンプリコンを含み、ｃｔＤＮＡである、固体支持体、特に、高スループットスクリーニングのための固体支持体の形成を含む。本明細書に提供される驚くべき結果に基づく例示的な実施形態において、ｃｔＤＮＡは、がんに由来するものであった。

【0078】

同様に、固体支持体であって、複数の核酸のクローン集合を含み、クローン集合が、がんを有する固体からの血液のサンプル又はその画分からの循環遊離核酸のサンプルから作成された核酸フラグメントを含む、固体支持体が、本発明の一実施形態として本明細書で提供される。

【0079】

特定の実施形態において、異なるクローン集合中の核酸フラグメントが、同じユニバーサルアダプターを含む。このような組成物は、典型的には、本発明の方法において、高スループット配列決定反応中に形成される。

【0080】

核酸のクローン集合は、２名以上の個体からのサンプルのセットからの核酸フラグメントに由来していてもよい。これらの実施形態において、核酸フラグメントは、サンプルのセットにおけるサンプルに対応する一連の分子バーコードの１つを含む。

【0081】

ＶＩ．分析方法ＳＮＶ１及び２
詳細な分析方法は、本明細書の分析の章において、ＳＮＶ方法１及びＳＮＶ方法２として本明細書で提供される。本明細書に提供される方法のうちのいずれかは、本明細書に提供される分析工程を更に含んでいてもよい。したがって、特定の例では、単一ヌクレオチドバリアントがサンプル中に存在するかどうかを決定する方法は、単一ヌクレオチドバリアント遺伝子座のセットの各々で、各対立遺伝子決定についての信頼値を特定することを含み、少なくとも一部には遺伝子座についてのリード深度に基づいていてもよい。信頼限界は、少なくとも７５％、８０％、８５％、９０％、９５％、９６％、９６％、９８％又は９９％で設定することができる。信頼限界は、異なる種類の変異について、異なるレベルで設定することができる。

【0082】

本方法は、少なくとも５、１０、１５、２０、２５、５０、１００、１５０、２００、２５０、５００、１，０００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００、５００，０００又は１００万の単一ヌクレオチドバリアント遺伝子座のセットについてのリード深度で行うことができる。

【0083】

特定の実施形態において、本明細書のいずれかの実施形態の方法は、効率及び／又はサイクル当たりのエラー率を決定することを含み、単一ヌクレオチドバリアント遺伝子座の多重増幅反応の各々の増幅反応について決定される。次いで、効率及びエラー率を使用して、単一バリアント遺伝子座のセットでの単一ヌクレオチドバリアントがサンプル中に存在するかどうかを決定してもよい。分析方法で提供されるＳＮＶ方法２に提供される更に詳細な分析工程が、特定の実施形態において、同様に含まれてもよい。

【0084】

本明細書の方法のうちのいずれかの、例示的な実施形態において、単一ヌクレオチドバリアント遺伝子座のセットは、がんについてＴＣＧＡ及びＣＯＳＭＩＣデータセットにおいて特定された単一ヌクレオチドバリアント遺伝子座の全てを含む。

【0085】

本明細書の方法のうちのいずれかの特定の実施形態において、単一ヌクレオチドバリアント遺伝子座のセットは、がんと関連することが知られている単一ヌクレオチドバリアント遺伝子座を範囲の下限で２、３、４、５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、７５、１００、２５０、５００、１０００、２５００、５０００、又は１０，０００個、並びに範囲の上限で５、６、７、８、９、１０、１５、２０、２５、３０、４０、５０、７５、１００、２５０、５００、１０００、２５００、５０００、１０，０００、２０，０００及び２５，０００個含む。

【0086】

ＶＩＩ．ＰＣＲ方法
ｃｔＤＮＡＳＮＶ増幅／配列決定ワークフローを含む本明細書のＳＮＶを検出するための方法のうちのいずれかにおいて、マルチプレックスＰＣＲについての改良された増幅パラメータを使用してもよい。例えば、増幅反応がＰＣＲ反応である場合、アニーリング温度が、範囲の下限でプライマーのセットのうち少なくとも１０、２０、２５、３０、４０、５０、０６、７０、７５、８０、９０、９５又は１００％のプライマーの融点よりも１、２、３、４、５、６、７、８、９又は１０℃高く、範囲の上限で２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４又は１５℃より高い。

【0087】

特定の実施形態において、増幅反応がＰＣＲ反応である場合、ＰＣＲ反応中のアニーリング工程の長さは、範囲の下限で１０、１５、２０、３０、４５及び６０分、範囲の上限で１５、２０、３０、４５、６０、１２０、１８０又は２４０分である。特定の実施形態において、増幅（例えばＰＣＲ反応）におけるプライマー濃度は、１～１０ｎＭである。更に、例示的な実施形態において、プライマーのセット中のプライマーは、プライマー二量体形成を最小限にするように設計される。

【0088】

したがって、増幅工程を含む本明細書の方法のうちのいずれかの一例において、増幅反応はＰＣＲ反応であり、アニーリング温度は、プライマーのセットのプライマーの少なくとも９０％の融点より１～１０℃高く、ＰＣＲ反応中のアニーリング工程の長さは、１５～６０分であり、増幅反応におけるプライマー濃度は、１～１０ｎＭであり、プライマーのセット中のプライマーは、プライマー二量体形成を最小限にするように設計される。この例の更なる態様において、多重増幅反応は、制限プライマー条件下で行われる。

【0089】

ＶＩＩＩ．がんの診断における使用
別の実施形態において、個体からの血液のサンプル又はその画分から、個体、例えば、がんを有することが疑われる個体についてのがんの診断を裏付けるための方法であって、本明細書で提供されるＤＮＡ増幅／配列決定ワークフローを行い、１つ以上の単一ヌクレオチドバリアントが、複数の単一ヌクレオチドバリアント遺伝子座に存在するかどうかを決定することを含む、方法が本明細書で提供される。この実施形態において、以下の要素、記述、ガイドライン又は規則が適用される。単一ヌクレオチドバリアントが存在しないことは、ステージ１ａ、１ｂ又は２ａの腺がんの診断を裏付けるものであり、単一ヌクレオチドバリアントの存在は、扁平上皮がん又はステージ２ｂ又は３ａの腺がんの診断を裏付けるものであり、及び／又は１０個以上の単一ヌクレオチドバリアントの存在は、扁平上皮がん又はステージ２ｂ又は３の腺がんの診断を裏付けるものである。

【0090】

これらの結果は、個体からの肺ＡＤＣ及びＳＣＣサンプルのｃｔＤＮＡＳＮＶ増幅／配列決定ワークフローを使用する分析を、ＡＤＣ腫瘍中に見出されるＳＮＶを、特に、ステージ２ｂ及び３ａのＡＤＣ腫瘍について、並びに特に、任意のステージでのＳＣＣ腫瘍について、特定するための価値ある方法として特定する。

【0091】

ＩＸ．治療レジメンの指示における使用
特定の実施形態において、ＳＮＶを検出するための本明細書の方法を使用して、治療レジメンを指示してもよい。ＡＤＣ及びＳＣＣに関連する特異的変異を標的とする療法が利用可能であり、開発中である（ＮａｔｕｒｅＲｅｖｉｅｗＣａｎｃｅｒ．１４：５３５－５５１（２０１４）。例えば、Ｌ８５８Ｒ又はＴ７９０ＭでのＥＧＦＲ変異の検出は、療法を選択するのに有益な場合がある。エルロチニブ、ゲフィチニブ、アファチニブ、ＡＺＫ９２９１、ＣＯ－１６８６及びＨＭ６１７１３は、特定のＥＧＦＲ変異を標的とする、米国及び臨床試験において承認された現行の療法である。別の例では、ＫＲＡＳにおけるＧ１２Ｄ、Ｇ１２Ｃ又はＧ１２Ｖ変異を使用して、セルメチニブとドセタキセルの組み合わせの療法を個体に指示してもよい。別の例として、ＢＲＡＦにおけるＶ６００Ｅの変異を使用して、被験体に、ベムラフェニブ、ダブラフェニブ及びトラメチニブの治療を指示してもよい。

【0092】

Ｘ．ライブラリ調製
本発明の方法は、特定の実施形態において、典型的には、サンプルから核酸ライブラリを作成し、増幅する工程を含む（すなわち、ライブラリ調製）。ライブラリ調製工程中のサンプルからの核酸は、付随したライゲーションアダプター（ライブラリタグ又はライゲーションアダプタータグ（ＬＴ）と呼ばれることが多い）を有していてもよく、ライゲーションアダプターは、ユニバーサルプライミング配列を含有し、続いて、ユニバーサル増幅を含む。一実施形態において、このことは、フラグメント化の後に配列決定ライブラリを作成するように設計された標準的なプロトコルを用いて行われてもよい。一実施形態において、ＤＮＡサンプルは、平滑末端であってもよく、次いで、Ａがその３’末端に付加されていてもよい。Ｔオーバーハングを有するＹアダプターを付加し、ライゲーションしてもよい。いくつかの実施形態において、Ａ又はＴオーバーハング以外の他の粘着末端を使用してもよい。いくつかの実施形態において、他のアダプター、例えば、ループ状ライゲーションアダプターを付加してもよい。いくつかの実施形態において、アダプターは、ＰＣＲ増幅のために設計されたタグを有していてもよい。

【0093】

ＸＩ．患者におけるがんをモニタリング又は検出するためのＤＮＡ増幅／配列決定ワークフロー。
本明細書で提供されるいくつかの実施形態は、ｃｔＤＮＡ、ｃｆＤＮＡ、又は細胞ＤＮＡサンプルにおいてがん特異的変異を検出することを含む。例示的な実施形態におけるこのような方法は、増幅工程及び配列決定工程を含む（本明細書では「ｃｔＤＮＡ増幅／配列決定ワークフローと呼ばれることがある）。例示的な例では、ＤＮＡ増幅／配列決定ワークフローは、個体、例えば、がん、例えば、乳がん、膀胱がん、又は大腸がんを有することが疑われる個体からの血液のサンプル又はその画分から単離された核酸に対して多重増幅反応を行うことによってアンプリコンのセットを作成することであって、アンプリコンのセットの各々のアンプリコンが、がん関連ゲノム遺伝子座のセットのうちの少なくとも１つのがん関連ゲノム遺伝子座、例えば、がんと関連することが知られているＳＮＶ遺伝子座に広がる、作成することと、アンプリコンのセットの各々のアンプリコンのうちの少なくともセグメントの配列を決定することであって、セグメントが、がん関連ゲノム遺伝子座を含む、決定することと、を含み得る。いくつかの実施形態において、がん関連ゲノム遺伝子座は、単一ヌクレオチドバリアント（ＳＮＶ）、コピー数多型（ＣＮＶ）、インデル、再配列遺伝子、又はエクソン、イントロン、遺伝子調節配列、若しくは非コードＲＮＡ配列の変動を含む。例示的なＤＮＡ増幅／配列決定ワークフローは、より詳細には、サンプルから作成された核酸ライブラリからのポリメラーゼ、ヌクレオチド三リン酸、核酸フラグメントと、単一ヌクレオチドバリアント遺伝子座からの有効な距離に各々結合するプライマーのセット、又はがん関連ゲノム遺伝子座を含む有効領域に各々広がるプライマー対のセットと、を組み合わせることによって増幅反応混合物を形成することを含み得る。次いで、増幅反応混合物を増幅条件に供して、がん関連ゲノム遺伝子座のセットのうちの少なくとも１つのがん関連ゲノム遺伝子座を含むアンプリコンのセットを作成すること、及びアンプリコンのセットの各々のアンプリコンのうちの少なくともセグメントの配列を決定することであって、セグメントが、がん関連ゲノム遺伝子座を含む、決定すること。

【0094】

プライマーの結合の有効距離は、がん関連ゲノム遺伝子座の１、２、３、４、５、６、７、８、９、１０、１１、１２、１３、１４、１５、２０、２５、３０、３５、４０、４５、５０、７５、１００、１２５、又は１５０個の塩基対以内であり得る。一対のプライマーが広がる有効範囲は、典型的には、がん関連ゲノム遺伝子座を含み、典型的には１６０個の塩基対以下であり、１５０、１４０、１３０、１２５、１００、７５、５０、又は２５個の塩基対以下であり得る。他の実施形態において、一対のプライマーが広がる有効範囲は、がん関連ゲノム遺伝子座から範囲の下限で２０、２５、３０、４０、５０、６０、７０、７５、１００、１１０、１２０、１２５、１３０、１４０、又は１５０ヌクレオチド、及び範囲の上限で２５、３０、４０、５０、６０、７０、７５、１００、１１０、１２０、１２５、１３０、１４０、若しくは１５０、１６０、１７０、１７５、又は２００である。

【0095】

本発明の方法で使用するためのがん関連ゲノム遺伝子座を検出するために、ｃｔＤＮＡ増幅／配列決定ワークフローで使用することができる増幅方法に関する更なる詳細は、本明細書の他の章に提供される。

【0096】

ＸＩＩ．ＳＮＶコール分析
本明細書で提供される方法を行っている間、核酸配列決定データが、タイル化マルチプレックスＰＣＲによって作成されるアンプリコンについて作成される。このデータを分析して、特定の信頼限界内で、がん関連ゲノム遺伝子座、例えば、単一ヌクレオチドバリアント（ＳＮＶ）が、がんの発症、再発、転移、治療応答、又は予後に関連することが知られている標的遺伝子中に存在するかどうかを決定するように使用及び／又は適合させ得るアルゴリズム設計ツールが利用可能である。

【0097】

配列決定リードは、社内ツールを使用してデマルチプレックスされ、Ｂｕｒｒｏｗｓ－ＷｈｅｅｌｅｒアラインメントソフトウェアのＢｗａｍｅｍ関数（ＢＷＡ、Ｂｕｒｒｏｗｓ－ＷｈｅｅｌｅｒＡｌｉｇｎｍｅｎｔＳｏｆｔｗａｒｅを使用して、ｈｇ１９ゲノムに対するペアマージリードを用い、シングルエンドモードでマッピングされてもよい（ＬｉＨ．及びＤｕｒｂｉｎＲ．（２０１０）Ｆａｓｔａｎｄａｃｃｕｒａｔｅｌｏｎｇ－ｒｅａｄａｌｉｇｎｍｅｎｔｗｉｔｈＢｕｒｒｏｗｓ－ＷｈｅｅｌｅｒＴｒａｎｓｆｏｒｍ．Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ、Ｅｐｕｂ．［ＰＭＩＤ：２００８０５０５］を参照）。増幅統計ＱＣは、全リード、マッピングされたリードの数、標的上のマッピングされたリードの数及び計測されたリードの数を分析することによって行うことができる。

【0098】

特定の実施形態において、核酸配列決定データの検出からＳＮＶを検出する任意の分析方法を、ＳＮＶを検出するか、又はＳＮＶが存在するかどうかを決定する工程を含む本発明に係る本発明の方法とともに使用してもよい。特定の例示的な実施形態において、以下のＳＮＶ方法１を利用する本発明の方法を使用する。他のなお更なる例示的な実施形態において、ＳＮＶを検出するか、又はＳＮＶがＳＮＶ遺伝子座に存在するかどうかを決定する工程を含む本発明の方法は、以下のＳＮＶ方法２を利用する。

【0099】

ＳＮＶ方法１：この実施形態に関して、バックグラウンドエラーモデルは、通常の血漿サンプルを用いて構築され、ランに特有のアーチファクトを考慮するために同じ配列決定ランで配列決定された。特定の実施形態において、５、１０、１５、２０、２５、３０、４０、５０、１００、１５０、２００、２５０、又は２５０個より多い通常の血漿サンプルを同じ配列決定ランで分析する。特定の例示的な実施形態において、２０、２５、４０又は５０個の通常の血漿サンプルを同じ配列決定ランで分析する。カットオフを超える通常のバリアント対立遺伝子頻度の中央値を有するノイズ位置を除去する。例えば、このカットオフは、特定の実施形態において、０．１％、０．２％、０．２５％、０．５％、１％、２％、５％又は１０％より大きい。特定の例示的な実施形態において、０．５％を超える通常のバリアント対立遺伝子頻度の中央値を有するノイズ位置を除去する。ノイズ及び混入を考慮するために、外れ値のサンプルをこのモデルから繰り返し除去した。特定の実施形態において、Ｚスコアが５、６、７、８、９又は１０を超えるサンプルは、データ分析から除去する。全てのゲノム遺伝子座の各々の塩基置換について、リード深度で重み付けされた平均及び誤差の標準偏差を計算する。少なくとも５つのバリアントリードを有し、バックグラウンドエラーモデルに対するＺスコアが１０である、腫瘍又は細胞を含まない血漿サンプルの位置は、例えば、候補変異としてコールすることができる。

【0100】

ＳＮＶ方法２：この実施形態に関して、単一ヌクレオチドバリアント（ＳＮＶ）は、血漿ｃｔＤＮＡデータを用いて決定される。ＰＣＲプロセスは、確率過程としてモデリングされ、トレーニングセットを用いてパラメータを推定し、別個の試験セットについて最終的なＳＮＶコールを作成する。複数のＰＣＲサイクルにわたる誤差の伝播が決定され、バックグラウンドエラーの平均及び分散が計算され、例示的な実施形態において、バックグラウンドエラーは、実際の変異とは区別される。

【0101】

各塩基について、以下のパラメータが推定される。

【0102】

ｐ＝効率（各リードが各サイクル中に複製される確率）

【0103】

ｐ_ｅ＝変異型ｅについてのサイクル当たりのエラー率（ｅ型のエラーが起こる確率）

【0104】

Ｘ_０＝分子の初期数

【0105】

一連のＰＣＲプロセスにわたってリードが複製されるにつれて、発生するエラーが多くなる。したがって、リードのエラープロファイルは、元のリードからの分離度によって決定される。作成されるまでにｋ回の複製を経た場合、リードを第ｋ世代と呼ぶ。

【0106】

各塩基について、以下の変数を定義してみよう。

【0107】

Ｘ_ｉｊ＝ＰＣＲサイクルｊで作成される第ｉ世代のリードの数

【0108】

Ｙ_ｉｊ＝サイクルｊ終了時の第ｉ世代のリードの総数

【0109】

Ｘ_ｉｊ ^ｅ＝ＰＣＲサイクルｊで作成される、変異ｅを有する第ｉ世代のリードの数

【0110】

更に、正常な分子Ｘ_０に加えて、ＰＣＲプロセス開始時に変異ｅを有する更なるｆ_ｅＸ_０分子が存在する場合（したがって、ｆｅ／（１＋ｆｅ）は、初期混合物中の変異した分子の分率であろう）。

【0111】

サイクルｊ－１での第ｉ－１世代のリードの総数を考えると、サイクルｊで作成される第ｉ世代のリードの数は、サンプルサイズがＹ_ｉ－１，_ｊ－１であり、確率パラメータがｐである二項分布を有する。したがって、Ｅ（Ｘ_ｉｊ，｜Ｙ_ｉ－１，_ｊ－１，ｐ）＝ｐＹ_ｉ－１，_ｊ－１及びＶａｒ（Ｘ_ｉｊ，｜Ｙ_ｉ－１，_ｊ－１，ｐ）＝ｐ（１－ｐ）Ｙ_ｉ－１，_ｊ－１である。

【0112】

本願発明者らは、

【数1】

も有する。したがって、再帰、シミュレーション又は同様の方法によって、Ｅ（Ｘ_ｉｊ）を決定することができる。同様に、本願発明者らは、ｐの分布を使用して、Ｖａｒ（Ｘ_ｉｊ）＝Ｅ（Ｖａｒ（Ｘ_ｉｊ，｜ｐ））＋Ｖａｒ（Ｅ（Ｘ_ｉｊ，｜ｐ））を決定することができる。

【0113】

最後に、Ｅ（Ｘ_ｉｊ ^ｅ｜Ｙ_ｉ－１，_ｊ－１，ｐ_ｅ）＝ｐ_ｅＹ_ｉ－１，_ｊ－１及びＶａｒ（Ｘ_ｉｊ ^ｅ｜Ｙ_ｉ－１，_ｊ－１，ｐ）＝ｐ_ｅ（１－ｐ_ｅ）Ｙ_ｉ－１，_ｊ－１であり、本願発明者らは、これらを使用して、Ｅ（Ｘ_ｉｊ ^ｅ）及びＶａｒ（Ｘ_ｉｊ ^ｅ）を計算することができる。

【0114】

特定の実施形態において、ＳＮＶ方法２は、以下のように行われる。

【0115】

ａ）トレーニングデータセットを用い、ＰＣＲ効率及びサイクル当たりのエラー率を推定する。

【0116】

ｂ）工程（ａ）で推定された効率の分布を用い、各塩基での試験データセットについての開始時分子の数を推定する。

【0117】

ｃ）必要に応じて、工程（ｂ）で推定された開始時分子の数を用いて、試験データセットについての効率の推定値を更新する。

【0118】

ｄ）工程（ａ）、（ｂ）及び（ｃ）で推定された試験セットデータ及びパラメータを用い、（実際の変異分子の初期の割合からなる検索空間について）分子の総数、バックグラウンドエラー分子及び実際の変異分子についての平均及び分散を推定する。

【0119】

ｅ）総分子における総エラー分子の数（バックグラウンドエラー及び実際の変異）に対する分布をフィッティングして、検索空間における各々の実際の変異の割合の尤度を計算する。

【0120】

ｆ）最も可能性の高い実際の変異の割合を決定し、工程（ｅ）からのデータを用いて信頼性を計算する。

【0121】

信頼性のカットオフを使用して、ＳＮＶ遺伝子座でＳＮＶを特定することができる。例えば、９０％、９５％、９６％、９７％、９８％又は９９％の信頼性カットオフを使用して、ＳＮＶをコールすることができる。

【0122】

例示的なＳＮＶ方法２のアルゴリズム
このアルゴリズムは、トレーニングセットを用いて効率及びサイクル当たりのエラー率を推定することから開始する。ｎは、ＰＣＲサイクルの総数を示す。

【0123】

各塩基ｂでのリードＲｂの数は、（１＋ｐ_ｂ）^ｎＸ_０によって概算することができ、ｐ_ｂは、塩基ｂでの効率である。次いで、（Ｒ_ｂ／Ｘ_０）^１／ｎを使用して、１＋ｐ_ｂを概算することができる。次いで、全てのトレーニングサンプルにわたって、ｐ_ｂの平均及び標準偏差を決定して、各塩基についての確率分布のパラメータ（例えば、通常分布、ベータ分布又は同様の分布）を推定することができる。

【0124】

同様に、各塩基ｂでのエラーｅのリードＲ_ｂ ^ｅの数を使用して、ｐ_ｅを推定することができる。全てのトレーニングサンプルにわたってエラー率の平均及び標準偏差を決定した後、その確率分布（例えば、通常分布、ベータ分布又は同様の分布）を概算し、この平均及び標準偏差の値を用い、そのパラメータが推定される。

【0125】

次に、試験データについて、各塩基での初期の開始時コピーを

【数2】

であると推定し、ここで、ｆ（．）は、トレーニングセットから推定された分布である。

【0126】

【数3】

式中、ｆ（．）は、トレーニングセットから推定された分布である。

【0127】

したがって、このパラメータを推定し、これを確率過程で使用する。次に、これらの推定値を使用することによって、各サイクルで作成された分子の平均及び分散を推定することができる（なお、通常の分子、エラー分子及び変異分子について別個にこれを行う）。

【0128】

最後に、確率法（例えば、最大尤度又は同様の方法）を使用することによって、エラー、変異及び通常の分子の分布に最も良く適合する最良のｆｅ値を決定することができる。より具体的には、本願発明者らは、最終的なリードにおける様々なｆｅ値について、全分子に対するエラー分子の予想比率を推定し、これらの値の各々についてのデータの尤度を決定し、次いで、最大尤度を有する値を選択する。

【0129】

ＸＩＩＩ．プライマー設計／ライブラリ調製
プライマーテールは、普遍的にタグ化されたライブラリからのフラグメント化されたＤＮＡの検出を改善することができる。ライブラリタグ及びプライマーテールが、相同配列を含有する場合、ハイブリダイゼーションを改善することができ（例えば、融点（Ｔｍ）を下げる）、プライマー標的配列の一部のみがサンプルＤＮＡプライマーフラグメント中にある場合、プライマーを伸長することができる。いくつかの実施形態において、１３個以上の標的特異性塩基対が使用されてもよい。いくつかの実施形態において、１０～１２個の標的特異性塩基対が使用されてもよい。いくつかの実施形態において、８～９つの標的特異性塩基対が使用されてもよい。いくつかの実施形態において、６～７つの標的特異性塩基対が使用されてもよい。

【0130】

一実施形態において、ライブラリは、サンプル中のＤＮＡフラグメントの末端に、又はサンプルから単離されたＤＮＡから作成されたＤＮＡフラグメントの末端にアダプターをライゲーションすることによって、上のサンプルから作成される。次いで、フラグメントを、例えば、以下の例示的なプロトコルにしたがって、ＰＣＲを使用して増幅することができる。

【0131】

９５℃で２分間；１５×［９５℃で２０秒間、５５℃で２０秒間、６８℃で２０秒間］、６８℃で２分間、４℃で保持。

【0132】

多くのキット及び方法は、その後の増幅（例えば、クローン増幅）及びその後の配列決定のためのユニバーサルプライマー結合部位を含む核酸ライブラリの作成についての当該技術分野で既知である。アダプターのライゲーションを促進しやすくするために、ライブラリ調製及び増幅は、末端修復及びアデニル化（すなわち、Ａテーリング）を含んでいてもよい。小さな核酸フラグメント（特に、循環遊離ＤＮＡ）からライブラリを調製するように特に適合されたキットは、本明細書で提供される方法を実施するのに有用な場合がある。例えば、ＢｉｏｏＳｃｉｅｎｔｉｆｉｃ（）から入手可能なＮＥＸＴｆｌｅｘＣｅｌｌＦｒｅｅキット又はＮａｔｅｒａＬｉｂｒａｒｙＰｒｅｐＫｉｔ（Ｎａｔｅｒａ，Ｉｎｃ．サンカルロス、ＣＡから入手可能）。しかし、このようなキットは、典型的には、本明細書で提供される方法の増幅工程及び配列決定工程のためにカスタマイズされたアダプターを含むように改変される。アダプターライゲーションは、ＡＧＩＬＥＮＴＳＵＲＥＳＥＬＥＣＴキット（Ａｇｉｌｅｎｔ、ＣＡ）中に見出されるライゲーションキットなどの市販のキットを用いて行うことができる。

【0133】

次いで、サンプル、特に、本発明の方法のための循環遊離ＤＮＡサンプルから単離されたＤＮＡから作成した核酸ライブラリの標的領域を増幅させる。この増幅のために、一連のプライマー又はプライマー対は、範囲の下限で５、１０、１５、２０、２５、５０、１００、１２５、１５０、２５０、５００、１０００、２５００、５０００、１０，０００、２０，０００、２５，０００又は５０，０００プライマー、範囲の上限で１５、２０、２５、５０、１００、１２５、１５０、２５０、５００、１０００、２５００、５０００、１０，０００、２０，０００、２５，０００、５０，０００、６０，０００、７５，０００又は１００，０００プライマーを含んでいてもよく、各々が、一連のプライマー結合部位の１つに結合する。

【0134】

プライマー設計は、Ｐｒｉｍｅｒ３とともに作成されてもよい（ＵｎｔｅｒｇｒａｓｓｅｒＡ、ＣｕｔｃｕｔａｃｈｅＩ、ＫｏｒｅｓｓａａｒＴ、ＹｅＪ、ＦａｉｒｃｌｏｔｈＢＣ、ＲｅｍｍＭ、ＲｏｚｅｎＳＧ（２０１２）「Ｐｒｉｍｅｒ３－ｎｅｗｃａｐａｂｉｌｉｔｉｅｓａｎｄｉｎｔｅｒｆａｃｅｓ．」ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ４０（１５）：ｅ１１５及びＫｏｒｅｓｓａａｒＴ，ＲｅｍｍＭ（２００７）「ＥｎｈａｎｃｅｍｅｎｔｓａｎｄｍｏｄｉｆｉｃａｔｉｏｎｓｏｆｐｒｉｍｅｒｄｅｓｉｇｎｐｒｏｇｒａｍＰｒｉｍｅｒ３．」Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ２３（１０）：１２８９－９１）ソースコードは、ｐｒｉｍｅｒ３．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔで入手可能）。プライマー特異性は、ＢＬＡＳＴによって評価され、これを既存のプライマー設計パイプライン基準に追加してもよい。

【0135】

プライマー特異性は、ｎｃｂｉ－ｂｌａｓｔ－２．２．２９＋パッケージからのＢＬＡＳＴｎプログラムを用いて決定することができる。タスクオプション「ｂｌａｓｔｎ－ｓｈｏｒｔ」を使用して、ｈｇ１９ヒトゲノムに対するプライマーをマッピングしてもよい。プライマー設計は、プライマーがゲノムに対して１００ヒット未満を有し、トップヒットが、そのゲノムの標的相補性プライマー結合領域であり、他のヒットよりも少なくとも２スコア高い場合に、「特異的」であると決定することができる（スコアは、ＢＬＡＳＴｎプログラムによって定義される）。このことは、そのゲノムに対して固有のヒットを有し、ゲノム全体に多くの他のヒットを有しないように行うことができる。

【0136】

最終的に選択されたプライマーは、ＩＧＶ（ＪａｍｅｓＴ．Ｒｏｂｉｎｓｏｎ、ＨｅｌｇａＴｈｏｒｖａｌｄｓｄｏｔｔｉｒ、ＷｅｎｄｙＷｉｎｃｋｌｅｒ、ＭｉｔｃｈｅｌｌＧｕｔｔｍａｎ、ＥｒｉｃＳ．Ｌａｎｄｅｒ、ＧａｄＧｅｔｚ、ＪｉｌｌＰ．Ｍｅｓｉｒｏｖ．ＩｎｔｅｇｒａｔｉｖｅＧｅｎｏｍｉｃｓＶｉｅｗｅｒ．ＮａｔｕｒｅＢｉｏｔｅｃｈｎｏｌｏｇｙ２９、２４－２６（２０１１））及びＵＣＳＣブラウザ（ＫｅｎｔＷＪ、ＳｕｇｎｅｔＣＷ、ＦｕｒｅｙＴＳ、ＲｏｓｋｉｎＫＭ、ＰｒｉｎｇｌｅＴＨ、ＺａｈｌｅｒＡＭ、ＨａｕｓｓｌｅｒＤ．ＴｈｅｈｕｍａｎｇｅｎｏｍｅｂｒｏｗｓｅｒａｔＵＣＳＣ．ＧｅｎｏｍｅＲｅｓ．２００２Ｊｕｎ；１２（６）：９９６－１００６）で、検証のためのベッドファイル及びカバレッジマップを使用して視覚化することができる。

【0137】

ＸＩＶ．ＰＣＲ反応混合物
本発明の方法は、特定の実施形態において、増幅反応混合物を形成することを含む。この反応混合物は、典型的には、サンプルから作成された核酸ライブラリからのポリメラーゼ、ヌクレオチド三リン酸、核酸フラグメントと、ＳＮＶを含有する標的領域に特異的な順方向プライマー及び逆方向プライマーのセットとを合わせることによって作成される。本明細書で提供される反応混合物は、例示的な実施形態において、それ自体が本発明の別個の態様を形成する。

【0138】

本発明に有用な増幅反応混合物は、核酸増幅、特にＰＣＲ増幅に関する技術分野で既知の構成要素を含む。例えば、反応混合物は、典型的には、ヌクレオチド三リン酸、ポリメラーゼ及びマグネシウムを含む。本発明に有用なポリメラーゼは、増幅反応に使用可能な任意のポリメラーゼ、特に、ＰＣＲ反応に有用なものを含んでいてもよい。特定の実施形態において、ホットスタートＴａｑポリメラーゼは、特に有用である。本明細書で提供される方法を実施するのに有用な増幅反応混合物、例えば、ＡｍｐｌｉＴａｑＧｏｌｄマスターミックス（ＬｉｆｅＴｅｃｈｎｏｌｏｇｉｅｓ、カールスバッド、ＣＡ）は、市販されている。

【0139】

ＰＣＲの増幅（例えば、温度サイクル）条件は、当該技術分野で周知である。本明細書で提供される方法は、標的核酸（例えば、ライブラリからの標的核酸）を増幅させる任意のＰＣＲサイクル条件を含んでいてもよい。非限定的な例示的なサイクル条件は、本明細書の実施例の章で提供される。

【0140】

ＰＣＲを実施するときに可能な多くのワークフローが存在し、本明細書に開示する方法に典型的ないくつかのワークフローが本明細書で提供される。本明細書で概説される工程は、他の可能な工程を除外することを意味しておらず、本明細書に記載される工程のいずれかが本方法が適切に機能するのに必要であることを暗示するものでもない。多数のパラメータの変動又は他の改変は、文献で既知であり、本発明の本質に影響を与えることなく行うことができる。

【0141】

本明細書で提供される方法の特定の実施形態において、アンプリコン（例えば、アウタープライマー標的アンプリコン）の少なくとも一部、例示的な例では全配列が、決定される。アンプリコンの配列を決定する方法は、当該技術分野で既知である。当該技術分野で既知の配列決定方法のいずれか、例えば、サンガー配列決定は、このような配列の決定に使用することができる。例示的な実施形態において、高スループット次世代配列決定技術（本明細書では、超並列配列決定技術とも呼ばれる）、例えば、限定されないが、ＭＹＳＥＱ（ＩＬＬＵＭＩＮＡ）、ＨＩＳＥＱ（ＩＬＬＵＭＩＮＡ）、ＩＯＮＴＯＲＲＥＮＴ（ＬＩＦＥＴＥＣＨＮＯＬＯＧＩＥＳ）、ＧＥＮＯＭＥＡＮＡＬＹＺＥＲＩＬＸ（ＩＬＬＵＭＩＮＡ）、ＧＳＦＬＥＸ＋（ＲＯＣＨＥ４５４）で使用されるものを、本明細書で提供される方法によって作られるアンプリコンを配列決定するために使用することができる。

【0142】

高スループット遺伝子シーケンサは、個体からの特有のサンプルを特定するためのバーコード化（すなわち、特徴的な核酸配列を用いたサンプルタグ化）の使用に合うように修正可能であり、それにより、ＤＮＡシーケンサの１回のランにおいて複数サンプルの同時分析を可能にする。ライブラリ調製（又は目的の他の核酸調製）においてゲノムの所与の領域が配列決定される回数（リード数）は、目的のゲノム中のその配列のコピー数（又はｃＤＮＡを含有する調製の場合には発現レベル）に比例するだろう。増幅効率におけるバイアスは、このような定量的な決定において考慮されてもよい。

【0143】

本発明の方法は、特定の実施形態において、増幅反応混合物を形成することを含む。この反応混合物は、典型的には、サンプルから作成された核酸ライブラリからのポリメラーゼ、ヌクレオチド三リン酸、核酸フラグメントと、一連の順方向の標的特異性アウタープライマー及び第１鎖逆方向アウターユニバーサルプライマーとを合わせることによって形成される。別の例示的な実施形態は、順方向の標的特異性アウタープライマーの代わりに、順方向の標的特異性インナープライマーと、核酸ライブラリからの核酸フラグメントの代わりに、アウタープライマーを用いる第１のＰＣＲ反応からのアンプリコンとを含む反応混合物である。本明細書で提供される反応混合物は、例示的な実施形態において、それ自体が本発明の別個の態様を形成する。例示的な実施形態において、反応混合物は、ＰＣＲ反応混合物である。ＰＣＲ反応混合物は、典型的には、マグネシウムを含む。

【0144】

いくつかの実施形態において、反応混合物は、エチレンジアミン四酢酸（ＥＤＴＡ）、マグネシウム、塩化テトラメチルアンモニウム（ＴＭＡＣ）、又はこれらの任意の組み合わせを含む。いくつかの実施形態において、ＴＭＡＣの濃度は、２０～７０ｍＭ（境界値を含む）である。任意の特定の理論に束縛されることを意味しないが、ＴＭＡＣは、ＤＮＡに結合し、二本鎖を安定化し、プライマー特異性を増加させ、及び／又は異なるプライマーの融点を等しくすると考えられる。いくつかの実施形態において、ＴＭＡＣは、異なる標的に対する増幅産物の量の均一性を高める。いくつかの実施形態において、マグネシウム（例えば、塩化マグネシウム由来のマグネシウム）の濃度は、１～８ｍＭである。

【0145】

多数の標的のマルチプレックスＰＣＲに使用される多数のプライマーは、多くのマグネシウムをキレート化し得る（プライマー中の２つのリン酸基が、１つのマグネシウムをキレート化する）。例えば、プライマー由来のリン酸基の濃度が約９ｍＭであるように十分なプライマーを使用する場合、プライマーは、有効マグネシウム濃度を約４．５ｍＭまで減らし得る。いくつかの実施形態において、高濃度のマグネシウムがＰＣＲのエラー（例えば、非標的遺伝子座の増幅）を引き起こす可能性があるため、ＥＤＴＡを使用して、ポリメラーゼの補因子として利用可能なマグネシウムの量を減らす。いくつかの実施形態において、ＥＤＴＡの濃度は、利用可能なマグネシウムの量を１～５ｍＭ（例えば、３～５ｍＭ）まで減らす。

【0146】

いくつかの実施形態において、ｐＨは、７．５～８．５、例えば、７．５～８、８～８．３又は８．３～８．５（境界値を含む）である。いくつかの実施形態において、Ｔｒｉｓは、例えば、１０～１００ｍＭ、例えば、１０～２５ｍＭ、２５～５０ｍＭ、５０～７５ｍＭ又は２５～７５ｍＭの濃度（境界値を含む）で使用される。いくつかの実施形態において、これらの濃度のいずれかのＴｒｉｓは、７．５～８．５のｐＨで使用される。いくつかの実施形態において、ＫＣｌ及び（ＮＨ_４）_２ＳＯ_４の組み合わせ、例えば、５０～１５０ｍＭのＫＣｌ及び１０～９０ｍＭの（ＮＨ_４）_２ＳＯ_４（境界値を含む）が使用される。いくつかの実施形態において、ＫＣｌの濃度は、０～３０ｍＭ、５０～１００ｍＭ又は１００～１５０ｍＭ（境界値を含む）である。いくつかの実施形態において、（ＮＨ_４）_２ＳＯ_４の濃度は、１０～５０ｍＭ、５０～９０ｍＭ、１０～２０ｍＭ、２０～４０ｍＭ、４０～６０ｍＭ又は６０～８０ｍＭの（ＮＨ_４）_２ＳＯ_４（境界値を含む）である。いくつかの実施形態において、アンモニウム［ＮＨ_４ ^＋］濃度は、０～１６０ｍＭ、例えば、０～５０、５０～１００又は１００～１６０ｍＭ（境界値を含む）である。いくつかの実施形態において、カリウム濃度とアンモニウム濃度の合計（［Ｋ^＋］＋［ＮＨ_４ ^＋］）は、０～１６０ｍＭ、例えば、０～２５、２５～５０、５０～１５０、５０～７５、７５～１００、１００～１２５又は１２５～１６０ｍＭ（境界値を含む）である。［Ｋ^＋］＋［ＮＨ_４ ^＋］＝１２０ｍＭを有する例示的な緩衝液は、２０ｍＭのＫＣｌ及び５０ｍＭの（ＮＨ_４）_２ＳＯ_４である。いくつかの実施形態において、緩衝液は、２５～７５ｍＭのＴｒｉｓ（ｐＨ７．２～８）、０～５０ｍＭのＫＣｌ、１０～８０ｍＭの硫酸アンモニウム及び３～６ｍＭのマグネシウム（境界値を含む）を含む。いくつかの実施形態において、緩衝液は、２５～７５ｍＭのＴｒｉｓ（ｐＨ７～８．５）、３～６ｍＭのＭｇＣｌ_２、１０～５０ｍＭのＫＣｌ及び２０～８０ｍＭの（ＮＨ_４）_２ＳＯ_４（境界値を含む）を含む。いくつかの実施形態において、１００～２００単位／ｍＬのポリメラーゼが使用される。いくつかの実施形態において、１００ｍＭのＫＣｌ、５０ｍＭの（ＮＨ_４）_２ＳＯ_４、３ｍＭのＭｇＣｌ_２、７．５ｎＭのライブラリ中の各プライマー及びｐＨ８．１の最終体積２０ｕｌ中の７ｕｌのＤＮＡテンプレートが使用される。

【0147】

いくつかの実施形態において、クラウディング剤、例えば、ポリエチレングリコール（ＰＥＧ、例えば、ＰＥＧ８，０００）又はグリセロールが使用される。いくつかの実施形態において、ＰＥＧ（例えばＰＥＧ８，０００）の量は、０．１～２０％、例えば、０．５～１５％、１～１０％、２～８％又は４～８％（境界値を含む）である。いくつかの実施形態において、グリセロールの量は、０．１～２０％、例えば、０．５～１５％、１～１０％、２～８％又は４～８％（境界値を含む）である。いくつかの実施形態において、クラウディング剤は、低ポリメラーゼ濃度及び／又はより短いアニーリング時間のいずれかを使用することを可能にする。いくつかの実施形態において、クラウディング剤は、ＤＯＲの均一性を改善し、及び／又はドロップアウト（検出されない対立遺伝子）を減らす。ポリメラーゼ。いくつかの実施形態において、プルーフリーディング活性を有するポリメラーゼ、プルーフリーディング活性を有しない（又は無視可能な）ポリメラーゼ、又はプルーフリーディング活性を有するポリメラーゼとプルーフリーディング活性を有しない（又は無視可能な）ポリメラーゼの混合物が使用される。いくつかの実施形態において、ホットスタートポリメラーゼ、非ホットスタートポリメラーゼ、又はホットスタートポリメラーゼと非ホットスタートポリメラーゼの混合物が使用される。いくつかの実施形態において、ＨｏｔＳｔａｒＴａｑＤＮＡポリメラーゼが使用される（例えば、ＱＩＡＧＥＮカタログ番号２０３２０３を参照）。いくつかの実施形態において、ＡｍｐｌｉＴａｑＧｏｌｄ（登録商標）ＤＮＡポリメラーゼが使用される。いくつかの実施形態において、反応混合物中に過剰なテンプレートが存在する場合、かつ長い産物を増幅する場合に効率的なＰＣＲ増幅を提供する高忠実度ポリメラーゼであるＰｒｉｍｅＳＴＡＲＧＸＬＤＮＡポリメラーゼが使用される（ＴａｋａｒａＣｌｏｎｔｅｃｈ、マウンテンビュー、ＣＡ）。いくつかの実施形態において、ＫＡＰＡＴａｑＤＮＡポリメラーゼ又はＫＡＰＡＴａｑＨｏｔＳｔａｒｔＤＮＡポリメラーゼが使用される。これらは、好熱菌Ｔｈｅｒｍｕｓａｑｕａｔｉｃｕｓの単一サブユニット野生型ＴａｑＤＮＡポリメラーゼに由来する。ＫＡＰＡＴａｑ及びＫＡＰＡＴａｑＨｏｔＳｔａｒｔＤＮＡポリメラーゼは、５’－３’ポリメラーゼ活性及び５’－３’エキソヌクレアーゼ活性を有するが、３’から５’方向のエキソヌクレアーゼ（プルーフリーディング）活性は有しない（例えば、ＫＡＰＡＢＩＯＳＹＳＴＥＭＳカタログ番号ＢＫ１０００を参照）。いくつかの実施形態において、ＰｆｕＤＮＡポリメラーゼが使用される。このポリメラーゼは、超好熱性古細菌Ｐｙｒｏｃｏｃｃｕｓｆｕｒｉｏｓｕｓ由来の高温安定性ＤＮＡポリメラーゼである。この酵素は、５’→３’方向において、ヌクレオチドから二本鎖ＤＮＡへのテンプレート依存性重合を触媒する。ＰｆｕＤＮＡＰｏｌｙｍｅｒａｓｅは、３’→５’エキソヌクレアーゼ（プルーフリーディング）活性も示し、このポリメラーゼがヌクレオチド組み込みエラーを修正することを可能にする。このポリメラーゼは、５’→３’エキソヌクレアーゼ活性を有しない（例えば、ＴｈｅｒｍｏＳｃｉｅｎｔｉｆｉｃカタログ番号ＥＰ０５０１を参照）。いくつかの実施形態において、Ｋｌｅｎｔａｑ１が使用される。これは、ＴａｑＤＮＡポリメラーゼのＫｌｅｎｏｗフラグメント類似体であり、エキソヌクレアーゼ活性又はエンドヌクレアーゼ活性を有しない（例えば、ＤＮＡＰＯＬＹＭＥＲＡＳＥＴＥＣＨＮＯＬＯＧＹ，Ｉｎｃ、セントルイス、ミズーリ、カタログ番号１００を参照）。いくつかの実施形態において、ポリメラーゼは、ＰＨＵＳＩＯＮＤＮＡポリメラーゼ、例えば、ＰＨＵＳＩＯＮＨｉｇｈＦｉｄｅｌｉｔｙＤＮＡポリメラーゼ（Ｍ０５３０Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）又はＰＨＵＳＩＯＮＨｏｔＳｔａｒｔＦｌｅｘＤＮＡポリメラーゼ（Ｍ０５３５Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）である。いくつかの実施形態において、ポリメラーゼは、Ｑ５（登録商標）ＤＮＡポリメラーゼ、例えば、Ｑ５（登録商標）Ｈｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡＰｏｌｙｍｅｒａｓｅ（Ｍ０４９１Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）又はＱ５（登録商標）ＨｏｔＳｔａｒｔＨｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡＰｏｌｙｍｅｒａｓｅ（Ｍ０４９３Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）である。いくつかの実施形態において、ポリメラーゼは、Ｔ４ＤＮＡポリメラーゼ（Ｍ０２０３Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）である。

【0148】

いくつかの実施形態において、５～６００単位／ｍＬ（反応体積１ｍＬ当たりの単位数）、例えば、５～１００、１００～２００、２００～３００、３００～４００、４００～５００又は５００～６００単位／ｍＬ（境界値を含む）のポリメラーゼが使用される。

【0149】

ＸＶ．ＰＣＲ方法
いくつかの実施形態において、ホットスタートＰＣＲは、ＰＣＲ熱サイクル前の重合を減らすか、又は防止するために使用される。例示的なホットスタートＰＣＲ方法としては、ＤＮＡポリメラーゼの初期抑制、又は反応混合物がより高温に達するまでの反応構成要素の反応の物理的な分離を含む。いくつかの実施形態において、マグネシウムの遅延放出が使用される。ＤＮＡポリメラーゼは、活性のためにマグネシウムイオンを必要とするため、マグネシウムは、化学化合物に結合することによって反応から化学的に分離され、高温でのみ溶液中に放出される。いくつかの実施形態において、阻害剤の非共有結合が使用される。この方法では、ペプチド、抗体又はアプタマーは、低温で酵素に非共有結合し、その活性を阻害する。高温でインキュベートした後、阻害剤が放出され、反応が開始する。いくつかの実施形態において、冷温感受性Ｔａｑポリメラーゼ、例えば、低温ではほとんど活性を有しない修飾ＤＮＡポリメラーゼが使用される。いくつかの実施形態において、化学修飾が使用される。この方法では、分子が、ＤＮＡポリメラーゼの活性部位にあるアミノ酸の側鎖に共有結合する。この分子は、反応混合物を高温でインキュベートすることによって、酵素から放出される。分子が放出されると、酵素が活性化される。

【0150】

いくつかの実施形態において、核酸（例えば、ＲＮＡ又はＤＮＡサンプル）をテンプレートで組み立てるための量は、２０～５，０００ｎｇ、例えば、２０～２００、２００～４００、４００～６００、６００～１，０００、１，０００～１，５００又は２，０００～３，０００ｎｇ（境界値を含む）である。

【0151】

いくつかの実施形態において、ＱＩＡＧＥＮＭｕｌｔｉｐｌｅｘＰＣＲＫｉｔが使用される（ＱＩＡＧＥＮカタログ番号２０６１４３）。１００×５０μｌのマルチプレックスＰＣＲ反応について、キットは、２×ＱＩＡＧＥＮＭｕｌｔｉｐｌｅｘＰＣＲＭａｓｔｅｒＭｉｘ（３ｍＭＭｇＣｌ２の最終濃度を提供する、３×０．８５ｍｌ）、５×Ｑ－Ｓｏｌｕｔｉｏｎ（１×２．０ｍｌ）及びＲＮａｓｅ－ＦｒｅｅＷａｔｅｒ（２×１．７ｍｌ）を含む。ＱＩＡＧＥＮＭｕｌｔｉｐｌｅｘＰＣＲＭａｓｔｅｒＭｉｘ（ＭＭ）は、ＫＣｌ及び（ＮＨ_４）_２ＳＯ_４の組み合わせに加え、テンプレートでのプライマーの局所濃度を増加させるＰＣＲ添加剤ＦａｃｔｏｒＭＰを含有する。ＦａｃｔｏｒＭＰは、特異的に結合したプライマーを安定化させ、ＨｏｔＳｔａｒＴａｑＤＮＡＰｏｌｙｍｅｒａｓｅによる効率的なプライマー伸長を可能にする。ＨｏｔＳｔａｒＴａｑＤＮＡＰｏｌｙｍｅｒａｓｅは、ＴａｑＤＮＡポリメラーゼの修飾された形態であり、周囲温度でポリメラーゼ活性を有しない。いくつかの実施形態において、ＨｏｔＳｔａｒＴａｑＤＮＡＰｏｌｙｍｅｒａｓｅは、任意の既存のサーマルサイクラープログラムに組み込むことが可能な、９５℃で１５分間のインキュベーションによって活性化する。

【0152】

いくつかの実施形態において、１×ＱＩＡＧＥＮＭＭ最終濃度（推奨濃度）、７．５ｎＭのライブラリ中の各プライマー、５０ｍＭのＴＭＡＣ及び２０ｕｌの最終体積中の７ｕｌのＤＮＡテンプレートが使用される。いくつかの実施形態において、ＰＣＲ熱サイクル条件は、９５℃で１０分間（ホットスタート）、９６℃で３０秒間、６５℃で１５分間、７２℃で３０秒間を２０サイクル、その後７２℃で２分間（最終伸長）、次いで４℃で保持を含む。

【0153】

いくつかの実施形態において、２×ＱＩＡＧＥＮＭＭ最終濃度（推奨濃度の２倍）、２ｎＭのライブラリ中の各プライマー、７０ｍＭのＴＭＡＣ及び２０ｕｌの全体積中の７ｕｌのＤＮＡテンプレートが使用される。いくつかの実施形態において、４ｍＭまでのＥＤＴＡも含まれる。いくつかの実施形態において、ＰＣＲ熱サイクル条件は、９５℃で１０分間（ホットスタート）、９６℃で３０秒間、６５℃で２０、２５、３０、４５、６０、１２０又は１８０分間、場合により７２℃で３０秒間を２５サイクル）、その後７２℃で２分間（最終伸長）、次いで４℃で保持を含む。

【0154】

条件の別の例示的なセットは、セミネスティッドＰＣＲ手法を含む。第１のＰＣＲ反応は、２×ＱＩＡＧＥＮＭＭ最終濃度、１．８７５ｎＭのライブラリ中の各プライマー（順方向及び逆方向のアウタープライマー）及びＤＮＡテンプレートを含む、２０ｕｌの反応体積を使用する。熱サイクルパラメータは、９５℃で１０分間、９６℃で３０秒間、６５℃で１分間、５８℃で６分間、６０℃で８分間、６５℃で４分間及び７２℃で３０秒間を２５サイクル、次いで７２℃で２分間、次いで４℃で保持を含む。次に、１：２００に希釈された、得られた産物２ｕｌを、第２のＰＣＲ反応のインプットとして使用する。この反応は、１×ＱＩＡＧＥＮＭＭ最終濃度、２０ｎＭの各インナー順方向プライマー及び１ｕＭの逆方向プライマータグを含む、１０ｕｌの反応体積を使用する。熱サイクルパラメータは、９５℃で１０分間、９５℃で３０秒間、６５℃で１分間、６０℃で５分間、６５℃で５分間及び７２℃で３０秒間を１５サイクル、次いで７２℃で２分間、次いで４℃で保持を含む。アニーリング温度は、任意選択的に、本明細書で考察されるように、プライマーのいくつか又は全ての融点より高くてもよい（その全体が本明細書に参考として組み込まれる、２０１５年１０月２０日に出願された米国特許出願第１４／９１８，５４４号を参照）。

【0155】

融点（Ｔ_ｍ）は、オリゴヌクレオチド（例えばプライマー）及びその完全相補体のＤＮＡ二本鎖の半分（５０％）が解離し、一本鎖ＤＮＡになる温度である。アニーリング温度（Ｔ_Ａ）は、ＰＣＲプロトコルを実行する温度である。従来の方法について、この温度は、通常は、使用するプライマーの最も低いＴ_ｍより５℃低いため、全ての可能な二本鎖に近いものが形成される（その結果、実質的に全てのプライマー分子が、テンプレート核酸に結合する）。これは、高効率ではあるが、より低い温度では、より多くの非特異的反応が生じることが確実である。Ｔ_Ａが低すぎることの結果の１つは、内部の単一塩基ミスマッチ又は部分的アニーリングが許容され得るため、プライマーが真の標的以外の配列にアニーリングし得ることである。本発明のいくつかの実施形態において、Ｔ_ＡはＴ_ｍより高く、所与の瞬間に、標的のわずかな部分のみが、アニーリングされたプライマーを有する（例えば、約１～５％のみ）。これらが伸長されると、プライマー及び標的のアニーリング及び解離の平衡から除去され（伸長は、Ｔ_ｍを７０℃より上まで迅速に増加させるため）、標的の新しい約１～５％がプライマーを有する。したがって、アニーリングのために反応を長時間行うことによって、サイクルごとにコピーされる標的の約１００％を得ることができる。

【0156】

様々な実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、６０、７０、７５、８０、９０、９５又は１００％の融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３℃から範囲の上限で２、３、４、５、６、７、８、９、１０、１１、１２、１３で又は１５℃高い。様々な実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、又は全ての融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、５～１０、５～８、８～１０、１０～１２又は１２～１５℃（境界値を含む））高い。様々な実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５％、５０％、６０％、７０％、７５％、８０％、９０％、９５％又は全ての融点（例えば、経験的に測定されたか、又は計算されたＴｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、３～８、５～１０、５～８、８～１０、１０～１２又は１２～１５℃（境界値を含む））高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、５～１８０分間、例えば、１５～１２０分間、１５～６０分間、１５～４５分間又は２０～６０分間（境界値を含む）である。

【0157】

ＸＶＩ．例示的なマルチプレックスＰＣＲ方法
様々な実施形態において、長いアニーリング時間（本明細書で考察され、実施例１０に例示されるとおり）及び／又は低いプライマー濃度を使用する。実際に、特定の実施形態において、制限されたプライマー濃度及び／又は条件が使用される。様々な実施形態において、アニーリング工程の長さは、範囲の下限で１５、２０、２５、３０、３５、４０、４５又は６０分間から、範囲の上限で２０、２５、３０、３５、４０、４５、６０、１２０又は１８０分間である。様々な実施形態において、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、３０～１８０分間である。例えば、アニーリング工程は、３０～６０分間であってもよく、各プライマーの濃度は、２０、１５、１０又は５ｎＭ未満であってもよい。他の実施形態において、プライマー濃度は、範囲の下限で１、２、３、４、５、６、７、８、９、１０、１５、２０又は２５ｎＭから、範囲の上限で２、３、４、５、６、７、８、９、１０、１５、２０、２５及び５０ｎＭである。

【0158】

高レベルの多重化では、溶液中の多量のプライマーに起因して、溶液が粘性になる場合がある。溶液が粘性すぎる場合、プライマー濃度を、プライマーがテンプレートＤＮＡに結合するのに依然として十分な量まで下げてもよい。様々な実施形態において、１，０００～１００，０００種類の異なるプライマーが使用され、各プライマーの濃度は、２０ｎＭ未満、例えば１０ｎＭ未満又は１～１０ｎＭ（境界値を含む）である。

【0159】

ＸＶＩＩ．コピー数多型（ＣＮＶ）の検出
ＳＮＶ及びインデルに加え、本明細書に記載される早期再発及び転移のモニタリング及び検出の方法も、ＣＮＶの検出から利益を得ることができる。

【0160】

一態様において、本発明は、一般的に、少なくとも一部には、コピー数多型（例えば、染色体セグメント又は染色体全体の欠失又は重複）の有無を決定する改良された方法に関する。この方法は、特に、関連する染色体セグメントから入手可能なデータが少数であることに起因して、従来の方法を用いて高い特異性及び感度で検出することが困難な場合がある小さな欠失又は重複を検出するのに有用である。この方法は、改善された分析方法、改善されたバイオアッセイ方法、及び改善された分析方法とバイオアッセイ方法の組み合わせを含む。本発明の方法は、試験される細胞又は核酸分子のわずかな割合にのみ存在する欠失又は重複を検出するのにも使用することができる。このことは、疾患の発生前に（例えば、前がん状態で）、又は疾患の早期、例えば、欠失又は重複を伴う多数の疾患細胞（例えばがん細胞）が蓄積する前に、欠失又は重複を検出することを可能にする。疾患又は障害に関連する欠失又は重複の更に正確な検出は、その疾患又は障害を診断し、予知し、予防し、遅らせ、安定化させ、又は治療するための改善された方法を可能にする。いくつかの欠失又は重複は、がん又は重篤な知的障害又は身体障害と関連することが知られている。

【0161】

ＸＶＩＩＩ．ＳＮＶ検出
別の態様において、本発明は、一般的に、少なくとも一部には、単一ヌクレオチドバリアント（ＳＮＶ）を検出する改善された方法に関する。これらの改善された方法は、改善された分析方法、改善されたバイオアッセイ方法、及び改善された分析方法とバイオアッセイ方法の組み合わせを使用する改善された方法を含む。特定の例示的な実施形態において、本方法を使用して、例えば、ＳＮＶが非常に低濃度で（例えば、ＳＮＶ遺伝子座の正常コピーの総数に対して１０％、５％、４％、３％、２．５％、２％、１％、０．５％、０．２５％又は０．１％未満で）存在するサンプル（例えば、循環遊離ＤＮＡサンプル）中のがんを検出し、診断し、モニタリングし、又はステージを決定する。すなわち、これらの方法は、特定の例示的な実施形態において、遺伝子座について存在する正常な多型対立遺伝子に対して比較的低い割合の変異又はバリアントが存在するサンプルに特に十分に適している。最後に、コピー数多型を検出するための改善された方法を、単一ヌクレオチドバリアントを検出するための改善された方法と組み合わせた方法が本明細書で提供される。

【0162】

がんなどの疾患の治療の成功は、多くは、早期診断、疾患の正しいステージ決定、有効な治療レジメンの選択、再発を予防又は検出するための密接なモニタリングに依存する。がん診断について、組織生検から得られる腫瘍物質の組織学的評価が、最も信頼性の高い方法であると考えられることが多い。しかし、生検に基づくサンプリングの侵襲的性質により、大量スクリーニング及び定期的なフォローアップには実用的ではない。したがって、本方法は、比較的低コストであり、かつターンアラウンドタイムが速いことが望まれる場合に、非侵襲的に行うことができるという利点を有する。本発明の方法によって使用可能な標的化配列決定は、ショットガン配列決定よりも少ないリード（例えば、４０００万リードではなく、数百リード）を必要とし、それによって、コストを減らす。マルチプレックスＰＣＲ及び使用可能な次世代配列決定は、スループットを増加させ、コストを減らす。

【0163】

いくつかの例示的な実施形態において、ｃｔＤＮＡにおけるＡＡＩパターンの分析は、腫瘍のクローンアーキテクチャのより詳細な洞察を提供し、その治療応答を予測し、治療戦略を最適化するのに役立つ。したがって、特定の実施形態において、臨床的に発症原因となるＣＮＶ及びＳＮＶを標的とするｍｍＰＣＲ－ＮＧＳパネルが選択される。このようなパネルは、特定の例示的な実施形態において、乳がん、卵巣がん及び肺がんにおいて一般的であるように、ＣＮＶが変異負荷の実質的な割合を表すがんを有する患者に特に有用である。

【0164】

いくつかの実施形態において、本方法は、個体における欠失、重複又は単一ヌクレオチドバリアントを検出するために使用される。欠失、重複又は単一ヌクレオチドバリアントを有することが疑われる細胞又は核酸を含有する個体由来のサンプルを分析してもよい。いくつかの実施形態において、サンプルは、欠失、重複又は単一ヌクレオチドバリアントを有することが疑われる組織又は臓器、例えば、がん性であることが疑われる細胞又は塊に由来する。本発明の方法を使用して、欠失、重複又は単一ヌクレオチドバリアントを有する細胞と、欠失、重複又は単一ヌクレオチドバリアントを有しない細胞とを含有する混合物において、１つの細胞又は少数の細胞にのみ存在する欠失、重複又は単一ヌクレオチドバリアントを検出することができる。いくつかの実施形態において、個体由来の血液サンプルからのｃｆＤＮＡ又はｃｆＲＮＡが分析される。いくつかの実施形態において、ｃｆＤＮＡ又はｃｆＲＮＡは、細胞（例えばがん細胞）によって分泌される。いくつかの実施形態において、ｃｆＤＮＡ又はｃｆＲＮＡは、壊死又はアポトーシスを受けている細胞（例えばがん細胞）によって放出される。本発明の方法を使用して、わずかな割合のｃｆＤＮＡ又はｃｆＲＮＡ中にのみ存在する欠失、重複又は単一ヌクレオチドバリアントを検出することができる。いくつかの実施形態において、胚由来の１つ以上の細胞が試験される。

【0165】

コピー数多型の有無を決定することに加え、所望な場合に、１つ以上の他の因子を分析してもよい。これらの因子を使用して、診断の精度（例えば、がんの有無又はがんのリスク上昇を決定すること、がんを分類すること、又はがんのステージを決定すること）又は予後の精度を高めることができる。これらの因子は、被験体において有効である可能性が高い特定の療法又は治療レジメンを選択するためにも使用することができる。例示的な因子としては、多型又は変異の有無、全体又は特定のｃｆＤＮＡ、ｃｆＲＮＡ、マイクロＲＮＡ（ｍｉＲＮＡ）のレベル変化（増加又は減少）、腫瘍画分の変化（増加又は減少）、メチル化レベルの変化（増加又は減少）、ＤＮＡ完全性の変化（増加又は減少）、変化（増加又は減少）又は代替的なｍＲＮＡスプライシングが挙げられる。

【0166】

以下の章は、フェージングデータ（例えば、推論又は測定されたフェージングデータ）又は非フェージングデータを用いて欠失又は重複を検出する方法、試験可能なサンプル、サンプル調製、増幅及び定量化の方法、遺伝子データをフェージングする方法、検出可能な多型、変異、核酸変化、ｍＲＮＡスプライシングの変化及び核酸レベルにおける変化、本方法、他のリスク因子及びスクリーニング方法から得られるデータベース、診断又は治療が可能ながん、がん治療、治療を試験するためのがんモデル、及び治療を処方し、行うための方法を記載する。

【0167】

ＸＩＸ．例示的な実施形態
Ａ．フェージングデータを使用して倍数性を決定するための例示的な方法
本発明の方法のいくつかは、一部には、ＣＮＶを検出するためにフェージングデータを用いると、非フェージングデータを用いる場合と比較して、偽陰性率及び偽陽性率が減少するという発見に基づく。この改善は、低レベルで存在するＣＮＶを有するサンプルにとって、最大のものである。したがって、フェージングデータは、非フェージングデータを用いる場合（例えば、１つ以上の遺伝子座での対立遺伝子比率を計算するか、又は異なる遺伝子座での対立遺伝子比率が、異常な量で同じ又は異なるハプロタイプが存在するように見えることを示すかどうかを考慮することなく、対立遺伝子比率を集計して、染色体又は染色体セグメントにわたる集計値（例えば平均値）を与える方法）と比較して、ＣＮＶ検出の精度を高める。フェージングデータを使用することにより、対立遺伝子比率の測定値と対立遺伝子比率の予測値との間の差が、ノイズに起因するか、又はＣＮＶの存在に起因するかについて、より正確な決定を行うことが可能になる。例えば、ある領域内の遺伝子座の大部分又は全てで、対立遺伝子比率の測定値と対立遺伝子比率の予測値との間の差が、サンプルハプロタイプが過剰出現されていることを示す場合、ＣＮＶが存在する可能性が高い。ハプロタイプにおける対立遺伝子間の結合を使用することにより、測定された遺伝子データが、（ランダムノイズではなく）過剰出現しているのと同じハプロタイプに一致するかどうかを決定することができる。これとは対照的に、対立遺伝子比率の測定値と対立遺伝子比率の予測値との間の差が、ノイズ（例えば実験誤差）にのみ起因する場合、いくつかの実施形態において、約半分の時間は、第１のハプロタイプが過剰出現するように見え、他方の約半分の時間は、第２のハプロタイプが過剰出現するように見える。

【0168】

いくつかの実施形態において、フェージング遺伝子データを使用して、個体のゲノムにおいて（例えば、１つ以上の細胞のゲノムにおいて、又はｃｆＤＮＡ又はｃｆＲＮＡにおいて）、第２の相同染色体セグメントと比較して、第１の相同染色体セグメントのコピー数の過剰出現が存在するかどうかを決定する。例示的な過剰出現としては、第１の相同染色体セグメントの重複又は第２の相同染色体セグメントの欠失が挙げられる。いくつかの実施形態において、第１の染色体セグメントと相同染色体セグメントが等しい割合で存在するため、過剰出現は存在しない（例えば、二倍体サンプル中の各セグメントの１つのコピー）。いくつかの実施形態において、核酸サンプルにおいて対立遺伝子比率の計算値を、対立遺伝子比率の予測値と比較して、以下に更に記載するような過剰出現が存在するかどうかを決定する。本明細書において、「第２の相同染色体セグメントと比較した場合の第１の相同染色体セグメント」との句は、染色体セグメントの第１のホモログ及び染色体セグメントの第２のホモログを意味する。

【0169】

いくつかの実施形態において、本方法は、第１の相同染色体セグメント上の多型遺伝子座のセット中の各々の遺伝子座について、第１の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の同一性を含む、第１の相同染色体セグメントについてのフェージング遺伝子データを得ることと、第２の相同染色体セグメント上の多型遺伝子座のセット中の各々の遺伝子座について、第２の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の同一性を含む、第２の相同染色体セグメントについてのフェージング遺伝子データを得ることと、上述の多型遺伝子座のセット中の各々の遺伝子座にある各々の対立遺伝子について、個体からの１つ以上の標的細胞及び１つ以上の非標的細胞からのＤＮＡ又はＲＮＡのサンプル中に存在する各々の対立遺伝子の量を含む、測定された遺伝子対立遺伝子データを得ることと、を含む。いくつかの実施形態において、本方法は、第１の相同染色体セグメントの過剰出現の程度を示す１つ以上の仮説のセットを列挙することと、上述の各々の仮説について、サンプル中の総ＤＮＡ又はＲＮＡに対する、１つ以上の標的細胞からのＤＮＡ又はＲＮＡの１つ以上の可能な比率について得られたフェージング遺伝子データから、サンプル中の複数の遺伝子座について予測された遺伝子データを計算することと、各々のＤＮＡ又はＲＮＡの可能な比率について、かつ、各々の仮説について、サンプルの得られた遺伝子データと、そのＤＮＡ又はＲＮＡの可能な比率について、かつ、その仮説についてのサンプルについて予測される遺伝子データとの間のデータフィッティングを計算する（例えば、コンピュータで計算する）ことと、このデータフィッティングに従い、上述の１つ以上の仮説をランク付けすることと、最も高くランク付けされた仮説を選択することによって、個体からの１つ以上の細胞のゲノム中の第１の相同染色体セグメントのコピー数の過剰出現の程度を決定することと、を含む。

【0170】

いくつかの実施形態において、本方法は、本明細書に記載される方法のいずれか、又は任意の既知の方法を用いてフェージング遺伝子データを得ることを伴う。いくつかの実施形態において、本方法は、同時に、又は任意の順序で連続して、（ｉ）第１の相同染色体セグメント上の多型遺伝子座のセット中の各々の遺伝子座について、第１の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の同一性を含む、第１の相同染色体セグメントについてのフェージング遺伝子データを得ることと、（ｉｉ）第２の相同染色体セグメント上の多型遺伝子座のセット中の各々の遺伝子座について、第２の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の同一性を含む、第２の相同染色体セグメントについてのフェージング遺伝子データを得ることと、（ｉｉｉ）個体からの１つ以上の細胞からのＤＮＡのサンプル中の多型遺伝子座のセット中の各々の遺伝子座についての各々の対立遺伝子の量を含む、測定された遺伝子対立遺伝子データを得ることと、を伴う。

【0171】

いくつかの実施形態において、本方法は、サンプルの由来となる少なくとも１つの細胞においてヘテロ接合性である多型遺伝子座のセット中の１つ以上の遺伝子座についての対立遺伝子比率を計算することを伴う。いくつかの実施形態において、特定の遺伝子座について対立遺伝子比率の計算値は、対立遺伝子の１つの測定量を、その遺伝子座についての全ての対立遺伝子の総測定量によって割り算したものである。いくつかの実施形態において、特定の遺伝子座について対立遺伝子比率の計算値は、対立遺伝子（例えば、第１の相同染色体セグメント上の対立遺伝子）の１つの測定量を、その遺伝子座についての１つ以上の他の対立遺伝子（例えば、第２の相同染色体セグメント上の対立遺伝子）の測定量によって割り算したものである。対立遺伝子比率の計算値は、本明細書に記載される方法のいずれか、又は任意の標準的な方法（例えば、本明細書に記載される対立遺伝子比率の計算値の任意の数学的変換）を用いて計算されてもよい。

【0172】

いくつかの実施形態において、本方法は、第１の相同染色体セグメントと第２の相同染色体セグメントが同じ割合で存在する場合、ある遺伝子座についての１つ以上の対立遺伝子比率の計算値を、その遺伝子座について予測される対立遺伝子比率と比較することによって、第１の相同染色体セグメントのコピー数の過剰出現が存在するかどうかを決定することを伴う。いくつかの実施形態において、対立遺伝子比率の予測値は、ある遺伝子座についての可能な複数の対立遺伝子が存在する尤度が等しいと仮定する。ある特定の遺伝子座についての対立遺伝子比率の計算値が、対立遺伝子の１つの測定量をその遺伝子座についての全ての対立遺伝子の総測定量で割り算したものであるいくつかの実施形態において、対応する対立遺伝子比率の予測値は、二対立遺伝子座について０．５であるか、又は三対立遺伝子座について１／３である。いくつかの実施形態において、対立遺伝子比率の予測値は、全ての遺伝子座について同じであり、例えば、全ての遺伝子座について０．５である。いくつかの実施形態において、対立遺伝子比率の予測値は、ある遺伝子座についての可能な対立遺伝子が存在する尤度、例えば、被験体が属する特定の集合（例えば、被験体の祖先に基づく集合）における各々の対立遺伝子の頻度に基づく尤度が異なる場合があると仮定する。このような対立遺伝子頻度は、公的に利用可能である（例えば、ＨａｐＭａｐＰｒｏｊｅｃｔ；ＰｅｒｌｅｇｅｎＨｕｍａｎＨａｐｌｏｔｙｐｅＰｒｏｊｅｃｔ；ウェブｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｐｒｏｊｅｃｔｓ／ＳＮＰ／；ＳｈｅｒｒｙＳＴ，ＷａｒｄＭＨ，ＫｈｏｌｏｄｏｖＭ，ｅｔａｌ．ｄｂＳＮＰ：ｔｈｅＮＣＢＩｄａｔａｂａｓｅｏｆｇｅｎｅｔｉｃｖａｒｉａｔｉｏｎ．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２００１年１月１日；２９（１）：３０８－１１を参照、各々、その全体が参照による本明細書に組み込まれる）。いくつかの実施形態において、対立遺伝子比率の予測値は、第１の相同染色体セグメントの過剰出現の程度を示す特定の仮説について試験される特定の個体について予測される対立遺伝子比率である。例えば、ある特定の個体についての対立遺伝子比率の予測値は、その個体からのフェージング遺伝子データ又は非フェージング遺伝子データ（例えば、非がん性サンプルなどの欠失又は重複を有する可能性が低い、その個体からのサンプル）、又はその個体からの１名以上の血縁者からのデータに基づいて決定されてもよい。

【0173】

いくつかの実施形態において、対立遺伝子比率の計算値は、（ｉ）第１の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の測定量についての対立遺伝子比率を、その遺伝子座についての全ての対立遺伝子の総測定量で割り算したものが、その遺伝子座についての対立遺伝子比率の予測値より大きい場合、又は（ｉｉ）第２の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の測定量についての対立遺伝子比率を、その遺伝子座についての全ての対立遺伝子の総測定量で割り算したものが、その遺伝子座についての対立遺伝子比率の予測値より小さい場合のいずれかの場合、第１の相同染色体セグメントのコピー数の過剰出現の指標である。いくつかの実施形態において、対立遺伝子比率の計算値は、その遺伝子座についての比率の予測値より顕著に大きいか、又は小さい場合にのみ、過剰出現の指標であると考えられる。いくつかの実施形態において、対立遺伝子比率の計算値は、（ｉ）第１の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の測定量についての対立遺伝子比率を、その遺伝子座についての全ての対立遺伝子の総測定量で割り算したものが、その遺伝子座についての対立遺伝子比率の予測値より小さいか、又は等しい場合、又は（ｉｉ）第２の相同染色体セグメント上の遺伝子座に存在する対立遺伝子の測定量についての対立遺伝子比率を、その遺伝子座についての全ての対立遺伝子の総測定量で割り算したものが、その遺伝子座についての対立遺伝子比率の予測値より大きいか、又は等しい場合のいずれかの場合、第１の相同染色体セグメントのコピー数の過剰出現がないことの指標である。いくつかの実施形態において、対応する比率の予測値に等しい、比率の計算値は、無視される（これらは、過剰出現がないことの指標であるため）。

【0174】

様々な実施形態において、以下の方法のうち１つ以上を使用して、対立遺伝子比率の計算値のうちの１つ以上を、対応する対立遺伝子比率の予測値と比較する。いくつかの実施形態において、対立遺伝子比率の計算値が、その差の大きさにかかわらず、特定の遺伝子座についての対立遺伝子比率の予測値を上回るか、又は下回るかを決定する。いくつかの実施形態において、対立遺伝子比率の計算値が、対立遺伝子比率の予測値を上回るか、又は下回るかにかかわらず、対立遺伝子比率の計算値と、ある特定の遺伝子座についての対立遺伝子比率の予測値との差の大きさを決定する。いくつかの実施形態において、対立遺伝子比率の計算値が、対立遺伝子比率の予測値を上回るか、又は下回るか、及びある特定の遺伝子座についてのその差の大きさを決定する。いくつかの実施形態において、対立遺伝子比率の計算値の平均又は重み付けされた平均値が、その差の大きさにかかわらず、対立遺伝子比率の予測値の平均又は重み付けされた平均値を上回るか、又は下回るかを決定する。いくつかの実施形態において、対立遺伝子比率の計算値の平均又は重み付けされた平均値が、対立遺伝子比率の予測値の平均又は重み付けされた平均値を上回るか、又は下回るかにかかわらず、対立遺伝子比率の計算値の平均又は重み付けされた平均値と、対立遺伝子比率の予測値の平均又は重み付けされた平均値との差の大きさを決定する。いくつかの実施形態において、対立遺伝子比率の計算値の平均又は重み付けされた平均値が、対立遺伝子比率の予測値の平均又は重み付けされた平均値を上回るか、又は下回るか、及びその差の大きさを決定する。いくつかの実施形態において、対立遺伝子比率の計算値と対立遺伝子比率の予測値との差の大きさの平均又は重み付けされた平均値を決定する。

【0175】

いくつかの実施形態において、対立遺伝子比率の計算値と１つ以上の遺伝子座についての対立遺伝子比率の予測値との差の大きさを使用して、第１の相同染色体セグメントのコピー数の過剰出現が、１つ以上の細胞のゲノム中の第１の相同染色体セグメントの重複又は第２の相同染色体セグメントの欠失に起因するものであるかどうかを決定する。

【0176】

いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現は、以下の条件のうちの１つ以上が満たされる場合に、存在すると決定される。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現の指標である対立遺伝子比率の計算値の数値は、閾値を上回る。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現がないことの指標である対立遺伝子比率の計算値の数値は、閾値を下回る。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現の指標である対立遺伝子比率の計算値と、対応する対立遺伝子比率の予測値との差の大きさは、閾値を上回る。いくつかの実施形態において、過剰出現の指標である全ての対立遺伝子比率の計算値について、対立遺伝子比率の計算値と対応する対立遺伝子比率の予測値との差の大きさの合計が、閾値を上回る。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現がないことの指標である対立遺伝子比率の計算値と、対応する対立遺伝子比率の予測値との差の大きさは、閾値を下回る。いくつかの実施形態において、第１の相同染色体セグメント上に存在する対立遺伝子の測定量についての対立遺伝子比率の計算値の平均又は重み付けされた平均値を、その遺伝子座についての全ての対立遺伝子の総測定量で割り算したものが、対立遺伝子比率の予測値の平均又は重み付けされた平均値より少なくとも１つの閾値だけ大きい。いくつかの実施形態において、第２の相同染色体セグメント上に存在する対立遺伝子の測定量についての対立遺伝子比率の計算値の平均又は重み付けされた平均値を、その遺伝子座についての全ての対立遺伝子の総測定量で割り算したものが、対立遺伝子比率の予測値の平均又は重み付けされた平均値より少なくとも１つの閾値だけ小さい。いくつかの実施形態において、対立遺伝子比率の計算値と、第１の相同染色体セグメントのコピー数の過剰出現について予測される対立遺伝子比率との間のデータフィッティングは、閾値を下回る（良好なデータフィッティングの指標である）。いくつかの実施形態において、対立遺伝子比率の計算値と、第１の相同染色体セグメントのコピー数の過剰出現がないことについて予測される対立遺伝子比率との間のデータフィッティングは、閾値を上回る（データフィッティング不良の指標である）。

【0177】

いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現は、以下の条件のうちの１つ以上が満たされる場合に、存在しないと決定される。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現の指標である対立遺伝子比率の計算値の数値は、閾値を下回る。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現がないことの指標である対立遺伝子比率の計算値の数値は、閾値を上回る。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現の指標である対立遺伝子比率の計算値と、対応する対立遺伝子比率の予測値との差の大きさは、閾値を下回る。いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現がないことの指標である対立遺伝子比率の計算値と、対応する対立遺伝子比率の予測値との差の大きさは、閾値を上回る。いくつかの実施形態において、第１の相同染色体セグメント上に存在する対立遺伝子の測定量についての対立遺伝子比率の計算値の平均又は重み付けされた平均値を、その遺伝子座についての全ての対立遺伝子の総測定量で割り算し、対立遺伝子比率の予測値の平均又は重み付けされた平均値を引いたものが、閾値を下回る。いくつかの実施形態において、対立遺伝子比率の予測値の平均又は重み付けされた平均値から、第２の相同染色体セグメント上に存在する対立遺伝子の測定量についての対立遺伝子比率の計算値の平均又は重み付けされた平均値を引き算し、その遺伝子座についての全ての対立遺伝子の総測定量で割り算したものが、閾値を下回る。いくつかの実施形態において、対立遺伝子比率の計算値と、第１の相同染色体セグメントのコピー数の過剰出現について予測される対立遺伝子比率との間のデータフィッティングは、閾値を上回る。いくつかの実施形態において、対立遺伝子比率の計算値と、第１の相同染色体セグメントのコピー数の過剰出現がないことについて予測される対立遺伝子比率との間のデータフィッティングは、閾値を下回る。いくつかの実施形態において、閾値は、目的のＣＮＶを有することが知られているサンプル及び／又はＣＮＶを欠くことが知られているサンプルの経験的な試験から決定される。

【0178】

いくつかの実施形態において、第１の相同染色体セグメントのコピー数の過剰出現が存在するかどうかを決定することは、第１の相同染色体セグメントの過剰出現の程度を示す１つ以上の仮説のセットを列挙することを含む。例示的な仮説では、第１の染色体セグメントと相同な染色体セグメントが等しい割合（二倍体サンプル中の各セグメントの１コピーなど）で存在するため、過剰出現は存在しない。他の例示的な仮説は、１回以上複製される第１の相同染色体セグメント（例えば、第２の相同染色体セグメントのコピー数と比較して、第１の相同染色体セグメントの１、２、３、４、５又はもっと多い過剰なコピー）を含む。別の例示的な仮説は、第２の相同染色体セグメントの欠失を含む。更に別の例示的な仮説は、第１及び第２の相同染色体セグメントの両方の欠失である。いくつかの実施形態において、少なくとも１つの細胞においてヘテロ接合性である遺伝子座についての対立遺伝子比率の予測値は、各々の仮説について、その仮説によって示される過剰出現の程度を考慮して、推定される。いくつかの実施形態において、その仮説が正しい尤度は、対立遺伝子比率の計算値と対立遺伝子比率の予測値とを比較することによって計算され、最大の尤度を有する仮説が選択される。

【0179】

いくつかの実施形態において、試験統計の予測分布（ｅｘｐｅｃｔｅｄｄｉｓｔｒｉｂｕｔｉｏｎ）は、各仮説についての対立遺伝子比率の予測値を用いて計算される。いくつかの実施形態において、その仮説が正しい尤度は、対立遺伝子比率の計算値を用いて計算される試験統計と、対立遺伝子比率の予測値を用いて計算される試験統計の予測分布とを比較することによって計算され、最大の尤度を有する仮説が選択される。

【0180】

いくつかの実施形態において、少なくとも１つの細胞においてヘテロ接合性である遺伝子座についての対立遺伝子比率の予測値は、第１の相同染色体セグメントについてのフェージング遺伝子データ、第２の相同染色体セグメントについてのフェージング遺伝子データ、及びその仮説によって示される過剰出現の程度を考慮して、推定される。いくつかの実施形態において、その仮説が正しい尤度は、対立遺伝子比率の計算値と対立遺伝子比率の予測値とを比較することによって計算され、最大の尤度を有する仮説が選択される。

【0181】

Ｂ．混合サンプルの使用
多くの実施形態について、サンプルは、１つ以上の標的細胞及び１つ以上の非標的細胞からのＤＮＡ又はＲＮＡを含む混合サンプルであることが理解されるだろう。いくつかの実施形態において、標的細胞は、ＣＮＶ（例えば、目的の欠失又は重複）を有する細胞であり、非標的細胞は、目的のコピー数多型を有しない細胞である（例えば、目的の欠失又は重複を有する細胞と、試験される欠失又は重複のいずれも含まない細胞との混合物）。いくつかの実施形態において、標的細胞は、ある疾患若しくは障害又は疾患若しくは障害のリスク上昇に関連する細胞（例えば、がん細胞）であり、非標的細胞は、ある疾患若しくは障害又は疾患若しくは障害のリスク上昇に関連しない細胞（例えば、非がん性細胞）である。いくつかの実施形態において、標的細胞は全て同じＣＮＶを有する。いくつかの実施形態において、２つ以上の標的細胞は、異なるＣＮＶを有する。いくつかの実施形態において、標的細胞のうちの１つ以上は、少なくとも１つの他の標的細胞では見られない、その疾患若しくは障害又は疾患若しくは障害のリスク上昇に関連するＣＮＶ、多型又は変異を有する。いくつかのこのような実施形態において、サンプルからの全細胞の中で、その疾患若しくは障害又は疾患若しくは障害のリスク上昇に関連する細胞の一部は、そのサンプル中のこれらのＣＮＶ、多型又は変異の最も頻度が高い部分より大きいか、又はこれに等しいと仮定される。例えば、細胞の６％がＫ－ｒａｓ変異を有し、細胞の８％がＢＲＡＦ変異を有する場合、細胞の少なくとも８％ががん性であると仮定される。

【0182】

いくつかの実施形態において、サンプル中の総ＤＮＡ（又はＲＮＡ）に対する１つ以上の標的細胞からのＤＮＡ（又はＲＮＡ）の比率が計算される。いくつかの実施形態において、第１の相同染色体セグメントの過剰出現の程度を示す１つ以上の仮説のセットが列挙される。いくつかの実施形態において、少なくとも１つの細胞においてヘテロ接合性である遺伝子座についての対立遺伝子比率の予測値は、ＤＮＡ又はＲＮＡの比率の計算値を考慮して推定され、その仮説によって示される過剰出現の程度が、各仮説について推定される。いくつかの実施形態において、その仮説が正しい尤度は、対立遺伝子比率の計算値と対立遺伝子比率の予測値とを比較することによって計算され、最大の尤度を有する仮説が選択される。

【0183】

いくつかの実施形態において、対立遺伝子比率の予測値及びＤＮＡ又はＲＮＡの比率の計算値を用いて計算された試験統計の予測分布が、各仮説について推定される。いくつかの実施形態において、その仮説が正しい尤度は、対立遺伝子比率の計算値及びＤＮＡ又はＲＮＡの比率の計算値を用いて計算される試験統計と、対立遺伝子比率の予測値及びＤＮＡ又はＲＮＡの比率の計算値を用いて計算される試験統計の予測分布とを比較することによって決定され、最大の尤度を有する仮説が選択される。

【0184】

いくつかの実施形態において、本方法は、第１の相同染色体セグメントの過剰出現の程度を示す１つ以上の仮説のセットを列挙することを含む。いくつかの実施形態において、本方法は、各仮説について、（ｉ）その仮説によって示される過剰出現の程度を考慮した、少なくとも１つの細胞においてヘテロ接合性である遺伝子座についての対立遺伝子比率の予測値、又は（ｉｉ）ＤＮＡ又はＲＮＡの１つ以上の可能な比率について、対立遺伝子比率の予測値及びサンプル中の総ＤＮＡ又はＲＮＡに対する１つ以上の標的細胞からのＤＮＡ又はＲＮＡの可能な比率を用いて計算された試験統計の予測分布のいずれかを推定することを含む。いくつかの実施形態において、データフィッティングは、（ｉ）対立遺伝子比率の計算値を、対立遺伝子比率の予測値、又は（ｉｉ）対立遺伝子比率の計算値及びＤＮＡ又はＲＮＡの可能な比率を用いて計算された試験統計のいずれかを、対立遺伝子比率の予測値及びＤＮＡ又はＲＮＡの可能な比率を用いて計算された試験統計の予測分布と比較することによって計算される。いくつかの実施形態において、仮説のうちの１つ以上は、データフィッティングに従ってランク付けされ、最も高くランク付けされた仮説が選択される。いくつかの実施形態において、検索アルゴリズムなどの技術又はアルゴリズムは、データフィッティングを計算する工程、仮説をランク付けする工程、又は最も高くランク付けされた仮説を選択する工程のうちの１つ以上のために使用される。いくつかの実施形態において、データフィッティングは、ベータ二項分布に対するフィッティング又は二項分布に対するフィッティングである。いくつかの実施形態において、この技術又はアルゴリズムは、最大尤度の推定、経験的な最大推定、ベイズ推定、動的推定（例えば、動的ベイズ推定）及び期待最大化推定からなる群から選択される。いくつかの実施形態において、本方法は、得られた遺伝子データと遺伝子データの予測値に対して、上述の技術又はアルゴリズムを適用することを含む。

【0185】

いくつかの実施形態において、本方法は、サンプル中の総ＤＮＡ又はＲＮＡに対する１つ以上の標的細胞からのＤＮＡ又はＲＮＡの比率について、下限から上限までの範囲の可能な比率の分配を作成することを含む。いくつかの実施形態において、第１の相同染色体セグメントの過剰出現の程度を示す１つ以上の仮説のセットが列挙される。いくつかの実施形態において、本方法は、分配におけるＤＮＡ又はＲＮＡの可能な比率の各々について、また、各仮説について、（ｉ）ＤＮＡ又はＲＮＡの可能な比率及びその仮説によって示される過剰出現の程度を考慮した、少なくとも１つの細胞においてヘテロ接合性である遺伝子座についての対立遺伝子比率の予測値、又は（ｉｉ）対立遺伝子比率の予測値及びＤＮＡ又はＲＮＡの可能な比率を用いて計算される試験確率の予測分布のいずれかを推定することを含む。いくつかの実施形態において、本方法は、分配におけるＤＮＡ又はＲＮＡの可能な比率の各々について、また、各仮説について、（ｉ）対立遺伝子比率の計算値を、対立遺伝子比率の予測値、又は（ｉｉ）対立遺伝子比率の計算値及びＤＮＡ又はＲＮＡの可能な比率を用いて計算された試験統計のいずれかを、対立遺伝子比率の予測値及びＤＮＡ又はＲＮＡの可能な比率を用いて計算された試験統計の予測分布と比較することによって、その仮説が正しい尤度が計算される。いくつかの実施形態において、各仮説についての結合確率は、分配における可能な比率各々について、その仮説の確率を合わせることによって決定され、最大の結合確率を有する仮説が選択される。いくつかの実施形態において、各仮説についての結合確率は、特定の可能な比率について、その可能な比率が正しい比率である尤度に基づき、ある仮説の確率を重み付けすることによって決定される。

【0186】

いくつかの実施形態において、最大尤度の推定、経験的な最大推定、ベイズ推定、動的推定（例えば、動的ベイズ推定）及び期待最大化推定からなる群から選択される技術を使用して、サンプル中の総ＤＮＡ又はＲＮＡに対する１つ以上の標的細胞からのＤＮＡ又はＲＮＡの比率を推定する。いくつかの実施形態において、サンプル中の総ＤＮＡ又はＲＮＡに対する１つ以上の標的細胞からのＤＮＡ又はＲＮＡの比率は、目的のＣＮＶのうちの２つ以上（又は全て）について同じであると仮定される。いくつかの実施形態において、目的の各々のＣＮＶについて、サンプル中の総ＤＮＡ又はＲＮＡに対する１つ以上の標的細胞からのＤＮＡ又はＲＮＡの比率が計算される。

【0187】

Ｃ．不完全なフェージングデータを使用するための例示的な方法
多くの実施形態について、不完全なフェージングデータが使用されることを理解されたい。例えば、第１及び／又は第２の相同染色体セグメント上の遺伝子座のうちの１つ以上について、どの対立遺伝子が存在するかは１００％確実には知られていない場合がある。いくつかの実施形態において、個体の可能なハプロタイプについての事前確率（例えば、集合に基づくハプロタイプ頻度に基づくハプロタイプ）を、各仮説の確率を計算する際に使用する。いくつかの実施形態において、可能なハプロタイプについての事前確率は、遺伝子データをフェージングするための別の方法を用いることによって、又は個体のインフォマティクスに基づくフェージングのために使用される集合データを絞り込むために他の被験体（例えば、以前の被験体）からのフェージングデータを用いることによって調整される。

【0188】

いくつかの実施形態において、フェージング遺伝子データは、フェージング遺伝子データの２つ以上の可能なセットについての確率データを含み、フェージングデータの各々の可能なセットは、第１の相同染色体セグメント上の多型遺伝子座のセット中の各遺伝子座に存在する対立遺伝子の可能な同一性及び第２の相同染色体セグメント上の多型遺伝子座のセット中の各遺伝子座に存在する対立遺伝子の可能な同一性を含む。いくつかの実施形態において、仮説のうちの少なくとも１つについての確率は、フェージング遺伝子データの可能なセット各々について決定される。いくつかの実施形態において、仮説についての結合確率は、フェージング遺伝子データの可能なセット各々についてのその仮説の確率を合わせることによって決定され、最大の結合確率を有する仮説が選択される。

【0189】

本明細書に開示される方法のいずれか又は任意の既知の方法を使用して、請求項記載の方法で使用するための不完全なフェージングデータを作成してもよい（例えば、集合に基づくハプロタイプ頻度を用い、最も可能性の高いフェーズを推測する）。いくつかの実施形態において、フェージングデータは、より小さなセグメントのハプロタイプを確率的に組み合わせることによって得られる。例えば、可能なハプロタイプは、第１の領域からの１つのハプロタイプと、同じ染色体からの別の領域からの別のハプロタイプとの可能な組み合わせに基づいて決定されてもよい。異なる領域からの特定のハプロタイプが、同じ染色体上の同じ、より大きなハプロタイプブロックの一部である確率は、例えば、集合に基づくハプロタイプ頻度及び／又は異なる領域間の既知の組換え率を用いて決定されてもよい。

【0190】

いくつかの実施形態において、単一仮説否定試験は、ダイソミーの帰無仮説のために使用される。いくつかの実施形態において、ダイソミー仮説の確率が計算され、ダイソミーの仮説は、その確率が所与の閾値を下回る場合（例えば、１，０００分の１未満である場合）、否定される。帰無仮説が否定される場合、このことは、不完全なフェージングデータにおけるエラーに起因するか、又はＣＮＶの存在に起因する可能性がある。いくつかの実施形態において、より正確なフェージングデータが得られる（例えば、バイオインフォマティクスに基づいて推測されるフェージングデータではなく、実際のフェージングデータを得るための本明細書に開示される分子フェージング方法のいずれかからのフェージングデータ）。いくつかの実施形態において、ダイソミー仮説の確率は、このより正確なフェージングデータを用いて再計算され、ダイソミー仮説がそれでも否定されるべきかどうかを決定する。この仮説の否定は、染色体セグメントの重複又は欠失が存在することを示す。所望な場合、偽陽性率は、閾値を調整することによって変えることができる。

【0191】

Ｄ．フェージングデータを使用して倍数性を決定するための更なる例示的な実施形態
例示的な実施形態において、個体のサンプル中の染色体セグメントの倍数性を決定する方法が本明細書で提供される。本方法は、染色体セグメント上の多型遺伝子座のセット中の各々の遺伝子座で、サンプル中に存在する各対立遺伝子の量を含む対立遺伝子頻度データを受信する工程と、対立遺伝子頻度データのフェーズを推定することによって、多型遺伝子座のセットについてのフェージング対立遺伝子情報を作成する工程と、対立遺伝子頻度データを用い、異なる倍数性状態についての多型遺伝子座についての対立遺伝子頻度の個々の確率を作成する工程と、個々の確率及びフェージング対立遺伝子情報を用い、多型遺伝子座のセットについての結合確率を作成する工程と、結合確率に基づき、染色体倍数性の指標である最良フィッティングモデルを選択することによって、染色体セグメントの倍数性を決定する工程と、を含む。

【0192】

本明細書に開示されるように、対立遺伝子頻度データ（本明細書において、測定される遺伝子対立遺伝子データとも呼ばれる）は、当該技術分野で既知の方法によって作成されてもよい。例えば、このデータは、ｑＰＣＲ又はマイクロアレイを使用して作成されてもよい。例示的な一実施形態において、このデータは、核酸配列データ、特に、高スループット核酸配列データを使用して生成される。

【0193】

特定の例示的な例では、対立遺伝子頻度データは、これを使用して個々の確率を作成する前に、エラーについて修正される。具体的な例示的な実施形態において、修正されるエラーは、対立遺伝子増幅効率バイアスを含む。他の実施形態において、修正されるエラーは、周囲コンタミネーション及び遺伝子型コンタミネーションを含む。いくつかの実施形態において、修正されるエラーとしては、対立遺伝子増幅バイアス、配列決定エラー、周囲コンタミネーション及び遺伝子型コンタミネーションが挙げられる。

【0194】

特定の実施形態において、個々の確率は、多型遺伝子座のセットについての異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットを用いて作成される。これらの実施形態及び他の実施形態において、結合確率は、染色体セグメント上の多型遺伝子座間の結合を考慮することによって作成される。

【0195】

したがって、これらの実施形態のいくつかを組み合わせた例示的な一実施形態において、個体のサンプル中の染色体倍数性を検出するための方法であって、個体における染色体セグメント上の多型遺伝子座のセットで、対立遺伝子についての核酸配列データを受信する工程と、核酸配列データを用い、遺伝子座のセットで対立遺伝子頻度を検出する工程と、検出された対立遺伝子頻度における対立遺伝子増幅効率バイアスを修正して、多型遺伝子座のセットについて修正された対立遺伝子頻度を作成する工程と、核酸配列データのフェーズを推定することによって、多型遺伝子座のセットについてのフェージング対立遺伝子情報を作成する工程と、修正された対立遺伝子頻度と、多型遺伝子座のセットについての異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットとを比較することによって、異なる倍数性状態についての多型遺伝子座についての対立遺伝子頻度の個々の確率を作成する工程と、染色体セグメント上の多型遺伝子座間の結合を考慮した個々の確率を合わせることによって、多型遺伝子座のセットについての結合確率を作成する工程と、結合確率に基づき、染色体異数性の指標である最良フィッティングモデルを選択する工程とを含む、方法が本明細書で提供される。

【0196】

本明細書に開示されるように、個々の確率は、多型遺伝子座のセットについての異なる倍数性状態及び平均対立遺伝子不均衡フラクションのモデル又は仮説のセットを用いて作成されてもよい。例えば、特に例示的な例では、個々の確率は、染色体セグメントの第１のホモログ及び染色体セグメントの第２のホモログの倍数性状態をモデリングすることによって作成される。モデリングされる倍数性状態は、以下のものを含む。（１）全ての細胞は、染色体セグメントの第１のホモログ又は第２のホモログの欠失又は増幅を有しない、（２）少なくともいくつかの細胞は、染色体セグメントの第１のホモログの欠失又は第２のホモログの増幅を有する、（３）少なくともいくつかの細胞は、染色体セグメントの第２のホモログの欠失又は第１のホモログの増幅を有する。

【0197】

上のモデルは、モデルを制約するために使用される仮説と称される場合もあることが理解されるだろう。したがって、上に示されたのは、使用可能な３つの仮説である。

【0198】

モデリングされる平均対立遺伝子不均衡フラクションは、染色体セグメントの実際の平均対立遺伝子不均衡を含む、任意の範囲の平均対立遺伝子不均衡を含んでいてもよい。例えば、特定の例示的な実施形態において、モデリングされる平均対立遺伝子不均衡の範囲は、下限で０、０．１、０．２、０．２５、０．３、０．４、０．５、０．６、０．７５、１、２、２．５、３、４及び５％、上限で１、２、２．５、３、４、５、１０、１５、２０、２５、３０、４０、５０、６０、７０８０９０、９５及び９９％であってもよい。この範囲を有するモデリングのための間隔は、使用される計算能力及び分析のために許容されている時間に応じて、任意の間隔であってもよい。例えば、０．０１、０．０５、０．０２又は０．１の間隔がモデリングされてもよい。

【0199】

特定の例示的な実施形態において、サンプルは、染色体セグメントについての平均対立遺伝子不均衡が０．４％～５％である。特定の実施形態において、平均対立遺伝子不均衡は、低い。これらの実施形態において、平均対立遺伝子不均衡は、典型的には、１０％未満である。特定の例示的な実施形態において、対立遺伝子不均衡は、下限で０．２５、０．３、０．４、０．５、０．６、０．７５、１、２、２．５、３、４及び５％、上限で１、２、２．５、３、４及び５％である。他の例示的な実施形態において、平均対立遺伝子不均衡は、下限で０．４、０．４５、０．５、０．６、０．７、０．８、０．９又は１．０％、上限で０．５、０．６、０．７、０．８、０．９、１．０、１．５、２．０、３．０、４．０又は５．０％である。例えば、サンプルの平均対立遺伝子不均衡は、例示的な例では、０．４５～２．５％である。別の例では、平均対立遺伝子不均衡は、０．４５、０．５、０．６、０．８、０．８、０．９又は１．０％の感度で検出される。すなわち、本試験方法は、ＡＡＩが０．４５、０．５、０．６、０．８、０．８、０．９又は１．０％まで下がる染色体異数性を検出することができる。本発明の方法において対立遺伝子不均衡が低い例示的なサンプルにおいて、循環腫瘍ＤＮＡを有するがんを有する個体からの血漿サンプル又は循環胎児ＤＮＡを有する妊婦由来の血漿サンプルを含む。

【0200】

ＳＮＶについて、異常ＤＮＡの割合は、典型的には、変異体対立遺伝子頻度（ある遺伝子座での変異体対立遺伝子の数／その遺伝子座での対立遺伝子の総数）を用いて測定されることが理解されるだろう。腫瘍における２つのホモログの量の差が類似しているため、平均対立遺伝子不均衡（ＡＡＩ）によって、ＣＮＶについての異常ＤＮＡの割合（｜（Ｈ１－Ｈ２）｜／（Ｈ１＋Ｈ２）と定義される）を測定し、ここで、Ｈｉは、サンプル中のホモログｉの平均コピー数であり、Ｈｉ／（Ｈ１＋Ｈ２）は、ホモログｉの存在分率、すなわち、ホモログ比率である。最大ホモログ比率は、より豊富なホモログのホモログ比率である。

【0201】

アッセイドロップアウト率は、全ＳＮＰを用いて推定される、リードを有しないＳＮＰの割合である。単一対立遺伝子ドロップアウト（ＡＤＯ）率は、ヘテロ接合性ＳＮＰのみを用いて推定される、たった１つの対立遺伝子が存在するＳＮＰの割合である。遺伝子型信頼性は、二項分布を、Ｂ対立遺伝子リードであった各ＳＮＰでのリード数に対して、ＳＮＰの焦点領域の倍数性状態を用いてフィッティングすることによって決定され、各遺伝子型の確率を推定することができる。

【0202】

腫瘍組織サンプルについて、染色体異数性（この段落ではＣＮＶによって例示される）は、対立遺伝子頻度分布間の遷移によって表すことができる。がん患者、がんを有することが疑われる個体、がんを有すると以前診断された個体の血漿サンプルにおいて、又はリスクのある個体又は一般的な集合のためのがんスクリーニングとして、ＣＮＶは、がんにおいて異数性を示すことが知られている領域において、及び／又は同じ個体からの腫瘍サンプルもＣＮＶを有する場合に、血漿ＣＮＶを検索する最大尤度アルゴリズムによって特定することができる。例示的な実施形態において、このアルゴリズムは、循環腫瘍ＤＮＡの存在についてサンプルが分析される個体のハプロタイプフェーズ情報を使用して、測定され、修正された試験サンプルの対立遺伝子数を、例えば、結合分布モードを用い、対立遺伝子数の予測値にフィッティングする。このようなハプロタイプフェーズ情報は、大部分が、又は少なくとも６０、７０、８０、９０、９５、９６、９７、９８、９９％、又は全ての正常な細胞ＤＮＡを含む、個体からの任意のサンプル、例えば、限定されないが、バフィーコートサンプル、唾液サンプル又は皮膚サンプルから、親の遺伝子情報から、又はデノボでのハプロタイプフェージングによって演繹することができ、これらは、様々な方法（例えば、Ｓｎｙｄｅｒ，Ｍ．，ｅｔａｌ．，Ｈａｐｌｏｔｙｐｅ－ｒｅｓｏｌｖｅｄｇｅｎｏｍｅｓｅｑｕｅｎｃｉｎｇ：ｅｘｐｅｒｉｍｅｎｔａｌｍｅｔｈｏｄｓａｎｄａｐｐｌｉｃａｔｉｏｎｓ．ＮａｔＲｅｖＧｅｎｅｔ１６、３４４－３５８（２０１５））、例えば、希釈によるハプロタイピング（Ｋａｐｅｒ，Ｆ．，ｅｔａｌ．，Ｗｈｏｌｅ－ｇｅｎｏｍｅｈａｐｌｏｔｙｐｉｎｇｂｙｄｉｌｕｔｉｏｎ，ａｍｐｌｉｆｉｃａｔｉｏｎ，ａｎｄｓｅｑｕｅｎｃｉｎｇ．ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ１１０、５５５２－５５５７（２０１３））又は長リード配列決定（Ｋｕｌｅｓｈｏｖ，Ｖ．ｅｔａｌ．Ｗｈｏｌｅ－ｇｅｎｏｍｅｈａｐｌｏｔｙｐｉｎｇｕｓｉｎｇｌｏｎｇｒｅａｄｓａｎｄｓｔａｔｉｓｔｉｃａｌｍｅｔｈｏｄｓ．ＮａｔＢｉｏｔｅｃｈ３２，２６１－２６６（２０１４））によって達成することができる。このアルゴリズムは、以下の仮説の３つのセットについて、０．０２５％の間隔で、全ての対立遺伝子不均衡比率にわたって、対立遺伝子頻度の予測値をモデリングすることができる。（１）全ての細胞が正常である（対立遺伝子不均衡なし）、（２）いくつか／全ての細胞が、ホモログ１の欠失又はホモログ２の増幅を有する、又は（３）いくつか／全ての細胞が、ホモログ２の欠失又はホモログ１の増幅を有する。各仮説の尤度は、全てのヘテロ接合性ＳＮＰでの対立遺伝子頻度の予測値及び観測値のベータ二項モデルに基づくベイズ分類器を用い、各ＳＮＰで決定することができ、次いで、複数のＳＮＰにわたる結合尤度を、特定の例示的な実施形態において、本明細書に例示されるように、ＳＮＰ遺伝子座の結合を考慮しつつ、計算することができる。実際に、例示的な実施形態において、上に開示したように得られる正常細胞のハプロタイプフェーズ情報は、測定され、典型的には修正された試験サンプル対立遺伝子数を、結合分布モデルを用い、対立遺伝子数の予測値にフィッティングするためにアルゴリズムによって使用される。次いで、最大尤度仮説を選択することができる。

【0203】

腫瘍中の平均Ｎ個のコピーを有する染色体領域を考慮し、ｃは、ダイソミー領域における正常細胞と腫瘍細胞の混合物に由来する血漿中のＤＮＡの分率を示す。ＡＡＩは、以下のように計算される。

【数4】

【0204】

特定の例示的な例では、対立遺伝子頻度データは、これを使用して個々の確率を作成する前に、エラーについて修正される。異なる種類のエラー及び／又はバイアスの修正が、本明細書に開示される。具体的な例示的な実施形態において、修正されるエラーは、対立遺伝子増幅効率バイアスである。他の実施形態において、修正されるエラーは、配列決定エラー、周囲コンタミネーション及び遺伝子型コンタミネーションを含む。いくつかの実施形態において、修正されるエラーとしては、対立遺伝子増幅バイアス、配列決定エラー、周囲コンタミネーション及び遺伝子型コンタミネーションが挙げられる。

【0205】

対立遺伝子増幅効率バイアスは、試験中のサンプルを含む実験又は研究室での決定の一部として、ある対立遺伝子について決定することができるか、又は効率が計算される対立遺伝子を含むサンプルのセットを用い、異なる時間に決定することができることが理解されるだろう。周囲コンタミネーション及び遺伝子型コンタミネーションは、典型的には、試験中のサンプル分析と同じランで決定される。

【0206】

特定の実施形態において、周囲コンタミネーション及び遺伝子型コンタミネーションは、サンプル中のホモ接合性対立遺伝子について決定される。個体からの任意の所与のサンプルについて、ある遺伝子座が集合の中で比較的高いヘテロ接合性を有するために、分析のために選択される場合であっても、サンプル中のいくつかの遺伝子座はヘテロ接合性であり、他方はホモ接合性であることが理解されるだろう。いくつかの実施形態において、ある個体についてヘテロ接合性遺伝子座を用いて染色体セグメントの倍数性を決定することが有利であり、一方、周囲コンタミネーション及び遺伝子型コンタミネーションは、ホモ接合性遺伝子座を用いて計算することができる。

【0207】

特定の例示的な例では、上述の選択することは、フェージング対立遺伝子情報とモデルについて作成された推定対立遺伝子頻度との差の大きさを分析することによって行われる。

【0208】

例示的な例では、対立遺伝子頻度の個々の確率は、多型遺伝子座のセットでの対立遺伝子頻度の予測値及び観測値のベータ二項モデルに基づいて作成される。例示的な例では、個々の確率は、ベイズ分類器を用いて作成される。

【0209】

特定の例示的な実施形態において、核酸配列データは、多重増幅反応を用いて作成される一連のアンプリコンの複数のコピーの高スループットＤＮＡ配列決定を行うことによって作成され、一連のアンプリコンの各々のアンプリコンは、多型遺伝子座のセットの少なくとも１つの多型遺伝子座に広がり、このセットの多型遺伝子座の各々が増幅される。特定の実施形態において、多重増幅反応は、反応の少なくとも１／２について、制限されたプライマー条件で行われる。いくつかの実施形態において、制限されたプライマー濃度は、多重反応のうちの反応の１／１０、１／５、１／４、１／３、１／２、又は全てで使用される。ＰＣＲなどの増幅反応において制限されたプライマー条件を達成するために考慮すべき因子が、本明細書で提供される。

【0210】

特定の実施形態において、本明細書で提供される方法は、複数の染色体にわたる複数の染色体セグメントについて倍数性を検出する。したがって、これらの実施形態における染色体倍数性は、サンプル中の染色体セグメントのセットについて決定される。これらの実施形態について、より多くの多重増幅反応が必要とされる。したがって、これらの実施形態について、多重増幅反応は、例えば、２，５００～５０，０００の多重反応を含んでいてもよい。特定の実施形態において、以下の範囲の多重反応が行われる。範囲の下限で１００、２００、２５０、５００、１０００、２５００、５０００、１０，０００、２０，０００、２５０００、５００００から、範囲の上限で２００、２５０、５００、１０００、２５００、５０００、１０，０００、２０，０００、２５０００、５００００及び１００，０００まで。

【0211】

例示的な実施形態において、多型遺伝子座のセットは、高いヘテロ接合性を示すことが知られている遺伝子座のセットである。しかし、任意の所与の個体について、これらの遺伝子座のいくつかがホモ接合性であることが予想される。特定の例示的な実施形態において、本発明の方法は、ある個体のホモ接合性遺伝子座及びヘテロ接合性遺伝子座の両方についての核酸配列情報を利用する。ある個体のホモ接合性遺伝子座は、例えば、エラー修正のために使用され、一方、ヘテロ接合性遺伝子座は、サンプルの対立遺伝子不均衡の決定に使用される。特定の実施形態において、多型遺伝子座の少なくとも１０％は、個体のヘテロ接合性遺伝子座である。

【0212】

本明細書に開示されるように、集合中でヘテロ接合性であることが知られている標的ＳＮＰ遺伝子座を分析することが好ましく与えられる。したがって、特定の実施形態において、多型遺伝子座の１０、２０、２５、５０、７５、８０、９０、９５、９９又は１００％が、集合中でヘテロ接合性であることが知られている多型遺伝子座が選択される。

【0213】

本明細書に開示されるように、特定の実施形態において、サンプルは、妊婦由来の血漿サンプルである。

【0214】

いくつかの例では、本方法は、更に、既知の平均対立遺伝子不均衡比率を有する対照サンプルに対して本方法を実施することを含む。対照は、例えば、腫瘍からの循環遊離ＤＮＡについて予想されるように、低濃度で存在するサンプル中の対立遺伝子の平均対立遺伝子不均衡を模倣するために、０．４～１０％の染色体セグメントの異数性の指標である特定の対立遺伝子状態についての平均対立遺伝子不均衡比率を有していてもよい。

【0215】

いくつかの実施形態において、本明細書に開示されるように、ＰｌａｓｍＡｒｔ対照は、対照として使用される。したがって、特定の態様において、これは、染色体異数性を示すことが知られている核酸サンプルを、個体の血漿中で循環するＤＮＡのフラグメントの大きさを模倣するフラグメントへとフラグメント化することを含む方法によって作成されるサンプルである。特定の態様において、染色体セグメントについての異数性を有しない対照が使用される。

【0216】

例示的な実施形態において、１つ以上の対照からのデータは、試験サンプルとともに本方法で分析されてもよい。対照は、例えば、染色体異数性を含有することが疑われない個体からの異なるサンプル、又はＣＮＶ又は染色体異数性を含有することが疑われるサンプルを含んでいてもよい。例えば、試験サンプルが、循環遊離腫瘍ＤＮＡを含有することが疑われる腫瘍サンプルである場合、本方法は、その血漿サンプルとともに、その被験体からの腫瘍由来の対照サンプルについても行うことができる。本明細書に開示されるように、対照サンプルは、染色体異数性を示すことが知られているＤＮＡサンプルをフラグメント化することによって調製されてもよい。このようなフラグメント化によって、特に、サンプルが、がんに罹患している個体由来である場合、アポトーシス細胞のＤＮＡ組成物を模倣するＤＮＡサンプルを得ることができる。対照サンプルからのデータは、染色体異数性の検出の信頼性を高めるだろう。

【0217】

倍数性を決定する方法の特定の実施形態において、サンプルは、がんを有することが疑われる個体からの血漿サンプルである。これらの実施形態において、本方法は、更に、上述の選択することに基づいて、コピー数多型が個体の腫瘍細胞に存在するかどうかを決定することを含む。これらの実施形態について、サンプルは、個体からの血漿サンプルであってもよい。これらの実施形態において、本方法は、更に、上述の選択することに基づいて、がんが個体中に存在するかどうかを決定することを含んでいてもよい。

【0218】

染色体セグメントの倍数性を決定するためのこれらの実施形態は、更に、単一ヌクレオチドバリアント位置のセットにおいて、単一ヌクレオチドバリアント位置にある単一ヌクレオチドバリアントを検出することを含んでいてもよく、染色体異数性又は単一ヌクレオチドバリアントのいずれか、又は両者を検出することは、サンプル中の循環腫瘍核酸の存在を示す。

【0219】

これらの実施形態は、更に、個体のある腫瘍についての染色体セグメントのハプロタイプ情報を受信することと、このハプロタイプ情報を用いて、多型遺伝子座のセットについての異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットを作成することと、を含んでいてもよい。

【0220】

本明細書に開示されるように、倍数性を決定する方法の特定の実施形態は、更に、初期又は修正された対立遺伝子頻度をモデルのセットと比較する前に、初期又は修正された対立遺伝子頻度データから外れ値を除去することを含んでいてもよい。例えば、特定の実施形態において、染色体セグメント上の他の遺伝子座についての平均値よりも少なくとも２又は３の標準偏差分、上又は下である遺伝子座対立遺伝子頻度は、モデリングのために使用される前に、データから除去される。

【0221】

本明細書に言及されるように、染色体セグメントの倍数性を決定するためのものを含む、本明細書で提供される実施形態の多くについて、不完全又は完全なフェージングデータが好ましく使用されることが理解されるだろう。倍数性を検出するための従来方法を超える改善を与えるいくつかの特徴が本明細書で提供され、これらの特徴の多くの異なる組み合わせを使用してもよいことも理解されるだろう。

【0222】

特定の実施形態において、本発明の任意の方法を行うためのコンピュータシステム及びコンピュータ可読媒体が本明細書で提供される。これらは、倍数性を決定する方法を行うためのシステム及びコンピュータ可読媒体を含む。したがって、システムの実施形態の非限定的な例として、本明細書で提供される方法のいずれかが、本明細書の開示を用い、システム及びコンピュータ可読媒体を用いて実行可能であることを示すために、別の態様において、個体のサンプル中の染色体倍数性を検出するためのシステムであって、染色体セグメント上の多型遺伝子座のセット中の各々の遺伝子座で、サンプル中に存在する各対立遺伝子の量を含む対立遺伝子頻度データを受信するような構成の入力プロセッサと、対立遺伝子頻度データのフェーズを推定することによって、多型遺伝子座のセットについてのフェージング対立遺伝子情報を作成し、対立遺伝子頻度データを用い、異なる倍数性状態についての多型遺伝子座についての対立遺伝子頻度の個々の確率を作成し、個々の確率及びフェージング対立遺伝子情報を用い、多型遺伝子座のセットについての結合確率を作成するような構成のモデラーと、結合確率に基づき、染色体倍数性の指標である最良フィッティングモデルを選択することによって、染色体セグメントの倍数性を決定する仮説マネージャと、を備える、システムが本明細書で提供される。

【0223】

このシステムの実施形態の特定の実施形態において、対立遺伝子頻度データは、核酸配列決定システムによって作成されるデータである。特定の実施形態において、このシステムは、更に、対立遺伝子頻度データ中のエラーを修正するような構成のエラー修正ユニットを備えており、修正された対立遺伝子頻度データは、モデラーによって、個々の確率を作成するために使用される。特定の実施形態において、エラー修正ユニットは、対立遺伝子増幅効率バイアスを修正する。特定の実施形態において、モデラーは、多型遺伝子座のセットについての異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットを用い、個々の確率を作成する。モデラーは、特定の例示的な実施形態において、染色体セグメント上の多型遺伝子座間の結合を考慮することによって、結合確率を作成する。

【0224】

例示的な一実施形態において、個体のサンプル中の染色体倍数性を検出するシステムであって、個体における染色体セグメント上の多型遺伝子座のセットでの対立遺伝子についての核酸配列データを受信し、核酸配列データを用い、遺伝子座のセットでの対立遺伝子頻度を検出するような構成の入力プロセッサと、検出された対立遺伝子頻度中のエラーを修正し、多型遺伝子座のセットについて修正された対立遺伝子頻度を作成するような構成のエラー修正ユニットと、核酸配列データのフェーズを推定することによって、多型遺伝子座のセットについてのフェージング対立遺伝子情報を作成し、フェージングされた対立遺伝子情報を、多型遺伝子座のセットの異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットとを比較することによって、異なる倍数性状態についての多型遺伝子座についての対立遺伝子頻度の個々の確率を作成し、染色体セグメント上の多型遺伝子座間の相対距離を考慮した個々の確率を合わせることによって、多型遺伝子座のセットについての結合確率を作成するような構成のモデラーと、結合確率に基づき、染色体異数性の指標である最良フィッティングモデルを選択するような構成の仮説マネージャとを備える、システムが本明細書で提供される。

【0225】

本明細書で提供される特定の例示的なシステムの実施形態において、多型遺伝子座のセットは、１０００～５０，０００個の多型遺伝子座を含む。本明細書で提供される特定の例示的なシステムの実施形態において、多型遺伝子座のセットは、１００個の既知のヘテロ接合性ホットスポット遺伝子座を含む。本明細書で提供される特定の例示的なシステムの実施形態において、多型遺伝子座のセットは、組換えホットスポットの０．５ｋｂにあるか、又はその内部にある１００個の遺伝子座を含む。

【0226】

本明細書で提供される特定の例示的なシステムの実施形態において、最良フィッティングモデルは、染色体セグメントの第１のホモログ及び染色体セグメントの第２のホモログの以下の倍数性状態を分析する。（１）全ての細胞は、染色体セグメントの第１のホモログ又は第２のホモログの欠失又は増幅を有しない、（２）いくつかの細胞又は全ての細胞は、染色体セグメントの第１のホモログの欠失又は第２のホモログの増幅を有する、（３）いくつかの細胞又は全ての細胞は、染色体セグメントの第２のホモログの欠失又は第１のホモログの増幅を有する。

【0227】

本明細書で提供される特定の例示的なシステムの実施形態において、修正されるエラーは、対立遺伝子増幅効率バイアス、コンタミネーション及び／又は配列決定エラーを含む。本明細書で提供される特定の例示的なシステムの実施形態において、コンタミネーションは、周囲コンタミネーション及び遺伝子型コンタミネーションを含む。本明細書で提供される特定の例示的なシステム実施形態において、周囲コンタミネーション及び遺伝子型コンタミネーションは、ホモ接合性対立遺伝子について決定される。

【0228】

本明細書で提供される特定の例示的なシステムの実施形態において、仮説マネージャは、そのモデルについて作成されたフェージング対立遺伝子情報と推定対立遺伝子頻度との差の大きさを分析するような構成である。本明細書で提供される特定の例示的なシステムの実施形態において、モデラーは、多型遺伝子座のセットでの対立遺伝子頻度の予測値及び観測値のベータ二項モデルに基づき、対立遺伝子頻度の個々の確率を作成する。本明細書で提供される特定の例示的なシステムの実施形態において、モデラーは、ベイズ分類器を用いて個々の確率を作成する。

【0229】

本明細書で提供される特定の例示的なシステムの実施形態において、核酸配列データは、多重増幅反応を用いて作成される一連のアンプリコンの複数のコピーの高スループットＤＮＡ配列決定を行うことによって作成され、一連のアンプリコンの各々のアンプリコンは、多型遺伝子座のセットの少なくとも１つの多型遺伝子座に広がり、このセットの多型遺伝子座の各々が増幅される。本明細書で提供される特定の例示的なシステムの実施形態において、多重増幅反応は、反応の少なくとも１／２について、制限されたプライマー条件で行われる。本明細書で提供される特定の例示的なシステムの実施形態において、サンプルは、平均対立遺伝子不均衡が０．４％～５％である。

【0230】

本明細書で提供される特定の例示的なシステムの実施形態において、サンプルは、がんを有することが疑われる個体からの血漿サンプルであり、仮説マネージャは、更に、最良フィッティングモデルに基づき、コピー数多型が個体の腫瘍細胞に存在するかどうかを決定するような構成である。

【0231】

本明細書で提供される特定の例示的なシステムの実施形態において、サンプルは、個体からの血漿サンプルであり、仮説マネージャは、更に、最良フィッティングモデルに基づき、がんが個体に存在するかどうかを決定するような構成である。これらの実施形態において、仮説マネージャは、更に、単一ヌクレオチドバリアント位置のセットにおいて、単一ヌクレオチドバリアント位置にある単一ヌクレオチドバリアントを検出するような構成であってもよく、染色体異数性又は単一ヌクレオチドバリアントのいずれか、又は両者を検出することは、サンプル中の循環腫瘍核酸の存在を示す。

【0232】

本明細書で提供される特定の例示的なシステムの実施形態において、入力プロセッサは、更に、個体のある腫瘍についての染色体セグメントのハプロタイプ情報を受信するような構成であり、モデラーは、このハプロタイプ情報を用いて、多型遺伝子座のセットについての異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットを作成するような構成である。

【0233】

本明細書で提供される特定の例示的なシステムの実施形態において、モデラーは、０％～２５％の範囲の対立遺伝子不均衡フラクションにわたってモデルを作成する。

【0234】

本明細書に提供される方法のうちのいずれかは、非一時的コンピュータ可読媒体に保存されるコンピュータ可読コードによって実行されてもよいことが理解されるだろう。したがって、一実施形態において、個体のサンプルにおいて染色体倍数性を検出するための非一時的コンピュータ可読媒体であって、コンピュータ可読コードを含み、処理デバイスによって実行される場合、処理デバイスに、染色体セグメント上の多型遺伝子座のセットにおける各遺伝子座で、サンプル中に存在する各対立遺伝子の量を含む対立遺伝子頻度データを受信させ、対立遺伝子頻度データのフェーズを推定することによって、多型遺伝子座のセットについてのフェージング対立遺伝子情報を作成させ、対立遺伝子頻度データを用い、異なる倍数性状態についての多型遺伝子座についての対立遺伝子頻度の個々の確率を作成させ、個々の確率及びフェージング対立遺伝子情報を用い、多型遺伝子座のセットについての結合確率を作成させ、結合確率に基づき、染色体倍数性の指標である最良フィッティングモデルを選択することによって、染色体セグメントの倍数性を決定させる、非一時的コンピュータ可読媒体が本明細書で提供される。

【0235】

特定のコンピュータ可読媒体の実施形態において、対立遺伝子頻度データは、核酸配列データから作成される。特定のコンピュータ可読媒体の実施形態は、更に、対立遺伝子頻度データ中のエラーを修正することと、修正された対立遺伝子頻度データを、個々の確率を作成する工程に使用することとを含む。特定のコンピュータ可読媒体の実施形態において、修正されるエラーは、対立遺伝子増幅効率バイアスである。特定のコンピュータ可読媒体の実施形態において、個々の確率は、多型遺伝子座のセットについての異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットを用いて作成される。特定のコンピュータ可読媒体の実施形態において、結合確率は、染色体セグメント上の多型遺伝子座間の結合を考慮することによって作成される。

【0236】

特定の一実施形態において、個体のサンプルにおいて染色体倍数性を検出するための非一時的コンピュータ可読媒体であって、コンピュータ可読コードを含み、処理デバイスによって実行される場合、処理デバイスに、個体における染色体セグメント上の多型遺伝子座のセットでの対立遺伝子についての核酸配列データを受信させ、核酸配列データを用い、遺伝子座のセットでの対立遺伝子頻度を検出させ、検出された対立遺伝子頻度における対立遺伝子増幅効率バイアスを修正して、多型遺伝子座のセットについて修正された対立遺伝子頻度を作成させ、核酸配列データのフェーズを推定することによって、多型遺伝子座のセットについてのフェージング対立遺伝子情報を作成させ、修正された対立遺伝子頻度と、多型遺伝子座のセットについての異なる倍数性状態及び対立遺伝子不均衡フラクションのモデルのセットとを比較することによって、異なる倍数性状態についての多型遺伝子座についての対立遺伝子頻度の個々の確率を作成させ、染色体セグメント上の多型遺伝子座間の結合を考慮した個々の確率を合わせることによって、多型遺伝子座のセットについての結合確率を作成させ、結合確率に基づき、染色体異数性の指標である最良フィッティングモデルを選択させる、非一時的コンピュータ可読媒体が本明細書で提供される。

【0237】

特定の例示的なコンピュータ可読媒体の実施形態において、上述の選択することは、フェージング対立遺伝子情報とモデルについて作成された推定対立遺伝子頻度との差の大きさを分析することによって行われる。

【0238】

特定の例示的なコンピュータ可読媒体の実施形態において、対立遺伝子頻度の個々の確率は、多型遺伝子座のセットでの対立遺伝子頻度の予測値及び観測値のベータ二項モデルに基づいて作成される。

【0239】

本明細書で提供されるいずれかの方法の実施形態は、非一時的コンピュータ可読媒体に保存されるコードを実行することによって行われてもよいことが理解されるだろう。

【0240】

Ｅ．がんを検出するための例示的な実施形態
特定の態様において、本発明は、がんを検出するための方法を提供する。サンプルは、がんを有することが疑われる個体からの腫瘍サンプル又は液体サンプル、例えば、血漿であってもよいことが理解されるだろう。本方法は、遺伝子変異、例えば、ＳＮＶなどの単一ヌクレオチド変化、又はコピー数の変化、例えば、サンプル中の総ＤＮＡの一部として低レベルのこれらの遺伝子変化を含むサンプル中のＣＮＶを検出するのに特に有効である。したがって、サンプル中のがんからのＤＮＡ又はＲＮＡを検出するための感度は、並外れている。本方法は、この並外れた感度を達成するために、ＣＮＶ及びＳＮＶを検出するための本明細書で提供される改良のいずれか又は全てを組み合わせてもよい。

【0241】

したがって、本明細書で提供される特定の実施形態において、循環腫瘍核酸が、個体のサンプル中に存在するかどうかを決定する方法、及び非一時的コンピュータ可読媒体であって、コンピュータ可読コードを含み、処理デバイスで実行される場合、処理デバイスに本方法を実施させる、非一時的コンピュータ可読媒体である。本方法は、サンプルを分析して、個体における染色体セグメント上の多型遺伝子座のセットでの倍数性を決定する工程と、倍数性の決定に基づき、多型遺伝子座に存在する平均対立遺伝子不均衡のレベルを決定する工程とを含み、０．４％、０．４５％、０．５％、０．６％、０．７％、０．７５％、０．８％、０．９％又は１％に等しいか、又はこれらより大きい平均対立遺伝子不均衡は、サンプル中の循環腫瘍核酸（例えば、ｃｔＤＮＡ）の存在の指標である。

【0242】

特定の例示的な実施例において、０．４、０．４５又は０．５％を超える平均対立遺伝子不均衡は、ｃｔＤＮＡの存在の指標である。特定の実施形態において、循環腫瘍核酸が存在するかどうかを決定する方法は、更に、単一ヌクレオチド分散位置のセットにおいて、単一ヌクレオチド分散部位にある単一ヌクレオチドバリアントを検出することを含み、０．５％に等しいか、又はこれより大きい対立遺伝子不均衡を検出すること、又は単一ヌクレオチドバリアントを検出すること、又はこの両者は、サンプル中の循環腫瘍核酸の存在の指標である。染色体倍数性又はＣＮＶを検出するために提供される方法のいずれかを使用して、対立遺伝子不均衡（典型的には平均対立遺伝子不均衡として表される）のレベルを決定することができることが理解されるだろう。ＳＮＶを検出するための本明細書に提供される方法のうちのいずれかを使用して、本発明のこの態様のための単一ヌクレオチドを検出することができることが理解されるだろう。

【0243】

特定の実施形態において、循環腫瘍核酸が存在するかどうかを決定するための方法は、更に、既知の平均対立遺伝子不均衡比率を有する対照サンプルに対して本方法を行うことを含む。対照は、例えば、個体の腫瘍からのサンプルであってもよい。いくつかの実施形態において、対照は、分析対象のサンプルに対して予測される平均対立遺伝子不均衡を有する。例えば、ＡＡＩは０．５％～５％、又は平均対立遺伝子不均衡比率が０．５％。

【0244】

特定の実施形態において、循環腫瘍核酸が存在するかどうかを決定するための方法の分析する工程は、がんにおいて異数性を示すことが知られている染色体セグメントのセットを分析することを含む。特定の実施形態において、循環腫瘍核酸が存在するかどうかを決定するための方法の分析する工程は、倍数性について、１，０００～５０，０００又は１００～１０００個の多型遺伝子座を分析することを含む。特定の実施形態において、循環腫瘍核酸が存在するかどうかを決定するための方法の分析する工程は、１００～１０００個の単一ヌクレオチドバリアント部位を分析することを含む。例えば、これらの実施形態において、分析する工程は、マルチプレックスＰＣＲを行い、１０００～５０，０００多型遺伝子座及び１００～１０００単一ヌクレオチドバリアント部位にわたってアンプリコンを増幅させることを含んでいてもよい。この多重反応は、単一の反応として、又は異なる部分集合の多重反応のプールとして設定することができる。本明細書で提供される多重反応方法（例えば、本明細書に開示される大規模マルチプレックスＰＣＲ）は、改良された多重化、したがって、感度レベルを達成するのに役立つように増幅反応を行う例示的なプロセスを提供する。

【0245】

特定の実施形態において、マルチプレックスＰＣＲ反応は、反応の少なくとも１０％、２０％、２５％、５０％、７５％、９０％、９５％、９８％、９９％又は１００％についての制限されたプライマー条件で行われる。本明細書で提供される大規模多重反応を行うための改良された条件を使用することができる。

【0246】

特定の態様において、循環腫瘍核酸が個体のサンプル中に存在するかどうかを決定するための上述の方法、及びその全ての実施形態は、システムを用いて行うことができる。本開示は、上述の方法を行うための特定の機能的特徴及び構造的特徴に関する教示を提供する。非限定的な例として、システムは、以下を含む。

【0247】

サンプルからのデータを分析して、個体における染色体セグメント上の多型遺伝子座のセットでの倍数性を決定するような構成の入力プロセッサと、

【0248】

倍数性の決定に基づき、多型遺伝子座に存在する対立遺伝子不均衡のレベルを決定するような構成であり、０．５％に等しいか、又はこれより大きい対立遺伝子不均衡が、循環の存在の指標である、モデラー。

【0249】

Ｆ．単一ヌクレオチドバリアントを検出するための例示的な実施形態
特定の態様において、サンプル中の単一ヌクレオチドバリアントを検出するための方法が本明細書で提供される。本明細書で提供される改良された方法は、サンプル中の０．０１５、０．０１７、０．０２、０．０５、０．１、０．２、０．３、０．４又は０．５％のＳＮＶの検出限界を達成することができる。ＳＮＶを検出するための全ての実施形態は、システムを用いて行うことができる。本開示は、上述の方法を行うための特定の機能的特徴及び構造的特徴に関する教示を提供する。更に、コンピュータ可読コードを含み、処理デバイスによって実行されると、処理デバイスに、本明細書で提供されるＳＮＶを検出するための方法を行わせる、非一時的コンピュータ可読媒体を含む実施形態が本明細書で提供される。

【0250】

したがって、一実施形態において、単一ヌクレオチドバリアントが、個体からのサンプル中のゲノム位置のセットに存在するかどうかを決定する方法であって、各々のゲノム位置について、そのゲノム位置に広がるアンプリコンについての効率及びサイクル当たりのエラー率の推定値を、トレーニングデータセットを用いて作成することと、サンプル中の各々のゲノム位置について、観測されたヌクレオチド同一性情報を受信することと、各々のゲノム位置についての増幅効率及びサイクル当たりのエラー率の推定値を独立して用い、各々のゲノム位置での観測されたヌクレオチド同一性情報を、異なるバリアントの割合のモデルと比較することによって、各々のゲノム位置にある１つ以上の実際の変異から得られる単一ヌクレオチドバリアントの割合の確率のセットを決定することと、各々のゲノム位置についての確率のセットから、最も可能性が高い実際のバリアントの割合及び信頼性を決定することと、を含む、方法が本明細書で提供される。

【0251】

単一ヌクレオチドバリアントが存在するかどうかを決定するための方法の例示的な実施形態において、効率及びサイクル当たりのエラー率の推定値は、ゲノム位置に広がるアンプリコンのセットについて作成される。例えば、ゲノム位置に広がる２、３、４、５、１０、１５、２０、２５、５０、１００個、又はもっと多くのアンプリコンが含まれていてもよい。

【0252】

単一ヌクレオチドバリアントが存在するかどうかを決定するための方法の例示的な実施形態において、観測されるヌクレオチド同一性情報は、各ゲノム位置についての総リードの観測数及び各ゲノム位置についてのバリアント対立遺伝子リードの観測数を含む。

【0253】

単一ヌクレオチドバリアントが存在するかどうかを決定するための方法の例示的な実施形態において、サンプルは、血漿サンプルであり、単一ヌクレオチドバリアントは、サンプルの循環腫瘍ＤＮＡ中に存在する。

【0254】

別の実施形態において、個体からのサンプル中に存在する単一ヌクレオチドバリアントの割合を推定する方法が本明細書で提供される。本方法は、ゲノム位置のセットで、それらのゲノム位置に広がる１つ以上のアンプリコンについての効率及びサイクル当たりのエラー率の推定値を、トレーニングデータセットを用いて作成する工程と、サンプル中の各々のゲノム位置について、観測されたヌクレオチド同一性情報を受信する工程と、アンプリコンの増幅効率及びサイクル当たりのエラー率を用い、実際の変異分子の初期の割合を含む検索空間について、分子の総数、バックグラウンドエラー分子及び実際の変異分子についての平均及び分散についての平均及び分散の推定値を作成する工程と、平均及び分散の推定値を用い、分布を、サンプル中の観測されたヌクレオチド同一性情報にフィッティングすることによって最も可能性の高い実際の単一ヌクレオチドバリアントの割合を決定することによって、実際の変異から得られるサンプル中に存在する単一ヌクレオチドバリアントの割合を決定する工程と、を含む。

【0255】

サンプル中に存在する単一ヌクレオチドバリアントの割合を推定するためのこの方法の例示的な例では、サンプルは、血漿サンプルであり、単一ヌクレオチドバリアントは、サンプルの循環腫瘍ＤＮＡ中に存在する。

【0256】

本発明のこの実施形態のトレーニングデータセットは、典型的には、１名の健康な個体又は好ましくは健康な個体群からのサンプルを含む。特定の例示的な実施形態において、トレーニングデータセットは、同じ日に分析されるか、又は１つ以上の試験中のサンプルについて同じランで分析される。例えば、２、３、４、５、１０、１５、２０、２５、３０、３６、４８、９６、１００、１９２、２００、２５０、５００、１０００、又はもっと多くの健康な個体の群からのサンプルを使用して、トレーニングデータセットを作成してもよい。更に多数の健康な個体（例えば、９６名以上）についてデータが利用可能である場合、試験中のサンプルについて本方法を実行する前にランが行われる場合であっても、増幅効率の推定値についての信頼性が増加する。ＰＣＲのエラー率は、エラー率がアンプリコン当たりであるため、ＳＮＶ塩基位置についてだけではなく、ＳＮＶ周囲の全増幅領域について作成された核酸配列情報を使用してもよい。例えば、５０名の個体からのサンプルを用い、ＳＮＶ周囲の２０塩基対アンプリコンを配列決定すると、１０００塩基リードからのエラー頻度データを使用して、エラー頻度率を決定することができる。

【0257】

典型的には、増幅効率は、増幅するセグメントについての増幅効率の平均及び標準偏差を推定し、次いで、これを分布モデル（例えば、二項分布又はベータ二項分布）にフィッティングすることによって推定される。既知のサイクル数を有するＰＣＲについてエラー率が決定され、次いで、サイクル当たりのエラー率が推定される。

【0258】

特定の例示的な実施形態において、試験データセットの開始時分子を推定することは、更に、リードの観測数が、リード数の推定値と有意に異なっている場合に、工程（ｂ）で推定される開始時の分子数を用い、試験データセットについての効率の推定値を更新することを含む。次いで、この推定値は、新たな効率及び／又は開始分子について更新することができる。

【0259】

分子の総数、バックグラウンドエラー分子及び実際の変異分子を推定するために使用される検索空間は、ＳＮＶ塩基であるＳＮＶ位置にある塩基のコピーの下限で０．１％、０．２％、０．２５％、０．５％、１％、２．５％、５％、１０％、１５％、２０％又は２５％、上限で１％、２％、２．５％、５％、１０％、１２．５％、１５％、２０％、２５％、５０％、７５％、９０％又は９５％の検索空間を含んでいてもよい。これより低い範囲である、下限で０．１％、０．２％、０．２５％、０．５％又は１％、上限で１％、２％、２．５％、５％、１０％、１２．５％又は１５％が、血漿サンプルについての例示的な例で使用されてもよく、ここで、本方法は、循環腫瘍ＤＮＡを検出する。腫瘍サンプルには、更に高い範囲が使用される。

【0260】

分布は、総分子における総エラー分子の数（バックグラウンドエラー及び実際の変異）に対してフィッティングされ、検索空間における各々の可能な実際の変異について尤度又は可能性を計算する。この分布は、二項分布又はベータ二項分布であってもよい。

【0261】

最も可能性の高い実際の変異は、最も可能性の高い実際の変異の割合を決定し、分布のフィッティングからのデータを用いて信頼性を計算することによって、決定される。例示的な例として、本明細書で提供される臨床的解釈を制限することを意図しないが、平均変異率が高い場合、ＳＮＶの陽性決定を行うのに必要な信頼性の割合は、低くなる。例えば、最も可能性の高い仮説を用いたサンプル中のＳＮＶについての平均変異率が５％であり、信頼性の割合が９９％である場合、陽性ＳＮＶのコールが行われるだろう。他方で、この例示的な例について、最も可能性の高い仮説を用いたサンプル中のＳＮＶについての平均変異率が１％であり、信頼性の割合が５０％である場合、特定の状況において、陽性ＳＮＶのコールは行われないだろう。データの臨床的解釈は、感度、特異性、有病率及び代替製品の入手可能性の関数であり得ることが理解されるだろう。

【0262】

ある例示的な実施形態において、サンプルは、循環ＤＮＡサンプル、例えば、循環腫瘍ＤＮＡサンプルである。

【0263】

別の実施形態において、個体からの試験サンプル中の１つ以上の単一ヌクレオチドバリアントを検出する方法が本明細書で提供される。本実施形態に係る方法は、以下の工程を含む。

【0264】

配列決定ランで作成された結果に基づき、単一ヌクレオチドバリアント位置のセットにおける各々の単一ヌクレオチドバリアント位置について、複数の正常な個体各々からの複数の対照サンプルについてのバリアント対立遺伝子頻度の中央値を決定して、閾値を下回る、正常なサンプルにおいてバリアント対立遺伝子頻度の中央値を有する選択された単一ヌクレオチドバリアント位置を特定し、各々の単一ヌクレオチドバリアント位置について外れ値サンプルを除去した後、各々の単一ヌクレオチドバリアント位置についてバックグラウンドエラーを決定する工程と、試験サンプルについての配列決定ランで作成されたデータに基づき、試験サンプルについて選択された単一ヌクレオチドバリアント位置について観測されたリード深度の重み付けされた平均及び分散を決定する工程と、コンピュータを用い、統計的に有意なリード深度の重み付けされた平均を有する１つ以上の単一ヌクレオチドバリアント位置を、その位置についてのバックグラウンドエラーと比較して特定することによって、１つ以上の単一ヌクレオチドバリアントを検出する工程。

【0265】

１つ以上のＳＮＶを検出するためのこの方法の特定の実施形態において、サンプルは、血漿サンプルであり、対照サンプルは、血漿サンプルであり、検出された１つ以上の検出された単一ヌクレオチドバリアントは、サンプルの循環腫瘍ＤＮＡ中に存在する。１つ以上のＳＮＶを検出するためのこの方法の特定の実施形態において、複数の対照サンプルは、少なくとも２５個のサンプルを含む。特定の例示的な実施形態において、複数の対照サンプルは、下限で少なくとも５、１０、１５、２０、２５、５０、７５、１００、２００又は２５０個のサンプル、上限で１０、１５、２０、２５、５０、７５、１００、２００、２５０、５００及び１０００個のサンプルである。

【0266】

１つ以上のＳＮＶを検出するためのこの方法の特定の実施形態において、外れ値が、高スループット配列決定ランで作成されたデータから除去され、観測されたリード深度の重み付けされた平均を計算し、観測された分散が決定される。１つ以上のＳＮＶを検出するためのこの方法の特定の実施形態において、試験サンプルについての各々の単一ヌクレオチドバリアント位置についてのリード深度は、少なくとも１００リードである。

【0267】

１つ以上のＳＮＶを検出するためのこの方法の特定の実施形態において、配列決定ランは、制限されたプライマー反応条件で行われる多重増幅反応を含む。本明細書で提供される多重増幅反応を行うための改善された方法を使用して、例示的な例で、これらの実施形態を行う。

【0268】

理論に限定されないが、本実施形態の方法は、正常な血漿サンプルを用いたバックグラウンドエラーモデルを利用し、これを試験中のサンプルとして同じ配列決定ランで配列決定し、ランに特有のアーチファクトを考慮する。閾値、例えば、０．１％、０．２％、０．２５％、０．５％、０．７５％及び１．０％を超える通常のバリアント対立遺伝子頻度の中央値を有するノイズ位置を除去する。

【0269】

ノイズ及びコンタミネーションを考慮するために、外れ値のサンプルをこのモデルから繰り返し除去する。全てのゲノム遺伝子座の各々の塩基置換について、リード深度で重み付けされた平均及び誤差の標準偏差を計算する。特定の例示的な実施形態において、閾値のリード数（例えば、少なくとも２、３、４、５、６、７、８、９、１０、１５、２０、２５、５０、１００、２５０、５００又は１０００個のバリアントリード）を少なくとも有し、特定の実施形態においてバックグラウンドエラーモデルに対するａ１Ｚスコアが２．５、５、７．５又は１０より大きい単一ヌクレオチドバリアント位置を有するサンプル（例えば、腫瘍又は細胞を含まない血漿サンプル）は、候補変異として計数される。

【0270】

特定の実施形態において、範囲の下限で１００、２５０、５００、１，０００、２０００、２５００、５０００、１０，０００、２０，０００、２５，００００、５０，０００又は１００，０００より多く、上限で２０００、２５００、５，０００、７，５００、１０，０００、２５，０００、５０，０００、１００，０００、２５０，０００又は５００，０００個のリードのリード深度が、単一ヌクレオチドバリアント位置のセットにおける各々の単一ヌクレオチドバリアント位置についての配列決定ランで達成される。典型的には、配列決定ランは、高スループット配列決定ランである。試験中のサンプルについて作成された平均又は中央値の値は、例示的な実施形態において、リード深度によって重み付けされる。したがって、バリアント対立遺伝子決定が、１０００リードにおいて１つのバリアント対立遺伝子が検出されたサンプル中で実際のものである尤度は、１０，０００リードにおいて１つのバリアント対立遺伝子が検出されたサンプルよりも大きく重み付けされる。バリアント対立遺伝子（すなわち変異）の決定が、１００％の信頼性で行われないため、特定された単一ヌクレオチドバリアントは、候補バリアント又は候補変異と考えられてもよい。

【0271】

Ｇ．フェージングデータの分析のための例示的な試験統計
例示的な試験統計は、遺伝的に同一ではない２つ以上の細胞に由来するＤＮＡ又はＲＮＡを含有する混合サンプルであることが知られているか、又はそれが疑われるサンプルからのフェージングデータの分析について、以下に記載される。ｆは、目的のＤＮＡ又はＲＮＡの分率、例えば、目的のＣＮＶを含むＤＮＡ又はＲＮＡの分率、又は目的の細胞、例えば、がん細胞からのＤＮＡ又はＲＮＡの分率を示す。がん試験のいくつかの実施形態において、ｆは、がん細胞と正常細胞の混合物中のがん細胞からのＤＮＡ又はＲＮＡの分率を示すか、又はｆは、がん細胞と正常細胞の混合物におけるがん細胞の分率を示す。なお、これは、ＤＮＡの２つのコピーが目的の各々の細胞によって与えられると仮定すると、目的の細胞からのＤＮＡの分率を指す。これは、欠失又は重複しているセグメントでの目的の細胞からのＤＮＡの分率とは異なる。

【0272】

各ＳＮＰの可能な対立遺伝子の値は、Ａ及びＢで示される。ＡＡ、ＡＢ、ＢＡ及びＢＢは、全ての可能な順序付き対立遺伝子対を示すために使用される。いくつかの実施形態において、順序付き対立遺伝子ＡＢ又はＢＡを含むＳＮＰが分析される。Ｎ_ｉは、ｉ番目のＳＮＰの配列リード数を示し、Ａ_ｉ及びＢ_ｉは、それぞれ対立遺伝子Ａ及びＢを示すｉ番目のＳＮＰのリード数を示すとする。以下を仮定する。
Ｎ_ｉ＝Ａ_ｉ＋Ｂ_ｉ。

【0273】

対立遺伝子比率Ｒｉは、以下のように定義される。

【数5】

【0274】

Ｔは、標的とされるＳＮＰの数を示す。

【0275】

一般性を失うことなく、いくつかの実施形態は、単一染色体セグメントに焦点を当てる。更なる明確性の問題として、本明細書において、「第２の相同染色体セグメントと比較した場合の第１の相同染色体セグメント」との句は、染色体セグメントの第１のホモログ及び染色体セグメントの第２のホモログを意味する。いくつかのこのような実施形態において、標的ＳＮＰの全てが、目的のセグメント染色体に含有される。他の実施形態において、複数の染色体セグメントは、可能なコピー数多型について分析される。

【0276】

ＭＡＰ推定
この方法は、標的セグメントの欠失又は重複を検出するために、順序付き対立遺伝子対を介したフェージングの知識を活用する。各ＳＮＰｉについて、以下のように定義する。

【数6】

【0277】

次いで、以下のように定義する。

【数7】

【0278】

様々なコピー数仮説（例えば、ダイソミーの仮説、第１又は第２のホモログの欠失、又は第１又は第２のホモログの重複）でのＸ_ｉ及びＳの分布を以下に記載する。

【0279】

ダイソミー仮説
標的セグメントが欠失又は重複していないという仮説の下、

【数8】

式中、

【数9】

【0280】

一定のリード深度Ｎを仮定すると、以下のパラメータを有する二項分布Ｓを与える。

【数10】

及びＴ。

【0281】

欠失仮説
第１のホモログが欠失する（すなわちＡＢＳＮＰがＢになり、ＢＡＳＮＰがＡになる）という仮説の下で、Ｒｉは、二項分布を有し、ＡＢＳＮＰについてパラメータ

【数11】

及びＴであり、ＢＡＳＮＰについて

【数12】

及びＴを有する。したがって、

【数13】

【0282】

一定のリード深度Ｎを仮定すると、以下のパラメータを有する二項分布Ｓを与える。

【数14】

及びＴ。

【0283】

第２のホモログが欠失する（すなわちＡＢＳＮＰがＡになり、ＢＡＳＮＰがＢになる）という仮説の下で、Ｒ_ｉは、二項分布を有し、ＡＢＳＮＰについてパラメータ

【数15】

及びＴであり、ＢＡＳＮＰについて

【数16】

及びＴを有する。したがって、

【数17】

【0284】

一定のリード深度Ｎを仮定すると、以下のパラメータを有する二項分布Ｓを与える。

【数18】

及びＴ。

【0285】

重複仮説
第１のホモログが重複する（すなわちＡＢＳＮＰがＡＡＢになり、ＢＡＳＮＰがＢＢＡになる）という仮説の下で、Ｒ_ｉは、二項分布を有し、ＡＢＳＮＰについてパラメータ

【数19】

及びＴであり、ＢＡＳＮＰについて

【数20】

及びＴを有する。したがって、

【数21】

【0286】

一定のリード深度Ｎを仮定すると、以下のパラメータを有する二項分布Ｓを与える。

【数22】

及びＴ。

【0287】

第２のホモログが重複する（すなわちＡＢＳＮＰがＡＢＢになり、ＢＡＳＮＰがＢＡＡになる）という仮説の下で、Ｒ_ｉは、二項分布を有し、ＡＢＳＮＰについてパラメータ

【数23】

及びＴであり、ＢＡＳＮＰについて

【数24】

及びＴを有する。したがって、

【数25】

【0288】

一定のリード深度Ｎを仮定すると、以下のパラメータを有する二項分布Ｓを与える。

【数26】

及びＴ。

【0289】

分類
上の章で示されるように、Ｘ_ｉは、以下を有する、バイナリランダム変数である

【数27】

【0290】

これにより、各仮説の下で試験統計Ｓの確率を計算することができる。測定データを考慮した各仮説の確率を計算することができる。いくつかの実施形態において、最大確率を有する仮説が選択される。所望な場合、Ｓについての分布は、各Ｎ_ｉを一定の到達深さＮで概算することによって、又はリード深度を一定値Ｎに切り捨てることによって単純化することができる。この単純化は、以下を与える。

【数28】

【0291】

ｆの値は、測定データを考慮した、ｆの最も可能性の高い値、例えば、アルゴリズム（例えば、検索アルゴリズム）、例えば、最大尤度の推定、経験的な最大推定又はベイズ推定を用いた最良データフィッティングを作成するｆの値を選択することによって、推定することができる。いくつかの実施形態において、複数の染色体セグメントが分析され、ｆの値は、各セグメントについてのデータに基づいて推定される。全ての標的細胞が、これらの重複又は欠失を有する場合、これらの異なるセグメントについてのデータに基づくｆの推定値は同様である。いくつかの実施形態において、ｆは、例えば、がん及び非がん性ＤＮＡ又はＲＮＡのメチル化（低メチル化又は高メチル化）の差に基づき、がん細胞からのＤＮＡ又はＲＮＡの分率を決定することによって、実験的に測定される。

【0292】

単一仮説拒否
ダイソミー仮説についてのＳの分布は、ｆに依存しない。したがって、測定データの確率は、ｆを計算することなく、ダイソミー仮説について計算することができる。単一仮説否定試験は、ダイソミーの帰無仮説に使用することができる。いくつかの実施形態において、ダイソミー仮説についてのＳの確率が計算され、ダイソミーの仮説は、その確率が所与の閾値を下回る場合（例えば、１，０００分の１未満である場合）、否定される。このことは、染色体セグメントの重複又は欠失が存在することを示す。所望な場合、偽陽性率は、閾値を調整することによって変えることができる。

【0293】

Ｈ．フェージングデータの分析のための例示的な方法
例示的な方法は、遺伝的に同一ではない２つ以上の細胞に由来するＤＮＡ又はＲＮＡを含有する混合サンプルであることが知られているか、又はそれが疑われるサンプルからのデータの分析について、以下に記載される。いくつかの実施形態において、フェージングデータが使用される。いくつかの実施形態において、本方法は、各対立遺伝子比率の計算値について、ある特定の遺伝子座についての対立遺伝子比率の計算値が対立遺伝子比率の予測値を上回るか、又は下回るかと、その差の大きさを決定することを伴う。いくつかの実施形態において、尤度分布は、特定の仮説についての遺伝子座での対立遺伝子比率について決定され、対立遺伝子比率の計算値が尤度分布の中心に近いほど、その仮説が正しい可能性が高い。いくつかの実施形態において、本方法は、ある仮説が各遺伝子座について正しい尤度を決定することを伴う。いくつかの実施形態において、本方法は、ある仮説が各遺伝子座について正しい尤度を決定することと、各遺伝子座についてのその仮説の確率を組み合わせることとを伴い、最大の結合確率を有する仮説が選択される。いくつかの実施形態において、本方法は、ある仮説が、各遺伝子座について、また、サンプル中の総ＤＮＡ又はＲＮＡに対する１つ以上の標的細胞からのＤＮＡ又はＲＮＡの各々の可能な比率について、正しい尤度を決定することを伴う。いくつかの実施形態において、各仮説についての結合確率は、各遺伝子座及び各可能な比率についての仮説の確率を合わせることによって決定され、最大の結合確率を有する仮説が選択される。

【0294】

一実施形態において、以下の仮説が考慮される：Ｈ_１１（全ての細胞が正常である）、Ｈ_１０（ホモログ１のみを有する細胞の存在、したがって、ホモログ２の欠失）、Ｈ_０１（ホモログ２のみを有する細胞の存在、したがって、ホモログ１の欠失）、Ｈ_２１（ホモログ１の重複を有する細胞の存在）、Ｈ_１２（ホモログ２の重複を有する細胞の存在）。がん細胞又はモザイク細胞などの標的細胞の分率ｆ（又は標的細胞からのＤＮＡ又はＲＮＡの分率）について、ヘテロ接合性（ＡＢ又はＢＡ）ＳＮＰについての対立遺伝子比率の予測値は、以下のように見出すことができる。

【0295】

数式（１）：

【数29】

【0296】

バイアス、コンタミネーション及び配列決定エラーの修正：
ＳＮＰでの観測Ｄ_ｓは、各対立遺伝子が存在する元々のマッピングされたリードの数ｎ_Ａ ^０及びｎ_Ｂ ^０からなる。次いで、Ａ及びＢの対立遺伝子の増幅におけるバイアスの予想値を用い、修正されたリードｎ_Ａ及びｎ_Ｂを見出すことができる。

【0297】

ｃ_ａは、周囲コンタミネーション（例えば、空気又は環境中のＤＮＡからのコンタミネーション）を示し、ｒ（ｃ_ａ）は、周囲汚染物質についての対立遺伝子比率を示す（最初は０．５とみなされる）。更に、ｃ_ｇは、遺伝子型コンタミネーション率（例えば、別のサンプルからのコンタミネーション）を示し、ｒ（ｃ_ｇ）は、その汚染物質についての対立遺伝子比率である。ｓ_ｅ（Ａ，Ｂ）及びｓ_ｅ（Ｂ，Ａ）は、１つの対立遺伝子を異なる対立遺伝子とコールする配列決定エラーを示す（例えば、Ｂ対立遺伝子が存在する場合に、Ａ対立遺伝子を誤って検出することによる）。

【0298】

周囲コンタミネーション、遺伝子型コンタミネーション及び配列決定エラーを修正することによって、所与の対立遺伝子比率の予測値ｒについて、対立遺伝子比率の観測値ｑ（ｒ，ｃａ，ｒ（ｃａ），ｃｇ，ｒ（ｃｇ），ｓｅ（Ａ，Ｂ），ｓｅ（Ｂ，Ａ））を見出すことができる。

【0299】

汚染物質の遺伝子型は不明であるため、集合頻度を使用して、Ｐ（ｒ（ｃ_ｇ））を見出すことができる。より具体的には、ｐは、対立遺伝子の１つ（参照対立遺伝子と呼ばれる場合がある）についての集合頻度である。次いで、本願発明者らは、Ｐ（ｒ（ｃ_ｇ）＝０）＝（１－ｐ）^２、Ｐ（ｒ（ｃ_ｇ）＝０）＝２ｐ（１－ｐ）及びＰ（ｒ（ｃ_ｇ）＝０）＝ｐ^２を有する。ｒ（ｃ_ｇ）にわたる条件付期待値を使用して、Ｅ［ｑ（ｒ，ｃ_ａ，ｒ（ｃ_ａ），ｃ_ｇ，ｒ（ｃ_ｇ），ｓ_ｅ（Ａ，Ｂ），ｓ_ｅ（Ｂ，Ａ））］を決定することができる。なお、周囲コンタミネーション及び遺伝子型コンタミネーションは、ホモ接合性ＳＮＰを用いて決定され、したがって、欠失又は重複の有無によって影響を受けない。更に、所望な場合、参照染色体を用い、周囲コンタミネーション及び遺伝子型コンタミネーションを測定することが可能である。

【0300】

各ＳＮＰでの尤度：
以下の式は、対立遺伝子比率ｒを考慮して、ｎ_Ａ及びｎ_Ｂを観測する確率を与える。

【0301】

数式（２）：

【数30】

【0302】

Ｄ_ｓは、ＳＮＰについてのデータを示すとする。各仮説ｈε｛Ｈ_１１，Ｈ_０１，Ｈ_１０，Ｈ_２１，Ｈ_１２｝について、数式（１）においてｒ＝ｒ（ＡＢ，ｈ）又はｒ＝ｒ（ＢＡ，ｈ）として、ｒ（ｃ_ｇ）にわたる条件付期待値を見出し、対立遺伝子比率の観測値Ｅ［ｑ（ｒ，ｃ_ａ，ｒ（ｃ_ａ），ｃ_ｇ，ｒ（ｃ_ｇ））］を決定することができる。次いで、数式（２）においてｒ＝Ｅ［ｑ（ｒ，ｃ_ａ，ｒ（ｃ_ａ），ｃ_ｇ，ｒ（ｃ_ｇ），ｓ_ｅ（Ａ，Ｂ），ｓ_ｅ（Ｂ，Ａ））］として、Ｐ（Ｄ_ｓ｜ｈ，ｆ）を決定することができる。

【0303】

検索アルゴリズム：
いくつかの実施形態において、外れ値であると思われる対立遺伝子比率を有するＳＮＰは、無視される（例えば、平均値よりも少なくとも２又は３の標準偏差分、上又は下である対立遺伝子比率を有するＳＮＰを無視するか、又は除外することによる）。なお、この手法について特定される利点は、より高い割合のモザイク存在下、対立遺伝子比率の可変性を高くし得るため、ＳＮＰがモザイクに起因してトリミングされないことを確実にすることである。

【0304】

Ｆ＝｛ｆ_１，・・・・，ｆ_Ｎ｝は、モザイクの割合についての検索空間を示すとする（例えば、腫瘍分率）。各ＳＮＰ及びｆεＦでのＰ（Ｄ_ｓ｜ｈ，ｆ）を決定し、全ＳＮＰにわたる尤度を組み合わせることができる。

【0305】

このアルゴリズムは、各仮説について、各ｆにわたって行う。検索方法を用い、欠失又は重複仮説の信頼性が、欠失がなく、重複がない仮説の信頼性よりも高い場合に、ｆの範囲Ｆ｛１＞＊＜１｝が存在するとき、モザイクが存在すると結論付ける。いくつかの実施形態において、Ｆ＊におけるＰ（Ｄ_ｓ｜ｈ，ｆ）についての最大尤度推定値が決定される。所望な場合、ｆεＦ＊にわたる条件付期待値を決定してもよい。所望な場合、各仮説についての信頼性を決定することができる。

【0306】

いくつかの実施形態において、ベータ二項分布が、二項分布の代わりに使用される。いくつかの実施形態において、参照染色体又は染色体セグメントを使用して、ベータ二項式のサンプル特有のパラメータを決定する。

【0307】

シミュレーションを用いた理論性能：
所望な場合、所与のリード深度（ＤＯＲ）で、参照リードの数をＳＮＰにランダムに割り当てることによって、アルゴリズムの理論性能を評価することができる。通常の場合、二項確率パラメータについてｐ＝０．５を使用し、欠失又は重複について、ｐをそれに応じて修正する。各シミュレーションの例示的な入力パラメータは、以下のとおりである。（１）ＳＮＰの数Ｓ、（２）ＳＮＰ当たりの一定ＤＯＲＤ、（３）ｐ及び（４）実験数。

【0308】

第１のシミュレーション実験：
この実験は、Ｓε｛５００，１０００｝，Ｄε｛５００，１０００｝及びｐε｛０％，１％，２％，３％，４％，５％｝に焦点が当てられた。各設定で、１，０００のシミュレーション実験を行った（したがって、フェーズを伴う２４，０００実験及びフェーズを伴わない２４，０００実験）。二項分布からのリード数をシミュレーションした（所望な場合、他の分布を使用してもよい）。偽陽性率（ｐ＝０％の場合）及び偽陰性率（ｐ＞０％の場合）は、フェーズ情報を用い、又はフェーズ情報を用いずに決定した。なお、特にＳ＝１０００、Ｄ＝１０００について、フェーズ情報は非常に有用である。しかし、Ｓ＝５００、Ｄ＝５００について、このアルゴリズムは、試験される条件からのフェーズアウトの有無にかかわらず、最も高い偽陽性率を有する。

【0309】

フェーズ情報は、特に、低いモザイク割合（≦３％）で有用である。フェーズ情報がなければ、欠失に対する信頼性が、Ｈ１０及びＨ０１に対して等しい機会を割り当てることによって決定されるため、ｐ＝１％について高レベルの偽陰性が観測され、１つの仮説に有利な小さな偏差は、他の仮説からの低い尤度を補うのに十分ではない。このことは、重複にも同様に当てはまる。また、このアルゴリズムは、ＳＮＰの数と比較して、リード深度に対してより感度が高いようである。フェーズ情報を用いた結果について、完全なフェーズ情報が、多数の連続ヘテロ接合性ＳＮＰについて利用可能であると仮定する。所望な場合、ハプロタイプ情報は、より小さなセグメントについてのハプロタイプを確率的に合わせることによって得ることができる。

【0310】

第２のシミュレーション実験：
この実験は、各々の設定で、Ｓε｛１００，２００，３００，４００，５００｝、Ｄε｛１０００，２０００，３０００，４０００，５０００｝及びｐε｛０％，１％，１．５％，２％，２．５％，３％｝及び１００００のランダム実験に焦点が当てられた。偽陽性率（ｐ＝０％の場合）及び偽陰性率（ｐ＞０％の場合）は、フェーズ情報を用い、又はフェーズ情報を用いずに決定した。偽陰性率は、ハプロタイプ情報を用い、Ｄ≧３０００及びＮ≧２００について１０％未満であり、一方、Ｄ＝５０００及びＮ≧４００について同じ性能に達する。小さなモザイク割合について、偽陰性率の差は特に目立つものであった。例えば、ｐ＝１％の場合、ハプロタイプデータがなければ、２０％未満の偽陰性率は決して達成されず、一方、Ｎ≧３００及びＤ≧３０００については０％に近い。ｐ＝３％の場合、ハプロタイプデータを用いると０％の偽陰性率が観測され、一方、ハプロタイプデータがなければ、同じ性能に達するのにＮ≧３００及びＤ≧３０００が必要である。

【0311】

Ｉ．フェージングデータを用いずに欠失及び重複を検出するための例示的な方法
いくつかの実施形態において、非フェージング遺伝子データを使用して、個体のゲノムにおいて（例えば、１つ以上の細胞のゲノムにおいて、又はｃｆＤＮＡ又はｃｆＲＮＡにおいて）、第２の相同染色体セグメントと比較して、第１の相同染色体セグメントのコピー数の過剰表現が存在するかどうかを決定する。いくつかの実施形態において、フェージング遺伝子データを使用するが、フェージングは無視される。いくつかの実施形態において、ＤＮＡ又はＲＮＡのサンプルは、２つ以上の遺伝的に異なる細胞からのｃｆＤＮＡ又はｃｆＲＮＡを含む固体からのｃｆＤＮＡ又はｃｆＲＮＡの混合サンプルである。いくつかの実施形態において、本方法は、各遺伝子座について、対立遺伝子比率の計算値と対立遺伝子比率の予測値との差の大きさを利用する。

【0312】

いくつかの実施形態において、本方法は、各遺伝子座での各対立遺伝子の量を測定することによって、個体からの１つ以上の細胞からのＤＮＡ又はＲＮＡのサンプル中の染色体又は染色体セグメント上の多型遺伝子座のセットでの遺伝子データを得ることを伴う。いくつかの実施形態において、対立遺伝子比率は、サンプルの由来となる少なくとも１つの細胞においてヘテロ接合性である遺伝子座について計算される。いくつかの実施形態において、特定の遺伝子座について対立遺伝子比率の計算値は、対立遺伝子の１つの測定量を、その遺伝子座についての全ての対立遺伝子の総測定量によって割り算したものである。いくつかの実施形態において、特定の遺伝子座について対立遺伝子比率の計算値は、対立遺伝子（例えば、第１の相同染色体セグメント上の対立遺伝子）の１つの測定量を、その遺伝子座についての１つ以上の他の対立遺伝子（例えば、第２の相同染色体セグメント上の対立遺伝子）の測定量によって割り算したものである。対立遺伝子比率の計算値及び対立遺伝子比率の予測値は、本明細書に記載される方法のいずれか、又は任意の標準的な方法（例えば、本明細書に記載される対立遺伝子比率の計算値又は対立遺伝子比率の予測値の任意の数学的変換）を用いて計算されてもよい。

【0313】

いくつかの実施形態において、試験統計は、各遺伝子座について、対立遺伝子比率の計算値と対立遺伝子比率の予測値との差の大きさに基づいて計算される。いくつかの実施形態において、試験統計Δは、以下の式を用いて計算される。

【数31】

【0314】

式中、δ_ｉは、ｉ番目の遺伝子座についての対立遺伝子比率の計算値と対立遺伝子比率の予測値との間の差の大きさであり、

【0315】

μ_ｉは、δ_ｉの平均値であり、

【0316】

【数32】

は、δ_ｉの標準偏差である。

【0317】

例えば、本願発明者らは、対立遺伝子比率の予測値が０．５である場合に、δ_ｉを以下のように定義することができる。

【数33】

【0318】

μ_ｉ及びσ_ｉについての値は、Ｒ_ｉが二項ランダム変数であるという事実を使用して計算することができる。いくつかの実施形態において、標準偏差は、全ての遺伝子座について同じであると仮定される。いくつかの実施形態において、標準偏差の平均値又は重み付けされた平均値、又は標準偏差の推定値が、

【数34】

の値について使用される。いくつかの実施形態において、試験統計は、正規分布を有すると仮定される。例えば、中心極限定理は、遺伝子座の数（例えば、ＳＮＰの数Ｔ）が大きくなるにつれて、Δの分布が正規分布に収束することを示唆する。

【0319】

いくつかの実施形態において、細胞の１つ以上のゲノム中の染色体又は染色体セグメントのコピー数を示す１つ以上の仮説のセットが列挙される。いくつかの実施形態において、試験統計に基づいて最も可能性が高い仮説が選択され、それによって、細胞の１つ以上のゲノム中の染色体又は染色体セグメントのコピー数を決定する。いくつかの実施形態において、試験統計が、ある仮説についての試験統計の分布に属する確率が上限閾値を超える場合、その仮説が選択される。試験統計が、ある仮説についての試験統計の分布に属する確率が、下限閾値を下回る場合、その１つ以上の仮説は否定されるか、又は試験統計が、ある仮説についての試験統計の分布に属する確率が、下限閾値から上限閾値の間である場合、又はその確率が、十分に高い信頼性で決定されない場合、その仮説は、選択されず、又は否定もされない。いくつかの実施形態において、上限閾値及び／又は下限閾値は、例えば、トレーニングデータからの分布（例えば、既知のコピー数を有するサンプル、例えば、二倍体サンプル又は特定の欠失又は重複を有することが知られているサンプル）からの経験的な分布から決定される。このような経験的な分布を使用して、単一仮説否定試験のための閾値を選択することができる。なお、試験統計Δは、Ｓから独立しているため、所望な場合、どちらも独立して使用することができる。

【0320】

Ｊ．対立遺伝子分布又はパターンを使用して欠失又は重複を検出するための例示的な方法
この章は、第２の相同染色体セグメントと比較して、第１の相同染色体セグメントのコピー数の過剰出現が存在するかどうかを決定する方法を含む。いくつかの実施形態において、本方法は、（ｉ）個体の１つ以上の細胞（例えばがん細胞）のゲノム中に存在する染色体又は染色体セグメントのコピー数を示す複数の仮説、又は（ｉｉ）個体の１つ以上の細胞のゲノム中の第２の相同染色体セグメントと比較して、第１の相同染色体セグメントのコピー数の過剰出現の程度を示す複数の仮説を列挙することを伴う。いくつかの実施形態において、本方法は、染色体又は染色体セグメント上の複数の多型遺伝子座（例えばＳＮＰ遺伝子座）で個体から遺伝子データを得ることを伴う。いくつかの実施形態において、各々の仮説についての個体の予測遺伝子型の確率分布が作成される。いくつかの実施形態において、得られた個体の遺伝子データと個体の予測遺伝子型の確率分布との間のデータフィッティングが計算される。いくつかの実施形態において、１つ以上の仮説は、データフィッティングに従ってランク付けされ、最も高くランク付けされた仮説が選択される。いくつかの実施形態において、検索アルゴリズムなどの技術又はアルゴリズムは、データフィッティングを計算する工程、仮説をランク付けする工程、又は最も高くランク付けされた仮説を選択する工程のうちの１つ以上のために使用される。いくつかの実施形態において、データフィッティングは、ベータ二項分布に対するフィッティング又は二項分布に対するフィッティングである。いくつかの実施形態において、この技術又はアルゴリズムは、最大尤度の推定、経験的な最大推定、ベイズ推定、動的推定（例えば、動的ベイズ推定）及び期待最大化推定からなる群から選択される。いくつかの実施形態において、本方法は、得られた遺伝子データと遺伝子データの予測値に対して、上述の技術又はアルゴリズムを適用することを含む。

【0321】

いくつかの実施形態において、本方法は、（ｉ）個体の１つ以上の細胞（例えばがん細胞）のゲノム中に存在する染色体又は染色体セグメントのコピー数を示す複数の仮説、又は（ｉｉ）個体の１つ以上の細胞のゲノム中の第２の相同染色体セグメントと比較して、第１の相同染色体セグメントのコピー数の過剰出現の程度を示す複数の仮説を列挙することを伴う。いくつかの実施形態において、本方法は、染色体又は染色体セグメント上の複数の多型遺伝子座（例えばＳＮＰ遺伝子座）で個体から遺伝子データを得ることを伴う。いくつかの実施形態において、遺伝子データは、複数の多型遺伝子座についての対立遺伝子数を含む。いくつかの実施形態において、各仮説についての染色体又は染色体セグメント上の複数の多型遺伝子座での対立遺伝子数の予測値について、結合分布モデルが作成される。いくつかの実施形態において、仮説のうちの１つ以上の相対確率は、結合分布モデル及びサンプルについて測定された対立遺伝子数を用いて決定され、最大確率を有する仮説が選択される。

【0322】

いくつかの実施形態において、対立遺伝子の分布又はパターン（例えば、対立遺伝子比率の計算値のパターン）を使用して、ＣＮＶ（例えば、欠失又は重複）の有無を決定する。所望な場合、ＣＮＶの親起源は、このパターンに基づいて決定することができる。

【0323】

Ｋ．例示的な計数方法／定量方法
いくつかの実施形態において、１つ以上の計数方法（定量方法とも呼ばれる）を使用して、１つ以上のＣＮＳ（例えば、染色体セグメント又は全染色体の欠失又は重複）を検出する。いくつかの実施形態において、１つ以上の計数方法を使用して、第１の相同染色体セグメントのコピー数の過剰出現が、第１の相同染色体セグメントの重複又は第２の相同染色体セグメントの欠失に起因するかどうかを決定する。いくつかの実施形態において、１つ以上の計数方法を使用して、重複する染色体セグメント又は染色体の過剰なコピー数（例えば、１、２、３、４、又はもっと多い過剰なコピーが存在するかどうか）を決定する。いくつかの実施形態において、１つ以上の計数方法を使用して、多くの重複を有し、腫瘍分率が小さいサンプルを、重複が少なく、腫瘍分率が多いサンプルから区別する。例えば、１つ以上の計数方法を使用して、２つの過剰な染色体コピーを有し、腫瘍分率が２０％であるサンプルから、４つの過剰な染色体コピーを有し、腫瘍分率が１０％であるサンプルを区別してもよい。例示的な方法は、例えば、米国公開第２００７／０１８４４６７号、第２０１３／０１７２２１１号及び第２０１２／０００３６３７号、米国特許第８，４６７，９７６号、第７，８８８，０１７号、第８，００８，０１８号、第８，２９６，０７６号及び第８，１９５，４１５号、２０１４年６月５日に出願された米国出願第６２／００８，２３５号及び２０１４年８月４日に出願された米国出願第６２／０３２，７８５号に開示されており、各々が、全体として参照により本明細書に組み込まれる。

【0324】

いくつかの実施形態において、計数方法は、１つ以上の所与の染色体又は染色体セグメントにマッピングするＤＮＡ配列に基づくリードの数を計数することを含む。いくつかのこのような方法は、特定の染色体又は染色体セグメントにマッピングするＤＮＡ配列リードの数についての参照値（カットオフ値）の作成を伴い、過剰な値のリード数は、特定の遺伝子異常の指標である。

【0325】

いくつかの実施形態において、１つ以上の遺伝子座についての全ての対立遺伝子の総測定量（例えば、多型又は非多型遺伝子座の総数）を参照値と比較する。いくつかの実施形態において、参照量は、（ｉ）閾値又は（ｉｉ）特定のコピー数仮説についての予測量である。いくつかの実施形態において、参照量（ＣＮＶが存在しない場合）は、欠失又は重複を有しないことが知られているか、又は予測される１つ以上の染色体又は染色体セグメントについての１つ以上の遺伝子座についての全ての対立遺伝子の総測定量である。いくつかの実施形態において、参照量（ＣＮＶが存在する場合）は、欠失又は重複を有することが知られているか、又は予測される１つ以上の染色体又は染色体セグメントについての１つ以上の遺伝子座についての全ての対立遺伝子の総測定量である。いくつかの実施形態において、参照量は、１つ以上の参照染色体又は染色体セグメントについての１つ以上の遺伝子座についての全ての対立遺伝子の総測定量である。いくつかの実施形態において、参照量は、２つ以上の異なる染色体、染色体セグメント、又は異なるサンプルについて決定される値の平均又は中央値である。いくつかの実施形態において、ランダム（例えば、超並列ショットガン配列決定）又は標的化配列決定を使用して、１つ以上の多型又は非多型遺伝子座の量を決定する。

【0326】

参照量を利用するいくつかの実施形態において、本方法は、（ａ）目的の染色体又は染色体セグメントに対する遺伝物質の量を測定することと、（ｂ）工程（ａ）からの量を参照量と比較することと、（ｃ）この比較に基づき、欠失又は重複の有無を特定することと、を含む。

【0327】

参照染色体又は染色体セグメントを利用するいくつかの実施形態において、本方法は、サンプルからのＤＮＡ又はＲＮＡを配列決定して、標的遺伝子座に整列する複数の配列タグを得ることを含む。いくつかの実施形態において、配列タグは、特定の標的遺伝子座に割り当てられるのに十分な長さを有し（例えば、１５～１００ヌクレオチド長）、標的遺伝子座は、サンプル中に異常な分布を有することが疑われる少なくとも１つの第１の染色体又は染色体セグメントと、サンプル中に正常に分布していると推定される少なくとも１つの第２の染色体又は染色体セグメントとを含む、複数の異なる染色体又は染色体セグメントに由来する。いくつかの実施形態において、複数の配列タグは、それらの対応する標的遺伝子座に割り当てられる。いくつかの実施形態において、第１の染色体又は染色体セグメントの標的遺伝子座に割り当てる配列タグの数と、第２の染色体又は染色体セグメントの標的遺伝子座に割り当てる配列タグの数を決定する。いくつかの実施形態において、これらの数を比較して、第１の染色体又は染色体セグメントの異常分布（例えば、欠失又は重複）の有無を決定する。

【0328】

いくつかの実施形態において、ｆの値（例えば、腫瘍分率）をＣＮＶ決定に使用して、例えば、２つの染色体又は染色体セグメントの量の差の観測値と、ｆの値を考慮して特定の種類のＣＮＶについて予測される差とを比較する（例えば、各々、全体として参照により本明細書に組み込まれる、米国公開第２０１２／０１９００２０号、米国公開第２０１２／０１９００２１号、米国公開第２０１２／０１９０５５７号、米国公開第２０１２／０１９１３５８号を参照）。例えば、ダイソミー参照染色体セグメントと比較した、腫瘍中で重複する染色体セグメントの量の差は、腫瘍分率が増加するにつれて増加する。いくつかの実施形態において、本方法は、目的の染色体又は染色体セグメントの相対頻度を、参照染色体又は染色体セグメント（例えば、ダイソミーであると予測されるか、又は知られている染色体又は染色体セグメント）と、ｆの値とを比較して、ＣＮＶの尤度を決定することを含む。例えば、第１の染色体又は染色体セグメントと、参照染色体又は染色体セグメントの量の差を、様々な可能なＣＮＶについてのｆの値を考慮して予測されるもの（例えば、目的の染色体セグメントの１つ又は２つの過剰なコピー）と比較してもよい。

【0329】

以下の仮想例は、第１の相同染色体セグメントの重複と第２の相同染色体セグメントの欠失とを区別するための計数方法／定量方法の使用を示す。宿主の正常なダイソミーゲノムがベースラインであると考えると、正常細胞及びがん細胞の混合物の分析は、混合物中のベースラインとがんのＤＮＡとの平均差を与える。例えば、サンプル中のＤＮＡの１０％が、アッセイによって標的とされる染色体の領域にわたって欠失を有する細胞に由来する場合を想像する。いくつかの実施形態において、定量手法は、この領域に対応するリードの量が、正常サンプルについて予測される量の９５％であると予測されることを示す。これは、標的領域の欠失を有する腫瘍細胞各々における２つの標的染色体領域の１つが欠けているため、この領域にマッピングするＤＮＡの総量は、９０％（正常細胞の場合）＋１／２×１０％（腫瘍細胞の場合）＝９５％である。これに代えて、いくつかの実施形態において、対立遺伝子手法は、ヘテロ接合性遺伝子座での対立遺伝子の比率が平均で１９：２０であることを示す。次に、サンプル中のＤＮＡの１０％が、アッセイによって標的とされる染色体の領域の５倍の焦点増幅を有する細胞に由来する場合を想像する。いくつかの実施形態において、定量手法は、この領域に対応するリードの量が、正常サンプルについて予測される量の１２５％であると予測されることを示す。これは、５倍の焦点増幅を有する腫瘍細胞各々における２つの標的染色体領域の１つが、標的領域にわたって過剰に５倍コピーされるため、この領域にマッピングするＤＮＡの総量は、９０％（正常細胞の場合）＋（２＋５）×１０％（腫瘍細胞の場合）／２＝１２５％である。これに代えて、いくつかの実施形態において、対立遺伝子手法は、ヘテロ接合性遺伝子座での対立遺伝子の比率が平均で２５：２０であることを示す。なお、対立遺伝子手法のみを用いる場合、１０％のｃｆＤＮＡを含むサンプル中の染色体領域にわたる５倍の焦点増幅は、４０％のｃｆＤＮＡを含むサンプル中の同じ領域にわたる欠失と同じであるように見える場合がある。これらの２つの場合では、欠失の場合に過小出現するハプロタイプは、焦点重複を有する場合において、ＣＮＶを含まないハプロタイプであるように見え、欠失の場合において、ＣＮＶを有しないハプロタイプは、焦点重複の場合において、過剰出現するハプロタイプであるように見える。この対立遺伝子手法によって作成される尤度と、定量手法によって作成される尤度とを組み合わせることで、この２つの確率を区別する。

【0330】

Ｌ．参照サンプルを使用する例示的な計数方法／定量方法
１つ以上の参照サンプルを使用する例示的な定量方法は、２０１４年６月５日に出願された米国出願第６２／００８，２３５号及び２０１４年８月４日に出願された米国出願第６２／０３２，７８５号に記載されており、その全体が参照により本明細書に組み込まれる。いくつかの実施形態において、１つ以上の染色体又は目的の染色体上にＣＮＶを有しない可能性が最も高い１つ以上の参照サンプル（例えば、正常サンプル）は、腫瘍ＤＮＡ分率が最も高いサンプルを選択し、ｚスコアが０に最も近いサンプルを選択し、最も高い信頼性又は尤度を有するＣＮＶがないことに対応する仮説にデータが適合するサンプルを選択し、正常であることが知られているサンプルを選択し、がんを有する尤度が最も低い（例えば、年齢が低い、乳がんについてスクリーニングする場合に男性である、家族歴がないなどの）個体からのサンプルを選択し、ＤＮＡのインプット量が最も多いサンプルを選択し、信号ノイズ比が最も高いサンプルを選択し、がんを有するという尤度に相関関係があると考えられている他の基準に基づいてサンプルを選択し、又は基準のいくつかの組み合わせを用いてサンプルを選択することによって特定される。参照セットが選択されると、これらの場合がダイソミーであると仮定し、ＳＮＰ当たりのバイアス、すなわち、実験に特有の増幅及び各遺伝子座についての他の処理バイアスを推定することができる。次いで、この実験に特有のバイアスの推定値を使用して、目的の染色体、例えば、染色体２１の遺伝子座の測定におけるバイアスを、適切な場合には他の染色体遺伝子座について、ダイソミーが染色体２１について仮定されていない部分集合の一部ではないサンプルについて修正することができる。バイアスが、未知の倍数性を有するこれらのサンプルにおいて修正されたら、これらのサンプルについてのデータを、同じ方法又は異なる方法を用いて２回分析し、個体がトリソミー２１に罹患しているかどうかを決定することができる。例えば、定量方法を、未知の倍数性を有する残りのサンプルに対して使用してもよく、ｚスコアは、染色体２１について修正された遺伝子データの測定値を用いて計算することができる。これに代えて、染色体２１の倍数性状態の予備的な推定の一部として、がんを有することが疑われる個体からのサンプルの腫瘍分率を計算することができる。ダイソミーの場合（ダイソミー仮説）に予測される修正されたリードの割合と、トリソミーの場合（トリソミー仮説）に予測される修正されたリードの割合を、その腫瘍分率を有する場合について計算することができる。これに代えて、腫瘍分率が前もって測定されていない場合、ダイソミー仮説及びトリソミー仮説のセットが、異なる腫瘍分率について作成されてもよい。各々の場合について、様々なＤＮＡ遺伝子座の選択及び測定において、修正されたリードの割合の予測分布が、所与の予測統計変動を考慮して計算されてもよい。リードの修正された割合の観測値を、修正されたリードの割合の予測分布と比較してもよく、尤度比率を、未知の倍数性を有するサンプル各々について、ダイソミー及びトリソミー仮説について計算することができる。最も高い尤度の計算値を有する仮説に関連する倍数性状態を、正しい倍数性状態として選択することができる。

【0331】

いくつかの実施形態において、がんを有する尤度が十分に低いサンプルの部分集合を選択し、サンプルの対照セットとして機能させてもよい。この部分集合は、固定数であってもよく、又は閾値を下回るサンプルのみを選択することに基づき、可変数であってもよい。サンプルの部分集合からの定量データを、組み合わせ、平均を計算し、又は重み付け平均を用いて組み合わせてもよく、この重み付けは、正常であるサンプルの尤度に基づく。定量データを使用して、対照サンプルの即時バッチにおいてサンプルの配列決定をする増幅についての遺伝子座当たりのバイアスを決定してもよい。遺伝子座当たりのバイアスは、サンプルの他のバッチからのデータも含んでいてもよい。遺伝子座当たりのバイアスは、他の遺伝子座と比較して、その遺伝子座について観測される相対的な過剰増幅又は相対過小増幅を示していてもよく、サンプルの部分集合がＣＮＶを含有しないと仮定すると、過剰増幅又は過小増幅の任意の観測値が、増幅及び／又は配列決定又は他のバイアスに起因することを示していてもよい。遺伝子座当たりのバイアスは、アンプリコンのＧＣ含有量を考慮してもよい。遺伝子座は、遺伝子座当たりのバイアスを計算する目的のために、遺伝子座群にグループ分けされてもよい。複数の遺伝子座中の各々の遺伝子座について、遺伝子座当たりのバイアスが計算されると、サンプルの部分集合中にはないサンプルのうちの１つ以上についての配列決定データと、場合により、サンプルの部分集合中にあるサンプルのうちの１つ以上が、各遺伝子座についての定量測定を調整して、その遺伝子座でのバイアスの効果を除去することによって修正されてもよい。例えば、患者の部分集合において、ＳＮＰ１が、平均の２倍の大きさのリード深度を有すると観測された場合、調整は、その大きさの半分の数を有するＳＮＰ１からの対応するリード数に置き換えることを伴っていてもよい。問題となっている遺伝子座がＳＮＰである場合、調整は、その遺伝子座での各々の対立遺伝子に対応するリード数を半分にすることを伴っていてもよい。１つ以上のサンプル中の各々の遺伝子座についての配列決定データが調整されたら、１つ以上の染色体領域でのＣＮＶの存在を検出する目的のために、ある方法を用いて分析されてもよい。

【0332】

一例では、サンプルＡは、定量方法を用いて分析される正常細胞とがん性細胞の混合物に由来する増幅ＤＮＡの混合物である。以下は、例示的な可能なデータを示す。染色体２２上のｑアームの領域は、その領域にマッピングするＤＮＡの予測される値の９０％しか有していないことがわかり、ＨＥＲ２遺伝子に対応する焦点領域は、その領域にマッピングするＤＮＡの予測される値の１５０％を有することがわかり、染色体５のｐアームは、マッピングするＤＮＡの予測される値の１０５％を有することがわかっている。医師は、そのサンプルが、染色体２２上のｑアーム上の領域の欠失と、ＨＥＲ２遺伝子の重複を有することを推論し得る。医師は、２２ｑ欠失が乳がんにおいて一般的であるため、また、両染色体上の２２ｑ領域の欠失を有する細胞が、通常は生存しないことから、サンプル中のＤＮＡの約２０％が、２つの染色体のうちの１つの上の２２ｑ欠失を有する細胞に由来することを推論し得る。医師はまた、腫瘍細胞に由来する混合サンプルからのＤＮＡが、ＨＥＲ２領域及び２２ｑ領域が均質である遺伝的な腫瘍細胞のセットに由来する場合、その細胞が、ＨＥＲ２領域の５倍重複を含有することを推論し得る。

【0333】

一例では、サンプルＡは、対立遺伝子方法を用いても分析される。以下は、例示的な可能なデータを示す。染色体２２上のｑアーム上の同じ領域についての２つのハプロタイプは、４：５の比率で存在し、ＨＥＲ２遺伝子に対応する焦点領域における２つのハプロタイプは、１：２の比率で存在し、染色体５のｐアーム中の２つのハプロタイプは、２０：２１の比率で存在する。ゲノムの全ての他のアッセイされた領域は、いずれのハプロタイプも統計的に有意に過剰に含まない。医師は、そのサンプルが、２２ｑ領域、ＨＥＲ２領域及び５ｐアーム中のＣＮＶを有する腫瘍からのＤＮＡを含有すると推論し得る。２２ｑ欠失が乳がんにおいて非常に一般的であるという知識及び／又はゲノムの２２ｑ領域にマッピングするＤＮＡの量の過小出現を示す定量分析に基づき、医師は、２２ｑ欠失を有する腫瘍の存在を推論し得る。ＨＥＲ２増幅が乳がんにおいて非常に一般的であるという知識及び／又はゲノムのＨＥＲ２領域にマッピングするＤＮＡの量の過剰出現を示す定量分析に基づき、医師は、ＨＥＲ２増幅を有する腫瘍の存在を推論し得る。

【0334】

Ｍ．例示的な参照染色体又は染色体セグメント
いくつかの実施形態において、本明細書に記載される方法のいずれかが、１つ以上の参照染色体又は染色体セグメントに対しても行われ、その結果を、目的の１つ以上の染色体又は染色体セグメントについての結果と比較する。

【0335】

いくつかの実施形態において、参照染色体又は染色体セグメントは、ＣＮＶが存在しないことが予測される対照として使用される。いくつかの実施形態において、参照は、染色体又は染色体セグメント中に欠失又は重複を有しないことが知られているか、又は予測される１つ以上の異なるサンプルからの同じ染色体又は染色体セグメントである。いくつかの実施形態において、参照は、ダイソミーであると予測される試験されるサンプルからの異なる染色体又は染色体セグメントである。いくつかの実施形態において、参照は、試験されるのと同じサンプル中の目的の染色体の１つからの異なるセグメントである。例えば、参照は、潜在的な欠失又は重複の領域の外側にある１つ以上のセグメントであってもよい。試験されるのと同じ染色体についての参照を有することで、異なる染色体間の変動、例えば、代謝、アポトーシス、ヒストン、不活化及び／又は染色体間の増幅の差を回避する。試験されるのと同じ染色体上にＣＮＶを含まないセグメントを分析することも使用して、代謝、アポトーシス、ヒストン、不活化及び／又は染色体間の増幅の差を決定することができ、ＣＮＶが存在しないホモログ間の変動のレベルを、潜在的なＣＮＶからの結果と比較するために決定することを可能にする。いくつかの実施形態において、潜在的なＣＮＶについての対立遺伝子比率の計算値と予測値との差の大きさは、参照についての対応する大きさよりも大きく、それによって、ＣＮＶの存在を確認する。

【0336】

いくつかの実施形態において、参照染色体又は染色体セグメントは、ＣＮＶ（例えば、目的の特定の欠失又は重複）が存在することが予想される対照として使用される。いくつかの実施形態において、参照は、染色体又は染色体セグメント中に欠失又は重複を有することが知られているか、又は予測される１つ以上の異なるサンプルからの同じ染色体又は染色体セグメントである。いくつかの実施形態において、参照は、ＣＮＶを有することが知られているか、又は予測される試験されるサンプルからの異なる染色体又は染色体セグメントである。いくつかの実施形態において、潜在的なＣＮＶについての対立遺伝子比率の計算値と予測値との差の大きさは、ＣＮＶについての参照のための対応する大きさと同様であり（例えば、有意に異ならず）、それによって、ＣＮＶの存在を確認する。いくつかの実施形態において、潜在的なＣＮＶについての対立遺伝子比率の計算値と予測値との差の大きさは、ＣＮＶについての参照のための対応する大きさよりも小さく（例えば、有意に小さく）、それによって、ＣＮＶが存在しないことを確認する。いくつかの実施形態において、非がん性細胞の遺伝子型（又は非がん性細胞からのＤＮＡ又はＲＮＡ、例えば、ｃｆＤＮＡ又はｃｆＲＮＡ）とは異なる、がん細胞の遺伝子型についての１つ以上の遺伝子座（又はｃｆＤＮＡ又はｃｆＲＮＡなどのがん細胞からのＤＮＡ又はＲＮＡ）を使用して、腫瘍分率を決定する。腫瘍分率を使用して、第１の相同染色体セグメントのコピー数の過剰出現が、第１の相同染色体セグメントの重複又は第２の相同染色体セグメントの欠失に起因するかどうかを決定することができる。腫瘍分率を使用して、重複する染色体セグメント又は染色体の過剰なコピー数（例えば、１、２、３、４、又はもっと多い過剰なコピーが存在するかどうか）を決定し、例えば、２つの過剰な染色体コピーを有し、腫瘍分率が２０％であるサンプルから、４つの過剰な染色体コピーを有し、腫瘍分率が１０％であるサンプルを区別することもできる。腫瘍分率を使用して、観測されたデータが、可能なＣＮＶについての予測データとどの程度十分に適合するかを決定することもできる。いくつかの実施形態において、ＣＮＶの過剰出現の程度を使用して、個体のための特定の療法又は治療レジメンを選択する。例えば、いくつかの治療薬は、染色体セグメントの少なくとも４、６、又はもっと多くのコピーに対してのみ有効である。

【0337】

いくつかの実施形態において、腫瘍分率を決定するために使用される１つ以上の遺伝子座は、参照染色体又は染色体セグメント、例えば、ダイソミーであると知られているか、若しくは予測される染色体若しくは染色体セグメント、がん細胞全般において、若しくは有することが知られているか、若しくは有するリスクが上昇している個体の特定の種類のがんにおいてほとんど重複若しくは欠失しない染色体若しくは染色体セグメント、又は異数性の可能性が低い染色体若しくは染色体セグメント（例えば、欠失又は重複すると、細胞死を引き起こすと予測されるこのようなセグメント）に対するものである。いくつかの実施形態において、本発明の方法のいずれかを使用して、参照染色体又は染色体セグメントが、がん細胞及び非がん性細胞の両方においてダイソミーであることを確認する。いくつかの実施形態において、ダイソミーのコールについての信頼性が高い１つ以上の染色体又は染色体セグメントが使用される。

【0338】

腫瘍分率を決定するために使用可能な例示的な遺伝子座としては、個体における非がん性細胞（又は非がん性細胞からのＤＮＡ又はＲＮＡ）中には存在しない、がん細胞（又は、がん細胞からのｃｆＤＮＡ又はｃｆＲＮＡなどのＤＮＡ又はＲＮＡ）中の多型又は変異（例えばＳＮＰ）が挙げられる。いくつかの実施形態において、腫瘍分率は、個体からのサンプル（例えば、血漿サンプル又は腫瘍検体）中のがん細胞（又はがん細胞からのＤＮＡ又はＲＮＡ）が、非がん性細胞（又は、非がん性細胞からのＤＮＡ又はＲＮＡ）中には存在しない対立遺伝子を有する、これらの多型遺伝子座を特定し、特定された多型遺伝子座のうちの１つ以上でのがん細胞に固有の対立遺伝子の量を使用して、サンプル中の腫瘍分率を決定することによって、決定される。いくつかの実施形態において、非がん性細胞は、多型遺伝子座にある第１の対立遺伝子についてホモ接合性であり、がん細胞は、（ｉ）第１の対立遺伝子及び第２の対立遺伝子についてヘテロ接合性であるか、又は（ｉｉ）多型遺伝子座にある第２の対立遺伝子についてホモ接合性である。いくつかの実施形態において、非がん性細胞は、多型遺伝子座にある第１の対立遺伝子及び第２の対立遺伝子についてヘテロ接合性であり、がん細胞は、（ｉ）多型遺伝子座にある第３の対立遺伝子の１つ又は２つのコピーを有する。いくつかの実施形態において、がん細胞は、非がん性細胞中に存在しない対立遺伝子の１つのコピーのみを有すると仮定されるか、又は知られている。例えば、非がん性細胞の遺伝子型がＡＡであり、がん細胞がＡＢであり、サンプル中のその遺伝子座での信号の５％がＢ対立遺伝子からのものであり、９５％がＡ対立遺伝子からのものである場合、そのサンプルの腫瘍分率は１０％である。いくつかの実施形態において、がん細胞は、非がん性細胞中に存在しない対立遺伝子の２つのコピーを有すると仮定されるか、又は知られている。例えば、非がん性細胞の遺伝子型がＡＡであり、がん細胞がＢＢであり、サンプル中のその遺伝子座での信号の５％がＢ対立遺伝子からのものであり、９５％がＡ対立遺伝子からのものである場合、そのサンプルの腫瘍分率は５％である。いくつかの実施形態において、がん細胞が非がん性細胞中にはない対立遺伝子を有する複数の遺伝子座を分析して、がん細胞中のどの遺伝子座がヘテロ接合性であり、どの遺伝子座がホモ接合性であるかを決定する。例えば、非がん性細胞がＡＡである遺伝子座について、Ｂ対立遺伝子からの信号が、いくつかの遺伝子座で約５％であり、いくつかの遺伝子座で約１０％である場合、がん細胞は、約５％のＢ対立遺伝子を有する遺伝子座ではヘテロ接合性であり、約１０％のＢ対立遺伝子を有する遺伝子座ではホモ接合性であると仮定される（腫瘍分率が約１０％であることを示す）。

【0339】

腫瘍分率を決定するために使用可能な例示的な遺伝子座としては、がん細胞及び非がん性細胞が共通して１つの対立遺伝子を有する遺伝子座が挙げられる（例えば、がん細胞はＡＢであり、非がん性細胞はＢＢであるか、又はがん細胞はＢＢであり、非がん性細胞はＡＢである遺伝子座）。混合サンプル（がん細胞及び非がん性細胞からのＤＮＡ又はＲＮＡを含有する）中のＡ信号の量、Ｂ信号の量、又はＢ信号に対するＡ信号の比率を、（ｉ）がん細胞のみからのＤＮＡ又はＲＮＡを含有するサンプル又は（ｉｉ）非がん性細胞のみからのＤＮＡ又はＲＮＡを含有するサンプルについての対応する値と比較する。この値の差を使用して、混合サンプルの腫瘍分率を決定する。

【0340】

いくつかの実施形態において、腫瘍分率を決定するために使用可能な遺伝子座は、（ｉ）がん細胞のみからのＤＮＡ又はＲＮＡを含有するサンプル及び／又は（ｉｉ）非がん性細胞のみからのＤＮＡ又はＲＮＡを含有するサンプルの遺伝子型に基づいて選択される。いくつかの実施形態において、遺伝子座は、混合サンプルの分析に基づいて選択され、例えば、各対立遺伝子の絶対量又は相対量が、がん細胞及びがん性細胞の両方が特定の遺伝子座で同じ遺伝子型を有する場合に予測される量とは異なる遺伝子座が選択される。例えば、がん細胞及び非がん性細胞が同じ遺伝子型を有する場合、遺伝子座は、全ての細胞がＡＡである場合には、０％のＢ信号を生成すると予測されるか、全ての細胞がＡＢである場合には、５０％のＢ信号を生成すると予測されるか、又は全ての細胞がＢＢである場合には、１００％のＢ信号を生成すると予測される。Ｂ信号の他の値は、がん細胞及び非がん性細胞の遺伝子型がその遺伝子座で異なるため、その遺伝子座を使用して腫瘍分率を決定することができることを示す。

【0341】

いくつかの実施形態において、１つ以上の遺伝子座にある対立遺伝子に基づいて計算される腫瘍分率を、本明細書に開示される計数方法のうちの１つ以上を用いて計算される腫瘍分率と比較する。

【0342】

Ｎ．表現型を検出するための、又は多重変異を分析するための例示的な方法
いくつかの実施形態において、本方法は、ある疾患若しくは障害（例えばがん）又はある疾患若しくは障害のリスク上昇に関連する変異のセットについて、サンプルを分析することを含む。ある方法の信号ノイズ比を改善し、腫瘍を別個の臨床部分集合に分類するために使用可能な、クラス内の事象（例えば、Ｍ又はＣのがんクラス）間に強い相関関係が存在する。例えば、合わせて考慮される１つ以上の染色体又は染色体セグメントについてのいくつかの変異（例えば、いくつかのＣＮＶ）についての境界にある結果は、非常に強力な信号であり得る。いくつかの実施形態において、目的の複数の多型又は変異（例えば、２、３、４、５、８、１０、１２、１５又はもっと多い）の有無を決定することは、ある疾患若しくは障害（例えばがん）の有無、又はある疾患若しくは障害（例えばがん）のリスク上昇の決定の感度及び／又は特異性を高める。いくつかの実施形態において、複数の染色体にわたる事象間の相関関係を使用して、これらの各々を個々に見るのと比較すると、より強力に信号を見る。本方法自体の設計を、腫瘍を最適に分類するために最適化することができる。このことは、１つの特定の変異／ＣＮＶに対する感度が最も重要であり得る再発に対する早期検出及びスクリーニングに非常に有用であろう。いくつかの実施形態において、事象は常に相関関係があるものではないが、相関関係がある確率を有する。いくつかの実施形態において、使用される非対角項を有するノイズ共分散行列を有するマトリックス推定組成が使用される。

【0343】

いくつかの実施形態において、本発明は、個体における表現型（例えば、がん表現型）を検出する方法を特徴とし、表現型は、変異のセットのうちの少なくとも１つの存在によって定義される。いくつかの実施形態において、本方法は、個体からの１つ以上の細胞からのＤＮＡ又はＲＮＡのサンプルについてのＤＮＡ又はＲＮＡの測定を得ることであって、１つ以上の細胞が、表現型を有することが疑われる、得ることと、ＤＮＡ又はＲＮＡの測定を分析して、変異のセット中の各々の変異について、細胞の少なくとも１つがその変異を有する尤度を決定することと、を含む。いくつかの実施形態において、本方法は、（ｉ）変異のうちの少なくとも１つについて、細胞の少なくとも１つがその変異を含有する尤度が閾値より大きい、又は（ｉｉ）変異のうちの少なくとも１つについて、細胞の少なくとも１つがその変異を有する尤度が閾値より小さく、複数の変異について、細胞の少なくとも１つが、変異のうちの少なくとも１つを有する結合尤度が閾値よりも大きい場合に、個体は表現型を有すると決定することを含む。いくつかの実施形態において、１つ以上の細胞は、変異のセット中の変異の部分集合又は全てを有する。いくつかの実施形態において、変異の部分集合は、がん又はがんのリスク上昇に関連する。いくつかの実施形態において、変異のセットは、がん変異のＭクラス中の変異の部分集合又は全てを含む（Ｃｉｒｉｅｌｌｏ、ＮａｔＧｅｎｅｔ．４５（１０）：１１２７－１１３３，２０１３，ｄｏｉ：１０．１０３８／ｎｇ．２７６２、これは、参照によりその全体が本明細書に組み込まれる）。いくつかの実施形態において、変異のセットは、がん変異のＣクラス中の変異の部分集合又は全てを含む（Ｃｉｒｉｅｌｌｏ、前出）。いくつかの実施形態において、サンプルは、無細胞ＤＮＡ又はＲＮＡを含む。いくつかの実施形態において、ＤＮＡ又はＲＮＡの測定は、目的の１つ以上の染色体又は染色体セグメント上の多型遺伝子座のセットでの測定（例えば、各遺伝子座での各対立遺伝子の量）を含む。

【0344】

Ｏ．方法の例示的な組み合わせ
結果の精度を高めるために、ＣＮＶの有無を検出する２つ以上の方法（例えば、本発明の方法のいずれか、又は任意の既知の方法）が行われる。いくつかの実施形態において、ある疾患若しくは障害の有無又はある疾患若しくは障害のリスク上昇の指標である因子を分析する１つ以上の方法（例えば、本発明の方法のいずれか、又は任意の既知の方法）が行われる。

【0345】

いくつかの実施形態において、標準的な数学技術を使用して、２つ以上の方法間の共分散及び／又は相関を計算する。標準的な数学技術を使用して、２つ以上の試験に基づく特定の仮説の結合確率も決定してもよい。例示的な技術としては、メタ分析、独自試験のためのフィッシャーの結合確率検定、従属ｐ値と既知の共分散を組み合わせるブラウン法及び従属ｐ値と未知の共分散を組み合わせるコスト法が挙げられる。尤度が、尤度が第２の方法について決定される方法に対して直交するか、又は無関係の方法で第１の方法によって決定される場合では、尤度を組み合わせることは簡単であり、乗算及び正規化によって行うことができ、又は以下のような式を使用することによって行うことができる。
Ｒ_ｃｏｍｂ＝Ｒ_１Ｒ_２／［Ｒ_１Ｒ_２＋（１－Ｒ_１）（１－Ｒ_２）］

【0346】

Ｒ_ｃｏｍｂは、結合尤度であり、Ｒ_１及びＲ_２は、個々の尤度である。例えば、方法１からのトリソミーの尤度が９０％であり、方法２からのトリソミーの尤度が９５％である場合、２つの方法からの出力を組み合わせることによって、医師は、（０．９０）（０．９５）／［（０．９０）（０．９５）＋（１－０．９０）（１－０．９５）］＝９９．４２％の尤度で、胎児がトリソミーであると結論付けることが可能になる。第１の方法と第２の方法が直交していない場合、すなわち、この２つの方法の間に相関関係がある場合にも、尤度を組み合わせることができる。

【0347】

複数の因子又は変数を分析する例示的な方法は、２０１１年９月２０日に登録された米国特許第８，０２４，１２８号、２００６年７月３１日に出願された米国公開第２００７／００２７６３６号及び２００６年１２月６日に出願された米国公開第２００７／０１７８５０１号に開示されており、各々が参照により本明細書に組み込まれる。

【0348】

様々な実施形態において、特定の仮説又は診断の結合確率は、８０、８５、９０、９２、９４、９６、９８、９９又は９９．９％より大きいか、又はいくつかの他の閾値より大きい。

【0349】

Ｐ．検出限界
実施例に提供される実験によって示されるように、本明細書に提供される方法は、検出又は感度の限界が０．４５％ＡＡＩ（これは、本発明の例示的な方法の異数性の検出限界である）で、サンプルにおいて平均対立遺伝子不均衡を検出することができる。同様に、特定の実施形態において、本明細書で提供される方法は、０．４５、０．５、０．６、０．８、０．８、０．９又は１．０％のサンプルにおける平均対立遺伝子不均衡を検出することができる。すなわち、本試験方法は、あるサンプルにおいて、ＡＡＩが０．４５、０．５、０．６、０．８、０．８、０．９又は１．０％まで下がる染色体異数性を検出することができる。実施例の章で提供される実験によって示されるように、本明細書で提供される方法は、少なくともいくつかのＳＮＶについて、あるサンプルにおいてＳＮＶの存在を検出することができ、検出又は感度の限界は０．２％であり、これは、例示的な一実施形態において、少なくともいくつかのＳＮＶについての検出限界である。同様に、特定の実施形態において、本方法は、０．２、０．３、０．４、０．５、０．６、０．８、０．８、０．９又は１．０％の頻度又はＳＮＶＡＡＩで、ＳＮＶを検出することができる。すなわち、本試験方法は、ＳＮＶの染色体遺伝子座での総対立遺伝子数の０．２、０．３、０．４、０．５、０．６、０．８、０．８、０．９又は１．０％の検出限界まで下がるサンプルにおいて、ＳＮＶを検出することができる。

【0350】

いくつかの実施形態において、本発明の方法の変異（例えば、ＳＮＶ又はＣＮＶ）の検出限界は、１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、これらに等しい。いくつかの実施形態において、本発明の方法の変異（例えば、ＳＮＶ又はＣＮＶ）の検出限界は、１５～０．００５％、例えば、１０～０．００５％、１０～０．０１％、１０～０．１％、５～０．００５％、５～０．０１％、５～０．１％、１～０．００５％、１～０．０１％、１～０．１％、０．５～０．００５％、０．５～０．０１％、０．５～０．１％又は０．１～０．０１（境界値を含む）である。

【0351】

いくつかの実施形態において、検出限界は、サンプル（例えば、ｃｆＤＮＡ又はｃｆＲＮＡのサンプル）中に遺伝子座を含むＤＮＡ又はＲＮＡの１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、又はこれらに等しい量で存在する変異（例えば、ＳＮＶ又はＣＮＶ）が検出される（又は検出することが可能な）値である。例えば、遺伝子座中に変異を有する遺伝子座（例えば、遺伝子座の野生型又は非変異態様又はその遺伝子座にある異なる変異の代わりに）を含むＤＮＡ又はＲＮＡ分子の１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、又はこれらに等しい場合に、変異を検出することができる。いくつかの実施形態において、検出限界は、サンプル（例えば、ｃｆＤＮＡ又はｃｆＲＮＡのサンプル）中のＤＮＡ又はＲＮＡ分子の１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、又はこれらに等しい量で存在する変異（例えば、ＳＮＶ又はＣＮＶ）が検出される（又は検出することが可能な）値である。ＣＮＶが欠失であるいくつかの実施形態において、サンプル中に欠失を含有していてもよく、又は含有していなくてもよい目的の領域を有するＤＮＡ又はＲＮＡ分子の１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、又はこれらに等しい量でのみ存在する場合であっても、欠失を検出することができる。ＣＮＶが欠失であるいくつかの実施形態において、サンプル中のＤＮＡ又はＲＮＡ分子の１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、又はこれらに等しい量でのみ存在する場合であっても、欠失を検出することができる。ＣＮＶが重複であるいくつかの実施形態において、存在する過剰に重複したＲＮＡ又はＤＮＡが、サンプル中でサンプル中で重複していてもよく、又は重複していなくてもよい目的の領域を有するＤＮＡ又はＲＮＡ分子の１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、又はこれらに等しい量で存在する場合であっても、重複を検出することができる。ＣＮＶが重複であるいくつかの実施形態において、存在する過剰に重複したＲＮＡ又はＤＮＡが、サンプル中のＤＮＡ又はＲＮＡ分子の１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さいか、又はこれらに等しい量でのみ存在する場合であっても、重複を検出することができる。

【0352】

Ｑ．例示的なサンプル
本発明の態様のいずれかのいくつかの実施形態において、サンプルは、欠失又は重複を有することが疑われる細胞、例えば、がん性であることが疑われる細胞からの細胞内及び／又は細胞外の遺伝物質を含む。いくつかの実施形態において、サンプルは、欠失又は重複を有する細胞、ＤＮＡ又はＲＮＡを含むことが疑われる任意の組織又は体液（例えば、腫瘍）、又はがん細胞、ＤＮＡ又はＲＮＡを含有する他のサンプルを含む。これらの方法の一部として使用される遺伝子測定は、ＤＮＡ又はＲＮＡを含む任意のサンプル、例えば、限定されないが、組織、血液、血清、血漿、尿、毛髪、涙、唾液、皮膚、指の爪、糞便、胆汁、リンパ液、子宮頸粘液、精液、腫瘍、又は核酸を含む他の細胞又は物質について行われてもよい。サンプルは、任意の細胞型を含んでいてもよく、又は任意の細胞型からのＤＮＡ又はＲＮＡを使用してもよい（例えば、がん性であることが疑われる任意の臓器又は組織からの細胞、又はニューロン）。いくつかの実施形態において、サンプルは、核及び／又はミトコンドリアＤＮＡを含む。いくつかの実施形態において、サンプルは、本明細書で開示される標的個体のいずれかに由来する。いくつかの実施形態において、標的個体のがん患者。

【0353】

例示的なサンプルとしては、ｃｆＤＮＡ又はｃｆＲＮＡを含有するものが挙げられる。いくつかの実施形態において、ｃｆＤＮＡは、細胞を溶解する工程を必要とせずに、分析に利用可能である。無細胞ＤＮＡは、様々な組織、例えば、液体形態である組織、例えば、血液、血漿、リンパ液、腹水又は脳脊髄液から得られてもよい。ある場合に、ｃｆＤＮＡは、胎児細胞に由来するＤＮＡからなる。ある場合に、ｃｆＤＮＡは、細胞物質を除去するために遠心分離された、全血から単離された血漿から単離される。ｃｆＤＮＡは、標的細胞（例えばがん細胞）及び非標的細胞（例えば非がん細胞）に由来するＤＮＡの混合物であってもよい。

【0354】

いくつかの実施形態において、サンプルは、ＤＮＡ（又はＲＮＡ）の混合物、例えば、がん細胞に由来するＤＮＡ（又はＲＮＡ）と非がん性（すなわち、正常）細胞に由来するＤＮＡ（又はＲＮＡ）の混合物を含有するか、又は含有することが疑われる。いくつかの実施形態において、サンプル中の細胞の少なくとも０．５、１、３、５、７、１０、１５、２０、３０、４０、５０、６０、７０、８０、９０、９２、９４、９５、９６、９８、９９又は１００％ががん細胞である。いくつかの実施形態において、サンプル中のＤＮＡ（例えばｃｆＤＮＡ）又はＲＮＡ（例えばｃｆＲＮＡ）の少なくとも０．５、１、３、５、７、１０、１５、２０、３０、４０、５０、６０、７０、８０、９０、９２、９４、９５、９６、９８、９９又は１００％が、がん細胞（複数可）由来である。様々な実施形態において、サンプル中のがん性細胞である細胞の割合は、０．５～９９％、例えば、１～９５％、５～９５％、１０～９０％、５～７０％、１０～７０％、２０～９０％又は２０～７０％（境界値を含む）である。いくつかの実施形態において、サンプルは、がん細胞が濃縮されているか、又はがん細胞からのＤＮＡ又はＲＮＡが濃縮されている。がん細胞が濃縮されているサンプルのいくつかの実施形態において、濃縮サンプル中の細胞の少なくとも０．５、１、２、３、４、５、６、７、１０、１５、２０、３０、４０、５０、６０、７０、８０、９０、９２、９４、９５、９６、９８、９９又は１００％ががん細胞である。がん細胞からのＤＮＡ又はＲＮＡが濃縮されているサンプルのいくつかの実施形態において、濃縮サンプル中のＤＮＡ又はＲＮＡの少なくとも０．５、１、２、３、４、５、６、７、１０、１５、２０、３０、４０、５０、６０、７０、８０、９０、９２、９４、９５、９６、９８、９９又は１００％が、がん細胞（複数可）由来である。いくつかの実施形態において、細胞選別（例えば、蛍光活性化細胞選別（ＦＡＣＳ））を用いて、がん細胞を濃縮する（Ｂａｒｔｅｎｅｖａｅｔａｌ．，ＢｉｏｃｈｉｍＢｉｏｐｈｙｓＡｃｔａ．，１８３６（１）：１０５－２２，Ａｕｇ２０１３．ｄｏｉ：１０．１０１６／ｊ．ｂｂｃａｎ．２０１３．０２．００４．Ｅｐｕｂ２０１３Ｆｅｂ２４、及びＩｂｒａｈｉｍｅｔａｌ．，ＡｄｖＢｉｏｃｈｅｍＥｎｇＢｉｏｔｅｃｈｎｏｌ．１０６：１９－３９，２００７、これらの各々は、参照によりその全体が本明細書に組み込まれる）。

【0355】

いくつかの実施形態において、サンプルは、胎児細胞が濃縮されている。胎児細胞が濃縮されているサンプルのいくつかの実施形態において、濃縮サンプル中の細胞の少なくとも０．５、１、２、３、４、５、６、７％又はもっと多くが、胎児細胞である。いくつかの実施形態において、サンプル中の胎児細胞である細胞の割合は、０．５～１００％、例えば、１～９９％、５～９５％、１０～９５％、１０～９５％、２０～９０％又は３０～７０％（境界値を含む）である。いくつかの実施形態において、サンプルは、胎児ＤＮＡが濃縮されている。胎児ＤＮＡが濃縮されているサンプルのいくつかの実施形態において、濃縮サンプル中のＤＮＡの少なくとも０．５、１、２、３、４、５、６、７％又はもっと多くが、胎児ＤＮＡである。いくつかの実施形態において、サンプル中の胎児ＤＮＡであるＤＮＡの割合は、０．５～１００％、例えば、１～９９％、５～９５％、１０～９５％、１０～９５％、２０～９０％又は３０～７０％（境界値を含む）である。

【0356】

いくつかの実施形態において、サンプルは、単一細胞を含むか、又は単一細胞からのＤＮＡ及び／又はＲＮＡを含む。いくつかの実施形態において、複数の個々の細胞（例えば、同じ被験体又は異なる被験体からの少なくとも５、１０、２０、３０、４０又は５０個の細胞）を並列に分析する。いくつかの実施形態において、同じ個体由来の複数のサンプルからの細胞を組み合わせ、これらのサンプルを別個に分析する場合と比較して、作業量が減少する。複数サンプルを組み合わせることで、がんについて同時に複数組織を試験することも可能になる（これを使用して、がんについてより十分なスクリーニングを提供するか、又はがんが他の組織に転移した可能性があるかどうかを決定することができる）。

【0357】

いくつかの実施形態において、サンプルは、単一の細胞又は少数の細胞、例えば、２、３、５、６、７、８、９又は１０個の細胞を含有する。いくつかの実施形態において、サンプルは、１～１００、１００～５００又は５００～１，０００個の細胞（境界値を含む）を含む。いくつかの実施形態において、サンプルは、１～１０ピコグラム、１０～１００ピコグラム、１００ピコグラム～１ナノグラム、１～１０ナノグラム、１０～１００ナノグラム又は１００ナノグラム～１マイクログラムのＲＮＡ及び／又はＤＮＡ（境界値を含む）を含有する。

【0358】

いくつかの実施形態において、サンプルは、パラフィルムに包埋される。いくつかの実施形態において、サンプルは、ホルムアルデヒドなどの防腐剤で保存され、場合により、パラフィンに封入され、そのうちの少量がＰＣＲに利用可能であるように、ＤＮＡの架橋を引き起こし得る。いくつかの実施形態において、サンプルは、ホルムアルデヒド固定パラフィン包埋（ＦＦＰＥ）サンプルである。いくつかの実施形態において、サンプルは、新鮮なサンプル（例えば、１日又は２日の分析で得られるサンプル）である。いくつかの実施形態において、サンプルは、分析前に凍結される。いくつかの実施形態において、サンプルは、歴史的サンプルである。

【0359】

これらのサンプルは、本発明の方法のいずれにおいて、使用することができる。

【0360】

Ｒ．例示的なサンプル調製方法
いくつかの実施形態において、本方法は、ＤＮＡ及び／又はＲＮＡを単離又は精製することを含む。このような目的を達成するために、当該技術分野で既知であるいくつかの標準的な手順が存在する。いくつかの実施形態において、サンプルを遠心分離して、様々な層を分離してもよい。いくつかの実施形態において、ＤＮＡ又はＲＮＡは、濾過を用いて単離されてもよい。いくつかの実施形態において、ＤＮＡ又はＲＮＡの調製は、増幅、分離、クロマトグラフィーによる精製、液体分離、単離、優先的濃縮、優先的増幅、標的化された増幅、又は当該技術分野で既知であるか、又は本明細書に記載されるいくつかの他の技術のいずれかを伴っていてもよい。ＤＮＡの単離のためのいくつかの実施形態において、ＲＮａｓｅを使用してＲＮＡを分解する。ＲＮＡの単離のためのいくつかの実施形態において、ＤＮａｓｅ（例えば、Ｉｎｖｉｔｒｏｇｅｎ、カールスバッド、ＣＡ、ＵＳＡ製のＤＮａｓｅＩ）を使用してＤＮＡを分解する。いくつかの実施形態において、ＲＮｅａｓｙミニキット（Ｑｉａｇｅｎ）を使用して、製造業者のプロトコルに従ってＲＮＡを単離する。いくつかの実施形態において、低分子ＲＮＡは、製造業者のプロトコルに従ってｍｉｒＶａｎａＰＡＲＩＳキット（Ａｍｂｉｏｎ、Ａｕｓｔｉｎ，ＴＸ，ＵＳＡ）を使用して単離される（Ｇｕｅｔａｌ．，Ｊ．Ｎｅｕｒｏｃｈｅｍ．１２２：６４１－６４９，２０１２、これは、参照によりその全体が本明細書に組み込まれる）。ＲＮＡの濃度及び純度は、任意選択的に、Ｎａｎｏｖｕｅ（ＧＥＨｅａｌｔｈｃａｒｅ、Ｐｉｓｃａｔａｗａｙ，ＮＪ，ＵＳＡ）を使用して決定されてもよく、ＲＮＡの完全性は、任意選択的に、２１００Ｂｉｏａｎａｌｙｚｅｒ（ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ、ＳａｎｔａＣｌａｒａ，ＣＡ，ＵＳＡ）を使用して測定されてもよい（Ｇｕｅｔａｌ．，Ｊ．Ｎｅｕｒｏｃｈｅｍ．１２２：６４１－６４９，２０１２、これは、参照によりその全体が本明細書に組み込まれる）。いくつかの実施形態において、ＴＲＩＺＯＬ又はＲＮＡｌａｔｅｒ（Ａｍｂｉｏｎ）を使用して、保管中のＲＮＡを安定化させる。

【0361】

いくつかの実施形態において、ユニバーサルタグ付けアダプターが追加され、ライブラリを作成する。ライゲーションの前に、サンプルＤＮＡは、平滑末端化されてもよく、次いで、単一のアデノシン塩基を３’末端に付加する。ライゲーションの前に、ＤＮＡは、制限酵素又はいくつかの他の開裂方法を用いて開裂されてもよい。ライゲーション中に、サンプルフラグメントの３’アデノシンと、アダプターの相補性３’チロシンオーバーハングが、ライゲーション効率を高めることができる。いくつかの実施形態において、アダプターライゲーションは、ＡＧＩＬＥＮＴＳＵＲＥＳＥＬＥＣＴキット中に見出されるライゲーションキットを用いて行われる。いくつかの実施形態において、ライブラリは、ユニバーサルプライマーを用いて増幅される。一実施形態において、増幅されるライブラリは、サイズ分離によって、又はＡＧＥＮＣＯＵＲＴＡＭＰＵＲＥビーズなどの製品又は他の同様の方法を用いることによって、分画される。いくつかの実施形態において、ＰＣＲ増幅を用いて、標的遺伝子座を増幅する。いくつかの実施形態において、増幅されるＤＮＡは、配列決定される（例えば、ＩＬＬＵＭＩＮＡＩＩＧＡＸ又はＨｉＳｅｑシーケンサ）。いくつかの実施形態において、増幅されるＤＮＡは、増幅されるＤＮＡの各末端から配列決定され、配列決定エラーを減らす。増幅されるＤＮＡの一端から配列決定する場合に、特定の塩基における配列エラーが存在する場合、増幅されるＤＮＡの他端から配列決定するときに相補性塩基中に配列エラーがある可能性が低い（増幅されるＤＮＡの同じ末端からの複数回の配列決定と比較して）。

【0362】

いくつかの実施形態において、全ゲノムアプリケーション（ＷＧＡ）を用いて核酸サンプルを増幅する。ライゲーション媒介ＰＣＲ（ＬＭ－ＰＣＲ）、変性オリゴヌクレオチドプライマーＰＣＲ（ＤＯＰ－ＰＣＲ）及び多重置換増幅（ＭＤＡ）といった、ＷＧＡに利用可能ないくつかの方法が存在する。ＬＭ－ＰＣＲにおいて、アダプターと呼ばれる短いＤＮＡ配列を、ＤＮＡの平滑末端にライゲーションする。これらのアダプターは、ＰＣＲによってＤＮＡを増幅するために使用されるユニバーサル増幅配列を含有する。ＤＯＰ－ＰＣＲにおいて、ユニバーサル増幅配列も含有するランダムプライマーを、アニーリング及びＰＣＲの第１ラウンドで使用する。次いで、第２ラウンドのＰＣＲを使用して、更にユニバーサルプライマー配列を用い、配列を増幅させる。ＭＤＡは、ｐｈｉ－２９ポリメラーゼを使用し、このポリメラーゼは、ＤＮＡを複製し、単一細胞分析に使用されてきた、高度なプロセッシブ非特異性酵素である。いくつかの実施形態において、ＷＧＡは実施されない。

【0363】

いくつかの実施形態において、選択的な増幅又は濃縮を使用して、標的遺伝子座を増幅するか、又は濃縮する。いくつかの実施形態において、増幅及び／又は選択的な濃縮技術は、ＰＣＲ（例えば、ライゲーション媒介ＰＣＲ）、ハイブリダイゼーションによる画分の捕捉、分子反転プローブ又は他の環状化プローブを伴っていてもよい。いくつかの実施形態において、リアルタイム定量ＰＣＲ（ＲＴ－ｑＰＣＲ）、デジタルＰＣＲ、又はエマルションＰＣＲ、単一対立遺伝子塩基伸長反応の後の質量分析が使用される（Ｈｕｎｇｅｔａｌ．，ＪＣｌｉｎＰａｔｈｏｌ６２：３０８－３１３、２００９、その全体が参照により本明細書に組み込まれる）。いくつかの実施形態において、ハイブリッド捕捉プローブを用いたハイブリダイゼーションによる捕捉を使用して、ＤＮＡを優先的に濃縮する。いくつかの実施形態において、増幅又は選択的な濃縮のための方法は、標的配列に正しくハイブリダイゼーションすると、ヌクレオチドプローブの３’末端又は５’末端が少数のヌクレオチドによって多型対立遺伝子の多型部位から分離されるプローブを用いることを伴っていてもよい。この分離は、対立遺伝子バイアスと呼ばれる１つの対立遺伝子の優先的増幅を減らす。これは、正しくハイブリダイズされたプローブの３’末端又は５’末端が、対立遺伝子の多型部位に直接隣接しているか、又は非常に近い位置にあるプローブを用いることを伴う方法の改善である。一実施形態において、ハイブリダイズする領域が多型部位を含有し得るか、又は確実に含有するプローブは除外される。ハイブリダイゼーション部位にある多型部位は、一部の対立遺伝子において不均等なハイブリダイゼーションを引き起こし、又はハイブリダイゼーションを完全に阻害する場合があり、特定の対立遺伝子の優先的増幅をもたらす場合がある。これらの実施形態は、各多型遺伝子座でサンプルの元々の対立遺伝子頻度を良好に保存するという点で、標的化された増幅及び／又は選択的な濃縮を伴う他の方法の改善であり、ここで、サンプルは、単一の個体又は個体の混合からの純粋なゲノムサンプルである。

【0364】

いくつかの実施形態において、ＰＣＲ（ミニＰＣＲと呼ばれる）を使用して、非常に短いアンプリコンを作成する（２０１２年１１月２１日に出願された米国出願第１３／６８３，６０４号、米国公開第２０１３／０１２３１２０号、２０１１年１１月１８日に出願された米国出願第１３／３００，２３５号、２０１１年１１月１８日に出願された米国公開第２０１２／０２７０２１２号及び２０１４年５月１６日に出願された米国出願第６１／９９４，７９１号、各々、その全体が参照により本明細書に組み込まれる）。ｃｆＤＮＡ（例えば、壊死又はアポトーシスによって放出されるがんｃｆＤＮＡ）は、高度にフラグメント化される。胎児ｃｆＤＮＡの場合、フラグメントサイズは、平均が１６０ｂｐ、標準偏差が１５ｂｐ、最小サイズが約１００ｂｐ、最大サイズが約２２０ｂｐのほぼＧａｕｓｓｉａｎ方法で分布する。ある特定の標的遺伝子座の多型部位は、その遺伝子座に由来する様々なフラグメントの最初から最後までの任意の位置を占めていてもよい。ｃｆＤＮＡフラグメントが短いため、両プライマー部位が存在する尤度、長さＬのフラグメントが順方向及び逆方向のプライマー部位の両方を含む尤度は、そのフラグメントの長さに対するアンプリコンの長さの比率である。理想的な条件下で、アンプリコンが４５、５０、５５、６０、６５又は７０ｂｐであるアッセイは、利用可能なテンプレートフラグメント分子のそれぞれ７２％、６９％、６６％、６３％、５９％又は５６％からの増幅に成功する。がんを有することが疑われる個体のサンプルからのｃｆＤＮＡに対して最も好ましく関連する特定の実施形態において、ｃｆＤＮＡは、８５、８０、７５又は７０ｂｐ、特定の好ましい実施形態において７５ｂｐの最大アンプリコン長を与え、融点が５０～６５℃、特定の好ましい実施形態において５４～６０．５℃のプライマーを用いて増幅される。アンプリコン長は、順方向及び逆方向のプライミング部位の５’末端間の距離である。当該技術分野で既知であるものによって典型的に使用されるものよりも短いアンプリコン長は、短い配列リードのみを必要とすることによって、所望な多型遺伝子座のより効率的な測定をもたらし得る。一実施形態において、アンプリコンの実質的な画分は、１００ｂｐ未満、９０ｂｐ未満、８０ｂｐ未満、７０ｂｐ未満、６５ｂｐ未満、６０ｂｐ未満、５５ｂｐ未満、５０ｂｐ未満又は４５ｂｐ未満である。

【0365】

いくつかの実施形態において、増幅は、直接多重化ＰＣＲ、連続ＰＣＲ、ネスティッドＰＣＲ、二重ネスティッドＰＣＲ、片側及び片側半（ｏｎｅ－ａｎｄ－ａ－ｈａｌｆｓｉｄｅｄ）ネスティッドＰＣＲ、完全ネスティッドＰＣＲ、片側完全ネスティッドＰＣＲ、片側ネスティッドＰＣＲ、ヘミネスティッドＰＣＲ、ヘミネスティッドＰＣＲ、三重ヘミネスティッドＰＣＲ、セミネスティッドＰＣＲ、片側セミネスティッドＰＣＲ、逆セミネスティッドＰＣＲ法、又は片側ＰＣＲを使用して行われ、これらは、それらの全体が本明細書に参考として組み込まれる、２０１２年１１月２１日に出願された米国出願第１３／６８３，６０４号、米国公開第２０１３／０１２３１２０号、２０１１年１１月１８日に出願された米国出願第１３／３００，２３５号、米国公開第２０１２／０２７０２１２号及び２０１４年５月１６日に出願された米国出願第６１／９９４，７９１号に記載される。所望な場合、これらの方法のいずれかをミニＰＣＲに使用してもよい。

【0366】

所望な場合、ＰＣＲ増幅の伸長工程は、２００ヌクレオチド、３００ヌクレオチド、４００ヌクレオチド、５００ヌクレオチド又は１，０００ヌクレオチドより長いフラグメントからの増幅を減らすために、時間的観点から制限されてもよい。これにより、フラグメント化されたＤＮＡ又はより短いＤＮＡ（例えば、胎児ＤＮＡ、又はアポトーシス又は壊死を受けたがん細胞からのＤＮＡ）の濃縮をもたらす場合があり、試験性能が向上し得る。

【0367】

いくつかの実施形態において、マルチプレックスＰＣＲが使用される。いくつかの実施形態において、核酸サンプルにおいて標的遺伝子座を増幅する方法は、（ｉ）核酸サンプルと、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる標的遺伝子座を同時にハイブリダイズするプライマーのライブラリとを接触させ、反応混合物を生成することと、（ｉｉ）この反応混合物をプライマー伸長反応条件（例えばＰＣＲ条件）に供して、標的アンプリコンを含む増幅産物を生成することとを伴う。いくつかの実施形態において、標的遺伝子座の少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％が増幅される。様々な実施形態において、増幅産物の６０、５０、４０、３０、２０、１０、５、４、３、２、１、０．５、０．２５、０．１又は０．０５％未満が、プライマーダイマーである。いくつかの実施形態において、プライマーは、溶液状態である（例えば、固相ではなく液相に溶解する）。いくつかの実施形態において、プライマーは、溶液状態であり、固体支持体に固定されていない。いくつかの実施形態において、プライマーは、マイクロアレイの一部ではない。いくつかの実施形態において、プライマーは、分子反転プローブ（ＭＩＰ）を含まない。

【0368】

いくつかの実施形態において、２つ以上（例えば、３又は４）の標的アンプリコン（例えば、本明細書に開示されるミニＰＣＲ方法からのアンプリコン）が一緒にライゲーションされ、次いで、ライゲーションされた産物が配列決定される。複数のアンプリコンを単一のライゲーション産物になるように組み合わせることで、その後の配列決定工程の効率が増加する。いくつかの実施形態において、標的アンプリコンは、これらがライゲーションされる前には、長さが１５０、１００、９０、７５又は５０塩基対未満である。選択的な濃縮及び／又は増幅は、各々の個々の分子を、異なるタグ、分子バーコード、増幅のためのタグ及び／又は配列決定のためのタグを用いてタグ化することを伴っていてもよい。いくつかの実施形態において、増幅産物は、配列決定（例えば、高スループット配列決定）によって、又はアレイ、例えば、ＳＮＰアレイ、ＩＬＬＵＭＩＮＡＩＮＦＩＮＩＵＭアレイ又はＡＦＦＹＭＥＴＲＩＸ遺伝子チップへのハイブリダイゼーションによって分析される。いくつかの実施形態において、ナノポア配列決定、例えば、Ｇｅｎｉａによって開発されたナノポア配列決定技術が使用される（例えば、その全体が参照により本明細書に組み込まれる、ｇｅｎｉａｃｈｉｐ．ｃｏｍ／ｔｅｃｈｎｏｌｏｇｙでのワールドワイドウェブを参照）。いくつかの実施形態において、二重配列決定が使用される（Ｓｃｈｍｉｔｔｅｔａｌ．，“Ｄｅｔｅｃｔｉｏｎｏｆｕｌｔｒａ－ｒａｒｅｍｕｔａｔｉｏｎｓｂｙｎｅｘｔ－ｇｅｎｅｒａｔｉｏｎｓｅｑｕｅｎｃｉｎｇ，”ＰｒｏｃＮａｔｌＡｃａｄＳｃｉＵＳＡ．１０９（３６）：１４５０８－１４５１３，２０１２、これは、参照によりその全体が本明細書に組み込まれる）。この手法は、ＤＮＡ二本鎖の２つの鎖の各々を独立してタグ化し、配列決定することによって、エラーを大きく減らす。この２つの鎖が相補性であるため、真の変異は、両方の鎖の同じ位置に見出される。これとは対照的に、ＰＣＲ又は配列決定のエラーは、１つの鎖にのみ変異を生じるため、技術的エラーとして割り引くことができる。いくつかの実施形態において、本方法は、二本鎖ＤＮＡの両方の鎖を、ランダムであるが相補性の二本鎖ヌクレオチド配列（二本鎖タグと呼ばれる）を用いてタグ化することを含む。最初に、一本鎖のランダム化ヌクレオチド配列を１つのアダプター鎖に導入し、次いで、反対側の鎖をＤＮＡポリメラーゼを用いて伸長し、相補性の二本鎖タグを得ることによって、二本鎖タグ配列が、標準的な配列決定アダプターに組み込まれる。タグ化されたアダプターを剪断ＤＮＡにライゲーションした後、個々に標識された鎖が、アダプターテール上の非対称プライマー部位からＰＣＲ増幅され、ペアエンド配列決定に供される。いくつかの実施形態において、サンプル（例えば、ＤＮＡ又はＲＮＡサンプル）が、複数の画分に、例えば、異なるウェル（例えば、ＷａｆｅｒＧｅｎＳｍａｒｔＣｈｉｐのウェル）に分割される。サンプルを異なる画分（例えば、少なくとも５、１０、２０、５０、７５、１００、１５０、２００又は３００画分）に分割することによって、変異を有する分子の割合が、全体的なサンプルよりもウェルのいくつかで高くなるため、分析の感度を上げることができる。いくつかの実施形態において、各画分は、５００、４００、２００、１００、５０、２０、１０、５、２個又は１個未満のＤＮＡ又はＲＮＡ分子を含む。いくつかの実施形態において、各画分中の分子は、別個に配列決定される。いくつかの実施形態において、同じバーコード（例えば、ランダム又は非ヒト配列）を、同じ画分中の全ての分子に加え（例えば、バーコードを含有するプライマーを用いた増幅によって、又はバーコードのライゲーションによって）、異なるバーコードが、異なる画分中の分子に加えられる。バーコード化された分子をプールし、一緒に配列決定することができる。いくつかの実施形態において、分子をプールし、配列決定（例えば、ネスティッドＰＣＲを用いることによって）する前に、分子を増幅する。いくつかの実施形態において、１つの順方向プライマーと２つの逆方向プライマー、又は２つの順方向プライマーと１つの逆方向プライマーが使用される。

【0369】

Ｓ．検出限界
いくつかの実施形態において、サンプル（例えば、ｃｆＤＮＡ又はｃｆＲＮＡのサンプル）中のＤＮＡ又はＲＮＡ分子の１０、５、２、１、０．５、０．１、０．０５、０．０１又は０．００５％より小さい量で存在する変異（例えば、ＳＮＶ又はＣＮＶ）が、検出される（又は検出することが可能である）。いくつかの実施形態において、サンプル（例えば、血液サンプルからのｃｆＤＮＡ又はｃｆＲＮＡのサンプルなど）中の１，０００、５００、１００、５０、２０、１０、５、４、３又は２未満の元々のＤＮＡ又はＲＮＡ分子（増幅前）に存在する変異（例えば、ＳＮＶ又はＣＮＶ）が検出される（又は検出することができる）。いくつかの実施形態において、サンプル（例えば、血液サンプルからのｃｆＤＮＡ又はｃｆＲＮＡのサンプルなど）中のたった１つの元々のＤＮＡ又はＲＮＡ分子（増幅前）に存在する変異（例えば、ＳＮＶ又はＣＮＶ）が検出される（又は検出することができる）。

【0370】

例えば、変異（例えば、単一ヌクレオチドバリアント（ＳＮＶ））の検出限界が０．１％である場合、画分を複数の画分（例えば、１００ウェル）に分割することによって、０．０１％で存在する変異を検出することができる。ウェルの大部分は、変異のコピーを含まない。変異を有する数少ないウェルについて、変異は、かなり高い割合のリードで存在する。一例では、標的遺伝子座からの２０，０００個のＤＮＡの初期コピーが存在し、これらのコピーのうちの２つが、目的のＳＮＶを含む。サンプルが１００ウェルに分割される場合、９８ウェルはＳＮＶを有し、２ウェルは、０．５％でＳＮＶを有する。各ウェル中のＤＮＡをバーコード化し、増幅し、他のウェルからのＤＮＡとともにプールし、配列決定することができる。ＳＮＶを含まないウェルを使用して、バックグラウンド増幅／配列決定エラー率を測定し、外れ値のウェルからの信号が、ノイズのバックグラウンドレベルを超えているかどうかを決定することができる。

【0371】

Ｔ．検出方法
いくつかの実施形態において、増幅産物は、アレイ、例えば、目的の１つ以上の染色体（例えば、染色体１３、１８、２１、Ｘ、Ｙ、又はこれらの任意の組み合わせ）に対するプローブを用いたアレイ（特にマイクロアレイ）を用いて検出される。例えば、市販のＳＮＰ検出マイクロアレイ、例えば、Ｉｌｌｕｍｉｎａ（サンディエゴ、ＣＡ）ＧｏｌｄｅｎＧａｔｅ、ＤＡＳＬ、Ｉｎｆｉｎｉｕｍ、又はＣｙｔｏＳＮＰ－１２遺伝子型決定アッセイ、又はＡｆｆｙｍｅｔｒｉｘ製のＳＮＰ検出マイクロアレイ製品、例えば、ＯｎｃｏＳｃａｎマイクロアレイを使用することができることが理解されるだろう。

【0372】

配列決定することを伴ういくつかの実施形態において、リード深度は、所与の遺伝子座にマッピングする配列決定リードの数である。リード深度は、リード総数にわたって正規化されてもよい。サンプルのリード深度についてのいくつかの実施形態において、リード深度は、標的遺伝子座にわたる平均リード深度である。遺伝子座のリード深度についてのいくつかの実施形態において、リード深度は、その遺伝子座にマッピングするシーケンサによって測定されるリードの数である。一般に、遺伝子座のリード深度が大きいほど、その遺伝子座での対立遺伝子の比率が、元々のＤＮＡサンプルにおける対立遺伝子の比率と近い傾向がある。リード深度は、限定されないが、百分率又は割合を含め、様々な異なる方法で表現されてもよい。したがって、例えば、高度に並行なＤＮＡシーケンサ、例えば、ＩｌｌｕｍｉｎａＨＩＳＥＱは、例えば、１００万個のクローン配列を生成し、１つの遺伝子座の配列決定を３０００回行うと、その遺伝子座でのリード深度は、３，０００リードになる。その遺伝子座でのリードの割合は、３，０００を総リード１００万で割り算したものであり、すなわち、総リードの０．３％である。

【0373】

いくつかの実施形態において、対立遺伝子データが得られ、対立遺伝子データは、多型遺伝子座の特定の対立遺伝子のコピー数の指標である定量測定値（複数可）を含む。いくつかの実施形態において、対立遺伝子データは、多型遺伝子座で観測される対立遺伝子の各々のコピー数の指標である定量測定値（複数可）を含む。典型的には、目的の多型遺伝子座の全ての可能な対立遺伝子について、定量測定値が得られる。例えば、マイクロアレイ、ｑＰＣＲ、ＤＮＡ配列決定、例えば、高スループットＤＮＡ配列決定など、ＳＮＰ又はＳＮＶ遺伝子座について対立遺伝子を決定するための前述の段落で記載された方法のいずれかを使用して、多型遺伝子座の特定の対立遺伝子のコピー数の定量測定値を作成することができる。この定量測定値は、本明細書では、対立遺伝子頻度データ又は遺伝子対立遺伝子データの測定値と呼ばれる。対立遺伝子データを用いる方法は、時に、定量対立遺伝子方法と呼ばれることがある。これは、非多型遺伝子座から、又は多型遺伝子座からであるが、対立遺伝子同一性に関するものではない、定量データを排他的に使用する定量方法とは対照的である。対立遺伝子データが、高スループット配列決定を用いて測定される場合、対立遺伝子データは、典型的には、目的の遺伝子座にマッピングする各対立遺伝子のリード数を含む。

【0374】

いくつかの実施形態において、非対立遺伝子データが得られ、非対立遺伝子データは、特定の遺伝子座のコピー数の指標である定量測定値（複数可）を含む。遺伝子座は、多型又は非多型であってもよい。遺伝子座が非多型である場合のいくつかの実施形態において、非対立遺伝子データは、その遺伝子座に存在し得る個々の対立遺伝子の相対量又は絶対量に関する情報を含有しない。非対立遺伝子データ（すなわち、非多型対立遺伝子からの定量データ、又は多型遺伝子からであるが、各フラグメントの対立遺伝子同一性に関するものではない定量データ）のみを使用する方法は、定量方法と呼ばれる。典型的には、目的の多型遺伝子座の全ての可能な対立遺伝子について、定量測定値が得られ、１つの値は、全体で、その遺伝子座にある全ての対立遺伝子についての測定量に関連付けられる。多型遺伝子座についての非対立遺伝子データは、その遺伝子座にある各対立遺伝子についての定量対立遺伝子を合計することによって得られてもよい。対立遺伝子データが、高スループット配列決定を用いて測定される場合、非対立遺伝子データは、典型的には、目的の遺伝子座にマッピングするもののリード数を含む。配列決定測定値は、その遺伝子座に存在する各々の対立遺伝子の相対数及び／又は絶対数を示すことができ、非対立遺伝子データは、対立遺伝子同一性にかかわらず、その遺伝子座にマッピングするリードの合計を含む。いくつかの実施形態において、配列決定測定値の同じセットを使用して、対立遺伝子データ及び非対立遺伝子データの両方を得ることができる。いくつかの実施形態において、対立遺伝子データを、ある方法の一部として使用して、目的の染色体でのコピー数を決定し、作成した非対立遺伝子データを、異なる方法の一部として使用して、目的の染色体でのコピー数を決定することができる。いくつかの実施形態において、この２つの方法は、統計的に直交しており、これらを組み合わせて、目的の染色体でのコピー数のより正確な決定を与える。

【0375】

いくつかの実施形態において、遺伝子データを得ることは、（ｉ）実験技術によって、例えば、自動化高スループットＤＮＡシーケンサの使用によって、ＤＮＡ配列情報を取得すること、又は（ｉｉ）実験技術によって前もって得ておいた情報を取得することを含み、この情報は、例えば、インターネットを介したコンピュータによって、又は配列決定デバイスからの電子送信によって、電気的に送信される。

【0376】

更なる例示的なサンプル調製、増幅及び定量化の方法は、２０１２年１１月２１日に出願された米国出願第１３／６８３，６０４号（米国公開第２０１３／０１２３１２０号及び２０１４年５月１６日に出願された米国出願第６１／９９４，７９１号、その全体が参照により本明細書に組み込まれる）に記載される。これらの方法は、本明細書に開示されるサンプルのうちのいずれかの分析に使用することができる。

【0377】

Ｕ．無細胞ＤＮＡのための例示的な定量化方法
所望な場合、ｃｆＤＮＡ又はｃｆＲＮＡの量又は濃度は、標準的な方法を用いて測定することができる。いくつかの実施形態において、無細胞ミトコンドリアＤＮＡ（ｃｆｍＤＮＡ）の量又は濃度が決定される。いくつかの実施形態において、核ＤＮＡに由来する無細胞ＤＮＡ（ｃｆｎＤＮＡ）の量又は濃度が決定される。いくつかの実施形態において、ｃｆｍＤＮＡ及びｃｆｎＤＮＡの量又は濃度が、同時に決定される。

【0378】

いくつかの実施形態において、ｑＰＣＲを使用して、ｃｆｎＤＮＡ及び／又はｃｆｍＤＮＡを測定する（Ｋｏｈｌｅｒｅｔａｌ．，“ＬｅｖｅｌｓｏｆｐｌａｓｍａｃｉｒｃｕｌａｔｉｎｇｃｅｌｌｆｒｅｅｎｕｃｌｅａｒａｎｄｍｉｔｏｃｈｏｎｄｒｉａｌＤＮＡａｓｐｏｔｅｎｔｉａｌｂｉｏｍａｒｋｅｒｓｆｏｒｂｒｅａｓｔｔｕｍｏｒｓ．”ＭｏｌＣａｎｃｅｒ８：１０５、２００９、８：ｄｏｉ：１０．１１８６／１４７６－４５９８－８－１０５、その全体が参照により本明細書に組み込まれる）。例えば、ｃｆｎＤＮＡからの１つ以上の遺伝子座（例えば、グリセルアルデヒド－３－ホスファト－デヒドロゲナーゼ、ＧＡＰＤＨ）及びｃｆｍＤＮＡからの１つ以上の遺伝子座（ＡＴＰａｓｅ８及びＭＴＡＴＰ８）を、マルチプレックスｑＰＣＲを用いて測定することができる。いくつかの実施形態において、蛍光標識ＰＣＲを使用して、ｃｆｎＤＮＡ及び／又はｃｆｍＤＮＡを測定する（Ｓｃｈｗａｒｚｅｎｂａｃｈｅｔａｌ．，“Ｅｖａｌｕａｔｉｏｎｏｆｃｅｌｌ－ｆｒｅｅｔｕｍｏｕｒＤＮＡａｎｄＲＮＡｉｎｐａｔｉｅｎｔｓｗｉｔｈｂｒｅａｓｔｃａｎｃｅｒａｎｄｂｅｎｉｇｎｂｒｅａｓｔｄｉｓｅａｓｅ．”ＭｏｌＢｉｏｓｙｓ７：２８４８－２８５４、２０１１、その全体が参照により本明細書に組み込まれる）。所望な場合、データの正規分布は、標準的な方法、例えば、シャピロ－ウィルク検定を用いて決定することができる。所望な場合、ｃｆｎＤＮＡ及びｍＤＮＡのレベルは、標準的な方法、例えば、マン－ホイットニーのＵ検定を用いて比較することができる。いくつかの実施形態において、ｃｆｎＤＮＡ及び／又はｍＤＮＡのレベルを、標準的な方法、例えば、マン－ホイットニーのＵ検定又はクラスカル－ウォリス検定を用いて、他の確立された予後因子と比較する。

【0379】

Ｖ．例示的なＲＮＡ増幅、定量化、及び分析方法
以下の例示的な方法のいずれかを使用して、ＲＮＡ（例えば、ｃｆＲＮＡ、細胞ＲＮＡ、細胞質ＲＮＡ、コード細胞質ＲＮＡ、非コード細胞質ＲＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ミトコンドリアＲＮＡ、ｒＲＮＡ又はｔＲＮＡ）を増幅し、場合により定量してもよい。いくつかの実施形態において、ｍｉＲＮＡは、ｍｉｒｂａｓｅ．ｏｒｇでのワールドワイドウェブ（その全体が参照により本明細書に組み込まれる）で入手可能なｍｉＲＢａｓｅに列挙されるｍｉＲＮＡ分子のいずれかである。例示的なｍｉＲＮＡ分子としては、ｍｉＲ－５０９、ｍｉＲ－２１及びｍｉＲ－１４６ａが挙げられる。

【0380】

いくつかの実施形態において、逆転写酵素多重ライゲーション依存性プローブ増幅（ＲＴ－ＭＬＰＡ）を用い、ＲＮＡを増幅する。いくつかの実施形態において、ハイブリダイズプローブの各セットは、ＳＮＰに広がる２つの短い合成オリゴヌクレオチドと、１つの長いオリゴヌクレオチドとからなる（Ｌｉｅｔａｌ．，ＡｒｃｈＧｙｎｅｃｏｌＯｂｓｔｅｔ．“Ｄｅｖｅｌｏｐｍｅｎｔｏｆｎｏｎｉｎｖａｓｉｖｅｐｒｅｎａｔａｌｄｉａｇｎｏｓｉｓｏｆｔｒｉｓｏｍｙ２１ｂｙＲＴ－ＭＬＰＡｗｉｔｈａｎｅｗｓｅｔｏｆＳＮＰｍａｒｋｅｒｓ，”２０１３年７月５日、ＤＯＩ１０．１００７／ｓ００４０４－０１３－２９２６－５、Ｓｃｈｏｕｔｅｎｅｔａｌ．，“Ｒｅｌａｔｉｖｅｑｕａｎｔｉｆｉｃａｔｉｏｎｏｆ４０ｎｕｃｌｅｉｃａｃｉｄｓｅｑｕｅｎｃｅｓｂｙｍｕｌｔｉｐｌｅｘｌｉｇａｔｉｏｎ－ｄｅｐｅｎｄｅｎｔｐｒｏｂｅａｍｐｌｉｆｉｃａｔｉｏｎ．”ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ３０：ｅ５７，２００２；Ｄｅｎｇｅｔａｌ．（２０１１）“Ｎｏｎ－ｉｎｖａｓｉｖｅｐｒｅｎａｔａｌｄｉａｇｎｏｓｉｓｏｆｔｒｉｓｏｍｙ２１ｂｙｒｅｖｅｒｓｅｔｒａｎｓｃｒｉｐｔａｓｅｍｕｌｔｉｐｌｅｘｌｉｇａｔｉｏｎ－ｄｅｐｅｎｄｅｎｔｐｒｏｂｅａｍｐｌｉｆｉｃａｔｉｏｎ，”Ｃｌｉｎ，Ｃｈｅｍ．ＬａｂＭｅｄ．４９：６４１－６４６，２０１１、各々、その全体が参照により本明細書に組み込まれる）。

【0381】

いくつかの実施形態において、ＲＮＡは、逆転写酵素ＰＣＲで増幅される。いくつかの実施形態において、ＲＮＡは、リアルタイム逆転写酵素ＰＣＲ、例えば、既に記載したようなＳＹＢＲＧＲＥＥＮＩを用いる１工程リアルタイム逆転写酵素ＰＣＲを用いて増幅される（Ｌｉｅｔａｌ．，ＡｒｃｈＧｙｎｅｃｏｌＯｂｓｔｅｔ．“Ｄｅｖｅｌｏｐｍｅｎｔｏｆｎｏｎｉｎｖａｓｉｖｅｐｒｅｎａｔａｌｄｉａｇｎｏｓｉｓｏｆｔｒｉｓｏｍｙ２１ｂｙＲＴ－ＭＬＰＡｗｉｔｈａｎｅｗｓｅｔｏｆＳＮＰｍａｒｋｅｒｓ，”２０１３年７月５日、ＤＯＩ１０．１００７／ｓ００４０４－０１３－２９２６－５、Ｌｏｅｔａｌ．，“ＰｌａｓｍａｐｌａｃｅｎｔａｌＲＮＡａｌｌｅｌｉｃｒａｔｉｏｐｅｒｍｉｔｓｎｏｎｉｎｖａｓｉｖｅｐｒｅｎａｔａｌｃｈｒｏｍｏｓｏｍａｌａｎｅｕｐｌｏｉｄｙｄｅｔｅｃｔｉｏｎ”、ＮａｔＭｅｄ１３：２１８－２２３２００７、Ｔｓｕｉｅｔａｌ．，Ｓｙｓｔｅｍａｔｉｃｍｉｃｒｏ－ａｒｒａｙｂａｓｅｄｉｄｅｎｔｉｆｉｃａｔｉｏｎｏｆｐｌａｃｅｎｔａｌｍＲＮＡｉｎｍａｔｅｒｎａｌｐｌａｓｍａ：ｔｏｗａｒｄｓｎｏｎ－ｉｎｖａｓｉｖｅｐｒｅｎａｔａｌｇｅｎｅｅｘｐｒｅｓｓｉｏｎｐｒｏｆｉｌｉｎｇ．ＪＭｅｄＧｅｎｅｔ４１：４６１－４６７，２００４；Ｇｕｅｔａｌ．，Ｊ．Ｎｅｕｒｏｃｈｅｍ．１２２：６４１－６４９，２０１２、各々、その全体が参照により本明細書に組み込まれる）。

【0382】

いくつかの実施形態において、マイクロアレイを使用して、ＲＮＡを検出する。例えば、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ製のヒトｍｉＲＮＡマイクロアレイを、製造業者のプロトコルに従って使用することができる。簡単に言うと、単離されたＲＮＡは、脱リン酸化され、ｐＣｐ－Ｃｙ３を用いてライゲーションされる。標識されたＲＮＡを精製し、ＳａｎｇｅｒｍｉＲＢａｓｅｒｅｌｅａｓｅ１４．０に基づいて、ヒト成熟ｍｉＲＮＡについてのプローブを含有するｍｉＲＮＡアレイにハイブリダイズする。このアレイを洗浄し、マイクロアレイスキャナ（Ｇ２５６５ＢＡ、ＡｇｉｌｅｎｔＴｅｃｈｎｏｌｏｇｉｅｓ）を使用してスキャンする。各ハイブリダイゼーション信号の強度は、Ａｇｉｌｅｎｔ抽出ソフトウェアｖ９．５．３によって評価される。標識、ハイブリダイゼーション及びスキャンは、ＡｇｉｌｅｎｔｍｉＲＮＡマイクロアレイシステムにおけるプロトコルに従って行われてもよい（Ｇｕｅｔａｌ．，Ｊ．Ｎｅｕｒｏｃｈｅｍ．１２２：６４１－６４９，２０１２、その全体が参照により本明細書に組み込まれる）。

【0383】

いくつかの実施形態において、ＴａｑＭａｎアッセイを使用して、ＲＮＡを検出する。例示的なアッセイは、ＴａｑＭａｎＡｒｒａｙＨｕｍａｎＭｉｃｒｏＲＮＡＰａｎｅｌｖ１．０（ＥａｒｌｙＡｃｃｅｓｓ）（ＡｐｐｌｉｅｄＢｉｏｓｙｓｔｅｍｓ）であり、１５７のＴａｑＭａｎＭｉｃｒｏＲＮＡアッセイを含み、それぞれの逆転写プライマー、ＰＣＲプライマー及びＴａｑＭａｎプローブを含む（Ｃｈｉｍｅｔａｌ．，“ＤｅｔｅｃｔｉｏｎａｎｄｃｈａｒａｃｔｅｒｉｚａｔｉｏｎｏｆｐｌａｃｅｎｔａｌｍｉｃｒｏＲＮＡｓｉｎｍａｔｅｒｎａｌｐｌａｓｍａ，”ＣｌｉｎＣｈｅｍ．５４（３）：４８２－９０，２００８、その全体が参照により本明細書に組み込まれる）。

【0384】

所望な場合、１つ以上のｍＲＮＡのｍＲＮＡスプライシングパターンは、標準的な方法を使用して決定することができる（ＦａｃｋｅｎｔｈａｌａｎｄＧｏｄｌｅｙ，ＤｉｓｅａｓｅＭｏｄｅｌｓ＆Ｍｅｃｈａｎｉｓｍｓ１：３７－４２，２００８，ｄｏｉ：１０．１２４２／ｄｍｍ．０００３３１、その全体が参照により本明細書に組み込まれる）。例えば、高密度マイクロアレイ及び／又は高スループットＤＮＡ配列決定を使用して、ｍＲＮＡスプライスバリアントを検出することができる。

【0385】

いくつかの実施形態において、全トランスクリプトームショットガン配列決定又はアレイを使用して、トランスクリプトームを測定する。

【0386】

Ｗ．例示的な増幅方法
同じ反応体積（例えば、全ての標的遺伝子座を同時に増幅するサンプルマルチプレックスＰＣＲの一部）における付近又は隣接する標的遺伝子座の増幅に起因する干渉を最小化するか、又は防ぐ、改善されたＰＣＲ増幅方法も開発された。これらの方法を使用して、付近又は隣接する標的遺伝子座を同時に増幅することができ、これは、標的遺伝子座を別個に増幅し、干渉を避けることができるような、付近の標的遺伝子座を異なる反応体積に分割する必要がある方法よりも、迅速であり、安価である。

【0387】

いくつかの実施形態において、標的遺伝子座の増幅は、低い５’→３’エキソヌクレアーゼ活性及び／又は低い鎖置換活性を有するポリメラーゼ（例えば、ＤＮＡポリメラーゼ、ＲＮＡポリメラーゼ又は逆転写酵素）を用いて行われる。いくつかの実施形態において、低レベルの５’→３’エキソヌクレアーゼは、付近のプライマー（例えば、伸長していないプライマー、又はプライマー伸長中に加えられる１つ以上のヌクレオチドを有しているプライマー）の分解を減らすか、又は防ぐ。いくつかの実施形態において、低レベルの鎖置換活性は、付近のプライマー（例えば、伸長していないプライマー、又はプライマー伸長中に加えられる１つ以上のヌクレオチドを有しているプライマー）の置換を減らすか、又は防ぐ。いくつかの実施形態において、互いに隣接する標的遺伝子座（例えば、標的遺伝子座の間に塩基がない）又は付近のもの（例えば、遺伝子座が、５０、４０、３０、２０、１５、１０、９、８、７、６、５、４、３、２又は１塩基以内にある）が増幅される。いくつかの実施形態において、１つの遺伝子座の３’末端は、次の下流の遺伝子座の５’末端の５０、４０、３０、２０、１５、１０、９、８、７、６、５、４、３、２又は１塩基以内である。

【0388】

いくつかの実施形態において、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる標的遺伝子座が増幅される（例えば、１つの反応体積における同時増幅による）。いくつかの実施形態において、増幅産物の少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％が、標的アンプリコンである。様々な実施形態において、標的アンプリコンである増幅される産物の量は、５０～９９．５％、例えば、６０～９９％、７０～９８％、８０～９８％、９０～９９．５％又は９５～９９．５％（境界値を含む）である。いくつかの実施形態において、例えば、１つの反応体積における同時増幅によって、標的遺伝子座の少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％が増幅される（例えば、増幅前の量と比較して、少なくとも５、１０、２０、３０、５０又は１００倍に増幅される）。様々な実施形態において、増幅される標的遺伝子座の量（例えば、増幅前の量と比較して、少なくとも５、１０、２０、３０、５０又は１００倍に増幅される）は、５０～９９．５％、例えば、６０～９９％、７０～９８％、８０～９９％、９０～９９．５％、９５～９９．９％又は９８～９９．９９％（境界値を含む）である。いくつかの実施形態において、より少ない非標的アンプリコン、例えば、第１のプライマー対からの順方向プライマー及び第２のプライマー対からの逆方向プライマーから作られる、より少ないアンプリコンが産生される。このような望ましくない非標的アンプリコンは、例えば、第１のプライマー対からの逆方向プライマー及び／又は第２のプライマー対からの順方向プライマーが分解し、及び／又は置き換わっている場合に、従来の増幅方法を用いて産生する可能性がある。

【0389】

いくつかの実施形態において、これらの方法は、伸長されるプライマーに結合するポリメラーゼが、このポリメラーゼの低い５’→３’エキソヌクレアーゼ活性及び／又は低い鎖置換活性を考慮して、付近のプライマー（例えば、次の下流のプライマー）を分解及び／又は置き換える確率が低いため、より長い伸長時間を使用することが可能である。様々な実施形態において、ポリメラーゼの伸長率が、伸長されるプライマーに付加されるヌクレオチドの数が、そのプライマー結合部位の３’末端と同じ鎖上の次の下流のプライマー結合部位の５’末端との間のヌクレオチド数の８０、９０、９５、１００、１１０、１２０、１３０、１４０、１５０、１７５又は２００％に等しいか、又は大きくすることが可能であるような反応条件（例えば、伸長時間及び温度）が使用される。

【0390】

いくつかの実施形態において、ＤＮＡポリメラーゼは、ＤＮＡをテンプレートとして用い、ＤＮＡアンプリコンを産生するために使用される。いくつかの実施形態において、ＲＮＡポリメラーゼは、ＤＮＡをテンプレートとして用い、ＲＮＡアンプリコンを産生するために使用される。いくつかの実施形態において、逆転写酵素は、ＲＮＡをテンプレートとして用い、ｃＤＮＡアンプリコンを産生するために使用される。

【0391】

いくつかの実施形態において、ポリメラーゼの低レベルの５’→３’エキソヌクレアーゼは、同じ条件で同じ量のＴｈｅｒｍｕｓａｑｕａｔｉｃｕｓポリメラーゼの活性の８０、７０、６０、５０、４０、３０、２０、１０、５、１又は０．１％未満である（「Ｔａｑ」ポリメラーゼ、一般的に使用される好熱菌由来のＤＮＡポリメラーゼであり、ＰＤＢ１ＢＧＸ、ＥＣ２．７．７．７、Ｍｕｒａｌｉｅｔａｌ．，“ＣｒｙｓｔａｌｓｔｒｕｃｔｕｒｅｏｆＴａｑＤＮＡｐｏｌｙｍｅｒａｓｅｉｎｃｏｍｐｌｅｘｗｉｔｈａｎｉｎｈｉｂｉｔｏｒｙＦａｂ：ｔｈｅＦａｂｉｓｄｉｒｅｃｔｅｄａｇａｉｎｓｔａｎｉｎｔｅｒｍｅｄｉａｔｅｉｎｔｈｅｈｅｌｉｘ－ｃｏｉｌｄｙｎａｍｉｃｓｏｆｔｈｅｅｎｚｙｍｅ，”Ｐｒｏｃ．Ｎａｔｌ．Ａｃａｄ．Ｓｃｉ．ＵＳＡ９５：１２５６２－１２５６７，１９９８、その全体が参照により本明細書に組み込まれる）。いくつかの実施形態において、ポリメラーゼの低レベルの鎖置換活性は、同じ条件で同じ量のＴａｑポリメラーゼの活性の８０、７０、６０、５０、４０、３０、２０、１０、５、１又は０．１％未満である。

【0392】

いくつかの実施形態において、ポリメラーゼは、ＰＵＳＨＩＯＮＤＮＡポリメラーゼ、例えば、ＰＨＵＳＩＯＮＨｉｇｈＦｉｄｅｌｉｔｙＤＮＡポリメラーゼ（Ｍ０５３０Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）又はＰＨＵＳＩＯＮＨｏｔＳｔａｒｔＦｌｅｘＤＮＡポリメラーゼ（Ｍ０５３５Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．、ＦｒｅｙａｎｄＳｕｐｐｍａｎＢｉｏＣｈｅｍｉｃａ．２：３４－３５，１９９５、ＣｈｅｓｔｅｒａｎｄＭａｒｓｈａｋＡｎａｌｙｔｉｃａｌＢｉｏｃｈｅｍｉｓｔｒｙ．２０９：２８４－２９０，１９９３、各々、その全体が参照により本明細書に組み込まれる）。ＰＨＵＳＩＯＮＤＮＡポリメラーゼは、処理能力向上ドメインと融合したＰｙｒｏｃｏｃｃｕｓ様酵素である。ＰＨＵＳＩＯＮＤＮＡポリメラーゼは、５’→３’ポリメラーゼ活性と３’→５’エンドヌクレアーゼ活性を有し、平滑末端化した産物を生成する。ＰＨＵＳＩＯＮＤＮＡポリメラーゼは、５’→３’エキソヌクレアーゼ活性と鎖置換活性を欠く。

【0393】

いくつかの実施形態において、ポリメラーゼは、Ｑ５（登録商標）ＤＮＡポリメラーゼ、例えば、Ｑ５（登録商標）Ｈｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡＰｏｌｙｍｅｒａｓｅ（Ｍ０４９１Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）又はＱ５（登録商標）ＨｏｔＳｔａｒｔＨｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡＰｏｌｙｍｅｒａｓｅ（Ｍ０４９３Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．）である。Ｑ５（登録商標）Ｈｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡポリメラーゼは、忠実度が高く、熱に安定なＤＮＡポリメラーゼであり、３’→５’エキソヌクレアーゼ活性を有し、処理能力向上Ｓｓｏ７ｄドメインに融合している。Ｑ５（登録商標）Ｈｉｇｈ－ＦｉｄｅｌｉｔｙＤＮＡポリメラーゼは、５’→３’エキソヌクレアーゼ活性と鎖置換活性を欠く。

【0394】

いくつかの実施形態において、ポリメラーゼは、Ｔ４ＤＮＡポリメラーゼである（Ｍ０２０３Ｓ、ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．；Ｔａｂｏｒ及びＳｔｒｕｈ．（１９８９）．“ＤＮＡ－ＤｅｐｅｎｄｅｎｔＤＮＡＰｏｌｙｍｅｒａｓｅｓ，”ＩｎＡｕｓｅｂｅｌｅｔａｌ．（Ｅｄ．），ＣｕｒｒｅｎｔＰｒｏｔｏｃｏｌｓｉｎＭｏｌｅｃｕｌａｒＢｉｏｌｏｇｙ．３．５．１０－３．５．１２．ＮｅｗＹｏｒｋ：ＪｏｈｎＷｉｌｅｙ＆Ｓｏｎｓ，Ｉｎｃ．，１９８９、Ｓａｍｂｒｏｏｋｅｔａｌ．ＭｏｌｅｃｕｌａｒＣｌｏｎｉｎｇ：ＡＬａｂｏｒａｔｏｒｙＭａｎｕａｌ．（第２版）、５．４４－５．４７．ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒ：ＣｏｌｄＳｐｒｉｎｇＨａｒｂｏｒＬａｂｏｒａｔｏｒｙＰｒｅｓｓ，１９８９、各々、その全体が参照により本明細書に組み込まれる）。Ｔ４ＤＮＡポリメラーゼは、５’→３’方向へのＤＮＡの合成を触媒し、テンプレート及びプライマーの存在を必要とする。この酵素は、ＤＮＡＰｏｌｙｍｅｒａｓｅＩで見られるよりもかなり活性が高い３’→５’エキソヌクレアーゼ活性を有する。Ｔ４ＤＮＡポリメラーゼは、５’→３’エキソヌクレアーゼ活性と鎖置換活性を欠く。

【0395】

いくつかの実施形態において、ポリメラーゼは、ＳｕｌｆｏｌｏｂｕｓＤＮＡＰｏｌｙｍｅｒａｓｅＩＶである（Ｍ０３２７Ｓ，ＮｅｗＥｎｇｌａｎｄＢｉｏＬａｂｓ，Ｉｎｃ．；（Ｂｏｕｄｓｏｃｑｅｔａｌ．（２００１）．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，２９：４６０７－４６１６，２００１、ＭｃＤｏｎａｌｄ．ｅｔａｌ．（２００６）．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，３４：１１０２－１１１１，２００６、各々、その全体が参照により本明細書に組み込まれる）。ＳｕｌｆｏｌｏｂｕｓＤＮＡＰｏｌｙｍｅｒａｓｅＩＶは、様々なＤＮＡテンプレート病変にわたってＤＮＡを効率的に合成する、熱に安定なＹファミリー病変バイパスＤＮＡＰｏｌｙｍｅｒａｓｅである。ＭｃＤｏｎａｌｄ，Ｊ．Ｐ．ｅｔａｌ．（２００６）．ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．，．３４，１１０２－１１１１、その全体が参照により本明細書に組み込まれる）。ＳｕｌｆｏｌｏｂｕｓＤＮＡＰｏｌｙｍｅｒａｓｅＩＶは、５’→３’エキソヌクレアーゼ活性と鎖置換活性を欠く。

【0396】

いくつかの実施形態において、プライマーがＳＮＰを有する領域に結合する場合、プライマーは、異なる効率で異なる対立遺伝子に結合し、増幅してもよく、又は１つの対立遺伝子にのみ結合し、増幅してもよい。ヘテロ接合性である被験体について、対立遺伝子の１つが、プライマーによって増幅されなくてもよい。いくつかの実施形態において、プライマーは、各対立遺伝子に対して設計される。例えば、２つの対立遺伝子（例えば、二対立遺伝子ＳＮＰ）が存在する場合、２つのプライマーを使用して、標的遺伝子座の同じ位置に結合してもよい（例えば、「Ａ」対立遺伝子に結合するための順方向プライマー及び「Ｂ」対立遺伝子に結合するための順方向プライマー）。標準的な方法（例えばｄｂＳＮＰデータベース）を使用して、既知のＳＮＰ、例えば、高いヘテロ接合率を有するＳＮＰホットスポットの位置を決定することができる。

【0397】

いくつかの実施形態において、アンプリコンは、同様の大きさである。いくつかの実施形態において、標的アンプリコンの長さの範囲は、１００、７５、５０、２５、１５、１０又は５ヌクレオチド未満である。いくつかの実施形態（例えば、フラグメント化されたＤＮＡ又はＲＮＡ中の標的遺伝子座の増幅）において、標的アンプリコンの長さは、５０～１００ヌクレオチド、例えば、６０～８０ヌクレオチド又は６０～７５ヌクレオチド（境界値を含む）である。いくつかの実施形態（例えば、エクソン又は遺伝子全体の複数の標的遺伝子座の増幅）において、標的アンプリコンの長さは、１００～５００ヌクレオチド、例えば、１５０～４５０ヌクレオチド、２００～４００ヌクレオチド、２００～３００ヌクレオチド又は３００～４００ヌクレオチド（境界値を含む）である。

【0398】

いくつかの実施形態において、複数の標的遺伝子座は、その反応体積中の増幅される各々の標的遺伝子座についての順方向及び逆方向のプライマーを含むプライマー対を用いて同時に増幅される。いくつかの実施形態において、１ラウンドのＰＣＲは、標的遺伝子座当たり１つのプライマーを用いて行われ、次いで、第２ラウンドのＰＣＲは、標的遺伝子座当たり１つのプライマー対を用いて行われる。例えば、第１ラウンドのＰＣＲは、全てのプライマーが同じ鎖に結合する（例えば、各標的遺伝子座について順方向プライマーを用いる）ように、標的遺伝子座当たり１つのプライマーを用いて行われてもよい。これにより、ＰＣＲは、線形態様で増幅が可能であり、配列又は長さの差に起因するアンプリコン間の増幅バイアスを減らすか、又は除外する。いくつかの実施形態において、次いで、各標的遺伝子座について、順方向及び逆方向のプライマーを用い、アンプリコンが増幅される。

【0399】

Ｘ．例示的なプライマー設計方法
所望な場合、マルチプレックスＰＣＲは、プライマーダイマーを生成する尤度が低いプライマーを用いて行われてもよい。特に、高度に多重化したＰＣＲは、多くは、プライマーダイマー生成などの生産的ではない副反応から得られる非常に高い割合の産物ＤＮＡを生成し得る。一実施形態において、生産的ではない副反応を引き起こす可能性が最も高い特定のプライマーは、プライマーライブラリから除去され、ゲノムにマッピングする増幅ＤＮＡの割合を大きくするプライマーライブラリを与え得る。問題のあるプライマー、すなわち、ダイマーを安定させる可能性が特に高いプライマーを除去する工程は、予測できないことに、その後の配列決定による分析のための非常に高いＰＣＲ多重化レベルを可能にした。

【0400】

非マッピングプライマーダイマー又は他のプライマー妨害産物の量が最小限にされたライブラリのためのプライマーを選択するいくつかの方法が存在する。経験的なデータは、少数の「悪い」プライマーが、多量の非マッピングプライマーダイマー副反応の原因であることを示す。これらの「悪い」プライマーを除去することで、標的遺伝子座へマッピングする配列リードの割合を高めることができる。「悪い」プライマーを特定するための１つの方法は、標的化された増幅によって増幅されたＤＮＡの配列決定データを見ることであり、最も頻繁に見られるこれらのプライマーダイマーが除去され、ゲノムにマッピングされない副産物ＤＮＡを生じる可能性が顕著に低いプライマーライブラリを与えることができる。様々なプライマーの組み合わせの結合エネルギーを計算することができる公的に利用可能なプログラムも存在し、最も高い結合エネルギーを有するものを除去することで、ゲノムにマッピングされない副産物ＤＮＡを生じる可能性が顕著に低いプライマーライブラリも与えるだろう。

【0401】

プライマーを選択するためのいくつかの実施形態において、候補プライマーの初期ライブラリは、候補標的遺伝子座に対する１つ以上のプライマー又はプライマー対を設計することによって作成される。候補標的遺伝子座（例えばＳＮＰ）のセットは、標的遺伝子座にとって望ましいパラメータ（例えば、標的集合内のＳＮＰの頻度又はＳＮＰのヘテロ接合率）に関する公的に利用可能な情報に基づいて選択することができる。一実施形態において、ＰＣＲプライマーは、Ｐｒｉｍｅｒ３プログラム（ｐｒｉｍｅｒ３．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔ：ｌｉｂｐｒｉｍｅｒ３ｒｅｌｅａｓｅ２．２．３でのワールドワイドウェブ、その全体が参照により本明細書に組み込まれる）を用いて設計されてもよい。所望な場合、特定のアニーリング温度範囲内でアニーリングし、特定の範囲のＧＣ内容物を有し、特定のサイズ範囲を有し、特定のサイズ範囲で標的アンプリコンを産生し、及び／又は他のパラメータ特徴を有するようなプライマーを設計することができる。候補標的遺伝子座当たり、複数のプライマー又はプライマー対を用いて開始すると、プライマー又はプライマー対が標的遺伝子座の大部分又は全てについてのライブラリ中に残る尤度が増加する。一実施形態において、選択基準は、標的遺伝子当たり少なくとも１つのプライマーがライブラリ中に残ることを必要とし得る。そうすれば、最終的なプライマーライブラリを使用するとき、標的遺伝子座の大部分又は全てが増幅されるだろう。このことは、ゲノム中の多数の位置での欠失又は重複についてのスクリーニング、又はある疾患又はある疾患のリスク上昇に関連付けられた多数の配列（例えば、多型又は他の変異）についてのスクリーニングなどの用途に望ましい。ライブラリからのプライマー対が、別のプライマー対によって産生される標的アンプリコンと重複する標的アンプリコンを産生する場合、プライマー対の１つが、干渉を防ぐためにライブラリから除去されてもよい。

【0402】

いくつかの実施形態において、候補プライマーのライブラリからの２つのプライマーの可能な組み合わせの大部分又は全てについて、「望ましくなさスコア」（最小の望ましくなさを表す、より高いスコア）が計算される。様々な実施形態において、望ましくなさスコアは、ライブラリ中の候補プライマーの可能な組み合わせの少なくとも８０、９０、９５、９８、９９又は９９．５％について計算される。各々の望ましくなさスコアは、少なくとも部分的に、２つの候補プライマー間のダイマー生成の尤度に依存する。所望な場合、望ましくなさスコアは、標的遺伝子座のヘテロ接合率、標的遺伝子座のある配列（例えば、多型）に関連付けられた疾患有病率、標的遺伝子座のある配列（例えば、多型）に関連付けられた疾患浸透度、標的遺伝子座に対する候補プライマーの特異性、候補プライマーの大きさ、標的アンプリコンの融点、標的アンプリコンのＧＣ含有率、標的アンプリコンの増幅効率、標的アンプリコンの大きさ及び組換えホットスポットの中心からの距離からなる群から選択される１つ以上の他のパラメータにも基づいていてもよい。いくつかの実施形態において、標的遺伝子座に対する候補プライマーの特異性は、候補プライマーが、増幅するように設計された標的遺伝子座以外の遺伝子座に結合し、増幅することによって、誤ってプライマー結合する尤度を含む。いくつかの実施形態において、誤ってプライマー結合する１つ以上又は全ての候補プライマーが、ライブラリから除去される。いくつかの実施形態において、選択する候補プライマーの数を増やすために、誤ってプライマー結合し得る候補プライマーは、ライブラリから除去されない。複数の因子が考慮される場合、望ましくなさスコアは、様々なパラメータの重み付けされた平均に基づいて計算されてもよい。パラメータは、プライマーが使用される特定の用途に対するその重要性に基づいて、異なる重みを割り当てられてもよい。いくつかの実施形態において、最も高い望ましくなさスコアを有するプライマーが、ライブラリから除去される。除去されたプライマーが、１つの標的遺伝子座にハイブリダイズするプライマー対のメンバーである場合、そのプライマー対の他のメンバーは、ライブラリから除去されてもよい。プライマーを除去するプロセスは、所望なように繰り返されてもよい。いくつかの実施形態において、上述の選択方法は、ライブラリ中に残る候補プライマーの組み合わせについての望ましくなさスコアが、全て最小閾値と等しいか、又はそれより小さくなるまで行われる。いくつかの実施形態において、上述の選択方法は、ライブラリ中に残る候補プライマーの数が、所望な数まで減るまで行われる。

【0403】

様々な実施形態において、望ましくなさスコアが計算された後、第１の最小閾値より大きな望ましくなさスコアを有する２つの候補プライマーの組み合わせの最大数の一部である候補プライマーは、ライブラリから除去される。この工程は、これらの相互作用があまり有意ではないため、第１の最小閾値と等しいか、又は下回る相互作用を無視する。除去されたプライマーが、１つの標的遺伝子座にハイブリダイズするプライマー対のメンバーである場合、そのプライマー対の他のメンバーは、ライブラリから除去されてもよい。プライマーを除去するプロセスは、所望なように繰り返されてもよい。いくつかの実施形態において、上述の選択方法は、ライブラリ中に残る候補プライマーの組み合わせについての望ましくなさスコアが、全て第１の最小閾値と等しいか、又はそれより小さくなるまで行われる。ライブラリ中に残る候補プライマーの数が、所望な数よりも多い場合、プライマーの数は、第１の最小閾値をそれより小さな第２の最小閾値まで減らし、プライマーを除去するプロセスを繰り返すことによって減らされてもよい。ライブラリ中に残る候補プライマーの数が、所望な数よりも少ない場合、本方法は、第１の最小閾値をそれより大きな第２の最小閾値まで増加させ、元の候補プライマーライブラリを用いて、プライマーを除去するプロセスを繰り返すことによって続けられてもよく、それにより、より多くの候補プライマーがライブラリ中に残ることを可能にする。いくつかの実施形態において、上述の選択方法は、ライブラリ中に残る候補プライマーの組み合わせについての望ましくなさスコアが、全て第２の最小閾値と等しいか、又はそれより小さくなるまで、又はライブラリ中に残る候補プライマーの数が所望な数まで減るまで、行われる。

【0404】

所望な場合、別のプライマー対によって産生される標的アンプリコンと重複する標的アンプリコンを産生するプライマー対は、別個の増幅反応に分割されてもよい。複数のＰＣＲ増幅反応は、（重複する標的アンプリコンに起因して、分析からの候補標的遺伝子座を省く代わりに）候補標的遺伝子座の全てを分析することが望ましい用途にとって望ましい場合がある。

【0405】

これらの選択方法は、プライマーダイマーの望ましい減少を達成するために、ライブラリから除去されなければならない候補プライマーの数を最小限にする。より少ない数の候補プライマーをライブラリから除去することによって、標的遺伝子座のより多く（又は全て）を、得られたプライマーライブラリを用いて増幅することができる。

【0406】

多数のプライマーを多重化することで、含まれ得るアッセイにかなりの制約を課す。意図せずに相互作用するアッセイは、偽の増幅産物を生じる。ミニＰＣＲのサイズ制約は、更なる制約を引き起こし得る。一実施形態において、非常に多数の潜在的なＳＮＰ標的（約５００から１００万より多くまで）から開始し、各ＳＮＰを増幅するようにプライマーを設計するように企画することが可能である。プライマーを設計することが可能な場合、ＤＮＡ二本鎖生成のための公開されている熱力学的パラメータを用い、全ての可能なプライマー対間の偽のプライマー二本鎖生成の尤度を評価することによって、偽の産物を生成する可能性があるプライマー対を特定するように企画することが可能である。プライマーの相互作用は、この相互作用に関連するスコアリング関数によってランク付けされてもよく、最も悪い相互作用スコアを有するプライマーは、望ましいプライマー数を満たすまで、除外される。ヘテロ接合性である可能性があるＳＮＰが最も有用である場合、アッセイのリストもランク付けし、最もヘテロ接合性に適合するアッセイを選択することが可能である。高い相互作用スコアを有するプライマーが、プライマーダイマーを形成する可能性が最も高いことが実験で検証されている。高度に多重化すると、全ての偽の相互作用を除外することは可能ではないが、反応全体を支配し、意図した標的からの増幅を大きく制限することがあるため、ｉｎｓｉｌｉｃｏで最も高い相互作用スコアを有するプライマー又はプライマー対を除外することが不可欠である。この手順を行い、１０，０００プライマーまで、ある場合には、１０，０００プライマーを超える多重プライマーセットを作成した。この手順に起因する改善は、かなりのものであり、全てのＰＣＲ産物によって決定されるような標的産物に対して、最も悪いプライマーが除去されなかった反応からの１０％と比較して、８０％より多く、９０％より多く、９５％より多く、９８％より多く、更に９９％より多くの増幅を可能にする。既に記載したように、部分的なセミネスティッド手法と組み合わせると、アンプリコンの９０％より多く、更に９５％より多くが、標的配列にマッピングされ得る。

【0407】

なお、どのＰＣＲプローブがダイマーを形成する可能性が高いかを決定する他の方法が存在する。一実施形態において、最適化されていないプライマーセットを用いて増幅されたＤＮＡのプールの分析は、問題のあるプライマーを決定するのに十分な場合がある。例えば、分析は、配列決定を用いて行われてもよく、最も多く存在するこれらのダイマーは、ダイマーを形成する可能性が最も高いものであると決定され、除去されてもよい。一実施形態において、プライマー設計の方法は、本明細書に記載のミニＰＣＲ方法と組み合わせて使用されてもよい。

【0408】

プライマーに対するタグの使用は、プライマーダイマー産物の増幅及び配列決定を減らし得る。いくつかの実施形態において、プライマーは、タブを含むループ構造を形成する内部領域を含有する。特定の実施形態において、プライマーは、標的遺伝子座に特異的な５’領域と、標的遺伝子座に特異的ではなく、ループ構造を形成する内部領域と、標的遺伝子座に特異的な３’領域とを含む。いくつかの実施形態において、ループ領域は、２つの結合領域がテンプレートＤＮＡの連続した領域又は隣接領域に結合するように設計されている２つの結合領域間に存在していてもよい。様々な実施形態において、３’領域の長さは、少なくとも７ヌクレオチドである。いくつかの実施形態において、３’領域の長さは、７～２０ヌクレオチド、例えば、７～１５ヌクレオチド又は７～１０ヌクレオチド（境界値を含む）である。様々な実施形態において、プライマーは、標的遺伝子座に特異的ではない５’領域（例えば、タグ又はユニバーサルプライマー結合部位）の後に、標的遺伝子座に特異的な領域と、標的遺伝子座に特異的ではなく、ループ構造を形成する内部領域と、標的遺伝子座に特異的な３’領域とを含む。タグプライマーを使用して、必要な標的特異性配列を２０未満、１５未満、１２未満、更に１０未満の塩基対まで短くすることができる。これは、標的配列がプライマー結合部位へとフラグメント化される場合、又はプライマー設計へと設計される場合に、予想外の発見となり得る。この方法の利点は、特定の最大アンプリコン長のために設計可能なアッセイの数を増やすことと、プライマー配列の「無情報」配列決定を短くすることを含む。内部タグ化と組み合わせ使用することも可能である。

【0409】

一実施形態において、多重標的化ＰＣＲ増幅における非生産的な産物の相対量は、アニーリング温度を上げることによって減らすことができる。標的特異性プライマーと同じタグを用いてライブラリを増幅する場合、アニーリング温度は、タグがプライマー結合に寄与するため、ゲノムＤＮＡと比較して、高くすることができる。いくつかの実施形態において、場合により、より長いアニーリング時間とともに、低いプライマー濃度が使用される。いくつかの実施形態において、アニーリング時間は、３分間より長く、５分間より長く、８分間より長く、１０分間より長く、１５分間より長く、２０分間より長く、３０分間より長く、６０分間より長く、１２０分間より長く、２４０分間より長く、４８０分間より長く、更に９６０分間より長くてもよい。特定の例示的な実施形態において、より長くアニーリング時間を、低いプライマー濃度とともに使用する。様々な実施形態において、３、５、８、１０又は１５分間より長い、通常の伸長時間より長い時間が使用される。いくつかの実施形態において、プライマー濃度は、５０ｎＭ、２０ｎＭ、１０ｎＭ、５ｎＭ、１ｎＭ程度の低さ、及び１ｎＭ未満である。これにより、驚くべきことに、高度二多重化された反応、例えば、１０００倍反応、２０００倍反応、５０００倍反応、１００００倍反応、２００００倍反応、５００００倍反応及び更に１０００００倍反応について、安定した性能が得られる。一実施形態において、増幅は、長いアニーリング時間を有する１、２、３、４又は５サイクルを使用し、その後、タグ化プライマーを用い、通常の更に長いアニーリング時間を有するＰＣＲサイクルを使用する。

【0410】

標的位置を選択するために、候補プライマー対設計のプールから開始し、プライマー対との間の潜在的に有害な副次的相互作用の熱力学的モデルを作成し、次いで、プール中の他の設計と互換性のない設計を除外するモデルを使用してもよい。

【0411】

一実施形態において、本発明は、標的遺伝子座（例えば、ある疾患若しくは障害又はある疾患若しくは障害（例えばがん）のリスク上昇に関連付けられた多型又は変位を含有し得る遺伝子座）の数を減らし、及び／又は検出される疾患負荷を増加させる（例えば、検出される多型又は変位の数を増やす）方法を特徴とする。いくつかの実施形態において、本方法は、疾患又は障害（例えばがん）を有する被験体間の各遺伝子座における多型又は変位の頻度又は再発（例えば、単一ヌクレオチド変動、又は欠失、又は本明細書に記載する他の変動のいずれか）によって、遺伝子座をランク付けすること（例えば、最高から最低までランク付けすること）を含む。いくつかの実施形態において、ＰＣＲプライマーは、遺伝子座のいくつか又は全てに対して設計される。プライマーのライブラリのためのＰＣＲプライマーの選択中に、より高い頻度又は再発を伴う遺伝子座（より高くランク付けされた遺伝子座）に対するプライマーは、より低い頻度又は再発を伴う遺伝子座（より低くランク付けされた遺伝子座）よりも好ましい。いくつかの実施形態において、このパラメータは、本明細書に記載される望ましくなさスコアの計算におけるパラメータの１つとして含まれる。所望な場合、ライブラリ中の他の設計と不適合なプライマー（例えば、高くランク付けされた遺伝子座に対するプライマー）は、異なるＰＣＲライブラリ／プールに含まれてもよい。いくつかの実施形態において、複数のライブラリ／プール（例えば、２、３、４、５又はもっと多く）は、別個のＰＣＲ反応に使用され、全てのライブラリ／プールによって表される遺伝子座の全て（又は大部分）の増幅を可能にする。いくつかの実施形態において、この方法は、プライマーが、集合体において、（例えば、疾患負荷の少なくとも８０、８５、９０、９５又は９９％の検出によって）所望な疾患負荷をその疾患又は障害のために捕捉し得ることを可能にするのに十分なプライマーが１つ以上のライブラリ／プールに含まれるまで続けられる。

【0412】

Ｙ．例示的なプライマーライブラリ
一態様において、本発明は、プライマー、例えば、本発明の方法のいずれかを用いて候補プライマーのライブラリから選択されるプライマーのライブラリを特徴とする。いくつかの実施形態において、ライブラリは、１つの反応体積において、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる標的遺伝子座を同時にハイブリダイズする（又は同時にハイブリダイズすることが可能である）か、又は同時に増幅する（又は同時に増幅することが可能である）プライマーを含む。様々な実施形態において、ライブラリは、１つの反応体積において、１００～５００、５００～１，０００、１，０００～２，０００、２，０００～５，０００、５，０００～７，５００、７，５００～１０，０００、１０，０００～２０，０００、２０，０００～２５，０００、２５，０００～３０，０００、３０，０００～４０，０００、４０，０００～５０，０００、５０，０００～７５，０００又は７５，０００～１００，０００個（境界値を含む）の異なる標的遺伝子座を同時に増幅する（又は同時に増幅することが可能な）プライマーを含む。様々な実施形態において、ライブラリは、１つの反応体積において、１，０００～１００，０００個の異なる標的遺伝子座、例えば、１，０００～５０，０００、１，０００～３０，０００、１，０００～２０，０００、１，０００～１０，０００、２，０００～３０，０００、２，０００～２０，０００、２，０００～１０，０００、５，０００～３０，０００、５，０００～２０，０００、又は５，０００～１０，０００個（境界値を含む）の異なる標的遺伝子座を同時に増幅する（又は同時に増幅することが可能な）プライマーを含む。いくつかの実施形態において、ライブラリは、増幅産物の６０、４０、３０、２０、１０、５、４、３、２、１、０．５、０．２５、０．１又は０．５％未満がプライマーダイマーであるように、１つの反応体積において標的遺伝子座を同時に増幅する（又は同時に増幅することが可能な）プライマーを含む。様々な実施形態は、プライマーダイマーである増幅産物の量は、０．５～６０％、例えば、０．１～４０％、０．１～２０％、０．２５～２０％、０．２５～１０％、０．５～２０％、０．５～１０％、１～２０％又は１～１０％（境界値を含む）である。いくつかの実施形態において、プライマーは、増幅産物の少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％が標的アンプリコンであるように、１つの反応体積において標的遺伝子座を同時に増幅する（又は同時に増幅することが可能である）。様々な実施形態において、標的アンプリコンである増幅される産物の量は、５０～９９．５％、例えば、６０～９９％、７０～９８％、８０～９８％、９０～９９．５％又は９５～９９．５％（境界値を含む）である。いくつかの実施形態において、プライマーは、標的遺伝子座の少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％が増幅される（例えば、増幅前の量と比較して少なくとも５、１０、２０、３０、５０又は１００倍に増幅される）ように、１つの反応体積において標的遺伝子座を同時に増幅する（又は同時に増幅することが可能である）。様々な実施形態において、増幅される標的遺伝子座の量（例えば、増幅前の量と比較して、少なくとも５、１０、２０、３０、５０又は１００倍に増幅される）は、５０～９９．５％、例えば、６０～９９％、７０～９８％、８０～９９％、９０～９９．５％、９５～９９．９％又は９８～９９．９９％（境界値を含む）である。いくつかの実施形態において、プライマーのライブラリは、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個のプライマー対を含み、プライマーの各対が、順方向の試験プライマー及び逆方向の試験プライマーを含み、試験プライマーの各対が、標的遺伝子座にハイブリダイズする。いくつかの実施形態において、プライマーのライブラリは、各々が異なる標的遺伝子座に結合する少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の個々のプライマーを含み、個々のプライマーは、プライマー対の一部ではない。

【0413】

様々な実施形態において、各プライマーの濃度は、１００、７５、５０、２５、２０、１０、５、２又は１ｎＭ未満であるか、又は５００、１００、１０又は１ｕＭ未満である。様々な実施形態において、各プライマーの濃度は、１ｕＭ～１００ｎＭ、例えば、１ｕＭ～１ｎＭ、１～７５ｎＭ、２～５０ｎＭ又は５～５０ｎＭ（境界値を含む）である。いくつかの実施形態において、プライマーのＧＣ含有量は、３０～８０％、例えば、４０～７０％又は５０～６０％（境界値を含む）である。いくつかの実施形態において、プライマーのＧＣ含有量の範囲は、３０、２０、１０又は５％未満である。いくつかの実施形態において、プライマーのＧＣ含有量の範囲は、５～３０％、例えば、５～２０％又は５～１０％（境界値を含む）である。いくつかの実施形態において、試験プライマーの融点（Ｔ_ｍ）は、４０～８０℃、例えば、５０～７０℃、５５～６５℃又は５７～６０．５℃（境界値を含む）である。いくつかの実施形態において、Ｔ_ｍは、Ｐｒｉｍｅｒ３プログラム（ｌｉｂｐｒｉｍｅｒ３リリース２．２．３）を用い、ビルトインのＳａｎｔａＬｕｃｉａパラメータ（ｐｒｉｍｅｒ３．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔでのワールドワイドウェブ）を用いて計算される。いくつかの実施形態において、プライマーの融点の範囲は、１５、１０、５、３又は１℃未満である。いくつかの実施形態において、プライマーの融点の範囲は、１～１５℃、例えば、１～１０℃、１～５℃又は１～３℃（境界値を含む）である。いくつかの実施形態において、プライマーの長さは、１５～１００ヌクレオチド、例えば、１５～７５ヌクレオチド、１５～４０ヌクレオチド、１７～３５ヌクレオチド、１８～３０ヌクレオチド又は２０～６５ヌクレオチド（境界値を含む）である。いくつかの実施形態において、プライマーの長さの範囲は、５０、４０、３０、２０、１０又は５ヌクレオチド未満である。いくつかの実施形態において、プライマーの長さの範囲は、５～５０ヌクレオチド、５～４０ヌクレオチド、５～２０ヌクレオチド又は５～１０ヌクレオチド（境界値を含む）である。いくつかの実施形態において、標的アンプリコンの長さは、５０～１００ヌクレオチド、例えば、６０～８０ヌクレオチド又は６０～７５ヌクレオチド（境界値を含む）である。いくつかの実施形態において、標的アンプリコンの長さの範囲は、５０、２５、１５、１０又は５ヌクレオチド未満である。いくつかの実施形態において、標的アンプリコンの長さの範囲は、５～５０ヌクレオチド、例えば、５～２５ヌクレオチド、５～１５ヌクレオチド又は５～１０ヌクレオチド（境界値を含む）である。いくつかの実施形態において、ライブラリは、マイクロアレイを含まない。いくつかの実施形態において、ライブラリは、マイクロアレイを含む。

【0414】

いくつかの実施形態において、アダプター又はプライマーのいくつか（例えば、少なくとも８０、９０又は９５％）又は全ては、天然に存在するホスホジエステル結合以外の隣接ヌクレオチド間の１つ以上の結合を含む。このような結合の例としては、ホスホラミド、ホスホロチオエート及びホスホロジチオエート結合が挙げられる。いくつかの実施形態において、アダプター又はプライマーのいくつか（例えば、少なくとも８０、９０又は９５％）又は全ては、最後の３’ヌクレオチドと２番目から最後の３’ヌクレオチドの間にチホホスフェート（例えば、モノチオホスフェート）を含む。いくつかの実施形態において、アダプター又はプライマーのいくつか（例えば、少なくとも８０、９０又は９５％）又は全ては、３’末端にある最後の２、３、４又は５ヌクレオチド間にチホホスフェート（例えば、モノチオホスフェート）を含む。いくつかの実施形態において、アダプター又はプライマーのいくつか（例えば、少なくとも８０、９０又は９５％）又は全ては、３’末端にある最後の１０ヌクレオチドのうち少なくとも１、２、３、４又は５ヌクレオチド間にチホホスフェート（例えば、モノチオホスフェート）を含む。いくつかの実施形態において、このようなプライマーは、開裂又は分解される可能性が低い。いくつかの実施形態において、プライマーは、酵素開裂部位（プロテアーゼ開裂部位など）を含有しない。

【0415】

更なる例示的なマルチプレックスＰＣＲ方法及びライブラリは、２０１２年１１月２１日に出願された米国出願第１３／６８３，６０４号（米国公開第２０１３／０１２３１２０号及び２０１４年５月１６日に出願された米国出願第６１／９９４，７９１号に記載され、その全体が参照により本明細書に組み込まれる）。これらの方法及びライブラリは、本明細書に開示されるサンプルのいずれかを分析し、本発明の方法のうちのいずれかに使用するために使用することができる。

【0416】

Ｚ．組換えの検出のための例示的なプライマーライブラリ
いくつかの実施形態において、プライマーライブラリ中のプライマーは、１つ以上の既知の組換えホットスポットで組換え（例えば、相同ヒト染色体間のクロスオーバー）が起こったか否かを決定するために設計される。染色体間でどのようなクロスオーバーが起こったかを知ることで、より正確なフェージング遺伝子データを個体について決定することができる。組換えホットスポットは、組換え事象が濃縮して起こる傾向がある染色体の局所的な領域である。組換えホットスポットは、組換えの平均頻度より低い「コールドスポット」領域が隣接していることが多い。組換えホットスポットは、類似の形態を共有する傾向があり、約１～２ｋｂ長である。ホットスポット分布は、ＧＣ含有量及び反復要素分布と正の相関にある。部分的に変性した１３マーモチーフＣＣＮＣＣＮＴＮＮＣＣＮＣは、いくつかのホットスポット活性において、ある役割を果たす。ＰＲＤＭ９と呼ばれるジンクフィンガータンパク質がこのモチーフに結合し、その位置で組換えを開始することが示されている。組換えホットスポットの中心間の平均距離は、約８０ｋｂであると報告されている。いくつかの実施形態において、組換えホットスポットの中心間の距離は、約３ｋｂ～約１００ｋｂの範囲である。公開データベースには、ＨＵＭＨＯＴ及びＩｎｔｅｒｎａｔｉｏｎａｌＨａｐＭａｐＰｒｏｊｅｃｔデータベースなどの多数の既知のヒト組換えホットスポットが含まれる（例えば、Ｎｉｓｈａｎｔｅｔａｌ．，“ＨＵＭＨＯＴ：ａｄａｔａｂａｓｅｏｆｈｕｍａｎｍｅｉｏｔｉｃｒｅｃｏｍｂｉｎａｔｉｏｎｈｏｔｓｐｏｔｓ，”ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓｅａｒｃｈ，３４：Ｄ２５－Ｄ２８，２００６，Ｄａｔａｂａｓｅｉｓｓｕｅ、Ｍａｃｋｉｅｗｉｃｚｅｔａｌ．，“ＤｉｓｔｒｉｂｕｔｉｏｎｏｆＲｅｃｏｍｂｉｎａｔｉｏｎＨｏｔｓｐｏｔｓｉｎｔｈｅＨｕｍａｎＧｅｎｏｍｅ－ＡＣｏｍｐａｒｉｓｏｎｏｆＣｏｍｐｕｔｅｒＳｉｍｕｌａｔｉｏｎｓｗｉｔｈＲｅａｌＤａｔａ”ＰＬｏＳＯＮＥ８（６）：ｅ６５２７２，ｄｏｉ：１０．１３７１／ｊｏｕｒｎａｌ．ｐｏｎｅ．００６５２７２、及びｈａｐｍａｐ．ｎｃｂｉ．ｎｌｍ．ｎｉｈ．ｇｏｖ／ｄｏｗｎｌｏａｄｓ／ｉｎｄｅｘ．ｈｔｍｌ．ｅｎでのワールドワイドウェブを参照、各々、その全体が参照により本明細書に組み込まれる）。

【0417】

いくつかの実施形態において、プライマーライブラリ内のプライマーは、組換えホットスポット（例えば、既知のヒト組換えホットスポット）でクラスター化される。いくつかの実施形態において、対応するアンプリコンを使用して、組換えホットスポット内又は付近の配列を決定し、その特定のホットスポットで組換えが起こったか否か（例えば、アンプリコンの配列が、組換えが起こった場合に予測される配列であるかどうか、又は組換えが起こらなかった場合に予測される配列であるかどうか）を決定する。いくつかの実施形態において、プライマーは、組換えホットスポットの一部又は全て（及び場合により、組換えホットスポットに隣接する配列）を増幅するように設計される。いくつかの実施形態において、長いリード配列決定（例えば、Ｉｌｌｕｍｉｎａによって開発された、約１０ｋｂまでの配列に対するＭｏｌｅｃｕｌｏＴｅｃｈｎｏｌｏｇｙを用いた配列決定）又はペアエンド配列決定を使用して、組換えホットスポットの一部又は全てを配列決定する。組換え事象が起こったか否かの知識を使用して、ハプロタイプブロックがホットスポットに隣接するかどうかを決定することができる。所望な場合、特定のハプロタイプブロックの存在は、ハプロタイプブロック内の領域に特異的なプライマーを用いて確認することができる。いくつかの実施形態において、既知の組換えホットスポット間にクロスオーバーが存在しないと仮定される。いくつかの実施形態において、プライマーライブラリ内のプライマーは、染色体の末端で、又は末端付近でクラスター化される。例えば、このようなプライマーを使用して、染色体の末端に特定のアーム又はセクションが存在するかどうかを決定することができる。いくつかの実施形態において、プライマーライブラリ内のプライマーは、組換えホットスポットで、又はその末端であり、かつ染色体の末端で、又は末端付近でクラスター化される。

【0418】

いくつかの実施形態において、プライマーライブラリは、組換えホットスポット（例えば、既知のヒト組換えホットスポット）に特異的であり、及び／又は組換えホットスポット付近の領域（例えば、組換えホットスポットの５’又は３’末端の１０、８、５、３、２、１又は０．５ｋｂ以内）に特異的な１つ以上のプライマー（例えば、少なくとも５、１０、５０、１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００又は５０，０００個の異なるプライマー又は異なるプライマー対）を含む。いくつかの実施形態において、少なくとも１、５、１０、２０、４０、６０、８０、１００又は１５０個の異なるプライマー（又はプライマー対）は、同じ組換えホットスポットに特異的であるか、又は同じ組換えホットスポット又は組換えホットスポット付近の領域に特異的である。いくつかの実施形態において、少なくとも１、５、１０、２０、４０、６０、８０、１００又は１５０個の異なるプライマー（又はプライマー対）は、組換えホットスポットの間の領域（例えば、組換えを受ける可能性が低い領域）に特異的であり、これらのプライマーを使用して、ハプロタイプブロックの存在を確認することができる（例えば、組換えが起こったか否かに依存して予測されるもの）。いくつかの実施形態において、プライマーライブラリ中の少なくとも１０、２０、３０、４０、５０、６０、７０、８０又は９０％は、組換えホットスポットに特異的であり、及び／又は組換えホットスポット付近の領域（例えば、組換えホットスポットの５’又は３’末端の１０、８、５、３、２、１又は０．５ｋｂ以内）に特異的である。いくつかの実施形態において、プライマーライブラリを使用して、組換えが、５、１０、５０、１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００又は５０，０００個の異なる組換えホットスポット（例えば、既知のヒト組換えホットスポット）より多く、又はこれに等しい場所で起こったか否かを決定する。いくつかの実施形態において、組換えホットスポット又は付近の領域に対するプライマーによって標的とされる領域は、ゲノムのその部分に沿ってほぼ均一に広がる。いくつかの実施形態において、少なくとも１、５、１０、２０、４０、６０、８０、１００又は１５０個の異なるプライマー（又はプライマー対）は、染色体の末端又は末端付近の領域（例えば、染色体の末端から２０、１０、５、１、０．５、０．１、０．０１又は０．００１ｍｂ以内の領域）に特異的である。いくつかの実施形態において、プライマーライブラリ中の少なくとも１０、２０、３０、４０、５０、６０、７０、８０又は９０％は、染色体又は染色体付近の領域（例えば、染色体の末端から２０、１０、５、１、０．５、０．１、０．０１又は０．００１ｍｂ以内の領域）に特異的である。いくつかの実施形態において、少なくとも１、５、１０、２０、４０、６０、８０、１００又は１５０個の異なるプライマー（又はプライマー対）は、染色体中の潜在的な微小欠失内の領域に特異的である。いくつかの実施形態において、プライマーライブラリ中の少なくとも１０、２０、３０、４０、５０、６０、７０、８０又は９０％は、染色体中の潜在的な微小欠失内の領域に特異的である。いくつかの実施形態において、プライマーライブラリ中の少なくとも１０、２０、３０、４０、５０、６０、７０、８０又は９０％は、組換えホットスポット、組換えホットスポット付近の領域、染色体の末端又は末端付近の領域、又は染色体中の潜在的な微小欠失内の領域に特異的である。

【0419】

ＡＡ．例示的なマルチプレックスＰＣＲ方法
一態様において、本発明は、核酸サンプルにおいて標的遺伝子座を増幅する方法であって、（ｉ）核酸サンプルと、少なくとも１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる標的遺伝子座に対して同時にハイブリダイゼーションするプライマーのライブラリとを接触させ、反応混合物を精製することと、（ｉｉ）この反応混合物をプライマー伸長反応条件（例えば、ＰＣＲ条件）に供して、標的アンプリコンを含む増幅産物を生成することとを伴う、方法を特徴とする。いくつかの実施形態において、本方法は、少なくとも１つの標的アンプリコン（例えば、標的アンプリコンの少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％）の有無を決定することも含む。いくつかの実施形態において、本方法は、少なくとも１つの標的アンプリコン（例えば、標的アンプリコンの少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％）の配列を決定することも含む。いくつかの実施形態において、標的遺伝子座の少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９又は９９．５％が増幅される。いくつかの実施形態において、少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる標的遺伝子座は、少なくとも５、１０、２０、４０、５０、６０、８０、１００、１２０、１５０、２００、３００又は４００倍に増幅される。いくつかの実施形態において、標的遺伝子座の少なくとも５０、６０、７０、８０、９０、９５、９６、９７、９８、９９、９９．５又は１００％は、少なくとも５、１０、２０、４０、５０、６０、８０、１００、１２０、１５０、２００、３００又は４００倍に増幅される。様々な実施形態において、増幅産物の６０、５０、４０、３０、２０、１０、５、４、３、２、１、０．５、０．２５、０．１又は０．０５％未満が、プライマーダイマーである。いくつかの実施形態において、本方法は、マルチプレックスＰＣＲ及び配列決定（例えば、高スループット配列決定）を伴う。

【0420】

様々な実施形態において、長いアニーリング時間及び／又は低いプライマー濃度を使用する。様々な実施形態において、アニーリング工程の長さは、３、５、８、１０、１５、２０、３０、４５、６０、７５、９０、１２０、１５０又は１８０分間より長い。様々な実施形態において、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、５～１８０分間、例えば、５～６０、１０～６０、５～３０又は１０～３０分間（境界値を含む）である。様々な実施形態において、アニーリング工程の長さは、５分間より長く（例えば、１０分間又は１５分間より長く）、各プライマーの濃度は、２０ｎＭ未満である。様々な実施形態において、アニーリング工程の長さは、５分間より長く（例えば、１０分間又は１５分間より長く）、各プライマーの濃度は、１～２０ｎＭ又は１～１０ｎＭ（境界値を含む）である。様々な実施形態において、アニーリング工程の長さは、２０分間より長く（例えば、３０、４５、６０又は９０分間より長く）、各プライマーの濃度は、１ｎＭ未満である。

【0421】

高レベルの多重化では、溶液中の多量のプライマーに起因して、溶液が粘性になる場合がある。溶液が粘性すぎる場合、プライマー濃度を、プライマーがテンプレートＤＮＡに結合するのに依然として十分な量まで下げてもよい。様々な実施形態において、６０，０００種類の異なるプライマーが使用され、各プライマーの濃度は、２０ｎＭ未満、例えば１０ｎＭ未満又は１～１０ｎＭ（境界値を含む）である。様々な実施形態において、６０，０００個を超える異なるプライマー（例えば、６０，０００～１２０，０００個の異なるプライマー）が使用され、各プライマーの濃度は、１０ｎＭ未満、例えば５ｎＭ未満又は１～１０ｎＭ（境界値を含む）である。

【0422】

アニーリング温度は、場合により、プライマーの一部又は全ての融点より高くてもよいことを発見した（プライマーの融点より低いアニーリング温度を使用する他の方法とは対照的に）。融点（Ｔ_ｍ）は、オリゴヌクレオチド（例えばプライマー）及びその完全相補体のＤＮＡ二本鎖の半分（５０％）が解離し、一本鎖ＤＮＡになる温度である。アニーリング温度（Ｔ_Ａ）は、ＰＣＲプロトコルを実行する温度である。従来の方法について、この温度は、通常は、使用するプライマーの最も低いＴ_ｍより５℃低いため、全ての可能な二本鎖に近いものが形成される（その結果、実質的に全てのプライマー分子が、テンプレート核酸に結合する）。これは、高効率ではあるが、より低い温度では、より多くの非特異的反応が生じることが確実である。Ｔ_Ａが低すぎることの結果の１つは、内部の単一塩基ミスマッチ又は部分的アニーリングが許容され得るため、プライマーが真の標的以外の配列にアニーリングし得ることである。本発明のいくつかの実施形態において、Ｔ_ＡはＴ_ｍより高く、所与の瞬間に、標的のわずかな部分のみが、アニーリングされたプライマーを有する（例えば、約１～５％のみ）。これらが伸長されると、プライマー及び標的のアニーリング及び解離の平衡から除去され（伸長は、Ｔ_ｍを７０℃より上まで迅速に増加させるため）、標的の新しい約１～５％がプライマーを有する。したがって、アニーリングのために反応を長時間行うことによって、サイクルごとにコピーされる標的の約１００％を得ることができる。したがって、最も安定な分子対（プライマーとテンプレートＤＮＡとの間の完全なＤＮＡ対形成）は、優先的に伸長され、正しい標的アンプリコンを生成する。例えば、融点が６３℃より低いプライマーを用い、アニーリング温度を５７℃として、又はアニーリング温度を６３℃として同じ実験を行った。アニーリング温度が５７℃の場合、増幅したＰＣＲ産物についてのマッピングされたリードの割合は、５０％程度の低さであった（増幅産物の約５０％がプライマーダイマーである）。アニーリング温度が６３℃であった場合、プライマーダイマーであった増幅産物の割合は、約２％まで減少した。

【0423】

様々な実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、又は全ての融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３又は１５℃高い。いくつかの実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００又は全ての融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３又は１５℃高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、１、３、５、８、１０、１５、２０、３０、４５、６０、７５、９０、１２０、１５０又は１８０分間より長い。

【0424】

様々な実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、又は全ての融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、５～１０、５～８、８～１０、１０～１２又は１２～１５℃（境界値を含む））高い。様々な実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、又は全ての融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、５～１０、５～８、８～１０、１０～１２又は１２～１５℃（境界値を含む））高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、５～１８０分間、例えば、５～６０、１０～６０、５～３０又は１０～３０分間（境界値を含む）である。

【0425】

いくつかの実施形態において、アニーリング温度は、プライマーの最も高い融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３又は１５℃高い。いくつかの実施形態において、アニーリング温度は、プライマーの最も高い融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３又は１５℃高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、１、３、５、８、１０、１５、２０、３０、４５、６０、７５、９０、１２０、１５０又は１８０分間より長い。

【0426】

いくつかの実施形態において、アニーリング温度は、プライマーの最も高い融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、５～１０、５～８、８～１０、１０～１２又は１２～１５℃（境界値を含む））高い。いくつかの実施形態において、アニーリング温度は、プライマーの最も高い融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、５～１０、５～８、８～１０、１０～１２又は１２～１５℃）高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、５～１８０分間、例えば、５～６０、１０～６０、５～３０又は１０～３０分間（境界値を含む）である。

【0427】

いくつかの実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、又は全ての平均融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３又は１５℃高い。いくつかの実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００又は全ての平均融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも少なくとも１、２、３、４、５、６、７、８、９、１０、１１、１２、１３又は１５℃高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、１、３、５、８、１０、１５、２０、３０、４５、６０、７５、９０、１２０、１５０又は１８０分間より長い。

【0428】

いくつかの実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、又は全ての平均融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、５～１０、５～８、８～１０、１０～１２又は１２～１５℃（境界値を含む））高い。いくつかの実施形態において、アニーリング温度は、非同一プライマーの少なくとも２５、５０、７５、１００、３００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、１５，０００、１９，０００、２０，０００、２５，０００、２７，０００、２８，０００、３０，０００、４０，０００、５０，０００、７５，０００、１００，０００、又は全ての平均融点（例えば、経験的に測定されたか、又は計算されたＴ_ｍ）よりも１～１５℃（例えば、１～１０、１～５、１～３、３～５、５～１０、５～８、８～１０、１０～１２又は１２～１５℃（境界値を含む））高く、アニーリング工程の長さ（ＰＣＲサイクル当たり）は、５～１８０分間、例えば、５～６０、１０～６０、５～３０又は１０～３０分間（境界値を含む）である。

【0429】

いくつかの実施形態において、アニーリング温度は、５０～７０℃、例えば、５５～６０、６０～６５又は６５～７０℃（境界値を含む）である。いくつかの実施形態において、アニーリング温度は、５０～７０℃、例えば、５５～６０、６０～６５又は６５～７０℃（境界値を含む）であり、（ｉ）アニーリング工程の長さ（ＰＣＲサイクル当たり）は、３、５、８、１０、１５、２０、３０、４５、６０、７５、９０、１２０、１５０又は１８０分間より長いか、又は（ｉｉ）アニーリング工程の長さ（ＰＣＲサイクル当たり）は、５～１８０分間、例えば、５～６０、１０～６０、５～３０又は１０～３０分間（境界値を含む）である。

【0430】

いくつかの実施形態において、以下の条件のうちの１つ以上は、Ｔ_ｍの経験的な測定に使用されるか、又はＴ_ｍの計算のために仮定される。温度６０．０℃、プライマー濃度１００ｎＭ及び／又は塩濃度１００ｍＭ。いくつかの実施形態において、他の条件、例えば、ライブラリを用いるマルチプレックスＰＣＲに使用される条件が使用される。いくつかの実施形態において、１００ｍＭのＫＣｌ、５０ｍＭの（ＮＨ_４）_２ＳＯ_４、３ｍＭのＭｇＣｌ_２、７．５ｎＭの各プライマー及び５０ｍＭのｐＨ８．１のＴＭＡＣが使用される。いくつかの実施形態において、Ｔ_ｍは、Ｐｒｉｍｅｒ３プログラム（ｌｉｂｐｒｉｍｅｒ３リリース２．２．３）を用い、ビルトインのＳａｎｔａＬｕｃｉａパラメータ（ｐｒｉｍｅｒ３．ｓｏｕｒｃｅｆｏｒｇｅ．ｎｅｔでのワールドワイドウェブ、その全体が参照により本明細書に組み込まれる）を用いて計算される。いくつかの実施形態において、プライマーの融点の計算値は、プライマー分子の半分がアニーリングすると予測される温度である。上述のように、融点の計算値より高い温度であっても、ある割合のプライマーがアニーリングされるため、ＰＣＲ伸長は可能である。いくつかの実施形態において、経験的に測定されたＴ_ｍ（実際のＴ_ｍ）は、ＵＶ分光光度計において、温度調節されたセルを使用することによって決定される。いくつかの実施形態において、温度は、吸収率に対してプロットされ、２つの平坦部を有するＳ字形曲線を生成する。この平坦部の間の途中の吸光度の読みは、Ｔ_ｍに対応する。

【0431】

いくつかの実施形態において、２６０ｎｍでの吸光度は、ｕｌｔｒｏｓｐｅｃ２１００ｐｒＵＶ／可視光分光光度計（Ａｍｅｒｓｈａｍｂｉｏｓｃｉｅｎｃｅｓ）で、温度の関数として測定される（例えば、その全体が参照により本明細書に組み込まれるＴａｋｉｙａｅｔａｌ．，“Ａｎｅｍｐｉｒｉｃａｌａｐｐｒｏａｃｈｆｏｒｔｈｅｒｍａｌｓｔａｂｉｌｉｔｙ（Ｔｍ）ｐｒｅｄｉｃｔｉｏｎｏｆＰＮＡ／ＤＮＡｄｕｐｌｅｘｅｓ，”ＮｕｃｌｅｉｃＡｃｉｄｓＳｙｍｐＳｅｒ（Ｏｘｆ）；（４８）：１３１－２，２００４を参照）。いくつかの実施形態において、２６０ｎｍでの吸光度は、１分間に２℃ずつ、９５℃から２０℃まで温度を下げることによって測定される。いくつかの実施形態において、プライマー及びその完全な相補体（例えば、２ｕＭの各対を形成するオリゴマー）を混合し、次いで、アニーリングは、サンプルを９５℃まで加熱し、それを５分間維持し、その後、３０分間で室温まで冷却し、サンプルを９５℃で少なくとも６０分間維持することによって行われる。いくつかの実施形態において、融点は、ＳＷＩＦＴＴｍソフトウェアを用いてデータを分析することによって決定される。本発明の方法のいずれかのいくつかの実施形態において、本方法は、プライマーを標的遺伝子座のＰＣＲ増幅に使用する前又は後に、ライブラリ中のプライマーの少なくとも５０、８０、９０、９２、９４、９６、９８、９９又は１００％について、融点を経験的に測定又は計算すること（例えば、コンピュータを用いて計算すること）を含む。

【0432】

いくつかの実施形態において、ライブラリは、マイクロアレイを含む。いくつかの実施形態において、ライブラリは、マイクロアレイを含まない。

【0433】

いくつかの実施形態において、プライマーの大部分又は全てが伸長され、増幅産物を形成する。ＰＣＲ反応で消費される全てのプライマーを含むことで、同じ又は同様の数のプライマー分子が、各標的遺伝子座についての標的アンプリコンに変換されるため、異なる標的遺伝子座の増幅の均一性を高める。いくつかの実施形態において、プライマー分子の少なくとも８０、９０、９２、９４、９６、９８、９９又は１００％が伸長され、増幅産物を形成する。いくつかの実施形態において、標的遺伝子の少なくとも８０、９０、９２、９４、９６、９８、９９又は１００％について、その標的遺伝子に対するプライマー分子の少なくとも８０、９０、９２、９４、９６、９８、９９又は１００％が伸長され、増幅産物を形成する。いくつかの実施形態において、この割合のプライマーが消費されるまで、複数のサイクルが行われる。いくつかの実施形態において、全て又は実質的に全てのプライマーが消費されるまで、複数のサイクルが行われる。所望な場合、初期のプライマー濃度を下げ、及び／又は行われるＰＣＲサイクルの数を増やすことによって、更に高い割合のプライマーを消費することができる。

【0434】

いくつかの実施形態において、ＰＣＲ方法は、マイクロリットル反応体積を用いて行われてもよく、マイクロ流体用途で使用されるナノリットル又はピコリットルの反応体積と比較して、特異的なＰＣＲ増幅を達成することがより困難な場合がある（より低い局所濃度のテンプレート核酸に起因する）。いくつかの実施形態において、反応体積は、１～６０ｕＬ、例えば、５～５０ｕＬ、１０～５０ｕＬ、１０～２０ｕＬ、２０～３０ｕＬ、３０～４０ｕＬ又は４０～５０ｕＬ（境界値を含む）である。

【0435】

一実施形態において、本明細書に開示される方法は、高効率な高度に多重化された標的化ＰＣＲを使用してＤＮＡを増幅し、その後、高スループット配列決定によって、各標的遺伝子座での対立遺伝子頻度を決定する。得られた配列リードのほとんどが標的遺伝子座に対してマッピングするような方法で１つの反応体積中に約５０個又は１００個より多いＰＣＲプライマーを多重化する能力は、新規であり、非自明である。高度に多重化された標的化ＰＣＲを高効率な方法で行うことを可能にする１つの技術は、互いにハイブリダイズする可能性が低いプライマーを設計することを伴う。ＰＣＲプローブは、典型的にはプライマーと呼ばれ、少なくとも３００、少なくとも５００、少なくとも７５０、少なくとも１，０００、少なくとも２，０００、少なくとも５，０００、少なくとも７，５００、少なくとも１０，０００、少なくとも２０，０００、少なくとも２５，０００、少なくとも３０，０００、少なくとも４０，０００、少なくとも５０，０００、少なくとも７５，０００又は少なくとも１００，０００個の潜在的なプライマー対との間の潜在的に有害な相互作用又はプライマーとサンプルＤＮＡとの間の意図していない相互作用の熱力学的モデルを作成し、次いで、このモデルを用いて、プール中の他の設計と不適合な設計を除外することによって選択される。高度に多重化された標的化ＰＣＲを高効率な方法で行うことを可能にする別の技術は、標的化ＰＣＲに対して、部分的又は完全なネスティング手法を用いることである。これらの手法の１つ又は組み合わせを用いることで、単一のプールにおいて、少なくとも３００、少なくとも８００、少なくとも１，２００、少なくとも４，０００又は少なくとも１０，０００個のプライマーの多重化が可能になり、得られた大部分のＤＮＡを含む増幅ＤＮＡは、配列決定されると、標的遺伝子座にマッピングする。これらの手法の１つ又は組み合わせを用いることで、単一のプールにおいて多数のプライマーの多重化が可能になり、得られたＤＮＡは、標的遺伝子座にマッピングする５０％より多く、６０％より多く、６７％より多く、８０％より多く、９０％より多く、９５％より多く、９６％より多く、９７％より多く、９８％より多く、９９％より多く、又は９９．５％より多いＤＮＡ分子を含む。

【0436】

いくつかの実施形態において、標的遺伝物質の検出は、多重化された方法で行われてもよい。並行して行われ得る遺伝子標的配列の数は、１～１０、１０～１００、１００～１０００、１０００～１万、１万～１０万、１０万～１００万又は１００万～１０００万の範囲であってもよい。１プール当たり１００個を超えるプライマーを多重化する従来の試みは、プライマーダイマー形成などの望ましくない副反応を伴う顕著な問題を生じていた。

【0437】

ＢＢ．標的化ＰＣＲ
いくつかの実施形態において、ＰＣＲを使用して、ゲノムの特定の位置を標的とすることができる。血漿サンプルにおいて、元々のＤＮＡは、高度にフラグメント化される（典型的には５００ｂｐ未満、平均長さは２００ｂｐ未満）。ＰＣＲでは、順方向及び逆方向のプライマーの両方が同じフラグメントにアニーリングし、増幅が可能である。したがって、フラグメントが短い場合、ＰＣＲアッセイは、同様に相対的に短い領域を増幅しなければならない。ＭＩＰＳと同様に、多型位置がポリメラーゼ結合部位に近すぎる場合、異なる対立遺伝子からの増幅におけるバイアスが生じる場合がある。現在、多型領域（ＳＮＰを含有するものなど）を標的とするＰＣＲプライマーは、典型的には、プライマーの３’末端が、１つ又は複数の多型塩基のすぐ横に隣接する塩基にハイブリダイズするように設計される。本開示の一実施形態において、順方向及び逆方向のＰＣＲプライマー両方の３’末端は、標的対立遺伝子のバリアント位置（多型部位）から離れた１つ又はいくつかの位置である塩基にハイブリダイズするように設計される。多型部位（ＳＮＰ又はその他）と、プライマーの３’末端にハイブリダイズするように設計された塩基との間の塩基数は、１塩基であってもよく、２塩基であってもよく、３塩基であってもよく、４塩基であってもよく、５塩基であってもよく、６塩基であってもよく、７～１０塩基であってもよく、１１～１５塩基であってもよく、又は１６～２０塩基であってもよい。順方向及び逆方向のプライマーは、多型部位から離れた異なる数の塩基をハイブリダイズするように設計されてもよい。

【0438】

ＰＣＲアッセイは大量に作成することができるが、異なるＰＣＲアッセイ間の相互作用により、約１００アッセイを超えて多重化することが困難である。様々な複雑な分子手法を使用して、多重化のレベルを上げることができるが、依然として、反応当たり１００、おそらく２００、又はおそらく５００より少ないアッセイに限定されるだろう。大量のＤＮＡを含むサンプルは、複数のサブ反応に分けられ、次いで、配列決定前に再び組み合わせることができる。ＤＮＡの全体サンプル又はいくつかの部分集合のいずれかが限定されるサンプルについて、サンプルを分けると、統計的ノイズが入り込むだろう。一実施形態において、少量又は限定された量のＤＮＡとは、１０ｐｇ未満、１０～１００ｐｇ、１００ｐｇ～１ｎｇ、１～１０ｎｇ又は１０～１００ｎｇの量を指していてもよい。なお、この方法は、複数のプールに分けることを伴う他の方法によって、入り込んでしまう統計的ノイズに関連する顕著な問題が生じ得る少量のＤＮＡに特に有用であるが、この方法は、任意の量のＤＮＡのサンプルで実行する場合にバイアスを最小限にするという利点を依然として提供する。これらの状況では、全体的なサンプル量を増やすために、普遍的な前増幅工程を使用してもよい。理想的には、この前増幅工程は、対立遺伝子分布を著しく変化させないものであるべきである。

【0439】

一実施形態において、本開示の方法は、例えば、単一細胞又は体液からのＤＮＡなどの限定されたサンプルからの配列決定又はいくつかの他の遺伝子決定方法による遺伝子型決定のために、多数の標的遺伝子座、具体的には、１，０００～５，０００個の遺伝子座、５，０００～１０，０００個の遺伝子座又は１０，０００個より多い遺伝子座に特異的なＰＣＲ産物を作成することができる。現在、５～１０個より多い標的のマルチプレックスＰＣＲ反応を行うことには、大きな課題があり、プライマー副産物（例えばプライマーダイマー）及び他のアーチファクトによって妨害されることが多い。ハイブリダイゼーションプローブを用いるマイクロアレイを用いて標的配列を検出する場合、プライマーダイマー及び他のアーチファクトは、これらが検出されないため、無視される場合がある。しかし、検出方法として配列決定を用いる場合、配列決定リードの大部分は、このようなアーチファクトを配列決定し、サンプル中の所望な標的配列を配列決定しないだろう。１つの反応体積中、５０又は１００を超える反応を多重化し、その後に配列決定するために使用される従来技術で記載される方法は、典型的には、２０％を超える、多くは５０％を超える、多くの場合には８０％を超える、ある場合には９０％を超える標的ではない配列リードが得られる。

【0440】

一般に、サンプルの複数の（ｎ）個の（５０より多い、１００より多い、５００より多い、又は１，０００より多い）標的の標的化配列決定を行うために、サンプルを、１つの個々の標的を増幅するいくつかの数の並行反応に分けることができる。このことは、ＰＣＲマルチウェルプレートで行うことができ、又は市販のプラットフォーム、例えば、ＦＬＵＩＤＩＧＭＡＣＣＥＳＳＡＲＲＡＹ（微小流体チップ中、サンプル当たり４８の反応）又はＲＡＩＮＤＡＮＣＥＴＥＣＨＮＯＬＯＧＹ製のＤＲＯＰＬＥＴＰＣＲ（１００～数千の標的）で行うことができる。残念ながら、これらの分けてプールする方法は、限定された量のＤＮＡを含むサンプルでは、各ウェル中にゲノムの各領域の１つのコピーが存在することを確実にするための、ゲノムの十分なコピーが存在しないことが多いため、問題がある。これは、多型遺伝子座が標的とされ、多型遺伝子座での対立遺伝子の相対的な割合が必要である場合には、分けてプールすることによって入り込む統計的ノイズが、ＤＮＡの元々のサンプル中に存在した対立遺伝子の割合の測定を非常に不正確なものにしてしまうため、特に深刻な問題である。限定された量のＤＮＡしか利用可能ではない場合に適用可能な、多くのＰＣＲ反応を効果的かつ効率的に増幅する方法が本明細書に記載される。一実施形態において、本方法は、単一細胞、体液、ＤＮＡの混合物（例えば、血漿中に見出される遊離浮遊ＤＮＡ）、生検、環境及び／又は法医学サンプルの分析に適用可能であろう。

【0441】

一実施形態において、標的化配列決定は、以下の工程のうちの１つ、複数又は全てを伴っていてもよい。ａ）ＤＮＡフラグメントの両端にアダプター配列を有するライブラリを作成し、増幅する。ｂ）ライブラリ増幅後に、複数の反応に分ける。ｃ）ＤＮＡフラグメントの両端のアダプター配列を用いてライブラリを作成し、場合により増幅する。ｄ）標的当たり１つの標的特異性の「順方向」プライマー及び１つのタグ特異性プライマーを用い、選択した標的の１０００～１０，０００倍の増幅を行う。ｅ）この産物から、「逆方向の」標的特異性プライマー及び１つ（又はもっと多い）第１ラウンドで標的特異性の順方向プライマーの一部として導入されたユニバーサルタグに特異性のプライマーを用い、第２の増幅を行う。ｆ）限定された数のサイクルのために、選択した標的の１０００倍の前増幅を行う。ｇ）この産物を複数のアリコートに分け、個々の反応において標的のサブプールを増幅する（例えば、５０～５００倍、これにより、１倍になるまで全ての方法を使用することができる。ｈ）並行サブプール反応の産物をプールする。ｉ）これらの増幅中に、プライマーは、産物を配列決定することができるように、配列決定に適合するタグ（部分又は全長）を有していてもよい。

【0442】

高度に多重化したＰＣＲ
血漿から得られるゲノムＤＮＡなどの核酸サンプルから、数百から数千の標的配列（例えば、ＳＮＰ遺伝子座）にわたる標的化された増幅を可能にする方法が、本明細書で開示される。増幅されるサンプルは、プライマーダイマー産物を比較的含まず、低い標的遺伝子座での対立遺伝子バイアスを有していてもよい。増幅中又は増幅後に、産物に、配列決定に適合するアダプターが付加される場合、これらの産物の分析は、配列決定によって行うことができる。

【0443】

当該技術分野で既知の方法を用いて高度に多重化されたＰＣＲ増幅を行うと、望ましい増幅産物より過剰な、配列決定には好適でないプライマーダイマー産物が生成する。これらは、これらの産物を形成するプライマーを除外することによって、又はプライマーのｉｎｓｉｌｉｃｏでの選択を行うことによって、経験的に減らすことができる。しかし、アッセイの数が多ければ多いほど、この問題は困難になる。

【0444】

１つの解決策は、５０００倍の反応を、いくつかのこれより少ない倍数の増幅（例えば、１００個の５０倍の反応又は５０個の１００倍の反応）に分けること、又は微小流体を用いること、又は更にサンプルを個々のＰＣＲ反応に分けることである。しかし、妊婦血漿由来の非侵襲的な産前診断など、サンプルＤＮＡが限定されている場合、サンプルを複数の反応に分けることは妨げとなるため、避けるべきである。

【0445】

まず、サンプルの血漿ＤＮＡを全体的に増幅し、次いで、サンプルを、反応当たり更に適度な数の標的配列を含む複数の多重化された標的濃縮反応に分けるための方法が本明細書に記載される。一実施形態において、本開示の方法は、複数の遺伝子座でＤＮＡ混合物を優先的に濃縮するために使用することができ、本方法は、ライブラリ中の分子がＤＮＡフラグメントの両端にライゲーションされたアダプター配列を有するようなＤＮＡの混合物からライブラリを作成し、増幅する工程、増幅したライブラリを複数の反応に分割する工程、１つの標的特異性「順方向」プライマーと１つ又は複数のアダプター特異性ユニバーサル「逆方向」プライマーを用い、選択された標的の第１ラウンドのマルチプレックス増幅を行う工程のうちの１つ以上を含む。一実施形態において、本開示の方法は、更に、「逆方向」標的特異性プライマーと、第１ラウンドで標的特異性順方向プライマーの一部として導入されたユニバーサルタグに特異的な１個又は複数のプライマーとを用い、第２の増幅を行うことを含む。一実施形態において、本方法は、完全ネスティッド、ヘミネスティッド、セミネスティッド、片側完全ネスティッド、片側ヘミネスティッド又は片側セミネスティッドＰＣＲ手法を伴っていてもよい。一実施形態において、本開示の方法は、複数の遺伝子座でＤＮＡ混合物を優先的に濃縮するために使用され、本方法は、制限された回数のサイクルについて、選択した標的のマルチプレックス前増幅を行うことと、この産物を複数のアリコートに分割することと、標的のサブプールを個々の反応で増幅することと、並行サブプール反応の産物をプールすることと、を含む。なお、この手法を使用して、５０～５００遺伝子座について、５００～５，０００遺伝子座について、５，０００～５０，０００遺伝子座について、又は更に５０，０００～５００，０００遺伝子座について、低レベルの対立遺伝子バイアスを生じる方法で、標的化された増幅を行うことができる。一実施形態において、プライマーは、部分又は全長の配列決定に適合するタグを有する。

【0446】

ワークフローは、（１）ＤＮＡ、例えば、血漿ＤＮＡを抽出すること、（２）フラグメントの両端にあるユニバーサルアダプターを用い、フラグメントライブラリを調製すること、（３）アダプターに特異的なユニバーサルプライマーを用い、ライブラリを増幅すること、（４）増幅したサンプル「ライブラリ」を複数のアリコートに分割すること、（５）アリコートについて、マルチプレックス（例えば、標的当たり１つの標的特異性プライマーとタグ特異性プライマーを用いた約１００反応分、１，０００又は１０，０００反応分）増幅を行うこと、（６）１つのサンプルのアリコートをプールすること、（７）サンプルをバーコード化すること、（８）サンプルを混合し、濃度を調整すること、（９）サンプルを配列決定すること、を含んでいてもよい。本ワークフローは、列挙された工程のうちの１つを含有する複数のサブ工程を含んでいてもよい（例えば、ライブラリを調製する工程である工程（２）は、３つの酵素工程（平滑末端化、ｄＡテーリング及びアダプターライゲーション）と３つの精製工程を伴っていてもよい）。ワークフローの工程は、組み合わせ、分割され、又は異なる順序で行われてもよい（例えば、バーコード化とサンプルのプール）。

【0447】

ライブラリの増幅は、短いフラグメントをより効率的に増幅するように偏重される方法で行われてもよい。この方法で、妊婦の循環中で見出される無細胞胎児ＤＮＡ（胎盤由来）として、より短い配列、例えば、モノヌクレオソームＤＮＡフラグメントを優先的に増幅することができる。なお、ＰＣＲアッセイは、タグ、例えば、配列決定タグ（通常、１５～２５塩基の切断された形態）を有していてもよい。多重化の後、サンプルのＰＣＲ多重化物をプールし、次いで、タグを、タグ特異性ＰＣＲ（ライゲーションによっても行うことが可能）によって完結させる（バーコード化を含む）。また、全配列決定タグは、多重化と同じ反応に加えられてもよい。第１のサイクルにおいて、標的は、標的特異性プライマーを用いて増幅されてもよく、その後、タグ特異性プライマーは、ＳＱアダプター配列を完成させるために引き継がれてもよい。ＰＣＲプライマーは、タグを有していなくてもよい。配列決定タグは、ライゲーションによって増幅産物に付けられてもよい。

【0448】

一実施形態において、高度なマルチプレックスＰＣＲの後、クローン配列決定による増幅物質の評価は、胎児異数性の検出などの様々な用途に使用されてもよい。従来のマルチプレックスＰＣＲは、５０個までの遺伝子座を同時に評価するのに対し、本明細書に記載される手法を使用して、５０個を超える遺伝子座を同時に、１００個を超える遺伝子座を同時に、５００個を超える遺伝子座を同時に、１，０００個を超える遺伝子座を同時に、５，０００個を超える遺伝子座を同時に、１０，０００個を超える遺伝子座を同時に、５０，０００個を超える遺伝子座を同時に、１００，０００個を超える遺伝子座を同時に、同時評価をすることが可能である。実験は、単一反応において、非侵襲性の産前異数性診断及び／又は高精度のコピー数コールを行うのに十分に良好な効率及び特異性を有しつつ、１０，０００個まで、１０，０００個を含む、１０，０００個を超える別個の遺伝子座を同時に評価することができることが示される。アッセイは、サンプルの全体、例えば、血漿から単離されたｃｆＤＮＡサンプル、その画分、又はｃｆＤＮＡサンプルの更に処理された誘導体を用い、単一反応で組み合わせられてもよい。サンプル（例えば、ｃｆＤＮＡ又は誘導体）はまた、複数の並列な多重化反応に分割されてもよい。最適なサンプル分割及び多重化は、様々な性能仕様の妥協点を探ることによって決定される。材料の量が限られているため、サンプルを複数の画分に分割すると、サンプリングノイズ、取り扱い時間が導入され、エラーの可能性が高まる場合がある。逆に、更に高度な多重化によって、より多くの誤った増幅が起こり、増幅においてより大きな不平等が生じる場合があり、この両者が試験性能を下げる可能性がある。

【0449】

本明細書に記載される方法の適用における２つの重要な関連する考慮事項は、元々のサンプル（例えば、血漿）の量が限られていることと、対立遺伝子頻度又は他の測定値を得るこの材料における元々の分子の数である。元々の分子の数が、特定の値を下回る場合、ランダムサンプリングノイズが顕著になり、試験の制度に影響を及ぼす場合がある。典型的には、標的遺伝子座当たり５００～１０００個の元々の分子に相当するものを含むサンプルに対して測定が行われる場合、非侵襲性の産前異数性診断を行うのに十分な量のデータを得ることができる。別個の測定の数を増やすいくつかの方法が存在する（例えば、サンプルの体積を増やす）。サンプルに適用される各操作も、潜在的に材料の消失を引き起こす可能性がある。様々な操作によって個こる消失を特徴付け、これを避けること、又は必要な場合、試験の性能を低下させ得る消失を避けるために特定の操作の収率を改善することが不可欠である。

【0450】

一実施形態において、元々のサンプル（例えば、ｃｆＤＮＡサンプル）の全て又は画分を増幅することによって、その後の工程での潜在的な消失を軽減することが可能である。サンプル中の遺伝物質の全てを増幅するための様々な方法が利用可能であり、下流の手順に利用可能な量を増やす。一実施形態において、ライゲーション媒介ＰＣＲ（ＬＭ－ＰＣＲ）のＤＮＡフラグメントは、１つの別個のアダプター、２つの別個のアダプター、又は多くの別個のアダプターのいずれかのライゲーションの後、ＰＣＲによって増幅される。一実施形態において、多重置換増幅（ＭＤＡ）のｐｈｉ－２９ポリメラーゼを使用して、全てのＤＮＡを等温増幅する。ＤＯＰ－ＰＣＲ及び変形例において、ランダムプライミングを使用して、元々の物質のＤＮＡを増幅する。各方法は、ゲノムの全ての表される領域にわたる増幅の均一性、元々のＤＮＡの捕捉及び増幅の効率及びフラグメントの長さの関数としての増幅性能など、特定の特徴を有する。

【0451】

一実施形態において、ＬＭ－ＰＣＲを、３’チロシンを有する単一のヘテロ二本鎖アダプターとともに使用してもよい。ヘテロ二本鎖アダプターは、第１ラウンドのＰＣＲ中に元々のＤＮＡフラグメントの５’及び３’末端で２つの別個の配列に変換され得る単一アダプター分子の使用を可能にする。一実施形態において、増幅されるライブラリを、サイズ分離によって、又はＡＭＰＵＲＥ、ＴＡＳＳなどの製品又は他の同様の方法を用いることによって、分画することが可能である。ライゲーションの前に、サンプルＤＮＡは、平滑末端化されてもよく、次いで、単一のアデノシン塩基を３’末端に付加する。ライゲーションの前に、ＤＮＡは、制限酵素又はいくつかの他の開裂方法を用いて開裂されてもよい。ライゲーション中に、サンプルフラグメントの３’アデノシンと、アダプターの相補性３’チロシンオーバーハングが、ライゲーション効率を高めることができる。ＰＣＲ増幅の伸長工程は、約２００ｂｐ、約３００ｂｐ、約４００ｂｐ、約５００ｂｐ又は約１，０００ｂｐより長いフラグメントからの増幅を減らすために、時間的観点から制限されてもよい。市販のキットによって指定される条件を用いていくつかの反応を実行し、サンプルＤＮＡ分子の１０％より少ないライゲーションが成功した。このための反応条件の一連の最適化は、ライゲーションを約７０％まで改善した。

【0452】

ミニＰＣＲ
以下のミニＰＣＲ方法は、短い核酸、消化された核酸、又はフラグメント化された核酸、例えば、ｃｆＤＮＡを含有するサンプルに望ましい。従来のＰＣＲアッセイ設計は、別個の胎児分子の顕著な消失を引き起こすが、消失は、ミニＰＣＲアッセイと呼ばれる非常に短いＰＣＲアッセイを設計することによって、大きく減らすことができる。母親の血清中の胎児ｃｆＤＮＡは、高度にフラグメント化され、フラグメントサイズは、平均が１６０ｂｐ、標準偏差が１５ｂｐ、最小サイズが約１００ｂｐ、最大サイズが約２２０ｂｐのほぼＧａｕｓｓｉａｎ方法で分布する。標的多型に関するフラグメントの開始位置と終了位置の分布は、必ずしもランダムではないが、個々の標的にわたって、また、全体的に全ての標的にわたって広く変動し、ある特定の標的遺伝子座の多型部位は、その遺伝子座に由来する様々なフラグメントの最初から最後までの任意の位置を占めていてもよい。なお、ミニＰＣＲという用語は、更なる制限又は限定なく、通常のＰＣＲを同様に指していてもよい。

【0453】

ＰＣＲ中に、増幅は、順方向及び逆方向のプライマー部位を両方とも含むテンプレートＤＮＡフラグメントからしか起こらない。胎児ｃｆＤＮＡフラグメントが短いため、両プライマー部位が存在する尤度、長さＬの胎児フラグメントが順方向及び逆方向のプライマー部位の両方を含む尤度は、そのフラグメントの長さに対するアンプリコンの長さの比率である。理想的な条件下で、アンプリコンが４５、５０、５５、６０、６５又は７０ｂｐであるアッセイは、利用可能なテンプレートフラグメント分子のそれぞれ７２％、６９％、６６％、６３％、５９％又は５６％からの増幅に成功する。アンプリコンの長さは、順方向及び逆方向のプライミング部位の５’末端間の距離である。当該技術分野で既知であるものによって典型的に使用されるものよりも短いアンプリコン長は、短い配列リードのみを必要とすることによって、所望な多型遺伝子座のより効率的な測定をもたらし得る。一実施形態において、アンプリコンの実質的な画分は、１００ｂｐ未満、９０ｂｐ未満、８０ｂｐ未満、７０ｂｐ未満、６５ｂｐ未満、６０ｂｐ未満、５５ｂｐ未満、５０ｂｐ未満又は４５ｂｐ未満であるべきである。

【0454】

なお、従来技術で既知の方法において、本明細書で記載されるような短いアッセイは、通常避けられる。これらのアッセイが必要とされず、プライマーの長さ、アニーリング特徴及び順方向プライマーと逆方向プライマーとの間の距離を制限することによって、プライマー設計にかなりの制約を課すためである。

【0455】

また、いずれかのプライマーの３’末端が、多型部位のほぼ１～６塩基内にある場合、偏った増幅の可能性が存在することに留意されたい。初期ポリメラーゼ結合部位でのこの一塩基の差は、１つの対立遺伝子の優先的増幅を引き起こす場合があり、対立遺伝子頻度の観測値を変え、性能を低下させ得る。これらの制約の全ては、特定の遺伝子座を首尾良く増幅するプライマーを特定し、更に、同じマルチプレックス反応で適合する多数のプライマーセットを設計するのを非常に困難なものにする。一実施形態において、順方向及び逆方向のインナープライマーの３’末端は、多型部位から上流のＤＮＡ領域にハイブリダイズするように設計され、少数の塩基によって多型部位から分離する。理想的には、塩基の数は、６～１０塩基であってもよいが、同様に、４～１５塩基、３～２０塩基、２～３０塩基又は１～６０塩基であってもよく、実質的に同じ末端を達成し得る。

【0456】

マルチプレックスＰＣＲは、全ての標的が増幅される単一ラウンドのＰＣＲを伴っていてもよく、又は１ラウンドのＰＣＲの後、１ラウンド以上のネスティッドＰＣＲ又はネスティッドＰＣＲのいくつかの変形例を伴っていてもよい。ネスティッドＰＣＲは、少なくとも１つの塩基対によって、以前のラウンドで使用されたプライマーに対して内部で結合する１つ以上の新しいプライマーを用いる、その後の１以上のラウンドのＰＣＲ増幅からなる。ネスティッドＰＣＲは、その後の反応において、修正された内部配列を有する従来のものからの増幅産物のみを増幅することによって、誤った増幅標的の数を減らす。誤った増幅標的を減らすことで、特に配列決定において得ることができる有用な測定値の数を改善する。ネスティッドＰＣＲは、典型的には、従来のプライマー結合部位に対して完全に内部にプライマーを設計することを伴い、増幅に必要な最小ＤＮＡセグメントの大きさを必然的に増加させる。ＤＮＡが高度にフラグメント化されるサンプル（例えば、血漿ｃｆＤＮＡ）について、アッセイサイズが大きいほど、測定値を得ることができる別個のｃｆＤＮＡ分子の数が減る。一実施形態において、この影響を相殺するために、第２ラウンドのプライマーの片方又は両方が、全アッセイサイズを最小限だけ大きくしつつ、更なる特異性を達成するために内部に数個の塩基を伸長する第１の結合部位と重複する、部分的なネスティッド手法を使用してもよい。

【0457】

一実施形態において、ＰＣＲアッセイのマルチプレックスプールは、１つ以上の染色体上の潜在的にヘテロ接合性のＳＮＰ又は他の多型若しくは非多型の遺伝子座を増幅するように設計され、これらのアッセイは、単一反応で使用され、ＤＮＡを増幅する。ＰＣＲアッセイの数は、５０～２００ＰＣＲアッセイ、２００～１，０００ＰＣＲアッセイ、１，０００～５，０００ＰＣＲアッセイ又は５，０００～２０，０００ＰＣＲアッセイ（それぞれ、５０～２００反応分、２００～１，０００反応分、１，０００～５，０００反応分、５，０００～２０，０００反応分、２０，０００より多い反応分）であってもよい。一実施形態において、約１０，０００ＰＣＲアッセイ（１０，０００反応分）のマルチプレックスプールは、染色体Ｘ、Ｙ、１３、１８及び２１及び１又は２上の潜在的にヘテロ接合性のＳＮＰを増幅するように設計され、これらのアッセイは、単一反応で使用され、材料の血漿サンプル、絨毛膜絨毛サンプル、羊水穿刺サンプル、単一細胞又は少数の細胞、他の体液又は組織、がん、又は遺伝物質から得られるｃｆＤＮＡを増幅する。各遺伝子座のＳＮＰ頻度は、クローンによって、又はアンプリコンを配列決定するいくつかの他の方法によって決定されてもよい。対立遺伝子頻度分布又は全てのアッセイの比率の統計分析を使用して、サンプルが、試験に含まれる染色体のうちの１つ以上のトリソミーを含有するかどうかを決定してもよい。別の実施形態において、元々のｃｆＤＮＡサンプルは、２つのサンプルに分割され、並行な５，０００反応分のアッセイが行われる。別の実施形態において、元々のｃｆＤＮＡサンプルは、ｎ個のサンプルに分割され、並行な（約１０，０００／ｎ）反応分のアッセイが行われ、ここで、ｎは、２～１２又は１２～２４又は２４～４８又は４８～９６である。データは、既に記載されているものと同様の方法で収集され、分析される。なお、この方法は、転座、欠失、重複及び他の染色体異常を検出するために、同様に十分に適用可能である。

【0458】

一実施形態において、標的ゲノムに対して相同性を有しないテールも、プライマーのいずれかの３’又は５’末端に付加されてもよい。これらのテールは、その後の操作、手順又は測定を容易にする。一実施形態において、テールの配列は、順方向及び逆方向の標的特異性プライマーと同じであってもよい。一実施形態において、異なるテールが、順方向及び逆方向の標的特異性プライマーのために使用されてもよい。一実施形態において、複数の異なるテールが、異なる遺伝子座又は遺伝子座のセットに使用されてもよい。特定のテールは、全ての遺伝子座間で、又は遺伝子座の部分集合間で共有されてもよい。例えば、現在の配列決定プラットフォームのいずれかによって必要とされる順方向及び逆方向の配列に対応する順方向及び逆方向のテールを用いることで、直接的な配列決定の後、増幅を可能にする。一実施形態において、テールは、他の有用な配列を付加するために使用可能な全ての増幅標的の間で、共通のプライミング部位として使用可能である。いくつかの実施形態において、インナープライマーは、標的遺伝子座（例えば、多型遺伝子座）の上流又は下流のいずれかにハイブリダイズするように設計された領域を含有してもよい。いくつかの実施形態において、プライマーは、分子バーコードを含有してもよい。いくつかの実施形態において、プライマーは、ＰＣＲ増幅を可能にするように設計されたユニバーサルプライミング配列を含有してもよい。

【0459】

一実施形態において、１０，０００反応分のＰＣＲアッセイプールは、順方向及び逆方向のプライマーが、高スループット配列決定装置（多くは、超並列配列決定装置と呼ばれる）、例えば、ＩＬＬＵＭＩＮＡから入手可能なＨＩＳＥＱ、ＧＡＩＩＸ又はＭＹＳＥＱによって必要とされる必要な順方向及び逆方向の配列に対応するテールを有するように作成される。これに加えて、アンプリコンに対してヌクレオチドバーコード配列を付加するために、その後のＰＣＲのプライミング部位として使用可能な更なる配列が、配列決定テールに対して５’に含まれ、高スループット配列決定装置の単一レーンにおいて複数サンプルのマルチプレックス配列決定を可能にする。

【0460】

一実施形態において、１０，０００反応分のＰＣＲアッセイプールは、逆方向プライマーが、高スループット配列決定装置によって必要とされる必要な逆方向配列に対応するテールを有するように作成される。第１の１０，０００反応分のアッセイを用いて増幅した後、その後のＰＣＲ増幅は、全ての標的について部分ネスティッド順方向プライマー（例えば、６塩基ネスティッド）と、第１ラウンドに含まれる逆方向配列決定テールに対応する逆方向プライマーとを含む、別の１０，０００反応分のプールを用いて行われてもよい。たった１つの標的特異性プライマーとユニバーサルプライマーを用いる、この後のラウンドの部分ネスティッド増幅は、アッセイの必要なサイズを制限し、サンプリングノイズを減らすが、誤ったアンプリコンの数を大きく減らす。配列決定タグは、付けられたライゲーションアダプターに、及び／又はＰＣＲプローブの一部として付加されてもよく、その結果、このタグは、最終的なアンプリコンの一部である。

【0461】

腫瘍分率は、試験の性能に影響を及ぼす。患者の血漿に見られるＤＮＡの腫瘍分率を濃くするいくつかの方法が存在する。腫瘍分率は、既に記載した、以前に記載したＬＭ－ＰＣＲ方法によって、また、長いフラグメントの標的化した除去によって高めることができる。一実施形態において、標的遺伝子座のマルチプレックスＰＣＲ増幅の前に、更なるマルチプレックスＰＣＲ反応を行い、その後のマルチプレックスＰＣＲにおいて標的とされる遺伝子座に対応する、長く、更に大きな材料フラグメントを選択的に除去してもよい。更なるプライマーは、無細胞胎児ＤＮＡフラグメントの中に存在すると予測されるものよりも多型からの距離が長い部位をアニーリングするように設計される。これらのプライマーは、標的多型遺伝子座のマルチプレックスＰＣＲの前に、１サイクルのマルチプレックスＰＣＲで使用されてもよい。これらの遠位のプライマーは、ＤＮＡの標的片の選択的認識を可能にする分子又は部分でタグ化される。一実施形態において、ＤＮＡのこれらの分子は、１サイクルのＰＣＲ後にこれらのプライマーを含む新しく形成した二本鎖ＤＮＡの除去を可能とするビオチン分子を用いて共有結合によって修飾されてもよい。その第１ラウンド中に形成された二本鎖ＤＮＡは、おそらく母体由来である。ハイブリッド材料の除去は、磁気ストレプトアビジンビーズの使用によって達成されてもよい。他にも同様に十分に機能し得る他のタグ化方法が存在する。一実施形態において、サイズ選択方法を使用して、ＤＮＡのより短い鎖（例えば、約８００ｂｐ未満、約５００ｂｐ未満、又は約３００ｂｐ未満）について、サンプルを濃縮してもよい。その後、短いフラグメントの増幅を、通常どおりに進めてもよい。

【0462】

本開示に記載のミニＰＣＲ方法は、単一サンプルから、単一反応において数百から数千、又は更に数百万の遺伝子座の高度に多重化された増幅及び分析を可能にする。同時に、増幅したＤＮＡの検出は、多重化されてもよい。数十から数百のサンプルは、バーコードＰＣＲを使用することによって、１つの配列決定レーンにおいて多重化することができる。この多重化された検出は、４９反応分までを首尾良く試験し、かなり高度な多重化が可能である。実際には、このことにより、単一の配列決定ランにおいて、数百のサンプルを数千のＳＮＰで遺伝子型決定することを可能にする。これらのサンプルについて、本方法は、遺伝子型及びヘテロ接合率の決定と、同時にコピー数の決定を可能にし、その両方が、異数性検出の目的のために使用可能である。変異投薬方法の一部として使用可能である。この方法は、任意の量のＤＮＡ又はＲＮＡについて使用されてもよく、標的領域は、ＳＮＰ、他の多型領域、非多型領域、及びこれらの組み合わせであってもよい。

【0463】

いくつかの実施形態において、フラグメント化されたＤＮＡのライゲーション媒介ユニバーサルＰＣＲ増幅が使用されてもよい。ライゲーション媒介ユニバーサルＰＣＲ増幅を使用して、血漿ＤＮＡを増幅させてもよく、次いで、これを複数の並行反応に分割してもよい。これを使用して、短いフラグメントを優先的に増幅し、それによって、腫瘍分率を高めてもよい。いくつかの実施形態において、ライゲーションによるフラグメントに対するタグの付加は、より短いフラグメントの検出、プライマーのより短い標的配列特異性部分の使用及び／又は非特異的な反応を減らす、より高い温度でのアニーリングを可能にする。

【0464】

本明細書に記載される方法は、ある量のコンタミネーションＤＮＡと混合した標的ＤＮＡのセットが存在するいくつかの目的のために使用されてもよい。いくつかの実施形態において、標的ＤＮＡ及びコンタミネーションＤＮＡは、遺伝的に関連する個体に由来するものであってもよい。例えば、胎児（標的）における遺伝子異常は、胎児（標的）ＤＮＡを含有し、母体の（コンタミネーション）ＤＮＡも含む母体の血漿から検出されてもよい。以上としては、全染色体異常（例えば、異数性）、部分染色体異常（例えば、欠失、重複、逆位、転座）、ポリヌクレオチド多型（例えば、ＳＴＲ）、単一ヌクレオチドバリアント多型及び／又は他の遺伝子異常又は違いが挙げられる。いくつかの実施形態において、標的及びコンタミネーションＤＮＡは、同じ個体に由来していてもよいが、標的及びコンタミネーションＤＮＡは、例えば、がんの場合に、１つ以上の変異によって異なっている。（例えば、Ｈ．Ｍａｍｏｎｅｔａｌ．ＰｒｅｆｅｒｅｎｔｉａｌＡｍｐｌｉｆｉｃａｔｉｏｎｏｆＡｐｏｐｔｏｔｉｃＤＮＡｆｒｏｍＰｌａｓｍａ：ＰｏｔｅｎｔｉａｌｆｏｒＥｎｈａｎｃｉｎｇＤｅｔｅｃｔｉｏｎｏｆＭｉｎｏｒＤＮＡＡｌｔｅｒａｔｉｏｎｓｉｎＣｉｒｃｕｌａｔｉｎｇＤＮＡ．ＣｌｉｎｉｃａｌＣｈｅｍｉｓｔｒｙ５４：９（２００８）を参照。いくつかの実施形態において、ＤＮＡは、細胞培養物（アポトーシス）の上清に見出されてもよい。いくつかの実施形態において、その後のライブラリ調製、増幅及び／又は配列決定のために、生体サンプル（例えば血液）におけるアポトーシスを誘発することが可能である。この目的を達成するためのいくつかの実行可能なワークフロー及びプロトコルは、本開示の別の箇所に提示されている。

【0465】

いくつかの実施形態において、標的ＤＮＡは、単一細胞に由来していてもよく、標的ゲノムの１個より少ないコピーからなるＤＮＡのサンプルに由来していてもよく、少量のＤＮＡに由来していてもよく、混合起源（例えば、がん患者の血漿及び腫瘍、健康なＤＮＡとがんＤＮＡの混合、移植など）からのＤＮＡに由来していてもよく、他の体液に由来していてもよく、細胞培養物に由来していてもよく、培養物の上清に由来していてもよく、ＤＮＡの法医学サンプルに由来していてもよく、ＤＮＡの古代のサンプル（例えば、コハクに捕捉された昆虫）に由来していてもよく、ＤＮＡの他のサンプルに由来していてもよく、これらの組み合わせであってもよい。

【0466】

いくつかの実施形態において、短いアンプリコンサイズが使用されてもよい。短いアンプリコンサイズは、フラグメント化されたＤＮＡに特に適している（例えば、ＡＳｉｋｏｒａ，ｅｔｓｌ．Ｄｅｔｅｃｔｉｏｎｏｆｉｎｃｒｅａｓｅｄａｍｏｕｎｔｓｏｆｃｅｌｌ－ｆｒｅｅｆｅｔａｌＤＮＡｗｉｔｈｓｈｏｒｔＰＣＲａｍｐｌｉｃｏｎｓ．ＣｌｉｎＣｈｅｍ．２０１０Ｊａｎ；５６（１）：１３６－８を参照）。

【0467】

短いアンプリコンサイズの使用は、いくつかの顕著な利益をもたらし得る。短いアンプリコンサイズは、最適化された増幅効率をもたらし得る。短いアンプリコンサイズは、典型的には、より短い産物を産生するため、非特異的なプライミングの機会が少ない。産物が短いほど、クラスターが小さくなり得るので、配列決定フローセル上で、より密にクラスター化させることができる。なお、本明細書に記載される方法は、より長いＰＣＲアンプリコンについても同様に十分に機能し得る。アンプリコンの長さは、必要な場合、例えば、更に大きな配列の伸長物を配列決定するときに、長くなるだろう。ネスティッドＰＣＲプロトコルの最初の工程として１００ｂｐ～２００ｂｐ長のアッセイを用いた、１４６反応分の標的化された増幅による実験は、単一セルで、陽性結果を有するゲノムＤＮＡに対して実行された。

【0468】

いくつかの実施形態において、本明細書に記載される方法を使用して、ＳＮＰ、コピー数、ヌクレオチドメチル化、ｍＲＮＡレベル、他の種類のＲＮＡ発現レベル、他の遺伝的及び／又はエピジェネティックな特徴を増幅及び／又は検出してもよい。本明細書に記載されるミニＰＣＲ方法は、次世代配列決定とともに使用されてもよく、マイクロアレイ、デジタルＰＣＲによる計数、リアルタイムＰＣＲ、質量分光計による分析などの他の下流の方法とともに使用されてもよい。

【0469】

いくつかの実施形態において、本明細書に記載のミニＰＣＲ増幅方法は、少数集合の正確な定量化のための方法の一部として使用されてもよい。スパイクキャリブレータを使用した絶対的な定量化に使用されてもよい。非常に深い配列決定を介する変異／マイナー対立遺伝子定量化に使用されてもよく、非常に多重化された態様で実行されてもよい。ヒト、動物、植物又は他の生物における血縁又は祖先の標準的な起源及び同一性の検査に使用されてもよい。法医学検査に使用されてもよい。任意の種類の物質、例えば、羊水及びＣＶＳ、精子、受胎産物（ＰＯＣ）に対する、迅速な遺伝子型決定及びコピー数分析（ＣＮ）に使用してもよい。胚から生検採取されたサンプルに対する遺伝子型決定など、単一細胞分析に使用されてもよい。ミニＰＣＲを使用した標的化配列決定によって、迅速な胚分析（１日未満、１日又は２日の範囲内の生検）に使用してもよい。

【0470】

いくつかの実施形態において、ミニＰＣＲ増幅方法は、腫瘍分析に使用することができる。腫瘍生検は、多くは、健康な細胞と腫瘍細胞の混合物である。標的化ＰＣＲは、バックグラウンド配列がほぼない状態でのＳＮＰ及び遺伝子座の深い配列決定を可能にする。腫瘍ＤＮＡに対するコピー数とヘテロ接合性の消失の分析に使用されてもよい。上述の腫瘍ＤＮＡは、腫瘍患者の多くの異なる体液又は組織中に存在していてもよい。腫瘍再発の検出及び／又は腫瘍スクリーニングに使用されてもよい。種子の品質管理検査に使用されてもよい。飼育又は漁業の目的で使用されてもよい。なお、これらの方法のいずれも、倍数性コールを目的として非多型遺伝子座を標的とすることに同様に十分に使用されてもよい。

【0471】

本明細書に開示される方法の基礎となるいくつかの基本的な方法を説明するいくつかの文献としては、以下のものが挙げられる。（１）ＷａｎｇＨＹ、ＬｕｏＭ、ＴｅｒｅｓｈｃｈｅｎｋｏＩＶ、ＦｒｉｋｋｅｒＤＭ、ＣｕｉＸ、ＬｉＪＹ、ＨｕＧ、ＣｈｕＹ、ＡｚａｒｏＭＡ、ＬｉｎＹ、ＳｈｅｎＬ、ＹａｎｇＱ、ＫａｍｂｏｕｒｉｓＭＥ、ＧａｏＲ、ＳｈｉｈＷ、ＬｉＨ．ＧｅｎｏｍｅＲｅｓ．２００５Ｆｅｂ；１５（２）：２７６－８３．ＤｅｐａｒｔｍｅｎｔｏｆＭｏｌｅｃｕｌａｒＧｅｎｅｔｉｃｓ、ＭｉｃｒｏｂｉｏｌｏｇｙａｎｄＩｍｍｕｎｏｌｏｇｙ／ＴｈｅＣａｎｃｅｒＩｎｓｔｉｔｕｔｅｏｆＮｅｗＪｅｒｓｅｙ、ＲｏｂｅｒｔＷｏｏｄＪｏｈｎｓｏｎＭｅｄｉｃａｌＳｃｈｏｏｌ、ＮｅｗＢｒｕｎｓｗｉｃｋ、ＮｅｗＪｅｒｓｅｙ０８９０３、ＵＳＡ．（２）Ｈｉｇｈ－ｔｈｒｏｕｇｈｐｕｔｇｅｎｏｔｙｐｉｎｇｏｆｓｉｎｇｌｅｎｕｃｌｅｏｔｉｄｅｐｏｌｙｍｏｒｐｈｉｓｍｓｗｉｔｈｈｉｇｈｓｅｎｓｉｔｉｖｉｔｙ．ＬｉＨ，ＷａｎｇＨＹ，ＣｕｉＸ，ＬｕｏＭ，ＨｕＧ，ＧｒｅｅｎａｗａｌｔＤＭ，ＴｅｒｅｓｈｃｈｅｎｋｏＩＶ，ＬｉＪＹ，ＣｈｕＹ，ＧａｏＲ．ＭｅｔｈｏｄｓＭｏｌＢｉｏｌ．２００７；３９６－ＰｕｂＭｅｄＰＭＩＤ：１８０２５６９９．（３）配列決定のための平均９アッセイの多重化を含む方法は、ＮｅｓｔｅｄＰａｔｃｈＰＣＲｅｎａｂｌｅｓｈｉｇｈｌｙｍｕｌｔｉｐｌｅｘｅｄｍｕｔａｔｉｏｎｄｉｓｃｏｖｅｒｙｉｎｃａｎｄｉｄａｔｅｇｅｎｅｓ．ＶａｒｌｅｙＫＥ、ＭｉｔｒａＲＤ．ＧｅｎｏｍｅＲｅｓ．２００８年１１月；１８（１１）：１８４４－５０．Ｅｐｕｂ２００８年１０月１０日に記載される。本明細書に開示される方法は、上述の参考文献よりも大きな桁数の多重化を可能にすることに留意されたい。

【0472】

例示的なキット
一態様において、本発明は、キット、例えば、本明細書に記載される方法のいずれかを用い、染色体セグメント又は染色体全体の欠失及び／又は重複を検出するために核酸サンプル中の標的遺伝子座を増幅するためのキットを特徴とする。いくつかの実施形態において、キットは、本発明のプライマーライブラリのいずれかを含んでいてもよい。一実施形態において、本キットは、複数のインナー順方向プライマーと場合により複数のインナー逆方向プライマーと、場合によりアウター順方向プライマー及びアウター逆方向プライマーを含み、各々のプライマーは、標的染色体又は染色体セグメント及び場合により更なる染色体又は染色体セグメント上の標的部位（例えば、多型部位）のうちの１つからすぐ上流及び／又は下流にあるＤＮＡの領域にハイブリダイズするように設計される。いくつかの実施形態において、本キットは、例えば、本明細書に記載される方法のいずれかを用い、１つ以上の染色体セグメント又は染色体全体の１つ以上の欠失及び／又は重複を検出するために、標的遺伝子座を増幅するためにプライマーライブラリを用いるための説明書を含む。

【0473】

特定の実施形態において、本発明のキットは、染色体の異数性及びＣＮＶ決定を検出するためのプライマー対、例えば、染色体の異数性（例えば、ＣＮＶ（ＣｏＮＶＥＲＧｅ）（ＣｏｐｙＮｕｍｂｅｒＶａｒｉａｎｔＥｖｅｎｔｓＲｅｖｅａｌｅｄＧｅｎｏｔｙｐｉｃａｌｌｙ：遺伝子型的に明らかになったコピー数バリアントイベント）及び／又はＳＮＶを検出するための大規模多重反応のためのプライマー対を提供する。これらの実施形態において、本キットは、一緒に出荷される、少なくとも１００、２００、２５０、３００、５００、１０００、２０００、２５００、３０００、５０００、１０，０００、２０，０００、２５，０００、２８，０００、５０，０００又は７５，０００、最大で２００、２５０、３００、５００、１０００、２０００、２５００、３０００、５０００、１０，０００、２０，０００、２５，０００、２８，０００、５０，０００、７５，０００又は１００，０００個のプライマー対を含んでいてもよい。プライマー対は、単一の容器、例えば、単一のチューブ又はボックス、又は複数のチューブ又はボックスに含有されていてもよい。特定の実施形態において、プライマー対は、商業的な供給業者によって前もって適正な品質にされ、一緒に販売され、他の実施形態において、顧客は、特注の遺伝子標的及び／又はプライマーを選択し、商業的な供給業者は、顧客に対し、１つのチューブでも複数のチューブでもなく、プライマープールを製造し、出荷する。特定の例示的な実施形態において、本キットは、ＣＮＶ及びＳＮＶの両方、特に、少なくとも１種類のがんと相関関係があることが知られているＣＮＶ及びＳＮＶを検出するためのプライマーを含む。

【0474】

本発明のいくつかの実施形態による循環ＤＮＡ検出のためのキットは、循環ＤＮＡのための標準及び／又は対照を含む。例えば、特定の実施形態において、標準及び／又は対照は、本明細書で提供される増幅反応を行うために使用されるプライマー（例えば、ＣｏＮＶＥＲＧｅを行うためのプライマー）とともに販売され、場合により出荷され、梱包される。特定の実施形態において、対照は、１個以上の染色体異数性（例えばＣＮＶ）を示すか、及び／又は１個以上のＳＮＶを含む単離されたゲノムＤＮＡを含め、ポリヌクレオチド（例えば、ＤＮＡ）を含む。特定の実施形態において、標準及び／又は対照は、ＰｌａｓｍＡｒｔ標準と呼ばれ、特に、特定の遺伝性疾患において、特定の疾患状態（例えば、がん）で、ＣＮＶを示すことが知られているゲノムの領域に対して配列同一性を有し、血漿中で通常見出されるｃｆＤＮＡフラグメントのサイズ分布を反映するサイズ分布を有するポリヌクレオチドを含む。ＰｌａｓｍＡｒｔ標準を作成するための例示的な方法は、本明細書の実施例で提供される。一般的に、染色体異数性を含むことが知られている供給源からのゲノムＤＮＡが、単離され、フラグメント化され、精製され、大きさが選択される。

【0475】

したがって、人工ｃｆＤＮＡポリヌクレオチドの標準及び／又は対照は、上にまとめたように調製される単離されたポリヌクレオチドサンプルを、ｉｎｖｉｖｏでｃｆＤＮＡについて観測されたものと同様の濃度で、例えば、流体中０．０１％～２０％、０．１～１５％又は４～１０％のＤＮＡで、染色体異数性及び／又はＳＮＶを示さないことがわかっているＤＮＡサンプルにスパイク化することによって製造される。これらの標準／対照は、アッセイ設計、特性決定、開発及び／又は検証のための対照として、試験（例えば、ＣＬＩＡ実験室で行われるがん試験）中の品質管理標準として、及び／又は研究使用のみ又は診断検査キットに含まれる標準として、使用することができる。

【0476】

例示的な正規化／修正方法
いくつかの実施形態において、異なる遺伝子座、染色体セグメント又は染色体の測定は、バイアス、例えば、ＧＣ含有量の差に起因するバイアス又は増幅効率の他の差に起因するバイアスについて調整されるか、又は配列決定エラーについて調整される。いくつかの実施形態において、同じ遺伝子座についての異なる対立遺伝子の測定値は、対立遺伝子間の代謝、アポトーシス、ヒストン、不活化及び／又は増幅の差について調整される。いくつかの実施形態において、ＲＮＡにおける同じ遺伝子座についての異なる対立遺伝子の測定値は、異なるＲＮＡ対立遺伝子間の転写速度又は安定性の差について調整される。

【0477】

遺伝子データをフェージングするための例示的な方法
いくつかの実施形態において、遺伝子データは、本明細書に記載される方法又は遺伝子データをフェージングするための任意の既知の方法を用いてフェージングされる（例えば、各々、参照によりその全体が本明細書に組み込まれる、２００９年２月９日に出願されたＰＣＴ国際公開第ＷＯ２００９／１０５５３１号、２００９年８月４日に出願されたＰＣＴ国際公開第ＷＯ２０１０／０１７２１４号、米国公開第２０１３／０１２３１２０号、２０１２年１１月２１日、２０１０年１０月７日に出願された米国公開第２０１１／００３３８６２号、２０１０年８月１９日に出願された米国公開第２０１１／００３３８６２号、２０１１年２月３日に出願された米国公開第２０１１／０１７８７１９号、２００８年３月１７日に出願された米国特許第８，５１５，６７９号、２００６年１１月２２日に出願された米国公開第２００７／０１８４４６７号、２００８年３月１７日に出願された米国公開第２００８／０２４３３９８号及び２０１４年５月１６日に出願された米国出願第６１／９９４，７９１号を参照）。いくつかの実施形態において、フェーズは、目的のＣＮＶを含有することが知られているか、又は含むことが疑われる１つ以上の領域について決定される。いくつかの実施形態において、フェーズは、ＣＮＶ領域（複数可）に隣接する１つ以上の領域及び／又は１つ以上の参照領域についても決定される。一実施形態において、個体の遺伝子データは、例えば、１つ以上の精子又は卵子を測定することによって、倍体である個体由来の組織を測定することによって、推論によってフェージングされる。一実施形態において、個体の遺伝子データは、１名以上の一親等の血縁者、例えば、個体の親（例えば、個体の父親からの精子）又は兄弟姉妹の遺伝子型データの測定値を用い、推論によってフェージングされる。

【0478】

一実施形態において、個体の遺伝子データは、例えば、デジタルＰＣＲを用いることによって、希釈によってフェージングされ、ＤＮＡ又はＲＮＡが１個又は複数のウェルで希釈される。いくつかの実施形態において、ＤＮＡ又はＲＮＡは、各ウェル中の各ハプロタイプの約１個以下のコピーが存在すると予想される程度まで希釈され、次いで、１個以上のウェル中のＤＮＡ又はＲＮＡが測定される。いくつかの実施形態において、染色体が密な束である場合、細胞は有糸分裂期に停止され、微小流体を使用して、別個のウェルに別個の染色体を入れる。ＤＮＡ又はＲＮＡが希釈されるため、１個より多いハプロタイプが同じ画分（又はチューブ）内にある可能性は低い。したがって、チューブ内にＤＮＡの単分子が効果的に存在してもよく、これにより、単一のＤＮＡ又はＲＮＡ分子上のハプロタイプを決定することができる。いくつかの実施形態において、本方法は、画分の少なくとも１つが、染色体対からの１つの染色体又は１つの染色体セグメントを含むように、ＤＮＡ又はＲＮＡのサンプルを複数の画分に分割することと、画分の少なくとも１つにおいて、ＤＮＡ又はＲＮＡのサンプルの遺伝子型を決定すること（例えば、２つ以上の多型遺伝子座の存在を決定すること）によって、ハプロタイプを決定すること、とを含む。いくつかの実施形態において、遺伝子型を決定することは、ＳＮＰアレイを配列決定し（例えば、ショットガン配列決定又は単分子配列決定）、多型遺伝子座を検出するか、又はマルチプレックスＰＣＲを伴う。いくつかの実施形態において、遺伝子型を決定することは、多型遺伝子座、例えば、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる多型遺伝子座を検出するためのＳＮＰアレイの使用を伴う。いくつかの実施形態において、遺伝子型を決定することは、マルチプレックスＰＣＲの使用を伴う。いくつかの実施形態において、本方法は、画分中のサンプルと、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる多型遺伝子座（例えばＳＮＰ）に同時にハイブリダイズするプライマーのライブラリとを接触させ、反応混合物を生成することと、反応混合物をプライマー伸長反応条件に供して、高スループットシーケンサを用いて測定される増幅産物を産生して配列決定データを作成することと、を伴う。いくつかの実施形態において、ＲＮＡ（例えばｍＲＮＡ）が配列決定される。ｍＲＮＡはエクソンのみを含有するため、ｍＲＮＡを配列決定することで、ゲノム中の大きな距離（例えば、数メガ塩基）にわたって多型遺伝子座（例えばＳＮＰ）について対立遺伝子を決定することができる。いくつかの実施形態において、個体のハプロタイプは、染色体選別によって決定される。例示的な染色体選別方法は、染色体が密な束である場合、有糸分裂期にある細胞を停止させることと、微小流体を使用して、別個のウェルに別個の染色体を入れることと、を含む。別の方法は、ＦＡＣＳを介する単一染色体選別を用い、単一染色体を集めることを伴う。標準的な方法（例えば、配列決定又はアレイ）を使用して、単一染色体上の対立遺伝子を特定して、個体のハプロタイプを決定することができる。

【0479】

いくつかの実施形態において、個体のハプロタイプは、長いリード配列決定によって、例えば、Ｉｌｌｕｍｉｎａによって開発されたＭｏｌｅｃｕｌｏＴｅｃｈｎｏｌｏｇｙを用いることによって決定される。いくつかの実施形態において、ライブラリ調製工程は、ＤＮＡをフラグメント（例えば、約１０ｋｂの大きさのフラグメント）に剪断することと、フラグメントを希釈することと、（約３，０００個のフラグメントが単一のウェル内にあるように）フラグメントをウェルに入れることと、ロングレンジＰＣＲによって、各ウェル中のフラグメントを増幅することと、短いフラグメントに切断することと、フラグメントをバーコード化することと、各ウェルからのバーコード化されたフラグメントを一緒にプールして、これらを全て配列決定することと、を伴う。配列決定の後、計算工程は、各ウェルからのリードを、付けられたバーコードに基づいて分離することと、これらをグループ分けしてフラグメントにすることと、重複するヘテロ接合性ＳＮＶにあるフラグメントをハプロタイプブロックにアセンブリすることと、このブロックを、フェージングされた参照パネルに基づき、統計的にフェージングすることと、長いハプロタイプコンフィグを生成することと、を伴う。

【0480】

いくつかの実施形態において、個体のハプロタイプは、個体の血縁者からのデータを用いて決定される。いくつかの実施形態において、ＳＮＰアレイを使用して、個体及び個体の血縁者からのＤＮＡ又はＲＮＡサンプルにおいて、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる多型遺伝子座の存在を決定する。いくつかの実施形態において、本方法は、個体及び／又は個体の血縁者からのＤＮＡサンプルと、少なくとも１００、２００、５００、７５０、１，０００、２，０００、５，０００、７，５００、１０，０００、２０，０００、２５，０００、３０，０００、４０，０００、５０，０００、７５，０００又は１００，０００個の異なる多型遺伝子座（例えばＳＮＰ）に同時にハイブリダイズするプライマーのライブラリとを接触させ、反応混合物を生成することと、反応混合物をプライマー伸長反応条件に供して、高スループットシーケンサを用いて測定される増幅産物を産生して配列決定データを作成することと、を伴う。

【0481】

一実施形態において、個体の遺伝子データは、集合に基づくハプロタイプ頻度を使用するコンピュータプログラムを使用してフェージングして、最も可能性の高いフェーズを推定する（例えば、ＨａｐＭａｐに基づくフェージング）。例えば、倍体データセットは、一般的な集合において既知のハプロタイプブロックを利用する統計的方法を用い、二倍体データから直接的に推測することができる（例えば、公的なＨａｐＭａｐＰｒｏｊｅｃｔ及びＰｅｒｌｅｇｅｎＨｕｍａｎＨａｐｌｏｔｙｐｅＰｒｏｊｅｃｔについて作成されたもの）。ハプロタイプブロックは、本質的には、様々な集合で繰り返し発生する、相関関係にある一連の対立遺伝子である。これらのハプロタイプブロックは、古く、一般的であることが多いため、これらを使用して、二倍体遺伝子型からハプロタイプを予測してもよい。この作業を完成させるのに利用可能な公的なアルゴリズムとしては、不完全な系統学による手法、共役事前分布に基づくベイズ手法及び集合遺伝学からの事前分布が挙げられる。これらのアルゴリズムのいくつかは、隠れマルコフモデルを使用する。

【0482】

一実施形態において、個体の遺伝子データは、遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、局在化したハプロタイプクラスタリングを使用するアルゴリズムを使用して、フェージングされる（例えば、その全体が参照により本明細書に組み込まれる、Ｂｒｏｗｎｉｎｇ及びＢｒｏｗｎｉｎｇ、「ＲａｐｉｄａｎｄＡｃｃｕｒａｔｅＨａｐｌｏｔｙｐｅＰｈａｓｉｎｇａｎｄＭｉｓｓｉｎｇ－ＤａｔａＩｎｆｅｒｅｎｃｅｆｏｒＷｈｏｌｅ－ＧｅｎｏｍｅＡｓｓｏｃｉａｔｉｏｎＳｔｕｄｉｅｓＢｙＵｓｅｏｆＬｏｃａｌｉｚｅｄＨａｐｌｏｔｙｐｅＣｌｕｓｔｅｒｉｎｇ」ＡｍＪＨｕｍＧｅｎｅｔ．Ｎｏｖ２００７；８１（５）：１０８４－１０９７）。例示的なプログラムは、Ｂｅａｇｌｅバージョン：３．３．２又はバージョン４である（ｈｆａｃｕｌｔｙ．ｗａｓｈｉｎｇｔｏｎ．ｅｄｕ／ｂｒｏｗｎｉｎｇ／ｂｅａｇｌｅ／ｂｅａｇｌｅ．ｈｔｍｌでのワールドワイドウェブにおいて入手可能、その全体が参照により本明細書に組み込まれる）。

【0483】

一実施形態において、個体の遺伝子データは、遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、遺伝子型決定されるマーカーの距離、順序及び間隔、欠落データの代入、組換え率の推定、又はこれらの組み合わせを用いる連鎖不均衡の減衰を使用するアルゴリズムを使用してフェージングされる（例えば、ＳｔｅｐｈｅｎｓａｎｄＳｃｈｅｅｔ，“ＡｃｃｏｕｎｔｉｎｇｆｏｒＤｅｃａｙｏｆＬｉｎｋａｇｅＤｉｓｅｑｕｉｌｉｂｒｉｕｍｉｎＨａｐｌｏｔｙｐｅＩｎｆｅｒｅｎｃｅａｎｄＭｉｓｓｉｎｇ－ＤａｔａＩｍｐｕｔａｔｉｏｎ”Ａｍ．Ｊ．Ｈｕｍ．Ｇｅｎｅｔ．７６：４４９－４６２，２００５を参照、その全体が参照により本明細書に組み込まれる）。例示的なプログラムは、ＰＨＡＳＥｖ．２．１又はｖ２．１．１である（ｓｔｅｐｈｅｎｓｌａｂ．ｕｃｈｉｃａｇｏ．ｅｄｕ／ｓｏｆｔｗａｒｅ．ｈｔｍｌでワールドワイドウェブで入手可能、その全体が参照により本明細書に組み込まれる）。

【0484】

一実施形態において、個体の遺伝子データは、集合の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、隠れマルコフモデルに従って、クラスターメンバーシップが染色体に沿って連続的に変化することを可能にするアルゴリズムを用いて、フェージングされる。この手法は自由度が高く、連鎖不均衡の「ブロック様」パターンと、距離を用いた連鎖不均衡が徐々に低下することの両方について可能である（例えば、その全体が参照により本明細書に組み込まれる、ＳｃｈｅｅｔａｎｄＳｔｅｐｈｅｎｓ，“Ａｆａｓｔａｎｄｆｌｅｘｉｂｌｅｓｔａｔｉｓｔｉｃａｌｍｏｄｅｌｆｏｒｌａｒｇｅ－ｓｃａｌｅｐｏｐｕｌａｔｉｏｎｇｅｎｏｔｙｐｅｄａｔａ：ａｐｐｌｉｃａｔｉｏｎｓｔｏｉｎｆｅｒｒｉｎｇｍｉｓｓｉｎｇｇｅｎｏｔｙｐｅｓａｎｄｈａｐｌｏｔｙｐｉｃｐｈａｓｅ．”ＡｍＪＨｕｍＧｅｎｅｔ，７８：６２９－６４４，２００６を参照）。例示的なプログラムは、ｆａｓｔＰＨＡＳＥである（ｓｔｅｐｈｅｎｓｌａｂ．ｕｃｈｉｃａｇｏ．ｅｄｕ／ｓｏｆｔｗａｒｅ．ｈｔｍｌでワールドワイドウェブで入手可能、その全体が参照により本明細書に組み込まれる）。

【0485】

一実施形態において、個体の遺伝子データは、遺伝子型代入方法、例えば、以下の参照データセットのうちの１つ以上を使用する方法を用いて、フェージングされる。ＨａｐＭａｐデータセット、複数のＳＮＰチップ上で遺伝子型決定される対照のデータセット及び１，０００ＧｅｎｏｍｅｓＰｒｏｊｅｃｔからの密に型決定されたサンプル。例示的な手法は、複数の参照パネルにわたって精度を高め、情報を組み合わせた、自由度の高いモデリングフレームワークである（例えば、その全体が参照により本明細書に組み込まれる、Ｈｏｗｉｅ、Ｄｏｎｎｅｌｌｙ及びＭａｒｃｈｉｎｉ（２００９）、「Ａｆｌｅｘｉｂｌｅａｎｄａｃｃｕｒａｔｅｇｅｎｏｔｙｐｅｉｍｐｕｔａｔｉｏｎｍｅｔｈｏｄｆｏｒｔｈｅｎｅｘｔｇｅｎｅｒａｔｉｏｎｏｆｇｅｎｏｍｅ－ｗｉｄｅａｓｓｏｃｉａｔｉｏｎｓｔｕｄｉｅｓ．」ＰＬｏＳＧｅｎｅｔｉｃｓ５（６）：ｅ１０００５２９，２００９を参照）。例示的なプログラムは、ＩＭＰＵＴＥ又はＩＭＰＵＴＥバージョン２（ＩＭＰＵＴＥ２としても知られる）である（ｍａｔｈｇｅｎ．ｓｔａｔｓ．ｏｘ．ａｃ．ｕｋ／ｉｍｐｕｔｅ／ｉｍｐｕｔｅ＿ｖ２．ｈｔｍｌでワールドワイドウェブで入手可能、その全体が参照により本明細書に組み込まれる）。

【0486】

一実施形態において、個体の遺伝子データは、ハプロタイプを推論するアルゴリズム、例えば、ＰＨＡＳＥｖ２．１においてＳｔｅｐｈｅｎｓによって開発されたような、組換えとの結合の遺伝子モデルの下でハプロタイプを推論するアルゴリズムを用いて、フェージングされる。主要なアルゴリズムの改善は、各個体についての候補ハプロタイプのセットを表すためのバイナリツリーの使用に依存する。これらのバイナリツリー表現は、（１）ＰＨＡＳＥｖ２．１で行われる冗長操作を回避することによって、ハプロタイプの事後確率の計算を高速化し、（２）バイナリツリーにおける最も合理的な経路（すなわち、ハプロタイプ）のスマートな検索によってハプロタイプ推論問題の指数関数的態様を克服する（例えば、Ｄｅｌａｎｅａｕ，ＣｏｕｌｏｎｇｅｓａｎｄＺａｇｕｒｙ，“Ｓｈａｐｅ－ＩＴ：ｎｅｗｒａｐｉｄａｎｄａｃｃｕｒａｔｅａｌｇｏｒｉｔｈｍｆｏｒｈａｐｌｏｔｙｐｅｉｎｆｅｒｅｎｃｅ，”ＢＭＣＢｉｏｉｎｆｏｒｍａｔｉｃｓ９：５４０，２００８ｄｏｉ：１０．１１８６／１４７１－２１０５－９－５４０を参照、その全体が参照により本明細書に組み込まれる）。例示的なプログラムは、ＳＨＡＰＥＩＴである（ｍａｔｈｇｅｎ．ｓｔａｔｓ．ｏｘ．ａｃ．ｕｋ／ｇｅｎｅｔｉｃｓ＿ｓｏｆｔｗａｒｅ／ｓｈａｐｅｉｔ／ｓｈａｐｅｉｔ．ｈｔｍｌでワールドワイドウェブで入手可能、その全体が参照により本明細書に組み込まれる）。

【0487】

一実施形態において、個体の遺伝子データは、集合の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、より長いハプロタイプについての経験に基づく確率を得るためにハプロタイプフラグメント頻度を使用するアルゴリズムを用いて、フェージングされる。いくつかの実施形態において、アルゴリズムは、最大の局所的なコヒーレンスを有するようにハプロタイプを再構築する（例えば、Ｅｒｏｎｅｎ，Ｇｅｅｒｔｓ，ａｎｄＴｏｉｖｏｎｅｎ，“ＨａｐｌｏＲｅｃ：Ｅｆｆｉｃｉｅｎｔａｎｄａｃｃｕｒａｔｅｌａｒｇｅ－ｓｃａｌｅｒｅｃｏｎｓｔｒｕｃｔｉｏｎｏｆｈａｐｌｏｔｙｐｅｓ，”ＢＭＣＢｉｏｉｎｆｏｒｍａｔｉｃｓ７：５４２，２００６を参照、その全体が参照により本明細書に組み込まれる）。例示的なプログラムは、ＨａｐｌｏＲｅｃ、例えば、ＨａｐｌｏＲｅｃバージョン２．３である（参照によりその全体が本明細書に組み込まれる、ｃｓ．ｈｅｌｓｉｎｋｉ．ｆｉ／ｇｒｏｕｐ／ｇｅｎｅｔｉｃｓ／ｈａｐｌｏｔｙｐｉｎｇ．ｈｔｍｌでワールドワイドウェブで入手可能）。

【0488】

一実施形態において、個体の遺伝子データは、集合の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、パーティションライゲーション戦略を使用するアルゴリズム及び期待最大化に基づくアルゴリズムを使用してフェージングされる（例えば、Ｑｉｎ，Ｎｉｕ，ａｎｄＬｉｕ，“Ｐａｒｔｉｔｉｏｎ－Ｌｉｇａｔｉｏｎ－Ｅｘｐｅｃｔａｔｉｏｎ－ＭａｘｉｍｉｚａｔｉｏｎＡｌｇｏｒｉｔｈｍｆｏｒＨａｐｌｏｔｙｐｅＩｎｆｅｒｅｎｃｅｗｉｔｈＳｉｎｇｌｅ－ＮｕｃｌｅｏｔｉｄｅＰｏｌｙｍｏｒｐｈｉｓｍｓ，”ＡｍＪＨｕｍＧｅｎｅｔ．７１（５）：１２４２－１２４７，２００２を参照、その全体が参照により本明細書に組み込まれる）。例示的なプログラムは、ＰＬ－ＥＭである（参照によりその全体が本明細書に組み込まれる、ｐｅｏｐｌｅ．ｆａｓ．ｈａｒｖａｒｄ．ｅｄｕ／～ｊｕｎｌｉｕ／ｐｌｅｍ／ｃｌｉｃｋ．ｈｔｍｌでワールドワイドウェブで入手可能）。

【0489】

一実施形態において、個体の遺伝子データは、集合の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、遺伝子型からハプロタイプへのフェージング及びブロック分割を同時に行うためのアルゴリズムを用いて、フェージングされる。いくつかの実施形態において、期待最大化アルゴリズムが使用される（例えば、ＫｉｍｍｅｌａｎｄＳｈａｍｉｒ，“ＧＥＲＢＩＬ：ＧｅｎｏｔｙｐｅＲｅｓｏｌｕｔｉｏｎａｎｄＢｌｏｃｋＩｄｅｎｔｉｆｉｃａｔｉｏｎＵｓｉｎｇＬｉｋｅｌｉｈｏｏｄ，”ＰｒｏｃｅｅｄｉｎｇｓｏｆｔｈｅＮａｔｉｏｎａｌＡｃａｄｅｍｙｏｆＳｃｉｅｎｃｅｓｏｆｔｈｅＵｎｉｔｅｄＳｔａｔｅｓｏｆＡｍｅｒｉｃａ（ＰＮＡＳ）１０２：１５８－１６２，２００５を参照、その全体が参照により本明細書に組み込まれる）。例示的なプログラムは、ＧＥＲＢＩＬであり、ＧＥＶＡＬＴバージョン２プログラムの一部として入手可能である（ａｃｇｔ．ｃｓ．ｔａｕ．ａｃ．ｉｌ／ｇｅｖａｌｔ／でワールドワイドウェブで入手可能、その全体が参照により本明細書に組み込まれる）。

【0490】

一実施形態において、個体の遺伝子データは、集合の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、フェーズを指定しない遺伝子型測定を考慮して、ハプロタイプ頻度のＭＬ推定値を計算するためにＥＭアルゴリズムを使用するアルゴリズムを用いて、フェージングされる。このアルゴリズムも、いくつかの遺伝子型測定が欠落する可能性がある（例えば、ＰＣＲの失敗に起因する）。個々のハプロタイプの複数の代入も可能にする（例えば、Ｃｌａｙｔｏｎ，Ｄ．（２００２），“ＳＮＰＨＡＰ：ＡＰｒｏｇｒａｍｆｏｒＥｓｔｉｍａｔｉｎｇＦｒｅｑｕｅｎｃｉｅｓｏｆＬａｒｇｅＨａｐｌｏｔｙｐｅｓｏｆＳＮＰｓ”を参照、その全体が参照により本明細書に組み込まれる）。例示的なプログラムは、ＳＮＰＨＡＰである（ｇｅｎｅ．ｃｉｍｒ．ｃａｍ．ａｃ．ｕｋ／ｃｌａｙｔｏｎ／ｓｏｆｔｗａｒｅ／ｓｎｐｈａｐ．ｔｘｔでのワールドワイドウェブで入手可能、その全体が参照により本明細書に組み込まれる）。

【0491】

一実施形態において、個体の遺伝子データは、集合の遺伝子型データからハプロタイプを推定するアルゴリズム、例えば、ＳＮＰの対について集められた遺伝子型統計に基づくハプロタイプ推論のためのアルゴリズムを用いて、フェージングされる。このソフトウェアは、例えば、ＤＮＡアレイから得られた多数の長いゲノム配列の比較的正確なフェージングのために使用することができる。例示的なプログラムは、遺伝子型マトリックスをインプットとして取り込み、対応するハプロタイプマトリックスを出力する（例えば、ＢｒｉｎｚａａｎｄＺｅｌｉｋｏｖｓｋｙ，“２ＳＮＰ：ｓｃａｌａｂｌｅｐｈａｓｉｎｇｂａｓｅｄｏｎ２－ＳＮＰｈａｐｌｏｔｙｐｅｓ，”Ｂｉｏｉｎｆｏｒｍａｔｉｃｓ．２２（３）：３７１－３，２００６を参照、その全体が参照により本明細書に組み込まれる）。例示的なプログラムは、２ＳＮＰである（ａｌｌａ．ｃｓ．ｇｓｕ．ｅｄｕ／～ｓｏｆｔｗａｒｅ／２ＳＮＰでのワールドワイドウェブで入手可能、参照によりその全体が本明細書に組み込まれる）。

【0492】

様々な実施形態において、個体の遺伝子データは、染色体又は染色体セグメント中の異なる位置で染色体が交差する確率に関するデータを使用して、フェージングされ（例えば、ＨａｐＭａｐデータベース中に見られ得るような組換えデータを用いて、任意の間隔で組換えリスクスコアを作成し）、その染色体又は染色体セグメント上の多型対立遺伝子間の依存性をモデル化する。いくつかの実施形態において、多型遺伝子座での対立遺伝子数は、配列決定データ又はＳＮＰアレイデータに基づいてコンピュータで計算される。いくつかの実施形態において、各染色体又は染色体セグメントの異なる可能な状態に関する複数の仮説（例えば、個体からの１つ以上の細胞のゲノムにおいて、第２の相同染色体セグメントと比較して、第１の相同染色体セグメントのコピー数の過剰出現、第１の相同染色体セグメントの重複、第２の相同染色体セグメントの欠失、又は第１及び第２の相同染色体セグメントの等しい出現）が作成され（例えば、コンピュータで作成）、染色体上の多型遺伝子座での対立遺伝子数の予測値についてのモデル（例えば、結合分布モデル）が、各々の仮説について構築され（例えば、コンピュータで構築）、結合分布モデル及び対立遺伝子数を用い、仮説の各々の相対確率が決定され（例えば、コンピュータで決定）、最大確率を有する仮説が選択される。いくつかの実施形態において、対立遺伝子数の結合分布モデルを構築することと、各々の仮説の相対確率を決定する工程は、参照染色体の使用を必要としない方法を用いて行われる。

【0493】

いくつかの実施形態において、個体からのサンプル（例えば、生検、例えば、腫瘍生検、血液サンプル、血漿サンプル、血清サンプル、又は大部分が目的のＣＮＶを有する細胞、ＤＮＡ又はＲＮＡ）を含有するか、又はこれらのみを含有する可能性が高い別のサンプル）が分析され、目的のＣＮＶ（例えば、欠失又は重複）を含有することが知られているか、又は疑われる１つ以上の領域についてフェーズを決定する。いくつかの実施形態において、サンプルは、高い腫瘍分率（例えば、３０、４０、５０、６０、７０、８０、９０、９５、９８、９９又は１００％）を有する。

【0494】

いくつかの実施形態において、サンプルは、ハプロタイプ不均衡又は任意の異数性を有する。いくつかの実施形態において、サンプルは、２種類のＤＮＡの任意の混合物を含み、この２種類は、異なる比率の２つのハプロタイプを有し、少なくとも１つのハプロタイプを共有している。例えば、腫瘍の場合、正常組織は１：１であり、腫瘍組織は、１：０又は１：２、１：３、１：４などである。いくつかの実施形態において、少なくとも１０、１００、５００、１，０００、２，０００、３，０００、５，０００、８，０００又は１０，０００個の多型遺伝子座が分析され、遺伝子座の一部又は全てでの対立遺伝子のフェーズを決定する。いくつかの実施形態において、サンプルは、異数性（例えば、長時間の細胞培養によって誘導される異数性）になるように処理された細胞又は組織に由来する。

【0495】

いくつかの実施形態において、サンプル中のＤＮＡ又はＲＮＡの大部分の割合又は全てが、目的のＣＮＶを有する。いくつかの実施形態において、サンプル中の総ＤＮＡ又はＲＮＡに対する、目的のＣＮＶを含有する１つ以上の標的細胞からのＤＮＡ又はＲＮＡの比率は、少なくとも８０、８５、９０、９５又は１００％である。欠失を有するサンプルについて、その欠失を有する細胞（又はＤＮＡ若しくはＲＮＡ）について、たった１つのハプロタイプが存在する。この第１のハプロタイプは、標準的な方法を用いて決定され、欠失の領域に存在する対立遺伝子の同一性を決定することができる。欠失を有する細胞（又はＤＮＡ若しくはＲＮＡ）のみを含有するサンプルにおいて、これらの細胞中に存在する第１のハプロタイプからの信号のみが存在するだろう。欠失を有しない少量の細胞（又はＤＮＡ若しくはＲＮＡ）（例えば、少量の非がん性細胞）も含有するサンプルにおいて、これらの細胞（又はＤＮＡ若しくはＲＮＡ）における第２のハプロタイプからの弱い信号は、無視することができる。その欠失を欠く個体からの他の細胞、ＤＮＡ又はＲＮＡ中に存在する第２のハプロタイプは、推論によって決定することができる。例えば、欠失を有しない個体からの細胞の遺伝子型が（ＡＢ，ＡＢ）であり、その個体についてのフェージングデータが、第１のハプロタイプが（Ａ，Ａ）であることを示す場合、他のハプロタイプは、（Ｂ，Ｂ）であると推論することができる。

【0496】

欠失を有する細胞（又はＤＮＡ若しくはＲＮＡ）と、欠失を有しない欠失を有する細胞（又はＤＮＡ若しくはＲＮＡ）が両方とも存在するサンプルについても、フェーズを決定することができる。例えば、ｘ軸が、染色体に沿った個々の遺伝子座の線形位置を表し、ｙ軸が、総（Ａ＋Ｂ）対立遺伝子リードの分率としてのＡ対立遺伝子リードの数を表す、プロットを作成することができる。欠失についてのいくつかの実施形態において、パターンは、個体がヘテロ接合性であるＳＮＰを表す２つの中央のバンドを含む（上側のバンドは、欠失を有しない細胞からのＡＢと、欠失を有する細胞からのＡを表し、下側のバンドは、欠失を有しない細胞からのＡＢと、欠失を有する細胞からのＢを表す）。いくつかの実施形態において、これら２つのバンドの分離は、欠失を有する細胞、ＤＮＡ又はＲＮＡの分率が高くなるにつれて、大きくなる。したがって、Ａ対立遺伝子の同一性を使用して、第１のハプロタイプを決定することができ、Ｂ対立遺伝子の同一性を使用して、第２のハプロタイプを決定することができる。

【0497】

重複を有するサンプルについて、重複を有する細胞（又はＤＮＡ若しくはＲＮＡ）について、ハプロタイプの過剰なコピーが存在する。重複した領域のこのハプロタイプは、標準的な方法を用いて決定され、この重複領域において増加した量で存在する対立遺伝子の同一性を決定することができるか、又は重複していない領域のハプロタイプが、標準的な方法を用いて決定され、減少した量で存在する対立遺伝子の同一性を決定することができる。１つのハプロタイプが決定されると、もう一方のハプロタイプは、推論によって決定することができる。

【0498】

重複を有する細胞（又はＤＮＡ若しくはＲＮＡ）と、重複を有しない欠失を有する細胞（又はＤＮＡ若しくはＲＮＡ）が両方とも存在するサンプルについても、欠失について上に記載したのと似た方法を用い、フェーズを決定することができる。例えば、ｘ軸が、染色体に沿った個々の遺伝子座の線形位置を表し、ｙ軸が、総（Ａ＋Ｂ）対立遺伝子リードの分率としてのＡ対立遺伝子リードの数を表す、プロットを作成することができる。欠失についてのいくつかの実施形態において、パターンは、個体がヘテロ接合性であるＳＮＰを表す２つの中央のバンドを含む（上側のバンドは、重複を有しない細胞からのＡＢと、重複を有する細胞からのＡＡＢを表し、下側のバンドは、重複を有しない細胞からのＡＢと、重複を有する細胞からのＡＢＢを表す）。いくつかの実施形態において、これら２つのバンドの分離は、重複を有する細胞、ＤＮＡ又はＲＮＡの分率が高くなるにつれて、大きくなる。したがって、Ａ対立遺伝子の同一性を使用して、第１のハプロタイプを決定することができ、Ｂ対立遺伝子の同一性を使用して、第２のハプロタイプを決定することができる。いくつかの実施形態において、１つ以上のＣＮＶ領域のフェーズ（例えば、測定された領域中の多型遺伝子座の少なくとも５０、６０、７０、８０、９０、９５又は１００％のフェーズ）は、がんを有することが知られている個体からのサンプル（例えば、腫瘍生検又は血漿サンプル）から決定され、がんの進行をモニタリングする（例えば、がんの寛解又は再発をモニタリングする）ために同じ個体からのその後のサンプルの分析に使用される。いくつかの実施形態において、腫瘍分率が高いサンプル（例えば、高い腫瘍負荷を有する個体からの腫瘍生検又は血漿サンプル）を使用して、より低い腫瘍分率を有するその後のサンプル（例えば、がんの治療を受けているか、又は寛解中の個体からの血漿サンプル）の分析に使用されるフェージングデータを得る。

【0499】

いくつかの実施形態において、本明細書に記載の方法のうちの２つ以上を用いて、個体の遺伝子データをフェージングする。いくつかの実施形態において、バイオインフォマティクス方法（例えば、集合に基づくハプロタイプ頻度を用い、最も可能性が高いフェーズを推定する）及び分子生物学的方法（例えば、バイオインフォマティクスに基づいて推論されたフェージングデータではなく、実際のフェージングデータを得るための本明細書に開示される分子フェージング方法のいずれか）が使用される。いくつかの実施形態において、他の被験体（例えば、以前の被験体）からのフェージングデータを使用して、集合のデータを絞り込む。例えば、他の被験体からのフェージングデータを集合のデータに加え、別の被験体についての可能なハプロタイプについての事前分布を計算することができる。いくつかの実施形態において、他の被験体（例えば、以前の被験体）からのフェージングデータを使用して、別の被験体についての可能なハプロタイプについての事前分布を計算する。

【0500】

いくつかの実施形態において、確率データが使用されてもよい。例えば、サンプル中のＤＮＡ分子の出現の確率的性質、及び様々な増幅及び測定バイアスに起因して、２つの異なる遺伝子座から、又は所与の遺伝子座にある異なる対立遺伝子から測定されたＤＮＡ分子の相対数は、必ずしも、混合物又は個体における分子の相対数を表すものではない。個体の血漿からのＤＮＡを配列決定することによって、常染色体上の所与の遺伝子座での正常二倍体個体の遺伝子型を決定しようと試みる場合、たった１つの対立遺伝子（ホモ接合性）又はほぼ等しい数の２つの対立遺伝子（ヘテロ接合性）のいずれかを観測することが予測されるだろう。その対立遺伝子で、Ａ対立遺伝子の１０個の分子が観測され、Ｂ対立遺伝子の２つの分子が観測される場合、その個体が、その遺伝子座でホモ接合性であり、Ｂ対立遺伝子の２つの分子がノイズ又はコンタミネーションに起因するものであったか、又はその個体がヘテロ接合性であり、少ない方の数のＢ対立遺伝子の分子は、血漿中のＤＮＡ分子の数におけるランダムな統計的変動、増幅バイアス、コンタミネーション又は任意の数の他の原因に起因するものであったかは、明らかではないだろう。この場合、その個体がホモ接合性であった確率と、その個体がヘテロ接合性であった対応する確率とを計算することができ、これらの確率的遺伝子型を更なる計算に使用することができる。

【0501】

なお、所与の対立遺伝子比率では、その比率が個体におけるＤＮＡ分子の比率を密接に表す尤度は、観測される分子の数が多いほど大きい。例えば、１００個のＡ分子と１００個のＢ分子を測定しようとする場合、実際の比率が５０％である尤度は、１０個のＡ分子と１０個のＢ分子を測定しようとする場合よりもかなり大きい。一実施形態において、データの詳細なモデルと組み合わせたベイズ理論を使用して、観測値を考慮して、特定の仮説が正しい尤度を決定する。例えば、トリソミー個体に対応する仮説と、ダイソミー個体に対応する仮説の２つの仮説を検討する場合、ダイソミー仮説が正しい確率は、２つの対立遺伝子の各々について１００個の分子が観測される場合の方が、２つの対立遺伝子の各々について１０個の分子が観測される場合と比較して、かなり高くなるだろう。バイアス、コンタミネーション又はいくつかの他のノイズ源に起因してデータにノイズが増えるにつれて、又は所与の遺伝子座での観測数が小さくなるにつれて、観測されたデータを考慮して、最大尤度仮説が真のものである確率は、低下する。実際には、最大尤度仮説が正しい仮説であると決定され得る信頼性を上げるために、多くの遺伝子座にわたって確率を集計することが可能である。いくつかの実施形態において、確率は、単に組換えを考慮せずに集計される。いくつかの実施形態において、計算は、クロスオーバーを考慮して行われる。

【0502】

一実施形態において、確率的にフェージングされたデータを、コピー数多型の決定に使用する。いくつかの実施形態において、確率的にフェージングされたデータは、ＨａｐＭａｐデータベースなどのデータソースからの集合に基づくハプロタイプブロック頻度データである。いくつかの実施形態において、確率的にフェージングされたデータは、分子方法、例えば、染色体の個々のセグメントが、反応当たり単一分子まで希釈されるが、統計的ノイズに起因して、ハプロタイプの同一性が絶対的には知ることができないような希釈によるフェージングによって得られるハプロタイプデータである。いくつかの実施形態において、確率的にフェージングされたデータは、分子方法によって得られるハプロタイプデータであり、ハプロタイプの同一性は、高い確実性をもって知ることが可能である。

【0503】

医師が、個体からの血漿ＤＮＡを測定することによって、個体が体内に特定の染色体セグメントに欠失を有するいくつかの細胞を有するかどうかを決定したいと考えたという仮想の場合を想像されたい。医師は、血漿ＤＮＡの由来となる細胞の全てが二倍体であり、同じ遺伝子型である場合、ヘテロ接合性遺伝子座について、２つの対立遺伝子座の各々について観測されるＤＮＡの相対的な分子数が、５０％のＡ対立遺伝子と５０％のＢ対立遺伝子を中心とした１つの分布に含まれるという知識を利用することができる。しかし、血漿ＤＮＡの由来となる細胞の一部が、特定の染色体セグメントに欠失を有する場合、ヘテロ接合性遺伝子座について、２つの対立遺伝子座の各々について観測されるＤＮＡの相対的な分子数が、２つの分布に含まれ、１つは、Ｂ対立遺伝子を含有する染色体セグメントが欠失した遺伝子座について５０％のＡ対立遺伝子を超えたところを中心としており、１つは、Ａ対立遺伝子を含有する染色体セグメントが欠失した遺伝子座について５０％未満のＡ対立遺伝子のところを中心としていると予想されるだろう。血漿ＤＮＡの由来となる細胞が欠失を含有する割合が大きいほど、これらの２つの分布は、５０％から更に離れるだろう。

【0504】

この仮説の場合、個体が、個体の体内にある細胞の一部の割合で染色体領域の欠失を有するかどうかを決定したい医師を想像されたい。医師は、個体からの血液をバキュテナー又は他の種類の血液チューブに抜き取り、血液を遠心分離し、血漿層を単離してもよい。医師は、血漿からＤＮＡを単離し、おそらく、標的化増幅又は他の増幅、遺伝子座捕捉技術、サイズ濃縮又は他の濃縮技術を用い、標的遺伝子座でＤＮＡを濃縮してもよい。医師は、ＳＮＰのセットで対立遺伝子の数を測定することによって、言い換えると、対立遺伝子頻度データを作成することによって、ｑＰＣＲ、配列決定、マイクロアレイ、又はサンプル中のＤＮＡの量を測定する他の技術などのアッセイを用い、濃縮及び／又は増幅したＤＮＡを分析してもよい。データ分析は、医師が標的化された増幅技術を使用して無細胞血漿ＤＮＡを増幅した場合に考慮され得、次いで、増幅したＤＮＡを配列決定して、がんの指標である染色体セグメント上で見出される６つのＳＮＰで、以下の例示的な可能なデータを得て、ここで、個体は、これらのＳＮＰでヘテロ接合性であった。

【0505】

ＳＮＰ１：４６０リードのＡ対立遺伝子、５４０リードのＢ対立遺伝子（４６％Ａ）

【0506】

ＳＮＰ２：５３０リードのＡ対立遺伝子、４７０リードのＢ対立遺伝子（５３％Ａ）

【0507】

ＳＮＰ３：４０リードのＡ対立遺伝子、６０リードのＢ対立遺伝子（４０％Ａ）

【0508】

ＳＮＰ４：４６リードのＡ対立遺伝子、５４リードのＢ対立遺伝子（４６％Ａ）

【0509】

ＳＮＰ５：５２０リードのＡ対立遺伝子、４８０リードのＢ対立遺伝子（５２％Ａ）

【0510】

ＳＮＰ６：２００リードのＡ対立遺伝子、２００リードのＢ対立遺伝子（５０％Ａ）

【0511】

このデータセットから、個体が正常であり、全ての細胞がダイソミーである場合、又は個体ががんを有する可能性があり、血漿中に見られる無細胞ＤＮＡに対してＤＮＡが寄与する細胞の一部が、染色体に欠失又は重複を有する場合を区別することは困難であろう。例えば、最大尤度を有する２つの仮説は、個体が、この染色体セグメントに欠失を有し、腫瘍分率が６％であり、染色体の欠失したセグメントが、（Ａ，Ｂ，Ａ，Ａ，Ｂ，Ｂ）又は（Ａ，Ｂ，Ａ，Ａ，Ｂ，Ａ）の６つのＳＮＰにわたって遺伝子型を有することであってもよい。ＳＮＰのセットにわたる個体の遺伝子型のこの表現において、括弧内の１つめの文字は、ＳＮＰ１についてのハプロタイプの遺伝子型に対応し、２番目はＳＮＰ２に対応する、など。

【0512】

その染色体セグメントでの個体のハプロタイプを決定する方法を使用しようとする場合、また、２つの染色体の１つについてのハプロタイプが（Ａ，Ｂ，Ａ，Ａ，Ｂ，Ｂ）であることを見出そうとし、これが最大尤度仮説に一致する場合、個体がそのセグメントに欠失を有する尤度の計算値、したがって、がん性細胞又は前がん細胞を有する可能性がある尤度の計算値は、かなり大きくなるだろう。一方で、個体がハプロタイプ（Ａ，Ａ，Ａ，Ａ，Ａ，Ａ）を有することがわかった場合、個体がその染色体セグメントに欠失を有する尤度は、かなり小さくなり、おそらく、欠失を有しない仮説の尤度が高くなるだろう（実際の尤度の値は、特に、この系で測定されるノイズなどの他のパラメータに依存するだろう）。

【0513】

個体のハプロタイプを決定する多くの方法が存在し、その多くは、本文書の別の箇所に記載されている。部分的なリストはここに挙げられているが、網羅的であることを意味していない。１つの方法は、各々の染色体領域から約１つの分子が所与の反応体積中に存在するまで、個々のＤＮＡ分子が希釈され、次いで、配列決定などの方法を使用して遺伝子型を測定する、生物学的方法である。別の方法は、様々なハプロタイプに関する集合データをその頻度と組み合わせたものを確率的な方法で使用することができる、情報学に基づく方法である。別の方法は、個体とハプロタイプブロックを共有し、ハプロタイプブロックを推論することが予想される、１名又は複数名の関連する個体とともに、個体の二倍体データを測定するものである。別の方法は、高濃度の欠失又は重複したセグメントを有する組織サンプルを採取し、対立遺伝子不均衡に基づいてハプロタイプを決定するものであり、例えば、欠失を有する腫瘍組織のサンプルからの遺伝子型測定を使用して、その欠失領域についてのフェージングデータを決定することができ、次いで、このデータを使用して、がんが切除後に再び成長しているかどうかを決定することができる。

【0514】

実際には、典型的には、２０個より多いＳＮＰ、５０個より多いＳＮＰ、１００個より多いＳＮＰ、５００個より多いＳＮＰ、１，０００個より多いＳＮＰ又は５，０００個より多いＳＮＰが、所与の染色体セグメント上で測定される。

【0515】

例示的な変異
ある疾患若しくは障害（例えばがん）又はある疾患若しくは障害（例えばがん）のリスク上昇（例えば、通常レベルのリスクより高い）に関連する例示的な変異としては、単一ヌクレオチドバリアント（ＳＮＶ）、複数ヌクレオチド変異、欠失（例えば、２００～３０００万塩基対領域の欠失）、重複又はタンデムリピートが挙げられる。いくつかの実施形態において、変異は、ＤＮＡ、例えば、ｃｆＤＮＡ、無細胞ミトコンドリアＤＮＡ（ｃｆｍＤＮＡ）、核ＤＮＡに由来する無細胞ＤＮＡ（ｃｆｎＤＮＡ）、細胞ＤＮＡ又はミトコンドリアＤＮＡの中にある。いくつかの実施形態において、変異は、ＲＮＡ、例えば、ｃｆＲＮＡ、細胞ＲＮＡ、細胞質ＲＮＡ、コード細胞質ＲＮＡ、非コード細胞質ＲＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ミトコンドリアＲＮＡ、ｒＲＮＡ又はｔＲＮＡの中にある。いくつかの実施形態において、変異は、ある疾患又は障害（例えばがん）を有する被験体において、その疾患又は障害（例えばがん）を有しない被験体よりも高い頻度で存在する。いくつかの実施形態において、変異は、がんの指標である（例えば、原因となる変異）。いくつかの実施形態において、変異は、疾患又は障害の原因的役割を有するドライバー変異である。いくつかの実施形態において、変異は、原因となる変異ではない。例えば、いくつかのがんでは、複数の変異が蓄積するが、そのうちのいくつかは、原因となる変異ではない。原因とならない変異（例えば、ある疾患又は障害を有する被験体において、その疾患又は障害を有しない被験体よりも高い頻度で存在するもの）も、その疾患又は障害を診断するのに有用であろう。いくつかの実施形態において、変異は、１つ以上のマイクロサテライトでのヘテロ接合性の消失（ＬＯＨ）である。

【0516】

いくつかの実施形態において、被験体は、被験体が有することが知られている多くの多型又は変異のうちの１つをスクリーニングする（例えば、その存在、これらの多型又は変異を有する細胞、ＤＮＡ又はＲＮＡの量の変化、又はがんの寛解又は再発を試験するために）。いくつかの実施形態において、被験体は、被験体がリスクがあることが知られている（例えば、その多型又は変異を有する血縁者を有する被験体）多くの多型又は変異のうちの１つをスクリーニングする。いくつかの実施形態において、被験体は、ある疾患又は障害（例えばがん）と関連する多型又は変異のパネルをスクリーニングする（例えば、少なくとも５、１０、５０、１００、２００、３００、５００、７５０、１，０００、１，５００、２，０００又は５，０００個の多型又は変異）。

【0517】

がんに関連する多くのコードバリアントは、Ａｂａａｎｅｔａｌ．，“ＴｈｅＥｘｏｍｅｓｏｆｔｈｅＮＣＩ－６０Ｐａｎｅｌ：ＡＧｅｎｏｍｉｃＲｅｓｏｕｒｃｅｆｏｒＣａｎｃｅｒＢｉｏｌｏｇｙａｎｄＳｙｓｔｅｍｓＰｈａｒｍａｃｏｌｏｇｙ”，ＣａｎｃｅｒＲｅｓｅａｒｃｈ，Ｊｕｌｙ１５，２０１３、及びｄｔｐ．ｎｃｉ．ｎｉｈ．ｇｏｖ／ｂｒａｎｃｈｅｓ／ｂｔｂ／ｃｈａｒａｃｔｅｒｉｚａｔｉｏｎＮＣＩ６０．ｈｔｍｌでのワールドワイドウェブ、各々、その全体が参照により本明細書に組み込まれる）に記載される。ＮＣＩ－６０ヒトがん細胞株パネルは、肺、結腸、脳、卵巣、乳房、前立腺及び腎臓のがん、並びに白血病及び黒色腫を表す６０種類の異なる細胞株からなる。これらの細胞株において特定された遺伝的変異は、正常な集合で見られるＩ型バリアントと、がんに特有のＩＩ型バリアントの２種類からなっていた。

【0518】

例示的な多型又は変異（例えば、欠失又は重複）は、以下の遺伝子のうちの１つ以上の中にある。ＴＰ５３、ＰＴＥＮ、ＰＩＫ３ＣＡ、ＡＰＣ、ＥＧＦＲ、ＮＲＡＳ、ＮＦ２、ＦＢＸＷ７、ＥＲＢＢｓ、ＡＴＡＤ５、ＫＲＡＳ、ＢＲＡＦ、ＶＥＧＦ、ＥＧＦＲ、ＨＥＲ２、ＡＬＫ、ｐ５３、ＢＲＣＡ、ＢＲＣＡ１、ＢＲＣＡ２、ＳＥＴＤ２、ＬＲＰ１Ｂ、ＰＢＲＭ、ＳＰＴＡ１、ＤＮＭＴ３Ａ、ＡＲＩＤ１Ａ、ＧＲＩＮ２Ａ、ＴＲＲＡＰ、ＳＴＡＧ２、ＥＰＨＡ３／５／７、ＰＯＬＥ、ＳＹＮＥ１、Ｃ２０ｏｒｆ８０、ＣＳＭＤ１、ＣＴＮＮＢ１、ＥＲＢＢ２。ＦＢＸＷ７、ＫＩＴ、ＭＵＣ４、ＡＴＭ、ＣＤＨ１、ＤＤＸ１１、ＤＤＸ１２、ＤＳＰＰ、ＥＰＰＫ１、ＦＡＭ１８６Ａ、ＧＮＡＳ、ＨＲＮＲ、ＫＲＴＡＰ４－１１、ＭＡＰ２Ｋ４、ＭＬＬ３、ＮＲＡＳ、ＲＢ１、ＳＭＡＤ４、ＴＴＮ、ＡＢＣＣ９、ＡＣＶＲ１Ｂ、ＡＤＡＭ２９、ＡＤＡＭＴＳ１９、ＡＧＡＰ１０、ＡＫＴ１、ＡＭＢＮ、ＡＭＰＤ２、ＡＮＫＲＤ３０Ａ、ＡＮＫＲＤ４０、ＡＰＯＢＲ、ＡＲ、ＢＩＲＣ６、ＢＭＰ２、ＢＲＡＴ１、ＢＴＮＬ８、Ｃ１２ｏｒｆ４、Ｃ１ＱＴＮＦ７、Ｃ２０ｏｒｆ１８６、ＣＡＰＲＩＮ２、ＣＢＷＤ１、ＣＣＤＣ３０、ＣＣＤＣ９３、ＣＤ５Ｌ、ＣＤＣ２７、ＣＤＣ４２ＢＰＡ、ＣＤＨ９、ＣＤＫＮ２Ａ、ＣＨＤ８、ＣＨＥＫ２、ＣＨＲＮＡ９、ＣＩＺ１、ＣＬＳＰＮ、ＣＮＴＮ６、ＣＯＬ１４Ａ１、ＣＲＥＢＢＰ、ＣＲＯＣＣ、ＣＴＳＦ、ＣＹＰ１Ａ２、ＤＣＬＫ１、ＤＨＤＤＳ、ＤＨＸ３２、ＤＫＫ２、ＤＬＥＣ１、ＤＮＡＨ１４、ＤＮＡＨ５、ＤＮＡＨ９、ＤＮＡＳＥ１Ｌ３、ＤＵＳＰ１６、ＤＹＮＣ２Ｈ１、ＥＣＴ２、ＥＦＨＢ、ＲＲＮ３Ｐ２、ＴＲＩＭ４９Ｂ、ＴＵＢＢ８Ｐ５、ＥＰＨＡ７、ＥＲＢＢ３、ＥＲＣＣ６、ＦＡＭ２１Ａ、ＦＡＭ２１Ｃ、ＦＣＧＢＰ、ＦＧＦＲ２、ＦＬＧ２、ＦＬＴ１、ＦＯＬＲ２、ＦＲＹＬ、ＦＳＣＢ、ＧＡＢ１、ＧＡＢＲＡ４、ＧＡＢＲＰ、ＧＨ２、ＧＯＬＧＡ６Ｌ１、ＧＰＨＢ５、ＧＰＲ３２、ＧＰＸ５、ＧＴＦ３Ｃ３、ＨＥＣＷ１、ＨＩＳＴ１Ｈ３Ｂ、ＨＬＡ－Ａ、ＨＲＡＳ、ＨＳ３ＳＴ１、ＨＳ６ＳＴ１、ＨＳＰＤ１、ＩＤＨ１、ＪＡＫ２、ＫＤＭ５Ｂ、ＫＩＡＡ０５２８、ＫＲＴ１５、ＫＲＴ３８、ＫＲＴＡＰ２１－１、ＫＲＴＡＰ４－５、ＫＲＴＡＰ４－７、ＫＲＴＡＰ５－４、ＫＲＴＡＰ５－５、ＬＡＭＡ４、ＬＡＴＳ１、ＬＭＦ１、ＬＰＡＲ４、ＬＰＰＲ４、ＬＲＲＦＩＰ１、ＬＵＭ、ＬＹＳＴ、ＭＡＰ２Ｋ１、ＭＡＲＣＨ１、ＭＡＲＣＯ、ＭＢ２１Ｄ２、ＭＥＧＦ１０、ＭＭＰ１６、ＭＯＲＣ１、ＭＲＥ１１Ａ、ＭＴＭＲ３、ＭＵＣ１２、ＭＵＣ１７、ＭＵＣ２、ＭＵＣ２０、ＮＢＰＦ１０、ＮＢＰＦ２０、ＮＥＫ１、ＮＦＥ２Ｌ２、ＮＬＲＰ４、ＮＯＴＣＨ２、ＮＲＫ、ＮＵＰ９３、ＯＢＳＣＮ、ＯＲ１１Ｈ１、ＯＲ２Ｂ１１、ＯＲ２Ｍ４、ＯＲ４Ｑ３、ＯＲ５Ｄ１３、ＯＲ８Ｉ２、ＯＸＳＭ、ＰＩＫ３Ｒ１、ＰＰＰ２Ｒ５Ｃ、ＰＲＡＭＥ、ＰＲＦ１、ＰＲＧ４、ＰＲＰＦ１９、ＰＴＨ２、ＰＴＰＲＣ、ＰＴＰＲＪ、ＲＡＣ１、ＲＡＤ５０、ＲＢＭ１２、ＲＧＰＤ３、ＲＧＳ２２、ＲＯＲ１、ＲＰ１１－６７１Ｍ２２．１、ＲＰ１３－９９６Ｆ３．４、ＲＰ１Ｌ１、ＲＳＢＮ１Ｌ、ＲＹＲ３、ＳＡＭＤ３、ＳＣＮ３Ａ、ＳＥＣ３１Ａ、ＳＦ１、ＳＦ３Ｂ１、ＳＬＣ２５Ａ２、ＳＬＣ４４Ａ１、ＳＬＣ４Ａ１１、ＳＭＡＤ２、ＳＰＴＡ１、ＳＴ６ＧＡＬ２、ＳＴＫ１１、ＳＺＴ２、ＴＡＦ１Ｌ、ＴＡＸ１ＢＰ１、ＴＢＰ、ＴＧＦＢＩ、ＴＩＦ１、ＴＭＥＭ１４Ｂ、ＴＭＥＭ７４、ＴＰＴＥ、ＴＲＡＰＰＣ８、ＴＲＰＳ１、ＴＸＮＤＣ６、ＵＳＰ３２、ＵＴＰ２０、ＶＡＳＮ、ＶＰＳ７２、ＷＡＳＨ３Ｐ、ＷＷＴＲ１、ＸＰＯ１、ＺＦＨＸ４、ＺＭＩＺ１、ＺＮＦ１６７、ＺＮＦ４３６、ＺＮＦ４９２、ＺＮＦ５９８、ＺＲＳＲ２、ＡＢＬ１、ＡＫＴ２、ＡＫＴ３、ＡＲＡＦ、ＡＲＦＲＰ１、ＡＲＩＤ２、ＡＳＸＬ１、ＡＴＲ、ＡＴＲＸ、ＡＵＲＫＡ、ＡＵＲＫＢ、ＡＸＬ、ＢＡＰ１、ＢＡＲＤ１、ＢＣＬ２、ＢＣＬ２Ｌ２、ＢＣＬ６、ＢＣＯＲ、ＢＣＯＲＬ１、ＢＬＭ、ＢＲＩＰ１、ＢＴＫ、ＣＡＲＤ１１、ＣＢＦＢ、ＣＢＬ、ＣＣＮＤ１、ＣＣＮＤ２、ＣＣＮＤ３、ＣＣＮＥ１、ＣＤ７９Ａ、ＣＤ７９Ｂ、ＣＤＣ７３、ＣＤＫ１２、ＣＤＫ４、ＣＤＫ６、ＣＤＫ８、ＣＤＫＮ１Ｂ、ＣＤＫＮ２Ｂ、ＣＤＫＮ２Ｃ、ＣＥＢＰＡ、ＣＨＥＫ１、ＣＩＣ、ＣＲＫＬ、ＣＲＬＦ２、ＣＳＦ１Ｒ、ＣＴＣＦ、ＣＴＮＮＡ１、ＤＡＸＸ、ＤＤＲ２、ＤＯＴ１Ｌ、ＥＭＳＹ（Ｃ１１ｏｒｆ３０）、ＥＰ３００、ＥＰＨＡ３、ＥＰＨＡ５、ＥＰＨＢ１、ＥＲＢＢ４、ＥＲＧ、ＥＳＲ１、ＥＺＨ２、ＦＡＭ１２３Ｂ（ＷＴＸ）、ＦＡＭ４６Ｃ、ＦＡＮＣＡ、ＦＡＮＣＣ、ＦＡＮＣＤ２、ＦＡＮＣＥ、ＦＡＮＣＦ、ＦＡＮＣＧ、ＦＡＮＣＬ、ＦＧＦ１０、ＦＧＦ１４、ＦＧＦ１９、ＦＧＦ２３、ＦＧＦ３、ＦＧＦ４、ＦＧＦ６、ＦＧＦＲ１、ＦＧＦＲ２、ＦＧＦＲ３、ＦＧＦＲ４、ＦＬＴ３、ＦＬＴ４、ＦＯＸＬ２、ＧＡＴＡ１、ＧＡＴＡ２、ＧＡＴＡ３、ＧＩＤ４（Ｃ１７ｏｒｆ３９）、ＧＮＡ１１、ＧＮＡ１３、ＧＮＡＱ、ＧＮＡＳ、ＧＰＲ１２４、ＧＳＫ３Ｂ、ＨＧＦ、ＩＤＨ１、ＩＤＨ２、ＩＧＦ１Ｒ、ＩＫＢＫＥ、ＩＫＺＦ１、ＩＬ７Ｒ、ＩＮＨＢＡ、ＩＲＦ４、ＩＲＳ２、ＪＡＫ１、ＪＡＫ３、ＪＵＮ、ＫＡＴ６Ａ（ＭＹＳＴ３）、ＫＤＭ５Ａ、ＫＤＭ５Ｃ、ＫＤＭ６Ａ、ＫＤＲ、ＫＥＡＰ１、ＫＬＨＬ６、ＭＡＰ２Ｋ２、ＭＡＰ２Ｋ４、ＭＡＰ３Ｋ１、ＭＣＬ１、ＭＤＭ２、ＭＤＭ４、ＭＥＤ１２、ＭＥＦ２Ｂ、ＭＥＮ１、ＭＥＴ、ＭＩＴＦ、ＭＬＨ１、ＭＬＬ、ＭＬＬ２、ＭＰＬ、ＭＳＨ２、ＭＳＨ６、ＭＴＯＲ、ＭＵＴＹＨ、ＭＹＣ、ＭＹＣＬ１、ＭＹＣＮ、ＭＹＤ８８、ＮＦ１、ＮＦＫＢＩＡ、ＮＫＸ２－１、ＮＯＴＣＨ１、ＮＰＭ１、ＮＲＡＳ、ＮＴＲＫ１、ＮＴＲＫ２、ＮＴＲＫ３、ＰＡＫ３、ＰＡＬＢ２、ＰＡＸ５、ＰＢＲＭ１、ＰＤＧＦＲＡ、ＰＤＧＦＲＢ、ＰＤＫ１、ＰＩＫ３ＣＧ、ＰＩＫ３Ｒ２、ＰＰＰ２Ｒ１Ａ、ＰＲＤＭ１、ＰＲＫＡＲ１Ａ、ＰＲＫＤＣ、ＰＴＣＨ１、ＰＴＰＮ１１、ＲＡＤ５１、ＲＡＦ１、ＲＡＲＡ、ＲＥＴ、ＲＩＣＴＯＲ、ＲＮＦ４３、ＲＰＴＯＲ、ＲＵＮＸ１、ＳＭＡＲＣＡ４、ＳＭＡＲＣＢ１、ＳＭＯ、ＳＯＣＳ１、ＳＯＸ１０、ＳＯＸ２、ＳＰＥＮ、ＳＰＯＰ、ＳＲＣ、ＳＴＡＴ４、ＳＵＦＵ、ＴＥＴ２、ＴＧＦＢＲ２、ＴＮＦＡＩＰ３、ＴＮＦＲＳＦ１４、ＴＯＰ１、ＴＰ５３、ＴＳＣ１、ＴＳＣ２、ＴＳＨＲ、ＶＨＬ、ＷＩＳＰ３、ＷＴ１、ＺＮＦ２１７、ＺＮＦ７０３、及びこれらの組み合わせ（Ｓｕｅｔａｌ．，ＪＭｏｌＤｉａｇｎ２０１１，１３：７４－８４；ＤＯＩ：１０．１０１６／ｊ．ｊｍｏｌｄｘ．２０１０．１１．０１０、及びＡｂａａｎｅｔａｌ．，“ＴｈｅＥｘｏｍｅｓｏｆｔｈｅＮＣＩ－６０Ｐａｎｅｌ：ＡＧｅｎｏｍｉｃＲｅｓｏｕｒｃｅｆｏｒＣａｎｃｅｒＢｉｏｌｏｇｙａｎｄＳｙｓｔｅｍｓＰｈａｒｍａｃｏｌｏｇｙ”、ＣａｎｃｅｒＲｅｓｅａｒｃｈ、２０１３年７月１５日、各々参照によりその全体が本明細書に組み込まれる）。いくつかの実施形態において、重複は、乳がんに関連付けられた染色体１ｐ（「Ｃｈｒ１ｐ」）の重複である。いくつかの実施形態において、１個以上の多型又は変異は、ＢＲＡＦにあり、例えば、Ｖ６００Ｅ変異である。いくつかの実施形態において、１個以上の多型又は変異は、Ｋ－ｒａｓにある。いくつかの実施形態において、Ｋ－ｒａｓ及びＡＰＣにおいて、１個以上の多型又は変異の組み合わせが存在する。いくつかの実施形態において、Ｋ－ｒａｓ及びｐ５３において、１個以上の多型又は変異の組み合わせが存在する。いくつかの実施形態において、ＡＰＣ及びｐ５３において、１個以上の多型又は変異の組み合わせが存在する。いくつかの実施形態において、Ｋ－ｒａｓ、ＡＰＣ及びｐ５３において、１個以上の多型又は変異の組み合わせが存在する。いくつかの実施形態において、Ｋ－ｒａｓ及びＥＧＦＲにおいて、１個以上の多型又は変異の組み合わせが存在する。例示的な多型又は変異は、以下のマイクロＲＮＡのうちの１つ以上にある。ｍｉＲ－１５ａ、ｍｉＲ－１６－１、ｍｉＲ－２３ａ、ｍｉＲ－２３ｂ、ｍｉＲ－２４－１、ｍｉＲ－２４－２、ｍｉＲ－２７ａ、ｍｉＲ－２７ｂ、ｍｉＲ－２９ｂ－２、ｍｉＲ－２９ｃ、ｍｉＲ－１４６、ｍｉＲ－１５５、ｍｉＲ－２２１、ｍｉＲ－２２２及びｍｉＲ－２２３（Ｃａｌｉｎｅｔａｌ．，“ＡｍｉｃｒｏＲＮＡｓｉｇｎａｔｕｒｅａｓｓｏｃｉａｔｅｄｗｉｔｈｐｒｏｇｎｏｓｉｓａｎｄｐｒｏｇｒｅｓｓｉｏｎｉｎｃｈｒｏｎｉｃｌｙｍｐｈｏｃｙｔｉｃｌｅｕｋｅｍｉａ．”ＮＥｎｇｌＪＭｅｄ３５３：１７９３－８０１、２００５、参照によりその全体が本明細書に組み込まれる）。

【0519】

いくつかの実施形態において、欠失は、少なくとも０．０１ｋｂ、０．１ｋｂ、１ｋｂ、１０ｋｂ、１００ｋｂ、１ｍｂ、２ｍｂ、３ｍｂ、５ｍｂ、１０ｍｂ、１５ｍｂ、２０ｍｂ、３０ｍｂ又は４０ｍｂの欠失である。いくつかの実施形態において、欠失は、１ｋｂ～４０ｍｂ、例えば、１ｋｂ～１００ｋｂ、１００ｋｂ～１ｍｂ、１～５ｍｂ、５～１０ｍｂ、１０～１５ｍｂ、１５～２０ｍｂ、２０～２５ｍｂ、２５～３０ｍｂ又は３０～４０ｍｂ（境界値を含む）の欠失である。

【0520】

いくつかの実施形態において、重複は、少なくとも０．０１ｋｂ、０．１ｋｂ、１ｋｂ、１０ｋｂ、１００ｋｂ、１ｍｂ、２ｍｂ、３ｍｂ、５ｍｂ、１０ｍｂ、１５ｍｂ、２０ｍｂ、３０ｍｂ又は４０ｍｂの重複である。いくつかの実施形態において、重複は、１ｋｂ～４０ｍｂ、例えば、１ｋｂ～１００ｋｂ、１００ｋｂ～１ｍｂ、１～５ｍｂ、５～１０ｍｂ、１０～１５ｍｂ、１５～２０ｍｂ、２０～２５ｍｂ、２５～３０ｍｂ又は３０～４０ｍｂ（境界値を含む）の重複である。

【0521】

いくつかの実施形態において、タンデムリピートは、２～６０ヌクレオチド、例えば、２～６、７～１０、１０～２０、２０～３０、３０～４０、４０～５０又は５０～６０ヌクレオチド（境界値を含む）の反復である。いくつかの実施形態において、タンデムリピートは、２ヌクレオチドの反復である（ジヌクレオチドリピート）。いくつかの実施形態において、タンデムリピートは、３ヌクレオチドの反復である（トリヌクレオチドリピート）。

【0522】

いくつかの実施形態において、多型又は変異は、予後因子である。例示的な予後変異としては、Ｋ－ｒａｓ変異、例えば、大腸がんにおける手術後の疾患再発の指標であるＫ－ｒａｓ変異が挙げられる（Ｒｙａｎｅｔａｌ．，“ＡｐｒｏｓｐｅｃｔｉｖｅｓｔｕｄｙｏｆｃｉｒｃｕｌａｔｉｎｇｍｕｔａｎｔＫＲＡＳ２ｉｎｔｈｅｓｅｒｕｍｏｆｐａｔｉｅｎｔｓｗｉｔｈｃｏｌｏｒｅｃｔａｌｎｅｏｐｌａｓｉａ：ｓｔｒｏｎｇｐｒｏｇｎｏｓｔｉｃｉｎｄｉｃａｔｏｒｉｎｐｏｓｔｏｐｅｒａｔｉｖｅｆｏｌｌｏｗｕｐ”、Ｇｕｔ５２：１０１－１０８，２００３、及びＬｅｃｏｍｔｅＴｅｔａｌ．，Ｄｅｔｅｃｔｉｏｎｏｆｆｒｅｅ－ｃｉｒｃｕｌａｔｉｎｇｔｕｍｏｒ－ａｓｓｏｃｉａｔｅｄＤＮＡｉｎｐｌａｓｍａｏｆｃｏｌｏｒｅｃｔａｌｃａｎｃｅｒｐａｔｉｅｎｔｓａｎｄｉｔｓａｓｓｏｃｉａｔｉｏｎｗｉｔｈｐｒｏｇｎｏｓｉｓ，”、ＩｎｔＪＣａｎｃｅｒ１００：５４２－５４８，２００２、各々、参照によりその全体が本明細書に組み込まれる）。

【0523】

いくつかの実施形態において、多型又は変異は、特定の治療に対する応答の変化（例えば、有効性又は副作用の増加又は減少）と関係がある。例としては、Ｋ－ｒａｓ変異は、非小細胞肺がんにおけるＥＧＦＲに基づく治療に対する応答の減少と関係がある（Ｗａｎｇｅｔａｌ．，“Ｐｏｔｅｎｔｉａｌｃｌｉｎｉｃａｌｓｉｇｎｉｆｉｃａｎｃｅｏｆａｐｌａｓｍａ－ｂａｓｅｄＫＲＡＳｍｕｔａｔｉｏｎａｎａｌｙｓｉｓｉｎｐａｔｉｅｎｔｓｗｉｔｈａｄｖａｎｃｅｄｎｏｎ－ｓｍａｌｌｃｅｌｌｌｕｎｇｃａｎｃｅｒ，”ＣｌｉｎＣａｎｃＲｅｓ１６：１３２４－１３３０，２０１０、参照によりその全体が本明細書に組み込まれる）。

【0524】

Ｋ－ｒａｓは、多くのがんにおいて活性化されるがん遺伝子である。例示的なＫ－ｒａｓ変異は、コドン１２、１３及び６１における変異である。Ｋ－ｒａｓｃｆＤＮＡ変異は、膵臓がん、肺がん、大腸がん、膀胱がん及び胃がんにおいて特定されている（Ｆｌｅｉｓｃｈｈａｃｋｅｒ及びＳｃｈｍｉｄｔ“Ｃｉｒｃｕｌａｔｉｎｇｎｕｃｌｅｉｃａｃｉｄｓ（ＣＮＡｓ）ａｎｄｃａｎｅｒ－ａｓｕｒｖｅｙ，”ＢｉｏｃｈｉｍＢｉｏｐｈｙｓＡｃｔａ１７７５：１８１－２３２，２００７、参照によりその全体が本明細書に組み込まれる）。

【0525】

ｐ５３は、多くのがんにおいて変異し、腫瘍の進行に寄与する、腫瘍抑制因子である（Ｌｅｖｉｎｅ及びＯｒｅｎ“Ｔｈｅｆｉｒｓｔ３０ｙｅａｒｓｏｆｐ５３：ｇｒｏｗｉｎｇｅｖｅｒｍｏｒｅｃｏｍｐｌｅｘ．ＮａｔｕｒｅＲｅｖＣａｎｃｅｒ，”９：７４９－７５８，２００９、参照によりその全体が本明細書に組み込まれる）。多くの異なるコドンが変異を受ける場合がある（例えば、Ｓｅｒ２４９）。ｐ５３ｃｆＤＮＡの変異は、乳がん、肺がん、卵巣がん、膀胱がん、胃がん、膵臓がん、大腸がん、腸がん及び肝細胞がんにおいて特定されている（Ｆｌｅｉｓｃｈｈａｃｋｅｒ及びＳｃｈｍｉｄｔ“Ｃｉｒｃｕｌａｔｉｎｇｎｕｃｌｅｉｃａｃｉｄｓ（ＣＮＡｓ）ａｎｄｃａｎｅｒ－ａｓｕｒｖｅｙ，”ＢｉｏｃｈｉｍＢｉｏｐｈｙｓＡｃｔａ１７７５：１８１－２３２，２００７、参照によりその全体が本明細書に組み込まれる）。

【0526】

ＢＲＡＦは、Ｒａｓの下流にあるがん遺伝子である。ＢＲＡＦ変異は、神経膠腫、黒色腫、甲状腺がん及び肺がんにおいて特定されている（Ｄｉａｓ－Ｓａｎｔａｇａｔａｅｔａｌ．，ＢＲＡＦＶ６００Ｅｍｕｔａｔｉｏｎｓａｒｅｃｏｍｍｏｎｉｎｐｌｅｏｍｏｒｐｈｉｃｘａｎｔｈｏａｓｔｒｏｃｙｔｏｍａ：ｄｉａｇｎｏｓｔｉｃａｎｄｔｈｅｒａｐｅｕｔｉｃｉｍｐｌｉｃａｔｉｏｎｓ．ＰＬＯＳＯＮＥ２０１１；６：ｅ１７９４８、２０１１；Ｓｈｉｎｏｚａｋｉｅｔａｌ．，ＵｔｉｌｉｔｙｏｆｃｉｒｃｕｌａｔｉｎｇＢ－ＲＡＦＤＮＡｍｕｔａｔｉｏｎｉｎｓｅｒｕｍｆｏｒｍｏｎｉｔｏｒｉｎｇｍｅｌａｎｏｍａｐａｔｉｅｎｔｓｒｅｃｅｉｖｉｎｇｂｉｏｃｈｅｍｏｔｈｅｒａｐｙ．ＣｌｉｎＣａｎｃＲｅｓ１３：２０６８－２０７４，２００７、及びＢｏａｒｄｅｔａｌ．，ＤｅｔｅｃｔｉｏｎｏｆＢＲＡＦｍｕｔａｔｉｏｎｓｉｎｔｈｅｔｕｍｏｒａｎｄｓｅｒｕｍｏｆｐａｔｉｅｎｔｓｅｎｒｏｌｌｅｄｉｎｔｈｅＡＺＤ６２４４（ＡＲＲＹ－１４２８８６）ａｄｖａｎｃｅｄｍｅｌａｎｏｍａｐｈａｓｅＩＩｓｔｕｄｙ．ＢｒｉｔＪＣａｎｃ２００９；１０１：１７２４－１７３０、各々、参照によりその全体が本明細書に組み込まれる）。ＢＲＡＦＶ６００Ｅ変異は、例えば、黒色腫の腫瘍において発生し、進行期において、更に一般的である。Ｖ６００Ｅ変異は、ｃｆＤＮＡにおいて検出されている。

【0527】

ＥＧＦＲは、細胞増殖に寄与し、多くのがんにおいて調節異常が起こる（ＤｏｗｎｗａｒｄＪ．ＴａｒｇｅｔｉｎｇＲＡＳｓｉｇｎａｌｌｉｎｇｐａｔｈｗａｙｓｉｎｃａｎｃｅｒｔｈｅｒａｐｙ．ＮａｔｕｒｅＲｅｖＣａｎｃｅｒ３：１１－２２、２００３、及びＬｅｖｉｎｅ及びＯｒｅｎ“Ｔｈｅｆｉｒｓｔ３０ｙｅａｒｓｏｆｐ５３：ｇｒｏｗｉｎｇｅｖｅｒｍｏｒｅｃｏｍｐｌｅｘ．ＮａｔｕｒｅＲｅｖＣａｎｃｅｒ，”９：７４９－７５８，２００９、参照によりその全体が本明細書に組み込まれる）。例示的なＥＧＦＲ変異としては、肺がん患者において特定されたエクソン１８～２１内の変異が挙げられる。ＥＧＦＲｃｆＤＮＡ変異は、肺がん患者において特定されている（Ｊｉａｅｔａｌ．“Ｐｒｅｄｉｃｔｉｏｎｏｆｅｐｉｄｅｒｍａｌｇｒｏｗｔｈｆａｃｔｏｒｒｅｃｅｐｔｏｒｍｕｔａｔｉｏｎｓｉｎｔｈｅｐｌａｓｍａ／ｐｌｅｕｒａｌｅｆｆｕｓｉｏｎｔｏｅｆｆｉｃａｃｙｏｆｇｅｆｉｔｉｎｉｂｔｒｅａｔｍｅｎｔｉｎａｄｖａｎｃｅｄｎｏｎ－ｓｍａｌｌｃｅｌｌｌｕｎｇｃａｎｃｅｒ，”ＪＣａｎｃＲｅｓＣｌｉｎＯｎｃｏｌ２０１０；１３６：１３４１－１３４７，２０１０、参照によりその全体が本明細書に組み込まれる）。

【0528】

乳がんに関連する例示的な多型又は変異としては、マイクロサテライトでのＬＯＨ（Ｋｏｈｌｅｒｅｔａｌ．“ＬｅｖｅｌｓｏｆｐｌａｓｍａｃｉｒｃｕｌａｔｉｎｇｃｅｌｌｆｒｅｅｎｕｃｌｅａｒａｎｄｍｉｔｏｃｈｏｎｄｒｉａｌＤＮＡａｓｐｏｔｅｎｔｉａｌｂｉｏｍａｒｋｅｒｓｆｏｒｂｒｅａｓｔｔｕｍｏｒｓ，”ＭｏｌＣａｎｃｅｒ８：ｄｏｉ：１０．１１８６／１４７６－４５９８－８－１０５，２００９、参照によりその全体が本明細書に組み込まれる）、ｐ５３変異（例えば、エクソン５～８内の変異）（Ｇａｒｃｉａｅｔａｌ．”ＥｘｔｒａｃｅｌｌｕｌａｒｔｕｍｏｒＤＮＡｉｎｐｌａｓｍａａｎｄｏｖｅｒａｌｌｓｕｒｖｉｖａｌｉｎｂｒｅａｓｔｃａｎｃｅｒｐａｔｉｅｎｔｓ，”Ｇｅｎｅｓ、Ｃｈｒｏｍｏｓｏｍｅｓ＆Ｃａｎｃｅｒ４５：６９２－７０１，２００６、参照によりその全体が本明細書に組み込まれる）、ＨＥＲ２（Ｓｏｒｅｎｓｅｎｅｔａｌ．“ＣｉｒｃｕｌａｔｉｎｇＨＥＲ２ＤＮＡａｆｔｅｒｔｒａｓｔｕｚｕｍａｂｔｒｅａｔｍｅｎｔｐｒｅｄｉｃｔｓｓｕｒｖｉｖａｌａｎｄｒｅｓｐｏｎｓｅｉｎｂｒｅａｓｔｃａｎｃｅｒ，”ＡｎｔｉｃａｎｃｅｒＲｅｓ３０：２４６３－２４６８，２０１０、参照によりその全体が本明細書に組み込まれる）、ＰＩＫ３ＣＡ、ＭＥＤ１及びＧＡＳ６多型又は変異（Ｍｕｒｔａｚａｅｔａｌ．“Ｎｏｎ－ｉｎｖａｓｉｖｅａｎａｌｙｓｉｓｏｆａｃｑｕｉｒｅｄｒｅｓｉｓｔａｎｃｅｔｏｃａｎｃｅｒｔｈｅｒａｐｙｂｙｓｅｑｕｅｎｃｉｎｇｏｆｐｌａｓｍａＤＮＡ，”Ｎａｔｕｒｅ２０１３；ｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１２０６５，２０１３、参照によりその全体が本明細書に組み込まれる）が挙げられる。

【0529】

ｃｆＤＮＡレベルの上昇及びＬＯＨは、全生存率及び無疾患生存率の低下と関係がある。ｐ５３変異（エクソン５～８）は、全生存率の低下と関係がある。循環ＨＥＲ２ｃｆＤＮＡレベルの低下は、ＨＥＲ２陽性乳がん被験体におけるＨＥＲ２を標的とした治療に対する応答が良くなることと関係がある。ＰＩＫ３ＣＡにおける活性化変異、ＭＥＤ１のトランケーション及びＧＡＳ６におけるスプライシング変異は、治療に対する耐性を引き起こす。

【0530】

大腸がんと関連する例示的な多型又は変異としては、ｐ５３、ＡＰＣ、Ｋ－ｒａｓ、並びにチミジル酸シンターゼの変異及びｐ１６遺伝子メチル化が挙げられる（Ｗａｎｇｅｔａｌ．“ＭｏｌｅｃｕｌａｒｄｅｔｅｃｔｉｏｎｏｆＡＰＣ、Ｋ－ｒａｓ、ａｎｄｐ５３ｍｕｔａｔｉｏｎｓｉｎｔｈｅｓｅｒｕｍｏｆｃｏｌｏｒｅｃｔａｌｃａｎｃｅｒｐａｔｉｅｎｔｓａｓｃｉｒｃｕｌａｔｉｎｇｂｉｏｍａｒｋｅｒｓ，”ＷｏｒｌｄＪＳｕｒｇ２８：７２１－７２６，２００４、Ｒｙａｎｅｔａｌ．“ＡｐｒｏｓｐｅｃｔｉｖｅｓｔｕｄｙｏｆｃｉｒｃｕｌａｔｉｎｇｍｕｔａｎｔＫＲＡＳ２ｉｎｔｈｅｓｅｒｕｍｏｆｐａｔｉｅｎｔｓｗｉｔｈｃｏｌｏｒｅｃｔａｌｎｅｏｐｌａｓｉａ：ｓｔｒｏｎｇｐｒｏｇｎｏｓｔｉｃｉｎｄｉｃａｔｏｒｉｎｐｏｓｔｏｐｅｒａｔｉｖｅｆｏｌｌｏｗｕｐ，”Ｇｕｔ５２：１０１－１０８，２００３、Ｌｅｃｏｍｔｅｅｔａｌ．“Ｄｅｔｅｃｔｉｏｎｏｆｆｒｅｅ－ｃｉｒｃｕｌａｔｉｎｇｔｕｍｏｒ－ａｓｓｏｃｉａｔｅｄＤＮＡｉｎｐｌａｓｍａｏｆｃｏｌｏｒｅｃｔａｌｃａｎｃｅｒｐａｔｉｅｎｔｓａｎｄｉｔｓａｓｓｏｃｉａｔｉｏｎｗｉｔｈｐｒｏｇｎｏｓｉｓ，”ＩｎｔＪＣａｎｃｅｒ１００：５４２－５４８，２００２、Ｓｃｈｗａｒｚｅｎｂａｃｈｅｔａｌ．“Ｍｏｌｅｃｕｌａｒａｎａｌｙｓｉｓｏｆｔｈｅｐｏｌｙｍｏｒｐｈｉｓｍｓｏｆｔｈｙｍｉｄｙｌａｔｅｓｙｎｔｈａｓｅｏｎｃｅｌｌ－ｆｒｅｅｃｉｒｃｕｌａｔｉｎｇＤＮＡｉｎｂｌｏｏｄｏｆｐａｔｉｅｎｔｓｗｉｔｈａｄｖａｎｃｅｄｃｏｌｏｒｅｃｔａｌｃａｒｃｉｎｏｍａ，”ＩｎｔＪＣａｎｃｅｒ１２７：８８１－８８８，２００９、各々、参照によりその全体が本明細書に組み込まれる）。血清中のＫ－ｒａｓ変異の手術後の検出は、疾患再発の強力な予測因子である。Ｋ－ｒａｓ変異及びｐ１６遺伝子メチル化の検出は、生存率の低下及び疾患再発の増加と関係がある。Ｋ－ｒａｓ、ＡＰＣ及び／又はｐ５３の変異の検出は、再発及び／又は転移と関係がある。ｃｆＤＮＡを用いたチミジル酸シンターゼ（フルオロピリミジンに基づく化学療法の標的）遺伝子における多型（ＬＯＨ、ＳＮＰ、様々な数のタンデムリピート及び欠失を含む）は、治療応答と関係がある可能性がある。

【0531】

肺がん（例えば、非小細胞肺がん）と関連する例示的な多型又は変異としては、Ｋ－ｒａｓ（例えば、コドン１２内の変異）及びＥＧＦＲ変異が挙げられる。例示的な予後変異としては、全生存率及び無憎悪生存率の増加に関連するＥＧＦＲ変異（エクソン１９の欠失又はエクソン２１の変異）及び無憎悪生存率の減少に関連するＫ－ｒａｓ変異（コドン１２及び１３内）が挙げられる（Ｊｉａｎｅｔａｌ．“Ｐｒｅｄｉｃｔｉｏｎｏｆｅｐｉｄｅｒｍａｌｇｒｏｗｔｈｆａｃｔｏｒｒｅｃｅｐｔｏｒｍｕｔａｔｉｏｎｓｉｎｔｈｅｐｌａｓｍａ／ｐｌｅｕｒａｌｅｆｆｕｓｉｏｎｔｏｅｆｆｉｃａｃｙｏｆｇｅｆｉｔｉｎｉｂｔｒｅａｔｍｅｎｔｉｎａｄｖａｎｃｅｄｎｏｎ－ｓｍａｌｌｃｅｌｌｌｕｎｇｃａｎｃｅｒ，”ＪＣａｎｃＲｅｓＣｌｉｎＯｎｃｏｌ１３６：１３４１－１３４７，２０１０、Ｗａｎｇｅｔａｌ．“Ｐｏｔｅｎｔｉａｌｃｌｉｎｉｃａｌｓｉｇｎｉｆｉｃａｎｃｅｏｆａｐｌａｓｍａ－ｂａｓｅｄＫＲＡＳｍｕｔａｔｉｏｎａｎａｌｙｓｉｓｉｎｐａｔｉｅｎｔｓｗｉｔｈａｄｖａｎｃｅｄｎｏｎ－ｓｍａｌｌｃｅｌｌｌｕｎｇｃａｎｃｅｒ，”ＣｌｉｎＣａｎｃＲｅｓ１６：１３２４－１３３０、２０１０、各々、参照によりその全体が本明細書に組み込まれる）。治療に対する応答の指標となる例示的な多型又は変異としては、治療に対する応答を改善するＥＧＦＲ変異（エクソン１９の欠失又はエクソン２１の変異）及び治療に対する応答を低下させるＫ－ｒａｓ変異（コドン１２及び１３）が挙げられる。ＥＦＧＲにおいて耐性を与える変異が特定されている（Ｍｕｒｔａｚａｅｔａｌ．“Ｎｏｎ－ｉｎｖａｓｉｖｅａｎａｌｙｓｉｓｏｆａｃｑｕｉｒｅｄｒｅｓｉｓｔａｎｃｅｔｏｃａｎｃｅｒｔｈｅｒａｐｙｂｙｓｅｑｕｅｎｃｉｎｇｏｆｐｌａｓｍａＤＮＡ，”Ｎａｔｕｒｅｄｏｉ：１０．１０３８／ｎａｔｕｒｅ１２０６５，２０１３、参照によりその全体が本明細書に組み込まれる）。

【0532】

黒色腫（例えば、ブドウ膜黒色腫）に関連する例示的な多型又は変異としては、ＧＮＡＱ、ＧＮＡ１１、ＢＲＡＦ及びｐ５３が挙げられる。例示的なＧＮＡＱ及びＧＮＡ１１変異としては、Ｒ１８３及びＱ２０９変異が挙げられる。ＧＮＡＱ又はＧＮＡ１１におけるＱ２０９変異は、骨への転移と関係がある。ＢＲＡＦＶ６００Ｅ変異は、転移／進行期黒色腫を有する患者で検出することができる。ＢＲＡＦＶ６００Ｅは、浸潤性黒色腫の指標である。化学療法後のＢＲＡＦＶ６００Ｅ変異の存在は、治療への応答がないことと関係がある。

【0533】

膵臓がん腫に関連する例示的な多型又は変異としては、Ｋ－ｒａｓ及びｐ５３（例えば、ｐ５３Ｓｅｒ２４９）における多型又は変異が挙げられる。ｐ５３Ｓｅｒ２４９は、Ｂ型肝炎感染及び肝細胞がん、並びに卵巣がん及び非ホジキンリンパ腫とも関係がある。

【0534】

サンプル中に低頻度で存在する多型又は変異であっても、本発明の方法を用いて検出することができる。例えば、１００万分の１の頻度で存在する多型又は変異は、１０００万個の配列決定リードを実施することによって、１０回観測することができる。所望な場合、配列決定リードの数は、所望な感度のレベルに応じて変更されてもよい。いくつかの実施形態において、サンプルを再分析するか、又はある被験体からの別のサンプルを、より多数の配列決定リードを用いて分析して、感度を向上させる。例えば、がん又はがんのリスク上昇に関連する多型又は変異が検出されないか、又は少数（例えば、１、２、３、４又は５）しか検出されない場合、そのサンプルを再分析するか、又は別のサンプルを試験する。

【0535】

いくつかの実施形態において、がん又は転移がんには、複数の多型又は変異が必要である。このような場合、複数の多型又は変異のスクリーニングは、がん又は転移がんを正確に診断する能力を向上させる。いくつかの実施形態において、被験体が、がん又は転移がんに必要な複数の多型又は変異の部分集合を有する場合、その被験体を後で再びスクリーニングして、その被験体が更なる変異を獲得するかどうかを調べることができる。

【0536】

複数の多型又は変異ががん又は転移がんに必要であるいくつかの実施形態において、各々の多型又は変異の頻度を、同様の頻度で発生するかどうかを見るために比較することができる。例えば、２つの変異ががんに必要である（「Ａ」及び「Ｂ」と示される）場合、一部の細胞は、どちらも有せず、一部の細胞はＡを有し、一部の細胞はＢを有し、一部の細胞は、ＡとＢを有する。Ａ及びＢが同様の頻度で観測される場合、被験体は、ＡとＢを両方とも有する一部の細胞を有する可能性が高い。Ａ及びＢが同様ではない頻度で観察される場合、被験体は、異なる細胞集合を有する可能性が高い。

【0537】

複数の多型又は変異ががん若しくは転移がんに必要であるいくつかの実施形態において、被験体に存在するこのような多型又は変異の数又は同一性を使用して、被験体が疾患又は障害を有する可能性がどれだけ高いか、又はどれだけ早いかを予測することができる。多型又は変異が特定の順序で発生する傾向があるいくつかの実施形態において、被験体が他の多型又は変異を獲得したかどうかを見るために周期的に試験されてもよい。

【0538】

いくつかの実施形態において、複数の多型又は変異（例えば、２、３、４、５、８、１０、１２、１５又はもっと多い）の有無を決定することは、ある疾患若しくは障害（例えばがん）の有無、又はある疾患若しくは障害（例えばがん）のリスク上昇の決定の感度及び／又は特異性を高める。

【0539】

いくつかの実施形態において、多型（複数可）又は変異（複数可）は、直接的に検出される。いくつかの実施形態において、多型（複数可）又は変異（複数可）は、その多型又は変異に結合する１つ以上の配列（例えば、ＳＮＰなどの多型遺伝子座）の検出によって、間接的に検出される。

【0540】

例示的な核酸変化
いくつかの実施形態において、ある疾患若しくは障害（例えばがん）又はある疾患若しくは障害（例えばがん）のリスク上昇に関連するＲＮＡ又はＤＮＡの完全性の変化（例えば、フラグメント化されたｃｆＲＮＡ又はｃｆＤＮＡの大きさの変化、又はヌクレオソーム組成の変化）が存在する。いくつかの実施形態において、ある疾患若しくは障害（例えばがん）又はある疾患若しくは障害（例えばがん）のリスク上昇に関連するＲＮＡ又はＤＮＡのメチル化パターンの変化（例えば、腫瘍抑制遺伝子の高メチル化）が存在する。例えば、腫瘍抑制遺伝子のプロモーター領域におけるＣｐＧアイランドのメチル化は、局所的な遺伝子サイレンシングの引き金となることが示唆されている。ｐ１６腫瘍抑制遺伝子の異常なメチル化が、肝臓がん、肺がん及び乳がんを有する被験体で生じる。他の頻繁にメチル化される腫瘍抑制遺伝子（ＡＰＣ、Ｒａｓ結合ドメインファミリータンパク質１Ａ（ＲＡＳＳＦ１Ａ）、グルタチオンＳ－トランスフェラーゼＰ１（ＧＳＴＰ１）及びＤＡＰＫを含む）は、様々な種類のがん、例えば、鼻咽頭がん腫、大腸がん、肺がん、食道がん、前立腺がん、膀胱がん、黒色腫及び急性白血病で検出されてきた。特定の腫瘍抑制遺伝子（例えばｐ１６）のメチル化は、がん形成における早期のイベントとして記載されているため、早期のがんスクリーニングに有用である。

【0541】

いくつかの実施形態において、メチル化感受性制限酵素消化を用いた重亜硫酸塩変換又は非重亜硫酸塩に基づく戦略を使用して、メチル化パターンを決定する（Ｈｕｎｇｅｔａｌ．，ＪＣｌｉｎＰａｔｈｏｌ６２：３０８－３１３，２００９、参照によりその全体が本明細書に組み込まれる）。重亜硫酸塩変換では、メチル化されたシトシンはシトシンとして残り、一方、メチル化されていないシトシンはウラシルに変換される。メチル化感受性制限酵素（例えば、ＢｓｔＵＩ）は、特定の認識部位（例えば、ＢｓｔＵＩの場合は５’－ＣＧＶＣＧ－３’）で、メチル化されていないＤＮＡ配列を開裂し、一方、メチル化された配列は、反応を受けない。いくつかの実施形態において、反応を受けなかったメチル化配列が検出される。いくつかの実施形態において、ステムループプライマーを使用して、酵素で消化されないメチル化ＤＮＡを一緒に増幅させることなく、制限酵素で消化されたメチル化されていないフラグメントを選択的に増幅する。

【0542】

ｍＲＮＡスプライシングの例示的な変化
いくつかの実施形態において、ｍＲＮＡスプライシングの変化は、ある疾患若しくは障害（例えばがん）又はある疾患若しくは障害（例えばがん）のリスク上昇に関連する。いくつかの実施形態において、ｍＲＮＡスプライシングの変化は、がん又はがんのリスク上昇に関連する以下の核酸のうちの１つ以上において生じる。ＤＮＭＴ３Ｂ、ＢＲＣＡ１、ＫＬＦ６、Ｒｏｎ又はＧｅｍｉｎ５。いくつかの実施形態において、検出されたｍＲＮＡスプライスバリアントは、ある疾患又は障害（例えばがん）に関連する。いくつかの実施形態において、複数のｍＲＮＡスプライスバリアントは、健康な細胞（例えば、非がん性細胞）によって作られるが、ｍＲＮＡスプライスバリアントの相対量の変化は、ある疾患又は障害（例えばがん）に関連する。いくつかの実施形態において、ｍＲＮＡスプライシングの変化は、ｍＲＮＡ配列の変化（例えば、スプライス部位中の変異）、スプライシング因子レベルの変化、利用可能なスプライシング因子の量の変化（例えば、反復に対するスプライシング因子の結合に起因する利用可能なスプライシング因子の量の減少）、スプライシング調節の変化又は腫瘍の微小環境に起因する。

【0543】

スプライシング反応は、スプライセオソームと呼ばれる複数タンパク質／ＲＮＡ複合体によって行われる（Ｆａｃｋｅｎｔｈａｌ１ａｎｄＧｏｄｌｅｙ，ＤｉｓｅａｓｅＭｏｄｅｌｓ＆Ｍｅｃｈａｎｉｓｍｓ１：３７－４２，２００８，ｄｏｉ：１０．１２４２／ｄｍｍ．０００３３１、その全体が参照により本明細書に組み込まれる）。スプライセオソームは、イントロン－エクソン境界を認識し、２つのエステル交換反応を介して、介在するイントロンを除去し、２つの隣接するエクソンをライゲーションする。この反応の忠実さは、絶妙なものでなければならない。なぜなら、ライゲーションが不正確に起こると、正常なタンパク質コード能力が損なわれる場合があるからである。例えば、エクソンスキッピングが、翻訳中のアミノ酸の同一性及び順序を示すトリプレットコドンのリーディングフレームを保存する場合、選択的スプライシングされるｍＲＮＡは、重要なアミノ酸残基を欠くタンパク質を示す場合がある。より一般的に、エクソンスキッピングは、翻訳リーディングフレームを乱し、未成熟終止コドンを生じる。これらのｍＲＮＡは、典型的には、ナンセンス変異依存ｍＲＮＡ分解として知られるプロセスによって少なくとも９０％が分解され、このような欠陥のあるメッセージが蓄積して、トランケーションされたタンパク質産物を生成する尤度を小さくする。誤ってスプライシングされたｍＲＮＡがこの経路から外れる場合、トランケーションされ、変異され、又は不安定なタンパク質が産生する。

【0544】

選択的スプライシングは、同じゲノムＤＮＡから、いくつか又は多くの異なる転写物を発現する手段であり、特定のタンパク質について利用可能なエクソンの部分集合を含むことから生じる。１つ以上のエクソンを除外することによって、特定のタンパク質ドメインは、コードされるタンパク質から失われる場合があり、タンパク質機能の消失又は増加を引き起こす場合がある。いくつかの種類の選択的スプライシングが記載されている：エクソンスキッピング、代替の５’又は３’スプライス部位、相互排他的なエクソン、及びかなりまれだが、イントロン保持。他者は、バイオインフォマティクス手法を用い、がんにおける選択的スプライシングの量を正常細胞と比較し、がんが正常細胞よりも低レベルの選択スプライシングを示すことを決定した。更に、選択スプライシングイベントの種類の分布は、がん細胞と正常細胞とでは異なっていた。がん細胞は、正常細胞よりも、エクソンスキッピングが少なかったが、より多くの代替の５’及び３’スプライス部位選択及びイントロン保持を示した。エクソン化の現象（他の組織によってイントロンとして主に使用される、エクソンとしての配列の使用）を調べると、がん細胞においてエクソン化に関連する遺伝子は、ｍＲＮＡプロセシングと優先的に関連付けられ、このことは、がん細胞と異常なｍＲＮＡスプライス形態の生成との間の直接的なつながりを示している。

【0545】

ＤＮＡ又はＲＮＡレベルの例示的な変化
いくつかの実施形態において、ＤＮＡ（例えば、ｃｆＤＮＡ、ｃｆｍＤＮＡ、ｃｆｎＤＮＡ、細胞ＤＮＡ又はミトコンドリアＤＮＡ）又はＲＮＡ（ｃｆＲＮＡ、細胞ＲＮＡ、細胞質ＲＮＡ、コード細胞質ＲＮＡ、非コード細胞質ＲＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ミトコンドリアＲＮＡ、ｒＲＮＡ又はｔＲＮＡ）のうちの１つ以上の種類の合計量又は濃度の変化が存在する。いくつかの実施形態において、１つ以上の特定のＤＮＡ（例えば、ｃｆＤＮＡ、ｃｆｍＤＮＡ、ｃｆｎＤＮＡ、細胞ＤＮＡ又はミトコンドリアＤＮＡ）又はＲＮＡ（ｃｆＲＮＡ、細胞ＲＮＡ、細胞質ＲＮＡ、コード細胞質ＲＮＡ、非コード細胞質ＲＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ミトコンドリアＲＮＡ、ｒＲＮＡ又はｔＲＮＡ）分子の量又は濃度の変化が存在する。いくつかの実施形態において、１つの対立遺伝子は、目的の遺伝子座の別の対立遺伝子よりも多く発現される。例示的なｍｉＲＮＡは、遺伝子の発現を調節する短い２０～２２ヌクレオチドのＲＮＡ分子である。いくつかの実施形態において、トランスクリプトームの変化、例えば、１つ以上のＲＮＡ分子の同一性又は量の変化が存在する。

【0546】

いくつかの実施形態において、ｃｆＤＮＡ又はｃｆＲＮＡの合計量又は濃度の変化は、ある疾患若しくは障害（例えばがん）又はある疾患若しくは障害（例えばがん）のリスク上昇に関連する。いくつかの実施形態において、ある種のＤＮＡ（例えば、ｃｆＤＮＡ、ｃｆｍＤＮＡ、ｃｆｎＤＮＡ、細胞ＤＮＡ又はミトコンドリアＤＮＡ）又はＲＮＡ（ｃｆＲＮＡ、細胞ＲＮＡ、細胞質ＲＮＡ、コード細胞質ＲＮＡ、非コード細胞質ＲＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ミトコンドリアＲＮＡ、ｒＲＮＡ又はｔＲＮＡ）の合計濃度は、健康な（例えば、非がん性）被験体のその種類のＤＮＡ又はＲＮＡの合計濃度と比較して、少なくとも２、３、４、５、６、７、８、９、１０倍、又はもっと多く増加する。いくつかの実施形態において、ｃｆＤＮＡの合計濃度が７５～１００ｎｇ／ｍＬ、１００～１５０ｎｇ／ｍＬ、１５０～２００ｎｇ／ｍＬ、２００～３００ｎｇ／ｍＬ、３００～４００ｎｇ／ｍｇＬ、４００～６００ｎｇ／ｍＬ、６００～８００ｎｇ／ｍＬ、８００～１，０００ｎｇ／ｍＬ（境界値を含む）であること、又はｃｆＤＮＡの合計濃度が１００ｎｇ／ｍＬより高く、例えば、２００、３００、４００、５００、６００、７００、８００、９００又は１，０００ｎｇ／ｍＬより高いことは、がん、がんのリスク上昇、良性ではなく悪性の腫瘍のリスク上昇、がんが寛解に向かう可能性の低下、又はがんの予後の悪化の指標である。いくつかの実施形態において、ある疾患若しくは障害（例えばがん）、又はある疾患若しくは障害（例えばがん）のリスク上昇に関連する１つ以上の多型又は変異（例えば、欠失又は重複）を有するある種のＤＮＡ（例えば、ｃｆＤＮＡ、ｃｆｍＤＮＡ、ｃｆｎＤＮＡ、細胞ＤＮＡ又はミトコンドリアＤＮＡ）又はＲＮＡ（ｃｆＲＮＡ、細胞ＲＮＡ、細胞質ＲＮＡ、コード細胞質ＲＮＡ、非コード細胞質ＲＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ミトコンドリアＲＮＡ、ｒＲＮＡ又はｔＲＮＡ）の量は、この種のＤＮＡ又はＲＮＡの合計量の少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１４、１６、１８、２０又は２５％である。いくつかの実施形態において、ある種のＤＮＡ（例えば、ｃｆＤＮＡ、ｃｆｍＤＮＡ、ｃｆｎＤＮＡ、細胞ＤＮＡ又はミトコンドリアＤＮＡ）又はＲＮＡ（ｃｆＲＮＡ、細胞ＲＮＡ、細胞質ＲＮＡ、コード細胞質ＲＮＡ、非コード細胞質ＲＮＡ、ｍＲＮＡ、ｍｉＲＮＡ、ミトコンドリアＲＮＡ、ｒＲＮＡ又はｔＲＮＡ）の合計量の少なくとも２、３、４、５、６、７、８、９、１０、１１、１２、１４、１６、１８、２０又は２５％は、ある疾患若しくは障害（例えばがん）、又はある疾患若しくは障害（例えばがん）のリスク上昇に関連する特定の多型又は変異（例えば、欠失又は重複）を有する。

【0547】

いくつかの実施形態において、ｃｆＤＮＡは、封入される。いくつかの実施形態において、ｃｆＤＮＡは、封入されない。

【0548】

いくつかの実施形態において、総ＤＮＡ中の腫瘍ＤＮＡの分率（例えば、総ｃｆＤＮＡ中の腫瘍ｃｆＤＮＡの分率又は総ｃｆＤＮＡ中の特定の変異を有する腫瘍ｃｆＤＮＡの分率）が決定される。いくつかの実施形態において、腫瘍ＤＮＡの分率は、複数の変異について決定されてもよく、変異は、単一ヌクレオチドバリアント、コピー数多型、異なるメチル化、又はこれらの組み合わせであってもよい。いくつかの実施形態において、腫瘍分率の計算値が最も高い１つの変異又は変異のセットについて計算された平均腫瘍分率は、サンプル中の実際の腫瘍分率であるとされる。いくつかの実施形態において、全ての変異について計算された平均腫瘍分率は、サンプル中の実際の腫瘍分率であるとされる。いくつかの実施形態において、この腫瘍分率を使用して、がんのステージを決定する（より高い腫瘍分率は、より進行したステージのがんと関連するため）。いくつかの実施形態において、より大きな腫瘍は、血漿中の腫瘍ＤＮＡの分率と相関関係がある可能性があるため、腫瘍分率を使用して、がんの大きさを決定する。いくつかの実施形態において、血漿サンプル中の腫瘍分率の測定値と所与の変異（複数可）遺伝子型を有する組織の大きさとの間に相関関係がある可能性があるため、腫瘍分率を使用して、単一又は複数の変異から影響を受けている腫瘍の割合の大きさを決定する。例えば、所与の変異遺伝子型を有する組織の大きさは、特定の変異に焦点を当てることによって計算され得る腫瘍ＤＮＡの分率と相関関係がある可能性がある。

【0549】

例示的なデータベース
本発明は、本発明の方法からの１つ以上の結果を含有するデータベースも特徴とする。例えば、データベースは、１名以上の被験体についての以下の情報のいずれかを含む記録を含んでいてもよい。特定される任意の多型／変異（例えばＣＮＶ）、多型／変異と、ある疾患若しくは障害又はある疾患若しくは障害のリスク上昇との任意の既知の関連性、コードされたｍＲＮＡ又はタンパク質の発現又は活性レベルに対する多型／変異の影響、サンプル中の総ＤＮＡ、ＲＮＡ又は細胞の中で、ある疾患若しくは障害に関連するＤＮＡ、ＲＮＡ又は細胞（例えば、ある疾患又は障害に関連する多型／変異を有するＤＮＡ、ＲＮＡ又は細胞）の分率、多型／変異を特定するために使用されるサンプルの供給源（例えば、血液サンプル、又は特定の組織からのサンプル）、疾患細胞の数、後で試験を繰り返して得られた結果（例えば、その疾患又は障害の進行又は寛解をモニタリングするための試験を繰り返す）、その疾患又は障害についての他の試験の結果、被験体が診断された疾患又は障害の種類、行われる治療、このような治療に対する応答、このような治療の副作用、症状（例えば、その疾患又は障害に関連する症状）、寛解の期間及び回数、生存期間（例えば、最初の試験から死亡するまでの期間、又は診断から死亡するまでの期間）、死因、及びこれらの組み合わせ。

【0550】

いくつかの実施形態において、データベースは、１名以上の被験体についての以下の情報のいずれかを含む記録を含む。特定される任意の多型／変異、多型／変異と、がん又はがんのリスク上昇との任意の既知の関連性、コードされたｍＲＮＡ又はタンパク質の発現又は活性レベルに対する多型／変異の影響、サンプル中の総ＤＮＡ、ＲＮＡ又は細胞の中で、がん性ＤＮＡ、ＲＮＡ又は細胞の分率、多型／変異を特定するために使用されるサンプルの供給源（例えば、血液サンプル、又は特定の組織からのサンプル）、がん性細胞の数、腫瘍の大きさ、後で試験を繰り返して得られた結果（例えば、がんの進行又は寛解をモニタリングするための試験を繰り返す）、がんについての他の試験の結果、被験体が診断されたがんの種類、行われる治療、このような治療に対する応答、このような治療の副作用、症状（例えば、がんに関連する症状）、寛解の期間及び回数、生存期間（例えば、最初の試験から死亡するまでの期間、又はがん診断から死亡するまでの期間）、死因、及びこれらの組み合わせ。いくつかの実施形態において、治療に対する応答は、以下のいずれかを含む。腫瘍（例えば、良性又はがん性腫瘍）の大きさが小さくなるか、又は安定化すること、腫瘍の大きさの増加が遅くなるか、又は防がれること、腫瘍細胞数が減るか、又は安定化すること、腫瘍の消失とその再出減との間の無疾患生存期間が長くなること、腫瘍の初期又はその後の発生が防がれること、腫瘍に関連する有害な症状が減るか、又は安定化すること、又はこれらの組み合わせ。いくつかの実施形態において、ある疾患又は障害（例えばがん）についての１つ以上の他の試験、例えば、組織サンプルのスクリーニング検査、医学的画像診断又は顕微鏡検査の結果が含まれる。

【0551】

このような一態様において、本発明は、少なくとも５、１０、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、又はもっと多くの記録を含む電子データベースを特徴とする。いくつかの実施形態において、データベースは、少なくとも５、１０、１０^２、１０^３、１０^４、１０^５、１０^６、１０^７、１０^８、又はもっと多くの異なる被験体についての記録を有する。

【0552】

別の態様において、本発明は、本発明のデータベースと、ユーザインターフェースとを含むコンピュータを特徴とする。いくつかの実施形態において、ユーザインターフェースは、１つ以上の記録に含有される情報の一部又は全てを表示することが可能である。いくつかの実施形態において、ユーザインターフェースは、（ｉ）記録がコンピュータに保存される、多型又は変異を含有すると特定された１種類以上のがん、（ｉｉ）記録がコンピュータに保存される、特定の種類のがんにおいて特定された１つ以上の多型又は変異、（ｉｉｉ）記録がコンピュータに保存される、特定の種類のがん又は特定の多型又は変異についての予後情報、（ｉｖ）記録がコンピュータに保存される、多型又は変異を有するがんに有用な１つ以上の化合物又は他の治療、（ｖ）記録がコンピュータに保存される、ｍＲＮＡ又はタンパク質の発現又は活性を調節する１つ以上の化合物、及び（ｖｉ）記録がコンピュータに保存される、発現又は活性が化合物によって調節される１つ以上のｍＲＮＡ分子又はタンパク質を表示することができる。コンピュータの内部構成要素は、典型的には、メモリに接続するプロセッサを含む。外部構成要素は、通常、マスストレージデバイス（例えば、ハードディスクドライブ）、ユーザ入力デバイス（例えば、キーボード及びマウス）、ディスプレイ（例えば、モニタ）と、場合により、コンピュータシステムを他のコンピュータに接続してデータの共有及びタスクの処理を可能にすることができるネットワークリンクを含む。プログラムは、操作中に、このシステムのメモリにロードされてもよい。

【0553】

別の態様において、本発明は、本発明の方法のいずれかの１つ以上の工程を含む、コンピュータに実装されたプロセスを特徴とする。

【0554】

例示的なリスク因子
いくつかの実施形態において、被験体は、ある疾患又は障害（例えばがん）の１つ以上のリスク因子についても評価される。例示的なリスク因子としては、その疾患又は障害の家族歴、生活習慣（例えば、喫煙及び発がん物質への曝露）、１つ以上のホルモン又は血清タンパク質のレベル（例えば、肝臓がんにおけるα－フェトプロテイン（ＡＦＰ）、大腸がんにおけるがん胎児性抗原（ＣＥＡ）又は前立腺がんにおける前立腺特異抗原（ＰＳＡ））が挙げられる。いくつかの実施形態において、腫瘍の大きさ及び／又は数が測定され、被験体の予後を決定するか、又は被験体の治療を選択する際に使用される。

【0555】

例示的なスクリーニング方法
所望な場合、ある疾患若しくは障害（例えばがん）の有無を確認することができるか、又はある疾患若しくは障害（例えばがん）は、任意の標準的な方法を用いて分類することができる。例えば、ある疾患又は障害（例えばがん）は、特定の徴候及び症状、腫瘍生検、スクリーニング検査又は医学的画像診断（例えば、マンモグラム又は超音波）を含む、いくつかの方法で検出することができる。可能性のあるがんが検出されたら、組織サンプルの顕微鏡検査によって診断されてもよい。いくつかの実施形態において、診断される被験体は、本発明の方法又はその疾患又は障害のための既知の検査を用い、複数のタイムポイントで繰り返し検査を受け、その疾患又は障害の進行又はその疾患又は障害の寛解又は再発をモニタリングする。

【0556】

例示的ながん
治療に対する応答を本発明の方法のいずれかを使用して予測又はモニタリングすることを可能にするために、診断され、予後判断され、安定化され、治療され、予防されることが可能な例示的ながんとしては、固形腫瘍、がん腫、肉腫、リンパ腫、白血病、生殖細胞腫瘍又は胚芽腫が挙げられる。様々な実施形態において、がんは、急性リンパ芽球性白血病、急性骨髄性白血病、副腎皮質がん腫、ＡＩＤＳ関連がん、ＡＩＤＳ関連リンパ腫、肛門がん、虫垂がん、星細胞腫（例えば、小児小脳又は大脳の星細胞腫）、基底細胞がん腫、胆管がん（例えば、肝外胆管がん）、膀胱がん、骨腫瘍（例えば、骨肉腫又は悪性線維性組織球腫）、脳幹グリオーマ、脳がん（例えば、小脳星細胞腫、大脳星細胞腫／悪性グリオーマ、上衣芽細胞腫、髄芽腫、テント上原始神経外胚葉腫瘍、又は視覚伝導路及び視床下部グリオーマ）、膠芽細胞腫、乳がん、気管支腺腫又はカルチノイド、バーキットリンパ腫、カルチノイド腫瘍（例えば、小児又は胃腸管のカルチノイド腫瘍）、がん腫、中枢神経系リンパ腫、小脳星細胞腫又は悪性グリオーマ（例えば、小児小脳星細胞腫又は悪性グリオーマ）、子宮頸がん、小児がん、慢性リンパ芽球性白血病、慢性骨髄性白血病、慢性骨髄増殖性障害、結腸がん、皮膚Ｔ細胞性リンパ腫、線維形成性小細胞腫瘍、子宮内膜がん、上衣腫、食道がん、ユーイング肉腫、ユーイングファミリーの腫瘍中の腫瘍、頭蓋外胚細胞腫瘍（例えば、小児頭蓋外胚細胞腫瘍）、性腺外胚細胞腫瘍、眼のがん（例えば、眼内黒色腫又は網膜芽細胞腫の眼のがん）、胆嚢がん、胃がん、胃腸カルチノイド腫瘍、消化管間質腫瘍、胚細胞腫瘍（例えば、頭蓋外、性腺外又は卵巣胚細胞腫瘍）、妊娠性絨毛性腫瘍、グリオーマ（例えば、脳幹、小児大脳星細胞腫、又は小児視覚伝導路及び視床下部グリオーマ）、胃カルチノイド、有毛細胞白血病、頭頸部がん、心臓がん、肝細胞（肝臓）がん、ホジキンリンパ腫、下咽頭がん、視床下部及び視覚伝導路グリオーマ（例えば、小児視覚伝導路グリオーマ）、島細胞がん腫（例えば、内分泌又は膵臓島細胞がん腫）、カポジ肉腫、腎臓がん、喉頭がん、白血病（例えば、急性リンパ芽球性、急性骨髄性、慢性リンパ性、慢性骨髄性又は有毛細胞白血病）、口唇又は口腔がん、脂肪肉腫、肝臓がん（例えば、非小細胞又は小細胞がん）、肺がん、リンパ腫（例えば、ＡＩＤＳ関連、バーキット、皮膚Ｔ細胞、ホジキン、非ホジキン、又は中枢神経系リンパ腫）、マクログロブリン血症（例えば、ワルデンシュトレームマクログロブリン血症、骨の悪性線維性組織球腫又は骨肉腫、髄芽腫（例えば、小児髄芽腫）、黒色腫、メルケル細胞がん腫、中皮腫（例えば、成人又は小児の中皮腫）、原発不明の転移性頸部扁平上皮がん、口がん（ｍｏｕｔｈｃａｎｃｅｒ）、多発性内分泌腫瘍症候群（例えば、小児多発性内分泌腫瘍症候群）、多発性骨髄腫又は形質細胞腫、菌状息肉腫、骨髄異形成症候群、骨髄増殖性新生物又は骨髄増殖性疾患、骨髄性白血病（例えば、慢性骨髄性白血病）、骨髄性白血病（例えば、成人急性又は小児急性骨髄性白血病）、骨髄増殖性障害（例えば、慢性骨髄増殖性障害）、鼻腔又は副鼻腔がん、鼻咽頭がん腫、神経芽細胞腫、口がん（ｏｒａｌｃａｎｃｅｒ）、口咽頭がん、骨肉腫又は骨の悪性線維性組織球腫、卵巣がん、上皮性卵巣がん、卵巣胚細胞腫瘍、卵巣低悪性度腫瘍、膵臓がん（例えば、膵島細胞がん）、副鼻腔又は鼻腔がん、副甲状腺がん、陰茎がん、咽頭がん、褐色細胞腫、松果体星細胞腫、松果体ジャーミノーマ、松果体芽腫又はテント上原始神経外胚葉性腫瘍（例えば、小児松果体芽腫又はテント上原始神経外胚葉性腫瘍）、下垂体腺腫、形質細胞腫、胸膜肺芽腫、原発性中枢神経系リンパ腫、がん、直腸がん、腎細胞がん腫、腎盂又は尿管がん（例えば、腎盂又は尿管移行上皮がん、網膜芽細胞腫、横紋筋肉腫（例えば、小児横紋筋肉腫）、唾液腺がん、肉腫（例えば、ユーイングファミリーの腫瘍中の腫瘍における肉腫、カポジ、軟組織又は子宮肉腫）、セザリー症候群、皮膚がん（例えば、非黒色腫、黒色腫又はメルケル細胞皮膚がん）、小腸がん、扁平上皮がん腫、テント上原始神経外胚葉性腫瘍（例えば、小児テント上原始神経外胚葉性腫瘍）、Ｔ細胞リンパ腫（例えば、皮膚Ｔ細胞性リンパ腫）、精巣がん、咽頭がん、胸腺腫（例えば、小児胸腺腫）、胸腺腫又は胸腺がん腫、甲状腺がん（例えば、小児甲状腺がん）、絨毛性腫瘍（例えば、妊娠性絨毛性腫瘍）、原発部位不明がん腫（例えば、成人又は小児の原発部位不明がん腫）、尿道がん（例えば、子宮体がん）、子宮肉腫、膣がん、視覚伝導路又は視床下部グリオーマ（例えば、小児視覚伝導路又は視床下部グリオーマ）、外陰がん、ワルデンシュトレームマクログロブリン血症、又はウィルムス腫瘍（例えば、小児ウィルムス腫瘍）である。様々な実施形態において、がんは、転移しているか、又は転移していない。

【0557】

がんは、ホルモンが関連するがん又はホルモン依存性がん（例えば、エストロゲン又はアンドロゲンが関連するがん）であってもよく、そうでなくてもよい。良性腫瘍又は悪性腫瘍は、本発明の方法及び／又は組成物を使用して、診断され、予後判断され、安定化され、治療され、予防されてもよい。

【0558】

いくつかの実施形態において、被験体は、がん症候群を有する。がん症候群は、１つ以上の遺伝子中の遺伝子変異が、罹患した個体でがんが発症する素因である、遺伝性障害であり、これらのがんの早期発症を引き起こす可能性もある。がん症候群は、がんを発症する生涯リスクが高いだけではなく、複数の独立した原発性腫瘍の発症も示すことが多い。これらの症候群の多くは、腫瘍抑制遺伝子、細胞ががん性化しないように保護することに関与する遺伝子の変異によって引き起こされる。影響を受け得る他の遺伝子は、ＤＮＡ修復遺伝子、がん遺伝子、及び血管の産生（血管新生）に関与する遺伝子である。遺伝性がん症候群の一般的な例は、遺伝性乳がん卵巣がん症候群及び遺伝性非ポリオーシス結腸がん（リンチ症候群）である。

【0559】

いくつかの実施形態において、１つ以上の多型又は変異ｎＫ－ｒａｓ、ｐ５３、ＢＲＡ、ＥＧＦＲ又はＨＥＲ２を有する被験体は、それぞれ、Ｋ－ｒａｓ、ｐ５３、ＢＲＡ、ＥＧＦＲ又はＨＥＲ２を標的とする治療が行われる。

【0560】

本発明の方法は、一般的に、任意の細胞、組織又は臓器型の悪性又は良性の腫瘍の治療に適用することができる。

【0561】

例示的な治療
所望な場合、ある疾患若しくは障害（例えばがん）、又はある疾患若しくは障害（例えばがん）のリスク上昇を安定化し、治療するか、又は予防するための任意の治療を、被験体（例えば、本発明の方法のいずれかを用いて、がん又はがんのリスク上昇を有すると特定された被験体）に行うことができる。様々な実施形態において、治療は、ある疾患又は障害（例えばがん）のための既知の治療又は治療の組み合わせであり、限定されないが、細胞毒性薬、標的療法、免疫療法、ホルモン療法、放射線療法、がん性細胞又はがん性になる可能性が高い細胞の手術による除去、幹細胞移植、骨髄移植、光力学療法、緩和治療、又はこれらの組み合わせを含む。いくつかの実施形態において、治療（例えば、予防内服）を使用して、ある疾患又は障害（例えばがん）のリスクが上昇した被験体において、ある疾患又は障害（例えばがん）を予防し、遅らせ、又は重篤度を下げる。いくつかの実施形態において、治療は、手術、第一選択の化学療法、アジュバント療法又はネオアジュバント療法である。

【0562】

いくつかの実施形態において、標的療法は、がんの成長及び生存に寄与するがん固有の遺伝子、タンパク質、又は組織環境を標的とする治療である。この種の治療は、正常細胞への損傷を制限しつつ、がん細胞の成長及び広がりを遮断し、通常は、他のがん治療薬よりも副作用が少なくなる。

【0563】

より成功した手法の１つは、血管新生（腫瘍周囲の新しい血管の成長）を標的とすることであった。標的療法、例えば、ベバシズマブ（アバスチン）、レナリドミド（レブラミド）、ソラフェニブ（ネクサバール）、スニチニブ（スーテント）及びサリドマイド（サロミド）は、血管新生を妨害する。別の例は、ＨＥＲ２を過剰発現するがん（例えば、ある種の乳がん）について、ＨＥＲ２を標的とする治療、例えば、トラスツズマブ又はラパチニブの使用である。いくつかの実施形態において、モノクローナル抗体を使用して、がん細胞の外側にある特異的標的を遮断する。例としては、アレムツズマブ（カンパス－１Ｈ）、ベバシズマブ、セツキシマブ（エルビタックス）、パニツムマブ（ベクティビックス）、ペルツズマブ（オムニターグ）、リツキシマブ（リツキサン）及びトラスツズマブが挙げられる。いくつかの実施形態において、モノクローナル抗体であるトシツモマブ（ベキサール）を使用して、腫瘍に放射線を送達する。いくつかの実施形態において、経口低分子は、がん細胞内部のがんプロセスを阻害する。例としては、ダサチニブ（スプリセル）、エルロチニブ（タルセバ）、ゲフィチニブ（イレッサ）、イマチニブ（グリーベック）、ラパチニブ（タイケルブ）、ニロチニブ（タシグナ）、ソラフェニブ、スニチニブ及びテムシロリムス（トーリセル）が挙げられる。いくつかの実施形態において、プロテアソーム阻害剤（例えば、多発性骨髄腫薬ボルテゾミブ（ベルケイド））は、特殊タンパク質と呼ばれる、細胞内の他のタンパク質を分解する酵素を妨害する。

【0564】

いくつかの実施形態において、免疫療法は、がんと戦うために身体の自然防御を高めるように設計される。例示的な種類の免疫療法は、免疫システム機能を増強し、標的とし、又は回復するために、体内又は研究所のいずれかで作られた物質を使用する。

【0565】

いくつかの実施形態において、ホルモン療法は、体内のホルモンの量を減少させることによってがんを治療する。ある種の乳がん及び前立腺がんを含むいくつかの種類のがんは、ホルモンと呼ばれる体内の天然化学物質の存在下でのみ成長し、広がる。様々な実施形態において、ホルモン療法は、前立腺、乳房、甲状腺及び生殖系のがんを治療するために使用される。

【0566】

いくつかの実施形態において、治療は、疾患骨髄が造血幹細胞と呼ばれる高度に専門化した細胞によって置き換えられる幹細胞移植を含む。造血幹細胞は、血液と骨髄の両方に見られる。

【0567】

いくつかの実施形態において、治療は、光増感剤と呼ばれる特殊な薬物を光とともに用いてがん細胞を死滅させる光力学療法を含む。この薬物は、特定の種類の光によって活性化された後に作用する。

【0568】

いくつかの実施形態において、治療は、がん性細胞又はがん性になる可能性が高い細胞の外科的除去（例えば、腫瘍摘出術又は乳房切除）を含む。例えば、乳がん感受性遺伝子変異（ＢＲＣＡ１又はＢＲＣＡ２遺伝子変異）を有する女性は、リスクを減らす卵管卵巣摘出（卵管及び卵巣の除去）及び／又はリスクを減らす両側乳房切除術（両方の乳房の除去）によって乳がん及び卵巣がんのリスクを減らし得る。いくつかのがんを治療することを含め、非常に慎重な手術作業のために、非常に強力で精密な光の束であるレーザを、刃物（メス）の代わりに使用することができる。

【0569】

がんを遅らせ、停止させ、又は除去するための治療（疾患指向治療とも呼ばれる）に加え、がんの治療の重要な部分は、被験体の症状及び副作用（例えば、疼痛及び吐き気）を緩和することである。緩和ケア又は支援ケアと呼ばれる手法で、身体的、感情的及び社会的な需要を有する被験体をサポートすることを含む。人々は、疾患指向療法と、症状をやわらげるための治療を同時に受けることが多い。

【0570】

例示的な治療としては、アクチノマイシンＤ、アドセトリス、アドリアマイシン、アルデスロイキン、アレムツズマブ、アリムタ、アムシジン、アムサクリン、アナストロゾール、アレディア、アリミデックス、アロマシン、アスパラギナーゼ、アバスチン、ベバシズマブ、ビカルタミド、ブレオマイシン、ボンドロナット、ボネフォス、ボルテゾミブ、ブシルベックス、ブスルファン、カンプト、カペシタビン、カルボプラチン、カルムスチン、カソデックス、セツキシマブ、チマックス（ｃｈｉｍａｘ）、クロラムブシル、シメチジン、シスプラチン、クラドリビン、クロドロン酸、クロファラビン、クリサンタスパーゼ、シクロホスファミド、酢酸シプロテロン、シプロスタット、シタラビン、シトキサン、ダカルボジン（ｄａｃａｒｂｏｚｉｎｅ）、ダクチノマイシン、ダサチニブ、ダウノルビシン、デキサメタゾン、ジエチルスチルベストロール、ドセタキセル、ドキソルビシン、ドロゲニル、エムシット、エピルビシン、エポシン、エルビタックス、エルロチニブ、エストラシット、エストラムスチン、エトポホス、エトポシド、エボルトラ、エキセメスタン、フェアストン、フェマーラ、フィルグラスチム、フルダラ、フルダラビン、フルオロウラシル、フルタミド、ゲフィニチブ、ゲムシタビン、ジェムザール、グリーベック、グリベック、ゴナペプチルデポ、ゴセレリン、ハラヴェン、ハーセプチン、ハイカムプチン、ヒドロキシカルバミド、イバンドロン酸、イブリツモマブ、イダルビシン、イフォスフォミド、インターフェロン、イマチニブメシル酸塩、イレッサ、イリノテカン、ジェブタナ、ランビス、ラパチニブ、レトロゾール、リューケラン、リュープロレリン、ロイスタット、ロムスチン、マブキャンパス、マブセラ、メガス、メゲストロール、メトトレキサート、ミトキサントロン、マイトマイシン、ムツラン（ｍｕｔｕｌａｎｅ）、ミレラン、ナベルビン、ニューラスタ、ニューポジェン、ネクサバール、ニペント、ノルバデックスＤ、ノバントロン、オンコビン、パクリタキセル、パミドロン酸、ＰＣＶ、ペメトレキセド、ペントスタチン、パージェタ、プロカルバジン、プロベンジ、プレドニゾロン、プロストラップ、ラルチトレキセド、リツキシマブ、スプリセル、ソラフェニブ、ソルタモックス、ストレプトゾトシン、スチルベストロール、スチムバックス、スニチニブ、スーテント、タブロイド、タガメット、タモフェン、タモキシフェン、タルセバ、タキソール、タキソテール、ウラシル含有テガフール、テモダール、テモゾロミド、サリドマイド、チオプレックス、チオテパ、チオグアニン、トムデックス、トポテカン、トレミフェン、トラスツズマブ、トレチノイン、トレオサルファン、トリエチレンチオホスホラミド、トリプトレリン、チバブ、ウフトラル（ｕｆｔｏｒａｌ）、ベルケイド、ベプシド、ベサノイド、ビンクリスチン、ビノレルビン、ザーコリ、ゼローダ、ヤーボイ、ザクティマ、ザノサー、ザベドス、ゼベリン、ゾラデックス、ゾレドロネート、ゾメタゾレドロン酸及びジチガが挙げられる。

【0571】

いくつかの実施形態において、がんは乳がんであり、個体に投与される治療又は化合物は、以下のうちの１つ以上である。アベマシクリブ、アブラキサン（パクリタキセルアルブミン安定化ナノ粒子製剤）、アドトラスツズマブエムタンシン、アフィニトール（エベロリムス）、アナストロゾール、アレディア（パミドロン酸二ナトリウム）、アリミデックス（アナストロゾール）、アロマシン（エキセメスタン）、カペシタビン、シクロホスファミド、ドセタキセル、ドキソルビシン塩酸塩、エレンス（エピルビシン塩酸塩）、エピルビシン塩酸塩、エリブリンメシル酸塩、エベロリムス、エキセメスタン、５－ＦＵ（フルオロウラシル注射液）、フェアストン（トレミフェン）、フェソロデックス（フルベストラント）、フェマーラ（レトロゾール）、フルオロウラシル注射液、フルベストラント、ゲムシタビン塩酸塩、ジェムザール（ゲムシタビン塩酸塩）、ゴセレリン酢酸塩、ハラヴェン（エリブリンメシル酸塩）、ハーセプチン（トラスツズマブ）、イブランス（パルボシクリブ）、イクサベピロン、イグゼンプラ（イクサベピロン）、カドサイラ（アドトラスツズマブエムタンシン）、キスカリ（リボシクリブ）、ラパチニブトシル酸塩、レトロゾール、リムパーザ（オラパリブ）、酢酸メゲストロール、メトトレキサート、ネラチニブマレイン酸塩、ネルリンクス（ネラチニブマレイン酸塩）、オラパリブ、パクリタキセル、パクリタキセルアルブミン安定化ナノ粒子製剤、パルボシクリブ、パミドロン酸二ナトリウム、パージェタ（ペルツズマブ）、ペルツズマブ、リボシクリブ、タモキシフェンクエン酸塩、タキソール（パクリタキセル）、タキソテール（ドセタキセル）、チオテパ、トレミフェン、トラスツズマブ、トレキサール（メトトレキサート）、タイケルブ（ラパチニブトシル酸塩）、ベージニオ（アベマシクリブ）、ビンブラスチン硫酸塩、ゼローダ（カペシタビン）、ゾラデックス（ゴセレリン酢酸塩）、エビスタ（ラロキシフェン塩酸塩）、ラロキシフェン塩酸塩、タモキシフェンクエン酸塩。いくつかの実施形態において、がんは乳がんであり、個体に投与される治療又は化合物は、以下から選択される組み合わせである。ドキソルビシン塩酸塩（アドリアマイシン）及びシクロホスファミド；ドキソルビシン塩酸塩（アドリアマイシン）、シクロホスファミド及びパクリタキセル（タキソール）；ドキソルビシン塩酸塩（アドリアマイシン）、シクロホスファミド及びフルオロウラシル；メトトレキサート、シクロホスファミド及びフルオロウラシル；エピルビシン塩酸塩、シクロホスファミド及びフルオロウラシル；並びにドキソルビシン塩酸塩（アドリアマイシン）、シクロホスファミド及びドセタキセル（タキソテール）。

【0572】

ｍＲＮＡ又はタンパク質の変異体形態（例えば、がんに関連する形態）及び野生型形態（例えば、がんに関連しない形態）の両方を発現する被験体について、治療は、好ましくは、野生型形態の発現又は活性を阻害するのより更に少なくとも２倍、５倍、１０倍又は２０倍多く変異体形態の発現又は活性を阻害する。複数の治療薬の同時使用又は逐次使用は、がんの発生を大幅に減らし、治療に対して耐性となる治療されるがんの数を減らし得る。これに加えて、併用療法の一部として使用される治療薬は、がんを治療するために、治療薬を単独で使用する場合に必要な対応する用量よりも低い用量しか必要としないだろう。併用療法における各化合物の用量が低いことは、その化合物からの潜在的な有害な副作用の重篤度を下げる。

【0573】

いくつかの実施形態において、がんのリスクが上昇していると特定された被験体は、本発明又は任意の標準的な方法によって、特定のリスク因子を避けてもよく、又はがんの任意の更なるリスクを減らすために生活習慣を変えてもよい。

【0574】

いくつかの実施形態において、多型、変異、リスク因子、又はこれらの任意の組み合わせを使用して、被験体の治療レジメンを選択する。いくつかの実施形態において、がんのリスクが高いか、又は予後が悪い被験体に対して、用量を増やした治療又は回数を増やした治療が選択される。

【0575】

個々の療法又は併用療法に含めるための他の化合物
所望な場合、ある疾患若しくは障害（例えばがん）、又はある疾患若しくは障害（例えばがん）のリスク上昇を安定化し、治療するか、又は予防するための更なる化合物が、当該技術分野で既知の方法に従って、天然産物又は合成（又は半合成）の抽出物又は化学ライブラリの大きなライブラリから特定されてもよい。当該分野又は薬物の発見及び開発の分野の当業者は、試験抽出物又は化合物の正確な供給源が本発明の方法にとって重要ではないことを理解するだろう。したがって、実質的に、任意の数の化学抽出物又は化合物が、特定の種類のがん又は特定の被験体に由来する細胞に対する効果についてスクリーニングされてもよく、又はがんに関連する分子（例えば、特定の種類のがんにおいて活性又は発現が変化することが知られているがんに関連する分子）の活性又は発現に対する効果についてスクリーニングされてもよい。粗抽出物が、がんに関連する分子の活性又は発現を調節することがわかっている場合、陽性なリード化合物の更なる分画を行い、当該技術分野で既知の方法を用い、観測された効果の原因となる化学構成物質を単離してもよい。

【0576】

療法の試験のための例示的なアッセイ及び動物モデル
所望な場合、本明細書に開示される治療のうちの１つ以上は、細胞株（例えば、本発明の方法を用いて、がん又はがんのリスク上昇を有すると診断された被験体において特定された変異のうちの１つ以上を有する細胞株）を用い、又はある疾患又は障害の動物モデル、例えば、ＳＣＩＤマウスモデルを用い、ある疾患又は障害（例えばがん）に対するその効果について試験してもよい（Ｊａｉｎｅｔａｌ．ＴｕｍｏｒＭｏｄｅｌｓＩｎＣａｎｃｅｒＲｅｓｅａｒｃｈ，ｅｄ．Ｔｅｉｃｈｅｒ，ＨｕｍａｎａＰｒｅｓｓＩｎｃ．，Ｔｏｔｏｗａ，Ｎ．Ｊ．，ｐｐ．６４７－６７１，２００１、参照によりその全体が本明細書に組み込まれる）。これに加えて、ある疾患若しくは障害（例えばがん）、又はある疾患若しくは障害（例えばがん）のリスク上昇を安定化し、治療するか、又は予防するための特定の療法の有効性を決定するために使用可能な多くの標準的なアッセイ及び動物モデルが存在する。療法は、標準的なヒト臨床試験において試験することもできる。

【0577】

特定の被験体に対して好ましい療法の選択のために、化合物を、被験体において変異する１つ以上の遺伝子に対する発現又は活性に対して化合物が及ぼす効果について試験することができる。例えば、ある化合物が特定のｍＲＮＡ分子又はタンパク質の発現を調節する能力は、標準的なノーザン、ウエスタン又はマイクロアレイ分析を用いて検出することができる。いくつかの実施形態において、（ｉ）被験体において（例えば被験体からのサンプルにおいて）正常レベルより高いレベルで発現するか、又は正常レベルよりも高い活性レベルを有するがんを促進するｍＲＮＡ分子又はタンパク質の発現又は活性を抑制するか、又は（ｉｉ）被験体において正常レベルより低いレベルで発現するか、又は正常レベルよりも低い活性レベルを有するがんを抑制するｍＲＮＡ分子又はタンパク質の発現又は活性を促進する１つ以上の化合物が選択される。（ｉ）被験体におけるがんに関連する変異を有するｍＲＮＡ分子又はタンパク質の最大数を調節し、（ｉｉ）被験体におけるがんに関連する変異を有しないｍＲＮＡ分子又はタンパク質の最小数を調節する、個々の治療又は併用療法。いくつかの実施形態において、選択された個々の療法又は併用療法は、高い薬物有効性を有し、もしあるにしても、有害な副作用はほとんど生じない。

【0578】

上に記載した被験体特異的な分析の代替として、ＤＮＡチップを使用して、特定の種類の初期又は後期のがん（例えば、乳がん細胞）におけるｍＲＮＡ分子の発現を、正常組織における発現と比較することができる（Ｍａｒｒａｃｋｅｔａｌ．，ＣｕｒｒｅｎｔＯｐｉｎｉｏｎｉｎＩｍｍｕｎｏｌｏｇｙ１２，２０６－２０９，２０００、Ｈａｒｋｉｎ，Ｏｎｃｏｌｏｇｉｓｔ．５：５０１－５０７，２０００、Ｐｅｌｉｚｚａｒｉｅｔａｌ．，ＮｕｃｌｅｉｃＡｃｉｄｓＲｅｓ．２８（２２）：４５７７－４５８１，２０００、各々、その全体が参照により本明細書に組み込まれる）。この分析に基づき、この腫のがんを有する被験体についての個々の療法又は併用療法を選択して、この種のがんにおいて発現が変化したｍＲＮＡ又はタンパク質の発現を調節することができる。

【0579】

特定の被験体又は被験体群のための療法を選択するために使用されることに加え、発現プロファイリングを使用して、治療中に生じるｍＲＮＡ及び／又はタンパク質の発現の変化をモニタリングすることができる。例えば、発現プロファイリングを使用して、がん関連遺伝子の発現が正常レベルに戻ったかどうかを決定することができる。戻っていない場合、対応するがん関連遺伝子の発現レベルに対するその療法の効果を上げるか、又は下げるように、その療法における１つ以上の化合物の用量を変更してもよい。これに加えて、この分析を使用して、ある療法が他の遺伝子（例えば、有害な副作用に関連する遺伝子）の発現に影響を与えるかどうかを決定することができる。所望な場合、療法の用量又は組成を変更して、望ましくない副作用を防ぐか、又は減らすことができる。

【0580】

例示的な製剤及び投与方法
ある疾患若しくは障害（例えばがん）、又はある疾患若しくは障害（例えばがん）のリスク上昇を安定化し、治療するか、又は予防するために、当業者に既知の任意野方法を用い、組成物が製剤化され、投与されてもよい（例えば、各々参照によりその全体が本明細書に組み込まれる米国特許第８，３８９，５７８号及び第８，３８９，５５７号を参照）。製剤及び投与のための一般的な技術は、“Ｒｅｍｉｎｇｔｏｎ：ＴｈｅＳｃｉｅｎｃｅａｎｄＰｒａｃｔｉｃｅｏｆＰｈａｒｍａｃｙ，”２１ｓｔＥｄｉｔｉｏｎ，Ｅｄ．ＤａｖｉｄＴｒｏｙ，２００６、ＬｉｐｐｉｎｃｏｔｔＷｉｌｌｉａｍｓ＆Ｗｉｌｋｉｎｓ，Ｐｈｉｌａｄｅｌｐｈｉａ，Ｐａ．の中に見出され、参照によりその全体が本明細書に組み込まれる。液体、スラリー、錠剤、カプセル、丸薬、粉末、顆粒、ゲル、軟膏、座薬、注射剤、吸入剤及びエアロゾルは、このような製剤の例である。一例として、放出性が改変されたか、又は徐放性の経口製剤は、当該技術分野で既知の更なる方法を用いて調製することができる。例えば、活性成分の好適な徐放性形態は、マトリックス錠剤又はカプセル組成物であってもよい。好適なマトリックス形成材料としては、例えば、ワックス（例えば、カルナウバ、ミツロウ、パラフィンワックス、セレシン、シェラックロウ、脂肪酸及び脂肪族アルコール）、油、硬化油又は脂肪（例えば、硬化菜種子油、ヒマシ油、牛脂、ヤシ油及び大豆油）、並びにポリマー（例えば、ヒドロキシプロピルセルロース、ポリビニルピロリドン、ヒドロキシプロピルメチルセルロース及びポリエチレングリコール）が挙げられる。他の好適なマトリックス錠剤化材料は、微結晶セルロース、粉末セルロース、ヒドロキシプロピルセルロース、エチルセルロース、他の担体を含むもの、及び充填剤である。錠剤には、粒状物、コーティングされた粉末又はペレットも含有されている場合がある。錠剤はまた、多層であってもよい。場合により、最終的な錠剤は、コーティングされていてもよく、又はコーティングされていなくてもよい。

【0581】

このような組成物を投与する典型的な経路としては、限定されないが、経口、舌下、口腔、局所、経皮、吸入、非経口（例えば、皮下、静脈内、筋肉内、胸骨内注射又は注入技術）、直腸、膣及び経鼻が挙げられる。好ましい実施形態において、療法は、徐放デバイスを用いて行われる。本発明の組成物は、組成物の投与時に、その中に含有される活性成分（複数可）が生体利用可能になるように製剤化される。組成物は、１つ以上の投与単位の形態をとっていてもよい。組成物は、１、２、３、４種類又は更に多い活性成分を含有していてもよく、場合により、１、２、３、４種類又は更に多い不活性成分を含有していてもよい。

【0582】

代替的な実施形態
本明細書に記載される方法のいずれかは、例えば、コンピュータ画面上又は印刷した紙の上などの物理的なフォーマットでのデータの出力を含んでいてもよい。本明細書の方法のいずれかは、医師によって作業され得るフォーマットで、作業可能なデータの出力と組み合わせられてもよい。標的個体に関する遺伝子データを決定するための本文書に記載される実施形態のいくつかは、医療従事者によって、潜在的な染色体異常（例えば、欠失又は重複）、又はそれを欠くことの通知と組み合わせられてもよい。本明細書に記載される実施形態のいくつかは、作業可能なデータの出力、臨床的な治療をもたらす臨床決定の実施、又は何の行動も取らないという臨床決定の実施と組み合わせられてもよい。

【0583】

いくつかの実施形態において、本発明の任意の方法の結果（例えば、欠失又は重複の有無）を開示する報告書を作成するための方法が本明細書で開示される。本発明の方法から得られた結果を用いて報告書を作成してもよく、これを医師に電子的に送信し、出力デバイスで表示し（例えば、デジタル報告書）、又は書面による報告書（例えば、報告書の印刷されたハードコピー）が医師に届けられてもよい。これに加えて、記載される方法は、臨床的な治療をもたらす臨床決定の実際の実施、又は何の行動も取らないという臨床決定の実施と組み合わせられてもよい。

【0584】

特定の実施形態において、本発明は、本明細書に開示されるマルチプレックスＰＣＲ方法を用い、同じサンプルからＣＮＶ及びＳＮＶを両方とも検出するための、試薬、キット及び方法、並びにこのような方法を行うためのコード化された命令を含むコンピュータシステム及びコンピュータ媒体を提供する。特定の好ましい実施形態において、サンプルは、循環腫瘍ＤＮＡを含有することが疑われる単一細胞サンプル又は血漿サンプルである。これらの実施形態は、特に、乳がん、卵巣がん及び肺がんなどのＣＮＶを示すがんについて、本明細書に開示される高感度マルチプレックスＰＣＲ方法を用いて、ＣＮＶ及びＳＮＶについて単一細胞又は血漿からのＤＮＡサンプルを調べることによって、ＣＮＶ又はＳＮＶのいずれかのみについて調べる場合と比べて、改良されたがん検出を達成することができるという発見を利用したものである。本方法は、ＣＮＶを分析する特定の例示的な実施形態において、５０～１００，０００個、又は５０～１０，０００個、又は５０～１，０００個のＳＮＰを調べ、ＳＮＶについて、５０～１０００個のＳＮＶ、又は５０～５００個のＳＮＶ、又は５０～２５０個のＳＮＶを調べる。例えば、ＣＮＶ及びＳＮＶを示すことが知られているがん、例えば、乳がん、肺がん及び卵巣がんを含むがんを有することが疑われる被験体の血漿中のＣＮＶ及び／又はＳＮＶを検出するための本明細書で提供される方法は、遺伝子組成という観点で、不均一ながん細胞集合で構成されることが多い腫瘍からＣＮＶ及び／又はＳＮＶを検出するという利点を提供する。したがって、腫瘍の特定の領域のみを分析することに焦点を当てた従来の方法は、腫瘍の他の領域にある細胞に存在するＣＮＶ又はＳＮＶを見落としてしまうことが多い。血漿サンプルは、液体生検として機能し、これを調べ、腫瘍細胞の部分集合にのみ存在するＣＮＶ及び／又はＳＮＶのいずれかを検出することができる。

【0585】

以下の実施例は、当業者に本明細書で提供される実施形態の使用方法の完全な開示及び説明を提供するために示されるのであって、本開示の範囲を限定することを意図したものではなく、以下の実施例が、行われる全ての実験又は唯一の実験であることを表すことを意図していない。使用される数字（例えば、量、温度など）に対する正確性を確保する努力がなされているが、ある程度の実験誤差及び偏差が考慮されるべきである。別段の指定がない限り、部は体積部であり、温度は摂氏である。記載される方法の変形は、実施例が例示することを意図する基本的態様を変更することなく行うことができることを理解されたい。

【実施例】

【0586】

実施例１
疾患再発の早期検出は、がん患者における生存率を改善することが示されている。手術後の循環腫瘍ＤＮＡ（ｃｔＤＮＡ）の検出は、再発のリスクが非常に高いがん患者の部分集合を定義する。

【0587】

リスク層別化、治療有効性のモニタリング及び予測、並びに早期再発検出のための感度の高い方法は、ステージＩＩＩの大腸がん患者についての治療決定、患者管理、及びアウトカムに大きな影響を及ぼし得る。アジュバント療法の前、間、及び後、並びにサーベイランス中に行われた連続ｃｔＤＮＡ測定の予後及び予測影響を評価した。

【0588】

患者及び方法。治癒的意図で治療された１６８人のステージＩＩＩのＣＲＣ患者を、２０１４～２０１９年にデンマーク及びスペインの病院において動員した。血漿サンプル（ｎ＝１２０３）中のｃｔＤＮＡを定量化するために、マルチプレックスＰＣＲ、次世代配列決定を使用して、１６の患者特異的体細胞単一ヌクレオチドバリアントをプロファイリングした。

【0589】

結果。ｃｔＤＮＡの検出は、両方とも、手術後（ＨＲ＝７．２、９５％ＣＩ３．８～１３．８、ｐ＜０．００１）、アジュバント化学療法（ＡＣＴ）の直後（ＨＲ＝２１、９５％ＣＩ８．０～５６、ｐ＜０．００１）、及び連続的に測定した場合、治療の終了後（ＨＲ＝４０、９５％ＣＩ１６～１００、ｐ＜０．００１）に、強力な再発予測因子であった。ＡＣＴで治療した手術後ｃｔＤＮＡ陽性患者の再発率は８０％であった（１６／２０）。ＡＣＴ中にｃｔＤＮＡ陽性のままであった全ての患者が再発した。連続の治療後測定は、２つの異なる指数関数的ｃｔＤＮＡ成長率、遅い（２６％のｃｔＤＮＡ増加／月）及び速い（１２６％のｃｔＤＮＡ増加／月）を明らかにした（ｐ＜０．００１）。比率は、生存率を予測した（ＨＲ＝２．６、９５％ＣＩ１．１～６．７、ｐ＝０．０３６）。ＣＴスキャン及びｃｔＤＮＡ測定（ｎ＝１１２人の患者）の一致は、高い一致（９２％）を示し、ｃｔＤＮＡは、ＣＴ画像診断の前又はＣＴ画像診断の時点での残存疾患を検出した。

【0590】

結論。連続の手術後ｃｔＤＮＡ分析は、強力な予後値を有し、ＣＴ画像診断よりも再発検出に対してより感度が高く、腫瘍成長率評価を可能にする。ｃｔＤＮＡ検出及び成長率評価の新規の組み合わせは、意思決定を導くための特有の機会を提供する。

【0591】

実施例２
導入。大腸がん（ＣＲＣ）は、世界的に主要な健康負担である。ステージＩＩＩの疾患を有する患者は、再発のリスクが高く、部分集合が残存疾患を有することを示す。潜在的な残存疾患を排除するために、ガイドラインは、ステージＩＩＩの患者をアジュバント化学療法（ＡＣＴ）に選択することを推奨する。しかしながら、全てのステージＩＩＩの患者が残存疾患を有しているわけではない。５０％を超えるものが、手術のみによって治癒する。したがって、患者をＡＣＴに選択するより正確な方法は、残存疾患の証拠を直接検出することであろう。

【0592】

これに加えて、現在では、ＡＣＴに対する患者の応答を正確にモニタリングすることができるバイオマーカーは存在しない。治療の失敗は、臨床再発が診断されるまで認識されない。したがって、ＡＣＴを完了したにもかかわらず再発するであろう患者を決定する能力は、潜在的に、これらの患者を、更なる療法又は強化されたサーベイランスを受けるための促進された経路に置くことを可能にするであろう。今日、ガイドラインは、全ての患者に対して６～１２ヶ月ごとの放射線サーベイランスを推奨している。ステージＩＩＩの患者における報告された再発率は、約３０％である。したがって、日常的な治療後の放射線サーベイランスを受ける患者のうちの約７０％は再発しない。これは、利用可能なサーベイランス資源を高リスク患者により良好に割り当てる必要性が満たされていないことを示している。

【0593】

循環腫瘍ＤＮＡ（ｃｔＤＮＡ）は、がんの検出のための有望な非侵襲的バイオマーカーとして出現している。いくつかの研究は、手術後のｃｔＤＮＡ検出が再発の高いリスクに関連することを示している。したがって、ｃｔＤＮＡの検出は、残存疾患の分子的確認として解釈され得、ｃｔＤＮＡのレベルは、腫瘍量の代用として解釈され得る。ｃｔＤＮＡ分析の利点は、ｃｔＤＮＡ濃度を連続的に評価する能力であり、原則として、例えば、治療応答を反映する分子的再発及び腫瘍量の変化についての継続的な評価を可能にする。

【0594】

結果は、ステージＩＩＩのＣＲＣを有する患者の均質なコホートにおける連続ｃｔＤＮＡ分析の前向き、多施設研究からのものであった。研究の主な目的は、手術後のｃｔＤＮＡレベルを検出及び定量化し、特定のタイムポイント、例えば、手術後及びＡＣＴ後、並びに連続的に、最大３６ヶ月間のサーベイランス中の再発との相関関係を評価することであった。第二の目的は、ｃｔＤＮＡ動態の連続評価が、アウトカム、ＡＣＴへの応答を予測し、サーベイランス中の再発の早期検出を可能にするかどうかを探索することであった。

【0595】

材料及び方法。
被験者及び研究の設計．この国際的な多施設研究は、２０１４年７月～２０１９年２月に６つのデンマークの病院、及び２０１６年６月～２０１８年１２月にスペインにおけるＨｏｓｐｉｔａｌＣｌｉｎｉｃｏＵｎｉｖｅｒｓｉｔａｒｉｏｄｅＶａｌｅｎｃｉａで治療された連続したステージＩＩＩのＣＲＣ患者（Ｎ＝１６８）を動員した。治癒的意図の治療を予定していた場合、患者は適格であり、手術前の胸部、腹部、及び骨盤のＣＴで転移性疾患は明らかではなかった。患者及び医師は、ｃｔＤＮＡ結果に盲検化されたＡＣＴ治療決定を行った。

【0596】

組織サンプル収集
全ての患者について、腫瘍組織を、新鮮な凍結したもの（ｎ＝１００）又はホルマリン固定されパラフィン包埋された組織（ＦＦＰＥ）（ｎ＝６６）のいずれかの切除された原発性腫瘍から収集した。同時ＣＲＣ腫瘍（ｎ＝５）を有する患者において、組織を全ての原発性腫瘍から収集した。

【0597】

採血及び血漿の単離。
血液サンプルを、Ｋ２－ＥＤＴＡ１０ｍｌチューブ（ＢｅｃｔｏｎＤｉｃｋｉｎｓｏｎ）に収集した。二重遠心分離によって、血漿を採血の２時間以内に単離した。デンマークでは、２回の遠心分離は各々、３０００ｇで１０分であった。スペインでは、最初の遠心分離は１６００ｇで１０分、２回目は３０００ｇで１０分であった。バフィーコートは、最初の遠心分離後に収集した。血漿及びバフィーコートを、使用するまで－８０℃で保存した。

【0598】

ＤＮＡ抽出及び定量化
新鮮な凍結した腫瘍組織サンプルからＤＮＡを、ＰｕｒｅｇｅｎｅＤＮＡ精製キット（ＧｅｎｔｒａＳｙｓｔｅｍｓ）を使用して抽出し、ＱｉＡａｍｐＤＮＡＦＦＰＥ組織キット（Ｑｉａｇｅｎ）を使用してＦＦＰＥサンプルから抽出した。デンマークでは、ＱＩＡｓｙｍｐｈｏｎｙＤＮＡＭｉｎｉＫｉｔ（Ｑｉａｇｅｎ）を使用して、バフィーコートから正常ＤＮＡを抽出した。スペインでは、ＣｈｅｍａｇｉｃＤＮＡＢｌｏｏｄＫｉｔＳｐｅｃｉａｌ及びＣｈｅｍａｇｉｃＭＳＭＩ装置（ＰｅｒｋｉｎＥｌｍｅｒ）を使用して、バフィーコートＤＮＡを抽出した。組織及びバフィーコートＤＮＡを、Ｑｕｂｉｔ（商標）ｄｓＤＮＡＢＲＡｓｓａｙＫｉｔ（ＴｈｅｒｍｏＦｉｓｈｅｒ）によって定量化した。血漿サンプル（中央値８ｍＬ、範囲１．３～１０ｍＬ）からｃｆＤＮＡを、ＱＩＡａｍｐＣｉｒｃｕｌａｔｉｎｇＮｕｃｌｅｉｃＡｃｉｄキット（Ｑｉａｇｅｎ）を使用して抽出し、５０μＬのＤＮＡＳｕｓｐｅｎｓｉｏｎＢｕｆｆｅｒ（Ｓｉｇｍａ）に溶出した。各ｃｆＤＮＡサンプルをＱｕａｎｔ－ｉＴＨｉｇｈＳｅｎｓｉｔｉｖｉｔｙｄｓＤＮＡＡｓｓａｙＫｉｔ（Ｉｎｖｉｔｒｏｇｅｎ）を使用して定量化した。

【0599】

がん胎児性抗原（ＣＥＡ）の分析
ＣＥＡ分析は、Ｃｏｂａｓｅ６０１プラットフォーム（Ｒｏｃｈｅ）で、５００μＬの血清を用い、製造業者の推奨に従って行われた。閾値レベルは、国のガイドラインに従って設定した：デンマークでは、それぞれ、非喫煙者及び喫煙者について、４．０μｇ／Ｌ及び６．０μｇ／Ｌ；スペインでは、それぞれ、非喫煙者及び喫煙者について、３．４μｇ／Ｌ及び４．３μｇ／Ｌ。サンプル採取前の８週間喫煙しなかった患者は、元喫煙者とみなされた。

【0600】

全エクソーム配列決定（ＷＥＳ）
５００ｎｇの中央値（範囲：１８１～５００ｎｇ）の腫瘍及び生殖細胞系からのゲノムＤＮＡを、Ｉｌｌｕｍｉｎａアダプターベースのライブラリ調製に供し、ＮｏｖａＳｅｑプラットフォームを使用して２ｘ１００ｂｐのペアエンド配列決定においてその後の全エクソーム配列決定（標的サイズ約４０Ｍｂ）に供した。腫瘍及び生殖細胞系サンプルを、それぞれ１８０倍及び５０倍の平均重複排除オンターゲットカバレッジで配列決定した。ｂｃｌ２ｆａｓｔｑ２を使用してＦａｓｔＱファイルを調製し、ＦａｓｔＱＣを使用して品質をチェックした。リードを、Ｂｕｒｒｏｗｓ－Ｗｈｅｅｌｅｒアライメントツール（ｖ．０．７．１２）を使用してヒト参照ゲノムｈｇ１９にマッピングし、Ｐｉｃａｒｄ及びＭｕｌｔｉＱＣを使用して品質をチェックした。再アライメントＱＣ及びアライメント後のＱＣメトリック（総リード数、重複排除オンターゲットカバレッジ、カバレッジの均一性を含む）を調べて、全エクソーム配列決定データの品質を確保した。腫瘍と一致した生殖細胞系ＤＮＡサンプルとの間のＳＮＰ遺伝子型一致性を調べて、任意のサンプルスワップ（ｓａｍｐｌｅｓｗａｐ）を特定した。

【0601】

体細胞バリアントコール及びＳｉｇｎａｔｅｒａｃｔＤＮＡアッセイ設計
体細胞バリアントコールを、腫瘍組織及び生殖細胞系の両方からの配列決定入力を使用するＮａｔｅｒａのコンセンサスバリアントコール方法を使用して行った。公開データセット（１０００ゲノムプロジェクト、ＥｘＡＣ、ＥＳＰ、ｄｂＳＮＰ）において生殖細胞系であると以前に報告されたバリアントをフィルタリングした。次いで、クローン体細胞単一ヌクレオチドバリアント（ＳＮＶ）の特定のためにＮａｔｅｒａの独自のバイオインフォマティクスパイプラインを介して処理される前に、ＷＥＳデータを品質メトリック及びサンプル一致性について分析した。特定されたクローンバリアントの候補プールのうち、バリアントの優先順位付けされたリストを使用して、最適化された設計パラメータに基づいてＰＣＲアンプリコンを設計し、ヒトゲノム内の一意性、アンプリコン効率、及びプライマー相互作用を確保した。

【0602】

血漿ＤＮＡライブラリ及び血漿マルチプレックスＰＣＲＮＧＳワークフロー。
血漿ｃｆＤＮＡ抽出後、６６ｎｇ（２０，０００ゲノム相当、図８Ａ）までのｃｆＤＮＡを使用してｃｆＤＮＡライブラリを調製し、末端修復、Ａテーリング及びアダプターライゲーションに供し、続いて、ＡｍｐｕｒｅＸＰビーズ（Ａｇｅｎｃｏｕｒｔ／ＢｅｃｋｍａｎＣｏｕｌｔｅｒ）を使用して産物を増幅及び精製した。ライブラリ調製後、各ライブラリ及びプライマーのアリコートでマルチプレックス標的化ＰＣＲを実施した。増幅されたバーコード化された産物をプールし、Ｉｌｌｕｍｉｎａプラットフォーム上でアンプリコン当たり１００，０００倍を超える平均深度で配列決定した。ｃｔＤＮＡ陽性についての基準として、検出された２つ以上のバリアントの以前に検証されたカットオフを使用した。カットオフは、高い感度を維持しながら９９．８％を超える高い特異性を達成するために必要な以前に定義された信頼閾値に基づいて選択した。

【0603】

ｃｔＤＮＡ成長速度に基づく患者の細分化
再発又は介入の前の時間の関数としてのｃｔＤＮＡレベルに基づいて、各患者に対数線形回帰をフィッティングさせた。ｃｔＤＮＡ成長速度を、回帰線の傾きから推定した。傾きのヒストグラムは、双峰分布を明らかにした（図１０Ａ）。分布内の２つのモード間の局所最小を特定するために、最小帯域幅によるカーネル平滑化を使用して実数値関数を推定し、２モーダル推定を与えた。関数に対して局所極値についての二次微分検定を適用することによって、局所最小を決定した。

【0604】

統計分析
無再発生存率（ＲＦＳ）を主要アウトカム尺度として使用した。標準的な放射線学的基準によってＲＦＳを評価し、手術日から確認された最初の放射線学的再発（局所又は遠隔）までを測定した。患者を、最後のフォローアップ時又は死亡時に打ち切った。フォローアップなしの患者を研究から除外した。全生存率（ＯＳ）を、手術日から死亡日又は最後のフォローアップ日まで計算した。２０２０年１２月３１日に、生存率を最後に評価した。臨床病理学的要因、並びにｃｔＤＮＡ及びＣＥＡ測定に対する再発率を、フィッシャーの正確検定、及びロジスティック回帰分析によって評価した。一致しない群の比較を、非正常データについてのウィルコクソンの順位和検定、又は対数変換されたデータに対するスチューデントのｔ検定を使用して行い、Ｑ－Ｑプロットによって正規性についてチェックした。対になったデータの比較を、連続データに対するウィルコクソンの符号順位検定、及びバイナリデータに対するマクネマー検定を使用して行った。コーエンのカッパ係数を使用して、重複するデータ間の一致を推定した。カプラン－マイヤー法を用い、生存率の分析を行った。コックス比例ハザード回帰分析を使用して、ＲＦＳ及びＯＳに対するｃｔＤＮＡ及びＣＥＡの影響を評価した。連続ｃｔＤＮＡ及びＣＥＡ測定値の分析において、これらは、時間変化する独立変数として扱った。単変量分析におけるｐ値＜０．０５による臨床病理学的パラメータを用いて多変量分析を行った。シェーンフェルト残差のグローバル試験によって比例ハザード仮定を試験した。全てのＰ値は、両側検定に基づいており、差は、Ｐ＜０．０５で有意であるとみなされた。ＲＳｔａｔｉｓｔｉｃａｌソフトウェア（ｖ．４．０）を使用して、統計分析を行った。

【0605】

結果。患者の登録及び研究の概要を図５に提示する。合計１６８人のステージＩＩＩのＣＲＣ患者を登録した。その後、異時性がんを発症した（ｎ＝１）、フォローアップ不能となった（ｎ＝２）、ＡＣＴ中にのみ血液サンプルを収集した（ｎ＝３）、又はＲ２切除を受けた（ｎ＝２）ため、８人の患者を除外し、分析のために１６０人の患者を残した。患者の部分集合（ｎ＝７７）について、ｃｔＤＮＡデータは、以前に利用可能であった。これらの患者に対して１８ヶ月超の更なるフォローアップを実施し、更なる長期的血漿サンプルの分析を提供した。患者のうちの２５％（４０／１６０）において再発が診断された。再発していない患者についてのフォローアップの中央値は、３４．８ヶ月（ＩＱＲ１２．７～３６．１ヶ月）であった。血漿は、連続的に、すなわち、手術前、ＡＣＴ前の手術後、及びその後、最大３年間にわたって約３ヶ月ごとに収集した。合計１，２０３個の血漿サンプルを評価した（患者当たり７の中央値、ＩＱＲ４～１１個のサンプル）。血漿中の腫瘍特異的クローンバリアントを追跡する、事前に定義され、以前に検証されたｃｔＤＮＡ分析パイプラインを使用して、血漿ｃｔＤＮＡレベルを定量化した。同時原発性腫瘍を有する患者について、各腫瘍についてクローンバリアントを追跡した。この手法の重要性は、３つの同時腫瘍を有する患者について図９に例示し、そのうちの１つのみが後に診断された遠隔転移を形成した。

【0606】

手術後のｃｔＤＮＡ状態及び再発のリスクとの関連
患者のうちの１４．２％（２０／１４０）において、手術後８週間以内（中央値２．６週間、ＩＱＲ２．２～３．７）及びＡＣＴ開始前に収集された手術後の血液サンプルによってＣｔＤＮＡが検出された。ｃｔＤＮＡ陽性患者についての再発率は、ｃｔＤＮＡ陰性患者についての再発率（１８．３％、２２／１２０［ＮＰＶ＝８１．７％］、ｐ＜０．０００１、フィッシャーの正確検定、表１）よりも有意に高かった（８０％、１６／２０［ＰＰＶ＝８０％］）。ｃｔＤＮＡの存在は、将来の再発（ＯＲ＝１７．８、９５％ＣＩ５．９～６７．１、Ｐ＜０．００１）及び無再発生存率（ＲＦＳ）（ＨＲ＝７．２、９５％ＣＩ３．８～１３．８、ｐ＜０．００１）の強力な予測因子であった（表１及び２）。ＲＦＳと有意に関連していた他の臨床病理学的変数はなかった（表２）。ＣｔＤＮＡは、ＡＣＴを調整した後も、ＲＦＳと有意に関連したままであった（ＨＲ＝１０．１、９５％ＣＩ４．９２～２０．７、ｐ＜０．００１、表２）。ｃｔＤＮＡは、後に再発した２２人の患者では検出されなかった。無細胞ＤＮＡ（ｃｆＤＮＡ）レベルは、ｃｔＤＮＡ陽性患者と比較して、これらの患者において有意により高かった（ｐ＜０．０５、スチューデントのｔ検定）（図６Ｂ）。後に収集したサンプル（手術後２ヶ月超）は、１５人の患者で利用可能であり、そのうちの８０％（１２／１５）は、ｃｔＤＮＡ陽性であった（図６Ｃ）。これらの「後の」ｃｔＤＮＡ陽性サンプル中のｃｆＤＮＡレベルは、手術後のｃｔＤＮＡ陽性サンプルと同様であった（図６Ｄ）。

【0607】

ｃｔＤＮＡ陽性患者のアジュバント化学療法及び再発リスク
合計で、手術後ｃｔＤＮＡ陽性患者のうちの９０％（１８／２０）がＡＣＴを受けた。手術後ｃｔＤＮＡ陽性患者の再発率は７８％（１４／１８）（図７Ａ）であり、２２％（４／１８、９５％ＣＩ２．６～４１．８％、ブートストラップによる）がＡＣＴによって治癒されたことを示している。一致して、利用可能なフォローアップサンプルを有する患者のｃｔＤＮＡ分析は、再発患者でｃｔＤＮＡを検出し、一方、再発していない患者は、フォローアップ終了時、３６ヶ月で陰性であった（図７Ａ）。ＡＣＴは、腫瘍量が小さいときにより良好な効果を有することが予想され得るため、手術後のｃｔＤＮＡレベルが再発患者と再発していない患者との間で異なるかどうかを探索した（図７Ｂ）。差の証拠は見出されなかった（ｐ＝０．７４、スチューデントのｔ検定）。

【0608】

ＡＣＴ中のｃｔＤＮＡレベルの変化及び再発の予測
ＡＣＴ前、ＡＣＴ中、及びＡＣＴ後に収集された血液サンプルは、１３／１８のＡＣＴ治療された手術後ｃｔＤＮＡ陽性患者に対して利用可能であった。ＡＣＴは、患者のうちの６２％（８／１３）において、少なくとも１つの血液サンプル中でｃｔＤＮＡクリアランスをもたらした（図７Ｃ）。これらのうち、６２．５％（５／８）が一過性のクリアランスを経験し、後に再発した。残りの３７．５％（３／８）の患者は、その後の全てのサーベイランスサンプルで除去されたままであり、患者のうちのいずれも再発と診断されなかった。ＡＣＴは、患者のうちの３８％（５／１３）においてｃｔＤＮＡを除去せず、患者は最終的に再発した（図７Ｃ）。

【0609】

ＡＣＴ後のｃｔＤＮＡ及びＣＥＡ状態、並びに再発の予測
ＡＣＴ後（３ヶ月後以内）に収集された血液サンプルは、９３人の患者で利用可能であった。ｃｔＤＮＡは、患者のうちの１２．９％（１２／９３）で検出された。単変量コックス回帰分析において、ＡＣＴ後のｃｔＤＮＡ検出は、顕著に低減したＲＦＳと関連していた（ＨＲ＝２１、ｐ＜０．００１、図７Ｄ）。臨床病理学的リスク因子もＡＣＴ後のＣＥＡも、ＲＦＳと有意に関連していなかった。

【0610】

長期的なｃｔＤＮＡ及びＣＥＡ測定、並びに再発への関連
次に、決定的な治療の終了後に、１１４人の患者から利用可能な連続的に収集された血漿サンプルを調べた。ｃｔＤＮＡ及びＣＥＡを時間変化する独立変数として使用する単変量コックス回帰分析は、ＣＥＡ及びＲＦＳ（ＨＲ＝３．８、ｐ＝０．００７、表２Ｃ）と比較して、ｃｔＤＮＡとＲＦＳとの間の強い相関関係を明らかにした（ＨＲ＝４０、ｐ＜０．００１、表２Ｃ、図１０）。両方のマーカーを含む多変量分析において、ｃｔＤＮＡは、依然としてＲＦＳの唯一の有意な予測因子であった（ｃｔＤＮＡ：ＨＲ＝４０．７、ｐ＜０．００１、表２Ｃ）。

【0611】

１１４人の患者のうち、２４人は再発を経験し、これらのうちの７９％（１９／２４）は、放射線学的再発の前又は時点でｃｔＤＮＡ検出を示した。これらの患者のうちの４７％（９／１９）について、ｃｔＤＮＡは、ＡＣＴの終了前に検出された（図７Ｅ）。これらのサンプルを含めると、１０．２ヶ月のリードタイムの中央値が得られた（ＩＱＲ：７．２～１１．３）、（図７Ｅ）。２人の再発患者（８％、２／２４）は、それぞれ５．２ヶ月及び５．３ヶ月の遅延時間で放射線学的再発後にｃｔＤＮＡを検出した（図７Ｅ）。

【0612】

ｃｔＤＮＡレベルの変化、腫瘍成長の代用、及び生存率へのその関連
このコホートにおいて、１７人の再発患者は、決定的な治療後及び再発の介入前に収集された、２つ以上の連続したｃｔＤＮＡ陽性サンプルを有した（中央値：３、範囲：２～８）。ｃｔＤＮＡの変化は、腫瘍成長についての代用として調査した。ｃｔＤＮＡレベルの指数関数的な上昇は、全ての患者について観測された（図７Ｆ）。対数線形回帰モデルをデータにフィッティングし、各患者について、ｃｔＤＮＡの増加／減少のペースを回帰線の傾きによって推定した（図７Ｆ）。コックス比例ハザードモデルでこの傾きを連続変数として使用することで、ｃｔＤＮＡの増加とより乏しい全生存率（ＯＳ）との間の関連を明らかにした（ＨＲ＝２．６、９５％ＣＩ１．１～６．７、ｐ＝０．０３６）。傾きの分布は、双峰（図１１）であり、２つの異なる成長パターン：速い（４７％、８／１７、平均傾き＝２．４１＋／－０．６ＳＥ、１４１％の増加／月）又は遅い（５３％、９／１７、平均傾き＝１．２６＋／－０．１５ＳＥ、２６％の増加／月）の存在を示した（ｐ＜０．００１、ウィルコクソンの順位和検定）（図７Ｆ）。長期的分析からの再発していない８９人の患者の生存率に対して遅い群及び速い群の生存率を比較した。これは、再発していない患者及び遅い表現型を有する再発患者について同様のＯＳを明らかにした（ｐ＝０．１８）。逆に、速い表現型を有する再発患者では、ＯＳが低減した（ＨＲ＝４２．０、９５％ＣＩ８．０～２２１、ｐ＜０．００１）（図１１）。速い表現型及び遅い表現型の臨床的関連性は、最初のｃｔＤＮＡ検出から放射線学的再発までに観察されるｃｔＤＮＡの倍率変化によって示される（速い：倍率変化の中央値１１７．３、範囲：２．１～５５４．７、遅い：倍率変化の中央値５．８、範囲：０．５～１７３．５）。最初の２つのサンプルのみを使用して、成長パターンを堅牢に評価できるかどうかを探索した。患者のうちの８８．２％（１５／１７）が、利用可能な全てのサンプルを使用する場合と同じ群に分類されていることから、良好な一致が観察された（ｐ＝０．４７９、マクネマー検定、コーエンのカッパ＝０．７７、図１１）。任意の２つの連続したタイムポイントを使用する場合に、同様の一致に達し、速い／遅いコールの堅牢性を示した。

【0613】

考察。検証された感度の高いバイオマーカーは、ステージＩＩＩのＣＲＣ患者におけるアウトカムを、より良好な、１）再発のリスクを定義すること、２）ＡＣＴのアウトカムを予測すること、３）ＡＣＴ後に更なる治療を必要とする可能性のある患者を特定すること、４）サーベイランス中に再発を検出すること、及び５）腫瘍量の成長速度を予測し、それによって介入の緊急性を知らせることによって潜在的に改善することができる。

【0614】

本研究は、ステージＩＩＩのＣＲＣ患者における連続ｃｔＤＮＡ測定に重点を置き、ＡＣＴの意思決定を導く可能性のある手術後の予後マーカーとしてのｃｔＤＮＡを実証する。この所見は、以前のＣＲＣ研究と一致し、かつ拡張されている。併せて、これらの結果は、ステージＩＩＩのＣＲＣ患者のためのｃｔＤＮＡ誘導ＡＣＴ投与の利益を調査する前向き試験の範囲の計画及び開始を促し、その多くは、ｃｔＤＮＡ陰性患者のための治療を減少させることを包括的な目的としている。これらの研究では、ｃｔＤＮＡ分析の高いＮＰＶが最も重要である。重要なことに、本研究は、手術後の血液サンプル収集のタイミングがＮＰＶにどのように影響し得るかを示した。手術後ｃｔＤＮＡ陰性患者について驚くほど高い再発率（１８％）が観察され、その後の分析は、これらの偽陰性がサンプリングのタイミングに根ざしていることを示唆した。プロトコルに従って、手術後の血液サンプルの大部分（８４％）は、手術後２～４週間で収集された（中央値２．６）。なお、この間隔は、外科的外傷によって引き起こされるｃｆＤＮＡの最近特定された４週間のサージと重複していた。野生型ｃｆＤＮＡサージと一致して、ｃｔＤＮＡ陰性再発患者は、高いｃｆＤＮＡレベルを有し、外傷誘発ｃｆＤＮＡが、検出限界を下回るｃｔＤＮＡを希釈した可能性があることを示す。一致して、正規化されたｃｆＤＮＡレベルによる後のサンプルの分析は、初期に陰性の再発患者のうちの８０％におけるｃｔＤＮＡ検出を明らかにした。したがって、治療の減少を調査する研究では、４週目の後に更なるサンプルを収集することが有益であり得る。これにより、ｃｔＤＮＡ評価を終了する前に、高いｃｆＤＮＡの正規化が可能になり、それによって全体的なＮＰＶが改善される。

【0615】

少数に限られるが、データは、ＡＣＴ治療されたｃｔＤＮＡ陽性患者のうちの２２％（９５％ＣＩ２．６～４１．８％）が、３年間のフォローアップ中に再発しなかったことを示した。この結果は、ＡＣＴ後の連続ｃｔＤＮＡ分析によって裏付けられ、これらの２２％は、持続的なｃｔＤＮＡクリアランスを示した。したがって、結果は、標準的なＡＣＴがわずかな患者に利益をもたらし得るという証拠を提供する。観察された低減のリスクは、選択されていないステージＩＩＩの結腸がん患者に標準的なＡＣＴを投与したときに報告された約３０％と一致する。潜在的には、ｃｔＤＮＡ陽性患者は、将来のアジュバントレジメンからより多くの利益を得るであろう。

【0616】

また、連続ｃｔＤＮＡ分析が、ＡＣＴの有効性をリアルタイムで知らせることができるという証拠も提供される。ＡＣＴ中に、２つの異なるｃｔＤＮＡパターンが特定され（図７Ｃ）、再発のリスクとの相関関係を示した。それらは、ｃｔＤＮＡの持続性が再発した患者で特定され、一方、クリアランスが再発のリスクを３７．５％低減させることに関連しているため、実行可能であり得る。したがって、クリアランスがなければ、再発は避けられないように思われる。所見と一致して、乳がんのネオアジュバント設定、免疫療法設定、並びに転移性肺及びＣＲＣの化学療法設定からの報告は、療法中の早期ｃｔＤＮＡ変化がアウトカムを予測することを示している。

【0617】

我々の研究は、手術後の設定だけでなく、ＡＣＴ後の設定においても、ｃｔＤＮＡが強力な予後マーカーであることを実証した。これは、ＣＲＣ患者のより小さい、より不均一なコホートにおける以前の研究と一致する。予測力は、ＡＣＴ後に行われた連続ｃｔＤＮＡ評価によって増加した。現在の臨床ガイドラインは、６～１２ヶ月ごとに患者を放射線学的に監視し、３～６ヶ月ごとにＣＥＡの分子分析によって補足することを推奨していた。この研究は、連続モニタリングにおいてＣＥＡよりもｃｔＤＮＡの予測力が高いことを示し、ｃｔＤＮＡが臨床診療においてより良好なリスク評価を提供し得ることを示唆している。これらの観察は、サーベイランス及び介入のための新しい機会を開くものである。連続ｃｔＤＮＡ評価は、更なる治療を必要とする可能性のある患者における残存疾患検出を可能にするだけでなく、再発サーベイランスのための画像診断資源のリスク層別化された割り当てを可能にする。この結果は、低リスク（ｃｔＤＮＡ陰性）患者では、放射線サーベイランスが減少し得、アウトカムに影響がない／最小限であることを示唆している。このサブグループが患者の大部分を構成するため、これによりサーベイランスコストが低下すると予想される。高リスク（ｃｔＤＮＡ陽性）患者の場合、ｃｔＤＮＡ検出直後に画像診断を強化する機会が開かれる。所見に基づいて、これはデンマーク及びスペインで標準的なケアのサーベイランスよりも早く画像診断を開始することを意味する。したがって、腫瘍量がより低い場合、より早期の再発検出を可能にし、潜在的に再発治療をより効果的にすることができる。

【0618】

早期再発検出及び介入の重要性は、再発患者のうちの４７％が速いｃｔＤＮＡ成長パターン、すなわち、中央値１２６％の月間増加を有することを示す結果によって強調される。おそらく、ｃｔＤＮＡのこの増加は、腫瘍量の増加を反映する。したがって、数ヶ月の長期間のサーベイランスでさえ、克服できない結果を有する可能性があり、例えば、腫瘍量がわずか３ヶ月で１１．４倍に増加し、転移性病変のサイズ及び／又は数が、治癒的介入がもはや選択肢ではなくなり、緩和的治療がより効果的でなくなるレベルにすぐに到達する可能性があることを示している。これらの仮定と一致して、速い成長を有する患者は、遅い成長を有する患者よりも有意に乏しいＯＳを有することが見出された。

【0619】

成長パターンを迅速に決定する、すなわち、最初のｃｔＤＮＡ検出の直後に決定することができることは、多くの臨床的意味を有することができ、データによって支持される。この研究において、腫瘍成長パターンは、最初の２つの連続した血液サンプルを用いて堅牢に評価した。サンプル間には３ヶ月の間隔があったが、パターンは数週間以内に潜在的に決定することができ、医師に早期介入を採用するように知らせることができる。速い成長を有する患者における残存疾患は、遅い成長を有する患者よりも早く、画像診断によって検出可能であることが予想される。これらの場合では、ｃｔＤＮＡ成長パターンの迅速な評価は、全身療法を開始するか、又はサーベイランスを継続するかの決定を知らせるのに役立つ可能性がある。

【図1A】