特許6161607 | 知財ポータル「IP Force」

知財求人 - 知財ポータルサイト「IP Force」

▶ ベリナタ　ヘルス　インコーポレイテッドの特許一覧

特許6161607サンプルにおける異なる異数性の有無を決定する方法

書誌要約請求の範囲詳細な説明課題実施例実施するための形態図面の説明

目に優しい文字サイズ小中大 PDF Top

< >

1
2A
2B
3A
3B
4A
4B
5A
5B
6A
6B
7
8
9
10
11A
11B
11C
11D
11E
12
13
14
15
16
17
18A
18B
19

(19)【発行国】日本国特許庁(JP)

(12)【公報種別】特許公報(B2)

(11)【特許番号】6161607

(24)【登録日】2017年6月23日

(45)【発行日】2017年7月12日

(54)【発明の名称】サンプルにおける異なる異数性の有無を決定する方法

(51)【国際特許分類】

C12Q 1/68 20060101AFI20170703BHJP

G01N 33/50 20060101ALI20170703BHJP

C12N 15/09 20060101ALN20170703BHJP

【ＦＩ】

C12Q1/68 Z

G01N33/50 P

!C12N15/00 A

【請求項の数】32

【全頁数】89

(21)【出願番号】特願2014-522796(P2014-522796)

(86)(22)【出願日】2011年7月26日

(65)【公表番号】特表2014-521334(P2014-521334A)

(43)【公表日】2014年8月28日

(86)【国際出願番号】US2011045412

(87)【国際公開番号】WO2013015793

(87)【国際公開日】20130131

【審査請求日】2014年7月10日

(73)【特許権者】

【識別番号】513257649

【氏名又は名称】ベリナタヘルスインコーポレイテッド

(74)【代理人】

【識別番号】100147485

【弁理士】

【氏名又は名称】杉村憲司

(74)【代理人】

【識別番号】100174001

【弁理士】

【氏名又は名称】結城仁美

(74)【代理人】

【識別番号】100181272

【弁理士】

【氏名又は名称】神紘一郎

(72)【発明者】

【氏名】リチャードピーラバ

(72)【発明者】

【氏名】デイビッドエーコムストック

(72)【発明者】

【氏名】ブライアンケーリース

【審査官】西賢二

(56)【参考文献】

【文献】特表２０１０−５３４０６９（ＪＰ，Ａ）

【文献】米国特許出願公開第２０１１／０１７７５１７（ＵＳ，Ａ１）

【文献】国際公開第２０１０／０３３５７８（ＷＯ，Ａ２）

【文献】国際公開第２０１１／０５１２８３（ＷＯ，Ａ１）

【文献】 FAN, H. Christina et al.，"Noninvasive diagnosis of fetal aneuploidy by shotgun sequencing DNA from maternal blood"，Proc. Natl. Acad. Sci. U. S. A.，２００８年，Vol. 105，p. 16266-16271

(58)【調査した分野】（Int.Cl.，ＤＢ名）

Ｃ１２Ｑ１／００−３／００

Ｃ１２Ｎ１５／００−１５／９０

ＭＥＤＬＩＮＥ／ＥＭＢＡＳＥ／ＢＩＯＳＩＳ（ＳＴＮ）

ＰｕｂＭｅｄ

(57)【特許請求の範囲】

【請求項1】

胎児及び母体の核酸を含む母体テストサンプルにおける、任意の４つ又はそれ以上の関心対象染色体それぞれの任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法において、
(ａ) 前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を、次世代シークエンシング（ＮＧＳ）を用いて取得するステップと、
(ｂ) 前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の４つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の４つ又はそれ以上の関心対象染色体それぞれの正規化染色体の配列タグ数を同定するステップ、ここで、前記４つまたはそれ以上の関心対象染色体それぞれの前記正規化染色体は、関心対象染色体を正常なコピー数で有する細胞で構成されていることが既知の検体から採取した適格サンプルの配列情報を用いて同定されたものであり、そして：
（ｉ）関心対象染色体にマッピングする配列タグの数の変動と最も近似する、正規化染色体にマッピングされた配列タグの数における変動を呈する、
及び／又は
（ｉｉ）適格サンプルにおいて関心対象染色体との間の染色体ドースの変動及びドース分布に基づいて統計学的に同定されるものであって、適格サンプル中の関心対象染色体の染色体ドースの分布と、テストサンプル中の関心対象染色体の染色体ドースの分布との間で、最も大きな統計学的相違を提供する、
と、
(ｃ) 前記任意の４つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化染色体に対して同定した前記配列タグ数を使用して、前記４つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び
(ｄ) 前記４つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記４つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップと
を有する、方法。

【請求項2】

請求項１記載の方法において、前記ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化染色体配列に対して同定した前記配列タグ数との比として計算するステップを有する、方法。

【請求項3】

請求項１又は２記載の方法において、前記ステップ(ｃ)は、
(i) 前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、
(ii) 前記ステップ(ｂ)で前記正規化染色体配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化染色体それぞれの配列タグ密度比を計算するステップ、及び
(iii) 前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化染色体配列における前記配列タグ密度比との比として計算するステップ
を有する、方法。

【請求項4】

請求項１〜３のうちいずれか一項記載の方法において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の４つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも２０の染色体を含むものとし、少なくとも２０の異なった完全胎児染色体異数性の有無を決定する、方法。

【請求項5】

請求項１〜３のうちいずれか一項記載の方法において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の４つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてとし、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべての異なった完全胎児染色体異数性の有無を決定する、方法。

【請求項6】

請求項１〜５のうちいずれか一項記載の方法において、前記正規化染色体配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した単独染色体とする、方法。

【請求項7】

請求項１〜５のうちいずれか一項記載の方法において、前記正規化染色体配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した染色体グループとする、方法。

【請求項8】

胎児及び母体の核酸を含む母体テストサンプルにおける、任意の１つ又はそれ以上の関心対象染色体の任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法において、
(ａ) 前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を、次世代シークエンシング（ＮＧＳ）を用いて取得するステップと、
(ｂ) 前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の１つ又はそれ以上の関心対象染色体それぞれの正規化断片配列の配列タグ数を同定するステップ、ここで、前記１つまたはそれ以上の関心対象染色体それぞれの前記正規化断片配列は、関心対象染色体を正常なコピー数で有する細胞で構成されていることが既知の検体から採取した適格サンプルの配列情報を用いて同定されたものであり、そして：
（ｉ）関心対象染色体にマッピングする配列タグの数の変動と最も近似する、正規化断片配列にマッピングされた配列タグの数における変動を呈する、
及び／又は
（ｉｉ）適格サンプルにおいて関心対象染色体との間の染色体ドースの変動及びドース分布に基づいて統計学的に同定されるものであって、適格サンプル中の関心対象染色体の染色体ドースの分布と、テストサンプル中の関心対象染色体の染色体ドースの分布との間で、最も大きな統計学的相違を提供する、
と、
(ｃ) 前記任意の１つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化断片配列に対して同定した前記配列タグ数を使用して、前記任意の１つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び
(ｄ) 前記任意の１つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の１つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップと
を有する、方法。

【請求項9】

請求項８記載の方法において、前記ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化断片配列に対して同定した前記配列タグ数との比として計算するステップを有する、方法。

【請求項10】

請求項８又は９記載の方法において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の１つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも２０の染色体を含むものとし、少なくとも２０の異なった完全胎児染色体異数性の有無を決定する、方法。

【請求項11】

請求項８又は９記載の方法において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の１つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてとし、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべての異なった完全胎児染色体異数性の有無を決定する、方法。

【請求項12】

請求項１〜１１のうちいずれか一項記載の方法において、前記異なった完全胎児染色体異数性は、完全染色体トリソミー、完全染色体モノソミー、及び完全染色体ポリソミーから選択する、方法。

【請求項13】

請求項１〜１２のうちいずれか一項記載の方法において、前記異なった完全胎児染色体異数性は、２番トリソミー、８番トリソミー、９番トリソミー、２１番トリソミー、１３番トリソミー、１６番トリソミー、１８番トリソミー、２２番トリソミー、４７,ＸＸＹ、４７,ＸＸＸ、４７,ＸＹＹ、及びＸモノソミーから選択する、方法。

【請求項14】

請求項１〜１３のうちいずれか一項記載の方法において、ステップ(ａ)〜(ｄ)は、異なる母体検体からのテストサンプルに対して繰り返して行い、前記方法は、前記テストサンプルそれぞれにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する、方法。

【請求項15】

請求項１〜１４のうちいずれか一項記載の方法において、さらに、正規化染色体値（ＮＣＶ：normalized chromosome value）を計算するＮＣＶ計算ステップであって、前記ＮＣＶは、次式のように、前記染色体ドースを、適格サンプルセットにおける対応の染色体ドースの平均に関連付ける値とし、

【数1】

ここで、

は、それぞれ適格サンプルセットにおけるｊ番染色体ドースに対する推定した平均及び標準偏差であり、ｘ_ijはテストサンプルｉにおける観測したｊ番染色体ドースである、該ＮＣＶ計算ステップを有する、方法。

【請求項16】

胎児及び母体の核酸を含む母体テストサンプルにおける、任意の１つ又はそれ以上の関心対象染色体の１つ又はそれ以上の断片の異なった部分的胎児染色体異数性の有無を決定する方法において、
(ａ) 前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を、次世代シークエンシング（ＮＧＳ）を用いて取得するステップと、
(ｂ) 前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの配列タグ数を同定し、また前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの正規化断片配列の配列タグ数を同定するステップ、ここで、前記１つまたはそれ以上の関心対象染色体の１つまたはそれ以上の断片それぞれの前記正規化断片配列は、関心対象染色体を正常なコピー数で有する細胞で構成されていることが既知の検体から採取した適格サンプルの配列情報を用いて同定されたものであり、そして：
（ｉ）１つまたはそれ以上の関心対象染色体の１つまたはそれ以上の断片にマッピングする配列タグの数の変動と最も近似する、正規化断片配列にマッピングされた配列タグの数における変動を呈する、
及び／又は
（ｉｉ）適格サンプルにおいて関心対象染色体との間の染色体ドースの変動及びドース分布に基づいて統計学的に同定されるものであって、適格サンプル中の１つまたはそれ以上の関心対象染色体の１つまたはそれ以上の断片の染色体ドースの分布と、テストサンプル中の１つまたはそれ以上の関心対象染色体の１つまたはそれ以上の断片の染色体ドースの分布との間で、最も大きな統計学的相違を提供する、
と、
(ｃ) 前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれに対して同定した前記配列タグ数、及び前記正規化断片配列に対して同定した前記配列タグ数を使用して、前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの単独染色体ドースを計算するステップと、及び
(ｄ) 前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの前記単独断片ドースそれぞれを、前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の１つ又はそれ以上の異なった部分的胎児染色体異数性の有無を決定するステップと
を有する、方法。

【請求項17】

請求項１６記載の方法において、前記ステップ(ｃ)は、前記関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれの単独断片ドースを、前記関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれに対して同定した前記配列タグ数と、前記関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれの前記正規化断片配列に対して同定した前記配列タグ数との比として計算するステップを有する、方法。

【請求項18】

請求項１６又は１７記載の方法において、さらに、正規化断片値（ＮＳＶ：normalized segment value）を計算するＮＳＶ計算ステップであって、前記ＮＳＶは、次式のように、前記断片ドースを、適格サンプルセットにおける対応の断片ドースの平均に関連付ける値とし、

【数2】

ここで、

は、それぞれ適格サンプルセットにおけるｊ番断片ドースに対する推定した平均及び標準偏差であり、ｘ_ijはテストサンプルｉにおける観測したｊ番断片ドースである、該ＮＳＶ計算ステップを有する、方法。

【請求項19】

請求項１６〜１８のうちいずれか一項に記載の方法において、前記異なった部分的胎児染色体異数性は、部分的重複、部分的増殖、部分的挿入及び部分的欠失から選択する、方法。

【請求項20】

請求項１６〜１９のうちいずれか一項に記載の方法において、前記異なった部分的胎児染色体異数性は、１番染色体の部分モノソミー、４番染色体の部分モノソミー、５番染色体の部分モノソミー、７番染色体の部分モノソミー、１１番染色体の部分モノソミー、１５番染色体の部分モノソミー、１７番染色体の部分モノソミー、１８番染色体の部分モノソミー、及び２２番染色体の部分モノソミーから選択する、方法。

【請求項21】

請求項１６〜２０のうちいずれか一項記載の方法において、ステップ(ａ)〜(ｄ)は、異なる母体検体からのテストサンプルに対して繰り返して行い、前記方法は、前記テストサンプルそれぞれにおける異なった部分的胎児染色体異数性の有無を決定する、方法。

【請求項22】

請求項８〜２１のうちいずれか一項記載の方法において、前記正規化断片配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１つ又はそれ以上における単独断片とする、方法。

【請求項23】

請求項８〜２１のうちいずれか一項記載の方法において、前記正規化断片配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１つ又はそれ以上における断片グループとする、方法。

【請求項24】

請求項１〜２３のうちいずれか一項記載の方法において、前記ステップ(ａ)は、前記テストサンプルにおける前記核酸の少なくとも一部分をシークエンシングし、前記テストサンプルにおける前記胎児及び母体の前記核酸に関する配列情報を得る、方法。

【請求項25】

請求項１〜２４のうちいずれか一項記載の方法において、前記テストサンプルは、血液、血漿、血清、尿及び唾液のサンプルから選択した母体サンプルとする、方法。

【請求項26】

請求項１〜２５のうちいずれか一項記載の方法において、前記核酸は、胎児及び母体の無細胞ＤＮＡ分子の混合物とする、方法。

【請求項27】

請求項１〜２６のうちいずれか一項記載の方法において、前記次世代シークエンシングは、可逆色素ターミネーターによるシークエンシング・バイ・シンセシスを使用する、大量並列シークエンシングとする、方法。

【請求項28】

請求項１〜２７のうちいずれか一項記載の方法において、前記次世代シークエンシングは、シークエンシング・バイ・リゲーションとする、方法。

【請求項29】

請求項１〜２８のうちいずれか一項記載の方法において、前記次世代シークエンシングは、増幅を含むものとする、方法。

【請求項30】

請求項１〜２９のうちいずれか一項記載の方法において、前記次世代シークエンシングは、単独分子シークエンシングとする、方法。

【請求項31】

請求項１〜７のうちいずれか一項記載の方法において、前記４つ又はそれ以上の関心対象染色体が、１３番染色体、１８番染色体、２１番染色体、及びＸ染色体であり、
（ｉ）１３番染色体の前記正規化染色体が、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、及び８番染色体の少なくとも１つであり、
（ｉｉ）１８番染色体の前記正規化染色体が、８番染色体、２番染色体、３番染色体、５番染色体、６番染色体、１２番染色体、及び１４番染色体の少なくとも１つであり、
（ｉｉｉ）２１番染色体の前記正規化染色体が、９番染色体、１番染色体、２番染色体、１１番染色体、１２番染色体、及び１４番染色体の少なくとも１つであり、
（ｉｖ）Ｘ染色体の前記正規化染色体が、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、及び８番染色体の少なくとも１つである、方法。

【請求項32】

請求項８〜１５のうちいずれか一項記載の方法において、前記関心対象染色体が、１３番染色体、１８番染色体、２１番染色体、及びＸ染色体から選択される４つ又はそれ以上の関心対象染色体であり、
（ｉ）１３番染色体の前記正規化染色体が、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、及び８番染色体の少なくとも１つから選択され、
（ｉｉ）１８番染色体の前記正規化染色体が、８番染色体、２番染色体、３番染色体、５番染色体、６番染色体、１２番染色体、及び１４番染色体の少なくとも１つから選択され、
（ｉｉｉ）２１番染色体の前記正規化染色体が、９番染色体、１番染色体、２番染色体、１１番染色体、１２番染色体、及び１４番染色体の少なくとも１つから選択され、
（ｉｖ）Ｘ染色体の前記正規化染色体が、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、及び８番染色体の少なくとも１つから選択される、方法。

【発明の詳細な説明】

【技術分野】

【0001】

本発明は、概して診断の分野に関し、また異なるゲノムに由来する核酸混合物における核酸配列の総量の変動（多型）を決定する方法を提供する。とくに、この方法は、非侵襲性出生前診断、並びにがん患者の転移性進行の診断及びモニタリングに適用できる。

【背景技術】

【0002】

人間医学研究における主な努力の１つは、健康上の悪影響の元をなす遺伝的異常の発見である。多くの場合、特定遺伝子及び／又は重要診断マーカーは、ゲノムの異常コピー数が存在する部分で識別されてきた。例えば、出生前診断において、染色体全体における過剰又は消失コピーはしばしば現れる病変である。がんにおいて、染色体全体若しくは染色体断片（セグメント）におけるコピーの欠失若しくは重複、及びゲノムの特定領域における高レベルの増幅は共通して現れる。

【0003】

コピー数多型（変動）に関する多くの情報は、構造異常の認識を可能にする細胞遺伝学的解明によって得てきた。遺伝学的スクリーニング及び生物学的線量測定のための普通の手順は、核型解析用に細胞を採取するのに侵襲的手順、例えば、羊水穿刺を使用してきた。細胞培養を必要としない、より迅速なテストの必要性を認識して、蛍光その場ハイブリダイゼーション（ハイブリッド形成法）［ＦＩＳＨ：fluorescence in situ hybridization］、定量的蛍光ＰＣＲ（ＱＦ−ＰＣＲ）及びアレイ−比較ゲノムハイブリダイゼーション（ＣＧＨ：Comparative Genomic Hybridization）が、コピー数多型を解析するための分子細胞遺伝学的解析法として開発されている。

【0004】

ゲノム全体を比較的短時間にシークエンシング（配列決定）を可能にする技術の出現、及び循環細胞フリー（circulating cell-free）ＤＮＡ（ｃｆＤＮＡ）は、侵襲性サンプル採取方法に関連する危険性なく、比較すべきある１つの染色体に由来する遺伝子材料を他の遺伝子材料の染色体と比較する機会を提供してきた。しかし、ｃｆＤＮＡの限界のあるレベルからステミング処理する不十分な感度、及びゲノム情報における固有の性質からステミング処理する技術のシークエンシングバイアスという限界を含む、既存の方法の限界が、特異度、感度及び利用可能性のうちいずれか、又はすべてを、種々の臨床背景における信頼性高いコピー数多型診断に与える、非侵襲性方法に対する永続的な要望の根底にある。

【発明の概要】

【発明が解決しようとする課題】

【0005】

本発明は、上述の要望のうち若干を満たし、またとくに、少なくとも非侵襲性出生前診断に、並びにがん患者の転移性進行の診断及びモニタリングに適用できる信頼性高い方法を提供する利点をもたらす。

【課題を解決するための手段】

【0006】

本発明は、１つ又はそれ以上の関心対象である配列の総量が既知である、又はその配列の総量に違いがあると懸念される核酸混合物を有するテストサンプルにおける、関心対象である配列のコピー数多型（ＣＮＶ：copy number variations）を決定する方法を提供する。この方法は、処理に関連する染色体間変動及びシークエンシング間変動からの見越し変動ステミング処理を担う統計学的アプローチをなす。この方法は、任意の胎児異数性におけるＣＮＶ、及び種々の内科的疾患に関連すると既知である若しくは懸念されるＣＮＶを決定するのに適用可能である。本発明方法によって決定できるＣＮＶには、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１つ又はそれ以上におけるトリソミー及びモノソミー、他の染色体ポリソミー、及び染色体のうち１つ又はそれ以上における断片（セグメント）の欠失及び／又は重複が含まれ、こらはテストサンプルの核酸を１回だけシークエンシングすることによって決定することができる。いかなる異数性もテストサンプルの核酸を１回だけシークエンシングすることによって得られる配列情報から決定することができる。

【0007】

一実施形態において、本発明は、胎児及び母体の核酸を含む母体テストサンプルにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。本発明方法は、(ａ)前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の４つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の４つ又はそれ以上の関心対象染色体それぞれの正規化染色体配列の配列タグ数を同定するステップと、(ｃ)前記任意の４つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化染色体配列に対して同定した前記配列タグ数を使用して、前記任意の４つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の４つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の４つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有する。ステップ(ａ)は、テストサンプルにおける核酸分子の少なくとも一部分をシークエンシングし、テストサンプルにおける胎児及び母体の前記核酸分子に関する配列情報を得る。若干の実施形態において、ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化染色体配列に対して同定した前記配列タグ数との比として計算するステップを有する。若干の実施形態において、前記ステップ(ｃ)は、(i)前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、(ii)前記ステップ(ｂ)で前記正規化染色体配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化染色体それぞれの配列タグ密度比を計算するステップ、及び(iii)前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化染色体配列における前記配列タグ密度比との比として計算するステップを有する。

【0008】

他の実施形態において、胎児及び母体の核酸を含む母体テストサンプルにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。本発明方法は、(ａ)前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の４つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の４つ又はそれ以上の関心対象染色体それぞれの正規化染色体配列の配列タグ数を同定するステップと、(ｃ)前記任意の４つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化染色体配列に対して同定した前記配列タグ数を使用して、前記任意の４つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の４つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の４つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有し、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の４つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも２０の染色体を含むものとし、少なくとも２０の異なった完全胎児染色体異数性の有無を決定する。前記ステップ(ａ)は、前記テストサンプルにおける前記核酸分子の少なくとも一部分をシークエンシングし、前記テストサンプルにおける前記胎児及び母体の前記核酸分子に関する配列情報を得る。若干の実施形態において、前記ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化染色体配列に対して同定した前記配列タグ数との比として計算するステップを有する。若干の他の実施形態において、ステップ(ｃ)は、(i)前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、(ii)前記ステップ(ｂ)で前記正規化染色体配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化染色体それぞれの配列タグ密度比を計算するステップ、及び(iii)前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化染色体配列における前記配列タグ密度比との比として計算するステップを有する。

【0009】

他の実施形態において、胎児及び母体の核酸を含む母体テストサンプルにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。本発明方法は、(ａ)前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の４つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の４つ又はそれ以上の関心対象染色体それぞれの正規化染色体配列の配列タグ数を同定するステップと、(ｃ)前記任意の４つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化染色体配列に対して同定した前記配列タグ数を使用して、前記任意の４つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の４つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の４つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有し、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の４つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてとし、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべての異なった完全胎児染色体異数性の有無を決定する。前記ステップ(ａ)は、前記テストサンプルにおける前記核酸分子の少なくとも一部分をシークエンシングし、前記テストサンプルにおける前記胎児及び母体の前記核酸分子に関する配列情報を得る。若干の実施形態において、前記ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化染色体配列に対して同定した前記配列タグ数との比として計算するステップを有する。他の若干の実施形態において、前記ステップ(ｃ)は、(i)前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、(ii)前記ステップ(ｂ)で前記正規化染色体配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化染色体それぞれの配列タグ密度比を計算するステップ、及び(iii)前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化染色体配列における前記配列タグ密度比との比として計算するステップを有する。

【0010】

上述のいずれかの実施形態において、前記正規化染色体配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した単独染色体とする。代案として、前記正規化染色体配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した染色体グループとする。

【0011】

他の実施形態において、胎児及び母体の核酸を含む母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。この方法は、(ａ)前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の１つ又はそれ以上の関心対象染色体それぞれの正規化断片配列の配列タグ数を同定するステップと、(ｃ)前記任意の１つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化断片配列に対して同定した前記配列タグ数を使用して、前記任意の１つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の１つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の１つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有する。前記ステップ(ａ)は、前記テストサンプルにおける前記核酸分子の少なくとも一部分をシークエンシングし、前記テストサンプルにおける前記胎児及び母体の前記核酸分子に関する配列情報を得る。若干の実施形態において、前記ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化断片配列に対して同定した前記配列タグ数との比として計算するステップを有する。前記ステップ(ｃ)は、(i)前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、(ii)前記ステップ(ｂ)で前記正規化断片配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化断片配列それぞれの配列タグ密度比を計算するステップ、及び(iii)前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化断片配列における前記配列タグ密度比との比として計算するステップを有する。

【0012】

他の実施形態において、胎児及び母体の核酸を含む母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。この方法は、(ａ)前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の１つ又はそれ以上の関心対象染色体それぞれの正規化断片配列の配列タグ数を同定するステップと、(ｃ)前記任意の１つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化断片配列に対して同定した前記配列タグ数を使用して、前記任意の１つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の１つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の１つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有し、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも２０の染色体を含むものとし、少なくとも２０の異なった完全胎児染色体異数性の有無を決定する。前記ステップ(ａ)は、前記テストサンプルにおける前記核酸分子の少なくとも一部分をシークエンシングし、前記テストサンプルにおける前記胎児及び母体の前記核酸分子に関する配列情報を得る。若干の実施形態において、前記ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化断片配列に対して同定した前記配列タグ数との比として計算するステップを有する。若干の他の実施形態において、前記ステップ(ｃ)は、(i)前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、(ii)前記ステップ(ｂ)で前記正規化断片配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化断片配列それぞれの配列タグ密度比を計算するステップ、及び(iii)前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化断片配列における前記配列タグ密度比との比として計算するステップを有する。

【0013】

他の実施形態において、胎児及び母体の核酸を含む母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。この方法は、(ａ)前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の１つ又はそれ以上の関心対象染色体それぞれの正規化断片配列の配列タグ数を同定するステップと、(ｃ)前記任意の１つ又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化断片配列に対して同定した前記配列タグ数を使用して、前記任意の１つ又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の１つ又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の１つ又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有し、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した前記任意の１つ又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてとし、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべての異なった完全胎児染色体異数性の有無を決定する。前記ステップ(ａ)は、前記テストサンプルにおける前記核酸分子の少なくとも一部分をシークエンシングし、前記テストサンプルにおける前記胎児及び母体の前記核酸分子に関する配列情報を得る。若干の実施形態において、前記ステップ(ｃ)は、前記関心対象染色体それぞれの単独染色体ドースを、前記関心対象染色体それぞれに対して同定した前記配列タグ数と、前記関心対象染色体それぞれの前記正規化断片配列に対して同定した前記配列タグ数との比として計算するステップを有する。他の若干の実施形態において、前記ステップ(ｃ)は、(i)前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、(ii)前記ステップ(ｂ)で前記正規化断片配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化断片配列それぞれの配列タグ密度比を計算するステップ、及び(iii)前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化断片配列における前記配列タグ密度比との比として計算するステップを有する。上述のいずれか１つの実施形態において、前記異なった完全胎児染色体異数性は、完全染色体トリソミー、完全染色体モノソミー、及び完全染色体ポリソミーから選択する。例えば、前記異なった完全胎児染色体異数性は、２番トリソミー、８番トリソミー、９番トリソミー、２１番トリソミー、１３番トリソミー、１６番トリソミー、１８番トリソミー、２２番トリソミー、４７,ＸＸＹ、４７,ＸＸＸ、４７,ＸＹＹ、及びＸモノソミーから選択する。

【0014】

上述したいずれか１つの実施形態において、ステップ(ａ)〜(ｄ)は、異なる母体検体からのテストサンプルに対して繰り返して行い、前記方法は、前記テストサンプルそれぞれにおける任意の４つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する。上述したいずれか１つの実施形態において、本発明方法は、さらに、正規化染色体値（ＮＣＶ：normalized chromosome value）を計算するＮＣＶ計算ステップであって、前記ＮＣＶは、次式のように、前記染色体ドースを、適格サンプルセットにおける対応の染色体ドースの平均に関連付ける値とし、

【数1】

ここで、

は、それぞれ適格サンプルセットにおけるｊ番染色体ドースに対する推定した平均及び標準偏差であり、ｘ_ijはテストサンプルｉにおける観測したｊ番染色体ドースである、該ＮＣＶ計算ステップを有する。

【0015】

他の実施形態において、胎児及び母体の核酸を含む母体テストサンプルにおける異なった部分的胎児染色体異数性の有無を決定する方法を提供する。この方法は、(ａ)前記母体テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの配列タグ数を同定し、また前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの正規化断片配列の配列タグ数を同定するステップと、(ｃ)前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれに対して同定した前記配列タグ数、及び前記正規化断片配列に対して同定した前記配列タグ数を使用して、前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の断片それぞれの前記単独断片ドースそれぞれを、前記任意の１つ又はそれ以上の関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれの閾値と比較し、これにより前記母体テストサンプルにおける任意の１つ又はそれ以上の異なった部分的胎児染色体異数性の有無を決定するステップとを有する。前記ステップ(ａ)は、前記テストサンプルにおける前記核酸分子の少なくとも一部分をシークエンシングし、前記テストサンプルにおける前記胎児及び母体の前記核酸分子に関する配列情報を得る。

【0016】

他の実施形態において、前記ステップ(ｃ)は、前記関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれの単独断片ドースを、前記関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれに対して同定した前記配列タグ数と、前記関心対象染色体における任意の１つ又はそれ以上の染色体断片それぞれの前記正規化断片配列に対して同定した前記配列タグ数との比として計算するステップを有する。若干の実施形態において、前記ステップ(ｃ)は、(i)前記ステップ(ｂ)で前記関心対象染色体それぞれに対して同定した前記配列タグ数を前記関心対象染色体それぞれの長さに関連付けすることによって、前記関心対象染色体それぞれの配列タグ密度比を計算するステップ、(ii)前記ステップ(ｂ)で前記正規化断片配列に対して同定した前記配列タグ数を前記正規化染色体それぞれの長さに関連付けすることによって、前記正規化断片配列それぞれの配列タグ密度比を計算するステップ、及び(iii)前記ステップ(i)及び(ii)で計算した前記配列タグ密度比を使用して、前記関心対象染色体それぞれの単独染色体ドースを計算するステップであって、前記染色体ドースは、前記関心対象染色体における前記配列タグ密度比と、前記関心対象染色体それぞれの前記正規化断片配列における前記配列タグ密度比との比として計算するステップを有する。この方法は、さらに、正規化断片値（ＮＳＶ：normalized segment value）を計算するＮＳＶ計算ステップであって、前記ＮＳＶは、次式のように、前記断片ドースを、適格サンプルセットにおける対応の断片ドースの平均に関連付ける値とし、

【数2】

ここで、

は、それぞれ適格サンプルセットにおけるｊ番断片ドースに対する推定した平均及び標準偏差であり、ｘ_ijはテストサンプルｉにおける観測したｊ番断片ドースである、該ＮＳＶ計算ステップを有する。

【0017】

染色体ドース又は断片ドースは正規化断片配列を使用して決定する上述した方法の実施形態において、前記正規化断片配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１つ又はそれ以上における単独断片とする。代案として、前記正規化断片配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１つ又はそれ以上における断片グループとする。

【0018】

部分的胎児染色体異数性の有無を決定する方法のステップ(ａ)〜(ｄ)は、異なる母体検体からのテストサンプルに対して繰り返して行う。本発明方法によって決定できる部分的胎児染色体異数性は、任意の染色体における任意の断片の部分的異数性を含む。部分的胎児染色体異数性は、部分的重複、部分的増殖、部分的挿入及び部分的欠失から選択することができる。本発明方法により決定できる部分異数性の例としては、１番染色体の部分モノソミー、４番染色体の部分モノソミー、５番染色体の部分モノソミー、７番染色体の部分モノソミー、１１番染色体の部分モノソミー、１５番染色体の部分モノソミー、１７番染色体の部分モノソミー、１８番染色体の部分モノソミー、及び２２番染色体の部分モノソミーがある。

【0019】

上述した実施形態のうち任意の１つにおいて、前記テストサンプルは、血液、血漿、血清、尿及び唾液のサンプルから選択した母体サンプルとする。任意な１つの実施形態において、テストサンプルは血漿サンプルとすることができる。母体サンプルの核酸分子は、胎児及び母体の無細胞ＤＮＡ分子の混合物とする。核酸のシークエンシングは、次世代シークエンシング（ＮＧＳ）を使用して実施することができる。若干の実施形態において、前記シークエンシングは、可逆色素ターミネーターによるシークエンシング・バイ・シンセシスを使用する。他の実施形態において、前記シークエンシングは、シークエンシング・バイ・リゲーションとする。さらに他の実施形態において、前記シークエンシングは、単独分子シークエンシングとする。随意的に、増幅ステップをシークエンシングの前に行うものとする。

【0020】

他の実施形態において、本発明は、胎児及び母体の無細胞ＤＮＡ分子の混合物を含む母体血漿テストサンプルにおける任意の２０又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。この方法は、(ａ)前記母体血漿テストサンプルにおける胎児及び母体の無細胞ＤＮＡ分子に関する配列情報を取得するよう、無細胞ＤＮＡ分子の少なくとも一部をシークエンシングするステップと、(ｂ)前記配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の２０又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、また前記任意の２０又はそれ以上の関心対象染色体それぞれの正規化染色体の配列タグ数を同定するステップと、(ｃ)前記任意の２０又はそれ以上の関心対象染色体それぞれに対して同定した前記配列タグ数、及び前記正規化染色体に対して同定した前記配列タグ数を使用して、前記任意の２０又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び(ｄ)前記任意の２０又はそれ以上の関心対象染色体それぞれの前記単独染色体ドースそれぞれを、前記任意の２０又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより前記母体血漿テストサンプルにおける任意の２０又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有する。

【0021】

他の実施形態において、本発明は、テストサンプルにおける関心対象配列、すなわち、臨床的に関連する配列のコピー数多型（変動）を同定する方法を提供し、この本発明方法は、(ａ)テストサンプル及び複数個の適格サンプルを採取するサンプル採取ステップであって、テストサンプルはテスト核酸分子を含み、複数個の適格サンプルは適格核酸分子を含むものとした、該サンプル採取ステップと、(ｂ)テストサンプルにおける胎児及び母体の核酸に関する配列情報を取得するステップと、(ｃ)適格核酸分子のシークエンシングに基づいて、前記複数個の適格サンプルにおける適格関心対象配列の適格配列ドースを計算する適格配列ドース計算ステップであり、適格配列ドースの計算は、適格関心対象配列のための、少なくとも１つの適格正規化配列におけるパラメータを決定することを含む、該適格配列ドース計算ステップと、(ｄ)適格配列ドースに基づいて、少なくとも１つの適格正規化配列を同定する適格正規化配列同定ステップであって、少なくとも１つの適格正規化配列は、前記複数個の適格サンプルにおける配列ドースに関して最小変動性及び／又は最大弁別可能性を有するものとした、該適格正規化配列同定ステップと、(ｅ)前記テストサンプルにおける核酸分子の配列に基づいて、関心対象テスト配列のテスト配列ドースを計算するテスト配列ドース計算ステップであって、テスト配列ドースの計算は、関心対象テスト配列のための少なくとも１つの正規化テスト配列におけるパラメータを決定することを含み、また少なくとも１つの正規化テスト配列は少なくとも１つの適格正規化配列に対応するものとした、該テスト配列ドース計算ステップと、(ｆ)前記テスト配列ドースを少なくとも１つの閾値に比較するステップと、(ｇ)ステップ(ｆ)における結果に基づいて、テストサンプルにおける関心対象配列のコピー数多型を評価するステップとを有する。一実施形態において、適格関心対象配列及び少なくとも１つの適格正規化配列のパラメータは、適格関心対象配列にマッピングした配列タグ数を適格正規化配列にマッピングしたタグ数に関連付け、また関心対象テスト配列及び少なくとも１つの正規化テスト配列のパラメータは、関心対象テスト配列にマッピングした配列タグ数を正規化テスト配列にマッピングしたタグ数に関連付けるものとする。若干の実施形態において、ステップ(ｂ)は、適格核酸分子及びテスト核酸分子の少なくとも一部をシークエンシングするステップであって、このシークエンシングにより、関心対象テスト配列及び適格配列のための、並びに少なくとも１つのテスト正規化配列及び少なくとも１つの適格正規化配列のための複数のマッピングした配列タグを得るものとしたステップ、テストサンプルの核酸分子の少なくとも一部をシークエンシングしてテストサンプルにおける胎児及び母体の核酸分子の配列情報を得るステップを含むものとする。若干の実施形態において、シークエンシングステップは、次世代シークエンシングとする。若干の実施形態において、シークエンシング方法は、可逆色素ターミネーターによるシークエンシング・バイ・シンセシスを使用する、大量並列シークエンシングとする。他の実施形態において、シークエンシング方法は、シークエンシング・バイ・リゲーションとする。若干の実施形態において、シークエンシングは、増幅を含むものとする。他の実施形態において、シークエンシングは、単独分子シークエンシングとする。関心対象配列のＣＮＶは、染色体異数性又は部分異数性の異数性とする。若干の実施形態において、染色体異数性は、２番トリソミー、８番トリソミー、９番トリソミー、１６番トリソミー、２１番トリソミー、１３番トリソミー、１８番トリソミー、２２番トリソミー、４７,ＸＸＹ、４７,ＸＸＸ、４７,ＸＹＹ、及びＸモノソミーから選択する。他の実施形態において、部分異数性は、部分的染色体欠失又は部分的染色体挿入である。若干の実施形態において、本発明方法によって同定されるＣＮＶは、がんに関連する染色体異数性又は部分異数性である。若干の実施形態において、テストサンプル及び適格サンプルは、生体液サンプル、例えば、血漿サンプルとし、妊娠したヒト検体のような妊娠検体から採取する。他の実施形態において、テスト生体液サンプル及び適格生体液サンプル、例えば、血漿サンプルは、がんであることが既知である又は疑われている検体から採取する。

【0022】

本明細書における実施例はヒトに関連し、専門用語も主にヒトに関するものであるが、本発明の概念は任意の植物又は動物のゲノムに適用できる。

【0023】

参照による組入れ
すべての特許、特許出願、及び本明細書に引用した参照文献に記載のあらゆる配列を含む他の文献は、参照によって、各個別の刊行物、特許又は特許出願が特別にまた個別に記載したのと同程度に、本明細書にはっきりと組入れたものとする。引用したすべての文献の関連部分を参照によって本明細書に組入れたものとする。しかし、任意の文献の引用は、本発明の従来技術である旨の了解と解釈すべきではない。

【0024】

本発明の新規な特徴を添付の特許請求の範囲に特別に記載する。本発明の特徴及び利点をよりよい理解は、本発明の原理を利用する例示的な実施形態について、図面につき行う以下の詳細な説明を参照することによって得られるであろう。

【図面の簡単な説明】

【0025】

【図1】核酸混合物を有するテストサンプルにおけるコピー数多型の有無を決定する方法１００のフローチャートである。

【図2A】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定した２１番染色体に関する染色体ドース（量）の分布であって、２１番染色体として適格な、すなわち、正常なもの（normal）に対して（○）を付し、２１番トリソミーのテストサンプルを１〜１２番染色体及びＸ染色体に（△）を付して示す。

【図2B】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定した２１番染色体に関する染色体ドース（量）の分布であって、２１番染色体として適格な、すなわち、正常なもの（normal）に対して（○）を付し、２１番トリソミーのテストサンプルを１〜２２番染色体及びＸ染色体に（△）を付して示す。

【図3A】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定した１８番染色体に関する染色体ドース（量）の分布であって、１８番染色体として適格な、すなわち、正常なもの（normal）に対して（○）を付し、１８番トリソミーのテストサンプルを１〜１２番染色体及びＸ染色体に（△）を付して示す。

【図3B】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定した１８番染色体に関する染色体ドース（量）の分布であって、１８番染色体として適格な、すなわち、正常なもの（normal）に対して（○）を付し、１８番トリソミーのテストサンプルを１〜２２番染色体及びＸ染色体に（△）を付して示す。

【図4A】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定した１３番染色体に関する染色体ドース（量）の分布であって、１３番染色体として適格な、すなわち、正常なもの（normal）に対して（○）を付し、１３番トリソミーのテストサンプルを１〜１２番染色体及びＸ染色体に（△）を付して示す。

【図4B】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定した１３番染色体に関する染色体ドース（量）の分布であって、１３番染色体として適格な、すなわち、正常なもの（normal）に対して（○）を付し、１３番トリソミーのテストサンプルを１〜２２番染色体及びＸ染色体に（△）を付して示す。

【図5A】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定したＸ染色体に関する染色体ドース（量）の分布であって、男児のＸ染色体ドースに（４６，ＸＹ;（○））を付し、女児のＸ染色体ドースに（４６，ＸＸ;（△））を付し、Ｘモノソミーに（４５，Ｘ；（＋））を付し、複雑核型のサンプルを１〜１２番染色体に（Cplx（Ｘ））を付して示す。

【図5B】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定したＸ染色体に関する染色体ドース（量）の分布であって、男児のＸ染色体ドースに（４６，ＸＹ;（○））を付し、女児のＸ染色体ドースに（４６，ＸＸ;（△））を付し、Ｘモノソミーに（４５，Ｘ；（＋））を付し、複雑核型のサンプルを１〜２２番染色体に（Cplx（Ｘ））を付して示す。

【図6A】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定したＹ染色体に関する染色体ドース（量）の分布であって、男児のＹ染色体ドースに（４６，ＸＹ;（△））を付し、女児のＸ染色体ドースに（４６，ＸＸ;（○））を付し、Ｘモノソミーに（４５，Ｘ；（＋））を付し、複雑核型のサンプルを１〜１２番染色体に（Cplx（Ｘ））を付して示す。

【図6B】ヒトの男児又は女児の胎児を妊娠した各被検体から採取した４８個の血液サンプルのセットから抽出したｃｆＤＮＡをシークエンシングすることによって決定したＹ染色体に関する染色体ドース（量）の分布であって、男児のＹ染色体ドースに（４６，ＸＹ;（△））を付し、女児のＸ染色体ドースに（４６，ＸＸ;（○））を付し、Ｘモノソミーに（４５，Ｘ；（＋））を付し、複雑核型のサンプルを１〜２２番染色体に（Cplx（Ｘ））を付して示す。

【図7】図２，３及び４でそれぞれ示したドースから決定された２１番染色体（黒四角）、１８番染色体（●）及び１３番染色体（黒三角）の変動係数（ＣＶ：coefficient of variation）を示す。

【図8】図５及び６でそれぞれ示したドースから決定されたＸ染色体（黒四角）、及びＹ染色体（●）の変動係数（ＣＶ：coefficient of variation）を示す。

【図9】ヒト染色体によるＧＣ画分の累積分布であり、垂直軸は染色体の頻度を表し、値の下方でＧＣ含有量を水平軸に示す。

【図10】妊娠したヒト被検者から採取した７個の適格サンプル（○）及び１個のテストサンプル（◇）のセットから抽出したｃｆＤＮＡをシークエンシングすることで決定した１１番染色体の断片（81000082-10300013bp）の配列ドース（Ｙ軸）を示し、１１番染色体に部分的異数性を有する胎児を孕んでいる被検者からのサンプルを同定した。

【図11A】異常がないサンプルにおける対応染色体に関する平均（Ｙ軸）の標準偏差に対する２１番染色体の正規化した染色体ドースの分布を示す。

【図11B】異常がないサンプルにおける対応染色体に関する平均（Ｙ軸）の標準偏差に対する１８番染色体の正規化した染色体ドースの分布を示す。

【図11C】異常がないサンプルにおける対応染色体に関する平均（Ｙ軸）の標準偏差に対する１３番染色体の正規化した染色体ドースの分布を示す。

【図11D】異常がないサンプルにおける対応染色体に関する平均（Ｙ軸）の標準偏差に対するＸ染色体の正規化した染色体ドースの分布を示す。

【図11E】異常がないサンプルにおける対応染色体に関する平均（Ｙ軸）の標準偏差に対するＹ染色体の正規化した染色体ドースの分布を示す。

【図12】実施例６に記載した正規化染色体を使用して、トレーニングセット１からのサンプルで決定した２１番染色体（○）、１８番染色体（△）、１３番染色体（□）の正規化染色体値を示す。

【図13】実施例６に記載した正規化染色体を使用して、テストセット１からのサンプルで決定した２１番染色体（○）、１８番染色体（△）、１３番染色体（□）の正規化染色体値を示す。

【図14】チュー氏らによる正規化方法（サンプルにおける残存染色体用に取得した（塩基配列タグ数を有する関心対象である染色体として同定した配列タグ数を正規化する。実施例７参照）を使用して、テストセット１からのサンプルで決定した２１番染色体（○）、１８番染色体（△）、１３番染色体（□）の正規化染色体値を示す。

【図15】（実施例７で説明したように）系統的に決定した正規化染色体を使用して、トレーニングセット１からのサンプルで決定した２１番染色体（○）、１８番染色体（△）、１３番染色体（□）の正規化染色体値を示す。

【図16】（実施例７で説明したように）系統的に決定した正規化染色体を使用して、テストセット１からのサンプルで決定した２１番染色体（○）、１８番染色体（△）、１３番染色体（□）の正規化染色体値を示す。

【図17】（実施例７で説明したように）系統的に決定した正規化染色体を使用して、テストセット１からのサンプルで決定した９番染色体（○）の正規化染色体値を示す。

【図18A】Ｘ染色体（Ｘ軸）及びＹ染色体（Ｙ軸）の正規化した染色体値を示し、実施例７で説明したように、トレーニングセット及びテストセットのそれぞれで同定した５個のＸモノソミーサンプルを矢印が示す。

【図18B】Ｘ染色体（Ｘ軸）及びＹ染色体（Ｙ軸）の正規化した染色体値を示し、実施例７で説明したように、トレーニングセット及びテストセットのそれぞれで同定した３個のＸモノソミーサンプルを矢印が示す。

【図19】（実施例７で説明したように）系統的に決定した正規化染色体を使用して、テストセット１からのサンプルで決定した１〜２２番染色体の正規化染色体値を示す。

【発明を実施するための形態】

【0026】

１個又はそれ以上の関心対象である配列の総量が既知である、又はその配列の総量に違いがあると懸念される核酸混合物を有するテストサンプルにおける、関心対象である配列のコピー数多型（ＣＮＶ：copy number variations）を決定する方法を提供する。関心対象である配列は、遺伝子状態又は病状に関連することが既知又は懸念される染色体全体に関してキロベース（ｋｂ）からメガベース（Ｍｂ）の範囲にわたるゲノム配列を含む。関心対象である配列の例としては、よく知られている異数性、例えば、２１番トリソミーに関連する染色体、及びがんのような疾患で増殖される染色体断片、例えば、急性骨髄性白血病における部分的８番トリソミーに関連する染色体がある。本発明により決定することができるＣＮＶとしては、１〜２２番の染色体、Ｘ及びＹの性染色体のうち任意の１つ又はそれ以上におけるモノソミー及びトリソミー、例えば、４５,Ｘ、４７,ＸＸＸ、４７,ＸＸＹ、及び４７,ＸＹＹ、他の染色体ポリソミー、すなわち限定はしないがＸＸＸＸ、ＸＸＸＸＸ、ＸＸＸＸＹ、ＸＹＹＹＹを含むテトラソミー及びペンタソミー、染色体のうち任意の１つ又はそれ以上における断片（セグメント）の欠失及び／又は重複がある。

【0027】

本発明方法は、処理に関連する染色体間（ラン内）変動及びシークエンシング間（ラン間）変動からの見越し変動ステミング処理を担う統計的アプローチをなす。この方法は、任意の胎児異数性におけるＣＮＶ、及び種々の内科的疾患に関連すると既知である又は懸念されるＣＮＶを決定するのに適用可能である。

【0028】

他に明示しない限り、本発明の実施には、従来の技術範囲にある分子生物学、微生物学、タンパク質精製、タンパク質工学、タンパク質及びＤＮＡシークエンシング（配列決定）及び組換えＤＮＡの分野で共通して使用される普通の技術を含む。このような技術は当業者には既知であり、多くの文書及び参照文献（例えば、Sambrook et al.,”Molecular Cloning:A Laboratory Manual”,Third Edition (Cold Spring Harbor）, [2001]); 及びAusubel et al., “Current Protocols in Molecular Biology” [1987]参照。）に記載されている。

【0029】

多くの範囲が範囲を画定する数に含まれている。本明細書に記載するあらゆる最大数値限定は、あらゆるより低い数値限定をも、このようなより低い数値限定が本明細書にはっきりと記載されているように含むことを意図する。本明細書に記載するあらゆる最小数値限定は、あらゆるより高い数値限定をも、このようなより高い数値限定が本明細書にはっきりと記載されているように含むことを意図する。本明細書に記載するあらゆる数値範囲は、このようなより広い数値範囲内にあるあらゆる狭い数値範囲をも、このようなより狭い数値範囲が本明細書にはっきりと記載されているように含むことを意図する。

【0030】

本明細書に付された見出し項目は、本明細書を全体的に参照することによって理解できる本発明の種々の態様又は実施形態を限定するものではない。したがって、上述したように、以下に定義する用語は、本明細書全体を参照することによってより十分に定義されるものである。

【0031】

本明細書に別様に定義しない限り、本明細書に使用するすべての技術的及び科学的な用語は、本発明が属する当業者に共通して理解されるのと同一の意味を有する。本明細書に含まれる用語を含む種々の科学辞書は既知であり、当業者が利用可能である。本明細書に記載のものと類似又は等価な任意の方法及び材料を本発明の実施又はテストに使用できるが、幾つかの好適な方法及び材料を記載する。したがって、以下に定義する用語は、本明細書全体を参照することによってより十分に記述されるものである。本発明は、本明細書に記載される特別な方法論、手順、及び試薬に限定されるものではなく、当業者が使用する文脈に応じて変化し得る。

【0032】

定義
本明細書に使用する、単数表記の”a”,”an”及び”the”は、他に明示しない限り複数での言及も含むものとする。他に明示しない限り、核酸は左から右に５′から３′に向かう向きに記述し、アミノ酸配列は左から右にアミノからカルボキシに向かう向きでそれぞれ記述する。

【0033】

本明細書における用語「評価（assessing）」は、「正常（normal）」、「異変あり（affected）」、「ノーコール（no-call）」という３タイプの判定（コール）のうち１つによって染色体異数性の状態を特徴付けることを意味する。例えば、トリソミー有無判定場合、「正常」の判定は、パラメータ、例えばユーザー定義の信頼性閾値未満のテスト染色体ドースの値によって決定し、「異変あり」の判定は、パラメータ、例えばユーザー定義の信頼性閾値を超えるテスト染色体ドースによって決定し、「ノーコール」の判定は、パラメータ、例えば「正常」又は「異変あり」の判定を行うユーザー定義の信頼性閾値間にあるテスト染色体ドースによって決定する。

【0034】

本明細書における用語「コピー数多型」は、適格サンプルに存在する核酸配列のコピー数と比較するテストサンプルに存在する１ｋｂ以上の長さを有する核酸配列におけるコピー数の変動を意味する。「コピー数多型（copy number variation）」は、核酸における１ｋｂ以上の長さを有する配列であって、コピー数の差異はテストサンプルにおける関心対象配列を適格サンプルに存在するその関心対象配列と比較することによって見出す。コピー数多型には、微小欠失を含む欠失、微小挿入を含む挿入、重複、増殖、逆位、転座、及び複合多部位変異がある。ＣＮＶは染色体異数性及び部分的異数性を含む。

【0035】

本明細書における用語「異数性」は、染色体全体又は染色体一部における不足又は過剰によって生ずる遺伝子材料の不均衡を意味する。

【0036】

本明細書における用語「染色体異数性」及び「完全染色体異数性」は、染色体全体における不足又は過剰によって生ずる遺伝子材料の不均衡を意味し、また生殖細胞系列異数性及びモザイク異数性を含む。

【0037】

本明細書における用語「部分異数性」及び「部分染色体異数性」は、染色体の一部における不足又は過剰、例えば、部分モノソミー及び部分トリソミーによって生ずる遺伝子材料の不均衡を意味し、転座、欠失及び挿入によって生ずる不均衡を含む。

【0038】

本明細書における用語「異数性サンプル」は、染色体含有量が正倍数性でない検体を表すサンプル、すなわち、染色体のコピー数が異常な検体を表すサンプルを意味する。

【0039】

本明細書における用語「異数性染色体」は、異常コピー数のサンプルに存在することが既知である又は決定された染色体を意味する。

【0040】

本明細書における用語「複数」は、本発明方法に使用するテストサンプル及び適格サンプルにおいて、コピー数多型における大きな差異を識別するのに十分な多数の核酸分子又は塩基配列タグ（例えば、染色体ドース）を意味する。若干の実施形態において、２０〜４０個の塩基対（ｂｐ）リード（reads）を有する、少なくとも約３×１０^６個の塩基配列タグ、少なくとも約５×１０^６個の塩基配列タグ、少なくとも約８×１０^６個の塩基配列タグ、少なくとも約１０×１０^６個の塩基配列タグ、少なくとも約１５×１０^６個の塩基配列タグ、少なくとも約２０×１０^６個の塩基配列タグ、少なくとも約３０×１０^６個の塩基配列タグ、少なくとも約４０×１０^６個の塩基配列タグ、少なくとも約５０×１０^６個の塩基配列タグを、各テストサンプルから得る。

【0041】

本明細書における用語「ポリヌクレオチド」、「核酸」及び「核酸分子」は、互いに置き換え可能に使用され、ヌクレオチドの共有結合配列（すなわち、ＲＮＡのリボヌクレオチド及びＤＮＡのデオキシリボヌクレオチド）を意味し、１つのヌクレオチドにおけるペントースの３′位置をホスホジエステル基によって、次のヌクレオチドにおけるペントースの５′位置に結合し、限定しないがＲＮＡ，ＤＮＡ，及びｃｆＤＮＡ分子を含む任意の核酸形式の配列を含む。用語「ポリヌクレオチド」は、限定しないが単独らせん及び２重らせんのポリヌクレオチドを含む。

【0042】

本明細書における用語「部分」は、生物学的サンプルにおける胎児及び母体の核酸分子の配列情報量の合計が１ヒトゲノムの配列情報より少ない量を意味する。

【0043】

本明細書における用語「テストサンプル」は、コピー数に変動があったことが懸念される少なくとも１つの核酸配列を有する核酸混合物を含むサンプルを意味する。テストサンプルに存在する核酸は「テスト核酸」と称する。

【0044】

本明細書における用語「適格サンプル」は、テストサンプルにおける核酸と比べられるコピー数が既知で存在する核酸混合物を有するサンプルを意味し、正常、すなわち関心対象である配列に異数性がないサンプルであり、例えば、２１番染色体の正規化染色体を識別するのに使用する適格サンプルは２１番トリソミーサンプルではないサンプルである。

【0045】

本明細書における用語「トレーニングセット」は、異変ありサンプル及び異変なしサンプルを含むことができるサンプルセットを意味する。トレーニングセットにおける異変なしサンプルは、正規化配列、例えば、正規化染色体を識別する適格サンプルとして使用し、異変なしサンプルの染色体ドースを使用し、関心対象である各配列、例えば、染色体それぞれの閾値を設定する。トレーニングセットにおける異変ありサンプルは、異変ありテストサンプルを異変なしサンプルから容易に区別できることを検証するのに使用することができる。

【0046】

本明細書における用語「適格核酸」は、「適格配列」と互いに置き換え可能に使用することができ、「適格配列」はテスト配列又はテスト核酸の総量と比較する配列である。適格配列は既知の表象で、すなわち、適格配列の総量が既知で生物学的サンプルに存在する。「関心対象である適格配列」は、適格サンプルにおいて総量が既知である適格配列であり、内科的疾患のある個人における配列表現の差異に関連する配列である。

【0047】

本明細書における用語「関心対象（である）配列」は、健康な個人対疾患のある個人における配列表現の差異に関連する核酸配列を意味する。関心対象配列は、内科的疾患又は遺伝子疾患における誤表現、すなわち、過剰表現又は不足表現されている染色体における配列である。関心対象配列は、さらに、染色体の一部、すなわち染色体断片（セグメント）、又は染色体にもなり得る。例えば、関心対象配列は、異数性症状で過剰表現される染色体、又はがんで不足表現される腫瘍抑制因子をコード化する遺伝子となり得る。関心対象配列は、検体における細胞の全体母集団又は部分母集団における過剰表現又は不足表現になっている配列を含む。「適格関心対象配列」は適格サンプルにおける関心対象配列である。「テスト関心対象配列」はテストサンプルにおける関心対象配列である。

【0048】

本明細書における用語「正規化配列」は、サンプル間でマッピングされる塩基配列タグ（ときに「配列タグ」と略称する）の数における変動（多型）を呈する配列であって、正規化パラメータとして使用される関心対象配列のそれと最も近似し、また１つ又はそれ以上の異変なしサンプルから異変ありサンプルを最も区別できるシークエンシング実行である。「正規化染色体」又は「正規化染色体配列」は、「正規化配列」の例である。「正規化染色体配列」は、単独染色体又は染色体グループによって構成することができる。「正規化断片」は「正規化配列」の他の例である。「正規化断片配列」は、染色体の単独断片によって構成することができる、又は同一若しくは異なった染色体における２つ又はそれ以上の断片によって構成することができる。

【0049】

本明細書における用語「弁別可能性」は、１つ又はそれ以上の異変なし、すなわち正常サンプルを、１つ又はそれ以上の異変あり、すなわち異数性サンプルから区別できる正規化染色体の特徴を意味する。

【0050】

本明細書における用語「配列ドース」は、関心対象配列の配列タグ密度を正規化配列のタグ密度に関連付けるパラメータを意味する。「テスト配列ドース」は、関心対象配列、例えば２１番染色体の配列タグ密度を正規化配列、例えばテストサンプルで決定した９番染色体の配列タグ密度に関連付けするパラメータである。同様に、「適格配列ドース」は、関心対象配列の配列タグ密度を適格サンプルで決定した正規化配列の配列タグ密度に関連付けするパラメータである。

【0051】

本明細書における用語「配列タグ密度」は、基準ゲノム配列にマッピングされる配列リード（reads)数を意味し、例えば、２１番染色体の配列タグ密度は、基準ゲノムの２１番染色体にマッピングされるようシークエンシング方法によって生じた配列リード数である。本明細書における用語「配列タグ密度比」は、基準ゲノム配列の染色体、例えば、２１番染色体にマッピングされる配列タグ数の、基準ゲノムにおける２１番染色体の長さに対する比を意味する。

【0052】

本明細書における用語「次世代シークエンシング（ＮＧＳ：Next Generation Sequencing」は、クローン的に増幅された、また単独核酸分子における大量並列シークエンシングができるシークエンシング方法を意味する。ＮＧＳにおける非限定的な例としては、可逆色素ターミネータを使用するシークエンシング・バイ・シンセシス（sequencing-by-synthesis）及びシークエンシング・バイ・リゲーション（sequencing-by-ligation）がある。

【0053】

本明細書における用語「パラメータ」は、数量的データセット及び／又は数量的データセット相互間の数的関係性を特徴付ける数値を意味する。例えば、染色体にマッピングされる配列タグ数と、配列タグがマッピングされる染色体の長さとの比（又は比の関数）をパラメータとする。

【0054】

本明細書における用語「閾値」及び「適格閾値」は、適格認定するデータセットを使用して計算し、また有機体におけるコピー数多型、例えば異数性に関する診断上の制限値として作用する任意の数値を意味する。本発明を実施することから得られた結果が閾値を超える場合、被検体はコピー数多型、例えば２１番トリソミーがあると診断することができる。本発明に記載する方法の適切な閾値は、サンプルのトレーニングセット用に計算した正規化値（例えば、染色体ドース、ＮＣＶｓ、又はＮＳＶｓ）を解析することによって同定することができる。閾値は、適格（すなわち、異変なし）サンプル及び異変ありサンプルの双方を有するトレーニングセットにおける適格（すなわち、異変なし）サンプルを使用して同定することができる。トレーニングセットにおける染色体異数性があると分かっているサンプル（すなわち、異変ありサンプル）を使用して、選択した閾値がテストセットにおける異変なしサンプルから異変ありを区別するのに有用であるかを確認することができる（本明細書の実施例参照）。閾値選択は、分類を行わなければならないと希望するユーザーの確信レベルに依存する。若干の実施形態において、適切な閾値を同定するのに使用するトレーニングセットは、少なくとも１０個、少なくとも２０個、少なくとも３０個、少なくとも４０個、少なくとも５０個、少なくとも６０個、少なくとも７０個、少なくとも８０個、少なくとも９０個、少なくとも１００個、少なくとも２００個、少なくとも３００個、少なくとも４００個、少なくとも５００個、少なくとも６００個、少なくとも７００個、少なくとも８００個、少なくとも９００個、少なくとも１０００個、少なくとも２０００個、少なくとも３０００個、少なくとも４０００個、又はそれより多くの個数のサンプルを有するものとする。より多くの適格サンプルのセットを使用することは、閾値の診断有用性を改善するのに有利である。

【0055】

本明細書における用語「正規化値」は、関心対象配列（例えば、染色体又は染色体断片）に対して同定された配列タグの数を、正規化配列（例えば、正規化染色体又は正規化染色体断片）に対して同定された配列タグの数に関連付けする数値を意味する。例えば、「正規化値」は、本明細書のいたるところに記載した染色体ドースとすることができる、又は本明細書のいたるところに記載したＮＣＶ（Normalized Chromosome Value）又は本明細書のいたるところに記載したＮＳＶ（Normalized Segment Value）とすることができる。

【0056】

本明細書における用語「リード（read）」は、十分な長さ（例えば、少なくとも約３０ｂｐ）のＤＮＡ配列を意味し、このリードを使用してより大きな配列又は領域を同定することができ、例えば、染色体又はゲノム領域又は遺伝子に整列させ、また特別に割り当てることができる。

【0057】

本明細書における用語「配列タグ」は、「マッピングされた配列タグ」と互いに置き換えて使用され、より大きな配列、例えば基準ゲノムに整列(alignment)によって特別に割り当てられた、すなわちマッピングされた配列リードを意味する。マッピングされた配列タグは、基準ゲノムに一意的にマッピングされる、すなわち、基準ゲノムに対する単独ロケーションとして割り当てられる。基準ゲノムに対して１ロケーションより多いロケーションでマッピングできるタグ、すなわち、一意的にマッピングされないタグはこの解析には含まれない。

【0058】

本明細書における用語「整列した（aligned）」、「整列(alignment)」、又は「整列する（aligning）」は、基準ゲノムから既知の配列に対する核酸分子の順番における一致として同定される１つ又はそれ以上の配列状態を意味する。このような整列は、手作業で、又は例えば、イルミナ・ゲノミクス・アナリシス（Illumina Genomics Analysis）におけるパイプラインの一部として配給されるヌクレオチドデータの効率的局所的整列（ＥＬＡＮＤ：Efficient Local Alignment of Nucleotide Data）コンピュータアルゴリズムを含むコンピュータアルゴリズムによって行うことができる。

【0059】

本明細書における用語「基準ゲノム」は、検体から同定された配列を参照するのに使用することができる任意の有機体又はウイルスにおける任意の特別な既知ゲノム配列（部分又は全体のいずれか）を意味する。例えば、ヒト検体並びに他の多くの有機体用に使用される基準ゲノムは、バイオテクノロジー情報ナショナルセンター（www.ncbi.nlm.hih.gov.）において見つけることができる。「ゲノム」は、有機体又はウイルスにおける核酸配列で表現される完全遺伝情報を意味する。

【0060】

本明細書における用語「臨床関連配列（clinically-relevant sequence）」は、遺伝子疾患又は病状に関連する又は関与することが既知である、又は疑われる核酸配列を意味する。臨床関連配列の有無を決定することは、内科的疾患の診断を決定する若しくは診断の確認をする上で、又は疾病の進行診断を行う上で有用である。

【0061】

本明細書において、核酸又は核酸混合物の文脈で使用される用語「由来する（derived）」は、核酸がその起源となる発生源（ソース）から得られたことを意味する。例えば、一実施形態において、２つの異なったゲノムから由来する核酸混合物とは、核酸、例えばｃｆＤＮＡがネクローシス又はアポトーシスのような自然発生的プロセスによって細胞から自然に放出されたものであることを意味する。他の実施形態においては、２つの異なったゲノムから由来する核酸混合物とは、核酸を検体からの細胞における２つの異なったタイプから抽出したことを意味する。

【0062】

本明細書における用語「混合サンプル（mixed sample）」は、異なったゲノムに由来する核酸の混合物を含むサンプルを意味する。

【0063】

本明細書における用語「母体サンプル（maternal sample）」は、妊娠した検体、例えば、女性のヒトから採取した生物学的サンプルを意味する。

【0064】

本明細書における用語「生体液（biological fluid）」は、生体液源から採取した液体を意味し、例えば、血液、血清、血漿、痰、破出液、脳脊髄液、尿、精液、汗、涙、唾液等がある。本明細書で使用する用語「血液」、「血漿」及び「血清」は、それらの画分又は処理した部分をも包含する。同様に、サンプルを生検、綿棒、塗抹等から採取する場合、「サンプル」は生検、綿棒、塗抹等に由来する処理画分又は部分をも含む。

【0065】

本明細書における用語「母体核酸」及び「胎児核酸」は、それぞれ妊娠女性検体の核酸及びその妊娠女性検体が孕んでいる胎児の核酸を意味する。

【0066】

本明細書で使用する用語「〜に対応する」は、異なった検体ゲノムに存在し、必ずしもすべてのゲノムにおいて同一配列を有するものではないが、例えば、遺伝子又は染色体である関心対象配列の遺伝情報以外の固有性を与えるのに供される、例えば、遺伝子又は染色体である核酸配列を意味する。

【0067】

本明細書で使用する用語「ほぼ無細胞」は、所望のサンプルの調合であって、この所望サンプルから通常関連する成分を除去する該所望サンプルを包含する。例えば、血漿サンプルは、血漿に関連する血液細胞、例えば赤色細胞（赤血球）を除去することによってほぼ無細胞状態にしたものである。若干の実施形態においては、ほぼ無細胞のサンプルは、除去処理を行わないと、ＣＮＶのテストをすべき所望遺伝的材料に寄与するであろう細胞を除去する処理を行う。

【0068】

本明細書に使用する用語「胎児画分」は、胎児核酸及び母体核酸を含むサンプル内に存在する胎児核酸の画分を意味する。

【0069】

本明細書に使用する用語「染色体」は、染色質に由来し、またＤＮＡ及びタンパク質成分（ヒストン）を含む生きている細胞の遺伝担持遺伝子キャリアを意味する。本明細書では、従来の国際的に認識されている個体ヒトゲノム染色体番号付け体系を採用する。

【0070】

本明細書に使用する用語「ポリヌクレオチド長さ」は、基準ゲノムの配列又は領域における核酸分子（ヌクレオチド）の絶対数を意味する。用語「染色体長さ」は、塩基対における染色体の既知の長さを意味し、例えば、ワールド・ワイド・ウェブ上の”genome.ucsc.edu/cgi-bin/hgTracks?Hgsid=167155613&chromInfoPage=”で見つかるヒト染色体のNCBI36/hg18アセンブリに規定されている。

【0071】

本明細書における用語「検体」は、ヒト検体並びにヒトではない検体、例えば、哺乳類、無脊椎動物、脊椎動物、菌類、酵母、細菌、及びウイルスをも意味する。本明細書における例はヒトに関連し、専門用語は主にヒト関連指向であるが、本発明の概念は任意の植物又は動物からのゲノムに適用でき、また獣医学、動物科学、研究所等の分野において有用である。

【0072】

本明細書における用語「病状」は、すべての疾患及び障害を含む広い意味での「内科的疾患」を意味するが、個人の健康に影響を及ぼし、医療支援の恩恵を受ける、又は医療処置の実施を受けることがあるような「傷害」及び妊娠のような正常健康状態をも含むものとする

【0073】

用語「完全」は、本明細書において全体染色体の過剰又は不足に言及する染色体異数性につき使用する。

【0074】

染色体異数性につき使用する用語「部分」は、染色体の一部における過剰又は不足に言及する。

【0075】

本明細書における用語「モザイク」は、単独受精卵から成長した１個体における異なった核型を有する２つの細胞集団が存在することを意味する。モザイク現象は、成長中の突然変異から生じ、この突然変異は成熟細胞の小集団にのみ波及する。

【0076】

本明細書における用語「非モザイク」は、１つの核型の細胞よりなる有機体、例えば、ヒト胎児を意味する。

【0077】

染色体ドースを決定することにつき使用する用語「染色体を使用する」は、本明細書において、染色体のために得る配列情報、すなわち、染色体のために得る配列タグの数を使用することを意味する。

【0078】

本明細書に使用する用語「感度」は、真陽性及び偽陰性の合計で真陽性を除算した数値に等しい。

【0079】

本明細書に使用する用語「特異度」は、真陰性及び偽陽性の合計で真陰性を除算した数値に等しい。

【0080】

本明細書における用語「患者サンプル」は、患者、すなわち医療的注意、ケア又は処置を受ける個人から得た生物学的サンプルを意味する。患者サンプルは、本明細書に記載する任意のサンプルとすることができる。好適には、患者サンプルは、非侵襲性手順で採取し、例えば、末梢血サンプル又は糞便サンプルとする。

【0081】

本明細書における用語「低二倍性」は、種の染色体特徴における正常な半数より１つ又はそれ以上少ない染色体数を意味する。

【0082】

説明
本発明は、２つの異なったゲノム由来の核酸混合物を有し、１つ又はそれ以上の関心対象配列における総量が異なることが既知である、又は疑われるテストサンプルにおける、異なる関心対象配列のコピー数多型（ＣＮＶ：copy number variation）を決定する方法を提供する。本発明方法によって決定されたコピー数多型としては、全体染色体の過剰又は不足、顕微鏡的に可視の極めて大きな染色体断片を含む変更、キロベース（ｋｂ）からメガベース（Ｍｂ）にも及ぶＤＮＡ断片における超顕微鏡的コピー数多型の多量存在がある。本発明方法は、この方法は、処理に関連する染色体間変動及びシークエンシング間変動からの見越し変動ステミング処理を担う統計的アプローチを含む。この方法は、任意の胎児異数性におけるＣＮＶ、及び種々の内科的疾患に関連すると既知である若しくは懸念されるＣＮＶを決定するのに適用可能である。本発明方法によって決定できるＣＮＶには、１〜２２番染色体、Ｘ及びＹ染色体のうち任意の１つ又はそれ以上におけるトリソミー及びモノソミー、他の染色体ポリソミー、及び染色体のうち１つ又はそれ以上における断片（セグメント）の欠失及び／又は重複が含まれ、こらはテストサンプルの核酸を１回だけシークエンシングすることによって決定することができる。いかなる異数性もテストサンプルの核酸を１回だけシークエンシングすることによって得られる配列情報から決定することができる。

【0083】

ヒトゲノムにおけるＣＮＶは、ヒトの及び多様性及び疾病素因に大きな影響を与える（Redon et al., Nature 23:444-454 [2006], Shaikh et al. Genome Res 19:1682-1690 [2009]参照）。ＣＮＶは、異なるメカニズムによる遺伝的疾病に関与し、多くの場合遺伝子量又は遺伝子の乱れによる不均衡に起因することが分かっている。遺伝的疾患に直接関連することの他に、ＣＮＶは、疾患となり得る表現型異常の仲立ちをすることがしられている。近年、幾つかの研究は、正常な対照例と比較すると、自閉症、ＡＤＨＤ及び統合失調症のような複合疾患における、稀な又はデノボ（新）なＣＮＶの増加を報告しており、稀な又はユニークなＣＮＶの潜在的病原性を浮き彫りにしている（Sebat et al., 316:445-449 [2007]; Walsh et al., Science 320:539-543 [2008]参照）。ＣＮＶは、主に欠失、重複、挿入及び不均衡な転座事象に起因するゲノム再編成から生ずる。

【0084】

本明細書に記載する方法は、次世代シークエンシング技術（ＮＧＳ：next generation sequencing technology）を採用し、クローン的に増幅したＤＮＡテンプレート又は単独ＤＮＡ分子をフローセル内で大量並列的にシークエンシングする（例えば、Volkerding et al., Clin Chem 55:641-658 [2009]; Metzker M Nature Rev 11: 31-46 [2010]参照）。高いスループットの配列情報の他に、ＮＧＳは、各配列リードが個別クローンＤＮＡテンプレート又は単独ＤＮＡ分子を表現する計数可能な「配列タグ」である点で定量的情報を提供する。ＮＧＳのシークエンシング技術としては、ピロシークエンシング（pyrosequencing）、可逆色素ターミネータを使用するシークエンシング・バイ・シンセシス（sequencing-by-synthesis）、オリゴヌクレオチドのプローブ結紮によるシークエンシング、及びイオン半導体シークエンシングがある。個別サンプルからのＤＮＡを個別にシークエンシングする（すなわち、単独シークエンシング）、又は複数サンプルからのＤＮＡをプールし、１回のシークエンシング作業（ラン）でインデックス付きのゲノム分子としてシークエンシング（すなわち、多重シークエンシング）し、ＤＮＡ配列の数憶個のリードを生ずることができる。本発明方法による配列情報を得るのに使用できるシークエンシング技術の例を以下に説明する。

【0085】

シークエンシング方法
若干のシークエンシング技術は市場で入手可能であり、例えば、アフィメトリクス（Affymetrix Inc.[カリフォルニア州サニーベール]）社からのシークエンシング・バイ・ハイブリダイゼーション基盤、及び４５４ライフ・サイエンシズ（Life Sciences [コネチカット州ブラッドフォード]）社、イルミナ／ソレクサ（Illumina/Solexa [カリフォルニア州ヘイワード]）社及びヘリコス・バイオサイエンシズ（Helicos Biosciences [マサチューセッツ州ケンブリッジ]）社からのシークエンシング・バイ・シンセシス基盤、及び、アプライド・バイオシステムズ（Applied Biosystems [カリフォルニア州フォスターシティ]）社からのシークエンシング・バイ・リゲーション基盤があり、これらを以下に説明する。ヘリコス・バイオサイエンシズ社のシークエンシング・バイ・シンセシスを使用して実施する単独分子シークエンシングの他に、他の単独分子シークエンシング技術としては、パシフィック・バイオサイエンシズ（Pacific Biosciences）社のＳＭＲＴ（登録商標）、イオン・トレント（登録商標）社の技術、及び例えば、オックスフォード・ナノポア・テクノロジーズ（Oxford Nanopore Technologies）社が開発したナノポア（細孔）シークエンシングがある。自動化サンガー（Sanger）方法は「第１世代」技術として見られているが、自動化サンガーシークエンシングを含むサンガーシークエンシングも、本発明方法に使用することができる。他のシークエンシング方法としては、核酸画像形成（イメージング）技術、例えば、原子間力顕微鏡（ＡＦＭ：atomic force microscopy）又は透過型電子顕微鏡（ＴＥＭ：transmission electron microscopy）がある。典型的シークエンシング技術を以下に説明する。

【0086】

一実施形態において、本発明方法は、ヘリコス社の真単独分子シークエンシング（ｔＳＭＳ：true Single Molecule Sequencing）技術（Harris T.D.et al., Science 320:106-109 [2008]参照）を使用して、テストサンプルにおける核酸の配列情報、例えば母体サンプルにおけるｃｆＤＮＡを得る。ｔＳＭＳ技術において、ＤＮＡサンプルを約１００〜２００個のヌクレオチドのストランドに開裂し、またポリＡ配列を各ＤＮＡストランドの３′端部に付加する。各ストランドは、蛍光ラベル付けされたアデノシンヌクレオチドの付加によってラベル付けされる。ＤＮＡストランドをつぎにフローセル内で交配させ、このフローセルは数１００万個のオリゴＴ捕捉部位を収容し、これらオリゴＴ捕捉部位はフローセル表面に不動に固定する。そのテンプレートは約１憶テンプレート／ｃｍ^２の密度にすることができる。このフローセルを機器、例えばＨｅｌｉＳｃｏｐｅ（登録商標）シークエンサーに装着し、レーザーをフローセルの表面に照射し、各テンプレーの位置を明らかにする。ＣＣＤカメラはフローセル表面上のテンプレート位置をマッピングすることができる。テンプレートの蛍光レベルを開裂し、洗い出す。シークエンシング反応はＤＮＡポリメラーゼ及び蛍光ラベル付けヌクレオチドを導入することによって開始する。オリゴＴ核酸ハプライマーとして作用する。ポリメラーゼは、テンプレート指導に従ってラベル付けヌクレオチドをプライマーに組込む。ポリメラーゼ及び組込まれなかったヌクレオチドを除去する。蛍光ラベル付けヌクレオチドの組込みを指導するテンプレートは、フローセル表面の画像形成によって判別される。画像形成後、開裂ステップは、蛍光ラベルを除去し、このプロセスは所望のリード長さを得るまで他の蛍光ラベル付けヌクレオチドに対して繰り返す。各ヌクレオチド付加ステップで配列情報を収集する。単独分子シークエンシング技術による全ゲノムシークエンシングは、シークエンシングライブラリ準備におけるＰＣＲ塩基増幅を排除し、またサンプル調合の直接性により、そのサンプルのコピー測定ではなくサンプル自体の直接測定を可能にする。

【0087】

他の実施形態において、本発明方法は、（ロシュ[Roche]社）４５４シークエンシング（例えば、Margulies, M.et.al. Nature 437:376-380 [2005]参照）を使用して、テストサンプルにおける核酸の配列情報、例えば母体テストサンプルにおけるｃｆＤＮＡを得る。４５４シークエンシングは、２つのステップを有する。第１ステップにおいて、ＤＮＡは、約３００〜８００個の塩基対フラグメントに切り分け、これらフラグメントは端部が粗い。次にオリゴヌクレオチドアダプタをフラグメントの端部に連結する。アダプタはフラグメントの増幅及びシークエンシングのプライマーとして作用する。フラグメントをＤＮＡ捕捉ビード、例えば、ストレプトアビジン被覆ビードに取付け、この取付けには、例えば、５′ビオチンタグを含むアダプタＢを使用する。ビードに取付けたフラグメントは、オイル−水エマルションの液滴内でＰＣＲ増幅される。この結果、各ビードにクローン的に増幅したＤＮＡフラグメントの多数のコピーを生ずる。第２ステップにおいて、ビードをウェル（ピコリットルのサイズ）内に捕捉する。ピロシークエンシングを各フラグメントに対して並列的に行う。１つ又はそれ以上のヌクレオチドの付加は光信号を発生し、この光信号をシークエンシング機器のＣＣＤカメラによって記録する。信号強度は組込まれたヌクレオチドの数に比例する。ピロシークエンシングは、ヌクレオチド付加の際に放出されるピロリン酸塩（ＰＰｉ）を利用する。ＰＰｉは、アデノシン５′ホスホ硫酸の存在下でＡＴＰスルフリル化によってＡＴＰに変換される。ルシフェラーゼ（発光酵素）はＡＴＰを使用して、ルシフェリンをオキシルシフェリンに変換し、またこの反応は光を発生し、この光を測定及び解析する。

【0088】

他の実施形態において、本発明方法は、ＳＯＬｉＤ（登録商標）技術（アプライド・バイオシステムズ [Applied Biosystems]社）を使用して、テストサンプルにおける核酸の配列情報、例えば母体テストサンプルにおけるｃｆＤＮＡを得る。ＳＯＬｉＤシークエンシング・バイ・リゲーションにおいて、ゲノムＤＮＡをフラグメントに切り分け、フラグメントの５′及び３′端部にアダプタを取付け、フラグメントライブラリを生成する。代案として、フラグメントの５′及び３′端部にアダプタを取付け、フラグメントを円形に配列し、円形に配列されたフラグメントを短縮化して内部アダプタを生成し、またこの結果生じたフラグメントの５′及び３′端部にアダプタを取付けて整合対ライブラリを生成することによって、内部アダプタを導入することができる。つぎに、ビード、プライマー、テンプレート、及びＰＣＲを収容するマイクロリアクタ内でクローンビード集団を調製する。ＰＣＲに続いて、テンプレートを変性させ、ビードを増やして拡張したテンプレートでビードを分離する。選択したビードにおけるテンプレートに３′修飾を加え、これによりスライドガラスへの結合が可能になる。配列は、ランダムなオリゴヌクレオチドを、順次に、特定のフルオロフォア（蛍光色素分子）によって識別される中心的な決定塩基（又は塩基対）と部分的にハイブリダイゼーション（交配）及びリゲーション（連結）することによって決定することができる。色を記録した後、連結されたオリゴヌクレオチドを開裂し、また除去し、つぎに、このプロセスを繰り返す。

【0089】

他の実施形態において、本発明方法は、パシフィック・バイオサイエンシズ社の単独分子リアルタイム（ＳＭＲＴ）シークエンシング技術を使用して、テストサンプルにおける核酸の配列情報、例えば母体テストサンプルにおけるｃｆＤＮＡを得る。ＳＭＲＴシークエンシングにおいて、色素ラベル付きヌクレオチドの連続的組込みをＤＮＡ合成中に画像化する。単独ＤＮＡポリメラーゼ分子は、リンに結合したヌクレオチドが成長するプライマーストランドに組込まれている間に配列情報を取得する、個別ゼロ・モード波長検出器（ＺＭＷ検出器：zero-mode wavelength detector）の底面に取り付く。ＺＭＷは閉じ込め構体であり、ＤＮＡポリメラーゼによる単独ヌクレオチドの組込みを、ＺＭＷに対して激しく（ミリ秒単位で）出入りするよう拡散する蛍光ヌクレオチドを背景として観察することができる。ヌクレオチドが成長ストランドに組込まれるのには数ミリ秒かかる。この時間中、蛍光ラベルは励起して蛍光信号を発生し、また蛍光タグが開裂する。色素の対応する蛍光測定はどの塩基が組込まれたかを示す。このプロセスを繰り返す。

【0090】

他の実施形態において、本発明方法は、ナノポア（細孔）シークエンシング（例えば、Soni GV and Meller A. Clin Chem 53:1996-2001 [2007]参照）を使用して、テストサンプルにおける核酸の配列情報、例えば母体テストサンプルにおけるｃｆＤＮＡを得る。ナノポアシークエンシングＤＮＡ解析技術は、オックスフォード・ナノポア・テクノロジーズ社（英国オックスフォード）を含む多くの会社によって産業的に開発されている。ナノポアシークエンシングは単独分子シークエンシング技術であり、これによってＤＮＡの単独分子をナノポアに通過させるとき直接シークエンシングすることができる。ナノポアは直径１ナノメートルのオーダーの細孔である。ナノポアを導電流体内に浸漬し、電位差（電圧）を印加することによってナノポアにイオンが導通することにより僅かな電流を生ずる。流れる電流の量はナノポアのサイズ及び形状の影響をうける。ＤＮＡ分子がナノポアを通過するとき、ＤＮＡ分子におけるヌクレオチドはナノポアを異なる程度で塞ぎ、ナノポアに流れる電流の大きさを異なる程度で変化する。このようにして、ＤＮＡ分子がナノポアを通過するときの電流変化がＤＮＡ配列のリード（読取り）を表す。

【0091】

他の実施形態において、本発明方法は、化学的感知電界効果トランジスタ（chemＦＥＴ）アレイ（例えば、米国特許出願公開第20090026082号参照）を使用して、テストサンプルにおける核酸の配列情報、例えば母体テストサンプルにおけるｃｆＤＮＡを得る。この技術における１つの例において、ＤＮＡ分子を反応チャンバ内に配置し、テンプレート分子をポリメラーゼに結合したシークエンシングプライマーに交配させる。1個又はそれ以上の三リン酸塩がシークエンシングプライマーの３′端部で新たな核酸ストランドに組込まれるのをchemＦＥＴによる電流変化によって判別できる。アレイは多数のchemＦＥＴセンサを有することができる。他の実施例において、単独核酸はビードに取り付くことができ、また核酸はビード上で増幅でき、個別のビードはchemＦＥＴアレイにおける反応チャンバ（各チャンバはchemＦＥＴセンサを有する）に転写することができ、核酸をシークエンシングすることができる。

【0092】

他の実施形態において、本発明方法は、透過型電子顕微鏡（ＴＥＭ）を使用するハルシオン・モレキュラー（Halcyon Molecular）社の技術を使用して、テストサンプルにおける核酸の配列情報、例えば母体テストサンプルにおけるｃｆＤＮＡを得る。個別分子配置急速ナノ転写（ＩＭＰＲＮＴ：Individual Molecule Placement Nano Transfer）と称されるこの方法は、選択的に重原子マーカーでラベル付けした高分子量（１５０ｋｂ以上）ＤＮＡを撮像する１原子解像度の透過型電子顕微鏡を使用し、これら分子を極薄フィルム上に超密度（3ｎｍのストランド相互間距離）の平行アレイにして塩基相互間の間隔が一定になるよう配列する。電子顕微鏡を使用してフィルム上の分子を撮像し、重原子マーカーの位置を決定し、またＤＮＡから塩基配列情報を抽出する。この方法は国際公開第２００９／０４６４４５号に記載されている。この方法は１０分未満で完全ヒトゲノムをシークエンシングすることができる。

【0093】

他の実施形態において、ＤＮＡシークエンシング技術はイオン・トレント（Ion Torrent）社の単独分子シークエンシングであり、これは半導体技術を単純シークエンシング化学に組合せて化学的コード化情報（Ａ，Ｃ，Ｇ，Ｔ）を半導体チップ上のデジタル情報（０，１）に直接翻訳するものである。実際は、ヌクレオチドをポリメラーゼによってＤＮＡストランドに組込むとき水素イオンが副産物として放出される。イオン・トレントは微細加工したウェルの高密度アレイを使用し、この生化学プロセスを大量並列的に行う。各ウェルは異なるＤＮＡ分子を保持する。ウェルの下方にイオン感知層を配置し、このイオン感知層の下方にイオンセンサを配置する。ヌクレオチド、例えばＣをＤＮＡテンプレートに付加し、次にＤＮＡストランドに組込むとき、水素イオンが放出される。そのイオンからの電荷は溶液のｐＨを変化させ、この変化をイオン・トレントのイオンセンサによって検出することができる。このシークエンサー（基本的には世界最小のソリッドステートｐＨ計）は塩基を判定し、化学的情報からデジタル情報に直接移行する。イオン・トレント社の個人向け（パーソナル）ゲノムマシン（ＰＧＭ［登録商標］）シーケンサーは、チップを順次に１つのヌクレオチドで横溢させる。チップを横溢する次のヌクレオチドが一致しない場合、電圧変化が記録されず、塩基が判定されない。ＤＮＡストランドに２つの個別塩基が存在する場合、電圧が倍になり、チップは判定された２つの個別塩基を記録する。直接検出によりヌクレオチド組込みを数秒で記録することができる。

【0094】

他の実施形態において、本発明方法は、シークエンシング・バイ・ハイブリダイゼーションを使用して、テストサンプルにおける核酸の配列情報、例えば母体テストサンプルにおけるｃｆＤＮＡを得る。シークエンシング・バイ・ハイブリダイゼーションは、複数のポリヌクレオチド配列を複数個ポリヌクレオチドプローブに接触させ、複数個のポリヌクレオチドプローブそれぞれは随意的に基板に係留することができる。基板は既知のヌクレオチド配列のアレイを有する平坦表面とすることができる。アレイに対するハイブリダイゼーション（交配）パターンを使用してサンプルに存在するポリヌクレオチド配列を決定することができる。他の実施形態において、各プローブをビード、例えば磁気ビード等に係留する。ビードに対するハイブリダイゼーションを決定し、これを使用してサンプル内の複数のポリヌクレオチド配列を同定することができる。

【0095】

他の実施形態において、本発明方法は、イルミナ社のシークエンシング・バイ・シンセシス及び可逆ターミネーター塩基シークエンシング化学（例えば、Bentley et al., Nature 6:53-59 [2009]参照）を使用する数１００万個のＤＮＡフラグメントの大量並列シークエンシングによって、テストサンプルにおける核酸の配列情報、例えば母体サンプルにおけるｃｆＤＮＡを得る。テンプレートＤＮＡはゲノムＤＮＡ、例えば、ｃｆＤＮＡとすることができる。若干の実施形態において、ｃｆＤＮＡをテンプレートとして使用し、ｃｆＤＮＡは短いフラグメントとして存在するのでフラグメント化を不要とする。例えば、胎児のｃｆＤＮＡは、長さが約１７０塩基対（ｂｐ）のフラグメントとして血流を循環し（例えば、Fan et al., Clin Chem 56:1279-1286 [2010]参照）、シークエンシング前にＤＮＡのフラグメント化は不要である。イルミナ社のシークエンシング技術は、フラグメント化したゲノムＤＮＡを、オリゴヌクレオチドアンカーを結合する平面状の透光性表面に取付けるのに依存する。テンプレートＤＮＡは端部修復されて５′リン酸化平滑末端を生じ、またクレノウフラグメントのポリメラーゼ活性を使用して単独のＡ塩基を平滑リン酸化ＤＮＡフラグメントの３′端部に付加する。この付加により、オリゴヌクレオチドアダプタに対するリゲーション（連結）のためにＤＮＡフラグメントを調製し、このオリゴヌクレオチドアダプタは３′端部で単独のＴ塩基の張出部を有し、リゲーション効率を高める。アダプタであるオリゴヌクレオチドはフローセルアンカーに対して相補的である。制限的希釈条件の下で、アダプタ修飾し、単独ストランド化したテンプレートＤＮＡをフローセルに付加し、アンカーに対するハイブリダイゼーションによって不動化する。取付けられたＤＮＡフラグメントは拡張し、またブリッジ増幅して、数億個のクラスタを有する超高密度シークエンシングフローセルを生じ、各クラスタは同一テンプレートの１０００個のコピーを含む。一実施形態において、ランダムにフラグメント化したゲノムＤＮＡ、例えばｃｆＤＮＡを、ＰＣＲを用いて増幅してからクラスタ増幅を行う。代案として、増幅しないゲノムライブラリ調製を使用し、クラスタ増幅のみを使用してランダムにフラグメント化したゲノムＤＮＡ、例えばｃｆＤＮＡを富裕にする（例えば、Kozarewa et al., Nature Methods 6:291-295 [2009]参照）。除去可能な蛍光色素を有する可逆ターミネーターを使用する堅牢な４色ＤＮＡシークエンシング・バイ・シンセシス技術を用いてテンプレートをシークエンシングする。高感度蛍光検出は、レーザー励起及び全内部反射光学系を使用することにより達成される。約２０〜４０ｂｐの短配列リードは、反復マスク掛けした基準ゲノムに対して整列し、また基準ゲノムに対する短配列リードの一意的マッピングは、特別に開発したデータ解析パイプラインソフトウェアを使用して同定する。非反復マスク掛け基準ゲノムを使用することもできる。反復マスク掛け又は非反復マスク掛けのいずれかの基準ゲノムを使用して、基準ゲノムに対して一意的にマッピングするリードのみをカウントする。第１リードが完了した後、テンプレートをその場で再生成し、フラグメントの反対側端部から第２リードを可能にする。このようにして、ＤＮＡフラグメントにおけるどちらか一方の単一端部又は修復端部のシークエンシングを使用することができる。サンプルに存在するＤＮＡフラグメントの部分的シークエンシングを行い、例えば３６ｂｐの所定長さのリードを有する配列タグを既知の基準ゲノムに対してマッピングし、これをカウントする。一実施形態において、基準ゲノム配列はNCBI36/hg18配列とし、この配列情報はワールド・ワイド・ウェブ上の”genome.ucsc.edu/cgi-bin/hgTracks?Hgsid=167155613&chromInfoPage=”から入手できる。代案として、基準ゲノム配列はGRCh37/hg19配列とし、この配列情報はワールド・ワイド・ウェブ上の”genome.ucsc.edu/cgi-bin/hgGateway”から入手できる。他の公開配列情報ソースとしては、ＧｅｎＢａｎｋ、ｄｂＥＳＴ、ｄｂＳＴＳ、ＥＭＢＬ（the European Molecular Biology Laboratory）、及びＤＤＢＪ（the DNA Databank of Japan）がある。配列を整列させる多くのコンピュータアルゴリズムが利用可能であり、これらアルゴリズムとしては、限定しないがＢＬＡＳＴ（altschul et al., 1990）、ＢＬＩＴＺ（ＭＰｓｒｃｈ）（Sturrock & Collins, 1993）、ＦＡＳＴＡ（Person & Lipman, 1988）、ＢＯＷＴＩＥ（Langmead et al., Genome Biology 10:R25.1-R25.10 [2009]）、又はＥＬＡＮＤ（Illumina, Inc., San Diego, CA, USA）がある。一実施形態において、血漿ｃｆＤＮＡのクローン的に拡張したコピーの一方の端部を、イルミナ・ゲノム・アナライザ（Illumina Genome Analyzer）用の生物情報解析によってシークエンシングし、また処理するが、これにはヌクレオチドデータベースの効率的大量整列（ＥＬＡＮＤ：Efficient Large-Scale Alignment of Nucleotide Database）ソフトウェアを使用する。本明細書に記載の方法における若干の実施形態において、マッピングされた配列タグは、約２０ｂｐ、約２５ｂｐ、約３０ｂｐ、約３５ｂｐ、約４０ｂｐ、約４５ｂｐ、約５０ｂｐ、約５５ｂｐ、約６０ｂｐ、約６５ｂｐ、約７０ｂｐ、約７５ｂｐ、約８０ｂｐ、約８５ｂｐ、約９０ｂｐ、約９５ｂｐ、約１００ｂｐ、約１１０ｂｐ、約１２０ｂｐ、約１３０ｂｐ、約１４０ｂｐ、約１５０ｂｐ、約２００ｂｐ、約２５０ｂｐ、約３００ｂｐ、約３５０ｂｐ、約４００ｂｐ、約４５０ｂｐ、約５００ｂｐの配列リードを有する。５００ｂｐを超える単独端部リードを可能にし、修復端部リードを生成するとき約１０００ｂｐより多いリードをも可能にする技術的進歩が期待される。一実施形態において、マッピングされた配列タグは３６ｂｐの配列リードを有する。配列タグのマッピングは、タグの配列を基準の配列と比較することによって得られ、これによりシークエンシングした核酸（例えば、ｃｆＤＮＡ）分子の染色体起源を決定し、また特別な遺伝配列情報は不要である。僅かな程度の不一致（配列タグあたり０〜２個の不一致）も、基準ゲノムと混合したサンプルにおけるゲノムとの間に存在し得る少数の多型性の要因となることができる。

【0096】

サンプルにつき複数の配列タグが得られる。若干の実施形態において、２０〜４０個の塩基対（ｂｐ）リード（reads）を有する、少なくとも約３×１０^６個の塩基配列タグ、少なくとも約５×１０^６個の塩基配列タグ、少なくとも約８×１０^６個の塩基配列タグ、少なくとも約１０×１０^６個の塩基配列タグ、少なくとも約１５×１０^６個の塩基配列タグ、少なくとも約２０×１０^６個の塩基配列タグ、少なくとも約３０×１０^６個の塩基配列タグ、少なくとも約４０×１０^６個の塩基配列タグ、少なくとも約５０×１０^６個の塩基配列タグを、サンプルあたりリードを基準ゲノムに対してマッピングすることから得る。一実施形態において、すべての配列リードを基準ゲノムの全領域に対してマッピングする。一実施形態において、基準ゲノムにおけるすべての領域、例えばすべての染色体に対してマッピングされたタグをカウントし、また混合ＤＮＡサンプルにおけるＣＮＶ、すなわち関心対象配列、例えば染色体又は染色体の一部における過剰又は不足表現を決定する。この方法は、２つのゲノム間の区別は不要である。

【0097】

ＣＮＶ、例えば異数性がサンプルに存在する又はしないに関する正確な決定に必要な精度は、１回のシークエンシング作業（ラン）でサンプルあたり基準ゲノムにマッピングする配列タグ数の変動（染色体間変動）、及び異なるシークエンシング作業（ラン）で基準ゲノムにマッピングする配列タグ数の変動（シークエンシング間変動）に基づく。例えば、多型（変動）は、ＧＣリッチ又はＧＣプアな基準配列にマッピングするタグに対して特別に宣告することができる。他の多型（変動）は、核酸の抽出及び純化、シークエンシングライブラリの調製、及び異なるシークエンシング基盤に対して異なる手順を使用することから生じ得る。本発明方法は、正規化配列（正規化染色体配列、又は正規化断片配列）に関する知識をベースにした配列ドース（染色体ドース、又は断片ドース）を使用し、本来的に染色体間（ラン内）及びシークエンシング間（ラン間）からステミング処理する見越し変動性、並びに基盤依存変動性の要因とする。染色体ドースは、単独染色体、又は１〜２２番染色体、Ｘ及びＹ染色体から選択した２個又はそれ以上の染色体により構成することができる正規化染色体配列に関する知識に基づく。代案として、正規化染色体配列は、単独染色体断片、又は１個の染色体における、又は２個若しくはそれ以上の染色体における２個以上の断片により構成することができる。断片ドースは、任意の１個の染色体の単独断片、又は１〜２２番染色体、Ｘ及びＹ染色体のうち、任意の２個若しくはそれ以上の染色体ににおける２個以上の断片より構成することができる正規化断片配列に関する知識に基づく。

【0098】

適格サンプルにおける正規化配列（正規化染色体配列及び正規化断片）の決定
正規化配列は、関心対象、例えば染色体又は染色体断片における任意の１個の配列に対する正常コピー数を有する細胞で構成されていることが既知の検体から採取した適格サンプルのセットからの配列情報を使用して同定する。正規化配列の決定は、図１に示す本発明方法の実施形態におけるステップ１００，１２０，１３０，１４０及び１４５で説明する。適格サンプルから採取した配列情報は、テストサンプルにおける染色体異数性の統計的に有意な同定を決定するのにも使用する（図１のステップ１５５及び実施例参照）。図１は、生物学的サンプルにおける関心対象、例えば染色体又は染色体断片の配列におけるＣＮＶを決定する本発明方法による実施形態１００のフローチャートである。若干の実施形態において、生物学的サンプルは、検体から採取し、異なるゲノムによって関与される核酸混合物を含む。異なるゲノムは２つの個体によってサンプルに関与し、例えば、異なったゲノムは胎児及びこの胎児を孕んだ母体によって関与される。その外に、ゲノムは、同一検体からの、例えばがん患者の血漿サンプルからの異数性がん細胞及び正倍数性細胞によってサンプルに関与する。

【0099】

適格サンプルのセットは、適格正規化配列を同定するため、またテストサンプルにおけるＣＮＶの統計学的に有意な同定を決定するのに使用する変動値を得るために採取する。ステップ１１０において、複数の生物学的適格サンプルを、関心対象の任意な１つの配列に関して正常なコピー数を有する細胞を含んでいることが既知である複数の検体から採取する。一実施形態において、適格サンプルは、細胞遺伝学的手段を用いて染色体の正常コピー数を有することが確認された胎児を孕んだ母体から採取する。生物学的適格サンプルは、生物学的流体、例えば、血漿、又は以下に説明するような任意の適当なサンプルとすることができる。若干の実施形態において、適格サンプルは、核酸分子、例えばｃｆＤＮＡ分子の混合物を含むものとすることができる。若干の実施形態において、適格サンプルは、胎児及び母体のｃｆＤＮＡ分子の混合物を含む母体血漿サンプルとする。正規化染色体及び／又は正規化染色体の断片のための配列情報は、任意な既知のシークエンシング方法を使用して、例えば、胎児及び母体の核酸の少なくとも一部をシークエンシングすることによって得る。好適には、本明細書のいたるところに記載した次世代シークエンシング（ＮＧＳ）方法のうち任意な１つを使用して、単独分子又はクローン増幅した分子としての胎児及び母体の核酸をシークエンシングする。

【0100】

ステップ１２０において、適格サンプルに含まれるすべての適格核酸それぞれの少なくとも一部分をシークエンシングして、例えばｈｇ１８の基準ゲノムに整列する、例えば３６ｂｐリードの配列リードを数１００万生ずる。若干の実施形態において、配列リードは、約２０ｂｐ、約２５ｂｐ、約３０ｂｐ、約３５ｂｐ、約４０ｂｐ、約４５ｂｐ、約５０ｂｐ、約５５ｂｐ、約６０ｂｐ、約６５ｂｐ、約７０ｂｐ、約７５ｂｐ、約８０ｂｐ、約８５ｂｐ、約９０ｂｐ、約９５ｂｐ、約１００ｂｐ、約１１０ｂｐ、約１２０ｂｐ、約１３０ｂｐ、約１４０ｂｐ、約１５０ｂｐ、約２００ｂｐ、約２５０ｂｐ、約３００ｂｐ、約３５０ｂｐ、約４００ｂｐ、約４５０ｂｐ、約５００ｂｐを有する。５００ｂｐを超える単独端部リードを可能にし、修復端部リードを生成するとき約１０００ｂｐより多いリードをも可能にする技術的進歩が期待される。一実施形態において、マッピングされた配列タグは３６ｂｐの配列リードを有する。配列リードは基準ゲノムに整列し、また基準ゲノムに一意的にマッピングされたリードは塩基配列タグ（ときに「配列タグ」と略称する）として知られている。一実施形態において、２０〜４０個の塩基対（ｂｐ）リード（reads）を有する、少なくとも約３×１０^６個の適格配列タグ、少なくとも約５×１０^６個の適格配列タグ、少なくとも約８×１０^６個の適格配列タグ、少なくとも約１０×１０^６個の適格配列タグ、少なくとも約１５×１０^６個の適格配列タグ、少なくとも約２０×１０^６個の適格配列タグ、少なくとも約３０×１０^６個の適格配列タグ、少なくとも約４０×１０^６個の適格配列タグ、少なくとも約５０×１０^６個の適格配列タグを、基準ゲノムに対して一意的にマッピングするリードから得る。

【0101】

ステップ１３０で、適格サンプルにおける核酸をシークエンシングすることから得たすべてのタグをカウントして、適格配列タグ密度を決定する。一実施形態において、配列タグ密度は、基準ゲノムにおける関心対象配列にマッピングされる適格配列タグの数として決定する。他の実施形態において、適格配列タグは、マッピングされる関心対象適格配列の長さに対して正規化した、関心対象配列にマッピングした適格配列タグの数として決定する。関心対象配列長さに対するタグ密度の比として決定された配列タグ密度は、本明細書においてタグ密度比と称する。関心対象配列長さに対する正規化は不要であり、ヒト解釈用に簡素化するための数値における桁数を減らすステップとして含めることができる。すべての適格配列タグをマッピングし、また適格サンプルそれぞれにおいてカウントするとき、適格サンプルにおける関心対象配列、例えば臨床関連配列の配列タグ密度は、後に正規化配列を同定する付加的配列のための配列タグ密度として決定される。

【0102】

若干の実施形態において、関心対象配列は、完全染色体異数性に関連する染色体、例えば２１番染色体とし、適格正規化配列は、染色体異数性に関連せず、また配列タグ密度における多型（変動）が関心対象配列の配列（すなわち、染色体）、例えば２１番染色体の多型に最も近似する完全染色体である。１〜２２番染色体、Ｘ及びＹ染色体のうち任意の１個又はそれ以上を関心対象配列とすることができ、また１個又はそれ以上の染色体は、適格サンプルにおける１〜２２番染色体、Ｘ及びＹ染色体のうち任意の１個それぞれに対する正規化配列として同定することができる。正規化染色体は個別染色体とするか、又は本明細書のいたるところに記載するように染色体のグループとすることができる。

【0103】

他の実施形態において、関心対象配列は、部分的異数性、例えば、染色体欠失若しくは挿入、又は不均衡染色体転座に関連する染色体断片であり、正規化配列は、部分異数性に関連せず、また配列タグ密度における多型（変動）が部分異数性に関連する染色体断片のの多型に最も近似する染色体断片である。１〜２２番染色体、Ｘ及びＹ染色体のうち任意の１個又はそれ以上における任意な１個又はそれ以上の断片を関心対象配列とすることができる。

【0104】

全ての実施形態において、適格サンプルで単独配列又は配列グループが、任意な１個又はそれ以上の関心対象配列のための正規化配列として同定されるかどうかによって、適格正規化配列は、適格サンプルにおいて決定された関心対象配列の配列タグ密度に最も近似する配列タグ密度に変動を有する。例えば、適格正規化配列は最も小さい変動性（多型性）を有する配列である、すなわち、正規化配列の変動性は関心対象配列の変動性に最も近似する。

【0105】

若干の実施形態において、正規化配列は、１個又はそれ以上の異変ありサンプルから１個又はそれ以上の適格サンプルを最も区別される配列であり、正規化配列は最も弁別可能性の高い配列であることを意味し、すなわち、正規化配列の弁別可能性は、異変ありテストサンプルにおける関心対象配列に対して最適な弁別を行い、異変ありテストサンプルを他の異変なしサンプルから容易に区別することができる。他の実施形態において、正規化配列は最も小さい変動性及び最も大きい弁別可能性を有する配列とする。弁別可能性のレベルは、以下に実施例で説明するように、適格サンプルの母集団における配列ドース、例えば染色体ドース又は断片ドースと、１個又はそれ以上のテストサンプルにおける染色体ドースとの間における統計学的相違として決定することができる。例えば、弁別可能性は、Ｔ検定値として数値的に表すことができ、このＴ検定値は、適格サンプルの母集団における染色体ドースと、１個又はそれ以上のテストサンプルにおける染色体ドースとの間の統計学的な相違を表す。代案として、弁別可能性は、正規化染色体値（ＮＣＶ：Normalized Chromosome Value）として数値表現することができ、これはＮＣＶの分布が標準的である限り染色体ドースに対するｚスコアである。同様に、弁別可能性は、Ｔ検定値として数値表現することができ、これは適格サンプルの母集団における断片ドースと、１個又はそれ以上のテストサンプルにおける断片ドースとの間の統計学的相違を表す。代案として、断片ドースの弁別可能性は、正規化断片値（ＮＳＶ：Normalized Segment Value）として数値表現することができ、これはＮＳＶの分布が標準的である限り染色体ドースに対するｚスコアである。ｚスコアを決定する際に、適格サンプルのセットにおける染色体ドース又は断片ドースの平均及び標準偏差を使用することができる。代案として、適格サンプル及び異変ありサンプルを含むトレーニングセットにおける染色体ドース又は断片ドースの平均及び標準偏差を使用することができる。他の実施形態において、正規化配列は最小変動性及び最大弁別可能性を有する配列とする。

【0106】

本発明方法は、本来的に類似特性を有し、またサンプル間及びシークエンシングの作業（ラン）間で類似の多型（変動）を受け易い配列を同定し、これはテストサンプルにおける配列ドースを決定するのに有用である。

【0107】

適格サンプルにおける配列ドース（すなわち、染色体ドース又は断片ドース）の決定
ステップ１４０において、計算した適格タグ密度に基づいて、関心対象配列用の適格配列ドース、すなわち染色体ドース又は断片ドースを、関心対象配列の配列タグ密度と、後のステップ１４５で正規化配列を同定する付加的配列の適格配列タグ密度との比として決定する。これに続いて同定した正規化配列を使用し、テストサンプルにおける配列ドースを決定する。

【0108】

一実施形態において、適格サンプルにおける配列ドースは、関心対象染色体に関する配列タグ数と、適格サンプルにおける正規化染色体配列に関する配列タグ数との比として計算される染色体ドースである。正規化染色体配列は、単独染色体、染色体グループ、１個の染色体の断片、又は異なる染色体からの断片グループとすることができる。したがって、関心対象染色体に関する染色体ドースは、適格サンプルにおいて、（ｉ）関心対象染色体に関するタグ数と、単独染色体により構成される正規化染色体配列に関するタグ数との比、（ii）関心対象染色体に関するタグ数と、２個又はそれ以上の染色体により構成される正規化染色体配列に関するタグ数との比、（iii）関心対象染色体に関するタグ数と、単独染色体断片により構成される正規化断片配列に関するタグ数との比、（iv）関心対象染色体に関するタグ数と、１個の染色体からの２個又はそれ以上の断片により構成される正規化断片配列に関するタグ数との比、又は（ｖ）関心対象染色体に関するタグ数と、２個又はそれ以上の染色体における２個又はそれ以上の染色体断片により構成される正規化断片配列に関するタグ数との比、として決定する。（ｉ）〜（ｖ）に従って関心対象である２１番染色体に関する染色体ドースを決定する実施例を以下に示す。関心対象染色体、例えば２１番染色体に関する染色体ドースを、２１番染色体の配列タグ密度と、残りのすべての染色体、すなわち１〜２０番染色体、２２番染色体、Ｘ染色体及びＹ染色体のそれぞれに関する配列タグ密度との比として決定する（ｉ）、関心対象染色体、例えば２１番染色体に関する染色体ドースを、２１番染色体の配列タグ密度と、残りの染色体における２個又はそれ以上のあり得るすべての組合せに関する配列タグ密度との比として決定する（ii）、関心対象染色体、例えば２１番染色体に関する染色体ドースを、２１番染色体の配列タグ密度と、他の染色体、例えば９番染色体の断片に関する配列タグ密度との比として決定する（iii）、関心対象染色体、例えば２１番染色体に関する染色体ドースを、２１番染色体の配列タグ密度と、他の１個の染色体の２個の断片、例えば９番染色体の２個の断片に関する配列タグ密度との比として決定する（iv）、及び関心対象染色体、例えば２１番染色体に関する染色体ドースを、２１番染色体の配列タグ密度と、２個の異なる染色体の２個の断片に関する、例えば９番染色体の断片及び１４番染色体の断片に関する配列タグ密度との比として決定する。

【0109】

他の実施形態において、適格サンプルにおける配列ドースは、関心対象断片に関する配列タグ数と適格サンプルにおける正規化断片配列に関する配列タグ数との比として計算される断片ドースとする。正規化断片配列は、１個の染色体断片、又は異なる染色体からの断片グループとすることができる。したがって、関心対象断片に関する断片ドースは適格サンプルにおいて、（ｉ）関心対象断片に関するタグ数と、染色体の単独断片により構成される正規化断片配列に関するタグ数との比、（ii）関心対象断片に関するタグ数と、１個の染色体における２個又はそれ以上の断片により構成される正規化断片配列に関するタグ数との比、又は（iii）関心対象断片に関するタグ数と、２個又はそれ以上の異なる染色体における２個又はそれ以上の断片により構成される正規化断片配列に関するタグ数との比、として決定する。

【0110】

関心対象の１個又はそれ以上の染色体に関する染色体ドースはすべての適格サンプルにおいて決定し、また正規化染色体配列をステップ１４５で同定する。同様に、１個又はそれ以上の関心対象断片に関する断片ドースをすべての適格サンプルで決定し、また正規化断片配列をステップ１４５で同定する。

【0111】

適格配列ドースからの正規化配列の同定
ステップ１４５において、正規化配列を関心対象配列用に計算した配列ドースに基づく配列として同定し、すなわち、すべての適格サンプルにわたり関心対象配列に関する配列ドースにおける変動性が最小となる。本発明方法は、本来的に類似特性を有し、またサンプル間及びシークエンシングの作業（ラン）間で類似の多型（変動）を受け易い配列を同定し、これはテストサンプルにおける配列ドースを決定するのに有用である

【0112】

１個又はそれ以上の関心対象配列に関する正規化配列は、適格サンプルのセットで同定することができ、またその後適格サンプルで同定される配列を使用して、各テストサンプルで１個又はそれ以上の関心対象配列に関する配列ドースを計算し（ステップ１５０）、各テストサンプルにおける異数性の有無を決定する。関心対象の染色体又は断片のために同定した正規化配列は、異なるシークエンシング基盤を使用するとき、及び／又はシークエンシングすべき核酸の純化に差があるとき、及び／又はシークエンシングライブラリの調製に差があるとき、異なることがあり得る。本発明方法による正規化配列を使用することによって、使用するサンプル調製及び／又はシークエンシング基盤に無関係に、染色体又は断片におけるコピー数多型に関する特別なまた感度のよい評価基準をもたらす。

【0113】

若干の実施形態において、１個より多い正規化配列を同定する、すなわち、異なった正規化配列を１個の関心対象配列に関して決定することができ、また複数の配列ドースを１個の関心対象配列に関して決定することができる。例えば、関心対象である２１番染色体に関する染色体ドースにおける多型、例えば、変動係数は、１４番染色体の配列タグ密度を使用するとき最小となる。しかし、２個、３個、４個、５個、６個、７個、８個又はそれ以上の正規化配列は、テストサンプルにおける関心対象配列に関する配列ドース決定に使用して同定することができる。例えば、任意な１つのテストサンプルにおける２１番染色体に関する第２ドースを、正規化染色体配列として、７番染色体、９番染色体、１１番染色体又は１２番染色体を使用して決定することができ、なぜならこれら染色体はすべて１４番染色体のＣＶに近似するＣＶを有するからである（実施例２、表２参照）。好適には、単独染色体を、関心対象染色体に関する正規化染色体配列として選択するとき、正規化染色体配列は、テストされるすべてのサンプル、例えば適格サンプルにわたり最小の変動性を有する関心対象染色体に関する染色体ドースになる染色体とする。

【0114】

染色体の正規化配列としての正規化染色体配列
他の実施形態において、正規化染色体配列は単独配列とするか、又は配列グループとすることができる。例えば、若干の実施形態において、正規化配列は、配列グループ、例えば染色体グループとし、これは１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１個又はそれ以上に関する正規化配列として同定する。関心対象染色体に関する正規化配列、すなわち、正規化染色体配列を含む染色体のグループは、２個、３個、４個、５個、６個、７個、８個、９個、１０個、１１個、１２個、１３個、１４個、１５個、１６個、１７個、１８個、１９個、２０個、２１個、２２個の染色体よりなるグループとすることができ、またＸ染色体及びＹ染色体のうち一方又は双方を含む又は含まないものとすることができる。正規化染色体配列として同定される染色体のグループは、テストされるすべてのサンプル、例えば適格サンプルにわたり最小の変動性を有する関心対象染色体に関する染色体ドースになる染色体グループとする。好適には、個別染色体及び染色体グループを、正規化染色体配列として選択される関心対象配列の挙動に最も近似する能力に関して、一緒にテストする。

【0115】

一実施形態において、２１番染色体の正規化配列は、９番染色体、１番染色体、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、８番染色体、１０番染色体、１１番染色体、１２番染色体、１３番染色体、１４番染色体、１５番染色体、１６番染色体、及び１７番染色体から選択する。代案として、２１番染色体の正規化配列を、９番染色体、１番染色体、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、８番染色体、１０番染色体、１１番染色体、１２番染色体、１３番染色体、１４番染色体、１５番染色体、１６番染色体、及び１７番染色体から選択した染色体グループとする。他の実施形態において、染色体グループは、９番染色体、１番染色体、２番染色体、１１番染色体、１２番染色体、及び１４番染色体から選択したグループとする。

【0116】

若干の実施形態において、本発明方法は、さらに、各染色体を個別に、また残りの染色体とのあり得るすべての組合せを使用してすべての染色体ドースを系統的に計算することによって決定した正規化配列を使用することにより改善する（実施例７参照）。例えば、系統的に決定した正規化染色体は、各関心対象染色体に関して、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意な１個、及び１〜２２番染色体、Ｘ染色体及びＹ染色体のうち２個又はそれ以上の組合せを使用してすべてのあり得る染色体ドースを系統的に計算することによって決定し、どの単独染色体又はどの染色体グループを正規化染色体とするかを決定することができ、これにより適格サンプルのセットにわたる関心対象染色体に関する染色体ドースの変動性が最小となる（実施例７参照）。したがって、一実施形態において、２１番染色体に関する系統的に計算した正規化染色体配列は、４番染色体、１４番染色体、１６番染色体、２０番染色体、及び２２番染色体よりなる染色体グループとする。単独染色体又は染色体グループは、ゲノムにおけるすべての染色体に関して決定することができる。

【0117】

一実施形態において、１８番染色体の正規化配列は、８番染色体、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、９番染色体、１０番染色体、１１番染色体、１２番染色体、１３番染色体、１４番染色体から選択する。好適には、１８番染色体用の正規化配列を、８番染色体、２番染色体、３番染色体、５番染色体、６番染色体、１２番染色体、及び１４番染色体から選択する。代案として、１８番染色体の正規化配列を、８番染色体、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、９番染色体、１０番染色体、１１番染色体、１２番染色体、１３番染色体、及び１４番染色体から選択した染色体グループとする。好適には、染色体グループは、８番染色体、２番染色体、３番染色体、５番染色体、６番染色体、１２番染色体、及び１４番染色体から選択したグループとする。

【0118】

他の実施形態において、１８番染色体の正規化配列は、（本明細書のあらゆるところで説明したように）あり得る各正規化染色体を個別に、また正規化染色体のあり得るすべての組合せを使用してあり得るすべての染色体ドースを系統的に計算することによって、決定する。したがって、一実施形態において、１８番染色体に関する正規化配列は、２番染色体、３番染色体、５番染色体、及び７番染色体よりなる染色体グループで構成される正規化染色体とする。

【0119】

一実施形態において、Ｘ染色体の正規化配列は、１番染色体、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、８番染色体、９番染色体、１０番染色体、１１番染色体、１２番染色体、１３番染色体、１４番染色体、１５番染色体、及び１６番染色体から選択する。好適には、Ｘ染色体の正規化配列を、２番染色体、３番染色体、５番染色体、６番染色体、及び８番染色体から選択する。代案として、Ｘ染色体の正規化配列を、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、８番染色体、９番染色体、１０番染色体、１１番染色体、１２番染色体、１３番染色体、１４番染色体、１５番染色体、及び１６番染色体から選択した染色体グループとする。好適には、染色体グループは、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、及び８番染色体から選択したグループとする。

【0120】

他の実施形態において、Ｘ染色体の正規化配列は、（本明細書のいたるところに記載したように）正規化染色体のうちあり得る正規化染色体及びあり得る正規化染色体の組合せのそれぞれを使用して、すべてのあり得る染色体ドースを系統的に計算することによって決定する。したがって、一実施形態において、Ｘ染色体の正規化配列は４番染色体及び８番染色体のグループよりなる正規化染色体とする。

【0121】

一実施形態において、１３番染色体の正規化配列は、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、８番染色体、９番染色体、１０番染色体、１１番染色体、１２番染色体、１４番染色体、１８番染色体、及び２１番染色体から選択する。好適には、１３番染色体用の正規化配列を、２番染色体、３番染色体、５番染色体、６番染色体、及び８番染色体から選択した染色体とする。他の実施形態において、１３番染色体の正規化配列を、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、７番染色体、８番染色体、９番染色体、１０番染色体、１１番染色体、１２番染色体、１４番染色体、１８番染色体、及び２１番染色体から選択した染色体グループとする。好適には、染色体グループは、２番染色体、３番染色体、４番染色体、５番染色体、６番染色体、及び８番染色体から選択したグループとする。

【0122】

他の実施形態において、１３番染色体の正規化配列は、（本明細書のいたるところに記載したように）正規化染色体のうちあり得る正規化染色体及びあり得る正規化染色体の組合せのそれぞれを使用して、すべてのあり得る染色体ドースを系統的に計算することによって決定する。したがって、一実施形態において、１３番染色体の正規化配列は４番染色体及び５番染色体のグループを有する正規化染色体とする。他の実施形態において、１３番染色体の正規化配列は４番染色体及び５番染色体のグループよりなる正規化染色体とする。

【0123】

Ｙ染色体の染色体ドースにおける多型は３０個より多く、これらの正規化染色体をそれぞれ独立的に使用してＹ染色体ドースを決定する。したがって、１〜２２番染色体及びＸ染色体から選択した任意の１個の染色体又は２個若しくはそれ以上の染色体のグループをＹ染色体の正規化配列として使用する。一実施形態において、少なくとも１個の正規化染色体は、１〜２２番染色体及びＸ染色体よりなる染色体グループとする。他の実施形態において、染色体グループは、２番染色体、３番染色体、４番染色体、５番染色体、及び６番染色体よりなる染色体グループとする。

【0124】

他の実施形態において、Ｙ染色体の正規化配列は、（本明細書のいたるところに記載したように）正規化染色体のうちあり得る正規化染色体及びあり得る正規化染色体の組合せのそれぞれを使用して、すべてのあり得る染色体ドースを系統的に計算することによって決定する。したがって、一実施形態において、Ｙ染色体の正規化配列は４番染色体及び６番染色体よりなる染色体グループを有する正規化染色体とする。他の実施形態において、Ｙ染色体の正規化配列は４番染色体及び６番染色体よりなる染色体グループで構成した正規化染色体とする。

【0125】

関心対象の異なる染色体又は関心対象の異なる断片におけるドースを計算するのに使用される正規化配列は同一の正規化配列とする、又は関心対象の異なる染色体又は関心対象の異なる断片に対してそれぞれ異なる正規化配列とすることができる。例えば、関心対象染色体Ａの正規化配列（単独若しくはグループ）は同一とするか、又は例えば関心対象染色体Ｂの正規化配列（単独若しくはグループ）とは異なるものとすることができる。

【0126】

完全染色体の正規化配列は完全染色体若しくは完全染色体グループとするか、又は染色体断片若しくは１個以上の染色体断片のグループとすることができる。

【0127】

染色体の正規化配列としての正規化断片配列
他の実施形態において、染色体の正規化配列は正規化断片配列とすることができる。正規化断片配列は単独断片とする若しくは１個の染色体の断片グループとすることができ、又は２個以上の異なる染色体からの断片とすることができる。正規化断片配列はゲノムにおける断片配列のすべての組合せを系統的に計算することによって決定することができる。例えば、２１番染色体の正規化断片配列は、２番染色体のサイズより大きい又は小さい単独断片とすることができ、２番染色体は約４７Ｍｂｐ（million base pairs）であり、約１４０Ｍｂｐの９番染色体とはサイズが異なる。代案として、２１番染色体のための正規化配列は、１番染色体からの配列と、１２番染色体からの配列との組合せとすることができる。

【0128】

一実施形態において、２１番染色体の正規化配列は、１〜２０番染色体、２２番染色体、Ｘ染色体及びＹ染色体のうちの１断片、又は２個以上の断片グループの正規化断片配列とする。他の実施形態において、１８番染色体の正規化配列は、１〜１７番染色体、１９〜２２番染色体、Ｘ染色体及びＹ染色体のうちの１断片、又は断片グループとする。他の実施形態において、１３番染色体の正規化配列は、１〜１２番染色体、１４〜２２番染色体、Ｘ染色体及びＹ染色体のうちの１断片、又は断片グループとする。他の実施形態において、Ｘ染色体の正規化配列は、１〜２２番染色体、及びＹ染色体のうちの１断片、又は断片グループとする。他の実施形態において、Ｙ染色体の正規化配列は、１〜２２番染色体、及びＸ染色体のうちの１断片、又は断片グループとする。単独断片又は断片グループの正規化断片配列はゲノムにおけるすべての染色体に対して決定することができる。正規化断片配列の２個以上の断片は１個の染色体からの断片とするか、又は２個以上の断片は２個以上の染色体の断片とすることができる。正規化染色体配列につき説明したように、正規化断片配列は２個以上の異なった染色体に対して同一とすることができる。

【0129】

染色体断片のための正規化配列としての正規化断片配列
関心対象配列のＣＮＶ有無は、関心対象配列が染色体断片であるとき決定することができる。染色体断片のコピー数多型は、部分的染色体異数性の有無を決定することができる。以下に説明するのは、種々の胎児異常及び病状に関連する部分的染色体異数性の例である。染色体断片は任意の長さとすることができる。例えば、その長さはキロベースから数１００メガベースの範囲にわたることがあり得る。ヒトゲノムは３０億個のＤＮＡ塩基にわたって存在し、このＤＮＡ塩基を、数１０個、数１０００個、数１０万、数１００万の異なるサイズの断片に分割し、これら異なるサイズの断片を本発明方法によって決定することができる。染色体断片の正規化配列は、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意な１個からの単独断片、又は１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意な１個以上から断片グループとすることができる正規化断片配列である。

【0130】

関心対象断片の正規化配列は、染色体にわたり変動性を有する、また関心対象断片の配列に近接するサンプルにわたり変動性を有する配列である。正規化配列の決定は、正規化配列が１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意な１個又はそれ以上の断片グループであるとき、関心対象染色体の正規化配列を決定することに関して説明したとおりに実行することができる。１個の断片又は断片グループの正規化断片配列は、１個の断片及び２個以上の断片におけるすべてのあり得る組合せを使用して、適格サンプル、すなわち、関心対象断片が2倍体であると分かっているサンプルのセットにおける各サンプルの関心対象断片の正規化配列として断片ドースを計算することによって同定することができ、また正規化配列は、正規化染色体配列につき上述したように、すべての適格サンプルにわたる関心対象断片の変動性が最低の断片ドースを提供するように決定する。

【0131】

例えば、１Ｍｂ（megabase）の関心対象断片に関して、約３Ｇｂのヒトゲノムにおける残りの３００万個（１ｍｇの関心対象断片を差し引いた）の断片を個別に、又は互いに組合せて使用し、適格サンプルのセットにおける関心対象断片の断片ドースを計算し、どの１個の断片又はどの断片グループが適格サンプル及びテストサンプルの正規化断片配列として作用するかを決定することができる。関心対象断片は約１０００個の塩基から数１０メガベースもの塩基にわたり変化し得る。正規化断片配列は、関心対象配列と同一サイズの１個又はそれ以上の断片により構成することができる。他の実施形態において、正規化断片配列は、関心対象配列の断片とは異なった、及び／又は互いに異なった断片により構成することができる。例えば、１０，０００塩基長さを有する配列の正規化断片配列は２０，０００塩基長さとすることができ、異なる長さ、例えば、７，０００＋８，０００＋５，０００塩基の配列組合せを有するものとすることができる。正規化染色体配列につき本明細書のいたるところに記載したように、正規化断片配列は、正規化断片におけるあり得る正規化染色体断片それぞれを個別に、またあり得るすべての組合せを使用して（正規化染色体配列につき本明細書のいたるところに記載したように）、すべてのあり得る染色体ドース及び／又は断片ドースを系統的に計算することによって、決定することができる。単独断片又は断片グループは、ゲノムにおけるすべての断片及び／又は染色体に対して決定することができる。

【0132】

関心対象の異なる染色体断片におけるドースを計算するのに使用する正規化配列は同一とするか、又は関心対象の異なる染色体断片に異なった正規化配列とすることができる。例えば、関心対象染色体断片Ａの正規化断片（単独若しくはグループ）の正規化配列は同一とするか、又は例えば関心対象染色体断片Ｂの正規化断片（単独若しくはグループ）とは異なる正規化配列とすることができる。

【0133】

テストサンプルにおける異数性決定
適格サンプルにおける正規化配列の同定に基づいて、１個又はそれ以上の関心対象配列に違いがあるゲノムに由来する核酸混合物を有するテストサンプルにおける関心対象配列に対して配列ドースを決定する。

【0134】

ステップ１１５において、テストサンプルを関心対象配列に臨床関連ＣＮＶがあることが疑われる又は既知の検体から採取する。このテストサンプルは、生体液、例えば、血漿、又は以下に説明するような任意の適当なサンプルとすることができる。若干の実施形態において、テストサンプルは、核酸分子、例えばｃｆＤＮＡ分子の混合物を含むものとする。若干の実施形態において、テストサンプルは、胎児及び母体のｃｆＤＮＡ分子混合物を含む母体血漿サンプルとする。

【0135】

ステップ１２５で、テストサンプルにおけるテスト核酸の少なくとも一部を、適格サンプルにつき説明したように、シークエンシングし、例えば、３６ｂｐリードの配列リードを数１００万個生成する。ステップ１２０と同様に、テストサンプルにおける核酸をシークエンシングすることから生じたリードを基準ゲノムに対して一意的にマッピングする。ステップ１２０につき説明したように、２０〜４０個の塩基対（ｂｐ）リード（reads）を有する、少なくとも約３×１０^６個の適格配列タグ、少なくとも約５×１０^６個の適格配列タグ、少なくとも約８×１０^６個の適格配列タグ、少なくとも約１０×１０^６個の適格配列タグ、少なくとも約１５×１０^６個の適格配列タグ、少なくとも約２０×１０^６個の適格配列タグ、少なくとも約３０×１０^６個の適格配列タグ、少なくとも約４０×１０^６個の適格配列タグ、少なくとも約５０×１０^６個の適格配列タグを、基準ゲノムに対して一意的にマッピングするリードから得る。

【0136】

ステップ１３５で、テストサンプルにおける核酸をシークエンシングすることから得るすべてのタグをカウントして、テスト配列タグ密度を決定する。一実施形態において、関心対象配列にマッピングされたテスト配列タグ数は、テスト配列タグ密度比を得るようマッピングされる関心対象配列の既知長さに正規化する。適格サンプルにつき説明したように、関心対象配列の既知長さに正規化する必要はなく、ヒト解釈用に簡素化するための数値における桁数を減らすステップとして含めることができる。すべてのマッピングされたテスト配列タグをテストサンプルにおいてカウントするとき、テストサンプルにおける関心対象配列、例えば臨床関連配列の配列タグ密度は、適格サンプルで同定される少なくとも１個の正規化配列に対応する付加的配列のための配列タグ密度として決定される。

【0137】

ステップ１５０で、適格サンプルにおける少なくとも１個の正規化配列の同定に基づいて、テスト配列ドースを、テストサンプルにおける関心対象配列に対して決定する。本明細書のいたるところに記載したように、少なくとも１個の正規化配列は、単独配列又は配列グループとすることができる。テストサンプルにおける関心対象配列の配列ドースは、テストサンプルにおける関心対象配列に関して決定した配列タグ密度と、テストサンプルで決定した少なくとも１個の正規化配列の配列タグ密度との比であり、この場合、テストサンプルにおける正規化配列は、特別な関心対象配列のために適格サンプルにおいて同定した正規化配列に対応する。例えば、適格サンプルにおいて２１番染色体に対して同定した正規化配列が染色体、例えば１４番染色体であると決定される場合、２１番染色体（関心対象配列）のテスト配列ドースは、２１番染色体の配列タグ密度と、テストサンプルでそれぞれ決定された１４番染色体の配列タグ密度との比として決定される。同様に、１３番染色体、１８番染色体、Ｘ染色体、Ｙ染色体及び染色体異数性に関連する他の染色体の染色体ドースを決定する。関心対象染色体の正規化配列は、１個の染色体若しくは染色体グループ、又は１個の染色体断片若しくは染色体断片グループとすることができる。上述したように、関心対象配列は、染色体の一部、例えば染色体断片の一部とすることができる。したがって、染色体断片のドースは、テストサンプルにおける断片に関して決定された配列タグ密度と、テストサンプルにおける正規化染色体断片の配列タグ密度との比として決定することができ、この場合、テストサンプルにおける正規化断片は、特別な関心対象断片のために適格サンプルにおいて同定された正規化断片（単独断片又は断片グループ）に対応する。染色体断片は寸法がキロベースからメガベースにわたる。

【0138】

ステップ１５５で、複数個の適格サンプルで決定された適格配列ドース、及び関心対象配列に関して異数性が既知のサンプルに対して決定された配列ドースのために確立された標準偏差から閾値を導き出す。正確な分類は、異なるクラス、すなわち、異数性のタイプに関する確率分布間の相違に依存する。好適には、閾値は、異数性の各タイプ、例えば２１番トリソミーの経験分布から選択する。胎児及び母体の核酸混合物を含む母体サンプルから抽出したｃｆＤＮＡをシークエンシングすることによって染色体異数性を決定するのに本発明方法を使用することを説明する実施例で記載するように、１３番トリソミー、１８番トリソミー、２１番トリソミー及びＸモノソミーの異数性を分類するのに確立された可能な閾値がある。或る染色体異数性の異変サンプルを区別するよう決定される閾値は、異なる異数性の異変サンプルを区別するよう決定される閾値と同一又は異なるものとすることができる。実施例で示すように、各関心対象染色体の閾値は、サンプル間及びシークエンシングラン間にわたる染色体ドースの変動性から決定する。任意の関心対象染色体の染色体ドースの変動性が少なければ少ないほど、異なった異数性を決定するための閾値を設定するのに使用されるすべての異変なしサンプルにわたる関心対象染色体のドースにおける分散は狭くなる。

【0139】

ステップ１６０で、関心対象配列のコピー数多型を、関心対象配列のテスト配列ドースを適格配列ドースから確立した少なくとも１個の閾値と比較することによって決定する。

【0140】

ステップ１６５で、関心対象テスト配列の計算したドースを、ユーザー定義の信頼性閾値に従って選択した閾値として設定したドースと比較し、サンプルを「正常」、「異変あり」、「ノーコール」として分類する。「ノーコール」サンプルは、断定的診断を信頼性を持って下せないサンプルである。

【0141】

本発明の他の実施形態は、胎児及び母体の核酸分子を有する生物学的サンプルにおける胎児の染色体異数性を出生前診断する方法を提供する。この診断は、生物学的テストサンプル、例えば母体血漿サンプルから採取した胎児及び母体の核酸分子混合物の少なくとも一部をシークエンシングする配列情報を取得し、配列データから１個又はそれ以上の関心対象染色体の正規化ドース及び／又は１個又はそれ以上の関心対象断片の正規化断片ドースをコンピュータ計算し、テストサンプルにおける関心対象染色体の染色体ドース及び／又は関心対象断片の断片ドースと、複数個の適格（正常）サンプルで確立された閾値との統計学的有意差を決定し、及び統計学的有意差に基づいて出生前診断を行うことに基づく。本発明方法のステップ１６５で説明するように、正常又は異変ありの診断を行う。「ノーコール」は、正常又は異変ありの診断が確信を持って行うことができない場合に下す。

【0142】

サンプル
ＣＮＶ、例えば染色体異数性及び部分的異数性を決定するのに使用するサンプルは、細胞内に存在する、又は「無細胞」の核酸を有する。本発明の若干の実施形態において、無細胞核酸、例えば無細胞（cell-free）ＤＮＡ(ｃｆＤＮＡ)を採取するのが有利である。無細胞ＤＮＡを含む無細胞核酸は、生物学的サンプル、例えば限定しないが血漿及び血清から従来既知の種々の方法によって採取することができる（Chen et al., Nature Med.2:1033-1035 [1996]; Lo et al., Lancet 350:485-487 [1997]参照）。細胞から無細胞ＤＮＡを分離するため、分別、遠心分離（例えば、密度勾配遠心分離）、ＤＮＡ特異的沈降、又は高スループットの細胞ソート及び／又は分離方法を使用することができる。

【0143】

本発明に記載の方法を適用する核酸混合物を有するサンプルは、例えば組織サンプル、生体液サンプル、又は細胞サンプルのような生物学的サンプルである。若干の実施形態において、核酸混合物を生物学的サンプルから既知の方法のうち任意な１つのによって、精製又は分離する。サンプルは精製又は分離したポリヌクレオチドにより構成されるか、又は組織サンプル、生体液サンプル、又は細胞サンプルのような生物学的サンプルを含むものとすることができる。生体液としては、限定しないが、血液、血漿、血清、汗、涙、痰、尿、精液、内耳液、リンパ液、唾液、脳脊髄液、破出液、骨髄懸濁液、膣液、経頸管洗浄液、脳液、腹水、母乳、呼吸器官、腸管及び泌尿生殖器管の分泌物、羊水、及び白血球共生サンプルがある。若干の実施形態において、サンプルは、非侵襲的手順によって容易に採取できるサンプル、例えば、血液、血漿、血清、汗、涙、痰、尿、精液、内耳液、唾液、又は糞便とする。好適には、生物学的サンプルは、末梢血液サンプル、又は血漿及び血清画分とする。他の実施形態において、生物学的サンプルは、綿棒若しくは塗抹採取試料、生検試料、又は細胞培養とする。他の実施形態において、サンプルは、２種類以上の生物学的サンプルの混合物とし、例えば、生物学的サンプルは、生体液サンプル、組織サンプル及び細胞培養サンプルのうち２つ又はそれ以上を有するものとすることができる。本明細書に使用する用語「血液」、「血漿」及び「血清」は、それらの画分又は処理した部分をも包含する。同様に、サンプルを生検、綿棒、塗抹等から採取する場合、「サンプル」は生検、綿棒、塗抹等に由来する処理画分又は部分をも含む。

【0144】

若干の実施形態において、サンプルはソースから採取することができ、限定はしないが、異なる個体、同一又は異なる個体の異なる発達段階、異なる疾患の個体（例えば、がんを有する又は遺伝性疾患を有することが疑われる個体）、正常個体、個体における疾患の異なる段階で採取したサンプル、異なる環境因子を受けた個体からのサンプル、又は病理学的素因を有する個体、又は感染性疾患作用因子（ＨＩＶ）に被曝した個体からのサンプルがある。

【0145】

一実施形態において、サンプルは、妊娠した雌体、例えば、妊娠した女性から採取した母体サンプルとする。この場合、サンプルは本明細書に記載した方法を使用して解析し、胎児の潜在的染色体異常の出生前診断を行う。母体サンプルは組織サンプル、生体液サンプル、又は細胞サンプルとすることができる。生体液は、非限定的な例として、血液、血漿、血清、汗、涙、痰、尿、精液、内耳液、リンパ液、唾液、脳脊髄液、破出液、骨髄懸濁液、膣液、経頸管洗浄液、脳液、腹水、母乳、呼吸器官、腸管及び泌尿生殖器管の分泌物、羊水、及び白血球共生サンプルがある。他の実施形態において、母体サンプルは、２つ異常の生物学的サンプルの混合物とすることができ、例えば、生物学的サンプルは、生体液サンプル、組織サンプル及び細胞培養サンプルのうち２つ又はそれ以上を有するものとすることができる。若干の実施形態において、サンプルは、非侵襲的手順によって容易に採取できるサンプル、例えば、血液、血漿、血清、汗、涙、痰、尿、精液、内耳液、唾液、又は糞便とする。好適には、生物学的サンプルは、末梢血液サンプル、又は血漿及び血清画分とする。他の実施形態において、生物学的サンプルは、綿棒若しくは塗抹採取試料、生検試料、又は細胞培養とする。本明細書に使用する用語「血液」、「血漿」及び「血清」は、それらの画分又は処理した部分をも包含する。同様に、サンプルを生検、綿棒、塗抹等から採取する場合、「サンプル」は生検、綿棒、塗抹等に由来する処理画分又は部分をも含む。

【0146】

サンプルは、試験管内培養したソースを含む組織、細胞、又はポリヌクレオチドから採取することができる。培養したサンプルは、限定しないが、異なる培地及び条件（例えば、ｐＨ、圧力、若しくは温度）に維持した培養物（例えば、組織若しくは細胞）、異なる長さの期間にわたり維持した培養物（例えば、組織若しくは細胞）、異なる因子若しくは試薬（例えば、薬剤候補若しくは調節因子）で処理した培養物（例えば、組織若しくは細胞）、又は組織若しくは細胞における異なるタイプの培養物を含むソースから採取することができる。

【0147】

生物学的ソースから核酸を単離する方法は、既知であり、またソースの性質に基づいて異なってくる。当業者であれば、方法に記載の方法に必要なソースから核酸を容易に単離することができる。若干の実施形態において、核酸サンプルにおける核酸分子をフラグメント化するのは有利である。フラグメント化を行うとき、ランダムとするか、又は例えば制限エンドヌクレアーゼを使用する特別なものとすることができる。ランダムフラグメント化の方法は従来既知であり、例えば、デオキシリボヌクレアーゼ温浸、アルカリ処理、及び物理的剪断がある。一実施形態において、サンプル核酸は、フラグメント化を受けていないｃｆＤＮＡから採取する。他の実施形態において、サンプル核酸は、約５００以上の塩基対のフラグメントにフラグメント化された、またＮＧＳ方法を容易に適用できるゲノムＤＮＡから採取する。

【0148】

出生前診断のためのＣＮＶ決定
母体血液内で循環する無細胞胎児ＤＮＡ及びＲＮＡは、母体管理及び生殖意思決定支援双方を行うため、多くの遺伝子疾患の初期出生前診断（ＮＩＰＤ：non-invasive prenatal diagnosis）に使用することができる。血流内で循環する無細胞ＤＮＡの存在は５０年にわたり知られてきた。より最近では、循環する少量の胎児ＤＮＡの存在が妊娠期間中の母体血流で発見された（Lo et al., Lancet 350:485-487 [1997]参照）。死にかけている胎盤細胞に由来すると考えられている、無細胞（cell-free）胎児ＤＮＡ（ｃｆＤＮＡ）は、典型的には２００ｂｐより少ない長さの短いフラグメントにより構成されていることが分かっており（Chan et al., Clin Chem 50:88-92 {2004]参照）、このｃｆＤＮＡは、妊娠４週目の早期に確認することができ（Illanes et al., Early Human Dev 83:563-566 [2007]参照）、また数時間の配給内で母体循環から除去されることがわかっている（Lo et al., Am J Hum Genet64:218-224 [1999]参照）。ＣｆＤＮＡの他に、無細胞胎児ＲＮＡ（ｃｆＲＮＡ）のフラグメントは、母体血流内に確認することができ、これは胎児又は胎盤内で転写された遺伝子に由来する。母体血液サンプルからのこれら胎児遺伝要素の抽出及びその後の解析により、新規なＮＩＰＤ機会をもたらす。

【0149】

本発明方法は、ＮＩＰＤに使用され、また胎児ｃｆＤＮＡを母体ｃｆＤＮＡから区別する必要がなく、胎児の異数性を決定することができる多型性独立方法である。若干の実施形態において、異数性は、完全染色体トリソミー若しくはモノソミー又は部分的トリソミー若しくはモノソミーである。部分的異数性は、染色体の一部の不足又は過剰によって生じ、また不安定な転座、不安定な反転、欠失及び挿入から引き起こされる染色体不均衡を含む。これまで、最も一般的に知られている生存可能な異数性は、２１番トリソミー、すなわちダウン症候群（ＤＳ）であり、これは２１番染色体の一部又はすべての存在によって生ずる。ＤＳは遺伝的又は散発性の異常によって引き起こされ、２１番染色体のすべて又は一部の過剰コピーが、他の染色体（通常、１４番染色体）に取り付いて、単独の変形した染色体を形成する。ＤＳは、知能障害、深刻な学習困難性、及び心臓病などの長期健康問題で生ずる超過死亡に関連する。臨床的に有意であることが知られている他の異数性としては、エドワーズ症候群（１８番トリソミー）及びパトー症候群（１３番トリソミー）があり、しばしば最初の２，３か月の寿命で死亡する。性染色体の数に関連する異常性も既知であり、Ｘモノソミー、例えばターナー症候群（ＸＯ）、及び女児出生におけるトリプルＸ症候群（ＸＸＸ）、クラインフェルター症候群（ＸＸＹ）、及び男児出生におけるＸＹＹ症候群があり、知的技能の欠落及び減退を含む種々の表現型に関連する。本発明方法を使用して、これら及び他の染色体異常を出生前に診断することができる。

【0150】

本発明の若干の実施形態によれば、本発明方法により決定されるトリソミーは、２１番トリソミー（Ｔ２１;ダウン症候群）、１８番トリソミー（Ｔ１８;エドワーズ症候群）、１６番トリソミー（Ｔ１６）、２２番トリソミー（Ｔ２２；キャットアイ症候群）、１５番トリソミー（Ｔ１５；プラダーウィリ症候群）、１３番トリソミー（Ｔ１３；パトー症候群）、８番トリソミー（Ｔ８；ワーカニー症候群）、ＸＸＹ（クラインフェルター症候群）、ＸＹＹ、又はＸＸＸトリソミーに限定しない。本発明が教示することによれば、様々な他の完全トリソミー及び部分的トリソミーを胎児ｃｆＤＮＡで決定することができる。部分的トリソミーの例としては、限定しないが、部分トリソミーｌｑ３２〜４４、９ｐトリソミー、４番トリソミーモザイク、１７ｐトリソミー、部分トリソミー４ｑ２６−ｑｔｅｒ、９番トリソミー、部分２ｐトリソミー、部分トリソミー１ｑ、及び／又は部分トリソミー６ｐ／モノソミー６ｑがある。

【0151】

本発明方法は、Ｘ染色体モノソミー、及び部分的モノソミーを決定することができ、部分的モノソミーとしては、例えば１３番モノソミー、１５番モノソミー、１６番モノソミー、２１番モノソミー、２２番モノソミーがあり、これらは流産となる妊娠に見られることが知られている。一般的に完全異数性に見られる染色体の部分的モノソミーも本発明方法によって決定することができる。モノソミー１８ｐは、まれな染色体障害であり、これは１８番染色体の短アームのすべて又は一部を欠失している（一染色体性である）。この障害は、典型的には小人症、程度に幅がある知能発育不全、発話発達遅滞、頭蓋骨及び顔（頭蓋顔面）領域奇形、及び／又は付加的な身体的異常で特徴付けされる。頭蓋顔面に関連する障害は、範囲及び重篤度に関して、ケースごとに大きく変動がある。１５番染色体の構造又はコピー数多型によって生ずる症状としては、アンジェルマン症候群及びプラダーウィリ症候群があり、これらは１５番染色体の同一部分、１５ｑ１１〜ｑ１３における遺伝子活性欠乏がある。幾つかの転座及び微小欠失は、キャリヤである親には無症状であり得るが、それでも子孫に大きな遺伝的障害を発症し得る。例えば、１５ｑ１１〜ｑ１３微小欠失を有する健康な母親は、アンジェルマン症候群、重篤な神経変性疾患を持つ子供を産むことがあり得る。本発明方法を使用して胎児におけるこのような部分的欠失及び他の欠失を同定することができる。部分モノソミー１３ｑはまれな染色体障害であり、１３番染色体における長アームの一部が消失している（一染色体性である）結果である。部分モノソミー１３ｑを持って生まれた胎児は、低出産時体重、頭部及び顔（頭蓋顔面領域）の奇形、骨格異常（とくに、手及び足）、及び他の身体的異常を呈する。精神発達遅滞はこの症状の特徴である。幼年期中の死亡率はこの障害を持って産まれた個体が高い。部分モノソミー１３ｑのほとんどすべてのケースは、はっきりとした理由なくランダムに（散発的に）発生する。２２ｑ１１.２欠失症候群（ディジョージ症候群としても知られている）は、２２番染色体の小さいピースの欠失によって発症する症候群である。（２２ｑ１１.２）欠失は、その染色体対のうち一方における長アームにある染色体中間部近傍で生ずる。この症候群の特徴は、同一症候群メンバー内でも広範囲に変動があり、身体の多くの部分に異変を及ぼす。特徴的兆候及び症候は、出生異常、例えば、先天性心臓疾患、最も一般的には神経筋の閉止問題に関連する口蓋における欠陥（口蓋帆咽頭不全）、学習障害、顔の特徴における軽度の相違、及び反復性感染がある。染色体領域２２ｑ１１.２での微小欠失は、統合失調症を２０〜３０倍にも増大させるリスクに関連する。一実施形態において、本発明方法を使用して、限定はしないが、モノソミー１８ｐ、１５番染色体の部分モノソミー（１５ｑ１１〜ｑ１３）、部分モノソミー１３ｑを含む部分モノソミーを決定し、また２２番染色体の部分モノソミーも本発明方法を用いて決定することができる。

【0152】

本発明方法は、片方の親がこのような異常性のキャリヤであることが分かっている場合に何らかの異数性を決定するのにも使用することができる。これら異数性としては、限定しないが、小さい過剰マーカー染色体（ＳＭＣ：supernumerary marker chromosome）のモザイク、t(11;14)(p15;p13)転座、不均衡転座t(8;11)(p23.2;p15.5)、１１ｑ２３微小欠失、１７ｐ１１.２欠失、２２ｑ１３.３欠失、Ｘｐ２２.３微小欠失、１０ｐ１４欠失、２０ｐ微小欠失、ディジョージ症候群[del(22)(q11.2q11.23]、ウィリアムズ症候群(7q11.23及び7q36欠失)、１ｐ３６欠失、２ｐ微小欠失、神経線維腫症１型（17q11.2微小欠失）、Ｙｑ欠失、ウォルフ・ヒルシュホーン（Wolf-Hirschhorn）症候群（WHS, 4p16.3微小欠失）、１ｐ３６.２微小欠失、１１ｑ１４欠失、１９ｑ１３.２微小欠失、ルビンシュタイン・タイビ（16p13.3微小欠失）７ｐ２１微小欠失、ミラー・ディーカー（Miller-Dieker）症候群、１７ｐ１１.２欠失、及び２ｑ３７微小欠失がある。

【0153】

完全胎児染色体異数性の決定
一実施形態において、本発明は、胎児及び母体の核酸分子を含む母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法を提供する。好適には、本発明方法は、任意の４つ又はそれ以上の完全染色体異数性の有無を決定する。本発明方法のステップは、（ａ）母体テストサンプルにおける胎児及び母体核酸の配列情報を取得するステップと、及び（ｂ）配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体それぞれにおける配列タグ数を同定し、また任意の１個又はそれ以上の関心対象染色体それぞれにおける正規化染色体配列の配列タグ数を同定するステップとを有する。正規化染色体配列は単独染色体とするか、又は１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した染色体グループとすることができる。本発明方法は、さらに、ステップ（ｃ）において、任意の１個又はそれ以上の関心対象染色体それぞれに対して同定した配列タグ数、及び各正規化染色体配列に対して同定した配列タグ数を使用して、任意の１個又はそれ以上の関心対象染色体それぞれにおける単独染色体ドースを計算し、及びステップ（ｄ）で任意の１個又はそれ以上の関心対象染色体それぞれにおける各単独染色体ドースを任意の１個又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児異数性の有無を決定する。

【0154】

若干の実施形態において、ステップ（ｃ）は、各関心対象染色体の単独染色体ドースを、各関心対象染色体に対して同定した配列タグ数と、各関心対象染色体の正規化染色体に対して同定した配列タグ数との比として計算する。

【0155】

他の実施形態において、ステップ（ｃ）は、関心対象染色体それぞれの単独染色体ドースを、関心対象染色体それぞれに対して同定した配列タグ数と、関心対象染色体それぞれの正規化染色体に対して同定した配列タグ数との比として計算する。他の実施形態において、ステップ（ｃ）は、関心対象染色体の配列タグ比の計算を、関心対象染色体に対して得た配列タグ数を関心対象染色体の長さに関連付けし、また関心対象染色体の対応する正規化染色体配列のタグ数を正規化染色体配列の長さに関連付けし、また関心対象染色体の染色体ドースを、関心対象染色体の配列タグ密度と正規化配列の配列タグ密度との比として計算することによって行う。すべての関心対象染色体それぞれに対してこの計算を繰り返す。ステップ（ａ）〜（ｄ）を、異なる母体検体からのテストサンプルに対して繰り返すことができる。

【0156】

４つ又はそれ以上の完全胎児染色体異数性を、胎児及び母体の無細胞ＤＮＡの混合物を含む母体テストサンプルにおいて決定する実施形態の例は、（ａ）テストサンプルにおける胎児及び母体の無細胞ＤＮＡ分子の少なくとも一部をシークエンシングして配列情報を取得するステップと、（ｂ）この配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の２０個又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、またその２０個又はそれ以上の関心対象染色体それぞれの正規化染色体の配列タグ数を同定するステップと、（ｃ）その２０個又はそれ以上の関心対象染色体それぞれに対して同定した配列タグ数及び各正規化染色体に対して同定した配列タグ数を使用して、その２０個又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び（ｄ）その２０個又はそれ以上の関心対象染色体それぞれの各単独染色体ドースを、２０個又はそれ以上の関心対象染色体それぞれの閾値と比較し、またこれによりテストサンプルにおける任意の２０又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有する。

【0157】

他の実施形態において、上述の母体テストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定する方法は、関心対象染色体におけるドースを決定する正規化断片配列を使用する。この場合、この方法は、（ａ）テストサンプルにおける胎児及び母体の核酸の配列情報を取得するステップと、（ｂ）この配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、またその１つ又はそれ以上の関心対象染色体それぞれの正規化断片配列の配列タグ数を同定するステップとを有する。正規化断片配列は、染色体の単独断片とするか、又は任意の１個又はそれ以上の異なった染色体からの断片グループとすることができる。この方法は、さらに、（ｃ）その任意の１個又はそれ以上の関心対象染色体それぞれに対して同定した配列タグ数及び各正規化断片配列に対して同定した配列タグ数を使用して、その任意の１個又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び（ｄ）その任意の１個又はそれ以上の関心対象染色体それぞれの各単独染色体ドースを、任意の１個又はそれ以上の関心対象染色体それぞれの閾値と比較し、またこれによりテストサンプルにおける任意の１つ又はそれ以上の異なった完全胎児染色体異数性の有無を決定するステップとを有する。

【0158】

若干の実施形態において、ステップ（ｃ）は、関心対象染色体それぞれの単独染色体ドースを、関心対象染色体それぞれに対して同定した配列タグ数と、関心対象染色体それぞれの正規化断片配列に対して同定した配列タグ数との比として計算する。

【0159】

他の実施形態において、ステップ（ｃ）は、関心対象染色体の配列タグ比の計算を、関心対象染色体に対して得た配列タグ数を関心対象染色体の長さに関連付けし、また関心対象染色体の対応する正規化断片配列のタグ数を正規化断片配列の長さに関連付けし、また関心対象染色体の染色体ドースを、関心対象染色体の配列タグ密度と正規化断片配列の配列タグ密度との比として計算することによって行う。すべての関心対象染色体それぞれに対してこの計算を繰り返す。ステップ（ａ）〜（ｄ）を、異なる母体検体からのテストサンプルに対して繰り返すことができる。

【0160】

異なるサンプルセットの染色体ドースを比較する手段は、テストサンプルにおける染色体ドースを、適格サンプルセットにおける対応の染色体ドースの平均に関連付ける正規化染色体値（ＮＣＶ：normalized chromosome value）を決定することによって得ることができる。ＮＣＶは、次式のように計算する。

【数3】

ここで、

は、それぞれ適格サンプルセットにおけるｊ番染色体ドースに対する推定した平均及び標準偏差であり、ｘ_ijはテストサンプルｉにおける観測したｊ番染色体ドースである。

【0161】

若干の実施形態において、少なくとも１つの完全胎児染色体異数性の有無を決定する。他の実施形態において、少なくとも２つ、少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、少なくとも９つ、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、少なくとも１８、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、少なくとも２４の、完全胎児染色体異数性の有無を１つのサンプル内で決定し、この場合、２２の完全胎児染色体異数性は、任意の１つ又はそれ以上の常染色体における完全染色体異数性に対応し、２３番目の染色体異数性及び２４番目の染色体異数性はＸ染色体及びＹ染色体の完全胎児染色体異数性に対応する。性染色体の異数性はテトラソミー、ペンタソミー及び他のポリソミーを含むため、本発明方法により決定することができる異なる完全染色体異数性の数としては、少なくとも２４、少なくとも２５、少なくとも２６、少なくとも２７、少なくとも２８、少なくとも２９、又は少なくとも３０の、完全染色体異数性がある。したがって、決定される異なる完全胎児染色体異数性の数は、解析用に選択される関心対象染色体の数に関連する。

【0162】

一実施形態において、上述のように母体テストサンプルにおける任意の１個又はそれ以上の異なる完全胎児染色体異数性の有無を決定することは、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した１つの関心対象染色体の正規化断片配列を使用する。他の実施形態において、２個又はそれ以上の関心対象染色体を、１番，２番，３番，４番，５番，６番，７番，８番，９番，１０番，１１番，１２番，１３番，１４番，１５番，１６番，１７番，１８番，１９番，２０番，２１番，２２番染色体、Ｘ染色体及びＹ染色体のうち任意の２つ又はそれ以上から選択する。一実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも２０個の染色体を有し、この場合、少なくとも２０の異なった完全胎児染色体異数性の有無を決定する。他の実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてとし、またこの場合、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてにおける完全胎児染色体異数性の有無を決定する。決定することができる異なる完全胎児染色体異数性としては、完全染色体トリソミー、完全染色体モノソミー、及び完全染色体ポリソミーがある。完全胎児染色体異数性の例としては、常染色体のうち任意の１個又はそれ以上におけるトリソミー、例えば２番トリソミー、８番トリソミー、９番トリソミー、２１番トリソミー、１３番トリソミー、１６番トリソミー、１８番トリソミー、２２番トリソミーに限定することなく、性染色体のトリソミー、例えば４７,ＸＸＹ、４７ＸＸＸ、及び４７ＸＹＹ；性染色体のテトラソミー、例えば４８,ＸＸＹＹ、４８,ＸＸＸＹ、及び４８ＸＸＸＸ、及び４８ＸＹＹＹ；性染色体のペンタソミー、例えば４９,ＸＸＸＹＹ、４９,ＸＸＸＸＹ、及び４９,ＸＸＸＸＸ、及び４９,ＸＹＹＹＹ；及びＸモノソミーがある。本発明方法によって決定できる他の完全胎児染色体異数性を以下に説明する。

【0163】

部分胎児染色体異数性の決定
他の実施形態において、本発明は、胎児及び母体の核酸分子を含む母体テストサンプルにおける任意の１つ又はそれ以上の異なった部分胎児染色体異数性の有無を決定する方法を提供する。本発明方法のステップとしては、（ａ）母体テストサンプルにおける胎児及び母体核酸の配列情報を取得するステップと、及び（ｂ）配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれにおける配列タグ数を同定し、また任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれにおける正規化断片配列の配列タグ数を同定するステップとを有する。正規化断片配列は染色体の単独断片とするか、又は１個又はそれ以上の異なった染色体からの断片グループとすることができる。本発明方法は、さらに、ステップ（ｃ）において、任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれに対して同定した配列タグ数、及び各正規化断片配列に対して同定した配列タグ数を使用して、任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれの単独断片ドースを計算し、及びステップ（ｄ）で任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれにおける各単独断片ドースを任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の染色体断片それぞれの閾値と比較し、これにより母体テストサンプルにおける任意の１つ又はそれ以上の異なった部分胎児染色体異数性の有無を決定する。

【0164】

若干の実施形態において、ステップ（ｃ）は、任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上それぞれの単独断片ドースを、任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれに対して同定した配列タグ数と、任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれの正規化断片配列に対して同定した配列タグ数との比として計算する。

【0165】

他の実施形態において、ステップ（ｃ）は、関心対象断片の配列タグ比の計算を、関心対象断片に対して得た配列タグ数を関心対象断片の長さに関連付けし、また関心対象断片の対応する正規化断片配列のタグ数を正規化断片配列の長さに関連付けし、また関心対象断片の断片ドースを、関心対象断片の配列タグ密度と正規化断片配列の配列タグ密度との比として計算することによって行う。すべての関心対象染色体それぞれに対してこの計算を繰り返す。ステップ（ａ）〜（ｄ）を、異なる母体検体からのテストサンプルに対して繰り返すことができる。

【0166】

異なるサンプルセットの断片ドースを比較する手段は、テストサンプルにおける断片ドースを、適格サンプルセットにおける対応の断片ドースの平均に関連付ける正規化断片値（ＮＳＶ：normalized segment value）を決定することによって得ることができる。ＮＳＶは、次式のように計算される。

【数4】

ここで、

は、それぞれ適格サンプルセットにおけるｊ番断片ドースに対する推定した平均及び標準偏差であり、ｘ_ijはテストサンプルｉにおける観測したｊ番断片ドースである。

【0167】

若干の実施形態において、少なくとも１つの部分胎児染色体異数性の有無を決定する。他の実施形態において、２つ、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０、１５、２０、２５、又はそれ以上の、部分胎児染色体異数性の有無を１つのサンプル内で決定する。一実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１個から選択した１個の関心対象断片は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択する。他の実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した２個又はそれ以上の関心対象断片を、１番，２番，３番，４番，５番，６番，７番，８番，９番，１０番，１１番，１２番，１３番，１４番，１５番，１６番，１７番，１８番，１９番，２０番，２１番，２２番染色体、Ｘ染色体及びＹ染色体のうち任意の２つ又はそれ以上から選択する。一実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象断片は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも１個、５個、１０個、１５個、２０個、２５個又はそれ以上の断片を有し、この場合、少なくとも１個、５個、１０個、１５個、２０個、２５個の異なった部分胎児染色体異数性の有無を決定する。決定することができる異なる部分胎児染色体異数性としては、部分重複、部分増殖、部分挿入、及び部分欠失がある。部分胎児染色体異数性の例としては、常染色体の部分モノソミー、及び部分トリソミーがある。常染色体の部分モノソミーとしては、１番染色体の部分モノソミー、４番染色体の部分モノソミー、５番染色体の部分モノソミー、７番染色体の部分モノソミー、１１番染色体の部分モノソミー、１５番染色体の部分モノソミー、１７番染色体の部分モノソミー、１８番染色体の部分モノソミー、及び２２番染色体の部分モノソミー、がある。本発明方法によって決定できる他の部分胎児染色体異数性を以下に説明する。

【0168】

上述した実施形態の任意の１つにおいて、テストサンプルは、血液、血漿、血清、尿、及び唾液のサンプルから選択した母体サンプルとする。若干の実施形態において、母体サンプルは血漿サンプルとする。母体サンプルの核酸分子は、胎児及び母体の無細胞ＤＮＡ分子の混合物である。核酸のシークエンシングは、本明細書のいたるところに記載したように、次世代シークエンシング（ＮＧＳ）を使用して行うことができる。他の実施形態において、シークエンシングは、可逆色素ターミネーターによるシークエンシング・バイ・シンセシスを使用する大量並列シークエンシングとする。他の実施形態において、シークエンシングは、シークエンシング・バイ・リゲーションとする。さらに他の実施形態において、シークエンシングは単独分子シークエンシングとする。随意的に増幅ステップをシークエンシングに先立って行う。

【0169】

臨床的障害のＣＮＶ決定
出生異常の早期決定の他に、本明細書に記載する方法は、ゲノムにおける遺伝子配列の表現における何らかの異常性決定に適用することができる。

【0170】

がん患者からの血液における血漿及び血清ＤＮＡは測定可能な量の腫瘍ＤＮＡを含み、これら腫瘍ＤＮＡを回収し、腫瘍ＤＮＡの代理ソースとして使用することができ、また腫瘍には、遺伝子配列若しくは全体染色体においてさえも、異数性又は不適切な数に特徴がある。個体からのサンプルにおける所定配列、すなわち、関心対象配列の総量における相違決定を内科的疾患の診断に使用することができる。若干の実施形態において、本発明方法を使用して、がんを患っていることが疑われる又は既知の患者における染色体異数性の有無を決定することができる。さらに、本発明方法は、疾患状態の有無を決定する、病原体、例えばウイルスの核酸の有無を決定する、移植片対宿主拒絶反応（ＧＶＨＤ：graft versus host disease）に関連する染色体異常を決定する、及び法医学解析における個体の関与を決定するのにも使用することができる。

【0171】

本発明の実施形態は、異なる２つのゲノム由来の核酸混合物を含み、１個又はそれ以上の関心対象配列の総量に違いがあることが既知又は疑われるテストサンプルにおける関心対象配列、例えば、臨床関連配列のコピー数多型を評価する方法を提供する。核酸混合物は２つ又はそれ以上の細胞型に由来する。一実施形態において、核酸混合物は、内科的疾患、例えばがんを患っている検体から採取した正常細胞及びがん性細胞に由来する。

【0172】

がんの発症には、しばしば全体染色体の数における変動、すなわち完全染色体異数性、及び／又は染色体断片の数の変動、すなわち部分異数性を伴うことがよくあり、これらは染色体不安定性（ＣＩＮ：chromosome instability）として知られているプロセスによって生ずる（Thoma et al.,Swiss Med Weekly 2011:141:w13170参照）。多くの固形腫瘍、例えば乳がんは、初期位置から数個の遺伝子異常の蓄積による転移として進行する（Sato et al., Cancer Res., 50:7184-7189 [1990]; Jongsma et.al., J Clin Pathol: Mol Path 55:305-309 [2002]参照）。このような遺伝子異常は、蓄積すると、増殖性優位、遺伝的不安定性、及び薬物抵抗性が急激に進展する付随能力、亢進する血管形成、タンパク質分解及び転移をもたらす。この遺伝子異常は、減退する「腫瘍抑制遺伝子」又は優勢に作用する腫瘍遺伝子のいずれかの影響をもたらす。ヘテロ接合性喪失（ＬＯＨ：loss of heterozygosity）にいたる欠失及び遺伝子組換えは、突然変異腫瘍抑制対立遺伝子をカバーしないことによって、腫瘍進行に大きな役割を果たすと信じられている。

【0173】

ｃｆＤＮＡは、悪性腫瘍と診断された患者の血液循環内で見つかっており、悪性腫瘍としては、限定しないが、肺がん（Pathak et al., Clin Chem 52:1833-1842 {2006]参照）、前立腺がん（Schwartzenbach et al., Clin Cancer Res 15:1032-8 [2009]参照）、及び乳がん（Schwartzenbach et al., breast-cancer-research.com/content/11/5/R7 [2009]参照）で見つかっている。がん患者における循環ｃｆＤＮＡで決定することができるがんに関連するゲノム不安定性の同定は、潜在的な診断及び予測ツールである。一実施形態において、本発明方法は、がん、例えば、上皮性悪性腫、非上皮性悪性腫瘍、リンパ腫、白血病、胚細胞腫瘍、及び芽細胞腫に罹患していることが疑われる又は既知である検体に由来する核酸混合物を有するサンプルにおける関心対象ＣＮＶを評価する。一実施形態において、サンプルは末梢血液から採取（処理）した血漿サンプルとし、この血漿サンプルは正常細胞及びがん性細胞に由来するｃｆＤＮＡの混合物を含む。他の実施形態において、ＣＮＶが存在するか否かを決定するのに必要な生物学的サンプルは、他の生体液、例えば、限定しないが、血清、汗、涙、痰、尿、精液、内耳液、リンパ液、唾液、脳脊髄、破出液、骨髄懸濁液、膣液、経頸管洗浄液、脳液、腹水、母乳、呼吸器官、腸管及び泌尿生殖器管の分泌物、羊水、及び白血球共生サンプルからの、又は組織生検、綿棒若しくは塗抹採取試料における、がん性細胞及び非がん性細胞の混合物に由来するものとする。

【0174】

関心対象配列は、がんの発症及び／又は進行に役割を果たすことが既知である、又は疑われる核酸配列である。関心対象配列の例としては、核酸配列、すなわち、完全染色体及び／又は染色体断片があり、これらは以下に説明するように、がん性細胞内で増幅又は欠失される。

【0175】

一実施形態において、本発明方法は、染色体増幅の有無を決定するのに使用することができる。若干の実施形態において、染色体増幅は、１個又はそれ以上の染色体の過剰生成である。他の実施形態において、染色体増幅は、１個又はそれ以上の染色体断片の過剰生成である。さらに他の実施形態において、染色体増幅は、２個又はそれ以上の染色体における２個又はそれ以上の断片の過剰生成である。染色体増幅は、１個又はそれ以上のがん遺伝子の過剰生成である。

【0176】

ヒトの固形腫瘍に関連して優勢的に活動する遺伝子は、過剰表現又は異形表現として効果を発揮する。遺伝子増幅は、遺伝子表現の上方調節に向かう共通のメカニズムである。細胞発生に関する研究からの証拠は、ヒトの乳がんの５０％以上にもわたり大きな増幅を生ずることを示している。最も注目すべきは、１７番染色体（17(17q21-q22)）に位置するがん原遺伝子に対するヒトにおける上皮細胞増殖因子受容体２（ＨＥＲ２：human epidermal growth factor receptor 2）の増幅によって、細胞表面におけるＨＥＲ２の過剰表現となり、乳がん及び他の悪性腫瘍における過剰なかつ無調節なシグナルを発生することになる（Park et al., Clinical Breast Cancer 8:392-401 [2008]参照）。様々ながん遺伝子が、ヒトの他の悪性腫瘍で増幅されることが分かってきた。ヒトの腫瘍における細胞性がん遺伝子の増幅は、前骨髄球性白血病細胞株ＨＬ６０及び小細胞肺がん細胞株におけるｃ-ｍｙｃ、原発性神経芽細胞腫（ステージIII及びIV）、神経芽腫細胞株、網膜芽細胞腫細胞株、原発性腫瘍、小細胞肺がん株、及び腫瘍におけるＮ-ｍｙｃ、小細胞肺がん細胞株及び腫瘍におけるＬ-ｍｙｃ、急性骨髄性白血病及び、大腸がん細胞株におけるｃ-ｍｙｂ、表皮がん細胞及び原発性神経膠腫におけるｃ-ｅｒｂｂ、肺、大腸、膀胱、及び直腸の原発性上皮性悪性腫瘍におけるｃ-Ｋ-ｒａｓ-２、乳房上皮性悪性腫瘍細胞株におけるＮ-ｒａｓの増幅を有する（Varmus H., Ann Rev Genetics 18:553-612 (1984)[cited in Watson et al., Molecular Biology of the Gene(4th ed.;Benjamin/Cummings Publishing Co. 1987)]参照）。

【0177】

一実施形態において、本発明方法を使用して染色体欠失の有無を決定することができる。若干の実施形態において、染色体欠失は、１個又はそれ以上の全体染色体の喪失とする。他の実施形態において、染色体欠失は、１個の染色体における１個又はそれ以上の断片の喪失とする。さらに他の実施形態において、染色体欠失は、２個又はそれ以上の染色体における２個又はそれ以上の断片の喪失とする。染色体欠失は、１個又はそれ以上の腫瘍抑制遺伝子の喪失を含むものとすることができる。

【0178】

腫瘍抑制遺伝子を含む染色体欠失は、固形腫瘍の発症及び進行に重要な役割を果たす。染色体１３ｑ１４に位置する網膜芽細胞腫抑制遺伝子（Ｒｂ-１）は最も強く特徴付けられた腫瘍抑制遺伝子である。Ｒｂ-１遺伝子産物である１０５ｋＤａ細胞核リンタンパク質は細胞サイクル調節に重要な役割を果たす（Howe et al., Proc Natl Acad Sci (USA) 87:5883-5887 [1990]参照）。Ｒｂタンパク質の変化又は喪失表現は、点（突然）変異又は染色体欠失のいずれかによって、両方の対立遺伝子の不活性化により生ずる。Ｒｂ-ｉ遺伝子の変化は、網膜芽細胞腫だけでなく、他の悪性腫瘍、例えば骨肉腫、小細胞肺がん（Rygaard et al., Cancer Res 50:5312-5317 [1990]参照）、及び乳がんでもあることが分かっている。制限断片長多型（ＲＦＬＰ：restriction fragment length polymorphism）研究は、このような腫瘍タイプは１３ｑでしばしばヘテロ接合性を喪失しており、Ｒｂ-１の対立遺伝子のうち一方が全体的な染色体欠失によって喪失していることを示唆するものであることを示した（Bowcock et al., Am J Hum Genet, 46:12 [1990]参照）。重複、欠失並びに６番染色体及び他のパートナー染色体を巻き込む不均衡転座を含む、１番染色体の異常は、１番染色体の領域、とくに、１ｑ２１〜１ｑ３２及び１ｐ１１〜１３が、骨髄増殖性新生物の慢性及び進行期双方に病因的に関連するがん遺伝子又は腫瘍抑制遺伝子を持っていることを示す（Caramazza et al., Eur J Hematol 84:191-200 [2010]参照）。骨髄増殖性新生物は５番染色体の欠失にも関連する。５番染色体の完全喪失又は間質的欠失は、骨髄異形成症候群（ＭＤＳ：myelodysplastic syndromes）における最も共通する核型異常である。単独del(5q)/5qのＭＤＳ患者は、付加的核型欠陥を有する患者よりも見込みある予後診断を受け、付加的核型欠陥を有する患者は骨髄増殖性新生物（ＭＰＮｓ：myeloproliferative neoplasms）及び急性骨髄性白血病を発症する傾向がある。不均衡となる５番染色体欠失の頻度は、５ｑには造血幹細胞／前駆細胞（ＨＳＣ／ＨＰＣ）の成長制御に基本的な役割を持つ１個又はそれ以上の腫瘍抑制遺伝子があるという着想に至る。５ｑ３１及び５ｑ３２に中心がある共通欠失領域（ＣＤＲ：commonly deleted regions）の細胞発生マッピングは、リボソーム・サブユニットＲＰＳ１４、転写因子Ｅｇｒｌ／Ｋｒｏｘ２０、細胞骨格再構成タンパク質及びαカテニンを含む腫瘍抑制遺伝子候補を同定した（Eisenmann et al., Oncogene 28:3429-3441 [2009]参照）。新鮮腫瘍及び腫瘍細胞株の細胞発生及びアレロタイプ化の研究は、３ｐ２５，３ｐ２１〜２２、３ｐ２１.３、３ｐ１２〜１３及び３ｐ１４を含む３番染色体の幾つかの明確な領域からのアレル欠失（対立遺伝子欠損）が、肺、乳房、腎臓、頭頸部、卵巣、頸部、大腸、膵臓、食道、膀胱、及び他の臓器における深刻な広範囲の上皮がんに見られる、最も初期に最も頻発するゲノム以上である。幾つかの腫瘍抑制遺伝子が染色体の３ｐ領域にマッピングされ、そして考えられることは、間質欠失又はプロモーター過剰メチル化が上皮性悪性腫瘍発症における３ｐ又は３番染色体全体の喪失に先行して生ずるということである（Angeloni D.,Briefings Functional Genomics 6:19-39 [2007]参照）。ダウン症候群（ＤＳ）を持つ新生児及び子供は、先天性一過性白血病を呈することがよくあり、また急性骨髄性白血病及び急性リンパ芽球性白血病のリスクが増大する。約３００個の遺伝子を有する２１番染色体は、多くの構造的異常、例えば、転座、欠失、及び増幅が白血病、リンパ腫、及び固形腫瘍に含まれる。さらに、２１番染色体に位置する遺伝子は腫瘍形成に重要な役割を果たすことが同定された。体細胞に関する並びに構造上の２１番染色体異常は白血病に関連し、また２１ｑに位置するＲＵＮＸ１、ＴＭＰＲＳＳ２及びＴＦＦを含む特定遺伝子が腫瘍形成に役割を果たす（Fonatsch C Gene Chromosomes Cancer 49:497-508 [2010]参照）。

【0179】

一実施形態において、本発明方法は、遺伝子増幅と腫瘍進行度との関連性を評価する手段を提供する。増幅及び／又は欠失とがんのステージ又は悪性度との相関性は予測の上で重要であり、なぜなら、このような情報は遺伝的腫瘍悪性度の定義に寄与し、この悪性度は最悪の予測が持たれるより進行した腫瘍での将来的病気進行をよりよく予測する。さらに、初期増幅及び／又は欠失に関する情報は、将来的病気進行の予測因子としてこれら事象を評価する上で有用である。本発明方法によって同定されるように、遺伝子増幅及び欠失は、他の既知のパラメータ、例えば、腫瘍悪性度、組織構造、Ｂｒｄ／Ｕｒｄラベル付け指標、ホルモン状態、リンパ節の転移、腫瘍サイズ、生存期間、並びに疫学的及び生物統計学的研究から得られる他の腫瘍特性に関連付けることができる。例えば、本発明方法によってテストすべき腫瘍ＤＮＡとしては、異型過形成、非浸潤性乳管がん、ステージＩ〜IIIのがん、及び転移リンパ節があり、増幅及び欠失とステージとの関連性の同定を行うことができる。なされた関連性はできるだけ有効な治療介入を行うことができる。例えば、絶えず増幅される領域は過剰表現された遺伝子を含み、この遺伝子の生成物を治療的に攻撃することができる（例えば、成長因子受容体チロシン・キナーゼ、ｐ１８５^ＨＥＲ２）。

【0180】

本発明方法を使用して、原発がんから他の部位に転移したがん細胞の核酸配列のコピー数多型を決定することによって、薬物抵抗性に関連する増幅及び／又は欠失事象同定することができる。遺伝子増幅及び／又は欠失が薬物抵抗性の急速な発展を可能にする核型不安定性の発現である場合、化学療法に感受性のある患者の腫瘍よりも、化学療法に耐性がある患者からの原発腫瘍により多くの増幅及び／又は欠失が予想される。例えば、特定遺伝子の増幅が薬物抵抗性の発達に寄与する場合、その遺伝子の周囲の領域が、化学療法に耐性がある患者の原発腫瘍ではなく、胸膜滲出からの腫瘍細胞で絶えず増幅されていることが予想される。遺伝子増幅及び／又は欠失と薬物耐性発達との間の関連性を発見することは、術後補助（アジュバント）療法が有益か否かの患者同定を可能にする。

【0181】

母体サンプルにおける完全及び／又は部分的な胎児染色体異数性の有無を決定することにつき説明したのと同様に、本発明方法を使用して、核酸、例えば、ＤＮＡ又はｃｆＤＮＡを含む任意の患者サンプル（母体サンプルではない患者サンプルを含む）における完全及び／又は部分的な染色体異数性の有無を決定することができる。患者サンプルは、本明細書のいたるところに記載したように、任意の生物学的サンプルとすることができる。好適には、サンプルは非侵襲的手順で採取する。例えば、サンプルは血液サンプル又は血液の血清及び血漿画分とすることができる。代案として、サンプルは尿サンプル又は糞便サンプルとすることができる。さらに他の実施形態において、サンプルは組織生検サンプルとする。すべてのケースで、サンプルは核酸、例えば、ｃｆＤＮＡ又はゲノムＤＮＡを含み、これらＤＮＡを精製し、上述のような任意のＮＧＳシークエンシングを使用してシークエンシングする。

【0182】

フォーメーションに関連する完全及び部分的染色体異数性、並びにがん進行の双方を本発明方法により決定することができる。

【0183】

患者サンプルにおける完全染色体異数性の決定
一実施形態において、本発明は、核酸分子を含む患者テストサンプルにおける異なった任意の１つ又はそれ以上の完全染色体異数性の有無を決定する方法を提供する。若干の実施形態において、本発明方法は、任意の１つ又はそれ以上の異なった完全染色体異数性の有無を決定する。本発明方法のステップとしては、（ａ）患者テストサンプルにおける患者核酸の配列情報を取得するステップと、及び（ｂ）配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体における配列タグ数を同定し、また任意の１個又はそれ以上の関心対象染色体における正規化染色体配列の配列タグ数を同定するステップとを有する。正規化染色体配列は単独染色体とするか、又は１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した染色体グループとすることができる。本発明方法は、さらに、ステップ（ｃ）において、任意の１個又はそれ以上の関心対象染色体それぞれに対して同定した配列タグ数、及び各正規化染色体配列に対して同定した配列タグ数を使用して、任意の１個又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算し、及びステップ（ｄ）で任意の１個又はそれ以上の関心対象染色体それぞれにおける各単独染色体ドースを任意の１個又はそれ以上の関心対象染色体それぞれの閾値と比較し、これにより患者テストサンプルにおける任意の１つ又はそれ以上の異なった完全患者異数性の有無を決定する。

【0184】

若干の実施形態において、ステップ（ｃ）は、関心対象染色体それぞれの単独染色体ドースを、関心対象染色体それぞれに対して同定した配列タグ数と、関心対象染色体それぞれの正規化染色体に対して同定した配列タグ数との比として計算する。

【0185】

他の実施形態において、ステップ（ｃ）は、関心対象染色体それぞれの単独染色体ドースを、関心対象染色体それぞれに対して同定した配列タグ数と、関心対象染色体それぞれの正規化染色体に対して同定した配列タグ数との比として計算する。他の実施形態において、ステップ（ｃ）は、関心対象染色体の配列タグ比の計算を、関心対象染色体に対して得た配列タグ数を関心対象染色体の長さに関連付けし、また関心対象染色体の対応する正規化染色体配列のタグ数を正規化染色体配列の長さに関連付けし、また関心対象染色体の染色体ドースを、関心対象染色体の配列タグ密度と正規化配列の配列タグ密度との比として計算することによって行う。すべての関心対象染色体それぞれに対してこの計算を繰り返す。ステップ（ａ）〜（ｄ）を、異なる患者からのテストサンプルに対して繰り返すことができる。

【0186】

１つ又はそれ以上の完全染色体異数性を、無細胞ＤＮＡ分子を含むがん患者テストサンプルにおいて決定する実施形態の例は、（ａ）テストサンプルにおける患者の無細胞ＤＮＡ分子の少なくとも一部をシークエンシングして配列情報を取得するステップと、（ｂ）この配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の２０個又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、またその２０個又はそれ以上の関心対象染色体それぞれの正規化染色体の配列タグ数を同定するステップと、（ｃ）その２０個又はそれ以上の関心対象染色体それぞれに対して同定した配列タグ数及び各正規化染色体に対して同定した配列タグ数を使用して、その２０個又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び（ｄ）その２０個又はそれ以上の関心対象染色体それぞれの各単独染色体ドースを、２０個又はそれ以上の関心対象染色体それぞれの閾値と比較し、またこれにより患者テストサンプルにおける任意の２０又はそれ以上の異なった完全染色体異数性の有無を決定するステップとを有する。

【0187】

他の実施形態において、上述の患者テストサンプルにおける任意の１つ又はそれ以上の異なった完全染色体異数性の有無を決定する方法は、関心対象染色体におけるドースを決定する正規化断片配列を使用する。この場合、この方法は、（ａ）テストサンプルにおける核酸の配列情報を取得するステップと、（ｂ）この配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１つ又はそれ以上の関心対象染色体それぞれの配列タグ数を同定し、またその１つ又はそれ以上の関心対象染色体それぞれの正規化断片配列の配列タグ数を同定するステップとを有する。正規化断片配列は、染色体の単独断片とするか、又は任意の１個又はそれ以上の異なった染色体からの断片グループとすることができる。この方法は、さらに、（ｃ）その任意の１個又はそれ以上の関心対象染色体それぞれに対して同定した配列タグ数及び各正規化断片配列に対して同定した配列タグ数を使用して、その任意の１個又はそれ以上の関心対象染色体それぞれの単独染色体ドースを計算するステップと、及び（ｄ）その任意の１個又はそれ以上の関心対象染色体それぞれの各単独染色体ドースを、任意の１個又はそれ以上の関心対象染色体それぞれの閾値と比較し、またこれにより患者テストサンプルにおける任意の１つ又はそれ以上の異なった完全染色体異数性の有無を決定するステップとを有する。

【0188】

【0189】

他の実施形態において、ステップ（ｃ）は、関心対象染色体の配列タグ比の計算を、関心対象染色体に対して得た配列タグ数を関心対象染色体の長さに関連付けし、また関心対象染色体の対応する正規化断片配列のタグ数を正規化断片配列の長さに関連付けし、また関心対象染色体の染色体ドースを、関心対象染色体の配列タグ密度と正規化断片配列の配列タグ密度との比として計算することによって行う。すべての関心対象染色体それぞれに対してこの計算を繰り返す。ステップ（ａ）〜（ｄ）を、異なる患者からのテストサンプルに対して繰り返すことができる。

【0190】

異なるサンプルセットの染色体ドースを比較する手段は、テストサンプルにおける染色体ドースを、適格サンプルセットにおける対応の染色体ドースの平均に関連付ける正規化染色体値（ＮＣＶ：normalized chromosome value）を決定することによって得ることができる。ＮＣＶは、次式のように計算される。

【数5】

ここで

【0191】

若干の実施形態において、少なくとも１つの完全染色体異数性の有無を決定する。他の実施形態において、少なくとも２つ、少なくとも３つ、少なくとも４つ、少なくとも５つ、少なくとも６つ、少なくとも７つ、少なくとも８つ、少なくとも９つ、少なくとも１０、少なくとも１１、少なくとも１２、少なくとも１３、少なくとも１４、少なくとも１５、少なくとも１６、少なくとも１７、少なくとも１８、少なくとも１９、少なくとも２０、少なくとも２１、少なくとも２２、少なくとも２３、少なくとも２４の、完全染色体異数性の有無を１つのサンプル内で決定し、この場合、２２の完全染色体異数性は、任意の１つ又はそれ以上の常染色体における完全染色体異数性に対応し、２３番目の染色体異数性及び２４番目の染色体異数性はＸ染色体及びＹ染色体の完全染色体異数性に対応する。異数性はトリソミー、テトラソミー、ペンタソミー及び他のポリソミーを含み、また完全染色体異数性の数は、異なる疾患、同一疾患における異なるステージで変化するため、本発明方法により決定することができる異なる完全染色体異数性の数としては、少なくとも２４、少なくとも２５、少なくとも２６、少なくとも２７、少なくとも２８、少なくとも２９、少なくとも３０、少なくとも４０、少なくとも５０、少なくとも６０、少なくとも７０、少なくとも８０、少なくとも９０、少なくとも１００、又はそれ以上の染色体異数性がある。腫瘍の系統的染色体解析によれば、がん細胞における染色体数は、低二倍性（４６個の染色体よりも相当少ない）から４倍性及び４倍性を超える倍数性（２００個の染色体）ものわたり広範囲に変化することがある（Storchova and Kuffer J Cell Sci 121:3859-3866 [2008]参照）。若干の実施形態において、本発明方法は、がん、例えば、大腸がんを患っていることが疑われる又は既知である患者からのサンプルにおいて、２００以上もの染色体異数性の有無を決定する。染色体異数性としては、１個又はそれ以上の染色体喪失（低二倍性）、トリソミー、テトラソミー、ペンタソミー及び他のポリソミーを含む過剰完全染色体がある。染色体断片の過剰及び／又は喪失も、本明細書のいたるところに記載したように決定することができる。本発明方法は、本明細書のいたるところに記載したように、任意のがんを患っていることが疑われる又は既知である患者からのサンプルにおける異なる異数性の有無を決定するのに適用することができる。

【0192】

若干の実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１つを、上述のような患者テストサンプルにおける任意の１つ又はそれ以上の異なった完全染色体異数性の有無を決定する際の関心対象染色体とすることができる。他の実施形態において、２個又はそれ以上の関心対象染色体を、１番，２番，３番，４番，５番，６番，７番，８番，９番，１０番，１１番，１２番，１３番，１４番，１５番，１６番，１７番，１８番，１９番，２０番，２１番，２２番染色体、Ｘ染色体及びＹ染色体のうち任意の２つ又はそれ以上から選択する。一実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも２０個の染色体を有し、この場合、少なくとも２０の異なった完全染色体異数性の有無を決定する。他の実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体は、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてとし、またこの場合、１〜２２番染色体、Ｘ染色体及びＹ染色体のすべてにおける完全染色体異数性の有無を決定する。決定することができる異なる完全染色体異数性としては、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１個又はそれ以上における完全染色体モノソミー、Ｘ染色体及びＹ染色体のうち任意の１個又はそれ以上における完全染色体トリソミー、Ｘ染色体及びＹ染色体のうち任意の１個又はそれ以上における完全染色体テトラソミー、Ｘ染色体及びＹ染色体のうち任意の１個又はそれ以上における完全染色体ペンタソミー、及びＸ染色体及びＹ染色体のうち任意の１個又はそれ以上における完全染色体ポリソミーがある。

【0193】

患者サンプルにおける部分染色体異数性の決定
他の実施形態において、本発明は、核酸分子を含む患者テストサンプルにおける任意の１つ又はそれ以上の異なった部分染色体異数性の有無を決定する方法を提供する。本発明方法のステップとしては、（ａ）テストサンプルにおける患者核酸の配列情報を取得するステップと、及び（ｂ）配列情報を使用して、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれにおける配列タグ数を同定し、また任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれにおける正規化断片配列の配列タグ数を同定するステップとを有する。正規化断片配列は染色体の単独断片とするか、又は１個又はそれ以上の異なった染色体からの断片グループとすることができる。本発明方法は、さらに、ステップ（ｃ）において、任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれに対して同定した配列タグ数、及び各正規化断片配列に対して同定した配列タグ数を使用して、任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれの単独断片ドースを計算し、及びステップ（ｄ）で任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の断片それぞれにおける各単独断片ドースを任意の１個又はそれ以上の関心対象染色体における任意の１個又はそれ以上の染色体断片それぞれの閾値と比較し、これによりテストサンプルにおける任意の１つ又はそれ以上の異なった部分染色体異数性の有無を決定する。

【0194】

【0195】

他の実施形態において、ステップ（ｃ）は、関心対象断片の配列タグ比の計算を、関心対象断片に対して得た配列タグ数を関心対象断片の長さに関連付けし、また関心対象断片の対応する正規化断片配列のタグ数を正規化断片配列の長さに関連付けし、また関心対象断片の断片ドースを、関心対象断片の配列タグ密度と正規化断片配列の配列タグ密度との比として計算することによって行う。すべての関心対象染色体それぞれに対してこの計算を繰り返す。ステップ（ａ）〜（ｄ）を、異なる患者からのテストサンプルに対して繰り返すことができる。

【0196】

【数6】

ここで、

【0197】

若干の実施形態において、少なくとも１つの部分染色体異数性の有無を決定する。他の実施形態において、２つ、３つ、４つ、５つ、６つ、７つ、８つ、９つ、１０、１５、２０、２５、又はそれ以上の、部分染色体異数性の有無を１つのサンプル内で決定する。一実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１個から選択した１個の関心対象断片は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択する。他の実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した２個又はそれ以上の関心対象断片を、１番，２番，３番，４番，５番，６番，７番，８番，９番，１０番，１１番，１２番，１３番，１４番，１５番，１６番，１７番，１８番，１９番，２０番，２１番，２２番染色体、Ｘ染色体及びＹ染色体のうち任意の２つ又はそれ以上から選択する。一実施形態において、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した任意の１個又はそれ以上の関心対象断片は、１〜２２番染色体、Ｘ染色体及びＹ染色体から選択した少なくとも１個、５個、１０個、１５個、２０個、２５個、５０個、７５個、１００個又はそれ以上の断片を有し、この場合、少なくとも１個、５個、１０個、１５個、２０個、２５個、５０個、７５個、１００個又はそれ以上の異なった部分染色体異数性の有無を決定する。決定することができる異なる部分染色体異数性としては、部分重複、部分増殖、部分挿入、及び部分欠失がある。

【0198】

患者における染色体異数性（部分又は完全）の有無を決定するのに使用できるサンプルは、本明細書のいたるところに記載したように、任意の生物学的サンプルとすることができる。患者における異数性決定に使用できるサンプルのタイプは、罹患していることが既知である又は疑われる患者の疾患のタイプに基づく。例えば、糞便サンプルをＤＮＡソースとして選択し、結腸直腸がんに関連する異数性の有無を決定することができる。好適には、サンプルは非侵襲性手段によって採取した生物学的サンプル、例えば、血漿サンプルとする。本明細書のいたるところに記載したように、患者サンプルにおける核酸のシークエンシングは、次世代シークエンシング（ＮＧＳ）を使用して実施することができる。若干の実施形態において、シークエンシングは、可逆色素ターミネーターによるシークエンシング・バイ・シンセシスを使用する大量並列シークエンシングとする。他の実施形態において、シークエンシングは、シークエンシング・バイ・リゲーションとする。さらに他の実施形態において、シークエンシングは単独分子シークエンシングとする。随意的に増幅ステップをシークエンシングに先立って行う。

【0199】

若干の実施形態において、異数性の有無は、本明細書のいたるところに記載したように、例えば、肺、乳房、腎臓、頭頸部、卵巣、頸部、大腸、膵臓、食道、膀胱、及び他の臓器のがん、並びに血液がんを罹患していることが疑われる患者において決定する。血液がんとしては、骨髄、血液、及びリンパ系のがんがあり、リンパ系は、リンパ節、リンパ管、へんとう腺、胸腺、脾臓、及び消化管のリンパ系組織を含む。骨髄からスタートする白血病及び骨髄腫、及びリンパ系からスタートするリンパ腫は、最も一般的な血液がんのタイプである。

【0200】

ＣＮＶを決定するための装置及びシステム

【0201】

シークエンシングデータの解析及びこの解析から導く診断は、一般的には種々のコンピュータアルゴリズム及びプログラムを使用して行う。一実施形態において、本発明は、テストサンプルにおける胎児異数性の有無を示す出力を発生するコンピュータプログラム製品を提供する。コンピュータ製品としては、プロセッサに対して胎児異数性を診断させるよう媒体に記録したロジックを有するコンピュータ可読媒体を含み、ロジックは、母体の生物学的サンプルからの核酸分子の少なくとも一部から、計算した染色体を含むシークエンシングデータを受け取る受取り手順、受取ったデータから胎児異数性を解析するコンピュータ支援ロジック、及びこの胎児異数性の有無又は種類を示す出力を発生する出力手順を有する。

【0202】

本発明方法は、任意のＣＮＶ、例えば、染色体異数性又は部分異数性を同定する方法を実行するコンピュータ可読命令を格納したコンピュータ可読媒体を使用して行うことができる。したがって、一実施形態において、本発明は、完全及び部分染色体異数性、例えば、胎児異数性を同定する方法を実施するコンピュータ可読命令を格納したコンピュータ可読媒体を提供する。

【0203】

本発明方法は、さらに、任意のＣＮＶ、例えば、染色体異数性又は部分異数性を同定する方法を実行するよう構成したコンピュータ処理システムを使用して実施することができる。したがって、本発明は、上述の方法を実施するよう構成したコンピュータ処理システムを提供する。一実施形態において、本発明装置は、サンプルにおける核酸分子の少なくとも一部をシークエンシングして、本明細書のいたるところに記載したように、配列情報のタイプを取得するよう構成したシークエンシング装置を有する。

【0204】

本発明を、以下の実施例で詳細に説明するが、これら実施例は、本発明の特許請求の範囲を限定することを意図しない。添付図面は、本発明の明細書と一体の部分として見なすべきである。以下の実施例は説明であって特許請求の範囲を限定するものではない。

【0205】

実験実施例
実施例１
サンプル処理及びＤＮＡ抽出
末梢血液サンプルを、妊娠第一期又は第二期にあり、胎児異数性のリスクがあると見なされた妊婦から採取した。血液採取前に各当事者からインフォームド・コンセントを得た。血液を採取してから、羊水穿刺又は絨毛膜絨毛のサンプリングを行った。核型解析は、絨毛膜絨毛又は羊水穿刺のサンプルを使用して行い、胎児の核型を確認した。

【0206】

各検体から採取した末梢血液はＡＣＤ管に収集した。１個の血液サンプル管（６〜９ｍＬ／管）を、１５ｍＬの低速遠心管に移し入れた。血液を、ベックマン・コールター社のアレグラ６Ｒ遠心分離及びロータモデルＧＡ３.８を使用して、２６４０ｒｐｍ、４゜Ｃにして１０分間にわたり、遠心分離した。無細胞血漿抽出のため、上澄みの血漿層を１５ｍＬの高速遠心分離管に移し入れ、ベックマン・コールター社のアヴァンチＪ−Ｅ遠心分離器及びＪＡ１４ロータを使用して、１６０００ｘｇ、４゜Ｃにして１０分間にわたり遠心分離した。２段階の遠心分離ステップを血液採取後７２時間内に行った。無細胞血漿を−８０゜Ｃで保存し、ＤＮＡ抽出前に１回だけ解凍した

【0207】

無細胞ＤＮＡは、キアゲン（Qiagen）社のQIAmp ＤＮＡ血液ミニキットを使用し、製造業者の取扱説明書に従って抽出した。５ミリリットルのバッファＡＬ及び５００μｌのキアゲン社のプロテアーゼを４.５ｍｌ〜５ｍｌの無細胞血漿に添加した。分量をリン酸緩衝生理食塩水（ＰＢＳ：phosphate buffered saline）で１０ｍｌに調整した。複数カラムを使用して、ベックマン社のマイクロ遠心分離器において８，０００ＲＰＭにして遠心分離することによって溶液から沈殿したｃｆＤＮＡを分離した。カラムをＡＷ１及びＡＷ２バッファで洗浄し、ｃｆＤＮＡを５５μｌのヌクレアーゼのない水で溶離した。約３.５〜７ｎｇのｃｆＤＮＡを血漿サンプルから抽出した。

【0208】

すべてのシークエンシングライブラリを、母体血漿から抽出した約２ｎｇの精製ｃｆＤＮＡから調製した。ライブラリ調製は、以下に説明するようなイルミナ（Illumina:登録商標）用のＮＥＢＮｅｘｔ（登録商標）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１（Part No.E6000L; New England Biolabs, Ipswich, MA）の試薬を使用して行った。無細胞血漿ＤＮＡは元々フラグメント（断片）化されているため、噴霧又は超音波処理による更なるフラグメント化は血漿ＤＮＡサンプルでは行わない。４０μｌに含まれる約２ｎｇの精製ｃｆＤＮＡのオーバーハング部分は、ＮＥＢＮｅｘｔ（登録商標）末端修復モジュールによってリン酸化した平滑末端に転換させられ、この転換は、ｃｆＤＮＡを１.５ｍｌの微量遠心管内で、ＮＥＢＮｅｘｔ（登録商標）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１に供給した、５μｌの１０Ｘリン酸化バッファ、２μｌのデオキシヌクレオチド混合溶液（各ｄＮＴＰ毎に１０ｍＭ）、１μｌの１：５希釈ＤＮＡポリメラーゼ、１μｌのＴ４ＤＮＡポリメラーゼ、及び１μｌのＴ４ポリヌクレオチドキナーゼとともに１５分間にわたり２０゜Ｃで培養することによって行った。次にこの反応混合物を７５゜Ｃで５分間にわたり培養することによって、酵素を加熱不活性化した。この混合物を４゜Ｃに冷却し、また平滑末端化したＤＮＡのｄＡ尾端化（tailing）を、クレノウフラグメント（３′〜５′エキソマイナス）（ＮＥＢＮｅｘｔ（商標名）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１）を含む１０μｌのｄＡ尾端化マスター混合物を使用し、また１５分間にわたり３７゜Ｃで培養することによって行った。つぎに、クレノウフラグメントを加熱不活性化し、この不活性化は反応混合物を７５゜Ｃで５分間にわたり培養することによって行った。クレノウフラグメントの不活性化後に、１μｌのイルミナ・ゲノミック・アダプタ・オリゴ・ミックス（Part No. 1000521; Illumina Inc., Hayward, CA）１：５希釈液を使用して、イルミナアダプタ（Non-Index Y-Adaptors）を、ＮＥＢＮｅｘｔ（登録商標）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１に供給された４μｌのＴ４ＤＮＡリガーゼを使用して反応混合物を１５分間にわたり２５゜Ｃで培養することによって、ｄＡ尾端化したＤＮＡに結合させた。この混合物を４゜Ｃに冷却し、アダプタ結合したｃｆＤＮＡを、未結合アダプタ、アダプタ二量体、及びエージェンコートAMPure XP PCRの精製システム（Part No. A63881; Beckman Coulter Genomics, Danvers, MA）に供給された磁気ビードを使用する他の試薬から精製した。ＰＣＲの１８サイクルを行って、選択的にアダプタ結合ｃｆＤＮＡを富裕化し、この富裕化は、フュージョン（Phusion：登録商標）・ハイ−フィデリティ・マスター・ミックス（Finnzymes, Woburn, MA）及びアダプタに相補的なイルミナ社のＰＣＲプライマー（Part No. 1000537及び1000537）を使用して行った。アダプタ結合ＤＮＡに対してＰＣＲ（９８゜Ｃで３０秒間；９８゜Ｃで１０秒間、６５゜Ｃで３０秒間及び７２゜Ｃで３０秒間を１８サイクル、７２゜Ｃで５分間の最終延長、及び４゜Ｃで保持）を加え、この場合、製造業者の取扱説明書に従って、ＮＥＢＮｅｘｔ（登録商標）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１に供給されたイルミナゲノミックＰＣＲプライマー（Part No. 100537及び1000538）及びフュージョン・ＨＦ・ＰＣＲマスター・ミックスを使用した。増幅した生成物を、エージェンコートAMPure XP PCRの精製システム（Agencourt Bioscience Corporation, Berverly, MA）を使用して精製し、この精製は、製造業者の取扱説明書（www.beckmangenomics.com/products/AMPureXPProtocol_000387v001.pdfで入手可能）に従って行った。精製した増幅生成物は、４０μｌのキアゲン・ＥＢ・バッファで溶離し、増幅したライブラリの濃度及びサイズ分布を、２１００バイオアナライザ（Agilent technologies Inc., Santana Clara, CA）のためのアジレント・ＤＮＡ・1000・キットを使用して解析した。

【0209】

イルミナ・ゲノム・アナライザIIを使用して増幅したＤＮＡをシークエンシングし、３６ｂｐの単独末端リードを得た。ランダム配列情報の約３０ｂｐのみが特定ヒト染色体に属する配列を同定するのに必である。より長い配列は、より特別なターゲットを一意的に同定することができる。サンプルのシークエンシングが完了した際に、イルミナ社「シークエンサ制御ソフトウェア」は画像及び塩基コール（判定）ファイルを、イルミナ社「ゲノム・アナライザ・パイプライン」を実行するユニックスサーバーに転送した。イルミナ社「ジェラルド」プログラムを実行して配列を基準ヒトゲノムに整列させ、この基準ヒトゲノムはバイオテクノロジー情報ナショナルセンターによって規定されたｈｇ１８ゲノムＮＣＢＩ３６／ｈｇ１８）に由来するものである（ワールドワイドウェブ上におけるＵＲＬ;http://genome.ucsc.edu/cgi-bin/hgGateway?Org=Human&db=hg18&hgsid=166260105で入手可能である）。ゲノムに一意的に整列させる上述の手順から生成した配列データを、Linnuxオペレーティングシステムを実行するコンピュータ上で稼働するプログラム（ｃ２ｃ.ｐｌ）によってジェラルドの出力（export.txtファイル）から読んだ。塩基の不一致を有する配列アラインメントは、ゲノムに一意的に整列した場合にのみ整列カウントが可能であり、整列カウントに含める。同一の開始及び末端配位を有する（複製）配列アラインメントは排除した。

【0210】

約５００万〜約１５００万個の３６ｂｐタグ間で２個以下の不一致がヒトゲノムにマッピングされた。マッピングされたすべてのタグをカウントし、またテストサンプル及び適格サンプルの双方において染色体ドースの計算に含めた。塩基０から塩基２×１０^６に、塩基１０×１０^６から塩基１３×１０^６に、塩基２３×１０^６からＹ染色体の末端にわたる領域は、特別に解析から排除し、これは男児又は女児のいずれかの胎児に由来するタグはＹ染色体のこれら領域にマッピングされるからである。同一ラン（稼働）でシークエンシングされたサンプル間で個別染色体にマッピングされる配列タグの総数に若干の変動が示され（染色体間変動）、相当大きな変動が異なるシークエンシングランで生じた（シークエンシングラン間変動）。

【0211】

実施例２
１３番、１８番、２１番、Ｘ及びＹ染色体のドース及び分散
すべての染色体に対してマッピングした配列タグ数の染色体間変動及びシークエンシング間変動の程度を調べるため、４８人のボランティアの妊婦検体における末梢血液に由来する血漿ｃｆＤＮＡを抽出し、実施例１に説明したようにシークエンシングし、以下のように解析した。各染色体にマッピングされた配列タグの総数（配列タグ密度）を決定した。代案として、マッピングした配列タグ数を染色体の長さに正規化し、配列タグ密度比を生成することができる。染色体長さに対する正規化は必要なステップではなく、単にヒトを解釈する上で簡素化するよう数の桁数を減少するために行うことができる。配列タグカウントを正規化するのに使用することができる染色体長さは、ワールドワイドウェブ上におけるgenome.ucsc.edu/goldenPath/stats.html#hg18で提供された長さとすることができる。

【0212】

各染色体に対して得られた配列タグ密度は、残りの染色体それぞれの配列タグ密度に関連付けして適格染色体ドースを導き出し、この適格染色体ドースは、関心対象染色体、例えば、２１番染色体の配列タグ密度と、残りの染色体、すなわち、１〜２０番染色体、２２番染色体及びＸ染色体それぞれの配列タグ密度との比として計算した。表１は、適格サンプルのうち１つで決定された関心対象の１３番、１８番、２１番染色体、Ｘ及びＹ染色体の計算した適格染色体ドースの例を示す。染色体ドースは、すべてのサンプルにおけるすべての染色体（Ｃｈｒ：chromosome）に対して決定し、また適格サンプルにおける関心対象の１３番、１８番、２１番染色体、Ｘ及びＹ染色体の平均ドースを表２及び表３に示し、図２〜６に示す。図２〜６は、さらに、テストサンプルに対する染色体ドースも示す。適格サンプルにおける関心対象染色体それぞれの染色体ドースは、各関心対象染色体それぞれにおけるマッピングした配列タグ総数における、残りの染色体それぞれにおけるマッピングした配列タグ総数に対する変動の比較尺度を提供する。したがって、適格染色体ドースが、染色体又は染色体グループ、すなわち、関心対象染色体の変動に最も近似するサンプル内の変動を有し、また更なる統計的評価をする上で正規化値用の理想配列として供する正規化染色体を同定することができる。図７及び８は、適格サンプルの母集団で決定した１３番、１８番、２１番染色体、Ｘ及びＹ染色体の計算した平均染色体ドースを示す。

【0213】

若干の実施形態において、最良の正規化染色体は最も少ない変動ではなく、テストサンプルを適格サンプルから最も区別する適格ドースの分布を有するものであり、すなわち、最良の正規化染色体は最低変動ではなく、最大弁別可能性である。この弁別可能性は、適格サンプルにおける染色体ドースの変動及びドース分布に基づく。

【0214】

表２及び３は、変動性の評価尺度としての変動係数（ＣＶ）、及び１８番、２１番染色体、Ｘ染色体及びＹ染色体の弁別可能性の評価尺度としてのスチューデントｔ検定値を示し、ｔ検定値が小さければ小さいほど、弁別可能性は大きくなる。１３番染色体の弁別可能性は、適格サンプルの平均染色体ドースとＴ１３テストサンプルのみの１３番染色体ドースとの間の差と、適格ドースの平均の標準偏差の比として決定した。

【0215】

適格染色体ドースは、以下に説明するように、テストサンプルにおける異数性を同定するとき、閾値を決定する基礎として供する。

【0216】

【表1】

【0217】

【表2】

【0218】

【表3】

【0219】

正規化染色体、染色体ドース及び関心対象染色体それぞれの弁別可能性を使用して得られたＴ２１，Ｔ１３，Ｔ１８及びターナー症候群の診断例を実施例３で説明する。

【0220】

実施例３
正規化染色体を使用する胎児異数性の診断
異数性を評価するため染色体ドースの使用を生物学的テストサンプルに適用する上で、母体血液テストサンプルをボランティアの妊婦から採取し、ｃｆＤＮＡを調製し、シークエンシングし、また実施例１及び２で記載したように解析した。

【0221】

２１トリソミー
表４は、例としてのテストサンプル（#11403）における２１番染色体の計算したドースを示す。Ｔ２１異数性の陽性診断のための計算した閾値は適格（正常）サンプルの平均からの標準偏差の２倍より大きい値＞（２標準偏差）に設定した。Ｔ２１のための診断は、テストサンプルにおける染色体ドースが設定した閾値よりも大きいことに基づいて行った。１４番及び１５番染色体を個別の計算における正規化染色体として使用し、最も低い変動性を有する染色体、例えば１４番染色体、又は最も大きい弁別可能性を有する染色体、例えば染色体１５のうちいずれかを使用して異数性を同定することができる。計算した染色体ドースを使用して１３例のＴ２１サンプルを同定し、異数性サンプルがＴ２1であることを核型によって確認した。

【0222】

【表4】

【0223】

１８トリソミー
表５はテストサンプル（#11390）における１８番染色体の計算したドースを示す。Ｔ１８異数性陽性診断のための計算した閾値は適格（正常）サンプルの平均からの標準偏差の２倍（２標準偏差）に設定した。Ｔ１８のための診断は、テストサンプルにおける染色体ドースが設定した閾値よりも大きいことに基づいて行った。８番染色体を正規化染色体として使用した。この場合、８番染色体が最も低い変動性を有し、又は最も大きい弁別可能性を有する染色体であった。染色体ドースを使用して８例のＴ１８サンプルを同定し、Ｔ１８であることを核型によって確認した。

【0224】

これらデータは、正規化染色体が最小変動性及び最大弁別可能性の双方を有することを示している。

【0225】

【表5】

【0226】

１３トリソミー
表６はテストサンプル（#51236）における１３番染色体の計算したドースを示す。Ｔ１３異数性陽性診断のための計算した閾値は適格（正常）サンプルの平均からの標準偏差の２倍（２標準偏差）に設定した。Ｔ１３のための診断は、テストサンプルにおける染色体ドースが設定した閾値よりも大きいことに基づいて行った。５番染色体又は３番、４番、５番及び６番染色体のグループを正規化染色体として使用して、１３番染色体の染色体ドースを計算した。１例のＴ１３サンプルを同定した。

【0227】

【表6】

【0228】

３〜６番染色体の配列タグ密度は、３〜６番染色体の平均タグカウント数である。
このデータは、３番、４番、５番及び６番染色体の組合せが、５番染色体よりも低い変動性、及び他の任意な染色体よりも最も大きい弁別可能性をもたらすものであることを示している。

【0229】

したがって、染色体グループを、染色体ドースを決定し、また異数性を同定するための正規化染色体として使用することができる。

【0230】

ターナー症候群（Ｘモノソミー）
表７は、テストサンプル（#51238）におけるＸ染色体及びＹ染色体の計算したドースを示す。ターナー症候群（Ｘモノソミー）陽性診断のための計算した閾値は、Ｘ染色体に対して適格（正常）サンプルの平均から（−２標準偏差）よりも小さく、Ｙ染色体がない場合に対して適格（正常）サンプルの平均から（−２標準偏差）よりも小さく設定した。

【0231】

【表7】

【0232】

設定した閾値の染色体ドースよりも小さいＸ染色体ドースを有するサンプルを１個のＸ染色体よりも少ないものとして同定した。この同一サンプルは設定した閾値より少ないＹ染色体ドースを有すると決定したが、このことはそのサンプルがＹ染色体を持っていないことを示す。このようにして、Ｘ及びＹ染色体の染色体ドースの組合せを使用し、ターナー症候群（Ｘモノソミー）を同定した。したがって、本発明によれば、染色体のＣＮＶを決定することができる。とくに、本発明によれば、母体血漿ｃｆＤＮＡを大量並列シークエンシングすることによって、またシークエンシングデータの統計学的解析のための正規化染色体同定によって、過剰及び不足表現の染色体異数性を決定することができる。本発明方法の感度及び信頼性は、妊娠第１期及び第２期における異数性テストを正確に行うことができる。

【0233】

実施例４
部分異数性の決定
配列ドース使用を、血液の血漿から調製したｃｆＤＮＡの生物学的テストサンプルにおける部分異数性評価に適用し、実施例１に記載したようにシークエンシングした。サンプルは、染色体解析によって１１番染色体における部分的欠失を有する検体に由来するものと確認した。部分異数性（１１番染色体における部分的、すなわちｑ２１〜ｑ２３の欠失）のためのシークエンシングデータ解析を、上述した実施例で染色体異数性につき説明したように行った。配列タグをテストサンプルにおける１１番染色体にマッピングすることによって、染色体のｑアームにおける塩基対81000082〜103000103間におけるタグカウント数の、適格サンプルにおける１１番染色体の対応配列に関して得られたタグカウント数（データは示さない）に対する顕著な喪失を明らかにした。適格サンプルそれぞれにおける関心対象１１番染色体にマッピングした配列タグ（810000082〜103000103bp）及び適格サンプルにおける全体ゲノムの２０メガベース断片すべてにマッピングした配列タグ、すなわち適格配列タグ密度を使用して、すべての適格サンプルにおけるタグ密度比として適格配列ドースを決定した。平均配列ドース、標準偏差、及び変動係数を、全体ゲノムにおける２０メガベース断片のすべてに対して計算し、最小の変動性を有する２０メガベース配列は、５番染色体における同定された正規化配列（13000014〜33000033)であり（表８参照）、これを使用してテストサンプルにおける関心対象配列のドースを計算した（表９参照）。表８は、テストサンプルにおける１１番染色体の関心対象配列（810000082〜103000103bp）のドースを示し、これは、関心対象配列にマッピングした配列タグと、同定した正規化配列にマッピングした配列タグとの比として計算した。図１０は、７個の適格サンプルにおける関心対象配列の配列ドース（○）、及びテストサンプルにおける対応配列の配列ドース（◇）を示す。平均を実線で示し、平均から５標準偏差に設定した部分異数性陽性診断のための計算した閾値を破線で示す。部分異数性診断は、設定した閾値より少ないテストサンプルの配列ドースに基づいて行った。テストサンプルは、染色体解析によって、１１番染色体におけるｑ２１〜ｑ２３欠失を有することを検証した。

【0234】

したがって、染色体異数性を同定することの他に、本発明方法を使用して部分異数性を同定することができる。

【0235】

【表8】

【0236】

【表9】

【0237】

実施例５
異数性検出の実証
実施例２及び３で説明し、また図２〜６に示したサンプルで得られた配列データをさらに解析して、母体サンプルにおける異数性をうまく同定することに成功する本発明方法の感度を示した。２１番、１８番、１３番染色体、Ｘ染色体及びＹ染色体のための正規化染色体ドースは、平均の標準偏差に対する分布（Ｙ軸）として解析し、また図１１に示す。使用した正規化染色体は、基準（デノミネータ）として示した（Ｘ軸）。

【0238】

図１１Ａは、２１番染色体の正規化染色体として１４番染色体を使用するとき、異変なしサンプル（○）及び２１トリソミーサンプル（Ｔ２１；△）における２１番染色体の平均からの標準偏差に対する染色体ドース分布を示す。図１１Ｂは、１８番染色体の正規化染色体として８番染色体を使用するとき、異変なしサンプル（○）及び１８トリソミーサンプル（Ｔ１８；△）における１８番染色体の平均からの標準偏差に対する染色体ドース分布を示す。図１１Ｃは、１３番染色体の染色体ドースを決定するための正規化染色体として３番、４番、５番及び６番染色体のグループの平均配列タグ密度を使用し、異変なしサンプル（○）及び１３トリソミーサンプル（Ｔ１３；△）における１３番染色体の平均からの標準偏差に対する染色体ドース分布を示す。図１１Ｄは、Ｘ染色体の正規化染色体として４番染色体を使用するとき、異変なし女児サンプル（○）、異変なし男児サンプル（△）及びＸモノソミーサンプル（ＸＯ；＋）におけるＸ染色体の平均からの標準偏差に対する染色体ドース分布を示す。図１１Ｅは、Ｙ染色体の染色体ドースを決定するための正規化染色体として１〜２２番染色体及びＸ染色体のグループの平均配列タグ密度を使用するとき、異変なし男児サンプル（○）、異変なし女児サンプル（△）、及びＸモノソミーサンプル（＋）におけるＹ染色体の平均からの標準偏差に対する染色体ドース分布を示す。

【0239】

データは、２１トリソミー、１８トリソミー、１３トリソミーを異変なし（正常）サンプルから明確に区別されたことを示している。Ｘモノソミーサンプルは、異変なし女児サンプルのＸ染色体ドースよりも明らかに低いＸ染色体ドースを有し、また異変なし男児サンプルのＹ染色体ドースよりも明らかに低いＹ染色体ドースを有する（図１１Ｅ参照）ものとして容易に同定した。したがって、本発明方法は、母体血液サンプルにおける染色体異数性の有無を決定するのに感度よく、また特化したものである。

【0240】

実施例６
母体血液からの無細胞胎児ＤＮＡに関して大量並列ＤＮＡシークエンシングを使用する
胎児異常の決定：トレーニングセット１とは独立したテストセット１
研究は、米国１３か所の臨床施設における有資格現地臨床研究員によって２００９年４月から２０１０年７月までの間に、各機関での機関審査委員会（ＩＲＢ：institutional review board）が承認したヒト検体プロトコルの下で行った。インフォームドコンセントの同意書を、研究関与前に各検体から取得した。プロトコルは、血液サンプル及び臨床データを得て非侵襲性妊婦遺伝子診断方法の発展を支援するよう策定した。１８歳以上の妊婦を有資格者とした。臨床的にＣＶＳ又は羊水穿刺を受ける患者に対して、手順を実施する前に血液した採取し、また胎児の核型結果を収集した。末梢血液サンプル（管２個又は総量２０ｍＬまでの）をすべての検体からクエン酸デキストロース（ＡＣＤ：acid citrate dextrose）管（ベクトン・ディッキンソン社製）内に引き込んだ。すべてのサンプルに対し、身元が判明しないようにし、匿名患者ＩＤ番号を割り当てた。血液サンプルを、研究用に設けた温度制御輸送容器内で一晩かけて研究室に輸送した。血液引込みとサンプル受入れとの間に経過した時間を、サンプル評価の一部として記録した。

【0241】

現地研究コーディネーターは、匿名患者ＩＤ番号を使用して、患者のその時の妊娠状況及び履歴に関連する臨床データを研究症例報告書（ＣＲＦ：case report forms）に書き込んだ。侵襲性出生前手順によるサンプルからの胎児核型の細胞発生学的解析を、地方の研究所毎に行い、この結果も研究ＣＲＦに記録した。ＣＲＦで得られたすべてのデータを、研究所の臨床データベースに入力した。無細胞血漿を、血管穿刺後２４〜４８時間内に個別の血液管から２段階遠心分離処理を使用して得た。単独の血液管からの血漿でシークエンシング解析に十分である。無細胞ＤＮＡは、製造業者の取扱説明書に従ってＱＩＡｍｐＤＮＡ血液ミニキット（キアゲン社）を使用して無細胞血漿から抽出した。無細胞ＤＮＡフラグメントは、長さが約１７０塩基対（ｂｐ）であることが分かっているため（Fan et al.,Clin Chem 56:1279-1286 [2010]参照）、シークエンシング前にはデータのフラグメント化は不要である。

【0242】

トレーニングセットのサンプルのために、ｃｆＤＮＡを、シークエンシングライブラリ調製及びイルミナ・ゲノム・アナライザIIX装置（http://www.illumina.com/参照）により標準製造業者プロトコルを使用するシークエンシングを行うよう、プログノシス・バイオサイエンシズ社（カリフォルニア州ラ・ジョラ）に送った。３６塩基対の単独末端リードを得た。シークエンシングが完了した際に、すべての塩基コールを収集し解析する。テストセットのサンプルに対して、シークエンシングライブラリを調製し、シークエンシングを、イルミナ・ゲノム・アナライザIIX装置上で行った。シークエンシングライブラリの調製は以下のようにして行った。記載された全編プロトコルは、実質的にイルミナ社が規定した標準プロトコルであり、増幅ライブラリの精製においてのみイルミナ社プロトコルから異なる。イルミナ社プロトコルはゲル電気泳動を使用して増幅ライブラリを精製することを指示するが、本明細書に記載するプロトコルは、同一精製ステップに対して磁気ビードを使用する。母体血漿から抽出した精製ｃｆＤＮＡの約２ｎｇを使用して、一次シークエンシングライブラリを調製し、この調製は、製造業者の指示書に従い、イルミナ社のＮＥＢＮｅｘｔ（商標名）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１（Part No.E6000L; New England Biolabs, Ipswich, MA）を使用して行った。精製カラムの代わりにエージェンコート社の磁気ビード及び試薬を使用して行った、アダプタ結合生成物の最終精製を除くすべてのステップを、プロトコルに従って、ゲノムＤＮＡライブラリのサンプル調製用ＮＥＢＮｅｘｔ（商標名）試薬とともに行い、イルミナ（登録商標）ＧＡIIを使用してシークエンシングした。ＮＥＢＮｅｘｔ(商標名）プロトコルは、ほぼイルミナ社が規定したもの(grcf.jhml.edu/hts/protocols/11257047_ChIP_Sample_Prep.pdf.で入手可能)に従う。

【0243】

４０μｌに含まれる約２ｎｇの精製ｃｆＤＮＡフラグメントのオーバーハング（突出）部分を、ＮＥＢＮｅｘｔ（登録商標）末端修復モジュールによってリン酸化した平滑末端に転換し、この転換は、４０μｌのｃｆＤＮＡを、ＮＥＢＮｅｘｔ（登録商標）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１に供給された、５μｌの１０Ｘリン酸化バッファ、２μｌのデオキシヌクレオチド混合溶液（各ｄＮＴＰ毎に１０ｍＭ）、１μｌの１：５希釈ＤＮＡポリメラーゼ、１μｌのＴ４ＤＮＡポリメラーゼ、及び１μｌのＴ４ポリヌクレオチドキナーゼとともに１５分間にわたり２０゜Ｃで培養することによって行った。サンプルを４゜Ｃに冷却し、また以下のように、ＱＩＡＱｕｉｃｋＰＣＲ精製キット（キアゲン社カリフォルニア州バレンシア）に供給されたＱＩＡＱｕｉｃｋカラムを使用して精製した。５０μｌ反応物を１.５ｍｌの微量遠心管内に移し入れ、２５０μｌのキアゲンバッファＰＢを添加した。この結果物３００μｌをＱＩＡＱｕｉｃｋカラム内に移し入れ、微量遠心管内において１分間にわたり１３，０００ＲＰＭで遠心分離した。カラムを７５０μｌのキアゲンバッファＰＥで洗浄し、再び遠心分離した。残留エタノールを、５分間１３，０００ＲＰＭで追加遠心分離することによって除去した。ＤＮＡを、遠心分離によって３９μｌのキアゲンバッファＥＢ内で溶離した。平滑末端化したＤＮＡのｄＡ尾端化（tailing）を、クレノウフラグメント（３′〜５′エキソマイナス）（ＮＥＢＮｅｘｔ（商標名）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１）を含む１６μｌのｄＡ尾端化マスター混合物を使用し、また製造業者のＮＥＢＮｅｘｔ（登録商標）ｄＡ尾端化モジュールに従って、３０分間にわたり３７゜Ｃで培養することによって行った。サンプルを４゜Ｃに冷却し、以下のように、ＭｉｎＥｌｕｔｅＰＣＲ精製キット（キアゲン社、カリフォルニア州バレンシア）に供給されたカラムを使用して精製した。つぎに、クレノウフラグメントを加熱不活性化し、この不活性化は反応混合物を７５゜Ｃで５分間にわたり培養することによって行った。５０μｌ反応物を１.５ｍｌの微量遠心管内に移し入れ、２５０μｌのキアゲンバッファＰＢを添加した。３００μｌをＭｉｎＥｌｕｔｅカラムに移し入れ、微量遠心管内において１分間にわたり１３，０００ＲＰＭで遠心分離した。残留エタノールを、５分間１３，０００ＲＰＭで追加遠心分離することによって除去した。ＤＮＡを、遠心分離によって１５μｌのキアゲンバッファＥＢ内で溶離した。１０マイクロリットルのＤＮＡ溶離物を、１μｌのイルミナ・ゲノミック・アダプタ・オリゴ・ミックス（Part No. 1000521）１：５希釈液、１５μｌの２Ｘクイック・リゲーション反応バッファ、及び４μｌのＴ４ＤＮＡリガーゼとともに、ＮＥＢＮｅｘｔ（登録商標）クイック・リゲーション・モジュールに従って、１５分間２５゜Ｃで培養した。サンプルを４゜Ｃに冷却し、以下のように、ＭｉｎＥｌｕｔｅカラムを使用して精製した。１５０ミリリットルのキアゲンバッファＰＥを３０μｌの反応物に添加し、全体量をＭｉｎＥｌｕｔｅカラムに移し入れ、このカラムを微量遠心管内において１３，０００ＲＰＭで１分間にわたり遠心分離した。カラムを７５０μｌのキアゲンバッファＰＥで洗浄し、また再び遠心分離した。残留エタノールを、５分間１３，０００ＲＰＭで追加遠心分離することによって除去した。ＤＮＡを、遠心分離によって２８μｌのキアゲンバッファＥＢ内で溶離した。２３マイクロリットルのアダプタ結合ＤＮＡに対して１８サイクルのＰＣＲ（９８゜Ｃで３０秒間；９８゜Ｃで１０秒間、６５゜Ｃで３０秒間及び７２゜Ｃで３０秒間を１８サイクル、７２゜Ｃで５分間の最終延長、及び４゜Ｃで保持）を加え、この場合、製造業者の取扱説明書に従って、ＮＥＢＮｅｘｔ（登録商標）ＤＮＡサンプルＰｒｅｐＤＮＡ試薬セット１に供給されたイルミナゲノミックＰＣＲプライマー（Part No. 100537及び1000538）及びフュージョン・ＨＦ・ＰＣＲマスター・ミックスを使用した。増幅した生成物を、エージェンコートAMPure XP PCRの精製システム（Agencourt Bioscience Corporation, Berverly, MA）を使用して精製し、この精製は、製造業者の取扱説明書（www.beckmangenomics.com/products/AMPureXPProtocol_000387v001.pdfで入手可能）に従って行った。エージェンコートAMPure XP PCRの精製システムは、組込まれなかったｄＮＴＰ、プライマー、プライマー二量体、塩、及び他の汚染物を除去し、また１００ｂｐより多い単位複製配列を回収する。精製した増幅生成物は、４０μｌのキアゲン・ＥＢ・バッファで溶離し、増幅したライブラリの濃度及びサイズ分布を、２１００バイオアナライザ（Agilent technologies Inc., Santana Clara, CA）のためのアジレント・ＤＮＡ・1000・キットを使用して解析した。トレーニングサンプルセット及びテストサンプルセットの双方に対して３６塩基対の単独末端リードをシークエンシングした。

【0244】

データ解析及びサンプル分類
長さが３６塩基の配列リードをＵＣＳＣデータベースから得られるヒトゲノムアセンブリ（http://hgdownload.cse.ucsc.edu/goldenPath/hg18/bigZips/参照）に整列させた。アラインメントは、アラインメント中に２つの塩基の不一致まで許容するボータイ（Bowtie）ショートリードアライナー（バージョン0.12.5）を利用して行った（Langmead et al., Genome Biol 10:R25 [2009]参照）。単独のゲノム位置にあいまいにマッピングされたリードのみを排除した。リードをマッピングしたゲノム位置をカウントし、また染色体ドースの計算に含めた（後の説明参照）。男児及び女児からの配列タグを区別することなしにマッピングしたＹ染色体の領域（とくに、塩基０から塩基２×１０^６に、塩基１０×１０^６から塩基１３×１０^６に、塩基２３×１０^６からＹ染色体の末端にわたる領域）を解析から排除した。

【0245】

配列リードの染色体分布におけるラン内及びラン間シークエンシング変動は、マッピングされた配列部位分布における胎児異数性の効果を損なう恐れがある。このような変動を補正するため、染色体ドースは、所定正規化染色体配列で観測されたカウントに正規化された所定関心対象染色体に対するマッピング部位のカウントとして計算した。上述したように、正規化された染色体配列は、単独染色体又は染色体グループにより構成することができる。正規化染色体配列は、まず各常染色体を関心対象染色体を有するカウントの比における潜在的なデノミネーター（分母）としてみなし、トレーニングサンプルセットにおける関心対象の２１番染色体、１８番染色体、１３番染色体及びＸ染色体の2倍体核型を有する、異変なしサンプル、すなわち適格サンプルであるサンプルの部分集合内で同定した。デノミネーター染色体、すなわちシークエンシングラン内及びシークエンシングラン間での染色体ドース変動を最少化した正規化染色体配列を選択した。各関心対象染色体は、明確な正規化染色体配列（デノミネーター）を有すると決定した（表１０参照）。どの単独染色体も１３番染色体の正規化染色体配列として同定されず、なぜならどの染色体も、サンプルにわたる１３番染色体のドース変動を減少するとの決定はされなかったから、すなわち、１３番染色体のＮＣＶ値の分散が十分減少されず、Ｔ１３異数性を正確に同定できなかったからである。２〜６番染色体をランダムに選択し、１３番染色体の挙動を擬態するグループとしての能力をテストした。２〜６番染色体のグループは、トレーニングサンプルにおける１３番染色体のドース変動性をほぼ減少させることが分かり、したがって、１３番染色体の正規化染色体配列として選択した。上述したように、Ｙ染色体の染色体ドースにおける変動性は３０より多く、これらから独立的に単独染色体を、Ｙ染色体ドース決定における正規化染色体配列として使用した。２〜６番染色体のグループは、トレーニングサンプルにおけるＹ染色体のドース変動性をほぼ減少させることが分かり、したがって、Ｙ染色体の正規化染色体配列として選択した。

【0246】

適格サンプルにおける関心対象染色体それぞれの染色体ドースは、関心対象染色体それぞれのマッピングした配列タグの総数の、残りの染色体それぞれのマッピングした配列タグの総数に対する変動の判断基準尺度をなす。したがって、適格染色体ドースは、サンプル間変動が関心対象染色体の変動に最も近似し、また更なる統計学的評価のための値を正規化する理想配列として供する染色体又は染色体グループ、すなわち正規化染色体配列を同定することができる。

【0247】

トレーニングセットにおけるすべてのサンプル、すなわち適格サンプル及び異変ありサンプルの染色体ドースも、以下に説明するようにテストサンプルにおいて異数性を同定するとき、閾値を決定する基礎として供し得る。

【0248】

【表10】

【0249】

テストセットにおける各サンプルの関心対象染色体それぞれに対して正規化値を決定し、異数性有無を決定するのに使用する。正規化値は染色体ドースとして計算することができ、この染色体ドースをさらに計算して正規化された染色体値（ＮＣＶ）を生ずることができる。

【0250】

テストセットに対して、各サンプルにおける関心対象の２１番染色体、１８番染色体、１３番染色体、Ｘ染色体及びＹ染色体それぞれの染色体ドースを計算した。上述の表１０に記載したように、２１番染色体の染色体ドースは、テストサンプルにおける２１番染色体にマッピングされたテストサンプルにおけるタグ数と、９番染色体にマッピングされたテストサンプルにおけるタグ数との比として計算し、１８番染色体の染色体ドースは、テストサンプルにおける１８番染色体にマッピングされたテストサンプルにおけるタグ数と、８番染色体にマッピングされたテストサンプルにおけるタグ数との比として計算し、１３番染色体の染色体ドースは、テストサンプルにおける１３番染色体にマッピングされたテストサンプルにおけるタグ数と、２〜６番染色体にマッピングされたテストサンプルにおけるタグ数との比として計算し、Ｘ染色体の染色体ドースは、テストサンプルにおけるＸ染色体にマッピングされたテストサンプルにおけるタグ数と、６番染色体にマッピングされたテストサンプルにおけるタグ数との比として計算し、Ｙ染色体の染色体ドースは、テストサンプルにおけるＹ染色体にマッピングされたテストサンプルにおけるタグ数と、２〜６番染色体にマッピングされたテストサンプルにおけるタグ数との比として計算した。

【0251】

正規化した染色体値
各テストサンプルにおける関心対象染色体それぞれの染色体ドース、トレーニングセットの適格サンプルにおいて決定した対応の染色体ドースの平均を使用し、正規化した染色体値（ＮＣＶ：normalized chromosome value）は、次式で計算される。

【数7】

ここで、

は、それぞれトレーニングセットにおけるｊ番染色体ドースに対する推定した平均及び標準偏差であり、ｘ_ijはサンプルｉにおける観測したｊ番染色体ドースである。染色体ドースが正規分布しているとき、ＮＣＶはドースに対して統計学的にｚスコアに等しい。異変なしサンプルからのＮＣＶの変位値−変位値プロットにおける線形性からの大きな逸脱は観測されない。さらに、ＮＣＶの正規性標準検定は、正規性の帰無仮説を却下できない。

【0252】

テストセットに対して、各サンプルにおける関心対象の２１番染色体、１８番染色体、１３番染色体、Ｘ染色体及びＹ染色体それぞれのＮＣＶを計算した。安全かつ有効な分類スキームを保証するため、控えめの境界を異数性分類に選択した。常染色体の異数性状態を分類するため、染色体に異変あり（すなわち、その染色体が異数性である）と分類するのにＮＣＶ＞４であることを必要とし、染色体に異変なしと分類するにはＮＣＶ＜２.５であることを必要とした。ＮＣＶが２.５と４.０との間である常染色体を有するサンプルは「ノーコール」として分類した。

【0253】

この検定における性染色体の分類は、Ｘ染色体及びＹ染色体双方に対して、以下のようにＮＣＶを逐次的に適用することによって行った。
１．男児サンプルの平均からＮＣＶＹ＞-２.０標準偏差である場合、このサンプルは男児（ＸＹ）であると分類した。
２．男児サンプルの平均からＮＣＶＹ＜-２.０標準偏差であり、かつ女児サンプルの平均からＮＣＶＸ＞-２.０標準偏差である場合、このサンプルは女児（ＸＸ）であると分類した。
３．男児サンプルの平均からＮＣＶＹ＜-２.０標準偏差であり、かつ女児サンプルの平均からＮＣＶＸ＜-３.０標準偏差である場合、このサンプルはＸモノソミー、すなわちターナー症候群であると分類した。
４．ＮＣＶが上述の基準のいずれにも当てはまらない場合、そのサンプルは、性に関して「ノーコール」として分類した。

【0254】

結果
人口統計学的研究
合計１，０１４名の患者を２００９年４月から２０１０年７月にかけて登録した。患者の人口統計学的データ、侵襲的処置タイプ及び核型結果を
に列挙する。研究参加者の平均年齢は３５.６歳（１７〜４７歳の範囲）であり、妊娠期間は、６週間、１日から３８週の間、１日の範囲にわたる（平均は１５週と４日）。異常胎児染色体核型の全体的出現率は６.８％で、そのうちＴ２１の事象は２.５％であった。単胎妊娠及び核型を有する９４６検体のうち、９０６例（９６％）は、出生前手順前の胎児異数性に関して少なくとも１つの臨床的に認識される危険因子を示した。単一兆候としての高齢母体の例を除外したとしても、データは、現在のスクリーニングモダリティに対して極めて高い偽陽性率を示している。増大した項部透過性、滑液嚢水腫、又は他の構造的先天性異常の超音波による発見は、この統計群における異常核型を最も多く予測した。

【0255】

【表11】

*複数妊娠期間からの胎児結果を含む、**臨床医が評価及び報告した略記：
AMA=高齢母体年齢(Advanced Maternal Age),NT=項部透過性(nuchal translucency)

【0256】

この研究母集団で表される種々の民族的背景の分布も表１１に示す。この研究における患者全体のうち６３％がコーカサス系、１７％がラテン系、６％がアジア系、５％が混血系、４％がアフリカ系アメリカ人であった。民族的多様性は、場所毎に大きく変動することが分かった。例えば、ある１つの場所では登録者の６０％がラテン系、２６％がコーカサス系の検体であり、３か所のクリニックはすべて同一の州に位置してラテン系の検体は登録されなかった。予期したとおり、この研究結果において異なった民族に対して顕著の相違は観察されなかった。

【0257】

トレーニングデータセット１
トレーニングセット研究は、２００９年４月から２００９年１２月にかけて収集した４３５サンプルの初期逐次蓄積から７１サンプルを選択した。この一次検体シリーズにおける異変あり胎児（異常核型）を孕んだすべての検体を、シークエンシング及びランダム選択のために、また適正サンプル及びデータを有する異変なし検体数に含めた。トレーニングセット患者の臨床的特性は、表１１に示す全体的研究の人口統計に一致した。トレーニングセットのサンプルにおける妊娠期間は１０週０日〜２３週１日にわたる範囲であった。３８を下回るＣＶＳ、３２を下回る羊水穿刺１名の患者は、侵襲的手順タイプとして特定されなかった（異変なし核型４６，ＸＹ）。患者の７０％はコーカサス系、８.５％はラテン系、８.５％はアジア系、８.５％は混血系であった。シークエンシングした６サンプルは、トレーニング目的のためにこのセットから除外した。すなわち、双子を孕んだ検体（以下にさらに説明する）からの４サンプル、調製中に汚染されたＴ１８を有する１サンプル、及び胎児核型６９，ＸＸＸを有する１サンプルを除外し、他の６５サンプルをトレーニングセットとして残した。

【0258】

特異配列部位（すなわち、ゲノムにおいて特異部位として同定されたタグ）の数は、トレーニングセット研究の初期段階における２.２Ｍから後期段階における１３.７Ｍまで変化し、これは時とともにシークエンシング技術が改良されたことに起因する。特異部位におけるこの６倍もの染色体ドースにおけるいかなる潜在的シフトをもモニタリングするため、研究の開始時及び終了時に異なる異変なしサンプルで稼働した。最初の１５の異変なしサンプルでの稼働に対して、平均特異部位数は３.８Ｍ、２１番染色体及び１８番染色体の平均染色体ドースは、それぞれ０.３１４及び０.５２８であった。最後の１５の異変なしサンプルでの稼働に対して、平均特異部位数は１０.７Ｍ、２１番染色体及び１８番染色体の平均染色体ドースは、それぞれ０.３１６及び０.５２９であった。トレーニングセット研究の時間経過における２１番染色体及び１８番染色体の平均染色体ドース間には統計学的相違はなかった。

【0259】

２１番、１８番及び１３番染色体のトレーニングセットＮＣＶを図１２に示す。図１２に示す結果は、2倍体ＮＣＶのおおよそ９９％は、平均の±２.５標準偏差内に入る点で正常性の想定に一致する。この６５サンプルセットのうち、Ｔ２１を示す臨床的核型を有する８サンプルは、６〜２０にわたるＮＣＶを有していた。胎児Ｔ１８を示す臨床的核型を有する４サンプルは、３.３〜１２にわたるＮＣＶを有し、胎児１３トリソミー（Ｔ１３）を示す臨床的核型を有する２サンプルは、２.６〜４にわたるＮＣＶを有していた。異変ありサンプルにおけるＮＣＶの分散は、個別サンプルにおける胎児ｃｆＤＮＡのパーセンテージに依存することに起因する。

【0260】

常染色体と同様に、性染色体の平均及び標準偏差をトレーニングセットで確立した。性染色体閾値は、トレーニングセットにおける男女の胎児を１００％同定できた。

【0261】

テストデータセット１
トレーニングセットからの染色体ドースの平均及び標準偏差を確立した後、４８サンプルのテストセットを、２０１０年１月から２０１０年６月にかけて収集した合計５７５サンプルから選択した。双子妊娠からのサンプルのうち１例を最終解析から除外し、テストセットとして４７サンプルを残した。シークエンシング及び機器を操作するための職員が調製するサンプルは、臨床的核型情報が分からないようにした。妊娠期間の範囲はトレーニングセットで見たのと同様であった（表１１参照）。侵襲性手順の５８％はＣＶＳであり、手順に関する全体的人口統計よりも高いが、トレーニングセットと同様であった。検体の５０％はコーカサス系、２７％はラテン系、１０.４％はアジア系、６.３％はアフリカ系アメリカ人であった。

【0262】

テストセットにおいて、特異配列タグ数は、約１３Ｍ〜２６Ｍにわたり変動した。異変なしサンプルに対して、２１番染色体及び１８番染色体の染色体ドースは、それぞれ０.３１３及び０.５２７であった。２１番、１８番及び１３番染色体のテストセットＮＣＶを
図１３に示し、分類を表１２に示す。

【0263】

【表12】

*ＭＸは、Ｙ染色体の確証がないＸ染色体におけるモノソミーである。

【0264】

テストセットにおいて、胎児Ｔ２１を示した臨床的核型を有する１３／１３検体は、５〜１４の範囲のＮＣＶを有すると正確に同定された。胎児Ｔ１８を示した核型を有する８／８検体は、８.５〜２２の範囲のＮＣＶを有すると正確に同定された。このテストセットにおいてＴ１３として分類された核型を有する１つのサンプルは約３のＮＣＶを有してノーコールとして分類された。

【0265】

テストデータセットに関して、すべての男児サンプルが、複雑核型、４６,ＸＹ＋マーカー染色体（核型によっては同定不能）を有するサンプルを含めて正確に同定された（表３参照）。２０女児サンプルのうち１９サンプルが正確に同定され、また１女児サンプルがノーコールとして分類された。テストセットにおける核型４５,Ｘを有する３サンプルに関して、３個のうち２サンプルがＸモノソミーとして正確に同定され、１サンプルがノーコールとして分類された（表１２参照）。

【0266】

双子
トレーニングセットに関して初期に選択した４サンプル及びテストセットにおける１サンプルは、双子妊娠からのものであった。ここで使用される閾値は、双子妊娠の設定で期待されるｃｆＤＮＡ量が異なることによって混乱を生ずるおそれがある。トレーニングセットにおいて、双子サンプルのうち１サンプルからの核型は、単一絨毛膜性の４７,ＸＹ+２１であった。第２の双子サンプルは二卵性双生児であり、羊水穿刺を各胎児に対して個別に行った。この双子妊娠において、二卵性双生児のうち一方は４７,ＸＹ+２１の核型であり、他方は正常な核型４６,ＸＸであった。これらケース双方において、無細胞分類は、サンプルをＴ２１と分類した上述の方法に基づいて行った。トレーニングセットにおける他の２つの双子妊娠は、Ｔ２１に関して異変なしとして正確に分類された（すべての双子は２１番染色体に関して２倍体の核型を示した）。テストセットにおける双子サンプルに関して、核型は双子Ｂ（４６,ＸＸ）に対してのみ確立し、アルゴリズムはＴ２１に関して異変なしと正確に分類した。

【0267】

結論
データは、大量並列シークエンシングを使用して妊婦の血液から複数の異常胎児核型を決定することができることを示す。これらデータは、独立したテストセットデータを使用して２１トリソミー及び１８トリソミーを有するサンプルの１００％正確な分類を同定できることを実証している。異常性染色体核型を有する胎児の場合でも、本発明方法のアルゴリズムによって、不正確に分類されるサンプルはなかった。重要なことに、アルゴリズムは、少なくとも一方が異変ありの胎児である双子妊娠の２セットで、Ｔ２１の存在を決定するのによく機能し、これは従来ではみられなかったことである。さらに、この研究は、複数のセンターからの様々な配列サンプルを審査し、商業的臨床的設定で直面しそうな異常核型の範囲のみならず、共通トリソミーの異変がない妊娠を正確に分類し、出生前スクリーニングで今も残存する容認できない高い疑陽性率に対処する意義を示している。データは、将来この方法を用いる大きな能力に価値ある予想を与える。示した特異ゲノム部位の部分集合解析は分散一貫ポアソン計数統計で増加する。

【0268】

大量並列シークエンシングを使用して、母体血漿から胎児異常を非侵襲的出生前決定の感度が計数統計によってのみ制限されることを実証したファン及びクウェイク氏の発見に基づく（Fan and Quake, PLos One 5, e10439 [2010]）。シークエンシング情報は全体ゲノムにわたって収集したため、この方法は、任意の異数性又は挿入及び欠失を含む他のコピー数多型を決定することができる。シークエンシングデータを５００キロベースのビンで解析したとき、サンプルのうち１つからの核型は１１番染色体にｑ２１とｑ２３との間で小さい欠失を有し、これをｑ２１から開始する２５Ｍｂ領域におけるタグの相対数の１０％減少として観測された。さらに、トレーニングセットにおいて、３サンプルが細胞発生解析におけるモザイク現象に起因する複雑性染色体核型を有していた。これら核型は、ｉ）４７,ＸＸＸ[９]／４５,Ｘ[６]、ii）４５,Ｘ[３]／４６,ＸＹ[１７]、及び
iii）４７,ＸＸＸ[１３]／４５,Ｘ[７]であった。若干のＸＹを含む細胞を示したサンプルii）はＸＹと正確に分類された。サンプルｉ（ＣＶＳ処置からの）及びiii（羊水穿刺からの）双方は細胞発生解析によるＸＸＸ及びＸ細胞の混合（モザイク型ターナー症候群に一致する）を示し、これらはそれぞれノーコール及びＸモノソミーとして分類された。

【0269】

アルゴリズムを検査するにあたり、他の興味深いデータポイントは、テストセットからの１サンプルに関して、２１番染色体における-５と-６との間にＮＣＶを持つことを観測した（図１３参照）。このサンプルは細胞発生によって２１番染色体に２倍体性を示すが、核型は９番染色体に部分的三倍体性、４７,ＸＸ+９[９]／４６ＸＸ[６]を有するモザイク現象を示した。９番染色体はデノミネーターに使用して２１番染色体の染色体ドースを決定するため（表１０参照）、このことは全体ＮＣＶ値を低下させる。このサンプルにおいて胎児９番トリソミーを決定するのに正規化染色体を使用する能力は、以下の実施例７で得られる結果によって証明される。

【0270】

この方法の感度に関するファン氏らの結論は、利用するアルゴリズムがシークエンシング方法によってもたらされる任意なランダム的又は系統的なバイアスを構成する場合のみ正確である。シークエンシングデータが適正に正規化されていない場合、結果としての解析は計数統計に劣る。チュー氏らは、最近の論文では、大量並列シークエンシング方法を使用する１８番及び１３番染色体の測定は不正確であると記述し、またこの方法をＴ１８及びＴ１３の決定に適用するにはより詳しいリサーチが必要であると結論付けた（Chiu et al., BMJ 342:c7401 [2011]）。チュー氏らの論文で使用される方法は、単に関心対象染色体（彼らのケースでは２１番染色体）における、シークエンシングランでタグ総数によって正規化された配列タグ数を使用するものである。このアプローチの課題は、各染色体におけるタグの分布は、シークエンシングラン毎に変動するおそれがあり、したがって、異数性決定に関する測定基準の全体変動を増大する点にある。チュー氏のアルゴリズムによる結果を本発明の実施例に使用した染色体ドースに比較するため、２１番及び１８番染色体のテストデータを、図１４に示すようなチュー氏らが推奨する方法を使用して、再解析した。全体的には、２１番及び１８番染色体それぞれのＮＣＶ範囲の比較、並びに異数性分類に対して４.０のＮＣＶ閾値を利用して本発明によるテストセットから正確に同定した１０／１３のＴ２１サンプル５／８のＴ１８サンプルの決定率低下を観測した。

【0271】

エーリッヒ氏らもＴ２１にのみ注目し、チュー氏らと同一のアルゴリズムを使用した（Ehrich et al., Am J Obstet Gynecol 204:205 el-e11 [2011]）。さらに、彼らのテストセットｚスコア測定基準における外部基準データ、すなわち、トレーニングセットからのずれを観測した後、彼らはテストセットを再トレーニングして、分類境界を規定した。原理的にはこのアプローチは実現可能であるが、実際的には、どの位多くのサンプルがトレーニングを必要とするか、及び分類境界が正確であるという確証を得るのにどの位の頻度で再トレーニングをする必要があるかを決定することに難題がある。この問題を軽減する１つの方法は、各シークエンシングラン毎に、ベースラインを測定し、また定量的な挙動を較正する制御を設けることである。

【0272】

本発明方法を使用して得られたデータは、大量並列シークエンシングは染色体カウントデータを正規化するアルゴリズムが最適化されるとき、妊婦の血漿から複数の胎児染色体異常を決定できることを示している。定量化のための本発明方法は、シークエンシングラン相互間のランダムな及び系統的な変動を最小化するだけでなく、全体ゲノムにわたる、異数性、とくに、Ｔ２１及びＴ１８を効果的に分類することができる。より多くのサンプル収集がＴ１３決定のためのアルゴリズムをテストするのに必要となる。この目的のため、本発明の診断精度をさらに実証する、有望な、手探りの、複数場所での臨床的研究を行っている。

【0273】

実施例７
個別テストサンプルのすべての染色体における少なくとも５つの異なった染色体異数性の
有無決定
１組の母体テストサンプル（テストセット１；実施例６）それぞれにおける任意の染色体異数性の有無を決定する本発明方法の能力を実証するため、系統的に決定した正規化染色体配列を、トレーニングセット（トレーニングセット１;実施例６）の異変なしサンプルにおいて同定し、各テストサンプルにおけるすべての染色体の染色体ドースを計算するのに使用した。テストセット及びトレーニングセットの各サンプルにおける任意の１つ又はそれ以上の異なる完全胎児染色体異数性の有無決定は、各個別サンプルに対する単独シークエンシングランから得たシークエンシング情報によって行った。

【0274】

実施例６で説明したトレーニングセットの各サンプルにおける各染色体に対して同定された染色体密度、すなわち配列タグ数を使用して、単独染色体又は染色体グループよりなる系統的に決定した正規化染色体配列を、１〜２２染色体、Ｘ染色体及びＹ染色体それぞの単独染色体ドースを計算することによって決定した。１〜２２染色体、Ｘ染色体及びＹ染色体それぞれの系統的に決定した正規化染色体配列は、あり得るすべての染色体の組合せを分子として使用し、各染色体の染色体ドースを系統的に計算することによって決定した。例えば、関心対象染色体としての２１番染色体の染色体ドースは、（ｉ）２１番染色体（関心対象染色体）に得られた配列タグ数と、（ii）残りの染色体それぞれに得られた配列タグ数との比、及び残りの染色体（２１番染色体を除外する）、すなわち、１，２，３，４，５等から２０，２１，２２，Ｘ，及びＹにいたる染色体のあり得るすべての組合せ、例えば、1+2,1+3,1+4,1+5等から1+20,1+22,1+X,及び1+Y;,1+2+3,1+2+4,1+2+5等から1+2+20,1+2+22,1+2+X,及び1+2+Y;1+3+4,1+3+5,1+3+6等から1+3+20,1+3+22,1+3+X,及び1+3+Y;1+2+3+4,1+2+3+5,1+2+3+6等から1+2+3+20,1+2+3+22,1+2+3+X,及び1+2+3+Y等々に得られたタグ数の合計として計算し、染色体１〜２０番染色体、２２番染色体、Ｘ染色体及びＹ染色体のすべてのあり得る組合せを、正規化染色体配列（分子）として使用し、トレーニングセットにおける適格サンプルそれぞれにおける各関心対象染色体のあり得るすべての染色体ドースを決定した。トレーニングサンプルのすべてにおける染色体ドースは２１番染色体と同様にして決定し、２１番染色体に対する系統的に決定した正規化染色体配列は、すべてのトレーニングサンプルにわたり変動性が最も小さい２１番染色体ドースとなる、単独染色体又は染色体グループとして決定した。同一解析を繰り返し、１３番染色体、１８番染色体、Ｘ染色体及びＹ染色体を含む残りの染色体それぞれの系統的に決定した正規化染色体配列として供する単独染色体又は染色体の組合せを決定した、すなわち、あり得るすべての染色体の組合せを使用して、すべてのトレーニングサンプルにおける他のすべての関心対象染色体、１〜１２番染色体、１４〜１７番染色体、１９〜２０番染色体、２２番染色体、Ｘ染色体及びＹ染色体の正規化配列（単独染色体又は染色体グループ）を決定した。このようにして、すべての染色体を関心対象染色体として処理し、系統的に決定した正規化配列を、トレーニングセットの異変なしサンプルそれぞれにおけるすべての染色体それぞれに対して決定した。表１３は、１〜２２番染色体、Ｘ染色体及びＹ染色体それぞれの系統的に決定した正規化配列として同定した単独染色体又は染色体グループを示す。表１３から明らかなように、関心対象である幾つかの染色体に対しては、系統的に決定した正規化染色体配列は単独染色体であると決定し（例えば、４番染色体が関心対象染色体であるとき）、他の関心対象染色体に対しては、系統的に決定した正規化染色体配列は染色体グループであると決定した（例えば、２１番染色体が関心対象染色体であるとき）。

【0275】

【表13】

【0276】

ずべての染色体それぞれに対して決定した系統的に決定した正規化染色体配列の平均、標準偏差（ＳＤ）、及び変動係数（ＣＶ）を表１４に示す。

【表14】

^ａトリソミーを含む
^ｂ女児

【0277】

ＣＶの値によって反映されたすべてのトレーニングサンプルにわたる染色体ドースの分散は、大きな信号対ノイズ比及びダイナミックレンジを得る系統的に決定した染色体配列の使用が、以下に示すように異数性決定を高い感度及び高い特異度で行うことができることを実証する。

【0278】

本発明方法の感度及び特異度を実証するため、関心対象となる１〜２２番染色体、Ｘ染色体及びＹ染色体すべての染色体ドースを、トレーニングセットの各サンプルにおいて、また実施例５で説明したテストセットのすべてのサンプルそれぞれにおいて、上述の表１３に示した対応する系統的に決定した正規化染色体配列を使用して決定した。

【0279】

各関心対象染色体の系統的に決定した正規化染色体配列を使用して、何らかの染色体異数性有無をトレーニングセットにおける各サンプルにおいて、及びテストサンプルそれぞれにおいて決定した、すなわち、各サンプルが１，２，３，４，５，６，７，８，９，１０，１１，１２，１３，１４，１５，１６，１７，１８，１９，２０，２１，２２番染色体、Ｘ染色体及びＹ染色体の完全胎児染色体異数性を含んでいるか否かを決定した。配列情報、すなわち、配列タグ数は、トレーニングセットにおける各サンプルにおける、及びテストサンプルそれぞれにおけるすべての染色体に関して取得し、トレーニングサンプル及びテストサンプルのそれぞれにおける各染色体の単独染色体ドースを、上述したように、トレーニングセットで決定したのに対応する系統的に決定した正規化染色体配列（表１３参照）に関して得た配列タグ数を使用して計算した。系統的に決定した正規化染色体配列用に各トレーニングサンプルにおいて得た配列タグ数を使用して、各トレーニングサンプルにおける各染色体の染色体ドースを決定し、また系統的に決定した正規化染色体配列用に各テストサンプルにおいて得た配列タグ数を使用して、各テストサンプルにおける各染色体の染色体ドースを決定した。安全で効果的な異数性分類を確実にするため、実施例６で説明したのと同一の控えめな境界を選択した。

【0280】

トレーニングセット結果
系統的に決定した正規化染色体配列を使用してのトレーニングセットのサンプルにおける２１番、１８番及び１３番染色体の染色体ドースのプロットを図１５に示す。系統的に決定した正規化染色体配列、すなわち、4+14+16+20+22番の染色体グループを使用するとき、Ｔ２１を示す臨床的核型を有する８個のサンプルは５.４〜２１.５の間のＮＣＶを有していた。系統的に決定した正規化染色体配列、すなわち、2+3+5+7番の染色体グループを使用するとき、Ｔ１８を示す臨床的核型を有する４個のサンプルは３.３〜１５.３の間のＮＣＶを有していた。系統的に決定した正規化染色体配列、すなわち、4+5番の染色体グループを使用するとき、Ｔ１３を示す臨床的核型を有する２個のサンプルは８.０及び１２.４のＮＣＶを有していた。トレーニングセットにおけるＴ２１を有するサンプルは、２１番染色体データの最後の８サンプル（○）として示し、トレーニングセットにおけるＴ１８を有するサンプルは、１８番染色体データの最後の４サンプル（△）として示し、トレーニングセットにおけるＴ１３を有するサンプルは、１３番染色体データの最後の２サンプル（□）として示す。

【0281】

これらデータは、正規化染色体配列を使用して異なる完全胎児染色体異常を高い確度で決定し、また正確に分類できることを示している。異変あり核型を有するすべてのサンプルは３より大きいＮＣＶを有するため、これらサンプルが異変なしの分布の一部である確率は約０．１％よりも低い。

【0282】

常染色体と同様に、Ｘ染色体用の系統的に決定した正規化染色体配列（すなわち、4+8番染色体）を使用するとき、またＹ染色体用の系統的に決定した正規化染色体配列（すなわち、4+6番染色体）を使用するとき、トレーニングセットにおけるすべての男児及び女児の胎児が正確に同定された。さらに、Ｘモノソミーの５サンプルすべてを同定した。図１８Ａは、トレーニングセットにおける各サンプルそれぞれにおける、Ｘ染色体に対して決定したＮＣＶ（Ｘ軸）、及びＹ染色体に対して決定したＮＣＶ（Ｙ軸）をプロットしたものを示す。核型がＸモノソミーであるサンプルすべては、−４.８３未満のＮＣＶ値を有する。４５,Ｘ核型（フル又はモザイク）に一致する核型を有するそれらＸモノソミーのサンプルは、予想どおりゼロに近いＹのＮＣＶを有する。女児サンプルはＸ及びＹ双方ともＮＣＶ＝０の周りに集まる。

【0283】

テストセット結果
関連の系統的に決定した正規化染色体配列を使用するテストサンプルにおける２１番、１８番及び１３番染色体の染色体ドースのプロットを図１６に示す。系統的に決定した正規化染色体配列（すなわち、4+14+16+20+22番の染色体グループ）を使用するとき、Ｔ２１を示す臨床的核型を有する１３個のサンプルのうち１３個は７.２〜１６.３の間のＮＣＶで同定された。系統的に決定した正規化染色体配列（すなわち、2+3+5+7番の染色体グループを使用するとき）、Ｔ１８を示す臨床的核型を有する８個のサンプルすべては１２.７〜３０.７の間のＮＣＶで同定された。系統的に決定した正規化染色体配列（すなわち、4+5番の染色体グループ）を使用するとき、Ｔ１３を示す臨床的核型を有する１個のみのサンプルは８.６のＮＣＶで同定された。テストセットにおけるＴ２１を有するサンプルは、２１番染色体データの最後の１３サンプル（○）として示し、テストセットにおけるＴ１８を有するサンプルは、１８番染色体データの最後の８サンプル（△）として示し、テストセットにおけるＴ１３を有するサンプルは、１３番染色体データの最後の１サンプル（□）として示す。

【0284】

これらデータは、系統的に決定した正規化染色体配列を使用して異なる完全胎児染色体異常を高い確度で決定し、また正確に分類できることを示している。トレーニングセットと同様に、異変あり核型を有するすべてのサンプルは７より大きいＮＣＶを有し、このことはこれらサンプルが異変なしの分布の一部である確率は無限小的に低いことを示す（図１６参照）。

【0285】

常染色体と同様に、Ｘ染色体用の系統的に決定した正規化染色体配列（すなわち、4+8番染色体）を使用するとき、またＹ染色体用の系統的に決定した正規化染色体配列（すなわち、4+6番染色体）を使用するとき、テストセットにおけるすべての男児及び女児の胎児が正確に同定された。さらに、Ｘモノソミーの３サンプルすべてを同定した。図１８Ｂは、テストセットにおける各サンプルにおける、Ｘ染色体に対して決定したＮＣＶ（Ｘ軸）、及びＹ染色体に対して決定したＮＣＶ（Ｙ軸）をプロットしたものを示す。

【0286】

上述したように、本発明方法によれば、各サンプルにおける１〜２２番染色体、Ｘ染色体及びＹ染色体それぞれの完全又は部分的な染色体異数性の有無を決定することができる。Ｔ１３，Ｔ１８，Ｔ２１及びＸモノソミーの完全染色体異数性を決定する他に、本発明方法はテストサンプルのうち１つのサンプルで９番染色体トリソミーの存在を決定した。系統的に決定した正規化染色体配列（すなわち、3+4+8+10+17+19+20+22番染色体グループ）を使用するとき、関心対象の９番染色体に対して、１４.４のＮＣＶを有するサンプルを同定した（図１７参照）。このサンプルは、２１番染色体（実施例６ではこの２１番染色体に対して９番染色体が正規化染色体配列として使用された）のドースが異常に低く計算されることで９番染色体の異数性が疑われた実施例６のテストサンプルに対応するものであった。

【0287】

このデータは、Ｔ２１，Ｔ１３，Ｔ１８，Ｔ９及びＸモノソミーを示す臨床的核型を有するサンプルの１００％が正確に同定されたことを示す。図１９は、４７個のテストサンプルそれぞれにおける１〜２２番染色体それぞれのＮＣＶのプロットを示す。ＮＣＶの中央値はゼロに正規化した。データは、本発明方法（系統的に決定した正規化染色体配列の使用を含む）が、このテストセットに存在した５タイプの染色体異数性すべての存在を１００％の感度及び１００％の特異度で決定したことを示し、また本発明方法は、いかなるサンプルにおいても、１〜２２番染色体、Ｘ染色体及びＹ染色体のうち任意の１つに関する任意の完全染色体異数性を同定できることを明らかに示している。

【0288】

実施例８
部分的胎児染色体異数性の有無決定：ネコ眼症候群の決定
ディジョージ症候群（２２ｑ１１.２欠失症候群）、すなわち、２２番染色体における欠失で生ずる障害は、幾つかの身体系統における発育不全を生ずる結果となる。ディジョージ症候群に共通して関連する内科的疾患としては、心臓疾患、免疫系の機能不全、口蓋裂、副甲状腺機能不全及び行動障害がある。ディジョージ症候群に関連する障害の数及び重篤度は大きく変動する。ディジョージ症候群を有するほとんどすべてのヒトは様々な分野の専門家からの治療を必要とする。

【0289】

胎児における２２番染色体の部分的欠失有無を決定するため、血液サンプルを母親の静脈穿刺によって採取し、上述の実施例で説明したようにｃｆＤＮＡを調製する。精製したｃｆＤＮＡをアダプタに結合し、イルミナ社のｃＢｏｔクラスタステーションを使用してクラスタ増幅する。大量並列シークエンシングを、可逆色素ターミネーターを使用して行い、３６ｂｐリードを数１００万生成する。配列リードをヒトｈｇ１９基準ゲノムに整列させ、基準ゲノムに一意的にマッピングされたリードをタグとしてカウントする。

【0290】

すべて２２番染色体の２倍体が既知である１組の適格サンプルのセット、すなわち、２２番染色体又は２２番染色体のいかなる部分も２倍体状態でのみ存在することが既知である適格サンプルセットを先ずシークエンシング及び解析し、３メガベース（ＭＢ）の１０００断片（領域２２ｑ１１.２は除外する）それぞれの配列タグ数を得る。ヒトゲノムが約３０憶個の塩基（３Ｇｂ）を有すると仮定すると、３Ｍｂの１０００断片それぞれはゲノムの残りをほぼ構成する。１０００断片それぞれは、関心対象断片、すなわち、２２ｑ１１.２の３Ｍｂ領域の正規化断片配列を決定するのに個別に又は断片配列グループとして、使用される。単独の１０００ｂｐ断片にそれぞれにマッピングされる配列タグ数を個別に使用して、２２ｑ１１.２の３Ｍｂ領域の断片ドースを計算する。さらに、２個以上の断片のあり得るすべての組合せを使用してすべての適格サンプルにおける関心対象断片の断片ドースを決定する。サンプルにわたり最小の変動性を有する断片となる単独３Ｍｂ断片又は２個以上の３Ｍｂ断片の組合せを、正規化断片配列として選択する。

【0291】

各適格サンプルにおける関心対象断片にマッピングされた配列タグ数を使用して、各適格サンプルにおける断片ドースを決定する。すべての適格サンプルにおける断片ドースの平均及び標準偏差を計算し、またテストサンプルで決定した断片ドースと比較する上での閾値を設定するのに使用する。好適には、正規化断片値（ＮＳＶ）をすべての適格サンプルにおけるすべての関心対象断片に対して計算し、閾値設定に使用する。

【0292】

これに続いて、対応のテストサンプルにおける正規化断片配列にマッピングしたタグ数を使用してテストサンプルにおける関心対象断片のドースを決定する。正規化断片値（ＮＳＶ）を、上述したように、テストサンプルの断片に対して計算し、テストサンプルにおける関心対象断片のＮＣＶを、適格サンプルを使用して決定した閾値と比較し、テストサンプルにおける２２ｑ１１.２の欠失有無を決定する。

【0293】

テストＮＣＶ＜-３は、関心対象断片の喪失、すなわち、２２番染色体の部分的（２２ｑ１１.２の）欠失が検査サンプルに存在することを示す。

【0294】

実施例９
ステージII大腸がん患者の転帰予測の便ＤＮＡ検査
すべてのステージII大腸がん患者の約３０％は再発し、がん疾患で死に至る。再発を起こした患者のステージII大腸がんは、４，５，１５ｑ、１７ｑ及び１８ｑ番染色体に多くの喪失を示した。とくに、ステージII大腸がん患者の４ｑ２２.１〜４ｑ３５.２における喪失は、より悪い転帰を示した。これらゲノム変化の有無決定は、補助（アジュバント）治療を患者が選択する上での支援となり得る（Brosens et al., Analytical Cellular Pathology/Cellular Oncology 33:95-104 [2010]参照）。

【0295】

ステージII大腸がんを有する患者の４ｑ２２.１〜４ｑ３５.２の領域における１つ以上の染色体欠失有無を決定するため、便及び／又は血漿サンプルを患者から採取する。便ＤＮＡは、刊行物（Chen et al., J Natl Cancer Inst 97:1124-1132 {2005]）に記載の方法に従って調製し、また血漿ＤＮＡを上述の実施例で説明した方法に従って調製した。ＤＮＡを本明細書で説明したＮＧＳに従ってシークエンシングし、また患者サンプルの配列情報を使用して４ｑ２２.１〜４ｑ３５.２の領域にわたる１つ以上の断片の断片ドースを計算する。断片ドースは、適格便及び／又は血漿サンプルのセットにおいてそれぞれ事前に決定する正規化断片配列を使用して決定する。検査サンプル（患者サンプル）における断片ドースを計算し、４ｑ２２.１〜４ｑ３５.２の領域内での１つ又はそれ以上の部分的染色体欠失有無は、関心対象断片それぞれのＮＳＶを、適格サンプルセットにおけるＮＳＶからの閾値と比較することによって決定する。

【0296】

本発明の好適な実施形態を本明細書において示しまた説明したが、このようなすべての実施形態は単なる例であることは当業者には明らかであろう。当業者にとっては、多くの変更、改変及び代用を、本発明から逸脱することなく行うことができるであろう。本明細書に記載した実施形態の種々の代替実施形態を、本発明の実施に使用できる。特許請求の範囲の請求項が本発明の範囲を規定し、また特許請求の範囲内の方法及び構成及び均等物も本発明によってカバーされることを意図する。

【図1】